欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于凈荷深度檢測(cè)和會(huì)話關(guān)聯(lián)技術(shù)的騰訊語音識(shí)別方法

文檔序號(hào):2837059閱讀:632來源:國(guó)知局
專利名稱:基于凈荷深度檢測(cè)和會(huì)話關(guān)聯(lián)技術(shù)的騰訊語音識(shí)別方法
技術(shù)領(lǐng)域
本發(fā)明是針對(duì)互聯(lián)網(wǎng)即時(shí)通信軟件-騰訊QQ進(jìn)行語音流量識(shí)別方法的研究,主要研究如何基于DPI凈荷深度檢測(cè)和會(huì)話關(guān)聯(lián)技術(shù)來有效識(shí)別QQ語音業(yè)務(wù),并設(shè)計(jì)了QQ語音業(yè)務(wù)的識(shí)別模型和算法,涉及IPv4和下一代互聯(lián)網(wǎng)業(yè)務(wù)感知以及服務(wù)質(zhì)量監(jiān)測(cè)等的協(xié)議分析技術(shù)領(lǐng)域。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和普及,人們的通信方式也發(fā)生了變革,傳統(tǒng)的通信方式逐漸被網(wǎng)絡(luò)通信所取代。利用通訊軟件,不僅可以進(jìn)行文本聊天,也可以用語音或者視頻進(jìn)行聊天,由于使用方便且資費(fèi)低廉,越來越多的人通過網(wǎng)絡(luò)進(jìn)行遠(yuǎn)程實(shí)時(shí)會(huì)話。在巨額利益的吸引下大量非法VoIP運(yùn)營(yíng)充斥著正規(guī)的電信市場(chǎng),不僅導(dǎo)致合法運(yùn)營(yíng)商話務(wù)量流失,更打破了原有電信市場(chǎng)的競(jìng)爭(zhēng)格局,給傳統(tǒng)的話音業(yè)務(wù)帶來了巨大的沖擊,電信運(yùn)營(yíng)商正遭受非法VoIP給其帶來的巨大挑戰(zhàn),因此非常有必要將互聯(lián)網(wǎng)上VoIP業(yè)務(wù)納入良性控制的范疇。
作為目前中國(guó)最為流行的即時(shí)通信軟件之一的QQ,雖然目前僅提供PC2PC的通話方式,但由此帶來的話務(wù)分流也對(duì)電信運(yùn)營(yíng)商造成了一定的沖擊,因此提供話音業(yè)務(wù)的網(wǎng)絡(luò)運(yùn)營(yíng)商自然而然希望能夠良性控制QQ的通話行為。所以,對(duì)QQ和QQ語音業(yè)務(wù)的識(shí)別及其良性控制,不僅對(duì)電信運(yùn)營(yíng)商有重大意義,而且也有助于對(duì)其他的即時(shí)通訊軟件進(jìn)行監(jiān)管。
針對(duì)QQ和QQ語音業(yè)務(wù)的識(shí)別具備一定的難度,有如下原因第一、QQ的通信協(xié)議不公開,且其中部分信令使用了加密算法。
第二、QQ的版本眾多,升級(jí)比較頻繁,而且與多數(shù)軟件不同的是,它客戶端的升級(jí)往往伴隨著協(xié)議相應(yīng)的改變。
第三、現(xiàn)今大部分對(duì)QQ的研究集中在QQ登陸退出過程以及文本聊天交互方式上,鮮有對(duì)其語音過程的分析,所以可借鑒之處不多。
第四、騰訊QQ采用端口偽裝技術(shù),使用80端口;端口可隨機(jī)配置;服務(wù)器有多個(gè)不固定的IP地址,難以做到完全封堵;第五、QQ提供文本、數(shù)據(jù)、語音、視頻等業(yè)務(wù),各種業(yè)務(wù)的會(huì)話特征均不相同,因此對(duì)服務(wù)器IP地址的“野蠻”封堵并不是解決問題的根本辦法,這會(huì)導(dǎo)致正常的QQ通信無法使用。
由上可見,采用傳統(tǒng)的端口過濾、IP地址過濾以及協(xié)議分析等業(yè)務(wù)識(shí)別方法很難識(shí)別出QQ的語音過程。因此,必須另辟蹊徑。
通過對(duì)QQ語音及其會(huì)話的識(shí)別,我們能夠解決以下問題(1)對(duì)電信運(yùn)營(yíng)商來說,能夠?qū)Q語音業(yè)務(wù)進(jìn)行統(tǒng)計(jì)分析,便于掌控QQ語音呼叫對(duì)傳統(tǒng)話音業(yè)務(wù)的影響;(2)能夠使得運(yùn)營(yíng)商對(duì)QQ語音業(yè)務(wù)實(shí)施良性監(jiān)管,如制定合理的計(jì)費(fèi)政策以保障傳統(tǒng)話音業(yè)務(wù)的利益;(3)從國(guó)家信息安全的角度考慮,可對(duì)QQ語音實(shí)施實(shí)時(shí)監(jiān)聽,有效防止非法活動(dòng)通過QQ作為通信媒介。

發(fā)明內(nèi)容
技術(shù)問題本發(fā)明的目的是建立一種基于凈荷深度檢測(cè)和會(huì)話關(guān)聯(lián)技術(shù)的騰訊語音識(shí)別方法,并設(shè)計(jì)其識(shí)別模型和算法,通過對(duì)QQ語音業(yè)務(wù)的識(shí)別,將QQ語音信令流和媒體流從QQ會(huì)話流中分揀出來,便于分析通話雙方的主被叫IP地址、語音編解碼類型、QQ語音服務(wù)器地址等詳細(xì)信息,從而可以更深入的分析QQ語音的通話內(nèi)容。
技術(shù)方案本發(fā)明提出了一種有效識(shí)別QQ語音業(yè)務(wù)的技術(shù)框架,并且詳細(xì)設(shè)計(jì)了識(shí)別算法,如附圖1所示。從圖中可以看出,系統(tǒng)分為四個(gè)層面,從下往上依次是數(shù)據(jù)采集層、協(xié)議分析層、流量識(shí)別(業(yè)務(wù)感知)層和QQ語音業(yè)務(wù)應(yīng)用層以及表現(xiàn)層。
這里需要區(qū)分兩個(gè)本文定義的術(shù)語。QQ會(huì)話泛指用戶登陸之后的所有QQ交互行為,包括用戶登陸、身份認(rèn)證、文本聊天、語音通話、視頻會(huì)話、3D游戲、退出等等QQ交互過程。而QQ語音通話特指QQ會(huì)話中的語音和視頻通信過程。因此,一個(gè)QQ號(hào)碼對(duì)應(yīng)一個(gè)QQ會(huì)話,QQ語音通話特指一個(gè)QQ用戶同另一個(gè)QQ用戶的語音通信過程。
本文的關(guān)鍵方法在流量識(shí)別層,該層主要包含兩個(gè)方法QQ會(huì)話識(shí)別方法和QQ語音會(huì)話關(guān)聯(lián)方法。通過首先識(shí)別出QQ會(huì)話分組,再進(jìn)行QQ語音會(huì)話關(guān)聯(lián)來確定真正的QQ語音會(huì)話。通過測(cè)試和數(shù)據(jù)分析,發(fā)現(xiàn)QQ會(huì)話具備一定的凈荷特征,QQ登錄過程或連接請(qǐng)求過程中數(shù)據(jù)包格式分為頭部,內(nèi)容和尾部三個(gè)部分,固定為0×02客戶端版本命令序列號(hào)QQ號(hào)碼內(nèi)容0×03。因此可以根據(jù)起始和末尾凈荷特征0×02及0×03,通過DPI凈荷深度檢測(cè)機(jī)制識(shí)別出QQ會(huì)話的分組。再根據(jù)請(qǐng)求登錄令牌,識(shí)別出數(shù)據(jù)包第八至第十一字節(jié)為主叫QQ號(hào)碼,以標(biāo)識(shí)一個(gè)QQ會(huì)話。如附圖2所示。而測(cè)試QQ語音通信的交互過程,發(fā)現(xiàn)語音連接建立時(shí),也具有起始和末尾凈荷0×02/0×03的特征,之后,則采用類似SIP協(xié)議的通信交互機(jī)制建立語音會(huì)話。因此也可以采用凈荷深度檢測(cè)機(jī)制和簡(jiǎn)單的協(xié)議分析技術(shù)來識(shí)別QQ的語音會(huì)話。凈荷特征匹配串為“SIP/user-agentTencent-VQQ”或“SIP/reason=100”等。如附圖3所示。
然而,QQ版本的改動(dòng)或者協(xié)議的改動(dòng)均會(huì)帶來QQ凈荷特征的變化,因此也必然會(huì)使得上述識(shí)別方法發(fā)生一定的變化。如何能夠不改動(dòng)系統(tǒng)而通過簡(jiǎn)單的配置就完成對(duì)QQ新業(yè)務(wù)特征的適應(yīng)是算法的一大挑戰(zhàn)。正則表達(dá)式正是一個(gè)非常好的解決方案,本方法采用正則表達(dá)式來表現(xiàn)QQ的會(huì)話特征和語音會(huì)話的特征。因此當(dāng)QQ版本發(fā)生變化或者特征發(fā)生變化,本算法只需要簡(jiǎn)單的修改正則表達(dá)式的特征配置文件即可,無需重新修改代碼和方法即做到快速高效的更新。
以下詳細(xì)介紹該設(shè)計(jì)的各個(gè)層面及其語音會(huì)話識(shí)別方法。
1.數(shù)據(jù)采集層功能該層面提供對(duì)于不同鏈路的數(shù)據(jù)采集或復(fù)制技術(shù),如100/1000M FE、ATM、SDH不同速率的采集或復(fù)制技術(shù),以保障數(shù)據(jù)完整、可靠地傳送至上一層面一協(xié)議分析層。
接口該層面與上一層面的接口為比特流數(shù)據(jù),向上層提供各種分組信息。
2.協(xié)議分析層功能該層面提供對(duì)于TCP/IP數(shù)據(jù)的協(xié)議解析,目的是為了向上層提供足夠的IP分組頭部和TCP/UDP的頭部信息及其必要的分組凈荷信息,以滿足上一層面流量識(shí)別層對(duì)業(yè)務(wù)的識(shí)別和感知。
接口該層面的協(xié)議分析深度應(yīng)當(dāng)分析至TCP/IP協(xié)議棧的第四層,即傳輸層。其向上層提供的接口為流(flow)。流應(yīng)當(dāng)由一個(gè)五元組來確定,即flow=(源IP,目的IP,源端口,目的端口,協(xié)議類型)。此處的協(xié)議類型指代TCP或者UDP。如有必要,該流中還可存放部分凈荷,捕獲的凈荷大小可配置。
3.流量識(shí)別(業(yè)務(wù)感知)層功能該層面是整個(gè)架構(gòu)的核心層面,主要根據(jù)提供下層即協(xié)議分析層提供的IP分組頭部和TCP/UDP的頭部信息及其凈荷信息等特征有效識(shí)別出QQ業(yè)務(wù),匹配失敗的分組則丟棄。
接口向應(yīng)用層面提供的接口應(yīng)當(dāng)是五元組,即(源IP,目的IP,源端口,目的端口,應(yīng)用詳細(xì)信息)。
該層主要包含兩個(gè)方法QQ會(huì)話識(shí)別方法和QQ語音業(yè)務(wù)識(shí)別和會(huì)話關(guān)聯(lián)方法。通過首先識(shí)別出QQ會(huì)話分組,再進(jìn)行QQ語音會(huì)話關(guān)聯(lián)來確定真正的QQ語音會(huì)話。
◆QQ會(huì)話識(shí)別方法。方法處理過程如下1.)初始化哈希表該哈希表是用于存儲(chǔ)騰訊會(huì)話標(biāo)識(shí),即騰訊會(huì)話ID,該標(biāo)識(shí)用騰訊號(hào)碼和其IP地址兩元組來表示,一個(gè)騰訊號(hào)碼只能對(duì)應(yīng)于一個(gè)IP地址,哈希表中所有的元素初始化為0,即所有騰訊號(hào)碼對(duì)應(yīng)的IP地址初始化為0;2.)接收所要監(jiān)測(cè)的IP網(wǎng)絡(luò)的分組;3.)根據(jù)騰訊會(huì)話凈荷特征進(jìn)行DPI檢測(cè),以判斷該分組是否為騰訊會(huì)話分組,再判斷該分組是否為騰訊會(huì)話的請(qǐng)求登陸令牌分組;如是,則獲取騰訊號(hào)碼,轉(zhuǎn)步驟4);如匹配失敗,丟棄分組,轉(zhuǎn)步驟2);4.)判斷該會(huì)話是否已經(jīng)存在于哈希表中,如果是,則丟棄分組,轉(zhuǎn)步驟2);如果不是,轉(zhuǎn)步驟5);5.)保存騰訊會(huì)話標(biāo)識(shí),會(huì)話標(biāo)識(shí)是由騰訊號(hào)碼和該騰訊號(hào)碼的登錄IP地址兩元組組成;6)騰訊會(huì)話識(shí)別成功,結(jié)束。
通過凈荷深度檢測(cè)和會(huì)話關(guān)聯(lián)方法來識(shí)別出騰訊的語音會(huì)話,其方法步驟為1.)接收分組該接收過程同騰訊會(huì)話過程是同一過程,只是同一分組復(fù)制之后用于不同分組特征匹配;
2.)針對(duì)接收到的分組根據(jù)騰訊語音凈荷的類SIP特性進(jìn)行特征匹配,如匹配成功,則轉(zhuǎn)步驟3);否則,丟棄分組,轉(zhuǎn)步驟1);3.)將騰訊語音會(huì)話同騰訊會(huì)話進(jìn)行關(guān)聯(lián)識(shí)別由于單單通過騰訊語音凈荷的特征分析并無法完全判斷該分組就是騰訊語音會(huì)話分組,因此必須將該騰訊語音會(huì)話分組同已有的騰訊會(huì)話進(jìn)行關(guān)聯(lián)檢測(cè),如該騰訊會(huì)話存在,則該騰訊語音分組的判斷將極大可能是準(zhǔn)確的;具體的關(guān)聯(lián)過程即用該語音分組中獲取的騰訊主叫號(hào)碼作為key,到騰訊會(huì)話哈希表中查詢,如查詢出來的元素為一個(gè)IP地址,那么證明該騰訊會(huì)話是存在,繼續(xù)比較IP地址,如果相同,則可判定該語音會(huì)話是屬于該騰訊會(huì)話的,轉(zhuǎn)步驟4);如果不相同,則說明該騰訊語音會(huì)話不是真正的語音會(huì)話,丟棄分組,轉(zhuǎn)步驟1);4.)保存和更新騰訊語音會(huì)話信息將騰訊語音會(huì)話的主被叫騰訊地址和端口、主被叫騰訊號(hào)碼、語音編解碼類型、呼叫發(fā)起時(shí)間、呼叫結(jié)束時(shí)間的信息保存;當(dāng)有其他該語音會(huì)話的分組到來的時(shí)候,相應(yīng)的更新相關(guān)信息,形成騰訊語音會(huì)話的呼叫詳細(xì)記錄CDR;5)騰訊語音會(huì)話識(shí)別成功,結(jié)束。
4.QQ語音業(yè)務(wù)應(yīng)用層以及表現(xiàn)層對(duì)于QQ語音業(yè)務(wù)的識(shí)別具有很廣泛的意義和應(yīng)用價(jià)值。主要可以應(yīng)用在◆QQ語音業(yè)務(wù)流量統(tǒng)計(jì)分析;◆QQ語音業(yè)務(wù)性能分析;◆QQ語音流量控制和呼叫跟蹤;◆QQ資費(fèi)影響因子估算◆QQ語音流量異常檢測(cè);◆QQ語音信息安全監(jiān)控。


圖1是QQ會(huì)話識(shí)別流程圖。圖中給出了識(shí)別QQ會(huì)話的各個(gè)處理過程。
圖2是QQ語音業(yè)務(wù)識(shí)別和會(huì)話關(guān)聯(lián)方法流程圖。圖中給出了QQ語音業(yè)務(wù)識(shí)別和會(huì)話關(guān)聯(lián)方法的各個(gè)處理過程。
圖3是騰訊語音會(huì)話識(shí)別方法技術(shù)框架結(jié)構(gòu)示意圖。
具體實(shí)施例方式
根據(jù)本方法開發(fā)出的VoIP檢測(cè)系統(tǒng)在中國(guó)電信廣西分公司的10G骨干網(wǎng)上得到了具體的驗(yàn)證。系統(tǒng)采用分光方式將10G流量負(fù)載均衡分流至若干臺(tái)業(yè)務(wù)識(shí)別處理機(jī)上,業(yè)務(wù)識(shí)別處理機(jī)完成核心算法的實(shí)現(xiàn),從紛繁復(fù)雜的分組中提取、分析、識(shí)別和關(guān)聯(lián)出QQ的語音會(huì)話。
通過在廣西電信10G骨干網(wǎng)的實(shí)際運(yùn)行和撥打測(cè)試,針對(duì)QQ語音業(yè)務(wù)的識(shí)別準(zhǔn)確率為100%,很好的體現(xiàn)了算法的實(shí)施效果,驗(yàn)證了算法的準(zhǔn)確性。
QQ語音監(jiān)控系統(tǒng)分為分光設(shè)備、QQ語音監(jiān)控設(shè)備、核心數(shù)據(jù)庫(kù)服務(wù)器和應(yīng)用服務(wù)器等實(shí)體。10G流量由分光設(shè)備分往若干臺(tái)QQ語音監(jiān)控服務(wù)器設(shè)備,每臺(tái)QQ語音監(jiān)控服務(wù)器設(shè)備承載千兆的流量,識(shí)別出業(yè)務(wù)流量之后,將業(yè)務(wù)信息實(shí)時(shí)傳送至核心數(shù)據(jù)庫(kù),并由應(yīng)用服務(wù)器發(fā)布,接入拓?fù)洹?br> 系統(tǒng)接入方式分為兩種一種為串聯(lián)模式,即將QQ語音監(jiān)控系統(tǒng)串聯(lián)入骨干網(wǎng)中實(shí)施檢測(cè)和控制;另一種為并聯(lián)模式,即采用監(jiān)聽的方式完成檢測(cè)和控制。串聯(lián)模式會(huì)影響整體的網(wǎng)絡(luò)拓?fù)?,且多多少少?huì)為原有網(wǎng)絡(luò)帶來隱患,因此更推薦對(duì)原有網(wǎng)絡(luò)無任何影響的并聯(lián)模式接入。
系統(tǒng)的分光設(shè)備從10G鏈路上實(shí)時(shí)的分光下來之后,將其分為若干路流量指向若干臺(tái)QQ監(jiān)控設(shè)備,監(jiān)控設(shè)備采用高性能的流量采集技術(shù)接收所有的流量,并自動(dòng)調(diào)用QQ語音業(yè)務(wù)識(shí)別引擎對(duì)流量進(jìn)行實(shí)時(shí)的識(shí)別,并根據(jù)用戶自定義的策略進(jìn)行控制,如封堵、干擾或者放行等。
基于凈荷深度檢測(cè)和會(huì)話關(guān)聯(lián)技術(shù)的騰訊語音識(shí)別方法的步驟為1.)初始化哈希表該哈希表是用于存儲(chǔ)騰訊會(huì)話標(biāo)識(shí),即騰訊會(huì)話ID,該標(biāo)識(shí)用騰訊號(hào)碼和其IP地址兩元組來表示,一個(gè)騰訊號(hào)碼只能對(duì)應(yīng)于一個(gè)IP地址,哈希表中所有的元素初始化為0,即所有騰訊號(hào)碼對(duì)應(yīng)的IP地址初始化為0;2.)接收所要監(jiān)測(cè)的IP網(wǎng)絡(luò)的分組;3.)根據(jù)騰訊會(huì)話凈荷特征進(jìn)行DPI檢測(cè),以判斷該分組是否為騰訊會(huì)話分組,再判斷該分組是否為騰訊會(huì)話的請(qǐng)求登陸令牌分組;如是,則獲取騰訊號(hào)碼,轉(zhuǎn)步驟4);如匹配失敗,丟棄分組,轉(zhuǎn)步驟2);4.)判斷該會(huì)話是否已經(jīng)存在于哈希表中,如果是,則丟棄分組,轉(zhuǎn)步驟2);如果不是,轉(zhuǎn)步驟5);
5.)保存騰訊會(huì)話標(biāo)識(shí),會(huì)話標(biāo)識(shí)是由騰訊號(hào)碼和該騰訊號(hào)碼的登錄IP地址兩元組組成;6)騰訊會(huì)話識(shí)別成功,結(jié)束。
通過凈荷深度檢測(cè)和會(huì)話關(guān)聯(lián)方法來識(shí)別出騰訊的語音會(huì)話,其方法步驟為1.)接收分組該接收過程同騰訊會(huì)話過程是同一過程,只是同一分組復(fù)制之后用于不同分組特征匹配;2.)針對(duì)接收到的分組根據(jù)騰訊語音凈荷的類SIP特性進(jìn)行特征匹配,如匹配成功,則轉(zhuǎn)步驟3);否則,丟棄分組,轉(zhuǎn)步驟1);3.)將騰訊語音會(huì)話同騰訊會(huì)話進(jìn)行關(guān)聯(lián)識(shí)別由于單單通過騰訊語音凈荷的特征分析并無法完全判斷該分組就是騰訊語音會(huì)話分組,因此必須將該騰訊語音會(huì)話分組同已有的騰訊會(huì)話進(jìn)行關(guān)聯(lián)檢測(cè),如該騰訊會(huì)話存在,則該騰訊語音分組的判斷將極大可能是準(zhǔn)確的;具體的關(guān)聯(lián)過程即用該語音分組中獲取的騰訊主叫號(hào)碼作為key,到騰訊會(huì)話哈希表中查詢,如查詢出來的元素為一個(gè)IP地址,那么證明該騰訊會(huì)話是存在,繼續(xù)比較IP地址,如果相同,則可判定該語音會(huì)話是屬于該騰訊會(huì)話的,轉(zhuǎn)步驟4);如果不相同,則說明該騰訊語音會(huì)話不是真正的語音會(huì)話,丟棄分組,轉(zhuǎn)步驟1);4.)保存和更新騰訊語音會(huì)話信息將騰訊語音會(huì)話的主被叫騰訊地址和端口、主被叫騰訊號(hào)碼、語音編解碼類型、呼叫發(fā)起時(shí)間、呼叫結(jié)束時(shí)間的信息保存;當(dāng)有其他該語音會(huì)話的分組到來的時(shí)候,相應(yīng)的更新相關(guān)信息,形成騰訊語音會(huì)話的呼叫詳細(xì)記錄CDR;5)騰訊語音會(huì)話識(shí)別成功,結(jié)束。
權(quán)利要求
1.一種基于凈荷深度檢測(cè)和會(huì)話關(guān)聯(lián)技術(shù)的騰訊語音識(shí)別方法,其特征在于該方法的步驟為1.)初始化哈希表該哈希表是用于存儲(chǔ)騰訊會(huì)話標(biāo)識(shí),即騰訊會(huì)話ID,該標(biāo)識(shí)用騰訊號(hào)碼和其IP地址兩元組來表示,一個(gè)騰訊號(hào)碼只能對(duì)應(yīng)于一個(gè)IP地址,哈希表中所有的元素初始化為0,即所有騰訊號(hào)碼對(duì)應(yīng)的IP地址初始化為0;2.)接收所要監(jiān)測(cè)的IP網(wǎng)絡(luò)的分組;3.)根據(jù)騰訊會(huì)話凈荷特征進(jìn)行DPI檢測(cè),以判斷該分組是否為騰訊會(huì)話分組,再判斷該分組是否為騰訊會(huì)話的請(qǐng)求登陸令牌分組;如是,則獲取騰訊號(hào)碼,轉(zhuǎn)步驟4);如匹配失敗,丟棄分組,轉(zhuǎn)步驟2);4.)判斷該會(huì)話是否已經(jīng)存在于哈希表中,如果是,則丟棄分組,轉(zhuǎn)步驟2);如果不是,轉(zhuǎn)步驟5);5.)保存騰訊會(huì)話標(biāo)識(shí),會(huì)話標(biāo)識(shí)是由騰訊號(hào)碼和該騰訊號(hào)碼的登錄IP地址兩元組組成;6)騰訊會(huì)話識(shí)別成功,結(jié)束。
2.一種基于凈荷深度檢測(cè)和會(huì)話關(guān)聯(lián)技術(shù)的騰訊語音會(huì)話識(shí)別方法,其特征在于通過凈荷深度檢測(cè)和會(huì)話關(guān)聯(lián)方法來識(shí)別出騰訊的語音會(huì)話,其方法步驟為1.)接收分組該接收過程同騰訊會(huì)話過程是同一過程,只是同一分組復(fù)制之后用于不同分組特征匹配;2.)針對(duì)接收到的分組根據(jù)騰訊語音凈荷的類SIP特性進(jìn)行特征匹配,如匹配成功,則轉(zhuǎn)步驟3);否則,丟棄分組,轉(zhuǎn)步驟1);3.)將騰訊語音會(huì)話同騰訊會(huì)話進(jìn)行關(guān)聯(lián)識(shí)別由于單單通過騰訊語音凈荷的特征分析并無法完全判斷該分組就是騰訊語音會(huì)話分組,因此必須將該騰訊語音會(huì)話分組同已有的騰訊會(huì)話進(jìn)行關(guān)聯(lián)檢測(cè),如該騰訊會(huì)話存在,則該騰訊語音分組的判斷將極大可能是準(zhǔn)確的;具體的關(guān)聯(lián)過程即用該語音分組中獲取的騰訊主叫號(hào)碼作為key,到騰訊會(huì)話哈希表中查詢,如查詢出來的元素為一個(gè)IP地址,那么證明該騰訊會(huì)話是存在,繼續(xù)比較IP地址,如果相同,則可判定該語音會(huì)話是屬于該騰訊會(huì)話的,轉(zhuǎn)步驟4);如果不相同,則說明該騰訊語音會(huì)話不是真正的語音會(huì)話,丟棄分組,轉(zhuǎn)步驟1);4.)保存和更新騰訊語音會(huì)話信息將騰訊語音會(huì)話的主被叫騰訊地址和端口、主被叫騰訊號(hào)碼、語音編解碼類型、呼叫發(fā)起時(shí)間、呼叫結(jié)束時(shí)間的信息保存;當(dāng)有其他該語音會(huì)話的分組到來的時(shí)候,相應(yīng)的更新相關(guān)信息,形成騰訊語音會(huì)話的呼叫詳細(xì)記錄CDR;5)騰訊語音會(huì)話識(shí)別成功,結(jié)束。
全文摘要
基于凈荷深度檢測(cè)和會(huì)話關(guān)聯(lián)技術(shù)的騰訊語音會(huì)話識(shí)別方法由騰訊會(huì)話識(shí)別方法和騰訊語音會(huì)話識(shí)別方法組成,首先通過騰訊會(huì)話識(shí)別方法將騰訊會(huì)話識(shí)別出來,然后再根據(jù)騰訊語音會(huì)話的凈荷特性識(shí)別出所有可能的騰訊語音會(huì)話,隨后再運(yùn)用會(huì)話關(guān)聯(lián)技術(shù)將可能的騰訊語音會(huì)話同每一個(gè)騰訊會(huì)話進(jìn)行關(guān)聯(lián)分析,從而通過騰訊會(huì)話過程和騰訊語音會(huì)話過程的雙重識(shí)別保證了該系統(tǒng)的準(zhǔn)確性及識(shí)別成功率,該方法具有良好的可擴(kuò)展性和準(zhǔn)確性,且易于與運(yùn)營(yíng)商相關(guān)的應(yīng)用接口對(duì)接。
文檔編號(hào)G10L15/00GK101072174SQ20071002102
公開日2007年11月14日 申請(qǐng)日期2007年3月23日 優(yōu)先權(quán)日2007年3月23日
發(fā)明者王攀, 金婷, 張順頤, 陳雪嬌 申請(qǐng)人:南京郵電大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
惠来县| 日照市| 潢川县| 宁武县| 泸定县| 双辽市| 酒泉市| 巧家县| 温州市| 台南市| 凤凰县| 六安市| 交城县| 邹平县| 凤冈县| 揭西县| 额济纳旗| 依安县| 高雄市| 姚安县| 三门峡市| 杭锦后旗| 林口县| 云浮市| 济宁市| 罗江县| 滕州市| 鹤山市| 乐清市| 习水县| 鱼台县| 澄迈县| 铁力市| 连城县| 宁海县| 福州市| 青阳县| 长阳| 博乐市| 皋兰县| 嘉黎县|