專利名稱:收集用戶行為特征的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及智能通信增值業(yè)務(wù)技術(shù)領(lǐng)域,特別是指一種收集用戶行為特征的方法和裝置。
背景技術(shù):
在目前的信息服務(wù)系統(tǒng)中,提供用戶滿意個(gè)性化的服務(wù)是運(yùn)營(yíng)商及其他的服務(wù)提供商所追求的目標(biāo),也是用戶所真正需要的。目前,用戶行為特征(包括行為習(xí)慣)的收集與統(tǒng)計(jì)系統(tǒng)在通信行業(yè)中已有不少應(yīng)用,尤其是在一些增值業(yè)務(wù)系統(tǒng)中。然而,現(xiàn)有的收集用戶行為特征的方法一般只限于對(duì)一些粗略的數(shù)目統(tǒng)計(jì)或是一些不計(jì)名的調(diào)查問(wèn)卷之類的統(tǒng)計(jì)。
目前,對(duì)用戶行為特征的收集,更多的使用在因特網(wǎng)或短信平臺(tái)。例如,在以太網(wǎng)平臺(tái),通過(guò)收集統(tǒng)計(jì)分析用戶瀏覽過(guò)的網(wǎng)頁(yè)或其他的上網(wǎng)記錄這些用戶行為特征,就可以分析出被高頻訪問(wèn)的網(wǎng)頁(yè)、新聞等內(nèi)容。但是,更多的是應(yīng)用于不針對(duì)特定用戶的收集與統(tǒng)計(jì),并不去確定用戶的身份,不能定位到具體的用戶,因此其統(tǒng)計(jì)信息可能不可靠。例如,某用戶為增加某網(wǎng)頁(yè)的被訪問(wèn)量,可以通過(guò)重復(fù)訪問(wèn)該網(wǎng)頁(yè)來(lái)實(shí)現(xiàn),但這樣卻不能反應(yīng)出該網(wǎng)頁(yè)實(shí)際的被訪問(wèn)量。
又如在短信平臺(tái),利用短信來(lái)進(jìn)行投票或信息交流,可以通過(guò)發(fā)送短信的手機(jī)號(hào)碼來(lái)識(shí)別用戶,實(shí)現(xiàn)針對(duì)特定用戶的行為特征的收集,進(jìn)而進(jìn)行統(tǒng)計(jì)和分析。但這種方式局限性很強(qiáng),目前,短信平臺(tái)的用戶行為特征的收集多用于類似投票的業(yè)務(wù)中,實(shí)現(xiàn)對(duì)投票進(jìn)行統(tǒng)計(jì)。
眾所周知,對(duì)于通信系統(tǒng),基本的話音業(yè)務(wù)(即普通電話業(yè)務(wù))仍然占據(jù)著重要的位置,是人們傳遞信息的主要方式,通過(guò)語(yǔ)言的交流也最能反映用戶的行為特征。但目前尚沒(méi)有一種基于語(yǔ)音業(yè)務(wù)收集用戶行為特征的技術(shù)。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的主要目的在于提供了一種收集用戶行為特征的方法和裝置,以實(shí)現(xiàn)可通過(guò)通話話音收集用戶行為特征。
本發(fā)明提供的一種收集用戶行為特征的方法,包括以下步驟A、獲取用戶通信時(shí)的通話話音;B、將所述通話話音的內(nèi)容通過(guò)語(yǔ)音識(shí)別轉(zhuǎn)換為文本信息;C、從所述文本信息中識(shí)別出用戶的行為特征信息并進(jìn)行保存。
其中,步驟A所述獲取用戶通信時(shí)的通話話音的步驟包括建立用戶的通信話路進(jìn)行通話時(shí),對(duì)所述通信話路進(jìn)行錄音獲取所述用戶的通話話音。
其中,步驟A后進(jìn)一步包括分析出所述通話話音的聲紋特征,根據(jù)所述聲紋特征識(shí)別出對(duì)應(yīng)的用戶標(biāo)識(shí);步驟C所述保存的步驟進(jìn)一步包括將所述用戶的行為特征信息與所述用戶標(biāo)識(shí)對(duì)應(yīng)保存。
其中,步驟C所述保存前進(jìn)一步包括判斷是否已經(jīng)保存有相同用戶標(biāo)識(shí)的相同行為特征信息,若是,則結(jié)束當(dāng)前流程,否則執(zhí)行所述保存。
其中,所述判斷是否已經(jīng)保存有相同用戶標(biāo)識(shí)的相同行為特征信息的步驟包括判斷所述根據(jù)聲紋特征識(shí)別出的用戶標(biāo)識(shí)是否與已經(jīng)保存的用戶標(biāo)識(shí)相同;或,判斷所述分析出的通話話音的聲紋特征是否與已經(jīng)保存的用戶標(biāo)識(shí)所對(duì)應(yīng)的聲紋特征相同。
其中,步驟C所述從文本信息中識(shí)別出用戶的行為特征信息的步驟包括識(shí)別出所述文本信息中的關(guān)鍵字;根據(jù)識(shí)別出的關(guān)鍵字分析出用戶的行為特征信息。
其中,分析出用戶的行為特征信息的步驟包括使用采用預(yù)定策略的方法、神經(jīng)網(wǎng)絡(luò)的方法、模糊查詢的方法、或關(guān)聯(lián)分析方法分析出用戶的行為特征信息。
本發(fā)明提供的一種收集用戶行為特征的裝置,包括話音獲取單元,用于獲取用戶通信時(shí)的通話話音,并傳送給語(yǔ)音識(shí)別單元;語(yǔ)音識(shí)別單元,用于將所述通話話音內(nèi)容轉(zhuǎn)換為文本信息、分析出通話話音的聲紋特征,分別傳送給語(yǔ)義分析單元和用戶身份識(shí)別單元;語(yǔ)義分析單元,用于從所述文本信息中識(shí)別出用戶的行為特征信息,并發(fā)送給行為特征存儲(chǔ)單元;用戶身份識(shí)別單元,用于根據(jù)聲紋特征識(shí)別出對(duì)應(yīng)的用戶標(biāo)識(shí),并發(fā)送給行為特征存儲(chǔ)單元;行為特征存儲(chǔ)單元,用于將所述用戶標(biāo)識(shí)和用戶的行為特征信息對(duì)應(yīng)保存。
其中,所述話音獲取單元由智能網(wǎng)中的智能外設(shè)IP或增強(qiáng)智能外設(shè)AIP實(shí)現(xiàn)。
其中,所述話音獲取單元、語(yǔ)音識(shí)別單元由智能網(wǎng)中的智能外設(shè)IP或增強(qiáng)智能外設(shè)AIP實(shí)現(xiàn)。
由上述方法可以看出,本發(fā)明能夠通過(guò)普通的電話通話來(lái)獲取用戶的行為特征。還利用用戶語(yǔ)音來(lái)識(shí)別用戶身份,使得針對(duì)需要識(shí)別用戶的數(shù)據(jù)統(tǒng)計(jì)不再依賴于用戶電話的電話號(hào)碼,從而在公用電話上,以及共用的家庭電話或企業(yè)電話也能夠識(shí)別出用戶的身份,使統(tǒng)計(jì)信息更為可靠和有實(shí)用性。
并且,在對(duì)特定話題進(jìn)行統(tǒng)計(jì)的時(shí)候,可以通過(guò)比較歷史記錄,判斷對(duì)同一用戶是否進(jìn)行了重復(fù)統(tǒng)計(jì)并進(jìn)行相應(yīng)的過(guò)濾,從而使統(tǒng)計(jì)的結(jié)果更為準(zhǔn)確。并且,還可根據(jù)用戶信息的詳細(xì)程度,進(jìn)一步的將統(tǒng)計(jì)結(jié)果進(jìn)行相應(yīng)的歸類。
可以說(shuō),本發(fā)明所提供的方案能夠讓服務(wù)提供者方便獲取用戶的行為特征,進(jìn)而提供相應(yīng)的個(gè)性化的服務(wù),可以極大的豐富信息服務(wù)提供的方式和手段。例如,可分析特定用戶的電話話音來(lái)獲取單個(gè)用戶的行為特征,記錄一些有預(yù)先設(shè)定的關(guān)鍵詞相關(guān)的信息,就可以對(duì)用戶進(jìn)行提醒。還可用于調(diào)查有多少人在打電話時(shí)以某特定詞語(yǔ)(如超級(jí)女生)作為話題。還可用于收集、統(tǒng)計(jì)通話時(shí)出現(xiàn)頻度很高的關(guān)鍵詞,以用于預(yù)測(cè)大家所關(guān)心的事以及比較流行的話題。
圖1為用戶行為特征的收集系統(tǒng)示意圖。
圖2為用戶行為特征收集流程圖。
圖3為用戶行為特征的收集系統(tǒng)實(shí)施例示意圖。
圖4為實(shí)現(xiàn)用戶行為特征的收集系統(tǒng)的智能網(wǎng)示意圖。
具體實(shí)施例方式
本發(fā)明提供了通過(guò)話音收集用戶的行為特征的技術(shù)方案,不僅可以用來(lái)統(tǒng)計(jì)用戶群的行為特征,還可以用來(lái)統(tǒng)計(jì)單個(gè)用戶行為特征。本發(fā)明的核心思想是在通信網(wǎng)絡(luò)中,當(dāng)用戶建立通話時(shí),獲取用戶通話的具體內(nèi)容,通過(guò)語(yǔ)音識(shí)別的身份確認(rèn)技術(shù)確定用戶的標(biāo)識(shí),并且通過(guò)語(yǔ)音識(shí)別技術(shù)將通話話音內(nèi)容轉(zhuǎn)換為文本形式的信息,然后分析出文本信息內(nèi)容,獲得關(guān)鍵字,再根據(jù)關(guān)鍵字獲得所述用戶的行為特征。
如圖1示出了本發(fā)明用戶行為特征的收集系統(tǒng),包括話音獲取單元、語(yǔ)音識(shí)別單元、語(yǔ)義分析單元、用戶身份識(shí)別單元、行為特征存儲(chǔ)單元。
其中,話音獲取單元用于獲取用戶的通話話音;語(yǔ)音識(shí)別單元用于將獲得的通話話音內(nèi)容轉(zhuǎn)換為文本信息,以及分析出通話話音的聲紋特征;語(yǔ)義分析單元用于從轉(zhuǎn)換的文本信息中識(shí)別出關(guān)鍵字信息,分析出關(guān)鍵字信息對(duì)應(yīng)的用戶行為特征信息;用戶身份識(shí)別單元用于根據(jù)分析出的聲紋特征識(shí)別出對(duì)應(yīng)的用戶標(biāo)識(shí);行為特征存儲(chǔ)單元用于將所述用戶標(biāo)識(shí)和識(shí)別出的用戶行為特征信息對(duì)應(yīng)保存起來(lái),以用于統(tǒng)計(jì)。
對(duì)照?qǐng)D1示出的收集系統(tǒng),并參照?qǐng)D2示出的用戶行為特征收集流程圖,在收集用戶行為特征時(shí),包括以下步驟步驟201話音獲取單元獲取用戶通話的原始話音內(nèi)容,發(fā)送給語(yǔ)音識(shí)別單元。
其中,話音獲取單元可以建立到用戶話路的連接,從而實(shí)現(xiàn)對(duì)用戶通話內(nèi)容的監(jiān)聽(tīng)錄音,來(lái)獲得用戶通話話音。
步驟202語(yǔ)音識(shí)別單元對(duì)傳送過(guò)來(lái)的話音內(nèi)容進(jìn)行識(shí)別,將話音內(nèi)容轉(zhuǎn)換為文本的描述信息發(fā)送給語(yǔ)義分析單元,以及分析出話音的聲紋特征發(fā)送給用戶身份識(shí)別單元。
其中,語(yǔ)音識(shí)別技術(shù)可以參考申請(qǐng)?zhí)枮?8107791的中國(guó)專利。將話音內(nèi)容轉(zhuǎn)換為文本形式可采用如下方法抽取發(fā)出的語(yǔ)音所具有的頻譜等物理特征,與預(yù)先存儲(chǔ)的母音、子音或單詞的物理特征模型進(jìn)行比較。從而將語(yǔ)音轉(zhuǎn)換為文字信息。
而對(duì)于語(yǔ)音識(shí)別的身份確認(rèn)技術(shù),其原理是每個(gè)人的生物特征不同,其發(fā)音特征也各不相同,因此可利用人的發(fā)音特點(diǎn)、即通話話音來(lái)提取話音聲紋特征(聲紋特征也可稱為特征碼,是能夠反映該話音生物特征的標(biāo)識(shí),可能是一串?dāng)?shù)字或是一個(gè)數(shù)字及其他符號(hào)的組合系列或是用來(lái)描述變化趨勢(shì)的數(shù)字或坐標(biāo)點(diǎn)的組合等,具體參見(jiàn)申請(qǐng)?zhí)?8107791的中國(guó)專利),通過(guò)不同用戶的不同聲紋特征區(qū)別不同的用戶。
步驟203語(yǔ)義分析單元接收轉(zhuǎn)換出的文本信息,識(shí)別出文本信息中的關(guān)鍵字,根據(jù)識(shí)別出的關(guān)鍵字分析出用戶的行為特征,發(fā)送給行為特征存儲(chǔ)單元。
在根據(jù)確定關(guān)鍵字是否能反映用戶特征時(shí),可以采用事先預(yù)定策略的方法,也可以用神經(jīng)網(wǎng)絡(luò)或其他的關(guān)聯(lián)分析方法來(lái)判斷。例如,下表1為關(guān)鍵詞與行為特征對(duì)照表,示出了預(yù)先設(shè)定的用于分析的條件
表1當(dāng)語(yǔ)義分析過(guò)程發(fā)現(xiàn)有與表1對(duì)應(yīng)的關(guān)鍵詞時(shí),便輸出行為特征描述字段中的相關(guān)信息。在判斷文本信息中是否出現(xiàn)所述關(guān)鍵字時(shí),并不一定要完全匹配,例如,當(dāng)文本信息中僅出現(xiàn)關(guān)鍵字“房產(chǎn)證、按揭”時(shí),也可輸出“正準(zhǔn)備購(gòu)房”的行為特征描述信息,當(dāng)然,匹配率越多,行為特征描述就越準(zhǔn)確。另外,對(duì)于由關(guān)鍵字對(duì)應(yīng)到行為特征描述信息過(guò)程中,還可以采用數(shù)據(jù)庫(kù)中的模糊查找的方法來(lái)豐富查找結(jié)果,例如,“房產(chǎn)證、房屋證,房屋產(chǎn)權(quán)證”都可以視為對(duì)應(yīng)到關(guān)鍵詞“房產(chǎn)證”,從而來(lái)輸出對(duì)應(yīng)的行為特征描述信息。而上面提到的神經(jīng)網(wǎng)絡(luò)是一種具有自學(xué)習(xí)能力的智能系統(tǒng),例如可自學(xué)習(xí)出哪些關(guān)鍵詞表示哪些行為特征描述,又例如還可進(jìn)行相近語(yǔ)義的學(xué)習(xí)等,能夠豐富模糊查詢的內(nèi)容。
類似的,為了更準(zhǔn)確的對(duì)用戶行為進(jìn)行判斷,還可以有更多的判斷準(zhǔn)則或其他的判斷形式,如對(duì)比關(guān)聯(lián)的方法等。
由于上述的神經(jīng)網(wǎng)絡(luò)、模糊查詢、對(duì)比關(guān)聯(lián)均為現(xiàn)有技術(shù),此處不再贅述。
步驟204用戶身份識(shí)別單元接收語(yǔ)音識(shí)別單元發(fā)送過(guò)來(lái)的聲紋特征,識(shí)別出該聲紋特征對(duì)應(yīng)的用戶標(biāo)識(shí),發(fā)送給行為特征存儲(chǔ)單元。
實(shí)現(xiàn)本步驟,需要預(yù)先對(duì)各個(gè)用戶提取并記錄其各自的聲紋特征信息(即特征碼),并將聲紋特征信息和用戶標(biāo)識(shí)對(duì)應(yīng)存儲(chǔ)起來(lái)。當(dāng)接收到語(yǔ)音識(shí)別模塊發(fā)送過(guò)來(lái)的聲紋信息后,將該聲紋信息與預(yù)先記錄的聲紋特征信息進(jìn)行比較,找出與之匹配的聲紋信息(這里匹配不一定是完全吻合,可能是在一定誤差許可范圍內(nèi)的近似吻合),從而獲得記錄的該聲紋信息所對(duì)應(yīng)的用戶標(biāo)識(shí),提供給行為特征存儲(chǔ)單元;若未檢索到有匹配的預(yù)先存儲(chǔ)的聲紋信息,則可向行為特征存儲(chǔ)單元報(bào)告無(wú)對(duì)應(yīng)用戶的記錄。
步驟205行為特征存儲(chǔ)單元用于將用戶身份識(shí)別單元發(fā)送過(guò)來(lái)的用戶標(biāo)識(shí)和語(yǔ)義分析單元發(fā)送過(guò)來(lái)的行為特征信息對(duì)應(yīng)保存起來(lái),以用于進(jìn)行統(tǒng)計(jì)等。
例如,當(dāng)通過(guò)語(yǔ)義分析判斷出用戶A通話出現(xiàn)的關(guān)鍵詞符合表1中的索引為1的記錄,則行為特征存儲(chǔ)單元可保存如下表2示出的內(nèi)容
表2當(dāng)存儲(chǔ)的信息用于分析和統(tǒng)計(jì)時(shí),若每個(gè)用戶標(biāo)識(shí)還對(duì)應(yīng)記錄有各個(gè)用戶的注冊(cè)信息(如年齡、性別等),還可以對(duì)統(tǒng)計(jì)結(jié)果進(jìn)行性別、年齡等分類。
另外,統(tǒng)計(jì)結(jié)果的記錄可以按照不同的需要以不同的形式組織,如果為了記錄歷史信息便于比較,可以記錄用戶身份信息以及日期還有所檢測(cè)詞等等,如下表3所示
表3通過(guò)所檢測(cè)關(guān)鍵詞、用戶標(biāo)識(shí),可用于在記錄過(guò)程中防止重復(fù)統(tǒng)計(jì)。例如,當(dāng)出現(xiàn)與要統(tǒng)計(jì)的關(guān)鍵詞對(duì)應(yīng)的信息時(shí),還要判斷該用戶是否以前已經(jīng)被記錄統(tǒng)計(jì)過(guò),這可以通過(guò)判斷針對(duì)該條關(guān)鍵詞是否已經(jīng)存在該用戶標(biāo)識(shí),或?qū)?yīng)到該標(biāo)識(shí)對(duì)應(yīng)的話音的聲紋信息,如果是,則要過(guò)濾掉采集的該次話音,不需要再進(jìn)行語(yǔ)義分析等后續(xù)過(guò)程,防止被重復(fù)記錄統(tǒng)計(jì)。
如果只是為了獲取某些關(guān)鍵詞相關(guān)的話題的出現(xiàn)頻度等統(tǒng)計(jì)信息時(shí),而不需要知道具體的用戶,在記錄和統(tǒng)計(jì)時(shí),可忽略身份識(shí)別的過(guò)程。即省略了對(duì)語(yǔ)音身份識(shí)別的步驟,以及省略了對(duì)應(yīng)到用戶ID的步驟。
對(duì)于圖1示出的各個(gè)單元,在實(shí)際實(shí)現(xiàn)中,可能由一個(gè)設(shè)備或多個(gè)設(shè)備來(lái)實(shí)現(xiàn),圖3示出了該系統(tǒng)的一個(gè)實(shí)施例,其中話音獲取單元、語(yǔ)音識(shí)別單元、語(yǔ)義分析單元、用戶身份識(shí)別單元的功能由通話放音設(shè)備實(shí)現(xiàn),特征記錄單元的功能由用戶習(xí)慣分析記錄設(shè)備用來(lái)實(shí)現(xiàn)。當(dāng)然,也可以由通話放音設(shè)備實(shí)現(xiàn)話音獲取單元、語(yǔ)音識(shí)別單元的功能,其他單元的功能都由用戶習(xí)慣分析記錄設(shè)備用來(lái)實(shí)現(xiàn)。這和具體設(shè)備所支持的功能有關(guān)。
下面參見(jiàn)圖4示出的智能網(wǎng)系統(tǒng),對(duì)本發(fā)明基于智能網(wǎng)的實(shí)現(xiàn)進(jìn)行描述。由智能網(wǎng)系統(tǒng)實(shí)現(xiàn)本發(fā)明時(shí),由智能網(wǎng)來(lái)實(shí)現(xiàn)圖1示出的話音獲取單元,對(duì)通話話音進(jìn)行采集,或進(jìn)一步的實(shí)現(xiàn)語(yǔ)音識(shí)別單元的語(yǔ)音到文本信息的語(yǔ)音識(shí)別轉(zhuǎn)換功能,而語(yǔ)義分析、聲紋識(shí)別轉(zhuǎn)換及記錄功能,可由外部設(shè)備(如計(jì)算機(jī))來(lái)實(shí)現(xiàn),這樣的實(shí)現(xiàn)方式基于原智能網(wǎng)網(wǎng)絡(luò),不影響原網(wǎng)絡(luò)的運(yùn)行。下面參見(jiàn)圖4示出的智能網(wǎng)絡(luò)進(jìn)行詳細(xì)說(shuō)明。
圖4示出的智能網(wǎng)絡(luò)的業(yè)務(wù)定制系統(tǒng),指能夠生成和定制業(yè)務(wù)的系統(tǒng),例如SMP。智能處理系統(tǒng),指智能網(wǎng)中的智能外設(shè)(IP)或增強(qiáng)智能外設(shè)(AIP)等具有放音、錄音以及語(yǔ)音識(shí)別等功能的設(shè)備。業(yè)務(wù)控制系統(tǒng),如SCP,存儲(chǔ)有用戶業(yè)務(wù)邏輯。通話連接系統(tǒng),如MSC、SSP等設(shè)備,能夠提供接入智能網(wǎng)的功能。
通過(guò)智能網(wǎng)實(shí)現(xiàn)收集用戶行為特征時(shí),包括以下步驟當(dāng)用戶撥號(hào)或是用戶作為被叫被呼叫時(shí),負(fù)責(zé)接通話路的通話連接系統(tǒng)(如SSP)中的業(yè)務(wù)觸發(fā)點(diǎn)觸發(fā)智能業(yè)務(wù),上報(bào)業(yè)務(wù)控制系統(tǒng)(如SCP);業(yè)務(wù)控制系統(tǒng)(如SCP)通過(guò)事先的業(yè)務(wù)預(yù)定情況決定是否對(duì)該話路進(jìn)行話音分析(考慮到并不是所有的通話記錄都要進(jìn)行話音分析和統(tǒng)計(jì),可以通過(guò)業(yè)務(wù)定制的方式進(jìn)行設(shè)定,只選擇一些話路話音進(jìn)行分析和統(tǒng)計(jì))。如果要進(jìn)行分析,則業(yè)務(wù)控制系統(tǒng)(如SCP)向智能處理系統(tǒng)(如AIP)下達(dá)對(duì)該話路進(jìn)行錄音的指令;業(yè)務(wù)控制系統(tǒng)(如SCP)指示通話連接系統(tǒng)(如SSP)連接智能處理系統(tǒng)(如AIP);智能處理系統(tǒng)(如AIP)可以根據(jù)規(guī)范的交互接口獲取通話的話音數(shù)據(jù),按照指定格式對(duì)話路進(jìn)行錄音。錄音完畢,拆除智能處理系統(tǒng)(如AIP)和通話連接系統(tǒng)(如SSP)的連接。
之后,智能處理系統(tǒng)(如AIP)將獲取的話音信息發(fā)送給外部計(jì)算機(jī),實(shí)現(xiàn)語(yǔ)音識(shí)別及記錄等后續(xù)步驟。
需要說(shuō)明的是,上例中,智能處理系統(tǒng)實(shí)現(xiàn)的僅是話音采集。目前,一些智能處理系統(tǒng)帶有一些語(yǔ)音識(shí)別的功能,因此也可以由業(yè)務(wù)控制系統(tǒng)控制智能處理系統(tǒng)將語(yǔ)音信息轉(zhuǎn)化后的話音文本信息及聲紋信息,在直接或間接(例如由業(yè)務(wù)控制系統(tǒng)轉(zhuǎn)發(fā))給如外部計(jì)算機(jī)等外圍設(shè)備,由外部計(jì)算機(jī)等外圍設(shè)備實(shí)現(xiàn)語(yǔ)音識(shí)別及行為特征的記錄等步驟。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種收集用戶行為特征的方法,其特征在于,該方法包括以下步驟A、獲取用戶通信時(shí)的通話話音;B、將所述通話話音的內(nèi)容通過(guò)語(yǔ)音識(shí)別轉(zhuǎn)換為文本信息;C、從所述文本信息中識(shí)別出用戶的行為特征信息并進(jìn)行保存。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟A所述獲取用戶通信時(shí)的通話話音的步驟包括建立用戶的通信話路進(jìn)行通話時(shí),對(duì)所述通信話路進(jìn)行錄音獲取所述用戶的通話話音。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟A后進(jìn)一步包括分析出所述通話話音的聲紋特征,根據(jù)所述聲紋特征識(shí)別出對(duì)應(yīng)的用戶標(biāo)識(shí);步驟C所述保存的步驟進(jìn)一步包括將所述用戶的行為特征信息與所述用戶標(biāo)識(shí)對(duì)應(yīng)保存。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,步驟C所述保存前進(jìn)一步包括判斷是否已經(jīng)保存有相同用戶標(biāo)識(shí)的相同行為特征信息,若是,則結(jié)束當(dāng)前流程,否則執(zhí)行所述保存。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述判斷是否已經(jīng)保存有相同用戶標(biāo)識(shí)的相同行為特征信息的步驟包括判斷所述根據(jù)聲紋特征識(shí)別出的用戶標(biāo)識(shí)是否與已經(jīng)保存的用戶標(biāo)識(shí)相同;或,判斷所述分析出的通話話音的聲紋特征是否與已經(jīng)保存的用戶標(biāo)識(shí)所對(duì)應(yīng)的聲紋特征相同。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟C所述從文本信息中識(shí)別出用戶的行為特征信息的步驟包括識(shí)別出所述文本信息中的關(guān)鍵字;根據(jù)識(shí)別出的關(guān)鍵字分析出用戶的行為特征信息。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述分析出用戶的行為特征信息的步驟包括使用采用預(yù)定策略的方法、神經(jīng)網(wǎng)絡(luò)的方法、模糊查詢的方法、或關(guān)聯(lián)分析方法分析出用戶的行為特征信息。
8.一種收集用戶行為特征的裝置,其特征在于,包括話音獲取單元,用于獲取用戶通信時(shí)的通話話音,并傳送給語(yǔ)音識(shí)別單元;語(yǔ)音識(shí)別單元,用于將所述通話話音內(nèi)容轉(zhuǎn)換為文本信息、分析出通話話音的聲紋特征,分別傳送給語(yǔ)義分析單元和用戶身份識(shí)別單元;語(yǔ)義分析單元,用于從所述文本信息中識(shí)別出用戶的行為特征信息,并發(fā)送給行為特征存儲(chǔ)單元;用戶身份識(shí)別單元,用于根據(jù)聲紋特征識(shí)別出對(duì)應(yīng)的用戶標(biāo)識(shí),并發(fā)送給行為特征存儲(chǔ)單元;行為特征存儲(chǔ)單元,用于將所述用戶標(biāo)識(shí)和用戶的行為特征信息對(duì)應(yīng)保存。
9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述話音獲取單元由智能網(wǎng)中的智能外設(shè)IP或增強(qiáng)智能外設(shè)AIP實(shí)現(xiàn)。
10.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述話音獲取單元、語(yǔ)音識(shí)別單元由智能網(wǎng)中的智能外設(shè)IP或增強(qiáng)智能外設(shè)AIP實(shí)現(xiàn)。
全文摘要
本發(fā)明提供了一種收集用戶行為特征的方法,包括獲取用戶通信時(shí)的通話話音;將所述通話話音的內(nèi)容通過(guò)語(yǔ)音識(shí)別轉(zhuǎn)換為文本信息以及分析出所述通話話音的聲紋特征對(duì)應(yīng)的用戶標(biāo)識(shí);將所述用戶的行為特征信息與所述用戶標(biāo)識(shí)對(duì)應(yīng)保存。還提供了收集用戶行為特征的裝置,包括話音獲取單元、語(yǔ)音識(shí)別單元、語(yǔ)義分析單元、用戶身份識(shí)別單元和行為特征存儲(chǔ)單元。通過(guò)本發(fā)明,可實(shí)現(xiàn)通過(guò)通話話音收集用戶行為特征。
文檔編號(hào)H04Q3/00GK1852354SQ20051011316
公開(kāi)日2006年10月25日 申請(qǐng)日期2005年10月17日 優(yōu)先權(quán)日2005年10月17日
發(fā)明者閔國(guó)兵, 鐘杰萍, 汪芳山 申請(qǐng)人:華為技術(shù)有限公司