技術(shù)總結(jié)
本發(fā)明公開了一種建立關(guān)鍵詞模型的方法及裝置,該方法包括通過獲取語音文本數(shù)據(jù)和核心關(guān)鍵詞,檢索所述語音文本數(shù)據(jù)中所述核心關(guān)鍵詞所在的文本語句,統(tǒng)計所述文本語句中設(shè)定范圍內(nèi)的詞以及詞的詞頻,對所述統(tǒng)計的詞依據(jù)詞的詞頻進(jìn)行排序,將所述詞頻的排名大于排名閾值的詞,確定輔助關(guān)鍵詞,對所述核心關(guān)鍵詞和所述輔助關(guān)鍵詞進(jìn)行邏輯關(guān)系組合,建立關(guān)鍵詞模型。通過對核心關(guān)鍵詞所在的文本語句中設(shè)定范圍內(nèi)的詞的篩選,以及詞的詞頻進(jìn)行排序,可以獲取輔助關(guān)鍵詞,從而獲取用于建立關(guān)鍵詞模型的關(guān)鍵詞,再將這些關(guān)鍵詞進(jìn)行邏輯組合,即可以建立關(guān)鍵詞模型,提高了語義分析的效率和準(zhǔn)確性。
技術(shù)研發(fā)人員:邱志賢;唐敏華;孫佳偉;顧偉;束俞;林嘉
受保護(hù)的技術(shù)使用者:中國移動通信集團(tuán)上海有限公司
文檔號碼:201510956045
技術(shù)研發(fā)日:2015.12.17
技術(shù)公布日:2017.06.27