一種對輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法及裝置制造方法

文檔序號(hào)：6492668閱讀：85來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種對輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種對輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法及裝置。其中該方法包括：接收當(dāng)前用戶在當(dāng)前時(shí)段的輸入信息；利用已建立的按時(shí)間先后順序劃分的多個(gè)先前時(shí)段的時(shí)間語言模型獲取輸入信息的候選項(xiàng)集合中每個(gè)候選項(xiàng)在先前時(shí)間語言模型下的第一權(quán)值；根據(jù)每個(gè)候選項(xiàng)的第一權(quán)值計(jì)算每個(gè)候選項(xiàng)的第一累積權(quán)值，其中第一權(quán)值對第一累積權(quán)值的貢獻(xiàn)度隨時(shí)間先后順序逐步消減；基于每個(gè)候選項(xiàng)的第一累積權(quán)值，對輸入信息的候選項(xiàng)進(jìn)行排序；展示排序后的候選項(xiàng)。通過上述方式，本發(fā)明能夠針對用戶在不同時(shí)段輸入同樣的輸入信息時(shí)，向用戶推送與時(shí)間相關(guān)的候選項(xiàng)排序，以滿足不同時(shí)段用戶的需求，提升用戶體驗(yàn)。
【專利說明】一種對輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及輸入法領(lǐng)域，特別是涉及一種對輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法及裝置。
【背景技術(shù)】
[0002]輸入法是指為了將各種符號(hào)輸入計(jì)算機(jī)或其他設(shè)備(如手機(jī))而采用的編碼方法。
[0003]利用輸入法進(jìn)行輸入時(shí)，通常通過向設(shè)備發(fā)送各種字符以獲取字符對應(yīng)的候選項(xiàng)，并選擇相應(yīng)的候選項(xiàng)來完成輸入。而對于輸入的相同讀音的字符時(shí)，獲取得到的字符對應(yīng)的候選項(xiàng)的集合中各候選項(xiàng)的排序通常都是一樣的。比如對于拼音“daxue”，該拼音對應(yīng)的候選項(xiàng)包括“大學(xué)”、“大雪”、“大血”、“打血”等多個(gè)，而每次針對用戶對拼音“daxue”的輸入，向用戶推送的候選項(xiàng)排序基本是一樣的，或者是只按照候選項(xiàng)在大規(guī)模語料中出現(xiàn)的頻次來排序。
[0004]本申請的發(fā)明人在長期的研究中發(fā)現(xiàn)，每個(gè)用戶在不同的時(shí)段輸入的同一個(gè)讀音的字符時(shí)，可能所需要的候選項(xiàng)不一樣。針對同一個(gè)輸入推送的候選項(xiàng)排序都一樣或者只簡單的按照頻次來進(jìn)行排序，不足以滿足不同時(shí)段用戶的需求，影響用戶體驗(yàn)。

【發(fā)明內(nèi)容】

[0005]本發(fā)明主要解決的技術(shù)問題是提供一種對候選項(xiàng)進(jìn)行排序的方法及裝置，能夠針對用戶輸入同樣的字符時(shí)，向用戶推送的候選項(xiàng)排序能夠滿足不同時(shí)段用戶的需求，提升用戶體驗(yàn)。
[0006]為解決上述技術(shù)問題，本發(fā)明采用的一個(gè)技術(shù)方案是:提供一種對輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法，包括:接收當(dāng)前用戶在當(dāng)前時(shí)段的輸入信息；利用已建立的按時(shí)間先后順序劃分的多個(gè)先前時(shí)段的時(shí)間語言模型獲取所述輸入信息的候選項(xiàng)集合中每個(gè)候選項(xiàng)在所述先前時(shí)間語言模型下的第一權(quán)值；根據(jù)每個(gè)候選項(xiàng)的所述第一權(quán)值計(jì)算每個(gè)候選項(xiàng)的第一累積權(quán)值，其中所述第一權(quán)值對所述第一累積權(quán)值的貢獻(xiàn)度隨時(shí)間先后順序逐步消減；基于所述每個(gè)候選項(xiàng)的第一累積權(quán)值，對所述輸入信息的候選項(xiàng)進(jìn)行排序；展示排序后的候選項(xiàng)。
[0007]其中，所述接收當(dāng)前用戶在當(dāng)前時(shí)段的輸入信息的步驟之前，還包括:使用文本分類技術(shù)對網(wǎng)頁語料按時(shí)間先后順序進(jìn)行分類整理，獲得多個(gè)不同先前時(shí)段的網(wǎng)頁語料；基于每一先前時(shí)段的網(wǎng)頁語料分別訓(xùn)練出一所述時(shí)間語言模型。
[0008]其中，所述根據(jù)每個(gè)候選項(xiàng)的所述第一權(quán)值計(jì)算每個(gè)候選項(xiàng)的第一累積權(quán)值的步驟包括:通過如下公式計(jì)算所述第一累積權(quán)值:
[0009]
【權(quán)利要求】
1.一種對輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法,其特征在于,包括: 接收當(dāng)前用戶在當(dāng)前時(shí)段的輸入信息；利用已建立的按時(shí)間先后順序劃分的多個(gè)先前時(shí)段的時(shí)間語言模型獲取所述輸入信息的候選項(xiàng)集合中每個(gè)候選項(xiàng)在所述先前時(shí)間語言模型下的第一權(quán)值；根據(jù)每個(gè)候選項(xiàng)的所述第一權(quán)值計(jì)算每個(gè)候選項(xiàng)的第一累積權(quán)值，其中所述第一權(quán)值對所述第一累積權(quán)值的貢獻(xiàn)度隨時(shí)間先后順序逐步消減；基于所述每個(gè)候選項(xiàng)的第一累積權(quán)值，對所述輸入信息的候選項(xiàng)進(jìn)行排序；展示排序后的候選項(xiàng)。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述接收當(dāng)前用戶在當(dāng)前時(shí)段的輸入信息的步驟之前，還包括: 使用文本分類技術(shù)對網(wǎng)頁語料按時(shí)間先后順序進(jìn)行分類整理，獲得多個(gè)不同先前時(shí)段的網(wǎng)頁語料；基于每一先前時(shí)段的網(wǎng)頁語料分別訓(xùn)練出一所述時(shí)間語言模型。
3.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述根據(jù)每個(gè)候選項(xiàng)的所述第一權(quán)值計(jì)算每個(gè)候選項(xiàng)的第一累積權(quán)值的步驟包括: 通過如下公式計(jì)算所述第一累積權(quán)值:
4.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述基于每個(gè)候選項(xiàng)的第一累積權(quán)值，對所述輸入信息的候選項(xiàng)進(jìn)行排序的步驟包括: 按照所述第一累積權(quán)值的大小對所述候選項(xiàng)進(jìn)行排序。
5.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述基于每個(gè)候選項(xiàng)的第一累積權(quán)值，對所述輸入信息的候選項(xiàng)進(jìn)行排序的步驟包括: 根據(jù)包括當(dāng)前用戶在內(nèi)的多個(gè)用戶在所述多個(gè)先前時(shí)段的輸入歷史信息計(jì)算每個(gè)用戶針對每個(gè)候選項(xiàng)的第二權(quán)值；根據(jù)所述第二權(quán)值計(jì)算每個(gè)用戶針對每個(gè)候選項(xiàng)的第二累積權(quán)值，其中所述第二權(quán)值對所述第二累積權(quán)值的貢獻(xiàn)度隨時(shí)間先后順序逐步消減；基于所述第一累積權(quán)值和所述第二累積權(quán)值計(jì)算第三累積權(quán)值，并根據(jù)第三累積權(quán)值的大小對所述輸入信息的候選項(xiàng)進(jìn)行排序。
6.根據(jù)權(quán)利要求5所述的方法，其特征在于，所述根據(jù)包括當(dāng)前用戶在內(nèi)的多個(gè)用戶在所述多個(gè)先前時(shí)段的輸入歷史信息計(jì)算每個(gè)用戶針對每個(gè)候選項(xiàng)的第二權(quán)值的步驟包括: 對每個(gè)用戶的輸入歷史信息按時(shí)間先后順序進(jìn)行分類整理，獲得多個(gè)不同先前時(shí)段的輸入歷史信息；統(tǒng)計(jì)每個(gè)用戶在每個(gè)先前時(shí)段輸入所述輸入信息時(shí)對每個(gè)候選項(xiàng)的選擇次數(shù)，作為第二權(quán)值。
7.根據(jù)權(quán)利要求6所述的方法，其特征在于，根據(jù)所述第二權(quán)值計(jì)算每個(gè)用戶針對每個(gè)候選項(xiàng)的第二累積權(quán)值的步驟包括: 通過如下公式計(jì)算所述第二累積權(quán)值:
8.根據(jù)權(quán)利要求7所述的方法，其特征在于，所述基于第一累積權(quán)值和所述第二累積權(quán)值計(jì)算第三累積權(quán)值的步驟包括: 通過如下公式計(jì)算所述第三累積權(quán)值:
9.根據(jù)權(quán)利要求5所述的方法，其特征在于，所述輸入歷史信息包括在輸入法應(yīng)用中的輸入歷史信息、在即時(shí)通信工具中的輸入歷史信息以及在社交網(wǎng)站中的輸入歷史信息中的任意一種或兩種以上。
10.根據(jù)權(quán)利要求8所述的方法，其特征在于，所述基于第一累積權(quán)值和所述第二累積權(quán)值，計(jì)算第三累積權(quán)值，并根據(jù)第三累積權(quán)值的大小對所述輸入信息的候選項(xiàng)進(jìn)行排序的步驟之后，還包括: 根據(jù)所述候選項(xiàng)集合中每個(gè)候選項(xiàng)的第三累積權(quán)值的大小，判斷候選項(xiàng)集合中是否有高頻熱詞或新詞。
11.根據(jù)權(quán)利要求10所述的方法，其特征在于，所述判斷候選項(xiàng)集合中是否有高頻熱詞或新詞的步驟包括: 若候選項(xiàng)集合中候選項(xiàng)的當(dāng)前迭代所產(chǎn)生的所述第三累積權(quán)值與前一次迭代所產(chǎn)生的所述第三累積權(quán)值相比的變化量大于預(yù)設(shè)的新詞的閾值，則確定所述候選項(xiàng)為新詞。
12.根據(jù)權(quán)利要求10所述的方法，其特征在于，所述判斷候選項(xiàng)集合中是否有高頻熱詞或新詞的步驟包括: 若候選項(xiàng)集合中候選項(xiàng)的連續(xù)預(yù)定次迭代產(chǎn)生的所述第三累積權(quán)值均大于預(yù)設(shè)的高頻熱詞的閾值，則確定所述候選項(xiàng)為高頻熱詞。
13.根據(jù)權(quán)利要求10所述的方法，其特征在于，所述判斷候選項(xiàng)集合中是否有高頻熱詞或新詞的步驟之后，還包括: 若候選項(xiàng)集合中有高頻熱詞或新詞時(shí)，向當(dāng)前用戶推送所述高頻熱詞或新詞對應(yīng)的鏈接，和/或所述高頻熱詞或新詞的所述第二累積權(quán)值相對于時(shí)間的變化曲線。
14.根據(jù)權(quán)利要求10所述的方法，其特征在于，所述展示排序后的候選項(xiàng)的步驟包括:展示進(jìn)行排序后的候選項(xiàng)以及候選項(xiàng)的新詞或熱詞的標(biāo)識(shí)。
15.根據(jù)權(quán)利要求8所述的方法，其特征在于，所述展示進(jìn)行排序后的候選項(xiàng)的步驟之后,還包括: 根據(jù)用戶的切換指令，按照候選項(xiàng)的所述第二累積權(quán)值對所述候選項(xiàng)進(jìn)行重新排序；展示按所述第二累積權(quán)值進(jìn)行重新排序的候選項(xiàng)。
16.根據(jù)權(quán)利要求1或2所述的方法，其特征在于，所述時(shí)間語言模型是N-Gram語言模型或N-Pos語言模型。
17.一種對輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的裝置，其特征在于，包括接收模塊、第一獲取模塊、第二獲取模塊、第一排序模塊以及展示模塊，其中: 所述接收模塊用于接收當(dāng)前用戶在當(dāng)前時(shí)段的輸入信息，并將所述當(dāng)前用戶在當(dāng)前時(shí)段的輸入信息發(fā)送給所述第一獲取模塊；所述第一獲取模塊用于利用已建立的按時(shí)間先后順序劃分的多個(gè)先前時(shí)段的時(shí)間語言模型獲取所述輸入信息的候選項(xiàng)集合中每個(gè)候選項(xiàng)在所述先前時(shí)間語言模型下的第一權(quán)值，并將所述第一權(quán)值發(fā)送給所述第二獲取模塊；所述第二獲取模塊用于根據(jù)每個(gè)候選項(xiàng)的所述第一權(quán)值計(jì)算每個(gè)候選項(xiàng)的第一累積權(quán)值，其中所述第一權(quán)值對所述第一累積權(quán)值的貢獻(xiàn)度隨時(shí)間先后順序逐步消減，并將所述第一累積權(quán)值發(fā)送給所述第一排序模塊；所述第一排序模塊用于基于所述每個(gè)候選項(xiàng)的第一累積權(quán)值，對所述輸入信息的候選項(xiàng)進(jìn)行排序，并將進(jìn)行所述排序后的候選項(xiàng)發(fā)送給所述展示模塊；所述展示模塊用于展示進(jìn)行所述排序后的候選項(xiàng)。
18.根據(jù)權(quán)利要求17所述的裝置，其特征在于，所述裝置還包括網(wǎng)頁語料分類模塊、訓(xùn)練模塊，其中: 所述網(wǎng)頁語料分類模塊用于使用文本分類技術(shù)對網(wǎng)頁語料按時(shí)間先后順序進(jìn)行分類整理，獲得多個(gè)不同先前時(shí)段的網(wǎng)頁語料，并將所述不同先前時(shí)段的網(wǎng)頁語料發(fā)送給所述訓(xùn)練模塊；所述訓(xùn)練模塊用于基于每一先前時(shí)段的網(wǎng)頁語料分別訓(xùn)練出一所述時(shí)間語言模型。
19.根據(jù)權(quán)利要求17所述的裝置，其特征在于，所述第二獲取模塊具體用于通過如下公式計(jì)算所述第一累積權(quán)值:C(w,t.) = ‘ s num.: w x k(tt,),
其中，
20.根據(jù)權(quán)利要求17所述的裝置，其特征在于，所述第一排序模塊具體用于按照所述第一累積權(quán)值的大小對所述候選項(xiàng)進(jìn)行排序。
21.根據(jù)權(quán)利要求20所述的裝置，其特征在于，所述第一排序模塊包括第一獲取單元、第二獲取單元、第三獲取單元以及排序單元，其中: 所述第一獲取單元用于根據(jù)包括當(dāng)前用戶在內(nèi)的多個(gè)用戶在所述多個(gè)先前時(shí)段的輸入歷史信息計(jì)算每個(gè)用戶針對每個(gè)候選項(xiàng)的第二權(quán)值，并將所述第二權(quán)值發(fā)送給所述第二獲取單元；所述第二獲取單元用于根據(jù)所述第二權(quán)值計(jì)算每個(gè)用戶針對每個(gè)候選項(xiàng)的第二累積權(quán)值，其中所述第二權(quán)值對所述第二累積權(quán)值的貢獻(xiàn)度隨時(shí)間先后順序逐步消減，并將所述第二累積權(quán)值發(fā)送給所述第三獲取單元；所述第三獲取單元用于基于所述第一累積權(quán)值和所述第二累積權(quán)值，計(jì)算第三累積權(quán)值，并將所述第三累積權(quán)值發(fā)送給所述排序單元；所述排序單元用于根據(jù)所述第三累積權(quán)值的大小對所述輸入信息的候選項(xiàng)進(jìn)行排序。
22.根據(jù)權(quán)利要求21所述的裝置，其特征在于，所述第一獲取單元包括用戶分類子單元以及統(tǒng)計(jì)子單元，其中: 所述用戶分類子單元用于對每個(gè)用戶的輸入歷史信息按時(shí)間先后順序進(jìn)行分類整理，獲得多個(gè)不同先前時(shí)段的輸入歷史信息；所述統(tǒng)計(jì)子單元用于統(tǒng)計(jì)每個(gè)用戶在每個(gè)先前時(shí)段輸入所述輸入信息時(shí)對每個(gè)候選項(xiàng)的選擇次數(shù)，作為第二權(quán)值。
23.根據(jù)權(quán)利要求21所述的裝置，其特征在于，所述第二獲取單元具體用于通過如下公式計(jì)算所述第二累積權(quán)值
24.根據(jù)權(quán)利要求23所述的裝置，其特征在于，所述第三獲取單元具體用于通過如下公式計(jì)算所述第三累積權(quán)值:
25.根據(jù)權(quán)利要求21所述的裝置，其特征在于，所述輸入歷史信息包括在輸入法應(yīng)用中的輸入歷史信息、在即時(shí)通信工具中的輸入歷史信息以及在社交網(wǎng)站中的輸入歷史信息中的任意一種或兩種以上輸入歷史信息。
26.根據(jù)權(quán)利要求24所述的裝置，其特征在于，所述第一排序模塊還包括判斷單元，用于根據(jù)所述候選項(xiàng)集合中每個(gè)候選項(xiàng)的第三累積權(quán)值的大小，判斷候選項(xiàng)集合中是否有高頻熱詞或新詞。
27.根據(jù)權(quán)利要求26所述的裝置，其特征在于，所述判斷單元具體用于當(dāng)候選項(xiàng)集合中候選項(xiàng)的連續(xù)預(yù)定次迭代產(chǎn)生的所述第三累積權(quán)值均大于預(yù)設(shè)的高頻熱詞的閾值時(shí)，則確定所述候選項(xiàng)為高頻熱詞；或具體用于當(dāng)候選項(xiàng)集合中候選項(xiàng)當(dāng)前迭代所產(chǎn)生的所述第三累積權(quán)值與前一次迭代所產(chǎn)生的所述第三累積權(quán)值相比的變化量大于預(yù)設(shè)的新詞的閾值時(shí)，則確定所述候選項(xiàng)為新詞。
28.根據(jù)權(quán)利要求26所述的裝置，其特征在于，所述第一排序模塊還包括推送單元，用于向當(dāng)前用戶推送所述高頻熱詞或新詞對應(yīng)的鏈接，和/或所述高頻熱詞或新詞的所述第二累積權(quán)值相對于時(shí)間的變化曲線。
29.根據(jù)權(quán)利要求26所述的裝置，其特征在于，所述展示模塊具體用于展示排序后的候選項(xiàng)以及候選項(xiàng)的新詞或高頻熱詞的標(biāo)識(shí)。
30.根據(jù)權(quán)利要求24所述的裝置，其特征在于，所述裝置還包括第二排序模塊，用于根據(jù)用戶的切換指令，按照候選項(xiàng)的所述第二累積權(quán)值對所述候選項(xiàng)進(jìn)行排序；所述展示模塊具體用于展示按所述第二累積權(quán)值進(jìn)行排序的候選項(xiàng)。
31.根據(jù)權(quán)利要求17或18所述的裝置，其特征在于，所述時(shí)間語言模型是n-gram語言模型或n-pos語言模型。
【文檔編號(hào)】G06F3/023GK103869998SQ201210531852
【公開日】2014年6月18日申請日期:2012年12月11日優(yōu)先權(quán)日:2012年12月11日
【發(fā)明者】吳先超申請人:百度國際科技（深圳）有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：吳先超
技術(shù)所有人：百度國際科技（深圳）有限公司
我是此專利的發(fā)明人

上一篇：對輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法及裝置制造方法
上一篇：液晶控制板的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種對輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法及裝置制造方法