欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種對輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法及裝置制造方法

文檔序號(hào):6492668閱讀:85來源:國知局
一種對輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種對輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法及裝置。其中該方法包括:接收當(dāng)前用戶在當(dāng)前時(shí)段的輸入信息;利用已建立的按時(shí)間先后順序劃分的多個(gè)先前時(shí)段的時(shí)間語言模型獲取輸入信息的候選項(xiàng)集合中每個(gè)候選項(xiàng)在先前時(shí)間語言模型下的第一權(quán)值;根據(jù)每個(gè)候選項(xiàng)的第一權(quán)值計(jì)算每個(gè)候選項(xiàng)的第一累積權(quán)值,其中第一權(quán)值對第一累積權(quán)值的貢獻(xiàn)度隨時(shí)間先后順序逐步消減;基于每個(gè)候選項(xiàng)的第一累積權(quán)值,對輸入信息的候選項(xiàng)進(jìn)行排序;展示排序后的候選項(xiàng)。通過上述方式,本發(fā)明能夠針對用戶在不同時(shí)段輸入同樣的輸入信息時(shí),向用戶推送與時(shí)間相關(guān)的候選項(xiàng)排序,以滿足不同時(shí)段用戶的需求,提升用戶體驗(yàn)。
【專利說明】一種對輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及輸入法領(lǐng)域,特別是涉及一種對輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法及裝置。
【背景技術(shù)】
[0002]輸入法是指為了將各種符號(hào)輸入計(jì)算機(jī)或其他設(shè)備(如手機(jī))而采用的編碼方法。
[0003]利用輸入法進(jìn)行輸入時(shí),通常通過向設(shè)備發(fā)送各種字符以獲取字符對應(yīng)的候選項(xiàng),并選擇相應(yīng)的候選項(xiàng)來完成輸入。而對于輸入的相同讀音的字符時(shí),獲取得到的字符對應(yīng)的候選項(xiàng)的集合中各候選項(xiàng)的排序通常都是一樣的。比如對于拼音“daxue”,該拼音對應(yīng)的候選項(xiàng)包括“大學(xué)”、“大雪”、“大血”、“打血”等多個(gè),而每次針對用戶對拼音“daxue”的輸入,向用戶推送的候選項(xiàng)排序基本是一樣的,或者是只按照候選項(xiàng)在大規(guī)模語料中出現(xiàn)的頻次來排序。
[0004]本申請的發(fā)明人在長期的研究中發(fā)現(xiàn),每個(gè)用戶在不同的時(shí)段輸入的同一個(gè)讀音的字符時(shí),可能所需要的候選項(xiàng)不一樣。針對同一個(gè)輸入推送的候選項(xiàng)排序都一樣或者只簡單的按照頻次來進(jìn)行排序,不足以滿足不同時(shí)段用戶的需求,影響用戶體驗(yàn)。

【發(fā)明內(nèi)容】

[0005]本發(fā)明主要解決的技術(shù)問題是提供一種對候選項(xiàng)進(jìn)行排序的方法及裝置,能夠針對用戶輸入同樣的字符時(shí),向用戶推送的候選項(xiàng)排序能夠滿足不同時(shí)段用戶的需求,提升用戶體驗(yàn)。
[0006]為解決上述技術(shù)問題,本發(fā)明采用的一個(gè)技術(shù)方案是:提供一種對輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法,包括:接收當(dāng)前用戶在當(dāng)前時(shí)段的輸入信息;利用已建立的按時(shí)間先后順序劃分的多個(gè)先前時(shí)段的時(shí)間語言模型獲取所述輸入信息的候選項(xiàng)集合中每個(gè)候選項(xiàng)在所述先前時(shí)間語言模型下的第一權(quán)值;根據(jù)每個(gè)候選項(xiàng)的所述第一權(quán)值計(jì)算每個(gè)候選項(xiàng)的第一累積權(quán)值,其中所述第一權(quán)值對所述第一累積權(quán)值的貢獻(xiàn)度隨時(shí)間先后順序逐步消減;基于所述每個(gè)候選項(xiàng)的第一累積權(quán)值,對所述輸入信息的候選項(xiàng)進(jìn)行排序;展示排序后的候選項(xiàng)。
[0007]其中,所述接收當(dāng)前用戶在當(dāng)前時(shí)段的輸入信息的步驟之前,還包括:使用文本分類技術(shù)對網(wǎng)頁語料按時(shí)間先后順序進(jìn)行分類整理,獲得多個(gè)不同先前時(shí)段的網(wǎng)頁語料;基于每一先前時(shí)段的網(wǎng)頁語料分別訓(xùn)練出一所述時(shí)間語言模型。
[0008]其中,所述根據(jù)每個(gè)候選項(xiàng)的所述第一權(quán)值計(jì)算每個(gè)候選項(xiàng)的第一累積權(quán)值的步驟包括:通過如下公式計(jì)算所述第一累積權(quán)值:
[0009]
【權(quán)利要求】
1.一種對輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的方法,其特征在于,包括: 接收當(dāng)前用戶在當(dāng)前時(shí)段的輸入信息; 利用已建立的按時(shí)間先后順序劃分的多個(gè)先前時(shí)段的時(shí)間語言模型獲取所述輸入信息的候選項(xiàng)集合中每個(gè)候選項(xiàng)在所述先前時(shí)間語言模型下的第一權(quán)值; 根據(jù)每個(gè)候選項(xiàng)的所述第一權(quán)值計(jì)算每個(gè)候選項(xiàng)的第一累積權(quán)值,其中所述第一權(quán)值對所述第一累積權(quán)值的貢獻(xiàn)度隨時(shí)間先后順序逐步消減; 基于所述每個(gè)候選項(xiàng)的第一累積權(quán)值,對所述輸入信息的候選項(xiàng)進(jìn)行排序; 展示排序后的候選項(xiàng)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述接收當(dāng)前用戶在當(dāng)前時(shí)段的輸入信息的步驟之前,還包括: 使用文本分類技術(shù)對網(wǎng)頁語料按時(shí)間先后順序進(jìn)行分類整理,獲得多個(gè)不同先前時(shí)段的網(wǎng)頁語料; 基于每一先前時(shí)段的網(wǎng)頁語料分別訓(xùn)練出一所述時(shí)間語言模型。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)每個(gè)候選項(xiàng)的所述第一權(quán)值計(jì)算每個(gè)候選項(xiàng)的第一累積權(quán)值的步驟包括: 通過如下公式計(jì)算所述第一累積權(quán)值:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于每個(gè)候選項(xiàng)的第一累積權(quán)值,對所述輸入信息的候選項(xiàng)進(jìn)行排序的步驟包括: 按照所述第一累積權(quán)值的大小對所述候選項(xiàng)進(jìn)行排序。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于每個(gè)候選項(xiàng)的第一累積權(quán)值,對所述輸入信息的候選項(xiàng)進(jìn)行排序的步驟包括: 根據(jù)包括當(dāng)前用戶在內(nèi)的多個(gè)用戶在所述多個(gè)先前時(shí)段的輸入歷史信息計(jì)算每個(gè)用戶針對每個(gè)候選項(xiàng)的第二權(quán)值; 根據(jù)所述第二權(quán)值計(jì)算每個(gè)用戶針對每個(gè)候選項(xiàng)的第二累積權(quán)值,其中所述第二權(quán)值對所述第二累積權(quán)值的貢獻(xiàn)度隨時(shí)間先后順序逐步消減; 基于所述第一累積權(quán)值和所述第二累積權(quán)值計(jì)算第三累積權(quán)值,并根據(jù)第三累積權(quán)值的大小對所述輸入信息的候選項(xiàng)進(jìn)行排序。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)包括當(dāng)前用戶在內(nèi)的多個(gè)用戶在所述多個(gè)先前時(shí)段的輸入歷史信息計(jì)算每個(gè)用戶針對每個(gè)候選項(xiàng)的第二權(quán)值的步驟包括: 對每個(gè)用戶的輸入歷史信息按時(shí)間先后順序進(jìn)行分類整理,獲得多個(gè)不同先前時(shí)段的輸入歷史信息; 統(tǒng)計(jì)每個(gè)用戶在每個(gè)先前時(shí)段輸入所述輸入信息時(shí)對每個(gè)候選項(xiàng)的選擇次數(shù),作為第二權(quán)值。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,根據(jù)所述第二權(quán)值計(jì)算每個(gè)用戶針對每個(gè)候選項(xiàng)的第二累積權(quán)值的步驟包括: 通過如下公式計(jì)算所述第二累積權(quán)值:
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述基于第一累積權(quán)值和所述第二累積權(quán)值計(jì)算第三累積權(quán)值的步驟包括: 通過如下公式計(jì)算所述第三累積權(quán)值:
9.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述輸入歷史信息包括在輸入法應(yīng)用中的輸入歷史信息、在即時(shí)通信工具中的輸入歷史信息以及在社交網(wǎng)站中的輸入歷史信息中的任意一種或兩種以上。
10.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述基于第一累積權(quán)值和所述第二累積權(quán)值,計(jì)算第三累積權(quán)值,并根據(jù)第三累積權(quán)值的大小對所述輸入信息的候選項(xiàng)進(jìn)行排序的步驟之后,還包括: 根據(jù)所述候選項(xiàng)集合中每個(gè)候選項(xiàng)的第三累積權(quán)值的大小,判斷候選項(xiàng)集合中是否有高頻熱詞或新詞。
11.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述判斷候選項(xiàng)集合中是否有高頻熱詞或新詞的步驟包括: 若候選項(xiàng)集合中候選項(xiàng)的當(dāng)前迭代所產(chǎn)生的所述第三累積權(quán)值與前一次迭代所產(chǎn)生的所述第三累積權(quán)值相比的變化量大于預(yù)設(shè)的新詞的閾值,則確定所述候選項(xiàng)為新詞。
12.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述判斷候選項(xiàng)集合中是否有高頻熱詞或新詞的步驟包括: 若候選項(xiàng)集合中候選項(xiàng)的連續(xù)預(yù)定次迭代產(chǎn)生的所述第三累積權(quán)值均大于預(yù)設(shè)的高頻熱詞的閾值,則確定所述候選項(xiàng)為高頻熱詞。
13.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述判斷候選項(xiàng)集合中是否有高頻熱詞或新詞的步驟之后,還包括: 若候選項(xiàng)集合中有高頻熱詞或新詞時(shí),向當(dāng)前用戶推送所述高頻熱詞或新詞對應(yīng)的鏈接,和/或所述高頻熱詞或新詞的所述第二累積權(quán)值相對于時(shí)間的變化曲線。
14.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述展示排序后的候選項(xiàng)的步驟包括:展示進(jìn)行排序后的候選項(xiàng)以及候選項(xiàng)的新詞或熱詞的標(biāo)識(shí)。
15.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述展示進(jìn)行排序后的候選項(xiàng)的步驟之后,還包括: 根據(jù)用戶的切換指令,按照候選項(xiàng)的所述第二累積權(quán)值對所述候選項(xiàng)進(jìn)行重新排序; 展示按所述第二累積權(quán)值進(jìn)行重新排序的候選項(xiàng)。
16.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述時(shí)間語言模型是N-Gram語言模型或N-Pos語言模型。
17.一種對輸入法所產(chǎn)生的候選項(xiàng)進(jìn)行排序的裝置,其特征在于,包括接收模塊、第一獲取模塊、第二獲取模塊、第一排序模塊以及展示模塊,其中: 所述接收模塊用于接收當(dāng)前用戶在當(dāng)前時(shí)段的輸入信息,并將所述當(dāng)前用戶在當(dāng)前時(shí)段的輸入信息發(fā)送給所述第一獲取模塊; 所述第一獲取模塊用于利用已建立的按時(shí)間先后順序劃分的多個(gè)先前時(shí)段的時(shí)間語言模型獲取所述輸入信息的候選項(xiàng)集合中每個(gè)候選項(xiàng)在所述先前時(shí)間語言模型下的第一權(quán)值,并將所述第一權(quán)值發(fā)送給所述第二獲取模塊; 所述第二獲取模塊用于根據(jù)每個(gè)候選項(xiàng)的所述第一權(quán)值計(jì)算每個(gè)候選項(xiàng)的第一累積權(quán)值,其中所述第一權(quán)值對所述第一累積權(quán)值的貢獻(xiàn)度隨時(shí)間先后順序逐步消減,并將所述第一累積權(quán)值發(fā)送給所述第一排序模塊; 所述第一排序模塊用于基于所述每個(gè)候選項(xiàng)的第一累積權(quán)值,對所述輸入信息的候選項(xiàng)進(jìn)行排序,并將進(jìn)行所述排序后的候選項(xiàng)發(fā)送給所述展示模塊; 所述展示模塊用于展示進(jìn)行所述排序后的候選項(xiàng)。
18.根據(jù)權(quán)利要求17所述的裝置,其特征在于,所述裝置還包括網(wǎng)頁語料分類模塊、訓(xùn)練模塊,其中: 所述網(wǎng)頁語料分類模塊用于使用文本分類技術(shù)對網(wǎng)頁語料按時(shí)間先后順序進(jìn)行分類整理,獲得多個(gè)不同先前時(shí)段的網(wǎng)頁語料,并將所述不同先前時(shí)段的網(wǎng)頁語料發(fā)送給所述訓(xùn)練模塊; 所述訓(xùn)練模塊用于基于每一先前時(shí)段的網(wǎng)頁語料分別訓(xùn)練出一所述時(shí)間語言模型。
19.根據(jù)權(quán)利要求17所述的裝置,其特征在于,所述第二獲取模塊具體用于通過如下公式計(jì)算所述第一累積權(quán)值:C(w,t.) = ‘ s num.: w x k(tt,),
其中,
20.根據(jù)權(quán)利要求17所述的裝置,其特征在于,所述第一排序模塊具體用于按照所述第一累積權(quán)值的大小對所述候選項(xiàng)進(jìn)行排序。
21.根據(jù)權(quán)利要求20所述的裝置,其特征在于,所述第一排序模塊包括第一獲取單元、第二獲取單元、第三獲取單元以及排序單元,其中: 所述第一獲取單元用于根據(jù)包括當(dāng)前用戶在內(nèi)的多個(gè)用戶在所述多個(gè)先前時(shí)段的輸入歷史信息計(jì)算每個(gè)用戶針對每個(gè)候選項(xiàng)的第二權(quán)值,并將所述第二權(quán)值發(fā)送給所述第二獲取單元; 所述第二獲取單元用于根據(jù)所述第二權(quán)值計(jì)算每個(gè)用戶針對每個(gè)候選項(xiàng)的第二累積權(quán)值,其中所述第二權(quán)值對所述第二累積權(quán)值的貢獻(xiàn)度隨時(shí)間先后順序逐步消減,并將所述第二累積權(quán)值發(fā)送給所述第三獲取單元; 所述第三獲取單元用于基于所述第一累積權(quán)值和所述第二累積權(quán)值,計(jì)算第三累積權(quán)值,并將所述第三累積權(quán)值發(fā)送給所述排序單元; 所述排序單元用于根據(jù)所述第三累積權(quán)值的大小對所述輸入信息的候選項(xiàng)進(jìn)行排序。
22.根據(jù)權(quán)利要求21所述的裝置,其特征在于,所述第一獲取單元包括用戶分類子單元以及統(tǒng)計(jì)子單元,其中: 所述用戶分類子單元用于對每個(gè)用戶的輸入歷史信息按時(shí)間先后順序進(jìn)行分類整理,獲得多個(gè)不同先前時(shí)段的輸入歷史信息; 所述統(tǒng)計(jì)子單元用于統(tǒng)計(jì)每個(gè)用戶在每個(gè)先前時(shí)段輸入所述輸入信息時(shí)對每個(gè)候選項(xiàng)的選擇次數(shù),作為第二權(quán)值。
23.根據(jù)權(quán)利要求21所述的裝置,其特征在于,所述第二獲取單元具體用于通過如下公式計(jì)算所述第二累積權(quán)值
24.根據(jù)權(quán)利要求23所述的裝置,其特征在于,所述第三獲取單元具體用于通過如下公式計(jì)算所述第三累積權(quán)值:
25.根據(jù)權(quán)利要求21所述的裝置,其特征在于,所述輸入歷史信息包括在輸入法應(yīng)用中的輸入歷史信息、在即時(shí)通信工具中的輸入歷史信息以及在社交網(wǎng)站中的輸入歷史信息中的任意一種或兩種以上輸入歷史信息。
26.根據(jù)權(quán)利要求24所述的裝置,其特征在于,所述第一排序模塊還包括判斷單元,用于根據(jù)所述候選項(xiàng)集合中每個(gè)候選項(xiàng)的第三累積權(quán)值的大小,判斷候選項(xiàng)集合中是否有高頻熱詞或新詞。
27.根據(jù)權(quán)利要求26所述的裝置,其特征在于,所述判斷單元具體用于當(dāng)候選項(xiàng)集合中候選項(xiàng)的連續(xù)預(yù)定次迭代產(chǎn)生的所述第三累積權(quán)值均大于預(yù)設(shè)的高頻熱詞的閾值時(shí),則確定所述候選項(xiàng)為高頻熱詞;或具體用于當(dāng)候選項(xiàng)集合中候選項(xiàng)當(dāng)前迭代所產(chǎn)生的所述第三累積權(quán)值與前一次迭代所產(chǎn)生的所述第三累積權(quán)值相比的變化量大于預(yù)設(shè)的新詞的閾值時(shí),則確定所述候選項(xiàng)為新詞。
28.根據(jù)權(quán)利要求26所述的裝置,其特征在于,所述第一排序模塊還包括推送單元,用于向當(dāng)前用戶推送所述高頻熱詞或新詞對應(yīng)的鏈接,和/或所述高頻熱詞或新詞的所述第二累積權(quán)值相對于時(shí)間的變化曲線。
29.根據(jù)權(quán)利要求26所述的裝置,其特征在于,所述展示模塊具體用于展示排序后的候選項(xiàng)以及候選項(xiàng)的新詞或高頻熱詞的標(biāo)識(shí)。
30.根據(jù)權(quán)利要求24所述的裝置,其特征在于,所述裝置還包括第二排序模塊,用于根據(jù)用戶的切換指令,按照候選項(xiàng)的所述第二累積權(quán)值對所述候選項(xiàng)進(jìn)行排序; 所述展示模塊具體用于展示按所述第二累積權(quán)值進(jìn)行排序的候選項(xiàng)。
31.根據(jù)權(quán)利要求17或18所述的裝置,其特征在于,所述時(shí)間語言模型是n-gram語言模型或n-pos語言 模型。
【文檔編號(hào)】G06F3/023GK103869998SQ201210531852
【公開日】2014年6月18日 申請日期:2012年12月11日 優(yōu)先權(quán)日:2012年12月11日
【發(fā)明者】吳先超 申請人:百度國際科技(深圳)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
四会市| 新疆| 鹤庆县| 增城市| 无极县| 永善县| 田东县| 环江| 南平市| 江华| 鹤岗市| 蓝田县| 武强县| 临安市| 金山区| 泽普县| 绥阳县| 浦江县| 许昌市| 赞皇县| 德保县| 吉首市| 洪洞县| 新丰县| 鹤山市| 尼勒克县| 黄龙县| 富宁县| 周至县| 高密市| 如皋市| 牙克石市| 额尔古纳市| 鱼台县| 龙口市| 南开区| 麻阳| 大新县| 剑河县| 苏尼特右旗| 绥棱县|