實(shí)時推薦系統(tǒng)及方法
【專利摘要】本發(fā)明公開了一種實(shí)時推薦系統(tǒng)及方法,該包括如下步驟:接收通過搜索引擎來的搜索查詢詞;對該搜索查詢詞進(jìn)行自然語言處理,抽取出關(guān)鍵詞,并產(chǎn)生通過語義分析抽取出來的一些關(guān)鍵字碎片及權(quán)重;以及獲取該搜索查詢詞的各個關(guān)鍵詞及權(quán)重,結(jié)合離線挖掘結(jié)果和點(diǎn)擊反饋數(shù)據(jù),然后對他們進(jìn)行綜合處理,最終得到用戶的個性化相關(guān)推薦結(jié)果輸出,通過本發(fā)明,可以快速響應(yīng)用戶的需求,實(shí)時地調(diào)整針對不同用戶的推薦結(jié)果,可以更好地滿足用戶的需求。
【專利說明】實(shí)時推薦系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明關(guān)于一種推薦系統(tǒng)及方法,特別是涉及一種基于搜索查詢詞融合的實(shí)時推 薦系統(tǒng)及方法。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)內(nèi)容的爆炸性增長,尤其是視頻網(wǎng)站和社交網(wǎng)站的快速發(fā)展,每天有 大量的新鮮內(nèi)容被生產(chǎn)和消費(fèi),與此同時,對一個用戶來說,從大量無關(guān)的內(nèi)容中發(fā)現(xiàn)感興 趣的信息越來越困難。
[0003] 視頻推薦是視頻網(wǎng)站幫助用戶查找并觀看某個特定領(lǐng)域視頻的方法和工具。相對 于傳統(tǒng)的視頻目錄瀏覽方式或者視頻搜索方式,視頻推薦能夠在用戶不確合適的搜索詞的 情況下,通過分析用戶歷史行為,發(fā)現(xiàn)用戶需求的特定領(lǐng)域,在該特定領(lǐng)域進(jìn)行推薦,避免 了搜索詞的輸入和層次目錄的多次點(diǎn)擊過程,使得查找并觀看某個特定類型的視頻更加簡 單容易。
[0004] 目前的推薦系統(tǒng)大多都是通過后臺離線計(jì)算,然后把事先挖掘好的推薦結(jié)果展示 給用戶,但是如何能夠快速的響應(yīng)用戶的需求,實(shí)時的調(diào)整針對不同用戶的推薦結(jié)果,成為 現(xiàn)在推薦系統(tǒng)所面臨的問題和挑戰(zhàn)。
【發(fā)明內(nèi)容】
[0005] 為克服上述現(xiàn)有技術(shù)存在的不足,本發(fā)明之目的在于提供一種實(shí)時推薦系統(tǒng)及方 法,針對帶有搜索引擎查詢詞的請求,根據(jù)相應(yīng)的搜索查詢詞進(jìn)行實(shí)時計(jì)算與調(diào)整,最終得 到相關(guān)的推薦結(jié)果,實(shí)現(xiàn)快速響應(yīng)用戶的需求,實(shí)時地調(diào)整針對不同用戶的推薦結(jié)果的目 的,可以更好地滿足用戶的需求。
[0006] 為達(dá)上述及其它目的,本發(fā)明提出一種實(shí)時推薦系統(tǒng),至少包括:
[0007] 搜索查詢詞接收模塊,接收通過搜索引擎來得搜索查詢詞;
[0008] 搜索查詢詞解析模塊,對搜索查詢詞進(jìn)行自然語言處理,抽取出關(guān)鍵詞,并產(chǎn)生通 過語義分析抽取出來的一些關(guān)鍵字碎片及權(quán)重;
[0009] 離線挖掘模塊,對該些關(guān)鍵詞進(jìn)行離線挖掘獲得離線挖掘的結(jié)果;
[0010] 點(diǎn)擊反饋模塊,對用戶的點(diǎn)擊進(jìn)行統(tǒng)計(jì),獲得點(diǎn)擊結(jié)果并反饋給實(shí)時在線推薦模 塊;以及
[0011] 實(shí)時在線推薦模塊,獲取當(dāng)前用戶搜索查詢詞的各個關(guān)鍵詞及權(quán)重,并結(jié)合離線 挖掘結(jié)果和點(diǎn)擊反饋數(shù)據(jù),對關(guān)鍵詞及權(quán)重以及離線挖掘結(jié)果和點(diǎn)擊反饋數(shù)據(jù)綜合處理, 最終得到用戶的個性化相關(guān)推薦結(jié)果輸出。
[0012] 進(jìn)一步地,該實(shí)時在線推薦模塊對關(guān)鍵詞及權(quán)重以及離線挖掘結(jié)果和點(diǎn)擊反饋數(shù) 據(jù)進(jìn)行加權(quán)合并并排序,最終得到用戶的個性化相關(guān)推薦結(jié)果輸出。
[0013] 進(jìn)一步地,該搜索查詢詞解析模塊通過中文分詞、TF/IDF以及專名詞典等計(jì)算抽 取出關(guān)鍵詞。
[0014] 進(jìn)一步地,該系統(tǒng)應(yīng)用于視頻推薦。
[0015] 為達(dá)到上述及其他目的,本發(fā)明還提供一種實(shí)時推薦方法,包括如下步驟:
[0016] 步驟一,接收通過搜索引擎來的搜索查詢詞;
[0017] 步驟二,對搜索查詢詞進(jìn)行自然語言處理,抽取出關(guān)鍵詞,并產(chǎn)生通過語義分析抽 取出來的一些關(guān)鍵字碎片及權(quán)重;以及
[0018] 步驟三,獲取該搜索查詢詞的各個關(guān)鍵詞及權(quán)重,結(jié)合離線挖掘結(jié)果和點(diǎn)擊反饋 數(shù)據(jù),然后對他們進(jìn)行綜合處理,最終得到用戶的個性化相關(guān)推薦結(jié)果輸出。
[0019] 進(jìn)一步地,于步驟三中,對關(guān)鍵詞及權(quán)重以及離線挖掘結(jié)果和點(diǎn)擊反饋數(shù)據(jù)進(jìn)行 加權(quán)合并并排序,最終得到用戶的個性化相關(guān)推薦結(jié)果輸出。
[0020] 進(jìn)一步地,于步驟二中,通過中文分詞、TF/IDF以及專名詞典等計(jì)算抽取出關(guān)鍵 。
[0021] 進(jìn)一步地,該方法應(yīng)用于視頻推薦。
[0022] 與現(xiàn)有技術(shù)相比,本發(fā)明一種實(shí)時推薦系統(tǒng)及方法針對帶有搜索引擎查詢詞的請 求,根據(jù)相應(yīng)的搜索查詢詞進(jìn)行實(shí)時計(jì)算與調(diào)整,最終得到相關(guān)的推薦結(jié)果,可快速的響應(yīng) 用戶的需求,實(shí)時地調(diào)整針對不同用戶的推薦結(jié)果,更好地滿足用戶的需求。
【專利附圖】
【附圖說明】
[0023] 圖1為本發(fā)明一種實(shí)時推薦系統(tǒng)的系統(tǒng)架構(gòu)圖;
[0024] 圖2為本發(fā)明一種實(shí)時推薦方法的步驟流程圖。
【具體實(shí)施方式】
[0025] 以下通過特定的具體實(shí)例并結(jié)合【專利附圖】
【附圖說明】本發(fā)明的實(shí)施方式,本領(lǐng)域技術(shù)人員可 由本說明書所揭示的內(nèi)容輕易地了解本發(fā)明的其它優(yōu)點(diǎn)與功效。本發(fā)明亦可通過其它不同 的具體實(shí)例加以施行或應(yīng)用,本說明書中的各項(xiàng)細(xì)節(jié)亦可基于不同觀點(diǎn)與應(yīng)用,在不背離 本發(fā)明的精神下進(jìn)行各種修飾與變更。
[0026] 圖1為本發(fā)明一種實(shí)時推薦系統(tǒng)的系統(tǒng)架構(gòu)圖。本發(fā)明針對帶有搜索引擎查詢詞 的請求,然后根據(jù)相應(yīng)的搜索查詢詞進(jìn)行實(shí)時計(jì)算與調(diào)整,最終得到相關(guān)的推薦結(jié)果,如圖 1所示,本發(fā)明之實(shí)時推薦系統(tǒng),至少包括:搜索查詢詞接收模塊101、搜索查詢詞解析模塊 102、離線挖掘模塊103、點(diǎn)擊反饋模塊104以及實(shí)時在線推薦模塊105。
[0027] 其中,搜索查詢詞接收模塊101用于接收用戶通過搜索引擎來的搜索查詢詞,例 如:用戶Steve,通過搜索引擎輸入一段查詢詞"中國國產(chǎn)航母上海開中印航母暗戰(zhàn)",搜索 查詢詞接收模塊101接收獲得該搜索查詢詞;搜索查詢詞解析模塊102,對搜索查詢詞進(jìn)行 自然語言處理,通過中文分詞,TF/IDF (特征性頻率-倒排文檔頻率加權(quán)法),專名詞典等計(jì) 算抽取出關(guān)鍵詞,并產(chǎn)生通過語義分析抽取出來的一些關(guān)鍵字碎片及權(quán)重,在本發(fā)明較佳 實(shí)施例中,搜索查詢詞解析模塊102對查詢詞進(jìn)行計(jì)算抽取出關(guān)鍵詞A=航母,B=暗戰(zhàn),C= 中印,相應(yīng)關(guān)鍵詞碎片及權(quán)重如下:
[0028] 關(guān)鍵詞A,權(quán)重0.5;
[0029] 關(guān)鍵詞B,權(quán)重0.3;
[0030] 關(guān)鍵詞C,權(quán)重0.2。
[0031] 離線挖掘模塊103,對搜索查詢詞解析模塊102抽取的關(guān)鍵詞進(jìn)行離線挖掘獲得 離線挖掘的結(jié)果,由于離線挖掘?yàn)楝F(xiàn)有技術(shù),在此則不予贅述;點(diǎn)擊反饋模塊104用于對用 戶的點(diǎn)擊進(jìn)行統(tǒng)計(jì),獲得點(diǎn)擊結(jié)果并反饋給實(shí)時在線推薦模塊105。
[0032] 實(shí)時在線推薦模塊105獲取當(dāng)前用戶搜索查詢詞的各個關(guān)鍵詞及權(quán)重,并結(jié)合離 線挖掘結(jié)果和點(diǎn)擊反饋數(shù)據(jù),然后對他們進(jìn)行加權(quán)合并排序,最終得到用戶的個性化相關(guān) 視頻推薦結(jié)果輸出。在本發(fā)明較佳實(shí)施例中,
[0033] 例如:用戶 Steve,
[0034] 關(guān)鍵詞A,權(quán)重0· 5,得到相關(guān)結(jié)果:
[0035] b=0. 31,g=0. 19
[0036] 關(guān)鍵詞B,權(quán)重0· 3,得到相關(guān)結(jié)果:
[0037] x=0. 16, y=0. 14
[0038] 關(guān)鍵詞C,權(quán)重0· 2,得到相關(guān)結(jié)果:
[0039] t=0. 18, u=0. 02
[0040] 離線挖掘結(jié)果:
[0041] x=0. 52, s=0. 48, g=0. 27, k=0. 13, t=0. 12
[0042] click feedback 點(diǎn)擊反饋數(shù)據(jù):
[0043] x=0. 21, u=0. 10, p=0. 07
[0044] 通過合并和重排序操作,最終對于用戶Steve的相關(guān)推薦結(jié)果:
[0045] {b=0. 31, g=0. 19} + {x=0. 16, y=0. 14} + {t=0. 18, u=0. 02} + {x=0. 52, s=0. 48, g=0. 27, k=0. 14, t=0. 12} + {x=0. 21, u=0. 11, p=0. 07}
[0046] ={x=0. 89, s=0. 48, g=0. 46, b=0. 31, t=0. 30, y=0. 14, k=0. 13, u=0. 12, p=0. 07} 〇
[0047] 以上字母均代表不同視頻節(jié)目。
[0048] 圖2為本發(fā)明一種實(shí)時推薦方法的步驟流程圖。本發(fā)明一種實(shí)時推薦方法,適合 于網(wǎng)站網(wǎng)頁的相關(guān)推薦,尤其是視頻推薦,該方法包括如下步驟:
[0049] 步驟201,接收通過搜索引擎來的搜索查詢詞,例如用戶Steve,通過搜索引擎輸 入一段查詢詞"中國國產(chǎn)航母上海開中印航母暗戰(zhàn)",網(wǎng)站接收獲得該搜索查詢詞。
[0050] 步驟202,對搜索查詢詞進(jìn)行自然語言處理,通過中文分詞、TF/IDF (特征性頻 率-倒排文檔頻率加權(quán)法)以及專名詞典等計(jì)算抽取出關(guān)鍵詞,獲得通過語義分析抽取出來 的一些關(guān)鍵字碎片及權(quán)重。在本發(fā)明較佳實(shí)施例中,對搜索查詢詞"中國國產(chǎn)航母上海開中 印航母暗戰(zhàn)"進(jìn)行計(jì)算抽取出關(guān)鍵詞A=航母,B=暗戰(zhàn),C=中印,相應(yīng)關(guān)鍵詞碎片及權(quán)重如 下:
[0051] 關(guān)鍵詞A,權(quán)重0.5;
[0052] 關(guān)鍵詞B,權(quán)重0.3;
[0053] 關(guān)鍵詞C,權(quán)重0.2。
[0054] 步驟203,獲取該搜索查詢詞的各個關(guān)鍵詞及權(quán)重,結(jié)合離線挖掘結(jié)果和點(diǎn)擊反饋 數(shù)據(jù),然后對他們進(jìn)行加權(quán)合并排序,最終得到用戶的個性化相關(guān)推薦結(jié)果輸出。例如:用 戶 Steve,
[0055] 關(guān)鍵詞A,權(quán)重0· 5,得到相關(guān)結(jié)果:
[0056] b=0. 31,g=0. 19 (各字母的含義)
[0057] 關(guān)鍵詞B,權(quán)重0. 3,得到相關(guān)結(jié)果:
[0058] x=0. 16, y=0. 14
[0059] 關(guān)鍵詞C,權(quán)重(λ 2,得到相關(guān)結(jié)果:
[0060] t=0. 18, u=0. 02
[0061] 離線挖掘結(jié)果:
[0062] x=0. 52, s=0. 48, g=0. 27, k=0. 13, t=0. 12
[0063] click feedback 點(diǎn)擊反饋數(shù)據(jù):
[0064] x=0. 21, u=0. 10, p=0. 07
[0065] 通過合并和重排序操作,最終對于用戶Steve的相關(guān)推薦結(jié)果:
[0066] {b=0. 31, g=0. 19} + {x=0. 16, y=0. 14} + {t=0. 18, u=0. 02} + {x=0. 52, s=0. 48, g=0. 27, k=0. 14, t=0. 12} + {x=0. 21, u=0. 11, p=0. 07}
[0067] ={x=0. 89, s=0. 48, g=0. 46, b=0. 31, t=0. 30, y=0. 14, k=0. 13, u=0. 12, p=0. 07} 〇
[0068] 綜上所述,本發(fā)明一種實(shí)時推薦系統(tǒng)及方法針對帶有搜索引擎查詢詞的請求,然 后根據(jù)相應(yīng)的搜索查詢詞進(jìn)行實(shí)時計(jì)算與調(diào)整,最終得到相關(guān)的推薦結(jié)果,可快速的響應(yīng) 用戶的需求,實(shí)時地調(diào)整針對不同用戶的推薦結(jié)果,更好地滿足用戶的需求。
[0069] 與現(xiàn)有技術(shù)相比,本發(fā)明具有以下幾個優(yōu)點(diǎn):
[0070] 1、通過不同的搜索查詢詞,可以改變用戶的相關(guān)推薦結(jié)果,從而針對不同的用戶 的搜索查詢詞計(jì)算得到的相關(guān)推薦結(jié)果是不同的,該方法可適用于多個領(lǐng)域的相關(guān)推薦。
[0071] 2、相關(guān)推薦結(jié)果會隨著用戶的搜索查詢實(shí)時發(fā)生變化,即當(dāng)不同用戶請求不同的 搜索查詢詞時會立刻得到不一樣的結(jié)果,給用戶帶來良好的用戶體驗(yàn)。
[0072] 上述實(shí)施例僅例示性說明本發(fā)明的原理及其功效,而非用于限制本發(fā)明。任何本 領(lǐng)域技術(shù)人員均可在不違背本發(fā)明的精神及范疇下,對上述實(shí)施例進(jìn)行修飾與改變。因此, 本發(fā)明的權(quán)利保護(hù)范圍,應(yīng)如權(quán)利要求書所列。
【權(quán)利要求】
1. 一種實(shí)時推薦系統(tǒng),至少包括: 搜索查詢詞接收模塊,接收通過搜索引擎來得搜索查詢詞; 搜索查詢詞解析模塊,對該搜索查詢詞進(jìn)行自然語言處理,抽取出關(guān)鍵詞,并產(chǎn)生通過 語義分析抽取出來的一些關(guān)鍵字碎片及權(quán)重; 離線挖掘模塊,對該些關(guān)鍵詞進(jìn)行離線挖掘獲得離線挖掘的結(jié)果; 點(diǎn)擊反饋模塊,對用戶的點(diǎn)擊進(jìn)行統(tǒng)計(jì),獲得點(diǎn)擊結(jié)果并反饋給實(shí)時在線推薦模塊;以 及 實(shí)時在線推薦模塊,獲取當(dāng)前用戶搜索查詢詞的各個關(guān)鍵詞及權(quán)重,并結(jié)合離線挖掘 結(jié)果和點(diǎn)擊反饋數(shù)據(jù),對關(guān)鍵詞及權(quán)重以及離線挖掘結(jié)果和點(diǎn)擊反饋數(shù)據(jù)綜合處理,最終 得到用戶的個性化相關(guān)推薦結(jié)果輸出。
2. 如權(quán)利要求1所述的一種實(shí)時推薦系統(tǒng),其特征在于:該實(shí)時在線推薦模塊對關(guān)鍵 詞及權(quán)重以及離線挖掘結(jié)果和點(diǎn)擊反饋數(shù)據(jù)進(jìn)行加權(quán)合并并排序,最終得到用戶的個性化 相關(guān)推薦結(jié)果輸出。
3. 如權(quán)利要求1所述的一種實(shí)時推薦系統(tǒng),其特征在于:該搜索查詢詞解析模塊通過 中文分詞、TF/IDF以及專名詞典等計(jì)算抽取出關(guān)鍵詞。
4. 如權(quán)利要求1所述的一種實(shí)時推薦系統(tǒng),其特征在于:該系統(tǒng)應(yīng)用于視頻推薦。
5. -種實(shí)時推薦方法,包括如下步驟: 步驟一,接收通過搜索引擎來的搜索查詢詞; 步驟二,對該搜索查詢詞進(jìn)行自然語言處理,抽取出關(guān)鍵詞,并產(chǎn)生通過語義分析抽取 出來的一些關(guān)鍵字碎片及權(quán)重;以及 步驟三,獲取該搜索查詢詞的各個關(guān)鍵詞及權(quán)重,結(jié)合離線挖掘結(jié)果和點(diǎn)擊反饋數(shù)據(jù), 然后對他們進(jìn)行綜合處理,最終得到用戶的個性化相關(guān)推薦結(jié)果輸出。
6. 如權(quán)利要求5所述的一種實(shí)時推薦方法,其特征在于:于步驟三中,對關(guān)鍵詞及權(quán) 重以及離線挖掘結(jié)果和點(diǎn)擊反饋數(shù)據(jù)進(jìn)行加權(quán)合并并排序,最終得到用戶的個性化相關(guān)推 薦結(jié)果輸出。
7. 如權(quán)利要求5所述的一種實(shí)時推薦方法,其特征在于:于步驟二中,通過中文分詞、 TF/IDF以及專名詞典等計(jì)算抽取出關(guān)鍵詞。
8. 如權(quán)利要求5所述的一種實(shí)時推薦方法,其特征在于:該方法應(yīng)用于視頻推薦。
【文檔編號】G06F17/30GK104216931SQ201310373521
【公開日】2014年12月17日 申請日期:2013年8月23日 優(yōu)先權(quán)日:2013年5月29日
【發(fā)明者】辛穎偉, 陳運(yùn)文, 紀(jì)達(dá)麒, 劉作濤, 姚璐, 陳冬 申請人:酷盛(天津)科技有限公司