相關(guān)搜索結(jié)果的提示方法、服務(wù)器及系統(tǒng)的制作方法
【專利摘要】本申請公開了相關(guān)搜索結(jié)果的提示方法、服務(wù)器及系統(tǒng),所述提示方法包括:接收輸入的關(guān)鍵詞,并根據(jù)輸入的關(guān)鍵詞查詢相關(guān)搜索詞庫,獲取與輸入的關(guān)鍵詞存在關(guān)聯(lián)關(guān)系的至少一個(gè)關(guān)鍵詞;根據(jù)與輸入的關(guān)鍵詞關(guān)聯(lián)的至少一個(gè)關(guān)鍵詞形成相關(guān)搜索結(jié)果,提示相關(guān)搜索結(jié)果;上述步驟中,相關(guān)搜索詞庫中存儲(chǔ)有預(yù)先收集的若干關(guān)鍵詞對,每個(gè)關(guān)鍵詞對中包含存在關(guān)聯(lián)關(guān)系的兩個(gè)關(guān)鍵詞,關(guān)聯(lián)關(guān)系由兩個(gè)關(guān)鍵詞之間的相關(guān)度構(gòu)成,兩個(gè)詞匯之間的相關(guān)度根據(jù)兩個(gè)詞匯在一次搜索中被同時(shí)輸入的概率進(jìn)行統(tǒng)計(jì)分析獲得。相關(guān)度較高的兩個(gè)關(guān)鍵詞能夠更加客觀地準(zhǔn)確地反映出用戶的興趣點(diǎn),使得本申請?jiān)谶M(jìn)行視頻資源檢索時(shí)提供更加精準(zhǔn)的相關(guān)搜索結(jié)果。
【專利說明】相關(guān)搜索結(jié)果的提示方法、服務(wù)器及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本申請涉及檢索【技術(shù)領(lǐng)域】,具體涉及一種相關(guān)搜索結(jié)果的提示方法、服務(wù)器及系統(tǒng)。
【背景技術(shù)】
[0002]用戶在使用檢索類網(wǎng)站進(jìn)行視頻資源檢索時(shí),會(huì)在檢索框中輸入節(jié)目名稱或者演員姓名這類片源名稱對自己想觀看的視頻資源進(jìn)行檢索。通常在檢索類網(wǎng)站的檢索結(jié)果中,會(huì)呈現(xiàn)兩個(gè)部分,一部分是具體的檢索結(jié)果,另一部分是相關(guān)搜索結(jié)果的展示。
[0003]例如以用戶檢索“爸爸去哪兒”為例,用戶在檢索類網(wǎng)站的檢索框中輸入關(guān)鍵詞“爸爸去哪兒”,檢索服務(wù)器根據(jù)上述關(guān)鍵詞進(jìn)行檢索,向用戶反饋檢索結(jié)果。另外,還會(huì)展示相關(guān)的關(guān)鍵詞作為相關(guān)搜索結(jié)果,即在當(dāng)前關(guān)鍵詞的基礎(chǔ)上提供幾個(gè)衍生的詞作為相關(guān)關(guān)鍵詞,如仍以輸入“爸爸去哪兒”為例,展示的相關(guān)關(guān)鍵詞通常包括“爸爸我們?nèi)ツ膬骸?、“爸爸去哪兒主題曲”、“爸爸去哪兒第一期”、“爸爸去哪兒第六期”、“爸爸去哪兒直播”、“爸爸去哪兒第四期”、“父親去哪兒”、“爸爸去哪兒第三期”等內(nèi)容。
[0004]上述現(xiàn)有技術(shù)中檢索類網(wǎng)站提示相關(guān)關(guān)鍵詞,一般都是根據(jù)用戶在檢索框中輸入關(guān)鍵詞的字面含義獲取相似或相近詞進(jìn)行提不,甚至是提具有字面包含關(guān)系的相關(guān)關(guān)鍵詞,以上例子是以用戶輸入節(jié)目名稱為例進(jìn)行說明,在用戶輸入節(jié)目的演員姓名檢索視頻資源時(shí)也會(huì)按照同樣的方式進(jìn)行處理。
[0005]但是,上述相關(guān)關(guān)鍵詞在用戶進(jìn)行電視節(jié)目的視頻資源檢索時(shí)并不適用,因?yàn)橛脩粝矚g或者想看的視頻資源很可能是同一類的熱播電視節(jié)目,如現(xiàn)有技術(shù)中僅根據(jù)字面含義相近、相似或者具有包含關(guān)系來作為相關(guān)關(guān)鍵詞顯然無法提示用戶想要的相關(guān)搜索結(jié)果。例如,“中國好聲音”和“快樂男聲”是同時(shí)熱播的兩部音樂類選秀節(jié)目,很多觀看了“中國好聲音”的用戶,往往還想觀看“快樂男聲”。但是“中國好聲音”和“快樂男聲”在字面含義上完全不同,也不具備公共字包含關(guān)系,按照現(xiàn)有的檢索類網(wǎng)站提供相關(guān)關(guān)鍵詞的方式,在輸入“中國好聲音”時(shí),是無法提示“快樂男聲”的相關(guān)搜索結(jié)果的。
【發(fā)明內(nèi)容】
[0006]本申請所要解決的技術(shù)問題在于提供一種相關(guān)搜索結(jié)果的提示方法、服務(wù)器及系統(tǒng),通過在檢索系統(tǒng)的后臺(tái)服務(wù)器中設(shè)置相關(guān)搜索詞庫,并在相關(guān)搜索詞庫中存儲(chǔ)存在關(guān)聯(lián)關(guān)系的若干關(guān)鍵詞對,每個(gè)關(guān)鍵詞對包含兩個(gè)關(guān)鍵詞,關(guān)聯(lián)關(guān)系根據(jù)每個(gè)關(guān)鍵詞對中包含的兩個(gè)關(guān)鍵詞之間的相關(guān)度獲得,而各關(guān)鍵詞之間的相關(guān)度為根據(jù)用戶輸入行為進(jìn)行統(tǒng)計(jì)分析獲得,上述的相關(guān)度能夠準(zhǔn)確的反映用戶在一段時(shí)間內(nèi)同時(shí)輸入兩個(gè)關(guān)鍵詞的概率,即相關(guān)度越高的兩個(gè)關(guān)鍵詞,用戶在一段時(shí)間內(nèi)同時(shí)輸入兩個(gè)關(guān)鍵詞的概率越大,則說明其均為用戶同時(shí)感興趣的對象。通過上述方式為用戶提供相關(guān)關(guān)鍵詞,能夠更加客觀地匹配用戶的興趣點(diǎn),從而在進(jìn)行視頻資源檢索時(shí)提供更加精準(zhǔn)的相關(guān)搜索結(jié)果。
[0007]為了解決上述問題,本申請揭示了一種相關(guān)搜索結(jié)果的提示方法,包括:接收輸入的關(guān)鍵詞,并根據(jù)所述輸入的關(guān)鍵詞查詢相關(guān)搜索詞庫,獲取與所述輸入的關(guān)鍵詞存在關(guān)聯(lián)關(guān)系的至少一個(gè)關(guān)鍵詞;根據(jù)與所述輸入的關(guān)鍵詞關(guān)聯(lián)的至少一個(gè)關(guān)鍵詞形成相關(guān)搜索結(jié)果,提示所述相關(guān)搜索結(jié)果;上述步驟中,所述相關(guān)搜索詞庫中存儲(chǔ)有預(yù)先收集的若干關(guān)鍵詞對,每個(gè)關(guān)鍵詞對中包含存在關(guān)聯(lián)關(guān)系的兩個(gè)關(guān)鍵詞,所述關(guān)聯(lián)關(guān)系由所述兩個(gè)關(guān)鍵詞之間的相關(guān)度構(gòu)成,所述兩個(gè)詞匯之間的相關(guān)度根據(jù)所述兩個(gè)詞匯在一次搜索中被同時(shí)輸入的概率進(jìn)行統(tǒng)計(jì)分析獲得。
[0008]進(jìn)一步地,獲取與所述輸入的關(guān)鍵詞存在關(guān)聯(lián)關(guān)系的至少一個(gè)關(guān)鍵詞的操作,具體包括:通過所述相關(guān)搜索詞庫查詢到與所述輸入的關(guān)鍵詞存在關(guān)聯(lián)關(guān)系的關(guān)鍵詞為多個(gè)關(guān)鍵詞時(shí),按照所述多個(gè)關(guān)鍵詞中的每個(gè)關(guān)鍵詞與所述輸入的關(guān)鍵詞的相關(guān)度從大到小的順序,獲取所述多個(gè)關(guān)鍵詞。
[0009]進(jìn)一步地,接收輸入的關(guān)鍵詞,并根據(jù)所述輸入的關(guān)鍵詞查詢相關(guān)搜索詞庫的操作之前,包括:記錄在一段預(yù)設(shè)時(shí)間內(nèi)接收到的關(guān)鍵詞組合,每個(gè)關(guān)鍵詞組合中包括在一次搜索中同時(shí)輸入的至少兩個(gè)關(guān)鍵詞;根據(jù)所述接收到的關(guān)鍵詞組合分拆關(guān)鍵詞對,其中,當(dāng)所述接收到的關(guān)鍵詞組合中包括兩個(gè)以上的關(guān)鍵詞時(shí),根據(jù)所述兩個(gè)以上的關(guān)鍵詞中兩兩不同的搭配方式將所述接收到的關(guān)鍵詞組合分拆為若干關(guān)鍵詞對,所述每個(gè)關(guān)鍵詞對中包含兩個(gè)關(guān)鍵詞;計(jì)算每個(gè)關(guān)鍵詞對的相似度和共現(xiàn)度,其中,所述每個(gè)關(guān)鍵詞對的相似度為每個(gè)關(guān)鍵詞對中兩個(gè)關(guān)鍵詞之間存在公共字的比例,所述每個(gè)關(guān)鍵詞對的共現(xiàn)度為在所述預(yù)設(shè)時(shí)間內(nèi)每個(gè)關(guān)鍵詞對出現(xiàn)的概率;根據(jù)所述每個(gè)關(guān)鍵詞對的相似度和共現(xiàn)度進(jìn)行正相關(guān)處理,獲得所述每個(gè)關(guān)鍵詞對中兩個(gè)關(guān)鍵詞之間的相關(guān)度;將所述每個(gè)關(guān)鍵詞對以及所述每個(gè)關(guān)鍵詞對中兩個(gè)關(guān)鍵詞之間的相關(guān)度保存在所述相關(guān)搜索詞庫中。
[0010]進(jìn)一步地,根據(jù)所述接收到的關(guān)鍵詞組合分拆關(guān)鍵詞對的操作,具體包括:根據(jù)所述接收到的關(guān)鍵詞組合分拆關(guān)鍵詞對,并統(tǒng)計(jì)每個(gè)關(guān)鍵詞對在所述預(yù)設(shè)時(shí)間內(nèi)的輸入次數(shù),保留所述輸入次數(shù)超過一預(yù)設(shè)門限的關(guān)鍵詞對,丟棄所述輸入次數(shù)未超過所述預(yù)設(shè)門限的關(guān)鍵詞對。
[0011]為了解決上述問題,本申請還揭示了一種提示相關(guān)搜索結(jié)果的服務(wù)器,包括:接收查詢模塊、提示模塊和相關(guān)搜索詞庫,其中,所述接收查詢模塊,用于接收輸入的關(guān)鍵詞,并根據(jù)所述輸入的關(guān)鍵詞查詢相關(guān)搜索詞庫,獲取與所述輸入的關(guān)鍵詞存在關(guān)聯(lián)關(guān)系的至少一個(gè)關(guān)鍵詞;所述提示模塊,用于根據(jù)與所述輸入的關(guān)鍵詞關(guān)聯(lián)的至少一個(gè)關(guān)鍵詞形成相關(guān)搜索結(jié)果,提示所述相關(guān)搜索結(jié)果;所述相關(guān)搜索詞庫,用于存儲(chǔ)預(yù)先收集的若干關(guān)鍵詞對,每個(gè)關(guān)鍵詞對中包含存在關(guān)聯(lián)關(guān)系的兩個(gè)關(guān)鍵詞,所述關(guān)聯(lián)關(guān)系由所述兩個(gè)關(guān)鍵詞之間的相關(guān)度構(gòu)成,所述兩個(gè)詞匯之間的相關(guān)度根據(jù)所述兩個(gè)詞匯在一次搜索中被同時(shí)輸入的概率進(jìn)行統(tǒng)計(jì)分析獲得。
[0012]進(jìn)一步地,所述接收查詢模塊,具體用于通過所述相關(guān)搜索詞庫查詢到與所述輸入的關(guān)鍵詞存在關(guān)聯(lián)關(guān)系的關(guān)鍵詞為多個(gè)關(guān)鍵詞時(shí),按照所述多個(gè)關(guān)鍵詞中的每個(gè)關(guān)鍵詞與所述輸入的關(guān)鍵詞的相關(guān)度從大到小的順序,獲取所述多個(gè)關(guān)鍵詞。
[0013]進(jìn)一步地,還包括:配置模塊,用于記錄在一段預(yù)設(shè)時(shí)間內(nèi)接收到的關(guān)鍵詞組合,每個(gè)關(guān)鍵詞組合中包括在一次搜索中同時(shí)輸入的至少兩個(gè)關(guān)鍵詞;根據(jù)所述接收到的關(guān)鍵詞組合分拆關(guān)鍵詞對,其中,當(dāng)所述接收到的關(guān)鍵詞組合中包括兩個(gè)以上的關(guān)鍵詞時(shí),根據(jù)所述兩個(gè)以上的關(guān)鍵詞中兩兩不同的搭配方式將所述接收到的關(guān)鍵詞組合分拆為若干關(guān)鍵詞對,所述每個(gè)關(guān)鍵詞對中包含兩個(gè)關(guān)鍵詞;計(jì)算每個(gè)關(guān)鍵詞對的相似度和共現(xiàn)度,其中,所述每個(gè)關(guān)鍵詞對的相似度為每個(gè)關(guān)鍵詞對中兩個(gè)關(guān)鍵詞之間出現(xiàn)公共字的概率,所述每個(gè)關(guān)鍵詞對的共現(xiàn)度為在所述預(yù)設(shè)時(shí)間內(nèi)每個(gè)關(guān)鍵詞對出現(xiàn)的概率;根據(jù)所述每個(gè)關(guān)鍵詞對的相似度和共現(xiàn)度進(jìn)行正相關(guān)處理,獲得所述每個(gè)關(guān)鍵詞對中兩個(gè)關(guān)鍵詞之間的相關(guān)度;將所述每個(gè)關(guān)鍵詞對以及所述每個(gè)關(guān)鍵詞對中兩個(gè)關(guān)鍵詞之間的相關(guān)度保存在所述相關(guān)搜索詞庫中。
[0014]進(jìn)一步地,所述配置模塊,具體用于根據(jù)所述接收到的關(guān)鍵詞組合分拆關(guān)鍵詞對,并統(tǒng)計(jì)每個(gè)關(guān)鍵詞對在所述預(yù)設(shè)時(shí)間內(nèi)的輸入次數(shù),保留所述輸入次數(shù)超過一預(yù)設(shè)門限的關(guān)鍵詞對,丟棄所述輸入次數(shù)未超過所述預(yù)設(shè)門限的關(guān)鍵詞對。
[0015]為了解決上述問題,本申請還揭示了一種提示相關(guān)搜索結(jié)果的系統(tǒng),其特征在于,包括:客戶端以及如前所述的提示相關(guān)搜索結(jié)果的服務(wù)器;所述客戶端,用于獲取輸入的關(guān)鍵詞并向所述服務(wù)器發(fā)送,以及用于接收所述服務(wù)器反饋的相關(guān)搜索結(jié)果并提示所述相關(guān)搜索結(jié)果。
[0016]與現(xiàn)有技術(shù)相比,本申請可以獲得包括以下技術(shù)效果:
[0017]I)通過在檢索系統(tǒng)的后臺(tái)服務(wù)器中設(shè)置相關(guān)搜索詞庫,并在相關(guān)搜索詞庫中存儲(chǔ)存在關(guān)聯(lián)關(guān)系的若干關(guān)鍵詞對,每個(gè)關(guān)鍵詞對包含兩個(gè)關(guān)鍵詞,關(guān)聯(lián)關(guān)系根據(jù)每個(gè)關(guān)鍵詞對中包含的兩個(gè)關(guān)鍵詞之間的相關(guān)度獲得,而各關(guān)鍵詞之間的相關(guān)度為根據(jù)用戶輸入行為進(jìn)行統(tǒng)計(jì)分析獲得,上述的相關(guān)度能夠準(zhǔn)確反映用戶在一段時(shí)間內(nèi)的興趣點(diǎn),即相關(guān)度較高的兩個(gè)關(guān)鍵詞同為用戶在該時(shí)間段內(nèi)感興趣的對象。具體的,對于用戶進(jìn)行視頻資源檢索而言,相關(guān)度較高的兩個(gè)關(guān)鍵詞能夠更加客觀地準(zhǔn)確地反映出用戶的興趣點(diǎn),即用戶除對當(dāng)前關(guān)鍵詞對應(yīng)的視頻資源外,還更想觀看哪些關(guān)鍵詞對應(yīng)的視頻資源,從而在進(jìn)行視頻資源檢索時(shí)提供更加精準(zhǔn)的相關(guān)搜索結(jié)果。
[0018]2)本申請進(jìn)一步的,在獲取各關(guān)鍵詞之間的相關(guān)度時(shí),是先計(jì)算用戶通過客戶端輸入的每個(gè)關(guān)鍵詞對中兩個(gè)關(guān)鍵詞之間的相似度,以及每個(gè)關(guān)鍵詞對中兩個(gè)關(guān)鍵詞的共現(xiàn)度,然后根據(jù)每個(gè)關(guān)鍵詞對的相似度和共現(xiàn)度進(jìn)行正相關(guān)處理,得到每個(gè)關(guān)鍵詞對的相關(guān)度。其中相似度主要考慮兩個(gè)關(guān)鍵詞之間含義的相似性,相似度高的兩個(gè)關(guān)鍵詞說明關(guān)鍵詞對應(yīng)的內(nèi)容也基本相同,用戶可能會(huì)同時(shí)對該兩個(gè)關(guān)鍵詞對應(yīng)的內(nèi)容感興趣,共現(xiàn)度主要考慮兩個(gè)關(guān)鍵詞被用戶同時(shí)檢索的概率。同時(shí)設(shè)置了權(quán)重值,可以均衡共現(xiàn)度和相似度對于相關(guān)性的影響,對于視頻資源搜索來說,共現(xiàn)度的重要性顯然很大,因此對于共現(xiàn)度應(yīng)該給予不低于相似度的權(quán)重值,這種方式不僅考慮了字面含義上相近相同和公共字包含關(guān)系,更重要的是將在字面含義上完全不同且不具備公共字包含關(guān)系的相關(guān)關(guān)鍵字也可以進(jìn)行提示,進(jìn)一步保證了進(jìn)行視頻資源檢索時(shí)提示相關(guān)搜索結(jié)果的精準(zhǔn)。
[0019]當(dāng)然,實(shí)施本申請的任一產(chǎn)品必不一定需要同時(shí)達(dá)到以上所述的所有技術(shù)效果。
【專利附圖】
【附圖說明】
[0020]此處所說明的附圖用來提供對本申請的進(jìn)一步理解,構(gòu)成本申請的一部分,本申請的示意性實(shí)施例及其說明用于解釋本申請,并不構(gòu)成對本申請的不當(dāng)限定。在附圖中:
[0021]圖1是本申請實(shí)施例的方法流程圖。
[0022]圖2是本申請實(shí)施例的構(gòu)建所述相關(guān)搜索詞庫的方法流程圖。[0023]圖3是本申請實(shí)施例的裝置結(jié)構(gòu)圖一。
[0024]圖4是本申請實(shí)施例的裝置結(jié)構(gòu)圖二。
[0025]圖5是本申請實(shí)施例的系統(tǒng)結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0026]以下將配合附圖及實(shí)施例來詳細(xì)說明本申請的實(shí)施方式,藉此對本申請如何應(yīng)用技術(shù)手段來解決技術(shù)問題并達(dá)成技術(shù)功效的實(shí)現(xiàn)過程能充分理解并據(jù)以實(shí)施。
[0027]本申請的豐要思想
[0028]本申請通過對用戶在預(yù)設(shè)時(shí)間段內(nèi)輸入的關(guān)鍵詞對進(jìn)行統(tǒng)計(jì)分析,獲取關(guān)鍵詞對的相關(guān)度,對于關(guān)鍵詞對的相關(guān)度可以先計(jì)算關(guān)鍵詞對之間的相似度以及共現(xiàn)度,再根據(jù)所述相似度和共現(xiàn)度進(jìn)行正相關(guān)處理得到關(guān)鍵詞對的相關(guān)度,并將各關(guān)鍵詞對以及每個(gè)關(guān)鍵詞對的相關(guān)度保存在所述相關(guān)搜索詞庫中。在用戶輸入關(guān)鍵詞進(jìn)行檢索時(shí),不僅輸出檢索結(jié)果,還從相關(guān)搜索詞庫中獲取至少一個(gè)存在關(guān)聯(lián)關(guān)系的關(guān)鍵詞作為相關(guān)搜索結(jié)果并提供給用戶。顯然,這種相關(guān)搜索結(jié)果不僅考慮了字面含義上相近相同和公共字包含關(guān)系,更重要的是將在字面含義上完全不同且不具備公共字包含關(guān)系的相關(guān)關(guān)鍵字也可以進(jìn)行提示。通過上述方式提供給用戶的相關(guān)關(guān)鍵詞,能夠更加與用戶的興趣點(diǎn)相匹配,提高用戶對相關(guān)關(guān)鍵詞提不的滿意度。
[0029]本串請的應(yīng)用場景
[0030]在用戶通過Web瀏覽器,或視頻播放器進(jìn)行視頻資源檢索時(shí),上述視頻資源可以包括電視劇、電影、綜藝類電視節(jié)目或體育類電視節(jié)目等,用戶可以在檢索框內(nèi)輸入關(guān)鍵詞進(jìn)行檢索,該關(guān)鍵詞可以是節(jié)目名稱,后臺(tái)服務(wù)器在接收到上述Web瀏覽器或視頻播放器發(fā)送過來的關(guān)鍵詞進(jìn)行視頻資源檢索時(shí),可以適用于本申請的方案,不僅提供有關(guān)上述節(jié)目名稱的檢索結(jié)果,而且提供與其相關(guān)的節(jié)目名稱。
[0031]當(dāng)然,本申請并不限于以上應(yīng)用場景,還存在其他適用的場景,在需要向用戶提供與關(guān)鍵詞關(guān)聯(lián)的相關(guān)關(guān)鍵詞時(shí),都可以利用本申請的技術(shù)方案以提聞相關(guān)關(guān)鍵詞與用戶興趣點(diǎn)的匹配度。
[0032]實(shí)施例描沭
[0033]下面以一實(shí)施例對本申請方法的實(shí)現(xiàn)作進(jìn)一步說明。如圖1所示,為本申請實(shí)施例的方法流程圖,包括:
[0034]步驟S100,接收通過客戶端輸入的關(guān)鍵詞,并根據(jù)所述輸入的關(guān)鍵詞查詢相關(guān)搜索詞庫,獲取與所述輸入的關(guān)鍵詞存在關(guān)聯(lián)關(guān)系的至少一個(gè)關(guān)鍵詞;所述相關(guān)搜索詞庫中存儲(chǔ)有預(yù)先收集的若干關(guān)鍵詞對,每個(gè)關(guān)鍵詞對中包含存在關(guān)聯(lián)關(guān)系的兩個(gè)關(guān)鍵詞,所述關(guān)聯(lián)關(guān)系由所述兩個(gè)關(guān)鍵詞之間的相關(guān)度構(gòu)成,所述兩個(gè)詞匯之間的相關(guān)度根據(jù)所述兩個(gè)詞匯在一次搜索中被同時(shí)輸入的概率進(jìn)行統(tǒng)計(jì)分析獲得。
[0035]本步驟中,客戶端可以為具有檢索框的Web瀏覽器或者是視頻播放器,具體的,用戶在進(jìn)行視頻資源檢索時(shí),可以是在上述的任一種客戶端的檢索框中輸入關(guān)鍵詞??蛻舳嗽讷@取到用戶輸入的關(guān)鍵詞后,會(huì)將關(guān)鍵詞發(fā)送給服務(wù)器。
[0036]服務(wù)器在接收到客戶端發(fā)送的關(guān)鍵詞后,會(huì)根據(jù)該關(guān)鍵詞進(jìn)行檢索,獲得相應(yīng)的檢索結(jié)果,并反饋給客戶端以向用戶展示。本申請的實(shí)施例中,后臺(tái)服務(wù)器除獲取相應(yīng)的檢索結(jié)果并向用戶展示外,還會(huì)在相關(guān)搜索詞庫中獲取與上述關(guān)鍵詞關(guān)聯(lián)的至少一個(gè)相關(guān)關(guān)鍵詞。
[0037]在形成相關(guān)搜索詞庫時(shí),需要對用戶在預(yù)設(shè)時(shí)間段內(nèi)輸入的關(guān)鍵詞對進(jìn)行統(tǒng)計(jì)分析,獲取關(guān)鍵詞對的相關(guān)度,對于關(guān)鍵詞對的相關(guān)度可以先計(jì)算關(guān)鍵詞對的相似度以及共現(xiàn)度,再根據(jù)所述相似度和共現(xiàn)度進(jìn)行正相關(guān)處理得到關(guān)鍵詞對的相關(guān)度,并將各關(guān)鍵詞對以及每個(gè)關(guān)鍵詞對的相關(guān)度保存在所述相關(guān)搜索詞庫中。
[0038]步驟S102,根據(jù)與所述輸入的關(guān)鍵詞關(guān)聯(lián)的至少一個(gè)關(guān)鍵詞形成相關(guān)搜索結(jié)果,通過所述客戶端提示所述相關(guān)搜索結(jié)果。
[0039]服務(wù)器在獲取與用戶輸入的關(guān)鍵詞存在關(guān)聯(lián)關(guān)系的至少一個(gè)關(guān)鍵詞后,會(huì)將該其發(fā)送給客戶端,該客戶端為接收用戶輸入的上述關(guān)鍵詞的客戶端,具體可以為具有檢索框的Web瀏覽器或視頻播放器??蛻舳嗽诮邮盏缴鲜鰞?nèi)容后,可以在關(guān)鍵詞的檢索結(jié)果頁面中展示與所述關(guān)鍵詞存在關(guān)聯(lián)關(guān)系的至少一個(gè)關(guān)鍵詞,以供用戶選擇存在關(guān)聯(lián)關(guān)系的至少一個(gè)關(guān)鍵詞進(jìn)行更廣泛的檢索。
[0040]顯然,這種相關(guān)搜索結(jié)果不僅考慮了字面含義上相近相同和公共字包含關(guān)系,更重要的是將在字面含義上完全不同且不具備公共字包含關(guān)系的相關(guān)關(guān)鍵字也可以進(jìn)行提示。通過上述方式提供給用戶的相關(guān)關(guān)鍵詞,能夠更加與用戶的興趣點(diǎn)相匹配,提高用戶對相關(guān)關(guān)鍵詞提不的滿意度。
[0041]本申請的技術(shù)方案中,在步驟SlOO之前,預(yù)先構(gòu)建了存儲(chǔ)各關(guān)鍵詞對以及每個(gè)關(guān)鍵詞對的相關(guān)度的相關(guān)搜索詞庫。在構(gòu)建該相關(guān)搜索詞庫的過程中,需要統(tǒng)計(jì)分析用戶輸入行為,并計(jì)算用戶輸入的關(guān)鍵詞之間的相關(guān)度。
[0042]如圖2所示,構(gòu)建所述相關(guān)搜索詞庫的過程,包括:
[0043]步驟S200,服務(wù)器記錄在一段預(yù)設(shè)時(shí)間內(nèi)接收到的關(guān)鍵詞組合,每個(gè)關(guān)鍵詞組合中包括在一次搜索中同時(shí)輸入的至少兩個(gè)關(guān)鍵詞;
[0044]例如在一次搜索中用戶同時(shí)輸入關(guān)鍵詞“中國好聲音”和“中國最強(qiáng)音”,“中國好聲音”和“中國最強(qiáng)音”就形成了一個(gè)關(guān)鍵詞組合;
[0045]再例如在一次搜索中用戶同時(shí)輸入關(guān)鍵詞“中國好聲音”、“快樂男聲”和“中國最強(qiáng)音”,“中國好聲音”、“快樂男聲”和“中國最強(qiáng)音”就形成了一個(gè)關(guān)鍵詞組合。
[0046]步驟S202,服務(wù)器根據(jù)所述接收到的關(guān)鍵詞組合分拆關(guān)鍵詞對,其中,當(dāng)所述接收到的關(guān)鍵詞組合中包括兩個(gè)以上的關(guān)鍵詞時(shí),根據(jù)所述兩個(gè)以上的關(guān)鍵詞中兩兩不同的搭配方式將所述接收到的關(guān)鍵詞組合分拆為若干關(guān)鍵詞對,所述每個(gè)關(guān)鍵詞對中包含兩個(gè)關(guān)鍵詞;
[0047]關(guān)鍵詞組合中包括在一次搜索中同時(shí)輸入的兩個(gè)關(guān)鍵詞時(shí),直接根據(jù)這個(gè)關(guān)鍵詞組合就可以形成一個(gè)關(guān)鍵詞對;
[0048]關(guān)鍵詞組合中包括在一次搜索中同時(shí)輸入的兩個(gè)以上關(guān)鍵詞時(shí),需要對所述關(guān)鍵詞組合中的兩個(gè)以上關(guān)鍵詞進(jìn)行兩兩拆分組合,從而形成若干關(guān)鍵詞對。例如“中國好聲音”、“快樂男聲”和“中國最強(qiáng)音”形成一個(gè)關(guān)鍵詞組合,而根據(jù)這個(gè)關(guān)鍵詞組合進(jìn)行拆分,就得到了三個(gè)關(guān)鍵詞對:“中國好聲音”和“中國最強(qiáng)音”、“快樂男聲”和“中國最強(qiáng)音”、“中國好聲音”和“快樂男聲”。
[0049]另外,在根據(jù)所述接收到的關(guān)鍵詞組合分拆關(guān)鍵詞對后,并不是所有的關(guān)鍵詞對都納入之后的步驟S204~步驟S208的處理最終保存在相關(guān)搜索詞庫中的。根據(jù)所述接收到的關(guān)鍵詞組合分拆關(guān)鍵詞對后,統(tǒng)計(jì)每個(gè)關(guān)鍵詞對在所述預(yù)設(shè)時(shí)間內(nèi)的輸入次數(shù),所述輸入次數(shù)超過一預(yù)設(shè)門限的關(guān)鍵詞對,顯然出現(xiàn)的概率很高,這些關(guān)鍵詞對會(huì)保留進(jìn)行步驟S204的處理,而所述輸入次數(shù)未超過所述預(yù)設(shè)門限的關(guān)鍵詞對,顯然出現(xiàn)的概率不高,這些關(guān)鍵詞對對于本申請的方案顯然意義不大,通常會(huì)丟棄;當(dāng)然,為了力求精準(zhǔn),也可以考慮不丟棄這部分關(guān)鍵詞對,對這些關(guān)鍵詞對也進(jìn)行步驟S204的處理,本申請并不限于此。
[0050]步驟S204,服務(wù)器計(jì)算每個(gè)關(guān)鍵詞對的相似度和共現(xiàn)度;
[0051]所述相似度為每個(gè)關(guān)鍵詞對中兩個(gè)關(guān)鍵詞之間所表示的字面含義是否近似,如果通過量化方式來評定,相似度可以解釋為兩個(gè)關(guān)鍵詞之間出現(xiàn)公共字的數(shù)量或者比例,在實(shí)際實(shí)現(xiàn)中可以通過兩個(gè)關(guān)鍵詞之間出現(xiàn)公共字的數(shù)量或者比例,并結(jié)合語義分析結(jié)果獲得相似度。例如對用戶輸入的關(guān)鍵詞“中國好聲音”和“中國最強(qiáng)音”進(jìn)行相似度分析,其中的公共字比例較高,且二者語義較為接近,則可認(rèn)為“中國好聲音”和“中國最強(qiáng)音”的相似度較高,通過計(jì)算得到“中國好聲音”和“中國最強(qiáng)音”之間的相似度; [0052]所述共現(xiàn)度為在所述預(yù)設(shè)時(shí)間內(nèi)每個(gè)關(guān)鍵詞對出現(xiàn)的概率,即每個(gè)關(guān)鍵詞對中的兩個(gè)關(guān)鍵詞在一次檢索中同時(shí)被用戶輸入的概率。例如某用戶在一個(gè)較短的時(shí)間間隔內(nèi),多次同時(shí)輸入“中國好聲音”和“中國最強(qiáng)音”,統(tǒng)計(jì)同時(shí)輸入兩者的次數(shù),根據(jù)同時(shí)輸入兩者的次數(shù)以及較短的時(shí)間間隔內(nèi)的各關(guān)鍵詞總輸入次數(shù)計(jì)算“中國好聲音”和“中國最強(qiáng)音”的共同出現(xiàn)概率,作為共現(xiàn)度值。假設(shè)服務(wù)器在時(shí)間間隔IOOs之內(nèi),統(tǒng)計(jì)到同時(shí)輸入“中國好聲音”和“快樂男聲”的次數(shù)為10萬次,則可以認(rèn)為上述兩個(gè)關(guān)鍵詞之間的共現(xiàn)度較高,并通過計(jì)算得到“中國好聲音”和“中國最強(qiáng)音”之間的共現(xiàn)度。
[0053]步驟S206,服務(wù)器根據(jù)所述每個(gè)關(guān)鍵詞對的相似度和共現(xiàn)度進(jìn)行正相關(guān)處理,獲得所述每個(gè)關(guān)鍵詞對中兩個(gè)關(guān)鍵詞之間的相關(guān)度;
[0054]正相關(guān)處理可以包括加權(quán)的方式,例如,某個(gè)關(guān)鍵詞對,其相似度為A,并設(shè)權(quán)重值為m,共現(xiàn)度為B,并設(shè)權(quán)重值為n,則通過正相關(guān)處理可以計(jì)算得到相關(guān)度X = mXA +nXB。權(quán)重值的設(shè)置為了均衡共現(xiàn)度和相似度對于相關(guān)性的影響,對于視頻資源搜索來說,共現(xiàn)度的重要性顯然很大,因此對于共現(xiàn)度應(yīng)該給予不低于相似度的權(quán)重值,即η > m。
[0055]步驟S208,服務(wù)器將所述每個(gè)關(guān)鍵詞對以及所述每個(gè)關(guān)鍵詞對中兩個(gè)關(guān)鍵詞之間的相關(guān)度保存在所述相關(guān)搜索詞庫中。
[0056]以下通過一個(gè)具體實(shí)施例,對如何根據(jù)用戶輸入行為統(tǒng)計(jì)分析獲得各關(guān)鍵詞之間的相關(guān)度進(jìn)行說明。
[0057]本實(shí)施例是通過離線方式進(jìn)行統(tǒng)計(jì)。具體的,在用戶每一次通過本地Web瀏覽器打開影視類網(wǎng)站,則本地Web瀏覽器會(huì)向影視類網(wǎng)站的后臺(tái)服務(wù)器發(fā)起了一次會(huì)話(session),一次會(huì)話表示用戶通過輸入關(guān)鍵詞向服務(wù)器發(fā)出了一次搜索,會(huì)話中承載的關(guān)鍵詞可以稱為query,一次會(huì)話中可以放入很多個(gè)query,即一次會(huì)話中可以輸入多個(gè)關(guān)鍵詞。而影視類網(wǎng)站的后臺(tái)服務(wù)器會(huì)對這些會(huì)話和會(huì)話中承載的query進(jìn)行記錄,從而形成日志數(shù)據(jù)供離線查看。
[0058]日志數(shù)據(jù)的具體結(jié)構(gòu)可以是如下形式:
[0059]Sessionl (queryl、query2、query3…)[0060]Session2 (query2、query4、query5…)
[0061]Session3 (queryl、query2、query3…)
[0062]Session4 (query I > query6 > query 5...)
[0063]其中,queryN (N= 1、2、3、4、5……)代表輸入的一段文字?jǐn)?shù)據(jù),可以是文字、字符或拼音等,SessionM (M = 1、2、3、4......)表示第M段會(huì)話。
[0064]進(jìn)一步的,可以根據(jù)上述獲得的日志數(shù)據(jù),計(jì)算各關(guān)鍵詞之間的相關(guān)度,并獲得與各關(guān)鍵詞關(guān)聯(lián)的至少一個(gè)相關(guān)關(guān)鍵詞。通過讀取一段時(shí)間內(nèi)的日志數(shù)據(jù),每個(gè)日志數(shù)據(jù)中的會(huì)話中都會(huì)包含幾個(gè)query,在一個(gè)會(huì)話中里出現(xiàn)的幾個(gè)query可以看作一條有效記錄,
這樣 Sessionl 里的 queryl、query2、query3......是一次有效記錄,Session2 里的 query2、
query4>query5......是一次有效記錄,Session3 里的 queryl、query2、query3......是一次有
效記錄,Session4里的queryl、query6、query5......同樣也是一次有效記錄。
[0065]在上述所有的有效記錄中,為統(tǒng)計(jì)各關(guān)鍵詞之間的相關(guān)度,需要首先統(tǒng)計(jì)獲得所有成對的query。在該統(tǒng)計(jì)成對的query過程中,為了避免成對的query太多,可以要求每對query伴隨出現(xiàn)的次數(shù)大于一個(gè)門限,即要求用戶在檢索過程中同時(shí)輸入上述每對中的兩個(gè)query的次數(shù)大于該門限,該門限例如可以設(shè)為5000次,或者其他數(shù)值。本實(shí)施例中,最終統(tǒng)計(jì)出 15 對 query,分別是(queryl, query2), (queryl, query3), (queryl, query4),(queryI, query5) , (queryI, query6) , (query2, query6) , (query3, query4),
(query2, query7), (queryl, query7)......。上述設(shè)置門限的方式,主要是為了使得獲取的成
對的query均為用戶經(jīng)常同時(shí)輸入的關(guān)鍵詞,以降低后續(xù)的計(jì)算量,該具體的實(shí)現(xiàn)過程中,也可以不設(shè)置上述門限。
[0066]在獲得了上述成對的query后,可以計(jì)算每對query中兩個(gè)query之間的相關(guān)度。本實(shí)施例中,首先計(jì)算兩個(gè)query之間的相似度和共現(xiàn)度,然后對相似度和共現(xiàn)度進(jìn)行正相關(guān)處理,得到兩個(gè)query之間的相關(guān)度。其中的相似度是指兩個(gè)關(guān)鍵詞所表示的含義是否近似,可以根據(jù)二者的公共字?jǐn)?shù)量,或者語義分析的結(jié)果獲得其相似度值,而共現(xiàn)度則是指兩個(gè)關(guān)鍵詞同時(shí)被用戶檢索的概率,可以參考一個(gè)用戶在一個(gè)較小的時(shí)間間隔內(nèi),依次輸入這兩個(gè)關(guān)鍵詞的次數(shù)等因素計(jì)算其共現(xiàn)度值。本申請實(shí)施例中,共現(xiàn)度主要是反映了用戶輸入行為,共現(xiàn)度值大表示用戶同時(shí)檢索該兩個(gè)query的概率大,該兩個(gè)query屬于用戶的同一個(gè)興趣點(diǎn),本實(shí)施例在計(jì)算相關(guān)度大小時(shí),可以考慮賦予共現(xiàn)度更高的權(quán)重值。另外,相似度主要是考慮二者的含義方面考慮,若兩個(gè)query的含義更為接近,則對應(yīng)的內(nèi)容也基本一致,同樣極有可能二者屬于用戶的同一個(gè)興趣點(diǎn),因此,將相似度也作為相關(guān)度的參考因素。
[0067]對于每一個(gè)成對query,分別按照上述方式計(jì)算兩個(gè)query之間的相關(guān)度,這樣就可以計(jì)算出上述15對query的相關(guān)度,將上述15對query及每對query的相關(guān)度保存在相關(guān)搜索詞庫中,該相關(guān)搜索詞庫的類型可以是非關(guān)系型的數(shù)據(jù)庫,如nosql數(shù)據(jù)庫。
[0068]上述方案是在離線狀態(tài)下,對用戶輸入行為的日志數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,從而得到包括各關(guān)鍵詞,以及其與對應(yīng)的相關(guān)關(guān)鍵詞的關(guān)聯(lián)關(guān)系的相關(guān)搜索詞庫。 [0069]在建立了上述相關(guān)搜索詞庫的基礎(chǔ)上,用戶通過本地Web瀏覽器打開影視類網(wǎng)站,在檢索框輸入了一段關(guān)鍵詞并點(diǎn)擊檢索,如該關(guān)鍵詞為queryl,則本地Web瀏覽器向影視類網(wǎng)站的后臺(tái)服務(wù)器發(fā)起了一次會(huì)話(session),會(huì)話中承載的關(guān)鍵詞是queryl。[0070]而影視類網(wǎng)站的后臺(tái)服務(wù)器實(shí)時(shí)根據(jù)queryl進(jìn)行常規(guī)檢索,檢索到含有queryl的11對query,從而11對query中獲得了與queryl存在關(guān)聯(lián)關(guān)系的11個(gè)query以及11對query的相關(guān)度。并根據(jù)相關(guān)度由大到小的順序?qū)?1個(gè)query中的前10個(gè)query作為檢索結(jié)果反饋給本地Web瀏覽器。例如,11個(gè)query的相關(guān)度由高到低排列的順序?yàn)?query2,query4, query3, query6, query5, query7, query8, query9, querylO, queryl I, queryl2,將排名在前 10 名的 query:query2, query4, query3, query6, query5, query7, query8, query9,querylO,作為queryl的相關(guān)關(guān)鍵詞存儲(chǔ)到相關(guān)搜索詞庫中。
[0071]需要說明的是,本申請上述實(shí)施例中,都是以相關(guān)度排名前10作為選擇相關(guān)關(guān)鍵詞,以及向用戶反饋和展示相關(guān)關(guān)鍵詞的標(biāo)準(zhǔn)。但在具體實(shí)現(xiàn)本申請的過程中,本領(lǐng)域內(nèi)技術(shù)人員可以根據(jù)實(shí)際情況選擇,例如根據(jù)本地Web瀏覽器中檢索結(jié)果頁面能夠提供給相關(guān)關(guān)鍵詞的位置大小確定要展示的相關(guān)關(guān)鍵詞的具體數(shù)目。
[0072]以下為本申請的一個(gè)具體實(shí)施例。在近一個(gè)星期內(nèi),統(tǒng)計(jì)發(fā)現(xiàn)很多用戶通過本地Web瀏覽器打開影視類網(wǎng)站,在影視類網(wǎng)站的檢索框中,成對地輸入過“爸爸去哪兒”、“中國好聲音”、“花兒朵朵”、“快樂男聲”、“超級女聲”、“中國夢之聲”、“中國最強(qiáng)音”、“中國紅歌會(huì)”、“最美和聲”、“一聲所愛”、“天籟之聲”等影視類節(jié)目,影視類網(wǎng)站的后臺(tái)服務(wù)器會(huì)對每次會(huì)話,以及會(huì)話中包含的關(guān)鍵詞進(jìn)行記錄,從而形成日志數(shù)據(jù)可以供離線查看。
[0073]后臺(tái)服務(wù)器統(tǒng)計(jì)近一個(gè)星期內(nèi)的日志數(shù)據(jù),讀取日志數(shù)據(jù)中的有效記錄,并統(tǒng)計(jì)出所有成對的關(guān)鍵詞。例如,對于一個(gè)會(huì)話中出現(xiàn)的三個(gè)關(guān)鍵詞“中國好聲音”、“花兒朵朵”和“快樂男聲”,可以統(tǒng)計(jì)得到三個(gè)關(guān)鍵詞對,分別是“中國好聲音”和“花兒朵朵”,“中國好聲音”和“快樂男聲”,“花兒朵朵”和“快樂男聲”,對于其他會(huì)話中出現(xiàn)的更多關(guān)鍵詞,可以同樣處理。
[0074]例如,最后統(tǒng)計(jì)出的關(guān)鍵詞對如下:
[0075]I) “中國好聲音” “花兒朵朵”;2) “中國好聲音” “快樂男聲”;
[0076]3) “中國好聲音” “超級女聲”;4) “中國好聲音” “中國夢之聲”;
[0077]5) “中國好聲音” “中國最強(qiáng)音”;6) “中國好聲音” “中國紅歌會(huì)”;
[0078]7) “中國好聲音” “最美和聲” ;8) “中國好聲音” “一聲所愛”;
[0079]9) “中國好聲音”“天籟之聲”;10) “花兒朵朵”“快樂男聲”。
[0080]分別計(jì)算上述每個(gè)關(guān)鍵詞對內(nèi)兩個(gè)關(guān)鍵詞之間的相關(guān)度,并將上述每個(gè)關(guān)鍵詞對以及每個(gè)關(guān)鍵詞對中兩個(gè)關(guān)鍵詞之間的相關(guān)度保存在數(shù)據(jù)庫中。其中,相關(guān)度由高到低的順序?yàn)?“中國好聲音” “快樂男聲”,“中國好聲音” “中國夢之聲”,“中國好聲音” “中國最強(qiáng)音”,“中國好聲音” “最美和聲”,“中國好聲音” “花兒朵朵”,“中國好聲音” “超級女聲”,“中國好聲音” “中國紅歌會(huì)”,“中國好聲音” “一聲所愛”,“中國好聲音” “天籟之聲”。
[0081]當(dāng)用戶通過本地Web瀏覽器打開影視類網(wǎng)站,在影視類網(wǎng)站的檢索框再輸入“中國好聲音”時(shí),后臺(tái)服務(wù)器根據(jù)“中國好聲音”在非關(guān)系型數(shù)據(jù)庫中遍歷,命中后到與“中國好聲音”存在關(guān)聯(lián)關(guān)系的9個(gè)關(guān)鍵詞,按相關(guān)度由高到低的順序給出“快樂男聲”、“中國夢之聲”、“中國最強(qiáng)音”、“最美和聲”、“花兒朵朵”、“超級女聲”、“中國紅歌會(huì)”、“一聲所愛”和“天籟之聲”,后臺(tái)服務(wù)器將上述相關(guān)關(guān)鍵詞發(fā)送給本地Web瀏覽器,并在檢索結(jié)果頁面中向用戶展示上述相關(guān)關(guān)鍵詞。
[0082]如圖3所示,是本申請實(shí)施例的裝置結(jié)構(gòu)圖一。提示相關(guān)搜索結(jié)果的服務(wù)器,包括:接收查詢模塊30、提示模塊31和相關(guān)搜索詞庫32,其中,
[0083]所述接收查詢模塊30,分別與提示模塊31和相關(guān)搜索詞庫32耦接,用于接收輸入的關(guān)鍵詞,并根據(jù)所述輸入的關(guān)鍵詞查詢相關(guān)搜索詞庫32,獲取與所述輸入的關(guān)鍵詞存在關(guān)聯(lián)關(guān)系的至少一個(gè)關(guān)鍵詞;
[0084]所述提示模塊31,與接收查詢模塊30耦接,用于根據(jù)與所述輸入的關(guān)鍵詞關(guān)聯(lián)的至少一個(gè)關(guān)鍵詞形成相關(guān)搜索結(jié)果,提示所述相關(guān)搜索結(jié)果;
[0085]所述相關(guān)搜索詞庫32,與接收查詢模塊30耦接,用于存儲(chǔ)預(yù)先收集的若干關(guān)鍵詞對,每個(gè)關(guān)鍵詞對中包含存在關(guān)聯(lián)關(guān)系的兩個(gè)關(guān)鍵詞,所述關(guān)聯(lián)關(guān)系由所述兩個(gè)關(guān)鍵詞之間的相關(guān)度構(gòu)成,所述兩個(gè)詞匯之間的相關(guān)度根據(jù)所述兩個(gè)詞匯在一次搜索中被同時(shí)輸入的概率進(jìn)行統(tǒng)計(jì)分析獲得。
[0086]所述接收查詢模塊30,具體用于通過所述相關(guān)搜索詞庫查詢到與所述輸入的關(guān)鍵詞存在關(guān)聯(lián)關(guān)系的關(guān)鍵詞為多個(gè)關(guān)鍵詞時(shí),按照所述多個(gè)關(guān)鍵詞中的每個(gè)關(guān)鍵詞與所述輸入的關(guān)鍵詞的相關(guān)度從大到小的順序,獲取所述多個(gè)關(guān)鍵詞。
[0087]如圖4所示,為本申請實(shí)施例的裝置結(jié)構(gòu)圖二。提示相關(guān)搜索結(jié)果的服務(wù)器包括與圖3中所示的結(jié)構(gòu)功能相同的接收查詢模塊30、提示模塊31和相關(guān)搜索詞庫32之外,還包括:配置模塊33。
[0088]配置模塊33,與相關(guān)搜索詞庫32耦接,用于記錄在一段預(yù)設(shè)時(shí)間內(nèi)接收到的關(guān)鍵詞組合,每個(gè)關(guān)鍵詞組合中包括在一次搜索中同時(shí)輸入的至少兩個(gè)關(guān)鍵詞;根據(jù)所述接收到的關(guān)鍵詞組合分拆關(guān)鍵詞對,其中,當(dāng)所述接收到的關(guān)鍵詞組合中包括兩個(gè)以上的關(guān)鍵詞時(shí),根據(jù)所述兩個(gè)以上的關(guān)鍵詞中兩兩不同的搭配方式將所述接收到的關(guān)鍵詞組合分拆為若干關(guān)鍵詞對,所述每個(gè)關(guān)鍵詞對中包含兩個(gè)關(guān)鍵詞;計(jì)算每個(gè)關(guān)鍵詞對的相似度和共現(xiàn)度,其中,所述相似度為每個(gè)關(guān)鍵詞對中兩個(gè)關(guān)鍵詞之間出現(xiàn)公共字的概率,所述共現(xiàn)度為在所述預(yù)設(shè)時(shí)間內(nèi)每個(gè)關(guān)鍵詞對出現(xiàn)的概率;根據(jù)所述每個(gè)關(guān)鍵詞對的相似度和共現(xiàn)度進(jìn)行正相關(guān)處理,獲得所述每個(gè)關(guān)鍵詞對中兩個(gè)關(guān)鍵詞之間的相關(guān)度;將所述每個(gè)關(guān)鍵詞對以及所述每個(gè)關(guān)鍵詞對中兩個(gè)關(guān)鍵詞之間的相關(guān)度保存在所述相關(guān)搜索詞庫32中。
[0089]配置模塊33,具體用于根據(jù)所述接收到的關(guān)鍵詞組合分拆關(guān)鍵詞對,并統(tǒng)計(jì)每個(gè)關(guān)鍵詞對在所述預(yù)設(shè)時(shí)間內(nèi)的輸入次數(shù),保留所述輸入次數(shù)超過一預(yù)設(shè)門限的關(guān)鍵詞對,丟棄所述輸入次數(shù)未超過所述預(yù)設(shè)門限的關(guān)鍵詞對。
[0090]所述服務(wù)器與前述的方法流程描述對應(yīng),不足之處參考上述方法流程的敘述,不再 贅述。
[0091]本申請的實(shí)施例還提供了一種提示相關(guān)搜索結(jié)果的系統(tǒng),如圖5所示,包括:客戶端I以及如圖3或4所示出的提示相關(guān)搜索結(jié)果的服務(wù)器2 ;
[0092]所述客戶端1,用于獲取輸入的關(guān)鍵詞并向所述服務(wù)器2發(fā)送,以及用于接收所述服務(wù)器2反饋的相關(guān)搜索結(jié)果并提示所述相關(guān)搜索結(jié)果。
[0093]所述系統(tǒng)中的服務(wù)器與前述的服務(wù)器實(shí)施例的描述對應(yīng),不足之處參考上述服務(wù)器實(shí)施例的敘述,不再一一贅述。
[0094]上述說明示出并描述了本申請的若干優(yōu)選實(shí)施例,但如前所述,應(yīng)當(dāng)理解本申請并非局限于本文所披露的形式,不應(yīng)看作是對其他實(shí)施例的排除,而可用于各種其他組合、修改和環(huán)境,并能夠在本文所述發(fā)明構(gòu)想范圍內(nèi),通過上述教導(dǎo)或相關(guān)領(lǐng)域的技術(shù)或知識(shí)進(jìn)行改動(dòng)。而本領(lǐng)域人員所進(jìn)行的改動(dòng)和變化不脫離本申請的精神和范圍,則都應(yīng)在本申請所附權(quán)利要求的保護(hù)范圍內(nèi)。
【權(quán)利要求】
1.一種相關(guān)搜索結(jié)果的提示方法,其特征在于,包括: 接收輸入的關(guān)鍵詞,并根據(jù)所述輸入的關(guān)鍵詞查詢相關(guān)搜索詞庫,獲取與所述輸入的關(guān)鍵詞存在關(guān)聯(lián)關(guān)系的至少一個(gè)關(guān)鍵詞; 根據(jù)與所述輸入的關(guān)鍵詞關(guān)聯(lián)的至少一個(gè)關(guān)鍵詞形成相關(guān)搜索結(jié)果,提示所述相關(guān)搜索結(jié)果; 上述步驟中,所述相關(guān)搜索詞庫中存儲(chǔ)有預(yù)先收集的若干關(guān)鍵詞對,每個(gè)關(guān)鍵詞對中包含存在關(guān)聯(lián)關(guān)系的兩個(gè)關(guān)鍵詞,所述關(guān)聯(lián)關(guān)系由所述兩個(gè)關(guān)鍵詞之間的相關(guān)度構(gòu)成,所述兩個(gè)詞匯之間的相關(guān)度根據(jù)所述兩個(gè)詞匯在一次搜索中被同時(shí)輸入的概率進(jìn)行統(tǒng)計(jì)分析獲得。
2.如權(quán)利要求1所述的提示方法,其特征在于,獲取與所述輸入的關(guān)鍵詞存在關(guān)聯(lián)關(guān)系的至少一個(gè)關(guān)鍵詞的操作,具體包括: 通過所述相關(guān)搜索詞庫查詢到與所述輸入的關(guān)鍵詞存在關(guān)聯(lián)關(guān)系的關(guān)鍵詞為多個(gè)關(guān)鍵詞時(shí),按照所述多個(gè)關(guān)鍵詞中的每個(gè)關(guān)鍵詞與所述輸入的關(guān)鍵詞的相關(guān)度從大到小的順序,獲取所述多個(gè)關(guān)鍵詞。
3.如權(quán)利要求1所述的提示方法,其特征在于,接收輸入的關(guān)鍵詞,并根據(jù)所述輸入的關(guān)鍵詞查詢相關(guān)搜索詞庫的操作之前,包括: 記錄在一段預(yù)設(shè)時(shí)間內(nèi)接收到的關(guān)鍵詞組合,每個(gè)關(guān)鍵詞組合中包括在一次搜索中同時(shí)輸入的至少兩個(gè)關(guān)鍵詞; 根據(jù)所述接收到的關(guān)鍵詞組合分拆關(guān)鍵詞對,其中,當(dāng)所述接收到的關(guān)鍵詞組合中包括兩個(gè)以上的關(guān)鍵詞時(shí),根據(jù)所述兩個(gè)以上的關(guān)鍵詞中兩兩不同的搭配方式將所述接收到的關(guān)鍵詞組合分拆為若干關(guān)鍵詞對,所述每個(gè)關(guān)鍵詞對中包含兩個(gè)關(guān)鍵詞; 計(jì)算每個(gè)關(guān)鍵詞對的相似度和共現(xiàn)度,其中,所述每個(gè)關(guān)鍵詞對的相似度為每個(gè)關(guān)鍵詞對中兩個(gè)關(guān)鍵詞之間存在公共字的比例,所述每個(gè)關(guān)鍵詞對的共現(xiàn)度為在所述預(yù)設(shè)時(shí)間內(nèi)每個(gè)關(guān)鍵詞對出現(xiàn)的概率; 根據(jù)所述每個(gè)關(guān)鍵詞對的相似度和共現(xiàn)度進(jìn)行正相關(guān)處理,獲得所述每個(gè)關(guān)鍵詞對中兩個(gè)關(guān)鍵詞之間的相關(guān)度; 將所述每個(gè)關(guān)鍵詞對以及所述每個(gè)關(guān)鍵詞對中兩個(gè)關(guān)鍵詞之間的相關(guān)度保存在所述相關(guān)搜索詞庫中。
4.如權(quán)利要求3所述的提示方法,其特征在于,根據(jù)所述接收到的關(guān)鍵詞組合分拆關(guān)鍵詞對的操作,具體包括: 根據(jù)所述接收到的關(guān)鍵詞組合分拆關(guān)鍵詞對,并統(tǒng)計(jì)每個(gè)關(guān)鍵詞對在所述預(yù)設(shè)時(shí)間內(nèi)的輸入次數(shù),保留所述輸入次數(shù)超過一預(yù)設(shè)門限的關(guān)鍵詞對,丟棄所述輸入次數(shù)未超過所述預(yù)設(shè)門限的關(guān)鍵詞對。
5.一種提示相關(guān)搜索結(jié)果的服務(wù)器,其特征在于,包括:接收查詢模塊、提示模塊和相關(guān)搜索詞庫,其中 所述接收查詢模塊,用于接收輸入的關(guān)鍵詞,并根據(jù)所述輸入的關(guān)鍵詞查詢相關(guān)搜索詞庫,獲取與所述輸入的關(guān)鍵詞存在關(guān)聯(lián)關(guān)系的至少一個(gè)關(guān)鍵詞; 所述提示模塊,用于根據(jù)與所述輸入的關(guān)鍵詞關(guān)聯(lián)的至少一個(gè)關(guān)鍵詞形成相關(guān)搜索結(jié)果,提示所述相關(guān)搜索結(jié)果;所述相關(guān)搜索詞庫,用于存儲(chǔ)預(yù)先收集的若干關(guān)鍵詞對,每個(gè)關(guān)鍵詞對中包含存在關(guān)聯(lián)關(guān)系的兩個(gè)關(guān)鍵詞,所述關(guān)聯(lián)關(guān)系由所述兩個(gè)關(guān)鍵詞之間的相關(guān)度構(gòu)成,所述兩個(gè)詞匯之間的相關(guān)度根據(jù)所述兩個(gè)詞匯在一次搜索中被同時(shí)輸入的概率進(jìn)行統(tǒng)計(jì)分析獲得。
6.如權(quán)利要求5所述的服務(wù)器,其特征在于, 所述接收查詢模塊,具體用于通過所述相關(guān)搜索詞庫查詢到與所述輸入的關(guān)鍵詞存在關(guān)聯(lián)關(guān)系的關(guān)鍵詞為多個(gè)關(guān)鍵詞時(shí),按照所述多個(gè)關(guān)鍵詞中的每個(gè)關(guān)鍵詞與所述輸入的關(guān)鍵詞的相關(guān)度從大到小的順序,獲取所述多個(gè)關(guān)鍵詞。
7.如權(quán)利要求5所述的服務(wù)器,其特征在于,還包括: 配置模塊,用于記錄在一段預(yù)設(shè)時(shí)間內(nèi)接收到的關(guān)鍵詞組合,每個(gè)關(guān)鍵詞組合中包括在一次搜索中同時(shí)輸入的至少兩個(gè)關(guān)鍵詞;根據(jù)所述接收到的關(guān)鍵詞組合分拆關(guān)鍵詞對,其中,當(dāng)所述接收到的關(guān)鍵詞組合中包括兩個(gè)以上的關(guān)鍵詞時(shí),根據(jù)所述兩個(gè)以上的關(guān)鍵詞中兩兩不同的搭配方式將所述接收到的關(guān)鍵詞組合分拆為若干關(guān)鍵詞對,所述每個(gè)關(guān)鍵詞對中包含兩個(gè)關(guān)鍵詞;計(jì)算每個(gè)關(guān)鍵詞對的相似度和共現(xiàn)度,其中,所述每個(gè)關(guān)鍵詞對的相似度為每個(gè)關(guān)鍵詞對中兩個(gè)關(guān)鍵詞之間出現(xiàn)公共字的概率,所述每個(gè)關(guān)鍵詞對的共現(xiàn)度為在所述預(yù)設(shè)時(shí)間內(nèi)每個(gè)關(guān)鍵詞對出現(xiàn)的概率;根據(jù)所述每個(gè)關(guān)鍵詞對的相似度和共現(xiàn)度進(jìn)行正相關(guān)處理,獲得所述每個(gè)關(guān)鍵詞對中兩個(gè)關(guān)鍵詞之間的相關(guān)度;將所述每個(gè)關(guān)鍵詞對以及所述每個(gè)關(guān)鍵詞對中兩個(gè)關(guān)鍵詞之間的相關(guān)度保存在所述相關(guān)搜索詞庫中。
8.如權(quán)利要求7所述的服務(wù)器,其特征在于, 所述配置模塊,具體用于根據(jù)所述接收到的關(guān)鍵詞組合分拆關(guān)鍵詞對,并統(tǒng)計(jì)每個(gè)關(guān)鍵詞對在所述預(yù)設(shè)時(shí)間內(nèi)的輸入次數(shù),保留所述輸入次數(shù)超過一預(yù)設(shè)門限的關(guān)鍵詞對,丟棄所述輸入次數(shù)未超過所述預(yù)設(shè)門限的關(guān)鍵詞對。
9.一種提示相關(guān)搜索結(jié)果的系統(tǒng),其特征在于,包括:客戶端以及如權(quán)利要求5至8中任一所述的提示相關(guān)搜索結(jié)果的服務(wù)器;` 所述客戶端,用于獲取輸入的關(guān)鍵詞并向所述服務(wù)器發(fā)送,以及用于接收所述服務(wù)器反饋的相關(guān)搜索結(jié)果并提示所述相關(guān)搜索結(jié)果。
【文檔編號】G06F17/30GK103678668SQ201310723926
【公開日】2014年3月26日 申請日期:2013年12月24日 優(yōu)先權(quán)日:2013年12月24日
【發(fā)明者】關(guān)濤 申請人:樂視網(wǎng)信息技術(shù)(北京)股份有限公司