本發(fā)明涉及信息檢索領(lǐng)域,特別地,涉及一種基于數(shù)據(jù)挖掘技術(shù)的用戶搜索詞的關(guān)聯(lián)關(guān)鍵詞組合推薦的方法。
背景技術(shù):
隨著大數(shù)據(jù),云計(jì)算,物聯(lián)網(wǎng)技術(shù)的發(fā)展,人們的生活和工作已經(jīng)離不開依靠信息的決策。目前的信息檢索系統(tǒng)大多基于關(guān)鍵詞的檢索,其原理是用戶向系統(tǒng)輸入搜索詞,系統(tǒng)根據(jù)用戶搜索詞查找系統(tǒng)內(nèi)部的關(guān)鍵詞索引,如果有關(guān)鍵詞索引與搜索詞有匹配,系統(tǒng)會給出關(guān)鍵詞所代表的檢索結(jié)果。這種檢索方法簡單,但檢索系統(tǒng)對用戶來講是不透明的,因此這種檢索原理是一種猜想式的檢索方法。因此,用戶首先給出一個概念很大的搜索詞試探檢索,這樣系統(tǒng)會給出數(shù)量巨大的檢索結(jié)果,需要用戶多次操作以便縮小檢索范圍。為了提高海量數(shù)據(jù)檢索的精度,大多數(shù)檢索系統(tǒng)增加了高級檢索功能,即設(shè)置了多個檢索詞由邏輯條件(與,或,非)限定的檢索方法。高級檢索方法的增加起到了一定的作用,使得檢索精度有所提高,檢索的數(shù)量有所縮小。但沒有改變用戶與檢索系統(tǒng)不透明的本質(zhì),由于不透明,若用戶利用多個關(guān)鍵詞邏輯(與,或,非)條件將關(guān)鍵詞加入限定,如果用了一個與檢索系統(tǒng)不同的搜索詞,將會導(dǎo)致檢索結(jié)果為0的悲劇,其實(shí)系統(tǒng)里有與用戶搜索詞同義的關(guān)鍵詞的組合,只是用戶事先難以知道罷了。這種用戶事先難以了解信息檢索系統(tǒng)中他所需要的信息的關(guān)聯(lián)信息,因此也就難以給出一個理想的關(guān)鍵詞從而找到滿意的文獻(xiàn)信息。尤其是,學(xué)術(shù)性檢索系統(tǒng)比社會網(wǎng)絡(luò)檢索系統(tǒng)要求檢索的精度要高,跨領(lǐng)域的海量數(shù)據(jù)學(xué)術(shù)檢索系統(tǒng),常常給用戶搜索詞的選擇上帶來了時間上,和精神上的極大壓力。信息數(shù)量急速的增長給人們信息獲取帶來困難,也影響著人們創(chuàng)新速度的發(fā)展。因此,用戶急需要一種系統(tǒng)能推薦關(guān)鍵詞讓用戶選擇的檢索方法。
目前搜索引擎大多通過搜索用戶日志的方法進(jìn)行熱點(diǎn)或趨勢推薦,這種方法有一定的參考價值,但有其局限性,因?yàn)?,用戶的訪問行為不具有反映信息檢索系統(tǒng)信息關(guān)聯(lián)組合的全面性,因而其推薦會失去全面性功能。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明解決的技術(shù)問題在于提供了一種為用戶推薦關(guān)聯(lián)關(guān)鍵詞的信息檢索方法,以解決現(xiàn)有技術(shù)中存在的檢索詞推薦范圍不全面,推薦深度低的問題。
為解決上述問題,本發(fā)明提供了一種為用戶推薦關(guān)聯(lián)關(guān)鍵詞的信息檢索方法,包括,
獲取用戶搜索詞;
在獲取用戶搜索詞后,分析搜索詞;
判斷搜索詞與信息檢索系統(tǒng)的關(guān)鍵詞是否匹配;
建立基于匹配關(guān)鍵詞的關(guān)聯(lián)關(guān)鍵詞推薦域;
推薦域由與匹配關(guān)鍵詞組成,包括共現(xiàn)的文摘號和所包括的關(guān)鍵詞;
計(jì)算推薦域中關(guān)鍵詞的支持度和置信度構(gòu)成的關(guān)聯(lián)度;
按照關(guān)聯(lián)度的高低排序顯示給用戶;
用戶選擇了所需的關(guān)聯(lián)度后自動進(jìn)入信息檢索系統(tǒng)檢索。
附圖說明
此處所說明的附圖用來提供對本發(fā)明的進(jìn)一步理解,構(gòu)成本發(fā)明的一部分,本發(fā)明的示意性實(shí)施及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:
圖1是本發(fā)明第一實(shí)施流程圖;
具體實(shí)施方式
本發(fā)明由6個模塊(1-6),10個處理關(guān)系(①-⑩)組成。
本發(fā)明由1個接口,與信息檢索系統(tǒng)進(jìn)行信息交換(②,④,⑥,⑩)。
通過接口,本發(fā)明可與任何信息檢索系統(tǒng)連接,提供用戶搜索詞的關(guān)聯(lián)關(guān)鍵詞推薦,實(shí)現(xiàn)用戶對信息系統(tǒng)系統(tǒng)相關(guān)信息的全面了解和精確獲取。