欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

根據(jù)結(jié)果與用戶查詢的相關(guān)性增強(qiáng)搜索索引的制作方法

文檔序號(hào):6502842閱讀:197來源:國(guó)知局
專利名稱:根據(jù)結(jié)果與用戶查詢的相關(guān)性增強(qiáng)搜索索引的制作方法
技術(shù)領(lǐng)域
本發(fā)明一般涉及搜索引擎和標(biāo)引(indexing)方法。
背景技術(shù)
搜索引擎眾所周知。它們是每個(gè)數(shù)據(jù)庫(kù)以及每個(gè)索引的一部分。數(shù)據(jù)庫(kù)一般把來自一個(gè)企業(yè)的信息保存到集合記錄(set records)中。索引是在多個(gè)位置找到的數(shù)據(jù)的逐條列舉。例如,Google.com和Altavista定期標(biāo)引萬維網(wǎng)的網(wǎng)頁(yè),以創(chuàng)建web索引。
Google.com已增強(qiáng)他們的搜索引擎,以便既查看網(wǎng)頁(yè)上的單詞,又查看指向該網(wǎng)頁(yè)的超鏈接(由其它人構(gòu)成的)。出現(xiàn)在超鏈接(通常用藍(lán)色突出顯示)上的文本被稱為“錨點(diǎn)文本”,并和網(wǎng)頁(yè)一起保存在索引中。
現(xiàn)在參見圖1,圖1圖解說明了一小部分的簡(jiǎn)化索引。在被標(biāo)引的文檔或網(wǎng)頁(yè)中找到的每個(gè)術(shù)語列舉在第一列2中。與每個(gè)術(shù)語相關(guān)的是該術(shù)語的總的出現(xiàn)次數(shù)(列4),和出現(xiàn)在文檔中的何處(在標(biāo)題中(列6),錨點(diǎn)文本中(列8)或者文本中(列10))。在列4、6、8或10的每個(gè)單元中,列舉文檔編號(hào)和出現(xiàn)次數(shù)。例如,下述被列舉為術(shù)語A的總的出現(xiàn)次數(shù)(doc#1,5000),(doc#4,6),(doc#67,90),(doc#1220,9)...
從而,術(shù)語A在文檔1中找到5000次,在文檔4中找到6次,在文檔67中找到90次,在文檔1220中找到9次。文檔1中的所有5000次出現(xiàn)在錨點(diǎn)文本(列8)中,而文檔4中的6次出現(xiàn)在兩個(gè)位置,4次出現(xiàn)在文本中,2次出現(xiàn)在標(biāo)題中。
一些索引還列舉每個(gè)術(shù)語出現(xiàn)在文檔中的何處。從而,該項(xiàng)目可被列舉為(doc#,文檔編號(hào)內(nèi)的字符)。這保持了初始文檔的結(jié)構(gòu),并且可在索引中形成另一列。索引還可包含術(shù)語如何出現(xiàn)在文本中的更詳細(xì)參考(例如黑體,加重,文本的顏色,文本的大小等)。每個(gè)這樣的參考可在索引中具有它自己的計(jì)數(shù)。
許多人已發(fā)現(xiàn)在網(wǎng)絡(luò)上查找東西容易,但是只有當(dāng)用戶知道用于進(jìn)行搜索的正確術(shù)語時(shí)才是如此。正確的術(shù)語是網(wǎng)頁(yè)的設(shè)計(jì)者所使用的那些術(shù)語。這使得找出非特定術(shù)語較為困難。例如,一個(gè)用戶到Amazon.com購(gòu)買5歲男孩用的音樂玩具,但是該過程需要大量的搜索,才能找到所需的物品。只鍵入“music toy for 5 year old boy”產(chǎn)生供小男孩用的和關(guān)于小男孩的各種東西的列表,而不產(chǎn)生適當(dāng)?shù)耐婢?。但是,“Visit Our Musical Instruments Store”包括在該列表中。當(dāng)被選擇時(shí),顯現(xiàn)一批孩子的音樂玩具。這些音樂玩具都不合意,從而按下選擇“Other Musical Instruments”。該選擇較為有用,因?yàn)樗ā癕arching Band Kit”,所需要的物品。
在另一例子中,用戶在查找“IR”(信息檢索)書。他在Google上搜索“IR book”。該搜索得到書籍的列表,但是列舉的書籍都不是其全名為Modern Information Retrieval的最新書籍。只有鍵入“moderninformation retrieval”時(shí),才能檢索到最新的IR書。

發(fā)明內(nèi)容
本發(fā)明的第一方面提供一種搜索系統(tǒng),所述搜索系統(tǒng)包括一個(gè)搜索文檔的索引的搜索引擎和用至少一些用戶查詢?cè)鰪?qiáng)索引的索引增強(qiáng)器。索引可包括在待標(biāo)引的文檔中和至少在用于查找所述文檔的用戶查詢中找到的術(shù)語的列表,和至少列出這些術(shù)語在文檔和用戶查詢中的出現(xiàn)頻率的列表。
本發(fā)明的第二方面提供一種用至少一些用戶查詢?cè)鰪?qiáng)文檔的索引的方法。所述方法由計(jì)算機(jī)程序?qū)崿F(xiàn),所述計(jì)算機(jī)程序包括由數(shù)據(jù)處理設(shè)備執(zhí)行的程序代碼指令。
本發(fā)明的第三方面提供一種索引,所述索引包含在待標(biāo)引的文檔中和至少在用于查找所述文檔的用戶查詢中找到的術(shù)語的列表,和這些術(shù)語在所述文檔和用戶查詢中的出現(xiàn)頻率的列表。
本發(fā)明的第四方面提供一種查詢索引,所述查詢索引包括在用戶查詢中找到的術(shù)語的列表,和所述術(shù)語被用于檢索的文檔的列表。
本發(fā)明的第五方面提供一種搜索系統(tǒng),所述搜索系統(tǒng)包括發(fā)出用戶查詢的搜索客戶機(jī),和搜索文檔的索引的搜索引擎,其中所述索引標(biāo)引至少初始文本和描述與所述初始文本有關(guān)的某些內(nèi)容的至少一個(gè)查詢。


在說明書的結(jié)束部分中特別指出和明確要求保護(hù)視為本發(fā)明的主題。但是,結(jié)合附圖,參考例證實(shí)施例的下述詳細(xì)說明,可關(guān)于操作組織和操作方法,以及發(fā)明目的,特征和優(yōu)點(diǎn),更好地理解本發(fā)明,其中圖1是一小部分的簡(jiǎn)化的現(xiàn)有索引;圖2是圖解說明根據(jù)本發(fā)明構(gòu)成和操作的搜索系統(tǒng)的方框圖;圖3是由圖2的系統(tǒng)產(chǎn)生的一小部分的簡(jiǎn)化的增強(qiáng)索引;圖4是可用在圖2的系統(tǒng)中的簡(jiǎn)化查詢索引。
要認(rèn)識(shí)到為了舉例說明的簡(jiǎn)明和清楚,附圖中所示的部件不必按比例繪制。例如,為了清楚起見,一些部件的尺寸可相對(duì)于其它部件被放大。此外,在認(rèn)為適當(dāng)?shù)牡胤剑綀D標(biāo)記可在附圖中重復(fù),以指示對(duì)應(yīng)或者類似的部件。
具體實(shí)施例方式
在下面的詳細(xì)說明中,陳述了眾多的具體細(xì)節(jié),以便徹底理解本發(fā)明。但是,本領(lǐng)域的技術(shù)人員明白可在沒有這些具體細(xì)節(jié)的情況下實(shí)踐本發(fā)明。在其它情況下,沒有說明公知的方法,過程和組件,以便不使本發(fā)明不分明。
申請(qǐng)人已認(rèn)識(shí)到在用戶的查詢中存在和用戶如何看待他們正搜索的物品有關(guān)的大量信息。根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施例,查詢單詞可被結(jié)合到索引中的信息中,從而增加描述物品(item)的方式。
例如在背景技術(shù)部分中,“Marching Band Toy”頁(yè)面將在索引中具有與之相關(guān)的單詞“music toy for 5 year old boy”,書籍ModernInformation Retrieval將具有與之相關(guān)的“IR book”,以致可能使用這些術(shù)語的其他搜索者會(huì)將這些物品視為其首次搜索的結(jié)果的一部分。
現(xiàn)在參見圖2,圖2圖解說明根據(jù)本發(fā)明構(gòu)成和操作的搜索系統(tǒng)10。搜索系統(tǒng)10可包含搜索客戶機(jī)12,搜索引擎14和索引增強(qiáng)器16。
搜索客戶機(jī)12和搜索引擎14可以是處理多個(gè)文檔20的索引18的任何搜索客戶機(jī)和搜索引擎,例如本領(lǐng)域中已知的搜索客戶機(jī)和搜索引擎。搜索引擎12可把搜索請(qǐng)求發(fā)送給搜索引擎14,搜索引擎14又可以和搜索請(qǐng)求匹配的文檔20的排序列表的形式提供搜索結(jié)果。搜索客戶機(jī)12可隨后從列表中選擇文檔,或者可請(qǐng)求另一搜索。
標(biāo)引的文檔可以是單個(gè)文檔、整個(gè)網(wǎng)站、不一定由一個(gè)人構(gòu)成或者保存在相同域的一系列的鏈接網(wǎng)頁(yè)、或者具有指向其的網(wǎng)頁(yè)的所有部分(即,出現(xiàn)在指向該網(wǎng)頁(yè)的鏈接上的錨點(diǎn)文本,或者甚至環(huán)繞錨點(diǎn)文本并被認(rèn)為引用(refer to)所指向的網(wǎng)頁(yè)的文本)的單個(gè)網(wǎng)頁(yè)。每個(gè)這樣的參考也可在索引中描述(例如,某一術(shù)語多少次表現(xiàn)為錨點(diǎn)文本)。
類似于任何索引,索引18可保存和每個(gè)術(shù)語相關(guān)的各種信息,例如其在文檔中的位置,其功能(例如,出現(xiàn)在標(biāo)題中,出現(xiàn)在子標(biāo)題中,作為主體文本,作為錨點(diǎn)文本等),它是否被強(qiáng)調(diào)(大寫,黑體,斜體,著色等),其出現(xiàn)頻率,出現(xiàn)之間的距離等。
根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施例,索引增強(qiáng)器16可根據(jù)向搜索引擎14提交的用戶查詢,把術(shù)語和/或其它細(xì)節(jié)增加到索引18中,或者增加到任意文檔20中。索引增強(qiáng)器16可如下參考圖3所述那樣,或者按照任何其它方式,把術(shù)語增加到文檔本身中(作為元數(shù)據(jù)),或者增加到它們?cè)谒饕?8中的表示中。
例如,現(xiàn)在簡(jiǎn)要參考的圖3圖解說明圖1的例證部分索引的例證增強(qiáng)形式,其中用黑體標(biāo)記新的信息。增強(qiáng)的索引可具有和現(xiàn)有技術(shù)的索引相同的列2、4、6、8和10。它還具有保存查詢信息的列9。標(biāo)題、錨點(diǎn)和文本列6、8和10中的信息沒有變化。變化的是總的出現(xiàn)次數(shù)列4中的信息。
例如,文檔1現(xiàn)在具有術(shù)語A的7000次出現(xiàn),因?yàn)閺挠脩舻牟樵冎性黾恿?000次。先前只具有術(shù)語A的文檔67現(xiàn)在還具有術(shù)語B的9000次出現(xiàn),所有這9000次出現(xiàn)都在查詢中,如查詢列9中列舉的。多個(gè)單詞查詢被保存為完整的短語,或者可按照和文檔文本或與之相關(guān)的錨點(diǎn)文本相類似的方式保存近似信息。
當(dāng)搜索引擎14可搜索增強(qiáng)的索引18時(shí),它可使用增強(qiáng)的信息,根據(jù)與標(biāo)引文檔相關(guān)的新的查詢術(shù)語輸出不同的搜索結(jié)果。從而,如果某人關(guān)于“toy for 5 year old”搜索增強(qiáng)索引,如背景技術(shù)中所述,那么搜索引擎14可返回對(duì)Marching Band Set的鏈接。類似地,如果某人關(guān)于“IR book”搜索增強(qiáng)索引,那么搜索引擎14可返回對(duì)所有書籍,包括最新的書籍的鏈接。
索引增強(qiáng)器16可包含用戶查詢處理器30,查詢排序器(ranker)32和索引增強(qiáng)器34。用戶查詢處理器30可分析由搜索引擎14產(chǎn)生的用戶的查詢和結(jié)果的日志文件。一些搜索引擎還記錄用戶的最終選擇,用戶查詢處理器30同樣可分析這些最終選擇。
用戶查詢處理器30可把用戶的查詢?cè)黾拥轿臋n查詢索引40中,文檔查詢索引40可使每個(gè)查詢和它產(chǎn)生的文檔20相關(guān)聯(lián)。它還可使多搜索會(huì)話中的所有查詢與產(chǎn)生的所有文檔相關(guān)聯(lián),或者只與每個(gè)查詢的排名在前的結(jié)果相關(guān)聯(lián)。另一方面,如果系統(tǒng)能夠告訴用戶注意哪些文檔作為搜索的結(jié)果,那么處理器30可使查詢只與查看或者點(diǎn)擊的文檔相關(guān)聯(lián)??砂凑杖魏芜m當(dāng)?shù)姆绞?例如在預(yù)定的一段時(shí)間內(nèi),或者在登錄期內(nèi))定義會(huì)話。
在另一實(shí)施例中,如果用戶在查詢間瀏覽信息,而不是使用查詢的結(jié)果,那么查詢處理器30也可使查詢與瀏覽的文檔相關(guān)聯(lián)。只有當(dāng)瀏覽的文檔可在初始索引中找到并且可用來把查詢加入它們之中時(shí),這才是可行的。
可對(duì)在搜索會(huì)話結(jié)束時(shí)選擇的文檔給予額外的權(quán)重,因?yàn)樵撐臋n通常是所需的內(nèi)容。該文檔可與搜索的每個(gè)查詢相關(guān)聯(lián),或者只與初始的搜索術(shù)語相關(guān)聯(lián),因?yàn)槌跏嫉乃阉餍g(shù)語通常是用戶的自然語言術(shù)語。另一方面或者另外,可對(duì)不同的查詢分配不同的權(quán)重,取決于它們與用戶的初始查詢有關(guān)的計(jì)時(shí)。
要認(rèn)識(shí)到查詢術(shù)語可以是任何語言,而與初始文檔的語言無關(guān)。例如,如果用戶用德語查詢某物,什么也沒得到,隨后用英語查詢,找到某些內(nèi)容,那么也可與英語文檔相關(guān)聯(lián)地增加德語單詞。
在一個(gè)備選實(shí)施例中,只有選擇的文檔和初始的搜索術(shù)語可被保存,因?yàn)檫x擇可能是對(duì)用戶的初始查詢的回答。另一方面,可要求用戶指出哪些搜索術(shù)語與他最終的選擇相關(guān)。
用戶查詢處理器30可和搜索引擎14一起工作,從而它可實(shí)時(shí)或半實(shí)時(shí)地接收搜索請(qǐng)求、結(jié)果和選擇。另一方面,如圖2中所示,用戶查詢處理器30可處理搜索引擎14產(chǎn)生的日志文件42。
可按照任何適當(dāng)?shù)姆绞浇M織文檔查詢索引40。一種例證方式可以是每個(gè)標(biāo)引文檔具有一個(gè)查詢文檔44,每個(gè)查詢文檔44可列舉查詢和該特定查詢?cè)谌罩疚募斜皇褂昧硕嗌俅?。?duì)于實(shí)時(shí)或半實(shí)時(shí)操作來說,查詢的頻率可被連續(xù)更新。類似地,當(dāng)可以復(fù)查(review)多個(gè)日志文件42時(shí),查詢的頻率可被更新。
現(xiàn)在簡(jiǎn)要參考圖4,在圖中表示的另一實(shí)施例中,查詢索引40可列舉和文檔索引18中相同的術(shù)語,并且可列舉術(shù)語在與文檔相關(guān)的查詢中的出現(xiàn)頻率。
在適當(dāng)?shù)臅r(shí)間,可能希望增強(qiáng)文檔索引18。查詢排序器32可復(fù)查查詢索引40,以確定哪些查詢?cè)黾拥轿臋n索引1中??梢圆捎萌魏芜m當(dāng)?shù)脑囂椒āR环N簡(jiǎn)單的試探法是加入所述查詢,并利用它們的使用頻率對(duì)它們加權(quán)。其它試探法可涉及只選擇具有較大使用頻率的那些查詢。另一些試探法可包含消除任何“過時(shí)的”查詢。后一種試探法可要求用戶查詢處理器30把與每個(gè)查詢相關(guān)的時(shí)間戳記保存在索引40中。另一種試探法可涉及確定哪個(gè)術(shù)語“成熟”到足以充分并且永久地與文檔20相關(guān)聯(lián)。另一種試探法可涉及向術(shù)語分配權(quán)重,以致它們?cè)谒饕?8中表現(xiàn)為“不確定”,隨后把該權(quán)重附到術(shù)語上用于由搜索引擎14進(jìn)行的排序計(jì)算。
索引增強(qiáng)器34類似于已知的索引更新器,因?yàn)樗蓮?fù)查索引和改變其中的信息。增強(qiáng)器34可獲得查詢排序器32產(chǎn)生的排序的查詢,并可在索引18中使它們與它們相關(guān)的文檔相關(guān)聯(lián)。索引增強(qiáng)器34可作為查詢列9或者按照任何其它適當(dāng)?shù)姆绞?,把查詢?cè)黾拥较嚓P(guān)的錨點(diǎn)文本22中、增加到相關(guān)的文檔20中、增加到另外的文本部分24中。如果適宜的話,索引增強(qiáng)器34還可復(fù)查先前增加的查詢的時(shí)間戳記,更新公共查詢的任何時(shí)間戳記,和除去其時(shí)間戳記“陳舊”的任何查詢,這里所述“陳舊”可具有任何適當(dāng)?shù)亩x。
索引增強(qiáng)器34可通過增加查詢和通過更新現(xiàn)有查詢的使用頻率和時(shí)間戳記,更新與每個(gè)文檔20相關(guān)聯(lián)的整個(gè)查詢列表。索引增強(qiáng)器34可按照任何適當(dāng)?shù)脑囂椒▽?duì)查詢排序。一種試探法可以是使用頻率。另一種可按照上面所述的時(shí)間戳記。
一旦索引增強(qiáng)器34完成,搜索引擎14就可用新的查詢搜索增強(qiáng)的索引18。
雖然這里舉例說明了本發(fā)明的一些特征,不過本領(lǐng)域的普通技術(shù)人員易于想到多種修改,替換,變化和等同物。于是,附加權(quán)利要求意圖覆蓋落入本發(fā)明精神范圍內(nèi)的所有這種修改和變化。
權(quán)利要求
1.一種搜索系統(tǒng),包括搜索文檔的索引的搜索引擎;和用至少一些用戶查詢?cè)鰪?qiáng)所述索引的索引增強(qiáng)器。
2.按照權(quán)利要求1所述的系統(tǒng),其中所述索引增強(qiáng)器包含使查詢與所述搜索引擎檢索的文檔相關(guān)聯(lián)的查詢處理器。
3.按照權(quán)利要求2所述的系統(tǒng),其中所述查詢處理器包含確定哪些所述檢索的文檔與所述查詢相關(guān)聯(lián)的裝置,和確定哪些查詢與所述檢索的文檔相關(guān)聯(lián)的裝置。
4.按照權(quán)利要求3所述的系統(tǒng),其中所述相關(guān)聯(lián)的查詢包含在會(huì)話中使用的一部分查詢。
5.按照權(quán)利要求3所述的系統(tǒng),其中所述相關(guān)聯(lián)的查詢包含會(huì)話的第一查詢。
6.按照權(quán)利要求3所述的系統(tǒng),其中所述確定的檢索文檔包含所述用戶選擇的文檔。
7.按照權(quán)利要求3所述的系統(tǒng),其中所述確定的檢索文檔包含作為查詢的結(jié)果由所述用戶瀏覽的文檔。
8.按照權(quán)利要求3所述的系統(tǒng),其中所述確定的檢索文檔包含從查詢產(chǎn)生的排序較高的文檔。
9.按照權(quán)利要求2所述的系統(tǒng),其中所述用戶查詢的語言不同于所選文檔的語言。
10.按照權(quán)利要求1所述的系統(tǒng),其中所述索引增強(qiáng)器包括對(duì)與文檔相關(guān)聯(lián)的查詢排序的查詢排序器。
11.按照權(quán)利要求10所述的系統(tǒng),其中所述查詢排序器包括按照使用頻率對(duì)所述查詢排序的裝置。
12.按照權(quán)利要求10所述的系統(tǒng),其中所述查詢排序器包括按照使用時(shí)間對(duì)所述查詢排序的裝置。
13.按照權(quán)利要求10所述的系統(tǒng),其中所述索引增強(qiáng)器包含用至少一些所述排序的查詢?cè)鰪?qiáng)所述索引的索引更新器。
14.按照權(quán)利要求13所述的系統(tǒng),其中所述索引更新器包括濾出排序較低的查詢的裝置。
15.一種索引,包括在待標(biāo)引的文檔中和至少在用于查找所述文檔的用戶查詢中找到的術(shù)語的列表;和至少列出這些術(shù)語在文檔和用戶查詢中的出現(xiàn)頻率的列表。
16.按照權(quán)利要求15所述的索引,其中所述用戶查詢包含在查找所選文檔的會(huì)話中使用的一部分查詢。
17.按照權(quán)利要求15所述的索引,其中所述用戶查詢包含查找所選文檔的會(huì)話的第一查詢。
18.按照權(quán)利要求15所述的索引,其中與查詢相關(guān)聯(lián)的文檔包含所述用戶選擇的文檔。
19.按照權(quán)利要求15所述的索引,其中與查詢相關(guān)聯(lián)的文檔包含作為查詢的結(jié)果由所述用戶瀏覽的文檔。
20.按照權(quán)利要求15所述的索引,其中與查詢相關(guān)聯(lián)的文檔包含從查詢產(chǎn)生的排序較高的文檔。
21.按照權(quán)利要求15所述的索引,其中所述用戶查詢的語言不同于所選文檔的語言。
22.一種查詢索引,包括在用戶查詢中找到的術(shù)語的列表;和所述術(shù)語被用于檢索的文檔的列表。
23.按照權(quán)利要求22所述的索引,其中所述用戶查詢包括在查找所選文檔的會(huì)話中使用的一部分查詢。
24.按照權(quán)利要求22所述的索引,其中所述用戶查詢包含查找所選文檔的會(huì)話的第一查詢。
25.按照權(quán)利要求22所述的索引,其中與查詢相關(guān)聯(lián)的文檔包含所述用戶選擇的文檔。
26.按照權(quán)利要求22所述的索引,其中與查詢相關(guān)聯(lián)的文檔包含作為查詢的結(jié)果由所述用戶瀏覽的文檔。
27.按照權(quán)利要求22所述的索引,其中與查詢相關(guān)聯(lián)的文檔包含從查詢產(chǎn)生的排序較高的文檔。
28.按照權(quán)利要求22所述的索引,其中所述用戶查詢的語言不同于所選文檔的語言。
29.一種搜索系統(tǒng),所述搜索系統(tǒng)包括發(fā)出用戶查詢的搜索客戶機(jī);和搜索文檔的索引的搜索引擎,其中所述索引標(biāo)引至少初始文本和描述與所述初始文本有關(guān)的某些內(nèi)容的至少一個(gè)查詢。
30.按照權(quán)利要求29所述的系統(tǒng),其中所述索引包括在待標(biāo)引的文檔中和至少在用于查找所述文檔的用戶查詢中找到的術(shù)語的列表;和至少列舉這些術(shù)語在所述文檔和用戶查詢中的出現(xiàn)頻率的列表。
31.按照權(quán)利要求30所述的系統(tǒng),其中所述用戶查詢包括在查找所選文檔的會(huì)話中使用的一部分查詢。
32.按照權(quán)利要求30所述的系統(tǒng),其中所述用戶查詢包含查找所選文檔的會(huì)話的第一查詢。
33.按照權(quán)利要求30所述的系統(tǒng),其中與查詢相關(guān)聯(lián)的文檔包含所述用戶選擇的文檔。
34.按照權(quán)利要求30所述的系統(tǒng),其中與查詢相關(guān)聯(lián)的文檔包含作為查詢的結(jié)果由所述用戶瀏覽的文檔。
35.按照權(quán)利要求30所述的系統(tǒng),其中與查詢相關(guān)聯(lián)的文檔包含從查詢產(chǎn)生的排序較高的文檔。
36.按照權(quán)利要求30所述的系統(tǒng),其中所述用戶查詢的語言不同于所選文檔的語言。
37.一種方法,包括用至少一些用戶查詢?cè)鰪?qiáng)文檔的索引。
38.按照權(quán)利要求37所述的方法,其中所述增強(qiáng)包括使查詢與由搜索引擎檢索的文檔相關(guān)聯(lián)。
39.按照權(quán)利要求38所述的方法,其中所述增強(qiáng)包含確定哪些所述檢索的文檔與所述查詢相關(guān)聯(lián),和確定哪些查詢與所述檢索的文檔相關(guān)聯(lián)。
40.按照權(quán)利要求38所述的方法,其中所述增強(qiáng)包括列舉查詢中的術(shù)語和該術(shù)語與文檔相關(guān)聯(lián)的次數(shù)。
41.按照權(quán)利要求38所述的方法,其中所述增強(qiáng)包括對(duì)與文檔相關(guān)聯(lián)的查詢排序。
42.按照權(quán)利要求41所述的方法,其中所述排序包括按照使用頻率對(duì)所述查詢排序。
43.按照權(quán)利要求41所述的方法,其中所述排序包括按照使用時(shí)間對(duì)所述查詢排序。
44.按照權(quán)利要求41所述的方法,其中所述增強(qiáng)包含用至少一些所述排序的查詢更新所述索引。
45.按照權(quán)利要求44所述的方法,其中所述更新包括濾出排序較低的查詢。
46.一種機(jī)器可讀的計(jì)算機(jī)產(chǎn)品,所述計(jì)算機(jī)產(chǎn)品包含可由機(jī)器執(zhí)行,從而實(shí)現(xiàn)增強(qiáng)索引的方法步驟的指令的程序,所述方法包括用至少一些用戶查詢?cè)鰪?qiáng)文檔的索引。
47.按照權(quán)利要求46所述的產(chǎn)品,其中所述增強(qiáng)包括使查詢與由搜索引擎檢索的文檔相關(guān)聯(lián)。
48.按照權(quán)利要求47所述的產(chǎn)品,其中所述增強(qiáng)包含確定哪些所述檢索的文檔與所述查詢相關(guān)聯(lián),和確定哪些查詢與所述檢索的文檔相關(guān)聯(lián)。
49.按照權(quán)利要求47所述的產(chǎn)品,其中所述增強(qiáng)包括列舉查詢中的術(shù)語和該術(shù)語在查詢中的位置。
50.按照權(quán)利要求47所述的產(chǎn)品,其中所述增強(qiáng)包括列舉查詢中的術(shù)語和該術(shù)語與文檔相關(guān)聯(lián)的次數(shù)。
51.按照權(quán)利要求47所述的產(chǎn)品,其中所述增強(qiáng)包括對(duì)與文檔相關(guān)聯(lián)的查詢排序。
52.按照權(quán)利要求51所述的產(chǎn)品,其中所述排序包括按照使用頻率對(duì)所述查詢排序。
53.按照權(quán)利要求51所述的產(chǎn)品,其中所述排序包括按照使用時(shí)間對(duì)所述查詢排序。
54.按照權(quán)利要求51所述的產(chǎn)品,其中所述增強(qiáng)包含用至少一些所述排序的查詢更新所述索引。
55.按照權(quán)利要求54所述的產(chǎn)品,其中所述更新包括濾出排序較低的查詢。
全文摘要
搜索系統(tǒng)包括一個(gè)搜索文檔的索引的搜索引擎,和用至少一些用戶查詢?cè)鰪?qiáng)索引的索引增強(qiáng)器。索引可包括在待標(biāo)引的文檔中和至少在用于查找所述文檔的用戶查詢中找到的術(shù)語的列表,和至少列出這些術(shù)語在文檔和用戶查詢中的出現(xiàn)頻率的列表。
文檔編號(hào)G06F17/30GK1898667SQ200480038364
公開日2007年1月17日 申請(qǐng)日期2004年12月15日 優(yōu)先權(quán)日2003年12月22日
發(fā)明者埃奈特·阿米塔 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
芦溪县| 稻城县| 阆中市| 遵化市| 福海县| 吴川市| 东海县| 南岸区| 紫云| 汉川市| 延边| 玉林市| 红桥区| 成武县| 海阳市| 滦平县| 博湖县| 玛多县| 龙游县| 城步| 武城县| 军事| 铜山县| 高台县| 武川县| 旌德县| 余江县| 福贡县| 承德县| 集贤县| 贵溪市| 平泉县| 贺兰县| 军事| 渝中区| 柳州市| 浦城县| 大理市| 襄垣县| 和林格尔县| 依兰县|