專利名稱:一種信息搜索方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種信息搜索方法和系統(tǒng)。
背景技術(shù):
目前在互聯(lián)網(wǎng)上進行信息搜索,通常以待搜索信息本身的文本內(nèi)容為關(guān)鍵字,通過字符匹配進行搜索,無法根據(jù)待搜索信息本身所蘊含的深度含義進行搜索。
例如,目前的音樂搜索系統(tǒng),通常以音樂文件本身的文本內(nèi)容為關(guān)鍵字,例如,以歌手名、歌曲名、專輯名稱等作為關(guān)鍵字進行音樂文件搜索,無法根據(jù)歌曲本身所蘊含的深度含義進行搜索。通常,待搜索信息本身所蘊含的深度含義,只有通過人的感知或綜合分析才能提煉出來,僅僅通過字符匹配無法準確搜索到需要的信息,例如,要尋找旋律和情感方面較為憂傷的歌曲,通過簡單的字符匹配是很難找到真正相應(yīng)的歌曲列表的。可見,目前的信息搜索方法的準確性較差。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供了一種信息搜索方法和系統(tǒng),以便提高信息搜索的準確性。本發(fā)明的技術(shù)方案具體是這樣實現(xiàn)的一種信息搜索方法,該方法包括通過分析用戶針對搜索對象的行為信息,為搜索對象建立標簽值;根據(jù)搜索對象在標簽值上的權(quán)重,確定該標簽值對應(yīng)的用戶的權(quán)重,根據(jù)用戶的權(quán)重,確定搜索對象在該用戶對應(yīng)的標簽值上的權(quán)重,其中,用戶與根據(jù)該用戶的行為信息為搜索對象建立的標簽值對應(yīng);根據(jù)搜索對象在標簽值上的權(quán)重,確定搜索結(jié)果?!N信息搜索系統(tǒng),該系統(tǒng)包括標簽值建立模塊、權(quán)重確定模塊和搜索模塊;所述標簽值建立模塊,用于根據(jù)用戶針對搜索對象的行為信息,為搜索對象建立標簽值;所述權(quán)重確定模塊,用于根據(jù)搜索對象在標簽值上的權(quán)重,確定該標簽值對應(yīng)的用戶的權(quán)重,根據(jù)用戶的權(quán)重,確定搜索對象在該用戶對應(yīng)的標簽值上的權(quán)重,其中,用戶與根據(jù)該用戶的行為信息為搜索對象建立的標簽值對應(yīng);所述搜索模塊,用于根據(jù)搜索對象在標簽值上的權(quán)重,確定搜索結(jié)果。由上述技術(shù)方案可見,本發(fā)明通過分析用戶針對搜索對象的行為信息,為搜索對象建立標簽值,通過以所述標簽值作為信息搜索的一個依據(jù),使得能夠根據(jù)用戶針對搜索對象的行為確定搜索結(jié)果,由于用戶行為能在一定程度上反映待搜索信息的深層含義,因此能夠提高信息搜索的準確性。另外,本發(fā)明根據(jù)搜索對象在標簽值上的權(quán)重,確定該標簽值對應(yīng)的用戶的權(quán)重,根據(jù)用戶的權(quán)重,確定搜索對象在該用戶對應(yīng)的標簽值上的權(quán)重,通過二維空間的相互影響,即通過用戶權(quán)重這樣的用戶空間和標簽值權(quán)重這樣的標簽空間的相互影響,使得確定出的搜索對象在標簽值上的權(quán)重能夠反映搜索對象本身的深層含義,因此,本發(fā)明在以標簽值作為依據(jù)進行信息搜索時,準確性較高。
圖I是本發(fā)明提供的信息搜索方法的流程圖。圖2是為音樂文件搜索預(yù)先確定維度值的方法流程圖。圖3是為音樂文件建立標簽值的方法流程圖。圖4是音樂文件對應(yīng)標簽的數(shù)據(jù)庫結(jié)構(gòu)圖。圖5是用戶對應(yīng)音樂文件標簽的數(shù)據(jù)庫結(jié)構(gòu)圖。圖6是本發(fā)明提供的二重維度空間相互依賴的權(quán)重模型。圖7是本發(fā)明提供的實例模型示意圖。圖8是歌曲在標簽值上的權(quán)重矩陣。圖9是對歌曲按照標簽值進行由小到大的排序并以序號作為綜合權(quán)重系數(shù)的矩陣。圖10是本發(fā)明提供的信息搜索系統(tǒng)的結(jié)構(gòu)圖。
具體實施例方式圖I是本發(fā)明提供的信息搜索方法的流程圖。如圖I所示,該方法包括步驟101,根據(jù)用戶針對搜索對象的行為信息,為搜索對象建立標簽值。步驟102,根據(jù)搜索對象在標簽值上的權(quán)重,確定該標簽值對應(yīng)的用戶的權(quán)重,根據(jù)用戶的權(quán)重,確定搜索對象在該用戶對應(yīng)的標簽值上的權(quán)重。其中,用戶與根據(jù)該用戶的行為信息為搜索對象建立的標簽值對應(yīng)。步驟103,根據(jù)搜索對象在標簽值上的權(quán)重,確定搜索結(jié)果。圖I所述的搜索對象,可以是音樂文件、視頻文件、網(wǎng)站、網(wǎng)絡(luò)上的商品信息等。所述的用戶針對搜索對象的行為信息,可以包括但不限于用戶評論的文字內(nèi)容、和/或以打分形式出現(xiàn)的用戶評論信息、和/或用戶是否訪問了該搜索對象。通過分析用戶針對搜索對象的行為信息,可以挖掘出搜索對象的深層含義,從而為搜索對象建立能夠代表其深層含義的標簽。下面以分析用戶評論為例,對為搜索對象建立標簽值的方法進行示例性說明,所舉例子并不用于限制本發(fā)明預(yù)先確定一個或多個維度、以及每個維度包括的維度值,遍歷所有維度的所有維度值,將用戶對搜索對象的用戶評論與每個維度的每個維度值進行匹配,將匹配成功的維度值確定為該搜索對象的標簽值。其中,所述預(yù)先確定一個或多個維度、以及每個維度包括的維度值,可以是根據(jù)互聯(lián)網(wǎng)上的用戶評論、或者現(xiàn)實生活中的用戶評論,由人工預(yù)先確定出相應(yīng)的維度,以及每個維度包括的維度值。由人工確定維度值的方法有失客觀性,無法準確地反映搜索對象的深層含義,因此,本發(fā)明提出,所述預(yù)先確定一個或多個維度、以及每個維度包括的維度值,可以采用如下的方法提高維度值的客觀性從網(wǎng)絡(luò)上獲取用戶評論,提取同一用戶對同一搜索對象的所有用戶評論的關(guān)鍵詞,根據(jù)關(guān)鍵詞的出現(xiàn)次數(shù),選擇出現(xiàn)次數(shù)滿足預(yù)定條件的關(guān)鍵詞,將選出的關(guān)鍵詞確定為維度值,將確定出的所有維度值劃分為一個或多個維度。將匹配成功的維度值確定為該搜索對象的標簽值之后,為了便于確定用戶權(quán)重和搜索對象在每個標簽值上的權(quán)重,本發(fā)明還可以在為搜索對象建立了標簽值以后,建立所有搜索對象對應(yīng)標簽的數(shù)據(jù)庫,以及所有用戶對應(yīng)標簽的數(shù)據(jù)庫。其中,所有搜索對象對應(yīng)標簽的數(shù)據(jù)庫包括搜索對象列表、每一搜索對象對應(yīng)的 標簽值列表,每一搜索對象的每一標簽值對應(yīng)的用戶評論信息列表,該用戶評論信息列表包括根據(jù)其用戶評論為所述搜索對象建立了所述標簽值的所有用戶、以及每一用戶的所有所述用戶評論的最新評論時間。所有用戶對應(yīng)標簽的數(shù)據(jù)庫包括用戶列表、每一用戶對應(yīng)的標簽值列表、以及每一用戶的每一標簽值對應(yīng)的搜索對象信息列表,該搜索對象信息列表包括根據(jù)所述用戶的用戶評論為其建立有所述標簽值的所有搜索對象、以及根據(jù)所述用戶的用戶評論為每一搜索對象建立所述標簽值的最新時間。下面以音樂文件搜索為例,對維度值的確定方法,以及為音樂文件建立標簽值的方法進行示例性說明,具體請參見圖2 圖5,所舉例子并不用于限制本發(fā)明。圖2是為音樂文件搜索預(yù)先確定維度值的方法流程圖。如圖2所示,該方法包括步驟201,從網(wǎng)絡(luò)上獲取音樂文件的用戶評論信息。步驟202,將同一用戶對同一音樂文件的用戶評論信息進行結(jié)構(gòu)解析,提取出關(guān)鍵
ο本步驟中,首先對獲取的用戶評論信息按照如下的結(jié)構(gòu)進行結(jié)構(gòu)化處理I)用戶評論信息的題目該用戶評論信息所針對的音樂文件名稱;2)用戶評論信息的內(nèi)容、作者(即用戶信息)和評論時間,還可以包括其他用戶對該用戶評論信息的內(nèi)容的支持與反對(即其他用戶是否支持該用戶評論信息的內(nèi)容)。將同一用戶對同一音樂文件的所有評論的內(nèi)容進行分詞處理,在分詞處理后,將一些停用詞等無意義的詞過濾掉,然后將剩余的詞作為提取出的關(guān)鍵詞。步驟203,從提取出的所有關(guān)鍵詞中選出重復(fù)次數(shù)滿足預(yù)定條件的關(guān)鍵詞,將該重復(fù)次數(shù)滿足預(yù)定條件的關(guān)鍵詞確定為維度值。關(guān)鍵詞的重復(fù)次數(shù)越多,則說明當前越多用戶采用該關(guān)鍵詞對音樂文件進行評論,因此可以將該關(guān)鍵詞作為一個維度值。其中,為了避免某些用戶多次使用相同的關(guān)鍵詞對同一音樂文件進行評論而影響關(guān)鍵詞的重復(fù)次數(shù),如果一個關(guān)鍵詞在同一用戶對同一音樂文件的所有評論的內(nèi)容中出現(xiàn)多次,則可以將該多次計為I次,以使得選出的維度值更能夠體現(xiàn)大多數(shù)用戶對音樂文件的評論內(nèi)容。通過對大量音樂文件的用戶評論信息的分詞處理和關(guān)鍵詞提取,最終確定了維度值以后,可以將所有維度值劃分為多個維度。
其中,每個維度中除了包含通過圖2方法確定的維度值外,還可以包括采用其他方法(例如人工方法)確定的維度值。圖3是為音樂文件建立標簽值的方法流程圖。如圖3所示,該流程包括步驟301,對于任意需要建立標簽值的音樂文件,獲取該音樂文件的用戶評論信
肩、O
步驟302,將每個用戶對該音樂文件的所有評論信息進行分詞處理,過濾掉停用詞等無意義的詞,將過濾后的分詞結(jié)果與每個維度中的每個維度值進行匹配,將匹配上的維度值確定為該音樂文件的標簽值。通過步驟302,可以為音樂文件建立標簽值。圖4是音樂文件對應(yīng)標簽的數(shù)據(jù)庫結(jié)構(gòu)圖。參見圖4, Songl-songN為所有的歌曲列表,labell-labelM為songl對應(yīng)的若干標簽值,歌曲列表中每首歌曲都對應(yīng)一個標簽列表,Iabelinfol列表代表該標簽對應(yīng)所有的用戶及評論時間??梢?,音樂文件對應(yīng)標簽的數(shù)據(jù)庫包括音樂文件列表、每一音樂文件對應(yīng)的標簽值列表,每一音樂文件的每一標簽值對應(yīng)的用戶評論信息列表,該用戶評論信息列表包括根據(jù)其用戶評論為所述音樂文件建立了所述標簽值的所有用戶、以及每一用戶的所有所述用戶評論的最新評論時間。圖5是用戶對應(yīng)音樂文件標簽的數(shù)據(jù)庫結(jié)構(gòu)圖。參見圖5, Userl-UserN為所有的參與評論的用戶列表,labell-labelM為Userl對應(yīng)的若干標簽值,用戶列表中每個用戶都對應(yīng)一個標簽列表,其中l(wèi)abelinfo2對象列表代表該標簽對應(yīng)所有歌曲及評論時間??梢?,用戶對應(yīng)音樂文件標簽的數(shù)據(jù)庫包括用戶列表、每一用戶對應(yīng)的標簽值列表、以及每一用戶的每一標簽值對應(yīng)的音樂文件信息列表,該音樂文件信息列表包括根據(jù)所述用戶的用戶評論為其建立有所述標簽值的所有音樂文件的信息、以及根據(jù)所述用戶的用戶評論為每一音樂文件建立所述標簽值的最新時間。圖I所示方法中,所述根據(jù)搜索對象在標簽值上的權(quán)重,確定該標簽值對應(yīng)的用戶的權(quán)重,根據(jù)用戶的權(quán)重,確定搜索對象在該用戶對應(yīng)的標簽值上的權(quán)重,實際上是在用戶空間和搜索對象的標簽值空間之間建立一種制約關(guān)系,使得用戶的權(quán)重和標簽值的權(quán)重能夠相互影響,從而使得用戶權(quán)重和標簽值的權(quán)重能夠更加客觀而真實。具體地,所述根據(jù)搜索對象在標簽值上的權(quán)重,確定該標簽值對應(yīng)的用戶的權(quán)重,根據(jù)用戶的權(quán)重,確定搜索對象在該用戶對應(yīng)的標簽值上的權(quán)重可以包括根據(jù)搜索對象在用戶對應(yīng)的各個標簽值上的權(quán)重,建立該用戶的權(quán)重方程;根據(jù)標簽值對應(yīng)的各個用戶的權(quán)重,建立搜索對象在該標簽值上的權(quán)重方程;通過求解包括所述用戶的權(quán)重方程和所述標簽值上的權(quán)重方程的方程組,確定用戶的權(quán)重,以及搜索對象在標簽值上的權(quán)重。其中,所述根據(jù)搜索對象在用戶對應(yīng)的各個標簽值上的權(quán)重,建立該用戶的權(quán)重方程包括根據(jù)搜索對象Si在維度Clj的維度值Vk上的權(quán)重SiCljvk,以及根據(jù)其用戶評論為搜索對象Si建立維度dj的維度值Vk的用戶的個數(shù)count_voteijk,確定用戶Uu在搜索對象Si的維度Clj的維度值Vk上的權(quán)重系數(shù)為SiDjV1^average = SiCljVk/ count_voteiJk遍歷用戶Uu在每個搜索對象的每個維度的每個維度值上的權(quán)重系數(shù),得到該用戶
Uu 的權(quán)重方程為
權(quán)利要求
1.一種信息搜索方法,其特征在于,該方法包括 根據(jù)用戶針對搜索對象的行為信息,為搜索對象建立標簽值; 根據(jù)搜索對象在標簽值上的權(quán)重,確定該標簽值對應(yīng)的用戶的權(quán)重,根據(jù)用戶的權(quán)重,確定搜索對象在該用戶對應(yīng)的標簽值上的權(quán)重,其中,用戶與根據(jù)該用戶的行為信息為搜索對象建立的標簽值對應(yīng); 根據(jù)搜索對象在標簽值上的權(quán)重,確定搜索結(jié)果。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述用戶針對搜索對象的行為信息包括用戶評論,所述根據(jù)用戶針對搜索對象的行為信息,為搜索對象建立標簽值包括 預(yù)先確定一個或多個維度、以及每個維度包括的維度值,遍歷所有維度的所有維度值,將用戶對搜索對象的用戶評論與每個維度的每個維度值進行匹配,將匹配成功的維度值確定為該搜索對象的標簽值。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述預(yù)先確定一個或多個維度、以及每個維度包括的維度值包括 從網(wǎng)絡(luò)上獲取用戶評論,提取同一用戶對同一搜索對象的所有用戶評論的關(guān)鍵詞,根據(jù)關(guān)鍵詞的出現(xiàn)次數(shù),選擇出現(xiàn)次數(shù)滿足預(yù)定條件的關(guān)鍵詞,將選出的關(guān)鍵詞確定為維度值,將確定出的所有維度值劃分為一個或多個維度。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,將匹配成功的維度值確定為該搜索對象的標簽值之后,該方法還包括 建立所有搜索對象對應(yīng)標簽的數(shù)據(jù)庫,以及所有用戶對應(yīng)標簽的數(shù)據(jù)庫,其中, 所有搜索對象對應(yīng)標簽的數(shù)據(jù)庫包括搜索對象列表、每一搜索對象對應(yīng)的標簽值列表,每一搜索對象的每一標簽值對應(yīng)的用戶評論信息列表,該用戶評論信息列表包括根據(jù)其用戶評論為所述搜索對象建立了所述標簽值的所有用戶、以及每一用戶的所有所述用戶評論的最新評論時間; 所有用戶對應(yīng)標簽的數(shù)據(jù)庫包括用戶列表、每一用戶對應(yīng)的標簽值列表、以及每一用戶的每一標簽值對應(yīng)的搜索對象信息列表,該搜索對象信息列表包括根據(jù)所述用戶的用戶評論為其建立有所述標簽值的所有搜索對象、以及根據(jù)所述用戶的用戶評論為每一搜索對象建立所述標簽值的最新時間。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)搜索對象在標簽值上的權(quán)重,確定該標簽值對應(yīng)的用戶的權(quán)重,根據(jù)用戶的權(quán)重,確定搜索對象在該用戶對應(yīng)的標簽值上的權(quán)重包括 根據(jù)搜索對象在用戶對應(yīng)的各個標簽值上的權(quán)重,建立該用戶的權(quán)重方程; 根據(jù)標簽值對應(yīng)的各個用戶的權(quán)重,建立搜索對象在該標簽值上的權(quán)重方程; 通過求解包括所述用戶的權(quán)重方程和所述標簽值上的權(quán)重方程的方程組,確定用戶的權(quán)重,以及搜索對象在標簽值上的權(quán)重。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)搜索對象在用戶對應(yīng)的各個標簽值上的權(quán)重,建立該用戶的權(quán)重方程包括 根據(jù)搜索對象Si在維度&的維度值Vk上的權(quán)重Sid#k,以及根據(jù)其用戶評論為搜索對象Si建立維度dj的維度值Vk的用戶的個數(shù)count_voteijk,確定用戶Uu在搜索對象Si的維度Clj的維度值Vk上的權(quán)重系數(shù)為SiDjVk-average = SiCijVk/count_voteijk, 遍歷用戶Uu在每個搜索對象的每個維度的每個維度值上的權(quán)重系數(shù),得到該用戶Uu的權(quán)重方程為
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述根據(jù)標簽值對應(yīng)的各個用戶的權(quán)重,建立搜索對象在該標簽值上的權(quán)重方程包括 遍歷根據(jù)其用戶評論為所述搜索對象建立了所述標簽值的所有用戶,根據(jù)所述所有用戶中每個用戶在所述搜索對象的所述標簽值上的權(quán)重系數(shù)Ui/countM,得到所述所有用戶的所述權(quán)重系數(shù)Ui/countM的累加和,其中,Ui是用戶的權(quán)重,countM是所述搜索對象的所有標簽值總數(shù); 確定所述標簽值所屬的維度,利用所述搜索對象在所述標簽值上得到的投票數(shù)countvotex,除以所述搜索對象在所述維度上得到的投票總數(shù)sum,將所得的結(jié)果確定為所有用戶對所述搜索對象在所述標簽值上的權(quán)重系數(shù),其中,所述搜索對象在所述標簽值上得到的投票數(shù),是根據(jù)其用戶評論,為所述搜索對象建立了所述標簽值的用戶的個數(shù),所述搜索對象在所述維度上得到的投票總數(shù),是所述搜索對象在所述維度上的所有標簽值上得到的投票數(shù)之和; 根據(jù)所述累加和、以及所述所有用戶對所述搜索對象在所述標簽值上的權(quán)重系數(shù),確定所述搜索對象在所述標簽值上的權(quán)重Score (ax)。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,確定所述搜索對象在所述標簽值上的權(quán)重 Score (ax)包括 將所述搜索對象在所述標簽值上的權(quán)重Scorebx),確定為所述累加和乘以所述所有用戶對所述搜索對象在所述標簽值上的權(quán)重系數(shù)所得的結(jié)果
9.根據(jù)權(quán)利要求7所述的方法,其特征在于,確定所述搜索對象在所述標簽值上的權(quán)重 Score (ax)包括 將所述搜索對象在所述標簽值上的權(quán)重Score (ax),確定為
10.根據(jù)權(quán)利要求I所述的方法,其特征在于,根據(jù)搜索對象在標簽值上的權(quán)重,確定搜索結(jié)果包括 當搜索關(guān)鍵字為一個標簽值時,根據(jù)各個搜索對象在該標簽值上的權(quán)重由大到小的順序返回搜索結(jié)果;和/或,當搜索關(guān)鍵字包括兩個以上的標簽值時,首先為各個搜索對象在每個作為搜索關(guān)鍵字的標簽值上的權(quán)重按照由小到大的順序排序,然后將每個搜索對象在各個作為搜索關(guān)鍵字的標簽值上的排序序號累加,得到每個搜索對象的綜合權(quán)重,根據(jù)各個搜索對象的綜合權(quán)重由大到小的順序返回搜索結(jié)果。
11.一種信息搜索系統(tǒng),其特征在于,該系統(tǒng)包括標簽值建立模塊、權(quán)重確定模塊和搜索模塊; 所述標簽值建立模塊,用于根據(jù)用戶針對搜索對象的行為信息,為搜索對象建立標簽值; 所述權(quán)重確定模塊,用于根據(jù)搜索對象在標簽值上的權(quán)重,確定該標簽值對應(yīng)的用戶的權(quán)重,根據(jù)用戶的權(quán)重,確定搜索對象在該用戶對應(yīng)的標簽值上的權(quán)重,其中,用戶與根據(jù)該用戶的行為信息為搜索對象建立的標簽值對應(yīng); 所述搜索模塊,用于根據(jù)搜索對象在標簽值上的權(quán)重,確定搜索結(jié)果。
12.根據(jù)權(quán)利要求11所述的系統(tǒng),其特征在于, 所述標簽值建立模塊,用于根據(jù)預(yù)先確定的一個或多個維度、以及每個維度包括的維度值,遍歷所有維度的所有維度值,將用戶對搜索對象的用戶評論與每個維度的每個維度值進行匹配,將匹配成功的維度值確定為該搜索對象的標簽值。
13.根據(jù)權(quán)利要求12所述的系統(tǒng),其特征在于,所述標簽值建立模塊包括維度建立模塊和維度值匹配模塊; 所述維度建立模塊,用于從網(wǎng)絡(luò)上獲取用戶評論,提取同一用戶對同一搜索對象的所有用戶評論的關(guān)鍵詞,根據(jù)關(guān)鍵詞的出現(xiàn)次數(shù),選擇出現(xiàn)次數(shù)滿足預(yù)定條件的關(guān)鍵詞,將選出的關(guān)鍵詞確定為維度值,將確定出的所有維度值劃分為一個或多個維度; 所述維度值匹配模塊,用于遍歷所有維度的所有維度值,將用戶對搜索對象的用戶評論與每個維度的每個維度值進行匹配,將匹配成功的維度值確定為該搜索對象的標簽值。
14.根據(jù)權(quán)利要求12所述的系統(tǒng),其特征在于,該系統(tǒng)還包括所有搜索對象對應(yīng)標簽的數(shù)據(jù)庫,以及所有用戶對應(yīng)標簽的數(shù)據(jù)庫,其中, 所有搜索對象對應(yīng)標簽的數(shù)據(jù)庫包括搜索對象列表、每一搜索對象對應(yīng)的標簽值列表,每一搜索對象的每一標簽值對應(yīng)的用戶評論信息列表,該用戶評論信息列表包括根據(jù)其用戶評論為所述搜索對象建立了所述標簽值的所有用戶、以及每一用戶的所有所述用戶評論的最新評論時間; 所有用戶對應(yīng)標簽的數(shù)據(jù)庫包括用戶列表、每一用戶對應(yīng)的標簽值列表、以及每一用戶的每一標簽值對應(yīng)的搜索對象信息列表,該搜索對象信息列表包括根據(jù)所述用戶的用戶評論為其建立有所述標簽值的所有搜索對象、以及根據(jù)所述用戶的用戶評論為每一搜索對象建立所述標簽值的最新時間。
15.根據(jù)權(quán)利要求12所述的系統(tǒng),其特征在于, 所述權(quán)重確定模塊,用于根據(jù)搜索對象在用戶對應(yīng)的各個標簽值上的權(quán)重,建立該用戶的權(quán)重方程,根據(jù)標簽值對應(yīng)的各個用戶的權(quán)重,建立搜索對象在該標簽值上的權(quán)重方程,通過求解包括所述用戶的權(quán)重方程和所述標簽值上的權(quán)重方程的方程組,確定用戶的權(quán)重,以及搜索對象在標簽值上的權(quán)重。
16.根據(jù)權(quán)利要求11 15任一權(quán)利要求所述的系統(tǒng),其特征在于,所述搜索模塊,用于在搜索關(guān)鍵字為一個標簽值時,根據(jù)各個搜索對象在該標簽值上的權(quán)重由大到小的順序返回搜索結(jié)果,和/或,在搜索關(guān)鍵字包括兩個以上的標簽值時,為各個搜索對象在每個作為搜索關(guān)鍵字的標簽值上的權(quán)重按照由小到大的順序排序,將每個搜索對象在各個作為搜索關(guān)鍵字的標簽值上的排序序號累加,得到每個搜索對象的綜合權(quán)重,根據(jù)各 個搜索對象的綜合權(quán)重由大到小的順序返回搜索結(jié)果。
全文摘要
本發(fā)明實施例公開了一種信息搜索方法和系統(tǒng)。該方法包括根據(jù)用戶針對搜索對象的行為信息,為搜索對象建立標簽值;根據(jù)搜索對象在標簽值上的權(quán)重,確定該標簽值對應(yīng)的用戶的權(quán)重,根據(jù)用戶的權(quán)重,確定搜索對象在該用戶對應(yīng)的標簽值上的權(quán)重,其中,用戶與根據(jù)該用戶的行為信息為搜索對象建立的標簽值對應(yīng);根據(jù)搜索對象在標簽值上的權(quán)重,確定搜索結(jié)果。應(yīng)用本發(fā)明能夠提高信息搜索的準確性。
文檔編號G06F17/30GK102955813SQ20111025144
公開日2013年3月6日 申請日期2011年8月29日 優(yōu)先權(quán)日2011年8月29日
發(fā)明者簡勤, 郭正平, 王全禮, 楊俊拯, 鄭長松, 曾東, 廖勤耘 申請人:中國移動通信集團四川有限公司