欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種用于人物搜索的方法、裝置和計算機設(shè)備的制作方法

文檔序號:6525193閱讀:233來源:國知局
一種用于人物搜索的方法、裝置和計算機設(shè)備的制作方法
【專利摘要】本發(fā)明提供一種用于人物搜索的方法,其中,該方法包括以下步驟:獲取來自用戶的搜索序列;由所述搜索序列中獲取至少一個搜索分詞;基于所述至少一個搜索分詞獲得至少一個候選人物,其中,所述至少一個搜索分詞的全部或部分中的每個搜索分詞均能與一個候選人物的人物標(biāo)簽中的一個或多個匹配;根據(jù)各個候選人物的、與所述搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序;將排序后的候選人物提供給所述用戶。
【專利說明】一種用于人物搜索的方法、裝置和計算機設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計算機網(wǎng)絡(luò)領(lǐng)域,尤其涉及一種用于人物搜索的方法、裝置和計算機設(shè)備。
【背景技術(shù)】
[0002]現(xiàn)有技術(shù)中,當(dāng)用戶需要搜素人物時,其多通過通用搜索引擎,輸入用于搜索人物的關(guān)鍵詞,并在搜索結(jié)果中查找其希望獲得的信息。然而,由于現(xiàn)有技術(shù)的通用搜索引擎缺乏針對人物搜索的處理,故現(xiàn)有技術(shù)的搜索引擎無法提供較好的人物搜索結(jié)果,如其往往會提供大量的、用戶可能不需要的或不準(zhǔn)確的信息。例如,搜索引擎往往會提供大量的、并非針對人物的搜索結(jié)果,使得用戶需要在海量結(jié)果中查詢其需要的人物信息;又例如,搜索引擎可能提供錯誤的人物信息,因為互聯(lián)網(wǎng)中往往由于諸如惡作劇、惡意標(biāo)注、自我標(biāo)榜等因素而使得人物介紹與人物不符,如一個普通人可以標(biāo)榜其為全國著名的心臟病專家并被搜索引擎提供給用戶;再例如,一些專業(yè)人物可能僅在小眾網(wǎng)站或社區(qū)中活動,使得其難以被搜索弓I擎挖掘出并提供給用戶等。

【發(fā)明內(nèi)容】

[0003]本發(fā)明的目的是提供一種用于搜索人物的方法、裝置和計算機設(shè)備。
[0004]根據(jù)本發(fā)明的一個方面,提供一種用于搜索人物的方法,其中,該方法包括以下步驟:
[0005]a獲取來自用戶的搜索序列;
[0006]b由所述搜索序列中獲取至少一個搜索分詞;
[0007]c基于所述至少一個搜索分詞獲得至少一個候選人物,其中,所述至少一個搜索分詞的全部或部分中的每個搜索分詞均能與一個候選人物的人物標(biāo)簽中的一個或多個匹配;
[0008]d根據(jù)各個候選人物的、與所述搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序;
[0009]e將排序后的候選人物提供給所述用戶。
[0010]根據(jù)本發(fā)明的另一個方面,還提供了一種用于搜索人物的搜索裝置,其中,該搜索裝置包括:
[0011]第一獲取裝置,用于獲取來自用戶的搜索序列;
[0012]第二獲取裝置,用于由所述搜索序列中獲取至少一個搜索分詞;
[0013]第一確定裝置,用于基于所述至少一個搜索分詞獲得至少一個候選人物,其中,所述至少一個搜索分詞的全部或部分中的每個搜索分詞均能與一個候選人物的人物標(biāo)簽中的一個或多個匹配;
[0014]排序裝置,用于根據(jù)各個候選人物的、與所述搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序;[0015]提供裝置,用于將排序后的候選人物提供給所述用戶。
[0016]與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點:I)能夠針對人物進(jìn)行檢索,并能夠基于與搜索序列匹配的人物標(biāo)簽的權(quán)重,來對候選人物進(jìn)行排序,從而使得人物檢索結(jié)果的可靠度較高;2)可以結(jié)合人物的社區(qū)網(wǎng)絡(luò)活動或者個人信息來確定其人物標(biāo)簽的權(quán)重信息,從而進(jìn)一步確保了基于人物標(biāo)簽的搜索和排序的準(zhǔn)確性;3)能夠在通用搜索引擎中實現(xiàn)人物搜索,從而能夠?qū)崿F(xiàn)跨網(wǎng)絡(luò)社區(qū)的人物搜索功能;4)通過與人物相關(guān)聯(lián)的其他人物以及人物自身所發(fā)布的內(nèi)容來為該人物更新標(biāo)簽,使得人物的標(biāo)簽?zāi)芨行У?、更完整的反?yīng)人物的特征,且通過人物標(biāo)簽的添加、刪除以及更改等操作使得人物標(biāo)簽?zāi)軌蚋鼫?zhǔn)確的反應(yīng)人物當(dāng)前所具有的特征,減少了在人物搜索中出現(xiàn)人物遺漏或者人物標(biāo)簽不準(zhǔn)確的情況,從而使得人物搜索的搜索結(jié)果更加全面,也更加符合用戶的搜索條件。
【專利附圖】

【附圖說明】
[0017]通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點將會變得更明顯:
[0018]圖1為本發(fā)明一個實施例的用于搜索人物的方法流程示意圖;
[0019]圖2為本發(fā)明另一個實施例的用于搜索人物的方法流程示意圖;
[0020]圖3為本發(fā)明另一個實施例的用于搜索人物的方法流程示意圖;
[0021]圖4為本發(fā)明一個實施例的用于搜索人物的搜索裝置的結(jié)構(gòu)示意圖;
[0022]圖5為本發(fā)明另一個實施例的用于搜索人物的搜索裝置的結(jié)構(gòu)示意圖;
[0023]圖6為本發(fā)明另一個實施例的用于搜索人物的搜索裝置的結(jié)構(gòu)示意圖。
[0024]附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。
【具體實施方式】
[0025]下面結(jié)合附圖對本發(fā)明作進(jìn)一步詳細(xì)描述。
[0026]圖1為本發(fā)明一個實施例的用于搜索人物的方法流程示意圖。其中,本實施例的方法主要通過計算機設(shè)備來實現(xiàn);所述計算機設(shè)備包括網(wǎng)絡(luò)設(shè)備和用戶設(shè)備;所述網(wǎng)絡(luò)設(shè)備包括但不限于單個網(wǎng)絡(luò)服務(wù)器、多個網(wǎng)絡(luò)服務(wù)器組成的服務(wù)器組或基于云計算(CloudComputing)的由大量計算機或網(wǎng)絡(luò)服務(wù)器構(gòu)成的云,其中,云計算是分布式計算的一種,由一群松散耦合的計算機集組成的一個超級虛擬計算機;所述用戶設(shè)備可包括但不限于PC機、平板電腦、智能手機、PDA、IPTV等;所述計算機設(shè)備所處的網(wǎng)絡(luò)包括但不限于互聯(lián)網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、VPN網(wǎng)絡(luò)等。
[0027]需要說明的是,所述網(wǎng)絡(luò)設(shè)備、用戶設(shè)備和網(wǎng)絡(luò)僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的計算設(shè)備或網(wǎng)絡(luò)如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并以引用方式包含于此。
[0028]根據(jù)本實施例的方法包括步驟S1、步驟S2、步驟S3、步驟S4和步驟S5。優(yōu)選地,根據(jù)本實施例的方法可在通用搜索引擎中實現(xiàn),該通用搜索引擎能夠獲得跨網(wǎng)絡(luò)社區(qū)的人物信息。
[0029]在步驟SI中,計算機設(shè)備獲取來自用戶的搜索序列。
[0030]其中,計算機設(shè)備獲取來自用戶的搜索序列的方式包括但不限于:[0031]I)計算機設(shè)備為直接與用戶交互的用戶設(shè)備,則計算機設(shè)備直接獲取用戶輸入的搜索序列。
[0032]例如,計算機設(shè)備為PC機,PC機直接獲得用戶直接在其瀏覽器搜索輸入框中輸入的搜索序列。
[0033]2)計算機設(shè)備通過其他計算機設(shè)備獲取用戶輸入的搜索序列。
[0034]例如,計算機設(shè)備為網(wǎng)絡(luò)設(shè)備,用戶在用戶設(shè)備的瀏覽器搜索輸入框中輸入搜索序列,用戶設(shè)備將該搜索序列通過網(wǎng)絡(luò)提供給網(wǎng)絡(luò)設(shè)備,網(wǎng)絡(luò)設(shè)備通過網(wǎng)絡(luò)獲取該搜索序列。
[0035]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何獲取來自用戶的搜索序列的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0036]在步驟S2中,計算機設(shè)備由所述搜索序列中獲取至少一個搜索分詞。
[0037]具體地,計算機設(shè)備可采用多種方式,從搜索序列中獲取至少一個搜索分詞。
[0038]如作為步驟S2的一種優(yōu)選方式,步驟S2進(jìn)一步包括步驟S201和步驟S202。
[0039]在步驟S201中,計算機設(shè)備對所述搜索序列進(jìn)行分詞,獲得分詞列表。
[0040]例如,計算機設(shè)備在步驟SI中獲得來自用戶的搜索序列“經(jīng)濟類的律師”,計算機設(shè)備根據(jù)語義分析以及預(yù)定分詞詞庫,對該搜索序列進(jìn)行分詞,獲取分詞列表包含“經(jīng)濟類”、“的”以及“律師”的分詞列表。
[0041]在步驟S202中,計算機設(shè)備從所述分詞列表中選擇重要分詞,作為所述至少一個搜索分詞。其中,計算機設(shè)備可通過多種方式來確定分詞列表中的分詞是否為重要分詞;例如計算機設(shè)備可通過將分詞列表中`的分詞與預(yù)定分詞詞庫中的分詞匹配,和/或,基于對搜索序列的語義分析、對分詞列表中的分詞本身的語義分析以及基于分詞列表中的分詞在搜索序列中的語法位置分析等,來確定分詞列表中的分詞是否為重要分詞。
[0042]例如,在步驟S201中,計算機設(shè)備通過對搜索序列“經(jīng)濟類的律師”進(jìn)行分詞,獲得分詞列表,其中包含的分詞為“經(jīng)濟類”、“的”以及“律師”;在步驟S202中,計算機設(shè)備將分詞列表中的分詞與預(yù)定分詞詞庫中的分詞進(jìn)行匹配,并根據(jù)匹配結(jié)果選擇重要分詞“經(jīng)濟類”和“律師”,作為搜索序列“經(jīng)濟類的律師”所對應(yīng)的兩個搜索分詞。
[0043]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何對所述搜索序列進(jìn)行分詞,獲得分詞列表,并從所述分詞列表中選擇重要分詞,作為所述至少一個搜索分詞的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0044]又如作為步驟S2的另一種優(yōu)選方式,步驟S2包括步驟S2’。
[0045]在步驟S2’中,計算機設(shè)備對所述搜索序列進(jìn)行分詞,獲得所述至少一個搜索分
ο
[0046]其中,計算機設(shè)備對搜索序列進(jìn)行的分詞的操作,考慮以下至少一項因素:
[0047]I)所述搜索序列的不同分詞結(jié)果的語義差別。
[0048]優(yōu)選地,計算機設(shè)備選擇語義歧義更小的分詞方式。如若搜索序列中的一個短語在進(jìn)一步被劃分后獲得的多個子短語中存在與該短語的語義區(qū)別較大的子短語,則選擇該完整的短語作為一個分詞,且不選擇該短語的子短語作為分詞。又如搜索序列中多個互相不包含的短語能夠產(chǎn)生多種組合時,選擇組合后與搜索序列語義差別更小的組合方式等。需要說明的是,搜索序列可直接為一個短語。
[0049]例如,搜索序列包含短語“蘋果手機”,該短語在進(jìn)一步被劃分后獲得的多個子短語為“蘋果”和“手機”,則計算機設(shè)備通過查詢預(yù)確定的短語類別,確定短語“蘋果手機”的主要類別為“手機”,并確定該短語的子短語“蘋果”的主要類別包括“水果”和“手機”,子短語“手機”的主要類別為“手機”,則計算機設(shè)備判斷“蘋果手機”在進(jìn)一步被劃分后獲得的多個子短語中存在與該短語的語義區(qū)別較大的子短語“蘋果”,則計算機設(shè)備選擇短語“蘋果手機”作為一個分詞,且不選擇該短語的子短語“蘋果”和“手機”作為分詞。
[0050]2)所述搜索序列與預(yù)定分詞詞庫的匹配結(jié)果。
[0051]優(yōu)選地,當(dāng)以較小的粒度進(jìn)行分詞獲得的短語不能在預(yù)定分詞詞庫中獲得與之相匹配的詞匯時,優(yōu)先選擇以較大的粒度進(jìn)行分詞所得的短語。如若搜索序列中的一個短語在進(jìn)一步細(xì)分后獲得的多個子短語中存在不屬于預(yù)定分詞詞庫的子短語,則直接選擇該短語,而不選擇該短語的子短語,作為分詞。
[0052]例如,搜索序列中的一個短語為“魔獸霍華德”,該短語分詞后獲得子短語“魔獸”和“霍華德”,然而在預(yù)定分詞詞庫中,不具有分詞“霍華德”,則直接將“魔獸霍華德”作為一個搜索分詞。
[0053]需要說明的是,在步驟S201中,可參考上述因素進(jìn)行分詞操作。
[0054]需要說明的是,計算機設(shè)備獲得的搜索分詞可部分重疊,例如,搜索序列“魔戒作者托爾金”可具有3個搜索分詞“魔戒作者托爾金”、“魔戒作者”和“托爾金”。
[0055]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何對所述搜索序列進(jìn)行分詞,獲得所述至少一個搜索分詞的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0056]需要說明的是,上述所舉多種優(yōu)選方式僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何由搜索序列中獲取至少一個搜索分詞的實現(xiàn)方式,如直接通過將搜索序列與一個預(yù)定詞庫進(jìn)行匹配,并搜索序列中能夠與該預(yù)定詞庫中的詞匯匹配的短語直接作為搜索分詞等,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0057]在步驟S3中,計算機設(shè)備基于在步驟S2中獲得的至少一個搜索分詞獲得至少一個候選人物,其中,所述至少一個搜索分詞的全部或部分中的每個搜索分詞均能與一個候選人物的人物標(biāo)簽中的一個或多個匹配。例如,搜索序列的各個搜索分詞中的每個搜索分詞,均能在任意一個候選人物的人物標(biāo)簽中獲得匹配;又例如,搜索序列的各個搜索分詞中的重要搜索分詞,均能在任意一個候選人物的人物標(biāo)簽中獲得匹配等。其中,一個搜索分詞可與一個或多個人物標(biāo)簽匹配。
[0058]其中,所述候選人物可為實際的自然人,如一個明星;也可為虛擬人物,如一個法人組織。
[0059]具體地,計算機設(shè)備可采用多種方式,來獲得至少一個候選人物。例如,計算機設(shè)備可先從各個搜索分詞中獲得重要搜索分詞,再基于重要搜索分詞,來確定至少一個候選人物;其中,每個重要搜索分詞均能與任意一個候選人物的人物標(biāo)簽中的一個或多個匹配。其中,計算機設(shè)備獲得重要搜索分詞的方式,與前述參照步驟S202中計算機設(shè)備獲得重要分詞的方式相同或相似,在此不再贅述。[0060]作為步驟S3的一種優(yōu)選方式,步驟S3進(jìn)一步包括步驟S31和步驟S32。
[0061]在步驟S31中,計算機設(shè)備獲取與所述至少一個搜索分詞中的每個搜索分詞所匹配的人物列表。
[0062]具體地,對于每個搜索分詞,計算機設(shè)備將該搜索分詞與各個人物列表對應(yīng)的人物標(biāo)簽匹配,并將能夠匹配的人物標(biāo)簽對應(yīng)的人物列表,作為該搜索分詞所匹配的人物列表。優(yōu)選地,當(dāng)一個搜索分詞能夠與多個人物標(biāo)簽相匹配時,選擇匹配度最高的人物標(biāo)簽所對應(yīng)的人物列表,作為該搜索分詞所匹配的人物列表。其中,一個人物標(biāo)簽對應(yīng)的人物列表中的每個人物,均具有該人物標(biāo)簽;例如,若人物標(biāo)簽“醫(yī)生”所對應(yīng)的人物列表中具有245個人物,則該等245個人物中的每個人物,均具有人物標(biāo)簽“醫(yī)生”。
[0063]例如,計算機設(shè)備在步驟S2中獲得搜索序列的2個搜索分詞“外科”和“醫(yī)生”;則對于搜索分詞“醫(yī)生”,計算機設(shè)備將該搜索分詞與各個人物列表對應(yīng)的人物標(biāo)簽進(jìn)行匹配,獲得與人物標(biāo)簽“醫(yī)生”對應(yīng)的人物列表,作為搜索分詞“醫(yī)生”所匹配的人物列表;對于搜索分詞“外科”,計算機設(shè)備同樣執(zhí)行上述步驟,獲得其所匹配的人物列表。
[0064]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何獲取與所述至少一個搜索分詞中的每個搜索分詞所匹配的人物列表的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0065]在步驟S32中,計算機設(shè)備確定在所有匹配獲得的人物列表中均存在的人物,作為所述至少一個候選人物。
[0066]例如,計算機設(shè)備在步驟S2中獲取搜索分詞“外科”和“醫(yī)生”,在步驟S31中,計算機設(shè)備獲得搜索分詞“外科”對應(yīng)的人物列表Listl和搜索分詞“醫(yī)生”對應(yīng)的人物列表List2,其中,Listl中包含人物A、B、C、D和E,List2中包含人物A、B、E、F和G,則計算機設(shè)備確定Listl和List2中均存在人物A、B和E,并將人物A、B和E作為搜索序列的候選人物。
[0067]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何確定在所有匹配獲得的人物列表中均存在的人物,作為所述至少一個候選人物的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0068]在步驟S4中,計算機設(shè)備根據(jù)各個候選人物的、與所述搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序。其中,候選人物的人物標(biāo)簽的權(quán)重信息可由人工指定,或者,可由計算機設(shè)備確定;并且,由計算機設(shè)備確定權(quán)重信息的步驟,可在步驟S4執(zhí)行的過程中執(zhí)行,也可在步驟SI之前執(zhí)行。其中,計算機設(shè)備確定候選人物的人物標(biāo)簽的權(quán)重信息的方式將在后續(xù)優(yōu)選方案中予以詳述,在此不在贅述。其中,對于一個候選人物,其與搜索分詞匹配的人物標(biāo)簽的權(quán)重信息越高,則其排序較聞的可能性越聞。
[0069]具體地,計算機設(shè)備可采用多種方式來根據(jù)各個候選人物的、與所述搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序。
[0070]如在步驟S4的一個優(yōu)選方式中,步驟S4進(jìn)一步包括步驟S401和步驟S402。
[0071]在步驟S401中,計算機設(shè)備對所述至少一個候選人物中的每一個候選人物,根據(jù)該候選人物的、與所述至少一個搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,確定該候選人物與所述搜索序列相對應(yīng)的權(quán)重信息。[0072]例如,計算機設(shè)備在步驟S2中獲取的搜索分詞為“外科”和“醫(yī)生”,在步驟S3中獲得候選人物A、B和E,其中,候選人物A、B和E均具有人物標(biāo)簽“外科”和“醫(yī)生”。計算機設(shè)備獲得的候選人物A、B和E的權(quán)重信息如下:候選人物A的人物標(biāo)簽“外科”的權(quán)重值為WAl,人物標(biāo)簽“醫(yī)生”的權(quán)重值為WA2 ;候選人物B的人物標(biāo)簽“外科”的權(quán)重值為WBl,人物標(biāo)簽“醫(yī)生”的權(quán)重值為WB2 ;候選人物E的人物標(biāo)簽“外科”的權(quán)重值為WEl,人物標(biāo)簽“醫(yī)生”的權(quán)重值為WE2。計算機設(shè)備根據(jù)上述權(quán)重信息確定:候選人物A與搜索序列對應(yīng)的權(quán)重信息=WA1+WA2 ;候選人物B與搜索序列對應(yīng)的權(quán)重信息=WB1+WB2 ;候選人物E與搜索序列對應(yīng)的權(quán)重信息=WE1+WE2。
[0073]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何對所述至少一個候選人物中的每一個候選人物,根據(jù)該候選人物的、與所述至少一個搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,確定該候選人物與所述搜索序列相對應(yīng)的權(quán)重信息的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0074]在步驟S402中,計算機設(shè)備根據(jù)各個候選人物的權(quán)重信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序。
[0075]例如,計算機設(shè)備在步驟S3中獲得候選人物A、B和E。計算機設(shè)備在步驟S401中確定候選人物A的權(quán)重為95,候選人物B的權(quán)重為85,候選人物E的權(quán)重為92。在步驟S402中,計算機設(shè)備根據(jù)上述權(quán)重信息對候選人物按照權(quán)重從高至低進(jìn)行排序,獲得排序結(jié)果為:候選人物A,候選人物E,候選人物B。
[0076]需要說明的是,計算機設(shè)備可根據(jù)各個候選人物的權(quán)重信息,按照預(yù)定規(guī)則對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序。其中,所述預(yù)定規(guī)則用于確定可參與排序的候選人物或者可參與排序的候選人物的個數(shù)。
[0077]例如,預(yù)定規(guī)則包括對候選人物中權(quán)重超過預(yù)定權(quán)重閾值的候選人物進(jìn)行排序,且預(yù)定權(quán)重閾值為90,計算機設(shè)備在步驟S3中獲得候選人物A、B和E,且在步驟S401中確定候選人物A的權(quán)重為95,候選人物B的權(quán)重為85,候選人物E的權(quán)重為92。在步驟S402中,計算機設(shè)備對滿足該預(yù)定規(guī)則的候選人物A和E進(jìn)行排序,獲得排序結(jié)果為:候選人物A,候選人物E。
[0078]又例如,預(yù)定規(guī)則包括當(dāng)候選人物的數(shù)量超過100時,僅對其中的100個候選人物進(jìn)行排序。則計算機設(shè)備可先確定權(quán)重前100位的候選人物,再對該等100位候選人物進(jìn)行排序等。
[0079]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)各個候選人物的權(quán)重信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0080]需要說明的是,步驟S401和步驟S402并無嚴(yán)格的先后順序,計算機設(shè)備可在執(zhí)行步驟S401的同時執(zhí)行步驟S402,例如,計算機設(shè)備可在獲得一個候選人物的權(quán)重信息后,即根據(jù)其與其他候選人物的權(quán)重信息,將其插入適當(dāng)?shù)呐判蛭恢?,與此同時,計算機設(shè)備還執(zhí)行步驟S401,獲取另一個候選人物的權(quán)重信息。
[0081]又如在步驟S4的另一個優(yōu)選方式中,步驟S4進(jìn)一步包括步驟S4’。
[0082]在步驟S4’中,計算機設(shè)備根據(jù)各個候選人物的、與所述搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,并結(jié)合各個候選人物對應(yīng)的認(rèn)證信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序。
[0083]其中,對于一個候選人物,其與搜索分詞匹配的人物標(biāo)簽的權(quán)重信息越高,則其排序較聞的可能性越聞;其具有認(rèn)證?目息,則其排序較聞的可能性越聞。
[0084]具體地,計算機設(shè)備可采用多種方式,來根據(jù)各個候選人物的、與所述搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,并結(jié)合各個候選人物對應(yīng)的認(rèn)證信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序。
[0085]例如,對于每個候選人物,計算機設(shè)備可直接基于該候選人物的、與搜索分詞匹配的人物標(biāo)簽的權(quán)重信息以及該候選人物的認(rèn)證信息,計算該候選人物與搜索序列對應(yīng)的權(quán)重,并且,計算機設(shè)備根據(jù)各個候選人物與該搜索序列對應(yīng)的權(quán)重,來對各個候選人物中的全部或部分進(jìn)行排序。
[0086]并且,步驟S4’與步驟S401和S402可以相結(jié)合。例如:對所述至少一個候選人物中的每一個候選人物,計算機設(shè)備根據(jù)該候選人物的、與所述至少一個搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,確定該候選人物與所述搜索序列相對應(yīng)的權(quán)重信息,并根據(jù)各個候選人物的權(quán)重信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序;接著,計算機設(shè)備根據(jù)各個候選人物是否具有認(rèn)證信息,來提高具有認(rèn)證信息的候選人物的排序,并降低不具有認(rèn)證信息的候選人物的排序。又例如,對所述至少一個候選人物中的每一個候選人物,計算機設(shè)備根據(jù)該候選人物的、與所述至少一個搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,確定該候選人物與所述搜索序列相對應(yīng)的權(quán)重信息,并且,計算機設(shè)備根據(jù)各個候選人物是否具有認(rèn)證信息,來對各個候選人物的權(quán)重信息進(jìn)行加權(quán);并且,計算機設(shè)備根據(jù)加權(quán)后的權(quán)重信息,來對至少一個候選人物中的全部或部分候選人物進(jìn)行排序等。
[0087]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)各個候選人物的、與所述搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,并結(jié)合各個候選人物對應(yīng)的認(rèn)證信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0088]需要說明的是,步驟S3和步驟S4并無嚴(yán)格的先后順序,計算機設(shè)備可在執(zhí)行步驟S3并獲得候選人物的同時,執(zhí)行步驟S4來對已獲得的候選人物進(jìn)行排序。
[0089]在步驟S5中,計算機設(shè)備將排序后的候選人物提供給所述用戶。
[0090]優(yōu)選地,計算機設(shè)備將排序后的候選人物提供給所述用戶的同時,可將候選人物中的附加信息一并提供給用戶,其中,所述附加信息可包括該候選人物的描述信息。
[0091]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何將排序后的候選人物提供給所述用戶的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0092]作為本實施例的一種優(yōu)選方案,計算機設(shè)備根據(jù)以下至少一項因素,確定人物的人物標(biāo)簽的權(quán)重信息:
[0093]I)具有該人物標(biāo)簽的其他人物對該人物的關(guān)注程度。
[0094]其中,所述具有該人物標(biāo)簽的其他人物對該人物的關(guān)注程度可基于以下因素確定:具有該人物標(biāo)簽的其他人物關(guān)注或轉(zhuǎn)發(fā)該人物發(fā)布的內(nèi)容的數(shù)量、關(guān)注該人物且具有該人物標(biāo)簽的其他人物的數(shù)量等。
[0095]例如,人物A具有“律師”標(biāo)簽,可根據(jù)關(guān)注人物A的其他人物中具有“律師”標(biāo)簽的人物的數(shù)量,和/或,具有“律師”標(biāo)簽的人物轉(zhuǎn)發(fā)該人物A發(fā)布的貼子的數(shù)量等,來確定人物A的“律師”標(biāo)簽的權(quán)重信息。
[0096]2)該人物對具有該人物標(biāo)簽的其他人物的關(guān)注程度。
[0097]其中,該人物對具有該人物標(biāo)簽的其他人物的關(guān)注程度可基于以下因素確定:該人物關(guān)注的具有該人物標(biāo)簽的其他人物的數(shù)量、該人物轉(zhuǎn)發(fā)的、具有該人物標(biāo)簽的其他人物發(fā)布的內(nèi)容的數(shù)量。
[0098]例如,人物A具有“律師”標(biāo)簽,根據(jù)人物A關(guān)注的其他人物中具有“律師”標(biāo)簽的人物的數(shù)量,和/或,人物A轉(zhuǎn)發(fā)的、具有“律師”標(biāo)簽的其他人物發(fā)布的內(nèi)容的數(shù)量,來確定人物A的“律師”標(biāo)簽的權(quán)重信息。
[0099]3)該人物發(fā)布的、具有該人物標(biāo)簽的特征的內(nèi)容的數(shù)量。
[0100]其中,計算機設(shè)備可通過解析該人物發(fā)布的內(nèi)容來確定該內(nèi)容是否具有該人物標(biāo)簽的特征。
[0101]例如,可通過解析該人物發(fā)布的內(nèi)容中是否包含具有該人物標(biāo)簽的特征的短語等,來確定該內(nèi)容是否具有該人物標(biāo)簽的特征。
[0102]4)該人物發(fā)布的、具有該人物標(biāo)簽的特征的內(nèi)容被其他人物關(guān)注的程度。其中,可通過分析人物發(fā)布的內(nèi)容來確定該內(nèi)容是否具有該人物標(biāo)簽的特征。
[0103]例如,根據(jù)人物A發(fā)布的、具有“律師”標(biāo)簽的特征的內(nèi)容被其他人物轉(zhuǎn)發(fā)或標(biāo)記的數(shù)量,確定人物A的“律師”標(biāo)簽的權(quán)重信息。
[0104]5)該人物對其他人物發(fā)布的、具有該人物標(biāo)簽的特征的內(nèi)容的關(guān)注程度。
[0105]例如,根據(jù)人物A對其他人物發(fā)布的、具有“律師”標(biāo)簽的特征的內(nèi)容進(jìn)行轉(zhuǎn)發(fā)或標(biāo)記的數(shù)量,確定人物A的“律師”標(biāo)簽的權(quán)重信息。
[0106]6)該人物是否具有與該人物標(biāo)簽對應(yīng)的認(rèn)證信息。
[0107]其中,該認(rèn)證信息包括任何能夠用于認(rèn)證該人物的真實性的信息。如認(rèn)證信息可包括但不限于:職業(yè)認(rèn)證信息,如律師證信息、醫(yī)生執(zhí)業(yè)證信息、教師資格證信息等;該人物所屬工作單位信息,如醫(yī)生所在的醫(yī)院信息、律師所在的律師事務(wù)所信息等;身份認(rèn)證信息,如實名認(rèn)證信息等。優(yōu)選地,一個人物可具有多個認(rèn)證信息,且各個認(rèn)證信息可對應(yīng)不同的人物標(biāo)簽,則當(dāng)該人物作為候選人物被排序時,可僅考慮與搜索分詞匹配的人物標(biāo)簽對應(yīng)的認(rèn)證信息。
[0108]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何確定人物的人物標(biāo)簽的權(quán)重信息的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0109]根據(jù)本實施例的方案,能夠針對人物進(jìn)行檢索,并能夠基于與搜索序列匹配的人物標(biāo)簽的權(quán)重,來對候選人物進(jìn)行排序,從而使得人物檢索結(jié)果的可靠度較高;優(yōu)選地,本實施例可以結(jié)合人物的社區(qū)網(wǎng)絡(luò)活動或者個人信息來確定其人物標(biāo)簽的權(quán)重信息,從而進(jìn)一步確保了基于人物標(biāo)簽的搜索和排序的準(zhǔn)確性;優(yōu)選地,本實施例的方案能夠在通用搜索引擎中實現(xiàn)人物搜索,從而能夠?qū)崿F(xiàn)跨網(wǎng)絡(luò)社區(qū)的人物搜索功能。
[0110]圖2為本發(fā)明另一個實施例的用于搜索人物的方法流程示意圖。
[0111]本實施例的方法主要由計算機設(shè)備實現(xiàn);其中,對參照圖1所示實施例中所述的計算機設(shè)備的任何說明,均以引用的方式包含于本實施例中。其中,本實施例的方法包括步驟S1、步驟S2、步驟S3、步驟S4、步驟S5和步驟S6。其中,步驟S1、步驟S2、步驟S3、步驟S4和步驟S5已在參照圖1中予以詳述,在此不再贅述。
[0112]在步驟S6中,計算機設(shè)備根據(jù)與一個人物相關(guān)聯(lián)的其他人物的人物標(biāo)簽和/或所述其他人物發(fā)布的內(nèi)容,更新所述人物的人物標(biāo)簽。
[0113]其中,所述與一個人物相關(guān)聯(lián)的其他人物包括與該人物存在網(wǎng)絡(luò)關(guān)系的其他人物;例如,該人物關(guān)注的其他人物、關(guān)注該人物的其他人物、與該人物具有好友關(guān)系的其他人物等。
[0114]其中,所述人物標(biāo)簽的更新包括但不限于人物標(biāo)簽的增加、修改和刪除等。
[0115]具體地,計算機設(shè)備根據(jù)與一個人物相關(guān)聯(lián)的其他人物的人物標(biāo)簽和/或所述其他人物發(fā)布的內(nèi)容,更新所述人物的人物標(biāo)簽的方式包括但不限于:
[0116]I)計算機設(shè)備直接根據(jù)與一個人物相關(guān)聯(lián)的其他人物的人物標(biāo)簽和/或所述其他人物發(fā)布的內(nèi)容,獲得一個或多個人物標(biāo)簽,并根據(jù)所獲得的人物標(biāo)簽,來更新該人物的人物標(biāo)簽。
[0117]其中,計算機設(shè)備可采用多種方式,來根據(jù)與一個人物相關(guān)聯(lián)的其他人物的人物標(biāo)簽和/或所述其他人物發(fā)布的內(nèi)容,獲得一個或多個人物標(biāo)簽。
[0118]例如,計算機設(shè)備統(tǒng)計與一個人物相關(guān)聯(lián)的其他人物的人物標(biāo)簽,并將出現(xiàn)數(shù)量的排序較高或出現(xiàn)的數(shù)量高于一個預(yù)定數(shù)量的人物標(biāo)簽,作為適用于該人物的人物標(biāo)簽。
[0119]又例如,對于一個其他人物的人物標(biāo)簽Tagl,計算機設(shè)備統(tǒng)計該人物標(biāo)簽Tagl在所有與該人物相關(guān)聯(lián)的其他人物的人物標(biāo)簽中出現(xiàn)的次數(shù),并結(jié)合該人物標(biāo)簽Tagl在大量的人物(如計算機設(shè)備的人物庫)的人物標(biāo)簽中出現(xiàn)的次數(shù),來確定該人物標(biāo)簽Tagl是否能夠表征與該人物相關(guān)聯(lián)的其他人物的特征,并將能夠表征特征的人物標(biāo)簽作為適用于所述更新的人物標(biāo)簽。其中,人物標(biāo)簽Tagl在與該人物相關(guān)聯(lián)的其他人物的人物標(biāo)簽中出現(xiàn)的次數(shù)越高,且在大量的人物(如計算機設(shè)備的人物庫)的人物標(biāo)簽中出現(xiàn)的次數(shù)越低,則人物標(biāo)簽Tagl的特征表征能力越強,越適用于更新操作;人物標(biāo)簽Tagl在與該人物相關(guān)聯(lián)的其他人物的人物標(biāo)簽中出現(xiàn)的次數(shù)越低,且在大量的人物(如計算機設(shè)備的人物庫)的人物標(biāo)簽中出現(xiàn)的次數(shù)越高,則人物標(biāo)簽Tagl的特征表征性能力弱,不適用于更新操作。
[0120]又例如,計算機設(shè)備根據(jù)與一個人物相關(guān)聯(lián)的其他人物發(fā)布的內(nèi)容,并根據(jù)該等內(nèi)容所具有的人物標(biāo)簽的特征,來確定一個或多個人物標(biāo)簽。如計算機設(shè)備根據(jù)一個人物相關(guān)聯(lián)的其他人物發(fā)布的內(nèi)容中出現(xiàn)大量的醫(yī)學(xué)專業(yè)詞匯,確定人物標(biāo)簽“醫(yī)生”等。
[0121]2)步驟S6進(jìn)一步包括步驟S61、步驟S62和步驟S63。
[0122]在步驟S61中,計算機設(shè)備根據(jù)與所述人物相關(guān)聯(lián)的其他人物的地址特征與網(wǎng)絡(luò)社交關(guān)系特征,將與所述人物相關(guān)聯(lián)的其他人物劃分為多個分組。
[0123]優(yōu)選地,所述地址特征包括網(wǎng)絡(luò)地址特征。例如,包括其他人物所使用的IP地址。
[0124]優(yōu)選地,所述網(wǎng)絡(luò)社交關(guān)系可包括任何在網(wǎng)絡(luò)社區(qū)中的關(guān)聯(lián)關(guān)系。例如,其他人物與該人物存在關(guān)注關(guān)系、其他人物與該人物存在好友關(guān)系、其他人物與該人物關(guān)注相同的人物等。
[0125]具體地,具有相同或相似的地址特征或網(wǎng)絡(luò)社交關(guān)系特征的其他人物,更容易被劃分為一組。例如,將IP地址相同或相近(如IP地址前3段相同)的其他人物劃分為一組;又例如,將與該人物存在關(guān)注關(guān)系或好友關(guān)系,且均關(guān)注同一個知名人物的其他人物劃分為一組等,其中,知名人物可通過其諸如粉絲數(shù)等因素確定。
[0126]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)與所述人物相關(guān)聯(lián)的其他人物的地址特征與網(wǎng)絡(luò)社交關(guān)系特征,將與所述人物相關(guān)聯(lián)的其他人物劃分為多個分組的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0127]在步驟S62中,計算機設(shè)備根據(jù)所述多個分組中全部或部分分組包含的所述其他人物的人物標(biāo)簽和/或所述其他人物發(fā)布的內(nèi)容,獲得一個或多個人物標(biāo)簽。其中,計算機設(shè)備根據(jù)每個分組包含的所述其他人物的人物標(biāo)簽和/或所述其他人物發(fā)布的內(nèi)容,獲得一個或多個人物標(biāo)簽的方式,與步驟S6的前述實現(xiàn)方式I)中,計算機設(shè)備直接根據(jù)與一個人物相關(guān)聯(lián)的其他人物的人物標(biāo)簽和/或所述其他人物發(fā)布的內(nèi)容,獲得一個或多個人物標(biāo)簽的方式相同或相似,在此不再贅述。
[0128]例如,在步驟S61中,計算機設(shè)備將與人物A相關(guān)聯(lián)的其他人物分為組Gl和組G2,在步驟S62中,計算機設(shè)備解析得到組Gl中90%的人物均具有“醫(yī)生”標(biāo)簽,且組Gl中的人物發(fā)布的內(nèi)容80%與“外科”有關(guān),則計算機設(shè)備獲得“醫(yī)生”標(biāo)簽和“外科”標(biāo)簽。
[0129]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)所述多個分組中全部或部分分組包含的所述其他人物的人物標(biāo)簽和/或所述其他人物發(fā)布的內(nèi)容,獲得一個或多個人物標(biāo)簽的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0130]在步驟S63中,計算機設(shè)備根據(jù)所述一個或多個人物標(biāo)簽,更新所述人物的人物標(biāo)簽。
[0131]例如,計算機設(shè)備在步驟S62中根據(jù)與人物A相關(guān)聯(lián)的其他人物獲得“醫(yī)生”標(biāo)簽和“外科”標(biāo)簽,而人物A不具有該兩個標(biāo)簽,則為人物A添加該兩個標(biāo)簽。
[0132]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)所述一個或多個人物標(biāo)簽,更新所述人物的人物標(biāo)簽的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0133]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)與一個人物相關(guān)聯(lián)的其他人物的人物標(biāo)簽和/或所述其他人物發(fā)布的內(nèi)容,更新所述人物的人物標(biāo)簽的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0134]跟據(jù)本實施例的方案,通過與人物相關(guān)聯(lián)的其他人物來為該人物更新標(biāo)簽,使得人物的標(biāo)簽?zāi)芨行У?、更完整的反?yīng)人物的特征,且通過人物標(biāo)簽的添加、刪除以及更改等操作使得人物標(biāo)簽?zāi)軌蚋鼫?zhǔn)確的反應(yīng)人物當(dāng)前所具有的特征,減少了在人物搜索中出現(xiàn)人物遺漏或者人物標(biāo)簽不準(zhǔn)確的情況,從而使得人物搜索的搜索結(jié)果更加全面,也更加符合用戶的搜索條件。
[0135]需要說明的是,為簡便起見,圖2中將步驟S6置于步驟SI之前,但本領(lǐng)域技術(shù)人員應(yīng)能理解,步驟S6與步驟SI至步驟S5并無先后順序。
[0136]圖3為本發(fā)明另一個實施例的用于搜索人物的方法流程示意圖。
[0137]本實施例的方法主要由計算機設(shè)備實現(xiàn);其中,對參照圖1所示實施例中所述的計算機設(shè)備的任何說明,均以引用的方式包含于本實施例中。其中,本實施例的方法包括步驟S1、步驟S2、步驟S3、步驟S4、步驟S5、步驟S7和步驟S8。其中,步驟S1、步驟S2、步驟S3、步驟S4和步驟S5已在參照圖1中予以詳述,在此不再贅述。
[0138]在步驟S7中,計算機設(shè)備根據(jù)所述人物發(fā)布的內(nèi)容,確定至少一個人物標(biāo)簽。
[0139]具體地,計算機設(shè)備根據(jù)人物發(fā)布的內(nèi)容,確定至少一個人物標(biāo)簽的方式,與前述步驟S6中計算機設(shè)備根據(jù)其他人物發(fā)布的內(nèi)容,確定至少一個人物標(biāo)簽的方式相同或相似。
[0140]例如,計算機設(shè)備對人物A發(fā)布的內(nèi)容中的每一個進(jìn)行解析,提取該內(nèi)容中的各個詞語出現(xiàn)的頻率,排除常用詞、語氣詞以及連接詞等,獲取出現(xiàn)頻率最高的多個詞語作為該內(nèi)容的關(guān)鍵詞,并通過語義分析來判斷該等關(guān)鍵詞對應(yīng)的人物標(biāo)簽為“醫(yī)生”標(biāo)簽。
[0141]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,根據(jù)所述人物發(fā)布的內(nèi)容,確定至少一個人物標(biāo)簽的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0142]在步驟S8中,計算機設(shè)備根據(jù)所述至少一個人物標(biāo)簽,更新所述人物的人物標(biāo)簽。
[0143]其中,計算機設(shè)備根據(jù)所述至少一個人物標(biāo)簽,更新所述人物的人物標(biāo)簽的方式,與前述步驟S63中計算機設(shè)備根據(jù)一個或多個人物標(biāo)簽,更新所述人物的人物標(biāo)簽的方式相同或相似,在此不再贅述。
[0144]需要說明的是,為簡便起見,圖3中將步驟S7和S8置于步驟SI之前,但本領(lǐng)域技術(shù)人員應(yīng)能理解,步驟S7和S8與步驟SI至步驟S5并無先后順序。
[0145]跟據(jù)本實施例的方案,人物的人物標(biāo)簽?zāi)軌蚋鶕?jù)人物的發(fā)布內(nèi)容進(jìn)行更新,使得人物的標(biāo)簽?zāi)芨行У摹⒏暾姆磻?yīng)人物的特征,且能夠通過人物自身發(fā)布的內(nèi)容,更準(zhǔn)確的反應(yīng)人物當(dāng)前所具有的特征,減少了在人物搜索中出現(xiàn)人物遺漏或者人物標(biāo)簽不準(zhǔn)確的情況,從而使得人物搜索的搜索結(jié)果更加全面,也更加符合用戶的搜索條件。
[0146]圖4為本發(fā)明一個實施例的用于搜索人物的搜索裝置的結(jié)構(gòu)示意圖。
[0147]本實施例的搜索裝置包括第一獲取裝置1、第二獲取裝置2、第一確定裝置3、排序裝置4和提供裝置5。優(yōu)選地,本實施例的搜索裝置可包括在計算機設(shè)備中。該計算機設(shè)備可實現(xiàn)通用搜索引擎的功能,該通用搜索引擎能夠獲得跨網(wǎng)絡(luò)社區(qū)的人物信息。
[0148]第一獲取裝置I獲取來自用戶的搜索序列。
[0149]其中,第一獲取裝置I獲取來自用戶的搜索序列的方式包括但不限于:
[0150]I)搜索裝置所在的計算機設(shè)備為直接與用戶交互的用戶設(shè)備,則第一獲取裝置I直接獲取用戶輸入的搜索序列。
[0151]例如,搜索裝置所在的計算機設(shè)備為PC機,第一獲取裝置I直接獲得用戶直接在PC機的瀏覽器搜索輸入框中輸入的搜索序列。
[0152]2)第一獲取裝置I通過其他計算機設(shè)備獲取用戶輸入的搜索序列。
[0153]例如,搜索裝置所在的計算機設(shè)備為網(wǎng)絡(luò)設(shè)備,用戶在用戶設(shè)備的瀏覽器搜索輸入框中輸入搜索序列,用戶設(shè)備將該搜索序列通過網(wǎng)絡(luò)提供給網(wǎng)絡(luò)設(shè)備,第一獲取裝置I通過網(wǎng)絡(luò)獲取該搜索序列。
[0154]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何獲取來自用戶的搜索序列的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0155]第二獲取裝置2由所述搜索序列中獲取至少一個搜索分詞。
[0156]具體地,第二獲取裝置2可采用多種方式,從搜索序列中獲取至少一個搜索分詞。
[0157]如作為第二獲取裝置2的一種優(yōu)選方式,第二獲取裝置2進(jìn)一步包括分詞裝置(圖未示出)和選擇裝置(圖未示出)。
[0158]分詞裝置對所述搜索序列進(jìn)行分詞,獲得分詞列表。
[0159]例如,第一獲取裝置I獲得來自用戶的搜索序列“經(jīng)濟類的律師”,分詞裝置根據(jù)語義分析以及預(yù)定分詞詞庫,對該搜索序列進(jìn)行分詞,獲取分詞列表包含“經(jīng)濟類”、“的”以及“律師”的分詞列表。
[0160]選擇裝置從所述分詞列表中選擇重要分詞,作為所述至少一個搜索分詞。其中,選擇裝置可通過多種方式來確定分詞列表中的分詞是否為重要分詞;例如選擇裝置可通過將分詞列表中的分詞與預(yù)定分詞詞庫中的分詞匹配,和/或,基于對搜索序列的語義分析、對分詞列表中的分詞本身的語義分析以及基于分詞列表中的分詞在搜索序列中的語法位置分析等,來確定分詞列表中的分詞是否為重要分詞。
[0161]例如,分詞裝置通過對搜索序列“經(jīng)濟類的律師”進(jìn)行分詞,獲得分詞列表,其中包含的分詞為“經(jīng)濟類”、“的”以及“律師”;選擇裝置將分詞列表中的分詞與預(yù)定分詞詞庫中的分詞進(jìn)行匹配,并根據(jù)匹配結(jié)果選擇重要分詞“經(jīng)濟類”和“律師”,作為搜索序列“經(jīng)濟類的律師”所對應(yīng)的兩個搜索分詞。
[0162]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何對所述搜索序列進(jìn)行分詞,獲得分詞列表,并從所述分詞列表中選擇重要分詞,作為所述至少一個搜索分詞的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0163]又如作為第二獲取裝置2的另一種優(yōu)選方式,第二獲取裝置2包括子獲取裝置(圖未示出)。
[0164]子獲取裝置對所述搜索序列進(jìn)行分詞,獲得所述至少一個搜索分詞。
[0165]其中,子獲取裝置對搜索序列進(jìn)行的分詞的操作,考慮以下至少一項因素:
[0166]I)所述搜索序列的不同分詞結(jié)果的語義差別。
[0167]優(yōu)選地,子獲取裝置選擇語義歧義更小的分詞方式。如若搜索序列中的一個短語在進(jìn)一步被劃分后獲得的多個子短語中存在與該短語的語義區(qū)別較大的子短語,則選擇該完整的短語作為一個分詞,且不選擇該短語的子短語作為分詞。又如搜索序列中多個互相不包含的短語能夠產(chǎn)生多種組合時,選擇組合后與搜索序列語義差別更小的組合方式等。需要說明的是,搜索序列可直接為一個短語。
[0168]例如,搜索序列包含短語“蘋果手機”,該短語在進(jìn)一步被劃分后獲得的多個子短語為“蘋果”和“手機”,則子獲取裝置通過查詢預(yù)確定的短語類別,確定短語“蘋果手機”的主要類別為“手機”,并確定該短語的子短語“蘋果”的主要類別包括“水果”和“手機”,子短語“手機”的主要類別為“手機”,則子獲取裝置判斷“蘋果手機”在進(jìn)一步被劃分后獲得的多個子短語中存在與該短語的語義區(qū)別較大的子短語“蘋果”,則子獲取裝置選擇短語“蘋果手機”作為一個分詞,且不選擇該短語的子短語“蘋果”和“手機”作為分詞。
[0169]2)所述搜索序列與預(yù)定分詞詞庫的匹配結(jié)果。[0170]優(yōu)選地,當(dāng)以較小的粒度進(jìn)行分詞獲得的短語不能在預(yù)定分詞詞庫中獲得與之相匹配的詞匯時,優(yōu)先選擇以較大的粒度進(jìn)行分詞所得的短語。如若搜索序列中的一個短語在進(jìn)一步細(xì)分后獲得的多個子短語中存在不屬于預(yù)定分詞詞庫的子短語,則直接選擇該短語,而不選擇該短語的子短語,作為分詞。
[0171 ] 例如,搜索序列中的一個短語為“魔獸霍華德”,該短語分詞后獲得子短語“魔獸”和“霍華德”,然而在預(yù)定分詞詞庫中,不具有分詞“霍華德”,則直接將“魔獸霍華德”作為一個搜索分詞。
[0172]需要說明的是,分詞裝置可參考上述因素進(jìn)行分詞操作。
[0173]需要說明的是,搜索裝置獲得的搜索分詞可部分重疊,例如,搜索序列“魔戒作者托爾金”可具有3個搜索分詞“魔戒作者托爾金”、“魔戒作者”和“托爾金”。
[0174]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何對所述搜索序列進(jìn)行分詞,獲得所述至少一個搜索分詞的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0175]需要說明的是,上述所舉多種優(yōu)選方式僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何由搜索序列中獲取至少一個搜索分詞的實現(xiàn)方式,如直接通過將搜索序列與一個預(yù)定詞庫進(jìn)行匹配,并搜索序列中能夠與該預(yù)定詞庫中的詞匯匹配的短語直接作為搜索分詞等,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0176]第一確定裝置3基于第二獲取裝置2獲得的至少一個搜索分詞獲得至少一個候選人物,其中,所述至少一個搜索分詞的全部或部分中的每個搜索分詞均能與一個候選人物的人物標(biāo)簽中的一個或多個匹配。例如,搜索序列的各個搜索分詞中的每個搜索分詞,均能在任意一個候選人物的人物標(biāo)簽中獲得匹配;又例如,搜索序列的各個搜索分詞中的重要搜索分詞,均能在任意一個候選人物的人物標(biāo)簽中獲得匹配等。其中,一個搜索分詞可與一個或多個人物標(biāo)簽匹配。
[0177]其中,所述候選人物可為實際的自然人,如一個明星;也可為虛擬人物,如一個法人組織。
[0178]具體地,第一確定裝置3可采用多種方式,來獲得至少一個候選人物。例如,第一確定裝置3可先從各個搜索分詞中獲得重要搜索分詞,再基于重要搜索分詞,來確定至少一個候選人物;其中,每個重要搜索分詞均能與任意一個候選人物的人物標(biāo)簽中的一個或多個匹配。其中,第一確定裝置3獲得重要搜索分詞的方式,與前述選擇裝置獲得重要分詞的方式相同或相似,在此不再贅述。
[0179]作為第一確定裝置3的一種優(yōu)選方式,第一確定裝置3進(jìn)一步包括步驟列表獲取裝置(圖未示出)和人物確定裝置(圖未示出)。
[0180]列表獲取裝置獲取與所述至少一個搜索分詞中的每個搜索分詞所匹配的人物列表。
[0181]具體地,對于每個搜索分詞,列表獲取裝置將該搜索分詞與各個人物列表對應(yīng)的人物標(biāo)簽匹配,并將能夠匹配的人物標(biāo)簽對應(yīng)的人物列表,作為該搜索分詞所匹配的人物列表。優(yōu)選地,當(dāng)一個搜索分詞能夠與多個人物標(biāo)簽相匹配時,選擇匹配度最高的人物標(biāo)簽所對應(yīng)的人物列表,作為該搜索分詞所匹配的人物列表。其中,一個人物標(biāo)簽對應(yīng)的人物列表中的每個人物,均具有該人物標(biāo)簽;例如,若人物標(biāo)簽“醫(yī)生”所對應(yīng)的人物列表中具有245個人物,則該等245個人物中的每個人物,均具有人物標(biāo)簽“醫(yī)生”。
[0182]例如,第二獲取裝置2獲得搜索序列的2個搜索分詞“外科”和“醫(yī)生”;則對于搜索分詞“醫(yī)生”,列表獲取裝置將該搜索分詞與各個人物列表對應(yīng)的人物標(biāo)簽進(jìn)行匹配,獲得與人物標(biāo)簽“醫(yī)生”對應(yīng)的人物列表,作為搜索分詞“醫(yī)生”所匹配的人物列表;對于搜索分詞“外科”,列表獲取裝置同樣執(zhí)行上述操作,獲得其所匹配的人物列表。
[0183]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何獲取與所述至少一個搜索分詞中的每個搜索分詞所匹配的人物列表的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0184]人物確定裝置確定在所有匹配獲得的人物列表中均存在的人物,作為所述至少一個候選人物。
[0185]例如,第二獲取裝置2獲取搜索分詞“外科”和“醫(yī)生”,列表獲取裝置獲得搜索分詞“外科”對應(yīng)的人物列表Listl和搜索分詞“醫(yī)生”對應(yīng)的人物列表List2,其中,Listl中包含人物A、B、C、D和E,List2中包含人物A、B、E、F和G,則人物確定裝置確定Listl和List2中均存在人物A、B和E,并將人物A、B和E作為搜索序列的候選人物。
[0186]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何確定在所有匹配獲得的人物列表中均存在的人物,作為所述至少一個候選人物的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0187]排序裝置4根據(jù)各個候選人物的、與所述搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序。其中,候選人物的人物標(biāo)簽的權(quán)重信息可由人工指定,或者,可由計算機設(shè)備確定;并且,由計算機設(shè)備確定權(quán)重信息的步驟,可在排序裝置4執(zhí)行操作的過程中執(zhí)行,也可在第一獲取裝置I之前執(zhí)行。其中,計算機設(shè)備確定候選人物的人物標(biāo)簽的權(quán)重信息的方式將在后續(xù)優(yōu)選方案中予以詳述,在此不在贅述。其中,對于一個候選人物,其與搜索分詞匹配的人物標(biāo)簽的權(quán)重信息越高,則其排序較高的可能性越高。
[0188]具體地,排序裝置4可采用多種方式來根據(jù)各個候選人物的、與所述搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序。
[0189]如在排序裝置4的一個優(yōu)選方式中,排序裝置4進(jìn)一步包括第一權(quán)重確定裝置(圖未示出)和第一子排序裝置(圖未示出)。
[0190]第一權(quán)重確定裝置對所述至少一個候選人物中的每一個候選人物,根據(jù)該候選人物的、與所述至少一個搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,確定該候選人物與所述搜索序列相對應(yīng)的權(quán)重信息。
[0191]例如,第二獲取裝置2獲取的搜索分詞為“外科”和“醫(yī)生”,第一確定裝置3獲得候選人物A、B和E,其中,候選人物A、B和E均具有人物標(biāo)簽“外科”和“醫(yī)生”。第一權(quán)重確定裝置獲得的候選人物A、B和E的權(quán)重信息如下:候選人物A的人物標(biāo)簽“外科”的權(quán)重值為WA1,人物標(biāo)簽“醫(yī)生”的權(quán)重值為WA2 ;候選人物B的人物標(biāo)簽“外科”的權(quán)重值為WBl,人物標(biāo)簽“醫(yī)生”的權(quán)重值為WB2 ;候選人物E的人物標(biāo)簽“外科”的權(quán)重值為WEl,人物標(biāo)簽“醫(yī)生”的權(quán)重值為WE2。第一權(quán)重確定裝置根據(jù)上述權(quán)重信息確定:候選人物A與搜索序列對應(yīng)的權(quán)重信息=WA1+WA2 ;候選人物B與搜索序列對應(yīng)的權(quán)重信息=WB1+WB2 ;候選人物E與搜索序列對應(yīng)的權(quán)重信息=WE1+WE2。[0192]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何對所述至少一個候選人物中的每一個候選人物,根據(jù)該候選人物的、與所述至少一個搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,確定該候選人物與所述搜索序列相對應(yīng)的權(quán)重信息的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0193]第一子排序裝置根據(jù)各個候選人物的權(quán)重信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序。
[0194]例如,第一確定裝置3獲得候選人物A、B和E。第一權(quán)重確定裝置確定候選人物A的權(quán)重為95,候選人物B的權(quán)重為85,候選人物E的權(quán)重為92。第一子排序裝置根據(jù)上述權(quán)重信息對候選人物按照權(quán)重從高至低進(jìn)行排序,獲得排序結(jié)果為:候選人物A,候選人物E,候選人物B。
[0195]需要說明的是,第一子排序裝置可根據(jù)各個候選人物的權(quán)重信息,按照預(yù)定規(guī)則對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序。其中,所述預(yù)定規(guī)則用于確定可參與排序的候選人物或者可參與排序的候選人物的個數(shù)。
[0196]例如,預(yù)定規(guī)則包括對候選人物中權(quán)重超過預(yù)定權(quán)重閾值的候選人物進(jìn)行排序,且預(yù)定權(quán)重閾值為90,第一確定裝置3獲得候選人物A、B和E,第一權(quán)重確定裝置確定候選人物A的權(quán)重為95,候選人物B的權(quán)重為85,候選人物E的權(quán)重為92。第一子排序裝置對滿足該預(yù)定規(guī)則的候選人物A和E進(jìn)行排序,獲得排序結(jié)果為:候選人物A,候選人物E。
[0197]又例如,預(yù)定規(guī)則包括當(dāng)候選人物的數(shù)量超過100時,僅對其中的100個候選人物進(jìn)行排序。則第一子排序裝置可先確定權(quán)重前100位的候選人物,再對該等100位候選人物進(jìn)行排序等。
[0198]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)`各個候選人物的權(quán)重信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0199]需要說明的是,第一權(quán)重確定裝置和第一子排序裝置的觸發(fā)執(zhí)行的操作并無嚴(yán)格的先后順序,第一權(quán)重確定裝置可與第一子排序裝置同時執(zhí)行操作,例如,搜索裝置在獲得一個候選人物的權(quán)重信息后,第一子排序裝置即根據(jù)其與其他候選人物的權(quán)重信息,將其插入適當(dāng)?shù)呐判蛭恢?,與此同時,第一權(quán)重確定裝置獲取另一個候選人物的權(quán)重信息。
[0200]又如在排序裝置4的另一個優(yōu)選方式中,排序裝置4進(jìn)一步包括第二子排序裝置(圖未示出)。
[0201]第二子排序裝置根據(jù)各個候選人物的、與所述搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,并結(jié)合各個候選人物對應(yīng)的認(rèn)證信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序。
[0202]其中,對于一個候選人物,其與搜索分詞匹配的人物標(biāo)簽的權(quán)重信息越高,則其排序較聞的可能性越聞;其具有認(rèn)證?目息,則其排序較聞的可能性越聞。
[0203]具體地,第二子排序裝置可采用多種方式,來根據(jù)各個候選人物的、與所述搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,并結(jié)合各個候選人物對應(yīng)的認(rèn)證信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序。
[0204]例如,對于每個候選人物,第二子排序裝置可直接基于該候選人物的、與搜索分詞匹配的人物標(biāo)簽的權(quán)重信息以及該候選人物的認(rèn)證信息,計算該候選人物與搜索序列對應(yīng)的權(quán)重,并且,第二子排序裝置根據(jù)各個候選人物與該搜索序列對應(yīng)的權(quán)重,來對各個候選人物中的全部或部分進(jìn)行排序。
[0205]并且,第二子排序裝置與第一權(quán)重確定裝置和第一子排序裝置實現(xiàn)的功能可以相結(jié)合。例如:對所述至少一個候選人物中的每一個候選人物,并根據(jù)該候選人物的、與所述至少一個搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,確定該候選人物與所述搜索序列相對應(yīng)的權(quán)重信息,并根據(jù)各個候選人物的權(quán)重信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序;接著,根據(jù)各個候選人物是否具有認(rèn)證信息,來提高具有認(rèn)證信息的候選人物的排序,并降低不具有認(rèn)證信息的候選人物的排序。又例如,對所述至少一個候選人物中的每一個候選人物,可根據(jù)該候選人物的、與所述至少一個搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,確定該候選人物與所述搜索序列相對應(yīng)的權(quán)重信息,并且,根據(jù)各個候選人物是否具有認(rèn)證信息,來對各個候選人物的權(quán)重信息進(jìn)行加權(quán);并且,根據(jù)加權(quán)后的權(quán)重信息,來對至少一個候選人物中的全部或部分候選人物進(jìn)行排序等。
[0206]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)各個候選人物的、與所述搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,并結(jié)合各個候選人物對應(yīng)的認(rèn)證信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0207]需要說明的是,第一確定裝置3和排序裝置4執(zhí)行的操作并無嚴(yán)格的先后順序,在第一確定裝置3執(zhí)行操作并獲得候選人物的同時,排序裝置4可對已獲得的候選人物進(jìn)行排序。
[0208]提供裝置5將排序后的候選人物提供給所述用戶。
[0209]優(yōu)選地,提供裝置5將排序后的候選人物提供給所述用戶的同時,可將候選人物中的附加信息一并提供給用戶,其中,所述附加信息可包括該候選人物的描述信息。
[0210]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何將排序后的候選人物提供給所述用戶的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0211]作為本實施例的一種優(yōu)選方案,搜索裝置包括第二權(quán)重確定裝置(圖未示出),第二權(quán)重確定裝置用于根據(jù)以下至少一項因素,確定人物的人物標(biāo)簽的權(quán)重信息:
[0212]I)具有該人物標(biāo)簽的其他人物對該人物的關(guān)注程度。
[0213]其中,所述具有該人物標(biāo)簽的其他人物對該人物的關(guān)注程度可基于以下因素確定:具有該人物標(biāo)簽的其他人物關(guān)注或轉(zhuǎn)發(fā)該人物發(fā)布的內(nèi)容的數(shù)量、關(guān)注該人物且具有該人物標(biāo)簽的其他人物的數(shù)量等。
[0214]例如,人物A具有“律師”標(biāo)簽,可根據(jù)關(guān)注人物A的其他人物中具有“律師”標(biāo)簽的人物的數(shù)量,和/或,具有“律師”標(biāo)簽的人物轉(zhuǎn)發(fā)該人物A發(fā)布的貼子的數(shù)量等,來確定人物A的“律師”標(biāo)簽的權(quán)重信息。
[0215]2)該人物對具有該人物標(biāo)簽的其他人物的關(guān)注程度。
[0216]其中,該人物對具有該人物標(biāo)簽的其他人物的關(guān)注程度可基于以下因素確定:該人物關(guān)注的具有該人物標(biāo)簽的其他人物的數(shù)量、該人物轉(zhuǎn)發(fā)的、具有該人物標(biāo)簽的其他人物發(fā)布的內(nèi)容的數(shù)量。
[0217]例如,人物A具有“律師”標(biāo)簽,根據(jù)人物A關(guān)注的其他人物中具有“律師”標(biāo)簽的人物的數(shù)量,和/或,人物A轉(zhuǎn)發(fā)的、具有“律師”標(biāo)簽的其他人物發(fā)布的內(nèi)容的數(shù)量,來確定人物A的“律師”標(biāo)簽的權(quán)重信息。
[0218]3)該人物發(fā)布的、具有該人物標(biāo)簽的特征的內(nèi)容的數(shù)量。
[0219]其中,第二權(quán)重確定裝置可通過解析該人物發(fā)布的內(nèi)容來確定該內(nèi)容是否具有該人物標(biāo)簽的特征。
[0220]例如,可通過解析該人物發(fā)布的內(nèi)容中是否包含具有該人物標(biāo)簽的特征的短語等,來確定該內(nèi)容是否具有該人物標(biāo)簽的特征。
[0221]4)該人物發(fā)布的、具有該人物標(biāo)簽的特征的內(nèi)容被其他人物關(guān)注的程度。其中,可通過分析人物發(fā)布的內(nèi)容來確定該內(nèi)容是否具有該人物標(biāo)簽的特征。
[0222]例如,根據(jù)人物A發(fā)布的、具有“律師”標(biāo)簽的特征的內(nèi)容被其他人物轉(zhuǎn)發(fā)或標(biāo)記的數(shù)量,確定人物A的“律師”標(biāo)簽的權(quán)重信息。
[0223]5)該人物對其他人物發(fā)布的、具有該人物標(biāo)簽的特征的內(nèi)容的關(guān)注程度。
[0224]例如,根據(jù)人物A對其他人物發(fā)布的、具有“律師”標(biāo)簽的特征的內(nèi)容進(jìn)行轉(zhuǎn)發(fā)或標(biāo)記的數(shù)量,確定人物A的“律師”標(biāo)簽的權(quán)重信息。
[0225]6)該人物是否具有與該人物標(biāo)簽對應(yīng)的認(rèn)證信息。
[0226]其中,該認(rèn)證信息包括任何能夠用于認(rèn)證該人物的真實性的信息。如認(rèn)證信息可包括但不限于:職業(yè)認(rèn)證信息,如律師證信息、醫(yī)生執(zhí)業(yè)證信息、教師資格證信息等;該人物所屬工作單位信息,如醫(yī)生所在的醫(yī)院信息、律師所在的律師事務(wù)所信息等;身份認(rèn)證信息,如實名認(rèn)證信息等。優(yōu)選地,一個人物可具有多個認(rèn)證信息,且各個認(rèn)證信息可對應(yīng)不同的人物標(biāo)簽,則當(dāng)該人物作為候選人物被排序時,可僅考慮與搜索分詞匹配的人物標(biāo)簽對應(yīng)的認(rèn)證信息。
[0227]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何確定人物的人物標(biāo)簽的權(quán)重信息的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0228]根據(jù)本實施例的方案,能夠針對人物進(jìn)行檢索,并能夠基于與搜索序列匹配的人物標(biāo)簽的權(quán)重,來對候選人物進(jìn)行排序,從而使得人物檢索結(jié)果的可靠度較高;優(yōu)選地,本實施例可以結(jié)合人物的社區(qū)網(wǎng)絡(luò)活動或者個人信息來確定其人物標(biāo)簽的權(quán)重信息,從而進(jìn)一步確保了基于人物標(biāo)簽的搜索和排序的準(zhǔn)確性;優(yōu)選地,本實施例的方案能夠在通用搜索引擎中實現(xiàn)人物搜索,從而能夠?qū)崿F(xiàn)跨網(wǎng)絡(luò)社區(qū)的人物搜索功能。
[0229]圖5為本發(fā)明另一個實施例的用于搜索人物的搜索裝置的結(jié)果示意圖。
[0230]其中,本實施例的搜索裝置包括第一獲取裝置1、第二獲取裝置2、第一確定裝置3、排序裝置4、提供裝置5和第一更新裝置6。其中,第一獲取裝置1、第二獲取裝置2、第一確定裝置3、排序裝置4和提供裝置5已在參照圖4中予以詳述,在此不再贅述。
[0231]第一更新裝置6根據(jù)與一個人物相關(guān)聯(lián)的其他人物的人物標(biāo)簽和/或所述其他人物發(fā)布的內(nèi)容,更新所述人物的人物標(biāo)簽。
[0232]其中,所述與一個人物相關(guān)聯(lián)的其他人物包括與該人物存在網(wǎng)絡(luò)關(guān)系的其他人物;例如,該人物關(guān)注的其他人物、關(guān)注該人物的其他人物、與該人物具有好友關(guān)系的其他人物等。
[0233]其中,所述人物標(biāo)簽的更新包括但不限于人物標(biāo)簽的增加、修改和刪除等。[0234]具體地,第一更新裝置6根據(jù)與一個人物相關(guān)聯(lián)的其他人物的人物標(biāo)簽和/或所述其他人物發(fā)布的內(nèi)容,更新所述人物的人物標(biāo)簽的方式包括但不限于:
[0235]I)第一更新裝置6直接根據(jù)與一個人物相關(guān)聯(lián)的其他人物的人物標(biāo)簽和/或所述其他人物發(fā)布的內(nèi)容,獲得一個或多個人物標(biāo)簽,并根據(jù)所獲得的人物標(biāo)簽,來更新該人物的人物標(biāo)簽。
[0236]其中,第一更新裝置6可采用多種方式,來根據(jù)與一個人物相關(guān)聯(lián)的其他人物的人物標(biāo)簽和/或所述其他人物發(fā)布的內(nèi)容,獲得一個或多個人物標(biāo)簽。
[0237]例如,第一更新裝置6統(tǒng)計與一個人物相關(guān)聯(lián)的其他人物的人物標(biāo)簽,并將出現(xiàn)數(shù)量的排序較高或出現(xiàn)的數(shù)量高于一個預(yù)定數(shù)量的人物標(biāo)簽,作為適用于該人物的人物標(biāo)簽。
[0238]又例如,對于一個其他人物的人物標(biāo)簽Tagl,第一更新裝置6統(tǒng)計該人物標(biāo)簽Tagl在所有與該人物相關(guān)聯(lián)的其他人物的人物標(biāo)簽中出現(xiàn)的次數(shù),并結(jié)合該人物標(biāo)簽Tagl在大量的人物(如計算機設(shè)備的人物庫)的人物標(biāo)簽中出現(xiàn)的次數(shù),來確定該人物標(biāo)簽Tagl是否能夠表征與該人物相關(guān)聯(lián)的其他人物的特征,并將能夠表征特征的人物標(biāo)簽作為適用于所述更新的人物標(biāo)簽。其中,人物標(biāo)簽Tagl在與該人物相關(guān)聯(lián)的其他人物的人物標(biāo)簽中出現(xiàn)的次數(shù)越高,且在大量的人物(如計算機設(shè)備的人物庫)的人物標(biāo)簽中出現(xiàn)的次數(shù)越低,則人物標(biāo)簽Tagl的特征表征能力越強,越適用于更新操作;人物標(biāo)簽Tagl在與該人物相關(guān)聯(lián)的其他人物的人物標(biāo)簽中出現(xiàn)的次數(shù)越低,且在大量的人物(如計算機設(shè)備的人物庫)的人物標(biāo)簽中出現(xiàn)的次數(shù)越高,則人物標(biāo)簽Tagl的特征表征性能力弱,不適用于更新操作。
[0239]又例如,第一更新裝置6根據(jù)與一個人物相關(guān)聯(lián)的其他人物發(fā)布的內(nèi)容,并根據(jù)該等內(nèi)容所具有的人物標(biāo)簽的特征,來確定一個或多個人物標(biāo)簽。如第一更新裝置6根據(jù)一個人物相關(guān)聯(lián)的其他人物發(fā)布的內(nèi)容中出現(xiàn)大量的醫(yī)學(xué)專業(yè)詞匯,確定人物標(biāo)簽“醫(yī)生”
坐寸ο
[0240]2)第一更新裝置6進(jìn)一步包括分組裝置(圖未示出)、第一標(biāo)簽確定裝置(圖未示出)和子更新裝置(圖未示出)。
[0241]分組裝置根據(jù)與所述人物相關(guān)聯(lián)的其他人物的地址特征與網(wǎng)絡(luò)社交關(guān)系特征,將與所述人物相關(guān)聯(lián)的其他人物劃分為多個分組。
[0242]優(yōu)選地,所述地址特征包括網(wǎng)絡(luò)地址特征。例如,包括其他人物所使用的IP地址。
[0243]優(yōu)選地,所述網(wǎng)絡(luò)社交關(guān)系可包括任何在網(wǎng)絡(luò)社區(qū)中的關(guān)聯(lián)關(guān)系。例如,其他人物與該人物存在關(guān)注關(guān)系、其他人物與該人物存在好友關(guān)系、其他人物與該人物關(guān)注相同的人物等。
[0244]具體地,具有相同或相似的地址特征或網(wǎng)絡(luò)社交關(guān)系特征的其他人物,更容易被劃分為一組。例如,將IP地址相同或相近(如IP地址前3段相同)的其他人物劃分為一組;又例如,將與該人物存在關(guān)注關(guān)系或好友關(guān)系,且均關(guān)注同一個知名人物的其他人物劃分為一組等,其中,知名人物可通過其諸如粉絲數(shù)等因素確定。
[0245]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)與所述人物相關(guān)聯(lián)的其他人物的地址特征與網(wǎng)絡(luò)社交關(guān)系特征,將與所述人物相關(guān)聯(lián)的其他人物劃分為多個分組的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0246]第一標(biāo)簽確定裝置根據(jù)所述多個分組中全部或部分分組包含的所述其他人物的人物標(biāo)簽和/或所述其他人物發(fā)布的內(nèi)容,獲得一個或多個人物標(biāo)簽。其中,第一標(biāo)簽確定裝置根據(jù)每個分組包含的所述其他人物的人物標(biāo)簽和/或所述其他人物發(fā)布的內(nèi)容,獲得一個或多個人物標(biāo)簽的方式,與第一更新裝置6的前述實現(xiàn)方式I)中,第一更新裝置6直接根據(jù)與一個人物相關(guān)聯(lián)的其他人物的人物標(biāo)簽和/或所述其他人物發(fā)布的內(nèi)容,獲得一個或多個人物標(biāo)簽的方式相同或相似,在此不再贅述。
[0247]例如,分組裝置將與人物A相關(guān)聯(lián)的其他人物分為組Gl和組G2,第一標(biāo)簽確定裝置解析得到組Gl中90%的人物均具有“醫(yī)生”標(biāo)簽,且組Gl中的人物發(fā)布的內(nèi)容80%與“夕卜科”有關(guān),則第一標(biāo)簽確定裝置獲得“醫(yī)生”標(biāo)簽和“外科”標(biāo)簽。
[0248]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)所述多個分組中全部或部分分組包含的所述其他人物的人物標(biāo)簽和/或所述其他人物發(fā)布的內(nèi)容,獲得一個或多個人物標(biāo)簽的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0249]子更新裝置根據(jù)所述一個或多個人物標(biāo)簽,更新所述人物的人物標(biāo)簽。
[0250]例如,第一標(biāo)簽確定裝置根據(jù)與人物A相關(guān)聯(lián)的其他人物獲得“醫(yī)生”標(biāo)簽和“外科”標(biāo)簽,而人物A不具有該兩個標(biāo)簽,則子更新裝置為人物A添加該兩個標(biāo)簽。
[0251]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)所述一個或多個人物標(biāo)簽,更新所述人物的人物標(biāo)簽的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0252]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)與一個人物相關(guān)聯(lián)的其他人物的人物標(biāo)簽和/或所述其他人物發(fā)布的內(nèi)容,更新所述人物的人物標(biāo)簽的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0253]跟據(jù)本實施例的方案,通過與人物相關(guān)聯(lián)的其他人物來為該人物更新標(biāo)簽,使得人物的標(biāo)簽?zāi)芨行У?、更完整的反?yīng)人物的特征,且通過人物標(biāo)簽的添加、刪除以及更改等操作使得人物標(biāo)簽?zāi)軌蚋鼫?zhǔn)確的反應(yīng)人物當(dāng)前所具有的特征,減少了在人物搜索中出現(xiàn)人物遺漏或者人物標(biāo)簽不準(zhǔn)確的情況,從而使得人物搜索的搜索結(jié)果更加全面,也更加符合用戶的搜索條件。
[0254]需要說明的是,為簡便起見,圖5中顯示第一更新裝置6的邏輯順序位于第一獲取裝置I之前,但本領(lǐng)域技術(shù)人員應(yīng)能理解,第一更新裝置6與第一獲取裝置I至提供裝置5執(zhí)行的操作并無先后順序。
[0255]圖6為本發(fā)明另一個實施例的用于搜索人物的搜索裝置的結(jié)構(gòu)示意圖。
[0256]本實施例的搜索裝置包括第一獲取裝置1、第二獲取裝置2、第一確定裝置3、排序裝置4、提供裝置5、第二標(biāo)簽確定裝置7和第二更新裝置8。其中,第一獲取裝置1、第二獲取裝置2、第一確定裝置3、排序裝置4和提供裝置5已在參照圖4中予以詳述,在此不再贅述。
[0257]第二標(biāo)簽確定裝置7根據(jù)所述人物發(fā)布的內(nèi)容,確定至少一個人物標(biāo)簽。
[0258]具體地,第二標(biāo)簽確定裝置7根據(jù)人物發(fā)布的內(nèi)容,確定至少一個人物標(biāo)簽的方式,與前述第一更新裝置6根據(jù)其他人物發(fā)布的內(nèi)容,確定至少一個人物標(biāo)簽的方式相同或相似。
[0259]例如,第二標(biāo)簽確定裝置7對人物A發(fā)布的內(nèi)容中的每一個進(jìn)行解析,提取該內(nèi)容中的各個詞語出現(xiàn)的頻率,排除常用詞、語氣詞以及連接詞等,獲取出現(xiàn)頻率最高的多個詞語作為該內(nèi)容的關(guān)鍵詞,并通過語義分析來判斷該等關(guān)鍵詞對應(yīng)的人物標(biāo)簽為“醫(yī)生”標(biāo)簽。
[0260]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,根據(jù)所述人物發(fā)布的內(nèi)容,確定至少一個人物標(biāo)簽的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0261]第二更新裝置8根據(jù)所述至少一個人物標(biāo)簽,更新所述人物的人物標(biāo)簽。
[0262]其中,第二更新裝置8根據(jù)所述至少一個人物標(biāo)簽,更新所述人物的人物標(biāo)簽的方式,與前述子更新裝置根據(jù)一個或多個人物標(biāo)簽,更新所述人物的人物標(biāo)簽的方式相同或相似,在此不再贅述。
[0263]需要說明的是,為簡便起見,圖6中顯示第一獲取裝置I的邏輯順序在第二標(biāo)簽確定裝置7和第二更新裝置8之前,但本領(lǐng)域技術(shù)人員應(yīng)能理解,第二標(biāo)簽確定裝置7和第二更新裝置8與第一獲取裝置I至提供裝置5執(zhí)行的操作之間并無先后順序。
[0264]跟據(jù)本實施例的方案,人物的人物標(biāo)簽?zāi)軌蚋鶕?jù)人物的發(fā)布內(nèi)容進(jìn)行更新,使得人物的標(biāo)簽?zāi)芨行У?、更完整的反?yīng)人物的特征,且能夠通過人物自身發(fā)布的內(nèi)容,更準(zhǔn)確的反應(yīng)人物當(dāng)前所具有的特征,減少了在人物搜索中出現(xiàn)人物遺漏或者人物標(biāo)簽不準(zhǔn)確的情況,從而使得人物搜索的搜索結(jié)果更加全面,也更加符合用戶的搜索條件。
[0265]需要注意的是,本發(fā)明可在軟件和/或軟件與硬件的組合體中被實施,例如,本發(fā)明的各個裝置可采用專用集成電路(ASIC)或任何其他類似硬件設(shè)備來實現(xiàn)。在一個實施例中,本發(fā)明的軟件程序可以通過處理器執(zhí)行以實現(xiàn)上文所述步驟或功能。同樣地,本發(fā)明的軟件程序(包括相關(guān)的數(shù)據(jù)結(jié)構(gòu))可以被存儲到計算機可讀記錄介質(zhì)中,例如,RAM存儲器,磁或光驅(qū)動器或軟磁盤及類似設(shè)備。另外,本發(fā)明的一些步驟或功能可采用硬件來實現(xiàn),例如,作為與處理器配合從而執(zhí)行各個步驟或功能的電路。
[0266]對于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實施例的細(xì)節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實現(xiàn)本發(fā)明。因此,無論從哪一點來看,均應(yīng)將實施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán)利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化涵括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。此夕卜,顯然“包括” 一詞不排除其他單元或步驟,單數(shù)不排除復(fù)數(shù)。系統(tǒng)權(quán)利要求中陳述的多個單元或裝置也可以由一個單元或裝置通過軟件或者硬件來實現(xiàn)。第一,第二等詞語用來表示名稱,而并不表示任何特定的順序。
【權(quán)利要求】
1.一種用于搜索人物的方法,其中,該方法包括以下步驟: a獲取來自用戶的搜索序列; b由所述搜索序列中獲取至少一個搜索分詞; c基于所述至少一個搜索分詞獲得至少一個候選人物,其中,所述至少一個搜索分詞的全部或部分中的每個搜索分詞均能與一個候選人物的人物標(biāo)簽中的一個或多個匹配;d根據(jù)各個候選人物的、與所述搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序;e將排序后的候選人物提供給所述用戶。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述步驟c包括以下步驟: -獲取所述至少一個搜索分詞中的每個搜索分詞所匹配的人物列表; -確定在所有匹配獲得的人物列表中均存在的人物,作為所述至少一個候選人物。
3.根據(jù)權(quán)利要求1或2所述的方法,其中,所述步驟d包括以下步驟: -對所述至少一個候選人物中的每一個候選人物,根據(jù)該候選人物的、與所述至少一個搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,確定該候選人物與所述搜索序列相對應(yīng)的權(quán)重信息; -根據(jù)各個候選人物的權(quán)重信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序。
4.根據(jù)權(quán)利要求1或2所述的方法,其中,所述步驟d包括以下步驟: -根據(jù)各個候選人物的、與所述搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,并結(jié)合各個候選人物對應(yīng)的認(rèn)證信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序。
5.根據(jù)權(quán)利要求1至4中任一項所述的方法,其中,所述步驟b包括以下步驟: -對所述搜索序列進(jìn)行分詞,獲得分詞列表; -從所述分詞列表中選擇重要分詞,作為所述至少一個搜索分詞。
6.根據(jù)權(quán)利要求1至4中任一項所述的方法,其中,所述步驟b包括以下步驟: -對所述搜索序列進(jìn)行分詞,獲得所述至少一個搜索分詞; 其中,所述分詞的操作考慮以下至少一項因素: -所述搜索序列的不同分詞結(jié)果的語義差別; -所述搜索序列與預(yù)定分詞詞庫的匹配結(jié)果。
7.根據(jù)權(quán)利要求1至6中任一項所述的方法,其中,該方法還包括以下步驟: X根據(jù)與一個人物相關(guān)聯(lián)的其他人物的人物標(biāo)簽和/或所述其他人物發(fā)布的內(nèi)容,更新所述人物的人物標(biāo)簽。
8.根據(jù)權(quán)利要求7所述的方法,其中,所述步驟X包括以下步驟: -根據(jù)與所述人物相關(guān)聯(lián)的其他人物的地址特征與網(wǎng)絡(luò)社交關(guān)系特征,將與所述人物相關(guān)聯(lián)的其他人物劃分為多個分組; -根據(jù)所述多個分組中全部或部分分組包含的所述其他人物的人物標(biāo)簽和/或所述其他人物發(fā)布的內(nèi)容,獲得一個或多個人物標(biāo)簽; -根據(jù)所述一個或多個人物標(biāo)簽,更新所述人物的人物標(biāo)簽。
9.根據(jù)權(quán)利要求1至8中任一項所述的方法,其中,該方法還包括以下步驟: -根據(jù)所述人物發(fā)布的內(nèi)容,確定至少一個人物標(biāo)簽;-根據(jù)所述至少一個人物標(biāo)簽,更新所述人物的人物標(biāo)簽。
10.根據(jù)權(quán)利要求1至9中任一項所述的方法,其中,該方法還包括以下步驟: -根據(jù)以下至少一項因素,確定人物的人物標(biāo)簽的權(quán)重信息; -具有該人物標(biāo)簽的其他人物對該人物的關(guān)注程度; -該人物對具有該人物標(biāo)簽的其他人物的關(guān)注程度; -該人物發(fā)布的、具有該人物標(biāo)簽的特征的內(nèi)容的數(shù)量; -該人物發(fā)布的、具有該人物標(biāo)簽的特征的內(nèi)容被其他人物關(guān)注的程度; -該人物對其他人物發(fā)布的、具有該人物標(biāo)簽的特征的內(nèi)容的關(guān)注程度; -該人物是否具有與該人物標(biāo)簽對應(yīng)的認(rèn)證信息。
11.一種用于搜索人物的搜索裝置,其中,該搜索裝置包括: 第一獲取裝置,用于獲取來自用戶的搜索序列; 第二獲取裝置,用于由所述搜索序列中獲取至少一個搜索分詞; 第一確定裝置,用于基于所述至少一個搜索分詞獲得至少一個候選人物,其中,所述至少一個搜索分詞的全部或部分中的每個搜索分詞均能與一個候選人物的人物標(biāo)簽中的一個或多個匹配; 排序裝置,用于根據(jù)各個候選人物的、與所述搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序; 提供裝置,用于將排序后的候選人物提供給所述用戶。
12.根據(jù)權(quán)利要求11所述的搜索裝置,其中,所述第一確定裝置包括: 列表獲取裝置,用于獲取與所述至少一個搜索分詞中的每個搜索分詞所匹配的人物列表; 人物確定裝置,用于確定在所有匹配獲得的人物列表中均存在的人物,作為所述至少一個候選人物。
13.根據(jù)權(quán)利要求11或12所述的搜索裝置,其中,所述排序裝置包括: 第一權(quán)重確定裝置,用于對所述至少一個候選人物中的每一個候選人物,根據(jù)該候選人物的、與所述至少一個搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,確定該候選人物與所述搜索序列相對應(yīng)的權(quán)重信息; 第一子排序裝置,用于根據(jù)各個候選人物的權(quán)重信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序。
14.根據(jù)權(quán)利要求11或12所述的搜索裝置,其中,所述排序裝置包括: 第二子排序裝置,用于根據(jù)各個候選人物的、與所述搜索分詞匹配的人物標(biāo)簽的權(quán)重信息,并結(jié)合各個候選人物對應(yīng)的認(rèn)證信息,對所述至少一個候選人物中的全部或部分候選人物進(jìn)行排序。
15.根據(jù)權(quán)利要求11至14中任一項所述的搜索裝置,其中,所述第二獲取裝置包括: 分詞裝置,用于對所述搜索序列進(jìn)行分詞,獲得分詞列表; 選擇裝置,用于從所述分詞列表中選擇重要分詞,作為所述至少一個搜索分詞。
16.根據(jù)權(quán)利要求11至14中任一項所述的搜索裝置,其中,所述第二獲取裝置包括以下裝置: 子獲取裝置:用于對所述搜索序列進(jìn)行分詞,獲得所述至少一個搜索分詞;其中,所述分詞的操作考慮以下至少一項因素: -所述搜索序列的不同分詞結(jié)果的語義差別; -所述搜索序列與預(yù)定分詞詞庫的匹配結(jié)果。
17.根據(jù)權(quán)利要求11至16中任一項所述的搜索裝置,其中,該搜索裝置還包括: 第一更新裝置,用于根據(jù)與一個人物相關(guān)聯(lián)的其他人物的人物標(biāo)簽和/或所述其他人物發(fā)布的內(nèi)容,更新所述人物的人物標(biāo)簽。
18.根據(jù)權(quán)利要求17所述的搜索裝置,其中,所述第一更新裝置包括: 分組裝置,用于根據(jù)與所述人物相關(guān)聯(lián)的其他人物的地址特征與網(wǎng)絡(luò)社交關(guān)系特征,將與所述人物相關(guān)聯(lián)的其他人物劃分為多個分組; 第一標(biāo)簽確定裝置,用于根據(jù)所述多個分組中全部或部分分組包含的所述其他人物的人物標(biāo)簽和/或所述其他人物發(fā)布的內(nèi)容,獲得一個或多個人物標(biāo)簽; 子更新裝置,用于根據(jù)所述一個或多個人物標(biāo)簽,更新所述人物的人物標(biāo)簽。
19.根據(jù)權(quán)利要求11至18中任一項所述的搜索裝置,其中,該搜索裝置還包括: 第二標(biāo)簽確定裝置,用于根據(jù)所述人物發(fā)布的內(nèi)容,確定至少一個人物標(biāo)簽; 第二更新裝置,用于根據(jù)所述至少一個人物標(biāo)簽,更新所述人物的人物標(biāo)簽。
20.根據(jù)權(quán)利要求11至19中任一項所述的搜索裝置,其中,該搜索裝置還包括: 第二權(quán)重確定裝置,用于根據(jù)以下至少一項因素,確定人物的人物標(biāo)簽的權(quán)重信息; -具有該人物標(biāo)簽的其他人物對該人物的關(guān)注程度; -該人物對具有該人物標(biāo)簽的其他人物的關(guān)注程度; -該人物發(fā)布的、具有該人物標(biāo)簽的特征的內(nèi)容的數(shù)量; -該人物發(fā)布的、具有該人物標(biāo)簽的特征的內(nèi)容被其他人物關(guān)注的程度; -該人物對其他人物發(fā)布的、具有該人物標(biāo)簽的特征的內(nèi)容的關(guān)注程度; -該人物是否具有與該人 物標(biāo)簽對應(yīng)的認(rèn)證信息。
21.一種計算機設(shè)備,包括如權(quán)利要求11至20中至少一項所述的搜索裝置。
【文檔編號】G06F17/30GK103744887SQ201310717845
【公開日】2014年4月23日 申請日期:2013年12月23日 優(yōu)先權(quán)日:2013年12月23日
【發(fā)明者】張超, 趙世奇 申請人:北京百度網(wǎng)訊科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
西宁市| 于都县| 克东县| 台南市| 岱山县| 永嘉县| 岳阳市| 项城市| 阳江市| 枣阳市| 仪征市| 彩票| 岳阳市| 高唐县| 徐州市| 井研县| 靖边县| 新竹市| 普兰店市| 永新县| 吴桥县| 平遥县| 麻阳| 阳信县| 定陶县| 郑州市| 荔浦县| 正安县| 泾阳县| 岱山县| 三穗县| 邯郸县| 大名县| 长宁县| 万宁市| 宁化县| 兴文县| 栾川县| 莱芜市| 台东市| 秦皇岛市|