欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

信息查詢系統(tǒng)與方法

文檔序號:6489899閱讀:379來源:國知局
信息查詢系統(tǒng)與方法
【專利摘要】本申請?zhí)峁┝艘环N信息查詢系統(tǒng)與方法,其中,信息查詢系統(tǒng)包括:第一集群和多個不同語種的第二集群;其中,所述第一集群,用于將源語種的查詢請求翻譯重寫為多種目標(biāo)語種的查詢請求,并分別發(fā)送給相應(yīng)語種的所述第二集群;所述第二集群中的每個集群,用于接收與本集群語種相對應(yīng)的所述目標(biāo)語種的查詢請求,根據(jù)接收的所述目標(biāo)語種的查詢請求進(jìn)行信息查詢,并向所述第一集群返回本集群對應(yīng)的目標(biāo)語種的查詢結(jié)果;所述第一集群,還用于對所述第二集群返回的不同目標(biāo)語種的查詢結(jié)果進(jìn)行處理后,發(fā)送給搜索前端進(jìn)行展示。通過本申請,達(dá)到了多語言信息檢索,提供用戶更多信息和提升用戶使用體驗的效果。
【專利說明】信息查詢系統(tǒng)與方法
【技術(shù)領(lǐng)域】
[0001]本申請涉及網(wǎng)絡(luò)【技術(shù)領(lǐng)域】,特別是涉及一種信息查詢系統(tǒng)與方法。
【背景技術(shù)】
[0002]在電子商務(wù)活動中,其中重要的一個環(huán)節(jié)是,如何將賣家發(fā)布的產(chǎn)品信息快速、友好、精準(zhǔn)地呈現(xiàn)給買家,而搜索引擎通常是實現(xiàn)這個環(huán)節(jié)的首選。在一次搜索體驗過程中,買家一般使用查詢關(guān)鍵詞表達(dá)求購意圖,期待搜索引擎快速、友好、精準(zhǔn)地返回賣家的相關(guān)產(chǎn)品信息。絕大多數(shù)提供搜索引擎功能的網(wǎng)站,返回的相關(guān)結(jié)果都是來自同一種語言的產(chǎn)品,而一個面向全球貿(mào)易的電子商務(wù)網(wǎng)站,發(fā)布、搜索和展示除了英語以外的其他不同語言的產(chǎn)品信息是很重要的功能。
[0003]現(xiàn)有的電子商務(wù)搜索引擎都是針對同一種語言的數(shù)據(jù)源進(jìn)行構(gòu)建,查詢詞和產(chǎn)品信息都是使用同一種語言進(jìn)行描述的,查詢結(jié)果也只能是來自一種語言的產(chǎn)品。
[0004]下面以英文產(chǎn)品的分布式搜索框架為例進(jìn)行說明,如圖1所示,該分布式搜索框架包括searchweb前端(web搜索前端)、merger (合并)集群、searcher (搜索)集群、和clustermap (集群映射)集群。在該英文分布式搜索框架中,產(chǎn)品數(shù)據(jù)按列劃分成N列。其中,M行XN列的searcher集群負(fù)責(zé)查詢串解析、檢索、過濾、統(tǒng)計、排序、選取和展示數(shù)據(jù)獲取,每一次查詢請求只會落到邏輯上的某一行上;1行XY列的merger集群負(fù)責(zé)向某行searcher發(fā)起查詢請求,并將來自N列的同構(gòu)數(shù)據(jù)的統(tǒng)計合并和排序,每一次查詢請求只會落到某一列上;clustermap維護(hù)merger和searcher集群機(jī)器角色之間的層次連接關(guān)系和機(jī)器狀態(tài)信息,控制searcher集群和merger集群機(jī)器之間的請求轉(zhuǎn)發(fā)和負(fù)載均衡;searchweb前端根據(jù)用戶查詢詞及其他查詢條件拼成請求串,發(fā)送給某列merger,具體的merger列由F5負(fù)載均衡設(shè)備(處于searchweb前端和merger集群之間,圖1中未示出)決定,等待返回結(jié)果并進(jìn)行解析展示。
[0005]分布式搜索框架采用兩階段查詢處理用戶請求,首先,merger向某行的每臺searcher發(fā)起第一階段查詢,具體的searcher行由clustermap決定;searcher完成具體的檢索流程得到產(chǎn)品id集合及分?jǐn)?shù)等信息,并返回給merger ;merger將各臺searcher的結(jié)果進(jìn)行合并,經(jīng)過排序后,根據(jù)請求的區(qū)間選取最終的產(chǎn)品id集合,然后向第一階段選中的searcher發(fā)起第二階段查詢;searcher獲取產(chǎn)品具體數(shù)據(jù),返回給merger,并根據(jù)一定格式生成最終結(jié)果。
[0006]上述現(xiàn)有分布式搜索框架只能較好的處理同一種語言的產(chǎn)品檢索,但卻無法處理不同種語言的產(chǎn)品檢索,無法滿足面向多語言的混合搜索需求。

【發(fā)明內(nèi)容】

[0007]本申請?zhí)峁┝艘环N信息查詢系統(tǒng)與方法,以解決現(xiàn)有分布式搜索框架無法處理不同種語言的檢索,無法滿足面向多語言的混合搜索需求的問題。
[0008]為了解決上述問題,本申請公開了一種信息查詢系統(tǒng),包括:第一集群和多個不同語種的第二集群;其中,所述第一集群,用于將源語種的查詢請求翻譯重寫為多種目標(biāo)語種的查詢請求,并分別發(fā)送給相應(yīng)語種的所述第二集群;所述第二集群中的每個集群,用于接收與本集群語種相對應(yīng)的所述目標(biāo)語種的查詢請求,根據(jù)接收的所述目標(biāo)語種的查詢請求進(jìn)行信息查詢,并向所述第一集群返回本集群對應(yīng)的目標(biāo)語種的查詢結(jié)果;所述第一集群,還用于對所述第二集群返回的不同目標(biāo)語種的查詢結(jié)果進(jìn)行處理后,發(fā)送給搜索前端進(jìn)行展示。
[0009]優(yōu)選地,所述信息查詢系統(tǒng)還包括:第三集群和所述搜索前端;其中,所述搜索前端,用于將所述處理后的所述不同目標(biāo)語種的查詢結(jié)果發(fā)送給所述第三集群;所述第三集群,用于從所述搜索前端獲取處理后的所述不同目標(biāo)語種的查詢結(jié)果,將所述不同目標(biāo)語種的查詢結(jié)果翻譯為所述源語種的查詢結(jié)果并返回給所述搜索前端;所述搜索前端,還用于接收所述源語種的查詢結(jié)果并進(jìn)行展示。
[0010]優(yōu)選地,所述第一集群中設(shè)置有字段名稱映射關(guān)系表,用于指示所述不同目標(biāo)語種的查詢結(jié)果中的字段名的對應(yīng)關(guān)系;所述第一集群在對所述第二集群返回的不同目標(biāo)語種的查詢結(jié)果進(jìn)行處理時,根據(jù)所述字段名映射關(guān)系表,對所述不同目標(biāo)語種的查詢結(jié)果進(jìn)行統(tǒng)計排序和合并,根據(jù)所述源語種的查詢請求生成最終查詢結(jié)果,其中,所述最終查詢結(jié)果中包含有所述不同目標(biāo)語種的查詢結(jié)果的語種信息。
[0011]優(yōu)選地,所述第一集群,還用于在將源語種的查詢請求翻譯重寫為多種目標(biāo)語種的階段查詢請求之前,獲取所述源語種的信息,并判斷所述第一集群是否支持所述源語種,若支持,則將所述源語種的查詢請求翻譯重寫為多種目標(biāo)語種的階段查詢請求。
[0012]優(yōu)選地,所述第一集群在將所述源語種的查詢請求翻譯重寫為多種目標(biāo)語種的階段查詢請求時,將所述源語種的查詢請求中的查詢詞翻譯為所述第二集群中的每個集群所支持的語種的查詢詞,分別重新拼裝為相應(yīng)的多個第一階段查詢請求,其中,所述第一階段查詢請求用于查詢數(shù)據(jù)索引信息。
[0013]優(yōu)選地,每個所述第二集群包括第一子集群和第二子集群;其中,所述第一子集群,用于接收發(fā)送給本第二集群的第一階段查詢請求,并向本第二集群中的第二子集群發(fā)送;所述第二子集群,用于根據(jù)所述第一子集群發(fā)送的所述第一階段查詢請求,在本第二子集群內(nèi)查詢選取所述數(shù)據(jù)索引信息,并返回給所述第一子集群;所述第一子集群,還用于對所述數(shù)據(jù)索引信息進(jìn)行同構(gòu)數(shù)據(jù)的統(tǒng)計排序和選取后,返回給所述第一集群。
[0014]優(yōu)選地,所述第一集群,還用于對多個所述第二集群中的第一子集群返回的不同語種的所述數(shù)據(jù)索引信息進(jìn)行異構(gòu)數(shù)據(jù)的統(tǒng)計排序和選取后,向所述多個第二集群中的第一子集群發(fā)送第二階段查詢請求,其中,所述第二階段查詢請求用于查詢對應(yīng)于統(tǒng)計排序和選取后的所述數(shù)據(jù)索引信息的數(shù)據(jù)詳細(xì)信息。
[0015]優(yōu)選地,所述多個第二集群中的每個所述第一子集群還用于接收并向本第二集群的第二子集群發(fā)送所述第二階段查詢請求;本第二集群的第二子集群還用于根據(jù)所述第二階段查詢請求,獲取本第二集群的數(shù)據(jù)詳細(xì)信息并返回給本第二集群的第一子集群;所述第一子集群還用于對返回的所述數(shù)據(jù)詳細(xì)信息進(jìn)行同構(gòu)數(shù)據(jù)合并后,返回給所述第一集群。
[0016]優(yōu)選地,所述搜索前端,還用于接收輸入的所述源語種的查詢詞,生成所述源語種的查詢請求并發(fā)送給所述第一集群,其中,所述源語種的查詢請求中包含有所述源語種的信息和所述目標(biāo)語種的信息。
[0017]優(yōu)選地,所述信息查詢系統(tǒng)還包括:第四集群,用于維護(hù)所述第一集群和所述第二集群的集群機(jī)器角色和層次關(guān)系。
[0018]優(yōu)選地,所述第一集群、所述第二集群、和所述第三集群均通過多個服務(wù)器實現(xiàn);所述第四集群,還用于對所述第一集群中的多個服務(wù)器進(jìn)行負(fù)載均衡;以及,對所述第二集群中的第一子集群和/或第二子集群進(jìn)行負(fù)載均衡。
[0019]為了解決上述問題,本申請還公開了一種信息查詢方法,包括:第一集群將源語種的查詢請求翻譯重寫為多種目標(biāo)語種的查詢請求,并分別發(fā)送給多個不同語種的第二集群中的相應(yīng)集群;所述多個第二集群中的每個集群接收與本集群語種相對應(yīng)的所述目標(biāo)語種的查詢請求,根據(jù)接收的所述目標(biāo)語種的查詢請求進(jìn)行信息查詢,并向所述第一集群返回本集群對應(yīng)的目標(biāo)語種的查詢結(jié)果;所述第一集群對所述第二集群返回的不同目標(biāo)語種的查詢結(jié)果進(jìn)行處理后,發(fā)送給搜索前端進(jìn)行展示。
[0020]優(yōu)選地,所述信息查詢方法還包括:所述搜索前端將所述處理后的所述不同目標(biāo)語種的查詢結(jié)果發(fā)送給第三集群;所述第三集群從所述搜索前端獲取處理后的所述不同目標(biāo)語種的查詢結(jié)果,將所述不同目標(biāo)語種的查詢結(jié)果翻譯為所述源語種的查詢結(jié)果并返回給所述搜索前端;所述搜索前端接收所述源語種的查詢結(jié)果并進(jìn)行展示。
[0021]優(yōu)選地,所述第一集群對所述第二集群返回的不同目標(biāo)語種的查詢結(jié)果進(jìn)行處理后,發(fā)送給搜索前端進(jìn)行展示的步驟包括:所述第一集群通過字段名稱映射關(guān)系表對所述不同目標(biāo)語種的查詢結(jié)果進(jìn)行統(tǒng)計排序和合并,根據(jù)所述源語種的查詢請求生成最終查詢結(jié)果并發(fā)送給所述搜索前端進(jìn)行展示;其中,所述字段名稱映射關(guān)系表用于指示所述不同目標(biāo)語種的查詢結(jié)果中的字段名的對應(yīng)關(guān)系;所述最終查詢結(jié)果中包含有所述不同目標(biāo)語種的查詢結(jié)果的語種信息。
[0022]與現(xiàn)有技術(shù)相比,本申請具有以下優(yōu)點:
[0023]本申請通過設(shè)置第一集群和多個不同語種的第二集群,將源語種的查詢請求翻譯重寫為多語種的查詢請求,并發(fā)送給相應(yīng)語種的第二集群進(jìn)行信息查詢。通過該方式,一個語種的查詢詞可以查詢到對不同語種的信息,有效解決了現(xiàn)有分布式搜索框架無法處理不同種語言的檢索,無法滿足面向多語言的混合搜索需求的問題,達(dá)到了多語言信息檢索,提供用戶更多信息和提升用戶使用體驗的效果。
【專利附圖】

【附圖說明】
[0024]圖1是現(xiàn)有技術(shù)的一種分布式搜索框架的示意圖;
[0025]圖2是根據(jù)本申請實施例一的一種信息查詢系統(tǒng)的結(jié)構(gòu)框圖;
[0026]圖3是根據(jù)本申請實施例二的一種信息查詢系統(tǒng)的結(jié)構(gòu)框圖;
[0027]圖4是根據(jù)本申請實施例三的一種信息查詢系統(tǒng)的結(jié)構(gòu)示意圖;
[0028]圖5是圖4所示系統(tǒng)的一種全量索引的流程示意圖;
[0029]圖6是圖4所示系統(tǒng)的一種增量索引的流程示意圖;
[0030]圖7是根據(jù)本申請實施例四的一種信息查詢方法的步驟流程圖。
【具體實施方式】[0031]為使本申請的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖和【具體實施方式】對本申請作進(jìn)一步詳細(xì)的說明。
[0032]實施例一
[0033]參照圖2,示出了根據(jù)本申請實施例一的一種信息查詢系統(tǒng)的結(jié)構(gòu)框圖。
[0034]本實施例的信息查詢系統(tǒng)包括:第一集群102和多個不同語種的第二集群104。
[0035]其中,第一集群102,用于將源語種的查詢請求翻譯重寫為多種目標(biāo)語種的查詢請求,并分別發(fā)送給相應(yīng)語種的第二集群104 ;第二集群104中的每個集群,用于接收與本集群語種相對應(yīng)的目標(biāo)語種的查詢請求,根據(jù)接收的目標(biāo)語種的查詢請求進(jìn)行信息查詢,并向第一集群102返回本集群對應(yīng)的目標(biāo)語種的查詢結(jié)果;第一集群102,還用于對第二集群104返回的不同目標(biāo)語種的查詢結(jié)果進(jìn)行處理后,發(fā)送給搜索前端進(jìn)行展示。
[0036]例如,設(shè)定源語種為法語,多個不同語種的第二集群分別為法語集群、英語集群和西班牙語集群,則第一集群102接收法語的查詢請求后,分別重寫為法語查詢請求、英語查詢請求和西班牙語查詢請求,并分別發(fā)送給對應(yīng)的法語集群、英語集群和西班牙語集群。法語集群、英語集群和西班牙語集群在接收到本集群語種的查詢請求后,按照查詢請求中的參數(shù)和信息進(jìn)行信息查詢,然后分別向第一集群102返回查詢結(jié)果,其中,法語集群返回的是法語的查詢結(jié)果、英語集群返回的是英語的查詢結(jié)果、西班牙語集群返回的是西班牙語的查詢結(jié)果。第一集群102在接收到這些查詢結(jié)果后進(jìn)行相應(yīng)的處理,如統(tǒng)計、排序、選取、合并、或者翻譯等,然后發(fā)送給搜索前端進(jìn)行展示。用戶通過該展示能夠獲取多語種的查詢結(jié)果息。
[0037]通過本實施例,在信息查詢系統(tǒng)中設(shè)置第一集群和多個不同語種的第二集群,將源語種的查詢請求翻譯重寫為多語種的查詢請求,并發(fā)送給相應(yīng)語種的第二集群進(jìn)行信息查詢。通過該方式,一個語種的查詢詞可以查詢到對不同語種的信息,有效解決了現(xiàn)有分布式搜索框架無法處理不同種語言的檢索,無法滿足面向多語言的混合搜索需求的問題,達(dá)到了多語言信息檢索,提供用戶更多信息和提升用戶使用體驗的效果。
[0038]實施例二
[0039]參照圖3,示出了根據(jù)本申請實施例二的一種信息查詢系統(tǒng)的結(jié)構(gòu)框圖。
[0040]本實施例的信息查詢系統(tǒng)包括:搜索前端202、第一集群204、多個不同語種的第二集群206、第三集群208、第四集群210。其中,第一集群204、第二集群206、第三集群208、第四集群210中的每個集群均可由一個或多個服務(wù)器實現(xiàn)。
[0041]搜索前端202可以是客戶端,也可以與客戶端相連,并與第一集群204和第三集群208相連。搜索前端202用于接收輸入的源語種的查詢詞,生成源語種的查詢請求并發(fā)送給第一集群204,其中,源語種的查詢請求中包含有源語種的信息和目標(biāo)語種的信息,該目標(biāo)語種與第二集群206支持的語種相對應(yīng);并且,搜索前端202還用于將第一集群204處理后的不同目標(biāo)語種的查詢結(jié)果發(fā)送給第三集群208 ;并在第三集群208將不同目標(biāo)語種的查詢結(jié)果翻譯為源語種的查詢結(jié)果后,接收第三集群208的返回源語種的查詢結(jié)果進(jìn)行展示,如顯示給客戶端的用戶。
[0042]第一集群204與搜索前端202和多個不同語種的第二集群206相連。第一集群204用于源語種的查詢請求翻譯重寫為多種目標(biāo)語種的查詢請求,并分別發(fā)送給相應(yīng)語種的第二集群206 ;以及,對第二集群206返回的不同目標(biāo)語種的查詢結(jié)果進(jìn)行處理后,發(fā)送給搜索前端202進(jìn)行展示。優(yōu)選地,可以在第一集群204中設(shè)置字段名稱映射關(guān)系表,該關(guān)系表用于指示不同目標(biāo)語種的查詢結(jié)果中的字段名的對應(yīng)關(guān)系,如英語查詢結(jié)果中的字段名“subject”與西班牙語查詢結(jié)果中的“tema”相對應(yīng),均指示產(chǎn)品名字段等。這樣,在第一集群204接收到第二集群206返回的不同目標(biāo)語種的查詢結(jié)果后,可以根據(jù)字段名映射關(guān)系表,對不同目標(biāo)語種的查詢結(jié)果進(jìn)行處理,即,對來自不同目標(biāo)語種的異構(gòu)查詢結(jié)果利用名稱映射關(guān)系表進(jìn)行結(jié)果兼容性處理,包括進(jìn)行統(tǒng)計排序和合并(將不同目標(biāo)語種的異構(gòu)查詢結(jié)果進(jìn)行并集處理)等,進(jìn)而根據(jù)源語種的查詢請求生成最終查詢結(jié)果,如,源語種的查詢請求中設(shè)定僅顯示最靠前的30條記錄等,則第一集群204對不同目標(biāo)語種的查詢結(jié)果進(jìn)行統(tǒng)計排序和合并后,根據(jù)源語種的查詢請求僅選取排名前30的查詢結(jié)果,生成最終查詢結(jié)果發(fā)送給搜索前端202進(jìn)行展示。其中,最終查詢結(jié)果中包含有不同目標(biāo)語種的查詢結(jié)果的語種信息。
[0043]優(yōu)選地,第一集群204可以在將源語種的查詢請求翻譯重寫為多種目標(biāo)語種的階段查詢請求之前,獲取源語種的信息,并判斷第一集群204是否支持源語種,若支持,則將源語種的查詢請求翻譯重寫為多種目標(biāo)語種的階段查詢請求。第一集群204通過判斷是否支持源語種,一方面可以確定用戶輸入的語種是否合法,另一方面能夠提高查詢的效率,避免無效查詢。
[0044]第一集群204通過第二集群206進(jìn)行信息查詢,獲取信息查詢結(jié)果。在這一過程中,第一集群204先將源語種的查詢請求中的查詢詞翻譯為第二集群206中的每個集群所支持的語種的查詢詞,然后分別重新拼裝為相應(yīng)的多個第一階段查詢請求,該第一階段查詢請求用于查詢數(shù)據(jù)索引信息,如產(chǎn)品的編號、標(biāo)題、簡要介紹,產(chǎn)品的屬性特征等字段建立有倒排索引,用于查詢匹配;產(chǎn)品產(chǎn)地、質(zhì)量、創(chuàng)建和修改時間等建立有正排索引,用于過濾、統(tǒng)計和排序。之后,第一集群204將多語種的多個第一階段查詢請求分別發(fā)送給相應(yīng)的第二集群206。在每個第二集群206中,都包括有第一子集群和第二子集群。以一個第二集群206的查詢請求處理為例,該第二集群206的第一子集群用于接收發(fā)送給本第二集群206的第一階段查詢請求,并向本第二集群206中的第二子集群發(fā)送;該第二集群206中的第二子集群用于根據(jù)本第二集群206的第一子集群發(fā)送的第一階段查詢請求,在本第二子集群內(nèi)查詢數(shù)據(jù)索引信息,并返回給本第二集群206的第一子集群;該第一子集群在接收到該第二子集群返回的數(shù)據(jù)索引信息后,還用于對數(shù)據(jù)索引信息進(jìn)行同構(gòu)數(shù)據(jù)(同構(gòu)數(shù)據(jù)指每條數(shù)據(jù)的描述形式是一致的,如每條數(shù)據(jù)的字段數(shù)量和名稱是一樣的)的統(tǒng)計排序和選取后,返回給第一集群204。第一集群204還用于接收各個第二集群206返回的不同語種的異構(gòu)(異構(gòu)數(shù)據(jù)是指數(shù)據(jù)的描述形式不一致,如每條數(shù)據(jù)的字段數(shù)量和/或字段名稱是不一樣的)的數(shù)據(jù)索引信息,對多個第二集群206中的第一子集群返回的不同語種的數(shù)據(jù)索引信息進(jìn)行異構(gòu)數(shù)據(jù)的統(tǒng)計排序和選取后,向多個第二集群206中的第一子集群發(fā)送第二階段查詢請求,該第二階段查詢請求用于查詢對應(yīng)于統(tǒng)計排序和選取后的數(shù)據(jù)索引信息的數(shù)據(jù)詳細(xì)信息(如產(chǎn)品的詳細(xì)介紹等)。優(yōu)選地,第一集群204在對多個第二集群206返回的不同語種的數(shù)據(jù)索引信息進(jìn)行異構(gòu)數(shù)據(jù)的統(tǒng)計排序和選取時,可以根據(jù)第一階段查詢請求對統(tǒng)計和排序后的數(shù)據(jù)索引信息進(jìn)行選取,如根據(jù)第一階段查詢請求中對條目數(shù)量的要求,選取符合條目數(shù)量的數(shù)據(jù)索引信息等;然后,再向多個第二集群206中的第一子集群發(fā)送第二階段查詢請求,該第二階段查詢請求用于查詢對應(yīng)于選取后的數(shù)據(jù)索引信息的數(shù)據(jù)詳細(xì)信息。通過數(shù)據(jù)索引信息篩選,能夠減少信息交互量,提高有效信息獲取效率。
[0045]仍以一個第二集群206為例,該第二集群206中的第一子集群還用于接收并向本第二集群206的第二子集群發(fā)送第二階段查詢請求;本第二集群206的第二子集群還用于根據(jù)第二階段查詢請求,獲取本第二集群206的數(shù)據(jù)詳細(xì)信息并返回給本第二集群206的第一子集群;本第二集群206的第一子集群還用于對返回的數(shù)據(jù)詳細(xì)信息進(jìn)行同構(gòu)數(shù)據(jù)合并后,返回給第一集群204。第一集群204對多個第二集群206返回的不同語種的異構(gòu)數(shù)據(jù)詳細(xì)信息進(jìn)行處理,如將異構(gòu)數(shù)據(jù)按指定的格式進(jìn)行兼容性拼裝處理(對異構(gòu)數(shù)據(jù)進(jìn)行的并集處理),然后生成最終的查詢結(jié)果,發(fā)送給搜索前端202進(jìn)行展示。
[0046]搜索前端202接收第一集群204返回的最終的查詢結(jié)果,也即,第一集群204處理后的不同目標(biāo)語種的查詢結(jié)果后,一種方式是直接展示給客戶端的用戶,但該種方式有可能因用戶不懂多種語言而造成閱讀困難,無法有效獲取信息。因此,優(yōu)選地,本實施例的信息查詢系統(tǒng)設(shè)置了第三集群208,第三集群208連接于搜索前端202,用于從搜索前端202獲取處理后的不同目標(biāo)語種的查詢結(jié)果,將不同目標(biāo)語種的查詢結(jié)果翻譯為源語種的查詢結(jié)果并返回給搜索前端202 ;搜索前端202還用于接收第三集群208返回的源語種的查詢結(jié)果并進(jìn)行展示。至此,客戶端用戶可以簡單方便地獲取多種語種情形下的信息,提升用戶使用體驗。
[0047]更進(jìn)一步,優(yōu)選地,本實施例的信息查詢系統(tǒng)還設(shè)置了第四集群210,以對信息查詢系統(tǒng)的集群進(jìn)行負(fù)載均衡,第四集群210與第一集群204和多個第二集群206相連,用于對第一集群204中的多個服務(wù)器進(jìn)行負(fù)載均衡;以及,對多個第二集群206中的多個第一子集群和/或多個第二子集群中的多個服務(wù)器進(jìn)行負(fù)載均衡。但不限于此,在實際使用中還可以通過其它方式實現(xiàn)集群中服務(wù)器的負(fù)載均衡,如,設(shè)置負(fù)載均衡設(shè)備,使該負(fù)載均衡設(shè)備連接于搜索前端202和第一集群204之間,當(dāng)?shù)谝患?04由多個服務(wù)器實現(xiàn)時,負(fù)載均衡設(shè)備對第一集群204中的多個服務(wù)器進(jìn)行負(fù)載均衡;而第四集群210僅與多個第二集群206相連,對多個第二集群206中的多個第一子集群和/或多個第二子集群進(jìn)行負(fù)載均衡。
[0048]此外,第四集群210還用于維護(hù)第一集群204和多個第二集群206的集群機(jī)器角色和層次關(guān)系。
[0049]通過本實施例,提供了一種面向多語言的信息查詢系統(tǒng),用于打造一套靈活可配置、簡單易擴(kuò)展、滿足不同語言產(chǎn)品的混合搜索需求的平臺。有效解決了現(xiàn)有分布式搜索框架無法處理不同種語言的檢索,無法滿足面向多語言的混合搜索需求的問題,達(dá)到了多語言信息檢索,提供用戶更多信息和提升用戶使用體驗的效果。
[0050]實施例三
[0051]參照圖4,示出了根據(jù)本申請實施例三的一種信息查詢系統(tǒng)的結(jié)構(gòu)示意圖。
[0052]本實施例中,設(shè)定第一集群為blender (混合)集群,第二集群包括第一子集群merger集群和第二子集群searcher集群,第三集群為translator (翻譯)集群、第四集群為clustermap集群,以面向英文和西班牙文的電子商務(wù)信息查詢系統(tǒng)為例,對本申請的信息查詢方案進(jìn)行說明。
[0053]本實施例的信息查詢系統(tǒng)包括:searchweb前端302、blender集群304、英文的merger集群306和西班牙文的merger集群306、英文的searcher集群308和西班牙文的searcher 集群 308、translator 集群 310、clustermap 集群 312。其中,blender 集群 304 設(shè)置為I行X Z行,共Z個blender服務(wù)器;merger集群306設(shè)置為I行X Y列,共Y個merger服務(wù)器;searcher集群308設(shè)置為M行XN列,共MXN個searcher服務(wù)器;translator集群310可以設(shè)置多個translator服務(wù)器;clustermap集群312也可以設(shè)置多個clustermap服務(wù)器。
[0054]searchweb 前端 302 分別與 blender 集群 304 和 translator 集群 310 相連,blender集群304還連接于英文的merger集群306和西班牙文的merger集群306,英文的merger集群306連接于英文的searcher集群308,西班牙文的merger集群306連接于西班牙文的searcher集群308, clustermap集群312與blender集群304、英文的merger集群306和西班牙文的merger集群306、英文的searcher集群308和西班牙文的searcher集群308相連。
[0055]I行XZ列的blender集群304首先對用戶的信息查詢請求在多種語言之間進(jìn)行翻譯重寫和轉(zhuǎn)發(fā),然后對來自不同集群的異構(gòu)查詢結(jié)果數(shù)據(jù)進(jìn)行統(tǒng)計和混合排序等處理,每一次的查詢請求只會落到blender集群304的某一列上,具體哪列由F5負(fù)載均衡設(shè)備(設(shè)置于searchweb前端302和blender集群304之間,圖4中未不出)決定。TransIator集群310負(fù)責(zé)將其他語言的產(chǎn)品信息翻譯成與用戶查詢?nèi)肟谡Z言(即源語種)相同的產(chǎn)品信息,以便讓searchweb前端302使用統(tǒng)一的語言展示產(chǎn)品信息。西班牙文的merger+searcher集群的結(jié)構(gòu)和布局與左側(cè)的英文merger+searcher集群類似,但有可能searcher和merger的行列數(shù)目不同,searcher和merger的行列數(shù)目主要由數(shù)據(jù)量和訪問量決定。
[0056]上述信息查詢系統(tǒng),不僅保持了英文集群和西班牙集群各自的相對獨立性,允許不經(jīng)過blender集群直接提供單一語種的查詢,而且提供面向英文和西班牙文產(chǎn)品的混合查詢功能。
[0057]再次參照圖4,使用本實施例的信息查詢系統(tǒng)進(jìn)行信息查詢的處理流程包括:
[0058]步驟S102:用戶在網(wǎng)站搜索框中輸入了西班牙文的查詢關(guān)鍵詞,如“relojes debolsillo”,中文意思“懷表”,英語 “pocket watches”。
[0059]步驟S104:searchweb前端根據(jù)搜索引擎的查詢語法及用戶選擇的其他搜索條件拼裝請求串。
[0060]如:
[0061]uq=relojes+de+bolsillo&lang=ES&sorttype=SCATTER&scoretype=MLR&subclusters=en, es&statistic=field=statfieldl, count=100, cattype=count&fiIter=county:US&s=0&n=30&outfmt=xml&retset=h,,
[0062]表示用戶搜索語種為西班牙(Iang=ES)的關(guān)鍵字(q=relojes+de+bolsillo),且僅搜索賣家所在的國家是美國(filter=coutry:US)的產(chǎn)品,發(fā)向搜索的集群是英文集群和西班牙文集群(subclusters=en, es),返回字段statfieldl的不同取值的計數(shù)在前 100 的信息(statistic=field=statfieldl, count=100, cattype=count),從滿足條件的產(chǎn)品集合中,經(jīng)過匹配分粗排后選出一定數(shù)量的產(chǎn)品作為候選集,再以機(jī)器學(xué)習(xí)排序(MLR)算分模型(Scoretype=MLR)重新計算分?jǐn)?shù)進(jìn)行精排(sorttype=SCATTER),返回分?jǐn)?shù)在前30名(s=0&n=30)的產(chǎn)品信息,輸出格式以xml方式(outfmt=xml)生成,輸出信息是每個產(chǎn)品的字段集合h (retset=h)0可見,上述請求中攜帶了源語種信息(Iang=ES)和目標(biāo)語種信息(subclusters=en, es)。此外,該請求中還攜帶了相應(yīng)的統(tǒng)計信息(statistic=field=statfield I, count=100, cattype=count),以及排序信息(sorttype=SCATTER&scoretype=MLR)。
[0063]該拼裝好的請求串發(fā)送給F5負(fù)載均衡設(shè)備,負(fù)載均衡設(shè)備挑選出一臺blender為這次查詢請求服務(wù)。blender對查詢請求串進(jìn)行合法性檢查(如:lang (即源語種)是否在支持的語種范圍內(nèi),subclusters的值是否正確等)和重寫,然后分別向英文和西班牙文的merger集群的某臺merger發(fā)起第一階段查詢請求,具體哪臺merger由clustermap集群決定,策略可以是輪詢方式,或者根據(jù)機(jī)器負(fù)載動態(tài)分配。
[0064]步驟S 106:blender發(fā)向英文集群某臺merger的請求串要對查詢詞部分進(jìn)行翻譯以及一些查詢參數(shù)的變更和不相關(guān)參數(shù)的剔除, 并重新拼裝成新的請求串。
[0065]如:
[0066]“ q=pocket+watches&lang=EN&sorttype=SCATTER&scoretype=MLR&stati stic=field=statfieldl, count=100,cattype=count&filter=county:US&s=0&n=30&_step_=first,,
[0067]從上面的新請求串可以看到查詢詞已經(jīng)變成英文的(pocket+watches),語種也變成了英文(Iang=EN),并用參數(shù)指明是第一階段查詢請求(_step_=first),第一階段的查詢和輸出格式及輸出字段集合沒有關(guān)系,剔除(outfmt=xml&retset=h)參數(shù)。blender中的翻譯模塊以動態(tài)庫的形式加載在blender服務(wù)中以提高整體的響應(yīng)速度。
[0068]步驟S108:merger接收到來自blender的第一階段查詢請求后,向某行的每臺searcher發(fā)起第一階段查詢請求,請求串和merger接收到的保持一致。
[0069]步驟SllO:收到第一階段查詢請求的一行searcher對查詢詞“pocket+watches”分詞為“pocket”和“watch”;然后對倒排索引進(jìn)行檢索,獲取產(chǎn)品id集合;接著進(jìn)行匹配算分(使用向量空間模型,不同字段賦予不同的權(quán)重分?jǐn)?shù),再根據(jù)相鄰與否進(jìn)行分?jǐn)?shù)加權(quán));再通過正排索引進(jìn)行過濾和統(tǒng)計,經(jīng)過本地的heapsort粗排(粗排依據(jù)的分?jǐn)?shù)是前面計算出來的匹配分)和SCATTER精排(精排依據(jù)的分?jǐn)?shù)是經(jīng)過MLR計算出來的,綜合考慮產(chǎn)品質(zhì)量、賣家信譽、作弊程度及語種差異等因素)得到排名前30的結(jié)果。此時的結(jié)果集主要是產(chǎn)品id和分?jǐn)?shù),并記錄下了哪些產(chǎn)品來自哪臺searcher等信息,此時沒有產(chǎn)品詳細(xì)信息(也即數(shù)據(jù)詳細(xì)信息),這些信息經(jīng)過序列化后返回給merger。
[0070]步驟S112:merger收到一行searcher的返回結(jié)果反序列化后,進(jìn)行同構(gòu)結(jié)果的統(tǒng)計和歸并排序,排序流程和search上類似,只是粗排和精排依據(jù)的分?jǐn)?shù)都是MLR計算出來的分?jǐn)?shù),然后將結(jié)果序列化后返回給blender。
[0071]步驟SI 14:blender收到來自不同集群(本實施例中為英文集群和西班牙文集群)的返回結(jié)果,進(jìn)行異構(gòu)結(jié)果的統(tǒng)計和歸并排序。
[0072]異構(gòu)結(jié)果的統(tǒng)計使用字段名稱映射關(guān)系表來處理,對于無映射關(guān)系的單獨統(tǒng)計;排序流程和merger上類似,粗排和精排依據(jù)的分?jǐn)?shù)都是MLR計算出來的分?jǐn)?shù)。根據(jù)請求的區(qū)間(s=0&n=30)選取最終的產(chǎn)品id集合,然后對不同集群發(fā)起第二階段查詢請求獲取產(chǎn)品詳細(xì)?目息,如:
[0073]“_step_=second&content=tcp:searcherIPl:portl, _docid_=10299, 8812, 12970,11040,7468,10454,~tcp:searcherIP2:port2, _docid_=10298, 88112,129790,110420,74618,104534, ~&retset=h”[0074]上述第二階段查詢請求表示第二階段向地址是(IP1, portl)的searcher以tcp的方式請求產(chǎn)品id為1299,8812,12970,11040, , 7468,10454的產(chǎn)品信息,向地址是(IP2, port2)的 searcher 以 tcp 的方式請求產(chǎn)品 id 為 10298,88112,129790,110420,74618,104534的產(chǎn)品信息,返回的字段集合是h。
[0075]步驟SI 16:merger接收到來自blender的第二階段查詢請求后,向指定行searcher發(fā)起第二階段查詢請求。
[0076]步驟S118:收到第二階段請求的同一行searcher根據(jù)產(chǎn)品id獲取產(chǎn)品字段集合是h的詳細(xì)信息,然后返回給merger。
[0077]步驟S120:merger收到一行searcher的產(chǎn)品詳細(xì)信息進(jìn)行合并后,繼而返回給blender。
[0078]步驟S122:發(fā)向西班牙文集群某臺merger的請求串除了剔除一些不用的參數(shù)外,基本不用處理,生成新的第一階段查詢請求串。
[0079]步驟S124 - S136的過程和步驟S108-S120類似,可仿照步驟S108-S120進(jìn)行,在此不再贅述。需要說明的是,上述對英文集群的查詢過程和對西班牙文集群的查詢過程可以異步并行執(zhí)行。
[0080]步驟S138:blender收到來自不同集群返回的產(chǎn)品詳細(xì)信息,按照請求的返回格式和字段集合(outfmt=xml&retset=h)生成最終查詢結(jié)果返回給searchweb前端,字段集合里面有一個特殊字段language標(biāo)記了產(chǎn)品信息的語種信息。
[0081 ] 步驟S140:searchweb前端收到blender返回的最終查詢結(jié)果,根據(jù)產(chǎn)品信息標(biāo)記的語種信息,向Translator發(fā)起翻譯請求。
[0082]步驟S142 translator收到翻譯請求,將產(chǎn)品信息翻譯為與用戶輸入的查詢詞的語種相同的語種(本實施例中,需要將英文翻譯為西班牙文),翻譯過程可以是線下翻譯,線上提供KV (Key Value)引擎服務(wù)。
[0083]步驟S144:searchweb前端對統(tǒng)一語種的產(chǎn)品信息進(jìn)行解析和展示,呈現(xiàn)給用戶。
[0084]至此,實現(xiàn)了一個語種的查詢詞的多語種查詢處理流程。
[0085]此外,因集群使用數(shù)據(jù)的海量,需要對數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行索引以方便查找,如對圖4中的英文產(chǎn)品庫和西班牙文產(chǎn)品庫中的數(shù)據(jù)進(jìn)行索引,包括全量索引和增量索引。其中,全量索引是對某個時間快照下的所有產(chǎn)品建立搜索引擎的索引的過程;增量索引是對變更產(chǎn)品及時更新到搜索引擎的索引的過程。
[0086]除了切換新老索引,全量索引基本上是一個線下過程,如圖5所示,F(xiàn)ull dump (全量轉(zhuǎn)出)是將某個時間快照下的產(chǎn)品數(shù)據(jù)從database (數(shù)據(jù)庫)里面拉出來的,形成dumpfiles (dump文件)的過程;I join (連接)是將dump files (dump文件)通過線下進(jìn)行類似數(shù)據(jù)庫的join操作和其他業(yè)務(wù)邏輯處理的過程,這樣就能生成一張產(chǎn)品維度的寬表,并且按列劃分(和searcher集群的列數(shù)對應(yīng)),以類似xml文件的形式存儲,生成xml file (xml文件);Ibuild (構(gòu)造)是索引構(gòu)建過程,根據(jù)索引配置對產(chǎn)品信息進(jìn)行預(yù)處理、分詞建立倒排、正排等索引,同樣是生成和searcher集群列數(shù)相同份數(shù)的index files (索引文件);Switch是新老索引的切換過程,涉及索引的分發(fā)、老索引的備份、新索引的加載和預(yù)熱等,主要是要保證切換的平滑,不影響線上正常服務(wù)。
[0087]增量索引過程和全量索引過程基本相同,每個步驟之間雖然前后有依賴關(guān)系,但是可以并行流水,提高并發(fā)性。如圖6所示,Update dump (更新轉(zhuǎn)出)是將某個很短時間范圍內(nèi)(如分鐘級別)的變更產(chǎn)品數(shù)據(jù)從database (數(shù)據(jù)庫)里面拉出來,生成增量的dump數(shù)據(jù)dump files (dump文件);Ijoin (連接)的過程和全量是類似的,不過會額外生成是刪除操作的產(chǎn)品id列表,Ijoin過程最終生成xml file (xml文件);Isupdate是一個deamon后臺服務(wù),部署在每臺searcher機(jī)器上,它會定期檢查是否有新的增量xml文件生成,如果有,進(jìn)行索引的追加和合并,對于產(chǎn)品刪除則置索引里面的對應(yīng)產(chǎn)品為無效,最終生成index files (索引文件)。
[0088]通過本實施例,提供了一種面向多語言的電子商務(wù)搜索框架(電子商務(wù)信息查詢系統(tǒng)),靈活可配置,簡單易擴(kuò)展,可以解決不同語言的產(chǎn)品的混合搜索需求;不同語言的產(chǎn)品分別部署在邏輯上不同的集群上,不同語言的產(chǎn)品的全量索引和增量索引流程相互獨立,互不影響;框架內(nèi)的模塊或模型,如機(jī)器翻譯、算分模型、排序模型都是可替換的,只要接口保持兼容即可,如,merger+searcher集群實現(xiàn)部分可使用開源搜索引擎Iucene近似代替,算分模塊可采用如語言模型、向量空間模型(VSM)等模型進(jìn)行替代,翻譯部分也可用其他翻譯方法,比如基于語料、基于規(guī)則、基于統(tǒng)計或混合的翻譯方法。
[0089]需要說明的是,本實施例提供的面向多語言的電子商務(wù)搜索框架僅以英文和西班牙文為例,但本領(lǐng)域技術(shù)人員應(yīng)當(dāng)明了,該搜索框架可以靈活擴(kuò)展到多種語言(如西班牙語、日語、俄語、法語、德語、葡萄牙語、意大利語、阿拉伯語、韓語等),以便達(dá)到不同語言產(chǎn)品的混合搜索和排序的目的,實現(xiàn)多語言混合搜索。
[0090]實施例四
[0091]參照圖7,示出了根據(jù)本申請實施例四的一種信息查詢方法的步驟流程圖。
[0092]本實施例的信息查詢方法包括以下步驟:
[0093]步驟S202:第一集群將源語種的查詢請求翻譯重寫為多種目標(biāo)語種的查詢請求,并分別發(fā)送給多個不同語種的第二集群中的相應(yīng)集群。
[0094]優(yōu)選地,第一集群在將源語種的查詢請求翻譯重寫為多種目標(biāo)語種的查詢請求之前,獲取源語種的信息,并判斷第一集群是否支持源語種,若支持,則將源語種的查詢請求重寫為多種目標(biāo)語種的階段查詢請求。
[0095]步驟S204:多個第二集群中的每個集群接收與本集群語種相對應(yīng)的目標(biāo)語種的查詢請求,根據(jù)接收的目標(biāo)語種的查詢請求進(jìn)行信息查詢,并向第一集群返回本集群對應(yīng)的目標(biāo)語種的查詢結(jié)果。
[0096]優(yōu)選地,在上述信息查詢過程中,第一集群在將源語種的查詢請求翻譯重寫為多種目標(biāo)語種的階段查詢請求時,將源語種的查詢請求中的查詢詞翻譯為第二集群中的每個集群所支持的語種的查詢詞,分別重新拼裝為相應(yīng)的多個第一階段查詢請求,其中,第一階段查詢請求用于查詢數(shù)據(jù)索引信息;每個第二集群包括第一子集群和第二子集群,第一子集群接收第一集群發(fā)送給本第二集群的第一階段查詢請求,并向本第二集群中的第二子集群發(fā)送;第二子集群根據(jù)第一子集群發(fā)送的第一階段查詢請求,在本第二子集群內(nèi)查詢數(shù)據(jù)索引信息,并返回給第一子集群;第一子集群對數(shù)據(jù)索引信息進(jìn)行同構(gòu)數(shù)據(jù)的統(tǒng)計排序和選取后,返回給第一集群;第一集群對多個第二集群中的第一子集群返回的不同語種的數(shù)據(jù)索引信息進(jìn)行異構(gòu)數(shù)據(jù)的統(tǒng)計排序和選取后,向多個第二集群中的第一子集群發(fā)送第二階段查詢請求,其中,第二階段查詢請求用于查詢對應(yīng)于統(tǒng)計排序和選取后的數(shù)據(jù)索引信息的數(shù)據(jù)詳細(xì)信息;多個第二集群中的每個第一子集群接收并向本第二集群的第二子集群發(fā)送第二階段查詢請求;本第二集群的第二子集群根據(jù)第二階段查詢請求,獲取本第二集群的數(shù)據(jù)詳細(xì)信息并返回給本第二集群的第一子集群;第一子集群對返回的數(shù)據(jù)詳細(xì)信息進(jìn)行同構(gòu)數(shù)據(jù)合并后,返回給第一集群。
[0097]步驟S206:第一集群對第二集群返回的不同目標(biāo)語種的查詢結(jié)果進(jìn)行處理后,發(fā)送給搜索前端進(jìn)行展示。
[0098]優(yōu)選地,第一集群通過字段名稱映射關(guān)系表對不同目標(biāo)語種的查詢結(jié)果進(jìn)行統(tǒng)計排序和合并,根據(jù)源語種的查詢請求生成最終查詢結(jié)果并發(fā)送給搜索前端進(jìn)行展示;其中,字段名稱映射關(guān)系表用于指示不同目標(biāo)語種的查詢結(jié)果中的字段名的對應(yīng)關(guān)系;最終查詢結(jié)果中包含有不同目標(biāo)語種的查詢結(jié)果的語種信息。
[0099]優(yōu)選地,搜索前端進(jìn)行展示時,搜索前端將處理后的不同目標(biāo)語種的查詢結(jié)果發(fā)送給第三集群;第三集群從搜索前端獲取處理后的不同目標(biāo)語種的查詢結(jié)果,將不同目標(biāo)語種的查詢結(jié)果翻譯為源語種的查詢結(jié)果并返回給搜索前端;搜索前端接收源語種的查詢結(jié)果并進(jìn)行展示。
[0100]優(yōu)選地,搜索前端還接收輸入的源語種的查詢詞,生成源語種的查詢請求并發(fā)送給第一集群,其中,源語種的查詢請求中包含有源語種的信息和目標(biāo)語種的信息。
[0101]優(yōu)選地,本實施例的信息查詢方法還包括:第四集群對第一集群中的多個服務(wù)器進(jìn)行負(fù)載均衡;以及,對第二集群中的第一子集群和/或第二子集群進(jìn)行負(fù)載均衡。此外,第四集群還維護(hù)第一集群和第二集群的集群機(jī)器角色和層次關(guān)系。
[0102]本實施例中,第一集群、第二集群、和第三集群均通過一個或多個服務(wù)器實現(xiàn)。
[0103]本實施例的信息查詢方法通過前述多個實施例中的信息查詢系統(tǒng)實現(xiàn),描述較為簡單,其有效效果可參照前述相應(yīng)的信息查詢系統(tǒng)實施例,在此不再贅述。
[0104]本說明書中的各個實施例均采用遞進(jìn)的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。對于方法實施例而言,描述的比較簡單,相關(guān)之處參見系統(tǒng)實施例部分的說明即可。
[0105]以上對本申請所提供的一種信息查詢系統(tǒng)及方法進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個例對本申請的原理及實施方式進(jìn)行了闡述,以上實施例的說明只是用于幫助理解本申請的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本申請的思想,在【具體實施方式】及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本申請的限制。
【權(quán)利要求】
1.一種信息查詢系統(tǒng),其特征在于,包括:第一集群和多個不同語種的第二集群; 其中, 所述第一集群,用于將源語種的查詢請求翻譯重寫為多種目標(biāo)語種的查詢請求,并分別發(fā)送給相應(yīng)語種的所述第二集群; 所述第二集群中的每個集群,用于接收與本集群語種相對應(yīng)的所述目標(biāo)語種的查詢請求,根據(jù)接收的所述目標(biāo)語種的查詢請求進(jìn)行信息查詢,并向所述第一集群返回本集群對應(yīng)的目標(biāo)語種的查詢結(jié)果; 所述第一集群,還用于對所述第二集群返回的不同目標(biāo)語種的查詢結(jié)果進(jìn)行處理后,發(fā)送給搜索前端進(jìn)行展示。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,還包括:第三集群和所述搜索前端; 其中, 所述搜索前端,用于將所述處理后的所述不同目標(biāo)語種的查詢結(jié)果發(fā)送給所述第三集群; 所述第三集群,用于從所述搜索前端獲取處理后的所述不同目標(biāo)語種的查詢結(jié)果,將所述不同目標(biāo)語種的查詢結(jié)果翻譯為所述源語種的查詢結(jié)果并返回給所述搜索前端;所述搜索前端,還用于接收所述源語種的查詢結(jié)果并進(jìn)行展示。
3.根據(jù)權(quán)利要求1或2所述的系統(tǒng),其特征在于,所述第一集群中設(shè)置有字段名稱映射關(guān)系表,用于指示所述不同目標(biāo)語種的查詢結(jié)果中的字段名的對應(yīng)關(guān)系; 所述第一集群在對所述第二集群返回的不同目標(biāo)語種的查詢結(jié)果進(jìn)行處理時,根據(jù)所述字段名映射關(guān)系表,對所述不同目標(biāo)語種的查詢結(jié)果進(jìn)行統(tǒng)計排序和合并,根據(jù)所述源語種的查詢請求生成最終查詢結(jié)果,其中,所述最終查詢結(jié)果中包含有所述不同目標(biāo)語種的查詢結(jié)果的語種信息。
4.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述第一集群,還用于在將源語種的查詢請求翻譯重寫為多種目標(biāo)語種的階段查詢請求之前,獲取所述源語種的信息,并判斷所述第一集群是否支持所述源語種,若支持,則將所述源語種的查詢請求翻譯重寫為多種目標(biāo)語種的階段查詢請求。
5.根據(jù)權(quán)利要求4所述的系統(tǒng),其特征在于,所述第一集群在將所述源語種的查詢請求翻譯重寫為多種目標(biāo)語種的階段查詢請求時,將所述源語種的查詢請求中的查詢詞翻譯為所述第二集群中的每個集群所支持的語種的查詢詞,分別重新拼裝為相應(yīng)的多個第一階段查詢請求,其中,所述第一階段查詢請求用于查詢數(shù)據(jù)索引信息。
6.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于,每個所述第二集群包括第一子集群和第二子集群; 其中, 所述第一子集群,用于接收發(fā)送給本第二集群的第一階段查詢請求,并向本第二集群中的第二子集群發(fā)送; 所述第二子集群,用于根據(jù)所述第一子集群發(fā)送的所述第一階段查詢請求,在本第二子集群內(nèi)查詢選取所述數(shù)據(jù)索引信息,并返回給所述第一子集群; 所述第一子集群,還用于對所述數(shù)據(jù)索引信息進(jìn)行同構(gòu)數(shù)據(jù)的統(tǒng)計排序和選取后,返回給所述第一集群。
7.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述第一集群,還用于對多個所述第二集群中的第一子集群返回的不同語種的所述數(shù)據(jù)索引信息進(jìn)行異構(gòu)數(shù)據(jù)的統(tǒng)計排序和選取后,向所述多個第二集群中的第一子集群發(fā)送第二階段查詢請求,其中,所述第二階段查詢請求用于查詢對應(yīng)于統(tǒng)計排序和選取后的所述數(shù)據(jù)索引信息的數(shù)據(jù)詳細(xì)信息。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述多個第二集群中的每個所述第一子集群還用于接收并向本第二集群的第二子集群發(fā)送所述第二階段查詢請求;本第二集群的第二子集群還用于根據(jù)所述第二階段查詢請求,獲取本第二集群的數(shù)據(jù)詳細(xì)信息并返回給本第二集群的第一子集群;所述第一子集群還用于對返回的所述數(shù)據(jù)詳細(xì)信息進(jìn)行同構(gòu)數(shù)據(jù)合并后,返回給所述第一集群。
9.根據(jù)權(quán)利 要求1所述的系統(tǒng),其特征在于,所述搜索前端,還用于接收輸入的所述源語種的查詢詞,生成所述源語種的查詢請求并發(fā)送給所述第一集群,其中,所述源語種的查詢請求中包含有所述源語種的信息和所述目標(biāo)語種的信息。
10.根據(jù)權(quán)利要求2所述的系統(tǒng),其特征在于,還包括:第四集群,用于維護(hù)所述第一集群和所述第二集群的集群機(jī)器角色和層次關(guān)系。
11.根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于, 所述第一集群、所述第二集群、和所述第三集群均通過多個服務(wù)器實現(xiàn); 所述第四集群,還用于對所述第一集群中的多個服務(wù)器進(jìn)行負(fù)載均衡;以及,對所述第二集群中的第一子集群和/或第二子集群進(jìn)行負(fù)載均衡。
12.一種信息查詢方法,其特征在于,包括: 第一集群將源語種的查詢請求翻譯重寫為多種目標(biāo)語種的查詢請求,并分別發(fā)送給多個不同語種的第二集群中的相應(yīng)集群; 所述多個第二集群中的每個集群接收與本集群語種相對應(yīng)的所述目標(biāo)語種的查詢請求,根據(jù)接收的所述目標(biāo)語種的查詢請求進(jìn)行信息查詢,并向所述第一集群返回本集群對應(yīng)的目標(biāo)語種的查詢結(jié)果; 所述第一集群對所述第二集群返回的不同目標(biāo)語種的查詢結(jié)果進(jìn)行處理后,發(fā)送給搜索前端進(jìn)行展示。
13.根據(jù)權(quán)利要求12所述的方法,其特征在于,還包括: 所述搜索前端將所述處理后的所述不同目標(biāo)語種的查詢結(jié)果發(fā)送給第三集群; 所述第三集群從所述搜索前端獲取處理后的所述不同目標(biāo)語種的查詢結(jié)果,將所述不同目標(biāo)語種的查詢結(jié)果翻譯為所述源語種的查詢結(jié)果并返回給所述搜索前端; 所述搜索前端接收所述源語種的查詢結(jié)果并進(jìn)行展示。
14.根據(jù)權(quán)利要求12或13所述的方法,其特征在于,所述第一集群對所述第二集群返回的不同目標(biāo)語種的查詢結(jié)果進(jìn)行處理后,發(fā)送給搜索前端進(jìn)行展示的步驟包括: 所述第一集群通過字段名稱映射關(guān)系表對所述不同目標(biāo)語種的查詢結(jié)果進(jìn)行統(tǒng)計排序和合并,根據(jù)所述源語種的查詢請求生成最終查詢結(jié)果并發(fā)送給所述搜索前端進(jìn)行展示; 其中,所述字段名稱映射關(guān)系表用于指示所述不同目標(biāo)語種的查詢結(jié)果中的字段名的對應(yīng)關(guān)系;所述最終查詢結(jié)果中包含有所述不同目標(biāo)語種的查詢結(jié)果的語種信息。
【文檔編號】G06F17/30GK103729386SQ201210393631
【公開日】2014年4月16日 申請日期:2012年10月16日 優(yōu)先權(quán)日:2012年10月16日
【發(fā)明者】葉良, 鄒華鋒, 鄭文彬 申請人:阿里巴巴集團(tuán)控股有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
蒙城县| 搜索| 武定县| 古田县| 巴林左旗| 潢川县| 呈贡县| 垣曲县| 施秉县| 哈密市| 胶南市| 满洲里市| 新乡市| 阳春市| 甘谷县| 黔东| 平陆县| 泗水县| 阳江市| 宜春市| 遂宁市| 米脂县| 祥云县| 绥阳县| 黔西县| 龙川县| 万荣县| 泰顺县| 环江| 武城县| 普洱| 金华市| 环江| 灵台县| 岳西县| 宝丰县| 于都县| 平湖市| 元谋县| 通城县| 乌拉特前旗|