本發(fā)明涉及數(shù)據(jù)庫
技術(shù)領(lǐng)域:
:,具體而言,涉及一種數(shù)據(jù)查詢處理方法及裝置。
背景技術(shù):
::目前,大數(shù)據(jù)統(tǒng)計(jì)已應(yīng)用于社會(huì)各個(gè)行業(yè)領(lǐng)域中,數(shù)據(jù)分析技術(shù)也隨之發(fā)展。在銷售領(lǐng)域中,在進(jìn)行銷售數(shù)據(jù)統(tǒng)計(jì)時(shí),通常會(huì)利用數(shù)據(jù)庫自關(guān)聯(lián)查詢技術(shù),來分析個(gè)體銷售或消費(fèi)行為的歷史數(shù)據(jù),從而得出可預(yù)計(jì)未來銷售或消費(fèi)行為的傾向性。但銷售數(shù)據(jù)量往往都是數(shù)以億計(jì)的,將其中任一數(shù)據(jù)字段進(jìn)行自關(guān)聯(lián),都意味著數(shù)億的平方數(shù)量級(jí)的運(yùn)算,普通運(yùn)算系統(tǒng)難以承受如此大的運(yùn)算負(fù)荷。特別是對(duì)于保險(xiǎn)公司而言,為了進(jìn)行核保作業(yè),每天都需要對(duì)每個(gè)銷售代理人均計(jì)算統(tǒng)計(jì)出其過往銷售歷史數(shù)據(jù),以驗(yàn)證其當(dāng)日銷售保單的風(fēng)險(xiǎn)值。技術(shù)實(shí)現(xiàn)要素:本發(fā)明提供一種數(shù)據(jù)查詢處理方法及裝置,能夠加快數(shù)據(jù)查詢處理時(shí)間,提升處理效率。本發(fā)明的其他特性和優(yōu)點(diǎn)將通過下面的詳細(xì)描述變得顯然,或部分地通過本發(fā)明的實(shí)踐而習(xí)得。根據(jù)本發(fā)明的一方面,提供了一種數(shù)據(jù)查詢處理方法,包括:根據(jù)查詢需求,在待處理數(shù)據(jù)表中建立分布鍵;根據(jù)所述分布鍵,拆分所述待處理數(shù)據(jù)表,以建立多個(gè)分布式數(shù)據(jù)表;為每個(gè)所述分布式數(shù)據(jù)表分配一個(gè)處理進(jìn)程;以及利用多線程操作,根據(jù)所述查詢需求,基于每個(gè)分布式數(shù)據(jù)表,進(jìn)行數(shù)據(jù)查詢操作。根據(jù)本發(fā)明的一實(shí)施方式,根據(jù)所述查詢需求,基于每個(gè)分布式數(shù)據(jù)表,進(jìn)行數(shù)據(jù)查詢操作包括:在每個(gè)分布式數(shù)據(jù)表中進(jìn)行所述查詢需 求所需的自關(guān)聯(lián)數(shù)據(jù)查詢。根據(jù)本發(fā)明的一實(shí)施方式,利用多線程操作,根據(jù)所述查詢需求,基于每個(gè)分布式數(shù)據(jù)表,進(jìn)行數(shù)據(jù)查詢操作之前還包括:為每個(gè)所述分布式數(shù)據(jù)表進(jìn)行同類數(shù)據(jù)查重及刪除操作。根據(jù)本發(fā)明的一實(shí)施方式,為每個(gè)所述分布式數(shù)據(jù)表進(jìn)行同類數(shù)據(jù)查重及刪除操作包括:針對(duì)每個(gè)所述分布式數(shù)據(jù)表,判斷其中是否存在重復(fù)的同類數(shù)據(jù);如果其中有重復(fù)的同類數(shù)據(jù),則刪除所述同類數(shù)據(jù),并將刪除所述同類數(shù)據(jù)后的所述分布式數(shù)據(jù)表保存為分布式數(shù)據(jù)中間表;以及根據(jù)所述查詢需求,基于每個(gè)分布式數(shù)據(jù)表,進(jìn)行數(shù)據(jù)查詢操作包括:根據(jù)每個(gè)所述分布式數(shù)據(jù)表及其對(duì)應(yīng)的所述分布式數(shù)據(jù)中間表,進(jìn)行所述查詢需求所需的互關(guān)聯(lián)數(shù)據(jù)查詢。根據(jù)本發(fā)明的一實(shí)施方式,所述同類數(shù)據(jù)根據(jù)所述查詢需求確定。根據(jù)本發(fā)明的另一方面,提供了一種數(shù)據(jù)查詢處理裝置,包括:分布鍵建立模塊,用于根據(jù)查詢需求,在待處理數(shù)據(jù)表中建立分布鍵;數(shù)據(jù)表拆分模塊,用于根據(jù)所述分布鍵,拆分所述待處理數(shù)據(jù)表,以建立多個(gè)分布式數(shù)據(jù)表;進(jìn)程分配模塊,用于為每個(gè)所述分布式數(shù)據(jù)表分配一個(gè)處理進(jìn)程;以及數(shù)據(jù)查詢模塊,用于利用多線程操作,根據(jù)所述查詢需求,基于每個(gè)分布式數(shù)據(jù)表,進(jìn)行數(shù)據(jù)查詢操作。根據(jù)本發(fā)明的一實(shí)施方式,所述數(shù)據(jù)查詢模塊包括:自關(guān)聯(lián)查詢子模塊,用于在每個(gè)分布式數(shù)據(jù)表中進(jìn)行所述查詢需求所需的自關(guān)聯(lián)數(shù)據(jù)查詢。根據(jù)本發(fā)明的一實(shí)施方式,該裝置還包括:同類數(shù)據(jù)刪除模塊,用于在所述數(shù)據(jù)查詢模塊進(jìn)行所述數(shù)據(jù)查詢操作之前,為每個(gè)所述分布式數(shù)據(jù)表進(jìn)行同類數(shù)據(jù)查重及刪除操作。根據(jù)本發(fā)明的一實(shí)施方式,所述同類數(shù)據(jù)刪除模塊包括:同類數(shù)據(jù)判斷子模塊,用于針對(duì)每個(gè)所述分布式數(shù)據(jù)表,判斷其中是否存在重復(fù)的同類數(shù)據(jù);及同類數(shù)據(jù)刪除子模塊,用于當(dāng)所述同類數(shù)據(jù)判斷子模塊判斷所述分布式數(shù)據(jù)表中有重復(fù)的同類數(shù)據(jù)時(shí),刪除所述同類數(shù)據(jù),并將刪除所述同類數(shù)據(jù)后的所述分布式數(shù)據(jù)表保存為分布式數(shù)據(jù)中間表;以及所述數(shù)據(jù)查詢模塊包括:互關(guān)聯(lián)查詢子模塊,用于根據(jù)每個(gè)所述分 布式數(shù)據(jù)表及其對(duì)應(yīng)的所述分布式數(shù)據(jù)中間表,進(jìn)行所述查詢需求所需的互關(guān)聯(lián)數(shù)據(jù)查詢。根據(jù)本發(fā)明的一實(shí)施方式,所述同類數(shù)據(jù)根據(jù)所述查詢需求確定。根據(jù)本發(fā)明的數(shù)據(jù)查詢處理方法,通過將大數(shù)據(jù)量的數(shù)據(jù)表根據(jù)分布鍵進(jìn)行拆分,拆分出多個(gè)分布式的子表,且利用多線程操作分布式地處理各個(gè)子表,大大加快了數(shù)據(jù)查詢的處理時(shí)間,提升了數(shù)據(jù)查詢效率。經(jīng)測(cè)算,以一千萬條數(shù)據(jù)量的數(shù)據(jù)表為例,作業(yè)時(shí)間可以由原先的二十幾個(gè)小時(shí)縮短至半個(gè)小時(shí)左右,數(shù)據(jù)查詢處理時(shí)間明顯降低,效果十分顯著。另外,根據(jù)一些實(shí)施例,本發(fā)明的數(shù)據(jù)查詢方法進(jìn)一步對(duì)拆分的分布式數(shù)據(jù)表中的同類數(shù)據(jù)進(jìn)行查重及刪除操作,采用該操作后進(jìn)一步減少了需統(tǒng)計(jì)數(shù)據(jù)量的規(guī)模,從而可以進(jìn)一步減少數(shù)據(jù)查詢處理的時(shí)間,進(jìn)一步提高處理效率。應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性的,并不能限制本發(fā)明。附圖說明通過參照附圖詳細(xì)描述其示例實(shí)施例,本發(fā)明的上述和其它目標(biāo)、特征及優(yōu)點(diǎn)將變得更加顯而易見。圖1是根據(jù)一示例性實(shí)施方式示出的一種數(shù)據(jù)查詢處理方法的流程圖。圖2是根據(jù)一示例性實(shí)施方式示出的另一種數(shù)據(jù)查詢處理方法的流程圖。圖3是根據(jù)一示例性實(shí)施方式示出的一種數(shù)據(jù)查詢處理裝置的框圖。圖4是根據(jù)一示例性實(shí)施方式示出的另一種數(shù)據(jù)查詢處理裝置的框圖。具體實(shí)施方式現(xiàn)在將參考附圖更全面地描述示例實(shí)施方式。然而,示例實(shí)施方式 能夠以多種形式實(shí)施,且不應(yīng)被理解為限于在此闡述的范例;相反,提供這些實(shí)施方式使得本發(fā)明將更加全面和完整,并將示例實(shí)施方式的構(gòu)思全面地傳達(dá)給本領(lǐng)域的技術(shù)人員。附圖僅為本發(fā)明的示意性圖解,并非一定是按比例繪制。圖中相同的附圖標(biāo)記表示相同或類似的部分,因而將省略對(duì)它們的重復(fù)描述。此外,所描述的特征、結(jié)構(gòu)或特性可以以任何合適的方式結(jié)合在一個(gè)或更多實(shí)施方式中。在下面的描述中,提供許多具體細(xì)節(jié)從而給出對(duì)本發(fā)明的實(shí)施方式的充分理解。然而,本領(lǐng)域技術(shù)人員將意識(shí)到,可以實(shí)踐本發(fā)明的技術(shù)方案而省略所述特定細(xì)節(jié)中的一個(gè)或更多,或者可以采用其它的方法、組元、裝置、步驟等。在其它情況下,不詳細(xì)示出或描述公知結(jié)構(gòu)、方法、裝置、實(shí)現(xiàn)或者操作以避免喧賓奪主而使得本發(fā)明的各方面變得模糊。圖1是根據(jù)一示例性實(shí)施方式示出的一種數(shù)據(jù)查詢處理方法的流程圖。如圖1所示,數(shù)據(jù)查詢處理方法10包括:在步驟s102中,根據(jù)查詢需求,在待處理數(shù)據(jù)表中建立分布鍵。以一交易流水?dāng)?shù)據(jù)表(table_test)為例進(jìn)行說明。假設(shè)該交易流水?dāng)?shù)據(jù)表包含4個(gè)字段:交易號(hào)tran_id、客戶號(hào)customer_id、交易金額money、交易日期tran_date。該交易流水?dāng)?shù)據(jù)表如表1所示:表1假設(shè)查詢需求為,在交易流水?dāng)?shù)據(jù)表中查詢每單交易時(shí),該單交易的客戶在該單交易之前的交易額。如果沒有把分布鍵建在customer_id上,例如采用sql語言,則查詢語句為:selecta.tran_id,sum(b.money)fromtable_testa,table_testbwherea.customer_id=b.customer_idandb.tran_date<a.tran_dategroupbya.tran_id;因?yàn)闆]有把分布鍵建在customer_id上,數(shù)據(jù)會(huì)進(jìn)行廣播,會(huì)按照customer_id進(jìn)行重新分布,執(zhí)行效率很低。當(dāng)數(shù)據(jù)量達(dá)到上千萬條時(shí),很可能幾天也執(zhí)行不完。而本發(fā)明實(shí)施方式,則可以根據(jù)上述示例的查詢需求,將分布鍵建立在customer_id上。在步驟s104中,根據(jù)建立的分布鍵,拆分待處理數(shù)據(jù)表,建立多個(gè)分布式數(shù)據(jù)表?;跀?shù)據(jù)庫的分區(qū),根據(jù)分布鍵,對(duì)待處理數(shù)據(jù)表進(jìn)行拆分。仍以上述交易流水?dāng)?shù)據(jù)表和查詢需求為例。假設(shè)數(shù)據(jù)庫的分區(qū)為4個(gè),則將上述交易流水?dāng)?shù)據(jù)表按照customer_id拆分為4個(gè)分布式數(shù)據(jù)表,且使customer_id均勻分布。以customer_id為分布鍵的拆分原則是,保證相同customer_id的數(shù)據(jù)分在同一分布式數(shù)據(jù)表中。假設(shè)拆分后的4個(gè)分布式數(shù)據(jù)表分別如表2-5所示:表2分區(qū)a中的分布式數(shù)據(jù)表表3分區(qū)b中的分布式數(shù)據(jù)表tran_idcustomer_idmoneytran_date2000210.002016-01-011000025.002016-01-0719000210.002016-01-1520000220.002016-01-159000510.002016-01-07表4分區(qū)c中的分布式數(shù)據(jù)表tran_idcustomer_idmoneytran_date3000320.002016-01-026000315.002016-01-0417000310.002016-01-1311000610.002016-01-0912000730.002016-01-11表5分區(qū)d中的分布式數(shù)據(jù)表tran_idcustomer_idmoneytran_date5000410.002016-01-047000420.002016-01-0415000910.002016-01-121600105.002016-01-1318001110.002016-01-15在步驟s106中,為每個(gè)分布式數(shù)據(jù)表分配一個(gè)處理進(jìn)程。仍以上述示例說明,為4個(gè)分布式數(shù)據(jù)表各分配一個(gè)處理進(jìn)程,即共分配4個(gè)處理進(jìn)程。在步驟s108中,利用多線程操作,根據(jù)該查詢需求,基于每個(gè)分布式數(shù)據(jù)表,進(jìn)行數(shù)據(jù)查詢操作。例如,仍以上述示例說明,利用多線程操作,使每個(gè)分布式數(shù)據(jù)表在各自的分區(qū)內(nèi)并行處理,每個(gè)分布式數(shù)據(jù)表和自己進(jìn)行自關(guān)聯(lián)。例如表2所示的分區(qū)a的分布式數(shù)據(jù)表table_test,按照分布鍵customer_id進(jìn)行自關(guān)聯(lián),仍以采用sql語言為例,則查詢語句為:selecta.tran_id,sum(b.money)fromtable_testa,table_testbwherea.customer_id=b.customer_idandb.tran_date<a.tran_dategroupbya.tran_id;其他各分區(qū)中的分布式數(shù)據(jù)表也獨(dú)立進(jìn)行上述自關(guān)聯(lián)查詢操作。需要說明的是,上述示例僅為了便于理解本發(fā)明的方法,而非限制本發(fā)明。本發(fā)明實(shí)施方式提供的數(shù)據(jù)查詢處理方法10,通過將大數(shù)據(jù)量的數(shù)據(jù)表根據(jù)分布鍵進(jìn)行拆分,拆分出多個(gè)分布式的子表,且利用多線程操作分布式地處理各個(gè)子表,大大加快了數(shù)據(jù)查詢的處理時(shí)間,提升了數(shù)據(jù)查詢效率。經(jīng)測(cè)算,以一千萬條數(shù)據(jù)量的數(shù)據(jù)表為例,作業(yè)時(shí)間可以由原先的二十幾個(gè)小時(shí)縮短至半個(gè)小時(shí)左右,數(shù)據(jù)查詢處理時(shí)間明顯降低,效果十分顯著。應(yīng)清楚地理解,本發(fā)明描述了如何形成和使用特定示例,但本發(fā)明的原理不限于這些示例的任何細(xì)節(jié)。相反,基于本發(fā)明公開的內(nèi)容的教導(dǎo),這些原理能夠應(yīng)用于許多其它實(shí)施方式。圖2是根據(jù)一示例性實(shí)施方式示出的另一種數(shù)據(jù)查詢處理方法的流程圖。如圖2所示,數(shù)據(jù)查詢處理方法20包括:在步驟s202中,根據(jù)查詢需求,在待處理數(shù)據(jù)表中建立分布鍵。在步驟s204中,根據(jù)建立的分布鍵,拆分待處理數(shù)據(jù)表,建立多個(gè)分布式數(shù)據(jù)表。在步驟s206中,為每個(gè)分布式數(shù)據(jù)表分配一個(gè)處理進(jìn)程。上述步驟與數(shù)據(jù)查詢處理方法10中的步驟s102~s106相同,在此不再贅述。在步驟s208中,利用多線程操作,根據(jù)查詢需求,為每個(gè)分布式數(shù)據(jù)表進(jìn)行同類數(shù)據(jù)查重及刪除操作。具體地,對(duì)于每個(gè)分布式數(shù)據(jù)表,如果其中有同類數(shù)據(jù)重復(fù)的情況,則可以進(jìn)行同類數(shù)據(jù)查重及刪除操作,并將查重及刪除操作后的分布式數(shù)據(jù)表保存為分布式數(shù)據(jù)中間表。該同類數(shù)據(jù)根據(jù)查詢需求確定,仍以上述示例為例進(jìn)行說明,上述表2和表3中的分布式數(shù)據(jù)表中customer_id為0001和0002的客戶分別在2016-01-04和2016-01-15有兩筆交易,因此可以按照交易日期進(jìn)行合并去重,進(jìn)行查重及刪除操作后生成的分布式數(shù)據(jù)中間表如表6和表7所示:表6分區(qū)a中的分布式數(shù)據(jù)中間表customer_idmoneytran_date000110.002016-01-01000140.002016-01-04000120.002016-01-12000815.002016-01-12表7分區(qū)b中的分布式數(shù)據(jù)中間表customer_idmoneytran_date000210.002016-01-0100025.002016-01-07000230.002016-01-15000510.002016-01-07上述生成分布式數(shù)據(jù)中間表的操作例如可以sql語句:insertintotable_test_1selectdistinctcustomer_id,tran_datefromtable_test;其中table_test為分布式數(shù)據(jù)表,table_test_1為分布式數(shù)據(jù)中間表。在步驟s210中,利用多線程操作,根據(jù)每個(gè)分布式數(shù)據(jù)表及其分布式數(shù)據(jù)中間表,執(zhí)行該查詢需求所需的互關(guān)聯(lián)數(shù)據(jù)查詢。例如,仍以上述示例及采用sql語言為例說明,查詢語句可以為:selecta.customer_id,a.tran_date,sum(b.money)astotal_moneyfromtable_test_1a,table_testbwherea.customer_id=b.customer_idandb.tran_date<a.tran_dategroupbya.customer_id,a.tran_date;并將上述查詢結(jié)果寫入表table_test_2中。之后,再用table左關(guān)聯(lián)table_test_2即可,具體語句可以如下:slecta.tran_id,b.total_moneyfromtable_testaleftjointable_test_2ona.customer_id=b.customer_idanda.tran_date=b.tran_date;本發(fā)明實(shí)施方式提供的數(shù)據(jù)查詢方法20,進(jìn)一步對(duì)拆分的分布式數(shù)據(jù)表中的同類數(shù)據(jù)進(jìn)行查重及刪除操作,采用該操作后進(jìn)一步減少了需統(tǒng)計(jì)數(shù)據(jù)量的規(guī)模,從而可以進(jìn)一步減少數(shù)據(jù)查詢處理的時(shí)間,進(jìn)一步 提高處理效率。本領(lǐng)域技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施方式的全部或部分步驟被實(shí)現(xiàn)為由cpu執(zhí)行的計(jì)算機(jī)程序。在該計(jì)算機(jī)程序被cpu執(zhí)行時(shí),執(zhí)行本發(fā)明提供的上述方法所限定的上述功能。所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,該存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤或光盤等。此外,需要注意的是,上述附圖僅是根據(jù)本發(fā)明示例性實(shí)施方式的方法所包括的處理的示意性說明,而不是限制目的。易于理解,上述附圖所示的處理并不表明或限制這些處理的時(shí)間順序。另外,也易于理解,這些處理可以是例如在多個(gè)模塊中同步或異步執(zhí)行的。下述為本發(fā)明裝置實(shí)施例,可以用于執(zhí)行本發(fā)明方法實(shí)施例。對(duì)于本發(fā)明裝置實(shí)施例中未披露的細(xì)節(jié),請(qǐng)參照本發(fā)明方法實(shí)施例。圖3是根據(jù)一示例性實(shí)施方式示出的一種數(shù)據(jù)查詢處理裝置的框圖。如圖3所示,數(shù)據(jù)查詢處理裝置30包括:分布鍵建立模塊302、數(shù)據(jù)表拆分模塊304、進(jìn)程分配模塊306以及數(shù)據(jù)查詢模塊308。其中,分布鍵建立模塊302用于根據(jù)查詢需求,在待處理數(shù)據(jù)表中建立分布鍵。數(shù)據(jù)表拆分模塊304用于根據(jù)建立的分布鍵,拆分待處理數(shù)據(jù)表,以建立多個(gè)分布式數(shù)據(jù)表。進(jìn)程分配模塊306用于為每個(gè)分布式數(shù)據(jù)表分配一個(gè)處理進(jìn)程。數(shù)據(jù)查詢模塊308用于利用多線程操作,根據(jù)查詢需求,基于每個(gè)分布式數(shù)據(jù)表,進(jìn)行數(shù)據(jù)查詢操作。在一些實(shí)施例中,數(shù)據(jù)查詢模塊308包括:自關(guān)聯(lián)查詢子模塊3082,用于在每個(gè)分布式數(shù)據(jù)表中進(jìn)行查詢需求所需的自關(guān)聯(lián)數(shù)據(jù)查詢。本發(fā)明實(shí)施方式提供的數(shù)據(jù)查詢處理裝置30,通過將大數(shù)據(jù)量的數(shù)據(jù)表根據(jù)分布鍵進(jìn)行拆分,拆分出多個(gè)分布式的子表,且利用多線程操作分布式地處理各個(gè)子表,大大加快了數(shù)據(jù)查詢的處理時(shí)間,提升了數(shù)據(jù)查詢效率。經(jīng)測(cè)算,以一千萬條數(shù)據(jù)量的數(shù)據(jù)表為例,作業(yè)時(shí)間可以由原先的二十幾個(gè)小時(shí)縮短至半個(gè)小時(shí)左右,數(shù)據(jù)查詢處理時(shí)間明顯降 低,效果十分顯著。圖4是根據(jù)一示例性實(shí)施方式示出的另一種數(shù)據(jù)查詢處理裝置的框圖。如圖4所示,數(shù)據(jù)查詢處理裝置40包括:分布鍵建立模塊402、數(shù)據(jù)表拆分模塊404、進(jìn)程分配模塊406、數(shù)據(jù)查詢模塊408以及同類數(shù)據(jù)刪除模塊410。其中,分布鍵建立模塊402用于根據(jù)查詢需求,在待處理數(shù)據(jù)表中建立分布鍵。數(shù)據(jù)表拆分模塊404用于根據(jù)分布鍵,拆分待處理數(shù)據(jù)表,以建立多個(gè)分布式數(shù)據(jù)表。進(jìn)程分配模塊406用于為每個(gè)分布式數(shù)據(jù)表分配一個(gè)處理進(jìn)程。同類數(shù)據(jù)刪除模塊410用于在數(shù)據(jù)查詢模塊408進(jìn)行數(shù)據(jù)查詢操作之前,為每個(gè)分布式數(shù)據(jù)表進(jìn)行同類數(shù)據(jù)查重及刪除操作。數(shù)據(jù)查詢模塊408用于利用多線程操作,根據(jù)查詢需求,基于每個(gè)分布式數(shù)據(jù)表,進(jìn)行數(shù)據(jù)查詢操作。在一些實(shí)施例中,同類數(shù)據(jù)刪除模塊410包括:同類數(shù)據(jù)判斷子模塊4102和同類數(shù)據(jù)刪除子模塊4104,其中同類數(shù)據(jù)判斷子模塊4102用于針對(duì)每個(gè)分布式數(shù)據(jù)表,判斷其中是否存在重復(fù)的同類數(shù)據(jù),同類數(shù)據(jù)刪除子模塊4104用于當(dāng)同類數(shù)據(jù)判斷子模塊判斷分布式數(shù)據(jù)表中有重復(fù)的同類數(shù)據(jù)時(shí),刪除同類數(shù)據(jù),并將刪除同類數(shù)據(jù)后的分布式數(shù)據(jù)表保存為分布式數(shù)據(jù)中間表。數(shù)據(jù)查詢模塊408包括:互關(guān)聯(lián)查詢子模塊4082,用于根據(jù)每個(gè)分布式數(shù)據(jù)表及其對(duì)應(yīng)的分布式數(shù)據(jù)中間表,進(jìn)行查詢需求所需的互關(guān)聯(lián)數(shù)據(jù)查詢。本發(fā)明實(shí)施方式提供的數(shù)據(jù)查詢裝置40,進(jìn)一步對(duì)拆分的分布式數(shù)據(jù)表中的同類數(shù)據(jù)進(jìn)行查重及刪除操作,采用該操作后進(jìn)一步減少了需統(tǒng)計(jì)數(shù)據(jù)量的規(guī)模,從而可以進(jìn)一步減少數(shù)據(jù)查詢處理的時(shí)間,進(jìn)一步提高處理效率。需要注意的是,上述附圖中所示的框圖是功能實(shí)體,不一定必須與物理或邏輯上獨(dú)立的實(shí)體相對(duì)應(yīng)??梢圆捎密浖问絹韺?shí)現(xiàn)這些功能實(shí)體,或在一個(gè)或多個(gè)硬件模塊或集成電路中實(shí)現(xiàn)這些功能實(shí)體,或在不同網(wǎng)絡(luò)和/或處理器裝置和/或微控制器裝置中實(shí)現(xiàn)這些功能實(shí)體。通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員易于理解,這里描述的示例實(shí)施方式可以通過軟件實(shí)現(xiàn),也可以通過軟件結(jié)合必要的硬件的方式來實(shí)現(xiàn)。因此,根據(jù)本發(fā)明實(shí)施方式的技術(shù)方案可以以軟件產(chǎn)品的形式體現(xiàn)出來,該軟件產(chǎn)品可以存儲(chǔ)在一個(gè)非易失性存儲(chǔ)介質(zhì)(可以是cd-rom,u盤,移動(dòng)硬盤等)中或網(wǎng)絡(luò)上,包括若干指令以使得一臺(tái)計(jì)算設(shè)備(可以是個(gè)人計(jì)算機(jī)、服務(wù)器、移動(dòng)終端、或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行根據(jù)本發(fā)明實(shí)施方式的方法。以上具體地示出和描述了本發(fā)明的示例性實(shí)施方式。應(yīng)可理解的是,本發(fā)明不限于這里描述的詳細(xì)結(jié)構(gòu)、設(shè)置方式或?qū)崿F(xiàn)方法;相反,本發(fā)明意圖涵蓋包含在所附權(quán)利要求的精神和范圍內(nèi)的各種修改和等效設(shè)置。當(dāng)前第1頁12當(dāng)前第1頁12