欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種數(shù)據(jù)融合方法及裝置與流程

文檔序號(hào):12786551閱讀:253來(lái)源:國(guó)知局
一種數(shù)據(jù)融合方法及裝置與流程

本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別涉及一種數(shù)據(jù)融合方法及裝置。



背景技術(shù):

隨著信息技術(shù)與互聯(lián)網(wǎng)的不斷發(fā)展,同一業(yè)務(wù)對(duì)象(如企事業(yè)單位)在不同組織(如政府部門(mén))中均可能會(huì)生成如圖像、視頻、音頻、文本等大規(guī)模的數(shù)據(jù)。與此同時(shí),為能夠更加全面的實(shí)現(xiàn)對(duì)同一業(yè)務(wù)對(duì)象的監(jiān)管,如何對(duì)各個(gè)組織中存儲(chǔ)的同一業(yè)務(wù)對(duì)象的數(shù)據(jù)進(jìn)行融合已成為目前比較關(guān)注的問(wèn)題。

目前,在對(duì)同一業(yè)務(wù)對(duì)象的數(shù)據(jù)進(jìn)行融合時(shí),主要是通過(guò)將各個(gè)組織中分別存儲(chǔ)的有關(guān)同一業(yè)務(wù)對(duì)象的數(shù)據(jù)都集中在一起。

但是,在某些組織中,雖然針對(duì)同一業(yè)務(wù)對(duì)象使用的字段主鍵不同,然而這些字段主鍵對(duì)應(yīng)的數(shù)據(jù)卻是相同的,因此,如果只是將各個(gè)組織中存儲(chǔ)的相關(guān)數(shù)據(jù)全部集中在一起,將會(huì)造成數(shù)據(jù)冗余。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明實(shí)施例提供了一種數(shù)據(jù)融合方法及裝置,能夠有效降低數(shù)據(jù)冗余。

第一方面,本發(fā)明實(shí)施例提供了一種數(shù)據(jù)融合方法,預(yù)先構(gòu)建至少一組關(guān)聯(lián)字段主鍵,包括:

獲取目標(biāo)業(yè)務(wù)對(duì)象的至少兩個(gè)待融合數(shù)據(jù);

針對(duì)于每一個(gè)所述待融合數(shù)據(jù),均執(zhí)行A1至A2:

A1:確定所述待融合數(shù)據(jù)對(duì)應(yīng)的至少一個(gè)參考字段主鍵;

A2:根據(jù)確定的每一個(gè)所述參考字段主鍵,將所述待融合數(shù)據(jù)拆分為至少一個(gè)字段,其中,所述至少一個(gè)參考字段主鍵和所述至少一個(gè)字段一一對(duì)應(yīng);

根據(jù)所述至少一組關(guān)聯(lián)字段主鍵,從確定的至少兩個(gè)所述參考字段主鍵中確定出至少兩個(gè)目標(biāo)字段主鍵,其中,所述至少兩個(gè)目標(biāo)字段主鍵中的任意兩個(gè)所述目標(biāo)字段主鍵均不在同一組所述關(guān)聯(lián)字段主鍵中;

利用每一個(gè)所述目標(biāo)字段主鍵分別對(duì)應(yīng)的字段組合成融合數(shù)據(jù)。

優(yōu)選地,

在所述根據(jù)所述至少一組關(guān)聯(lián)字段主鍵,從確定的至少兩個(gè)所述參考字段主鍵中確定出至少兩個(gè)目標(biāo)字段主鍵之后,進(jìn)一步包括:

檢測(cè)每一個(gè)所述目標(biāo)字段主鍵分別對(duì)應(yīng)的字段是否為結(jié)構(gòu)化數(shù)據(jù),如果是,則執(zhí)行N1,否則,執(zhí)行N2;

N1:確定所述字段為第一字段;

N2:確定所述字段為第二字段;

確定所述第二字段的第一數(shù)量;

所述利用每一個(gè)所述目標(biāo)字段主鍵分別對(duì)應(yīng)的字段組合成融合數(shù)據(jù),包括:

當(dāng)所述第一數(shù)量為0時(shí),利用各個(gè)所述第一字段組合成融合數(shù)據(jù)。

優(yōu)選地,

進(jìn)一步包括:

所述確定所述第二字段的第一數(shù)量,進(jìn)一步包括:確定所述第一字段的第二數(shù)量;

所述利用每一個(gè)所述目標(biāo)字段主鍵分別對(duì)應(yīng)的字段組合成融合數(shù)據(jù),包括:

當(dāng)所述第二數(shù)量為0時(shí),確定各個(gè)所述第二字段分別對(duì)應(yīng)的至少一個(gè)第一索引信息;

利用各個(gè)所述第二字段分別對(duì)應(yīng)的所述至少一個(gè)第一索引信息和對(duì)應(yīng)的目標(biāo)字段主鍵組合成融合數(shù)據(jù)。

優(yōu)選地,

進(jìn)一步包括:

所述確定所述第二字段的第一數(shù)量,進(jìn)一步包括:確定所述第一字段的第二數(shù)量;

所述利用每一個(gè)所述目標(biāo)字段主鍵分別對(duì)應(yīng)的字段組合成融合數(shù)據(jù),包括:

當(dāng)所述第一數(shù)量不小于1且所述第二數(shù)量不小于1時(shí),確定各個(gè)所述第二字段分別對(duì)應(yīng)的至少一個(gè)第二索引信息;

利用所述至少一個(gè)所述第一字段、各個(gè)所述第二字段分別對(duì)應(yīng)的所述至少一個(gè)第二索引信息及對(duì)應(yīng)的目標(biāo)字段主鍵組合成融合數(shù)據(jù)。

優(yōu)選地,

進(jìn)一步包括:

根據(jù)預(yù)設(shè)的至少一種數(shù)據(jù)轉(zhuǎn)換規(guī)則,分別將每一個(gè)所述目標(biāo)字段主鍵對(duì)應(yīng)的字段轉(zhuǎn)換為目標(biāo)字段;

所述利用每一個(gè)所述目標(biāo)字段主鍵分別對(duì)應(yīng)的字段組合成融合數(shù)據(jù),包括:

利用各個(gè)所述目標(biāo)字段組合成融合數(shù)據(jù)。

優(yōu)選地,

在所述利用每一個(gè)所述目標(biāo)字段主鍵分別對(duì)應(yīng)的字段組合成融合數(shù)據(jù)之后,進(jìn)一步包括:

根據(jù)預(yù)設(shè)的至少一種展示模型,對(duì)所述融合數(shù)據(jù)進(jìn)行展示;其中,所述至少一種展示模型包括關(guān)系圖、合弦圖、力導(dǎo)向圖、樹(shù)狀圖、列表和時(shí)間軸中的任意一種或多種。

第二方面,本發(fā)明實(shí)施例提供了一種數(shù)據(jù)融合裝置,包括:

構(gòu)建單元,用于預(yù)先構(gòu)建至少一組關(guān)聯(lián)字段主鍵;

獲取單元,用于獲取目標(biāo)業(yè)務(wù)對(duì)象的至少兩個(gè)待融合數(shù)據(jù);

第一確定單元,用于針對(duì)于每一個(gè)所述待融合數(shù)據(jù),確定所述待融合數(shù)據(jù)對(duì)應(yīng)的至少一個(gè)參考字段主鍵;

拆分單元,用于根據(jù)確定的每一個(gè)所述參考字段主鍵,將所述待融合數(shù)據(jù)拆分為至少一個(gè)字段,其中,所述至少一個(gè)參考字段主鍵和所述至少一個(gè)字段一一對(duì)應(yīng);

第二確定單元,用于根據(jù)所述至少一組關(guān)聯(lián)字段主鍵,從確定的至少兩個(gè)所述參考字段主鍵中確定出至少兩個(gè)目標(biāo)字段主鍵,其中,所述至少兩個(gè)目標(biāo)字段主鍵中的任意兩個(gè)所述目標(biāo)字段主鍵均不在同一組所述關(guān)聯(lián)字段主鍵中;

融合單元,用于利用每一個(gè)所述目標(biāo)字段主鍵分別對(duì)應(yīng)的字段組合成融合數(shù)據(jù)。

優(yōu)選地,

進(jìn)一步包括:

第三確定單元,用于檢測(cè)每一個(gè)所述目標(biāo)字段主鍵分別對(duì)應(yīng)的字段是否為結(jié)構(gòu)化數(shù)據(jù),如果是,則確定所述字段為第一字段,否則,確定所述字段為第二字段;

字段數(shù)量確定單元,用于確定所述第二字段的第一數(shù)量;

所述融合單元,具體用于當(dāng)所述第一數(shù)量為0時(shí),利用各個(gè)所述第一字段組合成融合數(shù)據(jù)。

優(yōu)選地,

進(jìn)一步包括:

所述字段數(shù)量確定單元,進(jìn)一步用于確定所述第一字段的第二數(shù)量;

所述融合單元,具體用于當(dāng)所述第二數(shù)量為0時(shí),確定各個(gè)所述第二字段分別對(duì)應(yīng)的至少一個(gè)第一索引信息;利用各個(gè)所述第二字段分別對(duì)應(yīng)的所述至少一個(gè)第一索引信息和對(duì)應(yīng)的目標(biāo)字段主鍵組合成融合數(shù)據(jù);

優(yōu)選地,

所述字段數(shù)量確定單元,進(jìn)一步用于確定所述第一字段的第二數(shù)量;

所述融合單元,具體用于當(dāng)所述第一數(shù)量不小于1且所述第二數(shù)量不小于1時(shí),確定各個(gè)所述第二字段分別對(duì)應(yīng)的至少一個(gè)第二索引信息;利用所述至少一個(gè)所述第一字段、各個(gè)所述第二字段分別對(duì)應(yīng)的所述至少一個(gè)第二索引信息及對(duì)應(yīng)的目標(biāo)字段主鍵組合成融合數(shù)據(jù)。

優(yōu)選地,

進(jìn)一步包括:

數(shù)據(jù)展示單元,用于根據(jù)預(yù)設(shè)的至少一種展示模型,對(duì)所述融合數(shù)據(jù)進(jìn)行展示;其中,所述至少一種展示模型包括關(guān)系圖、合弦圖、力導(dǎo)向圖、樹(shù)狀圖、列表和時(shí)間軸中的任意一種。

本發(fā)明實(shí)施例提供了一種數(shù)據(jù)融合方法及裝置,首先是構(gòu)建出至少一組關(guān)聯(lián)字段主鍵,其中,每一組關(guān)聯(lián)字段主鍵中包括的各個(gè)關(guān)聯(lián)字段主鍵相互關(guān)聯(lián),也即表示對(duì)應(yīng)相同的數(shù)據(jù),其次在獲取目標(biāo)業(yè)務(wù)對(duì)象對(duì)應(yīng)的各個(gè)待融合數(shù)據(jù)后,通過(guò)確定出每一個(gè)待融合數(shù)據(jù)對(duì)應(yīng)的參考字段主鍵,一方面,可根據(jù)預(yù)先構(gòu)建的至少一組關(guān)聯(lián)字段主鍵,從各個(gè)參考字段主鍵中確定出不再同一組關(guān)聯(lián)字段主鍵中的各個(gè)目標(biāo)字段主鍵,另一方面可通過(guò)參考字段主鍵將對(duì)應(yīng)的待融合數(shù)據(jù)拆分成字段,最終,只將所有目標(biāo)字段主鍵分別對(duì)應(yīng)的字段融合在一起,而避免將參考字段主鍵不同當(dāng)對(duì)應(yīng)相同數(shù)據(jù)的字段融合進(jìn)去,因此,有效降低了數(shù)據(jù)冗余。

附圖說(shuō)明

為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1是本發(fā)明一個(gè)實(shí)施例提供的一種數(shù)據(jù)融合方法的流程圖;

圖2是本發(fā)明另一個(gè)實(shí)施例提供的一種數(shù)據(jù)融合方法的流程圖;

圖3是本發(fā)明實(shí)施例提供的數(shù)據(jù)融合裝置所在設(shè)備的硬件架構(gòu)圖;

圖4是本發(fā)明實(shí)施例提供的一種數(shù)據(jù)融合裝置的結(jié)構(gòu)示意圖;

圖5是本發(fā)明另一個(gè)實(shí)施例提供的一種數(shù)據(jù)融合裝置的結(jié)構(gòu)示意圖;

圖6是本發(fā)明又一個(gè)實(shí)施例提供的一種數(shù)據(jù)融合裝置的結(jié)構(gòu)示意圖。

具體實(shí)施方式

為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例,基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)的前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。

如圖1所示,本發(fā)明實(shí)施例提供了一種數(shù)據(jù)融合方法,該方法可以包括以下步驟:

步驟101:預(yù)先構(gòu)建至少一組關(guān)聯(lián)字段主鍵。

步驟102:獲取目標(biāo)業(yè)務(wù)對(duì)象的至少兩個(gè)待融合數(shù)據(jù)。

步驟103:針對(duì)于每一個(gè)所述待融合數(shù)據(jù),確定所述待融合數(shù)據(jù)對(duì)應(yīng)的至少一個(gè)參考字段主鍵。

步驟104:根據(jù)確定的每一個(gè)所述參考字段主鍵,將所述待融合數(shù)據(jù)拆分為至少一個(gè)字段,其中,所述至少一個(gè)參考字段主鍵和所述至少一個(gè)字段一一對(duì)應(yīng)。

步驟105:根據(jù)所述至少一組關(guān)聯(lián)字段主鍵,從確定的至少兩個(gè)所述參考字段主鍵中確定出至少兩個(gè)目標(biāo)字段主鍵,其中,所述至少兩個(gè)目標(biāo)字段主鍵中的任意兩個(gè)所述目標(biāo)字段主鍵均不在同一組所述關(guān)聯(lián)字段主鍵中。

步驟106:利用每一個(gè)所述目標(biāo)字段主鍵分別對(duì)應(yīng)的字段組合成融合數(shù)據(jù)。

在本發(fā)明實(shí)施例中,首先是構(gòu)建出至少一組關(guān)聯(lián)字段主鍵,其中,每一組關(guān)聯(lián)字段主鍵中包括的各個(gè)關(guān)聯(lián)字段主鍵相互關(guān)聯(lián),也即表示對(duì)應(yīng)相同的數(shù)據(jù),其次在獲取目標(biāo)業(yè)務(wù)對(duì)象對(duì)應(yīng)的各個(gè)待融合數(shù)據(jù)后,通過(guò)確定出每一個(gè)待融合數(shù)據(jù)對(duì)應(yīng)的參考字段主鍵,一方面,可根據(jù)預(yù)先構(gòu)建的至少一組關(guān)聯(lián)字段主鍵,從各個(gè)參考字段主鍵中確定出不再同一組關(guān)聯(lián)字段主鍵中的各個(gè)目標(biāo)字段主鍵,另一方面可通過(guò)參考字段主鍵將對(duì)應(yīng)的待融合數(shù)據(jù)拆分成字段,最終,只將所有目標(biāo)字段主鍵分別對(duì)應(yīng)的字段融合在一起,而避免將參考字段主鍵不同當(dāng)對(duì)應(yīng)相同數(shù)據(jù)的字段融合進(jìn)去,因此,有效降低了數(shù)據(jù)冗余。

在本發(fā)明一個(gè)實(shí)施例中,在所述步驟105之后,進(jìn)一步包括:檢測(cè)每一個(gè)所述目標(biāo)字段主鍵分別對(duì)應(yīng)的字段是否為結(jié)構(gòu)化數(shù)據(jù),如果是,則執(zhí)行N1,否則,執(zhí)行N2;

N1:確定所述字段為第一字段;

N2:確定所述字段為第二字段;

確定所述第二字段的第一數(shù)量;

所述步驟106的具體實(shí)施方式包括:當(dāng)所述第一數(shù)量為0時(shí),利用各個(gè)所述第一字段組合成融合數(shù)據(jù)。

在本發(fā)明實(shí)施例中,每個(gè)字段包含一個(gè)字段主鍵及該字段主鍵對(duì)應(yīng)的數(shù)據(jù),如,字段a(如該字段為工商局的數(shù)據(jù)庫(kù)表格中的待融合數(shù)據(jù)拆分而來(lái))中包含字段主鍵“企業(yè)注冊(cè)日期”及“2012/9/3/08:00”,其中,“2012/9/3/08:00”為結(jié)構(gòu)化數(shù)據(jù);再如,字段b(如該字段為稅務(wù)局的數(shù)據(jù)庫(kù)表格中的待融合數(shù)據(jù)拆分而來(lái))中包含字段主鍵“企業(yè)繳稅金額”及“5萬(wàn)元”,其中數(shù)據(jù)“5萬(wàn)元”為結(jié)構(gòu)化數(shù)據(jù)。由于第二字段的數(shù)量為0,字段a和字段b為非關(guān)聯(lián)字段,且如果每個(gè)字段均對(duì)應(yīng)一列,那么最終組合而成的融合數(shù)據(jù)即為字段a和字段b組成的兩列。

在本發(fā)明一個(gè)實(shí)施例中,所述確定所述第二字段的第一數(shù)量,進(jìn)一步包括:確定所述第一字段的第二數(shù)量;所述步驟106的具體實(shí)施方式包括:當(dāng)所述第二數(shù)量為0時(shí),確定各個(gè)所述第二字段分別對(duì)應(yīng)的至少一個(gè)第一索引信息;利用各個(gè)所述第二字段分別對(duì)應(yīng)的所述至少一個(gè)第一索引信息和對(duì)應(yīng)的目標(biāo)字段主鍵組合成融合數(shù)據(jù)。

例如,字段c(如該字段來(lái)源于互聯(lián)網(wǎng)數(shù)據(jù))中包含字段主鍵“企業(yè)信用”及對(duì)應(yīng)的一段播放視頻,其中該播放視頻為非結(jié)構(gòu)化數(shù)據(jù);再如字段d(如該字段來(lái)源于某委辦局)中包含字段主鍵“企業(yè)新聞”及對(duì)應(yīng)的一張圖像,其中該圖像為非結(jié)構(gòu)化數(shù)據(jù)。由于第一字段的數(shù)量為0,字段c和字段d為非關(guān)聯(lián)的字段,那么最終在進(jìn)行數(shù)據(jù)融合時(shí),應(yīng)分別針對(duì)字段c中的播放視頻及字段d中的圖像分別提取出至少一個(gè)索引信息,例如,針對(duì)播放視頻共提取出兩個(gè)索引信息,并分別為“視頻提交人:張某某”和“提交日期:2013/1/1/08:00”,針對(duì)圖像共提取出一個(gè)索引信息,為“圖像提交人:李某”,這樣,最終組合而成的融合數(shù)據(jù),即為“企業(yè)信用”與對(duì)應(yīng)的“視頻提交人:張某某”、“提交日期:2013/1/1/08:00”,以及“企業(yè)新聞”與對(duì)應(yīng)的“圖像提交人:李某”。

在本發(fā)明一個(gè)實(shí)施例中,所述確定所述第二字段的第一數(shù)量,進(jìn)一步包括:確定所述第一字段的第二數(shù)量;所述步驟106的具體實(shí)施方式包括:當(dāng)所述第一數(shù)量不小于1且所述第二數(shù)量不小于1時(shí),確定各個(gè)所述第二字段分別對(duì)應(yīng)的至少一個(gè)第二索引信息;利用所述至少一個(gè)所述第一字段、各個(gè)所述第二字段分別對(duì)應(yīng)的所述至少一個(gè)第二索引信息及對(duì)應(yīng)的目標(biāo)字段主鍵組合成融合數(shù)據(jù)。

例如,以上述實(shí)施例中的字段a及字段c為例,在進(jìn)行數(shù)據(jù)融合時(shí),由于字段a屬于結(jié)構(gòu)化數(shù)據(jù),而字段c屬于非結(jié)構(gòu)化數(shù)據(jù),也即第一字段的數(shù)量為1,第二字段的數(shù)量為1,因此,應(yīng)先將字段c按照上述實(shí)施例提取出索引信息,那么在本發(fā)明實(shí)施例中,最終由字段a,以及字段主鍵“企業(yè)信用”與對(duì)應(yīng)的兩個(gè)索引信息“視頻提交人:張某某”、“提交日期:2013/1/1/08:00”組合而成。其中,字段a及字段c也為非關(guān)聯(lián)的字段,且可把字段a作為融合數(shù)據(jù)的第1列(第一行為企業(yè)注冊(cè)日期、第二行為2012/9/3/08:00),而將企業(yè)信用作為第2列的第一行,視頻提交人:張某某作為第2列的第二行,提交日期:2013/1/1/08:00作為第2列的第三行。針對(duì)多個(gè)字段融合,可依次類(lèi)推…

需要說(shuō)明的是,融合數(shù)據(jù)的組成形式并不局限于上述各個(gè)實(shí)施例,還可包括其他多種可以實(shí)現(xiàn)的組成形式。

在本發(fā)明一個(gè)實(shí)施例中,為了能夠使數(shù)據(jù)的格式統(tǒng)一,進(jìn)一步包括:根據(jù)預(yù)設(shè)的至少一種數(shù)據(jù)轉(zhuǎn)換規(guī)則,分別將每一個(gè)所述目標(biāo)字段主鍵對(duì)應(yīng)的字段轉(zhuǎn)換為目標(biāo)字段;所述步驟106的具體實(shí)施方式可包括:利用各個(gè)所述目標(biāo)字段組合成融合數(shù)據(jù)。

例如,針對(duì)日期設(shè)置的數(shù)據(jù)轉(zhuǎn)換規(guī)則為年/月/日/時(shí)分:秒毫秒,假設(shè)拆分得到的字段e中記錄的企業(yè)注冊(cè)日期為00:00/2/3/2016,字段f中記錄的企業(yè)繳稅日期為2016/3/1/09:00,那么為使融合數(shù)據(jù)中所有日期的格式統(tǒng)一,則需將字段e中記錄的企業(yè)注冊(cè)日期按照設(shè)置的標(biāo)準(zhǔn):年/月/日/時(shí)分:秒毫秒,轉(zhuǎn)換為2016/3/2/00:00,由于字段f中記錄的日期格式與規(guī)則相同,因此,無(wú)需在進(jìn)行轉(zhuǎn)換。之后,由完成轉(zhuǎn)換的字段e與字段f組合成融合數(shù)據(jù)(字段e與字段f為非關(guān)聯(lián)的字段)。那么針對(duì)其他的各個(gè)字段中記錄的與標(biāo)準(zhǔn)不相同的日期,與字段e的轉(zhuǎn)換原理相同,不再贅述。

再如,針對(duì)性別設(shè)置的數(shù)據(jù)轉(zhuǎn)換規(guī)則為M(表示男)、F(表示女),假設(shè)拆分得到的字段g中記錄的企業(yè)合法人的性別用0(表示男)、1表示(表示女),字段h中記錄的企業(yè)納稅人的性別用M(表示男)、F(表示女)表示,那么為使融合數(shù)據(jù)中所有性別表示統(tǒng)一,則需按照設(shè)置的標(biāo)準(zhǔn)M和F,將字段g中記錄的企業(yè)合法人的性別0轉(zhuǎn)換為M,將性別1轉(zhuǎn)換為F,但是由于字段h中記錄的性別表示與規(guī)則相同,因此,無(wú)需在進(jìn)行轉(zhuǎn)換。之后,由完成轉(zhuǎn)換的字段g及符合標(biāo)準(zhǔn)的字段h組合成融合數(shù)據(jù)(字段g和字段h為非關(guān)聯(lián)的字段)。

在本發(fā)明一個(gè)實(shí)施例中,在所述步驟106之后,可進(jìn)一步包括:根據(jù)預(yù)設(shè)的至少一種展示模型,對(duì)所述融合數(shù)據(jù)進(jìn)行展示;其中,所述至少一種展示模型包括關(guān)系圖、合弦圖、力導(dǎo)向圖、樹(shù)狀圖、列表和時(shí)間軸中的任意一種。

在本發(fā)明實(shí)施例中,在將各個(gè)待融合數(shù)據(jù)實(shí)現(xiàn)融合之后,可向每一個(gè)組織內(nèi)部人員(如政府管理人員)提供一個(gè)數(shù)據(jù)檢索系統(tǒng),如,政府管理人員可通過(guò)輸入關(guān)鍵字,如企業(yè)名稱(chēng)、法人姓名、企業(yè)注冊(cè)號(hào)以及組織機(jī)構(gòu)代碼等以列表的形式將某企業(yè)的所有融合數(shù)據(jù)進(jìn)行展示。例如,針對(duì)某企業(yè)的股東、投資、高管、法院判決公告、歷史股東等維度的文字信息可以關(guān)系圖、合弦圖、力導(dǎo)向圖、樹(shù)狀圖等關(guān)聯(lián)圖的形式進(jìn)行展示,而且還可實(shí)現(xiàn)不同關(guān)聯(lián)圖之間的轉(zhuǎn)換。再如,針對(duì)企業(yè)的榮譽(yù)事件、財(cái)資事件、違規(guī)事件、經(jīng)營(yíng)事件、資本運(yùn)作事件等類(lèi)列,系統(tǒng)可對(duì)每個(gè)類(lèi)別的事件設(shè)立一個(gè)時(shí)間軸,最終將企業(yè)的事件以在時(shí)間軸上散點(diǎn)的形式展示。

除此之外,針對(duì)目標(biāo)業(yè)務(wù)對(duì)象的融合數(shù)據(jù)的展示模型,并不局限于上述實(shí)施例中提到的關(guān)系圖、合弦圖、力導(dǎo)向圖、樹(shù)狀圖、列表和時(shí)間軸,還可包括其他多種展示模型。

下面將以目標(biāo)業(yè)務(wù)對(duì)象為企業(yè)A、企業(yè)A共包括3個(gè)待融合數(shù)據(jù)為例,詳細(xì)說(shuō)明本發(fā)明實(shí)施例提供的一種數(shù)據(jù)融合方法,如圖2所示,該方法可以包括以下步驟:

步驟201:預(yù)先構(gòu)建N(≥1)組關(guān)聯(lián)字段主鍵。

預(yù)先構(gòu)建出N(≥1)組關(guān)聯(lián)字段主鍵,那么無(wú)論是本次針對(duì)企業(yè)A的數(shù)據(jù)進(jìn)行融合,還是之后針對(duì)其它業(yè)務(wù)對(duì)象的數(shù)據(jù)進(jìn)行融合,均可以利用這N組關(guān)聯(lián)字段主鍵。可見(jiàn),N的值應(yīng)不宜過(guò)小,且每一組中的關(guān)聯(lián)字段主鍵的數(shù)量也不宜太小。

在本發(fā)明實(shí)施例中,例如,共構(gòu)建了3組關(guān)聯(lián)字段主鍵,且這3組關(guān)聯(lián)字段主鍵可以囊括企業(yè)A的相關(guān)待融合數(shù)據(jù)的所有可能關(guān)聯(lián)的字段主鍵,其中,第1組關(guān)聯(lián)字段主鍵包括X、M、P;第2組關(guān)聯(lián)字段主鍵包括R、Z;第3組關(guān)聯(lián)字段主鍵包括K、L。

步驟202:分別獲取企業(yè)A的待融合數(shù)據(jù)1、待融合數(shù)據(jù)2及待融合數(shù)據(jù)3。

例如,待融合數(shù)據(jù)1的來(lái)源可能是工商局、稅務(wù)局、住建局、環(huán)保局及食藥監(jiān)局中的任意一個(gè)委辦局,那么,如利用ETL(Extract-Transform-Load,數(shù)據(jù)抽取工具)工具從相應(yīng)委辦局對(duì)應(yīng)的數(shù)據(jù)源中抽取出有關(guān)企業(yè)A的所有待融合數(shù)據(jù),而且還可通過(guò)對(duì)抽取出的待融合數(shù)據(jù)進(jìn)行簡(jiǎn)單的清洗加工,以對(duì)一些異常數(shù)據(jù)進(jìn)行檢測(cè)與剔除,最后將剩余得到的待融合數(shù)據(jù)1加載至預(yù)先定義的數(shù)據(jù)倉(cāng)庫(kù)模型中。

再如,待融合數(shù)據(jù)2的來(lái)源可能是類(lèi)似黨政機(jī)關(guān)、行政機(jī)構(gòu)、司法機(jī)關(guān)等數(shù)據(jù)保密性要求較高的部門(mén),此時(shí),可通過(guò)與相應(yīng)的政務(wù)外網(wǎng)進(jìn)行連接,使用特定的安全系統(tǒng)接口采集相關(guān)部門(mén)中的待融合數(shù)據(jù)。而且還可通過(guò)安全系統(tǒng)接口實(shí)現(xiàn)待融合數(shù)據(jù)的更新及待融合數(shù)據(jù)質(zhì)量校驗(yàn)的功能。

又如,待融合數(shù)據(jù)3的來(lái)源可能是互聯(lián)網(wǎng),此時(shí)可借助大型互聯(lián)網(wǎng)搜索引擎,通過(guò)爬取關(guān)鍵字的方式實(shí)現(xiàn)待融合數(shù)據(jù)3的獲取。

步驟203:確定待融合數(shù)據(jù)1對(duì)應(yīng)的參考字段主鍵為X、Y、Z,待融合數(shù)據(jù)2對(duì)應(yīng)M、N,待融合數(shù)據(jù)3對(duì)應(yīng)P、Q、R。

步驟204:根據(jù)X、Y、Z,將待融合數(shù)據(jù)1拆分為字段x、y及z,根據(jù)M、N,將待融合數(shù)據(jù)2拆分為字段m及n,根據(jù)P、Q、R,將待融合數(shù)據(jù)3拆分為字段p、q及r。

以待融合數(shù)據(jù)1為例,待融合數(shù)據(jù)1中包括X、Y、Z共三個(gè)參考字段主鍵,其中,每一個(gè)參考字段主鍵均會(huì)對(duì)應(yīng)一部分?jǐn)?shù)據(jù),例如,參考字段主鍵X為“繳稅日期”,相對(duì)應(yīng)的數(shù)據(jù)可能包括“2016/1/1/08:00”、“2017/1/1/08:00”,則將待融合數(shù)據(jù)1拆分出的字段x(視為一列)中的這一列的第一行為繳稅日期,第二行和第三行分別為2016/1/1/08:00和2017/1/1/08:00。

步驟205:根據(jù)構(gòu)建的N組關(guān)聯(lián)字段主鍵,確定出不再同一組的5個(gè)目標(biāo)字段主鍵X、Y、Z、N及Q。

根據(jù)步驟201中的3組關(guān)聯(lián)字段主鍵,可以得出,待融合數(shù)據(jù)1中的參考字段主鍵X、待融合數(shù)據(jù)2中的參考字段主鍵M及待融合數(shù)據(jù)3中的參考字段主鍵P是關(guān)聯(lián)字段主鍵,也就是說(shuō),這三個(gè)參考字段主鍵對(duì)應(yīng)的數(shù)據(jù)是相同的,根據(jù)上述步驟204,對(duì)應(yīng)的均是2016/1/1/08:00和2017/1/1/08:00這兩個(gè)繳稅日期,因此,只需保留這三個(gè)參考字段主鍵中的任意一個(gè)即可,但具體是保留哪一個(gè),可在根據(jù)實(shí)際需要在上述步驟201中設(shè)置出來(lái)。

另外,待融合數(shù)據(jù)1中的參考字段主鍵Z與待融合數(shù)據(jù)3中的參考字段主鍵R是關(guān)聯(lián)的,因此與上述方法相同,保留其中一個(gè)。

在本發(fā)明實(shí)施例中,最終在參考字段主鍵X、M、P中保留的是X,在參考字段主鍵Z和P中保留的是Z,因此最后確定出的目標(biāo)字段主鍵為待融合數(shù)據(jù)1中的X、Y、Z,待融合數(shù)據(jù)2中的N及待融合數(shù)據(jù)3中的Q。

步驟206:檢測(cè)出字段x、y及z均為結(jié)構(gòu)化數(shù)據(jù),字段n及q為非結(jié)構(gòu)化數(shù)據(jù)。

在本發(fā)明實(shí)施例中,是以既包括結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù)為例。

步驟207:確定字段n對(duì)應(yīng)的兩個(gè)索引信息,字段q對(duì)應(yīng)的一個(gè)索引信息。

針對(duì)字段n及字段q中分別對(duì)應(yīng)的非結(jié)構(gòu)化數(shù)據(jù),并不能直接進(jìn)行融合,而是需要通過(guò)在每一個(gè)非結(jié)構(gòu)化數(shù)據(jù)中抽取出相對(duì)應(yīng)的索引要素。

例如,針對(duì)字段n中抽取的兩個(gè)索引信息分別是“提交人:王某”及“提交日期2016/1/1/08:00”。

另外,為保證數(shù)據(jù)格式的統(tǒng)一,還可預(yù)先針對(duì)日期、性別等其它的數(shù)據(jù)轉(zhuǎn)換規(guī)則,以將字段x、字段y、字段z中的相應(yīng)數(shù)據(jù),以及字段n及字段q分別對(duì)應(yīng)的索引信息進(jìn)行相應(yīng)的數(shù)據(jù)轉(zhuǎn)換。

步驟208:將字段x、y、z,字段n的兩個(gè)索引信息和X,字段q的一個(gè)索引信息及Q組合成融合數(shù)據(jù)。

在本發(fā)明實(shí)施例中,以字段x、字段y、字段z分別對(duì)應(yīng)一列為例,那么在進(jìn)行最終的數(shù)據(jù)融合時(shí),可預(yù)先設(shè)置一個(gè)融合數(shù)據(jù)表,然后將字段x、字段y、字段z作為該融合數(shù)據(jù)表的前三列,且每一列的第一行分別為目標(biāo)字段主鍵X、Y、Z,每一列的第二行、第三行…放置X、Y、Z分別對(duì)應(yīng)的數(shù)據(jù),那么第4列的第一行可為目標(biāo)字段主鍵N,第4列的第二行和第三行可分別放置字段n的兩個(gè)索引信息“提交人:王某”及“提交日期2016/1/1/08:00”,第5列的第一行可為目標(biāo)字段主鍵Q,第5列的第二行可為Q對(duì)應(yīng)的一個(gè)索引信息。

如圖3、圖4所示,本發(fā)明實(shí)施例提供了一種一種數(shù)據(jù)融合裝置。裝置實(shí)施例可以通過(guò)軟件實(shí)現(xiàn),也可以通過(guò)硬件或者軟硬件結(jié)合的方式實(shí)現(xiàn)。從硬件層面而言,如圖3所示,為本發(fā)明實(shí)施例提供的數(shù)據(jù)融合裝置所在設(shè)備的一種硬件結(jié)構(gòu)圖,除了圖3所示的處理器、內(nèi)存、網(wǎng)絡(luò)接口、以及非易失性存儲(chǔ)器之外,實(shí)施例中裝置所在的設(shè)備通常還可以包括其他硬件,如負(fù)責(zé)處理報(bào)文的轉(zhuǎn)發(fā)芯片等等。以軟件實(shí)現(xiàn)為例,如圖4所示,作為一個(gè)邏輯意義上的裝置,是通過(guò)其所在設(shè)備的CPU將非易失性存儲(chǔ)器中對(duì)應(yīng)的計(jì)算機(jī)程序指令讀取到內(nèi)存中運(yùn)行形成的。本實(shí)施例提供的一種數(shù)據(jù)融合裝置,包括:

構(gòu)建單元401,用于預(yù)先構(gòu)建至少一組關(guān)聯(lián)字段主鍵;

獲取單元402,用于獲取目標(biāo)業(yè)務(wù)對(duì)象的至少兩個(gè)待融合數(shù)據(jù);

第一確定單元403,用于針對(duì)于每一個(gè)所述待融合數(shù)據(jù),確定所述待融合數(shù)據(jù)對(duì)應(yīng)的至少一個(gè)參考字段主鍵;

拆分單元404,用于根據(jù)確定的每一個(gè)所述參考字段主鍵,將所述待融合數(shù)據(jù)拆分為至少一個(gè)字段,其中,所述至少一個(gè)參考字段主鍵和所述至少一個(gè)字段一一對(duì)應(yīng);

第二確定單元405,用于根據(jù)所述至少一組關(guān)聯(lián)字段主鍵,從確定的至少兩個(gè)所述參考字段主鍵中確定出至少兩個(gè)目標(biāo)字段主鍵,其中,所述至少兩個(gè)目標(biāo)字段主鍵中的任意兩個(gè)所述目標(biāo)字段主鍵均不在同一組所述關(guān)聯(lián)字段主鍵中;

融合單元406,用于利用每一個(gè)所述目標(biāo)字段主鍵分別對(duì)應(yīng)的字段組合成融合數(shù)據(jù);

如圖5所示,在本發(fā)明一個(gè)實(shí)施例中,進(jìn)一步包括:

進(jìn)一步包括:

第三確定單元501,用于檢測(cè)每一個(gè)所述目標(biāo)字段主鍵分別對(duì)應(yīng)的字段是否為結(jié)構(gòu)化數(shù)據(jù),如果是,則確定所述字段為第一字段,否則,確定所述字段為第二字段;

字段數(shù)量確定單元502,用于確定所述第二字段的第一數(shù)量;

所述融合單元406,具體用于當(dāng)所述第一數(shù)量為0時(shí),利用各個(gè)所述第一字段組合成融合數(shù)據(jù)。

在本發(fā)明一個(gè)實(shí)施例中,所述字段數(shù)量確定單元502,進(jìn)一步用于確定所述第一字段的第二數(shù)量;

所述融合單元406,具體用于當(dāng)所述第二數(shù)量為0時(shí),確定各個(gè)所述第二字段分別對(duì)應(yīng)的至少一個(gè)第一索引信息;利用各個(gè)所述第二字段分別對(duì)應(yīng)的所述至少一個(gè)第一索引信息和對(duì)應(yīng)的目標(biāo)字段主鍵組合成融合數(shù)據(jù);

在本發(fā)明一個(gè)實(shí)施例中,所述字段數(shù)量確定單元502,進(jìn)一步用于確定所述第一字段的第二數(shù)量;

所述融合單元406,具體用于當(dāng)所述第一數(shù)量不小于1且所述第二數(shù)量不小于1時(shí),確定各個(gè)所述第二字段分別對(duì)應(yīng)的至少一個(gè)第二索引信息;利用所述至少一個(gè)所述第一字段、各個(gè)所述第二字段分別對(duì)應(yīng)的所述至少一個(gè)第二索引信息及對(duì)應(yīng)的目標(biāo)字段主鍵組合成融合數(shù)據(jù)。

如圖6所示,在本發(fā)明一個(gè)實(shí)施例中,

進(jìn)一步包括:

數(shù)據(jù)展示單元601,用于根據(jù)預(yù)設(shè)的至少一種展示模型,對(duì)所述融合數(shù)據(jù)進(jìn)行展示;其中,所述至少一種展示模型包括關(guān)系圖、合弦圖、力導(dǎo)向圖、樹(shù)狀圖、列表和時(shí)間軸中的任意一種。

本發(fā)明實(shí)施例提供了一種可讀介質(zhì),包括執(zhí)行指令,當(dāng)存儲(chǔ)控制器的處理器執(zhí)行所述執(zhí)行指令時(shí),所述存儲(chǔ)控制器執(zhí)行上述各個(gè)實(shí)施例中的任意一個(gè)方法。

本發(fā)明實(shí)施例提供了一種存儲(chǔ)控制器,包括:處理器、存儲(chǔ)器和總線;

所述存儲(chǔ)器用于存儲(chǔ)執(zhí)行指令,所述處理器與所述存儲(chǔ)器通過(guò)所述總線連接,當(dāng)所述存儲(chǔ)控制器運(yùn)行時(shí),所述處理器執(zhí)行所述存儲(chǔ)器存儲(chǔ)的所述執(zhí)行指令,以使所述存儲(chǔ)控制器執(zhí)行上述各個(gè)實(shí)施例中的任意一個(gè)方法。

上述裝置內(nèi)的各單元之間的信息交互、執(zhí)行過(guò)程等內(nèi)容,由于與本發(fā)明方法實(shí)施例基于同一構(gòu)思,具體內(nèi)容可參見(jiàn)本發(fā)明方法實(shí)施例中的敘述,此處不再贅述。

綜上,本發(fā)明各個(gè)實(shí)施例至少具有如下有益效果:

1、在本發(fā)明實(shí)施例中,首先是構(gòu)建出至少一組關(guān)聯(lián)字段主鍵,其中,每一組關(guān)聯(lián)字段主鍵中包括的各個(gè)關(guān)聯(lián)字段主鍵相互關(guān)聯(lián),也即表示對(duì)應(yīng)相同的數(shù)據(jù),其次在獲取目標(biāo)業(yè)務(wù)對(duì)象對(duì)應(yīng)的各個(gè)待融合數(shù)據(jù)后,通過(guò)確定出每一個(gè)待融合數(shù)據(jù)對(duì)應(yīng)的參考字段主鍵,一方面,可根據(jù)預(yù)先構(gòu)建的至少一組關(guān)聯(lián)字段主鍵,從各個(gè)參考字段主鍵中確定出不再同一組關(guān)聯(lián)字段主鍵中的各個(gè)目標(biāo)字段主鍵,另一方面可通過(guò)參考字段主鍵將對(duì)應(yīng)的待融合數(shù)據(jù)拆分成字段,最終,只將所有目標(biāo)字段主鍵分別對(duì)應(yīng)的字段融合在一起,而避免將參考字段主鍵不同當(dāng)對(duì)應(yīng)相同數(shù)據(jù)的字段融合進(jìn)去,因此,有效降低了數(shù)據(jù)冗余,而且也便于對(duì)數(shù)據(jù)進(jìn)行查看。

2、在本發(fā)明實(shí)施例中,通過(guò)將目標(biāo)業(yè)務(wù)對(duì)象的來(lái)自不同數(shù)據(jù)源的待融合數(shù)據(jù)進(jìn)行融合,打破了各個(gè)數(shù)據(jù)源之間孤立的數(shù)據(jù)存儲(chǔ),從而也可提高對(duì)目標(biāo)業(yè)務(wù)對(duì)象監(jiān)管的準(zhǔn)確性。

3、在本發(fā)明實(shí)施例中,在將目標(biāo)業(yè)務(wù)對(duì)象的各個(gè)待融合數(shù)據(jù)融合之后,向各個(gè)組織內(nèi)部人員提供了展示系統(tǒng),該展示系統(tǒng)可根據(jù)接收到的不同的點(diǎn)擊觸發(fā),以不同的展示模型展示目標(biāo)業(yè)務(wù)對(duì)象的相關(guān)數(shù)據(jù)。

需要說(shuō)明的是,在本文中,諸如第一和第二之類(lèi)的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開(kāi)來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、物品或者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)〃·····”限定的要素,并不排除在包括所述要素的過(guò)程、方法、物品或者設(shè)備中還存在另外的相同因素。

本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述方法實(shí)施例的全部或部分步驟可以通過(guò)程序指令相關(guān)的硬件來(lái)完成,前述的程序可以存儲(chǔ)在計(jì)算機(jī)可讀取的存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),執(zhí)行包括上述方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:ROM、RAM、磁碟或者光盤(pán)等各種可以存儲(chǔ)程序代碼的介質(zhì)中。

最后需要說(shuō)明的是:以上所述僅為本發(fā)明的較佳實(shí)施例,僅用于說(shuō)明本發(fā)明的技術(shù)方案,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)所做的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍內(nèi)。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
昌平区| 阳江市| 清水县| 五大连池市| 武穴市| 镇坪县| 衡水市| 南阳市| 兰坪| 来宾市| 阿尔山市| 凤庆县| 喀喇沁旗| 金堂县| 宜川县| 游戏| 运城市| 吴忠市| 肃宁县| 英超| 宁河县| 定兴县| 芒康县| 永寿县| 伊宁县| 广饶县| 山阴县| 汉川市| 景谷| 准格尔旗| 南昌市| 元氏县| 涞水县| 宜昌市| 江安县| 鹤山市| 尉氏县| 延吉市| 康平县| 安康市| 汽车|