本發(fā)明涉及復(fù)雜數(shù)據(jù)網(wǎng)絡(luò)構(gòu)造與數(shù)據(jù)可視化領(lǐng)域,尤其涉及一種基于大數(shù)據(jù)的復(fù)雜金融交易網(wǎng)絡(luò)活動圖的構(gòu)造方法。
背景技術(shù):
金融犯罪是當(dāng)今社會面臨的重大問題,其中洗錢犯罪活動尤為突出,對國家的經(jīng)濟(jì)發(fā)展和安全等多方面都產(chǎn)生了極其惡劣的影響。當(dāng)前日益龐大起來的洗錢交易網(wǎng)絡(luò)結(jié)構(gòu)形式多樣、錯綜復(fù)雜。從這些交易網(wǎng)絡(luò)中快速地發(fā)現(xiàn)、挖掘可疑對象,追溯可疑資金的來源和去向,不依靠一定的專家經(jīng)驗輔助,完全無法高效準(zhǔn)確完成。其主要困難體現(xiàn)在:1)大數(shù)據(jù),犯罪分子掌握了大量的賬戶,多的時候達(dá)到上千個,然后經(jīng)過多次多級互相轉(zhuǎn)賬后,其形成的交易數(shù)據(jù)可以達(dá)到數(shù)百萬甚至上千萬的交易記錄。2)關(guān)系錯綜復(fù)雜,賬戶之間可以互相打款,資金拆散、合并,涉及多個金融機(jī)構(gòu)、多種交易方式。3)動態(tài)性:隨著信息技術(shù)的快速發(fā)展,網(wǎng)上轉(zhuǎn)賬的快速性導(dǎo)致交易隨時間在快速變化,依靠一般的靜態(tài)分析很難發(fā)現(xiàn)規(guī)律。4)不確定性,由于了解的信息的不完整以及數(shù)據(jù)的收集不完整,導(dǎo)致資金流向無法理清。上述問題導(dǎo)致了使得依靠人工難以梳理出資金流向的脈絡(luò)。事實上,這些交易數(shù)據(jù)之間存在關(guān)聯(lián),這些關(guān)聯(lián)形成了一個復(fù)雜的網(wǎng)絡(luò),為此可以用圖來表示金融網(wǎng)絡(luò)交易。
金融網(wǎng)絡(luò)就是網(wǎng)絡(luò)與金融活動的結(jié)合。金融網(wǎng)絡(luò)中的節(jié)點代表的是個人客戶、企業(yè)以及賬號,網(wǎng)絡(luò)中的邊關(guān)系代表的是這些節(jié)點之間發(fā)生的交易關(guān)系。而交易關(guān)系背后代表的是經(jīng)濟(jì)利益關(guān)系,邊的關(guān)系中包含的信息包括交易對象、交易的時間、交易金額、交易的方式、資金用途等信息。由于交易存在方向性,金融網(wǎng)絡(luò)實質(zhì)上是一個有向圖。金融網(wǎng)絡(luò)中的節(jié)點也包含一些其他屬性信息。
有研究將金融網(wǎng)絡(luò)表示為一個無向賦權(quán)圖,節(jié)點表示一個用戶賬號或一個自然人,邊表示一筆轉(zhuǎn)賬交易,然后利用圖論技術(shù)發(fā)現(xiàn)網(wǎng)絡(luò)中的可疑交易。也有利用圖論方法識別洗錢網(wǎng)絡(luò)中分賬階段可疑交易時將表示為一個有向圖,并且在節(jié)點中加入了屬性信息,便于進(jìn)行關(guān)聯(lián)分析,還有利用圖挖掘算法進(jìn)行可疑交易檢測時也是使用了同樣的描述方式表達(dá)金融網(wǎng)絡(luò)中的活動,這種表示方法只考慮交易中的轉(zhuǎn)賬記錄,而并沒有考慮存取款記錄,而且也沒有考慮交易的方向。還有學(xué)者提出為了讓基于圖論的挖掘算法有更好的效率,同時又不損失其他有效信息,需要對資金流向圖進(jìn)行擴(kuò)展,他們提出的圖的構(gòu)建方式中,節(jié)點和邊都有不同的屬性,節(jié)點有賬戶、交易和交易類型三種。這些方法都是將金融網(wǎng)絡(luò)中的各種活動表達(dá)為一個圖,用節(jié)點表示金融網(wǎng)絡(luò)中的實體,用邊表示資金流動,但是這些方法并沒有完全表示出交易網(wǎng)絡(luò)中的各個屬性,也沒有擴(kuò)展性和通用性,不便于利用多種智能分析方法對同一個數(shù)據(jù)集進(jìn)行分析挖掘。
在中國實用新型專利說明書CN 200910063081.9中公開了一種動態(tài)金融網(wǎng)絡(luò)監(jiān)測分析方法,其中提到了建立動態(tài)金融網(wǎng)絡(luò)模型,其金融模型把金融數(shù)據(jù)庫中的數(shù)據(jù)轉(zhuǎn)換成有向加權(quán)圖流,在有新的金融交易數(shù)據(jù)出現(xiàn)時,可以更新金融數(shù)據(jù)庫和動態(tài)金融網(wǎng)絡(luò)模型。在中國實用新型專利說明書CN201510332454.3公開了一種金融網(wǎng)絡(luò)可疑資金追蹤與識別方法,其中包括構(gòu)建金融交易網(wǎng)絡(luò)拓?fù)鋱D,即將原始金融交易流水經(jīng)過處理后轉(zhuǎn)換成一張金融交易圖,圖包含了原始金融交易流水中所有的交易關(guān)系和資金流向。
上述技術(shù)和方法都是把金融網(wǎng)絡(luò)圖作為一個二維圖,把所有的信息都設(shè)置在邊上。1)但事實上金融網(wǎng)絡(luò)圖包含了多種不同的屬性,主要包括交易金額、交易時間、交易地點、交易方式、資金用途、交易對象等等,如果把這些交易屬性集中在一起,則很難理清交易的脈絡(luò)和走向。因此,金融交易網(wǎng)絡(luò)應(yīng)當(dāng)是多維網(wǎng)絡(luò)圖。2)現(xiàn)有的方法沒有考慮數(shù)據(jù)的規(guī)模,對于復(fù)雜的金融交易或者洗錢行為,由于IT技術(shù)的發(fā)展,很多采用了自動轉(zhuǎn)賬,這樣經(jīng)過多次轉(zhuǎn)移后,其形成的交易筆數(shù)可以達(dá)到數(shù)千萬筆。3)金融交易存在動態(tài)特性,一方面是交易本身總是在動態(tài)變化;另一方面是隨著線索的更新,交易對象不斷增加,隨之導(dǎo)致交易網(wǎng)絡(luò)不斷變化?,F(xiàn)有的技術(shù)雖然考慮了增量更新策略,但都是離線操作,且需要人工干預(yù)。4)金融交易網(wǎng)絡(luò)形成的二維圖中,存在嵌套圖的問題,現(xiàn)有的方法沒有考慮如何進(jìn)行處理。
技術(shù)實現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是克服現(xiàn)有技術(shù)中對金融網(wǎng)絡(luò)圖表示簡單,屬性過少以及結(jié)構(gòu)不合理的缺點,提出一種基于大數(shù)據(jù)的復(fù)雜金融交易網(wǎng)絡(luò)活動圖的構(gòu)造方法。
本發(fā)明為解決上述技術(shù)問題采用以下技術(shù)方案
一種基于大數(shù)據(jù)的復(fù)雜金融交易網(wǎng)絡(luò)活動圖的構(gòu)造方法,具體包含如下步驟:
步驟1,對于新的節(jié)點數(shù)據(jù),在頂層上增加一個節(jié)點,同時在每一個維度的頂層上增加相應(yīng)的節(jié)點,針對每一維度,根據(jù)當(dāng)前維度的數(shù)據(jù)建立與其相關(guān)節(jié)點的邊,同時把數(shù)據(jù)存儲到圖數(shù)據(jù)庫;
步驟2,針對每一維度,建立其層次圖;
步驟3,建立每一層與其他維度之間的關(guān)系,根據(jù)維度數(shù)據(jù)信息,建立橫向邊,任意兩個節(jié)點之間的邊是他們數(shù)據(jù)的聚合;
步驟4,根據(jù)節(jié)點的名稱信息,將節(jié)點進(jìn)行合并;
步驟5,對節(jié)點包含的多個賬戶進(jìn)行拆分;
步驟6,根據(jù)建立的數(shù)據(jù)庫結(jié)構(gòu),對每一節(jié)點按照遍歷的方法進(jìn)行存儲;
步驟7,為了快速進(jìn)行數(shù)據(jù)搜索,建立數(shù)據(jù)索引;
步驟8,利用可視化技術(shù),把網(wǎng)絡(luò)交易圖展示出來,以二維為表現(xiàn)形式進(jìn)行展示。
作為本發(fā)明一種基于大數(shù)據(jù)的復(fù)雜金融交易網(wǎng)絡(luò)活動圖的構(gòu)造方法的進(jìn)一步優(yōu)選方案,所述步驟2具體包含如下步驟:
步驟2.1,對于分類數(shù)據(jù),對每一個分類建立下層的分類節(jié)點,利用統(tǒng)計方法獲取當(dāng)前分類的詳細(xì)數(shù)據(jù),每一個下層節(jié)點指向其上層父節(jié)點;
步驟2.2,采用遞歸方法對每一個分層繼續(xù)生成下個分層,直至到達(dá)葉節(jié)點。
作為本發(fā)明一種基于大數(shù)據(jù)的復(fù)雜金融交易網(wǎng)絡(luò)活動圖的構(gòu)造方法的進(jìn)一步優(yōu)選方案,在步驟3中,對于新的邊數(shù)據(jù),首先對交易數(shù)據(jù)根據(jù)維度離散化,然后在每一個維度的頂層圖中更新其相應(yīng)的邊,然后再根據(jù)圖的流向信息更新每一個層次圖的每一個相關(guān)的邊信息。
作為本發(fā)明一種基于大數(shù)據(jù)的復(fù)雜金融交易網(wǎng)絡(luò)活動圖的構(gòu)造方法的進(jìn)一步優(yōu)選方案,在步驟7中,建立的數(shù)據(jù)索引包含以節(jié)點為索引關(guān)鍵字、層次索引和維度索引
本發(fā)明采用以上技術(shù)方案與現(xiàn)有技術(shù)相比,具有以下技術(shù)效果:
1、本發(fā)明將根據(jù)金融分析工作中需要的信息,以及網(wǎng)絡(luò)中節(jié)點的行為模式,構(gòu)建一個通用多維多層次的金融網(wǎng)絡(luò)活動圖。網(wǎng)絡(luò)圖通過節(jié)點、邊、以及節(jié)點和邊的屬性定義了金融活動中各個維度的數(shù)據(jù);
2、本發(fā)明構(gòu)建的金融網(wǎng)絡(luò)活動圖能有效用于基于社會網(wǎng)絡(luò)理論、圖論、可視化等方法的金融數(shù)據(jù)分析方法;
3、本發(fā)明還考慮了大數(shù)據(jù)量的數(shù)據(jù)存儲問題,為了能夠有效地存儲和快速檢索大數(shù)據(jù)量的金融交易數(shù)據(jù),采用了如下存儲方式,對圖的每一個節(jié)點存儲一個數(shù)據(jù)塊,各個數(shù)據(jù)塊之間按照交易關(guān)系建立指針鏈接,這樣圖的存儲和實際的檢索以及展示是一致的,采用非結(jié)構(gòu)化數(shù)據(jù)方式來存儲圖的數(shù)據(jù)。
附圖說明
圖1是本發(fā)明金融網(wǎng)絡(luò)圖節(jié)點之間的倫理關(guān)系圖;
圖2是本發(fā)明金融網(wǎng)絡(luò)交易圖某維度的頂層結(jié)構(gòu)示意圖;
圖3是本發(fā)明金融網(wǎng)絡(luò)交易圖的分層結(jié)構(gòu)示意圖;
圖4本發(fā)明某維度金融網(wǎng)絡(luò)交易圖頂層圖的構(gòu)造流程。
具體實施方式
下面結(jié)合附圖對本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)說明:
首先構(gòu)造適合大數(shù)據(jù)的金融交易圖的存儲結(jié)構(gòu),采用圖數(shù)據(jù)庫的非結(jié)構(gòu)化數(shù)據(jù)來進(jìn)行存儲。
然后通過Web service的方式和金融機(jī)構(gòu)建立數(shù)據(jù)獲取途徑,可以采用拉取或者推送的方式進(jìn)行數(shù)據(jù)訂閱和請求服務(wù),當(dāng)需要的數(shù)據(jù)達(dá)到本系統(tǒng)時按照如下方式進(jìn)行圖的構(gòu)建和存儲。
1)對于新的節(jié)點數(shù)據(jù),在頂層上增加一個節(jié)點,同時在每一個維度的頂層上增加相應(yīng)的節(jié)點,針對每一維度,根據(jù)當(dāng)前維度的數(shù)據(jù)建立與其相關(guān)節(jié)點的邊,同時把數(shù)據(jù)存儲到圖數(shù)據(jù)庫。其中維度包括:交易金額、交易次數(shù)、交易方式、金融機(jī)構(gòu)類型、交易地點、交易時間、資金用途、交易對象類別。
1.1)針對每一維度,建立其層次圖,具體方法是:對于分類數(shù)據(jù),對每一個分類建立下層的分類節(jié)點,利用統(tǒng)計方法獲取當(dāng)前分類的詳細(xì)數(shù)據(jù),每一個下層節(jié)點指向其上層父節(jié)點,然后采用遞歸方法對每一個分層繼續(xù)生成下個分層,直至到達(dá)葉節(jié)點。層次圖的邊就是匯總關(guān)系的邊。針對數(shù)據(jù)類型數(shù)據(jù),對數(shù)據(jù)類型數(shù)據(jù)進(jìn)行區(qū)間劃分,劃分成多個數(shù)據(jù)區(qū)間,每一個數(shù)據(jù)區(qū)間作為一個獨立的節(jié)點,然后按照分類數(shù)據(jù)的方法構(gòu)建分層圖。
1.2)建立每一層與其他維度之間的關(guān)系,根據(jù)維度數(shù)據(jù)信息,建立橫向邊,任意兩個節(jié)點之間的邊是他們數(shù)據(jù)的聚合,例如銀行類別維度中的中國銀行的節(jié)點,與時間維度中2016年1月1日的節(jié)點之間如果要建立關(guān)聯(lián),則邊表示在中國銀行2016年1月1日發(fā)生的交易信息。
2)對于新的邊數(shù)據(jù),首先對交易數(shù)據(jù)根據(jù)維度離散化,然后在每一個維度的頂層圖中更新其相應(yīng)的邊,然后再根據(jù)圖的流向信息更新每一個層次圖的每一個相關(guān)的邊信息。
3)節(jié)點合并,給出節(jié)點名稱信息,把節(jié)點進(jìn)行合并。節(jié)點合并一般發(fā)生在多個賬戶實際掌控人為一個人的時候,為了分析方便,進(jìn)行數(shù)據(jù)合并。首先在每一個維度的頂層進(jìn)行合并,然后根據(jù)邊的信息合并相應(yīng)的分層數(shù)據(jù)。數(shù)據(jù)合并后,其原始的節(jié)點信息還要記錄在當(dāng)前節(jié)點中。
4)節(jié)點拆分,對某一個節(jié)點,把其包含的多個賬戶進(jìn)行拆分,一般拆分成兩個節(jié)點(拆分成多個節(jié)點的思路與兩個節(jié)點類似,每次拆分成兩個即可),其中一個為主節(jié)點,另一個為副節(jié)點,保持主節(jié)點不變,增加一個副節(jié)點,其方法與增加新節(jié)點類似。
5)數(shù)據(jù)存儲,根據(jù)建立的數(shù)據(jù)庫結(jié)構(gòu),對每一節(jié)點按照遍歷的方法進(jìn)行存儲。
6)索引創(chuàng)建,為了快速進(jìn)行數(shù)據(jù)搜索,建立數(shù)據(jù)索引。對圖建立多個索引,a)以節(jié)點為索引關(guān)鍵字,建立節(jié)點之間的關(guān)系,可以快速找到相關(guān)節(jié)點,采用的方式是鏈表指針方式。b) 層次索引,利用層次之間的樹形結(jié)構(gòu)建立B+索引,可以快速從頂層查詢到葉節(jié)點。 c) 維度索引,對每一維度建立B+索引,快速找到維度數(shù)據(jù)。
7)數(shù)據(jù)展示,利用可視化技術(shù),把網(wǎng)絡(luò)交易圖展示出來,以二維為表現(xiàn)形式進(jìn)行展示。其他維度和分層的數(shù)據(jù),通過向下鉆取,向上折疊,向左搜索,向右搜索進(jìn)行轉(zhuǎn)換展示。
金融網(wǎng)絡(luò)描述的是金融系統(tǒng)中所有資金流向所組成的路徑,是一種現(xiàn)實中客觀存在的網(wǎng)絡(luò)。賬戶是金融網(wǎng)絡(luò)的基本組成元素,常見的金融網(wǎng)絡(luò)往往由數(shù)以千萬計的賬戶節(jié)點組成。賬戶節(jié)點由金融系統(tǒng)的用戶創(chuàng)建,這些用戶決定了賬戶的開戶銀行、資金流向、交易頻率、交易金額和資金余額等賬戶節(jié)點的相關(guān)屬性。金融系統(tǒng)用戶的金融行為既有一定的規(guī)律性,但同時也伴隨著很強(qiáng)的隨機(jī)性,正是由于用戶行為的這些特性,導(dǎo)致金融系統(tǒng)異常龐大且復(fù)雜。
金融網(wǎng)絡(luò)中流動的是資金,資金通過銀行賬戶進(jìn)行流動,對資金進(jìn)行操作的主體是客戶。賬戶及其之間的資金轉(zhuǎn)移路徑就組成了金融網(wǎng)絡(luò)。如果具體到每一筆交易流水,那么主體對象是客戶在銀行開設(shè)的賬戶,賬戶的所有者是客戶,而一個客戶可以擁有多個賬戶。在今日分析工作中主要關(guān)注的是某個具體的嫌疑人或者團(tuán)伙。一般嫌疑人都會注冊大量的賬戶以方便犯罪活動,可能是用自己的身份在一個或多個銀行注冊多個賬戶,也可能是利用親屬、下屬或者其他受害人的身份信息注冊多個賬戶。在分析過程中需要將這些實際屬于同一實體的不同賬號聚集起來。這些賬號之間一般會出現(xiàn)相同的某些屬性,比如姓名、身份證號碼、電話號碼、地址等,也可能在案件調(diào)查過程中通過其他線索比如口供信息判定某些賬戶實際為某個嫌疑人所控制。
當(dāng)從不同層面分析時,具體關(guān)注的主體對象是不同的。但最重要的是洗錢嫌疑人或團(tuán)伙的資金流動,在進(jìn)行反洗錢工作時嫌疑人或團(tuán)伙所控制的賬戶間的資金流動并不是關(guān)注重點。主體對象對資金的操作有四種類型:轉(zhuǎn)入、轉(zhuǎn)出、存款和取款,如圖1。轉(zhuǎn)入/轉(zhuǎn)出操作涉及兩個賬戶,而存/取款操作的兩邊是客戶與賬戶。所以金融網(wǎng)絡(luò)活動圖上節(jié)點之間至少要表現(xiàn)出轉(zhuǎn)賬、存取款屬性,而且賬戶間的交易應(yīng)該是有向的。
金融犯罪過程復(fù)雜、多變,包含了現(xiàn)金存取、金融機(jī)構(gòu)間轉(zhuǎn)移等。根據(jù)已破獲金融犯罪案例的經(jīng)驗以及金融機(jī)構(gòu)交易數(shù)據(jù)特征,金融洗錢犯罪活動有以下特點:
對于多筆交易,與金融犯罪行為相關(guān)的交易往往具有以下特點:1)交易頻率高,交易金額巨大,由于洗錢往往涉及較大金額的資金,因此為了完成對這批資金的處理,洗錢行為不可避免地呈現(xiàn)出交易頻率高和金額巨大的特點。2)資金流向和金額與企業(yè)所從事領(lǐng)域、規(guī)模明顯不符。一個正常的企業(yè)很少出現(xiàn)與所從事領(lǐng)域不相關(guān)的金融交易,因此不相關(guān)領(lǐng)域的交易記錄也是金融犯罪行為的判斷指標(biāo)之一。
對于單個賬戶,判斷其金融犯罪嫌疑常用的指標(biāo)是該賬戶在一個特定時間區(qū)間內(nèi)的統(tǒng)計特征,例如,一個賬戶在一個時間段內(nèi)高頻率地存取現(xiàn)金等。因此可以通過對時間序列數(shù)據(jù)進(jìn)行提取和分析來判斷一個賬戶的金融犯罪嫌疑度。
從以上分析中可以看出,對金融犯罪行為分析識別重要相關(guān)的數(shù)據(jù)屬性主要包括賬戶的交易金額、發(fā)生頻率、資金去向以及用途等四個方面。
金融網(wǎng)絡(luò)就是網(wǎng)絡(luò)與金融活動的結(jié)合。金融網(wǎng)絡(luò)中的節(jié)點代表的是個人客戶、企業(yè)以及賬號,網(wǎng)絡(luò)中的邊關(guān)系代表的是這些節(jié)點之間發(fā)生的交易關(guān)系。而交易關(guān)系背后代表的是經(jīng)濟(jì)利益關(guān)系,邊的關(guān)系中包含的信息包括交易對象、交易的時間、交易金額、交易方式、資金用途等信息。由于交易存在方向性,金融網(wǎng)絡(luò)實質(zhì)上是一個有向圖。如果把這些信息都綁定在一個邊上,對于小型的金融網(wǎng)絡(luò)來講是可以接受的,但是對于復(fù)雜的金融犯罪網(wǎng)絡(luò)來講,則很難理清其中的關(guān)系,表示也很困難。因此,有必要采用多維的金融網(wǎng)絡(luò)交易圖,每一維度的邊中包含了某一類信息。同時,為了保證能夠把各種信息串聯(lián)起來,同時保留了原來的多信息的交易圖。同一緯度的數(shù)據(jù),只能反應(yīng)當(dāng)前維度的數(shù)據(jù),為了能夠方便的觀察整體數(shù)據(jù),需要考慮多層網(wǎng)絡(luò),每下一層可以是當(dāng)前的部分?jǐn)?shù)據(jù)的嵌套,也可以是另一維度的鉆取。
金融犯罪存在數(shù)據(jù)量大的特點,由于IT技術(shù)的發(fā)展,很多犯罪分子采用軟件或者定時隨機(jī)轉(zhuǎn)賬的方式,導(dǎo)致進(jìn)過幾級交易后,金融交易筆數(shù)可以達(dá)到數(shù)百萬甚至上千萬,常規(guī)的數(shù)據(jù)存儲和查詢方式效率非常低。
金融交易存在動態(tài)特性,一方面是因為金融交易本身隨著時間就是在不斷增加。另一方面,隨著金融分析的進(jìn)行,會發(fā)現(xiàn)新的交易對象或者合并交易對象,為此,需要考慮在線動態(tài)進(jìn)行網(wǎng)絡(luò)更新。
本發(fā)明,主要涉及如下內(nèi)容:
1)多維多層金融網(wǎng)絡(luò)圖的表示方法
2)適合大數(shù)據(jù)的金融網(wǎng)絡(luò)圖的存儲結(jié)構(gòu)
3)復(fù)雜金融網(wǎng)絡(luò)圖的在線更新機(jī)制。
根據(jù)以上分析,多維多層有向圖是金融網(wǎng)絡(luò)活動圖最佳的表示方法。下面詳細(xì)描述金融網(wǎng)絡(luò)活動圖的構(gòu)建方案。
多維多層金融網(wǎng)絡(luò)圖用G={G1, G2, …, Gn}, 其中每一個圖Gi是表示其中的一維,Gi=(Vi, Ei, Li),每個節(jié)點vi標(biāo)識一個人或者團(tuán)伙,用姓名(團(tuán)伙用名稱)作為唯一標(biāo)識,節(jié)點vi由一組賬戶Ai組成。還有兩個特殊的節(jié)點:存款節(jié)點和取款節(jié)點,這兩個節(jié)點只能作為衛(wèi)星節(jié)點與某個普通節(jié)點連接,用以標(biāo)識該普通節(jié)點的存取款行為。邊ei連接兩個節(jié)點eui和evi,一條邊表示一條資金流動路徑。兩個節(jié)點之間最多有兩條邊,分別表示兩個方向的資金流動。邊ei由是當(dāng)前維度交易信息Ti組成,而Ti為Aui向Avi轉(zhuǎn)移資金的所有交易記錄。如果維度為金額,則表示金額值,如果為筆數(shù),則表示交易次數(shù),如果維度為交易方式,則表示交易方式的總數(shù)量。本發(fā)明包括的維度有:交易金額、交易次數(shù)、交易方式、金融機(jī)構(gòu)類型、交易地點、交易時間、資金用途、交易對象類別。其中每一個維度的網(wǎng)絡(luò)交易圖的頂層如圖2所示。每一維度的整體的分層結(jié)構(gòu)如圖3所示。L指的是層數(shù),頂層是當(dāng)前緯度的匯總,下層是上層分解樹,例如對于分類屬性的數(shù)據(jù),其下層就是上層的分類,例如:對于交易類別,第二層包括多個子圖:柜臺轉(zhuǎn)賬、網(wǎng)銀轉(zhuǎn)賬等。如果分類是銀行,則第二個層次是中國銀行、建設(shè)銀行、工商銀行等。
本發(fā)明的網(wǎng)絡(luò)交易圖,可以從任一維向下進(jìn)入不同層次,也可以從任一層進(jìn)入其他維度的同一層。這樣可以從多個方向來觀察整個網(wǎng)絡(luò)交易圖,對追蹤資金、分離數(shù)據(jù)具有非常好的幫助作用。
對于某一維度的圖,從原始交易記錄構(gòu)建金融網(wǎng)絡(luò)活動圖的流程如圖4所示。其他維度按照類似的方式構(gòu)建,然后再根據(jù)數(shù)據(jù)的分類建立每一個層次圖,進(jìn)而構(gòu)成一個多維多層的金融網(wǎng)絡(luò)交易圖。
節(jié)點屬性:在圖4中,節(jié)點代表金融網(wǎng)絡(luò)活動中的一個具體實體,可以是一個人、一個企業(yè)或者一個金融團(tuán)伙。一個節(jié)點主要有以下兩個屬性:1)名稱:用于標(biāo)識節(jié)點,節(jié)點的名稱可以根據(jù)金融分析過程中的需要進(jìn)行修改。2)控制賬戶:一個節(jié)點控制著一組賬戶Av,這些賬戶進(jìn)行實際的金融活動,比如轉(zhuǎn)賬或者存取款。對于其他屬性,比如某段時間內(nèi)的交易金額、發(fā)生頻率,都可以通過與該節(jié)點相連接的邊所包含的交易記錄計算出來。
邊屬性:邊連接兩個節(jié)點,邊e的主要屬性有三個:起始節(jié)點u、終止節(jié)點v、交易記錄組。交易記錄由u控制的賬戶Au向v控制的賬戶Av所有轉(zhuǎn)賬記錄組成。
對于構(gòu)建完成的金融網(wǎng)絡(luò)活動圖,其結(jié)構(gòu)是動態(tài)的,因為在整個金融偵察分析過程中,會不斷加入新的線索,新的交易流水?dāng)?shù)據(jù)等。對于新加入的交易流水,可以按照圖4的流程加入圖中。而新線索對圖結(jié)構(gòu)的影響主要是節(jié)點的合并。當(dāng)發(fā)現(xiàn)某些賬戶實際為某個嫌疑人的別名賬戶時,需要將這些別名賬戶移動到其所屬的節(jié)點中,并對圖結(jié)構(gòu)作對應(yīng)調(diào)整。比如在分析過程中發(fā)現(xiàn)某個嫌疑人是一個洗錢團(tuán)伙的實際控制人,或者某個嫌疑人實際控制著多個賬號進(jìn)行洗錢活動,為了簡化網(wǎng)絡(luò)結(jié)構(gòu),可以將這些由同一個人控制的賬號合并為一個節(jié)點,那么這個節(jié)點之間的交易關(guān)系將會從圖中被移除。實際分析中我們也并不關(guān)心某個嫌疑人自己賬戶之間的資金流動,主要關(guān)系的是一個節(jié)點與其他節(jié)點之間的資金流動。
本發(fā)明還考慮了大數(shù)據(jù)量的數(shù)據(jù)存儲問題,為了能夠有效地存儲和快速檢索大數(shù)據(jù)量的金融交易數(shù)據(jù),采用了如下存儲方式,對圖的每一個節(jié)點存儲一個數(shù)據(jù)塊,各個數(shù)據(jù)塊之間按照交易關(guān)系建立指針鏈接,這樣圖的存儲和實際的檢索以及展示是一致的,采用非結(jié)構(gòu)化數(shù)據(jù)方式來存儲圖的數(shù)據(jù)。