專利名稱:基于生物啟發(fā)計(jì)算的流動(dòng)人口信息分析及預(yù)、報(bào)警方法
技術(shù)領(lǐng)域:
本發(fā)明屬于公共安全的信息分析技術(shù)領(lǐng)域,具體涉及一種基于生物啟發(fā)計(jì)算來發(fā)現(xiàn)和挖掘出流動(dòng)人口中各類人員的流動(dòng)模式以及流動(dòng)人口的趨勢(shì)性問題,找出異常的流動(dòng)信息和模式,根據(jù)各類犯罪人員特征對(duì)案件進(jìn)行相似度比對(duì),并實(shí)現(xiàn)預(yù)、報(bào)警的智能分析方法。
背景技術(shù):
隨著經(jīng)濟(jì)的持續(xù)發(fā)展,城市流動(dòng)人口的總量急劇增長(zhǎng),與流動(dòng)人口相關(guān)的各類治安、刑事案件發(fā)案率目前已經(jīng)超過了城市常住人口發(fā)案率,給城市尤其是沿海經(jīng)濟(jì)發(fā)達(dá)地區(qū)的社會(huì)治安構(gòu)成了主要的威脅。如此劇增、數(shù)量龐大的高流動(dòng)性人口群,其出現(xiàn)的高犯罪率再加上資料匱乏、調(diào)查困難等特點(diǎn),已經(jīng)給當(dāng)前城市綜合治安管理工作提出了嚴(yán)峻的挑戰(zhàn)。因而研究一套智能化的流動(dòng)人口分析方法,對(duì)潛在的犯罪分子及時(shí)排查和預(yù)測(cè)報(bào)警就顯得十分必要。
目前對(duì)于流動(dòng)人口出現(xiàn)率最高的旅館等場(chǎng)所,公安機(jī)關(guān)雖然一直采取嚴(yán)格的管理制度來保證治安需求,如對(duì)入住旅館的旅客要求進(jìn)行詳細(xì)的旅客身份等信息的登記,但由于這些旅客身份等信息的登記都是人工進(jìn)行的,公安機(jī)關(guān)要根據(jù)案件對(duì)其進(jìn)行檢索,不僅速度慢、程序繁瑣、易出錯(cuò),且成本高,還容易因保管不當(dāng)造成資料散亂、殘缺,給資料保存歸檔帶來了困難。其次,因公安機(jī)關(guān)追捕逃犯、打擊流竄犯和對(duì)刑偵案件的勘查和預(yù)測(cè),主要是通過向旅館安保部門發(fā)放通輯協(xié)查,再由總臺(tái)服務(wù)員翻閱住宿登記單或旅客住宿登記薄進(jìn)行核查,發(fā)現(xiàn)線索逐級(jí)上報(bào)的方式進(jìn)行。很顯然,這種方式,一方面隨著旅館數(shù)量大量增加,布控范圍擴(kuò)大,通緝協(xié)查往往發(fā)不到所有旅館,造成布控上的盲點(diǎn),二方面由于通緝協(xié)查數(shù)量逐年遞增,這種靠服務(wù)員手工翻閱資料核查,難免有漏報(bào)和錯(cuò)報(bào)的情況發(fā)生,同時(shí)費(fèi)時(shí)費(fèi)力,周轉(zhuǎn)期長(zhǎng),不能及時(shí)向公安機(jī)關(guān)提供需要查找的嫌疑對(duì)象和線索,容易給犯罪分子形成時(shí)間差而藏身落腳或逃避追捕。
據(jù)了解,目前為了解決上述問題,已有的相關(guān)技術(shù)產(chǎn)品有
1.成都嘉得利有限公司開發(fā)的《旅館業(yè)治安管理信息系統(tǒng)》。該系統(tǒng)提出了旅館業(yè)治安管理信息系統(tǒng)一體化解決方案,具有旅店管理、信息采集、布控報(bào)警、監(jiān)督管理等功能,實(shí)現(xiàn)了管理手段數(shù)字化、辦事效率信息化。該系統(tǒng)雖然能夠滿足旅店對(duì)旅客信息的管理,又可滿足公安機(jī)關(guān)對(duì)人口信息處理的實(shí)時(shí)性的特點(diǎn),但是該系統(tǒng)沒有利用現(xiàn)有的旅客、旅館信息進(jìn)行深層次分析,對(duì)潛在的犯罪分子進(jìn)行預(yù)測(cè)、報(bào)警,為案件偵破提供線索,輔助公安機(jī)關(guān)進(jìn)行案件的偵破和對(duì)公安機(jī)關(guān)打擊、防范犯罪的決策指揮提供支持。
2.武漢北大高科軟件有限公司開發(fā)的《旅店業(yè)治安管理系統(tǒng)》。作為全國“治安管理信息系統(tǒng)”的業(yè)務(wù)子系統(tǒng)之一,是公安部門對(duì)流動(dòng)人口管理的重要技術(shù)手段。該系統(tǒng)是先采用撥打電話,錄入人員的證件號(hào)碼和房號(hào),完成住宿人員的入住登記,然后系統(tǒng)自動(dòng)將登記信息通過通信中間件和參數(shù)網(wǎng)絡(luò)傳輸?shù)焦簿W(wǎng)內(nèi)。該系統(tǒng)雖然解決了長(zhǎng)期困擾“旅店業(yè)治安管理系統(tǒng)”建設(shè)的幾個(gè)問題,如前臺(tái)軟件實(shí)施成本巨大,日常費(fèi)用不可控制,PC版軟件操作復(fù)雜等問題,尤其對(duì)于小旅店的住宿人員的信息遲報(bào)、漏報(bào)甚至隱瞞不報(bào)等問題的解決效果較好。但是其同樣不能對(duì)旅店入住人員信息進(jìn)行智能化分析,進(jìn)而實(shí)現(xiàn)對(duì)潛在的犯罪分子的預(yù)測(cè)、報(bào)警,輔助公安機(jī)關(guān)進(jìn)行案件的偵破和對(duì)公安機(jī)關(guān)的決策指揮提供支持。
發(fā)明內(nèi)容
本發(fā)明的目的是針對(duì)已有技術(shù)存在的問題,提供一種基于生物啟發(fā)計(jì)算的流動(dòng)人口信息分析及預(yù)、報(bào)警方法。
本發(fā)明提供的方法是建立在生物啟發(fā)計(jì)算具有高效、準(zhǔn)確和海量數(shù)據(jù)處理能力的數(shù)據(jù)挖掘技術(shù)基礎(chǔ)之上的。生物啟發(fā)計(jì)算(Bio-inspired Computing)是指以生物界的各種自然現(xiàn)象或過程為靈感,并對(duì)生物現(xiàn)象或過程進(jìn)行模擬而提出的一系列啟發(fā)式智能計(jì)算方法。如進(jìn)化算法,人工神經(jīng)網(wǎng)絡(luò),元胞自動(dòng)機(jī)等。當(dāng)前生物啟發(fā)計(jì)算中比較重要的分支包括遺傳算法、免疫算法、神經(jīng)計(jì)算、螞蟻算法和基因表達(dá)式編程。數(shù)據(jù)挖掘技術(shù)是人們對(duì)數(shù)據(jù)管理、存儲(chǔ)和檢索技術(shù)的擴(kuò)展和深化,它旨在從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。
本發(fā)明提供的基于生物啟發(fā)計(jì)算的流動(dòng)人口信息分析及預(yù)、報(bào)警方法的總體構(gòu)思是利用現(xiàn)有公安機(jī)關(guān)建立的掌握流動(dòng)人口信息的系統(tǒng),從中抽取需要的信息,采用多種生物啟發(fā)計(jì)算的算法,完成數(shù)據(jù)的挖掘分類和孤立點(diǎn)分析,并根據(jù)孤立點(diǎn)分析結(jié)果,實(shí)時(shí)對(duì)流動(dòng)人口數(shù)據(jù)流進(jìn)行預(yù)、報(bào)警。該方法的步驟包括通過旅店前臺(tái)微機(jī)錄入住宿旅客信息的步驟;利用公網(wǎng)將錄入的住宿旅客信息傳輸?shù)酵ㄐ盘幚砟K的步驟;通信處理模塊將數(shù)據(jù)傳輸?shù)奖葘?duì)服務(wù)器與黑名單數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行比對(duì)的步驟;由通信處理模塊將數(shù)據(jù)維護(hù)到流動(dòng)人口數(shù)據(jù)庫的步驟;其特征在于該方法還包括利用數(shù)據(jù)抽取轉(zhuǎn)換加載模塊完成從流動(dòng)人口數(shù)據(jù)庫到流動(dòng)人口數(shù)據(jù)倉庫的加載步驟;依據(jù)流動(dòng)人口數(shù)據(jù)倉庫產(chǎn)生用于分類的樣本數(shù)據(jù),同時(shí)傳輸給基于多層染色體的基因表達(dá)式編程算法模塊和基于重疊表達(dá)的多基因進(jìn)化算法模塊進(jìn)行計(jì)算分析,并產(chǎn)生對(duì)應(yīng)分類器的步驟;將流動(dòng)人口數(shù)據(jù)庫的數(shù)據(jù)分別傳輸給多層染色體的基因表達(dá)式編程算法分類器和基于重疊表達(dá)的多基因進(jìn)化算法分類器進(jìn)行歸類,并產(chǎn)生孤立點(diǎn)列表的步驟;通信處理模塊將數(shù)據(jù)傳輸?shù)奖葘?duì)模塊與黑名單數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行比對(duì)后傳輸給報(bào)警處理模塊進(jìn)行實(shí)時(shí)報(bào)警的步驟;和將比對(duì)服務(wù)器傳出的數(shù)據(jù)依次傳輸給基于多層染色體的基因表達(dá)式編程算法分類器和基于重疊表達(dá)的多基因進(jìn)化算法分類器判斷是否為孤立點(diǎn)的步驟;將基于多層染色體的基因表達(dá)式編程算法分類器和基于重疊表達(dá)的多基因進(jìn)化算法分類器判斷為孤立點(diǎn)的信息傳輸?shù)綀?bào)警處理模塊進(jìn)行實(shí)時(shí)報(bào)警的步驟,否,就結(jié)束的步驟。
上述方法中用多層染色體的基因表達(dá)式編程算法模塊產(chǎn)生對(duì)應(yīng)分類器的步驟包括根據(jù)用戶輸入條件,從流動(dòng)人口數(shù)據(jù)倉庫選擇訓(xùn)練樣本數(shù)據(jù)并產(chǎn)生訓(xùn)練集的步驟;根據(jù)多層染色體的基因表達(dá)式編程算法參數(shù)對(duì)種群進(jìn)行初始化的步驟;根據(jù)多層染色體的基因表達(dá)式編程算法,計(jì)算種群中每個(gè)個(gè)體對(duì)訓(xùn)練集的適應(yīng)度的步驟;保留適應(yīng)度排名第一的個(gè)體到下一代的步驟;對(duì)種群進(jìn)行基本遺傳算子操作的步驟;
依次對(duì)種群執(zhí)行基因隨機(jī)重組算子和染色體重組算子的步驟;將操作結(jié)果排序并復(fù)制到下一代的步驟;如果最好進(jìn)化結(jié)果滿足精度要求或達(dá)到預(yù)設(shè)的最大輩數(shù),則進(jìn)行下一步,否則到第3步進(jìn)行循環(huán)操作的步驟;將最佳適應(yīng)度個(gè)體作為算法分類器的步驟。
上述方法中用基于重疊表達(dá)的多基因進(jìn)化算法模塊產(chǎn)生對(duì)應(yīng)分類器的步驟包括根據(jù)用戶輸入條件,從流動(dòng)人口數(shù)據(jù)倉庫選擇訓(xùn)練樣本數(shù)據(jù)并產(chǎn)生訓(xùn)練集的步驟;根據(jù)基于重疊表達(dá)的多基因進(jìn)化算法參數(shù)對(duì)種群進(jìn)行初始化的步驟;根據(jù)基于重疊表達(dá)的多基因進(jìn)化算法,計(jì)算種群中每個(gè)個(gè)體對(duì)訓(xùn)練集的適應(yīng)度,即調(diào)用評(píng)價(jià)函數(shù)的步驟;保留適應(yīng)度排名第一的個(gè)體到下一代的步驟;對(duì)種群進(jìn)行基本遺傳算子操作的步驟;將操作結(jié)果排序并復(fù)制到下一代的步驟;如果最佳個(gè)體適應(yīng)度滿足精度要求或達(dá)到預(yù)設(shè)的最大輩數(shù),則進(jìn)行下一步,否則回到第3步進(jìn)行循環(huán)操作的步驟;將最佳適應(yīng)度個(gè)體作為該算法分類器的步驟。
上述方法中實(shí)時(shí)報(bào)警的步驟包括對(duì)通信處理模塊傳輸來的實(shí)時(shí)流動(dòng)人口數(shù)據(jù)流,由比對(duì)模塊完成比對(duì)黑名單數(shù)據(jù)庫比對(duì)成功的信息,根據(jù)涉案嚴(yán)重程度顯示紅、棕、橙顏色提示的步驟;對(duì)通信處理模塊傳輸來的實(shí)時(shí)流動(dòng)人口數(shù)據(jù)流,由比對(duì)模塊完成比對(duì)黑名單數(shù)據(jù)庫未比對(duì)成功的信息,依次使用已訓(xùn)練的基于多層染色體的基因表達(dá)式編程算法分類器和基于重疊表達(dá)的多基因進(jìn)化算法分類器分類,發(fā)現(xiàn)為孤立點(diǎn),即顯示黃顏色提示的步驟;否則退出,顯示沒有報(bào)警的綠顏色提示的步驟。
本發(fā)明具有以下優(yōu)點(diǎn)1、由于本發(fā)明方法中利用了生物啟發(fā)計(jì)算技術(shù)對(duì)流動(dòng)人口信息進(jìn)行分析,因而為公安機(jī)關(guān)發(fā)現(xiàn)各類人員的流動(dòng)模式以及流動(dòng)人口的趨勢(shì)性問題,找出異常的流動(dòng)信息和模式,及進(jìn)一步對(duì)異常的人員流動(dòng)軌跡及趨勢(shì)、各類犯罪人員特征進(jìn)行深層次分析,建立了智能分析平臺(tái),填補(bǔ)了實(shí)時(shí)智能預(yù)、報(bào)警的空白。
2、由于本發(fā)明方法中利用的多層染色體的基因表達(dá)式編程算法具有種群中每個(gè)個(gè)體由多個(gè)染色體組成;不同的染色體有不同字符集和長(zhǎng)度;多個(gè)染色體分為多個(gè)層次,上層染色體基因可以調(diào)用下層染色體基因的計(jì)算結(jié)果的特點(diǎn),因而與傳統(tǒng)的單基因GEP和多基因GEP算法相比,平均進(jìn)化輩數(shù)僅為其的29~81%(見彭京,唐常杰,李川,胡建軍.M-GEP基于多層染色體基因表達(dá)式編程的遺傳進(jìn)化算法,計(jì)算機(jī)學(xué)報(bào),2005,28(9).1459-1466.)。
3、由于本發(fā)明方法中利用的基于重疊表達(dá)的多基因進(jìn)化算法具有用于遺傳的個(gè)體由多個(gè)基因組成,組成基因的片段在一定條件下可重復(fù)表達(dá);由于片段可以重復(fù)表達(dá),其表達(dá)空間效率優(yōu)于其他算法;無需對(duì)基因或染色體內(nèi)容做出約束的特點(diǎn),因而與傳統(tǒng)的GP與GEP算法都必須對(duì)基因格式做出某種限制要求而言,由于減少了限制,其算法效率可大幅度提高,實(shí)驗(yàn)表明在同等條件下,基于重疊表達(dá)的多基因進(jìn)化算法的速度為GEP的2.8到9.7倍,而且與GEP相比較,基于重疊表達(dá)的多基因進(jìn)化算法EAOGE在函數(shù)發(fā)現(xiàn)的成功率方面有較大幅度提高(見Jing Peng,Chang-jie Tang,Jing Zhang,and Chang-an Yuan.Evolutionary Algorithm Based on Overlapped Gene Expression,ICNC 2005,LNCS 3612,pp.194-204,2005.)。
4、將生物啟發(fā)計(jì)算技術(shù)應(yīng)用于案?jìng)晒ぷ鳎蚨c傳統(tǒng)的偵查工作模式相比,一方面可以快速、準(zhǔn)確和批量地產(chǎn)生分析結(jié)果,并根據(jù)分析結(jié)果通過調(diào)查取證而迅速破案,為公安機(jī)關(guān)打擊各類違法犯罪活動(dòng)贏得先機(jī),把握工作的主動(dòng)權(quán),另一方面可為預(yù)防和打擊各類犯罪行為,駕馭區(qū)域治安大局提供有用的情報(bào)信息,增強(qiáng)預(yù)警性、敏感性,為決策指揮提供方向性和指導(dǎo)性的建設(shè)意見,使之能更有效地防范和打擊犯罪。
5、由于本發(fā)明方法利用的生物啟發(fā)計(jì)算能夠?qū)α鲃?dòng)人口數(shù)據(jù)進(jìn)行深入的挖掘,因而使狡猾的犯罪分子也難逃該方法的分析判斷,極大地提高公安機(jī)關(guān)辦案效率。
6、使用本發(fā)明方法可以極大的降低辦案成本。目前,抓獲一個(gè)逃犯的平均辦案成本為一萬元,據(jù)公安部統(tǒng)計(jì)數(shù)據(jù),全國一年抓獲逃犯數(shù)為十多萬,辦案成本為十多億。如果采用這一先進(jìn)的技術(shù)手段,使抓獲每個(gè)逃犯的辦案成本降低10%,全國一年則可降低辦案成本一億元以上。
7、本發(fā)明方法具有高度的可伸縮性,不僅可用于對(duì)旅館流動(dòng)人口信息的分析,還可用于商場(chǎng)、倉庫、機(jī)場(chǎng)和銀行等場(chǎng)所的流動(dòng)人口信息的分析,應(yīng)用范圍廣。
四
圖1為依據(jù)本發(fā)明方法構(gòu)建的流動(dòng)人口分析系統(tǒng)實(shí)例圖;圖2為本發(fā)明方法對(duì)流動(dòng)人口信息分析以實(shí)現(xiàn)預(yù)、報(bào)警的總體流程圖;圖3為本發(fā)明方法中基于多層染色體的基因表達(dá)式編程算法模塊產(chǎn)生對(duì)應(yīng)分類器的流程圖;圖4為本發(fā)明方法中基于重疊表達(dá)的多基因進(jìn)化算法模塊產(chǎn)生對(duì)應(yīng)分類器的流程圖。
五具體實(shí)施例方式
下面結(jié)合附圖給出實(shí)施例并對(duì)本發(fā)明作進(jìn)一步說明,但需指出的是以下實(shí)施例不能理解為對(duì)本發(fā)明保護(hù)范圍的限制,本領(lǐng)域的技術(shù)熟練人員根據(jù)本發(fā)明的上述內(nèi)容對(duì)本發(fā)明作出的一些非本質(zhì)的改進(jìn)和調(diào)整仍屬于本發(fā)明的保護(hù)范圍。
按照本發(fā)明所述方法構(gòu)建的流動(dòng)人口分析系統(tǒng)如圖1所示。該系統(tǒng)可分為前臺(tái)、傳輸、后臺(tái)三個(gè)部分。其中前臺(tái)包括安裝在各旅店前臺(tái)的錄入終端1,該錄入終端1采用普通微機(jī),可聯(lián)網(wǎng)使用;傳輸部分包括前臺(tái)錄入終端的聯(lián)網(wǎng)設(shè)備,如ADSL、后臺(tái)中心的外網(wǎng)聯(lián)網(wǎng)設(shè)備2,如路由器或三層交換機(jī)、外網(wǎng)通信服務(wù)器3和內(nèi)網(wǎng)通信服務(wù)器5、物理隔離器和防火墻設(shè)備4、以及內(nèi)網(wǎng)聯(lián)網(wǎng)設(shè)備,即交換機(jī)12;后臺(tái)部分包括數(shù)據(jù)庫服務(wù)器6、數(shù)據(jù)倉庫服務(wù)器7、訓(xùn)練服務(wù)器8、比對(duì)服務(wù)器9、報(bào)警服務(wù)器10和管理平臺(tái)11。
旅店前臺(tái)錄入終端1采集的流動(dòng)人口數(shù)據(jù),通過傳輸部分2~5、12保存到數(shù)據(jù)庫服務(wù)器6;然后將數(shù)據(jù)庫服務(wù)器6的內(nèi)容轉(zhuǎn)換抽取加載到數(shù)據(jù)倉庫服務(wù)器7;訓(xùn)練服務(wù)器8根據(jù)管理平臺(tái)11的指令,利用數(shù)據(jù)倉庫7的內(nèi)容,訓(xùn)練出分類器,分類器再將數(shù)據(jù)庫內(nèi)容進(jìn)行分析,獲取孤立點(diǎn)列表并展示給用戶。
數(shù)據(jù)報(bào)警的過程是首先由訓(xùn)練服務(wù)器8將已訓(xùn)練的分類器復(fù)制到比對(duì)服務(wù)器9;然后比對(duì)服務(wù)器9根據(jù)分類器和數(shù)據(jù)庫中的黑名單數(shù)據(jù)對(duì)由通信服務(wù)器3、5提交的每一條數(shù)據(jù)進(jìn)行比對(duì),如果發(fā)現(xiàn)符合的數(shù)據(jù),則將該記錄及相關(guān)的比對(duì)情況和報(bào)警級(jí)別信息傳輸?shù)綀?bào)警服務(wù)器10;最后由報(bào)警服務(wù)器10根據(jù)報(bào)警級(jí)別予以對(duì)應(yīng)的報(bào)警提示。
利用本系統(tǒng)提供的報(bào)警級(jí)別信息,既可以及時(shí)發(fā)現(xiàn)黑名單數(shù)據(jù)中的重大逃犯、重、特、大案的涉案人員、通緝?nèi)藛T或布控人員的行蹤,便于及時(shí)實(shí)施抓捕,又可通過本系統(tǒng)將其劃為孤立點(diǎn)的報(bào)警級(jí)別,發(fā)現(xiàn)某些住宿特點(diǎn)與普通旅客完全不同人員,如利用旅店實(shí)施詐騙的團(tuán)伙,用戶可立即將其列為可疑對(duì)象進(jìn)行調(diào)查,從而為迅速偵破案件提供線索。本系統(tǒng)還可以輔助用戶提高數(shù)據(jù)采集質(zhì)量,因?yàn)轫?xiàng)目不完整或內(nèi)容嚴(yán)重偏差(如入住日期為10年前)的數(shù)據(jù)同樣會(huì)被本系統(tǒng)劃為孤立點(diǎn),用戶可以利用它來發(fā)現(xiàn)旅店前臺(tái)錄入數(shù)據(jù)的質(zhì)量問題并及時(shí)地加以調(diào)整、糾正。
(一)本發(fā)明方法的總體流程本發(fā)明提供的、用于上述系統(tǒng)的基于生物啟發(fā)計(jì)算的流動(dòng)人口信息分析及預(yù)、報(bào)警方法的總體流程,如圖2所示,具體步驟如下1、通過旅店前臺(tái)微機(jī)錄入住宿旅客信息的步驟,住宿旅客信息包括人員姓名、性別、年齡、身份證號(hào)、居住旅店的行政區(qū)劃、所屬派出所、居住旅店的編號(hào)和名稱、入住時(shí)間、離開時(shí)間、房間號(hào)碼、同住人、照片等。
2、利用公網(wǎng)將錄入的住宿旅客信息傳輸?shù)酵ㄐ盘幚砟K的步驟。
3、由通信處理模塊將數(shù)據(jù)維護(hù)到流動(dòng)人口數(shù)據(jù)庫的步驟。
4、利用數(shù)據(jù)抽取轉(zhuǎn)換加載模塊完成從流動(dòng)人口數(shù)據(jù)庫到流動(dòng)人口數(shù)據(jù)倉庫的加載步驟。數(shù)據(jù)庫及數(shù)據(jù)倉庫均可采用Oracle數(shù)據(jù)庫,數(shù)據(jù)ETL過程可以通過通用ETL軟件實(shí)現(xiàn),也可通過定制程序完成,目的是去掉項(xiàng)目不完整和非法的數(shù)據(jù),然后將數(shù)據(jù)加載到數(shù)據(jù)倉庫。
5、依據(jù)流動(dòng)人口數(shù)據(jù)倉庫產(chǎn)生用于分類的樣本數(shù)據(jù),樣本數(shù)據(jù)字段包括性別、年齡、身份證號(hào)、居住旅店的行政區(qū)劃、所屬派出所、居住旅店的編號(hào)和名稱、入住時(shí)間、離開時(shí)間、房間號(hào)碼等。同時(shí)傳輸給基于多層染色體的基因表達(dá)式編程算法模塊和基于重疊表達(dá)的多基因進(jìn)化算法模塊進(jìn)行計(jì)算分析,并產(chǎn)生對(duì)應(yīng)分類器的步驟。
6、將流動(dòng)人口數(shù)據(jù)庫的數(shù)據(jù)分別傳輸給基于多層染色體的基因表達(dá)式編程算法分類器和基于重疊表達(dá)的多基因進(jìn)化算法分類器進(jìn)行歸類,并產(chǎn)生孤立點(diǎn)列表的步驟。孤立點(diǎn)列表可為用戶治安防控和案件偵破提供線索。
同時(shí),通信處理模塊將數(shù)據(jù)傳輸?shù)奖葘?duì)服務(wù)器與黑名單數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行比對(duì)的步驟。
7、通信處理模塊將數(shù)據(jù)傳輸?shù)奖葘?duì)模塊與黑名單數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行比對(duì)成功后傳輸給報(bào)警處理模塊進(jìn)行實(shí)時(shí)報(bào)警的步驟,如果沒成功,則8、將比對(duì)服務(wù)器傳出的數(shù)據(jù)依次傳輸給基于多層染色體的基因表達(dá)式編程算法分類器和基于重疊表達(dá)的多基因進(jìn)化算法分類器判斷是否為孤立點(diǎn)的步驟。
9、將基于多層染色體的基因表達(dá)式編程算法分類器和基于重疊表達(dá)的多基因進(jìn)化算法分類器判斷為孤立點(diǎn)的信息傳輸?shù)綀?bào)警處理模塊進(jìn)行實(shí)時(shí)報(bào)警的步驟,否,就結(jié)束的步驟。
實(shí)時(shí)報(bào)警的步驟又包括1)對(duì)通信處理模塊傳輸來的實(shí)時(shí)流動(dòng)人口數(shù)據(jù)流,由比對(duì)模塊完成比對(duì)黑名單數(shù)據(jù)庫比對(duì)成功的信息,根據(jù)涉案嚴(yán)重程度顯示紅、棕、橙顏色提示的步驟。
2)對(duì)通信處理模塊傳輸來的實(shí)時(shí)流動(dòng)人口數(shù)據(jù)流,由比對(duì)模塊完成比對(duì)黑名單數(shù)據(jù)庫未比對(duì)成功的信息,依次使用已訓(xùn)練的基于多層染色體的基因表達(dá)式編程算法分類器和基于重疊表達(dá)的多基因進(jìn)化算法分類器分類,發(fā)現(xiàn)為孤立點(diǎn),即顯示黃顏色提示的步驟。
3)否則退出,顯示沒有報(bào)警的綠顏色提示的步驟。
本實(shí)施例所用的5種不同顏色的報(bào)警,其分別表示為●紅(特大)表示特大案事件。如公安部A級(jí)逃犯,或重特大案件涉案成員。
●棕(大)代表殺人、搶劫等大案要案的涉案成員。
●橙(中)表示一般案件通緝?nèi)藛T或布控人員。
●黃(小)異常信息,即通過智能分析方法分析和挖掘得到的孤立點(diǎn)。
●綠(安全)即沒有任何報(bào)警。
(二)用多層染色體的基因表達(dá)式編程算法模塊產(chǎn)生對(duì)應(yīng)分類器的流程用多層染色體的基因表達(dá)式編程算法模塊產(chǎn)生對(duì)應(yīng)分類器的流程如圖3所示,具體步驟包括1、根據(jù)用戶輸入條件,從流動(dòng)人口數(shù)據(jù)倉庫選擇訓(xùn)練樣本數(shù)據(jù)并產(chǎn)生訓(xùn)練集的步驟。樣本數(shù)據(jù)字段可根據(jù)用戶輸入從性別、年齡、身份證號(hào)、居住旅店的行政區(qū)劃、所屬派出所、居住旅店的編號(hào)和名稱、入住時(shí)間、離開時(shí)間、房間號(hào)碼等中進(jìn)行選擇。
2、根據(jù)用戶輸入多層染色體的基因表達(dá)式編程算法參數(shù)染色體數(shù)量、基因數(shù)量、種群大小、單點(diǎn)重組率、多點(diǎn)重組率、變異率、位移率、根位移率、基因位移率、基因重組率、基因隨機(jī)重組率、染色體重組率、精度、最大輩數(shù),對(duì)種群進(jìn)行初始化的步驟。
3、根據(jù)多層染色體的基因表達(dá)式編程算法,計(jì)算種群中每個(gè)個(gè)體對(duì)訓(xùn)練集的適應(yīng)度的步驟,適應(yīng)度公式如下fi=Σj=1Ct(M-|C(i,j)-Tj|)]]>
其中K為適應(yīng)度規(guī)范因子,下標(biāo)i表不種群中的第i個(gè)個(gè)體j表示適應(yīng)度用例中的第j個(gè)用例,Ct表示適應(yīng)度用例的數(shù)目,C(i,j)表示第i個(gè)個(gè)體代入第j個(gè)測(cè)試用例后得到的結(jié)果,Tj(j=1,2,…,Ct)表示測(cè)試用例中的目標(biāo)函數(shù)值。
4、保留適應(yīng)度排名第一的個(gè)體到下一代的步驟。
5、對(duì)種群進(jìn)行變異、位移、根位移、單點(diǎn)重組、兩點(diǎn)重組、基因位移、基因重組等基本遺傳算子操作的步驟?;具z傳算子選擇種群中的作用個(gè)體時(shí)采用的概率選擇算法為輪盤賭算法。輪盤賭算法采用的公式如下P(Ik)=α+f(Ik)Σi=1N(α+f(Ii))]]>其中α為非0正數(shù),保證即使適應(yīng)度為0,個(gè)體Ik仍然具有一定的選中概率。f(x)表示第x個(gè)體的適應(yīng)度得分。
6、依次對(duì)種群執(zhí)行基因隨機(jī)重組算子和染色體重組算子的步驟,其中基因隨機(jī)重組算子的計(jì)算步驟如下1)計(jì)算需要由本算子生成的后代數(shù);2)根據(jù)輪盤賭的方式隨機(jī)選擇兩個(gè)需要重組的個(gè)體;3)以基因?yàn)閱挝?,隨機(jī)產(chǎn)生染色體重組位置;4)交換兩個(gè)個(gè)體的重組位置后的所有基因;5)產(chǎn)生兩個(gè)后代個(gè)體;6)重復(fù)步2~步5,直到達(dá)到步1指定后代數(shù)。
染色體重組算子的計(jì)算步驟如下1)計(jì)算需要由本算子生成的后代數(shù);2)根據(jù)輪盤賭的方式隨機(jī)選擇兩個(gè)需要重組的個(gè)體;3)對(duì)兩個(gè)重組個(gè)體的所有基因隨機(jī)選擇是否交換;4)用選擇結(jié)果生成兩個(gè)后代個(gè)體;5)重復(fù)步2~步5,直到達(dá)到步1指定后代數(shù)。
7、將操作結(jié)果排序并復(fù)制到下一代的步驟。
8、如果最好進(jìn)化結(jié)果滿足精度要求或達(dá)到預(yù)設(shè)的最大輩數(shù),則進(jìn)行下一步,否則到第3步進(jìn)行循環(huán)操作的步驟。
9、將最佳適應(yīng)度個(gè)體作為算法分類器的步驟。
(三)用基于重疊表達(dá)的多基因進(jìn)化算法模塊產(chǎn)生對(duì)應(yīng)分類器的流程用基于重疊表達(dá)的多基因進(jìn)化算法模塊產(chǎn)生對(duì)應(yīng)分類器的流程如圖4所示,具體步驟包括1、根據(jù)用戶輸入條件,從流動(dòng)人口數(shù)據(jù)倉庫選擇訓(xùn)練樣本數(shù)據(jù)并產(chǎn)生訓(xùn)練集的步驟;樣本數(shù)據(jù)字段可根據(jù)用戶輸入從性別、年齡、身份證號(hào)、居住旅店的行政區(qū)劃、所屬派出所、居住旅店的編號(hào)和名稱、入住時(shí)間、離開時(shí)間、房間號(hào)碼等中進(jìn)行選擇。
2、根據(jù)用戶輸入重疊表達(dá)的多基因進(jìn)化算法參數(shù)基因數(shù)量、種群大小、單點(diǎn)重組率、多點(diǎn)重組率、變異率、位移率、根位移率、基因位移率、基因重組率、精度、最大輩數(shù)對(duì)種群進(jìn)行初始化的步驟。
3、根據(jù)基于重疊表達(dá)的多基因進(jìn)化算法,計(jì)算種群中每個(gè)個(gè)體對(duì)訓(xùn)練集的適應(yīng)度,即調(diào)用評(píng)價(jià)函數(shù)的步驟。具體公式與多層染色體的基因表達(dá)式編程算法相同。
4、保留適應(yīng)度排名第一的個(gè)體到下一代的步驟。
5、對(duì)種群進(jìn)行變異、位移、根位移、單點(diǎn)重組、兩點(diǎn)重組、基因位移、基因重組等基本遺傳算子操作的步驟。基本遺傳算子選擇種群中的作用個(gè)體時(shí)采用的概率選擇算法為輪盤賭算法或個(gè)體密度的概率選擇算法。輪盤賭算法與多層染色體的基因表達(dá)式編程算法相同,個(gè)體密度的概率選擇算法公式如下P(Ik)=1D(Ik)Σi=1N1D(Ii)=Σi=1N|f(Ik)-f(Ii)|Σi=1NΣj=1N|f(Ii)-f(Ij)|,k=1,2,...,N]]>其中α為非0正數(shù),保證即使適應(yīng)度為0,個(gè)體Ik仍然具有一定的選中概率。f(x)表示第x個(gè)體的適應(yīng)度得分。
6、將操作結(jié)果排序并復(fù)制到下一代的步驟;7、如果最佳個(gè)體適應(yīng)度滿足精度要求或達(dá)到預(yù)設(shè)的最大輩數(shù),則進(jìn)行下一步,否則回到第3步進(jìn)行循環(huán)操作的步驟;8、將最佳適應(yīng)度個(gè)體作為該算法分類器的步驟。
具體算法細(xì)節(jié)還可以參考文獻(xiàn)“彭京,唐常杰,李川,胡建軍.M-GEP基于多層染色體基因表達(dá)式編程的遺傳進(jìn)化算法,計(jì)算機(jī)學(xué)報(bào),2005,28(9).1459-1466.”和“JingPeng,Chang-jie Tang,Jing Zhang,and Chang-an Yuan.Evolutionary AlgorithmBased on Overlapped Gene Expression,ICNC 2005,LNCS 3612,pp.194-204,2005.”
權(quán)利要求
1.一種基于生物啟發(fā)計(jì)算的流動(dòng)人口信息分析及預(yù)、報(bào)警方法,包括通過旅店前臺(tái)微機(jī)錄入住宿旅客信息的步驟;利用公網(wǎng)將錄入的住宿旅客信息傳輸?shù)酵ㄐ盘幚砟K的步驟;通信處理模塊將數(shù)據(jù)傳輸?shù)奖葘?duì)服務(wù)器與黑名單數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行比對(duì)的步驟;由通信處理模塊將數(shù)據(jù)維護(hù)到流動(dòng)人口數(shù)據(jù)庫的步驟;其特征在于該方法還包括利用數(shù)據(jù)抽取轉(zhuǎn)換加載模塊完成從流動(dòng)人口數(shù)據(jù)庫到流動(dòng)人口數(shù)據(jù)倉庫的加載步驟;依據(jù)流動(dòng)人口數(shù)據(jù)倉庫產(chǎn)生用于分類的樣本數(shù)據(jù),同時(shí)傳輸給基于多層染色體的基因表達(dá)式編程算法模塊和基于重疊表達(dá)的多基因進(jìn)化算法模塊進(jìn)行計(jì)算分析,并產(chǎn)生對(duì)應(yīng)分類器的步驟;將流動(dòng)人口數(shù)據(jù)庫的數(shù)據(jù)分別傳輸給基于多層染色體的基因表達(dá)式編程算法分類器和基于重疊表達(dá)的多基因進(jìn)化算法分類器進(jìn)行歸類,并產(chǎn)生孤立點(diǎn)列表的步驟;通信處理模塊將數(shù)據(jù)傳輸?shù)奖葘?duì)模塊與黑名單數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行比對(duì)后傳輸給報(bào)警處理模塊進(jìn)行實(shí)時(shí)報(bào)警的步驟;和將比對(duì)服務(wù)器傳出的數(shù)據(jù)依次傳輸給基于多層染色體的基因表達(dá)式編程算法分類器和基于重疊表達(dá)的多基因進(jìn)化算法分類器判斷是否為孤立點(diǎn)的步驟;將基于多層染色體的基因表達(dá)式編程算法分類器和基于重疊表達(dá)的多基因進(jìn)化算法分類器判斷為孤立點(diǎn)的信息傳輸?shù)綀?bào)警處理模塊進(jìn)行實(shí)時(shí)報(bào)警的步驟,否,就結(jié)束的步驟。
2.根據(jù)權(quán)利要求1所述的基于生物啟發(fā)計(jì)算的流動(dòng)人口信息分析及預(yù)、報(bào)警方法,其特征在于基于多層染色體的基因表達(dá)式編程算法模塊產(chǎn)生對(duì)應(yīng)分類器的步驟包括根據(jù)用戶輸入條件,從流動(dòng)人口數(shù)據(jù)倉庫選擇訓(xùn)練樣本數(shù)據(jù)并產(chǎn)生訓(xùn)練集的步驟;根據(jù)基于多層染色體的基因表達(dá)式編程算法參數(shù)對(duì)種群進(jìn)行初始化的步驟;根據(jù)基于多層染色體的基因表達(dá)式編程算法,計(jì)算種群中每個(gè)個(gè)體對(duì)訓(xùn)練集的適應(yīng)度的步驟;保留適應(yīng)度排名第一的個(gè)體到下一代的步驟;對(duì)種群進(jìn)行基本遺傳算子操作的步驟;依次對(duì)種群執(zhí)行基因隨機(jī)重組算于和染色體重組算子的步驟;將操作結(jié)果排序并復(fù)制到下一代的步驟;如果最好進(jìn)化結(jié)果滿足精度要求或達(dá)到預(yù)設(shè)的最大輩數(shù),則進(jìn)行下一步,否則到第3步進(jìn)行循環(huán)操作的步驟;將最佳適應(yīng)度個(gè)體作為算法分類器的步驟。
3.根據(jù)權(quán)利要求1所述的基于生物啟發(fā)計(jì)算的流動(dòng)人口信息分析及預(yù)、報(bào)警方法,其特征在于基于重疊表達(dá)的多基因進(jìn)化算法模塊產(chǎn)生對(duì)應(yīng)分類器的步驟包括根據(jù)用戶輸入條件,從流動(dòng)人口數(shù)據(jù)倉庫選擇訓(xùn)練樣本數(shù)據(jù)并產(chǎn)生訓(xùn)練集的步驟;根據(jù)基于重疊表達(dá)的多基因進(jìn)化算法參數(shù)對(duì)種群進(jìn)行初始化的步驟;根據(jù)基于重疊表達(dá)的多基因進(jìn)化算法,計(jì)算種群中每個(gè)個(gè)體對(duì)訓(xùn)練集的適應(yīng)度,即調(diào)用評(píng)價(jià)函數(shù)的步驟;保留適應(yīng)度排名第一的個(gè)體到下一代的步驟;對(duì)種群進(jìn)行基本遺傳算子操作的步驟;將操作結(jié)果排序并復(fù)制到下一代的步驟;如果最佳個(gè)體適應(yīng)度滿足精度要求或達(dá)到預(yù)設(shè)的最大輩數(shù),則進(jìn)行下一步,否則回到第3步進(jìn)行循環(huán)操作的步驟;將最佳適應(yīng)度個(gè)體作為該算法分類器的步驟。
4.根據(jù)權(quán)利要求1或2或3所述的基于生物啟發(fā)計(jì)算的流動(dòng)人口信息分析及預(yù)、報(bào)警方法,其特征在于實(shí)時(shí)報(bào)警的步驟包括對(duì)通信處理模塊傳輸來的實(shí)時(shí)流動(dòng)人口數(shù)據(jù)流,由比對(duì)模塊完成比對(duì)黑名單數(shù)據(jù)庫比對(duì)成功的信息,根據(jù)涉案嚴(yán)重程度顯示紅、棕、橙顏色提示的步驟;對(duì)通信處理模塊傳輸來的實(shí)時(shí)流動(dòng)人口數(shù)據(jù)流,由比對(duì)模塊完成比對(duì)黑名單數(shù)據(jù)庫未比對(duì)成功的信息,依次使用已訓(xùn)練的基于多層染色體的基因表達(dá)式編程算法分類器和基于重疊表達(dá)的多基因進(jìn)化算法分類器分類,發(fā)現(xiàn)為孤立點(diǎn),即顯示黃顏色提示的步驟;否則退出,顯示沒有報(bào)警的綠顏色提示的步驟。
5.根據(jù)權(quán)利要求2所述的基于生物啟發(fā)計(jì)算的流動(dòng)人口信息分析及預(yù)、報(bào)警方法,其特征在于在產(chǎn)生基于多層染色體的基因表達(dá)式編程算法分類器時(shí),對(duì)種群進(jìn)行的基本遺傳算子操作有變異、位移、根位移、單點(diǎn)重組、兩點(diǎn)重組、基因位移、基因重組。
6.根據(jù)權(quán)利要求4所述的基于生物啟發(fā)計(jì)算的流動(dòng)人口信息分析及預(yù)、報(bào)警方法,其特征在于在產(chǎn)生基于多層染色體的基因表達(dá)式編程算法分類器時(shí),對(duì)種群進(jìn)行的基本遺傳算子操作有變異、位移、根位移、單點(diǎn)重組、兩點(diǎn)重組、基因位移、基因重組。
7.根據(jù)權(quán)利要求3所述的基于生物啟發(fā)計(jì)算的流動(dòng)人口信息分析及預(yù)、報(bào)警方法,其特征在于在產(chǎn)生基于重疊表達(dá)的多基因進(jìn)化算法分類器過程中,對(duì)種群進(jìn)行的基本遺傳算子操作有變異、位移、根位移、單點(diǎn)重組、兩點(diǎn)重組、基因位移、基因重組。
8.根據(jù)權(quán)利要求4所述的基于生物啟發(fā)計(jì)算的流動(dòng)人口信息分析及預(yù)、報(bào)警方法,其特征在于在產(chǎn)生基于重疊表達(dá)的多基因進(jìn)化算法分類器過程中,對(duì)種群進(jìn)行的基本遺傳算子操作有變異、位移、根位移、單點(diǎn)重組、兩點(diǎn)重組、基因位移、基因重組。
9.根據(jù)權(quán)利要求3所述的基于生物啟發(fā)計(jì)算的流動(dòng)人口信息分析及預(yù)、報(bào)警方法,其特征在于在產(chǎn)生基于重疊表達(dá)的多基因進(jìn)化算法分類器過程中,基本遺傳算子選擇種群中的作用個(gè)體時(shí)采用的概率選擇算法為輪盤賭算法或個(gè)體密度的概率選擇算法。
10.根據(jù)權(quán)利要求4所述的基于生物啟發(fā)計(jì)算的流動(dòng)人口信息分析及預(yù)、報(bào)警方法,其特征在于在產(chǎn)生基于重疊表達(dá)的多基因進(jìn)化算法分類器過程中,基本遺傳算子選擇種群中的作用個(gè)體時(shí)采用的概率選擇算法為輪盤賭算法或個(gè)體密度的概率選擇算法。
全文摘要
本發(fā)明提供的基于生物啟發(fā)計(jì)算的流動(dòng)人口信息分析及預(yù)、報(bào)警方法是利用現(xiàn)有公安機(jī)關(guān)建立的流動(dòng)人口信息系統(tǒng),從中抽取需要的信息,采用生物啟發(fā)計(jì)算領(lǐng)域內(nèi)的多層染色體的基因表達(dá)式編程算法和重疊表達(dá)的多基因進(jìn)化算法,對(duì)流動(dòng)人口數(shù)據(jù)進(jìn)行計(jì)算分析,完成數(shù)據(jù)的挖掘分類和孤立點(diǎn)分析,并根據(jù)孤立點(diǎn)分析結(jié)果,實(shí)時(shí)對(duì)流動(dòng)人口數(shù)據(jù)流進(jìn)行預(yù)、報(bào)警。本發(fā)明為公安機(jī)關(guān)發(fā)現(xiàn)各類人員的流動(dòng)模式以及流動(dòng)人口的趨勢(shì)性問題,對(duì)異常的人員流動(dòng)軌跡及趨勢(shì)、各類犯罪人員特征進(jìn)行深層次分析,建立了智能分析平臺(tái),填補(bǔ)了實(shí)時(shí)智能預(yù)、報(bào)警的空白,不僅可為打擊違法犯罪活動(dòng)贏得先機(jī),還能為區(qū)域治安提供有用的情報(bào)信息,增強(qiáng)預(yù)警性。
文檔編號(hào)G06Q50/00GK1808483SQ200610020149
公開日2006年7月26日 申請(qǐng)日期2006年1月16日 優(yōu)先權(quán)日2006年1月16日
發(fā)明者彭京, 唐常杰, 喬少杰, 程溫泉, 石葆梅, 方全心, 徐小玲 申請(qǐng)人:彭京