技術(shù)總結(jié)
一種大數(shù)據(jù)環(huán)境下的特殊人名與籍貫關(guān)聯(lián)方法,包括如下步驟:S1、采集人名與籍貫信息,包括人名的姓氏、讀音、籍貫地,并對(duì)人名與籍貫信息進(jìn)行數(shù)據(jù)融合、數(shù)據(jù)采樣與挖掘得到采集與挖掘后的數(shù)據(jù);同時(shí)跳轉(zhuǎn)到步驟S2、步驟S3;S2、篩除采集與挖掘后的數(shù)據(jù)中的常見(jiàn)人名,并對(duì)篩除后的數(shù)據(jù)進(jìn)行特殊人名甄別與標(biāo)記;通過(guò)分類校驗(yàn)特殊人名與常見(jiàn)人名進(jìn)行分類校驗(yàn)得到樣本數(shù)據(jù)結(jié)構(gòu)的定義;并跳轉(zhuǎn)到步驟S4;S3、對(duì)采集與挖掘后的數(shù)據(jù)進(jìn)行特征提取并建立關(guān)聯(lián)規(guī)則;并跳轉(zhuǎn)到步驟S4;S4、根據(jù)樣本數(shù)據(jù)結(jié)構(gòu)的定義以及提取的特征、關(guān)聯(lián)規(guī)則建立特殊人名集合與特征庫(kù);S5、根據(jù)特殊人名集合與特征庫(kù)建立推斷模型SNNPAR,并根據(jù)模型SNNPAR進(jìn)行特殊人名與籍貫、地域推斷。
技術(shù)研發(fā)人員:王峰
受保護(hù)的技術(shù)使用者:長(zhǎng)江大學(xué)
文檔號(hào)碼:201610518359
技術(shù)研發(fā)日:2016.07.04
技術(shù)公布日:2016.11.23