本發(fā)明涉及數(shù)據(jù)統(tǒng)計(jì)領(lǐng)域,特別涉及一種提升數(shù)據(jù)質(zhì)量的方法及裝置。
背景技術(shù):
現(xiàn)階段中,數(shù)據(jù)庫(kù)中的統(tǒng)計(jì)數(shù)據(jù)與實(shí)際情況相差甚遠(yuǎn),數(shù)據(jù)準(zhǔn)確性低,現(xiàn)實(shí)數(shù)據(jù)存在缺失、誤差等問(wèn)題,嚴(yán)重影響數(shù)據(jù)質(zhì)量。尤其是將紙質(zhì)版信息通過(guò)人工錄入時(shí),將會(huì)存在錯(cuò)填或缺失等問(wèn)題。其次,由于系統(tǒng)設(shè)計(jì)不合理,程序控制程度難以掌握,如兩個(gè)同性質(zhì)的表格,在不同系統(tǒng)中填入的內(nèi)容不相同,或在一個(gè)表格內(nèi)所需必填的內(nèi)容在另一表格內(nèi)缺失,從而造成數(shù)據(jù)不實(shí)。目前,存在許多因素造成數(shù)據(jù)質(zhì)量低下,難以保證數(shù)據(jù)的準(zhǔn)確度。
另外,現(xiàn)階段,數(shù)據(jù)庫(kù)中大量的同類(lèi)數(shù)據(jù)以人工核對(duì)的方式進(jìn)行校驗(yàn)。通過(guò)人手逐個(gè)錄入、核對(duì),并校對(duì)數(shù)據(jù)的準(zhǔn)確性。雖然人工核對(duì)方式能整合數(shù)據(jù)庫(kù)中各式同類(lèi)數(shù)據(jù),但效率低下,易產(chǎn)生錯(cuò)誤。
當(dāng)前,經(jīng)濟(jì)社會(huì)快速發(fā)展,人們對(duì)數(shù)據(jù)的需求不斷增加。高準(zhǔn)確度的數(shù)據(jù)對(duì)實(shí)行科學(xué)決策和現(xiàn)代化管理至關(guān)重要。而不實(shí)的數(shù)據(jù)不僅會(huì)造成財(cái)務(wù)成本核算失實(shí),還會(huì)導(dǎo)致管理人員在決策上造成重大失誤。因此,提升數(shù)據(jù)質(zhì)量是數(shù)據(jù)管理領(lǐng)域中最迫切的需求。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明要解決的技術(shù)問(wèn)題在于,針對(duì)現(xiàn)有技術(shù)的上述缺陷,提供一種能提高數(shù)據(jù)準(zhǔn)確性、優(yōu)化數(shù)據(jù)質(zhì)量、提高數(shù)據(jù)統(tǒng)計(jì)業(yè)務(wù)工作的質(zhì)量、有利于管理決策的提升數(shù)據(jù)質(zhì)量的方法及裝置。
本發(fā)明解決其技術(shù)問(wèn)題所采用的技術(shù)方案是:構(gòu)造一種提升數(shù)據(jù)質(zhì)量的方法,包括如下步驟:
A)在數(shù)據(jù)庫(kù)中對(duì)所有數(shù)據(jù)表進(jìn)行掃描,找出字段名稱(chēng)一致的字段,程序?qū)⒆侄蚊Q(chēng)一致的字段自動(dòng)生成關(guān)聯(lián)對(duì);
B)判斷生成的關(guān)聯(lián)對(duì)是否大于或等于設(shè)定對(duì)數(shù),如是,通過(guò)所述關(guān)聯(lián)對(duì)中的鍵值,獲取所述數(shù)據(jù)表中的數(shù)據(jù)值,執(zhí)行步驟C);否則,返回步驟A);
C)計(jì)算所獲取的所有數(shù)據(jù)值的權(quán)重值,并根據(jù)計(jì)算結(jié)果將權(quán)重值最高的數(shù)據(jù)值作為可信數(shù)據(jù);
D)當(dāng)用戶(hù)要求或程序無(wú)法做出自動(dòng)性判斷時(shí),系統(tǒng)生成自動(dòng)對(duì)比結(jié)果的表格,將所述計(jì)算結(jié)果以報(bào)表的形式羅列給所述用戶(hù),通過(guò)所述用戶(hù)的人工核對(duì),獲取最后的正確數(shù)據(jù)值。
在本發(fā)明所述的提升數(shù)據(jù)質(zhì)量的方法中,在所述步驟C)和步驟D)之間還包括:
C′)檢測(cè)所述數(shù)據(jù)值是否有校驗(yàn)碼,如是,根據(jù)編碼規(guī)則對(duì)所述校驗(yàn)位進(jìn)行校驗(yàn)計(jì)算,并判斷所述數(shù)據(jù)值的可信度,執(zhí)行步驟D);否則,執(zhí)行步驟D)。
在本發(fā)明所述的提升數(shù)據(jù)質(zhì)量的方法中,所述設(shè)定對(duì)數(shù)為三對(duì)。
在本發(fā)明所述的提升數(shù)據(jù)質(zhì)量的方法中,當(dāng)所述數(shù)據(jù)值為居民身份證編號(hào)時(shí),所述校驗(yàn)位為所述居民身份證編號(hào)的最后一位;當(dāng)所述數(shù)據(jù)值為組織機(jī)構(gòu)代碼證號(hào)時(shí),所述校驗(yàn)位為所述組織機(jī)構(gòu)代碼證號(hào)的最后一位;當(dāng)所述數(shù)據(jù)值為車(chē)輛識(shí)別號(hào)時(shí),所述校驗(yàn)位為所述車(chē)輛識(shí)別號(hào)的第九位;當(dāng)所述數(shù)據(jù)值為社會(huì)信用代碼時(shí),所述校驗(yàn)位為所述社會(huì)信用代碼的最后一位。
本發(fā)明還涉及一種實(shí)現(xiàn)如權(quán)利要求1所述的提升數(shù)據(jù)質(zhì)量的方法的裝置,包括:
掃描關(guān)聯(lián)單元:用于在數(shù)據(jù)庫(kù)中對(duì)所有數(shù)據(jù)表進(jìn)行掃描,找出字段名稱(chēng)一致的字段,程序?qū)⒆侄蚊Q(chēng)一致的字段自動(dòng)生成關(guān)聯(lián)對(duì);
關(guān)聯(lián)對(duì)判斷單元:用于判斷生成的關(guān)聯(lián)對(duì)是否大于或等于設(shè)定對(duì)數(shù),如是,通過(guò)所述關(guān)聯(lián)對(duì)中的鍵值,獲取所述數(shù)據(jù)表中的數(shù)據(jù)值;否則,返回到所述掃描關(guān)聯(lián)單元;
權(quán)重計(jì)算單元:用于計(jì)算所獲取的所有數(shù)據(jù)值的權(quán)重值,并根據(jù)計(jì)算結(jié)果將權(quán)重值最高的數(shù)據(jù)值作為可信數(shù)據(jù);
結(jié)果獲取單元:用于當(dāng)用戶(hù)要求或程序無(wú)法做出自動(dòng)性判斷時(shí),系統(tǒng)生成自動(dòng)對(duì)比結(jié)果的表格,將所述計(jì)算結(jié)果以報(bào)表的形式羅列給所述用戶(hù),通過(guò)所述用戶(hù)的人工核對(duì),獲取最后的正確數(shù)據(jù)值。
在本發(fā)明所述的實(shí)現(xiàn)上述提升數(shù)據(jù)質(zhì)量的方法的裝置中,在所述權(quán)重計(jì)算單元和結(jié)果獲取單元之間還包括:
校驗(yàn)碼檢測(cè)單元:用于檢測(cè)所述數(shù)據(jù)值是否有校驗(yàn)碼,如是,根據(jù)編碼規(guī)則對(duì)所述校驗(yàn)位進(jìn)行校驗(yàn)計(jì)算,并判斷所述數(shù)據(jù)值的可信度;否則,轉(zhuǎn)到所述結(jié)果獲取單元。
在本發(fā)明所述的實(shí)現(xiàn)上述提升數(shù)據(jù)質(zhì)量的方法的裝置中,所述設(shè)定對(duì)數(shù)為三對(duì)。
在本發(fā)明所述的實(shí)現(xiàn)上述提升數(shù)據(jù)質(zhì)量的方法的裝置中,當(dāng)所述數(shù)據(jù)值為居民身份證編號(hào)時(shí),所述校驗(yàn)位為所述居民身份證編號(hào)的最后一位;當(dāng)所述數(shù)據(jù)值為組織機(jī)構(gòu)代碼證號(hào)時(shí),所述校驗(yàn)位為所述組織機(jī)構(gòu)代碼證號(hào)的最后一位;當(dāng)所述數(shù)據(jù)值為車(chē)輛識(shí)別號(hào)時(shí),所述校驗(yàn)位為所述車(chē)輛識(shí)別號(hào)的第九位;當(dāng)所述數(shù)據(jù)值為社會(huì)信用代碼時(shí),所述校驗(yàn)位為所述社會(huì)信用代碼的最后一位。
實(shí)施本發(fā)明的提升數(shù)據(jù)質(zhì)量的方法及裝置,具有以下有益效果:由于通過(guò)掃描數(shù)據(jù)庫(kù)字段名稱(chēng)自動(dòng)獲取關(guān)聯(lián)對(duì),以加權(quán)方式判斷權(quán)重值較高的數(shù)據(jù)為可信數(shù)據(jù),通過(guò)報(bào)表的方案,結(jié)合程序自動(dòng)判斷和人工判斷兩種數(shù)據(jù)提升數(shù)據(jù)質(zhì)量的方法,相當(dāng)于通過(guò)對(duì)數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行整合,加強(qiáng)數(shù)據(jù)質(zhì)量管理、增強(qiáng)整合數(shù)據(jù)的能力、減少同類(lèi)數(shù)據(jù)中存在的誤差,這樣就可以提高數(shù)據(jù)準(zhǔn)確性,優(yōu)化數(shù)據(jù)質(zhì)量;通過(guò)提高數(shù)據(jù)庫(kù)的數(shù)據(jù)質(zhì)量,有助于業(yè)務(wù)工作人員有效運(yùn)用數(shù)據(jù),提高工作效率,為其工作帶來(lái)便利;當(dāng)管理用戶(hù)在制定決策時(shí),高質(zhì)量的數(shù)據(jù)成為他們決策的最佳依據(jù),能有效幫助他們做出準(zhǔn)確的判斷,確保做出信心十足的決策;所以其能提高數(shù)據(jù)準(zhǔn)確性、優(yōu)化數(shù)據(jù)質(zhì)量、提高數(shù)據(jù)統(tǒng)計(jì)業(yè)務(wù)工作的質(zhì)量、有利于管理決策。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明提升數(shù)據(jù)質(zhì)量的方法及裝置一個(gè)實(shí)施例中方法的流程圖;
圖2為所述實(shí)施例中進(jìn)行校驗(yàn)碼判斷的流程圖;
圖3為所述實(shí)施例中裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
在本發(fā)明提升數(shù)據(jù)質(zhì)量的方法及裝置實(shí)施例中,其提升數(shù)據(jù)質(zhì)量的方法的流程圖如圖1所示。圖1中,該提升數(shù)據(jù)質(zhì)量的方法包括如下步驟:
步驟S01在數(shù)據(jù)庫(kù)中對(duì)所有數(shù)據(jù)表進(jìn)行掃描,找出字段名稱(chēng)一致的字段,程序?qū)⒆侄蚊Q(chēng)一致的字段自動(dòng)生成關(guān)聯(lián)對(duì):本步驟中,通過(guò)掃描數(shù)據(jù)庫(kù)字段名稱(chēng),自動(dòng)獲取關(guān)聯(lián)對(duì),具體就是通過(guò)在數(shù)據(jù)庫(kù)中隊(duì)所有數(shù)據(jù)表進(jìn)行掃描,找出字段名稱(chēng)一致的字段,程序?qū)⒆侄蚊Q(chēng)一致的字段自動(dòng)生成關(guān)聯(lián)對(duì)。
步驟S02判斷生成的關(guān)聯(lián)對(duì)是否大于或等于設(shè)定對(duì)數(shù):本步驟中,判斷生成的關(guān)聯(lián)對(duì)是否大于或等于設(shè)定對(duì)數(shù),本實(shí)施例中,設(shè)定對(duì)數(shù)為三對(duì),也就是說(shuō),本步驟中,實(shí)際就是判斷生成的并聯(lián)對(duì)是否大于或等于三對(duì),如果判斷的結(jié)果為是,則執(zhí)行步驟S03;否則,返回步驟S01。
步驟S03通過(guò)關(guān)聯(lián)對(duì)中的鍵值,獲取數(shù)據(jù)表中的數(shù)據(jù)值:如果上述步驟S02的判斷結(jié)果為是,也就是生成了三對(duì)或三對(duì)以上的關(guān)聯(lián)對(duì),則執(zhí)行本步驟。本步驟中,關(guān)聯(lián)對(duì)比對(duì),加權(quán)信任,具體就是通過(guò)關(guān)聯(lián)對(duì)中的鍵值,獲取數(shù)據(jù)表中的數(shù)據(jù)值。執(zhí)行完本步驟,執(zhí)行步驟S04。
步驟S04計(jì)算所獲取的所有數(shù)據(jù)值的權(quán)重值,并根據(jù)計(jì)算結(jié)果將權(quán)重值最高的數(shù)據(jù)值作為可信數(shù)據(jù):本步驟中,計(jì)算所獲取的所有數(shù)據(jù)值的權(quán)重值,并根據(jù)計(jì)算結(jié)果將權(quán)重值最高的數(shù)據(jù)值作為可信數(shù)據(jù)。具體來(lái)講,如果一個(gè)數(shù)據(jù)值出現(xiàn)一次,即對(duì)該數(shù)據(jù)值的權(quán)重值加一。在此情況下,數(shù)據(jù)值重復(fù)出現(xiàn)的次數(shù)越多,其權(quán)重值就越高。因此完成對(duì)比后,權(quán)重值越高的數(shù)據(jù)值越可信。本實(shí)施例中,如果程序處于全自動(dòng)運(yùn)行無(wú)需人工干預(yù)狀態(tài),權(quán)重值最高的數(shù)據(jù)值為可信數(shù)據(jù)。執(zhí)行完本步驟,執(zhí)行步驟S05。
步驟S05當(dāng)用戶(hù)要求或程序無(wú)法做出自動(dòng)性判斷時(shí),系統(tǒng)生成自動(dòng)對(duì)比結(jié)果的表格,將計(jì)算結(jié)果以報(bào)表的形式羅列給用戶(hù),通過(guò)用戶(hù)的人工核對(duì),獲取最后的正確數(shù)據(jù)值:本步驟中,人工分析,列值比對(duì),具體的,完成上述比對(duì)后,如果用戶(hù)要求或者程序無(wú)法做出自動(dòng)性判斷時(shí),系統(tǒng)會(huì)生成自動(dòng)對(duì)比結(jié)果的表格,將步驟S04中的自動(dòng)算法計(jì)算之后的計(jì)算結(jié)果以報(bào)表的形式羅列給用戶(hù)自行核對(duì),最終通過(guò)用戶(hù)的人工核對(duì),獲取最終的正確數(shù)據(jù)值。
本發(fā)明的提升數(shù)據(jù)質(zhì)量的方法通過(guò)對(duì)數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行整合,可以加強(qiáng)數(shù)據(jù)質(zhì)量管理、增強(qiáng)整合數(shù)據(jù)的能力、減少同類(lèi)數(shù)據(jù)中存在的誤差、提高數(shù)據(jù)質(zhì)量,這樣就可以提高數(shù)據(jù)準(zhǔn)確性,優(yōu)化數(shù)據(jù)質(zhì)量。通過(guò)提高數(shù)據(jù)庫(kù)數(shù)據(jù)質(zhì)量,有助于業(yè)務(wù)工作人員有效運(yùn)用數(shù)據(jù),提高工作效率,為其工作帶來(lái)便利,這樣就可以提高數(shù)據(jù)統(tǒng)計(jì)業(yè)務(wù)工作的質(zhì)量。當(dāng)管理用戶(hù)在制定決策時(shí),高質(zhì)量的數(shù)據(jù)成為他們決策的最佳依據(jù),能有效幫助他們做出準(zhǔn)確的判斷,確保做出信心十足的決策,所以這樣就有利于管理決策。
值得一提的是,本實(shí)施例中,當(dāng)數(shù)據(jù)庫(kù)中個(gè)別字段有校驗(yàn)碼時(shí),可通過(guò)校驗(yàn)碼獲取可信數(shù)據(jù)。具體的,進(jìn)行校驗(yàn)碼判斷的流程圖如圖2所示,圖2中,在步驟S04和步驟S05之間還包括如下步驟:
步驟S04′檢測(cè)數(shù)據(jù)值是否有校驗(yàn)碼:本步驟中,檢測(cè)數(shù)據(jù)值是否有校驗(yàn)碼,如果檢測(cè)的結(jié)果為是,則執(zhí)行步驟S05′;否則,執(zhí)行步驟S05。
步驟S05′根據(jù)編碼規(guī)則對(duì)校驗(yàn)位進(jìn)行校驗(yàn)計(jì)算,并判斷數(shù)據(jù)值的可信度:如果上述步驟S04′的判斷結(jié)果為是,則執(zhí)行本步驟。本步驟中,根據(jù)編碼規(guī)則對(duì)校驗(yàn)位進(jìn)行校驗(yàn)計(jì)算,并判斷數(shù)據(jù)值的可信度。當(dāng)數(shù)據(jù)值為居民身份證編號(hào)時(shí),校驗(yàn)位為居民身份證編號(hào)的最后一位;當(dāng)數(shù)據(jù)值為組織機(jī)構(gòu)代碼證號(hào)時(shí),校驗(yàn)位為組織機(jī)構(gòu)代碼證號(hào)的最后一位;當(dāng)數(shù)據(jù)值為車(chē)輛識(shí)別號(hào)時(shí),校驗(yàn)位為所述車(chē)輛識(shí)別號(hào)的第九位;當(dāng)數(shù)據(jù)值為社會(huì)信用代碼時(shí),校驗(yàn)位為社會(huì)信用代碼的最后一位。
具體來(lái)講,居民身份證編號(hào)的校驗(yàn)位為身份證編號(hào)的最后一位,可以根據(jù)編碼規(guī)則《GB11643-1999公民身份號(hào)碼》檢驗(yàn)計(jì)算;組織機(jī)構(gòu)代碼證號(hào)的校驗(yàn)位為組織機(jī)構(gòu)代碼證號(hào)的最后一位,可以根據(jù)編碼規(guī)則《GB11714-1997全國(guó)組織機(jī)構(gòu)代碼編制規(guī)則》檢驗(yàn)計(jì)算;車(chē)輛識(shí)別號(hào)(VIN)的校驗(yàn)位為車(chē)輛識(shí)別號(hào)的第九位,可以根據(jù)編碼規(guī)則《GB16735-2004道路車(chē)輛車(chē)輛識(shí)別代號(hào)(VIN)》檢驗(yàn)計(jì)算;社會(huì)信用代碼的校驗(yàn)位為社會(huì)信用代碼的最后一位,可以根據(jù)編碼規(guī)則《GB32100-2015法人和其他組織統(tǒng)一社會(huì)信用代碼編碼規(guī)則》檢驗(yàn)計(jì)算。執(zhí)行完本步驟,執(zhí)行步驟S05。
此種情況下,在上述步驟S05中,就可以將步驟S04中自動(dòng)算法和步驟S05′中附加算法計(jì)算后的計(jì)算結(jié)果,以報(bào)表的形式羅列給用戶(hù)自行核對(duì)。最終通過(guò)用戶(hù)的人工核對(duì),獲取最后的正確數(shù)據(jù)值。這樣獲取的正確數(shù)據(jù)值的精度會(huì)更高。如果數(shù)據(jù)值不涉及校驗(yàn)值算法,則步驟S04′和步驟S05′可忽略。通過(guò)加入以上所述的校驗(yàn)碼算法,可協(xié)助判斷數(shù)據(jù)值的可信度。
本實(shí)施例還涉及一種實(shí)現(xiàn)上述提升數(shù)據(jù)質(zhì)量的方法的裝置,其結(jié)構(gòu)示意圖如圖3所示。圖3中,該裝置包括掃描關(guān)聯(lián)單元1、關(guān)聯(lián)對(duì)判斷單元2、權(quán)重計(jì)算單元3和結(jié)果獲取單元4;其中,掃描關(guān)聯(lián)單元1用于在數(shù)據(jù)庫(kù)中對(duì)所有數(shù)據(jù)表進(jìn)行掃描,找出字段名稱(chēng)一致的字段,程序?qū)⒆侄蚊Q(chēng)一致的字段自動(dòng)生成關(guān)聯(lián)對(duì);關(guān)聯(lián)對(duì)判斷單元2用于判斷生成的關(guān)聯(lián)對(duì)是否大于或等于設(shè)定對(duì)數(shù),如是,通過(guò)關(guān)聯(lián)對(duì)中的鍵值,獲取數(shù)據(jù)表中的數(shù)據(jù)值;否則,返回到掃描關(guān)聯(lián)單元1;上述設(shè)定對(duì)數(shù)為三對(duì)。當(dāng)然,在本實(shí)施例的一些情況下,上述設(shè)定對(duì)數(shù)也可以為其他值。權(quán)重計(jì)算單元3用于計(jì)算所獲取的所有數(shù)據(jù)值的權(quán)重值,并根據(jù)計(jì)算結(jié)果將權(quán)重值最高的數(shù)據(jù)值作為可信數(shù)據(jù);結(jié)果獲取單元4用于當(dāng)用戶(hù)要求或程序無(wú)法做出自動(dòng)性判斷時(shí),系統(tǒng)生成自動(dòng)對(duì)比結(jié)果的表格,將計(jì)算結(jié)果以報(bào)表的形式羅列給用戶(hù),通過(guò)用戶(hù)的人工核對(duì),獲取最后的正確數(shù)據(jù)值。
本發(fā)明的裝置通過(guò)對(duì)數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行整合,可以加強(qiáng)數(shù)據(jù)質(zhì)量管理、增強(qiáng)整合數(shù)據(jù)的能力、減少同類(lèi)數(shù)據(jù)中存在的誤差、提高數(shù)據(jù)質(zhì)量,這樣就可以提高數(shù)據(jù)準(zhǔn)確性,優(yōu)化數(shù)據(jù)質(zhì)量。通過(guò)提高數(shù)據(jù)庫(kù)數(shù)據(jù)質(zhì)量,有助于業(yè)務(wù)工作人員有效運(yùn)用數(shù)據(jù),提高工作效率,為其工作帶來(lái)便利,這樣就可以提高數(shù)據(jù)統(tǒng)計(jì)業(yè)務(wù)工作的質(zhì)量。當(dāng)管理用戶(hù)在制定決策時(shí),高質(zhì)量的數(shù)據(jù)成為他們決策的最佳依據(jù),能有效幫助他們做出準(zhǔn)確的判斷,確保做出信心十足的決策,所以這樣就有利于管理決策。
本實(shí)施例中,當(dāng)數(shù)據(jù)庫(kù)中個(gè)別字段有校驗(yàn)碼時(shí),可通過(guò)校驗(yàn)碼獲取可信數(shù)據(jù)。此時(shí),在權(quán)重計(jì)算單元3和結(jié)果獲取單元4之間還包括校驗(yàn)碼檢測(cè)單元3′,校驗(yàn)碼檢測(cè)單元3′用于檢測(cè)數(shù)據(jù)值是否有校驗(yàn)碼,如是,根據(jù)編碼規(guī)則對(duì)校驗(yàn)位進(jìn)行校驗(yàn)計(jì)算,并判斷數(shù)據(jù)值的可信度;否則,轉(zhuǎn)到結(jié)果獲取單元4。
本實(shí)施例中,當(dāng)數(shù)據(jù)值為居民身份證編號(hào)時(shí),校驗(yàn)位為所述居民身份證編號(hào)的最后一位;當(dāng)數(shù)據(jù)值為組織機(jī)構(gòu)代碼證號(hào)時(shí),校驗(yàn)位為組織機(jī)構(gòu)代碼證號(hào)的最后一位;當(dāng)數(shù)據(jù)值為車(chē)輛識(shí)別號(hào)時(shí),校驗(yàn)位為所述車(chē)輛識(shí)別號(hào)的第九位;當(dāng)數(shù)據(jù)值為社會(huì)信用代碼時(shí),校驗(yàn)位為社會(huì)信用代碼的最后一位。通過(guò)加入以上所述的校驗(yàn)碼算法,可協(xié)助判斷數(shù)據(jù)值的可信度。
總之,本發(fā)明通過(guò)使用通過(guò)掃描數(shù)據(jù)庫(kù)字段名稱(chēng),自動(dòng)獲取關(guān)聯(lián)對(duì);多值比對(duì),加權(quán)信任;人工分析,列值比對(duì)步驟,提升數(shù)據(jù)庫(kù)數(shù)據(jù)的質(zhì)量。具體就是通過(guò)掃描數(shù)據(jù)庫(kù)字段名稱(chēng),自動(dòng)獲取關(guān)聯(lián)對(duì);以加權(quán)方式,判斷權(quán)重值較高的數(shù)據(jù)值為可信數(shù)據(jù);通過(guò)報(bào)表的方案,結(jié)合程序自動(dòng)判斷和人工判斷兩種數(shù)據(jù)提升數(shù)據(jù)質(zhì)量的方法。本發(fā)明能提升數(shù)據(jù)庫(kù)數(shù)據(jù)質(zhì)量,并提供精確的數(shù)據(jù)分析的相關(guān)資料。其能解決傳統(tǒng)技術(shù)中數(shù)據(jù)庫(kù)中由于有許多同性質(zhì)的數(shù)據(jù)表格,然而這些表格由于存在不同原因?qū)е聰?shù)據(jù)錯(cuò)漏情況發(fā)生的問(wèn)題。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。