本發(fā)明涉及數(shù)據(jù)填報,尤其涉及一種智能數(shù)據(jù)填報系統(tǒng)。
背景技術(shù):
1、隨著我國經(jīng)濟的快速發(fā)展和科技水平的不斷提高,數(shù)據(jù)的收集和處理變得越來越重要。
2、傳統(tǒng)的數(shù)據(jù)填報方式無法做到自動填報數(shù)據(jù),需要人為進(jìn)行填報數(shù)據(jù),會出現(xiàn)大量錯誤之處,降低填報效率,增加人為成本,同時,缺少多層驗證機制,使填報過程變得繁瑣,降低數(shù)據(jù)的準(zhǔn)確性和精準(zhǔn)度。
3、因此,本發(fā)明提出一種智能數(shù)據(jù)填報系統(tǒng)。
技術(shù)實現(xiàn)思路
1、本發(fā)明提供一種智能數(shù)據(jù)填報系統(tǒng),用以解決現(xiàn)有技術(shù)中需要人為進(jìn)行填報數(shù)據(jù),會出現(xiàn)大量錯誤之處,降低填報效率,增加人為成本,同時,缺少多層驗證機制,使填報過程變得繁瑣,降低數(shù)據(jù)的準(zhǔn)確性和精準(zhǔn)度的缺陷。
2、一方面,本發(fā)明提供一種智能數(shù)據(jù)填報系統(tǒng),包括:
3、第一確定模塊:獲取目標(biāo)數(shù)據(jù)的數(shù)據(jù)特征和數(shù)據(jù)類型,根據(jù)所述數(shù)據(jù)特征和數(shù)據(jù)類型確定對應(yīng)的技術(shù)棧;
4、第一獲取模塊:根據(jù)所述技術(shù)?;谔顚懙奶崾?,獲取自動填充建議;
5、檢驗?zāi)K:設(shè)置多個層次的數(shù)據(jù)驗證機制,根據(jù)所述驗證機制檢驗數(shù)據(jù)的格式以及邏輯;
6、檢測模塊:根據(jù)所述自動填充建議以及驗證結(jié)果將目標(biāo)數(shù)據(jù)進(jìn)行填報,并基于人工智能技術(shù)檢測潛在的錯誤和不一致之處;
7、修正模塊:對所述錯誤和不一致之處進(jìn)行修正,并通過可視化的方式展示數(shù)據(jù),實現(xiàn)數(shù)據(jù)的智能填報。
8、根據(jù)本發(fā)明提供的一種智能數(shù)據(jù)填報系統(tǒng),第一確定模塊,包括:
9、第一獲取單元:對所述目標(biāo)數(shù)據(jù)進(jìn)行分析,獲取目標(biāo)數(shù)據(jù)的數(shù)據(jù)分布以及發(fā)展趨勢;
10、第二獲取單元:根據(jù)所述數(shù)據(jù)分布以及發(fā)展趨勢獲取目標(biāo)數(shù)據(jù)的數(shù)據(jù)特征;
11、提取單元:根據(jù)預(yù)設(shè)方式提取目標(biāo)數(shù)據(jù)的關(guān)鍵字,并根據(jù)數(shù)據(jù)來源確定目標(biāo)數(shù)據(jù)的詳細(xì)信息;
12、第一確定單元:根據(jù)所述關(guān)鍵字和數(shù)據(jù)的詳細(xì)信息確定目標(biāo)數(shù)據(jù)的數(shù)據(jù)類型;
13、第三獲取單元:獲取數(shù)據(jù)處理需求以及存儲需求,根據(jù)數(shù)據(jù)特征和數(shù)據(jù)類型獲取數(shù)據(jù)規(guī)模;
14、第二確定單元:基于所述數(shù)據(jù)處理需求、存儲需求以及數(shù)據(jù)規(guī)模確定對應(yīng)的技術(shù)棧。
15、根據(jù)本發(fā)明提供的一種智能數(shù)據(jù)填報系統(tǒng),第一獲取模塊,包括:
16、處理單元:使用分詞模型對已有的數(shù)據(jù)和填寫的提示進(jìn)行分詞處理,獲取單詞或字符序列;
17、轉(zhuǎn)換單元:將每個生成的單詞或字符序列轉(zhuǎn)換成對應(yīng)的詞語嵌入向量;
18、學(xué)習(xí)單元:通過建立神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)所述詞語嵌入向量和對應(yīng)的標(biāo)簽之間的映射關(guān)系;
19、預(yù)測單元:根據(jù)所述技術(shù)棧通過神經(jīng)網(wǎng)絡(luò)模型預(yù)測目標(biāo)數(shù)據(jù)可能存在的標(biāo)簽;
20、選擇單元:根據(jù)預(yù)測結(jié)果中每個標(biāo)簽的概率分布,選擇概率分布最多的標(biāo)簽作為自動填充建議;
21、其中,如果多個標(biāo)簽具有相同的高斯核密度,則可以隨機選擇其中一個標(biāo)簽。
22、根據(jù)本發(fā)明提供的一種智能數(shù)據(jù)填報系統(tǒng),檢驗?zāi)K,包括:
23、定義單元:根據(jù)填報系統(tǒng)的需求定義數(shù)據(jù)格式規(guī)則和邏輯驗證規(guī)則;
24、第三確定單元:編寫相應(yīng)的嵌套驗證函數(shù),并將目標(biāo)數(shù)據(jù)輸入到嵌套驗證函數(shù)中,獲取對應(yīng)的多個布爾值,根據(jù)所述多個布爾值確定數(shù)據(jù)的有效性;
25、分類標(biāo)注單元:根據(jù)所述有效性對數(shù)據(jù)進(jìn)行分類和標(biāo)注;
26、檢驗單元:根據(jù)分類和標(biāo)注結(jié)果基于所述數(shù)據(jù)格式規(guī)則和邏輯驗證規(guī)則檢驗數(shù)據(jù)的格式以及邏輯。
27、根據(jù)本發(fā)明提供的一種智能數(shù)據(jù)填報系統(tǒng),檢測模塊,包括:
28、第四獲取單元:對所述自動填充建議以及驗證結(jié)果進(jìn)行分析,獲取每個步驟和所需的變量;
29、填報單元:根據(jù)所述每個步驟和所需的變量將目標(biāo)數(shù)據(jù)進(jìn)行填報;
30、檢測單元:對填報的數(shù)據(jù)基于自然語言處理進(jìn)行預(yù)處理,根據(jù)預(yù)處理結(jié)果檢測填報數(shù)據(jù)潛在的錯誤和不一致之處。
31、根據(jù)本發(fā)明提供的一種智能數(shù)據(jù)填報系統(tǒng),修正模塊,包括:
32、分析單元:對所述錯誤和不一致之處進(jìn)行分析,根據(jù)分析結(jié)果獲取問題產(chǎn)生原因;
33、第四確定單元:根據(jù)所述問題產(chǎn)生原因確定問題類型;
34、修正單元:根據(jù)所述問題類型確定對應(yīng)的修復(fù)方案,根據(jù)所述修復(fù)方案對所述錯誤和不一致之處進(jìn)行修正,并通過可視化的方式展示修正后的數(shù)據(jù)。
35、根據(jù)本發(fā)明提供的一種智能數(shù)據(jù)填報系統(tǒng),定義單元,包括:
36、第一確定子單元:根據(jù)填報系統(tǒng)的需求確定填報數(shù)據(jù)格式種類,根據(jù)填報數(shù)據(jù)格式種類和各個數(shù)據(jù)格式之間的轉(zhuǎn)換參數(shù)定義數(shù)據(jù)格式規(guī)則;
37、第二確定子單元:確定填報內(nèi)容待滿足的條件參數(shù),根據(jù)待滿足的條件參數(shù)確定驗證邏輯條件;
38、生成子單元:基于驗證邏輯條件生成邏輯驗證規(guī)則。
39、根據(jù)本發(fā)明提供的一種智能數(shù)據(jù)填報系統(tǒng),還包括:
40、第二確定模塊:獲取填報數(shù)據(jù)的基本信息,根據(jù)基本信息確定宏觀維度數(shù)據(jù)標(biāo)簽和微觀維度數(shù)據(jù)標(biāo)簽;
41、第二獲取模塊:獲取宏觀維度數(shù)據(jù)標(biāo)簽和微觀維度數(shù)據(jù)標(biāo)簽各自對應(yīng)的標(biāo)簽數(shù)據(jù)并進(jìn)行整合,獲取標(biāo)簽數(shù)據(jù)集;
42、訓(xùn)練模塊:對標(biāo)簽數(shù)據(jù)集進(jìn)行預(yù)處理,利用預(yù)處理后的標(biāo)簽數(shù)據(jù)集對邏輯回歸模型進(jìn)行訓(xùn)練;
43、生成模塊:通過訓(xùn)練后的邏輯回歸模型獲取數(shù)據(jù)篩選定量指標(biāo)和數(shù)據(jù)篩選定性指標(biāo),根據(jù)數(shù)據(jù)篩選定量指標(biāo)和數(shù)據(jù)篩選定性指標(biāo)生成數(shù)據(jù)篩選規(guī)則;
44、調(diào)取模塊:通過預(yù)設(shè)方式接通大數(shù)據(jù)庫并基于大數(shù)據(jù)庫的數(shù)據(jù)調(diào)取功能生成數(shù)據(jù)調(diào)取請求;
45、第三獲取模塊:將數(shù)據(jù)篩選規(guī)則進(jìn)行序列化,生成規(guī)則文件,將規(guī)則文件導(dǎo)入到數(shù)據(jù)庫的觸發(fā)服務(wù)器中,通過觸發(fā)服務(wù)器在數(shù)據(jù)庫中進(jìn)行檢索,獲取多個數(shù)據(jù)文件夾;
46、設(shè)置模塊:設(shè)置數(shù)據(jù)存儲路徑,抽取多個數(shù)據(jù)文件夾中的源數(shù)據(jù)并將其存儲到數(shù)據(jù)存儲路徑中;
47、第三確定模塊:獲取每個源數(shù)據(jù)的業(yè)務(wù)對象,確定業(yè)務(wù)對象的業(yè)務(wù)屬性,確定業(yè)務(wù)屬性與填報內(nèi)容基本信息的吻合度,根據(jù)吻合度選擇目標(biāo)源數(shù)據(jù)作為待調(diào)取填報數(shù)據(jù)。
48、與現(xiàn)有技術(shù)相比,本申請的有益效果如下:
49、通過目標(biāo)數(shù)據(jù)的數(shù)據(jù)特征和數(shù)據(jù)類型確定技術(shù)棧,結(jié)合已有的數(shù)據(jù)和填寫的提示,獲取自動填充建議,并根據(jù)多層驗證機制將目標(biāo)數(shù)據(jù)進(jìn)行填報,確定填報錯誤之處,能夠提高填報效率,降低人為成本,同時,增加多層驗證機制,使填報過程變得精簡,提高數(shù)據(jù)的準(zhǔn)確性和精準(zhǔn)度。
1.一種智能數(shù)據(jù)填報系統(tǒng),其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的智能數(shù)據(jù)填報系統(tǒng),其特征在于,第一確定模塊,包括:
3.根據(jù)權(quán)利要求1所述的智能數(shù)據(jù)填報系統(tǒng),其特征在于,第一獲取模塊,包括:
4.根據(jù)權(quán)利要求1所述的智能數(shù)據(jù)填報系統(tǒng),其特征在于,檢驗?zāi)K,包括:
5.根據(jù)權(quán)利要求1所述的智能數(shù)據(jù)填報系統(tǒng),其特征在于,檢測模塊,包括:
6.根據(jù)權(quán)利要求1所述的智能數(shù)據(jù)填報系統(tǒng),其特征在于,修正模塊,包括:
7.根據(jù)權(quán)利要求4所述的智能數(shù)據(jù)填報系統(tǒng),其特征在于,定義單元,包括:
8.根據(jù)權(quán)利要求1所述的智能數(shù)據(jù)填報系統(tǒng),其特征在于,還包括: