本發(fā)明涉及名稱不一致,特別是財務(wù)系統(tǒng)內(nèi)名稱不一致的解決方案。
背景技術(shù):
名詞解釋
格式預(yù)處理:為統(tǒng)一格式而采用相應(yīng)處理步驟進(jìn)行的預(yù)處理??梢允浅绦蛲瓿傻模蚴止げ僮髦噶?。
標(biāo)準(zhǔn)名稱表:根據(jù)業(yè)務(wù)需求確定的標(biāo)準(zhǔn)名稱的集合表格。比如把銀行提供的出入帳信息表使用的單位名稱作為標(biāo)準(zhǔn)名稱。注意因為業(yè)務(wù)的不同,標(biāo)準(zhǔn)名稱不一定是最完整的名稱。
非標(biāo)準(zhǔn)名稱:與業(yè)務(wù)確定的標(biāo)準(zhǔn)名稱不同的名稱稱為非標(biāo)準(zhǔn)名稱。通常來自業(yè)務(wù)各個流程。
非標(biāo)準(zhǔn)名稱對照表:指非標(biāo)準(zhǔn)名稱與標(biāo)準(zhǔn)名稱之間建立的對照關(guān)系表格。
非關(guān)鍵字詞表:根據(jù)業(yè)務(wù)特征,為每類名稱定義其非關(guān)鍵的詞語(如:公司、有限、責(zé)任、股份等),并形成表格。
各個單位的財務(wù)系統(tǒng)電子化已相對普及,在實際工作中,特別涉及資金往來,比如保證金退款等業(yè)務(wù)中,因工作環(huán)節(jié)與流程的特性,財務(wù)系統(tǒng)往往從不同的業(yè)務(wù)流程中獲得信息,并綜合處理。因涉及的環(huán)節(jié)多,各個環(huán)節(jié)產(chǎn)生信息時,經(jīng)常會碰到名稱不一致的問題。比如同一單位,理論上其單位名稱應(yīng)該是唯一的,但實際中常會碰到如下問題:
1)單位簡稱、或不完整稱謂。如工行、工商銀行、中國工商銀行、中國工商銀行股份公司、中國工商銀行股份有限公司、工行某某區(qū)支行,等等。
2)格式問題。如:簡體繁體、全角半角、大小寫、空格
上述列出的問題最為常見,但不僅限于此。這些問題導(dǎo)致單位的財務(wù)系統(tǒng)會把上述原本是同一家的單位,認(rèn)為是多家不同的單位,導(dǎo)致財務(wù)處理的混亂與錯誤。
在這種情況下,目前的做法是當(dāng)發(fā)現(xiàn)錯誤(如對不上帳)時,將出錯的信息提取出來人工判斷處理?;虿捎酶倪M(jìn)的方法,如增加格式預(yù)處理步驟,對問題2)所述情況采用程序或手工操作進(jìn)行格式轉(zhuǎn)換,對問題1)所述情況則是逐條檢測標(biāo)準(zhǔn)名稱表里的每一個標(biāo)準(zhǔn)名稱,看其是否包含該非標(biāo)準(zhǔn)名稱。如果包含,則將此對名稱加入非標(biāo)準(zhǔn)名稱對照表(通常是多對一的),之后再遇到此非標(biāo)準(zhǔn)名稱時,查找非標(biāo)準(zhǔn)名稱對照表,用對應(yīng)的標(biāo)準(zhǔn)名稱取代。
當(dāng)數(shù)據(jù)量大時,即使采用上述改進(jìn)的方法,出錯的數(shù)量也相當(dāng)大。此時人工處理建立非標(biāo)準(zhǔn)名稱對照表時,對于大多數(shù)的非知名企業(yè)而言,手工在標(biāo)準(zhǔn)名稱表中找出正確的對應(yīng)單位也是相當(dāng)費(fèi)力的。如前述問題1)中工商銀行的例子,如果工行是非知名企業(yè),在龐大的標(biāo)準(zhǔn)名稱表中人工找到與“工行”對應(yīng)的標(biāo)準(zhǔn)名稱不是一件容易的事情。并且此種搜索方法存在的另一個問題是,當(dāng)標(biāo)準(zhǔn)名稱是簡稱或比非標(biāo)準(zhǔn)名稱短時,即使此非標(biāo)準(zhǔn)名稱在標(biāo)準(zhǔn)名稱表中有對應(yīng)的標(biāo)準(zhǔn)名稱,此種搜索也找不到。
技術(shù)實現(xiàn)要素:
本發(fā)明提供一種名稱不一致,特別是財務(wù)系統(tǒng)中名稱不一致的綜合處理技術(shù)方案,目的在于最大程度的自動化處理名稱不一致,并在需要人工干預(yù)時,為人工判斷提供盡可能準(zhǔn)確的推薦,從而大量減少名稱不一致導(dǎo)致的錯誤,降低人工處理的工作量及出錯率。
本發(fā)明采用的技術(shù)方案具體內(nèi)容是:
與現(xiàn)有技術(shù)相比,增加“非關(guān)鍵字詞表”,即:根據(jù)業(yè)務(wù)特性,為每一種需要統(tǒng)一名稱的名稱項(字段),定義對應(yīng)的非關(guān)鍵字詞組。如單位名稱字段中,非關(guān)鍵字詞可以包含:公司、有限、責(zé)任、股份等等;對部門名稱字段,非關(guān)鍵字詞可以是:處、局、科、室等;對地名,非關(guān)鍵字詞可以是:省、市、區(qū)、縣、鄉(xiāng)、鎮(zhèn)、村等等。
處理非標(biāo)準(zhǔn)名稱時,如果非標(biāo)準(zhǔn)名稱對照表中也沒有其對應(yīng)的標(biāo)準(zhǔn)名稱時,按如下步驟處理:
1)將非標(biāo)準(zhǔn)名稱中對應(yīng)的所述非關(guān)鍵字詞表中所列字詞去除,根據(jù)所述被去除的非關(guān)鍵字詞在原所述非標(biāo)準(zhǔn)名稱中位置的不同,可能將原所述非標(biāo)準(zhǔn)名稱分解成s1到sn的若干子字符串,將所有s1到sn合并得到字符串s;
2)所述s作為整體字符串,在所述標(biāo)準(zhǔn)名稱表中查找,如果找到包含所述s的標(biāo)準(zhǔn)名稱,則將該所述非標(biāo)準(zhǔn)名稱與該所述標(biāo)準(zhǔn)名稱對加入所述非標(biāo)準(zhǔn)名稱對照表,如果沒有查到包含所述s的標(biāo)準(zhǔn)名稱,則:
3)在所述標(biāo)準(zhǔn)名稱表中逐一檢查對所述s1到sn的包含情況,并將包含結(jié)果按從多到少排序輸出;
4)在所述標(biāo)準(zhǔn)名稱表中檢查每個標(biāo)準(zhǔn)名稱包含所述s的每一個字的情況,并將包含結(jié)果按從多到少排序輸出。
上述步驟中“排序輸出”的結(jié)果供人工參考,排在最前面的標(biāo)準(zhǔn)名稱最可能是這個非標(biāo)準(zhǔn)名稱的對應(yīng)標(biāo)準(zhǔn)名稱。這樣的步驟可以凸顯最可能對應(yīng)的標(biāo)準(zhǔn)名稱,減少了人工在龐大標(biāo)準(zhǔn)名稱表中手工搜索的難度與工作量。
因標(biāo)準(zhǔn)名稱完全可能是簡稱,所以本發(fā)明所述方案采用先在非標(biāo)準(zhǔn)名稱中去除不必要的字詞,即事先依據(jù)業(yè)務(wù)特性定義的非關(guān)鍵字詞(如公司、有限、責(zé)任、股份等),再檢查包含,將現(xiàn)有技術(shù)中檢查不出來的標(biāo)準(zhǔn)名稱在第2)步能夠自動檢查出來,提高了效率。對于仍然沒有檢測出來的非標(biāo)準(zhǔn)名稱,再按第3)到第4)步處理,為人工確定提供最可能的推薦,人工效率會進(jìn)一步提高。
經(jīng)由上述的技術(shù)方案可知,與現(xiàn)有技術(shù)相比,本發(fā)明公開的名稱不一致問題的技術(shù)解決方案改進(jìn)了現(xiàn)有技術(shù)中的不足。
附圖說明
圖1是本發(fā)明公開的名稱不一致處理步驟流程圖。
具體實施方式
本發(fā)明具體實施例以單位名稱為例進(jìn)行說明,但不應(yīng)理解為限定在單位名稱上,本發(fā)明所述“名稱”還可以是(但不僅限于)人名、地名、部門名、項目名、開戶銀行名等等。
本發(fā)明所述“表”(如標(biāo)準(zhǔn)名稱表、非標(biāo)準(zhǔn)名稱對照表等),可以是excel中的“工作簿”、數(shù)據(jù)庫中的“表”,或其它能實現(xiàn)相同功能的模塊。
具體實施例如下(參照圖1):
在類似財務(wù)系統(tǒng)的自動化系統(tǒng)中,從不同工作環(huán)節(jié)與流程匯集的數(shù)據(jù)遇到名稱不一致非常普遍,下面以單位名稱為例,參照圖1詳細(xì)說明本發(fā)明的具體內(nèi)容。
以工商銀行為例,系統(tǒng)匯集來的名稱可能包括:工行、工商銀行、中國工商銀行、中國工商銀行股份公司、中國工商銀行股份有限公司、工行某某區(qū)某某分理處,等等。在確定標(biāo)準(zhǔn)名稱時,不一定以“中國工商銀行股份有限公司”為標(biāo)準(zhǔn),根據(jù)業(yè)務(wù)的需要,可能需要指定“工商銀行某某分行”為其標(biāo)準(zhǔn)名稱,并記錄在標(biāo)準(zhǔn)名稱對照表中,而其他名稱都被認(rèn)為是非標(biāo)準(zhǔn)名稱。
為處理非標(biāo)準(zhǔn)名稱,財務(wù)系統(tǒng)會建立非標(biāo)準(zhǔn)名稱對照表,系統(tǒng)遇到非標(biāo)準(zhǔn)名稱時查表找到其對應(yīng)的標(biāo)準(zhǔn)名稱,并繼續(xù)處理。當(dāng)某個非標(biāo)準(zhǔn)名稱不在非標(biāo)準(zhǔn)名稱對照表內(nèi)時,需要將此新的非標(biāo)準(zhǔn)名稱找到其對應(yīng)的標(biāo)準(zhǔn)名稱并加入非標(biāo)準(zhǔn)名稱對照表內(nèi)。
現(xiàn)有技術(shù)是用此新非標(biāo)準(zhǔn)名稱(以“中國工商銀行股份有限公司某某分行”為例)搜索標(biāo)準(zhǔn)名稱表,但因為標(biāo)準(zhǔn)表內(nèi)是“工商銀行某某分行”,而以“中國工商銀行股份有限公司某某分行”搜索,是找不到的。此時即使人工操作,也很難在龐大的標(biāo)準(zhǔn)名稱表中找到“工商銀行某某分行”與之對應(yīng)。
本發(fā)明的方案是建立非關(guān)鍵字詞表,為這個名稱列(或域名)建立其對應(yīng)的非關(guān)鍵字詞,如:中國、股份、有限、責(zé)任、公司。
按照圖1中步驟101處理,將“中國工商銀行股份有限公司某某分行”中的所有非關(guān)鍵字詞去除,得到“工商銀行”(s1)和“某某分行”(s2),合并s1與s2,得到“工商銀行某某分行”(s)。這里選擇的例子為了說明s1到sn的分解及合成s,如果去除非關(guān)鍵字詞后只有一個字符串s1,則s1即為s。
步驟102,在標(biāo)準(zhǔn)名稱表內(nèi)查找“工商銀行某某分行”(s),找到,去往步驟105,之后結(jié)束。
在其他的例子中,如果步驟102中,沒有找到s,則去往步驟103;
步驟103,在標(biāo)準(zhǔn)名稱表中分別查找s1到sn,按包含多少排序輸出。比如為每個標(biāo)準(zhǔn)名稱增加計數(shù)模塊(如域、單元格等),檢測其是否包含s1到sn時,每包含一個,該標(biāo)準(zhǔn)名稱的計數(shù)模塊計數(shù)加1,按從多到少將計數(shù)排序,并輸出供人工參考。
步驟104,將s中的每一個字(或字母)在標(biāo)準(zhǔn)名稱表中查找,按包含從多到少排序輸出供人工參考,并結(jié)束處理步驟。本步驟在實現(xiàn)上可以把s的每一個字按字符查找,或?qū)的每一個字拆分成一個字符串,再按字符串查找。
步驟105,將此非標(biāo)準(zhǔn)名稱及與之對應(yīng)的標(biāo)準(zhǔn)名稱加入非標(biāo)準(zhǔn)名稱對照表。