專利名稱:報文識別系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及報文處理技術領域,具體涉及拼音戶名的報文識別系統(tǒng)。
背景技術:
隨著信息技術的飛躍發(fā)展,國際間業(yè)務往來日趨頻繁,然而,由于各個國家使用的語言不同,在某些領域對信息互通會造成一定的障礙。例如,在銀行業(yè)務領域,對業(yè)務雙方的信息識別需要絕對精準,否則對于像匯款這樣的業(yè)務而言,如果不能準確識別賬戶的用戶名,則無法辦理業(yè)務,而將英文表示的用戶名自動識別為中文用戶名,一直都是ー個技術難題。目前中國境內的用戶外幣跨境收付款一般通過SWIFT網絡進行。SWIFT(S0CIETY FOR WORLDWIDE INTERBANK FINANCIAL TELECOMMUNICATION 的縮寫),是“環(huán)球同業(yè)銀行金融電訊協(xié)會”。它是ー個組織,專門提供國際銀行間因業(yè)務來往而收發(fā)的報文傳輸服務。境內銀行要和境外行業(yè)務來往,就必須申請加入這個組織,通過SWIFT組織提供的網絡傳輸業(yè)務數(shù)據,這些業(yè)務數(shù)據通過報文形式組織。這個報文統(tǒng)稱為SWIFT報文。SWIFT報文有一定的結構和種類,并且每個種類的報文代表的意義不一祥。所有的SWIFT報文都必須遵循SffIFT組織規(guī)定的標準。SWIFT組織為了讓全世界所有金融機構都參與進來,對于SWIFT報文規(guī)定了只能使用英文字符,不能采用其他字符,比如中文漢字字符。所以境內銀行與境外銀行之間業(yè)務往來只能采用四角碼或者拼音,不能使用中文漢字。基于前面的SWIFT組織標準,境內銀行受理境外銀行進來的用戶資金業(yè)務報文中無法體現(xiàn)境內用戶的真實戶名,所以境外銀行在生成用戶資金業(yè)務報文時,只能通過在報文中體現(xiàn)用戶真實戶名轉換后的四角碼或者用戶真實戶名對應的拼音戶名。按照境內銀行的業(yè)務處理流程,對用戶資金進行自動處理的前提條件是業(yè)務報文中的用戶戶名需與境內銀行的本地存儲的用戶中文戶名或者英文戶名完全匹配,但是由于境內銀行本地存儲的用戶戶名是漢字,但是業(yè)務報文中的用戶戶名是英文字符,兩者無法匹配,所以無法進行自動處理。同時由于境內銀行系統(tǒng)中存儲的用戶英文戶名一般都不全,所以也無法通過匹配英文戶名來完成自動處理。例如匯款信息借助MT103報文來傳遞,收款人信息一般放在MT103報文的59域中,這個域中可以體現(xiàn)收款人的賬號和戶名。SffIFT網絡傳遞的報文信息內容需要符合SWIFT規(guī)范,SffIFT規(guī)范要求報文內字符需要是X字符集,這個X字符集包括大小寫字母、數(shù)字和幾個標點符號字符。按照這個規(guī)范MT103報文的收款人戶名無法用漢字來表示。按照收款銀行的匯款處理流程,對收款用戶進行自動入賬的前提條件是匯款報文中的收款戶名與收款銀行的本地存儲的收款人中文姓名或者英文戶名完全匹配,但是由于收款銀行本地存儲的收款人戶名是漢字,但是收款報文MT103中的收款人戶名是英文字符,兩者無法匹配,所以無法進行自動入賬。識別報文中的中文戶名還有一個技術問題是部分漢字存在多音字的情況,即ー個漢字可以對應多個拼音,如何將ー個漢字準確轉換為對應的拼音,也是現(xiàn)有技術中沒有解決的問題。也就是,使用現(xiàn)有技術的SWIFT網絡在實現(xiàn)具體業(yè)務中,由于不能準確識別其英文戶名所代表的真實用戶,導致相關業(yè)務的實現(xiàn)比較困難。由于現(xiàn)有技術存在以上缺陷,影響了報文的處理效率以及匯款資金到達的時效性,亟需ー種能克服現(xiàn)有技術中存在的報文識別系統(tǒng),以提高報文的處理效率。
發(fā)明內容
為了克服現(xiàn)有技術的上述缺陷,本發(fā)明提供了ー種報文識別系統(tǒng),該系統(tǒng)能夠自動識別報文中的拼音用戶名是否與本地存儲的中文用戶名一致。 本發(fā)明的報文識別系統(tǒng)包括數(shù)據存儲裝置,用于存儲四角碼信息、漢字拼音信息、漢字使用情況信息、用戶的本地用戶名和用戶編號信息,其中本地用戶名用漢字表示;自動接收報文裝置,用于與傳輸網絡進行連接,通過傳輸網絡接收報文,并交由拼音戶名識別裝置進行處理;拼音戶名識別裝置,用于從上述報文中提取用戶名信息以及用戶編號信息,如果用戶名信息是拼音,則拼音戶名識別裝置判斷從報文中提取的用戶編號是否為本地存儲裝置中存儲的本地用戶編號,如果是,則獲取與該本地用戶編號相對應的本地中文用戶名,并將其翻譯成漢字拼音,然后將該翻譯完成的漢字拼音與從報文中提取的拼音用戶名進行比較,判斷是否一致,如果一致,則將報文中的用戶識別為有效用戶。其中,數(shù)據存儲裝置包括漢字拼音存儲單元,其中存儲有漢字、拼音、音調、優(yōu)先級以及漢字與拼音之間的對照關系。其中,在拼音戶名識別裝置將本地中文用戶名翻譯成漢字拼音時,首先取本地中文用戶名中的第一個漢字,以該漢字為條件查詢漢字拼音存儲單元,按照優(yōu)先級高的順序獲取拼音字符,將該拼音字符與報文中拼音用戶名的前若干位字符進行比較,若比較結果一致,則獲取本地中文用戶名中的下ー個漢字進行翻譯和比較,直到比較完最后ー個漢字,若全部比較一致,則將報文中的用戶識別為有效用戶。其中,如果報文中的用戶被識別為有效用戶,則拼音戶名識別裝置對從漢字拼音存儲單元中獲取的拼音字符及其對應的漢字和聲調記錄到數(shù)據存儲裝置的漢字拼音使用情況存儲単元中,并將使用次數(shù)加一,拼音戶名識別裝置每隔預定時間,根據漢字拼音使用情況存儲単元中的漢字使用頻率對漢字拼音信息存儲單元中的優(yōu)先級進行調整。其中,調整所述優(yōu)先級具體為從漢字使用情況存儲単元中獲取記錄,然后根據記錄中的漢字、拼音、聲調查詢漢字拼音信息存儲單元,將找到記錄的優(yōu)先級加一,同時刪除漢字拼音使用情況存儲単元中的記錄。其中,拼音戶名識別裝置從上述報文中提取到用戶名信息之后,首先判斷用戶名信息中是否存在相連的四個數(shù)字組且數(shù)字組的前后都有空格,若存在,則從用戶名信息中逐個獲取需轉為漢字的四角碼數(shù)字組,并轉換為漢字,將四角碼數(shù)字組全部轉為漢字之后,將轉換后的漢語用戶名與存儲的本地用戶名比較,如果一致,則認為報文中的用戶名是有效的。其中,在報文中的用戶編號信息與本地存儲的用戶編號相一致的情況下,獲取與該本地用戶編號相對應的本地英文用戶名,如果報文中的用戶名不是四角碼,則將其與本地英文用戶名進行比較,如果一致,則認為報文中的用戶名是有效的。
其中,如果報文中的用戶名與本地英文用戶名進行比較,結果為不一致吋,則將報文中的用戶名判斷為拼音用戶名。本發(fā)明的報文識別系統(tǒng)能夠對報文中的拼音戶名進行識別,與本地存儲的中文用戶名進行自動匹配,從而實現(xiàn)了拼音戶名報文的自動識別,提高了報文處理效率。本發(fā)明能夠針對漢語拼音的使用頻率動態(tài)調整優(yōu)先級,使對拼音戶名的識別過程更加智能、提高了識別的效率和準確性。
圖I為本發(fā)明報文識別系統(tǒng)結構圖;圖2為本發(fā)明報文識別系統(tǒng)中數(shù)據存儲裝置結構圖;圖3為本發(fā)明報文識別系統(tǒng)中數(shù)據維護裝置結構圖;圖4為本發(fā)明報文識別系統(tǒng)中拼音戶名識別裝置的工作原理圖。
具體實施例方式為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚明白,以下結合具體實施例,并參照附圖,對本發(fā)明進ー步詳細說明。本發(fā)明的報文識別系統(tǒng)的工作原理是先將本地保存的中文戶名漢字轉換為其對 應的拼音,然后通過轉換后拼音與業(yè)務報文中的用戶戶名進行自動匹配,以達到拼音自動識別功能。同時,本發(fā)明通過記憶多音字的各個拼音的使用頻率,來提升常用漢字對應拼音的優(yōu)先級,以提高裝置自動識別的準確率。圖I為本發(fā)明報文識別系統(tǒng)的結構框圖。如圖I所示,該報文識別系統(tǒng)10包括數(shù)據存儲裝置11、數(shù)據維護裝置12、拼音戶名識別裝置13、自動接收報文裝置14。其中數(shù)據存儲裝置11負責四角碼信息、對公賬戶信息、個人賬戶信息、信用卡信息、用戶信息、漢字拼音信息、漢字使用情況信息等參數(shù)表信息的存儲;數(shù)據維護裝置12負責四角碼信息、對公賬戶信息、個人賬戶信息、信用卡信息、用戶信息、漢字拼音信息、漢字使用情況信息等參數(shù)表信息的維護處理;拼音戶名識別裝置13負責從自動接收報文裝置14接收信息進行識別和核對處理;自動接收報文裝置14負責與金融傳輸網絡15連接,接收金融傳輸網絡匯入的匯款報文,交由拼音戶名識別裝置13進行加工處理。報文識別系統(tǒng)10前端可通過自動接收報文裝置14與金融網絡傳輸15聯(lián)通接收收款人信息,后端與銀行賬務處理系統(tǒng)16連接。對前端接收到的收款人信息通過一定的算法將收款人戶名進行識別和核對,并通過后端發(fā)送到銀行賬務處理系統(tǒng)16完成入賬處理。圖2為本發(fā)明報文識別系統(tǒng)中數(shù)據存儲裝置的結構框圖。如圖2所示,數(shù)據存儲裝置11包含數(shù)據存儲主處理單元110、四角碼信息存儲單元111、對公賬戶信息存儲單元112、個人賬戶信息存儲單元113、信用卡信息存儲單元114、用戶信息存儲單元115、漢字拼音信息存儲單元116、漢字使用情況存儲単元117。其中數(shù)據存儲主處理110與其他各存儲單元進行連接,負責接收指令將數(shù)據存儲到其他各単元中。四角碼信息存儲單元111存儲每個漢字與四角碼之間的對應關系,其中包含漢字、四角碼等信息(詳見表一),并提供維護工具,即數(shù)據處理單元中的四角碼信息手工維護處理裝置121。
表一四角碼信息存儲單元
權利要求
1.一種報文識別系統(tǒng),該系統(tǒng)包括 數(shù)據存儲裝置,用于存儲四角碼信息、漢字拼音信息、漢字使用情況信息、用戶的本地用戶名和用戶編號信息,其中本地用戶名用漢字表示; 自動接收報文裝置,用于與傳輸網絡進行連接,通過傳輸網絡接收報文,并交由拼音戶名識別裝置進行處理; 拼音戶名識別裝置,用于從上述報文中提取用戶名信息以及用戶編號信息,如果用戶名信息是拼音,則拼音戶名識別裝置判斷從報文中提取的用戶編號是否為本地存儲裝置中存儲的本地用戶編號,如果是,則獲取與該本地用戶編號相對應的本地中文用戶名,并將其翻譯成漢字拼音,然后將該翻譯完成的漢字拼音與從報文中提取的拼音用戶名進行比較,判斷是否一致,如果一致,則將報文中的用戶識別為有效用戶。
2.如權利要求I所述的報文識別系統(tǒng),其特征在于,數(shù)據存儲裝置包括漢字拼音存儲單元,其中存儲有漢字、拼音、音調、優(yōu)先級以及漢字與拼音之間的對照關系。
3.如權利要求2所述的報文識別系統(tǒng),其特征在于,在拼音戶名識別裝置將本地中文用戶名翻譯成漢字拼音時,首先取本地中文用戶名中的第一個漢字,以該漢字為條件查詢漢字拼音存儲單元,按照優(yōu)先級高的順序獲取拼音字符,將該拼音字符與報文中拼音用戶名的前若干位字符進行比較,若比較結果一致,則獲取本地中文用戶名中的下一個漢字進行翻譯和比較,直到比較完最后一個漢字,若全部比較一致,則將報文中的用戶識別為有效用戶。
4.如權利要求3所述的報文識別系統(tǒng),其特征在于,如果報文中的用戶被識別為有效用戶,則拼音戶名識別裝置對從漢字拼音存儲單元中獲取的拼音字符及其對應的漢字和聲調記錄到數(shù)據存儲裝置的漢字拼音使用情況存儲單元中,并將使用次數(shù)加一,拼音戶名識別裝置每隔預定時間,根據漢字拼音使用情況存儲單元中的漢字使用頻率對漢字拼音信息存儲單元中的優(yōu)先級進行調整。
5.如權利要求4所述的報文識別系統(tǒng),其特征在于,調整所述優(yōu)先級具體為從漢字使用情況存儲單元中獲取記錄,然后根據記錄中的漢字、拼音、聲調查詢漢字拼音信息存儲單元,將找到記錄的優(yōu)先級加一,同時刪除漢字拼音使用情況存儲單元中的記錄。
6.如權利要求5所述的報文識別系統(tǒng),其特征在于,拼音戶名識別裝置從上述報文中提取到用戶名信息之后,首先判斷用戶名信息中是否存在相連的四個數(shù)字組且數(shù)字組的前后都有空格,若存在,則從用戶名信息中逐個獲取需轉為漢字的四角碼數(shù)字組,并轉換為漢字,將四角碼數(shù)字組全部轉為漢字之后,將轉換后的漢語用戶名與存儲的本地用戶名比較,如果一致,則認為報文中的用戶名是有效的。
7.如權利要求6所述的報文識別系統(tǒng),其特征在于,在報文中的用戶編號信息與本地存儲的用戶編號相一致的情況下,獲取與該本地用戶編號相對應的本地英文用戶名,如果報文中的用戶名不是四角碼,則將其與本地英文用戶名進行比較,如果一致,則認為報文中的用戶名是有效的。
8.如權利要求7所述的報文識別系統(tǒng),其特征在于,如果報文中的用戶名與本地英文用戶名進行比較,結果為不一致時,將報文中的用戶名判斷為拼音用戶名。
全文摘要
本發(fā)明公開了一種報文識別系統(tǒng),包括數(shù)據存儲裝置,用于存儲四角碼信息、漢字拼音信息等;自動接收報文裝置,用于與傳輸網絡進行連接,通過傳輸網絡接收報文,并交由拼音戶名識別裝置進行處理;拼音戶名識別裝置,用于從上述報文中提取用戶名信息以及用戶編號信息,如果用戶名信息是拼音,則拼音戶名識別裝置判斷從報文中提取的用戶編號是否為本地存儲裝置中存儲的本地用戶編號,如果是,則獲取與該本地用戶編號相對應的本地中文用戶名,并將其翻譯成漢字拼音,然后將該翻譯完成的漢字拼音與從報文中提取的拼音用戶名進行比較,判斷是否一致,如果一致,則將報文中的用戶識別為有效用戶。通過該系統(tǒng)可提高用戶識別效率。
文檔編號G06F17/30GK102663072SQ20121009371
公開日2012年9月12日 申請日期2012年3月31日 優(yōu)先權日2012年3月31日
發(fā)明者劉圣杰, 張錦元, 梁文健, 王雨超, 陳求相, 韋東俊 申請人:中國工商銀行股份有限公司