欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種客戶地址信息的分詞處理方法和系統(tǒng)的制作方法

文檔序號(hào):9667300閱讀:546來源:國(guó)知局
一種客戶地址信息的分詞處理方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及信息處理技術(shù)領(lǐng)域,更具體地說,涉及一種客戶地址信息的分詞處理 方法和系統(tǒng)。
【背景技術(shù)】
[0002] 在銀行信息處理技術(shù)領(lǐng)域中,常常需要對(duì)人工錄入的信息,如輸入的客戶地址信 息、電話信息等進(jìn)行解析并存儲(chǔ)。
[0003] 在實(shí)際應(yīng)用過程中,銀行系統(tǒng)對(duì)這些人工錄入的客戶地址信息、電話信息等采用 中文分詞算法進(jìn)行分詞,進(jìn)而逐個(gè)保存分詞后的各個(gè)詞匯。
[0004] 然而由于銀行系統(tǒng)的非智能化,以及人工錄入的客戶地址信息、電話信息等并不 規(guī)范,尤其在當(dāng)錄入的信息存在歧義時(shí),銀行系統(tǒng)會(huì)將出現(xiàn)歧義的信息處理為錯(cuò)誤的分詞, 出錯(cuò)率較高。

【發(fā)明內(nèi)容】

[0005] 有鑒于此,本發(fā)明提供一種客戶地址信息的分詞處理方法和系統(tǒng),以實(shí)現(xiàn)將人工 錄入的客戶地址信息規(guī)范化,從而提高銀行系統(tǒng)對(duì)客戶地址信息的識(shí)別率,以提高銀行系 統(tǒng)的分詞準(zhǔn)確性。技術(shù)方案如下:
[0006] 基于本發(fā)明的一方面,本發(fā)明提供一種客戶地址信息的分詞處理方法,預(yù)先存儲(chǔ) 有用于定義所有行政區(qū)域的代碼的行政區(qū)域匹配清單,所述方法包括:
[0007] 確定當(dāng)前待處理的客戶地址信息;
[0008] 將所述當(dāng)前待處理的客戶地址信息進(jìn)行處理,以獲取到符合處理標(biāo)準(zhǔn)的客戶地址 信息;
[0009] 按照最長(zhǎng)匹配原則,將所述符合處理標(biāo)準(zhǔn)的客戶地址信息中的各個(gè)子地址信息分 別與所述行政區(qū)域匹配清單進(jìn)行匹配;
[0010] 當(dāng)所述符合處理標(biāo)準(zhǔn)的客戶地址信息中的第一子地址信息與所述行政區(qū)域匹配 清單中的第一行政區(qū)域匹配,且匹配結(jié)果唯一時(shí),確定所述第一子地址信息的第一代碼;其 中所述第一代碼與所述第一行政區(qū)域?qū)?yīng);
[0011] 獲取所述符合處理標(biāo)準(zhǔn)的客戶地址信息中所有子地址信息的代碼,生成規(guī)范化的 客戶地址信息。
[0012] 優(yōu)選地,所述將所述當(dāng)前待處理的客戶地址信息進(jìn)行處理,以獲取到符合處理標(biāo) 準(zhǔn)的客戶地址信息包括:
[0013] 將所述當(dāng)前待處理的客戶地址信息中的全角字符轉(zhuǎn)換為半角字符;
[0014] 將所述當(dāng)前待處理的客戶地址信息中的分隔符去掉。
[0015] 優(yōu)選地,所述規(guī)范化的客戶地址信息包括符合預(yù)設(shè)規(guī)則的客戶地址信息;
[0016] 所述預(yù)設(shè)規(guī)則包括國(guó)家、省、市、區(qū)縣。
[0017] 優(yōu)選地,還包括:
[0018]當(dāng)所述符合處理標(biāo)準(zhǔn)的客戶地址信息中的第二子地址信息與所述行政區(qū)域匹配 清單中的至少兩個(gè)行政區(qū)域匹配,匹配結(jié)果不唯一時(shí),確定所述第二子地址信息的國(guó)家代 碼。
[0019] 優(yōu)選地,還包括:
[0020] 當(dāng)所述符合處理標(biāo)準(zhǔn)的客戶地址信息中的第三子地址信息與所述行政區(qū)域匹配 清單中的任意一個(gè)行政區(qū)域均不匹配時(shí),不處理所述第三子地址信息。
[0021] 優(yōu)選地,還包括:
[0022] 將所述第三子地址信息中之前包括的分隔符還原。
[0023] 優(yōu)選地,還包括:
[0024]當(dāng)所述符合處理標(biāo)準(zhǔn)的客戶地址信息中的第四子地址信息滿足不處理規(guī)則時(shí),不 處理所述第四子地址信息。
[0025] 優(yōu)選地,所述不處理規(guī)則包括:
[0026] 地址信息以大學(xué)、小區(qū)、展覽館、苑、園、花園、大道、弄、里、堡、巷、道、中心、廣場(chǎng)、 街道、街、路、大廈、樓、博物館、局、分局、鐵路局、中學(xué)、小學(xué)、分行、政府、公安局、廠、公司開 頭;
[0027] 或,地址信息以中國(guó)開頭,且后續(xù)字符串不滿足省市縣規(guī)則。
[0028] 基于本發(fā)明的另一方面,本發(fā)明還提供一種客戶地址信息的分詞處理系統(tǒng),預(yù)先 存儲(chǔ)有用于定義所有行政區(qū)域的代碼的行政區(qū)域匹配清單,所述系統(tǒng)包括:
[0029] 確定模塊,用于確定當(dāng)前待處理的客戶地址信息;
[0030] 信息處理模塊,用于將所述當(dāng)前待處理的客戶地址信息進(jìn)行處理,以獲取到符合 處理標(biāo)準(zhǔn)的客戶地址信息;
[0031] 匹配模塊,用于按照最長(zhǎng)匹配原則,將所述符合處理標(biāo)準(zhǔn)的客戶地址信息中的各 個(gè)子地址信息分別與所述行政區(qū)域匹配清單進(jìn)行匹配;
[0032] 第一確定模塊,用于當(dāng)所述符合處理標(biāo)準(zhǔn)的客戶地址信息中的第一子地址信息與 所述行政區(qū)域匹配清單中的第一行政區(qū)域匹配,且匹配結(jié)果唯一時(shí),確定所述第一子地址 信息的第一代碼;其中所述第一代碼與所述第一行政區(qū)域?qū)?yīng);
[0033] 獲取模塊,用于獲取所述符合處理標(biāo)準(zhǔn)的客戶地址信息中所有子地址信息的代 碼;
[0034]生成模塊,用于生成規(guī)范化的客戶地址信息。
[0035] 優(yōu)選地,所述信息處理模塊包括:
[0036] 第一處理子模塊,用于將所述當(dāng)前待處理的客戶地址信息中的全角字符轉(zhuǎn)換為半 角字符;
[0037] 第二處理子模塊,用于將所述當(dāng)前待處理的客戶地址信息中的分隔符去掉。
[0038] 優(yōu)選地,所述規(guī)范化的客戶地址信息包括符合預(yù)設(shè)規(guī)則的客戶地址信息;
[0039] 所述預(yù)設(shè)規(guī)則包括國(guó)家、省、市、區(qū)縣。
[0040] 優(yōu)選地,還包括:
[0041]第二確定模塊,用于當(dāng)所述符合處理標(biāo)準(zhǔn)的客戶地址信息中的第二子地址信息與 所述行政區(qū)域匹配清單中的至少兩個(gè)行政區(qū)域匹配,匹配結(jié)果不唯一時(shí),確定所述第二子 地址信息的國(guó)家代碼。
[0042] 優(yōu)選地,還包括:
[0043] 第三確定模塊,用于當(dāng)所述符合處理標(biāo)準(zhǔn)的客戶地址信息中的第三子地址信息與 所述行政區(qū)域匹配清單中的任意一個(gè)行政區(qū)域均不匹配時(shí),確定不處理所述第三子地址信 息。
[0044] 優(yōu)選地,還包括:
[0045] 還原模塊,用于將所述第三子地址信息中之前包括的分隔符還原。
[0046] 優(yōu)選地,還包括:
[0047] 第四確定模塊,用于當(dāng)所述符合處理標(biāo)準(zhǔn)的客戶地址信息中的第四子地址信息滿 足不處理規(guī)則時(shí),確定不處理所述第四子地址信息。
[0048] 優(yōu)選地,所述不處理規(guī)則包括:
[0049] 地址信息以大學(xué)、小區(qū)、展覽館、苑、園、花園、大道、弄、里、堡、巷、道、中心、廣場(chǎng)、 街道、街、路、大廈、樓、博物館、局、分局、鐵路局、中學(xué)、小學(xué)、分行、政府、公安局、廠、公司開 頭;
[0050] 或,地址信息以中國(guó)開頭,且后續(xù)字符串不滿足省市縣規(guī)則。
[0051] 應(yīng)用本發(fā)明的上述技術(shù)方案,本發(fā)明提供的客戶地址信息的分詞處理方法中預(yù)先 存儲(chǔ)有用于定義所有行政區(qū)域的代碼的行政區(qū)域匹配清單。方法具體包括:確定當(dāng)前待處 理的客戶地址信息;將所述當(dāng)前待處理的客戶地址信息進(jìn)行處理,以獲取到符合處理標(biāo)準(zhǔn) 的客戶地址信息;按照最長(zhǎng)匹配原則,將所述符合處理標(biāo)準(zhǔn)的客戶地址信息中的各個(gè)子地 址信息分別與所述行政區(qū)域匹配清單進(jìn)行匹配;當(dāng)所述符合處理標(biāo)準(zhǔn)的客戶地址信息中的 第一子地址信息與所述行政區(qū)域匹配清單中的第一行政區(qū)域匹配,且匹配結(jié)果唯一時(shí),確 定所述第一子地址信息的第一代碼;其中所述第一代碼與所述第一行政區(qū)域?qū)?yīng);獲取所 述符合處理標(biāo)準(zhǔn)的客戶地址信息中所有子地址信息的代碼,生成規(guī)范化的客戶地址信息。 因此本發(fā)明能夠依據(jù)預(yù)先存儲(chǔ)的行政區(qū)域匹配清單對(duì)客戶地址信息中的各個(gè)子地址信息 分別進(jìn)行匹配、處理,從而準(zhǔn)確地獲知客戶地址信息中的各個(gè)子地址信息的代碼,并生成規(guī) 范化的客戶地址信息。因此本發(fā)明實(shí)現(xiàn)了將人工錄入的客戶地址信息規(guī)范化,從而提高了 銀行系統(tǒng)對(duì)客戶地址信息的識(shí)別率,即提高了銀行系統(tǒng)的分詞準(zhǔn)確性。
【附圖說明】
[0
當(dāng)前第1頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
南漳县| 奉节县| 南开区| 红桥区| 道孚县| 垣曲县| 大田县| 贡觉县| 宜丰县| 义马市| 岑巩县| 汝阳县| 宝丰县| 大渡口区| 山丹县| 剑川县| 晋州市| 长宁县| 凌云县| 新宁县| 鲁甸县| 松滋市| 天镇县| 正阳县| 石屏县| 宿迁市| 襄垣县| 蓬莱市| 车险| 绩溪县| 郑州市| 京山县| 阳江市| 凤台县| 张家界市| 平顺县| 彰武县| 金乡县| 许昌市| 祁阳县| 建德市|