商戶地址信息識別方法和裝置制造方法
【專利摘要】一種商戶地址信息識別方法和裝置,其中,方法包括:獲取商戶的商戶信息,當(dāng)所獲取的商戶信息中包含商戶地址時,對商戶地址進(jìn)行切詞,得到商戶地址的地址詞集;將商戶地址的地址詞集與預(yù)設(shè)的標(biāo)準(zhǔn)地址信息表中的地址信息進(jìn)行匹配,并根據(jù)地址詞集中詞匯的完整程度,計算地址詞集對應(yīng)的權(quán)重值,標(biāo)準(zhǔn)地址信息表中的地址信息包含完整的行政級別信息以及對應(yīng)的地名;當(dāng)?shù)刂吩~集在標(biāo)準(zhǔn)地址信息表中存在至少兩條地址信息時,選擇商戶地址信息為標(biāo)準(zhǔn)地址信息表中對應(yīng)的權(quán)重值最高的地址信息。通過所述方法和裝置,可以快速準(zhǔn)確實現(xiàn)對商戶地址信息的識別。
【專利說明】商戶地址信息識別方法和裝置
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及信息識別【技術(shù)領(lǐng)域】,尤其涉及一種商戶地址信息識別方法和裝置。
【背景技術(shù)】
[0002] 由于具有交易安全以及方便快捷等優(yōu)點(diǎn),刷卡消費(fèi)已經(jīng)成為越來越多人的消費(fèi)習(xí) 慣。著眼于消費(fèi)者的這種消費(fèi)心理,越來越多的商戶加入到了支持刷卡消費(fèi)的行列中,從而 拓寬了刷卡支付的領(lǐng)域,也進(jìn)一步促進(jìn)了刷卡消費(fèi)。
[0003] 為了實現(xiàn)支持消費(fèi)者的刷卡消費(fèi),商戶需要向相關(guān)機(jī)構(gòu)如銀行等提出申請,并向 相關(guān)機(jī)構(gòu)如銀行等提供相應(yīng)的注冊信息,例如商戶所在地的歸屬地等信息。但是在實際應(yīng) 用過程中,會存在商戶注冊虛假歸屬地或錯誤歸屬地的情況。因此需要對這些錯誤信息進(jìn) 行及時甄別,以有效管理商戶信息。
[0004] 然而目前在收錄商戶信息后,需要通過人工重復(fù)審批的方式進(jìn)行處理。但是,采用 人工審批方式,即使耗費(fèi)巨大的人力和物力,也難以對所有商戶進(jìn)行有效識別,因此僅能做 抽樣檢查核對,難以及時發(fā)現(xiàn)商戶歸屬地信息中的錯誤。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明實施例解決的問題是如何快速準(zhǔn)確實現(xiàn)對商戶地址信息的識別。
[0006] 為解決上述問題,本發(fā)明實施例提供一種商戶地址信息識別方法,包括:獲取商戶 的商戶信息,當(dāng)所獲取的商戶信息中包含商戶地址時,對所述商戶地址進(jìn)行切詞,得到所述 商戶地址的地址詞集;將所述商戶地址的地址詞集與預(yù)設(shè)的標(biāo)準(zhǔn)地址信息表中的地址信息 進(jìn)行匹配,并根據(jù)所述地址詞集中詞匯的完整程度,計算所述地址詞集對應(yīng)的權(quán)重值,所述 標(biāo)準(zhǔn)地址信息表中的地址信息包含完整的行政級別信息以及對應(yīng)的地名;當(dāng)所述地址詞集 在所述標(biāo)準(zhǔn)地址信息表中存在至少兩條地址信息時,選擇所述商戶地址信息為所述標(biāo)準(zhǔn)地 址信息表中對應(yīng)的權(quán)重值最高的地址信息。
[0007] 可選的,所述計算所述地址詞集的權(quán)重值包括:當(dāng)所述地址詞集中的詞匯包含地 名及對應(yīng)的行政級別信息且與所述標(biāo)準(zhǔn)地址表完全匹配時,將所述地址詞集中的詞匯的權(quán) 重值設(shè)為完整權(quán)重值;當(dāng)所述地址詞集中的詞匯不包含行政級別信息時,所述地址詞集中 的詞匯權(quán)重值與所述地址詞集在所述標(biāo)準(zhǔn)地址信息表中地址信息的行政級別相關(guān),且低于 所述完整權(quán)重值。
[0008] 可選的,當(dāng)所述地址詞集中的詞匯不包含行政級別信息時,所述地址詞集的權(quán)重 值隨著地址詞集在所述標(biāo)準(zhǔn)地址信息表中所處的行政級別的降低而遞減。
[0009] 可選的,當(dāng)所述地址詞集在所述標(biāo)準(zhǔn)地址信息表中存在至少兩條地址信息時,通 過計算在所述標(biāo)準(zhǔn)信息表中具有相同名稱的地址的權(quán)重值;其中,所述Si為所述地 址詞集中第i個詞匯的權(quán)重值;所述Sum為所述標(biāo)準(zhǔn)地址信息表中與所述第i個詞匯具有 相同名稱的地址的權(quán)重值之和。
[0010] 可選的,所述商戶地址信息識別方法還包括:當(dāng)所述地址詞集中包含所述標(biāo)準(zhǔn)地 址信息表中未包含的地址信息時,將所述地址信息加入所述標(biāo)準(zhǔn)地址信息表中。
[0011] 可選的,所述商戶地址信息識別方法還包括:根據(jù)交易卡的交易記錄信息,對商戶 進(jìn)行分類,形成商戶商圈;當(dāng)獲取到的商戶的商戶信息中未包含商戶地址時,根據(jù)所述商戶 所處的商戶商圈,設(shè)置所述商戶的商戶地址為所述商戶商圈中占多數(shù)的商戶地址。
[0012] 可選的,所述根據(jù)交易卡的交易記錄信息,對商戶進(jìn)行分類,形成商戶商圈,包括: 獲取在預(yù)設(shè)時間內(nèi)在任意兩家商戶消費(fèi)過的交易卡的數(shù)量并統(tǒng)計所述交易卡的數(shù)量占所 有交易卡數(shù)量的百分比;當(dāng)所述百分比大于預(yù)設(shè)值時,將對應(yīng)的兩家商戶作為同一類,作為 一個商戶商圈。
[0013] 為了解決上述的技術(shù)問題,本發(fā)明實施例還公開了一種商戶地址信息識別裝置, 包括:切詞單元,用于獲取商戶的商戶信息,當(dāng)所獲取的商戶信息中包含商戶地址時,對所 述商戶地址進(jìn)行切詞,得到所述商戶地址的地址詞集;計算單元,用于將所述商戶地址的地 址詞集與預(yù)設(shè)的標(biāo)準(zhǔn)地址信息表中的地址信息進(jìn)行匹配,并根據(jù)所述地址詞集中詞匯的完 整程度,計算所述地址詞集對應(yīng)的權(quán)重值,所述標(biāo)準(zhǔn)地址信息表中的地址信息包含完整的 行政級別信息以及對應(yīng)的地名;選擇單元,用于當(dāng)所述地址詞集在所述標(biāo)準(zhǔn)地址信息表中 存在至少兩條地址信息時,選擇所述商戶地址信息為所述標(biāo)準(zhǔn)地址信息表中對應(yīng)的權(quán)重值 最商的地址?目息。
[0014] 可選的,所述計算單元用于當(dāng)所述地址詞集中的詞匯包含地名及對應(yīng)的行政級別 信息且與所述標(biāo)準(zhǔn)地址表完全匹配時,將所述地址詞集中的詞匯的權(quán)重值設(shè)為完整權(quán)重 值;且用于當(dāng)所述地址詞集中的詞匯不包含行政級別信息時,將所述地址詞集中的詞匯權(quán) 重值與所述地址詞集在所述標(biāo)準(zhǔn)地址信息表中地址信息的行政級別相關(guān),且低于所述完整 權(quán)重值。
[0015] 可選的,所述計算單元,用于當(dāng)所述地址詞集中的詞匯不包含行政級別信息時,將 所述地址詞集的權(quán)重值設(shè)置為隨著地址詞集在所述標(biāo)準(zhǔn)地址信息表中所處的行政級別的 降低而遞減。
[0016] 可選的,所述選擇單元用于通過計算在所述標(biāo)準(zhǔn)信息表中具有相同名稱的 Sum 地址的權(quán)重值;其中,所述Si為所述地址詞集中第i個詞匯的權(quán)重值;所述Sum為所述標(biāo)準(zhǔn) 地址信息表中與所述第i個詞匯具有相同名稱的地址的權(quán)重值之和。
[0017] 可選的,所述商戶地址信息識別裝置,還包括:分類單元,用于根據(jù)交易卡的交易 記錄信息,對商戶進(jìn)行分類,形成商戶商圈;設(shè)置單元,用于當(dāng)獲取到的商戶的商戶信息中 未包含商戶地址時,根據(jù)所述商戶所處的商戶商圈,設(shè)置所述商戶的商戶地址為所述商戶 商圈中占多數(shù)的商戶地址。
[0018] 可選的,所述分類單元包括:獲取子單元,用于獲取在預(yù)設(shè)時間內(nèi)在任意兩家商戶 消費(fèi)過的交易卡的數(shù)量;統(tǒng)計子單元,用于統(tǒng)計所述交易卡的數(shù)量占所有交易卡數(shù)量的百 分比;歸類單元,用于當(dāng)所述百分比大于預(yù)設(shè)值時,將對應(yīng)的兩家商戶作為同一類,作為一 個商戶商圈。
[0019] 與現(xiàn)有技術(shù)相比,本發(fā)明實施例的技術(shù)方案具有以下優(yōu)點(diǎn):
[0020] 通過語義識別對商戶信息進(jìn)行切詞操作,得到相應(yīng)的地址詞集。當(dāng)對比標(biāo)準(zhǔn)地址 信息表后檢測得到多條地址沖突時,通過計算所述地址詞集對應(yīng)所述標(biāo)準(zhǔn)地址信息表的權(quán) 重值,并將所述權(quán)重值最大的地址作為商戶地址,實現(xiàn)了商戶地址信息識別的自動化和智 能化,通過實現(xiàn)自動化和智能化識別,從而可以提高檢測效率,因而可以實現(xiàn)更大的覆蓋范 圍,且可以避免人為錯誤,因而具有更高的準(zhǔn)確率。
【專利附圖】
【附圖說明】
[0021] 圖1是本發(fā)明實施例的一種商戶地址信息識別方法的流程圖;
[0022] 圖2是本發(fā)明實施例的另一種商戶地址信息識別方法的流程圖;
[0023] 圖3是本發(fā)明實施例的對商戶進(jìn)行分類的方法的流程圖;
[0024] 圖4是本發(fā)明實施例一種商戶地址信息識別裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0025] 為了實現(xiàn)支持消費(fèi)者的刷卡消費(fèi),商戶需要向相關(guān)機(jī)構(gòu)如銀行等提出申請,并提 供相應(yīng)的注冊信息,例如商戶所在地的歸屬地等信息。但是在實際應(yīng)用過程中,會存在商戶 注冊虛假歸屬地或錯誤歸屬地的情況。因此需要對這些錯誤信息進(jìn)行及時甄別,以有效管 理商戶信息。
[0026] 然而目前在收錄商戶信息后,需要通過人工重復(fù)審批的方式進(jìn)行處理。但是,采用 人工審批方式,即使耗費(fèi)巨大的人力和物力,也難以對所有商戶進(jìn)行有效識別,因此僅能做 抽樣檢查核對,難以及時發(fā)現(xiàn)商戶歸屬地信息中的錯誤。
[0027] 本發(fā)明實施例通過語義識別對商戶信息進(jìn)行切詞操作,得到相應(yīng)的地址詞集。當(dāng) 對比標(biāo)準(zhǔn)地址信息表后檢測得到多條地址沖突時,通過計算所述地址詞集對應(yīng)所述標(biāo)準(zhǔn)地 址信息表的權(quán)重值,并將所述權(quán)重值最大的地址作為商戶地址,實現(xiàn)了商戶地址信息甄別 和更新的自動化和智能化,并且可以保證較高的準(zhǔn)確率和商戶全覆蓋,從而提高了檢測效 率。
[0028] 為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更為明顯易懂,下面結(jié)合附圖對本發(fā)明 的具體實施例做詳細(xì)的說明。
[0029] 本發(fā)明實施例提供了一種商戶地址信息識別方法,參照圖1,以下通過具體步驟進(jìn) 行詳細(xì)說明。
[0030] 步驟SlOl,獲取商戶的商戶信息,當(dāng)所獲取的商戶信息中包含商戶地址時,對所述 商戶地址進(jìn)行切詞,得到所述商戶地址的地址詞集。
[0031] 在具體實施中,可以是通過預(yù)設(shè)的語言字典,基于自然語義對所述商戶地址進(jìn)行 切詞操作,從而將商戶信息中的商戶地址分割成一個或多個地理詞匯,形成商戶地址的地 址詞集。
[0032] 步驟S102,將所述商戶地址的地址詞集與預(yù)設(shè)的標(biāo)準(zhǔn)地址信息表中的地址信息進(jìn) 行匹配,并根據(jù)所述地址詞集中詞匯的完整程度,計算所述地址詞集對應(yīng)的權(quán)重值。
[0033] 所述標(biāo)準(zhǔn)地址信息表可以包含完整的行政級別信息,并按照行政級別的順序?qū)?應(yīng)的地名進(jìn)行排序,具體向下可以精確到街道/鎮(zhèn)一級,例如,所述標(biāo)準(zhǔn)地址信息表中所包 含的一條地址詞條信息可以是:安徽省、安慶市、揪陽縣、陳瑤湖鎮(zhèn)??衫斫獾氖?,所述標(biāo)準(zhǔn) 地址信息表中的地址詞條信息也可以根據(jù)應(yīng)用的需要設(shè)置得更為具體,而不局限于街道/ 鎮(zhèn)一級。在具體實施中,所述標(biāo)準(zhǔn)地址信息表可以是基于互聯(lián)網(wǎng)的數(shù)據(jù)挖掘得到。
[0034] 在具體實施中,在具體對地址詞集進(jìn)行計算時,可以根據(jù)地址詞集中的詞匯的信 息完整度,計算商戶地址的地址詞集中詞匯的權(quán)重值,從而得到所述商戶地址的地址詞集 的權(quán)重值。
[0035] 在上述的具體實施中,當(dāng)所述地址詞集中的詞匯包含完整信息且與所述標(biāo)準(zhǔn)地址 表完全匹配時,將所述地址詞集中的詞匯的權(quán)重值設(shè)為完整權(quán)重值。
[0036] 例如,商戶給出的地址信息為"安徽省安慶市揪陽縣陳瑤湖鎮(zhèn)",經(jīng)過步驟SlOl的 切詞操作可以得到地址詞集〈安徽省、安慶市、揪陽縣、陳瑤湖鎮(zhèn)〉。在計算該地址信息的 權(quán)重值時,將上述地址詞集中的地址詞匯分別與所述標(biāo)準(zhǔn)地址信息表中的信息一一進(jìn)行匹 配。由于安徽省、安慶市、揪陽縣、陳瑤湖鎮(zhèn)均為完全信息,且能夠在所述標(biāo)準(zhǔn)地址信息表中 匹配到相應(yīng)的內(nèi)容,因此給予每個地址詞匯完整權(quán)重值,例如可以是1。由于安徽省、安慶 市、揪陽縣、陳瑤湖鎮(zhèn)在所述標(biāo)準(zhǔn)地址信息表中具有唯一可確定的上下級隸屬關(guān)系,因此在 計算該詞集總權(quán)重值時,將上級的權(quán)重值累加到下級的權(quán)重值中,從而得到所述地址詞集 的總權(quán)重值為4。
[0037] 在具體應(yīng)用中,還可以根據(jù)需要相應(yīng)設(shè)置所述完整權(quán)重值進(jìn)行相應(yīng)。例如,根據(jù)行 政級別的順序不同,設(shè)置不同的完整權(quán)重值。例如,將省級的完整權(quán)重值設(shè)為2、市級的完整 權(quán)重值設(shè)置為1。
[0038] 在上述的具體實施中,當(dāng)所述地址詞集中的詞匯不包含行政級別信息時,所述地 址詞集中的詞匯權(quán)重值與所述地址詞集在所述標(biāo)準(zhǔn)地址信息表中地址信息的行政級別相 關(guān)。
[0039] 由于行政級別越低,地名出現(xiàn)重復(fù)的可能性會相應(yīng)越高,例如,在不同省市中,可 能出現(xiàn)具有相同地名的鎮(zhèn),因此所述地址詞集的權(quán)重值可以隨著地址詞集在所述標(biāo)準(zhǔn)地址 信息表中所處的行政級別的降低而遞減,且低于所述完整權(quán)重值。
[0040] 例如,商戶給出的地址信息為"安徽安慶揪陽陳瑤湖",經(jīng)過步驟SlOl的切詞操作 可以得到地址詞集〈安徽、安慶、揪陽、陳瑤湖〉。此時,所述地址詞集中的詞匯僅包含地名 信息,不包含行政級別信息。當(dāng)計算所述地址詞集中詞匯的權(quán)重值時,經(jīng)過匹配發(fā)現(xiàn)所述 詞匯僅能實現(xiàn)部分匹配,因此將所述詞匯的權(quán)重值設(shè)為部分分支,并且根據(jù)所述詞匯的匹 配位置,設(shè)置不同的權(quán)重值,例如,安徽的權(quán)重值可以是0. 5,安慶的權(quán)重值可以是0. 4,揪 陽的權(quán)重值可以是〇. 3,陳瑤湖的權(quán)重值可以是0. 2,從而得到所述地址詞集的總權(quán)重值為 1. 4。
[0041] 在具體實施中,可能出現(xiàn)經(jīng)過匹配后,所述地址詞集中包含所述標(biāo)準(zhǔn)地址信息表 中未包含的地址信息的情況,例如,所述標(biāo)準(zhǔn)地址信息表中預(yù)設(shè)的最低行政級別是街道或 者鎮(zhèn)一級,而所述地址詞集中的地址信息是該最低行政級別的下一級地址信息,如某大道, 某路,即不包括在所述的標(biāo)準(zhǔn)地址信息表中。此時可以根據(jù)所述地址詞集中地址信息在所 述標(biāo)準(zhǔn)地址信息表中的匹配位置,將所述地址信息加入所述標(biāo)準(zhǔn)地址信息表中對應(yīng)的詞條 中,例如,商戶給出的商戶地址是"浦東新區(qū)陸家嘴街道",就可以將陸家嘴街道添加到浦東 新區(qū)后,實現(xiàn)所述標(biāo)準(zhǔn)地址信息表的自學(xué)習(xí)擴(kuò)充,得到新的標(biāo)準(zhǔn)地址信息表。
[0042] 步驟S103,當(dāng)所述地址詞集在所述標(biāo)準(zhǔn)地址信息表中存在至少兩條地址信息時, 選擇所述商戶地址信息為所述標(biāo)準(zhǔn)地址信息表中對應(yīng)的權(quán)重值最高的地址信息。
[0043] 在具體實施中,當(dāng)所述地址詞集在所述標(biāo)準(zhǔn)地址信息表中,僅存在一條匹配的地 址詞條時,因此此時詞集匹配到該詞條的分?jǐn)?shù)最高,選擇所述商戶地址信息為所述標(biāo)準(zhǔn)地 址信息表中對應(yīng)的權(quán)重值最高的地址信息。
[0044] 在具體實施中,當(dāng)所述地址詞集在所述標(biāo)準(zhǔn)地址信息表中存在至少兩條地址信息 時,可以通過計算在所述標(biāo)準(zhǔn)信息表中具有相同名稱的地址的權(quán)重值。 Swn
[0045] 其中,所述Si為所述地址詞集中第i個詞匯的權(quán)重值;所述Sum為所述標(biāo)準(zhǔn)地址 信息表中與所述第i個詞匯具有相同名稱的地址的權(quán)重值之和。
[0046] 例如,商戶提供的商戶地址信息為"揪陽縣陳瑤湖鎮(zhèn)",而在所述標(biāo)準(zhǔn)地址信息表 中揪陽縣和陳瑤湖鎮(zhèn)非隸屬關(guān)系,且陳瑤湖鎮(zhèn)在兩個不同的詞條中均出現(xiàn)過,因此判定所 述地址詞集在所述標(biāo)準(zhǔn)地址信息表中存在地址沖突。
[0047] 通過公式分別對"揪陽縣"和"陳瑤湖鎮(zhèn)"進(jìn)行計算,可得揪陽縣的權(quán)重值為 Swn 1x1 1χ? Y=I,而陳瑤湖鎮(zhèn)的權(quán)重值為·^ =0.5,由此可得,揪陽縣的權(quán)重值大于陳瑤湖鎮(zhèn)的權(quán) 1 1 + 1 重值,因此將地址詞集匹配到所述標(biāo)準(zhǔn)地址信息表中"揪陽縣"的地址詞條,將該地址詞條 作為商戶地址,從而實現(xiàn)了商戶地址信息的識別和更正。
[0048] 本發(fā)明實施例將商戶提供的商戶地址信息與預(yù)設(shè)的標(biāo)準(zhǔn)地址信息表進(jìn)行對比并 計算商戶地址信息的權(quán)重值,通過選擇具有最高權(quán)重值所對應(yīng)的標(biāo)準(zhǔn)地址信息表中的地 址,能夠在保證準(zhǔn)確率的基礎(chǔ)上,極大提升檢測效率,實現(xiàn)了對商戶地址信息的全覆蓋識別 和檢測。
[0049] 為了解決上述的技術(shù)問題,本發(fā)明實施例還公開了另一種商戶地址信息識別方 法。與圖1所示實施例的商戶地址信息識別方法相比,本發(fā)明實施例的商戶地址信息識別 方法可以實現(xiàn)當(dāng)商戶提供的商戶信息中未包含商戶地址時,對商戶地址的識別。具體來說, 如圖2所示,本發(fā)明實施例的商戶地址信息識別方法在圖1所示實施例的基礎(chǔ)上,還可以包 括:
[0050] 步驟S201,根據(jù)交易卡的交易記錄信息,對商戶進(jìn)行分類,形成商戶商圈。
[0051] 在具體實施中,參照圖3,所述步驟201可以包括如下步驟:
[0052] 步驟S2011,獲取在預(yù)設(shè)時間內(nèi)在任意兩家商戶消費(fèi)過的交易卡的數(shù)量。
[0053] 在具體實施中,可以是通過輸入全量交易卡的流水?dāng)?shù)據(jù),得到每張交易卡消費(fèi)過 的商戶,并計算在預(yù)設(shè)時間,如1小時內(nèi),交易卡用戶連續(xù)消費(fèi)過的商戶。最終經(jīng)過統(tǒng)計計 算,得到在所述預(yù)設(shè)時間內(nèi),在這些商戶消費(fèi)過的交易卡的總數(shù)。
[0054] 步驟S2012,統(tǒng)計所述交易卡的數(shù)量占所有交易卡數(shù)量的百分比。
[0055] 步驟S2013,當(dāng)所述百分比大于預(yù)設(shè)值時,將對應(yīng)的兩家商戶作為同一類,作為一 個商戶商圈。
[0056] 當(dāng)所述百分比大于預(yù)設(shè)值時,可以認(rèn)為這兩家商戶距離較近,屬于同一類,可以作 為一個商戶商圈。
[0057] 在另一種具體實施中,也可以將所述交易卡的總數(shù)與預(yù)設(shè)數(shù)值進(jìn)行比較。如果大 于預(yù)設(shè)數(shù)值,則可認(rèn)為這兩家商戶距離較近,屬于同一類,可以作為一個商戶商圈。
[0058] 步驟S202,當(dāng)獲取到的商戶的商戶信息中未包含商戶地址時,根據(jù)所述商戶所處 的商戶商圈,設(shè)置所述商戶的商戶地址為所述商戶商圈中占多數(shù)的商戶地址。
[0059] 有可能存在所述商戶同一類的商戶商圈中不同商戶地址數(shù)量相同的情況。此時無 法實現(xiàn)商戶地址的更新,因此在具體實施中,可以跳過該商戶的商戶地址的識別檢測。當(dāng) 完成對其他商戶地址的識別檢測后,此時商戶商圈中不同商戶地址各自的數(shù)量就會發(fā)生變 化,即出現(xiàn)占多數(shù)的商戶地址,從而可以實現(xiàn)對商戶信息中商戶地址的更新。
[0060] 本發(fā)明實施例通過挖掘交易卡的交易記錄信息,可以對商戶商圈進(jìn)行分類,從而 實現(xiàn)了對未包含商戶地址的商戶信息的自動識別更新。
[0061] 為了解決上述的技術(shù)問題,本發(fā)明實施例還公開了一種商戶地址信息識別裝置。 如圖4所示,所述商戶地址信息識別裝置40可以包括:
[0062] 切詞單元401,用于獲取商戶的商戶信息,當(dāng)所獲取的商戶信息中包含商戶地址 時,對所述商戶地址進(jìn)行切詞,得到所述商戶地址的地址詞集;
[0063] 計算單元402,用于將所述商戶地址的地址詞集與預(yù)設(shè)的標(biāo)準(zhǔn)地址信息表中的地 址信息進(jìn)行匹配,并根據(jù)所述地址詞集中詞匯的完整程度,計算所述地址詞集對應(yīng)的權(quán)重 值,所述標(biāo)準(zhǔn)地址信息表中的地址信息包含完整的行政級別信息以及對應(yīng)的地名;
[0064] 選擇單元403,用于當(dāng)所述地址詞集在所述標(biāo)準(zhǔn)地址信息表中存在至少兩條地址 信息時,選擇所述商戶地址信息為所述標(biāo)準(zhǔn)地址信息表中對應(yīng)的權(quán)重值最高的地址信息。 [0065] 在具體實施中,所述計算單元402用于當(dāng)所述地址詞集中的詞匯包含完整信息且 與所述標(biāo)準(zhǔn)地址表完全匹配時,將所述地址詞集中的詞匯的權(quán)重值設(shè)為完整權(quán)重值;以及 用于當(dāng)所述地址詞集中的詞匯不包含行政級別信息時,將所述地址詞集中的詞匯權(quán)重值設(shè) 置為與所述地址詞集在所述標(biāo)準(zhǔn)地址信息表中地址信息的行政級別相關(guān),且低于所述完整 權(quán)重值。
[0066] 在具體實施中,所述計算單元402,還用于當(dāng)所述地址詞集中的詞匯不包含行政級 別信息時,將所述地址詞集的權(quán)重值設(shè)置為隨著地址詞集在所述標(biāo)準(zhǔn)地址信息表中所處的 行政級別的降低而遞減。
[0067] 在具體實施中,所述選擇單元403可以包括:用于通過計算在所述標(biāo)準(zhǔn)信 Sum 息表中具有相同名稱的地址的權(quán)重值;
[0068] 其中,所述Si為所述地址詞集中第i個詞匯的權(quán)重值;所述Sum為所述標(biāo)準(zhǔn)地址 信息表中與所述第i個詞匯具有相同名稱的地址的權(quán)重值之和。
[0069] 在具體實施中,所述商戶地址信息識別裝置40還可以包括:
[0070] 分類單元404,用于根據(jù)交易卡的交易記錄信息,對商戶進(jìn)行分類,形成商戶商 圈;
[0071] 設(shè)置單元405,用于當(dāng)獲取到的商戶的商戶信息中未包含商戶地址時,根據(jù)所述商 戶所處的商戶商圈,設(shè)置所述商戶的商戶地址為所述商戶商圈中占多數(shù)的商戶地址。
[0072] 在具體實施中,所述分類單元404可以包括:
[0073] 獲取子單元,用于獲取在預(yù)設(shè)時間內(nèi)在任意兩家商戶消費(fèi)過的交易卡的數(shù)量;
[0074] 統(tǒng)計子單元,用于統(tǒng)計所述交易卡的數(shù)量占所有交易卡數(shù)量的百分比;
[0075] 歸類子單元,用于當(dāng)所述百分比大于預(yù)設(shè)值時,將對應(yīng)的兩家商戶作為同一類,作 為一個商戶商圈。
[0076] 本領(lǐng)域普通技術(shù)人員可以理解上述實施例的各種方法中的全部或部分步驟是可 以通過程序來指令相關(guān)的硬件來完成,該程序可以存儲于計算機(jī)可讀存儲介質(zhì)中,存儲介 質(zhì)可以包括:ROM、RAM、磁盤或光盤等。
[0077] 雖然本發(fā)明披露如上,但本發(fā)明并非限定于此。任何本領(lǐng)域技術(shù)人員,在不脫離本 發(fā)明的精神和范圍內(nèi),均可作各種更動與修改,因此本發(fā)明的保護(hù)范圍應(yīng)當(dāng)以權(quán)利要求所 限定的范圍為準(zhǔn)。
【權(quán)利要求】
1. 一種商戶地址信息識別方法,其特征在于,包括: 獲取商戶的商戶信息,當(dāng)所獲取的商戶信息中包含商戶地址時,對所述商戶地址進(jìn)行 切詞,得到所述商戶地址的地址詞集; 將所述商戶地址的地址詞集與預(yù)設(shè)的標(biāo)準(zhǔn)地址信息表中的地址信息進(jìn)行匹配,并根據(jù) 所述地址詞集中詞匯的完整程度,計算所述地址詞集對應(yīng)的權(quán)重值,所述標(biāo)準(zhǔn)地址信息表 中的地址信息包含完整的行政級別信息以及對應(yīng)的地名; 當(dāng)所述地址詞集在所述標(biāo)準(zhǔn)地址信息表中存在至少兩條地址信息時,選擇所述商戶地 址信息為所述標(biāo)準(zhǔn)地址信息表中對應(yīng)的權(quán)重值最高的地址信息。
2. 如權(quán)利要求1所述的商戶地址信息識別方法,其特征在于,所述計算所述地址詞集 的權(quán)重值包括: 當(dāng)所述地址詞集中的詞匯包含地名及對應(yīng)的行政級別信息且與所述標(biāo)準(zhǔn)地址表完全 匹配時,將所述地址詞集中的詞匯的權(quán)重值設(shè)為完整權(quán)重值; 當(dāng)所述地址詞集中的詞匯不包含行政級別信息時,所述地址詞集中的詞匯權(quán)重值與所 述地址詞集在所述標(biāo)準(zhǔn)地址信息表中地址信息的行政級別相關(guān),且低于所述完整權(quán)重值。
3. 如權(quán)利要求2所述的商戶地址信息識別方法,其特征在于,當(dāng)所述地址詞集中的詞 匯不包含行政級別信息時,所述地址詞集的權(quán)重值隨著地址詞集在所述標(biāo)準(zhǔn)地址信息表中 所處的行政級別的降低而遞減。
4. 如權(quán)利要求1所述的商戶地址信息識別方法,其特征在于,當(dāng)所述地址詞集在所述 標(biāo)準(zhǔn)地址信息表中存在至少兩條地址信息時,通過^^·計算在所述標(biāo)準(zhǔn)信息表中具有相 Sum 同名稱的地址的權(quán)重值; 其中,所述Si為所述地址詞集中第i個詞匯的權(quán)重值;所述Sum為所述標(biāo)準(zhǔn)地址信息 表中與所述第i個詞匯具有相同名稱的地址的權(quán)重值之和。
5. 如權(quán)利要求1所述的商戶地址信息識別方法,其特征在于,還包括:當(dāng)所述地址詞集 中包含所述標(biāo)準(zhǔn)地址信息表中未包含的地址信息時,將所述地址信息加入所述標(biāo)準(zhǔn)地址信 息表中。
6. 如權(quán)利要求1所述的商戶地址信息識別方法,其特征在于,還包括: 根據(jù)交易卡的交易記錄信息,對商戶進(jìn)行分類,形成商戶商圈; 當(dāng)獲取到的商戶的商戶信息中未包含商戶地址時,根據(jù)所述商戶所處的商戶商圈,設(shè) 置所述商戶的商戶地址為所述商戶商圈中占多數(shù)的商戶地址。
7. 如權(quán)利要求6所述的商戶地址信息識別方法,其特征在于,所述根據(jù)交易卡的交易 記錄信息,對商戶進(jìn)行分類,形成商戶商圈,包括: 獲取在預(yù)設(shè)時間內(nèi)在任意兩家商戶消費(fèi)過的交易卡的數(shù)量并統(tǒng)計所述交易卡的數(shù)量 占所有交易卡數(shù)量的百分比; 當(dāng)所述百分比大于預(yù)設(shè)值時,將對應(yīng)的兩家商戶作為同一類,作為一個商戶商圈。
8. -種商戶地址信息識別裝置,其特征在于,包括: 切詞單元,用于獲取商戶的商戶信息,當(dāng)所獲取的商戶信息中包含商戶地址時,對所述 商戶地址進(jìn)行切詞,得到所述商戶地址的地址詞集; 計算單元,用于將所述商戶地址的地址詞集與預(yù)設(shè)的標(biāo)準(zhǔn)地址信息表中的地址信息進(jìn) 行匹配,并根據(jù)所述地址詞集中詞匯的完整程度,計算所述地址詞集對應(yīng)的權(quán)重值,所述標(biāo) 準(zhǔn)地址信息表中的地址信息包含完整的行政級別信息以及對應(yīng)的地名; 選擇單元,用于當(dāng)所述地址詞集在所述標(biāo)準(zhǔn)地址信息表中存在至少兩條地址信息時, 選擇所述商戶地址信息為所述標(biāo)準(zhǔn)地址信息表中對應(yīng)的權(quán)重值最高的地址信息。
9. 如權(quán)利要求8所述的商戶地址信息識別裝置,其特征在于,所述計算單元用于當(dāng)所 述地址詞集中的詞匯包含地名及對應(yīng)的行政級別信息且與所述標(biāo)準(zhǔn)地址表完全匹配時,將 所述地址詞集中的詞匯的權(quán)重值設(shè)為完整權(quán)重值;且用于當(dāng)所述地址詞集中的詞匯不包含 行政級別信息時,將所述地址詞集中的詞匯權(quán)重值與所述地址詞集在所述標(biāo)準(zhǔn)地址信息表 中地址信息的行政級別相關(guān),且低于所述完整權(quán)重值。
10. 如權(quán)利要求9所述的商戶地址信息識別裝置,其特征在于,所述計算單元,用于當(dāng) 所述地址詞集中的詞匯不包含行政級別信息時,將所述地址詞集的權(quán)重值設(shè)置為隨著地址 詞集在所述標(biāo)準(zhǔn)地址信息表中所處的行政級別的降低而遞減。
11. 如權(quán)利要求8所述的商戶地址信息識別裝置,其特征在于,所述選擇單元用于通過 #^計算在所述標(biāo)準(zhǔn)信息表中具有相同名稱的地址的權(quán)重值;其中,所述Si為所述地址Sum 詞集中第i個詞匯的權(quán)重值;所述Sum為所述標(biāo)準(zhǔn)地址信息表中與所述第i個詞匯具有相 同名稱的地址的權(quán)重值之和。
12. 如權(quán)利要求8所述的商戶地址信息識別裝置,其特征在于,還包括:分類單元,用于 根據(jù)交易卡的交易記錄信息,對商戶進(jìn)行分類,形成商戶商圈; 設(shè)置單元,用于當(dāng)獲取到的商戶的商戶信息中未包含商戶地址時,根據(jù)所述商戶所處 的商戶商圈,設(shè)置所述商戶的商戶地址為所述商戶商圈中占多數(shù)的商戶地址。
13. 如權(quán)利要求12所述的商戶地址信息識別裝置,其特征在于,所述分類單元包括: 獲取子單元,用于獲取在預(yù)設(shè)時間內(nèi)在任意兩家商戶消費(fèi)過的交易卡的數(shù)量; 統(tǒng)計子單元,用于統(tǒng)計所述交易卡的數(shù)量占所有交易卡數(shù)量的百分比;歸類單元,用于 當(dāng)所述百分比大于預(yù)設(shè)值時,將對應(yīng)的兩家商戶作為同一類,作為一個商戶商圈。
【文檔編號】G06F17/27GK104462059SQ201410719537
【公開日】2015年3月25日 申請日期:2014年12月1日 優(yōu)先權(quán)日:2014年12月1日
【發(fā)明者】王霏, 龍凱 申請人:銀聯(lián)智惠信息服務(wù)(上海)有限公司