本發(fā)明實(shí)施例涉及數(shù)據(jù)挖掘領(lǐng)域,尤其涉及一種基于客戶群體特征的商戶競合關(guān)系分析的方法和裝置。
背景技術(shù):
:現(xiàn)有技術(shù)中,由于商戶只能通過自身的銷售系統(tǒng)獲取單一的自身商戶的客戶信息,因此無法用客戶交易信息來全面分析與其它商戶的競合關(guān)系。目前,可通過問卷調(diào)查等方式來了解商戶自身在本行業(yè)的位置和競合關(guān)系,但是通過此方式前期投入大,如需要投入大量的人力和物力,而且得到的結(jié)果可信度比較低。但是隨著人們消費(fèi)觀念的逐步更新,刷卡或電子支付越來越受到客戶的青睞,在很多商戶中,刷卡或電子支付占很大的比重。綜上,亟需一種基于客戶群體特征的商戶競合關(guān)系分析的方案,用于提高分析商戶競合關(guān)系的準(zhǔn)確性。技術(shù)實(shí)現(xiàn)要素:本發(fā)明實(shí)施例提供了一種基于客戶群體特征的商戶競合關(guān)系分析的方法和裝置,用于提高分析商戶競合關(guān)系的準(zhǔn)確性。本發(fā)明實(shí)施例提供一種基于客戶群體特征的商戶競合關(guān)系分析的方法,包括:獲取M個商戶對應(yīng)的多條客戶交易記錄;其中,多條客戶交易記錄中的每條客戶交易記錄包括客戶標(biāo)識、商戶標(biāo)識和交易屬性信息;其中,M為大于等于2的整數(shù);統(tǒng)計出多條客戶交易記錄對應(yīng)的多個客戶標(biāo)識,每個客戶標(biāo)識對應(yīng)至少一個商戶標(biāo)識;根據(jù)多條客戶交易記錄中每條客戶交易記錄的交易屬性信息,對多個客戶標(biāo)識進(jìn)行分類,獲得N個客戶集合;其中,N個客戶集合的中每個客戶集合包括多個客戶標(biāo)識中的至少一個客戶標(biāo)識;N為大于等于1的正整數(shù);針對N個客戶集合中的每個客戶集合:統(tǒng)計第一商戶的商戶標(biāo)識在該客戶集合中對應(yīng)的客戶標(biāo)識的第一數(shù)量,計算第一數(shù)量在該客戶集合的所有客戶標(biāo)識的數(shù)量中的第一占比;統(tǒng)計第二商戶的商戶標(biāo)識在該客戶集合中對應(yīng)的客戶標(biāo)識的第二數(shù)量,計算第二數(shù)量在該客戶集合的所有客戶標(biāo)識的數(shù)量中的第二占比;其中,第一商戶和第二商戶為M個商戶中的任兩個商戶;根據(jù)第一商戶在N個客戶集合中對應(yīng)的N個第一占比,以及第二商戶在N個客戶集合中對應(yīng)的N個第二占比,確定第一商戶和第二商戶之間的競爭關(guān)系??蛇x地,多條客戶交易記錄中的每條客戶交易記錄包括交易屬性信息包括:客戶消費(fèi)信息和該客戶交易記錄對應(yīng)的客戶的屬性信息;可選地,根據(jù)多條客戶交易記錄中每條客戶交易記錄的交易屬性信息,對多個客戶標(biāo)識進(jìn)行分類,獲得N個客戶集合,包括:使用K-Means算法,根據(jù)多條客戶交易記錄中每條客戶交易記錄的交易屬性信息,對多個客戶標(biāo)識進(jìn)行分類,獲得N個客戶集合??蛇x地,根據(jù)第一商戶在N個客戶集合中對應(yīng)的N個第一占比,以及第二商戶在N個客戶集合中對應(yīng)的N個第二占比,確定第一商戶和第二商戶之間的競爭關(guān)系,包括:根據(jù)第一商戶在N個客戶集合中對應(yīng)的N個第一占比,確定出第一商戶的第一總占比;根據(jù)第二商戶在N個客戶集合中對應(yīng)的N個第二占比,確定出第二商戶的第二總占比;根據(jù)第一總占比和第二總占比,計算第一商戶和第二商戶的相似度;根據(jù)相似度確定確定第一商戶和第二商戶之間的競爭關(guān)系??蛇x地,根據(jù)相似度確定確定第一商戶和第二商戶之間的競爭關(guān)系,包括:在確定相似度大于第一閾值,且第一商戶和第二商戶為同行業(yè)的情況下,確定第一商戶和第二商戶為競爭關(guān)系;在確定相似度大于第一閾值,且第一商戶和第二商戶為不同行業(yè)的情況下,確定第一商戶和第二商戶為合作關(guān)系;在確定相似度不大于第一閾值,且第一商戶和第二商戶為同行業(yè)的情況下,確定第一商戶和第二商戶為合作關(guān)系。可選地,在確定相似度大于第一閾值,且第一商戶和第二商戶為同行業(yè)的情況下,確定第一商戶和第二商戶為競爭關(guān)系,包括:在確定相似度大于第一閾值、小于第二閾值,且第一商戶和第二商戶為同行業(yè)的情況下,確定第一商戶和第二商戶為普通競爭關(guān)系;其中,第二閾值大于第一閾值;在確定相似度大于第二閾值,且第一商戶和第二商戶為同行業(yè)的情況下,確定第一商戶和第二商戶為強(qiáng)競爭關(guān)系??蛇x地,獲取M個商戶對應(yīng)的多條客戶交易記錄,包括:獲取待查詢的M個商戶;獲取預(yù)設(shè)時間段內(nèi)M個商戶中每個商戶對應(yīng)的所有客戶交易記錄;對M個商戶中每個商戶對應(yīng)的所有客戶交易記錄進(jìn)行篩選,去除無效的客戶交易記錄,得到M個商戶對應(yīng)的多條客戶交易記錄。本發(fā)明實(shí)施例提供一種一種基于客戶群體特征的商戶競合關(guān)系分析的裝置,包括:獲取單元,用于獲取M個商戶對應(yīng)的多條客戶交易記錄;其中,多條客戶交易記錄中的每條客戶交易記錄包括客戶標(biāo)識、商戶標(biāo)識和交易屬性信息;其中,M為大于等于2的整數(shù);統(tǒng)計單元,用于統(tǒng)計出多條客戶交易記錄對應(yīng)的多個客戶標(biāo)識,每個客戶標(biāo)識對應(yīng)至少一個商戶標(biāo)識;處理單元,用于根據(jù)多條客戶交易記錄中每條客戶交易記錄的交易屬性信息,對多個客戶標(biāo)識進(jìn)行分類,獲得N個客戶集合;其中,N個客戶集合的中每個客戶集合包括多個客戶標(biāo)識中的至少一個客戶標(biāo)識;N為大于等于1的正整數(shù);針對N個客戶集合中的每個客戶集合:統(tǒng)計第一商戶的商戶標(biāo)識在該客戶集合中對應(yīng)的客戶標(biāo)識的第一數(shù)量,計算第一數(shù)量在該客戶集合的所有客戶標(biāo)識的數(shù)量中的第一占比;統(tǒng)計第二商戶的商戶標(biāo)識在該客戶集合中對應(yīng)的客戶標(biāo)識的第二數(shù)量,計算第二數(shù)量在該客戶集合的所有客戶標(biāo)識的數(shù)量中的第二占比;其中,第一商戶和第二商戶為M個商戶中的任兩個商戶;根據(jù)第一商戶在N個客戶集合中對應(yīng)的N個第一占比,以及第二商戶在N個客戶集合中對應(yīng)的N個第二占比,確定第一商戶和第二商戶之間的競爭關(guān)系??蛇x地,多條客戶交易記錄中的每條客戶交易記錄包括交易屬性信息包括:客戶消費(fèi)信息和該客戶交易記錄對應(yīng)的客戶的屬性信息;處理單元,用于:使用K-Means算法,根據(jù)多條客戶交易記錄中每條客戶交易記錄的交易屬性信息,對多個客戶標(biāo)識進(jìn)行分類,獲得N個客戶集合??蛇x地,處理單元,用于:根據(jù)第一商戶在N個客戶集合中對應(yīng)的N個第一占比,確定出第一商戶的第一總占比;根據(jù)第二商戶在N個客戶集合中對應(yīng)的N個第二占比,確定出第二商戶的第二總占比;根據(jù)第一總占比和第二總占比,計算第一商戶和第二商戶的相似度;根據(jù)相似度確定確定第一商戶和第二商戶之間的競爭關(guān)系??蛇x地,還包括處理單元,用于:在確定相似度大于第一閾值,且第一商戶和第二商戶為同行業(yè)的情況下,確定第一商戶和第二商戶為競爭關(guān)系;在確定相似度大于第一閾值,且第一商戶和第二商戶為不同行業(yè)的情況下,確定第一商戶和第二商戶為合作關(guān)系;在確定相似度不大于第一閾值,且第一商戶和第二商戶為同行業(yè)的情況下,確定第一商戶和第二商戶為合作關(guān)系??蛇x地,處理單元,用于:在確定相似度大于第一閾值、小于第二閾值,且第一商戶和第二商戶為同行業(yè)的情況下,確定第一商戶和第二商戶為普通競爭關(guān)系;其中,第二閾值大于第一閾值;在確定相似度大于第二閾值,且第一商戶和第二商戶為同行業(yè)的情況下,確定第一商戶和第二商戶為強(qiáng)競爭關(guān)系。可選地,獲取單元,用于:獲取待查詢的M個商戶;獲取預(yù)設(shè)時間段內(nèi)M個商戶中每個商戶對應(yīng)的所有客戶交易記錄;處理單元,用于:對M個商戶中每個商戶對應(yīng)的所有客戶交易記錄進(jìn)行篩選,去除無效的客戶交易記錄,得到M個商戶對應(yīng)的多條客戶交易記錄。由于本發(fā)明實(shí)施例中,通過獲取M個商戶對應(yīng)的多條客戶交易記錄;統(tǒng)計出多條客戶交易記錄對應(yīng)的多個客戶標(biāo)識,每個客戶標(biāo)識對應(yīng)至少一個商戶標(biāo)識;根據(jù)多條客戶交易記錄中每條客戶交易記錄的交易屬性信息,對多個客戶標(biāo)識進(jìn)行分類,獲得N個客戶集合;獲得N個客戶集合是基于多個商戶的多條客戶交易記錄進(jìn)行的分類;之后,針對N個客戶集合中的每個客戶集合:統(tǒng)計第一商戶的商戶標(biāo)識在該客戶集合中對應(yīng)的客戶標(biāo)識的第一數(shù)量,計算第一數(shù)量在該客戶集合的所有客戶標(biāo)識的數(shù)量中的第一占比;統(tǒng)計第二商戶的商戶標(biāo)識在該客戶集合中對應(yīng)的客戶標(biāo)識的第二數(shù)量,計算第二數(shù)量在該客戶集合的所有客戶標(biāo)識的數(shù)量中的第二占比;根據(jù)第一商戶在N個客戶集合中對應(yīng)的N個第一占比,以及第二商戶在N個客戶集合中對應(yīng)的N個第二占比,確定第一商戶和第二商戶之間的競爭關(guān)系;根據(jù)每個商戶的客戶數(shù)量來在每個客戶集合中客戶數(shù)量的占比,來確定商戶之間的競爭關(guān)系,進(jìn)而,可以獲得準(zhǔn)確的商戶間競合關(guān)系;如此,通過該方法可以提高分析商戶競合關(guān)系的準(zhǔn)確性。附圖說明為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對實(shí)施例描述中所需要使用的附圖作簡要介紹。圖1為本發(fā)明實(shí)施例提供的一種基于客戶群體特征的商戶競合關(guān)系分析的方法流程示意圖;圖2為本發(fā)明實(shí)施例提供的另一種基于客戶群體特征的商戶競合關(guān)系分析的方法流程示意圖;圖3為本發(fā)明實(shí)施例提供的一種基于客戶群體特征的商戶競合關(guān)系分析的裝置的結(jié)構(gòu)示意圖。具體實(shí)施方式為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。圖1示例性示出了本發(fā)明實(shí)施例提供的一種基于客戶群體特征的商戶競合關(guān)系分析的方法流程示意圖,如圖2所示,該基于客戶群體特征的商戶競合關(guān)系分析的方法包括以下步驟:步驟101,獲取M個商戶對應(yīng)的多條客戶交易記錄;其中,多條客戶交易記錄中的每條客戶交易記錄包括客戶標(biāo)識、商戶標(biāo)識和交易屬性信息;其中,M為大于等于2的整數(shù);步驟102,統(tǒng)計出多條客戶交易記錄對應(yīng)的多個客戶標(biāo)識,每個客戶標(biāo)識對應(yīng)至少一個商戶標(biāo)識;步驟103,根據(jù)多條客戶交易記錄中每條客戶交易記錄的交易屬性信息,對多個客戶標(biāo)識進(jìn)行分類,獲得N個客戶集合;其中,N個客戶集合的中每個客戶集合包括多個客戶標(biāo)識中的至少一個客戶標(biāo)識;N為大于等于1的正整數(shù);步驟104,針對N個客戶集合中的每個客戶集合:統(tǒng)計第一商戶的商戶標(biāo)識在該客戶集合中對應(yīng)的客戶標(biāo)識的第一數(shù)量,計算第一數(shù)量在該客戶集合的所有客戶標(biāo)識的數(shù)量中的第一占比;統(tǒng)計第二商戶的商戶標(biāo)識在該客戶集合中對應(yīng)的客戶標(biāo)識的第二數(shù)量,計算第二數(shù)量在該客戶集合的所有客戶標(biāo)識的數(shù)量中的第二占比;其中,第一商戶和第二商戶為M個商戶中的任兩個商戶;步驟105,根據(jù)第一商戶在N個客戶集合中對應(yīng)的N個第一占比,以及第二商戶在N個客戶集合中對應(yīng)的N個第二占比,確定第一商戶和第二商戶之間的競爭關(guān)系。由于本發(fā)明實(shí)施例中,通過獲取M個商戶對應(yīng)的多條客戶交易記錄;統(tǒng)計出多條客戶交易記錄對應(yīng)的多個客戶標(biāo)識,每個客戶標(biāo)識對應(yīng)至少一個商戶標(biāo)識;根據(jù)多條客戶交易記錄中每條客戶交易記錄的交易屬性信息,對多個客戶標(biāo)識進(jìn)行分類,獲得N個客戶集合;獲得N個客戶集合是基于多個商戶的多條客戶交易記錄進(jìn)行的分類;之后,針對N個客戶集合中的每個客戶集合:統(tǒng)計第一商戶的商戶標(biāo)識在該客戶集合中對應(yīng)的客戶標(biāo)識的第一數(shù)量,計算第一數(shù)量在該客戶集合的所有客戶標(biāo)識的數(shù)量中的第一占比;統(tǒng)計第二商戶的商戶標(biāo)識在該客戶集合中對應(yīng)的客戶標(biāo)識的第二數(shù)量,計算第二數(shù)量在該客戶集合的所有客戶標(biāo)識的數(shù)量中的第二占比;根據(jù)第一商戶在N個客戶集合中對應(yīng)的N個第一占比,以及第二商戶在N個客戶集合中對應(yīng)的N個第二占比,確定第一商戶和第二商戶之間的競爭關(guān)系;根據(jù)每個商戶的客戶數(shù)量來在每個客戶集合中客戶數(shù)量的占比,來確定商戶之間的競爭關(guān)系,進(jìn)而,可以獲得準(zhǔn)確的商戶間競合關(guān)系;如此,通過該方法可以提高分析商戶競合關(guān)系的準(zhǔn)確性??蛇x地,本發(fā)明實(shí)施例中獲取M個商戶對應(yīng)的多條客戶交易記錄,包括:獲取待查詢的M個商戶;獲取預(yù)設(shè)時間段內(nèi)M個商戶中每個商戶對應(yīng)的所有客戶交易記錄;對M個商戶中每個商戶對應(yīng)的所有客戶交易記錄進(jìn)行篩選,去除無效的客戶交易記錄,得到M個商戶對應(yīng)的多條客戶交易記錄??蛇x地,為了保證獲得的交易記錄的可靠性,將獲得的交易記錄中數(shù)據(jù)進(jìn)行篩選,去除無效的客戶交易記錄,無效的交易記錄包括交易記錄標(biāo)識為失敗的交易記錄、交易記錄標(biāo)識為存在欺詐的交易記錄、交易記錄標(biāo)識為套現(xiàn)的交易記錄??蛇x地,本發(fā)明實(shí)施例中,多條客戶交易記錄中的每條客戶交易記錄包括交易屬性信息包括:客戶消費(fèi)信息和該客戶交易記錄對應(yīng)的客戶的屬性信息;根據(jù)多條客戶交易記錄中每條客戶交易記錄的交易屬性信息,對多個客戶標(biāo)識進(jìn)行分類,獲得N個客戶集合,包括:使用K-Means算法,根據(jù)多條客戶交易記錄中每條客戶交易記錄的交易屬性信息,對多個客戶標(biāo)識進(jìn)行分類,獲得N個客戶集合??蛇x地,客戶的消費(fèi)信息包括客戶的卡號、消費(fèi)金額、消費(fèi)所在的商戶標(biāo)識,消費(fèi)時間,購買的產(chǎn)品、產(chǎn)品的單價、購買的數(shù)量、消費(fèi)的總金額等信息;根據(jù)客戶交易屬性信息的特點(diǎn),可以將客戶進(jìn)行分類;可選地,可以將客戶分為不經(jīng)常變化的數(shù)據(jù)集合,反映客戶的一些基本屬性信息的集合,如客戶的自然屬性的集合;也可以將客戶分為隨時間變化的數(shù)據(jù)集合,主要是客戶與商戶之間進(jìn)行交易或其他交互所積累的數(shù)據(jù),這些交易記錄詳細(xì)記錄了客戶和商戶之間的整個交易過程,反映了客戶的消費(fèi)習(xí)慣等信息,可以為客戶消費(fèi)屬性。本發(fā)明實(shí)施例中,將客戶分為N個集合時,既包括客戶的自然屬性,又包括客戶的消費(fèi)屬性,比如,首先從客戶的交易屬性信息中提取客戶的消費(fèi)屬性特征作為聚類的向量,對客戶聚類,然后應(yīng)用特征提取方法從客戶交易屬性信息中選擇客戶的自然屬性作為分類變量;將客戶交易屬性中隨時間變化的特征聚類的結(jié)果與客戶的自然屬性相結(jié)合對客戶進(jìn)行分類。可選地,分類包括聚類,以及一般的分類方法,聚類能幫助市場分析人員從客戶交易記錄中發(fā)現(xiàn)不同的客戶群,并且用購買模式來刻畫不同的客戶群的特征;如此,由于在客戶的分類過程中包含了大量的客戶交易記錄,因此,可提高分類的全面性??蛇x地,根據(jù)客戶的交易屬性信息的趨勢、平均值、方差、偏度、峰度來描述客戶的交易屬性,如此,既降低了數(shù)據(jù)分析的維度,又描述了交易屬性的統(tǒng)計特征;結(jié)合統(tǒng)計的客戶的交易屬性特征和客戶的自然屬性特征,獲得客戶的特征矩陣X,其中,特征矩陣的每一行代表一個客戶的交易屬性信息,每一列代表一個特征屬性??蛇x地,趨勢特征是交易屬性較常用的特征,反映了客戶消費(fèi)的長期變化趨勢,可采用公式(1)計算獲得:在公式(1)中,xi表示客戶第i次消費(fèi)的消費(fèi)時間,yi表示客戶第i次消費(fèi)的消費(fèi)金額,n表示客戶消費(fèi)的次數(shù);μ表示趨勢特征;i表示第i次進(jìn)行消費(fèi),取值為大于等于1的整數(shù)??蛇x地,平均值反映了客戶購買產(chǎn)品消費(fèi)的金額,可采用公式(2)計算獲得:在公式(2)中,yi表示客戶第i次消費(fèi)的消費(fèi)金額,n表示客戶消費(fèi)的次數(shù),Г表示平均值,i表示第i次進(jìn)行消費(fèi),取值為大于等于1的整數(shù)??蛇x地,方差反映了客戶購買產(chǎn)品的波動程度,可采用公式(3)計算獲得:在公式(3)中,yi表示客戶第i次消費(fèi)的消費(fèi)金額,n表示客戶消費(fèi)的次數(shù),σ表示方差,即客戶購買產(chǎn)品的波動程度,i表示第i次進(jìn)行消費(fèi),取值為大于等于1的整數(shù)。可選地,偏度衡量數(shù)據(jù)的分布相對于中心點(diǎn)是否看起來一致,即交易的值相對于平均值的對稱程度,可采用公式(4)計算獲得:在公式(4)中,yi表示客戶第i次消費(fèi)的消費(fèi)金額,n表示客戶消費(fèi)的次數(shù);μ表示趨勢特征,σ表示方差,S表示偏度,即客戶購買產(chǎn)品的波動程度,i表示第i次進(jìn)行消費(fèi),取值為大于等于1的整數(shù)??蛇x地,峰度是數(shù)據(jù)分布集中趨勢的高峰的形狀,這里表示交易屬性的數(shù)據(jù)分布相對于正態(tài)分布來講是平坦還是具有尖峰,如果數(shù)據(jù)分布具有高的峰度系統(tǒng),則通常會在君子附近有明顯的尖峰,并且以較高的速度下降,峰度對于標(biāo)準(zhǔn)正態(tài)分布是3,因此,峰度系數(shù)可用公式(5)計算:在公式(5)中,yi表示客戶第i次消費(fèi)的消費(fèi)金額,n表示客戶消費(fèi)的次數(shù);μ表示趨勢特征,σ表示方差,K表示峰度,i表示第i次進(jìn)行消費(fèi),取值為大于等于1的整數(shù)??蛇x地,頻次表示客戶消費(fèi)的頻率,可采用公式(6)計算:在公式(6)中,Tt表示客戶第i次消費(fèi)的開始日期,Ts表示客戶第i次消費(fèi)的結(jié)束日期,n表示客戶消費(fèi)的次數(shù),i表示第i次進(jìn)行消費(fèi),取值為大于等于1的整數(shù)。為了不使個別特征統(tǒng)治聚類結(jié)果,消除由于特征取值范圍不同造成的影響,對上述特征進(jìn)行標(biāo)準(zhǔn)化,按公式(7)進(jìn)行標(biāo)準(zhǔn)化:在公式(7)中,X表示每個特征,Y表示進(jìn)行標(biāo)準(zhǔn)化后的特征,σ表示方差,μ表示趨勢特征.可選地,對標(biāo)準(zhǔn)化之后的數(shù)據(jù)使用特征降維(PrincipalComponentAnalysis,簡稱PCA)進(jìn)行降維,形成客戶特征矩陣X;之后使用K-Means算法將客戶分為N個集合,即獲得N個客戶群體g1,g2,g3…..gn,由于K-Means算法接收輸入量K,然后將n個數(shù)據(jù)劃分為K個聚類以便使得獲得的聚類滿足:統(tǒng)一聚類中的對象相似度較高,而不同聚類中的對象相似度較低,即群體g1,g2,g3…..gn,群體內(nèi)的特征非常接近,但群與群之間的特征差異非常大;上述分群操作包括但不限于此??蛇x地,根據(jù)第一商戶在N個客戶集合中對應(yīng)的N個第一占比,以及第二商戶在N個客戶集合中對應(yīng)的N個第二占比,確定第一商戶和第二商戶之間的競爭關(guān)系,包括:根據(jù)第一商戶在N個客戶集合中對應(yīng)的N個第一占比,確定出第一商戶的第一總占比;根據(jù)第二商戶在N個客戶集合中對應(yīng)的N個第二占比,確定出第二商戶的第二總占比;根據(jù)第一總占比和第二總占比,計算第一商戶和第二商戶的相似度;根據(jù)相似度確定確定第一商戶和第二商戶之間的競爭關(guān)系??蛇x地,假設(shè)獲取的M個商戶為商戶i、商戶j、商戶k,根據(jù)商戶i、商戶j、商戶k中的多條客戶交易記錄的交易屬性信息。獲得3個客戶群,分別客群體g1,客戶群體g2,客戶群體g3,統(tǒng)計商戶i中的客戶數(shù)量在客戶群體g1中客戶數(shù)量的占比,用表示,商戶i中的客戶數(shù)量在客戶群體g2中客戶數(shù)量的占比,用表示,商戶i中的客戶數(shù)量在客戶群體g2中客戶數(shù)量的占比,用表示;使用同樣的方法統(tǒng)計出商戶j中的客戶數(shù)量在客群體g1,客戶群體g2,客戶群體g3中的客戶數(shù)量的占比,分別用表示;商戶k中的客戶數(shù)量在客在客群體g1,客戶群體g2,客戶群體g3中的客戶數(shù)量的占比,分別用表示;獲得的占比構(gòu)成占比矩陣R,占比矩陣R中的每一行表示同一個商戶的客戶數(shù)量在不同的群體中的客戶數(shù)量占的比例,每一列表示不同的商戶的客戶數(shù)量在同一個客戶群中客戶數(shù)量的占比;可選地,根據(jù)占比矩陣確定出每個商戶的總占比,商戶i的總占比向量為:商戶j的總占比向量為:商戶k的總占比向量為:可選地,根據(jù)總的占比向量確定出任意兩個商戶的相似度,使用向量余弦相似度來衡量,根據(jù)向量余弦相似度公式:在公式(8)中,Si,j表示商戶i和商戶j的相似度,表示商戶i的總占比向量,表示商戶j的總占比向量。其中,余弦值Si,j的值越接近1,表明和的夾角越接近零度,也就是和越接近,夾角等于零的時候,兩個向量完全一樣,因此,余弦值Si,j越大越相似??蛇x地,對每兩個商戶使用余弦相似度公式計算出相似度后,可轉(zhuǎn)化為相似度矩陣S??蛇x地,對于相似度的計算包括使用余弦相似度公式計算,但不限于此,比如,可以使用Tanimoto系數(shù)計算:在公式(9)中,Si,j表示商戶i和商戶j的相似度,表示商戶i的總占比向量,表示商戶j的總占比向量;其中,Ti,j的范圍[0,1],完全相同的時候?yàn)門i,j=1,沒有相似的為Ti,j=0,越接近1相似度越高??蛇x地,根據(jù)相似度確定確定第一商戶和第二商戶之間的競爭關(guān)系,包括:在確定相似度大于第一閾值,且第一商戶和第二商戶為同行業(yè)的情況下,確定第一商戶和第二商戶為競爭關(guān)系;在確定相似度大于第一閾值,且第一商戶和第二商戶為不同行業(yè)的情況下,確定第一商戶和第二商戶為合作關(guān)系;在確定相似度不大于第一閾值,且第一商戶和第二商戶為同行業(yè)的情況下,確定第一商戶和第二商戶為合作關(guān)系??蛇x地,根據(jù)業(yè)務(wù)需求,確定相似度第一閾值,根據(jù)任意兩個商戶之間的相似度閾值和是否屬于同一行業(yè),可以確定出兩個商戶之間是否為競爭關(guān)系,或者合作關(guān)系??蛇x地,根據(jù)結(jié)果真值表來確定兩個商戶之間的競合關(guān)系,表1為結(jié)果真值表:表1:結(jié)果真值表:相似度是否大于第一閾值是否屬于同一行業(yè)預(yù)計競合關(guān)系是是競爭關(guān)系是否合作關(guān)系否是合作關(guān)系否否未知可選地,在確定相似度大于第一閾值,且第一商戶和第二商戶為同行業(yè)的情況下,確定第一商戶和第二商戶為競爭關(guān)系,包括:在確定相似度大于第一閾值、小于第二閾值,且第一商戶和第二商戶為同行業(yè)的情況下,確定第一商戶和第二商戶為普通競爭關(guān)系;其中,第二閾值大于第一閾值;在確定相似度大于第二閾值,且第一商戶和第二商戶為同行業(yè)的情況下,確定第一商戶和第二商戶為強(qiáng)競爭關(guān)系??蛇x地,在確定任意兩個商戶之間為競爭關(guān)系之后,根據(jù)根據(jù)業(yè)務(wù)需求,確定出第二閾值,比較兩個商戶之間的相似度與第二閾值的大小關(guān)系,在確定兩個商戶之間的相似度大于第二閾值的情況下,說明兩個商戶之間存在強(qiáng)競爭關(guān)系,如此,通過自動的方式方便快捷的獲取到商戶間競合關(guān)系,為商戶做出決策時提供了可靠的數(shù)據(jù)支持??蛇x地,為了便于展示結(jié)果,將相似度按照如下公式二值化:在公式(10)中,Si,j表示商戶i和商戶j的相似度,K為第二閾值;通過二值化的方式,可更加方便的展示商戶間的競合關(guān)系。需要說明的一點(diǎn)是:上述針對基于客戶群體特征的商戶間競合關(guān)系的分析過程的說明僅是示例性和解釋性的,并不用于限定本發(fā)明。為了更清楚的介紹上述方法流程,圖2示例性示出了本發(fā)明實(shí)施例提供的另一種基于客戶群體特征的商戶競合關(guān)系分析的方法。該分析方法可以在銀聯(lián)的后臺系統(tǒng)進(jìn)行分析,而且基于客戶群體特征分析商戶競合關(guān)系,可提高分析商戶競合關(guān)系的準(zhǔn)確性和全面性?;诳蛻羧后w特征的商戶競合關(guān)系分析的過程見下述內(nèi)容。如圖2所示,該方法包括:步驟201,接收輸入的查詢指令;其中,查詢指令包括查詢時間段,待查詢的M個商戶標(biāo)識;步驟202,獲取待查詢的M個商戶;步驟203,獲取預(yù)設(shè)時間段內(nèi)M個商戶中每個商戶對應(yīng)的所有客戶交易記錄;其中,多條客戶交易記錄中的每條客戶交易記錄包括客戶標(biāo)識、商戶標(biāo)識和交易屬性信息;其中,M為大于等于2的整數(shù);步驟204,對M個商戶中每個商戶對應(yīng)的所有客戶交易記錄進(jìn)行篩選,去除無效的客戶交易記錄,得到M個商戶對應(yīng)的多條客戶交易記錄;步驟205,統(tǒng)計出多條客戶交易記錄對應(yīng)的多個客戶標(biāo)識,每個客戶標(biāo)識對應(yīng)至少一個商戶標(biāo)識;步驟206,根據(jù)多條客戶交易記錄中每條客戶交易記錄的交易屬性信息,獲取客戶交易的消費(fèi)頻次、均值、趨勢、方差、偏度、峰度;步驟207,根據(jù)客戶交易的消費(fèi)頻次、均值、趨勢、方差、偏度、峰度;使用K-Means算法對多個客戶標(biāo)識進(jìn)行分類,獲得N個客戶集合;其中,N個客戶集合的中每個客戶集合包括多個客戶標(biāo)識中的至少一個客戶標(biāo)識;N為大于等于1的正整數(shù);步驟208,針對N個客戶集合中的每個客戶集合:統(tǒng)計第一商戶的商戶標(biāo)識在該客戶集合中對應(yīng)的客戶標(biāo)識的第一數(shù)量,計算第一數(shù)量在該客戶集合的所有客戶標(biāo)識的數(shù)量中的第一占比;統(tǒng)計第二商戶的商戶標(biāo)識在該客戶集合中對應(yīng)的客戶標(biāo)識的第二數(shù)量,計算第二數(shù)量在該客戶集合的所有客戶標(biāo)識的數(shù)量中的第二占比;其中,第一商戶和第二商戶為M個商戶中的任兩個商戶;步驟209,根據(jù)計算出的第一數(shù)量在該客戶集合的所有客戶標(biāo)識的數(shù)量中的第一占比,確定出第一商戶的第一總占比;以及計算出的第二數(shù)量在該客戶集合的所有客戶標(biāo)識的數(shù)量中的第二占比,確定出第二商戶的第二總占比;步驟210,根據(jù)第一總占比和第二總占比,計算第一商戶和第二商戶的相似度;步驟211,判斷第一商戶和第二商戶是否滿足相似度大于第一閾值且屬于同一行業(yè),若均滿足,則執(zhí)行步驟212;若至少一個滿足,則執(zhí)行步驟213步驟212,確定第一商戶和第二商戶為競爭關(guān)系;可選地,在確定相似度大于第一閾值,且第一商戶和第二商戶為同行業(yè)的情況下,確定第一商戶和第二商戶為競爭關(guān)系。步驟213,確定第一商戶和第二商戶為合作關(guān)系或者不確定第一商戶和第二商戶之間的競合關(guān)系;可選地,第一商戶和第二商戶之間若滿足相似度大于第一閾值或者屬于同一行業(yè)兩個條件中的任一個,則可確定第一商戶和第二商戶之間為合作關(guān)系,若不滿足相似度大于第一閾值且不屬于同一行業(yè)兩個條件,則第一商戶和第二商戶之間的競合關(guān)系為未知;可選地,在確定相似度大于第一閾值,且第一商戶和第二商戶為不同行業(yè)的情況下,確定第一商戶和第二商戶為合作關(guān)系;可選地,在確定相似度不大于第一閾值,且第一商戶和第二商戶為同行業(yè)的情況下,確定第一商戶和第二商戶為合作關(guān)系;步驟214,在步驟212之后,判斷第一商戶和第二商戶和相似度是否大于第二閾值,若是,則執(zhí)行步驟215;若否,則執(zhí)行步驟216;步驟215,確定第一商戶和第二商戶為強(qiáng)競爭關(guān)系;步驟216;確定第一商戶和第二商戶為普通競爭關(guān)系;可選地,在確定相似度大于第二閾值,且第一商戶和第二商戶為同行業(yè)的情況下,確定第一商戶和第二商戶為強(qiáng)競爭關(guān)系;可選地,在確定相似度大于第一閾值、小于第二閾值,且第一商戶和第二商戶為同行業(yè)的情況下,確定第一商戶和第二商戶為普通競爭關(guān)系;其中,第二閾值大于第一閾值;可選地,對M個商戶的競合關(guān)系進(jìn)行可視化處理;即將M個商戶的競合關(guān)系以圖形或者圖像的形式展示出來。從上述內(nèi)容可以看出:本發(fā)明實(shí)施例中,由于本發(fā)明實(shí)施例中,通過獲取M個商戶對應(yīng)的多條客戶交易記錄;統(tǒng)計出多條客戶交易記錄對應(yīng)的多個客戶標(biāo)識,每個客戶標(biāo)識對應(yīng)至少一個商戶標(biāo)識;根據(jù)多條客戶交易記錄中每條客戶交易記錄的交易屬性信息,對多個客戶標(biāo)識進(jìn)行分類,獲得N個客戶集合;獲得N個客戶集合是基于多個商戶的多條客戶交易記錄進(jìn)行的分類;之后,針對N個客戶集合中的每個客戶集合:統(tǒng)計第一商戶的商戶標(biāo)識在該客戶集合中對應(yīng)的客戶標(biāo)識的第一數(shù)量,計算第一數(shù)量在該客戶集合的所有客戶標(biāo)識的數(shù)量中的第一占比;統(tǒng)計第二商戶的商戶標(biāo)識在該客戶集合中對應(yīng)的客戶標(biāo)識的第二數(shù)量,計算第二數(shù)量在該客戶集合的所有客戶標(biāo)識的數(shù)量中的第二占比;根據(jù)第一商戶在N個客戶集合中對應(yīng)的N個第一占比,以及第二商戶在N個客戶集合中對應(yīng)的N個第二占比,確定第一商戶和第二商戶之間的競爭關(guān)系;根據(jù)每個商戶的客戶數(shù)量來在每個客戶集合中客戶數(shù)量的占比,來確定商戶之間的競爭關(guān)系,進(jìn)而,可以獲得準(zhǔn)確的商戶間競合關(guān)系;如此,通過該方法可以提高分析商戶競合關(guān)系的準(zhǔn)確性。圖3示例性示出了本發(fā)明實(shí)施例提供的一種基于客戶群體特征的商戶競合關(guān)系分析的裝置的結(jié)構(gòu)示意圖?;谙嗤瑯?gòu)思,本發(fā)明實(shí)施例提供一種基于客戶群體特征的商戶競合關(guān)系分析的裝置,如圖3所示,一種基于客戶群體特征的商戶競合關(guān)系分析的裝置300包括獲取單元301、統(tǒng)計單元302和處理單元303。其中:獲取單元,用于獲取M個商戶對應(yīng)的多條客戶交易記錄;其中,多條客戶交易記錄中的每條客戶交易記錄包括客戶標(biāo)識、商戶標(biāo)識和交易屬性信息;其中,M為大于等于2的整數(shù);統(tǒng)計單元,用于統(tǒng)計出多條客戶交易記錄對應(yīng)的多個客戶標(biāo)識,每個客戶標(biāo)識對應(yīng)至少一個商戶標(biāo)識;處理單元,用于根據(jù)多條客戶交易記錄中每條客戶交易記錄的交易屬性信息,對多個客戶標(biāo)識進(jìn)行分類,獲得N個客戶集合;其中,N個客戶集合的中每個客戶集合包括多個客戶標(biāo)識中的至少一個客戶標(biāo)識;N為大于等于1的正整數(shù);針對N個客戶集合中的每個客戶集合:統(tǒng)計第一商戶的商戶標(biāo)識在該客戶集合中對應(yīng)的客戶標(biāo)識的第一數(shù)量,計算第一數(shù)量在該客戶集合的所有客戶標(biāo)識的數(shù)量中的第一占比;統(tǒng)計第二商戶的商戶標(biāo)識在該客戶集合中對應(yīng)的客戶標(biāo)識的第二數(shù)量,計算第二數(shù)量在該客戶集合的所有客戶標(biāo)識的數(shù)量中的第二占比;其中,第一商戶和第二商戶為M個商戶中的任兩個商戶;根據(jù)第一商戶在N個客戶集合中對應(yīng)的N個第一占比,以及第二商戶在N個客戶集合中對應(yīng)的N個第二占比,確定第一商戶和第二商戶之間的競爭關(guān)系??蛇x地,多條客戶交易記錄中的每條客戶交易記錄包括交易屬性信息包括:客戶消費(fèi)信息和該客戶交易記錄對應(yīng)的客戶的屬性信息;處理單元,用于:使用K-Means算法,根據(jù)多條客戶交易記錄中每條客戶交易記錄的交易屬性信息,對多個客戶標(biāo)識進(jìn)行分類,獲得N個客戶集合??蛇x地,處理單元,用于:根據(jù)第一商戶在N個客戶集合中對應(yīng)的N個第一占比,確定出第一商戶的第一總占比;根據(jù)第二商戶在N個客戶集合中對應(yīng)的N個第二占比,確定出第二商戶的第二總占比;根據(jù)第一總占比和第二總占比,計算第一商戶和第二商戶的相似度;根據(jù)相似度確定確定第一商戶和第二商戶之間的競爭關(guān)系??蛇x地,還包括處理單元,用于:在確定相似度大于第一閾值,且第一商戶和第二商戶為同行業(yè)的情況下,確定第一商戶和第二商戶為競爭關(guān)系;在確定相似度大于第一閾值,且第一商戶和第二商戶為不同行業(yè)的情況下,確定第一商戶和第二商戶為合作關(guān)系;在確定相似度不大于第一閾值,且第一商戶和第二商戶為同行業(yè)的情況下,確定第一商戶和第二商戶為合作關(guān)系??蛇x地,處理單元,用于:在確定相似度大于第一閾值、小于第二閾值,且第一商戶和第二商戶為同行業(yè)的情況下,確定第一商戶和第二商戶為普通競爭關(guān)系;其中,第二閾值大于第一閾值;在確定相似度大于第二閾值,且第一商戶和第二商戶為同行業(yè)的情況下,確定第一商戶和第二商戶為強(qiáng)競爭關(guān)系。可選地,獲取單元,用于:獲取待查詢的M個商戶;獲取預(yù)設(shè)時間段內(nèi)M個商戶中每個商戶對應(yīng)的所有客戶交易記錄;處理單元,用于:對M個商戶中每個商戶對應(yīng)的所有客戶交易記錄進(jìn)行篩選,去除無效的客戶交易記錄,得到M個商戶對應(yīng)的多條客戶交易記錄。從上述內(nèi)容可以看出:本發(fā)明實(shí)施例中,由于本發(fā)明實(shí)施例中,通過獲取M個商戶對應(yīng)的多條客戶交易記錄;統(tǒng)計出多條客戶交易記錄對應(yīng)的多個客戶標(biāo)識,每個客戶標(biāo)識對應(yīng)至少一個商戶標(biāo)識;根據(jù)多條客戶交易記錄中每條客戶交易記錄的交易屬性信息,對多個客戶標(biāo)識進(jìn)行分類,獲得N個客戶集合;獲得N個客戶集合是基于多個商戶的多條客戶交易記錄進(jìn)行的分類;之后,針對N個客戶集合中的每個客戶集合:統(tǒng)計第一商戶的商戶標(biāo)識在該客戶集合中對應(yīng)的客戶標(biāo)識的第一數(shù)量,計算第一數(shù)量在該客戶集合的所有客戶標(biāo)識的數(shù)量中的第一占比;統(tǒng)計第二商戶的商戶標(biāo)識在該客戶集合中對應(yīng)的客戶標(biāo)識的第二數(shù)量,計算第二數(shù)量在該客戶集合的所有客戶標(biāo)識的數(shù)量中的第二占比;根據(jù)第一商戶在N個客戶集合中對應(yīng)的N個第一占比,以及第二商戶在N個客戶集合中對應(yīng)的N個第二占比,確定第一商戶和第二商戶之間的競爭關(guān)系;根據(jù)每個商戶的客戶數(shù)量來在每個客戶集合中客戶數(shù)量的占比,來確定商戶之間的競爭關(guān)系,進(jìn)而,可以獲得準(zhǔn)確的商戶間競合關(guān)系;如此,通過該方法可以提高分析商戶競合關(guān)系的準(zhǔn)確性。本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、或計算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機(jī)可用程序代碼的計算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學(xué)存儲器等)上實(shí)施的計算機(jī)程序產(chǎn)品的形式。本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機(jī)程序指令到通用計算機(jī)、專用計算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機(jī)器,使得通過計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。這些計算機(jī)程序指令也可存儲在能引導(dǎo)計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機(jī)可讀存儲器中,使得存儲在該計算機(jī)可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。這些計算機(jī)程序指令也可裝載到計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機(jī)實(shí)現(xiàn)的處理,從而在計算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。盡管已描述了本發(fā)明的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對這些實(shí)施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實(shí)施例以及落入本發(fā)明范圍的所有變更和修改。顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進(jìn)行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。當(dāng)前第1頁1 2 3