1.一種基于客戶群體特征的商戶競合關(guān)系分析的方法,其特征在于,包括:
獲取M個(gè)商戶對(duì)應(yīng)的多條客戶交易記錄;其中,所述多條客戶交易記錄中的每條客戶交易記錄包括客戶標(biāo)識(shí)、商戶標(biāo)識(shí)和交易屬性信息;其中,所述M為大于等于2的整數(shù);
統(tǒng)計(jì)出所述多條客戶交易記錄對(duì)應(yīng)的多個(gè)客戶標(biāo)識(shí),所述每個(gè)客戶標(biāo)識(shí)對(duì)應(yīng)至少一個(gè)商戶標(biāo)識(shí);
根據(jù)所述多條客戶交易記錄中每條客戶交易記錄的交易屬性信息,對(duì)所述多個(gè)客戶標(biāo)識(shí)進(jìn)行分類,獲得N個(gè)客戶集合;其中,所述N個(gè)客戶集合的中每個(gè)客戶集合包括所述多個(gè)客戶標(biāo)識(shí)中的至少一個(gè)客戶標(biāo)識(shí);N為大于等于1的正整數(shù);
針對(duì)所述N個(gè)客戶集合中的每個(gè)客戶集合:統(tǒng)計(jì)第一商戶的商戶標(biāo)識(shí)在該客戶集合中對(duì)應(yīng)的客戶標(biāo)識(shí)的第一數(shù)量,計(jì)算所述第一數(shù)量在該客戶集合的所有客戶標(biāo)識(shí)的數(shù)量中的第一占比;統(tǒng)計(jì)第二商戶的商戶標(biāo)識(shí)在該客戶集合中對(duì)應(yīng)的客戶標(biāo)識(shí)的第二數(shù)量,計(jì)算所述第二數(shù)量在該客戶集合的所有客戶標(biāo)識(shí)的數(shù)量中的第二占比;其中,所述第一商戶和所述第二商戶為所述M個(gè)商戶中的任兩個(gè)商戶;
根據(jù)所述第一商戶在所述N個(gè)客戶集合中對(duì)應(yīng)的N個(gè)第一占比,以及所述第二商戶在所述N個(gè)客戶集合中對(duì)應(yīng)的N個(gè)第二占比,確定所述第一商戶和所述第二商戶之間的競爭關(guān)系。
2.如權(quán)利要求1所述的方法,其特征在于,所述多條客戶交易記錄中的每條客戶交易記錄包括交易屬性信息包括:客戶消費(fèi)信息和該客戶交易記錄對(duì)應(yīng)的客戶的屬性信息;
所述根據(jù)所述多條客戶交易記錄中每條客戶交易記錄的交易屬性信息,對(duì)所述多個(gè)客戶標(biāo)識(shí)進(jìn)行分類,獲得N個(gè)客戶集合,包括:
使用K-Means算法,根據(jù)所述多條客戶交易記錄中每條客戶交易記錄的交易屬性信息,對(duì)所述多個(gè)客戶標(biāo)識(shí)進(jìn)行分類,獲得N個(gè)客戶集合。
3.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述第一商戶在所述N個(gè)客戶集合中對(duì)應(yīng)的N個(gè)第一占比,以及所述第二商戶在所述N個(gè)客戶集合中對(duì)應(yīng)的N個(gè)第二占比,確定所述第一商戶和所述第二商戶之間的競爭關(guān)系,包括:
根據(jù)所述第一商戶在所述N個(gè)客戶集合中對(duì)應(yīng)的N個(gè)第一占比,確定出所述第一商戶的第一總占比;
根據(jù)所述第二商戶在所述N個(gè)客戶集合中對(duì)應(yīng)的N個(gè)第二占比,確定出所述第二商戶的第二總占比;
根據(jù)所述第一總占比和所述第二總占比,計(jì)算所述第一商戶和所述第二商戶的相似度;
根據(jù)所述相似度確定所述確定所述第一商戶和所述第二商戶之間的競爭關(guān)系。
4.如權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述相似度確定所述確定所述第一商戶和所述第二商戶之間的競爭關(guān)系,包括:
在確定所述相似度大于第一閾值,且所述第一商戶和所述第二商戶為同行業(yè)的情況下,確定所述第一商戶和所述第二商戶為競爭關(guān)系;
在確定所述相似度大于第一閾值,且所述第一商戶和所述第二商戶為不同行業(yè)的情況下,確定所述第一商戶和所述第二商戶為合作關(guān)系;
在確定所述相似度不大于第一閾值,且所述第一商戶和所述第二商戶為同行業(yè)的情況下,確定所述第一商戶和所述第二商戶為合作關(guān)系。
5.如權(quán)利要求4所述的方法,其特征在于,所述在確定所述相似度大于第一閾值,且所述第一商戶和所述第二商戶為同行業(yè)的情況下,確定所述第一商戶和所述第二商戶為競爭關(guān)系,包括:
在確定所述相似度大于所述第一閾值、小于第二閾值,且所述第一商戶和所述第二商戶為同行業(yè)的情況下,確定所述第一商戶和所述第二商戶為普通競爭關(guān)系;其中,所述第二閾值大于所述第一閾值;
在確定所述相似度大于所述第二閾值,且所述第一商戶和所述第二商戶為同行業(yè)的情況下,確定所述第一商戶和所述第二商戶為強(qiáng)競爭關(guān)系。
6.如權(quán)利要求1至5任一權(quán)利要求所述的方法,其特征在于,所述獲取M個(gè)商戶對(duì)應(yīng)的多條客戶交易記錄,包括:
獲取待查詢的所述M個(gè)商戶;
獲取預(yù)設(shè)時(shí)間段內(nèi)所述M個(gè)商戶中每個(gè)商戶對(duì)應(yīng)的所有客戶交易記錄;
對(duì)所述M個(gè)商戶中每個(gè)商戶對(duì)應(yīng)的所有客戶交易記錄進(jìn)行篩選,去除無效的客戶交易記錄,得到所述M個(gè)商戶對(duì)應(yīng)的多條客戶交易記錄。
7.一種基于客戶群體特征的商戶競合關(guān)系分析的裝置,其特征在于,包括:
獲取單元,用于獲取M個(gè)商戶對(duì)應(yīng)的多條客戶交易記錄;其中,所述多條客戶交易記錄中的每條客戶交易記錄包括客戶標(biāo)識(shí)、商戶標(biāo)識(shí)和交易屬性信息;其中,所述M為大于等于2的整數(shù);
統(tǒng)計(jì)單元,用于統(tǒng)計(jì)出所述多條客戶交易記錄對(duì)應(yīng)的多個(gè)客戶標(biāo)識(shí),所述每個(gè)客戶標(biāo)識(shí)對(duì)應(yīng)至少一個(gè)商戶標(biāo)識(shí);
處理單元,用于根據(jù)所述多條客戶交易記錄中每條客戶交易記錄的交易屬性信息,對(duì)所述多個(gè)客戶標(biāo)識(shí)進(jìn)行分類,獲得N個(gè)客戶集合;其中,所述N個(gè)客戶集合的中每個(gè)客戶集合包括所述多個(gè)客戶標(biāo)識(shí)中的至少一個(gè)客戶標(biāo)識(shí);N為大于等于1的正整數(shù);針對(duì)所述N個(gè)客戶集合中的每個(gè)客戶集合:統(tǒng)計(jì)第一商戶的商戶標(biāo)識(shí)在該客戶集合中對(duì)應(yīng)的客戶標(biāo)識(shí)的第一數(shù)量,計(jì)算所述第一數(shù)量在該客戶集合的所有客戶標(biāo)識(shí)的數(shù)量中的第一占比;統(tǒng)計(jì)第二商戶的商戶標(biāo)識(shí)在該客戶集合中對(duì)應(yīng)的客戶標(biāo)識(shí)的第二數(shù)量,計(jì)算所述第二數(shù)量在該客戶集合的所有客戶標(biāo)識(shí)的數(shù)量中的第二占比;其中,所述第一商戶和所述第二商戶為所述M個(gè)商戶中的任兩個(gè)商戶;根據(jù)所述第一商戶在所述N個(gè)客戶集合中對(duì)應(yīng)的N個(gè)第一占比,以及所述第二商戶在所述N個(gè)客戶集合中對(duì)應(yīng)的N個(gè)第二占比,確定所述第一商戶和所述第二商戶之間的競爭關(guān)系。
8.如權(quán)利要求7所述的裝置,其特征在于,所述多條客戶交易記錄中的每條客戶交易記錄包括交易屬性信息包括:客戶消費(fèi)信息和該客戶交易記錄對(duì)應(yīng)的客戶的屬性信息;
所述處理單元,用于:
使用K-Means算法,根據(jù)所述多條客戶交易記錄中每條客戶交易記錄的交易屬性信息,對(duì)所述多個(gè)客戶標(biāo)識(shí)進(jìn)行分類,獲得N個(gè)客戶集合。
9.如權(quán)利要求7所述的裝置,其特征在于,所述處理單元,用于:
根據(jù)所述第一商戶在所述N個(gè)客戶集合中對(duì)應(yīng)的N個(gè)第一占比,確定出所述第一商戶的第一總占比;根據(jù)所述第二商戶在所述N個(gè)客戶集合中對(duì)應(yīng)的N個(gè)第二占比,確定出所述第二商戶的第二總占比;根據(jù)所述第一總占比和所述第二總占比,計(jì)算所述第一商戶和所述第二商戶的相似度;根據(jù)所述相似度確定所述確定所述第一商戶和所述第二商戶之間的競爭關(guān)系。
10.如權(quán)利要求9所述的裝置,其特征在于,還包括處理單元,用于:
在確定所述相似度大于第一閾值,且所述第一商戶和所述第二商戶為同行業(yè)的情況下,確定所述第一商戶和所述第二商戶為競爭關(guān)系;在確定所述相似度大于第一閾值,且所述第一商戶和所述第二商戶為不同行業(yè)的情況下,確定所述第一商戶和所述第二商戶為合作關(guān)系;在確定所述相似度不大于第一閾值,且所述第一商戶和所述第二商戶為同行業(yè)的情況下,確定所述第一商戶和所述第二商戶為合作關(guān)系。
11.如權(quán)利要求10所述的裝置,其特征在于,所述處理單元,用于:
在確定所述相似度大于所述第一閾值、小于第二閾值,且所述第一商戶和所述第二商戶為同行業(yè)的情況下,確定所述第一商戶和所述第二商戶為普通競爭關(guān)系;其中,所述第二閾值大于所述第一閾值;在確定所述相似度大于所述第二閾值,且所述第一商戶和所述第二商戶為同行業(yè)的情況下,確定所述第一商戶和所述第二商戶為強(qiáng)競爭關(guān)系。
12.如權(quán)利要求7至11任一權(quán)利要求所述的裝置,其特征在于,所述獲取單元,用于:
獲取待查詢的所述M個(gè)商戶;獲取預(yù)設(shè)時(shí)間段內(nèi)所述M個(gè)商戶中每個(gè)商戶對(duì)應(yīng)的所有客戶交易記錄;
所述處理單元,用于:
對(duì)所述M個(gè)商戶中每個(gè)商戶對(duì)應(yīng)的所有客戶交易記錄進(jìn)行篩選,去除無效的客戶交易記錄,得到所述M個(gè)商戶對(duì)應(yīng)的多條客戶交易記錄。