本發(fā)明屬于數(shù)據(jù)分析,具體涉及一種跨境電商數(shù)據(jù)分析方法及裝置。
背景技術(shù):
1、隨著跨境電商業(yè)務(wù)的不斷發(fā)展,商家通過分析消費者評論成為優(yōu)化商品的關(guān)鍵策略。通過深度挖掘評論數(shù)據(jù),商家能夠識別出產(chǎn)品的優(yōu)點與不足,理解消費者的具體需求和偏好。通過利用自然語言處理技術(shù),提取評論中的關(guān)鍵信息和情感傾向,從而定位商品改進的方向。
2、商家利用自然語言處理技術(shù)對商品評論進行情感分析,通過深度解析評論中的正面與負面反饋,商家能夠捕捉消費者對商品的滿意度、喜好與不滿等意見,根據(jù)用戶的使用體驗改進商品。
3、現(xiàn)有技術(shù)中,還存在一些問題,例如:商品數(shù)據(jù)與用戶數(shù)據(jù)的關(guān)聯(lián)性較弱,商品評論的數(shù)據(jù)量不夠豐富,并且對于評論語言分析的精準度較差,導(dǎo)致商家分析評論無法得到有效地改進意見。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的就在于解決商品數(shù)據(jù)與用戶數(shù)據(jù)的關(guān)聯(lián)性較弱,商品評論的數(shù)據(jù)量不夠豐富,并且對于評論語言分析的精準度較差,導(dǎo)致商家分析評論無法得到有效地改進意見的問題,而提出一種跨境電商數(shù)據(jù)分析方法及裝置。
2、在本發(fā)明實施的第一方面,首先提出一種跨境電商數(shù)據(jù)分析方法,所述方法包括:
3、獲取目標(biāo)商品的第一交易數(shù)據(jù),確定所述目標(biāo)商品的同屬商品,并獲取所述同屬商品的第二交易數(shù)據(jù);交易數(shù)據(jù)包括:商品信息和用戶信息;同屬商品為在全部功能標(biāo)簽上實現(xiàn)替代目標(biāo)商品的商品,目標(biāo)商品與同屬商品均包含多個功能標(biāo)簽;
4、將所述第一交易數(shù)據(jù)和所述第二交易數(shù)據(jù)融合得到第三交易數(shù)據(jù),針對所述第三交易數(shù)據(jù)進行預(yù)處理得到目標(biāo)數(shù)據(jù)集;
5、根據(jù)所述目標(biāo)數(shù)據(jù)集確定用戶的隱性需求,根據(jù)所述隱性需求確定替代商品,并獲取所述替代商品的評論得到評論數(shù)據(jù)集;替代商品為在部分功能標(biāo)簽上實現(xiàn)替代目標(biāo)商品的商品,替代商品包含一個功能標(biāo)簽;
6、對所述目標(biāo)數(shù)據(jù)集和所述評論數(shù)據(jù)集進行語言含義檢測得到分析結(jié)果。
7、可選的,針對所述第三交易數(shù)據(jù)進行預(yù)處理得到目標(biāo)數(shù)據(jù)集包括:
8、對所述第三交易數(shù)據(jù)進行預(yù)處理得到目標(biāo)數(shù)據(jù),并根據(jù)所述目標(biāo)數(shù)據(jù)構(gòu)建目標(biāo)異構(gòu)圖,將所述目標(biāo)異構(gòu)圖轉(zhuǎn)換為二維鄰接矩陣;
9、將所述二維鄰接矩陣通過編碼器映射至隱藏變量特征空間中得到隱藏特征向量;所述隱藏特征向量包含均值和方差;
10、將所述隱藏特征向量通過解碼器映射至原始樣本空間得到補償樣本,根據(jù)所述補償樣本重構(gòu)二維鄰接矩陣得到目標(biāo)鄰接矩陣;
11、將所述目標(biāo)鄰接矩陣轉(zhuǎn)換得到目標(biāo)異構(gòu)圖,根據(jù)所述目標(biāo)異構(gòu)圖逆構(gòu)建得到目標(biāo)數(shù)據(jù)集。
12、可選的,根據(jù)所述目標(biāo)數(shù)據(jù)集確定用戶的隱性需求包括:
13、將所述目標(biāo)數(shù)據(jù)集轉(zhuǎn)換為特征向量,并將所述特征向量作為xdeepfm模型的輸入進行隱式特征提取;所述xdeepfm模型包含深度神經(jīng)網(wǎng)絡(luò)和壓縮交互網(wǎng)絡(luò)。
14、可選的,對所述目標(biāo)數(shù)據(jù)集和所述評論數(shù)據(jù)集進行語言含義檢測得到分析結(jié)果包括:
15、針對所述目標(biāo)數(shù)據(jù)集和所述評論數(shù)據(jù)集中的語句進行詞性識別,將語句內(nèi)無意義詞語進行剔除得到語句集合;
16、識別所述語句集合中的目標(biāo)評論和目標(biāo)子評論,對所述目標(biāo)評論和所述目標(biāo)子評論進行詞性分析;
17、計算所述目標(biāo)評論和所述目標(biāo)子評論的情感分數(shù),若所述情感分數(shù)大于判斷閾值,則將所述目標(biāo)評論判定為正常評論得到評論集;
18、根據(jù)所述情感分數(shù)對所述評論集進行評論分類得到分類集合,并將所述分類集合作為分析結(jié)果。
19、可選的,計算所述目標(biāo)評論和所述目標(biāo)子評論的情感分數(shù)包括:
20、通過情感分數(shù)計算公式計算得到情感分數(shù);
21、其中,f為情感分數(shù),為目標(biāo)評論的情感分數(shù),s為屬性相關(guān)度得分,為目標(biāo)子評論的情感分數(shù),α和β為常數(shù)比例系數(shù)均不為零。
22、在本發(fā)明實施的第二方面,提出一種跨境電商數(shù)據(jù)分析裝置,包括:交易數(shù)據(jù)獲取模塊、數(shù)據(jù)預(yù)處理模塊、隱性需求確定模塊和語義分析模塊:
23、所述交易數(shù)據(jù)獲取模塊,用于獲取目標(biāo)商品的第一交易數(shù)據(jù),確定所述目標(biāo)商品的同屬商品,并獲取所述同屬商品的第二交易數(shù)據(jù);交易數(shù)據(jù)包括:商品信息和用戶信息;同屬商品為在全部功能標(biāo)簽上實現(xiàn)替代目標(biāo)商品的商品,目標(biāo)商品與同屬商品均包含多個功能標(biāo)簽;
24、所述數(shù)據(jù)預(yù)處理模塊,用于將所述第一交易數(shù)據(jù)和所述第二交易數(shù)據(jù)融合得到第三交易數(shù)據(jù),針對所述第三交易數(shù)據(jù)進行預(yù)處理得到目標(biāo)數(shù)據(jù)集;
25、所述隱性需求確定模塊,用于根據(jù)所述目標(biāo)數(shù)據(jù)集確定用戶的隱性需求,根據(jù)所述隱性需求確定替代商品,并獲取所述替代商品的評論得到評論數(shù)據(jù)集;替代商品為在部分功能標(biāo)簽上實現(xiàn)替代目標(biāo)商品的商品,替代商品包含一個功能標(biāo)簽;
26、所述語義分析模塊,用于對所述目標(biāo)數(shù)據(jù)集和所述評論數(shù)據(jù)集進行語言含義檢測得到分析結(jié)果。
27、可選的,所述數(shù)據(jù)預(yù)處理模塊包括:異構(gòu)圖構(gòu)建模塊、矩陣編碼映射模塊、矩陣解碼映射模塊和異構(gòu)圖逆構(gòu)建模塊:
28、所述異構(gòu)圖構(gòu)建模塊,用于對所述第三交易數(shù)據(jù)進行預(yù)處理得到目標(biāo)數(shù)據(jù),并根據(jù)所述目標(biāo)數(shù)據(jù)構(gòu)建目標(biāo)異構(gòu)圖,將所述目標(biāo)異構(gòu)圖轉(zhuǎn)換為二維鄰接矩陣;
29、所述矩陣編碼映射模塊,用于將所述二維鄰接矩陣通過編碼器映射至隱藏變量特征空間中得到隱藏特征向量;所述隱藏特征向量包含均值和方差;
30、所述矩陣解碼映射模塊,用于將所述隱藏特征向量通過解碼器映射至原始樣本空間得到補償樣本,根據(jù)所述補償樣本重構(gòu)二維鄰接矩陣得到目標(biāo)鄰接矩陣;
31、所述異構(gòu)圖逆構(gòu)建模塊,用于將所述目標(biāo)鄰接矩陣轉(zhuǎn)換得到目標(biāo)異構(gòu)圖,根據(jù)所述目標(biāo)異構(gòu)圖逆構(gòu)建得到目標(biāo)數(shù)據(jù)集。
32、可選的,所述隱性需求確定模塊還用于:
33、隱式特征提取模塊,用于將所述目標(biāo)數(shù)據(jù)集轉(zhuǎn)換為特征向量,并將所述特征向量作為xdeepfm模型的輸入進行隱式特征提??;所述xdeepfm模型包含深度神經(jīng)網(wǎng)絡(luò)和壓縮交互網(wǎng)絡(luò)。
34、可選的,所述語義分析模塊包括:詞性識別模塊、詞性分析模塊、情感分數(shù)判定模塊和分析結(jié)果獲取模塊:
35、所述詞性識別模塊,用于針對所述目標(biāo)數(shù)據(jù)集和所述評論數(shù)據(jù)集中的語句進行詞性識別,將語句內(nèi)無意義詞語進行剔除得到語句集合;
36、所述詞性分析模塊,用于識別所述語句集合中的目標(biāo)評論和目標(biāo)子評論,通過情感分析工具對所述目標(biāo)評論和所述目標(biāo)子評論進行詞性分析;
37、所述情感分數(shù)判定模塊,用于計算所述目標(biāo)評論和所述目標(biāo)子評論的情感分數(shù),若所述情感分數(shù)大于判斷閾值,則將所述目標(biāo)評論判定為正常評論得到評論集;
38、所述分析結(jié)果獲取模塊,用于根據(jù)所述情感分數(shù)對所述評論集進行評論分類得到分類集合,并將所述分類集合作為分析結(jié)果。
39、可選的,所述情感分數(shù)判定模塊還用于:
40、通過情感分數(shù)計算公式計算得到情感分數(shù);
41、其中,f為情感分數(shù),為目標(biāo)評論的情感分數(shù),s為屬性相關(guān)度得分,為目標(biāo)子評論的情感分數(shù),α和β為常數(shù)比例系數(shù)均不為零。
42、本發(fā)明的有益效果:
43、本發(fā)明提出了一種跨境電商數(shù)據(jù)分析方法,通過獲取目標(biāo)商品的第一交易數(shù)據(jù),確定目標(biāo)商品的同屬商品,并獲取同屬商品的第二交易數(shù)據(jù);將第一交易數(shù)據(jù)和第二交易數(shù)據(jù)融合得到第三交易數(shù)據(jù),針對第三交易數(shù)據(jù)進行預(yù)處理得到目標(biāo)數(shù)據(jù)集;根據(jù)目標(biāo)數(shù)據(jù)集確定用戶的隱性需求,根據(jù)隱性需求確定替代商品,并獲取替代商品的評論得到評論數(shù)據(jù)集;對目標(biāo)數(shù)據(jù)集和評論數(shù)據(jù)集進行語言含義檢測得到分析結(jié)果;通過結(jié)合用戶隱性需求分析確定替代商品評論,增加數(shù)據(jù)量的豐富度,有效增強了商品數(shù)據(jù)與用戶數(shù)據(jù)的關(guān)聯(lián)性,使得評論語義分析結(jié)果更精準。