本發(fā)明涉及互聯(lián)網(wǎng),特別是涉及一種數(shù)據(jù)處理、召回方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、不同用戶可能偏好在不同的場景下進(jìn)行消費(fèi),例如,用戶1偏好在場景1進(jìn)行消費(fèi),用戶2偏好在場景2進(jìn)行消費(fèi),等等。但在實(shí)際應(yīng)用過程中,也有偏好在一場景下進(jìn)行消費(fèi)的用戶在另一場景下進(jìn)行消費(fèi)的情況。不難理解,用戶偏好在一場景進(jìn)行消費(fèi),則在該場景下消費(fèi)的時(shí)間一般較長,而在另一些場景消費(fèi)的時(shí)間一般比較短。
2、若將用戶消費(fèi)時(shí)間較短的場景理解為弱勢消費(fèi)場景,弱勢消費(fèi)場景因消費(fèi)數(shù)據(jù)較少,并不能很好地獲取用戶的興趣偏好,如此會(huì)導(dǎo)致向用戶推薦的精度較低。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明實(shí)施例的目的在于提供一種數(shù)據(jù)處理、召回方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),以提高向用戶推薦的精度。具體技術(shù)方案如下:
2、第一方面,提供了一種數(shù)據(jù)處理方法,包括:
3、獲取參考推薦場景下的目標(biāo)賬戶的第一消費(fèi)數(shù)據(jù)和待推薦場景下的待召回?cái)?shù)據(jù);
4、確定所述第一消費(fèi)數(shù)據(jù)和所述待召回?cái)?shù)據(jù)的特征信息;
5、計(jì)算所述第一消費(fèi)數(shù)據(jù)的特征信息與所述待召回?cái)?shù)據(jù)的特征信息的相似度,并基于所述第一消費(fèi)數(shù)據(jù)的特征信息與所述待召回?cái)?shù)據(jù)的特征信息的相似度的順序,確定第一消費(fèi)數(shù)據(jù)關(guān)聯(lián)的待召回?cái)?shù)據(jù)。
6、可選地,所述待召回?cái)?shù)據(jù)包括:所述目標(biāo)賬戶在所述待推薦場景下的第二消費(fèi)數(shù)據(jù);
7、所述確定所述第一消費(fèi)數(shù)據(jù)和所述待召回?cái)?shù)據(jù)的特征信息,包括:
8、確定所述第一消費(fèi)數(shù)據(jù)和所述第二消費(fèi)數(shù)據(jù)的特征信息;
9、所述計(jì)算所述第一消費(fèi)數(shù)據(jù)的特征信息與所述待召回?cái)?shù)據(jù)的特征信息的相似度,并基于所述第一消費(fèi)數(shù)據(jù)的特征信息與所述待召回?cái)?shù)據(jù)的特征信息的相似度的順序,從所述待召回?cái)?shù)據(jù)中確定目標(biāo)召回?cái)?shù)據(jù),包括:
10、計(jì)算所述第一消費(fèi)數(shù)據(jù)的特征信息與所述第二消費(fèi)數(shù)據(jù)的特征信息的相似度,并基于所述第一消費(fèi)數(shù)據(jù)的特征信息與所述第二消費(fèi)數(shù)據(jù)的特征信息的相似度的順序,從所述第二消費(fèi)數(shù)據(jù)中確定目標(biāo)召回?cái)?shù)據(jù)。
11、可選地,所述特征信息包括嵌入特征;
12、所述確定所述第一消費(fèi)數(shù)據(jù)和所述第二消費(fèi)數(shù)據(jù)的特征信息,包括:
13、將所述第一消費(fèi)數(shù)據(jù)和所述第二消費(fèi)數(shù)據(jù)按照消費(fèi)時(shí)間進(jìn)行排序;
14、將每兩個(gè)相鄰的消費(fèi)數(shù)據(jù)作為一個(gè)樣本對(duì),并計(jì)算每一樣本對(duì)對(duì)應(yīng)的權(quán)重;
15、以每一樣本對(duì)中的每一消費(fèi)數(shù)據(jù)作為中心點(diǎn)數(shù)據(jù),將所有與所述中心點(diǎn)數(shù)據(jù)組成樣本對(duì)的消費(fèi)數(shù)據(jù)聚合至一個(gè)組合,作為鄰居節(jié)點(diǎn)組合;
16、針對(duì)每一中心點(diǎn)數(shù)據(jù),將所述中心點(diǎn)數(shù)據(jù)與所述鄰居節(jié)點(diǎn)組合中消費(fèi)數(shù)據(jù)作為訓(xùn)練樣本;
17、將所述訓(xùn)練樣本作為圖注意力模型gat的輸入,調(diào)整所述圖注意力模型gat中圖注意力層的特征向量,并在所述圖注意力模型gat輸出為所述中心點(diǎn)數(shù)據(jù)時(shí),將所述圖注意力模型gat中圖注意力層的特征向量作為所述中心點(diǎn)數(shù)據(jù)的嵌入特征。
18、可選地,在所述以每一樣本對(duì)中的每一消費(fèi)數(shù)據(jù)作為中心點(diǎn)數(shù)據(jù),將所有與所述中心點(diǎn)數(shù)據(jù)組成樣本對(duì)的消費(fèi)數(shù)據(jù)聚合至一個(gè)組合,作為鄰居節(jié)點(diǎn)組合之后,所述方法還包括:
19、基于所述鄰居節(jié)點(diǎn)組合中消費(fèi)數(shù)據(jù)的個(gè)數(shù)和/或所述中心點(diǎn)數(shù)據(jù)和所述鄰居節(jié)點(diǎn)組合中消費(fèi)數(shù)據(jù)對(duì)應(yīng)的樣本對(duì)的權(quán)重,從所述鄰居節(jié)點(diǎn)組合中選取目標(biāo)鄰居數(shù)據(jù);
20、針對(duì)每一中心點(diǎn)數(shù)據(jù),將所述中心點(diǎn)數(shù)據(jù)與所述目標(biāo)鄰居數(shù)據(jù)作為測試樣本;
21、在所述將所述訓(xùn)練樣本作為圖注意力模型gat的輸入,調(diào)整所述圖注意力模型gat中圖注意力層的特征向量之后,所述方法還包括:
22、將所述測試樣本作為圖注意力模型gat的輸入,調(diào)整所述圖注意力模型gat中圖注意力層的特征向量,并在所述圖注意力模型gat輸出為所述中心點(diǎn)數(shù)據(jù)時(shí),將所述圖注意力模型gat中圖注意力層的特征向量作為所述中心點(diǎn)數(shù)據(jù)的嵌入特征。
23、可選地,所述基于所述第一消費(fèi)數(shù)據(jù)的特征信息與所述待召回?cái)?shù)據(jù)的特征信息的相似度的順序,從所述待召回?cái)?shù)據(jù)中確定目標(biāo)召回?cái)?shù)據(jù),包括:
24、基于所述第一消費(fèi)數(shù)據(jù)的特征信息與所述待召回?cái)?shù)據(jù)的特征信息的相似度的順序,生成以所述第一消費(fèi)數(shù)據(jù)的標(biāo)識(shí)作為關(guān)鍵字、并以所述目標(biāo)召回?cái)?shù)據(jù)作為所述關(guān)鍵字對(duì)應(yīng)的值的倒排數(shù)據(jù)。
25、可選地,所述參考推薦場景為長視頻場景,所述待推薦場景為短視頻場景。
26、第二方面,提供了一種數(shù)據(jù)召回方法,包括:
27、響應(yīng)于客戶端發(fā)送的數(shù)據(jù)召回請(qǐng)求,確定目標(biāo)賬戶在參考推薦場景下的消費(fèi)數(shù)據(jù),所述數(shù)據(jù)召回請(qǐng)求用于請(qǐng)求待推薦場景下的數(shù)據(jù);
28、查找所述消費(fèi)數(shù)據(jù)關(guān)聯(lián)的待召回?cái)?shù)據(jù),并將所述消費(fèi)數(shù)據(jù)關(guān)聯(lián)的待召回?cái)?shù)據(jù)作為所述目標(biāo)賬戶在待推薦場景下的第一目標(biāo)召回?cái)?shù)據(jù),其中,消費(fèi)數(shù)據(jù)關(guān)聯(lián)的待召回?cái)?shù)據(jù)根據(jù)第一方面任一項(xiàng)所述的數(shù)據(jù)處理方法而得到。
29、可選地,所述確定目標(biāo)賬戶在參考推薦場景下的消費(fèi)數(shù)據(jù),包括:
30、確定所述目標(biāo)賬戶在參考推薦場景下的用戶偏好數(shù)據(jù),所述用戶偏好數(shù)據(jù)是所述消費(fèi)數(shù)據(jù)中用戶的感興趣數(shù)據(jù)。
31、可選地,所述待推薦場景包括所述目標(biāo)賬戶消費(fèi)時(shí)長小于預(yù)設(shè)時(shí)長的場景或消費(fèi)數(shù)據(jù)小于預(yù)設(shè)數(shù)量的場景;
32、所述確定目標(biāo)賬戶在參考推薦場景下的消費(fèi)數(shù)據(jù),包括:
33、確定所述目標(biāo)賬戶消費(fèi)時(shí)長最長的場景作為參考推薦場景;
34、確定所述目標(biāo)賬戶在所述消費(fèi)時(shí)長最長的場景下的消費(fèi)數(shù)據(jù)。
35、可選地,在查找所述消費(fèi)數(shù)據(jù)關(guān)聯(lián)的待召回?cái)?shù)據(jù)之后,所述方法還包括:
36、確定所述待推薦場景下的數(shù)據(jù)中、與所述待召回?cái)?shù)據(jù)的屬性匹配的匹配數(shù)據(jù),將所述匹配數(shù)據(jù)作為所述目標(biāo)賬戶在待推薦場景下的第二目標(biāo)召回?cái)?shù)據(jù);
37、和/或,
38、確定所述待推薦場景下的數(shù)據(jù)中、與目標(biāo)賬戶在參考推薦場景下的消費(fèi)數(shù)據(jù)的屬性匹配的匹配數(shù)據(jù),將所述匹配數(shù)據(jù)作為所述目標(biāo)賬戶在待推薦場景下的第三目標(biāo)召回?cái)?shù)據(jù)。
39、第三方面,提供了一種數(shù)據(jù)處理裝置,包括:
40、獲取模塊,用于獲取參考推薦場景下的目標(biāo)賬戶的第一消費(fèi)數(shù)據(jù)和待推薦場景下的待召回?cái)?shù)據(jù);
41、第一確定模塊,用于確定所述第一消費(fèi)數(shù)據(jù)和所述待召回?cái)?shù)據(jù)的特征信息;
42、第二確定模塊,用于計(jì)算所述第一消費(fèi)數(shù)據(jù)的特征信息與所述待召回?cái)?shù)據(jù)的特征信息的相似度,并基于所述第一消費(fèi)數(shù)據(jù)的特征信息與所述待召回?cái)?shù)據(jù)的特征信息的相似度的順序,確定第一消費(fèi)數(shù)據(jù)關(guān)聯(lián)的待召回?cái)?shù)據(jù)。
43、第四方面,提供了一種數(shù)據(jù)召回裝置,包括:
44、第三確定模塊,用于響應(yīng)于客戶端發(fā)送的數(shù)據(jù)召回請(qǐng)求,確定目標(biāo)賬戶在參考推薦場景下的消費(fèi)數(shù)據(jù),所述數(shù)據(jù)召回請(qǐng)求用于請(qǐng)求待推薦場景下的數(shù)據(jù);
45、查找模塊,用于查找所述消費(fèi)數(shù)據(jù)關(guān)聯(lián)的待召回?cái)?shù)據(jù),并將所述消費(fèi)數(shù)據(jù)關(guān)聯(lián)的待召回?cái)?shù)據(jù)作為所述目標(biāo)賬戶在待推薦場景下的第一目標(biāo)召回?cái)?shù)據(jù),其中,消費(fèi)數(shù)據(jù)關(guān)聯(lián)的待召回?cái)?shù)據(jù)根據(jù)第三方面所述的數(shù)據(jù)處理裝置而得到。
46、第五方面,提供了一種電子設(shè)備,包括處理器、通信接口、存儲(chǔ)器和通信總線,其中,處理器,通信接口,存儲(chǔ)器通過通信總線完成相互間的通信;
47、存儲(chǔ)器,用于存放計(jì)算機(jī)程序;
48、處理器,用于執(zhí)行存儲(chǔ)器上所存放的程序時(shí),實(shí)現(xiàn)第一方面或第二方面任一所述的方法步驟。
49、在本發(fā)明實(shí)施的又一方面,還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)內(nèi)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述任一所述的數(shù)據(jù)處理方法或數(shù)據(jù)召回方法。
50、在本發(fā)明實(shí)施的又一方面,還提供了一種包含指令的計(jì)算機(jī)程序產(chǎn)品,當(dāng)其在計(jì)算機(jī)上運(yùn)行時(shí),使得計(jì)算機(jī)執(zhí)行上述任一所述的數(shù)據(jù)處理方法或數(shù)據(jù)召回方法。
51、本發(fā)明實(shí)施例中,通過確定目標(biāo)賬戶在參考推薦場景下的消費(fèi)數(shù)據(jù)的特征信息和待推薦場景下的待推薦數(shù)據(jù)的特征信息,并基于消費(fèi)數(shù)據(jù)的特征信息與待推薦數(shù)據(jù)的特征信息的相似度的順序,基于第一消費(fèi)數(shù)據(jù)的特征信息與待召回?cái)?shù)據(jù)的特征信息的相似度的順序,確定第一消費(fèi)數(shù)據(jù)關(guān)聯(lián)的待召回?cái)?shù)據(jù),也即建立用戶在參考推薦場景下的消費(fèi)數(shù)據(jù)與待推薦場景下的待推薦數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,如此使得在待推薦場景下,可以基于用戶在參考推薦場景下的消費(fèi)數(shù)據(jù),通過用戶在參考推薦場景下的消費(fèi)數(shù)據(jù)與待推薦場景下的待推薦數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,確定召回?cái)?shù)據(jù),如此,在待推薦場景下向用戶的推薦利用了用戶在參考推薦場景下的數(shù)據(jù),提高了向用戶推薦的精度。即使用戶在待推薦場景下消費(fèi)數(shù)據(jù)比較少,也能夠很好地獲取用戶興趣偏好,提高了向用戶推薦的精度。