本公開涉及人工智能中的深度學習、數(shù)據(jù)處理、推薦算法,尤其涉及一種視頻推薦方法、模型訓練方法、裝置、設備及存儲介質。
背景技術:
1、隨著移動互聯(lián)網(wǎng)技術的飛速發(fā)展,智能手機普及率大幅提升,為短視頻應用程序的興起提供了堅實的基礎。用戶可以隨時隨地通過手機觀看、制作和分享短視頻,極大地提升了內(nèi)容的傳播效率和用戶參與度。在快節(jié)奏的生活中,人們越來越傾向于通過短視頻這種短平快的方式獲取娛樂和放松。短視頻以其短小精悍、內(nèi)容豐富的特點滿足了用戶的碎片化娛樂需求。
2、在當今,大多數(shù)的短視頻應用程序通常都是通過過濾算法分析視頻的內(nèi)容特征為用戶進行視頻的推薦。
3、然而,如何更靈活準確的為用戶推薦視頻,并提高用戶體驗,是本領域的技術問題。
技術實現(xiàn)思路
1、本公開提供了一種用于視頻推薦方法、模型訓練方法、裝置、設備及存儲介質。
2、根據(jù)本公開的第一方面,提供了一種視頻推薦方法,包括:
3、針對于預先獲取的候選視頻集合中的每個候選視頻,根據(jù)目標用戶的歷史觀看數(shù)據(jù),采用預先訓練的精排多目標模型對所述候選視頻進行預測,得到所述候選視頻的推薦指數(shù),所述精排多目標模型是基于預先設定的與用戶偏好關聯(lián)的標簽訓練得到的、用于預測視頻對特定用戶的推薦指數(shù)的模型;
4、對所述候選視頻集合中的候選視頻按照推薦指數(shù)從大到小進行排序,得到推薦列表;
5、將所述推薦列表推送至所述目標用戶。
6、根據(jù)本公開的第二方面,提供了一種模型訓練方法,包括:
7、基于與用戶偏好關聯(lián)的標簽對多個用戶對應的歷史觀看數(shù)據(jù)進行標定,得到多個訓練樣本,所述多個訓練樣本中包括指示推薦的正樣本和指示推薦的負樣本;
8、將所述多個訓練樣本劃分為訓練集和測試集;
9、根據(jù)所述訓練集和所述測試集以及所述標簽,對預先構建的多目標模型進行迭代訓練,得到用于預測視頻對特定用戶的推薦指數(shù)的精排多目標模型。
10、根據(jù)本公開的第三方面,提供了一種視頻推薦裝置,包括:
11、預測單元,用于針對于預先獲取的候選視頻集合中的每個候選視頻,根據(jù)目標用戶的歷史觀看數(shù)據(jù),采用預先訓練的精排多目標模型對所述候選視頻進行預測,得到所述候選視頻的推薦指數(shù),所述精排多目標模型是基于預先設定的與用戶偏好關聯(lián)的標簽訓練得到的、用于預測視頻對特定用戶的推薦指數(shù)的模型;
12、排序單元,用于對所述候選視頻集合中的候選視頻按照推薦指數(shù)從大到小進行排序,得到推薦列表;
13、推送單元,用于將所述推薦列表推送至所述目標用戶。
14、根據(jù)本公開的第四方面,提供了一種模型訓練裝置,包括:
15、標定單元,用于基于與用戶偏好關聯(lián)的標簽對多個用戶對應的歷史觀看數(shù)據(jù)進行標定,得到多個訓練樣本,所述多個訓練樣本中包括指示推薦的正樣本和指示推薦的負樣本;
16、劃分單元,用于將所述多個訓練樣本劃分為訓練集和測試集;
17、訓練單元,用于根據(jù)所述訓練集和所述測試集以及所述標簽,對預先構建的多目標模型進行迭代訓練,得到用于預測視頻對特定用戶的推薦指數(shù)的精排多目標模型。
18、根據(jù)本公開的第五方面,提供了一種電子設備,包括:
19、至少一個處理器;以及
20、與所述至少一個處理器通信連接的存儲器;其中,
21、所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令,所述指令被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行任一方面所述的方法。
22、根據(jù)本公開的第六方面,提供一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其中,所述計算機指令用于使所述計算機執(zhí)行任一方面所述的方法。
23、根據(jù)本公開的第七方面,提供一種計算機程序產(chǎn)品,所述計算機程序產(chǎn)品包括:計算機程序,所述計算機程序存儲在可讀存儲介質中,電子設備的至少一個處理器可以從所述可讀存儲介質讀取所述計算機程序,所述至少一個處理器執(zhí)行所述計算機程序使得電子設備執(zhí)行任一方面所述的方法。
24、根據(jù)本公開的技術解決了如何更靈活準確的為用戶推薦視頻,并提高用戶體驗的問題。
25、應當理解,本部分所描述的內(nèi)容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
1.一種視頻推薦方法,包括:
2.根據(jù)權利要求1所述的方法,其中,所述標簽包括至少兩個播放時長標簽,每個播放時長標簽表示用戶對視頻偏好的停留時間。
3.根據(jù)權利要求2所述的方法,其中,所述根據(jù)目標用戶的歷史觀看數(shù)據(jù),采用預先訓練的精排多目標模型對所述候選視頻進行預測,得到所述候選視頻的推薦指數(shù),包括:
4.根據(jù)權利要求3所述的方法,其中,所述根據(jù)所述候選視頻對應的視頻信息、所述目標用戶信息和所述偏好時長,通過所述精排多目標模型對所述候選視頻對應的多個標簽得分進行計算,包括:
5.根據(jù)權利要求3所述的方法,其中,所述基于所有標簽對應的分數(shù),確定所述候選視頻的推薦指數(shù),包括:
6.根據(jù)權利要求2所述的方法,所述標簽還包括以下至少一個標簽:
7.一種模型訓練方法,包括:
8.根據(jù)權利要求7所述的方法,其中,所述標簽包括至少兩個播放時長標簽,每個播放時長標簽表示用戶對視頻偏好的停留時間。
9.根據(jù)權利要求7所述的方法,還包括:
10.根據(jù)權利要求9所述的方法,其中,所述根據(jù)所述訓練集和所述測試集以及所述標簽,對預先構建的多目標模型進行迭代訓練,得到用于預測視頻對特定用戶的推薦指數(shù)的精排多目標模型,包括:
11.根據(jù)權利要求8所述的方法,所述標簽還包括以下至少一個標簽:
12.一種視頻推薦裝置,包括:
13.根據(jù)權利要求12所述的裝置,其中,所述標簽包括至少兩個播放時長標簽,每個播放時長標簽表示用戶對視頻偏好的停留時間。
14.根據(jù)權利要求13所述的裝置,其中,所述預測單元,包括:
15.根據(jù)權利要求14所述的裝置,其中,所述計算模塊,包括:
16.根據(jù)權利要求14所述的裝置,其中,所述第二確定模塊,包括:
17.根據(jù)權利要求13所述的裝置,其中,所述標簽還包括以下至少一個標簽:
18.一種模型訓練裝置,包括:
19.根據(jù)權利要求18所述的裝置,其中,所述標簽包括至少兩個播放時長標簽,每個播放時長標簽表示用戶對視頻偏好的停留時間。
20.根據(jù)權利要求18所述的裝置,還包括:
21.根據(jù)權利要求20所述的裝置,其中,所述訓練單元,包括:
22.根據(jù)權利要求19所述的裝置,所述標簽還包括以下至少一個標簽:
23.一種電子設備,包括:
24.一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其中,所述計算機指令用于使所述計算機執(zhí)行根據(jù)權利要求1-11中任一項所述的方法。
25.一種計算機程序產(chǎn)品,包括計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)權利要求1-11中任一項所述方法的步驟。