欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

自動推薦內(nèi)容的制作方法

文檔序號:7792302閱讀:259來源:國知局
自動推薦內(nèi)容的制作方法
【專利摘要】提供通過預(yù)測推薦每個視頻將滿足一定目標(biāo)的程度來選擇哪些視頻被推薦給用戶的技術(shù)。為了預(yù)測,訓(xùn)練機(jī)器學(xué)習(xí)引擎既被提供協(xié)作過濾參數(shù)值,又被提供基于內(nèi)容的過濾參數(shù)值。在視頻到視頻推薦的情況下,協(xié)作過濾參數(shù)值可以基于視頻對,該視頻對包括用戶已經(jīng)對其表現(xiàn)出興趣的視頻。機(jī)器學(xué)習(xí)引擎產(chǎn)生對每個視頻的機(jī)器-學(xué)習(xí)分?jǐn)?shù)。機(jī)器學(xué)習(xí)分?jǐn)?shù)被用作選擇哪些視頻推薦給特定用戶的基礎(chǔ)。
【專利說明】自動推薦內(nèi)容

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及自動推薦,更具體地,涉及一種用來向用戶自動推薦內(nèi)容的系統(tǒng)。

【背景技術(shù)】
[0002]已經(jīng)日益常見的是,將諸如視頻資產(chǎn)之類的內(nèi)容在網(wǎng)絡(luò)上傳送給用戶。電影、電視劇、家庭視頻、做法視頻、及音樂視頻僅僅是視頻資產(chǎn)的類型的少量例子,這些視頻資產(chǎn)當(dāng)前在互聯(lián)網(wǎng)、電話網(wǎng)絡(luò)、內(nèi)部網(wǎng)絡(luò)、有線連接等上提供。在網(wǎng)絡(luò)上已經(jīng)得到的視頻資產(chǎn)可在整個視頻資產(chǎn)已經(jīng)下載之后或者隨著視頻資產(chǎn)正在傳送(傳輸)而播放。
[0003]鑒于適于消費的視頻資產(chǎn)過多,已經(jīng)日益重要的是幫助用戶識別最可能使他們感興趣的那些視頻資產(chǎn)。例如,關(guān)于向用戶推薦用戶高度感興趣的十部視頻的系統(tǒng),比關(guān)于僅僅提供在百萬較小興趣視頻中搜索這相同十部視頻的工具的系統(tǒng),用戶將具有好得多的體驗。
[0004]各種手段已經(jīng)用來向用戶推薦視頻資產(chǎn),這些手段各自具有一定缺陷。例如,一種“趨勢”手段是保持跟蹤哪些視頻資產(chǎn)由整體的用戶人口最多地消費,并且將那些消費最多的視頻資產(chǎn)推薦給所有用戶。另一種趨勢手段是保持跟蹤那些視頻在整個用戶人口中當(dāng)前正經(jīng)歷一波興趣,并且將這些視頻推薦給所有用戶。這些“一只鞋子適合所有人”的趨勢手段,對于具有與平均用戶相對應(yīng)的興趣的用戶還可以,但不是對于所有用戶都適用。
[0005]“視頻到視頻(video-to-video) ”手段是向每個用戶推薦與該用戶剛剛消費的視頻資產(chǎn)共同具有某些內(nèi)容的視頻資產(chǎn)。例如,在用戶已經(jīng)消費電影X之后,可以向用戶呈現(xiàn):與電影X呈相同種類的、具有與電影X相同的主要演員的、具有與電影X相同的導(dǎo)演的、來自與電影X相同的時期的等等的電影的推薦?!耙曨l到視頻”手段當(dāng)用戶具有狹窄范圍的興趣時還可以,但當(dāng)用戶對于特定類型的視頻已經(jīng)變得滿足并且用戶現(xiàn)在想消費不同的視頻時,不太適用。
[0006]用來推薦視頻資產(chǎn)的“用戶到視頻(user-to-video) ”手段涉及相對于時間監(jiān)視用戶的資產(chǎn)消費行為?;谟脩舻囊曨l消費歷史,可以得出用戶的一般興趣。這些得出興趣然后可以用來識別用戶可能感興趣的其它視頻,這些其它視頻可以作為推薦而供給。用戶到視頻手段可以適用,只要用戶的消費歷史準(zhǔn)確地反映用戶的當(dāng)前興趣。然而,如果用戶不具有充足的歷史,或者用戶當(dāng)前感興趣的是與用戶過去消費的視頻不同的某些視頻,則基于用戶到視頻的推薦就不是特別有用。
[0007]本文中描述的手段是可實現(xiàn)的手段,但不一定是以前已經(jīng)想到或?qū)崿F(xiàn)的手段。因此,除非另外指示,否則不應(yīng)該假定:本文中描述的手段的任一種僅僅因為它們在本部分中被描述而看作現(xiàn)有技術(shù)。

【專利附圖】

【附圖說明】
[0008]在附圖中:
[0009]圖1是根據(jù)本發(fā)明實施例的方塊圖,該方塊圖表明機(jī)器學(xué)習(xí)引擎如何可以用來預(yù)測對于視頻的興趣分?jǐn)?shù);
[0010]圖2是根據(jù)本發(fā)明實施例的方塊圖,該方塊圖表明各種類型的元數(shù)據(jù),這些元數(shù)據(jù)可以由推薦系統(tǒng)保持;
[0011]圖3是根據(jù)本發(fā)明實施例的方塊圖,該方塊圖表明對于模型調(diào)諧參數(shù)的不同值,多個分?jǐn)?shù)如何可以供給到機(jī)器學(xué)習(xí)引擎中;
[0012]圖4是根據(jù)本發(fā)明實施例的方塊圖,該方塊圖表明產(chǎn)生多個不同分?jǐn)?shù)分量、和基于目的而組合分量分?jǐn)?shù);及
[0013]圖5是根據(jù)本發(fā)明實施例的計算機(jī)系統(tǒng)的方塊圖,該計算機(jī)系統(tǒng)可以用來實施視頻推薦系統(tǒng)。

【具體實施方式】
[0014]如下描述中,為了解釋的目的,敘述多個具體細(xì)節(jié),以便提供本發(fā)明的徹底理解。然而,顯然,可以實踐本發(fā)明而不用這些具體細(xì)節(jié)。其它情況下,熟知結(jié)構(gòu)和裝置以方塊圖形式表示,以便避免不必要地使本發(fā)明模糊。
[0015]一般概要
[0016]提供向用戶推薦視頻資產(chǎn)的技術(shù),其中對于每個候選視頻預(yù)測向用戶推薦該候選視頻可能滿足目的的程度。在所述目的是用戶約定的情況下,預(yù)測可以指示用戶可能對該候選視頻感興趣的程度。根據(jù)本發(fā)明的一個方面,訓(xùn)練機(jī)器學(xué)習(xí)引擎既供給有協(xié)作過濾(collaborative filtering, CF)參數(shù)值,又供給有基于內(nèi)容的過濾(content-basedfiltering, CBF)參數(shù)值。基于輸入?yún)?shù)值,機(jī)器學(xué)習(xí)引擎產(chǎn)生機(jī)器-學(xué)習(xí)分?jǐn)?shù)(“ML分?jǐn)?shù)”),該機(jī)器-學(xué)習(xí)分?jǐn)?shù)反映向用戶推薦特定視頻將滿足特定目的的程度。在所述目的是滿足用戶的觀看興趣的情況下,ML分?jǐn)?shù)是特定用戶可能對觀看視頻多么感興趣的預(yù)測。
[0017]為了解釋說明,對其產(chǎn)生ML分?jǐn)?shù)的用戶這里稱作“目標(biāo)用戶”,并且對其產(chǎn)生ML分?jǐn)?shù)的視頻這里稱作“目標(biāo)視頻”。在一個實施例中,對于在一組候選視頻中的每個視頻產(chǎn)生的ML分?jǐn)?shù),作為從候選視頻中選擇哪些視頻推薦給目標(biāo)用戶的基礎(chǔ)。
[0018]當(dāng)產(chǎn)生ML分?jǐn)?shù)時,每個輸入?yún)?shù)影響ML分?jǐn)?shù)的程度可能變化。例如,最近添加到收集庫中的視頻可能不具有顯著量的消費歷史。因此,與消費歷史有關(guān)的參數(shù)對于ML分?jǐn)?shù)具有比視頻本身的特征(例如,長度、題材、標(biāo)簽)更小的影響。另一方面,對于具有長消費歷史的視頻,與消費歷史有關(guān)的參數(shù)對于ML分?jǐn)?shù)可能具有較顯著的影響。一個實施例中,機(jī)器學(xué)習(xí)引擎產(chǎn)生ML分?jǐn)?shù)以及哪些特征對ML分?jǐn)?shù)具有最大肯定影響的指示。基于這種信息,關(guān)于每種視頻推薦,可以向用戶提供為什么正將該特定視頻推薦給他們的解釋。
[0019]視頻到視頻推薦
[0020]視頻到視頻推薦是指基于用戶對特定視頻的興趣的指示的視頻推薦。例如,如果用戶已經(jīng)觀看、瀏覽、或高度評價特定視頻,則可以假定:用戶對該特定視頻有興趣。基于該興趣,推薦系統(tǒng)可以向用戶推薦其它視頻。為了說明,用戶已經(jīng)指示對其感興趣的視頻這里稱作“比較”視頻。
[0021]使用機(jī)器學(xué)習(xí)將協(xié)作過濾與基于內(nèi)容的過濾相結(jié)合
[0022]參照圖1,它表明使用訓(xùn)練機(jī)器學(xué)習(xí)引擎102來產(chǎn)生候選視頻資產(chǎn)的ML分?jǐn)?shù)150的系統(tǒng)。機(jī)器學(xué)習(xí)引擎102基于輸入饋送106產(chǎn)生ML分?jǐn)?shù)150,該輸入饋送106特定于用戶/視頻組合。輸入饋送106包括幾種類型的輸入?yún)?shù)。在表明的實施例中,輸入饋送106包括協(xié)作過濾(CF)輸入108、基于內(nèi)容的過濾(CBF)輸入110、以及其它輸入112。這些輸入的每一種將在以后更詳細(xì)地描述。
[0023]協(xié)作過濾(CF)輸入
[0024]協(xié)作過濾輸入108是與用戶觀點或行為有關(guān)的任何輸入。協(xié)作過濾基于如下假定:關(guān)于一種東西具有類似觀點的兩個人關(guān)于另一種東西可能具有類似觀點。在預(yù)測用戶對視頻資產(chǎn)的興趣的情形中,協(xié)作過濾假定:如果目標(biāo)用戶已經(jīng)與另一個用戶喜歡觀看相同視頻的幾個,那么目標(biāo)用戶可能喜歡觀看其它用戶喜歡了的、但目標(biāo)用戶還未看過的視頻。
[0025]關(guān)于用戶的觀點的信息可以按各種方式得到或得出。例如,用戶感興趣的視頻類型隱含地反映在用戶的視頻觀看歷史中。因而,協(xié)作過濾輸入108可以包括關(guān)于目標(biāo)用戶的視頻觀看歷史、與目標(biāo)用戶類似的用戶的觀看歷史、及/或整個觀眾人群的觀看歷史的數(shù)據(jù)。
[0026]假定具有類似人口統(tǒng)計特性的用戶將具有類似視頻觀看興趣,協(xié)作過濾輸入108也可以包括人口統(tǒng)計信息。這樣的人口統(tǒng)計信息可以包括例如用戶的年齡、性別、地理位置、收入階層等等。協(xié)作過濾輸入108也可以包括用戶通過例如填寫視頻愛好調(diào)查或評價以前觀看視頻而已經(jīng)清晰識別的興趣。
[0027]在視頻到視頻推薦的情形中,CF輸入108可以明確地指示用戶行為,因為它與比較視頻/目標(biāo)視頻對(“視頻對”)有關(guān)。下文詳細(xì)地描述對于視頻對可以保持的各種類型的CF度量的例子。
[0028]在圖1中表明的實施例中,機(jī)器學(xué)習(xí)引擎102既被提供原始CF特征120,又被提供由CF分析器118基于原始CF特征產(chǎn)生的CF分?jǐn)?shù)124。CF分?jǐn)?shù)是由CF分析器118對將目標(biāo)視頻提供給用戶將滿足目的的程度的預(yù)測,該CF分析器118實施協(xié)作過濾算法。為了說明清楚,將假定:所述目的是滿足目標(biāo)觀眾的觀看興趣。然而,如下文將更詳細(xì)描述的那樣,所述目標(biāo)目的可以是除滿足觀眾的興趣之外的某些東西,或者可以是滿足觀眾的興趣和一個或多個其它目的的組合。
[0029]如圖1顯而易見的,代之以簡單地將CF分?jǐn)?shù)124用作目標(biāo)用戶對目標(biāo)視頻的興趣的預(yù)測,CF分?jǐn)?shù)124僅是饋送到機(jī)器學(xué)習(xí)引擎102中以產(chǎn)生ML分?jǐn)?shù)150的幾個輸入之一。終究,機(jī)器學(xué)習(xí)引擎102確定CF分?jǐn)?shù)124在產(chǎn)生ML分?jǐn)?shù)150時應(yīng)該加權(quán)多重,該ML分?jǐn)?shù)150被用作選擇要推薦那些視頻的基礎(chǔ)。
[0030]基于內(nèi)容的過濾(CBF)輸入
[0031]基于內(nèi)容的過濾輸入110是與目標(biāo)視頻的內(nèi)容與其它視頻的內(nèi)容多么類似有關(guān)的任何輸入。為了說明清楚,將描述產(chǎn)生視頻到視頻推薦的實施例。因而,基于內(nèi)容的過濾輸入聚焦在視頻對之間的相似性,該視頻對包括目標(biāo)視頻和比較視頻。然而,在可選擇實施例中,基于內(nèi)容的過濾輸入110可以包括用于任何數(shù)量的其它視頻(如目標(biāo)用戶最近觀看、瀏覽、或評價的視頻組)的特征信息。
[0032]如以上提到的那樣,比較視頻典型地是目標(biāo)用戶已經(jīng)指示對其的興趣的視頻。例如,比較視頻可以是目標(biāo)用戶最近觀看的、或?qū)ζ淠繕?biāo)用戶最近給出高度評價的視頻。
[0033]類似于協(xié)作過濾輸入108,基于內(nèi)容的過濾輸入110也包括從原始輸入得出的分?jǐn)?shù)。具體地,基于內(nèi)容的過濾輸入I1包括原始CBF特征126、和CBF分?jǐn)?shù)130,該CBF分?jǐn)?shù)130由CBF分析器128基于原始CBF特征126而產(chǎn)生。原始CBF特征126可以包括與目標(biāo)視頻和比較視頻有關(guān)的任何數(shù)量的特征。例如,原始CBF特征126可以包括諸如標(biāo)題、題材、持續(xù)時間、演員、關(guān)鍵字、標(biāo)簽等等之類的特征。
[0034]CBF分?jǐn)?shù)130是目標(biāo)視頻與比較視頻多么相似的估計。推定地,CBF分?jǐn)?shù)130越高,在目標(biāo)視頻與比較視頻之間的相似性越大。盡管一些系統(tǒng)使用CBF分?jǐn)?shù)作為用來選擇待推薦的視頻的唯一基礎(chǔ),但在圖1中表明的實施例中,CBF分?jǐn)?shù)130僅僅是饋送到機(jī)器學(xué)習(xí)引擎102的多個輸入?yún)?shù)之一。在得出ML分?jǐn)?shù)150時,給予CBF分?jǐn)?shù)130的實際權(quán)重將基于到機(jī)器學(xué)習(xí)引擎102的其它輸入和訓(xùn)練組(借助于該訓(xùn)練組,訓(xùn)練機(jī)器學(xué)習(xí)引擎102)而變化。
[0035]到機(jī)器學(xué)習(xí)引擎的其它輸入
[0036]其它輸入112的類型和性質(zhì)實際上沒有限制,這些其它輸入112可以饋送到機(jī)器學(xué)習(xí)引擎102,以提高M(jìn)L分?jǐn)?shù)150的準(zhǔn)確度。例如,其它輸入可以包括每天要給予推薦的時間、每周要給予推薦的周幾、目標(biāo)用戶的連接速度等。
[0037]機(jī)器學(xué)習(xí)(ML)分?jǐn)?shù)
[0038]基于協(xié)作過濾輸入108、基于內(nèi)容的過濾輸入110及任何數(shù)量的其它輸入112,機(jī)器學(xué)習(xí)引擎102產(chǎn)生ML分?jǐn)?shù)150。ML分?jǐn)?shù)150的值是將目標(biāo)視頻提供給用戶將多好地滿足特定目的或目的組的預(yù)測。在所述目的是用戶約定的實施例中,ML分?jǐn)?shù)150是目標(biāo)用戶將對觀看目標(biāo)視頻具有多大興趣的預(yù)測。
[0039]對于在一組候選視頻中的每個視頻,重復(fù)產(chǎn)生ML分?jǐn)?shù)的過程?;谒鼈兊南鄳?yīng)ML分?jǐn)?shù),將目標(biāo)用戶可能對其具有最大興趣的候選視頻選擇成呈現(xiàn)給目標(biāo)用戶作為推薦視頻。
[0040]按圖1表明的方式將協(xié)作過濾(CF)與基于內(nèi)容的過濾(CBF)相組合,可享有每種技術(shù)的優(yōu)勢。具體地說,將由CF/CBF分析器產(chǎn)生的判斷、與來自CF/CBF的原始特征一起直接暴露于機(jī)器學(xué)習(xí)引擎102。使機(jī)器學(xué)習(xí)引擎102接觸到原始特征可以提供幾個好處。
[0041]首先,將原始特征與CF/CBF分?jǐn)?shù)一起提供給ML系統(tǒng),允許ML系統(tǒng)分別基于來自CF和CBF的信號強度而組合分?jǐn)?shù)。就是說,給予CF/CBF分?jǐn)?shù)的相對權(quán)重將基于饋送到ML系統(tǒng)的其它輸入逐個迭代而變化。例如,對于不具有足夠行為數(shù)據(jù)的新電影,CF的信號強度很弱。因此,ML系統(tǒng)當(dāng)產(chǎn)生ML分?jǐn)?shù)時將把較小權(quán)重給予CF分?jǐn)?shù)。因此,在ML分?jǐn)?shù)中強調(diào)基于內(nèi)容的特征。隨著視頻由更多人觀看,行為數(shù)據(jù)將增加,當(dāng)產(chǎn)生ML分?jǐn)?shù)時,由ML系統(tǒng)給予CF分?jǐn)?shù)的權(quán)重也將增加。
[0042]第二,暴露原始CBF特征允許ML系統(tǒng)基于歷史CF和CBF學(xué)習(xí)全體而有效地解決新內(nèi)容問題。例如,ML系統(tǒng)可學(xué)習(xí)到,共享諸如‘a(chǎn)’、‘the’之類的關(guān)鍵字的視頻不一定相關(guān),而共孚諸如‘football’、‘49ers’之類的關(guān)鍵字的其它視頻可能指不較強關(guān)系。因此,當(dāng)產(chǎn)生ML分?jǐn)?shù)時,弱的非特定字所導(dǎo)致的很高的CBF分?jǐn)?shù)被機(jī)器學(xué)習(xí)引擎102給予較小權(quán)重;當(dāng)產(chǎn)生ML分?jǐn)?shù)時,高度特定字所導(dǎo)致而很高的CBF分?jǐn)?shù)被ML系統(tǒng)給予較大權(quán)重。
[0043]可解釋的推薦
[0044]根據(jù)一個實施例,除向目標(biāo)用戶呈現(xiàn)一組一個或多個推薦視頻之外,推薦系統(tǒng)也向該用戶呈現(xiàn)關(guān)于為什么視頻的每個正被推薦的信息。具體地,在一個實施例中,機(jī)器學(xué)習(xí)引擎102提供輸出152,該輸出152指示最肯定地影響每個ML分?jǐn)?shù)150的特征。例如,輸出152可以指示,目標(biāo)視頻因為CF分?jǐn)?shù)124很高,并且基于其它輸入,CF分?jǐn)?shù)124在ML分?jǐn)?shù)150的產(chǎn)生中被重重地加權(quán),而接收了高M(jìn)L分?jǐn)?shù)150。另一方面,用于目標(biāo)視頻的輸出152可以指示,CBF分?jǐn)?shù)很高,并且基于其它輸入,CBF分?jǐn)?shù)在ML分?jǐn)?shù)150的產(chǎn)生中被重重地加權(quán)。這些僅是對于視頻的ML分?jǐn)?shù)可具有強烈肯定影響的特征類型的兩個例子。
[0045]基于由輸出152指示的、最肯定地影響ML分?jǐn)?shù)150的特征,推薦系統(tǒng)可以選擇對于為什么將對應(yīng)視頻推薦給了目標(biāo)用戶(即,為什么ML分?jǐn)?shù)150高得足以證明推薦目標(biāo)視頻是正確的)的“解釋”。例如:
[0046].如果CBF分?jǐn)?shù)130很高,并且由機(jī)器學(xué)習(xí)引擎102重重地加權(quán),那么可以向用戶呈現(xiàn)解釋“這個視頻類似于X”(其中,X是比較視頻)。
[0047]?如果CF分?jǐn)?shù)124很高,并且由機(jī)器學(xué)習(xí)引擎102重重地加權(quán),那么可以向用戶呈現(xiàn)解釋“X的觀眾常常觀看這個視頻”(其中,X是比較視頻)。
[0048].如果其它輸入112指示目標(biāo)視頻在整個觀眾人群中是最多觀看視頻之一,并且這個特征對于ML分?jǐn)?shù)150具有顯著影響,那么可以向用戶呈現(xiàn)解釋:“這個視頻在所有用戶中是最多觀看視頻之一”。
[0049].如果其它輸入112指示目標(biāo)視頻當(dāng)前經(jīng)歷興趣提升,并且這個特征對于ML分?jǐn)?shù)150具有顯著影響,那么可以向用戶呈現(xiàn)解釋“這個視頻當(dāng)前正經(jīng)歷顯著的興趣爆發(fā)”。
[0050]這些僅是可能向用戶呈現(xiàn)的實際非限制數(shù)量的解釋的例子,以向用戶解釋為什么正推薦目標(biāo)視頻。盡管這些例子是非常一般的,但實際解釋可能是非常具體的。例如,除指示“這個視頻類似于X”之外,解釋可以列舉與X類似的視頻的各個方面(例如,題材、演員、主題、標(biāo)簽、持續(xù)時間、音樂分?jǐn)?shù)等)。
[0051]對于推薦系統(tǒng)的度量
[0052]如以上提到的那樣,協(xié)作過濾輸入108可以包括關(guān)于視頻消費者的觀看行為的信息。觀看行為反映在原始CF特征120中,這些原始CF特征120既饋送到CF分析器118,又饋送到機(jī)器學(xué)習(xí)引擎102。為了得到CF特征,推薦系統(tǒng)可以處理來自播放器日志(具有豐富的行為信息)的用戶-中心度量,以最終產(chǎn)生視頻對-中心度量,這些視頻對-中心度量可包括在到機(jī)器學(xué)習(xí)引擎102的輸入饋送106中。
[0053]參照圖2,它是根據(jù)本發(fā)明實施例的方塊圖,方塊圖表明可以由推薦系統(tǒng)保持的各種類型的度量。度量可以包括用戶-中心度量240、視頻-中心度量242、及視頻對-中心度量244。
[0054]用戶-中心度量
[0055]就用戶-中心度量240而論,推薦系統(tǒng)為每個用戶保持用戶日志。用戶的用戶日志指示哪些視頻用戶已經(jīng)觀看、或表現(xiàn)出興趣。圖2表明三個用戶日志250、252及254。
[0056]根據(jù)一個實施例,除列出用戶已經(jīng)表現(xiàn)出興趣的視頻之外,用戶日志也指示由用戶動作指示的興趣量、和指示何時表現(xiàn)出興趣的時間戳。根據(jù)一個實施例,用戶對視頻表現(xiàn)出的興趣量由“強度”值代表,該“強度”值與視頻列表一起存儲在用戶日志中。
[0057]強度值可以由各種因素確定,如用戶與視頻具有的相互作用的類型而確定。例如,觀看了視頻的用戶比僅僅瀏覽視頻的用戶對視頻表現(xiàn)出更大興趣。每種類型的相互作用內(nèi),強度值可能受其它因素影響。例如,給視頻五星評價的用戶比給視頻三星評價的用戶對視頻具有更強烈的興趣。作為另一個例子,觀看整個視頻的用戶比僅僅觀看視頻的第一半的用戶具有更強烈的興趣。因而,“已觀看視頻的百分比”可以是確定用戶的興趣強度的因素。作為又一個例子,重復(fù)地觀看視頻的用戶比觀看視頻一次的用戶具有更強烈的興趣。
[0058]視頻-中心度量
[0059]推薦系統(tǒng)處理用戶日志,并且對于為每個視頻保持的視頻-中心度量242進(jìn)行對應(yīng)更新。在圖2表明的實施例中,推薦系統(tǒng)保持用于三個視頻202、204及206的信息。對于每個視頻,由推薦系統(tǒng)保持的信息包括用戶清單,這些用戶已經(jīng)表現(xiàn)出對于視頻的興趣。視頻202、204及206的“感興趣用戶清單”分別表明為清單222、224及226。在一個實施例中,這些清單包括條目、時間戳、及強度值,這些條目的每一個識別用戶,這些強度值指示在由時間戳指示的時間、用戶對視頻表現(xiàn)出多么強烈的興趣。
[0060]除感興趣用戶清單222、224及226之外,為視頻的每一個保持視頻元數(shù)據(jù)。為每個視頻保持的視頻元數(shù)據(jù)可以包括關(guān)于視頻的任何數(shù)量和類型的信息,如持續(xù)時間、創(chuàng)建日期、標(biāo)簽、標(biāo)題、關(guān)鍵字、語言等。常常是,用于給定視頻的初始視頻元數(shù)據(jù)由視頻的生產(chǎn)者提供(例如,標(biāo)題、演員、語言),或者從視頻本身得出(例如,持續(xù)時間、編碼格式)。然而,在一些出版環(huán)境中,用于視頻的元數(shù)據(jù)可能相對于時間而變化或增加。例如,隨著更多用戶觀看視頻,用戶標(biāo)簽可以添加到視頻上。作為另一個例子,視頻的觀看數(shù)量和評價可能隨著用戶觀看和評價視頻而正連續(xù)地變化。在圖2表明的實施例中,用于視頻202、204及206的元數(shù)據(jù)分別表明為視頻元數(shù)據(jù)232、234及236。
[0061]視頻對-中心度量
[0062]視頻對-中心度量244是與一對視頻有關(guān)的度量。例如,圖2表明對于視頻對202和204的度量、對于視頻對202和206的度量、及對于視頻對204和206的度量。在圖2表明的實施例中,對于每個視頻對,度量包括CF度量和CBF度量。
[0063]一般地,對于視頻對的CF度量是用來預(yù)測觀看該對中的一個視頻的用戶也將觀看該對中的另一個視頻的可能性的度量。因而,CF度量262是用來預(yù)測觀看視頻202和204之一的用戶也將觀看視頻202和204的另一個的可能性的度量。類似地,CF度量264是用來預(yù)測觀看視頻202和206之一的用戶也將觀看視頻202和206的另一個的可能性的度量。最后,CF度量266是用來預(yù)測觀看視頻204和206之一的用戶也將觀看視頻204和206的另一個的可能性的度量。
[0064]一個實施例中,對于每個視頻對的CF度量至少包括:
[0065].所有用戶對于在視頻對中的每個視頻花費的總時間
[0066].各個用戶對于視頻對花費的最小時間之和
[0067]?對于觀看了該對中的兩個視頻的用戶,在觀看兩個視頻之間過去了多長時間
[0068].用戶的分布(將視頻由一個人觀看100次與視頻由100個不同的人各自觀看一次進(jìn)行區(qū)分)
[0069].觀看視頻對的每個用戶觀看的視頻的分布(指示觀看這個視頻的用戶是否往往會觀看多個視頻、或少量視頻)
[0070].該對的每個視頻如何相對于其它視頻而“可發(fā)現(xiàn)”(例如,將例如頻繁地出現(xiàn)在相同頁或列表上的視頻與很少出現(xiàn)在相同頁或列表上的視頻區(qū)分開)。
[0071]對于視頻對的CF度量可以從為該對中的每個視頻保持的感興趣用戶清單得出。例如,所有用戶對于在202/204視頻對中的每個視頻花費的總時間可以基于在清單222和224中的信息而確定。類似地,CF度量264可以從清單222和226得出。同樣,CF度量266可以從清單224和226得出。
[0072]當(dāng)視頻對中的視頻之一是目標(biāo)視頻,并且視頻對中的另一個視頻是比較視頻時,對于視頻對的CF度量可以被包括在用來產(chǎn)生ML分?jǐn)?shù)的原始CF特征120中。具體地,為了確定將視頻X推薦給特定用戶將實現(xiàn)目的的程度,其中該特定用戶已經(jīng)表現(xiàn)出對于視頻Y的興趣,對于視頻X/Y對的CF度量可以既饋送到CF分析器118,又饋送到機(jī)器學(xué)習(xí)引擎102。CF分析器118可能基于這些CF度量產(chǎn)生CF分?jǐn)?shù)124。CF分?jǐn)?shù)124可能饋送到機(jī)器學(xué)習(xí)引擎102,并且機(jī)器學(xué)習(xí)引擎102可能至少部分地基于這些CF度量確定將多大權(quán)重給予CF分?jǐn)?shù)124。
[0073]除CF度量之外,對于每個視頻對的視頻對-中心度量包括CBF度量。視頻對的CBF度量是一般指示在視頻對中的視頻的內(nèi)容是多么相似的度量。例如,視頻對的CBF度量可以指示視頻共同有多少標(biāo)簽、視頻共有哪些元數(shù)據(jù)(例如,演員、導(dǎo)演、關(guān)鍵字)等。在圖2表明的實施例中,用于視頻對202/204、202/206及204/206的CBF元數(shù)據(jù)分別表示成CBF度量 272、274 及 276。
[0074]根據(jù)一個實施例,當(dāng)視頻對中的視頻之一是目標(biāo)視頻,并且視頻對中的另一個視頻是比較視頻時,對于視頻對的CBF度量可以被包括在用來產(chǎn)生ML分?jǐn)?shù)的原始CBF特征126中。具體地,為了確定視頻X與用戶已經(jīng)表現(xiàn)出對其的興趣的視頻Y相似的程度,對于視頻X/Y對的CBF度量可以既饋送到CBF分析器128,又饋送到機(jī)器學(xué)習(xí)引擎102。CBF分析器128可能基于這些CBF度量產(chǎn)生CBF分?jǐn)?shù)130。CBF分?jǐn)?shù)130可能饋送到機(jī)器學(xué)習(xí)引擎102,并且機(jī)器學(xué)習(xí)引擎102可能至少部分地基于這些CBF度量確定將多大權(quán)重給予CBF分?jǐn)?shù)130。
[0075]行為數(shù)據(jù)的增量更新
[0076]對于盡可能準(zhǔn)確的ML分?jǐn)?shù)150,用來產(chǎn)生ML分?jǐn)?shù)150的原始CF特征120應(yīng)該盡可能是當(dāng)前的。然而,視頻觀看人群越大,越難以保證用于全部候選視頻的原始CF特征120
保持一直是新的。
[0077]例如,假定視頻收集庫具有百萬個視頻資產(chǎn),在任何給定時間,數(shù)萬觀眾正在觀看視頻。這些條件下,觀看行為信息的量可能是巨大的。更新行為數(shù)據(jù)的一種手段可能是實時地收集用戶-中心度量,并且在每個周末,對于視頻-中心度量242、和然后對于視頻對-中心度量244進(jìn)行批量更新。然而,這樣一種手段可能導(dǎo)致由推薦系統(tǒng)使用比較陳舊的視頻-中心度量242和視頻對-中心度量244。
[0078]為了避免由推薦系統(tǒng)使用陳舊視頻-中心度量242和視頻對-中心度量244,提供技術(shù)來增量地保持視頻-中心度量242和視頻對-中心度量。根據(jù)一個實施例,推薦系統(tǒng)增量地將新用戶行為數(shù)據(jù)折合到用戶歷史中,該用戶歷史按元組(tuple)形式(用戶、視頻、強度)概括全部歷史觀看行為。另外,推薦系統(tǒng)將新信息與舊信息區(qū)分開,并且只更新具有新用戶活動的視頻對的視頻對-中心度量244。
[0079]具體地,在一個實施例中,對于特定視頻的視頻-中心CF度量僅響應(yīng)對于特定視頻的新興趣表達(dá)而更新。類似地,對于特定視頻對的視頻對-中心度量,僅響應(yīng)對于屬于視頻對的至少一個視頻的新興趣表達(dá)而更新。因為多個視頻經(jīng)歷長時段,這些長時段期間沒有用戶表達(dá)興趣,所以減少需要重新計算的視頻-中心度量的百分比,由此降低為實時地保持視頻-中心度量242和視頻對-中心度量244 —直為新所需要的處理。
[0080]視頻元數(shù)據(jù)的增量更新
[0081]類似于CF度量,重要的是,每個視頻的以及視頻對的CBF度量保持一直是新的,因為這些度量對ML分?jǐn)?shù)具有影響,這些ML分?jǐn)?shù)用作選擇待推薦的視頻。為了按有效方式保持CBF度量一直是新的,推薦系統(tǒng)使用的基于內(nèi)容的管線也增量地保持。例如,在一個實施例中,吸收到推薦系統(tǒng)中的新視頻和關(guān)于視頻的元數(shù)據(jù)一旦可得,視頻就立即成為可推薦的。
[0082]在一個實施例中,實施基于內(nèi)容的管線,從而只有當(dāng)新視頻和現(xiàn)有視頻共享共同元數(shù)據(jù)時,才將新視頻與新視頻和現(xiàn)有視頻比較。在一個實施例中,推薦保持(特征名稱、特征值)對于(時間戳、視頻、視頻元數(shù)據(jù))映射。這樣的實施例中,基于內(nèi)容的管線可以包括如下邏輯步驟:
[0083].產(chǎn)生(特征名稱、特征值)對于(時間戳、視頻、視頻元數(shù)據(jù))映射,并且將新視頻折合到全局表中
[0084].對包含相同(特征名稱、特征值)的視頻進(jìn)行分組
[0085].為每組產(chǎn)生視頻對。
[0086]?聚集視頻對。為每個對計算成對距離。
[0087]當(dāng)視頻對中的視頻之一是目標(biāo)視頻,并且視頻對中的另一個視頻是比較視頻時,這個成對距離可以是饋送到機(jī)器學(xué)習(xí)引擎102的CBF分?jǐn)?shù)。因為性能原因,推薦系統(tǒng)可以檢查時間戳,并且將新視頻與新視頻、和新視頻與舊視頻(但不是舊視頻與舊視頻)相比較。
[0088]在一個實施例中,關(guān)于目標(biāo)視頻饋送到機(jī)器學(xué)習(xí)引擎102的原始CBF特征126反映對于該目標(biāo)視頻的當(dāng)前視頻-中心度量242、和對于包括該視頻和比較視頻的視頻對的當(dāng)前CBF度量。這在與任何給定視頻相關(guān)聯(lián)的視頻元數(shù)據(jù)可相對于時間顯著變化(例如,將新標(biāo)簽添加到視頻上)的環(huán)境中特別重要。
[0089]如以上提到的那樣,在一個實施例中,當(dāng)視頻對中的第二視頻添加到收集庫上時,對于該視頻對的CBF度量被創(chuàng)建,并且僅響應(yīng)在視頻對中的任一視頻的視頻元數(shù)據(jù)的變化才更新。例如,假定在將視頻204添加到收集庫上時,視頻202在視頻收集庫中存在。響應(yīng)視頻204添加到收集庫上,基于對于視頻202的視頻元數(shù)據(jù)232和對于視頻204的視頻元數(shù)據(jù)234,可以初始創(chuàng)建對于視頻對202/204的CBF度量272。
[0090]一旦產(chǎn)生,CBF度量272就保持不變,直到對于視頻202或視頻204的視頻元數(shù)據(jù)被改變。這樣一種變化(例如,標(biāo)簽被添加到視頻對中的視頻之一)觸發(fā)對于對的CBF度量272的重新計算。由于每個視頻可能屬于多個視頻對,所以對一個視頻的視頻元數(shù)據(jù)的更新可能觸發(fā)對于多個視頻對的CBF度量的重新計算。例如,對于視頻202的視頻元數(shù)據(jù)232的更新可能觸發(fā)視頻對202/204的CBF度量272的重新計算、和視頻對202/206的CBF度量274的重新計算。
[0091]重新計算視頻對的分?jǐn)?shù)
[0092]盡管在圖2未表明,每個視頻對的視頻對-中心度量244也可以包括預(yù)先計算CF分?jǐn)?shù)和預(yù)先計算CBF分?jǐn)?shù)。具體地,代之以在需要視頻推薦時產(chǎn)生對于視頻對的CF和CBF分?jǐn)?shù),這些分?jǐn)?shù)可以在更新底層視頻對度量時預(yù)先計算。因此,需要視頻推薦時,預(yù)先計算分?jǐn)?shù)可以簡單地從存儲中讀出,并且饋送到機(jī)器學(xué)習(xí)引擎102。在推薦(詢問)時和在電影信息更新時進(jìn)行這種計算之間存在權(quán)衡。一般指導(dǎo)原理是利用它們的相對頻率、以及如何盡可能不頻繁地進(jìn)行計算。
[0093]例如,視頻對202/204的CF分?jǐn)?shù)124基于CF度量262。CF度量262響應(yīng)用戶對視頻202或視頻204的興趣的指示而更新。響應(yīng)用戶興趣的指示,可以更新CF度量262,并且通過將更新的CF度量262饋送到CF分析器118中,可以對于視頻對202/204產(chǎn)生CF分?jǐn)?shù)124。當(dāng)使用機(jī)器學(xué)習(xí)引擎102基于視頻對202/204產(chǎn)生ML分?jǐn)?shù)150時,這個預(yù)先計算CF分?jǐn)?shù)然后可以簡單地讀取,而不是重新計算。
[0094]類似地,視頻對202/204的CBF分?jǐn)?shù)130基于CBF度量272。CBF度量272響應(yīng)對于對視頻202或視頻204的視頻元數(shù)據(jù)的更新而更新。響應(yīng)這樣的元數(shù)據(jù)更新,可以更新CBF度量272,并且通過將更新的CBF度量272饋送到CBF分析器128中,可以對于視頻對202/204產(chǎn)生CBF分?jǐn)?shù)130。當(dāng)使用機(jī)器學(xué)習(xí)引擎102基于視頻對202/204產(chǎn)生ML分?jǐn)?shù)150時,這個預(yù)先計算CBF分?jǐn)?shù)130然后可以簡單地讀取,而不是重新計算。
[0095]選擇對其保持度量的視頻對
[0096]理論上,對于收集庫中的每兩個視頻組合可以保持視頻對-中心度量244。對于收集庫中的每個可能視頻對,保持視頻對-中心度量可能導(dǎo)致NX (N-1)不同組的視頻對-中心度量,其中N是收集庫中的視頻數(shù)量。盡管對于小收集庫容易實現(xiàn)保持多組的視頻對-中心度量,但它對于極大收集庫是不切實際的。
[0097]因此,根據(jù)實施例,在認(rèn)為視頻與給定視頻足夠相似之前,視頻必須通過與給定視頻的“配對試驗”,以證明對于視頻和給定視頻的視頻對保持視頻對-中心度量是正確的。相對于特定視頻通過配對試驗的視頻這里稱作對于該特定視頻的“配對視頻組”。因而,在一個實施例中,對于任何給定視頻對(視頻X/視頻Y),如果且只有如果Y在視頻X的配對視頻組中,才保持視頻對-中心度量244。
[0098]配對試驗例如可以是,視頻必須共享如下特性的任一個:題材、演員、導(dǎo)演。這僅是實際上非限制類型的配對試驗的一個例子,這些配對試驗可以用來確定對于特定視頻對是否保持視頻對-中心度量。配對試驗越嚴(yán)格,對其保持視頻對-中心度量244的視頻對越少,因此保持視頻對-中心度量244的開銷越低。
[0099]然而,如果配對試驗太嚴(yán)格,那么推薦系統(tǒng)可能不能進(jìn)行有用的一些推薦。例如,如果視頻X不在視頻Y的配對視頻組中,那么當(dāng)視頻Y是比較視頻,即使視頻Y的大多數(shù)觀眾實際上可能喜歡觀看視頻X,視頻X也不可能由推薦系統(tǒng)推薦。
[0100]配對試驗可以是任意復(fù)雜的。例如,試驗可以具有諸如如下之類的規(guī)則:
[0101]?如果視頻X具有N或更好的評價,那么自動地認(rèn)為視頻X滿足與全部視頻有關(guān)的配對試驗。
[0102].如果視頻X具有小于N次觀看、但大于M次觀看的評價,那么認(rèn)為視頻X滿足與共有如下之一的視頻有關(guān)的配對試驗:題材、演員、導(dǎo)演。
[0103]?如果視頻X具有小于M次觀看,那么認(rèn)為視頻X滿足與相同題材的視頻有關(guān)的配對試驗。
[0104]這些規(guī)則中,視頻的評價確定那些通過配對試驗所必須滿足的條件。然而,在可選擇配對試驗中,用于配對的作用條件可以基于其它因素而變化。
[0105]代之以使用配對試驗來確定是否存儲對于視頻對的任何視頻對-中心度量,配對試驗可以用來確定對于視頻對是否應(yīng)該保持特定類型的視頻對-中心度量。例如,對于在收集庫中的所有視頻對可以保持CF度量,而僅對于通過配對試驗的視頻對保持CBF度量??蛇x擇地,對于在收集庫中的所有視頻對可以保持CBF度量,而僅對于通過配對試驗的視頻對保持CF度量。
[0106]在又一個實施例中,對于每種類型的視頻對-中心度量可以有不同的配對試驗。例如,如果視頻對中的兩個視頻都具有超過一定閾值的評價,則推薦系統(tǒng)可以存儲對于視頻對的CF度量。同時,如果視頻對共有至少一個顯著特征(例如,試樣、演員、導(dǎo)演),則推薦系統(tǒng)可以存儲對于視頻對的CBF度量。在這樣的實施例中,對于一些視頻對的視頻對-中心度量244可以既包括CF度量,又包括CBF度量,對于其它視頻對,可以只有CF度量或CBF度量,而不是兩者。
[0107]基于配對視頻組的視頻到視頻推薦
[0108]根據(jù)一個實施例,當(dāng)給定視頻到視頻推薦時,推薦系統(tǒng)只對于用戶對其已經(jīng)表達(dá)興趣的視頻的配對視頻組中的視頻產(chǎn)生ML分?jǐn)?shù)。例如,假定用戶剛剛結(jié)束觀看視頻X。為了推薦用戶觀看的下個視頻,機(jī)器學(xué)習(xí)引擎102對于視頻X的配對視頻組中的每個視頻,產(chǎn)生ML分?jǐn)?shù)150。
[0109]這個例子中,視頻X的配對視頻組中的每個視頻的原始CF特征120可能包括對于視頻對的CF度量,該視頻對包括該視頻和視頻X。這些原始CF特征120可能饋送到CF分析器118,以產(chǎn)生CF分?jǐn)?shù)124,該CF分?jǐn)?shù)124預(yù)測視頻X的觀眾可能對觀看目標(biāo)視頻有多大興趣。
[0110]類似地,原始CBF特征126可能包括對于視頻對的CF度量,該視頻對包括該視頻和視頻X。這些原始CBF特征126可能饋送到CBF分析器128,以產(chǎn)生CBF分?jǐn)?shù)130,該CBF分?jǐn)?shù)130預(yù)測視頻X與目標(biāo)視頻多么相似。
[0111]如在圖1表明的那樣,原始特征120和126和其它輸入112、與分?jǐn)?shù)124和130 —起饋送到機(jī)器學(xué)習(xí)引擎102,以使機(jī)器學(xué)習(xí)引擎102能夠確定將多大權(quán)重給予分?jǐn)?shù)124和130的每一個?;诖_定權(quán)重,機(jī)器學(xué)習(xí)引擎102對于目標(biāo)視頻產(chǎn)生ML分?jǐn)?shù)150。
[0112]在對視頻X的配對視頻組中的所有視頻重復(fù)這個過程之后,對于該視頻產(chǎn)生的ML分?jǐn)?shù)被用作確定要推薦視頻中的哪個的基礎(chǔ)。
[0113]衰減因數(shù)
[0114]一般地,用戶的最近動作比由用戶在較遠(yuǎn)過去采取的動作更多地指示用戶的當(dāng)前興趣。因此,產(chǎn)生CF分?jǐn)?shù)124時,CF分析器118可以應(yīng)用“衰減”因數(shù),該“衰減”因數(shù)基于行為多近發(fā)生而調(diào)整給予用戶行為度量的權(quán)重。
[0115]例如,為了產(chǎn)生CF分?jǐn)?shù)124的目的,CF分析器118可以將指示用戶觀看視頻對的兩個視頻的數(shù)據(jù),在用戶觀看兩個視頻之后立即給予100%權(quán)重,一周后給予80%權(quán)重,兩周后給予60%權(quán)重。用戶行為的遠(yuǎn)近可以由用戶日志中捕獲的時間戳確定。
[0116]衰減因數(shù)越高,給予較舊行為的權(quán)重越低。相反,衰減因數(shù)越低,給予較舊行為的權(quán)重越高。高衰減因數(shù)的例子可能例如將100%權(quán)重給予當(dāng)前行為,將10%權(quán)重給予一周舊的行為,對于多于兩周舊的行為不給予權(quán)重。
[0117]改變CF分析器118使用的衰減因數(shù)影響由CF分析器118產(chǎn)生的CF分?jǐn)?shù)124。例如,假定多個用戶在兩周前已經(jīng)觀看了特定視頻對,但少量用戶在上周觀看了同一視頻對。這些條件下,高衰減因數(shù)的使用可能導(dǎo)致低CF分?jǐn)?shù)124,因為很小權(quán)重可能給予較舊觀看信息。另一方面,低衰減因數(shù)的使用可能導(dǎo)致高CF分?jǐn)?shù)124,因為舊使用信息可能具有對于CF分?jǐn)?shù)124的顯著影響。
[0118]不幸地,沒有所有情形下都產(chǎn)生最佳結(jié)果的衰減因數(shù)。例如,對于來自高觀看視頻的發(fā)行者的視頻使用高衰減因數(shù)可能產(chǎn)生CF分?jǐn)?shù)124,這些CF分?jǐn)?shù)124準(zhǔn)確地預(yù)測觀看在視頻對中的一個視頻的用戶是否可能對觀看在視頻對中的另一個視頻感興趣。高衰減因數(shù)的使用可能對這樣類型的視頻是最佳的,因為最近觀看活動的量足以產(chǎn)生準(zhǔn)確預(yù)測。因此,舊行為數(shù)據(jù)可相應(yīng)地打折。
[0119]另一方面,對于其視頻較不頻繁地被觀看的發(fā)行者的視頻,使用低衰減因數(shù)可能產(chǎn)生更準(zhǔn)確的CF分?jǐn)?shù)124。這樣的情況下使用低衰減因數(shù)可能需要保證,CF分?jǐn)?shù)124基于有用的足夠行為數(shù)據(jù)。因而,在這個例子中,獨立于衰減因數(shù)的輸入?yún)?shù)(視頻發(fā)行者)可以將如下指示給予機(jī)器學(xué)習(xí)引擎102:哪種衰減因數(shù)可能更適當(dāng)?shù)赜迷谌魏谓o定情形下。
[0120]代之以試圖推測哪種衰減因數(shù)對于每個視頻對可能產(chǎn)生最準(zhǔn)確CF分?jǐn)?shù)124,提供這樣的實施例,對每個視頻對將多個CF分?jǐn)?shù)饋送到機(jī)器學(xué)習(xí)引擎102中,其中每個CF分?jǐn)?shù)通過使用不同的衰減因數(shù)而產(chǎn)生。這樣的實施例表明在圖3。
[0121]參照圖3,它表明推薦系統(tǒng),該推薦系統(tǒng)中,機(jī)器學(xué)習(xí)引擎102被提供CF輸入308,這些CF輸入308包括三個不同CF分?jǐn)?shù)324、326、328。CF分?jǐn)?shù)324、326及328基于相同的原始CF特征120,但通過使用三個不同的衰減因數(shù)314、316及318而產(chǎn)生?;谠谳斎腽佀?06中的其它特征(如視頻生產(chǎn)者),機(jī)器學(xué)習(xí)引擎102確定CF分?jǐn)?shù)的哪個應(yīng)該對ML分?jǐn)?shù)150具有較大影響。
[0122]例如,如果原始CBF特征126指示在視頻對中的視頻是關(guān)于來自特定發(fā)行者的高度觀看當(dāng)前新聞事件,則機(jī)器學(xué)習(xí)引擎102可以將較大權(quán)重給予CF分?jǐn)?shù),該CF分?jǐn)?shù)基于高衰減因數(shù)。另一方面,如果原始CBF特征126指示在視頻對中的視頻是來自另一個發(fā)行者的很少看到的經(jīng)典電影,則機(jī)器學(xué)習(xí)引擎102可以將較大權(quán)重給予CF分?jǐn)?shù),該CF分?jǐn)?shù)基于低衰減因數(shù)。
[0123]盡管在圖3表明的實施例中,使用三個不同的衰減因數(shù),但使用的衰減因數(shù)的實際數(shù)量可以隨實施變化。例如,一個實施例對于任何給定視頻對可以產(chǎn)生二十個CF分?jǐn)?shù),其中,二十個CF分?jǐn)?shù)的每一個基于不同的衰減因數(shù)。如將在下面更詳細(xì)解釋的那樣,這種技術(shù)不限于衰減因數(shù),也可以供任何數(shù)量的其它參數(shù)使用。
[0124]機(jī)率-比值截止
[0125]當(dāng)模型用來產(chǎn)生預(yù)測時,模型使用基于假設(shè)的某些“模型調(diào)諧參數(shù)”。以上討論的衰減因數(shù)是這樣一種模型調(diào)諧參數(shù)的例子。例如,使用衰減因數(shù)的模型-該衰減因數(shù)將給予動作的權(quán)重在一周之后減小50%,假定過去動作預(yù)測未來動作的能力在一周之后下降50%。
[0126]衰減因數(shù)僅是模型調(diào)諧參數(shù)的一個例子,這些模型調(diào)諧參數(shù)可以由模型使用,這些模型在CF和CBF分析器中實施。除衰減因數(shù)之外,由CF分析器采用的模型可以例如使用機(jī)率-比值截止閾值(odds-rat1 cut-off threshold),來減小當(dāng)預(yù)測兩個視頻是否實際上彼此有關(guān)時,由高度流行視頻引起的虛假-肯定(false-positives)的數(shù)量。
[0127]機(jī)率-比值截止可以用來解決如下問題:極流行視頻可能由如此多的用戶觀看,從而這些用戶觀看除極流行視頻之外的一些其它視頻的事實,并不是其它視頻與極流行視頻有關(guān)的準(zhǔn)確指示。為了避免預(yù)測極流行視頻與它們對其無關(guān)的其它視頻有關(guān),由CF分析器118使用的模型可以通過計算兩個視頻獨立同現(xiàn)在用戶觀看日志中的機(jī)率(而非依賴地同時出現(xiàn)),確定兩個視頻是否有關(guān)。如果兩個視頻獨立同現(xiàn)的機(jī)率大于由模型使用的機(jī)率-比值截止(例如,50% ),那么假定:兩個視頻實際上不是彼此有關(guān)的。
[0128]如關(guān)于衰減因數(shù)那樣,模型使用的機(jī)率-比值截止(a)影響預(yù)測,和(b)所基于的假設(shè)不可能始終保持真實。例如,一些情況下,兩個視頻,即使統(tǒng)計學(xué)指示有55%的機(jī)會它們獨立同現(xiàn)在用戶日志中,也可能是高度相關(guān)的。這種情形下,使用60%機(jī)率-比值截止,可能已經(jīng)使模型預(yù)測到所述視頻事實上是相關(guān)的。
[0129]另一方面,兩個視頻,即使統(tǒng)計學(xué)指示有45%的機(jī)會它們獨立同現(xiàn)在用戶日志中,也可能是不相關(guān)的。這種情形下,使用40%機(jī)率-比值截止可能已經(jīng)使模型預(yù)測到視頻不相關(guān)。
[0130]標(biāo)準(zhǔn)化因數(shù)
[0131]標(biāo)準(zhǔn)化因數(shù)是可以由一些模型使用的模型調(diào)諧參數(shù)的另一個例子。標(biāo)準(zhǔn)化因數(shù)一般試圖基于用戶的整體觀看行為將分?jǐn)?shù)標(biāo)準(zhǔn)化。例如,用戶A和B都觀看了視頻對(vl、v2)50分鐘。然而,用戶A只觀看了視頻vl和v2,而用戶B觀看了數(shù)百個其它視頻。用戶B具有關(guān)于視頻對的較分散注意力。對于視頻vl和v2的相關(guān)度來自用戶A的贊同應(yīng)該比來自用戶B的贊同重要。這與Web頁排序中使用的PageRank是相同精神,這里,給予引出鏈路的權(quán)重部分取決于每個網(wǎng)頁可能具有的引出鏈路的數(shù)量。
[0132]使用不同模型調(diào)諧參數(shù)的并行計算
[0133]因為模型對于模型調(diào)諧參數(shù)(例如,衰減因數(shù)、標(biāo)準(zhǔn)化因數(shù)、機(jī)率-比值截止等)使用的值所基于的假設(shè)并不是對于所有情形都真實,所以提供這樣實施例,將不同模型調(diào)諧參數(shù)值組合的分?jǐn)?shù)并行地饋送到機(jī)器學(xué)習(xí)引擎102。
[0134]例如,圖3表明將三個CF分?jǐn)?shù)324、326、328并行地饋送到機(jī)器學(xué)習(xí)引擎102,這三個CF分?jǐn)?shù)324、326、328的每一個與不同的衰減因數(shù)值相關(guān)聯(lián)??蛇x擇實施例中,對于幾個(衰減因數(shù)、標(biāo)準(zhǔn)化因數(shù)、機(jī)率-比值截止)值組合的每一個可產(chǎn)生一個CF分?jǐn)?shù)。例如,實施例可以使用對于衰減因數(shù)(X、Y、Z)的三個不同值、和兩個不同機(jī)率-比值截止閾值(A、B)。這樣的實施例中,機(jī)器學(xué)習(xí)引擎102可并行地被提供六個CF分?jǐn)?shù),對于模型調(diào)諧參數(shù)值組合(X、A)、(X、B)、(Y、A)、(Y、B)、(Z、A)、(Z、B)的每種一個。
[0135]盡管這個例子中使用衰減因數(shù)和機(jī)率-比值截止閾值的模型調(diào)諧參數(shù),但對于任何類型和數(shù)量的模型調(diào)諧參數(shù),可以使用相同的并行-分?jǐn)?shù)-產(chǎn)生技術(shù)。例如,特定CF分析器可以使用這樣模型,該模型采用四個不同的模型調(diào)諧參數(shù)。對于每個模型調(diào)諧參數(shù),可能有待試驗的三個可行值。這樣的實施例中,有模型調(diào)諧參數(shù)值的81種不同組合。因而,可以將81個CF分?jǐn)?shù)(對于每種模型調(diào)諧參數(shù)值組合一個)并行地饋送到機(jī)器學(xué)習(xí)引擎102中。
[0136]如關(guān)于以上給出的衰減因數(shù)例子那樣,在產(chǎn)生ML分?jǐn)?shù)時,給予CF分?jǐn)?shù)的每一個的權(quán)重至少部分地基于由機(jī)器學(xué)習(xí)引擎102接收的其它輸入。如在圖3指示的那樣,這些其它輸入包括原始CF特征120、原始CBF特征126、CBF分?jǐn)?shù)130及任何數(shù)量的其它輸入112。
[0137]靈活的對象函數(shù)
[0138]當(dāng)用在視頻到視頻推薦的情形時,機(jī)器學(xué)習(xí)引擎102產(chǎn)生ML分?jǐn)?shù),這些ML分?jǐn)?shù)預(yù)測用戶給定他/她已經(jīng)觀看視頻A(比較視頻)而將觀看視頻B(目標(biāo)視頻)的概率。實際中,有發(fā)行者想優(yōu)化實現(xiàn)的多個目標(biāo)。目標(biāo)的例子包括但不限于:
[0139].增加總電影觀看時間
[0140].增加每個用戶觀看的視頻數(shù)量
[0141].增加用戶花在觀看每個(推薦)視頻上的總分鐘
[0142]?增加來自每次視頻觀看的廣告收入
[0143].增大影響范圍
[0144]?增加每部電影的收入
[0145]為了解決這種挑戰(zhàn),提供這樣實施例,其中預(yù)測被初始地反映在幾個不同的子分量中。分量可以包括例如:
[0146].P(B|A)-用戶給定他/她觀看了 A而可能喜歡觀看B的概率
[0147].R(B) -來自B的每次觀看的期望收入(*未來工作)
[0148].P (ad I U,B)-觀看B的用戶u將點擊廣告的概率
[0149]使用機(jī)器學(xué)習(xí)引擎產(chǎn)生這些分量的每一個的分?jǐn)?shù)之后,分量分?jǐn)?shù)然后可以基于特定組的目標(biāo)而組合,以產(chǎn)生合成ML分?jǐn)?shù),該合成ML分?jǐn)?shù)用作選擇要推薦哪些候選視頻的基礎(chǔ)。
[0150]圖4是機(jī)器學(xué)習(xí)引擎402的方塊圖,該機(jī)器學(xué)習(xí)引擎402已經(jīng)訓(xùn)練成產(chǎn)生ML分量分?jǐn)?shù)404、406及408,這些ML分量分?jǐn)?shù)404、406及408由基于目標(biāo)的分量組合器410組合,以基于規(guī)定目標(biāo)430產(chǎn)生合成ML分?jǐn)?shù)440。這個例子中,ML分量分?jǐn)?shù)404、406及408可以與以上描述的目標(biāo)函數(shù)P (B|A)、R (B)、及P (ad I U,B)相對應(yīng)。當(dāng)產(chǎn)生合成ML分?jǐn)?shù)440時,由基于目標(biāo)的分量組合器410給予各個分量分?jǐn)?shù)的權(quán)重是基于饋送到基于目標(biāo)的分量組合器410的目標(biāo)信息430。
[0151]例如,假定目標(biāo)430指示用戶約定顯著地比收入重要,并且收入稍微比廣告重要?;谶@樣的目標(biāo)信息430,基于目標(biāo)的組合器410可以將分量分?jǐn)?shù)404、406及408分別按
0.6,0.25 及 0.15 加權(quán)。
[0152]盡管機(jī)器學(xué)習(xí)引擎402表明成單個引擎,機(jī)器學(xué)習(xí)引擎402可以實施成三個不同引擎,這三個不同引擎的每一個訓(xùn)練成產(chǎn)生不同的ML分量分?jǐn)?shù)。分量分?jǐn)?shù)的實際數(shù)量、和基于目標(biāo)的分量組合器410當(dāng)產(chǎn)生合成ML分?jǐn)?shù)440時如何將權(quán)重賦予這些分?jǐn)?shù),可以隨實施而變化。例如,單個推薦系統(tǒng)可以產(chǎn)生數(shù)十個ML分量分?jǐn)?shù),這些ML分量分?jǐn)?shù)的每一個反映基于不同目標(biāo)函數(shù)的預(yù)測。基于目標(biāo)的分量組合器410可以基于目標(biāo)信息430按各種方式組合這些ML分量分?jǐn)?shù)。
[0153]在一個實施例中,基于目標(biāo)的分量組合器410被提供多組目標(biāo),并因此產(chǎn)生多個合成ML分?jǐn)?shù)。這樣的實施例中,每個視頻對組合可能具有多個合成ML分?jǐn)?shù),并且為確定是否推薦視頻而使用的實際ML分?jǐn)?shù)可能基于給出推薦時有效的目標(biāo)。
[0154]在分量分?jǐn)?shù)之間交替
[0155]為了給出滿足某組目的的推薦,可以將分量分?jǐn)?shù)組合成合成ML分?jǐn)?shù)440,該合成ML分?jǐn)?shù)440用作確定要推薦哪些候選視頻的基礎(chǔ)。在可選擇實施例中,不產(chǎn)生合成ML分?jǐn)?shù)440。代之以,當(dāng)給出推薦時,推薦系統(tǒng)在分量分?jǐn)?shù)中的哪些要用作基礎(chǔ)之間交替,所述基礎(chǔ)用來確定待推薦的視頻。
[0156]例如,代之以通過將ML分量分?jǐn)?shù)404、406及408分別給予0.6、0.25及0.15的權(quán)重而產(chǎn)生合成ML分?jǐn)?shù)440,推薦系統(tǒng)可以在60%的時間給出基于ML分量分?jǐn)?shù)404的、在25%的時間給出基于ML分量分?jǐn)?shù)406、及在15%的時間給出基于ML分量分?jǐn)?shù)408的推薦。如關(guān)于產(chǎn)生合成ML分?jǐn)?shù)440的實施例那樣,在ML分量分?jǐn)?shù)之間交替的實施例基于正給出推薦時有效的目標(biāo)這樣做。
[0157]根據(jù)一個實施例,在ML分量分?jǐn)?shù)之間交替的模式不必是均勻的。例如,推薦系統(tǒng)可以在用戶-中心基礎(chǔ)上進(jìn)行交替,其中初始向用戶提供基于ML分量分?jǐn)?shù)的推薦,該ML分量分?jǐn)?shù)預(yù)測用戶約定。只有在向用戶已經(jīng)呈現(xiàn)幾個推薦之后,這幾個推薦聚焦在用戶約定上,推薦系統(tǒng)才可能開始提供基于其它目標(biāo)函數(shù)(如收入最大化)的一些推薦。如果當(dāng)呈現(xiàn)收入最大化推薦時的用戶行為指示,用戶約定已經(jīng)降落在特定閾值下面,則推薦系統(tǒng)可以切換回提供基本上或僅基于與用戶約定有關(guān)的分量分?jǐn)?shù)的推薦。
[0158]有限度探查
[0159]根據(jù)一個實施例,隨著向用戶推薦視頻,捕獲用戶行為,并且該用戶行為用來更新由推薦系統(tǒng)使用的元數(shù)據(jù),如以上描述的那樣。然而,只要向用戶始終呈現(xiàn)“最佳”視頻推薦(例如,具有最高M(jìn)L分?jǐn)?shù)的視頻),就不能收集關(guān)于用戶如何對“非最佳”推薦反應(yīng)的行為數(shù)據(jù)。在不收集關(guān)于對非最佳推薦的用戶反應(yīng)的信息的情況下,當(dāng)未被推薦的視頻應(yīng)該被推薦時,推薦系統(tǒng)將難以校正自身。
[0160]例如,假定視頻A對于視頻B的觀眾可能是很有興趣的。然而,在沒有對于視頻A的任何觀看歷史的情況下,機(jī)器學(xué)習(xí)引擎102對于視頻對A和B產(chǎn)生低ML分?jǐn)?shù)。由于低ML分?jǐn)?shù),視頻A可能不推薦給視頻B的觀眾,所以視頻B的很少觀眾可能觀看視頻A。因此,對于視頻對A和B的ML分?jǐn)?shù)可能保持很低。
[0161]為了避免這樣的問題,定期地將非最佳推薦呈現(xiàn)給用戶,對于非最佳推薦可以收集行為數(shù)據(jù)。呈現(xiàn)非最佳推薦稱作“探查”,因為它向用戶呈現(xiàn)在視頻組外的推薦,該視頻組通??赡芟蛴脩舫尸F(xiàn)。然而,太多探查、或在錯誤情況下的探查可能將用戶體驗降級到不可接受的程度。
[0162]因此,根據(jù)一個實施例,推薦系統(tǒng)對探查施加約束條件。具體地,探查按如下方式進(jìn)行:有限度探查對視頻推薦目標(biāo)具有的不利影響。例如,推薦系統(tǒng)可以定期地將視頻的選擇隨機(jī)化以推薦給用戶。然而,可以約束隨機(jī)選擇,其中從進(jìn)行隨機(jī)選擇的池中排除那些不利影響預(yù)計在一定閾值以上的任何視頻。
[0163]例如,在探查期間,進(jìn)行隨機(jī)選擇的視頻池可能只包括這樣的視頻,這些視頻相對于比較視頻具有高于某一閾值X的CF分?jǐn)?shù)、或高于某一閾值Y的CBF分?jǐn)?shù)、或高于某一閾值Z的ML分?jǐn)?shù)。置于視頻選擇池上的專門約束規(guī)則可能是任意復(fù)雜的。例如,如果(對于任何衰減因數(shù)的CF分?jǐn)?shù)>X)或者(ML分量分?jǐn)?shù)的任一個>Y)并且(合成ML分?jǐn)?shù)>Ζ),則視頻可能具有進(jìn)入選擇池的資格。
[0164]根據(jù)一個實施例,多臂老虎機(jī)(mult1-armed bandit)技術(shù)由視頻推薦用來學(xué)習(xí)在探查選擇過程中的每個變量對當(dāng)前目標(biāo)的實現(xiàn)具有的影響,并且調(diào)整預(yù)測具有最小不利影響的變量。例如,關(guān)于ε -貪婪策略(epsilon-greedy strategy),對于嘗試的比例1- ε選擇由ML系統(tǒng)(最好杠桿)推薦的視頻,并且對于比例ε選擇(以均勻概率)屬于其它池(高于某一閾值的隨機(jī)、趨勢CBF分?jǐn)?shù))的視頻。典型參數(shù)值可能是ε =0.1,但這可依據(jù)環(huán)境和偏好大大地變化。
[0165]運行時間性能增強
[0166]當(dāng)使用這里描述的技術(shù)提供視頻推薦時,可以使用各種運行時間性能增強。例如,一些實施例當(dāng)將用戶點擊數(shù)據(jù)(非常小)與特征(比較龐大)聯(lián)合以產(chǎn)生到機(jī)器學(xué)習(xí)系統(tǒng)的訓(xùn)練輸入時,可以使用bloom過濾器。具體地,在一個實施例中,使用用戶點擊數(shù)據(jù)建立bloom過濾器,并且過濾器用來濾除全部不相關(guān)的CF和CBF特征,這些不相關(guān)的CF和CBF特征沒有與它們相關(guān)聯(lián)的點擊數(shù)據(jù)。這對于諸如hadoop之類的數(shù)據(jù)處理系統(tǒng)特別有用,在這些數(shù)據(jù)處理系統(tǒng)中,對于各種表不建立索引。
[0167]視頻推薦系統(tǒng)可以使用的另一種運行時間增強涉及非對稱聯(lián)合。具體地,當(dāng)聯(lián)合CBF特征和CF特征時,非對稱聯(lián)合可以利用如下事實:對于新內(nèi)容,存在有限的行為數(shù)據(jù)。在一個實施例中,將特征依據(jù)它們產(chǎn)生的時間組織在不同的存儲桶中。推薦系統(tǒng)只將CBF特征與在最后幾個小時產(chǎn)生的CF特征相聯(lián)合。這顯著地減小為機(jī)器學(xué)習(xí)系統(tǒng)產(chǎn)生訓(xùn)練和試驗數(shù)據(jù)所需要的時間。
[0168]硬件概要
[0169]根據(jù)一個實施例,這里描述的技術(shù)由一個或多個專用計算裝置實施。專用計算裝置可以硬-連線以執(zhí)行各技術(shù);或者可以包括數(shù)字電子裝置,如一個或多個應(yīng)用程序-專門集成電路(ASIC)或現(xiàn)場可編程門陣列(FPGA),這些數(shù)字電子裝置不變地編程以執(zhí)行各技術(shù);或者可以包括一個或多個通用硬件處理器,這些通用硬件處理器編程成,按照在固件、存儲器、其它存儲裝置、或組合中的程序指令執(zhí)行各技術(shù)。這樣的專用計算裝置也可以將定制硬-連線邏輯裝置、ASIC或FPGA與定制編程組合以完成各技術(shù)。專用計算裝置可以是臺式計算機(jī)系統(tǒng)、可攜帶計算機(jī)系統(tǒng)、手持裝置、聯(lián)網(wǎng)裝置或任何其它裝置,該其它裝置包括硬-連線和/或程序邏輯裝置以實施各技術(shù)。
[0170]例如,圖5是方塊圖,方塊圖表明計算機(jī)系統(tǒng)500,在該計算機(jī)系統(tǒng)500上可以實施本發(fā)明的實施例。計算機(jī)系統(tǒng)500包括用來通信信息的總線502或其它通信機(jī)構(gòu)、和硬件處理器504,該硬件處理器504與總線502相聯(lián)接用來處理信息。硬件處理器504可以是例如通用微處理器。
[0171]計算機(jī)系統(tǒng)500也包括主存儲器506,如隨機(jī)存取存儲器(RAM)或其它動態(tài)存儲裝置,該主存儲器506聯(lián)接到總線502上,用來存儲信息和待由處理器504執(zhí)行的指令。主存儲器506也可以在待由處理器504執(zhí)行的指令的執(zhí)行期間,用來存儲臨時變量或其它中間信息。這樣的指令當(dāng)存儲在對于處理器504可訪問的非暫時存儲介質(zhì)中時使計算機(jī)系統(tǒng)500變成專用機(jī)器,該專用機(jī)器定制成,執(zhí)行在指令中規(guī)定的操作。
[0172]計算機(jī)系統(tǒng)500還包括只讀存儲器(ROM) 508或其它靜態(tài)存儲裝置,該只讀存儲器(ROM) 508或其它靜態(tài)存儲裝置聯(lián)接到總線502上,用來存儲用于處理器504的靜態(tài)信息和指令。提供諸如磁盤或光盤之類的存儲裝置510,并且聯(lián)接到總線502上用來存儲信息和指令。
[0173]計算機(jī)系統(tǒng)500可以經(jīng)總線502聯(lián)接到顯示器512上,如聯(lián)接到陰極射線管(CRT)上,用來向計算機(jī)用戶顯示信息。包括字母數(shù)字和其它鍵的輸入裝置514聯(lián)接到總線502上,用來將信息和命令選擇通信到處理器504。另一種類型的用戶輸入裝置是光標(biāo)控制裝置516,如鼠標(biāo)、跟蹤球、或光標(biāo)方向鍵,用來將方向信息和命令選擇通信到處理器504,并且用來控制在顯示器512上的光標(biāo)運動。這種輸入裝置典型地在兩根軸-第一軸(例如X)和第二軸(例如y),中具有兩個自由度,這允許裝置指定在平面中的位置。
[0174]計算機(jī)系統(tǒng)500可以使用定制硬-連線邏輯裝置、一個或多個ASIC或FPGA、固件及/或程序邏輯裝置實施這里描述的技術(shù),該程序邏輯裝置與計算機(jī)系統(tǒng)相組合使計算機(jī)系統(tǒng)500是或?qū)⑵渚幊虨閷S脵C(jī)器。根據(jù)一個實施例,這里的技術(shù)由計算機(jī)系統(tǒng)500響應(yīng)處理器504而執(zhí)行,該處理器504執(zhí)行在主存儲器506中包含的一個或多個指令的一個或多個序列。這樣的指令可以從另一種存儲介質(zhì),如存儲裝置510,讀取到主存儲器506中。在主存儲器506中包含的指令序列的執(zhí)行使處理器504執(zhí)行在這里描述的過程步驟。在可選擇實施例中,硬-連線電路可以用來代替軟件指令或者與它們組合。
[0175]這里所使用的術(shù)語“存儲介質(zhì)”是指任何非暫時介質(zhì),這些非暫時介質(zhì)存儲數(shù)據(jù)和/或指令,這些數(shù)據(jù)和/或指令使機(jī)器按特定方式操作。這樣的存儲介質(zhì)可以包括非易失介質(zhì)和/或易失介質(zhì)。非易失介質(zhì)包括例如光盤或磁盤,如存儲裝置510。易失介質(zhì)包括動態(tài)存儲器,如主存儲器506。普通形式的存儲介質(zhì)包括例如軟盤、柔性盤、硬盤、固態(tài)驅(qū)動器、磁帶、或任何其它磁性數(shù)據(jù)存儲介質(zhì)、CD-ROM、任何其它光學(xué)數(shù)據(jù)存儲介質(zhì)、具有孔的模式的任何物理介質(zhì)、RAM、PROM、及EPROM、FLASH-EPROM、NVRAM、任何其它存儲器芯片或盒。
[0176]存儲介質(zhì)與傳輸介質(zhì)不同,但可以與傳輸介質(zhì)一起使用。傳輸介質(zhì)參與在存儲介質(zhì)之間傳送信息。例如,傳輸介質(zhì)包括同軸電纜、銅導(dǎo)線及光學(xué)纖維,包括導(dǎo)線,這些導(dǎo)線包括總線502。傳輸介質(zhì)也可采取聲波或光波的形式,如在無線電波和紅外數(shù)據(jù)通信期間產(chǎn)生的那些波。
[0177]為了執(zhí)行將一個或多個指令的一個或多個序列傳送到處理器504時,可能涉及各種形式的介質(zhì)。例如,指令可能初始攜帶在遠(yuǎn)程計算機(jī)的磁盤或固態(tài)驅(qū)動器上。遠(yuǎn)程計算機(jī)可將指令加載到其動態(tài)存儲器中,并且使用調(diào)制解調(diào)器在電話線上發(fā)送指令。計算機(jī)系統(tǒng)500的本地調(diào)制解調(diào)器可在電話線上接收數(shù)據(jù),并且使用紅外收發(fā)器將數(shù)據(jù)轉(zhuǎn)化成紅外信號。紅外檢測器可接收在紅外信號中攜帶的數(shù)據(jù),并且適當(dāng)電路可將數(shù)據(jù)放置在總線502上。總線502將數(shù)據(jù)傳送到主存儲器506,處理器504從該主存儲器506中檢索指令并且執(zhí)行指令。主存儲器506接收的指令可以在由處理器504的執(zhí)行之前或之后選擇性地存儲在存儲裝置510上。
[0178]計算機(jī)系統(tǒng)500也包括聯(lián)接到總線502上的通信接口 518。通信接口 518提供聯(lián)接到網(wǎng)絡(luò)鏈路520上的雙向數(shù)據(jù)通信,該網(wǎng)絡(luò)鏈路520連接到本地網(wǎng)絡(luò)522上。例如,通信接口 518可以是集成服務(wù)數(shù)字網(wǎng)絡(luò)(ISDN)卡、有線調(diào)制解調(diào)器、衛(wèi)星調(diào)制解調(diào)器、或?qū)?shù)據(jù)通信連接提供給對應(yīng)類型的電話線的調(diào)制解調(diào)器。作為另一個例子,通信接口 518可以是將數(shù)據(jù)通信連接提供給兼容LAN的局域網(wǎng)(LAN)卡。也可以實施無線鏈路。在任何這樣的實施中,通信接口 518發(fā)送和接收電信號、電磁信號或光學(xué)信號,這些信號攜帶數(shù)字?jǐn)?shù)據(jù)流,這些數(shù)字?jǐn)?shù)據(jù)流代表各種類型的信息。
[0179]網(wǎng)絡(luò)鏈路520典型地提供通過一個或多個網(wǎng)絡(luò)到其它數(shù)據(jù)裝置的數(shù)據(jù)通信。例如,網(wǎng)絡(luò)鏈路520可以提供通過本地網(wǎng)絡(luò)522到主計算機(jī)524、或到數(shù)據(jù)設(shè)備的連接,該數(shù)據(jù)設(shè)備由互聯(lián)網(wǎng)服務(wù)提供商(ISP)526操作。ISP 526又提供通過全世界包數(shù)據(jù)通信網(wǎng)絡(luò)的數(shù)據(jù)通信服務(wù),該全世界包數(shù)據(jù)通信網(wǎng)絡(luò)現(xiàn)在通常稱作“互聯(lián)網(wǎng)”528。本地網(wǎng)絡(luò)522和互聯(lián)網(wǎng)528兩者都使用攜帶數(shù)字?jǐn)?shù)據(jù)流的電信號、電磁信號或光學(xué)信號。通過網(wǎng)絡(luò)的信號和在網(wǎng)絡(luò)鏈路520上并通過通信接口 518的信號是傳輸介質(zhì)的示范形式,這些信號將數(shù)字?jǐn)?shù)據(jù)傳送到計算機(jī)系統(tǒng)500并且從其傳送數(shù)字?jǐn)?shù)據(jù)。
[0180]計算機(jī)系統(tǒng)500可通過網(wǎng)絡(luò)(一個或多個)、網(wǎng)絡(luò)鏈路520及通信接口 518發(fā)送消息和接收數(shù)據(jù),包括程序代碼。在互聯(lián)網(wǎng)例子中,服務(wù)器530可能通過互聯(lián)網(wǎng)528、ISP 526、本地網(wǎng)絡(luò)522及通信接口 518傳輸對于應(yīng)用程序的要求代碼。
[0181]接收代碼隨著它被接收、和/或存儲在存儲裝置510、或用于以后執(zhí)行的其它非易失存儲裝置中,可以由處理器504執(zhí)行。
[0182]以上說明書中,參照隨實施可能變化的多個具體細(xì)節(jié),已經(jīng)描述了本發(fā)明的實施例。說明書和附圖相應(yīng)地要按說明性而不是限制性意義對待。本發(fā)明的范圍、和由本 申請人:打算是本發(fā)明的范圍的內(nèi)容的唯一和排它指示是權(quán)利要求組的文字和等效范圍,該范圍從本申請按這樣的權(quán)利要求發(fā)布的具體形式而發(fā)布,包括任何以后校正。
【權(quán)利要求】
1.一種方法,包括: 對于一組候選視頻中的每個視頻,通過將輸入饋送提供到機(jī)器學(xué)習(xí)引擎,產(chǎn)生多個機(jī)器學(xué)習(xí)(ML)分?jǐn)?shù); 其中對于候選視頻組中的一個特定視頻的輸入饋送至少包括: 一個或多個原始的協(xié)作過濾特征; 協(xié)作過濾分?jǐn)?shù),它基于所述一個或多個原始的協(xié)作過濾特征而產(chǎn)生; 一個或多個原始的基于內(nèi)容的過濾特征;及 基于內(nèi)容的過濾分?jǐn)?shù),它基于所述一個或多個原始的基于內(nèi)容的過濾特征而產(chǎn)生;當(dāng)產(chǎn)生對于所述特定視頻的ML分?jǐn)?shù)時,機(jī)器學(xué)習(xí)引擎至少部分地基于所述一個或多個原始的協(xié)作過濾特征和所述一個或多個原始的基于內(nèi)容的過濾特征,來確定給予所述協(xié)作過濾分?jǐn)?shù)和所述基于內(nèi)容的過濾分?jǐn)?shù)的權(quán)重; 至少部分地基于ML分?jǐn)?shù),從候選視頻組中選擇一個或多個視頻以推薦給特定用戶; 其中所述方法由一個或多個計算裝置執(zhí)行。
2.根據(jù)權(quán)利要求1所述的方法,其中: 對于特定視頻的輸入饋送包括:用于視頻對的視頻對-中心度量,所述視頻對包括所述特定視頻和比較視頻; 所述一個或多個原始的協(xié)作過濾特征包括:用于所述視頻對的協(xié)作過濾度量;及 所述一個或多個原始的基于內(nèi)容的過濾特征包括:用于所述視頻對的基于內(nèi)容的過濾度量。
3.根據(jù)權(quán)利要求2所述的方法,其中所述視頻對的協(xié)作過濾度量僅響應(yīng)于檢測到關(guān)于所述視頻對中的一個或多個視頻的用戶興趣的新指示而更新。
4.根據(jù)權(quán)利要求2所述的方法,其中所述視頻對的基于內(nèi)容的過濾度量僅響應(yīng)于檢測到關(guān)于所述視頻對中的一個或多個視頻的視頻元數(shù)據(jù)的新變化而更新。
5.根據(jù)權(quán)利要求2所述的方法,其中: 視頻對的視頻對-中心度量包括:特定組的度量;并且 如果且僅如果所述視頻對滿足特定配對試驗,才為所述視頻對保持所述特定組的度量。
6.根據(jù)權(quán)利要求5所述的方法,其中所述特定組的度量包括:視頻對-中心度量的全部。
7.根據(jù)權(quán)利要求5所述的方法,其中所述特定組的度量僅包括如下的一個: 所述視頻對的協(xié)作過濾度量;和 所述視頻對的基于內(nèi)容的過濾度量。
8.根據(jù)權(quán)利要求7所述的方法,還包括使用與所述配對試驗不同的第二配對試驗,來確定是否為所述視頻對保持如下的另一個: 所述視頻對的協(xié)作過濾度量;和 所述視頻對的基于內(nèi)容的過濾度量。
9.根據(jù)權(quán)利要求1所述的方法,其中: 對于所述特定視頻的輸入饋送包括多個協(xié)作過濾分?jǐn)?shù);并且 所述多個協(xié)作過濾分?jǐn)?shù)的每個協(xié)作過濾分?jǐn)?shù)是基于相同的原始的協(xié)作過濾特征,但所述多個協(xié)作過濾分?jǐn)?shù)具有彼此不同的衰減因數(shù)。
10.根據(jù)權(quán)利要求1所述的方法,其中: 對于所述特定視頻產(chǎn)生的ML分?jǐn)?shù)是機(jī)器學(xué)習(xí)引擎為所述特定視頻產(chǎn)生的多個分量分?jǐn)?shù)之一;并且 所述方法還包括,基于目標(biāo)信息來組合多個分量分?jǐn)?shù),以對于所述特定視頻產(chǎn)生合成ML分?jǐn)?shù)。
11.根據(jù)權(quán)利要求1所述的方法,其中: 對于所述特定視頻產(chǎn)生的ML分?jǐn)?shù)是機(jī)器學(xué)習(xí)引擎為所述特定視頻產(chǎn)生的多個分量分?jǐn)?shù)之一;并且 所述方法還包括,交替使用所述多個分量分?jǐn)?shù)的某些分量分?jǐn)?shù),這些分量分?jǐn)?shù)被用作選擇哪些視頻要推薦給特定用戶的基礎(chǔ)。
12.—種方法,包括: 對于一組候選視頻中的每個視頻,通過將對應(yīng)輸入饋送提供到機(jī)器學(xué)習(xí)引擎,產(chǎn)生多個機(jī)器學(xué)習(xí)(ML)分?jǐn)?shù); 其中與所述候選視頻組中的一個特定視頻相對應(yīng)的輸入饋送包括多個參數(shù)值; 至少部分地基于ML分?jǐn)?shù),從所述候選視頻組中選擇一個或多個視頻以推薦給特定用戶; 其中為所述特定用戶的推薦而選擇的所述一個或多個視頻包括所述特定視頻; 對于所述特定視頻,基于機(jī)器學(xué)習(xí)引擎產(chǎn)生所述特定視頻的ML分?jǐn)?shù)時如何加權(quán)多個參數(shù)值,從多個可能推薦原因中確定推薦原因; 與所述特定視頻的推薦相關(guān)聯(lián)地,把關(guān)于所述推薦原因的說明呈現(xiàn)給所述特定用戶; 其中所述方法由一個或多個計算裝置執(zhí)行。
13.—種方法,包括: 對于一組候選視頻中的每個視頻,通過將對應(yīng)輸入饋送提供到機(jī)器學(xué)習(xí)引擎,產(chǎn)生多個機(jī)器學(xué)習(xí)(ML)分?jǐn)?shù); 其中與所述候選視頻組中的一個特定視頻相對應(yīng)的輸入饋送包括多個參數(shù)值; 其中所述多個參數(shù)值包括第一組參數(shù)值和第二組參數(shù)值; 其中基于采用特定模型調(diào)諧參數(shù)的模型,來產(chǎn)生所述第一組參數(shù)值; 其中對關(guān)于所述特定模型調(diào)諧參數(shù)的多個模型調(diào)諧參數(shù)值的每個模型調(diào)諧參數(shù)值,所述第一組參數(shù)值包括至少一個參數(shù)值,該至少一個參數(shù)值是基于所述模型調(diào)諧參數(shù)值;其中所述第二組參數(shù)值包括獨立于所述模型調(diào)諧參數(shù)的一個或多個參數(shù)值; 其中,當(dāng)產(chǎn)生所述特定視頻的ML分?jǐn)?shù)時,機(jī)器學(xué)習(xí)引擎至少部分地基于所述第二組參數(shù)值中的參數(shù)值,確定將多大權(quán)重給予所述第一組參數(shù)值中的每個參數(shù)值;及 至少部分地基于ML分?jǐn)?shù),從所述候選視頻組中選擇一個或多個視頻以推薦給特定用戶; 其中所述方法由一個或多個計算裝置執(zhí)行。
14.根據(jù)權(quán)利要求13所述的方法,其中所述特定模型調(diào)諧參數(shù)是由所述模型使用的衰減因數(shù)。
15.根據(jù)權(quán)利要求13所述的方法,其中所述特定模型調(diào)諧參數(shù)是由所述模型使用的機(jī)率-比值截止。
16.根據(jù)權(quán)利要求13所述的方法,其中所述特定模型調(diào)諧參數(shù)是由所述模型使用的標(biāo)準(zhǔn)化因數(shù)。
17.根據(jù)權(quán)利要求13所述的方法,其中: 所述模型使用多個模型調(diào)諧參數(shù);并且 在第一組參數(shù)值中的每個參數(shù)值是基于所述多個模型調(diào)諧參數(shù)中的模型調(diào)諧參數(shù)值的不同組合。
18.根據(jù)權(quán)利要求1所述的方法,還包括: 基于行為數(shù)據(jù)建立bloom過濾器,該行為數(shù)據(jù)指示用戶最近與之互動的視頻;和 通過使用bloom過濾器,濾除與用戶最近與之互動的所述視頻不相關(guān)的協(xié)作過濾特征和基于內(nèi)容的過濾特征,以產(chǎn)生用于機(jī)器學(xué)習(xí)系統(tǒng)的訓(xùn)練輸入。
19.根據(jù)權(quán)利要求1所述的方法,還包括進(jìn)行基于內(nèi)容的過濾特征與協(xié)作過濾特征的非對稱聯(lián)合,從而僅將基于內(nèi)容的過濾特征與在一個閾值時間段內(nèi)產(chǎn)生的協(xié)作過濾特征相聯(lián)合。
20.根據(jù)權(quán)利要求1所述的方法,還包括:通過至少部分地基于ML分?jǐn)?shù)將候選視頻組合到池中,以及使用多臂老虎機(jī)技術(shù)從池中選擇待推薦的視頻,來進(jìn)行有限度的探查。
21.根據(jù)權(quán)利要求20所述的方法,其中所述多臂老虎機(jī)技術(shù)涉及epsilon-貪婪策略。
22.—種或多種非暫態(tài)計算機(jī)可讀介質(zhì),存儲指令,這些指令當(dāng)由一個或多個處理器執(zhí)行時,引起權(quán)利要求1-21任一項所述的方法的執(zhí)行。
23.—種系統(tǒng),包括一個或多個計算裝置,該一個或多個計算裝置配置成,引起在權(quán)利要求1-21任一項中敘述的方法的執(zhí)行。
【文檔編號】H04N21/45GK104247441SQ201380017911
【公開日】2014年12月24日 申請日期:2013年2月21日 優(yōu)先權(quán)日:2012年2月21日
【發(fā)明者】徐智晨, S·阿布厄海伽, 黃磊, N·霍弗恩 申請人:歐亞拉股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
师宗县| 曲靖市| 朝阳市| 雷州市| 敖汉旗| 和平区| 喜德县| 顺义区| 峨眉山市| 思南县| 高台县| 沐川县| 沂源县| 土默特左旗| 北安市| 泸溪县| 柘城县| 嵊泗县| 广西| 定安县| 凉城县| 江城| 孝感市| 太康县| 澄江县| 巴林左旗| 开鲁县| 沙坪坝区| 榆树市| 沈阳市| 科尔| 阳春市| 日照市| 玉屏| 榆社县| 庄河市| 额济纳旗| 台江县| 土默特右旗| 杭锦旗| 南华县|