專利名稱:跨媒體多視角非完美標(biāo)簽學(xué)習(xí)方法
技術(shù)領(lǐng)域:
本發(fā)明屬于標(biāo)簽技術(shù)領(lǐng)域,特別地涉及一種跨媒體多視角非完美標(biāo)簽學(xué)習(xí)方法。
背景技術(shù):
隨著信息時(shí)代的到來(lái),多媒體數(shù)據(jù)已經(jīng)實(shí)現(xiàn)了爆炸性的增長(zhǎng)。標(biāo)簽,作為多媒體的內(nèi)容形式之一,能幫助解決數(shù)據(jù)挖掘方面很多重要的現(xiàn)實(shí)應(yīng)用,特別是在跨媒體領(lǐng)域,體現(xiàn)出非常重要的作用。例如,利用合適的標(biāo)簽作為圖像注釋的一部分,可以開發(fā)出強(qiáng)大的圖像標(biāo)注和圖像檢索技術(shù);利用合適的標(biāo)簽作為電影評(píng)論的一部分,可以開發(fā)出有效的電影推薦系統(tǒng);利用合適的標(biāo)簽作為網(wǎng)頁(yè)標(biāo)記的一部分,可以開發(fā)出更有效率的搜索引擎。然而,由于數(shù)據(jù)量日新月異爆炸性的增長(zhǎng),僅僅依靠數(shù)據(jù)處理人員對(duì)所有的數(shù)據(jù)手工加標(biāo)簽是不現(xiàn)實(shí)的。在這種前提下,社會(huì)標(biāo)簽就應(yīng)運(yùn)而生了。社會(huì)標(biāo)簽,又稱合作標(biāo)簽,社會(huì)分類法,是一種讓普通大眾用戶能將在線的數(shù)字資源和自己提供的標(biāo)簽做關(guān)聯(lián)的 方法,是由用戶產(chǎn)生的、對(duì)網(wǎng)絡(luò)內(nèi)容進(jìn)行組織和共享的自下而上的組織分類體系。在這里,普通民眾都可以通過(guò)在線環(huán)境在相應(yīng)的系統(tǒng)中為自己感興趣的數(shù)字資源添加自己覺得合適的標(biāo)簽。正是基于這種特點(diǎn),社會(huì)標(biāo)簽的結(jié)果往往是不完美的,因?yàn)槊恳晃粎⑴c社會(huì)標(biāo)簽的普通用戶都不能排除自己的主觀性,粗心大意,甚至是缺乏耐心去提供一個(gè)完美的標(biāo)簽。社會(huì)標(biāo)簽的非完美性一般可以體現(xiàn)在兩個(gè)子問(wèn)題一、不完整標(biāo)簽;二、噪聲標(biāo)簽。不完整標(biāo)簽表示給定的標(biāo)簽都是正確的,但是不能完整的描述數(shù)字資源的所有的細(xì)節(jié),即數(shù)字資源中的一些對(duì)象被漏標(biāo)了標(biāo)簽。而噪聲標(biāo)簽表示給定的標(biāo)簽中包含有噪聲,即數(shù)字資源中的一些對(duì)象被標(biāo)上了錯(cuò)誤的標(biāo)簽或者被漏標(biāo)了標(biāo)簽。事實(shí)上,不完整標(biāo)簽是噪聲標(biāo)簽的一個(gè)特例,即不完整標(biāo)簽是只有漏標(biāo)標(biāo)簽沒(méi)有錯(cuò)誤標(biāo)簽的噪聲標(biāo)簽。為了更好的利用社會(huì)標(biāo)簽為進(jìn)一步的數(shù)據(jù)處理分析服務(wù),必須盡可能的改正錯(cuò)誤標(biāo)簽和補(bǔ)全漏標(biāo)標(biāo)簽,即盡可能的降低標(biāo)簽的非完美性。因此,非完美標(biāo)簽學(xué)習(xí)算法應(yīng)運(yùn)而生,并且有著非常廣闊的應(yīng)用前景和非常重要的實(shí)用價(jià)值。數(shù)據(jù)被標(biāo)上的標(biāo)簽越多,標(biāo)簽空間中包含的信息也就越多,這些信息可以被利用起來(lái)。當(dāng)判斷數(shù)據(jù)點(diǎn)是否應(yīng)該標(biāo)上某個(gè)標(biāo)簽時(shí),該數(shù)據(jù)點(diǎn)已有的其他標(biāo)簽會(huì)對(duì)判斷起到一定的幫助作用。例如,當(dāng)一幅包含動(dòng)物的圖像已有的標(biāo)簽為天空,云,草地,樹木的時(shí)候,它更可能被標(biāo)上的標(biāo)簽是鳥而不是魚。多標(biāo)簽空間中包含的信息在某種程度上可以幫助我們更好的進(jìn)行標(biāo)簽補(bǔ)全和糾錯(cuò)。隨著獲取數(shù)據(jù)的終端的多樣化,數(shù)據(jù)一般都擁有多視角的特征,尤其是在跨媒體領(lǐng)域,一個(gè)事件會(huì)被文本,圖像,聲音,視頻等多個(gè)視角進(jìn)行記錄和描述。即使是只有一種媒體,也可以把該媒體的多個(gè)相互條件獨(dú)立的特征看作為多視角的特征。例如圖像,可以從紋理,顏色,區(qū)域形狀等多個(gè)視角進(jìn)行分析。多個(gè)視角類似于多個(gè)獨(dú)立的歷史學(xué)家對(duì)于同一個(gè)歷史事件的記錄,盡管在這些記錄中存在著一定的重疊部分,但是這些記錄中的非重疊部分卻是最有價(jià)值的,能夠幫助后人盡可能的系統(tǒng)性的恢復(fù)整個(gè)歷史事件,甚至糾正單個(gè)歷史學(xué)家關(guān)于該歷史事件的一些零星出現(xiàn)的主觀性的錯(cuò)誤描述。同樣,利用跨媒體多視角對(duì)非完美標(biāo)簽進(jìn)行學(xué)習(xí),也能達(dá)到補(bǔ)全標(biāo)簽,糾正標(biāo)簽,恢復(fù)標(biāo)簽原本面貌的目的,以降低標(biāo)簽的非完美性。因此,跨媒體多視角非完美標(biāo)簽學(xué)習(xí)已經(jīng)成為當(dāng)前數(shù)據(jù)挖掘領(lǐng)域一個(gè)非常前沿的研究方向。
發(fā)明內(nèi)容
為解決上述問(wèn)題,本發(fā)明的目的在于提供一種跨媒體多視角非完美標(biāo)簽學(xué)習(xí)方法,用于利用多視角對(duì)原始的非完美標(biāo)簽訓(xùn)練集進(jìn)行標(biāo)簽補(bǔ)全和標(biāo)簽去噪,對(duì)標(biāo)簽進(jìn)行補(bǔ)全和糾錯(cuò)的同時(shí),得到一種更準(zhǔn)確的分類方法。為實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案為一種跨媒體多視角非完美標(biāo)簽學(xué)習(xí)方法,包括以下步驟
步驟1,對(duì)非完美標(biāo)簽訓(xùn)練集進(jìn)行預(yù)處理,在兩個(gè)相互條件獨(dú)立的視角上提取訓(xùn)練集的兩組特征,其中對(duì)非完美標(biāo)簽訓(xùn)練集I進(jìn)行預(yù)處理的方法為將非完美標(biāo)簽訓(xùn)練集 表示為J,訓(xùn)練集的兩個(gè)相互條件獨(dú)立的視角分別表示為:F⑷和戶w,訓(xùn)練集中的每個(gè)點(diǎn)Ii € Z都被標(biāo)上了多種多樣的標(biāo)簽,整個(gè)訓(xùn)練集的標(biāo)簽字典組成了 S維的多標(biāo)簽空間孓,當(dāng)任何一個(gè)標(biāo)簽I; (I ^S)作為二分類的目標(biāo)時(shí),其余的標(biāo)簽就會(huì)組成一個(gè)S-I維的標(biāo)簽
特征空間_£,訓(xùn)練集中的每個(gè)點(diǎn)/^ £ J在兩個(gè)視角中的特征向量分別表示為X,3和xf'在標(biāo)簽字典中的標(biāo)簽向量表示為Cli = (dia, dij2, , dijS)/,其中Cli^e {0,1},1彡r彡S表示字典中的第r個(gè)標(biāo)簽I;是否在Ii中出現(xiàn),對(duì)于每一個(gè)標(biāo)簽 ;,I < r < S,一個(gè)包含有^
個(gè)點(diǎn)的非完美標(biāo)簽訓(xùn)練集表示為. 二 IVfi1 = IxfiUfUigh對(duì)于爲(wèi)中的每一個(gè)點(diǎn)I1,用Jri,r表不Ii的權(quán)重,用OC)分別表不分類器對(duì)Ii在兩個(gè)視角和中的輸出值,
用#I 和Pf分別表示在兩個(gè)視角;中的校準(zhǔn)后驗(yàn)概率,權(quán)重Iu r e [-1,I],值
越大代表標(biāo)簽Tr出現(xiàn)在數(shù)據(jù)點(diǎn)Ii中的概率越大,反之值越小代表標(biāo)簽Tr不會(huì)出現(xiàn)在數(shù)據(jù)點(diǎn)Ii中的概率越大;步驟2,利用所述兩組特征和訓(xùn)練集現(xiàn)有的非完美標(biāo)簽,利用提出的一種新的多標(biāo)簽二視角柔性支持向量機(jī)中進(jìn)行訓(xùn)練,得到一組訓(xùn)練參數(shù),其中所述多標(biāo)簽二視角柔性支持向量機(jī)的建立方法為在多標(biāo)簽一對(duì)多One VsAll的分類模式中,當(dāng)一個(gè)標(biāo)簽I;被作為分類目標(biāo)時(shí),標(biāo)簽字典中其余的標(biāo)簽就會(huì)組成一個(gè)S-I維的標(biāo)簽特征空間£,在空間X中距離越近的點(diǎn)他們的分類相似度也越高,用Li表示Ii在空間_£中的特征向量,Li = (d,,1; ...,dm,di,r+1, ...,O',Li在空間£中的領(lǐng)域,包括Li自己,表示為L(zhǎng)i和其領(lǐng)域J(Ii)中數(shù)據(jù)點(diǎn)的分類結(jié)果相似度高,和非鄰域數(shù)據(jù)點(diǎn)的分類結(jié)果相似度低,令■Λ = UHj e丨,多標(biāo)簽二視角柔性支持向量機(jī)mss-2k分類器的優(yōu)化式如下所示
min IlIwwII2 + ^iIwwII2 + Cw + C( J] Ijiifw + 幺 W [ C_;f
W*,WL· MT. M. I. I.
1=1I=If=l
f CI = J
_ 2] Cij = j C*fedis{L·, Lj) φ 'j (C* ( QS.t. V =]
J|(W TX + 爐)> |y,|2 一 w@)5 ¢) > 0
權(quán)利要求
1.一種跨媒體多視角非完美標(biāo)簽學(xué)習(xí)方法,其特征在于,包括以下步驟 步驟1,對(duì)非完美標(biāo)簽訓(xùn)練集進(jìn)行預(yù)處理,在兩個(gè)相互條件獨(dú)立的視角上提取訓(xùn)練集的兩組特征,其中對(duì)非完美標(biāo)簽訓(xùn)練集I進(jìn)行預(yù)處理的方法為將非完美標(biāo)簽訓(xùn)練集表示為J,訓(xùn)練集的兩個(gè)相互條件獨(dú)立的視角分別表示為Tw和戶,訓(xùn)練集中的每個(gè)點(diǎn)Zi- € J都被標(biāo)上了多種多樣的標(biāo)簽,整個(gè)訓(xùn)練集的標(biāo)簽字典組成了 s維的多標(biāo)簽空間《Γ,當(dāng)任何一個(gè)標(biāo)簽I; (I ^S)作為二分類的目標(biāo)時(shí),其余的標(biāo)簽就會(huì)組成一個(gè)S-I維的標(biāo)簽特征空間I,訓(xùn)練集中的每個(gè)點(diǎn)Ji € J在兩個(gè)視角中的特征向量分別表示為X”和xf\在標(biāo)簽字典中的標(biāo)簽向量表示為(Ii = (dia, dij2, . . . , dijS);,其中du e {0,1}, I彡r彡S表示字典中的第r個(gè)標(biāo)簽I;是否在Ii中出現(xiàn),對(duì)于每一個(gè)標(biāo)簽 ;,I < r < S,一個(gè)包含有^個(gè)點(diǎn)的非完美標(biāo)簽訓(xùn)練集表示為
全文摘要
本發(fā)明實(shí)施例公開了一種跨媒體多視角非完美標(biāo)簽學(xué)習(xí)方法,包括以下步驟對(duì)非完美標(biāo)簽訓(xùn)練集進(jìn)行預(yù)處理,在兩個(gè)相互條件獨(dú)立的視角上提取訓(xùn)練集的兩組特征;利用兩組特征和訓(xùn)練集現(xiàn)有的非完美標(biāo)簽,利用一種新的多標(biāo)簽二視角柔性支持向量機(jī)中進(jìn)行訓(xùn)練,得到一組訓(xùn)練參數(shù);利用這組訓(xùn)練參數(shù)對(duì)訓(xùn)練集在兩個(gè)視角和中分別獨(dú)立進(jìn)行再分類,得到訓(xùn)練集在兩個(gè)視角中的兩組獨(dú)立的分類結(jié)果;對(duì)這兩組分類結(jié)果和進(jìn)行概率化處理,得到訓(xùn)練集在兩個(gè)視角中的兩組獨(dú)立的概率化的分類結(jié)果;利用提出的一組新的補(bǔ)全和去噪算法,得到訓(xùn)練集新的非完美標(biāo)簽;直到得到的訓(xùn)練集新的非完美標(biāo)簽和原有的非完美標(biāo)簽變化小于設(shè)定的閾值,則終止迭代過(guò)程。
文檔編號(hào)G06F17/30GK102945255SQ20121039633
公開日2013年2月27日 申請(qǐng)日期2012年10月18日 優(yōu)先權(quán)日2012年10月18日
發(fā)明者祁仲昂, 楊名, 張仲非, 張正友 申請(qǐng)人:浙江大學(xué)