型和特征向量X的特征類(lèi)型,即向量X的分量元 素。質(zhì)量向量的每個(gè)元素將與特征向量的特定特征相關(guān)聯(lián)的固有數(shù)據(jù)有關(guān)信息考慮在內(nèi)。
[0060] 例如,在信號(hào)處理或圖像處理領(lǐng)域,當(dāng)數(shù)據(jù)是圖像或者是采集到的由傳感器采集 的代表性信號(hào)時(shí),經(jīng)常將數(shù)據(jù)的頻率表示(例如,傅里葉變換)或者時(shí)頻表示(例如,小波變 換)用作特征向量X。特征向量的每個(gè)分量則僅取決于某些頻帶。
[0061] 在此情況下,數(shù)據(jù)的高頻分量證明比低頻分量更容易識(shí)別,但同樣對(duì)于諸如存在 噪聲或者信號(hào)分辨率低這樣的現(xiàn)象更加靈敏。
[0062] 如果數(shù)據(jù)是由傳感器采集的信號(hào),則數(shù)據(jù)中的噪聲量能夠通過(guò)分析數(shù)據(jù)的頻譜來(lái) 確定;或者如果數(shù)據(jù)是圖像,則通過(guò)分析數(shù)據(jù)的固有分辨率來(lái)確定。例如,已知Pfenning和 Kirchner在2012年ISCCP(International Satellite Cloud Climatology Project,國(guó)際 衛(wèi)星云氣候?qū)W計(jì)劃)的用于確定圖像分辨率的文章 《Spectral Methods to Determine the Exact Scaling Factor of Resampled Digital Images》(用于確定重米樣數(shù)字圖像的精 確比例因子的頻譜方法)。
[0063 ]根據(jù)特征向量X和數(shù)據(jù)的固有質(zhì)量生成的質(zhì)量向量qx則能夠如下構(gòu)造:
[0064] -將高質(zhì)量賦予特征向量中對(duì)數(shù)據(jù)的低頻分量靈敏的分量;
[0065] -將高質(zhì)量賦予特征向量中對(duì)數(shù)據(jù)的高頻分量靈敏并且具有低噪聲水平和/或高 分辨率的分量;
[0066] -將低質(zhì)量賦予特征向量中對(duì)高頻分量靈敏并且具有高噪聲水平和/或低分辨率 的分量。
[0067] 所賦予的質(zhì)量值以及噪聲水平或分辨率的閾值能夠以實(shí)驗(yàn)方式確定,以便在驗(yàn)證 基礎(chǔ)上優(yōu)化比較方法的性能。
[0068]根據(jù)另一示例,數(shù)據(jù)是面部圖像。
[0069] 根據(jù)該不例,如Chen等人在2013年的VCPR(World Climate Research Programme, 世界氣候研究計(jì)劃)的文章 《Blessing of Dimensionality:High_dimensional Feature and Its Efficient Compression for Face Verification》(來(lái)自維度的恩賜:高維度特 征及其對(duì)于面部檢驗(yàn)的高效壓縮)中,通過(guò)將從面部的某些語(yǔ)義點(diǎn)(例如,鼻尖、嘴角、眼睛 等)附近提取的局部描述符相連接能夠獲得特征向量。
[0070] 與在規(guī)則網(wǎng)格處提取描述符的方法相比,該表示的優(yōu)點(diǎn)在于對(duì)姿勢(shì)的變化具有更 好的魯棒性。
[0071] 然而,這些特征的提取包括檢測(cè)這些點(diǎn)的步驟。在整個(gè)該步驟中,所使用的檢測(cè)器 在提供面部的每個(gè)點(diǎn)在圖像中的最可能的位置外,還提供解釋檢測(cè)精度的置信水平的信 息。
[0072] 例如從Rapp等人在2011 年的Automatic Face&Gesture Recognition(自動(dòng)面部和 姿勢(shì)識(shí)別)的文章 《Blessing of Dimensionality:Multiple kernel learning SVM and statistical validation for facial landmark detection》(來(lái)自維度的恩賜:面部特征 點(diǎn)檢測(cè)的多核學(xué)習(xí) SVM和統(tǒng)計(jì)驗(yàn)證)已知測(cè)量方法,該測(cè)量方法在使用基于支持向量機(jī) (SVM,Support Vector Machine)的檢測(cè)器時(shí)測(cè)量到分離超平面的距離。
[0073] 另一不例在Dantone等人在2012年的CVPR的文章《Real-time Facial Feature Detection using Conditional Regression Forests》(使用條件回歸森林的實(shí)時(shí)面部特 征檢測(cè)),其中,信度測(cè)量由檢測(cè)器使用回歸樹(shù)確定的大量票數(shù)給出。
[0074] 該信度信息能夠被用于通過(guò)向特征向量的每個(gè)分量賦予對(duì)應(yīng)于該分量的面部語(yǔ) 義點(diǎn)的檢測(cè)質(zhì)量來(lái)生成與特征向量的每個(gè)分量相關(guān)聯(lián)的質(zhì)量。
[0075] 根據(jù)進(jìn)一步的示例,當(dāng)面部圖像是根據(jù)并非是面部正面圖像的圖像生成的面部圖 像時(shí),例如,通過(guò)應(yīng)用專(zhuān)利申請(qǐng)F(tuán)R 2998402中所述的方法,質(zhì)量向量可以是信度指數(shù),該指 數(shù)對(duì)于出現(xiàn)在原始圖像中的面部的點(diǎn)相對(duì)較高并且對(duì)于并未出現(xiàn)在原始圖像中而是在通 過(guò)插值重新構(gòu)建圖像中的面部的點(diǎn)相對(duì)較低。
[0076] 更普遍地,當(dāng)數(shù)據(jù)是圖像時(shí),質(zhì)量向量能夠通過(guò)模糊局部測(cè)量來(lái)得到。
[0077] 替代性地,特征提取模塊是采集單元30的一個(gè)模塊,特征提取模塊使得采集單元 能夠直接與處理裝置11傳送特征向量和相關(guān)聯(lián)的質(zhì)量向量。
[0078]數(shù)據(jù)比較方法
[0079]參考圖2,在此給出了對(duì)處理單元的處理裝置11實(shí)現(xiàn)的數(shù)據(jù)比較方法的說(shuō)明。
[0080]該方法包括通過(guò)計(jì)算分別從數(shù)據(jù)中得到的大小相同的兩個(gè)特征向量X和y之間的 相似度函數(shù)1〇〇,并且通過(guò)實(shí)現(xiàn)數(shù)據(jù)庫(kù)上的相似度函數(shù)的參數(shù)的機(jī)器學(xué)習(xí)200,來(lái)對(duì)兩個(gè)數(shù) 據(jù)項(xiàng)目進(jìn)行比較。
[0081 ]在該方法中,每個(gè)特征向量被建模為三個(gè)獨(dú)立的高斯變量求和:
[0082] χ=μ+ω+ε
[0083] 其中:
[0084] -μ為向量X所屬的類(lèi)的平均值;
[0085] -ω為向量X與平均值的固有偏差;以及
[0086] _ε為觀測(cè)噪聲。
[0087] 類(lèi)是被認(rèn)為相似的一組特征向量。如果使用相似度函數(shù)對(duì)兩個(gè)特征向量的比較產(chǎn) 生的結(jié)果高于由經(jīng)驗(yàn)確定的閾值,則兩個(gè)特征向量被認(rèn)為相似。
[0088] 例如,如果數(shù)據(jù)是面部圖像,類(lèi)有利地對(duì)應(yīng)于個(gè)體。通過(guò)對(duì)多個(gè)數(shù)據(jù)的兩個(gè)特征向 量進(jìn)行比較,如果數(shù)據(jù)來(lái)自同一個(gè)體,則被認(rèn)為相似。
[0089] 回到之前所述的模型,屬于同一類(lèi)的兩個(gè)特征向量因而具有相同的μ值,但是具有 不同的ω和ε值。
[0090]如果特征向量屬于不同的類(lèi),貝lj三個(gè)變量完全獨(dú)立。
[0091] 則認(rèn)為這三個(gè)變量滿足中位數(shù)為0的多變量正態(tài)分布,并且各協(xié)方差矩陣被記為 Su、S?和ShSu被稱(chēng)為類(lèi)間協(xié)方差矩陣,為類(lèi)內(nèi)協(xié)方差矩陣且s£為觀測(cè)噪聲協(xié)方差矩陣。
[0092] Sw、Su對(duì)于全部特征向量都是未知數(shù)。
[0093]另一方面,3£是已知的,這是因?yàn)槭怯商卣魈崛∧P蛷呐c特征向量相關(guān)量的質(zhì)量 向量中得到的。s£與相關(guān)聯(lián)的特征向量具有相同的大小。
[0094] 例如,假定觀測(cè)噪聲彼此不相關(guān),則Se能夠由對(duì)角矩陣充分近似。
[0095] 與質(zhì)量向量的分量的方差對(duì)應(yīng)的該對(duì)角矩陣的元素能夠根據(jù)該向量得到。
[0096] 例如,通過(guò)向質(zhì)量向量qx的分量應(yīng)用f (qx) = l/eaqx+b類(lèi)型的Sigmoid函數(shù)來(lái)利用方 差。能夠選擇系數(shù)a和b以將確定的方差水平與質(zhì)量水平相聯(lián)系。
[0097]例如,高質(zhì)量能夠與零方差相關(guān)聯(lián),極低質(zhì)量能夠與最大方差相關(guān)聯(lián),中間方差對(duì) 應(yīng)于中間質(zhì)量。
[0098] 通常來(lái)說(shuō),因?yàn)橘|(zhì)量向量和特征向量取決于數(shù)據(jù)類(lèi)型,所以將質(zhì)量向量轉(zhuǎn)換為噪 聲協(xié)方差矩陣的傳遞函數(shù)特定于相關(guān)聯(lián)的質(zhì)量向量和特征向量。
[0099] 在本申請(qǐng)的其他部分,SEx表示根據(jù)質(zhì)量向量qx得到的向量X的背景噪聲的協(xié)方差 矩陣,并且SEy為根據(jù)質(zhì)量向量qy得到的向量y的背景噪聲的協(xié)方差矩陣。
[0100] Hsim表示假設(shè)兩個(gè)特征向量屬于同一類(lèi),即認(rèn)為對(duì)應(yīng)的數(shù)據(jù)相似,并且Hdls表示相 反的假設(shè),特征向量屬于不同類(lèi)并且認(rèn)為對(duì)應(yīng)的數(shù)據(jù)不相似。
[0101]已知X和y的各自背景噪聲的協(xié)方差矩陣并且考慮到假設(shè)Hsim,x和y的聯(lián)合生成概
,該概率符合高斯律,其中位數(shù)為零并且協(xié)方差矩陣為
[0102] 已知X和y的各自背景噪聲的協(xié)方差矩陣并且考慮到假設(shè)Hdls,x和y的聯(lián)合發(fā)生概
,該概率符合高斯律,其中位數(shù)為零并且協(xié)方差矩陣為
[0103] 矩陣Ssim和Sdis的定義如下:
[0106]
的概率密度以已知方式為
其中,| S