特征提取技術(shù)的制作方法
【專利摘要】一種用于特征提取的計(jì)算機(jī)實(shí)施的技術(shù),包括:獲得對(duì)象的電子圖像;以及對(duì)電子圖像進(jìn)行邊緣檢測(cè)算法。該技術(shù)還包括進(jìn)行邊緣合并算法以及采樣電子圖像邊緣片、顏色片和紋理片。通過(guò)以下方式從邊緣片、顏色片和紋理片選擇片組:基于邊緣片組、顏色片組和紋理片組中的每個(gè)片距該片組中的第i片的歐幾里得距離來(lái)選擇要在該片組內(nèi)的第i+1片。進(jìn)行部件選擇算法和部件合并算法以獲得配準(zhǔn)至對(duì)象的部件。
【專利說(shuō)明】特征提取技術(shù)
【技術(shù)領(lǐng)域】
[0001]本公開內(nèi)容總體上涉及從電子圖像提取特征,并且更具體地涉及利用基于模型的算法和數(shù)據(jù)驅(qū)動(dòng)的算法兩者對(duì)電子圖像進(jìn)行特征提取的技術(shù)。
【背景技術(shù)】
[0002]本部分提供與本公開內(nèi)容有關(guān)的背景信息,其不一定是現(xiàn)有技術(shù)。
[0003]特征提取為許多圖像處理任務(wù)例如圖像分類和對(duì)象識(shí)別等提供基礎(chǔ)。傳統(tǒng)的特征提取技術(shù)可以分類為基于模型的方法、數(shù)據(jù)驅(qū)動(dòng)的方法或基于模型的方法和數(shù)據(jù)驅(qū)動(dòng)的方法的某種組合。基于模型的特征提取方法通常利用通過(guò)訓(xùn)練圖像而獲得的規(guī)則來(lái)將特征映射至未知圖像中的對(duì)象。數(shù)據(jù)驅(qū)動(dòng)的特征提取方法通常利用相對(duì)大量的訓(xùn)練圖像,根據(jù)這些訓(xùn)練圖像來(lái)得出特征至對(duì)象的映射示例。組合或“混合”方法利用規(guī)則以及特征至對(duì)象的映射示例的組合。
[0004]本公開內(nèi)容提供一種特征提取技術(shù),其利用基于模型的方法和數(shù)據(jù)驅(qū)動(dòng)的方法兩者來(lái)在例如圖像分類和對(duì)象識(shí)別中獲得改善了的性能。
【發(fā)明內(nèi)容】
[0005]本部分提供本公開內(nèi)容的一般概要,而不是對(duì)本公開內(nèi)容的全部范圍或所有特征的全面公開。
[0006]在本公開內(nèi)容的各種實(shí)施方式中,公開了一種計(jì)算機(jī)實(shí)施的技術(shù)。該技術(shù)包括:獲得對(duì)象的電子圖像;以及對(duì)電子圖像進(jìn)行邊緣檢測(cè)算法以獲得與該對(duì)象對(duì)應(yīng)的第一組邊緣。該技術(shù)還包括對(duì)第一組邊緣進(jìn)行邊緣合并算法以獲得第二組邊緣,第二組邊緣的數(shù)量小于第一組邊緣的數(shù)量。對(duì)電子圖像進(jìn)行采樣以獲得基于第二組邊緣的邊緣片組、顏色片組和紋理片組。該技術(shù)還包括:通過(guò)當(dāng)片組中的第i片與第i+Ι片之間的歐幾里得距離大于或等于所述第i片與所有其他片之間的歐幾里得距離時(shí)將第i+Ι片選擇到所述片組內(nèi),來(lái)從邊緣片組、顏色片組和紋理片組中選擇片組。此外,該技術(shù)包括對(duì)所選擇的片組進(jìn)行部件選擇算法以獲得第一組部件,并且對(duì)第一組部件進(jìn)行部件合并算法以獲得第二組部件。第二組部件的數(shù)量小于第一組部件的數(shù)量。部件合并算法包括:(i)將第一組部件中的每個(gè)部件分成多個(gè)子部件;以及(ii)對(duì)子部件中的每個(gè)子部件進(jìn)行MAX運(yùn)算。該技術(shù)還包括將第二組部件配準(zhǔn)至對(duì)象。
[0007]在本公開內(nèi)容的各種實(shí)施方式中,公開了一種特征提取。該特征提取技術(shù)包括邊緣檢測(cè)模塊,其確定與電子圖像的對(duì)象相對(duì)應(yīng)的第一組邊緣。該特征提取技術(shù)還包括邊緣合并模塊,其根據(jù)第一組邊緣確定第二組邊緣,其中第二組邊緣的數(shù)量小于第一組邊緣的數(shù)量。此外,該特征提取技術(shù)包括:邊緣片采樣模塊,其基于第二組邊緣采樣邊緣片組;顏色片采樣模塊,其從電子圖像采樣顏色片組;以及紋理片采樣模塊,其從電子圖像采樣紋理片組。該特征提取技術(shù)的片選擇模塊通過(guò)當(dāng)片組中的第i片與第i+Ι片之間的歐幾里得距離大于或等于第i片與所有其他片之間的歐幾里得距離時(shí)將該第i+Ι片選擇到該片組內(nèi),來(lái)從邊緣片組、顏色片組和紋理片組選擇片組。該特征提取技術(shù)還包括部件選擇模塊,其基于所選擇的片組來(lái)確定第一組部件。此外,該特征提取技術(shù)包括:部件合并模塊,其基于第一組部件確定第二組部件,第二組部件的數(shù)量小于第一組部件的數(shù)量,其中,部件合并算法包括:(i )將第一組部件中的每個(gè)部件分成多個(gè)子部件;以及(ii )對(duì)子部件中的每個(gè)子部件進(jìn)行MAX運(yùn)算。此外,該特征提取技術(shù)包括將第二組部件配準(zhǔn)至對(duì)象的對(duì)象配準(zhǔn)模塊。
[0008]在本公開內(nèi)容的各種實(shí)施方式中,公開了一種計(jì)算機(jī)實(shí)施的技術(shù)。該技術(shù)包括:獲得對(duì)象的電子圖像;以及對(duì)電子圖像進(jìn)行邊緣檢測(cè)算法以獲得與對(duì)象對(duì)應(yīng)的第一組邊緣。該技術(shù)還包括對(duì)第一組邊緣進(jìn)行邊緣合并算法以獲得第二組邊緣,第二組邊緣的數(shù)量小于第一組邊緣的數(shù)量。電子圖像被采樣以獲得基于第二組邊緣的邊緣片組、顏色片組和紋理片組。此外,該技術(shù)包括通過(guò)以下方式以從邊緣片組、顏色片組和紋理片組中選擇片組:基于邊緣片組、顏色片組和紋理片組中的每個(gè)片距該片組中的第i片的歐幾里得距離來(lái)選擇要在該片組內(nèi)的第i+Ι片。該技術(shù)還包括對(duì)所選擇的片組進(jìn)行部件選擇算法以獲得第一組部件,并且對(duì)第一組部件進(jìn)行部件合并算法以獲得第二組部件。第二組部件的數(shù)量小于第一組部件的數(shù)量。此外,該技術(shù)包括將第二組部件配準(zhǔn)至對(duì)象。
[0009]在本公開內(nèi)容的各種實(shí)施方式中,公開了一種特征提取。該特征提取技術(shù)包括邊緣檢測(cè)模塊,其確定與電子圖像的對(duì)象相對(duì)應(yīng)的第一組邊緣。該特征提取技術(shù)還包括:邊緣合并模塊,其根據(jù)第一組邊緣確定第二組邊緣,其中第二組邊緣的數(shù)量小于第一組邊緣的數(shù)量。此外,該特征提取技術(shù)包括:邊緣片采樣模塊,其基于第二組邊緣采樣邊緣片組;顏色片采樣模塊,其從電子圖像采樣顏色片組;以及紋理片采樣模塊,其從電子圖像采樣紋理片組。該特征提取技術(shù)的片選擇模塊通過(guò)以下方式從邊緣片組、顏色片組和紋理片組中選擇片組:基于邊緣片組、顏色片組和紋理片組中的每個(gè)片距該片組中的第i片的歐幾里得距離來(lái)選擇要在該片組內(nèi)的第i+Ι片。該特征提取技術(shù)還包括基于所選擇的片組來(lái)選擇第一組部件的部件選擇模塊。此外,該特征提取技術(shù)包括基于第一組部件確定第二組部件的部件合并模塊,其中第二組部件的數(shù)量小于第一組部件的數(shù)量。此外,該特征提取技術(shù)包括將第二組部件配準(zhǔn)至對(duì)象的對(duì)象配準(zhǔn)模塊。
[0010]根據(jù)本文所提供的描述,另外的應(yīng)用領(lǐng)域?qū)?huì)變得明顯。
【發(fā)明內(nèi)容】
部分中的描述和具體示例僅意在說(shuō)明而非意在限制本公開內(nèi)容的范圍。
【專利附圖】
【附圖說(shuō)明】
[0011]本文所描述的附圖僅出于對(duì)所選實(shí)施方式而非所有可能的實(shí)施方式進(jìn)行說(shuō)明的目的,并且不意在限制本公開內(nèi)容的范圍。
[0012]圖1是表示根據(jù)本公開內(nèi)容的一些實(shí)施方式的示例特征提取架構(gòu)的框圖;
[0013]圖2是要對(duì)其進(jìn)行根據(jù)本公開內(nèi)容的一些實(shí)施方式的特征提取技術(shù)的示例電子圖像的圖不;
[0014]圖3是根據(jù)本公開內(nèi)容的各種實(shí)施方式的示例特征提取技術(shù)的流程圖;
[0015]圖4是根據(jù)本公開內(nèi)容的各種實(shí)施方式的示例特征提取技術(shù)的框圖;以及
[0016]圖5是圖4所示的特征提取技術(shù)的片(patch)采樣模塊的示例的框圖。
[0017]貫穿附圖的若干視圖,相應(yīng)的附圖標(biāo)記表示相應(yīng)的部件?!揪唧w實(shí)施方式】
[0018]現(xiàn)將參考附圖更加充分地描述示例實(shí)施方式。
[0019]現(xiàn)參考圖1,示出了表示根據(jù)本公開內(nèi)容的一些實(shí)施方式的示例特征提取架構(gòu)10的框圖。特征提取架構(gòu)10提供一種用于對(duì)至少一個(gè)電子圖像40進(jìn)行特征提取以獲得與在電子圖像40中示出的一個(gè)或更多個(gè)對(duì)象映射或配準(zhǔn)的一組特征50。示例特征提取架構(gòu)10包括邊緣選擇11、邊緣合并(pooling) 12、顏色及紋理片13、稀疏正則化14、部件選擇15、部件合并16以及有監(jiān)督學(xué)習(xí)17。邊緣選擇11和邊緣合并12構(gòu)成用于特征提取的基于模型的算法20的一部分,而顏色及紋理片13構(gòu)成用于特征提取的數(shù)據(jù)驅(qū)動(dòng)的算法30。下面將更加充分地描述特征提取架構(gòu)10的每個(gè)要素。
[0020]現(xiàn)參考圖2,示出了將進(jìn)行特征提取的示例電子圖像40。電子圖像40包括對(duì)象45的表示,其在該示例中為正在水上航行的帆船。特征提取可以從電子圖像40檢測(cè)能夠映射(配準(zhǔn))至對(duì)象45的各種特征(邊緣、顏色、紋理等)。然后可以將這些特征與未知圖像中的特征進(jìn)行比較以對(duì)未知圖像中的未知對(duì)象進(jìn)行檢測(cè)和分類。
[0021]現(xiàn)參考圖3,示出了根據(jù)本公開內(nèi)容的各種實(shí)施方式的示例特征提取技術(shù)100。應(yīng)當(dāng)理解,特征提取技術(shù)100可以由適當(dāng)?shù)嘏渲玫挠?jì)算機(jī)或其他計(jì)算設(shè)備來(lái)進(jìn)行,諸如圖4所示的示例特征提取技術(shù)200。在步驟102,獲得電子圖像40。電子圖像40是可以任意數(shù)量種方式獲得的數(shù)字圖像,例如,從電子存儲(chǔ)介質(zhì)(數(shù)據(jù)庫(kù)、硬盤、閃存存儲(chǔ)器設(shè)備等)獲得、從數(shù)字?jǐn)z像機(jī)和/或從數(shù)字掃描儀獲得。電子圖像40可以包括技術(shù)100會(huì)將特征配準(zhǔn)至其的對(duì)象45的表示(諸如圖2所示的帆船)。對(duì)于將用來(lái)訓(xùn)練用于圖像分類、對(duì)象識(shí)別等的技術(shù)的電子圖像40,可以由用戶對(duì)對(duì)象45進(jìn)行分類。在圖2所示的電子圖像40的說(shuō)明示例中,用戶可以將對(duì)象45分類為“帆船”、“小船”、“船舶”/或其他恰當(dāng)?shù)姆诸悺?br>
[0022]在步驟104對(duì)電子圖像40執(zhí)行邊緣檢測(cè)算法以獲得與對(duì)象45對(duì)應(yīng)的第一組邊緣。在步驟104可以利用各種邊緣檢測(cè)算法中的任意一種。僅作為示例,在本公開內(nèi)容的各種實(shí)施方式中,可以利用Gabor濾波器來(lái)獲得第一組邊緣。在這些示例中,電子圖像40被轉(zhuǎn)換為灰度值圖像“I”??梢允褂靡韵碌仁綉?yīng)用不同大小的Gabor濾波器作為卷積核以處理灰度值圖像1:
【權(quán)利要求】
1.一種計(jì)算機(jī)實(shí)施的方法,包括: 獲得對(duì)象的電子圖像; 對(duì)所述電子圖像進(jìn)行邊緣檢測(cè)算法以獲得與所述對(duì)象對(duì)應(yīng)的第一組邊緣; 對(duì)所述第一組邊緣進(jìn)行邊緣合并算法以獲得第二組邊緣,所述第二組邊緣的數(shù)量小于所述第一組邊緣的數(shù)量; 對(duì)所述電子圖像進(jìn)行采樣以基于所述第二組邊緣獲得邊緣片組; 對(duì)所述電子圖像進(jìn)行采樣以從所述電子圖像中獲得顏色片組; 對(duì)所述電子圖像進(jìn)行采樣以從所述電子圖像中獲得紋理片組; 通過(guò)以下方式從所述邊緣片組、所述顏色片組和所述紋理片組中選擇片組:當(dāng)?shù)趇+1片與所述片組中的第i片之間的歐幾里得距離大于或等于所述第i片與所有其他片之間的歐幾里得距離時(shí),將所述第i+Ι片選擇到所述片組內(nèi); 對(duì)所選擇的片組進(jìn)行部件選擇算法以獲得第一組部件; 對(duì)所述第一組部件進(jìn)行部件合并算法以獲得第二組部件,所述第二組部件的數(shù)量小于所述第一組部件的數(shù)量,其中,所述部件合并算法包括:(i)將所述第一組部件中的每個(gè)部件分成多個(gè)子部件;以及(ii)對(duì)所述子部件中的每個(gè)子部件進(jìn)行MAX運(yùn)算;以及將所述第二組部件配準(zhǔn)至所述對(duì)象。
2.一種計(jì)算機(jī)實(shí)施的方法,包括: 獲得對(duì)象的電子圖像; 對(duì)所述電子圖像進(jìn)行邊緣檢測(cè)算法以獲得與所述對(duì)象對(duì)應(yīng)的第一組邊緣; 對(duì)所述第一組邊緣進(jìn)行邊緣合并算法以獲得第二組邊緣,所述第二組邊緣的數(shù)量小于所述第一組邊緣的數(shù)量; 對(duì)所述電子圖像進(jìn)行采樣以基于所述第二組邊緣獲得邊緣片組; 對(duì)所述電子圖像進(jìn)行采樣以從所述電子圖像中獲得顏色片組; 對(duì)所述電子圖像進(jìn)行采樣以從所述電子圖像中獲得紋理片組; 通過(guò)以下方式從所述邊緣片組、所述顏色片組和所述紋理片組中選擇片組:基于所述邊緣片組、所述顏色片組和所述紋理片組中的每個(gè)片距所述片組中的第i片的歐幾里得距離,選擇要在所述片組內(nèi)的第i+Ι片; 對(duì)所選擇的片組進(jìn)行部件選擇算法以獲得第一組部件; 對(duì)所述第一組部件進(jìn)行部件合并算法以獲得第二組部件,所述第二組部件的數(shù)量小于所述第一組部件的數(shù)量; 將所述第二組部件配準(zhǔn)至所述對(duì)象。
3.根據(jù)權(quán)利要求2所述的計(jì)算機(jī)實(shí)施的方法,其中,基于距所述第i片的歐幾里得距離來(lái)選擇所述第i+Ι片包括:如果所述第i片與所述第i+Ι片之間的歐幾里得距離大于或等于所述第i片與所有其他片之間的歐幾里得距離,則選擇所述第i+Ι片。
4.根據(jù)權(quán)利要求2所述的計(jì)算機(jī)實(shí)施的方法,其中,對(duì)所述第一組部件進(jìn)行所述部件合并算法以獲得所述第二組部件包括:對(duì)所述第一組部件進(jìn)行MAX運(yùn)算。
5.根據(jù)權(quán)利要求4所述的計(jì)算機(jī)實(shí)施的方法,其中,所述MAX運(yùn)算包括:(i)將所述第一組部件中的每個(gè)部件分 成多個(gè)子部件;以及(ii)對(duì)所述子部件中的每個(gè)進(jìn)行MAX運(yùn)算。
6.根據(jù)權(quán)利要求5所述的計(jì)算機(jī)實(shí)施的方法,其中,所述子部件的數(shù)量為4。
7.根據(jù)權(quán)利要求2所述的計(jì)算機(jī)實(shí)施的方法,其中,通過(guò)有監(jiān)督學(xué)習(xí)來(lái)進(jìn)行將所述第二組部件配準(zhǔn)至所述對(duì)象的處理。
8.根據(jù)權(quán)利要求2所述的計(jì)算機(jī)實(shí)施的方法,其中,對(duì)所述第一組邊緣進(jìn)行所述邊緣合并算法以獲得所述第二組邊緣包括:對(duì)所述第一組邊緣進(jìn)行MAX運(yùn)算。
9.一種特征提取系統(tǒng),包括: 邊緣檢測(cè)模塊,其確定與電子圖像的對(duì)象對(duì)應(yīng)的第一組邊緣; 邊緣合并模塊,其從所述第一組邊緣中確定第二組邊緣,所述第二組邊緣的數(shù)量小于所述第一組邊緣的數(shù)量; 邊緣片采樣模塊,其基于所述第二組邊緣來(lái)采樣邊緣片組; 顏色片采樣模塊,其從所述電子圖像中采樣顏色片組; 紋理片采樣模塊,其從所述 電子圖像中采樣紋理片組; 片選擇模塊,其通過(guò)以下方式從所述邊緣片組、所述顏色片組和所述紋理片組中選擇片組:基于所述邊緣片組、所述顏色片組和所述紋理片組中的每個(gè)片距所述片組中的第i片的歐幾里得距離來(lái)選擇要在所述片組內(nèi)的第i+Ι片; 部件選擇模塊,其基于所選擇的片組確定第一組部件; 部件合并模塊,其基于所述第一組部件確定第二組部件,所述第二組部件的數(shù)量小于所述第一組部件的數(shù)量;以及 對(duì)象配準(zhǔn)模塊,其將所述第二組部件配準(zhǔn)至所述對(duì)象。
10.根據(jù)權(quán)利要求7所述的特征提取系統(tǒng),其中,基于距所述第i片的歐幾里得距離來(lái)選擇所述第i+Ι片包括:當(dāng)所述第i片與所述第i+Ι片之間的歐幾里得距離大于或等于所述第i片與所有其他片之間的歐幾里得距離時(shí),選擇所述第i+Ι片。
11.根據(jù)權(quán)利要求9所述的特征提取系統(tǒng),其中,對(duì)所述第一組部件進(jìn)行部件合并算法以獲得所述第二組部件包括:對(duì)所述第一組部件進(jìn)行MAX運(yùn)算。
12.根據(jù)權(quán)利要求11所述的特征提取系統(tǒng),其中,所述MAX運(yùn)算包括:(i)將所述第一組部件中的每個(gè)部件分成多個(gè)子部件;以及(ii)對(duì)所述子部件中的每個(gè)進(jìn)行MAX運(yùn)算。
13.根據(jù)權(quán)利要求12所述的特征提取系統(tǒng),其中,所述子部件的數(shù)量為4。
14.根據(jù)權(quán)利要求9所述的特征提取系統(tǒng),其中,通過(guò)有監(jiān)督學(xué)習(xí)來(lái)進(jìn)行將所述第二組部件配準(zhǔn)至所述對(duì)象的處理。
15.根據(jù)權(quán)利要求9所述的特征提取系統(tǒng),其中,對(duì)所述第一組邊緣進(jìn)行邊緣合并算法以獲得所述第二組邊緣包括:對(duì)所述第一組邊緣進(jìn)行MAX運(yùn)算。
【文檔編號(hào)】G06K9/46GK103930902SQ201180073230
【公開日】2014年7月16日 申請(qǐng)日期:2011年8月1日 優(yōu)先權(quán)日:2011年8月1日
【發(fā)明者】王志宇, 愛德華·Y·常 申請(qǐng)人:谷歌公司