欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于改進(jìn)的潛在狄利克雷分配的自然圖像分類方法

文檔序號(hào):6539966閱讀:244來(lái)源:國(guó)知局
基于改進(jìn)的潛在狄利克雷分配的自然圖像分類方法
【專利摘要】本發(fā)明公開了一種基于改進(jìn)的潛在狄利克雷分配的自然圖像分類方法,主要解決現(xiàn)有全監(jiān)督自然圖像分類方法分類時(shí)間較長(zhǎng)以及在縮短了分類時(shí)間的前提下分類精度下降的問題。其實(shí)現(xiàn)步驟為:對(duì)每幅自然圖像進(jìn)行網(wǎng)格稠密采樣,得到其網(wǎng)格采樣點(diǎn);對(duì)每個(gè)網(wǎng)格采樣點(diǎn)提取其SIFT特征;對(duì)SIFT特征進(jìn)行K聚類,生成視覺詞典;用視覺詞典將自然圖像量化為視覺文檔;對(duì)每篇視覺文檔構(gòu)建二層空間金字塔,得到五篇視覺文檔;將每幅自然圖像的五篇視覺文檔輸入給LDA模型得到五個(gè)潛在語(yǔ)義主題分布;將所有自然圖像的潛在語(yǔ)義主題分布順次相連后輸入給SVM分類器進(jìn)行分類,得到分類結(jié)果。本發(fā)明與經(jīng)典分類方法相比,在縮短了平均分類時(shí)間的同時(shí)提高了分類精度,可用于目標(biāo)識(shí)別。
【專利說(shuō)明】基于改進(jìn)的潛在狄利克雷分配的自然圖像分類方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于圖像處理【技術(shù)領(lǐng)域】,涉及一種對(duì)自然圖像的分類方法,可用于目標(biāo)識(shí)別。
【背景技術(shù)】
[0002]近年來(lái),圖像數(shù)量的大量激增給圖像識(shí)別、檢索以及分類等問題帶來(lái)了巨大的挑戰(zhàn)。如何在浩瀚的數(shù)據(jù)中準(zhǔn)確獲得用戶所需信息并進(jìn)行處理,成為該領(lǐng)域亟待解決的問題之一。自然圖像分類的目的是根據(jù)圖像中所包含的內(nèi)容將圖像劃分為不同的類別,供后續(xù)處理或便于管理。經(jīng)典的自然圖像分類方法包括:
[0003]基于詞袋模型的自然圖像分類方法。該方法是由Csurka G等人將詞袋BoW模型的思想移植到圖像處理領(lǐng)域,見 Csurka G, Dance C, Fan L, et al.Visual Categorizationwith Bags of Keypoints.Workshop on statistical learning in compute vision,ECCV.2004,1:22.,其主要思想是通過對(duì)圖像進(jìn)行特征提取和描述,得到大量特征進(jìn)行處理,從而得到用來(lái)表示圖像的關(guān)鍵詞,并在此基礎(chǔ)上構(gòu)建視覺詞典,然后對(duì)待分類圖像采用相同的處理方法,將結(jié)果代入到訓(xùn)練的分類器中進(jìn)行分類。然而,詞袋模型在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用的缺陷是在應(yīng)用于圖像分類時(shí)分類精度不夠高,且分類時(shí)間較長(zhǎng)。
[0004]基于潛在狄利克雷分配的自然圖像分類方法。該方法是由David M.Blei等人在pLSA模型的基礎(chǔ)上進(jìn)行擴(kuò)展,提出了潛在狄利克雷分配LDA,對(duì)于像語(yǔ)料庫(kù)這樣的離散數(shù)據(jù)的收集建立了概率模型,見Blei,D.Μ.,Ng, A.Y.,Jordan, Μ.1.LatentDirichlet Allocation.Journal of Machine Learning Research3:993-1022,2003。隨后Fei Fei Li等人將該模型應(yīng)用于自然場(chǎng)景分類,見Fe1-Fei L, Perona P.A bayesianhierarchical model for learning natural scene categories.Computer Visionand Pattern Recognition,2005.CVPR2005.1EEE Computer Society Conferenceon.1EEE, 2005, 2:524-531。該方法相較于詞袋模型方法雖然大大縮短了分類時(shí)間,但卻降低了分類精度。

【發(fā)明內(nèi)容】

[0005]本發(fā)明的目的在于針對(duì)已有技術(shù)的不足,提出一種基于改進(jìn)的潛在狄利克雷分配的自然圖像分類方法,以提高分類效果。
[0006]為實(shí)現(xiàn)上述目的,本發(fā)明包括如下步驟:
[0007]1、一種基于改進(jìn)的潛在狄利克雷分配的自然圖像分類方法,包括如下步驟:
[0008](I)采用網(wǎng)格分塊方法對(duì)每一幅自然圖像進(jìn)行網(wǎng)格稠密采樣,得到每幅自然圖像相應(yīng)的網(wǎng)格采樣點(diǎn);
[0009](2)對(duì)每一個(gè)網(wǎng)格采樣點(diǎn)提取其周圍區(qū)域的尺度不變特征轉(zhuǎn)換SIFT特征;
[0010](3)對(duì)所有自然圖像提取出來(lái)的SIFT特征進(jìn)行K聚類,K聚類生成的η個(gè)聚類中心即η個(gè)視覺單詞,η個(gè)視覺單詞構(gòu)成一個(gè)視覺詞典;[0011](4)用每幅自然圖像中網(wǎng)格采樣點(diǎn)的SIFT特征分別與視覺詞典中的每個(gè)視覺單詞進(jìn)行比較,找出與每幅自然圖像中網(wǎng)格采樣點(diǎn)的SIFT特征最相近的視覺單詞來(lái)代替該SIFT特征,使得每幅自然圖像均由η個(gè)視覺單詞表示,即用量化后的每幅自然圖像作為由η個(gè)視覺單詞構(gòu)成的視覺文檔;
[0012](5)根據(jù)空間金字塔匹配SPM對(duì)每篇視覺文檔構(gòu)建二層空間金字塔,第一層空間金字塔中為原視覺文檔,第二層空間金字塔中為經(jīng)過平均劃分后得到的四個(gè)視覺子文檔,則每篇視覺文檔經(jīng)過空間金字塔匹配后可以得到五篇視覺文檔;
[0013](6)將每幅自然圖像對(duì)應(yīng)的五篇視覺文檔分別輸入給潛在狄利克雷分配LDA模型進(jìn)行若干次Gibbs采樣迭代,得到每幅自然圖像的五個(gè)潛在語(yǔ)義主題分布;
[0014](7)將每幅自然圖像的五個(gè)潛在語(yǔ)義主題分布順次相連后輸入給支持向量機(jī)SVM分類器進(jìn)行分類,選擇所有自然圖像的一半的圖像作為訓(xùn)練樣本,另一半的圖像作為測(cè)試樣本,得到分類結(jié)果。
[0015]本發(fā)明與現(xiàn)有的技術(shù)相比具有以下優(yōu)點(diǎn):
[0016]1.本發(fā)明在提取自然圖像的SIFT時(shí),考慮的是自然圖像在多個(gè)尺度下的SIFT特征,因而特征信息提取更完整;
[0017]2.本發(fā)明由于在LDA模型中引入空間金字塔匹配模型,考慮了自然圖像特征之間的空間信息,因而與現(xiàn)有技術(shù)相比,提高了平均分類精度;
【專利附圖】

【附圖說(shuō)明】
[0018]圖1是本發(fā)明的總流程圖。
【具體實(shí)施方式】
[0019]參照?qǐng)D1,本發(fā)明的具體實(shí)現(xiàn)步驟如下:
[0020]步驟1,采用網(wǎng)格分塊方法對(duì)每一幅自然圖像進(jìn)行網(wǎng)格稠密采樣,得到每幅自然圖像相應(yīng)的網(wǎng)格采樣點(diǎn)。
[0021]對(duì)每幅自然圖像進(jìn)行網(wǎng)格稠密采樣,是用水平和豎直的線均勻地分割每幅自然圖像得到每一幅自然圖像的每一個(gè)網(wǎng)格采樣點(diǎn)。
[0022]步驟2,對(duì)每一個(gè)網(wǎng)格采樣點(diǎn)使用尺度不變特征轉(zhuǎn)換(SIFT)算法提取其尺度不變特征轉(zhuǎn)換(SIFT)特征。
[0023](2a)將自然圖像中的每一個(gè)網(wǎng)格采樣點(diǎn)作為生成SIFT特征的關(guān)鍵點(diǎn);
[0024](2b)在以關(guān)鍵點(diǎn)為中心的NXN的鄰域窗口內(nèi)采樣,并用直方圖統(tǒng)計(jì)鄰域像素的梯度方向的幅值,N為不小于2的偶數(shù);
[0025]優(yōu)選地,N=4;
[0026](2c)計(jì)算8個(gè)梯度方向的累加值,得到每個(gè)關(guān)鍵點(diǎn)的NX N的鄰域上8個(gè)梯度方向的幅值的累加值,這樣就對(duì)每個(gè)關(guān)鍵點(diǎn)均生成了一個(gè)NXNX8維的SIFT特征向量。
[0027]步驟3,對(duì)所有自然圖像的SIFT特征進(jìn)行K聚類,生成視覺詞典。
[0028]K聚類的特點(diǎn)是各聚類本身盡可能的緊湊,而各聚類之間盡可能的分開,所以經(jīng)過K聚類得到的η個(gè)聚類中心符合視覺詞典中對(duì)視覺單詞的要求,即每一個(gè)視覺單詞可以代表許多相似的局部區(qū)域,而各個(gè)視覺單詞之間又相互區(qū)分,因而選用K聚類生成視覺詞典,其實(shí)現(xiàn)步驟如下:
[0029](3a)對(duì)所有自然圖像提取出來(lái)的SIFT特征進(jìn)行K聚類,每次K聚類生成η個(gè)聚類中心;
[0030](3b)將每次K聚類生成的η個(gè)聚類中心與視覺詞典中的η個(gè)視覺單詞相對(duì)應(yīng),生成一個(gè)均由η個(gè)視覺單詞構(gòu)成的視覺詞典。
[0031 ] 步驟4,量化每幅自然圖像為視覺文檔。
[0032]用每幅自然圖像中網(wǎng)格采樣點(diǎn)的SIFT特征分別與視覺詞典中的每個(gè)視覺單詞進(jìn)行比較,找出與每幅自然圖像中網(wǎng)格采樣點(diǎn)的SIFT特征最相近的視覺單詞來(lái)代替該SIFT特征,使得每幅自然圖像均由η個(gè)視覺單詞表示,即用量化后的每幅自然圖像作為由η個(gè)視覺單詞構(gòu)成的視覺文檔。
[0033]步驟5,根據(jù)空間金字塔匹配SPM對(duì)每篇視覺文檔構(gòu)建二層空間金字塔。
[0034]所構(gòu)建的二層空間金字塔中,第一層空間金字塔中為原視覺文檔,第二層空間金字塔中為經(jīng)過平均劃分后得到的四個(gè)視覺子文檔,則每篇視覺文檔經(jīng)過空間金字塔匹配后可以得到五篇視覺文檔。
[0035]該步驟在具體軟件實(shí)現(xiàn)時(shí),將一篇視覺文檔表現(xiàn)為一個(gè)向量,平均劃分就是說(shuō)比如一個(gè)長(zhǎng)為240的向量,經(jīng)過四等分的劃分之后即可得到四個(gè)長(zhǎng)為60的向量。
[0036]步驟6,將每幅自然圖像對(duì)應(yīng)的五篇視覺文檔分別輸入給潛在狄利克雷分配LDA模型進(jìn)行若干次吉布斯(Gibbs)采樣迭代,得到每幅自然圖像的五個(gè)潛在語(yǔ)義主題分布。
[0037](6a)對(duì)于每篇視覺文檔中的每一個(gè)視覺單詞Wi,隨機(jī)設(shè)定該視覺單詞所屬的主題Zi,令I(lǐng)zi = {l,2,...,T},i = 1,...,Μ},其中M為視覺文檔的視覺單詞總數(shù),T為主題個(gè)數(shù),該狀態(tài)即為Markov鏈的初始狀態(tài);
[0038](6b)根據(jù)下式將每篇視覺文檔中的視覺單詞分配給某個(gè)主題,獲取Markov鏈的下一個(gè)狀態(tài),
【權(quán)利要求】
1.一種基于改進(jìn)的潛在狄利克雷分配的自然圖像分類方法,包括如下步驟: (1)采用網(wǎng)格分塊方法對(duì)每一幅自然圖像進(jìn)行網(wǎng)格稠密采樣,得到每幅自然圖像相應(yīng)的網(wǎng)格采樣點(diǎn); (2)對(duì)每一個(gè)網(wǎng)格采樣點(diǎn)提取其周圍區(qū)域的尺度不變特征轉(zhuǎn)換SIFT特征; (3)對(duì)所有自然圖像提取出來(lái)的SIFT特征進(jìn)行K聚類,K聚類生成的η個(gè)聚類中心即η個(gè)視覺單詞,η個(gè)視覺單詞構(gòu)成一個(gè)視覺詞典; (4)用每幅自然圖像中網(wǎng)格采樣點(diǎn)的SIFT特征分別與視覺詞典中的每個(gè)視覺單詞進(jìn)行比較,找出與每幅自然圖像中網(wǎng)格采樣點(diǎn)的SIFT特征最相近的視覺單詞來(lái)代替該SIFT特征,使得每幅自然圖像均由η個(gè)視覺單詞表示,即量化每幅自然圖像為由η個(gè)視覺單詞構(gòu)成的視覺文檔; (5)根據(jù)空間金字塔匹配SPM對(duì)每篇視覺文檔構(gòu)建二層空間金字塔,第一層空間金字塔中為原視覺文檔,第二層空間金字塔中為經(jīng)過平均劃分后得到的四個(gè)視覺子文檔,則每篇視覺文檔經(jīng)過空間金字塔匹配后可以得到五篇視覺文檔; (6)將每幅自然圖像對(duì)應(yīng)的五篇視覺文檔分別輸入給潛在狄利克雷分配LDA模型進(jìn)行若干次吉布斯Gibbs采樣迭代,得到每幅自然圖像的五個(gè)潛在語(yǔ)義主題分布; (7)將每幅自然圖像的五個(gè)潛在語(yǔ)義主題分布順次相連后輸入給支持向量機(jī)SVM分類器進(jìn)行分類,選擇所有自然圖像的一半的圖像作為訓(xùn)練樣本,另一半的圖像作為測(cè)試樣本,得到分類結(jié)果。
2.根據(jù)權(quán)利要求書I所述的基于改進(jìn)的潛在狄利克雷分配的自然圖像分類方法,其中,步驟(1)所述的采用網(wǎng)格分塊方法對(duì)每一幅自然圖像進(jìn)行網(wǎng)格稠密采樣,得到每幅自然圖像相應(yīng)的網(wǎng)格采樣點(diǎn),是 將每幅自然圖像用水平和豎直的線均勻地分割,從而得到每一幅自然圖像的網(wǎng)格采樣點(diǎn)。
3.根據(jù)權(quán)利要求書I所述的基于改進(jìn)的潛在狄利克雷分配的自然圖像分類方法,其中,步驟(6)所述的將每幅自然圖像對(duì)應(yīng)的五篇視覺文檔分別輸入給潛在狄利克雷分配LDA模型進(jìn)行若干次Gibbs采樣迭代,得到每幅自然圖像的五個(gè)潛在語(yǔ)義主題分布,按如下步驟進(jìn)行: (6a)對(duì)于每篇視覺文檔中的每一個(gè)視覺單詞Wi,隨機(jī)設(shè)定該視覺單詞所屬的主題Zi,令I(lǐng)zi = {l,2,...,T},i = 1,...,M},其中M為視覺文檔的視覺單詞總數(shù),T為主題個(gè)數(shù),該狀態(tài)即為Markov鏈的初始狀態(tài); (6b)根據(jù)下式將每篇視覺文檔中的視覺單詞分配給某個(gè)主題,獲取Markov鏈的下一個(gè)狀態(tài),
4.根據(jù)權(quán)利要求書I所述的基于改進(jìn)的潛在狄利克雷分配的自然圖像分類方法,其中,所述步驟(7)的將每幅自然圖像的五個(gè)潛在語(yǔ)義主題分布順次相連后輸入給支持向量機(jī)SVM分類器進(jìn)行分類,按如下步驟進(jìn)行: (7a)選擇徑向基RBF核函數(shù)作為SVM分類器的核函數(shù); (7b)對(duì)所有自然圖像經(jīng)過順次相連的五個(gè)潛在語(yǔ)義主題分布采用M折交叉驗(yàn)證,選擇出徑向基RBF的核函數(shù)參數(shù)c和g的最佳值,即c=16,g=4,其中c是RBF核函數(shù)中的損失函數(shù),g是RBF核函數(shù)中的gamma函數(shù); (7c)隨機(jī)選擇所有自然圖像中的一半作為訓(xùn)練樣本,另一半圖像作為測(cè)試樣本,采用核函數(shù)為RBF核函數(shù)的SVM分類器對(duì)訓(xùn)練樣本進(jìn)行訓(xùn)練,得到訓(xùn)練模型,并用該訓(xùn)練模型對(duì)測(cè)試樣本進(jìn)行分類,得到分類結(jié)果。
5.根據(jù)權(quán)利要求書I所述的基于改進(jìn)的潛在狄利克雷分配的自然圖像分類方法,其中,M=10。
【文檔編號(hào)】G06K9/46GK103870840SQ201410085860
【公開日】2014年6月18日 申請(qǐng)日期:2014年3月11日 優(yōu)先權(quán)日:2014年3月11日
【發(fā)明者】焦李成, 劉芳, 韓冰, 馬文萍, 王爽, 馬晶晶, 侯彪, 白靜 申請(qǐng)人:西安電子科技大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
蓬安县| 黔西县| 库尔勒市| 五莲县| 中山市| 兴文县| 洞头县| 大姚县| 资源县| 微山县| 莱西市| 渭源县| 彭泽县| 榆中县| 南开区| 侯马市| 天台县| 观塘区| 肃北| 揭东县| 海林市| 新沂市| 邯郸市| 贺兰县| 无棣县| 营山县| 赫章县| 新邵县| 定日县| 竹北市| 涟水县| 新闻| 墨江| 沙湾县| 武山县| 华池县| 隆安县| 承德市| 措勤县| 拉孜县| 安乡县|