專利名稱:基于標(biāo)本圖像的鱗翅目昆蟲種類自動鑒別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于標(biāo)本數(shù)字圖像的昆蟲種類自動鑒別方法,特別是對鱗翅目昆蟲的自動鑒定,可應(yīng)用于植物檢疫、植物病蟲害預(yù)測預(yù)報(bào)及其防治等領(lǐng)域,或可作為重要組成部分用于生態(tài)信息學(xué)研究的借鑒和參考。該項(xiàng)技術(shù)可被海關(guān)、植物檢疫部門、農(nóng)林病蟲害防治等部門所采用??蔀椴痪邆溆嘘P(guān)專業(yè)知識的基層工作人員或農(nóng)民提供自動鑒別的手段。
背景技術(shù):
鱗翅目(L印idoptera)是昆蟲綱中第二大目,由于身體和翅膀上披有大量鱗片而得名。鱗翅目幼蟲多為植食性,對農(nóng)作物造成的危害較大,鱗翅目成蟲一般不為害寄主,但有部分害蟲如吸果葉蛾,喙尖,刺破果皮吸取汁液,對果實(shí)造成危害。因此,有效鑒定鱗翅目對病蟲害的防治具有重要意義。
傳統(tǒng)的昆蟲分類與識別僅局限于少數(shù)昆蟲研究者、植??萍脊ぷ髡撸揽渴止z查、肉眼觀察形態(tài)特征進(jìn)行,需要堅(jiān)實(shí)的昆蟲分類知識和經(jīng)驗(yàn)的積累,除少數(shù)專家外,一般人難于掌握,且結(jié)果通常為辨別者的主觀情緒所影響,識別率不穩(wěn)定,尤其在時間長、工作量大的情況下,誤判率增加。檢測不能實(shí)時動態(tài)進(jìn)行、需要大量人工、采樣點(diǎn)不夠,這在很大程度上限制了人們對昆蟲的認(rèn)識的普及度,常常給農(nóng)業(yè)生產(chǎn)和經(jīng)濟(jì)活動帶來巨大的損失。將先進(jìn)的圖像處理、模式識別等計(jì)算機(jī)視覺及信號處理技術(shù)應(yīng)用于昆蟲分類與識別領(lǐng)域,實(shí)現(xiàn)昆蟲的自動識別,對于促進(jìn)人類認(rèn)識的普及度;減少農(nóng)業(yè)生產(chǎn)中因?yàn)槔ハx引起的病害、避免經(jīng)濟(jì)損失;有效的保護(hù)珍稀昆蟲物種,維護(hù)生態(tài)環(huán)境平衡,具有不可忽略的作用。數(shù)字圖像處理技術(shù)是20世紀(jì)60年代隨著計(jì)算機(jī)技術(shù)和VLSI (超大規(guī)模集成電路)的發(fā)生、發(fā)展和不斷成熟起來的一個新興技術(shù)領(lǐng)域,并在90年代取得較大的發(fā)展。在航空航天、生物特征識別、生物醫(yī)學(xué)工程、機(jī)器視覺、多媒體信息處理等領(lǐng)域得到廣泛應(yīng)用,并取得很好的效果。但數(shù)字圖像處理技術(shù)應(yīng)用于昆蟲識別領(lǐng)域的研究才剛剛處于起步階段,有關(guān)文獻(xiàn)尚不多見,在技術(shù)實(shí)現(xiàn)上還有待進(jìn)一步開發(fā)和完善。昆蟲數(shù)學(xué)形態(tài)學(xué)與計(jì)算機(jī)技術(shù)相結(jié)合的研究主要從20世紀(jì)90年代開始。英國政府于 1996 年發(fā)起 DAISY (Digital Automated Identification SYstem)研究工程,在全世界范圍內(nèi)掀起了有關(guān)昆蟲自動識別研究的熱潮。經(jīng)過十多年的研究和探索,目前最具代表性的昆蟲自動識別軟件有Steinhage等開發(fā)的ABIS(Automatic BeeIdentificationSystem)、Weeks 等開發(fā)的 DAISY 和以及 Russell 和 Martin 開發(fā)的SPIDA(SPeciesIDentitfied Automatically), Tofilski 等開發(fā)的軟件 DrawWing 等。在國內(nèi),中國農(nóng)業(yè)大學(xué)沈佐銳教授指導(dǎo)的IPMIST(植保生態(tài)智能技術(shù)系統(tǒng))實(shí)驗(yàn)室從1997年起開始利用計(jì)算機(jī)模式識別的手段進(jìn)行昆蟲種類鑒定,并在昆蟲的圖像采集、利用及昆蟲圖像的數(shù)學(xué)形態(tài)學(xué)方面展開了較深入的探討,利用神經(jīng)網(wǎng)絡(luò)對昆蟲進(jìn)行了自動鑒別,在昆蟲形態(tài)自動測量與種類自動鑒定方面取得了一系列進(jìn)展。趙汗青等用蟲體面積、周長等11項(xiàng)數(shù)學(xué)形態(tài)特征對40種昆蟲實(shí)現(xiàn)自動鑒別;姚青等以翅面正投影周緣曲率為指標(biāo),對五種蛾類遷飛昆蟲及與其近似的非遷飛昆蟲的前翅翅形進(jìn)行數(shù)值分析和比較;黃世國等也對基于圖像的昆蟲識別關(guān)鍵技術(shù)進(jìn)行了系統(tǒng)性的研究,對基于形狀特征、紋理特征及形態(tài)學(xué)、本體的昆蟲識別算法進(jìn)行了研究,但其實(shí)驗(yàn)數(shù)據(jù)集僅包含五類昆蟲樣本,結(jié)果還有待用更充分的實(shí)驗(yàn)數(shù)據(jù)來證明。上述研究結(jié)果有的是基于翅脈特征,有的是基于形狀特征,翅脈特征對膜翅目昆蟲比較適用,鱗翅目昆蟲要提取翅脈特征,首先要使用化學(xué)方法去除翅面的鱗片和色斑,通過掃描獲取到蝴蝶翅脈圖片,過程復(fù)雜且容易損壞標(biāo)本;而形狀特征則對昆蟲的姿態(tài)、尺度變化敏感,而且如果昆蟲標(biāo)本有殘缺時就難以正確識別。多數(shù)方法的研究結(jié)果都是基于有限類昆蟲的小樣本庫試驗(yàn),在識別正確率,識別時間性能等方面還有待進(jìn)一步驗(yàn)證,還沒有達(dá)到可以直接應(yīng)用于生產(chǎn)的程度。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種自動識別鱗翅目昆蟲圖像的方法。它主要解決由昆蟲 圖像樣本通過計(jì)算機(jī)模式識別技術(shù)實(shí)現(xiàn)鱗翅目昆蟲種類自動識別問題。特別是在昆蟲樣本有部分缺失,或是樣本姿態(tài)甚至距離在有限范圍內(nèi)變化,仍能以較高性能有效識別出有顯著特征的昆蟲種類。昆蟲標(biāo)本無須使用化學(xué)方法去除翅面的鱗片和色斑,避免已有的基于翅脈特征的方法所帶來的復(fù)雜處理過程。并解決基于圖像形狀特征的昆蟲識別方法對殘缺樣本、圖像尺度變化產(chǎn)生的精度性能下降。本發(fā)明采用的技術(shù)方案為一種基于標(biāo)本圖像的鱗翅目昆蟲種類自動鑒別方法,包括以下步驟I)圖像預(yù)處理去除鱗翅目標(biāo)本彩色圖像的背景,對去除背景后的圖像進(jìn)行灰度化、高斯濾波后進(jìn)行二值化,再進(jìn)行左右翅分割;對準(zhǔn)左右翅位置,切取包括有效翅區(qū)域的正方形區(qū)域;對鱗翅目標(biāo)本彩色圖像作同樣的變換,S卩,先分割左右翅,再對準(zhǔn)左右翅位置,切取包括有效翅區(qū)域的正方形區(qū)域,最后得到旋轉(zhuǎn)對齊的左翅彩色圖像和右翅彩色圖像;2)圖像特征提取將位置對準(zhǔn)后的左右翅彩色圖像分解至RGB三個通道,對每一通道執(zhí)行以下相同的特征提取過程將翅面圖像沿半徑和角度方向均分成若干個區(qū)間,計(jì)算每個區(qū)間內(nèi)的翅面像素均值,將左右翅三個通道所有區(qū)間計(jì)算得到的像素均值串聯(lián),得到昆蟲整體圖像的特征向量,將特征向量元素值進(jìn)行縮放,歸一化到
區(qū)間;3)分類鑒別先確定訓(xùn)練集,再訓(xùn)練分類器模型,最后進(jìn)行分類識別。進(jìn)一步地在所述步驟I)中,使用以下方法之一去除標(biāo)本圖像的背景用Lazy snapping方法去除標(biāo)本圖像的背景,方法是在需要保留的前景區(qū)域內(nèi)用一種顏色的線條作標(biāo)記,在需要去除的背景區(qū)域內(nèi)用另一種顏色的線條作標(biāo)記,LazySnapping算法自動計(jì)算出前景和背景之間的分界線,如果分割還不夠精確則反復(fù)作標(biāo)記微調(diào),直至分界線符合要求;
或用Grabcut工具去除標(biāo)本圖像的背景,方法是設(shè)置包含前景區(qū)域的最小矩形框,分割完成后將背景區(qū)域設(shè)置成黑色;或用GrabCut+Lazy Snapping工具完成背景去除工作,方法是先用GrabCut勾勒出前景區(qū)域,然后再用Lazy Snapping標(biāo)記未去除的背景和誤去除的前景,分割完成后將背景區(qū)域設(shè)置成黑色。在所述步驟I)中,對去除背景后的圖像進(jìn)行灰度化是指采用加權(quán)平均法得到灰度圖像。對去除背景后的圖像中的RGB三分量按Y = O. 299*R+0. 587*G+0. 114*B進(jìn)行加權(quán)平均。
在所述步驟I)中,所述二值化即選擇一個灰度閾值,將大于閾值的像素點(diǎn)設(shè)置為白色,小于閾值的像素點(diǎn)設(shè)置為黑色。在所述步驟I)中,所述左右翅分割方法是,對形成的二值圖像取最大輪廓,將該輪廓圖像從中心向兩側(cè)求投影,得到兩個局部極小值點(diǎn),以這兩個局部極小值點(diǎn)的橫坐標(biāo)為界,分割出昆蟲的左右翅區(qū)域。在所述步驟I)中,所述左右翅位置對準(zhǔn)的方法是,在左右翅的輪廓圖上搜索上邊緣和下邊緣,對上下邊緣用直線擬合,以兩直線交心為中心旋轉(zhuǎn)圖像,直至上邊沿水平。在所述步驟3)中,所述確定訓(xùn)練集的方法是,每一類昆蟲對應(yīng)一個支持向量機(jī)分類器,用本類昆蟲的若干個標(biāo)本作為正例,其他類昆蟲的若干個標(biāo)本作為負(fù)例,按步驟2)的方法提取每一類昆蟲的特征向量。在所述步驟3)中,所述訓(xùn)練分類器模型的方法是,用上一步歸一化得到的正例和反例特征向量訓(xùn)練支持向量機(jī)分類器模型,每一類昆蟲對應(yīng)一個分類器模型。在所述步驟3)中,所述分類識別的方法是,將未知類別的昆蟲標(biāo)本圖像按步驟I)和2)進(jìn)行預(yù)處理和特征提取后,將特征向量作為各支持向量機(jī)分類器的輸入,如果某類支持向量機(jī)分類器的輸出值為正,則接受為本類昆蟲,如果輸出值為負(fù),則判斷為非本類昆蟲。本發(fā)明的優(yōu)點(diǎn)在于本發(fā)明的鱗翅目昆蟲圖像自動識別方法,不需要對昆蟲圖像用化學(xué)試劑去除表面鱗片和色斑,圖像采集方法簡便易操作。在預(yù)處理過程中能去除平移、旋轉(zhuǎn)等變化,特征提取時構(gòu)造的特征向量不但具有尺度不變性,而且對樣本有部分缺失時也有較好的容錯性。單個分類器執(zhí)行分類時間在50ms以下,分類的正確率在90%以上。
圖I為標(biāo)本圖像的原圖;圖2為從圖I中去除背景后的標(biāo)本圖像;圖3為輪廓圖;圖4為分割左右翅區(qū)域示意圖;圖5為用直線擬合上邊緣和下邊緣示意圖;圖6為旋轉(zhuǎn)對齊后的左右翅輪廓圖;圖7為旋轉(zhuǎn)對齊后的左右翅圖像;圖8為區(qū)間分割示意;圖9為用Lazy Snapping工具去除背景;
圖10為用Grabcut工具去除背景。
具體實(shí)施例方式本發(fā)明包括以下步驟I)圖像預(yù)處理去除鱗翅目標(biāo)本彩色圖像的背景,對去除背景后的圖像進(jìn)行灰度化、高斯濾波后進(jìn)行二值化,再進(jìn)行左右翅分割;對準(zhǔn)左右翅位置,切取包括有效翅區(qū)域的正方形區(qū)域;對鱗翅目標(biāo)本彩色圖像作同樣的變換,即,先分割左右翅,再對準(zhǔn)左右翅位置,切取包括有效翅區(qū)域的正方形區(qū)域,最后得到旋轉(zhuǎn)對齊的左翅彩色圖像和右翅彩色圖像。2)圖像特征提取將位置對準(zhǔn)后的左右翅彩色圖像分解至RGB三個通道,對每一通道執(zhí)行以下相同的特征提取過程將翅面圖像沿半徑和角度方向均分成若干個區(qū)間,計(jì)算每個區(qū)間內(nèi)的翅面像素均值,將左右翅三個通道所有區(qū)間計(jì)算得到的像素均值串聯(lián),得到昆蟲整體圖像的特征向量,將特征向量元素值進(jìn)行縮放,歸一化到
區(qū)間。 3)分類鑒別先確定訓(xùn)練集,再訓(xùn)練分類器模型,最后進(jìn)行分類識別。下面結(jié)合附圖詳細(xì)說明。I)圖像預(yù)處理使用數(shù)碼相機(jī)拍攝鱗翅目標(biāo)本,得到鱗翅目標(biāo)本的原始彩色圖像,用Lazysnapping方法去除背景,設(shè)置背景顏色為單色(圖2中顯示為白色,實(shí)際通常將背景設(shè)置為黑色),前景保持原圖信息。原始圖像與去除背景后的圖像見圖I、圖2。對去除背景后的圖像進(jìn)行灰度化,高斯濾波、再進(jìn)行二值化,并對二值化的結(jié)果取最大輪廓。其中所謂最大輪廓,是指在二值圖像中檢測到的輪廓中取出面積最大的一個,可以得到如圖3所示的昆蟲輪廓圖像?;叶然磳GB彩色圖像轉(zhuǎn)換為單色圖像,本發(fā)明采用加權(quán)平均法,由于人眼對綠色的敏感最高,對藍(lán)色敏感最低,因此,按下式對RGB三分量進(jìn)行加權(quán)平均能得到較合理的灰度圖像Y = O. 299*R+0. 587*G+0. 114*B高斯濾波的目的是平滑去噪,使二值化操作結(jié)果盡可能將前景和背景分離開。二值化即選擇一個灰度閾值,將大于閾值的像素點(diǎn)設(shè)置為白色(即像素值大小為255),小于閾值的像素點(diǎn)設(shè)置為黑色(即像素值大小為0),因在背景去除這一步已將背景設(shè)置為黑色,此處將閾值設(shè)置為一個比較小的值20。另外,因?yàn)槔ハx翅面的灰度紋理變化較多,存在將昆蟲翅面的部分區(qū)域二值化為黑色的情況,因此用提取最大輪廓的方法來消除翅面區(qū)域內(nèi)的孤立區(qū)域。對于該輪廓圖像從中心向兩側(cè)求垂直投影,可以得到兩個局部極小值點(diǎn),垂直投影即沿Y軸方向統(tǒng)計(jì)每個X坐標(biāo)值上前景像素的個數(shù),極小值點(diǎn)即該X坐標(biāo)值處前景像素累計(jì)值為極小值的X坐標(biāo),如圖4中的軀干兩邊的兩條黑色豎線位置。以這兩個局部極小值點(diǎn)的橫坐標(biāo)為界,可以粗略分割出昆蟲的左右翅區(qū)域,如圖4。從左翅和右翅的分割邊界跟蹤輪廓邊緣,上邊緣從邊界的上頂點(diǎn)a點(diǎn)開始跟蹤直至輪廓的最高點(diǎn)b點(diǎn),下邊緣從邊界的下頂點(diǎn)c點(diǎn)開始跟蹤直至輪廓的最低點(diǎn)d點(diǎn),用最小二乘法對處于左翅和右翅的上邊緣和下邊緣上的像素點(diǎn)用直線擬合,并分別求取左翅和右翅的上下邊緣直線的交點(diǎn)0,如圖5。然后將左翅繞兩直線交點(diǎn)O旋轉(zhuǎn)至上邊沿直線為水平,對右翅也作相同處理。再切取包括有效翅區(qū)域的正方形區(qū)域,如圖6。通過黑白圖像可以確定旋轉(zhuǎn)的中心點(diǎn)和旋轉(zhuǎn)的角度,以及翅面的有效區(qū)域,從而切取出對應(yīng)的彩色圖像區(qū)域,這樣彩色圖像只需要可以分割得到旋轉(zhuǎn)對齊的左翅和右翅,如圖7。2)圖像特征提取特征的提取在RGB三個通道上分別進(jìn)行。首先將圖7所示的彩色圖像變換到RGB三個通道,得到三幅灰度圖像。分別在這三幅灰度圖像上提取特征,將翅面圖像分別在半徑方向和角度方向均分為M和N個區(qū)域,本發(fā)明中M = 5,N = 8,那么整個翅面可以劃分為40個區(qū)間(如圖8),計(jì)算每個區(qū)間的像素平均值,即將區(qū)間內(nèi)的像素值累加后除以區(qū)間內(nèi)的像素個數(shù),那么每一個通道可以得到長度為40的向量,三個通道的向量串聯(lián)后得到40*3 =120的向量,左翅和右翅各120維,那么從昆蟲整體圖像可以得到120*2 = 240維的特征向 量。3)分類鑒別先確定訓(xùn)練集,再訓(xùn)練分類器模型,最后進(jìn)行分類識別。確定訓(xùn)練集的方法是,每一類昆蟲對應(yīng)一個支持向量機(jī)分類器,用本類昆蟲的若干個標(biāo)本作為正例,其他類昆蟲的若干個標(biāo)本作為負(fù)例,按步驟2)的方法提取每一類昆蟲的特征向量。訓(xùn)練分類器模型的方法是,用上一步歸一化得到的正例和反例特征向量訓(xùn)練支持向量機(jī)分類器模型,每一類昆蟲對應(yīng)一個分類器模型。分類識別的方法是,將未知類別的昆蟲標(biāo)本圖像按步驟I)和2)進(jìn)行預(yù)處理和特征提取后,將特征向量作為各支持向量機(jī)分類器的輸入,如果某類支持向量機(jī)分類器的輸出值為正,則接受為本類昆蟲,如果輸出值為負(fù),則判斷為非本類昆蟲。分類和鑒別的工作由分類器來完成。將上一步提取得到的特征向量歸一化到區(qū)間{0,1},即對向量X= (X1, X2,…,X1J執(zhí)行如下操作X1 j = Xi/255 i = I, 2, . . . , nXi(i = 1,2,...,n),Xi指特征向量X的第i個元素。因?yàn)榛叶葓D像的每個像素取值范圍為0 255,作為每個區(qū)間像素平均值的取值范圍也為0 255,通過上式的計(jì)算,可以把特征向量中每個元素的值歸一化到范圍0 I,從而得到歸一化的特征向量X’ =
{x I,X 2,...,X rJ0每一類昆蟲對應(yīng)一個分類器,本發(fā)明由支持向量機(jī)(Support Vector Machine,SVM)實(shí)現(xiàn)分類。對于每個SVM分類器,遵循了相同的設(shè)計(jì)原則首先采用有監(jiān)督訓(xùn)練的方法進(jìn)行訓(xùn)練,選擇合適的核函數(shù)和參數(shù);然后使用測試樣本測試識別率。核函數(shù)的選擇和參數(shù)的詵擇是一個繁雜的過稈,伯.是臺灣的林智仁博士用DVthon開發(fā)的腳本稈序可以實(shí)現(xiàn)自動參數(shù)選擇以獲得最優(yōu)的交叉驗(yàn)證精度,使用這個grid, py腳本要求安裝python和Rnuplot.。將采集樣本集中本類昆蟲提取的特征作為正例,正例是指分類器接受為本類的樣本(標(biāo)記輸出為+1),在其他類別昆蟲中提取特征作為負(fù)例(標(biāo)記輸出為-I),訓(xùn)練每類昆蟲對應(yīng)的分類器模型。
用訓(xùn)練得到的模型對同類昆蟲的測試樣本可進(jìn)行類內(nèi)測試,當(dāng)輸出為正數(shù),認(rèn)為接受,輸出為非正,認(rèn)為拒絕。用訓(xùn)練得到的模型對不同類昆蟲的任意測試樣本可進(jìn)行類間測試,當(dāng)輸出為正數(shù),接受,非正,拒絕。本發(fā)明試驗(yàn)集包含10類鱗翅目昆蟲成蟲 整體圖像,每類昆蟲采集樣本圖像48 66幅,其中4/5用來訓(xùn)練,1/5用來測試。訓(xùn)練多項(xiàng)式核函數(shù)的SVM分類器,該核函數(shù)的gamma值為I,核函數(shù)中的coefO設(shè)置為I,核函數(shù)中的degree設(shè)置為3,使用Svmtrain訓(xùn)練好的模型進(jìn)行測試,結(jié)果類內(nèi)匹配的正確率為平均91. 96 %,類間匹配正確率為91. 77 %,平均識別率為91. 79%。下面再結(jié)合具體實(shí)現(xiàn)方法的實(shí)例,對本發(fā)明的鱗翅目昆蟲標(biāo)本圖像的自動鑒別做進(jìn)一步的詳細(xì)說明實(shí)例II.使用“光影魔術(shù)手”附帶的摳圖功能模塊,完成從圖I到圖2的背景去除工作,并把背景設(shè)置成黑色。2.打開去除背景后的鱗翅目標(biāo)本整體圖像文件,打開的待鑒定圖像顯示在窗口左上方。3.點(diǎn)擊[操作]菜單下的[匹配]子菜單項(xiàng),將啟動整個鑒定匹配過程,鑒定結(jié)果顯示在窗口右側(cè),按分類器接受的先后次序輸出鑒定結(jié)果信息,即鑒定的昆蟲名稱和樣例圖像。一般情況下,由于每類昆蟲在庫中的對應(yīng)分類器模型只有一個,所以正確的鑒定輸出結(jié)果只有一個;當(dāng)存在誤判結(jié)果時,一幅圖像可能同時被多個分類器接受,此時輸出結(jié)果按匹配次序輸出前三個被接受的類別。4.如果要重新訓(xùn)練分類器模型,可點(diǎn)擊[操作]菜單下的[訓(xùn)練]子菜單項(xiàng),在彈出的窗口中,可以選擇訓(xùn)練數(shù)據(jù)文件所在路徑、模型編號、SVM分類器類型、核函數(shù)類型、以及代價(jià)、伽馬值等參數(shù),點(diǎn)確定后可重新訓(xùn)練生成指定編號的模型。實(shí)例2用Lazy Snapping工具完成從圖9a到圖9b的背景去除工作,方法是在需要保留的前景區(qū)域內(nèi)用一種顏色的線條作標(biāo)記,在需要去除的背景區(qū)域內(nèi)用另一種顏色的線條作標(biāo)記,Lazy Snapping算法將自動計(jì)算出前景和背景之間的分界線,如果分割還不夠精確則反復(fù)作標(biāo)記微調(diào),直至分界線符合要求。Lazy Snapping是一種交互式對象分割算法,操作時,用戶通過按住按鈕(左鍵顯示前景,右鍵顯示背景)拖動鼠標(biāo)來標(biāo)記一些線條。例如黃線標(biāo)記前景,藍(lán)線標(biāo)記背景。這種高層次的繪畫式用戶界面并不需要非常精確的用戶輸入。繪制好標(biāo)志線后通過點(diǎn)擊預(yù)覽按鈕觸發(fā)分割過程,然后,用戶檢查屏幕上的分割結(jié)果,并決定是否需要標(biāo)記更多的線。該方法產(chǎn)生的分割邊界誤差非常小,通過最大限度的增加對象內(nèi)部和邊界的顏色相似度,來優(yōu)化對象邊界。圖9a中的方框是采集昆蟲圖像時背景中的小紙片,Lazy Snapping算法的工具可以有效地把該背景去除。后續(xù)的鑒定操作同實(shí)例I的第2. 3步.訓(xùn)練過程同實(shí)例I的第4步。實(shí)例3用Grabcut工具完成從圖IOa到圖IOc的背景去除工作,圖IOa中的方框是采集昆蟲圖像時背景中的小紙片,圖IOb的矩形框?yàn)槿斯ぴO(shè)置的包含前景區(qū)域的最小矩形框,分割完成后將背景區(qū)域設(shè)置成黑色。后續(xù)的鑒定操作同實(shí)例I的第2. 3步.訓(xùn)練過程同實(shí)例I的第4步。實(shí)例4用GrabCut+Lazy Snapping工具完成背景去除工作。對于背景特別復(fù)雜的圖像,可以先用GrabCut勾勒出 大致的前景區(qū)域,然后再用Lazy Snapping標(biāo)記未去除的背景和誤去除的前景,分割完成后將背景區(qū)域設(shè)置成黑色。后續(xù)的鑒定操作同實(shí)例I的第2. 3步.訓(xùn)練過程同實(shí)例I的第4步。采用以上四種實(shí)例在包含10類鱗翅目昆蟲標(biāo)本圖像樣本庫中進(jìn)行鑒別試驗(yàn),都取得了良好的試驗(yàn)效果。
權(quán)利要求
1.一種基于標(biāo)本圖像的鱗翅目昆蟲種類自動鑒別方法,其特征在于包括以下步驟 1)圖像預(yù)處理 去除鱗翅目標(biāo)本彩色圖像的背景,對去除背景后的圖像進(jìn)行灰度化、高斯濾波后進(jìn)行二值化,再進(jìn)行左右翅分割; 對準(zhǔn)左右翅位置,切取包括有效翅區(qū)域的正方形區(qū)域; 對鱗翅目標(biāo)本彩色圖像作同樣的變換,即,先分割左右翅,再對準(zhǔn)左右翅位置,切取包括有效翅區(qū)域的正方形區(qū)域,最后得到旋轉(zhuǎn)對齊的左翅彩色圖像和右翅彩色圖像; 2)圖像特征提取 將位置對準(zhǔn)后的左右翅彩色圖像分解至RGB三個通道對每一通道執(zhí)行以下相同的特征提取過程將翅面圖像沿半徑和角度方向均分成若干個區(qū)間,計(jì)算每個區(qū)間內(nèi)的翅面像素均值,將左右翅三個通道所有區(qū)間計(jì)算得到的像素均值串聯(lián),得到昆蟲整體圖像的特征向量,將特征向量元素值進(jìn)行縮放,歸一化到
區(qū)間; 3)分類鑒別 先確定訓(xùn)練集,再訓(xùn)練分類器模型,最后進(jìn)行分類識別。
2.根據(jù)權(quán)利要求I所述的基于標(biāo)本圖像的鱗翅目昆蟲種類自動鑒別方法,其特征在于 在所述步驟I)中,使用以下方法之一去除標(biāo)本圖像的背景 用Lazy snapping方法去除標(biāo)本圖像的背景,方法是在需要保留的前景區(qū)域內(nèi)用一種顏色的線條作標(biāo)記,在需要去除的背景區(qū)域內(nèi)用另一種顏色的線條作標(biāo)記,Lazy Snapping算法自動計(jì)算出前景和背景之間的分界線,如果分割還不夠精確則反復(fù)作標(biāo)記微調(diào),直至分界線符合要求; 或用Grabcut工具去除標(biāo)本圖像的背景,方法是設(shè)置包含前景區(qū)域的最小矩形框,分割完成后將背景區(qū)域設(shè)置成黑色; 或用GrabCut+Lazy Snapping工具完成背景去除工作,方法是先用GrabCut勾勒出前景區(qū)域,然后再用Lazy Snapping標(biāo)記未去除的背景和誤去除的前景,分割完成后將背景區(qū)域設(shè)置成黑色。
3.根據(jù)權(quán)利要求I所述的基于標(biāo)本圖像的鱗翅目昆蟲種類自動鑒別方法,其特征在于 在所述步驟I)中,對去除背景后的圖像進(jìn)行灰度化是指采用加權(quán)平均法得到灰度圖像。
4.根據(jù)權(quán)利要求3所述的基于標(biāo)本圖像的鱗翅目昆蟲種類自動鑒別方法,其特征在于對去除背景后的圖像中的RGB三分量按Y = 0. 299*R+0. 587*G+0. 114*B進(jìn)行加權(quán)平均。
5.根據(jù)權(quán)利要求I所述的基于標(biāo)本圖像的鱗翅目昆蟲種類自動鑒別方法,其特征在于 在所述步驟I)中,所述二值化即選擇一個灰度閾值,將大于閾值的像素點(diǎn)設(shè)置為白色,小于閾值的像素點(diǎn)設(shè)置為黑色。
6.根據(jù)權(quán)利要求I所述的基于標(biāo)本圖像的鱗翅目昆蟲種類自動鑒別方法,其特征在于 在所述步驟I)中,所述左右翅分割方法是,對形成的二值圖像取最大輪廓,將該輪廓圖像從中心向兩側(cè)求投影,得到兩個局部極小值點(diǎn),以這兩個局部極小值點(diǎn)的橫坐標(biāo)為界,分割出昆蟲的左右翅區(qū)域。
7.根據(jù)權(quán)利要求I所述的基于標(biāo)本圖像的鱗翅目昆蟲種類自動鑒別方法,其特征在于 在所述步驟I)中,所述左右翅位置對準(zhǔn)的方法是,在左右翅的輪廓圖上搜索上邊緣和下邊緣,對上下邊緣用直線擬合,以兩直線交心為中心旋轉(zhuǎn)圖像,直至上邊沿水平。
8.根據(jù)權(quán)利要求I所述的基于標(biāo)本圖像的鱗翅目昆蟲種類自動鑒別方法,其特征在于 在所述步驟3)中,所述確定訓(xùn)練集的方法是,每一類昆蟲對應(yīng)一個支持向量機(jī)分類器,用本類昆蟲的若干個標(biāo)本作為正例,其他類昆蟲的若干個標(biāo)本作為負(fù)例,按步驟2)的方法提取每一類昆蟲的特征向量。
9.根據(jù)權(quán)利要求8所述的基于標(biāo)本圖像的鱗翅目昆蟲種類自動鑒別方法,其特征在于 在所述步驟3)中,所述訓(xùn)練分類器模型的方法是,用上一步歸一化得到的正例和反例特征向量訓(xùn)練支持向量機(jī)分類器模型,每一類昆蟲對應(yīng)一個分類器模型。
10.根據(jù)權(quán)利要求9所述的基于標(biāo)本圖像的鱗翅目昆蟲種類自動鑒別方法,其特征在于 在所述步驟3)中,所述分類識別的方法是,將未知類別的昆蟲標(biāo)本圖像按步驟I)和2)進(jìn)行預(yù)處理和特征提取后,將特征向量作為各支持向量機(jī)分類器的輸入,如果某類支持向量機(jī)分類器的輸出值為正,則接受為本類昆蟲,如果輸出值為負(fù),則判斷為非本類昆蟲。
全文摘要
本發(fā)明涉及一種基于標(biāo)本數(shù)字圖像的鱗翅目昆蟲種類自動鑒別方法,包括用LazySnapping和/或GrabCut去除背景,用基于投影的方法分割左右翅,用邊緣擬合的方法確定關(guān)鍵點(diǎn)并對準(zhǔn)左右翅的位置。特征的提取在RGB三個通道分別進(jìn)行,在半徑和角度方向把翅面部分分成若干個區(qū)間,計(jì)算各區(qū)間的像素均值的方法構(gòu)造出最終的特征向量;分類鑒別使用SVM分類器實(shí)現(xiàn)。該鱗翅目昆蟲標(biāo)本圖像識別方法具有操作簡便、識別精度高、容錯性強(qiáng),并有理想的時間性能,可以顯著提高鱗翅目昆蟲種類鑒定的效率。
文檔編號G06K9/00GK102760228SQ20111010695
公開日2012年10月31日 申請日期2011年4月27日 優(yōu)先權(quán)日2011年4月27日
發(fā)明者張培毅, 張真, 竺樂慶 申請人:中國林業(yè)科學(xué)研究院森林生態(tài)環(huán)境與保護(hù)研究所, 浙江工商大學(xué)