本發(fā)明屬于漁業(yè)養(yǎng)殖技術(shù)領域,特別涉及一種基于PCA和AdaBoost算法的運動魚苗識別方法。
背景技術(shù):
中國是世界上發(fā)展淡水養(yǎng)魚最早的國家之一,且我國擁有優(yōu)越的自然條件與廣闊的水資源,據(jù)20世紀80年代初統(tǒng)計,淡水水域約有2.5億畝,占國土面積的2%左右,其中能夠進行養(yǎng)殖的水域為7500萬畝,且還有許多稻田具備養(yǎng)魚的條件。隨著我國養(yǎng)殖業(yè)的迅速發(fā)展,對科學養(yǎng)殖與管理提出了更高的要求。
魚類的行為是指魚類在外在和自身環(huán)境發(fā)生變化時產(chǎn)生的外在反應,開展魚類的行為研究對促進養(yǎng)殖方式改進和養(yǎng)殖技術(shù)的提升具有積極的作用。在魚類行為研究中能否有效區(qū)分魚與背景并進行魚類的識別是決定魚類行為研究成敗的關鍵因素。
目前運動魚類識別及魚的行為研究大多采用的是人工觀測法,然而由于人工觀測易受外界影響,具有主觀性,使得觀測的標準難以統(tǒng)一,且其結(jié)果很難量化。機器視覺技術(shù)因擁有非接觸、高精度、可量化等特點目前已廣泛用在動植物的自動識別領域。迄今為止,尚未看到有關運動魚苗檢測與識別研究的相關報道。但有一些學者開展了成魚的檢測和識別研究,大都采用基于典型特征或幀間差分的運動物體識別算法,適用于目標特征明顯,易于分割的魚類。由于魚苗體型較小,魚鰭、魚尾不明顯,加之運動劇烈使得成像之后外形特征丟失嚴重。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是提供一種基于PCA和AdaBoost算法的運動魚苗識別方法,可以迅速有效地識別出運動魚苗,為下一步的魚類行為量化研究打下堅實的基礎。
主成分分析(Principal Component Analysis,PCA)是90年代初期由Tutk等提出的一種掌握事物主要矛盾的統(tǒng)計分析方法,它可以從多元事物中解析出主要影響因素,揭示事物的本質(zhì),簡化復雜的問題。這種方法可以有效的找出數(shù)據(jù)中最“主要”的元素和結(jié)構(gòu),去除噪音和冗余,將原有的復雜數(shù)據(jù)降維,揭示隱藏在復雜數(shù)據(jù)背后的簡單結(jié)構(gòu)。它的優(yōu)點是簡單,而且無參數(shù)限制,可以方便的應用與各個場合,主要應用于多源融合、數(shù)據(jù)降維、分析數(shù)據(jù)互相關性以及模式識別中。
AdaBoost,英文“Adaptive Boosting”的縮寫,是Yoav Freund和Robert Schapire在1995年提出的一種迭代算法,其核心思想是針對同一個訓練集訓練不同的分類器,即弱分類器,然后把這些弱分類器集合起來,構(gòu)造一個更強的最終分類器。算法本身是改變數(shù)據(jù)分布實現(xiàn)的,它根據(jù)每次訓練集之中的每個樣本的分類是否正確,以及上次的總體分類的準確率,來確定每個樣本的權(quán)值。將修改權(quán)值的新數(shù)據(jù)送給下層分類器進行訓練,然后將每次訓練得到的分類器融合起來,作為最后的決策分類器。目前,AdaBoost算法主要應用于分類和回歸問題。
本發(fā)明的技術(shù)方案是,一種運動魚苗識別方法,包括以下步驟:
(1)構(gòu)建AdaBoost算法識別訓練集及測試集并進行訓練,步驟包括:
A1,截取k×k像素的魚苗圖像m張、非魚苗圖像n張構(gòu)成訓練集,m/2張魚苗圖像、n/2張非魚苗圖像構(gòu)成測試集,k、n、m為正整數(shù);
A2,對截取的圖像使用PCA方法進行特征提取,數(shù)據(jù)降維;
A3,使用AdaBoost算法進行訓練,并確定AdaBoost算法強分類器的迭代次數(shù);
(2)對待識別圖像進行預處理,分離魚苗和圖像背景;
(3)對預處理后圖像進行分割,確定待識別矩形區(qū)域;
(4)使用AdaBoost算法識別模型進行運動魚苗識別。
步驟(2)還包括步驟:
B1,首先使用背景差分法去除魚苗圖像背景得到第一張圖;
B2,使用Ostu算法對第一張圖進行閾值分割,得到第二張圖;
B3,對圖像進行形態(tài)學處理,即分別從橫向和縱向方向進行膨脹操作,得到第三張圖;
B4,統(tǒng)計第三張圖各個連通區(qū)域的面積大小,預先估計魚苗區(qū)域的面積,對于和目標面積相差甚遠的小面積區(qū)域?qū)⑵淙コ瑥亩玫降谒膹垐D,即為預處理后的圖像。
統(tǒng)計第四張圖中所有連通區(qū)域的形心在第一張圖中所處位置,并以形心為中心構(gòu)建大小為k×k像素的識別框體,得到第五張圖,然后分別截取第五張圖所示的所有待識別矩形區(qū)域,以供后續(xù)步驟識別。
本發(fā)明的基于PCA和AdaBoost算法的運動魚苗識別方法可以成功識別運動魚苗,無需人工干預,大大提高識別精度,可以為魚苗下一步的行為研究提供技術(shù)支持。
附圖說明
圖1為本發(fā)明實施例中使用背景差分法去除魚苗圖像背景后的待識別魚苗圖像;
圖2為本發(fā)明實施例中閾值分割后的待識別魚苗圖像;
圖3為本發(fā)明實施例中進行形態(tài)學處理后的待識別魚苗圖像;
圖4為本發(fā)明實施例中去除小面積連通區(qū)域后的待識別魚苗圖像;
圖5為本發(fā)明實施例中構(gòu)建識別區(qū)域后的待識別魚苗圖像;
圖6為根據(jù)本發(fā)明實施例的運動魚苗識別方法的流程圖。
具體實施方式
下面結(jié)合附圖對本發(fā)明的實現(xiàn)過程進行詳細說明。
本發(fā)明實施例提供了一種基于PCA和AdaBoost算法的運動魚苗識別方法,如圖6所示,該方法包括:
(1)構(gòu)建AdaBoost算法識別訓練集(300張圖像)、測試集(150張圖像)并進行訓練,主要步驟包括:
①截取100×100像素的魚苗圖像200張(其中靜止魚苗圖像100張,運動魚苗圖像100張)、非魚苗圖像100張構(gòu)建訓練集;100張魚苗圖像、50張非魚苗圖像構(gòu)成測試集。
②使用PCA方法對訓練集圖片進行特征提取、數(shù)據(jù)降維,并分析主成分,最終確定主成分數(shù)為18,累計貢獻率為99.89%。
③使用AdaBoost算法進行訓練。分別使用10,15和20次迭代次數(shù)構(gòu)建AdaBoost算法強分類器對測試集圖像進行識別試驗,分別從識別時間和識別精度最終確定15次迭代次數(shù)構(gòu)建AdaBoost算法強分類器,得到AdaBoost算法識別模型。
(2)對待識別圖像進行預處理。
①首先使用背景差分法去除魚苗圖像背景得到圖1;
②使用Ostu算法對圖1進行閾值分割,得到圖2;
③為了減少連通區(qū)域,排除圖像中過分割現(xiàn)象,并使后面的圖像處理獲得好的效果,需要對圖像進行形態(tài)學處理,即分別從橫向和縱向方向進行膨脹操作。得到圖3;
④因為圖3存在一些由糞便和殘餌等造成的噪聲點,為去除這些小的噪聲點,統(tǒng)計各個連通區(qū)域的面積大小,并且利用先驗知識,可以預先估計魚苗區(qū)域的面積,對于和目標面積相差甚遠的小面積區(qū)域可以將其去除,從而得到圖4;
(3)統(tǒng)計圖4中所有連通區(qū)域的形心在圖1中所處位置,并以形心為中心構(gòu)建大小為100×100像素的識別框體,得到圖5。然后分別截取圖5所示的所有待識別矩形區(qū)域,等待識別;
(4)使用獲得的AdaBoost算法模型進行識別試驗。