本發(fā)明涉及生物水質(zhì)檢測、HSV空間域轉(zhuǎn)化提取輪廓、樸素貝葉斯分類技術(shù)等領(lǐng)域,提出了一種生物式水質(zhì)毒性檢測方法。
背景技術(shù):
水質(zhì)異常檢測是以被監(jiān)控水質(zhì)的正常數(shù)據(jù)指標(biāo)作為基準(zhǔn),通過檢查水質(zhì)的當(dāng)前數(shù)據(jù)指標(biāo)與正常數(shù)據(jù)指標(biāo)的偏差程度來確定是否發(fā)生了水質(zhì)異常。水質(zhì)檢測可以簡化為一個分類問題,輸入為水樣,輸出為正常水質(zhì)或異常水質(zhì)。
傳統(tǒng)的水質(zhì)檢測方法大多采用理化檢測結(jié)合統(tǒng)計模型分析方式,對水質(zhì)數(shù)據(jù)進(jìn)行提取和檢測。傳統(tǒng)方法的缺陷在于:1、水質(zhì)數(shù)據(jù)的采集大多采用人工方式進(jìn)行定時采集,導(dǎo)致采集具有滯后性,不能應(yīng)對突發(fā)性水質(zhì)污染的檢測;2、由于采用理化檢測,需要一系列用于分析、檢測的儀器設(shè)備,導(dǎo)致檢測成本較高。
為了解決傳統(tǒng)水質(zhì)檢測方法的不足,學(xué)者們提出了基于水生生物行為的水質(zhì)檢測方法。其中魚類是最為常見的水生生物,水質(zhì)變化往往會引起魚類行為的異常,通過觀察魚類異常行為,從而實現(xiàn)對水質(zhì)異常的預(yù)警。該方法往往利用置于水樣上的攝像頭,自動的獲取水樣中的魚類行為。通過分析魚類行為的視頻數(shù)據(jù),實現(xiàn)對水質(zhì)發(fā)生異常的預(yù)警。
技術(shù)實現(xiàn)要素:
本發(fā)明要克服現(xiàn)有技術(shù)上述缺點,提供一種基于魚類活性分析的水質(zhì)毒性檢測方法。
水質(zhì)中若存在較大的毒性,比如引起水中魚類大量死亡,則意味著水質(zhì)可能存在異常,據(jù)此應(yīng)自動產(chǎn)生預(yù)警信號。然而,判斷魚死亡不能簡單的根據(jù)某一個參數(shù),而需要綜合多個行為參數(shù)才能較為準(zhǔn)確的對其是否死亡進(jìn)行判斷。為此,本發(fā)明提出一種基于樸素貝葉斯檢測水樣中的魚群是否存在死亡的個體的方法,從而實現(xiàn)對水質(zhì)可能存在的毒性作出實時預(yù)警。
本發(fā)明解決其技術(shù)問題采用的技術(shù)方案是:
一種基于魚類活性分析的水質(zhì)毒性檢測方法,包括以下步驟:
1)以鯽魚作為生物監(jiān)測對象對其進(jìn)行實時監(jiān)測,綜合鯽魚的運動速度和運動時輪廓的變化,以此判斷水樣中的魚是否死亡,從而實現(xiàn)對水質(zhì)是否存在毒性進(jìn)行實時反饋。為了還原真實環(huán)境,采用的試驗裝置如(圖1),監(jiān)測魚置于水箱中,水箱上的攝像頭用于采集水箱中魚的行為視頻。該水箱可實時更新水源,使水流平緩流動,從而降低因水流沖擊對魚類行為的異常的影響;
2)采集和提取鯽魚的運動特征:通過紅R、綠G、藍(lán)B到色調(diào)H、飽和度S、亮度V顏色空間域的轉(zhuǎn)換來提取魚目標(biāo)輪廓(圖2),實時監(jiān)測跟蹤水樣中鯽魚,得到鯽魚的跟蹤視頻序列,該跟蹤模型描述如下:
通過對監(jiān)控視頻圖像的分割、識別、跟蹤標(biāo)定鯽魚目標(biāo)的實時運動位置,并以固定時間間隔作為統(tǒng)計周期,獲取該周期內(nèi)魚群中每個個體的輪廓和運動速度等特征參數(shù);
3)鯽魚的特征參數(shù)分析,包括以下過程:定義死魚特征數(shù)據(jù)集和活魚特征數(shù)據(jù)集,通過學(xué)習(xí),形成一個成熟的分類器結(jié)構(gòu)模型。具體過程如下:
3.1)收集水箱中每一條鯽魚的運動速度v、輪廓面積outline_Area與所有鯽魚等面積均值average_Area之差這兩個特征數(shù)據(jù),將這兩個參數(shù)作為檢測水箱中魚是否存活的指標(biāo)。
其中,魚的運動速度是研究魚類行為的一個重要的參數(shù),它反應(yīng)單位時間內(nèi)的位移、加速度等運動特征。
3.1.1)速度的特征數(shù)據(jù)
考慮到前一幀和后一幀每條魚的運動軌跡變化小,因此采用后一幀與前一幀魚的重心最短距離計算這條魚在一幀時間內(nèi)的移動距離Si。然后,取一秒鐘的幀數(shù)(通常設(shè)為15幀),把這些距離相加再除以時間就是魚每秒的運動速度。但是,由于水箱中魚在游動時常常存在疊加,導(dǎo)致定位每一條魚的身份存在困難。如果不能精準(zhǔn)的對每一條魚進(jìn)行跟蹤,那么計算每一魚的身份就會產(chǎn)生誤差。由于幀間魚游動距離很小,因此可根據(jù)前后幀距離關(guān)系求得每一條魚的游動距離。也就是取目標(biāo)魚后一幀到當(dāng)前幀移動距離最小值,作為當(dāng)前幀該目標(biāo)魚的游動距離。
假設(shè)水箱中有n條魚,第j幀第i條鯽魚輪廓的重心坐標(biāo)為第j+1幀第k條鯽魚輪廓的重心坐標(biāo)為可以得到第j幀第i條鯽魚到第j+1幀第k條鯽魚的距離為:
根據(jù)以上方法,可求出第j幀第i條鯽魚到第j+1幀魚缸中各條魚的距離為S1,…Sk…Sn。由此,得到當(dāng)前魚i在幀間游動距離為:
Si=min{S1,S2,…Sk…Sn} (2)
此時得到的最短距離Si即為第j幀第i條鯽魚到下一幀游動的距離。在一秒內(nèi)取15幀,則目標(biāo)在1秒內(nèi)的運動速度可以通過以下公式計算得到:
水箱中魚的運動速度的大小,能反映魚類游動的激烈程度,是衡量魚類目標(biāo)在被檢測水質(zhì)中活性的一個重要指標(biāo)參數(shù)。然而,當(dāng)魚的游動速度為0,并不意味著此時該魚一定處于死亡狀態(tài),而是有可能魚處于靜息狀態(tài)。此外,由于水流速度或者其他魚的撞擊,死亡的魚其速度也并不總是為0(圖3)。
3.1.2)輪廓的特征數(shù)據(jù)
背景差分后利用opencv里的contourArea函數(shù)可求得目標(biāo)輪廓面積,其中opencv是一個基于(開源)發(fā)行的跨平臺計算機(jī)視覺庫,該函數(shù)是統(tǒng)計目標(biāo)輪廓內(nèi)的每個像素點的累加和,即為面積。與上述求速度的方法類似,求得每一時刻魚的位置,由此計算水箱中魚在每一時刻的面積{A1,A2,…An}。當(dāng)魚處于死亡狀態(tài)時,其身體自由的飄浮在水中,魚體的面積大于其處于非死亡狀態(tài)時的面積。其中,水缸中魚體平均面積可由下式計算:
根據(jù)觀察,鯽魚在活性狀態(tài)下,其背部朝上。而一旦處于死亡狀態(tài),則其腹部朝上,其輪廓面積相比于死亡狀態(tài)增加了75%左右(圖4)。在圖4中,是死魚和活魚一定時間內(nèi)輪廓面積的統(tǒng)計,從圖中可以看到活魚面積基本維持在700到900像素,而死魚的面積基本在1200到1600像素之間。因此,輪廓面積的變化是判斷目標(biāo)魚存活性的重要特征之一。然而,由于水箱中燈光等環(huán)境常常處于變化狀態(tài),導(dǎo)致根據(jù)背景差分獲得的輪廓也會存在誤差。因此,僅僅根據(jù)目標(biāo)魚輪廓面積判斷其是否處于存活狀態(tài)依然存在較大誤差。
為此,提出利用樸素貝葉斯方法,綜合多個特征,判斷魚是否處于存活狀態(tài)的方法。該方法首先構(gòu)建模型,其次根據(jù)數(shù)據(jù)得到模型的參數(shù),從而得到成熟的分類模型(圖5)。該模型能判斷出水箱中是否有魚處于死亡狀態(tài),從而對水樣可能存在的毒性做出預(yù)警。
3.2)基于樸素貝葉斯算法對數(shù)據(jù)進(jìn)行訓(xùn)練產(chǎn)生成熟的分類器結(jié)構(gòu)模型,算法過程如下:
a)設(shè)x={a1,a2,……am}為一個待分類項,而每個a為x的特征項。目標(biāo)魚的速度a1和輪廓面積差a2即為特征項,因此可得x={a1,a2},x表示目標(biāo)魚;
b)輸出類別集合C={c1,c2,……cn},每個c是輸出集合C的一種結(jié)果。本發(fā)明是檢測判斷魚是否死亡,因此類別集合C={c1=0,c2=1},并用C=0表示魚處于活著狀態(tài);
c)當(dāng)利用游動速度和面積差這兩個特征來判斷魚類是否死亡時,可將這一過程表示成聯(lián)合條件概率P(C|a1,a2)。該式表示在a1,a2同時發(fā)生情況下目標(biāo)魚處于死亡狀態(tài)的概率。由貝葉斯公式,可得,
上式中的P(a1,a2)不依賴于類別C,也就是它的值對分類結(jié)果不產(chǎn)生影響,因此計算過程該項將被忽略。由全概率公式和條件概率的鏈?zhǔn)椒▌t,上式的分子項可展開為:
P(C)P(a1,a2|C)=P(a1,a2,C)
=P(a1|a2,C)P(a2|C)P(C)
假設(shè)給定類別C,特征之間相互條件獨立。也就是,P(a1|a2,C)=P(a1|C),上式可化為:
P(C)P(a1,a2|C)=P(a1|C)P(a2|C)P(C)
d)收集所有魚處于存活/死亡狀態(tài)下的游動速度和輪廓面積數(shù)據(jù),構(gòu)造訓(xùn)練樣本集,用于計算概率P(a1|C)、P(a2|C)值。本發(fā)明假設(shè)P(a1|C)、P(a2|C)均符合高斯分布,這樣可以從訓(xùn)練集中求得魚處于死亡狀態(tài)時速度均值μ1,方差σ1。魚處于死亡狀態(tài)時輪廓面積均值μ2,方差σ2。
3.3)使用新的特征數(shù)據(jù)來檢測判斷該檢測模型是否成熟。也就是,給定目標(biāo)魚的兩個特征判斷該目標(biāo)魚處于死亡或者存活狀態(tài)。
本發(fā)明假設(shè)魚是否死亡的先驗概率相等,即P(C=0)=P(C=1)=0.5。此外,
同理,可以分別求得P(a2|C=0)、P(a1|C=1)和P(a2|C=1)的值。當(dāng)(5)中比值大于1,則判斷目標(biāo)魚處于存活狀態(tài),否則處于死亡狀態(tài)。
3.4)通過成熟的檢測模型對魚缸中魚的存活與否作出判斷。當(dāng)魚缸中目標(biāo)魚死亡條數(shù)超過總數(shù)的一半,則給出水質(zhì)存在毒性的預(yù)警信號。
本發(fā)明的技術(shù)優(yōu)勢主要是可以克服復(fù)雜環(huán)境中的魚目標(biāo)個體提取,尤其是可以準(zhǔn)確的對目標(biāo)魚群存活狀態(tài)作出判斷,從而對水質(zhì)可能存在的毒性作出預(yù)警。
本發(fā)明的技術(shù)構(gòu)思為:所述基于魚類是否死亡檢測水質(zhì)異常的方法,包括以下步驟:
1)以鯽魚作為生物檢測對象對其進(jìn)行實時檢測;
2)對目標(biāo)輪廓的正確提取,實時檢測跟蹤鯽魚;
3)基于樸素貝葉斯算法對數(shù)據(jù)進(jìn)行訓(xùn)練產(chǎn)生成熟的檢測結(jié)構(gòu)模型,采用新的特征數(shù)據(jù)對生成的檢測結(jié)構(gòu)模型進(jìn)行檢測判斷,利用成熟的檢測模型對目標(biāo)生物的存活狀態(tài)作出判斷,從而實時對待監(jiān)測水質(zhì)可能存在的毒性作出預(yù)警。
步驟1)中,鯽魚作為一種重要的指標(biāo)生物已被廣泛地應(yīng)用于環(huán)境檢測,是國際標(biāo)準(zhǔn)化組織認(rèn)可的魚類實驗動物,是理想的水質(zhì)檢測指標(biāo)生物。本發(fā)明選取鯽魚作為指示生物并對其進(jìn)行實時監(jiān)測。指示生物指標(biāo)數(shù)據(jù)的有效獲取是生物監(jiān)測的重要內(nèi)容。由于鯽魚生理特征變化能比較直觀、實時的反應(yīng)水質(zhì)的變化,因此這些特征在水質(zhì)安全研究中既是關(guān)鍵的監(jiān)測指標(biāo)也是重要的檢測指標(biāo)。故對這些行為特征快速準(zhǔn)確地獲取與檢測就成為水質(zhì)異常檢測的重要內(nèi)容。
步驟2)中,對于飲用水源的安全健康,最為重要的內(nèi)容之一便是水源是否具有致命的毒性物質(zhì)。通過監(jiān)控水環(huán)境中指示生物的存活狀態(tài),實現(xiàn)自動監(jiān)控水源毒性的功能。判斷指示生物存活狀態(tài)需要綜合多個特征參數(shù),為此提出基于樸素貝葉斯算法,得到判斷指示生物存活狀態(tài)的分類模型。尤其是,本發(fā)明并不需要精準(zhǔn)跟蹤每一個指示生物,就能準(zhǔn)確判斷其存活狀態(tài)。由此,在保證準(zhǔn)確性的前提下提高的數(shù)據(jù)處理的效率,從而為及時預(yù)警提供了一種可行的實現(xiàn)。
步驟3)中,將步驟2)得到鯽魚運動行為特征的水質(zhì)指標(biāo)進(jìn)行分析檢測。
本發(fā)明利用生物檢測、樸素貝葉斯分類以及視覺感知技術(shù),提出一種基于生物監(jiān)測水質(zhì)毒性的算法。該算法主要分為三步:首先,將鯽魚作為生物檢測對象對其行為參數(shù)進(jìn)行監(jiān)測;其次,采用HSV空間域轉(zhuǎn)化計算視覺的算法提取每一個對象的行為參數(shù);然后,利用樸素貝葉斯分類算法產(chǎn)生成熟收斂的檢測器模型,對目標(biāo)魚的存活狀態(tài)進(jìn)行監(jiān)測。最后,根據(jù)待監(jiān)測水中目標(biāo)魚的存活狀態(tài)變化,對水質(zhì)可能存在的毒性進(jìn)行預(yù)警。
本發(fā)明的優(yōu)點是:能夠?qū)崿F(xiàn)在線實時檢測,提高水質(zhì)檢測的敏感性和連續(xù)性,降低檢測成本,可對大量未知水質(zhì)毒性狀況進(jìn)行實時有效地檢測。
附圖說明
圖1是流動水源魚缸示意圖;
圖2是RGB到HSV空間域轉(zhuǎn)化提取目標(biāo)示意圖;
圖3是魚的游動速度示意圖;
圖4是死魚與活魚的輪廓面積示意圖。
圖5是本發(fā)明的檢測流程示意圖;
圖6是本發(fā)明的流程示意圖。
具體實施方式
下面結(jié)合附圖對本發(fā)明作進(jìn)一步描述。
參照圖1~圖6,一種基于魚類活性分析的水質(zhì)毒性檢測方法,包括以下步驟:
1)以鯽魚作為生物監(jiān)測對象對其進(jìn)行實時監(jiān)測,基于其運動蹤跡實現(xiàn)對水質(zhì)的在線檢測。為了還原真實環(huán)境,本發(fā)明所使用的試驗裝置如圖1所示。該圖中1、2是進(jìn)水口,3、4是出水口,5是魚體目標(biāo),6是分辨率為640*480像素的攝像頭。采集數(shù)據(jù)所用的CMOS攝像頭放置在實驗魚缸正上方一定高度,保證攝像頭可以拍攝到魚的全部活動范圍。該裝置可以實時更新水源,使水流平緩流動,從而降低水流沖擊對魚類行為的異常影響;
2)采集和提取鯽魚的運動特征:通過RGB到HSV顏色空間域的轉(zhuǎn)換來提取魚目標(biāo)輪廓(圖2),實時監(jiān)測跟蹤鯽魚,得到鯽魚的跟蹤視頻序列。HSV有效避免了亮光、投影、噪聲等的干擾,相對于背景差建模法等方法可以更方便有效的應(yīng)用到實際水質(zhì)中,該跟蹤模型描述如下:
通過對監(jiān)控視頻圖像的分割、識別、跟蹤標(biāo)定鯽魚目標(biāo)的實時運動位置,并以固定時間間隔作為統(tǒng)計周期,獲取該周期魚群的輪廓、速度特征參數(shù)作為步驟三的數(shù)據(jù)依據(jù);
3)鯽魚的運動數(shù)據(jù)分析檢測,包括以下過程:基于步驟2)中所獲取的運動參數(shù),構(gòu)建死魚特征數(shù)據(jù)集和活魚特征數(shù)據(jù)集,設(shè)定各個運動參數(shù)的預(yù)警指標(biāo)。通過訓(xùn)練和學(xué)習(xí),得到分類器生成結(jié)構(gòu)模型,形成各個預(yù)警信息的成熟檢測器。具體過程如下:
3.1)收集魚類的運動速度、輪廓面積與面積均值之差這兩個主要特征數(shù)據(jù),將其作為檢測水質(zhì)是否異常的指標(biāo);
3.2)基于樸素貝葉斯算法對數(shù)據(jù)進(jìn)行訓(xùn)練產(chǎn)生分類成熟的檢測結(jié)構(gòu)模型;
3.3)使用新的特征數(shù)據(jù)來檢測判斷該檢測模型是否成熟;
3.4)利用成熟的檢測模型對實時水質(zhì)進(jìn)行在線檢測,最終實現(xiàn)水質(zhì)的異常檢測。
本實施例中,魚體數(shù)據(jù)指標(biāo)提取過程:視頻序列的目標(biāo)跟蹤問題可以看成是一個動態(tài)系統(tǒng)的狀態(tài)和觀測值,根據(jù)當(dāng)前幀和下一時刻下的狀態(tài)和觀測值,來獲取下一時刻的運動位置。所以單目標(biāo)跟蹤方法如下所示:
首先,由于前一幀和后一幀每條魚的運動軌跡變化小,通過后一幀與前一幀某條魚重心的最短距離計算這條魚在一幀的時間內(nèi)移動的距離,然后取一秒鐘的幀數(shù),把這些距離相加再除以時間就是魚每秒的運動速度。該方法的好處是,不需要精準(zhǔn)跟蹤每一個目標(biāo)魚,仍然可以較為準(zhǔn)確的計算出每一目標(biāo)魚的游動速度;
其次,獲取目標(biāo)魚的輪廓面積,與求取速度的方法類似,近似獲得每一目標(biāo)魚在下一時刻的位置,由此得到此魚在下一時刻的面積{A1,A2,…An};
根據(jù)觀察,鯽魚在活性狀態(tài)下,其背部朝上。而一旦處于死亡狀態(tài),則其腹部朝上,其輪廓面積相比于死亡狀態(tài)增加了75%左右(圖4)。在圖4中,是死魚和活魚一定時間內(nèi)輪廓面積的統(tǒng)計,從圖中可以看到活魚面積基本維持在700到900像素,而死魚的面積基本在1200到1600像素之間。因此,輪廓面積的變化是判斷目標(biāo)魚存活性的重要特征之一。然而,由于水箱中燈光等環(huán)境常常處于變化狀態(tài),導(dǎo)致根據(jù)背景差分獲得的輪廓也會存在誤差。因此,僅僅根據(jù)目標(biāo)魚輪廓面積判斷其是否處于存活狀態(tài)依然存在較大誤差。
為此,基于樸素貝葉斯算法對數(shù)據(jù)進(jìn)行訓(xùn)練產(chǎn)生成熟的分類器結(jié)構(gòu)模型,算法過程如下:
a)設(shè)x={a1,a2,……am}為一個待分類項,而每個a為x的特征項。目標(biāo)魚的速度a1和輪廓面積差a2即為特征項,因此可得x={a1,a2},x表示目標(biāo)魚;
b)輸出類別集合C={c1,c2,……cn},每個c是輸出集合C的一種結(jié)果。本發(fā)明是檢測判斷魚是否死亡,因此類別集合C={c1=0,c2=1},并用C=0表示魚處于活著狀態(tài);
c)當(dāng)利用游動速度和面積差這兩個特征來判斷魚類是否死亡時,可將這一過程表示成聯(lián)合條件概率P(C|a1,a2)。該式表示在a1,a2同時發(fā)生情況下目標(biāo)魚處于死亡狀態(tài)的概率。由貝葉斯公式,可得,
上式中的P(a1,a2)不依賴于類別C,也就是它的值對分類結(jié)果不產(chǎn)生影響,因此計算過程該項將被忽略。由全概率公式和條件概率的鏈?zhǔn)椒▌t,上式的分子項可展開為:
P(C)P(a1,a2|C)=P(a1,a2,C)
=P(a1|a2,C)P(a2|C)P(C)
假設(shè)給定類別C,特征之間相互條件獨立。也就是,P(a1|a2,C)=P(a1|C),上式可化為:
P(C)P(a1,a2|C)=P(a1|C)P(a2|C)P(C)
d)收集所有魚處于存活/死亡狀態(tài)下的游動速度和輪廓面積數(shù)據(jù),構(gòu)造訓(xùn)練樣本集,用于計算概率P(a1|C)、P(a2|C)值。本發(fā)明假設(shè)P(a1|C)、P(a2|C)均符合高斯分布,這樣可以從訓(xùn)練集中求得魚處于死亡狀態(tài)時速度均值μ1,方差σ1。魚處于死亡狀態(tài)時輪廓面積均值μ2,方差σ2。
然后,計算目標(biāo)魚處于死亡或者存活狀態(tài)下速度等于a1,以及面積等于a2的概率。也就是,求4個似然概率值P(a1|C=0)、P(a2|C=0)、P(a1|C=1)和P(a2|C=1)。假設(shè)目標(biāo)魚處于死亡或者存活狀態(tài)的概率均等于0.5。有了先驗概率和似然概率值,便可以根據(jù)貝葉斯公式求得給定目標(biāo)魚當(dāng)前速度等于a1、面積等于a2的情況下,該魚到底處于死亡或者存活狀態(tài)。
最后,根據(jù)得到的成熟的分類模型,判斷出水箱中是否有魚處于死亡狀態(tài)。當(dāng)水箱中目標(biāo)魚死亡條數(shù)超過總數(shù)(一般為4條目標(biāo)魚)的一半,則給出水質(zhì)存在毒性的預(yù)警信號。