專利名稱:基于熵值的面向輸電線路部件識(shí)別的自動(dòng)閾值圖象分割方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于熵值的面向輸電線路部件實(shí)時(shí)識(shí)別的自動(dòng)閾值圖象分割方法。本發(fā)明屬于應(yīng)用于通過(guò)機(jī)器視覺(jué)來(lái)實(shí)現(xiàn)輸電線路部件實(shí)時(shí)識(shí)別的高分辨率圖像預(yù)處理,尤其涉及到利用圖像的信息熵值來(lái)自動(dòng)選擇圖像分割閾值,將由輸電線路主要部件構(gòu)成的前景圖像分割出來(lái),用于輸電線路部件的自動(dòng)實(shí)時(shí)識(shí)別。
背景技術(shù):
輸電線路是國(guó)民經(jīng)濟(jì)的命脈,其安全穩(wěn)定運(yùn)行至關(guān)重要。巡線,即線路巡檢,就是通過(guò)巡視檢查來(lái)掌握線路運(yùn)行狀況及其周圍環(huán)境的變化,以便及時(shí)消除隱患。但輸電線路的分布點(diǎn)多面廣,所處自然條件復(fù)雜多樣,傳統(tǒng)的人工巡線不僅工作量大,而且條件艱苦。因此以現(xiàn)代信息技術(shù)為基礎(chǔ),借助車輛或者飛行器來(lái)對(duì)輸電線路進(jìn)行車載或機(jī)載進(jìn)行高分辨率成像,利用機(jī)器視覺(jué)技術(shù)來(lái)實(shí)現(xiàn)自動(dòng)實(shí)時(shí)巡線,具有很強(qiáng)的現(xiàn)實(shí)意義。
機(jī)器視覺(jué)自動(dòng)巡線應(yīng)用有以下特點(diǎn)1)高清圖像,即對(duì)輸電線路采用500萬(wàn)像素(即2560*1920)以上的高分辨率成像;2)實(shí)時(shí)在線處理,要求處理一幅圖像不超過(guò)40毫秒;3)成像的光照條件零約束,是純粹的自然光成像。前兩個(gè)特點(diǎn)要求圖像分割、圖像識(shí)別和理解的算法在計(jì)算速度上提出了嚴(yán)峻的要求;第三個(gè)特點(diǎn)要求圖像預(yù)處理不僅實(shí)現(xiàn)高速圖像分割,還能有效過(guò)濾和屏蔽成像過(guò)程中引入的各種噪聲和成像缺陷(如光照不均、曝光過(guò)強(qiáng)、曝光過(guò)弱等)。
自動(dòng)巡線要實(shí)現(xiàn)以下功能1)大部件識(shí)別,即對(duì)桿塔、絕緣子、導(dǎo)線、地線、引流線、金具等主要線路部件進(jìn)行視覺(jué)識(shí)別;2)缺陷檢查;3)線路呼稱高測(cè)量。
圖像分割是圖像識(shí)別和圖像理解的基礎(chǔ)和關(guān)鍵,也是機(jī)器視覺(jué)的經(jīng)典難題,尤其是自動(dòng)巡線應(yīng)用中的高清圖像和實(shí)時(shí)性要求對(duì)圖像分割以及后續(xù)的圖像識(shí)別和圖像理解在計(jì)算速度上提出了一場(chǎng)嚴(yán)峻的挑戰(zhàn)。就圖像分割而言,盡管到目前位置,提出的分割算法不下千種,并且每年還有不少新算法出現(xiàn),但由于實(shí)際的機(jī)器視覺(jué)都是面向某個(gè)具體應(yīng)用的,至今沒(méi)有一種有效的圖像分割算法能滿足自動(dòng)巡線應(yīng)用對(duì)自然光成像的高清圖像的實(shí)時(shí)處理要求。
對(duì)機(jī)器視覺(jué)自動(dòng)巡線應(yīng)用的圖像分割而言,其基本目的是要將由線路部件構(gòu)成的前景信息從原始采樣圖像中準(zhǔn)確地抽取出來(lái),實(shí)現(xiàn)前景與背景的準(zhǔn)確分割,同時(shí)能過(guò)濾和屏蔽成像過(guò)程中引入的各種噪聲和成像缺陷。
然而,縱覽各種圖像分割算法,其中絕大部分都是基于圖像在像素級(jí)別的不連續(xù)性和相似性。也就是說(shuō),屬于同一目標(biāo)的區(qū)域具有相似性,而不同區(qū)域在邊界會(huì)表現(xiàn)出不連續(xù)性。這些方法大致可以分成以下幾類 邊緣檢測(cè)方法基于圖像邊緣在像素級(jí)別上的某些方向存在邊緣梯度,通過(guò)從某些方向求圖像的一階(如Roberts算子、Sobel算子、Prewitt算子等)或二階導(dǎo)數(shù)(如高斯-拉普拉斯算子、LOG算子)等微分算子來(lái)尋找邊緣。Canny算子是一種不采用微分算子的邊緣檢測(cè)算子。但邊緣檢測(cè)方法對(duì)成像噪聲的抑制效果很一般、對(duì)成像缺陷的修復(fù)幾乎無(wú)能為力,其檢測(cè)效果反而因此而下降。
邊緣跟蹤方法由于前述的邊緣檢測(cè)方法檢測(cè)出的邊緣點(diǎn)往往由于成像噪聲、光照不均等原因而不連續(xù),邊緣跟蹤方法就是對(duì)這些邊緣點(diǎn)進(jìn)行跟蹤,形成連續(xù)的邊緣。最著名的當(dāng)屬常用于直線、橢圓檢測(cè)的Hough變換。
區(qū)域分割法包括區(qū)域增長(zhǎng)法和區(qū)域分裂合并法。其基本思想是基于同一區(qū)域像素的相似性。對(duì)輸電線路部件識(shí)別這種先驗(yàn)知識(shí)很少、場(chǎng)景復(fù)雜、成像條件約束很少的應(yīng)用進(jìn)行圖像確有一定的優(yōu)勢(shì)。但由于輸電線路部件識(shí)別一般采用高分辨率成像設(shè)備,而這種算法在具體實(shí)現(xiàn)上一般采用遞歸方法,牽涉到較大的計(jì)算時(shí)間開(kāi)銷,因此對(duì)計(jì)算速度影響較大。
最經(jīng)典的圖像分割方法是基于灰度閾值的分割方法。通過(guò)設(shè)定閾值與像素點(diǎn)的灰度值比較,如灰度值大于閾值,則該像素置為白色,否則置為黑色。這樣就將灰度圖像轉(zhuǎn)變?yōu)槎祱D像。但在輸電線路部件識(shí)別這種實(shí)時(shí)應(yīng)用中,針對(duì)每幅圖像或者某類圖像來(lái)人工設(shè)定閾值不能滿足實(shí)時(shí)識(shí)別的需要,必須采取自動(dòng)閾值選取。
盡管自動(dòng)閾值選取在過(guò)去幾十年里一直受到學(xué)術(shù)界的廣泛關(guān)注,也產(chǎn)生了很多中自動(dòng)閾值選取方法,其中比較著名的有迭代式閾值選擇法、Otsu法、最小誤差閾值選擇法,以及通過(guò)借鑒形態(tài)學(xué)理論、將像素值視為地形高度、將圖像視為地形高度圖的分水嶺算法(Watershed),但在實(shí)際應(yīng)用中卻沒(méi)有一種方法能對(duì)各種各樣的圖像都能得到令人滿意的結(jié)果,也沒(méi)有一個(gè)理論來(lái)指導(dǎo)我們?cè)撊绾吾槍?duì)不同的圖像自動(dòng)選取最“合適”的閾值來(lái)對(duì)圖像進(jìn)行分割。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供了一種基于熵值的面向輸電線路部件實(shí)時(shí)識(shí)別的自動(dòng)閾值圖象分割方法。用最大距離法在圖像的熵值直方圖上直接求取圖像分割的最佳閾值,避免了復(fù)雜耗時(shí)的微分操作,具有算法實(shí)現(xiàn)簡(jiǎn)單、計(jì)算開(kāi)銷小、運(yùn)算速度快的優(yōu)點(diǎn),能滿足以天空為主要背景的輸電線路自動(dòng)巡線的高分辨率圖像實(shí)時(shí)預(yù)處理需要。
為了達(dá)到上述目的,本發(fā)明的技術(shù)方案是 一種基于熵值的面向輸電線路部件識(shí)別的自動(dòng)閾值圖象分割方法,包括以下步驟 (1)將輸入的輸電線路彩色圖像轉(zhuǎn)換為灰度圖像,針對(duì)灰度圖像首先建立其灰度直方圖,并根據(jù)該灰度直方圖建立圖像的熵值直方圖;針對(duì)每個(gè)灰度級(jí)別,將對(duì)應(yīng)的像素?cái)?shù)除以整幅圖像的像素總數(shù),得到占比形式的灰度直方圖,再就占比形式的灰度直方圖對(duì)每個(gè)像素級(jí)別進(jìn)行積分,得到圖像的熵值直方圖。
(2)依據(jù)熵值直方圖確定適當(dāng)?shù)幕叶壤旆桨福瑢?duì)灰度圖像進(jìn)行灰度拉伸。
(3)重復(fù)步驟(1)中的建立灰度直方圖和熵值直方圖的方法,對(duì)灰度拉伸后的灰度圖像重新建立其灰度直方圖和熵值直方圖;此時(shí)的熵值直方圖顯示為單調(diào)上升曲線,尋找熵值曲線上熵值突變的拐點(diǎn)。
(4)用最大距離法求出拐點(diǎn),即計(jì)算熵值曲線上每個(gè)點(diǎn)到連接熵值曲線起點(diǎn)和終點(diǎn)的連線的距離,距離最大的點(diǎn)即為拐點(diǎn)。該拐點(diǎn)對(duì)應(yīng)的灰度值即為圖像閾值分割的最佳閾值。
(5)用最佳閾值對(duì)拉伸后的灰度圖像進(jìn)行圖像分割。凡灰度值大于最佳閾值的像素置為白色,反之置為黑色,得到分割出來(lái)的前景圖像,完成圖像預(yù)處理,用于后續(xù)的部件識(shí)別。
所述的建立灰度直方圖是指針對(duì)0-255的每個(gè)灰度級(jí)別對(duì)整幅圖像進(jìn)行掃描,統(tǒng)計(jì)每個(gè)灰度級(jí)別的像素?cái)?shù)量,將統(tǒng)計(jì)結(jié)果以直方圖形式表示。其中橫軸為灰度級(jí)別k,取0-255;豎軸為圖像中相應(yīng)灰度級(jí)別的像素個(gè)數(shù)nk。
所述的建立圖像的熵值直方圖是指首先將灰度直方圖轉(zhuǎn)換為占比直方圖形式將每個(gè)灰度級(jí)別的像素個(gè)數(shù)nk除以整個(gè)圖像的像素總數(shù)nT,得到每個(gè)灰度級(jí)別像素占整幅圖像像素的百分比,即占比pk;然后對(duì)占比直方圖進(jìn)行積分操作,積分公式為其中Ek表示灰度級(jí)別k的熵值,即灰度級(jí)別從0到k的像素占整幅圖像的百分比,形成圖像的熵值直方圖,橫軸為灰度級(jí)別k,取0-255,豎軸為熵值。
所述的熵值發(fā)生突變的拐點(diǎn)是指在熵值直方圖上熵值曲線由平緩上升轉(zhuǎn)為急劇上升的點(diǎn),由解析幾何可知,熵值直方圖中的拐點(diǎn)對(duì)應(yīng)熵值曲線的二階導(dǎo)數(shù)為零、三階導(dǎo)數(shù)不為零的點(diǎn),最佳閾值就是該拐點(diǎn)所對(duì)應(yīng)的灰度值。
本發(fā)明的有益效果為本發(fā)明通過(guò)對(duì)輸電線路車載部件識(shí)別圖像樣本的研究,發(fā)現(xiàn)這些圖像樣本具有以下特點(diǎn)1)其背景主要是天空,而山脈等地面景物較少;2)輸電線路部件在整幅圖像中的像素占比相對(duì)較??;3)相對(duì)背景而言,輸電線路部件的成像灰度總體偏低。針對(duì)輸電線路車載部件識(shí)別的應(yīng)用,考慮到上述圖像樣本的統(tǒng)計(jì)特性,本發(fā)明采用基于熵值的自動(dòng)閾值圖像分割法。這種方法不僅能有效實(shí)現(xiàn)圖像分割的基本目的,實(shí)現(xiàn)由輸電線路主要部件構(gòu)成的前景圖像與以天空為主要背景的背景圖像的分割,而且還能為判定和修復(fù)曝光過(guò)強(qiáng)、曝光過(guò)弱等圖像缺陷提供了有效的手段。同時(shí)本發(fā)明克服了傳統(tǒng)方法中需要對(duì)其進(jìn)行微分操作牽涉到曲線擬合,導(dǎo)致算法復(fù)雜度增加、計(jì)算時(shí)間開(kāi)銷加大,難以滿足實(shí)時(shí)圖像分割的需要的缺點(diǎn)。用最大距離法在圖像的熵值直方圖上直接求取圖像分割的最佳閾值,避免了復(fù)雜耗時(shí)的微分操作,具有算法實(shí)現(xiàn)簡(jiǎn)單、計(jì)算開(kāi)銷小、運(yùn)算速度快的優(yōu)點(diǎn),能滿足以天空為主要背景的輸電線路自動(dòng)巡線的高分辨率圖像實(shí)時(shí)預(yù)處理需要。使整個(gè)方法思路清晰、算法實(shí)現(xiàn)簡(jiǎn)單、計(jì)算開(kāi)銷小、分割速度快,能滿足車載輸電線路實(shí)時(shí)在線自動(dòng)識(shí)別的需要。
圖1為本發(fā)明原始彩色圖像(分辨率為2560*1920); 圖2為本發(fā)明由原始彩色圖像轉(zhuǎn)換而來(lái)的灰度圖像; 圖3為本發(fā)明原始灰度圖像的灰度直方圖; 圖4為本發(fā)明原始灰度圖像的熵值直方圖; 圖5為本發(fā)明經(jīng)灰度拉伸后的灰度圖像; 圖6為本發(fā)明經(jīng)灰度拉伸后的灰度直方圖; 圖7為本發(fā)明經(jīng)灰度拉伸后的熵值直方圖; 圖8為本發(fā)明由熵值直方圖確定的圖像分割“最佳”閾值; 圖9為本發(fā)明用“最佳”閾值分割后的圖像。
具體實(shí)施例方式 實(shí)施例1 本實(shí)施例的一種基于熵值的面向輸電線路部件識(shí)別的自動(dòng)閾值圖象分割方法。硬件平臺(tái)為個(gè)人微型計(jì)算機(jī),操作系統(tǒng)為Windows,圖像開(kāi)發(fā)平臺(tái)為Intel OpenCV,開(kāi)發(fā)工具為Microsoft Visual C++。
具體步驟為 首先將原始采集的分辨率為2560*1920的彩色圖像(圖1)通過(guò)cvCvtColor函數(shù)轉(zhuǎn)換為灰度圖像,如圖2所示。
然后針對(duì)灰度圖像建立灰度直方圖,見(jiàn)圖3所示。圖中橫軸為像素的灰度級(jí)別,取0-255,每個(gè)小格代表10;豎軸為圖像中相應(yīng)灰度級(jí)別的像素個(gè)數(shù)nk(其中k表示灰度級(jí)別)。具體的灰度直方圖數(shù)據(jù)如下 建立圖像的熵值直方圖,見(jiàn)圖4所示。首先將上述步驟中的灰度直方圖轉(zhuǎn)換為占比直方圖形式,辦法是將每個(gè)灰度級(jí)別的像素個(gè)數(shù)nk除以整幅圖像的像素總數(shù)(2560*1920),得到每個(gè)灰度級(jí)別的像素?cái)?shù)量在整幅圖像像素中的占比pk; 然后對(duì)占比直方圖進(jìn)行積分操作,形成圖像的熵值直方圖。具體積分辦法按照進(jìn)行(Ek表示灰度級(jí)別k的熵值)。積分操作后的熵值直方圖數(shù)據(jù)如下 根據(jù)熵值直方圖及上述數(shù)據(jù)可知,當(dāng)灰度級(jí)別為157,相應(yīng)熵值達(dá)到1,即滿熵值。從157遠(yuǎn)小于255可以判定本實(shí)施例的原始灰度圖像不是滿灰度的,需要對(duì)原灰度圖像進(jìn)行灰度拉伸操作。具體拉伸辦法是將原灰度圖像中灰度級(jí)別從0-157的灰度值等比例拉伸到0-255的滿灰度區(qū)間。如原灰度值為k0,則拉伸后的灰度值為經(jīng)灰度拉伸后的灰度圖像見(jiàn)圖5。重復(fù)上述建立圖像灰度直方圖和熵值直方圖的步驟,對(duì)拉伸后的灰度圖像重新建立其灰度直方圖(見(jiàn)圖6)和熵值直方圖(附圖7)。圖像經(jīng)灰度拉伸后的熵值直方圖數(shù)據(jù)如下 至此,圖像的熵值直方圖及其數(shù)據(jù)可知熵值曲線為定義域?yàn)?-255、值域?yàn)?-1的單調(diào)上升曲線。從熵值直方圖可知,用最大距離法(見(jiàn)圖8)可求出拐點(diǎn),即計(jì)算熵值曲線上每個(gè)點(diǎn)到連接熵值曲線起點(diǎn)和終點(diǎn)的連線的距離,距離最大的點(diǎn)即為拐點(diǎn)。該拐點(diǎn)對(duì)應(yīng)的灰度值即為圖像閾值分割的最佳閾值。由于熵值直方圖為離散圖形,通過(guò)求取熵值曲線上各點(diǎn)到OD的距離Dk,具體數(shù)據(jù)如下 其中距離OD最大的點(diǎn)就是熵值直方圖的拐點(diǎn),即圖中的T點(diǎn)。由上述數(shù)據(jù)表中粗體顯示的內(nèi)容可知,T點(diǎn)所對(duì)應(yīng)的灰度值為221,相應(yīng)的熵值曲線上點(diǎn)到OD的距離為0.4468。T點(diǎn)所對(duì)應(yīng)的灰度值(221)就是進(jìn)行圖像分割的“最佳”閾值kT。
最后用kT對(duì)拉伸后的灰度圖像進(jìn)行閾值變換就完成了圖像分割。具體辦法是凡灰度值大于kT的像素置為白色(灰度級(jí)別為255),反之置為黑色(灰度級(jí)別為0),得到分割出來(lái)的圖像(見(jiàn)圖9)。相應(yīng)的閾值變換代碼如下 void Threshold(IplImage*img,int nKt) { unsigned char*data=img->imageData; for(int y=0;y<img->height;y++,data+=img->widthStep){ for(imt x=0;x<img->width;x++){ if(data[x]>nKt)data[x]=255; else data[x]=0; } } }
權(quán)利要求
1、一種基于熵值的面向輸電線路部件識(shí)別的自動(dòng)閾值圖象分割方法,其特征在于包括以下步驟
(1)將輸入的輸電線路彩色圖像轉(zhuǎn)換為灰度圖像,針對(duì)灰度圖像首先建立其灰度直方圖,并根據(jù)該灰度直方圖建立圖像的熵值直方圖;針對(duì)每個(gè)灰度級(jí)別,將對(duì)應(yīng)的像素?cái)?shù)除以整個(gè)圖像的像素總數(shù),得到占比形式的灰度直方圖,再就占比形式的灰度直方圖對(duì)每個(gè)像素級(jí)別進(jìn)行積分,得到圖像的熵值直方(2)依據(jù)熵值直方圖確定適當(dāng)?shù)幕叶壤旆桨?,?duì)灰度圖像進(jìn)行灰度拉伸;
(3)重復(fù)步驟(1)中的建立灰度直方圖和熵值直方圖的方法,對(duì)灰度拉伸后的灰度圖像重新建立其熵值直方圖;此時(shí)的熵值直方圖顯示為單調(diào)上升曲線,尋找熵值曲線上熵值突變的拐點(diǎn);
(4)用最大距離法求出拐點(diǎn),即計(jì)算熵值曲線上每個(gè)點(diǎn)到連接熵值曲線起點(diǎn)和終點(diǎn)的連線的距離,距離最大的點(diǎn)即為拐點(diǎn);該拐點(diǎn)對(duì)應(yīng)的灰度值即為圖像閾值分割的最佳閾值;
(5)用最佳閾值對(duì)拉伸后的灰度圖像進(jìn)行閾值變換,完成圖像分割;凡灰度值大于最佳閾值的像素置為白色,反之置為黑色,得到分割出來(lái)的圖像。
2、如權(quán)利要求1所述的基于熵值的面向輸電線路部件識(shí)別的自動(dòng)閾值圖象分割方法,其特征在于所述的建立圖像的熵值直方圖是指首先將灰度直方圖轉(zhuǎn)換為占比直方圖形式將每個(gè)灰度級(jí)別的像素個(gè)數(shù)nk除以整個(gè)圖像的像素總數(shù),得到每個(gè)灰度級(jí)別在整個(gè)圖像中的像素占比pk;然后對(duì)占比直方圖進(jìn)行積分操作,積分公式為其中Ek表示灰度級(jí)別k的熵值,形成圖像的熵值直方圖,橫軸為像素占比pk值,豎軸為圖像的熵值。
3、如權(quán)利要求1所述的基于熵值的面向輸電線路部件識(shí)別的自動(dòng)閾值圖象分割方法,其特征在于所述的熵值發(fā)生突變的拐點(diǎn)是指經(jīng)過(guò)拐點(diǎn)以后熵值曲線由平緩轉(zhuǎn)變?yōu)榧眲∩仙狞c(diǎn),通過(guò)最大距離法來(lái)求得拐點(diǎn)對(duì)應(yīng)的灰度值,即進(jìn)行圖像分割的最佳閾值。
全文摘要
本發(fā)明公開(kāi)了一種基于熵值的面向輸電線路部件識(shí)別的自動(dòng)閾值圖象分割方法,包括以下步驟將輸入的輸電線路彩色圖像轉(zhuǎn)換為灰度圖像,針對(duì)灰度圖像建立其灰度直方圖和熵值直方圖;依據(jù)熵值直方圖確定適當(dāng)?shù)幕叶壤旆桨?,?duì)灰度圖像進(jìn)行灰度拉伸;重復(fù)上述步驟中的建立灰度直方圖和熵值直方圖的方法,對(duì)灰度拉伸后的灰度圖像重新建立其熵值直方圖;此時(shí)的熵值直方圖顯示為單調(diào)上升曲線,尋找熵值曲線上熵值突變的拐點(diǎn);用最大距離法求出拐點(diǎn),該拐點(diǎn)對(duì)應(yīng)的灰度值即為圖像閾值分割的最佳閾值;用最佳閾值對(duì)拉伸后的灰度圖像進(jìn)行閾值變換,完成圖像分割。本發(fā)明具有算法實(shí)現(xiàn)簡(jiǎn)單、計(jì)算開(kāi)銷小、運(yùn)算速度快的優(yōu)點(diǎn),能滿足以天空為主要背景的輸電線路自動(dòng)巡線的高分辨率圖像實(shí)時(shí)預(yù)處理需要。
文檔編號(hào)G06T7/00GK101630411SQ200910100168
公開(kāi)日2010年1月20日 申請(qǐng)日期2009年7月2日 優(yōu)先權(quán)日2009年7月2日
發(fā)明者黃宵寧, 張真良, 曄 盛, 宋偉光, 成劍英, 韋愛(ài)平 申請(qǐng)人:浙江省電力公司, 紹興電力局, 南京工程學(xué)院