本發(fā)明涉及智能機器人領域,尤其是一種移動機器人快速視覺定位方法。
背景技術:
移動機器人是人工智能技術的載體,在民用物料搬運、火山海底探險、智能清潔等民用領域及均值偵察、掃雷排險、防核化污染等軍事領域都具有廣闊的應用前景。自定位是移動機器人的基本要求。視覺定位技術是機器人自定位技術的一個主要發(fā)展方向。然而隨著ccd傳感器的發(fā)展及自定位要求的提高,待處理圖像的分辨率越來越高,傳統(tǒng)圖像處理方法所需時間大大增加,嚴重影響了移動機器人視覺定位技術的實時性。
技術實現(xiàn)要素:
本發(fā)明提供了一種移動機器人快速視覺定位技術,能很好地解決現(xiàn)有技術的不足,大大縮短圖像處理的時間,有效提高圖像處理效率,滿足視覺定位實時性的要求。
一種移動機器人快速視覺定位方法,主要采用三個模塊,
a、ccd傳感模塊,用于采集環(huán)境圖像并向圖像處理模塊傳送采集到的圖像,
b、圖像處理模塊,用于接收ccd傳感模塊傳送的圖像并進行圖像處理提取圖像的特征信息用于解算機器人的位置信息,同時提取對象尺寸特征用于下一幅圖像的處理,
c、位置信息解算模塊,用于接收圖像處理模塊的圖像特征信息并解算出機器人的位置信息;方法步驟如下:
1)通過ccd傳感模塊連續(xù)采集環(huán)境圖像并傳送給圖像處理模塊,執(zhí)行步驟2);
2)若當前為視頻第一幀圖像,執(zhí)行步驟3),否則執(zhí)行步驟4);
3)圖像處理模塊對接收到的圖像進行處理,而后提取圖像的特征信息傳送給位置信息解算模塊用于解算機器人位置信息,同時提取對象尺寸特征用于下一幅圖像的處理,執(zhí)行步驟5);
4)根據(jù)對象尺寸特征和最小分辨尺寸確定圖像的下采樣率并對源圖像進行下采樣,對下采樣后的圖像進行圖像處理得到對象坐標,根據(jù)對象坐標和下采樣率確定對象在源圖像中的區(qū)域,對源圖像的該區(qū)域進行圖像處理,提取圖像的特征信息傳送給位置信息解算模塊用于解算機器人位置信息,同時提取對象尺寸特征用于下一幅圖像的處理,執(zhí)行步驟5);
5)位置解算模塊接收圖像處理模塊傳送的特征信息,解算出移動機器人的位置信息,執(zhí)行步驟2)。
步驟4)所述的下采樣算法如下:
圖像分辨率為a*b,由上一幅圖像處理得到的對象尺寸特征為c,最小分辨尺寸為d,則下采樣率為d2/c2,下采樣后圖像分辨率為a*b*(c/d)^2,即每(d/c)^2個點中采樣一個點組成新的圖像。
步驟4)所述的對象坐標特指對象的外接正方形的坐標,且外接正方形邊長與圖像邊界平行,則外接正方形相對的兩個頂點坐標即表示該正方形的坐標,外接正方形兩個相對頂點坐標分別為(x1,y1)和(x2,y2),則對象坐標為(x1,y1,x2,y2)。
步驟4)所述的對象在源圖像中的區(qū)域確定算法如下:
對象在下采樣圖像中坐標為(x1,y1,x2,y2),且x1<x2,y1<y2,源圖像下采樣率為k,考慮移動機器人運動過程中對象可能的放大,令對象在源圖像中所處區(qū)域為(kx1/t,ky1/t,kx2*t,ky2*t),t放大系數(shù),其值為1.2。
所述的下采樣算法:
當對象為正方形時,尺寸特征為其邊長,否則尺寸特征為對象外接正方形的邊長。
所述的下采樣算法:
最小分辨尺寸為圖像分辨率固定條件下對象能被識別的最小像素尺寸,根據(jù)圖像識別需求和實際應用要求,實際應用的最小像素尺寸可大于理論值。
所述的下采樣算法:
對于新圖像坐標為(x’,y’)的像素點,其與原圖像像素點的坐標(x,y)對應關系為
本發(fā)明通過自適應下采樣技術將一幅高分辨率的圖像處理轉變?yōu)閮煞头直媛实膱D像處理,在保證視覺定位精度的基礎上大大減少圖像處理的工作量和時間,提高圖像處理效率,滿足視覺定位實時性的要求。
附圖說明
圖1是硬件系統(tǒng)模塊結構圖;
圖2是處理流程框圖;
圖3是待處理圖像。
具體實施方式
一種移動機器人快速視覺定位方法,其硬件系統(tǒng)如圖1所示,主要包括以下三個模塊:
a、ccd傳感模塊,用于采集環(huán)境圖像并向圖像處理模塊傳送采集到的圖像;
b、圖像處理模塊,用于接收ccd傳感模塊傳送的圖像并進行圖像處理提取圖像的特征信息用于解算機器人的位置信息,同時提取對象尺寸特征用于下一幅圖像的處理;
c、位置信息解算模塊,用于接收圖像處理模塊的圖像特征信息并解算出機器人的位置信息。
參照圖2,一種移動機器人快速視覺定位方法,主要處理步驟如下:
1)通過ccd傳感模塊連續(xù)采集環(huán)境圖像并傳送給圖像處理模塊,執(zhí)行步驟2);
2)假設為第一幅圖像,執(zhí)行步驟3),否則執(zhí)行步驟4);
3)圖像處理模塊對接收到的圖像進行處理,而后提取圖像的特征信息傳送給位置信息解算模塊用于解算機器人位置信息,同時提取對象尺寸特征用于下一幅圖像的處理,執(zhí)行步驟5);
4)根據(jù)對象尺寸特征和最小分辨尺寸確定圖像的下采樣率并對源圖像進行下采樣,對下采樣后的圖像進行圖像處理得到對象的坐標,根據(jù)對象坐標和下采樣率確定對象在源圖像中的區(qū)域,對源圖像的該區(qū)域進行圖像處理,提取圖像的特征信息傳送給位置信息解算模塊用于解算機器人位置信息,同時提取對象尺寸特征用于下一幅圖像的處理,執(zhí)行步驟5);
5)位置解算模塊接收圖像處理模塊傳送的特征信息,解算出移動機器人的位置信息,執(zhí)行步驟2)。
圖像處理主要包括圖像分割和特征提取,圖像分割采用基于點相關的分割方法中的灰度級的門限化方法,只需選取一個適當?shù)幕叶燃夐T限,然后將每個像素灰度和它比較,超過門限的重新分配以最大灰度(如1),低于門限的分配以最小灰度(如0),這樣就可以組成一個新的二值圖像,成功將對象從背景中顯露出來?;叶燃壍拈T限化方法可用式(1)的方程描述。
式中,f(x,y),g(x,y)分別為源圖像和重構圖像,t為灰度級門限。
位置解算算法思路為根據(jù)對象大小解算機器人與對象的距離由此解算出機器人的位置信息,由此可知僅需提取對象的尺寸信息,尺寸信息的提取可由對象的外接正方形確定。
對象坐標特指對象的外接正方形的坐標,且外接正方形邊長與圖像邊界平行,則外接正方形相對的兩個頂點坐標即可表示該正方形的坐標,假設外接正方形兩個相對頂點坐標分別為(x1,y1)和(x2,y2),則對象坐標為(x1,y1,x2,y2)。
假設對象在下采樣圖像中坐標為(x1,y1,x2,y2),且x1<x2,y1<y2,源圖像下采樣率為k,考慮移動機器人運動過程中對象可能的放大,令對象在源圖像中所處區(qū)域為(kx1/t,ky1/t,kx2*t,ky2*t),t放大系數(shù),其值為1.2。
一種移動機器人快速視覺定位方法,其自適應下采樣算法如下:
不妨設圖像分辨率為a*b,由上一幅圖像處理得到的對象尺寸特征為c,最小分辨尺寸為d,則下采樣率為d2/c2,下采樣后圖像分辨率為a*b*(c/d)^2,即每(d/c)^2個點中采樣一個點組成新的圖像。對于新圖像坐標為(x’,y’)的像素點,其與原圖像像素點的坐標(x,y)對應關系為
當對象為正方形時,尺寸特征為其邊長,否則尺寸特征為對象外接正方形的邊長。
最小分辨尺寸為圖像分辨率固定條件下對象能被識別的最小像素尺寸,根據(jù)圖像識別需求和實際應用要求,實際應用的最小像素尺寸可大于理論值,如對于正方形,其理論最小分辨尺寸為3像素,考慮圖像噪聲,實際應用中最小分辨尺寸應設為大于3像素。
一般地,圖像的分辨率越高,圖像處理的工作量越大,圖像處理時間越長。在此以圖像分辨率表征圖像處理的工作量。假設圖像采集設備得到的圖像分辨率為a*b,則傳統(tǒng)視覺定位技術的圖像處理工作量為
wo=a*b(3)。
特征對象的最小分辨尺寸為c,尺寸特征為d,則下采樣率為d/c,下采樣后圖像分辨率為a*b*(c/d)^2,即每(d/c)^2個點中抽取一個點組成新的圖像,則下采樣后圖像處理的工作量為
wd=a*b*(c/d)2(4)。
源圖像特定區(qū)域處理工作量與特征對象尺寸有關,一般地與特征尺寸的平方成正比,不妨設為t2d2,則所述技術的圖像處理的總工作量為
wt=a*b*(c/d)2+t2d2(5)。
式中,t=1.2,為放大系數(shù)。
設r為所述技術相比于傳統(tǒng)技術的效率提升,則r可表示為
由式(5)可知,當圖像分辨率和對象確定后,所述技術的相比傳統(tǒng)技術的提升效率由對象的尺寸特征d決定。當d滿足式(6)條件時,提升效率最大,此時圖像處理所需時間最少。
對于一般應用場合,d遠小于a和b,c遠小于d,則a*b*(c/d)^2+d2遠小于a*b,即所述技術可顯著降低圖像處理的工作量,提高圖像處理的效率。
本發(fā)明通過自適應下采樣技術將一幅高分辨率的圖像處理轉變?yōu)閮煞头直媛实膱D像處理,在保證視覺定位精度的基礎上大大減少圖像處理的工作量和時間,提高圖像處理效率,滿足視覺定位實時性的要求。
實施例
假設待處理圖像如圖3所示,圖中圓為待提取對象,圖像分辨率為1800*1200。尺寸特征即為圓的直徑,通過灰度級的門限化方法設定灰度門限為100進行圖像分割并采用hough變換提取圓的參數(shù),得到圓直徑約為194.7,令圓的最小分辨尺寸為20,則下采樣率約為100。由式(6)理論上本發(fā)明所述方法圖像處理工作量僅為傳統(tǒng)方法的3.0%。采用傳統(tǒng)方法對圖3進行圖像處理和特征提取,所需時間約為0.86s,采用本文方法對圖3進行圖像處理和特征提取,所需時間約為0.06s,實際所需時間為傳統(tǒng)方法的7.0%,與理論基本一致。因此當圖3為實際視頻定位的一幅圖像時,采用傳統(tǒng)方法處理僅能支持1.16幀/s幀速率的視頻處理,而一般視頻定位對幀速率的要求為10~30幀/s,而采用本發(fā)明方法可支持高達16.7幀/s幀速率的視頻處理,由此有效提高了視頻處理能力,可很好地滿足視頻定位實時性的要求。