1.一種基于超像素和卷積神經(jīng)網(wǎng)絡(luò)的道路檢測方法,其特征在于,該方法包括:
(1)使用簡單線性迭代聚類算法對圖像預(yù)處理,將圖像分割成大小均勻的超像素;
(2)基于超像素塊使用卷積神經(jīng)網(wǎng)絡(luò)自動學(xué)習(xí)最有利于分類的特征,訓(xùn)練網(wǎng)絡(luò);
(3)使用訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)對道路區(qū)域和非道路區(qū)域進行分類;
(4)根據(jù)超像素鄰域之間的關(guān)系,利用馬爾科夫隨機場對分類的結(jié)果進行優(yōu)化。
2.如權(quán)利要求1所述的方法,其特征在于,所述步驟(1)進一步包括:
簡單線性迭代聚類算法利用像素的顏色相似性與位置關(guān)系來生成超像素;對于每個超像素,其中心采用CIELAB顏色空間的三維顏色特征l、a、b及二維位置信息x、y進行描述;
初始化種子點步驟,假設(shè)圖像有N個像素點,預(yù)分割為K個超像素,那么每個超像素的大小為N/K,且每個種子點的距離近似為為了避免種子點處在圖像的邊緣位置,對后續(xù)的聚類過程造成干擾,將種子點移動到以它為中心的3×3的窗口內(nèi)梯度值最小處,同時為每個種子分配一個單獨的標簽;
相似度衡量步驟,為了提高算法的運算速度,只在以種子點為中心的2s×2s區(qū)域內(nèi)搜索相似像素點,將最相似種子點的標簽賦給該像素;通過不斷迭代該過程,直到收斂;相似度的衡量關(guān)系:
式中dlab為像素點間的顏色差異,dxy為像素點間的空間距離,Di為兩個像素的相似度,s為種子點的間距,m為平衡參數(shù),用來衡量顏色值與空間信息在相似度衡量中的比重;Di取值越大,說明兩個像素越相似;
考慮到提取的超像素的特征以及計算量,本算法選擇分割超像素的個數(shù)是300。
3.如權(quán)利要求1所述的方法,其特征在于,所述步驟(2)進一步包括:
超像素提取步驟,用簡單線性迭代聚類算法對原始圖像提取超像素;
保存超像素的外接矩形步驟,以超像素的中心為中心,保存超像素的外接矩形;
歸一化步驟,將矩形統(tǒng)一歸一化到N×N大小,并標記每個矩形的類別(道路是正樣本,標簽為1,非道路是負樣本,標簽為0),作為訓(xùn)練數(shù)據(jù);
分類器訓(xùn)練步驟,將訓(xùn)練數(shù)據(jù)輸入卷積神經(jīng)網(wǎng)絡(luò),訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò);在卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的過程中,首先使用當前的網(wǎng)絡(luò)權(quán)值和網(wǎng)絡(luò)輸入計算網(wǎng)絡(luò)的輸出,由得到的網(wǎng)絡(luò)輸出和樣本標簽計算誤差,然后用反向傳播算法計算誤差對網(wǎng)絡(luò)權(quán)值的導(dǎo)數(shù),最后使用權(quán)值更新方法更新權(quán)值,經(jīng)過多次訓(xùn)練后使得網(wǎng)絡(luò)中可學(xué)習(xí)的參數(shù)達到最優(yōu),得到一個穩(wěn)定的網(wǎng)絡(luò)結(jié)構(gòu);
本方法中用到的卷積神經(jīng)網(wǎng)絡(luò)包括3個卷積層,2個降采樣層,2個全連接層。
4.如權(quán)利要求1所述的方法,其特征在于,步驟(3)中:
將待檢測圖像分割成超像素,提取超像素的外接矩形,將矩形歸一化到N×N大小,通過訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)判斷其是否為道路,從而獲得圖像初步的道路區(qū)域。
5.如權(quán)利要求1所述的方法,其特征在于,步驟(4)中:
使用馬爾可夫隨機場來優(yōu)化標簽圖,純粹的馬爾科夫模型就是指一件事物的當前狀態(tài)只與它之前的1個或者n個狀態(tài)有關(guān),而與再之前的狀態(tài)有關(guān)系;引申到圖像領(lǐng)域,就是認為圖像中某一點的特征(一般都是像素點灰色、顏色值等)只與其附近的一小塊領(lǐng)域有關(guān),而與其他的領(lǐng)域無關(guān);
設(shè)x、y是二維平面上的隨機場,y是觀測圖像,x是分割的標記場;令是圖像真實標號的估計,由最大后驗概率(MAP)準則有
P(x)是標記場的先驗概率,能夠等價描述為Gibbs分布,滿足
P(y/x)是似然概率,在給定類別標號xi=l時,通常認為像素強度值yi服從參數(shù)為θi={μl,σl}的高斯分布,即滿足:
式中為xi超像素i的標簽,yi為超像素i的像素值,l取值為1或者0,l=1時超像素i為道路,l=0時超像素i為非道路,μl為第l類區(qū)域的均值,σl為第l類區(qū)域的標準方差,β為平滑參數(shù)(取值通常在0.8~1.4),Ni為超像素的鄰域。
6.如權(quán)利要求5所述的方法,其特征在于,使用馬爾科夫隨機場優(yōu)化標簽圖進一步包括:
初始分類結(jié)果步驟,卷積神經(jīng)網(wǎng)絡(luò)分類結(jié)果作為圖像的初始分割;
分割參數(shù)更新步驟,由當前分割更新θi={μl,σl},μl和σl分別是當前第l類區(qū)域的均值和標準方差;
計算超像素最大可能類別步驟,由當前圖像參數(shù)和上次迭代的分割結(jié)果,并根據(jù)最大后驗概率準則計算每個超像素最大可能的類別;
網(wǎng)絡(luò)判斷步驟,判斷是否收斂或達到了最高迭代次數(shù),如果滿足則退出;否則返回分割參數(shù)更新步驟,進行下一次迭代。