專利名稱:對具有深度圖像信息的圖像的分割方法
技術(shù)領域:
本發(fā)明涉及圖像分析技術(shù)領域,具體講是一種對具有深度圖像信息的圖像的分割方法。
背景技術(shù):
在圖像分析的技術(shù)中,圖像分割是非常重要的底層處理技術(shù),它是許多高層應用的基礎,簡單地以車牌識別舉例說明,其中圖像中的車輛牌照可被視為前景(有用的信息),而車輛牌照之外的部分則被視為背景,圖像分割就是要將前景和背景進行區(qū)分,或者說圖像分割就是將圖像分成若干個特定的、具有獨特性質(zhì)的區(qū)域并提取出感興趣的目標的技術(shù)和過程,如車輛牌照識別、醫(yī)學影像分析、人臉識別、人流量檢測、目標跟蹤和識別、AdobePhotoshop中魔棒的功能等等。圖像分割作為機器視覺領域的內(nèi)容,一直是一個研究難點,主要是沒有通用的分割方法對所有問題有效,這也是它頗具挑戰(zhàn)性的原因之一。 隨著2010年6月推出Kinect以來,具有深度圖像信息的圖像的獲取變得更加容易,基于深度圖像信息的分割將漸漸顯現(xiàn)出重要性,Kinect配套的API也使用了一些初步的具有深度圖像信息的圖像進行分割,但是較為簡單,主要原因是室內(nèi)環(huán)境比較簡單,通過閾值分割,在用平面匹配剪除地面的干擾,就能很好的分割出室內(nèi)的人物,而對于復雜或者前背景距離較近的情況則Kinect配套的API不太適用。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是,提供一種分割精度高、在前背景非常相似的情況下仍然達到較好分割效果的對具有深度圖像信息的圖像的分割方法。本發(fā)明的技術(shù)方案是,提供一種對具有深度圖像信息的圖像的分割方法,包括以下步驟①經(jīng)Kinect獲取具有深度圖像信息的圖像,該圖像的數(shù)據(jù)結(jié)構(gòu)為RGBD,其中RGB為顏色空間的三個通道,D為Kinect捕獲的與像素對應的深度圖像信息,然后在所述圖像上拖出一個圈或框進行第一次圖像分割,該圈或框完全落入要分割的目標內(nèi),或者該圈或框至少與要分割的目標相交;②對前背景的顏色信息和深度圖像信息進行概率建模,前景為圖像中拖出的圈或框選中的部分,背景則為未被圖像中拖出的圈或框選中的部分,深度圖像信息數(shù)據(jù)為ο =
Io1,.. . , Oi,. . . , oN}, Oi = (Ci, (Ii)為深度圖像信息的圖像分割信息,N為圖像像素的個數(shù),Ci為顏色空間中的三個分量組成的向量;對顏色信息的建模采用高斯混合模型,分別對前景和背景的顏色總體分布進行建模;③用EM算法對模型進行參數(shù)估計用高斯混合模型來估計前景和背景顏色信息的似然函數(shù),對高斯混合模型中的各K個高斯元的參數(shù)U,μ,Σ)進行估計,采用EM算法,通過迭代的方法進行模型參數(shù)的估計,
EM算法的第t次迭代的模型參數(shù)表示為 Qt= {> t (k),μ t (k),Σ t (k)},k = 1,· · ·,K在Ε-st印中對每一類別計算圖像數(shù)據(jù)的后驗概率
權(quán)利要求
1.一種對具有深度圖像信息的圖像的分割方法,其特征在于,包括以下步驟 ①經(jīng)Kinect獲取具有深度圖像信息的圖像,該圖像的數(shù)據(jù)結(jié)構(gòu)為RGBD,其中RGB為顏色空間的三個通道,D為Kinect捕獲的與像素對應的深度圖像信息,然后在所述圖像上拖出一個圈或框進行第一次圖像分割,該圈或框完全落入要分割的目標內(nèi),或者該圈或框至少與要分割的目標相交; ②對前背景的顏色信息和深度圖像信息進行概率建模,前景為圖像中拖出的圈或框選中的部分,背景則為未被圖像中拖出的圈或框選中的部分,深度圖像信息數(shù)據(jù)為ο =Io1,. . . , Oi,. . . , oN}, Oi = (Ci, (Ii)為深度圖像信息的圖像分割信息,N為圖像像素的個數(shù),Ci為顏色空間中的三個分量組成的向量;對顏色信息的建模采用高斯混合模型,分別對前景和背景的顏色總體分布進行建模; ③用EM算法對模型進行參數(shù)估計 用高斯混合模型來估計前景和背景顏色信息的似然函數(shù),對高斯混合模型中的各K個高斯元的參數(shù)U,μ,Σ)進行估計,采用EM算法,通過迭代的方法進行模型參數(shù)的估計, EM算法的第t次迭代的模型參數(shù)表示為
2.根據(jù)權(quán)利要求I所述的對具有深度圖像信息的圖像的分割方法,其特征在于,用EM算法對模型進行參數(shù)估計時,先用K-means方法對像素進行分類,再用這個結(jié)果作為高斯混合模型的初始化條件,最后用概率公式M
3.根據(jù)權(quán)利要求I所述的對具有深度圖像信息的圖像的分割方法,其特征在于,用圖像金字塔技術(shù)來加快最大流算法,即在底層進行概率建模,高層進行最大流算法,再把分割的結(jié)果映射到底層。
4.根據(jù)權(quán)利要求I所述的對具有深度圖像信息的圖像的分割方法,其特征在于,圖割算法分為建圖和執(zhí)行最大流算法兩個過程,建圖過程用到步驟②和③建立起來的前背景概率模型,其中,網(wǎng)絡圖分為兩種邊, 一種表示像素信息與概率模型的相似度,計算公式為, Rp(Ap) = -Inp (op I Θ f|b), 另一種表示像素信息間的差異程度,計算公式為,
5.根據(jù)權(quán)利要求I所述的對具有深度圖像信息的圖像的分割方法,其特征在于,所述圈為圓圈。
6.根據(jù)權(quán)利要求I所述的對具有深度圖像信息的圖像的分割方法,其特征在于,所述框為矩形框。
全文摘要
本發(fā)明公開了一種分割精度高、在前背景非常相似的情況下仍然達到較好分割效果的對具有深度圖像信息的圖像的分割方法,①經(jīng)Kinect獲取具有深度圖像信息的圖像;②對前背景的顏色信息和深度圖像信息進行概率建模;③用EM算法對模型進行參數(shù)估計;④采用圖割算法來對圖像進行上述第一次圖像分割以后的分割,能量函數(shù)為,根據(jù)所述能量函數(shù),用最大流算法求出最小割以得到最終分割目標。
文檔編號G06T7/00GK102903110SQ20121037221
公開日2013年1月30日 申請日期2012年9月29日 優(yōu)先權(quán)日2012年9月29日
發(fā)明者趙杰煜, 俞江明 申請人:寧波大學