本發(fā)明屬于圖像處理技術領域,特別是涉及一種自動人像分割方法。
背景技術:
近年來,隨著科技的發(fā)展,每天都有大量的數(shù)字圖片產(chǎn)生,而各種圖像處理技術也是層出不窮。其中,對人像的個性化處理更是一個極富活力的研究領域。從美膚、五官美化、背景替換,每一步都為人像美化提供了助力。而快速準確的人像分割正是前述背景替換模塊的關鍵步驟。分割的準確性直接影響了背景替換的質量與多樣性,同時,也影響了美膚的一致性。
目前,存在很多人像分割算法,比如早期的交互式分割graphcut等,基于crf的分割,近期等基于深度學習的fcn等。交互式方法,往往需要用戶對圖像分割有一定的了解,可以畫出比較好的分割線,用戶體驗稍差,且分割速度較慢,通常需要幾十秒的時間;基于crf的分割同樣是速度較慢;而fcn方法存在的問題主要有三點,一是模型尺寸較大,通常有幾百兆,不利于用于移動端,二是計算量較大,速度非常慢,通常需要幾秒到幾十秒;三是計算過程中涉及到pooling層計算,影響了分割的精度。
技術實現(xiàn)要素:
為了解決上述問題,本發(fā)明提出了一種自動人像分割方法,能夠自動且準確的進行人像分割,耗時短且占用空間小,適用于移動客戶端。
為達到上述目的,本發(fā)明采用的技術方案是:
一種自動人像分割方法,包括步驟模型訓練、人像初步分割和人像精確分割;
所述模型訓練包括步驟:獲取訓練數(shù)據(jù);將訓練數(shù)據(jù)輸入神經(jīng)網(wǎng)絡,學習得到網(wǎng)絡參數(shù)模型;當神經(jīng)網(wǎng)絡收斂后,存儲所述網(wǎng)絡參數(shù)模型,完成模型訓練;
所述人像初步分割包括步驟:載入所述網(wǎng)絡參數(shù)模型到移動客戶端;利用移動客戶端獲取輸入圖像;將所述輸入圖像輸入網(wǎng)絡參數(shù)模型,得到人像分割初步圖像;
所述人像精確分割包括步驟:對人像分割初步圖像,去除錯分的孤立區(qū),保留連通區(qū)域;利用摳像算法對連通區(qū)域分割細節(jié),突出邊緣,得到人像分割最終圖像。
進一步的是,所述獲取訓練數(shù)據(jù)過程包括步驟:搜集人像圖片;人工標注人像區(qū)域,形成與人像圖片對應的掩碼圖;將掩碼圖進行縮放至預定尺寸后構成訓練數(shù)據(jù)。
進一步的是,所述神經(jīng)網(wǎng)絡包含卷積模塊、上采樣層和softmax層;每個所述卷積模塊包括卷積層、relu層和pooling層。
進一步的是,所述神經(jīng)網(wǎng)絡包含5個卷積模塊、2個上采樣層和1個softmax層。
進一步的是,將訓練數(shù)據(jù)輸入神經(jīng)網(wǎng)絡后,初始化神經(jīng)網(wǎng)絡;用自適應估計矩陣算法更新神經(jīng)網(wǎng)絡權值;訓練過程中,動態(tài)調節(jié)學習率;經(jīng)過學習得到網(wǎng)絡參數(shù)模型。
進一步的是,獲取輸入圖像后,將輸入圖像進行尺寸縮放到預定尺寸;再將縮放后的圖像輸入網(wǎng)絡參數(shù)模型,得到人像分割掩碼圖,人像分割掩碼圖作為人像分割初步圖像。
進一步的是,將所述人像分割掩碼圖進行形態(tài)學運算,去除錯分的孤立區(qū),獲得多個連通區(qū)域;計算各連通區(qū)域的面積并排序,去除不在預設區(qū)域內的連通區(qū)域,保留剩余的連通區(qū)域。
進一步的是,對所述保留的連通區(qū)域的外邊緣處根據(jù)預定像素建立擴展區(qū)域,通過摳像算法對擴展區(qū)域進行分割細節(jié)和突出邊緣,得到人像分割最終圖像。
采用本技術方案的有益效果:
本發(fā)明提出一個瘦長型的深度神經(jīng)網(wǎng)絡結構,極大地縮減了計算量和模型尺寸,從而實現(xiàn)移動端快速人像分割;
本發(fā)明提出一個高效的分割算法,提高分割精度,在我們的標注數(shù)據(jù)集上iou為94.16%;標注大量的訓練數(shù)據(jù),極大地提高了訓練模型的性能。
附圖說明
圖1為本發(fā)明的一種自動人像分割方法流程示意圖;
圖2為本發(fā)明中模型訓練的流程示意圖;
圖3為本發(fā)明中人像初步分割的流程示意圖;
圖4為本發(fā)明中人像精確分割的流程示意圖;
圖5為本發(fā)明中神經(jīng)網(wǎng)絡的結構示意圖;
圖6為本發(fā)明中卷積模塊的結構示意圖。
具體實施方式
為了使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面結合附圖對本發(fā)明作進一步闡述。
在本實施例中,參見圖1-圖4所示,本發(fā)明提出了一種自動人像分割方法,包括步驟模型訓練、人像初步分割和人像精確分割。
1.所述模型訓練包括步驟:獲取訓練數(shù)據(jù);將訓練數(shù)據(jù)輸入神經(jīng)網(wǎng)絡,學習得到網(wǎng)絡參數(shù)模型;當神經(jīng)網(wǎng)絡收斂后,存儲所述網(wǎng)絡參數(shù)模型,完成模型訓練。
所述獲取訓練數(shù)據(jù)過程包括步驟:搜集人像圖片;人工標注人像區(qū)域,形成與人像圖片對應的掩碼圖;將掩碼圖進行縮放至預定尺寸后構成訓練數(shù)據(jù)。
如圖5和圖6所示,所述神經(jīng)網(wǎng)絡包含卷積模塊、上采樣層和softmax層;每個所述卷積模塊包括卷積層、relu層和pooling層。
優(yōu)選的是,所述神經(jīng)網(wǎng)絡包含5個卷積模塊、2個上采樣層和1個softmax層。
將訓練數(shù)據(jù)輸入神經(jīng)網(wǎng)絡后,初始化神經(jīng)網(wǎng)絡;用自適應估計矩陣算法更新神經(jīng)網(wǎng)絡權值;訓練過程中,動態(tài)調節(jié)學習率;經(jīng)過學習得到網(wǎng)絡參數(shù)模型。
2.所述人像初步分割包括步驟:載入所述網(wǎng)絡參數(shù)模型到移動客戶端;利用移動客戶端獲取輸入圖像;將所述輸入圖像輸入網(wǎng)絡參數(shù)模型,得到人像分割初步圖像。
獲取輸入圖像后,將輸入圖像進行尺寸縮放到預定尺寸;再將縮放后的圖像輸入網(wǎng)絡參數(shù)模型,得到人像分割掩碼圖,人像分割掩碼圖作為人像分割初步圖像。
3.所述人像精確分割包括步驟:對人像分割初步圖像,去除錯分的孤立區(qū),保留連通區(qū)域;利用摳像算法對連通區(qū)域分割細節(jié),突出邊緣,得到人像分割最終圖像。
所述人像分割掩碼圖進行形態(tài)學運算,去除錯分的孤立區(qū),獲得多個連通區(qū)域;計算各連通區(qū)域的面積并排序,去除不在預設區(qū)域內的連通區(qū)域,保留剩余的連通區(qū)域。
對所述保留的連通區(qū)域的外邊緣處根據(jù)預定像素建立擴展區(qū)域,通過摳像算法對擴展區(qū)域進行分割細節(jié)和突出邊緣,得到人像分割最終圖像。
以上顯示和描述了本發(fā)明的基本原理和主要特征和本發(fā)明的優(yōu)點。本行業(yè)的技術人員應該了解,本發(fā)明不受上述實施例的限制,上述實施例和說明書中描述的只是說明本發(fā)明的原理,在不脫離本發(fā)明精神和范圍的前提下,本發(fā)明還會有各種變化和改進,這些變化和改進都落入要求保護的本發(fā)明范圍內。本發(fā)明要求保護范圍由所附的權利要求書及其等效物界定。