本發(fā)明涉及多媒體大數(shù)據(jù)處理與分析領(lǐng)域,尤其涉及一種基于深度學習的兒童涂鴉評分方法。
背景技術(shù):
深度學習最早興起于圖像識別,但是在短短的幾年時間內(nèi),深度學習推廣到了機器學習的各個領(lǐng)域。如今,深度學習在很多機器學習領(lǐng)域都有非常出色的表現(xiàn),在圖像識別、語音識別、音頻處理、自然語言處理、機器人、生物信息處理、化學、電腦游戲、搜索引擎、網(wǎng)絡廣告投放、醫(yī)學自動診斷和金融等各大領(lǐng)域均有應用。
深度學習自動的將簡單的特征組合成更加復雜的特征,并使用這些組合特征解決問題。圖像分類問題是通過各種機器學習算法使計算機自動將各類圖像進行有效管理和分類。由于受圖像不規(guī)則性、尺度變化等因素的影響,使該項工作存在著許多的難點。深度學習作為近些年提出的新的機器學習方法,因其在圖像特征學習中的突出表現(xiàn)而得到廣泛關(guān)注。
近幾年來,兒童娛樂市場經(jīng)歷了快速發(fā)展的過程,娛樂形式、娛樂內(nèi)容出現(xiàn)了一些跨越式發(fā)展,也經(jīng)歷了較明顯的蛻變。而這些明顯體現(xiàn)了家長消費觀念、社會與科技發(fā)展的印跡,也反應了當前的兒童娛樂市場的焦點與熱點。傳統(tǒng)與新型、娛樂與教育、線上和線下的碰撞等推動了兒童娛樂的快速發(fā)展。
技術(shù)實現(xiàn)要素:
本發(fā)明為克服上述的不足之處,目的在于提供一種基于深度學習的兒童涂鴉評分方法,本發(fā)明方法有效減少了人工打分的繁瑣工作,同時避免了人工打分者個人的主觀臆斷對評分結(jié)果的誤判影響,也大大提高了打分速率。
本發(fā)明是通過以下技術(shù)方案達到上述目的:一種基于深度學習的兒童涂鴉評分方法,包括如下步驟:
(1)涂鴉圖片的樣本采集及打分:
(1.1)采用畫圖軟件畫出不同類別的涂鴉物體的輪廓形狀圖片;
(1.2)對得到的每張涂鴉物體輪廓圖片進行不同程度的顏色填充;(1.3)根據(jù)填充的涂鴉圖片的美觀程度進行人工打分,分數(shù)范圍為0分到10分;
(2)涂鴉圖片的樣本分類:根據(jù)人工打分結(jié)果,利用程序?qū)⑼謹?shù)的涂鴉圖片歸為一類,放在同一個文件夾內(nèi);并將每一類涂鴉圖片所在的文件夾命名為對應的分數(shù),作為該類涂鴉圖片的唯一的標簽;
(3)數(shù)據(jù)集的制作:
(3.1)根據(jù)準備制作訓練數(shù)據(jù)集和驗證數(shù)據(jù)集,并做好對應圖像的標簽;
(3.2)將數(shù)據(jù)集圖像統(tǒng)一縮放至固定像素大小,并保留rgb信息;(3.3)利用python代碼將圖像和所對應的標簽轉(zhuǎn)換成神經(jīng)網(wǎng)絡可以識別的數(shù)據(jù)類型:recordio格式的輸入文件;
(3.4)基于步驟(3.3),將涂鴉圖片樣本的四分之三制作成訓練數(shù)據(jù)集,余下的四分之一制作成驗證數(shù)據(jù)集;
(4)網(wǎng)絡模型訓練:
(4.1)在初始化后的網(wǎng)絡模型中輸入訓練樣本和標簽,通過反復迭代訓練直至達到線性回歸值收斂,得到最小的均方差值,并保存最小的均方差值對應的最優(yōu)網(wǎng)絡模型;
(4.2)將預處理好的驗證數(shù)據(jù)集輸入訓練好的最優(yōu)網(wǎng)絡模型,提取驗證圖像的均方差值,并進行分析比較;
(4.3)基于分析比較結(jié)果預測數(shù)據(jù)集圖像,輸出擬合結(jié)果;
(5)自動打分:調(diào)用預先保存的網(wǎng)絡模型編寫程序,輸出該網(wǎng)絡模型對全新的涂鴉圖片進行打分,完成涂鴉評分。
作為優(yōu)選,所述步驟(1.1)得到的輪廓形狀圖片格式優(yōu)選為png格式。
作為優(yōu)選,所述步驟(1.2)優(yōu)選采用彩色筆對得到的每張涂鴉物體輪廓圖片進行不同程度的顏色填充。
作為優(yōu)選,所述步驟(3.1)具體為:采用mxnet深度學習框架,根據(jù)準備制作訓練數(shù)據(jù)集和驗證數(shù)據(jù)集,并做好對應圖像的標簽,運用深度學習框架python工具生成.lst文件,.lst文件記錄了所有圖片的信息,每一行對應一個唯一序號標簽和對應圖片名稱信息。
作為優(yōu)選,所述的固定像素大小優(yōu)選為100*100。
作為優(yōu)選,所述步驟(4.1)采用的網(wǎng)絡模型為包含輸入層、兩層隱層、輸出層的網(wǎng)絡模型,訓練時設定批處理數(shù)據(jù)大小為10,最大迭代次數(shù)為100,創(chuàng)建迭代器讀取訓練樣本和標簽,并輸入網(wǎng)絡模型進行訓練,通過反復迭代訓練直到達到最大迭代次數(shù),輸出每次訓練得到的均方差值,保存最小的均方差值對應的最優(yōu)網(wǎng)絡模型。
本發(fā)明的有益效果在于:本發(fā)明通過深度學習、訓練網(wǎng)絡模型,利用模型快速對涂鴉圖片進行打分,保證打分公正的情況下同時節(jié)約了時間,減少了人力消耗,解決了現(xiàn)有兒童涂鴉評分存在的單一反復工作、誤判和效率低的問題。
附圖說明
圖1是本發(fā)明方法的流程示意圖;
圖2是本發(fā)明實施例用到的神經(jīng)網(wǎng)絡框架示意圖。
具體實施方式
下面結(jié)合具體實施例對本發(fā)明進行進一步描述,但本發(fā)明的保護范圍并不僅限于此:
實施例:本實施案例中的圖片分為11類,涂鴉圖片總共有10000張,在每類圖片中隨機挑選出7500張圖片用于訓練,剩余2500張圖片用于驗證。如圖1所示,一種基于深度學習的兒童涂鴉評分方法包括涂鴉圖片的樣本采集及打分、樣本分類、數(shù)據(jù)集的制作、網(wǎng)絡模型訓練和自動打分五大過程,具體如下:
步驟一、涂鴉圖片的樣本采集。
步驟1.1:采用畫圖軟件畫出恐龍、冰棒、花朵、蘑菇等不同類型的涂鴉物體的輪廓形狀圖片,圖片為png格式;
步驟1.2:給已經(jīng)畫好輪廓的圖片用彩色筆進行不同程度的的隨意涂鴉填充;
步驟1.3:根據(jù)填充的涂鴉圖片的美觀程度進行簡單的人工打分,分數(shù)類別為0,1,2···9,10這十一檔。
步驟二、樣本分類。
步驟2.1:根據(jù)步驟1.3中的每張圖片的打分情況,利用程序?qū)⑼环謹?shù)檔的的涂鴉圖片歸為一類,即表現(xiàn)為放在同一個文件夾中;
步驟2.2:給每一類涂鴉圖片所在的文件夾命名為對應的分數(shù),作為該類涂鴉圖片的一個唯一的標簽。
步驟三、數(shù)據(jù)集制作。
步驟3.1:本發(fā)明采用了mxnet深度學習框架。根據(jù)準備制作訓練數(shù)據(jù)集和驗證數(shù)據(jù)集,并做好對應圖像的標簽,運用深度學習框架python工具生成.lst文件,.lst文件記錄了所有圖片的一些信息,每一行對應一個唯一序號標簽和對應圖片名稱信息;
步驟3.2:將數(shù)據(jù)集圖像統(tǒng)一縮放到固定像素大小100*100,同時保留rgb信息;
步驟3.3:利用python代碼將圖像和對應的標簽轉(zhuǎn)換成神經(jīng)網(wǎng)絡能識別的數(shù)據(jù)類型:recordio格式的輸入文件;即將.lst文件轉(zhuǎn)化為.rec格式的二進制文件,所以.rec文件保存了要輸入網(wǎng)絡的圖片的詳細信息;其中,神經(jīng)網(wǎng)絡框架示意圖如圖2所示;
步驟3.4:按照步驟3.3,將涂鴉圖片的樣本的四分之三即7500張涂鴉圖片制作成訓練數(shù)據(jù)集,剩下四分之一即2500張涂鴉圖片制作成驗證數(shù)據(jù)集。
步驟四、網(wǎng)絡模型訓練。
步驟4.1:本發(fā)明采用了簡單的包含輸入層,兩層隱層,輸出層的網(wǎng)絡模型,訓練時設定批處理數(shù)據(jù)大小為10,最大迭代次數(shù)為100,創(chuàng)建迭代器讀取rec文件中的訓練樣本和標簽輸入網(wǎng)絡模型進行訓練,通過反復迭代訓練直到達到最大迭代次數(shù),輸出每次訓練得到的均方差值,保存最小的均方差值對應的最優(yōu)網(wǎng)絡模型;
步驟4.2:將預處理好的驗證數(shù)據(jù)集送入訓練好的網(wǎng)絡模型,提取驗證圖像的均方差值,并分析比較;
步驟4.3:基于分析比較結(jié)果預測數(shù)據(jù)集圖片,輸出線性回歸最后的擬合結(jié)果。
步驟五、自動打分。
步驟5.1:調(diào)用預先保存的網(wǎng)絡模型編寫程序,輸出該模型對全新的涂鴉圖片進的評分。
經(jīng)過上述步驟的操作,通過一次訓練,利用保存的模型即可實現(xiàn)對兒童涂鴉的有效快速評分。
以上的所述乃是本發(fā)明的具體實施例及所運用的技術(shù)原理,若依本發(fā)明的構(gòu)想所作的改變,其所產(chǎn)生的功能作用仍未超出說明書及附圖所涵蓋的精神時,仍應屬本發(fā)明的保護范圍。