技術特征:
技術總結(jié)
本發(fā)明公開了一種基于深度學習的文字識別方法,該方法包括空間變換層的構(gòu)建階段與深層卷積神經(jīng)網(wǎng)絡的構(gòu)建與訓練階段??臻g變換層包含三個部分,定位網(wǎng)絡接收特征圖作為輸入,經(jīng)過一系列隱層,然后輸出空間變換的參數(shù),該參數(shù)將被用于特征圖上;網(wǎng)格生成器使用第一部分生成的參數(shù)產(chǎn)生出采樣網(wǎng)格;采樣器將特征圖與采樣網(wǎng)格作為輸入,在網(wǎng)格點上對特征圖進行采樣,最后得到輸出特征圖結(jié)果??臻g變換層可微分,通過它能夠在網(wǎng)絡中對圖像數(shù)據(jù)進行空間處理,從而令網(wǎng)絡學習到對空間扭曲的不變性,避免了傳統(tǒng)卷積網(wǎng)絡訓練中需要人工生成大量變形樣本的過程。此外,通過構(gòu)建更深層的卷及神經(jīng)網(wǎng)絡,針對類別繁多的漢字有更好的識別效果。
技術研發(fā)人員:凌賀飛;趙航;李平
受保護的技術使用者:華中科技大學
技術研發(fā)日:2017.07.04
技術公布日:2017.10.20