技術總結
本發(fā)明涉及一種基于特征壓縮與特征選擇的歪斜場景文字識別方法,其步驟包括:在文字區(qū)域的每個像素點上提取CHOG特征;根據(jù)CHOG特征的差異程度確定字符級的聚類數(shù)量;對CHOG特征進行聚類得到壓縮后的字符級特征;將壓縮過的特征合并,再次進行聚類,生成初始的視覺特征詞典;建立視覺特征直方圖描述符;訓練線性支持向量機,對直方圖描述符中特征的重要性進行排序,選出若干最重要的特征作為最終的詞典;再次計算樣本的直方圖描述符,訓練多類徑向基函數(shù)支持向量機,作為最終的文字分類器以對歪斜場景文字進行識別,得到識別結果。本發(fā)明能夠在克服特征點檢測法失效的同時,保證很高的識別準確率和召回率。
技術研發(fā)人員:張永錚;周宇;王一鵬
受保護的技術使用者:中國科學院信息工程研究所
文檔號碼:201510014950
技術研發(fā)日:2015.01.12
技術公布日:2017.09.29