技術(shù)總結(jié)
本發(fā)明實(shí)施例公開了一種字符識別的處理方法和裝置,用于提高字符識別的識別效果。本發(fā)明實(shí)施例方法包括:根據(jù)字符在頁面上的高度信息將所述頁面上的多個字符歸屬到所述頁面上的多個行上,得到所述頁面上的每一行包括的多個字符,所述字符在頁面上的高度信息包括:該字符在所述頁面上的縱坐標(biāo)和該字符的高度范圍;按照所述頁面上字符之間在高度范圍上的重疊信息對所述頁面上的每個行包括的多個字符進(jìn)行行校正,得到所述頁面上的每一行包括的行校正后的多個字符;使用語義分析模型對所述頁面上的每一行包括的行校正后的多個字符進(jìn)行語義校正。
技術(shù)研發(fā)人員:周龍沙;王紅法
受保護(hù)的技術(shù)使用者:騰訊科技(深圳)有限公司
文檔號碼:201510410166
技術(shù)研發(fā)日:2015.07.13
技術(shù)公布日:2017.05.24