欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

光學(xué)字符識別方法及裝置制造方法

文檔序號:6551203閱讀:186來源:國知局
光學(xué)字符識別方法及裝置制造方法
【專利摘要】本公開提供了一種光學(xué)字符識別方法及裝置。其中,光學(xué)字符識別方法包括:從原始圖像中提取字符塊;基于筆畫寬度變換,確定所述字符塊中斷裂的筆畫;對所述斷裂的筆畫補(bǔ)齊得到準(zhǔn)識別圖像;對所述準(zhǔn)識別圖像進(jìn)行字符識別,得到所述準(zhǔn)識別圖像中的文本信息。本公開能夠利用筆畫寬度變換對字符中筆畫出現(xiàn)的斷裂進(jìn)行補(bǔ)齊,提高了光學(xué)字符識別的識別準(zhǔn)確率。
【專利說明】光學(xué)字符識別方法及裝置

【技術(shù)領(lǐng)域】
[0001] 本公開涉及圖像處理領(lǐng)域,具體而言,涉及光學(xué)字符識別方法及裝置。

【背景技術(shù)】
[0002] OCR (Optical Character Recognition,光學(xué)字符識別)技術(shù)在圖像處理領(lǐng)域占有 重要地位,在信息自動化和辦公自動化中具有廣泛的應(yīng)用。OCR是指對文本資料、卡片等的 圖像文件進(jìn)行分析識別處理,獲取文字及版面信息的過程。
[0003] 提高識別準(zhǔn)確率是OCR技術(shù)中很重要的課題。在實際應(yīng)用中,需要進(jìn)行光學(xué)字符 識別的原始圖像中經(jīng)常會存在字符中筆畫出現(xiàn)斷裂的情況,例如,在充值卡中,用戶在掛掉 涂層的時候,經(jīng)常會有殘留,導(dǎo)致充值卡的密碼被遮擋,從而導(dǎo)致比劃斷裂。相關(guān)技術(shù)的OCR 容易將斷裂的筆畫識別為兩個筆畫,導(dǎo)致識別準(zhǔn)確率降低。


【發(fā)明內(nèi)容】

[0004] 本公開的目的在于提供光學(xué)字符識別方法及裝置,以解決上述的問題。
[0005] 根據(jù)本公開實施例的第一方面,本公開提供了一種光學(xué)字符識別方法,包括:
[0006] 從原始圖像中提取字符塊;
[0007] 基于筆畫寬度變換,確定所述字符塊中斷裂的筆畫;
[0008] 對所述斷裂的筆畫補(bǔ)齊得到準(zhǔn)識別圖像;
[0009] 對所述準(zhǔn)識別圖像進(jìn)行字符識別,得到所述準(zhǔn)識別圖像中的文本信息。
[0010] 本公開的實施例提供的技術(shù)方案,能夠利用筆畫寬度變換對字符中筆畫出現(xiàn)的斷 裂進(jìn)行補(bǔ)齊,提高了光學(xué)字符識別的識別準(zhǔn)確率。
[0011] 上述光學(xué)字符識別方法還可以包括如下特點,所述基于筆畫寬度變換,確定所述 字符塊中斷裂的筆畫包括:
[0012] 設(shè)置斷裂長度閾值;
[0013] 確定所述字符塊的筆畫區(qū)域像素點所在筆畫的方向;
[0014] 判斷在所述筆畫區(qū)域像素點所在筆畫的方向上,所述筆畫區(qū)域像素點與其下一個 筆畫區(qū)域像素點之間是否存在筆畫寬度突變區(qū)域,且所述筆畫寬度突變區(qū)域的長度小于所 述斷裂長度閾值,所述筆畫寬度突變區(qū)域為空白區(qū)域、筆畫寬度增大值大于設(shè)定第一寬度 變化閾值或筆畫寬度減小值大于設(shè)定第二寬度變化閾值的區(qū)域;
[0015] 當(dāng)存在所述筆畫寬度突變區(qū)域時,確定所述筆畫區(qū)域像素點所在筆畫為斷裂的筆 畫,確定所述筆畫寬度突變區(qū)域為所述斷裂的筆畫中的斷裂區(qū)域。
[0016] 本公開的實施例提供的技術(shù)方案,利用筆畫寬度變換確定斷裂的筆畫,可以準(zhǔn)確 地找到斷裂區(qū)域,為補(bǔ)齊斷裂的筆畫提供基礎(chǔ),有助于提高字符識別的識別準(zhǔn)確率。
[0017] 上述光學(xué)字符識別方法還可以包括如下特點,所述對所述斷裂的筆畫補(bǔ)齊包括:
[0018] 設(shè)所述斷裂的筆畫中的斷裂區(qū)域沿其所在筆畫的方向與其所在筆畫的交界像素 點分別為第一交界點和第二交界點,將所述第一交界點和所述第二交界點之間沿所述第一 交界點的筆畫方向、寬度等于所述第一交界點的筆畫寬度值和所述第二交界點的筆畫寬度 值的平均值的區(qū)域設(shè)置為準(zhǔn)筆畫區(qū)域,其中,所述第一交界點的筆畫寬度值和所述第二交 界點的筆畫寬度值通過筆畫寬度變換算法獲得;
[0019] 將所述準(zhǔn)筆畫區(qū)域的灰度值設(shè)置為與所述字符塊中筆畫區(qū)域的灰度值一致的值。
[0020] 本公開的實施例提供的技術(shù)方案,通過將準(zhǔn)筆畫區(qū)域的灰度值設(shè)置為與字符塊中 筆畫區(qū)域的灰度值一致的值這種方式對斷裂的筆畫進(jìn)行補(bǔ)齊,能夠有效消除斷裂筆畫,有 助于提高字符識別的識別準(zhǔn)確率。
[0021] 上述光學(xué)字符識別方法還可以包括如下特點,所述對所述斷裂的筆畫補(bǔ)齊還包 括:
[0022] 當(dāng)所述斷裂區(qū)域為所述斷裂的筆畫中的筆畫寬度顯著增大區(qū)域時,將所述斷裂區(qū) 域中處于所述準(zhǔn)筆畫區(qū)域之外的筆畫區(qū)域的灰度值設(shè)置為與所述字符塊中背景區(qū)域的灰 度值一致的值。
[0023] 本公開的實施例提供的技術(shù)方案,在進(jìn)行筆畫補(bǔ)齊的同時還可以進(jìn)一步去除噪 聲,有助于提高字符識別的識別準(zhǔn)確率。
[0024] 上述光學(xué)字符識別方法還可以包括如下特點,在所述對所述準(zhǔn)識別圖像進(jìn)行字符 識別之前,還包括:
[0025] 基于筆畫寬度變換,檢測所述字符塊中的噪聲;
[0026] 消除所述噪聲。
[0027] 本公開的實施例提供的技術(shù)方案,不僅能夠?qū)ψ址泄P畫出現(xiàn)的斷裂進(jìn)行補(bǔ)齊, 還能夠利用筆畫寬度變換進(jìn)一步去除噪聲,進(jìn)一步提高了字符識別的識別準(zhǔn)確率。
[0028] 上述光學(xué)字符識別方法還可以包括如下特點,所述基于筆畫寬度變換,檢測所述 字符塊中的噪聲包括:
[0029] 確定所述字符塊的筆畫寬度W,字符塊i的筆畫寬度等于第一寬度平均值與第二 寬度平均值之和的二分之一,所述第一寬度平均值為字符塊i的平均筆畫寬度值,字符塊i 的平均筆畫寬度值等于字符塊i中所有筆畫區(qū)域像素點的筆畫寬度值的平均值,所述第二 寬度平均值為從所述原始圖像中提取出的所有字符塊的平均筆畫寬度值的平均值,i為自 然數(shù),筆畫區(qū)域像素點的筆畫寬度值通過筆畫寬度變換算法獲得;
[0030] 設(shè)置字符筆畫寬度誤差d ;
[0031] 判斷所述字符塊中筆畫寬度處于區(qū)間[W_d,W+d]之外的筆畫區(qū)域是否滿足如下 成噪條件之一:所述筆畫區(qū)域的設(shè)定范圍內(nèi)沒有與所述筆畫方向相符合的筆畫、沿所述筆 畫區(qū)域的筆畫寬度變化波動值大于設(shè)定波動閾值或者所述筆畫區(qū)域的筆畫長度小于設(shè)定 長度閾值;
[0032] 當(dāng)所述字符塊中筆畫寬度處于區(qū)間[W_d,W+d]之外的筆畫區(qū)域滿足所述成噪條 件之一時,判定所述字符塊中筆畫寬度處于區(qū)間[w-d,w+d]之外的筆畫區(qū)域為噪聲。
[0033] 本公開的實施例提供的技術(shù)方案,利用筆畫寬度變換檢測出字符塊中的噪聲,為 消除噪聲提供基礎(chǔ),有助于提高字符識別的識別準(zhǔn)確率。
[0034] 上述光學(xué)字符識別方法還可以包括如下特點,所述消除所述噪聲包括:
[0035] 將所述噪聲的灰度值設(shè)置為與所述字符塊中背景區(qū)域的灰度值一致的值。
[0036] 本公開的實施例提供的技術(shù)方案,能夠有效地消除字符塊中的噪聲,有助于提高 字符識別的識別準(zhǔn)確率。
[0037] 上述光學(xué)字符識別方法還可以包括如下特點,所述筆畫寬度變換算法包括:
[0038] 對所述字符塊進(jìn)行邊緣檢測,找到邊緣像素點,所述邊緣像素點具有一個方向梯 度值;
[0039] 按照任一邊緣像素點p的梯度方向dp沿路線r查找與邊緣像素點p相匹配的邊 緣像素點q,邊緣像素點q的梯度方向d q與邊緣像素點p的梯度方向dp相反,其中,r = p+n*dp, η大于或等于0 ;
[0040] 當(dāng)查找到所述邊緣像素點q時,指定所述邊緣像素點ρ與所述邊緣像素點q的連 線上每個像素點的筆畫寬度值為所述邊緣像素點P與所述邊緣像素點q之間的歐式距離。
[0041] 本公開的實施例提供的技術(shù)方案,能夠有效確定筆畫寬度值,為補(bǔ)齊斷裂的筆畫 提供基礎(chǔ)。
[0042] 根據(jù)本公開實施例的第二方面,本公開提供了一種光學(xué)字符識別裝置,包括:
[0043] 提取模塊,用于從原始圖像中提取字符塊;
[0044] 確定模塊,用于基于筆畫寬度變換,確定所述字符塊中斷裂的筆畫;
[0045] 補(bǔ)齊模塊,用于對所述斷裂的筆畫補(bǔ)齊得到準(zhǔn)識別圖像;
[0046] 識別模塊,用于對所述準(zhǔn)識別圖像進(jìn)行字符識別,得到所述準(zhǔn)識別圖像中的文本 信息。
[0047] 本公開的實施例提供的技術(shù)方案,能夠利用筆畫寬度變換對字符中筆畫出現(xiàn)的斷 裂進(jìn)行補(bǔ)齊,提高了光學(xué)字符識別的識別準(zhǔn)確率。
[0048] 上述光學(xué)字符識別裝置還可以包括如下特點,所述確定模塊包括:
[0049] 閾值設(shè)置單元,用于設(shè)置斷裂長度閾值;
[0050] 筆畫方向確定單元,用于確定所述字符塊的筆畫區(qū)域像素點所在筆畫的方向;
[0051] 突變判斷單元,用于判斷在所述筆畫區(qū)域像素點所在筆畫的方向上,所述筆畫區(qū) 域像素點與其下一個筆畫區(qū)域像素點之間是否存在筆畫寬度突變區(qū)域,且所述筆畫寬度突 變區(qū)域的長度小于所述斷裂長度閾值,所述筆畫寬度突變區(qū)域為空白區(qū)域、筆畫寬度增大 值大于設(shè)定第一寬度變化閾值或筆畫寬度減小值大于設(shè)定第二寬度變化閾值的區(qū)域;
[0052] 斷裂筆畫確定單元,用于當(dāng)存在所述筆畫寬度突變區(qū)域時,確定所述筆畫區(qū)域像 素點所在筆畫為斷裂的筆畫,確定所述筆畫寬度突變區(qū)域為所述斷裂的筆畫中的斷裂區(qū) 域。
[0053] 本公開的實施例提供的技術(shù)方案,利用筆畫寬度變換確定斷裂的筆畫,可以準(zhǔn)確 地找到斷裂區(qū)域,為補(bǔ)齊斷裂的筆畫提供基礎(chǔ),有助于提高字符識別的識別準(zhǔn)確率。
[0054] 上述光學(xué)字符識別裝置還可以包括如下特點,所述補(bǔ)齊模塊包括:
[0055] 準(zhǔn)筆畫區(qū)域設(shè)置單元,設(shè)所述斷裂的筆畫中的斷裂區(qū)域沿其所在筆畫的方向與其 所在筆畫的交界像素點分別為第一交界點和第二交界點,所述準(zhǔn)筆畫區(qū)域設(shè)置單元用于將 所述第一交界點和所述第二交界點之間沿所述第一交界點的筆畫方向、寬度等于所述第一 交界點的筆畫寬度值和所述第二交界點的筆畫寬度值的平均值的區(qū)域設(shè)置為準(zhǔn)筆畫區(qū)域, 其中,所述第一交界點的筆畫寬度值和所述第二交界點的筆畫寬度值通過筆畫寬度變換單 元獲得;
[0056] 第一灰度調(diào)整單元,用于將所述準(zhǔn)筆畫區(qū)域的灰度值設(shè)置為與所述字符塊中筆畫 區(qū)域的灰度值一致的值。
[0057] 本公開的實施例提供的技術(shù)方案,通過將準(zhǔn)筆畫區(qū)域的灰度值設(shè)置為與字符塊中 筆畫區(qū)域的灰度值一致的值這種方式對斷裂的筆畫進(jìn)行補(bǔ)齊,能夠有效消除斷裂筆畫,有 助于提高字符識別的識別準(zhǔn)確率。
[0058] 上述光學(xué)字符識別裝置還可以包括如下特點,所述補(bǔ)齊模塊還包括:
[0059] 第二灰度調(diào)整單元,用于當(dāng)所述斷裂區(qū)域為所述斷裂的筆畫中的筆畫寬度顯著增 大區(qū)域時,將所述斷裂區(qū)域中處于所述準(zhǔn)筆畫區(qū)域之外的筆畫區(qū)域的灰度值設(shè)置為與所述 字符塊中背景區(qū)域的灰度值一致的值。
[0060] 本公開的實施例提供的技術(shù)方案,在進(jìn)行筆畫補(bǔ)齊的同時還可以進(jìn)一步去除噪 聲,有助于提高字符識別的識別準(zhǔn)確率。
[0061] 上述光學(xué)字符識別裝置還可以包括如下特點,在所述識別模塊之前,還包括:
[0062] 噪聲檢測模塊,用于基于筆畫寬度變換,檢測所述字符塊中的噪聲;
[0063] 消除模塊,用于消除所述噪聲檢測模塊檢測出的噪聲。
[0064] 本公開的實施例提供的技術(shù)方案,不僅能夠?qū)ψ址泄P畫出現(xiàn)的斷裂進(jìn)行補(bǔ)齊, 還能夠利用筆畫寬度變換進(jìn)一步去除噪聲,進(jìn)一步提高了字符識別的識別準(zhǔn)確率。
[0065] 上述光學(xué)字符識別裝置還可以包括如下特點,所述噪聲檢測模塊包括:
[0066] 筆畫寬度確定單元,用于確定所述字符塊的筆畫寬度W,字符塊i的筆畫寬度等于 第一寬度平均值與第二寬度平均值之和的二分之一,所述第一寬度平均值為字符塊i的平 均筆畫寬度值,字符塊i的平均筆畫寬度值等于字符塊i中所有筆畫區(qū)域像素點的筆畫寬 度值的平均值,所述第二寬度平均值為從所述原始圖像中提取出的所有字符塊的平均筆畫 寬度值的平均值,i為自然數(shù),筆畫區(qū)域像素點的筆畫寬度值通過筆畫寬度變換單元獲得; [0067] 誤差設(shè)置單元,用于設(shè)置字符筆畫寬度誤差d ;
[0068] 成噪判斷單元,用于判斷所述字符塊中筆畫寬度處于區(qū)間[W_d,W+d]之外的筆畫 區(qū)域是否滿足如下成噪條件之一:所述筆畫區(qū)域的設(shè)定范圍內(nèi)沒有與所述筆畫方向相符合 的筆畫、沿所述筆畫區(qū)域的筆畫寬度變化波動值大于設(shè)定波動閾值或者所述筆畫區(qū)域的筆 畫長度小于設(shè)定長度閾值;
[0069] 判定單元,用于當(dāng)所述字符塊中筆畫寬度處于區(qū)間[W_d,W+d]之外的筆畫區(qū)域滿 足所述成噪條件之一時,判定所述字符塊中筆畫寬度處于區(qū)間[w-d,w+d]之外的筆畫區(qū)域 為噪聲。
[0070] 本公開的實施例提供的技術(shù)方案,利用筆畫寬度變換檢測出字符塊中的噪聲,為 消除噪聲提供基礎(chǔ),有助于提高字符識別的識別準(zhǔn)確率。
[0071] 上述光學(xué)字符識別裝置還可以包括如下特點,所述消除模塊包括:
[0072] 灰度除噪單元,用于將所述噪聲的灰度值設(shè)置為與所述字符塊中背景區(qū)域的灰度 值一致的值。
[0073] 本公開的實施例提供的技術(shù)方案,能夠有效地消除字符塊中的噪聲,有助于提高 字符識別的識別準(zhǔn)確率。
[0074] 上述光學(xué)字符識別裝置還可以包括如下特點,所述筆畫寬度變換單元包括:
[0075] 邊緣檢測子單元,用于對所述字符塊進(jìn)行邊緣檢測,找到邊緣像素點,所述邊緣像 素點具有一個方向梯度值;
[0076] 匹配子單元,用于按照任一邊緣像素點p的梯度方向dp沿路線r查找與邊緣像素 點P相匹配的邊緣像素點q,邊緣像素點q的梯度方向d q與邊緣像素點p的梯度方向dp相 反,其中,r = p+n*dp, η大于或等于0 ;
[0077] 指定子單元,用于當(dāng)查找到所述邊緣像素點q時,指定所述邊緣像素點ρ與所述邊 緣像素點q的連線上每個像素點的筆畫寬度值為所述邊緣像素點P與所述邊緣像素點q之 間的歐式距離。
[0078] 本公開的實施例提供的技術(shù)方案,能夠有效確定筆畫寬度值,為補(bǔ)齊斷裂的筆畫 提供基礎(chǔ)。
[0079] 根據(jù)本公開實施例的第三方面,提供一種光學(xué)字符識別裝置,包括:
[0080] 處理器;
[0081] 用于存儲處理器可執(zhí)行指令的存儲器;
[0082] 其中,所述處理器被配置為執(zhí)行如下指令:
[0083] 從原始圖像中提取字符塊;
[0084] 基于筆畫寬度變換,確定所述字符塊中斷裂的筆畫;
[0085] 對所述斷裂的筆畫補(bǔ)齊得到準(zhǔn)識別圖像;
[0086] 對所述準(zhǔn)識別圖像進(jìn)行字符識別,得到所述準(zhǔn)識別圖像中的文本信息。
[0087] 應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性的,并不能限制本 公開。

【專利附圖】

【附圖說明】
[0088] 圖1是根據(jù)一示例性實施例示出的一種光學(xué)字符識別方法的流程圖之一;
[0089] 圖2是根據(jù)一示例性實施例示出的一種光學(xué)字符識別方法的流程圖之二;
[0090] 圖3是根據(jù)一示例性實施例示出的一種光學(xué)字符識別裝置的結(jié)構(gòu)框圖之一; [0091] 圖4是根據(jù)一示例性實施例示出的一種光學(xué)字符識別裝置中確定模塊20的一種 結(jié)構(gòu)框圖;
[0092] 圖5是根據(jù)一示例性實施例示出的一種光學(xué)字符識別裝置中補(bǔ)齊模塊30的結(jié)構(gòu) 框圖之一;
[0093] 圖6是根據(jù)一示例性實施例示出的一種光學(xué)字符識別裝置中補(bǔ)齊模塊30的結(jié)構(gòu) 框圖之二;
[0094] 圖7是根據(jù)一示例性實施例示出的一種光學(xué)字符識別裝置中提取模塊10的結(jié)構(gòu) 框圖;
[0095] 圖8是根據(jù)一示例性實施例示出的一種光學(xué)字符識別裝置的結(jié)構(gòu)框圖之二; [0096] 圖9是根據(jù)一示例性實施例示出的一種光學(xué)字符識別裝置中噪聲檢測模塊50的 結(jié)構(gòu)框圖;
[0097] 圖10是根據(jù)一示例性實施例示出的一種光學(xué)字符識別裝置中消除模塊60的結(jié)構(gòu) 框圖;
[0098] 圖11是根據(jù)一示例性實施例示出的一種光學(xué)字符識別裝置中筆畫寬度變換單元 70的結(jié)構(gòu)框圖;
[0099] 圖12是根據(jù)一示例性實施例示出的一種裝置的框圖。
[0100] 此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本發(fā)明的實施 例,并與說明書一起用于解釋本發(fā)明的原理。

【具體實施方式】
[0101] 下面通過具體的實施例子并結(jié)合附圖對本公開做進(jìn)一步的詳細(xì)描述。
[0102] 圖1是根據(jù)一示例性實施例示出的一種光學(xué)字符識別方法的流程圖之一。如圖1 所示,本實施例中,光學(xué)字符識別方法的流程可以包括如下步驟:
[0103] 在步驟S101中,從原始圖像中提取字符塊;
[0104] 提取出的字符塊包括筆畫區(qū)域和背景區(qū)域。本公開中,可以將筆畫區(qū)域的像素點 的灰度值設(shè)為〇,將背景區(qū)域的灰度值設(shè)為255,也可以將筆畫區(qū)域的像素點的灰度值設(shè)為 255,將背景區(qū)域的灰度值設(shè)為0。
[0105] 其中,步驟S101可以采用如下的子步驟(步驟all至步驟dll)來實現(xiàn):
[0106] all,對原始圖像進(jìn)行灰度化處理后濾波,獲得原始圖像的第一預(yù)處理結(jié)果圖;
[0107] bll,對第一預(yù)處理結(jié)果圖進(jìn)行二值化處理后濾波,獲得原始圖像的第二預(yù)處理結(jié) 果圖;
[0108] cll,定位和提取第二預(yù)處理結(jié)果圖中的文本信息;
[0109] dll,對第二預(yù)處理結(jié)果圖中的文本信息按行進(jìn)行字符分割,得到字符塊,該字符 塊即為從原始圖像中提取出的字符塊。
[0110] 步驟all至步驟dll在進(jìn)行字符塊提取的過程中同時去除噪聲,有助于提高字符 識別的識別準(zhǔn)確率。
[0111] 在步驟S102中,基于筆畫寬度變換,確定該字符塊中斷裂的筆畫;
[0112] 其中,步驟S102可以采用如下的子步驟(步驟al2至步驟dl2)來實現(xiàn):
[0113] 在步驟al2中,設(shè)置斷裂長度閾值;
[0114] 在步驟bl2中,確定字符塊的筆畫區(qū)域像素點所在筆畫的方向;
[0115] 在步驟cl2中,判斷在筆畫區(qū)域像素點所在筆畫的方向上,筆畫區(qū)域像素點與其 下一個筆畫區(qū)域像素點之間是否存在筆畫寬度突變區(qū)域,且該筆畫寬度突變區(qū)域的長度小 于斷裂長度閾值,其中,筆畫寬度突變區(qū)域可以為空白區(qū)域、筆畫寬度顯著增大區(qū)域或筆畫 寬度顯著減小區(qū)域;其中,筆畫寬度顯著增大區(qū)域是指筆畫寬度增大值大于設(shè)定第一寬度 變化閾值的區(qū)域,筆畫寬度顯著減小區(qū)域是指筆畫寬度減小值大于設(shè)定第二寬度變化閾值 的區(qū)域。
[0116] 在步驟dl2中,當(dāng)存在筆畫寬度突變區(qū)域時,確定筆畫區(qū)域像素點所在筆畫為斷 裂的筆畫,確定筆畫寬度突變區(qū)域為斷裂的筆畫中的斷裂區(qū)域。
[0117] 利用筆畫寬度變換確定斷裂的筆畫,可以準(zhǔn)確地找到斷裂區(qū)域,為補(bǔ)齊斷裂的筆 畫提供基礎(chǔ),有助于提商字符識別的識別準(zhǔn)確率。
[0118] 在步驟S103中,對斷裂的筆畫補(bǔ)齊得到準(zhǔn)識別圖像;
[0119] 其中,步驟S103可以采用如下的子步驟(步驟al3至步驟bl3)來實現(xiàn):
[0120] 在步驟al3中,設(shè)斷裂的筆畫中的斷裂區(qū)域沿其所在筆畫的方向與其所在筆畫的 交界像素點分別為第一交界點和第二交界點,將第一交界點和第二交界點之間沿第一交界 點的筆畫方向、寬度等于第一交界點的筆畫寬度值和第二交界點的筆畫寬度值的平均值的 區(qū)域設(shè)置為準(zhǔn)筆畫區(qū)域,其中,第一交界點的筆畫寬度值和第二交界點的筆畫寬度值通過 筆畫寬度變換算法獲得;
[0121] 在步驟bl3中,將準(zhǔn)筆畫區(qū)域的灰度值設(shè)置為與字符塊中筆畫區(qū)域的灰度值一致 的值。
[0122] 步驟al3至步驟bl3通過將準(zhǔn)筆畫區(qū)域的灰度值設(shè)置為與字符塊中筆畫區(qū)域的灰 度值一致的值這種方式對斷裂的筆畫進(jìn)行補(bǔ)齊,能夠有效消除斷裂筆畫,有助于提高字符 識別的識別準(zhǔn)確率。
[0123] 在本公開實施例中,步驟S103還可以包括子步驟cl3 :
[0124] 在步驟cl3中,當(dāng)斷裂區(qū)域為斷裂的筆畫中的筆畫寬度顯著增大區(qū)域時,將斷裂 區(qū)域中處于準(zhǔn)筆畫區(qū)域之外的筆畫區(qū)域的灰度值設(shè)置為與字符塊中背景區(qū)域的灰度值一 致的值。這樣,在進(jìn)行筆畫補(bǔ)齊的同時還可以進(jìn)一步去除噪聲,有助于提高字符識別的識別 準(zhǔn)確率。
[0125] 在步驟S104中,對準(zhǔn)識別圖像進(jìn)行字符識別,得到該準(zhǔn)識別圖像中的文本信息。
[0126] 這里,說明一下筆畫寬度變換算法。筆畫寬度變換算法可以包括如下步驟(步驟 a00至步驟c00):
[0127] 在步驟a00中,對字符塊進(jìn)行邊緣檢測,找到邊緣像素點,邊緣像素點具有一個方 向梯度值;
[0128] 在步驟b00中,按照任一邊緣像素點p的梯度方向dp沿路線r查找與邊緣像素點 P相匹配的邊緣像素點q,邊緣像素點q的梯度方向dq與邊緣像素點p的梯度方向dp相反, 其中,r = p+n*dp, η大于或等于0 ;
[0129] 在步驟c00中,當(dāng)查找到邊緣像素點q時,指定邊緣像素點ρ與邊緣像素點q的連 線上每個像素點的筆畫寬度值為邊緣像素點p與邊緣像素點q之間的歐式距離。邊緣像素 點P與邊緣像素點q之間的歐式距離表示為I |p_q| I。
[0130] 該筆畫寬度變換算法能夠有效確定筆畫寬度值,為補(bǔ)齊斷裂的筆畫提供基礎(chǔ)。
[0131] 本實施例示出的光學(xué)字符識別方法,能夠利用筆畫寬度變換對字符中筆畫出現(xiàn)的 斷裂進(jìn)行補(bǔ)齊,提高了光學(xué)字符識別的識別準(zhǔn)確率。
[0132] 圖2是根據(jù)一示例性實施例示出的一種光學(xué)字符識別方法的流程圖之二。如圖2 所示,本實施例中,光學(xué)字符識別方法的流程可以包括如下步驟:
[0133] 在步驟S201中,從原始圖像中提取字符塊;
[0134] 在步驟S202中,基于筆畫寬度變換,確定字符塊中斷裂的筆畫;
[0135] 在步驟S203中,基于筆畫寬度變換,檢測字符塊中的噪聲;
[0136] 其中,步驟S203可以采用如下的子步驟(步驟a23至步驟d23)來實現(xiàn):
[0137] 在步驟a23中,確定字符塊的筆畫寬度W,字符塊i的筆畫寬度等于第一寬度平均 值與第二寬度平均值之和的二分之一,其中,第一寬度平均值為字符塊i的平均筆畫寬度 值,字符塊i的平均筆畫寬度值等于字符塊i中所有筆畫區(qū)域像素點的筆畫寬度值的平均 值,第二寬度平均值為從原始圖像中提取出的所有字符塊的平均筆畫寬度值的平均值,i為 自然數(shù),筆畫區(qū)域像素點的筆畫寬度值通過筆畫寬度變換算法獲得;
[0138] 設(shè)字符塊i的筆畫寬度為I,第一寬度平均值為Wn,第二寬度平均值為Wa,那么, Wa的表達(dá)式如公式(1)所示:

【權(quán)利要求】
1. 一種光學(xué)字符識別方法,其特征在于,包括: 從原始圖像中提取字符塊; 基于筆畫寬度變換,確定所述字符塊中斷裂的筆畫; 對所述斷裂的筆畫補(bǔ)齊得到準(zhǔn)識別圖像; 對所述準(zhǔn)識別圖像進(jìn)行字符識別,得到所述準(zhǔn)識別圖像中的文本信息。
2. 根據(jù)權(quán)利要求1所述的光學(xué)字符識別方法,其特征在于,所述基于筆畫寬度變換,確 定所述字符塊中斷裂的筆畫包括: 設(shè)置斷裂長度閾值; 確定所述字符塊的筆畫區(qū)域像素點所在筆畫的方向; 判斷在所述筆畫區(qū)域像素點所在筆畫的方向上,所述筆畫區(qū)域像素點與其下一個筆畫 區(qū)域像素點之間是否存在筆畫寬度突變區(qū)域,且所述筆畫寬度突變區(qū)域的長度小于所述斷 裂長度閾值,所述筆畫寬度突變區(qū)域為空白區(qū)域、筆畫寬度增大值大于設(shè)定第一寬度變化 閾值或筆畫寬度減小值大于設(shè)定第二寬度變化閾值的區(qū)域; 當(dāng)存在所述筆畫寬度突變區(qū)域時,確定所述筆畫區(qū)域像素點所在筆畫為斷裂的筆畫, 確定所述筆畫寬度突變區(qū)域為所述斷裂的筆畫中的斷裂區(qū)域。
3. 根據(jù)權(quán)利要求1所述的光學(xué)字符識別方法,其特征在于,所述對所述斷裂的筆畫補(bǔ) 齊包括: 設(shè)所述斷裂的筆畫中的斷裂區(qū)域沿其所在筆畫的方向與其所在筆畫的交界像素點分 別為第一交界點和第二交界點,將所述第一交界點和所述第二交界點之間沿所述第一交界 點的筆畫方向、寬度等于所述第一交界點的筆畫寬度值和所述第二交界點的筆畫寬度值的 平均值的區(qū)域設(shè)置為準(zhǔn)筆畫區(qū)域,其中,所述第一交界點的筆畫寬度值和所述第二交界點 的筆畫寬度值通過筆畫寬度變換算法獲得; 將所述準(zhǔn)筆畫區(qū)域的灰度值設(shè)置為與所述字符塊中筆畫區(qū)域的灰度值一致的值。
4. 根據(jù)權(quán)利要求3所述的光學(xué)字符識別方法,其特征在于,所述對所述斷裂的筆畫補(bǔ) 齊還包括: 當(dāng)所述斷裂區(qū)域為所述斷裂的筆畫中的筆畫寬度顯著增大區(qū)域時,將所述斷裂區(qū)域中 處于所述準(zhǔn)筆畫區(qū)域之外的筆畫區(qū)域的灰度值設(shè)置為與所述字符塊中背景區(qū)域的灰度值 一致的值。
5. 根據(jù)權(quán)利要求1所述的光學(xué)字符識別方法,其特征在于,在所述對所述準(zhǔn)識別圖像 進(jìn)行字符識別之前,還包括: 基于筆畫寬度變換,檢測所述字符塊中的噪聲; 消除所述噪聲。
6. 根據(jù)權(quán)利要求5所述的光學(xué)字符識別方法,其特征在于,所述基于筆畫寬度變換,檢 測所述字符塊中的噪聲包括: 確定所述字符塊的筆畫寬度W,字符塊i的筆畫寬度等于第一寬度平均值與第二寬度 平均值之和的二分之一,所述第一寬度平均值為字符塊i的平均筆畫寬度值,字符塊i的平 均筆畫寬度值等于字符塊i中所有筆畫區(qū)域像素點的筆畫寬度值的平均值,所述第二寬度 平均值為從所述原始圖像中提取出的所有字符塊的平均筆畫寬度值的平均值,i為自然數(shù), 筆畫區(qū)域像素點的筆畫寬度值通過筆畫寬度變換算法獲得; 設(shè)置字符筆畫寬度誤差d; 判斷所述字符塊中筆畫寬度處于區(qū)間[w-d,w+d]之外的筆畫區(qū)域是否滿足如下成噪 條件之一:所述筆畫區(qū)域的設(shè)定范圍內(nèi)沒有與所述筆畫方向相符合的筆畫、沿所述筆畫區(qū) 域的筆畫寬度變化波動值大于設(shè)定波動閾值或者所述筆畫區(qū)域的筆畫長度小于設(shè)定長度 閾值; 當(dāng)所述字符塊中筆畫寬度處于區(qū)間[w-d,w+d]之外的筆畫區(qū)域滿足所述成噪條件之 一時,判定所述字符塊中筆畫寬度處于區(qū)間[w-d,w+d]之外的筆畫區(qū)域為噪聲。
7. 根據(jù)權(quán)利要求5所述的光學(xué)字符識別方法,其特征在于,所述消除所述噪聲包括: 將所述噪聲的灰度值設(shè)置為與所述字符塊中背景區(qū)域的灰度值一致的值。
8. 根據(jù)權(quán)利要求3或6所述的光學(xué)字符識別方法,其特征在于,所述筆畫寬度變換算法 包括: 對所述字符塊進(jìn)行邊緣檢測,找到邊緣像素點,所述邊緣像素點具有一個方向梯度 值; 按照任一邊緣像素點P的梯度方向dp沿路線r查找與邊緣像素點p相匹配的邊緣像素 點q,邊緣像素點q的梯度方向dq與邊緣像素點p的梯度方向dp相反,其中,r = p+n*dp,η 大于或等于〇 ; 當(dāng)查找到所述邊緣像素點q時,指定所述邊緣像素點Ρ與所述邊緣像素點q的連線上 每個像素點的筆畫寬度值為所述邊緣像素點P與所述邊緣像素點q之間的歐式距離。
9. 一種光學(xué)字符識別裝置,其特征在于,包括: 提取模塊,用于從原始圖像中提取字符塊; 確定模塊,用于基于筆畫寬度變換,確定所述字符塊中斷裂的筆畫; 補(bǔ)齊模塊,用于對所述斷裂的筆畫補(bǔ)齊得到準(zhǔn)識別圖像; 識別模塊,用于對所述準(zhǔn)識別圖像進(jìn)行字符識別,得到所述準(zhǔn)識別圖像中的文本信息。
10. 根據(jù)權(quán)利要求9所述的光學(xué)字符識別裝置,其特征在于,所述確定模塊包括: 閾值設(shè)置單元,用于設(shè)置斷裂長度閾值; 筆畫方向確定單元,用于確定所述字符塊的筆畫區(qū)域像素點所在筆畫的方向; 突變判斷單元,用于判斷在所述筆畫區(qū)域像素點所在筆畫的方向上,所述筆畫區(qū)域像 素點與其下一個筆畫區(qū)域像素點之間是否存在筆畫寬度突變區(qū)域,且所述筆畫寬度突變區(qū) 域的長度小于所述斷裂長度閾值,所述筆畫寬度突變區(qū)域為空白區(qū)域、筆畫寬度增大值大 于設(shè)定第一寬度變化閾值或筆畫寬度減小值大于設(shè)定第二寬度變化閾值的區(qū)域; 斷裂筆畫確定單元,用于當(dāng)存在所述筆畫寬度突變區(qū)域時,確定所述筆畫區(qū)域像素點 所在筆畫為斷裂的筆畫,確定所述筆畫寬度突變區(qū)域為所述斷裂的筆畫中的斷裂區(qū)域。
11. 根據(jù)權(quán)利要求9所述的光學(xué)字符識別裝置,其特征在于,所述補(bǔ)齊模塊包括: 準(zhǔn)筆畫區(qū)域設(shè)置單元,設(shè)所述斷裂的筆畫中的斷裂區(qū)域沿其所在筆畫的方向與其所 在筆畫的交界像素點分別為第一交界點和第二交界點,所述準(zhǔn)筆畫區(qū)域設(shè)置單元用于將所 述第一交界點和所述第二交界點之間沿所述第一交界點的筆畫方向、寬度等于所述第一交 界點的筆畫寬度值和所述第二交界點的筆畫寬度值的平均值的區(qū)域設(shè)置為準(zhǔn)筆畫區(qū)域,其 中,所述第一交界點的筆畫寬度值和所述第二交界點的筆畫寬度值通過筆畫寬度變換單元 獲得; 第一灰度調(diào)整單元,用于將所述準(zhǔn)筆畫區(qū)域的灰度值設(shè)置為與所述字符塊中筆畫區(qū)域 的灰度值一致的值。
12. 根據(jù)權(quán)利要求11所述的光學(xué)字符識別裝置,其特征在于,所述補(bǔ)齊模塊還包括: 第二灰度調(diào)整單元,用于當(dāng)所述斷裂區(qū)域為所述斷裂的筆畫中的筆畫寬度顯著增大區(qū) 域時,將所述斷裂區(qū)域中處于所述準(zhǔn)筆畫區(qū)域之外的筆畫區(qū)域的灰度值設(shè)置為與所述字符 塊中背景區(qū)域的灰度值一致的值。
13. 根據(jù)權(quán)利要求9所述的光學(xué)字符識別裝置,其特征在于,在所述識別模塊之前,還 包括: 噪聲檢測模塊,用于基于筆畫寬度變換,檢測所述字符塊中的噪聲; 消除模塊,用于消除所述噪聲檢測模塊檢測出的噪聲。
14. 根據(jù)權(quán)利要求13所述的光學(xué)字符識別裝置,其特征在于,所述噪聲檢測模塊包括: 筆畫寬度確定單元,用于確定所述字符塊的筆畫寬度W,字符塊i的筆畫寬度等于第一 寬度平均值與第二寬度平均值之和的二分之一,所述第一寬度平均值為字符塊i的平均筆 畫寬度值,字符塊i的平均筆畫寬度值等于字符塊i中所有筆畫區(qū)域像素點的筆畫寬度值 的平均值,所述第二寬度平均值為從所述原始圖像中提取出的所有字符塊的平均筆畫寬度 值的平均值,i為自然數(shù),筆畫區(qū)域像素點的筆畫寬度值通過筆畫寬度變換單元獲得; 誤差設(shè)置單元,用于設(shè)置字符筆畫寬度誤差d ; 成噪判斷單元,用于判斷所述字符塊中筆畫寬度處于區(qū)間[W-d,W+d]之外的筆畫區(qū)域 是否滿足如下成噪條件之一:所述筆畫區(qū)域的設(shè)定范圍內(nèi)沒有與所述筆畫方向相符合的筆 畫、沿所述筆畫區(qū)域的筆畫寬度變化波動值大于設(shè)定波動閾值或者所述筆畫區(qū)域的筆畫長 度小于設(shè)定長度閾值; 判定單元,用于當(dāng)所述字符塊中筆畫寬度處于區(qū)間[W-d,W+d]之外的筆畫區(qū)域滿足所 述成噪條件之一時,判定所述字符塊中筆畫寬度處于區(qū)間[W-d,W+d]之外的筆畫區(qū)域為噪 聲。
15. 根據(jù)權(quán)利要求13所述的光學(xué)字符識別裝置,其特征在于,所述消除模塊包括: 灰度除噪單元,用于將所述噪聲的灰度值設(shè)置為與所述字符塊中背景區(qū)域的灰度值一 致的值。
16. 根據(jù)權(quán)利要求11或14所述的光學(xué)字符識別裝置,其特征在于,所述筆畫寬度變換 單元包括: 邊緣檢測子單元,用于對所述字符塊進(jìn)行邊緣檢測,找到邊緣像素點,所述邊緣像素點 具有一個方向梯度值; 匹配子單元,用于按照任一邊緣像素點P的梯度方向4沿路線r查找與邊緣像素點p 相匹配的邊緣像素點q,邊緣像素點q的梯度方向dq與邊緣像素點p的梯度方向dp相反, 其中,r = p+n*dp, η大于或等于0 ; 指定子單元,用于當(dāng)查找到所述邊緣像素點q時,指定所述邊緣像素點Ρ與所述邊緣像 素點q的連線上每個像素點的筆畫寬度值為所述邊緣像素點P與所述邊緣像素點q之間的 歐式距離。
17. -種光學(xué)字符識別裝置,其特征在于,包括: 處理器; 用于存儲處理器可執(zhí)行指令的存儲器; 其中,所述處理器被配置為執(zhí)行如下指令: 從原始圖像中提取字符塊; 基于筆畫寬度變換,確定所述字符塊中斷裂的筆畫; 對所述斷裂的筆畫補(bǔ)齊得到準(zhǔn)識別圖像; 對所述準(zhǔn)識別圖像進(jìn)行字符識別,得到所述準(zhǔn)識別圖像中的文本信息。
【文檔編號】G06K9/54GK104112130SQ201410299362
【公開日】2014年10月22日 申請日期:2014年6月26日 優(yōu)先權(quán)日:2014年6月26日
【發(fā)明者】陳志軍, 張祺深, 臧虎 申請人:小米科技有限責(zé)任公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
万源市| 凤城市| 军事| 平谷区| 涿州市| 保定市| 樟树市| 鄂温| 凌源市| 富阳市| 吉林省| 顺义区| 吉木乃县| 尚志市| 天津市| 石城县| 伊吾县| 安溪县| 二连浩特市| 高阳县| 中西区| 扬州市| 灵宝市| 老河口市| 玉门市| 黄山市| 马鞍山市| 长汀县| 阿勒泰市| 炉霍县| 米林县| 禹州市| 隆子县| 宜兴市| 库伦旗| 博罗县| 安龙县| 南部县| 鸡东县| 萝北县| 根河市|