專利名稱:定位圖像中文字區(qū)域的方法及裝置的制作方法
技術領域:
本發(fā)明涉及圖像處理領域,特別是涉及一種定位圖像中文字區(qū)域的方法及裝置。
背景技術:
商務活動中,用戶通常采用名片作為表明身份的工具。但傳統(tǒng)技術中的紙質名片不方便攜帶和保管,用戶通常需要手動將紙質名片上的信息錄入到智能終端中。為了能夠自動識別紙質名片上的信息,現(xiàn)用的名片管理軟件通常需要先定位拍照得到的名片圖像中的文字區(qū)域,然后再通過OCR (Optical CharacterRecognition,光學字符識別)系統(tǒng)將文字區(qū)域轉化成文本信息。然而,傳統(tǒng)技術中,定位圖像中文字區(qū)域的方法不準確,會漏掉關鍵信息,使得定位的準確度不高。
發(fā)明內容
基于此,有必要提供一種能提高準確度的定位圖像中文字區(qū)域的方法。一種定位圖像中文字區(qū)域的方法,包括獲取原始圖像;通過Roberts算子對所述原始圖像進行轉換生成灰度圖像;將所述灰度圖像二值化得到邊緣圖像;將所述邊緣圖像膨脹,提取所述邊緣圖像的連通域的位置信息。在其中一個實施例中,所述通過Roberts算子將所述原始圖像轉換成灰度圖像的步驟為根據(jù)公式
權利要求
1.一種定位圖像中文字區(qū)域的方法,包括獲取原始圖像;通過Roberts算子對所述原始圖像進行轉換生成灰度圖像;將所述灰度圖像二值化得到邊緣圖像;將所述邊緣圖像膨脹,提取所述邊緣圖像的連通域的位置信息。
2.根據(jù)權利要求1所述的定位圖像中文字區(qū)域的方法,其特征在于,所述通過Roberts算子將所述原始圖像轉換成灰度圖像的步驟為根據(jù)公式
3.根據(jù)權利要求1所述的定位圖像中文字區(qū)域的方法,其特征在于,所述將所述灰度圖像二值化得到邊緣圖像的步驟為通過最大類間方差算法對所述灰度圖像進行二值化得到邊緣圖像。
4.根據(jù)權利要求1所述的定位圖像中文字區(qū)域的方法,其特征在于,所述提取所述邊緣圖像的連通域的位置信息的步驟為根據(jù)區(qū)域標記算法提取所述邊緣圖像的連通域的位置信息。
5.根據(jù)權利要求1所述的定位圖像中文字區(qū)域的方法,其特征在于,所述提取所述邊緣圖像的連通域的位置信息的步驟之后還包括獲取所述連通域的紋理特征和/或直方圖特征;獲取預設的支持向量機的分類器;利用所述分類器根據(jù)所述紋理特征和/或直方圖特征篩選所述位置信息。
6.一種定位圖像中文字區(qū)域的裝置,其特征在于,包括圖像獲取模塊,用于獲取原始圖像;灰度圖像生成模塊,用于通過Roberts算子對所述原始圖像進行轉換生成灰度圖像;圖像二值化模塊,用于將所述灰度圖像二值化得到邊緣圖像;區(qū)域定位模塊,用于將所述邊緣圖像膨脹,提取所述邊緣圖像的連通域的位置信息。
7.根據(jù)權利要求6所述的定位圖像中文字區(qū)域的裝置,其特征在于,所述灰度圖像生成模塊還用于根據(jù)公式
8.根據(jù)權利要求6所述的定位圖像中文字區(qū)域的裝置,其特征在于,所述圖像二值化模塊還用于通過最大類間方差算法對所述灰度圖像進行二值化得到邊緣圖像。
9.根據(jù)權利要求6所述的定位圖像中文字區(qū)域的裝置,其特征在于,所述區(qū)域定位模塊還用于根據(jù)區(qū)域標記算法提取所述邊緣圖像的連通域的位置信息。
10.根據(jù)權利要求6所述的定位圖像中文字區(qū)域的裝置,其特征在于,所述裝置還包括區(qū)域篩選模塊,用于獲取所述連通域的紋理特征和/或直方圖特征,獲取預設的支持向量機的分類器,利用所述分類器根據(jù)所述紋理特征和/或直方圖特征篩選所述位置信息。
全文摘要
本發(fā)明涉及一種定位圖像中文字區(qū)域的方法,包括獲取原始圖像;通過Roberts算子對所述原始圖像進行轉換生成灰度圖像;將所述灰度圖像二值化得到邊緣圖像;將所述邊緣圖像膨脹,提取所述邊緣圖像的連通域的位置信息。此外,還包括一種定位圖像中文字區(qū)域的裝置。上述定位圖像中文字區(qū)域的方法及裝置可以提高定位的準確性。
文檔編號G06K9/54GK103034856SQ201210552389
公開日2013年4月10日 申請日期2012年12月18日 優(yōu)先權日2012年12月18日
發(fā)明者李冰, 陳小平, 肖方明, 汪利 申請人:深圳深訊和科技有限公司