專(zhuān)利名稱(chēng):一種移動(dòng)終端的光符識(shí)別中分區(qū)域判定背景色的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種光符識(shí)別技術(shù),特別是一種移動(dòng)終端的光符識(shí)別中分區(qū)域判定背景色的方法。
背景技術(shù):
目前移動(dòng)終端的光符識(shí)別技術(shù)中,判斷待識(shí)別字符和背景的灰度均值的對(duì)比度這一步驟往往不受重視,因?yàn)樵诮^大多數(shù)情況下,如報(bào)刊,書(shū)籍,名片等的光符識(shí)別中,背景的灰度均值往往高(顏色淺),而前景字符的灰度均值往往低(顏色深)。所以在現(xiàn)在大多數(shù)光符識(shí)別的二值化過(guò)程中往往直接就假定這一點(diǎn)來(lái)進(jìn)行處理。稍好一點(diǎn)的OCR識(shí)別系統(tǒng)會(huì)在識(shí)別前讓用戶選擇底色深淺或自動(dòng)計(jì)算整體圖像的前景字符與背景的灰度對(duì)比度來(lái)指導(dǎo)二值化和識(shí)別,即使這樣,現(xiàn)行技術(shù)的缺點(diǎn)是讓用戶指定的底色深淺往往針對(duì)于整個(gè)待識(shí)別圖像而言,或者光符識(shí)別自動(dòng)計(jì)算也是計(jì)算整個(gè)圖像的前景字符與背景的灰度對(duì)比度。如果對(duì)于一幅圖像背景和前景字符顏色對(duì)比度在整副圖像的不同區(qū)域不一致的情況,該方法就無(wú)效了,也就導(dǎo)致部分字符無(wú)法識(shí)別。
另外,移動(dòng)終端利用其攝像頭進(jìn)行光符識(shí)別的場(chǎng)景不僅包括對(duì)書(shū)籍、名片的識(shí)別,還有對(duì)廣告牌上文字(如電話號(hào)碼),公路標(biāo)識(shí)牌上文字(如距離,地點(diǎn)名等),車(chē)輛牌照(中國(guó)常見(jiàn)的是藍(lán)底白字的車(chē)牌)的牌照號(hào)碼的識(shí)別。此時(shí)往往字符區(qū)域附近的背景灰度均值小于前景字符灰度均值,這與目前絕大多數(shù)光符識(shí)別應(yīng)用于書(shū)籍報(bào)刊名片的對(duì)比度正好相反。同時(shí)由于車(chē)輛牌照、廣告牌、公路標(biāo)識(shí)牌等背景和前景字符灰度均值對(duì)比度在整副圖像的不同區(qū)域不一致的情況是經(jīng)常存在的,例如車(chē)牌是藍(lán)底白字,但是車(chē)身上的大寫(xiě)電話號(hào)碼等信息卻是白底黑字的;個(gè)性化的名片上也有這種情況出現(xiàn)名字區(qū)域是背景色深,而聯(lián)系方式區(qū)域是背景色淺。所以傳統(tǒng)的計(jì)算整個(gè)圖像的前景字符與背景的灰度對(duì)比度方法在該種情況下是毫無(wú)意義的,不可避免的造成了有些字符無(wú)法識(shí)別。
發(fā)明內(nèi)容
本發(fā)明的目的是針對(duì)現(xiàn)有技術(shù)的不足,提供一種方法簡(jiǎn)單、可適用于不同的場(chǎng)景,光符識(shí)別準(zhǔn)確度高的移動(dòng)終端的光符識(shí)別中分區(qū)域判定背景色的方法。
為了解決上述技術(shù)問(wèn)題,本發(fā)明所采取的技術(shù)方案是一種移動(dòng)終端的光符識(shí)別中分區(qū)域判定背景色的方法,包括步驟1、鎖定待識(shí)別區(qū)域;步驟2、對(duì)所述待識(shí)別區(qū)域作首次二值化處理;步驟3、根據(jù)所述首次二值化處理結(jié)果,分析獲得所述待識(shí)別區(qū)域中的可能包含文字的子區(qū)域;步驟4、在其中一個(gè)需進(jìn)行光符識(shí)別的子區(qū)域內(nèi),根據(jù)首次二值化處理結(jié)果統(tǒng)計(jì)黑白兩色的像素的數(shù)量,從而判斷該子區(qū)域的背景是為深底色背景還是淺底色背景;步驟5、根據(jù)所述背景的底色信息,進(jìn)行子區(qū)域內(nèi)的最終二值化算法和識(shí)別算法,從而獲得該子區(qū)域內(nèi)的文字內(nèi)容;步驟6、重復(fù)步驟4和步驟5,直至完成所有的需進(jìn)行光符識(shí)別的子區(qū)域的光符識(shí)別操作。
所述步驟2可以是在該待識(shí)別區(qū)域內(nèi),采用圖像二值化方法計(jì)算圖像二值化的整體閾值,從而完成首次二值化處理過(guò)程。
所述步驟3可以是利用所述首次二值化處理結(jié)果,作水平或垂直投影運(yùn)算和版面分析算法,從而判定出有幾個(gè)可能包含文字的子區(qū)域。
所述步驟4中,可以將該子區(qū)域內(nèi),黑白像素的數(shù)量較少的一方看做是前景字符,則當(dāng)前景字符為黑色,表明該子區(qū)域的背景為淺底色背景;當(dāng)前景字符為白色,表明該子區(qū)域的背景為深底色背景。
所述步驟1可以是在采用移動(dòng)終端顯示所拍攝的圖像的同時(shí),在顯示屏上顯示出可以移動(dòng)并改變其大小的鎖定框,用戶通過(guò)操作該鎖定框,鎖定待識(shí)別的區(qū)域。
所述步驟3中可以在判定出可能包含文字的子區(qū)域后,在移動(dòng)終端的顯示屏上對(duì)整幅圖像上的每個(gè)子區(qū)域以閃爍框的形式顯示,用戶通過(guò)移動(dòng)終端上的方向鍵和確認(rèn)鍵,選擇其中需要光符識(shí)別的子區(qū)域。
如果用戶在一段時(shí)間后依然沒(méi)有選擇需要光符識(shí)別的子區(qū)域,則可以默認(rèn)所有的可能包含文字的子區(qū)域都需要進(jìn)行光符識(shí)別。
當(dāng)步驟4判斷出背景為深底色背景還是淺底色背景后,可以在移動(dòng)終端的顯示屏上顯示判斷結(jié)果,由用戶來(lái)驗(yàn)證其結(jié)果,在獲得用戶的確認(rèn)后,再執(zhí)行步驟5。
如果用戶在一段時(shí)間后依然沒(méi)有驗(yàn)證結(jié)果,則可以認(rèn)為用戶認(rèn)為當(dāng)前的判斷結(jié)果正確,并以該判斷結(jié)果進(jìn)入所述步驟5在上述技術(shù)方案中,本發(fā)明先對(duì)一塊區(qū)域內(nèi)的不同程度底色的字符塊進(jìn)行分割,對(duì)分割后的每個(gè)子區(qū)域進(jìn)行單獨(dú)的背景與前景字符的對(duì)比度計(jì)算,智能的解決了對(duì)不同底色的字符進(jìn)行區(qū)別對(duì)待,進(jìn)行二值化和識(shí)別,因此本發(fā)明所提供的方法可以適用于對(duì)不同場(chǎng)景、不同背景色的光符識(shí)別,且具有光符識(shí)別準(zhǔn)確度高、智能性強(qiáng)等特點(diǎn)。
具體實(shí)施例方式
下面將結(jié)合具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明。
本實(shí)施例提供的一種移動(dòng)終端的光符識(shí)別中分區(qū)域判定背景色的方法,其步驟如下步驟1、利用移動(dòng)終端上的拍攝裝置(如攝像頭)對(duì)需進(jìn)行光符識(shí)別的圖像進(jìn)行拍攝,并在顯示所拍攝的圖像的同時(shí),在顯示屏上顯示出可以移動(dòng)并改變其大小的鎖定框,用戶通過(guò)操作該鎖定框,鎖定待識(shí)別的區(qū)域。所述鎖定框可以采用帶起止標(biāo)記的橫線或矩形框等。
步驟2、在該待識(shí)別區(qū)域內(nèi),采用最大類(lèi)間方差法等圖像二值化方法計(jì)算圖像二值化的整體閾值,從而完成首次二值化處理過(guò)程。
步驟3、利用所述首次二值化處理結(jié)果,作水平或垂直投影運(yùn)算和版面分析算法(如行分割算法等),從而判定出有幾個(gè)可能包含文字的子區(qū)域。
這里,可以在移動(dòng)終端的顯示屏上對(duì)這幾個(gè)可能包含文字的子區(qū)域用加閃爍框的形式顯示出來(lái),并且還可以使用戶通過(guò)移動(dòng)終端上的方向鍵、確認(rèn)鍵來(lái)選擇哪些子區(qū)域需要識(shí)別,從而使用戶可以掌握控制該判斷結(jié)果是否正確,并避免識(shí)別不需要的內(nèi)容,避免無(wú)謂的增加識(shí)別程序的時(shí)間,提高工作效率。
如果用戶在一段時(shí)間后沒(méi)有選擇需要光符識(shí)別的子區(qū)域,則默認(rèn)所有的可能包含文字的子區(qū)域都需要進(jìn)行光符識(shí)別。
步驟4、在其中一個(gè)需要進(jìn)行光符識(shí)別的子區(qū)域內(nèi),根據(jù)首次二值化處理結(jié)果統(tǒng)計(jì)黑白兩色的像素的數(shù)量,其中數(shù)量較少的一方看做是前景字符,則當(dāng)前景字符為黑色,表明該子區(qū)域的背景為淺底色背景;當(dāng)前景字符為白色,表明該子區(qū)域的背景為深底色背景。
由此則判斷該子區(qū)域的背景是為深底色背景還是淺底色背景;本步驟也可以在步驟3中用戶選擇需要光符識(shí)別的子區(qū)域的同時(shí)進(jìn)行,從而在用戶選擇時(shí),移動(dòng)終端的顯示屏上即顯示該子區(qū)域的背景色為深底色還是淺底色的提示,使用戶一方面確認(rèn)該子區(qū)域需要識(shí)別,另一方面確認(rèn)系統(tǒng)判斷該子區(qū)域的背景的結(jié)果是否正確。當(dāng)用戶確認(rèn)后,再執(zhí)行步驟5。如果等待一段時(shí)間后,還沒(méi)有接收到用戶輸入的確認(rèn)信息,則默認(rèn)用戶已經(jīng)確認(rèn),自動(dòng)進(jìn)入步驟5。
步驟5、根據(jù)所述背景的底色信息,進(jìn)行子區(qū)域內(nèi)的最終二值化算法和識(shí)別算法,從而獲得該子區(qū)域內(nèi)的文字內(nèi)容;步驟6、重復(fù)步驟4和步驟5,直至完成所有的子區(qū)域的光符識(shí)別。
在本實(shí)施例中,本發(fā)明先對(duì)一塊區(qū)域內(nèi)的不同程度底色的字符塊進(jìn)行分割,對(duì)分割后的每個(gè)子區(qū)域進(jìn)行單獨(dú)的背景與前景字符的對(duì)比度計(jì)算,智能的解決了對(duì)不同底色的字符進(jìn)行區(qū)別對(duì)待,進(jìn)行二值化和識(shí)別,而不會(huì)如傳統(tǒng)算法一樣,根據(jù)一個(gè)全局背景的判斷來(lái)指導(dǎo)所有不同子區(qū)域的二值化和識(shí)別工作,造成部分字符無(wú)法識(shí)別。
權(quán)利要求
1.一種移動(dòng)終端的光符識(shí)別中分區(qū)域判定背景色的方法,包括步驟1、鎖定待識(shí)別區(qū)域;步驟2、對(duì)所述待識(shí)別區(qū)域作首次二值化處理;步驟3、根據(jù)所述首次二值化處理結(jié)果,分析獲得所述待識(shí)別區(qū)域中的可能包含文字的子區(qū)域;步驟4、在其中一個(gè)需進(jìn)行光符識(shí)別的子區(qū)域內(nèi),根據(jù)首次二值化處理結(jié)果統(tǒng)計(jì)黑白兩色的像素的數(shù)量,從而判斷該子區(qū)域的背景是為深底色背景還是淺底色背景;步驟5、根據(jù)所述背景的底色信息,進(jìn)行子區(qū)域內(nèi)的最終二值化算法和識(shí)別算法,從而獲得該子區(qū)域內(nèi)的文字內(nèi)容;步驟6、重復(fù)步驟4和步驟5,直至完成所有的需進(jìn)行光符識(shí)別的子區(qū)域的光符識(shí)別操作。
2.如權(quán)利要求1所述移動(dòng)終端的光符識(shí)別中分區(qū)域判定背景色的方法,其特征在于所述步驟2是在該待識(shí)別區(qū)域內(nèi),采用圖像二值化方法計(jì)算圖像二值化的整體閾值,從而完成首次二值化處理過(guò)程。
3.如權(quán)利要求1所述移動(dòng)終端的光符識(shí)別中分區(qū)域判定背景色的方法,其特征在于所述步驟3是利用所述首次二值化處理結(jié)果,作水平或垂直投影運(yùn)算和版面分析算法,從而判定出有幾個(gè)可能包含文字的子區(qū)域。
4.如權(quán)利要求1、2或3所述移動(dòng)終端的光符識(shí)別中分區(qū)域判定背景色的方法,其特征在于所述步驟4中,將該子區(qū)域內(nèi),黑白像素的數(shù)量較少的一方看做是前景字符,則當(dāng)前景字符為黑色,表明該子區(qū)域的背景為淺底色背景;當(dāng)前景字符為白色,表明該子區(qū)域的背景為深底色背景。
5.如權(quán)利要求4所述移動(dòng)終端的光符識(shí)別中分區(qū)域判定背景色的方法,其特征在于所述步驟1是在采用移動(dòng)終端顯示所拍攝的圖像的同時(shí),在顯示屏上顯示出可以移動(dòng)并改變其大小的鎖定框,用戶通過(guò)操作該鎖定框,鎖定待識(shí)別的區(qū)域。
6.如權(quán)利要求5所述移動(dòng)終端的光符識(shí)別中分區(qū)域判定背景色的方法,其特征在于所述步驟3中在判定出可能包含文字的子區(qū)域后,在移動(dòng)終端的顯示屏上對(duì)整幅圖像上的每個(gè)子區(qū)域以閃爍框的形式顯示,用戶通過(guò)移動(dòng)終端上的方向鍵和確認(rèn)鍵,選擇其中需要光符識(shí)別的子區(qū)域。
7.如權(quán)利要求6所述移動(dòng)終端的光符識(shí)別中分區(qū)域判定背景色的方法,其特征在于如果用戶在一段時(shí)間后依然沒(méi)有選擇需要光符識(shí)別的子區(qū)域,則默認(rèn)所有的可能包含文字的子區(qū)域都需要進(jìn)行光符識(shí)別。
8.如權(quán)利要求7所述移動(dòng)終端的光符識(shí)別中分區(qū)域判定背景色的方法,其特征在于當(dāng)步驟4判斷出背景為深底色背景還是淺底色背景后,在移動(dòng)終端的顯示屏上顯示判斷結(jié)果,由用戶來(lái)驗(yàn)證其結(jié)果,在獲得用戶的確認(rèn)后,再執(zhí)行步驟5。
9.如權(quán)利要求8所述移動(dòng)終端的光符識(shí)別中分區(qū)域判定背景色的方法,其特征在于如果用戶在一段時(shí)間后依然沒(méi)有驗(yàn)證結(jié)果,則認(rèn)為用戶認(rèn)為當(dāng)前的判斷結(jié)果正確,并以該判斷結(jié)果進(jìn)入所述步驟5。
全文摘要
本發(fā)明提供了一種移動(dòng)終端的光符識(shí)別中分區(qū)域判定背景色的方法,主要是先對(duì)一塊區(qū)域內(nèi)的不同程度底色的字符塊進(jìn)行分割,對(duì)分割后的每個(gè)子區(qū)域進(jìn)行單獨(dú)的背景與前景字符的對(duì)比度計(jì)算,智能的解決了對(duì)不同底色的字符進(jìn)行區(qū)別對(duì)待,進(jìn)行二值化和識(shí)別。相對(duì)現(xiàn)有技術(shù),本發(fā)明具有可以適用于對(duì)不同場(chǎng)景、不同背景色的光符識(shí)別,且光符識(shí)別準(zhǔn)確度高、智能性強(qiáng)等特點(diǎn)。
文檔編號(hào)G06K9/54GK1632820SQ20041010348
公開(kāi)日2005年6月29日 申請(qǐng)日期2004年12月30日 優(yōu)先權(quán)日2004年12月30日
發(fā)明者吳文欽, 王浩, 夏煜 申請(qǐng)人:北京中星微電子有限公司