識別裝置、文字識別系統(tǒng)及方法
【專利摘要】本發(fā)明公開一種識別裝置,用于與具有文字識別功能的服務(wù)器配合而進(jìn)行文字識別。該識別裝置包括拍攝模塊,用于對目標(biāo)畫面進(jìn)行拍攝并生成圖片;發(fā)送模塊,用于向該服務(wù)器發(fā)送圖片;接收模塊,用于接收該服務(wù)器根據(jù)該圖片識別出來的文字及圖片信息;及排版模塊,用于對所接收的文字及圖片信息進(jìn)行排版并生成一定格式的文檔。本發(fā)明還公開一直識別裝置的文字識別方法以及一種文字識別系統(tǒng)。由于服務(wù)器中可存儲大量的文字?jǐn)?shù)據(jù)庫,因此,其識別的準(zhǔn)確率較高。
【專利說明】識別裝置、文字識別系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及文字識別【技術(shù)領(lǐng)域】,尤其是涉及一種可識別文字的識別裝置及其識別方法。
【背景技術(shù)】
[0002]光學(xué)字符識別(Optical Character Recognition, OCR)是指電子設(shè)備檢查圖片上的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機(jī)文字的過程。從影像到結(jié)果輸出,需經(jīng)過影像輸入、影像前處理、文字特征抽取、比對識別,最終獲取文字信息等步驟。對于有圖畫內(nèi)容的圖片,圖畫內(nèi)容所在區(qū)域?qū)⒈蛔R別出來,并還以圖片格式保存。
[0003]目前很多移動電子設(shè)備,比如智能手機(jī),都可集成OCR功能?,F(xiàn)有的一種方法過程是,用手機(jī)拍攝下具有目標(biāo)文字的圖片,然后啟動OCR功能。手機(jī)運行該功能對所拍攝圖片進(jìn)行文字識別,識別過程中,手機(jī)將識別出來的文字與識別得到該文字的圖塊逐個地對應(yīng)并存儲。OCR功能結(jié)束后,用戶看到的仍是拍攝的圖片,隨該圖片存儲的還有識別出來的文字。然而,由于手機(jī)運行速度較慢,存儲的文字?jǐn)?shù)據(jù)庫量也有限,因此,上述識別過程較慢,識別的準(zhǔn)確率也較低。
【發(fā)明內(nèi)容】
[0004]有鑒于此,有必要提供一種識別準(zhǔn)確率高的識別裝置、文字識別系統(tǒng)及方法。
[0005]本發(fā)明提出一種識別裝置,用于與具有文字識別功能的服務(wù)器配合而進(jìn)行文字識另IJ,其特征在于,該識別裝置包括拍攝模塊,用于對目標(biāo)畫面進(jìn)行拍攝并生成圖片;發(fā)送模塊,用于向該服務(wù)器發(fā)送圖片;接收模塊,用于接收該服務(wù)器根據(jù)該圖片識別出來的文字及圖片信息;及排版模塊,用于對所接收的文字及圖片信息進(jìn)行排版并生成一定格式的文檔。
[0006]一種文字識別系統(tǒng),包括如上所述的識別裝置及所述服務(wù)器,該服務(wù)器包括服務(wù)器端接收模塊,用于接收該識別裝置發(fā)送過來的圖片;文字識別模塊,用于對該圖片進(jìn)行光學(xué)字符識別,并生成對應(yīng)的文字信息及圖片信息;及服務(wù)器端發(fā)送模塊,用于向該識別裝置發(fā)送該文字及圖片信息。
[0007]優(yōu)選地,該識別裝置還包括處理模塊,其用于對該圖片的規(guī)格進(jìn)行處理。
[0008]優(yōu)選地,該處理模塊包括圖片生成子模塊,用于生成特定大小的空白區(qū)域;第一輸出子模塊,用于將圖片輸出在該空白區(qū)域;操作響應(yīng)子模塊,用于響應(yīng)用戶對圖片的縮放、裁剪和/或移動的操作;及記錄子模塊,用于記錄縮放比例及操作后的圖片與空白區(qū)域之間的位置關(guān)系及比例關(guān)系。
[0009]優(yōu)選地,該排版模塊包括:文檔生成子模塊,用于生成一定格式的空白文檔;第二輸出子模塊,用于根據(jù)所述位置關(guān)系及縮放比例在空白文檔的對應(yīng)位置輸出所述文字及圖片信息;及調(diào)整模塊,用于根據(jù)所述比例關(guān)系調(diào)整文字信息的文字大小。
[0010]一種文字識別方法,包括對目標(biāo)畫面進(jìn)行拍攝并生成圖片;向具有文字識別功能的服務(wù)器發(fā)送圖片;接收該服務(wù)器根據(jù)該圖片識別出來的文字及圖片信息;及對所接收的文字及圖片信息進(jìn)行排版并生成一定格式的文檔。
[0011]優(yōu)選地,在所述對目標(biāo)畫面進(jìn)行拍攝并生成圖片的步驟之后還包括對圖片的規(guī)格進(jìn)行處理的步驟。
[0012]優(yōu)選地,所述對圖片的規(guī)格進(jìn)行處理的步驟包括生成特定大小的空白區(qū)域;將圖片輸出在該空白區(qū)域;響應(yīng)用戶對圖片的縮放、裁剪和/或移動的操作;及記錄縮放比例及操作后的圖片與空白區(qū)域之間的位置關(guān)系及比例關(guān)系。
[0013]優(yōu)選地,所述對所接收的文字及圖片信息進(jìn)行排版的步驟包括生成一定格式的空白文檔;根據(jù)所述位置關(guān)系及縮放比例在空白文檔的對應(yīng)位置輸出所述文字及圖片信息;及根據(jù)所述比例關(guān)系調(diào)整文字信息的文字大小。
[0014]由于服務(wù)器中可存儲大量的文字?jǐn)?shù)據(jù)庫,加上其運行速度也較快,因此,其識別的準(zhǔn)確率較高,識別過程也較快。
【專利附圖】
【附圖說明】
[0015]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0016]圖1是本發(fā)明的文字識別系統(tǒng)的模塊示意圖,其包括識別裝置及服務(wù)器;
圖2是實施圖1中的第一輸出子模塊的一個實施例的示意圖;
圖3是實施圖1中的操作響應(yīng)子模塊的一個實施例的示意圖;
圖4是圖1的識別裝置的文字識別方法的流程示意圖;
圖5是圖4中步驟S2的分解步驟流程圖;
圖6是圖4中的步驟S13的分解步驟流程圖。
【具體實施方式】
[0017]下面結(jié)合附圖和具體實施例對本發(fā)明的技術(shù)方案作進(jìn)一步更詳細(xì)的描述。顯然,所描述的實施例僅僅是本發(fā)明的一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都應(yīng)屬于本發(fā)明保護(hù)的范圍。
[0018]請結(jié)合圖1,本發(fā)明的文字識別系統(tǒng)包括識別裝置100及服務(wù)器200。所述識別裝置可以是手機(jī)或平板電腦等有屏幕的識別裝置,也可以是沒有屏幕的識別裝置。所述識別裝置與服務(wù)器間可以是有線方式的連接,也可以是無線方式的連接。下述實施方式中的識別裝置100以手機(jī)為例,其包括拍攝模塊10、發(fā)送模塊20、接收模塊30、排版模塊40及顯示模塊50。
[0019]拍攝模塊10用于對目標(biāo)畫面進(jìn)行拍攝并生成圖片。在本實施方式中,拍攝模塊10與識別裝置中的攝像頭匹配,該攝像頭用于對用戶所需識別的具有文字的目標(biāo)畫面進(jìn)行光學(xué)成像,拍攝模塊10用于根據(jù)該光學(xué)成像生成目標(biāo)畫面的圖片。
[0020]發(fā)送模塊20用于向服務(wù)器200發(fā)送圖片。在本實施方式中,發(fā)送模塊20與識別裝置中的發(fā)送電路匹配,該發(fā)送模塊20用于將上述拍攝模塊10所生成的目標(biāo)畫面的圖片發(fā)送向服務(wù)器200。
[0021]接收模塊30用于接收服務(wù)器200傳來的文字及圖片信息。在本實施方式中,發(fā)送模塊20與識別裝置中的接收電路匹配,該接收模塊30用于接收服務(wù)器200傳來的文字及圖片信息(下文有仔細(xì)描述)。
[0022]排版模塊40用于對所接收的文字及圖片信息進(jìn)行排版并生成一定格式的文檔。在本實施方式中,所示一定格式的文檔可以是常用的Word或PDF等格式的文檔。
[0023]顯示模塊50用于顯示拍攝模塊10對目標(biāo)畫面所拍攝而生成的圖片,以及顯示排版模塊40生成的上述一定格式的文檔。
[0024]服務(wù)器200包括服務(wù)器端接收模塊202、文字識別模塊204以及服務(wù)器端發(fā)送模塊206。服務(wù)器端接收模塊202用于接收上述識別裝置的識別裝置100發(fā)送過來的圖片。文字識別模塊204用于對該圖片進(jìn)行光學(xué)字符識別,并生成對應(yīng)的文字信息及圖片信息。如【背景技術(shù)】所述,光學(xué)字符識別為本領(lǐng)域技術(shù)人員熟知,在本說明書中不再做贅述。服務(wù)器端發(fā)送模塊206用于向識別裝置100發(fā)送根據(jù)該圖片識別出來的文字及圖片信息。
[0025]如上實施方式所述,由于服務(wù)器200中可存儲大量的文字?jǐn)?shù)據(jù)庫,加上其運行速度也較快,因此,其識別的準(zhǔn)確率較高,識別過程也較快。當(dāng)識別裝置100為如手機(jī)等移動設(shè)備時,上述圖片及根據(jù)圖片識別出來的文字及圖片信息可通過WiFi或GPRS等無線的方式發(fā)送。
[0026]隨著3G甚至4G制式等高速數(shù)據(jù)網(wǎng)絡(luò)的覆蓋,上述圖片或者文字及圖片信息可以很快的進(jìn)行傳輸,傳輸所需時間將大為縮減。如此上述實施方式所能帶來的高識別度的有點將更為突出。
[0027]優(yōu)選地,識別裝置100還包括處理模塊60,用于對該圖片的規(guī)格進(jìn)行處理。具體地,處理模塊60對所述圖片的大小、畫質(zhì)、色調(diào)、對比度等規(guī)格進(jìn)行處理,以利于文字識別。
[0028]優(yōu)選地,處理模塊60包括圖片生成子模塊61、第一輸出子模塊62、操作響應(yīng)子模塊63及記錄子模塊64。圖片生成子模塊61用于生成特定大小的空白區(qū)域。第一輸出子模塊62用于將圖片輸出在該空白區(qū)域,如圖2所示。操作響應(yīng)子模塊63用于響應(yīng)用戶對圖片的縮放、裁剪和/或移動的操作,一般推薦用戶將邊緣的空白部分都裁剪掉,比如圖3所示的用戶操作后的狀態(tài)。記錄子模塊64用于記錄記錄縮放比例及圖片與空白區(qū)域之間的位置關(guān)系及比例關(guān)系。
[0029]優(yōu)選地,排版模塊40包括文檔生成子模塊41、第二輸出子模塊42及調(diào)整子模塊43。文檔生成子模塊41用于生成一定格式的空白文檔。第二輸出子模塊42用于根據(jù)所述位置關(guān)系及縮放比例在空白文檔的對應(yīng)位置輸出所述文字及圖片信息。具體地,第二輸出子模塊42根據(jù)位置關(guān)系將文字及圖片信息輸出在空白文檔的對應(yīng)位置處,再根據(jù)縮放比例調(diào)整圖片信息,以使圖片與縮放后的圖片大小保持一致。調(diào)整子模塊43用于根據(jù)所述比例關(guān)系調(diào)整文字信息。具體地,識別裝置100可存儲一個表,該表記錄了多個上述比例關(guān)系與文字大小之間的對應(yīng)關(guān)系,如此,調(diào)整后變可使得顯示的文字信息的文字大小與調(diào)整后的圖片的基本一致。如此,進(jìn)過上述調(diào)整,文檔中顯示的文字及圖片信息的排版便與調(diào)整后的圖片在空白區(qū)域中的排版基本一致。
[0030]請結(jié)合圖4,本發(fā)明的文字識別方法可以用于手機(jī)或平板電腦等有屏幕的識別裝置,也可以用于沒有屏幕的識別裝置。所述文字識別方法包括以下步驟:
步驟S1:拍攝目標(biāo)圖片并生成圖片。具體地,對用戶所需識別的具有文字的目標(biāo)畫面進(jìn)行光學(xué)成像,再根據(jù)該光學(xué)成像生成目標(biāo)畫面的圖片。
[0031]步驟S3:向具有文字識別功能的服務(wù)器發(fā)送圖片。
[0032]步驟S5:服務(wù)器接收該圖片。
[0033]步驟S7:服務(wù)器對該圖片進(jìn)行光學(xué)字符識別,并生成對應(yīng)的文字信息及圖片信息;
步驟S9:服務(wù)器發(fā)送該文字及圖片信息。
[0034]步驟Sll:接收該服務(wù)器傳來的文字及圖片信息。
[0035]步驟S13:對所接收的文字及圖片信息進(jìn)行排版并生成一定格式的文檔。所述一定格式的文檔可以是常用的Word或PDF等格式的文檔。
[0036]如上實施方式所述,由于服務(wù)器中可存儲大量的文字?jǐn)?shù)據(jù)庫,加上其運行速度也較快,因此,其識別的準(zhǔn)確率較高,識別過程也較快。當(dāng)識別裝置為如手機(jī)等移動設(shè)備時,上述圖片及根據(jù)圖片識別出來的文字及圖片信息可通過WiFi或GPRS等無線的方式發(fā)送。
[0037]隨著3G甚至4G制式等高速數(shù)據(jù)網(wǎng)絡(luò)的覆蓋,上述圖片或者文字及圖片信息可以很快的進(jìn)行傳輸,傳輸所需時間將大為縮減。如此上述實施方式所能帶來的高識別度的有點將更為突出。
[0038]優(yōu)選地,在生成一定格式的文檔的步驟之后,還包括步驟S15:顯示該文檔的。如此,用戶可直接觀看該文檔,方便其觀察識別出來的文字信息是否有誤。
[0039]優(yōu)選地,在向服務(wù)器發(fā)送圖片的步驟之前,還包括步驟S2:對該圖片的規(guī)格進(jìn)行處理。具體地,對所述圖片的大小、畫質(zhì)、色調(diào)、對比度等規(guī)格進(jìn)行處理,以利于文字識別。
[0040]優(yōu)選地,請結(jié)合圖5,對該圖片的規(guī)格進(jìn)行處理的步驟包括:
步驟S2.1:生成特定大小的空白區(qū)域。
[0041]步驟S322:將圖片輸出在該空白區(qū)域,如圖2所示。
[0042]步驟S2.3:響應(yīng)用戶對圖片的縮放、裁剪和/或移動的操作,一般推薦用戶將邊緣的空白部分都裁剪掉,比如圖3所示的用戶操作后的狀態(tài)。
[0043]步驟S2.4:記錄縮放比例及操作后的圖片與空白區(qū)域之間的位置關(guān)系及比例關(guān)系O
[0044]優(yōu)選地,請結(jié)合圖6,對所接收的文字及圖片信息進(jìn)行排版并生成一定格式的文檔的步驟包括:
步驟S13.1:生成一定格式的空白文檔,比如Word或PDG等文檔。
[0045]步驟S13.2:根據(jù)所述位置關(guān)系及縮放比例在空白文檔的對應(yīng)位置輸出所述文字及圖片信息。具體地,根據(jù)位置關(guān)系將文字及圖片信息輸出在空白文檔的對應(yīng)位置處,再根據(jù)縮放比例調(diào)整圖片信息,以使圖片與縮放后的圖片大小保持一致。
[0046]步驟S13.3:根據(jù)所述比例關(guān)系調(diào)整文字信息的文字大小。具體地,可存儲一個表,該表記錄了多個上述比例關(guān)系與文字大小之間的對應(yīng)關(guān)系,如此,調(diào)整后變可使得顯示的文字信息的文字大小與調(diào)整后的圖片的基本一致。如此,進(jìn)過上述調(diào)整,文檔中顯示的文字及圖片信息的排版便與調(diào)整后的圖片在空白區(qū)域中的排版基本一致。
[0047]必須指出的是,本說明書中所指的圖片信息是表示拍攝圖片中除了文字及空白部分的圖畫/插圖。
[0048]必須指出的是,由于用戶拍攝的畫面可能只有文字,也可能文字及圖畫/圖都有,因此,本說明書中所指出的“接收服務(wù)器傳來的文字信息及圖片信息”是為了表示可以接收文字信息,也可以接收文字及圖片信息,并非意味接收文字信息一定伴隨著接收圖片信息。在所拍攝的圖片中僅有文字時,接收到的僅是文字信息。
[0049]需要說明的是,通過以上的實施例的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件加必需的硬件平臺的方式來實現(xiàn),當(dāng)然也可以全部通過硬件來實施?;谶@樣的理解,本發(fā)明的技術(shù)方案對【背景技術(shù)】做出貢獻(xiàn)的全部或者部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,所述計算機(jī)軟件產(chǎn)品可以存儲在存儲介質(zhì)中,如R0M/RAM、磁碟、光盤等,包括若干指令用以使得一臺計算機(jī)設(shè)備(可以是個人計算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例或者實施例的某些部分所述的方法。
[0050]以上所揭露的僅為本發(fā)明實施例中的較佳實施例而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范圍,因此依本發(fā)明權(quán)利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。
【權(quán)利要求】
1.一種識別裝置,用于與具有文字識別功能的服務(wù)器配合而進(jìn)行文字識別,其特征在于,該識別裝置包括: 拍攝模塊,用于對目標(biāo)畫面進(jìn)行拍攝并生成圖片; 發(fā)送模塊,用于向該服務(wù)器發(fā)送圖片; 接收模塊,用于接收該服務(wù)器根據(jù)該圖片識別出來的文字及圖片信息;及 排版模塊,用于對所接收的文字及圖片信息進(jìn)行排版并生成一定格式的文檔。
2.根據(jù)權(quán)利要求1所述的識別裝置,其特征在于,還包括處理模塊,其用于對該圖片的規(guī)格進(jìn)行處理。
3.根據(jù)權(quán)利要求2所述的識別裝置,其特征在于,該處理模塊包括: 圖片生成子模塊,用于生成特定大小的空白區(qū)域; 第一輸出子模塊,用于將圖片輸出在該空白區(qū)域; 操作響應(yīng)子模塊,用于響應(yīng)用戶對圖片的縮放、裁剪和/或移動的操作 '及 記錄子模塊,用于記錄縮放比例及操作后的圖片與空白區(qū)域之間的位置關(guān)系及比例關(guān)系O
4.根據(jù)權(quán)利要求3所述的識別裝置,其特征在于,該排版模塊包括: 文檔生成子模塊,用于生成一定格式的空白文檔; 第二輸出子模塊,用于根據(jù)所述位置關(guān)系及縮放比例在空白文檔的對應(yīng)位置輸出所述文字及圖片信息 '及 調(diào)整模塊,用于根據(jù)所述比例關(guān)系調(diào)整文字信息的文字大小。
5.一種文字識別方法,包括: 對目標(biāo)畫面進(jìn)行拍攝并生成圖片; 向具有文字識別功能的服務(wù)器發(fā)送圖片; 接收該服務(wù)器根據(jù)該圖片識別出來的文字及圖片信息;及 對所接收的文字及圖片信息進(jìn)行排版并生成一定格式的文檔。
6.根據(jù)權(quán)利要求5所述的文字識別方法,其特征在于,在所述對目標(biāo)畫面進(jìn)行拍攝并生成圖片的步驟之后還包括: 對圖片的規(guī)格進(jìn)行處理。
7.根據(jù)權(quán)利要求6所述的文字識別方法,其特征在于,所述對圖片的規(guī)格進(jìn)行處理的步驟包括: 生成特定大小的空白區(qū)域; 將圖片輸出在該空白區(qū)域; 響應(yīng)用戶對圖片的縮放、裁剪和/或移動的操作 '及 記錄縮放比例及操作后的圖片與空白區(qū)域之間的位置關(guān)系及比例關(guān)系。
8.根據(jù)權(quán)利要求7所述的文字識別方法,其特征在于,所述對所接收的文字及圖片信息進(jìn)行排版的步驟包括: 生成一定格式的空白文檔; 根據(jù)所述位置關(guān)系及縮放比例在空白文檔的對應(yīng)位置輸出所述文字及圖片信息;及 根據(jù)所述比例關(guān)系調(diào)整文字信息的文字大小。
9.一種文字識別系統(tǒng),包括如權(quán)利要求1至4任一項所述的識別裝置及所述服務(wù)器,該服務(wù)器包括: 服務(wù)器端接收模塊,用于接收該識別裝置發(fā)送過來的圖片; 文字識別模塊,用于對該圖片進(jìn)行光學(xué)字符識別,并生成對應(yīng)的文字信息及圖片信息;及 服務(wù)器端發(fā)送模塊,用于向該識別裝置發(fā)送該文字及圖片信息。
10.一種文字識別方法,包括: 對目標(biāo)畫面進(jìn)行拍攝并生成圖片; 向該服務(wù)器發(fā)送圖片; 服務(wù)器接收該圖片; 服務(wù)器對該圖片進(jìn)行光學(xué)字符識別,并生成對應(yīng)的文字信息及圖片信息; 服務(wù)器發(fā)送該文字及圖片信息; 接收該服務(wù)器傳來的文字及圖片信息; 對所接收的文字及圖片信息進(jìn)行排版并生成一定格式的文檔。
【文檔編號】G06F17/30GK103810485SQ201410028560
【公開日】2014年5月21日 申請日期:2014年1月22日 優(yōu)先權(quán)日:2014年1月22日
【發(fā)明者】詹建東 申請人:深圳市東信時代信息技術(shù)有限公司