欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種字符識別方法和裝置與流程

文檔序號:11216942閱讀:406來源:國知局
本申請涉及圖像識別
技術領域
:,特別是涉及一種字符識別方法和一種字符識別裝置。
背景技術
::近年來隨著計算機技術和數字圖像處理技術的飛速發(fā)展,圖片識別技術尤其是對于圖片中的數字、字母、特殊符號等字符進行識別的技術越來越多的在各個方面都有著較為廣泛的應用需求。對于識別圖片中的字符,目前存在的識別過程是:1、檢測到圖片中字符的位置;2、切分成包含單個字符的圖片數據;3、使用字符分類器識別各個圖片數據。其中,對于字符分類器,目前實現(xiàn)的方案主要包括以下兩種:1)首先提取圖片的特征,比如hog(histogramoforientedgradient,方向梯度直方圖)特征,然后使用svm(supportvectormachine,支持向量機)分類器、神經網絡分類器等訓練字符識別模型;2)利用卷積神經網絡(convolutionalneuralnetworks,cnn),訓練字符識別模型。然后利用訓練好的字符識別模型對輸入的圖片數據進行字符識別。但是在實際應用過程中,例如在圖片比較模糊或者圖片中包含的字符比較多的情況下,可能會導致檢測到的字符位置不夠準確,其中會存在一些噪聲,例如不是字符的斑點等被檢測為字符,進而造成切分成的圖片數據中存在一些包含噪聲的圖片數據,所以在利用分類器識別各個圖片數據之后,需要從中篩選出不是噪聲的輸出結果。以身份證識別為例,如圖1a,其是從一張身份證圖片的身份證號碼區(qū)域切分得到的單字圖。如圖1a,在圖片本身比較模糊的時候,定位號碼行會不是很準確,頭部或者尾部會多出來一些噪聲,造成切單字的時候,會切出來前邊的噪聲,導致切出來的單字大于18個,需要選取18個數字。針對上述的問題,已有的技術方案是增加一個識別“是不是字符”的cnn分類器。利用這個分類器,先排除不是數字的圖片數據,然后再利用“是何種字符”的字符分類器識別剩下的圖片數據,從剩下的圖片數據中識別具體的字符。但是該技術方案存在一定的缺點,如下:首先,增加一個分類器,其是先后進行計算,意味著同時增加了計算時間,影響運行效率;其次,在實際操作中,如果增加的用以識別“是不是數字”的cnn分類器的計算結果出現(xiàn)錯誤,則不管后續(xù)的字符識別模型是否會出現(xiàn)問題,整個識別過程都會不可避免地發(fā)生錯誤,降低了字符識別的準確性。技術實現(xiàn)要素:鑒于上述問題,提出了本申請實施例以便提供一種克服上述問題或者至少部分地解決上述問題的一種字符識別方法和相應的一種字符識別裝置。為了解決上述問題,本申請公開了一種字符識別方法,其特征在于,包括:獲取圖片數據;利用第一分類器和第二分類器共享的計算層對所述圖片數據進行計算,得到第一結果;所述第一分類器為從圖片數據中識別具體字符的分類器;所述第二分類器為識別圖片數據是否為字符圖片的分類器;將所述第一結果帶入第一分類器中除共享的計算層之外剩余的計算層進行計算,得到對應各字符的第一概率;將所述第一結果帶入第二分類器中除共享的計算層之外剩余的計算層進行計算,得到第二概率;根據所述第一概率和第二概率,計算所述圖片數據識別為各個字符的置信度;根據置信度,輸出字符的識別結果。優(yōu)選地,還包括:利用字符圖片樣本訓練第一分類器的各計算層的參數值;所述第一分類 器包括前n層計算層和后m層計算層;固定第二分類器的前n層計算層的參數為第一分類器的前n層計算層的參數,并利用非字符圖片樣本和字符圖片樣本訓練第二分類器的后l層的參數值。優(yōu)選地,所述第一分類器和第二分類器共享的計算層包括:卷積層、或者卷積層和至少一層全連接層。優(yōu)選地,所述字符為數字。優(yōu)選地,所述獲取圖片數據的步驟,包括:從身份證明的圖片的號碼區(qū)域,切分各個圖片數據。優(yōu)選地,所述根據所述第一概率和第二概率,計算所述圖片數據識別為各個字符的置信度的步驟包括:將最大的第一概率與第二概率相乘,得到所述圖片數據為最大的第一概率對應的數字的置信度。優(yōu)選地,所述根據置信度,輸出字符的識別結果的步驟,包括:從各個圖片數據中,選擇排序靠前的符合所述身份證規(guī)定個數的圖片所對應的數字,并按序輸出。本申請還公開了一種字符識別裝置,其特征在于,包括:圖片獲取模塊,適于獲取圖片數據;第一結果計算模塊,適于利用第一分類器和第二分類器共享的計算層對所述圖片數據進行計算,得到第一結果;所述第一分類器為從圖片數據中識別具體字符的分類器;所述第二分類器為識別圖片數據是否為字符圖片的分類器;第一概率計算模塊,適于將所述第一結果帶入第一分類器中除共享的計算層之外剩余的計算層進行計算,得到對應各字符的第一概率;第二概率計算模塊,適于將所述第一結果帶入第二分類器中除共享的計算層之外剩余的計算層進行計算,得到第二概率;置信度計算模塊,適于根據所述第一概率和第二概率,計算所述圖片數據識別為各個字符的置信度;輸出模塊,適于根據置信度,輸出字符的識別結果。優(yōu)選地,還包括:第一分類器訓練模塊,適于利用字符圖片樣本訓練第一分類器的各計算層的參數值;所述第一分類器包括前n層計算層和后m層計算層;第二分類器訓練模塊,適于固定第二分類器的前n層計算層的參數為第一分類器的前n層計算層的參數,并利用非字符圖片樣本和字符圖片樣本訓練第二分類器的后l層的參數值。優(yōu)選地,所述第一分類器和第二分類器共享的計算層包括:卷積層、或者卷積層和至少一層全連接層。優(yōu)選地,所述字符為數字。優(yōu)選地,所述圖片獲取模塊,包括:圖片切分子模塊,適于從身份證明的圖片的號碼區(qū)域,切分各個圖片數據。優(yōu)選地,所述置信度計算模塊,包括:置信度計算子模塊,適于將最大的第一概率與第二概率相乘,得到所述圖片數據為最大的第一概率對應的數字的置信度。優(yōu)選地,所述輸出模塊,包括:輸出子模塊,適于從各個圖片數據中,選擇排序靠前的符合所述身份證規(guī)定個數的圖片所對應的數字,并按序輸出。本申請實施例包括以下優(yōu)點:本申請實施例,在獲取圖片數據之后利用第一分類器和第二分類器共享的計算層對所述圖片數據進行計算,得到第一結果;然后分別將第一結果帶入第一分類器中除共享的計算層之外剩余的計算層進行計算,得到對應各字符的第一概率;將所述第一結果帶入第二分類器中除共享的計算層之外剩余的計算層進行計算,得到第二概率;進而根據第一概率和第二概率,計算所述圖片數據識別為各個字符的置信度;最后根據置信度,輸出字符的識別結果。其中,第二分類器時與第一分類器共享一部分計算層的,對于第二分類 器與第一分類器共享的計算層,其計算過程以及計算結果也是共享的,所以相對于
背景技術
:在字符分類器之前增加一個完整的“是不是字符”分類器,然后按序對圖片進行計算的過程,本申請相對增加的計算量比較少,降低了計算時間,相對于
背景技術
:提高了字符識別的效率。另外,第二分類器與第一分類器并不是前后順序使用,而是將兩個分類器分別得到的概率值相乘得到一個置信度,然后根據置信度值輸出相應的識別結果,相對于
背景技術
:提高了字符識別的準確率,不會因為“是不是字符”分類器出現(xiàn)問題,而對整個識別過程產生太大的影響。附圖說明圖1是本申請的一種字符識別方法實施例的步驟流程圖;圖1a是本申請的一種身份證號碼示意圖;圖1b是本申請的一種第一分類器和第二分類器的示意圖;圖2本申請的一種字符識別方法實施例的步驟流程圖;圖3是本申請的一種字符識別裝置實施例的結構框圖;以及圖4是本申請的一種字符識別裝置實施例的結構框圖。具體實施方式為使本申請的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結合附圖和具體實施方式對本申請作進一步詳細的說明。本申請實施例的核心構思之一在于,在獲取圖片數據之后利用第一分類器和第二分類器共享的計算層對所述圖片數據進行計算,得到第一結果;然后分別將第一結果帶入第一分類器中除共享的計算層之外剩余的計算層進行計算,得到對應各字符的第一概率;將所述第一結果帶入第二分類器中除共享的計算層之外剩余的計算層進行計算,得到第二概率;進而根據第一概率和第二概率,計算所述圖片數據識別為各個字符的置信度;最后根據置信度,輸出字符的識別結果。本申請使從圖片數據中識別具體字符的第一分類器和識別圖片數據是否為字符圖片的分類器的第二分類器可以共享部分計算層數據,從而在計算時可以同時對圖片數據,并且計算過程存在重合,降 低計算量,提高計算準確度,并且通過兩個分類器計算結果一起對圖片進行識別,提高準確率,降低第二分類器出現(xiàn)問題對整個識別過程的影響。實施例一參照圖1,示出了本申請的一種字符識別方法實施例的步驟流程圖,具體可以包括如下步驟:步驟110,獲取圖片數據。本申請介紹的是一種針對圖片的字符識別方法,首先需要獲取所要識別的圖片數據。圖片是指由圖形、圖像等構成的平面媒體。本申請所述的圖片數據是數字圖片,數字圖片常用的存儲格式很多,例如bmp(bitmap,標準圖像文件格式)、tiff(taggedimagefileformat,位圖圖像格式)、jpeg(jointphotographicexpertsgroup,聯(lián)合圖像專家小組)、gif(graphicsinterchangeformat,圖像互換格式)、psd(photoshop專用格式)、pdf(portabledocumentformat,可移植文件格式)等格式。但是本申請對于具體的數字圖片的存儲格式不加以限定。在本申請實施例中,還可以對步驟110獲取的圖片數據進行預處理,比如將上述圖片數據進行灰度化,那么可以將彩色的圖片數據變成灰度的圖片數據,從而可以降低計算量。步驟120,利用第一分類器和第二分類器共享的計算層對所述圖片數據進行計算,得到第一結果;所述第一分類器為從圖片數據中識別具體字符的分類器;所述第二分類器為識別圖片數據是否為字符圖片的分類器。為了降低識別錯誤的可能性,本申請利用兩個分類器完成對圖片數據的識別,其中第一分類器用以從圖片數據中識別具體字符,第二分類器用以識別圖片數據是否為字符圖片。同時為了降低識別的時間成本,提高識別的效率以及準確率所以第一分類器和第二分類器共用一部分計算層。在本申請實施例中,所述具體字符比如0~9的阿拉伯數字,又比如希臘字符α、β、γ等字符,也可以為其他字符,具體可以根據實際需求設定。相應的模型也可以根據相應字符的相應確定。第一分類器和第二分類器都可以采用卷積神經網絡(convolutionalneuralnetworks,cnn)分類模型。卷積神經網絡分類模型包括至少一個卷積層、至少一個全連接層、以及一個softmax層。如圖1b為一個第一分類器和第二分類器的示意圖。其中,卷積層a、卷積層b、全連接層c、全連接層d、softmax層以及數字分類器構成了第一分類器,而卷積層a、卷積層b、全連接層c、全連接層e、softmax層以及是不是數字分類器構成了第二分類器??梢?,此時第一分類器和第二分類器共享的計算層為卷積層a、卷積層b以及全連接層c,第一分類器和第二分類器不共享的是一個全連接層和一個softmax層。在圖1b中,第一分類器和第二分類器都包含兩個卷積層、兩個全連接層以及一個softmax層。但是,在實際應用中,可以根據需求靈活設定第一分類器和第二分類器所包含的卷積層以及全連接層的具體數量,對此本申請實施例不加以限定。在本申請實施例中,可以先利用相應字符的圖片數據樣本,訓練第一分類器。比如,利用0~9的數字圖片樣本,訓練“是何種數字”的第一分類器。訓練第一分類器時,實際上是訓練該分類器的各個計算層的參數值。那么本申請實施例在訓練了第一分類器后,可以固定前面部分計算層的參數,比如固定所有卷積層的參數,然后利用不是數字的圖片數據樣本和是數字的圖片數據樣本,在固定了卷積層的參數值的情況下,訓練后續(xù)計算層的參數值。如此第二分類器與第一分類器則共享了參數值相同的計算層。在本申請實施例中,最優(yōu)的情況是共享卷積層,和除最后一層全連接層之前的全連接層。如此可以降低計算量,也可以提高準確度。其中,卷積層的計算過程如下:假設輸入的圖片數據的維度為c×n×n,卷積層的卷積核(kernel)的大小是m×m。其中,c表示圖片數據的r(red,紅色)、g(green、綠色)、b(blue、藍色)三通道,n×n的前后兩個n分別表示圖片數據在橫向方向上的像素大小與縱向方向上的像素大小,根據輸入圖像數據的不同,前后兩個n的值可以不同,也可以相同,對此本發(fā)明實施例不加以限定。對于卷積核的大小m×m,前后兩個m的值也可以相同或者不同,對此本發(fā)明實施例 也不加以限定。需要說明的是,兩個m中的較大值應該小于兩個n中的較小值。則經過卷積層后,輸出值為:其中,k,i,j表示輸出值的坐標,k對應于圖片數據的r、g、b三通道,i對應于圖片數據在橫向方向上的像素點位置,j對應于圖片數據在縱向方向上的像素位置。w是卷積層的參數值,x是輸入值,y是輸出值。在本申請實施例中,w是已知的參數,可以通過預先的對卷積層訓練獲得。在本申請實施例中,對于每個卷積層,可以有多個卷積核,例如卷積核的個數可以與輸入圖片數據除了在橫向方向上像素大小以及在縱向方向上的像素大小之外的維度一致,例如前述圖片數據的三維矩陣c×n×n中的c,因為c代表圖片數據r、g、b三通道,所以此時卷積層可以有3個如前述的m×m的卷積核,則此時由該卷積層的卷積核構成的3×m×m的三維矩陣,即為該卷基層的卷積矩陣。在具體運算過程中,每個卷積核m×m與輸入圖片數據的三維矩陣c×n×n進行卷積,得到一個二維矩陣。例如:第一個卷積核m×m與c為r通道時的圖片數據卷積,得到一個二維矩陣;第二個卷積核m×m與c為g通道時的圖片數據卷積,得到一個二維矩陣;第三個卷積核m×m與c為b通道時的圖片數據卷積,得到一個二維矩陣;將三個卷積核卷積得出的三個二維矩陣構成一個三維的矩陣,這個三維的矩陣就是公式(1)所示的卷積層的輸出結果。全連接層的計算公式如下:假設輸入數據的維度為n,則經過全連接層后,輸出值為:其中,σ(*)為sigmoid函數,w為全連接層的參數。softmax層的計算公式如下:其中,x為輸入值,j表示每一個類別,y表示類別標簽,θ為softmax層的參數,e為常量。以數字為例y的類別包括0,1,2……9。那么該公式可以計算數字圖片數據對應0、1、2……9這9個數字的概率。由上述分析以及圖1b知,在將獲取的圖片數據輸入之后,第一分類器和第一分類器共享的計算層的計算過程是一致的,因此在經過第一分類器和第一分類器共享的計算層之后,獲取的第一結果也是一致的,而后,對于第一分類器和第一分類器不共享的計算層,如圖1b中的全連接層d和全連接層e,是將第一結果分別作為第一分類器和第一分類器不共享的計算層的輸入,此時,第一分類器和第一分類器不共享的計算層的計算過程不相同。所以在本申請實施例中,先利用第一分類器和第二分類器共享的計算層對所述圖片數據進行計算,得到第一結果。在本申請另一個優(yōu)選的實施例中,在步驟120之前,還包括:步驟s11,利用字符圖片樣本訓練第一分類器的各計算層的參數值;所述第一分類器包括前n層計算層和后m層計算層。因為第一分類器和第二分類器中的參數可能為未知的,或者是為了進一步提高兩者的準確度,在本申請實施例中,在利用第一分類器以及第二分類器分別執(zhí)行計算過程之前,需要先訓練第一分類器以及第二分類器中的參數。因為第一分類器和第二分類器最終計算的概率本質上是不同的,所以對于第一分類器的訓練不需要考慮圖片數據不是字符的情況,所以在本申請實施例中,可以首先利用字符圖片樣本訓練第一分類器的各計算層的參數值。其中,第一分類器包括前n層計算層和后m層計算層,其前n層計算層是與第二分類器共享的計算層,后m層計算層則是不與第二分類器共享的計算層。在本申請實施例中,可以利用至少一個字符圖片樣本訓練第一分類器,其中的字符圖片樣本是指已經明確識別出字符的字符圖片樣本,字符圖片樣本包括的字符種類應該大于設定的第一分類器和第二分類器可識別的字符種類。所以可知,對應于字符圖片樣本,其識別為自身對應的字符的概率為1,為其他字符的概率都為0。此時,可以將字符圖片樣本作為第一分類器的輸入,將字符圖片樣本的概率為0的分類以及概率為1的分類作為理想輸出,對第一分類器的參數進行訓練。訓練過程主要包括四步,這四步被分為兩個階段:第一階段,向前傳播階段:(1)、選擇一個字符圖片樣本,輸入第一分類器;(2)、計算相應的實際輸出;在此階段,第一分類器會隨機生成初始參數,字符圖片數據從輸入層經過逐級的變換,傳送到輸出層。這個過程也是第一分類器在完成訓練后正常執(zhí)行時執(zhí)行的過程。第二階段,向后傳播階段:(1)、計算實際輸出與相應的理想輸出的差;(2)、按極小化誤差的方法調整參數。這兩個階段的工作一般應受到精度要求的控制,精度要求可以根據需求靈活設定,對此本申請不加以限定。對于第一分類器的訓練,實際上是訓練各個卷積層對應的公式(1)中的參數w,各全連接層對應的公式(2)中的參數w,以及softmax層中的參數θ。其中,不同的卷積層的公式(1)的w不同,不同的全連接層的公式(2)的w不同.步驟s12,固定第二分類器的前n層計算層的參數為第一分類器的前n層計算層的參數,并利用非字符圖片樣本和字符圖片樣本訓練第二分類器的后l層的參數值。因為第二分類器的前n層計算層是與第一分類器的前n層計算層共享的,所以在確定了第一分類器的前n層計算層的參數之后,那么此時相當于第二分類器的前n層計算層的參數也一樣確定了,可以只訓練第二分類器的 后l層的參數值,其中l(wèi)與m可以相同,也可以不同,對此本申請不加以限定。因為第二分類器時計算輸入圖片數據為字符圖片的概率,所以在對其訓練的過程還需要考慮非字符圖片的情況,所以,在申請實施例中,可以利用至少一個非字符圖片樣本和至少一個字符圖片樣本訓練第二分類器的后l層計算層的參數值。對于非字符圖片樣本,其是字符圖片的概率為0,不是字符圖片的概率為1;而對于字符圖片樣本,其是字符圖片的概率為1,不是字符圖片的概率為0。此時,可以將各字符圖片樣本作為第二分類器的輸入,將概率為1作為理想輸出;將各非字符圖片樣本作為第二分類器的輸入,將概率為0作為理想輸出;對第二分類器的參數進行訓練。具體的訓練過程,與步驟s11第一分類器的訓練過程類似,同樣主要包括四步,這四步被分為兩個階段:第一階段,向前傳播階段:(1)、選擇一個字符圖片樣本或者非字符圖片樣本,輸入第一分類器;(2)、計算相應的實際輸出;在此階段,第一分類器會隨機生成初始參數,字符圖片數據或者非字符圖片數據從輸入層經過逐級的變換,傳送到輸出層。這個過程也是第二分類器在完成訓練后正常執(zhí)行時執(zhí)行的過程。第二階段,向后傳播階段:(1)、計算實際輸出與相應的理想輸出的差;(2)、按極小化誤差的方法調整參數。這兩個階段的工作一般也應受到精度要求的控制,第二分類器器的精度要求同樣可以根據需求靈活設定,對此本申請不加以限定。需要說明的是,在本申請的另一優(yōu)選地實施例中,也可以先利用非字符圖片樣本和字符圖片樣本訓練第二分類器的前n層計算層和后l層計算層的參數值,然后固定第一分類器的前n層計算層的參數為第二分類器的前n層計算層的參數,并利用字符圖片樣本訓練第一分類器的后m層計算層的參數值。對于第二分類器的訓練,如果與第一分類器共享卷積層,則其各卷積層的公式(1)的參數由步驟s11確定;然后實際上利用前述(字符圖片數據樣本+非字符圖片數據樣本)訓練各全連接層對應的公式(2)中的參數w,以及softmax層中的參數θ。如果如果與第一分類器共享卷積層+部分全連接層,當然共享的全連接層是按照參數的輸入順序共享,即共享排序靠前的全連接層,那么其各卷積層的公式(1)的參數由步驟s11確定,其共享部分的全連接層的公式(2)中的參數w也由步驟s11確定。然后利用前述(字符圖片數據樣本+非字符圖片數據樣本)訓練剩余的未共享的全連接層對應的公式(2)中的參數w,以及softmax層中的參數θ。步驟130,將所述第一結果帶入第一分類器中除共享的計算層之外剩余的計算層進行計算,得到對應各字符的第一概率。第一分類器是用以從圖片數據中識別具體字符的分類器,將經步驟120得到的第一結果帶入第一分類器中除共享的計算層之外剩余的計算層進行計算,即可以得到圖片數據可能為各字符的第一概率。例如將第一結果作為輸入值帶入圖1b所示的第一分類器中的全連接層d以及softmax層1組成的整體,即可以得到對應各字符的第一概率。其中,圖片數據對應的字符可以為0到9之間的阿拉伯數字,也可以為大寫字符a到z之間以及小寫字母a到z之間的52個英文字符,或者是標點符號、特殊符號、漢字、羅馬字符等等在圖片數據中可能出現(xiàn)的字符類型中一種或多種字符。在本申請實施例中,所對應的具體字符種類可以根據需求設定,對此本發(fā)明實施例中不加以限定。在softmax層,如果已經設定可能的字符種類,則利用softmax層的分類算法,即可以算出輸入的圖片數據可能為各個字符的概率,即為其對應各字符的第一概率。步驟140,將所述第一結果帶入第二分類器中除共享的計算層之外剩余的計算層進行計算,得到第二概率。第二分類器是用以識別圖片數據是否為字符圖片的分類器,將經步驟 120得到的第一結果帶入第二分類器中除共享的計算層之外剩余的計算層進行計算,即可以得到圖片數據為字符圖片的第二概率。例如將第一結果作為輸入值帶入圖1b所示的第二分類器中的全連接層e以及softmax層2組成的整體,即可以得到對應各字符的第二概率。第二分類器得到的第二概率是圖片數據為字符圖片的概率,其中字符圖片所對應的字符同樣可能為步驟130所述的各種字符類型,可以根據需求設定,但是需要說明的是,第一分類器對應的字符種類與第二分類器對應的字符種類可以是一致的,或者第二分類器對應的字符種類包含第一分類器對應的字符種類,對此本發(fā)明實施例不加以限定。但是相對而言,對于第一分類器對應的字符種類與第二分類器對應的字符種類一致的情況,最終識別字符的效率以及準確度會更高。對于第二分類器而言,字符圖片是指包含設定的字符類型的圖片,計算圖片數據為字符圖片的概率是指計算圖片數據為包含設定的字符類型的圖片的概率,得到的結果即為第二概率。第二分類器也是利用其自身的softmax層計算第二概率,如果已經設定可能的字符種類,則利用softmax層的分類算法,即可以算出輸入的圖片數據可能為字符圖片的概率,即為其對應各字符的第一概率。需要說明的是,因為第一分類器和第二分類器計算得到的第一概率和第二概率的本質不相同,所以第一分類器和第二分類器除了共享的計算層之外剩余的計算層,尤其是softmax層的參數以及結構并不一定相同。步驟150,根據所述第一概率和第二概率,計算所述圖片數據識別為各個字符的置信度。如前述,第一概率是指圖片數據可能為各個字符的概率,而第二概率是指圖片數據可能為字符圖片的概率,可知,對于一個圖片數據而言,其第一概率的個數是與設定的字符種類相對應的,第一概率的個數等同于字符種類的個數,至少為一個,而對應輸入一個圖片數據,得到的第二概率只能為一個。此時,根據圖像數據的第一概率和第二概率,可以計算該圖片數據可以識別為各個字符的置信度。例如,可以通過分別將圖像數據對應于各個字符的第一概率與該圖片數據的第二概率相乘,得到該圖片數據識別為各個字符 的置信度。例如若要識別一個圖片數據是否為0到9之間的阿拉伯數字,則經過第一分類器可以得到十個第一概率,分別對應于該圖片數據為0到9之間的阿拉伯數字的概率,例如第一概率p0是指該圖片數據為字符0的概率,第一概率p1是指該圖片數據為字符1的概率,第一概率p9是指該圖片數據為字符9的概率,等等。而經過第二分類器只能得到一個第二概率,即為該圖片數據滿足設定的條件,例如為阿拉伯數字的概率s。此時,將p0與s相乘,得到的即為該圖片數據識別為字符0的置信度,而將p9與s相乘,得到的即為該圖片數據識別為字符9的置信度。步驟160,根據置信度,輸出字符的識別結果。在本申請實施例中,可以根據計算出來的圖片數據識別為各個字符的置信度,輸出其中對應置信度最高的字符作為識別結果輸出。例如,步驟150中所述的識別一個圖片數據是否為0到9之間的阿拉伯數字,若最終計算得到的對應各個字符的置信度中,p9與s相乘得到的置信度最大,則可以將字符9作為識別結果輸出。在本申請實施例中,在獲取圖片數據之后利用第一分類器和第二分類器共享的計算層對所述圖片數據進行計算,得到第一結果;然后分別將第一結果帶入第一分類器中除共享的計算層之外剩余的計算層進行計算,得到對應各字符的第一概率;將所述第一結果帶入第二分類器中除共享的計算層之外剩余的計算層進行計算,得到第二概率;進而根據第一概率和第二概率,計算所述圖片數據識別為各個字符的置信度;最后根據置信度,輸出字符的識別結果。其中,第二分類器時與第一分類器共享一部分計算層的,對于第二分類器與第一分類器共享的計算層,其計算過程以及計算結果也是共享的,所以相對于
背景技術
:在字符分類器之前增加一個完整的“是不是字符”分類器,然后按序對圖片進行計算的過程,本申請相對增加的計算量比較少,降低了計算時間,相對于
背景技術
:提高了字符識別的效率。另外,第二分類器與第一分類器并不是前后順序使用,而是將兩個分類 器分別得到的概率值相乘得到一個置信度,然后根據置信度值輸出相應的識別結果,相對于
背景技術
:提高了字符識別的準確率,不會因為“是不是字符”分類器出現(xiàn)問題,而對整個識別過程產生太大的影響。實施例二參照圖2,示出了本申請的一種字符識別方法實施例的步驟流程圖,具體可以包括如下步驟:步驟210,從身份證明的圖片的號碼區(qū)域,切分各個圖片數據。在本申請實施例中,是對身份證明的圖片進行號碼識別,因為身份證明的圖片中可能包含多個號碼,例如身份證號碼,所以為了識別的方便,首先需要從身份證明的圖片的號碼區(qū)域,切分各個圖片數據,如圖1a,切分得到多個圖片數據。例如將身份證號碼所在的區(qū)域按序切分成只包含一位號碼的圖片數據,對于具體的切分方法,屬于本領域的公知技術,對此本申請實施例不加以贅述。步驟220,利用第一分類器和第二分類器共享的計算層對所述圖片數據進行計算,得到第一結果;所述第一分類器為從圖片數據中識別具體字符的分類器;所述第二分類器為識別圖片數據是否為字符圖片的分類器。在本申請的另一個優(yōu)選的實施例中,所述第一分類器和第二分類器共享的計算層包括:卷積層、或者卷積層和至少一層全連接層。在本申請的另一個優(yōu)選的實施例中,所述字符為數字。此時,第一分類器是計算輸入圖片數據分別為0到9之間任一數字的概率,第二分類器是計算輸入圖片數據可識別為數字的概率。步驟230,將所述第一結果帶入第一分類器中除共享的計算層之外剩余的計算層進行計算,得到對應各字符的第一概率。步驟240,將所述第一結果帶入第二分類器中除共享的計算層之外剩余的計算層進行計算,得到第二概率。步驟250,將最大的第一概率與第二概率相乘,得到所述圖片數據為最大的第一概率對應的數字的置信度。其中最大的第一概率即為輸入圖片數據最可能為的數字對應的第一概 率,將最大的第一概率與第二概率相乘,即可以得到輸入的圖片數據為最大的第一概率對應的數字的置信度。步驟260,從各個圖片數據中,選擇排序靠前的符合所述身份證規(guī)定個數的圖片所對應的數字,并按序輸出。由于對切分得到的各個圖片都有對應數字0~9概率,而圖1b切分的圖片按身份證的撰寫習慣,從左端至右端切分的排列的多個圖片。那么本申請則確定各張圖片對應0~9中最大的概率,然后從排列好的圖片中以每張圖片最大的概率選擇概率最靠前的18張圖片,然后將相應概率數字圖片的排序組合,即得到身份證號碼。當然,在本申請實施例中,圖片的排序在步驟210切圖時,可以對圖片進行標注以記錄。例如,對于圖1a所示的身份證號碼進行字符識別,首先將其切分為多個字符數據,按照撰寫習慣,可以從左端到右端對其進行切分成互不相連的22個圖片數據,依次分別為a1到a22,然后利用第一分類器和第二分類器,計算各圖片數據對應最大的概率數字的置信度,并按照置信度從高到低的順序選擇18個圖片數據及18個圖片數據對應最大概率的數字,假設選擇出的圖片數據按該圖片中各數字的最大的照置信度從高到低的順序分別為:a5:(0.95,2)、a6:(0.94,0)、a12:(0.93,8)、a15:(0.92,9)、a11:(0.92,9)、a13:(0.90,9)、a16:(0.90,2)、a4:(0.89,4)、a10(0.89,1)、a14:(0.88,0),a7:(0.87,9)、a17:(0.86,6)、a8:(0.85,2)、a18:(0.84,5)、a9:(0.84,1)、a19:(0.83,1),a20:(0.81,3)、a21:(0.80,8),a2(0.1,8),a1(0.1,9),a22(0.09,0),a3(0.09,0)但是在輸出的過程中,仍然是按照最初切分時候的先后順序,輸出順序為:a4、a5、a6、a7、a8、a9、a10、a11、a12、a13、a14、a15、a16、a17、a18、a19、a20、a21,則輸出的數字序列為420921198909265138對于身份證明的圖片的號碼區(qū)域,可以切分為多個圖片數據,依次分別利用第一分類器和第二分類器,執(zhí)行上述的步驟220-250,計算各個圖片數據置信度,并分別按序輸出各第一概率對應的數字,從而實現(xiàn)了對身份證明 的號碼,例如身份證號碼的數字識別。在本申請實施例中,同樣在獲取圖片數據之后利用第一分類器和第二分類器共享的計算層對所述圖片數據進行計算,得到第一結果;然后分別將第一結果帶入第一分類器中除共享的計算層之外剩余的計算層進行計算,得到對應各字符的第一概率;將所述第一結果帶入第二分類器中除共享的計算層之外剩余的計算層進行計算,得到第二概率;進而根據第一概率和第二概率,計算所述圖片數據識別為各個字符的置信度;最后根據置信度,輸出字符的識別結果。進而相對于
背景技術
:提高了字符識別的效率以及準確率。另外,本申請在對第一分類器和第二分類器進行訓練的過程中,可以先訓練其中一個分類器,然后將第一分類器和第二分類器共享的計算層固定,繼續(xù)訓練另一個分類器未被訓練的計算層,相對于
背景技術
:,降低了訓練的工作量,也提高了對第一分類器和第二分類器訓練的效率。進一步提高了字符識別的效率以及準確率。需要說明的是,對于方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領域技術人員應該知悉,本申請實施例并不受所描述的動作順序的限制,因為依據本申請實施例,某些步驟可以采用其他順序或者同時進行。其次,本領域技術人員也應該知悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作并不一定是本申請實施例所必須的。實施例三參照圖3,示出了本申請的一種字符識別裝置實施例的結構框圖,具體可以包括如下模塊:圖片獲取模塊310,適于獲取圖片數據。第一結果計算模塊320,適于利用第一分類器和第二分類器共享的計算層對所述圖片數據進行計算,得到第一結果;所述第一分類器為從圖片數據中識別具體字符的分類器;所述第二分類器為識別圖片數據是否為字符圖片的分類器。第一概率計算模塊330,適于將所述第一結果帶入第一分類器中除共享的計算層之外剩余的計算層進行計算,得到對應各字符的第一概率。第二概率計算模塊340,適于將所述第一結果帶入第二分類器中除共享的計算層之外剩余的計算層進行計算,得到第二概率。置信度計算模塊350,適于根據所述第一概率和第二概率,計算所述圖片數據識別為各個字符的置信度。輸出模塊360,適于根據置信度,輸出字符的識別結果。在本申請的又一個優(yōu)選地實施例中,在第一結果計算模塊320之前,還包括:第一分類器訓練模塊370,適于利用字符圖片樣本訓練第一分類器的各計算層的參數值;所述第一分類器包括前n層計算層和后m層計算層。在本申請的又一個優(yōu)選地實施例中,在第二概率計算模塊340之前,還包括:第二分類器訓練模塊380,適于固定第二分類器的前n層計算層的參數為第一分類器的前n層計算層的參數,并利用非字符圖片樣本和字符圖片樣本訓練第二分類器的后l層的參數值。在本申請實施例中,在獲取圖片數據之后利用第一分類器和第二分類器共享的計算層對所述圖片數據進行計算,得到第一結果;然后分別將第一結果帶入第一分類器中除共享的計算層之外剩余的計算層進行計算,得到對應各字符的第一概率;將所述第一結果帶入第二分類器中除共享的計算層之外剩余的計算層進行計算,得到第二概率;進而根據第一概率和第二概率,計算所述圖片數據識別為各個字符的置信度;最后根據置信度,輸出字符的識別結果。其中,第二分類器時與第一分類器共享一部分計算層的,對于第二分類器與第一分類器共享的計算層,其計算過程以及計算結果也是共享的,所以相對于
背景技術
:增加一個完整的分類器,本申請相對增加的計算量比較少,相對于
背景技術
:提高了字符識別的效率。另外,第二分類器與第一分類器并不是前后順序使用,而是將兩個分類器分別得到的概率值相乘得到一個置信度,然后根據置信度值輸出相應的識別結果,相對于
背景技術
:提高了字符識別的準確率。實施例四參照圖4,示出了本申請的一種字符識別裝置實施例的結構框圖,具體可以包括如下模塊:圖片獲取模塊410,適于獲取圖片數據。具體包括:圖片切分子模塊411,適于從身份證明的圖片的號碼區(qū)域,切分各個圖片數據。第一結果計算模塊420,適于利用第一分類器和第二分類器共享的計算層對所述圖片數據進行計算,得到第一結果;所述第一分類器為從圖片數據中識別具體字符的分類器;所述第二分類器為識別圖片數據是否為字符圖片的分類器。第一概率計算模塊430,適于將所述第一結果帶入第一分類器中除共享的計算層之外剩余的計算層進行計算,得到對應各字符的第一概率。第二概率計算模塊440,適于將所述第一結果帶入第二分類器中除共享的計算層之外剩余的計算層進行計算,得到第二概率。置信度計算模塊450,適于根據所述第一概率和第二概率,計算所述圖片數據識別為各個字符的置信度。具體包括:置信度計算子模塊451,適于將最大的第一概率與第二概率相乘,得到所述圖片數據為最大的第一概率對應的數字的置信度。輸出模塊460,適于根據置信度,輸出字符的識別結果。具體包括:輸出子模塊461,適于從各個圖片數據中,選擇排序靠前的符合所述身份證規(guī)定個數的圖片所對應的數字,并按序輸出。在本申請實施例中,同樣在獲取圖片數據之后利用第一分類器和第二分類器共享的計算層對所述圖片數據進行計算,得到第一結果;然后分別將第一結果帶入第一分類器中除共享的計算層之外剩余的計算層進行計算,得到對應各字符的第一概率;將所述第一結果帶入第二分類器中除共享的計算層之外剩余的計算層進行計算,得到第二概率;進而根據第一概率和第二概率,計算所述圖片數據識別為各個字符的置信度;最后根據置信度,輸出字符的識別結果。進而相對于
背景技術
:提高了字符識別的效率以及準確率。另外,本申請在對第一分類器和第二分類器進行訓練的過程中,可以先訓練其中一個分類器,然后將第一分類器和第二分類器共享的計算層固定,繼續(xù)訓練另一個分類器未被訓練的計算層,相對于
背景技術
:,降低了訓練的工作量,也提高了對第一分類器和第二分類器訓練的效率。進一步提高了字符識別的效率以及準確率。對于裝置實施例而言,由于其與方法實施例基本相似,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。本說明書中的各個實施例均采用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。本領域內的技術人員應明白,本申請實施例的實施例可提供為方法、裝置、或計算機程序產品。因此,本申請實施例可采用完全硬件實施例、完全軟件實施例、或結合軟件和硬件方面的實施例的形式。而且,本申請實施例可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(包括但不限于磁盤存儲器、cd-rom、光學存儲器等)上實施的計算機程序產品的形式。在一個典型的配置中,所述計算機設備包括一個或多個處理器(cpu)、輸入/輸出接口、網絡接口和內存。內存可能包括計算機可讀介質中的非永久性存儲器,隨機存取存儲器(ram)和/或非易失性內存等形式,如只讀存儲器(rom)或閃存(flashram)。內存是計算機可讀介質的示例。計算機可讀介質包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現(xiàn)信息存儲。信息可以是計算機可讀指令、數據結構、程序的模塊或其他數據。計算機的存儲介質的例子包括,但不限于相變內存(pram)、靜態(tài)隨機存取存儲器(sram)、動態(tài)隨機存取存儲器(dram)、其他類型的隨機存取存儲器(ram)、只讀存儲器(rom)、電可擦除可編程只讀存儲器(eeprom)、快閃記憶體或其他內存技術、只讀光盤只讀存儲器(cd-rom)、字符多功能光盤(dvd)或其他光學存儲、磁盒式磁帶,磁帶磁磁盤存儲或其他磁性存儲設備或任何其 他非傳輸介質,可用于存儲可以被計算設備訪問的信息。按照本文中的界定,計算機可讀介質不包括非持續(xù)性的電腦可讀媒體(transitorymedia),如調制的數據信號和載波。本申請實施例是參照根據本申請實施例的方法、終端設備(系統(tǒng))、和計算機程序產品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合??商峁┻@些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數據處理終端設備的處理器以產生一個機器,使得通過計算機或其他可編程數據處理終端設備的處理器執(zhí)行的指令產生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。這些計算機程序指令也可存儲在能引導計算機或其他可編程數據處理終端設備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。這些計算機程序指令也可裝載到計算機或其他可編程數據處理終端設備上,使得在計算機或其他可編程終端設備上執(zhí)行一系列操作步驟以產生計算機實現(xiàn)的處理,從而在計算機或其他可編程終端設備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。盡管已描述了本申請實施例的優(yōu)選實施例,但本領域內的技術人員一旦得知了基本創(chuàng)造性概念,則可對這些實施例做出另外的變更和修改。所以,所附權利要求意欲解釋為包括優(yōu)選實施例以及落入本申請實施例范圍的所有變更和修改。最后,還需要說明的是,在本文中,諸如第一和第二等之類的關系術語僅僅用來將一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關系或者順序。而且,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得 包括一系列要素的過程、方法、物品或者終端設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者終端設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者終端設備中還存在另外的相同要素。以上對本申請所提供的一種字符識別方法和一種字符識別裝置,進行了詳細介紹,本文中應用了具體個例對本申請的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本申請的方法及其核心思想;同時,對于本領域的一般技術人員,依據本申請的思想,在具體實施方式及應用范圍上均會有改變之處,綜上所述,本說明書內容不應理解為對本申請的限制。當前第1頁12當前第1頁12
當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
辛集市| 仁寿县| 论坛| 曲松县| 六枝特区| 三门峡市| 鹤山市| 禄丰县| 连云港市| 宣化县| 平远县| 海城市| 兴海县| 云阳县| 新乡县| 航空| 睢宁县| 凉山| 清苑县| 金华市| 儋州市| 西充县| 吴堡县| 夏河县| 华坪县| 全州县| 东源县| 大宁县| 漯河市| 南漳县| 乌审旗| 登封市| 镶黄旗| 宁陵县| 永仁县| 普安县| 阳山县| 宝坻区| 松滋市| 阿鲁科尔沁旗| 始兴县|