欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種復(fù)雜背景下身份證號(hào)識(shí)別算法的制作方法

文檔序號(hào):11920634閱讀:363來源:國(guó)知局

本發(fā)明涉及計(jì)算機(jī)視覺技術(shù)領(lǐng)域,具體為一種復(fù)雜背景下身份證號(hào)識(shí)別算法。



背景技術(shù):

隨著互聯(lián)網(wǎng)的普及,眾多服務(wù)公司實(shí)現(xiàn)傳統(tǒng)柜臺(tái)業(yè)務(wù)辦理的網(wǎng)絡(luò)化,在柜臺(tái)業(yè)務(wù)網(wǎng)絡(luò)化中自動(dòng)的定位證件在圖像中的位置,并準(zhǔn)確識(shí)別證件號(hào)具有重要的意義。

身份證作為日常生活中最常用的證件,快速準(zhǔn)確地在復(fù)雜圖像中定位并識(shí)別身份證號(hào)具有重要的實(shí)用價(jià)值,當(dāng)前技術(shù)對(duì)身份證識(shí)別主要面臨以下兩個(gè)問題:

一是如何從復(fù)雜圖像中快速定位身份證的位置。復(fù)雜背景下圖像中具有較多的干擾信息,比如身份證周圍的環(huán)境信息、手持身份證的人、身份證上除身份證號(hào)之外的其他信息,這些噪聲都對(duì)身份證號(hào)的定位造成較大的影響。

二是如何辨識(shí)出低分辨率且較為模糊的數(shù)字。在對(duì)身份證的拍攝過程中,因光照、尺度、傾斜角、翻轉(zhuǎn)等原因都對(duì)身份證號(hào)碼的識(shí)別提出的挑戰(zhàn),特別是在低分辨率下,身份證號(hào)字符模糊不清,如何準(zhǔn)確高效的識(shí)別身份證號(hào)依舊是一個(gè)巨大的挑戰(zhàn)。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明的目的在于提供一種復(fù)雜背景下身份證號(hào)識(shí)別算法,該算法具體步驟如下:

S1:使用一種基于統(tǒng)計(jì)亮度信息量評(píng)估算法定位身份證在復(fù)雜圖像中的位置:

1)通過人臉檢測(cè)算法在圖像中獲得n個(gè)人臉坐標(biāo)Rn(x,y,w,h),本發(fā)明中使用了PICO算法用于人臉檢測(cè),由于是已有算法此處不再贅述,其中n是檢測(cè)到的人臉個(gè)數(shù),(x,y,w,h)是框定人臉矩形框的左上角二維坐標(biāo)和矩形框的寬和高,Ri(i∈n)定義為圖像中身份證人臉的候選區(qū)域;

2)獲取每個(gè)Ri(i∈n)右側(cè)與檢測(cè)人臉矩形框同樣大小的圖像區(qū)域R′i(x′,y′,w′,h′),按下式計(jì)算R′i的統(tǒng)計(jì)參考計(jì)數(shù),

其中F是灰度亮度判斷函數(shù),d(i,j)是圖像中坐標(biāo)(i,j)處的灰度值,α表示高亮度灰度統(tǒng)計(jì)值,通過上式可得待檢測(cè)區(qū)域的高亮度信息量,計(jì)算信息量的對(duì)比表述值

按同樣的方法,計(jì)算出Ri(i∈n)低亮度信息量,和低亮度灰度統(tǒng)計(jì)值β,如下式:

函數(shù)定義與上文相同,低亮度信息量的對(duì)比度表述值

當(dāng)P、P′滿足約束條件P>0.8×w×h,P′<0.2×w×h時(shí),此候選區(qū)域Ri(i∈n)處于身份證上,最后通過人臉區(qū)域按照身份證的比例估計(jì)出身份證的區(qū)域N;

S2:使用區(qū)域中心直線擬合算法定位身份證號(hào)碼所在位置以實(shí)現(xiàn)字符切割:

1)首先,定位后的身份證區(qū)域包含大量背景信息,這些背景信息極大的干擾了身份證號(hào)的提取,為了消除背景信息的干擾,本文將包含身份證的圖片轉(zhuǎn)換成二值圖,并獲取k個(gè)聯(lián)通區(qū)域的中心位置pi(x,y),(i∈k),其中k表示聯(lián)通區(qū)域的個(gè)數(shù),p(x,y)表示聯(lián)通區(qū)域的幾何中心坐標(biāo),

將定位后的圖像轉(zhuǎn)換成二值圖,獲取圖像中的k個(gè)聯(lián)通區(qū)域,并計(jì)算聯(lián)通區(qū)域中心坐標(biāo)pi(x,y),(i∈k),

2)其次,身份證號(hào)是身份證上最長(zhǎng)的連續(xù)字符串,根據(jù)這個(gè)性質(zhì),將pi(x,y),(i∈k)按以下公式映射到一個(gè)二維平面上得到映射后的坐標(biāo)p′,

pi(x,y)=Kp′(x′,y′),(i∈k),其中K為轉(zhuǎn)換系數(shù),作用是將不同分辨率下的輸入圖片轉(zhuǎn)換到同一分辨率下,采用HOUGH變換擬合出所有直線,直線定義為l={p1,p2…pn,n∈(0,20)},通過此方法可擬合出多條直線,根據(jù)身份證號(hào)是身份證上最長(zhǎng)的連續(xù)字符串的性質(zhì),判定所有擬合出的直線中最長(zhǎng)的直線MAX(lj(count(p))),j=1,2,...,h為身份證號(hào)所在的位置,其中h是擬合出所有直線的數(shù)量,count函數(shù)的功能是計(jì)算直線上點(diǎn)的個(gè)數(shù);

3)最后,截取擬合的直線區(qū)域,并通過縱向像素點(diǎn)直方圖和橫向像素的直方圖分割出數(shù)字字符,將去除表層土壤的鹽堿地上平鋪上改良材料,平鋪量為每畝地需要改良材料總量的三分之一,平鋪要求均勻,避免局部堆積過多的改良材料;

S3:提出一種數(shù)字字符錯(cuò)誤分割矯正算法:定位身份證號(hào)所在區(qū)域,并實(shí)現(xiàn)數(shù)字字符分割,有時(shí)會(huì)出現(xiàn)分割錯(cuò)誤,即分割出的數(shù)字字符數(shù)不等于18個(gè),具體的錯(cuò)誤情況如下:分割字符總數(shù)Schar<18,可能的情況為:1.字符粘連,2.字符缺失,分割字符總數(shù)Schar>18,可能的情況為:1.字符間有裂痕,2.身份證號(hào)兩側(cè)有噪聲,針對(duì)以上可能出現(xiàn)的情況,本文計(jì)算所有字符的平均寬度mean_w和平均間隔mean_i,并通過以下策略實(shí)現(xiàn)對(duì)錯(cuò)誤分割的矯正:

(1)Schar<18:

1)將數(shù)字字符區(qū)域擴(kuò)大為原來的1.2倍,并對(duì)此區(qū)域重新進(jìn)行字符切割,

2)判斷每個(gè)字符的寬度Wi(i=1,2,...,end),若Wi>1.5×mean_w,則將此字符從中間分割為兩個(gè),

(2)Schar<18:

1)若兩個(gè)數(shù)字字符的間隔Ii<0.2×mean_i,則將兩個(gè)數(shù)字字符合并為一個(gè)字符,

2)若數(shù)字字符的寬度Ii<0.5×mean_w,則刪除此字符,

若數(shù)字字符的寬度Ii>1.5×mean_w,并且此字符處于字符串的頭部或尾部,則刪除此數(shù)字字符;

S4:利用標(biāo)準(zhǔn)字體庫(kù)生成數(shù)字字符樣本:通過少量采樣樣本生成大量低分辨率的樣本,解決低分辨率數(shù)字字符難以區(qū)分的問題,步驟如下:

(1)因?yàn)榕臄z亮度、角度、傾斜角的不同,使得獲取的身份證字符多種多樣,而在數(shù)字字符樣本缺失的情況下,身份證字符的識(shí)別是一個(gè)巨大的挑戰(zhàn),為了解決身份證樣本不足的問題,我們提出了一種隨機(jī)生成身份證號(hào)樣本的方法,其中根據(jù)標(biāo)準(zhǔn)字體庫(kù)生成大量數(shù)字字符樣本的方法如下:

1)將標(biāo)準(zhǔn)數(shù)字字符轉(zhuǎn)換成二值圖像,其中背景像素值為0,前景像素值為1,

2)獲取隨機(jī)旋轉(zhuǎn)角度R,R為±8°之間的隨機(jī)數(shù)字,以R為角度旋轉(zhuǎn)標(biāo)準(zhǔn)數(shù)字字符的二值圖像,

3)為了獲取不同尺度下的數(shù)字字符樣本,獲取隨機(jī)尺度resizeY和resizeX,其中resizeY和resizeX是在5到100之間選取的隨機(jī)數(shù)字,將數(shù)字字符樣本轉(zhuǎn)換成高為resizeY,寬為resizeX的二值圖像,二值圖像即為數(shù)字字符樣本,

(2)獲取真實(shí)事例中的低分辨率樣本,重復(fù)步驟(1),生成大量低分辨率隨機(jī)樣本,

(3)使用深度學(xué)習(xí)算法完成對(duì)字符樣本的訓(xùn)練,其中網(wǎng)絡(luò)為4個(gè)卷成層加三個(gè)全連接層。

與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:本發(fā)明可以有效定位復(fù)雜圖像中身份證的位置,并完成對(duì)身份證號(hào)的識(shí)別,該方法首先通過統(tǒng)計(jì)亮度信息量評(píng)估算法定位身份證在復(fù)雜圖像中的位置,然后通過區(qū)域中心直線擬合算法定位身份證上的身份證號(hào)位置,并實(shí)現(xiàn)字符分割,最后通過樣本自生成算法生成大量不同尺度下的隨機(jī)樣本,并用生成的隨機(jī)樣本訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)對(duì)身份證號(hào)碼的識(shí)別。

附圖說明

圖1為本發(fā)明算法流程圖。

具體實(shí)施方式

為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合具體實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。

實(shí)施例1

一種復(fù)雜背景下身份證號(hào)識(shí)別算法,該算法具體步驟如下:

S1:使用一種基于統(tǒng)計(jì)亮度信息量評(píng)估算法定位身份證在復(fù)雜圖像中的位置:

1)通過人臉檢測(cè)算法在圖像中獲得n個(gè)人臉坐標(biāo)Rn(x,y,w,h),本發(fā)明中使用了PICO算法用于人臉檢測(cè),由于是已有算法此處不再贅述,其中n是檢測(cè)到的人臉個(gè)數(shù),(x,y,w,h)是框定人臉矩形框的左上角二維坐標(biāo)和矩形框的寬和高,Ri(i∈n)定義為圖像中身份證人臉的候選區(qū)域;

2)獲取每個(gè)Ri(i∈n)右側(cè)與檢測(cè)人臉矩形框同樣大小的圖像區(qū)域R′i(x′,y′,w′,h′),按下式計(jì)算R′i的統(tǒng)計(jì)參考計(jì)數(shù),

其中F是灰度亮度判斷函數(shù),d(i,j)是圖像中坐標(biāo)(i,j)處的灰度值,α表示高亮度灰度統(tǒng)計(jì)值,通過上式可得待檢測(cè)區(qū)域的高亮度信息量,計(jì)算信息量的對(duì)比表述值

按同樣的方法,計(jì)算出Ri(i∈n)低亮度信息量,和低亮度灰度統(tǒng)計(jì)值β,如下式:

函數(shù)定義與上文相同,低亮度信息量的對(duì)比度表述值

當(dāng)P、P′滿足約束條件P>0.8×w×h,P′<0.2×w×h時(shí),此候選區(qū)域Ri(i∈n)處于身份證上,最后通過人臉區(qū)域按照身份證的比例估計(jì)出身份證的區(qū)域N;

S2:使用區(qū)域中心直線擬合算法定位身份證號(hào)碼所在位置以實(shí)現(xiàn)字符切割:

1)首先,定位后的身份證區(qū)域包含大量背景信息,這些背景信息極大的干擾了身份證號(hào)的提取,為了消除背景信息的干擾,本文將包含身份證的圖片轉(zhuǎn)換成二值圖,并獲取k個(gè)聯(lián)通區(qū)域的中心位置pi(x,y),(i∈k),其中k表示聯(lián)通區(qū)域的個(gè)數(shù),p(x,y)表示聯(lián)通區(qū)域的幾何中心坐標(biāo),

將定位后的圖像轉(zhuǎn)換成二值圖,獲取圖像中的k個(gè)聯(lián)通區(qū)域,并計(jì)算聯(lián)通區(qū)域中心坐標(biāo)pi(x,y),(i∈k),

2)其次,身份證號(hào)是身份證上最長(zhǎng)的連續(xù)字符串,根據(jù)這個(gè)性質(zhì),將pi(x,y),(i∈k)按以下公式映射到一個(gè)二維平面上得到映射后的坐標(biāo)p′,

pi(x,y)=Kp′(x′,y′),(i∈k),其中K為轉(zhuǎn)換系數(shù),作用是將不同分辨率下的輸入圖片轉(zhuǎn)換到同一分辨率下,采用HOUGH變換擬合出所有直線,直線定義為l={p1,p2...pn,n∈(0,20)},通過此方法可擬合出多條直線,根據(jù)身份證號(hào)是身份證上最長(zhǎng)的連續(xù)字符串的性質(zhì),判定所有擬合出的直線中最長(zhǎng)的直線MAX(lj(count(p))),j=1,2,...,h為身份證號(hào)所在的位置,其中h是擬合出所有直線的數(shù)量,count函數(shù)的功能是計(jì)算直線上點(diǎn)的個(gè)數(shù);

3)最后,截取擬合的直線區(qū)域,并通過縱向像素點(diǎn)直方圖和橫向像素的直方圖分割出數(shù)字字符,將去除表層土壤的鹽堿地上平鋪上改良材料,平鋪量為每畝地需要改良材料總量的三分之一,平鋪要求均勻,避免局部堆積過多的改良材料;

S3:提出一種數(shù)字字符錯(cuò)誤分割矯正算法:定位身份證號(hào)所在區(qū)域,并實(shí)現(xiàn)數(shù)字字符分割,有時(shí)會(huì)出現(xiàn)分割錯(cuò)誤,即分割出的數(shù)字字符數(shù)不等于18個(gè),具體的錯(cuò)誤情況如下:分割字符總數(shù)Schar<18,可能的情況為:1.字符粘連,2.字符缺失,分割字符總數(shù)Schar>18,可能的情況為:1.字符間有裂痕,2.身份證號(hào)兩側(cè)有噪聲,針對(duì)以上可能出現(xiàn)的情況,本文計(jì)算所有字符的平均寬度mean_w和平均間隔mean_i,并通過以下策略實(shí)現(xiàn)對(duì)錯(cuò)誤分割的矯正:

(1)Schar<18:

1)將數(shù)字字符區(qū)域擴(kuò)大為原來的1.2倍,并對(duì)此區(qū)域重新進(jìn)行字符切割,

2)判斷每個(gè)字符的寬度Wi(i=1,2,...,end),若Wi>1.5×mean_w,則將此字符從中間分割為兩個(gè),

(2)Schar<18:

1)若兩個(gè)數(shù)字字符的間隔Ii<0.2×mean_i,則將兩個(gè)數(shù)字字符合并為一個(gè)字符,

2)若數(shù)字字符的寬度Ii<0.5×mean_w,則刪除此字符,

若數(shù)字字符的寬度Ii>1.5×mean_w,并且此字符處于字符串的頭部或尾部,則刪除此數(shù)字字符;

S4:利用標(biāo)準(zhǔn)字體庫(kù)生成數(shù)字字符樣本:通過少量采樣樣本生成大量低分辨率的樣本,解決低分辨率數(shù)字字符難以區(qū)分的問題,步驟如下:

(1)因?yàn)榕臄z亮度、角度、傾斜角的不同,使得獲取的身份證字符多種多樣,而在數(shù)字字符樣本缺失的情況下,身份證字符的識(shí)別是一個(gè)巨大的挑戰(zhàn),為了解決身份證樣本不足的問題,我們提出了一種隨機(jī)生成身份證號(hào)樣本的方法,其中根據(jù)標(biāo)準(zhǔn)字體庫(kù)生成大量數(shù)字字符樣本的方法如下:

1)將標(biāo)準(zhǔn)數(shù)字字符轉(zhuǎn)換成二值圖像,其中背景像素值為0,前景像素值為1,

2)獲取隨機(jī)旋轉(zhuǎn)角度R,R為±8°之間的隨機(jī)數(shù)字,以R為角度旋轉(zhuǎn)標(biāo)準(zhǔn)數(shù)字字符的二值圖像,

3)為了獲取不同尺度下的數(shù)字字符樣本,獲取隨機(jī)尺度resizeY和resizeX,其中resizeY和resizeX是在5到100之間選取的隨機(jī)數(shù)字,將數(shù)字字符樣本轉(zhuǎn)換成高為resizeY,寬為resizeX的二值圖像,二值圖像即為數(shù)字字符樣本,

(2)獲取真實(shí)事例中的低分辨率樣本,重復(fù)步驟(1),生成大量低分辨率隨機(jī)樣本,

(3)使用深度學(xué)習(xí)算法完成對(duì)字符樣本的訓(xùn)練,其中網(wǎng)絡(luò)為4個(gè)卷成層加三個(gè)全連接層,

統(tǒng)計(jì)信息量評(píng)估算法流程:

第一步,獲取輸入圖像,若檢測(cè)為空,則跳轉(zhuǎn)至第五點(diǎn),否則繼續(xù);

第二步,使用人臉識(shí)別算法PICO從背景圖像中定位人臉位置,獲取待確定位置;

第三步,使用統(tǒng)計(jì)亮度信息量評(píng)估從待確定位置中確定身份證所在的位置;

第五步,根據(jù)統(tǒng)計(jì)信息量分布對(duì)待判斷區(qū)域進(jìn)去判斷,若符合則輸出道下一模塊,否則退出;

區(qū)域中心直線擬合算法:

第一步,獲取上一模塊輸出的身份證區(qū)域,否則繼續(xù);

第二步,將身份證區(qū)域做二值化;

第三步,獲取所有聯(lián)通區(qū)域的中心位置;

第四步,根據(jù)聯(lián)通區(qū)域中心位置擬合直線;

第五步,根據(jù)擬合結(jié)果確定身份證號(hào)位置;

第六步,通過橫向和縱向像素點(diǎn)統(tǒng)計(jì)直方圖完成數(shù)字字符切割;

數(shù)字字符錯(cuò)誤分割矯正算法

第一步,獲取上一模塊中輸出的數(shù)字字符,若輸出字符等于18,則跳轉(zhuǎn)至第三步,否則繼續(xù);

第二步,根據(jù)分割字符數(shù)量進(jìn)行對(duì)分割結(jié)果進(jìn)行矯正;

第三步,退出算法;

樣本自生成與數(shù)字字符神經(jīng)網(wǎng)絡(luò)訓(xùn)練;

第一步,獲取標(biāo)準(zhǔn)字體庫(kù),并將標(biāo)準(zhǔn)字體庫(kù)字符轉(zhuǎn)換成二值圖像;

第二步,生成隨機(jī)旋轉(zhuǎn)角度R;

第三步,獲取隨機(jī)尺度;

第四步,根據(jù)隨機(jī)轉(zhuǎn)角R和隨機(jī)尺度,對(duì)第一步中獲得標(biāo)準(zhǔn)字符庫(kù)進(jìn)行相應(yīng)操作,

第五步,用生成的隨機(jī)樣本對(duì)深度卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練;

第六步,用訓(xùn)練好的網(wǎng)絡(luò)識(shí)別上一模塊中識(shí)別的字符,并輸出結(jié)果;

第七步,退出;

本發(fā)明可以有效定位復(fù)雜圖像中身份證的位置,并完成對(duì)身份證號(hào)的識(shí)別,該方法首先通過統(tǒng)計(jì)亮度信息量評(píng)估算法定位身份證在復(fù)雜圖像中的位置,然后通過區(qū)域中心直線擬合算法定位身份證上的身份證號(hào)位置,并實(shí)現(xiàn)字符分割,最后通過樣本自生成算法生成大量不同尺度下的隨機(jī)樣本,并用生成的隨機(jī)樣本訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)對(duì)身份證號(hào)碼的識(shí)別。

以上所述,僅為本發(fā)明較佳的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),根據(jù)本發(fā)明的技術(shù)方案及其發(fā)明構(gòu)思加以等同替換或改變,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
浦江县| 米林县| 塔城市| 昔阳县| 潼关县| 兴义市| 英德市| 湖南省| 郸城县| 水城县| 偏关县| 伽师县| 湘乡市| 集贤县| 景德镇市| 临潭县| 乌兰察布市| 抚宁县| 百色市| 南丹县| 化州市| 乌拉特中旗| 历史| 镇沅| 静宁县| 江永县| 孟州市| 平原县| 蒲江县| 济阳县| 巴林右旗| 房产| 大港区| 和平区| 洛浦县| 晋中市| 本溪| 额敏县| 秦皇岛市| 长白| 建昌县|