專利名稱:基于單個(gè)字符的統(tǒng)計(jì)筆跡鑒別和驗(yàn)證方法
技術(shù)領(lǐng)域:
基于單個(gè)字符的統(tǒng)計(jì)筆跡鑒別和驗(yàn)證方法屬于筆跡鑒別領(lǐng)域。
背景技術(shù):
利用書寫者書寫的筆跡差異進(jìn)行書寫者的身份辨識(shí)和驗(yàn)證,具有極其重要的理論和實(shí)際意義。在通常多采用人的知識(shí)和經(jīng)驗(yàn)進(jìn)行筆跡鑒別的現(xiàn)狀下,如何利用計(jì)算機(jī)進(jìn)行筆跡鑒別,消除人的因素的影響,客觀地進(jìn)行筆跡鑒別有特殊意義。通常的筆跡鑒別和驗(yàn)證方法有兩種,一種是文本無關(guān)的方法,一種是文本相關(guān)的方法。文本相關(guān)的方法采用相同的文字(稱為特征字)作為處理對(duì)象,進(jìn)行筆跡鑒別和驗(yàn)證。在筆跡鑒別和驗(yàn)證過程中,首先需要對(duì)驗(yàn)證對(duì)象——特征字進(jìn)行特征提取,選擇能夠充分表達(dá)書寫者筆跡差異的特征是筆跡鑒別成敗的核心。文獻(xiàn)中使用到的特征有圖像幾何矩特征、弧模式直方圖特征、筆劃書寫結(jié)構(gòu)等特征。但這些特征多是表述了書寫文字的全局特征,不能反映不同書寫者書寫的差異;而且這些特征要么難于提取,或者抗噪聲、抗干擾能力不強(qiáng)。這些方法的鑒別正確率都不高。
四方向線素特征充分反映了漢字由橫、豎、撇、捺等基本筆劃構(gòu)成的特點(diǎn),在字符識(shí)別領(lǐng)域有成功的應(yīng)用。但在筆跡鑒別領(lǐng)域,由于沒有考慮到筆跡鑒別的特殊性,文獻(xiàn)中所采用的類似于四方向線素的特征抽取方法其鑒別正確率都較低。
PCA(主分量分析)變換和LDA(線性鑒別分析)變換是兩種用于維數(shù)縮減、特征選擇的方法。PCA變換可得到最有效的特征,而LDA變換則可得到最具鑒別性的特征。但在筆跡鑒別領(lǐng)域,目前還沒有見到使用這兩種變換的文獻(xiàn)。
我們知道,筆跡鑒別是一個(gè)比較困難的問題,而且目前尚未見到有成功的算法和系統(tǒng)出現(xiàn),尤其在如何抽取表述不同書寫者筆跡差異特征的文獻(xiàn)幾乎沒有看到,這應(yīng)當(dāng)是影響筆跡鑒別技術(shù)發(fā)展的重要因素。
本發(fā)明就是通過抽取能夠集中表述不同書寫者的筆跡差異的特征作為主要的突破口,實(shí)現(xiàn)了高性能的基于單個(gè)字符的筆跡鑒別和驗(yàn)證的方法和系統(tǒng)。這是目前所有其他文獻(xiàn)里都沒有使用的方法。
發(fā)明內(nèi)容
本發(fā)明的目的在于實(shí)現(xiàn)一個(gè)基于單個(gè)字符的筆跡鑒別和驗(yàn)證方法。本鑒別方法以每個(gè)人書寫的相同的特征字作為處理對(duì)象,首先對(duì)處理字符對(duì)象進(jìn)行必要的預(yù)處理,包括對(duì)特征字進(jìn)行位置和大小的線性歸一化,然后提取能很好反映漢字特點(diǎn)的四方向線素特征,最重要的一步是在漢字的四方向線素特征上,選取反映不同書寫者差異的鑒別特征,即根據(jù)筆跡鑒別小樣本的特點(diǎn),采用兩種方法提取最優(yōu)特征,一種方法是采用直接LDA變換提取最具鑒別性的特征;另一種方法是先用PCA變換降維得到最有效的特征,然后用LDA變換提取最具鑒別性的最優(yōu)鑒別特征。最后采用合適的優(yōu)化分類器,根據(jù)由書寫者的筆跡抽取的最優(yōu)鑒別特征,對(duì)書寫者進(jìn)行鑒別和驗(yàn)證。由此,可以得到很高的單字鑒別正確率。并根據(jù)該方法,實(shí)現(xiàn)了一個(gè)基于單字字符的筆跡鑒別系統(tǒng)及筆跡驗(yàn)證系統(tǒng)。
作為一個(gè)基于單字字符的筆跡鑒別系統(tǒng)還包括書寫者筆跡的采集,即系統(tǒng)首先掃描輸入包含書寫者筆跡的文本,采用自動(dòng)或人機(jī)交互的方式進(jìn)行書寫字符切分。再采用字符識(shí)別技術(shù)可以得到相同特征字的字跡,由此完成用以訓(xùn)練和鑒別的書寫者筆跡的采集。利用采集建立的訓(xùn)練樣本數(shù)據(jù)庫,進(jìn)行四方向線素特征抽取,得到訓(xùn)練樣本的特征數(shù)據(jù)庫。然后采用直接LDA變換提取最具鑒別性的特征或先采用PCA變換然后用LDA變換提取最優(yōu)鑒別特征后建立訓(xùn)練樣本的鑒別特征庫。對(duì)未知書寫者的樣本,采用同樣的方法采集特征字,采用上述同樣的方法得到鑒別特征,然后與鑒別特征庫進(jìn)行分類比較,從而判斷書寫者是誰或者接受(拒絕)該書寫者。
本發(fā)明由以下幾部分組成預(yù)處理、四方向線素特征提取、特征變換、分類器設(shè)計(jì)。
1.預(yù)處理預(yù)處理部分包括字符的位置規(guī)一化和的大小規(guī)一化。
設(shè)原始特征字圖像為[F(i,j)]W×H,圖像寬度為W,高度為H,圖像位于第i行第j列的象素點(diǎn)的值為F(i,j)。用下式計(jì)算圖像的重心G=(Gi,Gj)Gi=Σi=1WΣj=1Hi·F(i,j)Σi=1WΣj=1HF(i,j),]]>Gj=Σi=1WΣj=1Hi·F(i,j)Σi=1WΣj=1HF(i,j)]]>采用重心——中心歸一化方法將原始圖像歸一化到M×M大小,歸一化后圖像記為[A(i,j)]M×M。歸一化后圖像在(i,j)處的象素值為原始圖像在(m,n)處的象素值 2.特征字符四方向線素特征提取假定特征字圖像其筆畫所對(duì)應(yīng)的點(diǎn)為黑象素點(diǎn),背景點(diǎn)為白象素點(diǎn)。對(duì)于筆畫象素點(diǎn),如果其四領(lǐng)域(或八領(lǐng)域)有白象素點(diǎn),則稱該筆畫象素點(diǎn)為輪廓點(diǎn)。采用已有的輪廓提取算法提取歸一化后的特征字圖像[A(i,j)]M×M的輪廓,得到輪廓圖像[B(i,j)]M×M。對(duì)每一個(gè)輪廓點(diǎn),根據(jù)其相鄰輪廓點(diǎn)的位置信息,賦予該輪廓點(diǎn)橫、豎、撇、捺四種方向?qū)傩浴>唧w的說,設(shè)象素點(diǎn)(i,j)是輪廓點(diǎn),如果象素點(diǎn)(i-1,j)(或象素點(diǎn)(i+1,j))為輪廓點(diǎn),則輪廓點(diǎn)(i,j)具有橫方向?qū)傩?;如果象素點(diǎn)(i,j-1)(或象素點(diǎn)(i,j+1))為輪廓點(diǎn),則輪廓點(diǎn)(i,j)具有豎方向?qū)傩?;如果象素點(diǎn)(i-1,j-1)(或象素點(diǎn)(i+1,j+1))為輪廓點(diǎn),則輪廓點(diǎn)(i,j)具有捺方向?qū)傩?;如果象素點(diǎn)(i-1,j+1)(或象素點(diǎn)(i+1,j-1))為輪廓點(diǎn),則輪廓點(diǎn)(i,j)具有撇方向?qū)傩?。一個(gè)輪廓點(diǎn)可以有不止一種方向?qū)傩浴H鐖D6(e)中的中心點(diǎn),既有豎方向?qū)傩?、又有撇方向?qū)傩浴⑤喞獔D像[B(i,j)]M×M劃分成N1×N1個(gè)子塊,每個(gè)子塊的象素寬度為L(如圖7所示,圖中1、2、…、N1等標(biāo)號(hào)表示塊號(hào))。分別統(tǒng)計(jì)第(k,l)(這里1≤k≤N1,1≤l≤N1)個(gè)子塊里面具有橫、豎、撇、捺方向?qū)傩缘妮喞c(diǎn)的數(shù)目,并記為Ckl(h),Ckl(v),Ckl(+),Ckl(-)。然后,再將輪廓圖像[B(i,j)]M×M劃分成N2×N2個(gè)小圖像塊。具體劃分規(guī)則如下對(duì)于第(x,y)(這里1≤x≤N2,1≤y≤N2)個(gè)小圖像塊,其所包含的子塊為(k,l)∈Dxy,Dxy表示表示如下子塊構(gòu)成的集合Dxy={(k,l)|max(1,2x-2)≤k≤min(N1,2x),max(1,2y-2)≤l≤min(N1,2y)}該小圖像塊的中心子塊為(2x-1,2y-1)(如圖8所示,圖中黑點(diǎn)表示中心子塊)。N1和N2的關(guān)系是N1=2N2-1。例如,對(duì)于第(1,1)個(gè)小圖象塊,x=1,y=1,從而可得它的中心子塊為(2×1-1,2×1-1)=(1,1),它由如下子塊構(gòu)成(1,1)、(1,2)、(2,1)、(2,2)。從第m(m=N2·x+y)個(gè)小圖像塊中抽取四方向線素特征Cm(h)(x,y)=Σ(k,l)∈DxyCkl(h)·w(k-(2x-1),l-(2y-1))]]>Cm(v)(x,y)=Σ(k,l)∈DxyCkl(v)·w(k-(2x-1),l-(2y-1))]]>Cm(+)(x,y)=Σ(k,l)∈DxyCkl(+)·w(k-(2x-1),l-(2y-1))]]>Cm(-)(x,y)=Σ(k,l)∈DxyCkl(-)·w(k-(2x-1),l-(2y-1))]]>其中w(u,v)=12πσ2exp(-u2+v22σ2)]]>是高斯加權(quán)函數(shù),這里σ=2tπ,]]>t是小圖像塊的交疊寬度,取t=1。
把每個(gè)小圖像塊得到的特征向量合并成一個(gè)維數(shù)為4N22的特征向量,即得到了四方向線素特征VV=[C1(h),C1(v),C1(+),C1(-),···,CN22(h),CN22(v),CN22(+),CN22(-)]T]]>3.線性特征變換本發(fā)明采用兩種方法進(jìn)行特征變換,一種是直接LDA變換的方法,另一種是先用PCA變換降維然后采用LDA變換的方法。
設(shè)書寫者數(shù)目為c。對(duì)第r(1≤r≤c)個(gè)書寫者的特征字樣本采用上述方法提取四方向線素特征,得到其特征向量集合為{V1(r),V2(r),..., },其中Kr為該書寫者訓(xùn)練樣本數(shù)目,Vj(r)(j=1,2...,Kr)是4N22維的特征向量。
3.1利用直接LDA變換提取最具鑒別性的特征首先計(jì)算每個(gè)書寫者r(1≤r≤c)特征向量的中心μr和所有書寫者特征向量的中心μμr=1KrΣj=1KrVj(r),]]>μ=1cΣr=1cμr]]>然后計(jì)算類間散度矩陣Sb和平均類內(nèi)散度矩陣SwSb=1cΣr=1c(μr-μ)(μr-μ)T,]]>Sw=1cΣr=1c1KrΣj=1Kr(Vj(r)-μr)(Vj(r)-μr)T]]>尋找最佳變換矩陣W,使 最大。
用矩陣計(jì)算工具計(jì)算Sb的前l(fā)個(gè)最大的非零本征值ρj(j=1,2,...,l)和相應(yīng)的本征向量ζj(j=1,2,...,l),Sbζj=ρjζj。設(shè)Q=ζ1,ζ2,...,ζl],Db=diag{ρ1,ρ2,...,ρl}。令H=QDb-12,]]>下面一步是對(duì)角化HTSwH。
用矩陣計(jì)算工具計(jì)算HTSwH的前d個(gè)最小本征值δj(j=1,2,...,d)和相應(yīng)的本征向量υj(j=1,2,...,d),即HTSwHυj=δjυj。設(shè)P=[υ1,υ2,...,υd],Dw=diag{δ1,δ2,...,δd},則最后的變換矩陣為W=HPDw-12=QDPb-12Dw-12.]]>3.2先用PCA變換降維然后采用LDA變換提取最具鑒別性特征A)利用PCA主分量分析方法進(jìn)行特征維數(shù)壓縮我們先利用PCA變換進(jìn)行特征維數(shù)的壓縮。
計(jì)算總的均值μ和總的協(xié)方差矩陣∑tμ=1cΣr=1c1KrΣj=1KrVj(r)]]>Σt=1cΣr=1c1KrΣj=1Kr(Vj(r)-μ)(Vj(r)-μ)T]]>
用矩陣計(jì)算工具計(jì)算∑t的n個(gè)非零本征值λj(j=1,2,...,n)和相應(yīng)的本征向量ξj(j=1,2,...,n),即∑tξj=λjξj。將這些本征值從大到小排序,設(shè)排序后的本征值為λ′j(j=1,2...,n),對(duì)應(yīng)的本征向量為ξ′j(j=1,2,...,n)。設(shè)α(0≤α≤1)為某個(gè)給定的經(jīng)驗(yàn)常數(shù)(我們?nèi)ˇ粒?.95),尋找最小的m,使得ΣJ=1mλJ′ΣJ=1nλJ′≥α]]>則PCA變換的變換矩陣U=[ξ′1,ξ′2,...,ξ′m]。通過PCA變換,將相應(yīng)的4N22維原始特征向量V變換為m維特征向量Y,m<4m22Y=UTV第r書寫者的特征集合經(jīng)PCA變換后變?yōu)閧Y1(r),Y2(r),..., }。
B)利用LDA線性鑒別分析提取反映不同書寫者差異的鑒別特征首先計(jì)算每個(gè)書寫者r(1≤r≤c)特征向量的中心ηr和所有書寫者特征向量的中心ηηr=1KrΣJ=1KrYj(r),]]>η=1cΣr=1cηr]]>然后計(jì)算類間散度矩陣Sb和平均類內(nèi)散度矩陣SwSb=1cΣr=1c(ηr-η)(ηr-η)T,]]>Sw=1cΣr=1c1KrΣj=1Kr(Yj(r)-ηr)(Yj(r)-ηr)T]]>尋找變換矩陣Φ,使得 最大,即使類內(nèi)方差最小和類間方差最大的特征變換Φ。
用矩陣計(jì)算工具計(jì)算矩陣Sw-1Sb的前d(一般d=c-1)個(gè)最大的非零本征值γj(j=1,2,...,d)和相應(yīng)的本征向量ζj(j=1,2,...,d),(Sw-1Sb)ζj=γjζj.]]>則LDA變換的變換矩陣Φ=[ζ1,ζ2,...,ζd]。相應(yīng)的特征變換為Z=ΦTY,這里Z是最具判別性的d維特征。
將PCA變換和LDA變換合并成一個(gè)單一的變換矩陣,可得W=UΦ,相應(yīng)的特征變換為Z=WTV4.基于單個(gè)字的統(tǒng)計(jì)筆跡鑒別方法筆跡鑒別已知某未知書寫者的特征字筆跡樣本是由c個(gè)書寫者中的某個(gè)人書寫的,現(xiàn)要確定該特征字筆跡樣本的書寫者是這c個(gè)書寫者中的哪一個(gè)。
4.1分類器設(shè)計(jì)對(duì)最具可分性的特征向量Z,計(jì)算所有書寫者的均值向量Z(r)‾(r=1,2,...,c),]]>Z(r)‾=1KrΣJ=1KrZJ(r),]]>其中每個(gè)書寫者r(1≤r≤c)的最具可分性的特征集合為{Z1(r),Z2(r),..., },將各書寫者的鑒別特征均值向量存入鑒別特征數(shù)據(jù)庫文件中。
4.2鑒別方法對(duì)未知書寫者的特征字,首先歸一化,然后提取四方向線素特征向量V,采用特征變換矩陣W將特征向量V變換為Z=WTV=[z1,z2,...,zd]T,然后從庫文件中讀出所有書寫者的均值向量Z(r)‾=[z1(r)‾,z2(r)‾,...,zb(r)‾]T,(r=1,2,...,c),]]>計(jì)算Z到 的歐氏距離D(r)D(r)=ΣJ=1d(zJ-zj(r)‾),1≤r≤c]]>如果D(k)=min1≤r≤cD(r),]]>則該特征字是由書寫者k書寫的,k=argr(min1≤r≤cD(r)).]]>4.3鑒別結(jié)果的置信度對(duì)于筆跡鑒別而言,我們不僅關(guān)心鑒別正確率,而且還關(guān)心鑒別結(jié)果的可靠程度,這種鑒別結(jié)果的可靠程度就是置信度。
設(shè)D(j)=min1≤r≤c,r≠kD(r),]]>即D(j)表示歐氏距離{D(r)}1≤r≤c中次小的,則將Z識(shí)別為第k個(gè)書寫者的廣義置信度為f,(Z)=1.0-D(k)D(j)]]>5.基于單個(gè)字符的統(tǒng)計(jì)筆跡驗(yàn)證方法筆跡驗(yàn)證對(duì)于輸入的某個(gè)未知字符筆跡,判斷是否是某個(gè)書寫者書寫的。筆跡驗(yàn)證從本質(zhì)上說是兩類問題。
5.1驗(yàn)證數(shù)據(jù)庫文件生成筆跡驗(yàn)證過程實(shí)際上是兩類的筆跡鑒別問題,即c=2,一類是書寫者的真筆跡,設(shè)有K1個(gè)真筆跡樣本,另一類是其他人書寫的偽筆跡,設(shè)有K2個(gè)偽筆跡樣本。我們可以采用前面所述的筆跡鑒別方法進(jìn)行筆跡驗(yàn)證。由于c=2,在LDA變換后最具可分性的特征的維數(shù)為d=1,即得到的最具可分性的特征為一維向量。對(duì)最具可分性的特征z,分別計(jì)算真樣本和偽樣本的均值 z(i)‾=1KiΣJ=1K1zj(i),i=1,2,]]>則判別域值h=z(1)‾+z(2)‾2.]]>將判別域值和變換矩陣存入驗(yàn)證數(shù)據(jù)庫文件中。
5.2筆跡驗(yàn)證方法在進(jìn)行驗(yàn)證時(shí),對(duì)需要驗(yàn)證的筆跡樣本,首先歸一化,然后提取四方向線素特征V,采用特征變換矩陣W將特征變換為z=WTV,則判別規(guī)則為如果z≤h,則接受z;否則,拒絕z。
5.3筆跡驗(yàn)證的可靠性估計(jì)設(shè)β為大于0的經(jīng)驗(yàn)常數(shù)(我們?nèi)ˇ拢?.4),則置信度采用下式計(jì)算S(z)=11+exp(-β(h-z))]]>S(z)的值域?yàn)?0,1),通過映射,判別規(guī)則變?yōu)槿绻鸖(z)≥0.5,則接受z;否則,拒絕z。
S(z)越大,驗(yàn)證結(jié)果越可靠。
本發(fā)明的特征在于,它是一種基于單個(gè)字符的筆跡鑒別。它依次含有以下步驟1.它在對(duì)處理字符筆跡對(duì)象進(jìn)行必要預(yù)處理后,先提取能很好反映漢字特點(diǎn)的四方向線素特征,再在此基礎(chǔ)上,采用下述兩種方法之一去選取反映不同書寫者差異的最優(yōu)鑒別特征,其中一種方法是采用直接LDA(線性鑒別分析)變換提取最具鑒別性的特征,另一種方法是先用PCA(主分量分析)變換降維得到最有效的特征,然后用LDA變換提取最具鑒別性的最優(yōu)鑒別特征。在由圖像采集設(shè)備和計(jì)算機(jī)組成的系統(tǒng)中,它依次含有以下步驟(1)書寫筆跡的采集掃描輸入包含書寫者筆跡的文本,先進(jìn)行書寫字符切分,再采用字符識(shí)別技術(shù)得到相同特征字的筆跡,由此完成用以訓(xùn)練和鑒別的書寫者筆跡的采集,建立訓(xùn)練樣本數(shù)據(jù)庫。
(2)預(yù)處理,包含字符位置和大小的線性歸一化(2.1)計(jì)算圖像的重心設(shè)原始特征字圖像為[F(i,j)]W×H,其中,W為圖像寬度,H為圖像高度,F(xiàn)(i,j)為圖像位于第i行第j列的象素點(diǎn)的值,則圖像的重心G=(Gi,Gj),其中
Gi=Σi=1WΣj=1Hi·F(i,j)Σi=1WΣj=1HF(i,j),]]>Gj=Σi=1WΣj=1Hj·F(i,j)Σi=1WΣj=1HF(i,j),]]>(2.2) 用重心——中心歸一化方法把原始圖像歸一化到M×M大小歸一化后圖像[A(i,j)]M×M在(i,j)處的象素值為原始圖像在(m,n)處的象素值 (3)提取特征字符的四方向線素特征(3.1)用已有的輪廓提取算法提取歸一化后的特征字圖像[A(i,j)]M×M的輪廓,得到輪廓圖像[B(i,j)]M×M。
(3.2)四方向線素特征的提取先把輪廓圖像[B(i,j)]M×M劃分成N1×N1個(gè)子塊,每個(gè)子塊的象素寬度為L。分別統(tǒng)計(jì)第(k,l)個(gè)子塊里面具有橫、豎、撇、捺方向?qū)傩缘妮喞c(diǎn)的數(shù)目,并記為Ckl(h),Ckl(v)),Ckl(+),Ckl(-),其中,1≤k≤N1,1≤l≤N1。
再次把輪廓圖像[B(i,j)]M×M劃分成N2×N2個(gè)小圖像塊。其中第(x,y)個(gè)小圖像塊(1≤x≤N2,1≤y≤N2)由子塊(k,l)構(gòu)成,這里(k,l)∈Dxy,Dxy表示如下子塊構(gòu)成的集合Dxy={(k,l)|max(1,2x-2)≤k≤min(N1,2x),max(1,2y-2)≤l≤min(N1,2y)}該小圖像塊的中心子塊為(2x-1,2y-1),N1=2N2-1。從第m(m=N2·x+y)個(gè)小圖像塊中抽取四方向線素特征Cm(h)(x,y)=Σ(k,l)∈DxyCkl(h)·w(k-(2x-1),l-(2y-1))]]>Cm(v)(x,y)=Σ(k,l)∈DxyCkl(v)·w(k-(2x-1),l-(2y-1))]]>Cm(+)(x,y)=Σ(k,l)∈DxyCkl(+)·w(k-(2x-1),l-(2y-1))]]>Cm(-)(x,y)=Σ(k,l)∈DxyCkl(-)·w(k-(2x-1),l-(2y-1))]]>其中w(u,v)=12πσ2exp(-u2+v22σ2)]]>是高斯加權(quán)函數(shù),這里σ=2tπ,]]>t是小圖像塊的交疊寬度,取t=1。
(3.3)把每個(gè)小圖像塊得到的特征向量合并成一個(gè)維數(shù)為4N22的特征向量,即為四方向線素特征VV=[C1(h),C1(v),C1(+),C1(-),···,CN22(h),CN22(v),CN22(+),CN22(-)]T.]]>(4)線性特征變換設(shè)書寫者數(shù)目為c。對(duì)第r(1≤r≤c)個(gè)書寫者的特征字樣本采用上述方法提取四方向線素特征,得到其特征向量集合為{V1(r),V2(r),..., },其中Kr為該書寫者訓(xùn)練樣本數(shù)目,Vj(r)(j=1,2,...,Kr)是4N22維的特征向量。
則利用直接LDA變換提取最具鑒別性的特征如下先計(jì)算每個(gè)書寫者r(1≤r≤c)特征向量的中心μr和所有書寫者特征向量的中心μμr=1KrΣj=1KrVj(r),]]>μ=1cΣr=1cμr]]>再計(jì)算類間散度矩陣Sb和平均類內(nèi)散度矩陣SwSb=1cΣr=1c(μr-μ)(μr-μ)T]]>Sw=1cΣr=1c1KrΣj=1Kr(Vj(r)-μr)(Vj(r)-μr)T]]>尋找最佳變換矩陣W,使 最大,則相應(yīng)的特征變換為Z=WTV;(5)進(jìn)行基于單個(gè)字符的統(tǒng)計(jì)筆跡鑒別,即已知某未知書寫者的特征字筆跡樣本是由c個(gè)書寫者中的某個(gè)人書寫的,現(xiàn)要確定該特征字筆跡樣本的書寫者是這c個(gè)書寫者中的哪一個(gè)。
(5.1)設(shè)計(jì)分類器對(duì)最具可分性的特征向量Z,計(jì)算所有書寫者的均值向量Z(r)‾(r=1,2,...,c),]]>Z(r)‾=1KrΣj=1KrZj(r),]]>其中每個(gè)書寫者r(1≤r≤c)的最具可分性的特征集合為{Z1(r),Z2(r),..., },將各書寫者的鑒別特征均值向量存入鑒別特征數(shù)據(jù)庫文件中。
(5.2)鑒別對(duì)未知書寫者的特征字,首先歸一化,再提取四方向線素特征向量V,采用特征變換矩陣W將特征向量V變換為Z=WTV=[z1,z2,...,zd]T,d是變換后特征的維數(shù)。
從庫文件中讀出所有書寫者的均值向量Z(r)‾=[z1(r)‾,z2(r)‾,...,zd(r)‾]T,r=1,2,...,c,]]>計(jì)算Z到 的歐氏距離D(r)D(r)=Σj=1d(zj-zj(r)‾),1≤r≤c]]>若D(k)=min1≤r≤cD(r),]]>則該特征字是由書寫者k書寫的,即k=argr(min1≤r≤cD(r)).]]>(6)進(jìn)行基于單個(gè)字符的統(tǒng)計(jì)筆跡驗(yàn)證,即對(duì)于輸入的某個(gè)未知筆跡,判斷是否為某個(gè)書寫者寫的(6.1)生成驗(yàn)證數(shù)據(jù)庫文件設(shè)有K1個(gè)真筆跡樣本,K2個(gè)偽筆跡樣本,分別計(jì)算真樣本和偽樣本的均值 z(i)‾=1KiΣj=1K1zj(i),i=1,2,]]>則判別域值h=z(1)‾+z(2)‾2.]]>將判別域值和變換矩陣存入驗(yàn)證數(shù)據(jù)庫文件中。
(6.2)驗(yàn)證對(duì)需要驗(yàn)證的筆跡樣本,首先歸一化,再提取四方向線素特征V,采用特征變換矩陣W將特征變換為z=WTV,則判別規(guī)則為若z≤h,則接受z,否則,拒絕z。
2.在作所述的線性特征變換時(shí),先用PCA變換降維,然后采用LDA變換提取最具鑒別性的特征(1)利用PCA主分量分析方法進(jìn)行特征維數(shù)壓縮(1.1)先計(jì)算總的均值μ和總的協(xié)方差矩陣∑tμ=1cΣr=1c1KrΣj=1KrVj(r)]]>Σt=1cΣr=1c1KrΣj=1Kr(Vj(r)-μ)(Vj(r)-μ)T]]>(1.2)計(jì)算∑t的n個(gè)非零本征值λj(j=1,2,...,n)和相應(yīng)的本征向量ξj(j=1,2,...,n),∑tξj=λjξj;(1.3)把本征值從大到小排序,排序后的本征值為λ′j(j=1,2,...,n),對(duì)應(yīng)的本征向量為ξ′j(j=1,2,...,n);(1.4)設(shè)定某個(gè)給定的經(jīng)驗(yàn)常數(shù)α,0≤α≤1,取α=0.95;(1.5)尋找最小的m,使Σj=1mλj′Σj=1nλj′≥α;]]>(1.6)得PCA變換的變換矩陣U=[ξ′1,ξ′2,...,ξ′m],從而把相應(yīng)的4N22維原始特征向量V變換為m維特征向量Y,m<4N22Y=UTV(1.7)第r書寫者的特征集合經(jīng)PCA變換后變?yōu)閧Y1(r),Y2(r),..., }。
(2)用LDA線性鑒別分析提取反映不同書寫者差異的鑒別特征(2.1)計(jì)算每個(gè)書寫者r(1≤r≤c)特征向量的中心ηr和所有書寫者特征向量的中心ηηr=1KrΣj=1KrYj(r),]]>η=1cΣr=1cηr;]]>(2.2)計(jì)算類間散度矩陣Sb和平均類內(nèi)散度矩陣SwSb=1cΣr=1c(ηr-)(ηr-η)T,]]>Sw=1cΣr=1c1KrΣj=1Kr(Yj(r)-ηr)(Yj(r)-ηr)T;]]>(2.3)尋找變換矩陣Φ,使得 最大;(2.4)相應(yīng)的特征變換為Z=ΦTY;(2.5)把PCA變換和LDA變換合并成一個(gè)單一的變換矩陣,得W=UΦ,相應(yīng)的特征變換為Z=WTV。
實(shí)驗(yàn)證明,本發(fā)明可以有效的完成筆跡鑒別和驗(yàn)證這兩大任務(wù)。
圖1一個(gè)典型的筆跡鑒別系統(tǒng)的硬件構(gòu)成。
圖2單個(gè)特征字樣本的生成。
圖3筆跡鑒別系統(tǒng)的構(gòu)成。
圖4四方向線素特征提取流程。
圖5歸一化字符和它的輪廓。
圖6四方向線素特征中的橫、豎、撇、捺四種方向?qū)傩浴?br>
圖7圖像子塊劃分方法。
圖8小圖像塊的構(gòu)成方法。
圖9直接LDA特征變換流程圖。
圖10先用PCA變換后LDA變換的特征變換流程圖。
圖11基于本算法的筆跡鑒別系統(tǒng)。
圖12公安部筆跡驗(yàn)證系統(tǒng)。
圖13筆跡鑒別中廣義置信度分布直方圖。
圖14筆跡驗(yàn)證中置信度分布直方圖。
具體實(shí)施例方式
如圖1所示,一個(gè)筆跡鑒別系統(tǒng)在硬件上由兩部分構(gòu)成圖像采集設(shè)備和計(jì)算機(jī)。圖像采集設(shè)備一般是掃描儀和數(shù)字?jǐn)z像機(jī),用來獲取筆跡的數(shù)字圖像。計(jì)算機(jī)用于對(duì)數(shù)字圖像進(jìn)行處理,并進(jìn)行判決分類。
圖2所示的是訓(xùn)練特征字樣本和測試特征字樣本的生成過程。對(duì)于一個(gè)書寫者書寫的一篇筆跡樣本,首先通過掃描儀掃入計(jì)算機(jī),將其變?yōu)閿?shù)字圖像。然后對(duì)數(shù)字圖像二值化、去除噪聲等預(yù)處理措施,得到二值化的圖像。再對(duì)輸入圖像進(jìn)行行切分,得到文本行,在此階段行切分錯(cuò)誤采用手動(dòng)方式改正。得到文本行后,對(duì)每一個(gè)文本行進(jìn)行字切分,得到單個(gè)手寫字符,同樣,此階段的字切分錯(cuò)誤采用手動(dòng)方式改正。此后,將切分出來的字符送入字符識(shí)別器識(shí)別,識(shí)別錯(cuò)誤由人工校正。最后,將相同的字符對(duì)應(yīng)的原始字符圖像提取出來,并保存,單個(gè)特征字的筆跡樣本獲取完畢。
如圖3所示,筆跡鑒別算法分為兩個(gè)部分訓(xùn)練系統(tǒng)和測試系統(tǒng)。訓(xùn)練系統(tǒng)中,對(duì)輸入的單個(gè)字符筆跡訓(xùn)練樣本集,提取反映書寫特性的四方向線素特征,對(duì)特征進(jìn)行變換,得到最具判別性的特征,然后,采用合適的分類器,訓(xùn)練分類器,得到鑒別庫文件。在測試系統(tǒng)中,對(duì)輸入的未知筆跡,采用和訓(xùn)練系統(tǒng)同樣的特征提取方法,并用訓(xùn)練系統(tǒng)得到的變換矩陣對(duì)特征進(jìn)行變換,然后送入分類器進(jìn)行分類,判斷書寫者是誰。
因而,實(shí)用的基于單個(gè)字符的筆跡鑒別系統(tǒng)的實(shí)現(xiàn)需要考慮如下幾個(gè)方面A)單個(gè)字符筆跡樣本的獲取;B)訓(xùn)練系統(tǒng)的實(shí)現(xiàn);C)測試系統(tǒng)的實(shí)現(xiàn)。
下面分別對(duì)這三個(gè)方面進(jìn)行詳細(xì)介紹。
A)單個(gè)字符筆跡樣本的獲取單個(gè)字符筆跡樣本是通過字符識(shí)別系統(tǒng)獲取的(圖2)。輸入的一篇筆跡文檔通過掃描儀得到數(shù)字圖像,輸入計(jì)算機(jī)。然后對(duì)該圖像進(jìn)行二值化等預(yù)處理措施。二值化方法可采用全局二值化也可采用局部自適應(yīng)二值化。然后對(duì)文檔進(jìn)行版面分析,得到字符塊。對(duì)字符塊進(jìn)行行切分和字切分得到單個(gè)字符。采用水平投影直方圖和垂直投影直方圖分別實(shí)現(xiàn)行切分和字切分。在此階段的切分錯(cuò)誤采用人機(jī)交互的方式更正。將得到的單個(gè)字符送入字符識(shí)別器進(jìn)行識(shí)別,識(shí)別錯(cuò)誤同樣采用手動(dòng)方式更正。由于字符識(shí)別器在字符識(shí)別領(lǐng)域討論得比較多,這里不詳細(xì)描述。
經(jīng)過字符識(shí)別器和手動(dòng)更正后,把具有相同內(nèi)碼的字符所對(duì)應(yīng)的原始字符圖像保存起來,這樣,我們就得到了單個(gè)字符筆跡樣本。
B)訓(xùn)練系統(tǒng)的實(shí)現(xiàn)B.1預(yù)處理設(shè)單個(gè)字的筆跡樣本為[F(i,j)]W×H,計(jì)算該樣本的重心G=(Gi,Gj)Gi=Σi=1WΣj=1Hi·F(i,j)Σi=1WΣj=1HF(i,j),]]>Gj=Σi=1WΣj=1Hj·F(i,j)Σi=1WΣj=1HF(i,j),]]>采用重心——中心歸一化方法對(duì)筆跡樣本歸一化為[A(i,j)]M×M。歸一化圖像中象素點(diǎn)(i,j)處的值等于原圖像在(m,n)處的值 B.2四方向線素特征提取特征提取流程如圖4所示。首先利用已有算法提取歸一化后圖像[A(i,j)]M×M的輪廓(圖5),得到輪廓圖像[B(i,j)]M×M。對(duì)每一個(gè)輪廓點(diǎn),根據(jù)其相鄰輪廓點(diǎn)的位置信息,賦予該輪廓點(diǎn)橫、豎、撇、捺四種方向?qū)傩浴>唧w的說,設(shè)象素點(diǎn)(i,j)是輪廓點(diǎn),如果象素點(diǎn)(i-1,j)(或象素點(diǎn)(i+1,j))為輪廓點(diǎn),則輪廓點(diǎn)(i,j)具有橫方向?qū)傩?;如果象素點(diǎn)(i,j-1)(或象素點(diǎn)(i,j+1))為輪廓點(diǎn),則輪廓點(diǎn)(i,j)具有豎方向?qū)傩裕蝗绻笏攸c(diǎn)(i-1,j-1)(或象素點(diǎn)(i+1,j+1))為輪廓點(diǎn),則輪廓點(diǎn)(i,j)具有捺方向?qū)傩?;如果象素點(diǎn)(i-1,j+1)(或象素點(diǎn)(i+1,j-1))為輪廓點(diǎn),則輪廓點(diǎn)(i,j)具有撇方向?qū)傩浴R粋€(gè)輪廓點(diǎn)可以有不止一種方向?qū)傩?圖6)。如圖6(e)中的輪廓點(diǎn)既有豎屬性、又有撇屬性。將輪廓圖像[B(i,j)]M×M劃分成N1×N1個(gè)子塊(圖7),每個(gè)子塊的象素寬度為L。第(k,l)個(gè)子塊里面具有橫、豎、撇、捺四種方向?qū)傩缘妮喞c(diǎn)的數(shù)目分別記為Ckl(h),Ckl(v),Ckl(+),Ckl(-)。然后,再將輪廓圖像[B(i,j)]M×M劃分成N2×N2個(gè)小圖像塊,每個(gè)小圖像塊由若干個(gè)子塊構(gòu)成,相鄰小圖像塊間有若干個(gè)子塊的交疊。具體劃分規(guī)則如下對(duì)于第(x,y)(這里1≤x≤N2,1≤y≤N2)個(gè)小圖像塊,其所包含的子塊為(k,l)∈Dxy,Dxy表示表示如下子塊構(gòu)成的集合Kxy={(k,l)|max(1,2x-2)≤k≤min(N1,2x),max(1,2y-2)≤l≤min(N1,2y)}該小圖像塊的中心子塊為(2x-1,2y-1)(如圖8所示,圖中黑點(diǎn)表示中心子塊)。N1和N2的關(guān)系是N1=2N2-1。例如,對(duì)于第(1,1)個(gè)小圖象塊,x=1,y=1,從而可得它的中心子塊為(2×1-1,2×1-1)=(1,1),它由如下子塊構(gòu)成(1,1)、(1,2)、(2,1)、(2,2)。從第m(m=N2·x+y)小圖像塊中抽取四方向線素特征Cm(h)(x,y)=Σ(k,l)∈DxyCkl(h)·w(k-(2x-1),l-(2y-1))]]>Cm(v)(x,y)=Σ(k,l)∈DxyCkl(v)·w(k-(2x-1),l-(2y-1))]]>Cm(+)(x,y)=Σ(k,l)∈DxyCkl(+)·w(k-(2x-1),l-(2y-1))]]>Cm(-)(x,y)=Σ(k,l)∈DxyCkl(-)·w(k-(2x-1),l-(2y-1))]]>其中w(u,v)=12πσ2exp(-u2+v22σ2)]]>是高斯加權(quán)函數(shù),這里σ=2tπ,]]>t是小圖像塊間的交疊寬度(這里t=1)。
把每個(gè)小圖像塊得到的特征矢量合并成一個(gè)維數(shù)為4N22的特征向量,即得到了四方向線素特征VV=[C1(h),C1(v),C1(+),C1(-),...,CN22(h),CN22(v),CN22(+),CN22(-)]T]]>B.3特征變換我們采用兩種方法進(jìn)行特征變換。一種是直接LDA方法(圖9),另一種是先用PCA變換降維然后采用LDA提取最具鑒別性的特征(圖10)。設(shè)書寫者數(shù)目為c。對(duì)每個(gè)書寫者r(1≤r≤c)的特征字樣本采用上述方法提取四方向線素特征,得到其特征向量集合為{Vj(r)}1≤j≤Kr,Kr為該書寫者訓(xùn)練樣本數(shù)目。
B.3.1直接LDA方法進(jìn)行特征變換特征變換流程圖如圖9所示。
首先計(jì)算每個(gè)書寫者r(1≤r≤c)特征向量的中心μr和所有書寫者特征向量的中心μμr=1KrΣj=1KrVj(r),]]>μ=1cΣr=1cμr]]>然后計(jì)算類間散度矩陣Sb和平均類內(nèi)散度矩陣SwSb=1cΣr=1c(μr-μ)(μr-μ)T,]]>Sw=1cΣr=1c1KrΣj=1c(Vj(r)-μr)(Vj(r)-μr)T]]>尋找最佳變換矩陣W,使 最大。
用矩陣計(jì)算工具計(jì)算Sb的前l(fā)個(gè)最大的非零本征值ρj(j=1,2,...,l)和相應(yīng)的本征向量ζj(j=1,2,...,l),Sbζj=ρjζj。設(shè)Q=[ζ1,ζ2,...,ζl],Db=diag{ρ1,ρ2,...,ρl}。令H=QDb-12,]]>下面一步是對(duì)角化HTSwH。
用矩陣計(jì)算工具計(jì)算HTSwH的前d個(gè)最小本征值δj(j=1,2,...,d)和相應(yīng)的本征向量υj(j=1,2,...,d),HTSwHυj=δjυj。設(shè)P=[υ1,υ2,...,υd],Dw=diag{δ1,δ2,...,δd},則最后的變換矩陣為W=HPDw-12=QDb-12PDw-12,]]>相應(yīng)的特征變換為Z=WTVB.3.2先用PCA降維然后用LDA提取最具鑒別性特征整個(gè)特征變換流程如圖10所示。
對(duì)得到的特征向量,利用PCA變換壓縮特征維數(shù)。
計(jì)算總的均值μ和總的協(xié)方差矩陣∑t。
μ=1cΣr=1c1KrΣj=1KrVj(r),]]>Σt=1cΣr=1c1KrΣj=1Kr(Vj(r)-μ)(Vj(r)-μ)T;]]>利用矩陣計(jì)算工具計(jì)算∑t的n個(gè)非零本征值λj(j=1,2,...,n)和相應(yīng)的本征向量ξj(j=1,2,...,n),∑tξj=λjξj。將這些本征值從大到小排序,設(shè)排序后的本征值為λ′j(j=1,2,...,n),對(duì)應(yīng)的本征向量為ξ′j(j=1,2,...,n)。設(shè)α(0≤α≤1)為某個(gè)給定的經(jīng)驗(yàn)常數(shù)(我們?nèi)ˇ粒?.95),尋找最小的m,使得ΣJ=1mλj′Σj=1nλj′≥α]]>則PCA變換的變換矩陣U=[ξ′1,ξ2′,...,ξ′m]。相應(yīng)的原始特征V變換為m維特征YY=UTV第r書寫者的特征集經(jīng)PCA變換后為{Y1(r),Y2(r),..., }。
然后利用LDA變換提取反映不同書寫者書寫差異的鑒別特征。
計(jì)算每個(gè)書寫者r(1≤r≤c)特征向量的均值ηr和總的均值ηηr=1KrΣj=1KrYj(r),]]>η=1cΣr=1cηr]]>計(jì)算類間散度矩陣Sb和平均類內(nèi)散度矩陣SwSb=1cΣr=1c(ηr-η)(ηr-η)T,]]>Sw=1cΣr=1c1KrΣj=1Kr(Yj(r)-ηr)(Yj(r)-ηr)T]]>尋找變換矩陣Φ,使得 最大。
采用矩陣計(jì)算工具計(jì)算矩陣Sw-1Sb的前d(一般d=c-1)個(gè)最大的非零本征值γj(j=1,2,...,d)和相應(yīng)的本征向量ζj(j=1,2,...,d),(Sw-1Sb)ζj=γjζj,]]>則LDA變換的變換矩陣Φ=[ζ1,ζ2,...,ζd]。相應(yīng)的特征變換為Z=ΦTY,這里Z是最具判別性的d維特征。
最后,總的變換矩陣為W=UΦ,特征變換為Z=WTV。
B.4分類器設(shè)計(jì)對(duì)得到的最具可分性的特征Z,計(jì)算所有書寫者的均值Z(r)‾(r=1,2,...,c),]]>Z(r)‾=1KrΣj=1KrZj(r),]]>其中每個(gè)書寫者r(1≤r≤c)的最具可分性的特征集合為{Z1(r),Z2(r),..., },將均值存入庫文件中。這樣就完成了歐氏距離分類器的設(shè)計(jì)和訓(xùn)練。
C)測試系統(tǒng)的實(shí)現(xiàn)對(duì)未知書寫者的特征字,首先歸一化,然后提取四方向線素特征V,采用特征變換矩陣W將特征變換為Z=WTV,然后從庫文件中讀出所有書寫者的均值Z(r)‾(r=1,2,...,c),]]>計(jì)算Z到
的歐氏距離{D(r)}1≤r≤cD(r)=Σj=1d(zj-zj(r)‾),1≤r≤c]]>如果D(k)=min1≤r≤cD(r),]]>則該特征字是由書寫者k書寫的。
以下給出兩個(gè)具體的實(shí)現(xiàn)例子。
實(shí)施例1筆跡鑒別系統(tǒng)基于本發(fā)明的筆跡鑒別系統(tǒng)如圖11所示。實(shí)驗(yàn)中采用27個(gè)人書寫的16頁筆跡文檔,每頁文檔包含20個(gè)漢字筆跡。先用掃描儀將這些筆跡文檔輸入到計(jì)算機(jī),然后用OCR軟件得到單個(gè)字的筆跡樣本。將每個(gè)單字筆跡樣本,歸一化成65×65的大小。四方向線素特征提取中子塊的劃分方法按圖7的方式劃分。這里N1=13,L=5,N2=7。按圖4的流程提取四方向線素特征。采用兩種方法進(jìn)行特征變換,一種是采用直接LDA變換方法,采用10個(gè)樣本訓(xùn)練,6個(gè)樣本測試,實(shí)驗(yàn)結(jié)果如表1所示。另一種是先用PCA變換降維,然后再LDA變換。PCA變換中的參數(shù)α=0.95,即PCA變換后的能量占總能量的95%,然后用LDA變換將特征維數(shù)壓縮為d=26。實(shí)驗(yàn)中每個(gè)書寫者用10個(gè)樣本訓(xùn)練,6個(gè)樣本測試。實(shí)驗(yàn)結(jié)果如表2所示。
表1 直接利用LDA進(jìn)行特征變換的筆跡鑒別結(jié)果
表2 先PCA后LDA進(jìn)行特征變換的筆跡鑒別結(jié)果
從表1、表2可看出,利用單個(gè)特征字的筆跡鑒別平均鑒別正確率分別為92.69和92.28%,與已有文獻(xiàn)相比,這是一個(gè)非常好的鑒別結(jié)果。
圖13所示的是先用PCA降維后用LDA提取最具鑒別特征的特征變換方法在測試集上廣義置信度分布直方圖。圖中“平均正確樣本數(shù)”表示20個(gè)特征字符鑒別正確的樣本數(shù)目總和的平均值,“平均錯(cuò)誤樣本數(shù)”表示20個(gè)特征字符鑒別錯(cuò)誤的樣本數(shù)目總和的平均值?!半y正確樣本數(shù)”表示“難”作為特征字鑒別正確的樣本數(shù)目,“難錯(cuò)誤樣本數(shù)”表示“難”作為特征字鑒別錯(cuò)誤的樣本數(shù)目?!叭苏_樣本數(shù)”、“人錯(cuò)誤樣本數(shù)”表示的意思類似。從圖中可看出,當(dāng)廣義置信度大于0.4時(shí),鑒別錯(cuò)誤的樣本數(shù)目為0,表示只要廣義置信度大于0.4,所作的判決是非??煽康?。
實(shí)施例2公安部筆跡驗(yàn)證(writer verification)系統(tǒng)公安部的筆跡驗(yàn)證系統(tǒng)需要完成的功能是通過給定的樣本訓(xùn)練出驗(yàn)證數(shù)據(jù)庫文件,判斷檢材是否是由書寫樣本的犯罪嫌疑人書寫的,從而為司法判斷提供依據(jù)。該問題實(shí)際上是一個(gè)兩類問題,其難點(diǎn)在于訓(xùn)練過程是實(shí)時(shí)的,而且沒有偽樣本。
整個(gè)驗(yàn)證系統(tǒng)框圖如圖12所示。主要由三部分組成●偽樣本生成部分該部分主要用于生成偽樣本庫。我們采用實(shí)驗(yàn)室收集的1806套不同人書寫的一級(jí)手寫漢字(3755個(gè)漢字)樣本作為單字筆跡的偽樣本。將1806個(gè)偽樣本采用K-均值聚類算法聚類成40類,這40個(gè)類中心作為偽樣本的代表點(diǎn)。將這40個(gè)類中心保存在偽樣本庫文件中。
●實(shí)時(shí)訓(xùn)練部分對(duì)于輸入的樣本,通過掃描儀輸入計(jì)算機(jī),采用OCR軟件得到單字筆跡,然后讀出偽樣本庫中相應(yīng)單字對(duì)應(yīng)的40個(gè)聚類中心。于是筆跡驗(yàn)證問題就變成了兩類筆跡鑒別問題,一類是真書寫者,一類是偽書寫者,也就是說,c=2。取特征變換后特征維數(shù)d=1,采用本文中給出的算法得到變換矩陣W、真書寫者類中心 和偽書寫者類中心 則域值h=z(1)‾+z(2)‾2.]]>將變換矩陣W和域值h存入校驗(yàn)庫文件中。
●驗(yàn)證部分對(duì)于檢材,用掃描儀輸入計(jì)算機(jī),用OCR軟件得到單字筆跡,提取四方向線素特征V。然后讀出變換矩陣W和域值h,采用下面的判別規(guī)則判斷該檢材是否是該犯罪嫌疑人書寫的如果WTV≤h,則接受V;否則,拒絕V。
實(shí)驗(yàn)中采用27個(gè)人書寫的20個(gè)字符筆跡作實(shí)驗(yàn),每人書寫每個(gè)字符16次。在進(jìn)行驗(yàn)證時(shí),對(duì)每個(gè)字符筆跡,分別采用每個(gè)人的10個(gè)字符筆跡作為真訓(xùn)練樣本,6個(gè)字符筆跡作為真測試樣本,其他26個(gè)人的416(16×26=416)個(gè)字符筆跡作為偽測試樣本,如此循環(huán)27次,使得每個(gè)人都作為真筆跡的書寫者1次。實(shí)驗(yàn)結(jié)果如表3所示。
從表3可看出,基于單字的字符校驗(yàn)的平均兩類錯(cuò)誤率分別為5.99%(FRR)和6.65%(FAR),是目前基于單字的筆跡校驗(yàn)的最好的。
圖14所示的是置信度分布直方圖。圖中“平均接受樣本數(shù)目”表示真樣本數(shù)目的平均值,“平均拒絕樣本數(shù)目”表示偽樣本數(shù)目的平均值。置信度公式中的β=0.4。從圖中可看出真樣本多集中在置信度較大的區(qū)域,偽樣本則集中在置信度小的區(qū)域。說明本方法具有很高的可靠性。
表3字符校驗(yàn)兩類錯(cuò)誤率
綜上所述,本發(fā)明提出的基于單字的筆跡鑒別方法具有以下優(yōu)點(diǎn)1)本方法基于單字字符筆跡,既可用于可獲取整篇文檔的筆跡鑒別也可用于只能得到幾個(gè)字符的筆跡鑒別,具有很大靈活性。
2)本方法不僅可用于筆跡鑒別(Writer Identification),也可用于筆跡驗(yàn)證(WriterVerification),并且具有非常高的正確率和可靠性。
本發(fā)明在實(shí)驗(yàn)中獲得了優(yōu)異的識(shí)別結(jié)果,具有非常廣泛的應(yīng)用前景。
權(quán)利要求
1.基于單個(gè)字符的統(tǒng)計(jì)筆跡鑒別和驗(yàn)證方法,其特征在于,它在對(duì)處理字符筆跡對(duì)象進(jìn)行必要預(yù)處理后,先提取能很好反映漢字特點(diǎn)的四方向線素特征,再在此基礎(chǔ)上,采用下述兩種方法之一去選取反映不同書寫者差異的最優(yōu)鑒別特征,其中一種方法是采用直接LDA(線性鑒別分析)變換提取最具鑒別性的特征,另一種方法是先用PCA(主分量分析)變換降維得到最有效的特征,然后用LDA變換提取最具鑒別性的最優(yōu)鑒別特征。在由圖像采集設(shè)備和計(jì)算機(jī)組成的系統(tǒng)中,它依次含有以下步驟(1)書寫筆跡的采集掃描輸入包含書寫者筆跡的文本,先進(jìn)行書寫字符切分,再采用字符識(shí)別技術(shù)得到相同特征字的筆跡,由此完成用以訓(xùn)練和鑒別的書寫者筆跡的采集,建立訓(xùn)練樣本數(shù)據(jù)庫;(2)預(yù)處理,包含字符位置和大小的線性歸一化(2.1)計(jì)算圖像的重心設(shè)原始特征字圖像為[F(i,j]W×H,其中,W為圖像寬度,H為圖像高度,F(xiàn)(i,j)為圖像位于第i行第j列的象素點(diǎn)的值,則圖像的重心G=(Gi,Gj),其中Gi=Σi=1WΣj=1Hi·F(i,j)Σi=1WΣj=1HF(i,j),]]>Gj=Σi=1WΣj=1Hi·F(i,j)Σi=1WΣj=1HF(i,j);]]>(2.2)用重心——中心歸一化方法把原始圖像歸一化到M×M大小歸一化后圖像[A(i,j)]M×M在(i,j)處的象素值為原始圖像在(m,n)處的象素值 (3)提取特征字符的四方向線素特征(3.1)用已有的輪廓提取算法提取歸一化后的特征字圖像[A(i,j)]M×M的輪廓,得到輪廓圖像[B(i,j)]M×M;(3.2)四方向線素特征的提取先把輪廓圖像[B(i,j]M×M劃分成N1×N1個(gè)子塊,每個(gè)子塊的象素寬度為L。分別統(tǒng)計(jì)第(k,l)個(gè)子塊里面具有橫、豎、撇、捺方向?qū)傩缘妮喞c(diǎn)的數(shù)目,并記為Ckl(h),Ckl(v),Ckl(+),Ckl(g),其中,1≤k≤N1,1≤l≤N1;再次把輪廓圖像[B(i,j)]M×M劃分成N2×N2個(gè)小圖像塊。其中第(x,y)個(gè)小圖像塊(1≤x≤N2,1≤y≤N2)由子塊(k,l)構(gòu)成,這里(k,l)∈Dxy,Dxy表示如下子塊構(gòu)成的集合Dxy={(k,l)max(1,2x-2)≤k≤min(N1,2x),max(1,2y-2)≤l≤min(N1,2y)}該小圖像塊的中心子塊為(2x-1,2y-1),N1=2N2-1。從第m(m=N2·x+y)個(gè)小圖像塊中抽取四方向線素特征Cm(h)(x,y)=Σ(k,l)∈DxyCkl(h)·w(k-(2x-1),l-(2y-1))]]>Cm(h)(x,y)=Σ(k,l)∈DxyCkl(h)·w(k-(2x-1),l-(2y-1))]]>Cm(h)(x,y)=Σ(k,l)∈DxyCkl(h)·w(k-(2x-1),l-(2y-1))]]>Cm(h)(x,y)=Σ(k,l)∈DxyCkl(h)·w(k-(2x-1),l-(2y-1))]]>其中w(u,v)=12πσ2exp(-u2+v22σ2)]]>是高斯加權(quán)函數(shù),這里σ=2tπ,]]>t是小圖像塊的交疊寬度,取t=1;(3.3)把每個(gè)小圖像塊得到的特征向量合并成一個(gè)維數(shù)為4N22的特征向量,即為四方向線素特征VV=[C1(h),C1(v),C1(+),C1(-),···,CN22(h),CN22(v),CN22(+),CN22(-)]T;]]>(4)線性特征變換設(shè)書寫者數(shù)目為c,對(duì)第r(1≤r≤c)個(gè)書寫者的特征字樣本采用上述方法提取四方向線素特征,得到其特征向量集合為{V1(r),V2(r),..., },其中Kr為該書寫者訓(xùn)練樣本數(shù)目,Vj(r)(j=1,2,...,Kr)是4N22維的特征向量;則利用直接LDA變換提取最具鑒別性的特征如下先計(jì)算每個(gè)書寫者r(1≤r≤c)特征向量的中心μr和所有書寫者特征向量的中心μμr=1KrΣj=1KrVj(r),]]>μ=1cΣr=1cμr]]>再計(jì)算類間散度矩陣Sb和平均類內(nèi)散度矩陣SwSb=1cΣr=1c(μr-μ)(μr-μ)T]]>Sw=1cΣr=1c1KrΣj=1Kr(Vj(r)-μr)(Vj(r)-μr)T]]>尋找最佳變換矩陣W,使 最大,則相應(yīng)的特征變換為Z=WTV;(5)進(jìn)行基于單個(gè)字符的統(tǒng)計(jì)筆跡鑒別,即已知某未知書寫者的特征字筆跡樣本是由c個(gè)書寫者中的某個(gè)人書寫的,現(xiàn)要確定該特征字筆跡樣本的書寫者是這c個(gè)書寫者中的哪一個(gè);(5.1)設(shè)計(jì)分類器對(duì)最具可分性的特征向量Z,計(jì)算所有書寫者的均值向量Z(r)‾(r=1,2,...,c),]]>Z(r)‾=1KrΣj=1KrZj(r),]]>其中每個(gè)書寫者r(1≤r≤c)的最具可分性的特征集合為{Z1(r),Z2(r),..., },將各書寫者的鑒別特征均值向量存入鑒別特征數(shù)據(jù)庫文件中;(5.2)鑒別對(duì)未知書寫者的特征字,首先歸一化,再提取四方向線素特征向量V,采用特征變換矩陣W將特征向量V變換為Z=WTV=[z1,z2,...zc,]T,d是變換后特征的維數(shù);從庫文件中讀出所有書寫者的均值向量Z(r)‾=[z1(r)‾,z2(r)‾,...,zd(r)‾]T,r=1,2,...,c,]]>計(jì)算Z到 的歐氏距離D(r)D(r)=Σj=1d(zj-zj(r)‾),1≤r≤c]]>若D(k)=min1≤r≤cD(r),]]>則該特征字是由書寫者k書寫的,即k=argr(min1≤r≤cD(r));]]>(6)進(jìn)行基于單個(gè)字符的統(tǒng)計(jì)筆跡驗(yàn)證,即對(duì)于輸入的某個(gè)未知筆跡,判斷是否為某個(gè)書寫者寫的(6.1)生成驗(yàn)證數(shù)據(jù)庫文件設(shè)有K1個(gè)真筆跡樣本,K2個(gè)偽筆跡樣本,分別計(jì)算真樣本和偽樣本的均值 z(t)‾=1K1ΣJ=1K1zJ(t),i=1,2,]]>則判別域值h=z(1)‾+z(2)‾2.]]>將判別域值和變換矩陣存入驗(yàn)證數(shù)據(jù)庫文件中;(6.2)驗(yàn)證對(duì)需要驗(yàn)證的筆跡樣本,首先歸一化,再提取四方向線素特征V,采用特征變換矩陣W將特征變換為z=WTV,則判別規(guī)則為若z≤h,則接受z,否則,拒絕z。
2.根據(jù)權(quán)利要求1所述的基于單個(gè)字符的統(tǒng)計(jì)筆跡鑒別和驗(yàn)證方法,其特征在于,在作所述的線性特征變換時(shí),先用PCA變換降維,然后采用LDA變換提取最具鑒別性的特征(1)利用PCA主分量分析方法進(jìn)行特征維數(shù)壓縮(1.1)先計(jì)算總的均值μ和總的協(xié)方差矩陣∑tμ=1cΣr=1c1KrΣJ=1KrV1(r)]]>Σt=1cΣr=1c1KrΣJ=1Kr(Vj(r)-μ)(Vj(r)-μ)T]]>(1.2)計(jì)算∑t的n個(gè)非零本征值λj(j=1,2,...,n)和相應(yīng)的本征向量ξj(j=1,2,...,n),∑tξj=λjξj;(1.3)把本征值從大到小排序,排序后的本征值為λ′j(j=1,2,...,n),對(duì)應(yīng)的本征向量為ξ′j(j=1,2,...,n);(1.4)設(shè)定某個(gè)給定的經(jīng)驗(yàn)常數(shù)α,0≤α≤1,取α=0.95;(1.5)尋找最小的m,使ΣJ=1mλJ′ΣJ=1nλJ′≥α;]]>(1.6)得PCA變換的變換矩陣U=[ξ′1,ξ2′,...,ξ′m],從而把相應(yīng)的4N22維原始特征向量V變換為m維特征向量Y,m<4N22Y=UTV;(1.7)第r書寫者的特征集合經(jīng)PCA變換后變?yōu)閧Y1(r),Y2(r),..., };(2)用LDA線性鑒別分析提取反映不同書寫者差異的鑒別特征(2.1)計(jì)算每個(gè)書寫者r(1≤r≤c)特征向量的中心ηr和所有書寫者特征向量的中心ηηr=1KrΣj=1KrVj(r),]]>η=1cΣr=1cηr;]]>(2.2)計(jì)算類間散度矩陣Sb和平均類內(nèi)散度矩陣SwSb=1cΣr=1c(ηr-η)(ηr-η)T,]]>Sw=1cΣr=1c1Kr(Yj(r)-ηr)(Yj(r)-ηr)T;]]>(2.3)尋找變換矩陣Φ,使得 最大;(2.4)相應(yīng)的特征變換為Z=ΦTY;(2.5)把PCA變換和LDA變換合并成一個(gè)單一的變換矩陣,得W=UΦ,相應(yīng)的特征變換為Z=WTV。
全文摘要
基于單個(gè)字符的統(tǒng)計(jì)筆跡鑒別和驗(yàn)證方法屬于筆跡鑒別領(lǐng)域。其特征在于,它在對(duì)處理字符筆跡對(duì)象進(jìn)行必要預(yù)處理后,先提取能很好反映漢字特點(diǎn)的四方向線素特征,再在此基礎(chǔ)上,采用下述兩種方法之一去選取反映不同書寫者差異的最優(yōu)鑒別特征,其中一種方法是采用直接LDA(線性鑒別分析)變換提取最具鑒別性的特征,另一種方法是先用PCA(主分量分析)變換降維得到最有效的特征,然后用LDA變換提取最具鑒別性的最優(yōu)鑒別特征。采用歐氏距離分類器進(jìn)行分類鑒別。本發(fā)明的平均鑒別正確率可達(dá)92.69%。
文檔編號(hào)G06K9/48GK1482571SQ0310981
公開日2004年3月17日 申請(qǐng)日期2003年4月11日 優(yōu)先權(quán)日2003年4月11日
發(fā)明者丁曉青, 王賢良, 劉長松, 彭良瑞, 方馳 申請(qǐng)人:清華大學(xué)