本發(fā)明涉及圖像識別,尤其涉及一種利用筆跡輪廓特征來進行筆跡鑒別的方法及系統(tǒng)。
背景技術:
生物特征識別技術是利用指紋、筆跡和聲音等一些習慣性的生物特征來鑒別一個人真實身份的一種技術。具體一點來說,生物特征識別技術就是通過生物傳感器采集人體固有的生理特征和行為特征數(shù)據(jù),利用計算機技術和生物統(tǒng)計學原理對采集的特征數(shù)據(jù)進行處理、分類,達到對個人身份鑒別的目的。
筆跡是眾多生物特征的一種,在較長的一段時間里書寫人的筆跡是穩(wěn)定的,不同書寫人的筆跡特點不一樣,具有不同的書寫特征,并且筆跡的采集要比指紋和虹膜等容易,需要的采集設備便宜簡單,作為生物識別特征的一種,目前已經(jīng)得到廣泛的應用。相對于指紋、虹膜等生物識別技術,筆跡鑒別技術有著更為廣闊的市場和應用場景,除了在公檢法等專業(yè)的筆跡鑒別領域發(fā)揮著重要作用,在商業(yè)市場的應用也得到了更加迅猛的發(fā)展,如金融、高等教育自學考試、辦公自動化和電商等領域的相關應用場景。筆跡鑒別在不同的領域發(fā)揮著重要的作用,很多領域都對筆跡鑒別的應用有不同的需求。
筆跡鑒別又分為在線和離線,在線簽名提供了更多的動態(tài)信息,且這種信息不易模仿,所以比離線要容易鑒定一些。目前在線簽名系統(tǒng)的交叉錯誤率已降到1%以下,國外也已有實用產(chǎn)品面世。離線筆跡鑒別則是書寫者在普通紙張上書寫完之后,再利用照像機、掃描儀等光學成像設備提取書寫者的筆跡。離線筆跡鑒別對于設備環(huán)境的要求較之在線方式寬松許多,如果能較大程度的提高其鑒別正確率,將會比在線方式有更大的應用前景。
技術實現(xiàn)要素:
本發(fā)明的發(fā)明目的,在于提供一種利用筆跡輪廓特征來進行筆跡鑒別的方法來提高評估離線筆跡鑒別的鑒別性能。
為達上述目的,本發(fā)明提供了利用筆跡輪廓特征來進行筆跡鑒別的方法,包括以下步驟:
獲取待測簽名圖像并進行預處理,具體包括對待測簽名圖像二值化處理,并對二值化處理后的圖像進行輪廓提取,得到筆跡輪廓;
提取筆跡輪廓的特征信息,包括基本鏈碼特征、一階差分鏈碼特征、二階差分鏈碼特征、微分鏈碼特征、方向鏈碼特征,局部基本鏈碼特征、局部一階差分鏈碼特征和局部二階差分鏈碼特征;
將各個特征向量與預設訓練模板庫中的所有樣本筆跡的特征向量的均值進行距離計算,將計算出的所有距離值進行大小排序,最小距離者為待測簽名的書寫者。
接上述技術方案,輪廓提取具體為將二值化后的筆跡圖像的內(nèi)部點掏空,對于圖像中某一筆跡點,若其8個相鄰點的灰度值都是0,則該點就是筆跡內(nèi)部點,將其灰度值置為255,否則灰度值不變。
接上述技術方案,其中:
所述基本鏈碼特征提取時,具體將圖像輪廓用8方向鏈碼進行表示,每個輪廓點對應一個方向值,統(tǒng)計每個方向值的個數(shù)所占百分比;
所述一階差分鏈碼特征提取時,具體將上述基本鏈碼進行差分轉(zhuǎn)化為一階差分鏈碼,則每個輪廓點的方向值會發(fā)生變化,統(tǒng)計每個方向值的個數(shù)所占百分比;
所述二階差分鏈碼特征提取時,具體將上述一階差分鏈碼進行差分轉(zhuǎn)化為二階差分鏈碼,則每個輪廓點的方向值會發(fā)生變化,統(tǒng)計每個方向值的個數(shù)所占百分比;
所述微分鏈碼特征提取時,具體統(tǒng)計當前輪廓點方向值和下個輪廓點方向值發(fā)生了改變的鏈碼對數(shù),并將每個鏈碼對個數(shù)所占百分比組合成48維特征向量;
所述方向鏈碼特征提取時,具體統(tǒng)計當前輪廓點方向值和它的上個輪廓點方向值以及它的下個輪廓點方向值之間發(fā)生了改變的鏈碼對數(shù),并將每個鏈碼對個數(shù)所占百分比組合成288維特征向量;
所述局部基本鏈碼特征提取時,具體統(tǒng)計在每個n×n的局部方格中每個基本鏈碼方向值的個數(shù)所占百分比;
所述局部一階差分鏈碼特征提取時,具體統(tǒng)計在每個n×n的局部方格中每個一階差分鏈碼方向值的個數(shù)所占百分比;
所述局部二階差分鏈碼特征提取時,具體統(tǒng)計在每個n×n的局部方格中每個二階差分鏈碼方向值的個數(shù)所占百分比。
接上述技術方案,具體通過距離分類器進行距離計算,距離分類器包括歐氏距離分類器、卡方距離分類器和曼哈頓距離分類器。
本發(fā)明還提供了一種利用筆跡輪廓特征來進行筆跡鑒別的系統(tǒng),包括:
待測簽名獲取模塊,用于獲取待測簽名圖像;
預處理模塊,用于對獲取的待測簽名圖像進行預處理,具體包括對待測簽名圖像二值化處理,并對二值化處理后的圖像進行輪廓提取,得到筆跡輪廓;
特征提取模塊,用于提取筆跡輪廓的特征信息,包括基本鏈碼特征、一階差分鏈碼特征、二階差分鏈碼特征、微分鏈碼特征、方向鏈碼特征,局部基本鏈碼特征、局部一階差分鏈碼特征和局部二階差分鏈碼特征;
距離計算模塊,用于將各個特征向量與預設訓練模板庫中的所有樣本筆跡的特征向量的均值進行距離計算;
匹配模塊,用于將計算出的所有距離值進行大小排序,最小距離者為待測簽名的書寫者。
接上述技術方案,所述預處理模塊在進行輪廓提取時,具體用于將二值化后的筆跡圖像的內(nèi)部點掏空,對于圖像中某一筆跡點,若其8個相鄰點的灰度值都是0,則該點就是筆跡內(nèi)部點,將其灰度值置為255,否則灰度值不變。
接上述技術方案,所述特征提取模塊具體包括:
基本鏈碼特征提取子模塊:將圖像輪廓用8方向鏈碼進行表示,則每個輪廓點會對應有一個方向值,該模塊統(tǒng)計了每個方向值的個數(shù)所占百分比;
一階差分鏈碼特征提取子模塊:將上述基本鏈碼進行差分轉(zhuǎn)化為一階差分鏈碼,則每個輪廓點的方向值會發(fā)生變化,該模塊統(tǒng)計了每個方向值的個數(shù)所占百分比;
二階差分鏈碼特征提取子模塊:將上述一階差分鏈碼進行差分轉(zhuǎn)化為二階差分鏈碼,則每個輪廓點的方向值會發(fā)生變化,該模塊統(tǒng)計了每個方向值的個數(shù)所占百分比;
微分鏈碼特征提取子模塊:該模塊統(tǒng)計了當前輪廓點方向值和下個輪廓點方向值發(fā)生了改變的鏈碼對數(shù),并將每個鏈碼對個數(shù)所占百分比組合成48維特征向量;
方向鏈碼特征提取子模塊:該模塊統(tǒng)計了當前輪廓點方向值和它的上個輪廓點方向值以及它的下個輪廓點方向值之間發(fā)生了改變的鏈碼對數(shù),并將每個鏈碼對個數(shù)所占百分比組合成288維特征向量;
局部基本鏈碼特征提取子模塊:該模塊統(tǒng)計了在每個n×n的局部方格中每個基本鏈碼方向值的個數(shù)所占百分比;
局部一階差分鏈碼特征提取子模塊:該模塊統(tǒng)計了在每個n×n的局部方格中每個一階差分鏈碼方向值的個數(shù)所占百分比;
局部二階差分鏈碼特征提取子模塊:該模塊統(tǒng)計了在每個n×n的局部方格中每個二階差分鏈碼方向值的個數(shù)所占百分比。
接上述技術方案,所述距離計算模塊具體通過距離分類器進行距離計算,距離分類器包括歐氏距離分類器、卡方距離分類器和曼哈頓距離分類器。
本發(fā)明產(chǎn)生的有益效果是:本發(fā)明提取了手寫筆跡的輪廓特征,能更好的利用了筆跡的邊緣方向信息,對反映出書寫者的書寫風格有明顯的效果。從硬件開銷來看,本發(fā)明中需要用到的硬件設備主要是個人計算機,不會增加額外的硬件開銷;從軟件開發(fā)來看,本發(fā)明中用到了輪廓特征提取和各種距離匹配算法,優(yōu)選出最佳距離度量方式,能達到很好的筆跡鑒別效果。本發(fā)明最大的特色是將這兩種技術完美結合,解決現(xiàn)有的離線筆跡鑒別系統(tǒng)中存在的一些弊端。
附圖說明
下面將結合附圖及實施例對本發(fā)明作進一步說明,附圖中:
圖1為本發(fā)明實施例離線筆跡鑒別方法流程圖;
圖2為本發(fā)明實施例離線筆跡鑒別系統(tǒng)流程圖;
圖3為本發(fā)明實施例筆跡圖像預處理模塊框圖;
圖4為本發(fā)明實施例筆跡圖像預處理后結果圖;
圖5為本發(fā)明實施例筆跡圖像特征提取結果圖。
具體實施方式
為了使本發(fā)明的目的、技術方案及優(yōu)點更加清楚明白,以下結合附圖及實施例,對本發(fā)明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
本發(fā)明實施例的利用筆跡輪廓特征來進行筆跡鑒別的方法,如圖1所示,包括以下步驟:
s1、獲取待測筆跡圖像;
s2、對獲取的待測筆跡圖像進行預處理,具體包括對待測簽名圖像二值化處理,并對二值化處理后的圖像進行輪廓提取,得到筆跡輪廓;
s3、提取筆跡輪廓的特征信息,包括基本鏈碼特征、一階差分鏈碼特征、二階差分鏈碼特征、微分鏈碼特征、方向鏈碼特征,局部基本鏈碼特征、局部一階差分鏈碼特征和局部二階差分鏈碼特征;
s4、將待測筆跡的特征向量通過距離分類器進行分類鑒別。
其中步驟s2中輪廓提取具體為將二值化后的筆跡圖像的內(nèi)部點掏空,對于圖像中某一筆跡點,若其8個相鄰點的灰度值都是0,則該點就是筆跡內(nèi)部點,將其灰度值置為255,否則灰度值不變。
步驟s3中,基本鏈碼特征提取時,具體將圖像輪廓用8方向鏈碼進行表示,8方向定義為水平向右的方向值為1,順時針依次為2、3、4、5、6、7、8,在對筆跡輪廓圖像進行編碼時,首先找到圖像上最左方且最上方的輪廓像素點并將其記為p,其方向值標注為9,在這里數(shù)字9不代表某個方向,僅僅只是作為起始點的標記,接著順時針搜索點p的八鄰域,將找到的第一個未被標注的輪廓像素點記為q,并停止搜索,此時q點的方向值由向量
一階差分鏈碼特征提取時,具體將上述基本鏈碼進行差分轉(zhuǎn)化為一階差分鏈碼,則每個輪廓點的方向值會發(fā)生變化,統(tǒng)計每個方向值的個數(shù)所占百分比,當用鏈碼來表示目標的邊界時,旋轉(zhuǎn)會使其發(fā)生變化,而一階差分鏈碼則可以解決這個問題。
二階差分鏈碼特征提取時,具體將上述一階差分鏈碼進行差分轉(zhuǎn)化為二階差分鏈碼,則每個輪廓點的方向值會發(fā)生變化,統(tǒng)計每個方向值的個數(shù)所占百分比,它能夠反映筆跡圖像輪廓的角度變化。
微分鏈碼特征提取時,具體統(tǒng)計當前輪廓點方向值和下個輪廓點方向值發(fā)生了改變的鏈碼對數(shù),并將每個鏈碼對個數(shù)所占百分比組合成48維特征向量,它能夠體現(xiàn)出筆跡中的細節(jié)變化。
方向鏈碼特征提取時,具體統(tǒng)計當前輪廓點方向值和它的上個輪廓點方向值以及它的下個輪廓點方向值之間發(fā)生了改變的鏈碼對數(shù),并將每個鏈碼對個數(shù)所占百分比組合成288維特征向量,該特征向量的每一維都代表了一組相鄰三個鏈碼出現(xiàn)的概率。
局部基本鏈碼特征提取時,具體統(tǒng)計在每個n×n的局部方格中每個基本鏈碼方向值的個數(shù)所占百分比,它相當于基本鏈碼特征基于局部網(wǎng)格窗口的一個變形,能夠體現(xiàn)筆跡的局部特征信息。
局部一階差分鏈碼特征提取時,具體統(tǒng)計在每個n×n的局部方格中每個一階差分鏈碼方向值的個數(shù)所占百分比,它相當于一階差分鏈碼特征基于局部網(wǎng)格窗口的一個變形,能夠體現(xiàn)筆跡的局部特征信息。
局部二階差分鏈碼特征提取時,具體統(tǒng)計在每個n×n的局部方格中每個二階差分鏈碼方向值的個數(shù)所占百分比,它相當于二階差分鏈碼特征基于局部網(wǎng)格窗口的一個變形,能夠體現(xiàn)筆跡的局部特征信息。
步驟s4中,具體通過距離分類器進行分類,距離分類器包括歐氏距離分類器、卡方距離分類器和曼哈頓距離分類器。
本發(fā)明的筆跡圖像采集:由于本發(fā)明主要著力于離線手寫中文筆跡的特征提取與鑒別,因此沒有采用數(shù)據(jù)庫來管理圖像或提取的特征,而是直接采用圖像文件保存筆跡圖像的方法,直接打開對應的筆跡圖像文件夾。
二值化和輪廓提取為預處理部分,為特征提取做準備工作。
本發(fā)明實施例二值化用到的是otsu算法,其基本原理是以最佳閾值將圖像的灰度直方圖分割成兩部分,使兩部分之間的方差取最大值,即分離性最大。
輪廓提取就是獲取圖像的外部輪廓,在二值化后的圖像中,設背景像素點灰度值為255,筆跡點灰度值為0。對于圖像中某一筆跡點,若它的8個相鄰點的灰度值都是0,則該點就是筆跡內(nèi)部點,將其灰度值置為255,否則灰度值不變。二值化后的筆跡圖像輪廓提取其實就是將筆跡中的內(nèi)部點掏空。
本發(fā)明實施例利用筆跡輪廓特征來進行筆跡鑒別的系統(tǒng),包括:
待測筆跡獲取模塊,用于獲取待測筆跡圖像;
預處理模塊,用于對獲取的待測筆跡圖像進行預處理,具體包括對待測筆跡名圖像二值化處理,并對二值化處理后的圖像進行輪廓提取,得到筆跡輪廓;
特征提取模塊,用于提取筆跡輪廓的特征信息,包括基本鏈碼特征、一階差分鏈碼特征、二階差分鏈碼特征、微分鏈碼特征、方向鏈碼特征,局部基本鏈碼特征、局部一階差分鏈碼特征和局部二階差分鏈碼特征;
分類鑒別模塊,用于對待測筆跡進行分類鑒別,具體通過距離分類器進行分類,距離分類器包括歐氏距離分類器、卡方距離分類器和曼哈頓距離分類器。
特征提取模塊中包括基本鏈碼特征提取子模塊、一階差分鏈碼特征提取子模塊、二階差分鏈碼特征提取子模塊、微分鏈碼特征提取子模塊、方向鏈碼特征提取子模塊、局部基本鏈碼特征提取子模塊、局部一階差分鏈碼特征提取子模塊和局部二階差分鏈碼特征提取子模塊。
基本鏈碼特征提取子模塊:將圖像輪廓用8方向鏈碼進行表示,8方向定義為水平向右的方向值為1,順時針依次為2、3、4、5、6、7、8,在對筆跡輪廓圖像進行編碼時,首先找到圖像上最左方且最上方的輪廓像素點并將其記為p,其方向值標注為9,在這里數(shù)字9不代表某個方向,僅僅只是作為起始點的標記,接著順時針搜索點p的八鄰域,將找到的第一個未被標注的輪廓像素點記為q,并停止搜索,此時q點的方向值由向量
一階差分鏈碼特征提取子模塊:將上述基本鏈碼進行差分轉(zhuǎn)化為一階差分鏈碼,則每個輪廓點的方向值會發(fā)生變化,該模塊統(tǒng)計了每個方向值的個數(shù)所占百分比;
二階差分鏈碼特征提取子模塊:將上述一階差分鏈碼進行差分轉(zhuǎn)化為二階差分鏈碼,則每個輪廓點的方向值會發(fā)生變化,該模塊統(tǒng)計了每個方向值的個數(shù)所占百分比;
微分鏈碼特征提取子模塊:該模塊統(tǒng)計了當前輪廓點方向值和下個輪廓點方向值發(fā)生了改變的鏈碼對數(shù),并將每個鏈碼對個數(shù)所占百分比組合成48維特征向量;
方向鏈碼特征提取子模塊:該模塊統(tǒng)計了當前輪廓點方向值和它的上個輪廓點方向值以及它的下個輪廓點方向值之間發(fā)生了改變的鏈碼對數(shù),并將每個鏈碼對個數(shù)所占百分比組合成288維特征向量;
局部基本鏈碼特征提取子模塊:該模塊統(tǒng)計了在每個n×n的局部方格中每個基本鏈碼方向值的個數(shù)所占百分比;
局部一階差分鏈碼特征提取子模塊:該模塊統(tǒng)計了在每個n×n的局部方格中每個一階差分鏈碼方向值的個數(shù)所占百分比;
局部二階差分鏈碼特征提取子模塊:該模塊統(tǒng)計了在每個n×n的局部方格中每個二階差分鏈碼方向值的個數(shù)所占百分比;
分類鑒別模塊包括的分類器有歐氏距離分類器、卡方距離分類器和曼哈頓距離分類器。
歐氏距離分類器:采用歐式距離來計算測試樣本的特征向量與訓練樣本的特征向量之間的距離。系統(tǒng)首先采用筆跡圖像進行訓練,得到一個模板值。當筆跡需要鑒別時,直接計算其特征向量與模板之間的歐氏距離值。距離越小說明相似度越高,則將最小距離判定為書寫者。距離計算公式如下:
其中dist為待測樣本的距離值,fi為待測樣本的特征值,ti為訓練樣本某特征的均值,n為特征數(shù)。
卡方距離分類器:采用卡方距離來計算測試樣本的特征向量與訓練樣本的特征向量之間的距離。原理及操作過程與上述歐式距離分類器相同。距離計算公式如下:
其中dist為待測樣本的距離值,fi為待測樣本的特征值,ti為訓練樣本某特征的均值,n為特征數(shù)。
曼哈頓距離分類器:采用曼哈頓距離來計算測試樣本的特征向量與訓練樣本的特征向量之間的距離。原理及操作過程與上述歐式距離分類器相同。距離計算公式如下:
其中dist為待測樣本的距離值,fi為待測樣本的特征值,ti為訓練樣本某特征的均值,n為特征數(shù)。
本發(fā)明在筆跡鑒別的過程中,采用書寫者的離線筆跡圖像,對圖像進行預處理,提取預處理后的圖像輪廓,并在其輪廓基礎上提取出全局和局部的邊緣方向特征,利用距離分類器對其進行分類鑒別;在訓練過程中,訓練數(shù)據(jù)為所有書寫者的筆跡圖像,訓練得到每個書寫者筆跡圖像的特征向量均值;在鑒別過程中,同樣,將筆跡圖像預處理后提取其輪廓特征,再將該特征向量通過距離分類器與訓練模板庫中的特征向量均值進行匹配實現(xiàn)分類鑒別,距離越小,說明相似度越高,反之,距離越大說明相似度越低,從而判斷出書寫者的身份。
本發(fā)明提取了手寫筆跡的輪廓特征,能更好的利用了筆跡的邊緣方向信息,對反映出書寫者的書寫風格有明顯的效果;本發(fā)明系統(tǒng)簡單、方便易操作、安全性高。從硬件開銷來看,本發(fā)明中需要用到的硬件設備主要是個人計算機,不會增加額外的硬件開銷;從軟件開發(fā)來看,本發(fā)明中用到了輪廓特征提取和各種距離匹配算法,優(yōu)選出最佳距離度量方式,能達到很好的筆跡鑒別效果。本發(fā)明最大的特色是將這兩種技術完美結合,解決現(xiàn)有的離線筆跡鑒別系統(tǒng)中存在的一些弊端。
離線筆跡鑒別系統(tǒng)由待測筆跡獲取模塊、預處理模塊、特征提取模塊和分類鑒別模塊組成,由圖2的系統(tǒng)流程圖可知,先要將筆跡樣本進行預處理,再對預處理后的筆跡圖像進行輪廓和特征提取,得到訓練模板,通過對待測樣本的特征提取之后,通過距離分類器與訓練模板庫中的特征向量均值進行匹配實現(xiàn)分類鑒別,距離越小,則認為向量之間的相似度越高,系統(tǒng)根據(jù)該距離排序判定最小距離者為該筆跡的書寫者,最后統(tǒng)計鑒別結果,得到系統(tǒng)的大致性能。
離線筆跡樣本都是使用筆寫在打印紙上的筆跡,然后通過掃描儀進行灰度掃描輸入電腦,由于自己采集數(shù)據(jù)工作量太大,于是本實驗選用的哈爾濱工業(yè)大學人工智能研究室發(fā)布的hit-mw庫(哈爾濱工業(yè)大學多人手寫庫)。
預處理模塊是對筆跡樣本進行預處理,將筆跡圖像規(guī)格化為特征提取所需要的形態(tài),為特征提取做好準備,預處理模塊框圖如圖3所示,其具體步驟包括二值化和輪廓提取,預處理后的筆跡圖像如圖4所示。
特征提取模塊通過對圖像輪廓圖進行8方向編碼,使每個輪廓點都對應著8方向中的一個方向值,進而在其基礎上提取一系列邊緣方向特征,特征提取結果如圖5所示。得到特征向量后計算待測筆跡與筆跡樣本之間的距離,按照其相似度來鑒別出筆跡書寫者,或者直接用分類器對其進行訓練和預測,然后統(tǒng)計實驗結果,包括基本鏈碼特征提取子模塊、一階差分鏈碼特征提取子模塊、二階差分鏈碼特征提取子模塊、微分鏈碼特征提取子模塊、方向鏈碼特征提取子模塊、局部基本鏈碼特征提取子模塊、局部一階差分鏈碼特征提取子模塊和局部二階差分鏈碼特征提取子模塊。
應當理解的是,對本領域普通技術人員來說,可以根據(jù)上述說明加以改進或變換,而所有這些改進和變換都應屬于本發(fā)明所附權利要求的保護范圍。