一種規(guī)則碎紙自動拼接方法
【專利摘要】本發(fā)明屬于圖像處理技術(shù),具體涉及一種規(guī)則碎紙自動拼接的方法。本發(fā)明的技術(shù)方案通過六步來實現(xiàn):(1)準備圖像數(shù)據(jù)集并進行預(yù)處理;(2)對碎紙按中英文、單雙面進行分類;(3)提取每幅圖像的局部區(qū)域特征,如碎紙片邊界像素點的位置和灰度值、上(下)邊界高度;對英文碎紙片特征的提取范圍進行擴大,附加特征包括:英文碎紙片的行高、英文歲紙片的水平位置、英文碎紙片的行間距;(4)依據(jù)步驟(3)提取的特征值,對碎片進行再分類;(5)對碎片進行局部匹配,行匹配和列匹配;(6)將匹配好的圖像進行還原。本發(fā)明提供的方法能夠更加準確地對大量碎紙進行拼接。
【專利說明】一種規(guī)則碎紙自動拼接方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于圖像處理技術(shù)的應(yīng)用領(lǐng)域,具體涉及一種規(guī)則碎紙自動拼接方法。
【背景技術(shù)】
[0002]碎紙拼接技術(shù)是數(shù)字圖像處理技術(shù)的一個重要研究分支,它是將一組相互間存在重疊部分的碎紙進行空間匹配對準,從而進行無縫拼接得到完整的、寬視角場景的圖像。
[0003]碎紙自動拼接復(fù)原技術(shù)在司法物證復(fù)原、歷史文獻修復(fù)以及軍事情報獲取等領(lǐng)域都有著重要的應(yīng)用。近年來,隨著德國斯塔西文件恢復(fù)工程的公布,碎紙文件復(fù)原技術(shù)的研究引起了廣泛的關(guān)注。
[0004]碎紙拼接必須完成的關(guān)鍵是碎片的匹配技術(shù)。傳統(tǒng)破碎文件的拼接,更多的是使用碎片的邊緣形狀提取其輪廓曲線并利用計算機算法進行拼接?,F(xiàn)如今隨著碎紙機的廣泛應(yīng)用,越來越多的破碎紙片拼接問題中,碎紙的邊緣形狀都大致相同,邊緣形狀拼接不再適用。對于規(guī)則形狀的碎紙,則是根據(jù)紙片邊緣所包含的文字內(nèi)容,通過圖像配準運算確定碎紙邊界的參數(shù),對碎片進行匹配,最終實現(xiàn)無縫拼接。但是在實際應(yīng)用當(dāng)中,待拼接的紙片數(shù)量越大,具有相似文字信息的紙片邊緣數(shù)量也就越大,且相似程度越高。而計算機掃描形成數(shù)字圖像的分辨率具有一定的局限性,因此在拼接過程中,會出現(xiàn)一定量的錯誤拼接。理想的拼接技術(shù)所要達到的效果便是“零錯誤”。就現(xiàn)有的技術(shù)現(xiàn)狀來看,現(xiàn)有的碎紙拼接方法大都針對于非規(guī)則形狀,能夠有效應(yīng)用于大型寬幅規(guī)則紙片拼接的方法較為少見。
[0005]提高碎紙自動拼接質(zhì)量的技術(shù)關(guān)鍵在于如何高質(zhì)量地獲取碎紙上的文字或圖像信息。一般來說,碎片上的信息量越小,拼接錯誤甚至是無法拼接的幾率越大。因此迄今為止,在該【技術(shù)領(lǐng)域】對碎紙圖像進行自動拼接過程希望能夠得到最終高質(zhì)量的寬幅碎紙拼接存在紙較大的技術(shù)難度。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的目的是提供一種規(guī)則碎紙自動拼接的方法,能夠更加準確地對大量碎紙片進行拼接。
[0007]本發(fā)明是通過以下技術(shù)方案實現(xiàn)的,主要包括以下六個步驟:
[0008]1.圖像數(shù)據(jù)集的準備和預(yù)處理的具體步驟包括:
[0009]1.1將碎紙片從左到右、從上到下依次編號,記為1,2,3...η;若需要區(qū)分正反面,則正面記為al, a2, a3...an ;反面記為bl, b2, b3...bn ;
[0010]1.2將圖像數(shù)字化,以像素點作為最小單位,并提取各像素點的灰度值和所在位置,建立函數(shù)矩陣;
[0011]1.3將圖像進行值化:灰度值為“O”的點為黑色點,灰度值為“255”的點為白色點,“O”與“255”之間的為灰色點;
[0012]1.4去噪點:由于原始信息都是連續(xù)的模擬信號,數(shù)字化處理過后的圖像也應(yīng)該是一個具有連續(xù)趨勢的間斷點圖像。針對同一顏色點完全包圍異色點的情況,將異色點的顏色同化成周圍點的顏色;
[0013]2.對碎紙整體進行分類,按中英文、單雙面分為4種情況:中文單面、中文雙面、英文單面、英文雙面;
[0014]3.分別提取出每幅圖像局部區(qū)域的特征,這些特征包括:碎紙片邊界像素點的位置和灰度值、上(下)邊界高度;對英文碎紙片特征的提取范圍進行擴大,附加特征包括:英文碎紙片的行高、英文碎紙片的水平位置、英文碎紙片的行間距;
[0015]特征提取的方法具體如下:
[0016]i)碎紙片最外層的像素點的位置和灰度值:
[0017]定義碎紙片最左(右)端一列像素點為左(右)邊界,最頂(底)端一行像素點為上(下)邊界,提取各邊界像素點的位置和灰度值;
[0018]ii)上(下)邊界高度:
[0019]根據(jù)每一張碎片的上下邊界是否完全白色分為白色邊界高度和黑色邊界高度兩大類。具體分類方法如下:
[0020]以碎片的最底端為X軸,以碎片左邊垂直于X軸向上為y軸,X軸與y軸的相交點為原點建立坐標系,將圖片上各個像素點向y軸作投影。如圖1所示。一個黑色或灰色點的投影記為一次有效投影,投影次數(shù)加1,而白色點的投影無效,投影次數(shù)不改變。記錄與原點之間的距離為h個像素點的投影點上的投影次數(shù)f(h)。
【權(quán)利要求】
1.一種規(guī)則碎紙自動拼接的方法,其特征在于:該方法主要包括以下六個步驟: (1)圖像數(shù)據(jù)集的準備和預(yù)處理,包括對碎紙進行編號、圖像數(shù)字化、圖像值化、去噪占.(2)對碎紙整體進行分類,按中英文、單雙面分為4種情況:中文單面、中文雙面、英文單面、英文雙面; (3)分別提取出每幅圖像局部區(qū)域的特征,對中文這些特征包括:碎紙片邊界像素點的位置和灰度值、上下邊界高度;對英文碎紙片特征的提取范圍進行擴大,附加特征還包括:英文碎紙片的行高、英文碎紙片的水平位置、英文碎紙片的行間距; (4)依據(jù)步驟3所提取的特征集,對碎片進行分類:首先分為上下邊界碎片、左右邊界碎片、中間碎片三類;再依據(jù)行間距特征、上下邊界高度、水平位置特征,將具有相同特征的碎片分為一類; (5)a:依據(jù)邊界跟蹤算法對碎片進行局部匹配,確定碎片邊界特征的匹配指數(shù);b:將步驟a獲得的符合匹配條件的碎紙片,利用邊界跟蹤算法進行行匹配和列匹配; (6)將步驟5匹配之后的圖像進行還原。
2.根據(jù)權(quán)利要求1所述的一張規(guī)則碎紙自動拼接的方法,其特征在于:步驟(I)所述的編號方法為:將碎紙片從左到右、從上到下依次編號,記為1,2,3...η;若需要區(qū)分正反面,貝1J正面記為al, a2, a3...an ;反面記為bl, b2, b3...bn ;步驟⑴所述的圖像數(shù)字化是指:以像素點作為最小單位,并提取各像素點的灰度值和所在位置,建立函數(shù)矩陣;步驟⑴所述的圖像值化是指:灰度值為“O”的點為黑色點,灰度值為“255”的點為白色點,“O”與“255”之間的為灰色點;步驟⑴所述的去噪點是指:針對同一顏色點完全包圍異色點,將異色點的顏色同化成周圍點的顏色。
3.根據(jù)權(quán)利要求1所述的一張規(guī)則碎紙自動拼接的方法,其特征在于:步驟(3)所述的碎紙片邊界像素點的位置和灰度值特征及提取方法為:定義碎紙片最左或最右端一列像素點為左或右邊界,最頂或最底端一行像素點為上下邊界,提取各邊界像素點的位置和灰度值; 步驟(3)所述的上下邊界高度特征及提取方法為:根據(jù)每一張碎片的上下邊界是否完全白色分為白色邊界高度和黑色邊界高度兩大類;具體分類方法如下: 以碎片的最底端為X軸,以碎片左邊垂直于X軸向上為y軸,X軸與y軸的相交點為原點建立坐標系,將圖片上各個像素點向y軸作橫向投影;一個黑色或灰色點的投影記為有效投影,投影次數(shù)加1,而白色點的投影無效,投影次數(shù)不改變;記錄距離原點為h個像素點的投影點上的投影次數(shù)f(h);
。,煙
255,/(//) > 當(dāng)投影次數(shù)f(h)小于該行總像素點數(shù)η的1/10時,將y軸上點h的灰度值g(h)記為“O”;當(dāng)投影次數(shù)f(h)大于或等于該行總像素點數(shù)η的1/10時,將點h的灰度值g(h)記為“255”; 在投影軸上,從碎片的上邊界依次向下進行統(tǒng)計,直至出現(xiàn)顏色不同的點;這一段高度即為上邊界高度,下邊界高度亦然; 步驟(3)所述的英文碎紙片的行高特征及提取方法為:英文字母的高度以及在同一行中所占的位置高度大致相同,因此,對英文碎片進行橫向投影后,灰度值為“I”的區(qū)間即是字母有效區(qū)間,定義有效區(qū)間的聞度為行聞,提取行聞; 步驟(3)所述的英文碎片的水平位置特征及提取方法為:對英文碎片進行橫向投影后,字母的有效投影區(qū)間的上下邊界,距碎紙片頂部的距離稱為該行字母的所在水平位置,提取水平位置特征; 步驟(3)所述的英文碎紙片的行間距特征及提取方法為:兩水平位置的垂直距離定義為行間距,提取行間距特征。
4.根據(jù)權(quán)利要求1所述的一張規(guī)則碎紙自動拼接的方法,其特征在于:步驟(4)所述的依據(jù)步驟3所提取的特征集,對碎片進行分類:具體步驟為: i)根據(jù)紙片邊界是否有文字筆畫信息,將碎紙分為三類:上下邊界碎片、左右邊界碎片和中間碎片; ?)依據(jù)行間距特征,分別對上述三類碎紙片進一步分類,相同行間距分為一類; iii)依據(jù)上下邊界高度,對步驟i所形成的三類碎片集進行分類,上下邊界高度相同或相近的碎片劃分為同一碎片集; iv)利用水平位置特征,對步驟ii所形成的各個碎片集進一步分類,處于同一水平位置的碎片劃分為一類。
5.根據(jù)權(quán)利要求1或4所述的一張規(guī)則碎紙自動拼接的方法,其特征在于:所述的步驟iii)中劃分類別是需要遵守的條件為: (1)每一類的碎片數(shù)量必須等于或略小于紙張的縱切次數(shù); (2)與其他高度相間隔的類別,若數(shù)量小于各類別碎片數(shù)量的1/5,則不獨立為一個類別; (3)高度相互連續(xù)的幾個類別歸為同一類; (4)最終的類別總數(shù)為紙張的橫切次數(shù); (5)若還是無法確定類別,則再根據(jù)底部高度進行輔助判斷。
6.根據(jù)權(quán)利要求1所述的一張規(guī)則碎紙自動拼接的方法,其特征在于:步驟(5)所述的對碎片進行匹配的步驟包括: a、依據(jù)邊界跟蹤算法對碎片進行局部匹配,即是兩碎片之間的匹配,確定碎片邊界特征的匹配指數(shù); b、將步驟a獲得的符合匹配條件的碎紙片,形成各個小的碎片集,利用邊界跟蹤算法對碎片集進行行匹配和列匹配。
7.根據(jù)權(quán)利要求6所述的一張規(guī)則碎紙自動拼接的方法,其特征在于:步驟a所述的局部匹配的判定標準為:定義Xu為第i張碎片右邊界上第j行像素點的灰度值,定義Yi, j為第r張碎片左邊界上第j行像素點的灰度值α古y );判定匹配與否的關(guān)鍵在于Xij和Yi, j之間的匹配程度,將步驟3提取的特征集,以右邊界特征為基準,定義判定標準為: XijS白色,Yi, Yi,」、Yi, j+1出現(xiàn)灰白黑三色且不全為黑為正常,可進行匹配; XijS灰色,Yi, W、Yi, j、Yi, j+1出現(xiàn)任意色均為正常,可進行匹配; Xij為黑色,Yi, J-1> Y1- j> Y1- j+1不全為白色為正常,可進行匹配; 其余情況為不正常,不可進行匹配;Xij與Yi, j-1、Yi, j、Yi, j+i的關(guān)系如表一所不; 其中=Xij:第i張紙條的最左邊一列的第j行像素點的灰度值; Yi, ^第i'張紙條的最右邊一列的第j行像素點的灰度值。
8.根據(jù)權(quán)利要求7所述的一種規(guī)則碎紙自動拼接方法,其特征在于:根據(jù)所述的局部匹配的判定標準,確定圖像匹配指數(shù)的數(shù)學(xué)模型,具體為:
其中: Sii,:第i張碎片與第i'張碎片總的匹配指數(shù); N:碎紙片垂直高度上像素點的總數(shù); Xij:碎片i右邊界j行像素點的灰度值; Ti, (Xij):判斷第i張碎紙第j行的右邊界特征與對應(yīng)行的第y張紙條的左邊界特征的的數(shù)據(jù)的匹配指數(shù); 該匹配指數(shù)具體表示為:
其中:
當(dāng)且僅當(dāng)Sii,指數(shù)為O時,兩碎片才視為可匹配;若不為O則不能進行匹配,且數(shù)值越大,匹配程度越差。
9.根據(jù)權(quán)利要求6所述的一張規(guī)則碎紙自動拼接的方法,其特征在于:步驟a所述的邊界跟蹤算法具體流程如下: 1)選取碎片i和P; 2)假設(shè)碎片i和P相互匹配; 3)讀取碎片i右邊界j行像素點Xu的灰度值; 4)掃面碎片i'左邊界與Xij相鄰的j_l、j、j+Ι行的像素點Yi,」、Yi, (j+1)的,判斷其是否全為白色; 5)若全為白色,且超出行范圍,則j+Ι后返回3); 6)若不全為白色,則j+Ι讀取下一行,判斷Xu是否為白色; 7)若為白色,則返回5); 8)若不為白色,則判斷Yi,j、Yi;(」+1)是否全為白色; 9)若全為白色,則返回5); 10)若不為白色,則j+Ι讀取下一行,判斷Xu的顏色; 11)若為白色,則返回5); 12)若為灰色,則返回5); 13)若為黑色,則判斷Yi,(」+1)是否全為白色; 14)若不為白色,則返回5); 15)若全為白色,則碎片UPi'匹配過程結(jié)束,碎片i和i'不匹配;16)若j+1超出行范圍,則碎片i和i'匹配過程結(jié)束,碎片i和P匹配。
10.根據(jù)權(quán)利要求6所述的一張規(guī)則碎紙自動拼接的方法,其特征在于:步驟b所述的進行行匹配和列匹配的具體過程為: (1)行匹配的具體過程: i)以其中一張碎片為基準,若兩碎片的局部匹配成功,則將兩碎片合并為一張碎紙片,放入新的碎片集;若局部匹配未成功,則保留基準碎片,繼續(xù)局部匹配;原碎片集中的碎片均無法成功局部匹配時,均放入新碎片集; ?)新的碎片按照上述步驟重復(fù)進行,直至所有碎紙片拼接成整行; (2)根據(jù)上述過程,確定圖像行匹配指數(shù)的數(shù)學(xué)模型,具體為: 目標函數(shù):
約束條件:
其中,a為Sii,的個數(shù); W的最小值為O ; M為碎紙片橫向切割的次數(shù); (3)將通過行匹配的碎片集形成碎片行,對碎片行矩陣進行轉(zhuǎn)置,再進行列匹配,列匹配的具體過程與行匹配相同。
【文檔編號】G06T7/00GK104182966SQ201410340616
【公開日】2014年12月3日 申請日期:2014年7月16日 優(yōu)先權(quán)日:2014年7月16日
【發(fā)明者】段倩, 金鑫, 浦志強, 李醫(yī)民, 朱峰 申請人:江蘇大學(xué)