文檔圖像的拼接裝置、方法以及掃描儀的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及圖像處理領(lǐng)域,尤其涉及一種文檔圖像的拼接裝置、方法以及掃描儀。
【背景技術(shù)】
[0002] 近年來,由于資料保存以及信息化的需要,對文檔資料進行電子化的需求日益增 長。為了防止損壞文檔,一般采用非接觸式掃描的方法進行文檔的電子化。而對于尺寸較 大的文檔,例如大量古代和近代的書籍和文件,需要將這些文檔水平翻轉(zhuǎn)后進行多次掃描, 或者利用多臺掃描儀進行掃描,并對掃描得到的多個文檔圖像進行拼接,從而獲得整個文 檔的圖像。現(xiàn)有的圖像拼接方法一般針對自然場景圖像,要求同一場景的各個圖像之間滿 足固定的幾何變換關(guān)系。
[0003] 應(yīng)該注意,上面對技術(shù)背景的介紹只是為了方便對本發(fā)明的技術(shù)方案進行清楚、 完整的說明,并方便本領(lǐng)域技術(shù)人員的理解而闡述的。不能僅僅因為這些方案在本發(fā)明的
【背景技術(shù)】部分進行了闡述而認為上述技術(shù)方案為本領(lǐng)域技術(shù)人員所公知。
【發(fā)明內(nèi)容】
[0004] 由于文檔圖像因其自身紋理的重復(fù)性,難以提取穩(wěn)定的特征,同時紙面的起伏變 化使得固定的幾何變換的條件不再滿足。因此,采用現(xiàn)有的圖像拼接方法對文檔圖像進行 拼接,會產(chǎn)生內(nèi)容失真,文本行錯位等問題。
[0005] 本發(fā)明實施例提供一種文檔圖像的拼接裝置、方法以及掃描儀,由于在檢測最優(yōu) 拼縫時同時考慮了穿過文檔空白區(qū)域和仿射場穩(wěn)定這兩個因素,能夠獲得完整的且內(nèi)容正 確的拼接圖像。
[0006] 根據(jù)本發(fā)明實施例的一個方面,提供一種文檔圖像的拼接裝置,所述裝置包括:校 正單元,所述校正單元用于對各個待拼接的文檔圖像進行初步校正;檢測單元,所述檢測單 元用于檢測所述校正單元初步校正后的各個待拼接的文檔圖像的最優(yōu)拼縫,其中,所述最 優(yōu)拼縫穿過所述文檔圖像的空白區(qū)域,并且沿著所述最優(yōu)拼縫的仿射場的變化最??;拼接 單元,所述拼接單元用于根據(jù)所述檢測單元檢測出的最優(yōu)拼縫,對各個待拼接的文檔圖像 進行拼接。
[0007] 根據(jù)本發(fā)明實施例的另一個方面,提供一種掃描儀,所述掃描儀包括根據(jù)上述一 個方面所述的文檔圖像的拼接裝置。
[0008] 根據(jù)本發(fā)明實施例的又一個方面,提供一種文檔圖像的拼接方法,所述方法包括: 對各個待拼接的文檔圖像進行初步校正;檢測初步校正后的各個待拼接的文檔圖像的最優(yōu) 拼縫,其中,所述最優(yōu)拼縫穿過所述文檔圖像的空白區(qū)域,并且沿著所述最優(yōu)拼縫的仿射場 的變化最?。桓鶕?jù)檢測出的最優(yōu)拼縫,對各個待拼接的文檔圖像進行拼接。
[0009] 本發(fā)明的有益效果在于:在檢測最優(yōu)拼縫時考慮了仿射場穩(wěn)定的因素,選擇穿過 文檔圖像的空白區(qū)域且仿射場的變化最小的拼縫作為最優(yōu)拼縫,并基于該最優(yōu)拼縫進行文 檔圖像的拼接,從而獲得完整的且內(nèi)容正確的拼接圖像。
[0010] 參照后文的說明和附圖,詳細公開了本發(fā)明的特定實施方式,指明了本發(fā)明的原 理可以被采用的方式。應(yīng)該理解,本發(fā)明的實施方式在范圍上并不因而受到限制。在所附 權(quán)利要求的精神和條款的范圍內(nèi),本發(fā)明的實施方式包括許多改變、修改和等同。
[0011] 針對一種實施方式描述和/或示出的特征可以以相同或類似的方式在一個或更 多個其它實施方式中使用,與其它實施方式中的特征相組合,或替代其它實施方式中的特 征。
[0012] 應(yīng)該強調(diào),術(shù)語"包括/包含"在本文使用時指特征、整件、步驟或組件的存在,但 并不排除一個或更多個其它特征、整件、步驟或組件的存在或附加。
【附圖說明】
[0013] 所包括的附圖用來提供對本發(fā)明實施例的進一步的理解,其構(gòu)成了說明書的一部 分,用于例示本發(fā)明的實施方式,并與文字描述一起來闡釋本發(fā)明的原理。顯而易見地,下 面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng) 造性勞動性的前提下,還可以根據(jù)這些附圖獲得其它的附圖。在附圖中:
[0014] 圖1是本發(fā)明實施例1的文檔圖像的拼接裝置100的組成示意圖;
[0015] 圖2是本發(fā)明實施例1的檢測單元102的的組成示意圖;
[0016] 圖3是本發(fā)明實施例1的第一檢測模塊202的組成示意圖;
[0017] 圖4是本發(fā)明實施例1的上下兩個待拼接文檔圖像的最優(yōu)拼縫的示意圖;
[0018] 圖5是本發(fā)明實施例1的拼接單元103的組成示意圖;
[0019] 圖6是本發(fā)明實施例1的對文檔圖像中的像素點進行坐標(biāo)變換的示意圖;
[0020] 圖7是本發(fā)明實施例1的完成拼接的文檔圖像的示意圖;
[0021] 圖8是本發(fā)明實施例2的掃描儀800的系統(tǒng)構(gòu)成的一示意框圖;
[0022] 圖9是本發(fā)明實施例3的文檔圖像拼接方法的流程圖。
【具體實施方式】
[0023] 參照附圖,通過下面的說明書,本發(fā)明的前述以及其它特征將變得明顯。在說明書 和附圖中,具體公開了本發(fā)明的特定實施方式,其表明了其中可以采用本發(fā)明的原則的部 分實施方式,應(yīng)了解的是,本發(fā)明不限于所描述的實施方式,相反,本發(fā)明包括落入所附權(quán) 利要求的范圍內(nèi)的全部修改、變型以及等同物。
[0024] 實施例1
[0025] 圖1是本發(fā)明實施例1的文檔圖像的拼接裝置100的組成示意圖。如圖1所示, 該裝置100包括校正單元101、檢測單元102以及拼接單元103,其中,
[0026] 校正單元101用于對各個待拼接的文檔圖像進行初步校正;
[0027] 檢測單元102用于檢測校正單元102初步校正后的各個待拼接的文檔圖像的最優(yōu) 拼縫,其中,該最優(yōu)拼縫穿過該文檔圖像的空白區(qū)域,并且沿著該最優(yōu)拼縫的仿射場的變化 最?。?br>[0028] 拼接單元103用于根據(jù)檢測單元102檢測出的最優(yōu)拼縫,對各個待拼接的文檔圖 像進行拼接。
[0029] 由上述實施例可知,由于在檢測最優(yōu)拼縫時同時考慮了穿過文檔空白區(qū)域和仿射 場穩(wěn)定這兩個因素,能夠獲得完整的且內(nèi)容正確的拼接圖像。
[0030]在本實施例中,各個待拼接的文檔圖像可以使用現(xiàn)有的掃描方法對文檔進行掃描 而獲得,其中,各個待拼接文檔圖像按照文檔內(nèi)容的順序進行排序,相鄰的兩個待拼接文檔 圖像之間具有交疊區(qū)域。另外,該文檔例如是書籍、報紙、資料、書法或繪畫作品等,本發(fā)明 實施例對文檔的類型并不進行限制。
[0031] 在本實施例中,待拼接的文檔圖像的數(shù)量例如由文檔的尺寸以及掃描儀的掃描范 圍所確定。本發(fā)明實施例以兩個待拼接的文檔圖像為例進行說明,但本發(fā)明實施例不對待 拼接的文檔圖像的數(shù)量進行限制。
[0032] 在本實施例中,當(dāng)待拼接的文檔圖像的數(shù)量為三個或三個以上時,可按文檔內(nèi)容 的順序?qū)Υ唇訄D像進行排序,例如,共有N個待拼接的文檔圖像,N> 3,可先對第一和第 二個待拼接的文檔圖像進行拼接,然后再將拼接后的圖像與第三個待拼接的文檔圖像進行 拼接,直至完成與第N個待拼接文檔圖像的拼接。
[0033] 其中,將第一和第二個待拼接的文檔圖像拼接后的圖像與第三個待拼接的文檔圖 像進行拼接時,其使用的拼接方法與第一和第二個待拼接的文檔圖像進行拼接時使用的方 法相同,以此類推,直至完成所有待拼接文檔圖像的拼接。
[0034] 在本實施例中,校正單元101可使用現(xiàn)有的任一種方法對各個待拼接的文檔圖像 進行初步校正。其中,可使用現(xiàn)有的方法對待拼接的文檔圖像進行全局的剛體變換,例如對 文檔圖像進行傾斜校正以及平移對齊等。
[0035] 在本實施例中,檢測單元102檢測初步校正后的各個待拼接的文檔圖像的最優(yōu)拼 縫,該最優(yōu)拼縫滿足以下兩個條件,即:最優(yōu)拼縫穿過該文檔圖像的空白區(qū)域,并且沿著該 最優(yōu)拼縫的仿射場的變化最小。其中,沿著該最優(yōu)拼縫的仿射場是指沿著該最優(yōu)拼縫的各 個像素點的仿射變換的集合。
[0036] 在本實施例中,基于以上兩個條件,檢測單元102檢測最優(yōu)拼縫。以下對本發(fā)明實 施例的檢測單元102的結(jié)構(gòu)以及檢測最優(yōu)拼縫的方法進行示例性的說明。
[0037] 圖2是