專利名稱:印頁識別和數(shù)字化圖像處理的方法和系統(tǒng)的制作方法
技術領域:
本發(fā)明一般涉及使用一個數(shù)字化轉換器裝置的數(shù)據(jù)輸入,特別是識別放置在一個數(shù)字化轉換器上的印頁和確定及校正數(shù)字化轉換器板的數(shù)字圖像偏移的系統(tǒng)和方法。
美國專利US5629499(Flickinger等人)公開了一種書寫板,并公開了兩種識別該書寫板上所用印頁的方法。在第一種方法中,一個觸發(fā)器用于觸發(fā)書寫板上所顯示的不同印頁標識符;在第二種方法中,一個條形碼閱讀器讀出印頁上預印的條形碼。觸發(fā)顯示需要書寫板包含一個微處理器,在每次使用一組新印頁時,該微處理器也許需要重新編程。
人們已經(jīng)知道數(shù)字筆記本記錄放置在其上的紙張印面上所制作的符號。例如,A.T.Cross公司已經(jīng)上市了一種CrossPad 35(參見
圖1),即,一個利用無線傳輸來數(shù)字化和記錄書寫動作的便攜數(shù)字筆記本。CrossPad將記錄的書寫動作發(fā)送給一個個人計算機進行處理和分析。然而,CrossPad本身不能識別預印的印頁。由CrossPad記錄并發(fā)送給計算機的信息僅包括通過用戶在一個印頁上書寫而輸入的筆劃。預印在印頁上的信息不能被CrossPad檢測。CrossPad沒有一個可以通過用戶觸發(fā)的印頁ID顯示器,也沒有條形碼閱讀器。
由于諸如CrossPad的裝置僅檢測由用戶書寫的信息,因此這種裝置通常不能在根據(jù)預印信息識別印頁的系統(tǒng)中使用。當把多個印頁放置在數(shù)字化轉換器上時,甚至連Reid-Green公開的系統(tǒng)也不能檢測印頁識別信息。例如,Reid-Green將只能夠識別位于堆疊紙張底部的印頁。Flickinger等人公開的裝置也許能夠閱讀多個頁面,但是這種裝置需要增加未出現(xiàn)在CrossPad型裝置上的(昂貴的)印頁閱讀機構。在數(shù)字化轉換器中使用條形碼閱讀器或其它印頁閱讀機構增加了數(shù)字化轉換器的成本和重量。
CrossPad裝置的另一個缺點是紙張印頁上書寫標志的空間關系不同于基礎“數(shù)字印頁”上相應數(shù)字標志的空間關系。該偏差(“數(shù)字位移”)可以有幾個毫米。
CrossPad型裝置的另一個缺點起因于以下事實當使用一個印頁時,該印頁上的預印信息不是上載的數(shù)字墨水文件的部分。為了使數(shù)字墨水文件在上載后效率最佳,紙張印頁上呈現(xiàn)的語境信息的圖像,在使用的任何時間需要加到數(shù)字墨水圖像上。這兩個圖像必須確實對準,以便可以重新建立具有在其上書寫的信息的原始印頁的圖像。
因此,需要一種能夠在CrossPad和類似裝置上使用的印頁的自動印頁識別的系統(tǒng),該系統(tǒng)不依賴印頁上的預印信息。
此外,還需要這樣一種系統(tǒng),該系統(tǒng)不需要被集成到CrossPad型電子書寫板上的一個笨重的LCD顯示器(連同一個可編程微處理器)和觸發(fā)器或者其它輸入裝置。
此外,還需要一種校正CrossPad型裝置和其它數(shù)字化轉換器的數(shù)字位移的方法和系統(tǒng)。還需要一種在具有基礎印頁的一個圖像的印頁上組合和對準手寫信息的數(shù)字墨水圖像的方法。
本發(fā)明還包括校正數(shù)字位移以及將數(shù)字墨水文件映射到數(shù)字印頁上的方法。通常,一個數(shù)字化轉換器板(例如,CrossPad或類似裝置)會遭受一定量的數(shù)字位移-紙張印頁上書寫的相對位置與基礎數(shù)字印頁上相應數(shù)字標志的相對位置之間的空間差。數(shù)字位移量和方向對于每個板(以及在給定印頁的任何地方)是恒定的,但是通常從一個板到另一個板各不相同。
優(yōu)選實施例的軟件通過參考給定印頁上的已知界標確定數(shù)字位移量和方向。這樣的一個界標在下面的討論中最好是一個印頁識別標志。在一個優(yōu)選實施例中,印頁標示符是一個圓圈。通過將紙張印頁上印頁標示符圓圈中央的已知位置與數(shù)字印頁下部上相應數(shù)字標志的中心進行比較,確定數(shù)字位移,然后確定水平和垂直方向的偏差。一旦確定該數(shù)字位移,就把它作為校正因子應用于該印頁的所有數(shù)字標記。
該校正因子便于手寫數(shù)字墨水圖像與基礎印頁的圖像的對準。該對準首先通過識別在其上寫入數(shù)字墨水數(shù)據(jù)的印頁來實現(xiàn)。然后從數(shù)據(jù)庫中取出被識別印頁的預加載圖像。該校正因子用來把墨水數(shù)據(jù)與數(shù)字印頁對準。數(shù)字印頁與數(shù)字墨水的校正對準能夠使紙張印頁的復制就像它被填寫時那樣。校正對準還能夠使合成圖像通過光學標志識別(OMR)、光學字符識別(OCR)以及存入數(shù)據(jù)庫的圖像片段進行處理。
本發(fā)明還包括一種創(chuàng)建印頁的啟動識別的方法和系統(tǒng),用于創(chuàng)建未在其上預印印頁識別標志的印頁的啟動識別。在本發(fā)明這一方面的一個優(yōu)選實施例中,一個具有三毫米孔的金屬或塑料引導器(guide)被粘貼在數(shù)字化轉換器板的一側,其中所述的三毫米孔位于該引導器的不同選擇位置上。該引導器最好被粘貼在鏈接用戶的一個預定位置上。將引導器固定到數(shù)字化轉換器板一側的預定位置上能夠使用戶在一個孔中制作標志,其中,該孔的位置對應于一個預印標志應當具有的位置。也就是,該標志具有塞滿預印印頁識別圓圈的一個標志應當有的相同位置。這允許預印沒有印刷印頁識別標志的印頁的客戶使用上述已公開系統(tǒng)剩余的印頁。
發(fā)明的詳細說明在一個優(yōu)選實施例中,如圖1所示,本發(fā)明的系統(tǒng)和方法與一個數(shù)字化轉換器系統(tǒng)結合使用,該系統(tǒng)包括一個數(shù)字化轉換器35,比如CrossPad;預印印頁45;一個個人計算機25和附帶軟件。為了便于說明,這里所用術語“CrossPad”在這里涉及本發(fā)明可應用的任何數(shù)字化轉換器板。本領域的熟練技術人員將會認識到該系統(tǒng)和方法可應用于任何數(shù)字化轉換器系統(tǒng),其中,可將一個印頁放置在一個數(shù)字化轉換器field中。此外,盡管在該說明中涉及紙張上印刷的印頁,但本領域的熟練技術人員將會明白所公開的系統(tǒng)和方法同樣適用于在其它媒介上實施的印頁。例如,本公開的發(fā)明還工作于塑料疊層板或“電子紙”上的印頁,比如,由Xerox公司(Palo Alto,California)開發(fā)的“Gyricon”產(chǎn)品,或者由E Ink(Cambridge,Massachusetts)公司開發(fā)的相同產(chǎn)品。
圖1所示的數(shù)字化轉換器系統(tǒng)的一般操作如下所示。預印的數(shù)據(jù)收集印頁45被放置在CrossPad35上。用戶使用CrossPad 35所需的特制筆將標志放置在印頁45上。CrossPad 35將印頁45上制作的標志記錄為數(shù)字化圖像。用戶將CrossPad 35連接到計算機25上,CrossPad35把存儲的圖像發(fā)送給計算機25。在一個可替代實施例中,CrossPad35連接一個將Crosspad數(shù)據(jù)變換成互聯(lián)網(wǎng)可兼容格式的變換器。該變換器經(jīng)由互聯(lián)網(wǎng)將變換的CrossPad數(shù)據(jù)發(fā)送給遠端位置上的計算機。在任何一個實施例中,計算機25上存儲的Crosspad圖像由計算機上存儲的軟件處理。下面描述優(yōu)選實施例所使用的印頁和軟件。
圖2示出了優(yōu)選實施例所使用的第一數(shù)據(jù)收集印頁45。印頁左頁邊距上的區(qū)域被保留用于印頁識別?!癝tart Here”指示225提醒用戶用于印頁標識符的指示符230應當被填寫(圓圈是指示符;通過填寫圓圈制作的標志是印頁標識符)。對于每個不同的印頁,印頁際識符指示符230位于區(qū)域210中的不同地方。
印刷優(yōu)選實施例中所用的印頁,使它們可以用于一個或多個數(shù)據(jù)輸入系統(tǒng)。例如,如果用光掃描器掃描印頁圖像,則印頁下右標線215和印頁上左標線220用來對準印頁的圖像。
圖3示出了在優(yōu)選實施例中使用的第二數(shù)據(jù)收集印頁。圖3中的印頁未顯示標號,以便更清楚地顯示優(yōu)選實施例中使用的印頁的外貌。需要說明的是,圖3中印頁的印頁標識符指示符位于與圖2所示印頁標識符230不同的區(qū)域210的不同地方。
最好是,當用戶每次在一個印頁上開始書寫時,該用戶填寫一個印頁標識符指示符。然而,為了減少差錯,在把CrossPad移交給一個第二用戶之前,第一用戶最好填寫多個指示符。例如,第一用戶可以使用包括用于所有印頁的指示符的一個模板。如果使用印頁1、3和6,第一用戶將模板放置在CrossPad的模板上,并且填寫用戶印頁1的指示符,敲擊CrossPad上的Next Page按鈕,填寫用于印頁3的指示符,再次敲擊Next Page指示符,填寫用于印頁6的指示符。第一用戶然后敲擊Back Page按鈕兩次,并且將CrossPad與夾在其上的印頁1、3和6傳給第二用戶。隨后,第二用戶可以填寫印頁1、3和6,但不需要填寫適當?shù)挠№摌俗R符指示符(盡管當?shù)诙脩糁鹩№摲摃r,仍然需要按壓Next和Back Page按鈕)。
圖4是一個流程圖,顯示了在一個優(yōu)選實施例中使用的軟件的操作。當CrossPad 35的用戶填寫印頁標識符指示符230時,用于用戶在印頁上書寫的任何其它信息的圖像和位置數(shù)據(jù)將一起存入CrossPad存儲器中。CrossPad把該信息存儲為“墨水數(shù)據(jù)”,它是IBM擁有的數(shù)據(jù)格式,不過,也可以使用存儲該數(shù)據(jù)的任何合適的格式。
在步驟410,用戶通過把CrossPad插入一個連接到計算機的串行連接電纜(雖然也可以使用紅外線、以太網(wǎng)或者其它連接裝置)將收集的墨水數(shù)據(jù)上載到個人計算機上,并且按壓CrossPad上的一個按鈕。在一個可替代實施例中,墨水數(shù)據(jù)首先被傳送給變換器,然后經(jīng)由(最好是)互聯(lián)網(wǎng)將數(shù)據(jù)發(fā)送給遠端位置上的計算機。遠端位置上的計算機可以是個人計算機,但是最好是服務器類型計算機(例如,一個互聯(lián)網(wǎng)服務器),因為人們期望計算機從多個源中接收數(shù)據(jù)。
在步驟412上,個人計算機上存儲的墨水傳遞程序接收所傳遞的墨水數(shù)據(jù),在步驟415,將該數(shù)據(jù)作為墨水數(shù)據(jù)文件存儲在計算機的硬件驅動器上。在一個優(yōu)選實施例中,裝備到Crosspad上的IBM InkManager Transfer程序執(zhí)行該步驟,并創(chuàng)建稱作“筆記本”的文件。
在上載該墨水數(shù)據(jù)文件之后,墨水傳遞程序發(fā)射墨水變換器程序(在這里,被稱作TMDInkExec),步驟417。在步驟420,TMDInkExec讀出上載的墨水數(shù)據(jù)文件,并且通過調用IBM供應的資料庫中包含的墨水變換程序塊,即IBM Electric Ink SDK,把墨水頁面轉換成非所有權的圖像文件(比如,組4 TIFF,但是也可以使用其它格式)。TMDInkExec根據(jù)IBM Electric Ink SDK包含的文件中所含有的指令調用適當?shù)哪儞Q程序塊。在一個可替代實施例中,步驟420上的從筆記本到非所有權圖像格式的變換還可以在遠端位置計算機上發(fā)生使用例如電子郵件或文件傳遞協(xié)議將墨水數(shù)據(jù)傳遞給遠端計算機,然后遠端計算機(或多個計算機)輪詢接收隊列(例如,電子郵件箱),并且執(zhí)行步驟420,處理所接收的成批墨水數(shù)據(jù)。
一旦完成步驟420,。TMDInkExec程序422就通知第二程序,即TMDInkMonitor,進一步處理TIFF數(shù)據(jù)。在步驟424,TMDInkMonitor程序向墨水數(shù)據(jù)文件中的成批頁面隨意地分配或確認一個主題ID(例如,如果這些頁面是為一個特定病人填寫的印頁,則應當輸入該病人的ID)。如果使用一個掃描器替代CrossPad,則可以把一個主題ID標簽粘貼到印頁上,該主題ID標簽辨別由系統(tǒng)分配的識別號碼。如果用戶未分配主題ID(CrossPad也為記錄該主題ID),則TMDInkMonitor程序分配一個默認主題ID(最好是在前主題ID遞增1)。
在步驟426,將整批上載ID分配給相應的整批TIFF圖像文件,在步驟428,借助整批上載ID和主題ID將TIFF數(shù)據(jù)寫入一個數(shù)據(jù)庫。然后在步驟430,TIFF數(shù)據(jù)文件由一個識別引擎從數(shù)據(jù)庫中復制出并進行處理,該識別引擎采用OMR(光標記閱讀,或光標記辨別)技術將圖像轉換成已識別數(shù)據(jù)。一種識別引擎是軟件,該軟件提供服務于另一個軟件模塊的確認文件集,或者提供將圖像數(shù)據(jù)轉換成(識別)計算機可讀文本的程序。在一個優(yōu)選實施例中,可以使用Caere公司(Los Gatos,California)出售的Caere Developer’s Kit 2000識別引擎,但是眾多識別軟件可從市場上得到(例如,可以從加利福尼亞,圣地亞哥的Mitek Systems,Inc.,和明尼蘇達,明尼愛普斯的NationalComputer System,Inc.得到),在一個優(yōu)選實施例中,本領域的熟練技術人員還可以使用這些識別軟件。
在步驟432,TMDInkMonitor調用一個Form ID確定程序塊,該程序塊驅動對應于已識別數(shù)據(jù)的印頁ID。圖5和圖6示出了由Form ID確定程序塊執(zhí)行的步驟。
印頁ID確定程序塊使用OMR識別程序塊和OMR填寫方法。識別程序塊是軟件,它符合識別引擎的規(guī)范并且將不同類型的圖像數(shù)據(jù)轉換成計算機可讀文本,填寫方法規(guī)定期望出現(xiàn)在一個區(qū)域之內的圖像數(shù)據(jù)的類型。某些填寫方法與一個唯一的識別程序塊相關聯(lián);其它填寫方法則由一個以上的識別程序塊支持。填寫方法的某些實例是多字體機器打印,OMR,手寫印刷體,條形碼,點陣打印,OCRA和盲文。
區(qū)域是一個圖像區(qū)域,直至整個頁面,包括用戶感興趣的字符。在一個優(yōu)選實施例中,所述區(qū)域是矩形的,但是本領域的熟練技術人員將會認識到也可以使用不同形狀的區(qū)域。區(qū)域所覆蓋的圖像數(shù)據(jù)被分別處置和處理。一般的區(qū)域類型是圖形(不識別)、文本和諸如條形碼或OMR的其它區(qū)域。為了便于區(qū)域面積中的圖像數(shù)據(jù)的識別,根據(jù)每個區(qū)域將包含的預期信息為每個區(qū)域分配所有權?;镜膮^(qū)域所有權是x-y坐標、大小、識別程序塊、濾波器、語言字典和用戶字典。語言字典是包含語言詞匯元素加規(guī)則的一個文件,所述規(guī)則用于從語言詞匯元素中生成單詞。該文件可以用來在識別文本中標注非字典單詞,或者把非字典單詞變成可接受的單詞。某些識別程序塊參考語言字典,以協(xié)助它們作出識別決定。用戶字典含有單詞表、字符串和定義字形的正規(guī)表達,以補充語言字典文件的內容。一個或多個用戶字典可以與一個特定區(qū)域相關聯(lián)。用戶字典中的正規(guī)表達通過指定字符類型、范圍或者對一個區(qū)域中一個或多個字符位置有效的各個字符來定義允許的字形,以提高識別精度。正規(guī)表達還被稱作掩?;蚰P?。正規(guī)表達經(jīng)常在印頁類的情況下使用,其中區(qū)域內容處于某種可預言方式中。
印頁識別區(qū)域模板(或,F(xiàn)IZT)用于從圖像中識別印頁。區(qū)域模板是一組指定和存儲的區(qū)域或頁面所有權(例如,對應于一個待識別的印頁),用于以后在諸如盤文件或數(shù)據(jù)庫記錄的媒介中進行檢索和處理。FIZT由一組被布置在柵格圖形中的區(qū)域組成(參見圖7)。濾波器可以加到區(qū)域級或印頁級,以提高識別結果。濾波器是規(guī)約,依據(jù)所認為盡可能有效結果消除某些類別。濾波器的實例包括數(shù)字、大寫字母、小寫字母和標點符號。
由于主體發(fā)明利用了OMR技術,因此在另一個實施例中,非標準符號(比如,一個被圈繞的N-類似于符號)用來指示印頁上有關信息。這種有關信息的實例包括剪貼區(qū)域;需要校正的信息;和對另一個數(shù)據(jù)文件的參考。
印頁識別的區(qū)域被規(guī)定為從左至右和從從上至下,如圖7的陰影號所示。每個區(qū)域相對應于一個印頁屬于的組中的印頁號。按照區(qū)域之間具有足夠空間布置這些區(qū)域,以便使錯誤印頁識別的可能性最小化。作者將標記標在圓圈之外或者掃描印頁時的偏斜將造成錯誤印頁識別。一組中的每個印頁被分配對應于其印頁號的一個區(qū)域,并且在印頁頁面上的分配區(qū)域內預印一個未填寫點(參見圖2和圖3)。一個表(“點映射”)將點號映射到印頁組中的一個印頁號。一個用于點映射的實例表如下所示
存儲該“點映射”,以便以后在諸如數(shù)據(jù)庫表或盤文件的存儲媒介中進行檢索。
參見圖5,在步驟510,印頁ID確定模塊從標志檢測區(qū)域中檢索已識別數(shù)據(jù)。在步驟520,為第一已填滿點和對應區(qū)域執(zhí)行一個搜索,并在步驟530從區(qū)域定義中確定。在步驟540,從基于點號的點映射表中檢索對應的印頁號(例如,在上表中,點號‘1’對應印頁ID號‘00300001-01’)。如果在步驟545上還未確定印頁ID號,則在步驟550,向用戶顯示一個頁面的基于墨水數(shù)據(jù)的圖像,并且在步驟555,提示用戶輸入適當?shù)挠№揑D號。在步驟560,用戶輸入印頁ID號。盡管一個優(yōu)選實施例使用了號碼(數(shù)字)識別印頁,但本領域的熟練技術人員將會認識到也可以使用字母數(shù)字或其它符號。圖5所示的處理在某些方面被更詳細地顯示在圖14中。
參見圖6,在印頁ID號由系統(tǒng)確定后,或者由一個用戶輸入后,執(zhí)行步驟645。在步驟645,根據(jù)印頁ID號進一步識別數(shù)據(jù)(例如,應用光字符識別,或者手寫印刷體識別-也稱作ICR,用于智能字符識別;識別的優(yōu)選方法在圖12中示出),在步驟650,將寫入圖像的印頁的識別數(shù)據(jù)和ID號作為一個未審核文件存入數(shù)據(jù)庫中。識別數(shù)據(jù)根據(jù)印頁的類別進行組織,并且任意地顯示在用戶的檢查屏幕上。數(shù)據(jù)以諸如一個表的格式來顯示,以便于檢查。在步驟660,用戶檢查和確認檢查屏幕上的每個識別數(shù)據(jù)元素,適當時,對其進行校正。在一個優(yōu)選實施例中,圖形用戶接口(GUI)810(參見圖8)能夠使用戶按照“上下文定向”觀看數(shù)據(jù)例如,如果某些數(shù)據(jù)未被識別,則用戶可以有一個在屏幕上顯示的紙張印頁的一部分的圖像,具有重疊在該紙張印頁的圖像上的該頁面的墨水數(shù)據(jù)的一個圖像,以便向用戶呈現(xiàn)一個被書寫紙張印頁的一部分的屏幕圖像。這能夠使用戶檢查和確認數(shù)據(jù)元素,而不呈現(xiàn)被書寫的印頁,并且能夠使用觀看被書寫紙張印頁的所有圖像,這又能使操作員在一個遠端站點(該遠端站點是從書寫紙張印頁的該站點定位的)進行檢查和確認,此外,當數(shù)據(jù)是例如醫(yī)學報告時,印頁上手寫的上下文定向屏幕觀看能夠使用戶重建作者作出該報告使的心態(tài)(語氣),以及患者的個性。
在步驟665,將檢查的數(shù)據(jù)保存到數(shù)據(jù)庫中。
圖9示出了優(yōu)選印頁對準處理的一個概況。在步驟910,執(zhí)行與文本相關聯(lián)的圖5和圖6所示的印頁識別處理,。在步驟915,如果印頁識別步驟910不成功,則在步驟920,印頁對準處理中止,該印頁被標注為“未知”。
如果印頁識別步驟910是成功的,那么在步驟925,對于墨水圖像泡執(zhí)行一個定位墨水泡中心處理(參見圖10和圖11和關聯(lián)的文本)。該步驟導致計算墨水圖像泡的坐標(XlnkCenter,YlnkCenter)。
在步驟925之后,計算基準泡與墨水圖像泡之間的偏移(XOffset,YOffset)XOffset=XlnkCenter-XMast;YOffset=YlnkCenter-Y。XMast和YMast在圖10中分別由X0和Y0表示。
在步驟940,執(zhí)行墨水對準將XOffset和YOffset值應用于墨水圖像,并由此位移圖像。
在步驟950,識別已對準的墨水圖像(參見圖12和相關聯(lián)的文本)。最后,在步驟960,將識別的已對準墨水圖像與基準圖像(已識別印頁的存儲圖像)合并。
圖10示出了在優(yōu)選的定位墨水泡中心處理中利用的坐標和區(qū)域界定,圖11示出了處理步驟。
參見圖10,所示的坐標系統(tǒng)具有沿向下方向增加的y坐際?;鶞仕阉鲄^(qū)域1020由識別的印頁和印頁識別區(qū)域模板來確定。由于該印頁被識別,因此在一個特定基準泡區(qū)域1010內找到以(Xlnk,Ylnk)為圓心的墨水泡圓圈1030。基準泡區(qū)域1010是使基準泡具有中心(X0,Y0),該中心也是基準包膜墨水區(qū)域1010的中心?;鶞仕阉鲄^(qū)域1020是這樣確定的將墨水泡區(qū)域1010沿每個方向(左和右)水平延伸一個距離Xexpand以及沿每個方向(上和下)垂直延伸一個距離Yexpand。
因而,基準搜索區(qū)域1020是一個矩形,具有角坐標(X1,Y1)(上左角),(X2,Y1)(上右角),(X2,Y2)(下右角),和(X1,Y2)(下左角)。
定位墨水中心處理被顯示在圖11中。在步驟1105,初始化變量。BubbleZoneLeft是泡區(qū)域1010左側的x坐標。BubbleZoneRight是泡區(qū)域1010右側的x坐標。BubbleZoneTop是泡區(qū)域1010頂側的y坐標。BubbleZoneBottom是泡區(qū)域1010底側的y坐標。變量YScan被設置為Y1。
變量YTop、YBottom、XLeft和XRight最初被分別設置為Y2、Y1、X2和X1。在定位墨水泡中心處理的結尾,變量YBottom將含有墨水泡1030的y坐標的值,XLeft將含有墨水泡1030的左側的x坐標的值,XRight將含有墨水泡1030的右側的y坐標的值。需要注意的是,該處理是很粗的,即使墨水泡1030不是一個完全的圓盤,該處理也將確定墨水泡1030的“中心”。
在步驟1110,變量XScan被設置到X1。在步驟1115,進行一個檢驗,檢驗一個黑色像素是否位于基準搜索區(qū)域1020的上左角(XScan,YScan)(最初位于(X1,Y1))。如果如果答案是否定的,則在步驟1160遞增變量XScan。如果在步驟1165上檢驗到值,則該遞增不會導致一個大于X2的值(即,如果該掃描未達到基準搜索區(qū)域1020的右側,則重復步驟1115)。如果在步驟1165上,步驟1160上的變量XScan的遞增導致XScan具有大于X2的值,那么在步驟1170上遞增變量YScan。如果在步驟1175上檢驗到值時YScan的值大于Y2,那么,在步驟1180上計算XlnkCenter和YlnkCenter。如果在步驟1175上YScan的值不大于Y2,則重復步驟1110。軟件從左到右和從上到下掃描基準收縮區(qū)域1020。
如果步驟1115上的回答是肯定的,則在步驟1120上進行一個檢驗,檢驗變量YScan的當前值是否小于YTop的當前值。如果是,則在步驟1125上將YTop設置為等于YScan。從而找到墨水泡1030的頂端,并且把它的y坐標確定為YScan的當前值。如果步驟1120上的回答是否定的,則執(zhí)行步驟1130,如果步驟1120上的答復是肯定的,則執(zhí)行步驟1125。
在步驟1130上,進行一個檢驗,以便檢驗XScan的當前值是否小于XLeft的當前值。如果回答是肯定的,則在步驟1150上將XRight設置為等于XScan。如果步驟1130上答案是肯定的,則執(zhí)行步驟1145,如果步驟1130上的答案是否定的,則執(zhí)行步驟1145。
在步驟1145上,進行一個檢驗,以便檢驗XScan是否大于XRight,如果答案是肯定的,則在步驟1150上將XRight設置為等于XScan。如果步驟1145上答案是否定的,則執(zhí)行步驟1155,如果步驟1145上的答案是肯定的,則執(zhí)行步驟1150。在步驟1155上,YBottom被設置為等于YScan。如上所述,步驟1160跟隨步驟1155。當處理繼續(xù)進行時,YTop的值遞減,直至它反映了墨水泡1030中最上端像素的y坐標的值;YBottom的值遞增,直至它反映了墨水泡1030中最下端像素的y坐標的值;YLeft的值遞減,直至它反映了墨水泡1030中最左端像素的x坐標的值;YRight的值遞增,直至它反映了墨水泡1030中最右端像素的x坐標的值;這樣,當最后到達步驟1180時,XlnkCenter(=(XLeft+XRight)/2)和YlnkCenter(=(YTop+YBottom)/2)的計算將精確地確定墨水泡1030的中心位置(如果墨水泡1030形成一個理想的圓盤的話),并且在任何情況下適當?shù)亟?估計)墨水泡1030的中心。這種確定墨水泡1030中心的方法僅僅是一個優(yōu)選實施例。不能用來限定權利要求所述的本發(fā)明的范圍。本領域的熟練技術人員將會認識到存在各種已知的確定不規(guī)則形狀的二維對象中心的方法,在不背離本發(fā)明公開范圍的條件下,可以用這些方法替代上述方法。
返回圖9,在步驟930,使用公式XOffset=XlnkCenter-XMast和YOffset=YlnkCenter-YMast計算墨水泡1030與基準泡(具有中心(XMast,YMast))之間的偏差。然后應用值XOffset和YOffset移位墨水圖像。例如,如果XOffset為正而YOffset為負,則將墨水圖像向左位移一個距離|XOffset|,以及向下位移一個距離|YOffset|。
最好按照像素數(shù)目測量距離。這樣,在一個優(yōu)選實施例中,用|XOffset|像素水平地移動墨水圖像像素,以及用|YOffset|像素垂直地移動墨水圖像像素。下面的C++碼示出了執(zhí)行墨水圖像位移的優(yōu)選方法<pre listing-type="program-listing"><![CDATA[////////////////////////////////////////////////////////功能計算泡偏移////計算自動對準偏移的算法//參數(shù)// in// hllmg BITMAPHANDLE*具有包含泡的墨水像素// iBubbleTop 泡基準區(qū)域頂部的Y坐標// iBubbleLeft泡基準區(qū)域左部的X坐標// iBubbleBottom 泡基準區(qū)域底部的Y坐標// iBubbleRight 泡基準區(qū)域右部的X坐標//// out// *piOffsetX 設置到計算的XOffset或者作為默認值的0// *piOffsetY 設置到計算的YOffset或者作為默認值的0//如果未發(fā)現(xiàn)泡,則返回到0//如果發(fā)現(xiàn)泡,則返回到1//int CalculateBubbleOffset( BITMAPHANDLE *hllmg, int iBubbleTop, int iBubbleLeft, int iBubbleBottom, int iBubbleRight, int*piOffsetX,int*piOffsetY){ #定義EXPAND_Y 50//Y方向的基準搜索區(qū)域 #定義EXPAND_X 40//X方向的基準搜索區(qū)域 #定義ALIGN_THRESHOLD 50//像素的最大允許自動對準 int iRetuen=0 //最初沒有偏移 piOffsetX=*piOffsetY=0; COLORREF cr; int x,y; int iMinY=-1; int iMinX=-1; int iMaxY=-1; int iMaxX=-1; int iStartY=__max(iBubbleTop-EXPAND_y,0); int iStartX=__max(iBubbleLeft-EXPAND_x,0); int iEndY=iBubbleBottom+EXPAND_y; int iEndX=iBubbleRight+EXPAND_x; bool bFound=錯誤; 對于(y=iStartY;y<=iEndy;y++) { h=0; 對于(x=iStartX;x<=iEndX;x++) { //檢查黑色像素 cr=GetPixelColor(hLlmg,y,x); 如果(cr==RGB(0,0,0)) {如果(!bFound) bFound=正確; //將所有坐標初始化到第一黑色像素 如果(iMinY==-1) { iMinY=y(tǒng); } 如果(iMaxY==-1) { iMaxY=y(tǒng) } 如果(iMinX==-1) { iMinX=X; { 如果(iMaxX==-1) { iMaxX=X; { //更新mins和maxes 如果(x>iMaxX) iMaxX=x; 如果(x>iMaxY) iMaXY=y(tǒng); 如果(x<iMinX) iMinX=x; } }}如果(bFound){ iReturn=1; //計算墨水泡的中心(Xlnk,Ylnk)int iBubbleCenterX=iMinX+(iMaxX-iMinX); int iBubbleCenterY=iMinY+(iMaxY-iMinY); //計算基準泡的中心(X0,Y0) int iReferenceCenterX=iBubbleLeft+(iBubbleRight-iBubbleLeft); int iReferenceCenterY=iBubbleTop+(iBubbleBottom-iBubbleTop); //計算自動印頁對準偏移(XOffset,YOffset) *piOffsetX=iBubbleCenterX-iReferenceCenterX; *piOffsetY=iBubbleCenterY-iReferenceCenterY; //使真實偏移不大于max piOffsetX=__min(*plOffsetX,ALIGN_THRESHOLD); piOffsetY=__min(*plOffsetY;ALIGN_THRESHOLD); } 其它 { TRACE0(_T(”CalculateBubbleOffset no ink found in bubble zone.\n”)); } 返回iReturn;}//結尾功能CalculateBubbleOffset///////////////////////////////////////////////////////////]]></pre>通過合并加載墨水與計劃性建立的白頁“空”圖像偏移墨水像素。把像素結果設置到255最大值(白色)的逐位加算法被用來合并像素。下列代碼執(zhí)行該操作CombineBitmapPixels(&bmpWhitePage,//建立的“白頁”像素數(shù)據(jù)結構(還導致目的地)0, //白頁像素的X源點0, //白色像素的Y源點BITMAPWIDTH(&bmpWhitePage),//白頁中的全部X像素
BITMAPHEIGHT(&bmpWhitePage),//白頁中的全部Y像素&bmplnk,//加載的墨水象素數(shù)據(jù)結構iXOffset, //墨水象素的X源點(X偏移)iYOffset, //墨水象素的Y源點(Y偏移)CB_OP_ADD); //合并算法類型一旦墨水圖像已經(jīng)被位移(對準),OMR和OCR處理就進行(發(fā)生)-在步驟950識別已對準的圖像。
圖12示出了優(yōu)選的墨水圖像識別處理。在步驟1210,加載用于一個印頁的字段定義文件。在步驟1220,將墨水圖像加載到存儲器中。在步驟1230,將字段定義文件和圖像傳送到用于識別的識別引擎,在步驟1240,將識別的結果保存到數(shù)據(jù)庫上。
返回到圖9,在步驟960用識別的(黑色)印頁的基準圖像對準已對準的被識別墨水圖像。圖13示出了該處理。在步驟1310將印頁的基準圖像加載到存儲器中。在步驟1320,將墨水圖像加載到存儲器中。
在步驟1330,將墨水圖像與基準圖像合并。通過計劃性地使用合并像素的逐位OR算法,將墨水象素與基準圖像像素合并。以下代碼執(zhí)行該操作CombineBitmapPixels(&bmplnk,//加載的墨水象素結構(還導致目的地)0, //墨水像素的X源點0, //墨水像素的Y源點BITMAPWIDTH(&bmplnk), //墨水中的全部X像素BITMAPHEIGHT(&bmplnk),//墨水中的全部Y像素&bmpReference,//加載的基準象素數(shù)據(jù)結構0,//基準像素的X源點0,//墨水象素的Y源點CB_OP_OR);//合并算法類型最后,在步驟1340,將合并的圖像保存到一個盤或其它存儲媒介上。
圖14示出了優(yōu)選實施例的印頁識別處理。該處理的某些處理還被顯示在圖5中。在步驟1410,將一個印頁集Form ID區(qū)域定義文件加載到存儲器中。在步驟1420,將一個墨水圖像加載到存儲器中。在步驟1425上,調用一個識別并且使用加載的區(qū)域定義和墨水圖像。在步驟1430,將變量FormID調整到等于1。在步驟1435,進行一個檢驗,以便檢驗FormID上的識別結果中的字符等于1。如果等于1,則該印頁已經(jīng)被識別,并且在步驟1450結束該處理。如果不等于1,那么執(zhí)行步驟1440,在該步驟中遞增FormID。在步驟1445,進行一個檢驗,以便檢查是否大于印頁集中的印頁的數(shù)量。如果是,則因為不識別印頁而在步驟1455上結束處理。如果不是,則處理返回到步驟1435。
在本發(fā)明的另一個實施例中,使用未在其上印刷印頁指示符的預印印頁。為了能夠使用這種印頁,將一個模板(最好是金屬或塑料模板)粘貼到數(shù)字化轉換器板上。該模板作為一個印刷模板(參見圖15)用戶在引導器中的孔中填寫;每個孔對應于不同的印頁。按照這種方式,將上述的印頁識別處理應用于未預印印頁指示符的印頁。
在一個優(yōu)選實施例中,使用諸如圖15所示的配置。模板最好是一個塑料覆蓋板1510,該覆蓋板套在數(shù)字化轉換器板(最好是CrossPad或者其衍生物)上的側部的紙張引導器上(參見圖16,數(shù)字化轉換器板在其左側具有三個側部紙張引導器1610)。模板1510最好具有三個槽1530,這三個槽能夠使模板套在數(shù)字化轉換器板上的三個凸起紙張引導器上。本領域的熟練技術人員將會認識到應當用其它的附著方法替代其它配置的數(shù)字化轉換器板。例如,如果在數(shù)字化轉換器板上僅存在一個凸起的紙張引導,并且位于板的右手側,則模板1510應當具有沿其右側設置的一個槽。
返回到圖15所示的優(yōu)選實施例,三個槽1530相隔近似為(±2mm)48mm,寬為1mm,距模板1510的左邊緣5mm,長度約為(±1mm)48mm。最頂端槽1530的頂部最好與模板1510的頂邊緣相距15mm,最底端槽1530的底部最好與模板1510的底邊緣相距15mm。
模板1310厚約為2mm,長約為273mm,寬約為27mm。每個印頁指示符泡1520的直徑最好為2.5mm,泡1520之間的最小的優(yōu)選距離為4mm。
盡管所示和所述的實施例能夠充分實現(xiàn)本發(fā)明的主題,但是應當理解顯示這些實施例僅僅是用于舉例說明的目的,而不是用于限制的目的。例如,可以容易地把CrossPad修改為使用戶能夠能夠跳躍頁面(例如,從頁面14直接跳躍到頁面3),以替代重復地敲擊頁上移和頁下移按鈕。
權利要求
1.一種預印印頁的自動識別的方法,包括以下步驟(a)接收和存儲描述一個在預印印頁上人工制作的標志的位置的數(shù)據(jù);(b)根據(jù)所述標志的位置識別所述印頁。
2.根據(jù)權利要求1所述的方法,其中在步驟(a)中接收和存儲的數(shù)據(jù)是數(shù)字化圖像數(shù)據(jù),該圖像數(shù)據(jù)被計算機接收并且被存儲在一個計算機存儲媒介中。
3.根據(jù)權利要求2所述的方法,其中步驟(b)包括確定一個包括所述標志的所述位置的印頁識別區(qū)域,以及確定對應于印頁識別區(qū)域的印頁。
4.根據(jù)權利要求3所述的方法,其中步驟(b)包括存儲一個匹配印頁識別區(qū)域與印頁ID的表。
5.根據(jù)權利要求4所述的方法,其中步驟(b)還包括將所接收的數(shù)字化圖像數(shù)據(jù)再形成一個將由一個識別引擎處理的格式;通過用所述識別引擎處理所述再形成的圖像數(shù)據(jù),將再形成的數(shù)字化圖像數(shù)據(jù)轉換成已識別數(shù)據(jù);為一個或多個印頁識別區(qū)域檢索已識別數(shù)據(jù);為包含標志的區(qū)域搜索所述檢索的已識別數(shù)據(jù);和通過匹配所述區(qū)域與印頁ID來識別印頁。
6.根據(jù)權利要求5所述的方法,還包括在計算機監(jiān)視器上顯示數(shù)字化圖像數(shù)據(jù)的步驟,使用戶能夠人工地識別書寫圖像的印頁。
7.根據(jù)權利要求6所述的方法,還包括在用戶計算機監(jiān)視器上以便于檢查的格式顯示識別數(shù)據(jù)的步驟。
8.根據(jù)權利要求7所述的方法,還包括顯示疊加在識別的印頁的一個圖像上的數(shù)字化圖像數(shù)據(jù)的步驟,以便顯現(xiàn)印頁的屏幕圖像和寫在印頁上的圖像。
9.根據(jù)權利要求8所述的方法,還包括通過將所述識別數(shù)據(jù)與被顯示的疊加在識別印頁的圖像上的數(shù)字化圖像數(shù)據(jù)相比較,檢查所述識別數(shù)據(jù)的步驟。
10.一種預印印頁識別的系統(tǒng),包括a)一個數(shù)字化轉換器;b)一個預印印頁,包括所述印頁才有的一個或多個預印指示符,以指示用戶輸入的一個或多個識別標識;和c)一個連接數(shù)據(jù)庫的計算機處理器,用于i)接收在印頁上制作了標志的一個或多個數(shù)字化圖像,ii)識別由用戶制作的一個或多個識別標志的存在或位置,和iii)根據(jù)所述一個或多個標志的位置識別印頁。
11.預印印頁的自動識別的計算機軟件,包括a)接收和存儲描述一個在預印印頁上人工制作的標志的位置的數(shù)據(jù)的軟件;b)根據(jù)所述標志的位置識別所述印頁的軟件。
12.根據(jù)權利要求11所述的軟件,還包括存儲一個匹配印頁識別區(qū)域與印頁ID的表的軟件。
13.根據(jù)權利要求11所述的軟件,其中所接收的和存儲的數(shù)據(jù)是存儲在一個計算機存儲媒介中的數(shù)字化圖像數(shù)據(jù)。
14.根據(jù)權利要求13所述的軟件,還包括管理用于后續(xù)基準的所述數(shù)字化圖像數(shù)據(jù)的軟件。
15.根據(jù)權利要求14所述的軟件,其中識別軟件包括確定一個包括所述標志的所述位置的印頁識別區(qū)域的軟件,以及確定對應于印頁識別區(qū)域的印頁的軟件。
16.根據(jù)權利要求15所述的軟件,其中識別軟件還包括這樣的軟件將所接收的數(shù)字化圖像數(shù)據(jù)再形成一個將由一個識別引擎處理的格式;通過用所述識別引擎處理所述再形成的圖像數(shù)據(jù),將所述再形成的數(shù)字化圖像數(shù)據(jù)轉換成已識別數(shù)據(jù);為一個或多個印頁識別區(qū)域檢索已識別數(shù)據(jù);為包含標志的區(qū)域搜索所述檢索的已識別數(shù)據(jù);和通過匹配將所述區(qū)域與印頁ID來識別印頁。
17.根據(jù)權利要求16所述的軟件,還包括在計算機監(jiān)視器上顯示數(shù)字化圖像數(shù)據(jù)的軟件,使用戶能夠人工地識別書寫圖像的印頁。
18.根據(jù)權利要求17所述的軟件,還包括在用戶計算機監(jiān)視器上以便于檢查的格式顯示已識別數(shù)據(jù)的軟件。
19.根據(jù)權利要求18所述的軟件,還包括顯示疊加在識別印頁的一個圖像上的數(shù)字化圖像數(shù)據(jù)的軟件,以便顯現(xiàn)印頁的屏幕圖像和寫在印頁上的圖像。
20.根據(jù)權利要求19所述的軟件,還包括通過將所述已識別數(shù)據(jù)與所顯示的疊加在識別印頁的圖像上的數(shù)字化圖像數(shù)據(jù)相比較,檢查所述已識別數(shù)據(jù)的軟件。
21.根據(jù)權利要求20所述的軟件,還包括根據(jù)寫在印頁上的非標準符號辨別有關信息的軟件。
22.一種處理數(shù)字化圖像數(shù)據(jù)的方法,包括以下步驟(a)接收數(shù)字化圖像數(shù)據(jù);(b)確定所述數(shù)字化圖像數(shù)據(jù)中所包括的第一標志的位置;(c)確定從所述第一標志到基準位置的距離和方向;(d)執(zhí)行所述數(shù)字化圖像數(shù)據(jù)的位移,其中所述位移以所述距離和方向為基礎。
23.根據(jù)權利要求22所述的方法,其中所述數(shù)字化圖像數(shù)據(jù)對應于置放在數(shù)字化轉換器板式上的印頁上所制作的標志。
24.根據(jù)權利要求23所述的方法,其中通過已經(jīng)制作一個識別標志的一個區(qū)域的位置識別所述印頁。
25.根據(jù)權利要求24所述的方法,其中所述第一標志是所述識別標志。
26.根據(jù)權利要求25所述的方法,其中所述識別標志近似為圓圈。
27.根據(jù)權利要求25所述的方法,其中所述第一標志的所述位置通過定位所述第一標志的中心來確定。
28.根據(jù)權利要求26所述的方法,其中所述第一標志的所述位置通過定位所述第一標志的中心來確定。
29.一種處理數(shù)字化圖像數(shù)據(jù)的方法,包括以下步驟a)接收數(shù)字化圖像數(shù)據(jù);b)確定所述數(shù)字化圖像數(shù)據(jù)中所包括的第一標志的位置;c)確定從所述第一標志到基準位置的距離和方向;d)執(zhí)行所述數(shù)字化圖像數(shù)據(jù)的位移,其中所述位移以所述距離和方向為基礎;e)通過用一個識別引擎處理所述數(shù)字化圖像數(shù)據(jù),將所述位移數(shù)字化圖像數(shù)據(jù)轉換成識別圖像數(shù)據(jù);和f)合并所述識別圖像數(shù)據(jù)與基準圖像。
30.根據(jù)權利要求29所述的方法,其中所述數(shù)字化圖像數(shù)據(jù)對應于置放在數(shù)字化轉換器板上的印頁上所制作的標志。
31.根據(jù)權利要求30所述的方法,其中所述基準圖像是所述印頁的一個圖像。
32.根據(jù)權利要求31所述的方法,其中通過已經(jīng)制作一個識別標志的一個區(qū)域的位置識別所述印頁。
33.根據(jù)權利要求32所述的方法,其中所述第一標志是所述識別標志。
34.根據(jù)權利要求33所述的方法,其中所述識別標志近似為圓圈。
35.根據(jù)權利要求33所述的方法,其中所述第一標志的所述位置通過定位所述第一標志的中心來確定。
36.根據(jù)權利要求34所述的方法,其中所述第一標志的所述位置通過定位所述第一標志的中心來確定。
37.一種預印印頁的自動識別的方法,包括以下步驟a)接收和存儲描述一個在預印印頁上人工制作的標志的位置的數(shù)據(jù),其中所述標志通過在粘貼到數(shù)字化轉換器板上的模板的一個孔中填寫來制作所述標志;和b)根據(jù)所述標志的位置識別所述印頁。
38.根據(jù)權利要求37所述的方法,其中在步驟(a)中接收和存儲的數(shù)據(jù)是數(shù)字化圖像數(shù)據(jù),該圖像數(shù)據(jù)被計算機接收并且被存儲在一個計算機存儲媒介中。
39.根據(jù)權利要求38所述的方法,其中步驟(b)包括確定一個包括所述標志的所述位置的印頁識別區(qū)域,以及確定對應于印頁識別區(qū)域的印頁。
40.根據(jù)權利要求39所述的方法,其中步驟(b)包括存儲一個匹配印頁識別區(qū)域與印頁ID的表。
41.根據(jù)權利要求40所述的方法,其中步驟(b)還包括將所接收的數(shù)字化圖像數(shù)據(jù)再形成一個將由一個識別引擎處理的格式;通過用所述識別引擎處理所述再形成的圖像數(shù)據(jù),將再形成的數(shù)字化圖像數(shù)據(jù)轉換成已識別數(shù)據(jù);為一個或多個印頁識別區(qū)域檢索已識別數(shù)據(jù);為包含標志的區(qū)域搜索所述檢索的已識別數(shù)據(jù);和通過匹配所述區(qū)域與印頁ID來識別印頁。
42.根據(jù)權利要求41所述的方法,還包括在計算機監(jiān)視器上顯示數(shù)字化圖像數(shù)據(jù)的步驟,使用戶能夠人工地識別書寫圖像的印頁。
43.根據(jù)權利要求42所述的方法,還包括在用戶計算機監(jiān)視器上以便于檢查的格式顯示已識別數(shù)據(jù)的步驟。
44.根據(jù)權利要求43所述的方法,還包括顯示疊加在識別的印頁的一個圖像上的數(shù)字化圖像數(shù)據(jù)的步驟,以便顯現(xiàn)印頁的屏幕圖像和寫在印頁上的圖像。
45.根據(jù)權利要求44所述的方法,還包括通過將所述已識別數(shù)據(jù)與所顯示的疊加在識別印頁的圖像上的數(shù)字化圖像數(shù)據(jù)相比較,檢查所述已識別數(shù)據(jù)的步驟。
46.一種預印印頁識別的系統(tǒng),包括a)一個數(shù)字化轉換器;b)一個預印印頁,c)一個粘貼在所述數(shù)字化轉換器上的模板,所述模板包括一個或多個孔,用戶通過所述孔輸入識別所述印頁的一個或多個識別標記;和d)一個連接數(shù)據(jù)庫的計算機處理器,用于i)接收在印頁上制作了標志的一個或多個數(shù)字化圖像,ii)識別由用戶制作的一個或多個識別標志的存在或位置,和iii)根據(jù)所述一個或多個標志的位置識別印頁。
47.預印印頁的自動識別的計算機軟件,包括a)接收和存儲描述一個在預印印頁上人工制作的標志的位置的數(shù)據(jù)的軟件,所述標志是通過在一個模板的一個或多個孔中填寫制作的;和c)根據(jù)所述標志的位置識別所述印頁的軟件。
48.根據(jù)權利要求47所述的軟件,還包括存儲一個匹配印頁識別區(qū)域與印頁ID的表的軟件。
49.根據(jù)權利要求47所述的軟件,其中所接收的和存儲的數(shù)據(jù)是存儲在一個計算機存儲媒介中的數(shù)字化圖像數(shù)據(jù)。
50.根據(jù)權利要求49所述的軟件,還包括管理用于后續(xù)基準的所述數(shù)字化圖像數(shù)據(jù)的軟件。
51.根據(jù)權利要求50所述的軟件,其中識別軟件包括確定一個包括所述標志的所述位置的印頁識別區(qū)域的軟件,以及確定對應于印頁識別區(qū)域的印頁的軟件。
52.根據(jù)權利要求51所述的軟件,其中識別軟件還包括這樣的軟件將所接收的數(shù)字化圖像數(shù)據(jù)再形成一個由一個識別引擎處理的格式;通過用所述識別引擎處理所述再形成的圖像數(shù)據(jù),將所述再形成的數(shù)字化圖像數(shù)據(jù)轉換成已識別數(shù)據(jù);為一個或多個印頁識別區(qū)域檢索已識別數(shù)據(jù);為包含標志的區(qū)域搜索所述檢索的已識別數(shù)據(jù);和通過匹配將所述區(qū)域與印頁ID來識別印頁。
53.根據(jù)權利要求52所述的軟件,還包括在計算機監(jiān)視器上顯示數(shù)字化圖像數(shù)據(jù)的軟件,使用戶能夠人工地識別書寫圖像的印頁。
54.根據(jù)權利要求53所述的軟件,還包括在用戶計算機監(jiān)視器上以便于檢查的格式顯示已識別數(shù)據(jù)的軟件。
55.根據(jù)權利要求54所述的軟件,還包括顯示疊加在識別印頁的一個圖像上的數(shù)字化圖像數(shù)據(jù)的軟件,以便顯現(xiàn)印頁的屏幕圖像和寫在印頁上的圖像。
56.根據(jù)權利要求55所述的軟件,還包括通過將所述已識別數(shù)據(jù)與所顯示的疊加在識別印頁的圖像上的數(shù)字化圖像數(shù)據(jù)相比較,檢查所述已識別數(shù)據(jù)的軟件。
57.根據(jù)權利要求56所述的軟件,還包括根據(jù)寫在印頁上的非標準符號辨別有關信息的軟件。
全文摘要
一種預印印頁(45)的自動識別的方法和系統(tǒng),根據(jù)印頁(45)上人工制作的一個標志(230)的位置進行自動識別。該方法包括以下步驟接收數(shù)字化墨水圖像數(shù)據(jù)(412),識別標志(230)的存在和位置,確定接收的墨水數(shù)據(jù)與存儲的印頁圖像之間的任何未對準,并且位移墨水數(shù)據(jù),以校正未對準。系統(tǒng)包括一個數(shù)字化轉換器(35)和一個預印印頁(45),預印印頁(45)包括只有該印頁才有的一個或多個預印的指示符,該指示符指示用戶輸入一個或多個識別標志(221,230)。數(shù)字化轉換器(35)將圖像數(shù)據(jù)發(fā)送給連接數(shù)據(jù)庫的計算機處理器(25),包括在一個印頁上制作了標志的一個或多個數(shù)字化圖像。處理器(25)識別由用戶制作的一個或多個識別標志的存在和位置,并且根據(jù)所述一個或多個標志的位置識別印頁。
文檔編號G06K9/20GK1429450SQ01803614
公開日2003年7月9日 申請日期2001年1月9日 優(yōu)先權日2000年1月11日
發(fā)明者A·P·伯格森, S·范思克, D·格森伯格, A·小列農, S·B·里德 申請人:蒂姆布爾系統(tǒng)公司