欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

經(jīng)掃描的硬拷貝媒體的分類的制作方法_4

文檔序號(hào):9621388閱讀:來源:國知局
典350進(jìn)行比較。可接著計(jì)算匹配詞干詞典350中的詞目的詞干330的數(shù)目, 且將詞干330的數(shù)目與預(yù)先定義的閾值進(jìn)行比較。詞干詞典350可包含在特定語言的文檔 中存在的詞干或可包含一組相關(guān)語言中存在的詞干。在一些實(shí)施例中,詞干詞典350可僅 包含對(duì)應(yīng)于感興趣的特定文檔類型(舉例來說,發(fā)票)的詞干。圖6展示針對(duì)英文發(fā)票憑 據(jù)的示范性詞干詞典350的一部分。所顯示的部分展示發(fā)現(xiàn)在發(fā)票憑據(jù)的示例數(shù)目的至少 25%中存在的詞干。類似詞干詞典350可具有一組不同的文檔類型(舉例來說,收據(jù)、商業(yè) 信件、報(bào)告等等)。在此情況下,可將發(fā)現(xiàn)于經(jīng)掃描的數(shù)字圖像210中的詞干330與詞干詞 典350中的每一者進(jìn)行比較,以不僅確定硬拷貝媒體200 (圖2)是否為文檔,而且將文檔的 類型分類。
[0072] 在一些應(yīng)用中,輸入硬拷貝媒體200的前側(cè)及背側(cè)兩者經(jīng)掃描以提供對(duì)應(yīng)的經(jīng)掃 描的數(shù)字圖像210。在此情況下,針對(duì)硬拷貝媒體200的前側(cè)與背側(cè)兩者,可將本發(fā)明的 方法獨(dú)立地應(yīng)用到經(jīng)掃描的數(shù)字圖像210。以此方式,可針對(duì)每一側(cè)確定獨(dú)立的媒體分類 260。替代地,可以組合形式分析兩側(cè)。舉例來說,前側(cè)及背側(cè)的物理尺寸通常將為相同的, 且因此常見的照片尺寸測(cè)試225及常見的文檔尺寸測(cè)試240應(yīng)都產(chǎn)生相同的結(jié)果。因此, 如果這些測(cè)試中的一者針對(duì)一側(cè)產(chǎn)生肯定結(jié)果,相同的分類就也被采用到另一側(cè)。
[0073] 在一些實(shí)施例中,在雙面型硬拷貝媒體被分類為照片的情況中,可使用額外標(biāo)準(zhǔn) 以確定哪面是照片的前側(cè)及哪面是照片的背側(cè)。舉例來說,可出于此目的使用前述美國 專利案7,920, 296中描述的方法。在此情況下,可希望將不同的處理應(yīng)用到照片的前側(cè) 及背側(cè)。舉例來說,水印、背打印及在照片的背側(cè)上書寫的手寫文本可經(jīng)分析以確定可與 照片的前側(cè)上描繪的圖像相關(guān)聯(lián)的元數(shù)據(jù)。舉例來說,貝亞托(Beato)等人的標(biāo)題為"從 數(shù)字化硬拷貝媒體自動(dòng)產(chǎn)生動(dòng)態(tài)數(shù)字元數(shù)據(jù)記錄的方法(Method for Automatically Generating a Dynamic Digital Metadata Record from Digitized Hardcopy Media) ',的 第2007/0250532號(hào)美國專利申請(qǐng)案公開案揭示通過分析包含水印及其它物理印刷品屬性 的特征以確定關(guān)于印刷品的信息而從數(shù)字化硬拷貝媒體自動(dòng)產(chǎn)生一組動(dòng)態(tài)的元數(shù)據(jù)。
[0074] 計(jì)算機(jī)程序產(chǎn)品可包含一或多種非暫時(shí)性的有形計(jì)算機(jī)可讀存儲(chǔ)媒體,舉例來 說:磁性存儲(chǔ)媒體,例如磁盤(例如軟盤)或磁帶;光學(xué)存儲(chǔ)媒體,例如光盤,光帶或機(jī)器可 讀條形碼;固態(tài)電子存儲(chǔ)裝置,例如隨機(jī)存取存儲(chǔ)器(RAM)或只讀存儲(chǔ)器(ROM);或用以存 儲(chǔ)具有用于控制一或多個(gè)計(jì)算機(jī)實(shí)踐根據(jù)本發(fā)明的方法的指令的計(jì)算機(jī)程序的任何其它 物理裝置或媒體。
[0075] 已特定參考本發(fā)明的某些優(yōu)選實(shí)施例詳細(xì)描述本發(fā)明,但應(yīng)理解,在本發(fā)明的精 神及范圍內(nèi)可實(shí)現(xiàn)多種變化及修改。
[0076] 部件列表
[0077] 110 數(shù)據(jù)處理系統(tǒng)
[0078] 120 外圍系統(tǒng)
[0079] 130 用戶接口系統(tǒng)
[0080] 140 數(shù)據(jù)存儲(chǔ)系統(tǒng)
[0081] 200 硬拷貝媒體
[0082] 205 掃描媒體步驟
[0083] 210 經(jīng)掃描的數(shù)字圖像
[0084] 215 確定物理尺寸步驟
[0085] 220 物理尺寸
[0086] 225 常見的照片尺寸測(cè)試
[0087] 230 常見的照片尺寸數(shù)據(jù)庫
[0088] 235 將圖像分類為照片步驟
[0089] 240 常見的文檔尺寸測(cè)試
[0090] 245 常見的文檔尺寸數(shù)據(jù)庫
[0091] 250 將圖像分類為文檔步驟
[0092] 255 上下文處理步驟
[0093] 260 媒體分類
[0094] 265 存儲(chǔ)媒體分類步驟
[0095] 305 光學(xué)字符辨識(shí)處理步驟
[0096] 310 ASCII 文本
[0097] 320 計(jì)算詞干步驟
[0098] 330 詞干
[0099] 340 文檔文本圖案測(cè)試
[0100] 350 詞干詞典
[0101] 400 常見的照片尺寸表
[0102] 500 常見的ISO文檔尺寸表
[0103] 510 常見的日本文檔尺寸表
[0104] 520 常見的北美文檔尺寸表
[0105] 530 常見的ANSI文檔尺寸表
【主權(quán)項(xiàng)】
1. 一種用于自動(dòng)將經(jīng)掃描的硬拷貝媒體分類的方法,其包括: 使用數(shù)字圖像捕獲裝置掃描一件硬拷貝媒體以提供具有多個(gè)圖像像素的經(jīng)掃描的數(shù) 字圖像,所述多個(gè)圖像像素具有像素值; 確定所述件硬拷貝媒體的物理尺寸; 接收指定照片的常見物理尺寸的常見的照片尺寸數(shù)據(jù)庫; 接收指定文檔的常見物理尺寸的常見的文檔尺寸數(shù)據(jù)庫; 如果所述所確定的物理尺寸在預(yù)先確定的容差內(nèi)匹配照片的所述常見的物理尺寸中 的一者,就將所述件經(jīng)掃描的硬拷貝媒體分類為照片; 如果所述所確定的物理尺寸在預(yù)先確定的容差內(nèi)匹配文檔的所述常見的物理尺寸中 的一者,就將所述件經(jīng)掃描的硬拷貝媒體分類為文檔;以及 將所述所確定的分類的指示存儲(chǔ)到處理器可存取的存儲(chǔ)器中。2. 根據(jù)權(quán)利要求1所述的方法,其中通過使用數(shù)據(jù)處理器分析所述經(jīng)掃描的數(shù)字圖像 的所述像素值確定所述件硬拷貝媒體的所述物理尺寸。3. 根據(jù)權(quán)利要求1所述的方法,其中通過使用與所述數(shù)字圖像捕獲裝置相關(guān)聯(lián)的一或 多個(gè)傳感器確定所述件硬拷貝媒體的所述物理尺寸。4. 根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包含:將一或多個(gè)數(shù)字圖像處理操作應(yīng)用到 所述經(jīng)掃描的數(shù)字圖像,其中響應(yīng)于所述所確定的分類控制或選擇所述數(shù)字圖像處理操作 中的至少一者。5. 根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包含:如果所述所確定的物理尺寸在預(yù)先確 定的容差內(nèi)不匹配照片的所述常見的物理尺寸中的任何者或文檔的所述常見的物理尺寸 中的任何者,則: 使用數(shù)據(jù)處理器分析所述經(jīng)掃描的數(shù)字圖像以檢測(cè)所述件硬拷貝媒體中存在的任何 字母數(shù)字字符的存在; 如果所述經(jīng)檢測(cè)的字母數(shù)字字符滿足預(yù)先定義的標(biāo)準(zhǔn)就將所述件經(jīng)掃描的硬拷貝媒 體分類為文檔。6. 根據(jù)權(quán)利要求5所述的方法,其中使用光學(xué)字符辨識(shí)算法分析所述經(jīng)掃描的硬拷貝 媒體的頁以識(shí)別所述件硬拷貝媒體中存在的任何字母數(shù)字字符。7.根據(jù)權(quán)利要求6所述的方法,其中如果經(jīng)辨識(shí)的字母數(shù)字字符的數(shù)目大于或等于預(yù) 先確定的閾值,所述預(yù)先確定的標(biāo)準(zhǔn)被滿足。8. 根據(jù)權(quán)利要求6所述的方法,其進(jìn)一步包含: 將經(jīng)辨識(shí)的字母數(shù)字字符群組與具有已知的詞的詞典進(jìn)行比較以識(shí)別經(jīng)辨識(shí)的詞; 其中所述預(yù)先確定的標(biāo)準(zhǔn)將經(jīng)辨識(shí)的詞的數(shù)目與預(yù)先確定的閾值進(jìn)行比較。9.根據(jù)權(quán)利要求6所述的方法,其進(jìn)一步包含: 分析經(jīng)辨識(shí)的字母數(shù)字字符群組以確定對(duì)應(yīng)的詞干; 其中所述預(yù)先確定的標(biāo)準(zhǔn)響應(yīng)于所述所確定的詞干確定是否將所述件經(jīng)掃描的硬拷 貝媒體分類為文檔。10. 根據(jù)權(quán)利要求9所述的方法,其中將所述所確定的詞干與常見的文檔詞干詞典進(jìn) 行比較。11. 根據(jù)權(quán)利要求10所述的方法,其中所述常見的文檔詞干詞典為特定文檔類型所特 有。12. 根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包含:分析所述經(jīng)掃描的數(shù)字圖像以確定所 述件硬拷貝媒體是否為空白頁。13. 根據(jù)權(quán)利要求12所述的方法,其進(jìn)一步包含:丟棄被確定為空白頁的任何經(jīng)掃描 的數(shù)字圖像。14. 根據(jù)權(quán)利要求1所述的方法,其中使用數(shù)字掃描儀掃描所述件硬拷貝媒體的前側(cè) 與背側(cè)兩者以提供前側(cè)數(shù)字圖像及背側(cè)數(shù)字圖像,且其中分析所述前側(cè)數(shù)字圖像與所述背 側(cè)數(shù)字圖像兩者以確定所述分類。15. 根據(jù)權(quán)利要求1所述的方法,其中所述文檔分類包含文本文檔、藝術(shù)線條文檔或圖 形文檔。16. 根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包含:將所述經(jīng)掃描的數(shù)字圖像存儲(chǔ)到數(shù)字 文件中,且其中將所述所確定的分類存儲(chǔ)為與所述數(shù)字文件相關(guān)聯(lián)的元數(shù)據(jù)。17. -種系統(tǒng),其包括: 數(shù)字圖像捕獲裝置; 數(shù)據(jù)處理系統(tǒng); 數(shù)據(jù)庫存儲(chǔ)器,其存儲(chǔ)指定照片的常見物理尺寸的常見的照片尺寸數(shù)據(jù)庫及指定文檔 的常見物理尺寸的常見的文檔尺寸數(shù)據(jù)庫;以及 存儲(chǔ)器系統(tǒng),其通信地連接到所述數(shù)據(jù)處理系統(tǒng)且存儲(chǔ)經(jīng)配置以致使所述數(shù)據(jù)處理系 統(tǒng)實(shí)施一種用于自動(dòng)將經(jīng)掃描的硬拷貝媒體分類的方法的指令,其中所述方法包含: 使用所述數(shù)字圖像捕獲裝置掃描一件硬拷貝媒體以提供具有多個(gè)圖像像素的經(jīng)掃描 的數(shù)字圖像,所述多個(gè)圖像像素具有像素值; 確定所述件硬拷貝媒體的物理尺寸; 如果所述所確定的物理尺寸在預(yù)先確定的容差內(nèi)匹配照片的所述常見的物理尺寸中 的一者,就將所述件經(jīng)掃描的硬拷貝媒體分類為照片; 如果所述所確定的物理尺寸在預(yù)先確定的容差內(nèi)匹配文檔的所述常見的物理尺寸中 的一者,就將所述件經(jīng)掃描的硬拷貝媒體分類為文檔;以及 將所述所確定的分類的指示存儲(chǔ)到處理器可存取的存儲(chǔ)器中。
【專利摘要】一種基于經(jīng)掃描的硬拷貝媒體的物理尺寸自動(dòng)地將其分類的方法。如果所確定的物理尺寸在預(yù)先確定的容差內(nèi)匹配(225:Y)照片的常見物理尺寸中的一者,就將所述硬拷貝媒體分類(235)為照片,且如果所述所確定的物理尺寸在預(yù)先確定的容差內(nèi)匹配(240:Y)文檔的常見物理尺寸中的一者,就將所述硬拷貝媒體分類(250)為文檔。否則(225:N及240:N),就使用上下文處理(255)確定媒體分類。
【IPC分類】H04N1/00, H04N1/40, G06K9/00
【公開號(hào)】CN105379242
【申請(qǐng)?zhí)枴緾N201480036092
【發(fā)明人】路易斯·詹姆斯·貝亞托
【申請(qǐng)人】柯達(dá)阿拉里斯股份有限公司
【公開日】2016年3月2日
【申請(qǐng)日】2014年6月2日
【公告號(hào)】EP3005676A1, US9307107, US20140355073, WO2014197358A1
當(dāng)前第4頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
鸡东县| 柘城县| 石楼县| 页游| 吉木萨尔县| 浙江省| 甘洛县| 全椒县| 师宗县| 宾川县| 万载县| 云梦县| 濮阳县| 来宾市| 维西| 龙山县| 仙桃市| 南宫市| 芦溪县| 南木林县| 湾仔区| 永靖县| 富民县| 阿勒泰市| 双辽市| 玉龙| 松江区| 怀仁县| 兴和县| 科技| 和平县| 西昌市| 日照市| 巩留县| 龙南县| 阿克陶县| 秦皇岛市| 沈阳市| 屯留县| 白银市| 丹巴县|