用。更詳細(xì)而言,也可以云服務(wù)器90基于來(lái)自MFP10的委托執(zhí)行針對(duì)該掃描圖像的OCR處理,將該OCR處理的處理結(jié)果發(fā)送至MFP10。而且,也可以MFP10基于該OCR處理的處理結(jié)果和在MFP10內(nèi)決定的排列方向字符尺寸(例如,“字符寬度”等)將OCR處理結(jié)果的字符串配置在電子文檔內(nèi),生成電子文檔。
[0245]或者,在圖20所示的系統(tǒng)構(gòu)成等中,生成了掃描圖像的MFP10自身作為執(zhí)行與上述各實(shí)施方式中的外部終端50(電子文檔生成應(yīng)用程序110)相同的動(dòng)作的電子文檔生成裝置發(fā)揮作用,并且,這次外部終端50也可以作為執(zhí)行與上述的云服務(wù)器90相同的OCR處理(通用OCR應(yīng)用程序120)的OCR處理裝置發(fā)揮作用。更詳細(xì)而言,也可以外部終端50基于來(lái)自MFP10的委托執(zhí)行針對(duì)該掃描圖像的OCR處理,將該OCR處理的處理結(jié)果發(fā)送至MFP10。而且,也可以MFP10基于該OCR處理的處理結(jié)果和在MFP10內(nèi)決定的排列方向字符尺寸(例如,“字符寬度”等),將各OCR處理結(jié)果的字符串配置在電子文檔內(nèi),生成電子文檔。
[0246]另外,在上述各實(shí)施方式等中,帶透明文本TOF(與原始的字符圖像重疊,OCR結(jié)果的字符串以非顯示狀態(tài)嵌入的PDF形式的文件)(可檢索的PDF等)作為電子文檔500而被生成,但本發(fā)明并不局限于此,也可以生成如下的電子文檔500。
[0247]具體而言,在最終的電子文檔500中,也可以刪除原始的字符圖像(字符區(qū)域210的圖像),并且,OCR結(jié)果的文本數(shù)據(jù)以可視化的狀態(tài)代替該原始的字符圖像顯示。
[0248]更詳細(xì)而言,也可以刪除掃描圖像200中的字符區(qū)域210的各部分區(qū)域230的圖像,代替該各部分區(qū)域230的圖像,對(duì)于各部分區(qū)域230的處理結(jié)果的字符串以“顯示狀態(tài)”嵌入(配置)于該各部分區(qū)域230的各個(gè)的檢測(cè)位置,從而生成電子文檔500。S卩,也可以生成不具有字符圖像而具有文本字符串的電子文檔500。
[0249]另外,在上述各實(shí)施方式等中,例示了 PDF形式的電子文檔,但本發(fā)明并不局限于此,也可以生成其他的各種形式(XPS形式等)的電子文檔。
[0250]符號(hào)說(shuō)明
[0251]1...圖像形成系統(tǒng)(電子文檔生成系統(tǒng));10...MFP(圖像形成裝置);25...觸摸面板;50...外部終端;90...云服務(wù)器;110...電子文檔生成應(yīng)用程序;120...通用OCR應(yīng)用程序;200...掃描圖像;210...字符區(qū)域;220...非字符區(qū)域;230...部分區(qū)域(處理對(duì)象區(qū)域);231?233...行區(qū)域;250...文本數(shù)據(jù);300...屬性指定數(shù)據(jù);500...電子文檔。
【主權(quán)項(xiàng)】
1.一種電子文檔生成系統(tǒng),該電子文檔生成系統(tǒng)的特征在于,具備: 第一裝置,其根據(jù)原稿的掃描圖像生成電子文檔;以及 第二裝置,其基于來(lái)自所述第一裝置的委托執(zhí)行針對(duì)所述掃描圖像的光學(xué)字符識(shí)別處理,并將該光學(xué)字符識(shí)別處理的處理結(jié)果送出到所述第一裝置, 所述第一裝置具有: 提取單元,其從所述掃描圖像提取包括行區(qū)域的處理對(duì)象區(qū)域,其中,所述行區(qū)域是在所述掃描圖像內(nèi)沿某方向排列的1行字符串的全部或者一部分范圍的區(qū)域; 檢測(cè)單元,其檢測(cè)所述行區(qū)域的大小; 決定單元,其基于所述行區(qū)域的大小,決定排列方向字符尺寸,其中,所述排列方向字符尺寸是所述處理對(duì)象區(qū)域內(nèi)的字符的字符尺寸,且是所述1行字符串的排列方向上的字符尺寸; 指示送出單元,其將應(yīng)該對(duì)于所述處理對(duì)象區(qū)域進(jìn)行所述光學(xué)字符識(shí)別處理的主旨的指示和所述處理對(duì)象區(qū)域的圖像數(shù)據(jù)向所述第二裝置送出; 接受單元,其從所述第二裝置接受關(guān)于所述處理對(duì)象區(qū)域的所述光學(xué)字符識(shí)別處理的處理結(jié)果;以及 生成單元,其基于由所述決定單元決定的所述排列方向字符尺寸,將所述處理結(jié)果涉及的字符串配置在所述電子文檔內(nèi),生成所述電子文檔。2.根據(jù)權(quán)利要求1所述的電子文檔生成系統(tǒng),其特征在于, 所述決定單元基于用所述行區(qū)域的所述排列方向上的長(zhǎng)度除以所述行區(qū)域內(nèi)的字符數(shù)得到的值,決定所述排列方向字符尺寸。3.根據(jù)權(quán)利要求2所述的電子文檔生成系統(tǒng),其特征在于, 所述提取單元提取包括多行的字符串的區(qū)域作為所述處理對(duì)象區(qū)域, 所述決定單元基于用是與所述多行的字符串中的任意1行的字符串相關(guān)的區(qū)域的所述行區(qū)域的所述排列方向上的長(zhǎng)度除以所述行區(qū)域內(nèi)的字符數(shù)得到的值,決定所述排列方向字符尺寸。4.根據(jù)權(quán)利要求2所述的電子文檔生成系統(tǒng),其特征在于, 所述提取單元提取單一行的字符串涉及的區(qū)域作為所述處理對(duì)象區(qū)域, 所述決定單元基于用是與所述單一行的字符串相關(guān)的區(qū)域的所述行區(qū)域的所述排列方向上的長(zhǎng)度除以所述行區(qū)域內(nèi)的字符數(shù)得到的值,決定所述排列方向字符尺寸。5.根據(jù)權(quán)利要求2所述的電子文檔生成系統(tǒng),其特征在于, 所述提取單元提取所述1行字符串的所述排列方向上的全部范圍中的一部分范圍的區(qū)域作為所述處理對(duì)象區(qū)域, 所述決定單元基于用所述一部分范圍的區(qū)域的所述排列方向上的長(zhǎng)度除以所述一部分范圍的區(qū)域內(nèi)的字符數(shù)得到的值,決定所述排列方向字符尺寸。6.根據(jù)權(quán)利要求1所述的電子文檔生成系統(tǒng),其特征在于, 所述決定單元基于所述行區(qū)域的正交方向上的長(zhǎng)度決定正交方向字符尺寸,并且基于所述正交方向字符尺寸決定所述排列方向字符尺寸,其中,所述正交方向是與所述1行字符串的排列方向正交的方向,所述正交方向字符尺寸是所述處理對(duì)象區(qū)域內(nèi)的字符的字符尺寸,且是所述正交方向的字符尺寸。7.根據(jù)權(quán)利要求6所述的電子文檔生成系統(tǒng),其特征在于, 所述提取單元提取包括多行字符串的區(qū)域作為所述處理對(duì)象區(qū)域, 所述決定單元基于所述處理對(duì)象區(qū)域的所述正交方向上的長(zhǎng)度和所述處理對(duì)象區(qū)域所包含的字符串的行數(shù)來(lái)檢測(cè)所述行區(qū)域的所述正交方向上的長(zhǎng)度,基于所述行區(qū)域的所述正交方向上的該長(zhǎng)度決定所述正交方向字符尺寸,并且,基于該正交方向字符尺寸決定所述排列方向字符尺寸。8.根據(jù)權(quán)利要求6所述的電子文檔生成系統(tǒng),其特征在于, 所述提取單元提取單一行的字符串涉及的區(qū)域作為所述處理對(duì)象區(qū)域, 所述決定單元基于所述單一行的字符串涉及的區(qū)域的所述正交方向上的長(zhǎng)度計(jì)算所述正交方向字符尺寸,并且,基于該正交方向字符尺寸決定所述排列方向字符尺寸。9.根據(jù)權(quán)利要求6所述的電子文檔生成系統(tǒng),其特征在于, 所述提取單元提取所述1行字符串的所述排列方向上的全部范圍中的一部分范圍的區(qū)域作為所述處理對(duì)象區(qū)域, 所述決定單元基于所述一部分范圍的區(qū)域的所述正交方向上的長(zhǎng)度計(jì)算所述正交方向字符尺寸,并且,基于該正交方向字符尺寸決定所述排列方向字符尺寸。10.根據(jù)權(quán)利要求1所述的電子文檔生成系統(tǒng),其特征在于, 所述決定單元基于用所述行區(qū)域的所述排列方向上的長(zhǎng)度除以所述行區(qū)域內(nèi)的字符數(shù)得到的值,決定關(guān)于所述處理對(duì)象區(qū)域的所述排列方向字符尺寸,并且, 基于所述行區(qū)域的正交方向上的長(zhǎng)度決定正交方向字符尺寸,其中,所述正交方向是與所述1行字符串的排列方向正交的方向,所述正交方向字符尺寸是所述處理對(duì)象區(qū)域內(nèi)的字符的字符尺寸,且是所述正交方向的字符尺寸, 所述生成單元基于由所述決定單元決定的所述排列方向字符尺寸和所述正交方向字符尺寸,將所述處理結(jié)果涉及的字符串配置在所述電子文檔內(nèi),來(lái)生成所述電子文檔。11.根據(jù)權(quán)利要求1?10中任一項(xiàng)所述的電子文檔生成系統(tǒng),其特征在于, 所述檢測(cè)單元也檢測(cè)所述掃描圖像內(nèi)的所述處理對(duì)象區(qū)域的位置, 所述生成單元也基于所述處理對(duì)象區(qū)域的所述位置,將所述處理結(jié)果涉及的字符串配置在所述電子文檔內(nèi)。12.根據(jù)權(quán)利要求1?11中任一項(xiàng)所述的電子文檔生成系統(tǒng),其特征在于, 所述第一裝置是圖像形成裝置, 所述第二裝置是云服務(wù)器。13.根據(jù)權(quán)利要求1?11中任一項(xiàng)所述的電子文檔生成系統(tǒng),其特征在于, 所述第一裝置是圖像形成裝置, 所述第二裝置是通信終端。14.根據(jù)權(quán)利要求1?11中任一項(xiàng)所述的電子文檔生成系統(tǒng),其特征在于, 所述第一裝置是通信終端, 所述第二裝置是云服務(wù)器。15.一種電子文檔生成裝置,是根據(jù)原稿的掃描圖像生成電子文檔的電子文檔生成裝置,其特征在于,具備: 提取單元,其從所述掃描圖像提取包括行區(qū)域的處理對(duì)象區(qū)域,其中,所述行區(qū)域是在所述掃描圖像內(nèi)沿某方向排列的1行字符串的全部或者一部分范圍的區(qū)域, 檢測(cè)單元,其檢測(cè)所述行區(qū)域的大小; 決定單元,其基于所述行區(qū)域的大小,決定排列方向字符尺寸,其中,所述排列方向字符尺寸是所述處理對(duì)象區(qū)域內(nèi)的字符的字符尺寸,且是所述1行字符串的排列方向上的字符尺寸; 指示送出單元,其將應(yīng)該對(duì)于所述處理對(duì)象區(qū)域進(jìn)行光學(xué)字符識(shí)別處理的主旨的指示和所述處理對(duì)象區(qū)域的圖像數(shù)據(jù)向外部裝置送出; 接受單元,其從所述外部裝置接受對(duì)于所述處理對(duì)象區(qū)域由所述外部裝置執(zhí)行的所述光學(xué)字符識(shí)別處理的處理結(jié)果;以及 生成單元,其基于由所述決定單元決定的所述排列方向字符尺寸,將所述處理結(jié)果涉及的字符串配置在所述電子文檔內(nèi),生成所述電子文檔。16.根據(jù)權(quán)利要求15所述的電子文檔生成裝置,其特征在于, 所述決定單元基于用所述行區(qū)域的所述排列方向上的長(zhǎng)度除以所述行區(qū)域內(nèi)的字符數(shù)得到的值,決定所述排列方向字符尺寸。17.根據(jù)權(quán)利要求16所述的電子文檔生成裝置,其特征在于, 所述提取單元提取包括多行字符串的區(qū)域作為所述處理對(duì)象區(qū)域, 所述決定單元基于用是與所述多行字符串中的任意1行的字符串相關(guān)的區(qū)域的所述行區(qū)域的所述排列方向上的長(zhǎng)度除以所述行區(qū)域內(nèi)的字符數(shù)得到的值,決定所述排列方向字符尺寸。18.根據(jù)權(quán)利要求16所述的電子文檔生成裝置,其特征在于, 所述提取單元提取單一行的字符串涉及的區(qū)域作為所述處理對(duì)象區(qū)域, 所述決定單元基于用是與所述單一行的字符串相關(guān)的區(qū)域的所述行區(qū)域的所述排列方向上的長(zhǎng)度除以所述行區(qū)域內(nèi)的字符數(shù)得到的值,決定所述排列方向字符尺寸。19.根據(jù)權(quán)利要求16所述的電子文檔生成裝置,其特征在于, 所述提取單元提取所述1行字符串的所述排列方向上的全部范圍中的一部分范圍的區(qū)域作為所述處理對(duì)象區(qū)域, 所述決定單元基于用所述一部分范圍的區(qū)域的所述排列方向上的長(zhǎng)度除以所述一部分范圍的區(qū)域內(nèi)的字符數(shù)得到的值,決定所述排列方向字符尺寸。20.根據(jù)權(quán)利要求15所述的電子文檔生成裝置,其特征在于, 所述決定單元基于所述行區(qū)域的正交方向上的長(zhǎng)度決定正交方向字符尺寸,并且基于所述正交方向字符尺寸決定所述排列方向字符尺寸,其中,所述正交方向是與所述1行字符串的排列方向正交的方向,所述正交方向字符尺寸是所述處理對(duì)象區(qū)域內(nèi)的字符的字符尺寸,且是所述正交方向的字符尺寸。21.根據(jù)權(quán)利要求20所述的電子文檔生成裝置,其特征在于, 所述提取單元提取包括多行字符串的區(qū)域作為所述處理對(duì)象區(qū)域, 所述決定單元基于所述處理對(duì)象區(qū)域的所述正交方向上的長(zhǎng)度和所述處理對(duì)象區(qū)域所包含的字符串的行數(shù)來(lái)計(jì)算所述行區(qū)域的所述正交方向上的長(zhǎng)度,基于所述行區(qū)域的所述正交方向上的該長(zhǎng)度決定所述正交方向字符尺寸,并且,基于該正交方向字符尺寸決定所述排列方向字符尺寸。22.根據(jù)權(quán)利要求20所述的電子文檔生成裝置,其特征在于, 所述提取單元提取單一行的字符串涉及的區(qū)域作為所述處理對(duì)象區(qū)域, 所述決定單元基于所述單一行的字符串涉及的區(qū)域的所述正交方向上的長(zhǎng)度計(jì)算所述正交方向字符尺寸,并且,基于該正交方向字符尺寸決定所述排列方向字符尺寸。23.根據(jù)權(quán)利要求20所述的電子文檔生成裝置,其特征在于, 所述提取單元提取所述1行字符串的所述排列方向上的全部范圍中的一部分范圍的區(qū)域作為所述處理對(duì)象區(qū)域, 所述決定單元基于所述一部分范圍的區(qū)域的所述正交方向上的長(zhǎng)度計(jì)算所述正交方向字符尺寸,并且,基于該正交方向字符尺寸決定所述排列方向字符尺寸。24.根據(jù)權(quán)利要求15所述的電子文檔生成裝置,其特征在于, 所述決定單元基于用所述行區(qū)域的所述排列方向上的長(zhǎng)度除以所述行區(qū)域內(nèi)的字符數(shù)得到的值,決定關(guān)于所述處理對(duì)象區(qū)域的所述排列方向字符尺寸,并且, 基于所述行區(qū)域的正交方向上的長(zhǎng)度決定正交方向字符尺寸,其中,所述正交方向是與所述1行字符串的排列方向正交的方向,所述正交方向字符尺寸是所述處理對(duì)象區(qū)域內(nèi)的字符的字符尺寸,且是所述正交方向的字符尺寸, 所述生成單元基于由所述決定單元決定的所述排列方向字符尺寸和所述正交方向字符尺寸,將所述處理結(jié)果涉及的字符串配置在所述電子文檔內(nèi),來(lái)生成所述電子文檔。25.根據(jù)權(quán)利要求15?24中任一項(xiàng)所述的電子文檔生成裝置,其特征在于, 所述檢測(cè)單元也檢測(cè)所述掃描圖像內(nèi)的所述處理對(duì)象區(qū)域的位置, 所述生成單元也基于所述處理對(duì)象區(qū)域的所述位置,將所述處理結(jié)果涉及的字符串配置在所述電子文檔內(nèi),生成所述電子文檔。26.根據(jù)權(quán)利要求15?25中任一項(xiàng)所述的電子文檔生成裝置,其特征在于, 所述電子文檔生成裝置是圖像形成裝置。27.根據(jù)權(quán)利要求15?25中任一項(xiàng)所述的電子文檔生成裝置,其特征在于, 所述電子文檔生成裝置是與生成所述掃描圖像的圖像形成裝置不同的通信裝置且是與所述外部裝置也不同的通信裝置。28.一種電子文檔生成裝置,是根據(jù)原稿的掃描圖像生成電子文檔的電子文檔生成裝置,其特征在于,具備: 提取單元,其從所述掃描圖像提取包括多行字符串的處理對(duì)象區(qū)域; 檢測(cè)單元,其檢測(cè)所述處理對(duì)象區(qū)域的大小; 決定單元,其基于所述處理對(duì)象區(qū)域的大小,決定排列方向字符尺寸,其中,所述排列方向字符尺寸是所述處理對(duì)象區(qū)域內(nèi)的字符的字符尺寸,且是所述處理對(duì)象區(qū)域內(nèi)的字符串的排列方向上的字符尺寸; 指示送出單元,其將應(yīng)該對(duì)于所述處理對(duì)象區(qū)域進(jìn)行光學(xué)字符識(shí)別處理的主旨的指示和所述處理對(duì)象區(qū)域的圖像數(shù)據(jù)向外部裝置送出, 接受單元,其從所述外部裝置接受對(duì)于所述處理對(duì)象區(qū)域由所述外部裝置執(zhí)行的所述光學(xué)字符識(shí)別處理的處理結(jié)果;以及 生成單元,其基于由所述決定單元決定的所述排列方向字符尺寸,將所述處理結(jié)果涉及的字符串配置在所述電子文檔內(nèi),生成所述電子文檔, 所述決定單元基于所述處理對(duì)象區(qū)域的正交方向上的長(zhǎng)度和所述處理對(duì)象區(qū)域所包含的字符串的行數(shù)來(lái)決定正交方向字符尺寸,并且,基于所述正交方向字符尺寸決定所述排列方向字符尺寸,其中,所述正交方向是與所述排列方向正交的方向,所述正交方向字符尺寸是所述處理對(duì)象區(qū)域內(nèi)的字符的字符尺寸,且是所述正交方向的字符尺寸。
【專利摘要】本發(fā)明涉及電子文檔生成系統(tǒng)以及電子文檔生成裝置,提供在從某裝置對(duì)于其它的裝置(云服務(wù)器等)委托OCR處理,使用其處理結(jié)果來(lái)生成電子文檔的技術(shù)中,能夠?qū)CR處理結(jié)果涉及的字符串配置在其排列方向上比較正確的位置的技術(shù)。外部終端(通信裝置)從該掃描圖像提取包括行區(qū)域(掃描圖像內(nèi)的1行的字符串的全部或者一部分的范圍的區(qū)域)的處理對(duì)象區(qū)域(步驟S12)。處理對(duì)象區(qū)域的圖像數(shù)據(jù)與OCR處理指示一起被發(fā)送至云服務(wù)器,OCR處理結(jié)果被回信(步驟S14、S15)。另外,外部終端基于行區(qū)域的大小決定處理對(duì)象區(qū)域內(nèi)的字符的字符寬度(排列方向字符尺寸)(步驟S16)。外部終端基于排列方向字符尺寸將從云服務(wù)器接受到的OCR處理結(jié)果的字符串配置在電子文檔內(nèi)(步驟S17)。
【IPC分類】G06K9/00
【公開(kāi)號(hào)】CN105320933
【申請(qǐng)?zhí)枴緾N201510404336
【發(fā)明人】坂匡晃
【申請(qǐng)人】柯尼卡美能達(dá)株式會(huì)社
【公開(kāi)日】2016年2月10日
【申請(qǐng)日】2015年7月10日
【公告號(hào)】US9398191, US20160014299