欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

雙層電子文件文本選擇區(qū)域偏差的檢測(cè)方法和系統(tǒng)的制作方法

文檔序號(hào):6335170閱讀:263來(lái)源:國(guó)知局

專利名稱::雙層電子文件文本選擇區(qū)域偏差的檢測(cè)方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域
:本發(fā)明涉及一種雙層電子文件文本選擇區(qū)域偏差的檢測(cè)方法和系統(tǒng)。
背景技術(shù)
:可移植文檔格式(PortableDocumentFormat,PDF)的雙層電子文件例如書籍、文件,是有圖像層與文字層的PDF文件,圖像層在上顯示原書例如紙書的版面,上面每一個(gè)字實(shí)際上是一個(gè)字形圖像;文字層在圖像層下面,并不顯示出來(lái),文字層中包含文件的電子版文本,通常是使用光學(xué)字符識(shí)別(OpticalCharacterRecognition,OCR)的方式獲得。文字層的文本與圖像層的字形圖像按字對(duì)位,圖像層的每個(gè)字的下方就是該字在文字層中的文本。用戶在使用雙層電子文件的閱讀軟件的選擇工具時(shí),因?yàn)樯鲜龅膶?duì)位的關(guān)系,所以根據(jù)圖像層的顯示就能夠選擇到文字層的用戶需要的文本。圖1是根據(jù)現(xiàn)有技術(shù)中使雙層電子文件的閱讀軟件進(jìn)行文本選擇的示意圖。如圖1所示,在方框10中的文本塊內(nèi),雙層電子文件的閱讀軟件使用戶選擇時(shí)被選的區(qū)域變?yōu)楹谏?,但黑色區(qū)域與顯示的文本的區(qū)域重合度較低,例如方框11和方框12中的黑色區(qū)域沒有完全覆蓋被選字符,這樣視覺效果較差,特別是在行間距較小的情況下,更影響了用戶的使用體驗(yàn)?,F(xiàn)有的雙層電子文件的文本選擇區(qū)域的視覺效果不佳,對(duì)于該問題,目前尚未提出有效解決方案。
發(fā)明內(nèi)容本發(fā)明的主要目的是提供一種雙層電子文件文本選擇區(qū)域偏差的檢測(cè)方法和系統(tǒng),用以解決現(xiàn)有技術(shù)中雙層電子文件的文本選擇區(qū)域的視覺效果不佳的問題。為解決上述問題,根據(jù)本發(fā)明的一個(gè)方面,提供了一種雙層電子文件文本選擇區(qū)域偏差的檢測(cè)方法。本發(fā)明的雙層電子文件文本選擇區(qū)域偏差的檢測(cè)方法包括獲取雙層電子文件文字層的單個(gè)字符的字塊范圍,并且獲取所述雙層電子文件圖像層的單個(gè)字形圖像的外接矩形范圍;計(jì)算對(duì)應(yīng)于同一字符的所述字塊范圍和所述外接矩形范圍在高度方向和寬度方向的差異,在其中至少一項(xiàng)差異大于預(yù)設(shè)值的情況下生成提示信息。進(jìn)一步地,獲取雙層電子文件文字層的單個(gè)字符的字塊范圍包括獲取雙層電子文件文字層的單個(gè)字符在文字層的坐標(biāo);將所述單個(gè)字符在文字層的坐標(biāo)轉(zhuǎn)換為在所述雙層電子文件的圖像層的坐標(biāo);根據(jù)轉(zhuǎn)化后的單個(gè)字符在所述圖像層的坐標(biāo)確定所述單個(gè)字符的字塊范圍。進(jìn)一步地,獲取所述雙層電子文件圖像層的單個(gè)字形圖像的外接矩形范圍包括搜索所述單個(gè)字形圖像的邊界;根據(jù)所述邊界確定所述雙層電子文件圖像層的單個(gè)字形圖像的外接矩形范圍。進(jìn)一步地,生成提示信息包括在所述圖像層的字圖像上添加矩形框,該矩形框的大小與所述文字層中對(duì)位于該字形圖像的字符的字塊范圍相同。進(jìn)一步地,所述雙層電子文件為可移植文檔格式(PortableDocumentFormat)的文件。為解決上述問題,根據(jù)本發(fā)明的另一方面,提供了一種雙層電子文件文本選擇區(qū)域偏差的檢測(cè)系統(tǒng)。本發(fā)明的雙層電子文件文本選擇區(qū)域偏差的檢測(cè)系統(tǒng)包括第一獲取模塊,用于獲取雙層電子文件文字層的單個(gè)字符的字塊范圍;第二獲取模塊,用于獲取所述雙層電子文件圖像層的單個(gè)字形圖像的外接矩形范圍;計(jì)算模塊,用于計(jì)算對(duì)應(yīng)于同一字符的所述字塊范圍和所述外接矩形范圍在高度方向和寬度方向的差異;輸出模塊,用于在所述計(jì)算模塊得出的兩項(xiàng)差異中至少一項(xiàng)差異大于預(yù)設(shè)值的情況下生成提示信息。進(jìn)一步地,所述第一獲取模塊還用于獲取雙層電子文件文字層的單個(gè)字符在文字層的坐標(biāo);將所述單個(gè)字符在文字層的坐標(biāo)轉(zhuǎn)換為在所述雙層電子文件的圖像層的坐標(biāo);根據(jù)轉(zhuǎn)化后的單個(gè)字符在所述圖像層的坐標(biāo)確定所述單個(gè)字符的字塊范圍。進(jìn)一步地,所述第二獲取模塊還用于搜索所述單個(gè)字形圖像的邊界;根據(jù)所述邊界確定所述雙層電子文件圖像層的單個(gè)字形圖像的外接矩形范圍。進(jìn)一步地,所述輸出模塊還用于在所述圖像層的字形圖像上添加矩形框,該矩形框的大小與所述文字層中對(duì)位于該字形圖像的字符的字塊范圍相同。根據(jù)本發(fā)明的技術(shù)方案,根據(jù)雙層電子文件文字層的單個(gè)字符的字塊范圍和圖像層的單個(gè)字形圖像的外接矩形范圍,確定對(duì)應(yīng)于同一字符的所述字塊范圍和所述外接矩形范圍在高度方向和寬度方向的差異,這樣就可以根據(jù)該差異提示用戶,供其參考以及對(duì)字體的尺寸進(jìn)行調(diào)整,使在雙層電子文件中作出的文本選擇區(qū)域與字體區(qū)域?qū)ξ粶?zhǔn)確,提高用戶的體驗(yàn)。此處所說(shuō)明的附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本發(fā)明的示意性實(shí)施例及其說(shuō)明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中圖1是根據(jù)現(xiàn)有技術(shù)中使雙層電子文件的閱讀軟件進(jìn)行文本選擇的示意圖;圖2是根據(jù)本發(fā)明實(shí)施例的雙層電子文件文本選擇區(qū)域偏差的檢測(cè)方法的主要步驟的示意圖;圖3是根據(jù)本發(fā)明實(shí)施例的輸出文本選擇區(qū)域偏差提示信息的示意圖;以及圖4是根據(jù)本發(fā)明實(shí)施例的雙層電子文件文本選擇區(qū)域偏差的檢測(cè)系統(tǒng)的主要模塊的示意圖。具體實(shí)施例方式下面將參考附圖并結(jié)合實(shí)施例,來(lái)詳細(xì)說(shuō)明本發(fā)明。圖2是根據(jù)本發(fā)明實(shí)施例的雙層電子文件文本選擇區(qū)域偏差的檢測(cè)方法的主要步驟的示意圖。如圖2所示,該方法包括如下的步驟S21至步驟S24。步驟S21獲取雙層電子文件文字層的單個(gè)字符的字塊范圍,并且獲取雙層電子文件圖像層的單個(gè)字形圖像的外接矩形范圍。在本步驟中,獲取雙層電子文件文字層的單個(gè)字符的字塊范圍具體可以采用如下步驟獲取雙層電子文件文字層的單個(gè)字符在文字層的坐標(biāo);將所述單個(gè)字符在文字層的坐標(biāo)轉(zhuǎn)換為在所述雙層電子文件的圖像層的坐標(biāo);根據(jù)轉(zhuǎn)化后的單個(gè)字符在圖像層的坐標(biāo)確定所述單個(gè)字符的字塊范圍。在本步驟中,獲取雙層電子文件圖像層的單個(gè)字形圖像的外接矩形范圍具體可以采用如下步驟搜索單個(gè)字形圖像的邊界;根據(jù)所述邊界確定所述雙層電子文件圖像層的單個(gè)字形圖像的外接矩形范圍。步驟S22計(jì)算對(duì)應(yīng)于同一字符的所述字塊范圍和所述外接矩形范圍在高度方向和寬度方向的差異。因?yàn)閳D像層的每個(gè)字塊下方對(duì)應(yīng)于該字在文字層中的文本,因此可以確定對(duì)應(yīng)于同一字符的所述字塊范圍和所述外接矩形范圍。步驟S23判斷步驟S22中得出的兩項(xiàng)差異是否大于預(yù)設(shè)值,若其中至少一項(xiàng)差異大于預(yù)設(shè)值,則進(jìn)入步驟S24;否則返回步驟S21,不重復(fù)地獲取下一個(gè)字符的字塊范圍。這里的預(yù)設(shè)值可以是兩個(gè)值,分別于用于與兩項(xiàng)差異比較,也可以是一個(gè)值。預(yù)設(shè)值可以根據(jù)顯示時(shí)的字符大小和用戶觀察的敏銳程度來(lái)設(shè)定,例如設(shè)定為1.5mm或2mm,此時(shí)用戶能夠明顯看到選擇區(qū)域與字體區(qū)域存在偏差。步驟S24生成提示信息。生成提示信息可以是在圖像層的字形圖像上添加矩形框,該矩形框的大小與文字層中對(duì)位于該字形圖像的字符的字塊范圍相同。在生成提示信息之后,可以根據(jù)用戶的指令輸出該提示信息。以上述的添加矩形框的方式為例,提示信息的輸出如圖3所示,圖3是根據(jù)本發(fā)明實(shí)施例的輸出文本選擇區(qū)域偏差提示信息的示意圖。在圖3中,方框30中的文本塊經(jīng)過(guò)檢測(cè),確認(rèn)其中有若干文本的選擇區(qū)域存在偏差,具體例如方框31、方框32、方框33、方框34、方框35所示。方框30中是圖像層的狀態(tài),方框31至方框35則框出了文本層文字的范圍。從圖3中可以清晰地看到有哪些文本在選擇之后存在選擇區(qū)域偏差,這樣用戶可以參考類似于圖3中的提示將這些文本的尺寸在文字層中進(jìn)行調(diào)整。圖4是根據(jù)本發(fā)明實(shí)施例的雙層電子文件文本選擇區(qū)域偏差的檢測(cè)系統(tǒng)的主要模塊的示意圖。如圖4所示,雙層電子文件文本選擇區(qū)域偏差的檢測(cè)系統(tǒng)40主要包括第一獲取模塊、第二獲取模塊、計(jì)算模塊、輸出模塊。第一獲取模塊,用于獲取雙層電子文件文字層的單個(gè)字符的字塊范圍;第二獲取模塊,用于獲取所述雙層電子文件圖像層的單個(gè)字形圖像的外接矩形范圍;計(jì)算模塊,用于計(jì)算對(duì)應(yīng)于同一字符的所述字塊范圍和所述外接矩形范圍在高度方向和寬度方向的差異;輸出模塊,用于在所述計(jì)算模塊得出的兩項(xiàng)差異中至少一項(xiàng)差異大于預(yù)設(shè)值的情況下生成提示信息。另外,第一獲取模塊還可以用于獲取雙層電子文件文字層的單個(gè)字符在文字層的坐標(biāo);將所述單個(gè)字符在文字層的坐標(biāo)轉(zhuǎn)換為在所述雙層電子文件的圖像層的坐標(biāo);根據(jù)轉(zhuǎn)化后的單個(gè)字符在所述圖像層的坐標(biāo)確定所述單個(gè)字符的字塊范圍。第二獲取模塊還可以用于搜索所述單個(gè)字形圖像的邊界;根據(jù)所述邊界確定雙層電子文件圖像層的單個(gè)字形圖像的外接矩形范圍。輸出模塊還可以用于在所述圖像層的字形圖像上添加矩形框,該矩形框的大小與文字層中對(duì)位于該字形圖像的字符的字塊范圍相同。根據(jù)本發(fā)明實(shí)施例的技術(shù)方案,根據(jù)雙層電子文件文字層的單個(gè)字符的字塊范圍和圖像層的單個(gè)字形圖像的外接矩形范圍,確定對(duì)應(yīng)于同一字符的所述字塊范圍和所述外接矩形范圍在高度方向和寬度方向的差異,這樣就可以根據(jù)該差異提示用戶,供其參考以及對(duì)字體的尺寸進(jìn)行調(diào)整,使雙層電子文件的閱讀軟件的文本選擇工具作出的文本選擇區(qū)域與字體區(qū)域?qū)ξ粶?zhǔn)確,提高用戶的體驗(yàn)。顯然,本領(lǐng)域的技術(shù)人員應(yīng)該明白,上述的本發(fā)明的各模塊或各步驟可以用通用的計(jì)算裝置來(lái)實(shí)現(xiàn),它們可以集中在單個(gè)的計(jì)算裝置上,或者分布在多個(gè)計(jì)算裝置所組成的網(wǎng)絡(luò)上,可選地,它們可以用計(jì)算裝置可執(zhí)行的程序代碼來(lái)實(shí)現(xiàn),從而,可以將它們存儲(chǔ)在存儲(chǔ)裝置中由計(jì)算裝置來(lái)執(zhí)行,或者將它們分別制作成各個(gè)集成電路模塊,或者將它們中的多個(gè)模塊或步驟制作成單個(gè)集成電路模塊來(lái)實(shí)現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件結(jié)合。以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō),本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。權(quán)利要求一種雙層電子文件文本選擇區(qū)域偏差的檢測(cè)方法,其特征在于,包括獲取雙層電子文件文字層的單個(gè)字符的字塊范圍,并且獲取所述雙層電子文件圖像層的單個(gè)字形圖像的外接矩形范圍;計(jì)算對(duì)應(yīng)于同一字符的所述字塊范圍和所述外接矩形范圍在高度方向和寬度方向的差異,在其中至少一項(xiàng)差異大于預(yù)設(shè)值的情況下生成提示信息。2.根據(jù)權(quán)利要求1所述的檢測(cè)方法,其特征在于,獲取雙層電子文件文字層的單個(gè)字符的字塊范圍包括獲取雙層電子文件文字層的單個(gè)字符在文字層的坐標(biāo);將所述單個(gè)字符在文字層的坐標(biāo)轉(zhuǎn)換為在所述雙層電子文件的圖像層的坐標(biāo);根據(jù)轉(zhuǎn)化后的單個(gè)字符在所述圖像層的坐標(biāo)確定所述單個(gè)字符的字塊范圍。3.根據(jù)權(quán)利要求1所述的檢測(cè)方法,其特征在于,獲取所述雙層電子文件圖像層的單個(gè)字形圖像的外接矩形范圍包括搜索所述單個(gè)字形圖像的邊界;根據(jù)所述邊界確定所述雙層電子文件圖像層的單個(gè)字形圖像的外接矩形范圍。4.根據(jù)權(quán)利要求1所述的檢測(cè)方法,其特征在于,生成提示信息包括在所述圖像層的字形圖像上添加矩形框,該矩形框的大小與所述文字層中對(duì)位于該字形圖像的字符的字塊范圍相同。5.根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的檢測(cè)方法,其特征在于,所述雙層電子文件為可移植文檔格式的文件。6.一種雙層電子文件文本選擇區(qū)域偏差的檢測(cè)系統(tǒng),其特征在于,包括第一獲取模塊,用于獲取雙層電子文件文字層的單個(gè)字符的字塊范圍;第二獲取模塊,用于獲取所述雙層電子文件圖像層的單個(gè)字形圖像的外接矩形范圍;計(jì)算模塊,用于計(jì)算對(duì)應(yīng)于同一字符的所述字塊范圍和所述外接矩形范圍在高度方向和寬度方向的差異;輸出模塊,用于在所述計(jì)算模塊得出的兩項(xiàng)差異中至少一項(xiàng)差異大于預(yù)設(shè)值的情況下生成提示信息。7.根據(jù)權(quán)利要求6所述的檢測(cè)系統(tǒng),其特征在于,所述第一獲取模塊還用于獲取雙層電子文件文字層的單個(gè)字符在文字層的坐標(biāo);將所述單個(gè)字符在文字層的坐標(biāo)轉(zhuǎn)換為在所述雙層電子文件的圖像層的坐標(biāo);根據(jù)轉(zhuǎn)化后的單個(gè)字符在所述圖像層的坐標(biāo)確定所述單個(gè)字符的字塊范圍。8.根據(jù)權(quán)利要求6所述的檢測(cè)系統(tǒng),其特征在于,所述第二獲取模塊還用于搜索所述單個(gè)字形圖像的邊界;根據(jù)所述邊界確定所述雙層電子文件圖像層的單個(gè)字形圖像的外接矩形范圍。9.根據(jù)權(quán)利要求6所述的檢測(cè)系統(tǒng),其特征在于,所述輸出模塊還用于在所述圖像層的字形圖像上添加矩形框,該矩形框的大小與所述文字層中對(duì)位于該字形圖像的字符的字塊范圍相同。全文摘要本發(fā)明公開了一種雙層電子文件文本選擇區(qū)域偏差的檢測(cè)方法和系統(tǒng),以解決現(xiàn)有技術(shù)中雙層電子文件的文本選擇區(qū)域的視覺效果不佳的問題。該方法包括獲取雙層電子文件文字層的單個(gè)字符的字塊范圍,并且獲取所述雙層電子文件圖像層的單個(gè)字形圖像的外接矩形范圍;計(jì)算對(duì)應(yīng)于同一字符的所述字塊范圍和所述外接矩形范圍在高度方向和寬度方向的差異,在其中至少一項(xiàng)差異大于預(yù)設(shè)值的情況下生成提示信息。根據(jù)本發(fā)明的技術(shù)方案,能夠向用戶提示對(duì)文本選擇區(qū)域的偏差狀態(tài),供其參考以及對(duì)字體的尺寸進(jìn)行調(diào)整,使在雙層電子文件中作出的文本選擇區(qū)域與字體區(qū)域?qū)ξ粶?zhǔn)確,提高用戶的體驗(yàn)。文檔編號(hào)G06F3/048GK101980133SQ20101053115公開日2011年2月23日申請(qǐng)日期2010年10月29日優(yōu)先權(quán)日2010年10月29日發(fā)明者蘭榮春,周長(zhǎng)嶺,趙海濤申請(qǐng)人:方正國(guó)際軟件有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
乐业县| 罗江县| 兴安县| 钟祥市| 泊头市| 正镶白旗| 娄烦县| 福海县| 西平县| 桐梓县| 保靖县| 科技| 巴林左旗| 舟曲县| 芦溪县| 乐业县| 文安县| 麦盖提县| 鹤庆县| 湖南省| 绥棱县| 沙雅县| 河间市| 漳浦县| 大理市| 岑巩县| 行唐县| 浦江县| 内黄县| 高青县| 寿宁县| 曲周县| 肇庆市| 满洲里市| 明溪县| 东莞市| 岳阳市| 崇州市| 汉沽区| 寿阳县| 观塘区|