基于圖像中的文本進行圖像顯示的方法和系統(tǒng)的制作方法

文檔序號：6614056閱讀：236來源：國知局

專利名稱：基于圖像中的文本進行圖像顯示的方法和系統(tǒng)的制作方法
技術領域：
本發(fā)明涉及一種基于圖像中的文本進行圖像顯示的方法和系統(tǒng)，更具體地說，涉及一種能夠自動確定按圖像的真實大小來顯示該圖像還是把圖像縮小以適應屏幕的方式來顯示該圖像的基于圖像中的文本進行圖像顯示的方法和系統(tǒng)。
背景技術：
隨著計算機和網(wǎng)絡等信息傳播技術的發(fā)展，圖像作為一種直觀的信息表現(xiàn)方式，在計算機及網(wǎng)絡領域中變得越來越普及。圖像所表現(xiàn)的信息極為豐富，包括人像、風景圖片、示意圖、地圖等等，甚至文字也能夠以圖像的格式來表現(xiàn)，而且，同一圖像中所包含的信息種類也不是單一的，例如，以風光為主的圖像中還包含文字、人像的背景為風景等，典型的情況為地圖，是示意標記和文字的結合。對于各種各樣的圖像，計算機及網(wǎng)絡用戶對其需求的側(cè)重點并不相同，例如，對于人像和風景圖片，用戶一般側(cè)重于首先從整體上把握，而對于以文字為主要信息表現(xiàn)手段的圖像，用戶一般側(cè)重于把握其中的細節(jié)，要達到其中主要文字能夠識別的程度，該圖像才是有意義的。然而，現(xiàn)有的計算機及網(wǎng)絡并沒有針對用戶對于不同類型的圖像的需求而采取有針對性的圖像顯示方式，從而造成圖像的顯示方式并不一定能夠恰好符
合用戶的要求。
在較早期的圖像顯示方式中，圖像以其真實大小顯示，例如ACDSystems 公司的ACDSee (注冊商標)圖像瀏覽管理軟件。在其早期版本例如2.4中，在圖像大于顯示屏幕的情況下，用戶一般先看到圖像的局部，如果用戶需要首先從整體上把握圖像，則還需要把顯示方式切換到以適合屏幕的大小顯示，一方面需要用戶的操作，另一方面增加用戶的等待時間。
目前，在待顯示圖像大于顯示屏幕的情況下，Microsoft公司的Internet Explorer (注冊商標)瀏覽器采用將圖像縮小到適合顯示屏幕的大小然后在顯示屏幕顯示的方式，從而用戶能夠首先從整體上把握圖像。在圖像主要表現(xiàn)人像或風景的情況下，這種顯示方式能夠比較好地滿足用戶的要求。然而，在圖像包含大量文本并主要表現(xiàn)其中的文字信息，或圖像本身即為文本文檔的圖像的情況下，這樣的縮小顯示對于用戶通常是沒有價值的，因為用戶通常無法識別圖像中的文字。在這種情況下，用戶必需在圖像上移動鼠標，尋找并點擊圖像擴大圖標，等待將圖像擴大至其真實大小。一方面需要用戶的操作，另一方面增加用戶的等待時間。
總之，在現(xiàn)有的圖像顯示的技術中，無論是按圖像的真實大小來顯示該圖像的方式，還是把圖像縮小來以適應屏幕的大小顯示該圖像的方式，均有相當大的可能不能夠滿足用戶的要求，造成一方面需要用戶的操作，另一方面增加用戶的等待顯示的時間。因此需要一種能夠自動確定按圖像的真實大小來顯示該圖像還是把圖像縮小以適應屏幕的方式來顯示該圖像的方案，目前的光學字符識別技術為實現(xiàn)此目的提供了可能性。
光學字符識別(Optical Character Recognition, OCR)技術，是通過掃描等光學輸入方式將各種票據(jù)、報刊、書籍、文稿及其它印刷品的文字轉(zhuǎn)化為圖像信息，再利用文字識別技術將圖像信息轉(zhuǎn)化為可以使用的格式的計算機輸入技術。可應用于銀行票據(jù)、大量文字資料、檔案巻宗、文案的錄入和處理領域。利用OCR技術，可自動識別印刷體漢字、字母、數(shù)字，可識別手寫體漢字、手寫體字母、數(shù)字及多種手寫符號。OCR技術還具有版面自動分析功能，能夠自動對掃描的版面進行分析，把應識別的文本區(qū)域劃分出來，之后進fH只別。
光學字符識別包括如下的關鍵模塊圖像輸入、圖像前處理、文字特征抽if又、對比^:據(jù)庫、和對比識別。
影象輸入待經(jīng)過OCR處理的對象透過光學儀器，諸如圖像掃描儀、傳真機或任何攝影器材，將圖像傳入計算機。隨著科技的進步，掃描儀等輸入裝置已經(jīng)制作得越來越精致，輕薄短小且品質(zhì)高，掃描儀的分辨率使圖像更清晰，增進OCR處理的效率。
影象前處理包括從獲取黑白二值化圖像、或灰階、彩色的圖像到分離出各個文字圖像的過程。涉及圖像正規(guī)化、去除噪聲、圖像矯正等圖像處理，及圖文分析、文字行與字分離(即先以行為單位來分離出文字行，再針對各個文字行分離出文字行中的文字)等文件前處理。在圖像處理方面，在理論和實際技術方面都已達到成熟階段，因此在市面上或網(wǎng)絡資源中有不少可用的鏈接庫。在文件前處理方面，對于圖像，需要先將圖片、表才各及文本區(qū)域相分離，甚至可以將文章的編排方向、文章的題綱及內(nèi)容主體區(qū)域分開，而文字的大小及文字的字體也可以如原始文件一樣地判斷出來。
文字特征抽取在識別率方面，特征抽取操作，諸如用何種特征、如何
抽取等等，直接影響識別的效果。特征可以大致分為兩類一類是統(tǒng)計的特征，諸如文本區(qū)域內(nèi)的黑白點數(shù)比；另一類是結構的特征，例如，文字圖像細線化后，所取得的文字的筆劃端點、交叉點的數(shù)量及位置、或筆劃段。
對比數(shù)據(jù)庫其中存儲標準、被-現(xiàn)為正確的文字信息，當抽取輸入文字的特征之后，無論是用統(tǒng)計還是用結構的特征，均需要對比數(shù)據(jù)庫來進行對比，對比數(shù)據(jù)庫的內(nèi)容包含所有欲識別的文字字集、以及根據(jù)與對輸入文字采用的特征抽取方法相同的特征抽取方法所獲取的特征群組。
對比識別根據(jù)不同的特征特性，選用不同的數(shù)學距離函數(shù)，通常采用的對比方法諸如歐式空間的對比方法、；卩>弛(Relaxation)對比方法、動態(tài)程序(Dynamic Programming, DP)對比方法、以及類神經(jīng)網(wǎng)絡的數(shù)據(jù)庫建立及對比、HMM ( Hidden Markov Model (隱藏馬爾可夫模型))等等。為了使識別的結果更穩(wěn)定，還提出所謂的專家系統(tǒng)(Experts System),其利用各種特征對比方法的相異互補性，提高識別結果的可信度。
此外，現(xiàn)有技術已有了多種計算圖像總面積以及一個文字的面積的方法。其中，計算圖像總面積可以采用多種方法，對于規(guī)則圖像，可以通過圖像庫函數(shù)返回圖像的長度和寬度，即可以得到圖像總面積，對于具有復雜邊緣輪廓的圖像可以采用區(qū)域分割法，將圖像分割成若干小塊，分別求出每塊的面積，再求和。針對一個文字，可以采用多種方法獲取其大小，也可以獲取其邊距，包括上下邊距和左右邊距。邊距大小可以用像素值表示。假設某個字是8號字，假設其大小為80x80像素并且左右上下邊距均為5個像素，那么該文字所占面積是8 5 x 8 5像素。
美國專利申請公開US 2007/0104366 A1號公開了一種對圖像中的文本區(qū) 域進行抽取和重新排序的方案，用于向用戶呈現(xiàn)以圖像格式存儲的文本。在該方案中，如果圖像包含一個或多個文本區(qū)域，并且圖像中的各個文本區(qū)域都有明確的邊界，則可以利用OCR技術把圖像中的各個文本區(qū)域抽取出來分別形成子圖像。然后，按照預先設置的順序，諸如文字閱讀順序，把各個子圖像重新排序并向用戶顯示，便于用戶閱讀。然而，該方案并不涉及如何決定按圖像的真實大小來顯示該圖像還是把圖像縮小以適應屏幕的方式來顯示該圖像的問題。
美國專利申請公開US 2002/0120653 Al號公開了一種獲取圖像中文本信息以便于用戶瀏覽網(wǎng)頁的方案。在用戶瀏覽的圖像中包含文本區(qū)域的情況下，利用過濾器識別圖像中的文本區(qū)域，利用OCR技術識別并提取出文本區(qū)域中的文字，然后放大文字以顯示。該方案假定圖像中的文字比較小，不方便用戶閱讀，因此提取圖像中的文字并放大。因而，該方案不涉及對于是否應該將圖像調(diào)整為顯示屏幕大小來顯示的判斷。實踐中的情況通常是，真實大小的圖像中的文字大小適合于用戶閱讀，但是由于瀏覽器自動縮小了圖像的大小，導致用戶無法閱讀圖像中的文字，因而不需要盲目一概地放大圖像中的文字。因此，在很大程度上，該方案造成計算機系統(tǒng)資源的無謂浪費。特別是，對于文本區(qū)域和圖形區(qū)域之間存在緊密聯(lián)系的圖像，諸如地圖，如果將地像中的表示地名和圖例的文本提取出來單獨顯示，那么對于用戶而言沒有意義。
因此，現(xiàn)有的采用OCR技術處理文本圖像的方案均未能提供一種能夠自動確定是否應將圖像縮小至顯示屏幕的大小來進行顯示的技術，以致造成用戶瀏覽的不便、以及計算機系統(tǒng)的不必要的負荷。

發(fā)明內(nèi)容
本發(fā)明針對現(xiàn)有技術中存在的上述缺陷而提出，本發(fā)明要解決的技術問題是提供一種基于圖像中的文本進行圖像顯示的方法和系統(tǒng)，目的是以符合用戶需要的方式向用戶顯示圖像，以方便用戶瀏覽，并避免計算機系統(tǒng)的不必要的負荷。
根據(jù)本發(fā)明的一個方面，提供一種基于圖像中的文本進行圖像顯示的方法，包括文本提取步驟，提取待顯示圖像中的文本區(qū)域；文本含量值計算步驟，計算所述圖像中文本的含量值；比較步驟，將所計算的含量值與預定閾值相比較；顯示步驟，如果所述含量值大于所述預定閾值，則按該圖像的真實大小來顯示該圖像。
根據(jù)本發(fā)明的另一個方面，提供一種基于圖像中的文本進行圖像顯示的系統(tǒng)，包括文本提取器，提取待顯示圖像中的文本區(qū)域；文本含量值計算器，計算所述圖像中文本的含量值；比較器，將所計算的含量值與預定閾值相比較；顯示器，如果所述含量值大于所述預定閾值，則按該圖像的真實大
小來顯示該圖像。
按照本發(fā)明，在當前電子地圖在計算機及網(wǎng)絡資源中越來越普遍的情況下，以及越來越多的組織和個人利用數(shù)字照相機拍攝文件來保存文件的情況下，通過自動地計算圖像中文本含量值，判斷按圖像的真實大小來顯示該圖像，還是把圖像縮小來以適應屏幕的方式顯示該圖像，能夠節(jié)省時間和用戶操作，消除用戶試圖閱讀過小的圖像而造成的錯誤，提高瀏覽器的總體可用性。

通過下面結合附圖進行的詳細描述，可以理解本發(fā)明所選擇的實施例及
其獲得的許多的目的、特征和優(yōu)點，其中
圖1是示出應用本發(fā)明的圖像顯示方法的總體流程圖2是示出一種計算圖像中文本的含量值的方法的流程圖3是示出應用本發(fā)明的圖像顯示系統(tǒng)的總體框圖4是示出一種文本含量值計算裝置的框圖5示出文本含量值高的圖像的一個示例；
圖6示出文本含量值低的圖像的一個示例；以及
圖7示出文本含量值高的地像的一個示例。
具體實施例方式
下面參照附圖詳細說明本發(fā)明的具體實施例。
圖1是示出應用本發(fā)明的圖像顯示方法的總體流程圖。首先，在步驟 S101，針對待顯示的圖像，提取其中的文本區(qū)域。此步驟可以通過使用光學字符識別(OCR)技術來實現(xiàn)，但是顯然，能夠從圖像中判斷并區(qū)分出文本區(qū)域的任何技術均可以應用于該步驟的處理。然后，在步驟S102,計算該圖像中文本的含量值，并在步驟S103將所計算的含量值與預定閾值相比較。最后，在步驟S104,如果所計算的含量值大于預定閾值，則認為該圖像是文本含量值高的圖像，按該圖像的真實大小來顯示該圖像。
應用圖l所示的方法，對于如圖5所示的圖像，被判斷為文本含量值高，從而按該圖像的真實大小來顯示，對于如圖6所示的圖像，被判斷為文本含量值低，從而將其縮小至顯示屏幕的大小來顯示，對于如圖7所示的地像，被判斷為文本含量值高，從而按該地像的真實大小來顯示。
下面詳細說明計算圖像中文本的含量值以及設置閾值的具體方法。可以根據(jù)需要構想出一些考慮因素作為指標，諸如文本的拼寫、語法，如果拼寫語法錯誤過多，則體現(xiàn)出該文本的可讀性不強，應降低圖像中文本
的含量值。還可以將圖像中文本區(qū)域的數(shù)目作為指標，例如，對于地圖，其中的文本分'散，因此，盡管圖像中文本總數(shù)量不是很高，但如果圖像中文本區(qū)域的數(shù)目較多，則應提高圖像中文本的含量值。還可以考慮所提取的文本區(qū)域中的文字的平均字體大小的因素，將其作為指標，如果所提取的文本區(qū) 域中的文字的平均字體大小較大，則其對于按真實大小顯示的要求會降低，應降低圖像中文本的含量值。此外，還可以考慮文本區(qū)域的面積占圖像面積的百分比的指標，如果該百分比高，則應提高圖像中文本的含量值。
本領域技術人員應該理解，以上的指標并非窮盡計算圖像中文本的含量值時所應考慮的所有因素，另一方面，上述指標顯然是相互獨立的，因此可以在設計時或由用戶在使用時任意地選擇采用。
關于對所選取采用的各個指標的評分方式，便于與閾值相比較，可以采用歸一化的方法，另外，可以令所有分值均為正值，把所選用的指標的得分值相加，除以所選用的指標的滿分之和，得到該圖像中文本的含量值。如公 <formula>formula see original document page 11</formula>
其中，選用k個指標，Nl為第1個指標的分值，Ml為第1個指標的滿分， N2為第2個指標的分值，M2為第2個指標的滿分，Nk為第k個指標的分值， Mk為第k個指標的滿分，Q為圖像中文本的含量值。顯然，Q為[O, l]的歸一化值。
顯然，也可以不采用歸一化值的方式，即把各個指標的得分相加作為圖像中文本的含量值Q。也可以考慮部分或全部指標采用負數(shù)值，圖像中文本的含量值也可以為負值。本領域技術人員應當理解，只要適當體現(xiàn)出所選用的指標的作用，評分體系可以設計為各種方式。
各個指標分別的評分方式可以通過對大量的文本圖像進行統(tǒng)計計算而得出。例如，對于拼寫指標，可以假定總分為100,出現(xiàn)一處拼寫錯誤則減1分，最低至0;對于語法指標，可以假定總分為100，出現(xiàn)一處語法錯誤則減 2分，最低至0;對于文本區(qū)域的數(shù)目指標，可以假定總分為100，有一處文本區(qū)域則得1分，最高100;對于平均字體大小的指標，可以假定總分為100, 平均字體大小從72號(及以上)至5號(及以下)，或者從初號(及以下) 至八號(及以上)，得分逐漸從0至100;對于文本區(qū)域的面積占圖像面積的百分比的指標，可以假定總分為100,百分數(shù)即為得分。
顯然，上述評分方法可以根據(jù)根據(jù)設計需要或用戶選擇而調(diào)整，例如總分可以是任意分數(shù)，甚至負數(shù)。各個指標的評分體系也可以調(diào)整，例如出現(xiàn) 一處拼寫錯誤則減2分，出現(xiàn)一處語法錯誤則減5分，有一處文本區(qū)域得2.5 分。關于平均字體大小的評分，也可以將28號字以上的情況全部定為0分，字號與得分的關系可以是線性的，也可以是單調(diào)的任何其它函數(shù)關系。關于文本區(qū)域的面積占圖像面積的百分比的評分，百分比與得分的關系也可以是單調(diào)的任何其它函數(shù)關系。
另外，為了體現(xiàn)各個指標之間重要性的不同，可以將各個指標的總分定
為不同，例如，在正常的指標滿分為100的情況下，如果認為平均字體大小
的指標較為重要，可以將其總分定為150分，如果認為文本區(qū)域的數(shù)目的指
標不很重要，可以將其總分定為50分?；蛘?，各個指標之間重要性的不同可
以通過為各個指標設置權重來表現(xiàn)。假定指標1至k的權重分別為Wl至W5，
則圖像中文本的含量值的計算方法可以如公式(2)所示。『1xM +『2x7V2 +…+股xM:
『lx紹+『2xM2 +…+附xM:
可以通過現(xiàn)有的拼寫檢查器和/或語法檢查器來檢查所提取文本區(qū)域中文本的拼寫和/或語法，例如Microsoft公司的字處理軟件Word及郵件收發(fā)軟件Outlook即采用了檢查文本的拼寫和/或語法的技術。可以通過計數(shù)器來計數(shù)文本中拼寫和/或語法發(fā)生錯誤的個數(shù)。對于檢查到拼寫和/或語法錯誤的文本，可以降低相應指標的得分，在還選用了其它指標的情況下，還可以選擇采用排除發(fā)生錯誤的文本的處理方法，也就是在其它指標的評分中，不再考慮該發(fā)生拼寫和/或語法錯誤的文本區(qū)域。
可以在識別和提取圖像中的文本區(qū)域(步驟S101)的同時，通過計數(shù)器來計數(shù)所提取的文本區(qū)域的數(shù)目，從而獲取圖像中的文本區(qū)域的數(shù)目。但是顯然，獲取圖像中的文本區(qū)域的數(shù)目的操作也可以在提取圖像中的文本區(qū)域之后，計算圖像中文本含量值的步驟S102中進行。
計算所提取的文本區(qū)域中的文字的平均字體大小的操作可以通過下述的兩種方法來進4亍。
一種方法是，利用OCR技術逐個返回每個文字的字體大小，把每個文字的字體大小相加，再除以圖像中文字的總個數(shù)。如果圖像中共有r個文字，分別為C1、 C2........ Cr,各個文字相應的字體大小分別為Fl、 F2........
Fr，則該圖像的平均字體大小AFS可以按照公式(3)求出
一 M + F2 +…+ Fr ,、
爿K5 二- ( 3 )
另一種方法是，利用OCR技術逐個返回每個文本區(qū)域的平均字體大小，
如果圖像中共有s個文本區(qū)域，各個文本區(qū)域分別為T1、 T2........ Ts，各
個文本區(qū)域包含的文字個數(shù)分別為Gl、 G2.......、 Gs，個文本區(qū)域的平均
字體大小分別為AFS1、 AFS2........ AFSs,則該圖像的平均字體大小AFS
可以按照公式(4)求出
^ (^^^1 + <^/1^2 + — + 6^爿孤，、
爿FS =- ( 4 )
Gl + G2 +…Os
計算所提取的文本區(qū)域的面積并求出文本區(qū)域的面積占所述圖像面積的百分比的操作可以通過下述的兩種方法來進行。
一種方法是，利用OCR技術獲取圖像中每個文本區(qū)域的面積，如果圖像
中共有s個文本區(qū)域，各個文本區(qū)域分別為T1、 T2........ Ts,各個文本區(qū)
域的面積分別為Dl、 D2........ Ds,圖像的總面積為H，則該圖像的文本
區(qū)域面積的百分比可以按照公式(5)求出
= S
另一種方法是，利用OCR技術逐個返回每個文字的字體大小，將字體大
小換算成該文字所占的面積，如果圖像中共有r個文字，分別為C1 、 C2 、.......
Cr,各個文字所占的面積分別為El、 E2........ Er，圖像的總面積為P，則
該圖像的文本區(qū)域面積的百分比可以按照公式(6)求出
P,漁…揚 (6)
在對海量的現(xiàn)有的文本圖像進行上述公式(1)或公式(2)的計算，如果得到的圖像中文本的含量值Q的范圍在[Ql, Q2],則可以選取將Q1定為閾值TH,即按圖像的真實大小來顯示該圖像還是把圖像縮小以適應屏幕的方式來顯示該圖像的標準，根據(jù)所計算的文本的含量值Q與閾值TH的比較結
果，如果含量值Q大于閾值TH,則認為該圖像的文本含量值高，按圖像的真實大小來顯示，如果含量值Q小于閾值TH,則認為該圖像的文本含量值低，把圖像縮小以適應屏幕的方式來顯示。顯然，閾值的確定同樣可以根據(jù) 設計需要或用戶選擇來進行，例如設置為Q2或介于Q1和Q2之間的任意數(shù)、甚至小于Ql或大于Q2的數(shù)，只要所設置的閾值TH符合具體用戶對于圖像的顯示方式的要求。
閾值TH可以設置為一個閾值，也可以提供為不同程度的多個閾值供用戶在使用中選擇，或者可以由用戶自由設置。
圖2示出了在選擇采用拼寫和/或語法指標、文本區(qū)域數(shù)目指標、平均字體大小指標、和文本區(qū)域面積百分比指標的情況下的一種計算圖像中文本的含量值的方法的流程圖。
在步驟S201,檢查所提取文本區(qū)域中文本的拼寫和/或語法。如果檢查到拼寫和/或語法錯誤，則降低此項指標的得分?；蛘?，也可以排除發(fā)生錯誤的文本區(qū)域，在隨后的步驟中，不再考慮發(fā)生拼寫和/或語法錯誤的文本區(qū)域。
在步驟S202,對所提取的文本區(qū)域的數(shù)目計數(shù)。
在步驟S203,計算所提取的文本區(qū)域中的文字的平均字體大小?？梢圆?用如上述公式(3)或公式(4)所描述的方法。
在步驟S204，計算所提取的文本區(qū)域的面積并求出文本區(qū)域的面積占所述圖像面積的百分比?？梢圆捎萌缟鲜龉?5)或公式(6)所描述的方法。
在步驟S205,根據(jù)所檢查的拼寫和/或語法的情況、文本區(qū)域的數(shù)目、平均字體大小、和文本區(qū)域的面積占所述圖像面積的百分比，而評出所述圖像中文本的含量值?？梢圆捎萌缟鲜龉?1)或公式(2)所描述的方法。假定拼寫指標的得分為N1，總分為M1，權重為W1;語法指標得分為N2，總分為M2，權重為W2;文本區(qū)域的數(shù)目指標得分為N3,總分為M3,權重為 W3;平均字體大小指標得分為N4,總分為M4，權重為W4;文本區(qū)域的面積所占百分比的指標得分為N5,總分為M5，權重為W5，則圖像中文本的
含量值Q可以按如下公式(7)求出
<formula>formula see original document page 14</formula>(7)
顯然，在只選擇檢查拼寫而不檢查語法的情況下，上述公式(7)中的W2xN2項和W2xM2項應去除。類似地，在只選擇檢查語法而不4企查拼寫的情況下，上述公式(7)中的WlxNl項和WlxMl項應去除。
本領域技術人員可以理解，在圖2示出的計算圖像中文本的含量值的方法中，很顯然，各個步驟不限于該圖2所公開的具體的順序和組合方式，其中的步驟S201 S204是相互獨立的，根據(jù)設計需要以及用戶的決定，可以個別地選擇是否采用，并且選擇采用的步驟之間的順序也是可以任意調(diào)整的。
例如，可以只選用步驟S201,即檢查所提取文本區(qū)域中文本的拼寫和/ 或語法，然后基于所檢查的拼寫和/或語法的情況而評出圖像中文本的含量值。在此情況下，圖像中文本的含量值Q可以按如下公式(8)求出
例如，可以只選用步驟S202,即對所提取的文本區(qū)域的數(shù)目進行計數(shù)，然后基于圖像中文本區(qū)域的數(shù)目而評出所述圖像中文本的含量值。在此情況下，圖像中文本的含量值Q可以按如下公式(9)求出
2 =- (9)
例如，可以只選用步驟S202、 S203、和S204，即，對所拔JF又的文本區(qū)域的數(shù)目進行計數(shù)，然后計算所提取的文本區(qū)域中的文字的平均字體大小，并計算所提取的文本區(qū)域的面積并求出文本區(qū)域的面積占圖像面積的百分比，然后，根據(jù)文本區(qū)域的數(shù)目、平均字體大小、和文本區(qū)域的面積占圖像面積的百分比，而評出所述圖像中文本的含量值。在此情況下，圖像中文本的含量值Q可以按如下公式(10)求出
或者，例如，可以只選用步驟S201和S202,即，檢查所提取的文本區(qū) 域中文本的拼寫和/或語法，并對所提取的文本區(qū)域的數(shù)目計數(shù)，然后，基于所檢查的拼寫和/或語法的情況、和該文本區(qū)域數(shù)目，而評出圖像中文本的含量值。在此情況下，圖像中文本的含量值Q可以按如下公式(11 )求出
其中，關于從各個指標的情況來獲得該指標的得分的操作，既可以在如步驟S201 ~ S204的獲取各個指標的情況的步驟進行，也可以在如步驟S205的評出圖像中文本的含量值的步驟中進行。
實際上，對于計算圖像中文本含量值所選用的指標的組合方式不限于上述的例子。而且，還可以在本發(fā)明的基于圖像中的文本進行圖像顯示的方法的執(zhí)行過程中，檢測用戶是否發(fā)出關于按適合于顯示屏幕大小的大小顯示圖像的指令，如果檢測到用戶發(fā)出按適合于顯示屏幕大小的大小顯示圖像的指令，則按適合于顯示屏幕大小的大小來縮小該圖像并重新顯示。
下面，說明本發(fā)明的基于圖像中的文本進行圖像顯示的系統(tǒng)。
圖3示出了應用本發(fā)明的圖像顯示系統(tǒng)的總體框圖。文本提取器301針
對待顯示的圖像，提取其中的文本區(qū)域。文本提取器301的上述操作可以通過使用光學字符識別(OCR)技術來實現(xiàn)，但是顯然，能夠從圖像中判斷并區(qū)分出文本區(qū)域的任何技術均可以應用于文本提取器301的處理。然后，文本含量值計算器302計算該圖像中文本的含量值。文本含量值計算器302可以通過上述公式(1)或公式(2)來計算該圖像中文本的含量值。然后，比較器303將所計算的含量值與預定閾值相比較。最后，如果所計算的含量值大于預定閾值，則顯示器304把該圖像作為文本含量值高的圖像，按該圖像的真實大小來顯示。
本發(fā)明的文本含量值計算器302可以以上述的指標作為評價圖像中文本含量值的指標，并以上述的評分體系來作為針對各個指標進行評分的體系。在本發(fā)明中，針對各個指標，分別設計器件來進行處理，獲取該指標的情況。
圖4示出了在選擇采用拼寫和/或語法指標、文本區(qū)域數(shù)目指標、平均字體大小指標、和文本區(qū)域面積百分比指標的情況下的一種計算圖像中文本的含量值的文本含量值計算器302的組成框圖。
檢查器401檢查所提取文本區(qū)域中文本的拼寫和/或語法。如果檢查到拼寫和/或語法錯誤，則降低此項指標的得分。文本區(qū)域計數(shù)器402對所提取的文本區(qū)域的數(shù)目計數(shù)。
平均字體大小計算器403可以通過執(zhí)行如上述公式(3)或公式(4)所描述的操作，來計算所提取的文本區(qū)域中的文字的平均字體大小。
文本區(qū)域比計算器404可以通過執(zhí)行如上述公式(5)或公式(6)所描述的操作，來計算所提取的文本區(qū)域的面積并求出文本區(qū)域的面積占所述圖像面積的百分比。
上述器件401 ~ 404的處理結果分別輸出至評值器405,評值器405按照上述公式(7)來計算圖像的文本含量值。
本領域技術人員應當理解，在圖4示出的文本含量值計算裝置中，很顯
然，各個組成器件不限于該圖4所公開的具體的組合方式，其中的器件401 404可以是相互獨立的，根據(jù)設計需要以及用戶的決定，因而可以個別地選擇是否采用?？梢詾槊總€器件401 -404分別甚至一個選擇器，從而在設計時或在用戶使用時能夠通過選擇器來控制是否選用相應的器件。
關于從各個指標的情況來獲得該指標的得分的處理，既可以在如器件 401 -404的獲取各個指標的情況的器件進行，也可以在如評值器405的評出圖像中文本的含量值的器件中進行。
在檢查器401只檢查拼寫而不檢查語法的情況下，上述公式(7)中的 W2xN2項和W2xM2項應去除。類似地，在4金查器401只4企查語法而不纟全查拼寫的情況下，上述公式(7)中的WlxNl項和WlxMl項應去除。
并且，文本含量值計算器302可以配置為，檢查器401在檢查到拼寫和/ 或語法錯誤后，可以排除發(fā)生錯誤的文本區(qū)域，并將排除了發(fā)生錯誤的文本區(qū)域的文本輸出至器件402-404，從而器件402-404不再考慮發(fā)生拼寫和/ 或語法錯誤的文本區(qū)域。
例如，在器件401 -404中，可以只選用檢查器401，即，檢查器401檢查所提取文本區(qū)域中文本的拼寫和/或語法，評值器405按照上述公式(8)，基于所檢查的拼寫和/或語法的情況而評出圖像中文本的含量值。
例如，在器件401 404中，可以只選用文本區(qū)域計數(shù)器402,即，文本區(qū)域計數(shù)器402對所提取的文本區(qū)域的數(shù)目進行計數(shù)，評值器405按照上述公式(9),基于圖像中文本區(qū)域的數(shù)目而評出所述圖像中文本的含量值。
例如，在器件401 404中，可以只選用文本區(qū)域計數(shù)器402、平均字體大小計算器403、和文本區(qū)域比計算器404,即，文本區(qū)域計數(shù)器402對所提取的文本區(qū)域的數(shù)目進行計數(shù)，平均字體大小計算器403計算所提取的文本區(qū)域中的文字的平均字體大小，文本區(qū)域比計算器404計算所提取的文本區(qū) 域的面積并求出文本區(qū)域的面積占圖像面積的百分比，然后，評值器405按照上述公式(IO),根據(jù)文本區(qū)域的數(shù)目、平均字體大小、和文本區(qū)域的面積占圖像面積的百分比，而評出所述圖像中文本的含量值。
例如，在器件401 -404中，可以只選用檢查器401和文本區(qū)域計數(shù)器 402,即，檢查器401檢查所提取的文本區(qū)域中文本的拼寫和/或語法，文本區(qū)域計數(shù)器402對所提取的文本區(qū)域的數(shù)目計數(shù)，然后，評值器405按照上述公式(ll),基于所檢查的拼寫和/或語法的情況、和文本區(qū)域的數(shù)目，而評出圖像中文本的含量值。
實際上，對于計算圖像中文本含量值所選用的指標的組合方式不限于上述的例子。而且，還可以在本發(fā)明的基于圖像中的文本進行圖像顯示的系統(tǒng) 中，另外設置檢測器，用來檢測用戶是否發(fā)出關于按適合于顯示屏幕大小的大小顯示圖像的指令，如果檢測到用戶發(fā)出按適合于顯示屏幕大小的大小顯示圖像的指令，則由顯示器按適合于顯示屏幕大小的大小來縮小該圖像并重新顯示。
按照本發(fā)明，通過計算待顯示圖像中文本的含量值，自動判斷按圖像的真實大小來顯示該圖像，還是把圖像縮小來以適應屏幕的方式顯示該圖像，一方面實現(xiàn)以符合用戶瀏覽目的的方式向用戶顯示圖像，同時避免計算機系統(tǒng)的不必要的負荷。
可以在應用本發(fā)明的基于圖像中的文本進行圖像顯示的方法之前，先獲取待顯示圖像的面積，類似地，本發(fā)明的基于圖像中的文本進行圖像顯示的系統(tǒng)，也可以在執(zhí)行處理前先獲取待顯示圖像的面積，如果該圖像面積大于顯示屏幕面積以致于按真實大小無法同時在顯示屏幕上顯示圖像整體，則判
斷是否應將圖像縮小至顯示屏幕的大小來進行顯示。
另外，除了應用于判斷是否應將圖像縮小至顯示屏幕的大小來進行顯示之外，很顯然，本發(fā)明還可以應用于從大量圖像中搜索出文本圖像，以及應用于從大量文本圖像中搜索出拼寫和/或語法錯誤比較多的文本圖像。本發(fā)明能夠?qū)嵤┯跒g覽器或瀏覽器插件中。
為了說明和描述，提出了上面的陳述。但并非想要窮盡或把本發(fā)明限制到所公開的詳細形式。根據(jù)上面的說明，可以進行許多修改和變更。意圖本發(fā)明的范圍不由在此的詳細描述限制，而由所附的權利要求來限定。上面地說明和示例地實施提供本發(fā)明的制造和構成使用的完全說明。由于在不脫離本發(fā)明的精神和范圍的前提下，能夠作出本發(fā)明的許多實施例，因此，本發(fā) 明體現(xiàn)于所附的權利要求中。
權利要求
1. 一種基于圖像中的文本進行圖像顯示的方法，包括文本提取步驟，提取待顯示圖像中的文本區(qū)域；文本含量值計算步驟，計算所述圖像中文本的含量值；比較步驟，將所計算的含量值與預定閾值相比較；顯示步驟，如果所述含量值大于所述預定閾值，則按該圖像的真實大小來顯示該圖像。
2. 按照權利要求1所述的方法，其中，在所述文本提取步驟中，利用光學字符識別技術提取所述圖像中的文本區(qū)域。
3. 按照權利要求1或2所述的方法，其中，所述文本含量值計算步驟包括檢查步驟，檢查所提取文本區(qū)域中文本的拼寫和/或語法；評值步驟，基于所檢查的拼寫和/或語法的情況而評出所述圖像中文本的含量值。
4. 按照權利要求1或2所述的方法，其中，所述文本含量值計算步驟包括文本區(qū)域計數(shù)步驟，計數(shù)所提取的文本區(qū)域的數(shù)目；評值步驟，基于該文本區(qū)域的數(shù)目而評出所述圖像中文本的含量值。
5. 按照權利要求1或2所述的方法，其中，所述文本含量值計算步驟包括文本區(qū)域計數(shù)步驟，計數(shù)所提取的文本區(qū)域的數(shù)目；平均字體大小計算步驟，計算所提取的文本區(qū)域中的文字的平均字體大文本區(qū)域比計算步驟，計算所提取的文本區(qū)域的面積并求出文本區(qū)域的面積占所述圖像面積的百分比；評值步驟，根據(jù)文本區(qū)域的數(shù)目、平均字體大小、和文本區(qū)域的面積占所述圖像面積的百分比，而評出所述圖像中文本的含量值。
6. 按照權利要求l或2所述的方法，其中，所述文本含量值計算步驟包括..檢查步驟，檢查所提取的文本區(qū)域中文本的拼寫和/或語法；文本區(qū)域計數(shù)步驟，計數(shù)所提取的文本區(qū)域的數(shù)目；評值步驟，基于所檢查的拼寫和/或語法的情況、和該文本區(qū)域數(shù)目而評出所述圖像中文本的含量值。
7. 按照權利要求1或2所述的方法，其中，所述文本含量值計算步驟包括-.檢查步驟，檢查所提取文本區(qū)域中文本的拼寫和/或語法；文本區(qū)域計數(shù)步驟，計數(shù)所提取的文本區(qū)域的數(shù)目；平均字體大小計算步驟，計算所提取的文本區(qū)域中的文字的平均字體大小；文本區(qū)域比計算步驟，計算所提取的文本區(qū)域的面積并求出文本區(qū)域的面積占所述圖像面積的百分比；評值步驟，根據(jù)所檢查的拼寫和/或語法的情況、文本區(qū)域的數(shù)目、平均字體大小、和文本區(qū)域的面積占所述圖像面積的百分比，而評出所述圖像中文本的含量值。
8. 按照權利要求1 ~7中任意一個所述的方法，還包括檢測步驟，檢測用戶是否發(fā)出關于按適合于顯示屏幕大小的大小顯示的指令；重顯示步驟，如果檢測到用戶發(fā)出按適合于顯示屏幕大小的大小顯示的指令，則按適合于顯示屏幕的大小來縮小該圖像并顯示。
9. 按照權利要求6或7所述的方法，其中，在所述檢查步驟中，如果檢查出所提取的文本區(qū)域中有拼寫和/或語法的錯誤，則排除該有拼寫和/或語法錯誤的文本區(qū)域。
10. —種基于圖像中的文本進行圖像顯示的系統(tǒng)，包括文本提取器，提取待顯示圖像中的文本區(qū)域；文本含量值計算器，計算所述圖像中文本的含量值；比較器，將所計算的含量值與預定閾值相比較；顯示器，如果所述含量值大于所述預定閾值，則按該圖像的真實大小來顯示該圖像。
11. 按照權利要求IO所述的系統(tǒng)，其中，所述文本提取器利用光學字符識別技術提取所述圖像中的文本區(qū)域。
12. 按照權利要求10或11所述的系統(tǒng)，其中，所述文本含量值計算器包括檢查器，檢查所提取文本區(qū)域中文本的拼寫和/或語法；評值器，基于所檢查的拼寫和/或語法的情況而評出所述圖像中文本的含量值。
13. 按照權利要求10或11所述的系統(tǒng)，其中，所述文本含量值計算器包括文本區(qū)域計數(shù)器，計數(shù)所提取的文本區(qū)域的數(shù)目；評值器，基于該文本區(qū)域的數(shù)目而評出所述圖像中文本的含量值。
14. 按照權利要求10或11所述的系統(tǒng)，其中，所述文本含量值計算器包括文本區(qū)域計數(shù)器，計數(shù)所提取的文本區(qū)域的數(shù)目；平均字體大小計算器，計算所提取的文本區(qū)域中的文字的平均字體大??；文本區(qū)域比計算器，計算所提取的文本區(qū)域的面積并求出文本區(qū)域的面積占所述圖像面積的百分比；評值器，根據(jù)文本區(qū)域的數(shù)目、平均字體大小、和文本區(qū)域的面積占所述圖像面積的百分比，而評出所述圖像中文本的含量值。
15. 按照權利要求10或11所述的系統(tǒng)，其中，所述文本含量值計算器包括檢查器，檢查所提取的文本區(qū)域中文本的拼寫和/或語法；文本區(qū)域計數(shù)器，計數(shù)所提取的文本區(qū)域的數(shù)目；評值器，基于所檢查的拼寫和/或語法的情況、和該文本區(qū)域數(shù)目而評出所述圖像中文本的含量值。
16. 按照權利要求10或11所述的系統(tǒng)，其中，所述文本含量值計算器包括檢查器，檢查所提取文本區(qū)域中文本的拼寫和/或語法；文本區(qū)域計數(shù)器，計數(shù)所提取的文本區(qū)域的數(shù)目；平均字體大小計算器，計算所提取的文本區(qū)域中的文字的平均字體大小；文本區(qū)域比計算器，計算所提取的文本區(qū)域的面積并求出文本區(qū)域的面積占所述圖像面積的百分比；評值器，根據(jù)所檢查的拼寫和/或語法的情況、文本區(qū)域的數(shù)目、平均字體大小、和文本區(qū)域的面積占所述圖像面積的百分比，而評出所述圖像中文本的含量值。
17. 按照權利要求10~ 16中任意一個所述的系統(tǒng)，還包括檢測器，檢測用戶是否發(fā)出關于按適合于顯示屏幕大小的大小顯示的指令，其中，如果所述檢測器檢測到用戶發(fā)出按適合于顯示屏幕大小的大小顯示的指令，則所述顯示器按適合于顯示屏幕的大小來縮小該圖像并顯示。
18. 按照權利要求15或16所述的系統(tǒng)，其中，所述檢查器如果檢查出所提取的文本區(qū)域中有拼寫和/或語法的錯誤，則排除該有拼寫和/或語法錯誤的文本區(qū)域。
全文摘要
本發(fā)明提供一種基于圖像中的文本進行圖像顯示的方法和系統(tǒng)。本發(fā)明的圖像顯示方法，包括文本提取步驟，提取待顯示圖像中的文本區(qū)域；文本含量值計算步驟，計算所述圖像中文本的含量值；比較步驟，將所計算的含量值與預定閾值相比較；顯示步驟，如果所述含量值大于所述預定閾值，則按該圖像的真實大小來顯示該圖像。實現(xiàn)以符合用戶瀏覽目的的方式向用戶顯示圖像，同時避免計算機系統(tǒng)的不必要的負荷。
文檔編號G06K9/00GK101419661SQ20071018029
公開日2009年4月29日申請日期2007年10月26日優(yōu)先權日2007年10月26日
發(fā)明者卡里·貝茨, 波涂申請人:國際商業(yè)機器公司

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：卡里.貝茨;涂波
技術所有人：國際商業(yè)機器公司
我是此專利的發(fā)明人

上一篇：計算機有害程序自動防護方法及裝置的制作方法
上一篇：訪問控制設備及訪問控制方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于圖像中的文本進行圖像顯示的方法和系統(tǒng)的制作方法