欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

文本檢測的制作方法

文檔序號:7641885閱讀:199來源:國知局
專利名稱:文本檢測的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種檢測視頻信號中的文本的方法和設(shè)備。
背景技術(shù)
EP-A-0687105揭示了視頻信號中檢測移動的方法。這種方法可以用于在場中的線之間產(chǎn)生新的線。首先,穿過圖像的差分信號被計(jì)算。使用兩個連續(xù)場計(jì)算的邊緣信息,來水平地?cái)U(kuò)展這個差分信號,其中差分信號給出了檢測位置的最小移動區(qū)域。邊緣檢測器基于最小移動區(qū)域的連續(xù)奇數(shù)與偶數(shù)場之間的閾值差分信號,并且基于根據(jù)水平邊緣的最小移動區(qū)域可控制的水平擴(kuò)展。這里,水平邊緣具有高的垂直頻率。
US-A-5051826揭示了垂直邊緣檢測電路,它適用于電視圖像移動的逐行掃描轉(zhuǎn)換電路。它包括第一電路(基于線存儲器),用于從隔行掃描輸入電視信號中產(chǎn)生場內(nèi)差分信號,和第二電路(基于場存儲器)用于從隔行掃描的輸入電視信號中產(chǎn)生場間差分信號。當(dāng)幀間差分信號小于預(yù)定值時,第三電路選擇性地輸出場內(nèi)和場間差分信號的最大值,而當(dāng)它大于預(yù)定值時,輸出場內(nèi)差分信號。這份文件中所謂的“垂直邊緣”,與EP-A-0687105中所謂的“水平邊緣”相同。
US-A-5565998(律師的記錄摘要PHB33.833)揭示了在視頻序列中識別電影幀的方法。
已知的移動補(bǔ)償差值技術(shù)存在這樣的問題,即它們不能處理滾動文本。特別困難的是對付在電影模式背景上滾動的視頻模式文本,這在視頻模式文本加到電影模式信號時發(fā)生。這里,電影模式意味著一對隔行場涉及相同的移動項(xiàng),當(dāng)使用1個電影幀來產(chǎn)生2個隔行視頻場,從而在25Hz電影信號中獲得50Hz視頻信號時,這會發(fā)生。在視頻模式中,每個場代表分離的移動項(xiàng)。在上述出版物中不處理這些問題。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種改進(jìn)的文本檢測。對此,本發(fā)明提供由獨(dú)立權(quán)利要求限定的文本檢測,在從屬權(quán)利要求中體現(xiàn)了優(yōu)選實(shí)施例。
根據(jù)本發(fā)明的第一方面,在檢測視頻信號中的文本的方法中,檢測視頻信號中高的水平頻率,來得到水平邊緣檢測結(jié)果,并且在給定位置上的水平邊緣檢測結(jié)果,與在垂直相鄰位置上的水平邊緣檢測結(jié)果關(guān)聯(lián)。
從此后描述的實(shí)施例及其說明中,本發(fā)明的這些和其它方面將會更明顯。


在附圖中圖1顯示了顯示裝置,它包括根據(jù)本發(fā)明的移動文本檢測器的第一實(shí)施例;圖2顯示了根據(jù)本發(fā)明的移動文本檢測器的第二實(shí)施例;而圖3顯示了本發(fā)明優(yōu)選實(shí)施例中使用的測量窗口。
實(shí)施例說明根據(jù)本發(fā)明的靜止/移動文本檢測器的目的,是在視頻圖像中識別文本,其中文本對特殊的視頻處理,如移動補(bǔ)償插值非常敏感。我們定義文本為關(guān)聯(lián)數(shù)量的連續(xù)字符,其間可能有空格。本發(fā)明不限于拉丁字符表中的字符,系統(tǒng)對其它字符表中的字符處理得也很好,特別是阿拉伯字符。
圖1的顯示裝置包括—瞬態(tài)(邊緣)檢測器ED,它指示視頻信號VS中任何文本瞬態(tài)的水平位置和方向(低到高的變化和高到低的變化)。
—關(guān)聯(lián)器C,它比較3個空間連續(xù)線上的文本位置和方向(場n中的線m,場n中的線m-2(即在隔行視頻信號中,相同場中的前置線),和空間上在這些線m-2與m之間,但位于場n-1中的線m-1)。
—后處理單元PPU,它檢查是否檢測的瞬態(tài)實(shí)際符合文本,并且在這種情況下,它們指示檢測的文本瞬態(tài)符合靜止文本,還是符合水平說明移動文本。后處理單元PPU還可以給出附加的信息,如文本的速度。它可以被容易地?cái)U(kuò)展,從而還給出文本的高度和長度,它在屏幕中的位置等。后處理單元PPU將速度估計(jì)SE發(fā)出到關(guān)聯(lián)器C。速度估計(jì)SE指示文本的速度,使關(guān)聯(lián)器C找到正確的位置。
—窗口指示單元W,它允許限制部分特定畫面的檢測。
—移動補(bǔ)償處理器MCP(例如,100Hz轉(zhuǎn)換器),它根據(jù)檢測的文本和關(guān)聯(lián)信息(靜止/移動文本,速度等),處理視頻信號(VS)。
—顯示設(shè)備D,用于顯示移動補(bǔ)償視頻信號。
瞬態(tài)檢測器ED和關(guān)聯(lián)器C處理象素基,而后處理單元PPU處理線基。瞬態(tài)檢測器ED查找一些象素(典型地為三個象素)中低閾值與高閾值交叉的亮度水平。檢測器ED的輸出refo(象素)是0如果象素符合高到低的瞬態(tài)。
2如果象素符合低到高的瞬態(tài)。
1其它情況。
基本上,檢測器ED標(biāo)記文本字符的大約第一和最后象素。
文本檢測的原理使用了這樣的事實(shí),即小的垂直線是文本的特點(diǎn),在文本的情況下,—在一些連續(xù)線(場n中的線m,場n中的線m-2,和空間上在這些線m-2與m之間,但位于場n-1中的線m-1)上,檢測器refo[象素]的輸出之間有高的關(guān)聯(lián)性,和—在整個文本長度上,標(biāo)記象素(在0和2的refo[象素])的密度相對高。
在隔行視頻模式中,靜止/移動檢測的原理是—在靜止文本中,從場n中的線m到場n中的線m-2匹配的瞬態(tài)頻率,低于從場n中的線m到場n-1中的線m-1匹配的瞬態(tài)頻率,其中場n-1中的線m-1垂直地位于場n中的線m與m-2之間,而—在移動文本中,從場n中的線m到場n中的線m-2匹配的瞬態(tài)頻率,更高于從場n中的線m到場n-1中的線m-1匹配的瞬態(tài)頻率,其中場n-1中的線m-1垂直地位于場n中的線m與m-2之間。
通過用前置幀的數(shù)據(jù)代替前置場的數(shù)據(jù),上述原理可以容易地適應(yīng)逐行掃描視頻模式。
關(guān)聯(lián)器C和后處理單元PPU使用這些思想,來識別線是否包含靜止文本,移動文本,還是不包含文本。在一個實(shí)施例中,使用了三個計(jì)數(shù)器。計(jì)數(shù)1代表從場n中的線m-2到場n中的線m匹配的頻率。計(jì)數(shù)2代表從場n中的線m到場n-1中的線m-1匹配的頻率。計(jì)數(shù)3符合線中文本的長度;它用于對文本檢測設(shè)置適當(dāng)?shù)拈撝怠?br> 如果計(jì)數(shù)2>計(jì)數(shù)3/16,并且計(jì)數(shù)2>計(jì)數(shù)1,則檢測靜止文本。
如果計(jì)數(shù)1>計(jì)數(shù)3/16,并且計(jì)數(shù)1>2*計(jì)數(shù)2,則檢測移動文本。
這個系統(tǒng)被證明適于正確地檢測靜止和移動文本。特別是,沒有發(fā)現(xiàn)系統(tǒng)將移動(靜止)文本識別為靜止(移動)文本的特定情況。在字符序列的高度內(nèi),特別是所有的線都識別為字符線,除了有時相應(yīng)于字符序列頂部或底部的線。
在多路并發(fā)信號中,有一些“錯誤檢測”的情況。通過在具有文本的線組之間,檢測一些沒有文本的線的出現(xiàn),來解決這個問題。
這種算法能夠被擴(kuò)展,從而給出文本的水平速度。通過提供我們已知的文本移動方向,系統(tǒng)需要m線來識別文本在速度上等于m象素/場。如果我們不知道方向,那么我們需要2*m線來識別速度。在多數(shù)情況下,我們可以檢測文本從屏幕的哪一側(cè)進(jìn)入,并且知道文本的方向。如果我們考慮,通常文本的速度<=10象素/場,那么我們可以在一個字符高度內(nèi)可靠地加速輸出。當(dāng)檢測到文本時,這個文本搜索機(jī)制用于第一場。速度的結(jié)果可以直接用于后面場中的靜止/移動文本檢測。
該系統(tǒng)還可以容易地提供關(guān)于檢測的文本的尺寸和位置的信息。
在圖2中,給出了移動文本檢測器更具體的方塊圖。系統(tǒng)的心臟仍然由邊緣檢測器ED、關(guān)聯(lián)器C和后處理單元PPU組成。邊緣檢測器ED的輸出是瞬態(tài)的位置和方向的信息。這個信息既被關(guān)聯(lián)器C使用,又被存儲在線存儲器LM和場存儲器FM中。關(guān)聯(lián)器C需要三條線的邊緣信息當(dāng)前線和當(dāng)前場的前置線,和前置場之間的線。由于多數(shù)水平移動文本預(yù)期出現(xiàn)在屏幕的頂部和底部,加入了柔性的窗口指示單元W,來限制需要處理的量。
除了圖1的實(shí)施例,圖2的實(shí)施例包括基于象素的尖峰檢測器P,其輸出被基于場的控制處理器CP使用,通過邊緣水平選擇信號EL的方式,來適應(yīng)邊緣檢測器ED的閾值水平??刂铺幚砥鰿P將窗口選擇信號WS發(fā)出到窗口指示單元W,用于適應(yīng)窗口。例如,如果檢測到移動文本,那么窗口可以適應(yīng)文本的移動(例如除了二*二的水平獨(dú)立窗口,還采用圖3例子中的從hwindow_start_left到hwindow_start_right擴(kuò)展的二*一的大窗口)??刂铺幚砥鰿P還發(fā)出信號是電影模式還是視頻模式或文本模式的信號。
所以,我們以柔性方式確定窗口(見圖3)。這個柔性窗口確定的另一個原因是,可以以盡可能小的窗口,盡可能早地檢測文本從右到左的滾動,或從左到右的滾動(例如阿拉伯文)。通過使hwindow_stop_left>hwindow_start_right,并且vwindow_stop_top>vwindow_start_bottom,4個窗口可以組合成一個。
在簡單應(yīng)用中,尖峰檢測器P容易地檢測測量窗口中最高的亮度水平。
文本檢測器檢測視頻信號中大的、快的瞬態(tài)。有很多方法來實(shí)現(xiàn)。在一個實(shí)施例中,使用了“事件檢測器”,它檢測兩個閾值何時交叉亮度(lowthreshold,再次high_threshold)。只當(dāng)閾值連續(xù)交叉時,輸出將在預(yù)定時間內(nèi)。
進(jìn)一步的實(shí)施例包括第三檢測器(閾值/速度檢測器),它不僅搜索閾值的交叉,而且設(shè)置允許瞬態(tài)的時間限制。以這種方式,考慮瞬態(tài)的振幅和速度移動文本的最大速度可以非常高。如果在2秒內(nèi)文本交叉屏幕,那么意味著在100場內(nèi)大約800個象素,或者每個場8個象素。通過這樣的速度,檢測器會鎖定錯誤的瞬態(tài),錯誤地指示文本非移動。由于這個原因,我們擴(kuò)展檢測器來給出上升和下降瞬態(tài)的差分輸出0=檢測的下降邊緣,1=?jīng)]有邊緣,2=檢測的上升邊緣。
下面解釋新的檢測器。
閾值/陡度檢測器檢測亮度信號何時交叉低閾值或高閾值。其結(jié)果是兩個1位信號。它們存儲在一個移位寄存器中,該寄存器可以得到三個樣本。
在下一步中,我們測量在3個象素中閾值是否交叉。通過將三個象素以前的1位信號與當(dāng)前比較,我們來完成這步。如果是這種情況,那么我們作后面的事情—如果亮度信號從高到低(首先交叉高閾值,并且在3個象素內(nèi)也交叉低閾值),那么我們使輸出信號為0;—如果亮度信號從低到高(首先交叉低閾值,并且在3個象素內(nèi)也交叉高閾值),那么我們使輸出信號為2;—在所有其它情況下,輸出信號為1。
為了在存儲器中存儲邊緣信息,我們假設(shè)線存儲器LM可以定位在處理器CP的本地緩存中。場存儲器必須在外部(SD)RAM中,這樣將影響存儲器帶寬。由于邊緣檢測ED只需要每象素2位,能夠?qū)⑺南笏氐倪吘墮z測器輸出封裝成—字節(jié)。在硬件應(yīng)用中,封裝/拆封非常便宜,并且在那種情況下,會超過存儲器帶寬的增加。
下面介紹關(guān)聯(lián)器C的操作。上述檢測器ED識別文本字符開始或結(jié)束(輸出0或2)的機(jī)率高的象素。關(guān)聯(lián)器C的目標(biāo)是確定象素是否符合文本,并且在我們處理文本的情況下,確定文本是靜止的還是移動的。為此,關(guān)聯(lián)器C將當(dāng)前線的檢測器ED的輸出refo,與空間上相同場中之前2條線的檢測器ED的輸出refpp1比較,并且與前置場之前1條線的檢測器ED的輸出refpp2比較。
首先,在文本出現(xiàn)的線中,在整個文本寬度上,通常有相對高密集度的檢測器輸出0或2。如果我們假設(shè)文本出現(xiàn),那么我們認(rèn)為在多數(shù)情況下,文本的限制將符合不同于1的首先和最后的檢測器輸出。從檢測器輸出中,我們可以這樣確定文本的長度。數(shù)據(jù)還可以用于設(shè)置文本識別檢測器輸出0或2的次數(shù)。
我們考慮這樣的事實(shí),即主要的文本字符趨于包含小的垂直線。由此,在文本出現(xiàn)的情況下,我們期待連續(xù)線檢測器ED輸出之間的很多相似。
在文本是靜止的情況下,與相同場在空間之前2條線的檢測器ED的輸出refpp1相比,當(dāng)前線檢測器ED的輸出refo會更好地匹配前置場之前一條線的檢測器ED的輸出refpp2。在隔行視頻信號中,refpp1對應(yīng)關(guān)于refo的相同場中的前置線。
相反,如果文本是移動的,那么與前置場在空間上之前一條線的檢測器ED的輸出refpp2相比,當(dāng)前線檢測器ED的輸出refo會更好地匹配相同場在空間上之前2條線的檢測器ED的輸出refpp1。
靜止文本的特點(diǎn)在于,從線m-1,場n-1到線m,場n匹配的瞬態(tài)頻率,與從線m-2,場n到線m,場n匹配的瞬態(tài)頻率是可比的。移動文本的特點(diǎn)在于,從線m-1,場n-1到線m,場n匹配的瞬態(tài)頻率,低于與從線m-2,場n到線m,場n匹配的瞬態(tài)頻率。
一個機(jī)構(gòu)可以加到文本檢測器中,來找出文本移動的速度。如果我們將正確的移動補(bǔ)償應(yīng)用在檢測器的輸出上,通過移動陣列refpp2[]中的索引,來計(jì)算當(dāng)前線檢測器的輸出與前置場之前1條線的一個檢測器如何頻繁地匹配,那么通過關(guān)聯(lián)器,移動文本將被看作是靜止文本。然后文本的速度符合refpp2[]索引的移動。
一個搜索機(jī)構(gòu)開始查找靜止文本。如果檢測到移動文本,那么速度增加一個象素/線。對于后面的文本線,當(dāng)前線檢測器ED的輸出refo與前置場在空間上之前1線的檢測器的一個refpp2如何頻繁匹配的計(jì)算,考慮了一個象素的移動補(bǔ)償。如果關(guān)聯(lián)器C仍然指示“移動文本”,那么對于下一個文本線檢測,速度進(jìn)一步增加一個象素。當(dāng)達(dá)到正確的速度時,這意味著速度*線之后,關(guān)聯(lián)器指示“靜止文本”。這個處理允許檢測幾條線中的文本和它的移動速度。
由于搜索機(jī)構(gòu)從“靜止文本”位置(速度=0)開始,對于適當(dāng)?shù)氖諗克俣人阉鳎P(guān)聯(lián)地知道文本在哪個方向上移動。如果我們假設(shè)足夠快地檢測到文本進(jìn)入畫面,那么根據(jù)文本被首先檢測到的窗口,我們知道文本從左側(cè)還是右側(cè)進(jìn)入屏幕。在那種情況下,我們還知道文本的滾動方向。另一種可能性是,在兩個連續(xù)場中,比較檢測從文本的第一象素和檢測為文本的最后象素的信息。
本發(fā)明的一方面可以如下概括,在視頻中,文本,特別是水平滾動文本,對移動補(bǔ)償處理(例如100Hz轉(zhuǎn)換)特別敏感。本發(fā)明的優(yōu)選實(shí)施例能夠檢測文本,并且通過邊緣檢測器ED和關(guān)聯(lián)器C的方式,確定它是靜止的還是移動的。特定的應(yīng)用還可以給出附加的信息,像文本的速度,它的高度或長度或它在屏幕上的位置。原理作用于隔行和逐行信號上,從關(guān)于不同時間(場/幀)的reffp2而不是refo和reffp1提供數(shù)據(jù)。本發(fā)明廣泛地涉及文本檢測,并且不限于滾動文本檢測(盡管移動文本檢測是優(yōu)選實(shí)施例)或電影模式背景上的視頻模式文本檢測(盡管本發(fā)明好象在此應(yīng)用中特別有用)。
應(yīng)該注意,上述實(shí)施例說明而不是限制了本發(fā)明,并且本領(lǐng)域的專家能夠設(shè)計(jì)出很多代替的實(shí)施例,而不必從所附權(quán)利要求書的領(lǐng)域中分離出來。在權(quán)利要求書中,放在圓括號中的任何參考符號不構(gòu)成本發(fā)明的限制。單詞“包括”不排除出現(xiàn)權(quán)利要求書中所列出那些以外的元素和步驟。元素前的“a”或“an”不排除出現(xiàn)多個這樣的元素。單詞“場”應(yīng)用于隔行和逐行視頻信號中?!按怪毕噜徫恢谩辈恍枰谙嗤膱鲋?。并且它們不需要在純垂直線上,而它們可以在有些傾斜的線上,或者前置場導(dǎo)致的邊緣檢測的水平位置,可以與當(dāng)前場導(dǎo)致的邊緣檢測的水平位置不同。本發(fā)明可以通過硬件的方式實(shí)現(xiàn),其中硬件包括幾個獨(dú)立元件,并且可以通過適當(dāng)編程的計(jì)算機(jī)實(shí)現(xiàn)。在設(shè)備權(quán)利要求書中列舉了幾種裝置,可以通過一項(xiàng)或相同項(xiàng)的硬件實(shí)施幾個這樣的裝置。在彼此不同的相關(guān)權(quán)利要求中陳述了適當(dāng)?shù)氖侄危@個唯一的事實(shí)不表示這些手段的組合不能被推薦使用。
權(quán)利要求
1.一種檢測在視頻信號(VS)中的文本的方法,該方法包括如下步驟檢測(ED)視頻信號(VS)中的高水平頻率,而得到水平邊緣檢測結(jié)果(refo,refpp1,refpp2);并且使在給定位置的水平邊緣檢測結(jié)果(refo)與在垂直相鄰位置的水平邊緣檢測結(jié)果(refpp1,refpp2)關(guān)聯(lián)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,進(jìn)一步包括步驟,測量水平邊緣檢測結(jié)果的密度,其中水平邊緣檢測結(jié)果指示瞬態(tài)。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,進(jìn)一步包括步驟,比較(PPU)場內(nèi)瞬態(tài)匹配頻率與場間瞬態(tài)匹配頻率,來區(qū)別靜止文本與移動文本。
4.一種檢測在視頻信號(VS)中的文本的設(shè)備,該設(shè)備包括用于檢測(ED)視頻信號(VS)中的高水平頻率而得到水平邊緣檢測結(jié)果(refo,refpp1,refpp2)的裝置;和使在給定位置的水平邊緣檢測結(jié)果(refo)與在垂直相鄰位置的水平邊緣檢測結(jié)果(refpp1,refpp2)關(guān)聯(lián)的裝置。
5.一種顯示裝置,包括根據(jù)權(quán)利要求4所述的設(shè)備(ED,C),用于檢測視頻信號(VS)中的文本;移動補(bǔ)償處理器(MCP),用于根據(jù)文本檢測設(shè)備的輸出(ED,C),對視頻信號(VS)移動補(bǔ)償處理;和顯示器(D),用于顯示移動補(bǔ)償處理器(MCP)的輸出。
全文摘要
在檢測視頻信號(VS)中的文本信息的方法中,視頻信號(VS)中高的水平頻率被檢測(ED),來得到水平邊緣檢測結(jié)果(refo,refpp1,refpp2),并且使在給定位置的水平邊緣檢測結(jié)果(refo)與在垂直鄰近位置的水平邊緣檢測結(jié)果(refpp1,refpp2)關(guān)聯(lián)。
文檔編號H04N5/44GK1366763SQ01800721
公開日2002年8月28日 申請日期2001年3月22日 優(yōu)先權(quán)日2000年3月31日
發(fā)明者M·M·P·尼科拉斯, M·W·紐溫惠岑, J·M·克特尼斯 申請人:皇家菲利浦電子有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
孟连| 高雄县| 富顺县| 米林县| 且末县| 神农架林区| 台北县| 三明市| 曲靖市| 于都县| 中西区| 行唐县| 淮安市| 吉隆县| 屏东县| 绥德县| 西乡县| 抚宁县| 蕉岭县| 孟津县| 安顺市| 中牟县| 普兰店市| 大冶市| 乌海市| 育儿| 吉安县| 白沙| 谢通门县| 文山县| 大庆市| 宁化县| 宁城县| 永胜县| 抚州市| 岐山县| 龙口市| 普安县| 丁青县| 凤翔县| 罗田县|