欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

使用音頻特征檢測視頻節(jié)目中的精彩部分的系統(tǒng)和方法

文檔序號:7651477閱讀:258來源:國知局
專利名稱:使用音頻特征檢測視頻節(jié)目中的精彩部分的系統(tǒng)和方法
技術(shù)領(lǐng)域
本發(fā)明通常直接涉及一種視頻回放設(shè)備,并且尤其涉及一種檢測和回放視頻節(jié)目例如體育節(jié)目中的精彩部分的系統(tǒng)。
本發(fā)明的背景在市場上有很多種種類的視頻回放設(shè)備。很多人都擁有或者熟悉視頻盒式記錄器(VCR),也被稱為視頻磁帶記錄器(VTR)。最近,在市場上已經(jīng)出現(xiàn)了使用計算機(jī)磁硬盤而不使用盒式磁帶來存儲視頻節(jié)目的視頻記錄器。例如,回放TVTM記錄器以及TiVOTM記錄器使用例如MPEG-2壓縮將電視節(jié)目數(shù)字的紀(jì)錄在硬盤驅(qū)動器上。此外,一些視頻回放設(shè)備也在可讀/寫數(shù)字通用盤(DVD)而不是在磁盤上進(jìn)行紀(jì)錄。
事實上每一個能夠放映視頻節(jié)目的系統(tǒng)都具有一個快進(jìn)模式和一個回放模式,允許觀眾能夠在紀(jì)錄的視頻節(jié)目中有選擇的進(jìn)行掃描。這些模式是非常節(jié)省時間的。很多人使用快進(jìn)(FF)以及回放(REW)觀看節(jié)目中有趣的部分(即,精彩部分)并且跳過包括廣告在內(nèi)的節(jié)目中的無趣的部分。在一個典型的情況下,球迷會使用快進(jìn)模式在一個非常短的時間內(nèi)對足球比賽進(jìn)行瀏覽,并且停止快進(jìn)模式以正常的速度來觀看有趣的比賽(例如進(jìn)球或者長傳)。
但是,這種節(jié)目觀看方法仍然需要大量的人機(jī)交互并且實際上是很偶然的。觀眾必須持續(xù)的監(jiān)視在快進(jìn)模式中的屏幕從而檢測有趣的事件。觀眾經(jīng)常在意識到有趣的內(nèi)容發(fā)生以前瀏覽過了有趣事件(例如一個進(jìn)球)的大部分,如果不是全部。觀眾必須輕輕的回放并且以正常的速度重放有趣的事件。
已經(jīng)有一些技術(shù)被引入從而自動的進(jìn)行在視頻節(jié)目中有選擇的觀看精彩部分(或者有趣的事件)的處理,只是受成功度的限制。這些現(xiàn)有技術(shù)的系統(tǒng)已經(jīng)使用了搜索與視頻節(jié)目相關(guān)的字庫的基于關(guān)鍵詞的方法,使用了尋找聲音分類的(即,語音,音樂,靜音)的基于聲音內(nèi)容的方法,以及視頻處理方法,該方法根據(jù),例如場景的變換自動的分列一個視頻節(jié)目。不幸的是,盡管對于人們而言,選擇視頻精彩部分是一項簡單的工作,但是自動的在視頻節(jié)目中檢測真正有趣的事件被證明為總是一件傾向于錯誤的過程,這需要大量的計算能量。
因此,在本技術(shù)中需要一種改進(jìn)的系統(tǒng)和方法,能夠在視頻節(jié)目中檢測有趣的事件。尤其是,需要一種能夠記錄視頻節(jié)目并且在紀(jì)錄的視頻節(jié)目中識別有趣的事件的視頻回放設(shè)備。更為尤其的是需要一種能夠在紀(jì)錄的視頻節(jié)目中識別精彩部分并且響應(yīng)于隨后觀眾的要求有選擇的回放精彩部分的視頻回放設(shè)備。
發(fā)明的概述為了彌補(bǔ)上面所述的現(xiàn)有技術(shù)的不足,本發(fā)明的一個首要目的是提供一種在視頻回放設(shè)備中使用的能夠回放紀(jì)錄在視頻回放設(shè)備的存儲介質(zhì)上的視頻節(jié)目的,一種用于檢測視頻節(jié)目中的精彩節(jié)目的裝置。根據(jù)本發(fā)明的一個優(yōu)選實施例,該裝置包括1)一個關(guān)鍵字檢測電路,能夠在視頻節(jié)目的音頻軌跡上檢測選定的關(guān)鍵字的位置;以及2)一個音頻信號能量電平檢測電路,能夠判斷接近選定關(guān)鍵字的檢測位置的音頻軌跡的音頻信號能量電平并將音頻信號能量電平與預(yù)定的門限值相比較。
根據(jù)本發(fā)明的一個實施例,音頻信號能量電平檢測電路,響應(yīng)于音頻信號能量電平超出預(yù)定門限值的判斷,將選定的關(guān)鍵字的檢測位置識別為節(jié)目精彩部分。
根據(jù)本發(fā)明的另一個實施例,關(guān)鍵字檢測電路包括一個封閉字幕檢測器,能夠捕捉視頻節(jié)目中封閉字幕文本以及一個處理器用于檢測捕捉的封閉字幕文本中的關(guān)鍵字。
根據(jù)本發(fā)明的另一個實施例,處理器通過比較捕捉的封閉字幕文本與多個存儲在與處理器相關(guān)聯(lián)的存儲器中的關(guān)鍵字來檢測捕捉的封閉字幕中的關(guān)鍵字。
根據(jù)本發(fā)明的另一個實施例,關(guān)鍵字檢測電路包括一個音頻處理器,能夠執(zhí)行語音識別應(yīng)用程序,該程序能夠?qū)⒃谝纛l軌跡中檢測到的語音字轉(zhuǎn)換成文本字,并且其中的音頻處理器進(jìn)一步能夠檢測轉(zhuǎn)換的文本字中的關(guān)鍵字。
根據(jù)本發(fā)明的另一個實施例,音頻處理器通過比較轉(zhuǎn)換的文本字與多個存儲在與處理器相關(guān)聯(lián)的存儲器中的關(guān)鍵字檢測轉(zhuǎn)換的文本字中的關(guān)鍵字。
根據(jù)本發(fā)明的另一個實施例,音頻信號能量電平檢測電路通過在接近選定的關(guān)鍵字的檢測位置上在一個窗口中判斷平均音頻信號能量電平來判斷音頻軌跡的音頻信號能量電平。
根據(jù)本發(fā)明的另一個實施例,音頻信號能量電平檢測電路通過判斷在選定的關(guān)鍵字的檢測位置之前的節(jié)目精彩部分的開始點以及判斷在選定的關(guān)鍵字的檢測位置之后的節(jié)目精彩部分的終止點來將選定的關(guān)鍵字的檢測位置識別為節(jié)目精彩部分。
本發(fā)明的另一個主要目的是提供一種在視頻節(jié)目中檢測節(jié)目精彩部分的裝置,它不需要使用關(guān)鍵字檢測電路。在本發(fā)明的一個實施例中,該裝置包括1)一個音頻信號能量檢測電路,能夠檢測音頻軌跡中N個連續(xù)的段落的音頻信號能量電平并且比較音頻信號能量電平與一個預(yù)定的門限值。音頻信號能量電平檢測電路,響應(yīng)于音頻信號能量電平超出預(yù)定門限值的判斷,將N個連續(xù)的段落識別為節(jié)目精彩部分。在一個典型的實施例中,節(jié)目精彩部分是通過對平均音頻信號能量電平超出預(yù)定的門限值的N個連續(xù)的段落的判斷而識別出來的。
前面已經(jīng)廣泛的概述了本發(fā)明的特征和技術(shù)優(yōu)勢從而使得本領(lǐng)域的技術(shù)人員能夠更好的理解后面的詳細(xì)描述。本發(fā)明的附加的特征和優(yōu)點將在以后進(jìn)行描述從而形成本發(fā)明的權(quán)利要求的主題。本領(lǐng)域的技術(shù)人員可以知道他們可以使用公開的概念和特定的實施例作為基礎(chǔ)從而改變或者設(shè)計其它的結(jié)構(gòu)用于執(zhí)行本發(fā)明的同樣目的。本領(lǐng)域的技術(shù)人員也可以以其廣播形式在不背離本發(fā)明的精神和范圍內(nèi)實現(xiàn)同等的結(jié)構(gòu)。
在進(jìn)行詳細(xì)描述以前,最好是解釋一下在本專利文件中使用的特定的詞語和短語的含義單詞“include”和“comprising”,以及它們的變形,表示非限制性的包括;單詞“or”,是包含的,意思是和/或;短語“associated with”和“associated therewith”以及它們的變形,表示包括,被包括,被包含于其中,包含,被包含,與之相連,與之相耦合,與之相連,合作,插入,并列,接近,圍繞,有,有特性,或者類似的意思;以及單詞“controller”表示任何設(shè)備,系統(tǒng)或者其中能夠至少控制一個操作的部分,這樣的設(shè)備能夠以硬件,軟件硬件相結(jié)合,軟件來實現(xiàn),或者至少其中的兩種相結(jié)合來實現(xiàn)。應(yīng)當(dāng)注意與任何特定的控制器相聯(lián)的功能可以集中或者分散的實現(xiàn),通過本地或者遠(yuǎn)程。尤其是,一個控制器可以包括一個或者多個數(shù)據(jù)處理器,并且相聯(lián)的輸入/輸出設(shè)備,存儲器,執(zhí)行一個或多個應(yīng)用程序和/或操作系統(tǒng)程序。對于每一個特定的詞語和短語的定義是提供于整個專利文件當(dāng)中的,本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)明白在許多,如果不是多數(shù)情況下,這樣定義的詞語和短語的特征使用中,這樣的定義也應(yīng)用于現(xiàn)有技術(shù)。
附圖的簡要描述為了更加完整的理解本發(fā)明以及本發(fā)明的優(yōu)點,下面的描述將結(jié)合隨后的附圖一起作為參考,其中同樣的數(shù)字表示同樣的對象,其中附

圖1示出了根據(jù)本發(fā)明的一個實施例的典型的視頻回放設(shè)備和電視機(jī);附圖2示出了根據(jù)本發(fā)明的一個實施例的更為詳細(xì)的典型的視頻回放設(shè)備;附圖3示出了根據(jù)本發(fā)明的一個實施例中的存儲在典型的視頻回放設(shè)備上的硬盤驅(qū)動器上的典型的視頻節(jié)目;以及附圖4示出了根據(jù)本發(fā)明的一個實施例的典型視頻回放設(shè)備的操作流程圖。
本發(fā)明的詳細(xì)描述在本專利文件中,下面描述的附圖1-4,以及用于描述本發(fā)明的原則的各種實施例僅是以示例的方式進(jìn)行描述,這些不應(yīng)被用于限制本發(fā)明的范圍。本領(lǐng)域的技術(shù)人員將會明白本發(fā)明的原則可以通過任何合適配置的視頻回放設(shè)備來實現(xiàn)。
附圖1描繪了根據(jù)本發(fā)明的一個實施例的典型視頻回放設(shè)備150以及電視機(jī)105。視頻回放設(shè)備150從諸如有線電視服務(wù)提供商(CableCo.),本地天線,互聯(lián)網(wǎng),或者DVD或VHS磁帶播放器的外部源接收輸入的電視信號,并向電視機(jī)105傳送一個觀眾選定的頻道。在紀(jì)錄模式中,視頻回放設(shè)備150可以解調(diào)輸入的射頻(RF)電視信號,產(chǎn)生一個基帶電視信號,這個基帶信號將被記錄或存儲在視頻回放設(shè)備150內(nèi)的或與之相連的存儲介質(zhì)中。在播放模式中,視頻回放設(shè)備150從存儲介質(zhì)讀取用戶選擇的存儲的基帶視頻信號(即,節(jié)目),并將其傳送給電視機(jī)105。
例如,如果視頻回放設(shè)備150是一個視頻盒式記錄器(VCR),也被稱為視頻磁帶記錄器(VTR),視頻回放設(shè)備150則將輸入的電視信號存儲在磁式盒帶上并從磁式盒帶中重新獲得存儲的電視信號。如果視頻回放設(shè)備150為一個基于盤驅(qū)動的設(shè)備,例如一個回放電視記錄器或者一個TiVOTM記錄器,視頻回放設(shè)備150將輸入的電視信號存儲在計算機(jī)磁式硬盤上,而不是磁式盒帶上,并且從硬盤上重新得到存儲的電視信號。在另一個實施例中,視頻回放設(shè)備150可以存儲并從本地讀/寫(R/W)數(shù)字通用盤或讀寫(R-W)CD-ROM中重新獲得信號。這樣,本地存儲介質(zhì)可以是固定的(即,硬盤驅(qū)動器)或可移動的(即,DVD,CD-ROM)。
視頻回放設(shè)備150包括紅外傳感器(IR)160,它接收用戶從遠(yuǎn)程控制設(shè)備發(fā)出的命令(例如,增大頻道,減小頻道,聲音增大,聲音減小,記錄,播放,快進(jìn)(FF),回放(REW)以及類似的)。電視機(jī)105是一個傳統(tǒng)的電視,包括屏幕110,紅外傳感器(IR)115,以及一個或多個手動控制120(以虛線所包圍的)。IR傳感器115也接收來自用戶的遠(yuǎn)程控制設(shè)備發(fā)出的命令(例如,聲音增加,聲音減小,電源開/關(guān))。
應(yīng)當(dāng)注意,視頻回放設(shè)備150并不限于從特定類型的源中接收特定類型的輸入電視信號。如上所述,外部源可以是一個有線服務(wù)提供商,一個傳統(tǒng)的RF廣播天線,一個蝶形衛(wèi)星,一個互聯(lián)網(wǎng)連接,或者其他諸如DVD播放器或者VHS磁帶播放器的本地存儲設(shè)備。在一些實施例中,視頻回放設(shè)備150甚至可能不能紀(jì)錄,但是限于能夠回放從可移動的DVD或CD-ROM得到的電視信號。這樣,輸入的信號可以是一個數(shù)字信號,一個模擬信號,或者互聯(lián)網(wǎng)協(xié)議包(IP)。但是,為了簡化并清楚的解釋本發(fā)明的原則,下文的描述將直接涉及視頻回放設(shè)備150從有線服務(wù)商接收輸入電視信號(模擬的和/或數(shù)字的)的實施例。但是,本領(lǐng)域的技術(shù)人員將明白本發(fā)明的原則也適用于無線廣播電視信號,本地存儲系統(tǒng),包含MPEG數(shù)據(jù)的IP包輸入流,以及類似的系統(tǒng)。
附圖2描繪了更為詳細(xì)的根據(jù)本發(fā)明的一個實施例的典型視頻回放設(shè)備150。視頻回放設(shè)備150包括IR傳感器160,視頻處理器210,MPEG2編碼器220,硬盤驅(qū)動器230,MPEG2解碼/NTSC編碼器240,以及視頻記錄控制器(VR)250。視頻回放設(shè)備150進(jìn)一步包括封閉字幕檢測器(CC)260,音頻處理器270,以及存儲器280。VR控制器250指揮視頻回放設(shè)備150的整個操作,包括觀看模式,記錄模式,播放模式,快進(jìn)(FF)模式,回放模式(REW),以及其他。根據(jù)本發(fā)明的原則,視頻回放設(shè)備150也提供一種掃描模式,該模式能夠回放從視頻節(jié)目中選定的精彩部分,下文將詳細(xì)描述。
在觀看模式中,VR控制器250使來自于有線服務(wù)提供商的輸入電視信號解調(diào)制以及被視頻處理器210所處理,然后被傳送到電視機(jī)105,而不存儲或從硬盤驅(qū)動器230中重新獲得信號。視頻處理器210包括射頻(RF)前端電路,用于從有線服務(wù)提供商接收輸入的電視信號,將其調(diào)諧到用戶選定的頻道,并且將選定的RF信號轉(zhuǎn)換到適于在電視105上顯示的基帶電視信號(例如超級視頻信號)。視頻處理器210也能夠在播放模式中從MPEG2解碼器/NTSC編碼器240接收傳統(tǒng)的NTSC電視信號并將基帶電視信號傳送到電視機(jī)105。
在紀(jì)錄模式中,VR控制器250使輸入的電視信號存儲在硬盤驅(qū)動器230上。在VR控制器250的控制下,MPEG2編碼器220接收有線服務(wù)商提供的輸入電視信號并轉(zhuǎn)換接收的RF信號為MPEG格式并將其存儲在硬盤驅(qū)動器230上。在播放模式中,VR控制器250指揮硬盤驅(qū)動器230使存儲的電視信號(即,節(jié)目)流向MPEG2解碼器/NTSC編碼器240,240將來自于硬盤驅(qū)動器230的MPEG2數(shù)據(jù)轉(zhuǎn)換成例如被傳送到電視機(jī)105的超級視頻信號(S-Video)。應(yīng)當(dāng)注意對于MPEG2編碼器220和MPEG2解碼器/NTSC編碼器240選擇MPEG2標(biāo)準(zhǔn)只是一種示例。在本發(fā)明的替代實施例中,MPEG編碼器和解碼器可以遵照一個或者多個MPEG1,MPEG2,MPEG4和MPEG7標(biāo)準(zhǔn)。
為了申請和隨后的權(quán)利要求的目的,硬盤驅(qū)動器230被定義為包括任何大型的既可讀又可寫的存儲設(shè)備,包括傳統(tǒng)的磁盤驅(qū)動器以及用于讀寫數(shù)字通用盤(DVD-RW)的光盤驅(qū)動器,可擦寫CD-ROMs,VCR磁帶和類似的設(shè)備。實際上,硬盤驅(qū)動器230并不需要固定于永久性嵌入到視頻回放設(shè)備150中的傳統(tǒng)的概念。而且,硬盤驅(qū)動器230包括任何大型的存儲設(shè)備能夠為了存儲紀(jì)錄的視頻節(jié)目而應(yīng)用于視頻回放設(shè)備150。這樣,硬盤驅(qū)動器230可以包括一個附加的外部設(shè)備或者可移動的盤驅(qū)動設(shè)備(嵌入或者外部附加),例如容納讀寫DVDs或者只讀CD-ROMs的自動唱片點唱設(shè)備。而且,在本發(fā)明的一個優(yōu)化實施例中,硬盤驅(qū)動器230可以包括視頻回放設(shè)備150可以通過網(wǎng)絡(luò)連接(例如,互聯(lián)網(wǎng)協(xié)議(IP)連接)訪問和控制的外部大型存儲設(shè)備,包括,例如,在用戶的家中個人電腦(PC)上的盤驅(qū)動器,或者在用戶的互聯(lián)網(wǎng)服務(wù)提供商(ISP)的服務(wù)器上的盤驅(qū)動器。
在播放模式中,VR控制器250可以通過IR傳感器160接收來自于用戶的掃描命令。在掃描模式中,視頻回放設(shè)備150能夠僅回放從存儲在硬盤驅(qū)動器230上的視頻節(jié)目(例如運動節(jié)目)中抽取的精彩部分。為了實現(xiàn)上述功能,視頻回放設(shè)備150可以在視頻節(jié)目正在被記錄在硬盤驅(qū)動器230上的時候(或者在其已被記錄以后)對該視頻節(jié)目進(jìn)行分析,并且使用基于文本的搜索和選擇音頻特征的組合來自動的檢測和標(biāo)記視頻節(jié)目中的精彩部分。在接下來的掃描模式中,視頻回放設(shè)備檢測標(biāo)記的存儲視頻節(jié)目的精彩部分并且僅抽取標(biāo)記的精彩部分用于在電視105上播放。
在本發(fā)明的一個典型的實施例中,存儲器280可以包括一個隨機(jī)訪問存儲器(RAM),用于存儲語音識別程序282和關(guān)鍵字(KW)庫284。語音識別程序282包括由音頻處理器270執(zhí)行的程序指令,其用于在視頻節(jié)目的音頻軌跡上檢測語音字并將檢測到的語音字轉(zhuǎn)換為文本字。音頻處理器270然后比較文本字與選定的存儲在關(guān)鍵字庫284中的關(guān)鍵字。當(dāng)一場比賽開始的時候,音頻處理器270在硬盤驅(qū)動器230上存儲一個與存儲的視頻節(jié)目相應(yīng)部分相關(guān)的關(guān)鍵字識別符。就運動節(jié)目而言,關(guān)鍵字包括諸如進(jìn)球,套袋,截取,漏接,射門得分,本壘打,跑分,三壘打,盜壘,三分,連續(xù)進(jìn)攻,快攻,暫停,得分,救球,集中攻勢,三擊手退場,以及類似的詞語和短語。
在本發(fā)明的一個替代實施例中,音頻處理器270可以使用從封閉字幕(CC)檢測器260獲得的文本識別視頻節(jié)目中的關(guān)鍵字。封閉字幕檢測器260接收MPEG2解碼器/NTSC編碼器240的輸出視頻流,并檢測NTSC輸出信號中的CC文本。CC文本通常被插入在視頻信號的垂直消隱期間的第21行的末尾。CC檢測器260使用與CC數(shù)據(jù)的每一行相關(guān)的時標(biāo)識別與CC文本相應(yīng)的視頻節(jié)目的段。CC檢測器260將CC文本的每一行以及時標(biāo)傳輸給音頻處理器270。音頻處理器270然后比較CC文本字與選定的存儲在關(guān)鍵字庫284(KW)中的關(guān)鍵字。當(dāng)一場比賽開始的時候,音頻處理器270將與由時標(biāo)識別的存儲視頻節(jié)目的相應(yīng)的段相關(guān)的關(guān)鍵字識別符存儲在硬盤驅(qū)動器230上。
在實際的運動廣播中,許多關(guān)鍵字是用在主持人之間的日常談話中的,而不是用在可能發(fā)生精彩事件的過程中。這就導(dǎo)致出現(xiàn)了大量的“false positive”,其中音頻處理器270會將關(guān)鍵字標(biāo)識符附加給不與精彩部分相對應(yīng)的存儲的視頻節(jié)目的段落中。為了減少“falsepositive”的數(shù)量,音頻處理器270也要分析存儲的視頻節(jié)目的音頻軌跡,從而識別在存儲的視頻節(jié)目中與標(biāo)識的關(guān)鍵字的發(fā)生相對應(yīng)的高的音頻能量(例如,喧鬧聲)的期間。
音頻軌跡信息已被有效的用于識別,分類以及將視頻流分割成具有特定語義特征的段落中。它已被用于基于演講人的新聞節(jié)目的段落以及通過語音識別發(fā)現(xiàn)關(guān)鍵字。音頻數(shù)據(jù)也可被有效的應(yīng)用于內(nèi)容索引中,因為與視頻處理相比,它需要非常少的處理能量和存儲空間。
音頻處理器270首先執(zhí)行音頻軌跡信息的文本搜索。該步驟通常得到一長列的候選名單(即,包含特定關(guān)鍵字的節(jié)目段落)。如上所述,許多這些段落并不表示一個實際的精彩部分,因為評論員經(jīng)常使用這些詞參考先前的游戲或比賽。音頻處理器270然后使用來自于每一個檢測關(guān)鍵字周圍的段落附近的音頻信號特性來判斷是真正的精彩部分還是“false positive”。
在本發(fā)明的一個典型實施例中,音頻處理器270在一秒鐘長的段落中處理音頻軌跡信息。音頻處理器270計算音頻刺激電平,X(A),作為每一段落的平均絕對幅度。如果A是一個音頻信號,刺激電平,X(A)=AVG(ABS)(A)),其中ABS是絕對值函數(shù)。接下來,音頻處理器270使用一個滑動窗口,例如,five(5)segments(等于5秒鐘),來計算平均長度,因為在多數(shù)情況下真正有趣的事件(即,精彩部分)通常會持續(xù)至少5秒鐘。然后,平均刺激電平高于特定門限值的5秒鐘段落的組合被合并形成一個精彩序列,并作為精彩部分在硬盤驅(qū)動器230上被標(biāo)識(標(biāo)記)。在一個典型實施例中,音頻處理器270可以使用整個節(jié)目(即,對于一個運動節(jié)目一般為2-3小時)中最大值的一半作為門限值。在另一個替代實施例中,音頻處理器270可以使用節(jié)目的延長部分的最大值的一半作為門限值,例如,視頻節(jié)目塊的10或15分鐘。
本發(fā)明可被用于與非運動節(jié)目的結(jié)合中,例如從一個脫口秀節(jié)目中抽取精彩部分(即,笑話)。為了檢測笑話或者其他的精彩部分,音頻處理器270可以使用一個基于音頻運算法則的變量大致從一個脫口秀中找到最好的“笑話”。例如,音頻處理器270可以使用一個標(biāo)準(zhǔn)的刺激電平,NX(A),來檢測記錄在一個演播室環(huán)境中的低電平的笑聲效果,其中NX(A)=AVG(ABS(A)/MAX(ABS(A))并且其中ABS是一個絕對值函數(shù)。音頻處理器270再次為每一個一秒鐘長度的非重疊窗口計算該值,并找出最大值作為候選。在一個第二通道中,音頻處理器270可以消除在節(jié)目段落開始或結(jié)束時的孤立的峰值以及發(fā)生在廣告期間的峰值。
附圖3示出了根據(jù)本發(fā)明的一個實施例存儲在硬盤驅(qū)動器230上的典型的視頻節(jié)目300。在視頻節(jié)目300中的典型的精彩部分已被音頻處理器270所識別并標(biāo)記,用于由視頻回放設(shè)備150在掃描模式中順序回放。視頻節(jié)目300包括多個連續(xù)的一秒鐘的段落,S0到Sn。兩個典型的關(guān)鍵字的位置KW1和KW2已被表示出來。KW1大致發(fā)生在視頻節(jié)目300的4分16秒(即,256秒),在段落S256和S258交界的地方。KW2大致發(fā)生在視頻節(jié)目300的15分18秒,在段落S918和S919交界的地方。
音頻處理器270的判斷結(jié)果是在KW1和KW2周圍的音頻能量電平超過了預(yù)定的門限電平,如上所述,音頻處理器270將段落S252和S261識別為精彩部分(標(biāo)記為精彩部分1)并將段落S914和S923識別為精彩部分(標(biāo)記為精彩部分2)。在掃描模式中,視頻回放設(shè)備150直接跳到(或快進(jìn))精彩部分1(而不是以段落S0開始)并以正常的速度播放精彩部分1(即,S252-S261)。在精彩部分1播放以后,視頻回放設(shè)備150跳過(或快進(jìn))精彩部分1與精彩部分2之間的段落S262-S913,并以正常的速度播放精彩部分2(即,S914-S923)。
在典型的視頻節(jié)目300中,精彩部分1和2的長度(即,10秒鐘)僅是一個示例。在替代實施例中,音頻處理器270可以識別與關(guān)鍵字有關(guān)的長于或者短于典型的10秒鐘的精彩部分作為精彩部分。例如,音頻處理器270可以識別精彩部分為20秒,30秒,或者用戶定義的長度。此外,關(guān)鍵字也不需要位于精彩部分的中點。例如,音頻處理器270可以識別一個30秒的精彩部分,在高信號能量電平的期間中前面進(jìn)行了20秒,在關(guān)鍵字發(fā)生以后再進(jìn)行10秒。
最后,由音頻處理器270識別的精彩部分的長度不需要與環(huán)繞關(guān)鍵字的高音頻信號能量電平的周期長度相一致。在上面的描述中,音頻處理器270在平均音頻刺激電平超過預(yù)定的門限電平的期間尋找一個與關(guān)鍵字的發(fā)生相符合的5秒的窗口。但是,一旦音頻處理器270檢測到了這樣的一個5秒鐘的窗口并且判斷出發(fā)生了一個精彩部分,音頻處理器270可以定義一個精彩部分,前面發(fā)生了20秒,在關(guān)鍵字以后繼續(xù)進(jìn)行10秒。以這種方式,視頻回放設(shè)備150可以回放一個相對低的音頻刺激直至精彩事件的發(fā)生這樣的一個期間。
附圖3描繪了流程圖400,它示出了根據(jù)本發(fā)明的一個實施例典型的視頻回放設(shè)備150的操作流程。當(dāng)視頻回放設(shè)備150在硬盤驅(qū)動器230上記錄視頻節(jié)目的時候產(chǎn)生和觀看視頻精彩部分的步驟就開始了(處理步驟405)。視頻回放設(shè)備150可以在編程的時間記錄視頻節(jié)目,或者與觀眾通過遠(yuǎn)程控制手動的記錄命令相響應(yīng)。接下來,音頻處理器270在紀(jì)錄的視頻節(jié)目的音頻軌跡上檢測關(guān)鍵字。關(guān)鍵字可以通過比較由語音識別程序282檢測的詞與存儲在關(guān)鍵字庫284中的詞進(jìn)行,或者通過比較從封閉字幕檢測器260接收的文本與存儲在關(guān)鍵字庫284中的詞來進(jìn)行。音頻處理器270可以檢測視頻節(jié)目記錄期間的關(guān)鍵詞(即,實時的),或者檢測視頻節(jié)目記錄以后的關(guān)鍵詞(即,延時的)(處理步驟410)。
在每一個關(guān)鍵字發(fā)生的位置,音頻處理器270比較位于每一個關(guān)鍵字周圍的可變尺寸的窗口中的音頻信號的能量與預(yù)定的門限值,如前所述(處理步驟415)。如果窗口中的音頻信號能量電平超過了門限值,音頻處理器270將關(guān)鍵字的位置識別為視頻節(jié)目關(guān)鍵部分(處理步驟420)。為了將關(guān)鍵字的位置識別為精彩部分,音頻處理器270可以在視頻節(jié)目的每一個精彩部分的始點和終點插入可測的標(biāo)記(符號)。如果已紀(jì)錄的視頻節(jié)目被存儲在硬盤上,音頻處理器將通過將每一個精彩部分的起點地址和終點地址存儲在一個與視頻節(jié)目相關(guān)的數(shù)據(jù)文件中的方式來識別每一個精彩部分的位置。如上所述,對于檢測到的關(guān)鍵字的位置而言精彩部分的長度和位置是可變的。在一個優(yōu)選實施例中,精彩部分的長度和位置可以由用戶通過由VR控制器控制的電視105的圖形用戶接口而改變。最后,在掃描模式中,視頻回放設(shè)備150僅從硬盤驅(qū)動器230中得到視頻節(jié)目精彩部分用于在電視105上回放(處理步驟425)。
盡管本發(fā)明已經(jīng)作為較為詳盡的描述,但是本領(lǐng)域的技術(shù)人員應(yīng)該明白它們可以以廣播的形式再不被例本發(fā)明的精神和范圍內(nèi)作各種變形、置換和改造。
權(quán)利要求
1.用于在視頻回放設(shè)備(150)中使用的能夠回放存儲在所述的視頻回放設(shè)備(150)中的存儲介質(zhì)(230)中的視頻節(jié)目的一種用于在所述的視頻節(jié)目中檢測節(jié)目精彩部分的裝置包括一個關(guān)鍵字檢測電路(260,270,280),能夠在所述的視頻節(jié)目的音頻軌跡上檢測選定的關(guān)鍵字的位置;以及一個音頻信號能量電平檢測電路(270),能夠判斷接近所述的選定關(guān)鍵字的所述的檢測位置的所述音頻軌跡的音頻信號能量電平,并將所述的音頻信號能量電平與預(yù)定的門限值相比較。
2.一種如權(quán)利要求1所述的裝置,其中所述的音頻信號能量電平檢測電路(270),響應(yīng)于所述音頻信號能量電平超出所述預(yù)定門限值的判斷,將所述選定的關(guān)鍵字的所述檢測位置識別為節(jié)目精彩部分。
3.一種如權(quán)利要求2所述的裝置,其中所述的關(guān)鍵字檢測電路(260,270,280)包括一個封閉字幕檢測器(260),能夠捕捉所述的視頻節(jié)目中的封閉字幕文本以及一個處理器(270)用于檢測所述的捕捉的封閉字幕文本中的關(guān)鍵字。
4.一種如權(quán)利要求3所述的裝置,其中所述的處理器(270)通過比較所述捕捉的封閉字幕文本與多個存儲在與所述處理器相關(guān)聯(lián)的存儲器中的關(guān)鍵字來檢測所述捕捉的封閉字幕中的所述關(guān)鍵字。
5.一種如權(quán)利要求2所述的裝置,其中所述的關(guān)鍵字檢測電路(260,270,280)包括一個音頻處理器(270),能夠執(zhí)行語音識別應(yīng)用程序,該程序能夠?qū)⒃谒龅囊纛l軌跡中檢測到的語音字轉(zhuǎn)換成文本字,并且其中所述的音頻處理器(270)進(jìn)一步能夠檢測所述的轉(zhuǎn)換的文本字中的關(guān)鍵字。
6.一種如權(quán)利要求5所述的裝置,其中所述的音頻處理器(270)通過比較所述的轉(zhuǎn)換的文本字與多個存儲在與所述處理器(270)相關(guān)聯(lián)的存儲器中的關(guān)鍵字檢測所述轉(zhuǎn)換的文本字中的所述關(guān)鍵字。
7.一種如權(quán)利要求2所述的裝置,其中所述的音頻信號能量電平檢測電路(270)通過在接近所述選定的關(guān)鍵字的所述檢測位置上在一個窗口中判斷平均音頻信號能量電平來判斷所述音頻軌跡的所述音頻信號能量電平。
8.一種如權(quán)利要求2所述的裝置,其中所述的音頻信號能量電平檢測電路(270)通過判斷在所述選定的關(guān)鍵字的所述檢測位置之前的所述節(jié)目精彩部分的開始點以及判斷在所述選定的關(guān)鍵字的所述檢測位置之后的所述節(jié)目精彩部分的終止點來將所述選定的關(guān)鍵字的所述檢測位置識別為節(jié)目精彩部分。
9.一種視頻設(shè)備(150),包括一個存儲設(shè)備(230),其上能夠存儲多個視頻節(jié)目;一個視頻記錄電路(220),能夠接受輸入的視頻節(jié)目并且在所述的存儲設(shè)備上存儲所述的輸入視頻節(jié)目;以及進(jìn)一步包括權(quán)利要求1所述的裝置的所述視頻回放設(shè)備。
10.用于一種視頻回放設(shè)備(150)中的能夠回放紀(jì)錄在所述的視頻回放設(shè)備(150)上的存儲介質(zhì)中的視頻節(jié)目,一種用于在所述的視頻節(jié)目中檢測節(jié)目精彩部分的方法,包括步驟在視頻節(jié)目的所述的音頻軌跡上檢測選定的關(guān)鍵字的位置;判斷接近選定的關(guān)鍵字的檢測位置的音頻軌跡上的音頻信號能量電平;比較音頻信號能量電平與預(yù)定的門限值。
11.一種如權(quán)利要求10所述的方法,包括步驟判斷是否音頻信號能量電平超過了預(yù)定的門限值;以及響應(yīng)于音頻信號能量電平超出預(yù)定的門限值的判斷,將選定的關(guān)鍵字的選定位置識別為節(jié)目精彩部分。
12.如權(quán)利要求11所述的方法,其中檢測關(guān)鍵字的位置包括步驟捕捉視頻節(jié)目中的封閉字幕文本;以及在捕捉的封閉字幕文本中檢測關(guān)鍵字。
13.如權(quán)利要求12所述的方法,其中在捕捉的封閉字幕文本中檢測關(guān)鍵字的步驟包括比較捕捉的封閉字幕文本與多個存儲在與視頻回放設(shè)備(150)相連的關(guān)鍵字庫的關(guān)鍵字的子步驟。
14.如權(quán)利要求13所述的方法,其中檢測關(guān)鍵字的位置的步驟包括子步驟執(zhí)行語音識別應(yīng)用程序,將在音頻軌跡中檢測的語音字轉(zhuǎn)換成文本字;以及在轉(zhuǎn)換的文本字中檢測關(guān)鍵字。
15.如權(quán)利要求14所述的方法,其中在轉(zhuǎn)換的文本字中檢測關(guān)鍵字的步驟包括比較轉(zhuǎn)換的文本字與多個存儲在與視頻回放設(shè)備(150)的關(guān)鍵字庫中的關(guān)鍵字的子步驟。
16.如權(quán)利要求11所述的方法,其中判斷音頻信號能量電平的步驟包括在接近選定關(guān)鍵字的檢測位置的窗口中判斷平均音頻信號能量電平的子步驟。
17.用于在視頻回放設(shè)備(150)中使用的能夠回放存儲在所述的視頻回放設(shè)備(150)中的存儲介質(zhì)(230)中的視頻節(jié)目的一種用于在所述的視頻節(jié)目中檢測節(jié)目精彩部分的裝置包括一個音頻信號能量檢測電路(270),能夠檢測所述的音頻軌跡中N個連續(xù)的段落的音頻信號能量電平并且比較所述的音頻信號能量電平與一個預(yù)定的門限值。
18.如權(quán)利要求17所述的裝置,其中所述的音頻信號能量電平檢測電路(270),響應(yīng)于音頻信號能量電平超出預(yù)定門限值的判斷,將所述的N個連續(xù)的段落識別為節(jié)目精彩部分。
19.如權(quán)利要求18所述的裝置,其中所述的音頻信號能量電平檢測電路(270)通過判斷所述的N個連續(xù)段落的平均音頻信號能量電平來判斷所述音頻軌跡的所述音頻信號能量電平。
全文摘要
這里公開了一種用于檢測視頻節(jié)目中的精彩節(jié)目的裝置。該裝置包括1)一個關(guān)鍵字檢測電路用于在視頻節(jié)目的音頻軌跡上檢測選定的關(guān)鍵字的位置;以及2)一個音頻信號能量電平檢測電路,用于檢測接近選定的關(guān)鍵字的檢測位置的音頻軌跡的音頻信號能量電平并將音頻信號能量電平與預(yù)定的門限相比較。音頻信號能量電平檢測電路,響應(yīng)于音頻信號能量電平超過預(yù)定的門限的判斷,將選定的關(guān)鍵字的檢測位置定義為節(jié)目精彩部分。
文檔編號H04N5/76GK1404609SQ01805388
公開日2003年3月19日 申請日期2001年10月16日 優(yōu)先權(quán)日2000年10月30日
發(fā)明者S·達(dá)格塔斯 申請人:皇家菲利浦電子有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
延津县| 宜阳县| 错那县| 邵武市| 曲靖市| 磴口县| 南开区| 嵩明县| 邢台县| 增城市| 昌黎县| 乌恰县| 祁东县| 洪江市| 廉江市| 洛阳市| 永修县| 平山县| 焦作市| 辉南县| 萨迦县| 鄂托克旗| 怀远县| 崇阳县| 岗巴县| 渑池县| 浙江省| 五大连池市| 泽库县| 平山县| 思茅市| 靖安县| 南雄市| 磐安县| 读书| 淮阳县| 洪江市| 辽宁省| 调兵山市| 亳州市| 湛江市|