本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別涉及一種視頻聲音與圖像同步的方法及裝置。
背景技術(shù):
隨著科學(xué)技術(shù)的發(fā)展,視頻等多媒體格式的信息數(shù)據(jù)越來越豐富,而其后臺數(shù)據(jù)編輯的工作量也越來越大,尤其是在時限性很強(qiáng)的新聞等行業(yè)中,對于視頻數(shù)據(jù)編輯的精準(zhǔn)性和編輯效率要求很高。在視頻數(shù)據(jù)編輯的過程中,視頻聲音和圖像的同步是必須要處理的問題,而在現(xiàn)有技術(shù)的方案中,由于編輯系統(tǒng)中的音頻文件通常是一旦加載之后就開始播放的,而視頻中提取的圖像的時間和音頻的時間并未自動對齊,因此在進(jìn)行自動播放時,播放的聲音與顯示的圖像往往不是屬于同一個時間段;而在進(jìn)行同步編輯時,只有當(dāng)編輯人員單擊了圖像才會觸發(fā)對應(yīng)時段內(nèi)的音頻,這樣需要編輯人員將音視頻分為一段一段逐個進(jìn)行檢查之后,才能找到不同步的位置并對其進(jìn)行編輯,操作十分復(fù)雜且工作效率低、操作時間長。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種視頻聲音與圖像同步的方法及裝置,用以減少聲音與圖像同步操作過程中的工作量,節(jié)約工作時間,提高工作效率。
根據(jù)本發(fā)明實(shí)施例的第一方面,提供一種視頻聲音與圖像同步的方法,包括:
接收到同步編輯指令后,檢測當(dāng)前播放聲音在正在播放的音頻中的播放時間;
根據(jù)所述播放時間及所述音頻中預(yù)先劃分的聲音時間區(qū)段,檢測所述播放時間在所述音頻中所屬的聲音時間區(qū)段;
調(diào)取與所述音頻中的所述聲音時間區(qū)段預(yù)先關(guān)聯(lián)的視頻關(guān)鍵幀,并在所述音頻的所述聲音時間區(qū)段的聲音播放過程中顯示所述視頻關(guān)鍵幀的圖像。
在一個實(shí)施例中,所述根據(jù)所述播放時間及所述音頻中預(yù)先劃分的聲音時間區(qū)段,檢測所述播放時間在所述音頻中所屬的聲音時間區(qū)段之前,包括:
自與所述音頻對應(yīng)的視頻中提取視頻關(guān)鍵幀,并對應(yīng)存儲各所述視頻關(guān)鍵幀在所述視頻中播放時所屬的圖像時間區(qū)段;
根據(jù)各所述視頻關(guān)鍵幀在所述視頻中所屬的圖像時間區(qū)段,將所述音頻的播放時間劃分為與多個聲音時間區(qū)段,使得多個所述聲音時間區(qū)段與多個所述圖像時間區(qū)段一一對應(yīng);
將對應(yīng)于各所述圖像時間區(qū)段的聲音時間區(qū)段與對應(yīng)于各所述圖像時間區(qū)段的視頻關(guān)鍵幀關(guān)聯(lián)后存儲。
在一個實(shí)施例中,所述調(diào)取與所述音頻中的所述聲音時間區(qū)段預(yù)先關(guān)聯(lián)的視頻關(guān)鍵幀,并在所述音頻的所述聲音時間區(qū)段的聲音播放過程中顯示所述視頻關(guān)鍵幀的圖像,包括:
在檢測到所述播放時間在所述音頻中所屬的聲音時間區(qū)段時,調(diào)取與所述音頻中的所述聲音時間區(qū)段預(yù)先關(guān)聯(lián)的視頻關(guān)鍵幀;
在所述音頻播放的顯示界面中顯示所述視頻關(guān)鍵幀的圖像。
在一個實(shí)施例中,所述調(diào)取與所述音頻中的所述聲音時間區(qū)段預(yù)先關(guān)聯(lián)的視頻關(guān)鍵幀,并在所述音頻的所述聲音時間區(qū)段的聲音播放過程中顯示所述視頻關(guān)鍵幀的圖像之后,還包括:
實(shí)時檢測所述音頻當(dāng)前播放的聲音所屬的聲音時間區(qū)段是否與當(dāng)前顯示圖像所屬的圖像時間區(qū)段匹配;
在當(dāng)前播放的聲音所屬的聲音時間區(qū)段與當(dāng)前顯示圖像所屬的圖像時間區(qū)段不匹配時,調(diào)取與當(dāng)前播放的聲音所屬的聲音時間區(qū)段預(yù)先關(guān)聯(lián)的視頻關(guān) 鍵幀,并在所述音頻播放的顯示界面中顯示所述視頻關(guān)鍵幀的圖像;
在當(dāng)前播放的聲音所屬的聲音時間區(qū)段與當(dāng)前顯示圖像所屬的圖像時間區(qū)段匹配時,繼續(xù)在所述音頻播放的顯示界面中顯示當(dāng)前顯示圖像。
在一個實(shí)施例中,所述調(diào)取與所述音頻中的所述聲音時間區(qū)段預(yù)先關(guān)聯(lián)的視頻關(guān)鍵幀,并在所述音頻的所述聲音時間區(qū)段的聲音播放過程中同步顯示所述視頻關(guān)鍵幀的圖像之后,還包括:
在當(dāng)前播放的聲音與當(dāng)前顯示圖像出現(xiàn)不同步時,對當(dāng)前播放的聲音所屬的聲音時間區(qū)段的起始時間或/和中止時間節(jié)點(diǎn)進(jìn)行調(diào)整。
根據(jù)本發(fā)明實(shí)施例的第二方面,還提供一種視頻聲音與圖像同步的裝置,包括:
第一檢測模塊,用于接收到同步編輯指令后,檢測當(dāng)前播放聲音在正在播放的音頻中的播放時間;
第二檢測模塊,用于根據(jù)所述播放時間及所述音頻中預(yù)先劃分的聲音時間區(qū)段,檢測所述播放時間在所述音頻中所屬的聲音時間區(qū)段;
同步顯示模塊,用于調(diào)取與所述音頻中的所述聲音時間區(qū)段預(yù)先關(guān)聯(lián)的視頻關(guān)鍵幀,并在所述音頻的所述聲音時間區(qū)段的聲音播放過程中顯示所述視頻關(guān)鍵幀的圖像。
在一個實(shí)施例中,所述裝置還包括:
關(guān)鍵幀提取模塊,用于自與所述音頻對應(yīng)的視頻中提取視頻關(guān)鍵幀,并對應(yīng)存儲各所述視頻關(guān)鍵幀在所述視頻中播放時所屬的圖像時間區(qū)段;
聲音時間區(qū)段劃分模塊,用于根據(jù)各所述視頻關(guān)鍵幀在所述視頻中所屬的圖像時間區(qū)段,將所述音頻的播放時間劃分為與多個聲音時間區(qū)段,使得多個所述聲音時間區(qū)段與多個所述圖像時間區(qū)段一一對應(yīng);
關(guān)聯(lián)存儲模塊,用于將對應(yīng)于各所述圖像時間區(qū)段的聲音時間區(qū)段與對應(yīng)于各所述圖像時間區(qū)段的視頻關(guān)鍵幀關(guān)聯(lián)后存儲。
在一個實(shí)施例中,所述同步顯示模塊包括:
關(guān)鍵幀調(diào)取子模塊,用于在檢測到所述播放時間在所述音頻中所屬的聲音時間區(qū)段時,調(diào)取與所述音頻中的所述聲音時間區(qū)段預(yù)先關(guān)聯(lián)的視頻關(guān)鍵幀;
同步顯示子模塊,用于在所述音頻播放的顯示界面中顯示所述視頻關(guān)鍵幀的圖像。
在一個實(shí)施例中,所述裝置還包括:
實(shí)時檢測模塊,用于實(shí)時檢測所述音頻當(dāng)前播放的聲音所屬的聲音時間區(qū)段是否與當(dāng)前顯示圖像所屬的圖像時間區(qū)段匹配;
第一顯示模塊,用于在當(dāng)前播放的聲音所屬的聲音時間區(qū)段與當(dāng)前顯示圖像所屬的圖像時間區(qū)段不匹配時,調(diào)取與當(dāng)前播放的聲音所屬的聲音時間區(qū)段預(yù)先關(guān)聯(lián)的視頻關(guān)鍵幀,并在所述音頻播放的顯示界面中顯示所述視頻關(guān)鍵幀的圖像;
第二顯示模塊,用于在當(dāng)前播放的聲音所屬的聲音時間區(qū)段與當(dāng)前顯示圖像所屬的圖像時間區(qū)段匹配時,繼續(xù)在所述音頻播放的顯示界面中顯示當(dāng)前顯示圖像。
在一個實(shí)施例中,所述裝置還包括:
調(diào)整模塊,用于在當(dāng)前播放的聲音與當(dāng)前顯示圖像出現(xiàn)不同步時,對當(dāng)前播放的聲音所屬的聲音時間區(qū)段的起始時間或/和中止時間節(jié)點(diǎn)進(jìn)行調(diào)整。
本發(fā)明實(shí)施例提供的技術(shù)方案可產(chǎn)生以下有益效果:接收到同步編輯指令后,檢測當(dāng)前播放聲音在正在播放的音頻中的播放時間;根據(jù)所述播放時間及所述音頻中預(yù)先劃分的聲音時間區(qū)段,檢測所述播放時間在所述音頻中所屬的聲音時間區(qū)段;調(diào)取與所述音頻中的所述聲音時間區(qū)段預(yù)先關(guān)聯(lián)的視頻關(guān)鍵幀,并在所述音頻的所述聲音時間區(qū)段的聲音播放過程中顯示所述視頻關(guān)鍵幀的圖像。該方案將提取的視頻關(guān)鍵幀的圖像與播放的音頻的聲音時間區(qū)段進(jìn)行關(guān)聯(lián),使得在聲音播放的同時自動顯示與其對應(yīng)的圖像,令出現(xiàn)聲音與圖像不對應(yīng)的情況時,可以直接在音頻的音軌上進(jìn)行調(diào)整,而不需要一一點(diǎn)擊圖像去 播放所點(diǎn)擊圖像對應(yīng)的音頻文件,簡化了操作過程,且為聲音與圖像的同步編輯過程節(jié)約了時間,提高了編輯效率。
本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。
下面通過附圖和實(shí)施例,對本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
附圖說明
附圖用來提供對本發(fā)明的進(jìn)一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明的實(shí)施例一起用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。
在附圖中:
圖1為本發(fā)明根據(jù)一示例性實(shí)施例示出的一種視頻聲音與圖像同步的方法的流程圖;
圖2為本發(fā)明根據(jù)一示例性實(shí)施例示出的另一種視頻聲音與圖像同步的方法的流程圖;
圖3為本發(fā)明根據(jù)一示例性實(shí)施例示出的視頻聲音與圖像同步的方法中步驟S30的實(shí)施方式流程圖;
圖4為本發(fā)明根據(jù)一示例性實(shí)施例示出的又一種視頻聲音與圖像同步的方法的流程圖;
圖5為本發(fā)明根據(jù)一示例性實(shí)施例示出的再一種視頻聲音與圖像同步的方法的流程圖;
圖6為本發(fā)明根據(jù)一示例性實(shí)施例示出的一種視頻聲音與圖像同步的裝置的框圖;
圖7為本發(fā)明根據(jù)一示例性實(shí)施例示出的另一種視頻聲音與圖像同步的裝置的框圖;
圖8為本發(fā)明根據(jù)一示例性實(shí)施例示出的視頻聲音與圖像同步的裝置中同步顯示模塊63的框圖;
圖9為本發(fā)明根據(jù)一示例性實(shí)施例示出的又一種視頻聲音與圖像同步的裝置的框圖;
圖10為本發(fā)明根據(jù)一示例性實(shí)施例示出的再一種視頻聲音與圖像同步的裝置的框圖。
具體實(shí)施方式
以下結(jié)合附圖對本發(fā)明的優(yōu)選實(shí)施例進(jìn)行說明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實(shí)施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。
本公開實(shí)施例提供了一種視頻聲音與圖像同步的方法,用于減少聲音與圖像同步操作過程中的工作量,節(jié)約工作時間,提高工作效率。如圖1所示,該方法包括步驟S10-S30:
在步驟S10中,接收到同步編輯指令后,檢測當(dāng)前播放聲音在正在播放的音頻中的播放時間。也即,當(dāng)音頻開始加載完畢并開始播放時,則開始接收到同步編輯指令,此時檢測所述音頻當(dāng)前播放的聲音在當(dāng)前音頻中的具體的播放時間。
在步驟S20中,根據(jù)所述播放時間及所述音頻中預(yù)先劃分的聲音時間區(qū)段,檢測所述播放時間在所述音頻中所屬的聲音時間區(qū)段。在步驟S10中檢測到所述音頻當(dāng)前播放的聲音在當(dāng)前音頻中的具體的播放時間之后,判斷所述播放時間在所述音頻中所屬的聲音時間區(qū)段,也即,該播放時間屬于所述音頻中的哪一個聲音時間區(qū)段被確定之后,可以利用該聲音時間區(qū)段將當(dāng)前播放聲音與圖像進(jìn)行匹配后同步顯示。其中所述聲音時間區(qū)段是在所述音頻中預(yù)先劃分的,且預(yù)先劃分之后的聲音時間區(qū)段是與視頻中提取的視頻關(guān)鍵幀所屬的圖像時間區(qū)段一一對應(yīng)的。
在步驟S30中,調(diào)取與所述音頻中的所述聲音時間區(qū)段預(yù)先關(guān)聯(lián)的視頻關(guān) 鍵幀,并在所述音頻的所述聲音時間區(qū)段的聲音播放過程中顯示所述視頻關(guān)鍵幀的圖像。其中,所述音頻中的所述聲音時間區(qū)段與視頻中提取的視頻關(guān)鍵幀是預(yù)先關(guān)聯(lián)的,因此在所述音頻的所述聲音時間區(qū)段的聲音播放時,可以設(shè)定自動顯示與其關(guān)聯(lián)的視頻關(guān)鍵幀的圖像。
在一個實(shí)施例中,如圖3所示,所述步驟S30可包括:
步驟S301、在檢測到所述播放時間在所述音頻中所屬的聲音時間區(qū)段時,調(diào)取與所述音頻中的所述聲音時間區(qū)段預(yù)先關(guān)聯(lián)的視頻關(guān)鍵幀;也即,所述音頻中的所述聲音時間區(qū)段與視頻中提取的視頻關(guān)鍵幀是預(yù)先關(guān)聯(lián)的,因此在所述音頻的所述聲音時間區(qū)段的聲音播放時,首先找到預(yù)先關(guān)聯(lián)的所述視頻關(guān)鍵幀,并將其從數(shù)據(jù)庫中調(diào)取出來,之后顯示在所述音頻播放的界面上,以便于編輯人員查看比對所述聲音與圖像是否同步匹配。
步驟S302、在所述音頻播放的顯示界面中顯示所述視頻關(guān)鍵幀的圖像。所述圖像與所述聲音的音軌在同一顯示界面中顯示,且兩者最好形成一個相互對應(yīng)的顯示關(guān)系,比如,將所述圖像顯示在所述音頻的音軌中當(dāng)前播放的聲音時間區(qū)段的上方或者下方,形成一個對應(yīng)關(guān)系,以便于編輯人員查看比對所述聲音與圖像是否同步匹配。
在一個實(shí)施例中,如圖2所示,該方法的步驟S20之前還包括步驟S40-S60:
在步驟S40中,自與所述音頻對應(yīng)的視頻中提取視頻關(guān)鍵幀,并對應(yīng)存儲各所述視頻關(guān)鍵幀在所述視頻中播放時所屬的圖像時間區(qū)段。也即,在需要進(jìn)行聲音圖像同步的視頻中提取視頻關(guān)鍵幀,且各所述視頻關(guān)鍵幀分別對應(yīng)所述視頻中的一個圖像時間區(qū)段,將所述時間區(qū)段信息與所述視頻關(guān)鍵幀一并存儲在數(shù)據(jù)庫中,以便于在需要時進(jìn)行調(diào)取。
在步驟S50中,根據(jù)各所述視頻關(guān)鍵幀在所述視頻中所屬的圖像時間區(qū)段,將所述音頻的播放時間劃分為與多個聲音時間區(qū)段,使得多個所述聲音時間區(qū)段與多個所述圖像時間區(qū)段一一對應(yīng)。也即,在提取視頻關(guān)鍵幀并將其與各所述視頻關(guān)鍵幀在所述視頻中播放時所屬的圖像時間區(qū)段對應(yīng)存儲之后,此時將 于各個圖像時間區(qū)段對應(yīng)的聲音時間區(qū)段也一一劃分出來,將多個所述聲音時間區(qū)段與多個所述圖像時間區(qū)段一一對應(yīng)之后,只要播放音頻的聲音,就會將該聲音所屬聲音時間區(qū)段的視頻關(guān)鍵幀的圖像調(diào)取出來進(jìn)行顯示。
在步驟S60中,將對應(yīng)于各所述圖像時間區(qū)段的聲音時間區(qū)段與對應(yīng)于各所述圖像時間區(qū)段的視頻關(guān)鍵幀關(guān)聯(lián)后存儲。將所述時間區(qū)段信息與所述視頻關(guān)鍵幀的所述圖像時間區(qū)段對應(yīng)存儲在數(shù)據(jù)庫中,以便于在聲音播放時自動調(diào)取和顯示其對應(yīng)的圖像。
在一個實(shí)施例中,如圖4所示,該方法的步驟S30之后還包括步驟S70-S90:
在步驟S70中,實(shí)時檢測所述音頻當(dāng)前播放的聲音所屬的聲音時間區(qū)段是否與當(dāng)前顯示圖像所屬的圖像時間區(qū)段匹配;也即,在音頻播放的過程中,當(dāng)前聲音時間區(qū)段的聲音播放完畢之后,由于當(dāng)前顯示的是上一個聲音時間區(qū)段關(guān)聯(lián)的視頻關(guān)鍵幀的圖像,因此需要將當(dāng)前顯示的圖像實(shí)時更換為當(dāng)前播放聲音的聲音時間區(qū)段對應(yīng)的圖像,因此需要實(shí)時進(jìn)行檢測所述音頻當(dāng)前播放的聲音所屬的聲音時間區(qū)段是否與當(dāng)前顯示圖像所屬的圖像時間區(qū)段匹配,以便于實(shí)時替換當(dāng)前顯示的圖像。
在步驟S80中,在當(dāng)前播放的聲音所屬的聲音時間區(qū)段與當(dāng)前顯示圖像所屬的圖像時間區(qū)段不匹配時,調(diào)取與當(dāng)前播放的聲音所屬的聲音時間區(qū)段預(yù)先關(guān)聯(lián)的視頻關(guān)鍵幀,并在所述音頻播放的顯示界面中顯示所述視頻關(guān)鍵幀的圖像;在當(dāng)前播放的聲音所屬的聲音時間區(qū)段與當(dāng)前顯示圖像所屬的圖像時間區(qū)段不匹配時,需要將當(dāng)前顯示的圖像實(shí)時更換為當(dāng)前播放聲音的聲音時間區(qū)段對應(yīng)的圖像,因此,需要取消當(dāng)前圖像的顯示,而將與當(dāng)前播放聲音的聲音時間區(qū)段對應(yīng)的圖像調(diào)取出來進(jìn)行實(shí)時顯示。
在步驟S90中,在當(dāng)前播放的聲音所屬的聲音時間區(qū)段與當(dāng)前顯示圖像所屬的圖像時間區(qū)段匹配時,繼續(xù)在所述音頻播放的顯示界面中顯示當(dāng)前顯示圖像。而在當(dāng)前播放的聲音所屬的聲音時間區(qū)段與當(dāng)前顯示圖像所屬的圖像時間區(qū)段匹配時,說明當(dāng)前聲音時間區(qū)段的聲音播放尚未完畢,繼續(xù)進(jìn)行播放且顯 示當(dāng)前圖像即可。
在一個實(shí)施例中,如圖5所示,該方法的步驟S30之后還包括步驟S100:
在步驟S100中,在當(dāng)前播放的聲音與當(dāng)前顯示圖像出現(xiàn)不同步時,對當(dāng)前播放的聲音所屬的聲音時間區(qū)段的起始時間或/和中止時間節(jié)點(diǎn)進(jìn)行調(diào)整。
也即,當(dāng)編輯人員發(fā)現(xiàn)當(dāng)前播放的聲音與當(dāng)前顯示圖像出現(xiàn)不同步時,比如,當(dāng)前播放的聲音并不是圖像中顯示的發(fā)言人物的發(fā)言,或者其發(fā)言并未與發(fā)言人物的口型同步,此時,需要調(diào)整所述音頻的當(dāng)前聲音時間區(qū)段的起始時間或/和中止時間節(jié)點(diǎn),也即在當(dāng)前顯示的音軌上對上述時間節(jié)點(diǎn)進(jìn)行調(diào)整,調(diào)整后聲音和圖像同步匹配播放,且由于僅對時間節(jié)點(diǎn)進(jìn)行了調(diào)整,聲音和圖像之間的對應(yīng)關(guān)系并未改變,因此在播放修改時間節(jié)點(diǎn)之后的音頻的所述聲音時間區(qū)段時,還是會同步顯示與其對應(yīng)的視頻關(guān)鍵幀的圖像,同時也不會影響對后續(xù)的同步關(guān)系進(jìn)行調(diào)整。
本發(fā)明實(shí)施例提供的上述方法,接收到同步編輯指令后,檢測當(dāng)前播放聲音在正在播放的音頻中的播放時間;根據(jù)所述播放時間及所述音頻中預(yù)先劃分的聲音時間區(qū)段,檢測所述播放時間在所述音頻中所屬的聲音時間區(qū)段;調(diào)取與所述音頻中的所述聲音時間區(qū)段預(yù)先關(guān)聯(lián)的視頻關(guān)鍵幀,并在所述音頻的所述聲音時間區(qū)段的聲音播放過程中顯示所述視頻關(guān)鍵幀的圖像。該方案將提取的視頻關(guān)鍵幀的圖像與播放的音頻的聲音時間區(qū)段進(jìn)行關(guān)聯(lián),使得在聲音播放的同時自動顯示與其對應(yīng)的圖像,令出現(xiàn)聲音與圖像不對應(yīng)的情況時,可以直接在音頻的音軌上進(jìn)行調(diào)整,而不需要一一點(diǎn)擊圖像去播放所點(diǎn)擊圖像對應(yīng)的音頻文件,簡化了操作過程,且為聲音與圖像的同步編輯過程節(jié)約了時間,提高了編輯效率。
對應(yīng)本發(fā)明實(shí)施例提供的視頻聲音與圖像同步的方法,本發(fā)明還提供視頻聲音與圖像同步的裝置,如圖6所示,該裝置可包括:
第一檢測模塊61,用于接收到同步編輯指令后,檢測當(dāng)前播放聲音在正在 播放的音頻中的播放時間;
第二檢測模塊62,用于根據(jù)所述播放時間及所述音頻中預(yù)先劃分的聲音時間區(qū)段,檢測所述播放時間在所述音頻中所屬的聲音時間區(qū)段;
同步顯示模塊63,用于調(diào)取與所述音頻中的所述聲音時間區(qū)段預(yù)先關(guān)聯(lián)的視頻關(guān)鍵幀,并在所述音頻的所述聲音時間區(qū)段的聲音播放過程中顯示所述視頻關(guān)鍵幀的圖像。
在一個實(shí)施例中,如圖7所示,所述裝置還包括:
關(guān)鍵幀提取模塊64,用于自與所述音頻對應(yīng)的視頻中提取視頻關(guān)鍵幀,并對應(yīng)存儲各所述視頻關(guān)鍵幀在所述視頻中播放時所屬的圖像時間區(qū)段;
聲音時間區(qū)段劃分模塊65,用于根據(jù)各所述視頻關(guān)鍵幀在所述視頻中所屬的圖像時間區(qū)段,將所述音頻的播放時間劃分為與多個聲音時間區(qū)段,使得多個所述聲音時間區(qū)段與多個所述圖像時間區(qū)段一一對應(yīng);
關(guān)聯(lián)存儲模塊66,用于將對應(yīng)于各所述圖像時間區(qū)段的聲音時間區(qū)段與對應(yīng)于各所述圖像時間區(qū)段的視頻關(guān)鍵幀關(guān)聯(lián)后存儲。
在一個實(shí)施例中,如圖8所示,所述同步顯示模塊63包括:
關(guān)鍵幀調(diào)取子模塊631,用于在檢測到所述播放時間在所述音頻中所屬的聲音時間區(qū)段時,調(diào)取與所述音頻中的所述聲音時間區(qū)段預(yù)先關(guān)聯(lián)的視頻關(guān)鍵幀;
同步顯示子模塊632,用于在所述音頻播放的顯示界面中顯示所述視頻關(guān)鍵幀的圖像。
在一個實(shí)施例中,如圖9所示,所述裝置還包括:
實(shí)時檢測模塊67,用于實(shí)時檢測所述音頻當(dāng)前播放的聲音所屬的聲音時間區(qū)段是否與當(dāng)前顯示圖像所屬的圖像時間區(qū)段匹配;
第一顯示模塊68,用于在當(dāng)前播放的聲音所屬的聲音時間區(qū)段與當(dāng)前顯示圖像所屬的圖像時間區(qū)段不匹配時,調(diào)取與當(dāng)前播放的聲音所屬的聲音時間區(qū)段預(yù)先關(guān)聯(lián)的視頻關(guān)鍵幀,并在所述音頻播放的顯示界面中顯示所述視頻關(guān)鍵 幀的圖像;
第二顯示模塊69,用于在當(dāng)前播放的聲音所屬的聲音時間區(qū)段與當(dāng)前顯示圖像所屬的圖像時間區(qū)段匹配時,繼續(xù)在所述音頻播放的顯示界面中顯示當(dāng)前顯示圖像。
在一個實(shí)施例中,如圖10所示,所述裝置還包括:
調(diào)整模塊70,用于在當(dāng)前播放的聲音與當(dāng)前顯示圖像出現(xiàn)不同步時,對當(dāng)前播放的聲音所屬的聲音時間區(qū)段的起始時間或/和中止時間節(jié)點(diǎn)進(jìn)行調(diào)整。
本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機(jī)可用程序代碼的計算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器和光學(xué)存儲器等)上實(shí)施的計算機(jī)程序產(chǎn)品的形式。
本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機(jī)程序指令到通用計算機(jī)、專用計算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機(jī)器,使得通過計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些計算機(jī)程序指令也可存儲在能引導(dǎo)計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機(jī)可讀存儲器中,使得存儲在該計算機(jī)可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些計算機(jī)程序指令也可裝載到計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機(jī)實(shí)現(xiàn)的處理,從而在計算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個 流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進(jìn)行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。