本公開涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種分享視頻文件的方法及裝置。
背景技術(shù):
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,社交應(yīng)用的功能越來越多;社交應(yīng)用不僅具有聊天功能,還具有分享視頻片段等功能;例如,社交應(yīng)用為用戶提供一個信息展示平臺,用戶可以將自己拍攝的視頻片段分享到該信息展示平臺,好友用戶可以從該信息展示平臺觀看該視頻片段。
目前,用戶終端開啟攝像頭開始進行拍攝,得到視頻片段,向社交應(yīng)用服務(wù)器發(fā)送該視頻片段;社交應(yīng)用服務(wù)器將該視頻片段發(fā)布到該信息展示平臺。
技術(shù)實現(xiàn)要素:
為克服相關(guān)技術(shù)中存在的問題,本公開提供一種分享視頻文件的方法及裝置,所述技術(shù)方案如下:
根據(jù)本公開實施例的第一方面,提供一種分享視頻文件的方法,所述方法包括:
獲取待分享的第一視頻文件;
根據(jù)所述第一視頻文件包括的音頻數(shù)據(jù),生成所述音頻數(shù)據(jù)對應(yīng)的字幕文件,所述字幕文件包括時間信息和與所述時間信息關(guān)聯(lián)的文字信息;
將所述字幕文件插入所述第一視頻文件中,得到第二視頻文件;
向社交應(yīng)用服務(wù)器發(fā)送所述第二視頻文件,以使所述服務(wù)器分享所述第二視頻文件。
本公開實施例中,終端獲取待分享的第一視頻文件,生成該音頻數(shù)據(jù)對應(yīng)的字幕文件,并將該字幕文件插入該第一視頻文件中,生成第二視頻文件,向社交應(yīng)用發(fā)送該第二視頻文件,通過該社交應(yīng)用服務(wù)器分享該第二視頻文件。由于該第二視頻文件不僅包括圖像數(shù)據(jù)和音頻數(shù)據(jù),還包括字幕信息,因此增加了第二視頻文件的信息量。
在一種可能的實現(xiàn)方式中,所述方法還包括:
獲取用戶選擇的視頻特效模板;
對于所述第二視頻文件中的每幀圖像包括的每一個像素點,根據(jù)所述視頻特效模板,對所述像素點的第一圖像數(shù)據(jù)進行處理,得到第二圖像數(shù)據(jù),將所述第一圖像數(shù)據(jù)修改為所述第二圖像數(shù)據(jù)。
本公開實施例中,終端還可以根據(jù)用戶選擇的視頻特效,對第二視頻文件進行特效處理,滿足用戶需求,提高了用戶粘度。
在一種可能的實現(xiàn)方式中,所述根據(jù)所述第一視頻文件包括的音頻數(shù)據(jù),生成所述音頻數(shù)據(jù)對應(yīng)的字幕文件,包括:
根據(jù)所述音頻數(shù)據(jù)中的語音信息,獲取所述語音信息的時間信息;
識別所述語音信息,得到第一文字信息,關(guān)聯(lián)所述時間信息和所述第一文字信息;
將所述時間信息和所述第一文字信息,組成所述字幕文件。
本公開實施例中,終端可以通過識別音頻數(shù)據(jù)中的語音信息,獲取該語音信息對應(yīng)的第一文字信息和時間信息,該字幕文件包括時間信息和第一文字信息,提高了將字幕文件插入第一視頻文件的準確性。
在一種可能的實現(xiàn)方式中,所述識別所述語音信息,得到第一文字信息,包括:
識別所述語音信息,得到第二文字信息;
顯示文本窗口,所述文本窗口包括所述第二文字信息;
如果檢測到用戶修正所述第二文字信息中包括的字符的操作,則將所述修正后的第二文字信息確定為所述第一文字信息。
本公開實施例中,終端顯示文本窗口,文本窗口包括第二文字信息,用戶可以在該文本窗口中修正第二文字信息,從而提高了第一文字信息的準確性。
在一種可能的實現(xiàn)方式中,所述方法還包括:
當檢測到所述第一文字信息的語種與預(yù)設(shè)系統(tǒng)語種不同時,對所述第一文字信息進行語種轉(zhuǎn)換;或者,
當檢測到當前界面中的翻譯按鈕被觸發(fā)時,對所述第一文字信息進行語種轉(zhuǎn)換。
本公開實施例中,終端還可以對第一文字信息進行語種轉(zhuǎn)換,從而字幕文件中可以包括不同語種的文字信息,進一步增加了第二視頻文件的信息量,提高了用戶粘度。
在一種可能的實現(xiàn)方式中,所述將所述字幕文件插入所述第一視頻文件中,得到第二視頻文件,包括:
根據(jù)所述時間信息,將所述文字信息插入所述第一視頻文件中,得到所述第二視頻文件。
本公開實施例中,根據(jù)時間信息,將文字信息插入第一視頻文件中,保證了時間信息和文字信息的同步。
根據(jù)本公開實施例的第二方面,提供一種分享視頻文件的裝置,所述裝置包括:
第一獲取模塊,用于獲取待分享的第一視頻文件;
生成模塊,用于根據(jù)所述第一視頻文件包括的音頻數(shù)據(jù),生成所述音頻數(shù)據(jù)對應(yīng)的字幕文件,所述字幕文件包括時間信息和與所述時間信息關(guān)聯(lián)的文字信息;
插入模塊,用于將所述字幕文件插入所述第一視頻文件中,得到第二視頻文件;
發(fā)送模塊,用于向社交應(yīng)用服務(wù)器發(fā)送所述第二視頻文件,以使所述服務(wù)器分享所述第二視頻文件。
在一種可能的實現(xiàn)方式中,所述裝置還包括:
第二獲取模塊,用于獲取用戶選擇的視頻特效模板;
處理模塊,用于對于所述第二視頻文件中的每幀圖像包括的每一個像素點,根據(jù)所述視頻特效模板,對所述像素點的第一圖像數(shù)據(jù)進行處理,得到第二圖像數(shù)據(jù),
修改模塊,用于將所述第一圖像數(shù)據(jù)修改為所述第二圖像數(shù)據(jù)。
在一種可能的實現(xiàn)方式中,所述生成模塊用于根據(jù)所述音頻數(shù)據(jù)中的語音信息,獲取所述語音信息的時間信息;識別所述語音信息,得到第一文字信息,關(guān)聯(lián)所述時間信息和所述第一文字信息;將所述時間信息和所述第一文字信息,組成所述字幕文件。
在一種可能的實現(xiàn)方式中,所述生成模塊用于識別所述語音信息,得到第二文字信息;顯示文本窗口,所述文本窗口包括所述第二文字信息;如果檢測到用戶修正所述第二文字信息中包括的字符的操作,則將所述修正后的第二文字信息確定為所述第一文字信息。
在一種可能的實現(xiàn)方式中,所述裝置還包括:
轉(zhuǎn)換模塊,用于當檢測到所述第一文字信息的語種與預(yù)設(shè)系統(tǒng)語種不同時,對所述第一文字信息進行語種轉(zhuǎn)換;或者,當檢測到當前界面中的翻譯按鈕被觸發(fā)時,對所述第一文字信息進行語種轉(zhuǎn)換。
在一種可能的實現(xiàn)方式中,所述插入模塊用于根據(jù)所述時間信息,將所述文字信息插入所述第一視頻文件中,得到所述第二視頻文件。
根據(jù)本公開實施例的第三方面,提供一種分享視頻文件的裝置,包括:
處理器;
用于存儲處理器可執(zhí)行指令的存儲器;
其中,所述處理器被配置為:獲取待分享的第一視頻文件;根據(jù)所述第一視頻文件包括的音頻數(shù)據(jù),生成所述音頻數(shù)據(jù)對應(yīng)的字幕文件,所述字幕文件包括時間信息和與所述時間信息關(guān)聯(lián)的文字信息;將所述字幕文件插入所述第一視頻文件中,得到第二視頻文件;向社交應(yīng)用服務(wù)器發(fā)送所述第二視頻文件,以使所述服務(wù)器分享所述第二視頻文件。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:本公開實施例中,終端獲取待分享的第一視頻文件,生成該音頻數(shù)據(jù)對應(yīng)的字幕文件,并將該字幕文件插入該第一視頻文件中,生成第二視頻文件,向社交應(yīng)用發(fā)送該第二視頻文件,通過該社交應(yīng)用服務(wù)器分享該第二視頻文件。由于該第二視頻文件不僅包括圖像數(shù)據(jù)和音頻數(shù)據(jù),還包括字幕信息,因此增加了第二視頻文件的信息量。
應(yīng)當理解的是,以上的一般描述和后文的細節(jié)描述僅是示例性和解釋性的,并不能限制本公開。
附圖說明
此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本公開的實施例,并與說明書一起用于解釋本公開的原理。
圖1是根據(jù)一示例性實施例示出的一種分享視頻文件的方法流程圖;
圖2是根據(jù)一示例性實施例示出的一種分享視頻文件的方法流程圖;
圖3是根據(jù)一示例性實施例示出的一種分享視頻文件的裝置的框圖;
圖4是根據(jù)一示例性實施例示出的一種分享視頻文件的裝置的框圖;
圖5是根據(jù)一示例性實施例示出的一種分享視頻文件的裝置的框圖;
圖6是根據(jù)一示例性實施例示出的一種分享視頻文件的裝置400的框圖。
具體實施方式
為使本公開的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本公開實施方式作進一步地詳細描述。
這里將詳細地對示例性實施例進行說明,其示例表示在附圖中。下面的描述涉及附圖時,除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實施例中所描述的實施方式并不代表與本公開相一致的所有實施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本公開的一些方面相一致的裝置和方法的例子。
相關(guān)技術(shù)中,用戶將自己拍攝的視頻片段分享到社交應(yīng)用的信息展示平臺時,終端獲取視頻片段后,直接向社交應(yīng)用服務(wù)器發(fā)送該視頻片段;社交應(yīng)用服務(wù)器將該視頻片段發(fā)布到該信息展示平臺。由于該視頻片段中僅包括圖像數(shù)據(jù)和音頻數(shù)據(jù);從而導(dǎo)致分享的視頻片段中包括的信息量較少。
本公開實施例中,終端獲取待分享的第一視頻文件,生成該音頻數(shù)據(jù)對應(yīng)的字幕文件,并將該字幕文件插入該第一視頻文件中,生成第二視頻文件,向社交應(yīng)用發(fā)送該第二視頻文件,通過該社交應(yīng)用服務(wù)器分享該第二視頻文件。由于該第二視頻文件不僅包括圖像數(shù)據(jù)和音頻數(shù)據(jù),還包括字幕信息,因此增加了第二視頻文件的信息量。
圖1是根據(jù)一示例性實施例示出的一種分享視頻文件的方法流程圖,該分享視頻文件的方法應(yīng)用于終端,如圖1所示,包括以下步驟。
在步驟101中,獲取待分享的第一視頻文件。
在步驟102中,根據(jù)該第一視頻文件包括的音頻數(shù)據(jù),生成該音頻數(shù)據(jù)對應(yīng)的字幕文件,該字幕文件包括時間信息和與該時間信息關(guān)聯(lián)的文字信息。
在步驟103中,將該字幕文件插入該第一視頻文件中,得到第二視頻文件。
在步驟104中,向社交應(yīng)用服務(wù)器發(fā)送該第二視頻文件,以使該服務(wù)器分享該第二視頻文件。
本公開實施例的一種可能實現(xiàn)方式中,該方法還包括:
獲取用戶選擇的視頻特效模板;
對于該第二視頻文件中的每幀圖像包括的每一個像素點,根據(jù)該視頻特效模板,對該像素點的第一圖像數(shù)據(jù)進行處理,得到第二圖像數(shù)據(jù),將該第一圖像數(shù)據(jù)修改為該第二圖像數(shù)據(jù)。
本公開實施例的一種可能實現(xiàn)方式中,根據(jù)該第一視頻文件包括的音頻數(shù)據(jù),生成該音頻數(shù)據(jù)對應(yīng)的字幕文件,包括:
根據(jù)該音頻數(shù)據(jù)中的語音信息,獲取該語音信息的時間信息;
識別該語音信息,得到第一文字信息,關(guān)聯(lián)該時間信息和該第一文字信息;
將該時間信息和該第一文字信息,組成該字幕文件。
本公開實施例的一種可能實現(xiàn)方式中,識別該語音信息,得到第一文字信息,包括:
識別該語音信息,得到第二文字信息;
顯示文本窗口,該文本窗口包括該第二文字信息;
如果檢測到用戶修正該第二文字信息中包括的字符的操作,則將該修正后的第二文字信息確定為該第一文字信息。
本公開實施例的一種可能實現(xiàn)方式中,該方法還包括:
當檢測到該第一文字信息的語種與預(yù)設(shè)系統(tǒng)語種不同時,對該第一文字信息進行語種轉(zhuǎn)換;或者,
當檢測到當前界面中的翻譯按鈕被觸發(fā)時,對該第一文字信息進行語種轉(zhuǎn)換。
本公開實施例的一種可能實現(xiàn)方式中,將該字幕文件插入該第一視頻文件中,得到第二視頻文件,包括:
根據(jù)該時間信息,將該文字信息插入該第一視頻文件中,得到該第二視頻文件。
本公開實施例中,終端獲取待分享的第一視頻文件,生成該音頻數(shù)據(jù)對應(yīng)的字幕文件,并將該字幕文件插入該第一視頻文件中,生成第二視頻文件,向社交應(yīng)用發(fā)送該第二視頻文件,通過該社交應(yīng)用服務(wù)器分享該第二視頻文件。由于該第二視頻文件不僅包括圖像數(shù)據(jù)和音頻數(shù)據(jù),還包括字幕信息,因此增加了第二視頻文件的信息量。
上述所有可選技術(shù)方案,可以采用任意結(jié)合形成本公開的可選實施例,在此不再一一贅述。
圖2是根據(jù)一示例性實施例示出的一種分享視頻文件的方法流程圖,該分享視頻文件的方法應(yīng)用于終端,如圖2所示,包括以下步驟。
在步驟201中,終端獲取待分享的第一視頻文件。
在本步驟中,用戶可以通過社交應(yīng)用將第一視頻文件分享給好友用戶,也可以通過社交應(yīng)用將第一視頻文件分享到信息展示平臺。如果用戶通過社交應(yīng)用將第一視頻文件分享給好友用戶,則用戶與好友用戶的對話框的工具欄中顯示第一分享按鈕和第二分享按鈕;如果用戶通過社交應(yīng)用將視頻文件分享到信息展示平臺,則在信息展示平臺中顯示第一分享按鈕和第二分享按鈕。其中,第一分享按鈕用于觸發(fā)終端顯示視頻選擇界面,用戶可以在該視頻選擇界面中選擇待分享的第一視頻文件;第二分享按鈕用于觸發(fā)終端顯示拍攝界面,用戶可以在該拍攝界面中拍攝待分享的第一視頻文件。
相應(yīng)的,本步驟可以為:終端檢測到第一分享按鈕被觸發(fā)時,顯示視頻選擇界面,該視頻選擇界面包括終端中已存儲的視頻文件的縮略圖,獲取用戶從視頻文件的縮略圖中選擇的視頻文件,將該選擇的視頻文件作為待分享的第一視頻文件。或者,
終端檢測到第二分享按鈕被觸發(fā)時,開啟攝像頭開始進行拍攝,將當前拍攝得到是視頻文件作為待分享的第一視頻文件。
本公開實施例的一種可能實現(xiàn)方式中,終端還可以為用戶的好友用戶分享的視頻文件添加字幕文件,則步驟201可以替換為:
終端獲取待播放的視頻文件,將該視頻文件作為第一視頻文件,該待播放的視頻文件為好友用戶分享的視頻文件。
由于第一視頻文件僅僅包括音頻數(shù)據(jù)和圖像數(shù)據(jù),也即第一視頻文件包括的信息量較少,為了增加第一視頻文件包括的信息量,終端可以通過以下步驟202-203為第一視頻文件添加字幕文件。
在步驟202中,終端根據(jù)該第一視頻文件包括的音頻數(shù)據(jù),生成該音頻數(shù)據(jù)對應(yīng)的字幕文件,該字幕文件包括時間信息和與該時間信息關(guān)聯(lián)的文字信息。
本步驟中,終端可以獲取該第一視頻文件中的音頻數(shù)據(jù),并提取該音頻數(shù)據(jù)中的語音信息;終端根據(jù)該語音信息,通過以下步驟2021-2022生成字幕文件。
在步驟2021中,終端根據(jù)該音頻數(shù)據(jù)中的語音信息,獲取該語音信息的時間信息;終端識別該語音信息,得到第一文字信息,關(guān)聯(lián)該時間信息和該第一文字信息。
本步驟中,終端根據(jù)該音頻數(shù)據(jù)中的語音信息,獲取該語音信息的時間信息的步驟可以為:終端根據(jù)預(yù)設(shè)時長,將該語音信息切分成多幀語音信息,多幀語音信息中的每幀語音信息的時長不大于該預(yù)設(shè)時長;終端通過語音識別技術(shù),獲取每幀語音信息在該音頻數(shù)據(jù)中對應(yīng)的時間信息,將每幀語音信息在該音頻數(shù)據(jù)中對應(yīng)的時間信息組成該語音信息的時間信息。
其中,預(yù)設(shè)時長可以根據(jù)需要設(shè)置并更改,本公開實施例對預(yù)設(shè)時長并不做具體限定。例如,預(yù)設(shè)時長可以為25毫秒、0.1毫秒、1秒等。
為了便于后續(xù)終端確定語音信息中每幀語音信息對應(yīng)的時間信息,在本步驟中,終端存儲語音信息中每幀語音信息和每幀語音信息的時間信息的對應(yīng)關(guān)系。
本公開實施例中,終端可以通過語音識別技術(shù),將該語音信息轉(zhuǎn)化為該語音信息對應(yīng)的文字信息;由于該語音信息對應(yīng)的文字信息可能存在錯誤字符,因此,終端識別該語音信息,得到第一文字信息的步驟可以通過以下步驟2021a-2021c實現(xiàn)。
在步驟2021a中,終端識別該語音信息,得到第二文字信息。
終端提取該語音信息中每幀語音信息的語音特征序列,將該每幀語音信息的語音特征序列同聲學模型進行匹配,根據(jù)聲學模型中的語音識別算法和每幀語音信息的語音特征序列,確定每幀語音信息對應(yīng)的文字信息,將每幀語音信息對應(yīng)的文字信息組成第二文字信息。
其中,第二文字信息中包括多個字符,終端可以存儲每幀語音信息和字符的對應(yīng)關(guān)系,便于之后終端根據(jù)每幀語音信息,獲取每幀語音信息對應(yīng)的字符。
在步驟2021b中,終端顯示文本窗口,該文本窗口包括該第二文字信息。
為了便于用戶直觀的檢查并修正該第二文字信息中的錯誤字符,終端可以在當前顯示界面顯示文本窗口,將該第二文字信息顯示在該文本窗口中,用戶可以在該文本窗口中修正第二文字信息包括的字符。
為了便于用戶查看第二文字信息,終端還可以對第二文字信息進行分行處理,將處理后的第二文字信息顯示在該文本窗口中。
由于終端存儲了語音信息中每幀語音信息和時間信息的對應(yīng)關(guān)系,以及每幀語音信息和字符的對應(yīng)關(guān)系,因此,終端對第二文字信息進行分行處理的步驟可以為:
終端可以從每幀語音信息和時間信息的對應(yīng)關(guān)系中,獲取每幀語音信息對應(yīng)的時間信息;終端從每幀語音信息和字符的對應(yīng)關(guān)系中,獲取每幀語音信息對應(yīng)的字符,進而確定第二文字信息中每個字符對應(yīng)的時間信息,根據(jù)每個字符對應(yīng)的時間信息,確定第二文字信息中相鄰字符的時間間隔,將時間間隔小于預(yù)設(shè)時間間隔的連續(xù)的多個字符按時間先后順序排列成一行。其中,每行文字信息中可以包括一個字符,也可以包括多個字符。
終端對第二文字信息進行分行處理后,還可以獲取每行文字信息的時間信息,在該文本窗口中顯示該文字信息的時間信息。
在本步驟中,為了便于用戶快速檢查出第二文字信息中的錯誤字符,終端可以開啟檢查拼寫和語法的功能,通過檢查拼寫和語法功能中的算法,檢測第二文字信息中是否存在錯誤字符;如果終端檢測出第二文字信息中存在錯誤字符,終端在文本窗口中標識第二文字信息中的錯誤字符。
本公開實施例提供的一種可能實現(xiàn)方式中,終端可以在社交應(yīng)用的文本窗口中顯示確定按鈕,當用戶修正第二文字信息中的錯誤字符或者確定第二文字信息不存在錯誤字符時,用戶可以點擊該確定按鈕以觸發(fā)終端獲取修正后的第二文字信息。終端檢測到該確定按鈕被觸發(fā)后,執(zhí)行步驟2021c。
在步驟2021c中,如果終端檢測到用戶修正該第二文字信息中包括的字符的操作,則終端將修正后的第二文字信息確定為該第一文字信息。
如果終端沒有檢測到用戶修正該第二文字信息中包括的字符的操作,則終端直接將第二文字信息確定為第一文字信息。
在步驟2022中,終端將該時間信息和該第一文字信息,組成該字幕文件。
本步驟中,該字幕文件中存儲了第一文字信息中每行文字信息在視頻數(shù)據(jù)的時間信息與該行文字信息的對應(yīng)關(guān)系,因此,該字幕文件包括:第一文字信息、時間信息和第一文字信息中每行文字信息同時間信息的對應(yīng)關(guān)系。
本公開實施提供的一種可能實現(xiàn)方式中,終端可以自動檢測第一文字信息的語種是否和預(yù)設(shè)系統(tǒng)語種相同;如果第一文字信息的語種和預(yù)設(shè)系統(tǒng)語種不同,可以對該第一文字信息進行語種轉(zhuǎn)換。也即將第一文字信息翻譯為預(yù)設(shè)系統(tǒng)語種對應(yīng)的第三文字信息。
在本步驟中,為了便于用戶閱讀,終端將第三文字信息插入到該字幕文件中。
本公開實施提供的一種可能實現(xiàn)方式中,終端在當前顯示界面中顯示翻譯按鈕,用戶可以通過點擊該翻譯按鈕觸發(fā)終端對第一文字信息進行語種轉(zhuǎn)換。當檢測到該翻譯按鈕被觸發(fā)時,終端顯示語種選擇界面,該語種選擇界面中包括多個語種;獲取用戶選擇的語種,將第一文字信息翻譯為用戶選擇的語種對應(yīng)的第四文字信息。
在本步驟中,為了便于用戶閱讀,終端將第四文字信息插入到該字幕文件中。
例如,第一文字信息的語種為中文,用戶選擇的語種為英語,則終端將第一文字翻譯為英文語種的第四文字信息。
在步驟203中,終端將該字幕文件插入該第一視頻文件中,得到第二視頻文件。
該字幕文件包括時間信息和與該時間信息關(guān)聯(lián)的文字信息,因此,本步驟可以為:終端根據(jù)時間信息,將該文字信息插入該第一視頻文件中,得到第二視頻文件。
其中,終端獲取第一視頻文件包括的每幀圖像;終端獲取第一文字信息中每行文字信息,根據(jù)該行文字信息,從每行文字信息和時間信息的對應(yīng)關(guān)系中,獲取該行文字信息的時間信息,即該行文字信息在第一視頻文件中對應(yīng)的起始時間和終止時間。進而,終端獲取第一視頻文件中該行文字信息對應(yīng)的起始時間和終止時間間隔內(nèi)的目標幀圖像;終端將該行文字信息插入到第一視頻文件中的目標幀圖像中,得到該第二視頻文件。
本公開實施例提供的一種可能實現(xiàn)方式中,為了方便用戶瀏覽音頻數(shù)據(jù)對應(yīng)的文字信息,終端可以將該行文字信息在該行文字信息的起始時間之前提前第一預(yù)設(shè)時間顯示,或者將該行文字信息在該行文字信息的終止時間之后延遲第二預(yù)設(shè)時間消失。因此,終端根據(jù)時間信息,將該文字信息插入該第一視頻文件中,得到第二視頻文件的步驟可以為:
終端獲取第一視頻文件包括的每幀圖像;終端獲取第一文字信息中每行文字信息在第一視頻文件中對應(yīng)的起始時間和終止時間;終端將該起始時間減去第一預(yù)設(shè)時間,得到第一時間,終端將該終止時間加第二預(yù)設(shè)時間,得到第二時間;終端獲取第一視頻文件中第一時間和第二時間的間隔內(nèi)的每幀圖像;終端將該行文字信息插入到第一視頻文件中第一時間和第二時間的間隔內(nèi)的每幀圖像中,得到該第二視頻文件。
本公開實施例中,為了提升用戶瀏覽視頻文件時的視覺效果,終端可以提供視頻特效功能,用戶可以在分享視頻文件時選擇該視頻文件的視頻特效;終端根據(jù)用戶選擇的視頻特效,對第二視頻文件中的圖像數(shù)據(jù)進行處理。本步驟可以通過以下步驟204-205實現(xiàn)。
在步驟204中,終端獲取用戶選擇的視頻特效模板。
本步驟中,終端可以在社交應(yīng)用的當前界面中顯示視頻特效按鈕,終端檢測到該視頻特效按鈕被觸發(fā)時,終端顯示多種視頻特效模板,用戶可以根據(jù)需要選擇一種視頻特效模板,終端獲取用戶選擇的視頻特效模板,執(zhí)行步驟205。
其中,視頻特效模板可以根據(jù)用戶設(shè)置并更改,本公開實施例對視頻特效模板并不作具體限定。例如,視頻特效模板可以為毛玻璃效果、古典效果、黑白效果等。
在步驟205中,對于該第二視頻文件中的每幀圖像包括的每一個像素點,終端根據(jù)該視頻特效模板,對該像素點的第一圖像數(shù)據(jù)進行處理,得到第二圖像數(shù)據(jù),將該第一圖像數(shù)據(jù)修改為該第二圖像數(shù)據(jù)。
終端存儲多種視頻特效模板中的每種視頻特效模板對應(yīng)的算法,在本步驟中,終端根據(jù)該視頻特效模板,對該像素點的第一圖像數(shù)據(jù)進行處理,得到第二圖像數(shù)據(jù)的步驟可以為:
終端獲取用戶選擇的視頻特效模板對應(yīng)的算法,根據(jù)用戶選擇的視頻特效模板對應(yīng)的算法,對第一圖像數(shù)據(jù)進行處理,得到第二圖像數(shù)據(jù)。
例如,視頻特效模板以毛玻璃效果為例進行說明,毛玻璃效果對應(yīng)的算法可以為高斯模糊算法。對于每幀圖像中的每一個像素點,終端提取該像素點的第一圖像數(shù)據(jù),對該第一圖像數(shù)據(jù)進行高斯模糊處理,即通過高斯函數(shù),確定該像素點的權(quán)重矩陣,根據(jù)該像素點的第一圖像數(shù)據(jù)和權(quán)重矩陣,確定該像素點的第二圖像數(shù)據(jù);在第二視頻文件中,終端將每幀圖像的每一個像素點的第一圖像數(shù)據(jù)修改為第二圖像數(shù)據(jù)。
在步驟206中,終端向社交應(yīng)用服務(wù)器發(fā)送該第二視頻文件,以使該服務(wù)器分享該第二視頻文件。
本公開實施例中,用戶可以通過社交應(yīng)用將第一視頻文件分享給好友用戶,也即以下第一種實現(xiàn)方式,用戶也可以通過社交應(yīng)用將第一視頻文件分享到信息展示平臺,也即以下第二種實現(xiàn)方式。
對于第一種實現(xiàn)方式,本步驟可以為:終端向社交應(yīng)用服務(wù)器發(fā)送該第二視頻文件、好友用戶的用戶標識;社交應(yīng)用服務(wù)器接收終端發(fā)送的該第二視頻文件和好友用戶的用戶標識,根據(jù)該好友用戶的用戶標識,將該第二視頻文件發(fā)送給好友用戶對應(yīng)的終端。
當然,終端還可以將該第二視頻文件分享到群組中,如果將該第二視頻文件分享到群組中,則本步驟可以為:終端向社交應(yīng)用服務(wù)器發(fā)送該第二視頻文件、群組標識;社交應(yīng)用服務(wù)器接收終端發(fā)送的該第二視頻文件和群組標識,根據(jù)該群組標識,將該第二視頻文件發(fā)送給該群組內(nèi)包括的用戶對應(yīng)的終端。
對于第二種實現(xiàn)方式,本步驟可以為:終端向社交應(yīng)用服務(wù)器發(fā)送該用戶的用戶標識和該第二視頻文件;社交應(yīng)用服務(wù)器接收終端發(fā)送的該用戶的用戶標識和該第二視頻文件,根據(jù)該用戶的用戶標識,將該第二視頻文件分享到該用戶的信息展示平臺中。
其中,用戶標識可以為用戶事先在社交應(yīng)用服務(wù)器中注冊的用戶賬號等。
本公開實施例中,終端向社交應(yīng)用服務(wù)器發(fā)送該第二視頻文件之前,終端可以在社交應(yīng)用的當前界面提供預(yù)覽按鈕,當終端檢測到用戶觸發(fā)預(yù)覽按鈕時,終端將該第二視頻文件顯示在終端屏幕上,以供用戶預(yù)覽。
本公開實施例提供的一種可能實現(xiàn)方式中,終端存儲第二視頻文件,以便于后續(xù)分享或觀看該第二視頻文件。
本公開實施例中,終端獲取待分享的第一視頻文件,生成該音頻數(shù)據(jù)對應(yīng)的字幕文件,并將該字幕文件插入該第一視頻文件中,生成第二視頻文件,向社交應(yīng)用發(fā)送該第二視頻文件,通過該社交應(yīng)用服務(wù)器分享該第二視頻文件。由于該第二視頻文件不僅包括圖像數(shù)據(jù)和音頻數(shù)據(jù),還包括字幕信息,因此增加了第二視頻文件的信息量。
圖3是根據(jù)一示例性實施例示出的一種分享視頻文件的裝置的框圖。參照圖3,該裝置包括第一獲取模塊301,生成模塊302,插入模塊303和發(fā)送模塊304。
第一獲取模塊301被配置為獲取待分享的第一視頻文件;
生成模塊302被配置為根據(jù)該第一視頻文件包括的音頻數(shù)據(jù),生成該音頻數(shù)據(jù)對應(yīng)的字幕文件,該字幕文件包括時間信息和與該時間信息關(guān)聯(lián)的文字信息;
插入模塊303被配置為將該字幕文件插入該第一視頻文件中,得到第二視頻文件;
發(fā)送模塊304被配置為向社交應(yīng)用服務(wù)器發(fā)送該第二視頻文件,以使該服務(wù)器分享該第二視頻文件。
在一種可能的實現(xiàn)方式中,如圖4所示,該裝置還包括:
第二獲取模塊305,被配置為獲取用戶選擇的視頻特效模板;
處理模塊306,被配置為對于該第二視頻文件中的每幀圖像包括的每一個像素點,根據(jù)該視頻特效模板,對該像素點的第一圖像數(shù)據(jù)進行處理,得到第二圖像數(shù)據(jù);
修改模塊307,被配置為將該第一圖像數(shù)據(jù)修改為該第二圖像數(shù)據(jù)。
在一種可能的實現(xiàn)方式中,該生成模塊302被配置為根據(jù)該音頻數(shù)據(jù)中的語音信息,獲取該語音信息的時間信息;識別該語音信息,得到第一文字信息,關(guān)聯(lián)該時間信息和該第一文字信息;將該時間信息和該第一文字信息,組成該字幕文件。
在一種可能的實現(xiàn)方式中,該生成模塊302被配置為識別該語音信息,得到第二文字信息;顯示文本窗口,該文本窗口包括該第二文字信息;如果檢測到用戶修正該第二文字信息中包括的字符的操作,則將該修正后的第二文字信息確定為該第一文字信息。
在一種可能的實現(xiàn)方式中,如圖5所示,該裝置還包括:
轉(zhuǎn)換模塊308,被配置為當檢測到該第一文字信息的語種與預(yù)設(shè)系統(tǒng)語種不同時,對該第一文字信息進行語種轉(zhuǎn)換;或者,當檢測到當前界面中的翻譯按鈕被觸發(fā)時,對該第一文字信息進行語種轉(zhuǎn)換。
在一種可能的實現(xiàn)方式中,該插入模塊303被配置為根據(jù)該時間信息,將該文字信息插入該第一視頻文件中,得到該第二視頻文件。
本公開實施例中,終端獲取待分享的第一視頻文件,生成該音頻數(shù)據(jù)對應(yīng)的字幕文件,并將該字幕文件插入該第一視頻文件中,生成第二視頻文件,向社交應(yīng)用發(fā)送該第二視頻文件,通過該社交應(yīng)用服務(wù)器分享該第二視頻文件。由于該第二視頻文件不僅包括圖像數(shù)據(jù)和音頻數(shù)據(jù),還包括字幕信息,因此增加了第二視頻文件的信息量。
上述所有可選技術(shù)方案,可以采用任意結(jié)合形成本公開的可選實施例,在此不再一一贅述。
需要說明的是:上述實施例提供的分享視頻文件的裝置在分享視頻文件時,僅以上述各功能模塊的劃分進行舉例說明,實際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能模塊完成,即將裝置的內(nèi)部結(jié)構(gòu)劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。另外,上述實施例提供的分享視頻文件的裝置與分享視頻文件是方法實施例屬于同一構(gòu)思,其具體實現(xiàn)過程詳見方法實施例,這里不再贅述。
圖6是根據(jù)一示例性實施例示出的一種分享視頻文件的裝置400的框圖。例如,裝置400可以是移動電話,計算機,數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺,平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備,個人數(shù)字助理等。
參照圖6,裝置400可以包括以下一個或多個組件:處理組件402,存儲器404,電源組件406,多媒體組件408,音頻組件410,輸入/輸出(I/O)接口412,傳感器組件414,以及通信組件416。
處理組件402通常控制裝置400的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相機操作和記錄操作相關(guān)聯(lián)的操作。處理組件402可以包括一個或多個處理器420來執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件402可以包括一個或多個模塊,便于處理組件402和其他組件之間的交互。例如,處理組件402可以包括多媒體模塊,以方便多媒體組件408和處理組件402之間的交互。
存儲器404被配置為存儲各種類型的數(shù)據(jù)以支持在裝置400的操作。這些數(shù)據(jù)的示例包括用于在裝置400上操作的任何應(yīng)用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù),消息,圖片,視頻等。存儲器404可以由任何類型的易失性或非易失性存儲設(shè)備或者它們的組合實現(xiàn),如靜態(tài)隨機存取存儲器(SRAM),電可擦除可編程只讀存儲器(EEPROM),可擦除可編程只讀存儲器(EPROM),可編程只讀存儲器(PROM),只讀存儲器(ROM),磁存儲器,快閃存儲器,磁盤或光盤。
電源組件406為裝置400的各種組件提供電力。電源組件406可以包括電源管理系統(tǒng),一個或多個電源,及其他與為裝置400生成、管理和分配電力相關(guān)聯(lián)的組件。
多媒體組件408包括在所述裝置400和用戶之間的提供一個輸出接口的屏幕。在一些實施例中,屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板,屏幕可以被實現(xiàn)為觸摸屏,以接收來自用戶的輸入信號。觸摸面板包括一個或多個觸摸傳感器以感測觸摸、滑動和觸摸面板上的手勢。所述觸摸傳感器可以不僅感測觸摸或滑動動作的邊界,而且還檢測與所述觸摸或滑動操作相關(guān)的持續(xù)時間和壓力。在一些實施例中,多媒體組件408包括一個前置攝像頭和/或后置攝像頭。當裝置400處于操作模式,如拍攝模式或視頻模式時,前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個前置攝像頭和后置攝像頭可以是一個固定的光學透鏡系統(tǒng)或具有焦距和光學變焦能力。
音頻組件410被配置為輸出和/或輸入音頻信號。例如,音頻組件410包括一個麥克風(MIC),當裝置400處于操作模式,如呼叫模式、記錄模式和語音識別模式時,麥克風被配置為接收外部音頻信號。所接收的音頻信號可以被進一步存儲在存儲器404或經(jīng)由通信組件416發(fā)送。在一些實施例中,音頻組件410還包括一個揚聲器,用于輸出音頻信號。
I/O接口412為處理組件402和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤,點擊輪,按鈕等。這些按鈕可包括但不限于:主頁按鈕、音量按鈕、啟動按鈕和鎖定按鈕。
傳感器組件414包括一個或多個傳感器,用于為裝置400提供各個方面的狀態(tài)評估。例如,傳感器組件414可以檢測到裝置400的打開/關(guān)閉狀態(tài),組件的相對定位,例如所述組件為裝置400的顯示器和小鍵盤,傳感器組件414還可以檢測裝置400或裝置400一個組件的位置改變,用戶與裝置400接觸的存在或不存在,裝置400方位或加速/減速和裝置400的溫度變化。傳感器組件414可以包括接近傳感器,被配置用來在沒有任何的物理接觸時檢測附近物體的存在。傳感器組件414還可以包括光傳感器,如CMOS或CCD圖像傳感器,用于在成像應(yīng)用中使用。在一些實施例中,該傳感器組件414還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。
通信組件416被配置為便于裝置400和其他設(shè)備之間有線或無線方式的通信。裝置400可以接入基于通信標準的無線網(wǎng)絡(luò),如WiFi,2G或3G,或它們的組合。在一個示例性實施例中,通信組件416經(jīng)由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號或廣播相關(guān)信息。在一個示例性實施例中,所述通信組件416還包括近場通信(NFC)模塊,以促進短程通信。例如,在NFC模塊可基于射頻識別(RFID)技術(shù),紅外數(shù)據(jù)協(xié)會(IrDA)技術(shù),超寬帶(UWB)技術(shù),藍牙(BT)技術(shù)和其他技術(shù)來實現(xiàn)。
在示例性實施例中,裝置400可以被一個或多個應(yīng)用專用集成電路(ASIC)、數(shù)字信號處理器(DSP)、數(shù)字信號處理設(shè)備(DSPD)、可編程邏輯器件(PLD)、現(xiàn)場可編程門陣列(FPGA)、控制器、微控制器、微處理器或其他電子元件實現(xiàn),用于執(zhí)行上述分享視頻文件的方法。
在示例性實施例中,還提供了一種包括指令的非臨時性計算機可讀存儲介質(zhì),例如包括指令的存儲器404,上述指令可由裝置400的處理器420執(zhí)行以完成上述方法。例如,所述非臨時性計算機可讀存儲介質(zhì)可以是ROM、隨機存取存儲器(RAM)、CD-ROM、磁帶、軟盤和光數(shù)據(jù)存儲設(shè)備等。當所述存儲介質(zhì)中的指令由終端的處理器執(zhí)行時,使得終端能夠執(zhí)行上述分享視頻文件的方法。
本領(lǐng)域技術(shù)人員在考慮說明書及實踐這里公開的發(fā)明后,將容易想到本公開的其它實施方案。本申請旨在涵蓋本公開的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開的一般性原理并包括本公開未公開的本技術(shù)領(lǐng)域中的公知常識或慣用技術(shù)手段。說明書和實施例僅被視為示例性的,本公開的真正范圍和精神由下面的權(quán)利要求指出。
應(yīng)當理解的是,本公開并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進行各種修改和改變。本公開的范圍僅由所附的權(quán)利要求來限制。