欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

視頻翻譯方法、裝置、計算機設備及存儲介質與流程

文檔序號:40817062發(fā)布日期:2025-01-29 02:35閱讀:22來源:國知局
視頻翻譯方法、裝置、計算機設備及存儲介質與流程

本發(fā)明涉及視頻翻譯領域,尤其涉及一種視頻翻譯方法、裝置、計算機設備及存儲介質。


背景技術:

1、隨著人們生活水平的提高,人們觀看外文視頻的機會越來越多,然而現有的外文視頻大多都是外文音頻,配上中文字幕進行觀看,不然會影響人們對于外文視頻的觀看。因此,亟待一種方法,可以解決人們觀看外文視頻語言轉換的問題。


技術實現思路

1、本發(fā)明實施例提供一種視頻翻譯方法、裝置、計算機設備及存儲介質,以解決視頻翻譯問題。

2、本申請第一方面提供一種視頻翻譯方法,包括:

3、提取視頻中的原始音頻以及視頻中的關鍵幀;

4、根據所述原始音頻以及所述關鍵幀,以判斷是否在云端已提前存儲翻譯后的目標翻譯音頻;

5、若判斷沒有提前存儲翻譯后的目標翻譯音頻,則將所述原始音頻分段轉換為目標翻譯文本;

6、提取所述原始音頻特征,以根據所述目標翻譯文本與提取到的所述原始音頻特征合成目標翻譯音頻,其中,所述提取到的所述原始音頻特征,包括對所述原始音頻的語氣特征進行提取。

7、可選地,將所述原始音頻分段轉換為目標翻譯文本,包括:

8、根據所述原始音頻的內容以及目標翻譯語種,將所述原始音頻的內容分段轉換為目標翻譯文本,并對目標翻譯文本進行語義校準。

9、可選地,將所述原始音頻分段轉換為目標翻譯文本,包括:

10、將所述原始音頻進行分割,形成若干原始音頻片段;

11、按照所述原始音頻片段播放的時間,依次獲取每一個音頻片段預計播放時間;

12、根據每一個音頻片段預計播放時間,依次將所述原始音頻片段轉換為目標翻譯文本。

13、可選地,提取所述原始音頻的特征,以根據所述目標翻譯文本與所述提取音頻特征合成目標翻譯音頻,包括:

14、提取所述原始音頻的音頻特征,對所述原始音頻的音頻特征進行分析;

15、根據所述音頻特征分析結果以及所述目標翻譯文本,生成與原始音頻特征相同的所述目標翻譯音頻。

16、可選地,根據每一個音頻片段預計播放時間,依次將所述原始音頻片段轉換為目標翻譯文本,之前包括:

17、檢查所述原始音頻的翻譯進度,判斷是否還有所述原始音頻未翻譯;

18、若存在未翻譯音頻,根據音頻片段預計播放時間,計算目標翻譯音頻生成時間;

19、根據所述目標翻譯音頻生成時間,依次將所述原始音頻片段轉換為目標翻譯文本。

20、可選地,合成目標翻譯音頻,之后包括:

21、將所述原始音頻替換為目標翻譯音頻;

22、將目標翻譯音頻和視頻動畫進行融合,形成翻譯后的目標視頻。

23、本申請第二方面提供一種視頻翻譯裝置,包括:

24、音頻提取模塊,用于提取視頻中的原始音頻以及視頻中的關鍵幀;

25、判斷模塊,根據所述原始音頻以及所述關鍵幀,以判斷是否在云端已提前存儲翻譯后的目標翻譯音頻;

26、第一音頻處理模塊,用于若判斷沒有提前存儲翻譯后的目標翻譯音頻,則將所述原始音頻轉換為目標翻譯文本;

27、第二音頻處理模塊,提取所述原始音頻特征,以根據所述目標翻譯文本與提取到的所述原始音頻特征合成目標翻譯音頻,其中,所述提取到的所述原始音頻特征,包括對所述原始音頻的語氣特征進行提??;

28、音頻輸出模塊,將所述原始音頻替換為目標翻譯音頻。

29、可選地,第二音頻處理模塊,包括:

30、提取所述原始音頻的音頻特征,對所述原始音頻的音頻特征進行分析;

31、根據所述音頻特征分析結果以及所述目標翻譯文本,生成與原始音頻特征相同的所述目標翻譯音頻。

32、本申請第三方面提供一種計算機設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現上述視頻翻譯方法。

33、本申請第四方面提供一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現上述視頻翻譯方法。

34、上述視頻翻譯方法、裝置、計算機設備及存儲介質,通過提取視頻中的原始音頻以及視頻中的關鍵幀;根據所述原始音頻以及所述關鍵幀,以判斷是否在云端已提前存儲翻譯后的目標翻譯音頻;若判斷沒有提前存儲翻譯后的目標翻譯音頻,則將所述原始音頻轉換為目標翻譯文本;提取所述原始音頻特征,以根據所述目標翻譯文本與提取到的所述原始音頻特征合成目標翻譯音頻,其中,所述提取到的所述原始音頻特征,包括對所述原始音頻的語氣特征進行提??;將所述原始音頻替換為目標翻譯音頻。本申請通過判斷云端存儲目標翻譯音頻是否存在和分段翻譯,從而最大化縮短視頻翻譯后加載時長,以提升用戶視頻觀看的流暢度。



技術特征:

1.一種視頻翻譯方法,其特征在于,包括:

2.根據權利要求1所述的視頻翻譯方法,其特征在于,將所述原始音頻分段轉換為目標翻譯文本,包括:

3.根據權利要求1所述的視頻翻譯方法,其特征在于,將所述原始音頻分段轉換為目標翻譯文本,包括:

4.根據權利要求1所述的視頻翻譯方法,其特征在于,提取所述原始音頻的特征,以根據所述目標翻譯文本與所述提取音頻特征合成目標翻譯音頻,包括:

5.根據權利要求3所述的視頻翻譯方法,其特征在于,根據每一個音頻片段預計播放時間,依次將所述原始音頻片段轉換為目標翻譯文本,之前包括:

6.根據權利要求1所述的視頻翻譯方法,其特征在于,合成目標翻譯音頻,之后包括:

7.一種視頻翻譯裝置,其特征在于,提取所述原始音頻的特征,包括:

8.根據權利要求7所述的視頻翻譯裝置,其特征在于,第二音頻處理模塊,包括:

9.一種計算機設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序時實現根據權利要求1至6任一項所述視頻翻譯方法。

10.一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現根據權利要求1至6任一項所述視頻翻譯方法。


技術總結
本發(fā)明公開了一種視頻翻譯方法、裝置、計算機設備及存儲介質,通過提取視頻中的原始音頻以及視頻中的關鍵幀;根據所述原始音頻以及所述關鍵幀,以判斷是否在云端已提前存儲翻譯后的目標翻譯音頻;若判斷沒有提前存儲翻譯后的目標翻譯音頻,則將所述原始音頻轉換為目標翻譯文本;提取所述原始音頻特征,以根據所述目標翻譯文本與提取到的所述原始音頻特征合成目標翻譯音頻,其中,所述提取到的所述原始音頻特征,包括對所述原始音頻的語氣特征進行提??;將所述原始音頻替換為目標翻譯音頻。本申請通過判斷云端存儲目標翻譯音頻是否存在和分段翻譯,從而最大化縮短視頻翻譯后加載時長,以提升用戶視頻觀看的流暢度。

技術研發(fā)人員:盧銀奇
受保護的技術使用者:深圳市酷開網絡科技股份有限公司
技術研發(fā)日:
技術公布日:2025/1/28
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
鄂伦春自治旗| 江源县| 尼木县| 河池市| 福州市| 锦州市| 海丰县| 平泉县| 拉萨市| 清流县| 乌兰察布市| 邮箱| 叶城县| 阿拉尔市| 保康县| 信阳市| 芮城县| 石河子市| 罗源县| 和平县| 山阳县| 密云县| 黑河市| 宜春市| 浦城县| 乌拉特中旗| 长顺县| 西乌珠穆沁旗| 白朗县| 巫溪县| 恩施市| 荥阳市| 辽宁省| 天门市| 朔州市| 宁晋县| 临城县| 高州市| 奈曼旗| 达州市| 东乡县|