本發(fā)明涉及視頻翻譯領域,尤其涉及一種視頻翻譯方法、裝置、計算機設備及存儲介質。
背景技術:
1、隨著人們生活水平的提高,人們觀看外文視頻的機會越來越多,然而現有的外文視頻大多都是外文音頻,配上中文字幕進行觀看,不然會影響人們對于外文視頻的觀看。因此,亟待一種方法,可以解決人們觀看外文視頻語言轉換的問題。
技術實現思路
1、本發(fā)明實施例提供一種視頻翻譯方法、裝置、計算機設備及存儲介質,以解決視頻翻譯問題。
2、本申請第一方面提供一種視頻翻譯方法,包括:
3、提取視頻中的原始音頻以及視頻中的關鍵幀;
4、根據所述原始音頻以及所述關鍵幀,以判斷是否在云端已提前存儲翻譯后的目標翻譯音頻;
5、若判斷沒有提前存儲翻譯后的目標翻譯音頻,則將所述原始音頻分段轉換為目標翻譯文本;
6、提取所述原始音頻特征,以根據所述目標翻譯文本與提取到的所述原始音頻特征合成目標翻譯音頻,其中,所述提取到的所述原始音頻特征,包括對所述原始音頻的語氣特征進行提取。
7、可選地,將所述原始音頻分段轉換為目標翻譯文本,包括:
8、根據所述原始音頻的內容以及目標翻譯語種,將所述原始音頻的內容分段轉換為目標翻譯文本,并對目標翻譯文本進行語義校準。
9、可選地,將所述原始音頻分段轉換為目標翻譯文本,包括:
10、將所述原始音頻進行分割,形成若干原始音頻片段;
11、按照所述原始音頻片段播放的時間,依次獲取每一個音頻片段預計播放時間;
12、根據每一個音頻片段預計播放時間,依次將所述原始音頻片段轉換為目標翻譯文本。
13、可選地,提取所述原始音頻的特征,以根據所述目標翻譯文本與所述提取音頻特征合成目標翻譯音頻,包括:
14、提取所述原始音頻的音頻特征,對所述原始音頻的音頻特征進行分析;
15、根據所述音頻特征分析結果以及所述目標翻譯文本,生成與原始音頻特征相同的所述目標翻譯音頻。
16、可選地,根據每一個音頻片段預計播放時間,依次將所述原始音頻片段轉換為目標翻譯文本,之前包括:
17、檢查所述原始音頻的翻譯進度,判斷是否還有所述原始音頻未翻譯;
18、若存在未翻譯音頻,根據音頻片段預計播放時間,計算目標翻譯音頻生成時間;
19、根據所述目標翻譯音頻生成時間,依次將所述原始音頻片段轉換為目標翻譯文本。
20、可選地,合成目標翻譯音頻,之后包括:
21、將所述原始音頻替換為目標翻譯音頻;
22、將目標翻譯音頻和視頻動畫進行融合,形成翻譯后的目標視頻。
23、本申請第二方面提供一種視頻翻譯裝置,包括:
24、音頻提取模塊,用于提取視頻中的原始音頻以及視頻中的關鍵幀;
25、判斷模塊,根據所述原始音頻以及所述關鍵幀,以判斷是否在云端已提前存儲翻譯后的目標翻譯音頻;
26、第一音頻處理模塊,用于若判斷沒有提前存儲翻譯后的目標翻譯音頻,則將所述原始音頻轉換為目標翻譯文本;
27、第二音頻處理模塊,提取所述原始音頻特征,以根據所述目標翻譯文本與提取到的所述原始音頻特征合成目標翻譯音頻,其中,所述提取到的所述原始音頻特征,包括對所述原始音頻的語氣特征進行提??;
28、音頻輸出模塊,將所述原始音頻替換為目標翻譯音頻。
29、可選地,第二音頻處理模塊,包括:
30、提取所述原始音頻的音頻特征,對所述原始音頻的音頻特征進行分析;
31、根據所述音頻特征分析結果以及所述目標翻譯文本,生成與原始音頻特征相同的所述目標翻譯音頻。
32、本申請第三方面提供一種計算機設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現上述視頻翻譯方法。
33、本申請第四方面提供一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現上述視頻翻譯方法。
34、上述視頻翻譯方法、裝置、計算機設備及存儲介質,通過提取視頻中的原始音頻以及視頻中的關鍵幀;根據所述原始音頻以及所述關鍵幀,以判斷是否在云端已提前存儲翻譯后的目標翻譯音頻;若判斷沒有提前存儲翻譯后的目標翻譯音頻,則將所述原始音頻轉換為目標翻譯文本;提取所述原始音頻特征,以根據所述目標翻譯文本與提取到的所述原始音頻特征合成目標翻譯音頻,其中,所述提取到的所述原始音頻特征,包括對所述原始音頻的語氣特征進行提??;將所述原始音頻替換為目標翻譯音頻。本申請通過判斷云端存儲目標翻譯音頻是否存在和分段翻譯,從而最大化縮短視頻翻譯后加載時長,以提升用戶視頻觀看的流暢度。
1.一種視頻翻譯方法,其特征在于,包括:
2.根據權利要求1所述的視頻翻譯方法,其特征在于,將所述原始音頻分段轉換為目標翻譯文本,包括:
3.根據權利要求1所述的視頻翻譯方法,其特征在于,將所述原始音頻分段轉換為目標翻譯文本,包括:
4.根據權利要求1所述的視頻翻譯方法,其特征在于,提取所述原始音頻的特征,以根據所述目標翻譯文本與所述提取音頻特征合成目標翻譯音頻,包括:
5.根據權利要求3所述的視頻翻譯方法,其特征在于,根據每一個音頻片段預計播放時間,依次將所述原始音頻片段轉換為目標翻譯文本,之前包括:
6.根據權利要求1所述的視頻翻譯方法,其特征在于,合成目標翻譯音頻,之后包括:
7.一種視頻翻譯裝置,其特征在于,提取所述原始音頻的特征,包括:
8.根據權利要求7所述的視頻翻譯裝置,其特征在于,第二音頻處理模塊,包括:
9.一種計算機設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序時實現根據權利要求1至6任一項所述視頻翻譯方法。
10.一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現根據權利要求1至6任一項所述視頻翻譯方法。