欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

語音字幕的生成和裝置、播放方法和裝置的制造方法_3

文檔序號:9263786閱讀:來源:國知局
0097]其中,在上述音頻信息的類別為非人物對話類別時(shí),則當(dāng)前視頻片段需要插入語音字幕,將當(dāng)前視頻片段確定為目標(biāo)視頻片段;
[0098]步驟503、將當(dāng)前音頻類別對應(yīng)的視頻片段作為目標(biāo)視頻片段,并提取目標(biāo)視頻片段的視頻特征;
[0099]步驟504、計(jì)算上述目標(biāo)視頻片段的評論信息與上述視頻特征的相似度;
[0100]步驟505、確定上述相似度最大的上述評論信息為上述目標(biāo)視頻片段的文本信息;
[0101]步驟506、依據(jù)上述文本描述信息,生成上述目標(biāo)視頻片段的語音字幕;
[0102]步驟507、將上述語音字幕合成到上述目標(biāo)視頻片段對應(yīng)的音頻中。
[0103]本發(fā)明實(shí)施例中,步驟501中識別視頻對應(yīng)音頻信息的類別是一個(gè)動態(tài)的過程,是持續(xù)讀取一個(gè)完整視頻所對應(yīng)的音頻信息的過程。
[0104]參照圖6,示出了本發(fā)明的一種播放方法實(shí)施例的步驟流程圖,具體可以包括如下步驟:
[0105]步驟601、接收視頻加載請求;
[0106]本發(fā)明實(shí)施例中,可以在視頻播放頁面上提供兩種視頻加載請求的觸發(fā)控件,具體可以包括:打開語音字幕請求的觸發(fā)控件I和不打開語音字幕請求的觸發(fā)控件2等。
[0107]步驟602、依據(jù)上述視頻加載請求,確定對應(yīng)視頻的音頻信息;其中,所述音頻中具體可以包括:普通音頻和語音字幕;上述語音字幕為利用前述實(shí)施例一至實(shí)施例五中任一所述的語音字幕的生成方法得到;
[0108]其中,普通音頻可以為視頻對應(yīng)的原始音頻信息,即未插入語音字幕情況下的音頻信息。
[0109]本發(fā)明實(shí)施例中,若視頻加載請求為觸發(fā)控件I對應(yīng)的請求,則所述音頻信息具體可以包括普通音頻和語音字幕;若視頻加載請求為觸發(fā)控件2對應(yīng)的請求,則所述音頻信息可以包括普通音頻,本發(fā)明實(shí)施例主要應(yīng)用在視頻加載請求對應(yīng)打開語音字幕請求的場景下。
[0110]步驟603、播放所述音頻。
[0111]綜上,由于本發(fā)明實(shí)施例提供的語音字幕的播放方法,可以對視頻中非人物對話的視頻片段進(jìn)行人物語音的描述,方便了無法正常觀看視頻的人進(jìn)行觀賞視頻,如:盲人,做跑步等運(yùn)動的人等等。
[0112]需要說明的是,對于方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明實(shí)施例并不受所描述的動作順序的限制,因?yàn)橐罁?jù)本發(fā)明實(shí)施例,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動作并不一定是本發(fā)明實(shí)施例所必須的。
[0113]參照圖7,示出了本發(fā)明一種語音字幕的生成裝置實(shí)施例一的結(jié)構(gòu)示意圖,具體可以包括:提取模塊701、第一確定模塊702及生成模塊703 ;其中,
[0114]提取模塊701,用于提取目標(biāo)視頻片段的視頻特征;
[0115]第一確定模塊702,用于將與上述視頻特征最匹配的評論信息確定為上述目標(biāo)視頻片段的文本描述信息;及
[0116]生成模塊703,用于依據(jù)上述文本描述信息,生成上述目標(biāo)視頻片段的語音字幕。
[0117]綜上,本發(fā)明實(shí)施例提供的一種語音字幕的生成裝置,將目標(biāo)視頻片段的視頻特征與評論信息相結(jié)合,確定與上述視頻特征最匹配的評論信息為上述目標(biāo)視頻片段的文本描述信息,并依據(jù)上述文本描述信息生成語音字幕。采用本發(fā)明實(shí)施例提供的一種語音字幕的生成裝置,可以自動化的為視頻生成語音字幕,由于生成的語音字幕在內(nèi)容上是在將視頻片段中的前后場景關(guān)聯(lián)基礎(chǔ)上對當(dāng)前視頻片段提交的描述性的文字信息,因此對目標(biāo)視頻片段的描述較為精準(zhǔn);相對于人工的做法,本發(fā)明實(shí)施例提供的一種語音字幕的生成裝置不僅節(jié)約了成本,而且提高了生產(chǎn)效率和產(chǎn)量。
[0118]參照圖8,示出了本發(fā)明一種語音字幕的生成裝置實(shí)施例二的結(jié)構(gòu)示意圖,具體可以包括:識別模塊801、第二確定模塊802、提取模塊803、第一確定模塊804及生成模塊805 ;其中,
[0119]識別模塊801,用于識別視頻對應(yīng)音頻信息的類別;其中,上述音頻信息的類別包括人物對話類別和非人物對話類別;
[0120]第二確定模塊802,用于在上述音頻信息的類別為非人物對話類別時(shí),將當(dāng)前視頻片段作為目標(biāo)視頻片段。
[0121]提取模塊803,用于提取上述目標(biāo)視頻片段的視頻特征;
[0122]第一確定模塊804,用于將與上述視頻特征最匹配的評論信息確定為上述目標(biāo)視頻片段的文本描述信息;及
[0123]生成模塊805,用于依據(jù)上述文本描述信息,生成上述目標(biāo)視頻片段的語音字幕;
[0124]綜上,本發(fā)明實(shí)施例提供的一種語音字幕的生成裝置,通過識別音頻信息的類別,確定音頻信息的類別為非人物對話類別處的視頻片段為目標(biāo)視頻片段,可以更準(zhǔn)確的找到需要插入語音字幕的視頻片段,并在該目標(biāo)視頻片段處生成并插入語音字幕,不僅可以對不通過直接觀看視頻片段而無法得到相關(guān)信息的視頻片段進(jìn)行語音字幕的生成和插入,還可以避免語音字幕對于普通音頻造成的干擾和混淆的問題。
[0125]參照圖9,示出了本發(fā)明一種語音字幕的生成裝置實(shí)施例三的結(jié)構(gòu)示意圖,具體可以包括:識別模塊901、第二確定模塊902、提取模塊903、第一確定模塊904及生成模塊905 ;其中,
[0126]識別模塊901,用于識別視頻對應(yīng)音頻信息的類別;其中,上述音頻信息的類別包括人物對話類別和非人物對話類別;
[0127]第二確定模塊902,用于在上述音頻信息的類別為非人物對話類別時(shí),將當(dāng)前視頻片段作為目標(biāo)視頻片段。
[0128]提取模塊903,用于提取上述目標(biāo)視頻片段的視頻特征;
[0129]第一確定模塊904,用于將與上述視頻特征最匹配的評論信息確定為上述目標(biāo)視頻片段的文本描述信息;及
[0130]生成模塊905,用于依據(jù)上述文本描述信息,生成上述目標(biāo)視頻片段的語音字幕;
[0131]其中,識別模塊901可以包括:識別單元9011 ;
[0132]上述識別單元9011,用于使用語音活性檢測技術(shù)識別上述視頻對應(yīng)音頻信息的類別。
[0133]綜上,采用本發(fā)明實(shí)施例提供的一種語音字幕的生成裝置,通過計(jì)算目標(biāo)視頻片段的評論信息與上述視頻特征的相似度,確定上述相似度最大的上述評論信息為上述目標(biāo)視頻片段的文本信息,并根據(jù)文本信息,生成上述目標(biāo)視頻片段的語音字幕,生成的語音字幕對目標(biāo)視頻片段的描述較為精準(zhǔn)。
[0134]參照圖10,示出了本發(fā)明一種語音字幕的生成裝置實(shí)施例四的結(jié)構(gòu)示意圖,具體可以包括:提取模塊1001、第一確定模塊1002及生成模塊1003 ;其中,
[0135]提取模塊1001,用于提取目標(biāo)視頻片段的視頻特征;
[0136]第一確定模塊1002,用于將與上述視頻特征最匹配的評論信息確定為上述目標(biāo)視頻片段的文本描述信息;及
[0137]生成模塊1003,用于依據(jù)上述文本描述信息,生成上述目標(biāo)視頻片段的語音字蒂;
[0138]其中,第一確定模塊1002可以包括:計(jì)算單元10021及確定單元10022 ;其中,
[0139]計(jì)算單元10021,用于計(jì)算上述目標(biāo)視頻片段的評論信息與上述視頻特征的相似度;
[0140]確定單元10022,用于確定上述相似度最大的上述評論信息為上述目標(biāo)視頻片段的文本信息。
[0141]參照圖11,示出了本發(fā)明一種語音字幕的生成裝置實(shí)施例五的結(jié)構(gòu)示意圖,具體可以包括:提取模塊1101、第一確定模塊1102、生成模塊1103及合成模塊1104 ;其中,
[0142]提取模塊1101,用于提取目標(biāo)視頻片段的視頻特征;
[0143]第一確定模塊1102,用于將與上述視頻特征最匹配的評論信息確定為上述目標(biāo)視頻片段的文本描述信息;
[0144]生成模塊1103,用于依據(jù)上述文本描述信息,生成上述目標(biāo)視頻片段的語音字幕;及
[0145]合成模塊1104,用于將上述語音字幕合
當(dāng)前第3頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
宁国市| 厦门市| 彭山县| 奉贤区| 寻乌县| 庆安县| 北海市| 五寨县| 广宁县| 长海县| 馆陶县| 股票| 怀化市| 锦屏县| 水富县| 康平县| 阆中市| 玉环县| 宽城| 长宁县| 门头沟区| 旅游| 邻水| 平山县| 内乡县| 丰原市| 龙海市| 宣汉县| 福州市| 杂多县| 贺兰县| 金堂县| 清涧县| 万州区| 揭阳市| 邯郸市| 石林| 塔城市| 新巴尔虎右旗| 延长县| 环江|