欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種字幕對(duì)準(zhǔn)方法及裝置與流程

文檔序號(hào):12598532閱讀:來源:國知局

技術(shù)特征:

1.一種字幕校準(zhǔn)方法,其特征在于,所述方法包括下述步驟:

獲取音視頻數(shù)據(jù)和初始字幕數(shù)據(jù);

對(duì)所述音視頻數(shù)據(jù)進(jìn)行語音識(shí)別,確定音色對(duì)應(yīng)的語音區(qū)間,根據(jù)所述語音區(qū)間生成帶時(shí)間軸的第一字幕,并對(duì)所述音視頻數(shù)據(jù)進(jìn)行語音轉(zhuǎn)換得到轉(zhuǎn)換文本信息;

依據(jù)所述初始字幕數(shù)據(jù)和/或所述轉(zhuǎn)換文本信息對(duì)所述帶時(shí)間軸的第一字幕進(jìn)行校準(zhǔn),依據(jù)所述校準(zhǔn)結(jié)果生成帶時(shí)間軸的第二字幕。

2.如權(quán)利要求1所述的方法,其特征在于,所述依據(jù)所述初始字幕數(shù)據(jù)和/或轉(zhuǎn)換文本信息對(duì)所述帶時(shí)間軸的第一字幕進(jìn)行校準(zhǔn),依據(jù)所述校準(zhǔn)結(jié)果生成帶時(shí)間軸的第二字幕,包括:

將所述初始字幕數(shù)據(jù)與所述帶時(shí)間軸的第一字幕進(jìn)行語音區(qū)間的校準(zhǔn);和/或

將所述初始字幕數(shù)據(jù)與所述轉(zhuǎn)換文本信息比對(duì),依據(jù)所述比對(duì)結(jié)果與所述帶時(shí)間軸的第一字幕進(jìn)行字與字的校準(zhǔn)。

3.如權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述音視頻數(shù)據(jù)進(jìn)行語音識(shí)別,確定音色對(duì)應(yīng)的語音區(qū)間,生成帶時(shí)間軸的第一字幕,并對(duì)所述音視頻數(shù)據(jù)進(jìn)行語音轉(zhuǎn)換,得到轉(zhuǎn)換文本信息,包括:

識(shí)別所述音視頻數(shù)據(jù)中包含的音色標(biāo)識(shí)以及所述音色標(biāo)識(shí)對(duì)應(yīng)的語音區(qū)間,生成所述音色標(biāo)識(shí)對(duì)應(yīng)的字幕,所述帶時(shí)間軸的第一字幕包括所述音色標(biāo)識(shí)對(duì)應(yīng)的字幕。

4.如權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述音視頻數(shù)據(jù)進(jìn)行語音識(shí)別,確定音色對(duì)應(yīng)的語音區(qū)間,生成帶時(shí)間軸的第一字幕,并對(duì)所述音視頻數(shù)據(jù)進(jìn)行語音轉(zhuǎn)換得到轉(zhuǎn)換文本信息,包括:

計(jì)算所述音視頻數(shù)據(jù)的能量和過零率,由所述計(jì)算結(jié)果確定所述語音區(qū)間;所述語音區(qū)間包括有聲區(qū)間和無聲區(qū)間。

5.如權(quán)利要求1所述的方法,其特征在于,所述依據(jù)所述初始字幕數(shù)據(jù)和/或所述轉(zhuǎn)換文本信息對(duì)所述帶時(shí)間軸的第一字幕進(jìn)行校準(zhǔn),依據(jù)所述校準(zhǔn)結(jié)果生成帶時(shí)間軸的第二字幕之后,所述方法還包括:

在接收到對(duì)所述帶時(shí)間軸的第二字幕的修改反饋信息時(shí),標(biāo)識(shí)修改反饋對(duì)應(yīng)的語音區(qū)間,并進(jìn)行自修正。

6.一種字幕校準(zhǔn)裝置,其特征在于,所述裝置包括:

獲取模塊,用于獲取音視頻數(shù)據(jù)和初始字幕數(shù)據(jù);

識(shí)別模塊,用于對(duì)所述獲取模塊獲取的音視頻數(shù)據(jù)進(jìn)行語音識(shí)別,確定音色對(duì)應(yīng)的語音區(qū)間,根據(jù)所述語音區(qū)間生成帶時(shí)間軸的第一字幕,并對(duì)所述音視頻數(shù)據(jù)進(jìn)行語音轉(zhuǎn)換得到轉(zhuǎn)換文本信息;

校準(zhǔn)模塊,用于依據(jù)所述獲取模塊獲取的初始字幕數(shù)據(jù)和/或所述識(shí)別模塊得到的轉(zhuǎn)換文本信息對(duì)所述帶時(shí)間軸的第一字幕進(jìn)行校準(zhǔn),依據(jù)所述校準(zhǔn)結(jié)果生成帶時(shí)間軸的第二字幕。

7.如權(quán)利要求6所述的裝置,其特征在于,所述校準(zhǔn)模塊包括:區(qū)間校準(zhǔn)單元和/或字字校準(zhǔn)單元;

所述區(qū)間校準(zhǔn)單元,用于將所述初始字幕數(shù)據(jù)與所述帶時(shí)間軸的第一字幕進(jìn)行語音區(qū)間的校準(zhǔn);

所述字字校準(zhǔn)單元,用于將所述初始字幕數(shù)據(jù)與所述轉(zhuǎn)換文本信息比對(duì),依據(jù)所述比對(duì)結(jié)果與所述帶時(shí)間軸的第一字幕進(jìn)行字與字的校準(zhǔn)。

8.如權(quán)利要求6所述的裝置,其特征在于,所述識(shí)別模塊包括:

音色識(shí)別單元,用于識(shí)別所述音視頻數(shù)據(jù)中包含的音色標(biāo)識(shí)以及所述音色標(biāo)識(shí)對(duì)應(yīng)的語音區(qū)間,生成所述音色標(biāo)識(shí)對(duì)應(yīng)的字幕,所述帶時(shí)間軸的第一字幕包括所述音色標(biāo)識(shí)對(duì)應(yīng)的字幕。

9.如權(quán)利要求6所述的裝置,其特征在于,所述識(shí)別模塊包括:

區(qū)間計(jì)算單元,用于計(jì)算所述音視頻數(shù)據(jù)的能量和過零率,由所述計(jì)算結(jié)果確定所述語音區(qū)間;所述語音區(qū)間包括有聲區(qū)間和無聲區(qū)間。

10.如權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括:

自修正模塊,用于在接收到對(duì)所述帶時(shí)間軸的第二字幕的修改反饋信息時(shí),標(biāo)識(shí)修改反饋對(duì)應(yīng)的語音區(qū)間,并進(jìn)行自修正。

當(dāng)前第2頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
朝阳县| 喀喇沁旗| 阿克苏市| 洞头县| 阳朔县| 闵行区| 和田县| 兰州市| 鸡泽县| 库车县| 敦化市| 沧州市| 蒲江县| 梧州市| 甘谷县| 嘉荫县| 常德市| 米泉市| 虹口区| 青岛市| 南乐县| 龙海市| 石首市| 普安县| 新竹市| 长兴县| 宿州市| 潞城市| 会宁县| 云霄县| 十堰市| 股票| 浮梁县| 兴文县| 葫芦岛市| 高淳县| 南郑县| 兴宁市| 将乐县| 桐乡市| 天柱县|