欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

新增口說語匯的語音識(shí)別系統(tǒng)與方法

文檔序號(hào):9218167閱讀:607來源:國知局
新增口說語匯的語音識(shí)別系統(tǒng)與方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種新增口說語匯(spoken vocabulary)的語音識(shí)別系統(tǒng)與方法。
【背景技術(shù)】
[0002]語音識(shí)別模塊/系統(tǒng)在運(yùn)行之前,常需預(yù)先設(shè)定好辨識(shí)的語匯與聲學(xué)模型,并且為該語匯建構(gòu)辨識(shí)時(shí)期所需的搜尋網(wǎng)絡(luò),以便在辨識(shí)時(shí)能引用該搜尋網(wǎng)絡(luò)與聲學(xué)模型進(jìn)行辨識(shí)。因此,該語音識(shí)別模塊/系統(tǒng)在應(yīng)用之前,需要在脫機(jī)階段做好事前的準(zhǔn)備工作。
[0003]在實(shí)際應(yīng)用上,當(dāng)預(yù)先設(shè)定的語匯并非使用者所習(xí)慣的語匯,或是使用者日常所使用的語言/腔調(diào)與該語音識(shí)別模塊/系統(tǒng)的設(shè)定不一致時(shí),例如,一個(gè)結(jié)合居家操控的語音識(shí)別器提供臺(tái)灣腔中文聲學(xué)模型與一組語匯,如「打開電燈」、「打開冷氣」、...等,讓使用者對(duì)居家電器設(shè)備進(jìn)行語音操控,而用戶習(xí)慣用臺(tái)語,或者想用「開燈」來取代原本設(shè)定的「打開電燈」語匯,或者使用上辨識(shí)效果不佳時(shí),可能會(huì)降低使用者的使用意愿。此時(shí),前述的語音識(shí)別器,往往需要根據(jù)使用者的習(xí)慣做客制化設(shè)計(jì)或調(diào)整。
[0004]有一技術(shù)使用一圖形化接口來增加新語匯。新增的語匯透過拼音數(shù)據(jù)庫比對(duì),得到對(duì)應(yīng)的新語匯的拼音,再將此新語匯增加到語音識(shí)別字典中。有一新增語匯的技術(shù)透過一歧異性偵測(cè)器(ambiguity detect1n engine)來偵測(cè)輸入的語匯是否與已存在的語匯有歧異性;當(dāng)沒有歧異性時(shí),回饋給使用者并詢問是否做一新增語匯的動(dòng)作。有一技術(shù)依據(jù)音素結(jié)構(gòu)(phonetic structure),執(zhí)行輸入的聲學(xué)數(shù)據(jù)(acoustic data)的語匯元素特定型態(tài)聲學(xué)音素錄制、語匯元素型態(tài)的分類、以及語匯元素特定型態(tài)音素至字母形式轉(zhuǎn)換(phoneme-to-grapheme convers1n),來產(chǎn)生語匯元素。有一技術(shù)先偵測(cè)輸入的語匯是否與已存在的多個(gè)語匯的一語匯實(shí)質(zhì)上匹配,是的話,將該同義詞替代該語匯并請(qǐng)求打算使用該語匯的用戶的輸入語音新增該同義詞。有一技術(shù)透過麥克風(fēng)逐字輸入欲增加的語匯,并提供一種增加語匯的操作接口。
[0005]現(xiàn)有含語音識(shí)別功能的產(chǎn)品有地域性的限制。不同地區(qū)因口音或語系差異,需要做客制化設(shè)計(jì)與足夠的發(fā)展時(shí)程。例如,需要收集該地區(qū)大量的語音數(shù)據(jù)來涵蓋該地區(qū)可能的年齡層與口音,并檢驗(yàn)這些語料的質(zhì)量,以及訓(xùn)練適用于該地區(qū)的聲學(xué)模型等。
[0006]在上述及/或現(xiàn)行的語匯產(chǎn)生的的語音識(shí)別技術(shù)或產(chǎn)品中,有的需要根據(jù)不同地區(qū)口音,做客制化設(shè)計(jì)。有的需預(yù)先設(shè)定好識(shí)別的語匯與聲學(xué)模型,以便在識(shí)別時(shí)能引用該搜尋網(wǎng)絡(luò)與聲學(xué)模型進(jìn)行識(shí)別;在實(shí)際應(yīng)用上,需要根據(jù)使用者的習(xí)慣做客制化設(shè)計(jì)或調(diào)整。所以,能夠提供一個(gè)可根據(jù)使用者需求來做調(diào)整的語音識(shí)別模塊/系統(tǒng),以讓用戶方便的進(jìn)行操控,并且能夠減輕技術(shù)提供者的負(fù)擔(dān),以讓技術(shù)可被廣泛的應(yīng)用是目前研發(fā)的重點(diǎn)。

【發(fā)明內(nèi)容】

[0007]本發(fā)明的實(shí)施例可提供一種新增口說語匯的語音識(shí)別系統(tǒng)與方法。
[0008]本發(fā)明的一實(shí)施例是關(guān)于一種新增口說語匯的語音識(shí)別系統(tǒng)。此系統(tǒng)可包含至少一輸入設(shè)備、一模式偵測(cè)(mode detect1n)模塊、一語音訓(xùn)練模塊、以及一語音識(shí)別模塊。此輸入設(shè)備接收多個(gè)輸入信號(hào),此多個(gè)輸入信號(hào)至少包括一段聲音信號(hào)(sound signal)。此模式偵測(cè)模塊偵測(cè)此多個(gè)輸入信號(hào),當(dāng)偵測(cè)出該段聲音信號(hào)中存在一特定聲音事件或是該多個(gè)輸入信號(hào)還包括該段聲音信號(hào)以外的至少一控制信號(hào)時(shí),輸出一語音訓(xùn)練模式,當(dāng)偵測(cè)出該段聲音信號(hào)中不存在該特定聲音事件并且該多個(gè)輸入信號(hào)中不存在此段聲音信號(hào)以外的該至少一控制信號(hào)時(shí),輸出一語音識(shí)別模式。此語音訓(xùn)練模塊接收該語音訓(xùn)練模式,并對(duì)該段聲音信號(hào)進(jìn)行一訓(xùn)練處理后,輸出一訓(xùn)練結(jié)果。此語音識(shí)別模塊接收該語音識(shí)別模式,并對(duì)該段聲音信號(hào)進(jìn)行一語音識(shí)別處理后,輸出一辨識(shí)結(jié)果。
[0009]本發(fā)明的另一實(shí)施例是關(guān)于一種新增口說語匯的語音識(shí)別方法。此方法可包含:利用至少一輸入設(shè)備接收多個(gè)輸入信號(hào),此多個(gè)輸入信號(hào)至少包括一段聲音信號(hào),并利用一模式偵測(cè)模塊偵測(cè)此多個(gè)輸入信號(hào);當(dāng)偵測(cè)出該段聲音信號(hào)中存在一特定聲音事件或是該多個(gè)輸入信號(hào)還包括該段聲音信號(hào)以外的至少一控制信號(hào)時(shí),輸出一語音訓(xùn)練模式,由一語音訓(xùn)練模塊對(duì)該段聲音信號(hào)進(jìn)行一訓(xùn)練處理后,輸出一訓(xùn)練結(jié)果;以及當(dāng)偵測(cè)出該段聲音信號(hào)中不存在該特定聲音事件并且是該多個(gè)輸入信號(hào)中不存在此段聲音信號(hào)以外的該至少一控制信號(hào)時(shí),輸出一語音識(shí)別模式,由一語音識(shí)別模塊對(duì)該段聲音信號(hào)進(jìn)行一語音識(shí)別處理后,輸出一辨識(shí)結(jié)果。
[0010]下面將結(jié)合下列圖示、實(shí)施例的詳細(xì)說明及申請(qǐng)專利范圍,將詳細(xì)描述上述及本發(fā)明的其他優(yōu)點(diǎn)。
【附圖說明】
[0011]圖1是根據(jù)本發(fā)明的一實(shí)施例,說明一種新增口說語匯的語音識(shí)別系統(tǒng)。
[0012]圖2是根據(jù)本發(fā)明的一實(shí)施例,說明新增口說語匯的語音識(shí)別系統(tǒng)的一應(yīng)用范例。
[0013]圖3是根據(jù)本發(fā)明的一實(shí)施例,說明新增口說語匯的語音識(shí)別系統(tǒng)的另一應(yīng)用范例。
[0014]圖4(A)是根據(jù)本發(fā)明的一實(shí)施例,說明聲音事件偵測(cè)模塊進(jìn)行關(guān)鍵詞萃取,取得此特定關(guān)鍵詞存在于輸入的一段聲音信號(hào)的分段時(shí)間標(biāo)記的一范例示意圖。
[0015]圖4(B)是根據(jù)本發(fā)明的一實(shí)施例,說明聲音事件偵測(cè)模塊進(jìn)行靜音偵測(cè),取得此特定靜音存在于輸入的一段聲音信號(hào)的分段時(shí)間標(biāo)記的一范例不意圖。
[0016]圖4(C)是根據(jù)本發(fā)明的一實(shí)施例,說明聲音事件偵測(cè)模塊進(jìn)行特殊音偵測(cè),取得此特定特殊音存在于輸入的一段聲音信號(hào)的分段時(shí)間標(biāo)記的一范例不意圖。
[0017]圖5是根據(jù)本發(fā)明的一實(shí)施例,說明控制信號(hào)偵測(cè)模塊偵測(cè)默認(rèn)的控制信號(hào),取得此默認(rèn)的控制信號(hào)存在于輸入的一段聲音信號(hào)的分段時(shí)間標(biāo)記的一范例示意圖。
[0018]圖6是根據(jù)本發(fā)明的一實(shí)施例,說明語音訓(xùn)練模塊進(jìn)行語匯訓(xùn)練的一范例示意圖。
[0019]圖7是根據(jù)本發(fā)明的一實(shí)施例,說明一種新增口說語匯的語音識(shí)別方法。
[0020]圖8是根據(jù)本發(fā)明的一實(shí)施例,說明一語匯模型訓(xùn)練器的元件與處理流程。
[0021]圖9㈧是根據(jù)本發(fā)明的一實(shí)施例,說明以圖4㈧或圖4(C)的范例,經(jīng)語音切割處理后,得到的語音段落。
[0022]圖9(B)是根據(jù)本發(fā)明的一實(shí)施例,說明以圖4(B)的范例,經(jīng)語音切割處理后,得到的語音段落。
[0023]圖10是根據(jù)本發(fā)明的一實(shí)施例,舉一范例說明一種可避免無法成功偵測(cè)既定語匯的處理流程。
[0024]附圖標(biāo)記說明:
[0025]100新增口說語匯的語音識(shí)別系統(tǒng)
[0026]110輸入設(shè)備120模式偵測(cè)模塊
[0027]130語音訓(xùn)練模塊 140語音識(shí)別模塊
[0028]112輸入信號(hào)114 一段聲音信號(hào)
[0029]124語音訓(xùn)練模式 126語音識(shí)別模式
[0030]132訓(xùn)練處理134訓(xùn)練結(jié)果[0031 ] 142語音識(shí)別處理 144辨識(shí)結(jié)果
[0032]210輸入設(shè)備220聲音事件偵測(cè)模塊
[0033]310另一輸入設(shè)備 320控制信號(hào)偵測(cè)模塊
[0034]314非聲音信號(hào)
[0035]兩箭頭分段時(shí)間標(biāo)記
[0036]505使用者507默認(rèn)的控制信號(hào)
[0037]514—段聲音信號(hào) 520另一輸入設(shè)備
[0038]634數(shù)據(jù)庫
[0039]632語匯模型訓(xùn)練器ml 1、ml2語匯模型
[0040]636語匯集合
[0041]710利用至少一輸入設(shè)備接收多個(gè)輸入信號(hào),此多個(gè)輸入信號(hào)至少包括一段聲音信號(hào)
[0042]720利用一模式偵測(cè)模塊偵測(cè)此多個(gè)輸入信號(hào)
[0043]732當(dāng)偵測(cè)出該段聲音信號(hào)中存在一特定聲音事件或是該多個(gè)輸入信號(hào)還包括該段聲音信號(hào)以外的至少一控制信號(hào)時(shí),輸出一語音訓(xùn)練模
當(dāng)前第1頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
萨嘎县| 建阳市| 耒阳市| 民乐县| 通海县| 阜阳市| 台东市| 旬阳县| 通许县| 屏山县| 岳普湖县| 德江县| 剑川县| 普宁市| 齐河县| 微博| 邵东县| 镇远县| 余江县| 平安县| 孟津县| 和硕县| 宝山区| 利川市| 古浪县| 千阳县| 泊头市| 卢龙县| 乌拉特后旗| 墨竹工卡县| 岗巴县| 德安县| 报价| 若羌县| 锡林浩特市| 綦江县| 乡宁县| 个旧市| 临邑县| 五河县| 青浦区|