欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

語(yǔ)音識(shí)別方法及系統(tǒng)的制作方法

文檔序號(hào):2826438閱讀:206來(lái)源:國(guó)知局
語(yǔ)音識(shí)別方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及語(yǔ)音識(shí)別【技術(shù)領(lǐng)域】,公開(kāi)了一種語(yǔ)音識(shí)別方法及系統(tǒng),該方法包括:持續(xù)接收錄音輸入;利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述錄音進(jìn)行語(yǔ)音識(shí)別,以檢查所述錄音中是否包含預(yù)設(shè)的關(guān)鍵詞;如果所述錄音中包含所述關(guān)鍵詞,則利用大詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述關(guān)鍵詞后的錄音進(jìn)行識(shí)別,得到識(shí)別結(jié)果。利用本發(fā)明,可以在保證語(yǔ)音識(shí)別質(zhì)量的前提下,提高大詞匯量語(yǔ)音識(shí)別的智能性。
【專利說(shuō)明】語(yǔ)音識(shí)別方法及系統(tǒng)【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及語(yǔ)音識(shí)別【技術(shù)領(lǐng)域】,具體涉及一種語(yǔ)音識(shí)別方法及系統(tǒng)。
【背景技術(shù)】
[0002]語(yǔ)音識(shí)別技術(shù)是機(jī)器通過(guò)識(shí)別和理解過(guò)程將人發(fā)出的聲音、音節(jié)或短語(yǔ)轉(zhuǎn)換為相應(yīng)的文字或符號(hào),或者給出響應(yīng),如執(zhí)行控制、做出回答等,它的應(yīng)用領(lǐng)域非常廣泛,幾乎涉及生活的每個(gè)領(lǐng)域,比如計(jì)算機(jī)控制、工業(yè)控制、信息網(wǎng)絡(luò)查詢等等。
[0003]語(yǔ)音識(shí)別系統(tǒng)按照不同識(shí)別系統(tǒng)的要求,可以劃分成很多不同的種類。如,根據(jù)識(shí)別對(duì)象的不同,可分為:孤立字(詞)識(shí)別、連接詞識(shí)別、連續(xù)語(yǔ)音識(shí)別;根據(jù)詞匯量的大小,可分為:小詞匯量語(yǔ)音識(shí)別系統(tǒng)(通常指能識(shí)別小于100個(gè)詞匯的系統(tǒng))和大詞匯量語(yǔ)音識(shí)別系統(tǒng)(通常指包括上千至幾萬(wàn)個(gè)詞匯的系統(tǒng));按照說(shuō)話人的限定范圍可以分為:特定人和非特定人語(yǔ)音識(shí)別系統(tǒng);按照識(shí)別方法分,主要有:模板匹配法、概率模型法、基于人工神經(jīng)網(wǎng)絡(luò)等系統(tǒng)。
[0004]通常,語(yǔ)音識(shí)別系統(tǒng)都會(huì)設(shè)置一個(gè)詞匯表,系統(tǒng)對(duì)包含于該詞匯表中的詞條進(jìn)行識(shí)別。在現(xiàn)有技術(shù)中,大詞匯量語(yǔ)音識(shí)別技術(shù)都需要觸發(fā)后才能夠開(kāi)始識(shí)別,因?yàn)槿绻R(shí)別系統(tǒng)一直監(jiān)聽(tīng)錄音,由于大詞匯量語(yǔ)音識(shí)別系統(tǒng)詞匯量過(guò)多,受到的錄音干擾較大,容易發(fā)生虛警,導(dǎo)致用戶根本沒(méi)有說(shuō)話就會(huì)輸出識(shí)別結(jié)果。
[0005]而這種通過(guò)觸發(fā)實(shí)現(xiàn)大詞匯量識(shí)別的方法不僅智能化低,而且會(huì)為用戶帶來(lái)諸多不便,比如在行車過(guò)程中用手進(jìn)行觸發(fā)操作會(huì)導(dǎo)致安全性問(wèn)題。

【發(fā)明內(nèi)容】

[0006]本發(fā)明提供一種語(yǔ)音識(shí)別方法及系統(tǒng),在保證語(yǔ)音識(shí)別質(zhì)量的前提下,提高大詞匯量語(yǔ)音識(shí)別的智能性。
[0007]為此,本發(fā)明提供如下技術(shù)方案:
[0008]一種語(yǔ)音識(shí)別方法,包括:
[0009]持續(xù)接收錄音輸入;
[0010]利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述錄音進(jìn)行語(yǔ)音識(shí)別,得到第一識(shí)別結(jié)果;
[0011]如果所述第一識(shí)別結(jié)果中包含預(yù)設(shè)的命令詞,則利用大詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述命令詞后的錄音進(jìn)行識(shí)別,得到第二識(shí)別結(jié)果。
[0012]優(yōu)選地,所述利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述錄音進(jìn)行語(yǔ)音識(shí)別,得到第一識(shí)別結(jié)果包括: [0013]利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述錄音進(jìn)行語(yǔ)音識(shí)別,得到候選關(guān)鍵詞及所述候選關(guān)鍵詞的置信度得分;
[0014]如果所述候選關(guān)鍵詞的置信度得分大于設(shè)定閾值,則將所述候選關(guān)鍵詞作為第一識(shí)別結(jié)果。
[0015]優(yōu)選地,所述方法還包括:[0016]構(gòu)建所述小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)。
[0017]優(yōu)選地,所述方法還包括:
[0018]構(gòu)建所述大詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)。
[0019]優(yōu)選地,所述方法還包括:
[0020]根據(jù)所述第一識(shí)別結(jié)果和第二識(shí)別結(jié)果執(zhí)行對(duì)應(yīng)操作。
[0021]一種語(yǔ)音識(shí)別系統(tǒng),包括:
[0022]接收模塊,用于持續(xù)接收錄音輸入;
[0023]小詞匯量識(shí)別模塊,用于利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述錄音進(jìn)行語(yǔ)音識(shí)別,得到第一識(shí)別結(jié)果;
[0024]判斷模塊,用于判斷所述第一識(shí)別結(jié)果中是否包含預(yù)設(shè)的命令詞;
[0025]大詞匯量識(shí)別模塊,用于在所述判斷模塊判斷所述第一識(shí)別結(jié)果中包含預(yù)設(shè)的命令詞后,利用大詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述命令詞后的錄音進(jìn)行識(shí)別,得到第二識(shí)別結(jié)果。
[0026]優(yōu)選地,所述小詞匯量識(shí)別模塊包括:
[0027]輸出單元,用于利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述錄音進(jìn)行語(yǔ)音識(shí)別,得到候選關(guān)鍵詞及所述候選關(guān)鍵詞的置信度得分;
[0028]選擇單元,用于在所述候選關(guān)鍵詞的置信度得分大于設(shè)定閾值時(shí),將所述候選關(guān)鍵詞作為第一識(shí)別結(jié)果。
[0029]優(yōu)選地,所述系統(tǒng)還包括:
[0030]第一構(gòu)建模塊,用于構(gòu)建所述小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)。
[0031 ] 優(yōu)選地,所述系統(tǒng)還包括:
[0032]第二構(gòu)建模塊,用于構(gòu)建所述大詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)。
[0033]優(yōu)選地,所述系統(tǒng)還包括:
[0034]執(zhí)行模塊,用于根據(jù)所述第一識(shí)別結(jié)果和第二識(shí)別結(jié)果執(zhí)行對(duì)應(yīng)操作。
[0035]本發(fā)明實(shí)施例提供的語(yǔ)音識(shí)別方法及系統(tǒng),綜合小詞匯量語(yǔ)音識(shí)別系統(tǒng)和大詞匯量語(yǔ)音識(shí)別系統(tǒng)各自的優(yōu)點(diǎn),針對(duì)持續(xù)接收的錄音輸入,先利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述錄音進(jìn)行語(yǔ)音識(shí)別,以檢查所述錄音中是否包含預(yù)設(shè)的關(guān)鍵詞,在檢查到該錄音中包含相應(yīng)的關(guān)鍵詞后,再利用大詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)該關(guān)鍵詞后的錄音進(jìn)行識(shí)別,得到識(shí)別結(jié)果,從而實(shí)現(xiàn)了無(wú)需觸發(fā)一次性完成多命令詞語(yǔ)音識(shí)別,在保證語(yǔ)音識(shí)別質(zhì)量的前提下,提高了大詞匯量語(yǔ)音識(shí)別的智能性。利用本發(fā)明實(shí)施例提供的語(yǔ)音識(shí)別方法及系統(tǒng),可以大大改善用戶體驗(yàn)。
【專利附圖】

【附圖說(shuō)明】
[0036]為了更清楚地說(shuō)明本申請(qǐng)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明中記載的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,還可以根據(jù)這些附圖獲得其他的附圖。
[0037]圖1是現(xiàn)有技術(shù)中小詞匯量語(yǔ)音識(shí)別過(guò)程示意圖;
[0038]圖2是現(xiàn)有技術(shù)中大詞匯量語(yǔ)音識(shí)別過(guò)程示意圖;
[0039]圖3是本發(fā)明實(shí)施例語(yǔ)音識(shí)別方法的流程圖;
[0040]圖4是本發(fā)明實(shí)施例語(yǔ)音識(shí)別系統(tǒng)的結(jié)構(gòu)示意圖。【具體實(shí)施方式】
[0041]為了使本【技術(shù)領(lǐng)域】的人員更好地理解本發(fā)明實(shí)施例的方案,下面結(jié)合附圖和實(shí)施方式對(duì)本發(fā)明實(shí)施例作進(jìn)一步的詳細(xì)說(shuō)明。
[0042]下面首先對(duì)現(xiàn)有技術(shù)中小詞匯量語(yǔ)音識(shí)別及大詞匯量語(yǔ)音識(shí)別的觸發(fā)及識(shí)別過(guò)程作簡(jiǎn)單介紹。
[0043]如圖1所示,是現(xiàn)有技術(shù)中小詞匯量語(yǔ)音識(shí)別過(guò)程示意圖。
[0044]現(xiàn)有技術(shù)中,小詞匯量語(yǔ)音識(shí)別系統(tǒng)通常是指詞匯量在100以下的語(yǔ)音識(shí)別系統(tǒng),它的應(yīng)用極其廣泛,如語(yǔ)音指令控制等。小詞匯量語(yǔ)音識(shí)別系統(tǒng)在算法復(fù)雜度和實(shí)現(xiàn)難度上比大詞匯量語(yǔ)音識(shí)別系統(tǒng)小許多,比較容易在脫機(jī)系統(tǒng)比如PDA等手持設(shè)備上實(shí)現(xiàn)。
[0045]由于詞匯量有限,因此在識(shí)別時(shí),語(yǔ)音識(shí)別系統(tǒng)可以一直監(jiān)聽(tīng)錄音,有識(shí)別結(jié)果后進(jìn)行置信度判別以確定是否輸出結(jié)果。小詞匯量語(yǔ)音識(shí)別系統(tǒng)對(duì)較少的命令詞識(shí)別時(shí),能得到較好的識(shí)別效果。
[0046]如圖2所示,是現(xiàn)有技術(shù)中大詞匯量語(yǔ)音識(shí)別過(guò)程示意圖。
[0047]在現(xiàn)有技術(shù)中,對(duì)于大詞匯量語(yǔ)音識(shí)別都需要用戶觸發(fā)操作才會(huì)開(kāi)啟識(shí)別過(guò)程。
[0048]為此,本發(fā)明實(shí)施例提供一種語(yǔ)音識(shí)別方法及系統(tǒng),綜合小詞匯量語(yǔ)音識(shí)別系統(tǒng)和大詞匯量語(yǔ)音識(shí)別系統(tǒng)各自的優(yōu)點(diǎn),實(shí)現(xiàn)無(wú)需觸發(fā)一次性完成多命令詞語(yǔ)音識(shí)別,在保證語(yǔ)音識(shí)別質(zhì)量的前提下,提高大詞匯量語(yǔ)音識(shí)別的智能性。
[0049]如圖3所示,是本發(fā)明實(shí)施例語(yǔ)音識(shí)別方法的流程圖,包括以下步驟:
[0050]步驟301,持續(xù)接收錄音輸入;
[0051]步驟302,利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述錄音進(jìn)行語(yǔ)音識(shí)別,得到第一識(shí)別結(jié)果;
[0052]步驟303,如果所述第一識(shí)別結(jié)果中包含預(yù)設(shè)的命令詞,則利用大詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述命令詞后的錄音進(jìn)行識(shí)別,得到第二識(shí)別結(jié)果。
[0053]本發(fā)明實(shí)施例的語(yǔ)音識(shí)別方法,利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)和大詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò),對(duì)錄音輸入的語(yǔ)音信號(hào)進(jìn)行連續(xù)識(shí)別解碼,從而利用小詞匯量的無(wú)需觸發(fā)識(shí)別召回率高和虛警率低的特點(diǎn),通過(guò)判定小詞匯量語(yǔ)音識(shí)別結(jié)果的置信度來(lái)決定是否輸出大詞匯量語(yǔ)音識(shí)別的結(jié)果。
[0054]在本發(fā)明實(shí)施例中,利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述錄音進(jìn)行語(yǔ)音識(shí)別的過(guò)程主要包括:語(yǔ)音信號(hào)預(yù)處理、特征提取、特征建模、模式匹配等過(guò)程。其中:
[0055]預(yù)處理主要是對(duì)輸入的語(yǔ)音進(jìn)行一些前期處理,主要包括采樣量化、預(yù)加重、力口窗、端點(diǎn)檢測(cè)等操作。
[0056]特征提取是指從語(yǔ)音信號(hào)中提取有效的特征矢量,進(jìn)一步地,為了提高識(shí)別精度,還需要去除語(yǔ)音信號(hào)中的噪聲信息。
[0057]特征建模的過(guò)程主要是指建立聲學(xué)模型及語(yǔ)言模型,其中,聲學(xué)模型是語(yǔ)音識(shí)別系統(tǒng)的底層模型,主要用于刻畫(huà)語(yǔ)音信號(hào)的聲學(xué)特征;聲學(xué)模型的設(shè)計(jì)和語(yǔ)音發(fā)音特點(diǎn)密切相關(guān)。通過(guò)聲學(xué)模型,可以估計(jì)待識(shí)別語(yǔ)音特征矢量序列所對(duì)應(yīng)的語(yǔ)音識(shí)別單元,從而完成特征矢量序列到語(yǔ)音單元的識(shí)別轉(zhuǎn)換。在語(yǔ)音識(shí)別中,僅僅只利用聲學(xué)模型對(duì)語(yǔ)音信號(hào)進(jìn)行描述或表征是不夠的,還需要利用諸如語(yǔ)法知識(shí)、句法知識(shí)、語(yǔ)義知識(shí)等語(yǔ)言學(xué)知識(shí),而這些信息的利用是通過(guò)語(yǔ)言模型建模來(lái)實(shí)現(xiàn)的。
[0058]模式匹配的過(guò)程就是在一個(gè)由特征矢量序列、聲學(xué)模型、語(yǔ)言模型構(gòu)建的空間中到最佳匹配路徑的過(guò)程。
[0059]在本發(fā)明實(shí)施例中,首先利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述錄音進(jìn)行語(yǔ)音識(shí)別,得到多個(gè)候選關(guān)鍵詞。其中,小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)的構(gòu)建過(guò)程大致如下:先將關(guān)鍵詞轉(zhuǎn)為拼音,再將拼音轉(zhuǎn)為音素序列,選取每個(gè)音素對(duì)應(yīng)的聲學(xué)模型形成聲學(xué)模型序列,將多個(gè)關(guān)鍵詞對(duì)應(yīng)的聲學(xué)模型序列并聯(lián)起來(lái)即形成了小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)。
[0060]相應(yīng)地,對(duì)應(yīng)每個(gè)候選關(guān)鍵詞,可以有一個(gè)置信度得分,各候選關(guān)鍵詞的置信度得分的高低直接反映了該關(guān)鍵詞的可靠程度。因此,在本發(fā)明實(shí)施例中,可以預(yù)先設(shè)定一閾值(比如,置信度區(qū)間為O?100分,閾值設(shè)為70分),如果所述候選關(guān)鍵詞的置信度得分大于該閾值,則將該候選關(guān)鍵詞作為第一識(shí)別結(jié)果。
[0061]由于影響置信度的因素很多,比如,識(shí)別結(jié)果自身的信息、路徑搜索過(guò)程中的競(jìng)爭(zhēng)路徑信息、輔助模型給出的對(duì)比信息等,這些都對(duì)置信度的計(jì)算有不同程度的影響。因此,在本發(fā)明實(shí)施例中,置信度可以看作是這些因素的函數(shù),用于衡量識(shí)別結(jié)果的可靠程度。
[0062]當(dāng)然,在實(shí)際應(yīng)用中,所述置信度也可以按照現(xiàn)有技術(shù)中的一些方法進(jìn)行計(jì)算,t匕如,基于特征分類器的置信度、基于似然比檢驗(yàn)的置信度、基于后驗(yàn)概率的置信度等,具體可以根據(jù)實(shí)際應(yīng)用環(huán)境來(lái)選用,對(duì)此本發(fā)明實(shí)施例不做限定。
[0063]利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)進(jìn)行識(shí)別得到第一識(shí)別結(jié)果后,需要判斷所述第一識(shí)別結(jié)果中是否包含預(yù)設(shè)的命令詞,具體地,可以將具體應(yīng)用環(huán)境中所需的命令詞保存在一個(gè)命令詞列表中,比如,對(duì)應(yīng)于車載系統(tǒng),命令詞列表中可以有:導(dǎo)航、收音機(jī)、MP3播放、視頻播放等命令詞。
[0064]在第一識(shí)別結(jié)果中包含預(yù)設(shè)的命令詞的情況下,繼續(xù)利用大詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述命令詞后的錄音進(jìn)行識(shí)別,得到第二識(shí)別結(jié)果。
[0065]上述大詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)的構(gòu)建過(guò)程與小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)的構(gòu)建過(guò)程類似,在此不再贅述。
[0066]繼續(xù)以前面提到的車載系統(tǒng)為例,比如,接收到的錄音輸入為“導(dǎo)航到天安門(mén)”,則利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)識(shí)別得到第一識(shí)別結(jié)果為“導(dǎo)航”,然后由大詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)繼續(xù)對(duì)“導(dǎo)航”后的錄音信號(hào)“到天安門(mén)”進(jìn)行識(shí)別,得到大詞匯量識(shí)別結(jié)果,即第二識(shí)別結(jié)果。
[0067]再比如,在手機(jī)應(yīng)用中,要讓系統(tǒng)識(shí)別“打電話給劉德華”并輸出結(jié)果,則過(guò)程如下:
[0068]( I)對(duì)識(shí)別系統(tǒng)說(shuō)“打電話給劉德華”,系統(tǒng)會(huì)進(jìn)行錄音,將錄音發(fā)送給識(shí)別網(wǎng)絡(luò)。
[0069]( 2 )由小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)“打電話給”進(jìn)行識(shí)別,得到小詞匯量識(shí)別結(jié)果。
[0070](3)如果小詞匯量識(shí)別結(jié)果通過(guò)置信度門(mén)限,即其置信度大于設(shè)定的閾值時(shí),則無(wú)需觸發(fā),進(jìn)入步驟(4)
[0071](4)大詞匯量網(wǎng)絡(luò)中對(duì)聯(lián)系人姓名“劉德華”,得到大詞匯量識(shí)別結(jié)果。
[0072]本發(fā)明無(wú)需其他方式的觸發(fā)一次語(yǔ)音交互即可實(shí)現(xiàn)語(yǔ)音命令控制,解決了語(yǔ)音識(shí)別需要按鍵、觸屏等其他方式觸發(fā)問(wèn)題。比如:1.現(xiàn)有技術(shù)中用語(yǔ)音識(shí)別打電話需要按鈕,利用本發(fā)明則無(wú)需按按鈕即可實(shí)現(xiàn);2.現(xiàn)有技術(shù)中通過(guò)觸發(fā)方式進(jìn)行語(yǔ)音識(shí)別時(shí)需要二次語(yǔ)音交互,而利用本發(fā)明則一次語(yǔ)音交互即可達(dá)到操控目的。比如現(xiàn)有技術(shù)中第一次交互需要用戶說(shuō)“撥打電話”觸發(fā)識(shí)別,然后再讓用戶說(shuō)人名“劉德華”,而利用本發(fā)明,只需要用戶說(shuō)“撥打電話劉德華”無(wú)需任何按鍵觸發(fā)一次交互就達(dá)到目的。
[0073]本發(fā)明實(shí)施例提供的語(yǔ)音識(shí)別方法,結(jié)合小詞匯量語(yǔ)音識(shí)別系統(tǒng)和大詞匯量語(yǔ)音識(shí)別系統(tǒng)各自的優(yōu)點(diǎn),針對(duì)持續(xù)接收的錄音輸入,先利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述錄音進(jìn)行語(yǔ)音識(shí)別,以檢查所述錄音中是否包含預(yù)設(shè)的關(guān)鍵詞,在檢查到該錄音中包含相應(yīng)的關(guān)鍵詞后,再利用大詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)該關(guān)鍵詞后的錄音進(jìn)行識(shí)別,得到識(shí)別結(jié)果,從而實(shí)現(xiàn)了無(wú)需觸發(fā)一次性完成多命令詞語(yǔ)音識(shí)別,在保證語(yǔ)音識(shí)別質(zhì)量的前提下,提高了大詞匯量語(yǔ)音識(shí)別的智能性。
[0074]相應(yīng)地,本發(fā)明實(shí)施例還提供一種語(yǔ)音識(shí)別系統(tǒng),如圖4所示,是本發(fā)明實(shí)施例語(yǔ)音識(shí)別系統(tǒng)的結(jié)構(gòu)示意圖。
[0075]在該實(shí)施例中,所述語(yǔ)音識(shí)別系統(tǒng)包括:
[0076]接收模塊401,用于持續(xù)接收錄音輸入;
[0077]小詞匯量識(shí)別模塊402,用于利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述錄音進(jìn)行語(yǔ)音識(shí)另IJ,得到第一識(shí)別結(jié)果;
[0078]判斷模塊403,用于判斷所述第一識(shí)別結(jié)果中是否包含預(yù)設(shè)的命令詞;
[0079]大詞匯量識(shí)別模塊404,用于在所述判斷模塊403判斷所述第一識(shí)別結(jié)果中包含預(yù)設(shè)的命令詞后,利用大詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述命令詞后的錄音進(jìn)行識(shí)別,得到第二識(shí)別結(jié)果。
[0080]上述小詞匯量識(shí)別模塊402可以包括:輸出單元和選擇單元(未圖示)。其中:所述輸出單元用于利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述錄音進(jìn)行語(yǔ)音識(shí)別,得到候選關(guān)鍵詞及所述候選關(guān)鍵詞的置信度得分;所述選擇單元用于在所述候選關(guān)鍵詞的置信度得分大于設(shè)定閾值時(shí),將所述候選關(guān)鍵詞作為第一識(shí)別結(jié)果。
[0081]所述候選關(guān)鍵詞的置信度得分的計(jì)算可以有多種方式,對(duì)此本發(fā)明實(shí)施例不做限定。
[0082]另外,所述系統(tǒng)還包括:第一構(gòu)建模塊和第二構(gòu)建模塊(未圖不)。其中:所述第一構(gòu)建模塊,用于構(gòu)建所述小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)。所述第二構(gòu)建模塊用于構(gòu)建所述大詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)。
[0083]語(yǔ)音識(shí)別網(wǎng)絡(luò)的構(gòu)建過(guò)程可參照前面的描述,在此不再贅述。
[0084]本發(fā)明實(shí)施例的語(yǔ)音識(shí)別系統(tǒng)可以應(yīng)用于多種語(yǔ)音輸入控制環(huán)境,比如,打電話、聽(tīng)音樂(lè)、導(dǎo)航等各種不同操作的語(yǔ)音控制。
[0085]為此,在實(shí)際應(yīng)用中,所述系統(tǒng)還可進(jìn)一步包括:執(zhí)行模塊(未圖示),用于根據(jù)所述第一識(shí)別結(jié)果和第二識(shí)別結(jié)果執(zhí)行對(duì)應(yīng)操作。
[0086]本發(fā)明實(shí)施例提供的語(yǔ)音識(shí)別系統(tǒng),結(jié)合小詞匯量語(yǔ)音識(shí)別系統(tǒng)和大詞匯量語(yǔ)音識(shí)別系統(tǒng)各自的優(yōu)點(diǎn),針對(duì)持續(xù)接收的錄音輸入,先利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述錄音進(jìn)行語(yǔ)音識(shí)別,以檢查所述錄音中是否包含預(yù)設(shè)的關(guān)鍵詞,在檢查到該錄音中包含相應(yīng)的關(guān)鍵詞后,再利用大詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)該關(guān)鍵詞后的錄音進(jìn)行識(shí)別,得到識(shí)別結(jié)果,從而實(shí)現(xiàn)了無(wú)需觸發(fā)一次性完成多命令詞語(yǔ)音識(shí)別,在保證語(yǔ)音識(shí)別質(zhì)量的前提下,提高了大詞匯量語(yǔ)音識(shí)別的智能性。[0087]本說(shuō)明書(shū)中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn)即可,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處。尤其,對(duì)于系統(tǒng)實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述得比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。以上所描述的系統(tǒng)實(shí)施例僅僅是示意性的,其中所述作為分離部件說(shuō)明的單元可以是或者也可以不是物理上分開(kāi)的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部模塊來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動(dòng)的情況下,即可以理解并實(shí)施。
[0088]以上對(duì)本發(fā)明實(shí)施例進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了【具體實(shí)施方式】對(duì)本發(fā)明進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的方法及設(shè)備;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在【具體實(shí)施方式】及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書(shū)內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。
【權(quán)利要求】
1.一種語(yǔ)音識(shí)別方法,其特征在于,包括: 持續(xù)接收錄首輸入; 利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述錄音進(jìn)行語(yǔ)音識(shí)別,得到第一識(shí)別結(jié)果; 如果所述第一識(shí)別結(jié)果中包含預(yù)設(shè)的命令詞,則利用大詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述命令詞后的錄音進(jìn)行識(shí)別,得到第二識(shí)別結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述錄音進(jìn)行語(yǔ)音識(shí)別,得到第一識(shí)別結(jié)果包括: 利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述錄音進(jìn)行語(yǔ)音識(shí)別,得到候選關(guān)鍵詞及所述候選關(guān)鍵詞的置信度得分; 如果所述候選關(guān)鍵詞的置信度得分大于設(shè)定閾值,則將所述候選關(guān)鍵詞作為第一識(shí)別結(jié)果。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 構(gòu)建所述小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 構(gòu)建所述大詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)。
5.根據(jù)權(quán)利要求1至4任一項(xiàng)所述的方法,其特征在于,所述方法還包括: 根據(jù)所述第一識(shí)別結(jié)果和第二識(shí)別結(jié)果執(zhí)行對(duì)應(yīng)操作。
6.一種語(yǔ)音識(shí)別系統(tǒng),其特征在于,包括: 接收模塊,用于持續(xù)接收錄音輸入; 小詞匯量識(shí)別模塊,用于利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述錄音進(jìn)行語(yǔ)音識(shí)別,得到第一識(shí)別結(jié)果; 判斷模塊,用于判斷所述第一識(shí)別結(jié)果中是否包含預(yù)設(shè)的命令詞; 大詞匯量識(shí)別模塊,用于在所述判斷模塊判斷所述第一識(shí)別結(jié)果中包含預(yù)設(shè)的命令詞后,利用大詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述命令詞后的錄音進(jìn)行識(shí)別,得到第二識(shí)別結(jié)果。
7.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述小詞匯量識(shí)別模塊包括: 輸出單元,用于利用小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)對(duì)所述錄音進(jìn)行語(yǔ)音識(shí)別,得到候選關(guān)鍵詞及所述候選關(guān)鍵詞的置信度得分; 選擇單元,用于在所述候選關(guān)鍵詞的置信度得分大于設(shè)定閾值時(shí),將所述候選關(guān)鍵詞作為第一識(shí)別結(jié)果。
8.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括: 第一構(gòu)建模塊,用于構(gòu)建所述小詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)。
9.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括: 第二構(gòu)建模塊,用于構(gòu)建所述大詞匯量語(yǔ)音識(shí)別網(wǎng)絡(luò)。
10.根據(jù)權(quán)利要求6至9任一項(xiàng)所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括: 執(zhí)行模塊,用于根據(jù)所述第一識(shí)別結(jié)果和第二識(shí)別結(jié)果執(zhí)行對(duì)應(yīng)操作。
【文檔編號(hào)】G10L15/28GK103680505SQ201310589827
【公開(kāi)日】2014年3月26日 申請(qǐng)日期:2013年11月20日 優(yōu)先權(quán)日:2013年9月3日
【發(fā)明者】陳盛, 于振華, 趙志偉, 劉俊峰, 馬冰 申請(qǐng)人:安徽科大訊飛信息科技股份有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
永登县| 顺义区| 沂源县| 深泽县| 南投县| 会东县| 莱阳市| 揭西县| 聂拉木县| 宣恩县| 东港市| 抚顺县| 万全县| 寿光市| 磐安县| 三门县| 进贤县| 漳平市| 呼玛县| 八宿县| 南澳县| 龙川县| 凉城县| 永城市| 库尔勒市| 鹤峰县| 西安市| 体育| 成安县| 嫩江县| 沛县| 玉树县| 昌江| 平顶山市| 曲松县| 郯城县| 亚东县| 土默特左旗| 广宁县| 河曲县| 开封县|