欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

語(yǔ)音識(shí)別裝置、方法以及電子設(shè)備的制造方法

文檔序號(hào):9261966閱讀:610來(lái)源:國(guó)知局
語(yǔ)音識(shí)別裝置、方法以及電子設(shè)備的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及語(yǔ)音識(shí)別技術(shù)領(lǐng)域,尤其涉及一種語(yǔ)音識(shí)別裝置、方法W及電子設(shè)備?!颈尘凹夹g(shù)】
[0002] 關(guān)鍵詞識(shí)別(KeywordReco即ition,KWR)是語(yǔ)音識(shí)別的一個(gè)分支,又稱關(guān)鍵詞檢 出(KeywordSpotting,KWS),是從語(yǔ)音中識(shí)別出一組給定的詞,即關(guān)鍵詞,而忽略除關(guān)鍵詞 W外的其它詞和各種非話音。關(guān)鍵詞識(shí)別與連續(xù)語(yǔ)音識(shí)別的不同之處主要是:連續(xù)語(yǔ)音識(shí) 別要求識(shí)別出語(yǔ)音的所有內(nèi)容,而關(guān)鍵詞識(shí)別則只要求從語(yǔ)音中識(shí)別出關(guān)鍵詞即可。
[0003]現(xiàn)有技術(shù)中,通?;诼晫W(xué)模型來(lái)識(shí)別語(yǔ)音中的關(guān)鍵詞;例如,可W直接根據(jù)語(yǔ)音 的聲學(xué)模型,來(lái)識(shí)別關(guān)鍵詞,但該種方法容易產(chǎn)生錯(cuò)誤拒絕(FalseRejection,FR)和錯(cuò)誤 接受(FalseAlarm,FA);在一些改進(jìn)的方案中,可W構(gòu)建填充(Filler)模型來(lái)提高關(guān)鍵詞 識(shí)別的準(zhǔn)確性,或者,可W在構(gòu)建填充模型的基礎(chǔ)上進(jìn)一步構(gòu)建混淆詞,從而進(jìn)一步提高關(guān) 鍵詞識(shí)別的準(zhǔn)確性,其中,填充模型和混淆詞都是基于聲學(xué)模型而構(gòu)建的。
[0004]應(yīng)該注意,上面對(duì)技術(shù)背景的介紹只是為了方便對(duì)本發(fā)明的技術(shù)方案進(jìn)行清楚、 完整的說(shuō)明,并方便本領(lǐng)域技術(shù)人員的理解而闡述的。不能僅僅因?yàn)樵撔┓桨冈诒景l(fā)明的
【背景技術(shù)】部分進(jìn)行了闡述而認(rèn)為上述技術(shù)方案為本領(lǐng)域技術(shù)人員所公知。

【發(fā)明內(nèi)容】

[0005]現(xiàn)有技術(shù)通常是基于聲學(xué)模型來(lái)識(shí)別關(guān)鍵詞,對(duì)于發(fā)音與其它詞比較接近的關(guān)鍵 詞而言,錯(cuò)誤識(shí)別的比率仍然較高。例如,對(duì)于許多發(fā)音較短的關(guān)鍵詞而言,很容易與其它 詞具有相似的發(fā)音,如"師長(zhǎng)"與"市場(chǎng)"、"年事"與"您是"、"愛(ài)也"與"A型"等,因此,采用 現(xiàn)有技術(shù)中基于聲學(xué)模型的關(guān)鍵詞識(shí)別方法很難準(zhǔn)確識(shí)別出該些關(guān)鍵詞。此外,對(duì)于基于 填充模型和混淆詞的方法而言,還存在該樣的缺陷:隨著關(guān)鍵詞或應(yīng)用環(huán)境的變化,混淆詞 需要重新設(shè)計(jì)和訓(xùn)練,無(wú)法適應(yīng)多樣化的任務(wù)和使用條件。
[0006]本發(fā)明實(shí)施例提供一種語(yǔ)音識(shí)別裝置、方法W及電子設(shè)備,能夠結(jié)合上下文的語(yǔ) 義信息,進(jìn)行關(guān)鍵詞識(shí)別,解決了相似發(fā)音導(dǎo)致的誤識(shí)別問(wèn)題。
[0007]根據(jù)本發(fā)明實(shí)施例的第一方面,提供一種語(yǔ)音識(shí)別裝置,該裝置包括:
[0008]識(shí)別單元,其用于對(duì)語(yǔ)音進(jìn)行識(shí)別,W獲得候選關(guān)鍵詞;
[0009]解碼單元,其結(jié)合語(yǔ)義信息,對(duì)所述語(yǔ)音中包含識(shí)別出所述候選關(guān)鍵詞的語(yǔ)音的 語(yǔ)音進(jìn)行解碼,W生成與所述包含識(shí)別出所述候選關(guān)鍵詞的語(yǔ)音的語(yǔ)音對(duì)應(yīng)的詞語(yǔ)網(wǎng)格;
[0010] 計(jì)算單元,其根據(jù)所述詞語(yǔ)網(wǎng)格,計(jì)算所述候選關(guān)鍵詞的置信度;
[0011] 判斷單元,其根據(jù)所述置信度,判斷是否將所述候選關(guān)鍵詞確定為關(guān)鍵詞。
[0012] 根據(jù)本發(fā)明實(shí)施例的第二方面,提供一種電子設(shè)備,其具有如上述第一方面所述 的語(yǔ)音識(shí)別裝置。
[0013] 根據(jù)本發(fā)明實(shí)施例的第H方面,提供一種語(yǔ)音識(shí)別方法,該方法包括:
[0014] 對(duì)語(yǔ)音進(jìn)行識(shí)別,W獲得候選關(guān)鍵詞;
[0015] 結(jié)合語(yǔ)義信息,對(duì)所述語(yǔ)音中包含識(shí)別出所述候選關(guān)鍵詞的語(yǔ)音的語(yǔ)音進(jìn)行解 碼,W生成與所述包含識(shí)別出所述候選關(guān)鍵詞的語(yǔ)音的語(yǔ)音對(duì)應(yīng)的詞語(yǔ)網(wǎng)格;根據(jù)所述詞 語(yǔ)網(wǎng)格,計(jì)算所述候選關(guān)鍵詞的置信度;
[0016] 根據(jù)所述置信度,判斷是否將所述候選關(guān)鍵詞確定為關(guān)鍵詞。
[0017] 本發(fā)明的有益效果在于;通過(guò)結(jié)合語(yǔ)義信息,對(duì)初步識(shí)別的候選關(guān)鍵詞進(jìn)行進(jìn)一 步地識(shí)別,可降低錯(cuò)誤識(shí)別的概率,提高語(yǔ)音識(shí)別的準(zhǔn)確性。
[0018]參照后文的說(shuō)明和附圖,詳細(xì)公開(kāi)了本發(fā)明的特定實(shí)施方式,指明了本發(fā)明的原 理可W被采用的方式。應(yīng)該理解,本發(fā)明的實(shí)施方式在范圍上并不因而受到限制。在所附 權(quán)利要求的精神和條款的范圍內(nèi),本發(fā)明的實(shí)施方式包括許多改變、修改和等同。
[0019]針對(duì)一種實(shí)施方式描述和/或示出的特征可相同或類似的方式在一個(gè)或更 多個(gè)其它實(shí)施方式中使用,與其它實(shí)施方式中的特征相組合,或替代其它實(shí)施方式中的特 征。
[0020] 應(yīng)該強(qiáng)調(diào),術(shù)語(yǔ)"包括/包含"在本文使用時(shí)指特征、整件、步驟或組件的存在,但 并不排除一個(gè)或更多個(gè)其它特征、整件、步驟或組件的存在或附加。
【附圖說(shuō)明】
[0021] 所包括的附圖用來(lái)提供對(duì)本發(fā)明實(shí)施例的進(jìn)一步的理解,其構(gòu)成了說(shuō)明書(shū)的一部 分,用于例示本發(fā)明的實(shí)施方式,并與文字描述一起來(lái)闡釋本發(fā)明的原理。顯而易見(jiàn)地,下 面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng) 造性勞動(dòng)性的前提下,還可W根據(jù)該些附圖獲得其他的附圖。在附圖中:
[0022] 圖1是本發(fā)明實(shí)施例1的語(yǔ)音識(shí)別裝置的組成示意圖;
[0023] 圖2是是基于填充模型的關(guān)鍵詞識(shí)別搜索網(wǎng)絡(luò)示意圖;
[0024] 圖3是本發(fā)明實(shí)施例1的詞語(yǔ)網(wǎng)格示意圖;
[00巧]圖4-圖7是本發(fā)明實(shí)施例2的詞語(yǔ)網(wǎng)格的示意圖;
[0026] 圖8是本發(fā)明實(shí)施例3的電子設(shè)備的系統(tǒng)構(gòu)成的示意框圖;
[0027] 圖9是本發(fā)明實(shí)施例4的語(yǔ)音識(shí)別的方法的流程圖。
【具體實(shí)施方式】
[0028]參照附圖,通過(guò)下面的說(shuō)明書(shū),本發(fā)明的前述W及其它特征將變得明顯。在說(shuō)明書(shū) 和附圖中,具體公開(kāi)了本發(fā)明的特定實(shí)施方式,其表明了其中可W采用本發(fā)明的原則的部 分實(shí)施方式,應(yīng)了解的是,本發(fā)明不限于所描述的實(shí)施方式,相反,本發(fā)明包括落入所附權(quán) 利要求的范圍內(nèi)的全部修改、變型W及等同物。
[0029] 實(shí)施例1
[0030] 圖2是本發(fā)明實(shí)施例1的語(yǔ)音識(shí)別裝置的組成示意圖,如圖2所示,語(yǔ)音識(shí)別裝置 100包括識(shí)別單元101、解碼單元102、計(jì)算單元103和判斷單元104。
[0031] 其中,識(shí)別單元101用于對(duì)語(yǔ)音進(jìn)行識(shí)別,W獲得候選關(guān)鍵詞;解碼單元102用于 結(jié)合語(yǔ)義信息,對(duì)所述語(yǔ)音中包含識(shí)別出所述候選關(guān)鍵詞的語(yǔ)音的語(yǔ)音進(jìn)行解碼,W生成 與所述包含識(shí)別出所述候選關(guān)鍵詞的語(yǔ)音的語(yǔ)音對(duì)應(yīng)的詞語(yǔ)網(wǎng)格;;計(jì)算單元103根據(jù)該 詞語(yǔ)網(wǎng)格,計(jì)算該候選關(guān)鍵詞的置信度;判斷單元104根據(jù)該置信度,判斷是否將該候選關(guān) 鍵詞確定為關(guān)鍵詞。
[0032] 由上述實(shí)施例可知,通過(guò)結(jié)合語(yǔ)義信息,對(duì)初步識(shí)別出的候選關(guān)鍵詞進(jìn)行進(jìn)一步 地識(shí)別,可降低錯(cuò)誤識(shí)別的概率,提高語(yǔ)音識(shí)別的準(zhǔn)確性。
[0033] 在本發(fā)明實(shí)施例中,該語(yǔ)音可W是語(yǔ)音采集設(shè)備,如麥克風(fēng)等設(shè)備實(shí)時(shí)采集的語(yǔ) 音,也可W是存儲(chǔ)在存儲(chǔ)介質(zhì)上的語(yǔ)音。
[0034] 下面參照附圖,詳細(xì)說(shuō)明本發(fā)明實(shí)施例1的語(yǔ)音識(shí)別裝置100。
[00巧]在本發(fā)明實(shí)施例中,識(shí)別單元101用于對(duì)語(yǔ)音進(jìn)行識(shí)別,W獲得候選關(guān)鍵詞。其 中,對(duì)語(yǔ)音進(jìn)行識(shí)別,可W是對(duì)輸入該裝置的語(yǔ)音進(jìn)行處理,并提取語(yǔ)音,根據(jù)該語(yǔ)音特征 獲得候選關(guān)鍵詞。
[0036] 在本發(fā)明實(shí)施例中,識(shí)別單元101對(duì)該語(yǔ)音進(jìn)行的處理可W是分峽處理,例如,可 每峽25毫砂,峽疊為10毫砂的方式將該語(yǔ)音劃分為多個(gè)峽。
[0037] 在本發(fā)明實(shí)施例中,識(shí)別單元101可W針對(duì)該語(yǔ)音的每一峽,提取該峽的語(yǔ)音特 征,例如,可W提取該幀的梅爾頻率倒譜系數(shù)(Mel-Frequen巧CepstralCoefficients, MFCC)及其一階、二階差分W及能量等特征。識(shí)別單元101提取語(yǔ)音特征的具體方法,可W 參考現(xiàn)有技術(shù),本發(fā)明實(shí)施例不再費(fèi)述。
[0038] 在本發(fā)明實(shí)施例中,識(shí)別單元101可W根據(jù)提取出的語(yǔ)音特征,獲得候選關(guān)鍵詞。 識(shí)別單元101可W采用現(xiàn)有技術(shù)中的任何一種方法來(lái)獲得候選關(guān)鍵詞,例如,可W直接根 據(jù)語(yǔ)音的聲學(xué)模型,來(lái)獲得候選關(guān)鍵詞,或者可W基于填充模型來(lái)獲得候選關(guān)鍵詞,或者可 W基于填充模型和混淆詞來(lái)獲得候選關(guān)鍵詞。W下W基于填充模型的方法為例簡(jiǎn)要說(shuō)明。 圖2是基于填充模型的候選關(guān)鍵詞搜索網(wǎng)絡(luò)示意圖,如圖2所示,候選關(guān)鍵詞和填充模型共 同組成并行搜索網(wǎng)絡(luò),其中,填充模型可W擬合自然界的各種發(fā)音現(xiàn)象,例如背景噪聲、咳 嗽、喘氣等非語(yǔ)言現(xiàn)象,從而吸收非語(yǔ)言發(fā)音。通過(guò)對(duì)候選關(guān)鍵詞加上合適的獎(jiǎng)賞分或?qū)μ?充模型給予合適的懲罰分,使得關(guān)鍵詞得分超過(guò)填充模型得分,從而獲得關(guān)鍵詞。此外,女口 圖2所示,該并行搜索網(wǎng)絡(luò)還可W進(jìn)一步具有混淆詞,該混淆詞與該候選關(guān)鍵詞具有相似 的發(fā)音,能夠提高候選關(guān)鍵詞的識(shí)別率。
[0039] 對(duì)于上述基于填充模型和基于填充模型與混淆詞的關(guān)鍵詞識(shí)別方法的詳細(xì)說(shuō)明, 可W參考專利公告文件CN102194454B(發(fā)明人李鵬等,發(fā)明名稱"用于檢測(cè)連續(xù)語(yǔ)音中的 關(guān)鍵詞的設(shè)備和方法",授權(quán)公告日1012年11月28日)和"ImprovedMandarinKeyword SpottingusingConfusionGarbageModel"(作者化ileiZhang等,ICPR1010)W及上述 兩個(gè)文獻(xiàn)所引用的文獻(xiàn),本發(fā)明實(shí)施例不再費(fèi)述。
[0040]由于具有相似發(fā)音的詞語(yǔ)往往具有
當(dāng)前第1頁(yè)1 2 3 4 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
芜湖县| 德惠市| 克东县| 巴塘县| 大安市| 萨迦县| 定襄县| 甘洛县| 西昌市| 罗源县| 紫云| 锡林郭勒盟| 河津市| 滦南县| 九龙坡区| 安庆市| 乐昌市| 朝阳县| 洛扎县| 祥云县| 托克逊县| 安庆市| 诸城市| 湘潭县| 伊川县| 白城市| 阿合奇县| 嘉祥县| 安庆市| 海淀区| 察隅县| 上饶市| 鹤庆县| 阿荣旗| 榆林市| 屏东县| 沁阳市| 垣曲县| 莱西市| 建始县| 济南市|