技術(shù)特征:
技術(shù)總結(jié)
本申請(qǐng)?zhí)岢鲆环N基于人工智能的語音喚醒方法、裝置和計(jì)算機(jī)設(shè)備,該基于人工智能的語音喚醒方法,包括:對(duì)在線錄制的語音進(jìn)行加窗分幀操作,獲得至少一個(gè)語音幀;對(duì)所述語音幀進(jìn)行特征提取,獲得語音特征;通過基于卷積神經(jīng)網(wǎng)絡(luò)的語音喚醒模型對(duì)所述語音幀包含的靜態(tài)的語音特征進(jìn)行計(jì)算,獲得所述語音幀包含的靜態(tài)的語音特征對(duì)應(yīng)于非喚醒詞類別和喚醒詞類別的后驗(yàn)概率;當(dāng)所述語音幀包含的靜態(tài)的語音特征對(duì)應(yīng)于喚醒詞類別的后驗(yàn)概率大于或等于預(yù)定閾值時(shí),確定所述在線錄制的語音中包括喚醒詞。本申請(qǐng)可以有效地降低基于卷積神經(jīng)網(wǎng)絡(luò)的語音喚醒模型的參數(shù)量,從而達(dá)到降低運(yùn)算量的目的,并且本申請(qǐng)可以提升語音喚醒的效果。
技術(shù)研發(fā)人員:孫玨;陳明明;李先剛
受保護(hù)的技術(shù)使用者:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
技術(shù)研發(fā)日:2017.05.16
技術(shù)公布日:2017.09.29