聲音喚醒偵測(cè)裝置與方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明是有關(guān)于一種偵測(cè)裝置及方法,且特別是有關(guān)于一種聲音喚醒偵測(cè)裝置與方法。
【背景技術(shù)】
[0002]現(xiàn)今智能型手機(jī)的功能越來(lái)越多樣化,具聲音喚醒功能的智能型手機(jī)越來(lái)越受到消費(fèi)者的重視。一般來(lái)說(shuō),當(dāng)智能型手機(jī)等電子產(chǎn)品進(jìn)入睡眠狀態(tài)時(shí),只要用戶發(fā)出關(guān)鍵詞(keyword)的聲音,智能型手機(jī)即可進(jìn)行關(guān)鍵詞的辨識(shí),并且由睡眠狀態(tài)進(jìn)入正常運(yùn)作狀態(tài)。換言之,使用者無(wú)需利用智能型手機(jī)其他的功能按鍵,即可讓智能型手機(jī)進(jìn)入正常運(yùn)作狀態(tài)。
[0003]請(qǐng)參照?qǐng)D1,其所繪示為現(xiàn)有電子產(chǎn)品中的聲音喚醒偵測(cè)裝置示意圖。電子產(chǎn)品中的聲音喚醒偵測(cè)裝置100包括:前端偵測(cè)電路(front end detecting circuit)110、聲音辨識(shí)處理器(speech recognit1n processor) 120、以及主處理器(main processor) 130。其中,前端偵測(cè)電路110包括麥克風(fēng)102與事件偵測(cè)器(event detector) 104。于睡眠狀態(tài)時(shí),前端偵測(cè)電路110會(huì)被供電,使得麥克風(fēng)102與事件偵測(cè)器104持續(xù)運(yùn)作。另外,電子產(chǎn)品由睡眠狀態(tài)被喚醒的過(guò)程需要經(jīng)過(guò)三個(gè)偵測(cè)程序(detect1n phase)。說(shuō)明如下:
[0004]基本上,事件偵測(cè)器104主要的功能在于進(jìn)行聽(tīng)覺(jué)事件偵測(cè)(acoustic eventdetect1n)。麥克風(fēng)102產(chǎn)生聲音信號(hào)Sa至事件偵測(cè)器104,而事件偵測(cè)器104偵測(cè)聲音信號(hào)Sa的振幅、信噪比(SNR)或者子頻段信噪比(sub-band SNR)。
[0005]當(dāng)電子產(chǎn)品處于睡眠狀態(tài)且聲音喚醒偵測(cè)裝置100處于第一偵測(cè)程序(firstphase detect1n)時(shí),麥克風(fēng)102持續(xù)地接收外部的聲音,并轉(zhuǎn)換為聲音信號(hào)Sa輸入事件偵測(cè)器104。當(dāng)聲音信號(hào)Sa的振幅大于臨限值(threshold)時(shí),事件偵測(cè)器104即產(chǎn)生第一中斷信號(hào)(interrupt) INTl至聲音辨識(shí)處理器120。
[0006]除了偵測(cè)聲音信號(hào)Sa的振幅之外,事件偵測(cè)器104也可以偵測(cè)聲音信號(hào)的信噪比(SNR)或者子頻段信噪比(sub-band SNR)。亦即,當(dāng)聲音信號(hào)Sa的信噪比(SNR)或者子頻段信噪比(sub-band SNR)大于臨限值時(shí),事件偵測(cè)器104產(chǎn)生第一中斷信號(hào)INTl至聲音辨識(shí)處理器120。
[0007]再者,聲音辨識(shí)處理器120為一種數(shù)字信號(hào)處理器(DSP),又稱為微小處理器(tinyprocessor),其作用在于對(duì)聲音信號(hào)Sa進(jìn)行語(yǔ)音識(shí)別。當(dāng)?shù)谝恢袛嘈盘?hào)INTl尚未動(dòng)作之前,聲音辨識(shí)處理器120未被供電,所以無(wú)法運(yùn)作,此時(shí)尚處于聲音喚醒偵測(cè)裝置100的第一偵測(cè)程序。反之,當(dāng)?shù)谝恢袛嘈盘?hào)INTl動(dòng)作時(shí),聲音辨識(shí)處理器120被供電,聲音喚醒偵測(cè)裝置100即由第一偵測(cè)程序進(jìn)入第二偵測(cè)程序(second phase detect1n)并且開始執(zhí)行聲音信號(hào)Sa的關(guān)鍵詞辨識(shí)動(dòng)作。
[0008]于第二偵測(cè)程序,聲音辨識(shí)處理器120辨識(shí)聲音信號(hào)Sa是否為關(guān)鍵詞的聲音。當(dāng)聲音辨識(shí)處理器120確認(rèn)聲音信號(hào)Sa是關(guān)鍵詞的聲音,聲音辨識(shí)處理器120即產(chǎn)生第二中斷信號(hào)INT2至主處理器130。當(dāng)主處理器130接收到第二中斷信號(hào)INT2時(shí),聲音喚醒偵測(cè)裝置100即由第二偵測(cè)程序進(jìn)入第三偵測(cè)程序(third phase detect1n)。
[0009]反之,當(dāng)聲音辨識(shí)處理器120確認(rèn)聲音信號(hào)Sa不是關(guān)鍵詞的聲音,并不會(huì)動(dòng)作第二中斷信號(hào)INT2至主處理器130,并且聲音辨識(shí)處理器120會(huì)再次被停止供電。此時(shí),聲音喚醒偵測(cè)裝置100即由第二偵測(cè)程序進(jìn)入第一偵測(cè)程序,并且等待前端偵測(cè)電路110再次產(chǎn)生第一中斷信號(hào)INTl。
[0010]再者,于第三偵測(cè)程序時(shí),主處理器130被供電,并進(jìn)一步使得智能型手機(jī)進(jìn)入正常運(yùn)作狀態(tài)。
[0011]由以上的說(shuō)明可知,現(xiàn)有智能型手機(jī)中,于第一偵測(cè)程序時(shí),前端偵測(cè)器110僅對(duì)聲音信號(hào)Sa進(jìn)行聲音事件的判斷,并不會(huì)對(duì)聲音信號(hào)Sa進(jìn)行關(guān)鍵詞的辨識(shí)。而于第二偵測(cè)程序時(shí),聲音辨識(shí)處理器120才會(huì)開始對(duì)聲音信號(hào)Sa進(jìn)行關(guān)鍵詞的辨識(shí)。
[0012]—般來(lái)說(shuō),現(xiàn)有聲音喚醒偵測(cè)裝置100中,僅前端偵測(cè)電路110運(yùn)作于第一偵測(cè)程序時(shí),消耗的電能最小,大約需要ImA的電流。于前端偵測(cè)電路110與聲音辨識(shí)處理器120同時(shí)在運(yùn)作的第二偵測(cè)程序時(shí),電能次之,大約需要6mA的電流。
[0013]現(xiàn)有的聲音喚醒偵測(cè)裝置100還是有缺點(diǎn)。舉例來(lái)說(shuō),假設(shè)智能型手機(jī)于睡眠狀態(tài)時(shí)處于吵雜的環(huán)境下,則麥克風(fēng)102將持續(xù)收到不是關(guān)鍵詞的聲音。此時(shí),前端偵測(cè)電路110有可能被激發(fā)(trigger)而常常產(chǎn)生第一中斷信號(hào)INTl。因此,聲音喚醒偵測(cè)裝置100會(huì)常常在第一偵測(cè)程序與第二偵測(cè)程序之間運(yùn)作。所以,一整天下來(lái)其電能損耗(day of usepower consumpt1n)也是非常可觀。
【發(fā)明內(nèi)容】
[0014]本發(fā)明之主要目的在于提出一種聲音喚醒偵測(cè)裝置與方法。當(dāng)電子裝置處于睡眠狀態(tài)時(shí),聲音喚醒偵測(cè)裝置能更準(zhǔn)確地(accurately)于第一偵測(cè)程序偵測(cè)聲音信號(hào)。如此,可以有效地降低聲音喚醒偵測(cè)裝置執(zhí)行第二偵測(cè)程序的次數(shù),并降低電子裝置的日電能損耗(day of use power consumpt1n)。
[0015]本發(fā)明有關(guān)于一種聲音喚醒偵測(cè)裝置,運(yùn)用于電子產(chǎn)品,該裝置包括:前端偵測(cè)電路,辨識(shí)聲音信號(hào)中是否出現(xiàn)子關(guān)鍵詞,并且于確認(rèn)出現(xiàn)該子關(guān)鍵詞時(shí),產(chǎn)生第一中斷信號(hào);聲音辨識(shí)處理器,于接收到該第一中斷信號(hào)后開始運(yùn)作,并辨識(shí)該聲音信號(hào)中是否出現(xiàn)關(guān)鍵詞,并且于確認(rèn)出現(xiàn)該關(guān)鍵詞時(shí),產(chǎn)生第二中斷信號(hào);以及主處理器,于接收到該第二中斷信號(hào)后開始運(yùn)作,并使得該電子產(chǎn)品由睡眠狀態(tài)進(jìn)入正常運(yùn)作模式。
[0016]本發(fā)明有關(guān)于一種聲音喚醒偵測(cè)方法,包括下列步驟:提供前端偵測(cè)電路接收聲音信號(hào),并辨識(shí)該聲音信號(hào);當(dāng)該聲音信號(hào)中出現(xiàn)子關(guān)鍵詞的聲音時(shí),啟動(dòng)聲音辨識(shí)處理器來(lái)辨識(shí)該聲音信號(hào);當(dāng)該聲音信號(hào)中出現(xiàn)關(guān)鍵詞的聲音時(shí),啟動(dòng)主處理器,并喚醒該電子產(chǎn)品應(yīng)以進(jìn)入正常運(yùn)作狀態(tài)。
[0017]為了對(duì)本發(fā)明之上述及其他方面有更佳的了解,下文特舉較佳實(shí)施例,并配合所附圖式,作詳細(xì)說(shuō)明如下:
【附圖說(shuō)明】
[0018]圖1所繪示為現(xiàn)有電子產(chǎn)品中的聲音喚醒偵測(cè)裝置示意圖。
[0019]圖2A與圖2B所繪示為本發(fā)明聲音喚醒偵測(cè)裝置的功能方塊示意圖
[0020]圖3所繪示為本發(fā)明電子產(chǎn)品中的聲音喚醒偵測(cè)裝置的第一實(shí)施例。
[0021]圖4所繪示為本發(fā)明電子產(chǎn)品中的聲音喚醒偵測(cè)裝置的第二實(shí)施例。
[0022]圖5A與圖5B所繪示為本發(fā)明子關(guān)鍵詞判斷電路示意圖。
[0023]圖6所繪示為本發(fā)明電子產(chǎn)品中的聲音喚醒偵測(cè)方法流程圖。
【具體實(shí)施方式】
[0024]本發(fā)明是一種語(yǔ)者相關(guān)(speakerdependent)的聲音喚醒偵測(cè)裝置與相關(guān)方法。利用訓(xùn)練動(dòng)作(training act 1n)來(lái)建立子關(guān)鍵詞的模型參數(shù)(sub-keyword modelparameters)以及關(guān)鍵詞的模型參數(shù)(keyword model parameters),分別運(yùn)用于第一偵測(cè)程序以及第二偵測(cè)程序。
[0025]圖2A與圖2B,其所繪示為本發(fā)明聲音喚醒偵測(cè)裝置的功能方塊示意圖。首先,當(dāng)電子產(chǎn)品于正常運(yùn)作狀態(tài)時(shí),利用主處理器來(lái)產(chǎn)生關(guān)鍵詞模型參數(shù)232及子關(guān)鍵詞模型參數(shù)234。于睡眠狀態(tài)時(shí),子關(guān)鍵詞模型參數(shù)即可用于第一偵測(cè)程序,而關(guān)鍵詞模型參數(shù)即可運(yùn)用于第二偵測(cè)程序。
[0026]如圖2A所示,于正常運(yùn)作狀態(tài)時(shí),主處理器可以執(zhí)行訓(xùn)練動(dòng)作(trainingact1n),用以接收關(guān)鍵詞的聲音信號(hào)Sa。以下系假設(shè)關(guān)鍵詞為“H1-Patent”,且“Hi”為子關(guān)鍵詞來(lái)進(jìn)行說(shuō)明。
[0027]于訓(xùn)練動(dòng)作時(shí),主處理器中的模型參數(shù)估算單元(model parameter estimat1nunit)230即接收用戶所發(fā)出關(guān)鍵詞“H1-Patent”的聲音信號(hào)Sa后,會(huì)利用先進(jìn)行特征擷取動(dòng)作(feature extracting)以擷取聲音信號(hào)Sa中的各種聲音特征(voice feature),例如頻率、音量、噪音等等特征。接著利用特定的語(yǔ)音識(shí)別模型來(lái)對(duì)聲音信號(hào)Sa建立關(guān)鍵詞模型參數(shù)232?;旧?,特定的語(yǔ)音識(shí)別模型可為隱藏式馬可夫模型(Hidden Markov Model,簡(jiǎn)稱ΗΜΜ) ο當(dāng)然,本發(fā)明并不限定于上述的HMM,也可以是高斯混合模型(Gaussian MixtureModel,簡(jiǎn)稱GMM)、支持向量機(jī)制(Support Vector Machine,SVM)模型或者神經(jīng)網(wǎng)絡(luò)(Neural Net)模型等等的其他語(yǔ)音識(shí)別模型。
[0028]再者,為了要建立子關(guān)鍵詞模型參數(shù)234,模型參數(shù)估算單元230更需要進(jìn)行分段動(dòng)作(segmentat1n)。分段動(dòng)作系基于關(guān)鍵詞“H1-Patent”的HMM運(yùn)用維特比譯碼算法來(lái)分離關(guān)鍵詞中的“Hi”與“Patent”。
[0029]于分段完成之后,模型參數(shù)估算單元230利用獲得的“Hi”子關(guān)鍵詞,以HMM來(lái)建立子關(guān)鍵詞模型參數(shù)。當(dāng)然,上述分段動(dòng)并不限定于將關(guān)鍵詞