語(yǔ)音激活檢測(cè)方法與裝置的制作方法

文檔序號(hào)：2835840閱讀：350來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：語(yǔ)音激活檢測(cè)方法與裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及音頻信號(hào)處理技術(shù)領(lǐng)域，特別涉及一種語(yǔ)音激活檢測(cè)方法與裝置。
背景技術(shù)：
語(yǔ)音激活檢測(cè)(VAD，Voice Activity Detection)是一種通過(guò)特定的判決準(zhǔn)則判斷語(yǔ)音中出現(xiàn)的停頓和靜默間隔，檢測(cè)出有效語(yǔ)音部分的技術(shù)。通常運(yùn)用這種技術(shù)可以在確保語(yǔ)音質(zhì)量的前提下，對(duì)不同類別的語(yǔ)音段采用不同的比特?cái)?shù)進(jìn)行編碼，從而降低語(yǔ)音的編碼速率。由于在雙工通信系統(tǒng)中，一方只有35%左右的時(shí)間處于激活狀態(tài)，如何降低靜音期的編碼速率對(duì)于減少傳輸帶寬、功率以及容量具有積極的作用，因此VAD技術(shù)在語(yǔ)音通信領(lǐng)域具有重要的使用價(jià)值?；贗Pdnternet Protocol)的語(yǔ)音會(huì)議，一般都由終端進(jìn)行回聲消除和去噪處理，但是有些終端并沒(méi)有做這些處理，導(dǎo)致會(huì)議里面回聲和噪聲都很大，嚴(yán)重影響了語(yǔ)音會(huì)議的質(zhì)量。為了適應(yīng)各種品質(zhì)的終端，語(yǔ)音服務(wù)器(例如多媒體調(diào)度機(jī))有必要對(duì)終端帶進(jìn)的回聲和噪聲進(jìn)行處理，使語(yǔ)音會(huì)議質(zhì)量達(dá)到可用程度。而通過(guò)VAD技術(shù)能夠區(qū)分傳輸?shù)穆曇粜盘?hào)中的語(yǔ)音信號(hào)和噪音信號(hào)，去除噪聲信號(hào)以避免無(wú)用信號(hào)的傳輸，提高語(yǔ)音質(zhì)量。目前，對(duì)于VAD技術(shù)的研究較多，例如(1)《基于三階累積量的VAD算法》，北京郵電大學(xué)，王凡。該算法可以判斷出淹沒(méi)在噪聲中的語(yǔ)音，但由于噪聲信號(hào)和清音信號(hào)服從較為接近的分布特性，這就使得利用此算法后，對(duì)原音頻信號(hào)進(jìn)行重構(gòu)時(shí)會(huì)使話音質(zhì)量下降，這是三階累積量理論無(wú)法克服的一個(gè)不足。(2)《基于高階循環(huán)累積量的VAD算法》，華中科技大學(xué)，朱曉亮。該算法采用 MA (Moving Average)模型對(duì)語(yǔ)音信號(hào)建模，并選擇平均幅度差(AMDF，Average Magnitude Difference Function)的方法來(lái)估算循環(huán)頻率以降低算法復(fù)雜度。該算法對(duì)高斯(白色或有色)噪聲以及其它平穩(wěn)噪聲自適應(yīng)能力強(qiáng)、檢測(cè)性能突出，但對(duì)于復(fù)雜背景噪聲的處理效果不算理想。因此，目前很多方法都是以犧牲通話質(zhì)量為代價(jià)去減少背景噪聲的，而且對(duì)于復(fù)雜背景噪聲的處理效果不佳，暫時(shí)還沒(méi)有一種方法能夠確保通話質(zhì)量的同時(shí)將噪聲降低到最小。關(guān)于VAD的相關(guān)技術(shù)，還可參考公開(kāi)號(hào)為CN 101320559A的中國(guó)專利申請(qǐng)，該專利
公開(kāi)了一種聲音激活檢測(cè)裝置及方法。

發(fā)明內(nèi)容
本發(fā)明解決的問(wèn)題是提供一種語(yǔ)音激活檢測(cè)方法與裝置，能快捷、有效地識(shí)別出輸入的聲音信號(hào)中的語(yǔ)音信號(hào)和噪聲信號(hào)，在確保通話質(zhì)量的同時(shí)達(dá)到減少背景噪聲的目的。為解決上述問(wèn)題，本發(fā)明的技術(shù)方案提供一種語(yǔ)音激活檢測(cè)方法，包括
對(duì)輸入的聲音信號(hào)進(jìn)行分幀；以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行時(shí)頻分析；若時(shí)頻分析后的結(jié)果小于或等于第一參考閾值，則判定該幀為噪聲信號(hào)；若時(shí)頻分析后的結(jié)果大于所述第一參考閾值，且小于第二參考閾值，則該幀為待定信號(hào)，基于下一幀聲音信號(hào)的判定結(jié)果對(duì)其進(jìn)行判定；若時(shí)頻分析后的結(jié)果大于或等于所述第二參考閾值，則判定該幀為語(yǔ)音信號(hào)；所述第二參考閾值與第一參考閾值具有倍數(shù)關(guān)系。可選的，所述第一參考閾值和第二參考閾值是通過(guò)提取所述輸入的聲音信號(hào)中前 N幀聲音信號(hào)并進(jìn)行分析得到的?？蛇x的，基于下一幀聲音信號(hào)的判定結(jié)果對(duì)所述待定信號(hào)進(jìn)行判定包括將所述待定信號(hào)判定為與所述下一幀聲音信號(hào)的信號(hào)類型一致?？蛇x的，當(dāng)判定該幀為噪聲信號(hào)之后，還包括基于該幀噪聲信號(hào)更新所述第一參考閾值和第二參考閾值?？蛇x的，所述第一參考閾值大于或等于最小預(yù)設(shè)值，且小于或等于最大預(yù)設(shè)值；所述基于該幀噪聲信號(hào)更新所述第一參考閾值和第二參考閾值包括將所述最大預(yù)設(shè)值與所述時(shí)頻分析后的結(jié)果分別乘以預(yù)設(shè)加權(quán)系數(shù)后相加得到的值更新所述第一參考閾值；基于所述第二參考閾值和第一參考閾值的倍數(shù)關(guān)系和更新后的第一參考閾值更新所述第二參考閾值。可選的，所述語(yǔ)音激活檢測(cè)方法還包括保存與判定出的語(yǔ)音信號(hào)連續(xù)的前P幀待定信號(hào)以及保存與判定出的語(yǔ)音信號(hào)連續(xù)的后Q幀待定信號(hào)?？蛇x的，所述第二參考閾值為第一參考閾值的1.3倍?？蛇x的，每一幀聲音信號(hào)的長(zhǎng)度為8ms。可選的，所述時(shí)頻分析包括對(duì)該幀聲音信號(hào)分別在時(shí)域以及頻域上求方差，獲得反映其在時(shí)域以及頻域上的綜合變化率的值。為解決上述問(wèn)題，本發(fā)明的技術(shù)方案還提供一種語(yǔ)音激活檢測(cè)方法，包括對(duì)輸入的聲音信號(hào)進(jìn)行分幀；設(shè)定噪聲信號(hào)的第一參考閾值和第二參考閾值，所述第二參考閾值與第一參考閾值具有倍數(shù)關(guān)系；判斷所述第一參考閾值是否處于預(yù)定范圍之內(nèi)，否則以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行時(shí)頻分析；是則以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行過(guò)零率計(jì)算，若計(jì)算出的過(guò)零率大于預(yù)設(shè)閾值，則進(jìn)行所述時(shí)頻分析，否則判定該幀為噪聲信號(hào)；若時(shí)頻分析后的結(jié)果小于或等于第一參考閾值，則判定該幀為噪聲信號(hào)；若時(shí)頻分析后的結(jié)果大于所述第一參考閾值，且小于第二參考閾值，則該幀為待定信號(hào)，基于下一幀聲音信號(hào)的判定結(jié)果對(duì)其進(jìn)行判定；若時(shí)頻分析后的結(jié)果大于或等于所述第二參考閾值，則判定該幀為語(yǔ)音信號(hào)?？蛇x的，所述語(yǔ)音激活檢測(cè)方法還包括基于所述第一參考閾值設(shè)定所述過(guò)零率的預(yù)設(shè)閾值?？蛇x的，所述第一參考閾值大于或等于最小預(yù)設(shè)值，且小于或等于最大預(yù)設(shè)值；所述預(yù)定范圍包括第一預(yù)定范圍和第二預(yù)定范圍，所述第一預(yù)定范圍與所述最大預(yù)設(shè)值相關(guān)，所述第二預(yù)定范圍與所述最小預(yù)設(shè)值和中間預(yù)設(shè)值相關(guān)，所述中間預(yù)設(shè)值大于最小預(yù)設(shè)值，且小于最大預(yù)設(shè)值；所述基于所述第一參考閾值設(shè)定所述過(guò)零率的預(yù)設(shè)閾值包括若所述第一參考閾值處于所述第一預(yù)定范圍之內(nèi)，則將所述過(guò)零率的預(yù)設(shè)閾值設(shè)定為第一預(yù)設(shè)閾值；若所述第一參考閾值處于所述第二預(yù)定范圍之內(nèi)，則將所述過(guò)零率的預(yù)設(shè)閾值設(shè)定為第二預(yù)設(shè)閾值?？蛇x的，所述第一參考閾值和第二參考閾值是通過(guò)提取所述輸入的聲音信號(hào)中前 N幀聲音信號(hào)并進(jìn)行分析得到的?？蛇x的，基于下一幀聲音信號(hào)的判定結(jié)果對(duì)所述待定信號(hào)進(jìn)行判定包括將所述待定信號(hào)判定為與所述下一幀聲音信號(hào)的信號(hào)類型一致?？蛇x的，當(dāng)判定該幀為噪聲信號(hào)之后，所述語(yǔ)音激活檢測(cè)方法還包括基于該幀噪聲信號(hào)更新所述第一參考閾值和第二參考閾值?？蛇x的，所述第一參考閾值大于或等于最小預(yù)設(shè)值，且小于或等于最大預(yù)設(shè)值；所述基于該幀噪聲信號(hào)更新所述第一參考閾值和第二參考閾值包括將所述最大預(yù)設(shè)值與所述時(shí)頻分析后的結(jié)果分別乘以預(yù)設(shè)加權(quán)系數(shù)后相加得到的值更新所述第一參考閾值；基于所述第二參考閾值和第一參考閾值的倍數(shù)關(guān)系和更新后的第一參考閾值更新所述第二參考閾值。為解決上述問(wèn)題，本發(fā)明的技術(shù)方案還提供一種語(yǔ)音激活檢測(cè)裝置，包括分幀單元，適于對(duì)輸入的聲音信號(hào)進(jìn)行分幀；時(shí)頻分析單元，適于以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行時(shí)頻分析；判定單元，適于當(dāng)時(shí)頻分析后的結(jié)果小于或等于第一參考閾值，則判定該幀為噪聲信號(hào)；若時(shí)頻分析后的結(jié)果大于所述第一參考閾值，且小于第二參考閾值，則該幀為待定信號(hào)，基于下一幀聲音信號(hào)的判定結(jié)果對(duì)其進(jìn)行判定；若時(shí)頻分析后的結(jié)果大于或等于所述第二參考閾值，則判定該幀為語(yǔ)音信號(hào)；所述第二參考閾值與第一參考閾值具有倍數(shù)關(guān)系?？蛇x的，所述語(yǔ)音激活檢測(cè)裝置還包括噪聲預(yù)測(cè)單元，適于提取所述輸入的聲音信號(hào)中前N幀聲音信號(hào)并進(jìn)行分析，得到所述第一參考閾值和第二參考閾值?？蛇x的，所述語(yǔ)音激活檢測(cè)裝置還包括更新單元，適于當(dāng)所述判定單元判定該幀為噪聲信號(hào)之后，基于該幀噪聲信號(hào)更新所述第一參考閾值和第二參考閾值。可選的，所述語(yǔ)音激活檢測(cè)裝置還包括存儲(chǔ)單元，適于保存與判定出的語(yǔ)音信號(hào)連續(xù)的前P幀待定信號(hào)以及保存與判定出的語(yǔ)音信號(hào)連續(xù)的后Q幀待定信號(hào)。為解決上述問(wèn)題，本發(fā)明的技術(shù)方案還提供一種語(yǔ)音激活檢測(cè)裝置，包括分幀單元，適于對(duì)輸入的聲音信號(hào)進(jìn)行分幀；第一設(shè)定單元，適于設(shè)定噪聲信號(hào)的第一參考閾值和第二參考閾值，所述第二參考閾值與第一參考閾值具有倍數(shù)關(guān)系；第一判定單元，適于判斷所述第一參考閾值是否處于預(yù)定范圍之內(nèi)；過(guò)零率計(jì)算單元，適于當(dāng)判斷出所述第一參考閾值處于預(yù)定范圍之內(nèi)，以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行過(guò)零率計(jì)算；第二判定單元，適于判斷計(jì)算出的過(guò)零率是否大于預(yù)設(shè)閾值，否則判定該幀為噪
聲信號(hào)；時(shí)頻分析單元，適于當(dāng)所述第一判定單元判斷出所述第一參考閾值處于預(yù)定范圍之外或所述第二判定單元判斷出計(jì)算出的過(guò)零率大于所述預(yù)設(shè)閾值時(shí)，以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行時(shí)頻分析；第三判定單元，適于當(dāng)時(shí)頻分析后的結(jié)果小于或等于第一參考閾值，則判定該幀為噪聲信號(hào)；當(dāng)時(shí)頻分析后的結(jié)果大于第一參考閾值，且小于所述第二參考閾值，則該幀為待定信號(hào)，基于下一幀聲音信號(hào)的判定結(jié)果對(duì)其進(jìn)行判定；當(dāng)時(shí)頻分析后的結(jié)果大于或等于所述第二參考閾值，則判定該幀為語(yǔ)音信號(hào)。與現(xiàn)有技術(shù)相比，本技術(shù)方案具有以下優(yōu)點(diǎn)通過(guò)對(duì)輸入的聲音信號(hào)進(jìn)行分幀(每幀聲音信號(hào)平滑過(guò)渡)，再以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行時(shí)頻分析，將時(shí)頻分析的結(jié)果與預(yù)先設(shè)定好的噪聲信號(hào)的第一參考閾值和第二參考閾值進(jìn)行比較，從而能夠快捷、有效地識(shí)別出某一幀聲音信號(hào)是語(yǔ)音信號(hào)還是噪聲信號(hào)，以實(shí)現(xiàn)確保通話質(zhì)量的同時(shí)達(dá)到減少背景噪聲的目的。通過(guò)判斷設(shè)定的第一參考閾值是否處于預(yù)設(shè)范圍之內(nèi)，是則根據(jù)所述第一參考閾值處于不同的預(yù)設(shè)范圍(不同的噪聲信號(hào)類型)對(duì)應(yīng)設(shè)定不同的過(guò)零率的預(yù)設(shè)閾值，通過(guò)以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行過(guò)零率計(jì)算，對(duì)于計(jì)算的過(guò)零率小于所述預(yù)設(shè)閾值則判定為噪聲信號(hào)，否則以時(shí)頻分析進(jìn)行進(jìn)一步檢驗(yàn)，由此實(shí)現(xiàn)了對(duì)不同噪聲信號(hào)有針對(duì)性的檢驗(yàn)，從而能在很大程度上避免產(chǎn)生誤檢和漏檢的情況，對(duì)噪聲信號(hào)與語(yǔ)音信號(hào)的識(shí)別更為有效。基于已識(shí)別出的噪聲信號(hào)，及時(shí)地對(duì)第一參考閾值和第二參考閾值進(jìn)行不斷的更新，從而能實(shí)現(xiàn)對(duì)當(dāng)前環(huán)境中背景噪聲變化的自適應(yīng)，使對(duì)噪聲信號(hào)與語(yǔ)音信號(hào)的識(shí)別更為準(zhǔn)確、有效。另外，通過(guò)提取輸入的聲音信號(hào)中前N幀聲音信號(hào)并進(jìn)行分析得到所述第一參考閾值和第二參考閾值的方式，能在語(yǔ)音通話建立之初就根據(jù)所處的不同環(huán)境設(shè)定出適應(yīng)當(dāng)前環(huán)境的噪聲信號(hào)的參考閾值，較好地實(shí)現(xiàn)了對(duì)當(dāng)前環(huán)境的背景噪聲的預(yù)測(cè)，使對(duì)噪聲信號(hào)的識(shí)別更為準(zhǔn)確。

圖1是本發(fā)明實(shí)施例一提供的語(yǔ)音激活檢測(cè)方法的流程示意圖；圖2是本發(fā)明實(shí)施例一提供的語(yǔ)音激活檢測(cè)裝置的結(jié)構(gòu)示意圖；圖3是本發(fā)明實(shí)施例二提供的語(yǔ)音激活檢測(cè)方法的流程示意圖；圖4是本發(fā)明實(shí)施例二提供的語(yǔ)音激活檢測(cè)裝置的結(jié)構(gòu)示意圖；圖5是本發(fā)明實(shí)施例三提供的語(yǔ)音激活檢測(cè)方法的流程示意圖；圖6是本發(fā)明實(shí)施例三提供的語(yǔ)音激活檢測(cè)裝置的結(jié)構(gòu)示意圖。
具體實(shí)施例方式如背景技術(shù)所述，現(xiàn)有技術(shù)中很多方法都是以犧牲通話質(zhì)量為代價(jià)去減少背景噪聲，而且對(duì)于復(fù)雜背景噪聲的處理效果不佳。本技術(shù)方案通過(guò)采用各種模擬工具找到語(yǔ)音信號(hào)與噪聲信號(hào)之間特性的差異，然后綜合利用語(yǔ)音平滑(分幀)，時(shí)域過(guò)零率計(jì)算，時(shí)域方差計(jì)算，頻域方差計(jì)算等方法獲得反映輸入的聲音信號(hào)在時(shí)域以及頻域上的綜合變化率的值，并采用自適應(yīng)背景噪聲的方法檢測(cè)VAD，使得能快捷、有效地識(shí)別出輸入的聲音信號(hào)中的語(yǔ)音信號(hào)和噪聲信號(hào)，達(dá)到去除噪聲信號(hào)的同時(shí)還原語(yǔ)音真實(shí)質(zhì)量的目的。為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更為明顯易懂，下面結(jié)合附圖對(duì)本發(fā)明的具體實(shí)施方式
做詳細(xì)的說(shuō)明。在以下描述中闡述了具體細(xì)節(jié)以便于充分理解本發(fā)明。但是本發(fā)明能夠以多種不同于在此描述的其它方式來(lái)實(shí)施，本領(lǐng)域技術(shù)人員可以在不違背本發(fā)明內(nèi)涵的情況下做類似推廣。因此本發(fā)明不受下面公開(kāi)的具體實(shí)施方式
的限制。實(shí)施例一圖1是本發(fā)明實(shí)施例一提供的語(yǔ)音激活檢測(cè)方法的流程示意圖。如圖1所示，所述語(yǔ)音激活檢測(cè)方法包括以下步驟首先執(zhí)行步驟S101，對(duì)輸入的聲音信號(hào)進(jìn)行分幀。本領(lǐng)域技術(shù)人員知曉，語(yǔ)音信號(hào)分析的目的就是在于方便有效地提取并表示語(yǔ)音信號(hào)所攜帶的信息，是語(yǔ)音信號(hào)處理的前提和基礎(chǔ)，只有分析出可表示語(yǔ)音信號(hào)特征的參數(shù)，才有可能利用這些參數(shù)進(jìn)行高效的語(yǔ)音通信、語(yǔ)音合成和語(yǔ)音識(shí)別等處理。語(yǔ)音一般分為無(wú)聲段、清音段和濁音段。一般把濁音認(rèn)為是一個(gè)以基音周期為周期的斜三角脈沖串，把清音模擬成隨機(jī)白噪聲。由于語(yǔ)音信號(hào)是一個(gè)非平穩(wěn)態(tài)過(guò)程，不能用處理平穩(wěn)信號(hào)的信號(hào)處理技術(shù)對(duì)其進(jìn)行分析處理。但由于語(yǔ)音信號(hào)本身的特點(diǎn)，在短時(shí)間(例如10 30ms甚至更短的時(shí)間)范圍內(nèi)，其特性可以看作是一個(gè)準(zhǔn)穩(wěn)態(tài)過(guò)程，即語(yǔ)音信號(hào)具有短時(shí)平穩(wěn)性。因此，利用語(yǔ)音的短時(shí)平穩(wěn)特性，可以將處理平穩(wěn)信號(hào)的信號(hào)處理技術(shù)引入到語(yǔ)音信號(hào)的短時(shí)處理中去，例如可以采用加窗分幀的方法將輸入的聲音信號(hào)(包括語(yǔ)音信號(hào)和噪聲信號(hào))分為多幀聲音信號(hào)，每一幀短時(shí)的聲音信號(hào)又稱為一個(gè)分析幀(簡(jiǎn)稱為幀)。分幀是用有限長(zhǎng)度的窗函數(shù)來(lái)截取輸入的聲音信號(hào)形成分析幀，窗函數(shù)將需要處理區(qū)域之外的樣點(diǎn)置零來(lái)獲得當(dāng)前的分析幀。分幀雖然可以采用將輸入的聲音信號(hào)連續(xù)分段的方法，但一般常采用交疊分段的方法，即前一幀與后一幀具有共同的交疊部分，該交疊部分稱為幀移，這樣可以使幀與幀之間平滑過(guò)渡，保持其連續(xù)性。幀移與幀長(zhǎng)(一幀聲音信號(hào)的長(zhǎng)度)的比值一般取為0 1/2。本實(shí)施例中，每一幀聲音信號(hào)的長(zhǎng)度為8ms，后續(xù)步驟中的過(guò)零率計(jì)算以及背景噪聲的預(yù)測(cè)及估計(jì)都是依據(jù)8ms長(zhǎng)度數(shù)據(jù)計(jì)算的。關(guān)于對(duì)輸入的聲音信號(hào)進(jìn)行加窗分幀的方法為本技術(shù)領(lǐng)域常用手段，在此不再贅述。執(zhí)行步驟S102，設(shè)定噪聲信號(hào)的參考閾值，所述參考閾值包括第一參考閾值和第二參考閾值。因?yàn)橐R(shí)別出聲音信號(hào)中的語(yǔ)音信號(hào)和噪聲信號(hào)，就需要對(duì)噪聲信號(hào)與語(yǔ)音信號(hào)之間特性的差異進(jìn)行分析，特別是對(duì)各種類型的噪聲信號(hào)進(jìn)行分析。對(duì)此，就需要預(yù)先進(jìn)行大量的實(shí)驗(yàn)，對(duì)各類噪聲信號(hào)進(jìn)行分析，提取出其特征參數(shù)，例如常用的方法是通過(guò)對(duì)噪聲信號(hào)進(jìn)行時(shí)域分析以及頻域分析，獲得反映其在時(shí)域以及頻域上綜合變化率的值，從而統(tǒng)計(jì)出能快捷、有效識(shí)別出噪聲信號(hào)和語(yǔ)音信號(hào)的參考閾值的范圍。如此，當(dāng)輸入的聲音信號(hào)通過(guò)步驟SlOl分幀之后，在后續(xù)步驟中，就能夠以幀為單位對(duì)每一幀聲音信號(hào)進(jìn)行分析，并將分析后的結(jié)果與所述參考閾值進(jìn)行比較，從而基于不同的比較結(jié)果判定出該幀聲音信號(hào)是噪聲信號(hào)、語(yǔ)音信號(hào)或是有待進(jìn)一步判定的信號(hào)。具體判定過(guò)程將在下面步驟中詳細(xì)描述。需要說(shuō)明的是，所述參考閾值包括第一參考閾值和第二參考閾值，其中，所述第一參考閾值主要用于實(shí)現(xiàn)對(duì)噪聲信號(hào)的識(shí)別，而所述第二參考閾值則主要用于實(shí)現(xiàn)對(duì)語(yǔ)音信號(hào)的識(shí)別，通過(guò)大量實(shí)驗(yàn)的統(tǒng)計(jì)結(jié)果發(fā)現(xiàn)，第二參考閾值與第一參考閾值之間是具有一定倍數(shù)關(guān)系的，因此，確定了第一參考閾值，也就能確定第二參考閾值。本實(shí)施例中，所述第二參考閾值為第一參考閾值的1. 3倍，對(duì)于“1. 3倍”的確定，正是基于對(duì)多種背景噪聲進(jìn)行大量實(shí)驗(yàn)，通過(guò)統(tǒng)計(jì)計(jì)算結(jié)果而得到的值。此外，在所述第一參考閾值的具體設(shè)定過(guò)程中，分別設(shè)置有最大預(yù)設(shè)值、最小預(yù)設(shè)值，所述第一參考閾值的取值范圍用區(qū)間表示為[最小預(yù)設(shè)值，最大預(yù)設(shè)值]，即所述第一參考閾值大于或等于所述最小預(yù)設(shè)值，且小于或等于所述最大預(yù)設(shè)值。當(dāng)然，在所述最小預(yù)設(shè)值和最大預(yù)設(shè)值之間還可以設(shè)定一個(gè)中間預(yù)設(shè)值，所述中間預(yù)設(shè)值的取值范圍用區(qū)間表示為(最小預(yù)設(shè)值，最大預(yù)設(shè)值)，即所述中間預(yù)設(shè)值大于所述最小預(yù)設(shè)值且小于所述最大預(yù)設(shè)值。對(duì)于所述第一參考閾值的最大預(yù)設(shè)值和最小預(yù)設(shè)值的設(shè)定也會(huì)影響最終判定的結(jié)果，因此，設(shè)定所述第一參考閾值的時(shí)候，應(yīng)該根據(jù)實(shí)際情況對(duì)所述最大預(yù)設(shè)值和最小預(yù)設(shè)值進(jìn)行設(shè)置。具體實(shí)施時(shí)，所述第一參考閾值的最大預(yù)設(shè)值設(shè)為350，所述第一參考閾值的最小預(yù)設(shè)值設(shè)為對(duì)0，所述第一參考閾值的中間預(yù)設(shè)值設(shè)為觀0。本實(shí)施例中，所述參考閾值(包括第一參考閾值和第二參考閾值)是通過(guò)提取所述輸入的聲音信號(hào)中前N幀聲音信號(hào)并進(jìn)行分析得到的。一般地，N的取值越大(即采集的幀數(shù)越多)，對(duì)于語(yǔ)音通話建立之初當(dāng)前環(huán)境的背景噪聲的預(yù)測(cè)效果就越好，當(dāng)然，如果采集的幀數(shù)越多，其分析處理的過(guò)程就會(huì)比較長(zhǎng)，從而參考閾值的確定過(guò)程就會(huì)占用一定時(shí)間，不能及時(shí)地完成對(duì)噪聲信號(hào)的參考閾值的設(shè)定。因此，在具體實(shí)施時(shí)，可以根據(jù)實(shí)際情況確定N的取值。通過(guò)提取輸入的聲音信號(hào)中前N幀聲音信號(hào)并進(jìn)行分析得到所述參考閾值的方式，能在語(yǔ)音通話建立之初就根據(jù)所處的不同環(huán)境設(shè)定出適應(yīng)當(dāng)前環(huán)境的噪聲信號(hào)的參考閾值，較好地實(shí)現(xiàn)了對(duì)當(dāng)前環(huán)境的背景噪聲的預(yù)測(cè)，使對(duì)噪聲信號(hào)的識(shí)別更為準(zhǔn)確。在其他實(shí)施例中，也可以根據(jù)實(shí)際情況預(yù)先便選擇合適的參考閾值完成設(shè)定，例如在語(yǔ)音通話之前就人為設(shè)定好參考閾值，此外，還可以采用早已設(shè)定好的默認(rèn)的參考閾值。執(zhí)行步驟S103，判斷所述第一參考閾值是否處于預(yù)定范圍之內(nèi)。如前所述，所述第一參考閾值主要用于實(shí)現(xiàn)對(duì)噪聲信號(hào)的識(shí)別，然而，考慮到某幾類特殊的噪聲信號(hào)在某些特性上與語(yǔ)音信號(hào)較為類似，依據(jù)所述參考閾值恐怕難以有效地識(shí)別出某一幀聲音信號(hào)是噪聲信號(hào)還是語(yǔ)音信號(hào)，即采用比較所述參考閾值這一特性難以準(zhǔn)確地判定出噪聲信號(hào)，由此可能產(chǎn)生誤檢和漏檢的情況。由于不同的噪聲信號(hào)具有多種不同的特性，因此可以針對(duì)這幾類特殊的噪聲信號(hào)的其他特性，例如針對(duì)不同噪聲信號(hào)在變化率及幅值大小不同情況下統(tǒng)計(jì)出不同的特性，采用對(duì)應(yīng)的方法對(duì)所述聲音信號(hào)進(jìn)行初步判定，這樣可以有效地識(shí)別出部分背景噪聲(所述幾類特殊的噪聲信號(hào))。若通過(guò)步驟S103判斷出所述第一參考閾值處于預(yù)定范圍之外，則執(zhí)行步驟S104，以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行時(shí)頻分析。所述時(shí)頻分析包括時(shí)域分析以及頻域分析，具體為對(duì)一幀聲音信號(hào)分別在時(shí)域以及頻域上求方差，獲得反映其在時(shí)域以及頻域上的綜合變化率的值。其中，基于分幀平滑后的一幀聲音信號(hào)，利用方差公式求出時(shí)域方差；基于分幀平滑后的一幀聲音信號(hào)，首先對(duì)該信號(hào)作快速傅里葉變換(FFT)，對(duì)求出的傅里葉變換求方差，最后對(duì)數(shù)據(jù)求模作為復(fù)頻域的變化率。在獲得時(shí)域方差的值和頻域方差的值之后，再對(duì)兩者分別乘以一定的加權(quán)系數(shù)(兩者所乘的加權(quán)系數(shù)之和等于1)，最終獲得的值為反映該幀聲音信號(hào)在時(shí)域以及頻域上的綜合變化率的值，即所述時(shí)頻分析后的結(jié)果。至于時(shí)域分析以及頻域分析的方法為本技術(shù)領(lǐng)域常用手段，在此不再贅述。若通過(guò)步驟S103判斷出所述第一參考閾值處于預(yù)定范圍之內(nèi)，則執(zhí)行步驟S105，以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行過(guò)零率計(jì)算。所述過(guò)零率計(jì)算也是較為常用的一種對(duì)聲音信號(hào)進(jìn)行時(shí)域分析方法。本領(lǐng)域技術(shù)人員知曉，過(guò)零率(短時(shí)過(guò)零率)表示一幀聲音信號(hào)中，其信號(hào)波形穿過(guò)橫軸(零電平)的次數(shù)，可以反映信號(hào)的頻譜特性，對(duì)于連續(xù)的信號(hào)，過(guò)零即意味著時(shí)域波形通過(guò)時(shí)間軸，而對(duì)于離散信號(hào)，如果相鄰的取樣值改變符號(hào)則稱為過(guò)零。過(guò)零率就是樣本改變符號(hào)的次數(shù)。清音和濁音的過(guò)零率分布大致呈高斯分布，一般兩者的過(guò)零率有較大差異，雖然依靠過(guò)零率不能完全區(qū)分清音和濁音，但是由于本實(shí)施例中所述的這幾類特殊的噪聲信號(hào)的過(guò)零率的次數(shù)與語(yǔ)音信號(hào)的過(guò)零率具有明顯的差異，因此通過(guò)將計(jì)算出的過(guò)零率與一預(yù)先設(shè)定的閾值進(jìn)行比較，能夠判定出噪聲信號(hào)。具體地，通過(guò)步驟S105進(jìn)行過(guò)零率的計(jì)算之后，則執(zhí)行步驟S106，判斷計(jì)算出的過(guò)零率是否大于預(yù)設(shè)閾值，是則執(zhí)行步驟S104，以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行時(shí)頻分析，否則執(zhí)行步驟S107，判定該幀為噪聲信號(hào)。需要說(shuō)明的是，在過(guò)零率的計(jì)算過(guò)程中，對(duì)于過(guò)零率的預(yù)設(shè)閾值的選擇很重要，選擇過(guò)小將產(chǎn)生誤檢，選擇過(guò)大將產(chǎn)生漏檢。因此，在本實(shí)施例中，是基于所述第一參考閾值設(shè)定所述過(guò)零率的預(yù)設(shè)閾值，由此能設(shè)定出合適的過(guò)零率的預(yù)設(shè)閾值。具體地，所述預(yù)定范圍包括第一預(yù)定范圍和第二預(yù)定范圍，所述第一預(yù)定范圍與所述第一參考閾值的最大預(yù)設(shè)值相關(guān)，所述第二預(yù)定范圍與所述第一參考閾值的最小預(yù)設(shè)值和中間預(yù)設(shè)值相關(guān)；所述基于所述第一參考閾值設(shè)定所述過(guò)零率的預(yù)設(shè)閾值包括若所述第一參考閾值處于所述第一預(yù)定范圍之內(nèi)，則將所述過(guò)零率的預(yù)設(shè)閾值設(shè)定為第一預(yù)設(shè)閾值；若所述第一參考閾值處于所述第二預(yù)定范圍之內(nèi)，則將所述過(guò)零率的預(yù)設(shè)閾值設(shè)定為第二預(yù)設(shè)閾值。需要說(shuō)明的是，對(duì)于所述第一預(yù)設(shè)閾值和第二預(yù)設(shè)閾值的設(shè)定是與噪聲信號(hào)的類型相關(guān)。如前所述，有幾類特殊的噪聲信號(hào)通過(guò)計(jì)算出的過(guò)零率可以較容易地實(shí)現(xiàn)對(duì)其的判定，但是這幾類噪聲信號(hào)中，隨著噪聲信號(hào)的類型的不同，對(duì)噪聲信號(hào)進(jìn)行判定的標(biāo)準(zhǔn)(所述過(guò)零率的預(yù)設(shè)閾值)也有差異。舉例來(lái)說(shuō)假設(shè)存在兩類特殊噪聲信號(hào)，對(duì)于第一類噪聲信號(hào)，一般計(jì)算出的過(guò)零率小于或等于19，則可將19作為此類噪聲信號(hào)的判定標(biāo)準(zhǔn)，而對(duì)于第二類噪聲信號(hào)，如果仍然以19作為判定標(biāo)準(zhǔn)，則可能存在漏檢，即很多計(jì)算出的過(guò)零率大于19且小于或等于觀的聲音信號(hào)其實(shí)都屬于噪聲信號(hào)，因此，對(duì)于第二類噪聲信號(hào)的判定標(biāo)準(zhǔn)應(yīng)該設(shè)定為觀比較合適。反之，如果將觀作為第一類噪聲信號(hào)的判定標(biāo)準(zhǔn)，則可能存在誤檢。因此，所述第一參考閾值所處的預(yù)定范圍不同，表明當(dāng)前的聲音信號(hào)中噪聲信號(hào)的類型不同，由此對(duì)應(yīng)設(shè)定的過(guò)零率的預(yù)設(shè)閾值也不同。具體實(shí)施時(shí)，所述第一預(yù)定范圍為大于所述第一參數(shù)閾值的最大預(yù)設(shè)值，即第一預(yù)定范圍為大于350，當(dāng)所述第一參考閾值處于所述第一預(yù)定范圍之內(nèi)，則將所述過(guò)零率的預(yù)設(shè)閾值設(shè)定為第一預(yù)設(shè)閾值，所述第一預(yù)設(shè)閾值具體為觀；所述第二預(yù)定范圍為所述第一參數(shù)閾值的最小預(yù)設(shè)值與所述第一參數(shù)閾值的中間預(yù)設(shè)值之間，即第二預(yù)定范圍為 240 觀0，當(dāng)所述第一參考閾值處于所述第二預(yù)定范圍之內(nèi)，則將所述過(guò)零率的預(yù)設(shè)閾值設(shè)定為第二預(yù)設(shè)閾值，所述第二預(yù)設(shè)閾值具體為19。舉例來(lái)說(shuō)，如果步驟S103判斷出所述第一參考閾值為360，該值大于350，第一參考閾值處于所述第一預(yù)定范圍之內(nèi)，則說(shuō)明該幀有可能為特殊的噪聲信號(hào)，需要對(duì)其進(jìn)行過(guò)零率的計(jì)算以確定是否為噪聲信號(hào)，此時(shí)過(guò)零率的預(yù)設(shè)閾值設(shè)定為28，如果計(jì)算出的過(guò)零率小于或等于觀，則確定該幀為噪聲信號(hào)；同樣地，如果步驟S103判斷出所述第一參考閾值為沈0，該值介于240 280之間，第一參考閾值處于所述第二預(yù)定范圍之內(nèi)，則說(shuō)明該幀也有可能為特殊的噪聲信號(hào)，需要對(duì)其進(jìn)行過(guò)零率的計(jì)算以確定是否為噪聲信號(hào)，此時(shí)過(guò)零率的預(yù)設(shè)閾值設(shè)定為19，如果計(jì)算出的過(guò)零率小于或等于19，則確定該幀為噪聲信號(hào)；而如果步驟S103判斷出所述第一參考閾值為300，則第一參考閾值處于所述預(yù)定范圍之外，此時(shí)的過(guò)零率的預(yù)設(shè)閾值一般設(shè)定為1，這意味著幾乎不太可能判定為噪聲信號(hào)，因此，在實(shí)際實(shí)施過(guò)程中，便不再進(jìn)行過(guò)零率的計(jì)算，而是直接執(zhí)行步驟S104，以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行時(shí)頻分析。通過(guò)步驟S104獲得時(shí)頻分析后的結(jié)果之后，執(zhí)行步驟S108，將時(shí)頻分析后的結(jié)果與所述參考閾值進(jìn)行比較。具體地，若時(shí)頻分析后的結(jié)果小于或等于第一參考閾值，則執(zhí)行步驟S109判定該幀為噪聲信號(hào)；若時(shí)頻分析后的結(jié)果大于所述第一參考閾值，且小于第二參考閾值，則執(zhí)行步驟S111，該幀為待定信號(hào)，基于下一幀聲音信號(hào)的判定結(jié)果對(duì)其進(jìn)行判定；若時(shí)頻分析后的結(jié)果大于或等于所述第二參考閾值，則執(zhí)行步驟S110，判定該幀為語(yǔ)音信號(hào)。其中，步驟Slll中所述基于下一幀聲音信號(hào)的判定結(jié)果對(duì)所述待定信號(hào)進(jìn)行判定包括將所述待定信號(hào)判定為與所述下一幀聲音信號(hào)的信號(hào)類型一致。具體地，若下一幀聲音信號(hào)判定為語(yǔ)音信號(hào)，則判定所述待定信號(hào)為語(yǔ)音信號(hào)；若下一幀聲音信號(hào)判定為噪聲信號(hào)，則判定所述待定信號(hào)為噪聲信號(hào)；若下一幀聲音信號(hào)判定為待定信號(hào)，則再基于這一幀判定為待定信號(hào)的下一幀聲音信號(hào)的判定結(jié)果對(duì)其進(jìn)行判定。舉例來(lái)說(shuō)，如果第1幀聲音信號(hào)判定出為噪聲信號(hào)，則直接將其丟棄，而第2幀聲音信號(hào)判定為待定信號(hào)，則將其暫時(shí)存于緩存之中，等待第3幀聲音信號(hào)的判定結(jié)果，如果第3幀聲音信號(hào)的判定為語(yǔ)音信號(hào)，則可以將第2幀聲音信號(hào)(待定信號(hào))判定為語(yǔ)音信號(hào)，當(dāng)然，如果第3幀聲音信號(hào)仍然判定為待定信號(hào)，則繼續(xù)等待第4幀聲音信號(hào)的判定結(jié)果，第4幀聲音信號(hào)仍然為待定信號(hào)，則等待第5幀聲音信號(hào)的判定結(jié)果，如此直至后續(xù)有一幀能夠判定出是噪聲信號(hào)或語(yǔ)音信號(hào)為止。所以說(shuō)，假設(shè)第1幀到第η幀都判定為待定信號(hào)，而第n+1幀判定為噪聲信號(hào)，則之前第1幀到第η幀都判定為噪聲信號(hào)，如果第n+1幀判定為語(yǔ)音信號(hào)，則之前第1幀到第η幀都判定為語(yǔ)音信號(hào)。當(dāng)然，一方面由于緩存的容量有限，不可能保存入太多的待定信號(hào)，另一方面，對(duì)語(yǔ)音信號(hào)進(jìn)行處理的即時(shí)性要求，也沒(méi)必要保存時(shí)間上已過(guò)去很久的待定信號(hào)，因此，一般考慮只將預(yù)定數(shù)量的待定信號(hào)存于緩存之中，以等待后面幾幀信號(hào)的判定結(jié)果對(duì)其進(jìn)行進(jìn)一步的判定，當(dāng)緩存中保存的待定信號(hào)的幀數(shù)超過(guò)預(yù)定數(shù)量時(shí)，則將最先存入的那幀待定信號(hào)丟棄，即對(duì)于待定信號(hào)的保存遵守先進(jìn)先出的原則。舉例說(shuō)明，如果所述預(yù)定數(shù)量為8，假設(shè)第1幀至第8幀聲音信號(hào)均判定為待定信號(hào)，那么這8幀聲音信號(hào)都保存在緩存中，如果第9幀判定為語(yǔ)音信號(hào)，則第1幀至第8幀聲音信號(hào)都為語(yǔ)音信號(hào)，并且第1幀聲音信號(hào)可作為這一段語(yǔ)音的開(kāi)始，而如果第9幀判定為待定信號(hào)，則第1幀聲音信號(hào)(已被判定為待定信號(hào))會(huì)被丟棄；同理，如果某一幀語(yǔ)音信號(hào)之后的10幀聲音信號(hào)均判定為待定信號(hào)，該幀語(yǔ)音信號(hào)之后的第1幀和第2幀聲音信號(hào)會(huì)被丟棄，而如果第11幀聲音信號(hào)為噪聲信號(hào)，則保存的這8幀待定信號(hào)判定為噪聲信號(hào)(實(shí)際實(shí)施時(shí)，為了保證語(yǔ)音的自然度及過(guò)渡的平滑性，這8幀待定信號(hào)不會(huì)被丟棄，會(huì)經(jīng)語(yǔ)音處理后輸出)，該幀語(yǔ)音信號(hào)可作為這一段語(yǔ)音的結(jié)束。本實(shí)施例中，所述語(yǔ)音激活檢測(cè)方法還包括保存與判定出的語(yǔ)音信號(hào)連續(xù)的前 P幀待定信號(hào)以及保存與判定出的語(yǔ)音信號(hào)連續(xù)的后Q幀待定信號(hào)。在對(duì)判定出的語(yǔ)音信號(hào)進(jìn)行語(yǔ)音處理并輸出時(shí)，也會(huì)將所述前P幀待定信號(hào)和后Q幀待定信號(hào)也處理后輸出，如此，便可以保證語(yǔ)音的自然度及過(guò)渡的平滑性。需要說(shuō)明的是，這里的P和Q是指預(yù)先設(shè)定的在緩存中所保存待定信號(hào)數(shù)量的最大值，在實(shí)際實(shí)施時(shí)，也會(huì)出現(xiàn)緩存中保存的待定信號(hào)的數(shù)量小于P或Q的情況，例如如果P = 8，Q = 5，假設(shè)第1幀至第3幀判定為待定信號(hào)，而后續(xù)的幾幀聲音信號(hào)都為語(yǔ)音信號(hào)，則緩存中實(shí)際保存的待定信號(hào)的數(shù)量只有3幀；同理，如果某一幀語(yǔ)音信號(hào)之后的4幀聲音信號(hào)均判定為待定信號(hào)，該幀語(yǔ)音信號(hào)之后的第5幀為噪聲信號(hào)或語(yǔ)音信號(hào)，則緩存中實(shí)際保存的待定信號(hào)的數(shù)量只有3幀。本實(shí)施例中，取P = Q = 3，當(dāng)然，P、Q的取值可以根據(jù)實(shí)際需求做出適當(dāng)?shù)恼{(diào)整。特別地，可以將上述基于自適應(yīng)背景噪聲的語(yǔ)音激活檢測(cè)方法應(yīng)用于語(yǔ)音會(huì)議服務(wù)器上進(jìn)行回聲消除和噪聲去除，在語(yǔ)音會(huì)議中，每路輸入的聲音信號(hào)通過(guò)該方法的處理后，可以有效的去除終端帶入的回聲和噪音?；谏鲜稣Z(yǔ)音激活檢測(cè)方法，本實(shí)施例還提供一種語(yǔ)音激活檢測(cè)裝置。圖2是本發(fā)明實(shí)施例一提供的語(yǔ)音激活檢測(cè)裝置的結(jié)構(gòu)示意圖，如圖2所示，本實(shí)施例提供的語(yǔ)音激活檢測(cè)裝置包括分幀單元101，適于對(duì)輸入的聲音信號(hào)進(jìn)行分幀；第一設(shè)定單元102，適于設(shè)定噪聲信號(hào)的參考閾值，所述參考閾值包括第一參考閾值和第二參考閾值，所述第二參考閾值與第一參考閾值具有倍數(shù)關(guān)系；第一判定單元103，與所述第一設(shè)定單元102相連，適于判斷所述第一設(shè)定單元102設(shè)定的所述第一參考閾值是否處于預(yù)定范圍之內(nèi)；過(guò)零率計(jì)算單元104，與所述分幀單元101、第一判定單元103相連，適于當(dāng)所述第一判定單元 103判斷出所述第一參考閾值處于預(yù)定范圍之內(nèi)，以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行過(guò)零率計(jì)算；第二判定單元105，與所述過(guò)零率計(jì)算單元104相連，適于判斷計(jì)算出的過(guò)零率是否大于預(yù)設(shè)閾值，否則判定該幀為噪聲信號(hào)；時(shí)頻分析單元106，與所述分幀單元101、第一判定單元103、第二判定單元105相連，適于當(dāng)所述第一判定單元103判斷出所述第一參考閾值處于預(yù)定范圍之外或所述第二判定單元105判斷出計(jì)算出的過(guò)零率大于所述預(yù)設(shè)閾值時(shí)，以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行時(shí)頻分析；第三判定單元107，與所述時(shí)頻分析單元106相連，適于當(dāng)時(shí)頻分析后的結(jié)果小于或等于第一參考閾值，則判定該幀為噪聲信號(hào)；當(dāng)時(shí)頻分析后的結(jié)果大于第一參考閾值，且小于所述第二參考閾值，則該幀為待定信號(hào)，基于下一幀聲音信號(hào)的判定結(jié)果對(duì)其進(jìn)行判定；當(dāng)時(shí)頻分析后的結(jié)果大于或等于所述第二參考閾值，則判定該幀為語(yǔ)音信號(hào)。所述第三判定單元107基于下一幀聲音信號(hào)的判定結(jié)果對(duì)所述待定信號(hào)進(jìn)行判定具體為將所述待定信號(hào)判定為與所述下一幀聲音信號(hào)的信號(hào)類型一致。本實(shí)施例中，所述語(yǔ)音激活檢測(cè)裝置還包括第二設(shè)定單元109，所述第二設(shè)定單元 109與第一設(shè)定單元102、第二判定單元105連接，適于基于所述第一參考閾值設(shè)定所述過(guò)零率的預(yù)設(shè)閾值。具體地，所述預(yù)定范圍包括第一預(yù)定范圍和第二預(yù)定范圍，所述第一預(yù)定范圍與所述第一參考閾值的最大預(yù)設(shè)值相關(guān)，所述第二預(yù)定范圍與所述第一參考閾值的最小預(yù)設(shè)值和中間預(yù)設(shè)值相關(guān)；所述第二設(shè)定單元109基于所述第一參考閾值設(shè)定所述過(guò)零率的預(yù)設(shè)閾值具體為若所述第一參考閾值處于所述第一預(yù)定范圍之內(nèi)，則將所述過(guò)零率的預(yù)設(shè)閾值設(shè)定為第一預(yù)設(shè)閾值；若所述第一參考閾值處于所述第二預(yù)定范圍之內(nèi)，則將所述過(guò)零率的預(yù)設(shè)閾值設(shè)定為第二預(yù)設(shè)閾值。所述語(yǔ)音激活檢測(cè)裝置還包括噪聲預(yù)測(cè)單元108，所述噪聲預(yù)測(cè)單元108與分幀單元101、第一設(shè)定單元102連接，適于提取所述輸入的聲音信號(hào)中前N幀聲音信號(hào)并進(jìn)行分析，得到所述第一設(shè)定單元102設(shè)定的所述參考閾值(包括第一參考閾值和第二參考閾值)。此外，所述語(yǔ)音激活檢測(cè)裝置還包括存儲(chǔ)單元110，所述存儲(chǔ)單元110與第三判定單元107連接，適于保存與判定出的語(yǔ)音信號(hào)連續(xù)的前P幀待定信號(hào)以及保存與判定出的語(yǔ)音信號(hào)連續(xù)的后Q幀待定信號(hào)。關(guān)于所述語(yǔ)音激活檢測(cè)裝置的具體實(shí)施可參考本實(shí)施例提供的語(yǔ)音激活檢測(cè)方法，在此不再贅述。實(shí)施例二圖3是本發(fā)明實(shí)施例二提供的語(yǔ)音激活檢測(cè)方法的流程示意圖。如圖3所示，與實(shí)施例一有所區(qū)別的是，本實(shí)施例中，當(dāng)步驟S107或步驟S109中判定該幀為噪聲信號(hào)之后，還包括執(zhí)行步驟S112，基于該幀噪聲信號(hào)更新所述參考閾值。具體地，所述基于該幀噪聲信號(hào)更新所述參考閾值包括將所述第一參考閾值的最大預(yù)設(shè)值與所述時(shí)頻分析后的結(jié)果分別乘以預(yù)設(shè)加權(quán)系數(shù)后相加得到的值更新所述參考閾值。因?yàn)榫鸵粠呀?jīng)判定出是噪聲信號(hào)的聲音信號(hào)而言，對(duì)其進(jìn)行時(shí)頻分析后的結(jié)果能夠表明當(dāng)前環(huán)境下背景噪聲的特性，那么可以基于這幀噪聲信號(hào)的時(shí)頻分析后的結(jié)果，乘以一定的加權(quán)系數(shù)a，再將所述第一參考閾值的最大預(yù)設(shè)值乘以對(duì)應(yīng)的加權(quán)系數(shù)b，其中，a+b = 1，之后以兩者相加得到的值作為新的第一參考閾值，再基于所述第一參考閾值與第二參考閾值之間具有的倍數(shù)關(guān)系和更新后的第一參考閾值得出新的第二參考閾值。舉例來(lái)說(shuō)，假設(shè)當(dāng)前設(shè)定的所述第一參考閾值為沈0，對(duì)一幀聲音信號(hào)進(jìn)行時(shí)頻分析之后，得到的時(shí)頻分析的結(jié)果為250，則通過(guò)執(zhí)行步驟S108后，判斷出時(shí)頻分析的結(jié)果小于第一參考閾值，則執(zhí)行步驟S109，然后，執(zhí)行步驟Sl 12，基于該幀噪聲信號(hào)更新所述參考閾值，如實(shí)施例一中所述，所述第一參考閾值的最大預(yù)設(shè)值為350，假設(shè)對(duì)時(shí)頻分析的結(jié)果的加權(quán)系數(shù)為0. 6，則對(duì)所述第一參考閾值的最大預(yù)設(shè)值的加權(quán)系數(shù)為0. 4，則最后得到的值應(yīng)該為250*0. 6+350*0. 4 = 150+140 = 2900于是，將290作為更新后的第一參考閾值，由于本實(shí)施例中第二參考閾值為第一參考閾值的 1.3倍，那么更新后的第二參考閾值為377。當(dāng)然，上面只是對(duì)基于該幀噪聲信號(hào)更新所述參考閾值的一種方式，在其他實(shí)施例中，也可以在判定出時(shí)頻分析的結(jié)果小于第一參考閾值，以時(shí)頻分析的結(jié)果替換所述第一參考閾值?；谝炎R(shí)別出的噪聲信號(hào)，及時(shí)地對(duì)第一參考閾值和第二參考閾值進(jìn)行更新，從而能實(shí)現(xiàn)對(duì)當(dāng)前環(huán)境中背景噪聲變化的自適應(yīng)，使對(duì)噪聲信號(hào)與語(yǔ)音信號(hào)的識(shí)別更為準(zhǔn)確、有效。本實(shí)施例的其他步驟可參考實(shí)施例一的具體實(shí)施，在此不再贅述?；谏鲜稣Z(yǔ)音激活檢測(cè)方法，本實(shí)施例還提供一種語(yǔ)音激活檢測(cè)裝置。圖4是本發(fā)明實(shí)施例二提供的語(yǔ)音激活檢測(cè)裝置的結(jié)構(gòu)示意圖，如圖4所示，本實(shí)施例提供的語(yǔ)音激活檢測(cè)裝置不僅包括實(shí)施例一中所述語(yǔ)音激活檢測(cè)裝置的各單元，有所區(qū)別的是，還包括更新單元111，所述更新單元111與第二判定單元105、第三判定單元107、第一設(shè)定單元102連接，適于當(dāng)所述第二判定單元105或第三判定單元107判定該幀為噪聲信號(hào)之后，基于該幀噪聲信號(hào)更新所述參考閾值。所述更新單元111基于該幀噪聲信號(hào)更新所述參考閾值具體為將所述第一參考閾值的最大預(yù)設(shè)值與所述時(shí)頻分析后的結(jié)果分別乘以預(yù)設(shè)加權(quán)系數(shù)后相加得到的值更新所述第一參考閾值，并基于所述第二參考閾值和第一參考閾值的倍數(shù)關(guān)系和更新后的第一參考閾值更新所述第二參考閾值。本實(shí)施例所述語(yǔ)音激活檢測(cè)裝置的具體實(shí)施，可參考本實(shí)施例所述語(yǔ)音激活檢測(cè)方法，在此不再贅述。實(shí)施例三圖5是本發(fā)明實(shí)施例三提供的語(yǔ)音激活檢測(cè)方法的流程示意圖。如圖5所示，與實(shí)施例二、實(shí)施例三中所述語(yǔ)音激活檢測(cè)方法有所不同的是，本實(shí)施例可以通過(guò)較為簡(jiǎn)單的實(shí)施方式實(shí)現(xiàn)本發(fā)明提供的語(yǔ)音激活檢測(cè)方法。結(jié)合圖1或圖3，具體地，本實(shí)施例提供的語(yǔ)音激活檢測(cè)方法不需要進(jìn)行判斷所述第一參考閾值是否處于預(yù)定范圍之內(nèi)的步驟 (步驟S10;3)，由此也就不需要進(jìn)行過(guò)零率的計(jì)算及其后續(xù)相關(guān)判定步驟(步驟S105、步驟 S106、步驟S107)，此外，也不需要在進(jìn)行時(shí)頻分析之前對(duì)噪聲信號(hào)的第一參考閾值和第二參考閾值進(jìn)行設(shè)定的步驟，時(shí)頻分析后的結(jié)果可以直接與一預(yù)先存儲(chǔ)的默認(rèn)的第一參考閾值和第二參考閾值進(jìn)行比較。本實(shí)施例提供的語(yǔ)音激活檢測(cè)方法包括步驟S201，對(duì)輸入的聲音信號(hào)進(jìn)行分幀；步驟S202，以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行時(shí)頻分析；步驟S203，將時(shí)頻分析后的結(jié)果與第一參考閾值和第二參考閾值進(jìn)行比較，若時(shí)頻分析后的結(jié)果小于或等于第一參考閾值，則執(zhí)行步驟S204，判定該幀為噪聲信號(hào)；若時(shí)頻分析后的結(jié)果大于所述第一參考閾值，且小于第二參考閾值，則執(zhí)行步驟S205，該幀為待定信號(hào)，基于下一幀聲音信號(hào)的判定結(jié)果對(duì)其進(jìn)行判定；若時(shí)頻分析后的結(jié)果大于或等于所述第二參考閾值，則執(zhí)行步驟S206，判定該幀為語(yǔ)音信號(hào)。本實(shí)施例中，每一幀聲音信號(hào)的長(zhǎng)度為8ms。所述第一參考閾值和第二參考閾值是通過(guò)提取所述輸入的聲音信號(hào)中前N幀聲音信號(hào)并進(jìn)行分析得到的。所述第二參考閾值為第一參考閾值的1. 3倍。所述基于下一幀聲音信號(hào)的判定結(jié)果對(duì)所述待定信號(hào)進(jìn)行判定包括將所述待定信號(hào)判定為與所述下一幀聲音信號(hào)的信號(hào)類型一致。所述時(shí)頻分析包括對(duì)該幀聲音信號(hào)分別在時(shí)域以及頻域上求方差，獲得反映其在時(shí)域以及頻域上的綜合變化率的值。此外，所述語(yǔ)音激活檢測(cè)方法還包括保存與判定出的語(yǔ)音信號(hào)連續(xù)的前P幀待定信號(hào)以及保存與判定出的語(yǔ)音信號(hào)連續(xù)的后Q幀待定信號(hào)。在其他實(shí)施例中，當(dāng)判定該幀為噪聲信號(hào)之后，語(yǔ)音激活檢測(cè)方法還可以包括基于該幀噪聲信號(hào)更新所述第一參考閾值和第二參考閾值的步驟。具體包括將所述第一參考閾值的最大預(yù)設(shè)值與所述時(shí)頻分析后的結(jié)果分別乘以預(yù)設(shè)加權(quán)系數(shù)后相加得到的值更新所述第一參考閾值和第二參考閾值。對(duì)于基于該幀噪聲信號(hào)更新所述第一參考閾值和第二參考閾值的步驟可參考實(shí)施例二中所述語(yǔ)音激活檢測(cè)方法的相關(guān)描述，在此不再贅述?；谏鲜稣Z(yǔ)音激活檢測(cè)方法，本實(shí)施例還提供一種語(yǔ)音激活檢測(cè)裝置。圖6是本發(fā)明實(shí)施例三提供的語(yǔ)音激活檢測(cè)裝置的結(jié)構(gòu)示意圖，如圖6所示，本實(shí)施例提供的語(yǔ)音激活檢測(cè)裝置包括分幀單元201，適于對(duì)輸入的聲音信號(hào)進(jìn)行分幀；時(shí)頻分析單元202，與所述分幀單元201相連，適于以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行時(shí)頻分析；所述時(shí)頻分析單元202進(jìn)行的時(shí)頻分析包括對(duì)該幀聲音信號(hào)分別在時(shí)域以及頻域上求方差，獲得反映其在時(shí)域以及頻域上的綜合變化率的值；判定單元203，與所述時(shí)頻分析單元202相連，適于當(dāng)時(shí)頻分析后的結(jié)果小于或等于第一參考閾值，則判定該幀為噪聲信號(hào)；若時(shí)頻分析后的結(jié)果大于所述第一參考閾值，且小于第二參考閾值，則該幀為待定信號(hào)，基于下一幀聲音信號(hào)的判定結(jié)果對(duì)其進(jìn)行判定；若時(shí)頻分析后的結(jié)果大于或等于所述第二參考閾值，則判定該幀為語(yǔ)音信號(hào)。所述判定單元203基于下一幀聲音信號(hào)的判定結(jié)果對(duì)所述待定信號(hào)進(jìn)行判定具體為將所述待定信號(hào)判定為與所述下一幀聲音信號(hào)的信號(hào)類型一致。本實(shí)施例中，所述語(yǔ)音激活檢測(cè)裝置還包括噪聲預(yù)測(cè)單元204，所述噪聲預(yù)測(cè)單元 204與分幀單元201、判定單元203連接，適于提取所述輸入的聲音信號(hào)中前N幀聲音信號(hào)并進(jìn)行分析，得到所述第一參考閾值和第二參考閾值。此外，所述語(yǔ)音激活檢測(cè)裝置還包括存儲(chǔ)單元205，所述存儲(chǔ)單元205與判定單元 203連接，適于保存與判定出的語(yǔ)音信號(hào)連續(xù)的前P幀待定信號(hào)以及保存與判定出的語(yǔ)音信號(hào)連續(xù)的后Q幀待定信號(hào)。在其他實(shí)施例中，語(yǔ)音激活檢測(cè)裝置還可以包括更新單元，適于當(dāng)判定單元203 判定該幀為噪聲信號(hào)之后，基于該幀噪聲信號(hào)更新所述第一參考閾值和第二參考閾值。所述更新單元基于該幀噪聲信號(hào)更新所述第一參考閾值和第二參考閾值具體為將所述第一參考閾值的最大預(yù)設(shè)值與所述時(shí)頻分析后的結(jié)果分別乘以預(yù)設(shè)加權(quán)系數(shù)后相加得到的值更新所述第一參考閾值和第二參考閾值。本實(shí)施例所述語(yǔ)音激活檢測(cè)裝置的具體實(shí)施，可參考本實(shí)施例以及實(shí)施例一中所述語(yǔ)音激活檢測(cè)方法的相關(guān)步驟，在此不再贅述。綜上，本發(fā)明實(shí)施方式提供的語(yǔ)音激活檢測(cè)方法與裝置，至少具有如下有益效果通過(guò)對(duì)輸入的聲音信號(hào)進(jìn)行分幀(每幀聲音信號(hào)平滑過(guò)渡)，再以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行時(shí)頻分析，將時(shí)頻分析的結(jié)果與預(yù)先設(shè)定好的噪聲信號(hào)的第一參考閾值和第二參考閾值進(jìn)行比較，從而能夠快捷、有效地識(shí)別出某一幀聲音信號(hào)是語(yǔ)音信號(hào)還是噪聲信號(hào)，以實(shí)現(xiàn)確保通話質(zhì)量的同時(shí)達(dá)到減少背景噪聲的目的。進(jìn)一步地，對(duì)某幾類特殊的噪聲信號(hào)，通過(guò)判斷設(shè)定的第一參考閾值是否處于預(yù)設(shè)范圍之內(nèi)，是則根據(jù)所述第一參考閾值處于不同的預(yù)設(shè)范圍(不同的噪聲信號(hào)類型)對(duì)應(yīng)設(shè)定不同的過(guò)零率的預(yù)設(shè)閾值，通過(guò)以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行過(guò)零率計(jì)算，對(duì)于計(jì)算的過(guò)零率小于所述預(yù)設(shè)閾值則判定為噪聲信號(hào)，否則以時(shí)頻分析進(jìn)行進(jìn)一步檢驗(yàn)，由此實(shí)現(xiàn)了對(duì)不同噪聲信號(hào)有針對(duì)性的檢驗(yàn)，從而能在很大程度上避免產(chǎn)生誤檢和漏檢的情況，對(duì)噪聲信號(hào)與語(yǔ)音信號(hào)的識(shí)別更為有效?；谝炎R(shí)別出的噪聲信號(hào)，及時(shí)地對(duì)第一參考閾值和第二參考閾值進(jìn)行不斷的更新，從而能實(shí)現(xiàn)對(duì)當(dāng)前環(huán)境中背景噪聲變化的自適應(yīng)，使對(duì)噪聲信號(hào)與語(yǔ)音信號(hào)的識(shí)別更為準(zhǔn)確、有效。另外，通過(guò)提取輸入的聲音信號(hào)中前N幀聲音信號(hào)并進(jìn)行分析得到所述第一參考閾值和第二參考閾值的方式，能在語(yǔ)音通話建立之初就根據(jù)所處的不同環(huán)境設(shè)定出適應(yīng)當(dāng)前環(huán)境的噪聲信號(hào)的參考閾值，較好地實(shí)現(xiàn)了對(duì)當(dāng)前環(huán)境的背景噪聲的預(yù)測(cè)，使對(duì)噪聲信號(hào)的識(shí)別更為準(zhǔn)確。本發(fā)明雖然已以較佳實(shí)施例公開(kāi)如上，但其并不是用來(lái)限定本發(fā)明，任何本領(lǐng)域技術(shù)人員在不脫離本發(fā)明的精神和范圍內(nèi)，都可以利用上述揭示的方法和技術(shù)內(nèi)容對(duì)本發(fā)明技術(shù)方案做出可能的變動(dòng)和修改，因此，凡是未脫離本發(fā)明技術(shù)方案的內(nèi)容，依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所作的任何簡(jiǎn)單修改、等同變化及修飾，均屬于本發(fā)明技術(shù)方案的保護(hù)范圍。
權(quán)利要求
1.一種語(yǔ)音激活檢測(cè)方法，其特征在于，包括對(duì)輸入的聲音信號(hào)進(jìn)行分幀；以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行時(shí)頻分析；若時(shí)頻分析后的結(jié)果小于或等于第一參考閾值，則判定該幀為噪聲信號(hào)；若時(shí)頻分析后的結(jié)果大于所述第一參考閾值，且小于第二參考閾值，則該幀為待定信號(hào)，基于下一幀聲音信號(hào)的判定結(jié)果對(duì)其進(jìn)行判定；若時(shí)頻分析后的結(jié)果大于或等于所述第二參考閾值，則判定該幀為語(yǔ)音信號(hào)；所述第二參考閾值與第一參考閾值具有倍數(shù)關(guān)系。
2.根據(jù)權(quán)利要求1所述的語(yǔ)音激活檢測(cè)方法，其特征在于，所述第一參考閾值和第二參考閾值是通過(guò)提取所述輸入的聲音信號(hào)中前N幀聲音信號(hào)并進(jìn)行分析得到的。
3.根據(jù)權(quán)利要求1所述的語(yǔ)音激活檢測(cè)方法，其特征在于，基于下一幀聲音信號(hào)的判定結(jié)果對(duì)所述待定信號(hào)進(jìn)行判定包括將所述待定信號(hào)判定為與所述下一幀聲音信號(hào)的信號(hào)類型一致。
4.根據(jù)權(quán)利要求1所述的語(yǔ)音激活檢測(cè)方法，其特征在于，當(dāng)判定該幀為噪聲信號(hào)之后，還包括基于該幀噪聲信號(hào)更新所述第一參考閾值和第二參考閾值。
5.根據(jù)權(quán)利要求4所述的語(yǔ)音激活檢測(cè)方法，其特征在于，所述第一參考閾值大于或等于最小預(yù)設(shè)值，且小于或等于最大預(yù)設(shè)值；所述基于該幀噪聲信號(hào)更新所述第一參考閾值和第二參考閾值包括將所述最大預(yù)設(shè)值與所述時(shí)頻分析后的結(jié)果分別乘以預(yù)設(shè)加權(quán)系數(shù)后相加得到的值更新所述第一參考閾值；基于所述第二參考閾值和第一參考閾值的倍數(shù)關(guān)系和更新后的第一參考閾值更新所述第二參考閾值。
6.根據(jù)權(quán)利要求1所述的語(yǔ)音激活檢測(cè)方法，其特征在于，還包括保存與判定出的語(yǔ)音信號(hào)連續(xù)的前P幀待定信號(hào)以及保存與判定出的語(yǔ)音信號(hào)連續(xù)的后Q幀待定信號(hào)。
7.根據(jù)權(quán)利要求1所述的語(yǔ)音激活檢測(cè)方法，其特征在于，所述第二參考閾值為第一參考閾值的1.3倍。
8.根據(jù)權(quán)利要求1所述的語(yǔ)音激活檢測(cè)方法，其特征在于，每一幀聲音信號(hào)的長(zhǎng)度為8ms ο
9.根據(jù)權(quán)利要求1所述的語(yǔ)音激活檢測(cè)方法，其特征在于，所述時(shí)頻分析包括對(duì)該幀聲音信號(hào)分別在時(shí)域以及頻域上求方差，獲得反映其在時(shí)域以及頻域上的綜合變化率的值。
10.一種語(yǔ)音激活檢測(cè)方法，其特征在于，包括對(duì)輸入的聲音信號(hào)進(jìn)行分幀；設(shè)定噪聲信號(hào)的第一參考閾值和第二參考閾值，所述第二參考閾值與第一參考閾值具有倍數(shù)關(guān)系；判斷所述第一參考閾值是否處于預(yù)定范圍之內(nèi)，否則以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行時(shí)頻分析；是則以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行過(guò)零率計(jì)算，若計(jì)算出的過(guò)零率大于預(yù)設(shè)閾值，則進(jìn)行所述時(shí)頻分析，否則判定該幀為噪聲信號(hào)；若時(shí)頻分析后的結(jié)果小于或等于第一參考閾值，則判定該幀為噪聲信號(hào)；若時(shí)頻分析后的結(jié)果大于所述第一參考閾值，且小于第二參考閾值，則該幀為待定信號(hào)，基于下一幀聲音信號(hào)的判定結(jié)果對(duì)其進(jìn)行判定；若時(shí)頻分析后的結(jié)果大于或等于所述第二參考閾值，則判定該幀為語(yǔ)音信號(hào)。
11.根據(jù)權(quán)利要求10所述的語(yǔ)音激活檢測(cè)方法，其特征在于，還包括基于所述第一參考閾值設(shè)定所述過(guò)零率的預(yù)設(shè)閾值。
12.根據(jù)權(quán)利要求11所述的語(yǔ)音激活檢測(cè)方法，其特征在于，所述第一參考閾值大于或等于最小預(yù)設(shè)值，且小于或等于最大預(yù)設(shè)值；所述預(yù)定范圍包括第一預(yù)定范圍和第二預(yù)定范圍，所述第一預(yù)定范圍與所述最大預(yù)設(shè)值相關(guān)，所述第二預(yù)定范圍與所述最小預(yù)設(shè)值和中間預(yù)設(shè)值相關(guān)，所述中間預(yù)設(shè)值大于最小預(yù)設(shè)值，且小于最大預(yù)設(shè)值；所述基于所述第一參考閾值設(shè)定所述過(guò)零率的預(yù)設(shè)閾值包括若所述第一參考閾值處于所述第一預(yù)定范圍之內(nèi)，則將所述過(guò)零率的預(yù)設(shè)閾值設(shè)定為第一預(yù)設(shè)閾值；若所述第一參考閾值處于所述第二預(yù)定范圍之內(nèi)，則將所述過(guò)零率的預(yù)設(shè)閾值設(shè)定為第二預(yù)設(shè)閾值。
13.根據(jù)權(quán)利要求10所述的語(yǔ)音激活檢測(cè)方法，其特征在于，所述第一參考閾值和第二參考閾值是通過(guò)提取所述輸入的聲音信號(hào)中前N幀聲音信號(hào)并進(jìn)行分析得到的。
14.根據(jù)權(quán)利要求10所述的語(yǔ)音激活檢測(cè)方法，其特征在于，基于下一幀聲音信號(hào)的判定結(jié)果對(duì)所述待定信號(hào)進(jìn)行判定包括將所述待定信號(hào)判定為與所述下一幀聲音信號(hào)的信號(hào)類型一致。
15.根據(jù)權(quán)利要求10所述的語(yǔ)音激活檢測(cè)方法，其特征在于，當(dāng)判定該幀為噪聲信號(hào)之后，還包括基于該幀噪聲信號(hào)更新所述第一參考閾值和第二參考閾值。
16.根據(jù)權(quán)利要求15所述的語(yǔ)音激活檢測(cè)方法，其特征在于，所述第一參考閾值大于或等于最小預(yù)設(shè)值，且小于或等于最大預(yù)設(shè)值；所述基于該幀噪聲信號(hào)更新所述第一參考閾值和第二參考閾值包括將所述最大預(yù)設(shè)值與所述時(shí)頻分析后的結(jié)果分別乘以預(yù)設(shè)加權(quán)系數(shù)后相加得到的值更新所述第一參考閾值；基于所述第二參考閾值和第一參考閾值的倍數(shù)關(guān)系和更新后的第一參考閾值更新所述第二參考閾值。
17.根據(jù)權(quán)利要求10所述的語(yǔ)音激活檢測(cè)方法，其特征在于，還包括保存與判定出的語(yǔ)音信號(hào)連續(xù)的前P幀待定信號(hào)以及保存與判定出的語(yǔ)音信號(hào)連續(xù)的后Q幀待定信號(hào)。
18.根據(jù)權(quán)利要求10所述的語(yǔ)音激活檢測(cè)方法，其特征在于，所述第二參考閾值為第一參考閾值的1.3倍。
19.根據(jù)權(quán)利要求10所述的語(yǔ)音激活檢測(cè)方法，其特征在于，每一幀聲音信號(hào)的長(zhǎng)度為 8ms。
20.根據(jù)權(quán)利要求10所述的語(yǔ)音激活檢測(cè)方法，其特征在于，所述時(shí)頻分析包括對(duì)該幀輸入的聲音信號(hào)分別在時(shí)域以及頻域上求方差，獲得反映其在時(shí)域以及頻域上的綜合變化率的值。
21.一種語(yǔ)音激活檢測(cè)裝置，其特征在于，包括分幀單元，適于對(duì)輸入的聲音信號(hào)進(jìn)行分幀；時(shí)頻分析單元，適于以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行時(shí)頻分析；判定單元，適于當(dāng)時(shí)頻分析后的結(jié)果小于或等于第一參考閾值，則判定該幀為噪聲信號(hào)；若時(shí)頻分析后的結(jié)果大于所述第一參考閾值，且小于第二參考閾值，則該幀為待定信號(hào)，基于下一幀聲音信號(hào)的判定結(jié)果對(duì)其進(jìn)行判定；若時(shí)頻分析后的結(jié)果大于或等于所述第二參考閾值，則判定該幀為語(yǔ)音信號(hào)；所述第二參考閾值與第一參考閾值具有倍數(shù)關(guān)系。
22.根據(jù)權(quán)利要求21所述的語(yǔ)音激活檢測(cè)裝置，其特征在于，還包括噪聲預(yù)測(cè)單元，適于提取所述輸入的聲音信號(hào)中前N幀聲音信號(hào)并進(jìn)行分析，得到所述第一參考閾值和第二參考閾值。
23.根據(jù)權(quán)利要求21所述的語(yǔ)音激活檢測(cè)裝置，其特征在于，所述判定單元將所述待定信號(hào)判定為與所述下一幀聲音信號(hào)的信號(hào)類型一致。
24.根據(jù)權(quán)利要求21所述的語(yǔ)音激活檢測(cè)裝置，其特征在于，還包括更新單元，適于當(dāng)所述判定單元判定該幀為噪聲信號(hào)之后，基于該幀噪聲信號(hào)更新所述第一參考閾值和第二參考閾值。
25.根據(jù)權(quán)利要求M所述的語(yǔ)音激活檢測(cè)裝置，其特征在于，所述第一參考閾值大于或等于最小預(yù)設(shè)值，且小于或等于最大預(yù)設(shè)值；所述更新單元將所述最大預(yù)設(shè)值與所述時(shí)頻分析后的結(jié)果分別乘以預(yù)設(shè)加權(quán)系數(shù)后相加得到的值更新所述第一參考閾值，并基于所述第二參考閾值和第一參考閾值的倍數(shù)關(guān)系和更新后的第一參考閾值更新所述第二參考閾值。
26.根據(jù)權(quán)利要求21所述的語(yǔ)音激活檢測(cè)裝置，其特征在于，還包括存儲(chǔ)單元，適于保存與判定出的語(yǔ)音信號(hào)連續(xù)的前P幀待定信號(hào)以及保存與判定出的語(yǔ)音信號(hào)連續(xù)的后Q幀待定信號(hào)。
27.根據(jù)權(quán)利要求21所述的語(yǔ)音激活檢測(cè)裝置，其特征在于，所述第二參考閾值為第一參考閾值的1.3倍。
28.根據(jù)權(quán)利要求21所述的語(yǔ)音激活檢測(cè)裝置，其特征在于，每一幀聲音信號(hào)的長(zhǎng)度為 8ms。
29.根據(jù)權(quán)利要求21所述的語(yǔ)音激活檢測(cè)裝置，其特征在于，所述時(shí)頻分析對(duì)該幀聲音信號(hào)分別在時(shí)域以及頻域上求方差，獲得反映其在時(shí)域以及頻域上的綜合變化率的值。
30.一種語(yǔ)音激活檢測(cè)裝置，其特征在于，包括分幀單元，適于對(duì)輸入的聲音信號(hào)進(jìn)行分幀；第一設(shè)定單元，適于設(shè)定噪聲信號(hào)的第一參考閾值和第二參考閾值，所述第二參考閾值與第一參考閾值具有倍數(shù)關(guān)系；第一判定單元，適于判斷所述第一參考閾值是否處于預(yù)定范圍之內(nèi)；過(guò)零率計(jì)算單元，適于當(dāng)判斷出所述第一參考閾值處于預(yù)定范圍之內(nèi)，以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行過(guò)零率計(jì)算；第二判定單元，適于判斷計(jì)算出的過(guò)零率是否大于預(yù)設(shè)閾值，否則判定該幀為噪聲信號(hào)；時(shí)頻分析單元，適于當(dāng)判斷出所述第一參考閾值處于預(yù)定范圍之外或判斷出計(jì)算出的過(guò)零率大于所述預(yù)設(shè)閾值時(shí)，以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行時(shí)頻分析；第三判定單元，適于當(dāng)時(shí)頻分析后的結(jié)果小于或等于第一參考閾值，則判定該幀為噪聲信號(hào)；當(dāng)時(shí)頻分析后的結(jié)果大于第一參考閾值，且小于所述第二參考閾值，則該幀為待定信號(hào)，基于下一幀聲音信號(hào)的判定結(jié)果對(duì)其進(jìn)行判定；當(dāng)時(shí)頻分析后的結(jié)果大于或等于所述第二參考閾值，則判定該幀為語(yǔ)音信號(hào)。
31.根據(jù)權(quán)利要求30所述的語(yǔ)音激活檢測(cè)裝置，其特征在于，還包括第二設(shè)定單元，適于基于所述第一參考閾值設(shè)定所述過(guò)零率的預(yù)設(shè)閾值。
32.根據(jù)權(quán)利要求31所述的語(yǔ)音激活檢測(cè)裝置，其特征在于，所述第一參考閾值大于或等于最小預(yù)設(shè)值，且小于或等于最大預(yù)設(shè)值；所述預(yù)定范圍包括第一預(yù)定范圍和第二預(yù)定范圍，所述第一預(yù)定范圍與所述最大預(yù)設(shè)值相關(guān)，所述第二預(yù)定范圍與所述最小預(yù)設(shè)值和中間預(yù)設(shè)值相關(guān)，所述中間預(yù)設(shè)值大于最小預(yù)設(shè)值，且小于最大預(yù)設(shè)值；若所述第一參考閾值處于所述第一預(yù)定范圍之內(nèi)，則所述第二設(shè)定單元將所述過(guò)零率的預(yù)設(shè)閾值設(shè)定為第一預(yù)設(shè)閾值；若所述第一參考閾值處于所述第二預(yù)定范圍之內(nèi)，則所述第二設(shè)定單元將所述過(guò)零率的預(yù)設(shè)閾值設(shè)定為第二預(yù)設(shè)閾值。
33.根據(jù)權(quán)利要求30所述的語(yǔ)音激活檢測(cè)裝置，其特征在于，還包括噪聲預(yù)測(cè)單元，適于提取所述輸入的聲音信號(hào)中前N幀聲音信號(hào)并進(jìn)行分析，得到所述第一設(shè)定單元設(shè)定的所述第一參考閾值和第二參考閾值。
34.根據(jù)權(quán)利要求30所述的語(yǔ)音激活檢測(cè)裝置，其特征在于，所述第三判定單元將所述待定信號(hào)判定為與所述下一幀聲音信號(hào)的信號(hào)類型一致。
35.根據(jù)權(quán)利要求30所述的語(yǔ)音激活檢測(cè)裝置，其特征在于，還包括更新單元，適于當(dāng)所述第二判定單元或第三判定單元判定該幀為噪聲信號(hào)之后，基于該幀噪聲信號(hào)更新所述第一參考閾值和第二參考閾值。
36.根據(jù)權(quán)利要求35所述的語(yǔ)音激活檢測(cè)裝置，其特征在于，所述第一參考閾值大于或等于最小預(yù)設(shè)值，且小于或等于最大預(yù)設(shè)值；所述更新單元將所述最大預(yù)設(shè)值與所述時(shí)頻分析后的結(jié)果分別乘以預(yù)設(shè)加權(quán)系數(shù)后相加得到的值更新所述第一參考閾值，并基于所述第二參考閾值和第一參考閾值的倍數(shù)關(guān)系和更新后的第一參考閾值更新所述第二參考閾值。
37.根據(jù)權(quán)利要求30所述的語(yǔ)音激活檢測(cè)裝置，其特征在于，還包括存儲(chǔ)單元，適于保存與判定出的語(yǔ)音信號(hào)連續(xù)的前P幀待定信號(hào)以及保存與判定出的語(yǔ)音信號(hào)連續(xù)的后Q幀待定信號(hào)。
38.根據(jù)權(quán)利要求30所述的語(yǔ)音激活檢測(cè)裝置，其特征在于，所述第二參考閾值為第一參考閾值的1.3倍。
39.根據(jù)權(quán)利要求30所述的語(yǔ)音激活檢測(cè)裝置，其特征在于，每一幀聲音信號(hào)的長(zhǎng)度為 8ms。
40.根據(jù)權(quán)利要求30所述的語(yǔ)音激活檢測(cè)裝置，其特征在于，所述時(shí)頻分析對(duì)該幀輸入的聲音信號(hào)分別在時(shí)域以及頻域上求方差，獲得反映其在時(shí)域以及頻域上的綜合變化率的值。
全文摘要
一種語(yǔ)音激活檢測(cè)方法與裝置，所述語(yǔ)音激活檢測(cè)方法包括對(duì)輸入的聲音信號(hào)進(jìn)行分幀；以幀為單位對(duì)輸入的聲音信號(hào)進(jìn)行時(shí)頻分析；若時(shí)頻分析后的結(jié)果小于或等于第一參考閾值，則判定該幀為噪聲信號(hào)；若時(shí)頻分析后的結(jié)果大于所述第一參考閾值，且小于第二參考閾值，則該幀為待定信號(hào)，基于下一幀聲音信號(hào)的判定結(jié)果對(duì)其進(jìn)行判定；若時(shí)頻分析后的結(jié)果大于或等于所述第二參考閾值，則判定該幀為語(yǔ)音信號(hào)；所述第二參考閾值與第一參考閾值具有倍數(shù)關(guān)系。本技術(shù)方案能快捷、有效地識(shí)別出輸入的聲音信號(hào)中的語(yǔ)音信號(hào)和噪聲信號(hào)，確保通話質(zhì)量的同時(shí)減少了背景噪聲。
文檔編號(hào)G10L19/02GK102314884SQ201110235228
公開(kāi)日2012年1月11日申請(qǐng)日期2011年8月16日優(yōu)先權(quán)日2011年8月16日
發(fā)明者吳飛飛, 栗紅霞申請(qǐng)人:上海杰之能信息科技有限公司, 捷思銳科技(北京)有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：吳飛飛;栗紅霞
技術(shù)所有人：捷思銳科技（北京）有限公司;上海杰之能信息科技有限公司
我是此專利的發(fā)明人

上一篇：一種實(shí)現(xiàn)阿拉伯文tts發(fā)音的方法
上一篇：用于接近傳感器的超聲波換能器的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

語(yǔ)音激活檢測(cè)相關(guān)技術(shù)

語(yǔ)音報(bào)警裝置相關(guān)技術(shù)

電梯語(yǔ)音報(bào)站裝置相關(guān)技術(shù)

物質(zhì)激活能量裝置相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

語(yǔ)音激活檢測(cè)方法與裝置的制作方法