一種基于集成學(xué)習(xí)的室內(nèi)聲源定位方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種基于集成學(xué)習(xí)的室內(nèi)聲源定位方法,特別是涉及聲源定位識(shí)別方法所使用的特征。本發(fā)明使用信號(hào)的相位變換廣義互相關(guān)函數(shù)作為位置特征,將聲源信號(hào)數(shù)據(jù)轉(zhuǎn)換成特征數(shù)據(jù)集,再使用集成學(xué)習(xí)技術(shù)(Bagging,AdaBoost等)對(duì)特征數(shù)據(jù)進(jìn)行訓(xùn)練和定位測(cè)試,最終得到的集成學(xué)習(xí)分類(lèi)器能很好地鑒別聲源位置,克服了傳統(tǒng)聲源定位算法在惡劣環(huán)境下性能損失嚴(yán)重的不足。相比較傳統(tǒng)的定位算法,本發(fā)明的優(yōu)勢(shì)在于能在室內(nèi)環(huán)境下,有較強(qiáng)的噪聲、混響的惡劣環(huán)境下,依舊能夠獲得魯棒的聲源定位性能。
【專(zhuān)利說(shuō)明】
一種基于集成學(xué)習(xí)的室內(nèi)聲源定位方法
技術(shù)領(lǐng)域
[0001 ]本發(fā)明屬于無(wú)線(xiàn)電波的反射或再輻射的定位或存在檢測(cè)領(lǐng)域,涉及一種在混響和 噪聲干擾環(huán)境下基于集成學(xué)習(xí)的室內(nèi)聲源定位方法,特別是涉及聲源定位識(shí)別方法所使用 的特征。
【背景技術(shù)】
[0002] 基于麥克風(fēng)陣列的聲源定位技術(shù)是近幾年國(guó)內(nèi)外的一項(xiàng)研究熱點(diǎn)。它主要原理 是:通過(guò)具有一定幾何拓?fù)浣Y(jié)構(gòu)的麥克風(fēng)陣列采集聲源信號(hào),通過(guò)陣列信號(hào)處理技術(shù)對(duì)語(yǔ) 音信號(hào)進(jìn)行處理和分析,從而確定聲源位置。
[0003] 目前,基于麥克風(fēng)陣列的聲源定位技術(shù)已廣泛應(yīng)用于許多領(lǐng)域,如視頻會(huì)議、聲音 檢測(cè)、語(yǔ)音增強(qiáng)、語(yǔ)音識(shí)別、說(shuō)話(huà)人識(shí)別、智能機(jī)器人、監(jiān)控監(jiān)聽(tīng)系統(tǒng)、助聽(tīng)裝置等。傳統(tǒng)的聲 源定位算法主要有三類(lèi):
[0004] 第一類(lèi)是基于高分辨率譜估計(jì)的方法。該方法源于一些現(xiàn)代高分辨率估計(jì)技術(shù), 如自回歸模型(AR,Auto Regressive)、最小方差譜估計(jì)(MV,Minimum Variance)、多重信號(hào) 分類(lèi)(MUSIC,Multiple Signal Classification)等等,它們利用求解麥克風(fēng)信號(hào)間的相關(guān) 矩陣來(lái)定出方向角,從而進(jìn)一步確定聲源位置;這類(lèi)方法有很強(qiáng)的分辨力,但是運(yùn)算量極 大,且不適用于近距離的定位。
[0005] 第二類(lèi)是基于時(shí)延估計(jì)(TD0A,Time Difference of Arrival)的技術(shù)。該方法首 先求出聲音到達(dá)不同位置麥克風(fēng)的時(shí)間差,從而根據(jù)時(shí)間差用幾何法來(lái)計(jì)算出聲源位置; 這類(lèi)時(shí)延估計(jì)算法主要有廣義互相關(guān)函數(shù)(GCC,Generali zed cross correlation)時(shí)延估 計(jì)算法和自適應(yīng)最小均方時(shí)延(LMS,Least Mean Square)估計(jì)算法。比如專(zhuān)利名稱(chēng)為"麥克 風(fēng)間距測(cè)量方法和裝置〃(
【申請(qǐng)人】:華為終端有限公司,專(zhuān)利號(hào):CN101685153B)就屬于這類(lèi) 技術(shù)。這類(lèi)方法計(jì)算量小,實(shí)時(shí)性好,成本低易于實(shí)現(xiàn),但是由于要先估計(jì)時(shí)延會(huì)造成二次 估計(jì)上的誤差,時(shí)延精度也易受到混響和噪聲干擾的影響,魯棒性較差。
[0006] 第三類(lèi)是基于最大輸出功率可控的波束成型方法。該方法對(duì)麥克風(fēng)陣列接受的語(yǔ) 音信號(hào)進(jìn)行濾波、加權(quán)求和,然后直接控制麥克風(fēng)指向波束有最大輸出功率的方向即是聲 源的位置;比如名稱(chēng)為"一種聲源定位的方法及系統(tǒng)"(
【申請(qǐng)人】:TCL集團(tuán)股份有限公司,公開(kāi) 號(hào):CN105204001A)的發(fā)明專(zhuān)利屬于這類(lèi)技術(shù)。但是該方法需要聲源和環(huán)境噪聲的先驗(yàn)知 識(shí),實(shí)際情況下先驗(yàn)知識(shí)較難獲得,同時(shí)對(duì)外界環(huán)境以及聲源頻率反映比較敏感,從而限制 了應(yīng)用場(chǎng)合。
[0007] 因此,目前大多數(shù)的基于麥克風(fēng)陣列的定位技術(shù)中,特別是在室內(nèi)環(huán)境,如小型會(huì) 場(chǎng)、教室、辦公室等,當(dāng)噪聲大、有混響的情況下存在定位準(zhǔn)確率不高,系統(tǒng)成本高、計(jì)算量 大等等問(wèn)題。
[0008] 集成學(xué)習(xí)技術(shù)是一個(gè)迅速發(fā)展中的研究領(lǐng)域,它是機(jī)器學(xué)習(xí)領(lǐng)域中用來(lái)提升分類(lèi) 算法準(zhǔn)確率的技術(shù)。集成學(xué)習(xí)通過(guò)構(gòu)建并合并多個(gè)弱學(xué)習(xí)器(分類(lèi)器)來(lái)完成學(xué)習(xí)分類(lèi)任 務(wù),常常能獲得比單一學(xué)習(xí)器顯著優(yōu)越的泛化性能。常用的集成學(xué)習(xí)算法有Bagging(裝 袋)、Boosting(提升)、RandomForest(隨機(jī)森林)等等。
[0009] 當(dāng)前,集成學(xué)習(xí)技術(shù)正在眾多領(lǐng)域獲得日益廣泛的應(yīng)用,在其從出現(xiàn)到目前短短 的近二十年里,它已經(jīng)廣泛應(yīng)用于語(yǔ)音識(shí)別、文本過(guò)濾、遙感信息處理、疾病診斷等領(lǐng)域。預(yù) 計(jì)將來(lái)會(huì)有越來(lái)越多的研究可由集成學(xué)習(xí)來(lái)解決。
【發(fā)明內(nèi)容】
[0010] 本發(fā)明目的在于解決在有較強(qiáng)的噪聲、混響的惡劣室內(nèi)環(huán)境下魯棒性較差的問(wèn) 題。為解決上述問(wèn)題,本發(fā)明提出的技術(shù)方案為一種基于集成學(xué)習(xí)的室內(nèi)聲源定位方法,包 括如下步驟:
[0011] 步驟1:設(shè)定聲源的訓(xùn)練位置li(i = l,2· · ·η)(單位:角度),使用若干個(gè)麥克風(fēng) 陣列記錄聲源發(fā)出的混響信號(hào)Xji(i = l,2· · ·η,」_ = 1,2· · ·πι);
[0012] 步驟2:利用記錄下的混響信號(hào))^,根據(jù)具體要求,加入一定信噪比的高斯白噪聲, 對(duì)混響信號(hào)計(jì)算處理生成信號(hào)的相位變換廣義互相關(guān)函數(shù)R 1;
[0013] 步驟3:利用得到的相位變換廣義互相關(guān)函數(shù)心產(chǎn)生對(duì)應(yīng)聲源位置h的特征向量 Yi;
[0014] 步驟4:處理特征向量Yi對(duì)應(yīng)的特征數(shù)據(jù)集yi,將數(shù)據(jù)集劃分為訓(xùn)練數(shù)據(jù)集和測(cè)試 數(shù)據(jù)集;
[0015] 步驟5:對(duì)訓(xùn)練數(shù)據(jù)集使用集成學(xué)習(xí)方法,弱學(xué)習(xí)器選擇常用的決策樹(shù),訓(xùn)練出集 成學(xué)習(xí)分類(lèi)器;
[0016] 步驟6:使用得到的集成學(xué)習(xí)分類(lèi)器進(jìn)行測(cè)試,識(shí)別出聲源的位置。
[0017]進(jìn)一步,步驟2中,所使用的特征為相位變換廣義互相關(guān)函數(shù),特征的計(jì)算過(guò)程包 括如下步驟:
[0018] 步驟2-1:設(shè)聲源位置為1 i,則產(chǎn)生出混響時(shí)間為T(mén)的房間脈沖響應(yīng)h (1 i,k) i,說(shuō)話(huà) 人語(yǔ)音為s(k),使用m個(gè)麥克風(fēng)組成麥克風(fēng)陣,則麥克風(fēng)接受到的信號(hào)為Xn(k)=h(li,k)*s (k)(n = l,2,· · · m);
[0019] 步驟2-2:對(duì)步驟2-1得到的信號(hào)Xn(k),分幀加漢寧窗采集數(shù)據(jù),對(duì)每幀信號(hào)數(shù)據(jù), 可在頻域計(jì)算出它們之間的廣義互相關(guān)函數(shù)
;中 Φ?η,2η( ω )為加權(quán)函數(shù),此處使用相位變換加權(quán)函數(shù)(PHAT;
能增 強(qiáng)互相關(guān)函數(shù)的抗混響能力;
[0020] 步驟2-3:將步驟2-2得到的所有的對(duì)應(yīng)所有位置的廣義互相關(guān)函數(shù)Μτ)作預(yù)處 理轉(zhuǎn)化為分類(lèi)算法的訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)
其中round是取整函 數(shù),D是麥克風(fēng)間距離,fs是采樣頻率,c是聲速,因子α設(shè)為1.67,則取得的數(shù)據(jù)集為
,按一定比例 隨機(jī)劃分Υ就得到了訓(xùn)練數(shù)據(jù)集Ytrain和測(cè)試數(shù)據(jù)集Ytest。
[0021] 作為優(yōu)選方案,步驟2-2中所述采集數(shù)據(jù)的方式為幀長(zhǎng)512個(gè)采樣點(diǎn),幀移256個(gè)采 樣點(diǎn),共使用200幀的數(shù)據(jù)。
[0022]同樣,作為優(yōu)選方案,步驟2-3中所述按一定比例隨機(jī)劃分Y是指按6:4的比例隨機(jī) 劃分Y。
[0023]進(jìn)一步,步驟5中數(shù)據(jù)的分類(lèi)和最后的定位使用了集成學(xué)習(xí)方法集成了決策樹(shù)算 法。
[0024] 具體而言,作為優(yōu)選方案,上述集成學(xué)習(xí)方法包括AdaBoost和Bagging方法。
[0025]與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果在于:
[0026] 1.本發(fā)明通過(guò)使用相位變換廣義互相關(guān)函數(shù)作為識(shí)別特征,利用分類(lèi)識(shí)別的方法 來(lái)進(jìn)行聲源定位,能夠克服傳統(tǒng)的三類(lèi)聲源定位算法在室內(nèi)條件,噪聲、混響較為惡劣的環(huán) 境下定位性能急劇惡化,甚至無(wú)法定位的弱點(diǎn)。
[0027] 2.隨著環(huán)境溫度、濕度等的變化,以及器件的老化,經(jīng)過(guò)一段時(shí)間后麥克風(fēng)的特性 將發(fā)生變化,使得傳統(tǒng)的麥克風(fēng)陣的定位性能下降,本發(fā)明不需要對(duì)麥克風(fēng)進(jìn)行校正。 [0028] 3.本發(fā)明使用了集成學(xué)習(xí)算法。在實(shí)際應(yīng)用中,想要直接構(gòu)造一個(gè)擁有很高性能 的學(xué)習(xí)器模型是很難的,而集成學(xué)習(xí)算法常常能通過(guò)增加數(shù)據(jù)擾動(dòng)提升學(xué)習(xí)器的性能,同 時(shí)得到的集成學(xué)習(xí)器不需要提前知道弱學(xué)習(xí)器的先驗(yàn)知識(shí),也不容易過(guò)擬合。因此,可以很 容易地在一定基礎(chǔ)上對(duì)模型的性能不斷處理、改進(jìn)。
【附圖說(shuō)明】
[0029] 圖1為本發(fā)明的方法流程圖。
[0030] 圖2為模擬出的房間、麥克風(fēng)陣以及聲源的示意圖。
[0031 ]圖3為模擬的房間平面圖,以及位于90°位置上的聲源的示意圖。
[0032]圖4為聲源位于10°、50°位置上所對(duì)應(yīng)的相位變換廣義互相關(guān)函數(shù)。
[0033]圖5為聲源位于9個(gè)位置、混響時(shí)間為0.3S時(shí)四種方法的準(zhǔn)確率比較圖。
[0034]圖6為聲源位于9個(gè)位置時(shí)、混響時(shí)間為0.6S時(shí)四種方法定位的準(zhǔn)確率比較圖。
【具體實(shí)施方式】
[0035]下面結(jié)合說(shuō)明書(shū)附圖對(duì)本發(fā)明創(chuàng)造作進(jìn)一步的詳細(xì)說(shuō)明。本發(fā)明的工作原理是通 過(guò)使用信號(hào)的廣義互相關(guān)函數(shù)作為位置特征,將聲源信號(hào)數(shù)據(jù)轉(zhuǎn)化成特征數(shù)據(jù)集,再使用 集成學(xué)習(xí)技術(shù)(Bagging(裝袋),AdaBoost(自適應(yīng)提升)等)對(duì)特征數(shù)據(jù)進(jìn)行訓(xùn)練和定位測(cè) 試,最終得到的集成學(xué)習(xí)分類(lèi)器能很好地鑒別聲源位置,克服了傳統(tǒng)聲源定位算法在惡劣 環(huán)境下性能損失嚴(yán)重的不足。
[0036]基于上述原理,本發(fā)明所采取的技術(shù)方案主要包括如下步驟:
[0037] 步驟1:設(shè)定聲源的訓(xùn)練位置1,(1 = 1,2-11)(單位:角度),使用若干個(gè)麥克風(fēng)陣列 記錄聲源發(fā)出的混響信號(hào)Xji(i = l,2···]!,j = l,2···ηι);
[0038] 步驟2:利用記錄下的混響信號(hào))^,根據(jù)具體要求,加入一定信噪比的高斯白噪聲, 對(duì)混響信號(hào)計(jì)算處理生成信號(hào)的相位變換廣義互相關(guān)函數(shù)R 1;
[0039] 步驟3:利用得到的相位變換廣義互相關(guān)函數(shù)心產(chǎn)生對(duì)應(yīng)聲源位置h的特征向量 Yi;
[0040] 步驟4:處理特征向量Yi對(duì)應(yīng)的特征數(shù)據(jù)集yi,將數(shù)據(jù)集劃分為訓(xùn)練數(shù)據(jù)集和測(cè)試 數(shù)據(jù)集;
[0041]步驟5:對(duì)訓(xùn)練數(shù)據(jù)集使用集成學(xué)習(xí)方法(AdaB〇〇st,Bagging),弱學(xué)習(xí)器選擇常用 的決策樹(shù),訓(xùn)練出集成學(xué)習(xí)分類(lèi)器。;
[0042]步驟6:使用得到的集成學(xué)習(xí)分類(lèi)器進(jìn)行測(cè)試,識(shí)別出聲源的位置。
[0043]如圖1所示,本發(fā)明是一種混響和噪聲環(huán)境下基于集成學(xué)習(xí)的室內(nèi)聲源定位方法, 該方法包含訓(xùn)練和定位兩個(gè)階段,在訓(xùn)練階段對(duì)每個(gè)位置由互相關(guān)函數(shù)訓(xùn)練出集成學(xué)習(xí)器 模型,然后在定位階段通過(guò)使用上一階段訓(xùn)練出的模型來(lái)測(cè)試數(shù)據(jù)的互相關(guān)函數(shù)從而確定 聲源的位置。下面將具體描述每一步的細(xì)節(jié)。
[0044] 本發(fā)明具體實(shí)施步驟,包括如下:
[0045] 步驟1:圖2所示為模擬出的房間,和房間中的麥克風(fēng)陣,以及位于170°位置上的聲 源。使用matlab工具包roomsim模擬出7mX6mX3m的房間,使用2個(gè)麥克風(fēng)組成麥克風(fēng)陣,對(duì) 于聲源位置為li(設(shè)相對(duì)麥克風(fēng)陣的水平方向角為10°、30°、…150°、170°,共9個(gè)位置,距離 為2m,圖3即為聲源位置為90°時(shí)的情況),產(chǎn)生出混響時(shí)間為T(mén)的房間脈沖響應(yīng)h(1 i,k)i;語(yǔ) 音信號(hào)采用麻省理工大學(xué)的??ΜΙΤ語(yǔ)音庫(kù)的語(yǔ)音s(k)。使用2個(gè)麥克風(fēng)組成麥克風(fēng)陣,麥克 間距離為〇.3111,貝11麥克風(fēng)接受到的信號(hào)為1 11(1〇=11(]^,1〇*8(1〇(11=1,2)。
[0046] 步驟2:對(duì)步驟1得到的信號(hào)X1(k)和X2(k),分幀加漢寧窗,幀長(zhǎng)512個(gè)采樣點(diǎn),幀移 256個(gè)采樣點(diǎn),共使用200幀的數(shù)據(jù)。對(duì)每幀信號(hào)數(shù)據(jù),可在頻域計(jì)算出它們之間的廣義互相 關(guān)函婁
其中Φι,2( ω )為加權(quán)函數(shù),此處使用相位變換 -奶' , 加權(quán)函數(shù)(ΡΗΑΤ
胃能增強(qiáng)互相關(guān)函數(shù)的抗混響能力。圖4為聲源位于 10°、50°位置上所對(duì)應(yīng)的相位變換廣義互相關(guān)函數(shù),可見(jiàn)聲源在不同位置(聲源10°、50°)時(shí) 對(duì)應(yīng)的廣義互相關(guān)函數(shù)是有差異的。
[0047]步驟3:將步驟2得到的所有的對(duì)應(yīng)所有位置的廣義互相關(guān)函數(shù)Μτ)作預(yù)處理轉(zhuǎn) 化為分類(lèi)算法的訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)。取其中round是取整函數(shù),D是
、-乂, 麥克風(fēng)間距離,fs是采樣頻率,C是聲速,因子α設(shè)為1 .67。則取得的數(shù)據(jù)集為
f。按6: 4的比例隨機(jī) 劃分Y就得到了訓(xùn)練數(shù)據(jù)集Ytrain和測(cè)試數(shù)據(jù)集Ytest。
[0048]步驟4:利用步驟3得到的訓(xùn)練數(shù)據(jù)Ytrain,使用決策樹(shù)算法訓(xùn)練分類(lèi)器模型modell, 同時(shí),分別使用AbaBoost和Bagging方法集成決策樹(shù)訓(xùn)練分類(lèi)器模型model2和modle3。 [0049] 步驟5:使用步驟4得到的模型111〇(1161、1]1〇(1162和1]1〇(1163對(duì)測(cè)試數(shù)據(jù)集¥1^1;進(jìn)行定 位。
[0050]步驟6:結(jié)果比較分析,參數(shù)調(diào)整。將定位結(jié)果與傳統(tǒng)的聲源定位算法的定位結(jié)果 作對(duì)比測(cè)試(這里選擇SRP-PHAT(可控響應(yīng)功率-相位加權(quán))算法),不斷調(diào)整信噪比(純凈語(yǔ) 音,25(^,20(^,15(^,10(^,5(^),選擇不同長(zhǎng)度的混響時(shí)間(0.63和0.33)。最終定位結(jié)果如 圖5,圖6所示。圖5為聲源位于9個(gè)位置時(shí),混響時(shí)間為0.3S,SRP-PHAT算法、決策樹(shù)算法, AdaBoost和Bagging決策樹(shù)方法在信噪比由純凈語(yǔ)音,25dB,20dB,15dB,lOdB直到5dB變化 時(shí),以上四種方法的準(zhǔn)確率。圖6為聲源位于9個(gè)位置時(shí),混響時(shí)間為0.6S,SRP-PHAT算法、決 策樹(shù)算法,AdaBoost和Bagging決策樹(shù)方法在信噪比由純凈語(yǔ)音,25dB,20dB,15dB,10dB直 至lj5dB變化時(shí),以上四種方法定位的準(zhǔn)確率。可以發(fā)現(xiàn)本發(fā)明隨著噪聲和混響的加強(qiáng),定位 準(zhǔn)確率和魯棒性都要強(qiáng)于經(jīng)典的SRP-PHAT算法。
[0051]對(duì)本領(lǐng)域技術(shù)人員而言,根據(jù)上述實(shí)施類(lèi)型可以很容易聯(lián)想其他變形,如弱分類(lèi) 器的選擇,聲源位置的選擇,麥克風(fēng)數(shù)量等。因此,本發(fā)明不局限于以上實(shí)例,其僅僅作為例 子對(duì)本發(fā)明的一種形態(tài)進(jìn)行詳細(xì)、示范性的說(shuō)明。在不背離本發(fā)明宗旨的范圍內(nèi),本領(lǐng)域技 術(shù)人員根據(jù)上述具體實(shí)例,通過(guò)各種等同替換所得到的技術(shù)方案,均應(yīng)包含在本發(fā)明的權(quán) 利要求范圍及其等同范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種基于集成學(xué)習(xí)的室內(nèi)聲源定位方法,其特征在于,包括如下步驟: 步驟1:設(shè)定聲源的訓(xùn)練位置li(i = l,2· · ·η),使用若干個(gè)麥克風(fēng)陣列記錄聲源發(fā)出 的混響信號(hào)Xji(i = l,2. · ·η〇 = 1,2· · .m); 步驟2:利用記錄下的混響信號(hào)^1,根據(jù)具體要求,加入一定信噪比的高斯白噪聲,對(duì)混 響信號(hào)計(jì)算處理生成信號(hào)的相位變換廣義互相關(guān)函數(shù)Ri; 步驟3:利用得到的相位變換廣義互相關(guān)函數(shù)Ri產(chǎn)生對(duì)應(yīng)聲源位置li的特征向量Yi; 步驟4:處理特征向量Yi對(duì)應(yīng)的特征數(shù)據(jù)集yi,將數(shù)據(jù)集劃分為訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù) 集; 步驟5:對(duì)訓(xùn)練數(shù)據(jù)集使用集成學(xué)習(xí)方法,弱學(xué)習(xí)器選擇常用的決策樹(shù),訓(xùn)練出集成學(xué) 習(xí)分類(lèi)器; 步驟6:使用得到的集成學(xué)習(xí)分類(lèi)器進(jìn)行測(cè)試,識(shí)別出聲源的位置。2. 根據(jù)權(quán)利要求1所述的一種基于集成學(xué)習(xí)的室內(nèi)聲源定位方法,其特征在于,步驟2 中,所使用的特征為相位變換廣義互相關(guān)函數(shù),特征的計(jì)算過(guò)程包括如下步驟: 步驟2-1:設(shè)聲源位置為li,則產(chǎn)生出混響時(shí)間為T(mén)的房間脈沖響應(yīng)h(li,k)i,說(shuō)話(huà)人語(yǔ) 音為S化),使用m個(gè)麥克風(fēng)組成麥克風(fēng)陣,則麥克風(fēng)接受到的信號(hào)為Xn化)=h(li,k)*s化)(n =1,2, · · · m); 步驟2-2:對(duì)步驟2-1得到的信號(hào)xn化),分帖加漢寧窗采集數(shù)據(jù),對(duì)每帖信號(hào)數(shù)據(jù),可在 頻域計(jì)算出它們之間的廣義互相關(guān)函數(shù)其中化n,2n (ω )為加權(quán)函數(shù),此處使用相位變換加權(quán)函I'能增強(qiáng)互 相關(guān)函數(shù)的抗混響能力; 步驟2-3:將步驟2-2得到的所有的對(duì)應(yīng)所有位置的廣義互相關(guān)函數(shù)Ri(T)作預(yù)處理轉(zhuǎn)化 為分類(lèi)算法的訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù),巧其中round是取整函數(shù),D是麥 克風(fēng)間距離,fs是采樣頻率,C是聲速,因子α設(shè)為1.67,貝峨得的數(shù)據(jù)集為Y引i?(-r"J,R(- Tmax+l) ,R(-Tmax+2),…R(Tmax-2),… R( Tmax-l ),R( Tmax) ]Τ,按一定比例隨機(jī)劃分Υ就得到了訓(xùn)練數(shù)據(jù)集Ytrain和測(cè)試數(shù)據(jù)集 Ytest 〇3. 根據(jù)權(quán)利要求2所述的一種基于集成學(xué)習(xí)的室內(nèi)聲源定位方法,其特征在于步驟2-2 中所述采集數(shù)據(jù)的方式為帖長(zhǎng)512個(gè)采樣點(diǎn),帖移256個(gè)采樣點(diǎn),共使用200帖的數(shù)據(jù)。4. 根據(jù)權(quán)利要求1所述的一種基于集成學(xué)習(xí)的室內(nèi)聲源定位方法,其特征在于步驟2-3 中所述按一定比例隨機(jī)劃分Y是指按6:4的比例隨機(jī)劃分Y。5. 根據(jù)權(quán)利要求1所述的一種基于集成學(xué)習(xí)的室內(nèi)聲源定位方法,其特征在于步驟5中 數(shù)據(jù)的分類(lèi)和最后的定位使用了集成學(xué)習(xí)方法集成了決策樹(shù)算法。6. 根據(jù)權(quán)利要求5所述的一種基于集成學(xué)習(xí)的室內(nèi)聲源定位方法,其特征在于,所述集 成學(xué)習(xí)方法包括AdaBoost和Bagging方法。
【文檔編號(hào)】G10L21/0216GK105976827SQ201610356146
【公開(kāi)日】2016年9月28日
【申請(qǐng)日】2016年5月26日
【發(fā)明人】萬(wàn)新旺, 楊?lèi)? 顧曉瑜, 王吉
【申請(qǐng)人】南京郵電大學(xué)