聲源定位方法和裝置與流程

文檔序號：12456791閱讀：447來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>測量裝置的制造及其應(yīng)用技術(shù)

本發(fā)明實(shí)施例涉及定位技術(shù)，尤其涉及一種聲源定位方法和裝置。

背景技術(shù)：

聲源定位技術(shù)是利用拾音器拾取語音信號，并通過數(shù)字信號處理技術(shù)對拾音器拾取的語音信號進(jìn)行分析和處理，從而確定和跟蹤聲源的空間位置的一種技術(shù)。聲源定位技術(shù)在視頻會議、語音識別和目標(biāo)定位等領(lǐng)域有著重要的應(yīng)用。

目前，聲源定位技術(shù)主要是基于波束形成的方法來進(jìn)行聲源定位，圖1是現(xiàn)有技術(shù)中基于波束形成的方法來進(jìn)行聲源定位的示意圖。如圖1所示，拾音器2、拾音器3、拾音器4、拾音器5、拾音器6構(gòu)成一個(gè)拾音器陣列，處理器(圖中未示出)將拾音器陣列采集到的聲源1的信號進(jìn)行加權(quán)求和，形成波束7、波束8和波束9，獲取每個(gè)波束的輸出信號功率，將輸出信號功率最大的波束對應(yīng)的位置確定為聲源位置，例如，圖1中波束8的輸出信號功率最大，則波束8對應(yīng)的位置為聲源位置。

但是，由于受拾音器陣列形狀的影響，基于波束形成的方法無法獲得穩(wěn)定的聲源定位精度，尤其在近場或者是聲學(xué)環(huán)境比較復(fù)雜的室內(nèi)環(huán)境中無法精確的進(jìn)行聲源定位。

技術(shù)實(shí)現(xiàn)要素：

本發(fā)明實(shí)施例提供一種聲源定位方法和裝置，以保證在近場、室內(nèi)環(huán)境中對聲源的位置進(jìn)行準(zhǔn)確的定位。

第一方面，本發(fā)明實(shí)施例提供一種聲源定位方法，包括：根據(jù)聲源發(fā)出的音頻信號和拾音器接收到的音頻信號，獲取第一通道脈沖響應(yīng)；其中，所述第一通道脈沖響應(yīng)為所述聲源與所述拾音器之間的通道脈沖響應(yīng)；獲取所述第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)；其中，所述模板庫中包括待定位空間中每個(gè)區(qū)域?qū)?yīng)的第二通道脈沖響應(yīng)，所述第二通道脈沖響應(yīng)為所述區(qū)域的測點(diǎn)與所述拾音器之間的通道脈沖響應(yīng)，所述相關(guān)系數(shù)表示所述第一通道脈沖響應(yīng)和所述第二通道脈沖響應(yīng)之間的相似度；根據(jù)絕對值最大的相關(guān)系數(shù)確定所述聲源的位置。在本實(shí)施例中，由于相關(guān)系數(shù)的絕對值越大，說明該第二通道脈沖響應(yīng)與第一通道脈沖響應(yīng)相似度越高，即該第二通道脈沖響應(yīng)對應(yīng)的區(qū)域位置和聲源的位置越相近，因此，將第二通道脈沖響應(yīng)對應(yīng)的區(qū)域位置確定為聲源的位置，可以保證在近場、室內(nèi)環(huán)境中對聲源的位置進(jìn)行準(zhǔn)確的定位。

結(jié)合第一方面，在第一方面的第一種可能實(shí)現(xiàn)方式中，所述根據(jù)聲源發(fā)出的音頻信號和拾音器接收到的音頻信號，獲取第一通道脈沖響應(yīng)之前，所述方法還包括：將所述待定位空間劃分為多個(gè)區(qū)域，并為每個(gè)所述區(qū)域設(shè)置一個(gè)測點(diǎn)；根據(jù)每個(gè)所述測點(diǎn)與所述拾音器之間的通道脈沖響應(yīng)生成所述模板庫。在本實(shí)施例中，將待定位空間劃分為若干區(qū)域，測量每個(gè)測點(diǎn)與拾音器之間的通道脈沖響應(yīng)，以生成模板庫，從而可以將待測聲源的通道脈沖響應(yīng)與模板庫中的每個(gè)通道脈沖響應(yīng)進(jìn)行匹配，保證確定的聲源位置更加精確。

結(jié)合第一方面或第一方面的第一種可能實(shí)現(xiàn)方式，在第一方面的第二種可能實(shí)現(xiàn)方式中，所述獲取所述第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)，包括：獲取所述第一通道脈沖響應(yīng)的反向脈沖序列；獲取所述反向脈沖序列與每個(gè)所述第二通道脈沖響應(yīng)之間的所述相關(guān)系數(shù)。

結(jié)合第一方面的任一種可能實(shí)現(xiàn)方式，在第一方面的第三種可能實(shí)現(xiàn)方式中，所述根據(jù)絕對值最大的相關(guān)系數(shù)確定所述聲源的位置，包括：獲取所述絕對值最大的相關(guān)系數(shù)中的第一元素；其中，所述第一元素為所述絕對值最大的相關(guān)系數(shù)中數(shù)值最大的元素；根據(jù)所述第一元素確定所述聲源的位置。在本實(shí)施例中，由于拾音器接收到的音頻信號不僅包括聲源發(fā)出的音頻信號，還包括其它的反射信號和干擾信號，一般情況下，聲源發(fā)出的音頻信號的信號強(qiáng)度比其它的反射信號和干擾信號的信號強(qiáng)度高，因此，聲源發(fā)出的音頻信號對應(yīng)的元素的絕對值比其它的信號對應(yīng)的元素的絕對值高，因此，根據(jù)第一元素確定聲源的位置的與實(shí)際的聲源的位置更加的接近，提高了聲源定位的精確度。

結(jié)合第一方面第二種或第三種可能實(shí)現(xiàn)方式，在第一方面的第四種可能實(shí)現(xiàn)方式中，所述根據(jù)聲源發(fā)出的音頻信號和拾音器接收到的音頻信號，獲取第一通道脈沖響應(yīng)，包括：根據(jù)公式計(jì)算所述第一通道脈沖響應(yīng)其中，S(jω)＝FFT(s(t))，R(jω)＝FFT(r(t))，r(t)為所述拾音器接收到的音頻信號，s(t)為所述聲源發(fā)出的音頻信號，t為所述聲源發(fā)出的音頻信號的持續(xù)時(shí)間。

結(jié)合第一方面第四種可能實(shí)現(xiàn)方式，在第一方面的第五種可能實(shí)現(xiàn)方式中，所述獲取所述第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)，包括：根據(jù)公式獲取所述反向脈沖序列其中，為通道脈沖響應(yīng)反向處理函數(shù)；根據(jù)公式獲取所述相關(guān)系數(shù)x(l,i)；其中，h_i(t)為所述第二通道脈沖響應(yīng)，i表示所述第二通道脈沖響應(yīng)對應(yīng)的區(qū)域的編號，且i為大于或者等于1的正整數(shù)，l＝1,2...2t-1。

結(jié)合第一方面第五種可能實(shí)現(xiàn)方式，在第一方面的第六種可能實(shí)現(xiàn)方式中，所述根據(jù)絕對值最大的相關(guān)系數(shù)確定所述聲源的位置，包括：根據(jù)公式p(i)＝max(x(l,i))獲取所述絕對值最大的相關(guān)系數(shù)p(i)；根據(jù)公式c＝max(p(i))確定所述聲源的位置c。

第二方面，本發(fā)明實(shí)施例提供一種聲源定位裝置，包括：獲取模塊，用于根據(jù)聲源發(fā)出的音頻信號和拾音器接收到的音頻信號，獲取第一通道脈沖響應(yīng)；其中，所述第一通道脈沖響應(yīng)為所述聲源與所述拾音器之間的通道脈沖響應(yīng)；處理模塊，用于獲取所述第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)；其中，所述模板庫中包括待定位空間中每個(gè)區(qū)域?qū)?yīng)的第二通道脈沖響應(yīng)，所述第二通道脈沖響應(yīng)為所述區(qū)域的測點(diǎn)與所述拾音器之間的通道脈沖響應(yīng)，所述相關(guān)系數(shù)表示所述第一通道脈沖響應(yīng)和所述第二通道脈沖響應(yīng)之間的相似度；確定模塊，用于根據(jù)絕對值最大的相關(guān)系數(shù)確定所述聲源的位置。本實(shí)施例的裝置，用于執(zhí)行第一方面提供的聲源定位方法，其實(shí)現(xiàn)原理和有益效果類似，此處不再贅述。

結(jié)合第二方面，在第二方面的第一種可能實(shí)現(xiàn)方式中，所述處理模塊還用于將所述待定位空間劃分為多個(gè)區(qū)域，并為每個(gè)所述區(qū)域設(shè)置一個(gè)測點(diǎn)；并根據(jù)每個(gè)所述測點(diǎn)與所述拾音器之間的通道脈沖響應(yīng)生成所述模板庫。本實(shí)施例的裝置，用于執(zhí)行第一方面的第一種可能實(shí)現(xiàn)方式提供的聲源定位方法，其實(shí)現(xiàn)原理和有益效果類似，此處不再贅述。

結(jié)合第二方面或第二方面的第一種可能實(shí)現(xiàn)方式，在第二方面的第二種可能實(shí)現(xiàn)方式中，所述處理模塊獲取所述第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)，包括：所述處理模塊獲取所述第一通道脈沖響應(yīng)的反向脈沖序列；并獲取所述反向脈沖序列與每個(gè)所述第二通道脈沖響應(yīng)之間的所述相關(guān)系數(shù)。

結(jié)合第二方面的任一種可能實(shí)現(xiàn)方式，在第二方面的第三種可能實(shí)現(xiàn)方式中，所述確定模塊具體用于獲取所述絕對值最大的相關(guān)系數(shù)中的第一元素，并根據(jù)所述第一元素確定所述聲源的位置；其中，所述第一元素為所述絕對值最大的相關(guān)系數(shù)中數(shù)值最大的元素。本實(shí)施例的裝置，用于執(zhí)行第一方面的第三種可能實(shí)現(xiàn)方式提供的聲源定位方法，其實(shí)現(xiàn)原理和有益效果類似，此處不再贅述。

結(jié)合第二方面的第二種或第三種可能實(shí)現(xiàn)方式，在第二方面的第四種可能實(shí)現(xiàn)方式中，所述獲取模塊具體用于根據(jù)公式計(jì)算所述第一通道脈沖響應(yīng)其中，S(jω)＝FFT(s(t))，R(jω)＝FFT(r(t))，r(t)為所述拾音器接收到的音頻信號，s(t)為所述聲源發(fā)出的音頻信號，t為所述聲源發(fā)出的音頻信號的持續(xù)時(shí)間。

結(jié)合第二方面的第四種可能實(shí)現(xiàn)方式，在第二方面的第四種可能實(shí)現(xiàn)方式中，所述處理模塊獲取所述第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)，包括：所述處理模塊根據(jù)公式獲取所述反向脈沖序列并根據(jù)公式獲取所述相關(guān)系數(shù)x(l,i)；其中，為通道脈沖響應(yīng)反向處理函數(shù)，h_i(t)為所述第二通道脈沖響應(yīng)，i表示所述第二通道脈沖響應(yīng)對應(yīng)的區(qū)域的編號，且i為大于或者等于1的正整數(shù)，l＝1,2...2t-1。

結(jié)合第二方面的第四種可能實(shí)現(xiàn)方式，在第二方面的第五種可能實(shí)現(xiàn)方式中，所述確定模塊具體用于根據(jù)公式p(i)＝max(x(l,i))獲取所述絕對值最大的相關(guān)系數(shù)p(i)；根據(jù)公式c＝max(p(i))確定所述聲源的位置c。

附圖說明

為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹，顯而易見地，下面描述中的附圖是本發(fā)明的一些實(shí)施例，對于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動性的前提下，還可以根據(jù)這些附圖獲得其他的附圖。

圖1是現(xiàn)有技術(shù)中基于波束形成的方法來進(jìn)行聲源定位的示意圖；

圖2為本發(fā)明實(shí)施例提供的聲源定位方法的應(yīng)用場景示意圖；

圖3為本發(fā)明實(shí)施例提供的聲源定位方法的系統(tǒng)架構(gòu)示意圖；

圖4為本發(fā)明實(shí)施例一提供的聲源定位方法的流程圖；

圖5為本發(fā)明實(shí)施例二提供的聲源定位方法的流程圖；

圖6為本發(fā)明實(shí)施例三提供的聲源定位方法的流程圖；

圖7為本發(fā)明實(shí)施例四提供的聲源定位裝置的結(jié)構(gòu)示意圖；

圖8為本發(fā)明實(shí)施例五提供的聲源定位設(shè)備的結(jié)構(gòu)示意圖。

具體實(shí)施方式

為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚，下面將結(jié)合本發(fā)明實(shí)施例中的附圖，對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述，顯然，所描述的實(shí)施例是本發(fā)明一部分實(shí)施例，而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例，本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例，都屬于本發(fā)明保護(hù)的范圍。

本發(fā)明實(shí)施例涉及的方法，旨在解決現(xiàn)有技術(shù)中由于受拾音器陣列形狀的影響，基于波束形成的方法無法獲得穩(wěn)定的聲源定位精度，而且，在近場或者是聲學(xué)環(huán)境比較復(fù)雜的室內(nèi)環(huán)境中無法精確的進(jìn)行聲源定位這一技術(shù)問題。

下面以具體地實(shí)施例對本發(fā)明的技術(shù)方案進(jìn)行詳細(xì)說明。下面這幾個(gè)具體的實(shí)施例可以相互結(jié)合，對于相同或相似的概念或過程可能在某些實(shí)施例不再贅述。

圖2為本發(fā)明實(shí)施例提供的聲源定位方法的應(yīng)用場景示意圖。如圖2所示，該場景可以為房屋、辦公場所、隧道等室內(nèi)空間，該室內(nèi)空間被劃分為若干個(gè)區(qū)域，并且，包括一個(gè)拾音器和一個(gè)聲源，可以根據(jù)拾音器與聲源之間的通道脈沖響應(yīng)，將聲源的位置定位到該室內(nèi)空間的某個(gè)區(qū)域內(nèi)。

圖3為本發(fā)明實(shí)施例提供的聲源定位方法的系統(tǒng)架構(gòu)示意圖。如圖3所示，該系統(tǒng)包括定位設(shè)備11和聲源12，其中，定位設(shè)備11包括計(jì)算機(jī)13、聲卡14和拾音器15。定位設(shè)備可以為一個(gè)獨(dú)立的設(shè)備，例如，手機(jī)、電腦、手持終端等，則計(jì)算機(jī)可以為一個(gè)具有運(yùn)算功能的處理器，拾音器可以為內(nèi)置的麥克風(fēng)；定位設(shè)備也可以為幾個(gè)設(shè)備組成的一個(gè)組合設(shè)備，例如，定位設(shè)備由一臺計(jì)算機(jī)、聲卡設(shè)備和外接的麥克風(fēng)組成。聲源可以為各種發(fā)音設(shè)備、樂器、人、動物等。

圖4為本發(fā)明實(shí)施例一提供的聲源定位方法的流程圖。本實(shí)施例的執(zhí)行主體為終端，該終端可以為計(jì)算機(jī)、手機(jī)、平板電腦等具有處理功能的設(shè)備，本實(shí)施例涉及的是終端將聲源與拾音器之間的通道脈沖響應(yīng)與模板庫中保存的通道脈沖響應(yīng)進(jìn)行匹配，確定聲源的位置的具體過程，。如圖4所示，該方法包括以下步驟：

步驟101、根據(jù)聲源發(fā)出的音頻信號和拾音器接收到的音頻信號，獲取第一通道脈沖響應(yīng)。

其中，第一通道脈沖響應(yīng)為聲源與拾音器之間的通道脈沖響應(yīng)。

在本實(shí)施例中，可以在終端上安裝Dirac軟件，通過Dirac軟件測量第一通道脈沖響應(yīng)。聲源可以為各種發(fā)音設(shè)備、樂器等，聲源發(fā)出的音頻信號為預(yù)先設(shè)置的一個(gè)已知的音頻信號，拾音器可以為麥克風(fēng)、錄音器等聲音采集設(shè)備。

步驟102、獲取第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)。

其中，模板庫中包括待定位空間中每個(gè)區(qū)域?qū)?yīng)的第二通道脈沖響應(yīng)，第二通道脈沖響應(yīng)為區(qū)域的測點(diǎn)與拾音器之間的通道脈沖響應(yīng)，相關(guān)系數(shù)表示第一通道脈沖響應(yīng)和第二通道脈沖響應(yīng)之間的相似度。

在本實(shí)施例中，可以預(yù)先將待定位空間劃分為若干個(gè)區(qū)域，并為每個(gè)區(qū) 域設(shè)置一個(gè)測點(diǎn)，測量每個(gè)測點(diǎn)與拾音器之間的通道脈沖響應(yīng)，將待定位空間中每個(gè)區(qū)域?qū)?yīng)的第二通道脈沖響應(yīng)保存到模板庫中，當(dāng)獲取到第一通道脈沖響應(yīng)之后，計(jì)算第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)，相關(guān)系數(shù)為一個(gè)向量，且用于表示第一通道脈沖響應(yīng)和第二通道脈沖響應(yīng)之間的相似度，例如，若相關(guān)系數(shù)的絕對值越大，則第一通道脈沖響應(yīng)和第二通道脈沖響應(yīng)之間的相似度越高，若相關(guān)系數(shù)的絕對值越小，則第一通道脈沖響應(yīng)和第二通道脈沖響應(yīng)之間的相似度越低。

需要說明的是，聲源的位置可以是待定位空間中的任一位置，但是拾音器的位置必須和建立模板庫時(shí)拾音器的位置相同，且固定不變。

步驟103、根據(jù)絕對值最大的相關(guān)系數(shù)確定聲源的位置。

在本實(shí)施例中，相關(guān)系數(shù)的絕對值越大，說明第二通道脈沖響應(yīng)和第一通道脈沖響應(yīng)的相似度越高，因此，從所有的相關(guān)系數(shù)中確定絕對值最大的相關(guān)系數(shù)，將絕對值最大的相關(guān)系數(shù)對應(yīng)的區(qū)域確定為聲源的位置。

現(xiàn)有技術(shù)中，將拾音器陣列采集到的聲源的信號進(jìn)行加權(quán)求和，形成波束，將輸出信號功率最大的波束對應(yīng)的位置作為聲源的位置，但是，在近場、室內(nèi)、封閉及半封閉空間中，由于反射體的存在，聲源發(fā)出的聲音會通過多次反射疊加被拾音器接收，聲學(xué)環(huán)境較為復(fù)雜，嚴(yán)重影響了聲源定位的精度，而且，現(xiàn)有技術(shù)的方法也會受到拾音器陣列形狀的影響，使得聲源定位精度很低。本實(shí)施例提供的聲源定位方法，獲取聲源與拾音器之間的通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)，根據(jù)絕對值最大的相關(guān)系數(shù)確定聲源的位置，由于相關(guān)系數(shù)的絕對值越大，說明該第二通道脈沖響應(yīng)與第一通道脈沖響應(yīng)相似度越高，即該第二通道脈沖響應(yīng)對應(yīng)的區(qū)域位置和聲源的位置越相近，因此，將第二通道脈沖響應(yīng)對應(yīng)的區(qū)域位置確定為聲源的位置，可以保證在近場、室內(nèi)環(huán)境中對聲源的位置進(jìn)行準(zhǔn)確的定位。

本實(shí)施例提供的聲源定位方法，終端根據(jù)聲源發(fā)出的音頻信號和拾音器接收到的音頻信號，獲取第一通道脈沖響應(yīng)，獲取第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)，根據(jù)絕對值最大的相關(guān)系數(shù)確定聲源的位置，由于相關(guān)系數(shù)的絕對值越大，說明該第二通道脈沖響應(yīng)與第一通道脈沖響應(yīng)相似度越高，即該第二通道脈沖響應(yīng)對應(yīng)的區(qū)域位置和聲源的位置越相近，因此，將第二通道脈沖響應(yīng)對應(yīng)的區(qū)域位置確定為聲源的位置，可以保證在近場、室內(nèi)環(huán)境中對聲源的位置進(jìn)行準(zhǔn)確的定位。

圖5為本發(fā)明實(shí)施例二提供的聲源定位方法的流程圖。本發(fā)明實(shí)施例為圖4所示方法的一種具體實(shí)現(xiàn)方式，涉及建立模板庫、獲取相關(guān)系數(shù)和確定聲源位置的具體實(shí)現(xiàn)方式。如圖5所示，該方法包括以下步驟：

步驟201、將待定位空間劃分為多個(gè)區(qū)域，并為每個(gè)區(qū)域設(shè)置一個(gè)測點(diǎn)。

在本實(shí)施例中，如圖2所示，可以按照定位精度的需要，將給定的待定位空間劃分為若干區(qū)域，每個(gè)區(qū)域的范圍可人為劃定，每個(gè)區(qū)域中心之間的距離可自由選擇，區(qū)域一般為規(guī)則的正方形或長方形，但并不以此為限?？梢詾閷Ω鲄^(qū)域進(jìn)行編號，例如，將各個(gè)區(qū)域一次編號為i，i＝1,2,…n,并在每個(gè)區(qū)域中設(shè)置一個(gè)測點(diǎn)，該測點(diǎn)一般設(shè)置在區(qū)域的中心位置。然后再待定位空間中設(shè)置一個(gè)拾音器，例如，麥克風(fēng)，錄音器等，在測量和定位過程中，拾音器的位置應(yīng)保持不變。

步驟202、根據(jù)每個(gè)測點(diǎn)與拾音器之間的通道脈沖響應(yīng)生成模板庫。

在本實(shí)例中，可以使用Dirac軟件測量每個(gè)測點(diǎn)與拾音器之間的通道脈沖響應(yīng)，并將這些通道脈沖響應(yīng)保存到模板庫中，也可以采用其他的測量軟件測量通道脈沖響應(yīng)，本發(fā)明中并不以此為限。

步驟203、根據(jù)聲源發(fā)出的音頻信號和拾音器接收到的音頻信號，獲取第一通道脈沖響應(yīng)。

其中，第一通道脈沖響應(yīng)為聲源與拾音器之間的通道脈沖響應(yīng)。

步驟204、獲取第一通道脈沖響應(yīng)的反向脈沖序列。

步驟205、獲取反向脈沖序列與每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)。

在本實(shí)施例中，計(jì)算相關(guān)系數(shù)之前，先要將第一通道脈沖響應(yīng)進(jìn)行反向處理，獲取反向脈沖序列，再計(jì)算反向脈沖序列與每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)。

在本實(shí)施例中，步驟204和步驟205為“獲取第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)”這一步驟的具體實(shí)現(xiàn)方式。

步驟206、獲取絕對值最大的相關(guān)系數(shù)中第一元素；其中，第一元素為絕對值最大的相關(guān)系數(shù)中絕對值最大的元素。

步驟207、根據(jù)第一元素確定聲源的位置。

在本實(shí)施例中，從所有的相關(guān)系數(shù)中選取絕對值最大的相關(guān)系數(shù)，由于相關(guān)系數(shù)為一個(gè)向量，包括多個(gè)元素，其中，元素代表的是拾音器接收到的音頻信號的通道脈沖響應(yīng)，由于拾音器接收到的音頻信號不僅包括聲源發(fā)出的音頻信號，還包括其它的反射信號和干擾信號，一般情況下，聲源發(fā)出的音頻信號的信號強(qiáng)度比其它的反射信號和干擾信號的信號強(qiáng)度高，因此，聲源發(fā)出的音頻信號對應(yīng)的元素的絕對值比其它的信號對應(yīng)的元素的絕對值高，因此，根據(jù)第一元素確定聲源的位置的與實(shí)際的聲源的位置更加的接近。

在本實(shí)施例中，步驟206和步驟207為“根據(jù)絕對值最大的相關(guān)系數(shù)確定聲源的位置”這一步驟的具體實(shí)現(xiàn)方式。

本實(shí)施例提供的聲源定位方法，終端將待定位空間劃分為多個(gè)區(qū)域，并為每個(gè)區(qū)域設(shè)置一個(gè)測點(diǎn)，根據(jù)每個(gè)測點(diǎn)與拾音器之間的通道脈沖響應(yīng)生成模板庫，根據(jù)聲源發(fā)出的音頻信號和拾音器接收到的音頻信號，獲取第一通道脈沖響應(yīng)，獲取第一通道脈沖響應(yīng)的反向脈沖序列，獲取反向脈沖序列與每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)，獲取絕對值最大的相關(guān)系數(shù)中第一元素，根據(jù)第一元素確定聲源的位置。本實(shí)施例中，預(yù)先將待定位空間劃分為若干區(qū)域，測量每個(gè)區(qū)域的測點(diǎn)與拾音器之間的通道脈沖響應(yīng)生成模板庫，根據(jù)第一通道脈沖響應(yīng)和第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)，并根據(jù)絕對值最大的相關(guān)系數(shù)中的絕對值最大的元素來確定聲源的位置，保證聲源定位的精度更加的準(zhǔn)確，并且，本實(shí)施例中，僅需要一個(gè)拾音器即可實(shí)現(xiàn)整個(gè)待定位空間的聲源定位，成本低，操作簡單。

可選地，在本實(shí)施例中，還可以采用雙拾音器進(jìn)行聲源定位，提升聲源定位穩(wěn)定性。

圖6為本發(fā)明實(shí)施例三提供的聲源定位方法的流程圖。如圖6所示，該方法包括以下步驟：

步驟301、根據(jù)公式計(jì)算第一通道脈沖響應(yīng)

其中，S(jω)＝FFT(s(t))，R(jω)＝FFT(r(t))，r(t)為拾音器接收到的音頻信號，s(t)為聲源發(fā)出的音頻信號，t為聲源發(fā)出的音頻信號的持續(xù)時(shí)間。

在本實(shí)施例中，待定位空間中的某一聲源發(fā)出的音頻信號為s(t)，拾音器接收到的音頻信號為r(t)，將s(t)和r(t)進(jìn)行傅里葉變換，得到頻域信號S(jω)和 R(jω)，在利用公式計(jì)算第一通道脈沖響應(yīng)

步驟302、根據(jù)公式獲取反向脈沖序列

其中，為通道脈沖響應(yīng)反向處理函數(shù)。

步驟303、根據(jù)公式獲取相關(guān)系數(shù)x(l,i)。

其中，h_i(t)為第二通道脈沖響應(yīng)，i表示第二通道脈沖響應(yīng)對應(yīng)的區(qū)域的編號，且i為大于或者等于1的正整數(shù)，l＝1,2...2t-1。

在本實(shí)施例中，將模版庫中的第二通道脈沖響應(yīng)h_i(t)和第一通道脈沖響應(yīng)的反向脈沖序列通過相關(guān)函數(shù)計(jì)算相關(guān)系數(shù)。其中，x(l,i)表示反向脈沖序列與第i個(gè)區(qū)域?qū)?yīng)的第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)。

步驟304、根據(jù)公式p(i)＝max(x(l,i))獲取絕對值最大的相關(guān)系數(shù)p(i)。

步驟305、根據(jù)公式c＝max(p(i))確定聲源的位置c。

在本實(shí)施例中，c為絕對值最大的相關(guān)系數(shù)對應(yīng)的區(qū)域的編號，即將絕對值最大的相關(guān)系數(shù)對應(yīng)的區(qū)域確定為聲源的位置。

本實(shí)施例提供的聲源定位方法，終端根據(jù)公式計(jì)算第一通道脈沖響應(yīng)根據(jù)公式獲取反向脈沖序列根據(jù)公式獲取相關(guān)系數(shù)x(l,i)，根據(jù)公式p(i)＝max(x(l,i))獲取絕對值最大的相關(guān)系數(shù)p(i)，根據(jù)公式c＝max(p(i))確定聲源的位置c，相較于現(xiàn)有技術(shù)，本實(shí)施例的聲源定位方法，充分利用了室內(nèi)通道的聲學(xué)信息，計(jì)算簡便，數(shù)據(jù)運(yùn)算量小，可在1～2s內(nèi)完成聲源定位；并且，定位精度高，可以實(shí)現(xiàn)厘米級定位精度。

圖7為本發(fā)明實(shí)施例四提供的聲源定位裝置的結(jié)構(gòu)示意圖。該聲源定位裝置可以為一個(gè)獨(dú)立的設(shè)備，例如，手機(jī)、電腦、手持終端、平板電腦等設(shè)備，也可以為集成在手機(jī)、電腦、手持終端、平板電腦等設(shè)備中的一個(gè)功能模塊。如圖7所示，該裝置包括獲取模塊21、處理模塊22和確定模塊23。獲取模塊21用于根據(jù)聲源發(fā)出的音頻信號和拾音器接收到的音頻信號，獲取第一通道脈沖響應(yīng)；其中，第一通道脈沖響應(yīng)為聲源與拾音器之間的通道脈沖響應(yīng)。處理模塊22用于獲取第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)；其中，模板庫中包括待定位空間中每個(gè)區(qū)域?qū)?yīng)的第二通道脈沖響應(yīng)，第二通道脈沖響應(yīng)為區(qū)域的測點(diǎn)與拾音器之間的通道脈沖響應(yīng)，相關(guān)系數(shù)表示第一通道脈沖響應(yīng)和第二通道脈沖響應(yīng)之間的相似度。確定模塊23用于根據(jù)絕對值最大的相關(guān)系數(shù)確定聲源的位置。

本實(shí)施例的裝置，可以用于執(zhí)行圖4所示方法實(shí)施例的技術(shù)方案，其實(shí)現(xiàn)原理和技術(shù)效果類似，此處不再贅述。

可選地，在圖7所示實(shí)施例的基礎(chǔ)上，處理模塊22還用于將待定位空間劃分為多個(gè)區(qū)域，并為每個(gè)區(qū)域設(shè)置一個(gè)測點(diǎn)；并根據(jù)每個(gè)測點(diǎn)與拾音器之間的通道脈沖響應(yīng)生成模板庫。

可選地，處理模塊22獲取第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)，包括：處理模塊22獲取第一通道脈沖響應(yīng)的反向脈沖序列；并獲取反向脈沖序列與每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)。

可選地，確定模塊23具體用于獲取絕對值最大的相關(guān)系數(shù)中的第一元素，并根據(jù)第一元素確定聲源的位置；其中，第一元素為絕對值最大的相關(guān)系數(shù)中數(shù)值最大的元素。

可選地，獲取模塊21具體用于根據(jù)公式計(jì)算第一通道脈沖響應(yīng)其中，S(jω)＝FFT(s(t))，R(jω)＝FFT(r(t))，r(t)為拾音器接收到的音頻信號，s(t)為聲源發(fā)出的音頻信號，t為聲源發(fā)出的音頻信號的持續(xù)時(shí)間。

可選地，處理模塊22獲取第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)，包括：處理模塊22根據(jù)公式獲取反向脈沖序列并根據(jù)公式獲取相關(guān)系數(shù)x(l,i)；其中，為通道脈沖響應(yīng)反向處理函數(shù)，h_i(t)為第二通道脈沖響應(yīng)，i表示第二通道脈沖響應(yīng)對應(yīng)的區(qū)域的編號，且i為大于或者等于1的正整數(shù)，l＝1,2...2t-1。

可選地，確定模塊23具體用于根據(jù)公式p(i)＝max(x(l,i))獲取絕對值最大的相關(guān)系數(shù)p(i)；根據(jù)公式c＝max(p(i))確定聲源的位置c。

本實(shí)施例的裝置，可以用于執(zhí)行圖4-圖6所示的任一方法實(shí)施例的技術(shù)方案，其實(shí)現(xiàn)原理和技術(shù)效果類似，此處不再贅述。

圖8為本發(fā)明實(shí)施例五提供的聲源定位設(shè)備的結(jié)構(gòu)示意圖。如圖8所示，該聲源定位設(shè)備包括處理器31、聲卡32和拾音器33。處理器31用于根據(jù)聲源發(fā)出的音頻信號和拾音器33接收到的音頻信號，獲取第一通道脈沖響應(yīng)；其中，第一通道脈沖響應(yīng)為聲源與拾音器之間的通道脈沖響應(yīng)；獲取第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)；其中，模板庫中包括待定位空間中每個(gè)區(qū)域?qū)?yīng)的第二通道脈沖響應(yīng)，第二通道脈沖響應(yīng)為區(qū)域的測點(diǎn)與拾音器之間的通道脈沖響應(yīng)，相關(guān)系數(shù)表示第一通道脈沖響應(yīng)和第二通道脈沖響應(yīng)之間的相似度；根據(jù)絕對值最大的相關(guān)系數(shù)確定聲源的位置。聲卡32用于將聲源發(fā)出的音頻信號和拾音器33接收到的音頻信號分別轉(zhuǎn)換為數(shù)字信號。拾音器33用于接收音頻信號。

可選地，處理器31可以是一個(gè)通用處理器，也可以是專用集成電路(application specific integrated circuit，ASIC)或數(shù)字信號處理器(digital signal processing，簡稱DSP)。

本實(shí)施例的聲源定位設(shè)備，可以用于執(zhí)行圖4所示方法實(shí)施例的技術(shù)方案，其實(shí)現(xiàn)原理和技術(shù)效果類似，此處不再贅述。

可選地，該定位設(shè)備還可以包括收發(fā)器34和存儲器35，收發(fā)器34與處理器31耦合，收發(fā)器34可以是發(fā)射器，接收器或其組合，用于箱其它設(shè)備發(fā)送數(shù)據(jù)或接收其它設(shè)備發(fā)送的數(shù)據(jù)。存儲器35可為非瞬時(shí)性的存儲介質(zhì)，與處理器31相耦合，用于保存模板庫和不同類型的數(shù)據(jù)。存儲器35可包含只讀存儲器(read only memory，ROM),隨機(jī)存取存儲器(random access memory，RAM)或者可存儲信息和指令的其他類型的動態(tài)存儲設(shè)備，也可以是磁盤存儲器。存儲器504可用于保存實(shí)現(xiàn)圖4、圖5或圖6所述相關(guān)方法的指令。

可選地，處理器31還用于將待定位空間劃分為多個(gè)區(qū)域，并為每個(gè)區(qū)域設(shè)置一個(gè)測點(diǎn)；并根據(jù)每個(gè)測點(diǎn)與拾音器之間的通道脈沖響應(yīng)生成模板庫。

可選地，處理器31獲取第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)，包括：處理器31獲取第一通道脈沖響應(yīng)的反向脈沖序列；獲取反向脈沖序列與每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)。

可選地，處理器31根據(jù)絕對值最大的相關(guān)系數(shù)確定聲源的位置，包括：處理器31獲取絕對值最大的相關(guān)系數(shù)中的第一元素，并根據(jù)第一元素確定聲源的位置；其中，第一元素為絕對值最大的相關(guān)系數(shù)中數(shù)值最大的元素。

可選地，處理器31根據(jù)聲源發(fā)出的音頻信號和拾音器接收到的音頻信號，獲取第一通道脈沖響應(yīng)，包括：處理器31根據(jù)公式計(jì)算第一通道脈沖響應(yīng)其中，S(jω)＝FFT(s(t))，R(jω)＝FFT(r(t))，r(t)為拾音器接收到的音頻信號，s(t)為聲源發(fā)出的音頻信號，t為聲源發(fā)出的音頻信號的持續(xù)時(shí)間。

可選地，處理器31獲取第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)，包括：處理器31根據(jù)公式獲取反向脈沖序列并根據(jù)公式獲取相關(guān)系數(shù)x(l,i)；其中，為通道脈沖響應(yīng)反向處理函數(shù)，h_i(t)為第二通道脈沖響應(yīng)，i表示第二通道脈沖響應(yīng)對應(yīng)的區(qū)域的編號，且i為大于或者等于1的正整數(shù)，l＝1,2...2t-1。

可選地，處理器31根據(jù)絕對值最大的相關(guān)系數(shù)確定聲源的位置，包括：處理器31根據(jù)公式p(i)＝max(x(l,i))獲取絕對值最大的相關(guān)系數(shù)p(i)；并根據(jù)公式c＝max(p(i))確定聲源的位置c。

本實(shí)施例的聲源定位設(shè)備，可以用于執(zhí)行圖4-圖6所示的任一方法實(shí)施例的技術(shù)方案，其實(shí)現(xiàn)原理和技術(shù)效果類似，此處不再贅述。

本領(lǐng)域普通技術(shù)人員可以理解：實(shí)現(xiàn)上述各方法實(shí)施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成。前述的程序可以存儲于一計(jì)算機(jī)可讀取存儲介質(zhì)中。該程序在執(zhí)行時(shí)，執(zhí)行包括上述各方法實(shí)施例的步驟；而前述的存儲介質(zhì)包括：只讀存儲器(Read-Only Memory，簡稱ROM)、隨機(jī)存取存儲器(random access memory，簡稱RAM)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。

最后應(yīng)說明的是：以上各實(shí)施例僅用以說明本發(fā)明的技術(shù)方案，而非對其限制；盡管參照前述各實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明，本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解：其依然可以對前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改，或者對其中部分或者全部技術(shù)特征進(jìn)行等同替換；而這些修改或者替換，并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：曾向陽;王海濤
技術(shù)所有人：華為技術(shù)有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、邢老師：1.機(jī)械設(shè)計(jì)及理論 2.生物醫(yī)學(xué)材料及器械 3.聲發(fā)射檢測技術(shù)。
2、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測試技術(shù) 5.逆向工程技術(shù)研究
3、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
4、張老師：1.機(jī)械設(shè)計(jì)的應(yīng)力分析、強(qiáng)度校核的計(jì)算機(jī)仿真 2.生物反應(yīng)器研制 3.生物力學(xué)
5、趙老師：檢測與控制技術(shù)、機(jī)器人技術(shù)、機(jī)電一體化技術(shù)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

聲源定位方法和裝置與流程