本發(fā)明實(shí)施例涉及定位技術(shù),尤其涉及一種聲源定位方法和裝置。
背景技術(shù):
聲源定位技術(shù)是利用拾音器拾取語音信號,并通過數(shù)字信號處理技術(shù)對拾音器拾取的語音信號進(jìn)行分析和處理,從而確定和跟蹤聲源的空間位置的一種技術(shù)。聲源定位技術(shù)在視頻會議、語音識別和目標(biāo)定位等領(lǐng)域有著重要的應(yīng)用。
目前,聲源定位技術(shù)主要是基于波束形成的方法來進(jìn)行聲源定位,圖1是現(xiàn)有技術(shù)中基于波束形成的方法來進(jìn)行聲源定位的示意圖。如圖1所示,拾音器2、拾音器3、拾音器4、拾音器5、拾音器6構(gòu)成一個(gè)拾音器陣列,處理器(圖中未示出)將拾音器陣列采集到的聲源1的信號進(jìn)行加權(quán)求和,形成波束7、波束8和波束9,獲取每個(gè)波束的輸出信號功率,將輸出信號功率最大的波束對應(yīng)的位置確定為聲源位置,例如,圖1中波束8的輸出信號功率最大,則波束8對應(yīng)的位置為聲源位置。
但是,由于受拾音器陣列形狀的影響,基于波束形成的方法無法獲得穩(wěn)定的聲源定位精度,尤其在近場或者是聲學(xué)環(huán)境比較復(fù)雜的室內(nèi)環(huán)境中無法精確的進(jìn)行聲源定位。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供一種聲源定位方法和裝置,以保證在近場、室內(nèi)環(huán)境中對聲源的位置進(jìn)行準(zhǔn)確的定位。
第一方面,本發(fā)明實(shí)施例提供一種聲源定位方法,包括:根據(jù)聲源發(fā)出的音頻信號和拾音器接收到的音頻信號,獲取第一通道脈沖響應(yīng);其中,所述第一通道脈沖響應(yīng)為所述聲源與所述拾音器之間的通道脈沖響應(yīng);獲取所述第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù); 其中,所述模板庫中包括待定位空間中每個(gè)區(qū)域?qū)?yīng)的第二通道脈沖響應(yīng),所述第二通道脈沖響應(yīng)為所述區(qū)域的測點(diǎn)與所述拾音器之間的通道脈沖響應(yīng),所述相關(guān)系數(shù)表示所述第一通道脈沖響應(yīng)和所述第二通道脈沖響應(yīng)之間的相似度;根據(jù)絕對值最大的相關(guān)系數(shù)確定所述聲源的位置。在本實(shí)施例中,由于相關(guān)系數(shù)的絕對值越大,說明該第二通道脈沖響應(yīng)與第一通道脈沖響應(yīng)相似度越高,即該第二通道脈沖響應(yīng)對應(yīng)的區(qū)域位置和聲源的位置越相近,因此,將第二通道脈沖響應(yīng)對應(yīng)的區(qū)域位置確定為聲源的位置,可以保證在近場、室內(nèi)環(huán)境中對聲源的位置進(jìn)行準(zhǔn)確的定位。
結(jié)合第一方面,在第一方面的第一種可能實(shí)現(xiàn)方式中,所述根據(jù)聲源發(fā)出的音頻信號和拾音器接收到的音頻信號,獲取第一通道脈沖響應(yīng)之前,所述方法還包括:將所述待定位空間劃分為多個(gè)區(qū)域,并為每個(gè)所述區(qū)域設(shè)置一個(gè)測點(diǎn);根據(jù)每個(gè)所述測點(diǎn)與所述拾音器之間的通道脈沖響應(yīng)生成所述模板庫。在本實(shí)施例中,將待定位空間劃分為若干區(qū)域,測量每個(gè)測點(diǎn)與拾音器之間的通道脈沖響應(yīng),以生成模板庫,從而可以將待測聲源的通道脈沖響應(yīng)與模板庫中的每個(gè)通道脈沖響應(yīng)進(jìn)行匹配,保證確定的聲源位置更加精確。
結(jié)合第一方面或第一方面的第一種可能實(shí)現(xiàn)方式,在第一方面的第二種可能實(shí)現(xiàn)方式中,所述獲取所述第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù),包括:獲取所述第一通道脈沖響應(yīng)的反向脈沖序列;獲取所述反向脈沖序列與每個(gè)所述第二通道脈沖響應(yīng)之間的所述相關(guān)系數(shù)。
結(jié)合第一方面的任一種可能實(shí)現(xiàn)方式,在第一方面的第三種可能實(shí)現(xiàn)方式中,所述根據(jù)絕對值最大的相關(guān)系數(shù)確定所述聲源的位置,包括:獲取所述絕對值最大的相關(guān)系數(shù)中的第一元素;其中,所述第一元素為所述絕對值最大的相關(guān)系數(shù)中數(shù)值最大的元素;根據(jù)所述第一元素確定所述聲源的位置。在本實(shí)施例中,由于拾音器接收到的音頻信號不僅包括聲源發(fā)出的音頻信號,還包括其它的反射信號和干擾信號,一般情況下,聲源發(fā)出的音頻信號的信號強(qiáng)度比其它的反射信號和干擾信號的信號強(qiáng)度高,因此,聲源發(fā)出的音頻信號對應(yīng)的元素的絕對值比其它的信號對應(yīng)的元素的絕對值高,因此,根據(jù)第一元素確定聲源的位置的與實(shí)際的聲源的位置更加的接近,提高了聲源定位的精確度。
結(jié)合第一方面第二種或第三種可能實(shí)現(xiàn)方式,在第一方面的第四種可能 實(shí)現(xiàn)方式中,所述根據(jù)聲源發(fā)出的音頻信號和拾音器接收到的音頻信號,獲取第一通道脈沖響應(yīng),包括:根據(jù)公式計(jì)算所述第一通道脈沖響應(yīng)其中,S(jω)=FFT(s(t)),R(jω)=FFT(r(t)),r(t)為所述拾音器接收到的音頻信號,s(t)為所述聲源發(fā)出的音頻信號,t為所述聲源發(fā)出的音頻信號的持續(xù)時(shí)間。
結(jié)合第一方面第四種可能實(shí)現(xiàn)方式,在第一方面的第五種可能實(shí)現(xiàn)方式中,所述獲取所述第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù),包括:根據(jù)公式獲取所述反向脈沖序列其中,為通道脈沖響應(yīng)反向處理函數(shù);根據(jù)公式獲取所述相關(guān)系數(shù)x(l,i);其中,hi(t)為所述第二通道脈沖響應(yīng),i表示所述第二通道脈沖響應(yīng)對應(yīng)的區(qū)域的編號,且i為大于或者等于1的正整數(shù),l=1,2...2t-1。
結(jié)合第一方面第五種可能實(shí)現(xiàn)方式,在第一方面的第六種可能實(shí)現(xiàn)方式中,所述根據(jù)絕對值最大的相關(guān)系數(shù)確定所述聲源的位置,包括:根據(jù)公式p(i)=max(x(l,i))獲取所述絕對值最大的相關(guān)系數(shù)p(i);根據(jù)公式c=max(p(i))確定所述聲源的位置c。
第二方面,本發(fā)明實(shí)施例提供一種聲源定位裝置,包括:獲取模塊,用于根據(jù)聲源發(fā)出的音頻信號和拾音器接收到的音頻信號,獲取第一通道脈沖響應(yīng);其中,所述第一通道脈沖響應(yīng)為所述聲源與所述拾音器之間的通道脈沖響應(yīng);處理模塊,用于獲取所述第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù);其中,所述模板庫中包括待定位空間中每個(gè)區(qū)域?qū)?yīng)的第二通道脈沖響應(yīng),所述第二通道脈沖響應(yīng)為所述區(qū)域的測點(diǎn)與所述拾音器之間的通道脈沖響應(yīng),所述相關(guān)系數(shù)表示所述第一通道脈沖響應(yīng)和所述第二通道脈沖響應(yīng)之間的相似度;確定模塊,用于根據(jù)絕對值最大的相關(guān)系數(shù)確定所述聲源的位置。本實(shí)施例的裝置,用于執(zhí)行第一方面提供的聲源定位方法,其實(shí)現(xiàn)原理和有益效果類似,此處不再贅述。
結(jié)合第二方面,在第二方面的第一種可能實(shí)現(xiàn)方式中,所述處理模塊還 用于將所述待定位空間劃分為多個(gè)區(qū)域,并為每個(gè)所述區(qū)域設(shè)置一個(gè)測點(diǎn);并根據(jù)每個(gè)所述測點(diǎn)與所述拾音器之間的通道脈沖響應(yīng)生成所述模板庫。本實(shí)施例的裝置,用于執(zhí)行第一方面的第一種可能實(shí)現(xiàn)方式提供的聲源定位方法,其實(shí)現(xiàn)原理和有益效果類似,此處不再贅述。
結(jié)合第二方面或第二方面的第一種可能實(shí)現(xiàn)方式,在第二方面的第二種可能實(shí)現(xiàn)方式中,所述處理模塊獲取所述第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù),包括:所述處理模塊獲取所述第一通道脈沖響應(yīng)的反向脈沖序列;并獲取所述反向脈沖序列與每個(gè)所述第二通道脈沖響應(yīng)之間的所述相關(guān)系數(shù)。
結(jié)合第二方面的任一種可能實(shí)現(xiàn)方式,在第二方面的第三種可能實(shí)現(xiàn)方式中,所述確定模塊具體用于獲取所述絕對值最大的相關(guān)系數(shù)中的第一元素,并根據(jù)所述第一元素確定所述聲源的位置;其中,所述第一元素為所述絕對值最大的相關(guān)系數(shù)中數(shù)值最大的元素。本實(shí)施例的裝置,用于執(zhí)行第一方面的第三種可能實(shí)現(xiàn)方式提供的聲源定位方法,其實(shí)現(xiàn)原理和有益效果類似,此處不再贅述。
結(jié)合第二方面的第二種或第三種可能實(shí)現(xiàn)方式,在第二方面的第四種可能實(shí)現(xiàn)方式中,所述獲取模塊具體用于根據(jù)公式計(jì)算所述第一通道脈沖響應(yīng)其中,S(jω)=FFT(s(t)),R(jω)=FFT(r(t)),r(t)為所述拾音器接收到的音頻信號,s(t)為所述聲源發(fā)出的音頻信號,t為所述聲源發(fā)出的音頻信號的持續(xù)時(shí)間。
結(jié)合第二方面的第四種可能實(shí)現(xiàn)方式,在第二方面的第四種可能實(shí)現(xiàn)方式中,所述處理模塊獲取所述第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù),包括:所述處理模塊根據(jù)公式獲取所述反向脈沖序列并根據(jù)公式獲取所述相關(guān)系數(shù)x(l,i);其中,為通道脈沖響應(yīng)反向處理函數(shù),hi(t)為所述第二通道脈沖響應(yīng),i表示所述第二通道脈沖響應(yīng)對應(yīng)的區(qū)域的編號,且i為大于或者等于1的正整數(shù),l=1,2...2t-1。
結(jié)合第二方面的第四種可能實(shí)現(xiàn)方式,在第二方面的第五種可能實(shí)現(xiàn)方式中,所述確定模塊具體用于根據(jù)公式p(i)=max(x(l,i))獲取所述絕對值最大的相關(guān)系數(shù)p(i);根據(jù)公式c=max(p(i))確定所述聲源的位置c。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是現(xiàn)有技術(shù)中基于波束形成的方法來進(jìn)行聲源定位的示意圖;
圖2為本發(fā)明實(shí)施例提供的聲源定位方法的應(yīng)用場景示意圖;
圖3為本發(fā)明實(shí)施例提供的聲源定位方法的系統(tǒng)架構(gòu)示意圖;
圖4為本發(fā)明實(shí)施例一提供的聲源定位方法的流程圖;
圖5為本發(fā)明實(shí)施例二提供的聲源定位方法的流程圖;
圖6為本發(fā)明實(shí)施例三提供的聲源定位方法的流程圖;
圖7為本發(fā)明實(shí)施例四提供的聲源定位裝置的結(jié)構(gòu)示意圖;
圖8為本發(fā)明實(shí)施例五提供的聲源定位設(shè)備的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明實(shí)施例涉及的方法,旨在解決現(xiàn)有技術(shù)中由于受拾音器陣列形狀的影響,基于波束形成的方法無法獲得穩(wěn)定的聲源定位精度,而且,在近場或者是聲學(xué)環(huán)境比較復(fù)雜的室內(nèi)環(huán)境中無法精確的進(jìn)行聲源定位這一技術(shù)問題。
下面以具體地實(shí)施例對本發(fā)明的技術(shù)方案進(jìn)行詳細(xì)說明。下面這幾個(gè)具體的實(shí)施例可以相互結(jié)合,對于相同或相似的概念或過程可能在某些實(shí)施例 不再贅述。
圖2為本發(fā)明實(shí)施例提供的聲源定位方法的應(yīng)用場景示意圖。如圖2所示,該場景可以為房屋、辦公場所、隧道等室內(nèi)空間,該室內(nèi)空間被劃分為若干個(gè)區(qū)域,并且,包括一個(gè)拾音器和一個(gè)聲源,可以根據(jù)拾音器與聲源之間的通道脈沖響應(yīng),將聲源的位置定位到該室內(nèi)空間的某個(gè)區(qū)域內(nèi)。
圖3為本發(fā)明實(shí)施例提供的聲源定位方法的系統(tǒng)架構(gòu)示意圖。如圖3所示,該系統(tǒng)包括定位設(shè)備11和聲源12,其中,定位設(shè)備11包括計(jì)算機(jī)13、聲卡14和拾音器15。定位設(shè)備可以為一個(gè)獨(dú)立的設(shè)備,例如,手機(jī)、電腦、手持終端等,則計(jì)算機(jī)可以為一個(gè)具有運(yùn)算功能的處理器,拾音器可以為內(nèi)置的麥克風(fēng);定位設(shè)備也可以為幾個(gè)設(shè)備組成的一個(gè)組合設(shè)備,例如,定位設(shè)備由一臺計(jì)算機(jī)、聲卡設(shè)備和外接的麥克風(fēng)組成。聲源可以為各種發(fā)音設(shè)備、樂器、人、動物等。
圖4為本發(fā)明實(shí)施例一提供的聲源定位方法的流程圖。本實(shí)施例的執(zhí)行主體為終端,該終端可以為計(jì)算機(jī)、手機(jī)、平板電腦等具有處理功能的設(shè)備,本實(shí)施例涉及的是終端將聲源與拾音器之間的通道脈沖響應(yīng)與模板庫中保存的通道脈沖響應(yīng)進(jìn)行匹配,確定聲源的位置的具體過程,。如圖4所示,該方法包括以下步驟:
步驟101、根據(jù)聲源發(fā)出的音頻信號和拾音器接收到的音頻信號,獲取第一通道脈沖響應(yīng)。
其中,第一通道脈沖響應(yīng)為聲源與拾音器之間的通道脈沖響應(yīng)。
在本實(shí)施例中,可以在終端上安裝Dirac軟件,通過Dirac軟件測量第一通道脈沖響應(yīng)。聲源可以為各種發(fā)音設(shè)備、樂器等,聲源發(fā)出的音頻信號為預(yù)先設(shè)置的一個(gè)已知的音頻信號,拾音器可以為麥克風(fēng)、錄音器等聲音采集設(shè)備。
步驟102、獲取第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)。
其中,模板庫中包括待定位空間中每個(gè)區(qū)域?qū)?yīng)的第二通道脈沖響應(yīng),第二通道脈沖響應(yīng)為區(qū)域的測點(diǎn)與拾音器之間的通道脈沖響應(yīng),相關(guān)系數(shù)表示第一通道脈沖響應(yīng)和第二通道脈沖響應(yīng)之間的相似度。
在本實(shí)施例中,可以預(yù)先將待定位空間劃分為若干個(gè)區(qū)域,并為每個(gè)區(qū) 域設(shè)置一個(gè)測點(diǎn),測量每個(gè)測點(diǎn)與拾音器之間的通道脈沖響應(yīng),將待定位空間中每個(gè)區(qū)域?qū)?yīng)的第二通道脈沖響應(yīng)保存到模板庫中,當(dāng)獲取到第一通道脈沖響應(yīng)之后,計(jì)算第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù),相關(guān)系數(shù)為一個(gè)向量,且用于表示第一通道脈沖響應(yīng)和第二通道脈沖響應(yīng)之間的相似度,例如,若相關(guān)系數(shù)的絕對值越大,則第一通道脈沖響應(yīng)和第二通道脈沖響應(yīng)之間的相似度越高,若相關(guān)系數(shù)的絕對值越小,則第一通道脈沖響應(yīng)和第二通道脈沖響應(yīng)之間的相似度越低。
需要說明的是,聲源的位置可以是待定位空間中的任一位置,但是拾音器的位置必須和建立模板庫時(shí)拾音器的位置相同,且固定不變。
步驟103、根據(jù)絕對值最大的相關(guān)系數(shù)確定聲源的位置。
在本實(shí)施例中,相關(guān)系數(shù)的絕對值越大,說明第二通道脈沖響應(yīng)和第一通道脈沖響應(yīng)的相似度越高,因此,從所有的相關(guān)系數(shù)中確定絕對值最大的相關(guān)系數(shù),將絕對值最大的相關(guān)系數(shù)對應(yīng)的區(qū)域確定為聲源的位置。
現(xiàn)有技術(shù)中,將拾音器陣列采集到的聲源的信號進(jìn)行加權(quán)求和,形成波束,將輸出信號功率最大的波束對應(yīng)的位置作為聲源的位置,但是,在近場、室內(nèi)、封閉及半封閉空間中,由于反射體的存在,聲源發(fā)出的聲音會通過多次反射疊加被拾音器接收,聲學(xué)環(huán)境較為復(fù)雜,嚴(yán)重影響了聲源定位的精度,而且,現(xiàn)有技術(shù)的方法也會受到拾音器陣列形狀的影響,使得聲源定位精度很低。本實(shí)施例提供的聲源定位方法,獲取聲源與拾音器之間的通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù),根據(jù)絕對值最大的相關(guān)系數(shù)確定聲源的位置,由于相關(guān)系數(shù)的絕對值越大,說明該第二通道脈沖響應(yīng)與第一通道脈沖響應(yīng)相似度越高,即該第二通道脈沖響應(yīng)對應(yīng)的區(qū)域位置和聲源的位置越相近,因此,將第二通道脈沖響應(yīng)對應(yīng)的區(qū)域位置確定為聲源的位置,可以保證在近場、室內(nèi)環(huán)境中對聲源的位置進(jìn)行準(zhǔn)確的定位。
本實(shí)施例提供的聲源定位方法,終端根據(jù)聲源發(fā)出的音頻信號和拾音器接收到的音頻信號,獲取第一通道脈沖響應(yīng),獲取第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù),根據(jù)絕對值最大的相關(guān)系數(shù)確定聲源的位置,由于相關(guān)系數(shù)的絕對值越大,說明該第二通道脈沖響應(yīng)與第一通道脈沖響應(yīng)相似度越高,即該第二通道脈沖響應(yīng)對應(yīng)的區(qū)域位置和聲源的位置越相近,因此,將第二通道脈沖響應(yīng)對應(yīng)的區(qū)域位置確定為聲源的 位置,可以保證在近場、室內(nèi)環(huán)境中對聲源的位置進(jìn)行準(zhǔn)確的定位。
圖5為本發(fā)明實(shí)施例二提供的聲源定位方法的流程圖。本發(fā)明實(shí)施例為圖4所示方法的一種具體實(shí)現(xiàn)方式,涉及建立模板庫、獲取相關(guān)系數(shù)和確定聲源位置的具體實(shí)現(xiàn)方式。如圖5所示,該方法包括以下步驟:
步驟201、將待定位空間劃分為多個(gè)區(qū)域,并為每個(gè)區(qū)域設(shè)置一個(gè)測點(diǎn)。
在本實(shí)施例中,如圖2所示,可以按照定位精度的需要,將給定的待定位空間劃分為若干區(qū)域,每個(gè)區(qū)域的范圍可人為劃定,每個(gè)區(qū)域中心之間的距離可自由選擇,區(qū)域一般為規(guī)則的正方形或長方形,但并不以此為限??梢詾閷Ω鲄^(qū)域進(jìn)行編號,例如,將各個(gè)區(qū)域一次編號為i,i=1,2,…n,并在每個(gè)區(qū)域中設(shè)置一個(gè)測點(diǎn),該測點(diǎn)一般設(shè)置在區(qū)域的中心位置。然后再待定位空間中設(shè)置一個(gè)拾音器,例如,麥克風(fēng),錄音器等,在測量和定位過程中,拾音器的位置應(yīng)保持不變。
步驟202、根據(jù)每個(gè)測點(diǎn)與拾音器之間的通道脈沖響應(yīng)生成模板庫。
在本實(shí)例中,可以使用Dirac軟件測量每個(gè)測點(diǎn)與拾音器之間的通道脈沖響應(yīng),并將這些通道脈沖響應(yīng)保存到模板庫中,也可以采用其他的測量軟件測量通道脈沖響應(yīng),本發(fā)明中并不以此為限。
步驟203、根據(jù)聲源發(fā)出的音頻信號和拾音器接收到的音頻信號,獲取第一通道脈沖響應(yīng)。
其中,第一通道脈沖響應(yīng)為聲源與拾音器之間的通道脈沖響應(yīng)。
步驟204、獲取第一通道脈沖響應(yīng)的反向脈沖序列。
步驟205、獲取反向脈沖序列與每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)。
在本實(shí)施例中,計(jì)算相關(guān)系數(shù)之前,先要將第一通道脈沖響應(yīng)進(jìn)行反向處理,獲取反向脈沖序列,再計(jì)算反向脈沖序列與每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)。
在本實(shí)施例中,步驟204和步驟205為“獲取第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)”這一步驟的具體實(shí)現(xiàn)方式。
步驟206、獲取絕對值最大的相關(guān)系數(shù)中第一元素;其中,第一元素為絕對值最大的相關(guān)系數(shù)中絕對值最大的元素。
步驟207、根據(jù)第一元素確定聲源的位置。
在本實(shí)施例中,從所有的相關(guān)系數(shù)中選取絕對值最大的相關(guān)系數(shù),由于 相關(guān)系數(shù)為一個(gè)向量,包括多個(gè)元素,其中,元素代表的是拾音器接收到的音頻信號的通道脈沖響應(yīng),由于拾音器接收到的音頻信號不僅包括聲源發(fā)出的音頻信號,還包括其它的反射信號和干擾信號,一般情況下,聲源發(fā)出的音頻信號的信號強(qiáng)度比其它的反射信號和干擾信號的信號強(qiáng)度高,因此,聲源發(fā)出的音頻信號對應(yīng)的元素的絕對值比其它的信號對應(yīng)的元素的絕對值高,因此,根據(jù)第一元素確定聲源的位置的與實(shí)際的聲源的位置更加的接近。
在本實(shí)施例中,步驟206和步驟207為“根據(jù)絕對值最大的相關(guān)系數(shù)確定聲源的位置”這一步驟的具體實(shí)現(xiàn)方式。
本實(shí)施例提供的聲源定位方法,終端將待定位空間劃分為多個(gè)區(qū)域,并為每個(gè)區(qū)域設(shè)置一個(gè)測點(diǎn),根據(jù)每個(gè)測點(diǎn)與拾音器之間的通道脈沖響應(yīng)生成模板庫,根據(jù)聲源發(fā)出的音頻信號和拾音器接收到的音頻信號,獲取第一通道脈沖響應(yīng),獲取第一通道脈沖響應(yīng)的反向脈沖序列,獲取反向脈沖序列與每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù),獲取絕對值最大的相關(guān)系數(shù)中第一元素,根據(jù)第一元素確定聲源的位置。本實(shí)施例中,預(yù)先將待定位空間劃分為若干區(qū)域,測量每個(gè)區(qū)域的測點(diǎn)與拾音器之間的通道脈沖響應(yīng)生成模板庫,根據(jù)第一通道脈沖響應(yīng)和第二通道脈沖響應(yīng)之間的相關(guān)系數(shù),并根據(jù)絕對值最大的相關(guān)系數(shù)中的絕對值最大的元素來確定聲源的位置,保證聲源定位的精度更加的準(zhǔn)確,并且,本實(shí)施例中,僅需要一個(gè)拾音器即可實(shí)現(xiàn)整個(gè)待定位空間的聲源定位,成本低,操作簡單。
可選地,在本實(shí)施例中,還可以采用雙拾音器進(jìn)行聲源定位,提升聲源定位穩(wěn)定性。
圖6為本發(fā)明實(shí)施例三提供的聲源定位方法的流程圖。如圖6所示,該方法包括以下步驟:
步驟301、根據(jù)公式計(jì)算第一通道脈沖響應(yīng)
其中,S(jω)=FFT(s(t)),R(jω)=FFT(r(t)),r(t)為拾音器接收到的音頻信號,s(t)為聲源發(fā)出的音頻信號,t為聲源發(fā)出的音頻信號的持續(xù)時(shí)間。
在本實(shí)施例中,待定位空間中的某一聲源發(fā)出的音頻信號為s(t),拾音器接收到的音頻信號為r(t),將s(t)和r(t)進(jìn)行傅里葉變換,得到頻域信號S(jω)和 R(jω),在利用公式計(jì)算第一通道脈沖響應(yīng)
步驟302、根據(jù)公式獲取反向脈沖序列
其中,為通道脈沖響應(yīng)反向處理函數(shù)。
步驟303、根據(jù)公式獲取相關(guān)系數(shù)x(l,i)。
其中,hi(t)為第二通道脈沖響應(yīng),i表示第二通道脈沖響應(yīng)對應(yīng)的區(qū)域的編號,且i為大于或者等于1的正整數(shù),l=1,2...2t-1。
在本實(shí)施例中,將模版庫中的第二通道脈沖響應(yīng)hi(t)和第一通道脈沖響應(yīng)的反向脈沖序列通過相關(guān)函數(shù)計(jì)算相關(guān)系數(shù)。其中,x(l,i)表示反向脈沖序列與第i個(gè)區(qū)域?qū)?yīng)的第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)。
步驟304、根據(jù)公式p(i)=max(x(l,i))獲取絕對值最大的相關(guān)系數(shù)p(i)。
步驟305、根據(jù)公式c=max(p(i))確定聲源的位置c。
在本實(shí)施例中,c為絕對值最大的相關(guān)系數(shù)對應(yīng)的區(qū)域的編號,即將絕對值最大的相關(guān)系數(shù)對應(yīng)的區(qū)域確定為聲源的位置。
本實(shí)施例提供的聲源定位方法,終端根據(jù)公式計(jì)算第一通道脈沖響應(yīng)根據(jù)公式獲取反向脈沖序列根據(jù)公式獲取相關(guān)系數(shù)x(l,i),根據(jù)公式p(i)=max(x(l,i))獲取絕對值最大的相關(guān)系數(shù)p(i),根據(jù)公式c=max(p(i))確定聲源的位置c,相較于現(xiàn)有技術(shù),本實(shí)施例的聲源定位方法,充分利用了室內(nèi)通道的聲學(xué)信息,計(jì)算簡便,數(shù)據(jù)運(yùn)算量小,可在1~2s內(nèi)完成聲源定位;并且,定位精度高,可以實(shí)現(xiàn)厘米級定位精度。
圖7為本發(fā)明實(shí)施例四提供的聲源定位裝置的結(jié)構(gòu)示意圖。該聲源定位裝置可以為一個(gè)獨(dú)立的設(shè)備,例如,手機(jī)、電腦、手持終端、平板電腦等設(shè)備,也可以為集成在手機(jī)、電腦、手持終端、平板電腦等設(shè)備中的一個(gè)功能模塊。如圖7所示,該裝置包括獲取模塊21、處理模塊22和確定模塊23。獲取模塊21用于根據(jù)聲源發(fā)出的音頻信號和拾音器接收到的音頻信號,獲取 第一通道脈沖響應(yīng);其中,第一通道脈沖響應(yīng)為聲源與拾音器之間的通道脈沖響應(yīng)。處理模塊22用于獲取第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù);其中,模板庫中包括待定位空間中每個(gè)區(qū)域?qū)?yīng)的第二通道脈沖響應(yīng),第二通道脈沖響應(yīng)為區(qū)域的測點(diǎn)與拾音器之間的通道脈沖響應(yīng),相關(guān)系數(shù)表示第一通道脈沖響應(yīng)和第二通道脈沖響應(yīng)之間的相似度。確定模塊23用于根據(jù)絕對值最大的相關(guān)系數(shù)確定聲源的位置。
本實(shí)施例的裝置,可以用于執(zhí)行圖4所示方法實(shí)施例的技術(shù)方案,其實(shí)現(xiàn)原理和技術(shù)效果類似,此處不再贅述。
可選地,在圖7所示實(shí)施例的基礎(chǔ)上,處理模塊22還用于將待定位空間劃分為多個(gè)區(qū)域,并為每個(gè)區(qū)域設(shè)置一個(gè)測點(diǎn);并根據(jù)每個(gè)測點(diǎn)與拾音器之間的通道脈沖響應(yīng)生成模板庫。
可選地,處理模塊22獲取第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù),包括:處理模塊22獲取第一通道脈沖響應(yīng)的反向脈沖序列;并獲取反向脈沖序列與每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)。
可選地,確定模塊23具體用于獲取絕對值最大的相關(guān)系數(shù)中的第一元素,并根據(jù)第一元素確定聲源的位置;其中,第一元素為絕對值最大的相關(guān)系數(shù)中數(shù)值最大的元素。
可選地,獲取模塊21具體用于根據(jù)公式計(jì)算第一通道脈沖響應(yīng)其中,S(jω)=FFT(s(t)),R(jω)=FFT(r(t)),r(t)為拾音器接收到的音頻信號,s(t)為聲源發(fā)出的音頻信號,t為聲源發(fā)出的音頻信號的持續(xù)時(shí)間。
可選地,處理模塊22獲取第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù),包括:處理模塊22根據(jù)公式獲取反向脈沖序列并根據(jù)公式獲取相關(guān)系數(shù)x(l,i);其中,為通道脈沖響應(yīng)反向處理函數(shù),hi(t)為第二通道脈沖響應(yīng),i表示第二通道脈沖響應(yīng)對應(yīng)的區(qū)域的編號,且i為大于或者等于1的正整數(shù),l=1,2...2t-1。
可選地,確定模塊23具體用于根據(jù)公式p(i)=max(x(l,i))獲取絕對值 最大的相關(guān)系數(shù)p(i);根據(jù)公式c=max(p(i))確定聲源的位置c。
本實(shí)施例的裝置,可以用于執(zhí)行圖4-圖6所示的任一方法實(shí)施例的技術(shù)方案,其實(shí)現(xiàn)原理和技術(shù)效果類似,此處不再贅述。
圖8為本發(fā)明實(shí)施例五提供的聲源定位設(shè)備的結(jié)構(gòu)示意圖。如圖8所示,該聲源定位設(shè)備包括處理器31、聲卡32和拾音器33。處理器31用于根據(jù)聲源發(fā)出的音頻信號和拾音器33接收到的音頻信號,獲取第一通道脈沖響應(yīng);其中,第一通道脈沖響應(yīng)為聲源與拾音器之間的通道脈沖響應(yīng);獲取第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù);其中,模板庫中包括待定位空間中每個(gè)區(qū)域?qū)?yīng)的第二通道脈沖響應(yīng),第二通道脈沖響應(yīng)為區(qū)域的測點(diǎn)與拾音器之間的通道脈沖響應(yīng),相關(guān)系數(shù)表示第一通道脈沖響應(yīng)和第二通道脈沖響應(yīng)之間的相似度;根據(jù)絕對值最大的相關(guān)系數(shù)確定聲源的位置。聲卡32用于將聲源發(fā)出的音頻信號和拾音器33接收到的音頻信號分別轉(zhuǎn)換為數(shù)字信號。拾音器33用于接收音頻信號。
可選地,處理器31可以是一個(gè)通用處理器,也可以是專用集成電路(application specific integrated circuit,ASIC)或數(shù)字信號處理器(digital signal processing,簡稱DSP)。
本實(shí)施例的聲源定位設(shè)備,可以用于執(zhí)行圖4所示方法實(shí)施例的技術(shù)方案,其實(shí)現(xiàn)原理和技術(shù)效果類似,此處不再贅述。
可選地,該定位設(shè)備還可以包括收發(fā)器34和存儲器35,收發(fā)器34與處理器31耦合,收發(fā)器34可以是發(fā)射器,接收器或其組合,用于箱其它設(shè)備發(fā)送數(shù)據(jù)或接收其它設(shè)備發(fā)送的數(shù)據(jù)。存儲器35可為非瞬時(shí)性的存儲介質(zhì),與處理器31相耦合,用于保存模板庫和不同類型的數(shù)據(jù)。存儲器35可包含只讀存儲器(read only memory,ROM),隨機(jī)存取存儲器(random access memory,RAM)或者可存儲信息和指令的其他類型的動態(tài)存儲設(shè)備,也可以是磁盤存儲器。存儲器504可用于保存實(shí)現(xiàn)圖4、圖5或圖6所述相關(guān)方法的指令。
可選地,處理器31還用于將待定位空間劃分為多個(gè)區(qū)域,并為每個(gè)區(qū)域設(shè)置一個(gè)測點(diǎn);并根據(jù)每個(gè)測點(diǎn)與拾音器之間的通道脈沖響應(yīng)生成模板庫。
可選地,處理器31獲取第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù),包括:處理器31獲取第一通道脈沖響應(yīng)的反向脈沖 序列;獲取反向脈沖序列與每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù)。
可選地,處理器31根據(jù)絕對值最大的相關(guān)系數(shù)確定聲源的位置,包括:處理器31獲取絕對值最大的相關(guān)系數(shù)中的第一元素,并根據(jù)第一元素確定聲源的位置;其中,第一元素為絕對值最大的相關(guān)系數(shù)中數(shù)值最大的元素。
可選地,處理器31根據(jù)聲源發(fā)出的音頻信號和拾音器接收到的音頻信號,獲取第一通道脈沖響應(yīng),包括:處理器31根據(jù)公式計(jì)算第一通道脈沖響應(yīng)其中,S(jω)=FFT(s(t)),R(jω)=FFT(r(t)),r(t)為拾音器接收到的音頻信號,s(t)為聲源發(fā)出的音頻信號,t為聲源發(fā)出的音頻信號的持續(xù)時(shí)間。
可選地,處理器31獲取第一通道脈沖響應(yīng)和模板庫中的每個(gè)第二通道脈沖響應(yīng)之間的相關(guān)系數(shù),包括:處理器31根據(jù)公式獲取反向脈沖序列并根據(jù)公式獲取相關(guān)系數(shù)x(l,i);其中,為通道脈沖響應(yīng)反向處理函數(shù),hi(t)為第二通道脈沖響應(yīng),i表示第二通道脈沖響應(yīng)對應(yīng)的區(qū)域的編號,且i為大于或者等于1的正整數(shù),l=1,2...2t-1。
可選地,處理器31根據(jù)絕對值最大的相關(guān)系數(shù)確定聲源的位置,包括:處理器31根據(jù)公式p(i)=max(x(l,i))獲取絕對值最大的相關(guān)系數(shù)p(i);并根據(jù)公式c=max(p(i))確定聲源的位置c。
本實(shí)施例的聲源定位設(shè)備,可以用于執(zhí)行圖4-圖6所示的任一方法實(shí)施例的技術(shù)方案,其實(shí)現(xiàn)原理和技術(shù)效果類似,此處不再贅述。
本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述各方法實(shí)施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成。前述的程序可以存儲于一計(jì)算機(jī)可讀取存儲介質(zhì)中。該程序在執(zhí)行時(shí),執(zhí)行包括上述各方法實(shí)施例的步驟;而前述的存儲介質(zhì)包括:只讀存儲器(Read-Only Memory,簡稱ROM)、隨機(jī)存取存儲器(random access memory,簡稱RAM)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
最后應(yīng)說明的是:以上各實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對 其限制;盡管參照前述各實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍。