欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

聲場分析系統(tǒng)的制作方法

文檔序號:6168587閱讀:204來源:國知局
聲場分析系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及一種聲場分析系統(tǒng)。在一個實(shí)施例中,通過提取空間角度信息、發(fā)散度信息(并且可選地提取聲音等級信息)來映射聲場。映射所提取的信息以用于以黎曼球體的形式來展示,其中,沿著球體,空間角度在經(jīng)度上變化,發(fā)散度在維度上變化,并且等級在徑向上變化。更一般的映射利用將空間角度和發(fā)散度信息映射到代表性區(qū)域上,以表現(xiàn)在與所提取的空間信息相對應(yīng)的到達(dá)的方向中的變化以及在與所提取的發(fā)散度信息相對應(yīng)的距離中的變化。
【專利說明】聲場分析系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本公開涉及音頻場景,并且更具體地,涉及根據(jù)音頻場景的特征提取。
【背景技術(shù)】
[0002]音頻場景包括多維環(huán)境,其中不同聲音出現(xiàn)在各種時間和位置處。音頻場景的示例可以是會議室、工作室、演奏廳、游戲環(huán)境、餐廳、森林場景、繁忙的街道、或者其中在不同時間和位置處出現(xiàn)聲音的任何室內(nèi)或室外環(huán)境。
[0003]使用方向或者全方向性麥克風(fēng)的陣列或者其他方式,音頻場景可以被記錄為音頻數(shù)據(jù)。在用于音頻場景的典型捕獲布置中,N個記錄設(shè)備放置在音頻空間內(nèi)以記錄音頻場景。所捕獲的信號隨后可選地被處理并且被發(fā)送到終端用戶或者應(yīng)用可以根據(jù)各種處置(rendering)算法來選擇的處置側(cè)(或者可替選地被存儲用于稍后的耗用),其中,基于來自重構(gòu)的音頻空間的偏好,處置算法可能影響傾聽點(diǎn)和/或音頻信息的朝向和特性。處置方隨后根據(jù)與所期望和選擇的、源聲場的感知表現(xiàn)相對應(yīng)的多個記錄來提供經(jīng)處理的信號。記錄設(shè)備可以是具有音頻靈敏度的方向性特性的麥克風(fēng),但是可以利用其他類型的具有任何形式的適當(dāng)特性的麥克風(fēng)。此外,所利用的多個麥克風(fēng)可以不必是等效的甚至不必是相似的,并且可以使用具有不同空間和/或頻率特性的麥克風(fēng)。經(jīng)處置或者處理的輸出信號可以是單、立體、或雙耳信號,或者其可以包括多個信道。

【發(fā)明內(nèi)容】

[0004]如本文所述,一種用于創(chuàng)建對聲場的空間音頻場景分析的方法包括:響應(yīng)于聲音來生成電信號,根據(jù)電信號提取空間角度信息,根據(jù)電信號提取發(fā)散度信息,以及映射空間角度和發(fā)散度信息以用于以封閉的二維表面或者其更高維突出體的形式來展示,其中該二維表面具有相對于半球的同構(gòu),使得沿著半球或者等價地在該表面上,對象空間角度中的變化在經(jīng)度上展示了變化,并且源的發(fā)散度(以及因而相關(guān)聯(lián)的距離)的變化在緯度上變化,使得更發(fā)散或者更遠(yuǎn)的源收斂到該封閉二維表面中的點(diǎn)。
[0005]而且,如本文所述,一種用于基于響應(yīng)于聲場中的聲音而接收的電信號來映射聲場的系統(tǒng)包括:空間角度提取模塊,其適于提取空間角度信息;發(fā)散度提取模塊,其適于提取發(fā)散度信息;以及映射模塊,其適于以封閉的二維表面或者其更高維突出體的方式來展示空間角度和發(fā)散度信息,其中,該二維表面具有相對于半球的同構(gòu),使得沿著半球或者等價地在該表面上,對象空間角度中的變化在經(jīng)度上展示了的變化,并且源的發(fā)散度(以及因而相關(guān)聯(lián)的距離)的變化在緯度上變化,使得更發(fā)散或者更遠(yuǎn)的源收斂到該封閉二維表面中的點(diǎn)。
[0006]而且,如本文所述,一種系統(tǒng)包括:麥克風(fēng)的陣列,其適于根據(jù)聲場來生成電信號;以及處理器,其響應(yīng)于電信號。處理器適于根據(jù)電信號來提取空間角度信息,根據(jù)電信號來提取發(fā)散度信息,并且映射空間角度和發(fā)散度信息以用于以封閉的二維表面或者其更高維突出體的形式來展示,其中該二維表面具有相對于半球的同構(gòu),使得沿著半球或者等價地在該表面上,對象空間角度中的變化在經(jīng)度上展示了的變化,并且源的發(fā)散度(以及因而相關(guān)聯(lián)的距離)的變化在緯度上變化,使得更發(fā)散或者更遠(yuǎn)的源收斂到該封閉二維表面中的點(diǎn)。
[0007]本文描述的實(shí)施例通常涉及特征空間的映射,其創(chuàng)建了分析和解讀聽覺場景的改進(jìn)的能力??梢哉J(rèn)識到的一些優(yōu)點(diǎn)包括:
[0008]-與其中對象可以潛在地是無窮遠(yuǎn)的自然物理空間映射相反,本文的公開將對象空間映射到封閉的表面。這具有緊湊的優(yōu)點(diǎn)以及允許對離散的可解析對象的數(shù)目的已知約束的優(yōu)點(diǎn)。
[0009]-就簡單的距離度量使得具有相似的預(yù)期實(shí)際不確定性和差異(differentiation)的區(qū)域和距離相等而言,用于對象和觀察結(jié)果的映射和相關(guān)聯(lián)的空間是相對一致的。這避免了需要對于不同空間區(qū)域中的預(yù)測的對象尺寸進(jìn)行特定學(xué)習(xí)。
[0010]-映射避免了任何具有奇異性的點(diǎn),在具有奇異性的點(diǎn)中一個維度隨著另一維度的收斂而變得不確定。特別地,通常在混響室內(nèi)環(huán)境中觀察到的關(guān)系是源的方向隨著源變得更遠(yuǎn)(或者更發(fā)散)而變得更加不確定。通過使該常規(guī)(normal)的奇異性點(diǎn)與具有“北極”或者半球的頂點(diǎn)的區(qū)域相關(guān)聯(lián),在所表現(xiàn)的映射中與角度不確定性一起捕獲了發(fā)散和距離的該關(guān)系。該拓?fù)渥匀坏刂С至嗽诎l(fā)散的或者遠(yuǎn)的對象的情況下角度中的不確定性。
[0011]-與先前的點(diǎn)相關(guān),映射避免了如下的區(qū)域,其中原本會存在由于初始提取的特征中所期望的物理或?qū)嶋H不確定性而出現(xiàn)在觀察結(jié)果中的、所期望的大的不連續(xù)性。特別地,通過將該拓?fù)浞从车狡渲嗅槍h(yuǎn)的源的大的角度變化僅展示為所映射的特征空間中的位置中的小的變化的拓?fù)渲?,避免了在角度在大距離處變得不確定時大的位置變化的觀點(diǎn)。
[0012]-映射允許當(dāng)存在觀察結(jié)果的沖突時(S卩,在并存的源的情況下只可能解析有限個(在給定N個信道時通常是N-1個)的方向),將在這些具有不確定性的時間期間的觀察結(jié)果推離與各個對象觀察結(jié)果相關(guān)聯(lián)的區(qū)域或者從該區(qū)域中聚類出去。
[0013]在所表現(xiàn)的映射是詳細(xì)且非瑣碎的并且是依賴于對初始特征的本性和用于聚類和分析的空間的有用屬性這兩者的知識的同時,對于本領(lǐng)域普通技術(shù)人員而言應(yīng)該顯然的是,以上屬性的集合在任何后續(xù)分析中都是非常有用的。
【專利附圖】

【附圖說明】
[0014]并入本說明書并且構(gòu)成本說明書的一部分的附圖圖示了實(shí)施例的一個或更多個示例,并且與示例實(shí)施例的描述一起服務(wù)于說明實(shí)施例的原理和實(shí)施方式。
[0015]在圖中:
[0016]圖1是聲場捕獲系統(tǒng)的說明圖;
[0017]圖2是示出了用于特征提取和映射處理的處理流程的框圖;
[0018]圖2A是示出了用在一個示例性實(shí)施例中時,水平平面中X-Y信號的八個形狀模式(figure eight patterns)以及全方向性W信道的示意圖;
[0019]圖3是瞬時的對平滑的發(fā)散度的圖表;并且
[0020]圖4至6是示出了按照特定實(shí)施例的、具有聲場對象的所提取的源角度(Θ )、源發(fā)散度(P )和源等級(L)特征的黎曼球體映射的圖?!揪唧w實(shí)施方式】
[0021]在用于根據(jù)緊湊的方向性陣列來執(zhí)行針對音頻場景分析的特征提取的計(jì)算機(jī)、月艮務(wù)器和軟件的系統(tǒng)以及處理的背景中,本文描述了示例實(shí)施例。本領(lǐng)域普通技術(shù)人員會認(rèn)識到以下描述僅僅是示意性的而非意圖以任何方式進(jìn)行限制。其他實(shí)施例會容易地將它們自己暗示給受益于本公開的那些技術(shù)人員。如附圖中所圖示的,現(xiàn)在將作出對示例實(shí)施例的實(shí)施方式的詳細(xì)參考。在可能貫穿圖和以下說明的范圍內(nèi),將對使用相同的參考標(biāo)記來指代相同或相似的項(xiàng)目。
[0022]為了清楚起見,沒有示出和描述本文所述的實(shí)施方式的全部常規(guī)特征。當(dāng)然,要理解的是,在任何實(shí)際的實(shí)施方式的開發(fā)中,必須做出大量特定于實(shí)施方式的決定,以便實(shí)現(xiàn)開發(fā)者的特定目的,諸如符合與應(yīng)用和商業(yè)相關(guān)的規(guī)定,還要理解的是,這些特定目的會根據(jù)實(shí)施方式的不同和開發(fā)者的不同而變化。此外,要理解的是,這樣的開發(fā)努力必然是復(fù)雜而費(fèi)時的,但是盡管如此,對于受益于本公開的本領(lǐng)域普通技術(shù)人員而言依舊是常規(guī)的工程任務(wù)。
[0023]按照本公開,可以使用各種類型的操作系統(tǒng)、計(jì)算平臺、計(jì)算機(jī)程序和/或通用機(jī)器來實(shí)現(xiàn)本文所述的部件、處理步驟和/或數(shù)據(jù)結(jié)構(gòu)。此外,本領(lǐng)域普通技術(shù)人員會認(rèn)識至IJ,在不脫離本文所述的創(chuàng)造性概念的范圍和精神的情況下,也可以使用具有更不通用的本性的設(shè)備(諸如硬線設(shè)備、現(xiàn)場可編程門陣列(FPGA)、特定于應(yīng)用的集成電路(ASIC)等)。在通過計(jì)算機(jī)或者機(jī)器來實(shí)現(xiàn)包括一系列處理步驟的方法并且這些處理步驟可以存儲為一系列機(jī)器可讀的指令的情況下,它們可以存儲在有形介質(zhì)(諸如計(jì)算機(jī)存儲器設(shè)備(例如ROM (只讀存儲器)、PR0M (可編程只讀存儲器)、EEPR0M (電可擦除可編程只讀存儲器)、FLASH存儲器、跳躍驅(qū)動器(Jump Drive)等)、磁存儲介質(zhì)(例如磁帶、磁盤驅(qū)動器等)、光存儲介質(zhì)(例如⑶-ROM (壓縮盤只讀存儲器)、DVD-ROM (數(shù)字多功能盤只讀存儲器)、紙卡、紙帶等)和其他類型的程序存儲器)上。
[0024]術(shù)語“示例性”在本文中使用時意在表示“用作示例、實(shí)例或闡釋”。本文描述為“示例性”的任何實(shí)施例不必理解為優(yōu)選的或者與其他實(shí)施例相比是有利的。
[0025]在為了特定目的或應(yīng)用捕獲音頻信號本身之外處理系統(tǒng)可以在捕獲的點(diǎn)或者更下游處執(zhí)行對展示了聲場的進(jìn)入音頻信號的詳細(xì)分析。本文的布置與特定形式的分析有關(guān),其中已知場景展示了聽覺發(fā)出對象和聲學(xué)環(huán)境。特別地,關(guān)于本文的公開的一個考慮是普通主體在貫穿工作和或休閑的活動的通常經(jīng)歷中一般會遇到的那種聽覺場景的情況。已知這樣的聽覺場景具有特定屬性和特性,其中之一是該場景會包含相區(qū)別的或者被相區(qū)別地感知到的聲音對象。參見Bregman (Bregman, A.S.(1993).Auditory SceneAnalysis:Hearing in Complex Environments.Thinking in Sound:The CognitivePsychology of Human Audition.S.McAdams and E.Bigand.0xford: 10-36.),以類似于人類感知的方式進(jìn)行尋求分析和理解聽覺場景的處理。
[0026]本領(lǐng)域普通技術(shù)人員已知該區(qū)域?yàn)橛?jì)算聽覺場景分析(CASA)。通常執(zhí)行該場景分析,以在對所捕獲的信號的適當(dāng)信號處理的應(yīng)用和控制中進(jìn)行輔助,并且/或者以提取可以具有在某個進(jìn)一步的應(yīng)用領(lǐng)域中所捕獲的音頻的處置和利用的下游的優(yōu)勢的數(shù)據(jù)。場景分析可以附加地用于其他信息的目的,諸如顯示或者法庭風(fēng)格日志(forensic stylelogging)。通常的事實(shí)是,計(jì)算聽覺場景分析被設(shè)計(jì)為利用感知方面的源識別和分組,因?yàn)槠涮峁┝丝梢杂糜诟倪M(jìn)所提取的聽覺場景的穩(wěn)定性和主觀性能的有用的標(biāo)準(zhǔn)、假設(shè)和先驗(yàn)信息的集合。
[0027]因?yàn)槁犛X場景涉及對離散的源、聲學(xué)對象和/或一般背景噪音以及聲學(xué)干擾的展示,具有某個“特征空間”的內(nèi)部展示是有利的,如果不是嚴(yán)格需要的話,其中,來自麥克風(fēng)或時間上的不同點(diǎn)處的多信道信號的觀察結(jié)果和估值可以被放置并適當(dāng)分組到該“特征空間”中。本文的公開是在聽覺場景中的聽覺對象的識別和分離之前的、用于形成該內(nèi)部多維展示的方案。特別地,對于魯棒且實(shí)際的算法,經(jīng)常期望的是具有反應(yīng)與在先問題和所預(yù)期的實(shí)際不確定性有關(guān)的特定拓?fù)浠蛘弑拘韵嚓P(guān)聯(lián)的距離度量的空間。特別地,本文的公開涉及一類從傳統(tǒng)的特征空間映射到修改的多維特征展示的映射,該多維特征展示被發(fā)現(xiàn)高度有利于計(jì)算聽覺場景分析的處理。該空間對于可視化、靜態(tài)分析、觀測結(jié)果聚類和對象識別都是有用的。本文的公開在本性和具體設(shè)計(jì)兩者上涉及特征的具體選擇的兩個特別的創(chuàng)造性方面,并且涉及從簡單特征空間到已發(fā)現(xiàn)在本申請領(lǐng)域非常有效的展示的特別的映射。
[0028]圖1是按照本文所述的特定實(shí)施例的聲場波或系統(tǒng)100的說明圖。聲場捕獲系統(tǒng)100包括耦合到處理設(shè)備104的麥克風(fēng)陣列102。麥克風(fēng)陣列102包括兩個或更多個麥克風(fēng)。在圖1的布置中,使用了三個心形麥克風(fēng)(cardioid microphone)M1、M2和M3。麥克風(fēng)被布置為在直徑約5cm的圓形配置中相隔120度。這樣的示例性布置允許對平面聲場(沒有z分量)的第一階估值。麥克風(fēng)Ml、M2和M3借助于指派為L、R、S的各個信號來根據(jù)音頻場景捕獲大致標(biāo)記為左、右和周圍的音頻信號。
[0029]圖2是示出了用于由處理設(shè)備104執(zhí)行的特征提取和映射處理的處理流程的框圖。由麥克風(fēng)陣列102 (圖1)產(chǎn)生的聲場捕獲被提供給特征提取模塊202。特征映射模塊204接收特征提取模塊的輸出,并且聲場特征映射。在特定實(shí)施例中,所生成的特征映射是封閉的空間,其中,簡單的度量具有相對一致的、由于實(shí)際不確定性導(dǎo)致的方差的,避免了由于所預(yù)期的物理或?qū)嶋H度量不確定性導(dǎo)致的奇異性或者不連續(xù)性,并且支持了由于抵觸的音頻激勵導(dǎo)致的真實(shí)對象觀察結(jié)果和虛擬觀察結(jié)果之間的差異。由處理設(shè)備104執(zhí)行的處理包括映射處理,其中與音頻場景中的一個或更多個對象所提取的角度、發(fā)散度和可選的等級信息為了展示而被映射到作為封閉的盤或者半球凸殼的展示的拓?fù)渲?,以用于展示了方向和發(fā)散度的特征,以及用于另外的特征(特別是音頻活動的功率或者信號等級)的附加維度。用于本文詳述的該映射的一個方案是黎曼球體映射的衍生。在該情況下,信號等級附加地修改觀察結(jié)果的所映射的距原點(diǎn)的半徑,如下所詳述。
[0030]在示例性實(shí)施例中,聲場捕獲是由麥克風(fēng)陣列102的麥克風(fēng)Ml、M2和M3提供給202的輸入信號的函數(shù)。根據(jù)指派為L、R和S的這些輸入信號,特征提取模塊202進(jìn)行操作以提取聲場的瞬時空間特征。包括源角度(Θ )、原發(fā)散度(P )和可選的源等級(L)的這些特征由映射模塊204映射到用作使來自聲場捕獲的空間靜止的音頻對象的方差的均勻性最大化的特征空間上。該意義中的映射意在表示展示的形式,而不一定限定為視覺展示,盡管在特定實(shí)施例中考慮了視覺展示。
[0031]在特定實(shí)施例中,逐幀地(典型地約20ms)分析聲場。對于源角度(Θ ),針對每幀來計(jì)算角度估值。角度估值對應(yīng)于聲場中活躍對象的瞬時或者適當(dāng)估計(jì)的角度。在特定實(shí)施例中,這是聲場中最響亮的對象。在其他實(shí)施例中,這是正在被追蹤的特定對象。所提取的特征和相關(guān)聯(lián)的發(fā)聲對象對應(yīng)于與音頻場景中當(dāng)前正在被追蹤的或者被估計(jì)為活躍的對象相關(guān)的所選擇的區(qū)域。在另外的實(shí)施例中,其也可以包含與靜止和/或發(fā)散的背景噪音的方向性偏差相關(guān)的角度信息,諸如在很多音頻捕捉應(yīng)用中所預(yù)期的。
[0032]對象的發(fā)散度(P )展示了在發(fā)出聲音時(例如在人類講話時)聲場變得發(fā)散的程度。發(fā)散度是房間或者環(huán)境的回聲以及對象源距離麥克風(fēng)陣列的距離的指示符。發(fā)散度或者類似特征可以用許多不同方式來定義或者衍生。這樣的示例包括:
[0033]-評估輸入信號協(xié)方差矩陣的短期估值的特征量,其中,第一特征量與隨后的特征量的比率是直接聲音的強(qiáng)度的指示符,
[0034]-利用給定的一個或多個頻帶中的功率或者信號幅度的梯度,其中,更快的變強(qiáng)或變?nèi)跏歉话l(fā)散或更不起回聲的入射音頻的指示符。
[0035]-利用已知的或者合理建模的源的頻譜特性,其中,更高頻率的衰減與來自源的直接的和隨后的聲音所行進(jìn)的距離相關(guān),
[0036]-利用針對可以是已知的或者良好建模的任何源的等級或者估計(jì)的等級的方面,
[0037]-對互相關(guān)性和自相關(guān)性項(xiàng)之間的各種比率的利用,諸如在起回聲的或者遠(yuǎn)的聲音在任何緊湊的麥克風(fēng)陣列處通常具有較小相關(guān)性的情況下,根據(jù)輸入信道之間的相關(guān)性的簡單度量而得到的利用,
[0038]-利用麥克風(fēng)之間的幅度的區(qū)別作為距離的指示符,例如(Dickins,Kennedy,“On the spatial localization of a wireless transmitter from a multisensorreceiver”,Signal Processing and Communication Systems, 2008.1CSPCS 2008)中所呈現(xiàn)的。
[0039]在結(jié)合如下事實(shí)的情況下其他方式可以是已知的或者通常設(shè)想的:在相關(guān)聯(lián)的真實(shí)聲學(xué)和物理空間中源到麥克風(fēng)陣列的距離的印象可以與到該所選擇的且隨后所映射的特征的單調(diào)關(guān)系相關(guān)聯(lián)。
[0040]作為可以提取的可選特征的等級(L)對應(yīng)于當(dāng)前幀的功率。其可以展示特定角度處的功率,諸如會根據(jù)以特定方向來操縱或者計(jì)算的束而得到的那樣,或者共同入射在麥克風(fēng)陣列上的整個聲場的總功率。
[0041]返回圖2,特征提取模塊202從麥克風(fēng)陣列102的麥克風(fēng)M1、M2和M3接收LRS輸入信號。在特定實(shí)施例中,可以多于三個的所接收的信號使用簡單線性變換矩陣或者等效混合和提取操作來轉(zhuǎn)換為第一階聲場“WXY”格式,其中W指代全方向性(第O階)而X和Y指代八個形狀或者在水平面上彼此垂直的第一階信號,如圖2A中所示。對于本領(lǐng)域普通技術(shù)人員而言應(yīng)該明顯的是,用于輸入信號計(jì)數(shù)、麥克風(fēng)幾何和中間處理格式的許多可能性都有可能適用于特征提取處理。本文所示的基于LRS和WXY的示例性實(shí)施例在其表現(xiàn)的簡易性和在應(yīng)用領(lǐng)域中的實(shí)際價值上都是方便的。應(yīng)用第一階聲場信號WXY作為給用于執(zhí)行如下空間角度估值以及可選的語音等級估值和可選的發(fā)散度估值的特征提取處理的輸入。
[0042]_空間角度估值
[0043]通常,提取空間角度包括生成進(jìn)入信號或者進(jìn)入信號對于信號的子集或者頻率范圍的變形之間的一個或更多個協(xié)方差矩陣,以及分析所生成的協(xié)方差矩陣以提取一個或更多個源的相關(guān)聯(lián)的方向性信息。[0044]讓W(xué)(co,n)、Χ(ω,η)和Υ(ω,η)分別代表頻域的WXY麥克風(fēng)信號,同時ω是規(guī)范化的角度頻率,其中
【權(quán)利要求】
1.一種聲場映射方法,其包括: 響應(yīng)于所述聲場中的聲音來生成電信號; 根據(jù)所述電信號來提取空間角度和發(fā)散度信息;以及 映射所述空間角度和發(fā)散度信息以用于以黎曼球體的形式來展示,其中,沿著所述球體,空間角度在經(jīng)度上變化,并且發(fā)散度在的緯度上變化。
2.根據(jù)權(quán)利要求1所述的方法,其還包括: 根據(jù)所述電信號來提取聲音等級信息,所述映射包括映射所述聲音等級信息以用于以黎曼球體的形式來展示,其中,聲音等級映射到所映射的特征空間中半徑上的單調(diào)變化。
3.根據(jù)權(quán)利要求1所述的方法,其中,所提取的特征對應(yīng)于所述聲場中最響亮的對象。
4.根據(jù)權(quán)利要求1所述的方法,其中,所提取的特征對應(yīng)于與音頻場景中當(dāng)前正在被追蹤的或者被估計(jì)為活躍的對象相關(guān)的、所選擇的區(qū)域。
5.根據(jù)權(quán)利要求1所述的方法,其中,提取空間角度信息包括: 生成在進(jìn)入信號或者進(jìn)入信號對于信號的子集或頻率范圍的變形之間的一個或更多個協(xié)方差矩陣;以及 分析所生成的協(xié)方差矩陣以提取一個或更多個源的相關(guān)聯(lián)的方向性信息。
6.根據(jù)權(quán)利要求5所述的方法,其中,將所述一個或更多個協(xié)方差矩陣遍及時間實(shí)例進(jìn)行過濾以獲得平滑的估值。
7.根據(jù)權(quán)利要求5所述的方法,其中,根據(jù)對協(xié)方差矩陣的主特征值的分析來獲得到達(dá)的角度。
8.根據(jù)權(quán)利要求1所述的方法,其還包括: 根據(jù)電信號來提取聲音等級信息,所述映射包括將到達(dá)的方向和發(fā)散度或距離度量映射到具有隨所述聲音等級單調(diào)變化的半徑的半球。
9.根據(jù)權(quán)利要求8所述的方法,其中,遍及頻帶的范圍或集合來計(jì)算并且或者在時間上平均所述聲音等級。
10.根據(jù)權(quán)利要求8所述的方法,其中,在語音或者所期望的信號活動期間執(zhí)行聲音等級計(jì)算。
11.根據(jù)權(quán)利要求1所述的方法,其中,將所提取的特征映射到使空間靜止的音頻對象的變化的均勻性最大化的特征空間上。
12.—種用于基于響應(yīng)于聲場中的聲音而接收的電信號來映射所述聲場的系統(tǒng),所述系統(tǒng)包括: 空間角度提取模塊,其適于根據(jù)所述聲場來提取空間角度信息; 發(fā)散度提取模塊,其適于根據(jù)所述聲場來提取發(fā)散度信息; 映射模塊,其適于以黎曼球體的形式來展示空間角度和發(fā)散度信息,其中,沿著所述球體,空間角度在經(jīng)度上變化,并且發(fā)散度在維度上變化。
13.根據(jù)權(quán)利要求12所述的系統(tǒng),其還包括: 聲音等級提取模塊,其適于根據(jù)所述聲場來提取聲音等級信息,其中,所述映射模塊還適于映射所述聲音等級信息以用于以黎曼球體的形式來展示,其中,聲音等級映射到所映射的特征空間中半徑上的單調(diào)變化。
14.根據(jù)權(quán)利要求12所述的系統(tǒng),其中,所述空間角度和發(fā)散度信息對象對應(yīng)于音頻場景中最響亮的對象。
15.根據(jù)權(quán)利要求12所述的系統(tǒng),其中,所述空間角度和發(fā)散度信息對應(yīng)于音頻場景中正在被追蹤的對象。
16.根據(jù)權(quán)利要求12所述的系統(tǒng),其中,所述空間角度提取模塊適于生成在進(jìn)入信號或者進(jìn)入信號對于信號的子集或頻率范圍的變形之間的一個或更多個協(xié)方差矩陣,并且適于分析所生成的協(xié)方差矩陣以提取一個或更多個源的相關(guān)聯(lián)的方向性信息。
17.根據(jù)權(quán)利要求16所述的系統(tǒng),其還包括:過濾模塊,其適于將所述一個或更多個協(xié)方差矩陣遍及時間實(shí)例進(jìn)行過濾以獲得平滑的估值。
18.根據(jù)權(quán)利要求16所述的系統(tǒng),其中,所述空間角度提取模塊適于根據(jù)對協(xié)方差矩陣的主特征值的分析來獲得到達(dá)的角度。
19.根據(jù)權(quán)利要求12所述的系統(tǒng),其中,所述黎曼球體展示是在使空間靜止的音頻對象的變化的均勻性最大化的特征空間上的。
20.—種系統(tǒng),其包括: 麥克風(fēng)的陣列,其用于根據(jù)聲場來生成電信號;以及 處理器,其適于: 根據(jù)所述電信號來提取空間角度和發(fā)散度信息;以及 映射所述空間角度和發(fā)散度信息以用于以黎曼球體的形式來展示,其中,沿著所述球體,空間角度在經(jīng)度上變化,并且發(fā)散度在的緯度上變化。
21.根據(jù)權(quán)利要求20所述的系統(tǒng),其中,所述處理器還適于: 根據(jù)所述電信號來提取聲音等級信息,所述映射包括映射所述聲音等級信息以用于以黎曼球體的形式來展示,其中,聲音等級映射到所映射的特征空間中半徑上的單調(diào)變化。
22.根據(jù)權(quán)利要求20所述的系統(tǒng),其中,所述空間角度和發(fā)散度信息對應(yīng)于音頻場景中最響亮的對象。
23.根據(jù)權(quán)利要求20所述的系統(tǒng),其中,所述空間角度和發(fā)散度信息對應(yīng)于與音頻場景中正在被追蹤的對象。
24.根據(jù)權(quán)利要求20所述的系統(tǒng),其中,所述黎曼球體展示是在使空間靜止的音頻對象的變化的均勻性最大化的特征空間上的。
25.一種用于映射音頻場景的方法,其包括: 檢測聲場中的聲音; 響應(yīng)于所述聲音來生成電信號; 根據(jù)所述電信號來提取空間角度和發(fā)散度信息;以及 將所述空間角度和發(fā)散度信息映射到代表性區(qū)域上,以表現(xiàn)在與所提取的空間信息相對應(yīng)的到達(dá)的方向中的變化以及在與所提取的發(fā)散度信息相對應(yīng)的距離中的變化。
26.根據(jù)權(quán)利要求25所述的方法,其還包括:根據(jù)所述電信號來提取聲音等級信息,并且表現(xiàn)沿著所述代表性區(qū)域的維度的聲音等級中的變化。
【文檔編號】G01H11/06GK104019885SQ201310064537
【公開日】2014年9月3日 申請日期:2013年2月28日 優(yōu)先權(quán)日:2013年2月28日
【發(fā)明者】大衛(wèi)·古納萬, 施棟, 格倫·N·迪金森 申請人:杜比實(shí)驗(yàn)室特許公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
子洲县| 衡水市| 武功县| 利津县| 宁蒗| 安图县| 甘南县| 屯门区| 绥滨县| 南川市| 沂水县| 清水县| 赤城县| 牡丹江市| 雷州市| 水城县| 江安县| 高密市| 南昌县| 湖口县| 铜梁县| 峨山| 寿阳县| 来宾市| 车致| 芮城县| 沾化县| 龙陵县| 镇原县| 静海县| 桃园县| 靖远县| 双辽市| 陕西省| 利川市| 加查县| 报价| 会昌县| 渝北区| 南华县| 岳池县|