0。存儲設(shè)備230包括被配置來與數(shù)據(jù)庫234交互的應(yīng)用程序232。
[0030]揚(yáng)聲器130被配置來重現(xiàn)音頻流,如多通道音頻流,其由與手勢系統(tǒng)100整合或耦接至手勢系統(tǒng)100的電子設(shè)備加以輸出。例如并且無限制地,揚(yáng)聲器130可包括兩個或更多個揚(yáng)聲器,所述揚(yáng)聲器能夠在聲音空間內(nèi)的特定位置處呈現(xiàn)音頻流中所包括的音頻事件(例如,語音、通知、音樂、導(dǎo)航方向等)。在一些實(shí)施方案中,多個揚(yáng)聲器分布在環(huán)境(例如,車廂)內(nèi),以便在聲音空間中的特定位置處呈現(xiàn)音頻事件。在相同或其它實(shí)施方案中,音頻信號處理技術(shù)可以用來使用兩個或更多個揚(yáng)聲器在聲音空間中的特定位置處虛擬地呈現(xiàn)音頻事件。
[0031]處理單元210可包括中央處理單元(CPU)、數(shù)字信號處理單元(DSP)等。在各種實(shí)施方案中,處理單元210被配置來分析由傳感器140所獲取的傳感器數(shù)據(jù),以便檢測用戶手勢和/或確定用戶相對于車輛環(huán)境的位置和/或方位。另外,處理單元210可以被配置來修改與由手勢系統(tǒng)100輸出到揚(yáng)聲器130的音頻流相關(guān)聯(lián)的空間音頻參數(shù)。例如并且無限制地,處理單元210可以執(zhí)行應(yīng)用程序232,所述應(yīng)用程序處理音頻流中所包括的一個或多個音頻事件,以便在由揚(yáng)聲器130所產(chǎn)生的聲音空間中的特定位置處呈現(xiàn)音頻事件。
[0032]在各種實(shí)施方案中,處理單元210對傳感器140所獲取的數(shù)據(jù)進(jìn)行分析,以便檢測用戶已經(jīng)做出的一個或多個手勢。然后,響應(yīng)于檢測到手勢,處理單元210修改手勢系統(tǒng)100正在重現(xiàn)的音頻流的空間音頻參數(shù)。例如并且無限制地,處理單元210可以修改空間音頻參數(shù),以便修改聲音空間內(nèi)的音頻事件的感知位置。在一些實(shí)施方案中,處理單元210基于雙耳線索(例如,耳間時差、耳間強(qiáng)度差)、頻譜線索、動態(tài)范圍線索、頭部相關(guān)的轉(zhuǎn)移功能(例如,描述聲波如何與聽者身體交互的空間濾波器)、回響等來修改音頻流的空間音頻參數(shù)。例如并且無限制地,處理單元210可以基于與用戶耳朵、耳道和/或頭部的形狀相關(guān)聯(lián)的一個或多個參數(shù)來處理音頻流,以便增加重現(xiàn)音頻事件的角度分辨率。在相同或其它實(shí)施方案中,處理單元210通過修改以下來修改音頻流的空間音頻參數(shù):哪些揚(yáng)聲器130正在重現(xiàn)音頻事件,和/或由揚(yáng)聲器130中的一個或多個揚(yáng)聲器重現(xiàn)音頻事件的級別。例如并且無限制地,處理單元210可以通過增加和/或降低某些揚(yáng)聲器130正在重現(xiàn)音頻事件的級別,以便修改聲音空間內(nèi)的音頻事件的感知位置。在一些實(shí)施方案中,音頻信號處理由處理單元210通過如OpenAL的中間件加以執(zhí)行。
[0033]I/O設(shè)備220可包括輸入設(shè)備、輸出設(shè)備以及能夠接收輸入并提供輸出的設(shè)備。例如并且無限制地,I/o設(shè)備220可包括有線和/或無線通信設(shè)備,其發(fā)送數(shù)據(jù)到手勢系統(tǒng)100中所包括的傳感器140和/或耦接至手勢系統(tǒng)100的揚(yáng)聲器130,和/或從傳感器140和/或揚(yáng)聲器130接收數(shù)據(jù)。此外,在一些實(shí)施方案中,I/O設(shè)備220包括一個或多個有線或無線通信設(shè)備,其接收(例如,通過網(wǎng)絡(luò),如局域網(wǎng)和/或互聯(lián)網(wǎng)來接收)將由揚(yáng)聲器130所重現(xiàn)的音頻流。另外,如下文結(jié)合圖7A和圖7B進(jìn)一步詳細(xì)描述的,I/O設(shè)備220可包括立體顯示器,所述立體顯示器使得用戶能夠查看并修改聲音空間內(nèi)正在重現(xiàn)音頻事件的位置。
[0034]存儲單元230可包括存儲模塊或存儲模塊的集合。存儲單元230內(nèi)的軟件應(yīng)用程序232可以由處理單元210執(zhí)行來實(shí)現(xiàn)計算設(shè)備200的整體功能,并且因此將手勢系統(tǒng)100的操作進(jìn)行總體協(xié)調(diào)。數(shù)據(jù)庫234可以存儲數(shù)字信號處理算法、音頻流、手勢辨別數(shù)據(jù)、立體顯示器數(shù)據(jù)等。
[0035]計算設(shè)備200總體上可以是微處理器、特殊應(yīng)用集成電路(ASIC)、系統(tǒng)級芯片(SoC)、如平板計算機(jī)或手機(jī)的移動計算設(shè)備、媒體播放器等。一般來說,計算設(shè)備200可以被配置來協(xié)調(diào)手勢系統(tǒng)100的整體操作。在其它實(shí)施方案中,計算設(shè)備200可以耦接至手勢系統(tǒng)100但與手勢系統(tǒng)100分開。在這類實(shí)施方案中,手勢系統(tǒng)100可包括單獨(dú)的處理器,它從計算設(shè)備200接收數(shù)據(jù)(音頻流)并傳輸數(shù)據(jù)(傳感器數(shù)據(jù))到計算設(shè)備200,所述計算設(shè)備200可包括在消費(fèi)者電子設(shè)備中,所述消費(fèi)者電子設(shè)備如車輛主機(jī)單元(headunit)、導(dǎo)航系統(tǒng)、智能電話、便攜式媒體播放器、個人計算機(jī)等。然而,本文所公開的實(shí)施方案涵蓋被配置來實(shí)現(xiàn)手勢系統(tǒng)100的功能性的任何技術(shù)上可行的系統(tǒng)。
[0036]圖3示出根據(jù)各種實(shí)施方案的用戶在汽車環(huán)境中與圖1A的手勢系統(tǒng)100交互。如上所述,音頻流中包括的音頻事件可以(例如,通過處理單元210)加以處理,以便在由揚(yáng)聲器130所產(chǎn)生的聲音空間中的特定位置處呈現(xiàn)音頻事件。例如并且無限制地,如圖所示,處理單元210可以修改與環(huán)境音頻源(例如,音樂)和點(diǎn)音頻源(例如,語音電話)相關(guān)聯(lián)的空間音頻參數(shù),以便呈現(xiàn)聲音空間左側(cè)上的環(huán)境音頻源和聲音空間右側(cè)上的點(diǎn)音頻源。盡管圖3中展示五個揚(yáng)聲器130,但是在其它實(shí)施方案中,兩個或更多個揚(yáng)聲器130可以用來在聆聽環(huán)境中產(chǎn)生二維或三維聲音空間。
[0037]如上文所述,手勢系統(tǒng)100檢測由用戶做出的手勢,并且作為響應(yīng)來修改揚(yáng)聲器130所重現(xiàn)的音頻流的一個或多個參數(shù)。在某些實(shí)施方案中,用戶做出一個或多個手勢來選擇性地在聲音空間內(nèi)重新定位一個或多個人員的語音。特定實(shí)例展示于在圖4A至圖4C中,圖中示出根據(jù)各種實(shí)施方案的用戶與圖1A的手勢系統(tǒng)100交互,以便重新定位由通信服務(wù)所生成的音頻事件。
[0038]如圖4A所示,最初(例如,當(dāng)發(fā)起語音電話時),用戶正與之講話的人員的語音可以從聲音空間內(nèi)的類似或相同位置進(jìn)行呈現(xiàn)。然后,用戶可以將他或她的手部移動到與語音相關(guān)聯(lián)的位置,并且與對應(yīng)于每個語音的虛擬對象交互,以便使語音在聲音空間內(nèi)重新定位。例如并且無限制地,如圖4B和圖4C所示,用戶可以通過在聲音空間內(nèi)將他或她的手部移動到左邊或右邊和/或向上移動、向下移動、向前移動或向后移動(例如,在二維X、Y平面內(nèi),或三維平面X、Y、Z空間內(nèi)移動)以便與虛擬對象交互,從而重新定位音頻事件。然后,通過由傳感器140所獲取的并且傳遞給處理單元210的數(shù)據(jù)來確定手部手勢和虛擬對象的新位置。作為響應(yīng),處理單元210修改與音頻事件相關(guān)聯(lián)的一個或多個參數(shù),以使得用戶感知定位于新位置(例如,多個明顯不同的點(diǎn)音頻源)處的語音。因此,手勢系統(tǒng)100可以精確地模擬實(shí)時對話,其中多個人員相對于用戶位于不同的位置處,從而使得用戶能夠更加容易地區(qū)分多個語音。
[0039]處理單元210被配置來使用各種技術(shù)確定用戶是否正在嘗試重新定位音頻事件。在一種技術(shù)中,處理單元210跟蹤與音頻事件相關(guān)聯(lián)的第一虛擬對象的位置(例如,三維空間內(nèi)的坐標(biāo)),并且確定(例如,通過傳感器140)與用戶手指、手部和/或手臂相關(guān)聯(lián)的第二虛擬對象何時與第一虛擬對象交互(例如,抓取)。然后,處理單元210實(shí)現(xiàn)物理模型,以便基于與第二虛擬對象的交互來確定第一虛擬對象的新位置。例如并且無限制地,在一些實(shí)施方案中,處理單元210檢測用戶手部的位置,以便確定用戶何時已經(jīng)抓取、推動、拖拉、滑動與音頻事件相關(guān)聯(lián)的虛擬對象等。然后,處理單元210實(shí)現(xiàn)物理模型,以便(例如,基于抓取、推動、拖拉和/或滑動的速度、距離和/或持續(xù)時間)確定音頻事件的新位置。然后,可以修改音頻流的一個或多個參數(shù),以使得用戶感知位于新位置處的音頻事件。
[0040]在一些實(shí)施方案中,用戶將他或她的手部移動到聲音空間內(nèi)與音頻事件的感知位置(例如,點(diǎn)音頻源)相關(guān)聯(lián)的位置,并且做出抓取手勢來抓取對應(yīng)于音頻事件的虛擬對象。然后,在用戶做出抓取手勢時,用戶將音頻事件移動到預(yù)期位置(例如,如圖4B和圖4C所示)。作為響應(yīng),處理單元210修改與音頻流相關(guān)聯(lián)的一個或多個參數(shù)(例如,空間音頻參數(shù)),以使得用戶感知從相對于用戶的所需角度和/或距離呈現(xiàn)的音頻事件。
[0041]另外,用戶可以使用如滑動手勢的其它類型的手勢來重新定位音頻事件,如圖5A至圖5E所示,圖中示出根據(jù)各種實(shí)施方案的用戶與虛擬對象交互,以便重新定位音頻事件。為了解釋的清晰性,圖5A至圖5E包括與某些音頻事件(例如,環(huán)境音樂和語音電話)相關(guān)聯(lián)的虛擬對象的視覺表示。然而,在一些實(shí)施方案中,這些視覺表示對于手勢系統(tǒng)100的用戶是不可見的。
[0042]如圖5A和圖5B所示,在用戶聆聽由媒體播放器所生成的環(huán)境音頻源(例如,使用兩個或更多個揚(yáng)聲器130在用戶四周呈現(xiàn)的音樂)時,用戶可以從通信服務(wù)接收撥入電話的通知。然后,用戶可以選擇將與音樂相關(guān)聯(lián)的虛擬對象滑動到聲音空間的左側(cè),如圖5C和圖所示。作為響應(yīng),處理單元210跟蹤用戶手部的位置,并且任選地實(shí)現(xiàn)物理模型,以便基于滑動手勢的速度、距離和/或持續(xù)時間來確定與音樂相關(guān)聯(lián)的虛擬對象的新位置。在一些實(shí)施方案中,處理單元210分析從傳感器140所接收的數(shù)據(jù),以便確定滑動手勢發(fā)起的地方和/或手勢結(jié)束的地方。然后,處理單元210基于虛擬對象的新位置來修改環(huán)境音頻源的一個或多個參數(shù)(例如,聲音平衡和/或方向),以便