專(zhuān)利名稱(chēng):用于再現(xiàn)三維聲音的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本申請(qǐng)涉及一種用于再現(xiàn)立體聲的方法和設(shè)備,更具體地講,涉及一種用于再現(xiàn)將遠(yuǎn)近感(perspective)提供給聲音對(duì)象的立體聲的方法和設(shè)備。
背景技術(shù):
由于成像技術(shù)的發(fā)展,用戶(hù)可觀看3D立體圖像。3D立體圖像考慮雙目視差而將左視點(diǎn)圖像數(shù)據(jù)暴露給左眼并將右視點(diǎn)圖像數(shù)據(jù)暴露給右眼。用戶(hù)可通過(guò)3D圖像技術(shù)識(shí)別看起來(lái)從屏幕真實(shí)跳出或向著屏幕的背面真實(shí)進(jìn)入的對(duì)象。此外,隨著成像技術(shù)的發(fā)展,用戶(hù)對(duì)聲音的興趣增加,具體地講,立體聲已得到明顯發(fā)展。在立體聲技術(shù)中,多個(gè)揚(yáng)聲器被布置在用戶(hù)周?chē)?,使得用?hù)可體驗(yàn)不同位置處的定 位和遠(yuǎn)近感。然而,在立體聲技術(shù)中,接近用戶(hù)或變得離用戶(hù)更遠(yuǎn)的圖像對(duì)象可能不能被有效表現(xiàn)出,使得可能不能提供與3D圖像對(duì)應(yīng)的音效。
圖I是根據(jù)本發(fā)明的實(shí)施例的用于再現(xiàn)立體聲的設(shè)備的框圖;圖2是根據(jù)本發(fā)明的實(shí)施例的圖I的聲音深度信息獲取單元的框圖;圖3是根據(jù)本發(fā)明的另一實(shí)施例的圖I的聲音深度信息獲取單元的框圖;圖4是示出根據(jù)本發(fā)明的實(shí)施例的用于在確定單元中確定聲音深度值的預(yù)定函數(shù)的曲線(xiàn)圖;圖5是根據(jù)本發(fā)明的實(shí)施例的使用立體聲信號(hào)提供立體聲的遠(yuǎn)近感提供單元的框圖;圖6A至圖6D示出根據(jù)本發(fā)明的實(shí)施例的在圖I的用于再現(xiàn)立體聲的設(shè)備中提供立體聲的過(guò)程;圖7是示出根據(jù)本發(fā)明的實(shí)施例的基于聲音信號(hào)來(lái)檢測(cè)聲音對(duì)象的位置的方法的流程圖;圖8A至圖8D示出根據(jù)本發(fā)明的實(shí)施例的從聲音信號(hào)檢測(cè)聲音對(duì)象的位置;圖9是示出根據(jù)本發(fā)明的實(shí)施例的再現(xiàn)立體聲的方法的流程圖。
發(fā)明內(nèi)容
本發(fā)明提供了一種用于有效地再現(xiàn)立體聲的方法和設(shè)備,具體地講,提供了一種通過(guò)將遠(yuǎn)近感提供給聲音對(duì)象來(lái)有效地表現(xiàn)接近用戶(hù)或變得離用戶(hù)更遠(yuǎn)的聲音而再現(xiàn)立體聲的方法和設(shè)備。根據(jù)本發(fā)明的一方面,提供了一種再現(xiàn)立體聲的方法,所述方法包括獲取指示圖像信號(hào)中的至少一個(gè)圖像對(duì)象與參考位置之間的距離的圖像深度信息;基于圖像深度信息,獲取指不聲音信號(hào)中的至少一個(gè)聲音對(duì)象與參考位置之間的距離的聲音深度信息;基于聲音深度信息,將聲音遠(yuǎn)近感提供給所述至少一個(gè)聲音對(duì)象。
獲取聲音深度信息的步驟包括獲取組成圖像信號(hào)的每個(gè)圖像片段的最大深度值;基于所述最大深度值,獲取用于所述至少一個(gè)聲音對(duì)象的聲音深度值。獲取聲音 深度值的步驟包括當(dāng)所述最大深度值小于第一閾值時(shí),將所述聲音深度值確定為最小值,當(dāng)所述最大深度值等于或大于第二閾值時(shí),將所述聲音深度值確定為最大值。獲取聲音深度值的步驟還包括當(dāng)所述最大深度值等于或大于第一閾值且小于第二閾值時(shí),將所述聲音深度值確定為與所述最大深度值成比例。獲取聲音深度信息的步驟包括獲取關(guān)于圖像信號(hào)中的所述至少一個(gè)圖像對(duì)象的位置信息以及關(guān)于聲音信號(hào)中的所述至少一個(gè)聲音對(duì)象的位置信息;確定所述至少一個(gè)圖像對(duì)象的位置是否與所述至少一個(gè)聲音對(duì)象的位置匹配;基于確定的結(jié)果來(lái)獲取聲音深度信息。獲取聲音深度信息的步驟包括獲取組成圖像信號(hào)的每個(gè)圖像片段的平均深度值;基于所述平均深度值,獲取用于所述至少一個(gè)聲音對(duì)象的聲音深度值。獲取聲音深度值的步驟包括當(dāng)所述平均深度值小于第三閾值時(shí),將所述聲音深度值確定為最小值。獲取聲音深度值的步驟包括當(dāng)先前片段中的平均深度值與當(dāng)前片段中的平均深度值之間的差小于第四閾值時(shí),將所述聲音深度值確定為最小值。提供聲音遠(yuǎn)近感的步驟包括基于聲音深度信息來(lái)控制聲音對(duì)象的功率。提供聲音遠(yuǎn)近感的步驟包括基于聲音深度信息,控制按照聲音對(duì)象被反射的方式而產(chǎn)生的反射信號(hào)的增益和延遲時(shí)間。提供聲音遠(yuǎn)近感的步驟包括基于聲音深度信息,控制聲音對(duì)象的低頻段分量的強(qiáng)度。提供聲音遠(yuǎn)近感的步驟包括控制將通過(guò)第一揚(yáng)聲器輸出的聲音對(duì)象的相位與將通過(guò)第二揚(yáng)聲器輸出的聲音對(duì)象的相位之間的差。所述方法還包括通過(guò)左環(huán)繞揚(yáng)聲器和右環(huán)繞揚(yáng)聲器、左前揚(yáng)聲器和右前揚(yáng)聲器中的至少一個(gè),輸出提供有聲音遠(yuǎn)近感的聲音對(duì)象。所述方法還包括通過(guò)使用聲音信號(hào),使相位朝向揚(yáng)聲器的外部。獲取聲音深度信息的步驟包括基于所述至少一個(gè)圖像對(duì)象的中的每一個(gè)的大小,確定用于所述至少一個(gè)聲音對(duì)象的聲音深度值。獲取聲音深度信息的步驟包括基于所述至少一個(gè)圖像對(duì)象的分布,確定用于所述至少一個(gè)聲音對(duì)象的聲音深度值。根據(jù)本發(fā)明的另一方面,提供了一種再現(xiàn)立體聲的設(shè)備,所述設(shè)備包括圖像深度信息獲取單元,用于獲取指示圖像信號(hào)中的至少一個(gè)圖像對(duì)象與參考位置之間的距離的圖像深度信息;聲音深度信息獲取單元,用于基于圖像深度信息,獲取指示聲音信號(hào)中的至少一個(gè)聲音對(duì)象與參考位置之間的距離的聲音深度信息;遠(yuǎn)近感提供單元,用于基于聲音深度信息,將聲音遠(yuǎn)近感提供給所述至少一個(gè)聲音對(duì)象。
具體實(shí)施例方式在下文中,將參照附圖更充分地描述本發(fā)明的一個(gè)或多個(gè)實(shí)施例。
首先,為了方便描述,如下簡(jiǎn)短定義在此使用的術(shù)語(yǔ)。圖像對(duì)象表示包括在圖像信號(hào)中的對(duì)象或諸如人、動(dòng)物、植物等的對(duì)象。聲音對(duì)象表不包括在聲音信號(hào)中的聲音分量。各種聲音對(duì)象可包括在一個(gè)聲音信號(hào)中。例如,在通過(guò)記錄管弦樂(lè)隊(duì)演奏而產(chǎn)生的聲音信號(hào)中,包括有從各種樂(lè)器(諸如吉他、小提琴、雙簧管等)產(chǎn)生的各種聲音對(duì)象。音源是產(chǎn)生聲音對(duì)象的對(duì)象(例如,樂(lè)器或聲帶)。在本說(shuō)明書(shū)中,實(shí)際產(chǎn)生聲音對(duì)象的對(duì)象和識(shí)別用戶(hù)產(chǎn)生聲音對(duì)象的對(duì)象表示音源。例如,當(dāng)在用戶(hù)觀看電影的同時(shí)蘋(píng)果從屏幕被扔向用戶(hù)時(shí),在蘋(píng)果移動(dòng)時(shí)產(chǎn)生的聲音(聲音對(duì)象)可包括在聲音信號(hào)中??赏ㄟ^(guò)記錄當(dāng)蘋(píng)果被扔出時(shí)實(shí)際產(chǎn)生的聲音來(lái)獲得聲音對(duì)象,或者聲音對(duì)象可以是被簡(jiǎn)單再現(xiàn)的預(yù)先記錄的聲音對(duì)象。然而,在每一種情況下,用戶(hù)識(shí)別出蘋(píng)果產(chǎn)生所述聲音對(duì)象,并 且因此,蘋(píng)果可以是如在本說(shuō)明書(shū)中定義的音源。圖像深度信息指示背景與參考位置之間的距離以及對(duì)象與參考位置之間的距離。參考位置可以是輸出圖像的顯示裝置的表面。聲音深度信息指示聲音對(duì)象與參考位置之間的距離。更具體地講,聲音深度信息指示產(chǎn)生聲音對(duì)象的位置(音源的位置)與參考位置之間的距離。如上所述,當(dāng)在用戶(hù)觀看電影的同時(shí)蘋(píng)果從屏幕移向用戶(hù)時(shí),音源和用戶(hù)之間的距離變得接近。為了有效表現(xiàn)蘋(píng)果正在接近,可表現(xiàn)出與圖像對(duì)象對(duì)應(yīng)的聲音對(duì)象的產(chǎn)生位置正逐漸變得更接近于用戶(hù),并且關(guān)于這一點(diǎn)的信息包括在聲音深度信息中。參考位置可根據(jù)音源的位置、揚(yáng)聲器的位置、用戶(hù)的位置等而改變。聲音遠(yuǎn)近感是用戶(hù)關(guān)于聲音對(duì)象體驗(yàn)到的感受之一。用戶(hù)觀看聲音對(duì)象,使得用戶(hù)可識(shí)別產(chǎn)生聲音對(duì)象的位置,即,產(chǎn)生聲音對(duì)象的音源的位置。這里,對(duì)用戶(hù)識(shí)別出的音源與用戶(hù)之間的距離的感受表示聲音遠(yuǎn)近感。圖I是根據(jù)本發(fā)明的實(shí)施例的用于再現(xiàn)立體聲的設(shè)備100的框圖。根據(jù)本發(fā)明的當(dāng)前實(shí)施例的用于再現(xiàn)立體聲的設(shè)備100包括圖像深度信息獲取單元110、聲音深度信息獲取單元120和遠(yuǎn)近感提供單元130。圖像深度信息獲取單元110獲取指示圖像信號(hào)中的至少一個(gè)圖像對(duì)象與參考位置之間的距離的圖像深度信息。圖像深度信息可以是指示組成圖像對(duì)象或背景的像素的深度值的深度圖。聲音深度信息獲取單元120基于圖像深度信息來(lái)獲取指示聲音對(duì)象與參考位置之間的距離的聲音深度信息??纱嬖诙喾N使用圖像深度信息來(lái)產(chǎn)生聲音深度信息的方法,在下文中,將描述兩種產(chǎn)生聲音深度信息的方法。然而,本發(fā)明不限于此。例如,聲音深度信息獲取單元120可獲取用于每個(gè)聲音對(duì)象的聲音深度值。聲音深度信息獲取單元120獲取關(guān)于圖像對(duì)象的位置信息以及關(guān)于聲音對(duì)象的位置信息,并基于位置信息將圖像對(duì)象與聲音對(duì)象進(jìn)行匹配。然后,基于圖像深度信息以及匹配信息,可產(chǎn)生聲音深度信息。將參照?qǐng)D2詳細(xì)描述這樣的示例。作為另一不例,聲音深度信息獲取單兀120可根據(jù)組成聲音信號(hào)的聲音片段來(lái)獲取聲音深度值。聲音信號(hào)包括至少一個(gè)聲音片段。這里,一個(gè)聲音片段中的聲音信號(hào)可具有相同的聲音深度值。也就是說(shuō),在每個(gè)不同的聲音對(duì)象中,可應(yīng)用相同的聲音深度值。聲音深度信息獲取單元120獲取組成圖像信號(hào)的每個(gè)圖像片段的圖像深度值??赏ㄟ^(guò)按幀單元或按場(chǎng)景單元?jiǎng)澐謭D像信號(hào)來(lái)獲得圖像片段。聲音深度信息獲取單元120獲取每個(gè)圖像片段中的代表性深度值(例如,最大深度值、最小深度值或平均深度值)并通過(guò)使用代表性深度值確定與圖像片段對(duì)應(yīng)的聲音片段中的聲音深度值。將參照?qǐng)D3詳細(xì)描述這樣的示例。遠(yuǎn)近感提供單元130基于聲音深度信息對(duì)聲音信號(hào)進(jìn)行處理,使得用戶(hù)可感受聲音遠(yuǎn)近感。遠(yuǎn)近感提供單元130可在與圖像對(duì)象對(duì)應(yīng)的聲音對(duì)象被提取之后根據(jù)每個(gè)聲音對(duì)象來(lái)提供聲音遠(yuǎn)近感、根據(jù)包括在聲音信號(hào)中的每個(gè)聲道提供聲音遠(yuǎn)近感,或者為所有的聲音信號(hào)提供聲音遠(yuǎn)近感。遠(yuǎn)近感提供單元130執(zhí)行以下四個(gè)任務(wù)i)、ii)、iii)和iv)中的至少一個(gè),以便用戶(hù)有效地感受聲音遠(yuǎn)近感。然而,在遠(yuǎn)近感提供單元130中執(zhí)行的四個(gè)任務(wù)僅是示例,本發(fā)明不限于此。i)遠(yuǎn)近感提供單元130基于聲音深度信息調(diào)整聲音對(duì)象的功率。聲音對(duì)象被產(chǎn)生得越接近用戶(hù),聲音對(duì)象的功率增加得越多。
ii)遠(yuǎn)近感提供單元130基于聲音深度信息調(diào)整反射信號(hào)的增益和延遲時(shí)間。用 戶(hù)聽(tīng)到不是由障礙反射的直接聲音信號(hào)以及通過(guò)被障礙反射而產(chǎn)生的反射聲音信號(hào)。反射聲音信號(hào)具有比直接聲音信號(hào)的強(qiáng)度更小的強(qiáng)度,并且與直接聲音信號(hào)相比,通常被延遲了預(yù)定時(shí)間來(lái)接近用戶(hù)。具體地講,當(dāng)聲音對(duì)象被產(chǎn)生得接近用戶(hù)時(shí),反射聲音信號(hào)與直接聲音信號(hào)相比到達(dá)得較晚,并且反射聲音信號(hào)的強(qiáng)度被明顯降低。iii)遠(yuǎn)近感提供單元130基于聲音深度信息調(diào)整聲音對(duì)象的低頻段分量。當(dāng)聲音對(duì)象被產(chǎn)生得接近用戶(hù)時(shí),用戶(hù)可明顯地識(shí)別出低頻段分量。iv)遠(yuǎn)近感提供單元130基于聲音深度信息調(diào)整聲音對(duì)象的相位。隨著將從第一揚(yáng)聲器輸出的聲音對(duì)象的相位和將從第二揚(yáng)聲器輸出的聲音對(duì)象的相位之間的差增加,用戶(hù)識(shí)別出聲音對(duì)象更加接近。將參照?qǐng)D5詳細(xì)描述遠(yuǎn)近感提供單元130的操作。圖2是根據(jù)本發(fā)明的實(shí)施例的圖I的聲音深度信息獲取單元120的框圖。聲音深度信息獲取單元120包括第一位置獲取單元210、第二位置獲取單元220、匹配單元230和確定單元240。第一位置獲取單元210基于圖像深度信息獲取圖像對(duì)象的位置信息。第一位置獲取單元210可僅獲取關(guān)于感測(cè)到圖像信號(hào)中向左方和右方的移動(dòng)或者向前方或后方的移動(dòng)的圖像對(duì)象的位置信息。第一位置獲取單元210基于下面的等式I來(lái)比較關(guān)于連續(xù)圖像幀的深度圖并識(shí)別深度值的改變?cè)黾拥淖鴺?biāo)。[等式I]Diffi =I1 -Im
JJ u A% r x\y在等式I中,i指示幀的編號(hào),x、y指示坐標(biāo)。因此,Iix,y指示在(x,y)坐標(biāo)處的第i幀的深度值。在針對(duì)所有坐標(biāo)計(jì)算了 DIff^y之后,第一位置獲取單元210搜索DIffiM高于閾值的坐標(biāo)。第一位置獲取單元210將與DIffixiy高于閾值的坐標(biāo)對(duì)應(yīng)的圖像對(duì)象確定為其移動(dòng)被感測(cè)到的圖像對(duì)象,并且對(duì)應(yīng)的坐標(biāo)被確定為所述圖像對(duì)象的位置。
第二位置獲取單兀220基于聲音信號(hào)獲取關(guān)于聲音對(duì)象的位置信息??纱嬖诙喾N通過(guò)第二位置獲取單元220獲取關(guān)于聲音對(duì)象的位置信息的方法。例如,第二位置獲取單兀220將主分量和環(huán)境分量與聲首信號(hào)分尚,將主分量與環(huán)境分量比較,從而獲取關(guān)于聲音對(duì)象的位置信息。此外,第二位置獲取單元220比較聲音信號(hào)的每個(gè)聲道的功率,從而獲取關(guān)于聲音對(duì)象的位置信息。在該方法中,聲音對(duì)象的左位置和右位置可被識(shí)別。作為另一示例,第二位置獲取單元220將聲音信號(hào)劃分為多個(gè)片段,在每個(gè)片段中計(jì)算每個(gè)頻段的功率,并基于按照每個(gè)頻段的功率確定公共頻段。在本說(shuō)明書(shū)中,公共頻段表示在相鄰片段中功率高于預(yù)定閾值的公共頻段。例如,在當(dāng)前片段中選擇功率高于“A”的頻段,在先前片段中選擇功率高于“A”的頻段(或者選擇當(dāng)前片段中功率在較高的第五等級(jí)內(nèi)的頻段,在先前片段中選擇先前片段中功率在較高的第五等級(jí)內(nèi)的頻段)。然后,在先前片段和當(dāng)前片段中被共同選擇的頻段被確定為公共頻段。對(duì)高于閾值的頻段的限制在于獲取具有大信號(hào)強(qiáng)度的聲音對(duì)象的位置。因此,具·有小信號(hào)強(qiáng)度的聲音對(duì)象的影響被最小化,并且主要聲音對(duì)象的影響被最大化。由于公共頻段被確定,因此,可確定在先前片段中不存在的新聲音信號(hào)是否在當(dāng)前片段中被產(chǎn)生,或者在先前片段中存在的聲音對(duì)象的特性(例如,產(chǎn)生位置)是否被改變。當(dāng)圖像對(duì)象的位置被改變?yōu)轱@示裝置的深度方向時(shí),與所述圖像對(duì)象對(duì)應(yīng)的聲音對(duì)象的功率被改變。在這種情況下,與所述聲音對(duì)象對(duì)應(yīng)的頻段的功率被改變,因此可通過(guò)檢查每個(gè)頻段中的功率的改變來(lái)識(shí)別沿深度方向的聲音對(duì)象的位置。匹配單元230基于關(guān)于圖像對(duì)象的位置信息以及關(guān)于聲音對(duì)象的位置信息來(lái)確定圖像對(duì)象和深度對(duì)象之間的關(guān)系。匹配單元230在圖像對(duì)象的坐標(biāo)與聲音對(duì)象的坐標(biāo)之間的差在閾值內(nèi)時(shí)確定圖像對(duì)象與聲音對(duì)象匹配。另一方面,匹配單元230在圖像對(duì)象的坐標(biāo)與聲音對(duì)象的坐標(biāo)之間的差高于閾值時(shí)確定圖像對(duì)象與聲音對(duì)象不匹配。確定單元240基于匹配單元230的確定來(lái)確定用于聲音對(duì)象的聲音深度值。例如,在被確定為與圖像對(duì)象匹配的聲音對(duì)象中,根據(jù)圖像對(duì)象的深度值來(lái)確定聲音深度值。在被確定為與圖像對(duì)象不匹配的聲音對(duì)象中,聲音深度值被確定為最小值。當(dāng)聲音深度值被確定為最小值時(shí),遠(yuǎn)近感提供單元130不將聲音遠(yuǎn)近感提供給聲音對(duì)象。當(dāng)圖像對(duì)象和聲音對(duì)象的位置彼此匹配時(shí),確定單元240可在預(yù)定的異常環(huán)境下不將聲音遠(yuǎn)近感提供給聲音對(duì)象。例如,當(dāng)圖像對(duì)象的大小低于閾值時(shí),確定單元240可不將聲音遠(yuǎn)近感提供給與圖像對(duì)象對(duì)應(yīng)的聲音對(duì)象。由于具有非常小尺寸的圖像對(duì)象對(duì)用戶(hù)體驗(yàn)3D效果的影響輕微,因此確定單元240可不將聲音遠(yuǎn)近感提供給對(duì)應(yīng)聲音對(duì)象。圖3是根據(jù)本發(fā)明的另一實(shí)施例的圖I的聲音深度信息獲取單元120的框圖。根據(jù)本發(fā)明的當(dāng)前實(shí)施例的聲音深度信息獲取單元120包括片段深度信息獲取單元310和確定單元320。片段深度信息獲取單元310基于圖像深度信息獲取每個(gè)圖像片段的深度信息。圖像信號(hào)可被劃分為多個(gè)片段。例如,可按照?qǐng)鼍氨晦D(zhuǎn)換的場(chǎng)景單元、按照?qǐng)D像幀單元或者GOP單元來(lái)劃分圖像信號(hào)。片段深度信息獲取單元310獲取與每個(gè)片段對(duì)應(yīng)的圖像深度值。片段深度信息獲取單元310可基于下面的等式2獲取與每個(gè)片段對(duì)應(yīng)的圖像深度值。[等式2]
權(quán)利要求
1.一種再現(xiàn)立體聲的方法,所述方法包括 獲取指示圖像信號(hào)中的至少一個(gè)圖像對(duì)象與參考位置之間的距離的圖像深度信息;基于圖像深度信息,獲取指示聲音信號(hào)中的至少一個(gè)聲音對(duì)象與參考位置之間的距離的聲音深度信息; 基于聲音深度信息,將聲音遠(yuǎn)近感提供給所述至少一個(gè)聲音對(duì)象。
2.如權(quán)利要求I所述的方法,其中,獲取聲音深度信息的步驟包括 獲取組成圖像信號(hào)的每個(gè)圖像片段的最大深度值; 基于所述最大深度值,獲取用于所述至少一個(gè)聲音對(duì)象的聲音深度值。
3.如權(quán)利要求2所述的方法,其中,獲取聲音深度值的步驟包括當(dāng)所述最大深度值小 于第一閾值時(shí),將所述聲音深度值確定為最小值,當(dāng)所述最大深度值等于或大于第二閾值時(shí),將所述聲音深度值確定為最大值。
4.如權(quán)利要求3所述的方法,其中,獲取聲音深度值的步驟還包括當(dāng)所述最大深度值等于或大于第一閾值且小于第二閾值時(shí),將所述聲音深度值確定為與所述最大深度值成比例。
5.如權(quán)利要求I所述的方法,其中,獲取聲音深度信息的步驟包括 獲取關(guān)于圖像信號(hào)中的所述至少一個(gè)圖像對(duì)象的位置信息以及關(guān)于聲音信號(hào)中的所述至少一個(gè)聲音對(duì)象的位置信息; 確定所述至少一個(gè)圖像對(duì)象的位置是否與所述至少一個(gè)聲音對(duì)象的位置匹配; 基于確定的結(jié)果來(lái)獲取聲音深度信息。
6.如權(quán)利要求I所述的方法,其中,獲取聲音深度信息的步驟包括 獲取組成圖像信號(hào)的每個(gè)圖像片段的平均深度值; 基于所述平均深度值,獲取用于所述至少一個(gè)聲音對(duì)象的聲音深度值。
7.如權(quán)利要求6所述的方法,其中,獲取聲音深度值的步驟包括 當(dāng)所述平均深度值小于第三閾值時(shí),將所述聲音深度值確定為最小值。
8.如權(quán)利要求6所述的方法,其中,獲取聲音深度值的步驟包括當(dāng)先前片段中的平均深度值與當(dāng)前片段中的平均深度值之間的差小于第四閾值時(shí),將所述聲音深度值確定為最小值。
9.如權(quán)利要求I所述的方法,其中,提供聲音遠(yuǎn)近感的步驟包括基于聲音深度信息來(lái)控制聲音對(duì)象的功率。
10.如權(quán)利要求I所述的方法,其中,提供聲音遠(yuǎn)近感的步驟包括基于聲音深度信息,控制按照聲音對(duì)象被反射的方式而產(chǎn)生的反射信號(hào)的增益和延遲時(shí)間。
11.如權(quán)利要求I所述的方法,其中,提供聲音遠(yuǎn)近感的步驟包括基于聲音深度信息,控制聲音對(duì)象的低頻段分量的強(qiáng)度。
12.如權(quán)利要求I所述的方法,其中,提供聲音遠(yuǎn)近感的步驟包括控制將通過(guò)第一揚(yáng)聲器輸出的聲音對(duì)象的相位與將通過(guò)第二揚(yáng)聲器輸出的聲音對(duì)象的相位之間的差。
13.如權(quán)利要求I所述的方法,還包括通過(guò)左環(huán)繞揚(yáng)聲器和右環(huán)繞揚(yáng)聲器、左前揚(yáng)聲器和右前揚(yáng)聲器中的至少一個(gè),輸出提供有聲音遠(yuǎn)近感的聲音對(duì)象。
14.如權(quán)利要求I所述的方法,還包括通過(guò)使用聲音信號(hào),使相位朝向揚(yáng)聲器的外部。
15.如權(quán)利要求I所述的方法,其中,獲取聲音深度信息的步驟包括基于所述至少一個(gè)圖像對(duì)象的中的每一個(gè)的大小,確定用于所述至少一個(gè)聲音對(duì)象的聲音深度值。
16.如權(quán)利要求I所述的方法,其中,獲取聲音深度信息的步驟包括基于所述至少一個(gè)圖像對(duì)象的分布,確定用于所述至少一個(gè)聲音對(duì)象的聲音深度值。
17.一種再現(xiàn)立體聲的設(shè)備,所述設(shè)備包括 圖像深度信息獲取單元,用于獲取指示圖像信號(hào)中的至少一個(gè)圖像對(duì)象與參考位置之間的距離的圖像深度信息; 聲音深度信息獲取單元,用于基于圖像深度信息,獲取指示聲音信號(hào)中的至少一個(gè)聲音對(duì)象與參考位置之間的距離的聲音深度信息; 遠(yuǎn)近感提供單元,用于基于聲音深度信息,將聲音遠(yuǎn)近感提供給所述至少一個(gè)聲音對(duì)象。
18.如權(quán)利要求17所述的設(shè)備,其中,聲音深度信息獲取單元獲取組成圖像信號(hào)的每個(gè)圖像片段的最大深度值,并基于所述最大深度值,獲取用于所述至少一個(gè)聲音對(duì)象的聲音深度值。
19.如權(quán)利要求18所述的設(shè)備,其中,當(dāng)所述最大深度值小于第一閾值時(shí),聲音深度信息獲取單元將所述聲音深度值確定為最小值,當(dāng)所述最大深度值等于或大于第二閾值時(shí),聲音深度信息獲取單元將所述聲音深度值確定為最大值。
20.如權(quán)利要求18所述的方法,其中,當(dāng)所述最大深度值等于或大于第一閾值且小于第二閾值時(shí),所述聲音深度值被確定為與所述最大深度值成比例。
21.—種其上包含有用于執(zhí)行權(quán)利要求I至16的方法中的任意一種方法的計(jì)算機(jī)程序的計(jì)算機(jī)可讀記錄介質(zhì)。
全文摘要
公開(kāi)了一種再現(xiàn)立體聲的方法,所述方法包括獲取指示圖像信號(hào)中的至少一個(gè)圖像對(duì)象與參考位置之間的距離的圖像深度信息;基于圖像深度信息,獲取指示聲音信號(hào)中的至少一個(gè)聲音對(duì)象與參考位置之間的距離的聲音深度信息;基于聲音深度信息,將聲音遠(yuǎn)近感提供給所述至少一個(gè)聲音對(duì)象。
文檔編號(hào)H04S1/00GK102812731SQ201180014834
公開(kāi)日2012年12月5日 申請(qǐng)日期2011年3月17日 優(yōu)先權(quán)日2010年3月19日
發(fā)明者趙镕春, 金善民 申請(qǐng)人:三星電子株式會(huì)社