用于再現(xiàn)三維聲音的方法和設(shè)備的制作方法

文檔序號(hào)：7848638閱讀：270來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>電子通信裝置的制造及其應(yīng)用技術(shù)

專(zhuān)利名稱(chēng)：用于再現(xiàn)三維聲音的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域：
本申請(qǐng)涉及一種用于再現(xiàn)立體聲的方法和設(shè)備，更具體地講，涉及一種用于再現(xiàn)將遠(yuǎn)近感(perspective)提供給聲音對(duì)象的立體聲的方法和設(shè)備。
背景技術(shù)：
由于成像技術(shù)的發(fā)展，用戶(hù)可觀看3D立體圖像。3D立體圖像考慮雙目視差而將左視點(diǎn)圖像數(shù)據(jù)暴露給左眼并將右視點(diǎn)圖像數(shù)據(jù)暴露給右眼。用戶(hù)可通過(guò)3D圖像技術(shù)識(shí)別看起來(lái)從屏幕真實(shí)跳出或向著屏幕的背面真實(shí)進(jìn)入的對(duì)象。此外，隨著成像技術(shù)的發(fā)展，用戶(hù)對(duì)聲音的興趣增加，具體地講，立體聲已得到明顯發(fā)展。在立體聲技術(shù)中，多個(gè)揚(yáng)聲器被布置在用戶(hù)周?chē)?，使得用?hù)可體驗(yàn)不同位置處的定位和遠(yuǎn)近感。然而，在立體聲技術(shù)中，接近用戶(hù)或變得離用戶(hù)更遠(yuǎn)的圖像對(duì)象可能不能被有效表現(xiàn)出，使得可能不能提供與3D圖像對(duì)應(yīng)的音效。

圖I是根據(jù)本發(fā)明的實(shí)施例的用于再現(xiàn)立體聲的設(shè)備的框圖；圖2是根據(jù)本發(fā)明的實(shí)施例的圖I的聲音深度信息獲取單元的框圖；圖3是根據(jù)本發(fā)明的另一實(shí)施例的圖I的聲音深度信息獲取單元的框圖；圖4是示出根據(jù)本發(fā)明的實(shí)施例的用于在確定單元中確定聲音深度值的預(yù)定函數(shù)的曲線(xiàn)圖；圖5是根據(jù)本發(fā)明的實(shí)施例的使用立體聲信號(hào)提供立體聲的遠(yuǎn)近感提供單元的框圖；圖6A至圖6D示出根據(jù)本發(fā)明的實(shí)施例的在圖I的用于再現(xiàn)立體聲的設(shè)備中提供立體聲的過(guò)程；圖7是示出根據(jù)本發(fā)明的實(shí)施例的基于聲音信號(hào)來(lái)檢測(cè)聲音對(duì)象的位置的方法的流程圖；圖8A至圖8D示出根據(jù)本發(fā)明的實(shí)施例的從聲音信號(hào)檢測(cè)聲音對(duì)象的位置；圖9是示出根據(jù)本發(fā)明的實(shí)施例的再現(xiàn)立體聲的方法的流程圖。

發(fā)明內(nèi)容
本發(fā)明提供了一種用于有效地再現(xiàn)立體聲的方法和設(shè)備，具體地講，提供了一種通過(guò)將遠(yuǎn)近感提供給聲音對(duì)象來(lái)有效地表現(xiàn)接近用戶(hù)或變得離用戶(hù)更遠(yuǎn)的聲音而再現(xiàn)立體聲的方法和設(shè)備。根據(jù)本發(fā)明的一方面，提供了一種再現(xiàn)立體聲的方法，所述方法包括獲取指示圖像信號(hào)中的至少一個(gè)圖像對(duì)象與參考位置之間的距離的圖像深度信息；基于圖像深度信息，獲取指不聲音信號(hào)中的至少一個(gè)聲音對(duì)象與參考位置之間的距離的聲音深度信息；基于聲音深度信息，將聲音遠(yuǎn)近感提供給所述至少一個(gè)聲音對(duì)象。
獲取聲音深度信息的步驟包括獲取組成圖像信號(hào)的每個(gè)圖像片段的最大深度值；基于所述最大深度值，獲取用于所述至少一個(gè)聲音對(duì)象的聲音深度值。獲取聲音深度值的步驟包括當(dāng)所述最大深度值小于第一閾值時(shí)，將所述聲音深度值確定為最小值，當(dāng)所述最大深度值等于或大于第二閾值時(shí)，將所述聲音深度值確定為最大值。獲取聲音深度值的步驟還包括當(dāng)所述最大深度值等于或大于第一閾值且小于第二閾值時(shí)，將所述聲音深度值確定為與所述最大深度值成比例。獲取聲音深度信息的步驟包括獲取關(guān)于圖像信號(hào)中的所述至少一個(gè)圖像對(duì)象的位置信息以及關(guān)于聲音信號(hào)中的所述至少一個(gè)聲音對(duì)象的位置信息；確定所述至少一個(gè)圖像對(duì)象的位置是否與所述至少一個(gè)聲音對(duì)象的位置匹配；基于確定的結(jié)果來(lái)獲取聲音深度信息。獲取聲音深度信息的步驟包括獲取組成圖像信號(hào)的每個(gè)圖像片段的平均深度值；基于所述平均深度值，獲取用于所述至少一個(gè)聲音對(duì)象的聲音深度值。獲取聲音深度值的步驟包括當(dāng)所述平均深度值小于第三閾值時(shí)，將所述聲音深度值確定為最小值。獲取聲音深度值的步驟包括當(dāng)先前片段中的平均深度值與當(dāng)前片段中的平均深度值之間的差小于第四閾值時(shí)，將所述聲音深度值確定為最小值。提供聲音遠(yuǎn)近感的步驟包括基于聲音深度信息來(lái)控制聲音對(duì)象的功率。提供聲音遠(yuǎn)近感的步驟包括基于聲音深度信息，控制按照聲音對(duì)象被反射的方式而產(chǎn)生的反射信號(hào)的增益和延遲時(shí)間。提供聲音遠(yuǎn)近感的步驟包括基于聲音深度信息，控制聲音對(duì)象的低頻段分量的強(qiáng)度。提供聲音遠(yuǎn)近感的步驟包括控制將通過(guò)第一揚(yáng)聲器輸出的聲音對(duì)象的相位與將通過(guò)第二揚(yáng)聲器輸出的聲音對(duì)象的相位之間的差。所述方法還包括通過(guò)左環(huán)繞揚(yáng)聲器和右環(huán)繞揚(yáng)聲器、左前揚(yáng)聲器和右前揚(yáng)聲器中的至少一個(gè)，輸出提供有聲音遠(yuǎn)近感的聲音對(duì)象。所述方法還包括通過(guò)使用聲音信號(hào)，使相位朝向揚(yáng)聲器的外部。獲取聲音深度信息的步驟包括基于所述至少一個(gè)圖像對(duì)象的中的每一個(gè)的大小，確定用于所述至少一個(gè)聲音對(duì)象的聲音深度值。獲取聲音深度信息的步驟包括基于所述至少一個(gè)圖像對(duì)象的分布，確定用于所述至少一個(gè)聲音對(duì)象的聲音深度值。根據(jù)本發(fā)明的另一方面，提供了一種再現(xiàn)立體聲的設(shè)備，所述設(shè)備包括圖像深度信息獲取單元，用于獲取指示圖像信號(hào)中的至少一個(gè)圖像對(duì)象與參考位置之間的距離的圖像深度信息；聲音深度信息獲取單元，用于基于圖像深度信息，獲取指示聲音信號(hào)中的至少一個(gè)聲音對(duì)象與參考位置之間的距離的聲音深度信息；遠(yuǎn)近感提供單元，用于基于聲音深度信息，將聲音遠(yuǎn)近感提供給所述至少一個(gè)聲音對(duì)象。
具體實(shí)施例方式在下文中，將參照附圖更充分地描述本發(fā)明的一個(gè)或多個(gè)實(shí)施例。
首先，為了方便描述，如下簡(jiǎn)短定義在此使用的術(shù)語(yǔ)。圖像對(duì)象表示包括在圖像信號(hào)中的對(duì)象或諸如人、動(dòng)物、植物等的對(duì)象。聲音對(duì)象表不包括在聲音信號(hào)中的聲音分量。各種聲音對(duì)象可包括在一個(gè)聲音信號(hào)中。例如，在通過(guò)記錄管弦樂(lè)隊(duì)演奏而產(chǎn)生的聲音信號(hào)中，包括有從各種樂(lè)器(諸如吉他、小提琴、雙簧管等)產(chǎn)生的各種聲音對(duì)象。音源是產(chǎn)生聲音對(duì)象的對(duì)象(例如，樂(lè)器或聲帶)。在本說(shuō)明書(shū)中，實(shí)際產(chǎn)生聲音對(duì)象的對(duì)象和識(shí)別用戶(hù)產(chǎn)生聲音對(duì)象的對(duì)象表示音源。例如，當(dāng)在用戶(hù)觀看電影的同時(shí)蘋(píng)果從屏幕被扔向用戶(hù)時(shí)，在蘋(píng)果移動(dòng)時(shí)產(chǎn)生的聲音(聲音對(duì)象)可包括在聲音信號(hào)中?？赏ㄟ^(guò)記錄當(dāng)蘋(píng)果被扔出時(shí)實(shí)際產(chǎn)生的聲音來(lái)獲得聲音對(duì)象，或者聲音對(duì)象可以是被簡(jiǎn)單再現(xiàn)的預(yù)先記錄的聲音對(duì)象。然而，在每一種情況下，用戶(hù)識(shí)別出蘋(píng)果產(chǎn)生所述聲音對(duì)象，并且因此，蘋(píng)果可以是如在本說(shuō)明書(shū)中定義的音源。圖像深度信息指示背景與參考位置之間的距離以及對(duì)象與參考位置之間的距離。參考位置可以是輸出圖像的顯示裝置的表面。聲音深度信息指示聲音對(duì)象與參考位置之間的距離。更具體地講，聲音深度信息指示產(chǎn)生聲音對(duì)象的位置(音源的位置)與參考位置之間的距離。如上所述，當(dāng)在用戶(hù)觀看電影的同時(shí)蘋(píng)果從屏幕移向用戶(hù)時(shí)，音源和用戶(hù)之間的距離變得接近。為了有效表現(xiàn)蘋(píng)果正在接近，可表現(xiàn)出與圖像對(duì)象對(duì)應(yīng)的聲音對(duì)象的產(chǎn)生位置正逐漸變得更接近于用戶(hù)，并且關(guān)于這一點(diǎn)的信息包括在聲音深度信息中。參考位置可根據(jù)音源的位置、揚(yáng)聲器的位置、用戶(hù)的位置等而改變。聲音遠(yuǎn)近感是用戶(hù)關(guān)于聲音對(duì)象體驗(yàn)到的感受之一。用戶(hù)觀看聲音對(duì)象，使得用戶(hù)可識(shí)別產(chǎn)生聲音對(duì)象的位置，即，產(chǎn)生聲音對(duì)象的音源的位置。這里，對(duì)用戶(hù)識(shí)別出的音源與用戶(hù)之間的距離的感受表示聲音遠(yuǎn)近感。圖I是根據(jù)本發(fā)明的實(shí)施例的用于再現(xiàn)立體聲的設(shè)備100的框圖。根據(jù)本發(fā)明的當(dāng)前實(shí)施例的用于再現(xiàn)立體聲的設(shè)備100包括圖像深度信息獲取單元110、聲音深度信息獲取單元120和遠(yuǎn)近感提供單元130。圖像深度信息獲取單元110獲取指示圖像信號(hào)中的至少一個(gè)圖像對(duì)象與參考位置之間的距離的圖像深度信息。圖像深度信息可以是指示組成圖像對(duì)象或背景的像素的深度值的深度圖。聲音深度信息獲取單元120基于圖像深度信息來(lái)獲取指示聲音對(duì)象與參考位置之間的距離的聲音深度信息?？纱嬖诙喾N使用圖像深度信息來(lái)產(chǎn)生聲音深度信息的方法，在下文中，將描述兩種產(chǎn)生聲音深度信息的方法。然而，本發(fā)明不限于此。例如，聲音深度信息獲取單元120可獲取用于每個(gè)聲音對(duì)象的聲音深度值。聲音深度信息獲取單元120獲取關(guān)于圖像對(duì)象的位置信息以及關(guān)于聲音對(duì)象的位置信息，并基于位置信息將圖像對(duì)象與聲音對(duì)象進(jìn)行匹配。然后，基于圖像深度信息以及匹配信息，可產(chǎn)生聲音深度信息。將參照?qǐng)D2詳細(xì)描述這樣的示例。作為另一不例，聲音深度信息獲取單兀120可根據(jù)組成聲音信號(hào)的聲音片段來(lái)獲取聲音深度值。聲音信號(hào)包括至少一個(gè)聲音片段。這里，一個(gè)聲音片段中的聲音信號(hào)可具有相同的聲音深度值。也就是說(shuō)，在每個(gè)不同的聲音對(duì)象中，可應(yīng)用相同的聲音深度值。聲音深度信息獲取單元120獲取組成圖像信號(hào)的每個(gè)圖像片段的圖像深度值?？赏ㄟ^(guò)按幀單元或按場(chǎng)景單元?jiǎng)澐謭D像信號(hào)來(lái)獲得圖像片段。聲音深度信息獲取單元120獲取每個(gè)圖像片段中的代表性深度值(例如，最大深度值、最小深度值或平均深度值)并通過(guò)使用代表性深度值確定與圖像片段對(duì)應(yīng)的聲音片段中的聲音深度值。將參照?qǐng)D3詳細(xì)描述這樣的示例。遠(yuǎn)近感提供單元130基于聲音深度信息對(duì)聲音信號(hào)進(jìn)行處理，使得用戶(hù)可感受聲音遠(yuǎn)近感。遠(yuǎn)近感提供單元130可在與圖像對(duì)象對(duì)應(yīng)的聲音對(duì)象被提取之后根據(jù)每個(gè)聲音對(duì)象來(lái)提供聲音遠(yuǎn)近感、根據(jù)包括在聲音信號(hào)中的每個(gè)聲道提供聲音遠(yuǎn)近感，或者為所有的聲音信號(hào)提供聲音遠(yuǎn)近感。遠(yuǎn)近感提供單元130執(zhí)行以下四個(gè)任務(wù)i)、ii)、iii)和iv)中的至少一個(gè)，以便用戶(hù)有效地感受聲音遠(yuǎn)近感。然而，在遠(yuǎn)近感提供單元130中執(zhí)行的四個(gè)任務(wù)僅是示例，本發(fā)明不限于此。i)遠(yuǎn)近感提供單元130基于聲音深度信息調(diào)整聲音對(duì)象的功率。聲音對(duì)象被產(chǎn)生得越接近用戶(hù)，聲音對(duì)象的功率增加得越多。
ii)遠(yuǎn)近感提供單元130基于聲音深度信息調(diào)整反射信號(hào)的增益和延遲時(shí)間。用戶(hù)聽(tīng)到不是由障礙反射的直接聲音信號(hào)以及通過(guò)被障礙反射而產(chǎn)生的反射聲音信號(hào)。反射聲音信號(hào)具有比直接聲音信號(hào)的強(qiáng)度更小的強(qiáng)度，并且與直接聲音信號(hào)相比，通常被延遲了預(yù)定時(shí)間來(lái)接近用戶(hù)。具體地講，當(dāng)聲音對(duì)象被產(chǎn)生得接近用戶(hù)時(shí)，反射聲音信號(hào)與直接聲音信號(hào)相比到達(dá)得較晚，并且反射聲音信號(hào)的強(qiáng)度被明顯降低。iii)遠(yuǎn)近感提供單元130基于聲音深度信息調(diào)整聲音對(duì)象的低頻段分量。當(dāng)聲音對(duì)象被產(chǎn)生得接近用戶(hù)時(shí)，用戶(hù)可明顯地識(shí)別出低頻段分量。iv)遠(yuǎn)近感提供單元130基于聲音深度信息調(diào)整聲音對(duì)象的相位。隨著將從第一揚(yáng)聲器輸出的聲音對(duì)象的相位和將從第二揚(yáng)聲器輸出的聲音對(duì)象的相位之間的差增加，用戶(hù)識(shí)別出聲音對(duì)象更加接近。將參照?qǐng)D5詳細(xì)描述遠(yuǎn)近感提供單元130的操作。圖2是根據(jù)本發(fā)明的實(shí)施例的圖I的聲音深度信息獲取單元120的框圖。聲音深度信息獲取單元120包括第一位置獲取單元210、第二位置獲取單元220、匹配單元230和確定單元240。第一位置獲取單元210基于圖像深度信息獲取圖像對(duì)象的位置信息。第一位置獲取單元210可僅獲取關(guān)于感測(cè)到圖像信號(hào)中向左方和右方的移動(dòng)或者向前方或后方的移動(dòng)的圖像對(duì)象的位置信息。第一位置獲取單元210基于下面的等式I來(lái)比較關(guān)于連續(xù)圖像幀的深度圖并識(shí)別深度值的改變?cè)黾拥淖鴺?biāo)。[等式I]Diffi =I1 -Im
JJ u A% r x\y在等式I中，i指示幀的編號(hào)，x、y指示坐標(biāo)。因此，Iix,y指示在(x，y)坐標(biāo)處的第i幀的深度值。在針對(duì)所有坐標(biāo)計(jì)算了 DIff^y之后，第一位置獲取單元210搜索DIffiM高于閾值的坐標(biāo)。第一位置獲取單元210將與DIffixiy高于閾值的坐標(biāo)對(duì)應(yīng)的圖像對(duì)象確定為其移動(dòng)被感測(cè)到的圖像對(duì)象，并且對(duì)應(yīng)的坐標(biāo)被確定為所述圖像對(duì)象的位置。
第二位置獲取單兀220基于聲音信號(hào)獲取關(guān)于聲音對(duì)象的位置信息?？纱嬖诙喾N通過(guò)第二位置獲取單元220獲取關(guān)于聲音對(duì)象的位置信息的方法。例如，第二位置獲取單兀220將主分量和環(huán)境分量與聲首信號(hào)分尚，將主分量與環(huán)境分量比較，從而獲取關(guān)于聲音對(duì)象的位置信息。此外，第二位置獲取單元220比較聲音信號(hào)的每個(gè)聲道的功率，從而獲取關(guān)于聲音對(duì)象的位置信息。在該方法中，聲音對(duì)象的左位置和右位置可被識(shí)別。作為另一示例，第二位置獲取單元220將聲音信號(hào)劃分為多個(gè)片段，在每個(gè)片段中計(jì)算每個(gè)頻段的功率，并基于按照每個(gè)頻段的功率確定公共頻段。在本說(shuō)明書(shū)中，公共頻段表示在相鄰片段中功率高于預(yù)定閾值的公共頻段。例如，在當(dāng)前片段中選擇功率高于“A”的頻段，在先前片段中選擇功率高于“A”的頻段(或者選擇當(dāng)前片段中功率在較高的第五等級(jí)內(nèi)的頻段，在先前片段中選擇先前片段中功率在較高的第五等級(jí)內(nèi)的頻段)。然后，在先前片段和當(dāng)前片段中被共同選擇的頻段被確定為公共頻段。對(duì)高于閾值的頻段的限制在于獲取具有大信號(hào)強(qiáng)度的聲音對(duì)象的位置。因此，具·有小信號(hào)強(qiáng)度的聲音對(duì)象的影響被最小化，并且主要聲音對(duì)象的影響被最大化。由于公共頻段被確定，因此，可確定在先前片段中不存在的新聲音信號(hào)是否在當(dāng)前片段中被產(chǎn)生，或者在先前片段中存在的聲音對(duì)象的特性(例如，產(chǎn)生位置)是否被改變。當(dāng)圖像對(duì)象的位置被改變?yōu)轱@示裝置的深度方向時(shí)，與所述圖像對(duì)象對(duì)應(yīng)的聲音對(duì)象的功率被改變。在這種情況下，與所述聲音對(duì)象對(duì)應(yīng)的頻段的功率被改變，因此可通過(guò)檢查每個(gè)頻段中的功率的改變來(lái)識(shí)別沿深度方向的聲音對(duì)象的位置。匹配單元230基于關(guān)于圖像對(duì)象的位置信息以及關(guān)于聲音對(duì)象的位置信息來(lái)確定圖像對(duì)象和深度對(duì)象之間的關(guān)系。匹配單元230在圖像對(duì)象的坐標(biāo)與聲音對(duì)象的坐標(biāo)之間的差在閾值內(nèi)時(shí)確定圖像對(duì)象與聲音對(duì)象匹配。另一方面，匹配單元230在圖像對(duì)象的坐標(biāo)與聲音對(duì)象的坐標(biāo)之間的差高于閾值時(shí)確定圖像對(duì)象與聲音對(duì)象不匹配。確定單元240基于匹配單元230的確定來(lái)確定用于聲音對(duì)象的聲音深度值。例如，在被確定為與圖像對(duì)象匹配的聲音對(duì)象中，根據(jù)圖像對(duì)象的深度值來(lái)確定聲音深度值。在被確定為與圖像對(duì)象不匹配的聲音對(duì)象中，聲音深度值被確定為最小值。當(dāng)聲音深度值被確定為最小值時(shí)，遠(yuǎn)近感提供單元130不將聲音遠(yuǎn)近感提供給聲音對(duì)象。當(dāng)圖像對(duì)象和聲音對(duì)象的位置彼此匹配時(shí)，確定單元240可在預(yù)定的異常環(huán)境下不將聲音遠(yuǎn)近感提供給聲音對(duì)象。例如，當(dāng)圖像對(duì)象的大小低于閾值時(shí)，確定單元240可不將聲音遠(yuǎn)近感提供給與圖像對(duì)象對(duì)應(yīng)的聲音對(duì)象。由于具有非常小尺寸的圖像對(duì)象對(duì)用戶(hù)體驗(yàn)3D效果的影響輕微，因此確定單元240可不將聲音遠(yuǎn)近感提供給對(duì)應(yīng)聲音對(duì)象。圖3是根據(jù)本發(fā)明的另一實(shí)施例的圖I的聲音深度信息獲取單元120的框圖。根據(jù)本發(fā)明的當(dāng)前實(shí)施例的聲音深度信息獲取單元120包括片段深度信息獲取單元310和確定單元320。片段深度信息獲取單元310基于圖像深度信息獲取每個(gè)圖像片段的深度信息。圖像信號(hào)可被劃分為多個(gè)片段。例如，可按照?qǐng)鼍氨晦D(zhuǎn)換的場(chǎng)景單元、按照?qǐng)D像幀單元或者GOP單元來(lái)劃分圖像信號(hào)。片段深度信息獲取單元310獲取與每個(gè)片段對(duì)應(yīng)的圖像深度值。片段深度信息獲取單元310可基于下面的等式2獲取與每個(gè)片段對(duì)應(yīng)的圖像深度值。[等式2]
權(quán)利要求
1.一種再現(xiàn)立體聲的方法，所述方法包括獲取指示圖像信號(hào)中的至少一個(gè)圖像對(duì)象與參考位置之間的距離的圖像深度信息；基于圖像深度信息，獲取指示聲音信號(hào)中的至少一個(gè)聲音對(duì)象與參考位置之間的距離的聲音深度信息；基于聲音深度信息，將聲音遠(yuǎn)近感提供給所述至少一個(gè)聲音對(duì)象。
2.如權(quán)利要求I所述的方法，其中，獲取聲音深度信息的步驟包括獲取組成圖像信號(hào)的每個(gè)圖像片段的最大深度值；基于所述最大深度值，獲取用于所述至少一個(gè)聲音對(duì)象的聲音深度值。
3.如權(quán)利要求2所述的方法，其中，獲取聲音深度值的步驟包括當(dāng)所述最大深度值小于第一閾值時(shí)，將所述聲音深度值確定為最小值，當(dāng)所述最大深度值等于或大于第二閾值時(shí)，將所述聲音深度值確定為最大值。
4.如權(quán)利要求3所述的方法，其中，獲取聲音深度值的步驟還包括當(dāng)所述最大深度值等于或大于第一閾值且小于第二閾值時(shí)，將所述聲音深度值確定為與所述最大深度值成比例。
5.如權(quán)利要求I所述的方法，其中，獲取聲音深度信息的步驟包括獲取關(guān)于圖像信號(hào)中的所述至少一個(gè)圖像對(duì)象的位置信息以及關(guān)于聲音信號(hào)中的所述至少一個(gè)聲音對(duì)象的位置信息；確定所述至少一個(gè)圖像對(duì)象的位置是否與所述至少一個(gè)聲音對(duì)象的位置匹配；基于確定的結(jié)果來(lái)獲取聲音深度信息。
6.如權(quán)利要求I所述的方法，其中，獲取聲音深度信息的步驟包括獲取組成圖像信號(hào)的每個(gè)圖像片段的平均深度值；基于所述平均深度值，獲取用于所述至少一個(gè)聲音對(duì)象的聲音深度值。
7.如權(quán)利要求6所述的方法，其中，獲取聲音深度值的步驟包括當(dāng)所述平均深度值小于第三閾值時(shí)，將所述聲音深度值確定為最小值。
8.如權(quán)利要求6所述的方法，其中，獲取聲音深度值的步驟包括當(dāng)先前片段中的平均深度值與當(dāng)前片段中的平均深度值之間的差小于第四閾值時(shí)，將所述聲音深度值確定為最小值。
9.如權(quán)利要求I所述的方法，其中，提供聲音遠(yuǎn)近感的步驟包括基于聲音深度信息來(lái)控制聲音對(duì)象的功率。
10.如權(quán)利要求I所述的方法，其中，提供聲音遠(yuǎn)近感的步驟包括基于聲音深度信息，控制按照聲音對(duì)象被反射的方式而產(chǎn)生的反射信號(hào)的增益和延遲時(shí)間。
11.如權(quán)利要求I所述的方法，其中，提供聲音遠(yuǎn)近感的步驟包括基于聲音深度信息，控制聲音對(duì)象的低頻段分量的強(qiáng)度。
12.如權(quán)利要求I所述的方法，其中，提供聲音遠(yuǎn)近感的步驟包括控制將通過(guò)第一揚(yáng)聲器輸出的聲音對(duì)象的相位與將通過(guò)第二揚(yáng)聲器輸出的聲音對(duì)象的相位之間的差。
13.如權(quán)利要求I所述的方法，還包括通過(guò)左環(huán)繞揚(yáng)聲器和右環(huán)繞揚(yáng)聲器、左前揚(yáng)聲器和右前揚(yáng)聲器中的至少一個(gè)，輸出提供有聲音遠(yuǎn)近感的聲音對(duì)象。
14.如權(quán)利要求I所述的方法，還包括通過(guò)使用聲音信號(hào)，使相位朝向揚(yáng)聲器的外部。
15.如權(quán)利要求I所述的方法，其中，獲取聲音深度信息的步驟包括基于所述至少一個(gè)圖像對(duì)象的中的每一個(gè)的大小，確定用于所述至少一個(gè)聲音對(duì)象的聲音深度值。
16.如權(quán)利要求I所述的方法，其中，獲取聲音深度信息的步驟包括基于所述至少一個(gè)圖像對(duì)象的分布，確定用于所述至少一個(gè)聲音對(duì)象的聲音深度值。
17.一種再現(xiàn)立體聲的設(shè)備，所述設(shè)備包括圖像深度信息獲取單元，用于獲取指示圖像信號(hào)中的至少一個(gè)圖像對(duì)象與參考位置之間的距離的圖像深度信息；聲音深度信息獲取單元，用于基于圖像深度信息，獲取指示聲音信號(hào)中的至少一個(gè)聲音對(duì)象與參考位置之間的距離的聲音深度信息；遠(yuǎn)近感提供單元，用于基于聲音深度信息，將聲音遠(yuǎn)近感提供給所述至少一個(gè)聲音對(duì)象。
18.如權(quán)利要求17所述的設(shè)備，其中，聲音深度信息獲取單元獲取組成圖像信號(hào)的每個(gè)圖像片段的最大深度值，并基于所述最大深度值，獲取用于所述至少一個(gè)聲音對(duì)象的聲音深度值。
19.如權(quán)利要求18所述的設(shè)備，其中，當(dāng)所述最大深度值小于第一閾值時(shí)，聲音深度信息獲取單元將所述聲音深度值確定為最小值，當(dāng)所述最大深度值等于或大于第二閾值時(shí)，聲音深度信息獲取單元將所述聲音深度值確定為最大值。
20.如權(quán)利要求18所述的方法，其中，當(dāng)所述最大深度值等于或大于第一閾值且小于第二閾值時(shí)，所述聲音深度值被確定為與所述最大深度值成比例。
21.—種其上包含有用于執(zhí)行權(quán)利要求I至16的方法中的任意一種方法的計(jì)算機(jī)程序的計(jì)算機(jī)可讀記錄介質(zhì)。
全文摘要
公開(kāi)了一種再現(xiàn)立體聲的方法，所述方法包括獲取指示圖像信號(hào)中的至少一個(gè)圖像對(duì)象與參考位置之間的距離的圖像深度信息；基于圖像深度信息，獲取指示聲音信號(hào)中的至少一個(gè)聲音對(duì)象與參考位置之間的距離的聲音深度信息；基于聲音深度信息，將聲音遠(yuǎn)近感提供給所述至少一個(gè)聲音對(duì)象。
文檔編號(hào)H04S1/00GK102812731SQ201180014834
公開(kāi)日2012年12月5日申請(qǐng)日期2011年3月17日優(yōu)先權(quán)日2010年3月19日
發(fā)明者趙镕春, 金善民申請(qǐng)人:三星電子株式會(huì)社

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：趙镕春;金善民
技術(shù)所有人：三星電子株式會(huì)社
我是此專(zhuān)利的發(fā)明人

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話(huà)進(jìn)行咨詢(xún)。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開(kāi)發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開(kāi)發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車(chē)檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車(chē)電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線(xiàn)網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

聲音的再現(xiàn)相關(guān)技術(shù)

中國(guó)好聲音黃家駒再現(xiàn)相關(guān)技術(shù)

聲音和音頻設(shè)備相關(guān)技術(shù)

下載聲音和音頻設(shè)備相關(guān)技術(shù)

電腦沒(méi)聲音設(shè)備相關(guān)技術(shù)

聲音輸出設(shè)備相關(guān)技術(shù)

mac沒(méi)有聲音輸出設(shè)備相關(guān)技術(shù)

聲音設(shè)備相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于再現(xiàn)三維聲音的方法和設(shè)備的制作方法