欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于相機(jī)選擇的音頻處理的制作方法

文檔序號(hào):11291477閱讀:220來(lái)源:國(guó)知局
基于相機(jī)選擇的音頻處理的制造方法與工藝

示例性和非限制性實(shí)施例一般涉及音頻信號(hào),更具體地涉及音頻信號(hào)的處理。



背景技術(shù):

具有多個(gè)麥克風(fēng)的設(shè)備是已知的。具有多個(gè)相機(jī)的設(shè)備是已知的。處理音頻信號(hào)以產(chǎn)生經(jīng)修改的音頻信號(hào)是已知的。



技術(shù)實(shí)現(xiàn)要素:

以下發(fā)明內(nèi)容僅僅旨在是示例性的。該發(fā)明內(nèi)容不旨在限制權(quán)利要求的范圍。

按照一個(gè)方面,一種示例方法,包括:從裝置的麥克風(fēng)生成相應(yīng)的音頻信號(hào);確定裝置的多個(gè)相機(jī)中的哪些相機(jī)已經(jīng)被選擇以供使用;以及基于所確定的被選擇以供使用的相機(jī),為相應(yīng)的音頻信號(hào)中要被處理的至少一個(gè)相應(yīng)的音頻信號(hào)選擇音頻處理模式,其中音頻處理模式基于所確定的被選擇以供使用的相機(jī)來(lái)至少部分地自動(dòng)調(diào)整至少一個(gè)相應(yīng)的音頻信號(hào)。

按照另一示例實(shí)施例,提供了一種裝置,其包括至少一個(gè)處理器;以及至少一個(gè)非暫態(tài)存儲(chǔ)器,其包括計(jì)算機(jī)程序代碼,至少一個(gè)存儲(chǔ)器和計(jì)算機(jī)程序代碼被配置成與至少一個(gè)處理器一起使得裝置:確定裝置的多個(gè)相機(jī)中的哪些相機(jī)已經(jīng)被選擇以供使用;基于所確定的被選擇以供使用的相機(jī),為來(lái)自裝置的麥克風(fēng)的要被處理的相應(yīng)的音頻信號(hào)選擇音頻處理模式,其中音頻處理模式基于所確定的被選擇以供使用的相機(jī)來(lái)至少部分地自動(dòng)調(diào)整至少一個(gè)相應(yīng)的音頻信號(hào)。

按照另一示例實(shí)施例,提供了一種由機(jī)器可讀取的非暫態(tài)程序存儲(chǔ)設(shè)備,其有形地體現(xiàn)由機(jī)器可執(zhí)行的用于執(zhí)行操作的指令程序,該操作包括:確定裝置的多個(gè)相機(jī)中的哪些相機(jī)已經(jīng)被選擇以供使用;基于所確定的被選擇以供使用的相機(jī),為來(lái)自裝置的麥克風(fēng)的要被處理的相應(yīng)的音頻信號(hào)選擇音頻處理模式,其中音頻處理模式基于所確定的被選擇以供使用的相機(jī)來(lái)至少部分地自動(dòng)調(diào)整至少一個(gè)相應(yīng)的音頻信號(hào)。

附圖說(shuō)明

在以下結(jié)合附圖進(jìn)行的描述中對(duì)前述各方面以及其他特征進(jìn)行闡明,其中:

圖1是示例實(shí)施例的正視圖;

圖2是圖1所示的實(shí)施例的后視圖;

圖3是圖示了圖1至圖2所示的實(shí)施例的部件中的一些部件的示意圖;

圖4是圖示了來(lái)自圖1至圖3所示的實(shí)施例的麥克風(fēng)的音頻信號(hào)的處理的圖;

圖5是圖示了示例方法的圖;

圖6是圖示了來(lái)自圖1至圖3所示的實(shí)施例的麥克風(fēng)的音頻信號(hào)的處理的圖;

圖7是圖示了來(lái)自圖1至圖3所示的實(shí)施例的麥克風(fēng)的音頻信號(hào)的處理的圖;

圖8是圖示了來(lái)自圖1至圖3所示的實(shí)施例的麥克風(fēng)的音頻信號(hào)的處理的圖;

圖9是圖示了相對(duì)于圖1至圖2所示的裝置的區(qū)域的圖,其中可以修改音頻源方向;

圖10是圖示了用于修改音頻源方向的示例圖形的圖。

圖11是圖示了在圖1至圖2所示的裝置的一側(cè)上使空間圖像靜止的圖;

圖12是圖示了來(lái)自圖1至圖3所示的實(shí)施例的麥克風(fēng)的音頻信號(hào)的處理的圖;

圖13是圖示了來(lái)自圖1至圖3所示的實(shí)施例的麥克風(fēng)的音頻信號(hào)的處理的圖;

圖14是圖示了來(lái)自圖1至圖3所示的實(shí)施例的麥克風(fēng)以及另一麥克風(fēng)的音頻信號(hào)的處理的圖;

圖15是圖示了來(lái)自麥克風(fēng)的音頻信號(hào)的處理的圖;

圖16是圖示了相對(duì)于圖1至圖2所示的裝置的音頻捕獲和回放方向以及視頻捕獲方向的示例使用的圖;以及

圖17是圖示了相對(duì)于圖1至圖2所示的裝置的音頻捕獲和回放方向以及視頻捕獲方向的示例使用的另一圖。

具體實(shí)施方式

參考圖1,示出了結(jié)合示例實(shí)施例的特征的裝置10的正視圖。盡管將參照附圖中示出的示例實(shí)施例對(duì)特征進(jìn)行描述,但是應(yīng)當(dāng)理解,可以以許多備選形式的實(shí)施例來(lái)體現(xiàn)特征。另外,可以使用任何合適的尺寸、形狀或類型的元件或材料。

裝置10可以是手持便攜式裝置,諸如包括例如電話應(yīng)用的通信設(shè)備。在所示的示例中,裝置10是包括相機(jī)和相機(jī)應(yīng)用的智能手機(jī)。裝置10可以附加地或可替代地包括因特網(wǎng)瀏覽器應(yīng)用、視頻記錄器應(yīng)用、音樂(lè)播放器和記錄器應(yīng)用、電子郵件應(yīng)用、導(dǎo)航應(yīng)用、游戲應(yīng)用和/或任何其他合適的電子設(shè)備應(yīng)用。在備選示例實(shí)施例中,該裝置可能不是智能電話。

還參考圖2至圖3,在該示例實(shí)施例中,裝置10包括殼體12、觸摸屏14、接收器16、發(fā)送器18、控制器20、可充電電池26和至少兩個(gè)相機(jī)30、32。然而,這些特征對(duì)于實(shí)現(xiàn)下文所描述的特征是不必要的。控制器20可以包括至少一個(gè)處理器22、至少一個(gè)存儲(chǔ)器24和軟件28。殼體12內(nèi)部的電子電路可以包括至少一個(gè)印刷電路板(pwb)21,其具有諸如控制器20之類的部件。接收器16和發(fā)送器18形成主通信系統(tǒng),以允許裝置10與無(wú)線電話系統(tǒng)(諸如例如移動(dòng)電話基站)進(jìn)行通信。

在該示例中,裝置10包括位于裝置的后側(cè)13的相機(jī)30、位于裝置的相對(duì)前側(cè)的前置相機(jī)32、led34和閃光燈系統(tǒng)36。led34和閃光燈系統(tǒng)36在裝置的后側(cè)是可見的,并且被提供用于相機(jī)30。相機(jī)30、32、led34和閃光燈系統(tǒng)36連接至控制器20,使得控制器20可以控制其操作。在備選示例實(shí)施例中,后側(cè)可以包括多于一個(gè)的相機(jī),和/或前側(cè)可以包括多于一個(gè)的相機(jī)。

裝置10包括作為耳機(jī)40而被提供的聲音換能器、以及作為揚(yáng)聲器42而被提供的聲音換能器??梢蕴峁┒嘤谝粋€(gè)或少于一個(gè)的揚(yáng)聲器。裝置10包括作為麥克風(fēng)38、39而被提供的聲音換能器。在備選示例中,該裝置可以包括多于兩個(gè)的麥克風(fēng)。麥克風(fēng)38、39位于殼體12的相應(yīng)的左側(cè)和右側(cè),以允許其音頻信號(hào)表示左聲道和右聲道。然而,除了只有左聲道和右聲道之外,可以提供附加的或備選的聲道。在該示例中,麥克風(fēng)38、39位于殼體12的底部,但是它們可以位于殼體上的任何合適位置。

還參考圖4,將對(duì)包括特征的一種類型的示例進(jìn)行描述。裝置10的電子電路被配置成從兩個(gè)或更多個(gè)麥克風(fēng)38、39接收信號(hào),并且產(chǎn)生作為左輸出聲道和右輸出聲道的音頻信號(hào)44'、45'。裝置10的電子電路形成多模式音頻處理器70用于該目的。音頻處理器70可以使用不同的模式來(lái)處理信號(hào)44、45并且產(chǎn)生不同種類的信號(hào)44'、45'。多模式音頻處理器70使用的模式可以至少部分地基于哪個(gè)相機(jī)30、32正在被使用來(lái)確定或選擇。

語(yǔ)音和環(huán)境聲音通常通過(guò)其在視頻呼叫或視頻記錄中的不同角色而具有不同的相對(duì)重要性。如何最佳地表示和渲染或捕獲這些音頻信號(hào)可能取決于視頻觀點(diǎn)。在一類示例中,本文中所描述的特征可以用于基于所使用的相機(jī)視圖來(lái)提供默認(rèn)音頻表示和渲染模式。通過(guò)利用多麥克風(fēng)空間捕獲,可以獲得語(yǔ)音和環(huán)境音頻信號(hào)之間的改進(jìn)的分離。因此,可以以更好的質(zhì)量和更自然的方式來(lái)渲染音頻,其與正在使用的相機(jī)視圖更好地相對(duì)應(yīng)并且適應(yīng)于該相機(jī)視圖。該渲染可以進(jìn)一步實(shí)現(xiàn)講話者是場(chǎng)景的一部分的模式,或者講話者與總體場(chǎng)景分離并且用作敘述者的新穎的視頻呼叫模式。

由麥克風(fēng)拾取(諸如例如,在例如視頻呼叫期間)的聲音可以被分成音頻語(yǔ)音信號(hào)和音頻環(huán)境信號(hào)。應(yīng)當(dāng)理解,這些信號(hào)類型被認(rèn)為是在視頻電話和視頻記錄的范圍內(nèi)。因此,本文中所描述的特征不限于視頻電話。

當(dāng)進(jìn)行視頻呼叫(或視頻記錄)時(shí),可以利用設(shè)備(或作為記錄系統(tǒng)的一部分)上的多于一個(gè)的相機(jī)。具體地,對(duì)于圖1至圖3所示的示例,前置相機(jī)32通常捕獲用戶的臉部,并且主相機(jī)30可以用于捕獲用戶前面的內(nèi)容。

一個(gè)方面是通過(guò)利用空間多麥克風(fēng)捕獲來(lái)在該框架中更好地分離語(yǔ)音信號(hào)和環(huán)境信號(hào),并且因此允許集中于在每個(gè)“使用”情況下被認(rèn)為更重要的聲音。例如,當(dāng)使用前置相機(jī)32時(shí),從相機(jī)的直視圖發(fā)出的信號(hào)可以被視為被保存的主信號(hào),而其他信號(hào)(環(huán)境)的增益可以被降低。因?yàn)轭A(yù)期當(dāng)用戶選擇示出他/她的臉(如通過(guò)使用相機(jī)32的選擇所指示的)時(shí),語(yǔ)音信號(hào)是最重要的信號(hào),所以這可以做到。另一方面,當(dāng)使用主相機(jī)30時(shí),可以預(yù)期所有聲源(包括現(xiàn)在最可能在設(shè)備10后方的講話者)是感興趣的。

使用本文中所描述的特征,在視頻呼叫中利用前置相機(jī)32或主相機(jī)30可以用于基于正在被使用的相機(jī)來(lái)觸發(fā)優(yōu)選的捕獲模式。利用特定相機(jī)可以附加地觸發(fā)捕獲模式的默認(rèn)設(shè)置。在一種示例實(shí)施例中,捕獲模式的默認(rèn)設(shè)置然后還可以由用戶調(diào)整。

返回參考圖4,音頻處理器70被配置成基于所使用的相機(jī)來(lái)控制輸出信號(hào)中的環(huán)境信號(hào)的水平。這還可能是基于話音活動(dòng)檢測(cè)(vad)或面部檢測(cè)。因此,本文中所描述的特征可以用于當(dāng)用戶使用或切換到主相機(jī)30時(shí),自動(dòng)允許改進(jìn)語(yǔ)音信號(hào)編碼的保真度(當(dāng)使用前置相機(jī)32時(shí))以及適應(yīng)不同的編碼語(yǔ)音和環(huán)境信號(hào),諸如例如,在相同的水平下。

還參考圖5,一種示例方法,可以包括:如框60所指示的,從裝置的麥克風(fēng)生成音頻信號(hào);如框62所指示的,確定裝置的多個(gè)相機(jī)的哪些相機(jī)已經(jīng)被選擇以供使用;以及如框64所指示的,基于所確定的被選擇以供使用的相機(jī),為要被處理的音頻信號(hào)選擇音頻處理模式,其中音頻處理模式基于所確定的被選擇以供使用的相機(jī)來(lái)至少部分地自動(dòng)調(diào)整音頻信號(hào)。在麥克風(fēng)的電性輸出信號(hào)被處理的情況下,生成音頻信號(hào)是指音頻捕獲/記錄。

如上文所指出的,可以利用面部跟蹤方法來(lái)進(jìn)一步增強(qiáng)捕獲對(duì)現(xiàn)實(shí)情景的適應(yīng)性。例如,面部檢測(cè)信息可以由圖4所示的信號(hào)58提供。在一個(gè)示例中,當(dāng)在前置相機(jī)32的視圖中找不到講話者的面部時(shí),設(shè)備前面(但不在視圖中)的聲源的環(huán)境增益可能不會(huì)降低。事實(shí)上,這樣的聲源可能是講話者??梢酝ㄟ^(guò)使用如上文所指出的話音活動(dòng)檢測(cè)(vad)或類似技術(shù)來(lái)附加地或可替代地檢測(cè)語(yǔ)音信號(hào)的存在。

還參考圖6,將對(duì)另一示例實(shí)施例進(jìn)行描述,其可以用于講話者(主語(yǔ)音信號(hào))和環(huán)境信號(hào)的更具體的分離。這種方法的用例可以被描述為整個(gè)場(chǎng)景中的“抬出講話者”,并且用他/她作為敘述者。在這種情況下,當(dāng)在前置相機(jī)32和設(shè)備主相機(jī)30之間進(jìn)行切換時(shí),講話者的方位遵循視頻鏡頭的方位。實(shí)際上,當(dāng)講話者被認(rèn)為是環(huán)境的一部分時(shí),這是被認(rèn)為是自然而優(yōu)選的渲染方式,并且聽眾想體驗(yàn)身臨其境的場(chǎng)景。然而,我們也習(xí)慣于將其自身適用于視頻電話的另一種類型的渲染。典型示例可能是電視新聞演示(或諸如自然文件之類的程序),其涉及顯示人講話的頭部(講話的頭部)和其他視頻鏡頭,其中講話者只呈現(xiàn)為敘述者,而非完整場(chǎng)景的元素。這種情景對(duì)于視頻電話本身很自然,并且單聲道音頻渲染(其當(dāng)前是視頻呼叫中的典型音頻技術(shù))還可以被認(rèn)為遵循這一原則:當(dāng)視頻鏡頭中的視圖改變時(shí),講話者的位置或多或少保持固定。

相機(jī)中的一個(gè)相機(jī)通常主要用于捕獲揚(yáng)聲器(前置相機(jī)32),并且其他相機(jī)用于捕獲風(fēng)景(后置相機(jī)30)。因此,來(lái)自揚(yáng)聲器的話音被鏈接至前置相機(jī)32,并且環(huán)境聲音被鏈接到后置相機(jī)30。因此,如果當(dāng)使用前置相機(jī)時(shí),揚(yáng)聲器的話音的空間圖像可能與視頻相對(duì)應(yīng),并且當(dāng)使用后置相機(jī)時(shí),環(huán)境的空間圖像可能與視頻相對(duì)應(yīng),那么這是好事。

在該示例實(shí)施例中,空間多麥克風(fēng)捕獲用于分離設(shè)備的每一側(cè)上的信號(hào)。至少,與前置相機(jī)側(cè)和設(shè)備主相機(jī)側(cè)有關(guān)的聲音和聲源被分離。進(jìn)一步地,主語(yǔ)音信號(hào)與前置相機(jī)側(cè)環(huán)境信號(hào)相分離。可以利用音頻和視頻處理方法,諸如vad、噪聲抑制、人臉跟蹤、波束成形、音頻對(duì)象分離等。

左麥克風(fēng)38和右麥克風(fēng)39被放置在設(shè)備上以分別正確地捕獲一個(gè)相機(jī)的音頻,即,相機(jī)的左側(cè)和右側(cè)上。在一種示例中,產(chǎn)生聚焦于(多個(gè))揚(yáng)聲器上的單聲道信號(hào)。在備選示例中,產(chǎn)生聚焦于(多個(gè))揚(yáng)聲器上的立體聲信號(hào)。在該示例中,來(lái)自麥克風(fēng)的信號(hào)44、45用于通過(guò)電路50來(lái)產(chǎn)生單聲道信號(hào)(或立體聲信號(hào))48。這可以包括例如使用在國(guó)際申請(qǐng)?zhí)杙ct/ib2013/052690(國(guó)際公開號(hào)wo2014/162171a1)中描述的裝置和方法,其全部?jī)?nèi)容通過(guò)引用并入本文,其產(chǎn)生聚焦于如由相機(jī)捕獲的講話者的單聲道信號(hào)。然而,可以提供用于將語(yǔ)音與環(huán)境聲音分離的任何合適系統(tǒng)。

由電路52延遲的音頻信號(hào)44、45然后被電路54衰減。控制器20被配置成確定在產(chǎn)生信號(hào)44、45期間哪個(gè)相機(jī)30或32正在被使用,并且向電路54發(fā)送相機(jī)指示信號(hào)56。電路54被配置成提供用于信號(hào)44、45的兩個(gè)或更多個(gè)音頻處理模式。音頻處理模式的選擇至少部分地基于相機(jī)指示信號(hào)56。因此,電路54被配置成基于哪個(gè)相機(jī)30、32正在被使用來(lái)變化信號(hào)44、45的衰減。然后,輸出信號(hào)44'、45'與(多個(gè))單聲道信號(hào)48組合以產(chǎn)生輸出信號(hào)46、47。

離開電路54的環(huán)境信號(hào)的電平根據(jù)所使用的相機(jī)而變化,并且環(huán)境信號(hào)與所聚焦的語(yǔ)音信號(hào)混合。當(dāng)使用面向(多個(gè))揚(yáng)聲器的相機(jī)(通常為前置相機(jī)32)時(shí),語(yǔ)音信號(hào)空間圖像保持恒定,語(yǔ)音空間圖像與視頻(由前置相機(jī)32拍攝的)一致,并且環(huán)境信號(hào)空間圖像可能被衰減。當(dāng)使用背對(duì)揚(yáng)聲器的相機(jī)(通常為后置相機(jī)30)時(shí),環(huán)境信號(hào)空間圖像保持恒定,環(huán)境空間圖像與視頻一致,并且語(yǔ)音信號(hào)空間圖像保持恒定(或可以比上述模式中的環(huán)境信號(hào)衰減更少)。

在一些另外的示例實(shí)施例中,當(dāng)視圖在至少兩個(gè)相機(jī)視圖之間切換時(shí),可以進(jìn)行信號(hào)的立體聲聲道或方向反轉(zhuǎn)。例如,可以進(jìn)行這樣的反轉(zhuǎn)(參見圖16和圖17),諸如通過(guò)縮小聲道之間的間隔(一直到單聲道信號(hào)),然后將該間隔擴(kuò)展回到全立體聲(其中左聲道和右聲道現(xiàn)在被反轉(zhuǎn))。

還參考圖7,還可以將實(shí)現(xiàn)方式范圍擴(kuò)展到兩個(gè)以上的聲道。例如,無(wú)論所使用的相機(jī)如何,都可以使用聚焦于他/她的話音的多麥克風(fēng)技術(shù)來(lái)捕獲揚(yáng)聲器的聲音,并且可以使用產(chǎn)生5.1聲音的多麥克風(fēng)技術(shù)來(lái)捕獲環(huán)境。該5.1捕獲可以對(duì)準(zhǔn)固定至相機(jī)中的其中一個(gè)相機(jī)(通常是移動(dòng)設(shè)備背面的主相機(jī)30)的方向。通常,當(dāng)揚(yáng)聲器想要示出風(fēng)景或用戶前面的視圖等等時(shí),使用該相機(jī)30。然后,可以以取決于所使用的相機(jī)的方式以及當(dāng)揚(yáng)聲器的頭部在相機(jī)30或32中可見時(shí)將兩個(gè)信號(hào)(環(huán)境和聲音)混合在一起。通常,當(dāng)揚(yáng)聲器在相機(jī)30或32中可見時(shí),環(huán)境信號(hào)被衰減。

在一些實(shí)施例中,視頻鏡頭可以利用畫中畫(pip)渲染。在這種情況下,語(yǔ)音和環(huán)境音頻的分離以及為講話者維持靜態(tài)方位通常提供愉快的渲染。因此,pip用例的工作模式可能與上文所討論的“敘述者”模式相同。在一些另外的實(shí)施例中,音頻模式可以適應(yīng)畫中畫視頻的改變。特別地,當(dāng)主相機(jī)提供主畫面并且輔助(pip)畫面來(lái)自前置相機(jī)時(shí),該用例類似于使用僅具有主相機(jī)視圖的“敘述者”模式。另一方面,當(dāng)主畫面和pip被反轉(zhuǎn)時(shí),默認(rèn)操作可以至少輕微地衰減空間環(huán)境聲音。在另外的實(shí)施例中,當(dāng)畫中畫視頻被示出時(shí),語(yǔ)音信號(hào)的立體聲或多聲道渲染可以被下混頻到單聲道。當(dāng)pip視頻來(lái)自前置相機(jī)時(shí),尤其如此。

在各種示例實(shí)施例中,設(shè)備取向(縱向、橫向)可以導(dǎo)致對(duì)于左信號(hào)和右信號(hào)相對(duì)應(yīng)的麥克風(fēng)的選擇。由此可見,根據(jù)設(shè)備方位,不同的麥克風(fēng)集合或麥克風(fēng)配對(duì)與左和右相對(duì)應(yīng)。

還參考圖8至圖9,還可以修改音頻信號(hào),使得音頻源方向(空間圖像)和視頻總是一致。只要在相機(jī)30、32可以看到的區(qū)域之間存在間隙72、74以及當(dāng)音頻源方向移動(dòng)到這些間隙時(shí),就可以這樣工作;方向可以被改變。當(dāng)然,當(dāng)源在相機(jī)中可見時(shí),還可以改變音頻源方向,但這會(huì)導(dǎo)致空間圖像和視頻之間的不一致性。在典型情景下,環(huán)境音頻源的方向?qū)⒈恍薷模粨P(yáng)聲器通常移動(dòng)較少,并且僅保留在一個(gè)相機(jī)的視圖中。

如本文中所描述的特征可以使用諸如在美國(guó)專利公開號(hào)us2013/0044884a1中描述的移動(dòng)設(shè)備中僅使用3個(gè)麥克風(fēng)來(lái)捕獲5.1信號(hào),其全部?jī)?nèi)容通過(guò)引用并入本文。還可以將不同的搖攝功能用于不同的輸出。在該實(shí)施例中(參考圖8),使用立體聲音頻。因?yàn)楫?dāng)相機(jī)被切換(從前置相機(jī)到主相機(jī),或反之亦然)時(shí),音頻對(duì)象的回放方向可能需要從后向前切換,所以該實(shí)施例(參考圖8)將不適用于5.1音頻。由3個(gè)麥克風(fēng)捕獲的信號(hào)首先被轉(zhuǎn)換成中間信號(hào)和側(cè)信號(hào)以及側(cè)信息α。alphaαb描述了每個(gè)頻帶b的主要聲音方向。為了產(chǎn)生音頻信號(hào),在即使當(dāng)用戶在前置相機(jī)和后置相機(jī)之間切換時(shí)聲音圖像保持靜止的情況下,還可以以下列方式修改α(為了簡(jiǎn)單起見,省略了帶索引b):

這導(dǎo)致落在圖9中的區(qū)域72、74中的音頻源方向被修改。

直接向左和向右的對(duì)象可以從左和右兩者回放;因此它們被賦予方向其是未知方向的符號(hào)。未知方向扇區(qū)的面積為-a<α<<a和180°-a<α<<180°+a。通常a為45°,然而,還可以使用a的其他值,諸如例如,當(dāng)使用不同的搖攝定律時(shí)。特別地,如果a=45°,則可以使用的搖攝定律的一個(gè)示例是眾所周知的正弦-余弦搖攝定律。那么,搖攝至左輸出聲道和右輸出聲道的中間聲道為:

這之后,去相關(guān)的側(cè)信號(hào)被添加到左聲道和右聲道,其被傳輸并且被回放。

利用上文所描述的示例,直接向設(shè)備的左側(cè)或右側(cè)的音頻對(duì)象需要從左側(cè)和右側(cè)兩者回放;否則,當(dāng)相機(jī)切換時(shí),那些音頻對(duì)象的回放方向?qū)⑶袚Q位置。這不是個(gè)大問(wèn)題,因?yàn)槟切?duì)象在任一相機(jī)中都不可見。還參考圖1,可替代地,當(dāng)相機(jī)被切換時(shí),可以聚焦于使空間音頻圖像在相機(jī)的一側(cè)(前面或后面)上靜止,同時(shí)讓另外三個(gè)側(cè)上的音頻對(duì)象的回放方向從左向右切換,反之亦然。這可以通過(guò)將音頻對(duì)象回放位置壓縮到相機(jī)一側(cè)上的一個(gè)點(diǎn),同時(shí)在另一側(cè)上保持位置“原樣”來(lái)實(shí)現(xiàn)。

在實(shí)踐中,這通常是這樣做的,使得在前置相機(jī)側(cè)上,在前置相機(jī)中可見的所有音頻對(duì)象將總是從中心回放其音頻。通常,僅在前置相機(jī)側(cè)上存在人,因此將他的話音的方向壓縮至中心是自然的。然后將從與后置相機(jī)上看到的方向相對(duì)應(yīng)的方向回放設(shè)備的另一側(cè)上的音頻對(duì)象。這可以通過(guò)使用圖10所圖示的函數(shù)而修改α來(lái)代替公式1來(lái)完成;同時(shí)保持其他處理如同圖8一樣。圖10是描繪了α的修改的曲線。

還參考圖12,備選示例是在相機(jī)之間或相機(jī)之中切換相機(jī)使用時(shí),緩慢轉(zhuǎn)動(dòng)聽覺(jué)空間圖像。例如,用戶首先使用第一相機(jī)來(lái)拍攝視頻,并且音頻空間圖像與第一相機(jī)一致。然后,用戶切換到第二相機(jī)。在切換之后,音頻空間圖像被(緩慢地)轉(zhuǎn)動(dòng),直到它變得與第二相機(jī)一致為止。

上文所描述的示例已經(jīng)聚焦于具有兩個(gè)相機(jī)的設(shè)備上。然而,如本文中所描述的特征可以容易地?cái)U(kuò)展到具有兩個(gè)以上的相機(jī)的裝置。相機(jī)不需要處于單個(gè)平面中。如這里呈現(xiàn)的相同原理可以用于不在單個(gè)平面上的相機(jī)。這里的備選實(shí)施例不限于移動(dòng)電話??梢允褂镁哂袃蓚€(gè)或更多個(gè)相機(jī)的任何設(shè)備??梢蕴砑佑糜谝纛l對(duì)象分離的器件、或用于分離語(yǔ)音和環(huán)境對(duì)象的定向麥克風(fēng)。例如,類似于上文關(guān)于圖6所描述的實(shí)施例,可以以以下關(guān)于圖13和圖14的兩種方式來(lái)實(shí)現(xiàn)特征。圖13示出了使用音頻對(duì)象分離。如框76所指示的,音頻被分成來(lái)自前置相機(jī)和后置相機(jī)的對(duì)象;如框78所指示的,根據(jù)哪個(gè)相機(jī)正在被使用來(lái)衰減來(lái)自后置相機(jī)30的一側(cè)的對(duì)象,并且可以組合80用于輸出音頻82的信號(hào)。圖14示出了使用定向麥克風(fēng)。如框84所指示的,可以基于哪個(gè)相機(jī)正在被使用來(lái)衰減來(lái)自指向后置相機(jī)的左側(cè)和右側(cè)的麥克風(fēng)的信號(hào)44、45,并且指向與前置相機(jī)32相同的方向的來(lái)自麥克風(fēng)的信號(hào)85可以與從84輸出的信號(hào)進(jìn)行組合86、87以生成輸出左聲道46和輸出右聲道47。

音頻對(duì)象分離還可以用于實(shí)現(xiàn)類似于上文關(guān)于圖8至圖11所描述的實(shí)施例的實(shí)施例。一種方法可以用于將多麥克風(fēng)信號(hào)轉(zhuǎn)換為音頻對(duì)象及其軌跡。軌跡是每個(gè)對(duì)象的時(shí)間相依方向。該方向通常指示為相對(duì)于設(shè)備的角度(或者在完整3d軌跡的情況下,為兩個(gè)角度,方位角和仰角)。然后可以使用公式1或圖10來(lái)修改每個(gè)對(duì)象的角度。參見圖15,其是該實(shí)現(xiàn)方式的示例框圖。來(lái)自麥克風(fēng)的信號(hào)可以被分成如框88所指示的對(duì)象及其時(shí)間相依方向,諸如例如,使用如在國(guó)際專利公開號(hào)wo2014/147442a1中所描述的特征,其全部?jī)?nèi)容通過(guò)引用并入本文。如框90所指示的,可以修改從88輸出的信號(hào)中的一些信號(hào)的方向。如框92所指示的,合成可以用于通過(guò)將對(duì)象搖攝到修改后的方向來(lái)產(chǎn)生多聲道信號(hào),諸如例如,r.sadek,c.kyriakakis在美國(guó)加利福尼亞州舊金山于2004年10月28日至31日的aes第117界會(huì)議上的“anovelmultichannelpanningmethodforstandardandarbitraryloudspeakerconfigurations”中所描述的。

如本文中所描述的特征可以用于基于相機(jī)選擇來(lái)自動(dòng)適應(yīng)編碼模式以提高質(zhì)量并且聚焦于相關(guān)信號(hào)??梢蕴峁┯糜谝曨l電話的新用例,其中講話者/揚(yáng)聲器/用戶作為敘述者而非整個(gè)場(chǎng)景的一部分。如本文中所描述的特征可以用于視頻電話、空間音頻捕獲、音頻處理、編碼和渲染。

在常規(guī)電影中,當(dāng)相機(jī)角度或視點(diǎn)改變時(shí),僅屏幕上可見的音頻源的位置改變。當(dāng)相機(jī)視點(diǎn)改變時(shí),屏幕上不可見的音頻源不會(huì)改變它們的方向。如本文中所描述的特征可以改變?cè)谄聊?顯示器上不可見的音頻源的方向/位置。在常規(guī)電影制作中,許多不同的方法用于保持音頻源的位置恒定,并且當(dāng)相機(jī)視點(diǎn)被改變時(shí),仍然與視頻匹配。然而,這些方法純粹是手動(dòng)的,并且在后期處理期間分開進(jìn)行。

傳統(tǒng)上,低比特率語(yǔ)音編碼集中于將可理解語(yǔ)音信號(hào)從講話者傳遞到聽眾。該目標(biāo)的一個(gè)實(shí)際含義是除活動(dòng)語(yǔ)音之外的所有信號(hào)都被認(rèn)為是可以被抑制或去除的噪聲。然而,在高質(zhì)量的服務(wù)中,這個(gè)想法是越來(lái)越經(jīng)常把大多數(shù)其他信號(hào)認(rèn)為想要為聽眾復(fù)制的環(huán)境信息(盡管維持語(yǔ)音信號(hào)的可理解性的想法確實(shí)與低比特率應(yīng)用相關(guān))。因此,最高優(yōu)先級(jí)是語(yǔ)音,但環(huán)境信號(hào)也是感興趣的。事實(shí)上,在一些情況下,它們的重要性可能至少暫時(shí)會(huì)超過(guò)語(yǔ)音信號(hào)的重要性。

當(dāng)使用具有多于一個(gè)的相機(jī)的移動(dòng)設(shè)備來(lái)記錄視頻(并且可能在視頻呼叫中傳輸)時(shí),用戶可以在記錄期間改變相機(jī)。常規(guī)上講,這改變相機(jī)的視點(diǎn),但是它不改變麥克風(fēng)的位置。因此,對(duì)于常規(guī)設(shè)備,在音頻源位置和視點(diǎn)中的至少一個(gè)視點(diǎn)中的視頻之間存在差異。第一簡(jiǎn)單解決方案可能保持音頻源位置(即,音頻空間圖像)固定在一個(gè)相機(jī)上,但是這可能意味著空間圖像對(duì)于所有其他相機(jī)可能是錯(cuò)誤的。第二簡(jiǎn)單解決方案可能為每個(gè)相機(jī)不同地重新指派所使用的麥克風(fēng),但是每當(dāng)所使用的相機(jī)被改變時(shí),這可能導(dǎo)致音頻信號(hào)的煩人改變。如本文中所描述的特征提出了幾種改善情形的方法。

還參考圖16,示出了幫助可視化如本文中所描述的特征中的一些特征的圖。如上文所指出的,在視頻呼叫或視頻記錄期間的音頻聲音可以被分成語(yǔ)音信號(hào)和環(huán)境信號(hào)。當(dāng)進(jìn)行視頻呼叫或記錄時(shí),經(jīng)常利用設(shè)備10上的多于一個(gè)的相機(jī)(或作為記錄系統(tǒng)的一部分)。前置相機(jī)32可以捕獲用戶100的臉部,并且主相機(jī)30可以例如在(移動(dòng))呼叫期間用于捕獲用戶在使用設(shè)備的同時(shí)看到的大部分內(nèi)容。圖16以概念和簡(jiǎn)化水平圖示了來(lái)自講話者100的講話者/揚(yáng)聲器信號(hào)和環(huán)境信號(hào)如何可以由圖1所示的兩個(gè)麥克風(fēng)38、39捕獲,然后在這樣的系統(tǒng)(其中優(yōu)于單聲道記錄和渲染并且假設(shè)耳機(jī)聆聽)中被渲染(回放)給用戶100'(其可以是諸如在視頻呼叫期間或許使用不同的設(shè)備10'的同一個(gè)人100或不同的人)。更簡(jiǎn)單的系統(tǒng)根本不會(huì)適應(yīng)相機(jī)視圖的改變。

如從圖16中可以看出,講話者100總是被認(rèn)為是整個(gè)場(chǎng)景/環(huán)境的一部分,而不管如圖區(qū)域102所指示的正在使用前置相機(jī)還是如圖區(qū)域104所指示的使用設(shè)備主相機(jī)。因此,對(duì)于由麥克風(fēng)捕獲的所有聲音(講話者和環(huán)境),左是左,右是右,只有在講話者和環(huán)境信號(hào)回放期間的位置似乎相對(duì)于聽眾100'而改變(以自然方式)。

一方面是通過(guò)利用空間多麥克風(fēng)捕獲來(lái)實(shí)現(xiàn)在該框架中更好地分離語(yǔ)音信號(hào)和環(huán)境信號(hào),并且因此允許集中于在每個(gè)用例中被認(rèn)為是更重要的聲音。因此,當(dāng)如102所指示的使用前置相機(jī)時(shí),從相機(jī)的直視圖發(fā)出的信號(hào)可以被視為所保留的主信號(hào),同時(shí)可以降低其他信號(hào)(環(huán)境)的增益。這可以做到,因?yàn)轭A(yù)期當(dāng)用戶選擇示出他/她的臉時(shí),語(yǔ)音信號(hào)是最重要的信號(hào)。另一方面,當(dāng)如104所指示的主相機(jī)用于示出整個(gè)場(chǎng)景時(shí),所有聲源(包括現(xiàn)在最可能在設(shè)備背后的講話者)可以被期望是感興趣的。

例如,在pct公開號(hào)wo2013/093187a2中描述的技術(shù)可以用于實(shí)現(xiàn)上述分離,其通過(guò)引用整體并入本文。然而,如本文中所描述的,在視頻呼叫中利用前置相機(jī)或主相機(jī)可以用于觸發(fā)來(lái)自多個(gè)模式的優(yōu)選音頻捕獲模式。在更一般的術(shù)語(yǔ)中,利用具體相機(jī)可以觸發(fā)捕獲模式的默認(rèn)設(shè)置,其可以隨后可選地由用戶進(jìn)行調(diào)整。另外,面部跟蹤方法可以用于進(jìn)一步增強(qiáng)捕獲對(duì)現(xiàn)實(shí)世界情景的適應(yīng)性。特別地,當(dāng)在前置相機(jī)的視圖中找不到講話者的臉部時(shí),設(shè)備前面(而非視圖中)的聲源的環(huán)境增益可能不會(huì)降低。這樣的聲源實(shí)際上可能是講話者。還可以例如通過(guò)使用話音活動(dòng)檢測(cè)(vad)或類似技術(shù)來(lái)檢測(cè)語(yǔ)音信號(hào)的存在。

因此,實(shí)施例可以自動(dòng)地允許改進(jìn)語(yǔ)音信號(hào)編碼(當(dāng)使用前置相機(jī)時(shí))的保真度,并且適應(yīng)相同水平下的編碼語(yǔ)音和環(huán)境信號(hào)(當(dāng)用戶切換到主相機(jī)時(shí))。

如上文關(guān)于權(quán)利要求6所指出的,一種實(shí)施例允許講話者(主語(yǔ)音信號(hào))和環(huán)境信號(hào)的更具體的分離。如圖16所看到的,當(dāng)在由如102所圖示的前置相機(jī)和如104所圖示的設(shè)備主相機(jī)之間進(jìn)行切換時(shí),講話者的方位遵循視頻鏡頭的方位。實(shí)際上,當(dāng)談話者被認(rèn)為是環(huán)境的一部分并且聽眾想體驗(yàn)如身臨其境的場(chǎng)景時(shí),這可以被認(rèn)為是自然和優(yōu)選的渲染方式。

在該實(shí)施例中,空間多麥克風(fēng)捕獲可以用于分離設(shè)備的每一側(cè)上的信號(hào)。至少,聲音和與前置相機(jī)側(cè)和設(shè)備主相機(jī)側(cè)有關(guān)的聲音源可以分開。進(jìn)一步地,主語(yǔ)音信號(hào)可以與前置相機(jī)側(cè)環(huán)境信號(hào)分離。

示例實(shí)施例可以將語(yǔ)音信號(hào)的左聲道和右聲道(或任何數(shù)目個(gè)聲道)相對(duì)于設(shè)備維持靜態(tài),而不管有源相機(jī)的切換。另一方面,環(huán)境信號(hào)可能如由相機(jī)視圖的切換觸發(fā)來(lái)切換。當(dāng)利用前置相機(jī)時(shí),講話者因此被維持,并且環(huán)境可以被抑制(至少稍微)。當(dāng)視圖切換到主相機(jī)時(shí),講話者可以維持在先前方位,但環(huán)境信號(hào)遵循新的相機(jī)視圖,并且抑制變?yōu)榱?或其他默認(rèn)值)。圖17圖示了高水平下的捕獲和渲染。

在一些實(shí)施例中,當(dāng)設(shè)備捕獲多聲道音頻時(shí),語(yǔ)音信號(hào)可以是單聲道的(例如,所講出的單詞由單聲道耳機(jī)或麥克風(fēng)來(lái)捕獲)。在這些實(shí)施例中,可以使用相同的分離原理和環(huán)境信號(hào)的抑制。語(yǔ)音信號(hào)可以被感知為單聲源(使用預(yù)先定義的搖攝),或者當(dāng)來(lái)自其他麥克風(fēng)信號(hào)的可聽見的提示被用于提供語(yǔ)音信號(hào)的定向多聲道渲染時(shí),語(yǔ)音信號(hào)變成定向。在各種實(shí)施例中,設(shè)備方位(縱向、橫向)可以導(dǎo)致與例如左和右信號(hào)相對(duì)應(yīng)的麥克風(fēng)的選擇。由此可見,根據(jù)設(shè)備方位,不同的麥克風(fēng)集合或麥克風(fēng)配對(duì)與左和右相對(duì)應(yīng)。

一種示例方法,可以包括:從裝置的麥克風(fēng)生成相應(yīng)的音頻信號(hào);確定裝置的多個(gè)相機(jī)中的哪些相機(jī)已經(jīng)被選擇以供使用;以及基于所確定的被選擇以供使用的相機(jī),為要被處理的音頻信號(hào)選擇音頻處理模式,其中音頻處理模式基于所確定的被選擇以供使用的相機(jī)來(lái)至少部分地自動(dòng)調(diào)整音頻信號(hào)。

該方法還可以包括:從音頻信號(hào)產(chǎn)生單獨(dú)的語(yǔ)音信號(hào)。該方法可以包括:基于所確定的被選擇以供使用的相機(jī)來(lái)衰減音頻信號(hào),然后將單獨(dú)的語(yǔ)音信號(hào)與衰減的音頻信號(hào)進(jìn)行組合。在比承載衰減的音頻信號(hào)的所有聲道更少的聲道上,單獨(dú)的語(yǔ)音信號(hào)可以與衰減的音頻信號(hào)進(jìn)行組合。僅在一個(gè)承載衰減的音頻信號(hào)的聲道上,單獨(dú)的語(yǔ)音信號(hào)可以與衰減的音頻信號(hào)進(jìn)行組合。該方法可以包括:基于所確定的被選擇以供使用的相機(jī)來(lái)衰減音頻信號(hào),并且在單獨(dú)的聲道上提供單獨(dú)的語(yǔ)音信號(hào),而非衰減的音頻信號(hào)。從音頻信號(hào)產(chǎn)生單獨(dú)的語(yǔ)音信號(hào)可以包括:使用面部檢測(cè)。該方法可以包括:當(dāng)被選擇以供使用的相機(jī)包括第一相機(jī)時(shí),將來(lái)自麥克風(fēng)中的第一麥克風(fēng)的音頻信號(hào)指派為左聲道信號(hào)、并且將來(lái)自麥克風(fēng)中的第二麥克風(fēng)的音頻信號(hào)指派為右聲道信號(hào);以及當(dāng)被選擇以供使用的相機(jī)包括第二相機(jī)時(shí),將來(lái)自第一麥克風(fēng)的音頻信號(hào)指派為右聲道信號(hào)、并且將來(lái)自第二麥克風(fēng)的音頻信號(hào)指派為左聲道信號(hào)。該方法還可以包括:從音頻信號(hào)產(chǎn)生單獨(dú)的語(yǔ)音信號(hào),并且當(dāng)?shù)谝幌鄼C(jī)或第二相機(jī)被選擇時(shí),保持與單獨(dú)的語(yǔ)音信號(hào)相對(duì)應(yīng)的空間方向基本上不變。

當(dāng)被選擇以供使用的相機(jī)從第一相機(jī)切換到第二相機(jī)時(shí),在第一麥克風(fēng)和第二麥克風(fēng)之間緩慢轉(zhuǎn)動(dòng)由第一麥克風(fēng)和第二麥克風(fēng)接收的聲音的聽覺(jué)圖像。該方法可以包括:當(dāng)被選擇以供使用的相機(jī)包括第一相機(jī)時(shí),為要被處理的音頻信號(hào)選擇音頻處理模式中的第一音頻處理模式;以及當(dāng)被選擇以供使用的相機(jī)包括第二相機(jī)時(shí),為要被處理的音頻信號(hào)選擇音頻處理模式中的不同的第二音頻處理模式,其中第一相機(jī)和第二相機(jī)面對(duì)不同的方向,并且還包括:從用于第一模式的音頻信號(hào)產(chǎn)生單獨(dú)的語(yǔ)音信號(hào),而不從用于第二模式的音頻信號(hào)產(chǎn)生單獨(dú)的語(yǔ)音信號(hào)。

可以在一種裝置中提供實(shí)施例,該裝置包括至少一個(gè)處理器;以及至少一個(gè)非暫態(tài)存儲(chǔ)器,其包括計(jì)算機(jī)程序代碼,至少一個(gè)存儲(chǔ)器和計(jì)算機(jī)程序代碼被配置成與至少一個(gè)處理器一起使得裝置:確定裝置的多個(gè)相機(jī)中的哪些相機(jī)已經(jīng)被選擇以供使用;以及基于所確定的被選擇以供使用的相機(jī),為來(lái)自裝置的麥克風(fēng)的要被處理的音頻信號(hào)選擇音頻處理模式,其中音頻處理模式基于所確定的被選擇以供使用的相機(jī)來(lái)至少部分地自動(dòng)調(diào)整音頻信號(hào)。

至少一個(gè)存儲(chǔ)器和計(jì)算機(jī)程序代碼可以被配置成與至少一個(gè)處理器一起使得裝置:從音頻信號(hào)產(chǎn)生單獨(dú)的語(yǔ)音信號(hào)。至少一個(gè)存儲(chǔ)器和計(jì)算機(jī)程序代碼可以被配置成與至少一個(gè)處理器一起使得裝置:基于所確定的被選擇以供使用的相機(jī)來(lái)衰減音頻信號(hào),然后將單獨(dú)的語(yǔ)音信號(hào)與衰減的音頻信號(hào)進(jìn)行組合。至少一個(gè)存儲(chǔ)器和計(jì)算機(jī)程序代碼可以被配置成與至少一個(gè)處理器一起使得裝置:在比承載衰減的音頻信號(hào)的所有聲道更少的聲道上,將單獨(dú)的語(yǔ)音信號(hào)與衰減的音頻信號(hào)進(jìn)行組合。至少一個(gè)存儲(chǔ)器和計(jì)算機(jī)程序代碼可以被配置成與至少一個(gè)處理器一起使得裝置:僅在一個(gè)承載衰減的音頻信號(hào)的聲道上,將單獨(dú)的語(yǔ)音信號(hào)與衰減的音頻信號(hào)進(jìn)行組合。至少一個(gè)存儲(chǔ)器和計(jì)算機(jī)程序代碼可以被配置成與至少一個(gè)處理器一起使得裝置:基于所確定的被選擇以供使用的相機(jī)來(lái)衰減音頻信號(hào),并且在單獨(dú)的聲道上提供單獨(dú)的語(yǔ)音信號(hào),而非衰減的音頻信號(hào)。至少一個(gè)存儲(chǔ)器和計(jì)算機(jī)程序代碼可以被配置成與至少一個(gè)處理器一起使得裝置:使用面部檢測(cè)從音頻信號(hào)中產(chǎn)生單獨(dú)的語(yǔ)音信號(hào)。至少一個(gè)存儲(chǔ)器和計(jì)算機(jī)程序代碼可以被配置成與至少一個(gè)處理器一起使得裝置:當(dāng)被選擇以供使用的相機(jī)包括第一相機(jī)時(shí),將來(lái)自麥克風(fēng)中的第一麥克風(fēng)的音頻信號(hào)指派為左聲道信號(hào)、并且將來(lái)自麥克風(fēng)中的第二麥克風(fēng)的音頻信號(hào)指派為右聲道信號(hào);以及當(dāng)被選擇以供使用的相機(jī)包括第二相機(jī)時(shí),將來(lái)自第一麥克風(fēng)的音頻信號(hào)指派為右聲道信號(hào)、并且將來(lái)自第二麥克風(fēng)的音頻信號(hào)指派為左聲道信號(hào)。至少一個(gè)存儲(chǔ)器和計(jì)算機(jī)程序代碼可以被配置成與至少一個(gè)處理器一起使得裝置:從音頻信號(hào)產(chǎn)生單獨(dú)的語(yǔ)音信號(hào),并且當(dāng)?shù)谝幌鄼C(jī)或第二相機(jī)被選擇時(shí),維持與單獨(dú)的語(yǔ)音信號(hào)相對(duì)應(yīng)的方向信息基本上不變。至少一個(gè)存儲(chǔ)器和計(jì)算機(jī)程序代碼可以被配置成與至少一個(gè)處理器一起使得裝置:在選擇以供使用的相機(jī)從第一相機(jī)切換到第二相機(jī)時(shí),在左聲道和右聲道之間緩慢轉(zhuǎn)動(dòng)由第一麥克風(fēng)和第二麥克風(fēng)接收的聲音的聽覺(jué)圖像。至少一個(gè)存儲(chǔ)器和計(jì)算機(jī)程序代碼可以被配置成與至少一個(gè)處理器一起使得裝置:當(dāng)被選擇以供使用的相機(jī)包括第一相機(jī)時(shí),為要被處理的音頻信號(hào)選擇音頻處理模式中的第一音頻處理模式;以及當(dāng)被選擇以供使用的相機(jī)包括第二相機(jī)時(shí),為要被處理的音頻信號(hào)選擇音頻處理模式中的不同的第二音頻處理模式,其中第一相機(jī)和第二相機(jī)面向不同的方向,并且還包括:從用于第一模式的音頻信號(hào)產(chǎn)生單獨(dú)的語(yǔ)音信號(hào),而不從用于第二模式的音頻信號(hào)產(chǎn)生單獨(dú)的語(yǔ)音聲音信號(hào)。

可以在可由機(jī)器讀取的非暫態(tài)程序存儲(chǔ)設(shè)備中提供示例實(shí)施例,諸如例如,圖3中的存儲(chǔ)器24,其有形地體現(xiàn)可由機(jī)器執(zhí)行的用于執(zhí)行操作的指令程序,這些操作包括:確定裝置的多個(gè)相機(jī)中的哪些相機(jī)已經(jīng)被選擇以供使用;以及基于所確定的被選擇以供使用的相機(jī),為來(lái)自裝置的麥克風(fēng)的要被處理的音頻信號(hào)選擇音頻處理模式,其中音頻處理模式基于所確定的被選擇以供使用的相機(jī)來(lái)至少部分地自動(dòng)調(diào)整音頻信號(hào)。

一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)的任何組合可以用作存儲(chǔ)器。計(jì)算機(jī)可讀介質(zhì)可以是計(jì)算機(jī)可讀信號(hào)介質(zhì)或非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)不包括傳播信號(hào),并且可以是例如但不限于電子、磁性、光學(xué)、電磁、紅外或半導(dǎo)體系統(tǒng)、裝置或設(shè)備、或前述的任何合適組合。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的更具體的示例(非詳盡列表)將包括以下各項(xiàng):具有一條或多條電線的電連接、便攜式計(jì)算機(jī)軟盤、硬盤、隨機(jī)存取存儲(chǔ)器(ram)、只讀存儲(chǔ)器(rom)、可擦除可編程只讀存儲(chǔ)器(eprom或閃存)、光纖、便攜式光盤只讀存儲(chǔ)器(cd-rom)、光存儲(chǔ)設(shè)備、磁存儲(chǔ)設(shè)備、或前述的任何合適組合。

一種示例實(shí)施例,可以包括:用于從裝置的麥克風(fēng)生成音頻信號(hào)的器件;用于確定裝置的多個(gè)相機(jī)中的哪些相機(jī)已經(jīng)被選擇以供使用的器件;以及用于基于所確定的被選擇以供使用的相機(jī),為要被處理的音頻信號(hào)選擇音頻處理模式的器件,其中音頻處理模式基于所確定的被選擇以供使用的相機(jī)來(lái)至少部分地自動(dòng)調(diào)整音頻信號(hào)。

應(yīng)當(dāng)理解,先前描述僅僅是說(shuō)明性的。本領(lǐng)域技術(shù)人員可以設(shè)計(jì)出各種備選方案和修改。例如,各種從屬權(quán)利要求中記載的特征可以以任何合適的組合彼此組合。另外,來(lái)自上文所描述的不同實(shí)施例的特征可以被選擇性地組合成新的實(shí)施例。因而,該描述旨在涵蓋落在所附權(quán)利要求的范圍內(nèi)的所有這樣的備選方案、修改和變型。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
兴安县| 韶关市| 息烽县| 安义县| 玉溪市| 普兰店市| 威海市| 沧州市| 台州市| 水富县| 镇沅| 巴塘县| 湖口县| 钦州市| 浦县| 秦皇岛市| 武平县| 东阳市| 枣强县| 峨眉山市| 朝阳县| 潞西市| 新源县| 大余县| 平利县| 四平市| 钦州市| 连州市| 沙坪坝区| 浪卡子县| 余庆县| 岳阳县| 马尔康县| 浠水县| 剑河县| 安徽省| 濮阳市| 城步| 阜新市| 大安市| 岱山县|