聲信號處理系統(tǒng)、聲信號解碼設備、該系統(tǒng)和設備中的處理方法、以及程序的制作方法

文檔序號：2824708閱讀：271來源：國知局

專利名稱：聲信號處理系統(tǒng)、聲信號解碼設備、該系統(tǒng)和設備中的處理方法、以及程序的制作方法
技術領域：
本發(fā)明涉及一種聲信號處理系統(tǒng)，并且具體地涉及對經編碼的聲信號進行向下混合(downmix)的聲信號處理系統(tǒng)、聲信號解碼設備、該系統(tǒng)和設備中的處理方法、以及使計算機執(zhí)行該方法的程序。
背景技術：
常規(guī)地，作為聲信號編碼設備，通常使用以下設備該設備通過將多個輸入信道的聲信號變換到頻域并對通過該變換獲得的頻域信號進行編碼來生成經編碼的聲數據。因此，對經編碼的聲數據進行解碼從而將頻域信號變換成時域信號并輸出這些信號作為輸出聲信號的聲信號解碼設備已經變得普遍。許多這樣的聲信號解碼設備具有以下功能基于用于將輸出聲信號的輸出信道的數目減小到輸入信道的數目以下的加權系數，輸出與小于輸入信道的數目的輸出信道的數目相對應的輸出聲信號。例如，已提出了一種編碼音頻解碼設備，其通過在將各輸入信道的頻域信號變換成時域信號之前利用加權系數執(zhí)行加權加法來輸出與輸出信道的數目相對應的經解碼的音頻(例如參見PTL1)。在該編碼音頻解碼設備中，基于示出關于各頻域信號的變換長度的變換函數選擇信息，通過根據其變換長度使輸入信道的頻域信號彼此相關聯(lián)來執(zhí)行加權加法。這是因為，除非對各輸入信道的頻域信號執(zhí)行的窗口化處理是相同的，否則無法對輸入信道的頻域信號執(zhí)行加權加法(混合)。引用文獻列表專利文獻PTLl 日本專利第3279228號(圖1)

發(fā)明內容
技術問題在上述相關技術中，對頻域信號執(zhí)行加權加法，由此可將頻域信號的信道的數目減小到輸入信道的數目之下。因此，可減少用于將頻域信號變換成時域信號的計算處理。然而，僅根據關于各信道的頻域信號的變換長度的類型來確定是否可執(zhí)行頻域上的加權加法，并且因此，如果頻域信號的變換長度是相同的，即使施加于頻域信號的窗口形狀彼此不同，仍可以混合頻域信號。例如，在AAC(高級音頻編碼)方法中，基于輸入聲信號的特性，既可改變變換長度，又可改變窗口形狀的類型。因此，如果僅基于頻域信號的變換長度來確定是否可執(zhí)行頻域上的混合，則可能將具有不同窗口形狀的頻域信號混合到一起，使得在某些情況下無法生成適當的輸出聲信號。鑒于這種情況，做出了本發(fā)明，并且其目的是在實現(xiàn)適當的輸出聲信號的生成的同時，對于從頻域到時域的信號變換處理，減少聲信號解碼設備的計算量。問題的解決方案做出了本發(fā)明以解決上述問題，并且本發(fā)明的第一方面是一種聲信號解碼設備、用于該設備的處理方法以及使計算機執(zhí)行該方法的程序，該聲信號解碼設備包括輸出控制單元，其被配置成基于窗口信息來執(zhí)行控制以同時輸出具有相同窗口信息的頻域信號，該窗口信息包括示出窗口函數類型的窗口形狀，該窗口函數類型與通過對多個輸入信道的聲信號執(zhí)行窗口化處理獲得的頻域信號有關；頻域混合單元，其被配置成基于向下混合信息來混合具有相同窗口信息的輸入信道的頻域信號，并且輸出這些信號作為與小于輸入信道的數目的輸出信道的數目相對應的頻域信號；以及輸出聲音生成單元，其被配置成通過將從頻域混合單元輸出的輸出信道的頻域信號變換成時域信號并通過對通過該變換獲得的時域信號執(zhí)行窗口化處理來生成輸出信道的聲信號。因此，提供了以下操作基于向下混合信息，將具有包括示出窗口函數類型的窗口形狀的相同窗口信息的頻域信號混合，由此將與小于輸入信道的數目的輸出信道的數目相對應的頻域信號變換成時域信號，以生成對應于輸出信道的數目的聲信號。另外，在第一方面中，針對多條窗口信息中的各個組合，頻域混合單元可以基于向下混合信息來混合輸入信道的頻域信號，并且輸出聲音生成單元可以通過將已對其執(zhí)行窗口化處理的各個組合的時域信號相加來生成輸出信道的聲信號。因此，提供了以下操作針對多條窗口信息中的各個組合，由頻域混合單元基于向下混合信息將頻域信號相加，從而生成輸出信道的聲信號。在這種情況下，在多條窗口信息中的組合的數目與輸出信道的數目的乘積值小于輸入信道的數目的情況下，輸出控制單元可以將輸入信道的頻域信號同時輸出到頻域混合單元。因此，僅在窗口信息中的組合的數目與輸出信道的數目的乘積值小于輸入信道的數目的情況下，可以基于向下混合信息，通過混合輸入信道的頻域信號來生成輸出信道的頻域信號。另外，在第一方面中，輸出控制單元可以基于窗口信息來控制頻域信號的輸出，該窗口信息是基于輸入信道的聲信號設置的并且包括示出窗口類型的窗口化形式，并且輸出聲音生成單元可以基于窗口信息中示出的窗口化形式和窗口函數類型，通過對輸出信道的頻域信號執(zhí)行窗口化處理來生成輸出信道的聲信號。因此，提供了以下操作基于窗口信息中的窗口化形式和窗口形狀的組合來混合各信道的頻域信號以生成輸出信道的頻域信號，將所生成的頻域信號變換成時域信號，并且基于窗口信息對這些時域信號執(zhí)行窗口化處理，從而生成聲信號。在這種情況下，輸出控制單元可以基于針對窗口化形式中的前半部分和后半部分示出窗口形狀的窗口信息來控制頻域信號的輸出。因此，提供了以下操作由輸出控制單元基于針對窗口化形式中的變換長度的前半部分和后半部分示出窗口形狀的窗口信息來切換頻域信號的輸出。另外，本發(fā)明的第二方面是一種聲信號處理系統(tǒng)，其包括聲信號編碼設備，該聲信號編碼設備包括窗口化處理單元，其被配置成對多個輸入信道的聲信號執(zhí)行窗口化處理并生成包括示出窗口化處理中的窗口函數類型的窗口形狀的窗口信息；以及頻率轉換單元，其被配置成將從窗口化處理單元輸出的聲信號變換到頻域，從而生成頻域信號，并且該聲信號處理系統(tǒng)包括聲信號解碼設備，該聲信號解碼設備包括輸出控制單元，其被配置成執(zhí)行控制以同時輸出頻域信號，這些頻域信號是從聲信號編碼設備輸出的并且具有相同的
5與輸入信道的頻域信號有關的窗口信息；頻域混合單元，其被配置成基于向下混合信息來混合具有相同窗口信息的輸入信道的頻域信號，并且輸出這些信號作為與小于輸入信道的數目的輸出信道的數目相對應的頻域信號；以及輸出聲音生成單元，其被配置成通過將從頻域混合單元輸出的輸出信道的頻域信號變換成時域信號并通過對通過該變換獲得的時域信號執(zhí)行窗口化處理來生成輸出信道的聲信號。因此，提供了以下操作將對應于輸出信道的數目的頻域信號變換成時域信號，這些頻域信號是通過基于向下混合信息來混合由聲信號編碼設備生成的輸入信道的頻域信號之中的具有相同窗口信息的頻域信號而生成的，并且對通過該變換獲得的時域信號執(zhí)行窗口化處理，從而生成輸出通道的聲信號。發(fā)明的有益效果根據本發(fā)明，能夠獲得以下有益效果在實現(xiàn)適當的輸出聲信號的生成的同時，對于從頻域到時域的信號變換處理，可以減小聲信號解碼設備中的計算量。

圖1是示出了根據本發(fā)明的第一實施例的聲信號處理系統(tǒng)的配置示例的框。圖2是示出了根據本發(fā)明的第一實施例的聲信號編碼設備200的配置示例的框圖。圖3是示出了由根據本發(fā)明的第一實施例的窗口化處理單元211至215生成的窗口信息中的組合的示例的圖。圖4是示出了根據本發(fā)明的第一實施例的聲信號解碼設備300的配置示例的框圖。圖5是示出了由根據本發(fā)明的第一實施例的聲信號解碼設備300執(zhí)行的用于對代碼串進行解碼的方法的處理步驟示例的流程圖。圖6是示出了根據本發(fā)明的第二實施例的聲信號解碼設備的配置示例的框圖。圖7是示出了由根據本發(fā)明的第二實施例的第一至第五輸出選擇單元711至715 選擇輸出目標的示例的圖。圖8是示出了由根據本發(fā)明的第二實施例的第一至第十六IMDCT/窗口化處理單元731至733和741至743執(zhí)行的窗口化處理的示例的圖。圖9是示出了由根據本發(fā)明的第二實施例的聲信號解碼設備600執(zhí)行的用于對代碼串進行解碼的方法的處理步驟示例的流程圖。圖10是示出了根據本發(fā)明的第三實施例的聲信號解碼設備的配置示例的框圖。圖11是示出了由根據本發(fā)明的第三實施例的聲信號解碼設備800執(zhí)行的用于對代碼串進行解碼的方法的處理步驟示例的流程圖。
具體實施例方式在下文中，將描述用于實施本發(fā)明的實施例(下文中稱作實施例)。將按照以下順序進行描述。1.第一實施例(向下混合控制基于窗口信息，在時域上的向下混合處理與頻域上的向下混合處理之間切換的示例)2.第二實施例(向下混合控制基于窗口信息，僅利用頻域信號執(zhí)行向下混合處理的示例)3.第三實施例(向下混合控制基于窗口信息的組合的數目，在時域上的向下混合處理與頻域上的向下混合處理之間切換的示例)<1.第一實施例>[聲信號編碼設備的配置示例]圖1是示出了根據本發(fā)明的第一實施例的聲信號處理系統(tǒng)的配置示例的框。聲信號處理系統(tǒng)100包括聲信號編碼設備200，其對與多個輸入信道的數目相對應的聲信號進行編碼；以及聲信號解碼設備300，其對經編碼的聲信號進行解碼并以小于輸入信道的數目的輸出信道的數目將其輸出。另外，聲信號處理系統(tǒng)100包括兩個揚聲器以聲波形式輸出從聲信號解碼設備300輸出的兩個信道的聲信號的右信道揚聲器110和左信道揚聲器 120。聲信號編碼設備200將從輸入端子101至105輸入的五個信道的聲信號變換成數字信號，并且對通過該變換獲得的數字信號進行編碼。向聲信號編碼設備200提供來自輸入端子101的右環(huán)繞信道(Rs)的聲信號，提供來自輸入端子102的右信道(R)的聲信號，并提供來自輸入端子103的中央信道(C)的聲信號。此外，向聲信號編碼設備200提供來自輸入端子104的左信道(L)的聲信號，并提供來自輸入端子105的左環(huán)繞信道(Ls)的聲信號。聲信號編碼設備200對從輸入端子101至105提供的、輸入信道的數目為五的各聲信號執(zhí)行編碼。另外，聲信號編碼設備200復用(multiplex)各經編碼的聲信號和關于該編碼的信息，從而將其作為經編碼的聲數據經由代碼串傳輸線301提供給聲信號解碼設備 300。聲信號解碼設備300對從代碼串傳輸線301提供的經編碼的聲數據進行解碼，從而生成與小于輸入信道的數目的輸出信道的數目相對應的兩個信道的聲信號。聲信號解碼設備300從經編碼的聲數據中提取經編碼的聲信號，并且對所提取的五個信道的經編碼的聲數據進行解碼，從而生成兩個信道的聲信號。另外，聲信號解碼設備300經由信號線111將所生成的兩個信道的聲信號之一 (即右信道的聲信號)輸出到右信道揚聲器110。另外，聲信號解碼設備300經由信號線 121將另一信號(即左信道的聲信號)輸出到左信道揚聲器120。以這種方式，在聲信號處理系統(tǒng)100中，由聲信號解碼設備300對被聲信號編碼設備200編碼的五個信道的聲信號進行解碼，使得兩個信道的聲信號輸出到揚聲器110和 120。注意，聲信號處理系統(tǒng)100是權利要求中描述的聲信號處理系統(tǒng)的示例。注意，盡管這里在假定輸入信道的數目和輸出信道的數目分別是五和二的情況下已給出描述作為示例，但是本發(fā)明并不局限于此。在本發(fā)明的實施例中，輸出信道的數目可以小于輸入信道的數目。例如，輸入信道的數目可以為三，并且輸出信道的數目可以為一。接下來，下面將參照附圖描述聲信號編碼設備200的具體配置示例。[聲信號編碼設備200的配置示例]圖2是示出了根據本發(fā)明的第一實施例的聲信號編碼設備200的配置示例的框圖。這里，作為示例，假定通過AAC標準實現(xiàn)聲信號編碼設備200。聲信號編碼設備200包括窗口化處理單元211至215、MDCT單元231至235、量化單元241至M5、代碼串生成單元250、以及向下混合信息接收單元沈0。根據各輸入信道的聲信號的特性，窗口化處理單元211至215分別對從輸入端子 101至105輸入的各輸入信道的聲信號執(zhí)行窗口化處理。也就是，窗口化處理單元211對右環(huán)繞信道的聲信號執(zhí)行窗口化處理，窗口化處理單元212對右信道的聲信號執(zhí)行窗口化處理，并且窗口化處理單元213對中央信道的聲信號執(zhí)行窗口化處理。另外，窗口化單元214 對左信道的聲信號執(zhí)行窗口化處理，并且窗口化單元215對左環(huán)繞信道的聲信號執(zhí)行窗口化處理。具體地，窗口化處理單元211至215以特定周期對聲信號進行采樣，并生成時域信號作為幀，該時域信號是通過該采樣獲得的2048個樣本的離散信號。窗口化處理單元211 至215使前一幀位移半幀(10M個樣本)，以生成下一幀。也就是，窗口化處理單元211至215生成下一幀，使得前一幀的后半部分(半幀) 與下一幀的前半部分重疊。因此，可以抑制在MDCT單元231至235中通過MDCT (修正離散余弦變換)生成的頻域信號的數據量。另外，窗口化處理單元211至215對幀執(zhí)行窗口化處理，以抑制通過將聲信號劃分成幀而出現(xiàn)的失真。具體地，根據AAC的規(guī)定，基于各信道的時域信號的特性，窗口化處理單元211至215針對一個幀從表示四種窗口類型的窗口化形式之中選擇窗口化形式。窗口化處理單元211至215針對所選擇的窗口化形式中的前半部分和后半部分中的每一個，選擇表示兩種窗口函數類型的窗口形狀中的任一個。此時，窗口化處理單元211 至215選擇與前一幀的后半部分相同的窗口形狀作為當前幀的前半部分的窗口形狀，以消除當前幀與前一幀之間的連接失真。也就是，窗口化處理單元211至215針對在當前幀與前一幀之間的重疊部分選擇相同的窗口形狀?；谒x擇的窗口化形式和關于該形式的前半部分和后半部分的窗口形狀，窗口化處理單元211至215對時域信號執(zhí)行窗口化處理，并生成示出窗口化形式和窗口形狀的組合的窗口信息。另外，窗口化處理單元211至215將已對其執(zhí)行窗口化處理的各時域信號提供給 MDCT單元231至235。另外，窗口化處理單元211至215經由窗口信息線221至225將各個輸入信道的窗口信息提供給代碼串生成單元250，以在聲信號解碼設備300中生成聲信號。注意，窗口化處理單元211至215是權利要求中描述的聲信號編碼設備中的窗口化處理單元的示例。MDCT單元231至235將從各個窗口化處理單元211至215提供的時域信號變換成頻域信號。也就是，MDCT單元231至235將從窗口化處理單元211至215輸出的聲信號變換到頻域，從而生成頻域信號。具體地，MDCT單元231至235利用MDCT處理來變換時域信號，從而生成作為MDCT系數的頻域信號(頻譜)。另外，MDCT單元231至235將作為所生成的頻域信號的、已對其執(zhí)行窗口化處理的各個頻域信號提供給量化單元241至M5。注意，MDCT單元231至235是權利要求中描述的聲信號編碼設備中的頻率轉換單元的示例。量化單元241至245對從MDCT單元231至235提供的、對應于各個輸入信道的各個頻域信號進行量化。例如，量化單元241至245基于人類的聽覺特性來執(zhí)行量化，并鑒于由該聽覺特性引起的遮蔽效應來控制量化噪聲。另外，量化單元241至245將各個量化頻域信號提供給代碼串生成單元250。向下混合信息接收單元260接收用于使輸出信道的數目小于輸入信道的數目的向下混合信息。例如，向下混合信息接收單元260接收用于對每個輸入信道設置加權系數的向下混合系數的值。向下混合信息接收單元260將所接收的向下混合信息輸出到代碼串生成單元250。注意，雖然這里描述了在聲信號編碼設備200中設置向下混合信息的示例，但是可以在聲信號解碼設備300中設置向下混合信息。代碼串生成單元250對從量化單元241至245提供的量化頻域信號、從窗口化處理單元211至215提供的窗口信息、以及從向下混合信息接收單元260提供的向下混合信息進行編碼，從而生成一個代碼串。代碼串生成單元250通過分別對各輸入信道的經量化的頻域信號進行編碼來生成經編碼的聲數據。另外，編碼串生成單元250將各輸入信道的經編碼的窗口信息和向下混合信息復用為經編碼的聲數據，從而將其作為一個代碼串(比特流)提供給代碼串傳輸線301。以這種方式，聲信號編碼設備200基于各輸入信道的聲信號，從MDCT變換中的多個組合的窗口化處理之中選擇一個窗口化處理，并且對時域信號執(zhí)行所選擇的窗口化處理。另外，聲信號編碼設備200經由代碼串傳輸線301將經編碼的聲數據傳輸到聲信號解碼設備300，在該經編碼的聲數據中復用已對其執(zhí)行窗口化處理的頻域信號和關于這些頻域信號的窗口信息?，F(xiàn)在，下面將參照附圖簡要描述由各個窗口化處理單元211至215生成的窗口信息的組合。[由窗口化處理單元211至215生成的窗口信息的示例]圖3是示出了由根據本發(fā)明的第一實施例的窗口化處理單元211至215生成的窗口信息中的窗口化形式和窗口形狀的組合的示例的圖。這里，作為窗口信息270中的組合，示出了窗口化形式271和關于窗口化形式271的前半部分和后半部分的窗口形狀272的組
I=I ο窗口化形式271示出了四種窗口化形式(長窗口、開始窗口、短窗口和停止窗口) 作為窗口類型。另外，窗口化形式271在概念上表示關于一個幀的窗口化形式。這里，窗口化形式271中的實線部分對應于窗口形狀272中的前半部分，并且窗口化形式271中的虛線部分對應于窗口形式272中的后半部分。在窗口化形式271中，基本上，基于輸入信道的聲信號的特性來選擇長窗口和短窗口中的任一個。窗口化形式271中的長窗口是具有2048個樣本的變換長度(作為MDCT 的變換區(qū)間)的窗口化形式，并且在聲信號的水平的波動小的情況下選擇該長窗口。另一方面，窗口化形式271中的短窗口具有256個樣本的MDCT的變換長度，并且在聲信號的水平突然改變的情況(如在起聲(attack sound)中那樣)下選擇該短窗口。這里，示出了八個短窗口。這是因為在選擇短窗口的情況下，利用關于一個幀的八個短窗口生成頻域信號。因此，與在長窗口中相比，可以準確地生成輸入信道的聲信號的頻率分量，并且由此甚至在聲信號的信號水平急劇改變的幀中也可以抑制聽覺噪聲。另外，在窗口化形式271中，選擇開始窗口或停止窗口，以根據長窗口與短窗口之間的切換來抑制相鄰幀之間的連接失真。窗口化形式271中的開始窗口是具有2048個樣本的MDCT的變換長度的窗口化形式，并且當執(zhí)行從長窗口到短窗口的切換時選擇該開始窗口。例如，在檢測到起聲的情況下，緊接在選擇短窗口之前選擇開始窗口。
另外，窗口化形式271中的停止窗口是具有2048個樣本的MDCT的變換長度的窗口化形式，并且當執(zhí)行從短窗口到長窗口的切換時選擇該停止窗口。也就是，在起聲部分結束之后，緊接在選擇長窗口之前選擇停止窗口。在窗口形狀272中的前半部分和后半部分中，示出兩種窗口形狀(正弦和KBD)，作為施加到窗口化形式的窗口函數類型。對于這里的窗口形狀272中的前半部分和后半部分，關于窗口化形式271中的當前變換區(qū)間，在時間軸上與前一變換區(qū)間重疊的區(qū)間是前半部分，并且與下一變換區(qū)間重疊的區(qū)間是后半部分。窗口形狀272中的正弦表示已選擇正弦窗口作為窗口函數。窗口形狀272中的 KBD表示已選擇KBD(Kaiser-Bessel推導)窗口作為窗口函數。另外，在MDCT處理中，對于當前幀中的與前一變換區(qū)間重疊的部分(前半部分或后半部分)，需要選擇與施加到前一變換區(qū)間相同的窗口形狀，以抑制連接失真。以這種方式，在窗口信息270中，基于四種窗口化形式和施加到這些窗口化形式中的前半部分和后半部分的兩個窗口形狀來選擇窗口化處理，并且由此存在最大的十六個組合281至四6。這里，由于輸入信道是五個信道，所以窗口信息270中的組合的數目最大為五。接下來，下面將參照附圖描述聲信號解碼設備300的配置示例。[聲信號解碼設備300的配置示例]圖4是示出了根據本發(fā)明的第一實施例的聲信號解碼設備300的配置示例的框圖。聲信號解碼設備300包括代碼串分離單元310、解碼/去量化單元320、輸出控制單元340、輸出開關單元351至355、加法單元361和362、時域合成單元400以及頻域合成單元500。另外，時域合成單元400包括IMDCT/窗口化處理單元411至415和時域混合單元 420。此外，頻域合成單元500包括頻域混合單元510和輸出聲音生成單元520。輸出聲音生成單元520包括IMDCT/窗口化處理單元521和522。代碼串分離單元310使從代碼串傳輸線301提供的代碼串分離。代碼串分離單元 310基于從代碼串傳輸線301提供的代碼串將代碼串分離成輸入信道的經編碼的聲數據、各輸入信道的窗口信息以及向下混合信息。另外，代碼串分離單元310將各輸入信道的經編碼的聲數據和窗口信息提供給解碼/去量化單元320。也就是，代碼串分離單元310將右環(huán)繞信道的經編碼的聲數據提供給信號線321，將右信道的經編碼的聲數據提供給信號線322，并且將中央信道的經編碼的聲數據提供給信號線323。此外，代碼串分離單元310將左信道的經編碼的聲數據提供給信號線324，并且將左環(huán)繞信道的經編碼的聲數據提供給信號線325。此外，代碼串分離單元310經由窗口信息線311將各輸入信道的窗口信息提供給輸出控制單元340。另外，代碼串分離單元310經由向下混合信息線312將向下混合信息提供給時域混合單元420和頻域混合單元510。解碼/去量化單元320對各輸入信道的經編碼的聲數據進行解碼和去量化，從而生成作為MDCT系數的頻域信號。解碼/去量化單元320根據輸出控制單元340的控制將各輸入信道的所生成的頻域信號和窗口信息提供給時域合成單元400和頻域合成單元500 中的任一個。
10
具體地，解碼/去量化單元320分別將各輸入信道的所生成的頻域信號提供給輸出開關單元351至355。也就是，解碼/去量化單元320將右環(huán)繞信道的頻域信號提供給信號線331，將右信道的頻域信號提供給信號線332，并且將中央信道的頻域信號提供給信號線333。此外，解碼/去量化單元320將左信道的頻域信號提供給信號線334，并且將左環(huán) 繞信道的頻域信號提供給信號線335。輸出開關單元351至355是用于根據輸出控制單元340的控制將從信號線331至 335提供的頻域信號輸出到時域合成單元400和頻域合成單元500中的任一個的開關。輸出開關單元351至355根據輸出控制單元340的控制同時將所有輸入信道的頻域信號輸出到IMDCT/窗口化處理單元411至415或頻域混合單元510。輸出控制單元340基于包括在從窗口信息線311提供的各輸入信道的窗口信息中的窗口化形式和窗口形狀來切換輸出開關單元351至355的連接。也就是，輸出控制單元 340基于圖3中示出的窗口信息中的窗口化形式與窗口化形式中的前半部分和后半部分的窗口形狀的組合來控制輸入信道的頻域信號的輸出目標。輸出控制單元340確定各輸入信道的窗口信息是否彼此匹配。于是，如果所有窗口信息匹配，則輸出控制單元340控制輸出開關單元351至355，以將信號線331至335連接到頻域混合單元510。另一方面，如果所有窗口信息不匹配，則輸出控制單元340控制輸出開關單元351 至355，以將信號線331至335連接到IMDCT/窗口化處理單元411至415。也就是，輸出控制單元340基于包括表示窗口函數類型的窗口形狀的窗口信息來控制輸出開關單元351至 355，使得具有相同窗口信息的頻域信號同時輸出到頻域混合單元510。注意，輸出控制單元 340是權利要求中描述的輸出控制單元的示例。時域合成單元400將輸入信道的各頻域信號變換成時域信號，并且隨后基于從代碼串分離單元310提供的向下混合信息將輸入信道的時域信號合成為輸出信道的時域信號。也就是，時域合成單元400將五個信道的頻域信號變換成頻域信號，并且然后基于向下混合信息將五個信道的時域信號合成為兩個信道的時域信號。IMDCT/窗口化處理單元411至415基于窗口信息和從信號線331至335提供的頻域信號來生成輸入信道的時域信號。IMDCT/窗口化處理單元411至415基于包括在窗口信息中的窗口化形式，利用IMDCT(逆MDCT)將各頻域信號變換成時域信號。另外，IMDCT/窗口化處理單元411至415基于從代碼串分離單元310提供的窗口信息對通過該變換獲得的時域信號執(zhí)行窗口化處理。另外，IMDCT/窗口化處理單元411至 415將已對其執(zhí)行窗口化處理的各時域信號提供給時域混合單元420。時域混合單元420基于從代碼串分離單元310提供的向下混合信息來混合從 IMDCT/窗口化處理單元411至415提供的五個信道的時域信號，從而生成兩個信道的時域信號。也就是，時域混合單元420基于從代碼串分離單元310提供的向下混合信息和輸入信道的時域信號來生成比輸入信道少的輸出信道的時域信號。例如，根據AAC的規(guī)定，時域混合單元420通過基于以下等式混合五個信道的時域信號來生成兩個信道的時域信號。[數1]
權利要求
1.一種聲信號解碼設備，包括輸出控制單元，其被配置成基于窗口信息來執(zhí)行控制以同時輸出具有相同的所述窗口信息的頻域信號，所述窗口信息包括示出窗口函數類型的窗口形狀，所述窗口函數類型與通過對多個輸入信道的聲信號執(zhí)行窗口化處理獲得的所述頻域信號有關；頻域混合單元，其被配置成基于向下混合信息來混合具有相同的所述窗口信息的所述輸入信道的頻域信號，并且輸出所述信號作為與小于所述輸入信道的數目的輸出信道的數目相對應的頻域信號；以及輸出聲音生成單元，其被配置成通過將從所述頻域混合單元輸出的所述輸出信道的頻域信號變換成時域信號并通過對通過所述變換獲得的時域信號執(zhí)行所述窗口化處理來生成所述輸出信道的聲信號。
2.根據權利要求1所述的聲信號解碼設備，其中，針對所述多條窗口信息中的各個組合，所述頻域混合單元基于所述向下混合信息來混合所述輸入信道的頻域信號，以及其中，所述輸出聲音生成單元通過將已對其執(zhí)行所述窗口化處理的所述各個組合的所述時域信號相加來生成所述輸出信道的所述聲信號。
3.根據權利要求2所述的聲信號解碼設備，其中，在所述多條窗口信息中的所述組合的數目與所述輸出信道的數目的乘積值小于所述輸入信道的數目的情況下，所述輸出控制單元將所述輸入信道的所述頻域信號同時輸出到所述頻域混合單元。
4.根據權利要求1所述的聲信號解碼設備，其中，所述輸出控制單元基于所述窗口信息來控制所述頻域信號的輸出，所述窗口信息是基于所述輸入信道的聲信號設置的并且包括示出窗口類型的窗口化形式，以及其中，所述輸出聲音生成單元基于所述窗口信息中示出的所述窗口化形式和所述窗口函數類型，通過對所述輸出信道的所述頻域信號執(zhí)行所述窗口化處理來生成所述輸出信道的所述聲信號。
5.根據權利要求4所述的聲信號解碼設備，其中，所述輸出控制單元基于針對所述窗口化形式中的前半部分和后半部分示出所述窗口形狀的所述窗口信息來控制所述頻域信號的輸出。
6.一種聲信號處理系統(tǒng)，包括聲信號編碼設備，其包括窗口化處理單元，其被配置成對多個輸入信道的聲信號執(zhí)行窗口化處理，并生成包括示出所述窗口化處理中的窗口函數類型的窗口形狀的窗口信息；以及頻率轉換單元，其被配置成將從所述窗口化處理單元輸出的所述聲信號變換到頻域從而生成頻域信號；以及聲信號解碼設備，其包括輸出控制單元，其被配置成執(zhí)行控制以同時輸出所述頻域信號，所述頻域信號是從所述聲信號編碼設備輸出的并且具有相同的與所述輸入信道的所述頻域信號有關的所述窗口信息；頻域混合單元，其被配置成基于向下混合信息來混合具有相同的所述窗口信息的所述輸入信道的頻域信號，并且輸出所述信號作為與小于所述輸入信道的數目的輸出信道的數目相對應的頻域信號；以及輸出聲音生成單元，其被配置成通過將從所述頻域混合單元輸出的所述輸出信道的頻域信號變換成時域信號并通過對通過所述變換獲得的時域信號執(zhí)行所述窗口化處理來生成所述輸出信道的聲信號。
7.一種聲信號解碼方法，包括輸出控制步驟，其基于窗口信息來執(zhí)行控制以同時輸出具有相同的所述窗口信息的頻域信號，所述窗口信息包括示出窗口函數類型的窗口形狀，所述窗口函數類型與通過對多個輸入信道的聲信號執(zhí)行窗口化處理獲得的所述頻域信號有關；頻域混合步驟，其基于向下混合信息來混合具有相同的所述窗口信息的所述輸入信道的頻域信號，并且輸出所述信號作為與小于所述輸入信道的數目的輸出信道的數目相對應的頻域信號；以及輸出聲音生成步驟，其通過將所述頻域混合步驟輸出的所述輸出信道的頻域信號變換成時域信號并通過對通過所述變換獲得的時域信號執(zhí)行所述窗口化處理來生成所述輸出信道的聲信號。
8.一種程序，使計算機執(zhí)行輸出控制步驟，其基于窗口信息來執(zhí)行控制以同時輸出具有相同的所述窗口信息的頻域信號，所述窗口信息包括示出窗口函數類型的窗口形狀，所述窗口函數類型與通過對多個輸入信道的聲信號執(zhí)行窗口化處理獲得的所述頻域信號有關；頻域混合步驟，其基于向下混合信息來混合具有相同的所述窗口信息的所述輸入信道的頻域信號，并且輸出所述信號作為與小于所述輸入信道的數目的輸出信道的數目相對應的頻域信號；以及輸出聲音生成步驟，其通過將所述頻域混合步驟輸出的所述輸出信道的頻域信號變換成時域信號并通過對通過所述變換獲得的時域信號執(zhí)行所述窗口化處理來生成所述輸出信道的聲信號。
全文摘要
在實現(xiàn)適當的輸出聲信號的生成的同時，對于從頻域到時域的信號變換處理，減小聲信號解碼設備中的計算量。輸出控制單元340從代碼串分離單元310接收窗口信息，并且如果所有窗口信息相同，則將輸出開關單元351至355的連接切換到頻域混合單元510，這些窗口信息包括示出與輸入信道的窗口化處理有關的窗口函數類型的窗口形狀?；谑馆敵鲂诺赖臄的啃∮谳斎胄诺赖臄的康南蛳禄旌闲畔?，頻域混合單元510混合從解碼/去量化單元320提供的五個信道的頻域信號。IMDC/窗口化處理單元521和522將從頻域混合單元510輸出的兩個信道的頻域信號變換成時域信號，從而輸出這些信號作為兩個信道的聲信號。
文檔編號G10L19/00GK102119413SQ201080002207
公開日2011年7月6日申請日期2010年6月3日優(yōu)先權日2009年6月23日
發(fā)明者知念徹, 辻實申請人:索尼公司

完整全部詳細技術資料下載