欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

聲音分析裝置、聲音分析合成裝置、校正規(guī)則信息生成裝置、聲音分析系統(tǒng)、聲音分析方法...的制作方法

文檔序號(hào):2823096閱讀:276來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):聲音分析裝置、聲音分析合成裝置、校正規(guī)則信息生成裝置、聲音分析系統(tǒng)、聲音分析方法 ...的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及對(duì)聲音的非周期成分進(jìn)行分析的技術(shù)。
背景技術(shù)
近幾年,隨著聲音生成技術(shù)的發(fā)展,已經(jīng)能夠創(chuàng)作出音質(zhì)非常高的合成音。這樣的 合成音是例如以播音員的語(yǔ)調(diào)宣讀新聞的語(yǔ)句等用途為主。一方面,在移動(dòng)電話的服務(wù)等方面所提供的服務(wù)中逐漸普及的是某種特殊的聲音 (具有個(gè)人再現(xiàn)性的高合成音或,具有高中女學(xué)生的語(yǔ)氣或關(guān)西方言等特殊韻律或聲質(zhì)的 合成音),融匯了一個(gè)內(nèi)容之中,例如,以有名人物的聲音消息來(lái)代替電鈴聲等。作為合成音的用途的另一方面,為了增加個(gè)人之間的交流中的樂(lè)趣,對(duì)于創(chuàng)作特 殊的聲音給對(duì)方聽(tīng)這樣的需求也會(huì)增加。決定聲音的特征的一個(gè)因素為非周期成分。在伴有聲帶振動(dòng)的有聲聲音中,包含 音調(diào)脈沖反復(fù)出現(xiàn)的周期性的成分和其他的非周期性的成分。此非周期性的成分包括間 隔周期的波動(dòng)、音調(diào)振幅的波動(dòng)、音調(diào)脈沖波形的波動(dòng)、以及噪聲成分等。這些非周期性的 成分,對(duì)聲音的自然性產(chǎn)生很大的影響,并且,對(duì)發(fā)聲者的個(gè)人的特征也帶來(lái)了很大的貢獻(xiàn) (非專(zhuān)利文獻(xiàn)1)。圖16(a)和圖16(b)為非周期成分的量不同的母音/a/的頻譜圖。橫軸表示時(shí)間, 縱軸表示頻率。在圖16(a)和圖16(b)中水平方向看到的條狀的線表示高次諧波,該高次 諧波為基本頻率的整數(shù)倍的頻率的信號(hào)成分。圖16(a)為非周期成分少的情況,且能夠確認(rèn)到高頻帶的高次諧波。圖16(b)為 非周期成分多的情況,且能夠確認(rèn)到中間的頻帶(以Xl表示)的高次諧波,但是,在中間的 頻帶以上的頻帶中不能確認(rèn)高次諧波。這樣的非周期成分多的聲音多見(jiàn)于沙 的聲音的情況等中。此外,非周期成分也 多見(jiàn)于如讀故事給孩子聽(tīng)的柔和的聲音的情況中。因此,正確地分析非周期成分對(duì)聲音的個(gè)人特征的再現(xiàn)非常重要。此外,通過(guò)適當(dāng) 地變換非周期成分,從而也能夠適用在說(shuō)話者變換上。高頻帶中的非周期性的成分不僅根據(jù)音調(diào)振幅以及間隔周期的波動(dòng),還根據(jù)音調(diào) 波形的波動(dòng)以及噪聲成分的有無(wú)而被賦予特征,并且,破壞其頻帶中的諧波結(jié)構(gòu)。為了確定 此非周期成分占有支配性的頻帶,在非專(zhuān)利文獻(xiàn)1中利用了如下方法,即根據(jù)不同的多個(gè) 頻帶中的帶通信號(hào)的自相關(guān)函數(shù)的強(qiáng)度,判斷非周期性強(qiáng)的頻帶。圖17是示出在非專(zhuān)利文獻(xiàn)1中的對(duì)包含在聲音中的非周期成分進(jìn)行分析的聲音 分析裝置900的功能性的結(jié)構(gòu)的框圖。圖17的聲音分析裝置900包括時(shí)間軸伸縮部901、頻帶劃分部902、相關(guān)函數(shù)計(jì) 算部903a、903b、…、903η、以及邊界頻率計(jì)算部904。
6
時(shí)間軸伸縮部901將輸入信號(hào)劃分為規(guī)定的時(shí)間長(zhǎng)度的幀,并對(duì)各個(gè)幀進(jìn)行時(shí)間 軸的伸縮。頻帶劃分部902將由時(shí)間軸伸縮部901伸縮的信號(hào)劃分為每個(gè)預(yù)先規(guī)定的多個(gè)頻 帶的帶通信號(hào)。相關(guān)函數(shù)計(jì)算部903a、903b、-,903η對(duì)由頻帶劃分部902劃分的各個(gè)帶通信號(hào)
計(jì)算出自相關(guān)函數(shù)。邊界頻率計(jì)算部904根據(jù)由相關(guān)函數(shù)計(jì)算部903a、903b、…、903η計(jì)算出的自相 關(guān)函數(shù),計(jì)算出周期性的成分占有支配性的頻帶和非周期性的成分占有支配性的頻帶之間 的邊界頻率。輸入聲音由時(shí)間軸伸縮部901伸縮時(shí)間軸之后,由頻帶劃分部902進(jìn)行頻率劃分。 針對(duì)被劃分的輸入聲音的各個(gè)頻帶的頻率成分,計(jì)算出自相關(guān)函數(shù),并且,計(jì)算出基本周期 TO的時(shí)間移位中的自相關(guān)值。根據(jù)針對(duì)各個(gè)頻帶的頻率成分計(jì)算出的自相關(guān)值,能夠決定 對(duì)周期性的成分占有支配性的頻帶和非周期性的成分占有支配性的頻帶進(jìn)行劃分的邊界頻率。非專(zhuān)利文獻(xiàn)1 大冢貴弘、糟谷英樹(shù)“時(shí)間周波數(shù)領(lǐng)域(二杉K 3連続音聲O周 期·非周期成分O性質(zhì)(時(shí)間頻帶中的連續(xù)聲音的周期·非周期成分的性質(zhì))”日本音響 學(xué)會(huì)講演論文集(2001年10月pp. 265-266.)。在上述的方法中,能夠計(jì)算出具有輸入聲音中包含的非周期成分的邊界頻率。然 而,在實(shí)際的應(yīng)用中聲音的收錄環(huán)境未必能像實(shí)驗(yàn)室一樣安靜。例如在移動(dòng)電話中應(yīng)用的 情況下,聲音被收錄的環(huán)境如在街上或車(chē)站等含有很多噪聲的情況比較多。在這樣的噪聲環(huán)境下會(huì)出現(xiàn)如下問(wèn)題,即在非專(zhuān)利文獻(xiàn)1的非周期成分分析方法 中,由于背景噪聲帶來(lái)的影響,計(jì)算出的信號(hào)的自相關(guān)函數(shù)比實(shí)際的值低,從而導(dǎo)致過(guò)大地 評(píng)價(jià)非周期成分。圖18(a)-圖18(c)是說(shuō)明因背景噪聲高次諧波被噪聲埋沒(méi)的狀態(tài)的圖。圖18(a) 示出試驗(yàn)性的對(duì)背景噪聲進(jìn)行重疊的聲音信號(hào)的波形。圖18(b)表示對(duì)背景噪聲進(jìn)行重 疊的聲音信號(hào)的頻譜圖,圖18(c)則表示對(duì)背景噪聲不進(jìn)行重疊的元來(lái)的聲音信號(hào)的頻譜 圖。如圖18(c)所示,元來(lái)的聲音信號(hào)在高頻帶中也會(huì)出現(xiàn)高次諧波,并且,非周期成 分是少的。但是,如圖18(b)所示,在對(duì)背景噪聲進(jìn)行重疊的情況下,聲音信號(hào)被背景噪聲 埋沒(méi),從而很難看到高次諧波。因此,以往技術(shù)中出現(xiàn)如下結(jié)果,即帶通信號(hào)的自相關(guān)值降 低,從而計(jì)算出比實(shí)際多的非周期成分。

發(fā)明內(nèi)容
為了解決所述以往的課題,本發(fā)明的目的在于提供一種非周期成分的分析方法, 該非周期成分的分析方法即使在存在背景噪聲的實(shí)際環(huán)境中,也能夠正確地分析非周期成 分。為了解決以往的課題,本發(fā)明的聲音分析裝置根據(jù)表示背景噪聲和聲音的混合聲 音的輸入信號(hào),分析所述聲音中包含的非周期成分,其中包括頻帶劃分部,將所述輸入信 號(hào)頻率劃分為多個(gè)頻帶中的帶通信號(hào);噪聲區(qū)間識(shí)別部,識(shí)別噪聲區(qū)間和聲音區(qū)間,所述噪聲區(qū)間為所述輸入信號(hào)僅表示所述背景噪聲的區(qū)間,所述聲音區(qū)間為所述輸入信號(hào)表示所 述背景噪聲以及所述聲音的區(qū)間;信噪比計(jì)算部,計(jì)算出信噪比,該信噪比為從所述聲音區(qū) 間中的所述輸入信號(hào)劃分出的各個(gè)帶通信號(hào)的功率和從所述噪聲區(qū)間中的所述輸入信號(hào) 劃分出的各個(gè)帶通信號(hào)的功率的比率;相關(guān)函數(shù)計(jì)算部,計(jì)算出從所述聲音區(qū)間中的所述 輸入信號(hào)劃分出的各個(gè)帶通信號(hào)的自相關(guān)函數(shù);校正量決定部,根據(jù)計(jì)算出的所述信噪比, 決定有關(guān)非周期成分比率的校正量;以及非周期成分比率計(jì)算部,根據(jù)被決定的所述校正 量和計(jì)算出的所述自相關(guān)函數(shù),針對(duì)所述多個(gè)頻帶分別計(jì)算出包含在所述聲音中的非周期 成分比率。在此,也可以是,計(jì)算出的所述信噪比越小,所述校正量決定部就將越大的校正量 作為有關(guān)所述非周期成分比率的校正量來(lái)決定。并且,也可以是,從所述輸入信號(hào)的基本頻 率的一個(gè)周期的時(shí)間移位中的所述自相關(guān)函數(shù)的值減去所述校正量之后得到的校正相關(guān) 值越小,所述非周期成分比率計(jì)算部就計(jì)算出越大的比率,以作為所述非周期成分比率。并且,也可以是,所述校正量決定部,預(yù)先保持表示信噪比和校正量的對(duì)應(yīng)關(guān)系的 校正規(guī)則信息,并根據(jù)所述校正規(guī)則信息,參照對(duì)應(yīng)于計(jì)算出的所述信噪比的校正量,并將 被參照的校正量決定為有關(guān)所述非周期成分比率的校正量。在此,也可以是,所述校正量決定部,預(yù)先將表示信噪比和校正量的關(guān)系的近似函 數(shù)作為所述校正規(guī)則信息來(lái)保持,根據(jù)計(jì)算出的所述信噪比,計(jì)算出所述近似函數(shù)的值,將 計(jì)算出的值決定為有關(guān)所述非周期成分比率的校正量,所述近似函數(shù)是根據(jù)聲音的自相關(guān) 值與已知的信噪比的噪聲被重疊在所述聲音中的情況下的自相關(guān)值之間的差得到的。此外,也可以是,所述聲音分析裝置還包括基本頻率歸一化部,該基本頻率歸一化 部將所述聲音的基本頻率歸一化為預(yù)先規(guī)定的目標(biāo)頻率,所述非周期成分比率計(jì)算部,利 用基本頻率被歸一化之后的所述聲音,計(jì)算出所述非周期成分比率。本發(fā)明不僅作為這樣的聲音分析裝置來(lái)實(shí)現(xiàn),也可以作為聲音分析方法以及程序 來(lái)實(shí)現(xiàn)。此外,本發(fā)明也可以作為校正規(guī)則信息生成裝置、校正規(guī)則信息生成方法以及程 序來(lái)實(shí)現(xiàn),所述校正規(guī)則信息生成裝置生成為了在這樣的聲音分析裝置中決定校正量而使 用的校正規(guī)則信息。本發(fā)明還可以作為向聲音分析合成裝置以及聲音分析系統(tǒng)的應(yīng)用來(lái)實(shí) 現(xiàn)。根據(jù)本發(fā)明的聲音分析裝置,即使對(duì)于在噪聲環(huán)境下收錄的聲音,通過(guò)基于每個(gè) 頻帶的信噪比,對(duì)非周期成分比率進(jìn)行校正,從而也能夠排除噪聲給非周期成分帶來(lái)的影 響并正確地分析非周期成分。也就是說(shuō),根據(jù)本發(fā)明的聲音分析裝置,即使在存在背景噪聲的街上等的實(shí)際環(huán) 境下,也能夠正確地分析包含在聲音中的非周期成分。


圖1是示出本發(fā)明的實(shí)施例1中的聲音分析裝置的功能性的結(jié)構(gòu)的一個(gè)例子的框 圖。圖2是示出有聲聲音的振幅譜的一個(gè)例子的圖。圖3是示出有聲聲音的多個(gè)劃分頻帶的每一個(gè)的帶通信號(hào)的自相關(guān)函數(shù)的一個(gè) 例子的圖。
圖4是示出有聲聲音的基本頻率的一個(gè)周期的時(shí)間移位中的各個(gè)帶通信號(hào)的自 相關(guān)值的一個(gè)例子的圖。圖5(a)_(h)是示出噪聲給自相關(guān)值帶來(lái)的影響的圖。圖6是示出本發(fā)明的實(shí)施例1中的聲音分析裝置的工作的一個(gè)例子的流程圖。圖7是示出對(duì)于非周期成分少的聲音的分析結(jié)果的一個(gè)例子的圖。圖8是示出對(duì)于非周期成分多的聲音的分析結(jié)果的一個(gè)例子的圖。圖9是示出本發(fā)明的應(yīng)用例中的聲音分析合成裝置的功能性的結(jié)構(gòu)的一個(gè)例子 的框圖。圖10(a)、(b)是示出聲源波形和其振幅譜的一個(gè)例子的圖。圖11是示出由聲源模型化部進(jìn)行模型化的聲源的振幅譜的圖。圖12(a)_(c)是示出由合成部合成聲源波形的方法的圖。圖13(a)、(b)是示出基于非周期成分的相位譜的生成方法的圖。圖14是示出本發(fā)明的實(shí)施例2中的校正規(guī)則信息生成裝置的功能性的結(jié)構(gòu)的一 個(gè)例子的框圖。圖15是示出本發(fā)明的實(shí)施例2中的校正規(guī)則信息生成裝置的工作的一個(gè)例子的 流程圖。圖16(a)、(b)是示出非周期成分的不同量給頻譜帶來(lái)的影響的圖。圖17是示出以往的聲音分析裝置的功能性的結(jié)構(gòu)的框圖。圖18(a)-(c)是示出由背景噪聲引起的高次諧波被噪聲埋沒(méi)的狀態(tài)的圖。
具體實(shí)施例方式以下,參照附圖對(duì)本發(fā)明的實(shí)施例進(jìn)行說(shuō)明。(實(shí)施例1)圖1是示出本發(fā)明的實(shí)施例1中的聲音分析裝置100的功能性的結(jié)構(gòu)的一個(gè)例子 的框圖。圖1中的聲音分析裝置100為根據(jù)表示背景噪聲和聲音的混合音的輸入信號(hào), 分析所述聲音中包含的非周期成分的裝置,所述聲音分析裝置100包括噪聲區(qū)間識(shí)別部 101、有聲無(wú)聲判斷部102、基本頻率歸一化部103、頻帶劃分部104、相關(guān)函數(shù)計(jì)算部105a、 105b、105c、信噪比(SNR =SignalNoise Ratio)計(jì)算部 106a、106b、106c、校正量決定部 107a、107b、107c、以及非周期成分比率計(jì)算部108a、108b、108c。聲音分析裝置I00也可以作為例如以中央處理器、存儲(chǔ)裝置等構(gòu)成的計(jì)算機(jī)系統(tǒng) 來(lái)實(shí)現(xiàn)。在此情況下,聲音分析裝置100的各個(gè)部的功能可以作為軟件功能來(lái)實(shí)現(xiàn),所述中 央處理器執(zhí)行存儲(chǔ)在所述存儲(chǔ)裝置的程序,從而所述軟件發(fā)揮作用。此外,聲音分析裝置 100的各個(gè)部的功能也可以利用數(shù)字信號(hào)處理裝置,或者,專(zhuān)用的硬件裝置來(lái)實(shí)現(xiàn)。噪聲區(qū)間識(shí)別部101接受作為背景噪聲和聲音的混合音的輸入信號(hào)。接著,按照 每個(gè)規(guī)定的時(shí)間長(zhǎng)度將接受的輸入信號(hào)劃分為多個(gè)幀,并且,識(shí)別每個(gè)幀是作為僅表示背 景噪聲的噪聲區(qū)間的背景噪聲幀還是作為表示背景噪聲和聲音的聲音區(qū)間的聲音幀。有聲無(wú)聲判斷部102接受由噪聲區(qū)間識(shí)別部101識(shí)別為聲音幀的幀,以作為輸入, 并且,判斷被輸入的幀內(nèi)的聲音是有聲聲音還是無(wú)聲聲音。
9
基本頻率歸一化部103分析聲音的基本頻率,所述聲音為由有聲無(wú)聲判斷部102 判斷為有聲聲音的聲音,并且,將聲音的基本頻率歸一化為規(guī)定的目標(biāo)頻率。頻帶劃分部104將聲音和背景噪聲劃分為作為預(yù)先規(guī)定的不同的多個(gè)頻帶的每 個(gè)劃分頻帶的帶通信號(hào),所述聲音是由基本頻率歸一化部103將基本頻率歸一化為規(guī)定的 目標(biāo)頻率的,所述背景噪聲包含在由噪聲區(qū)間識(shí)別部101識(shí)別為背景噪聲幀的幀內(nèi)。以下 將用于頻率劃分聲音以及背景噪聲的頻帶稱(chēng)為劃分頻帶。相關(guān)函數(shù)計(jì)算部105a、105b、105c計(jì)算出由頻帶劃分部104劃分的各個(gè)帶通信號(hào)
的自相關(guān)函數(shù)。信噪比計(jì)算部106a、106b、106c針對(duì)由頻帶劃分部104劃分的各個(gè)帶通信號(hào),計(jì)算 出聲音幀內(nèi)的功率和背景噪聲幀內(nèi)的功率的比率,以作為信噪比。校正量決定部107a、107b、107c根據(jù)由信噪比計(jì)算部106a、106b、106c計(jì)算出的信 噪比,決定校正量,該校正量與針對(duì)各個(gè)帶通信號(hào)計(jì)算出的非周期成分比率有關(guān)。非周期成分比率計(jì)算部108a、108b、108c根據(jù)自相關(guān)函數(shù)和校正量,按照每個(gè)劃 分頻帶計(jì)算出聲音中包含的非周期成分頻率,所述自相關(guān)函數(shù)是由相關(guān)函數(shù)計(jì)算部105a、 105b、105c計(jì)算出的各個(gè)帶通信號(hào)的自相關(guān)函數(shù),所述校正量是由校正量決定部107a、 107b、107c決定的校正量。以下,針對(duì)各個(gè)部的工作進(jìn)行詳細(xì)的說(shuō)明。<噪聲區(qū)間識(shí)別部101>噪聲區(qū)間識(shí)別部101按照每個(gè)規(guī)定的時(shí)間將輸入信號(hào)劃分為多個(gè)幀,并且,識(shí)別 劃分出的各個(gè)幀是背景噪聲幀還是聲音幀,所述背景噪聲幀是作為僅表示背景噪聲的噪聲 區(qū)間的背景噪聲幀,所述聲音幀是作為表示背景噪聲和聲音的聲音區(qū)間的聲音幀。在此,也可以將輸入信號(hào)例如按照每個(gè)50msec劃分而得到的各個(gè)部分作為幀。此 外,識(shí)別幀是背景噪聲幀還是聲音幀的方法不需要特別的限定,但是,例如可以將輸入信號(hào) 的功率超過(guò)規(guī)定的閾值的幀識(shí)別為聲音幀,將其他的幀識(shí)別為背景噪聲幀。<有聲無(wú)聲判斷部102>有聲無(wú)聲判斷部102判斷聲音是有聲聲音還是無(wú)聲聲音,所述聲音為以由噪聲區(qū) 間識(shí)別部101識(shí)別為聲音幀的幀內(nèi)的輸入信號(hào)表示的聲音。判斷的方法不需要特別的限 定。例如在聲音的自相關(guān)函數(shù)或變形相關(guān)函數(shù)的峰值的大小超過(guò)預(yù)先規(guī)定的閾值的情況 下,可以判斷為有聲聲音。<基本頻率歸一化部103>基本頻率歸一化部103分析聲音的基本頻率,所述聲音為以由有聲無(wú)聲判斷部 102識(shí)別為有聲幀的幀內(nèi)的輸入信號(hào)表示的聲音。分析的方法不需要特別的限定。例如可 以利用作為針對(duì)混入噪聲的聲音的強(qiáng)健的基本頻率分析方法的基于瞬時(shí)頻率的基本頻率 分析方法(非專(zhuān)利文獻(xiàn) 2 :T· Abe, T· Kobayashi, S· Imai,"Roubust pitch estimation with harmonic enhancement in noisy environment based on instantaneous frequency", ASVA 97,423-430(1996))。基本頻率歸一化部103對(duì)聲音的基本頻率進(jìn)行分析之后,將聲音的基本 頻率歸一化為規(guī)定的目標(biāo)頻率。歸一化的方法不需要特別的限定。例如能夠根 據(jù)PSOLA (Pitch-Synchronous OverLap-Add 基周同步疊加)法(非專(zhuān)利文獻(xiàn)3 F.Charpentier, M. Stella, "Diphone synthesis using an over-lapped technique for speech waveforms concatenation", Proc. ICASSP, 2015-2018, Tokyo, 1986)變更聲音的基 本頻率,且歸一化為規(guī)定的目標(biāo)頻率。因此,能夠減輕韻律給自相關(guān)函數(shù)帶來(lái)的影響。另外,將聲音歸一化時(shí)的目標(biāo)頻率不需要特別的限定,但是,例如通過(guò)將目標(biāo)頻率 設(shè)定為聲音的規(guī)定的區(qū)間(也可以是整體)中的基本頻率的平均值,從而能夠緩和因基本 頻率的歸一化處理而引起的聲音的變形。例如在PSOLA法中,在將基本頻率大幅度上升的情況下,由于反復(fù)使用同一音調(diào) 波形,從而會(huì)使自相關(guān)值上升得過(guò)大。另一方面,在將基本頻率大幅度降低的情況下,由于 音調(diào)波形大量遺漏,從而會(huì)導(dǎo)致聲音的信息的丟失。因此,優(yōu)選的是,決定目標(biāo)頻率時(shí),盡可 能使變更的量少。<頻帶劃分部104>頻帶劃分部104將聲音和背景噪聲劃分為作為預(yù)先決定的多個(gè)頻帶的每個(gè)劃分 頻帶的帶通信號(hào),所述聲音是由基本頻率歸一化部103將基本頻率歸一化而得到的,所述 背景噪聲在由噪聲區(qū)間識(shí)別部101判斷為背景噪聲幀的幀內(nèi)。劃分的方法不需要特別的限定。例如也可以按照每個(gè)劃分頻帶設(shè)計(jì)濾波器,通過(guò) 對(duì)輸入信號(hào)進(jìn)行濾波處理,從而將輸入信號(hào)劃分為各個(gè)帶通信號(hào)。例如在輸入信號(hào)的采樣頻率為IlKHz的情況下,作為劃分頻帶的預(yù)先決定的 多個(gè)頻帶,也可以為將包含0-5. 5KHz的頻帶以等間隔劃分為8等分而形成的0-689HZ、 689-1378Hz、1378-2067Hz、2067Hz-2756Hz,2756-3445Hz、3445Hz-4134Hz、4134Hz-4823Hz、 以及4823Hz-5512Hz中的各個(gè)頻帶。通過(guò)如上所述,能夠個(gè)別地計(jì)算出包含在各個(gè)劃分頻 帶中的帶通信號(hào)內(nèi)的非周期成分比率。另外,在本實(shí)施例中,以將輸入信號(hào)劃分為8個(gè)劃分頻帶的每一個(gè)的帶通信號(hào)為 例進(jìn)行了說(shuō)明,但是,不限于8個(gè),也可以劃分為4個(gè)或16個(gè)等。通過(guò)使劃分頻帶數(shù)量增多, 從而能夠提高非周期成分的頻率分辨能力。但是,由于被劃分的各個(gè)帶通信號(hào)是由相關(guān)函 數(shù)計(jì)算部105a-105c計(jì)算出自相關(guān)函數(shù),因此,為了計(jì)算出周期性的強(qiáng)度,優(yōu)選的是頻帶內(nèi) 包含有多個(gè)基本周期的信號(hào)。例如在基本周期為200Hz的聲音的情況下,也可以將各個(gè)劃 分頻帶的帶寬劃分成400Hz以上。此外,也可以將頻帶不劃分為等間隔,例如也可以按照聽(tīng)覺(jué)特性,利用Mel頻率軸 劃分為不等間隔。優(yōu)選的是劃分輸入信號(hào)的頻帶,以符合以上的條件。< 相關(guān)函數(shù)計(jì)算部 105a、105b、105c>相關(guān)函數(shù)計(jì)算部105a、105b、105c計(jì)算出由頻帶劃分部104劃分的各個(gè)帶通信號(hào) 的自相關(guān)函數(shù)。若將第i個(gè)帶通信號(hào)設(shè)為Xi (η),則能夠以公式1表示Xi (η)的自相關(guān)函數(shù) Φ i (m)。(公式1)
權(quán)利要求
一種聲音分析裝置,根據(jù)表示背景噪聲和聲音的混合音的輸入信號(hào),分析所述聲音中包含的非周期成分,所述聲音分析裝置包括頻帶劃分部,將所述輸入信號(hào)頻率劃分為多個(gè)頻帶中的帶通信號(hào);噪聲區(qū)間識(shí)別部,識(shí)別噪聲區(qū)間和聲音區(qū)間,所述噪聲區(qū)間為所述輸入信號(hào)僅表示所述背景噪聲的區(qū)間,所述聲音區(qū)間為所述輸入信號(hào)表示所述背景噪聲以及所述聲音的區(qū)間;信噪比計(jì)算部,計(jì)算出信噪比,該信噪比為從所述聲音區(qū)間中的所述輸入信號(hào)劃分出的各個(gè)帶通信號(hào)的功率和從所述噪聲區(qū)間中的所述輸入信號(hào)劃分出的各個(gè)帶通信號(hào)的功率的比率;相關(guān)函數(shù)計(jì)算部,計(jì)算出從所述聲音區(qū)間中的所述輸入信號(hào)劃分出的各個(gè)帶通信號(hào)的自相關(guān)函數(shù);校正量決定部,根據(jù)計(jì)算出的所述信噪比,決定有關(guān)非周期成分比率的校正量;以及非周期成分比率計(jì)算部,根據(jù)被決定的所述校正量和計(jì)算出的所述自相關(guān)函數(shù),針對(duì)所述多個(gè)頻帶分別計(jì)算出包含在所述聲音中的非周期成分比率。
2.如權(quán)利要求1所述的聲音分析裝置,計(jì)算出的所述信噪比越小,所述校正量決定部就將越大的校正量作為有關(guān)所述非周期 成分比率的校正量來(lái)決定。
3.如權(quán)利要求1所述的聲音分析裝置,從所述輸入信號(hào)的基本頻率的一個(gè)周期的時(shí)間移位中的所述自相關(guān)函數(shù)的值減去所 述校正量之后得到的校正相關(guān)值越小,所述非周期成分比率計(jì)算部就計(jì)算出越大的比率, 以作為所述非周期成分比率。
4.如權(quán)利要求1所述的聲音分析裝置,所述校正量決定部,預(yù)先保持表示信噪比和校正量的對(duì)應(yīng)關(guān)系的校正規(guī)則信息,并根 據(jù)所述校正規(guī)則信息,參照對(duì)應(yīng)于計(jì)算出的所述信噪比的校正量,并將被參照的校正量決 定為有關(guān)所述非周期成分比率的校正量。
5.如權(quán)利要求1所述的聲音分析裝置,所述校正量決定部,預(yù)先將表示信噪比和校正量的關(guān)系的近似函數(shù)作為所述校正規(guī)則 信息來(lái)保持,根據(jù)計(jì)算出的所述信噪比,計(jì)算出所述近似函數(shù)的值,將計(jì)算出的值決定為有 關(guān)所述非周期成分比率的校正量,所述近似函數(shù)是根據(jù)聲音的自相關(guān)值與已知的信噪比的 噪聲被重疊在所述聲音中的情況下的自相關(guān)值之間的差得到的。
6.如權(quán)利要求1所述的聲音分析裝置,所述聲音分析裝置還包括基本頻率歸一化部,該基本頻率歸一化部將所述聲音的基本 頻率歸一化為預(yù)先規(guī)定的目標(biāo)頻率,所述非周期成分比率計(jì)算部,利用基本頻率被歸一化之后的所述聲音,計(jì)算出所述非 周期成分比率。
7.如權(quán)利要求6所述的聲音分析裝置,所述基本頻率歸一化部,將所述聲音的基本頻率歸一化為所述聲音的規(guī)定的單位的基 本頻率的平均值。
8.如權(quán)利要求7所述的聲音分析裝置,所述規(guī)定的單位為音素、音節(jié)、音拍、重音句、詞組、全句中的任一個(gè)。
9.一種聲音分析合成裝置,根據(jù)表示背景噪聲和第一聲音的混合音的第一輸入信號(hào), 分析所述第一聲音中包含的非周期成分,并對(duì)分析出的所述非周期成分和以第二輸入信號(hào) 所表示的第二聲音進(jìn)行合成,所述聲音分析合成裝置包括頻帶劃分部,將所述第一輸入信號(hào)頻率劃分為多個(gè)頻帶中的帶通信號(hào); 噪聲區(qū)間識(shí)別部,識(shí)別噪聲區(qū)間和聲音區(qū)間,所述噪聲區(qū)間為所述第一輸入信號(hào)僅表 示所述背景噪聲的區(qū)間,所述聲音區(qū)間為所述第一輸入信號(hào)表示所述背景噪聲和所述聲音 的區(qū)間;信噪比計(jì)算部,計(jì)算出信噪比,該信噪比為從所述聲音區(qū)間中的所述第一輸入信號(hào)劃 分出的各個(gè)帶通信號(hào)的功率和從所述噪聲區(qū)間中的所述第一輸入信號(hào)劃分出的各個(gè)帶通 信號(hào)的功率的比率;相關(guān)函數(shù)計(jì)算部,計(jì)算出從所述聲音區(qū)間中的所述第一輸入信號(hào)劃分出的各個(gè)帶通信 號(hào)的自相關(guān)函數(shù);校正量決定部,根據(jù)計(jì)算出的所述信噪比,決定有關(guān)非周期成分比率的校正量; 非周期成分比率計(jì)算部,根據(jù)被決定的所述校正量和計(jì)算出的所述自相關(guān)函數(shù),針對(duì) 所述多個(gè)頻帶分別計(jì)算出包含在所述第一聲音中的非周期成分比率;非周期成分頻譜計(jì)算部,根據(jù)針對(duì)所述多個(gè)頻帶分別計(jì)算出的非周期成分比率,計(jì)算 出表示非周期成分的頻率分布的非周期成分頻譜;聲道特征分析部,分析有關(guān)所述第二聲音的聲道特征;逆濾波部,通過(guò)利用分析出的所述聲道特征的逆特性,對(duì)所述第二聲音進(jìn)行逆濾波,從 而提取所述第二聲音的聲源波形;聲源模型化部,對(duì)被提取的所述聲源波形進(jìn)行模型化;以及合成部,根據(jù)分析出的所述聲道特征、被進(jìn)行模型化的所述聲源特征和計(jì)算出的所述 非周期成分頻譜,對(duì)聲音進(jìn)行合成。
10.一種校正規(guī)則信息生成裝置,包括頻帶劃分部,將表示聲音的輸入信號(hào)和表示噪聲的輸入信號(hào),分別頻率劃分為作為相 同的多個(gè)頻帶的每個(gè)劃分頻帶的帶通信號(hào);信噪比計(jì)算部,根據(jù)劃分出的各個(gè)所述帶通信號(hào),按照每個(gè)所述劃分頻帶,計(jì)算出信噪 比,該信噪比為不同的多個(gè)時(shí)間區(qū)間的每一個(gè)中的所述聲音的功率和所述噪聲的功率的比 率;相關(guān)函數(shù)計(jì)算部,根據(jù)劃分出的各個(gè)所述帶通信號(hào),按照每個(gè)所述劃分頻帶,計(jì)算出所 述多個(gè)時(shí)間區(qū)間的每一個(gè)中的所述聲音的自相關(guān)值以及所述噪聲的自相關(guān)值;以及校正規(guī)則信息生成部,根據(jù)計(jì)算出的所述信噪比、所述聲音的自相關(guān)值、以及所述噪聲 的自相關(guān)值,按照每個(gè)所述劃分頻帶,生成校正規(guī)則信息,該校正規(guī)則信息表示所述聲音的 自相關(guān)值與所述噪聲的自相關(guān)值之間的差和所述信噪比之間的對(duì)應(yīng)關(guān)系。
11.一種聲音分析系統(tǒng),所述聲音分析系統(tǒng)包括權(quán)利要求1所述的聲音分析裝置和權(quán) 利要求10所述的校正規(guī)則信息生成裝置,所述聲音分析裝置,根據(jù)在所述校正規(guī)則信息生成裝置生成的校正規(guī)則信息,參照對(duì) 應(yīng)于計(jì)算出的信噪比的校正量,并將被參照的校正量決定為有關(guān)非周期成分比率的校正量。
12.—種聲音分析方法,根據(jù)表示背景噪聲和聲音的混合音的輸入信號(hào),分析所述聲音 中包含的非周期成分,所述聲音分析方法包括頻帶劃分步驟,將所述輸入信號(hào)頻率劃分為多個(gè)頻帶中的帶通信號(hào);噪聲區(qū)間識(shí)別步驟,識(shí)別噪聲區(qū)間和聲音區(qū)間,所述噪聲區(qū)間為所述輸入信號(hào)僅表示 所述背景噪聲的區(qū)間,所述聲音區(qū)間為所述輸入信號(hào)表示所述背景噪聲以及所述聲音的區(qū) 間;信噪比計(jì)算步驟,計(jì)算出信噪比,該信噪比為從所述聲音區(qū)間中的所述輸入信號(hào)劃分 出的各個(gè)帶通信號(hào)的功率和從所述噪聲區(qū)間中的所述輸入信號(hào)劃分出的各個(gè)帶通信號(hào)的 功率的比率;相關(guān)函數(shù)計(jì)算步驟,計(jì)算出從所述聲音區(qū)間中的所述輸入信號(hào)劃分出的各個(gè)帶通信號(hào) 的自相關(guān)函數(shù);校正量決定步驟,根據(jù)計(jì)算出的所述信噪比,決定有關(guān)非周期成分比率的校正量;以及非周期成分比率計(jì)算步驟,根據(jù)被決定的所述校正量和計(jì)算出的所述自相關(guān)函數(shù),針 對(duì)所述多個(gè)頻帶分別計(jì)算出包含在所述聲音中的非周期成分比率。
13.一種校正規(guī)則信息生成方法,包括頻帶劃分步驟,將表示聲音的輸入信號(hào)和表示噪聲的輸入信號(hào),分別頻率劃分為作為 相同的多個(gè)頻帶的每個(gè)劃分頻帶的帶通信號(hào);信噪比計(jì)算步驟,根據(jù)劃分出的各個(gè)所述帶通信號(hào),按照每個(gè)所述劃分頻帶,計(jì)算出信 噪比,該信噪比為不同的多個(gè)時(shí)間區(qū)間的每一個(gè)中的所述聲音的功率和所述噪聲的功率的 比率;相關(guān)函數(shù)計(jì)算步驟,根據(jù)劃分出的各個(gè)所述帶通信號(hào),按照每個(gè)所述劃分頻帶,計(jì)算出 所述多個(gè)時(shí)間區(qū)間的每一個(gè)中的所述聲音的自相關(guān)值以及所述噪聲的自相關(guān)值;以及校正規(guī)則信息生成步驟,根據(jù)計(jì)算出的所述信噪比、所述聲音的自相關(guān)值、以及所述噪 聲的自相關(guān)值,按照每個(gè)所述劃分頻帶,生成校正規(guī)則信息,該校正規(guī)則信息表示所述聲音 的自相關(guān)值與所述噪聲的自相關(guān)值之間的差和所述信噪比之間的對(duì)應(yīng)關(guān)系。
14.一種程序,用于根據(jù)表示背景噪聲和聲音的混合音的輸入信號(hào),來(lái)分析所述聲音中 包含的非周期成分,且能夠由計(jì)算機(jī)執(zhí)行,該程序的特征在于使計(jì)算機(jī)執(zhí)行以下步驟頻帶劃分步驟,將所述輸入信號(hào)頻率劃分為多個(gè)頻帶中的帶通信號(hào);噪聲區(qū)間識(shí)別步驟,識(shí)別噪聲區(qū)間和聲音區(qū)間,所述噪聲區(qū)間為所述輸入信號(hào)僅表示 所述背景噪聲的區(qū)間,所述聲音區(qū)間為所述輸入信號(hào)表示所述背景噪聲以及所述聲音的區(qū) 間;信噪比計(jì)算步驟,計(jì)算出信噪比,該信噪比為從所述聲音區(qū)間中的所述輸入信號(hào)劃分 出的各個(gè)帶通信號(hào)的功率和從所述噪聲區(qū)間中的所述輸入信號(hào)劃分出的各個(gè)帶通信號(hào)的 功率的比率;相關(guān)函數(shù)計(jì)算步驟,計(jì)算出從所述聲音區(qū)間中的所述輸入信號(hào)劃分出的各個(gè)帶通信號(hào) 的自相關(guān)函數(shù);校正量決定步驟,根據(jù)計(jì)算出的所述信噪比,決定有關(guān)非周期成分比率的校正量;以及非周期成分比率計(jì)算步驟,根據(jù)被決定的所述校正量和計(jì)算出的所述自相關(guān)函數(shù),針對(duì)所述多個(gè)頻帶分別計(jì)算出包含在所述聲音中的非周期成分比率。
15. 一種程序,其特征在于,使計(jì)算機(jī)執(zhí)行以下步驟頻帶劃分步驟,將表示聲音的輸入信號(hào)和表示噪聲的輸入信號(hào),分別頻率劃分為作為 相同的多個(gè)頻帶的每個(gè)劃分頻帶的帶通信號(hào);信噪比計(jì)算步驟,根據(jù)劃分出的所述各個(gè)帶通信號(hào),按照每個(gè)所述劃分頻帶,計(jì)算出信 噪比,該信噪比為不同的多個(gè)時(shí)間區(qū)間的每一個(gè)中的所述聲音的功率和所述噪聲的功率的 比率;相關(guān)函數(shù)計(jì)算步驟,根據(jù)劃分出的所述各個(gè)帶通信號(hào),按照每個(gè)所述劃分頻帶,計(jì)算出 所述多個(gè)時(shí)間區(qū)間的每一個(gè)中的所述聲音的自相關(guān)值以及所述噪聲的自相關(guān)值;以及校正規(guī)則信息生成步驟,根據(jù)計(jì)算出的所述信噪比、所述聲音的自相關(guān)值、以及所述噪 聲的自相關(guān)值,按照每個(gè)所述劃分頻帶,生成校正規(guī)則信息,該校正規(guī)則信息表示所述聲音 的自相關(guān)值與所述噪聲的自相關(guān)值之間的差和所述信噪比之間的對(duì)應(yīng)關(guān)系。
全文摘要
本發(fā)明為一種聲音分析裝置,在存在背景噪聲的實(shí)際環(huán)境下,能夠正確地分析聲音的非周期成分,并且,包括頻帶劃分部(104),將表示背景噪聲和聲音的混合音的輸入信號(hào)頻率劃分為多個(gè)帶通信號(hào);噪聲區(qū)間識(shí)別部(101),識(shí)別所述輸入信號(hào)的噪聲區(qū)間和聲音區(qū)間;信噪比計(jì)算部(106a-106c),計(jì)算出信噪比,該信噪比為各個(gè)帶通信號(hào)的所述聲音區(qū)間中的功率和所述噪聲區(qū)間中的功率的比率;相關(guān)函數(shù)計(jì)算部(105a-105c),計(jì)算出所述聲音區(qū)間中的各個(gè)帶通信號(hào)的自相關(guān)函數(shù);校正量決定部(107a-107b),根據(jù)計(jì)算出的所述信噪比,決定校正量;以及非周期成分比率計(jì)算部(108a-108c),根據(jù)被決定的所述校正量和計(jì)算出的所述自相關(guān)函數(shù),針對(duì)所述多個(gè)頻帶分別計(jì)算出所述聲音中包含的非周期成分比率。
文檔編號(hào)G10L11/00GK101983402SQ200980111700
公開(kāi)日2011年3月2日 申請(qǐng)日期2009年9月11日 優(yōu)先權(quán)日2008年9月16日
發(fā)明者廣瀨良文, 釜井孝浩 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
东乡族自治县| 建德市| 锡林郭勒盟| 偃师市| 湾仔区| 绿春县| 河北省| 商洛市| 阜城县| 都安| 马山县| 泰和县| 清水河县| 铅山县| 安顺市| 临汾市| 焉耆| 察哈| 杭州市| 抚州市| 滕州市| 苏州市| 崇州市| 醴陵市| 漳州市| 若尔盖县| 大荔县| 沙雅县| 陇川县| 苍梧县| 石屏县| 格尔木市| 全椒县| 拜城县| 游戏| 通榆县| 冀州市| 墨竹工卡县| 和田市| 阳江市| 昆山市|