欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基音搜索方法及裝置的制作方法

文檔序號(hào):2831187閱讀:424來(lái)源:國(guó)知局
專利名稱:基音搜索方法及裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明實(shí)施例涉及語(yǔ)音編解碼領(lǐng)域,涉及一種基音搜索方法及裝置。
背景技術(shù)
通常語(yǔ)音頻信號(hào)具有一定的周期性特征,采用長(zhǎng)時(shí)預(yù)測(cè)(Long Term Prediction,以下簡(jiǎn)稱LTP )方法可以去掉語(yǔ)音頻信號(hào)中的長(zhǎng)時(shí)周期性。在 進(jìn)行LTP預(yù)測(cè)時(shí),需要預(yù)先搜索基音?,F(xiàn)有技術(shù)提供了一種利用自相關(guān)函數(shù) 的基音搜索方法,在運(yùn)動(dòng)圖像專家組音頻無(wú)損編碼(Moving Pictures Experts Group Audio Lossless Coding,以下簡(jiǎn)稱MPEGALS)裝置中,利用歷史緩 沖區(qū)的數(shù)據(jù)作為激勵(lì)信號(hào)來(lái)預(yù)測(cè)當(dāng)前幀信號(hào)。下面以開環(huán)基因分析為例進(jìn)行 介紹。
首先通過(guò)將原始語(yǔ)音信號(hào)輸入感知加權(quán)濾波器中得到加權(quán)語(yǔ)音信號(hào)
// 一 1
、("),感知加權(quán)濾波器的表達(dá)式為^)=牟仏)^_—其中
(31=0.68。對(duì)于每一子幀,子幀長(zhǎng)為1^=64,加權(quán)語(yǔ)音信號(hào)、(")表達(dá)式為
<formula>formula see original document page 5</formula>
其中s(n)為原始語(yǔ)音信號(hào),"'為線性預(yù)測(cè)系數(shù),^為感知加權(quán)因子。 對(duì)于該加權(quán)語(yǔ)音信號(hào),采用 一個(gè)四階FIR濾波器H^im2W進(jìn)行2倍下采樣,
得到U (");根據(jù)U ("),采用對(duì)相關(guān)函數(shù)加權(quán)的方式得到
<formula>formula see original document page 5</formula>
所求的基音即為使C(d)最大的基音延遲d,其中w(d)是一個(gè)加權(quán)函數(shù),包括低延遲加權(quán)函數(shù)"")和前一幀延遲加權(quán)函數(shù)w"("),見式(3): 低延遲加權(quán)函數(shù)"(力的表達(dá)式為
其中cw(d)存在于程序的tab文件中,前一幀延遲加權(quán)函數(shù)w"")取決于前 面幀的基音延遲,其表達(dá)式為
"^) = 丁,化"_ + 98} v>0.8, (5) 1 1.0, 其他
其中L表示前面5幀中基音延遲的平均值,v是自適應(yīng)因子。當(dāng)開環(huán) 基音增益gX).6時(shí),該幀定義為濁音,則下一幀的v設(shè)為1;否則v=0.9v。開 環(huán)基音增益g的表達(dá)式為
63
max /
63 63
(!^w(")I^L("—"腦
使C(d)最大的基音延遲。中值濾波器僅在濁音幀時(shí)更新。如果前一幀包 含清音或靜音,加權(quán)函數(shù)將受到參數(shù)v的衰減。
由以上描述可以看出,在現(xiàn)有技術(shù)中,為了解決長(zhǎng)時(shí)周期性的問題,采' 用對(duì)一幀輸入語(yǔ)音信號(hào)計(jì)算自相關(guān)函數(shù)的方法進(jìn)行處理,來(lái)獲得基音。

發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種基音搜索方法及裝置,不需要計(jì)算整幀輸入語(yǔ) 音信號(hào)的相關(guān)函數(shù)值。
本發(fā)明實(shí)施例提供了一種基音搜索方法,包括
獲取殘差信號(hào)的特征函數(shù)值,所述殘差信號(hào)根據(jù)輸入語(yǔ)音信號(hào)去掉長(zhǎng)時(shí) 預(yù)測(cè)貢獻(xiàn)信號(hào)獲得;根據(jù)所述殘差信號(hào)的特征函數(shù)值,獲得基音。 本發(fā)明實(shí)施例提供了另一種基音搜索方法,包括
在輸入語(yǔ)音信號(hào)中,查找幅度或幅值最大的脈沖;
根據(jù)所述幅度或幅值最大的脈沖的位置,對(duì)所述輸入語(yǔ)音信號(hào)設(shè)置目標(biāo)
窗;
滑動(dòng)所述目標(biāo)窗得到滑動(dòng)窗,計(jì)算所述滑動(dòng)窗內(nèi)的輸入語(yǔ)音信號(hào)與所述
目標(biāo)窗內(nèi)的輸入語(yǔ)音信號(hào)的相關(guān)系數(shù),獲得所述相關(guān)系數(shù)最大值; 根據(jù)所述相關(guān)系數(shù)最大值,獲取基音。 本發(fā)明實(shí)施例提供了一種基音搜索裝置,包括
特征值獲取模塊,用于獲取殘差信號(hào)的特征函數(shù)值,所述殘差信號(hào)是根
據(jù)輸入語(yǔ)音信號(hào)去掉長(zhǎng)時(shí)預(yù)測(cè)貢獻(xiàn)信號(hào)而得到的;
基音獲取模塊,用于根據(jù)所述殘差信號(hào)的特征函數(shù)值,獲得基音。 本發(fā)明實(shí)施例提供了另一種基音搜索裝置,包括 查找模塊,用于在輸入語(yǔ)音信號(hào)中,查找幅度或幅值最大的脈沖; 目標(biāo)窗模塊,用于根據(jù)所述幅度或幅值最大的脈沖的位置,對(duì)所述輸入
語(yǔ)音信號(hào)設(shè)置目標(biāo)窗;
計(jì)算才莫塊,用于滑動(dòng)所述目標(biāo)窗得到滑動(dòng)窗,計(jì)算所述滑動(dòng)窗內(nèi)的輸入
語(yǔ)音信號(hào)與所述目標(biāo)窗內(nèi)的輸入語(yǔ)音信號(hào)的相關(guān)系數(shù),獲得所述相關(guān)系數(shù)最
大值;
基音獲取模塊,用于根據(jù)所述相關(guān)系數(shù)最大值,獲取基音。
本發(fā)明實(shí)施例提供的一種基音搜索方法及裝置,獲取殘差信號(hào)的特征函
數(shù)值,根據(jù)該殘差信號(hào)的特征函數(shù)值,獲得基音,不需要計(jì)算整幀輸入語(yǔ)音
信號(hào)的相關(guān)函數(shù)值。


圖l為本發(fā)明提供的一種基音搜索方法實(shí)施例一 流程圖;圖2為本發(fā)明提供的一種基音搜索方法實(shí)施例二的流程圖; 圖3為本發(fā)明提供的一種基音搜索方法實(shí)施例三的流程圖; 圖4為本發(fā)明提供的另一種基音搜索方法實(shí)施例一的流程圖; 圖5為本發(fā)明提供的另一種基音搜索方法實(shí)施例二的流程圖; 圖6為本發(fā)明提供的一種基音搜索裝置實(shí)施例的結(jié)構(gòu)示意圖; 圖7為本發(fā)明提供的另 一種基音搜索裝置實(shí)施例的結(jié)構(gòu)示意圖。
具體實(shí)施例方式
下面通過(guò)附圖和實(shí)施例,對(duì)本發(fā)明實(shí)施例的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
如圖1所示,為本發(fā)明提供的一種基音搜索方法實(shí)施例一的流程圖,具 體包括如下步驟
步驟101、獲取殘差信號(hào)的特征函數(shù)值,該殘差信號(hào)是根據(jù)輸入語(yǔ)音信 號(hào)去掉長(zhǎng)時(shí)預(yù)測(cè)貢獻(xiàn)信號(hào)而得到的;
步驟102、根據(jù)殘差信號(hào)的特征函數(shù)值,獲得基音。
本實(shí)施例獲取殘差信號(hào)的特征函數(shù)值,根據(jù)該殘差信號(hào)的特征函數(shù)值, 獲得基音,不需要計(jì)算整幀輸入語(yǔ)音信號(hào)的相關(guān)函數(shù)值。
如圖2所示,為本發(fā)明提供的一種基音搜索方法實(shí)施例二的流程圖,具 體包括如下步驟
步驟201、將輸入語(yǔ)音信號(hào)進(jìn)行預(yù)處理;
該預(yù)處理的操作可以為低通濾波處理,也可以為下采樣處理,還可以為 先進(jìn)行低通濾波處理,再進(jìn)行下采樣處理;具體地低通濾波處理可以為均值 濾波。以PCM信號(hào)為例,用y(n)表示輸入語(yǔ)音信號(hào),設(shè)輸入語(yǔ)音信號(hào)的幀長(zhǎng) L-160,即一幀包括160個(gè)樣點(diǎn);用y2(n)表示經(jīng)過(guò)下采樣處理的輸入語(yǔ)音信 號(hào),以下稱為下采用信號(hào);本實(shí)施例以2倍下采樣為例,則有MtT (7) M是中值濾波器的階數(shù);y2(n)的樣點(diǎn)范圍為
。 本步驟為可選步驟,也可以不經(jīng)過(guò)預(yù)處理直接執(zhí)行步驟202。 步驟202、查找輸入語(yǔ)音信號(hào)幅度或幅值最大的脈沖; 本實(shí)施例可以在整幀信號(hào)范圍內(nèi)查找該脈沖,也可以在一幀信號(hào)中的設(shè)
定范圍內(nèi)查找脈沖。以在一幀信號(hào)中的設(shè)定范圍內(nèi)查找該脈沖為例,可具體
i兌明如下
首先,對(duì)于輸入語(yǔ)音信號(hào)y(n),根據(jù)幀長(zhǎng),預(yù)先設(shè)定其基音范圍,在設(shè) 定其基音范圍時(shí),應(yīng)參照幀長(zhǎng),并考慮到基音不能過(guò)大,若基音過(guò)大,則導(dǎo) 致一幀信號(hào)中較少的樣點(diǎn)參與LTP計(jì)算,降低了LTP的性能。舉例來(lái)說(shuō),針 對(duì)幀長(zhǎng)L二160,本實(shí)施例設(shè)定y(n)基音范圍為[20, 83]。由于本實(shí)施例步驟 202中采用2倍下采樣,則下采樣信號(hào)y2(n)的基音范圍[PMIN, PMAX]為[IO, 41],即PMIN=10, PMAX=41,為了保證在基音最大時(shí),依然能夠搜索到基 音,將搜索脈沖的樣點(diǎn)范圍設(shè)置為[41, 79]。
然后,在樣點(diǎn)范圍[41, 79]內(nèi),查找y2(n)幅度或幅值最大的脈沖,設(shè)該 幅度或幅值最大的脈沖對(duì)應(yīng)的樣點(diǎn)為p0, 41《p0<79,則有
血O2O0))2一;;2(")),"e[尸M4X,l"一l],"^ ; 0 (8)
在本實(shí)施例中,y2(n)的幅度可以為實(shí)數(shù);y2(n)的幅值表示幅度的絕對(duì)值, 為非負(fù)數(shù)。
步驟203、根據(jù)輸入語(yǔ)音信號(hào)幅度或幅值最大的脈沖樣點(diǎn)pO的位置,設(shè) 置目標(biāo)窗;
具體地說(shuō),在樣點(diǎn)pO周圍加一個(gè)目標(biāo)窗,選取一部分信號(hào),該目標(biāo)窗覆 蓋樣點(diǎn)pO;其中,該目標(biāo)窗的范圍為pmin , smax],目標(biāo)窗的長(zhǎng)度 /e" = smax-smin ,目標(biāo)窗的長(zhǎng)度len的范圍為l-L,也就是說(shuō),目標(biāo)窗可以覆 蓋整幀信號(hào)。舉例來(lái)i兌,s min = s — max(>0 — 1), ;y max = 一 min(p0 + d,79),其中d用于P艮
制目標(biāo)窗的長(zhǎng)度,本實(shí)施例中d=15, Lmax(p0-t/,41)表示取P0-"和41兩者 的較大值,s —min(;70 + ",79)表示取;K) + "和79兩者的較小值。
步驟204、分別計(jì)算與預(yù)先設(shè)定的基音范圍內(nèi)的每一個(gè)基音對(duì)應(yīng)的輸入 語(yǔ)音信號(hào)(本實(shí)施例為下采樣信號(hào))的殘差信號(hào);該殘差信號(hào)為輸入語(yǔ)音信 號(hào)去掉長(zhǎng)時(shí)預(yù)測(cè)貢獻(xiàn)信號(hào)后的殘差信號(hào),該長(zhǎng)時(shí)預(yù)測(cè)貢獻(xiàn)信號(hào)是根據(jù)長(zhǎng)時(shí)預(yù) 測(cè)激勵(lì)信號(hào)和基音增益確定的;
_y2(0, / = 0,1,…,s min-1 W)H ,r、,r t、. . 丄, (9)
其中,A表示基音,g表示基音增益,g可以為一固定的經(jīng)驗(yàn)值,也可 以為根據(jù)預(yù)先設(shè)定的基音范圍內(nèi)的基音自適應(yīng)確定的值,也就是說(shuō),對(duì)于不
同的基音k, g可以為相同的值;也可以預(yù)先建立基音k與基音增益g的映射 表,g為隨k而改變的值。
步驟205、計(jì)算與每個(gè)基音對(duì)應(yīng)的殘差信號(hào)能量;
五"0= 2X(/)W),"I^2] (10)
其中,[&,&]表示基音范圍,本實(shí)施例中,^=10, ^=41, A(0表示與A 對(duì)應(yīng)的殘差信號(hào)能量。
步驟206、在計(jì)算得到的殘差信號(hào)能量中選擇最小值,得到殘差信號(hào)能 量最小值^力),也就是說(shuō),在[&,&]范圍中,與基音P對(duì)應(yīng)的下采樣信號(hào)y2(n)
的殘差信號(hào)能量£力')最??;
步驟207、由于y2(n)為y(n)經(jīng)過(guò)2倍下采樣處理而得到的,因此對(duì)于y(n) 來(lái)說(shuō),獲得的基音為2P。
進(jìn)一步的,為了避免將基音的倍頻誤認(rèn)為基音,本實(shí)施例在獲得基音2P 之后,還可以包括如下處理過(guò)程
在語(yǔ)音信號(hào)域,計(jì)算所獲得基音的相關(guān)函數(shù),以及所獲得的基音的倍頻的相關(guān)函數(shù);本步驟根據(jù)下式計(jì)算2P的相關(guān)函數(shù)ww一cw[2尸],以及2P的倍 頻P的相關(guān)函ltwor—cw[P]:
" (11)
將計(jì)算得到的相關(guān)函數(shù)最大值對(duì)應(yīng)的基音作為最終獲得的基音;也就是
il, 比4交"or — cor[2P]和"or — cor[p]的,若"or - cor[2尸]> — ,則將2p
作為語(yǔ)音信號(hào)的最終獲得的基音;"w —"^[2尸]<"^ —a^[尸],則將p作為語(yǔ)音 信號(hào)的最終獲得的基音。
本實(shí)施例通過(guò)設(shè)置目標(biāo)窗,對(duì)一幀信號(hào)中殘差信號(hào)能量進(jìn)行計(jì)算,不需 要計(jì)算整幀信號(hào)的相關(guān)函數(shù)值,大大降低了基音搜索的復(fù)雜度;同時(shí),通過(guò) 比較基音和基音倍頻的相關(guān)函數(shù),避免了將基音的倍頻誤認(rèn)為基音,保證了 基音搜索的準(zhǔn)確性。
如圖3所示,為本發(fā)明提供的一種基音搜索方法實(shí)施例三的流程圖,本 實(shí)施例與上述實(shí)施例二的區(qū)別在于將步驟205和206替換為步驟305和306, 本實(shí)施例中殘差信號(hào)的特征函數(shù)值為殘差信號(hào)絕對(duì)值之和,具體介紹如下
步驟305、計(jì)算與基音范圍內(nèi)的每一個(gè)基音對(duì)應(yīng)的下采樣信號(hào)的殘差信 號(hào)絕對(duì)值之和;
■ymax
&(/)= (12)
& (0表示與*對(duì)應(yīng)的殘差信號(hào)絕對(duì)值之和;
步驟306、在計(jì)算得到的殘差信號(hào)絕對(duì)值之和中選擇最小值,得到殘差 信號(hào)絕對(duì)值之和最小值&W,也就是說(shuō),在^,^]范圍中,與基音P對(duì)應(yīng)的下
采樣信號(hào)的殘差信號(hào)絕對(duì)值之和^W最小。
本實(shí)施例通過(guò)設(shè)置目標(biāo)窗,對(duì)一幀信號(hào)中殘差信號(hào)絕對(duì)值之和進(jìn)行計(jì)算, 不需要計(jì)算整幀信號(hào)的相關(guān)函數(shù)值,大大降低了基音搜索的復(fù)雜度。上述實(shí)施例二和三適用于采用一幀信號(hào)中前一部分信號(hào)預(yù)測(cè)后一部分信 號(hào)的情況,本發(fā)明實(shí)施例不僅限于應(yīng)用于該情況,還可以應(yīng)用于采用過(guò)去幀 信號(hào)預(yù)測(cè)當(dāng)前幀信號(hào)的情況,在這種情況下,可以獲取整幀殘差信號(hào)的特征 函數(shù)值,根據(jù)整幀殘差信號(hào)的特征函數(shù)值,獲得基音。
如圖4所示,為本發(fā)明提供的另一種基音搜索方法實(shí)施例一的流程圖,
具體包括如下步驟
步驟401、在輸入語(yǔ)音信號(hào)中,查找幅度或幅值最大的脈沖;
步驟402、根據(jù)幅度或幅值最大的脈沖的位置,對(duì)輸入語(yǔ)音信號(hào)設(shè)置目
標(biāo)窗;
步驟403、滑動(dòng)目標(biāo)窗得到滑動(dòng)窗,計(jì)算滑動(dòng)窗內(nèi)的輸入語(yǔ)音信號(hào)與目 標(biāo)窗內(nèi)的輸入語(yǔ)音信號(hào)的相關(guān)系數(shù),獲得相關(guān)系數(shù)最大值; 步驟404、根據(jù)相關(guān)系數(shù)最大值,獲取基音。
本實(shí)施例通過(guò)設(shè)置目標(biāo)窗,并滑動(dòng)該目標(biāo)窗,計(jì)算滑動(dòng)窗內(nèi)的信號(hào)與目 標(biāo)窗內(nèi)的信號(hào)的相關(guān)系數(shù),根據(jù)相關(guān)系數(shù)最大值,獲取基音,不需要計(jì)算整. 幀輸入語(yǔ)音信號(hào)的相關(guān)函數(shù)值,大大降低了基音搜索的復(fù)雜度。
如圖5所示,為本發(fā)明提供的另一種基音搜索方法實(shí)施例二的流程圖, 具體包括如下步驟
步驟501、將輸入語(yǔ)音信號(hào)進(jìn)行預(yù)處理;
進(jìn)一步的,該預(yù)處理的操作可以為低通濾波處理,也可以為下采樣處理, 還可以為先進(jìn)行低通濾波處理,再進(jìn)行下采樣處理;具體地低通濾波處理可 以為均值濾波。以PCM信號(hào)為例,用y(n)表示輸入的語(yǔ)音信號(hào),設(shè)輸入的語(yǔ) 音信號(hào)的幀長(zhǎng)L-160,即一幀包括160個(gè)樣點(diǎn);用y2(n)表示經(jīng)過(guò)下采樣處理 的輸入語(yǔ)音信號(hào),以下稱為下采用信號(hào);本實(shí)施例以2倍下采樣為例,則有
<formula>formula see original document page 12</formula>
M是中值濾波器的階數(shù);y2(n)的樣點(diǎn)范圍為
。本步驟為可選步驟,也可以不經(jīng)過(guò)預(yù)處理直接執(zhí)行步驟502。步驟502、在輸入語(yǔ)音信號(hào)中,查找幅度或幅值最大的脈沖; 本實(shí)施例可以在整幀信號(hào)范圍內(nèi)查找該脈沖,也可以在一幀信號(hào)中設(shè)定 范圍內(nèi)查找脈沖。以在一幀信號(hào)中設(shè)定范圍內(nèi)查找該脈沖為例,可具體說(shuō)明首先,對(duì)于輸入語(yǔ)音信號(hào)y(n),根據(jù)幀長(zhǎng),預(yù)先設(shè)定其基音范圍,在設(shè) 定其基音范圍時(shí),應(yīng)參照幀長(zhǎng),并考慮到基音不能過(guò)大,若基音過(guò)大,則導(dǎo) 致一幀信號(hào)中較少的樣點(diǎn)參與LTP計(jì)算,降低了LTP的性能。舉例來(lái)說(shuō),針 對(duì)幀長(zhǎng)乙=160,本實(shí)施例設(shè)定y(n)基音范圍為[20, 83]。由于本實(shí)施例步驟 202中采用2倍下采樣,則下采樣信號(hào)y2(n)的基音范圍[PMIN, PMAX]為[IO, 41],即PMIN=10, PMAX=41,為了保證在基音最大時(shí),依然能夠搜索到基 音,將搜索脈沖的樣點(diǎn)設(shè)置為[41, 79]。然后,在樣點(diǎn)范圍[41, 79]內(nèi),查找y2(n)幅度或幅值最大的脈沖,設(shè)該 幅度或幅值最大的脈沖對(duì)應(yīng)的樣點(diǎn)為p0, 41《p0《79,則有血Ck2(; 0)) 2 一;;2("))," e [尸M4X,垂—1〗,w - / 0 (14)在本實(shí)施例中,y2(n)的幅度可以為實(shí)數(shù);y2(n)的幅值表示幅度的絕對(duì)值, 為非負(fù)數(shù)。步驟503、根據(jù)輸入語(yǔ)音信號(hào)幅度或幅值最大的脈沖樣點(diǎn)pO的位置,對(duì) 輸入語(yǔ)音信號(hào)設(shè)置目標(biāo)窗;具體地說(shuō),在樣點(diǎn)pO周圍加一個(gè)目標(biāo)窗,選取一部分信號(hào),該目標(biāo)窗覆 蓋樣點(diǎn)pO;其中,該目標(biāo)窗的范圍為pmin , sinax],目標(biāo)窗的長(zhǎng)度 /e"二smax-smin ,目標(biāo)窗的長(zhǎng)度len的范圍為l-L,也就是說(shuō),目標(biāo)窗可以覆' 蓋整幀信號(hào)。舉例來(lái)說(shuō),smirks —max(/70 — d,41),smax =《一minO0 + d,79),其中d用于限 制目標(biāo)窗的長(zhǎng)度,本實(shí)施例中cN15, max(p0-d,41)表示耳又P0 —"和41兩者的較大值,匕min(pO + d,,表示取pO + t/和79兩者的較小值。步驟504、滑動(dòng)目標(biāo)窗得到滑動(dòng)窗,計(jì)算滑動(dòng)窗內(nèi)的信號(hào)與目標(biāo)窗內(nèi)的 信號(hào)的相關(guān)系數(shù);cwr[A:]= Z^2(/"少2(,:A:),A:e[A:"A:2] (15)其中,A表示基音,[&,^]表示基音范圍,本實(shí)施例中,^=10, ^=41,cwr[A:]表示與A:對(duì)應(yīng)的相關(guān)系數(shù)。步驟505、在計(jì)算得到的相關(guān)系數(shù)中選擇相關(guān)系數(shù)最大值c?!╗P];也就是 說(shuō),在^,^]范圍中,與基音P對(duì)應(yīng)的下采樣信號(hào)的相關(guān)系數(shù)"〃["最大;步驟506、由于y2(n)為y(n)經(jīng)過(guò)2倍下采樣處理而得到的,因此對(duì)于y(n) 來(lái)說(shuō),所獲得的基音為2P。進(jìn)一步的,為了避免將基音的倍頻誤認(rèn)為基音,本實(shí)施例在獲得基音2P 之后,還可以包括如下處理過(guò)程在語(yǔ)音信號(hào)域,計(jì)算所獲得基音的相關(guān)函數(shù),以及所獲得的基音的倍頻 的相關(guān)函數(shù);本步驟根據(jù)下式計(jì)算2P的相關(guān)函數(shù)"w—cw[2P],以及2P的倍 頻P的相關(guān)函lt"w—cw[尸]:"or — cor[/ ] = -,畫尸,2尸.'" (16)將計(jì)算得到的相關(guān)函數(shù)最大值對(duì)應(yīng)的基音作為最終獲得的基音;也就是 i兌,比專交"w—cor[2尸]和"^—cor[P]的值,若"or—cw[2尸k"or—cor[尸],則將2P 作為語(yǔ)音信號(hào)的最終獲得的基音;則將p作為語(yǔ)音 信號(hào)的最終獲得的基音。本實(shí)施例通過(guò)設(shè)置目標(biāo)窗,并滑動(dòng)該目標(biāo)窗,計(jì)算滑動(dòng)窗內(nèi)的信號(hào)與目 標(biāo)窗內(nèi)的信號(hào)的相關(guān)系數(shù),根據(jù)相關(guān)系數(shù)最大值,獲取基音,不需要計(jì)算整幀信號(hào)的相關(guān)函數(shù)值,大大降低了基音搜索的復(fù)雜度;同時(shí),通過(guò)比較基音和基音倍頻的相關(guān)函數(shù),避免了將基音的倍頻誤認(rèn)為基音,保證了基音搜索 的準(zhǔn)確性。如圖6所示,為本發(fā)明提供的一種基音搜索裝置實(shí)施例的結(jié)構(gòu)示意圖, 本實(shí)施例具體包括特征值獲取模塊11和基音獲取模塊12;其中,特征值 獲取模塊11獲取殘差信號(hào)的特征函數(shù)值,該殘差信號(hào)是根據(jù)輸入語(yǔ)音信號(hào)去 掉長(zhǎng)時(shí)預(yù)測(cè)貢獻(xiàn)信號(hào)而得到的;基音獲取模塊12根據(jù)特征函數(shù)值,獲得基音。具體地說(shuō),上述特征值獲取模塊11可以計(jì)算整幀殘差信號(hào)的特征函數(shù) 值;特征值獲取模塊11也可以包括目標(biāo)窗單元13和特征值獲取單元14,其 中目標(biāo)窗單元13對(duì)輸入語(yǔ)音信號(hào)設(shè)置目標(biāo)窗,特征值獲取單元14獲取目標(biāo) 窗中殘差信號(hào)的特征值。進(jìn)一步的,本實(shí)施例可以包括查找模塊15,該查找模塊15查找輸入語(yǔ) 音信號(hào)幅度或幅值最大的脈沖;目標(biāo)窗單元13根據(jù)輸入語(yǔ)音信號(hào)幅度或幅值 最大的脈沖的位置,設(shè)置目標(biāo)窗。本實(shí)施例還可以包括預(yù)處理模塊16,該預(yù)處理模塊16將輸入語(yǔ)音信號(hào) 進(jìn)行預(yù)處理,具體為進(jìn)行^f氐通濾波處理或下采樣處理;將預(yù)處理后的輸入語(yǔ) 音信號(hào)傳輸給目標(biāo)窗單元13和特征值獲取單元14。上述特征值獲取模塊11還可以包括第一計(jì)算單元和第二計(jì)算單元,其中 第一計(jì)算單元在預(yù)先設(shè)定的基音范圍內(nèi),計(jì)算與每個(gè)基音對(duì)應(yīng)的殘差信號(hào); 第二計(jì)算單元計(jì)算與每個(gè)基音對(duì)應(yīng)的殘差信號(hào)的特征函數(shù)值,并獲取特征函 數(shù)值的最值,基音獲取模塊12將特征函數(shù)值的最值對(duì)應(yīng)的基音作為所獲得的 基音。本實(shí)施例通過(guò)設(shè)置目標(biāo)窗,對(duì)一幀信號(hào)中殘差信號(hào)的特征函數(shù)值進(jìn)行計(jì) 算,不需要計(jì)算整幀信號(hào)的相關(guān)函數(shù)值,大大降低了基音搜索的復(fù)雜度。如圖7所示,為本發(fā)明提供的另一種基音搜索裝置實(shí)施例的結(jié)構(gòu)示意圖, 本實(shí)施例具體包括查找模塊21、目標(biāo)窗模塊22、計(jì)算模塊23及基音獲取 模塊24;查找模塊21在輸入語(yǔ)音信號(hào)中,查找幅度或幅值最大的脈沖;目標(biāo)窗模塊22根據(jù)幅度或幅值最大的脈沖的位置,對(duì)輸入語(yǔ)音信號(hào)設(shè)置目標(biāo)窗;在滑動(dòng)目標(biāo)窗的同時(shí),計(jì)算模塊23計(jì)算滑動(dòng)窗內(nèi)的輸入語(yǔ)音信號(hào)與目標(biāo) 窗內(nèi)的輸入語(yǔ)音信號(hào)的相關(guān)系數(shù),獲得相關(guān)系數(shù)最大值;基音獲取模塊24根 據(jù)相關(guān)系數(shù)最大值,獲取基音。本實(shí)施例還可以包括預(yù)處理模塊25,該預(yù)處理模塊25將輸入語(yǔ)音信號(hào) 進(jìn)行預(yù)處理,具體為進(jìn)行低通濾波處理或下采樣處理;將預(yù)處理后的輸入語(yǔ) 音信號(hào)傳輸給查找模塊21 、目標(biāo)窗模塊22和計(jì)算模塊23。本實(shí)施例通過(guò)"&置目標(biāo)窗,并滑動(dòng)該目標(biāo)窗,計(jì)算滑動(dòng)窗內(nèi)的信號(hào)與目 標(biāo)窗內(nèi)的信號(hào)的相關(guān)系數(shù),根據(jù)相關(guān)系數(shù)最大值,獲取基音,不需要計(jì)算整 幀信號(hào)的相關(guān)函數(shù)值,大大降低了基音搜索的復(fù)雜度。本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述方法實(shí)施例的全部或部分步 驟可以通過(guò)程序指令相關(guān)的硬件來(lái)完成,前述的程序可以存儲(chǔ)于一計(jì)算機(jī) 可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),執(zhí)行包括上述方法實(shí)施例的步驟, 而前述的存儲(chǔ)介質(zhì)包括ROM、 RAM、磁碟或者光盤等各種可以存儲(chǔ)程 序代碼的介質(zhì)。最后應(yīng)說(shuō)明的是以上實(shí)施例僅用以說(shuō)明本發(fā)明實(shí)施例的技術(shù)方案,而 非對(duì)其限制;盡管參照前述實(shí)施例對(duì)本發(fā)明實(shí)施例進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng) 域的普通技術(shù)人員應(yīng)當(dāng)理解其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案 進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換, 并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明實(shí)施例各實(shí)施例技術(shù)方案的精神和范 圍。
權(quán)利要求
1、一種基音搜索方法,其特征在于包括獲取殘差信號(hào)的特征函數(shù)值,所述殘差信號(hào)根據(jù)輸入語(yǔ)音信號(hào)去掉長(zhǎng)時(shí)預(yù)測(cè)貢獻(xiàn)信號(hào)獲得;根據(jù)所述殘差信號(hào)的特征函數(shù)值,獲得基音。
2、 根據(jù)權(quán)利要求1所述的基音搜索方法,其特征在于,所述獲取殘差 信號(hào)的特征函數(shù)值包括獲取整幀殘差信號(hào)的特征函數(shù)值;或者,對(duì)所述輸入語(yǔ)音信號(hào)設(shè)置目標(biāo)窗,獲取所述目標(biāo)窗中殘差信號(hào)的 特征值。
3、 根據(jù)權(quán)利要求2所述的基音搜索方法,其特征在于,所述對(duì)輸入語(yǔ) 音信號(hào)設(shè)置目標(biāo)窗具體為查找所述輸入語(yǔ)音信號(hào)幅度或幅值最大的脈沖;根據(jù)所述輸入語(yǔ)音信號(hào) 幅度或幅值最大的脈沖的位置,設(shè)置所述目標(biāo)窗。
4、 根據(jù)權(quán)利要求1或2或3所述的基音搜索方法,其特征在于 所述獲取殘差信號(hào)的特征函數(shù)值包括在預(yù)先設(shè)定的基音范圍內(nèi),計(jì)算與每個(gè)基音對(duì)應(yīng)的殘差信號(hào);計(jì)算與每個(gè)基音對(duì)應(yīng)的殘差信號(hào)的特征函數(shù)值; 所述根據(jù)殘差信號(hào)的特征函數(shù)值,獲得基音包括在所述與每個(gè)基音對(duì) 應(yīng)的殘差信號(hào)的特征函數(shù)值中,查找特征函數(shù)值的最值;將所述最值對(duì)應(yīng)的 基音作為所述基音。
5、 根據(jù)權(quán)利要求4所述的基音搜索方法,其特征在于 所述殘差信號(hào)的特征函數(shù)值為殘差信號(hào)能量,所述特征函數(shù)值的最值為殘差信號(hào)能量最小值;或者,所述殘差信號(hào)的特征函數(shù)值為殘差信號(hào)絕對(duì)值之和,所述特征函 數(shù)值的最值為殘差信號(hào)絕對(duì)值之和最小值。
6、 根據(jù)權(quán)利要求1所述的基音搜索方法,其特征在于,在獲取殘差信.號(hào)的特征函數(shù)值之前還包括對(duì)所述輸入語(yǔ)音信號(hào)進(jìn)行低通濾波處理或下采 樣處理。
7、 根據(jù)權(quán)利要求1所述的基音搜索方法,其特征在于,所述長(zhǎng)時(shí)預(yù)測(cè) 貢獻(xiàn)信號(hào)是根據(jù)長(zhǎng)時(shí)預(yù)測(cè)激勵(lì)信號(hào)和基音增益確定的;所述基音增益為一固 定值,或者,所述基音增益為根據(jù)預(yù)先設(shè)定的基音范圍中的基音自適應(yīng)確定 的值。
8、 一種基音搜索方法,其特征在于包括 在輸入語(yǔ)音信號(hào)中,查找幅度或幅值最大的脈沖; 根據(jù)所述幅度或幅值最大的脈沖的位置,對(duì)所述輸入語(yǔ)音信號(hào)設(shè)置目標(biāo)窗;滑動(dòng)所述目標(biāo)窗得到滑動(dòng)窗,計(jì)算所述滑動(dòng)窗內(nèi)的輸入語(yǔ)音信號(hào)與所述 目標(biāo)窗內(nèi)的輸入語(yǔ)音信號(hào)的相關(guān)系數(shù),獲得所述相關(guān)系數(shù)最大值; 根據(jù)所述相關(guān)系數(shù)最大值,獲取基音。
9、 根據(jù)權(quán)利要求8所述的基音搜索方法,其特征在于,在所述查找幅 度或幅值最大的脈沖之前還包括將所述輸入語(yǔ)音信號(hào)進(jìn)行低通濾波處理或 下采樣處理。
10、 一種基音搜索裝置,其特征在于包括特征值獲取模塊,用于獲取殘差信號(hào)的特征函數(shù)值,所述殘差信號(hào)是根 據(jù)輸入語(yǔ)音信號(hào)去掉長(zhǎng)時(shí)預(yù)測(cè)貢獻(xiàn)信號(hào)而得到的;基音獲取模塊,用于根據(jù)所述殘差信號(hào)的特征函數(shù)值,獲得基音。
11、 根據(jù)權(quán)利要求IO所述的基音搜索裝置,其特征在于所述特征值獲取^^莫塊具體用于獲取整幀殘差信號(hào)的特征函數(shù)值; 或者,所述特征值獲取模塊包括 目標(biāo)窗單元,用于對(duì)所述輸入語(yǔ)音信號(hào)設(shè)置目標(biāo)窗; 特征值獲取單元,用于獲取所述目標(biāo)窗中殘差信號(hào)的特征值。
12、 根據(jù)權(quán)利要求11所述的基音搜索裝置,其特征在于還包括查找模塊,用于查找所述輸入語(yǔ)音信號(hào)幅度或幅值最大的脈沖;所述目標(biāo)窗單元具體用于根據(jù)所述輸入語(yǔ)音信號(hào)幅度或幅值最大的脈沖的位置,設(shè)置所述目標(biāo)窗。
13、 根據(jù)權(quán)利要求10或11或12所述的基音搜索裝置,其特征在于,所述特征值獲取模塊包括第一計(jì)算單元,用于在預(yù)先設(shè)定的基音范圍內(nèi),計(jì)算與每個(gè)基音對(duì)應(yīng)的殘差信號(hào);第二計(jì)算單元,用于計(jì)算與每個(gè)基音對(duì)應(yīng)的殘差信號(hào)的特征函數(shù)值,并獲取特征函數(shù)值的最值;所述基音獲取4莫塊具體用于將特征函數(shù)值的最值對(duì)應(yīng)的基音作為所獲得的基音。
14、 根據(jù)權(quán)利要求10所述的基音搜索裝置,其特征在于還包括預(yù)處理模塊,用于將所述輸入語(yǔ)音信號(hào)進(jìn)行低通濾波處理或下采樣處理。
15、 一種基音搜索裝置,其特征在于包括查找模塊,用于在輸入語(yǔ)音信號(hào)中,查找幅度或幅值最大的脈沖;目標(biāo)窗模塊,用于根據(jù)所述幅度或幅值最大的脈沖的位置,對(duì)所述輸入語(yǔ)音信號(hào)設(shè)置目標(biāo)窗;計(jì)算模塊,用于滑動(dòng)所述目標(biāo)窗得到滑動(dòng)窗,計(jì)算所述滑動(dòng)窗內(nèi)的輸入語(yǔ)音信號(hào)與所述目標(biāo)窗內(nèi)的輸入語(yǔ)音信號(hào)的相關(guān)系數(shù),獲得所述相關(guān)系數(shù)最大值;基音獲取模塊,用于根據(jù)所述相關(guān)系數(shù)最大值,獲取基音。
16、 根據(jù)權(quán)利要求15所述的基音搜索裝置,其特征在于還包括預(yù)處
全文摘要
本發(fā)明實(shí)施例涉及一種基音搜索方法及裝置,其中一種方法包括獲取殘差信號(hào)的特征函數(shù)值,所述殘差信號(hào)是根據(jù)輸入語(yǔ)音信號(hào)去掉長(zhǎng)時(shí)預(yù)測(cè)貢獻(xiàn)信號(hào)而得到的;根據(jù)所述殘差信號(hào)的特征函數(shù)值,獲得基音。另一種方法包括在輸入語(yǔ)音信號(hào)中,查找幅度或幅值最大的脈沖;根據(jù)所述幅度或幅值最大的脈沖的位置,對(duì)所述輸入語(yǔ)音信號(hào)設(shè)置目標(biāo)窗;滑動(dòng)所述目標(biāo)窗得到滑動(dòng)窗,計(jì)算所述滑動(dòng)窗內(nèi)的輸入語(yǔ)音信號(hào)與所述目標(biāo)窗內(nèi)的輸入語(yǔ)音信號(hào)的相關(guān)系數(shù),獲得所述相關(guān)系數(shù)最大值;根據(jù)所述相關(guān)系數(shù)最大值,獲取基音。本發(fā)明實(shí)施例通過(guò)設(shè)置目標(biāo)窗,不需要計(jì)算整幀信號(hào)的相關(guān)函數(shù)值,大大降低了基音搜索的復(fù)雜度。
文檔編號(hào)G10L15/02GK101599272SQ20081024703
公開日2009年12月9日 申請(qǐng)日期2008年12月30日 優(yōu)先權(quán)日2008年12月30日
發(fā)明者哈維·米希爾·塔迪, 清 張, 張德軍, 李立雄, 磊 苗, 許劍峰, 馬付偉, 揚(yáng) 高, 齊峰巖 申請(qǐng)人:華為技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
石首市| 山丹县| 平泉县| 防城港市| 西乌珠穆沁旗| 巴塘县| 武宣县| 赤水市| 财经| 金寨县| 会泽县| 临高县| 邵东县| 肥东县| 衢州市| 敖汉旗| 隆回县| 元谋县| 乌拉特后旗| 类乌齐县| 蒙山县| 土默特左旗| 舟曲县| 赤城县| 南通市| 枣庄市| 临湘市| 上虞市| 永新县| 厦门市| 镇坪县| 大荔县| 临武县| 石柱| 福贡县| 霸州市| 枣庄市| 保康县| 宁津县| 宁安市| 将乐县|