前后鼻音韻母的參數(shù)合成方法及感知范疇測量方法、裝置的制造方法
【專利摘要】本發(fā)明的實施方式提供了前后鼻音韻母的參數(shù)合成方法及感知范疇測量方法、裝置,其中,該前后鼻音韻母的參數(shù)合成方法包括:獲取包含前后鼻音音節(jié)的若干語音信號,并確定關(guān)鍵音段;通過處理每個語音信號的關(guān)鍵音段的第二共振峰曲線和第三共振峰曲線,合成第二共振峰連續(xù)統(tǒng)和第三共振峰連續(xù)統(tǒng);利用第二共振峰連續(xù)統(tǒng)、第三共振峰連續(xù)統(tǒng),以及第二共振峰和第三共振峰以外的其他共振峰,合成關(guān)鍵音段連續(xù)統(tǒng);將關(guān)鍵音段連續(xù)統(tǒng)中每個合成的關(guān)鍵音段與關(guān)鍵音段以外的其他音段拼接得到合成語音。本發(fā)明為參數(shù)法合成鼻音提供了新方法,所合成的前后鼻音韻母連續(xù)統(tǒng)可應(yīng)用于前后鼻音知覺空間的范疇化測量,打開了計算機(jī)輔助鼻音教學(xué)的新思路。
【專利說明】
前后鼻音韻母的參數(shù)合成方法及感知范疇測量方法、裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明的實施方式設(shè)及語音處理技術(shù),特別是關(guān)于計算機(jī)輔助語音設(shè)備中的語音 識別技術(shù),具體的講是一種前后鼻音韻母的參數(shù)合成方法及感知范疇測量方法、裝置。
【背景技術(shù)】
[0002] 本部分旨在為權(quán)利要求書中陳述的本發(fā)明的實施方式提供背景或上下文。此處的 描述不因為包括在本部分中就承認(rèn)是現(xiàn)有技術(shù)。
[0003] 日常生活中我們常常遇到前后鼻音不分的人,既包括來自很多方言區(qū)的中國人, 也包括學(xué)習(xí)漢語的外國人。而普通話中有鼻音音節(jié)502個,約占音節(jié)總數(shù)的42%;且運502個 音節(jié)中又有60%左右因為前后鼻音的音位對立造成意義上的不同。前后鼻音不分造成字詞 的混淆W及意義上的歧解,不僅給我們?nèi)粘=涣鲙聿槐?,也對外國人學(xué)習(xí)漢語語音、鼻音 音節(jié)所對應(yīng)的漢字、詞匯,甚至理解相應(yīng)的句子,產(chǎn)生了非常不利的影響。例如對于日本學(xué) 生而言,大量研究證實,日本學(xué)習(xí)者在感知和產(chǎn)出普通話前后鼻音節(jié)時遇到了較大問題。他 們學(xué)習(xí)漢語的語音時最難的部分即為鼻音。
[0004] 如果能及時發(fā)現(xiàn)漢語普通話學(xué)習(xí)者的鼻音偏誤問題,并給予他們準(zhǔn)確、有效的反 饋,將會大大地提高他們的普通話發(fā)音的準(zhǔn)確度。
[0005] 另外,在信息科學(xué)和計算機(jī)科學(xué)迅速發(fā)展的今天,語音合成技術(shù)取得了巨大的進(jìn) 步。高清晰度、高自然度,乃至高表現(xiàn)力的語音合成技術(shù)和系統(tǒng)不斷涌現(xiàn),被廣泛應(yīng)用于信 息查詢、自動報警、人機(jī)交互乃至計算機(jī)輔助語言學(xué)習(xí)等領(lǐng)域。語音合成技術(shù)甚至可W提供 各種人類難W發(fā)出的、聲學(xué)參數(shù)精確控制的合成語音,對于語音學(xué)、語音感知、語音教學(xué)等 研究和應(yīng)用有著重要價值。語音合成技術(shù)的種類主要有參數(shù)合成和語料庫合成兩種,參數(shù) 合成的基本理論假設(shè)是語音的產(chǎn)生可W看作濾波器對于激勵聲源的濾波結(jié)果,語料庫合成 則是基于細(xì)小片段語音拼接來產(chǎn)生連續(xù)語流的方法。兩種方法各有特點,都是目前研究的 執(zhí)占。 "、、'、、、〇
【發(fā)明內(nèi)容】
[0006] 前后鼻音韻母在漢語普通話中載有重要的信息傳遞作用,但是已有的研究表明很 多漢語母語者及二語學(xué)習(xí)者在其習(xí)得上存在較大困難。知覺分辨是語音范疇習(xí)得的基礎(chǔ), 為了能夠測量不同母語背景被試的普通話前后鼻音知覺空間,需要有關(guān)鍵聲學(xué)參數(shù)漸變的 "前后鼻音韻母連續(xù)統(tǒng)"作為測量工具。但是在語音合成研究中,由于鼻腔共鳴的復(fù)雜性,相 比于其他音素的語音合成,鼻音音節(jié)合成一直是一個難點。
[0007] 普通話的前后鼻音音節(jié)可分為Ξ個部分:元音段、過渡段和鼻音尾。已有的研究發(fā) 現(xiàn)鼻韻母的元音段和過渡段含有該鼻韻母的主要辨別信息。在研究本發(fā)明的過程中,通過 基于自然音節(jié)剪切和拼接樣本的語音感知實驗,發(fā)明人發(fā)現(xiàn)鼻音尾對于漢語母語者辨認(rèn)鼻 音作用很小,過渡段對于漢語母語者辨別前后鼻音類型起決定性的作用,而當(dāng)元音段和過 渡段位置線索沖突時,漢語母語者又會傾向于依賴過渡段。運也就是說,過渡段載有對于普 通話母語背景者關(guān)于前后鼻音知覺分辨的關(guān)鍵聲學(xué)線索,通過進(jìn)一步研究發(fā)現(xiàn),運一關(guān)鍵 聲學(xué)線索可W歸結(jié)為前后鼻音音節(jié)的過渡段在其第二共振峰F2、第Ξ共振峰F3具有不同的 分布情況?;诖隧棸l(fā)現(xiàn),前后鼻音韻母的參數(shù)合成就可W繞開復(fù)雜的鼻音尾合成問題,而 利用一般的參數(shù)合成法合成出具有較高前/后辨識度的鼻音韻母。
[0008] 為此,本發(fā)明提出一種前后鼻音韻母的參數(shù)合成方法、一種前后鼻音韻母的感知 范疇測量方法、一種前后鼻音韻母的參數(shù)合成裝置、一種前后鼻音韻母的感知范疇測量裝 置,為計算機(jī)輔助鼻音學(xué)習(xí)提供條件。
[0009] 在本發(fā)明實施方式的第一方面中,提供了一種前后鼻音韻母的參數(shù)合成方法,包 括:
[0010] 確定一對前后鼻音音節(jié),獲取包含所述前后鼻音音節(jié)的若干語音信號,并確定所 述每個語音信號的關(guān)鍵音段;
[0011] 提取所述每個語音信號的關(guān)鍵音段的第二共振峰曲線和第Ξ共振峰曲線;
[0012] 通過處理所述每個語音信號的關(guān)鍵音段的第二共振峰曲線和第Ξ共振峰曲線,合 成第二共振峰連續(xù)統(tǒng)和第Ξ共振峰連續(xù)統(tǒng);所述第二共振峰連續(xù)統(tǒng)包括多條合成的第二共 振峰曲線,所述第Ξ共振峰連續(xù)統(tǒng)包括多條合成的第Ξ共振峰曲線;
[0013] 利用所述第二共振峰連續(xù)統(tǒng)、所述第Ξ共振峰連續(xù)統(tǒng),W及第二共振峰和第Ξ共 振峰W外的其他共振峰,合成關(guān)鍵音段連續(xù)統(tǒng);所述關(guān)鍵音段連續(xù)統(tǒng)包括多個合成的關(guān)鍵 音段;
[0014] 將所述關(guān)鍵音段連續(xù)統(tǒng)中每個合成的關(guān)鍵音段與關(guān)鍵音段W外的其他音段拼接 得到合成語音。
[0015] 在本發(fā)明實施方式的第二方面中,提供了一種前后鼻音韻母的感知范疇測量方 法,包括:
[0016] 根據(jù)前述的前后鼻音韻母的參數(shù)合成方法得到前后鼻音韻母連續(xù)統(tǒng);
[0017] 利用所述前后鼻音韻母連續(xù)統(tǒng)中的各個合成語音,對若干被試進(jìn)行前后鼻音感知 測試;
[0018] 基于所述前后鼻音感知測試的結(jié)果,利用logistic回歸模型確定回歸系數(shù);
[0019] 利用所述回歸系數(shù)確定所述若干被試的前后鼻音感知范疇。
[0020] 在本發(fā)明實施方式的第Ξ方面中,提供了一種前后鼻音韻母的參數(shù)合成裝置,包 括:
[0021] 關(guān)鍵音段確定模塊,用于確定一對前后鼻音音節(jié),獲取包含所述前后鼻音音節(jié)的 若干語音信號,并確定所述每個語音信號的關(guān)鍵音段;
[0022] 共振峰提取模塊,用于提取所述每個語音信號的關(guān)鍵音段的第二共振峰曲線和第 Ξ共振峰曲線;
[0023] 共振峰連續(xù)統(tǒng)合成模塊,用于通過處理所述每個語音信號的關(guān)鍵音段的第二共振 峰曲線和第Ξ共振峰曲線,合成第二共振峰連續(xù)統(tǒng)和第Ξ共振峰連續(xù)統(tǒng);所述第二共振峰 連續(xù)統(tǒng)包括多條合成的第二共振峰曲線,所述第Ξ共振峰連續(xù)統(tǒng)包括多條合成的第Ξ共振 峰曲線;
[0024] 關(guān)鍵音段連續(xù)統(tǒng)合成模塊,用于利用所述第二共振峰連續(xù)統(tǒng)、所述第Ξ共振峰連 續(xù)統(tǒng),W及第二共振峰和第Ξ共振峰W外的其他共振峰,合成關(guān)鍵音段連續(xù)統(tǒng);所述關(guān)鍵音 段連續(xù)統(tǒng)包括多個合成的關(guān)鍵音段;
[0025] 語音合成模塊,用于將所述關(guān)鍵音段連續(xù)統(tǒng)中每個合成的關(guān)鍵音段與關(guān)鍵音段W 外的其他音段拼接得到合成語音。
[0026] 在本發(fā)明實施方式的第四方面中,提供了一種前后鼻音韻母的感知范疇測量裝 置,包括:
[0027] 如前所述的前后鼻音韻母的參數(shù)合成裝置;
[0028] 測試模塊,用于利用所述前后鼻音韻母的參數(shù)合成裝置合成的前后鼻音韻母連續(xù) 統(tǒng)中的各個合成語音,對若干被試進(jìn)行前后鼻音感知測試;
[0029] 回歸模型計算模塊,用于基于所述前后鼻音感知測試的結(jié)果,利用logistic回歸 模型確定回歸系數(shù);
[0030] 范疇確定模塊,用于利用所述回歸系數(shù)確定所述若干被試的前后鼻音感知范疇。
[0031] 借助于上述技術(shù)方案,本發(fā)明基于包含前后鼻音音節(jié)的若干語音信號,確定載有 前后鼻音區(qū)分特征的關(guān)鍵音段(元音段和過渡段,或者,只有過渡段),針對關(guān)鍵音段合成具 有連續(xù)變化趨勢的第二共振峰曲線和第Ξ共振峰曲線,在此基礎(chǔ)上繼續(xù)合成具有連續(xù)變化 趨勢的關(guān)鍵音段,最后合成具有連續(xù)變化趨勢的合成語音,從而得到前后鼻音韻母連續(xù)統(tǒng); 利用合成的前后鼻音韻母連續(xù)統(tǒng)對被試進(jìn)行前后鼻音感知測試,結(jié)合logistic回歸模型可 有效確定被試的前后鼻音感知范疇。本發(fā)明為參數(shù)法合成鼻音提供了新方法,所合成的前 后鼻音韻母連續(xù)統(tǒng)可用作鼻音知覺空間的范疇化測量,可有效地解決語音教學(xué)中的鼻音教 學(xué)難點問題,打開了計算機(jī)輔助鼻音教學(xué)的新思路。
【附圖說明】
[0032] 通過參考附圖閱讀下文的詳細(xì)描述,本發(fā)明示例性實施方式的上述W及其他目 的、特征和優(yōu)點將變得易于理解。在附圖中,W示例性而非限制性的方式示出了本發(fā)明的若 干實施方式,其中:
[0033] 圖1為本發(fā)明提供的前后鼻音韻母的參數(shù)合成方法的流程示意圖;
[0034] 圖2為陰平音節(jié)吁an"的語料標(biāo)注示意圖;
[0035] 圖3為合成第二共振峰連續(xù)統(tǒng)和第Ξ共振峰連續(xù)統(tǒng)的流程示意圖;
[0036] 圖4為第二共振峰連續(xù)統(tǒng)的示意圖;
[0037] 圖5為第Ξ共振峰連續(xù)統(tǒng)的示意圖;
[0038] 圖6為合成關(guān)鍵音段連續(xù)統(tǒng)的流程示意圖;
[0039] 圖7為關(guān)鍵音段連續(xù)統(tǒng)的矩陣形式示意圖;
[0040] 圖8為關(guān)鍵音段連續(xù)統(tǒng)中某一關(guān)鍵音段的共振峰曲線示意圖;
[0041] 圖9為W前鼻音音節(jié)/an/和后鼻音音節(jié)/哪/為例合成前后鼻音韻母連續(xù)統(tǒng)的過程 示意圖;
[0042] 圖10為對合成語音的關(guān)鍵音段進(jìn)行能量調(diào)整的對比示意圖;
[0043] 圖11為前后鼻音韻母的感知范疇測量方法的流程示意圖;
[0044] 圖12為根據(jù)中國被試的前后鼻音感知測試結(jié)果繪制的感知曲線;
[0045] 圖13為中國被試對元音段和過渡段的fan-fang組前后鼻音韻母連續(xù)統(tǒng)的前后鼻 音感知范疇示意圖;
[0046] 圖14為中國被試對過渡段的fan-fang組前后鼻音韻母連續(xù)統(tǒng)的前后鼻音感知范 疇示意圖;
[0047] 在附圖中,相同或?qū)?yīng)的標(biāo)號表示相同或?qū)?yīng)的部分。
【具體實施方式】
[0048] 下面將參考若干示例性實施方式來描述本發(fā)明的原理和精神。應(yīng)當(dāng)理解,給出運 些實施方式僅僅是為了使本領(lǐng)域技術(shù)人員能夠更好地理解進(jìn)而實現(xiàn)本發(fā)明,而并非W任何 方式限制本發(fā)明的范圍。相反,提供運些實施方式是為了使本公開更加透徹和完整,并且能 夠?qū)⒈竟_的范圍完整地傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0049] 本領(lǐng)域技術(shù)人員知道,本發(fā)明的實施方式可W實現(xiàn)為一種系統(tǒng)、裝置、設(shè)備、方法 或計算機(jī)程序產(chǎn)品。因此,本公開可W具體實現(xiàn)為W下形式,即:完全的硬件、完全的軟件 (包括固件、駐留軟件、微代碼等),或者硬件和軟件結(jié)合的形式。
[00加]示例性方法一
[0051] 本發(fā)明提供一種前后鼻音韻母連續(xù)統(tǒng)合成方法,如圖1所示,該方法包括:
[0052] 步驟S11,確定一對前后鼻音音節(jié),獲取包含前后鼻音音節(jié)的若干語音信號,并確 定每個語音信號的關(guān)鍵音段;
[0053] 步驟S12,提取每個語音信號的關(guān)鍵音段的第二共振峰曲線和第Ξ共振峰曲線;
[0054] 步驟S13,通過處理每個語音信號的關(guān)鍵音段的第二共振峰曲線和第Ξ共振峰曲 線,合成第二共振峰連續(xù)統(tǒng)和第Ξ共振峰連續(xù)統(tǒng);第二共振峰連續(xù)統(tǒng)包括多條合成的第二 共振峰曲線,第Ξ共振峰連續(xù)統(tǒng)包括多條合成的第Ξ共振峰曲線;
[0055] 步驟S14,利用第二共振峰連續(xù)統(tǒng)、第Ξ共振峰連續(xù)統(tǒng),W及第二共振峰和第Ξ共 振峰W外的其他共振峰,合成關(guān)鍵音段連續(xù)統(tǒng);關(guān)鍵音段連續(xù)統(tǒng)包括多個合成的關(guān)鍵音段;
[0056] 步驟S15,將關(guān)鍵音段連續(xù)統(tǒng)中每個合成的關(guān)鍵音段與關(guān)鍵音段W外的其他音段 拼接得到合成語音。
[0057] 本發(fā)明基于包含前后鼻音音節(jié)的若干語音信號,確定載有前后鼻音區(qū)分特征的關(guān) 鍵音段(元音段和過渡段,或者,只有過渡段),針對關(guān)鍵音段合成具有連續(xù)變化趨勢的第二 共振峰曲線和第Ξ共振峰曲線,在此基礎(chǔ)上繼續(xù)合成具有連續(xù)變化趨勢的關(guān)鍵音段,最后 合成具有連續(xù)變化趨勢的合成語音,運些合成語音之間呈現(xiàn)前鼻音韻母至后鼻音韻母的連 續(xù)變化趨勢。
[0058] 基于本發(fā)明的思想,前后鼻音韻母的元音段和過渡段的第二共振峰、第Ξ共振峰 存在不同分布,載有關(guān)于前后鼻音知覺分辨的關(guān)鍵聲學(xué)線索,通過修改前后鼻音韻母的元 音段和過渡段的第二共振峰、第Ξ共振峰,即可在前鼻音韻母和后鼻音韻母之間進(jìn)行轉(zhuǎn)換, 實現(xiàn)前后鼻音韻母的參數(shù)合成。
[0059] W下分別針對該方法中的每個步驟進(jìn)行詳細(xì)介紹:
[0060] 步驟S11,確定一對前后鼻音音節(jié),獲取包含該前后鼻音音節(jié)的若干語音信號,確 定每個語音信號的關(guān)鍵音段。
[0061 ] 首先,確定一對前后鼻音音節(jié)。例如可W是/an/和/巧也可W是傳 η/和/巧/,還可W 是/in/和/i如。為了方便說明,W下均W前鼻音音節(jié)/an/和后鼻音音節(jié)/邱/為例。
[0062]其次,獲取被試?yán)首x的包含該前后鼻音音節(jié)的若干語音信號。為確保本發(fā)明得到 的合成結(jié)果更具普遍意義,可令被試?yán)首x多種輔音聲母和該前后鼻音音節(jié)組成的音節(jié),例 女曰吁an"和吁ang","dan"和"dang","san"和"sang","kan"和"kang","pan"和 "pang"等等。
[0063] 然后,對獲取的每個語音信號進(jìn)行語料標(biāo)注。具體的,包括標(biāo)注輔音聲母、元音段、 過渡段和鼻音尾。圖2所示為一位女性被試?yán)首x陰平音節(jié)"fan"的語音信號的波形、能量和 共振峰。圖2中有兩層標(biāo)注,第一層是拼音層,包含音節(jié)的聲韻調(diào)信息,第二層是音段結(jié)構(gòu) 層,分為四個部分:輔音聲母Τ',元音段V',過渡段"a~"和鼻音尾V'。標(biāo)注元音段和過渡 段的邊界時,主要考慮波形、能量和共振峰運Ξ個因素。如圖2所示,過渡段的波形與元音段 差異較大,同時能量方面大幅衰減,其共振峰也沒有元音段那么穩(wěn)定。另外,標(biāo)注時應(yīng)盡量 將邊界落在元音段、過渡段和鼻音尾的波形起始原點,W便之后合成音節(jié)時音段拼接順楊, 提高合成語料的自然度。
[0064] 最后,根據(jù)語料標(biāo)注的結(jié)果,確定每個語音信號的關(guān)鍵音段。目前已有的研究發(fā)現(xiàn) 元音段和過渡段載有分辨前后鼻音的聲學(xué)線索,尤其過渡段載有分辨前后鼻音的關(guān)鍵聲學(xué) 線索,基于此項研究,本發(fā)明著重對元音段和過渡段進(jìn)行研究。因此,在設(shè)定關(guān)鍵音段時需 要考慮元音段和過渡段。可選地,令關(guān)鍵音段為元音段和過渡段,或者僅為過渡段,從而確 定每個語音信號的關(guān)鍵音段的步驟為確定每個語音信號的元音段和過渡段,或者僅確定每 個語音信號的過渡段。
[0065] 為了研究關(guān)鍵音段是否載有分辨前后鼻音的聲學(xué)線索,本發(fā)明通過步驟S12~S14 來合成具有連續(xù)變化趨勢的關(guān)鍵音段,即關(guān)鍵音段連續(xù)統(tǒng)。
[0066] 步驟S12,提取所述每個語音信號的關(guān)鍵音段的第二共振峰曲線和第Ξ共振峰曲 線。
[0067] 本步驟可采用目前已有的共振峰提取算法實現(xiàn),本發(fā)明對此不作限定,可根據(jù)實 際需要選擇。
[0068] 步驟S13,通過處理所述每個語音信號的關(guān)鍵音段的第二共振峰曲線和第Ξ共振 峰曲線,合成第二共振峰連續(xù)統(tǒng)和第Ξ共振峰連續(xù)統(tǒng)。
[0069] 本步驟是基于已有的語音信號的關(guān)鍵音段的第二共振峰曲線和第Ξ共振峰曲線, 合成具有連續(xù)變化趨勢的第二共振峰曲線,和具有連續(xù)變化趨勢的第=共振峰曲線,W此 作為后續(xù)合成具有連續(xù)變化趨勢的關(guān)鍵音段(即關(guān)鍵音段連續(xù)統(tǒng))的基礎(chǔ)。
[0070] 具體實施時,本步驟可通過圖3所示的步驟實現(xiàn):
[0071] 步驟S31,按照時間順序在每個語音信號的關(guān)鍵音段的第二共振峰曲線和第Ξ共 振峰曲線上各選取N個點,并確定每個點的第二共振峰值和第Ξ共振峰值。
[0072] 實際發(fā)音測試中,不同被試?yán)首x同一音節(jié)(例如由相同的輔音聲母和前/后鼻音音 節(jié)組成)所產(chǎn)生的語音信號可能會不同,同一被試在不同時刻朗讀同一音節(jié)(例如由相同的 輔音聲母和前/后鼻音音節(jié)組成)所產(chǎn)生的語音信號也可能不同,同一被試?yán)首x包含相同 前/后鼻音音節(jié)的不同音節(jié)(例如同樣的前/后鼻音音節(jié)與不同的輔音聲母組成的音節(jié))所 產(chǎn)生的語音信號也可能不同,運些不同可能體現(xiàn)在語音信號的時長不同,各個音段的共振 峰不同等等??紤]到運些,本發(fā)明需要獲取被試發(fā)出的語音信號的平均水平,W使后續(xù)的合 成結(jié)果可信度更高。
[0073] 由于每個語音信號的關(guān)鍵音段的時長可能是不同的,相應(yīng)的第二共振峰曲線和第 Ξ共振峰曲線的長度也是不同的,考慮時長歸一化,本步驟選取N個點的過程可W是:將每 個語音信號的關(guān)鍵音段的第二共振峰曲線等分成N-1段,各段的端點總共N個,運N個點即被 作為被選取點,同樣的,將每個語音信號的關(guān)鍵音段的第Ξ共振峰曲線等分成N-1段,各段 共N個端點作為被選取點。
[0074] 具體實施時,本步驟選取N個點的過程也可W是其他方式,例如,按照時間順序,將 每個語音信號的關(guān)鍵音段的第二/Ξ共振峰曲線等分成N'-1(N'>N)段,各段的端點總共Ν' 個,從其中選取Ν個作為最終選取的點。
[0075] 步驟S32,針對所述Ν個點中的每個點,分別計算所述若干語音信號中所有包含前 鼻音音節(jié)的語音信號在該點的第二共振峰值的平均值和第Ξ共振峰值的平均值,W及分別 計算所述若干語音信號中所有包含后鼻音音節(jié)的語音信號在該點的第二共振峰值的平均 值和第Ξ共振峰值的平均值。
[0076] 首先,按照包含的是前鼻音音節(jié)還是后鼻音音節(jié)對步驟S11獲取的若干語音信號 進(jìn)行區(qū)分,假設(shè)分為前鼻音組(由全部包含前鼻音音節(jié)的語音信號組成)和后鼻音組(由全 部包含后鼻音音節(jié)的語音信號組成)。
[0077] 其次,針對所述Ν個點中的每個點,確定前鼻音組中各個語音信號的第二共振峰值 和第Ξ共振峰值,計算運些第二共振峰值的平均值,W及運些第Ξ共振峰值的平均值,運兩 個平均值分別是當(dāng)前點處前鼻音組的第二共振峰值的平均值和第Ξ共振峰值的平均值。假 設(shè)當(dāng)前點記為i(i = l,2,3'''N),前鼻音組在當(dāng)前點的第二共振峰值的平均值記為F2ai,則前 鼻音組全部N個點的第二共振峰值的平均值為F2al,F(xiàn)2a2,F(xiàn)2a3,…F2aN,前鼻音組在當(dāng)前點的 第Ξ共振峰值的平均值記為F3ai,則前鼻音組全部N個點的第Ξ共振峰值的平均值為F3ai, F3a2,F3a3,,,,F(xiàn)3aN。
[0078] 類似的,針對所述Ν個點中的每個點,確定后鼻音組中各個語音信號的第二共振峰 值和第Ξ共振峰值,計算運些第二共振峰值的平均值,W及運些第Ξ共振峰值的平均值,運 兩個平均值分別是當(dāng)前點處后鼻音組的第二共振峰值的平均值和第Ξ共振峰值的平均值。 當(dāng)前點記為?α = 1,2,3···Ν),后鼻音組在當(dāng)前點的第二共振峰值的平均值記為F2bi,則后鼻 音組全部N個點的第二共振峰值的平均值為F2bl,F(xiàn)2b2,F(xiàn)2b3,…F2bN,后鼻音組在當(dāng)前點的第 Ξ共振峰值的平均值記為F3bi,則后鼻音組全部N個點的第Ξ共振峰值的平均值為F3bi, F3b2,F3b3,-"F3bN〇
[0079] 步驟S33,針對Ν個點中的每個點,W所有包含前鼻音音節(jié)的語音信號在該點的第 二共振峰值的平均值作為第一初始值,W所有包含后鼻音音節(jié)的語音信號在該點的第二共 振峰值的平均值作為第一結(jié)束值,將第一初始值至第一結(jié)束值的數(shù)值(包含第一初始值和 第一結(jié)束值)進(jìn)行M-1等分;將N個點對應(yīng)的第k個化=1,2,3···Μ-2)等分點的數(shù)值相連接,將 Ν個點的第一初始值相連接,將Ν個點的第一結(jié)束值相連接,共合成Μ條第二共振峰曲線,運 合成的Μ條第二共振峰曲線即組成了第二共振峰連續(xù)統(tǒng)。
[0080] 圖4所示為第二共振峰連續(xù)統(tǒng)的示意圖。在得到圖4的例子中,前鼻音音節(jié)為/an/, 后鼻音音節(jié)為/巧/,關(guān)鍵音段包括元音段及過渡段,在關(guān)鍵音段上選取10個點,前鼻音組全 部10個點的第二共振峰值的平均值為F2al,F(xiàn)2a2,F(xiàn)2a3,…。之。",后鼻音組全部10個點的第二 共振峰值的平均值為F2bi,F(xiàn)2b2,F(xiàn)2b3,···FSbio。對于當(dāng)前點i,F(xiàn)2ai為該點的第一初始值,F(xiàn)2bi 為該點的第一結(jié)束值,將F2ai至F2bi的數(shù)值(包含邊界)進(jìn)行9等分,總共8個等分點,將全部 10個點對應(yīng)的第1個等分點、第2個等分點…第8個等分點的數(shù)值相連接,分別得到F2-LI肥2 ~F2-LI肥9各條曲線,將全部1 ο個點的第一初始值相連接得到曲線F2-LI肥1,將全部10個 點的第一結(jié)束值相連接得到曲線F2-LI肥10。
[0081] 步驟S34,針對Ν個點中的每個點,W所有包含前鼻音音節(jié)的語音信號在該點的第 Ξ共振峰值的平均值作為第二初始值,W所有包含后鼻音音節(jié)的語音信號在該點的第Ξ共 振峰值的平均值作為第二結(jié)束值,將第二初始值至第二結(jié)束值的數(shù)值(包含第二初始值和 第二結(jié)束值)進(jìn)行Μ-1等分;將Ν個點對應(yīng)的第k個化=1,2,3···Μ-2)等分點的數(shù)值相連接,將 Ν個點的第二初始值相連接,將Ν個點的第二結(jié)束值相連接,共合成Μ條第Ξ共振峰曲線,運 合成的Μ條第Ξ共振峰曲線即組成了第Ξ共振峰連續(xù)統(tǒng)。
[0082] 圖5所示為第Ξ共振峰連續(xù)統(tǒng)的示意圖。在得到圖5的例子中,前鼻音音節(jié)為/an/, 后鼻音音節(jié)為/α?]Λ關(guān)鍵音段包括元音段及過渡段,在關(guān)鍵音段上選取10個點,前鼻音組全 部10個點的第Ξ共振峰值的平均值為F3al,F(xiàn)3a2,F(xiàn)3a3,···F3al0,后鼻音組全部10個點的第二 共振峰值的平均值為F3bi,F(xiàn)3b2,F(xiàn)3b3,···F3bio。對于當(dāng)前點i,F(xiàn)3ai為該點的第一初始值,F(xiàn)3bi 為該點的第一結(jié)束值,將F3ai至F3bi的數(shù)值(包含邊界)進(jìn)行9等分,總共8個等分點,將全部 10個點對應(yīng)的第1個等分點、第2個等分點…第8個等分點的數(shù)值相連接,分別得到F3-LI肥2 ~F3-LI肥9各條曲線,將全部10個點的第一初始值相連接得到曲線F3-LI肥1,將全部10個 點的第一結(jié)束值相連接得到曲線F3-LI肥10。
[0083] 步驟S14,利用第二共振峰連續(xù)統(tǒng)、第Ξ共振峰連續(xù)統(tǒng),W及第二共振峰和第Ξ共 振峰W外的其他共振峰,合成關(guān)鍵音段連續(xù)統(tǒng)。
[0084] 要合成具有連續(xù)變化趨勢的關(guān)鍵音段(即關(guān)鍵音段連續(xù)統(tǒng)),首先要合成其中的每 個關(guān)鍵音段。由于關(guān)鍵音段可表征為多種共振峰曲線的組合,因此要合成關(guān)鍵音段,不僅需 要第二共振峰曲線、第Ξ共振峰曲線,還需要其他幾種共振峰曲線(例如第一共振峰曲線)。 需要說明的是,為了研究第二共振峰和第Ξ共振峰對分辨前后鼻音的影響,在合成關(guān)鍵音 段時,應(yīng)保證所采用的其他共振峰曲線是固定不變的,即只改變第二共振峰和第Ξ共振峰。
[0085] 具體實施時,本步驟可采用圖6所示的過程實現(xiàn):
[0086] 步驟S61,將第二共振峰連續(xù)統(tǒng)中的第二共振峰曲線與第Ξ共振峰連續(xù)統(tǒng)中的第 Ξ共振峰曲線兩兩組合,得到多個互不相同的曲線組合。
[0087] 承前所述,將第二共振峰連續(xù)統(tǒng)中Μ條第二共振峰曲線與第Ξ共振峰連續(xù)統(tǒng)中Μ條 第Ξ共振峰曲線兩兩組合,可得到Μ*Μ個互不相同的曲線組合。
[0088] 步驟S62,將每個曲線組合與第二共振峰和第Ξ共振峰W外的其他共振峰合成關(guān) 鍵音段;將合成的關(guān)鍵音段組成所述關(guān)鍵音段連續(xù)統(tǒng)。
[0089] 承前所述,Μ*Μ個互不相同的曲線組合恰好合成Μ*Μ個互不相同的關(guān)鍵音段,運Μ*Μ 個互不相同的關(guān)鍵音段即組成了關(guān)鍵音段連續(xù)統(tǒng)。具體實施時,關(guān)鍵音段連續(xù)統(tǒng)可采用矩 陣表示,其中的行和列分別表示第二共振峰曲線、第Ξ共振峰曲線,每個元素代表一個合成 的關(guān)鍵音段。例如將圖4所示第二共振峰連續(xù)統(tǒng)中的第二共振峰曲線與圖5所示的第Ξ共振 峰連續(xù)統(tǒng)中的第Ξ共振峰曲線兩兩組合,再與統(tǒng)一的其他共振峰曲線合成關(guān)鍵音段,得到 如圖7所示的關(guān)鍵音段連續(xù)統(tǒng),其中坐標(biāo)為(F2-LI肥5,F(xiàn)3-LI肥5)的點對應(yīng)的關(guān)鍵音段如圖 8所示,為圖4中的F2-LI肥5、圖5中的F3-LI肥5 W及合成所用的第一共振峰曲線。
[0090] 步驟S15,將關(guān)鍵音段連續(xù)統(tǒng)中每個合成的關(guān)鍵音段與關(guān)鍵音段W外的其他音段 拼接得到合成語音。
[0091] 前面步驟合成了關(guān)鍵音段,為了合成可用于計算機(jī)輔助語音測試和學(xué)習(xí)所用的鼻 音,本步驟還需要將運些合成的關(guān)鍵音段與關(guān)鍵音段W外的其他音段進(jìn)行拼接,得到完整 的合成語音。具體實施時,該過程可借助于已有的語音學(xué)軟件(如Praat)實現(xiàn),具體過程為: 首先設(shè)定輔音聲母(:和鼻音尾?;其次,如果關(guān)鍵音段僅包含過渡段^^則還需設(shè)定元音段¥, 將過渡段F對應(yīng)的各個合成的關(guān)鍵音段作為變量輸入;如果關(guān)鍵音段包含元音段V和過渡段 民則將元音段V和過渡段t?對應(yīng)的各個合成的關(guān)鍵音段作為變量輸入;最后,得到各個變量 對應(yīng)的合成語音。該過程根據(jù)關(guān)鍵音段包含的元音段和/或過渡段來調(diào)整輸入的變量。
[0092] 由于運些合成語音是呈現(xiàn)前鼻音韻母至后鼻音韻母的連續(xù)變化趨勢,因此可將步 驟S15得到的全部合成語音形成的集合作為前后鼻音韻母連續(xù)統(tǒng)。前后鼻音韻母連續(xù)統(tǒng)中 的每個合成語音都可W看作是前鼻音韻母到后鼻音韻母(或后鼻音韻母到前鼻音韻母)漸 變的任意一個"中間態(tài)"。
[0093] 如圖9所示,W前鼻音音節(jié)/an/和后鼻音音節(jié)/叫/為例合成前后鼻音韻母連續(xù)統(tǒng), 設(shè)定輔音聲母C為?',鼻音尾為V'和"ng",關(guān)鍵音段包含元音段和過渡段,采用由如圖4所 示的第二共振峰連續(xù)統(tǒng)與圖5所示的第Ξ共振峰連續(xù)統(tǒng)合成的關(guān)鍵音段連續(xù)統(tǒng)(圖7所示的 10*10矩陣)作為變量輸入,分別得到從陰平音節(jié)吁an"漸變到吁ang"的各個合成語音,和從 陰平音節(jié)吁ang"漸變到"fan"的各個合成語音,運些合成語音共同組成了對應(yīng)元音段和過 渡段的化η-化ng組前后鼻音韻母連續(xù)統(tǒng)。
[0094] 在研究本發(fā)明的過程中發(fā)現(xiàn),由于關(guān)鍵音段的能量比起其他音段的能量更大一 些,因此通過W上語音拼接過程得到的合成語音的整體聽感不夠自然,為了避免對后續(xù)應(yīng) 用造成不良影響,可選地,本發(fā)明可在得到合成語音之后,對每個合成語音中的關(guān)鍵音段的 能量進(jìn)行適當(dāng)調(diào)整,使其更接近原始語料的能量曲線,聽感也趨近于自然音節(jié)。
[00M]如圖10所示,(a)為通過語音拼接過程得到的合成語音"fan"的能量和波形圖示, 其中關(guān)鍵音段的能量相較于其他音段來說明顯更大,(b)為對(a)中合成語音"fan"的關(guān)鍵 音段進(jìn)行適當(dāng)調(diào)整后的能量和波形圖示,更接近原始語料的能量曲線。
[0096] 示例性方法二
[0097] 本發(fā)明還提供一種前后鼻音韻母的感知范疇測量方法,如圖11所示,該方法包括:
[0098] 步驟Sill,根據(jù)示例性方法一中的前后鼻音韻母的參數(shù)合成方法得到前后鼻音韻 母連續(xù)統(tǒng),利用前后鼻音韻母連續(xù)統(tǒng)中的各個合成語音,對若干被試進(jìn)行前后鼻音感知測 試;
[0099] 步驟S112,基于前后鼻音感知測試的結(jié)果,利用logistic回歸模型確定回歸系數(shù);
[0100] 步驟S113,利用回歸系數(shù)確定若干被試的前后鼻音感知范疇。
[0101] W下分別對該方法中的各個步驟進(jìn)行詳細(xì)介紹。
[0102] 步驟S111,利用前后鼻音韻母連續(xù)統(tǒng)中的各個合成語音,對若干被試進(jìn)行前后鼻 音感知測試。
[0103] 測試過程為讓被試聽辨前后鼻音韻母連續(xù)統(tǒng)中的各個合成語音,記錄聽辨結(jié)果是 自。鼻首首節(jié)還是后鼻首首節(jié)〇
[0104] 例如,采用圖9得到的對應(yīng)元音段和過渡段的化n-fang組前后鼻音韻母連續(xù)統(tǒng),選 擇多名普通話水平二級甲等W上、聽力正常的漢語母語者作為中國被試。如圖12所示為中 國被試對特定曲線組合(分別由圖5中的第Ξ共振峰曲線F3-LI肥10和圖4中的各條第二共 振峰曲線F2-LI肥1~F2-LI肥10組成)所對應(yīng)的合成語音的聽辨結(jié)果,其中,橫坐標(biāo)為圖4中 的各個第二共振峰曲線F2-LI肥1~F2-LI肥10,縱坐標(biāo)為聽辨結(jié)果的比例。圖12的聽辨結(jié)果 表明,在第Ξ共振峰曲線F3-LINE10固定的情況下,逐漸移動第二共振峰曲線F2-LI肥1~ F2-LI肥10,感知為吁an"的比例由100%逐漸減小至0.00%,感知為吁ang"的比例由0.00% 逐漸增大至1〇〇%dF2-LI肥1~F2-LI肥5與F3-LI肥10的曲線組合中,絕大多數(shù)中國被試聽 辨結(jié)果為吁曰心',在F2-LI肥8~F2-LI肥10與F3-LI肥10的曲線組合中,絕大多數(shù)中國被試聽 辨結(jié)果為吁ang",在F2-LI肥5~F2-LI肥8與F3-LI肥10的曲線組合中,中國被試的聽辨結(jié)果 特征不明顯。
[0105] 步驟S112,基于前后鼻音感知測試的結(jié)果,利用logistic回歸模型確定回歸系數(shù)。
[0106] 具體的,利用前后鼻音感知測試的結(jié)果繪制感知曲線,該感知曲線的第一坐標(biāo)軸 記錄所述前后鼻音韻母連續(xù)統(tǒng)中各個合成語音的編號,第二坐標(biāo)軸記錄被試的前后鼻音感 知比例。圖12所示的曲線即為一條感知曲線(其中合成語音的編號采用其對應(yīng)的第二共振 峰曲線的編號表示),實際得到的感知曲線還有很多條類似的曲線。
[0107] 該步驟所采用的logistic回歸模型為:
[010 引
[0109] 其中,X為所述感知曲線上的點在第一坐標(biāo)軸上的坐標(biāo)值,L為所述感知曲線上的 點在第二坐標(biāo)軸上的坐標(biāo)值,Pi為前后鼻音的識別率,bi為回歸曲線的斜率,bo為回歸曲線 的截距,所述的回歸系數(shù)包括Pi、bi、bo。
[0110] 利用所述感知曲線上的點即可計算出回歸系數(shù)Pi、bi、bo。
[0111] 步驟S113,利用所述回歸系數(shù)確定所述若干被試的前后鼻音感知范疇。
[0112] 具體的,當(dāng)識別率Pi為0.5時,相應(yīng)的X值為范疇邊界,運里用xcb表示,范疇邊界xcb 可通過W下公式得到:
[0115] 范疇邊界的寬度被定義為Pi分別為0.化和0.75時兩點間的線性距離。
[0116] 范疇邊界越窄,范疇化傾向更明顯。
[0117] 利用圖9得到的對應(yīng)元音段和過渡段的fan-fang組前后鼻音韻母連續(xù)統(tǒng),中國被 試的前后鼻音感知范疇如圖13所示,其中,橫坐標(biāo)為第Ξ共振峰曲線F3-LINE1~F3- LI肥10,縱坐標(biāo)為第二共振峰曲線F2-LI肥1~F2-LI肥10。交點為范疇邊界(Pi為0.5),交點 相連而成的曲線表示中國被試對相應(yīng)的合成語音的聽辨結(jié)果為前后鼻音音節(jié)各占50%;范 疇下邊界(前鼻音的Pi為0.75)?下的區(qū)域,75% W上的中國被試聽辨為前鼻音音節(jié)"fan"; 范疇上邊界(前鼻音的Pi為0.25)?上區(qū)域,75% W上的中國被試聽辨為后鼻音音節(jié) 吁ang",范疇上、下邊界之間區(qū)域?qū)?yīng)的合成語音處于中國被試的感知混淆區(qū)間。
[0118] 若利用對應(yīng)過渡段(關(guān)鍵音段僅包括過渡段)的化η-化ng組前后鼻音韻母連續(xù)統(tǒng), 中國被試的前后鼻音感知范疇如圖14所示。
[0119] 實施例一
[0120] 被試為22名普通話水平二級甲等W上、聽力正常的中國研究生。
[0121] 實驗一采用的前后鼻音韻母連續(xù)統(tǒng)中前后鼻音音節(jié)為/an/和/哪/,關(guān)鍵音段包括 元音段和過渡段,包括由吁an"漸變到吁ang"的各個合成語音;
[0122] 實驗二采用的前后鼻音韻母連續(xù)統(tǒng)與實驗一采用的前后鼻音韻母連續(xù)統(tǒng)的區(qū)別 僅在于關(guān)鍵音段只包括過渡段。
[0123] 實驗一和實驗二的被試情況和實驗過程相同。
[0124] 實驗過程為:每個合成語音重復(fù)Ξ次,W盡量減少被試誤判的可能性及其影響。所 有合成語音通過E-prime 2.0軟件隨機(jī)呈現(xiàn),界面有中文指導(dǎo)語。被試逐個在隔音效果良好 的語音實驗室內(nèi)使用AKG監(jiān)聽式耳機(jī)進(jìn)行聽辨。每兩個合成語音之間呈現(xiàn)一張無聲圖片,W 弱化上一個合成語音對其后刺激的前攝影響。全部合成語音隨機(jī)分為四組,每組之間有休 息時間,W減小疲勞效應(yīng)。整個實驗時長約30分鐘。
[0125] 實驗一得到的前后鼻音感知范疇如圖13所示,實驗二得到的前后鼻音感知范疇如 圖14所示。
[0126] 實驗一實際是利用合成的元音段和過渡段的連續(xù)統(tǒng)進(jìn)行聽辨測試,實驗二實際是 利用合成的過渡段的連續(xù)統(tǒng)進(jìn)行聽辨測試。兩因素方差分析結(jié)果表明,無論是實驗一還是 實驗二,第二共振峰F2的主效應(yīng)都非常顯著(p<.001),即中國被試聽辨利用不同第二共振 峰F2得到的合成語音時,其結(jié)果存在顯著差異。而第Ξ共振峰F3的主效應(yīng)則都不顯著(P述鍛 = .98;p^g殺翊鍛=1.0),表明第Ξ共振峰F3的變化對中國被試辨別前后鼻音的結(jié)果沒有重 要的影響。
[0127] 發(fā)明人利用本發(fā)明提供的方法進(jìn)行了大量的實驗研究,運些實驗結(jié)果表明基于過 渡段和元音段的第二共振峰、第Ξ共振峰合成的前后鼻音韻母連續(xù)統(tǒng)能夠測量出母語者的 鼻音感知范疇,元音段及過渡段對漢語母語者判斷前后鼻音音節(jié)都起了非常重要的作用, 其中有統(tǒng)計上顯著影響的最關(guān)鍵聲學(xué)線索是第二共振峰F2,母語者對改變第二共振峰F2和 第Ξ共振峰F3合成的前后鼻音韻母連續(xù)統(tǒng)具有范疇感知能力。
[012引示例性裝置一
[0129]本發(fā)明還提供一種前后鼻音韻母的參數(shù)合成裝置,包括:關(guān)鍵音段確定模塊、共振 峰提取模塊、共振峰連續(xù)統(tǒng)合成模塊、關(guān)鍵音段連續(xù)統(tǒng)合成模塊、語音合成模塊。
[0130]關(guān)鍵首段確定板塊,用于確定一對自U后鼻首首節(jié),獲取包含所述自U后鼻首首節(jié)的 若干語音信號,并確定所述每個語音信號的關(guān)鍵音段;
[0131] 共振峰提取模塊,用于提取所述每個語音信號的關(guān)鍵音段的第二共振峰曲線和第 Ξ共振峰曲線;
[0132] 共振峰連續(xù)統(tǒng)合成模塊,用于通過處理所述每個語音信號的關(guān)鍵音段的第二共振 峰曲線和第Ξ共振峰曲線,合成第二共振峰連續(xù)統(tǒng)和第Ξ共振峰連續(xù)統(tǒng);所述第二共振峰 連續(xù)統(tǒng)包括多條合成的第二共振峰曲線,所述第Ξ共振峰連續(xù)統(tǒng)包括多條合成的第Ξ共振 峰曲線;
[0133] 關(guān)鍵音段連續(xù)統(tǒng)合成模塊,用于利用所述第二共振峰連續(xù)統(tǒng)、所述第Ξ共振峰連 續(xù)統(tǒng),W及第二共振峰和第Ξ共振峰W外的其他共振峰,合成關(guān)鍵音段連續(xù)統(tǒng);所述關(guān)鍵音 段連續(xù)統(tǒng)包括多個合成的關(guān)鍵音段;
[0134] 語音合成模塊,用于將所述關(guān)鍵音段連續(xù)統(tǒng)中每個合成的關(guān)鍵音段與關(guān)鍵音段W 外的其他音段拼接得到合成語音。
[0135] 可選地,共振峰連續(xù)統(tǒng)合成模塊進(jìn)一步包括:點選取模塊、共振峰平均值計算模 塊、第二共振峰連續(xù)統(tǒng)合成模塊、第Ξ共振峰連續(xù)統(tǒng)合成模塊。
[0136] 點選取模塊,用于按照時間順序在所述每個語音信號的關(guān)鍵音段的第二共振峰曲 線和第Ξ共振峰曲線上各選取N個點,并確定每個點的第二共振峰值和第Ξ共振峰值;其中 N為自然數(shù);
[0137] 共振峰平均值計算模塊,用于針對所述N個點中的每個點,分別計算所述若干語音 信號中所有包含前鼻音音節(jié)的語音信號在該點的第二共振峰值的平均值和第Ξ共振峰值 的平均值,W及分別計算所述若干語音信號中所有包含后鼻音音節(jié)的語音信號在該點的第 二共振峰值的平均值和第Ξ共振峰值的平均值;
[0138] 第二共振峰連續(xù)統(tǒng)合成模塊,用于針對所述N個點中的每個點,W所述所有包含前 鼻音音節(jié)的語音信號在該點的第二共振峰值的平均值作為第一初始值,W所述所有包含后 鼻音音節(jié)的語音信號在該點的第二共振峰值的平均值作為第一結(jié)束值,將所述第一初始值 至所述第一結(jié)束值的數(shù)值進(jìn)行M-1等分;將所述N個點對應(yīng)的第k個等分點的數(shù)值相連接,將 所述N個點的第一初始值相連接,將所述N個點的第一結(jié)束值相連接,共合成Μ條第二共振峰 曲線,將合成的所述Μ條第二共振峰曲線組成所述第二共振峰連續(xù)統(tǒng);其中,Μ為自然數(shù),k = 1,2,3···Μ-2;
[0139] 第Ξ共振峰連續(xù)統(tǒng)合成模塊,用于針對所述Ν個點中的每個點,W所述所有包含前 鼻音音節(jié)的語音信號在該點的第Ξ共振峰值的平均值作為第二初始值,W所述所有包含后 鼻音音節(jié)的語音信號在該點的第Ξ共振峰值的平均值作為第二結(jié)束值,將所述第二初始值 至所述第二結(jié)束值的數(shù)值進(jìn)行M-1等分;將所述N個點對應(yīng)的第k個等分點的數(shù)值相連接,將 所述N個點的第二初始值相連接,將所述N個點的第二結(jié)束值相連接,共合成Μ條第Ξ共振峰 曲線,將合成的所述Μ條第Ξ共振峰曲線組成所述第Ξ共振峰連續(xù)統(tǒng)。
[0140] 可選地,點選取模塊,進(jìn)一步包括:等分模塊、端點確定模塊。
[0141] 等分模塊,用于將所述每個語音信號的關(guān)鍵音段的第二共振峰曲線等分成Ν-1段, 選取等分得到的各段的Ν個端點;
[0142] 端點確定模塊,用于將所述每個語音信號的關(guān)鍵音段的第Ξ共振峰曲線等分成Ν- 1段,選取等分得到的各段的Ν個端點。
[0143] 可選地,關(guān)鍵音段連續(xù)統(tǒng)合成模塊,進(jìn)一步包括:曲線組合模塊、關(guān)鍵音段合成模 塊、關(guān)鍵音段集成模塊。
[0144] 曲線組合模塊,用于將所述第二共振峰連續(xù)統(tǒng)中的第二共振峰曲線與所述第Ξ共 振峰連續(xù)統(tǒng)中的第Ξ共振峰曲線兩兩組合成互不相同的曲線組合;
[0145] 關(guān)鍵音段合成模塊,用于將每個所述曲線組合與第二共振峰和第Ξ共振峰W外的 其他共振峰合成關(guān)鍵音段;
[0146] 關(guān)鍵音段集成模塊,用于將所述合成的關(guān)鍵音段組成所述關(guān)鍵音段連續(xù)統(tǒng)。
[0147] 可選地,前后鼻音韻母的參數(shù)合成裝置,還包括:能量調(diào)整模塊,用于調(diào)整所述合 成語音中關(guān)鍵音段的能量。
[0148] 可選地,關(guān)鍵音段為元音段和過渡段。運種情況下,語音合成模塊具體用于:將所 述關(guān)鍵音段連續(xù)統(tǒng)中每個合成的關(guān)鍵音段與輔音聲母和鼻音尾拼接得到合成語音。
[0149] 可選地,所述關(guān)鍵音段為過渡段。運種情況下,語音合成模塊具體用于:將所述關(guān) 鍵音段連續(xù)統(tǒng)中每個合成的關(guān)鍵音段與輔音聲母、元音段和鼻音尾拼接得到合成語音。
[0150] 可選地,該前后鼻音韻母的參數(shù)合成裝置,還包括:前后鼻音韻母連續(xù)統(tǒng)合成模 塊,用于將得到的全部所述合成語音組成前后鼻音韻母連續(xù)統(tǒng)。
[0151] 示例性裝置二
[0152] 本發(fā)明還提供一種前后鼻音韻母的感知范疇測量裝置,包括:示例性裝置一中提 供的前后鼻音韻母的參數(shù)合成裝置,W及測試模塊、回歸模型計算模塊、范疇確定模塊。
[0153] 測試模塊,用于利用所述前后鼻音韻母的參數(shù)合成裝置合成的前后鼻音韻母連續(xù) 統(tǒng)中的各個合成語音,對若干被試進(jìn)行前后鼻音感知測試;
[0154] 回歸模型計算模塊,用于基于所述前后鼻音感知測試的結(jié)果,利用logistic回歸 模型確定回歸系數(shù);
[0155] 范疇確定模塊,用于利用所述回歸系數(shù)確定所述若干被試的前后鼻音感知范疇。
[0156] 可選地,回歸模型計算模塊,進(jìn)一步包括:感知曲線繪制模塊、坐標(biāo)選取模塊、回歸 系數(shù)計算模塊。
[0157] 感知曲線繪制模塊,用于利用所述前后鼻音感知測試的結(jié)果繪制感知曲線,該感 知曲線的第一坐標(biāo)軸記錄所述前后鼻音韻母連續(xù)統(tǒng)中各個合成語音的編號,第二坐標(biāo)軸記 錄被試的前后鼻音感知比例;
[0158] 坐標(biāo)選取模塊,用于在所述感知曲線上選取多個點,并確定所述選取的點的坐標(biāo) 值;
[0159] 回歸系數(shù)計算模塊,用于將所述選取的點的坐標(biāo)值代入如下的logistic回歸模型 中,計算回歸系數(shù):
[0160]
[0161] 其中,X為所述感知曲線上的點在第一坐標(biāo)軸上的坐標(biāo)值,L為所述感知曲線上的 點在第二坐標(biāo)軸上的坐標(biāo)值,Pi為回歸曲線的識別率,bi為回歸曲線的斜率,bo為回歸曲線 的截距,所述的回歸系數(shù)包括Pi、bi、bo。
[0162] 可選地,范疇確定模塊,進(jìn)一步包括:范疇邊界確定模塊、范疇上邊界確定模塊、范 疇下邊界確定模塊。
[0163] 范疇邊界確定模塊,用于將所述回歸曲線的識別率Pi為0.5時的X值確定為范疇邊 界;
[0164] 范疇上邊界確定模塊,用于將所述回歸曲線的識別率Pi為0.25時的X值確定為范 疇上邊界;
[0165] 范疇下邊界確定模塊,用于將所述回歸曲線的識別率Pi為0.75時的X值確定為范 疇下邊界。
[0166] W上所述的具體實施例,對本發(fā)明的目的、技術(shù)方案和有益效果進(jìn)行了進(jìn)一步詳 細(xì)說明,所應(yīng)理解的是,W上所述僅為本發(fā)明的具體實施例而已,并不用于限定本發(fā)明的保 護(hù)范圍,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本 發(fā)明的保護(hù)范圍之內(nèi)。
[0167] 盡管在附圖中W特定順序描述了本發(fā)明方法的操作,但是,運并非要求或者暗示 必須按照該特定順序來執(zhí)行運些操作,或是必須執(zhí)行全部所示的操作才能實現(xiàn)期望的結(jié) 果。附加地或備選地,可W省略某些步驟,將多個步驟合并為一個步驟執(zhí)行,和/或?qū)⒁粋€步 驟分解為多個步驟執(zhí)行。
[0168] 盡管在上文詳細(xì)描述中提及了前后鼻音韻母的參數(shù)合成裝置和前后鼻音韻母的 感知范疇測量裝置的若干模塊,但是運種劃分僅僅并非強(qiáng)制性的。實際上,根據(jù)本發(fā)明的實 施方式,上文描述的兩個或更多模塊的特征和功能可W在一個模塊中具體化。反之,上文描 述的一個模塊的特征和功能可W進(jìn)一步劃分為由多個模塊來具體化。
[0169] 雖然已經(jīng)參考若干【具體實施方式】描述了本發(fā)明的精神和原理,但是應(yīng)該理解,本 發(fā)明并不限于所公開的【具體實施方式】,對各方面的劃分也不意味著運些方面中的特征不能 組合W進(jìn)行受益,運種劃分僅是為了表述的方便。本發(fā)明旨在涵蓋所附權(quán)利要求的精神和 范圍內(nèi)所包括的各種修改和等同布置。
[0170] 本領(lǐng)域技術(shù)人員還可W 了解到本發(fā)明實施例列出的各種說明性邏輯塊 (illustrative logical block),單元,和步驟可W通過電子硬件、電腦軟件,或兩者的結(jié) 合進(jìn)行實現(xiàn)。為清楚展示硬件和軟件的可替換性。111日'油日叫日日13;[1;^7),上述的各種說明 性部件(illustrative components),單元和步驟已經(jīng)通用地描述了它們的功能。運樣的功 能是通過硬件還是軟件來實現(xiàn)取決于特定的應(yīng)用和整個系統(tǒng)的設(shè)計要求。本領(lǐng)域技術(shù)人員 可W對于每種特定的應(yīng)用,可W使用各種方法實現(xiàn)所述的功能,但運種實現(xiàn)不應(yīng)被理解為 超出本發(fā)明實施例保護(hù)的范圍。
[0171] 本發(fā)明實施例中所描述的各種說明性的邏輯塊,或單元,或裝置都可W通過通用 處理器,數(shù)字信號處理器,專用集成電路(ASIC),現(xiàn)場可編程口陣列或其它可編程邏輯裝 置,離散口或晶體管邏輯,離散硬件部件,或上述任何組合的設(shè)計來實現(xiàn)或操作所描述的功 能。通用處理器可W為微處理器,可選地,該通用處理器也可W為任何傳統(tǒng)的處理器、控制 器、微控制器或狀態(tài)機(jī)。處理器也可W通過計算裝置的組合來實現(xiàn),例如數(shù)字信號處理器和 微處理器,多個微處理器,一個或多個微處理器聯(lián)合一個數(shù)字信號處理器核,或任何其它類 似的配置來實現(xiàn)。
[0172] 本發(fā)明實施例中所描述的方法或算法的步驟可W直接嵌入硬件、處理器執(zhí)行的軟 件模塊、或者運兩者的結(jié)合。軟件模塊可W存儲于RAM存儲器、閃存、ROM存儲器、EPROM存儲 器、EEPR0M存儲器、寄存器、硬盤、可移動磁盤、CD-ROM或本領(lǐng)域中其它任意形式的存儲媒介 中。示例性地,存儲媒介可W與處理器連接,W使得處理器可W從存儲媒介中讀取信息,并 可W向存儲媒介存寫信息。可選地,存儲媒介還可W集成到處理器中。處理器和存儲媒介可 W設(shè)置于ASIC中,ASIC可W設(shè)置于用戶終端中??蛇x地,處理器和存儲媒介也可W設(shè)置于用 戶終端中的不同的部件中。
[0173] 在一個或多個示例性的設(shè)計中,本發(fā)明實施例所描述的上述功能可W在硬件、軟 件、固件或運Ξ者的任意組合來實現(xiàn)。如果在軟件中實現(xiàn),運些功能可W存儲與電腦可讀的 媒介上,或W-個或多個指令或代碼形式傳輸于電腦可讀的媒介上。電腦可讀媒介包括電 腦存儲媒介和便于使得讓電腦程序從一個地方轉(zhuǎn)移到其它地方的通信媒介。存儲媒介可W 是任何通用或特殊電腦可W接入訪問的可用媒體。例如,運樣的電腦可讀媒體可W包括但 不限于341、1?01、66?1?01八0-1?01或其它光盤存儲、磁盤存儲或其它磁性存儲裝置,或其它任 何可W用于承載或存儲W指令或數(shù)據(jù)結(jié)構(gòu)和其它可被通用或特殊電腦、或通用或特殊處理 器讀取形式的程序代碼的媒介。此外,任何連接都可w被適當(dāng)?shù)囟x為電腦可讀媒介,例 如,如果軟件是從一個網(wǎng)站站點、服務(wù)器或其它遠(yuǎn)程資源通過一個同軸電纜、光纖電纜、雙 絞線、數(shù)字用戶線(D化)或W例如紅外、無線和微波等無線方式傳輸?shù)囊脖话谒x的 電腦可讀媒介中。所述的碟片(disk)和磁盤(disc)包括壓縮磁盤、錯射盤、光盤、DVD、軟盤 和藍(lán)光光盤,磁盤通常W磁性復(fù)制數(shù)據(jù),而碟片通常W激光進(jìn)行光學(xué)復(fù)制數(shù)據(jù)。上述的組合 也可W包含在電腦可讀媒介中。
【主權(quán)項】
1. 一種前后鼻音韻母的參數(shù)合成方法,其特征在于,包括: 確定一對前后鼻音音節(jié),獲取包含所述前后鼻音音節(jié)的若干語音信號,并確定所述每 個語音信號的關(guān)鍵音段; 提取所述每個語音信號的關(guān)鍵音段的第二共振峰曲線和第三共振峰曲線; 通過處理所述每個語音信號的關(guān)鍵音段的第二共振峰曲線和第三共振峰曲線,合成第 二共振峰連續(xù)統(tǒng)和第三共振峰連續(xù)統(tǒng);所述第二共振峰連續(xù)統(tǒng)包括多條合成的第二共振峰 曲線,所述第三共振峰連續(xù)統(tǒng)包括多條合成的第三共振峰曲線; 利用所述第二共振峰連續(xù)統(tǒng)、所述第三共振峰連續(xù)統(tǒng),以及第二共振峰和第三共振峰 以外的其他共振峰,合成關(guān)鍵音段連續(xù)統(tǒng);所述關(guān)鍵音段連續(xù)統(tǒng)包括多個合成的關(guān)鍵音段; 將所述關(guān)鍵音段連續(xù)統(tǒng)中每個合成的關(guān)鍵音段與關(guān)鍵音段以外的其他音段拼接得到 合成語音。2. 根據(jù)權(quán)利要求1所述的前后鼻音韻母的參數(shù)合成方法,其特征在于,所述的通過處理 所述每個語音信號的關(guān)鍵音段的第二共振峰曲線和第三共振峰曲線,合成第二共振峰連續(xù) 統(tǒng)和第三共振峰連續(xù)統(tǒng),包括: 按照時間順序在所述每個語音信號的關(guān)鍵音段的第二共振峰曲線和第三共振峰曲線 上各選取N個點,并確定每個點的第二共振峰值和第三共振峰值;其中N為自然數(shù); 針對所述N個點中的每個點,分別計算所述若干語音信號中所有包含前鼻音音節(jié)的語 音信號在該點的第二共振峰值的平均值和第三共振峰值的平均值,以及分別計算所述若干 語音信號中所有包含后鼻音音節(jié)的語音信號在該點的第二共振峰值的平均值和第三共振 峰值的平均值; 針對所述N個點中的每個點,以所述所有包含前鼻音音節(jié)的語音信號在該點的第二共 振峰值的平均值作為第一初始值,以所述所有包含后鼻音音節(jié)的語音信號在該點的第二共 振峰值的平均值作為第一結(jié)束值,將所述第一初始值至所述第一結(jié)束值的數(shù)值進(jìn)行M-1等 分;將所述N個點對應(yīng)的第k個等分點的數(shù)值相連接,將所述N個點的第一初始值相連接,將 所述N個點的第一結(jié)束值相連接,共合成Μ條第二共振峰曲線,將合成的所述Μ條第二共振峰 曲線組成所述第二共振峰連續(xù)統(tǒng);其中,Μ為自然數(shù),k = 1,2,3···Μ-2; 針對所述Ν個點中的每個點,以所述所有包含前鼻音音節(jié)的語音信號在該點的第三共 振峰值的平均值作為第二初始值,以所述所有包含后鼻音音節(jié)的語音信號在該點的第三共 振峰值的平均值作為第二結(jié)束值,將所述第二初始值至所述第二結(jié)束值的數(shù)值進(jìn)行Μ-1等 分;將所述Ν個點對應(yīng)的第k個等分點的數(shù)值相連接,將所述Ν個點的第二初始值相連接,將 所述N個點的第二結(jié)束值相連接,共合成Μ條第三共振峰曲線,將合成的所述Μ條第三共振峰 曲線組成所述第三共振峰連續(xù)統(tǒng)。3. 根據(jù)權(quán)利要求2所述的前后鼻音韻母的參數(shù)合成方法,其特征在于,所述的按照時間 順序在所述每個語音信號的關(guān)鍵音段的第二共振峰曲線和第三共振峰曲線上各選取Ν個 點,包括: 將所述每個語音信號的關(guān)鍵音段的第二共振峰曲線等分成Ν-1段,選取等分得到的各 段的Ν個端點; 將所述每個語音信號的關(guān)鍵音段的第三共振峰曲線等分成Ν-1段,選取等分得到的各 段的Ν個端點。4. 根據(jù)權(quán)利要求2所述的前后鼻音韻母的參數(shù)合成方法,其特征在于,所述的利用所述 第二共振峰連續(xù)統(tǒng)、所述第三共振峰連續(xù)統(tǒng),以及第二共振峰和第三共振峰以外的其他共 振峰,合成關(guān)鍵音段連續(xù)統(tǒng),包括: 將所述第二共振峰連續(xù)統(tǒng)中的第二共振峰曲線與所述第三共振峰連續(xù)統(tǒng)中的第三共 振峰曲線兩兩組合成互不相同的曲線組合; 將每個所述曲線組合與第二共振峰和第三共振峰以外的其他共振峰合成關(guān)鍵音段; 將所述合成的關(guān)鍵音段組成所述關(guān)鍵音段連續(xù)統(tǒng)。5. 根據(jù)權(quán)利要求1所述的前后鼻音韻母的參數(shù)合成方法,其特征在于,還包括:調(diào)整所 述合成語音中關(guān)鍵音段的能量。6. 根據(jù)權(quán)利要求1~5任一所述的前后鼻音韻母的參數(shù)合成方法,其特征在于,所述關(guān) 鍵音段為元音段和過渡段。7. 根據(jù)權(quán)利要求6所述的前后鼻音韻母的參數(shù)合成方法,其特征在于,所述的將所述關(guān) 鍵音段連續(xù)統(tǒng)中每個合成的關(guān)鍵音段與關(guān)鍵音段以外的其他音段拼接得到合成語音,包 括: 將所述關(guān)鍵音段連續(xù)統(tǒng)中每個合成的關(guān)鍵音段與輔音聲母和鼻音尾拼接得到合成語 音。8. 根據(jù)權(quán)利要求1~5任一所述的前后鼻音韻母的參數(shù)合成方法,其特征在于,所述關(guān) 鍵音段為過渡段。9. 根據(jù)權(quán)利要求8所述的前后鼻音韻母的參數(shù)合成方法,其特征在于,所述的將所述關(guān) 鍵音段連續(xù)統(tǒng)中每個合成的關(guān)鍵音段與關(guān)鍵音段以外的其他音段拼接得到合成語音,包 括: 將所述關(guān)鍵音段連續(xù)統(tǒng)中每個合成的關(guān)鍵音段與輔音聲母、元音段和鼻音尾拼接得到 合成語音。10. 根據(jù)權(quán)利要求1所述的前后鼻音韻母的參數(shù)合成方法,其特征在于,還包括:將得到 的全部所述合成語音組成前后鼻音韻母連續(xù)統(tǒng)。11. 一種前后鼻音韻母的感知范疇測量方法,其特征在于,包括: 根據(jù)權(quán)利要求10所述的前后鼻音韻母的參數(shù)合成方法得到前后鼻音韻母連續(xù)統(tǒng); 利用所述前后鼻音韻母連續(xù)統(tǒng)中的各個合成語音,對若干被試進(jìn)行前后鼻音感知測 試; 基于所述前后鼻音感知測試的結(jié)果,利用logistic回歸模型確定回歸系數(shù); 利用所述回歸系數(shù)確定所述若干被試的前后鼻音感知范疇。12. 根據(jù)權(quán)利要求11所述的前后鼻音韻母的感知范疇測量方法,其特征在于,所述的基 于所述前后鼻音感知測試的結(jié)果,利用logistic回歸模型確定回歸系數(shù),包括: 利用所述前后鼻音感知測試的結(jié)果繪制感知曲線,該感知曲線的第一坐標(biāo)軸記錄所述 前后鼻音韻母連續(xù)統(tǒng)中各個合成語音的編號,第二坐標(biāo)軸記錄被試的前后鼻音感知比例; 在所述感知曲線上選取多個點,并確定所述選取的點的坐標(biāo)值; 將所述選取的點的坐標(biāo)值代入如下的logistic回歸模型中,計算回歸系數(shù):其中,X為所述感知曲線上的點在第一坐標(biāo)軸上的坐標(biāo)值,L為所述感知曲線上的點在 第二坐標(biāo)軸上的坐標(biāo)值,P:為回歸曲線的識別率,h為回歸曲線的斜率,b〇為回歸曲線的截 距,所述的回歸系數(shù)包括Pi、bi、bo。13. 根據(jù)權(quán)利要求12所述的前后鼻音韻母的感知范疇測量方法,其特征在于,所述的利 用所述回歸系數(shù)確定所述若干被試的前后鼻音感知范疇,包括: 將所述回歸曲線的識別率Pi為〇. 5時的X值確定為范疇邊界; 將所述回歸曲線的識別率Pi為〇. 25時的X值確定為范疇上邊界; 將所述回歸曲線的識別率Pi為〇. 75時的X值確定為范疇下邊界。14. 一種前后鼻音韻母的參數(shù)合成裝置,其特征在于,包括: 關(guān)鍵音段確定模塊,用于確定一對前后鼻音音節(jié),獲取包含所述前后鼻音音節(jié)的若干 語音信號,并確定所述每個語音信號的關(guān)鍵音段; 共振峰提取模塊,用于提取所述每個語音信號的關(guān)鍵音段的第二共振峰曲線和第三共 振峰曲線; 共振峰連續(xù)統(tǒng)合成模塊,用于通過處理所述每個語音信號的關(guān)鍵音段的第二共振峰曲 線和第三共振峰曲線,合成第二共振峰連續(xù)統(tǒng)和第三共振峰連續(xù)統(tǒng);所述第二共振峰連續(xù) 統(tǒng)包括多條合成的第二共振峰曲線,所述第三共振峰連續(xù)統(tǒng)包括多條合成的第三共振峰曲 線; 關(guān)鍵音段連續(xù)統(tǒng)合成模塊,用于利用所述第二共振峰連續(xù)統(tǒng)、所述第三共振峰連續(xù)統(tǒng), 以及第二共振峰和第三共振峰以外的其他共振峰,合成關(guān)鍵音段連續(xù)統(tǒng);所述關(guān)鍵音段連 續(xù)統(tǒng)包括多個合成的關(guān)鍵音段; 語音合成模塊,用于將所述關(guān)鍵音段連續(xù)統(tǒng)中每個合成的關(guān)鍵音段與關(guān)鍵音段以外的 其他音段拼接得到合成語音。15. 根據(jù)權(quán)利要求14所述的前后鼻音韻母的參數(shù)合成裝置,其特征在于,所述共振峰連 續(xù)統(tǒng)合成模塊進(jìn)一步包括: 點選取模塊,用于按照時間順序在所述每個語音信號的關(guān)鍵音段的第二共振峰曲線和 第三共振峰曲線上各選取N個點,并確定每個點的第二共振峰值和第三共振峰值;其中N為 自然數(shù); 共振峰平均值計算模塊,用于針對所述N個點中的每個點,分別計算所述若干語音信號 中所有包含前鼻音音節(jié)的語音信號在該點的第二共振峰值的平均值和第三共振峰值的平 均值,以及分別計算所述若干語音信號中所有包含后鼻音音節(jié)的語音信號在該點的第二共 振峰值的平均值和第三共振峰值的平均值; 第二共振峰連續(xù)統(tǒng)合成模塊,用于針對所述N個點中的每個點,以所述所有包含前鼻音 音節(jié)的語音信號在該點的第二共振峰值的平均值作為第一初始值,以所述所有包含后鼻音 音節(jié)的語音信號在該點的第二共振峰值的平均值作為第一結(jié)束值,將所述第一初始值至所 述第一結(jié)束值的數(shù)值進(jìn)行M-1等分;將所述N個點對應(yīng)的第k個等分點的數(shù)值相連接,將所述 N個點的第一初始值相連接,將所述N個點的第一結(jié)束值相連接,共合成Μ條第二共振峰曲 線,將合成的所述Μ條第二共振峰曲線組成所述第二共振峰連續(xù)統(tǒng);其中,Μ為自然數(shù),k= 1, 2,3···Μ-2; 第三共振峰連續(xù)統(tǒng)合成模塊,用于針對所述Ν個點中的每個點,以所述所有包含前鼻音 音節(jié)的語音信號在該點的第三共振峰值的平均值作為第二初始值,以所述所有包含后鼻音 音節(jié)的語音信號在該點的第三共振峰值的平均值作為第二結(jié)束值,將所述第二初始值至所 述第二結(jié)束值的數(shù)值進(jìn)行M-1等分;將所述N個點對應(yīng)的第k個等分點的數(shù)值相連接,將所述 N個點的第二初始值相連接,將所述N個點的第二結(jié)束值相連接,共合成Μ條第三共振峰曲 線,將合成的所述Μ條第三共振峰曲線組成所述第三共振峰連續(xù)統(tǒng)。16. 根據(jù)權(quán)利要求15所述的前后鼻音韻母的參數(shù)合成裝置,其特征在于,所述點選取模 塊,進(jìn)一步包括: 等分模塊,用于將所述每個語音信號的關(guān)鍵音段的第二共振峰曲線等分成Ν-1段,選取 等分得到的各段的Ν個端點; 端點確定模塊,用于將所述每個語音信號的關(guān)鍵音段的第三共振峰曲線等分成Ν-1段, 選取等分得到的各段的Ν個端點。17. 根據(jù)權(quán)利要求15所述的前后鼻音韻母的參數(shù)合成裝置,其特征在于,所述關(guān)鍵音段 連續(xù)統(tǒng)合成模塊,進(jìn)一步包括: 曲線組合模塊,用于將所述第二共振峰連續(xù)統(tǒng)中的第二共振峰曲線與所述第三共振峰 連續(xù)統(tǒng)中的第三共振峰曲線兩兩組合成互不相同的曲線組合; 關(guān)鍵音段合成模塊,用于將每個所述曲線組合與第二共振峰和第三共振峰以外的其他 共振峰合成關(guān)鍵音段; 關(guān)鍵音段集成模塊,用于將所述合成的關(guān)鍵音段組成所述關(guān)鍵音段連續(xù)統(tǒng)。18. 根據(jù)權(quán)利要求14所述的前后鼻音韻母的參數(shù)合成裝置,其特征在于,還包括:能量 調(diào)整模塊,用于調(diào)整所述合成語音中關(guān)鍵音段的能量。19. 根據(jù)權(quán)利要求14~18任一所述的前后鼻音韻母的參數(shù)合成裝置,其特征在于,所述 關(guān)鍵音段為元音段和過渡段。20. 根據(jù)權(quán)利要求19所述的前后鼻音韻母的參數(shù)合成裝置,其特征在于,所述語音合成 模塊具體用于:將所述關(guān)鍵音段連續(xù)統(tǒng)中每個合成的關(guān)鍵音段與輔音聲母和鼻音尾拼接得 到合成語音。21. 根據(jù)權(quán)利要求14~18任一所述的前后鼻音韻母的參數(shù)合成裝置,其特征在于,所述 關(guān)鍵音段為過渡段。22. 根據(jù)權(quán)利要求21所述的前后鼻音韻母的參數(shù)合成裝置,其特征在于,所述語音合成 模塊具體用于:將所述關(guān)鍵音段連續(xù)統(tǒng)中每個合成的關(guān)鍵音段與輔音聲母、元音段和鼻音 尾拼接得到合成語音。23. 根據(jù)權(quán)利要求14所述的前后鼻音韻母的參數(shù)合成裝置,其特征在于,還包括: 前后鼻音韻母連續(xù)統(tǒng)合成模塊,用于將得到的全部所述合成語音組成前后鼻音韻母連 續(xù)統(tǒng)。24. -種前后鼻音韻母的感知范疇測量裝置,其特征在于,包括: 權(quán)利要求23所述的前后鼻音韻母的參數(shù)合成裝置; 測試模塊,用于利用所述前后鼻音韻母的參數(shù)合成裝置合成的前后鼻音韻母連續(xù)統(tǒng)中 的各個合成語音,對若干被試進(jìn)行前后鼻音感知測試; 回歸模型計算模塊,用于基于所述前后鼻音感知測試的結(jié)果,利用logistic回歸模型 確定回歸系數(shù); 范疇確定模塊,用于利用所述回歸系數(shù)確定所述若干被試的前后鼻音感知范疇。25. 根據(jù)權(quán)利要求24所述的前后鼻音韻母的感知范疇測量裝置,其特征在于,所述回歸 模型計算模塊,進(jìn)一步包括: 感知曲線繪制模塊,用于利用所述前后鼻音感知測試的結(jié)果繪制感知曲線,該感知曲 線的第一坐標(biāo)軸記錄所述前后鼻音韻母連續(xù)統(tǒng)中各個合成語音的編號,第二坐標(biāo)軸記錄被 試的前后鼻音感知比例; 坐標(biāo)選取模塊,用于在所述感知曲線上選取多個點,并確定所述選取的點的坐標(biāo)值; 回歸系數(shù)計算模塊,用于將所述選取的點的坐標(biāo)值代入如下的logistic回歸模型中, 計算回歸系數(shù):其中,X為所述感知曲線上的點在第一坐標(biāo)軸上的坐標(biāo)值,L為所述感知曲線上的點在 第二坐標(biāo)軸上的坐標(biāo)值,P:為回歸曲線的識別率,h為回歸曲線的斜率,b〇為回歸曲線的截 距,所述的回歸系數(shù)包括Pi、bi、bo。26. 根據(jù)權(quán)利要求25所述的前后鼻音韻母的感知范疇測量裝置,其特征在于,所述范疇 確定模塊,進(jìn)一步包括: 范疇邊界確定模塊,用于將所述回歸曲線的識別率Pi為〇. 5時的X值確定為范疇邊界; 范疇上邊界確定模塊,用于將所述回歸曲線的識別率Pi為0.25時的X值確定為范疇上邊 界; 范疇下邊界確定模塊,用于將所述回歸曲線的識別率PzSO.75時的X值確定為范疇下邊 界。
【文檔編號】G10L13/10GK105825847SQ201610149425
【公開日】2016年8月3日
【申請日】2016年3月16日
【發(fā)明人】張勁松, 郝麗霞, 解焱陸, 時書菊, 曹文
【申請人】北京語言大學(xué)