欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種用于口語測(cè)試的文本朗讀水平自動(dòng)評(píng)估診斷方法

文檔序號(hào):2555316閱讀:206來源:國(guó)知局
專利名稱:一種用于口語測(cè)試的文本朗讀水平自動(dòng)評(píng)估診斷方法
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)輔助語言學(xué)習(xí)領(lǐng)域,具體涉及一種用于口語測(cè)試的文本朗讀水
平自動(dòng)評(píng)估診斷方法,它要求測(cè)試者朗讀預(yù)先設(shè)定的文本,然后利用收集到的語音對(duì)測(cè)試 者的口語能力做出自動(dòng)評(píng)估。
背景技術(shù)
近十年來,計(jì)算機(jī)輔助學(xué)習(xí)技術(shù)得到業(yè)界的廣泛關(guān)注,并且取得了長(zhǎng)足的進(jìn)步,尤 其是在口語學(xué)習(xí)領(lǐng)域,人機(jī)交互的學(xué)習(xí)方式幾已趨于使用。在這種情況下,將口語評(píng)估從全 人工的方式中解脫出來更是大勢(shì)所趨。要做到這一點(diǎn),計(jì)算機(jī)作為"虛擬教師",必須能對(duì)測(cè) 試者的口語能力做出一個(gè)公允、準(zhǔn)確、詳盡的評(píng)估。這就需要設(shè)計(jì)者在大量的歷史評(píng)估數(shù)據(jù) 中收集足夠多的樣例,用于改進(jìn)計(jì)算機(jī)的評(píng)估效果。在大規(guī)模數(shù)據(jù)的支持下,相比于傳統(tǒng)的 人工口語評(píng)估中所存在的隨意性和主觀性,計(jì)算機(jī)評(píng)估更能為測(cè)試者做出一個(gè)公平公正的 評(píng)估結(jié)果。至于如何在收集到的大量評(píng)估數(shù)據(jù)基礎(chǔ)上,開發(fā)出有效的自動(dòng)評(píng)估算法,則成為 自動(dòng)口語評(píng)估所需要研究的內(nèi)容。 目前已有的自動(dòng)口語評(píng)估方法的框架大體都是基于朗讀語音評(píng)估,通過評(píng)估測(cè)試 者的朗讀語音得出機(jī)器評(píng)分,其選用的特征主要是發(fā)音和漢語聲調(diào),并且診斷信息不足。

發(fā)明內(nèi)容
本發(fā)明的目的是在收集到的大量評(píng)估數(shù)據(jù)基礎(chǔ)上,開發(fā)出有效的自動(dòng)評(píng)估方法, 通過對(duì)測(cè)試者的朗讀語音進(jìn)行處理,從而自動(dòng)評(píng)估其口語能力,為此本發(fā)明提出一種用于 口語測(cè)試的文本朗讀水平自動(dòng)評(píng)估診斷方法。 為達(dá)成所述目的,本發(fā)明提供一種用于口語測(cè)試的文本朗讀水平自動(dòng)評(píng)估診斷方 法,其技術(shù)方案如下所述測(cè)試者朗讀預(yù)先設(shè)定的文本,提取測(cè)試者按照給定文本朗讀語音 的特征,選取完整性、準(zhǔn)確性和流利性三方面特征作為機(jī)器評(píng)估的評(píng)判標(biāo)準(zhǔn),在歷史評(píng)估數(shù) 據(jù)上提取并訓(xùn)練其統(tǒng)計(jì)模型和擬分模型用于實(shí)際的評(píng)估。測(cè)試的時(shí)候,同樣提取測(cè)試人朗 讀語音的特征,在統(tǒng)計(jì)模型上打分,最后通過擬分模型得出實(shí)際的機(jī)器分。同時(shí),對(duì)該測(cè)試 者的各項(xiàng)語言能力,該發(fā)明可以按照不同的分類給出其相應(yīng)的診斷信息,用于糾正測(cè)試者 的錯(cuò)誤,使其能夠在測(cè)試中不斷進(jìn)步。 本發(fā)明的有益效果本發(fā)明基于測(cè)試人朗讀語音的語言能力自動(dòng)評(píng)估,利用大量 的歷史評(píng)估數(shù)據(jù),該方法能夠做到公允、準(zhǔn)確、詳盡的口語能力評(píng)估,并且能有效地克服人 工評(píng)分的隨意性和主觀性,從而促進(jìn)測(cè)試者的語言學(xué)習(xí)過程。本發(fā)明的特點(diǎn)是利用改進(jìn)的 發(fā)音、聲調(diào)、語速和音節(jié)段長(zhǎng)特征,同時(shí)加入特有的對(duì)齊特征、停頓特征和編輯特征,將特征 分別歸為完整性、準(zhǔn)確性和流利性三大類,分門別類對(duì)測(cè)試者的語音做評(píng)估和診斷。同時(shí)針 對(duì)不需要診斷信息和需要診斷信息的場(chǎng)合,分別采用直接擬合和分層擬合框架做機(jī)器分?jǐn)M 合。此外,采用分段擬合來處理失衡的訓(xùn)練數(shù)據(jù)。


圖1是本發(fā)明的朗讀語音評(píng)估總體框架。
圖2是本發(fā)明的直接擬合框架。 圖3是本發(fā)明的分層擬合框架。 圖4是本發(fā)明的英語口語診斷界面示例圖。 圖5是本發(fā)明的漢語聲調(diào)診斷界面示例圖。
具體實(shí)施例方式
下面結(jié)合附圖詳細(xì)說明本發(fā)明技術(shù)方案中所涉及的各個(gè)細(xì)節(jié)問題。應(yīng)指出的是,
所描述的實(shí)施例僅旨在便于對(duì)本發(fā)明的理解,而對(duì)其不起任何限定作用。 請(qǐng)參閱圖l,本發(fā)明的朗讀語音評(píng)估總體框架。對(duì)照?qǐng)Dl,為了達(dá)到朗讀評(píng)估的目
的,需要在一臺(tái)配備錄音設(shè)備的計(jì)算機(jī)上實(shí)現(xiàn)本發(fā)明的朗讀語音評(píng)估,還需要準(zhǔn)備的資源
包括歷史評(píng)估數(shù)據(jù)和朗讀文本;需要使用通用編程語言(如C++)編制總體結(jié)構(gòu)各模塊的
程序,包括模型訓(xùn)練模塊、擬合參數(shù)訓(xùn)練模塊、特征提取模塊和分?jǐn)?shù)擬合模塊;在測(cè)試時(shí)
候也需要要求測(cè)試者按照朗讀文本進(jìn)行朗讀錄音。至此,實(shí)際的評(píng)估流程為測(cè)試者利用模
型訓(xùn)練模塊按照朗讀文本進(jìn)行錄音,然后利用特征提取模塊提取測(cè)試者按照給定文本進(jìn)行
朗讀語音的各項(xiàng)特征,利用擬合參數(shù)訓(xùn)練模塊訓(xùn)練朗讀特征與人工評(píng)分的擬分模型;利用
分?jǐn)?shù)擬合模塊測(cè)試時(shí)依據(jù)其朗讀特征并且用擬分模型得出機(jī)器評(píng)估分?jǐn)?shù)和相關(guān)的診斷信
息。其中特征提取模型和擬分模型的參數(shù)是通過歷史評(píng)估數(shù)據(jù)訓(xùn)練出來的。
下面對(duì)本發(fā)明方法的具體特征說明如下 —、特征部分; 1、完整性特征,其是用于表征測(cè)試者朗讀內(nèi)容與標(biāo)準(zhǔn)答案的符合度。根據(jù)側(cè)重點(diǎn) 不同,完整性特征又分為詞對(duì)齊特征和段對(duì)齊特征。
其提取方法是將測(cè)試者朗讀語音做自動(dòng)識(shí)別的結(jié)果Sr與標(biāo)準(zhǔn)文本Sd分別做正
向和反向的動(dòng)態(tài)匹配,取兩次匹配的交集(加上不匹配部分的邊界重復(fù)段)為匹配集合&。
對(duì)于屬于匹配集合Sa的每一個(gè)詞Wa,將緊臨Wa的兩個(gè)詞都標(biāo)記為匹配,這時(shí)候得到的匹配
集合是Sm。這樣就有 詞對(duì)齊特征WRM = Sa/Sd。 段對(duì)齊特征SM = Sm/Sd。 2、準(zhǔn)確性特征,其包括發(fā)音和聲調(diào)兩部分。 發(fā)音特征向量Fp的提取方法是取完整性特征中匹配集合Sa,做音素級(jí)別的自動(dòng) 強(qiáng)制對(duì)齊,對(duì)于對(duì)齊后的每個(gè)音素P及其語音信號(hào)O,計(jì)算給定音素P的聲學(xué)模型Mp情況下, 語音信號(hào)0的模型打分P(OlMp)作為發(fā)音打分Ppi。將M種不同的模型打分方法計(jì)算出的 分?jǐn)?shù)合并為一個(gè)發(fā)音打分向量作為發(fā)音特征Pp = [Ppl, Pp2, . . . , PPM],并按照朗讀文本做加
權(quán)。最終發(fā)音特征向量 其中、是音素P的發(fā)音權(quán)重。 <formula>formula see original document page 5</formula> 模型打分方法有如下幾種
a)基于隱馬模型對(duì)數(shù)似然分LL :<formula>formula see original document page 6</formula>
其中音素對(duì)應(yīng)語音0t,長(zhǎng)度為Ni,起始時(shí)間是t。, logP (ot I qi)是0t在qi上的聲
學(xué)模型打分。最終的打分是在整句上做平均,其中句長(zhǎng)M:

J 7W
丄丄=——5]丄丄(《,)
M臺(tái)
b)基于隱馬模型對(duì)數(shù)后驗(yàn)概率分LPP : "尸(仏)去》k)g尸fek)
^': f。
bg騷)二bg-她剛 聲調(diào)特征Ft的提取方法是取完整性特征中匹配集合Sa,做音節(jié)級(jí)別的自動(dòng)強(qiáng)制 對(duì)齊,對(duì)于對(duì)齊后的每個(gè)音節(jié)W及其語音信號(hào)0,計(jì)算給定音節(jié)W的聲調(diào)模型Tw情況下,語 音信號(hào)0的后驗(yàn)概率P(OlTj作為聲調(diào)打分P^并按照朗讀文本做加權(quán)。最終聲調(diào)特征Ft 表示如下
= Z尸人
5>(o, l力)尸(力)
其中對(duì)應(yīng)語音0t,長(zhǎng)度為Ni,起始時(shí)間是t。, logP (ot I qi)是0t在qi上的聲學(xué)模 Q是qi的競(jìng)爭(zhēng)音素集合。 最終的打分是在整句上做平均,其中句長(zhǎng)M :
根據(jù)競(jìng)爭(zhēng)音素不同計(jì)算方法,LLP有多種變形,包括全音素LLP,臨近音素LLP,動(dòng) ROS = n/T
ART = n' /T' 其中n是總音素個(gè)數(shù),T是總時(shí)長(zhǎng);n'是去除重復(fù)音素的總音素個(gè)數(shù),T'是去除音 素間間隔的總時(shí)長(zhǎng)。 2)音節(jié)段長(zhǎng)評(píng)估特征SDS,其特點(diǎn)是利用各音素的段長(zhǎng)模型對(duì)朗讀語音打分,最 后按音素做算術(shù)平局
6<formula>formula see original document page 7</formula> 其中M是總音素個(gè)數(shù),P (t I Pi, o)是給定音素Pi和語音o情況下時(shí)長(zhǎng)為t的概率。 3)停頓特征PD的檢測(cè),其特點(diǎn)是利用靜音檢測(cè)出的停頓點(diǎn),在停頓模型上對(duì)測(cè)試
者的停頓次數(shù)和分布進(jìn)行打分 平均停頓時(shí)長(zhǎng)PDur = np/Tp 平均停頓次數(shù)NDur = np/M 停頓分布向量Pd = [Pn P2, . . . , P10] 其中rip是總停頓次數(shù),Tp是總停頓時(shí)長(zhǎng),M是句子音素個(gè)數(shù),Pi是停頓間隔排序后,第i/10部分的停頓時(shí)長(zhǎng)。 4)編輯特征ED,其特點(diǎn)是利用語言編輯模型檢測(cè)朗讀語音中音素的重復(fù)個(gè)數(shù)N。插入個(gè)數(shù)&和刪除個(gè)數(shù)Nd,然后對(duì)朗讀文本長(zhǎng)度歸一化。五D二 … ,, ^ 其中M是總音素個(gè)數(shù),~ Wi和wd分別是三種現(xiàn)象的權(quán)重。
二、分?jǐn)?shù)擬合 在上述特征基礎(chǔ)上,最終的回歸方法采用線性回歸
Y = P 。x。+ P !x一. + P nxn+ e 其中x。. . xn是擬合輸入的歸一化向量,13 。, . . . 13 n是在大規(guī)模數(shù)據(jù)上訓(xùn)練得到的回歸系數(shù),e是殘差。 本發(fā)明具體的擬合方法有兩種不同的框架,對(duì)于不同的應(yīng)用,采取不同的框架做擬合。下面詳述這兩種框架 1)直接擬合框架(參見圖2):對(duì)于僅需要機(jī)器分?jǐn)?shù)而不需要診斷信息的場(chǎng)合(如考試),為了加快計(jì)算速度,采取直接擬合模塊。這里不需要按照先前的特征劃分方式(完整性、準(zhǔn)確性和流利性特征),而是直接將最基本的特征提取出來,直接用于訓(xùn)練擬分模型。這些特征包括詞對(duì)齊特征、段對(duì)齊特征、發(fā)音特征、聲調(diào)特征、語速特征、段長(zhǎng)特征、停頓特征及編輯特征,它們之間是并列的關(guān)系,拼接起來作為擬分模型的訓(xùn)練輸入。也就是說,訓(xùn)練該擬分模型的時(shí)候,使用上述所有特征作為x。. . Xn,人工評(píng)分為Y,計(jì)算模型參數(shù)
P。,... Pn。測(cè)試的時(shí)候,使用各項(xiàng)特征作為&..&,利用P。,... Pn直接計(jì)算出機(jī)器評(píng)估分。
2)分層擬合框架(參見圖3): 在需要診斷信息的場(chǎng)合,采取分層擬合框架。這里不同于直接擬合框架的地方在于,需要將直接擬合框架的訓(xùn)練輸入特征按照各自不同的分類分別進(jìn)行擬合。也就是說,將上述特征按照完整性(詞對(duì)其特征、段對(duì)齊特征)、準(zhǔn)確性特征(發(fā)音特征、聲調(diào)特征)和流利性特征(語速特征、段長(zhǎng)特征、停頓特征、編輯特征)分類,計(jì)算完整分?jǐn)M合模型、準(zhǔn)確分
擬合模型和流利分?jǐn)M合模型各自的模型參數(shù)Pl。,…,13^, P2,。,…,|32, 和|33,。,…,
Pu,然后再訓(xùn)練從完整性特征、準(zhǔn)確性特征和流利性特征擬合機(jī)器分的參數(shù)P。, !^, e2。
測(cè)試的時(shí)候,同樣先將特征分三類,按照h,。,…,h,n, P2,。,…,h,n和P3,。,…,P3,n計(jì)算完整性特征、準(zhǔn)確性特征和流利性特征,得到完整性打分、準(zhǔn)確性打分和流利性打分,
再利用分層擬合模型進(jìn)行分層擬合,得到機(jī)器分的參數(shù)P。, !^, !32,然后使用P。, !^, e2計(jì)算出機(jī)器分。 對(duì)于訓(xùn)練集合中人工標(biāo)注數(shù)據(jù)分布不均勻的情況,需要采取分段擬合的策略使得
擬合模型能夠得到較好的效果,尤其是在缺乏特別好或特別差數(shù)據(jù)的情況下。這需要按照實(shí)際的分?jǐn)?shù)分布將分?jǐn)?shù)分段,使得各分?jǐn)?shù)段內(nèi)部的人工打分趨于平衡,從而減少數(shù)據(jù)失衡對(duì)擬合的影響。 分段方法如下設(shè)總體分布區(qū)間是[Sd,Sj,最終分?jǐn)?shù)段集合是Q,參數(shù)P用于控制分?jǐn)?shù)段內(nèi)部不均衡的程度 步驟A :設(shè)置Q為空集,S丄=Sd, S2 = S,l,取Va為S丄對(duì)應(yīng)打分個(gè)數(shù);這里S丄和S2
分別做為備選分?jǐn)?shù)區(qū)間的開始和結(jié)束位置。
步驟B :取V2為S2對(duì)應(yīng)打分個(gè)數(shù),如果<formula>formula see original document page 8</formula> 則S2 = S2+l,到步驟C ;否則Q = Q U [S" S2) , S丄=S2+l,到步驟D ; 步驟C:如果S2大于Su,Q二Q U S2],到步驟E ;否則對(duì)[S"S廠1]集合中所有
點(diǎn)對(duì)應(yīng)的打分個(gè)數(shù)取算術(shù)平均,更新Va,返回步驟B ; 步驟D :如果S丄< Su_l,則S2 = S,l,取Va為S丄對(duì)應(yīng)打分個(gè)數(shù),返回步驟B ;否則Q = Q U [Sp SJ,到步驟E ; 步驟E,輸出最終分?jǐn)?shù)段集合是Q,算法完成,退出。 在得到分?jǐn)?shù)段集合后Q,對(duì)于Q中每一個(gè)集合建立一個(gè)擬合模型,同時(shí),各類之間建立分?jǐn)?shù)段分類器。在測(cè)試時(shí)候,對(duì)于不同的數(shù)據(jù),先用分?jǐn)?shù)段分類器判斷該測(cè)試樣本屬于哪一個(gè)分?jǐn)?shù)段,然后再用該分?jǐn)?shù)段的擬合模型擬合出該樣本的機(jī)器分。
三、診斷信息 圖4是本發(fā)明的英語口語診斷界面示例。圖中測(cè)試者(考生)的語音波形顯示在圖下方,圖中的參考語音是用于提示考生正確的讀法。測(cè)試者的各項(xiàng)診斷信息以評(píng)估報(bào)告的形式展示在圖的中部,在此不再贅述。 圖5是本發(fā)明的漢語口語診斷界面示例。圖中測(cè)試者的語音整體波形顯示在左上部。左下部是測(cè)試者的聲調(diào)與標(biāo)準(zhǔn)調(diào)型的對(duì)比信息。測(cè)試者朗讀文本右上部是錯(cuò)誤點(diǎn)定位的報(bào)告說明,測(cè)試者朗讀文本右下部是漢語發(fā)音診斷信息的總體評(píng)價(jià)報(bào)告說明,以評(píng)估報(bào)告形式給出。圖中,整體波形是該考生朗讀的所有語音的波形顯示;而當(dāng)前波形是當(dāng)前在整體波形中高亮的那個(gè)詞的波形顯示;相應(yīng)的,聲調(diào)對(duì)比是該詞的實(shí)際聲調(diào)與標(biāo)準(zhǔn)調(diào)值的比對(duì)。 本發(fā)明在給出測(cè)試者口語評(píng)測(cè)結(jié)果的同時(shí),診斷信息也會(huì)按照不同的特征分類給出 1)完整性診斷對(duì)于沒有朗讀和朗讀不完整的部分,在用戶界面上用特定的顏色標(biāo)識(shí)出來。 2)準(zhǔn)確性診斷漢語的每個(gè)字都會(huì)給出對(duì)應(yīng)的聲調(diào)診斷信息。請(qǐng)參閱圖4,本發(fā)明的漢語聲調(diào)診斷界面示例,左下部顯示出了的測(cè)試者調(diào)值和標(biāo)準(zhǔn)調(diào)值的對(duì)比。
此外,對(duì)于錯(cuò)誤的音素和字,也會(huì)在用戶界面上高亮顯示。其中漢語和英語按照各
自不同的發(fā)音規(guī)范作為診斷標(biāo)準(zhǔn) a)對(duì)于元音,按照其舌位給出診斷 i.舌位的高低; ii.舌位的前后; iii.嘴唇的圓展。 b)對(duì)于輔音,按照其發(fā)音部位和發(fā)音方法給出診斷 i.發(fā)音部位雙唇、唇齒、齒間、舌尖前、舌尖中、舌尖后、舌葉、舌面、舌跟、小舌、喉。
ii.發(fā)音方式塞音、擦音、塞擦音、顫音、閃音、邊音、半元音。
3)流利性診斷按照特征分類顯示。語速診斷包括測(cè)試者的語速信息和與標(biāo)準(zhǔn)語速的對(duì)比;音節(jié)段長(zhǎng)異常的音素、不合理的停頓和重復(fù)插入刪除都在界面上高亮顯示。
以上所述,僅為本發(fā)明中的具體實(shí)施方式
,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉該技術(shù)的人在本發(fā)明所揭露的技術(shù)范圍內(nèi),可理解想到的變換或替換,都應(yīng)涵蓋在本發(fā)明的包含范圍之內(nèi),因此,本發(fā)明的保護(hù)范圍應(yīng)該以權(quán)利要求書的保護(hù)范圍為準(zhǔn)。
權(quán)利要求
一種用于口語測(cè)試的文本朗讀水平自動(dòng)評(píng)估診斷方法,其特征是步驟1測(cè)試者朗讀預(yù)先設(shè)定的文本,提取測(cè)試者按照給定文本朗讀語音的特征,所述朗讀語音特征包括可客觀計(jì)算的完整性特征、準(zhǔn)確性特征和流利性特征;步驟2在歷史評(píng)估數(shù)據(jù)上提取并訓(xùn)練朗讀特征與人工評(píng)分的擬分模型;步驟3測(cè)試時(shí)依據(jù)其朗讀特征和擬分模型擬合出機(jī)器評(píng)分,并給出測(cè)試者朗讀特征的診斷信息。
2. 根據(jù)權(quán)利要求1所述用于口語測(cè)試的文本朗讀水平自動(dòng)評(píng)估診斷方法,其特征是 所述完整性特征提取包括將測(cè)試者朗讀語音做自動(dòng)識(shí)別的結(jié)果與標(biāo)準(zhǔn)文本分別做正向和 反向的動(dòng)態(tài)匹配,取兩次匹配和匹配部分的邊界重復(fù)段的交集為匹配集合,然后根據(jù)各自 不同的匹配度計(jì)算詞對(duì)齊特征和段對(duì)齊特征,用于表征測(cè)試者朗讀內(nèi)容與標(biāo)準(zhǔn)答案的符合度。
3. 根據(jù)權(quán)利要求1所述用于口語測(cè)試的文本朗讀水平自動(dòng)評(píng)估診斷方法,其特征是 所述準(zhǔn)確性特征提取包括發(fā)音特征和漢語的聲調(diào)特征,其中所述發(fā)音特征向量提取是取完整性特征中匹配集合,做音素級(jí)別的自動(dòng)強(qiáng)制對(duì)齊,對(duì) 于對(duì)齊后的每個(gè)音素及其語音信號(hào),計(jì)算給定音素的聲學(xué)模型情況下,語音信號(hào)的模型打 分P(Oll)作為發(fā)音打分;將M種不同的模型打分計(jì)算出的分?jǐn)?shù)合并為Pp = [Ppl,Pp2,PpM], 并按照朗讀文本做加權(quán);最終計(jì)算發(fā)音特征向量FP為<formula>formula see original document page 2</formula>其中kw是音素P的發(fā)音權(quán)重,Sa是完整性特征中匹配集合a, Mp是給定音素的聲學(xué)模 型,O是語音信號(hào);所述聲調(diào)特征提取是取完整性特征中匹配集合,做音節(jié)級(jí)別的自動(dòng)強(qiáng)制對(duì)齊,對(duì)于 對(duì)齊后的每個(gè)音節(jié)其語音信號(hào),計(jì)算給定音節(jié)的聲調(diào)模型情況下,語音信號(hào)的后驗(yàn)概率 P(0|Tw)作為聲調(diào)打分,并按照朗讀文本做加權(quán),最終計(jì)算聲調(diào)的特征Ft為<formula>formula see original document page 2</formula>其中hw是音節(jié)W的聲調(diào)權(quán)重,Tw是聲調(diào)模型,Pw是聲調(diào)打分。
4. 根據(jù)權(quán)利要求1所述用于口語測(cè)試的文本朗讀水平自動(dòng)評(píng)估診斷方法,其特征是 所述流利性特征提取包括測(cè)試者的語速評(píng)估特征、音節(jié)段長(zhǎng)評(píng)估特征、停頓特征和編輯特征以及相應(yīng)的計(jì)算,各特征之間是并列關(guān)系,如下所述語速評(píng)估特征提取包括利用語速提取測(cè)試者單位時(shí)間內(nèi)說出的音素個(gè)數(shù);利用調(diào)音 速率提取測(cè)試者去掉重復(fù)的現(xiàn)象的平均音素時(shí)長(zhǎng);音節(jié)段長(zhǎng)評(píng)估特征提取是利用各音素的段長(zhǎng)模型對(duì)朗讀語音打分,最后將該打分按音 素做算術(shù)平局;停頓特征提取是利用靜音檢測(cè)出的停頓點(diǎn),在停頓模型上對(duì)測(cè)試者的停頓次數(shù)和分布 進(jìn)行打分;編輯特征提取是利用語言編輯模型檢測(cè)朗讀語音中的重復(fù)、插入和刪除現(xiàn)象的個(gè)數(shù), 然后對(duì)朗讀文本長(zhǎng)度歸一化。
5. 根據(jù)權(quán)利要求1所述用于口語測(cè)試的文本朗讀水平自動(dòng)評(píng)估診斷方法,其特征是所述訓(xùn)練朗讀特征與人工評(píng)分的擬分模型是利用訓(xùn)練集合中的人工標(biāo)注數(shù)據(jù),采用回歸 法,將多個(gè)朗讀特征擬合為機(jī)器分;對(duì)于在人工打分方面分布失衡的訓(xùn)練數(shù)據(jù),需要采取分 段擬合的策略,按照分?jǐn)?shù)分布將分?jǐn)?shù)分段,使得各分?jǐn)?shù)段內(nèi)部的人工打分趨于平衡,用于減 少數(shù)據(jù)失衡對(duì)擬合的影響。
6. 根據(jù)權(quán)利要求1所述計(jì)算機(jī)評(píng)估測(cè)試者口語朗讀語言能力的方法,其特征是所述 診斷信息還包括在需要評(píng)分、不需要診斷信息的評(píng)估場(chǎng)合選用直接擬合框架,直接用各項(xiàng)朗讀特征通 過擬合模型得出機(jī)器分;在需要評(píng)分、又要診斷信息場(chǎng)合,選用分層擬合框架,先擬合基本特征分?jǐn)?shù)和完整分、 準(zhǔn)確分和流利分和相應(yīng)的診斷信息,然后在此基礎(chǔ)上再擬合出機(jī)器分。
7. 根據(jù)權(quán)利要求1所述用于口語測(cè)試的文本朗讀水平自動(dòng)評(píng)估診斷方法,其特征是 所述診斷信息是按照各自不同的分類,給出詳細(xì)的測(cè)試者診斷信息為完整性診斷是將計(jì)算詞對(duì)齊特征和段對(duì)齊特征過程中沒有匹配上的字或詞在用戶界 面上用顏色標(biāo)識(shí)出完整性診斷;準(zhǔn)確性診斷是對(duì)漢語或英語的每個(gè)音素給出其發(fā)音準(zhǔn)確性診斷信息包括錯(cuò)誤發(fā)音 和發(fā)音方式診斷,具體方式是將所有后驗(yàn)概率低于預(yù)定門限的發(fā)音標(biāo)記為錯(cuò)誤發(fā)音,并且 按照其發(fā)音方式分類結(jié)果,給出對(duì)應(yīng)的診斷信息;其中對(duì)于元音,按照其舌位給出診斷信 息;對(duì)于輔音,按照其發(fā)音部位和發(fā)音方法給出診斷信息;對(duì)漢語的聲調(diào)診斷信息凡識(shí)別 出的聲調(diào)與漢字的候選發(fā)音不同,則標(biāo)記為錯(cuò)誤聲調(diào),同時(shí)按照識(shí)別出的聲調(diào)給出診斷信 息;流利性診斷是按照特征分類顯示,為語速診斷包括測(cè)試者的語速信息和與標(biāo)準(zhǔn)語速 的對(duì)比、音節(jié)段長(zhǎng)異常的音素、不合理的停頓和重復(fù)插入刪除都在界面上高亮顯示。
全文摘要
本發(fā)明涉及一種用于口語測(cè)試的文本朗讀水平自動(dòng)評(píng)估診斷方法,該方法提取測(cè)試者按照給定文本進(jìn)行朗讀語音的各項(xiàng)特征;訓(xùn)練朗讀特征與人工評(píng)分的擬分模型;測(cè)試時(shí)依據(jù)其朗讀特征和擬分模型擬合出機(jī)器評(píng)分,并給出相關(guān)的診斷信息。它要求測(cè)試者朗讀預(yù)先設(shè)定的文本,然后利用收集到的語音對(duì)測(cè)試者的口語能力做出自動(dòng)評(píng)估。其特點(diǎn)是利用計(jì)算機(jī)提取測(cè)試者朗讀語音的各項(xiàng)特征,在擬分模型上擬和得出機(jī)器評(píng)分,從而達(dá)到評(píng)估測(cè)試者口語語言能力的目的。
文檔編號(hào)G09B7/00GK101739868SQ20081022667
公開日2010年6月16日 申請(qǐng)日期2008年11月19日 優(yōu)先權(quán)日2008年11月19日
發(fā)明者徐波, 徐爽, 柯登峰, 江杰, 浦劍濤, 陳振標(biāo) 申請(qǐng)人:中國(guó)科學(xué)院自動(dòng)化研究所
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
新郑市| 当雄县| 天等县| 高雄市| 台北市| 白银市| 辰溪县| 报价| 浏阳市| 平塘县| 河东区| 集安市| 原平市| 专栏| 全椒县| 苏尼特左旗| 吉安县| 嘉善县| 麻阳| 邓州市| 江源县| 浙江省| 汉寿县| 陕西省| 乌拉特中旗| 永胜县| 吕梁市| 平舆县| 大冶市| 永春县| 保山市| 巫山县| 竹山县| 桦南县| 昌黎县| 铜梁县| 区。| 临江市| 峨边| 武安市| 喀喇|