欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

修正語(yǔ)音輸入文本中命名實(shí)體詞匯的方法、裝置及終端的制作方法

文檔序號(hào):6356249閱讀:342來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):修正語(yǔ)音輸入文本中命名實(shí)體詞匯的方法、裝置及終端的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及語(yǔ)音識(shí)別技術(shù),特別涉及修正語(yǔ)音輸入文本中命名實(shí)體詞匯的方法、裝置及終端。
背景技術(shù)
隨著半導(dǎo)體工業(yè)、材料工業(yè)、電子技術(shù)的高速發(fā)展,終端設(shè)備上所具有的功能日益復(fù)雜,智能型的文本輸入功能和設(shè)備控制方式成為了現(xiàn)有終端設(shè)備的必要需求。在各種智能型的文本輸入技術(shù)中,語(yǔ)音輸入以其直觀(guān)、快捷的特點(diǎn),成為主流技術(shù)之一。修正語(yǔ)音輸入文本中錯(cuò)誤識(shí)別的詞匯是語(yǔ)音輸入法的后處理技術(shù),首先對(duì)用戶(hù)輸入的語(yǔ)音進(jìn)行識(shí)別,然后對(duì)識(shí)別結(jié)果進(jìn)行檢測(cè)、定位可能識(shí)別錯(cuò)誤的詞匯,最后提供修正模式、讓用戶(hù)通過(guò)修正模式對(duì)可能識(shí)別錯(cuò)誤的詞匯進(jìn)行修正。 在現(xiàn)有技術(shù)中,在定位錯(cuò)誤詞匯方面,主要通過(guò)置信測(cè)度方法衡量輸入語(yǔ)音和識(shí)別結(jié)果之間的可信程度,找到置信度較低的詞匯作為可能識(shí)別錯(cuò)誤的詞匯。在修正錯(cuò)誤詞匯方面,向用戶(hù)提供用多模態(tài)方式進(jìn)行重新輸入的修正模式,例如從本地通信記錄中選擇正確詞匯、或者從基于模糊音提供的候選詞中重新選擇正確詞匯,或者通過(guò)重發(fā)音來(lái)重新輸入語(yǔ)音、或通過(guò)手寫(xiě)體識(shí)別錄入正確詞匯、或通過(guò)直接鍵盤(pán)錄入正確詞匯等,使用用戶(hù)重新輸入的詞匯進(jìn)行修正。現(xiàn)有技術(shù)中的上述方法主要存在以下缺陷第一、對(duì)語(yǔ)音輸入的每個(gè)詞匯采用無(wú)差別的置信度分析方法,而實(shí)際上目前針對(duì)特定領(lǐng)域內(nèi)容的連續(xù)語(yǔ)音識(shí)別的正確率已經(jīng)能夠達(dá)到90%,容易識(shí)別錯(cuò)誤的詞匯主要是集外詞匯。在短信、郵件、搜索詞條的智能語(yǔ)音輸入中,名詞往往是表達(dá)該段文字中心內(nèi)容的載體,在所有的名詞中,主要包括人名、地名和機(jī)構(gòu)名等的命名實(shí)體詞匯又占據(jù)了很大的比重,由于命名實(shí)體詞匯屬于成長(zhǎng)型詞匯,總是在不斷的更新和增加,因此很多命名實(shí)體詞匯對(duì)于語(yǔ)音識(shí)別來(lái)說(shuō)都屬于集外詞匯,容易造成錯(cuò)誤識(shí)別,現(xiàn)有技術(shù)中的方法并沒(méi)有針對(duì)性的定位這種承載了語(yǔ)義主體內(nèi)容、又容易被錯(cuò)誤識(shí)別的命名實(shí)體詞匯;第二、現(xiàn)有技術(shù)的方法在修正錯(cuò)誤詞匯時(shí),只關(guān)注于用多模態(tài)的方式進(jìn)行重新輸入,沒(méi)有考慮更多、更便捷的修正途徑。

發(fā)明內(nèi)容
本發(fā)明提供一種修正語(yǔ)音輸入文本中命名實(shí)體詞匯的方法,精確定位識(shí)別錯(cuò)誤的命名實(shí)體詞匯,并提供更豐富、便捷的修正途徑。本發(fā)明提供一種修正語(yǔ)音輸入文本中命名實(shí)體詞匯的裝置,精確定位識(shí)別錯(cuò)誤的命名實(shí)體詞匯,并提供更豐富、便捷的修正途徑。本發(fā)明提供一種終端,精確定位識(shí)別錯(cuò)誤的命名實(shí)體詞匯,并提供更豐富、便捷的修正途徑。本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的
—種修正語(yǔ)音輸入文本中命名實(shí)體詞匯的方法,關(guān)鍵在于,該方法包括A、識(shí)別語(yǔ)音輸入信號(hào),得到包括命名實(shí)體詞匯標(biāo)注信息的識(shí)別結(jié)果;B、根據(jù)所述命名實(shí)體詞匯標(biāo)注信息,確定所述識(shí)別結(jié)果中識(shí)別錯(cuò)誤的命名實(shí)體詞匯,突出顯示所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯;C、使用從預(yù)設(shè)的本地命名實(shí)體庫(kù)和/或網(wǎng)絡(luò)資源中選擇的詞匯、或用戶(hù)重新輸入的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯。一種修正語(yǔ)音輸入文本中命名實(shí)體詞匯的裝置,關(guān)鍵在于,該裝置包括連續(xù)語(yǔ)音識(shí)別模塊、命名實(shí)體詞匯檢測(cè)模塊和用戶(hù)更正模塊;所述連續(xù)語(yǔ)音識(shí)別模塊,用于識(shí)別語(yǔ)音輸入信號(hào),將包括命名實(shí)體詞匯標(biāo)注信息的識(shí)別結(jié)果輸出給所述命名實(shí)體詞匯檢測(cè)模塊;
所述命名實(shí)體詞匯檢測(cè)模塊,用于根據(jù)所述命名實(shí)體詞匯標(biāo)注信息,確定所述識(shí)別結(jié)果中錯(cuò)誤識(shí)別的命名實(shí)體詞匯,在識(shí)別結(jié)果中突出標(biāo)注出錯(cuò)誤識(shí)別的命名實(shí)體詞匯,并將標(biāo)注后的識(shí)別結(jié)果輸出給所述用戶(hù)更正模塊及顯示部件;所述用戶(hù)更正模塊,用于使用從預(yù)設(shè)的本地命名實(shí)體庫(kù)和/或網(wǎng)絡(luò)資源中選擇的詞匯、或用戶(hù)重新輸入的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯。一種終端,關(guān)鍵在于,該終端包括修正語(yǔ)音輸入文本中命名實(shí)體詞匯的裝置和顯示部件;所述修正語(yǔ)音輸入文本中命名實(shí)體詞匯的裝置,用于識(shí)別語(yǔ)音輸入信號(hào),得出包括命名實(shí)體詞匯標(biāo)注信息的識(shí)別結(jié)果;根據(jù)所述命名實(shí)體詞匯標(biāo)注信息,確定所述識(shí)別結(jié)果中錯(cuò)誤識(shí)別的命名實(shí)體詞匯,在識(shí)別結(jié)果中突出標(biāo)注出錯(cuò)誤識(shí)別的命名實(shí)體詞匯,并將標(biāo)注后的識(shí)別結(jié)果輸出給所述顯示部件;使用從預(yù)設(shè)的本地命名實(shí)體庫(kù)和/或網(wǎng)絡(luò)資源中選擇的詞匯、或用戶(hù)重新輸入的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯;所述顯示部件,用于顯示所述標(biāo)注后的識(shí)別結(jié)果??梢钥闯?,本發(fā)明中修正語(yǔ)音輸入文本中命名實(shí)體詞匯的方法、裝置及終端,一方面由于在識(shí)別結(jié)果中增加了命名實(shí)體詞匯標(biāo)注信息,使得后續(xù)可以有針對(duì)性的定位出識(shí)別錯(cuò)誤的命名實(shí)體詞匯,而不是對(duì)用戶(hù)輸入的每個(gè)詞匯是否識(shí)別錯(cuò)誤都進(jìn)行判斷,另一方面增加了使用從本地命名實(shí)體庫(kù)和/或網(wǎng)絡(luò)資源中選擇的詞匯、執(zhí)行修正的修正模式,與現(xiàn)有技術(shù)中僅通過(guò)多模態(tài)的文字輸入進(jìn)行修正相比,修正途徑更加豐富和便捷。


圖I為本發(fā)明中修正語(yǔ)音輸入文本中命名實(shí)體詞匯的方法的流程圖;圖2為本發(fā)明實(shí)施例中修正語(yǔ)音輸入文本中命名實(shí)體詞匯的方法的流程圖;圖3為圖2中所示步驟21的實(shí)現(xiàn)流程圖;圖4為圖2中所示步驟22的實(shí)現(xiàn)流程圖;圖5為本發(fā)明實(shí)施例中查找問(wèn)題區(qū)域的過(guò)程示意圖;圖6為本發(fā)明實(shí)施例中用戶(hù)界面的示意圖;圖7為本發(fā)明中修正語(yǔ)音輸入文本中命名實(shí)體詞匯的裝置結(jié)構(gòu)示意圖;圖8為本發(fā)明實(shí)施例中連續(xù)語(yǔ)音識(shí)別模塊的結(jié)構(gòu)示意圖;圖9為本發(fā)明實(shí)施例中命名實(shí)體檢測(cè)模塊的結(jié)構(gòu)示意圖10為本發(fā)明實(shí)施例中用戶(hù)更正模塊的結(jié)構(gòu)示意圖;圖11為本發(fā)明中終端的結(jié)構(gòu)示意圖。
具體實(shí)施例方式為使本發(fā)明的目的和優(yōu)點(diǎn)更加清楚,下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)ー步的詳細(xì)說(shuō)明。圖I為本發(fā)明中修正語(yǔ)音輸入文本中命名實(shí)體詞匯的方法流程圖,在圖I所示的流程開(kāi)始之前,建立本地命名實(shí)體庫(kù)。圖I所示流程包括步驟11 :識(shí)別語(yǔ)音輸入信號(hào),得到包括命名實(shí)體詞匯標(biāo)注信息的識(shí)別結(jié)果。
步驟12 :根據(jù)命名實(shí)體詞匯標(biāo)注信息,確定識(shí)別結(jié)果中識(shí)別錯(cuò)誤的命名實(shí)體詞匯,突出顯示識(shí)別錯(cuò)誤的命名實(shí)體詞匯。步驟13 :使用從本地命名實(shí)體庫(kù)和/或網(wǎng)絡(luò)資源中選擇的詞匯、或用戶(hù)重新輸入的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯。可見(jiàn),本發(fā)明中修正語(yǔ)音輸入文本中命名實(shí)體詞匯的方法,一方面由于在識(shí)別結(jié)果中增加了命名實(shí)體詞匯標(biāo)注信息,使得后續(xù)步驟中可以有針對(duì)性的定位出識(shí)別錯(cuò)誤的命名實(shí)體詞匯,而不是對(duì)用戶(hù)輸入的每個(gè)詞匯是否識(shí)別錯(cuò)誤都進(jìn)行判斷,另ー方面増加了使用從本地命名實(shí)體庫(kù)和/或網(wǎng)絡(luò)資源中選擇的詞匯、執(zhí)行修正的修正模式,與現(xiàn)有技術(shù)中僅通過(guò)多模態(tài)的文字輸入進(jìn)行修正相比,修正途徑更加豐富和便捷。下面給出本發(fā)明方法的一個(gè)實(shí)施例,在本實(shí)施例中,本地命名實(shí)體庫(kù)的初始狀態(tài)為空。圖2為本發(fā)明實(shí)施例中修正語(yǔ)音輸入文本中命名實(shí)體詞匯的方法的流程圖,該流程包括步驟21 :識(shí)別語(yǔ)音輸入信號(hào),得到包括命名實(shí)體詞匯位置和類(lèi)別信息的識(shí)別結(jié)果O本步驟中的命名實(shí)體詞匯位置和類(lèi)別信息,是命名實(shí)體詞匯標(biāo)注信息的一種實(shí)施方式,其中位置信息指該命名實(shí)體詞匯在句子中所處的位置,例如在主語(yǔ)位置、賓語(yǔ)位置,或者句子的前段位置、中段位置等,類(lèi)別信息指該命名實(shí)體詞匯所屬的類(lèi)別,例如該命名實(shí)體詞匯屬于人名類(lèi)別、地名類(lèi)別或機(jī)構(gòu)名類(lèi)別等。這里的步驟21由圖3所示的流程實(shí)現(xiàn),圖3所示流程包括步驟211 :提取語(yǔ)音輸入信號(hào)的多維度倒譜特征及其差分特征。本步驟中的多維度倒譜特征及其差分特征用來(lái)表征語(yǔ)音信號(hào)中和語(yǔ)言相關(guān)的信息,使用現(xiàn)有的常用方法即可實(shí)現(xiàn)這里的提取操作,例如通過(guò)端點(diǎn)檢測(cè)算法,將連續(xù)語(yǔ)音流中的語(yǔ)音段切分出來(lái),將語(yǔ)音段分為20 30毫秒的幀。分幀加窗以后的幀數(shù)據(jù),通過(guò)離散傅里葉變換轉(zhuǎn)換到頻譜上,再將頻譜信號(hào)進(jìn)行一系列帶通濾波、并將每次濾波后的結(jié)果進(jìn)行非線(xiàn)性壓縮,最后對(duì)得到的一組數(shù)據(jù)作離散余弦變換,以降低每維特征之間的相關(guān)性,并保留特征數(shù)據(jù)中表征性較強(qiáng)的部分維度。為了提高語(yǔ)音識(shí)別的精度和抗噪性能,Mel倒譜系數(shù)、感知線(xiàn)性預(yù)測(cè)系數(shù)、Gamma-tone倒譜系數(shù)等多種類(lèi)型的倒譜特征均可被采用。步驟212 :基于命名實(shí)體標(biāo)注詞典、聲學(xué)模型和基于類(lèi)的語(yǔ)言模型,對(duì)提取出的特征解碼得出包括詞格和音素格的識(shí)別結(jié)果,在詞格中標(biāo)注命名實(shí)體詞匯的位置和類(lèi)別信
肩、O本步驟中的詞格和音素格由識(shí)別柵格組成。 本步驟中,命名實(shí)體標(biāo)注詞典是包含了命名實(shí)體標(biāo)注信息的中文詞典,可以在離線(xiàn)狀態(tài)下生成?,F(xiàn)有技術(shù)中的詞典生成算法很多,一個(gè)詞典可能具備多種生成來(lái)源,例如根據(jù)漢語(yǔ)語(yǔ)言學(xué)規(guī)則得到的通用詞典,或?qū)Υ罅肯嚓P(guān)文本進(jìn)行分詞后統(tǒng)計(jì)得到的詞典,或根據(jù)距離測(cè)度生成的新詞典等。在合并了多種生成來(lái)源的詞條后,可以采用手工校對(duì)或者統(tǒng)計(jì)型測(cè)度等方法,選取其中有效的詞條,得到命名實(shí)體標(biāo)注詞典。命名實(shí)體標(biāo)注詞典不僅是本步驟中解碼操作的基礎(chǔ)之一,還是聲學(xué)模型訓(xùn)練及基于類(lèi)的語(yǔ)言模型訓(xùn)練的基礎(chǔ)。聲學(xué)模型可以在離線(xiàn)狀態(tài)下生成?,F(xiàn)有技術(shù)中常用的生成方法是,通過(guò)對(duì)大量語(yǔ)音數(shù)據(jù)的有監(jiān)瞀和無(wú)監(jiān)瞀學(xué)習(xí)的算法,生成針對(duì)具體應(yīng)用的隱含馬爾科夫模型。
基于類(lèi)的語(yǔ)言模型可以在離線(xiàn)狀態(tài)下生成。在語(yǔ)言模型訓(xùn)練中,將同類(lèi)別的命名實(shí)體詞匯作為相同詞匯考慮,例如將屬于人名類(lèi)別的命名實(shí)體詞匯作為相同詞匯考慮。采用基于類(lèi)的語(yǔ)言模型的優(yōu)點(diǎn)有以下兩點(diǎn)第一,由于很多命名實(shí)體詞語(yǔ)在文本中的出現(xiàn)頻率比較低,普通語(yǔ)言模型在此情況下會(huì)由于數(shù)據(jù)稀疏而產(chǎn)生估計(jì)誤差,基于類(lèi)的語(yǔ)言模型在一定程度上可以避免這ー問(wèn)題的出現(xiàn),進(jìn)而提高語(yǔ)音識(shí)別率和識(shí)別的穩(wěn)健性;第二,由于命名實(shí)體詞匯屬于快速成長(zhǎng)型詞匯,新詞不斷的出現(xiàn),采用基于類(lèi)的語(yǔ)言模型,能夠減少集外詞造成的識(shí)別錯(cuò)誤,進(jìn)而提高語(yǔ)音識(shí)別性能。至于本步驟中如何基于命名實(shí)體標(biāo)注詞典、聲學(xué)模型和基于類(lèi)的語(yǔ)言模型,得出包括詞格和音素格的識(shí)別結(jié)果,現(xiàn)有技術(shù)中有多種實(shí)現(xiàn)方法,這里不再贅述。本步驟中將根據(jù)命名實(shí)體標(biāo)注詞典和基于類(lèi)的語(yǔ)言模型在詞格中標(biāo)注命名實(shí)體詞匯的位置和類(lèi)別信息。經(jīng)過(guò)上述步驟211 步驟212就完成了對(duì)語(yǔ)音輸入信號(hào)的識(shí)別,得出了識(shí)別結(jié)果。步驟22 :根據(jù)所述命名實(shí)體詞匯的位置和屬性信息及置信測(cè)度方法,確定所述識(shí)別結(jié)果中識(shí)別錯(cuò)誤的命名實(shí)體詞匯,高亮顯示所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯。這里的步驟22可以由圖4所示流程實(shí)現(xiàn),圖4所示流程包括步驟221 :根據(jù)詞格和音素格及其起始和終止時(shí)間信息,對(duì)詞格和音素格進(jìn)行強(qiáng)制對(duì)齊,查找識(shí)別柵格未對(duì)齊且包括命名實(shí)體詞匯的問(wèn)題區(qū)域。圖5為本步驟中查找問(wèn)題區(qū)域的過(guò)程示意圖,其中詞格中的每個(gè)圓圈對(duì)應(yīng)ー個(gè)詞匯,而音素格中的多個(gè)圓圈對(duì)應(yīng)ー個(gè)詞匯的發(fā)音。圖5中的標(biāo)號(hào)①代表根據(jù)詞格和音素格及其起始和終止時(shí)間信息,對(duì)詞格和音素格進(jìn)行強(qiáng)制對(duì)齊,標(biāo)號(hào)②代表查找問(wèn)題區(qū)域,其中標(biāo)號(hào)為a和b的兩處為查找出的問(wèn)題區(qū)域。這里的強(qiáng)制對(duì)齊是一種現(xiàn)有技術(shù)中的算法,具體實(shí)現(xiàn)方式這里不再贅述。步驟222 :根據(jù)置信測(cè)度方法,確定置信度低于設(shè)定閾值的問(wèn)題區(qū)域。本步驟中采用了廣義詞語(yǔ)后驗(yàn)概率方法,這也是現(xiàn)有技術(shù)中ー種應(yīng)用較廣泛的置信測(cè)度方法。當(dāng)然本步驟也可以應(yīng)用其他的置信測(cè)度方法。步驟223 :聞売顯不確定出的問(wèn)題區(qū)域中的命名實(shí)體詞匯。本步驟中,也可以采用其他突出顯示的方式,例如用顔色著重標(biāo)注等。經(jīng)過(guò)上述步驟221 步驟223,確定出了識(shí)別錯(cuò)誤的命名實(shí)體詞匯。
步驟23 :從本地命名實(shí)體庫(kù)和/或網(wǎng)絡(luò)資源中查找識(shí)別錯(cuò)誤的命名實(shí)體詞匯的候選詞匯,形成候選詞匯列表并顯示。本步驟中查找候選詞匯有以下兩種實(shí)施方式第一、在本地命名實(shí)體庫(kù)中查找候選詞匯時(shí),在本地命名實(shí)體庫(kù)中查找與識(shí)別錯(cuò)誤的命名實(shí)體詞匯相同類(lèi)別且發(fā)音相似的候選詞匯;在網(wǎng)絡(luò)資源中查找候選詞匯時(shí),在網(wǎng)絡(luò)中的公用數(shù)據(jù)庫(kù)查找與識(shí)別錯(cuò)誤的命名實(shí)體詞匯發(fā)音相似的候選詞匯;或者,在網(wǎng)絡(luò)資源中搜索識(shí)別錯(cuò)誤的命名實(shí)體詞匯、及在本地命名實(shí)體庫(kù)中查找出的詞匯的發(fā)音,通過(guò)搜索返回率確定候選詞匯。第二、在本次資源中查找候選詞匯時(shí),和上述第一種中的實(shí)現(xiàn)方式相同;在網(wǎng)絡(luò)資源中查找候選詞匯時(shí),與上述第一種中采取完全在線(xiàn)查找的方式不同的是,采用一種半在線(xiàn)或離線(xiàn)的搜索模式,在此情況下,在網(wǎng)絡(luò)中的由服務(wù)提供商提供一臺(tái)服務(wù)器或服務(wù)器群組中查找與識(shí)別錯(cuò)誤的命名實(shí)體詞匯發(fā)音相似的候選詞匯,該服務(wù)器或服務(wù)器群組會(huì)利用網(wǎng)絡(luò)資源定時(shí)對(duì)自身內(nèi)部的命名實(shí)體詞匯進(jìn)行更新,這種半在線(xiàn)或離線(xiàn)的搜索模式的優(yōu)點(diǎn) 在于,服務(wù)器端已經(jīng)在離線(xiàn)狀態(tài)下將大量的網(wǎng)絡(luò)資源進(jìn)行了歸納和整理,并且定時(shí)更新,所以在服務(wù)器端查找候選詞匯,將比直接在大量網(wǎng)絡(luò)資源中查找速度更快、更有針對(duì)性且用戶(hù)支出的費(fèi)用更少,對(duì)服務(wù)器端而言,根據(jù)在服務(wù)器或服務(wù)器群組中查找候選詞匯的情況,可以獲知哪些詞匯的搜索頻率較多等反饋信息,從而將這些詞匯優(yōu)先作為候選詞匯。步驟24 :使用用戶(hù)直接從候選詞匯列表中選擇的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯;或者,從本地命名實(shí)體庫(kù)和/或網(wǎng)絡(luò)資源中查找識(shí)別錯(cuò)誤的命名實(shí)體詞匯的候選詞匯并顯示,使用用戶(hù)從查找出的候選詞匯中選擇的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯;或者,使用用戶(hù)重新輸入的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯。本步驟中,用戶(hù)選擇不同的修正模式時(shí),執(zhí)行對(duì)應(yīng)的修正方法。用戶(hù)重新輸入詞匯的方式可以是從本地通信記錄中選擇、鍵盤(pán)輸入、通過(guò)語(yǔ)音重新輸入,其中采用從本地通信記錄中選擇和鍵盤(pán)輸入時(shí),與現(xiàn)有技術(shù)中的實(shí)現(xiàn)方式相同。采用語(yǔ)音重新輸入時(shí),需重新識(shí)別輸入的語(yǔ)音輸入信號(hào),并顯示重新識(shí)別的識(shí)別結(jié)果,在用戶(hù)確認(rèn)后,將重新識(shí)別的識(shí)別結(jié)果作為確認(rèn)的正確詞匯,在用戶(hù)重新輸入語(yǔ)音時(shí),再執(zhí)行重新識(shí)別輸入的語(yǔ)音輸入信號(hào)的步驟。進(jìn)一歩,由于終端的顯示界面有限,步驟23中形成的候選詞匯列表中只能列出一部分查找到的候選詞匯,如果用戶(hù)未從候選詞匯列表中找到要確認(rèn)的正確詞匯,也不想通過(guò)上述提供的其他修正模式進(jìn)行修正,還可以向用戶(hù)顯示步驟23中查找到的、且未包含在候選詞匯列表中的更多候選詞匯,使用用戶(hù)從所述更多候選詞匯中選擇出的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯。步驟25 :將執(zhí)行修正后確認(rèn)的正確詞匯更新到本地命名實(shí)體庫(kù)中。本步驟中的更新可以包括將用戶(hù)確認(rèn)的正確詞匯及其類(lèi)別、在句子中的位置、出現(xiàn)的頻次和毎次更新的時(shí)間?;诒静襟E中的本地命名實(shí)體庫(kù)的更新方式,下次再執(zhí)行步驟23、在本地命名實(shí)體庫(kù)中查找候選詞匯時(shí),可以考慮上述類(lèi)別、在句子中的位置、出現(xiàn)的頻次和毎次更新的時(shí)間。例如,如果當(dāng)前識(shí)別錯(cuò)誤的命名實(shí)體詞匯為人名,則直接查找本地命名實(shí)體庫(kù)中類(lèi)別為人名的候選詞匯,如果當(dāng)前識(shí)別錯(cuò)誤的命名實(shí)體詞匯在句子中的位置是主語(yǔ),則直接查找本地命名實(shí)體庫(kù)中在句子中位置為主語(yǔ)的候選詞匯。又例如,在查找出多個(gè)針對(duì)當(dāng)前識(shí)別錯(cuò)誤的命名實(shí)體詞匯的候選詞語(yǔ)時(shí),將出現(xiàn)的頻次高的候選詞匯排列在前,或?qū)⒚看胃聲r(shí)間較快的候選詞匯排列在前。類(lèi)似的,在執(zhí)行步驟23中的在網(wǎng)絡(luò)資源中查找候選詞匯時(shí),可以依據(jù)某個(gè)詞匯的檢索頻次來(lái)確定該詞的排序,檢索頻次高的詞匯排列在前。本發(fā)明實(shí)施例中的本地命名實(shí)體庫(kù)是根據(jù)毎次用戶(hù)確認(rèn)的正確詞匯進(jìn)行更新的,由于這些更新是被用戶(hù)經(jīng)常使用的,所以從本地命名實(shí)體庫(kù)中更容易找到與識(shí)別錯(cuò)誤的命名實(shí)體詞匯較接近的候選詞匯。圖6為本發(fā)明實(shí)施例中用戶(hù)界面的示意圖,假設(shè)用戶(hù)的語(yǔ)音輸入為“請(qǐng)通知張老師,明天到華潤(rùn)大廈開(kāi)會(huì)”,其中“張老師”和“華潤(rùn)”為識(shí)別錯(cuò)誤的命名實(shí)體詞匯、且被高亮顯示。針對(duì)識(shí)別錯(cuò)誤的“張老師”ー詞,提供的屬于“人名選擇”類(lèi)別的候選詞匯列表為“張老師、趙老師、左老師”,針對(duì)識(shí)別錯(cuò)誤的“華潤(rùn)”ー詞,提供的屬于“地名選擇”類(lèi)別的候選詞匯列表為“鵬潤(rùn)、鵬輝、華潤(rùn)”。用戶(hù)除了可以直接從候選詞匯列表中直接選擇詞匯外,還可以選擇“選項(xiàng)”中提供的其他修正模式,例如更多候選詞、查找通訊錄、查找網(wǎng)絡(luò)、查找本地命名實(shí)體庫(kù)、鍵盤(pán)輸入或重讀該詞。當(dāng)用戶(hù)點(diǎn)擊“查找網(wǎng)絡(luò)”或“查找本地命名實(shí)體庫(kù)”時(shí),將執(zhí)行步驟24中的顯示查找出的候選詞匯,使用用戶(hù)從查找出的候選詞匯中選擇的詞匯, 修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯。圖7為本發(fā)明中修正語(yǔ)音輸入文本中命名實(shí)體詞匯的裝置結(jié)構(gòu)示意圖,該裝置包括連續(xù)語(yǔ)音識(shí)別模塊100、命名實(shí)體詞匯檢測(cè)模塊200和用戶(hù)更正模塊300。連續(xù)語(yǔ)音識(shí)別模塊100,用于識(shí)別語(yǔ)音輸入信號(hào),將包括命名實(shí)體詞匯標(biāo)注信息的識(shí)別結(jié)果輸出給命名實(shí)體詞匯檢測(cè)模塊200。命名實(shí)體詞匯檢測(cè)模塊200,用于根據(jù)命名實(shí)體詞匯標(biāo)注信息,確定識(shí)別結(jié)果中識(shí)別錯(cuò)誤的命名實(shí)體詞匯,在識(shí)別結(jié)果中突出標(biāo)注錯(cuò)誤識(shí)別的命名實(shí)體詞匯,將標(biāo)注后的識(shí)別結(jié)果輸出給用戶(hù)更正模塊及顯示部件。用戶(hù)更正模塊300,用于使用從預(yù)設(shè)的本地命名實(shí)體庫(kù)和/或網(wǎng)絡(luò)資源中選擇的詞匯、或用戶(hù)重新輸入的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯??梢?jiàn),本發(fā)明中修正語(yǔ)音輸入文本中命名實(shí)體詞匯的裝置,一方面由于在識(shí)別結(jié)果中包含了命名實(shí)體詞匯標(biāo)注信息,使得后續(xù)可以有針對(duì)性的定位出錯(cuò)誤識(shí)別的命名實(shí)體詞匯,而不是對(duì)用戶(hù)輸入的每個(gè)詞匯是否識(shí)別錯(cuò)誤都進(jìn)行判斷,另ー方面増加了使用從本地命名實(shí)體庫(kù)和網(wǎng)絡(luò)資源中選擇的詞匯、執(zhí)行修正的修正模式,與現(xiàn)有技術(shù)中僅通過(guò)多模態(tài)的文字輸入進(jìn)行修正相比,修正途徑更加豐富和便捷。下面給出本發(fā)明修正語(yǔ)音輸入文本中命名實(shí)體詞匯的裝置的實(shí)施例。圖8為本發(fā)明實(shí)施例中連續(xù)語(yǔ)音識(shí)別模塊的結(jié)構(gòu)示意圖,連續(xù)語(yǔ)音識(shí)別模塊100包括特征提取子模塊101、解碼器102、命名實(shí)體標(biāo)注詞典103、聲學(xué)模型104和基于類(lèi)的語(yǔ)目模型105。特征提取子模塊101,用于從語(yǔ)音輸入信號(hào)中提取多維度的倒譜特征及其差分特征,輸出到解碼器102中。命名實(shí)體標(biāo)注詞典103是解碼器102的ー項(xiàng)輸入,是包含了命名實(shí)體標(biāo)注信息的中文詞典,可以在離線(xiàn)狀態(tài)下生成。具體的生成方法在本發(fā)明方法中已介紹,生成命名實(shí)體標(biāo)注詞典103的可以是如圖9中所示的詞典生成子模塊。聲學(xué)模型104是解碼器102的另ー項(xiàng)輸入,可以在離線(xiàn)狀態(tài)下生成。具體的形成方法在本發(fā)明方法中已介紹。形成聲學(xué)模型104的可以是如圖9中所示的聲學(xué)模型訓(xùn)練子模塊?;陬?lèi)的語(yǔ)言模型105是解碼器102的第三項(xiàng)輸入,可以在離線(xiàn)狀態(tài)下生成。具體的形成方法在本發(fā)明方法中已介紹。形成基于類(lèi)的語(yǔ)言模型105的可以是如圖8中所示的語(yǔ)言模型訓(xùn)練子模塊。解碼器102,基于命名實(shí)體標(biāo)注詞典103、聲學(xué)模型104和基于類(lèi)的語(yǔ)言模型105,得到音素格和詞格兩級(jí)識(shí)別結(jié)果,在詞格中標(biāo)注命名實(shí)體詞匯標(biāo)注信息,將得到的音素格和詞格輸出給命名實(shí)體檢測(cè)模塊200。這里的命名實(shí)體詞匯標(biāo)注信息為命名實(shí)體詞匯位置和類(lèi)別信息。圖9為本發(fā)明實(shí)施例中命名實(shí)體檢測(cè)模塊的結(jié)構(gòu)示意圖,命名實(shí)體檢測(cè)模塊200包括置信度校驗(yàn)子模塊201和新詞生成子模塊202。置信度校驗(yàn)子模塊201,用于根據(jù)解碼器102輸出的詞格和音素格及其起始和終 止時(shí)間信息,對(duì)詞格和音素格進(jìn)行強(qiáng)制對(duì)齊,確定識(shí)別柵格未對(duì)齊、包含命名實(shí)體詞匯標(biāo)注信息、且置信測(cè)度低于設(shè)定閾值的問(wèn)題區(qū)域,在識(shí)別結(jié)果中突出標(biāo)注確定出的問(wèn)題區(qū)域中的命名實(shí)體詞匯,將標(biāo)注后的識(shí)別結(jié)果輸出給新詞生成子模塊202。新詞生成子模塊202,用于從本地命名實(shí)體庫(kù)中和網(wǎng)絡(luò)資源中查找確定出的問(wèn)題區(qū)域中的命名實(shí)體詞匯的候選詞匯,形成候選詞匯列表輸出給顯示部件,將標(biāo)注后的識(shí)別結(jié)果輸出給用戶(hù)更正模塊300和顯示部件。前文中已提到,本發(fā)明實(shí)施例中的命名實(shí)體詞匯標(biāo)注信息為命名實(shí)體詞匯的位置和屬性信息,本發(fā)明實(shí)施例的裝置中進(jìn)ー步包括本地命名實(shí)體庫(kù)更新模塊400,進(jìn)ー步用于將所述用戶(hù)更正模塊執(zhí)行修正后確認(rèn)的正確詞匯及其類(lèi)別、在句子中的位置、出現(xiàn)的頻次和毎次更新的時(shí)間更新到本地命名實(shí)體庫(kù)中。在這種情況下,上述新詞生成子模塊202進(jìn)一步用于,在利用本地命名實(shí)體庫(kù)查找所述確定出的命名實(shí)體詞匯的候選詞匯時(shí),根據(jù)所述類(lèi)別、在句子中的位置、出現(xiàn)的頻次和毎次更新的時(shí)間,確定查找出的候選詞匯的排列順序。圖10為本發(fā)明實(shí)施例中用戶(hù)更正模塊的結(jié)構(gòu)示意圖,用戶(hù)更正模塊300包括第一更正子模塊301、第二更正子模塊302和第三更正子模塊303。上述第一更正子模塊301,用于在用戶(hù)觸發(fā)后,使用用戶(hù)直接從所述候選詞匯列表中選擇的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯;將執(zhí)行修正后確認(rèn)正確的詞匯輸出給本地命名實(shí)體庫(kù)更新模塊400。這里的第一更正子模塊301負(fù)責(zé)提供直接從候選詞匯列表中選擇正確詞匯的修正模式,當(dāng)用戶(hù)選擇這種修正模式后才執(zhí)行操作。上述第二更正子模塊302,用于在用戶(hù)觸發(fā)后,從本地命名實(shí)體庫(kù)和/或網(wǎng)絡(luò)資源中查找確定出的問(wèn)題區(qū)域中的命名實(shí)體詞匯的候選詞匯,輸出給顯示部件;使用用戶(hù)從查找出的候選詞匯中選擇的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯;將執(zhí)行修正后確認(rèn)正確的詞匯輸出給本地命名實(shí)體庫(kù)更新模塊400。這里的第二更正子模塊302負(fù)責(zé)提供直接從候選詞匯中選擇正確詞匯的模式,當(dāng)用戶(hù)選擇這種修正模式后才執(zhí)行操作。上述第三更正子模塊303,用于在用戶(hù)觸發(fā)后,使用用戶(hù)重新輸入的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯;將執(zhí)行修正后確認(rèn)正確的詞匯輸出給本地命名實(shí)體庫(kù)更新模塊400。這里的第三更正子模塊303負(fù)責(zé)提供用戶(hù)重新輸入詞匯的修正模式,當(dāng)用戶(hù)選擇這種修正模式后才執(zhí)行操作。當(dāng)用戶(hù)通過(guò)語(yǔ)音重新輸入詞匯時(shí),第三更正子模塊303進(jìn)ー步用于,觸發(fā)連續(xù)語(yǔ)音識(shí)別模塊100重新識(shí)別輸入的語(yǔ)音輸入信號(hào)、并顯示重新識(shí)別的識(shí)別結(jié)果,將用戶(hù)確認(rèn)的重新識(shí)別的識(shí)別結(jié)果作為確認(rèn)的正確詞匯。當(dāng)用戶(hù)沒(méi)有從候選詞匯列表中選擇出正確詞匯,也不想通過(guò)上述其他模式進(jìn)行修正時(shí),用戶(hù)更正模塊300中還可以包括第四更正子模塊304,用于在用戶(hù)觸發(fā)后,顯示所述新詞生成子模塊202確定出、且未包含在所述候選詞匯列表中的更多候選詞匯,使用用戶(hù)從所述更多候選詞匯中選擇出的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯;將執(zhí)行修正后確認(rèn)正確的詞匯輸出給本地命名實(shí)體庫(kù)更新模塊400。這里的第三更正子模塊303負(fù)責(zé)提供后多候選詞的修正模式,當(dāng)用戶(hù)選擇這種修正模式后才執(zhí)行操作。圖11為本發(fā)明中終端的結(jié)構(gòu)示意圖,該終端包括修正語(yǔ)音輸入文本中命名實(shí)體詞匯的裝置和顯示部件。上述修正語(yǔ)音輸入文本中命名實(shí)體詞匯的裝置,用于識(shí)別語(yǔ)音輸入信號(hào),得出包 括命名實(shí)體詞匯標(biāo)注信息的識(shí)別結(jié)果;根據(jù)命名實(shí)體詞匯標(biāo)注信息,確定所述識(shí)別結(jié)果中錯(cuò)誤識(shí)別的命名實(shí)體詞匯,在識(shí)別結(jié)果中突出標(biāo)注出錯(cuò)誤識(shí)別的命名實(shí)體詞匯,并將標(biāo)注后的識(shí)別結(jié)果輸出給所述顯示部件;使用從預(yù)設(shè)的本地命名實(shí)體庫(kù)和/或網(wǎng)絡(luò)資源中選擇的詞匯、或用戶(hù)重新輸入的詞匯,修正識(shí)別錯(cuò)誤的命名實(shí)體詞匯。上述顯示部件,用于顯示修正語(yǔ)音輸入文本中命名實(shí)體詞匯的裝置輸出的標(biāo)注后的識(shí)別結(jié)果。本發(fā)明的終端中的修正語(yǔ)音輸入文本中命名實(shí)體詞匯的裝置,其內(nèi)部結(jié)構(gòu)和各項(xiàng)附加功能可以與前文所述的修正語(yǔ)音輸入文本中命名實(shí)體詞匯的裝置相同,這里不再贅述。綜上所述,以上僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.ー種修正語(yǔ)音輸入文本中命名實(shí)體詞匯的方法,其特征在于,該方法包括 A、識(shí)別語(yǔ)音輸入信號(hào),得到包括命名實(shí)體詞匯標(biāo)注信息的識(shí)別結(jié)果; B、根據(jù)所述命名實(shí)體詞匯標(biāo)注信息,確定所述識(shí)別結(jié)果中識(shí)別錯(cuò)誤的命名實(shí)體詞匯,突出顯示所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯; C、使用從預(yù)設(shè)的本地命名實(shí)體庫(kù)和/或網(wǎng)絡(luò)資源中選擇的詞匯、或用戶(hù)重新輸入的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯。
2.如權(quán)利要求I所述的方法,其特征在于,所述步驟A包括 Al、提取所述語(yǔ)音輸入信號(hào)的多維度倒譜特征及其差分特征; A2、基于命名實(shí)體標(biāo)注詞典、聲學(xué)模型和基于類(lèi)的語(yǔ)言模型,得出包括詞格和音素格的識(shí)別結(jié)果,并在所述詞格中標(biāo)注命名實(shí)體詞匯標(biāo)注信息,所述詞格和音素格由識(shí)別柵格組成,所述命名實(shí)體詞匯標(biāo)注信息為命名實(shí)體詞匯的位置和類(lèi)別信息。
3.如權(quán)利要求2所述的方法,其特征在于,所述步驟B包括 BI、根據(jù)所述詞格和音素格及其起始和終止時(shí)間信息,對(duì)詞格和音素格進(jìn)行強(qiáng)制對(duì)齊,查找識(shí)別柵格未對(duì)齊且包括命名實(shí)體詞匯的問(wèn)題區(qū)域; B2、確定置信度低于設(shè)定閾值的問(wèn)題區(qū)域; B3、突出標(biāo)注確定出的問(wèn)題區(qū)域中的命名實(shí)體詞匯,顯示標(biāo)注后的識(shí)別結(jié)果。
4.如權(quán)利要求2所述的方法,其特征在于,所述步驟C包括 Cl、從本地命名實(shí)體庫(kù)和/或網(wǎng)絡(luò)資源中查找所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯的候選詞匯、形成候選詞匯列表并顯示; C2、使用用戶(hù)直接從所述候選詞匯列表中選擇的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯;或者,從本地命名實(shí)體庫(kù)和/或網(wǎng)絡(luò)資源中查找所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯的候選詞匯并顯示,使用用戶(hù)直接從查找出的候選詞匯中選擇的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯;或者,使用用戶(hù)重新輸入的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯。
5.如權(quán)利要求4所述的方法,其特征在于,所述步驟Cl和步驟C2中從本地命名實(shí)體庫(kù)和/或網(wǎng)絡(luò)資源中查找所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯的候選詞匯為 在本地命名實(shí)體庫(kù)中查找時(shí),包括在本地命名實(shí)體庫(kù)中查找與確定出的命名實(shí)體詞匯相同類(lèi)別且發(fā)音相似的詞匯; 在網(wǎng)絡(luò)資源中查找時(shí),包括在網(wǎng)絡(luò)中的公用數(shù)據(jù)庫(kù)查找與確定出的命名實(shí)體詞匯發(fā)音相似的詞匯;或者,在網(wǎng)絡(luò)資源中捜索確定出的命名實(shí)體詞匯、及在本地命名實(shí)體庫(kù)中查找出的詞匯的發(fā)音,通過(guò)搜索返回率確定詞匯;或者,在網(wǎng)絡(luò)中的設(shè)定服務(wù)器或服務(wù)器組查找與確定出的命名實(shí)體詞匯發(fā)音相似的詞匯,所述設(shè)定服務(wù)器或服務(wù)器組定時(shí)更新自身內(nèi)部的命名實(shí)體詞匯。
6.如權(quán)利要求5所述的方法,其特征在于,所述步驟C中進(jìn)ー步包括 C3、將執(zhí)行修正后確認(rèn)的正確詞匯及其類(lèi)別、在句子中的位置、出現(xiàn)的頻次和毎次更新的時(shí)間更新到本地命名實(shí)體庫(kù)中; 所述在本地命名實(shí)體庫(kù)中查找時(shí),進(jìn)ー步根據(jù)所述類(lèi)別、在句子中的位置、出現(xiàn)的頻次和毎次更新的時(shí)間,確定查找出的候選詞匯的排列順序。
7.如權(quán)利要求4所述的方法,其特征在于,所述步驟C2中進(jìn)ー步包括顯示所述查找出、且未包含在所述候選詞匯列表中的更多候選詞匯,使用用戶(hù)從所述更多候選詞匯中選擇出的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯。
8.如權(quán)利要求4所述的方法,其特征在于,所述步驟C2中,用戶(hù)重新輸入的詞匯為用戶(hù)通過(guò)語(yǔ)音重新輸入的詞匯; 當(dāng)使用用戶(hù)重新輸入的詞匯修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯時(shí),重新識(shí)別輸入的語(yǔ)音輸入信號(hào),并顯示重新識(shí)別的識(shí)別結(jié)果,在用戶(hù)確認(rèn)后,將重新識(shí)別的識(shí)別結(jié)果作為確認(rèn)的正確詞匯,在用戶(hù)重新輸入語(yǔ)音時(shí),返回執(zhí)行重新識(shí)別輸入的語(yǔ)音輸入信號(hào)的步驟。
9.ー種修正語(yǔ)音輸入文本中命名實(shí)體詞匯的裝置,其特征在于,該裝置包括連續(xù)語(yǔ)音識(shí)別模塊、命名實(shí)體詞匯檢測(cè)模塊和用戶(hù)更正模塊; 所述連續(xù)語(yǔ)音識(shí)別模塊,用于識(shí)別語(yǔ)音輸入信號(hào),將包括命名實(shí)體詞匯標(biāo)注信息的識(shí)別結(jié)果輸出給所述命名實(shí)體詞匯檢測(cè)模塊; 所述命名實(shí)體詞匯檢測(cè)模塊,用于根據(jù)所述命名實(shí)體詞匯標(biāo)注信息,確定所述識(shí)別結(jié)果中錯(cuò)誤識(shí)別的命名實(shí)體詞匯,在識(shí)別結(jié)果中突出標(biāo)注出錯(cuò)誤識(shí)別的命名實(shí)體詞匯,并將標(biāo)注后的識(shí)別結(jié)果輸出給所述用戶(hù)更正模塊及顯示部件; 所述用戶(hù)更正模塊,用于使用從預(yù)設(shè)的本地命名實(shí)體庫(kù)和/或網(wǎng)絡(luò)資源中選擇的詞匯、或用戶(hù)重新輸入的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯。
10.如權(quán)利要求9所述的裝置,其特征在干,所述連續(xù)語(yǔ)音識(shí)別模塊包括特征提取子模塊、解碼器、命名實(shí)體標(biāo)注詞典、聲學(xué)模型和基于類(lèi)的語(yǔ)言模型; 所述特征提取子模塊,用于從語(yǔ)音輸入信號(hào)中提取多維度的倒譜特征及其差分特征,輸出到所述解碼器; 所述解碼器,用于基于命名實(shí)體標(biāo)注詞典、聲學(xué)模型和基于類(lèi)的語(yǔ)言模型,得到音素格和詞格兩級(jí)識(shí)別結(jié)果,輸出給所述命名實(shí)體檢測(cè)模塊,所述詞格和音素格由識(shí)別柵格組成、且詞格中包括命名實(shí)體詞匯標(biāo)注信息,所述命名實(shí)體詞匯標(biāo)注信息為命名實(shí)體詞匯的位置和類(lèi)別信息。
11.如權(quán)利要求10所述的裝置,其特征在于,所述命名實(shí)體檢測(cè)模塊包括置信度校驗(yàn)子模塊和新詞生成子模塊; 所述置信度校驗(yàn)子模塊,用于根據(jù)所述詞格和音素格及其起始和終止時(shí)間信息,對(duì)詞格和音素格進(jìn)行強(qiáng)制對(duì)齊,確定識(shí)別柵格未對(duì)齊、包括命名實(shí)體詞匯標(biāo)注信息、且置信度低于設(shè)定閾值的問(wèn)題區(qū)域,突出標(biāo)注出所述問(wèn)題區(qū)域中的命名實(shí)體詞匯,并將標(biāo)注后的識(shí)別結(jié)果輸出給所述新詞生成子模塊; 所述新詞生成子模塊,用于從本地命名實(shí)體庫(kù)和/或網(wǎng)絡(luò)資源中查找確定出的問(wèn)題區(qū)域中的命名實(shí)體詞匯的候選詞匯,形成候選詞匯列表輸出給顯示部件,將標(biāo)注后的識(shí)別結(jié)果輸出給所述用戶(hù)更正模塊和顯示部件。
12.如權(quán)利要求11所述的裝置,其特征在于,所述裝置中進(jìn)ー步包括本地命名實(shí)體庫(kù)更新模塊,用于將所述用戶(hù)更正模塊執(zhí)行修正后確認(rèn)的正確詞匯及其類(lèi)別、在句子中的位置、出現(xiàn)的頻次和毎次更新的時(shí)間更新到本地命名實(shí)體庫(kù)中; 所述新詞生成子模塊進(jìn)一步用于,在利用本地命名實(shí)體庫(kù)查找所述確定出的命名實(shí)體詞匯的候選詞匯時(shí),根據(jù)所述類(lèi)別、在句子中的位置、出現(xiàn)的頻次和毎次更新的時(shí)間,確定查找出的候選詞匯的排列順序。
13.如權(quán)利要求12所述的裝置,其特征在于,所述用戶(hù)更正模塊包括第一更正子模塊、第二更正子模塊和第三更正子模塊; 所述第一更正子模塊,用于在用戶(hù)觸發(fā)后,使用用戶(hù)直接從所述候選詞匯列表中選擇的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯;將執(zhí)行修正后確認(rèn)正確的詞匯輸出給本地命名實(shí)體庫(kù)更新ホ吳塊; 所述第二更正子模塊,用于在用戶(hù)觸發(fā)后,從本地命名實(shí)體庫(kù)和/或網(wǎng)絡(luò)資源中查找確定出的問(wèn)題區(qū)域中的命名實(shí)體詞匯的候選詞匯,輸出給顯示部件;使用用戶(hù)從查找出的候選詞匯中選擇的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯;將執(zhí)行修正后確認(rèn)正確的詞匯輸出給本地命名實(shí)體庫(kù)更新模塊; 第三更正子模塊,用于在用戶(hù)觸發(fā)后,使用用戶(hù)重新輸入的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯;將執(zhí)行修正后確認(rèn)正確的詞匯輸出給本地命名實(shí)體庫(kù)更新模塊。
14.如權(quán)利要求13所述的裝置,其特征在于,所述用戶(hù)更正模塊中進(jìn)ー步包括第四更正子模塊,用于在用戶(hù)觸發(fā)后,顯示所述新詞生成子模塊確定出、且未包含在所述候選詞匯列表中的更多候選詞匯,使用用戶(hù)從所述更多候選詞匯中選擇出的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯;將執(zhí)行修正后確認(rèn)正確的詞匯輸出給本地命名實(shí)體庫(kù)更新模塊。
15.如權(quán)利要求13所述的裝置,其特征在于,所述用戶(hù)重新輸入的詞匯為用戶(hù)通過(guò)語(yǔ)音重新輸入的詞匯; 所述第三更正模塊進(jìn)一步用于,觸發(fā)所述連續(xù)語(yǔ)音識(shí)別模塊重新識(shí)別輸入的語(yǔ)音輸入信號(hào)、并顯示重新識(shí)別的識(shí)別結(jié)果,將用戶(hù)確認(rèn)的重新識(shí)別的識(shí)別結(jié)果作為確認(rèn)的正確詞匯。
16.ー種終端,其特征在于,該終端包括修正語(yǔ)音輸入文本中命名實(shí)體詞匯的裝置和顯示部件; 所述修正語(yǔ)音輸入文本中命名實(shí)體詞匯的裝置,用于識(shí)別語(yǔ)音輸入信號(hào),得出包括命名實(shí)體詞匯標(biāo)注信息的識(shí)別結(jié)果;根據(jù)所述命名實(shí)體詞匯標(biāo)注信息,確定所述識(shí)別結(jié)果中錯(cuò)誤識(shí)別的命名實(shí)體詞匯,在識(shí)別結(jié)果中突出標(biāo)注出錯(cuò)誤識(shí)別的命名實(shí)體詞匯,并將標(biāo)注后的識(shí)別結(jié)果輸出給所述顯示部件;使用從預(yù)設(shè)的本地命名實(shí)體庫(kù)和/或網(wǎng)絡(luò)資源中選擇的詞匯、或用戶(hù)重新輸入的詞匯,修正所述識(shí)別錯(cuò)誤的命名實(shí)體詞匯; 所述顯示部件,用于顯示所述標(biāo)注后的識(shí)別結(jié)果。
全文摘要
本發(fā)明公開(kāi)了修正語(yǔ)音輸入文本中命名實(shí)體詞匯的方法及裝置,有針對(duì)性的定位識(shí)別錯(cuò)誤的命名實(shí)體詞匯,而不是對(duì)用戶(hù)輸入的每個(gè)詞匯是否識(shí)別錯(cuò)誤都進(jìn)行判斷,同時(shí)提供了包括使用從預(yù)設(shè)的本地命名實(shí)體庫(kù)和/或網(wǎng)絡(luò)資源中選擇的詞匯、及使用用戶(hù)重新輸入的詞匯進(jìn)行修正的修正模式,與現(xiàn)有技術(shù)中僅通過(guò)多模態(tài)的文字輸入進(jìn)行修正相比,修正途徑更加便捷、豐富。
文檔編號(hào)G06F17/30GK102682763SQ201110063938
公開(kāi)日2012年9月19日 申請(qǐng)日期2011年3月10日 優(yōu)先權(quán)日2011年3月10日
發(fā)明者嚴(yán)基完, 張華 , 朱璇, 李在原, 蘇騰榮 申請(qǐng)人:三星電子株式會(huì)社, 北京三星通信技術(shù)研究有限公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
延安市| 乌苏市| 罗源县| 海宁市| 二连浩特市| 大庆市| 扶沟县| 大悟县| 茌平县| 金川县| 肇源县| 香港| 黎平县| 兰西县| 阿尔山市| 延津县| 商丘市| 西乌珠穆沁旗| 来凤县| 商水县| 东安县| 大余县| 乐至县| 德钦县| 行唐县| 高平市| 新巴尔虎右旗| 专栏| 太白县| 大关县| 双桥区| 巢湖市| 剑河县| 长宁区| 武邑县| 太仆寺旗| 临湘市| 鄂伦春自治旗| 兴国县| 虹口区| 彝良县|