一種在線語音翻譯方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種在線語音翻譯方法及裝置,所述方法包括:對第一用戶輸入的第一語音信息進行語音識別,獲得第一識別信息;確定第一識別信息的置信度;根據(jù)第一識別信息的置信度提示第一用戶對第一識別信息進行確認;對確認的第一識別信息進行翻譯,獲得第一翻譯信息并輸出;根據(jù)第二用戶反饋的第二信息,提取第一翻譯信息的關聯(lián)信息;根據(jù)關聯(lián)信息對第一翻譯信息進行修正并輸出。通過本發(fā)明公開的一種在線語音翻譯方法及裝置,可以保證在跨語言交流中溝通順暢。
【專利說明】一種在線語音翻譯方法及裝置
【技術領域】
[0001 ] 本發(fā)明實施例涉及在線翻譯技術,尤其涉及一種在線語音翻譯方法及裝置。
【背景技術】
[0002]隨著國際性交流的增加,使用不同語種的語言溝通越來越頻繁。為克服語言障礙,基于客戶端進行在線語音翻譯得到廣泛的應用。
[0003]在線語音翻譯一般涉及兩個環(huán)節(jié),第一是進行語音識別,即將第一用戶輸入的第一語種語音識別為文字信息;第二是將文字信息基于翻譯語料庫進行翻譯,再生成第二語種的語音信息或文字信息,提供給第二用戶。通過在線語音翻譯,可以為使用不同語言的用戶雙方提供翻譯服務,使雙方進行順利溝通。
[0004]目前,在在線語音翻譯過程中,在語音識別和翻譯的過程中都可能會出現(xiàn)錯誤,導致在跨語言交流中溝通不暢,最終使得跨語言溝通無法進行。
【發(fā)明內(nèi)容】
[0005]本發(fā)明提供一種在線語音翻譯方法及裝置,以實現(xiàn)提高在線語音翻譯的準確率,保證溝通順暢。
[0006]一方面,本發(fā)明實施例提供了一種在線語音翻譯方法,包括:
[0007]對第一用戶輸入的第一語音信息進行語音識別,獲得第一識別信息;
[0008]提示所述第一用戶對所述第一識別信息進行確認;
[0009]對確認的所述第一識別信息進行翻譯,獲得第一翻譯信息并輸出;
[0010]根據(jù)第二用戶反饋的第二信息,提取第一翻譯信息的關聯(lián)信息;
[0011]根據(jù)所述關聯(lián)信息對提取第一翻譯信息的關聯(lián)信息。
[0012]優(yōu)選地,提示所述第一用戶對所述第一識別信息進行確認包括:
[0013]確定第一識別信息的置信度;
[0014]根據(jù)所述第一識別信息的置信度提示所述第一用戶對所述第一識別信息進行確認。
[0015]優(yōu)選地,所述確定第一識別信息的置信度,包括:
[0016]根據(jù)當前對話場景中的關鍵詞和/或語言規(guī)則,確定所述第一識別信息的置信度。
[0017]優(yōu)選地,所述根據(jù)所述第一識別信息的置信度提示所述第一用戶對所述第一識別信息進行確認,包括:
[0018]如果所述第一識別信息的置信度低于第一預設門限值,將第一識別信息顯示供所述第一用戶進行確認;或
[0019]如果第一識別信息中至少一個關鍵詞的置信度低于第二預設門限值,將所述關鍵詞顯示供所述第一用戶進行確認。
[0020]優(yōu)選地,所述根據(jù)第二用戶反饋的第二信息,提取第一翻譯信息的關聯(lián)信息,包括:
[0021]將所述第二用戶反饋的所述第二信息與所述第一翻譯信息,進行關鍵詞相似度匹配,提取匹配的關鍵詞作為第一翻譯信息的關聯(lián)信息。
[0022]優(yōu)選地,所述根據(jù)第二用戶反饋的第二信息,提取第一翻譯信息的關聯(lián)信息,包括:
[0023]根據(jù)當前對話場景中的關鍵詞和/或語言規(guī)則,從所述第二信息中提取第一翻譯信息的關聯(lián)信息。
[0024]優(yōu)選地,所述方法還包括:
[0025]根據(jù)所述第一識別信息確定當前對話場景,或根據(jù)第一用戶已確認的歷史識別信息中的關鍵詞識別當前對話場景。
[0026]另一方面,本發(fā)明實施例還提供了一種在線語音翻譯裝置,包括:
[0027]第一識別信息模塊,用于對第一用戶輸入的第一語音信息進行語音識別,獲得第一識別信息;
[0028]確認提示模塊,用于提示所述第一用戶對所述第一識別信息進行確認;
[0029]信息翻譯模塊,用于對確認的所述第一識別信息進行翻譯,獲得第一翻譯信息并輸出;
[0030]關聯(lián)信息提取模塊,用于根據(jù)第二用戶反饋的第二信息,提取第一翻譯信息的關聯(lián)息;
[0031]信息修正模塊,用于根據(jù)所述關聯(lián)信息對所述第一翻譯信息進行修正并輸出。
[0032]優(yōu)選地,所述確認提示模塊包括:
[0033]置信度確定模塊,用于確定第一識別信息的置信度;
[0034]用戶確認模塊,用于根據(jù)所述第一識別信息的置信度提示所述第一用戶對所述第一識別信息進行確認。
[0035]優(yōu)選地,所述置信度確定模塊具體用于:根據(jù)當前對話場景中的關鍵詞和/或語言規(guī)則,確定所述第一識別信息的置信度。
[0036]優(yōu)選地,所述確認提示模塊具體用于:
[0037]如果所述第一識別信息的置信度低于第一預設門限值,將第一識別信息顯示供所述第一用戶進行確認;或
[0038]如果第一識別信息中至少一個關鍵詞的置信度低于第二預設門限值,將所述關鍵詞顯示供所述第一用戶進行確認。
[0039]優(yōu)選地,所述關聯(lián)信息提取模塊包括:
[0040]關鍵詞匹配子模塊,用于將所述第二用戶反饋的所述第二信息與所述第一翻譯信息,進行關鍵詞相似度匹配,提取匹配的關鍵詞作為第一翻譯信息的關聯(lián)信息。
[0041 ] 優(yōu)選地,所述關聯(lián)信息提取模塊包括:
[0042]語言規(guī)則子模塊,用于根據(jù)當前對話場景中的關鍵詞和、或語言規(guī)則,從所述第二Ih息中提取第一翻譯息的關聯(lián)息。
[0043]優(yōu)選地,所述裝置還包括:
[0044]對話場景確定模塊,用于根據(jù)所述第一識別信息確定當前對話場景,或根據(jù)第一用戶已確認的歷史識別信息中的關鍵詞識別當前對話場景。[0045]本發(fā)明實施例通過提示第一用戶對第一識別信息識別結果進行確認,避免了識別語音過程中會出現(xiàn)錯誤,提高了識別信息準確率;并且,通過依據(jù)在第二用戶反饋的第二信息,提取第一翻譯信息的關聯(lián)信息,對第一翻譯信息進行修正并輸出,從而提高了跨語言翻譯的準確率。
【專利附圖】
【附圖說明】
[0046]圖1為本發(fā)明實施例一提供的一種在線語音翻譯方法的流程圖;
[0047]圖2為本發(fā)明實施例二提供的一種在線語音翻譯方法的流程圖;
[0048]圖3為本發(fā)明實施例三提供的一種在線語音翻譯方法的流程圖;
[0049]圖4為本發(fā)明實施例四提供的一種在線語音翻譯裝置的結構示意圖;
[0050]圖5為本發(fā)明實施例五提供的一種在線語音翻譯裝置的結構示意圖。
【具體實施方式】
[0051]下面結合附圖和實施例對本發(fā)明作進一步的詳細說明??梢岳斫獾氖牵颂幩枋龅木唧w實施例僅僅用于解釋本發(fā)明,而非對本發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關的部分而非全部結構。
[0052]實施例一
[0053]圖1為本發(fā)明實施例一提供的一種在線語音翻譯方法的流程圖。本實施例可適用于雙方跨語言進行語音交流時進行語音識別和翻譯的情況,該方法可以由在線語音翻譯裝置來執(zhí)行,該裝置可以由硬件和/或軟件來實現(xiàn),該裝置可以配置在任意終端或網(wǎng)元中。該方法具體包括如下:
[0054]S101,對第一用戶輸入的第一語音信息進行語音識別,獲得第一識別信息。
[0055]在上述操作中,第一用戶和第二用戶進行跨語種的語言交流,第一用戶可以采用第一語音輸入第一語音信息,在線語音翻譯裝置可以對其進行語音識別,得到第一識別信肩、O
[0056]S102,提不第一用戶對第一識別信息進行確認。
[0057]在上述操作中,可以將第一識別信息顯示在顯示屏上,第一用戶通過觸摸屏、鍵盤和鼠標等輸入設備對第一識別信息進行確認。
[0058]該操作可以是獲取的第一識別信息全部提示給用戶進行確認,但優(yōu)選是按照設定觸發(fā)條件,有選擇地提供給用戶進行確認,優(yōu)選是:確定第一識別信息的置信度;根據(jù)第一識別信息的置信度提示第一用戶對第一識別信息進行確認。
[0059]置信度可以是表不第一識別信息的正確率,例如與第一用戶輸入的第一語音信息原意的誤差度,第一識別信息的可識別率,與詞庫中標準詞匯的誤差度。置信度的確定可以是將第一識別信息在標準詞庫中進行匹配,以判斷正確識別的詞匯率是否達到設定限制,或者判斷第一識別信息是否滿足設定規(guī)則,例如語法要求。在實際使用過程中,可以確定全部第一識別信息的置信度;也可以是選取第一識別信息中的至少一個關鍵詞,確定各關鍵詞的置信度。
[0060]根據(jù)第一識別信息的置信度對用戶進行的提示,優(yōu)選是,如果第一識別信息的置信度低于第一預設門限值,將第一識別信息顯示供第一用戶進行確認?;蛘撸绻谝蛔R別信息中至少一個關鍵詞的置信度低于第二預設門限值,將關鍵詞顯示供第一用戶進行確認。
[0061]S103,對確認的第一識別信息進行翻譯,獲得第一翻譯信息并輸出。
[0062]在上述操作中,將第一識別信息由第一用戶所使用的語種翻譯成為第二用戶使用的語種,例如,對中文的第一識別信息進行翻譯,獲得英文的第一翻譯信息。兩個用戶可以分別使用兩個配置有在線語音翻譯裝置的終端,則第一用戶的終端可以通過有線網(wǎng)絡或無線網(wǎng)絡輸出第一翻譯信息給第二用戶的終端。
[0063]S104,根據(jù)第二用戶反饋的第二信息,提取第一翻譯信息的關聯(lián)信息。
[0064]在上述操作中,第二用戶反饋的第二信息仍然可以通過終端之間的交互返回給第一用戶的終端。第一翻譯信息的關聯(lián)信息是能夠矯正第一翻譯信息正確性的信息。例如,與第一翻譯信息滿足設定相似度的單字、詞組,或者,與第一翻譯信息具備設定邏輯關聯(lián)的信息,如針對第一翻譯信息的反問信息。
[0065]獲取關聯(lián)信息的方式,例如可以為:將第二用戶反饋的第二信息與第一翻譯信息,進行關鍵詞相似度匹配,提取匹配的關鍵詞作為第一翻譯信息的關聯(lián)信息。例如,第一用戶說“從北京到天津怎么走?”,若第二用戶反問“去哪”,就說明此處對天津的翻譯可能有誤,使得第二用戶無法理解,則通過將第二信息“去哪”與第一翻譯信息“從北京到天津怎么走? ”進行相似度匹配,獲取第二用戶更為關注的信息,作為需糾正的信息。
[0066]S105,根據(jù)關聯(lián)信息對第一翻譯信息進行修正并輸出。
[0067]在上述操作中,可以對全部第一翻譯信息進行修正并輸出,確保不會遺漏信息。也可以將第一翻譯信息中的一部分進行修正并輸出,例如,其中的一些關鍵詞,相對于翻譯一段信息而言,翻譯關鍵詞的準確率較高,從而可以提高修正的正確率。而且處理部分字或者詞的數(shù)據(jù)處理量較小,可以提高對第一翻譯信息進行修正并輸出的效率。具體的可以通過有線網(wǎng)絡或者無線網(wǎng)絡向第二用戶進行輸出。本操作中,無需再將第一翻譯信息顯示給第一用戶進行確認,而是可以由裝置自動完成翻譯信息的修正,提高了翻譯的準確性。
[0068]本實施例公開的在線語音翻譯方法,通過提示第一用戶對第一識別信息識別結果進行確認,避免了識別語音過程中會出現(xiàn)錯誤,提高了識別信息準確率;并且,通過依據(jù)在第二用戶反饋的第二信息,提取第一翻譯信息的關聯(lián)信息,對第一翻譯信息進行修正并輸出,從而提高了跨語言翻譯的準確率。
[0069]實施例二
[0070]圖2為本發(fā)明實施例二提供的一種在線語音翻譯方法的流程圖。在實際雙方交流的過程中,對話內(nèi)容是基于一定的對話場景以及對話規(guī)則產(chǎn)生的。所以,本發(fā)明實施例二在本發(fā)明實施例一的基礎上,基于對話場景及對話規(guī)則對在線語音翻譯過程進行優(yōu)化,本實施例提供的一種在線語音翻譯方法,包括:
[0071]S201,對第一用戶輸入的第一語音信息進行語音識別,獲得第一識別信息。
[0072]S202,根據(jù)第一識別信息確定當前對話場景,或根據(jù)第一用戶已確認的歷史識別信息中的關鍵詞識別當前對話場景;
[0073]在上述操作中,可以預先設定一些對話場景,及其確定規(guī)則。例如,娛樂信息場景、商務會談場景、學術討論場景、火車站交談場景、飛機場交談場景等??梢愿鶕?jù)第一識別信息中的關鍵詞確定當前對話場景,例如關鍵詞為景點地名時,確定當前對話場景為旅游場景。也可以根據(jù)第一用戶在預設時間段內(nèi)確認的歷史識別信息中的關鍵詞識別當前對話場景。在第一用戶對第一識別信息進行確認之前確認的信息為歷史識別信息。當然,對話場景也可以由用戶進行選擇。
[0074]S203,根據(jù)當前對話場景中的關鍵詞和/或語言規(guī)則,確定第一識別信息的置信度。
[0075]在上述操作中,當前對話場景中關鍵詞是在該場景下的常用詞匯,或是該場景下的罕見詞匯。所以,可以將第一識別信息與當前對話場景的關鍵詞進行比對。根據(jù)所包括的常用詞匯和/或罕見詞匯的概率確定置信度。語言規(guī)則可以是語法規(guī)則,語言規(guī)則可以包括但不限于時間、地點、人物和事件。
[0076]S204,根據(jù)第一識別信息的置信度提示第一用戶對第一識別信息進行確認。
[0077]在上述操作中,可以通過視覺方式提示第一用戶對第一識別信息進行確認,例如在顯示界面上彈出窗口和顯示確定鍵等方式,也可以通過聽覺方式提示第一用戶對第一識別信息進行確認,例如播放提示語音信息。
[0078]S205,對確認的第一識別信息進行翻譯,獲得第一翻譯信息并輸出。
[0079]S206,根據(jù)當前對話場景中的關鍵詞和/或語言規(guī)則,從第二信息中提取第一翻譯信息的關聯(lián)信息。
[0080]S207,根據(jù)關聯(lián)信息對提取第一翻譯信息的關聯(lián)信息。
[0081]通過本實施例二公開的在線語音翻譯方法,增加了對話的場景管理,進一步優(yōu)化了置信度確定和關聯(lián)信息確定的準確率。
[0082]實施例三
[0083]圖3為本發(fā)明實施例三提供的一種在線語音翻譯方法的流程圖。基于本發(fā)明前述提供的實施例,本實施例提供一種在線語音翻譯方法的優(yōu)選實施方案,以第一用戶為中文用戶,第二用戶為法文用戶進行舉例說明。該方法包括:
[0084]S301、第一用戶使用中文通過麥克風輸入“今天下午從尼斯去巴黎的火車票”,作為第一語音信息,對其進行語音識別,得到第一識別信息,由于口音、環(huán)境噪聲等多方面原因,識別信息可能為“京天下午從14去巴黎的火車票”。
[0085]S302、確定“京天下午從14去巴黎的火車票”置信度,若置信度低于設定門限值,則執(zhí)行S303,否則繼續(xù)執(zhí)行S305。
[0086]由于在“京天下午從14去巴黎的火車票”中出現(xiàn)“下午”、“巴黎”和“火車票”,按照常規(guī)語法規(guī)則推斷應為從一地去另一地的語法規(guī)則,“京天”既不是時間名詞也不是地址名詞,在“從14去巴黎”這一表達出發(fā)地和目的地的語法規(guī)則中,“14”也不是地址細膩,因此,“京天”和“14”的置信度較低,應執(zhí)行S303。
[0087]S303、將“京天下午從14去巴黎的火車票”以文字的方式顯示于顯示屏上,提示第一用戶進行確認。
[0088]S304、用戶選擇刪除并重新輸入,返回執(zhí)行S301。
[0089]直至得到置信度較高的第一識別信息為“今天下午從尼斯去巴黎的火車票”。
[0090]S305、將第一識別信息“今天下午從尼斯去巴黎的火車票”翻譯為法語“今天下午從你斯去巴黎的火車票”,即第一翻譯信息,輸出給第二用戶;
[0091]此處可能會由于詞匯的生僻或者有多種語義,而導致翻譯信息有誤。[0092]S306、接收第二用戶輸入的法語反饋信息,將反饋信息翻譯成中文,反饋的信息為“你從哪里去巴黎”,作為第二信息;
[0093]可以直接將法語反饋信息作為第二信息,也可以將其翻譯成中文后作為第二信肩、O
[0094]S307、根據(jù)語言規(guī)則,從第二信息中提取第一翻譯信息的關聯(lián)信息。
[0095]本實例中,第二信息為“你從哪里去巴黎”,基于語言規(guī)則識別出是在詢問出發(fā)地點,而第一識別信息中“今天下午從尼斯去巴黎的火車票”中,“從尼斯去巴黎”按照常規(guī)語法可反映出發(fā)地和目的地,據(jù)此,提取出“尼斯”作為關聯(lián)信息。
[0096]S308、根據(jù)關聯(lián)信息修正第一翻譯信息,并輸出給第二用戶。
[0097]依據(jù)關聯(lián)信息“尼斯”將第一翻譯信息修正為法語的“尼斯”,并輸出給第二用戶。通常情況下,翻譯系統(tǒng)對單個詞和短語的翻譯相對于語句的翻譯會比較準確,因此能在一定程度上降低翻譯錯誤概率。
[0098]本實施例三的技術方案,可以避免向第二用戶方輸出“京天”的翻譯結果,造成雙方溝通不順暢,而且可以修正對“尼斯”的翻譯結果并重新輸出,保證了跨語言雙方的溝通順暢。
[0099]實施例四
[0100]圖4為本發(fā)明實施例四提供的一種在線語音翻譯裝置的結構示意圖。本實施例可適用于雙方跨語言進行語音交流時進行語音識別和翻譯的情況,該裝置可以配置在任意終端或網(wǎng)元中。該裝置具體包括:
[0101]第一識別信息模塊41、確認提示模塊42、信息翻譯模塊43、關聯(lián)信息提取模塊44和信息修正模塊45。
[0102]第一識別信息模塊41,用于對第一用戶輸入的第一語音信息進行語音識別,獲得第一識別信息;確認提示模塊42,用于提示第一用戶對第一識別信息進行確認;信息翻譯模塊43,用于對確認的第一識別信息進行翻譯,獲得第一翻譯信息并輸出;關聯(lián)信息提取模塊44,用于根據(jù)第二用戶反饋的第二信息,提取第一翻譯信息的關聯(lián)信息;信息修正模塊45,用于根據(jù)關聯(lián)信息對第一翻譯信息進行修正并輸出。
[0103]在第一識別信息模塊41中,第一用戶和第二用戶進行跨語種的語言交流,第一用戶可以采用第一語音輸入第一語音信息,在線語音翻譯裝置可以對其進行語音識別,得到第一識別信息。
[0104]在確認提示模塊42中,可以將第一識別信息顯示在顯示屏上,第一用戶通過觸摸屏、鍵盤和鼠標等輸入設備對第一識別信息進行確認。
[0105]可以是獲取的第一識別信息全部提示給用戶進行確認,但優(yōu)選是按照設定觸發(fā)條件,有選擇地提供給用戶進行確認。
[0106]確認提示模塊42包括置信度確定模塊421和用戶確認模塊422。
[0107]置信度確定模塊421,用于確定第一識別信息的置信度;
[0108]用戶確認模塊422,用于根據(jù)第一識別信息的置信度提示第一用戶對第一識別信息進行確認。
[0109]在置信度確定模塊421中,置信度可以是表示第一識別信息的正確率,例如與第一用戶輸入的第一語音信息原意的誤差度,第一識別信息的可識別率,與詞庫中標準詞匯的誤差度。置信度的確定可以是將第一識別信息在標準詞庫中進行匹配,以判斷正確識別的詞匯率是否達到設定限制,或者判斷第一識別信息是否滿足設定規(guī)則,例如語法要求。在實際使用過程中,可以確定全部第一識別信息的置信度;也可以是選取第一識別信息中的至少一個關鍵詞,確定各關鍵詞的置信度。
[0110]在用戶確認模塊422中,根據(jù)第一識別信息的置信度對用戶進行的提示,優(yōu)選是,如果第一識別信息的置信度低于第一預設門限值,將第一識別信息顯示供第一用戶進行確認?;蛘?,如果第一識別信息中至少一個關鍵詞的置信度低于第二預設門限值,將關鍵詞顯示供第一用戶進行確認。
[0111]在信息翻譯模塊43中,將第一識別信息由第一用戶所使用的語種翻譯成為第二用戶使用的語種,例如,對中文的第一識別信息進行翻譯,獲得英文的第一翻譯信息。兩個用戶可以分別使用兩個配置有在線語音翻譯裝置的終端,則第一用戶的終端可以通過有線網(wǎng)絡或無線網(wǎng)絡輸出第一翻譯信息給第二用戶的終端。
[0112]在關聯(lián)信息提取模塊44中,第二用戶反饋的第二信息仍然可以通過終端之間的交互返回給第一用戶的終端。第一翻譯信息的關聯(lián)信息是能夠矯正第一翻譯信息正確性的信息。例如,與第一翻譯信息滿足設定相似度的單字、詞組,或者,與第一翻譯信息具備設定邏輯關聯(lián)的信息,如針對第一翻譯信息的反問信息。
[0113]在關聯(lián)信息提取模塊44中,包括關鍵詞匹配子模塊441,用于將第二用戶反饋的第二信息與第一翻譯信息,進行關鍵詞相似度匹配,提取匹配的關鍵詞作為第一翻譯信息的關聯(lián)信息。例如,第一用戶說“從北京到天津怎么走? ”,若第二用戶反問“去哪”,就說明此處對天津的翻譯可能有誤,使得第二用戶無法理解,則通過將第二信息“去哪”與第一翻譯信息“從北京到天津怎么走? ”進行相似度匹配,獲取第二用戶更為關注的信息,作為需糾正的信息。
[0114]在信息修正模塊45中,可以對全部第一翻譯信息進行修正并輸出,確保不會遺漏信息。也可以將第一翻譯信息中的一部分進行修正并輸出,例如,其中的一些關鍵詞,相對于翻譯一段信息而言,翻譯關鍵詞的準確率較高,從而可以提高修正的正確率。而且處理部分字或者詞的數(shù)據(jù)處理量較小,可以提高對第一翻譯信息進行修正并輸出的效率。具體的可以通過有線網(wǎng)絡或者無線網(wǎng)絡向第二用戶進行輸出。從而,無需再將第一翻譯信息顯示給第一用戶進行確認,而是可以由裝置自動完成翻譯信息的修正,提高了翻譯的準確性。
[0115]本實施例四公開的在線語音翻譯裝置,通過提示第一用戶對第一識別信息識別結果進行確認,避免了識別語音過程中會出現(xiàn)錯誤,提高了識別信息準確率;并且,通過依據(jù)在第二用戶反饋的第二信息,提取第一翻譯信息的關聯(lián)信息,對第一翻譯信息進行修正并輸出,從而提高了跨語言翻譯的準確率。
[0116]實施例五
[0117]圖5為本發(fā)明實施例五提供的一種在線語音翻譯裝置的結構示意圖。在實際雙方交流的過程中,對話內(nèi)容是基于一定的對話場景以及對話規(guī)則產(chǎn)生的。所以,本發(fā)明實施例五在本發(fā)明實施例四的基礎上,基于對話場景及對話規(guī)則對在線語音翻譯過程進行優(yōu)化,本實施例提供的一種在線語音翻譯裝置,包括:
[0118]第一識別信息模塊51、對話場景確定模塊52、置信度確定模塊53、用戶確認模塊54、信息翻譯模塊55、語言規(guī)則子模塊56和信息修正模塊57。[0119]第一識別信息模塊51,用于對第一用戶輸入的第一語音信息進行語音識別,獲得第一識別信息;對話場景確定模塊52,用于根據(jù)第一識別信息確定當前對話場景,或根據(jù)第一用戶已確認的歷史識別信息中的關鍵詞識別當前對話場景;置信度確定模塊53,用于確定第一識別信息的置信度;用戶確認模塊54,用于根據(jù)第一識別信息的置信度提示第一用戶對第一識別信息進行確認;信息翻譯模塊55,用于對確認的第一識別信息進行翻譯,獲得第一翻譯信息并輸出;語言規(guī)則子模塊56,用于根據(jù)當前對話場景中的關鍵詞和、或語言規(guī)則,從第二信息中提取第一翻譯信息的關聯(lián)信息;信息修正模塊57,用于根據(jù)關聯(lián)信息對第一翻譯信息進行修正并輸出。
[0120]在對話場景確定模塊52中,可以預先設定一些對話場景,及其確定規(guī)則。例如,娛樂信息場景、商務會談場景、學術討論場景、火車站交談場景、飛機場交談場景等??梢愿鶕?jù)第一識別信息中的關鍵詞確定當前對話場景,例如關鍵詞為景點地名時,確定當前對話場景為旅游場景。也可以根據(jù)第一用戶在預設時間段內(nèi)確認的歷史識別信息中的關鍵詞識別當前對話場景。在第一用戶對第一識別信息進行確認之前確認的信息為歷史識別信息。當然,對話場景也可以由用戶進行選擇。
[0121]在置信度確定模塊53中,當前對話場景中關鍵詞是在該場景下的常用詞匯,或是該場景下的罕見詞匯。所以,可以將第一識別信息與當前對話場景的關鍵詞進行比對。根據(jù)所包括的常用詞匯和/或罕見詞匯的概率確定置信度。語言規(guī)則可以是語法規(guī)則,語言規(guī)則可以包括但不限于時間、地點、人物和事件。
[0122]在用戶確認模塊54中,可以通過視覺方式提示第一用戶對第一識別信息進行確認,例如在顯示界面上彈出窗口和顯示確定鍵等方式,也可以通過聽覺方式提示第一用戶對第一識別信息進行確認,例如播放提示語音信息。
[0123]通過本實施例五公開的在線語音翻譯裝置,增加了對話的場景管理,進一步優(yōu)化了置信度確定和關聯(lián)信息確定的準確率。
[0124]上述在線語音翻譯裝置可執(zhí)行本發(fā)明任意實施例所提供的在線語音翻譯方法,具備相應的功能模塊和有益效果。
[0125]注意,上述僅為本發(fā)明的較佳實施例及所運用技術原理。本領域技術人員會理解,本發(fā)明不限于這里所述的特定實施例,對本領域技術人員來說能夠進行各種明顯的變化、重新調整和替代而不會脫離本發(fā)明的保護范圍。因此,雖然通過以上實施例對本發(fā)明進行了較為詳細的說明,但是本發(fā)明不僅僅限于以上實施例,在不脫離本發(fā)明構思的情況下,還可以包括更多其他等效實施例,而本發(fā)明的范圍由所附的權利要求范圍決定。
【權利要求】
1.一種在線語音翻譯方法,其特征在于,包括: 對第一用戶輸入的第一語音信息進行語音識別,獲得第一識別信息; 提示所述第一用戶對所述第一識別信息進行確認; 對確認的所述第一識別信息進行翻譯,獲得第一翻譯信息并輸出; 根據(jù)第二用戶反饋的第二信息,提取第一翻譯信息的關聯(lián)信息; 根據(jù)所述關聯(lián)信息對提取第一翻譯信息的關聯(lián)信息。
2.根據(jù)權利要求1所述的方法,其特征在于,提示所述第一用戶對所述第一識別信息進行確認包括: 確定第一識別信息的置信度; 根據(jù)所述第一識別信息的置信度提示所述第一用戶對所述第一識別信息進行確認。
3.根據(jù)權利要求2所述的方法,其特征在于,所述確定第一識別信息的置信度,包括: 根據(jù)當前對話場景中的關鍵詞和/或語言規(guī)則,確定所述第一識別信息的置信度。
4.根據(jù)權利要求2所述的方法,其特征在于,所述根據(jù)所述第一識別信息的置信度提示所述第一用戶對所述第一識別信息進行確認,包括: 如果所述第一識別信息的置信度低于第一預設門限值,將第一識別信息顯示供所述第一用戶進行確認;或 如果第一識別信息中至少一個關鍵詞的置信度低于第二預設門限值,將所述關鍵詞顯示供所述第一用 戶進行確認。
5.根據(jù)權利要求1所述的方法,其特征在于,所述根據(jù)第二用戶反饋的第二信息,提取第一翻譯信息的關聯(lián)信息,包括: 將所述第二用戶反饋的所述第二信息與所述第一翻譯信息,進行關鍵詞相似度匹配,提取匹配的關鍵詞作為第一翻譯信息的關聯(lián)信息。
6.根據(jù)權利要求1所述的方法,其特征在于,所述根據(jù)第二用戶反饋的第二信息,提取第一翻譯信息的關聯(lián)信息,包括: 根據(jù)當前對話場景中的關鍵詞和/或語言規(guī)則,從所述第二信息中提取第一翻譯信息的關聯(lián)信息。
7.根據(jù)權利要求3或6所述的方法,其特征在于,還包括: 根據(jù)所述第一識別信息確定當前對話場景,或根據(jù)第一用戶已確認的歷史識別信息中的關鍵詞識別當前對話場景。
8.—種在線語音翻譯裝置,其特征在于,包括: 第一識別信息模塊,用于對第一用戶輸入的第一語音信息進行語音識別,獲得第一識另1Jf目息; 確認提示模塊,用于提示所述第一用戶對所述第一識別信息進行確認; 信息翻譯模塊,用于對確認的所述第一識別信息進行翻譯,獲得第一翻譯信息并輸出; 關聯(lián)信息提取模塊,用于根據(jù)第二用戶反饋的第二信息,提取第一翻譯信息的關聯(lián)信息; 信息修正模塊,用于根據(jù)所述關聯(lián)信息對所述第一翻譯信息進行修正并輸出。
9.根據(jù)權利要求8所述的裝置,其特征在于,所述確認提示模塊包括:置信度確定模塊,用于確定第一識別信息的置信度; 用戶確認模塊,用于根據(jù)所述第一識別信息的置信度提示所述第一用戶對所述第一識別信息進行確認。
10.根據(jù)權利要求9所述的裝置,其特征在于,所述置信度確定模塊具體用于:根據(jù)當前對話場景中的關鍵詞和/或語言規(guī)則,確定所述第一識別信息的置信度。
11.根據(jù)權利要求8所述的裝置,其特征在于,所述確認提示模塊具體用于: 如果所述第一識別信息的置信度低于第一預設門限值,將第一識別信息顯示供所述第一用戶進行確認;或 如果第一識別信息中至少一個關鍵詞的置信度低于第二預設門限值,將所述關鍵詞顯示供所述第一用戶進行確認。
12.根據(jù)權利要求8所述的裝置,其特征在于,所述關聯(lián)信息提取模塊包括: 關鍵詞匹配子模塊,用于將所述第二用戶反饋的所述第二信息與所述第一翻譯信息,進行關鍵詞相似度匹配,提取匹配的關鍵詞作為第一翻譯信息的關聯(lián)信息。
13.根據(jù)權利要求8所述的裝置,其特征在于,所述關聯(lián)信息提取模塊包括: 語言規(guī)則子模塊,用 于根據(jù)當前對話場景中的關鍵詞和、或語言規(guī)則,從所述第二信息中提取第一翻譯信息的關聯(lián)信息。
14.根據(jù)權利要求8或13所述的裝置,其特征在于,還包括: 對話場景確定模塊,用于根據(jù)所述第一識別信息確定當前對話場景,或根據(jù)第一用戶已確認的歷史識別信息中的關鍵詞識別當前對話場景。
【文檔編號】G10L15/01GK103744843SQ201310728312
【公開日】2014年4月23日 申請日期:2013年12月25日 優(yōu)先權日:2013年12月25日
【發(fā)明者】王海峰, 吳華 申請人:北京百度網(wǎng)訊科技有限公司