專利名稱:一種網絡電話語音翻譯系統(tǒng)和翻譯方法
技術領域:
本發(fā)明涉及語音智能翻譯技術,特別涉及一種網絡電話語音翻譯系統(tǒng)和翻譯方 法。
背景技術:
由于網絡的普及現(xiàn)在越來越多的人習慣通過網絡電話的方式互相溝通,但隨著國 家同國家的貿易、交流的不斷發(fā)展和進步,用戶國際化的趨勢必然導致不同國家人們在使 用網絡電話進行溝通時存在語言障礙的問題。以中、英文母語用戶為例,在中國的用戶很少 有人能熟練使用英語和美國人交流,美國人也很少有人懂漢語,于是語言成為國際化交流 的最大障礙。現(xiàn)有的網絡電話中還沒有將語音進行即時翻譯的技術出現(xiàn),而且網絡電話語音即 時翻譯都將會幫助人們進行更方便、更廣泛的無障礙交流。
發(fā)明內容
本發(fā)明的目的在于提供一種網絡電話語音翻譯系統(tǒng),能將即時翻譯技術集成到各 種網絡電話上,從而支持不同語種的網絡電話用戶之間的溝通。本發(fā)明的另一個目的在于提供一種將多語言即時翻譯集成到網絡電話上的方法, 能實現(xiàn)多種語言之間的翻譯轉換,從而支持不同語種的網絡電話用戶之間的溝通。為了達到以上目的本發(fā)明的技術方案是這樣實現(xiàn)的(1) 一種網絡電話語音即時翻譯系統(tǒng),其特征在于,包括多語言翻譯數(shù)據庫單元,用于存儲不同語言的詞庫、短句庫、行業(yè)庫、以及原始文 本信息與所翻譯的目標文本信息之間的翻譯對照關系;翻譯服務器單元,利用多語言翻譯數(shù)據庫單元將語音轉換后的文本翻譯為目標語 言文本;終端應用單元,通過語音轉換單元將輸入或接聽的語音轉化為文本信息,經翻譯 服務器單元翻譯為目標語言文本,后回傳至語音轉換單元轉換為目標語音經由網絡電話信 號發(fā)送端發(fā)送出去。上述技術方案的特點在于(a)所述翻譯服務器單元包括分析模塊,和合成模塊,發(fā)送模塊;其中,分析模塊獲取并分析由語音轉換成的文本信息,從詞法、語法數(shù)據庫單元 中提取所需的原始文本信息與所翻譯的目標文本信息;其中,合成模塊將從詞法、語法數(shù)據庫單元提取的文本信息與翻譯的目標文本信 息,依照語法規(guī)則和語言習慣,合成目標語言;其中,發(fā)送模塊用于發(fā)送合成的目標語言到語音處理單元。(b)所述詞法、語法數(shù)據庫單元包括翻譯對照數(shù)據庫,用于存儲輸入的語音轉換 得到的原始文本信息與所翻譯的目標文本信息之間的翻譯對照關系;所述翻譯對照數(shù)據庫包括第一語言向第二語言對照數(shù)據庫,和第二語言向第一語言對照數(shù)據庫。(c)所述終端應用單元還可以選擇性包括輸入語音的目標翻譯語言設置及語音段落的開始和結束標記。錄入或接聽語音的設置模塊,可以設置語音的語速快慢和音量大小。(2) 一種網絡電話語音即時翻譯方法,其特征在于,包括以下步驟終端用戶設定 好目標語言后,由語音處理單元將終端用戶的語音轉換為文本信息,再由翻譯服務單元將 得到的文本翻譯為目標語言文本,并返回語音處理單元處理為目標語音,語音處理單元將 目標語音結果發(fā)送到網絡電話信號發(fā)送端口最終到對端網絡電話聽筒;或終端用戶聽到對 端語音信息,首先語音處理單元對對端語音進行文本轉換然后通過翻譯服務單元轉換為目 標文本,最后通過語音處理單元處理輸出到終端用戶聽筒。
圖1為一種網絡電話語音即時翻譯系統(tǒng)2為網絡電話語音即時翻譯數(shù)據流圖
具體實施例方式本發(fā)明的核心思想是在現(xiàn)有網絡電話中集成不同語言間的語音翻譯功能,由翻 譯服務器單元對輸入用戶錄入的語音信息進行翻譯,或對對端用戶發(fā)來的語音信息進行翻 譯,從而實現(xiàn)對不同語言的網絡電話用戶進行通話的支持。參照圖1,本發(fā)明的網絡電話語音翻譯系統(tǒng)包括翻譯服務器單元,終端應用單 元。翻譯服務器單元進一步包括中央處理單元4、分析處理單元5、合成單元7,詞法、語法 數(shù)據庫單元6。其中,單元4用于處理來自終端的翻譯請求,并在翻譯完成后返回翻譯結果。 單元5獲取并分析語音轉換原始文本,按照分析結果,依據處理規(guī)則,從詞法、語法數(shù)據庫 提取所需的文本信息。單元7將從數(shù)據庫提取的文本信息,依照語法規(guī)則,和語言習慣,合 成目標文本。單元6,詞法、語法數(shù)據庫包括,翻譯對照數(shù)據庫包括第一語言向第二語言對照 數(shù)據庫和,第二語言向第一語言對照庫。終端應用單元進一步包括目標語言選擇單元1, 語音輸入單元2,語音處理單元3。其中,單元1用于設置目標翻譯語言;單元2用于判斷語 音輸入段落的開始與結束;單元3用于將輸入端的語音轉化成為文本信息,同時將翻譯的 目標語言文本轉化成為語音發(fā)送給網絡電話信號發(fā)送端。本發(fā)明中,所述數(shù)據庫6存儲的翻譯對照關系可存儲于翻譯對照表中,所述翻譯 對照表包括第一語言向第二語言的翻譯對照表、或第二語言向第一語言的翻譯對照表,也 可以同時具有第一語言向第二語言的翻譯對照表和第二語言向第一語言的翻譯對照表。相 應的,網絡電話的翻譯單元6可以僅具有第一語言到第二語言的翻譯功能、或第二語言到 第一語言的翻譯功能,也可以同時具有第一語言到第二語言的翻譯功能和第二語言到第一 語言的翻譯功能。這里,所述第一語言可以是中文、英文等等;與之對應,第二語言可以是英文、中文 等等。那么,所述數(shù)據庫中存儲的翻譯對照表為中文與外文之間的翻譯對照表,用于將中 文翻譯成外文;或為外文與中文之間的翻譯對照表,用于將外文翻譯成中文;或為中文與 外文之問互譯的翻譯對照表,既能將中文翻譯成外文,又能將外文翻譯成中文。
本發(fā)明中,數(shù)據庫6主要存儲基于語料的類庫,所謂基于語料的類庫是指基于設 置一個含有各種句型的原始文本信息和目標文本信息雙語對照的語料類庫。在翻譯時,從 語料類庫中抽取與輸入原始語音信息中句子相類似的句子,然后模仿例句來實現(xiàn)原始語音 信息到目標語音信息的轉換。而且,由于數(shù)據庫中存儲對應的詞庫,因此,翻譯語言的種類 是可以根據不同網絡電話用戶進行選擇的。這里,不同網絡電話用戶可以是不同國家的使 用者。如果原始語音信息采用的是第一語言,則目標語音信息采用第二語言;反之,如果原 始語音信息采用的是第二語言,則目標語音信息采用第一語言。對于網絡電話即時語音翻譯系統(tǒng)中的任意兩個網絡電話用戶而言,發(fā)送語音信息 的可稱為本端即時語音終端,接收語音信息的可稱為對端即時語音終端,本端即時語音終 端與對端即時語音終端通過Internet相連。在本發(fā)明的翻譯平臺中中,可以在一個網絡電 話中集成翻譯功能,也可以在兩個網絡電話皆集成翻譯功能。也就是說,上面所述的終端應 用單元可以僅設置于本端即時語音終端中、或是僅設置于對端語音通訊終端中,也可以同 時設置于本端即時語音終端和對端即時語音終端中。本發(fā)明中翻譯平臺中,任意一個即時語音終端應用可以采用圖1所示的結構。具 體來說,本發(fā)明的終端應用在實際應用中可采用以下幾種基本架構①本端即時語音終端 采用圖1所示結構,對端網絡電話保持不變;②本端即時語音終端保持不變,對端即時語音 終端采用圖1所示結構;③本端即時語音終端和對端即時語音終端均采用圖1所示的結構, 即每個即時通訊終端都能支持第一語言到第二語言的翻譯、以及第二語言到第一語言的 翻譯。對于每個采用圖1結構的即時語音終端,還可以進一步設置選擇發(fā)送設置模塊、 翻譯設置模塊等。基于上述多語言翻譯平臺,本發(fā)明所提供的多語言翻譯平臺方法為先將原始語 音信息翻譯為目標語音信息,再發(fā)送。具體有兩種實現(xiàn)方式一種方式是,本端即時語音終端接收用戶輸入的原始語音 信息,并將原始語音信息翻譯為目標語音信息,之后,將目標語音信息通過網絡電話發(fā)送給 對端即時語音終端。另一種方式是本端即時語音終端接收對端即時語音終端發(fā)出的原 始語音信息,并將原始語音信息翻譯為目標語音信息,之后,將目標語音信息提供給本端用 戶。針對上述多語言即時語音方法的兩種實現(xiàn)方式,該方法進一步包括預先設置需 翻譯到的目標語言;具體來說,在語音發(fā)送前通過網絡電話功能鍵設置來確定發(fā)送端與對端的語言類 型,這樣在發(fā)送語音和接收語音信息時語音轉化單元可以依據初始設定而自動進行轉換。上述網絡電話即時語音翻譯方法的實現(xiàn)方式中,所述翻譯具體為本端分析處理 單元5,將處理由語音處理單元經中央處理單元傳入的文本信息,然后將結果送入詞法、語 法數(shù)據庫單元通過分析后經由合成單元合成目標語言文本信息。合成單元的結果通過中央 處理單元進入語音處理單元最后合成目標語音,最后通過網絡電話發(fā)送給對端用戶。這里,分析處理單元5獲取原始語音對應的文本信息,并根據數(shù)據庫6中存儲的原 始文本信息與目標文本信息之間的翻譯對照關系,將原始文本信息翻譯為目標文本信息的 過程,可采用的翻譯方式有多種,比如既可以采用歸屬于傳統(tǒng)派的翻譯方式,包括直接翻譯法(Direct Translation)、中間語 g法(Intel Lingual Approach)、轉換法(Transfer Approach.);又可以采用基于類庫、歸屬于現(xiàn)代派的翻譯方式其中,直接翻譯法是指將原始語音對應的文本信息中的單詞、固定詞組或句子直 接置換成目標文本信息中的對應成分。中間語言法是指先對原始語音對應的文本信息中的單詞、固定詞組或句子進行 分析,再轉換成對所有目標文本信息都適合的一種句法,即語義表示,并根據語義表示生 成任何一種目標文本信息。轉換法是指采用兩種內部表達并按三個階段進行翻譯,第一個階段把原始語音 對應的文本信息轉換成原始語音對應的文本信息的內部表達,第二階段把原始語音對應的 文本信息的內部表達轉換成目標文本信息的內部表達,第三階段再根據目標文本信息的內 部表達生成目標文本信息。本發(fā)明的網絡電話語音翻譯方法中,當存在多種目標語言可供選擇時,在進行查 詢之前還需先設置要翻譯出發(fā)語言和的目標語言,之后,分析處理單元根據設置到相應的 數(shù)據庫中進行查詢。比如當前設置有英文數(shù)據庫、韓文數(shù)據庫,如果當前設置的目標語言 是英文,則分析處理單元會以原始語音對應的文本信息為索在英文數(shù)據庫中進行查詢,獲 得目標文本信息。通常,可以確定一種語言為默認的目標語言,比如英語,如果沒有設置目 標語言,則翻譯時均翻譯為英語。實施例一本實施例中,第一語言為中文,原始語音信息采用中文語音輸入;第二語言為英 文,目標語音信息采用英文發(fā)音。所述翻譯功能在發(fā)送語音前由本端即時語音翻譯服務器 翻譯完成,所述翻譯單元及數(shù)據庫設置于翻譯服務器中,翻譯的目標語言設置默認為英文, 即將中文翻譯為英文。也就是說,本實施例中發(fā)送方提供翻譯功能,接收方不提供翻譯功 能。圖2所示為本實施例所采用的網絡電話語音翻譯平臺,發(fā)送語音的本端采用圖1 所示的即時語音翻譯結構。那么,本端即時語音錄入的原始語音信息為“早上好”時,本實 施例中語音翻譯平臺方法的處理流程為步驟1、本地用戶通過網絡電話錄入語音信息“早上好”,此時語音信息進入到圖2 中的語音處理單元1中轉換成對應的文本信息。步驟2、語音處理單元1將轉換后的文本信息提交到中央處理單元2。步驟3、中央處理單元2對原始文本進行預處理后發(fā)送給分析處理單元3,根據默 認的目標語言將中文翻譯到英文。具體為分析單元3以原始文本信息為索引通過詞法、 語法算法進行拆分然后進入數(shù)據庫5的英文庫中進行查詢,獲得目標文本信息為“good morning”,之后將目標文本信息“good morning”發(fā)送給總成處理單元6進行合成,并且,將 目標文本信息“goodmorning”發(fā)送給中央處理單元2,由中央處理單元按照翻譯堆棧序列 表中順序依次將目標文本發(fā)送到語音處理單元1,語音處理單元根據初始語言設置條件將 目標文本轉換為對應的目標語音信息,最后通過網絡電話發(fā)送到對端網絡電話。此時,對端在聽到語音信息后進行回復,當對端在回復過程中本端的語音處理單 元以對端語句中的停頓時間長短為判斷依據來標記語句結束同時給對端用戶一個提示音 表示翻譯中請等待。按照步驟1、2、3的翻譯過程后,對端的回復就會以本端的語言形式輸
6出語音。從而完成不同語言用戶之間的及時語音溝通。以上所述,僅為本發(fā)明的較佳實施例而巳,并非用于限定本發(fā)明的保護范圍。以下是語音轉化為文本信息的部分程序代碼,程序開發(fā)語言為JAVA。Public class MyRec{H創(chuàng)建識別器并對資源進行分配Recognizer recognizer = Central. createRecognizer(null) ;recognizer, allocate ();H添加引擎監(jiān)聽器_來表示錄入語音何時開始,停止等等recognizer. addEngineListene r (engineListener);//讀取語法文件File gf = new FileReader(grammarFile);RuleGrammar rules = recognizer. IoadJSGF(gf);//添加結果監(jiān)聽器rules. addResultListener (new VoiceListener ());Il語音識別器處理變化recognizer. commitChanges ();recognizer. requestFocus ();//開始監(jiān)聽recognizer, resume ();......}以下是接受和處理語音為文本的代碼片段public class VoiceListener extends ResultAdaptor{public void resultAccepted(ResultEvent re){FinalRuleResult result = (FinalRuleResult) re. getSource();//獲取一個檢查語法標記String [] tags = result. getTags ();System, out. println (/r First tag was “ +tags
);}......}
權利要求
一種網絡電話語音翻譯技術,其特征在于,包括語音處理單元,用于將輸入的語音轉換為文本信息,為進入翻譯服務單元做信息輸入準備;同時將轉換后得到的目標文本轉換成對應的目標語音;詞法、語法數(shù)據庫單元,用于存儲不同語言的詞庫、短句庫、行業(yè)庫、以及原始文本信息與所翻譯的目標文本信息之間的翻譯對照關系;翻譯服務器單元,利用多語言詞法、語法數(shù)據庫單元將語音轉換單元得到的文本信息翻譯為目標語言。
2.根據權利要求1所述的一種網絡電話語音翻譯系統(tǒng),其特征在于,所述翻譯服務器 單元包括分析模塊,和合成模塊,發(fā)送模塊;其中,分析模塊獲取并分析由語音轉換成的文本信息,從詞法、語法數(shù)據庫單元中提 取所需的原始文本信息與所翻譯的目標文本信息;其中,合成模塊將從詞法、語法數(shù)據庫單元提取的文本信息與翻譯的目標文本信息, 依照語法規(guī)則和語言習慣,合成目標語言;其中,發(fā)送模塊用于發(fā)送合成的目標語言到語音處理單元。
3.根據權利要求1所述的一種網絡電話語音翻譯系統(tǒng),其特征在于,所述詞法、語法數(shù) 據庫單元包括翻譯對照數(shù)據庫,用于存儲輸入的語音轉換得到的原始文本信息與所翻譯 的目標文本信息之間的翻譯對照關系;所述翻譯對照數(shù)據庫包括第一語言向第二語言對照 數(shù)據庫,和第二語言向第一語言對照數(shù)據庫。
4.根據權利要求1所述的一種網絡電話語音翻譯系統(tǒng),其特征在于,發(fā)送語音設置模 塊,設置語音的語速快慢和音量大小。
5.一種網絡電話語音翻譯方法,其特征在于,包括以下步驟終端用戶設定好目標語 言后,由語音處理單元將終端用戶的語音轉換為文本信息,再由翻譯服務單元將得到的文 本翻譯為目標語言文本,并返回語音處理單元處理為目標語音,語音處理單元將目標語音 結果發(fā)送到發(fā)送端口最終到對端;或終端用戶聽到對端語音信息,首先語音處理單元對對 端語音進行文本轉換然后通過翻譯服務單元轉換為目標文本,最后通過語音處理單元處理 輸出到終端用戶。
6.根據權利要求5所述的一種網絡電話語音翻譯方法,其特征在于,錄入的語音信息 的輸入目標語音前,先設置目標語言、轉換,再發(fā)送。
全文摘要
本發(fā)明涉及網絡電話語音翻譯技術,它是一種語音識別系統(tǒng)和語音翻譯的方法,其核心思想是在現(xiàn)有的網絡電話安裝具有語音翻譯功能的軟件,由翻譯服務單元對通過語音識別系統(tǒng)獲取的信息進行翻譯并將翻譯結果發(fā)送給對端,同時對對端的語音信息進行同樣處理,從而實現(xiàn)對不同語言用戶通過語音翻譯技術進行網絡電話語音交流。
文檔編號H04M3/42GK101957813SQ20091002334
公開日2011年1月26日 申請日期2009年7月16日 優(yōu)先權日2009年7月16日
發(fā)明者劉越, 韓西杰 申請人:劉越;韓西杰