專利名稱:一種語言轉(zhuǎn)換裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種電子技術(shù),特別是一種可以將使用者所說的某種語言轉(zhuǎn)換成另一種語言、或?qū)⑵渌怂f的語言轉(zhuǎn)換成使用者使用的語言的便攜式語言轉(zhuǎn)換裝置,以及相應(yīng)的語言互譯方法。
背景技術(shù):
說話是人類進(jìn)行交流最直接、最自然的方式,我們?nèi)粘I钪泻艽笠徊糠值男畔⒍际峭ㄟ^說話來進(jìn)行傳遞和獲取的。如果由于某些原因而無法用說話來進(jìn)行交流的話,人與人之間信息傳遞的效率將會大大降低,從而給生活帶來巨大的不便。如不同國家之間的語言的差異,對溝通帶來極大的障礙。而即便是同一國家,因方言的不同,也會帶來溝通上的障礙。我國幅員遼闊,具有眾多的民族,長期以來在各民族聚居的地方形成了多種獨(dú)特的文化,也形成了各種各樣的語言,例如僅在廣東省內(nèi)就存在粵語、潮汕話、客家話、雷州話等多種地區(qū)語言。這些語言雖然大多數(shù)都以中文為基礎(chǔ),但它們通常在發(fā)音、用詞、句式等方面與常用的普通話有著較大的差別,語言與語言之間也存在著許多差異,這使得一個地區(qū)的人如不經(jīng)過學(xué)習(xí)很難聽懂或說另一地區(qū)的本地話。為了消除各地區(qū)語言上的差別,建國以來國家大力推廣普通話教育,取得了很大的成績。但盡管如此,在許多普通話教育還不夠普及的地區(qū),人們?nèi)粘5慕涣魅砸员镜卣Z言為主,不少人甚至還不懂得普通話的聽和說。語言與普通話、語言與語言之間的差異使得來自不同地區(qū)的人常常難以正常地通過說話進(jìn)行交流,種類繁多的語言也使得一般人無法一一學(xué)習(xí)。隨著各地間交往的增多,語言不通日益成為人們出行中的最常遇到的不便之一。解決出行中語言不通的問題目前主要采取兩種方法,其一是大家都說普通話,但這個要求對不少人來說難度較大;或者是找一位懂得兩位說話人使用語言的人作為翻譯, 將兩人的話互譯為對方的語言,但許多情況下這種翻譯并是隨時都能找到的,如在外出旅游時就會經(jīng)常碰到語言不通但又找不到可翻譯的人的情況。當(dāng)然還可以通過寫字、打手勢等非說話的方式進(jìn)行交流,但這些方法與說話相比顯然要麻煩得多,使用起來極為不便。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服不同語言之間的差異所導(dǎo)致的溝通障礙,提供了一種語言轉(zhuǎn)換裝置。為了達(dá)到發(fā)明目的,本發(fā)明采用的技術(shù)方案為
一種語言轉(zhuǎn)換裝置,包括處理器芯片、記憶芯片、語言接收模塊、播放器、擴(kuò)展接口、顯示模塊、選擇電路和譯碼電路組成,所述記憶芯片、語言接收模塊、播放器、擴(kuò)展接口、顯示模塊、選擇電路和譯碼電路均與處理器芯片連接,所述處理器芯片用以處理輸入語言信號、 產(chǎn)生輸出語言信號、控制擴(kuò)展接口與外接設(shè)備之間的通信、對顯示模塊和選擇電路進(jìn)行控制,所述譯碼電路通過地址線與處理器芯片連接,并產(chǎn)生該語言轉(zhuǎn)換裝置所需的片選信號,所述選擇電路能選擇不同語言之間的轉(zhuǎn)換,進(jìn)而使處理器芯片控制對不同語言之間的轉(zhuǎn)換,該語言轉(zhuǎn)換裝置的處理過程包括如下幾個步驟
(1)、建立語言系統(tǒng)
包括建立語言識別模型庫、語言合成模型庫和不同語言文法轉(zhuǎn)換表;
(2)、記錄原始語言信息
通過語言接收模塊記錄現(xiàn)場的原始語言信息;
(3)、識別原始語言信息
處理器芯片根據(jù)步驟(1)所建立的語言識別模型庫識別原始語言信息的內(nèi)容;
(4)、將原始語言信息轉(zhuǎn)換成目標(biāo)語言信息
處理器芯片根據(jù)步驟(1)所建立的語言文法轉(zhuǎn)換表將原始語言信息轉(zhuǎn)換成目標(biāo)語言信
息;
(5)、播放目標(biāo)語言信息
處理器芯片根據(jù)步驟(1)所建立的語言合成模型庫合成目標(biāo)語言信息,并通過播放器將目標(biāo)語言信息播出。本發(fā)明的步驟(1)建立語言系統(tǒng)包括如下步驟
(11)、確定需互譯的語言種類,并根據(jù)實(shí)際的需要確定每種語言的詞匯表和句子列
表;
(12)、根據(jù)每種語言的句子列表,建立語言文法轉(zhuǎn)換表,對于兩種語言之間的互譯,語言文法轉(zhuǎn)換表具體又可分為兩部分,一部分為語言C的句子到語言D的句子的映射,另一部分為語言D的句子到語言C的句子的映射,兩部分均為一張多對一的列表;
(13)、根據(jù)所確定的系統(tǒng)詞匯表,對每種語言的每個詞匯采集訓(xùn)練數(shù)據(jù),采用統(tǒng)計的方法建立語言識別模型庫;
(14)、根據(jù)系統(tǒng)的詞匯表以及所采用的合成方法不同,以語句、短語、詞或音節(jié)為單位, 或音節(jié)、半音節(jié)、音素為單位建立語言合成模型庫,通過對樣本數(shù)據(jù)的編碼分析,得到語言合成所需的模型參數(shù)。本發(fā)明的所述步驟(3)識別原始語言信息A包括如下步驟
(31)采用端點(diǎn)檢測技術(shù),檢測出所錄制聲音中所有語言段的起點(diǎn)和終點(diǎn);
(32)采用關(guān)鍵詞確認(rèn)技術(shù),對所有語言,分別利用其對應(yīng)的語言識別模型庫識別出語言段中包含的系統(tǒng)可識別詞匯,無法識別的詞匯采用特殊的符號來代替,并將每句話的識別結(jié)果按先后順序進(jìn)行排列;
(33)將不同語言識別得到的每句話的內(nèi)容與該語言預(yù)定的句子內(nèi)容進(jìn)行比較,首先找出所有語言中與所記錄語言最匹配的句子,然后將該句子和所記錄語言的匹配程度與一預(yù)先設(shè)定的閾值進(jìn)行比較,如果超過該閾值,則該句子為識別結(jié)果,該句子所屬的語言為當(dāng)前記錄語言的語言,如果少于該閾值,則提示使用者無法識別該段聲音。本發(fā)明所述記憶芯片采用大容量的閃存芯片,且通過地址線、控制線、數(shù)據(jù)線與處理器芯片連接。記憶芯片為語言互譯裝置提供存儲空間。所述的語言接收模塊由麥克風(fēng)和A/D轉(zhuǎn)換器組成,所述的播放器由D/A轉(zhuǎn)換器和揚(yáng)聲器組成,所述的語言接收模塊和播放器均通過數(shù)據(jù)線和控制線與處理器芯片連接。本發(fā)明的語言互譯裝置的擴(kuò)展接口由計算機(jī)接口控制器和計算機(jī)接口共同構(gòu)成,且通過控制線和數(shù)據(jù)線與處理器芯片連接。為處理器芯片和計算機(jī)之間提供接口。所述的擴(kuò)展接口由計算機(jī)接口控制器和計算機(jī)接口共同構(gòu)成,且通過控制線和數(shù)據(jù)線與處理器芯片連接。本發(fā)明的語言互譯裝置的選擇電路由鍵盤陣列和鍵盤控制器組成,且通過數(shù)據(jù)線和控制線與處理器芯片連接。使用者可以通過開關(guān)或按鍵來對語言互譯裝置的狀態(tài)進(jìn)行控制和設(shè)置。本發(fā)明提供的語言互譯裝置可以中文與外文、不同外文之間、以及實(shí)現(xiàn)普通話與語言之間、或語言與語言之間一些常用語的互譯,即可以將接收到的一段常用的普通話或某種語言的語言轉(zhuǎn)換為另一種語言或普通話再進(jìn)行播放,使得使用者無需通過第三者翻譯即可直接與使用其他語言的人進(jìn)行簡單的交談,可有效地解決出行時語言不通的問題。本發(fā)明的有益之處包括
1、利用本發(fā)明,兩個語言不通的人無需通過第三者或?qū)懽?、打手勢等方式即可方便地進(jìn)行一些交1如購物、餐飲等等,有效地改善了人們出行中遇到的語言不通的問題。2、本發(fā)明的電路體積小,重量輕,可以隨身攜帶,方便人們使用。3、通過合理地設(shè)計系統(tǒng)的詞匯和句子,可以方便地設(shè)計出適用于不同場合的語言互譯機(jī),并能實(shí)現(xiàn)多種語言之間的互譯。4、可以通過用計算機(jī)下載更新語言識別模型庫、語言合成模型庫和語言文法轉(zhuǎn)換表的方法,來改變系統(tǒng)適用的語言以及詞匯。
圖1為本發(fā)明提供的語言互譯裝置的結(jié)構(gòu)原理圖。
具體實(shí)施例方式
下面結(jié)合附圖對本發(fā)明做進(jìn)一步的說明。本發(fā)明提供的語言轉(zhuǎn)換裝置的結(jié)構(gòu)原理圖如附圖1所示,由處理器芯片、記憶芯片、語言接收模塊、播放器、擴(kuò)展接口、顯示模塊、選擇電路、譯碼電路組成,所述的記憶芯片、語言接收模塊、播放器、擴(kuò)展接口、顯示模塊、選擇電路、譯碼電路通過地址線、或數(shù)據(jù)線、或控制線與處理器芯片連接。本實(shí)施例的處理器芯片由DSP或MCU芯片構(gòu)成;語言輸入電路由麥克風(fēng)和A/D轉(zhuǎn)換器共同構(gòu)成;語言輸出電路由D/A轉(zhuǎn)換器和揚(yáng)聲器共同構(gòu)成;記憶芯片采用大容量的閃存芯片;擴(kuò)展接口由計算機(jī)接口控制器和計算機(jī)接口共同構(gòu)成,使用者可以通過該接口從計算機(jī)中下載新的語言識別模型庫、語言合成模型庫和語言文法轉(zhuǎn)換表;顯示模塊由LCD 顯示屏和LCD控制器共同構(gòu)成,用以顯示系統(tǒng)當(dāng)前的一些狀態(tài)信息,如時間、互譯語言種類、是否正在翻譯、翻譯時已錄入語言的長短、系統(tǒng)設(shè)置時的菜單等;選擇電路由鍵盤陣列和鍵盤控制器共同構(gòu)成,其中鍵盤陣列中包含一“翻譯”功能按鍵,當(dāng)需要進(jìn)行語言翻譯時, 使用者按住“翻譯”功能鍵并對麥克風(fēng)說話,說完話后,松開“翻譯”功能鍵,互譯機(jī)即自動將使用者所說的話轉(zhuǎn)換為所需的語言,通過互譯機(jī)上的揚(yáng)聲器播放出來;鍵盤陣列上還設(shè)有另一些可對系統(tǒng)狀態(tài)進(jìn)行設(shè)置的按鍵,可通過這些按鍵對系統(tǒng)的一些參數(shù)進(jìn)行設(shè)置,如在系統(tǒng)可以處理多種語言時,設(shè)定當(dāng)前互譯的語言類型。
5
當(dāng)開機(jī)上電后,系統(tǒng)首先進(jìn)行初始化。初始化結(jié)束后,進(jìn)入主程序循環(huán),系統(tǒng)不斷檢測計算機(jī)接口是否與計算機(jī)連接,以及按鍵狀態(tài)。當(dāng)檢測到計算機(jī)接口與計算機(jī)連接后, 則停止其他操作,進(jìn)入聯(lián)機(jī)狀態(tài)。此時使用者可通過計算機(jī)下載新的語言識別模型庫、語言合成模型庫以及語言文法轉(zhuǎn)換規(guī)則表,以更新系統(tǒng)適用的語言或詞匯。當(dāng)使用者完成下載, 并將計算機(jī)與系統(tǒng)斷開連接后,系統(tǒng)退出聯(lián)機(jī)狀態(tài),恢復(fù)正常的操作。如果系統(tǒng)沒有與計算機(jī)連接并有按鍵操作時,判斷使用者是否按下“翻譯”功能鍵,當(dāng)使用者按下“翻譯”鍵時, 進(jìn)行以下操作
1、使用者按下“翻譯”功能鍵的同時,開始在內(nèi)存緩沖區(qū)中對輸入的聲音信號進(jìn)行記錄,當(dāng)使用者放開“翻譯”功能鍵時,停止聲音信號的記錄,啟動語言識別進(jìn)程。由于直接記錄原始聲音信號需要較大的存儲空間,因此先將原始語言信號轉(zhuǎn)換為識別時所需要的語言特征,再對這些語言特征進(jìn)行記錄,這樣可以節(jié)約大量的存儲空間。2、語言識別進(jìn)程中,對記錄下的聲音段進(jìn)行檢測和識別,具體又可以分為以下步驟
(1)采用端點(diǎn)檢測技術(shù),檢測出所錄制聲音中所有語言段的起點(diǎn)和終點(diǎn)。(2)采用關(guān)鍵詞確認(rèn)技術(shù),對系統(tǒng)的所有語言,分別利用其對應(yīng)的語言識別模型庫識別出語言段中包含的系統(tǒng)可識別詞匯,無法識別的詞匯采用特殊的符號來代替,并將每句話的識別結(jié)果按先后順序進(jìn)行排列。(3)將不同語言識別得到的每句話的內(nèi)容與該語言預(yù)定的句子內(nèi)容進(jìn)行比較,首先找出所有語言中與所記錄語言最匹配的句子,然后將該句子和所記錄語言的匹配程度與一預(yù)先設(shè)定的閾值進(jìn)行比較,如果超過該閾值,則該句子為識別結(jié)果,該句子所屬的語言為當(dāng)前記錄語言的語言,如果少于該閾值,則提示使用者無法識別該段聲音。3、根據(jù)語言識別得到的語言種類和句子內(nèi)容,以及系統(tǒng)當(dāng)前設(shè)置的互譯語言種類,利用語言文法轉(zhuǎn)換表,對識別結(jié)果的每個句子轉(zhuǎn)換為另一種語言的句子。4、利用語言合成模型庫,將已經(jīng)轉(zhuǎn)換好的句子用語言合成技術(shù)進(jìn)行合成,并控制播放器進(jìn)行播放,具體又可以分為以下幾個步驟
(1)根據(jù)所需的語言類型和轉(zhuǎn)換好的句子內(nèi)容,在語言合成模型庫中找出所需用到的語言合成模型,并加載這些模型。(2)利用已加載的語言合成模型,用語言合成技術(shù)產(chǎn)生所需要的數(shù)字語言信號。(3)向D/A轉(zhuǎn)換器輸出該語言信號。當(dāng)使用者按下其他功能鍵時,執(zhí)行相應(yīng)的功能操作,例如在系統(tǒng)可以處理多種語言時,對當(dāng)前互譯語言種類的指定等。語言識別模型庫、語言合成模型庫和語言文法轉(zhuǎn)換表由生產(chǎn)廠家以軟件的形式提供給使用者,使用者可以通過互譯機(jī)的計算機(jī)接口從計算機(jī)上下載不同的語言識別模型庫、語言合成模型庫和語言文法轉(zhuǎn)換表。語言識別模型庫、語言合成模型庫和語言文法轉(zhuǎn)換表可以通過以下方法建立
1、確定需互譯的語言種類,并根據(jù)實(shí)際的需要確定每種語言的詞匯表和句子列表。2、根據(jù)每種語言的句子列表,建立語言文法轉(zhuǎn)換表。對于兩種語言之間的互譯,語言文法轉(zhuǎn)換表具體又可分為兩部分,一部分為語言A的句子到語言B的句子的映射,另一部分為語言B的句子到語言A的句子的映射,兩部分均為一張多對一的列表。這是因為不少句子雖然用詞不同,但其意思是一樣的,例如普通話的“請問到北京路怎么走? ”和“北京路怎么去?”意思都是問去北京路的方法,因此轉(zhuǎn)換時可以當(dāng)作一個句子來翻譯。3、根據(jù)所確定的系統(tǒng)詞匯表,對每種語言的每個詞匯采集訓(xùn)練數(shù)據(jù),采用統(tǒng)計的方法建立語言識別模型庫。目前語言識別中最常用的統(tǒng)計模型為HMM,可以采用EM訓(xùn)練方法由訓(xùn)練數(shù)據(jù)得到每個詞匯的HMM模型,語言特征可采用MFCC、LPCC、PLP以及音調(diào)變化軌跡等。在建立系統(tǒng)詞匯表內(nèi)詞匯的語言識別模型的同時,還需建立詞匯表外詞匯的填料模型。4、根據(jù)系統(tǒng)的詞匯表以及所采用的合成方法不同,以語句、短語、詞或音節(jié)為單位 (適用于語言的波形編碼合成法),或音節(jié)、半音節(jié)、音素為單位(適用于語言的參數(shù)分析合成法和規(guī)則合成法)建立語言合成模型庫,通過對樣本數(shù)據(jù)的編碼分析,得到語言合成所需的模型參數(shù)。
權(quán)利要求
1. 一種語言轉(zhuǎn)換裝置,包括處理器芯片、記憶芯片、語言接收模塊、播放器、擴(kuò)展接口、 顯示模塊、選擇電路和譯碼電路組成,所述記憶芯片、語言接收模塊、播放器、擴(kuò)展接口、顯示模塊、選擇電路和譯碼電路均與處理器芯片連接,其特征在于該語言轉(zhuǎn)換裝置的處理過程包括如下幾個步驟(1)、建立語言系統(tǒng)包括建立語言識別模型庫、語言合成模型庫和不同語言文法轉(zhuǎn)換表,進(jìn)一步包括如下步驟(11)、確定需互譯的語言種類,并根據(jù)實(shí)際的需要確定每種語言的詞匯表和句子列表;(12)、根據(jù)每種語言的句子列表,建立語言文法轉(zhuǎn)換表,對于兩種語言之間的互譯,語言文法轉(zhuǎn)換表具體又可分為兩部分,一部分為第一語言的句子到第二語言的句子的映射, 另一部分為第二語言的句子到第一語言的句子的映射,兩部分均為一張多對一的列表;(13)、根據(jù)所確定的系統(tǒng)詞匯表,對每種語言的每個詞匯采集訓(xùn)練數(shù)據(jù),采用統(tǒng)計的方法建立語言識別模型庫;(14)、根據(jù)系統(tǒng)的詞匯表以及所采用的合成方法不同,以語句、短語、詞或音節(jié)為單位, 或音節(jié)、半音節(jié)、音素為單位建立語言合成模型庫,通過對樣本數(shù)據(jù)的編碼分析,得到語言合成所需的模型參數(shù);(2)、記錄原始語言信息通過語言接收模塊記錄現(xiàn)場的原始語言信息;(3)、識別原始語言信息處理器芯片根據(jù)步驟(1)所建立的語言識別模型庫識別原始語言信息的內(nèi)容,進(jìn)一步包括如下步驟(31)采用端點(diǎn)檢測技術(shù),檢測出所錄制聲音中所有語言段的起點(diǎn)和終點(diǎn);(32)采用關(guān)鍵詞確認(rèn)技術(shù),對所有語言,分別利用其對應(yīng)的語言識別模型庫識別出語言段中包含的系統(tǒng)可識別詞匯,無法識別的詞匯采用特殊的符號來代替,并將每句話的識別結(jié)果按先后順序進(jìn)行排列;(33)將不同語言識別得到的每句話的內(nèi)容與該語言預(yù)定的句子內(nèi)容進(jìn)行比較,首先找出所有語言中與所記錄語言最匹配的句子,然后將該句子和所記錄語言的匹配程度與一預(yù)先設(shè)定的閾值進(jìn)行比較,如果超過該閾值,則該句子為識別結(jié)果,該句子所屬的語言為當(dāng)前記錄語言的語言,如果少于該閾值,則提示使用者無法識別該段聲音;(4)、將原始語言信息轉(zhuǎn)換成目標(biāo)語言信息處理器芯片根據(jù)步驟(1)所建立的語言文法轉(zhuǎn)換表將原始語言信息轉(zhuǎn)換成目標(biāo)語言信息;(5)、播放目標(biāo)語言信息處理器芯片根據(jù)步驟(1)所建立的語言合成模型庫合成目標(biāo)語言信息,并通過播放器將目標(biāo)語言信息播出。
全文摘要
本發(fā)明提供一種語言轉(zhuǎn)換裝置,包括處理器芯片、記憶芯片、語言接收模塊、播放器、擴(kuò)展接口、顯示模塊、選擇電路和譯碼電路組成,所述記憶芯片、語言接收模塊、播放器、擴(kuò)展接口、顯示模塊、選擇電路和譯碼電路均與處理器芯片連接,所述處理器芯片用以處理輸入語言信號、產(chǎn)生輸出語言信號、控制擴(kuò)展接口與外接設(shè)備之間的通信、對顯示模塊和選擇電路進(jìn)行控制,所述譯碼電路產(chǎn)生所需的片選信號,所述選擇電路能選擇不同語言之間的轉(zhuǎn)換,進(jìn)而使處理器芯片控制對不同語言之間的轉(zhuǎn)換,所述的譯碼電路通過地址線與處理器芯片連接。
文檔編號G06F17/28GK102567309SQ201010581088
公開日2012年7月11日 申請日期2010年12月9日 優(yōu)先權(quán)日2010年12月9日
發(fā)明者蔡偉俊 申請人:蔡偉俊