專利名稱:語音字典形成方法、語音識(shí)別系統(tǒng)及其方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種將輸入手持移動(dòng)終端或計(jì)算機(jī)的語音轉(zhuǎn)成中文文本的語音識(shí)別系統(tǒng)和方法。
背景技術(shù):
現(xiàn)有技術(shù)向手持移動(dòng)終端或計(jì)算機(jī)輸入中文文本方式有多種,這些類輸入方式在不斷的完善和發(fā)展,但是,這些輸入法在使用中普遍不夠快速。目前向手持移動(dòng)終端或計(jì)算機(jī)輸入中文信息的方式有以下幾種方式。
第一類是系統(tǒng)基于把中文漢字分解成圖形成分,把不同的圖形成分分配到相應(yīng)的按鍵上,這樣通過一次或幾次敲擊按鍵把圖形成分輸入系統(tǒng),實(shí)現(xiàn)漢字的輸入。漢字的輸入是需要我們對(duì)漢字的字型結(jié)構(gòu)了解,同時(shí)要對(duì)按鍵和相應(yīng)的圖形成分的布局很了解的前提下才能較快速的向手持移動(dòng)終端或計(jì)算機(jī)輸入中文漢字。這種輸入方式的缺點(diǎn)是這種漢字圖形的組合是要靠人工來實(shí)現(xiàn)的,在輸入漢字的時(shí)候腦子同時(shí)要想字型的圖形成分和該字成分相時(shí)應(yīng)按鍵的位置,所以對(duì)大部分的普通用戶來說其輸入的效率是很低的。
第二類是系統(tǒng)基于中文漢字拼音的法則,這種是通過向系統(tǒng)輸入漢字的拼音,這是專業(yè)的打字員常采用的方式,這種拼音輸入法是現(xiàn)在比較普遍的輸入漢字的方式,前提也是要求我們對(duì)每個(gè)漢字的拼音了解。這種方式存在的問題我們?cè)谳斎霛h字時(shí)腦子要想漢字的拼音和相對(duì)應(yīng)的拼音所在按鍵,另外這種輸入發(fā)也要靠人工敲擊按鍵實(shí)現(xiàn)操作。所以對(duì)大部分的普通用戶來說其輸入的效率是不夠理想的。
第三類是系統(tǒng)把語音-字符輸入和外加的非語音字符結(jié)合起來的輸入法,把非語音加到語音符號(hào)上以來區(qū)別發(fā)音相同的字符。例子包括有字根標(biāo)志的語音拼寫(1985年11月20日授權(quán)的英國專利2,158,776)和帶有筆畫數(shù)的語音拼寫(1992年11月25日授權(quán)的,中國專利1,066,518)。
這些方法要記住認(rèn)為的規(guī)則或要求計(jì)算筆畫數(shù),后者明顯降低了輸入的速度。
第四類是美國國際商業(yè)機(jī)器公司IBM在中國申請(qǐng)的專利號(hào)為96105876.5,專利名為“處理中文文本的系統(tǒng)和方法”。這種輸入法是將語音中文(拼音和BPMF)輸入計(jì)算機(jī)并轉(zhuǎn)換成漢字形式。該系統(tǒng)帶有發(fā)音符號(hào)鍵(以及對(duì)應(yīng)的ASCII編碼)的新穎鍵盤,從而允許用戶利用指示音節(jié)聲調(diào)的發(fā)音符號(hào)注釋各個(gè)所輸入的語音文本音節(jié)。該系統(tǒng)基于中文漢字讀音和漢字讀音聲調(diào)相結(jié)合的輸入方式,他提供了一種比較詳細(xì)的解決漢字輸入的方式,理論上看是要比前面幾種輸入方式更有效,如果按照這種輸入方式一個(gè)一個(gè)的輸入中文漢字,那么準(zhǔn)確率會(huì)較高。但是實(shí)際上此輸入方式是缺少對(duì)中國人民使用漢字的習(xí)慣的了解,因?yàn)橹袊拇蟛糠秩嗽谌粘J褂闷胀ㄔ掃^程中很少考慮中文字的聲調(diào),對(duì)大部分的普通用戶來說很難去適應(yīng)這種使用方式。這么一種不適應(yīng)中國大眾使用習(xí)慣的輸入方式對(duì)中國人來說其輸入效率是很低的。
有關(guān)于中文語音輸入轉(zhuǎn)換成中文文本的方式,中國專利局授予諾基亞有限公司專利號(hào)為02106017.7,發(fā)明名稱為“短信息消息業(yè)務(wù)方法、裝置及系統(tǒng)”。這個(gè)發(fā)明主要解決的問題是發(fā)送短語音消息的解決方案。在這份專利文件里面提到可以把短語音信號(hào)存儲(chǔ)在手機(jī)里,通過語音識(shí)別軟件把口述的語音信號(hào)轉(zhuǎn)換成文本,內(nèi)容里僅僅是提到用語音識(shí)別軟件翻譯,沒有公布出如何識(shí)別翻譯的技術(shù)方案。
發(fā)明內(nèi)容為了克服現(xiàn)有技術(shù)語音轉(zhuǎn)換為文本效率低的技術(shù)問題,本發(fā)明提供一種可為高效實(shí)現(xiàn)語音換為文本提供基礎(chǔ)的語音字典形成方法。
為了克服現(xiàn)有技術(shù)語音轉(zhuǎn)換為文本效率低的技術(shù)問題,本發(fā)明提供一種可高效實(shí)現(xiàn)語音轉(zhuǎn)換為文本的語音識(shí)別方法。
為了克服現(xiàn)有技術(shù)語音轉(zhuǎn)換為文本效率低的技術(shù)問題,本發(fā)明提供一種可高效實(shí)現(xiàn)語音轉(zhuǎn)換為文本的語音識(shí)別系統(tǒng)。
本發(fā)明解決上述第一技術(shù)問題所采用的技術(shù)方案是提供一種語音字典形成方法,包括A、整理日常生活中常會(huì)組合在一起使用的文字;B、將所述文字的標(biāo)準(zhǔn)讀音通過音節(jié)代碼存儲(chǔ)。
本發(fā)明解決上述第二技術(shù)問題所采用的技術(shù)方案是提供一種語音識(shí)別方法,包括A、輸入語音;B、進(jìn)行語音分析,比對(duì)輸入語音形成的代碼和語音字典里的語音代碼,所述語音字典里的語音代碼是通過存儲(chǔ)日常生活中常會(huì)組合在一起使用的文字的標(biāo)準(zhǔn)讀音而得到;C、輸出比對(duì)所得到語音代碼的對(duì)應(yīng)文本。
本發(fā)明解決上述第三技術(shù)問題所采用的技術(shù)方案是提供一種語音識(shí)別系統(tǒng),包括順序連接的語音輸入模塊、語音識(shí)別模塊和輸出模塊、以及安裝有語音字典的標(biāo)準(zhǔn)語音模塊,語音識(shí)別模塊和所述標(biāo)準(zhǔn)語音模塊連接,其根據(jù)每個(gè)字或幾個(gè)字的讀音給出相應(yīng)可供選擇的文本,所述語音字典里的語音代碼是通過存儲(chǔ)日常生活中常會(huì)組合在一起使用的文字的標(biāo)準(zhǔn)讀音而得到。
相對(duì)于現(xiàn)有技術(shù),本發(fā)明語音字典形成方法的有益效果是由于一、大部分人對(duì)文字的記憶是通過記住文字讀音來實(shí)現(xiàn),大部分人在日常的語言交流中很少有聲調(diào)的概念;二、大部人對(duì)單個(gè)字的含義的意識(shí)比較弱,在日常的語言交流大部分是都通過短語、句子來實(shí)現(xiàn)溝通的。本發(fā)明就是基于人們使用語言的上述習(xí)慣,把日常生活中常會(huì)組合在一起使用的文字的標(biāo)準(zhǔn)讀音存儲(chǔ)成語音字典,按照日常生活中的語言使用習(xí)慣向系統(tǒng)輸入準(zhǔn)確的讀音,只要輸入的語音符合語音字典里對(duì)應(yīng)常用詞或句的讀音,就可以識(shí)別出輸入的語音,轉(zhuǎn)換成相應(yīng)的文本,大大地提高語音轉(zhuǎn)換成文本的速度。
相對(duì)于現(xiàn)有技術(shù),本發(fā)明語音識(shí)別方法的有益效果是由于一、大部分人對(duì)文字的記憶是通過記住文字讀音來實(shí)現(xiàn),大部分人在日常的語言交流中很少有聲調(diào)的概念;二、大部人對(duì)單個(gè)字的含義的意識(shí)比較弱,在日常的語言交流大部分是都通過短語、句子來實(shí)現(xiàn)溝通的。本發(fā)明就是基于人們使用語言的上述習(xí)慣,把日常生活中常會(huì)組合在一起使用的文字的標(biāo)準(zhǔn)讀音存儲(chǔ)成語音字典,按照日常生活中的語言使用習(xí)慣向系統(tǒng)輸入準(zhǔn)確的讀音,只要輸入的語音符合語音字典里對(duì)應(yīng)常用詞或句的讀音,就可以識(shí)別出輸入的語音,轉(zhuǎn)換成相應(yīng)的文本,大大地提高向手持移動(dòng)終端或計(jì)算機(jī)輸入文本文字的速度,不需要現(xiàn)有技術(shù)配合鍵盤輸入的復(fù)雜的方法。
相對(duì)于現(xiàn)有技術(shù),本發(fā)明語音識(shí)別系統(tǒng)的有益效果是由于一、大部分人對(duì)文字的記憶是通過記住文字讀音來實(shí)現(xiàn),大部分人在日常的語言交流中很少有聲調(diào)的概念;二、大部人對(duì)單個(gè)字的含義的意識(shí)比較弱,在日常的語言交流大部分是都通過短語、句子來實(shí)現(xiàn)溝通的。本發(fā)明就是基于人們使用語言的上述習(xí)慣,把日常生活中常會(huì)組合在一起使用的文字的標(biāo)準(zhǔn)讀音存儲(chǔ)成語音字典安裝在標(biāo)準(zhǔn)語音模塊里,按照日常生活中的語言使用習(xí)慣向系統(tǒng)輸入準(zhǔn)確的讀音,只要輸入的語音符合語音字典里對(duì)應(yīng)常用詞或句的讀音,就可以識(shí)別出輸入的語音,轉(zhuǎn)換成相應(yīng)的文本,大大地提高向手持移動(dòng)終端或計(jì)算機(jī)輸入文本文字的速度,相對(duì)現(xiàn)有技術(shù)配合鍵盤輸入的復(fù)雜系統(tǒng),本發(fā)明語音識(shí)別系統(tǒng)簡(jiǎn)單高效。
圖1是本發(fā)明語音識(shí)別系統(tǒng)的電路示意圖2是本發(fā)明語音字典形成方法的流程圖;圖3是本發(fā)明語音識(shí)別方法的流程圖。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施方式對(duì)本發(fā)明進(jìn)一步說明。
參見圖1,本發(fā)明語音識(shí)別系統(tǒng)100包括順序連接的語音輸入模塊10、語音轉(zhuǎn)換前處理模塊20、語音識(shí)別模塊30、語音后處理模塊40、語音數(shù)據(jù)轉(zhuǎn)換成文本數(shù)據(jù)庫模塊60、存儲(chǔ)模塊70和輸出模塊90。還包括標(biāo)準(zhǔn)語音模塊50和文本處理模塊80,語音識(shí)別模塊30和所述標(biāo)準(zhǔn)語音模塊50與語音數(shù)據(jù)轉(zhuǎn)換成文本數(shù)據(jù)庫模塊60連接,文本處理模塊80連接存儲(chǔ)模塊70。
語音輸入模塊10把語音輸入系統(tǒng);語音轉(zhuǎn)換前處理模塊20用以去除噪音,進(jìn)行語音分析;語音識(shí)別模塊30配合標(biāo)準(zhǔn)語音模塊50根據(jù)每個(gè)字或幾個(gè)字的讀音給出相應(yīng)可供選擇的文本;標(biāo)準(zhǔn)語音模塊50安裝有語音字典,所述語音字典里的語音代碼是通過存儲(chǔ)日常生活中常會(huì)組合在一起使用的文字的標(biāo)準(zhǔn)讀音而得到。
語音后處理模塊40根據(jù)前后不同間隔的語音對(duì)比,進(jìn)行語法、語義分析,找出最合乎邏輯的詞;語音數(shù)據(jù)轉(zhuǎn)換成文本數(shù)據(jù)庫模塊60通過存有語音詞典的標(biāo)準(zhǔn)語音模塊50把輸入的語音轉(zhuǎn)換成文本,提供文本特征數(shù)據(jù);存儲(chǔ)模塊70將語音轉(zhuǎn)換成文本的數(shù)據(jù)存儲(chǔ);文本處理模塊80對(duì)存儲(chǔ)模塊70里給出的文本進(jìn)行修改、移動(dòng)、復(fù)制等等文本編輯操作;輸出模塊90則將語音轉(zhuǎn)換成文本的數(shù)據(jù)按所要求的格式輸出。
本發(fā)明可應(yīng)用于中文漢字輸入手持移動(dòng)終端或計(jì)算機(jī)文字輸入等需要文字輸入的設(shè)備。以下以中文漢字輸入手持移動(dòng)終端為例,具體說明本發(fā)明。
首先,形成語音識(shí)別所需要的語音字典(參閱圖2),包括步驟A、整理日常生活中常會(huì)組合在一起使用的中文文字701;B、將所述文字的標(biāo)準(zhǔn)普通話讀音通過音節(jié)代碼存儲(chǔ)702。
這套語音詞典的結(jié)構(gòu)編排上根據(jù)中國人使用中文的習(xí)慣排列。這種使用習(xí)慣指的是在當(dāng)代中文漢語已經(jīng)形成約定成俗的短語、成語、典故、名人名字、名人名句、著名的地名、學(xué)校名、風(fēng)景區(qū)名、句子等等凡是在日常生活中常會(huì)組合在一起使用的中文漢字。
所述中文語音音節(jié)代碼的存儲(chǔ)方式都以一個(gè)單位(一個(gè)單位指的是一個(gè)代碼串)方式存儲(chǔ)。例“中國”就把中國兩個(gè)字的讀音音節(jié)代碼存儲(chǔ)成一個(gè)單位;“乘風(fēng)破浪”就把乘風(fēng)破浪四個(gè)字的讀音音節(jié)存儲(chǔ)成一個(gè)單位;“三人行,必有我?guī)煛卑讶诵?,必有我?guī)熎邆€(gè)字的讀音音節(jié)存儲(chǔ)成一個(gè)單位;“志當(dāng)存高遠(yuǎn)”把志當(dāng)存高遠(yuǎn)存儲(chǔ)在一個(gè)單位;“諸葛亮”把諸葛亮存儲(chǔ)成一個(gè)單位等等。這種結(jié)構(gòu)的排列會(huì)大大的提高工作效率。然后,在詞典中文語音音節(jié)代碼排列上根據(jù)使用習(xí)慣分成不同的組別,每個(gè)組別的排列的秩序默認(rèn)為根據(jù)日常使用的頻率排列,使用頻率越高地越排列在前面。例如輸入“乘風(fēng)破浪”四個(gè)字的讀音,系統(tǒng)提供的供選擇的文本是從所有四個(gè)字組成的代碼串里選擇與“乘風(fēng)破浪”最接近的讀音,越接近的越排列在前面。同時(shí)也有一組所有詞典里的漢字都以單個(gè)字為一個(gè)單位存儲(chǔ)的組,以備單個(gè)字音的輸入。
語音詞典是標(biāo)準(zhǔn)的普通話口語語音,語音識(shí)別兼容男女老少不同的聲線、音量。假如使用者不會(huì)說普通話語音,系統(tǒng)仍然根據(jù)中文語音詞典音節(jié)對(duì)輸入的“方言語音”音節(jié)按中文語音詞典音節(jié)進(jìn)行語音翻譯轉(zhuǎn)換成文本,掌握該“方言語音”的人能看明白該文本。
其次,進(jìn)行語音識(shí)別(參閱圖3)。一句語音輸入手持移動(dòng)終端或計(jì)算機(jī)后,幾秒鐘(用戶可以根據(jù)需要調(diào)整系統(tǒng)設(shè)置的時(shí)間)后系統(tǒng)自動(dòng)進(jìn)入默認(rèn)為對(duì)輸入的語音音節(jié)進(jìn)行文本轉(zhuǎn)換801。也可以通過一個(gè)向系統(tǒng)輸入一個(gè)命令來執(zhí)行,其方法流程如下A、輸入語音802,按確認(rèn)鍵讓系統(tǒng)確認(rèn)要處理的″數(shù)量″803,由語音輸入模塊10完成B、進(jìn)行語音分析,比對(duì)輸入語音形成的代碼和語音字典里的語音代碼,包括子步驟b1、噪音處理804,由語音轉(zhuǎn)換前處理模塊20處理;b2、進(jìn)行語音分析、語法分析和語境分析805~807,由語音識(shí)別模塊30處理;b3、比對(duì)輸入語音形成的代碼和語音字典里的語音代碼,由語音識(shí)別模塊30處理;b4、語音數(shù)據(jù)轉(zhuǎn)換成文本數(shù)據(jù),由語音數(shù)據(jù)轉(zhuǎn)換成文本數(shù)據(jù)庫模塊60處理。
b5、判斷是否幾個(gè)語音連接808,如果是,進(jìn)行動(dòng)態(tài)優(yōu)化切分809,如果否,跳到步驟C;C、輸出比對(duì)所得到語音代碼的對(duì)應(yīng)文本,包括子步驟c1、輸出模塊90的屏幕顯示輸出比對(duì)所得到語音代碼的對(duì)應(yīng)文本和相應(yīng)的操作命令,文本排列順序按使用頻率高低前后排序810;c2、手動(dòng)確認(rèn)選項(xiàng)811;
c3、利用文本處理模塊80進(jìn)行編輯文本812、發(fā)送并存儲(chǔ)文本813、直接存儲(chǔ)文本814或直接發(fā)送文本815的其中一種,如果是進(jìn)行編輯文本812,跳到子步驟c4,如果否,則結(jié)束;c4、直接存儲(chǔ)文本816或直接發(fā)送文本817。
本發(fā)明巧妙地利用人們使用語言的習(xí)慣,把日常生活中常會(huì)組合在一起使用的文字的標(biāo)準(zhǔn)讀音存儲(chǔ)成語音字典,按照日常生活中的語言使用習(xí)慣向系統(tǒng)輸入準(zhǔn)確的讀音,只要輸入的語音符合語音字典里對(duì)應(yīng)常用詞或句的讀音,就可以識(shí)別出輸入的語音,轉(zhuǎn)換成相應(yīng)的文本,大大地提高向手持移動(dòng)終端或計(jì)算機(jī)輸入文本文字的速度,不需要現(xiàn)有技術(shù)配合鍵盤輸入的復(fù)雜的方法。
相對(duì)現(xiàn)有技術(shù)配合鍵盤輸入的復(fù)雜系統(tǒng),本發(fā)明不需要特定的鍵盤配合,語音識(shí)別系統(tǒng)簡(jiǎn)單高效。相對(duì)于現(xiàn)有技術(shù)基于語音字符輸入和外加的非語音字符結(jié)合起來的輸入法,本發(fā)明不需要外加非語音字符結(jié)合,因而簡(jiǎn)單高效,因?yàn)楝F(xiàn)有技術(shù)要記住認(rèn)為的規(guī)則或要求計(jì)算筆畫數(shù),后者明顯降低了輸入的速度。相對(duì)于現(xiàn)有技術(shù)基于中文漢字拼音的法則或把中文漢字分解成圖形成分的方法,本發(fā)明使用語音輸入,極大地提高文字輸入速度,簡(jiǎn)單方便。人類在做一樣事情時(shí),在單位時(shí)間里他的注意力是有限的,本發(fā)明與以往的各種中文輸入系統(tǒng)的方式相比,是最大限度的釋放出手,我們只要把注意力集中在嘴巴的發(fā)音上,按照日常生活中的中文使用習(xí)慣向系統(tǒng)輸入準(zhǔn)確的讀音,會(huì)大大地提高我們向手持移動(dòng)終端或計(jì)算機(jī)輸入中文的速度,尤其適合手機(jī)中文短信息的發(fā)送和網(wǎng)絡(luò)上的中文短信息的交流。
上述的根據(jù)中國人民的使用中文的習(xí)慣,是指一、大部分中國大眾(語言專業(yè)的人士除外)對(duì)中文的記憶是通過對(duì)記住中文讀音,大部分人在日常的中文交流中很少有聲調(diào)的概念,這符合我們的使用習(xí)慣;二、大部分中國大眾(語言專業(yè)的人士除外)對(duì)單個(gè)的中文字的含義的意識(shí)比較弱,在日常的中文交流大部分是都通過短語、句子來實(shí)現(xiàn)溝通的,這也符合我們的使用習(xí)慣。
權(quán)利要求
1.一種語音字典形成方法,包括A、整理日常生活中常會(huì)組合在一起使用的文字;B、將所述文字的標(biāo)準(zhǔn)讀音通過音節(jié)代碼存儲(chǔ)。
2.根據(jù)權(quán)利要求1所述的語音字典形成方法,其特征在于所述語音音節(jié)代碼的存儲(chǔ)方式都以一個(gè)單位方式存儲(chǔ)。
3.根據(jù)權(quán)利要求2所述的語音字典形成方法,其特征在于在詞典語音音節(jié)代碼排列上根據(jù)使用習(xí)慣分成不同的組別,每個(gè)組別的排列的秩序默認(rèn)為根據(jù)日常使用的頻率排列。
4.一種語音識(shí)別方法,包括A、輸入語音;B、進(jìn)行語音分析,比對(duì)輸入語音形成的代碼和語音字典里的語音代碼,所述語音字典里的語音代碼是通過存儲(chǔ)日常生活中常會(huì)組合在一起使用的文字的標(biāo)準(zhǔn)讀音而得到;C、輸出比對(duì)所得到語音代碼的對(duì)應(yīng)文本。
5.根據(jù)權(quán)利要求1所述的語音識(shí)別方法,其特征在于所述步驟B包括子步驟b2、進(jìn)行語音分析、語法分析和語境分析;b3、比對(duì)輸入語音形成的代碼和語音字典里的語音代碼;b4、語音數(shù)據(jù)轉(zhuǎn)換成文本數(shù)據(jù)。
6.根據(jù)權(quán)利要求2所述的語音識(shí)別方法,其特征在于所述步驟B進(jìn)一步包括子步驟b1、噪音處理;b5、判斷是否幾個(gè)語音連接,如果是,進(jìn)行動(dòng)態(tài)優(yōu)化切分,如果否,跳到步驟C。
7.根據(jù)權(quán)利要求3所述的語音識(shí)別方法,其特征在于所述語音識(shí)別方法應(yīng)用在文本信息發(fā)送裝置中,步驟C包括子步驟c1、輸出模塊的屏幕顯示輸出比對(duì)所得到語音代碼的對(duì)應(yīng)文本和相應(yīng)的操作命令,文本排列順序按使用頻率高低前后排序;c2、手動(dòng)確認(rèn)選項(xiàng);c3、進(jìn)行編輯文本、發(fā)送并存儲(chǔ)文本、直接存儲(chǔ)文本或直接發(fā)送文本的其中一種,如果是進(jìn)行編輯文本,跳到子步驟c4,如果否,則結(jié)束;c4、直接存儲(chǔ)文本或直接發(fā)送文本。
8.一種語音識(shí)別系統(tǒng),包括順序連接的語音輸入模塊、語音識(shí)別模塊和輸出模塊、以及安裝有語音字典的標(biāo)準(zhǔn)語音模塊,語音識(shí)別模塊和所述標(biāo)準(zhǔn)語音模塊連接,其根據(jù)每個(gè)字或幾個(gè)字的讀音給出相應(yīng)可供選擇的文本,其特征在于所述語音字典里的語音代碼是通過存儲(chǔ)日常生活中常會(huì)組合在一起使用的文字的標(biāo)準(zhǔn)讀音而得到。
9.根據(jù)權(quán)利要求8所述的語音識(shí)別系統(tǒng),其特征在于進(jìn)一步包括語音轉(zhuǎn)換前處理模塊,其連接所述輸入模塊和語音識(shí)別模塊,用以去除噪音,進(jìn)行語音分析。
10.根據(jù)權(quán)利要求9所述的語音識(shí)別系統(tǒng),其特征在于進(jìn)一步包括語音后處理模塊、語音數(shù)據(jù)轉(zhuǎn)換成文本數(shù)據(jù)庫模塊、存儲(chǔ)模塊以及文本處理模塊,語音后處理模塊連接語音識(shí)別模塊,根據(jù)前后不同間隔的語音對(duì)比,進(jìn)行語法、語義分析,找出最合乎邏輯的詞,語音數(shù)據(jù)轉(zhuǎn)換成文本數(shù)據(jù)庫模塊連接語音后處理模塊和存儲(chǔ)模塊,通過存儲(chǔ)語音詞典的標(biāo)準(zhǔn)語音模塊把輸入的語音轉(zhuǎn)換成文本,提供文本特征數(shù)據(jù),存儲(chǔ)模塊連接輸出模塊和文本處理模塊,將語音轉(zhuǎn)換成文本的數(shù)據(jù)存儲(chǔ),文本處理模塊對(duì)給出的文本進(jìn)行修改、移動(dòng)、復(fù)制。
全文摘要
本發(fā)明涉及一種語音字典形成方法、語音識(shí)別系統(tǒng)及其方法。該系統(tǒng)包括順序連接的語音輸入模塊、語音識(shí)別模塊和輸出模塊、以及安裝有語音字典的標(biāo)準(zhǔn)語音模塊,語音識(shí)別模塊和所述標(biāo)準(zhǔn)語音模塊連接,其根據(jù)每個(gè)字或幾個(gè)字的讀音給出相應(yīng)可供選擇的文本,所述語音字典里的語音代碼是通過存儲(chǔ)日常生活中常會(huì)組合在一起使用的文字的標(biāo)準(zhǔn)讀音而得到。本發(fā)明基于人們使用語言的習(xí)慣,把日常生活中常會(huì)組合在一起使用的文字的標(biāo)準(zhǔn)讀音存儲(chǔ)成語音字典安裝在標(biāo)準(zhǔn)語音模塊里,只要輸入的語音符合語音字典里對(duì)應(yīng)常用詞或句的讀音,就可以識(shí)別出輸入的語音,轉(zhuǎn)換成相應(yīng)的文本,大大地提高向手持移動(dòng)終端或計(jì)算機(jī)輸入文本文字的速度。
文檔編號(hào)G10L15/00GK1901041SQ20051003599
公開日2007年1月24日 申請(qǐng)日期2005年7月22日 優(yōu)先權(quán)日2005年7月22日
發(fā)明者林躍 申請(qǐng)人:康佳集團(tuán)股份有限公司