專利名稱:語音響應設(shè)備的制作方法
此項發(fā)明是與語音響應設(shè)備有關(guān)的,從更特殊的角度講,此項發(fā)明是和向數(shù)據(jù)處理設(shè)備提供語音識別部件的設(shè)備有關(guān)的。
現(xiàn)在已經(jīng)知道有許多種語音識別設(shè)備,經(jīng)過一定的處理,它們可以識別由特定用戶講出的字母字符和數(shù)字字符。
將這樣的語音識別設(shè)備與現(xiàn)有的一類計算機裝置聯(lián)接起來是不容易的,這類計算機裝置的特點是為了使某個特定程序運行需要用鍵盤輸入信息,例如輸入數(shù)據(jù)字符串。為了使這類裝置能夠響應簡單的語音輸入信息,可能需要廣泛地修改軟件。修改軟件要花費大量的時間,而且要熟練的計算機編程員付出艱苦的勞動。
此項發(fā)明的目的是向這類計算機裝置提供一種適用于進行語音輸入的系統(tǒng),而且不需要廣泛地修改軟件。
按照此項發(fā)明,語音響應設(shè)備插在手動鍵盤的輸出部位,(在操作手動鍵盤時,鍵盤輸出數(shù)字編碼信號,這些信號代表了多個鍵盤字符的組合)和數(shù)據(jù)處理設(shè)備的輸入部位之間,這樣就有了一個語音識別部件,在這個部件中,有一個比較裝置用來將數(shù)字信號(來源于所講的詞或短語有關(guān)的音頻輸入信號)與多個用數(shù)字據(jù)表示的詞(以后簡稱數(shù)據(jù)詞)進行比較,這些數(shù)據(jù)詞放在可編程的語音信號數(shù)據(jù)存儲器中(這里的數(shù)據(jù)詞代表了真實的單詞或短語),如果有可能的話,比較系統(tǒng)還用于確定已經(jīng)講了哪個單詞或短語并用于給翻譯系統(tǒng)提供信號,此時,這些信號等同于已講的單詞或短語,翻譯系統(tǒng)對來自比較系統(tǒng)的信號產(chǎn)生響應,以根據(jù)第二個可編程的數(shù)據(jù)存儲器中找出數(shù)據(jù)(代表與之等價的多次鍵盤操作,此鍵盤是與該設(shè)備相連的)并使信號發(fā)送系統(tǒng)輸出一串數(shù)字編碼信號,這些信號代表了等價的多次鍵盤操作。
可以安裝這臺設(shè)備使之達到如下目的當它對由已講出的一串真實單詞組成的音頻輸入信號產(chǎn)生響應時,相互關(guān)聯(lián)的翻譯信號序列(對上述真實單詞進行翻譯得到的信號)產(chǎn)生了代表所講單詞中的數(shù)據(jù)信號輸出序列。音頻輸入信號中預定寬度的無聲暫停段至少可以部分地確定翻譯信號間的相互關(guān)聯(lián)性。此外,(也可以說或者),音頻輸入信號中預定的音調(diào)變化也可以至少部分地確定了翻譯信號間的相互關(guān)聯(lián)性。
也可以安裝這臺設(shè)備使之達到如下目的從數(shù)據(jù)處理設(shè)備接收到的信息可以部分地確定數(shù)據(jù)信號的輸出序列。
可以提供開關(guān)部件,此設(shè)備在第一種狀態(tài)(開關(guān)部件從上述方式動作)和第二種狀態(tài)(開關(guān)部件允許在數(shù)據(jù)處理設(shè)備和鍵盤之間進行直接通訊)下產(chǎn)生響應。
此設(shè)備可以包括一個存儲器,存儲代表此設(shè)備字符輸出的數(shù)據(jù),存儲是在開關(guān)部件處于第一種狀態(tài)時進行的,這樣,當開關(guān)部件處于第二種狀態(tài)時,此設(shè)備使與鍵盤相連的顯示器顯示出正確的數(shù)據(jù)記錄(數(shù)據(jù)來自或使輸?shù)綌?shù)據(jù)處理設(shè)備)。
本文用例子并參照下列附圖來描述本發(fā)明中的語音響應設(shè)備。
圖1是一張典型的且與此設(shè)備一起使用的計算機裝置方塊示意圖;
圖2和圖3分別是圖1中的計算機裝置與兩種不同的無關(guān)語音響應設(shè)備(本發(fā)明中的兩種設(shè)備)相連的方塊示意圖;
圖4是一張方塊示意圖,更詳細地示出了圖2中的語音響應設(shè)備;
圖5是另一張方塊示意圖,按照此發(fā)明圖解設(shè)備;
圖6是解圖5中設(shè)備特點的流圖。
先看圖1,此設(shè)備與典型的計算機裝置(圖中標1的部件)一起使用,此裝置與一個或多個人機接口(例如視頻顯示器和鍵盤2)相連。如圖所示,通過數(shù)據(jù)母線3和3′以及插銷4和插座4′來聯(lián)接視頻顯示器2或者通過一個接通的電話環(huán)節(jié)與遠處的能夠存取數(shù)據(jù)的數(shù)據(jù)庫相連。
現(xiàn)在來看圖2,本設(shè)備基本上構(gòu)成了信號轉(zhuǎn)換機5,它與線3、3′、麥克風6及語音輸入控制開關(guān)7相聯(lián)。
信號轉(zhuǎn)換機5包括一個用于選擇該機運行方式的模式開關(guān)8,這在以后要講到。為了使信號轉(zhuǎn)換機能與其它部件之間進行簡單的連接,相應地安裝了插銷9和插座10,分別與視頻顯示器2的插座4′和計算機裝置1的插銷4相連。
一種更令人喜歡的布置方式示于圖3,現(xiàn)在我們就來看圖3,在此種布置方式中,后面要講到的模式選擇實際上是與該機的翻譯功能分開的,因此語音控制臺5′可以在視頻顯示器2附近而翻譯機5″可以離它遠一些,通過連接線11傳輸數(shù)據(jù)。此時,語音控制臺5′與模式選擇開關(guān)8、麥克風6以及語音輸入控制開關(guān)7相連。
現(xiàn)在看圖4,我們注意到圖3中的語音電路控制臺5′和翻譯機5″的組合能夠與圖2中的信號轉(zhuǎn)機5起著類似的作用,現(xiàn)在我們來描述該設(shè)備的功能。
使用在控制臺5′上的模式開關(guān)8,用戶可以選擇該設(shè)備的運行方式。在輸入部分13上的微處理器12能夠檢測所選擇的模式,根據(jù)所選擇的模式,微處理器跟蹤六個程序中的某一個。為了描述方便,如下定義設(shè)備5的六種運行方式
1.直按式,2.宏命令式,3.文本式,4.訓練式,5.負載式及6.保留式。
這里要注意的是,模式開關(guān)8可能是控制臺鍵板上的一系列鍵。微處理器12也可以用于檢測數(shù)字與字母字符串及(或)檢測用于選擇信號轉(zhuǎn)換機5運行方式的控制字符。在后者情況下,可以給微處理器12編程,使之能夠制止選擇字符串傳輸?shù)接嬎銠C主機。
在直接式模式中,微處理器12使電子開關(guān)14將其輸入和與線15相聯(lián)的一個輸出相接。因此,在連接線3上的視頻顯示器2的輸出信號通過一個或門16傳到與計算機主機相連的連接線3′。這里要注意,如果使用單向發(fā)送信號運行視頻顯示器2(也就是說,如果自動地顯示所發(fā)送的字符),那么在連接線3上收到的字符以掃描次序存在屏幕存儲器17中,這樣做的意圖以后就變得明顯了。功能部件19和16能夠放入微處理器系統(tǒng)中,不必是真正的開關(guān)或門。
如果使用雙向發(fā)送信號運行視頻顯示2,那么在連接線3′上收到信號存在屏幕存儲器17中并返回到與線3′連接的顯示器2上,以按照通常的方式顯示。不考慮信號發(fā)送方式,來自計算機終端的數(shù)據(jù)存在屏幕存儲器17中并用類似的方法傳送到線3上。
我們不久將會認識到,在直接式方式中,轉(zhuǎn)換機5對在視頻顯示器2和計算機主機之間的數(shù)據(jù)使不產(chǎn)生明顯的影響。然而,需要經(jīng)常校正屏幕存儲器17,以保證當從其它運行方式轉(zhuǎn)到直接式方式時,微處理器12可以使視頻顯示器2的螢光屏顯示當前的正確數(shù)據(jù)。
這里要提及的是,直接式方式也適用于語音輸入。因此,如果操作語音控制開關(guān)同時轉(zhuǎn)換機5處于直接式方式,那么將以今后要講到的方式來完成根據(jù)語音輸入翻譯成數(shù)據(jù)輸出這一工作。
宏命令式、文本式及訓練式方式是用于給轉(zhuǎn)換機5編程,該機5和與之相連的特定計算機主機或數(shù)據(jù)庫相連。在處于這三種模式之一情況下,微處理12使電子開關(guān)14通過連接線17將輸入連接線3與微處理器12相連。接收到的數(shù)據(jù)不是連接線3′的輸出。宏命令方式允許用戶輸入多個數(shù)據(jù)串(利用視頻顯示器2上的鍵盤輸入,當后來語音輸入信號選擇計算機時,數(shù)據(jù)傳輸?shù)接嬎銠C)和對發(fā)送每一個數(shù)據(jù)串的限制條件。例如,如果必須把一串字符(如“10.0,40.0,1.0,1E6,‘CR’”,其中‘CR’表示回車)傳輸?shù)接嬎銠C主機,這可能是用戶為了定義欠缺號數(shù)而這樣做,那么用戶就可以在宏命令方式下輸入這串字符。微處理器12將收到的字符串存儲在數(shù)據(jù)存儲器18中。
在輸入了現(xiàn)在所需要的字符串以后(這些字符串可能包含著字母-數(shù)字字符和(或)控制字符),用戶接通文本方式。
在文本方式下,微處理器12將已輸入的每個字符串從數(shù)據(jù)存儲器18再傳送到視頻顯示器2,以便使用戶能夠檢查已輸入的每個字符串并從鍵盤輸入用來辨別每個字符串的詞或短語。從上面已引用的例子為例,微處理器12令使字符串“10.0,40.0,1.0,1E6,‘CR’”重新顯示在屏幕上。為回荅這一顯示,用戶可以敲入短語“Defanlt Parameters”以定義這串字符。
在完成參數(shù)的文本定義后,使用模式開關(guān)8選擇訓練模式。在這種模式下,微處理器12使視頻顯示器2顯示以前輸入的每一個短語,而且用戶操作語音輸入開關(guān)7并朝著麥克風6講這些短語。模/數(shù)轉(zhuǎn)換器19將來自麥克風6的輸入轉(zhuǎn)換成數(shù)字信號,微處理器12將此輸入存在短語參數(shù)存儲器20中(附存一個識別器)中,與在數(shù)據(jù)存儲器18中的相應數(shù)據(jù)對應。
此設(shè)備的新用戶可以接通訓練方式,不需要重輸入新的宏字符串或文本就可以提供短語參數(shù)的替代集。通過接通適當?shù)哪J胶洼斎胄碌臄?shù)據(jù)串就可以輸入附加的宏字符串和有關(guān)的文本,不必改變有關(guān)的文本或訓練輸入就可以修改現(xiàn)有的數(shù)據(jù)串。
在文本模式下,微處理器13將每一個文本輸入與以前所存的文本輸入相比較,以便讓同一標題下不出現(xiàn)兩個不同的數(shù)據(jù)串。如果需要,微處理器12將向視頻顯示器2提供一個適當?shù)男畔ⅰ?br>提供負載模式和保留模式是為了使現(xiàn)有的語音參數(shù)數(shù)據(jù)和(或)文本及成串數(shù)據(jù)旣可以存在轉(zhuǎn)換機5后向存儲器(圖中未示出)中又可以存在計算機主機的存儲器中(如果這樣做,有可能的話)。因此,如果這臺設(shè)備有幾個用戶,那么一旦開始使用,則當前用戶可以接通保留模式并輸入字符中,如“Save speech parameters Fred”或“Svve text and spcceh perameters Fred”,使得在接通終端后,通過接通負載模式和從顯示器2的鍵盤上輸入“Loacl Fved”可以撤回數(shù)據(jù),并且該用戶立卽能夠開始語音輸入。
在給轉(zhuǎn)換機5編程后,用戶將該設(shè)備返回到直接模式,此時,微處理器12使屏幕存儲器17重新組織在顯示器2上的顯示內(nèi)容。
如果現(xiàn)在操作語音輸入開關(guān)7并已講出了短語default parameters”,那么微處理器12提供比較方法并將由模/數(shù)轉(zhuǎn)換器轉(zhuǎn)換過的此輸入(卽該講的短語)與放在存儲器20中的語音參數(shù)相比較。如果所講的短語是可識別的,微處理器12提供翻譯方法并使用有關(guān)的辨別器恢復來自數(shù)據(jù)存儲器18的相應數(shù)據(jù)串,微處理器12還使數(shù)據(jù)經(jīng)連接線3′傳送到計算機主機或數(shù)據(jù)庫。所傳送的數(shù)據(jù)串也會返回到顯示器2。
如果微處理器12不能辨別出所講的短語,那么可以給轉(zhuǎn)換機5預編程,以便傳送以前在文本模式下輸入的文本字符或者通過連接線3′傳送零字符串。此外,輸入的“不真實語音”信息可以通過連接線3傳送到顯示器2。
如果這些字符串是與來自主機的字符無關(guān)的輸出,那么在某些情況下,可以接收到語音命令,但不會很好地組織屏幕格式。因而,為了使來自主機的字符輸出與這里的字符輸出有關(guān),加入了一個部件。屏幕上的例子很好地格式化了。
在宏字符中的下一部分輸出以前,打入提醒符然后等待提醒符2,否則輸入文本可能在提醒符以前出現(xiàn)在屏幕上,這樣用戶就不能看到令人滿意的圖象,也不能看到與鍵盤輸入等價的圖象。
人們將認識到,除了短語輸入部件以外,轉(zhuǎn)換機5還可以具備現(xiàn)已知語音識別設(shè)備所具備的所有功能。因此如果用戶講了某句話,如“7”、“5”、“1”,“RETURN”,那么在連接線3′上的輸出將是“751‘CR’”。這里要提及的是,不需要對計算機主機或數(shù)據(jù)庫進行任何的重編程工作,轉(zhuǎn)換機5就能夠提供所有的語音識別功能。
翻譯機和商用語音識別設(shè)備的組合使轉(zhuǎn)換機5完成全部功能,而且它的某些功能是和計算機主機結(jié)合在一起的。
以下更進一步地闡述在附屬要求中所規(guī)定的特點。
可以按下述更詳細地解釋在附屬要求中所給定的比較方法在許多時間區(qū)間上,計算音頻輸入信號譜的短期數(shù)字表示,每一個表示叫做一個框架。因而,輸入轉(zhuǎn)換為一系列的框架……f11……f1i……f1n其中每個框架都解釋了該時刻音頻輸入信號的短期譜。輸入序列……f11……f1i……f1n與一組“樣品”相比較,這組樣品以下列形式代表真實的單詞或短語。單詞Z(Wz)是由一系列框架fz1…fznz來表示的。
詞Z(WZ)is用框架序列fz1……fznz表示的。比較系統(tǒng)確定哪一列詞能夠最好地解釋輸入框架序列,比如說,能最好地解釋輸入框架序列的詞序列是WxWy……Wz參看文獻J.S.Bridle and M.D.Brown“Connected Word Yecognition Wsing Wnole Word Templates”in proc Jnst.Acowst.Aubumn conf.,Nov.1979,pp 25-28下面可以更詳細地解釋信號比較系統(tǒng)與翻譯系統(tǒng)(按照附屬要求定義的)之間的關(guān)系。
來自比較系統(tǒng)的信息使識別處理器輸出下列信息對每一個被識別的樣品(Piton Code) Ovtionul選擇音調(diào)碼Template Idenhification Score Start Time樣品 辨識 比分 開始時間Stop Time停止時間其中后者也可以編碼為
Start Time and Duration開始時間 和 寬度或者編為Duration and Stop time寬度 和 停止時間算法在開始時刻和停止時刻確定輸入語音中是否包含著被識別的樣品,選擇音調(diào)碼在所定周期內(nèi)為音調(diào)輪廓信息編碼。
當信息識別輸出時間后確定時,識別處理器還是以給定的速度輸出無聲段作為所識別出的樣品,因此,在所講短語的末尾,比較系統(tǒng)收到了無聲信息。
下面可以更詳細地解釋發(fā)送信號系統(tǒng)輸出一串字符的方式(這在附屬要求中已有描述)。
每個樣品都與某個宏定義有關(guān);這個宏定義本身能夠調(diào)用其它宏定義,而且十分重要的情況是,此宏定義能依賴于時間。
這種安排為人提供了一個十分重要的方便措施,如果有人講了“One hunored”(100),但他可能經(jīng)常希望輸出的是“1”“0”“D”“Carriang Orehurn”(回車),如果講了“One hundred and twenby four”(124),他可能希望輸出的是“1”“2”“4”“Canange rekum”(回車)。這種方便措施在一些已知的(每個樣品僅對應著一個辨識器)中是不可能的,在這種情況下,人們可能會發(fā)現(xiàn)“100”對應著One hundod(100)“20”對應著twenhy(20)“4”對應著fowr(4)而“Carriage rebwn”(回車)對應著“Cnter”(輸入)(此處是舉例說明)。
在本發(fā)明中,不僅100 20 4能夠被表示為124,而且不需要標志字符串結(jié)束的附加詞,因為所有已定義的宏定義包括一個結(jié)尾詞CR,在預定時間內(nèi),在樣品尾部加入CR,因此當最后一個詞4后面跟著一段足夠?qū)挼臒o聲段時,能夠輸出回車或用戶定義的其它字符以標志輸入字母串的結(jié)束。
另外,識別器還可以將音調(diào)碼傳送到處理器,然后表示降調(diào)的碼能夠用來表示回車應該加到最后一個詞的末尾。
在下述內(nèi)容中,更詳細地說明了本發(fā)明的特點,請參照圖5和圖6。
“在宏發(fā)音器中的宏元件”引言到現(xiàn)在為止,語音識別器已經(jīng)輸出了僅與所講的正確單詞有關(guān)的數(shù)據(jù)。這在講象122這樣的短語時出現(xiàn)了問題。除非與詞“100”相聯(lián)的文本是“One Hundred”(100)而與詞“20”相聯(lián)的文本是“Twenty”,否則輸出數(shù)據(jù)是混淆的而且難于使用。
在微發(fā)音器中,存在著一組功能很強的指令集來最后處理已識別出的單詞,然后再輸出有用的數(shù)據(jù)。這種數(shù)據(jù)可能以文本字符(包括控制字符)的形式送到主計算機并將語音輸出信息或數(shù)據(jù)送到輸出接口。
還存在著其它的功能以取出來自軟盤的數(shù)據(jù)并檢查從主計算機送到VDU的數(shù)據(jù)。
有宏定義的原因為了使語音識別器與外部部件(請看圖5)相接,必須做出聰明的決策。對于許多應用來講,所需要的一切都是已經(jīng)提到的文本的變型。然而,對于其它情況則可能必須控制外部設(shè)備(象燈、電動機等)和語音輸出。
本發(fā)明有十分強的能力來根據(jù)已講出的內(nèi)容修改句法和識別器中的詞匯,唯一受到限制的是詞匯的多少,這是由能夠使用的存儲器來決定的。
為了實現(xiàn)上述功能,需要特殊的編程語言。當某個程序段能夠有效地將已提到的東西變擴張成有用的指令時,我們稱這個程序段為宏定義(Macros)。
為了能夠數(shù)字輸出象102這樣的單詞,則必須對100,101和102等均給出樣品,或者樣品能夠聰明的預先,此時必須給“Dne”(1),“hundred”(100),“and”(和)及“two”(2)編碼。
(請看附錄2)宏定義下面是給宏段音器制定的有效命令表告訴它怎樣輸出和輸出哪些數(shù)據(jù)。雖然有一些用于特殊指令的變形字符例外,但在一般情況下,所有字符可以直接輸給主計算機。
變形字符是@、&、/和;,用戶也可以用分號表示兩個相鄰命令之間的命令分界線。
當改變在這些變形字符之后的文本解釋時,這些變形字符不能直接用作輸出文本。如果變形字符的操作數(shù)不合適,那么機器將不認識整個操作數(shù)和變形字形。
“/”這是“文字化”字符,在文本輸給主計算機時,使用它能夠使我們使用變形字形?!?”沒有合法的操作數(shù),當宏發(fā)音器與下列字符有關(guān)時,它無任何特殊意義。
因此,為將&作為文本輸出則需要使用/&,類似地,對于其它變形字符必須使用/@,//和/;
“@”這被用來根據(jù)另一宏定義調(diào)用某個宏定義。這個符號能夠使與幾個樣品相同的宏定義輸出中部分僅被定義一次。
用法是@nnrx例如@100r4nn是待執(zhí)行的宏命令號,這是該宏命令應當連續(xù)執(zhí)行的次數(shù)。
也允許使用@nn例如@72表示執(zhí)行宏命令nn一次保留特殊情況@nnro這表示永遠重復宏命令nn,或者直到已經(jīng)識別出一個新的樣本為止。
“&”這是一個放在前面的字符,表示在其后面的內(nèi)容是給宏發(fā)音器的一個指令。
指令功能可分成六個基本塊1.頭部2.并行接口 O/P3.語音信息 O/P
4.同前5.識別器參數(shù)6.其它1. &&&&文件字符串的開頭)用于在宏發(fā)音器和軟盤或其它輸入。
&?。?!文件串的結(jié)尾)設(shè)備之間傳送數(shù)據(jù)。
&m=N 后面尾隨著的字符定義了宏定義N。
&# 結(jié)束宏定義。
2. 并行接口自己有一個處理器,因此宏定義實際上是往接口中的每一位上寫程序。這樣接口可以與宏定義同時運行,因此有可能使這些宏定義永遠運行,而不必停止識別和進一步地處理宏定義。
在接口中有16位根據(jù)宏定義直接運行的命令&W=N 往第N位上寫指令表& 結(jié)束指令表&d=H1H2H3H4 用4個六進制數(shù)H1……H4表示所有的位,不能運行有數(shù)的那些中的程序位如&d=0005意味著禁止第0位和第二位&e=H1H2H3H4 能夠運行上述所說的有數(shù)的那些位中的程序&s=H1H2H3H4 使用4個六進制數(shù)所表示的所有位同步(也就是說,使程序計算器返回到開始狀態(tài))
接口位程序控制&+ 接通輸出通道&- 斷開輸出通道&±=T T毫移的時間延遲&s=H1H2H3H4 請看上面&d=H1H2H3H4 請看上面&e=H1H2H3H4 請看上面&w=N 請看上面&. 請看上面當軟件只運行每位上的一個命令時,每當其電平回路接通時,執(zhí)行該命令。注意&w……&劃歸為一個命令注意H1H2H3H4代表六進制數(shù)的4個字符。
3. &v=N 輸出第N個語音信息。
4. &h=“String” 在宏定義中的該點上暫停,直到從主計算機接收到所規(guī)定的字符為止(使其能夠與主程序同前,例在前面的類型有問題的時候)。
歐↑&n=oN在宏定義中的該點上暫停,直到并行輸出通道第N位已經(jīng)停止執(zhí)行其命令表為止。
&h=V 暫停,直到已經(jīng)完成了所有的語言信息為止。
5. &x=O 清理文本記錄簿。
&x=N (N=0)對第N個樣本建立訓練文本輸入。
&y=O 清理句法記錄簿。
&y=N (N=0)第N個節(jié)點建立句法。
&z=O 清理樣本記錄簿。
&z=N (N=0)建立第N個樣本。
&# 終止字符。
6. &^x 將控制符
X送到主計算機。
&p=T 在繼續(xù)處理宏定義以前,檢查在已識別出的樣本中是否有T秒的暫停。如果沒有找到T秒或更長的暫停,則結(jié)束宏定義(這對于產(chǎn)生102等有用,請看附錄2)。
&1=filenane 從軟盤中取文件“文件名字”。
&t=T T毫秒的時間延遲。
&n=N 檢查被識別出的樣本是否在第N個節(jié)點上。
如果如此,繼續(xù)處理宏命令,否則結(jié)束宏命令。
&c=N 將下個樣本的識別符與N比較,如果識別符是N繼續(xù)該宏定義,否則結(jié)束(如果有一個暫停時問題出了樣本結(jié)束的無聲時間,則出現(xiàn)假結(jié)果,并結(jié)束宏定義)。
&f 忘記在已識別出的樣本表中的下一個樣本-當已經(jīng)注意到這個尾隨樣本時,可與
&c一起使用。
&i 截斷在主計算機和VDU之間的數(shù)據(jù)傳輸-與&h=“String”一起使用,此時,有一個命令使此字符串產(chǎn)生。為了避免丟失已返回的字符串,&l應當在觸發(fā)字符以前發(fā)送&i。
注當使用變形字符命令時,可以略去以前的語句結(jié)束字符(default=;)語音宏接口宏發(fā)音器是一個經(jīng)訓練后的揚聲器系統(tǒng)時,那么一定要定義待識別詞或短語的選擇項。每一個語音單位叫做一個樣本。每一個樣本與一個宏數(shù)字有關(guān),因此當識別出樣本時,執(zhí)行帶該標號的宏定義。
附錄1宏定義功能/ 文字化。
@anrx 執(zhí)行宏定義nnx次。
@nn 執(zhí)行宏定義nn一次。
&&&& 文件頭部。
&?。?! 文件的結(jié)尾。
&# 一般性結(jié)束(終止使用宏定義和識別器參數(shù))。
&+ 接通輸出通道#。
&- 斷開輸出通道#。
&. 結(jié)束接口命令表。
# 只在接口命令表中使用 H1H2H3H4=4個六進制的數(shù)。
&^x 控制字符x。
&c=N 如果下個樣本識別符為N,繼續(xù)宏定義。
&d=H1H2H3H4 禁止使用所表示出的輸出接口指令表。
&e=H1H2H3H4 能夠使用所表示出的輸出接口指令表。
&f 忘掉在已識別出的樣本表中的下一個樣本。
&h=“string” 暫停宏定義,直到從主計算機收到此處所給定的字符串為止。
&h=ON 暫停宏定義,直到第N個輸出通道停止執(zhí)行。
&h=v 暫停宏定義,直到已經(jīng)發(fā)送了所有的語言信息。
&i= 截斷至計算機給VDU傳送數(shù)據(jù)。
&l=filenane 從軟盤中取“文件名字”。
&m=N 跟隨的字符定義N。
&n=N 如果識別出的樣本是在節(jié)點N上,則繼續(xù)宏定義。
&p=T 如果在當前樣本和下一個樣本之間的暫停時間大于T秒則繼續(xù)宏定義。
&s=H1H2H3H4 使所表示的所有輸出通道同前。
&v=N 輸出符N個語音信息。
&w=N 往輸出接口第N位上寫指令表。
&x=N N=0 清理文本記錄簿。
N<>0 為第N個樣本建立訓練文本。
&y=N N=0 清理句法記錄簿。
N<>0 為第N個節(jié)點建立句法。
&z=N N=0 清理樣本記錄簿。
N<>0 建立第N個樣本。
附錄2“102”譯碼語音One hundred and two(一百零二)見圖6為了決定說了什么,詞與詞(或者缺少詞)必須有暫停。
在圖6中,為了在102和122間的決定必須在“和”段作出,從而須要比較下一個樣品指令&c=N。當在本循環(huán)中注意采用下一樣品時,“&f”也是須要的。
例如樣品號 所講的詞100 hundred50 and20 twenty2 two1 one對于本例,采用極限為0.6秒的間歇。
宏定義11;&p=0.6; 印出一個1,并且人如果從此停止說話,同;&# 時支架回車。
宏定義22;&p=0.6; 同宏定義1。
;&#宏定義202;&p=0.6;0 須要作出決定是20還是22,也就;&# 是“20”是否意味“2”或者“2”,“0”。
宏定義100&p=0.6;OC 僅當100是數(shù)字的最后部分時,須;&# 要附加的特征。
宏定義50@105;@106;&# 做宏定義105和106(每個一次)。
宏定義105&c=2;02 如果“和”之后說“2”,則須要輸;&f;&# 出02。
當處理過“2”樣品,&f被用來從識別出的樣品表中移除“2”。
宏定義106&c=20;&f;@20;&# 如果說了“20”,須要處理上述的決定是在宏定義20之下做出的,由此調(diào)用上述指令。注意,在調(diào)用宏指令之前,“20”已經(jīng)完全處理于此點,必須從識別出的樣品表(RTLIST)移去“20”樣品辨認,宏定義20須要的數(shù)據(jù)保持在RTLIST下方。
這些宏定義執(zhí)行以下規(guī)則發(fā)音聲 宏指令輸出One(一) 1two(二) 2twenty(二十) 20One hundred(一百) 100two hundred(二百) 200One hundred and One(一百零一) 101One hundred and two(一百零二) 102One hundred and twenty two 122(一百二十二)two hundred and two(二百零二) 202two hundred and twenty 220(二百二十)two hundred and twenty one 221(二百二十一)two hundred and twenty two 222(二百二十二)
權(quán)利要求
1.語音響應設(shè)備,其特征在于它是安裝在手動鍵盤(2)的輸出部位(在操作手動鍵盤時,鍵盤輸出數(shù)字編碼信號,這些信號代表了多個鍵盤字符的組合)和數(shù)據(jù)處理設(shè)備(1)的輸入部位之間,從而提供一個語音識別部件。在這個部件中,有一個比較裝置用來將數(shù)字信號(來源于所講的詞或短語有關(guān)的音頻輸入信號)與多個用數(shù)據(jù)詞表示的詞進行比較,這些數(shù)據(jù)詞放在可編程的語言信號數(shù)據(jù)存儲器(20)中(這里所說的數(shù)據(jù)詞代表了真實單詞和短語),如有可能的話,比較裝置還用于確定已經(jīng)講了哪個單詞或短語并用于給翻譯裝置提供信號,此時這些信號等同于已講的單詞或短語,翻譯裝置對來自比較裝置的信號產(chǎn)生響應以決定第二個可編程的數(shù)據(jù)存儲器(18)中找出數(shù)據(jù)(代表與之等價的多次鍵盤操作,此鍵盤是與該設(shè)備相連的)并使信號發(fā)送裝置輸出一串數(shù)字編碼信號,這些信號代表了等價的多次鍵盤操作。
2.如在權(quán)利要求
1中所述的,語音響應設(shè)備對已講出的一串真實(或有效)單詞組成的音頻輸入信號產(chǎn)生響應時,相互關(guān)聯(lián)的翻譯信號序列(對上述真實單詞進行翻譯得到的信號)產(chǎn)生了代表所講的單詞中的數(shù)據(jù)信號的輸出序列。
3.如在權(quán)利要求
2所述的,音頻信號中預定寬度的無聲暫停階段至少可以部分地確定所講序列真實(或有效)單詞翻譯信號間的相互關(guān)聯(lián)性。
4.如在權(quán)利要求
2或3中所述的,語音響應設(shè)備中,音頻輸入信號的音調(diào)至少可以部分地確定翻譯信號之間的相關(guān)關(guān)聯(lián)性。
5.在前面所提出要求的語音響應設(shè)備中,從數(shù)據(jù)處理設(shè)備收到的信息可以部分地確定數(shù)據(jù)信號的輸出串。
6.在前面所提出要求的語音響應設(shè)備中,提供了開關(guān)裝置(7),此設(shè)備在第一種狀態(tài)(開關(guān)裝置在前述方式下運行)和第二種狀態(tài)(開關(guān)裝置允許在與之相連的數(shù)據(jù)處理設(shè)備和鍵盤之間直間通訊)下產(chǎn)生的響應。
7.在與權(quán)利要求
6相對應的語音響應設(shè)備中,當開關(guān)裝置(7)處于上述第一種狀態(tài)時,使用存儲器(17)存儲數(shù)據(jù),這些數(shù)據(jù)代表了該設(shè)備的字符輸出,因此,當上述開關(guān)裝置處于前述第二種狀態(tài)時,此設(shè)備可能使與鍵盤相連的顯示裝置顯示正確的數(shù)據(jù)記錄(這些數(shù)據(jù)傳送到來的,或者從相連接的數(shù)據(jù)處理器傳送來的)。
8.按照前述任何一個權(quán)利要求
得到的語音響應設(shè)備組成的語言輸入機(5′)和翻譯機(5″),它們是在電氣上互相聯(lián)結(jié)的,這種聯(lián)結(jié)可以與所聯(lián)結(jié)的鍵盤遠距離地放置。
9.在按照上述任何一個權(quán)利要求
得到的語音響應設(shè)備中,選擇裝置對預定的數(shù)字和字母及(或)控制字符產(chǎn)生響應以選擇該設(shè)備的運行方式,這些字符來自與該設(shè)備相連的鍵盤,該設(shè)備中有兩個可以預先編程的數(shù)據(jù)存儲器。
10.在按照權(quán)利要求
9得到的語音響應設(shè)備中,按裝選擇裝置以便制止這樣收到的任何選擇字符串傳送到與之相連的計算機中。
11.按照前述任何一個權(quán)利要求
得到的語音響應設(shè)備中,該設(shè)備也應當對所講的數(shù)字字母字符及(或)控制詞產(chǎn)生響應,以便將識別所講字符的數(shù)字編碼信號送到數(shù)據(jù)處理設(shè)備。
12.按照權(quán)利要求
8得到的語音響應設(shè)備中,翻譯機是計算機裝置的一部分,能夠象與之相連的數(shù)據(jù)處理器那樣工作。
專利摘要
為計算裝置(未示出)提供語音識別裝置的設(shè)備是安裝在鍵盤機(2)和計算機之間的。在語音模式中,微處理器(12)將來自麥克風(6)的數(shù)字化后的音頻輸入與放在語音參數(shù)存儲器中的數(shù)據(jù)相比較,以便找到所講的單詞或短語。然后,使用這樣找到的已識別出的內(nèi)容,從數(shù)據(jù)存儲器(18)中得到一個字符串并將其傳送到輸出部件(3′)上的計算機。不需要修改計算機軟件,就能向計算機裝置相應地提供語音識別部件。
文檔編號G06F13/38GK85103197SQ85103197
公開日1986年10月22日 申請日期1985年4月25日
發(fā)明者威爾遜 申請人:馬科尼有限公司導出引文BiBTeX, EndNote, RefMan