欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

增大在遠程通信終端中語音輸入指令的識別率的系統(tǒng)和方法

文檔序號:7607676閱讀:218來源:國知局
專利名稱:增大在遠程通信終端中語音輸入指令的識別率的系統(tǒng)和方法
技術領域
本發(fā)明涉及在通信設備中的語音輸入識別,更具體地,涉及用于增強在遠程通信終端中語音撥號系統(tǒng)精確度的系統(tǒng)和方法。
載入移動電話的遠程通信終端在許多現(xiàn)代工業(yè)化國家中是很普遍的。大多數(shù)遠程通信終端使用小鍵盤作為輸入設備。然而,小鍵盤存在某些缺點。首先,小鍵盤的使用可能要求使用者將注意力轉(zhuǎn)向該通信設備,只要一段短時刻。在某些情況中,諸如當駕駛時,這是不期望的。此外,市場不斷驅(qū)使制造商生產(chǎn)更小的遠程電話終端設備,該設備也被稱為手機。該終端設備尺寸的減小使得更可能產(chǎn)生小鍵盤的錯誤,從而降低了作為輸入設備的小鍵盤的精確度。
制造商已經(jīng)實現(xiàn)了適于接收一個語音輸入,識別該輸入,并執(zhí)行一個基于該輸入的動作的基于語音的輸入設備。舉例來說,授予Kuniyoshi的U.S.專利No.4,959,850公開了一個無線電電話裝置,它包括用于電話的基于語音撥號的語音識別功能。類似地,授予Sakanishi的U.S.專利No.5,042,063和授予Gerson等人的U.S.專利No.4,870,686公開了一個使用可以進行基于語音撥號的語音識別功能的電話裝置。語音識別功能還被公開在下列參考文件中授予Will的U.S.專利No.5,917,891;授予Maekawa等人的U.S.專利No.5,884,257;授予Eting等人的U.S.專利No.5,651,056;授予Meador的U.S.專利No.5,638,425;授予Peterson的U.S.專利No.5,509,049;授予Jakatdar的U.S.專利No.5,495,533;;和授予Hunt等人的U.S.專利No.5,303,299。
然而,語音識別是一個很困難的任務,尤其是當語音信號與來自周圍環(huán)境的模糊噪聲,例如汽車噪聲和街道噪聲相結(jié)合時。來自模糊噪聲的不適當發(fā)音和/或干擾可使得使用者的語音不能被設備所識別。在基于語音的撥號應用中,這可導致電話設備撥出一個不正確的號碼??蛇x地,該電話設備會促使使用者重復未被識別的數(shù)位,或整個數(shù)字序列。取決于語音識別系統(tǒng)的精度,使用者可能被要求相當比例的時間來重復號碼,這使得基于語音的撥號特性對于使用者變得較不方便。
因此,在本技術領域中,存在對改進的基于語音撥號系統(tǒng)和方法的需要。
本發(fā)明致力于通過提供一種用于改進包括移動電話的遠程通信終端的基于語音撥號的裝置和方法來解決這些和其他問題。根據(jù)本發(fā)明,一個遠程終端適用于使用保存在存儲器中的信息來增強語音識別例程精度。優(yōu)選地,該信息包括一個關于先前由該遠程終端所撥的電話號碼的信息,該信息會與由基于語音撥號方法所輸入的電話號碼相匹配以增強語音識別系統(tǒng)的精度。
一個方面,本發(fā)明提供一個用于促進通信設備的基于語音撥號的系統(tǒng)。該系統(tǒng)包括一個用于接收一個輸入字符序列的語音輸入表示并產(chǎn)生在該輸入字符序列中的每一個字符的信號表示的轉(zhuǎn)換模塊,一個用于確定該輸入字符序列是否包括未識別字符的判斷模塊,一個包括多個響應于網(wǎng)絡弟子的字符序列的存儲器模塊,和一個用于在存儲器模塊中搜索一個具有對應于在輸入字符序列中已識別字符的字符的字符序列的搜索模塊。使用中,如果轉(zhuǎn)換模塊不能將該輸入字符序列中一個和多個字符轉(zhuǎn)換,這搜索模塊可在存儲器模塊中搜索具有與輸入字符序列中已識別字符相匹配的字符的一個或多個字符序列。
另一方面,本發(fā)明提供一個促進在通信設備中基于語音呼叫的方法。該方法包括以下步驟接收所期望字符序列的語音輸入表示,產(chǎn)生該字符序列中每一個字符的一個信號表示,確定該輸入字符序列是否包括未識別字符,和如果有未識別字符,則搜索一個具有對應于在輸入字符序列中已識別字符的字符的匹配字符序列,并產(chǎn)生一個匹配字符序列的信號表示。
本發(fā)明的這些和其他目的、特征和優(yōu)點將通過本說明書的描述并結(jié)合附圖變得更清楚。


圖1為一個適于實現(xiàn)本發(fā)明的示例性GSM通信的框圖;圖2顯示根據(jù)本發(fā)明的一個實施例的,用于改進在一個通信設備中的基于語音的呼叫的方法流程圖;和圖3為根據(jù)本發(fā)明的一個實施例的遠程通信終端的原理圖。
今天所使用的許多數(shù)字式無線系統(tǒng)使用時隙式接入系統(tǒng)。使用者信息(例如語音)被分段,壓縮,分組和在預分配的時隙中傳輸。時隙可被分配給不同的使用者,通常被稱為時分多路訪問(TDMA)機制。時分多路訪問(TDMA)通信系統(tǒng),諸如在歐洲的全球移動通信系統(tǒng)(GSM),在北美的數(shù)字式先進移動電話系統(tǒng)(D-AMPS),或在日本的個人數(shù)字式蜂窩(PDC)系統(tǒng),允許在多遠程終端之間分享單個無線電頻率信道,從而增加了通信系統(tǒng)的容量。
隨后的示例性實施例被提供于時分多路訪問(TDMA)無線電通信系統(tǒng)的環(huán)境中。然而,本領域技術人員應認識到TDMA方法論僅僅是為示例性的目的而被描述,而本發(fā)明很容易適用于包括頻分多路訪問(FDMA),TDMA,碼分多路訪問(CDMA)和/和它們的混合的所有類型的訪問技術中。
在歐洲電信標準協(xié)會(ETSI)文件ETS 300 573,ETS 300 574和ETS 300 578中描述了根據(jù)GSM標準的蜂窩通信系統(tǒng)的運作過程,這些文件在此被引用作為參考。因此,再次僅簡要描述一個示例性GSM系統(tǒng)的運作。雖然本名以在GSM系統(tǒng)中的示例性實施例來描述,但是本領域的技術人員應可認識到本發(fā)明還可被用于其他的通信系統(tǒng)中。
參照圖1,描繪了一個其中可實施本發(fā)明的通信系統(tǒng)10。該系統(tǒng)10為一個具有用于管理呼叫的多層的分層網(wǎng)絡。使用一組上行鏈路和下行鏈路的無線頻率,在系統(tǒng)10中工作的遠程通信終端12使用在這些頻率上分配給它們的時隙來參加呼叫。在一個上部的分層中,一組移動交換中心(MSCs)14將來自始發(fā)者的呼叫選擇路由發(fā)送給收信方。具體地,這些實體負責呼叫的設置,控制和終止。一個MSCs14,通常稱為一個網(wǎng)關MSC,與公用交換電話網(wǎng)絡(PSTN)18,和其他公用和私用網(wǎng)絡一起來處理通信。
MSCs14中的每一個被連接到一個和多個基站控制器(BSCs)16。根據(jù)GSM標準,BSC16通過被稱為A-接口的標準接口來與一個MSC14相通信,該接口是基于CCITT信令系統(tǒng)No.7的移動應用部分。
BSCs16中的每一個控制一個和多個基收發(fā)站(BTSs)20。每一個BTS20包括一個或多個使用上行和下行鏈路無線電頻率(RF頻率)以為一個具體地理區(qū)域,諸如一個和多個通信小區(qū)21提供服務的收發(fā)器(TRXs)(未示出)。BTSs20主要提供用于發(fā)射數(shù)據(jù)猝發(fā)(burst)到在它們各自小區(qū)中的遠端站12和接收來自這些遠端站的數(shù)據(jù)猝發(fā)的RF鏈路。在一個示例性實施例中,多個BTSs20被包括在一個無線電基站(RBS)22中。RBS 22,例如,可以根據(jù)一族RBS200產(chǎn)品族來構(gòu)造,這些產(chǎn)品由Telefonaktiebolaget LM Ericsson公司,本發(fā)明的受讓人所提供。對于與示例性遠端站12和RBS22的實現(xiàn)的更多細節(jié),有興趣的讀者可以參看授予Frodigh等人的U.S.專利No.5,909,469,該文件的公開在此被引用作為參考。
圖2表示了一個適于根據(jù)本發(fā)明的使用中的遠程終端200的示意圖。遠程終端200優(yōu)選地是一個用于數(shù)字式TDMA蜂窩式通信系統(tǒng),諸如GSM系統(tǒng),PDC系統(tǒng),或D-AMPS系統(tǒng)中的移動電話。然而,如上所述的,本發(fā)明可以應用于所有類型的接入系統(tǒng)中,并且可容易地應用于TDMA或CDMA系統(tǒng),或它們的混合系統(tǒng)中。遠程終端是公知的并且是市場上可以獲得的。因此,下面僅詳細描述遠程終端200的那些與本發(fā)明有關的方面。對于涉及遠程終端的其他信息,有興趣的讀者可以參看授予Dent等人的U.S.專利No.5,745,523,該文件在此被引用作為參考。
參照圖2,遠程終端200包括,在相關部分中,一個用于接收來自電話使用者的語音的麥克風210。麥克風210被連接到轉(zhuǎn)換模塊220。轉(zhuǎn)換模塊220可包括一個用于將模擬語音輸入轉(zhuǎn)換為數(shù)字信號的模數(shù)(A/D)轉(zhuǎn)換器224。轉(zhuǎn)換模塊220還可以包括一個用于識別使用者的語音的自動語音識別(ASR)模塊228。遠程終端200還包括一個用于確定ASR模塊228是否以所期望的精度識別出一個由使用者所說的字符的判斷模塊230。遠程終端200還包括一個用于保存表示有效電話號碼的字符序列的存儲器模塊250,和一個用于搜索存儲器模塊250的搜索模塊240。遠程終端200還包括一個用于建立與諸如如圖1所示的GSM網(wǎng)絡的通信網(wǎng)絡的通信連接的連接模塊260。遠程終端200還包括一個用于將信息顯示給使用者的適合的顯示器270(例如,一個LED和LCD顯示器)。一個具有適合的語音識別模塊的終端為由Ericsson所提供的市場上可獲得的T28。
我們希望的是將模塊220-260中的一些或所有模塊嵌入一個合適的專用集成電路(ASIC)或一個可編程數(shù)字信號處理器(DSP),或為一組包括多個ASIC的芯片組。在各個模塊200-260和遠程終端的其他部件之間形成有電連接。例如,判斷模塊230和搜索模塊240電連接到顯示器270,到揚聲器280,和到連接模塊260。
另外,在一個優(yōu)選實施例中,在存儲器模塊250和連接模塊260之間的電連接使得存儲器模塊250可以保存與遠程終端200所建立的連接有關的電話號碼。例如,每次使用者將一個電話號碼輸入遠程終端200中,該號碼可被保存在存儲器模塊250中。以此方式,存儲器模塊250可以保持一個先前撥號的電話號碼列表,這些電話號碼可被用作增強基于語音撥號的精度的先前信息,如下所述。
圖2示出了一種根據(jù)本發(fā)明的一個實施例的基于語音撥號的方法。簡而言之,參照圖3,該方法包括接收一個由使用者所說的字符,將該字符轉(zhuǎn)換為一個阻止信號,并確定該字符序列是否完整。如果該字符序列不完整,則該系統(tǒng)重復地接收另外的字符并將這些字符轉(zhuǎn)換為數(shù)字信號。在已接收一個完整的字符序列之后,系統(tǒng)判斷該字符序列是否包括一個和多個未識別的字符。如果該字符序列不包括未識別的字符,則該字符序列的被發(fā)送給用于使電話撥出響應于已識別字符序列的號碼的模塊(例如一個連接模塊)。如果該字符序列包括一個和多個未識別字符,則調(diào)用一個搜索模塊。該搜索模塊將在該字符序列中的已識別字符與在相關存儲器中的字符序列中對應的數(shù)位相比較以確定是否在存儲器中的一個字符序列可能匹配于使用者輸入的字符序列。當檢測到一個可能的匹配時,該字符序列可被發(fā)送到一個用于使得該電話撥出響應于已識別字符序列相應的號碼的模塊??蛇x地,字符序列可被顯示和聽覺上表現(xiàn)給電話的使用者,該使用者可以指示該字符序列實際上是否匹配于所期望的字符序列。下面將更詳細地解釋該過程。
在一個示例性實施例中,圖3中的過程可被實現(xiàn)在一個具有基于語音撥號特性的遠程通信終端,例如移動電話中。參考圖3,在步驟310中,基于語音的撥號特性被激活而遠程終端接收在一個字符序列中第一字符的語音輸入表示。在美國,該字符優(yōu)選地代表公知的十位撥號格式(例如,xxx-xxx-xxxx)中的一位。然而,我們期望該字符序列可以是適用于不同地理區(qū)域的撥號系統(tǒng)的格式,或在一種數(shù)字應用中可以代表在一個數(shù)據(jù)網(wǎng)絡中的網(wǎng)絡地址(例如,一個URL或一個IP地址)??蛇x地,該字符序列可表示指向一個遠程終端的指令,或包括一個用于快速撥號的號碼的存儲器地址。
在步驟320中,已接收的字符被轉(zhuǎn)換為一個表示由該用戶所說的字符的數(shù)字信號。該轉(zhuǎn)換可以使用一個模擬-數(shù)字(A/D)轉(zhuǎn)換器結(jié)合適當?shù)腁SR模塊來實現(xiàn)。許多ASR模塊實現(xiàn)用于報告為一個特定字符所做的判決的可靠性量度的統(tǒng)計例程。所期望的可靠率可被編程入ASR模塊的邏輯電路中,或可以由用戶所選擇并輸入到系統(tǒng)中作為一個參量。ASR模塊是本領域所公知的,而ASR模塊的具體細節(jié)與本發(fā)明無關。
在步驟330中,執(zhí)行一個測試以確定該字符序列的輸入是否完成。例如,在美國電話系統(tǒng)中,它使用一個十個字符的格式,當輸入第十個字符時就認為該字符序列的輸入完成。在另一個實施例中,判斷步驟可使用超時例程,即當一個預定時間在一個特定字符輸入后被耗盡,則假設該字符序列被完成。在另一個可選實施例中,一個使用者可以通過按一個指定按鍵或通過說出一個特定碼來主動地指示該字符序列完成。本領域的技術人員將認識到許多種可以檢測出一個輸入字符序列的終結(jié)的其他方式。如果該字符序列未完成,則步驟310到330可重復直至該字符序列完成,或使用者指示希望取消該語音輸入過程。
在確定該字符序列完成之后,在步驟340,執(zhí)行一個測試以確定該字符序列是否包括一個或多個未識別字符。在此,術語“未識別字符”應指該字符序列中未由ASR模塊確認的字符。在一個實施例中,該系統(tǒng)可以測試以確定與字符序列中的一個或多個字符有關的可靠性量度是否小于一個預定閾值(例如95%,或90%),若是,則該字符序列可被確定為具有未識別字符。還可采用另外的測試。例如,如果與兩個字符有關的可靠性量度小于一個預定閾值,則該字符序列可被確定為具有未識別字符。
如果該字符序列不包括未識別字符,則在步驟380,該字符序列被撥號而遠程終端200試圖建立一個與網(wǎng)絡的連接。
如果該字符序列包括未識別字符,則在步驟350,一個與遠程終端有關的存儲器模塊被搜索以確定是否在該存儲器模塊中的一個字符序列匹配于在使用者輸入的字符序列中的已識別字符。如果在步驟360中,發(fā)現(xiàn)一個匹配,則由該存儲器中搜索該字符序列并且在步驟370中可選地表現(xiàn)給使用者。在一個實施例,該字符序列,例如通過一個LCD顯示器或其他合適的顯示器來可視地表現(xiàn)給使用者。在另一個實施例中,用一個語音合成器將該字符序列在聽覺上表現(xiàn)給使用者。在接收到來自使用者的同意的指示后,在步驟380撥叫該字符序列。
將認識到的是步驟310-380中的一些或所有步驟可由一個合適的ASIC,DSP,或一芯片組,或通過在一個通用處理器上的邏輯指令操作來實施。
雖然本發(fā)明已參照幾個示例性實施例進行了詳細描述,本領域的技術人員應認識到可以做各種改型而不背離本發(fā)明。因此,本發(fā)明僅由隨后的權利要求來限定,該權利要求意欲包含本發(fā)明的所有等價物。
權利要求
1.用于改進通信設備的語音撥號的系統(tǒng),包括一個用于接收一個輸入字符序列的語音輸入表示并產(chǎn)生在該輸入字符序列中的每一個字符的信號表示的轉(zhuǎn)換模塊,一個用于確定該輸入字符序列是否包括未識別字符的判斷模塊,一個包括多個響應于網(wǎng)絡弟子的字符序列的存儲器模塊,和一個用于在存儲器模塊中搜索一個具有對應于在輸入字符序列中已識別字符的字符的字符序列的搜索模塊;這樣,如果轉(zhuǎn)換模塊不能將該輸入字符序列中一個和多個字符轉(zhuǎn)換,這搜索模塊可在存儲器模塊中搜索具有與輸入字符序列中已識別字符相匹配的字符的一個或多個字符序列。
2.權利要求1的系統(tǒng),其中該轉(zhuǎn)換模塊包括一個用于將所接收的語音輸入信號數(shù)字化的A/D轉(zhuǎn)換器。
3.權利要求1的系統(tǒng),其中該轉(zhuǎn)換模塊包括一個用于分析該數(shù)字信號并產(chǎn)生由該數(shù)字信號所表示的字符序列的信號指示的語音識別模塊。
4.權利要求1的系統(tǒng),其中該轉(zhuǎn)換模塊產(chǎn)生用于表示與轉(zhuǎn)換精度有關的信任級別的信號;和該判斷模塊產(chǎn)生一個表示該信任級別是否高于一個預定閾值的信號。
5.權利要求1的系統(tǒng),其中該轉(zhuǎn)換模塊和判斷模塊被嵌入一個數(shù)字信號處理器中。
6.權利要求1的系統(tǒng),還包括一個用于產(chǎn)生表示在存儲器中的一個字符序列的信號。
7.權利要求6的系統(tǒng),還包括用于顯示由該輸出模塊所產(chǎn)生的信號所表示的字符序列的顯示器模塊。
8.權利要求6的系統(tǒng),還包括用于用聲音通告由輸出模塊所產(chǎn)生的信號所表示的字符序列的模塊。
9.權利要求1的系統(tǒng),還包括一個用于建立與由輸出模塊所產(chǎn)生的信號表示的字符序列的連接的連接模塊。
10.一個促進在通信設備中基于語音呼叫的方法包括以下步驟接收所期望字符序列的語音輸入表示,產(chǎn)生該字符序列中每一個字符的一個信號表示,確定該輸入字符序列是否包括未識別字符,和如果有未識別字符,則搜索一個具有對應于在輸入字符序列中已識別字符的字符的匹配字符序列,和產(chǎn)生一個匹配字符序列的信號表示。
11.權利要求10的方法,其中用于產(chǎn)生該字符序列中每一個字符的一個信號表示的步驟包括將所接收的語音輸入信號數(shù)字化。
12.權利要求11的方法,其中用于產(chǎn)生該字符序列中每一個字符的一個信號表示的步驟包括分析該數(shù)字信號并產(chǎn)生由該數(shù)字信號所表示的字符序列的信號指示。
13.權利要求10的方法,其中用于產(chǎn)生該字符序列中每一個字符的一個信號表示的步驟產(chǎn)生用于表示與轉(zhuǎn)換精度有關的信任級別的第一信號。
14.權利要求13的方法,其中用于確定該輸入字符序列是否包括未識別字符包括比較該信任級別與一個預定閾值并產(chǎn)生一個表示該信任級別是否高于一個預定閾值的第二信號。
15.權利要求10的方法,還包括顯示由輸出模塊所產(chǎn)生的信號表示的字符序列。
16.權利要求10的方法,還包括用聲音通告由輸出模塊所產(chǎn)生的信號所表示的字符序列。
全文摘要
本發(fā)明公開了一個改進在遠程通信終端中基于語音撥號的精度的方法,和包括該方法的終端。一個期望的電話號碼的模擬語音輸入表示被轉(zhuǎn)換為一個數(shù)字信號。一個自動語音識別模塊識別數(shù)位并產(chǎn)生表示這些數(shù)位的輸出信號。一個判斷模塊施加一個測試以確定該轉(zhuǎn)換是否未識別出在該電話號碼中的一個和多個數(shù)位。如果該電話號碼包括未識別的數(shù)位,則一個搜索模塊在一個相關的存儲器模塊搜索一個具有匹配于使用者所輸入的號碼的已識別數(shù)位的數(shù)位的電話號碼。存儲器中的匹配電話號碼被視覺上,和聽覺上顯示給使用者。如果期望,則遠程終端可以建立一個與由存儲器模塊中選擇的電話號碼的連接。
文檔編號H04M1/725GK1387663SQ00815370
公開日2002年12月25日 申請日期2000年10月31日 優(yōu)先權日1999年11月4日
發(fā)明者A·D·希門尼斯·費爾特斯特倫 申請人:艾利森電話股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
新龙县| 临夏县| 嘉义市| 防城港市| 民乐县| 东安县| 天峻县| 大连市| 册亨县| 红原县| 河曲县| 罗定市| 崇阳县| 惠安县| 新蔡县| 临汾市| 通许县| 克拉玛依市| 来宾市| 兴安县| 翼城县| 定日县| 饶阳县| 长汀县| 茌平县| 江永县| 寿光市| 中方县| 扎鲁特旗| 和田市| 泸溪县| 扬州市| 新竹县| 缙云县| 比如县| 大同县| 涿鹿县| 大兴区| 墨江| 武威市| 晋江市|