專利名稱:具有語音識別功能的便攜式計算機與其處理方法
技術領域:
本發(fā)明涉及一種語音指令的處理技術,且特別涉及一種具有多層級數(shù)據(jù) 庫的語音指令的處理技術。
背景技術:
隨著計算機系統(tǒng)的普及,使用者對于計算機使用上的便利性有愈來愈多 的要求。因此,計算機系統(tǒng)的輸入設備,從傳統(tǒng)的鍵盤、鼠標與遙控器等, 漸漸地發(fā)展成更為人性化的操作技術,例如語音輸入控制。而語音控制的關 鍵,就在于語音指令的識別率。
一般而言,語音識別技術都是以語音指令中的關鍵詞詞為基底進行識別, 是較簡單也較有效率的語音識別技術。此方法乃是直接以存儲在關鍵詞數(shù)據(jù) 庫中所有的關鍵詞詞作為識別率的依據(jù),因為只需要對此特定范圍的關鍵詞 詞進行識別,所以能使語音識別的識別率達成一定的水平。
然而,已知的語音識別技術的識別率,會隨著數(shù)據(jù)庫中關鍵詞詞的數(shù)量 增大而降低。也就是說,當使用者將愈多的關鍵詞詞存入數(shù)據(jù)庫中,則系統(tǒng) 進行字詞比較的時間就愈長,并且比較的復雜度也更為提升,而導致準確度 相對地下降。
發(fā)明內(nèi)容
因此,本發(fā)明提供一種語音指令的處理方法,可以提高語音指令的識別率。
此外,本發(fā)明也提供一種具有語音識別功能的便攜式計算機,其具有較 佳的語音識別效率。
本發(fā)明提供一種語音指令的處理方法,而此語音指令包括Y個指令字符 串,其中,Y為大于等于l的正整數(shù)。本發(fā)明的處理方法包括提供多個語音 識別數(shù)據(jù)庫,并且為了執(zhí)行語音指令中第X個指令字符串而加載對應的語音 識別數(shù)據(jù)庫,其中X為大于等于1且小于等于N的正整數(shù)。當在所加載的語音識別數(shù)據(jù)庫中搜尋到符合第X個指令字符串的字符串時,則執(zhí)行第x個指 令字符串所代表的動作。且當X不等于Y時,則將X加1。
此外,當在所加載的語音識別數(shù)據(jù)庫中搜尋不到符合第x個指令字符串 的字符串時,則放棄執(zhí)行此語音指令。
從另 一觀點來看,本發(fā)明也提供一種具有語音識別功能的便攜式計算機, 包括輸入單元、存儲單元和處理單元。其中,輸入單元可以用來接收一語音 指令,而存儲單元內(nèi)存儲有多個語音識別數(shù)據(jù)庫。另外,處理單元則是耦接 輸入單元和存儲單元。藉此,當便攜式計算機的語音識別功能被啟動,而且
一包含有N個指令字符串的語音指令從上述的輸入單元輸入時,則處理單元 可以為了執(zhí)行語音指令中第x個指令字符串而從存儲單元加載對應的語音識
別數(shù)據(jù)庫,并且在加載的語音識別數(shù)據(jù)庫內(nèi)搜尋是否有符合第x個指令字符 串的字符串。當從加載的語音識別數(shù)據(jù)庫內(nèi)搜尋到符合第x個指令字符串的
字符串時,則執(zhí)行第X個指令字符串所代表的動作。另外,當X不等于N時, 則將X加1。其中,N為大于等于l的正整數(shù),而X則為大于等于1而小于等 于N的正整數(shù)。
由于在本發(fā)明中,每一指令字符串不一定都是在同一數(shù)據(jù)庫內(nèi),而是采 取分級的架構。因此,本發(fā)明可以提高語音指令的識別率,并且可以提升指 令字符串搜尋的速度,進而提升語音指令處理的速度。 有益效果
綜上所述,由于本發(fā)明具有多層級的數(shù)據(jù)庫結構來搜尋語音指令中的指 令字符串。因此,本發(fā)明可以縮短搜尋的時間,并且進而提升語音指令的執(zhí) 行效率。另外,指令字符串是分配到不同的語音識別數(shù)據(jù)庫,因此不同層級 的語音數(shù)據(jù)庫內(nèi)不會含有太多的字符串需要比較,是以本發(fā)明具有較佳的語 音識別率。
為讓本發(fā)明的上述和其它目的、特征和優(yōu)點能更明顯易懂,下文特舉較 佳實施例,并配合附圖,作詳細iJt明如下。
圖1所示為依照本發(fā)明的一實施例的一種具有語音識別功能的便攜式計 算機的內(nèi)部方塊圖。圖2所示為依照本發(fā)明的一較佳實施例的一種語音指令的處理方法的步 驟流程圖。
圖3所示為依照本發(fā)明的一較佳實施例的一種數(shù)據(jù)庫的層級架構圖。 圖4所示為依照本發(fā)明的一較佳實施例的一種比較指令字符串的步驟流 程圖。
具體實施例方式
圖1所示為依照本發(fā)明的一實施例的一種具有語音識別功能的便攜式計 算機的內(nèi)部方塊圖。請參照圖l,本發(fā)明較佳實施例所提供的便攜式計算機 IOO例如是筆記本計算機或超級行動個人計算機(UMPC)系統(tǒng),其包括輸入 單元1Q2、處理單元1G4、存儲單元106、及存儲單元ll8。上述輸入單元102 與處理單元104電性連接,處理單元104與存儲單元118電性連接。處理單 元104亦與存儲單元106電性連接。
在本實施例中,輸入單元102為指向性麥克風,其可組設在便攜式計算 機IOO的顯示器上緣,以獲得較佳的收音,且輸入單元102在接收一外界的 聲音后,并將其所接收的聲音訊號輸出至與其耦接的處理單元104。在其它 實施例中,輸入單元102亦可為一般型的麥克風。另外,存儲單元106可以 是各種不同的存儲設備,例如硬盤、存儲卡等,并且也是耦接至處理單元104。
在本實施例中,存儲單元106內(nèi)存有多個語音識別數(shù)據(jù)庫110。另外, 在存儲單元106中,更可以存儲有多個應用程序112和大量的數(shù)據(jù)文件114。
請繼續(xù)參照圖1,若是使用者要使用語音控制來操作便攜式計算機IOO 時,可以先啟動存儲裝置106中關于語音識別功能的應用程序112。假設便 攜式計算機100的語音識別功能已經(jīng)被開啟,則使用者就可以藉由輸入單元 102將一語音指令輸入至便攜式計算機100中。特別的是,本發(fā)明較佳實施 例允許使用者所輸入的語音指令可以包括多個指令字符串,并且每個指令字 符串又可以包括多個字符。另外,每個指令字符串內(nèi)所含的字符也不一定需 要相同。
圖2所示為依照本發(fā)明的一較佳實施例的一種語音指令的處理方法的步 驟流程圖。請合并參照圖1和圖2,以下舉一實施例來說明本發(fā)明的精神。 若是一使用者想要利用本發(fā)明實施例所提供的便攜式計算機100播放一位歌 手AAA的歌曲,歌名叫做DDDD時,使用者可通過便攜式計算機100的輸入單元102輸入一包含有Y個指令字符串的語音指令,就如步驟SMZ所述。Y可 以是大于等于l的正整數(shù)。例如,使用者說出"播放AAADDDD,,的語音指令, 則此語音指令就可以包括"播放"、"AAA" 、"DDDD,,等三個指令字符串, 也就是說Y等于3。
當語音指令通過輸入單元102送進便攜式計算機100后,處理單元104 為執(zhí)行所輸入的語音指令中第X個指令字符串,而如步驟SS(H所述,從存儲 單元106內(nèi)加載對應的語音識別數(shù)據(jù)庫110,其中X為大于等于1而小于等 于Y的正整數(shù)。例如,當X等于l,則處理單元l(M所要處理的指令字符串 就是"播放,,。因此,處理單元104可以為了執(zhí)行此第1個指令字符串而從 存儲單元106內(nèi)加載對應于指令字符串為."播放"的語音識別數(shù)據(jù)庫。
一般來說,處理單元104可以具有寄存區(qū)116,而4皮加載的語音識別數(shù) 據(jù)庫IIO就可以被存放在此寄存區(qū)116中。而在另外一些選擇實施例中,處 理單元116也可以將被加載的語音識別數(shù)據(jù)庫IIO存放在例如動態(tài)隨機存取 內(nèi)存等的外部存儲單元118,并不會影響本發(fā)明主要的精神。
當處理單元104從存儲單元106加載對應的數(shù)據(jù)庫110后,可以如步驟 S206所述,檢查所加載的語音識別數(shù)據(jù)庫110內(nèi),是否存在有字符串可以符 合第X個指令字符串。當沒有從加載的語音識別數(shù)據(jù)庫110中搜尋到有符合 的字符串時(就是步驟S206所標示的"否"),代表此語音指令可能是無效的 語音指令,或是使用者所說出(輸入)的語音指令不清楚。此時,本實施例 可以執(zhí)行步驟S208,就是放棄執(zhí)行所輸入的語音指令。
相對地,當處理單元104在加載的語音識別數(shù)據(jù)庫110中搜尋到符合第 X個指令字符串的字符串時(就是步驟S206所標示的"是"),則如步驟S210 所述,執(zhí)行第X個字符串所代表的動作。假設,處理單元104在加載的語音 識別數(shù)據(jù)庫110中搜尋到"播放,,的指令字符串,就可以使處理單元104啟 動存儲單元106中關于多媒體播放的應用程序112,以準備播放歌曲。
另一方面,本實施例可以如步驟S212所述,檢查X是否等于Y。在本實 施例中,Y等于3,而此時X等于l,因此X不等于Y(就是步驟S212所標示 的"否,,),則執(zhí)行步驟S214,就是將X加l,并且重復執(zhí)行步驟S204等步 驟。
另外,處理單元104所執(zhí)行的第X個指令字符串所代表的動作,不一定 是要執(zhí)行某個應用程序。假設在步驟S206中,目前X等于3,也就是在加載的語音識別數(shù)據(jù)庫中搜尋是否符合歌名為"DDDD,,的歌曲。若是在加載語音 識別數(shù)據(jù)庫中尋找到符合"DDDD"的字符串,就可以使處理單元l(M對存儲 單元106執(zhí)行存取"DDDD,,歌曲的檔案數(shù)據(jù)ll4 (SnO)。并且由于X等于Y (就 是步驟S212所標示的"是"),則結束整個圖2的流程。
綜合圖2的說明,圖3提供了一個數(shù)據(jù)庫層級架構圖。請參照圖3,其 中包括了不同層級的語音識別數(shù)據(jù)庫302、 304和306。首先,本發(fā)明較佳實 施例為了要執(zhí)行一語音指令,可以先在較上級的語音識別數(shù)據(jù)庫302中搜尋 是否有符合的字符串。以上述的例子來說明,假設字符串312代表上述"播 放,,的指令字符串,當搜尋到312時,不但可以執(zhí)行字符串312所代表的動 作(例如啟動播放媒體),并且可以呼叫并加載下一層語音識別數(shù)據(jù)庫304。
假設,語音識別數(shù)據(jù)庫304的內(nèi)容包含所有歌手的名字,則本發(fā)明較佳 實施例可以在字符串312所代表的動作被執(zhí)行完時,繼續(xù)搜尋有否符合歌手 姓名為"AAA"的字符串。假設字符串314是符合的字符串時,則本發(fā)明可以 依據(jù)字符串314而呼叫語音識別數(shù)據(jù)庫306,例如是此歌手所有歌曲的列表。 藉此,使用者就可以利用便攜式計算機100正確的執(zhí)行「播放歌手AAA的歌 曲,其歌名叫DDDD」的動作。
圖4所示為依照本發(fā)明的一較佳實施例的一種比較指令字符串的步驟流 程圖。請參照圖4,當本實施例如上所述,要從加載的語音識別數(shù)據(jù)庫中比 較是否有符合的字符串時,可以如步驟SM2所述,依序組合此語音指令中第 k個字符到第m個字符間所有的字符,以產(chǎn)生一組合字符串。假設此語音指 令具有n個字符,則k可以為大于等于1而小于m的正整數(shù),而m可以是大 于k而小于等于n的正整數(shù),且n為大于l的正整數(shù)。
以上述的例子來說明,假設本實施例在搜尋在加載的語音識別數(shù)據(jù)庫中 是否有符合"AAA"的字符串。此時,k被設為3,而m的初始值被設為4, 因此所產(chǎn)生的組合字符串就為"AA,,。接著,本實施例可以如步驟S404所述, 在所加載的語音識別數(shù)據(jù)庫中,搜尋是否有字符串符合此組合字符串。
假設,在加載的數(shù)據(jù)庫中,并沒有符合"AA,,的字符串(就是步驟S404 中所標示的"否"),此時本實施例可以如步驟S406所述,判斷m是否等于 n。以上述為例,此語音指令包含9個字符,也就是說n等于9。因此,m不 等于11(就是步驟S4()6中所標示的"否,,),則本實施例可以執(zhí)行步驟S408,就是將m加l,此時m的值為5。反的,若是m等于n(就是步驟S406中所標 示的"是"),則如步驟S410所述,放棄執(zhí)行此語音指令。
回到步驟S408,由于m最新的值為5,因此新產(chǎn)生出來的組合字符串就 為"AAA"。接著,重復步驟S404。此時,假設在加載的語音識別數(shù)據(jù)庫中 搜尋到符合"AAA"的字符串時(就是步驟S404中所標示的"是"),則將此 組合字符串當作指令字符串,就如步驟S412所述。
雖然本發(fā)明已以較佳實施例揭露如上,然其并非用以限定本發(fā)明,任何 熟習此技藝者,在不脫離本發(fā)明的精神和范圍內(nèi),當可作些許的更動與潤飾, 因此本發(fā)明的保護范圍當視權利要求書所界定者為準。
權利要求
1.一種語音指令的處理方法,其特征是上述的語音指令包括Y個指令字符串,其中,Y為大于等于1的正整數(shù),上述的處理方法包括下述步驟提供多個語音識別數(shù)據(jù)庫;為了執(zhí)行上述的語音指令中第X個指令字符串,而從上述這些語音識別數(shù)據(jù)庫中加載對應的數(shù)據(jù)庫,其中,X為大于等于1而小于等于Y的正整數(shù);檢查所加載的語音識別數(shù)據(jù)庫內(nèi)是否有符合上述的第X個指令字符串的字符串;當從所加載的語音識別數(shù)據(jù)庫中搜尋到符合上述的第X個指令字符串的字符串時,則執(zhí)行上述的第X個指令字符串所代表的動作;以及當X不等于Y時,則將X加1。
2. 根據(jù)權利要求1所述的處理方法, 處理方法的流^f。
3. 根據(jù)權利要求1所述的處理方法, 內(nèi)沒有符合上述的語音指令的字符串時,
4. 根據(jù)權利要求1所述的處理方法 內(nèi)沒有符合上述的語音指令的字符串時,
5. 根據(jù)權利要求1所述的處理方法, 符,而n為正整數(shù)。
6. 根據(jù)權利要求5所述的處理方法, 串的步驟,包括依序組合上述的語音指令中第k個字符到第m個字符間所有的字符,以 產(chǎn)生一組合字符串,其中k為大于等于1而小于m的正整數(shù),而m為大于k 而小于等于n的正整數(shù);在對應的語音識別數(shù)據(jù)庫中搜尋是否有字符串符合上述的組合字符串;當在對應的語音識別數(shù)據(jù)庫中搜尋到有字符串符合上述的組合字符串 時,則將上述的組合字符串當作上述的第X個指令字符串;當沒有在對應的語音識別數(shù)據(jù)庫中搜尋到有字符串符合上述的組合字符 串時,則檢查m是否等于n;當m不等于n時,則將m力nl,并重新產(chǎn)生上述的組合字符串;以及其中,當X等于Y時,則結束整個其中,當所加載的語音識別數(shù)據(jù)庫 則放棄執(zhí)行上述的語音指令。 其中,當所加載的語音識別數(shù)據(jù)庫 則放棄執(zhí)行上述的語音指令。 其中,上述的語音指令包括n個字其中,比較上述的第X個指令字符當m等于n時,則放棄執(zhí)行上述的語音指令。
7. 根據(jù)權利要求1所述的處理方法,其中,執(zhí)行上述的第X個指令字符 串所代表的動作,包括執(zhí)行一應用程序和存取一數(shù)據(jù)文件二者其中之一。
8. 根據(jù)權利要求1所述的處理方法,更包括檢查一語音識別功能是否被 啟動。
9. 一種具有語音識別功能的便攜式計算機,其特征是包括 一輸入單元,用以接收一語音指令;一存儲單元,存儲有多個語音識別數(shù)據(jù)庫;以及 一處理單元,耦接上述的輸入單元和上述的存儲單元, 其中,當上述的語音識別功能被啟動,且一包含N個指令字符串的語音 指令從上述的輸入單元輸入后,則上述的處理單元為了執(zhí)行上述的語音指令 中第X個指令字符串,而從上述的存儲單元加載對應的語音識別數(shù)據(jù)庫,并 在加載的語音識別數(shù)據(jù)庫內(nèi)搜尋是否有符合上述的第X個指令字符串的字符 串,當從加載的語音識別數(shù)據(jù)庫內(nèi)搜尋到符合上述的第X個指令字符串的字 符串時,則執(zhí)行上述的第X個指令字符串所代表的動作,且當X不等于N時, 將X力口 1,而N為大于等于1的正整數(shù),X則為大于等于1而小于等于N的正 整數(shù)。
10. 根據(jù)權利要求9所述的便攜式計算機,其中,上述的輸入單元為一 指向性麥克風。
11. 根據(jù)權利要求9所述的便攜式計算機,其中,上述的存儲單元為一硬盤。
12. 根據(jù)權利要求9所述的便攜式計算機,其中,上述的處理單元具有 一寄存區(qū),用以存儲加載的上述這些語音識別數(shù)據(jù)庫。
13. 根據(jù)權利要求9所述的便攜式計算機,更包括一存儲單元,耦接上 述的處理單元,用以存放上述這些語音識別數(shù)據(jù)庫。
14. 根據(jù)權利要求U所述的便攜式計算機,其中,上述的存儲單元為一 動態(tài)隨機存取內(nèi)存。
15. 根據(jù)權利要求9所述的便攜式計算機,其中,上述的處理單元依據(jù) 上述的第X個指令字符串而執(zhí)行上述的存儲單元內(nèi)的一應用程序。
16,根據(jù)權利要求9所述的便攜式計算機,其中,上述的處理單元依據(jù) 上述的第X個指令字符串而對上述的存儲單元執(zhí)行一存取數(shù)據(jù)文件的程序二 者其中之一。
全文摘要
一種具有語音識別功能的便攜式計算機與其處理方法,在語音指令的處理方法中,而此語音指令包括Y個指令字符串,其中Y為大于等于1的正整數(shù)。本發(fā)明的處理方法包括提供多個語音識別數(shù)據(jù)庫,并且可以為了執(zhí)行語音指令中第X個指令字符串加載對應的語音識別數(shù)據(jù)庫,而X為大于等于1且小于等于N的正整數(shù)。當在所加載的語音識別數(shù)據(jù)庫中搜尋到符合第X個指令字符串的字符串時,則執(zhí)行第X個指令字符串所代表的動作,并且當X不等于Y時,則將X加1。
文檔編號G10L15/08GK101290767SQ200710097859
公開日2008年10月22日 申請日期2007年4月20日 優(yōu)先權日2007年4月20日
發(fā)明者周柏崴, 梁宏隆 申請人:華碩電腦股份有限公司