信息處理裝置、信息處理方法及存儲介質(zhì)的制作方法

文檔序號：2823589閱讀：261來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：信息處理裝置、信息處理方法及存儲介質(zhì)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明有關(guān)信息處理裝置、信息處理方法及存儲介質(zhì)。特別涉及聲音輸入和GUI并用進(jìn)行信息處理的裝置及其方法。
背景技術(shù)：
隨著聲音識別、合成技術(shù)的進(jìn)步，利用聲音的信息輸入裝置被實(shí)用化。利用聲音與其他裝置組合的信息輸入裝置也開始被使用了。在這樣的裝置中，能夠彌補(bǔ)各裝置的欠缺，靈活利用各裝置的優(yōu)點(diǎn)。
我們熟知了作為其中之一的組合了聲音輸入和GUI的接口裝置。它通過靈活利用聲音輸入及GUI的優(yōu)點(diǎn)進(jìn)行輸入，彌補(bǔ)了各自的缺點(diǎn)。
即，聲音是人與外界的自然交流手段，具有能夠容易地進(jìn)行輸入、輸出的優(yōu)點(diǎn)。但作為輸出裝置有著缺乏直觀性的缺點(diǎn)。另一方面，由于GUI作為輸出裝置具有直觀性，所以例如作為一覽顯示輸入項(xiàng)目(輸入字段)的輸入裝置，如果有菜單供選擇的話，就具有了能夠容易地輸入的優(yōu)點(diǎn)。但是，自由輸入具有處理麻煩的缺點(diǎn)(特別地，利用數(shù)字鍵輸入和手寫輸入的情況下上述缺點(diǎn)更加顯著)。
例如，以具有圖8所示的接口的音樂檢索系統(tǒng)為例進(jìn)行說明，它能夠通過藝術(shù)名、曲名、該曲使用的CM名稱中的任一個檢索曲目。輸出作為GUI(畫面顯示)，以各輸入項(xiàng)目的輸入作為聲音。
這種情況下，由于將信息顯示在畫面上，能夠通過藝術(shù)名、曲名、該曲使用的CM名稱中的任一個進(jìn)行檢索，所以能夠使使用者容易理解。另外，因?yàn)槟軌蚶寐曇粼诟鬏斎胱侄沃羞M(jìn)行輸入，輸入操作也很容易。
在此，識別輸入到各輸入字段中的聲音，是使用各自不同的文法進(jìn)行的。例如，識別藝術(shù)名使用藝術(shù)名的文法，識別曲名使用曲名的文法，識別CM名使用CM名的文法。
但是，在聲音輸入和GUI并用的情況下，如圖8所示存在多個輸入字段，則在有聲音輸入的情況下，就有必要判斷它是針對哪一個輸入字段的聲音輸入。
作為該方法，并不同時使用所有的輸入字段的文法進(jìn)行聲音識別，可以考慮對得到的識別結(jié)果原來是輸入到哪個輸入字段的進(jìn)行判斷。
在圖8的例子中，同時使用藝術(shù)名、曲名、CM名的文法進(jìn)行聲音識別，如果識別結(jié)果是CM名，就可以判斷為是針對CM名輸入字段的輸入。
在此就產(chǎn)生了問題，一般文法越大則聲音識別的識別率就越低。所以，在同時使用多個輸入字段的文法時，就產(chǎn)生了對聲音輸入的識別率低下的問題。

發(fā)明內(nèi)容
本發(fā)明鑒于上述問題，其目的是即使在有多個輸入字段的情況下，也能夠使得用于聲音識別的文法的規(guī)模不變大，提高對聲音輸入的識別率。
為達(dá)到上述目的，本發(fā)明的信息處理裝置具有以下結(jié)構(gòu)即輸入具有多個輸入項(xiàng)目的文件的輸入裝置；根據(jù)上述文件的顯示狀態(tài)，從上述多個輸入項(xiàng)目中判別出有效輸入項(xiàng)目的判別裝置；選擇與上述判別裝置判別為有效的輸入項(xiàng)目相對應(yīng)的特定的文法的選擇裝置。
另外，為達(dá)到上述目的，根據(jù)本發(fā)明的其他實(shí)施例的信息處理裝置具有以下結(jié)構(gòu)即輸入具有多個輸入項(xiàng)目的文件的輸入裝置；在上述文件中，對應(yīng)于該文件的顯示狀態(tài)判斷是否有選擇特定文法的指令的判斷裝置；對應(yīng)于上述判斷結(jié)果控制文法選擇的控制裝置。
另外，為達(dá)到上述目的，本發(fā)明的信息處理方法包括下列步驟輸入具有多個輸入項(xiàng)目的文件；根據(jù)上述文件的顯示狀態(tài)，從上述多個輸入項(xiàng)目中判別出有效輸入項(xiàng)目；選擇與上述判別步驟中判別為有效的輸入項(xiàng)目相對應(yīng)的特定的文法。
為達(dá)到上述目的，本發(fā)明的信息處理方法還具有輸入具有多個輸入項(xiàng)目的文件的輸入步驟；在上述文件中，對應(yīng)于該文件的顯示狀態(tài)判斷是否有選擇特定文法的指令的判斷步驟；對應(yīng)于上述判斷結(jié)果控制文法選擇的控制步驟。
另外，根據(jù)本發(fā)明，還提供在計算機(jī)上實(shí)現(xiàn)上述信息處理方法的控制程序、存儲有該控制程序的計算機(jī)可讀介質(zhì)及計算機(jī)程序產(chǎn)品。

圖1是顯示本發(fā)明的第1實(shí)施例的聲音接口裝置的基本結(jié)構(gòu)的框圖。
圖2是顯示第1實(shí)施例的聲音接口裝置的具體硬件結(jié)構(gòu)的框圖。
圖3是顯示第1實(shí)施例的處理步驟概要的流程圖。
圖4是顯示字段信息保存部件的數(shù)據(jù)結(jié)構(gòu)例子的圖。
圖5是表示文法保存部件的數(shù)據(jù)的結(jié)構(gòu)例子的圖。
圖6是表示第2實(shí)施例相關(guān)的聲音接口裝置的基本結(jié)構(gòu)的框圖。
圖7是表示第2實(shí)施例的處理步驟概要的流程圖。
圖8是表示輸入畫面的具體例子的圖。
圖9是說明輸入畫面的顯示部分和非顯示部分的圖。
圖10是表示超文本文件的表現(xiàn)例子的圖。
圖11是表示圖10所示的超文本文件的輸入畫面的具體顯示例子的圖。
圖12是表示輸入畫面的具體顯示例子的圖。
圖13是表示在使用如圖10所示的超文本文件的情況下的第2實(shí)施例的處理步驟概要的流程圖。
具體實(shí)施例方式
(第1實(shí)施例)以下，參照附圖對本發(fā)明進(jìn)行詳細(xì)說明。
圖1是表示本發(fā)明的信息輸入裝置、信息輸入方法及存儲介質(zhì)的第1實(shí)施例相關(guān)的裝置的基本結(jié)構(gòu)的框圖。
在圖1中，101是顯示信息的信息顯示部件。在信息顯示部件101中，也顯示輸入字段(輸入項(xiàng)目)的信息。102是從顯示在信息顯示部件101中的輸入字段中選擇一個的字段選擇部件。103是對是否有表示通過字段選擇部件102已經(jīng)選擇了輸入字段的信號輸入進(jìn)行檢測的輸入檢測部件。
104是根據(jù)字段選擇部件102發(fā)出的經(jīng)由輸入檢測部件103傳送來的選擇信號、判斷哪個輸入字段被選擇了的字段判斷部件。之后，將通過字段選擇部件102選擇的輸入字段稱為激活字段。
105是根據(jù)判斷部件104的判斷切換激活字段的字段切換部件。106是保存有關(guān)現(xiàn)在正在顯示的內(nèi)容中的所有字段的信息的字段信息保存部件。字段信息保存部件106的內(nèi)容如圖4所示。
即如圖4所示給各輸入字段賦予編號，保存輸入字段的編號、它的值(初始狀態(tài)時值未被設(shè)置)、識別該輸入字段的聲音時使用的文法的ID。
107是保存激活字段的激活字段保存部件。108是根據(jù)字段判斷部件105的判斷切換文法的文法切換字段。之后，將通過文法切換部件108選擇的文法稱為激活文法。
109是針對現(xiàn)在正在顯示在信息顯示部件101中的內(nèi)容，保存用于聲音輸入的所有文法的文法保存部件。文法保存部件109的內(nèi)容如圖5所示，由文法ID、各文法的描述組成。有關(guān)使用哪個文法的信息被記載在正在顯示的內(nèi)容中(有關(guān)這一點(diǎn)將參照圖10在后面敘述)。另外，文法自身可以從盤裝置(未圖示)和網(wǎng)絡(luò)上的服務(wù)器(未圖示)取得。
110是保存激活文法的ID的激活文法保存部件。111是輸入聲音的聲音輸入部件。112是利用保存在激活文法保存部件110中的文法，對從聲音輸入部件111輸入的聲音進(jìn)行識別的聲音識別部件。113是保存聲音識別部件112的識別結(jié)果的識別結(jié)果保存部件。
圖2是表示本實(shí)施例的聲音輸入裝置的具體硬件結(jié)構(gòu)的框圖。
在圖2中，201是CPU，依據(jù)實(shí)現(xiàn)后述步驟的程序進(jìn)行動作。202是存儲器，提供字段信息保存部件106、激活字段保存部件107、文法保存部件109、激活文法保存部件110、識別結(jié)果保存部件113，以及實(shí)現(xiàn)上述程序的動作所必要的存儲區(qū)域。
203是控制存儲器，存儲實(shí)現(xiàn)后述步驟的程序。204是位置指示裝置，構(gòu)成上述的字段選擇部件102。205是顯示器，構(gòu)成信息顯示部件101。206是麥克風(fēng)，構(gòu)成聲音輸入部件111。207是連接各構(gòu)成要素的總線。
下面，參照圖3所示的流程圖，說明本實(shí)施例的裝置的動作。在以下的說明中，以使用鼠標(biāo)作為選擇設(shè)備204的情況為例進(jìn)行說明。
在某內(nèi)容被顯示的時刻，把用于識別該內(nèi)容的各輸入字段的聲音的全部文法讀入文法保存部件109，在字段信息保存部件106中保存輸入文法與文法ID的對應(yīng)關(guān)系。
在最初的步驟S301，通過輸入檢測部件103對是否有鼠標(biāo)的輸入進(jìn)行調(diào)查。對鼠標(biāo)輸入的檢測，可以通過檢測鼠標(biāo)的點(diǎn)擊，或檢測鼠標(biāo)光標(biāo)在某目標(biāo)上停留規(guī)定時間來實(shí)現(xiàn)。循環(huán)該步驟直到有輸入為止。若有輸入了的話就前進(jìn)到步驟S302。
在步驟S302，調(diào)查在步驟S301檢測的輸入是否是選擇輸入字段的輸入。然后，在調(diào)查結(jié)果不是選擇輸入字段的情況下，返回步驟S301。在是選擇輸入字段的情況下，前進(jìn)到步驟S303。
在步驟S303，通過字段判斷部件104調(diào)查哪個輸入字段被選擇了。然后，通過字段切換部件105將選擇的輸入字段保存在激活字段保存部件107中。
在步驟S304，通過文法切換部件108，將激活文法保存在激活文法保存部件110中。激活文法就是在保存在文法保存部件109中的文法中與保存在激活字段保存部件107中的輸入字段相對應(yīng)的文法。通過字段信息保存部件106調(diào)查與現(xiàn)在的激活字段對應(yīng)的文法ID，從文法保存部件109中讀出與該文法ID相對應(yīng)的文法。
在步驟S305，調(diào)查是否從聲音輸入部件111輸入了聲音。循環(huán)該步驟直到聲音被輸入，若聲音被輸入了的話前進(jìn)到步驟S306。
在步驟S306，利用保存在激活文法保存部件110中的文法，通過聲音識別部件112對在步驟S305輸入的聲音進(jìn)行識別處理。聲音識別的結(jié)果被保存在識別結(jié)果保存部件113中。
在步驟S307，將保存在識別結(jié)果保存部件113中的結(jié)果保存到字段信息保存部件106中。即在圖4中，將識別結(jié)果保存到對應(yīng)于激活字段的“值”欄中。
在步驟S308，在信息顯示部件101中將保存在識別結(jié)果保存部件113中的結(jié)果顯示在保存在激活字段保存部件107中的輸入字段中。結(jié)束上述處理。
下面，以圖8的內(nèi)容為例，具體說明處理的內(nèi)容。在圖8中，第1輸入字段801的編號為1，第2輸入字段802的編號為2，第3輸入字段803的編號為3。
另外，藝術(shù)名的文法為第1文法A，曲名的文法為第2文法B，CM名的文法為文法C，則字段信息保存部件109的內(nèi)容成為如圖4所示那樣。在利用現(xiàn)有技術(shù)對輸入聲音進(jìn)行識別的情況下，使用第1文法A、第2文法B及第3文法C的全部三個文法。
而在本實(shí)施例中，利用鼠標(biāo)，例如如果選擇了第1輸入字段801，則只使用與第1輸入字段1對應(yīng)的第1文法A對輸入聲音進(jìn)行識別。由此，為了識別輸入聲音而使用的文法的規(guī)模與現(xiàn)有技術(shù)相比能夠相對較小。所以能夠大幅提高輸入聲音的識別率。
同樣地，如果利用鼠標(biāo)輸入了第2輸入字段802，則使用與第2輸入字段2對應(yīng)的第2文法B對輸入聲音進(jìn)行識別。如果選擇了第3輸入字段803，則只使用與第3輸入字段3對應(yīng)的第3文法C對輸入聲音進(jìn)行識別。
另外，在上述實(shí)施例中，對使用鼠標(biāo)來構(gòu)成字段選擇部件102的情況進(jìn)行了說明，但使用其他裝置也可以。例如，也可以用信息顯示部件101的顯示器作為觸摸屏，用筆或手指指定希望的字段。
另外，也可以利用數(shù)字鍵指定第n個輸入字段(任意的輸入字段)。即，用數(shù)值輸入的形式指定希望的字段也可以。另外，也可以利用視線輸入裝置，通過視線的方向指定輸入字段。
另外，也可以與輸入字段一一對應(yīng)地顯示聲音輸入用對象(按鈕、圖標(biāo)、圖象等)，通過選擇這些對象來選擇輸入字段。
另外，在上述實(shí)施例中，是在輸入字段被選擇的時刻切換聲音識別用的文法的，但也可以在聲音被輸入的時刻判斷激活的輸入字段，進(jìn)行文法的切換。
還有，在上述實(shí)施例中，也可以通過輸入字段的選擇操作，來指定聲音輸入的開始和結(jié)束。例如，可以以輸入字段被選擇的時刻作為聲音輸入的開始時間，而以輸入字段選擇結(jié)束的時刻作為聲音輸入的結(jié)束時間。例如，還可以在通過鼠標(biāo)操作將鼠標(biāo)指針放在輸入字段上的期間中，獲取聲音輸入。
在上述實(shí)施例中，使用GUI作為輸出裝置，使用聲音輸入作為輸入裝置，但并不限于此，也可以在輸入裝置中并用GUI，在輸出裝置中并用聲音。
(第2實(shí)施例)以下參照附圖詳細(xì)說明本發(fā)明的第2實(shí)施例。
圖6是展示與本發(fā)明的第2實(shí)施例相關(guān)的裝置的基本結(jié)構(gòu)的框圖。
在圖6中，601是顯示信息的信息顯示部件。該信息顯示部件601也顯示輸入字段的信息。
602是將實(shí)際顯示在信息顯示部件601上的內(nèi)容保存起來的顯示內(nèi)容保存部件。603是切換顯示在信息顯示部件601上的信息的顯示信息切換部件。特別在信息顯示部件的尺寸較小的情況下，通過顯示信息的切換操作可以使剩下的內(nèi)容依次被顯示出來。例如，該操作可以進(jìn)行頁切換、滾屏等操作。
604是對實(shí)際顯示在信息顯示部件601上的輸入字段進(jìn)行判斷的字段判斷部件。我們將顯示在信息顯示部件601上的輸入字段稱為激活字段。在本實(shí)施例的場合，與第1實(shí)施例不同，假設(shè)有不止一個激活字段的情況。
605是根據(jù)字段判斷部件604的判斷切換激活字段的字段切換部件。606是將與現(xiàn)在正在顯示的內(nèi)容中的所有輸入字段相關(guān)的信息保存起來的字段信息保存部件。字段信息保存部件606的內(nèi)容可以是例如圖4所示的那樣。
即，給各輸入字段標(biāo)上編號，保存輸入字段的編號、它的值(初始狀態(tài)下則值未被設(shè)定)、在識別該輸入字段的聲音時使用的文法的ID。
607是保存激活字段的激活字段保存部件。608是根據(jù)字段判斷部件604的判斷切換文法的文法切換部件。我們將通過文法切換部件608選擇的文法稱為激活文法。609是針對現(xiàn)在顯示在信息顯示部件601中的內(nèi)容，保存能夠用來識別輸入聲音的所有的文法文法保存部件。如圖5所示，文法顯示部件609的內(nèi)容由文法ID、對各文法的描述構(gòu)成。有關(guān)使用的文法的信息在顯示的內(nèi)容中被描述。另外，可以從盤裝置(未圖示)和網(wǎng)絡(luò)上的服務(wù)器(未圖示)取得文法。
610是保存激活文法的ID的激活文法保存部件。611是輸入聲音的聲音輸入部件。612是使用保存在激活文法保存部件610中的文法對從聲音輸入部件611輸入的聲音進(jìn)行識別的聲音識別部件。613是保存聲音識別部件612的識別結(jié)果的識別結(jié)果保存部件。
由于第2實(shí)施例的聲音輸入裝置的結(jié)構(gòu)與上述第1實(shí)施例中圖2所示的結(jié)構(gòu)相同，所以通過實(shí)施例1的圖2進(jìn)行說明。
在圖2中，201是CPU，它依據(jù)實(shí)現(xiàn)后述步驟的程序進(jìn)行動作。202是存儲器，提供顯示內(nèi)容保存部件602、字段信息保存部件606、激活字段保存部件607、激活文法保存部件610、識別結(jié)果保存部件613和上述程序的動作所必要的存儲區(qū)域。
203是控制存儲器，保存實(shí)現(xiàn)后述步驟的程序。204是位置指示裝置，實(shí)現(xiàn)顯示內(nèi)容切換部件603。205是顯示器，實(shí)現(xiàn)信息顯示部件601。206是麥克風(fēng)，實(shí)現(xiàn)聲音輸入部件611。207是連接各構(gòu)成要素的總線。
下面，參照圖7所示的流程圖，說明第2實(shí)施例的信息輸入裝置的動作。
在某內(nèi)容被顯示的時刻，從文法保存部件609中讀出用來識別該內(nèi)容的各輸入字段的聲音的所有文法，并將輸入字段與文法ID的對應(yīng)關(guān)系保存在字段信息保存部件606中。
在最初的步驟S701中，調(diào)查是否從聲音輸入部件611輸入了聲音。循環(huán)執(zhí)行該步驟S701直到有聲音輸入。輸入了聲音則前進(jìn)到步驟S702。
在步驟S702，根據(jù)顯示內(nèi)容保存部件602的內(nèi)容，調(diào)查現(xiàn)在哪個輸入字段實(shí)際正在被顯示。
在步驟S703通過字段切換部件605，將現(xiàn)在顯示的輸入字段保存到激活字段保存部件607中。
在步驟S704通過文法切換部件608，將激活文法保存到激活文法保存部件610中。在此，激活文法就是在保存在文法保存部件609中的文法中的與保存在激活字段保存部件607中的輸入字段對應(yīng)的文法。即，在字段信息保存部件606中調(diào)查與現(xiàn)在的激活字段對應(yīng)的文法ID，并從文法保存部件609中讀出與該文法ID對應(yīng)的文法。
在步驟S705，在聲音識別部件612中使用保存在激活文法保存部件610中的文法對在步驟S701輸入的聲音進(jìn)行識別處理。識別處理返回識別結(jié)果和識別使用的文法ID。即，雖然使用與多個種類的文法ID對應(yīng)的文法，但取得對每個文法ID的識別結(jié)果，將一致性最高的候補(bǔ)與該文法ID一起輸出。識別結(jié)果被保存在識別結(jié)果保存部件613中。
在步驟S706，根據(jù)在步驟S705取得的文法ID判斷是針對哪個輸入字段輸入的。由于文法ID與輸入字段的對應(yīng)關(guān)系被保存在字段信息保存部件606中，所以可以參照。例如，字段信息保存部件606的內(nèi)容如圖4所示的那樣，則激活字段為“1”和“3”。因此，若返回的是識別結(jié)果和作為文法ID的第3文法C，則由此可以知道該輸入是針對與第3文法C對應(yīng)的第3輸入字段3的輸入。
在步驟S707將保存在識別結(jié)果保存部件613中的結(jié)果保存到字段信息保存部件606中。即在圖4中，將識別結(jié)果保存到與被輸出的文法ID對應(yīng)的“值”欄中。在步驟S708，將保存在識別結(jié)果保存部件613中的結(jié)果顯示到在步驟S706判斷出的信息顯示部件601的輸入字段中。按以上的步驟，處理結(jié)束。
下面，以圖8的內(nèi)容為例，具體說明處理內(nèi)容。
圖8的內(nèi)容如圖9那樣被顯示出來。在該圖中，標(biāo)記了符號904的部分表示實(shí)際正在被顯示的部分，而標(biāo)記了符號905的部分表示未被顯示的部分。
輸入字段901的編號為1，輸入字段902的編號為2，輸入字段903的編號為3。若藝術(shù)名的文法為第1文法A，曲名的文法為第2文法B，CM名的文法為第3文法，則字段信息保存部件609的內(nèi)容如圖4所示。
在通過現(xiàn)有技術(shù)對輸入聲音進(jìn)行識別的情況下，會使用第1文法A、第2文法B、第3文法C三個文法。而在本實(shí)施例，由于實(shí)際被顯示的輸入字段只有901，所以只使用與輸入字段1對應(yīng)的文法A進(jìn)行輸入聲音的識別。由此，使用的文法規(guī)模與現(xiàn)有技術(shù)相比變小了，所以能夠提高識別率。
另外，在顯示了多個輸入字段的情況下，由于用于聲音識別的文法被局限于與顯示的輸入字段對應(yīng)的文法，所以能夠保持識別精度。另外，識別結(jié)果被適用于多個激活字段的任一個，根據(jù)聲音識別使用的文法來決定適用于哪個輸入字段。因此，即使多個輸入字段被顯示，也能夠自動、恰當(dāng)?shù)卦O(shè)定輸入字段的值(聲音識別結(jié)果)，提高了可操作性。
(第3實(shí)施例)以下，參照附圖詳細(xì)說明本發(fā)明的第3實(shí)施例。
第3實(shí)施例相關(guān)的裝置的基本結(jié)構(gòu)及硬件結(jié)構(gòu)與上述第2實(shí)施例中的圖6及圖2的結(jié)構(gòu)相同，所以省略詳細(xì)說明。
第3實(shí)施例與第2實(shí)施例的主要不同是在第2實(shí)施例中是用超文本來描述內(nèi)容的，以及對該內(nèi)容的處理。以下，參照圖10～圖13詳細(xì)進(jìn)行說明。
圖10是利用超文本文件表現(xiàn)內(nèi)容的一個例子。該超文本文件被保存在顯示內(nèi)容保存部件602中，并如圖11那樣通過信息顯示部件601被顯示出來。
圖10的101所示的標(biāo)記是用來指定文法的顯示聯(lián)動與否，即是否對應(yīng)顯示畫面的切換對文法進(jìn)行切換的標(biāo)記。在該標(biāo)記被設(shè)定了的情況下，與顯示聯(lián)動地切換文法，而在該標(biāo)記未被設(shè)定的情況下，不與顯示聯(lián)動地切換文法。詳細(xì)的說明用圖13所示的流程圖進(jìn)行。
102描述的是輸入到輸入字段的“藝術(shù)名”中的數(shù)據(jù)的類型、該輸入字段的大小、該輸入字段所使用的文法的所在位置信息(“http//temp/art.grm”)。103、104、105、106也一樣，描述的是與各輸入字段相關(guān)的信息和對應(yīng)各輸入字段存儲的文法的所在位置信息。
圖11是展示圖10所示的超文本通過信息顯示部件601顯示出來的狀態(tài)的圖。
圖11的內(nèi)容由4個輸入字段(1001、1002、1003、1004)組成。在顯示畫面足夠大的情況下，4個輸入字段可以全部顯示在一個畫面中。但在顯示畫面較小的情況下，如圖12所示只能顯示4個輸入字段的一部分。在該圖中顯示了1002、1003二個字段。在這種情況下，可以通過用滾動條上下移動畫面、變換畫面顯示狀態(tài)，來確認(rèn)未被顯示的部分。
下面，參照圖13所示的流程圖，說明本實(shí)施例的信息輸入裝置的動作。
在步驟S801，如圖10所示讀入超文本。在步驟S802對在步驟S801讀入的超文本進(jìn)行解析，并根據(jù)解析結(jié)果顯示圖11所示的GUI。根據(jù)該解析結(jié)果檢測出文法的位置，如“http//temp/art.grm”。另外，在標(biāo)記中，也解析在<form>標(biāo)記內(nèi)是否設(shè)置了“grmselect＝“display””等。
在步驟S803讀入在步驟S802根據(jù)文法位置信息檢測出來的文法，并將與藝術(shù)名、曲名、CM名、序列名對應(yīng)的4個文法保存到文法保存部件609中。另外，在步驟S804，根據(jù)步驟S802的解析結(jié)果，將字段信息即輸入字段與文法的對應(yīng)關(guān)系保存到字段信息保存部件606中。本實(shí)施例的場合，是將以下對應(yīng)地進(jìn)行保存的輸入字段1001對應(yīng)文法“http//temp/art.grm”，輸入字段1002對應(yīng)文法“http//temp/kyoku.grm”，輸入字段1003對應(yīng)文法“http//temp/cm.grm”，輸入字段1004對應(yīng)文法“http//temp/rank.grm”。
在步驟S805進(jìn)行聲音輸入的檢測，檢測出來的情況下前進(jìn)到步驟S806。在步驟S806，根據(jù)步驟S802的解析結(jié)果，判斷<form>標(biāo)記中是否設(shè)置了“grmselect＝“display””，即判斷是否與顯示聯(lián)動地切換使用的文法。設(shè)置了的情況下，前進(jìn)到步驟S808，未設(shè)置的情況下，前進(jìn)到步驟S807。
在未設(shè)置的情況下，在步驟S807設(shè)定所有的文法為激活文法。即，將4個文法都保存到激活文法保存部件610中，前進(jìn)到步驟S811的聲音識別處理。
在設(shè)置了的情況下，在步驟S808調(diào)查實(shí)際現(xiàn)在哪個字段正在被顯示。在步驟S809，將現(xiàn)在正在顯示的輸入字段保存到激活字段保存部件607中。在步驟S810，將在步驟S803保存了的4個文法中的與保存在激活字段保存部件607中的輸入字段對應(yīng)的文法作為激活文法保存到激活文法保存部件610中。在圖12的情況下，4個字段中的1002及1003二個輸入字段被顯示出來。與該二個輸入字段對應(yīng)的文法是“http//temp/kyoku.grm”，及“http//temp/cm.grm”，將該二個文法作為激活文法保存。
在步驟S811，使用在步驟S807或步驟S810中作為激活文法保存起來的文法，對輸入的聲音進(jìn)行識別處理。識別處理返回識別結(jié)果和識別所使用的文法的ID。該識別結(jié)果和識別所使用的文法的ID被保存到識別結(jié)果保存部件613中。
在步驟S812，根據(jù)在步驟S811取得的文法ID，判斷是針對哪個輸入字段的輸入。由于文法ID與輸入字段的對應(yīng)關(guān)系被保存在字段信息保存部件606中，所以可以參照。
在步驟S813，將保存在識別結(jié)果保存部件613中的識別結(jié)果保存到字段信息保存部件606中。具體的就是將識別結(jié)果保存到圖4的值欄中。
在步驟S814，將保存在識別結(jié)果保存部件613中的結(jié)果顯示到在步驟S812判斷出的信息顯示部件的輸入字段中。
然后，在通過檢索按鈕等指示了發(fā)送顯示在輸入字段中的識別結(jié)果的情況下，將識別結(jié)果發(fā)送到應(yīng)用程序，而應(yīng)用程序就依據(jù)識別結(jié)果進(jìn)行動作。
例如，在圖8的藝術(shù)名欄801中顯示了藝術(shù)名(識別結(jié)果)的狀態(tài)下，在按下了檢索按鈕的情況下，將顯示的藝術(shù)名等傳送到應(yīng)用程序，就能夠根據(jù)該藝術(shù)名得到檢索結(jié)果了。
以上處理結(jié)束。
在圖10的超文本中設(shè)置了“grmselect＝“display””，而如圖11那樣顯示的情況下，4個輸入字段都可以進(jìn)行輸入。而在圖12的情況下，則只有二個輸入字段可以進(jìn)行輸入。另外，在未設(shè)置的情況下，與該輸入字段是否被顯示無關(guān)，可以向4個輸入欄中進(jìn)行輸入。
根據(jù)本實(shí)施例，在顯示的輸入項(xiàng)目中有復(fù)雜的文法項(xiàng)目的情況下，通過控制不顯示該項(xiàng)目，能夠控制輸入字段，提高識別率。
另外，根據(jù)本實(shí)施例，由于只使用與實(shí)際顯示的輸入字段對應(yīng)的文法進(jìn)行聲音識別處理，所以能夠減小文法的規(guī)模，其結(jié)果是能夠提高對輸入聲音的識別率。
根據(jù)本實(shí)施例，對應(yīng)于表示是否與顯示畫面的切換對應(yīng)地進(jìn)行文法切換的標(biāo)記的有無，控制輸入字段，但并限于此。例如，也可以根據(jù)標(biāo)記內(nèi)的描述內(nèi)容控制輸入字段。具體地說就是，可以在標(biāo)記中設(shè)置了“grmselect＝“none””的情況下，使用所有的文法，而在設(shè)置了“grmselect＝“display””的情況下，與顯示器的顯示聯(lián)動地控制文法。在該情況下，可以在未設(shè)置標(biāo)記時，不進(jìn)行識別。
根據(jù)本實(shí)施例，將現(xiàn)在正在顯示的輸入字段作為激活字段處理。并不限于此，在使用了HTML文件的幀頁的情況下，或使用了多個窗口的情況下，可以將存在于現(xiàn)在激活的幀頁(由于幀頁是瀏覽頁中被劃分的區(qū)域，所以能夠在每個這樣的區(qū)域滾動文件)或窗口中的輸入字段作為激活字段處理。
根據(jù)本實(shí)施例，將GUI作為輸出裝置，將聲音作為輸入裝置，但并不限于此，可以并用GUI作為輸入裝置，并用聲音作為輸出裝置。
另外，在表示是否對應(yīng)于顯示畫面的切換進(jìn)行文法的切換的標(biāo)記被設(shè)置了的情況下，可以將其通知給用戶。具體地說就是可以考慮設(shè)置GUI上的指示器等。由此，用戶能夠事前知道是選擇了輸入字段的所有文法、還是選擇了被顯示的輸入字段的特定文法，能夠提高本信息處理裝置的操作性。
上述各實(shí)施例可以被適用于由多個機(jī)器構(gòu)成的系統(tǒng)中，也可以被適用于由一個機(jī)器構(gòu)成的裝置中。
另外，作為存儲實(shí)現(xiàn)上述各實(shí)施例的功能的控制程序的程序代碼的存儲介質(zhì)，可以使用例如軟盤、硬盤、光盤、光磁盤、CD-ROM、磁帶、非易失存儲卡、ROM等。
另外，在上述控制程序的程序代碼與中央處理裝置2中運(yùn)行的OS(操作系統(tǒng))或其他應(yīng)用軟件等的共同作用下實(shí)現(xiàn)上述實(shí)施例所示的功能的情況下，其程序代碼當(dāng)然也包含在本發(fā)明的實(shí)施例中。
本發(fā)明還包括下列情況在將上述控制程序的程序代碼存儲到功能擴(kuò)展板和功能擴(kuò)展單元具備的存儲器中后，根據(jù)該程序代碼的指令由該功能擴(kuò)展板和功能擴(kuò)展單元具備的CPU等進(jìn)行實(shí)際處理的一部分或全部，通過該處理實(shí)現(xiàn)上述實(shí)施例的功能。
如上所述，根據(jù)本發(fā)明，由于能夠與輸入項(xiàng)目的顯示狀態(tài)對應(yīng)地進(jìn)行聲音識別，所以能夠提高對輸入聲音的識別率。
權(quán)利要求
1.一種信息處理裝置，其特征在于包括輸入具有多個輸入項(xiàng)目的文件的輸入裝置；對應(yīng)于上述文件的顯示狀態(tài)，從上述多個輸入項(xiàng)目中判斷出有效的輸入項(xiàng)目的判斷裝置；以及選擇與上述判斷裝置判斷為有效的輸入項(xiàng)目相對應(yīng)的特定文法的選擇裝置。
2.根據(jù)權(quán)利要求1所述的信息處理裝置，其特征在于上述判斷裝置將顯示在顯示畫面上的輸入項(xiàng)目判別為有效的輸入項(xiàng)目。
3.根據(jù)權(quán)利要求1所述的信息處理裝置，其特征在于還包括輸入聲音的聲音輸入裝置；以及使用通過上述選擇裝置選擇的文法，對通過上述聲音輸入裝置輸入的聲音進(jìn)行識別的識別裝置。
4.根據(jù)權(quán)利要求3所述的信息處理裝置，其特征在于還包括判斷應(yīng)該輸入上述聲音識別裝置的識別結(jié)果的輸入項(xiàng)目的判斷裝置；以及進(jìn)行控制以便將上述識別結(jié)果輸入到由上述判斷裝置確定的輸入項(xiàng)目中的控制裝置。
5.根據(jù)權(quán)利要求1所述的信息處理裝置，其特征在于還包括切換顯示畫面上的顯示內(nèi)容的顯示切換裝置；其中在通過上述顯示切換裝置切換了顯示內(nèi)容的情況下，通過上述判斷裝置將顯示在顯示畫面上的輸入項(xiàng)目判別為有效的輸入項(xiàng)目。
6.根據(jù)權(quán)利要求5所述的信息處理裝置，其特征在于上述顯示切換裝置使顯示畫面滾動。
7.根據(jù)權(quán)利要求5所述的信息處理裝置，其特征在于上述顯示切換裝置切換幀頁。
8.一種信息處理裝置，其特征在于包括輸入具有多個輸入項(xiàng)目的文件的輸入裝置；在上述文書中，對應(yīng)于上述文件的顯示狀態(tài)，判斷是否指定了進(jìn)行選擇特定的文法的判斷裝置；以及對應(yīng)于上述判斷結(jié)果控制文法的選擇的控制裝置。
9.根據(jù)權(quán)利要求8所述的信息處理裝置，其特征在于在通過上述判斷裝置判斷出指定了根據(jù)文件的顯示狀態(tài)選擇特定的文法的情況下，上述控制裝置選擇與顯示畫面上顯示的輸入項(xiàng)目對應(yīng)的特定的文法。
10.根據(jù)權(quán)利要求8所述的信息處理裝置，其特征在于在通過上述判斷裝置判斷出未指定根據(jù)文件的顯示狀態(tài)選擇特定的文法的情況下，上述控制裝置選擇與上述文件中的輸入項(xiàng)目對應(yīng)的所有的文法。
11.根據(jù)權(quán)利要求8所述的信息處理裝置，其特征在于還包括輸入聲音的聲音輸入裝置；使用通過上述控制裝置選擇的文法，對通過上述聲音輸入裝置輸入的聲音進(jìn)行識別的聲音識別裝置。
12.根據(jù)權(quán)利要求11所述的信息處理裝置，其特征在于還包括判斷應(yīng)該輸入上述聲音識別裝置的識別結(jié)果的輸入項(xiàng)目的判斷裝置；以及進(jìn)行控制以便將上述識別結(jié)果輸入到由上述判斷裝置確定的輸入項(xiàng)目中的控制裝置。
13.根據(jù)權(quán)利要求8所述的信息處理裝置，其特征在于在上述文件中，在通過上述判斷裝置判斷出指定了根據(jù)該文件的顯示狀態(tài)選擇特定的文法的情況下，提示該信息的提示裝置。
14.一種信息處理方法，其特征在于包括輸入具有多個輸入項(xiàng)目的文件的輸入步驟；對應(yīng)于上述文件的顯示狀態(tài)，從上述多個輸入項(xiàng)目中判斷出有效的輸入項(xiàng)目的判斷步驟；以及選擇與在上述判斷步驟判斷為有效的輸入項(xiàng)目相對應(yīng)的特定文法的選擇步驟。
15.根據(jù)權(quán)利要求14所述的信息處理方法，其特征在于上述判斷步驟將顯示在顯示畫面上的輸入項(xiàng)目判別為有效的輸入項(xiàng)目。
16.根據(jù)權(quán)利要求14所述的信息處理方法，其特征在于還包括輸入聲音的聲音輸入步驟；以及使用在所述選擇步驟選擇的文法、對在上述聲音輸入步驟輸入的聲音進(jìn)行識別的識別裝置。
17.根據(jù)權(quán)利要求16所述的信息處理方法，其特征在于還包括判斷應(yīng)該輸入上述聲音識別步驟的識別結(jié)果的輸入項(xiàng)目的判斷步驟；以及進(jìn)行控制以便將識別結(jié)果輸入到在上述判斷步驟確定的輸入項(xiàng)目中的控制步驟。
18.根據(jù)權(quán)利要求14所述的信息處理方法，其特征在于還包括切換顯示畫面上的顯示內(nèi)容的顯示切換步驟；其中在上述顯示切換步驟切換了顯示內(nèi)容的情況下，通過上述判斷步驟將顯示在顯示畫面上的輸入項(xiàng)目判別為有效的輸入項(xiàng)目。
19.根據(jù)權(quán)利要求18所述的信息處理方法，其特征在于上述顯示切換步驟使顯示畫面滾動。
20.根據(jù)權(quán)利要求18所述的信息處理方法，其特征在于上述顯示切換步驟切換幀頁。
21.一種信息處理方法，其特征在于包括輸入具有多個輸入項(xiàng)目的文件的輸入步驟；判斷在上述文書中、對應(yīng)于該文件的顯示狀態(tài)是否指定了進(jìn)行選擇特定的文法的判斷步驟；以及對應(yīng)于上述判斷結(jié)果控制文法的選擇的控制步驟。
22.根據(jù)權(quán)利要求21所述的信息處理方法，其特征在于在通過上述判斷步驟判斷出指定了根據(jù)文件的顯示狀態(tài)選擇特定的文法的情況下，上述控制步驟選擇與顯示畫面上顯示的輸入項(xiàng)目對應(yīng)的特定的文法。
23.根據(jù)權(quán)利要求21所述的信息處理方法，其特征在于在通過上述判斷步驟判斷出未指定根據(jù)文件的顯示狀態(tài)選擇特定的文法的情況下，上述控制步驟選擇與上述文件中的輸入項(xiàng)目對應(yīng)的所有的文法。
24.根據(jù)權(quán)利要求21所述的信息處理方法，其特征在于還包括輸入聲音的聲音輸入步驟；使用在上述控制步驟選擇的文法，對在上述聲音輸入步驟中輸入的聲音進(jìn)行識別的聲音識別步驟。
25.根據(jù)權(quán)利要求24所述的信息處理裝置，其特征在于還包括判斷應(yīng)該輸入上述聲音識別步驟的識別結(jié)果的輸入項(xiàng)目的判斷步驟；以及進(jìn)行控制以便將識別結(jié)果輸入到在上述判斷步驟確定的輸入項(xiàng)目中的控制步驟。
26.根據(jù)權(quán)利要求21所述的信息處理方法，其特征在于還包括在上述文件中，在通過上述判斷步驟判斷出指定了根據(jù)該文件的顯示狀態(tài)選擇特定的文法的情況下，提示該信息的提示步驟。
27.一種存儲用于使計算機(jī)進(jìn)行信息處理的控制程序的計算機(jī)可讀介質(zhì)，其特征在于，該控制程序包括輸入具有多個輸入項(xiàng)目的文件的輸入步驟的代碼；對應(yīng)于上述文件的顯示狀態(tài)，從上述多個輸入項(xiàng)目中判斷出有效的輸入項(xiàng)目的判斷步驟的代碼；以及選擇與上述判斷步驟判斷為有效的輸入項(xiàng)目相對應(yīng)的特定文法的選擇步驟的代碼。
28.一種存儲用于使計算機(jī)進(jìn)行信息處理的控制程序的計算機(jī)可讀介質(zhì)，其特征在于，該控制程序包括輸入具有多個輸入項(xiàng)目的文件的輸入步驟的代碼；判斷在上述文書中、對應(yīng)于該文件的顯示狀態(tài)是否指定了進(jìn)行選擇特定的文法的判斷步驟的代碼；以及對應(yīng)于上述判斷結(jié)果控制文法的選擇的控制步驟的代碼。
29.一種用于使計算機(jī)進(jìn)行信息處理的控制程序，其特征在于包括輸入具有多個輸入項(xiàng)目的文件的輸入步驟的代碼；對應(yīng)于上述文件的顯示狀態(tài)，從上述多個輸入項(xiàng)目中判斷出有效的輸入項(xiàng)目的判斷步驟的代碼；以及選擇與上述判斷步驟判斷為有效的輸入項(xiàng)目相對應(yīng)的特定文法的選擇步驟的代碼。
30.一種用于使計算機(jī)進(jìn)行信息處理的控制程序，其特征在于包括輸入具有多個輸入項(xiàng)目的文件的輸入步驟的代碼；判斷在上述文書中、對應(yīng)于該文件的顯示狀態(tài)是否指定了進(jìn)行選擇特定的文法的判斷步驟的代碼；以及對應(yīng)于上述判斷結(jié)果控制文法的選擇的控制步驟的代碼。
全文摘要
本發(fā)明的信息處理裝置及方法、以及存儲介質(zhì)的特征在于輸入具有多個輸入項(xiàng)目的文件，并通過信息顯示部件(101)將其顯示出來。根據(jù)該文件的顯示狀態(tài)，從多個輸入項(xiàng)目中判別出有效的輸入項(xiàng)目。從保存有多種文法的文法保存部件(109)中，選擇與被判別為有效的輸入項(xiàng)目對應(yīng)的特定的文法，并將選擇的文法用于聲音識別處理。
文檔編號G10L15/18GK1470015SQ01817263
公開日2004年1月21日申請日期2001年10月11日優(yōu)先權(quán)日2000年10月11日
發(fā)明者小板哲夫, 上田隆也, 也, 伊藤史朗, 朗, 山本寬樹, 樹, 池田裕治, 治申請人:佳能株式會社

完整全部詳細(xì)技術(shù)資料下載