專利名稱:信息處理裝置、信息處理方法及存儲介質(zhì)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明有關(guān)信息處理裝置、信息處理方法及存儲介質(zhì)。特別涉及聲音輸入和GUI并用進(jìn)行信息處理的裝置及其方法。
背景技術(shù):
隨著聲音識別、合成技術(shù)的進(jìn)步,利用聲音的信息輸入裝置被實(shí)用化。利用聲音與其他裝置組合的信息輸入裝置也開始被使用了。在這樣的裝置中,能夠彌補(bǔ)各裝置的欠缺,靈活利用各裝置的優(yōu)點(diǎn)。
我們熟知了作為其中之一的組合了聲音輸入和GUI的接口裝置。它通過靈活利用聲音輸入及GUI的優(yōu)點(diǎn)進(jìn)行輸入,彌補(bǔ)了各自的缺點(diǎn)。
即,聲音是人與外界的自然交流手段,具有能夠容易地進(jìn)行輸入、輸出的優(yōu)點(diǎn)。但作為輸出裝置有著缺乏直觀性的缺點(diǎn)。另一方面,由于GUI作為輸出裝置具有直觀性,所以例如作為一覽顯示輸入項(xiàng)目(輸入字段)的輸入裝置,如果有菜單供選擇的話,就具有了能夠容易地輸入的優(yōu)點(diǎn)。但是,自由輸入具有處理麻煩的缺點(diǎn)(特別地,利用數(shù)字鍵輸入和手寫輸入的情況下上述缺點(diǎn)更加顯著)。
例如,以具有圖8所示的接口的音樂檢索系統(tǒng)為例進(jìn)行說明,它能夠通過藝術(shù)名、曲名、該曲使用的CM名稱中的任一個檢索曲目。輸出作為GUI(畫面顯示),以各輸入項(xiàng)目的輸入作為聲音。
這種情況下,由于將信息顯示在畫面上,能夠通過藝術(shù)名、曲名、該曲使用的CM名稱中的任一個進(jìn)行檢索,所以能夠使使用者容易理解。另外,因?yàn)槟軌蚶寐曇粼诟鬏斎胱侄沃羞M(jìn)行輸入,輸入操作也很容易。
在此,識別輸入到各輸入字段中的聲音,是使用各自不同的文法進(jìn)行的。例如,識別藝術(shù)名使用藝術(shù)名的文法,識別曲名使用曲名的文法,識別CM名使用CM名的文法。
但是,在聲音輸入和GUI并用的情況下,如圖8所示存在多個輸入字段,則在有聲音輸入的情況下,就有必要判斷它是針對哪一個輸入字段的聲音輸入。
作為該方法,并不同時使用所有的輸入字段的文法進(jìn)行聲音識別,可以考慮對得到的識別結(jié)果原來是輸入到哪個輸入字段的進(jìn)行判斷。
在圖8的例子中,同時使用藝術(shù)名、曲名、CM名的文法進(jìn)行聲音識別,如果識別結(jié)果是CM名,就可以判斷為是針對CM名輸入字段的輸入。
在此就產(chǎn)生了問題,一般文法越大則聲音識別的識別率就越低。所以,在同時使用多個輸入字段的文法時,就產(chǎn)生了對聲音輸入的識別率低下的問題。
發(fā)明內(nèi)容
本發(fā)明鑒于上述問題,其目的是即使在有多個輸入字段的情況下,也能夠使得用于聲音識別的文法的規(guī)模不變大,提高對聲音輸入的識別率。
為達(dá)到上述目的,本發(fā)明的信息處理裝置具有以下結(jié)構(gòu)即輸入具有多個輸入項(xiàng)目的文件的輸入裝置;根據(jù)上述文件的顯示狀態(tài),從上述多個輸入項(xiàng)目中判別出有效輸入項(xiàng)目的判別裝置;選擇與上述判別裝置判別為有效的輸入項(xiàng)目相對應(yīng)的特定的文法的選擇裝置。
另外,為達(dá)到上述目的,根據(jù)本發(fā)明的其他實(shí)施例的信息處理裝置具有以下結(jié)構(gòu)即輸入具有多個輸入項(xiàng)目的文件的輸入裝置;在上述文件中,對應(yīng)于該文件的顯示狀態(tài)判斷是否有選擇特定文法的指令的判斷裝置;對應(yīng)于上述判斷結(jié)果控制文法選擇的控制裝置。
另外,為達(dá)到上述目的,本發(fā)明的信息處理方法包括下列步驟輸入具有多個輸入項(xiàng)目的文件;根據(jù)上述文件的顯示狀態(tài),從上述多個輸入項(xiàng)目中判別出有效輸入項(xiàng)目;選擇與上述判別步驟中判別為有效的輸入項(xiàng)目相對應(yīng)的特定的文法。
為達(dá)到上述目的,本發(fā)明的信息處理方法還具有輸入具有多個輸入項(xiàng)目的文件的輸入步驟;在上述文件中,對應(yīng)于該文件的顯示狀態(tài)判斷是否有選擇特定文法的指令的判斷步驟;對應(yīng)于上述判斷結(jié)果控制文法選擇的控制步驟。
另外,根據(jù)本發(fā)明,還提供在計算機(jī)上實(shí)現(xiàn)上述信息處理方法的控制程序、存儲有該控制程序的計算機(jī)可讀介質(zhì)及計算機(jī)程序產(chǎn)品。
圖1是顯示本發(fā)明的第1實(shí)施例的聲音接口裝置的基本結(jié)構(gòu)的框圖。
圖2是顯示第1實(shí)施例的聲音接口裝置的具體硬件結(jié)構(gòu)的框圖。
圖3是顯示第1實(shí)施例的處理步驟概要的流程圖。
圖4是顯示字段信息保存部件的數(shù)據(jù)結(jié)構(gòu)例子的圖。
圖5是表示文法保存部件的數(shù)據(jù)的結(jié)構(gòu)例子的圖。
圖6是表示第2實(shí)施例相關(guān)的聲音接口裝置的基本結(jié)構(gòu)的框圖。
圖7是表示第2實(shí)施例的處理步驟概要的流程圖。
圖8是表示輸入畫面的具體例子的圖。
圖9是說明輸入畫面的顯示部分和非顯示部分的圖。
圖10是表示超文本文件的表現(xiàn)例子的圖。
圖11是表示圖10所示的超文本文件的輸入畫面的具體顯示例子的圖。
圖12是表示輸入畫面的具體顯示例子的圖。
圖13是表示在使用如圖10所示的超文本文件的情況下的第2實(shí)施例的處理步驟概要的流程圖。
具體實(shí)施例方式
(第1實(shí)施例)以下,參照附圖對本發(fā)明進(jìn)行詳細(xì)說明。
圖1是表示本發(fā)明的信息輸入裝置、信息輸入方法及存儲介質(zhì)的第1實(shí)施例相關(guān)的裝置的基本結(jié)構(gòu)的框圖。
在圖1中,101是顯示信息的信息顯示部件。在信息顯示部件101中,也顯示輸入字段(輸入項(xiàng)目)的信息。102是從顯示在信息顯示部件101中的輸入字段中選擇一個的字段選擇部件。103是對是否有表示通過字段選擇部件102已經(jīng)選擇了輸入字段的信號輸入進(jìn)行檢測的輸入檢測部件。
104是根據(jù)字段選擇部件102發(fā)出的經(jīng)由輸入檢測部件103傳送來的選擇信號、判斷哪個輸入字段被選擇了的字段判斷部件。之后,將通過字段選擇部件102選擇的輸入字段稱為激活字段。
105是根據(jù)判斷部件104的判斷切換激活字段的字段切換部件。106是保存有關(guān)現(xiàn)在正在顯示的內(nèi)容中的所有字段的信息的字段信息保存部件。字段信息保存部件106的內(nèi)容如圖4所示。
即如圖4所示給各輸入字段賦予編號,保存輸入字段的編號、它的值(初始狀態(tài)時值未被設(shè)置)、識別該輸入字段的聲音時使用的文法的ID。
107是保存激活字段的激活字段保存部件。108是根據(jù)字段判斷部件105的判斷切換文法的文法切換字段。之后,將通過文法切換部件108選擇的文法稱為激活文法。
109是針對現(xiàn)在正在顯示在信息顯示部件101中的內(nèi)容,保存用于聲音輸入的所有文法的文法保存部件。文法保存部件109的內(nèi)容如圖5所示,由文法ID、各文法的描述組成。有關(guān)使用哪個文法的信息被記載在正在顯示的內(nèi)容中(有關(guān)這一點(diǎn)將參照圖10在后面敘述)。另外,文法自身可以從盤裝置(未圖示)和網(wǎng)絡(luò)上的服務(wù)器(未圖示)取得。
110是保存激活文法的ID的激活文法保存部件。111是輸入聲音的聲音輸入部件。112是利用保存在激活文法保存部件110中的文法,對從聲音輸入部件111輸入的聲音進(jìn)行識別的聲音識別部件。113是保存聲音識別部件112的識別結(jié)果的識別結(jié)果保存部件。
圖2是表示本實(shí)施例的聲音輸入裝置的具體硬件結(jié)構(gòu)的框圖。
在圖2中,201是CPU,依據(jù)實(shí)現(xiàn)后述步驟的程序進(jìn)行動作。202是存儲器,提供字段信息保存部件106、激活字段保存部件107、文法保存部件109、激活文法保存部件110、識別結(jié)果保存部件113,以及實(shí)現(xiàn)上述程序的動作所必要的存儲區(qū)域。
203是控制存儲器,存儲實(shí)現(xiàn)后述步驟的程序。204是位置指示裝置,構(gòu)成上述的字段選擇部件102。205是顯示器,構(gòu)成信息顯示部件101。206是麥克風(fēng),構(gòu)成聲音輸入部件111。207是連接各構(gòu)成要素的總線。
下面,參照圖3所示的流程圖,說明本實(shí)施例的裝置的動作。在以下的說明中,以使用鼠標(biāo)作為選擇設(shè)備204的情況為例進(jìn)行說明。
在某內(nèi)容被顯示的時刻,把用于識別該內(nèi)容的各輸入字段的聲音的全部文法讀入文法保存部件109,在字段信息保存部件106中保存輸入文法與文法ID的對應(yīng)關(guān)系。
在最初的步驟S301,通過輸入檢測部件103對是否有鼠標(biāo)的輸入進(jìn)行調(diào)查。對鼠標(biāo)輸入的檢測,可以通過檢測鼠標(biāo)的點(diǎn)擊,或檢測鼠標(biāo)光標(biāo)在某目標(biāo)上停留規(guī)定時間來實(shí)現(xiàn)。循環(huán)該步驟直到有輸入為止。若有輸入了的話就前進(jìn)到步驟S302。
在步驟S302,調(diào)查在步驟S301檢測的輸入是否是選擇輸入字段的輸入。然后,在調(diào)查結(jié)果不是選擇輸入字段的情況下,返回步驟S301。在是選擇輸入字段的情況下,前進(jìn)到步驟S303。
在步驟S303,通過字段判斷部件104調(diào)查哪個輸入字段被選擇了。然后,通過字段切換部件105將選擇的輸入字段保存在激活字段保存部件107中。
在步驟S304,通過文法切換部件108,將激活文法保存在激活文法保存部件110中。激活文法就是在保存在文法保存部件109中的文法中與保存在激活字段保存部件107中的輸入字段相對應(yīng)的文法。通過字段信息保存部件106調(diào)查與現(xiàn)在的激活字段對應(yīng)的文法ID,從文法保存部件109中讀出與該文法ID相對應(yīng)的文法。
在步驟S305,調(diào)查是否從聲音輸入部件111輸入了聲音。循環(huán)該步驟直到聲音被輸入,若聲音被輸入了的話前進(jìn)到步驟S306。
在步驟S306,利用保存在激活文法保存部件110中的文法,通過聲音識別部件112對在步驟S305輸入的聲音進(jìn)行識別處理。聲音識別的結(jié)果被保存在識別結(jié)果保存部件113中。
在步驟S307,將保存在識別結(jié)果保存部件113中的結(jié)果保存到字段信息保存部件106中。即在圖4中,將識別結(jié)果保存到對應(yīng)于激活字段的“值”欄中。
在步驟S308,在信息顯示部件101中將保存在識別結(jié)果保存部件113中的結(jié)果顯示在保存在激活字段保存部件107中的輸入字段中。結(jié)束上述處理。
下面,以圖8的內(nèi)容為例,具體說明處理的內(nèi)容。在圖8中,第1輸入字段801的編號為1,第2輸入字段802的編號為2,第3輸入字段803的編號為3。
另外,藝術(shù)名的文法為第1文法A,曲名的文法為第2文法B,CM名的文法為文法C,則字段信息保存部件109的內(nèi)容成為如圖4所示那樣。在利用現(xiàn)有技術(shù)對輸入聲音進(jìn)行識別的情況下,使用第1文法A、第2文法B及第3文法C的全部三個文法。
而在本實(shí)施例中,利用鼠標(biāo),例如如果選擇了第1輸入字段801,則只使用與第1輸入字段1對應(yīng)的第1文法A對輸入聲音進(jìn)行識別。由此,為了識別輸入聲音而使用的文法的規(guī)模與現(xiàn)有技術(shù)相比能夠相對較小。所以能夠大幅提高輸入聲音的識別率。
同樣地,如果利用鼠標(biāo)輸入了第2輸入字段802,則使用與第2輸入字段2對應(yīng)的第2文法B對輸入聲音進(jìn)行識別。如果選擇了第3輸入字段803,則只使用與第3輸入字段3對應(yīng)的第3文法C對輸入聲音進(jìn)行識別。
另外,在上述實(shí)施例中,對使用鼠標(biāo)來構(gòu)成字段選擇部件102的情況進(jìn)行了說明,但使用其他裝置也可以。例如,也可以用信息顯示部件101的顯示器作為觸摸屏,用筆或手指指定希望的字段。
另外,也可以利用數(shù)字鍵指定第n個輸入字段(任意的輸入字段)。即,用數(shù)值輸入的形式指定希望的字段也可以。另外,也可以利用視線輸入裝置,通過視線的方向指定輸入字段。
另外,也可以與輸入字段一一對應(yīng)地顯示聲音輸入用對象(按鈕、圖標(biāo)、圖象等),通過選擇這些對象來選擇輸入字段。
另外,在上述實(shí)施例中,是在輸入字段被選擇的時刻切換聲音識別用的文法的,但也可以在聲音被輸入的時刻判斷激活的輸入字段,進(jìn)行文法的切換。
還有,在上述實(shí)施例中,也可以通過輸入字段的選擇操作,來指定聲音輸入的開始和結(jié)束。例如,可以以輸入字段被選擇的時刻作為聲音輸入的開始時間,而以輸入字段選擇結(jié)束的時刻作為聲音輸入的結(jié)束時間。例如,還可以在通過鼠標(biāo)操作將鼠標(biāo)指針放在輸入字段上的期間中,獲取聲音輸入。
在上述實(shí)施例中,使用GUI作為輸出裝置,使用聲音輸入作為輸入裝置,但并不限于此,也可以在輸入裝置中并用GUI,在輸出裝置中并用聲音。
(第2實(shí)施例)以下參照附圖詳細(xì)說明本發(fā)明的第2實(shí)施例。
圖6是展示與本發(fā)明的第2實(shí)施例相關(guān)的裝置的基本結(jié)構(gòu)的框圖。
在圖6中,601是顯示信息的信息顯示部件。該信息顯示部件601也顯示輸入字段的信息。
602是將實(shí)際顯示在信息顯示部件601上的內(nèi)容保存起來的顯示內(nèi)容保存部件。603是切換顯示在信息顯示部件601上的信息的顯示信息切換部件。特別在信息顯示部件的尺寸較小的情況下,通過顯示信息的切換操作可以使剩下的內(nèi)容依次被顯示出來。例如,該操作可以進(jìn)行頁切換、滾屏等操作。
604是對實(shí)際顯示在信息顯示部件601上的輸入字段進(jìn)行判斷的字段判斷部件。我們將顯示在信息顯示部件601上的輸入字段稱為激活字段。在本實(shí)施例的場合,與第1實(shí)施例不同,假設(shè)有不止一個激活字段的情況。
605是根據(jù)字段判斷部件604的判斷切換激活字段的字段切換部件。606是將與現(xiàn)在正在顯示的內(nèi)容中的所有輸入字段相關(guān)的信息保存起來的字段信息保存部件。字段信息保存部件606的內(nèi)容可以是例如圖4所示的那樣。
即,給各輸入字段標(biāo)上編號,保存輸入字段的編號、它的值(初始狀態(tài)下則值未被設(shè)定)、在識別該輸入字段的聲音時使用的文法的ID。
607是保存激活字段的激活字段保存部件。608是根據(jù)字段判斷部件604的判斷切換文法的文法切換部件。我們將通過文法切換部件608選擇的文法稱為激活文法。609是針對現(xiàn)在顯示在信息顯示部件601中的內(nèi)容,保存能夠用來識別輸入聲音的所有的文法文法保存部件。如圖5所示,文法顯示部件609的內(nèi)容由文法ID、對各文法的描述構(gòu)成。有關(guān)使用的文法的信息在顯示的內(nèi)容中被描述。另外,可以從盤裝置(未圖示)和網(wǎng)絡(luò)上的服務(wù)器(未圖示)取得文法。
610是保存激活文法的ID的激活文法保存部件。611是輸入聲音的聲音輸入部件。612是使用保存在激活文法保存部件610中的文法對從聲音輸入部件611輸入的聲音進(jìn)行識別的聲音識別部件。613是保存聲音識別部件612的識別結(jié)果的識別結(jié)果保存部件。
由于第2實(shí)施例的聲音輸入裝置的結(jié)構(gòu)與上述第1實(shí)施例中圖2所示的結(jié)構(gòu)相同,所以通過實(shí)施例1的圖2進(jìn)行說明。
在圖2中,201是CPU,它依據(jù)實(shí)現(xiàn)后述步驟的程序進(jìn)行動作。202是存儲器,提供顯示內(nèi)容保存部件602、字段信息保存部件606、激活字段保存部件607、激活文法保存部件610、識別結(jié)果保存部件613和上述程序的動作所必要的存儲區(qū)域。
203是控制存儲器,保存實(shí)現(xiàn)后述步驟的程序。204是位置指示裝置,實(shí)現(xiàn)顯示內(nèi)容切換部件603。205是顯示器,實(shí)現(xiàn)信息顯示部件601。206是麥克風(fēng),實(shí)現(xiàn)聲音輸入部件611。207是連接各構(gòu)成要素的總線。
下面,參照圖7所示的流程圖,說明第2實(shí)施例的信息輸入裝置的動作。
在某內(nèi)容被顯示的時刻,從文法保存部件609中讀出用來識別該內(nèi)容的各輸入字段的聲音的所有文法,并將輸入字段與文法ID的對應(yīng)關(guān)系保存在字段信息保存部件606中。
在最初的步驟S701中,調(diào)查是否從聲音輸入部件611輸入了聲音。循環(huán)執(zhí)行該步驟S701直到有聲音輸入。輸入了聲音則前進(jìn)到步驟S702。
在步驟S702,根據(jù)顯示內(nèi)容保存部件602的內(nèi)容,調(diào)查現(xiàn)在哪個輸入字段實(shí)際正在被顯示。
在步驟S703通過字段切換部件605,將現(xiàn)在顯示的輸入字段保存到激活字段保存部件607中。
在步驟S704通過文法切換部件608,將激活文法保存到激活文法保存部件610中。在此,激活文法就是在保存在文法保存部件609中的文法中的與保存在激活字段保存部件607中的輸入字段對應(yīng)的文法。即,在字段信息保存部件606中調(diào)查與現(xiàn)在的激活字段對應(yīng)的文法ID,并從文法保存部件609中讀出與該文法ID對應(yīng)的文法。
在步驟S705,在聲音識別部件612中使用保存在激活文法保存部件610中的文法對在步驟S701輸入的聲音進(jìn)行識別處理。識別處理返回識別結(jié)果和識別使用的文法ID。即,雖然使用與多個種類的文法ID對應(yīng)的文法,但取得對每個文法ID的識別結(jié)果,將一致性最高的候補(bǔ)與該文法ID一起輸出。識別結(jié)果被保存在識別結(jié)果保存部件613中。
在步驟S706,根據(jù)在步驟S705取得的文法ID判斷是針對哪個輸入字段輸入的。由于文法ID與輸入字段的對應(yīng)關(guān)系被保存在字段信息保存部件606中,所以可以參照。例如,字段信息保存部件606的內(nèi)容如圖4所示的那樣,則激活字段為“1”和“3”。因此,若返回的是識別結(jié)果和作為文法ID的第3文法C,則由此可以知道該輸入是針對與第3文法C對應(yīng)的第3輸入字段3的輸入。
在步驟S707將保存在識別結(jié)果保存部件613中的結(jié)果保存到字段信息保存部件606中。即在圖4中,將識別結(jié)果保存到與被輸出的文法ID對應(yīng)的“值”欄中。在步驟S708,將保存在識別結(jié)果保存部件613中的結(jié)果顯示到在步驟S706判斷出的信息顯示部件601的輸入字段中。按以上的步驟,處理結(jié)束。
下面,以圖8的內(nèi)容為例,具體說明處理內(nèi)容。
圖8的內(nèi)容如圖9那樣被顯示出來。在該圖中,標(biāo)記了符號904的部分表示實(shí)際正在被顯示的部分,而標(biāo)記了符號905的部分表示未被顯示的部分。
輸入字段901的編號為1,輸入字段902的編號為2,輸入字段903的編號為3。若藝術(shù)名的文法為第1文法A,曲名的文法為第2文法B,CM名的文法為第3文法,則字段信息保存部件609的內(nèi)容如圖4所示。
在通過現(xiàn)有技術(shù)對輸入聲音進(jìn)行識別的情況下,會使用第1文法A、第2文法B、第3文法C三個文法。而在本實(shí)施例,由于實(shí)際被顯示的輸入字段只有901,所以只使用與輸入字段1對應(yīng)的文法A進(jìn)行輸入聲音的識別。由此,使用的文法規(guī)模與現(xiàn)有技術(shù)相比變小了,所以能夠提高識別率。
另外,在顯示了多個輸入字段的情況下,由于用于聲音識別的文法被局限于與顯示的輸入字段對應(yīng)的文法,所以能夠保持識別精度。另外,識別結(jié)果被適用于多個激活字段的任一個,根據(jù)聲音識別使用的文法來決定適用于哪個輸入字段。因此,即使多個輸入字段被顯示,也能夠自動、恰當(dāng)?shù)卦O(shè)定輸入字段的值(聲音識別結(jié)果),提高了可操作性。
(第3實(shí)施例)以下,參照附圖詳細(xì)說明本發(fā)明的第3實(shí)施例。
第3實(shí)施例相關(guān)的裝置的基本結(jié)構(gòu)及硬件結(jié)構(gòu)與上述第2實(shí)施例中的圖6及圖2的結(jié)構(gòu)相同,所以省略詳細(xì)說明。
第3實(shí)施例與第2實(shí)施例的主要不同是在第2實(shí)施例中是用超文本來描述內(nèi)容的,以及對該內(nèi)容的處理。以下,參照圖10~圖13詳細(xì)進(jìn)行說明。
圖10是利用超文本文件表現(xiàn)內(nèi)容的一個例子。該超文本文件被保存在顯示內(nèi)容保存部件602中,并如圖11那樣通過信息顯示部件601被顯示出來。
圖10的101所示的標(biāo)記是用來指定文法的顯示聯(lián)動與否,即是否對應(yīng)顯示畫面的切換對文法進(jìn)行切換的標(biāo)記。在該標(biāo)記被設(shè)定了的情況下,與顯示聯(lián)動地切換文法,而在該標(biāo)記未被設(shè)定的情況下,不與顯示聯(lián)動地切換文法。詳細(xì)的說明用圖13所示的流程圖進(jìn)行。
102描述的是輸入到輸入字段的“藝術(shù)名”中的數(shù)據(jù)的類型、該輸入字段的大小、該輸入字段所使用的文法的所在位置信息(“http//temp/art.grm”)。103、104、105、106也一樣,描述的是與各輸入字段相關(guān)的信息和對應(yīng)各輸入字段存儲的文法的所在位置信息。
圖11是展示圖10所示的超文本通過信息顯示部件601顯示出來的狀態(tài)的圖。
圖11的內(nèi)容由4個輸入字段(1001、1002、1003、1004)組成。在顯示畫面足夠大的情況下,4個輸入字段可以全部顯示在一個畫面中。但在顯示畫面較小的情況下,如圖12所示只能顯示4個輸入字段的一部分。在該圖中顯示了1002、1003二個字段。在這種情況下,可以通過用滾動條上下移動畫面、變換畫面顯示狀態(tài),來確認(rèn)未被顯示的部分。
下面,參照圖13所示的流程圖,說明本實(shí)施例的信息輸入裝置的動作。
在步驟S801,如圖10所示讀入超文本。在步驟S802對在步驟S801讀入的超文本進(jìn)行解析,并根據(jù)解析結(jié)果顯示圖11所示的GUI。根據(jù)該解析結(jié)果檢測出文法的位置,如“http//temp/art.grm”。另外,在標(biāo)記中,也解析在<form>標(biāo)記內(nèi)是否設(shè)置了“grmselect=“display””等。
在步驟S803讀入在步驟S802根據(jù)文法位置信息檢測出來的文法,并將與藝術(shù)名、曲名、CM名、序列名對應(yīng)的4個文法保存到文法保存部件609中。另外,在步驟S804,根據(jù)步驟S802的解析結(jié)果,將字段信息即輸入字段與文法的對應(yīng)關(guān)系保存到字段信息保存部件606中。本實(shí)施例的場合,是將以下對應(yīng)地進(jìn)行保存的輸入字段1001對應(yīng)文法“http//temp/art.grm”,輸入字段1002對應(yīng)文法“http//temp/kyoku.grm”,輸入字段1003對應(yīng)文法“http//temp/cm.grm”,輸入字段1004對應(yīng)文法“http//temp/rank.grm”。
在步驟S805進(jìn)行聲音輸入的檢測,檢測出來的情況下前進(jìn)到步驟S806。在步驟S806,根據(jù)步驟S802的解析結(jié)果,判斷<form>標(biāo)記中是否設(shè)置了“grmselect=“display””,即判斷是否與顯示聯(lián)動地切換使用的文法。設(shè)置了的情況下,前進(jìn)到步驟S808,未設(shè)置的情況下,前進(jìn)到步驟S807。
在未設(shè)置的情況下,在步驟S807設(shè)定所有的文法為激活文法。即,將4個文法都保存到激活文法保存部件610中,前進(jìn)到步驟S811的聲音識別處理。
在設(shè)置了的情況下,在步驟S808調(diào)查實(shí)際現(xiàn)在哪個字段正在被顯示。在步驟S809,將現(xiàn)在正在顯示的輸入字段保存到激活字段保存部件607中。在步驟S810,將在步驟S803保存了的4個文法中的與保存在激活字段保存部件607中的輸入字段對應(yīng)的文法作為激活文法保存到激活文法保存部件610中。在圖12的情況下,4個字段中的1002及1003二個輸入字段被顯示出來。與該二個輸入字段對應(yīng)的文法是“http//temp/kyoku.grm”,及“http//temp/cm.grm”,將該二個文法作為激活文法保存。
在步驟S811,使用在步驟S807或步驟S810中作為激活文法保存起來的文法,對輸入的聲音進(jìn)行識別處理。識別處理返回識別結(jié)果和識別所使用的文法的ID。該識別結(jié)果和識別所使用的文法的ID被保存到識別結(jié)果保存部件613中。
在步驟S812,根據(jù)在步驟S811取得的文法ID,判斷是針對哪個輸入字段的輸入。由于文法ID與輸入字段的對應(yīng)關(guān)系被保存在字段信息保存部件606中,所以可以參照。
在步驟S813,將保存在識別結(jié)果保存部件613中的識別結(jié)果保存到字段信息保存部件606中。具體的就是將識別結(jié)果保存到圖4的值欄中。
在步驟S814,將保存在識別結(jié)果保存部件613中的結(jié)果顯示到在步驟S812判斷出的信息顯示部件的輸入字段中。
然后,在通過檢索按鈕等指示了發(fā)送顯示在輸入字段中的識別結(jié)果的情況下,將識別結(jié)果發(fā)送到應(yīng)用程序,而應(yīng)用程序就依據(jù)識別結(jié)果進(jìn)行動作。
例如,在圖8的藝術(shù)名欄801中顯示了藝術(shù)名(識別結(jié)果)的狀態(tài)下,在按下了檢索按鈕的情況下,將顯示的藝術(shù)名等傳送到應(yīng)用程序,就能夠根據(jù)該藝術(shù)名得到檢索結(jié)果了。
以上處理結(jié)束。
在圖10的超文本中設(shè)置了“grmselect=“display””,而如圖11那樣顯示的情況下,4個輸入字段都可以進(jìn)行輸入。而在圖12的情況下,則只有二個輸入字段可以進(jìn)行輸入。另外,在未設(shè)置的情況下,與該輸入字段是否被顯示無關(guān),可以向4個輸入欄中進(jìn)行輸入。
根據(jù)本實(shí)施例,在顯示的輸入項(xiàng)目中有復(fù)雜的文法項(xiàng)目的情況下,通過控制不顯示該項(xiàng)目,能夠控制輸入字段,提高識別率。
另外,根據(jù)本實(shí)施例,由于只使用與實(shí)際顯示的輸入字段對應(yīng)的文法進(jìn)行聲音識別處理,所以能夠減小文法的規(guī)模,其結(jié)果是能夠提高對輸入聲音的識別率。
根據(jù)本實(shí)施例,對應(yīng)于表示是否與顯示畫面的切換對應(yīng)地進(jìn)行文法切換的標(biāo)記的有無,控制輸入字段,但并限于此。例如,也可以根據(jù)標(biāo)記內(nèi)的描述內(nèi)容控制輸入字段。具體地說就是,可以在標(biāo)記中設(shè)置了“grmselect=“none””的情況下,使用所有的文法,而在設(shè)置了“grmselect=“display””的情況下,與顯示器的顯示聯(lián)動地控制文法。在該情況下,可以在未設(shè)置標(biāo)記時,不進(jìn)行識別。
根據(jù)本實(shí)施例,將現(xiàn)在正在顯示的輸入字段作為激活字段處理。并不限于此,在使用了HTML文件的幀頁的情況下,或使用了多個窗口的情況下,可以將存在于現(xiàn)在激活的幀頁(由于幀頁是瀏覽頁中被劃分的區(qū)域,所以能夠在每個這樣的區(qū)域滾動文件)或窗口中的輸入字段作為激活字段處理。
根據(jù)本實(shí)施例,將GUI作為輸出裝置,將聲音作為輸入裝置,但并不限于此,可以并用GUI作為輸入裝置,并用聲音作為輸出裝置。
另外,在表示是否對應(yīng)于顯示畫面的切換進(jìn)行文法的切換的標(biāo)記被設(shè)置了的情況下,可以將其通知給用戶。具體地說就是可以考慮設(shè)置GUI上的指示器等。由此,用戶能夠事前知道是選擇了輸入字段的所有文法、還是選擇了被顯示的輸入字段的特定文法,能夠提高本信息處理裝置的操作性。
上述各實(shí)施例可以被適用于由多個機(jī)器構(gòu)成的系統(tǒng)中,也可以被適用于由一個機(jī)器構(gòu)成的裝置中。
另外,作為存儲實(shí)現(xiàn)上述各實(shí)施例的功能的控制程序的程序代碼的存儲介質(zhì),可以使用例如軟盤、硬盤、光盤、光磁盤、CD-ROM、磁帶、非易失存儲卡、ROM等。
另外,在上述控制程序的程序代碼與中央處理裝置2中運(yùn)行的OS(操作系統(tǒng))或其他應(yīng)用軟件等的共同作用下實(shí)現(xiàn)上述實(shí)施例所示的功能的情況下,其程序代碼當(dāng)然也包含在本發(fā)明的實(shí)施例中。
本發(fā)明還包括下列情況在將上述控制程序的程序代碼存儲到功能擴(kuò)展板和功能擴(kuò)展單元具備的存儲器中后,根據(jù)該程序代碼的指令由該功能擴(kuò)展板和功能擴(kuò)展單元具備的CPU等進(jìn)行實(shí)際處理的一部分或全部,通過該處理實(shí)現(xiàn)上述實(shí)施例的功能。
如上所述,根據(jù)本發(fā)明,由于能夠與輸入項(xiàng)目的顯示狀態(tài)對應(yīng)地進(jìn)行聲音識別,所以能夠提高對輸入聲音的識別率。
權(quán)利要求
1.一種信息處理裝置,其特征在于包括輸入具有多個輸入項(xiàng)目的文件的輸入裝置;對應(yīng)于上述文件的顯示狀態(tài),從上述多個輸入項(xiàng)目中判斷出有效的輸入項(xiàng)目的判斷裝置;以及選擇與上述判斷裝置判斷為有效的輸入項(xiàng)目相對應(yīng)的特定文法的選擇裝置。
2.根據(jù)權(quán)利要求1所述的信息處理裝置,其特征在于上述判斷裝置將顯示在顯示畫面上的輸入項(xiàng)目判別為有效的輸入項(xiàng)目。
3.根據(jù)權(quán)利要求1所述的信息處理裝置,其特征在于還包括輸入聲音的聲音輸入裝置;以及使用通過上述選擇裝置選擇的文法,對通過上述聲音輸入裝置輸入的聲音進(jìn)行識別的識別裝置。
4.根據(jù)權(quán)利要求3所述的信息處理裝置,其特征在于還包括判斷應(yīng)該輸入上述聲音識別裝置的識別結(jié)果的輸入項(xiàng)目的判斷裝置;以及進(jìn)行控制以便將上述識別結(jié)果輸入到由上述判斷裝置確定的輸入項(xiàng)目中的控制裝置。
5.根據(jù)權(quán)利要求1所述的信息處理裝置,其特征在于還包括切換顯示畫面上的顯示內(nèi)容的顯示切換裝置;其中在通過上述顯示切換裝置切換了顯示內(nèi)容的情況下,通過上述判斷裝置將顯示在顯示畫面上的輸入項(xiàng)目判別為有效的輸入項(xiàng)目。
6.根據(jù)權(quán)利要求5所述的信息處理裝置,其特征在于上述顯示切換裝置使顯示畫面滾動。
7.根據(jù)權(quán)利要求5所述的信息處理裝置,其特征在于上述顯示切換裝置切換幀頁。
8.一種信息處理裝置,其特征在于包括輸入具有多個輸入項(xiàng)目的文件的輸入裝置;在上述文書中,對應(yīng)于上述文件的顯示狀態(tài),判斷是否指定了進(jìn)行選擇特定的文法的判斷裝置;以及對應(yīng)于上述判斷結(jié)果控制文法的選擇的控制裝置。
9.根據(jù)權(quán)利要求8所述的信息處理裝置,其特征在于在通過上述判斷裝置判斷出指定了根據(jù)文件的顯示狀態(tài)選擇特定的文法的情況下,上述控制裝置選擇與顯示畫面上顯示的輸入項(xiàng)目對應(yīng)的特定的文法。
10.根據(jù)權(quán)利要求8所述的信息處理裝置,其特征在于在通過上述判斷裝置判斷出未指定根據(jù)文件的顯示狀態(tài)選擇特定的文法的情況下,上述控制裝置選擇與上述文件中的輸入項(xiàng)目對應(yīng)的所有的文法。
11.根據(jù)權(quán)利要求8所述的信息處理裝置,其特征在于還包括輸入聲音的聲音輸入裝置;使用通過上述控制裝置選擇的文法,對通過上述聲音輸入裝置輸入的聲音進(jìn)行識別的聲音識別裝置。
12.根據(jù)權(quán)利要求11所述的信息處理裝置,其特征在于還包括判斷應(yīng)該輸入上述聲音識別裝置的識別結(jié)果的輸入項(xiàng)目的判斷裝置;以及進(jìn)行控制以便將上述識別結(jié)果輸入到由上述判斷裝置確定的輸入項(xiàng)目中的控制裝置。
13.根據(jù)權(quán)利要求8所述的信息處理裝置,其特征在于在上述文件中,在通過上述判斷裝置判斷出指定了根據(jù)該文件的顯示狀態(tài)選擇特定的文法的情況下,提示該信息的提示裝置。
14.一種信息處理方法,其特征在于包括輸入具有多個輸入項(xiàng)目的文件的輸入步驟;對應(yīng)于上述文件的顯示狀態(tài),從上述多個輸入項(xiàng)目中判斷出有效的輸入項(xiàng)目的判斷步驟;以及選擇與在上述判斷步驟判斷為有效的輸入項(xiàng)目相對應(yīng)的特定文法的選擇步驟。
15.根據(jù)權(quán)利要求14所述的信息處理方法,其特征在于上述判斷步驟將顯示在顯示畫面上的輸入項(xiàng)目判別為有效的輸入項(xiàng)目。
16.根據(jù)權(quán)利要求14所述的信息處理方法,其特征在于還包括輸入聲音的聲音輸入步驟;以及使用在所述選擇步驟選擇的文法、對在上述聲音輸入步驟輸入的聲音進(jìn)行識別的識別裝置。
17.根據(jù)權(quán)利要求16所述的信息處理方法,其特征在于還包括判斷應(yīng)該輸入上述聲音識別步驟的識別結(jié)果的輸入項(xiàng)目的判斷步驟;以及進(jìn)行控制以便將識別結(jié)果輸入到在上述判斷步驟確定的輸入項(xiàng)目中的控制步驟。
18.根據(jù)權(quán)利要求14所述的信息處理方法,其特征在于還包括切換顯示畫面上的顯示內(nèi)容的顯示切換步驟;其中在上述顯示切換步驟切換了顯示內(nèi)容的情況下,通過上述判斷步驟將顯示在顯示畫面上的輸入項(xiàng)目判別為有效的輸入項(xiàng)目。
19.根據(jù)權(quán)利要求18所述的信息處理方法,其特征在于上述顯示切換步驟使顯示畫面滾動。
20.根據(jù)權(quán)利要求18所述的信息處理方法,其特征在于上述顯示切換步驟切換幀頁。
21.一種信息處理方法,其特征在于包括輸入具有多個輸入項(xiàng)目的文件的輸入步驟;判斷在上述文書中、對應(yīng)于該文件的顯示狀態(tài)是否指定了進(jìn)行選擇特定的文法的判斷步驟;以及對應(yīng)于上述判斷結(jié)果控制文法的選擇的控制步驟。
22.根據(jù)權(quán)利要求21所述的信息處理方法,其特征在于在通過上述判斷步驟判斷出指定了根據(jù)文件的顯示狀態(tài)選擇特定的文法的情況下,上述控制步驟選擇與顯示畫面上顯示的輸入項(xiàng)目對應(yīng)的特定的文法。
23.根據(jù)權(quán)利要求21所述的信息處理方法,其特征在于在通過上述判斷步驟判斷出未指定根據(jù)文件的顯示狀態(tài)選擇特定的文法的情況下,上述控制步驟選擇與上述文件中的輸入項(xiàng)目對應(yīng)的所有的文法。
24.根據(jù)權(quán)利要求21所述的信息處理方法,其特征在于還包括輸入聲音的聲音輸入步驟;使用在上述控制步驟選擇的文法,對在上述聲音輸入步驟中輸入的聲音進(jìn)行識別的聲音識別步驟。
25.根據(jù)權(quán)利要求24所述的信息處理裝置,其特征在于還包括判斷應(yīng)該輸入上述聲音識別步驟的識別結(jié)果的輸入項(xiàng)目的判斷步驟;以及進(jìn)行控制以便將識別結(jié)果輸入到在上述判斷步驟確定的輸入項(xiàng)目中的控制步驟。
26.根據(jù)權(quán)利要求21所述的信息處理方法,其特征在于還包括在上述文件中,在通過上述判斷步驟判斷出指定了根據(jù)該文件的顯示狀態(tài)選擇特定的文法的情況下,提示該信息的提示步驟。
27.一種存儲用于使計算機(jī)進(jìn)行信息處理的控制程序的計算機(jī)可讀介質(zhì),其特征在于,該控制程序包括輸入具有多個輸入項(xiàng)目的文件的輸入步驟的代碼;對應(yīng)于上述文件的顯示狀態(tài),從上述多個輸入項(xiàng)目中判斷出有效的輸入項(xiàng)目的判斷步驟的代碼;以及選擇與上述判斷步驟判斷為有效的輸入項(xiàng)目相對應(yīng)的特定文法的選擇步驟的代碼。
28.一種存儲用于使計算機(jī)進(jìn)行信息處理的控制程序的計算機(jī)可讀介質(zhì),其特征在于,該控制程序包括輸入具有多個輸入項(xiàng)目的文件的輸入步驟的代碼;判斷在上述文書中、對應(yīng)于該文件的顯示狀態(tài)是否指定了進(jìn)行選擇特定的文法的判斷步驟的代碼;以及對應(yīng)于上述判斷結(jié)果控制文法的選擇的控制步驟的代碼。
29.一種用于使計算機(jī)進(jìn)行信息處理的控制程序,其特征在于包括輸入具有多個輸入項(xiàng)目的文件的輸入步驟的代碼;對應(yīng)于上述文件的顯示狀態(tài),從上述多個輸入項(xiàng)目中判斷出有效的輸入項(xiàng)目的判斷步驟的代碼;以及選擇與上述判斷步驟判斷為有效的輸入項(xiàng)目相對應(yīng)的特定文法的選擇步驟的代碼。
30.一種用于使計算機(jī)進(jìn)行信息處理的控制程序,其特征在于包括輸入具有多個輸入項(xiàng)目的文件的輸入步驟的代碼;判斷在上述文書中、對應(yīng)于該文件的顯示狀態(tài)是否指定了進(jìn)行選擇特定的文法的判斷步驟的代碼;以及對應(yīng)于上述判斷結(jié)果控制文法的選擇的控制步驟的代碼。
全文摘要
本發(fā)明的信息處理裝置及方法、以及存儲介質(zhì)的特征在于輸入具有多個輸入項(xiàng)目的文件,并通過信息顯示部件(101)將其顯示出來。根據(jù)該文件的顯示狀態(tài),從多個輸入項(xiàng)目中判別出有效的輸入項(xiàng)目。從保存有多種文法的文法保存部件(109)中,選擇與被判別為有效的輸入項(xiàng)目對應(yīng)的特定的文法,并將選擇的文法用于聲音識別處理。
文檔編號G10L15/18GK1470015SQ01817263
公開日2004年1月21日 申請日期2001年10月11日 優(yōu)先權(quán)日2000年10月11日
發(fā)明者小板哲夫, 上田隆也, 也, 伊藤史朗, 朗, 山本寬樹, 樹, 池田裕治, 治 申請人:佳能株式會社