欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

機(jī)器人裝置及其行為控制方法

文檔序號:6559001閱讀:131來源:國知局
專利名稱:機(jī)器人裝置及其行為控制方法
技術(shù)領(lǐng)域
本發(fā)明涉及機(jī)器人裝置及控制其行為的方法。
背景技術(shù)
近年來,仿照動物,比如狗的外貌形成的機(jī)器人裝置正在出現(xiàn)在市場上。這種機(jī)器人裝置響應(yīng)外部信息或其自身內(nèi)部狀態(tài),比如其感覺狀態(tài),行動像動物。在這些機(jī)器人當(dāng)中,存在著能做出踢球這樣的行為的一種,同時也存在為其提供學(xué)習(xí)功能的一種。在這些學(xué)習(xí)功能中,一種為語音學(xué)習(xí)功能。
寵物型機(jī)器人中的一個最終目標(biāo)是,產(chǎn)生逼真的機(jī)器人裝置,或換句話說,構(gòu)造一個可擴(kuò)充的系統(tǒng)。
迄今為止已經(jīng)通過提高機(jī)器人裝置的外觀復(fù)雜性,嘗試接近構(gòu)造逼真機(jī)器人裝置的目標(biāo)。這也考慮到學(xué)習(xí)或成長元素。
但是,在組裝這些功能時,常規(guī)的做法一直是改變對于行為產(chǎn)生固定設(shè)定的概率狀態(tài)機(jī)的概率,或整個地更換狀態(tài)機(jī)。
雖然通過與用戶或外部世界的交互改變了行為發(fā)生的頻率,從而提高了適合于機(jī)器人裝置的復(fù)雜性,但是,不能夠說,這樣的復(fù)雜性在設(shè)計者(編程者)原來預(yù)先假定的行為或反應(yīng)的范圍之外。相似地,機(jī)器人能夠識別的對象受到限制,使得機(jī)器人裝置不能夠識別編程者設(shè)定的之外的對象。這表示當(dāng)前機(jī)器人裝置缺乏確定如何對未知刺激做出反應(yīng)的能力。
下面是產(chǎn)生可擴(kuò)充系統(tǒng)所需要的而其可能在設(shè)計者設(shè)定的范圍外的能力(1)識別未知刺激的能力;(2)產(chǎn)生新行為的能力;和(3)針對未知刺激選擇適當(dāng)行為的能力。
如果考慮到所指的機(jī)器人裝置是寵物型的機(jī)器人的這一事實,則寵物型機(jī)器人與人類交互的能力是特別重要的。事實上,在學(xué)習(xí)各種未知事物時,寵物型機(jī)器人通過與人類的交互學(xué)習(xí)它們。
在與人類交互中最重要的是通過語言交流。至于識別未知刺激的能力(1),最佳分類、獲取作為符號的名字和獲取行為的名字,被認(rèn)為是第一步驟。這是稱為語言獲取的研究領(lǐng)域。如所指出的,關(guān)鍵的是這些符號是物理相關(guān)或以物理為基礎(chǔ)的。
例如,這點在如下的報告中指出Kaplan等人的報告(在下面稱為參考資料1,Kaplan,F(xiàn).撰寫的“交談(Talking)AIBO與自主的四腿機(jī)器人的語言交互的第一試驗(First experimentation of verbal interactions with an autonomousfour-legged robot)”,刊載在關(guān)于交互作用智能媒體的CELE-Twente專題研討會會議錄(proceedings of the CECLE-Twentte on interacting agents)中,2000年10月),Roy等人的報告(下面稱為參考資料2,Roy,D.和Pentland A.撰寫的“從自然聲至視覺輸入學(xué)習(xí)字(Learning Words from Natural Audio-Visual Input)”,刊載在關(guān)于口語語言處理的國際會議會議錄(Proceedings of InternationalConference on Spoken Language Processing)中,1998年),和Steels等人的報告(下面稱為參考資料3,Steels,L.撰寫的“以感知為基礎(chǔ)的意義創(chuàng)造(PerceptuallyGrounded Meaning Creation)”,刊載在關(guān)于多智能媒體系統(tǒng)的國際會議會議錄(Proceedings of the International Conference on Multi-Agent System)中,1996年)。
上述(2)的行為獲取,可以用通過模仿的行為獲取、通過強(qiáng)化學(xué)習(xí)的行為獲取和從進(jìn)化計算的行為獲取示范說明。
例如,這點在以下報告中指出Damasio的報告(下面稱為參考資料4,Damasio,A.撰寫的“Descartes’Error情感和人的大腦(Emotion,and theHuman Brain)”,Putman出版集團(tuán)(Putman Publishing Group),1994年),Mataric的報告(下面稱為參考資料5,Mataric,M.撰寫的“作為模仿基礎(chǔ)的傳感發(fā)動機(jī)基原將感知聯(lián)結(jié)到動作和將生物學(xué)聯(lián)結(jié)到機(jī)器人(Sensory-MotorPrimitives as a basis for ImitationLinking Perception to Actin and Biology toRobotics)”,刊載在C.Nehniv和K.Dautenhalm(eds)著“動物和人工制品的模仿(Imitation in Animals and Artifacts)”中,MIT出版社(press)出版,2000年)。
至于對未知刺激的適當(dāng)?shù)姆磻?yīng)行為(3),只報告了在現(xiàn)實世界中的極原始行為,或在虛擬世界中的幾個相關(guān)行為。
上述能力(3)的涵義是,如何獲取對象對機(jī)器人裝置所具有的意義,例如,它是否是食物,玩具或可怕的東西。在該方面,不僅從身體上使識別對象與之相關(guān)或授之所識別對象的基礎(chǔ)知識是必須的,而且識別該識別對象如何影響機(jī)器人裝置的內(nèi)部狀態(tài),如例如,主要情感或次要情感也是必須的。

發(fā)明內(nèi)容
鑒于上述技術(shù)狀態(tài),本發(fā)明的目的是提供一種制造得更逼真的機(jī)器人裝置以及控制所述機(jī)器人裝置的行為的方法。
為解決上述問題,本發(fā)明的機(jī)器人裝置包括意義獲取部件,用于獲取對象的意義。這樣構(gòu)造的機(jī)器人裝置獲取對象的意義。為解決上述問題,本發(fā)明的機(jī)器人裝置的行為控制方法還獲取、當(dāng)基于內(nèi)部狀態(tài)行動的機(jī)器人裝置對對象采取行動時產(chǎn)生的、機(jī)器人裝置的內(nèi)部狀態(tài)變化,作為對象的意義。
用機(jī)器人裝置的行為控制方法,所述機(jī)器人基于其內(nèi)部狀態(tài)行動,并獲取當(dāng)基于內(nèi)部狀態(tài)行動的機(jī)器人對對象采取行動時產(chǎn)生的內(nèi)部狀態(tài)變化,作為對象的意義。
為達(dá)到上述目的,機(jī)器人裝置還包括語音輸入部件,和特征化多個字序列的多個模型,其中,基于發(fā)出字序列時占優(yōu)勢的字序列的特征值對所述模型進(jìn)行分類。所述機(jī)器人還包括語音輸入評估部件,用于根據(jù)字序列特征化模型,評估由語音輸入部件生成的語音輸入;以及字序列指定部件,用于基于語音輸入評估部件的評估值指定語音輸入的字序列。
用這樣構(gòu)造的機(jī)器人裝置,基于字序列特征化模型,用語音輸入評估部件評估由語音輸入部件生成的語音輸入,所述的字序列特征化模型是基于發(fā)出的字序列的特征值分類的,并且,基于語音輸入評估部件的評估值,由字序列指定部件指定語音輸入的字序列。這使得機(jī)器人裝置能夠?qū)⑤斎胝Z音指定為最佳字序列。為解決上述問題,本發(fā)明的機(jī)器人裝置的行為控制方法也包括語音輸入步驟;語音輸入評估步驟,根據(jù)特征化多個字序列的多個模型,評估在語音輸入步驟生成的語音輸入;以及字序列指定步驟,基于在語音輸入評估步驟中獲得的評估值指定語音輸入的字序列。該行為控制方法使得機(jī)器人裝置能夠?qū)⑤斎胝Z音指定為最佳字序列。為解決上述問題,本發(fā)明的機(jī)器人裝置還包括控制部件,用于執(zhí)行指向?qū)W習(xí)對象的行為控制。這樣構(gòu)造的機(jī)器人裝置執(zhí)行指向其學(xué)習(xí)對象的行為。
為解決上述問題,本發(fā)明的機(jī)器人裝置的行為控制方法還控制機(jī)器人裝置的行為,從而自主行動的機(jī)器人將指向其學(xué)習(xí)對象。通過機(jī)器人裝置的行為控制方法,所述機(jī)器人執(zhí)行指向其學(xué)習(xí)對象的行為。為解決上述問題,本發(fā)明的機(jī)器人裝置還包括檢測對象的傳感器;用于評估所述傳感器的輸入信號的感知評估部分;內(nèi)部狀態(tài)管理部分,為其饋送感知評估部分的評估結(jié)果以管理根據(jù)所述結(jié)果改變的虛假內(nèi)部狀態(tài);以及存儲部件,用于存儲對象和基于對象的內(nèi)部狀態(tài)變化之間的關(guān)系。用這樣構(gòu)造的機(jī)器人裝置,當(dāng)檢測到對象時,將基于所檢測的對象的內(nèi)部狀態(tài)變化和所述對象相關(guān)地存儲在存儲部件中。
為解決上述問題,本發(fā)明的機(jī)器人部件的行為控制方法還包括感知評估步驟,評估檢測到對象的傳感器的輸入信號;內(nèi)部狀態(tài)管理部分,用于管理基于感知評估步驟中的評估結(jié)果改變的虛假內(nèi)部狀態(tài);以及存儲步驟,存儲對象和基于對象的內(nèi)部狀態(tài)變化之間的關(guān)系。將基于所檢測的對象的內(nèi)部狀態(tài)的變化和對象相關(guān)地存儲在存儲部件中。用這樣構(gòu)造的機(jī)器人裝置的行為控制方法,當(dāng)檢測到對象時,將基于所檢測的對象的內(nèi)部狀態(tài)變化和所述對象相關(guān)地存儲在存儲部件中。
通過閱讀如附圖所示的本發(fā)明的實施例,本發(fā)明的其它目的、特征和優(yōu)點將變得更加清楚。


圖1是實施本發(fā)明的機(jī)器人裝置的外觀透視圖;圖2是說明所述機(jī)器人裝置的電路結(jié)構(gòu)的方框圖;圖3是說明所述機(jī)器人的軟件結(jié)構(gòu)的方框圖;圖4是說明所述機(jī)器人的軟件結(jié)構(gòu)中應(yīng)用層的方框圖;圖5是說明所述機(jī)器人的軟件結(jié)構(gòu)的應(yīng)用層結(jié)構(gòu)的方框圖;圖6是說明所述應(yīng)用層的行為模型庫結(jié)構(gòu)的方框圖;圖7說明了作為所述機(jī)器人裝置的行為決定的信息的有限概率自動機(jī);圖8說明了為有限概率自動機(jī)的每個節(jié)點提供的狀態(tài)轉(zhuǎn)換表;圖9是說明選擇行為的構(gòu)成單元的方框圖;圖10是說明通過感知選擇行為的構(gòu)成單元方框圖;
圖11說明了子系統(tǒng)的指定例子;圖12是說明行為選擇結(jié)構(gòu)的一個更具體的構(gòu)成單元的方框圖;圖13說明了包括機(jī)器人裝置的網(wǎng)絡(luò)系統(tǒng);圖14是說明直到機(jī)器人裝置通過協(xié)同注意實現(xiàn)信息獲取行為或信息確認(rèn)行為一直執(zhí)行的操作序列的流程圖;圖15A和15B說明了為可選的單一顏色的輸入圖像的顏色分段;圖16A和16B說明了包括人類的輸入圖像的顏色分段;圖17說明了顏色分段的集群;圖18A和18B說明了輸入圖像的集群;圖19說明了通過顏色分段切片分析外形的結(jié)果;圖20說明實現(xiàn)了對發(fā)出的語音的識別的構(gòu)成單元的方框圖;圖21說明了用于輸入未知語言的HMM的示意結(jié)構(gòu);圖22說明了語音識別的結(jié)果;圖23說明了與內(nèi)部狀態(tài)相關(guān)的信息;圖24說明了虛擬胃和虛擬膀胱之間關(guān)系;圖25是說明學(xué)習(xí)存儲器結(jié)構(gòu)的方框圖;圖26說明了從根據(jù)外部或內(nèi)部狀態(tài)的刺激的信息,通過協(xié)同注意,實現(xiàn)信息獲取行為或信息確認(rèn)行為的處理過程。
具體實施例方式
下面參照附圖詳細(xì)說明本發(fā)明的優(yōu)選實施例。本實施例旨在說明一種自主地響應(yīng)周圍環(huán)境(外部刺激)和內(nèi)部狀態(tài)而行為的自主機(jī)器人裝置。
在本實施例中,首先說明機(jī)器人裝置的結(jié)構(gòu),隨后詳細(xì)說明利用所述機(jī)器人取得的日常功能。
(1)本實施例機(jī)器人裝置的結(jié)構(gòu)如圖1所示,所述機(jī)器人裝置是模仿動物,比如狗的所謂寵物機(jī)器人,并且由分別連接在軀干單元2的左右側(cè)的前后側(cè)的腿單元3A、3B、3C和3D以及分別連接到軀干單元2的前后端的頭部單元4和尾部單元5構(gòu)成。
參見圖2,軀干單元2包括控制器單元16,該控制器單元16包括CPU(中央處理單元)10內(nèi)部總線上的內(nèi)連、DRAM(動態(tài)隨機(jī)存取存儲器)11、快速ROM(只讀存儲器)12、PC(個人計算機(jī))卡接口電路13和信號處理電路14、以及作為機(jī)器人裝置1的電源的電池17。在軀干單元2中還裝有檢測機(jī)器人裝置1的運動姿勢和運動加速度的角速度傳感器18和加速度傳感器19。
在頭部單元4上安裝在位的有CCD(電荷耦合器件)照相機(jī)20,用于將成像外部狀態(tài);接觸傳感器21,用于檢測由物理動作,如用戶的‘打擊’或‘輕拍’造成的壓力;距離傳感器22,用于測量到放置在前面的對象的距離;話筒23,用于收集外部聲音;揚聲器24,用于輸出如哀鳴的聲音;以及LED(發(fā)光二極管),相當(dāng)于機(jī)器人裝置1的眼睛。
為腿單元3A至3D的關(guān)節(jié)部分、腿單元3A至3D和軀干單元2的各連接部分、頭部單元4和軀干單元2的各連接部分以及尾部單元5的尾部5A的連接部分提供對應(yīng)于自由度數(shù)目的數(shù)個執(zhí)行器251至25n和電位計261至26n。例如,執(zhí)行器251至25n包括伺服電動機(jī)。腿單元3A至3D由伺服電動機(jī)的驅(qū)動控制,轉(zhuǎn)換到目標(biāo)姿勢或運動。
各個傳感器,如角速度傳感器18、加速度傳感器19、接觸傳感器21、觸地傳感器23R/L、姿勢傳感器24、距離傳感器25、話筒26、距離傳感器22、話筒23、擴(kuò)音器24以及電位計251至25n經(jīng)相關(guān)的集線器271至27n;連接到控制器16的信號處理電路14,而成像裝置20和電池17直接連接到信號處理電路14。
信號處理電路14順序地捕獲從上述各傳感器提供的傳感器數(shù)據(jù)、圖像數(shù)據(jù)或語音數(shù)據(jù),以使這些數(shù)據(jù)順序地經(jīng)內(nèi)部總線15存儲在DRAM11中的預(yù)定位置。另外,信號處理電路14順序地捕獲由電池17提供的指示剩余電池容量的剩余電池容量數(shù)據(jù),以將如此捕獲的數(shù)據(jù)存儲在DRAM11中的預(yù)定位置。
當(dāng)CPU10執(zhí)行機(jī)器人裝置1的操作控制時,順序利用如此存儲在DRAM11中的各個傳感器數(shù)據(jù)、圖像數(shù)據(jù)、語音數(shù)據(jù)以及剩余電池容量數(shù)據(jù)。
實際中,在機(jī)器人裝置1啟動的初始階段,CPU10為得到DRAM11中的存儲內(nèi)容,直接地或通過PC卡接口電路13讀取插在軀干單元2的PC卡槽(未說明了)中的存儲器卡28或存儲在快速ROM12中控制程序。
然后,CPU10根據(jù)從信號處理電路14順序存儲到DRAM11的傳感器數(shù)據(jù)、圖像數(shù)據(jù)、語音數(shù)據(jù)或剩余電池容量數(shù)據(jù),檢查其自身狀態(tài)和周圍狀態(tài),以及用戶可能發(fā)出的命令或行動。
CPU10根據(jù)檢查的結(jié)果和存儲在11中的控制程序,還確定下一個隨之發(fā)生的動作,同時根據(jù)如此確定的結(jié)果,在需要時驅(qū)動執(zhí)行器251至25n,產(chǎn)生行為,如在上下方向或左右方向搖動頭部單元4,或移動腿單元3A至3D以行走或跳躍。
在需要時,CPU10產(chǎn)生語音數(shù)據(jù),并將如此產(chǎn)生的數(shù)據(jù)作為語音信號通過信號處理電路14發(fā)送到揚聲器24,以向外部輸出從語音信號推導(dǎo)出的語音,或開/關(guān)或閃耀LED。
以這種方式,本機(jī)器人裝置1能夠響應(yīng)其自身狀態(tài)和周圍狀態(tài),或用戶的命令或動作,而自主地行為。
(2)控制程序的軟件結(jié)構(gòu)圖3說明了機(jī)器人裝置1中上述控制程序的軟件結(jié)構(gòu)。在圖3中,器件驅(qū)動程序?qū)?0位于控制程序的最下層,并形成為由多個器件驅(qū)動程序組成的器件驅(qū)動程序組31。每個器件驅(qū)動程序是一個允許直接訪問在普通計算機(jī)中使用的硬件,如圖像拾取裝置20(圖2)或計時器的對象,并且響應(yīng)相關(guān)硬件的中斷執(zhí)行處理。
機(jī)器人服務(wù)器對象32由虛擬機(jī)器人33、電源管理程序34、器件驅(qū)動程序管理程序35以及設(shè)計的機(jī)器人36組成。所述電源管理程序34由一組負(fù)責(zé)在電源之間切換的軟件項目組成。所述器件驅(qū)動程序管理程序35由一組軟件項目組成,管理各種其它器件驅(qū)動程序。所述設(shè)計的機(jī)器人36由管理所述機(jī)器人裝置1的機(jī)構(gòu)的一組軟件項目組成。位于器件驅(qū)動程序?qū)?0的最下層的虛擬機(jī)器人33由提供訪問硬件項目的接口的一組軟件項目組成,它包括上述各種傳感器和執(zhí)行器251至25n。
管理程序?qū)ο?7由對象管理程序38和服務(wù)管理程序39組成。對象管理程序38是一組管理包括機(jī)器人的服務(wù)器對象32、中間件層40和應(yīng)用層41中的各軟件項目的引導(dǎo)和結(jié)束的軟件項目,而服務(wù)管理程序39是一組根據(jù)存儲器卡28(圖2)中存儲的連接文件中陳述的關(guān)于各對象之間連接的信息,管理各對象間連接的軟件項目。
中間件層40位于機(jī)器人服務(wù)器對象32的上層,并且由提供機(jī)器人裝置1的基本功能,如圖像處理或語音處理的一組軟件項目組成。應(yīng)用程序?qū)?1位于中間件層40的上層,并且是根據(jù)組成中間件層40的軟件項目處理的結(jié)果決定機(jī)器人裝置1的行為的一組軟件項目。
圖4示說明了中間件層40和應(yīng)用層41的具體的軟件結(jié)構(gòu)。
參見圖4,中間件層40是由識別系統(tǒng)60和輸出系統(tǒng)69組成。所述識別系統(tǒng)60具有用于噪音、溫度或亮度檢測、音階(sound scale)識別、距離或姿勢檢測,用于接觸傳感器,用于運動檢測和顏色識別的信號處理模塊58至58以及輸入語義轉(zhuǎn)換器模塊59。所述輸出系統(tǒng)69具有輸出語義轉(zhuǎn)換器模塊68以及用于姿勢管理、跟蹤、運動再現(xiàn)、行走、從跌倒?fàn)顟B(tài)的恢復(fù)、LED閃光和聲音再現(xiàn)的信號處理模塊61至67。
識別系統(tǒng)60的信號處理模塊50至58從由機(jī)器人服務(wù)器對象32的虛擬機(jī)器人33從DRAM11(圖2)讀出的以進(jìn)行處理的傳感器數(shù)據(jù)、圖像數(shù)據(jù)和語音數(shù)據(jù)中捕獲相關(guān)的數(shù)據(jù),并向輸入語義轉(zhuǎn)換器模塊59發(fā)送處理的結(jié)果。應(yīng)注意,虛擬機(jī)器人33構(gòu)造為用于根據(jù)預(yù)定通信協(xié)議交換或轉(zhuǎn)換信號的組件。
輸入語義轉(zhuǎn)換器模塊59識別自身狀態(tài)、周圍的狀態(tài)、用戶命令或動作,如‘煩惱’、‘急躁’、‘光’、‘檢測到一個球’、‘檢測到跌倒’、‘被擊打’、‘被輕拍’、‘聽見do-mi-so音階’、‘檢測到運動的對象’、或‘檢測到障礙’以向應(yīng)用程序?qū)?1(圖3)輸出識別的結(jié)果。
應(yīng)用層41由五個模塊組成,即,行為模型庫70、行為切換模塊71、學(xué)習(xí)模塊72、感覺模型73及本能模型74,如圖5所示。
在行為模型庫70中,提供有與多個預(yù)選條件項目,如‘剩余電池容量低’、‘從跌倒?fàn)顟B(tài)恢復(fù)’、‘要躲避的障礙’、‘要表達(dá)的感覺’、或‘檢測到一個球’相關(guān)的各獨立行為模塊701至70n,如圖6所示。
當(dāng)從輸入語義轉(zhuǎn)換器模塊59提供了識別的結(jié)果、或從提供最后的識別結(jié)果的時間起過了預(yù)定的時間時,行為模型701至70n在參照感覺模型73中保存的情感參數(shù)值、和參照本能模型74中保存的相應(yīng)愿望的參數(shù)值的同時、決定下面的行為以將決定的結(jié)果發(fā)送到行為切換模塊71。
在本實施例中,行為模型701至70n使用稱為有限概率自動機(jī)的算法作為決定下一個行為的技術(shù)。該算法根據(jù)對于內(nèi)連各節(jié)點NODE0至NODEn的弧ARC1至ARCn1設(shè)定的轉(zhuǎn)換概率的值P1至Pn概率地確定從節(jié)點NODE0至NODEn中的哪一個到這些節(jié)點NODE0至NODEn中的哪一個將進(jìn)行轉(zhuǎn)換。
具體而言,每個行為模型701至70n包括圖8所示的每個節(jié)點NODE0至NODEn的狀態(tài)轉(zhuǎn)換表80,與這些節(jié)點NODE0至NODEn相關(guān)地形成其自身的行為模型701至70n。
在狀態(tài)轉(zhuǎn)換表80中,作為節(jié)點NODE0至NODEn中轉(zhuǎn)換條件的輸入事件(識別的結(jié)果),以優(yōu)先級的序列,列表在‘輸入事件名’的列中,并且在列‘?dāng)?shù)據(jù)名’和‘?dāng)?shù)據(jù)范圍’的相關(guān)行中陳述轉(zhuǎn)換條件的其它條件。
因此,在圖8的狀態(tài)轉(zhuǎn)換表80中說明了的節(jié)點NODE100中,假定‘檢測到球’(BALL)的識別結(jié)果,則與識別結(jié)果一起假定的球的大小(SIZE)是‘從1至1000’,代表向另一個節(jié)點轉(zhuǎn)換的條件。相似地,假定識別結(jié)果‘檢測到障礙’(OBSTACLE),與識別結(jié)果一起假定的到所述障礙的距離(DISTANCE)是“從0至100”的范圍,代表向另一個節(jié)點轉(zhuǎn)換的條件。
而且在當(dāng)前的節(jié)點NODE100中,如果沒有輸入任何識別結(jié)果,但是在行為模型701至70n周期地參考的參數(shù)值當(dāng)中,保存在感覺模型73中的,各情感和愿望的參數(shù)值當(dāng)中的參數(shù)值‘高興’(JOY),‘驚奇’(SURPRISE)或‘悲傷’(SADNESS)中任何一個在‘50至100’之間的范圍中,則可以做出向另一個節(jié)點的轉(zhuǎn)換。
而且,在狀態(tài)轉(zhuǎn)換表80中,從節(jié)點NODE0至NODEn能夠做出向其轉(zhuǎn)換的節(jié)點名表示在列‘向其它節(jié)點轉(zhuǎn)換的概率’中的行‘轉(zhuǎn)換的目的地節(jié)點’中。另外,在列‘輸入事件名’、‘?dāng)?shù)據(jù)名’和‘?dāng)?shù)據(jù)范圍’中陳述的所有條件滿足時,可以將向其它節(jié)點NODE0至NODEn轉(zhuǎn)換的概率列入在列‘向其它節(jié)點轉(zhuǎn)換概率’的相對應(yīng)位置。在向節(jié)點NODE0至NODEn轉(zhuǎn)換時要輸出的行為表示在列‘向其它節(jié)點轉(zhuǎn)換概率’中的行‘輸出行為’中。同時,列‘向其它節(jié)點轉(zhuǎn)換的概率’中的每行概率值的總和是100%。
因此,在圖8的狀態(tài)轉(zhuǎn)換表80表示的節(jié)點NODE100中,假設(shè)識別結(jié)果‘檢測到球’并且球的大小(SIZE)是‘從0至100’的范圍,那么,能夠以30%的概率做出向‘節(jié)點NODE120(節(jié)點120)’轉(zhuǎn)換,然后輸出行為‘ACTION1’。
在行為模型701至70n的每個中,每個都如該狀態(tài)轉(zhuǎn)換表80中陳述的那樣多個節(jié)點NODE0至NODEn的集合交連在一起,從而,假定從輸入語義轉(zhuǎn)換器模塊59給出識別結(jié)果,則利用NODE0至NODEn的狀態(tài)轉(zhuǎn)換表概率地確定下一個行為,并且將該決定的結(jié)果輸出到行為切換模塊71。
圖5說明了的行為切換模塊71,向中間件層40的輸出語義轉(zhuǎn)換器模塊68發(fā)送命令,以在從行為模型庫70的各個行為模型701至70n輸出的各行為當(dāng)中,選擇具有預(yù)定的較高優(yōu)先級的從行為模型701至70n輸出的一個行為,并且執(zhí)行該行為。該命令在下面稱為行為命令。在本實施例中,在圖6中說明了的行為模型701至70n的給定一個的優(yōu)先級排列(the order of priority)越高,在圖6中的所述的行為模型的等級(rank)越低。
行為切換模塊71根據(jù)在行為結(jié)束后輸出語義轉(zhuǎn)換器模塊68提供的行為完成信息,通知學(xué)習(xí)模塊72、感覺模型73和本能模型74該行為結(jié)束的效果。
將從輸出語義轉(zhuǎn)換器模塊68提供的識別結(jié)果中的作為用戶動作,如‘輕拍’或‘打擊’接收的指令的識別結(jié)果饋送到學(xué)習(xí)模塊72。
學(xué)習(xí)模塊72根據(jù)識別結(jié)果和從行為切換模塊71來的通知,改變行為模型庫70中的行為701至70n的轉(zhuǎn)換概率,從而,在動作是‘輕拍’(‘訓(xùn)斥’)或‘打擊’(‘表揚’)時,所述行為的發(fā)生概率將分別增加或降低。
另一方面,感覺模型73保存表示六種情感類型每一個的強(qiáng)度的參數(shù),即,高興(JOY)、悲傷(SADNESS)、憤怒(ANGER)、驚奇(SURPRISE)、厭惡(DISGUST)和恐懼(FEAR)。感覺模型73根據(jù)輸入語義轉(zhuǎn)換器模塊59提供的特定識別結(jié)果,如‘被輕拍’或‘被打擊’,逝去的時間以及從行為切換模塊71來的通知周期地修改這些情感類型的參數(shù)值。
特別地,感覺模型73根據(jù)下列公式(1)計算下一周期的當(dāng)前情感類型的參數(shù)值E[t+1]E[t+1]=E[t]+ke×ΔE[t] ...(1)其中ΔE[t]為由預(yù)定的公式根據(jù),例如輸入語義轉(zhuǎn)換器模塊59提供的識別結(jié)果、機(jī)器人裝置在相關(guān)時間的行為或根據(jù)從前一個改變事件時間開始已逝去的時間計算的情感類型的變化量,,E[t]是情感類型的當(dāng)前參數(shù)值,以及ke是表示情感類型的敏感度的系數(shù)。感覺模型73用這樣計算的值代替情感類型的當(dāng)前參數(shù)值E[t],以修改情感類型的參數(shù)值。以相似的方式,感覺模型73修改情感類型的總體的參數(shù)值。
從輸出語義轉(zhuǎn)換器模塊68來的各識別結(jié)果和通知將對各情感類型參數(shù)值的改變量ΔE[t]具有怎樣的影響是預(yù)先確定的,從而,識別結(jié)果‘被輕拍’顯著地影響情感類型‘憤怒’的參數(shù)值的改變量ΔE[t],而識別結(jié)果‘被輕拍’顯著地影響情感類型‘高興’的參數(shù)值的改變量ΔE[t]。
輸出語義轉(zhuǎn)換器模塊68的通知是所謂的行為反饋信息(行為結(jié)束信息)和關(guān)于行為發(fā)生的結(jié)果的信息。感覺模型73還根據(jù)該信息改變感覺。例如,通過‘吠’的動作可以降低憤怒的感覺水平。同時,輸出語義轉(zhuǎn)換器模塊68來的通知也輸入到學(xué)習(xí)模塊72,然后,它根據(jù)該通知改變行為模型701至70n的相應(yīng)轉(zhuǎn)換概率。
同時,由行為切換模塊71的輸出(適應(yīng)于該感覺的行為)可以做出行為結(jié)果的反饋。
另一方面,本能模型74保存表示五個相互獨立的愿望的強(qiáng)度參數(shù),即‘練習(xí)愿望’、‘好感愿望’、‘食欲’及‘好奇’。本能模型74根據(jù)輸入語義轉(zhuǎn)換器模塊59提供的識別結(jié)果、逝去的時間以及從行為切換模塊71來的通知,周期地修改這些愿望的參數(shù)值。
特別地,本能模型74關(guān)于‘練習(xí)愿望’、‘好感愿望’和‘好奇’在預(yù)定的周期使用下面的公式,計算在下個周期中的這些愿望的參數(shù)值I[k+1]I[k+1]=I[k]+ki×ΔI[k] ...(2)其中,ΔI[k]是由預(yù)定公式根據(jù)識別結(jié)果、逝去的時間及輸出語義轉(zhuǎn)換器模塊68的通知計算的在相關(guān)時間的所述愿望的改變量,I[k]是愿望的當(dāng)前參數(shù)值,以及ki是表示所述愿望的敏感度的系數(shù),并且用計算的結(jié)果代替當(dāng)前參數(shù)值I[k],以修改愿望的參數(shù)值。本能模型74修改除了‘食欲’外的各愿望的參數(shù)值。
從輸出語義轉(zhuǎn)換器模塊模塊68來的識別結(jié)果和通知對各愿望的參數(shù)值的改變量ΔI[k]的影響是預(yù)先確定的,從而,例如,從輸出語義轉(zhuǎn)換器模塊68來的通知顯著影響‘疲勞’參數(shù)值的改變量ΔI[k]。
在本實施例中,各個情感類型和各個愿望的參數(shù)在從0至100的范圍內(nèi)改變,而系數(shù)ke和ki的值對各個情感類型和各個愿望獨立地進(jìn)行設(shè)定。
如圖4所示,中間件層40的輸出語義轉(zhuǎn)換器模塊68將如上所述的應(yīng)用層41的行為切換模塊71提供的抽象的行為命令,如‘往前走’、‘高興’、‘喊叫’或‘跟蹤(跟蹤一個球)’發(fā)送到輸出系統(tǒng)69的信號處理模塊61至67。
假定一行為命令,信號處理模塊61至67根據(jù)該行為命令,產(chǎn)生將提供到相關(guān)執(zhí)行器251至25n(圖2)以執(zhí)行該行為的伺服命令值、要從揚聲器24(圖2)輸出的聲音語音數(shù)據(jù)、和/或要向‘眼睛’LED提供的驅(qū)動數(shù)據(jù),并且以這樣的順序,通過機(jī)器人服務(wù)器對象32的虛擬機(jī)器人33和信號處理電路14(圖2)將這些數(shù)據(jù)發(fā)送到相關(guān)的執(zhí)行器251至25n、揚聲器24或LED。
以這種方式,機(jī)器人裝置1能夠根據(jù)控制程序響應(yīng)其自身內(nèi)部狀態(tài)、周圍的狀態(tài)(外部狀態(tài))或用戶的命令或動作,執(zhí)行自主的行為。
(3)本發(fā)明在機(jī)器人裝置上的應(yīng)用現(xiàn)在說明的技術(shù)代表將本發(fā)明應(yīng)用于機(jī)器人裝置的基礎(chǔ)。
(3-1)系統(tǒng)結(jié)構(gòu)的概況首先,在下面說明實現(xiàn)基于情感的符號獲取的系統(tǒng)結(jié)構(gòu)的概況。
首先,在構(gòu)造系統(tǒng)時存在以下問題。通過本發(fā)明的系統(tǒng)解決了這些問題,并且將實現(xiàn)現(xiàn)有技術(shù)未能實現(xiàn)的逼真的機(jī)器人。
首先存在下面問題(Req-1)語言獲取行為如何嵌入機(jī)器人裝置1的自主行為系統(tǒng);(Req-2)基于情感的符號將如何構(gòu)造;(Req-3)要識別的現(xiàn)實世界的對象如何分類;以及(Req-4)機(jī)器人裝置1和人類如何將注意引向相同的對象,即,如何解決共同注意的問題。
首先,問題(Req-1)是通過集成生態(tài)學(xué)模型產(chǎn)生的自主行為的方法和基于物理的符號的獲取的方法而解決的。
應(yīng)注意,通過生態(tài)學(xué)模型產(chǎn)生自主行為是在,例如Arkin的報告(下面稱為參考資料6,Arkin,R.C.,F(xiàn)ujita,M.,Takagi,T.,和Hasegawa,R.撰寫的“生態(tài)學(xué)模型...(Ethological Model...)”提交到ICRA至2001),和Bates的報告(下稱參考資料7,Bates,J.撰寫的“在交互的世界和oz項目中的特征本性(Nature ofcharacter in interactive worlds and the oz project)”“技術(shù)報告(TechnicalReport)CMU-CS-92-200”,Carnegie Mellon大學(xué),1992年10月)中提出的技術(shù)。
基于物理的符號獲取的方法是在前述的參考資料1-3中提出的技術(shù)。
特別地,將作為滿足關(guān)于信息的饑餓感覺的行為的信息獲取行為定義為自主行為之一,并且將‘吃’信息的信息獲取行為實現(xiàn)為與吃食物的行為相似的子系統(tǒng)。作為要獲取的對象的信息是對象和意義的名稱。
所述子系統(tǒng)是規(guī)定機(jī)器人裝置1的行為的子系統(tǒng),所述的機(jī)器人裝置1具有依賴于行為種類的多種子系統(tǒng)。該子系統(tǒng)主要由感知和內(nèi)部狀態(tài)確定。
至于(Req-2)基于情感的符號問題,通過將激發(fā)所述行為的內(nèi)部狀態(tài)變化與那時的輸入和行為相關(guān)聯(lián)來解決。特別地,不是通過將輸入時內(nèi)部狀態(tài)其本身,而是將針對輸入的內(nèi)部狀態(tài)變化,與那時的輸入和行為相關(guān)聯(lián),而使對象對個人的意義與滿足內(nèi)部狀態(tài)時激起的情感之間相關(guān)聯(lián)。
至于(Req-3),通過用感知分類對象,和通過將統(tǒng)計模型用作作為感知檢測到的顏色等的分類器,適當(dāng)?shù)胤诸愐R別的現(xiàn)實世界的對象。
機(jī)器人裝置與在計算機(jī)中構(gòu)造的虛擬世界中提出的,如在El至Nasr等人的報告(下面稱為參考資料8,El-Nasr,M.,Loeger,T.,和Yen,J.撰寫的“PETTEI帶有情感衍生智能的寵物(A pet with Evolving EmtionallyIntelligence)”刊載在“自主智能體的國際會議會議錄(procedings ofInternational Conference on Autonomous Agents)”中,2000)中提出的合成生物之間的不同是機(jī)器人裝置必須能夠在現(xiàn)實世界中操作。在現(xiàn)實世界的對象中,顏色、形狀等連續(xù)地分布在各特征空間中。而且,缺乏編程的簡單觀察對象不能夠揭示它實際具有的意義。所以,在解決上述問題(Req-3)中,使用統(tǒng)計模型作為感知的分類器。
由通過利用該生態(tài)模型的行為選擇中注意力引向?qū)ο髸r執(zhí)行所述行為的一部分,自發(fā)地執(zhí)行共同的注意力,而解決(Req-4)的共同注意問題。
共同注意或協(xié)同注意是現(xiàn)實世界中符號獲取的重要功能之一。在Burner的報告(下面稱為參考資料9,Bruner,J.撰寫“學(xué)習(xí)如何用字做事情(Learninghow to do things with wordz)”刊載在J.Brunner和A.Garton著的“人的生長和發(fā)展(Human growth and development)”,Wolfstan College Lectures,Clarendon出版社,1978年)中,例如在認(rèn)識心理學(xué)中指出共同注意在嬰兒的學(xué)習(xí)過程中起重要的作用。這是引導(dǎo)方和被引導(dǎo)方,這里為嬰兒共同擁有感興趣對象的能力,由于嬰兒自發(fā)地朝引導(dǎo)者手指指出的方向,或沿引導(dǎo)者的視線看。
通過利用注意引向某個對象時執(zhí)行所述行為的生態(tài)模型的行為選擇的一部分,自發(fā)地將該共同注意納入到自主行為中。
首先,簡要說明考慮生態(tài)研究的行為控制。例如在上述的參考資料6中討論了生態(tài)運動控制技術(shù)。
接下來,全面地說明其結(jié)構(gòu),以及如何將信息獲取行為集成在自主機(jī)器人裝置1的軟件中,以及與共同注意相關(guān)的解決方法。
在生態(tài)模型中的關(guān)鍵點是,通過內(nèi)部狀態(tài)和外部刺激選擇行為,并且在產(chǎn)生行為評估(行為值)時,獨立評估和相關(guān)(融合)從內(nèi)部狀態(tài)產(chǎn)生的動機(jī)和從外部刺激來的釋放信號。這使得將內(nèi)部變量抑制到一定程度內(nèi)的體內(nèi)平衡(homeostatic)的行為能夠產(chǎn)生。同時,體內(nèi)平衡的行為是表現(xiàn)為例如將內(nèi)部變量保持在固定水平上的行為。
圖9說明了一種允許對彼此相關(guān)的內(nèi)部變量和外部刺激進(jìn)行獨立評估的配置。圖10說明了一種實現(xiàn)體內(nèi)平衡的行為的配置,更具體地說,說明了一種其中系統(tǒng)地構(gòu)造行為,并且解釋外部環(huán)境以獲得外部刺激從而選擇保持固定內(nèi)部狀態(tài)的行為的配置。
參見圖9,說明攝取行為的情況。動機(jī)產(chǎn)生器101評估并輸出從內(nèi)部狀態(tài)如饑餓程度來的攝取行為的動機(jī)值。釋放機(jī)構(gòu)102評估并輸出與攝取行為相關(guān)的外部刺激,例如,如果存在食物的話,攝取行為的釋放信號。動機(jī)值和釋放信號彼此獨立地被評估。
行為評估器103評估動機(jī)值和釋放信號,并輸出行為本身的評估值作為行為值。存在多個對其每一個都獨立計算行為值,并輸出到稍后說明的動作選擇單元的行為。動作選擇器選擇給出最高評估的行為以執(zhí)行這樣選擇的行為。
通過定義動機(jī)產(chǎn)生器101從而使當(dāng)內(nèi)部狀態(tài)偏離最適宜的范圍時,將采取使內(nèi)部狀態(tài)能夠恢復(fù)到它原來范圍的動作,實現(xiàn)了試圖獲取行為的對象的廣義的行為定義,如果外部世界存在該對象的話,從而可以實現(xiàn)體內(nèi)平衡行為。
(3-3)基于情感的符號獲取的體系基于情感的符號獲取實現(xiàn)相對于未知對象的情感獲取行為作為自主行為的一部分。
作為一個例子,圖12說明了一個實現(xiàn)基于情感的符號獲取作為自主行為一部分的配置。在此系統(tǒng)構(gòu)造中的要點可以列為(i)能夠辨別輸入是未知的輸入還是先前已知的輸入的每個通道的分類器;(ii)用于存儲每個通道分類結(jié)果與內(nèi)部變量的改變時間的相關(guān)存儲器;以及(iii)通過生態(tài)模型將內(nèi)部變量和外部刺激結(jié)合。
以上是系統(tǒng)構(gòu)造的要點。同時,如果外部刺激是已知刺激,則啟動根據(jù)通常生態(tài)模型的體內(nèi)平衡行為的自主行為。
根據(jù)本發(fā)明實現(xiàn)的基于情感的符號獲取,其特征為存儲對象對哪個內(nèi)部狀態(tài)是至關(guān)重要的,并從而顯著地不同于通常的基于物理的符號獲取。
因此,基于情感的符號獲取將對象與基于情感的信息相關(guān)。通過將信息與對象相關(guān),使釋放機(jī)構(gòu)能夠評估對于新的對象要采取哪個動作。
而且,通過將內(nèi)部狀態(tài)變化(內(nèi)部變量)作為與對象相關(guān)的相關(guān)存儲器,能夠從所述相關(guān)存儲器輸出在次要情感中存儲的內(nèi)部變量中的改變以產(chǎn)生第二階的情感,如高興或恐懼作為情感。
這使得能夠與見到的對象相關(guān)地,作為情感表現(xiàn)行為,產(chǎn)生表達(dá),影響行為選擇,或調(diào)整運動。
(3-4)情感獲取(吃)行為為實現(xiàn)作為自主行為一部分的信息獲取行為,定義下面稱為信息獲取行為子系統(tǒng)的子系統(tǒng),它具有作為內(nèi)部狀態(tài)因子的與信息獲取愿望相關(guān)的各變量,在下面稱其為信息獲取變量。
例如,將信息獲取行為子系統(tǒng)定義為是一個內(nèi)部模型,其信息獲取變量在對其相關(guān)存儲器為未知的輸入進(jìn)行學(xué)習(xí)的情況下得以增加,并且隨著時間而減少。在所述信息獲取變量被耗盡時,該信息獲取行為子系統(tǒng)產(chǎn)生信息獲取行為的動機(jī)。
而且,在這種情況下,當(dāng)輸入(信息)是未知時,釋放機(jī)構(gòu)產(chǎn)生釋放信號。這使得獲取信息的行為,象吃食物的行為那樣,能夠作為內(nèi)部變量和外部刺激的融合而產(chǎn)生。
在信息獲取的愿望增加時,尋找未知對象的行為和諸如對未知對象問‘這是什么?’的詢問的行為,是表現(xiàn)為信息獲取行為的特定行為的典型行為。一般是通過與用戶對話形成這樣的行為。
通過構(gòu)造這樣的系統(tǒng),通過基于好奇的對話能夠?qū)崿F(xiàn)信息獲取,并進(jìn)一步地自然地在自主行為中嵌入信息獲取行為。即,信息獲取行為是作為機(jī)器人裝置1中的實現(xiàn)為自主行為的交互的新元素實現(xiàn)。
(3-5)共同注意共同注意或協(xié)同注意自發(fā)地被嵌入在系統(tǒng)中。在該系統(tǒng)結(jié)構(gòu)中,根據(jù)共同注意的信息獲取行為(吃信息)如下執(zhí)行假定通過如上所述的各內(nèi)部變量和各外部刺激的融合,由動作選擇單元116選擇了信息獲取行為。
激發(fā)釋放機(jī)構(gòu)102發(fā)出釋放信號的對象是進(jìn)行信息獲取的目標(biāo)。如果從內(nèi)部狀態(tài)的饑餓感覺單獨地選擇該行為,則進(jìn)行尋找,并且給定對象變成所述信息獲取行為的目標(biāo)。因此,執(zhí)行行為獲取的目標(biāo)變成共同注意的目標(biāo)。
如果機(jī)器人具有主動性,即,如果信息獲取行為從內(nèi)部狀態(tài)的饑餓感覺引起,則機(jī)器人裝置1接近目標(biāo),并將其手指指向目標(biāo)以激發(fā)操縱者的人的注意力從而實現(xiàn)共同注意。
如果用戶具有主動性,即,如果根據(jù)釋放機(jī)構(gòu)102發(fā)出的釋放信號指定目標(biāo),機(jī)器人裝置1首先發(fā)出聲音或移動對象以激發(fā)用戶的注意。用戶可以對此作出響應(yīng)指向所述目標(biāo),如用手指指向目標(biāo),做出詢問‘這是什么?’。當(dāng)該手指或詢問選擇了行為獲取行為時,機(jī)器人裝置1指定用手指指向的對象作為對象。因此,即使用戶具有主動性,也實現(xiàn)了對相同目標(biāo)的共同注意。
因此,在本系統(tǒng)中,共同注意作為如愿地對內(nèi)部狀態(tài)予以注意,或?qū)?qiáng)烈的外部刺激予以注意的一般概念的一部分,納入到系統(tǒng)中。
(3-6)內(nèi)部狀態(tài)和情感(內(nèi)部變量和情感)的改變參見圖12,將情感部分120大致分成感知內(nèi)部狀態(tài)部分131、內(nèi)部狀態(tài)部分132和情感部分133。
第一個內(nèi)部狀態(tài)部分132管理內(nèi)部狀態(tài)本身的動態(tài)。所述內(nèi)部狀態(tài)包括作為虛擬變量的營養(yǎng)、水、疲勞和好奇,這將在下面序列說明(圖23)。除了上述的外,這些內(nèi)部變量可以包括在活的有機(jī)體或動物中發(fā)現(xiàn)的其它內(nèi)部變量。內(nèi)部狀態(tài)部分132監(jiān)視各個保養(yǎng)所需的各狀態(tài)以檢測所監(jiān)視的值偏離了最佳值。為維持恒定所需的行為,內(nèi)部狀態(tài)部分132還向動機(jī)產(chǎn)生器發(fā)送促使保持內(nèi)部狀態(tài)所需行為的信號。
第二部分,即,感知內(nèi)部狀態(tài)132,是分析從內(nèi)部傳感器或外部傳感器來的輸入以向內(nèi)部狀態(tài)管理單元輸入該分析結(jié)果的部分,。所述傳感器信號分析對應(yīng)于真實動物情況下的,有關(guān)從血液中的糖的比例檢測到的飲食的信息,或有關(guān)疲勞的信息。在機(jī)器人裝置1中,傳感器信號是剩余電池容量的分析。在機(jī)器人裝置1中,預(yù)先假設(shè)偽食欲,并且通過執(zhí)行適當(dāng)?shù)膭幼鳟a(chǎn)生輸入信號以維持偽恒定內(nèi)部狀態(tài)。
第三部分,即,情感部分133,是通過內(nèi)部變量的改變,產(chǎn)生愉快或不愉快的感覺以產(chǎn)生與高興或憤怒相對應(yīng)的情感的部分。該情感部分133也稱為第二階情感,并根據(jù)稱為第一階情感的內(nèi)部情感的滿足程度產(chǎn)生愉快或不愉快的信號。而且,情感部分133從這些愉快信號、不愉快信號、喚醒程度或確信狀態(tài)產(chǎn)生諸如高興、悲傷或憤怒的情感。第二階情感用于情感表現(xiàn)的行為,諸如產(chǎn)生面部表情或產(chǎn)LED的相應(yīng)光模式。
如圖12所示,內(nèi)部狀態(tài)的這些改變,通過學(xué)習(xí)存儲器(相關(guān)存儲器)140用于學(xué)習(xí)的時序。這意味著當(dāng)內(nèi)部狀態(tài)發(fā)生重大改變時進(jìn)行學(xué)習(xí)。將內(nèi)部狀態(tài)和情感狀態(tài)輸入到行為產(chǎn)生單元的動機(jī)產(chǎn)生器用作各行為的誘因刺激。
(3-7)未知刺激的感知在現(xiàn)實世界中機(jī)器人裝置1的開發(fā)中,感覺‘識別’是一個嚴(yán)重的任務(wù)。具體而言,在現(xiàn)實環(huán)境下的實時識別,它提出一個關(guān)鍵問題,即,隨各種因素變化的輸入應(yīng)視為是與已經(jīng)學(xué)習(xí)的信息相同,還是應(yīng)判斷為是新的刺激。
近來,統(tǒng)計或概率模式分類的技術(shù)在識別領(lǐng)域已取得顯著結(jié)果。這是將在特征空間中分布的輸入抽樣處理為最小化風(fēng)險函數(shù)并找出它的參數(shù)的統(tǒng)計問題的識別技巧。在稍后說明的,當(dāng)前是語音識別的主流的Hidden-Markov-Model(HMM),是也屬于該范疇的的識別技術(shù)。HMM也是圖像識別的代表性識別技術(shù)。
在本系統(tǒng)中,使用該統(tǒng)計模式識別的技術(shù),檢查給定的輸入是否是未知對象或已知對象。
在統(tǒng)計模式識別中,給出給定對象是否是它的原型的概率或可能性,并用于辨別對象是未知的或已知的刺激。而且,如果在給定傳感器通道的特征空間中的距離較小以致通過該單獨的通道決定是困難的,則可以用另一個通道觀察顯著差異,使得能夠調(diào)節(jié)原來空間中的辨別參數(shù)。
(3-8)存儲感覺的學(xué)習(xí)存儲器(與情感相關(guān)的相關(guān)存儲器)學(xué)習(xí)存儲器(相關(guān)存儲器)用于進(jìn)行伴隨由作為誘因的各感知通道的輸出引起的內(nèi)部狀態(tài)改變的學(xué)習(xí)。在此,學(xué)習(xí)意味著對與引起內(nèi)部狀態(tài)改變的對象,即影響內(nèi)部狀態(tài)的對象相結(jié)合作為誘因的內(nèi)部狀態(tài)變化的存儲。
應(yīng)注意內(nèi)部狀態(tài)變化是根據(jù),例如,傳感器信號分析中能夠?qū)嶋H地測定的量,比如在關(guān)節(jié)中消耗的電流,以及根據(jù)如在(3-5)內(nèi)部狀態(tài)和情感中的改變(內(nèi)部變量和情感)中所述的偽測定的量(對吃虛擬食物的操作的檢測)產(chǎn)生的。在關(guān)節(jié)中消耗的電流由運動的次數(shù)確定,并且代表,例如,疲勞因子。
和相關(guān)性一樣,根據(jù)從感知通道發(fā)送的原型數(shù)目和對所述原型合適的概率學(xué)習(xí)同時發(fā)生的事件之間的相似性。在這些事件當(dāng)中,有所謂的基于物理的符號,如通過行為產(chǎn)生發(fā)送的對象名。這些符號也通過學(xué)習(xí)獲取。
同時,作為誘因的內(nèi)部狀態(tài)變化和對對象采取的行為也相關(guān)地進(jìn)行存儲。結(jié)果是對由對對象采取什么行為產(chǎn)生內(nèi)部狀態(tài)的什么變化的存儲。這樣的學(xué)習(xí)代表基于情感的符號的獲取。
應(yīng)注意,情感是內(nèi)部狀態(tài)的直接改變,因此稱為第一階情感。但是,因為第一階情感的改變可以引起第二階情感,所以該情感是基于,例如,恐懼的符號。
(3-9)子系統(tǒng)和行為根據(jù)圖10說明了的一組多個可分類的行為的子系統(tǒng)1151至115n控制行為。子系統(tǒng)1151至115n是分級結(jié)構(gòu)和樹狀結(jié)構(gòu),其最上層表明是實際的子系統(tǒng)。
在上述生態(tài)學(xué)研究的參考資料6中,即Arkin等人的報告中,列出精明(canny)行為必須和足夠的子系統(tǒng)。在參考資料6中報告的技術(shù)的特征是,將攝取行為(研究性的)定義為吃的行為的子系統(tǒng)。例如,攝取行為的子系統(tǒng)將食物定義為吃的行為。這理想地使得能夠產(chǎn)生將作為內(nèi)部狀態(tài)的剩余電池容量保持在某個范圍內(nèi)的行為,并且產(chǎn)生生成尋找充電地點的行為的動機(jī)的行為,即產(chǎn)生充電或自動充電的愿望。
在本系統(tǒng)中,本概念作為信息獲取的一個步驟引入,并且提供對應(yīng)于‘新穎信息的學(xué)習(xí)量’的行為作為內(nèi)部狀態(tài)的一項,同時也定義隨比如時間因素降低的內(nèi)部狀態(tài)的動態(tài)范圍。在內(nèi)部狀態(tài)的該動態(tài)中,產(chǎn)生對應(yīng)于‘學(xué)習(xí)量’的行為,象電池的情況那樣。例如,機(jī)器人裝置1以使‘學(xué)習(xí)量’保持在一定范圍內(nèi)的方式動作,并且如果‘學(xué)習(xí)量’耗盡,則尋找獲取新穎信息的未知對象。而且,當(dāng)未知對象作為外部刺激存在時,機(jī)器人裝置1接近它并通過實施‘這是什么?’的詢問行為指向它。另外,機(jī)器人裝置1通過相關(guān)存儲器產(chǎn)生學(xué)習(xí)操作者說出的名字的行為。同時,信息量是相應(yīng)于正在學(xué)習(xí)的對象的特征確定的或是隨時間的逝去降低的改變量。
而且,當(dāng)學(xué)習(xí)了對象的名字時,能夠定義獲取所述對象的名字對內(nèi)部狀態(tài)具有的意義的行為。這可以通過測試對象的某個行為和在內(nèi)部狀態(tài)已改變時,通過進(jìn)行行為和內(nèi)部狀態(tài)變化之間的相關(guān)學(xué)習(xí)而實現(xiàn)。
(4)對實際機(jī)器人裝置的應(yīng)用(實施)(4-1)四腿機(jī)器人裝置的結(jié)構(gòu)(增強(qiáng)四腿機(jī)器人平臺)現(xiàn)在說明其上安裝上述系統(tǒng)的四腿機(jī)器人裝置1。圖13說明了具有作為組成元件的機(jī)器人裝置1的網(wǎng)絡(luò)系統(tǒng)的例子。
在此網(wǎng)絡(luò)系統(tǒng)中,機(jī)器人裝置1借助于TCP/IP(發(fā)送控制/因特網(wǎng)協(xié)議)使用無線LAN卡161連接到網(wǎng)絡(luò)。
機(jī)器人裝置1包括CPU,其特性為主操作處理系統(tǒng)(MOPS)R4XXX約為100兆指令/秒(MIPS);以及16兆字節(jié)的主存儲器。該機(jī)器人裝置1包括作為輸出的執(zhí)行原始行為(基本姿勢轉(zhuǎn)換、尋找對象、跟蹤對象、接近對象、踢對象、吃對象等)的軟件;以及作為輸入的具有一串發(fā)音標(biāo)記的語音對象。機(jī)器人裝置1還存儲著用于使用相當(dāng)于機(jī)器人眼睛的LED做出幾個表達(dá)的命令。
在該機(jī)器人裝置1中,已經(jīng)構(gòu)造上述系統(tǒng),同時機(jī)器人裝置1實現(xiàn)了作為自主行為的一部分的信息獲取行為。
借助于機(jī)器人裝置1連接的網(wǎng)絡(luò)系統(tǒng)的優(yōu)點,與在機(jī)器人裝置1上執(zhí)行的相似的操作能夠在工作站163上進(jìn)行。以下面的方式進(jìn)行在工作站163上的處理過程。
機(jī)器人裝置1捕獲輸入圖像信號,并通過無線局域網(wǎng)LAN用無線LAN卡161將所述圖像發(fā)送到訪問點162。將所發(fā)送圖像經(jīng)以太網(wǎng)從訪問點162發(fā)送到工作站163。
將在機(jī)器人裝置1上各關(guān)節(jié)角的檢測結(jié)構(gòu)和傳感器檢測信息,如接觸傳感器或加速度傳感器獲得的信息,發(fā)送到工作站,正像從機(jī)器人裝置1向工作站163發(fā)送圖像一樣。如果處理是由工作站163進(jìn)行,則語音由工作站163提供的話筒輸入,而不使用機(jī)器人裝置1的話筒。
在工作站163上,使用上述的輸入信號如圖像,執(zhí)行上述的感知、各內(nèi)部變量的評估,行為子系統(tǒng)或動作的選擇。這些功能可以通過在工作站上設(shè)計OPEN-R對象實現(xiàn),如同在機(jī)器人裝置1中一樣,通過,例如,安裝在Linux操作系統(tǒng)上的SONY公司制造的OPEN-R并通過自由互連網(wǎng)絡(luò)上對象而實現(xiàn)。例如,各操作當(dāng)前正根據(jù)混合在一起的Matlab程序和在Linux操作系統(tǒng)上的OPEN-R對象進(jìn)行。
(4-2)實現(xiàn)的功能和試驗結(jié)果通過應(yīng)用本發(fā)明,將機(jī)器人裝置1設(shè)計為通過作為自主行為的一部分的共同注意,最終實現(xiàn)信息獲取行為或情感確認(rèn)行為。具體而言,如圖14所示,機(jī)器人裝置1用共同注意(步驟S4)通過自主行為(步驟S1)、對象輸入(步驟S2)和行為選擇(步驟S3),最終實現(xiàn)信息獲取行為和信息確認(rèn)行為。機(jī)器人裝置1將這些階段作為自主行為的一部分進(jìn)行處理。
(4-2-1)感知部分參見圖10,在機(jī)器人裝置1中提供感知部分111。具體而言,如圖12所示,感知部分121包括用于理解圖像的顏色感知部分122和形狀感知部分123,接觸感知部分(接觸部分)124,以及用于理解聲音的聲音感知部分125。
具體而言,顏色感知部分122是實現(xiàn)從對象信息自動顏色分段的部分,如下面說明的那樣;形狀感知部分12是根據(jù)圖像信息分析對象形狀的部分;以及聲音感知部分125是與從話筒輸入的語音相應(yīng)的語音識別的部分。下面說明這些感知部分進(jìn)行的處理。
接觸感知部分124(接觸部分)通過所謂的肌膚球傳感器的信號與對象接觸,所述傳感器為在機(jī)器人裝置1的足底上提供的所謂肌膚球。
(4-2-1-1)自動顏色分段首先,基于輸入感知刺激進(jìn)行使用顏色的顏色分段。該顏色分段使得能夠刻劃出任意單一顏色的多個對象。另外,在顏色分段中,使用通過在沒有教師下學(xué)習(xí)的分群算法進(jìn)行的顏色分段。
圖15A和15B分別說明了人工繪制的對象及其顏色分段結(jié)果。圖16A和16B分別說明了包括人的手和面部的自然圖像及其顏色分段結(jié)果。
應(yīng)注意輸入圖像在從較窄視角(5341度)的相機(jī)輸入到系統(tǒng)時,已經(jīng)通過了低通濾光器,從而減小到8860像素。為將該因素考慮在內(nèi),逐像素地獨立進(jìn)行顏色分段。通過這樣做,基本能夠?qū)崟r獲得圖15B和16B說明了的良好結(jié)果。
通常在RGB空間或規(guī)范化RGB空間中進(jìn)行顏色分段。因為相機(jī)信號是Y、Cr和Cb格式的,所以,將(Nr,Nb)的二維空間=(atan(Cr/Y),atan(Cb/Y))用作顏色空間??紤]到向RGB空間映射時執(zhí)行的計算量及量化誤差,這樣做可以達(dá)到極有效的處理。
同時,該顏色分段用作形狀分析的預(yù)處理。
下面是上述顏色分段中分群算法的處理步驟(i)至(vi)的例子。
在步驟(i),均勻地排列適當(dāng)數(shù)目的原型。
在步驟(ii),向所有像素提供最接近的原型的級層(class levels to the closestprototype)用下面公式(3)作為距離。
d=√(dhue/σhue)2+(dsat/σsat)2...(3)在上述公式中,hue和sat分別表示,如在從適當(dāng)?shù)娜訄D像的分布的起點可以看到的,如圖17所示。一般來說,Hue<sat。即,可以將上述距離認(rèn)為是在色調(diào)方向中的加權(quán)誤差。
在步驟(iii),如果屬于原型的像素數(shù)目較小,則改變原型。
在步驟(iv),將原型移動到具有相同類標(biāo)號(class label)的平均位置。
在步驟(v),如果兩個或更多原型的距離小于一定距離,則將這些原型一起組合到一個原型。
在步驟(vi),如果修改原型位置的次數(shù)不頻繁,或已到達(dá)適當(dāng)值,則終止操作。如果為相反情況,則處理過程回到上述步驟(ii),重新開始處理。
圖18A和18B說明了輸入圖像的分群狀態(tài)。圖18A和18B說明了一種分析以前存儲的皮膚顏色區(qū)域(area)以檢測指出的方向以及剝離出(strip out)延長線上的對象的情況。在隨后將說明的共同注意中使用該信息。
(4-2-1-2)形狀分析用相對大小和旋轉(zhuǎn)具有不變性的Fourier描述符(descriptor)執(zhí)行形狀分析。在該形狀分析中,F(xiàn)ourier描述符空間(第64維)中的L2范數(shù)(norm)用于分類。通過FD空間表示輸入對象,并且,用到最接近的原型的距離,確定所述原型是否是新的原型。圖19說明了通過顏色分段獲得的對象形狀分析的結(jié)果。
(4-2-1-3)語音識別作為語言識別,使用利用HMM的連續(xù)語音識別。該技術(shù)可以通過在上述參考資料5中提出的技術(shù)示范地說明。
參見圖20,為該系統(tǒng)提供語音輸入單元171、具有多個HMM的HMM寄存器172、輸入未知語言的HMM173以及比較器174。
HMM寄存器172的HMM是研究過日語音素并在開始時將需要的字記錄其中的HMM。在HMM寄存器172的HMM中,包括后來獲取的和學(xué)到的字。記錄或獲取的字的例子包括名詞和動詞。在HMM寄存器172的HMM中將輸入的音素序列作為置信度的度數(shù)評估。
輸入未知語言的HMM173是獲取未知字的HMM。如圖21所示,該輸入未知語言的HMM173具有陳述并連接到所有音素狀態(tài)的所有音素模型。如圖21所示,如果做出語音輸入‘bouruu’,則輸入未知語言的HMM173將它識別為‘booru’。
由已經(jīng)記錄或獲取字的HMM和輸入未知語言的HMM173評估輸入音素序列。此時,使用驗證值,在比較器174中評估顯示最大匹配的在距離HMM的距離。如果驗證值大于預(yù)定值,將所述音素序列作為新的音素系列重新標(biāo)記,所述新音素序列作為HMM寄存器172的HMM被記錄。
通過例子說明HMM寄存器172僅包括作為HMM的兩個記錄的字‘tomare(stop)’和‘kere(kick)’的情況。圖22說明了使用該系統(tǒng)的結(jié)果。
圖22說明了在右側(cè)記錄的字的輸入信號的驗證值。同時,驗證值越小,置信度越高。
例如,系統(tǒng)估計語音‘tomare’是音素序列‘tomare’的輸入,此時驗證值是0.136。
另一方面,對于在從圖22的頂部第三行中的未知字‘booru(ball)’,與其最佳匹配的模型是‘tomare’,此時驗證值極高,等于4.835。從而,分配并記錄了一個新的符號‘未知(unknown)-1’。因此,對于下一個語音輸入,即,從圖22的頂部第四行上示出的語音輸入‘booru(ball)’,未知-1的HMM是最靠近的,驗證值是小值0.41,從而未知-1正確地獲取到‘booru(ball)’。
而且,因為HMM能夠識別連續(xù)的語音,故對于圖22中從頂部起的第七個語音,緊接著在先前獲取的標(biāo)記未知至1,能夠識別符號‘kere’。
在這種語音識別系統(tǒng)中,如果獲取到名詞‘booru’,則機(jī)器人裝置1能夠通過命令‘booru kere(kick a ball)’踢球。
(4-2-1-4)感覺部分(情感部分)圖23說明了內(nèi)部狀態(tài)(各內(nèi)部變量)和與其相關(guān)的行為(各子系統(tǒng))之間的關(guān)系。
參照攝取行為的心理學(xué)模型,該例建議了為維持通常內(nèi)部狀態(tài)的假想的體內(nèi)營養(yǎng)積累緩沖器和排泄緩沖器,并將積累量定義為內(nèi)部變量。內(nèi)部變量的例子包括能量至2(虛擬食物)和虛擬排泄物。
如圖24所示,通過將假想胃(體內(nèi)營養(yǎng)積累緩沖器)和假想膀胱或腸(排泄物緩沖器)相關(guān),將假想胃中的積累量的降低設(shè)計成導(dǎo)致例如假想膀胱中的積累量的增加。
如圖23所示,內(nèi)部變量具有根據(jù)某些因素增加或降低的動態(tài)。動機(jī)產(chǎn)生器的基本工作是提高相應(yīng)行為組(子系統(tǒng))的動機(jī)以將內(nèi)部變量保持在允許的范圍內(nèi)的。
安裝虛擬食物或水主要是考慮為改善機(jī)器人裝置1的娛樂性。另外,存在與電能或疲勞其固有語義等同的內(nèi)部變量。這些也構(gòu)成圖23所示的隨增加或減少因素變化的動態(tài)。將相關(guān)子系統(tǒng)的動機(jī)產(chǎn)生器設(shè)計成激勵行為以將這些動態(tài)保持在固定值。安裝了所謂充電裝置作為自主行為的機(jī)器人裝置1的這種自動充電行為是可以期待的。然而,如果沒有為機(jī)器人裝置1提供這樣的充電裝置,則機(jī)器人裝置1執(zhí)行請求充電的行為,并且讓某人(人類)將它的電池充電。
對于相關(guān)存儲器獲取的信息準(zhǔn)備了相似的內(nèi)部狀態(tài)變量。用相關(guān)存儲器,計算和發(fā)送獲取的內(nèi)部信息量。在這種情況下,除了忘卻的情況,相關(guān)存儲器的內(nèi)部信息量僅增加。然而,忘卻不必安裝。通過在適當(dāng)?shù)臅r間段結(jié)合各相應(yīng)的信息量作為增加的因素、構(gòu)成暫時減少因素的簡單動態(tài)、以形成信息獲取行為子系統(tǒng)的動機(jī)。
(4-2-1-5)學(xué)習(xí)存儲器部分(相關(guān)存儲器部分)圖25說明了在信息獲取中機(jī)器人裝置1使用的相關(guān)存儲器140的具體結(jié)構(gòu)。如圖25所示,該相關(guān)存儲器140包括短期存儲器181、長期存儲器182以及注意對象存儲器183。具體地提供該相關(guān)存儲器140,如圖12所示。
通過上述結(jié)構(gòu),相關(guān)存儲器140作為具有某個顏色和某個形狀的名字的實體的存儲單元以及作為該實體對機(jī)器人裝置1的內(nèi)部狀態(tài)具有的意義的存儲單元進(jìn)行工作。
短期存儲器(STM)181存儲與ID號一起提供的圖像中的對象信息。此時的對象信息是顏色原型數(shù)(CP-I)和形狀原型數(shù)(SP-j)的信息。短期存儲器181也被饋送從語音處理輸入的一個語音的字序列。
圖像數(shù)據(jù)被饋送顏色原型數(shù)(CP-I)和形狀原型數(shù)(SP-j),以獲取對象名字和對內(nèi)部狀態(tài)的影響(delta-I)。如圖12所示,這些組合在一起并發(fā)送到行為產(chǎn)生器150。如果未獲取對象名(HMM-k)或?qū)?nèi)部狀態(tài)的影響(delta-I),則將這些作為零信息留下和發(fā)送。將語音數(shù)據(jù)直接發(fā)送到行為產(chǎn)生器150。
另一方面,在行動選擇單元116選擇行為(Action)和對象(Obj-ID)。該信息從下面說明的行為狀態(tài)機(jī)向相關(guān)存儲器140發(fā)送。與對象(Obj-ID)相應(yīng)的信息從短期存儲器181存儲到注意對象存儲器183中。同時,將短期存儲器181中存儲的說出的字序列直接發(fā)送到注意對象存儲器183。
用作為誘因的內(nèi)部變量的變化設(shè)置從注意對象存儲器183到作為固有相關(guān)存儲器182工作的長期存儲器182的學(xué)習(xí)的時序。因此,當(dāng)在對象上執(zhí)行動作期間改變了內(nèi)部變量時,將內(nèi)部變量的變化值與對象相關(guān)地進(jìn)行存儲。(4-2-1-6)行為產(chǎn)生部分現(xiàn)在說明作為規(guī)定機(jī)器人裝置1行為的子系統(tǒng)的信息獲取行為子系統(tǒng)151n。如圖26所示,將信息獲取行為子系統(tǒng)子系統(tǒng)151n構(gòu)造為分級的結(jié)構(gòu)。
在行為子系統(tǒng)層中,有一個軟件對象。
在上述第一階內(nèi)部存儲量偏離適當(dāng)范圍時,構(gòu)造所述軟件對象的動機(jī)產(chǎn)生器101用于輸出動機(jī)值。
MC_val=1-tanh(Int_val)+ε...(4)另一方面,釋放機(jī)構(gòu)102檢查從相關(guān)存儲器140發(fā)送的對象。釋放機(jī)構(gòu)102考慮與人指向相關(guān)的當(dāng)前未知的和感知(釋放)因素。在這些釋放因素當(dāng)中有例如,對象(Object)的對象名(Obj:Name)、顏色名(Ccolor:Name)、形狀名(Shape:Name)以及對對象內(nèi)部變量改變的影響(Act:Delta-1)。
除非就作為釋放因素獲得的東西做了信息定義,釋放機(jī)構(gòu)102產(chǎn)生釋放信號。與對象相關(guān)地確定釋放機(jī)構(gòu)102輸出的釋放信號的值作為關(guān)于一個對象的未定義信息的積累值。例如,只有對象名(Obj:Name)和對對象內(nèi)部變量的影響(Act:Delta-1)可以成為對象。
釋放機(jī)構(gòu)102評估存在對象的釋放信號、以選擇具有最大值的對象、從而輸出指定如此選定的對象(Obj)的ID和釋放信號。
例如,如果將蘋果指定為對象,機(jī)器人裝置1使用上述形狀或顏色分析,分析它的形狀或顏色以評估顏色名(Color:Name)和形狀名(Shape:Name)作為釋放因素。如果所述蘋果被預(yù)先記錄,則獲取高的評估值,從而所述對象被識別是蘋果。輸出將蘋果指定為選定對象的ID和這時的釋放信號。如果所述蘋果沒有預(yù)先記錄,則將未定義的蘋果的數(shù)積累求和,并與作為未知對象的蘋果相關(guān)。
釋放機(jī)構(gòu)102設(shè)置為產(chǎn)生與人指向相應(yīng)的更大的釋放信號。在做出指向的對象檢測時,不管對象是未知對象或已知對象,釋放機(jī)構(gòu)102都產(chǎn)生釋放信號。潛在的涵義是,顯然指向是人發(fā)出的信息獲取或確認(rèn)請求,因此,如愿地引發(fā)信息獲取行而不明顯地依賴于內(nèi)部狀態(tài),或如愿地執(zhí)行對于先前已知對象的確認(rèn)行為。
在信息獲取行為子系統(tǒng)151n中,作為行為評估值(行為值),獲得該釋放信號和動機(jī)值的乘積。以相似的方式,每個其它規(guī)定,例如吃的子系統(tǒng),使用輸入到信息獲取行為子系統(tǒng)151n的該釋放信號和動機(jī)值以獲得行為評估值(行為值)。
動作選擇單元116將各子系統(tǒng)的行為評估值(行為值)進(jìn)行比較、以選擇具有最大行為值的子系統(tǒng)作為要執(zhí)行的子系統(tǒng)。這里說明信息獲取行為子系統(tǒng)151n中的行為值保持為最大的情況。
同時,選定子系統(tǒng)需要連續(xù)一段時間被選中。例如,通過相互抑制或疲勞因子使其成為可能。
在選中信息獲取行為子系統(tǒng)151n時,如圖26所示,處理過程轉(zhuǎn)移到稱為模式MD的層。在模式MD中,以相似的方式進(jìn)行信息選擇。具體而言,在模式(Mode)中,區(qū)分上層的選擇是通過指向指出的對象,或是機(jī)器人裝置本身選擇的對象,即,未知的對象。如果在該模式(Mode)中做出該區(qū)別,則在被稱為模塊MJ的下層中做出關(guān)于具體行為的評估。根據(jù)該選擇,在動作選擇單元116中選擇指定的行為。
以這種方式,如果對象是已知的對象,則機(jī)器人裝置1執(zhí)行確認(rèn)行為。如果對象是未知對象,則機(jī)器人裝置1執(zhí)行獲取行為。信息獲取行為可以如下執(zhí)行,即,如果獲取了關(guān)于對象名(Obj:Name)和對內(nèi)部變量的改變的影響(Act:Delta-Int)的兩類信息,則可以檢查在子系統(tǒng)上給出最大評估值的對象以選擇一個信息。
至于在執(zhí)行確認(rèn)行為的情況中的處理過程,向與確認(rèn)行為相關(guān)的狀態(tài)機(jī)發(fā)送命令,并執(zhí)行所述名字的確認(rèn)行為。在機(jī)器人裝置1執(zhí)行視覺跟蹤時,機(jī)器人裝置1接近人指向的對象,并將其手指,即,前肢指向?qū)ο?,表現(xiàn)與‘這是XX,不是嗎?’相應(yīng)的行為。在陳述規(guī)定行為的行為序列的狀態(tài)機(jī)的控制下實現(xiàn)這樣的行為。
至于對象名(Obj:Name)的獲取行為的處理過程,將其輸出發(fā)送到負(fù)責(zé)獲取相應(yīng)對象名(Obj:Name)的狀態(tài)機(jī)。
在對象名(Obj:Name)獲取行為中,機(jī)器人裝置在執(zhí)行視覺跟蹤時接近對象,并指向它以表現(xiàn)出與‘它的名字是什么?’相應(yīng)的行為。而且,此時用距離對象的距離做出適當(dāng)?shù)男袨榭刂?。該行為由指示?guī)定所述行為的行為序列的狀態(tài)機(jī)實現(xiàn)。
緊接著‘它的名字是什么’,可以使用重復(fù)地確認(rèn)對于從語音識別單元輸出有效的任何輸入音素序列的狀態(tài)機(jī),。
另一方面,如果選擇了對內(nèi)部變量的改變的影響(Acr:Delta-Int)的獲取行為,即,根據(jù)內(nèi)部變量改變獲取未知對象的獲取行為,則與對象相關(guān)地隨機(jī)選擇數(shù)個行為,并予以執(zhí)行。此時產(chǎn)生的對內(nèi)部變量的的變化的影響(Acr:Delta-Int),由相關(guān)存儲器評估。因為這將對象與內(nèi)部狀態(tài)相關(guān)聯(lián),所以將對新對象內(nèi)部變量改變的影響實現(xiàn)為意義獲取。
例如,如果內(nèi)部狀態(tài)在看見蘋果時改變到‘愉快’,則內(nèi)部狀態(tài)改變與作為對象的蘋果相關(guān)聯(lián)。隨后,機(jī)器人裝置1將蘋果解釋為‘愉快’。這意味著,蘋果的意義獲取在機(jī)器人裝置1上得以實現(xiàn)。
同時,如上所述,將本發(fā)明應(yīng)用于機(jī)器人裝置1,能夠通過例如,軟件實現(xiàn)。
工業(yè)可應(yīng)用性使用本發(fā)明,如上所述,機(jī)器人裝置1能夠?qū)⑿畔@取行為實現(xiàn)為自主行為的一部分,并將共同注意作為最佳行為執(zhí)行。另外,機(jī)器人裝置在信息獲取行為中能夠獲取未知對象的意義,作為內(nèi)部狀態(tài)改變。這使得機(jī)器人裝置更逼真。
權(quán)利要求
1.一種機(jī)器人裝置的行為控制方法,所述方法包括語音輸入步驟;語音輸入評估步驟,根據(jù)特征化多個字序列的多個模型,評估在所述語音輸入步驟形成的語音輸入,所述模型已基于說出字序列時占優(yōu)勢的所述字序列的特征值進(jìn)行了分類;以及字序列指定步驟,基于在所述語音輸入評估步驟獲得的評估值指定所述語音輸入的字序列。
2.一種自主行動的機(jī)器人裝置,包括控制部件,用于指向機(jī)器人學(xué)習(xí)對象的行為控制。
3.如權(quán)利要求2所述的機(jī)器人裝置,包括控制部件,用于使機(jī)器人與基于外部刺激指定為優(yōu)先學(xué)習(xí)的對象的對象交互。
4.如權(quán)利要求2所述的機(jī)器人裝置,還包括指向其學(xué)習(xí)對象,作為表示好奇的行為。
5.如權(quán)利要求2所述的機(jī)器人裝置,形成至少帶有肢體的像動物的外貌;所述控制部件執(zhí)行用所述肢體指向正在學(xué)習(xí)的對象的行為控制。
6.一種自主行動的機(jī)器人裝置的行為控制方法,所述方法包括控制機(jī)器人裝置的行為以使機(jī)器人會指向其學(xué)習(xí)對象。
全文摘要
一種通過根據(jù)傳感器單元(120)獲得的信息等改變在情感單元(130)中的感情等而顯示出作為自主行為的信息捕獲行為的機(jī)器人裝置。所述機(jī)器人裝置包括行為控制部件,用于提供語言捕獲行為;意義捕獲部件;以及控制部件,用于執(zhí)行指示其自身學(xué)習(xí)對象的行為控制。所述機(jī)器人裝置將基于對象的內(nèi)部狀態(tài)變化和所述對象彼此相關(guān)地存儲在存儲器部件中。
文檔編號G06F15/18GK1853879SQ20061008506
公開日2006年11月1日 申請日期2001年10月11日 優(yōu)先權(quán)日2000年10月13日
發(fā)明者藤田雅博, 高木剛, 堀中里香, 橫野順, 加布里爾·科斯塔, 下村秀樹, 南野活樹 申請人:索尼公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
凌云县| 西青区| 平乐县| 铜梁县| 双柏县| 拜城县| 梁平县| 虎林市| 内丘县| 襄樊市| 南丰县| 故城县| 页游| 兖州市| 泉州市| 邵东县| 靖江市| 若尔盖县| 通榆县| 乌拉特前旗| 乌苏市| 五原县| 舟曲县| 文化| 罗山县| 巴楚县| 新田县| 台东县| 九寨沟县| 吉水县| 新宁县| 隆尧县| 泽州县| 丁青县| 化德县| 大城县| 宁南县| 徐水县| 沙湾县| 潮安县| 呈贡县|