專利名稱:自校準(zhǔn)傳感器定向系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對(duì)具有傳感器裝置的定向/定位設(shè)備的控制,可以通過由該定向/定位設(shè)備的致動(dòng)裝置控制的真實(shí)行為,來改變?cè)搨鞲衅餮b置的輸入空間。因此,優(yōu)選地,設(shè)想對(duì)該傳感器裝置進(jìn)行定向/定位,以使在該傳感器裝置的輸入空間中識(shí)別到的圖案轉(zhuǎn)移到目標(biāo)位置,例如該傳感器裝置的輸入空間坐標(biāo)的中心。
背景技術(shù):
本發(fā)明的背景是定向/定位設(shè)備領(lǐng)域,下面將參照?qǐng)D1和圖2來說明這種定向/定位設(shè)備。圖1表示可以以多個(gè)自由度進(jìn)行定向的立體攝像機(jī)。假定將所示的攝像機(jī)定向?yàn)槭沟盟鶛z測(cè)到的出現(xiàn)在該攝像機(jī)的輸入空間的某個(gè)位置的可視目標(biāo)移動(dòng)到該輸入空間的坐標(biāo)原點(diǎn)處。圖2表示用于計(jì)算并執(zhí)行動(dòng)作(即,攝像機(jī)的移動(dòng))以實(shí)現(xiàn)所述目的的已知處理。在第一步驟中,對(duì)該傳感器(在此為攝像機(jī))的輸出進(jìn)行評(píng)估,以確定該傳感器的多維輸入空間中的目標(biāo)位置,該目標(biāo)位置例如可以為所識(shí)別的聲音源。在后面的步驟中,使用預(yù)先定義的查找表或分析功能將該傳感器坐標(biāo)(角度等)映射到電機(jī)坐標(biāo)(電壓、電流等),以生成前面確定的攝像機(jī)的新定向所需的致動(dòng)器(電機(jī))命令。
提供顯式定向信息的傳感器裝置的典型示例例如為圖像傳感器陣列、雷達(dá)圖像傳感器陣列或化學(xué)受體傳感器陣列。提供隱式定向信息的典型傳感器裝置為用于定位聲源的立體麥克風(fēng)。在可以使用所述定向信息之前,提供隱式定向信息的傳感器裝置需要提取該定向信息。
包括用于提供定向信息的傳感器的機(jī)器人被稱為定向機(jī)器人。這種定向機(jī)器人的缺點(diǎn)在于為了能夠正確地工作,需要對(duì)它們進(jìn)行頻繁的校準(zhǔn)。每一次系統(tǒng)幾何形態(tài)發(fā)生改變之后(例如,傳感器和機(jī)器人的致動(dòng)器之間的物理關(guān)系發(fā)生變化時(shí))、每一次改變(例如,更換鏡頭、改變電機(jī))之后、以及在變化或不受控的環(huán)境中使用機(jī)器人的情況下,都必須進(jìn)行這種校準(zhǔn)。
在特定環(huán)境中,由用戶來進(jìn)行人工校準(zhǔn)是不可能的或不希望的(例如,在該機(jī)器人是送到其它行星上的探測(cè)器的情況下)。另外,在系統(tǒng)幾何形態(tài)頻繁變化、頻繁改變傳感器或電機(jī),或者非受控環(huán)境的情況下,頻繁的校準(zhǔn)非常費(fèi)時(shí)和費(fèi)力。
因此,提出了自校準(zhǔn)定向機(jī)器人。
這種自校準(zhǔn)定向機(jī)器人通常使用校準(zhǔn)方案(scenarios)、數(shù)學(xué)分析或者在人的監(jiān)督下的參數(shù)/硬件調(diào)整。
以上所有的校準(zhǔn)技術(shù)都具有以下缺點(diǎn)之一校準(zhǔn)方案的使用通常要求機(jī)器人的致動(dòng)器返回到基準(zhǔn)點(diǎn)。因此,在新的和/或非受控的環(huán)境中頻繁地進(jìn)行校準(zhǔn)是不可能的。此外,通過頻繁使用基準(zhǔn)點(diǎn)進(jìn)行的所述校準(zhǔn)不足以解決電機(jī)響應(yīng)的非線性問題。
通過數(shù)學(xué)分析進(jìn)行的校準(zhǔn)有以下缺點(diǎn)需要多個(gè)隱式的假設(shè),這往往導(dǎo)致極大的簡(jiǎn)化。通常只考慮變量的子集。因此,所述校準(zhǔn)方法的精度通常是不夠的。此外,由于復(fù)雜度高,而使得通過數(shù)學(xué)分析頻繁進(jìn)行的校準(zhǔn)通常不適用于在線校準(zhǔn)。最終,必須對(duì)設(shè)置的任何有意或無意的改變來重新定義該分析。
在人的監(jiān)督下進(jìn)行的參數(shù)/硬件調(diào)整的缺點(diǎn)在于,需要人類專家的干預(yù)。因此,這種校準(zhǔn)方案不適用于自主機(jī)器人。此外,這種校準(zhǔn)技術(shù)通常非常耗時(shí),并且高度依賴于專家的經(jīng)驗(yàn)。
發(fā)明內(nèi)容
因此,本發(fā)明的一個(gè)目的是提供一種用于控制定向系統(tǒng)的方法,以及一種自校準(zhǔn)定向系統(tǒng),該系統(tǒng)可以在無人工干預(yù)的情況下高精度地進(jìn)行系統(tǒng)的自校準(zhǔn)。
本發(fā)明的另一目的是提供一種用于控制定向系統(tǒng)的方法,以及一種自校準(zhǔn)定向系統(tǒng),該系統(tǒng)適于解決電機(jī)/傳感器響應(yīng)中的非線性問題,并且適于在變化的和/或非受控環(huán)境中使用,其中不可能或不希望進(jìn)行維護(hù)。
可以通過獨(dú)立權(quán)利要求的特征來實(shí)現(xiàn)以上目的。從屬權(quán)利要求進(jìn)一步拓展了本發(fā)明的中心思想。
根據(jù)本發(fā)明的第一方面,提出了一種用于控制定向/定位系統(tǒng)的方法,所述定向系統(tǒng)包括至少一個(gè)傳感器裝置,以及用于控制這些傳感器裝置的定向和/或定位動(dòng)作的致動(dòng)器裝置。
該方法包括以下步驟-(S1)對(duì)所述傳感器裝置的動(dòng)作前輸出信息進(jìn)行評(píng)估,以檢測(cè)圖案在所述傳感器裝置的輸入空間中的位置;-(S2)確定所述圖案在所述傳感器裝置的輸入空間中的目標(biāo)動(dòng)作后位置(targeted post-action position);-(S3)通過使用預(yù)先定義的映射函數(shù),將所述傳感器裝置的輸入空間坐標(biāo)中的動(dòng)作前位置與目標(biāo)動(dòng)作后位置的任何偏離,映射到致動(dòng)器控制坐標(biāo),來定義用于所述致動(dòng)器裝置的命令;-(S4)根據(jù)所定義的命令由所述致動(dòng)器裝置來定向/定位所述傳感器裝置,以執(zhí)行定向/定位動(dòng)作;以及-(S5)檢測(cè)所述圖案在所述傳感器裝置的輸入空間中的實(shí)際動(dòng)作后位置;-(S6)根據(jù)所述圖案在所述傳感器裝置的輸入空間中的實(shí)際動(dòng)作后位置與目標(biāo)動(dòng)作后位置之間的任何差異,來調(diào)整(adapting)步驟S3中使用的映射函數(shù),以執(zhí)行映射函數(shù)的增量自適應(yīng)學(xué)習(xí)(incremental adaptivelearning),其中使用分別經(jīng)過調(diào)整的映射函數(shù)循環(huán)地重復(fù)步驟S1至S6至少一次。
注意,在步驟S4中,可以直接或間接地移動(dòng)所述傳感器裝置(例如,在將傳感器裝置安裝在車輛或機(jī)器人上時(shí)的情況下,移動(dòng)該傳感器裝置的支架)。
在步驟S6中,可以根據(jù)圖案在所述傳感器裝置的輸入空間中的實(shí)際動(dòng)作后位置與目標(biāo)動(dòng)作后位置之間的任何差異,來計(jì)算校正信號(hào)??梢钥紤]該校正信號(hào)以及圖案在所述傳感器裝置的輸入空間中的動(dòng)作前位置,來調(diào)整映射函數(shù)。
另選地,在步驟S6中,可以根據(jù)動(dòng)作前位置來計(jì)算校正信號(hào),該動(dòng)作前位置在執(zhí)行該動(dòng)作時(shí)實(shí)際上被移動(dòng)到目標(biāo)動(dòng)作后位置??梢钥紤]該校正信號(hào)以及圖案在所述傳感器裝置的輸入空間中的動(dòng)作前位置,來調(diào)整映射函數(shù)。
在調(diào)整映射函數(shù)之前,可以將調(diào)整矢量(adaptation vector)與一因子相乘,以控制映射函數(shù)的調(diào)整率(adaptation rate),該因子大于或等于0,并且小于或等于1。
所述方法還可以包括以下步驟根據(jù)所述圖案在所述傳感器裝置的輸入空間中的實(shí)際動(dòng)作后位置與目標(biāo)位置之間的差異的合理性(plausibility),例如通過所選擇的圖案的相關(guān)值,來計(jì)算置信值(confidence value)。然后可以用該置信值對(duì)所述調(diào)整矢量進(jìn)行調(diào)制,以使得所述調(diào)整率依賴于例如所選擇的傳感器圖案之間在動(dòng)作前和動(dòng)作后的相關(guān)性的置信度。
可以通過查找表來實(shí)現(xiàn)該映射函數(shù)。該查找表將傳感器坐標(biāo)與對(duì)應(yīng)的致動(dòng)器坐標(biāo)相關(guān)聯(lián)。
在步驟S1至S6中,對(duì)于各次循環(huán),不僅使用了圖案的位置,而且使用了該位置周圍的限定范圍內(nèi)的鄰域,其中可以在后續(xù)的兩個(gè)循環(huán)之間改變?cè)撪徲虻姆秶?br>
可以在傳感器坐標(biāo)或致動(dòng)器坐標(biāo)中執(zhí)行對(duì)映射函數(shù)的調(diào)整。
本發(fā)明的另一方面涉及一種用于控制定向/定位系統(tǒng)的方法,所述定向系統(tǒng)包括至少一個(gè)傳感器裝置,以及用于控制所述傳感器裝置的定向和/或定位動(dòng)作的致動(dòng)器裝置。
所述方法優(yōu)選地包括以下步驟-(S1)使用預(yù)定義的映射函數(shù),將所述傳感器裝置位于所述傳感器裝置(1)的輸入空間坐標(biāo)中的輸出信息,映射到致動(dòng)器控制坐標(biāo);-(S2)確定目標(biāo)動(dòng)作后位置,該確定在致動(dòng)器控制坐標(biāo)中進(jìn)行;-(S3)根據(jù)所述確定的結(jié)果來定義用于所述致動(dòng)器裝置(41、42、43)的命令;以及-(S4)根據(jù)所定義的命令,由所述致動(dòng)器裝置來對(duì)所述傳感器裝置進(jìn)行定向/定位,以執(zhí)行所述傳感器裝置的定向/定位動(dòng)作。
可以將多個(gè)傳感器裝置的輸出分別映射到致動(dòng)器坐標(biāo)中,隨后進(jìn)行組合,其中可以根據(jù)該組合的結(jié)果來執(zhí)行步驟S2中的所述確定。
在進(jìn)行步驟S2中的確定時(shí),可以考慮所述致動(dòng)器裝置的約束。
本發(fā)明的另一方面涉及一種計(jì)算機(jī)軟件產(chǎn)品,該計(jì)算機(jī)軟件產(chǎn)品用于在計(jì)算機(jī)設(shè)備上運(yùn)行時(shí)實(shí)現(xiàn)上述方法。
本發(fā)明的另一方面涉及一種自動(dòng)校準(zhǔn)定向/定位系統(tǒng)。該系統(tǒng)優(yōu)選地包括至少一個(gè)傳感器裝置、計(jì)算裝置,以及用于控制所述傳感器裝置的定向和/或定位動(dòng)作的致動(dòng)器裝置,所述計(jì)算裝置包括-用于對(duì)所述傳感器裝置的動(dòng)作前輸出信息進(jìn)行評(píng)估,以檢測(cè)圖案在所述傳感器裝置(1)的輸入空間中的位置的裝置;-用于確定所述圖案在所述傳感器裝置的輸入空間中的目標(biāo)動(dòng)作后位置的裝置;-用于向致動(dòng)器裝置發(fā)送命令的裝置,該命令是通過使用預(yù)定義的映射函數(shù),將所述傳感器裝置的輸入空間坐標(biāo)中的動(dòng)作前位置與目標(biāo)動(dòng)作后位置之間的任何偏離,映射到致動(dòng)器控制坐標(biāo)而生成的;-用于檢測(cè)所述圖案在所述傳感器裝置的輸入空間中的實(shí)際動(dòng)作后位置的裝置;以及-用于根據(jù)所述圖案在所述傳感器裝置的輸入空間中的實(shí)際動(dòng)作后位置與目標(biāo)動(dòng)作后位置之間的任何差異,來校準(zhǔn)所述映射函數(shù),以執(zhí)行映射函數(shù)的增量自適應(yīng)學(xué)習(xí)的裝置。
在以下的詳細(xì)說明中,將參照附圖對(duì)本發(fā)明進(jìn)行說明,在所有附圖中,使用相似的標(biāo)號(hào)來表示相似的部分,在附圖中圖1表示根據(jù)現(xiàn)有技術(shù)的定向裝置;圖2表示根據(jù)現(xiàn)有技術(shù)的定向動(dòng)作計(jì)算處理;
圖3a、3b示意性地表示了根據(jù)本發(fā)明的另選處理;圖4a、4b表示計(jì)算校正信號(hào)以進(jìn)行映射函數(shù)的自適應(yīng)學(xué)習(xí)的不同實(shí)施例;圖5表示用于加速調(diào)整處理的選項(xiàng);圖6表示在圖3a或3b的學(xué)習(xí)處理中引入置信值;以及圖7表示本發(fā)明的自校準(zhǔn)定向/定位系統(tǒng)的方框圖。
具體實(shí)施例方式
現(xiàn)將參照?qǐng)D3a來說明根據(jù)本發(fā)明的處理。與已知處理(參見圖2)相比,對(duì)傳感器的輸出信號(hào)進(jìn)行評(píng)估,以確定所識(shí)別圖案在傳感器裝置1的輸入空間中的目標(biāo)位置,該目標(biāo)位置是通過預(yù)先計(jì)算的“一次(one-strike)”動(dòng)作而獲得的。這意味著,首先構(gòu)成一動(dòng)作,即與真實(shí)世界的計(jì)劃交互,然后執(zhí)行整個(gè)動(dòng)作。只有在該動(dòng)作完成以后,才對(duì)最初計(jì)劃的動(dòng)作與實(shí)際結(jié)果之間的差異進(jìn)行評(píng)估,并計(jì)劃和執(zhí)行額外的校正動(dòng)作。
根據(jù)本發(fā)明,為了將所確定動(dòng)作的傳感器坐標(biāo)映射到致動(dòng)器坐標(biāo)中,使用了自適應(yīng)學(xué)習(xí)的映射。在定向的第一循環(huán)中,使用粗略估測(cè)或任意設(shè)定的映射函數(shù)。在至少一個(gè)另外的循環(huán)中,將使用改進(jìn)的“學(xué)習(xí)”映射函數(shù)。
該方法具有以下優(yōu)點(diǎn)在傳感器/致動(dòng)器特性發(fā)生變化(磨損、設(shè)置的變化、更換、溫度波動(dòng)...)的情況下,通過較少的學(xué)習(xí)/調(diào)整循環(huán)來自動(dòng)實(shí)現(xiàn)正確的傳感器/致動(dòng)器映射,而無需人工干預(yù),也無需通過分析(重新)定義致動(dòng)器和傳感器坐標(biāo)之間的相關(guān)性。
為了執(zhí)行自適應(yīng)學(xué)習(xí)處理,當(dāng)完成了循環(huán)并且執(zhí)行了動(dòng)作時(shí),評(píng)估該動(dòng)作是否成功,即,該圖案是否實(shí)際上已接近目標(biāo)位置,并且根據(jù)任何偏差來生成校正信號(hào),并將其饋送到映射單元,以執(zhí)行增量學(xué)習(xí)步驟??梢灾貜?fù)該循環(huán),直到所計(jì)劃的動(dòng)作與實(shí)際結(jié)果之間的偏差小于預(yù)定閾值為止,或者可以無限地繼續(xù)該循環(huán)。
注意,在該動(dòng)作完成之后生成該校正信號(hào),該動(dòng)作意味著在一次過程中獲得所需的結(jié)果。
總之,根據(jù)該示例,在傳感器坐標(biāo)中確定要進(jìn)行的動(dòng)作;隨后將該確定產(chǎn)生的結(jié)果映射到致動(dòng)器(電機(jī))坐標(biāo)。
圖3b表示一另選設(shè)置,其中在致動(dòng)器坐標(biāo)系統(tǒng)中執(zhí)行確定處理之前,首先將傳感器坐標(biāo)映射到致動(dòng)器坐標(biāo)。這種設(shè)置具有以下優(yōu)點(diǎn)例如,可以在當(dāng)前正在致動(dòng)器坐標(biāo)中進(jìn)行確定的過程中,更容易地考慮對(duì)致動(dòng)器坐標(biāo)的限制(最大范圍、速度、加速度等)。
另外,根據(jù)圖3b的該另選設(shè)置,可以將不同的、最終完全不同的傳感器的輸出信號(hào)分別映射到各自的致動(dòng)器坐標(biāo)中,可以容易地將這些致動(dòng)器坐標(biāo)進(jìn)行組合,以根據(jù)所組合的致動(dòng)器坐標(biāo)來確定要執(zhí)行的動(dòng)作。
將參照?qǐng)D4a來說明計(jì)算校正信號(hào)以及映射函數(shù)的調(diào)整的第一實(shí)施例。如上所述,映射的目的是將在傳感器坐標(biāo)中確定的動(dòng)作的坐標(biāo)轉(zhuǎn)換為適用于控制該致動(dòng)器裝置的坐標(biāo)。因此,圖4a分別示出了傳感器陣列和電機(jī)陣列。在本示例中,設(shè)想要執(zhí)行下述動(dòng)作,通過該動(dòng)作,將動(dòng)作前位置 轉(zhuǎn)移到傳感器陣列(傳感器輸入空間)的中心。使用預(yù)設(shè)的映射函數(shù),假定對(duì)應(yīng)的致動(dòng)器(電機(jī))命令為 然而,通過使用該電機(jī)命令,沒有將動(dòng)作前位置 精確地移動(dòng)到傳感器陣列中的目標(biāo)位置,而是移動(dòng)到了動(dòng)作后位置 根據(jù)本實(shí)施例,現(xiàn)作為線性外推法執(zhí)行映射函數(shù)的增量自適應(yīng)學(xué)習(xí)(并且該映射函數(shù)的增量自適應(yīng)學(xué)習(xí)要用于下一循環(huán)),即坐標(biāo)(自由度)x的自適應(yīng)校正電機(jī)命令為M→xt+1=M→xt-1+αx(M→^xt-M→xt-1)]]>其中M→^xt=M→xt-1·S→xt-1S→xt-1-S→xt,]]>并且αx是可選參數(shù)(等于或大于0,并且等于或小于1),用于控制坐標(biāo)x的調(diào)整率。
注意,還可以將這種外推型學(xué)習(xí)處理用于非線性映射。
此外,可以將如圖4a所示的學(xué)習(xí)處理應(yīng)用于圖3a和圖3b的確定策略。
最后,還可以將該學(xué)習(xí)處理應(yīng)用于傳感器的輸入空間中存在單個(gè)和多個(gè)刺激發(fā)射源(stimulus-emitting sources)的情況。
為了加速學(xué)習(xí)處理(該學(xué)習(xí)處理被調(diào)整率參數(shù)αx潛在地減慢),可以在各次循環(huán)中使用一個(gè)以上的位置。如圖5所示,為了加速調(diào)整的收斂,可以使用一位置的限定鄰域。因此,通過使該鄰域的范圍可隨時(shí)間變化,可以實(shí)現(xiàn)下述的映射函數(shù),該映射函數(shù)在系統(tǒng)突然失準(zhǔn)的情況下保持可塑性,并且同時(shí)保持局部穩(wěn)定,以保證任何非線性的精確表達(dá)。
將參照?qǐng)D4b來說明計(jì)算校正信號(hào)以及映射函數(shù)的調(diào)整的第二實(shí)施例。同樣,該映射的目的是將在傳感器坐標(biāo)中確定的動(dòng)作的坐標(biāo)轉(zhuǎn)換為適用于控制該致動(dòng)器裝置的坐標(biāo)。因此,圖4b也分別示出了傳感器陣列和電機(jī)陣列。在本示例中,設(shè)想要執(zhí)行下述動(dòng)作,通過該動(dòng)作,將動(dòng)作前位置 轉(zhuǎn)移到傳感器陣列(傳感器輸入空間)的中心。使用預(yù)設(shè)的映射函數(shù),假定對(duì)應(yīng)的致動(dòng)器(電機(jī))命令為 然而,通過使用該電機(jī)命令,沒有將動(dòng)作前位置 精確地轉(zhuǎn)移到傳感器陣列中的目標(biāo)位置,而是轉(zhuǎn)移到動(dòng)作后位置 下面,根據(jù)本第二實(shí)施例,對(duì)實(shí)際上已經(jīng)在執(zhí)行由 所命令的動(dòng)作時(shí)轉(zhuǎn)移到目標(biāo)位置的基準(zhǔn)位置進(jìn)行識(shí)別。此外,與第一實(shí)施例相反,在傳感器空間中根據(jù)以下公式來執(zhí)行對(duì)映射的調(diào)整S→xt=S→xt-1+αx(S→^xt-1-S→xt-1)]]>其中 是在時(shí)刻t的維度x的經(jīng)校正的目標(biāo)動(dòng)作后位置, 是在時(shí)刻t-1的維度x的(未校正的)目標(biāo)動(dòng)作后位置, 是時(shí)刻t-1的維度x的動(dòng)作前基準(zhǔn)位置,而αx是用于控制維度x的調(diào)整率的常數(shù)(大于或等于0,并且小于或等于1)。
注意,該學(xué)習(xí)處理可以應(yīng)用于圖3a和3b的學(xué)習(xí)策略。該學(xué)習(xí)處理是一種相對(duì)較快的方法,然而,其要求在輸入空間中存在多個(gè)刺激發(fā)射源—如果僅存在單個(gè)刺激發(fā)射源,顯然不能如上所述找到基準(zhǔn)位置。
圖6示意性地表示了可以根據(jù)校正信號(hào)獲得置信量度。隨后可以使用該置信量度(具有0到1之間的值)對(duì)調(diào)整率進(jìn)行調(diào)制。置信量度的引入使產(chǎn)生錯(cuò)誤調(diào)整步驟的可能性最小(在不正確地估測(cè)校正信號(hào)的情況下會(huì)產(chǎn)生錯(cuò)誤調(diào)整步驟)。通常通過相關(guān)性方法來計(jì)算校正信號(hào),這種情況下,可以使用(在歸一化之后)該相關(guān)性作為置信量度。
圖7示意性示出了根據(jù)本發(fā)明的自校準(zhǔn)定向/定位系統(tǒng)。
該系統(tǒng)包括傳感器裝置1,用于采集現(xiàn)實(shí)世界的信息,以將圖案2(例如,所識(shí)別的限定目標(biāo))定位在該傳感器裝置1的至少一維的輸入空間中。另選地,該傳感器裝置1可以是雷達(dá)圖像傳感器陣列、化學(xué)受體傳感器陣列,或者用于定位由對(duì)象2發(fā)出的聲音的立體聲麥克風(fēng),或者任何其它定向傳感器。
傳感器裝置1安裝在機(jī)架上,該機(jī)架包括例如適用于傾斜和搖擺該傳感器裝置1的致動(dòng)器裝置41和42。在本示例中,所述致動(dòng)器裝置41和42例如可以是線性電機(jī)。
因此,致動(dòng)器裝置41和42適于通過移動(dòng)傳感器裝置1本身來改變傳感器裝置1的輸入空間。注意,在本說明書的結(jié)構(gòu)中,將適于通過真實(shí)世界的操控來改變傳感器裝置1的輸入空間的任何計(jì)劃處理稱為“動(dòng)作”。因此,“動(dòng)作前”和“動(dòng)作后”分別是指由該致動(dòng)器裝置控制的這種動(dòng)作發(fā)生之前和之后的狀態(tài)。
傳感器裝置1和致動(dòng)器裝置41和42與計(jì)算裝置3相連。
在圖7中,所述計(jì)算裝置3是計(jì)算機(jī),該計(jì)算機(jī)適用于定義該圖案在傳感器裝置1的輸入空間中的目標(biāo)動(dòng)作后位置信息,以及計(jì)算用于使致動(dòng)器裝置41和42移動(dòng)傳感器裝置1的命令。另選地或另外地,該計(jì)算裝置可適用于計(jì)算用來移動(dòng)機(jī)器人43的操控裝置(manipulator)8的命令,操控裝置8的移動(dòng)也是適于在致動(dòng)器裝置41和42的控制下改變傳感器裝置1的輸入空間的動(dòng)作。
當(dāng)計(jì)算用于各個(gè)致動(dòng)器裝置41、42或者機(jī)器人43的命令時(shí),該計(jì)算裝置使用下述信息由所述傳感器裝置1提供的動(dòng)作前位置信息,即,與該動(dòng)作發(fā)生前,該圖案在傳感器裝置1的輸入空間中的位置相關(guān)的信息;以及目標(biāo)動(dòng)作后位置信息,即,表示該動(dòng)作發(fā)生后,圖案2的目標(biāo)位置的信息。例如,該目標(biāo)位置可以是傳感器裝置1的輸入空間的中心。另選地,特別在致動(dòng)器裝置控制例如機(jī)器人等的操控裝置臂的情況下,可以將該目標(biāo)位置設(shè)定為要由該機(jī)器人操控的對(duì)象的位置(仍然位于傳感器裝置1的輸入空間中)。
計(jì)算裝置3包括確定裝置5和比較裝置6。
確定裝置5適于確定在完成所述致動(dòng)器裝置41、42和/或所述機(jī)器人43通過移動(dòng)所述傳感器裝置1或通過移動(dòng)所述操控裝置8對(duì)所述對(duì)象2和/或所述操控裝置8進(jìn)行的動(dòng)作后,由傳感器裝置1輸出的動(dòng)作后位置信息是否與計(jì)算裝置3先前定義的目標(biāo)動(dòng)作后位置一致。
如果確定裝置5確定動(dòng)作后對(duì)象-傳感器位置信息與目標(biāo)對(duì)象-傳感器位置信息不匹配,則計(jì)算裝置3進(jìn)一步通過使用由比較裝置6輸出的比較結(jié)果,對(duì)分別用于致動(dòng)器裝置41、42和機(jī)器人43的計(jì)算命令進(jìn)行校正。然后可以將校正后的命令用于后續(xù)動(dòng)作。
為了實(shí)現(xiàn)圖3a的學(xué)習(xí)策略,計(jì)算裝置3適于計(jì)算動(dòng)作后對(duì)象-傳感器位置信息與目標(biāo)動(dòng)作后對(duì)象-傳感器位置信息之間的差異,并通過使用以下公式對(duì)用于致動(dòng)器裝置41、42、43的計(jì)算命令進(jìn)行自動(dòng)校正M→xt+1=M→xt-1+αx(M→^xt-M→xt-1)]]>其中M→^xt=M→xt-1·S→xt-1S→xt-1-S→xt,]]> 是在時(shí)刻t+1的維度x的用于致動(dòng)器裝置(41、42、43)的已校正命令, 是在時(shí)刻t-1的維度x的用于致動(dòng)器裝置(41、42、43)的未校正命令, 是在根據(jù)未校正命令對(duì)所述致動(dòng)器裝置(41、42、43)進(jìn)行了控制之后,在時(shí)刻t的維度x的動(dòng)作后對(duì)象-傳感器位置信息, 是在時(shí)刻t-1的維度x的目標(biāo)動(dòng)作后對(duì)象-傳感器位置信息,而αx是用于控制維度x的調(diào)整率的常數(shù)。
由于明確地考慮了當(dāng)前通過先前用于控制致動(dòng)器裝置41、42和/或機(jī)器人43的命令而實(shí)現(xiàn)的精度,所以所述差異的使用使得能夠以非常精確的方式對(duì)用于控制致動(dòng)器裝置41、42和/或機(jī)器人43的計(jì)算命令進(jìn)行校正。
為了實(shí)現(xiàn)圖3b的學(xué)習(xí)策略,該計(jì)算裝置可以適于通過使用以下公式來計(jì)算目標(biāo)動(dòng)作后位置信息與動(dòng)作前位置信息之間的差異S→xt=S→xt-1+αx(S→^xt-1-S→xt-1)]]>其中 是在時(shí)刻t的維度x的調(diào)整后的目標(biāo)動(dòng)作后位置, 是在時(shí)刻t-1的維度x的目標(biāo)動(dòng)作后位置, 是在時(shí)刻t-1的維度x的動(dòng)作前基準(zhǔn)圖案位置,而αx是用于控制維度x的調(diào)整率的常數(shù)(大于或等于0,并且小于或等于1)。
由于通過使用位于目標(biāo)動(dòng)作后對(duì)象-傳感器位置信息中的基準(zhǔn)對(duì)象來選擇所述基準(zhǔn)位置,所以保證了該基準(zhǔn)對(duì)象最佳地適用于校正致動(dòng)器裝置41、42和/或機(jī)器人43的各自動(dòng)作。此外,由于不是通過使用單個(gè)預(yù)定基準(zhǔn)點(diǎn)而是使用位于各個(gè)目標(biāo)動(dòng)作后對(duì)象-傳感器位置信息中的基準(zhǔn)對(duì)象來進(jìn)行這種校正,所以甚至可以處理電機(jī)/傳感器響應(yīng)中的非線性問題。
可以通過計(jì)算裝置3將校正后的命令,即,自適應(yīng)學(xué)習(xí)的映射函數(shù),存儲(chǔ)到所述命令映射的所述存儲(chǔ)裝置7中。
由計(jì)算裝置3使用存儲(chǔ)在命令映射中的命令來計(jì)算分別用于致動(dòng)器41、42和機(jī)器人43的任何新命令。
通過自動(dòng)比較傳感器裝置的動(dòng)作后輸出和該傳感器裝置的動(dòng)作前輸出,并且使用所述比較結(jié)果對(duì)用于致動(dòng)器裝置的計(jì)算命令進(jìn)行校正,本發(fā)明的方法使得該定位系統(tǒng)能夠自動(dòng)校準(zhǔn),并且適應(yīng)變化和不受控的環(huán)境。
因此,本發(fā)明提供了一種用于控制定向系統(tǒng)的方法以及一種自校準(zhǔn)定向系統(tǒng),該方法使得該系統(tǒng)能夠高精度進(jìn)行自動(dòng)校準(zhǔn),而無需人工干預(yù)。此外,本發(fā)明的用于控制定向系統(tǒng)的方法以及本發(fā)明的自校準(zhǔn)定向系統(tǒng)適于處理電機(jī)/傳感器中的非線性問題,并適于在不能或不希望進(jìn)行維護(hù)的變化和/或不受控的環(huán)境中使用。因此,本發(fā)明的系統(tǒng)和方法可以在沒有人工干預(yù)的情況下長(zhǎng)時(shí)間地進(jìn)行操作。
與現(xiàn)有技術(shù)的自定向/自校準(zhǔn)系統(tǒng)相比,本發(fā)明的系統(tǒng)更加簡(jiǎn)單、更加靈活,并且需要較少的維護(hù)??梢愿淖儽景l(fā)明的系統(tǒng)的幾何形態(tài),而不需要對(duì)制動(dòng)器裝置和傳感器裝置進(jìn)行新的校準(zhǔn)。
例如,本發(fā)明的系統(tǒng)和方法的典型應(yīng)用示例為在自動(dòng)攝像機(jī)或定點(diǎn)設(shè)備監(jiān)督下的機(jī)器人的攝像機(jī)調(diào)焦操作。配備有攝像機(jī)的機(jī)器人以及根據(jù)本發(fā)明的定向系統(tǒng)可以由此聚焦在所識(shí)別的對(duì)象上,并最終朝向它們移動(dòng),以對(duì)它們進(jìn)行操控。
權(quán)利要求
1.一種用于控制定向/定位系統(tǒng)的方法,該定向系統(tǒng)包括至少一個(gè)傳感器裝置(1);以及用于控制所述傳感器裝置(1)的定向和/或定位動(dòng)作的致動(dòng)器裝置(41、42、43),所述方法包括以下步驟-(S1)對(duì)所述傳感器裝置(1)的動(dòng)作前輸出信息進(jìn)行評(píng)估,以檢測(cè)圖案在所述傳感器裝置(1)的輸入空間中的位置;-(S2)確定所述圖案(2)在所述傳感器裝置(1)的輸入空間中的目標(biāo)動(dòng)作后位置;-(S3)通過使用預(yù)先定義的映射函數(shù),將所述傳感器裝置(1)的輸入空間坐標(biāo)中的所述動(dòng)作前位置與所述目標(biāo)動(dòng)作后位置之間的任何偏離,映射到致動(dòng)器控制坐標(biāo),來定義用于所述致動(dòng)器裝置(41、42、43)的命令;-(S4)根據(jù)所定義的命令由所述致動(dòng)器裝置(41、42、43)來定向/定位所述傳感器裝置(1),以執(zhí)行定向/定位動(dòng)作;以及-(S5)檢測(cè)所述圖案(2)在所述傳感器裝置(1)的輸入空間中的實(shí)際動(dòng)作后位置;所述方法的特征在于-(S6)根據(jù)所述圖案在所述傳感器裝置(1)的輸入空間中的所述實(shí)際動(dòng)作后位置與所述目標(biāo)動(dòng)作后位置之間的任何差異,來調(diào)整在步驟S3中使用的所述映射函數(shù),以執(zhí)行所述映射函數(shù)的增量自適應(yīng)學(xué)習(xí),其中使用分別進(jìn)行了調(diào)整的映射函數(shù)循環(huán)地重復(fù)步驟S1至S6至少一次。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于在步驟S6中,-根據(jù)所述圖案在所述傳感器裝置(1)的輸入空間中的所述實(shí)際動(dòng)作后位置與所述目標(biāo)位置之間的任何差異,計(jì)算校正信號(hào),并且-考慮所述校正信號(hào)、所執(zhí)行的致動(dòng)器命令以及所述圖案在所述傳感器裝置(1)的輸入空間中的動(dòng)作前位置,來調(diào)整所述映射函數(shù)。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于在步驟S6中,-根據(jù)執(zhí)行所述動(dòng)作時(shí)已實(shí)際移動(dòng)到所述目標(biāo)動(dòng)作后位置的所述動(dòng)作前位置,來計(jì)算校正信號(hào),并且-考慮所述校正信號(hào)和所執(zhí)行的致動(dòng)器命令,來調(diào)整所述映射函數(shù)。
4.根據(jù)權(quán)利要求2或3所述的控制定向系統(tǒng)的方法,其特征在于在調(diào)整所述映射函數(shù)之前,將調(diào)整矢量與一因子相乘,以控制所述映射函數(shù)的調(diào)整率,該因子大于或等于0,并且小于或等于1。
5.根據(jù)權(quán)利要求2至4中的任意一項(xiàng)所述的控制定向系統(tǒng)的方法,其特征在于所述方法還包括以下步驟-根據(jù)執(zhí)行所述動(dòng)作之前和之后的傳感器圖案之間的比較,來計(jì)算置信值;并且-使用所述置信值對(duì)所述調(diào)整矢量進(jìn)行調(diào)制,以使得所述調(diào)整率依賴于所述置信值。
6.根據(jù)前述權(quán)利要求中的任何一項(xiàng)所述的方法,其特征在于通過查找表來實(shí)現(xiàn)所述映射函數(shù)。
7.根據(jù)前述權(quán)利要求中的任何一項(xiàng)所述的方法,其特征在于在步驟S1至S6中,對(duì)于各次循環(huán),不僅使用了所述圖案的位置,而且使用了該位置周圍的限定范圍內(nèi)的鄰域。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于可以在兩個(gè)后續(xù)的循環(huán)之間改變所述鄰域的范圍。
9.根據(jù)前述權(quán)利要求中的任何一項(xiàng)所述的方法,其特征在于在所述傳感器坐標(biāo)中執(zhí)行對(duì)所述映射函數(shù)的調(diào)整。
10.根據(jù)權(quán)利要求1至9中的任何一項(xiàng)所述的方法,其特征在于在所述致動(dòng)器坐標(biāo)中執(zhí)行對(duì)所述映射函數(shù)的調(diào)整。
11.一種用于控制定向/定位系統(tǒng)的方法,該定向系統(tǒng)包括至少一個(gè)傳感器裝置(1);以及用于控制所述傳感器裝置(1)的定向和/或定位動(dòng)作的致動(dòng)器裝置(41、42、43),所述方法包括以下步驟-(S1)使用預(yù)先定義的映射函數(shù),將所述傳感器裝置(1)在所述傳感器裝置(1)的輸入空間坐標(biāo)中的輸出信息,映射到致動(dòng)器控制坐標(biāo);-(S2)確定目標(biāo)動(dòng)作后位置,該確定在所述致動(dòng)器控制坐標(biāo)中進(jìn)行;-(S3)根據(jù)所述確定的結(jié)果來定義用于所述致動(dòng)器裝置(41、42、43)的命令;以及-(S4)根據(jù)所定義的命令,由所述致動(dòng)器裝置(41、42、43)對(duì)所述傳感器裝置(1)進(jìn)行定向/定位,以執(zhí)行所述傳感器裝置的定向/定位動(dòng)作。
12.根據(jù)權(quán)利要求11所述的方法,其特征在于將多個(gè)傳感器裝置的輸出分別映射到致動(dòng)器坐標(biāo),隨后進(jìn)行組合,其中可以根據(jù)該組合的結(jié)果來執(zhí)行步驟S2中的所述確定。
13.根據(jù)權(quán)利要求11或12所述的方法,其特征在于在步驟S2中進(jìn)行所述確定時(shí),考慮所述致動(dòng)器裝置的約束。
14.一種計(jì)算機(jī)軟件產(chǎn)品,適于在計(jì)算設(shè)備上運(yùn)行時(shí)實(shí)現(xiàn)根據(jù)前述權(quán)利要求中的任何一項(xiàng)所述的方法。
15.一種自動(dòng)校準(zhǔn)定向/定位系統(tǒng),其包括至少一個(gè)傳感器裝置(1)、計(jì)算裝置、以及用于控制傳感器裝置(1)的定向和/或定位動(dòng)作的致動(dòng)器裝置(41、42、43),所述計(jì)算裝置包括-用于對(duì)所述傳感器裝置(1)的動(dòng)作前輸出信息進(jìn)行評(píng)估,以檢測(cè)圖案在所述傳感器裝置(1)的輸入空間中的位置的裝置;-用于確定所述圖案(2)在所述傳感器裝置(1)的輸入空間中的目標(biāo)動(dòng)作后位置的裝置;-用于向所述致動(dòng)器裝置(41、42、43)發(fā)送命令的裝置,所述命令是通過使用預(yù)先定義的映射函數(shù),將所述傳感器裝置(1)的輸入空間中的所述動(dòng)作前位置與所述目標(biāo)動(dòng)作后位置之間的任何偏離,映射到致動(dòng)器控制坐標(biāo)中而生成的;-用于檢測(cè)所述圖案(2)在所述傳感器裝置(1)的輸入空間中的實(shí)際動(dòng)作后位置的裝置;-用于根據(jù)所述圖案在所述傳感器裝置(1)的輸入空間中的所述實(shí)際動(dòng)作后位置與所述目標(biāo)動(dòng)作后位置之間的任何差異,來校準(zhǔn)所述映射函數(shù),以執(zhí)行所述映射函數(shù)的增量自適應(yīng)學(xué)習(xí)的裝置。
16.根據(jù)權(quán)利要求15所述的系統(tǒng),其特征在于用于根據(jù)所述圖案在所述傳感器裝置(1)的輸入空間中的所述實(shí)際動(dòng)作后位置與所述目標(biāo)位置之間的任何差異,來計(jì)算校正信號(hào)的裝置,其中,考慮所述校正信號(hào)、所執(zhí)行的致動(dòng)器命令以及所述圖案在所述傳感器裝置(1)的輸入空間中的動(dòng)作前位置,來校準(zhǔn)所述映射函數(shù)。
17.根據(jù)權(quán)利要求16所述的系統(tǒng),其特征在于用于根據(jù)執(zhí)行所述動(dòng)作時(shí)已實(shí)際移動(dòng)到所述目標(biāo)動(dòng)作后位置的所述動(dòng)作前位置,來計(jì)算校正信號(hào)的裝置,并且其中,考慮所述校正信號(hào)以及所執(zhí)行的致動(dòng)器命令,來校準(zhǔn)所述映射函數(shù)。
18.根據(jù)權(quán)利要求16或17所述的系統(tǒng),其特征在于在校準(zhǔn)所述映射函數(shù)之前,將調(diào)整矢量與一因子相乘,以控制所述映射函數(shù)的調(diào)整率,該因子大于或等于0,并且小于或等于1。
19.根據(jù)權(quán)利要求16至18中的任意一項(xiàng)所述的系統(tǒng),其特征在于-用于根據(jù)執(zhí)行所述動(dòng)作之前和之后所選擇的傳感器圖案的相關(guān)性,來計(jì)算置信值的裝置;以及-用于使用所述置信值對(duì)所述調(diào)整矢量進(jìn)行調(diào)制,以使所述調(diào)整率依賴于所述置信值的裝置。
20.根據(jù)權(quán)利要求16至19中的任意一項(xiàng)所述的系統(tǒng),其特征在于通過查找表來實(shí)現(xiàn)所述映射函數(shù)。
21.根據(jù)權(quán)利要求16至20中的任意一項(xiàng)所述的系統(tǒng),其特征在于所述傳感器裝置包括攝像機(jī)或麥克風(fēng)中的至少一種。
全文摘要
本發(fā)明涉及對(duì)定向/定位系統(tǒng)的控制,該定向/定位系統(tǒng)包括傳感器裝置(1);以及用于控制該傳感器裝置的定向和/或定位動(dòng)作的致動(dòng)器裝置(41、42、43)。
文檔編號(hào)G05D3/00GK1696855SQ20051006661
公開日2005年11月16日 申請(qǐng)日期2005年4月15日 優(yōu)先權(quán)日2004年4月16日
發(fā)明者弗蘭克·茹布蘭, 托比亞斯·羅德曼 申請(qǐng)人:本田研究所歐洲有限公司