專利名稱:基于馬爾科夫鏈蒙特卡洛粒子濾波的目標(biāo)跟蹤方法
技術(shù)領(lǐng)域:
本發(fā)明提供的是一種函數(shù)跟蹤方法,具體涉及融合了馬爾科夫鏈蒙特卡洛移動步驟的粒子濾波方法(PF-MCMC)。
背景技術(shù):
非線性濾波方法目前廣泛應(yīng)用于信號處理以及導(dǎo)航制導(dǎo)、目標(biāo)跟蹤、金融分析、人工智能等相關(guān)領(lǐng)域。最早出現(xiàn)的非線性濾波算法是擴(kuò)展卡爾曼濾波(EKF),EKF的核心思想是對隨機(jī)系統(tǒng)的非線性模型作線性近似,而且其噪聲是基于高斯假設(shè)的,因此對于強(qiáng)非線性非高斯模型的濾波效果不佳,在工程應(yīng)用中,EKF僅對某些特定的模型有效,對于很多非線性系統(tǒng)不能保證收斂和濾波精度。無跡卡爾曼濾波(UKF)也是較為常用的一種非線性濾波算法,UKF無須將模型進(jìn)行線性化,直接使用非線性模型,避免了局部線性化引入的誤差,避免在強(qiáng)非線性系統(tǒng)中出現(xiàn)發(fā)散。但由于UKF也是基于高斯假設(shè),所以在工程應(yīng)用中的很多非高斯模型上很難取得理想的濾波效果。以非參數(shù)化的蒙特卡羅模擬方法為基礎(chǔ)的粒子濾波(PF)可以有效的彌補(bǔ)EKF和UKF的不足,PF方法的核心是利用些隨機(jī)樣本(粒子)來表示系統(tǒng)隨機(jī)變量的后驗(yàn)概率密度,能得到基于物理模型的近似最優(yōu)數(shù)值解,而不是對近似模型進(jìn)行最優(yōu)濾波。
PF最常見的問題是粒子退化現(xiàn)象,即經(jīng)過幾次迭代,除一個粒子外,所有粒子都只具有微小的權(quán)值,這意味著大量的計算工作都被用來更新那些對后驗(yàn)概率密度的估計幾乎沒有影響的粒子上。解決該問題的一個關(guān)鍵技術(shù)是再采樣策略,其基本思想是通過后驗(yàn)概率密度函數(shù)再采樣N次,產(chǎn)生新的粒子集,由于再采樣是獨(dú)立同分布,粒子權(quán)值被重新設(shè)置為1/N,再采樣帶來的負(fù)面問題是樣本貧化現(xiàn)象,即高權(quán)值的粒子被多次復(fù)制,采樣結(jié)果中包含了很多重復(fù)點(diǎn),不能有效的反應(yīng)狀態(tài)變量的概率分布,從而喪失了粒子的多樣性,甚至?xí)?dǎo)致濾波發(fā)散。因此,一個好的再采樣算法應(yīng)該能夠在增加粒子多樣性和減少小權(quán)值粒子數(shù)目之間進(jìn)行有效平衡。
馬爾可夫鏈蒙特卡羅(MCMC)算法是一種利用馬爾科夫鏈無記憶性的隨機(jī)模擬方法。其基本思想是構(gòu)造一條非周期、不可約的馬爾科夫鏈(X0,X1,X2…),并且它有不變分布π,當(dāng)這一馬爾科夫鏈迭代次數(shù)接近無窮大時,得到的Xn的分布可以無限接近π。利用這種方法我們可以找到一條以P為不變分布的馬爾科夫鏈,進(jìn)而可以得到近似服從P的隨機(jī)樣本。MCMC方法主要應(yīng)用在下面幾個方面用于生成比較復(fù)雜的隨機(jī)數(shù),可以實(shí)現(xiàn)對高維分布的采樣,也是重要性采樣的一種方法;實(shí)現(xiàn)高維積分的數(shù)值計算;用被估參數(shù)的貝葉斯分布的采樣來估計參數(shù);求復(fù)雜樣本空間上函數(shù)的極值(模擬退火)。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種能提高濾波精度,改善粒子多樣性的基于馬爾科夫鏈蒙特卡洛粒子濾波的目標(biāo)跟蹤方法。
本發(fā)明的目的是這樣實(shí)現(xiàn)的 主要包括如下步驟 第一步,初始化粒子,并設(shè)置其初始的均值和方差。
第二步,使用UKF/SSUKF或混合建議分布更新粒子 通過標(biāo)準(zhǔn)無跡粒子濾波算法(UKF)或基于超球面采樣的無跡粒子濾波(SSUKF)進(jìn)行重要性采樣即通過UKF/SSUKF獲得粒子集的均值
和方差Pki,從UKF/SSUKF結(jié)果
中采樣產(chǎn)生N個粒子。
混合建議分布即通過UKF/SSUKF得到的分布產(chǎn)生一部分粒子,剩余粒子由先驗(yàn)分布產(chǎn)生。
第三步,權(quán)值更新 上式中的重要性概率密度函數(shù)引入了最新的觀測值,因此改善了濾波器的性能。
第四步,得到歸一化的權(quán)值
第五步,再采樣。
第六步,引入MCMC移動步驟,使用馬特普利斯-黑斯廷(Metropolis-Hasting)算法的具體步驟。
第七步,狀態(tài)更新。
至此,算法一個時間步的運(yùn)算結(jié)束,進(jìn)入下一時間步的運(yùn)算,轉(zhuǎn)入第二步運(yùn)行。
本發(fā)明針對再采樣步驟引起的樣本貧化現(xiàn)象,在這一步驟之后引入MCMC移動步驟,使得粒子群有序移動,得到更好的分布,改善了多樣性,能夠在定程度上減輕樣本的貧化現(xiàn)象。
MCMC移動步驟本來用于不確定參數(shù)的系統(tǒng)辨識,Metropolis-Hasting算法是一種典型的MCMC方法,在再采樣步驟中引入MCMC移動步驟可以提高濾波精度和對粒子個數(shù)進(jìn)行調(diào)整。
在k時刻,利用馬爾可夫過渡核函數(shù)
來生成一組新的樣本
用以代替重采樣后的樣本集
此時核函數(shù)
滿足下列恒定性條件 因此,新的粒子集
仍然服從p(x0k|y1k)的分布。
Metropolis-Hasting算法的基本步驟如下 第一步,任意選取馬爾科夫鏈的初始狀態(tài)X0=x。
第二步,從重要性分布中產(chǎn)生備選擇點(diǎn)
其中k為算法迭代步數(shù)。
第三步,由均勻分布U(0,1)中產(chǎn)生一個參考分布,即v~U(0,1) 第四步,判斷是否接受移動 如果
則接受移動,令
否則拒絕移動,丟棄
保留再采樣的粒子,即
從上述步驟可以得知,MCMC方法主要是把粒子推向先驗(yàn)密度和后驗(yàn)密度都較大的區(qū)域??梢詣討B(tài)調(diào)整系統(tǒng)的性能和控制粒子數(shù)目的增減。
在粒子濾波的步驟中,最為重要的是重要性采樣和再采樣步驟。在再采樣步驟之中加入MCMC算法。通過利用某一門限值判斷是否接受移動,如果移動則將粒子推向后驗(yàn)密度較大的區(qū)域,如果不移動,則說明再采樣的粒子得到了應(yīng)有的效果無需移動。因此,這一步驟從一定程度上保證了再采樣步驟的效果,相應(yīng)也保證了算法的濾波精度。但是,加入了MCMC步驟之后,也相應(yīng)加重了算法的計算負(fù)擔(dān),使得濾波的快速性有所下降。因此在需要保證快速性的場合,可以考慮使用相對簡單的重要性采樣方式或者對粒子數(shù)進(jìn)行一定的控制,以減小算法整體的計算量。
本發(fā)明具有以下優(yōu)點(diǎn) 第一,通過MCMC步驟,粒子推向在先驗(yàn)密度和后驗(yàn)密度都較大的區(qū)域,從而在一定程度上解決了樣本貧化問題。
第二,保證了再采樣步驟的效果,提高了濾波算法的精度。
第三,在傳統(tǒng)的SIR中或者改進(jìn)后的EKPF、UPF等粒子濾波算法中都可以加入MCMC算法,應(yīng)用范圍較廣,均可以取得比較理想的效果。
本發(fā)明針對粒子濾波的粒子退化以及再采樣引起的樣本貧化問題,在粒子濾波中引入統(tǒng)計了統(tǒng)計理論中的馬爾科夫鏈-蒙特卡洛方法,在每個粒子上增加一個穩(wěn)定分布作為后驗(yàn)概率密度的馬爾科夫鏈蒙特卡洛移動步驟,由此提高濾波精度,改善粒子多樣性。
圖1為PF-MCMC濾波方法流程圖; 圖2為UPF與UPF-MCMC在一次獨(dú)立實(shí)驗(yàn)中的函數(shù)跟蹤(N=200); 圖3為SSUPF與SSUPF-MCMC在一次獨(dú)立實(shí)驗(yàn)中的函數(shù)跟蹤(N=200); 圖4為UPF與混合分布UPF-MCMC在一次獨(dú)立實(shí)驗(yàn)中的函數(shù)跟蹤(N=200)。
具體實(shí)施例方式 下面結(jié)合附圖舉例對本發(fā)明做更詳細(xì)地描述 本發(fā)明PF-MCMC濾波方法的基本步驟如下 第一步,初始時刻,由初始分布p(x0)中得到一組初始粒子,并設(shè)置其初始的均值和方差。
第二步,更新粒子 使用UKF/SSUKF或混合建議分布更新粒子 通過UKF或SSUKF進(jìn)行重要性采樣即通過UKF/SSUKF獲得粒子集的均值
和方差Pki,從UKF/SSUKF結(jié)果
中采樣產(chǎn)生N個粒子。
混合建議分布即通過UKF/SSUKF得到的分布產(chǎn)生一部分粒子,剩余粒子由先驗(yàn)分布產(chǎn)生,步驟如下 (1)對每一個采樣點(diǎn)xk-1i,應(yīng)用UKF/SSUKF得到粒子集的均值
和方差Pki。
(2)引入一個比例參數(shù)a(0<a<1),從UKF結(jié)果
中產(chǎn)生a×N個粒子,從先驗(yàn)概率分布p(xk|xk-1i)中產(chǎn)生(1-a)×N個粒子。
第三步,權(quán)值更新 上式中的重要性概率密度函數(shù)
引入了最新的觀測值,因此改善了濾波器的性能。
第四步,得到歸一化的權(quán)值
第五步,再采樣 定義Neff來衡量有效粒子數(shù)量。如Neff<Nthr,即對
重新采樣,產(chǎn)生新的集合{xki,i=1,...,N},重新設(shè)定粒子的權(quán)值為
第六步,引入MCMC移動步驟 即運(yùn)用Metropolis-Hasting算法的具體步驟 第七步,狀態(tài)更新
至此,算法一個時間步的運(yùn)算結(jié)束,進(jìn)入下一時間步的運(yùn)算,轉(zhuǎn)入第二步運(yùn)行。
實(shí)施實(shí)例一 單變量非穩(wěn)定增長模型(UNGM)是在經(jīng)濟(jì)領(lǐng)域應(yīng)用較為廣泛的一種非線性模型,利用這一模型對PF-MCMC濾波方法的跟蹤性能和一般粒子濾波性能進(jìn)行比較,該模型是研究比較各種粒子濾波的算法性能的標(biāo)準(zhǔn)驗(yàn)證程序之一,其狀態(tài)方程和觀測方程如下 其中觀測噪聲vt~N(0,1),系統(tǒng)噪聲為如下的高斯和分布 p(ut)=0.8N(u;0,1)+0.2N(u;0,10) 給定系統(tǒng)狀態(tài)條件下的測量似然函數(shù)在yt>0時是雙模態(tài)的,在yt<0是單模態(tài)的。由于狀態(tài)初始值和濾波迭代步數(shù)與粒子濾波算法無關(guān),因此可以不考慮這兩個參數(shù)。另外,狀態(tài)初始方差、測量噪聲方差、過程噪聲方差與重采樣算法關(guān)系不大,而且在實(shí)際應(yīng)用中,這三個參數(shù)都是由傳感器等測量儀給出的。仿真實(shí)驗(yàn)中的濾波參數(shù)如下狀態(tài)初值為0.1,狀態(tài)初始方差2,采樣粒子數(shù)100,迭代時間步數(shù)100,再采樣閾值0.9?;旌辖ㄗh分布MCMC濾波選用SSUKF和先驗(yàn)分布共同產(chǎn)生建議分布,比例參數(shù)a=0.4。
仿真數(shù)據(jù)在表1中顯示,實(shí)驗(yàn)表明,MCMC方法把粒子推向高似然函數(shù)區(qū)域,在過程噪聲比較小的情況下,UPF-MCMC和SSUPF-MCMC和混合建議分布MCMC算法完全沒有采樣枯竭問題。有效樣本個數(shù)可以衡量粒子濾波算法的退化程度,對于SIR濾波Neff=25.947;而UPF-MCMC濾波達(dá)到了Neff=72.214;SSUPF-MCMC濾波Neff=73.526;混合建議分布MCMC濾波Neff=73.029。
表1 實(shí)施實(shí)例二 利用下面的非線性模型對濾波跟蹤性能進(jìn)行驗(yàn)證,其狀態(tài)方程和觀測方程如下 其中過程噪聲vt服從Gamma(3,2)分布,量測噪聲nk服從高斯分布N(0,10-5)。系統(tǒng)狀態(tài)的估計為
一次獨(dú)立實(shí)驗(yàn)的均方誤差為
在實(shí)驗(yàn)中,分別采用UPF以及SSUPF與本文提出的UPF-MCMC、SSUPF-MCMC、混合建議分布MCMC方法進(jìn)行比較。采用的粒子數(shù)N為200個,量測時間為T=60,進(jìn)行100次獨(dú)立的實(shí)驗(yàn),UPF的UT變換參數(shù)為α=1,β=0,κ=2?;旌辖ㄗh分布MCMC濾波選用SSUKF和先驗(yàn)分布共同產(chǎn)生建議分布,比例參數(shù)a=0.4。
圖2給出了給出了UPF、UPF-MCMC在一次獨(dú)立實(shí)驗(yàn)中的狀態(tài)估計結(jié)果。。圖3給出了SSUPF、SSUPF-MCMC在一次獨(dú)立實(shí)驗(yàn)中的狀態(tài)估計誤差。圖4給出了SSUPF、混合建議分布MCMC在一次獨(dú)立實(shí)驗(yàn)中的狀態(tài)估計誤差。從以上圖中可以看出,對于非線性、非高斯問題,PF算法得到的狀態(tài)估計在部分時刻會嚴(yán)重偏離真實(shí)值,UPF與SSUPF算法得到的狀態(tài)估計可以較好的吻合真實(shí)狀態(tài),在加入了MCMC步驟的三種算法的跟蹤性能進(jìn)一步提高。從圖2到圖4可以看出,在非線性較強(qiáng)的前30個時間步,加入了MCMC的三種算法的跟蹤性能明顯好于其余三種,而在后30時間步,各種算法的跟蹤性能很相近。
表2 通過上述模型將加入了MCMC步驟的粒子濾波跟蹤方法與UPF和SSUPF三種方法的跟蹤性能進(jìn)行對比。主要對比數(shù)據(jù)為經(jīng)過50次運(yùn)行6種粒子濾波算法的均方根誤差(RMSE)、運(yùn)算時間,如表2所示。通過對這些性能指標(biāo)的比較可以得到,在加入了MCMC步驟的三種算法中,UPF-MCMC、SSUPF-MCMC和混合建議分布MCMC算法的跟蹤性能比較好,算法精度較高。但所用的計算時間大大超過前兩種算法。由于在sigma采樣時節(jié)省了一定的計算成本,SSUPF-MCMC的計算效率好于UPF-MCMC。由于采用了計算效率較高的重要性采樣方式,所以混合建議分布MCMC算法的計算效率進(jìn)一步有所改善。
權(quán)利要求
1.一種基于馬爾可夫鏈蒙特卡羅粒子濾波的目標(biāo)跟蹤方法,其特征是主要包括如下步驟
第一步,初始時刻,由初始分布p(x0)中得到一組初始粒子,并設(shè)置其初始的均值和方差;
第二步,重要性采樣
(1)根據(jù)標(biāo)準(zhǔn)無跡粒子濾波算法以及基于超球面采樣的無跡粒子濾波對粒子的狀態(tài)進(jìn)行更新;或采取混合建議分布,即一部分粒子通過標(biāo)準(zhǔn)無跡粒子濾波或算法以及基于超球面采樣的無跡粒子濾得到,剩余部分由先驗(yàn)分布產(chǎn)生;
(2)求粒子集的均值
和方差Pki;
(3)從重要性密度函數(shù)中抽取粒子;
第三步,權(quán)值更新
上式中,wki為粒子對應(yīng)的權(quán)值,p(·|·)為概率密度函數(shù),重要性概率密度函數(shù)
為由均值和方差得到的建議分布;
第四步,得到歸一化的權(quán)值
第五步,再采樣定義閾值Neff來衡量有效粒子數(shù)量,Nthr為有效粒子數(shù),如Neff<Nthr,即對粒子集
重新采樣,產(chǎn)生新的集合{xki,i=1,...,N},重新設(shè)定粒子的權(quán)值為wki=1/N,N為粒子數(shù);
第六步,引入馬爾科夫鏈蒙特卡洛移動步驟;
第七步,狀態(tài)更新
全文摘要
本發(fā)明提供的是一種基于馬爾科夫鏈蒙特卡洛粒子濾波的目標(biāo)跟蹤方法1、初始時刻,由初始分布中得到一組初始粒子,并設(shè)置其初始的均值和方差;2、重要性采樣;3、權(quán)值更新;4、得到歸一化的權(quán)值;5、再采樣;6、引入MCMC移動步驟;7、狀態(tài)更新。本發(fā)明通過MCMC移動步驟,將粒子推向先驗(yàn)分布和后驗(yàn)分布都較大的區(qū)域,改善粒子多樣性,在一定程度上抑制樣本貧化問題。樣本貧化問題的解決使得算法再采樣的效果得到保證,進(jìn)而可以提高濾波的精度。MCMC移動步驟比較容易實(shí)現(xiàn),因此可以與其它改進(jìn)步驟結(jié)合運(yùn)用對粒子濾波進(jìn)行優(yōu)化。MCMC步驟的加入增加了濾波方法的運(yùn)算量,但另一方面降低了精確估計所需要的粒子數(shù),提高了濾波的效率。
文檔編號G06T7/20GK101819682SQ20101014220
公開日2010年9月1日 申請日期2010年4月9日 優(yōu)先權(quán)日2010年4月9日
發(fā)明者楊萌, 高偉, 郝燕玲 申請人:哈爾濱工程大學(xué)