本發(fā)明涉及目標(biāo)識別技術(shù),特別是一種基于概率閾值的logistic-svm目標(biāo)識別算法。
背景技術(shù):
以坦克為主要代表的各式裝甲目標(biāo)在現(xiàn)代戰(zhàn)場上占據(jù)越來越重要的地位,并開始主導(dǎo)陸地戰(zhàn)場,所以對此類裝甲目標(biāo)實(shí)施準(zhǔn)確有效的打擊成為目前彈藥武器的主要發(fā)展方向。毫米波技術(shù)與微波技術(shù)相比,具有精度高、抗干擾能力強(qiáng)、低仰角探測性能好、體積小、重量輕等優(yōu)勢;與紅外和激光技術(shù)相比,具有抗煙塵能力強(qiáng)、可有效識別環(huán)境中的金屬目標(biāo)等優(yōu)勢。國內(nèi)外開展了大量有關(guān)智能彈藥毫米波探測器的干擾技術(shù)研究,因此抗波形干擾的信號特征提取與識別技術(shù)變得格外重要。
信號特征識別問題屬于單分類問題,logistic回歸算法和svm算法都是常見的分類算法。論文“一種基于logistic回歸模型的atr算法性能評估方法”中介紹了一種基于logistic回歸的分類方法;logistic回歸相對來說模型更簡單,好理解,實(shí)現(xiàn)起來,特別是大規(guī)模線性分類時(shí)比較方便,但是針對非線性可分問題時(shí),易引入更多的冗余高次項(xiàng),導(dǎo)致模型復(fù)雜度大幅提高。論文“trackingofobjectwithsvmregression”中介紹了一種基于svm分類的追蹤方法;這種方法復(fù)雜度高,支持?jǐn)?shù)量較多時(shí)計(jì)算法較大,導(dǎo)致了分類速度必然較慢。且在處理非線性可分問題時(shí),采用核函數(shù)方法,嚴(yán)重依賴樣本數(shù)據(jù),而樣本數(shù)據(jù)往往存在一定偏差,導(dǎo)致結(jié)果出現(xiàn)誤差。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種基于概率閾值的logistic-svm目標(biāo)識別算法,有效降低算法整體復(fù)雜度的同時(shí),取得較高的識別性能。
實(shí)現(xiàn)本發(fā)明目的的技術(shù)解決方案為:一種基于概率閾值的logistic-svm目標(biāo)識別算法,步驟如下:
步驟1、選定樣本集的特征參量;
步驟2、仿真獲取訓(xùn)練樣本集、交叉驗(yàn)證集和測試集,訓(xùn)練樣本集、交叉驗(yàn)證集和測試集中均含有目標(biāo)仿真信號和波形誘騙假目標(biāo)仿真信號;
步驟3、利用步驟1和步驟2中的特征參量、訓(xùn)練樣本集、交叉驗(yàn)證集和測試集對logistic回歸模型和svm進(jìn)行訓(xùn)練、驗(yàn)證和測試;
步驟4、輸入待分類信號樣本;
步驟5、利用logistic回歸算法獲得p(y=1|x)和p(y=0|x),其中,p(y|x)為二階邏輯斯諦回歸模型的條件概率分布,
步驟6、進(jìn)行判定,當(dāng)p(y=1|x)和p(y=0|x)的差值絕對值超過概率判別閾值pt,將實(shí)例x劃分到概率值較大的一類;
當(dāng)p(y=1|x)和p(y=0|x)的差值低于概率判別閾值pt,忽略logistic回歸的判定結(jié)果,利用svm對目標(biāo)信號重新分類;
步驟7、綜合步驟6中的結(jié)果,當(dāng)目標(biāo)信號屬于目標(biāo)信號類,則識別該目標(biāo);當(dāng)目標(biāo)信號屬于波形誘騙假目標(biāo)仿真信號類,則屏蔽該信號。
本發(fā)明與現(xiàn)有技術(shù)相比,其顯著優(yōu)點(diǎn)為:(1)本發(fā)明對誤差較大的樣本形成樣本集時(shí)具有較好的容錯(cuò)能力;(2)比較已有的logistic分類算法,本發(fā)明具有更高的分類精度;(3)比較已有的svm分類算法,本發(fā)明具有更簡單的系統(tǒng)結(jié)構(gòu),需要的計(jì)算量大大減少。
附圖說明
圖1是本發(fā)明基于概率閾值的logistic-svm目標(biāo)識別算法流程圖。
圖2是訓(xùn)練選擇特征參數(shù)示意圖。
圖3是logistic識別結(jié)果圖。
圖4是logistic識別結(jié)果的概率分布圖。
圖5是svm識別結(jié)果圖。
圖6是基于概率閾值的logistic-svm探測概率p和f1示意圖。
圖7是基于概率閾值的logistic-svm平均識別時(shí)間示意圖。
具體實(shí)施方式
結(jié)合圖1,一種基于概率閾值的logistic-svm目標(biāo)識別算法,步驟如下:
步驟1、選定樣本集的特征參量[c1,c2,c3,...,cn];
步驟2、仿真獲取訓(xùn)練樣本集ttr、交叉驗(yàn)證集tcv、測試集tte,訓(xùn)練樣本集ttr、交叉驗(yàn)證集tcv和測試集tte中均含有目標(biāo)仿真信號和波形誘騙假目標(biāo)仿真信號;
步驟3、利用步驟1和步驟2中的特征參量[c1,c2,c3,...,cn]、訓(xùn)練樣本集ttr、交叉驗(yàn)證集tcv和測試集tte對logistic回歸模型和svm進(jìn)行訓(xùn)練、驗(yàn)證和測試;
步驟4、輸入待分類信號樣本t;
步驟5、利用logistic回歸算法獲得p(y=1|x)和p(y=0|x),其中,p(y|x)為二階邏輯斯諦回歸模型的條件概率分布,
步驟6、進(jìn)行判定,當(dāng)p(y=1|x)和p(y=0|x)的差值絕對值超過概率判別閾值pt,將實(shí)例x劃分到概率值較大的一類;
當(dāng)p(y=1|x)和p(y=0|x)的差值低于概率判別閾值pt,忽略logistic回歸的判定結(jié)果,利用svm對目標(biāo)信號重新分類;
步驟7、綜合步驟6中的結(jié)果,當(dāng)目標(biāo)信號屬于目標(biāo)信號類,則識別該目標(biāo);當(dāng)目標(biāo)信號屬于波形誘騙假目標(biāo)仿真信號類,則屏蔽該信號。
進(jìn)一步的,步驟3中svm分類過程中采用了fcsvm算法,具體為:
設(shè)sj為訓(xùn)練后產(chǎn)生的n個(gè)支持向量,構(gòu)成向量集s={sj|sj∈s,j=1,...n},將s分解為2個(gè)支持向量子集p和q,p={sk|sk∈s,l=1,...,m},q={sk|sk∈s,l=m+1,...,n};將所有樣本xi和支持向量sj通過非線性函數(shù)φ映射到一個(gè)高維特征空間h,則x關(guān)于p和q在特征空間h中的內(nèi)積矩陣為km和kn,定義一個(gè)變換矩陣wt,滿足kn=wtkm,其中
取滿足mercer條件的核函數(shù)k(xi,sj)=φ(xi)φ(sj),令kij=φ(xi)φ(sj)則
設(shè)svm的分類函數(shù)為符號函數(shù)f(x),其具體形式如下:
其中,αj為lagrange乘子,且滿足αj>0,yj為sj的類標(biāo)示,且yj∈{+1,-1},c是類標(biāo)示閾值;則改進(jìn)后的精簡的分類函數(shù)為
其中,
kt=(kt,1,kt,2,...,kt,m)t
下面結(jié)合具體實(shí)施例和附圖對本發(fā)明進(jìn)行詳細(xì)說明。
實(shí)施例
結(jié)合圖1,一種基于概率閾值的logistic-svm末敏彈被動(dòng)探測器目標(biāo)識別算法,步驟如下:
步驟1、信號特征的提取。如圖2所示,受干擾源發(fā)射功率的影響,波形誘騙有源假目標(biāo)干擾信號的峰值、脈寬、最大斜率、全局斜率(即信號從最小值點(diǎn)上升至最大值點(diǎn)的斜率)、積分值(信號從最小值點(diǎn)至最大值點(diǎn)的積分)均有可能出現(xiàn)變形,故選擇特征參數(shù)[pe,t,kv,kw],其中,pe為峰值、t為脈寬、kv為最大斜率、kw為全局斜率??紤]到應(yīng)用在智能彈藥領(lǐng)域,所有的信號判決結(jié)果都需在信號峰值附近得到,這樣才能對裝甲目標(biāo)中心實(shí)施有效打擊,所以此處的脈寬t修改為門限pe'上升到峰值pe處的時(shí)間寬度,門限pe'為峰值的一半。
步驟2、仿真生成裝甲目標(biāo)和波形誘騙干擾信號的訓(xùn)練集ttr、交叉驗(yàn)證集tcv、測試集tte,其中一類為裝甲目標(biāo)仿真信號類,另一類為波形誘騙假目標(biāo)仿真信號類。
步驟3、利用步驟1和步驟2中的特征參量、訓(xùn)練樣本集、交叉驗(yàn)證集和測試集對logistic回歸模型和svm進(jìn)行訓(xùn)練、驗(yàn)證和測試;
步驟4、輸入待分類信號樣本t。
步驟5、利用logistic回歸算法獲得識別結(jié)果。輸入待分類信號樣本t后,logistic得到的識別結(jié)果如圖3所示,識別時(shí)間為0.02200007s,已知測試集所含樣本個(gè)數(shù)為2000個(gè),所以單個(gè)識別時(shí)間約為11μs,f1為0.83,f1為性能評價(jià)指標(biāo),探測概率為0.87。識別結(jié)果的概率分布如圖4所示。為了對結(jié)果進(jìn)行比對,仿真svm識別結(jié)果如圖5所示,單個(gè)樣本識別時(shí)間月約為15.5μs,f1為0.894,若準(zhǔn)確率為p,召回率為r,那么
步驟6、進(jìn)行判定,當(dāng)p(y=1|x)和p(y=0|x)的差值絕對值超過概率判別閾值pt,將目標(biāo)信號劃分到概率值較大的一類。
當(dāng)p(y=1|x)和p(y=0|x)的差值低于概率判別閾值pt,忽略logistic回歸的判定結(jié)果,利用svm對目標(biāo)信號重新分類。根據(jù)logistic識別結(jié)果的概率分布,從0到1依次選擇判決閾值pt,對低于該值的樣本進(jìn)行svm再判別,獲得的模型的訓(xùn)練時(shí)間為4.239s。輸入待分類信號樣本t后,不同閾值pt下的探測概率如圖6所示,運(yùn)行時(shí)間如圖7所示。
由圖6可知,隨著概率閾值的增大,探測概率p和f1均增大,但是又由圖7可知平均單個(gè)樣本的識別時(shí)間也變長。當(dāng)概率閾值取0時(shí),則所有數(shù)據(jù)均只進(jìn)行l(wèi)ogistic分類,所以探測概率p、f1和平均識別時(shí)間均和logistic的結(jié)果近似一致;當(dāng)概率閾值取1時(shí),則所有數(shù)據(jù)都進(jìn)行了logistic和svm分類,所以最終的探測概率p和f1近似svm分類結(jié)果,甚至高于svm的分類結(jié)果,但是平均識別時(shí)間則達(dá)到兩者的平均識別時(shí)間之和;當(dāng)概率閾值取0.5時(shí),此時(shí)f1為0.873,探測概率p為0.896,而平均識別時(shí)間僅為13.12μs。綜上,選取0.5作為閾值。
步驟7、根據(jù)步驟6的識別結(jié)果,判別目標(biāo)。