本發(fā)明涉及核輻射探測技術領域,特別是一種基于模糊決策樹的復雜核素識別方法。
背景技術:
隨著科學技術的發(fā)展,核技術已被廣泛應用于工業(yè)、農業(yè)等各個領域。傳統(tǒng)的放射性核素識別方法是對放射性核素所放射出的γ能譜進行尋峰,通過所尋道址獲取其對應能量,經(jīng)反檢索核素庫后,即可得到該處峰位對應的核素種類。這種方法在研究初期有很好的適用性,但隨著待檢測樣品復雜程度的增加,特別是在放射性核素活度較低時,識別所需時間很長,且效果偏差。近年來,人工神經(jīng)網(wǎng)絡、小波變換等新的數(shù)據(jù)處理技術不斷得到發(fā)展,這些技術在譜分析方面的應用也受到了關注。人工神經(jīng)網(wǎng)絡具有非線性映射、快速并行處理功能,但要求學習譜的探測條件和實測時的探測條件保持一致,且如要識別更多核素,則需要大量學習樣本?,F(xiàn)有方法均存在一定的局限性,在數(shù)據(jù)分析方面都沒有擺脫傳統(tǒng)γ能譜的概念,對于復雜γ能譜的特征屬性提取不夠完備,且大多屬于黑箱算法,模型不透明。
技術實現(xiàn)要素:
本發(fā)明所要解決的技術問題是:針對上述存在的問題,提供了一種基于模糊決策樹的復雜核素識別方法。
本發(fā)明采用的技術方案如下:一種基于模糊決策樹的復雜核素識別方法,具體包括以下過程:
步驟s1:對放射性核素γ能譜采用時域最小二乘法進行平滑預處理;
步驟s2:對處理后的γ能譜采用對稱零面積變換法進行尋峰,提取特征峰位值;
步驟s3:對處理后的γ能譜采用db5小波基對混合能譜進行5層一維小波變換,提取變換后最大的分波能量值;
步驟s4:整合特征信息即特征峰位值和分波能量值形成樣本庫,基于模糊決策樹方法,在建樹過程中動態(tài)地對特征空間進行劃分,構造核素識別分類器,實現(xiàn)核素的識別。
進一步的,所述步驟s1中,選取核素γ能譜數(shù)據(jù)的第m點,并在第m點左右各取k個數(shù)據(jù),所述m、k均為整數(shù),形成2k+1個數(shù)據(jù)點的窗口;在所述窗口中用多項式擬合原始譜數(shù)據(jù),多項式在第m點的值就是平滑預處理后的譜在m點的值;m的值沿能譜數(shù)據(jù)移動則獲取整個平滑后的譜數(shù)據(jù)。
進一步的,所述步驟s3中,小波變換將混合能譜分解為低頻信息和高頻信息,分別選取低頻信息和高頻信息中最大的分波能量值。
進一步的,所述步驟s4中模糊決策樹方法的具體流程為:(a)輸入樣本庫中原始數(shù)據(jù)集,根據(jù)原始數(shù)據(jù)集構造根節(jié)點;(b)判斷根節(jié)點上的數(shù)據(jù)集是否符合葉節(jié)點的條件,如果符合則生成葉子節(jié)點獲取最終的模糊決策樹,如果不符合則到步驟c;(c)計算當前節(jié)點的信息量,使用fcm聚類算法對當前節(jié)點上數(shù)據(jù)集的可用屬性進行分類;(d)計算數(shù)據(jù)集中每個可用屬性的模糊信息增益,選取最大者作為擴展屬性對數(shù)據(jù)集進行分割;(e)根據(jù)所選擴展屬性進行的模糊分割,將當前節(jié)點樣本集映射到相應的子模糊集;(f)將所選屬性去活躍;(g)為每個子模糊集構造相應的子節(jié)點,再返回到步驟b。
與現(xiàn)有技術相比,采用上述技術方案的有益效果為:
(1)在特征提取過程中,將新興方法與傳統(tǒng)方法相結合,即將小波變換的分波能量與放射性核素能譜特征峰相結合,作為識別核素的依據(jù)。用小波變換后的分波能量取代傳統(tǒng)方法中核素特征射線的全能峰面積,作為分析和識別核素種類的特征之一,綜合利用了全譜計數(shù)來進行分析,避免了傳統(tǒng)識別方法中環(huán)境和儀器噪聲對能譜影響較大的情況,從一個新的視角對能譜特征進行提取,提高了核素識別的可靠性和穩(wěn)定性。
(2)本發(fā)明中涉及到的模糊決策樹算法在其建樹過程中動態(tài)地對特征空間進行劃分。這種建樹方式追求每個結點處的最優(yōu)劃分,故可以提高決策樹的測試精度,且相比起現(xiàn)有的核素識別算法,本發(fā)明所用的模糊決策樹算法擁有透明的模型,靈活地對特征信息進行模糊化,建立合適的決策樹并輸出模糊規(guī)則,能很好地針對核素識別問題做出決策。
附圖說明
圖1是本發(fā)明中一種基于模糊決策樹的復雜核素識別方法的流程示意圖。
圖2是本發(fā)明中137cs(銫137)、60co(鈷60)及(152eu鈾152)混合源的實測γ能譜圖。
圖3是本發(fā)明中137cs(銫137)、60co(鈷60)及(152eu鈾152)混合源的實測γ能譜圖進行時域最小二乘法平滑預處理后的能譜。
圖4是本發(fā)明中平滑預處理后的能譜使用自刻度對稱零面積變換法進行尋峰的結果圖。
圖5是本發(fā)明中平滑預處理后的能譜利用db5小波基對能譜進行5層一維小波分解的低頻(近似)信號譜圖。
圖6是平滑預處理后的能譜利用db5小波基對能譜進行5層一維小波分解的高頻(細節(jié))信號譜圖。
圖7為本發(fā)明中模糊決策樹方法的具體流程示意圖。
具體實施方式
下面結合附圖對本發(fā)明做進一步描述。
本實施例以放射性核素137cs(銫137)、60co(鈷60)及152eu(鈾152)在強本底情況下的混合γ能譜為例,能譜圖如圖2所示,對本發(fā)明作進一步的闡述,由于混合了三種放射性核素,該混合γ能譜是一種復雜放射性核素γ能譜。
一種基于模糊決策樹的復雜核素識別方法,如圖1所示為所述復雜核素識別方法的流程示意圖。
步驟s1:對137cs(銫137)、60co(鈷60)及152eu(鈾152)混合γ能譜采用時域最小二乘法進行平滑預處理;
采用時域最小二乘法時的基本過程為:選取核素γ能譜數(shù)據(jù)的第m點,第m點是能譜數(shù)據(jù)中所有數(shù)據(jù)點中的其中一點,并在第m點左右各取k個數(shù)據(jù),所述m、k均為整數(shù),形成2k+1個數(shù)據(jù)點的窗口,例如k取3時即在第m點前后各取3點,進行7點最小二乘法;在7個數(shù)據(jù)點的窗口中用多項式擬合原始譜數(shù)據(jù),多項式在第m點的值就是平滑預處理后的譜在m點的值;m的值沿能譜數(shù)據(jù)移動則獲取整個平滑后的譜數(shù)據(jù),如圖3所示。
步驟s2:對平滑預處理后的γ能譜采用對稱零面積變換法進行尋峰,提取特征峰位值;
對稱零面積變換法是用面積為零的窗函數(shù)與能譜數(shù)據(jù)進行卷積變換,并且要求窗函數(shù)為對稱函數(shù)。對于線性本底,二階差分為零,只有峰出現(xiàn)時,二階差分才不為零,且為一個負的極小值,極小值位置即為特征峰位值。
尋峰的具體過程為:通過計算得到能譜的對稱零面積變換譜,結合下式(1)判定峰的存在,其中,y為原始能譜,
通過改變尋峰閾值,可以調整尋峰算法對假峰的容忍度,從而達到控制尋峰數(shù)量的目的。本實施例選定尋峰閾值為-0.60,如圖4為使用自刻度對稱零面積變換法得到的尋峰結果,能譜中每個全能峰及附近的輔助峰位均被識別出來,如圖中豎線標示。
步驟s3:對處理后的γ能譜采用db5小波基對混合能譜進行5層一維小波變換,提取變換后最大的分波能量值;
小波變換將混合能譜分解為低頻信息和高頻信息。低頻信息是變化緩慢的部分,是圖像的框架,也是輪廓,占全部信息的大部分;高頻信息是變化迅速的部分,反映的是圖像的細節(jié)信息,占全部信息的小部分。
設hjf為能量有限信號f∈l2(r)在分辨率2j下的近似,則hjf可以進一步分解為f在分辨率2j-1下的近似hj-1f(通過低通濾波器得到),以及位于分辨率2j-1與2j之間的細節(jié)dj-1f(通過高通濾波器得到)之和,基本分解過程如下式(3)所示:
hjf=hj-1f+dj-1f.....................(3)
圖5為利用db5小波基對混合能譜進行5層一維小波分解低頻(逼近)信號譜圖,圖6為利用db5小波基對混合能譜進行5層一維小波分解高頻(細節(jié))信號譜圖;分別選取低頻信息和高頻信息中最大的分波能量值。
步驟s4:整合特征信息即特征峰位值和分波能量值形成樣本庫,基于模糊決策樹方法,在建樹過程中動態(tài)地對特征空間進行劃分,構造核素識別分類器,實現(xiàn)核素的識別。
優(yōu)選地,本實施例的模糊決策樹方法與傳統(tǒng)的模糊決策樹方法不同,區(qū)別在于:本實施例中,建樹過程中動態(tài)地對特征空間進行劃分,而并不是傳統(tǒng)方法中建樹前對特征空間就進行模糊劃分。
如圖7所示,本實施例模糊決策樹方法的具體流程為:(a)輸入樣本庫中原始數(shù)據(jù)集,根據(jù)原始數(shù)據(jù)集構造根節(jié)點;(b)判斷根節(jié)點上的數(shù)據(jù)集是否符合葉節(jié)點的條件,如果符合則生成葉子節(jié)點獲取最終的模糊決策樹,如果不符合則到步驟c;(c)計算當前節(jié)點的信息量,使用fcm聚類算法對當前節(jié)點上數(shù)據(jù)集的可用屬性進行分類;(d)計算數(shù)據(jù)集中每個可用屬性的模糊信息增益,選取最大者作為擴展屬性對數(shù)據(jù)集進行分割;(e)根據(jù)所選擴展屬性進行的模糊分割,將當前節(jié)點樣本集映射到相應的子模糊集;(f)將所選屬性去活躍;(g)為每個子模糊集構造相應的子節(jié)點,再返回到步驟b。本實施例的建樹方式追求每個結點處的最優(yōu)劃分,故可以提高決策樹的測試精度。
例如,在對當前結點例如節(jié)點a進行劃分時,分別對結點內樣本的每一個可用屬性值進行模糊c均值聚類(fcm)劃分,且計算出此種劃分的信息增益值,模糊信息增益為信息量的差值。信息增益是每一個決策結點選取最佳決策屬性的度量標準,信息增益越大,說明采用該屬性進行篩選后,信息熵變得越小,樣本集合純度更高。屬性v相對于當前結點a樣本集s的信息增益gain(s,v)定義為:
其中sv是樣本集s中進行模糊聚類后屬性值為v的子集。式子的第一項entropy(s)就是當前結點a樣本集s的熵,第二項
本發(fā)明并不局限于前述的具體實施方式。本發(fā)明擴展到任何在本說明書中披露的新特征或任何新的組合,以及披露的任一新的方法或過程的步驟或任何新的組合。如果本領域技術人員,在不脫離本發(fā)明的精神所做的非實質性改變或改進,都應該屬于本發(fā)明權利要求保護的范圍。