本發(fā)明涉及一種物質(zhì)分類方法及裝置,尤其是一種基于太赫茲光譜的物質(zhì)分類方法及裝置。
背景技術(shù):
1、目前,對(duì)藥品等物質(zhì)的檢測時(shí),所述檢測方法可包括化學(xué)法、光譜法、離子遷移譜法、色譜法、質(zhì)譜法和色譜質(zhì)譜聯(lián)用技術(shù)等方法,雖然不同的檢測方法各有優(yōu)點(diǎn),但也有相應(yīng)的限制,具體如下:
2、化學(xué)法的檢測成本低,但不易檢測出含量低、化學(xué)結(jié)構(gòu)相似的藥品,一般多用于實(shí)驗(yàn)室環(huán)境并且無法進(jìn)行快速檢測;
3、光譜法多指利用x光進(jìn)行檢測,其中,x光穿透能力極強(qiáng),能夠檢測到包裹里物品的形狀;然而,一些藥品在x光下只能看到外部輪廓,難以進(jìn)行定性分析,同時(shí)還存在對(duì)人體的輻射危害;
4、離子遷移譜法對(duì)微量物質(zhì)非常敏感,可通過檢測人體毛發(fā)、血液或尿液來檢測人體內(nèi)是否有藥品殘留。不過,離子遷移譜法的分辨率較低、定量性差,并且只適用于低濃度范圍內(nèi)的檢測;
5、色譜法與質(zhì)譜法具有較高的靈敏度,但操作復(fù)雜且成本高,不適用于藥品的現(xiàn)場檢測。
6、隨著太赫茲技術(shù)的發(fā)展,太赫茲波被廣泛地應(yīng)用于物質(zhì)檢測領(lǐng)域并取得顯著的成果。太赫茲波通常是指頻率在0.1-10thz的電磁波,其波長范圍為30μm-3000μm,頻率處于紅外波和微波之間。相對(duì)于其它頻段的波,太赫茲波具有相干性、高穿透性、低能性、指紋光譜、強(qiáng)吸水性等特點(diǎn)。
7、太赫茲時(shí)域光譜技術(shù)(thz-tds)是獲取太赫茲頻率范圍內(nèi)高信噪比光譜數(shù)據(jù)的常用方法,太赫茲波的頻帶覆蓋了許多大分子的振動(dòng)能級(jí)和旋轉(zhuǎn)能級(jí),它對(duì)分子間的振動(dòng)有很強(qiáng)的敏感性,特別是對(duì)集體振動(dòng)模式和空間結(jié)構(gòu)的微小差異的敏感性。因此,太赫茲光譜可以用來區(qū)分具有相似化學(xué)成分的物質(zhì)。太赫茲光譜學(xué)的瞬態(tài)、相干和寬帶特性,可以用來快速有效的獲得被測藥物的內(nèi)部分子結(jié)構(gòu)和分子之間復(fù)雜的相互作用;同時(shí),太赫茲波的單光子能量也較低,不會(huì)對(duì)人體造成危害,也不會(huì)引起被測物質(zhì)的電解和分離。與其它光譜相比,太赫茲波更適合違禁藥物等物質(zhì)的快速、無損檢測。
8、對(duì)太赫茲時(shí)域光譜的物質(zhì)檢測,大多都是以主成分分析—傳統(tǒng)機(jī)器學(xué)習(xí)為基礎(chǔ),首先將樣本信號(hào)進(jìn)行傅里葉變化,然后使用主成分分析對(duì)不同樣本進(jìn)行特征提取,最后使用傳統(tǒng)機(jī)器學(xué)習(xí)建立分類模型;比如:使用梯度提升決策樹模型、支持向量機(jī)模型等對(duì)降維后的太赫茲光譜進(jìn)行物質(zhì)識(shí)別,然而采用主成分分析等一些降維方式對(duì)一些太赫茲時(shí)域光譜曲線整體差異較小的化合物進(jìn)行降維時(shí),容易缺失樣本間差異的重要特征信息,從而導(dǎo)致不佳的分類效果。若不對(duì)原始太赫茲時(shí)域光譜數(shù)據(jù)進(jìn)行降維,傳統(tǒng)機(jī)器學(xué)習(xí)分類算法難以對(duì)維數(shù)較高的光譜數(shù)據(jù)進(jìn)行分類。
9、隨著深度學(xué)習(xí)的發(fā)展,神經(jīng)網(wǎng)絡(luò)因其自動(dòng)提取特征的強(qiáng)大能力,在多類別、復(fù)雜背景等情況下的物質(zhì)檢測中表現(xiàn)出不錯(cuò)的效果。為了解決現(xiàn)有機(jī)器學(xué)習(xí)算法分類準(zhǔn)確度低的問題,公開號(hào)cn113344051a的申請(qǐng)使用了神經(jīng)網(wǎng)絡(luò)來對(duì)太赫茲數(shù)據(jù)進(jìn)行分類。公開號(hào)為cn116310575a的申請(qǐng)使用convnext-tiny網(wǎng)絡(luò)模型,并于目前流行的resnet模型作對(duì)比,進(jìn)一步提高了違禁品分類識(shí)別的準(zhǔn)確率。
10、對(duì)于太赫茲光譜這種的自然數(shù)據(jù),深度學(xué)習(xí)利用一些非線性的結(jié)構(gòu)可以把原始數(shù)據(jù)轉(zhuǎn)變?yōu)楦映橄蟮谋磉_(dá),實(shí)現(xiàn)特征自動(dòng)提取,并且隨著數(shù)據(jù)的豐富,算法性能也隨之提升。但是卷積通過局部感受野只能提取局部特征,并且多層卷積和池化操作的疊加會(huì)逐漸降低特征圖的分辨率,導(dǎo)致模型在全局特征提取方面存在缺陷,從而影響分類精度。
11、transformer的興起徹底解決了神經(jīng)網(wǎng)絡(luò)的一些弊端。transformer使用自注意力機(jī)制,能夠捕獲輸入數(shù)據(jù)的全局依賴關(guān)系,每個(gè)輸入位置(如圖像中的一個(gè)像素或特征)都能與其他所有位置交互,從而更好地提取全局特征。為了在自注意力機(jī)制中保留輸入序列的位置信息,transformer引入了位置編碼,使得模型能夠識(shí)別和利用輸入的相對(duì)位置信息。transformer在自然語言處理(nlp)領(lǐng)域表現(xiàn)出色,并逐漸擴(kuò)展到圖像識(shí)別領(lǐng)域。例如,vit(vision?transformer)已應(yīng)用于圖像和光譜數(shù)據(jù)分類,表現(xiàn)優(yōu)于cnn。公開號(hào)為cn116883933a的申請(qǐng)中使用基于transformer架構(gòu)的msa-detr來對(duì)違禁品進(jìn)行分類,取得了很好的效果。然而,自注意力機(jī)制的計(jì)算復(fù)雜度是ο(n2),其中n是輸入序列的長度(對(duì)于圖像來說是像素的數(shù)量)。與卷積的局部操作相比,自注意力需要計(jì)算所有位置之間的相互關(guān)系,因此計(jì)算量更大。隨著數(shù)據(jù)量的豐富,對(duì)于物質(zhì)的分類準(zhǔn)確率會(huì)提高,而這些架構(gòu)所取得的令人印象深刻的性能通常來自于模型規(guī)模的強(qiáng)大,這就使得在資源受限的設(shè)備上應(yīng)用它們成為一個(gè)關(guān)鍵的挑戰(zhàn)。
12、為了追求輕量級(jí)模型,已經(jīng)進(jìn)行了大量的研究,皆在減少模型的資源消耗,同時(shí)保持競爭性。早期關(guān)于高效cnn的研究主要集中在通過有效的組卷積、輕量級(jí)跳躍等方式來縮小原始的卷積塊。而對(duì)于transfomer網(wǎng)絡(luò),一些研究提出了減少vit的計(jì)算復(fù)雜度,并嘗試在輕量級(jí)模型中融合vit與cnn。然而,vit的輕量化通常是以犧牲自注意力中的全局捕獲能力為代價(jià)的。因此,現(xiàn)有的高效vit方法不得不局限于在劃分的窗口內(nèi)進(jìn)行局部自注意力操作,或者僅在分辨率低的更深階段進(jìn)行全局自注意力操作。這種令人尷尬的權(quán)衡和vit向cnn的回退,阻礙了進(jìn)一步提升輕量級(jí)模型性能的可能性。
13、上面引用的一些申請(qǐng)以及參考論文基本都是用傳統(tǒng)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)來進(jìn)行太赫茲物質(zhì)的分類,少部分用到了transformer網(wǎng)絡(luò),這些方法在分類精度和訓(xùn)練速度方面難以同時(shí)兼顧。
14、由上述說明可知,如何有效快速實(shí)現(xiàn)對(duì)物質(zhì)的分類,是目前急需解決的技術(shù)難題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是克服現(xiàn)有技術(shù)中存在的不足,提供一種基于太赫茲光譜的物質(zhì)分類方法及裝置,其基于太赫茲光譜能有效滿足對(duì)物質(zhì)分類的需求,提高分類的精度,降低硬件資源的消耗。
2、按照本發(fā)明提供的技術(shù)方案,一種基于太赫茲光譜的物質(zhì)分類方法,所述物質(zhì)分類方法包括:
3、提供基準(zhǔn)物質(zhì)組,并基于所述基準(zhǔn)物質(zhì)組構(gòu)建用于物質(zhì)分類的太赫茲光譜分類模型,其中,所述基準(zhǔn)物質(zhì)組包括若干的基準(zhǔn)類物質(zhì);
4、提供待分類的目標(biāo)物質(zhì),對(duì)目標(biāo)物質(zhì)進(jìn)行太赫茲光譜處理,以基于對(duì)目標(biāo)物質(zhì)的太赫茲光譜處理生成目標(biāo)物質(zhì)的吸收譜特征圖;
5、將目標(biāo)物質(zhì)的吸收譜特征圖加載到上述構(gòu)建的太赫茲光譜分類模型內(nèi),以利用太赫茲光譜分類模型對(duì)目標(biāo)物質(zhì)的吸收譜特征圖進(jìn)行識(shí)別分類處理,以在識(shí)別分類處理后生成目標(biāo)物質(zhì)的類別,其中,
6、對(duì)識(shí)別分類生成目標(biāo)物質(zhì)的類別,所述類別為基準(zhǔn)物質(zhì)組中對(duì)應(yīng)的一個(gè)基準(zhǔn)類物質(zhì)。
7、基于對(duì)目標(biāo)物質(zhì)的太赫茲光譜處理生成目標(biāo)物質(zhì)的吸收譜特征圖時(shí),包括:
8、對(duì)目標(biāo)物質(zhì)進(jìn)行太赫茲時(shí)域光譜透射處理,以獲取得到太赫茲光譜參考信號(hào)以及與目標(biāo)物質(zhì)對(duì)應(yīng)的目標(biāo)物質(zhì)太赫茲光譜信號(hào);
9、對(duì)太赫茲光譜參考信號(hào)以及目標(biāo)物質(zhì)太赫茲光譜信號(hào)進(jìn)行預(yù)處理,以在預(yù)處理后分別生成太赫茲光譜參考目標(biāo)信號(hào)以及目標(biāo)物質(zhì)太赫茲光譜目標(biāo)信號(hào);
10、基于太赫茲光譜參考目標(biāo)信號(hào)以及目標(biāo)物質(zhì)太赫茲光譜目標(biāo)信號(hào),計(jì)算生成目標(biāo)物質(zhì)的目標(biāo)吸收系數(shù);
11、基于目標(biāo)物質(zhì)的目標(biāo)吸收系數(shù),生成目標(biāo)物質(zhì)的吸收譜特征圖。
12、對(duì)目標(biāo)物質(zhì)太赫茲光譜信號(hào)進(jìn)行預(yù)處理時(shí),包括:
13、搜索確定目標(biāo)物質(zhì)太赫茲光譜信號(hào)的目標(biāo)峰值,并基于所搜索確定目標(biāo)峰值配置與目標(biāo)物質(zhì)太赫茲光譜信號(hào)匹配的目標(biāo)處理窗口;
14、基于目標(biāo)處理窗口與目標(biāo)物質(zhì)太赫茲光譜信號(hào),生成目標(biāo)物質(zhì)映射光譜信號(hào);
15、基于預(yù)設(shè)的目標(biāo)維度對(duì)目標(biāo)物質(zhì)映射光譜信號(hào)進(jìn)行維度匹配處理,以在維度匹配處理后生成目標(biāo)物質(zhì)太赫茲光譜目標(biāo)信號(hào)。
16、生成目標(biāo)物質(zhì)映射光譜信號(hào)時(shí),將目標(biāo)處理窗口與目標(biāo)物質(zhì)太赫茲光譜信號(hào)進(jìn)行點(diǎn)乘,以在點(diǎn)乘后生成目標(biāo)物質(zhì)映射光譜信號(hào);
17、對(duì)目標(biāo)物質(zhì)映射光譜信號(hào)進(jìn)行維度匹配處理時(shí),包括對(duì)目標(biāo)物質(zhì)映射光譜信號(hào)進(jìn)行截?cái)嗵幚砘蛱畛涮幚怼?/p>
18、計(jì)算生成目標(biāo)物質(zhì)的目標(biāo)吸收系數(shù)時(shí),包括:
19、將太赫茲光譜參考目標(biāo)信號(hào)以及目標(biāo)物質(zhì)太赫茲光譜目標(biāo)信號(hào)進(jìn)行頻域轉(zhuǎn)換處理,以在頻域轉(zhuǎn)換處理后分別生成對(duì)應(yīng)的太赫茲光譜參考頻域信號(hào)、目標(biāo)物質(zhì)太赫茲光譜頻域信號(hào);
20、對(duì)太赫茲光譜參考頻域信號(hào)、目標(biāo)物質(zhì)太赫茲光譜頻域信號(hào)進(jìn)行過濾,以分別生成太赫茲光譜參考目標(biāo)頻域信號(hào)、目標(biāo)物質(zhì)太赫茲光譜目標(biāo)頻域信號(hào);
21、基于太赫茲光譜參考目標(biāo)頻域信號(hào)以及目標(biāo)物質(zhì)太赫茲光譜目標(biāo)頻域信號(hào),計(jì)算生成目標(biāo)物質(zhì)的目標(biāo)吸收系數(shù),所述目標(biāo)物質(zhì)的目標(biāo)吸收系數(shù)為:
22、
23、其中,ω為角頻率,s(w)為目標(biāo)物質(zhì)太赫茲光譜目標(biāo)頻域信號(hào);r(w)為太赫茲光譜參考目標(biāo)頻域信號(hào);h(w)是頻率ω下的傳遞函數(shù);d為目標(biāo)物質(zhì)的厚度;c為光在真空中的速度;ρ(ω)為目標(biāo)物質(zhì)太赫茲光譜目標(biāo)頻域信號(hào)和太赫茲光譜參考目標(biāo)頻域信號(hào)的幅值比;arg(s(w))為目標(biāo)物質(zhì)太赫茲光譜目標(biāo)頻域信號(hào)的相位;arg(r(w))為太赫茲光譜參考目標(biāo)頻域信號(hào)的相位;為目標(biāo)物質(zhì)太赫茲光譜目標(biāo)頻域信號(hào)相對(duì)太赫茲光譜參考目標(biāo)頻域信號(hào)的相位差;n(ω)為目標(biāo)物質(zhì)的折射率參數(shù);α(ω)為目標(biāo)物質(zhì)的目標(biāo)吸收系數(shù)。
24、生成目標(biāo)物質(zhì)的吸收譜特征圖時(shí),包括:
25、基于目標(biāo)物質(zhì)的類型,配置吸收系數(shù)頻段;
26、利用所配置的吸收系數(shù)頻段對(duì)計(jì)算生成目標(biāo)物質(zhì)的目標(biāo)吸收系數(shù)進(jìn)行篩選,以提取得到與吸收系數(shù)頻段對(duì)應(yīng)的目標(biāo)物質(zhì)篩選后目標(biāo)吸收系數(shù);
27、基于目標(biāo)物質(zhì)篩選后目標(biāo)吸收系數(shù),生成目標(biāo)物質(zhì)的吸收譜特征圖,其中,目標(biāo)物質(zhì)的吸收譜特征圖包括目標(biāo)物質(zhì)的吸收譜二維灰度圖。
28、所述太赫茲光譜分類模型基于efficientvmamba輕量級(jí)模型構(gòu)建生成,其中,
29、基于efficientvmamba輕量級(jí)模型構(gòu)建生成太赫茲光譜分類模型時(shí),所述太赫茲光譜分類模型包括依次連接的分類起始層、分類識(shí)別第一模塊、分類識(shí)別第二模塊、分類識(shí)別第三模塊、分類識(shí)別第四模塊以及分類器,其中,
30、對(duì)目標(biāo)物質(zhì)的吸收譜特征圖進(jìn)行識(shí)別分類處理時(shí),目標(biāo)物質(zhì)的吸收譜特征圖依次經(jīng)起始層、分類識(shí)別第一模塊、分類識(shí)別第二模塊、分類識(shí)別第三模塊、分類識(shí)別第四模塊以及分類器處理,并經(jīng)分類器輸出目標(biāo)物質(zhì)的類別。
31、基于基準(zhǔn)物質(zhì)組構(gòu)建太赫茲光譜分類模型時(shí),包括:
32、構(gòu)建與太赫茲光譜分類模型對(duì)應(yīng)的太赫茲光譜分類基礎(chǔ)模型,并制作用于對(duì)太赫茲光譜分類基礎(chǔ)模型進(jìn)行訓(xùn)練的分類模型訓(xùn)練數(shù)據(jù)集,其中,
33、所述分類模型訓(xùn)練數(shù)據(jù)集包括若干訓(xùn)練樣本;
34、制作分類模型訓(xùn)練數(shù)據(jù)集時(shí),對(duì)基準(zhǔn)物質(zhì)組內(nèi)的每一基準(zhǔn)類物質(zhì),獲取所述基準(zhǔn)類物質(zhì)的太赫茲光譜信息,并基于每一基準(zhǔn)類物質(zhì)的太赫茲光譜信息,制作所述基準(zhǔn)類物質(zhì)對(duì)應(yīng)的吸收譜特征圖,且基于一個(gè)吸收譜特征圖形成分類模型訓(xùn)練數(shù)據(jù)集內(nèi)的一個(gè)訓(xùn)練樣本;
35、利用分類模型訓(xùn)練數(shù)據(jù)集對(duì)太赫茲光譜分類基礎(chǔ)模型進(jìn)行訓(xùn)練,并在對(duì)太赫茲光譜分類基礎(chǔ)模型訓(xùn)練達(dá)到目標(biāo)狀態(tài)時(shí),則基于太赫茲光譜分類基礎(chǔ)模型形成太赫茲光譜分類模型。
36、所述分類識(shí)別第一模塊包括至少一個(gè)高效視覺狀態(tài)空間單元,其中,
37、每個(gè)高效視覺狀態(tài)空間單元包括兩個(gè)依次串接的視覺狀態(tài)空間塊;
38、對(duì)任一視覺狀態(tài)空間塊,包括視覺狀態(tài)第一分支以及視覺狀態(tài)第二分支,
39、利用視覺狀態(tài)第一分支進(jìn)行局部特征提取,以在局部特征提取后生成局部特征提取特征圖;
40、視覺狀態(tài)第二分支基于高效二維選擇性掃描進(jìn)行全局特征提取,以在全局特征提取后生成全局特征提取特征圖;
41、利用壓縮-激勵(lì)網(wǎng)絡(luò)對(duì)局部特征提取特征圖、全局特征提取特征圖進(jìn)行特征平衡,并在特征平衡后進(jìn)行補(bǔ)丁合并操作,且在補(bǔ)丁合并操作后生成視覺狀態(tài)空間塊處理后特征圖。
42、一種基于太赫茲光譜的物質(zhì)分類裝置,包括物質(zhì)分類終端,其中,對(duì)目標(biāo)物質(zhì),物質(zhì)分類終端采用上述所述的物質(zhì)分類方法進(jìn)行識(shí)別分類處理,以在識(shí)別分類處理后生成目標(biāo)物質(zhì)的類別。
43、本發(fā)明的優(yōu)點(diǎn):基于基準(zhǔn)物質(zhì)類構(gòu)建太赫茲光譜分類模型,當(dāng)太赫茲光譜分類模型基于efficientvmamba-t模型構(gòu)建生成時(shí),則使得太赫茲光譜分類模型既有trasnfomer全局特征提取的優(yōu)勢,又具有輕量化的特性,降低對(duì)硬件資源的消耗;
44、對(duì)目標(biāo)物質(zhì)的目標(biāo)物質(zhì)太赫茲光譜信號(hào),通過預(yù)處理方式得到對(duì)應(yīng)的吸收譜特征圖,利用太赫茲光譜分類模型對(duì)吸收譜特征圖進(jìn)行識(shí)別分類處理,可得到目標(biāo)物質(zhì)的類別,也即基于太赫茲光譜能有效滿足對(duì)物質(zhì)分類的需求,太赫茲檢測具有速度快、無損檢測、對(duì)人體無害等優(yōu)點(diǎn),通過獲取目標(biāo)物質(zhì)的吸收光譜數(shù)據(jù),能夠充分挖掘目標(biāo)物質(zhì)的固有特性,從而顯著提高分類的準(zhǔn)確性。