本發(fā)明涉及一種基于改進msrcr與隨機森林的試紙變色定量識別方法,屬于線纜熱穩(wěn)定性能檢測。
背景技術(shù):
1、線纜原材料的化學穩(wěn)定性對于線纜的性能、可靠性和安全性具有至關(guān)重要的意義。高化學穩(wěn)定性意味著線纜原材料能夠抵抗環(huán)境中的化學物質(zhì)侵蝕,如酸、堿、鹽等,從而確保線纜在長期使用過程中性能穩(wěn)定,不易老化或損壞。穩(wěn)定的化學性能有助于維持線纜的電氣性能,如電阻率、絕緣強度等,確保信號傳輸?shù)目煽啃院托?;化學不穩(wěn)定的原材料在特定條件下可能釋放有害物質(zhì),對環(huán)境和人體健康構(gòu)成威脅,高化學穩(wěn)定性的原材料能夠減少這種風險,確保線纜在使用過程中的安全性;在火災等緊急情況下,化學穩(wěn)定的線纜材料能夠減少有毒煙霧的釋放。
2、現(xiàn)有技術(shù)通常采用熱穩(wěn)定試驗評估線纜原材料的化學穩(wěn)定性,這一試驗側(cè)重于監(jiān)測線纜材料在油浴環(huán)境中的化學變化,特別關(guān)注酸性物質(zhì)的釋放速率。目前線纜熱穩(wěn)定試驗主要存在如下缺點:
3、1、檢驗員頻繁的觀察過程限制了他們同時進行其他試驗的能力,顯著降低了整體的檢驗效率。
4、2、在判斷試紙是否變色時,檢驗員主要依賴肉眼觀察,這種方法存在明顯的主觀性,難以確保不同檢驗員之間判斷標準的一致性,從而可能影響試驗結(jié)果的可靠性。
5、3、試驗數(shù)據(jù)僅有變色與否、變色時間,雖能按照標準完成試驗,但是沒有充分利用數(shù)據(jù),沒有對試驗本身與試驗材料進行進一步的分析與評估。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于改進msrcr與隨機森林的試紙變色定量識別方法,用以解決現(xiàn)有技術(shù)的線纜熱穩(wěn)定試驗中肉眼識別試紙變色檢測結(jié)果不準確、檢測效率低的技術(shù)問題。
2、本發(fā)明采用如下技術(shù)方案:基于改進msrcr與隨機森林的試紙變色定量識別方法,其包括以下步驟:
3、s1、由相機采集不同狀態(tài)的試紙照片作為目標圖像,不同狀態(tài)的試紙照片包括不同光照強度、不同變色狀態(tài)、不同變色面積的試紙照片以及同一試紙在不同位置不同角度拍攝的照片;
4、s2、通過改進的多尺度自適應增益msrcr對每張目標圖像均進行增強與歸一化處理,具體步驟為:
5、s2.1、通過ssr算法增強圖像中的邊緣信息,除去原始圖像中的低頻照射部分,留下原始圖像所對應的高頻分量:
6、由于入射光照射在反射物體上,通過反射物體的反射,形成反射光進入人眼,最后形成的圖像表示為如下公式:
7、?(1)
8、公式(1)中,r(x,?y)表示物體的反射性質(zhì),即圖像內(nèi)在屬性;l(x,?y)表示入射光圖像,原始圖像為s(x,?y),反射圖像為r(x,?y),亮度圖像為l(x,?y),可以得到公式(2):
9、?(2)
10、公式(2)中,f(x,?y)是中心環(huán)繞函數(shù),與s(x,?y)進行卷積運算,可以表示為:
11、?(3)
12、公式(3)中,e為高斯環(huán)繞尺度,為尺度,其取值需滿足:
13、?(4)
14、s2.2、在ssr算法的基礎(chǔ)上,增加高斯中心環(huán)繞函數(shù),發(fā)展為多尺度msr算法,其公式為:
15、?(5)
16、公式(5)中,?k是高斯中心環(huán)繞函數(shù)的個數(shù),表示高斯中心環(huán)繞函數(shù)對應的尺度參數(shù),0<<1,且++……+=1;
17、s2.3、在msr的基礎(chǔ)上,加入了色彩恢復因子c來調(diào)節(jié)由于圖像局部區(qū)域?qū)Ρ榷仍鰪姸鴮е骂伾д娴娜毕?,其公式為?/p>
18、(6)
19、(7)
20、(8)
21、其中,表示第個通道的色彩恢復因子,用來調(diào)節(jié)rgb彩色通道中3個通道的顏色比例;表示第個通道的圖像;f表示顏色空間的映射函數(shù);β是增益常數(shù);α是受控制的非線性強度;
22、s2.4、自適應色彩恢復因子改進msrcr的算法,假設(shè)表示第個通道的圖像,=r,?g,?b,設(shè)計如下自適應色彩恢復因子c,其步驟為:
23、步驟s2.4.1、使用sobel算子計算圖像在x和y方向上的梯度和,計算梯度幅值:
24、(9)
25、步驟s2.4.2、定義一個與梯度幅值g(x,?y)相關(guān)的函數(shù)f(g(x,?y)),并用該函數(shù)重新定義自適應色彩恢復因子c,c可以表示為:
26、(10)
27、其中,公式(10)的exp部分是一個高斯函數(shù),用于根據(jù)梯度幅值?g(x,y)?調(diào)整色彩恢復因子;和分別是梯度幅值?g(x,y)?的均值和標準差;公式(10)的后半部分為對比度增強部分,用于根據(jù)局部對比度增強色彩恢復因子,l(x,y)?是圖像的局部亮度分量;和分別是局部亮度?l(x,y)?的均值和標準差;
28、步驟s2.4.3、用公式(10)新的自適應色彩恢復因子c代替公式(7)作為msrcr的新色彩因子,計算圖像的拉普拉斯算子laplacian,得到高頻成分,對高頻成分進行增強,再將增強后的高頻成分加回原圖像中,進行銳化強度調(diào)整,以增加圖像的清晰度;
29、s3、對增強后的圖像基于歐幾里得距離與大津二分法完成試紙定位與目標區(qū)域分割,具體步驟為:
30、在大場景圖像中自動定位目標試紙區(qū)域:在圖像中遍歷各點像素(r,g,b)分別與純紅色點(255,0,0)與純黃色點(255,255,0)的歐幾里得距離,試紙像素顏色的歐幾里得距離與周圍環(huán)境像素的歐幾里得距離都有顯著不同,因此對這些像素點對應的歐幾里得距離運用大津最大類間方差法進行二分類,取其小者為目標像素點;并在目標像素點中繼續(xù)運用大津法進行二分類,可以細致分出變色紅色區(qū)域與黃色區(qū)域;然后,繼續(xù)遍歷這些像素點的互相之間的歐幾里得坐標距離,將同一張試紙上相互距離最近的聚類為一群;最后用一個最小內(nèi)包正交矩形實現(xiàn)對目標區(qū)域的框選,框選區(qū)域即為試紙定位區(qū)域;
31、s4、使用rgb顏色空間的歐幾里得距離分析試紙定位區(qū)域中像素點顏色從黃色漸變到紅色的程度,定義rgb顏色空間歐幾里得距離為:
32、?(15)
33、,分別為顏色a的rgb值;,分別為顏色b的rgb值;
34、根據(jù)公式(15)分別對每張目標圖像提取以下五個特征:
35、特征一、目標圖像距離純黃色(255,255,0)的平均歐幾里得距離ly;
36、特征二、目標圖像距離純紅色(255,0,0)的平均歐幾里得距離lr?;
37、特征三、參數(shù)p=ly/lr?;
38、特征四、目標圖像距離純黃色(255,255,0)的最近的歐幾里得距離lymin;
39、特征五、目標圖像距離純紅色(255,0,0)的最近的歐幾里得距離lrmin?;
40、特征五、目標圖像距離純紅色(255,0,0)的最近的歐幾里得距離lrmin?;
41、s5、通過有經(jīng)驗的實驗員對步驟(1)采集的試紙照片進行變色程度評分,如果試驗員認為沒有變色,則為0分,如果試紙變色,則按照1~10的程度評分,評分的依據(jù)為:實驗員目視的顏色變化程度以及目視的變色區(qū)域與試紙整體的面積比,顏色變化程度越高、變色區(qū)域與試紙整體的面積比越大,則評分值越高;
42、將評分結(jié)果target和步驟(4)提取的所有特征制作成數(shù)據(jù)集;
43、s6、隨機森林訓練和測試:將數(shù)據(jù)集導入隨機森林算法進行訓練,利用訓練后的隨機森林算法對待識別的試紙照片進行變色程度測試識別。
44、步驟s2.2中,高斯中心環(huán)繞函數(shù)的個數(shù)為三個,分別為高、中、低三個尺度不同的高斯中心環(huán)繞函數(shù),k=3,且=1/3;=15;=80;=200。
45、步驟s5中,通過經(jīng)驗的實驗員對試紙照片進行變色程度評分,最終取三名實驗員評分的均值作為該試紙照片的最終評分。
46、所述數(shù)據(jù)集為csv格式。
47、步驟s1中,采集不同狀態(tài)的試紙照片數(shù)量為1000張,步驟s5得到的數(shù)據(jù)集包含1000張試紙照片數(shù)據(jù),其中700張試紙照片數(shù)據(jù)用于隨機森林訓練,300張試紙照片數(shù)據(jù)用于隨機森林測試。
48、步驟s6中,隨機森林訓練時,優(yōu)化隨機森林參數(shù),具體如下:
49、s6.1、加權(quán)隨機森林:對重要特征賦予更高的權(quán)重,使其在樹的構(gòu)建過程中更有可能被選擇,在計算子節(jié)點均方誤差mse時,對每個特征的貢獻進行加權(quán),其公式為:
50、?(16)
51、其中,是特征的權(quán)重,是實際值,是測試值;
52、s6.2、加權(quán)信息分裂準則:在回歸任務中使用隨機森林算法時,如果已知某些特征與目標參數(shù)關(guān)系很大,而其他特征關(guān)系不是很大,通過以下步驟進行優(yōu)化:
53、在加權(quán)信息增益中,將每個特征的貢獻與其權(quán)重相乘;對于每個候選分裂,計算分裂前后不純度的減少量,并將其與特征的權(quán)重相乘,表示為:
54、(17)
55、其中,是特征a的權(quán)重,impurity(d)?是數(shù)據(jù)集的不純度,是分裂后子節(jié)點v的數(shù)據(jù)集;
56、按以上步驟優(yōu)化回歸森林參數(shù),將數(shù)據(jù)集導入進行訓練。
57、數(shù)據(jù)集中,五個特征的重要性排序為:p≥lrmin≥ly≥lymin≥lr。
58、數(shù)據(jù)集中,五個特征的重要性占比為:p為0.35,lrmin為0.25,ly為0.2,lymin為0.1,lr為0.1。
59、本發(fā)明的有益效果:本發(fā)明是將改進msrcr算法與隨機森林結(jié)合,改進的msrcr算法能夠自適應增強圖像,提高識別穩(wěn)定性,而隨機森林算法則通過集成多棵決策樹,對試紙變色程度進行了準確測試,表現(xiàn)出了良好的性能。本發(fā)明通過引入機器視覺技術(shù),實現(xiàn)了試紙變色識別的自動化,顯著提高了檢驗工作的效率,有效解決了傳統(tǒng)方法中檢驗效率低、主觀性強以及數(shù)據(jù)利用不充分的問題。本發(fā)明為線纜熱穩(wěn)定試驗提供了一種新的、高效的試紙變色定量分析方法,不僅適用于線纜熱穩(wěn)定試驗試紙變色的識別,也可應用于其它領(lǐng)域的試紙變色識別,為其他領(lǐng)域的類似的問題提供了有益的參考和借鑒。
60、本發(fā)明的優(yōu)勢在于:
61、1、通過引入機器視覺技術(shù),試驗識別過程實現(xiàn)自動化,擺脫了人工肉眼判斷的束縛,從而顯著提高了檢驗工作的效率;
62、2、改進的msrcr算法能夠在不同光照條件下對圖像進行自適應的增強,設(shè)備對環(huán)境光的魯棒性較強,因此識別穩(wěn)定性較強;
63、3、隨機森林算法是決策樹的集成方法,它通常比單個決策樹具有更好的泛化能力和測試準確性。將試紙變色問題轉(zhuǎn)化為回歸問題,視其變色程度為0~10范圍內(nèi)的連續(xù)值,可以直接輸出該值作為變色程度的定量表示;
64、4、定量的試紙變色程度參數(shù)有利于進一步表征試紙變色的快慢趨勢,提煉出熱穩(wěn)定試驗更多的數(shù)據(jù)信息,如基于假設(shè)檢驗的同批次相同樣品變色時間預測與不同樣品的熱穩(wěn)定性優(yōu)劣定量評價等。