本發(fā)明屬于水環(huán)境工業(yè)點源污染源解析,特別涉及用于識別污水處理廠和紡織印染廠出水污染的化學指示物指紋譜及其應用。
背景技術:
1、隨著工業(yè)化進程的不斷加速,工業(yè)廢水排放量日益增加,其中所含的復雜污染物對水環(huán)境生態(tài)系統(tǒng)構成了嚴重威脅。傳統(tǒng)的環(huán)境監(jiān)測方法通常依賴于目標污染物的預先識別,難以全面反映工業(yè)廢水中污染物的真實情況,限制了對新型污染物和未知風險的識別能力。
2、近年來,非靶向篩選技術憑借其高通量、高靈敏度、無需預先確定目標污染物等優(yōu)勢,在環(huán)境分析領域得到越來越廣泛的應用。該技術結合高分辨率質(zhì)譜、液相色譜等分析手段,能夠?qū)Νh(huán)境樣品中的大量化合物進行同時檢測和鑒定,進而識別出潛在的特征污染物。與傳統(tǒng)的目標分析方法相比,非靶向篩選技術能夠全面地了解工業(yè)廢水中污染物的組成,有助于發(fā)現(xiàn)新的環(huán)境風險物質(zhì),為水環(huán)境污染防治提供更為科學的依據(jù)。目前,非靶向篩選技術已應用于識別制藥、印染、化工等行業(yè)工業(yè)廢水中的特征污染物,并結合化學計量學方法,例如主成分分析、聚類分析等,對水環(huán)境污染來源進行初步解析,初步實現(xiàn)了對工業(yè)點源污染的溯源和識別。然而,面對海量數(shù)據(jù)處理和分析的復雜性等挑戰(zhàn),機器學習的介入能夠幫助解決這一問題?;诖罅康哪承袠I(yè)樣品構建單類行業(yè)的污染物指紋譜,以幫助溯源。
技術實現(xiàn)思路
1、為此,本發(fā)明所解決的技術問題為:提供了用于識別污水處理廠和紡織印染廠出水污染的化學指示物指紋譜及其應用;通過檢測水體中化合物的物種組成,結合二次判別分析模型,可快速準確地區(qū)別污染來自于污水處理廠或紡織印染廠排出水。
2、為此,本申請的第一技術方案公開了用于識別污水處理廠和紡織印染廠出水污染的化學指示物指紋譜,該指紋譜通過對目標水體特征成分篩選得到;所述篩選包括特征成分提取和特征成分選擇;其中,特征成分提取包括:
3、對目標水樣進行預處理;
4、通過串聯(lián)oasis?hlb,?isolute?env+,?strata?xcw,?strata?xaw固相萃取小柱對預處理后的目標水樣進行化合物提?。?/p>
5、將提取得到的特征成分經(jīng)質(zhì)譜分析并于數(shù)據(jù)庫匹配得到特征成分數(shù)據(jù)集。
6、進一步的,所述質(zhì)譜分析所使用的色譜柱為acquity?uplc?beh?c18,前置保護柱為:acquity?uplc?beh?c18。
7、進一步的,所述特征成分選擇為通過機器學習進行選擇,具體為:
8、將所述特征成分數(shù)據(jù)集經(jīng)分類后采用boruta-shap算法與shap值相結合確定每個特征的重要性,得到特征污染物;
9、對特征污染物進行分類預測模型構建及模型評估。
10、進一步的,基于二次判別分析算法進行分類預測模型構建。
11、進一步的,所述模型評估指標包括分類準確率、曲線下方面積、召回率、準確度。
12、進一步的,所述化學指示物指紋譜包括28個特征成分,其中,用于識別污水處理廠的成分包括甲磺酸帕珠沙星,甲氧基肉桂酸辛酯,油酸酰胺,脫甲基-甲酰氨基-抗蚜威,奧克立林,(4-壬基苯氧基)-乙酸,殘殺威,芐嘧磺隆;用于識別紡織印染廠的成分包括苯霜靈,抗蚜威,丙環(huán)唑,利他林,奧美沙坦,布他酮,除線磷,乙氧基喹啉,tcpp,三唑醇,4-甲酰氨基安替比林,三氯蔗糖,雌三醇,新斯的明,甘寶素,異丙甲草胺,n-丁基苯磺酰胺,磺胺二甲嘧啶,他噴他多。
13、本申請的第二技術方案公開了上述化學指示物指紋譜在識別水體污染源屬于污水處理廠和/或紡織印染廠污染上的應用。
14、進一步的,所述應用包括以下步驟:
15、(1)提取目標水樣所含化合物信息;
16、(2)基于二次判別分析模型對所述化合物信息進行識別,判定目標水樣來源。
17、優(yōu)選的,所述步驟(1)為固相萃取提取,具體為通過串聯(lián)oasis?hlb、isolute?env+、strata?xcw、strata?xaw固相萃取小柱提取。
18、與現(xiàn)有溯源技術相比,本發(fā)明具有以下有益效果:
19、1.高通量非靶向篩選技術:使用串聯(lián)四類互補spe小柱及l(fā)c/q-tof進行非靶向篩選,盡可能保留更多的分子獲取更豐富的所含分子信息。
20、2.boruta-shap特征選擇方法結合了基于樹的特征重要性與shap將所有特征進行排序并采用統(tǒng)計測試決定每個特征重要性,從而篩選出最能影響分類結果的化合物。
21、3.特征選擇物的選擇基于大量樣本的機器學習,兼顧化合物在同類樣本的不同表達與不同類別樣本的高低表達,此方法建立的機器學習模型具有較高的泛化能力和穩(wěn)定性。
1.用于識別污水處理廠和紡織印染廠出水污染的化學指示物指紋譜,其特征在于,該指紋譜通過對目標水體特征成分篩選得到;所述篩選包括特征成分提取和特征成分選擇;其中,特征成分提取包括:
2.根據(jù)權利要求1所述化學指示物指紋譜,其特征在于,所述質(zhì)譜分析所使用的色譜柱為acquity?uplc?beh?c18,前置保護柱為:acquity?uplc?beh?c18。
3.根據(jù)權利要求1所述化學指示物指紋譜,其特征在于,所述特征成分選擇為通過機器學習進行選擇,具體為:
4.根據(jù)權利要求3所述化學指示物指紋譜,其特征在于,基于二次判別分析算法進行分類預測模型構建。
5.根據(jù)權利要求3所述化學指示物指紋譜,其特征在于,所述模型評估指標包括分類準確率、曲線下方面積、召回率、準確度。
6.根據(jù)權利要求1所述化學指示物指紋譜,其特征在于,包括28個特征成分,其中,用于識別污水處理廠的成分包括甲磺酸帕珠沙星,甲氧基肉桂酸辛酯,油酸酰胺,脫甲基-甲酰氨基-抗蚜威,奧克立林,(4-壬基苯氧基)-乙酸,殘殺威,芐嘧磺??;用于識別紡織印染廠的成分包括苯霜靈,抗蚜威,丙環(huán)唑,利他林,奧美沙坦,布他酮,除線磷,乙氧基喹啉,tcpp,三唑醇,4-甲酰氨基安替比林,三氯蔗糖,雌三醇,新斯的明,甘寶素,異丙甲草胺,n-丁基苯磺酰胺,磺胺二甲嘧啶,他噴他多。
7.如權利要求1-6任一所述化學指示物指紋譜在識別水體污染源屬于污水處理廠和/或紡織印染廠污染上的應用。
8.根據(jù)權利要求7所述應用,其特征在于,包括以下步驟:
9.根據(jù)權利要求8所述應用,其特征在于,所述步驟(1)為固相萃取提取,具體為通過串聯(lián)oasis?hlb、isolute?env+、strata?xcw、strata?xaw固相萃取小柱提取。