專利名稱::一種基于拉曼光譜的測(cè)量汽油烯烴含量的方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及測(cè)量汽油烯烴含量的方法,尤其是結(jié)合拉曼光譜和最小二乘支持向量機(jī)測(cè)量汽油烯烴含量的方法。技術(shù)背景汽油的烴類物質(zhì)組成數(shù)據(jù)是汽油產(chǎn)品的重要指標(biāo),也是石油煉制過(guò)程不可缺少的基礎(chǔ)數(shù)據(jù)。烴類物質(zhì)中的烯烴作為不飽和烴類物質(zhì),具有較好的抗爆性,但熱穩(wěn)定性差,易堵塞發(fā)動(dòng)機(jī)噴嘴,影響發(fā)動(dòng)機(jī)燃燒效率、增加污染物排放。同時(shí),由于烯烴化學(xué)性質(zhì)活潑,揮發(fā)后和大氣中的NOx混合,經(jīng)太陽(yáng)紫外線照射形成有毒光化學(xué)煙霧,對(duì)大氣造成嚴(yán)重污染。國(guó)家標(biāo)準(zhǔn)《車用無(wú)鉛汽油》(GB17930-2006)中規(guī)定汽油中芳烴含量不大于40%,烯烴含量不大于35%。根據(jù)我國(guó)煉油工藝,大部分煉油企業(yè)在汽油生產(chǎn)時(shí)芳烴能達(dá)到控制指標(biāo),但烯烴含量卻較難控制。在汽油生產(chǎn)過(guò)程屮快速、準(zhǔn)確測(cè)定烯烴含量以控制汽油品質(zhì)是非常必要的。目前烯烴測(cè)定的仲裁方法采用GB/T11132—2002《液體石油產(chǎn)品烴類測(cè)定法熒光指示劑吸附法》,該測(cè)定方法是參考ASTMD1319建立的一種經(jīng)典的油品族組成的分析方法,操作繁瑣、測(cè)試費(fèi)用高、分析時(shí)間長(zhǎng)(約2h)。該國(guó)標(biāo)中規(guī)定,對(duì)烯烴含量為35%的汽油,允許測(cè)試方法的重復(fù)性為2.0%,再現(xiàn)性達(dá)8.2%。目前行業(yè)中普遍采用的SH/T0741-2004《汽油中烴族組成測(cè)定法多維氣相色譜法》,對(duì)于烯烴含量35%樣本,其重復(fù)性要求為1.6%,該方法影響分析結(jié)果的因素較少,結(jié)果精度較高,但是由于烯烴的典型保留時(shí)間在910.5min,測(cè)定一個(gè)汽油樣本的時(shí)間仍然需要大約12min,且對(duì)于烯烴捕集阱的要求較高。近紅外光譜(NIR)分析技術(shù)為解決這一問(wèn)題提供了新的方法。該方法首先通過(guò)光譜儀獲得未知樣品光譜,然后通過(guò)校正模型預(yù)測(cè)該樣本的性質(zhì)和組成。校正模型在測(cè)量前由已知樣品的近紅外光譜與被測(cè)組分進(jìn)行關(guān)聯(lián)得到。通常,使用MR技術(shù)完成一次烯烴測(cè)量只需大約2分鐘,相比多維氣相色譜法,縮短了分析時(shí)時(shí)間。但是,由于烯烴在近紅外譜區(qū)吸收較弱,該方法在實(shí)際應(yīng)用中測(cè)量精度受到一定限制。
發(fā)明內(nèi)容本發(fā)明的目的是提供一種基于拉曼光譜的測(cè)量汽油烯烴含量的方法,以實(shí)現(xiàn)在汽油生產(chǎn)過(guò)程中快速、準(zhǔn)確的測(cè)定烯烴含量,控制汽油品質(zhì)。本發(fā)明的基于拉曼光譜的測(cè)量汽油烯烴含量的方法,包括如下步驟(1)用熒光指示劑吸附法或多維氣相色譜法測(cè)定訓(xùn)練樣本的烯烴含量;(2)測(cè)取訓(xùn)練樣本的拉曼光譜;(3)對(duì)測(cè)取的拉曼光譜進(jìn)行平滑濾波、基線校正和標(biāo)準(zhǔn)歸一化預(yù)處理;(4)將經(jīng)步驟(3)預(yù)處理的訓(xùn)練樣本拉曼光譜與步驟(1)測(cè)得的烯烴含量值,采用最小二乘支持向量機(jī)建立汽油烯烴含量校正模型;(5)測(cè)取待測(cè)油樣的拉曼光譜,對(duì)拉曼光譜進(jìn)行平滑濾波、基線校正和標(biāo)準(zhǔn)歸一化預(yù)處理,根據(jù)步驟(4)的校正模型計(jì)算待測(cè)油樣的烯烴含量。本發(fā)明中,所說(shuō)的平滑濾波是采用Savitzky-Golay巻積平滑濾波。本發(fā)明中,所說(shuō)的基線校正步驟是選擇拉曼光譜的無(wú)信號(hào)區(qū)作為參考區(qū),對(duì)參考區(qū)內(nèi)的拉曼光譜數(shù)據(jù)進(jìn)行線性回歸,求得斜率,選擇拉曼光譜有效信號(hào)區(qū)中的某一公共的起點(diǎn)作為基線的起始點(diǎn),得到基線方程,然后,在相應(yīng)波數(shù)段從拉曼光譜中將基線去除,保留有效信號(hào)區(qū)內(nèi)的拉曼光譜數(shù)據(jù)用于步驟(4)建模和步驟(5)測(cè)量。本發(fā)明中,所說(shuō)的標(biāo)準(zhǔn)歸一化的參考點(diǎn)為拉曼光譜中飽和烴的最大拉曼峰。本發(fā)明中,所說(shuō)的測(cè)取訓(xùn)練樣本和待測(cè)油樣的拉曼光譜,可采用傳統(tǒng)的拉曼光譜測(cè)取法,也可以采用包括激光器、激發(fā)光纖、光纖探頭、樣品分析池、收集光纖、光譜儀和計(jì)算機(jī)的裝置,激光器發(fā)出的激光經(jīng)激發(fā)光纖和光纖探頭照射到樣品分析池中的汽油樣品,樣品在強(qiáng)激光照射下發(fā)出拉曼散射光,經(jīng)光纖探頭長(zhǎng)通濾光后通過(guò)收集光纖傳送到光譜儀進(jìn)行分光和數(shù)字采集,再由計(jì)算機(jī)對(duì)拉曼散射光進(jìn)行處理得到以波數(shù)為單位的拉曼光譜。本發(fā)明的有益效果在于由于拉曼光譜中譜峰對(duì)應(yīng)于特定的分子結(jié)構(gòu),對(duì)于非極性基團(tuán)如C=C等紅外吸收較弱的官能團(tuán),拉曼光譜中可呈現(xiàn)強(qiáng)烈的特征譜圖。各種物質(zhì)的化學(xué)官能團(tuán)具有很強(qiáng)的特征拉曼振動(dòng)譜帶。所以,拉曼光譜可以充分反映物質(zhì)的組成結(jié)構(gòu)。同時(shí),支持向量機(jī)作為一種新型的非線性建模方法,在解決小樣本、非線性問(wèn)題中表現(xiàn)出了許多優(yōu)勢(shì)。本發(fā)明將拉曼光譜和最小二乘支持向量機(jī)相結(jié)合分析汽油烯烴含量的方法,與傳統(tǒng)測(cè)量方法相比顯著提高了檢測(cè)精度,同時(shí)可大大縮短測(cè)量時(shí)間,且測(cè)量過(guò)程對(duì)樣品無(wú)損耗,這對(duì)石油加工過(guò)程的質(zhì)量控制有著重要意義。圖l為本發(fā)明中測(cè)取訓(xùn)練樣本和待測(cè)油樣拉曼光譜用的裝置,圖中,1-激光器,2-激發(fā)光纖,3-光纖探頭,4-樣品分析池,5-收集光纖,6-光譜儀,7-計(jì)算機(jī)。圖2為基線校正示意圖,其中a)為基線校正前的光譜,b)為基線校正后的光譜。圖3為預(yù)處理后的訓(xùn)練樣品拉曼光譜。圖4為最小二乘支持向量機(jī)模型參數(shù)對(duì)校正模型精度的影響曲線,圖中,曲線a、b、c、d分別為參數(shù)一取l、20、50和100時(shí)對(duì)校正模型精度的影響曲線。具體實(shí)施方式以下結(jié)合實(shí)施例進(jìn)一步說(shuō)明本發(fā)明方法。基于拉曼光譜的測(cè)量汽油烯烴含量的方法,包括如下步驟(1)使用《液體石油產(chǎn)品烴類測(cè)定法熒光指示劑吸附法》(GB/T11132—2002)測(cè)定20個(gè)不同汽油訓(xùn)練樣本的烯烴含量,每個(gè)樣本大約耗時(shí)2小時(shí),測(cè)量結(jié)果烯烴含量范圍從0.23%至34.3%。(2)本例中,采用如圖l所示的拉曼光譜裝置測(cè)取訓(xùn)練樣本的拉曼光譜;該裝置包括激光器1、激發(fā)光纖2、光纖探頭3、樣品分析池4、收集光纖5、光譜儀6和計(jì)算機(jī)7,激光器1通過(guò)激發(fā)光纖2與光纖探頭3的入射口相連,光纖探頭3的出射口通過(guò)收集光纖5與光譜儀6相連,光譜儀與計(jì)算機(jī)USB接口連接。這里,激光器1是中心波長(zhǎng)為6501064nm,激光線寬^0.2nm,功率dOOmW的近紅外激光器,樣品分析池4為lcm光程石英比色皿,光譜儀6為OceanOpticsQE65000光柵光譜儀,光學(xué)分辨率為6cm",在0至2100cm"區(qū)域內(nèi)收集拉曼光譜。測(cè)量訓(xùn)練樣本拉曼光譜時(shí),激光器1發(fā)出的激光經(jīng)激發(fā)光纖2和光纖探頭3照射到樣品分析池4中的汽油樣品,樣品在強(qiáng)激光照射下發(fā)出拉曼散射光,經(jīng)光纖探頭3長(zhǎng)通濾光后通過(guò)收集光纖5傳送到光譜儀6進(jìn)行分光和數(shù)字采集,再由計(jì)算機(jī)7對(duì)拉曼散射光進(jìn)行處理得到以波數(shù)為單位的拉曼光譜。對(duì)于所有樣品,連續(xù)測(cè)量三次,取三次獲得光譜數(shù)據(jù)均值作為該樣品拉曼光譜,每次積分時(shí)間為30秒。(3)對(duì)測(cè)取的拉曼光譜進(jìn)行平滑濾波、基線校正和標(biāo)準(zhǔn)歸一化預(yù)處理;首先,對(duì)拉曼光譜進(jìn)行Savitzky-Golay巻積平滑濾波,濾波窗口寬度為20cm—1。由于汽油樣品的拉曼光譜中包含了拉曼峰,同時(shí)也包含較大的熒光背景。為了去除熒光影響以獲得更精確的模型和預(yù)測(cè)結(jié)果,需要在預(yù)處理中進(jìn)行基線校正。任選一個(gè)樣本為例說(shuō)明本發(fā)明中的基線校正方法。指定1775cm"2100cnT1波數(shù)段作為參考區(qū),對(duì)參考區(qū)內(nèi)的光譜數(shù)據(jù)進(jìn)行線性回歸,得到斜率=-4.067作為基線斜率。將930cm"處數(shù)據(jù)點(diǎn)(930,3381)設(shè)為基線的起始點(diǎn)。則基線的方程為"3381=-4.067*(jc-930)在930cm"2100cm"波數(shù)段內(nèi)將基線從光譜減去(圖2a中虛直線為上式所描述的基線,實(shí)線為原光譜),得到基線校正后的光譜如圖2b。為了消除光譜中激勵(lì)源功率變化和光強(qiáng)波動(dòng)的影響,本發(fā)明以飽和烴拉曼光譜中的最大拉曼峰(1448cm"處)作為參考點(diǎn)對(duì)光譜進(jìn)行標(biāo)準(zhǔn)歸一化。圖3為20個(gè)訓(xùn)練樣本經(jīng)過(guò)預(yù)處理后的拉曼光譜。(4)將經(jīng)步驟(3)預(yù)處理的訓(xùn)練樣本拉曼譜圖與步驟(1)測(cè)得的烯烴含量值,采用最小二乘支持向量機(jī)建立校正模型;最小二乘支持向量機(jī)(ls-svm)用于函數(shù)擬合的原理簡(jiǎn)單描述如下。給定一個(gè)有A^個(gè)數(shù)據(jù)的訓(xùn)練集合W,^t,其中輸入數(shù)據(jù)^e/r,輸出數(shù)據(jù)^ei。函數(shù)擬合問(wèn)題可以描述為以下最優(yōu)化問(wèn)題,<formula>formulaseeoriginaldocumentpage6</formula>上述優(yōu)化問(wèn)題可歸結(jié)為求解以下線性方程組<formula>formulaseeoriginaldocumentpage6</formula>其中3^bp…,h:r;J-[1,…,/=^^[1,...,1],/e/"","/"g表示對(duì)角矩陣;y>0為懲罰系數(shù);…,,6ei為偏置值;i2={/^|A:,/=1,…,,i^-p(^)V(;c,)=《(;^,;0,*,/=1,…,iV。K(^,:c,)稱為核函數(shù)。本文采用RBF核函數(shù)<formula>formulaseeoriginaldocumentpage6</formula>(3)從而可得ls-svm擬合模型為<formula>formulaseeoriginaldocumentpage6</formula>ls-svm模型中包含參數(shù)02和y,其中cj2為RBF核函數(shù)參數(shù),y為懲罰系數(shù)。這兩個(gè)參數(shù)需要在建模前選定。本發(fā)明采用交叉檢驗(yàn)法確定參數(shù),即在選定一組參數(shù)(C^和Y)的情況下,每次留取一個(gè)樣本作為預(yù)測(cè),用剩余的樣本建立校正模型來(lái)預(yù)測(cè)留取的樣本。經(jīng)過(guò)反復(fù)建模及預(yù)測(cè),直到每個(gè)樣品都被預(yù)測(cè)一次且只被預(yù)測(cè)一次,計(jì)算與該組參數(shù)對(duì)應(yīng)的交叉驗(yàn)證均方差(SECV,SquareErrorsofCross-Validation)作為參數(shù)評(píng)價(jià)的指標(biāo)。選擇交叉驗(yàn)證均方差最小的那組參數(shù)作為最終建模參數(shù)。交叉驗(yàn)證均方差定義為,SECV=H>'-少')2(5)Vai其中,x,j),分別是第y個(gè)訓(xùn)練樣本的標(biāo)準(zhǔn)分析值和預(yù)測(cè)值,w為訓(xùn)練樣本數(shù)。圖4為最小二乘支持向量機(jī)模型參數(shù)對(duì)校正模型精度的影響曲線,也即參數(shù)c^和Y的取值及其所對(duì)應(yīng)的交叉驗(yàn)證均方差,其中曲線a、b、c、d分別為參數(shù)—取l、20、50和100時(shí)對(duì)校正模型精度的影響曲線。從圖中可知,(72的取值在20左右模型性能較好,而Y在一個(gè)較大范圍內(nèi)模型都具有準(zhǔn)確性和穩(wěn)定性。在本實(shí)例中(72和Y的值分別取20和104。表1中顯示了在該參數(shù)下使用留一法得到的標(biāo)準(zhǔn)測(cè)量值和預(yù)測(cè)值以及兩者的誤差。表1<table>tableseeoriginaldocumentpage7</column></row><table>在選定參數(shù)后,將20個(gè)汽油樣本使用熒光指示劑法測(cè)量得到的烯烴含量值和經(jīng)過(guò)預(yù)處理后的訓(xùn)練樣本光譜數(shù)據(jù)代入式(2),其中j^b,,...,^f為標(biāo)準(zhǔn)方法測(cè)量得到的20個(gè)樣本的烯烴含量值,^和x,分別為第A和第/個(gè)訓(xùn)練樣本光譜經(jīng)過(guò)預(yù)處理后的數(shù)據(jù)。通過(guò)解式(2)中的方程可以得到《和6。將《和6代入式(4)即得到汽油烯烴含量校正模型。(5)測(cè)取待測(cè)油樣的拉曼光譜,對(duì)拉曼光譜進(jìn)行平滑濾波、基線校正和標(biāo)準(zhǔn)歸一化預(yù)處理,根據(jù)步驟(4)的校正模型計(jì)算待測(cè)油樣的烯烴含量。首先按照步驟(2)同樣的方法獲得待測(cè)油樣的拉曼譜圖,然后對(duì)拉曼光譜進(jìn)行平滑濾波、基線校正和標(biāo)準(zhǔn)歸一化預(yù)處理,將得到的光譜數(shù)據(jù)代入式(4),得到的結(jié)果y即為待測(cè)樣品的烯烴含量。其中,^為第yfc個(gè)訓(xùn)練樣本光譜經(jīng)過(guò)預(yù)處理后的數(shù)據(jù),;c為待測(cè)樣品的光譜經(jīng)過(guò)預(yù)處理后的數(shù)據(jù)。為驗(yàn)證本發(fā)明方法的可靠性,進(jìn)行模型驗(yàn)證和重復(fù)性試驗(yàn)如下模型驗(yàn)證為了驗(yàn)證模型的精度和穩(wěn)定性,通常將已知樣品分成校正集和驗(yàn)證集進(jìn)行模型驗(yàn)證。模型驗(yàn)證評(píng)價(jià)參數(shù)包括最小誤差、最大誤差、均方誤差(StandardErrorofPrediction,SEP)以及復(fù)相關(guān)系數(shù)(72)。各指標(biāo)定義如下最小誤差=minO,.-少,)(6)最大誤差二maxO,.-A)(7)M2及2=1-^-(9)式中乂,免分別是第/個(gè)樣本的標(biāo)準(zhǔn)分析值和預(yù)測(cè)值,7=^|>,為標(biāo)準(zhǔn)分析值的算術(shù)平均值,M為測(cè)試樣本數(shù)目。模型精度驗(yàn)證每次從20個(gè)樣本中隨機(jī)抽取5個(gè)樣本作為驗(yàn)證集,剩余15個(gè)樣本作為訓(xùn)練樣本。此隨機(jī)抽取試驗(yàn)共進(jìn)行10次。試驗(yàn)結(jié)果如表2中所示。試驗(yàn)的預(yù)測(cè)結(jié)果與標(biāo)準(zhǔn)測(cè)量值復(fù)相關(guān)系數(shù)在0.99以上,均值達(dá)到0.9958,絕對(duì)誤差最大為0.94%。表2<table>tableseeoriginaldocumentpage0</column></row><table>重復(fù)性試驗(yàn)隨機(jī)選取某一樣本,重復(fù)測(cè)量12次,測(cè)量結(jié)果如表3所示。從表中數(shù)據(jù)可知,本發(fā)明提出的汽油烯烴含量測(cè)量方法的偏差重復(fù)性為0.14%,低于GB/T11132—2002《液體石油產(chǎn)品烴類測(cè)定法熒光指示劑吸附法》規(guī)定的2.0%和SH/T0741-2004《汽油中烴族組成測(cè)定法多維氣相色譜法》規(guī)定的1.2%。表3<table>tableseeoriginaldocumentpage0</column></row><table>權(quán)利要求1、一種基于拉曼光譜的測(cè)量汽油烯烴含量的方法,該方法包括如下步驟(1)用熒光指示劑吸附法或多維氣相色譜法測(cè)定訓(xùn)練樣本的烯烴含量;(2)測(cè)取訓(xùn)練樣本的拉曼光譜;(3)對(duì)測(cè)取的拉曼光譜進(jìn)行平滑濾波、基線校正和標(biāo)準(zhǔn)歸一化預(yù)處理;(4)將經(jīng)步驟(3)預(yù)處理的訓(xùn)練樣本拉曼光譜與步驟(1)測(cè)得的烯烴含量值,采用最小二乘支持向量機(jī)建立汽油烯烴含量校正模型;(5)測(cè)取待測(cè)油樣的拉曼光譜,對(duì)拉曼光譜進(jìn)行平滑濾波、基線校正和標(biāo)準(zhǔn)歸一化預(yù)處理,根據(jù)步驟(4)的校正模型計(jì)算待測(cè)油樣的烯烴含量。2、根據(jù)權(quán)利要求1所述的基于拉曼光譜的測(cè)量汽油烯烴含量的方法,其特征在于所說(shuō)的平滑濾波是采用Savitzky-Golay巻積平滑濾波。3、根據(jù)權(quán)利要求1所述的基于拉曼光譜的測(cè)量汽油烯烴含量的方法,其特征在于所說(shuō)的基線校正步驟是選擇拉曼光譜的無(wú)信號(hào)區(qū)作為參考區(qū),對(duì)參考區(qū)內(nèi)的拉曼光譜數(shù)據(jù)進(jìn)行線性回歸,求得斜率,選擇拉曼光譜有效信號(hào)區(qū)中的某一公共的起點(diǎn)作為基線的起始點(diǎn),得到基線方程,然后,在相應(yīng)波數(shù)段從拉曼光譜中將基線去除,保留有效信號(hào)區(qū)內(nèi)的拉曼光譜數(shù)據(jù)用于步驟(4)建模和步驟(5)測(cè)量。4、根據(jù)權(quán)利要求1所述的基于拉曼光譜的測(cè)量汽油烯烴含量的方法,其特征在于所說(shuō)的標(biāo)準(zhǔn)歸一化的參考點(diǎn)為拉曼光譜中飽和烴的最大拉曼峰。5、根據(jù)權(quán)利要求1所述的基于拉曼光譜的測(cè)量汽油烯烴含量的方法,其特征在于測(cè)取訓(xùn)練樣本拉曼光譜和待測(cè)樣本拉曼光譜采用包括激光器(1)、激發(fā)光纖(2)、光纖探頭(3)、樣品分析池(4)、收集光纖(5)、光譜儀(6)和計(jì)算機(jī)(7)的裝置,激光器(1)發(fā)出的激光經(jīng)激發(fā)光纖(2)和光纖探頭(3)照射到樣品分析池(4)中的汽油樣品,樣品在強(qiáng)激光照射下發(fā)出拉曼散射光,經(jīng)光纖探頭(3)長(zhǎng)通濾光后通過(guò)收集光纖(5)傳送到光譜儀(6)進(jìn)行分光和數(shù)字采集,再由計(jì)算機(jī)(7)對(duì)拉曼散射光進(jìn)行處理得到以波數(shù)為單位的拉曼光譜。6、根據(jù)權(quán)利要求5所述的基于拉曼光譜的測(cè)量汽油烯烴含量的方法,其特征在于激光器(1)采用中心波長(zhǎng)為6501064nm,激光線寬《0.2nm,功率aOOmW的近紅外激光器。全文摘要本發(fā)明公開(kāi)的基于拉曼光譜的測(cè)量汽油烯烴含量的方法,依次包括用熒光指示劑吸附法或多維氣相色譜法測(cè)定訓(xùn)練樣本的烯烴含量;測(cè)取訓(xùn)練樣本的拉曼光譜;對(duì)測(cè)取的拉曼光譜進(jìn)行平滑濾波、基線校正和標(biāo)準(zhǔn)歸一化預(yù)處理;將經(jīng)預(yù)處理的訓(xùn)練樣本拉曼光譜與測(cè)得的烯烴含量值,采用最小二乘支持向量機(jī)建立汽油烯烴含量校正模型;測(cè)取待測(cè)油樣的拉曼光譜,對(duì)拉曼光譜進(jìn)行平滑濾波、基線校正和標(biāo)準(zhǔn)歸一化預(yù)處理,根據(jù)校正模型計(jì)算待測(cè)油樣的烯烴含量。本發(fā)明將拉曼光譜和最小二乘支持向量機(jī)相結(jié)合分析汽油烯烴含量的方法,可顯著提高檢測(cè)精度,同時(shí)大大縮短測(cè)量時(shí)間,且測(cè)量過(guò)程對(duì)樣品無(wú)損耗,這對(duì)石油加工過(guò)程的質(zhì)量控制有著重要意義。文檔編號(hào)G01N21/63GK101403696SQ200810121879公開(kāi)日2009年4月8日申請(qǐng)日期2008年10月21日優(yōu)先權(quán)日2008年10月21日發(fā)明者戴連奎,華阮申請(qǐng)人:浙江大學(xué)