本發(fā)明涉及一種古龍酸工業(yè)發(fā)酵過程代謝活性關(guān)鍵階段的識(shí)別方法,屬于生物技術(shù)和信息科學(xué)交叉技術(shù)領(lǐng)域。
背景技術(shù):
維生素C(即L-抗壞血酸)是人體必需的營(yíng)養(yǎng)物質(zhì),廣泛用作輔助藥物、食品、飲料和飼料添加劑。我國(guó)維生素C生產(chǎn)采用的是具有自主知識(shí)產(chǎn)權(quán)的二步法發(fā)酵工藝。第一步發(fā)酵過程中,L-山梨醇被黑醋酸桿菌轉(zhuǎn)變?yōu)長(zhǎng)-山梨糖。L-山梨糖在第二步發(fā)酵過程中經(jīng)巨大芽孢桿菌(俗稱大菌)和氧化葡萄糖酸桿菌(俗稱小菌)混菌發(fā)酵生成維生素C的前體2-酮基-L-古龍酸(簡(jiǎn)稱古龍酸)。最后,古龍酸經(jīng)過化學(xué)烯醇化酸化被轉(zhuǎn)化為維生素C。
第二步混菌發(fā)酵生產(chǎn)古龍酸是提高轉(zhuǎn)化率和生產(chǎn)率的關(guān)鍵,也是本發(fā)明的研究對(duì)象。由于菌體的代謝過程、大小菌的相互作用機(jī)制較為復(fù)雜,難以用精確的數(shù)學(xué)機(jī)理模型來描述,給發(fā)酵過程的監(jiān)控帶來困難。在古龍酸發(fā)酵過程中,產(chǎn)物質(zhì)量和批次的性能通過離線分析產(chǎn)物濃度、底物濃度等變量來監(jiān)督。這些測(cè)量值的獲取比較耗時(shí)和昂貴,并且采樣頻率低(4小時(shí)),以提前預(yù)定的時(shí)間間隔進(jìn)行采樣,因此不能及時(shí)反映批次的狀態(tài),給精確監(jiān)控發(fā)酵過程帶來困難。在線測(cè)量的變量如pH、液位、通氣量等,采樣成本較低采樣頻率高,雖不能直接給出反映過程狀態(tài)的信息,但是具有挖掘潛力來獲得菌體代謝活性信息。因此可以利用在線測(cè)量數(shù)據(jù)來監(jiān)測(cè)發(fā)酵過程的代謝活性變化以調(diào)控發(fā)酵過程。
技術(shù)實(shí)現(xiàn)要素:
為了克服現(xiàn)有技術(shù)的不足,本發(fā)明的目的在于提供一種古龍酸工業(yè)發(fā)酵過程代謝活性關(guān)鍵階段的識(shí)別方法。
由于工業(yè)發(fā)酵過程不可避免的存在批次之間的波動(dòng)(主要由于原料、種子的質(zhì)量以及操作工技術(shù)的波動(dòng)),發(fā)酵過程可被看成為一系列不同的代謝階段,每個(gè)階段有其持續(xù)時(shí)間和獨(dú)有的動(dòng)態(tài)特征,本發(fā)明將批次之間的波動(dòng)性這一現(xiàn)象轉(zhuǎn)化為批次的不同階段的過渡時(shí)間和持續(xù)時(shí)間不同,從而通過檢測(cè)這些不同階段事件的發(fā)生可以有效的調(diào)控發(fā)酵過程。
本發(fā)明建立基于在線數(shù)據(jù)的代謝活性階段的辨識(shí),不需要建立過程機(jī)理模型,也不需要收集歷史數(shù)據(jù),僅依賴于當(dāng)前批次的可獲得的在線數(shù)據(jù),綜合發(fā)酵過程動(dòng)態(tài)特性和主元分析的特點(diǎn),提出了基于時(shí)滯窗口的主成分分析方法來辨識(shí)發(fā)酵過程不同階段。本發(fā)明技術(shù)方案具體介紹如下。
一種古龍酸工業(yè)發(fā)酵過程代謝活性關(guān)鍵階段的識(shí)別方法,具體步驟如下:
1)選取與菌體生長(zhǎng)和產(chǎn)物形成的發(fā)酵過程狀態(tài)相關(guān)的在線測(cè)量數(shù)據(jù),所述在線測(cè)量數(shù)據(jù)包括發(fā)酵液的pH值、液位高度、溫度以及通氣量;
2)引入時(shí)滯窗口,滯后數(shù)據(jù)被加入到當(dāng)前測(cè)量值中,t時(shí)刻的動(dòng)態(tài)系統(tǒng)狀態(tài)由[t-D,t]時(shí)間段的在線測(cè)量數(shù)據(jù)來表征,D為時(shí)滯窗口的寬度,對(duì)帶時(shí)滯窗口的在線測(cè)量數(shù)據(jù)進(jìn)行主成分分析,將多個(gè)相關(guān)變量轉(zhuǎn)化為少數(shù)幾個(gè)新的不相關(guān)的變量,即獲得反映數(shù)據(jù)主要信息的主元;
3)利用帶時(shí)滯窗口的主成分分析后的主元計(jì)算統(tǒng)計(jì)指標(biāo)Hotelling’s T2隨發(fā)酵時(shí)間的變化曲線;根據(jù)統(tǒng)計(jì)曲線中的奇異點(diǎn)SP包含的動(dòng)態(tài)行為信息對(duì)不同代謝活性關(guān)鍵階段進(jìn)行識(shí)別。
本發(fā)明采用對(duì)在線測(cè)量數(shù)據(jù)進(jìn)行帶時(shí)滯窗口的主成分分析來檢測(cè)發(fā)酵階段的變動(dòng)。傳統(tǒng)的主成分分析假設(shè)變量的測(cè)量值與過去時(shí)刻的值獨(dú)立,但是對(duì)于動(dòng)態(tài)過程如發(fā)酵過程,這個(gè)假設(shè)是無效的,當(dāng)前測(cè)量值依賴于過去的測(cè)量值,為了獲得這些動(dòng)態(tài)關(guān)系,引入時(shí)滯窗口,滯后數(shù)據(jù)被加入到當(dāng)前測(cè)量值中。也就是說,t時(shí)刻的動(dòng)態(tài)系統(tǒng)狀態(tài)需要由[t-D,t]時(shí)間段的測(cè)量值來表征,而不僅僅是t時(shí)刻。
利用帶時(shí)滯窗口的主成分分析后的主元得出統(tǒng)計(jì)指標(biāo)Hotelling’s T2隨時(shí)間的變化曲線,可以反映過程動(dòng)態(tài)特性的變化,曲線中的奇異點(diǎn)(SP)可以檢測(cè)古龍酸發(fā)酵階段的變動(dòng)。當(dāng)獲得發(fā)酵過程發(fā)生階段轉(zhuǎn)換的信息時(shí),可以實(shí)時(shí)指導(dǎo)離線采樣分析的時(shí)間。
以下是對(duì)本發(fā)明方法作進(jìn)一步描述,具體如下:
1.帶時(shí)滯窗口的主成分分析
為了反映過程的動(dòng)態(tài)特性和變量之間的依賴時(shí)間的特性,采用帶時(shí)滯窗口的PCA對(duì)輸入變量進(jìn)行降維,獲取反映過程變量的主元信息,首先選取在線測(cè)量變量,假設(shè)發(fā)酵過程t時(shí)刻在線測(cè)量變量組成的m維向量用x(t)=[xt,1 xt,2 … xt,m]表示,則帶時(shí)滯窗口的PCA的輸入變量Xd為如下形式:
其中n為測(cè)量樣本的個(gè)數(shù),如果在線變量每τh采集一次,時(shí)滯窗口的寬度為D=d×τ;
假設(shè)輸入變量Xd已處理為歸一化數(shù)據(jù),對(duì)輸入變量Xd進(jìn)行主元分解獲得反映變量Xd主要信息的主元ti:
式中,r為保留的主元個(gè)數(shù),ti為得分向量,也稱為主元,pi為載荷向量,E為殘差矩陣;ti和pi的乘積之和表示發(fā)酵過程數(shù)據(jù)的主要信息,殘差部分E代表發(fā)酵過程數(shù)據(jù)的次要信息。
2.Hotelling’s T2統(tǒng)計(jì)指標(biāo)
統(tǒng)計(jì)指標(biāo)Hotelling’s T2反映了每個(gè)采樣在變化趨勢(shì)和幅值上偏離模型的程度。T2統(tǒng)計(jì)量隨時(shí)間的變化曲線可以反映過程動(dòng)態(tài)特性的變化。Hotelling’s T2隨時(shí)間的變化曲線如下表示:
其中:λ是由前r個(gè)主元所對(duì)應(yīng)的特征值組成的對(duì)角矩陣,Hotelling’s T2統(tǒng)計(jì)量通過主元模型內(nèi)部的主元向量模的波動(dòng)來反映過程動(dòng)態(tài)特性的變化,反映了數(shù)據(jù)中沒有被主元模型所解釋的變化。
3.奇異點(diǎn)(Singular points,SP)
由于時(shí)變信號(hào)中各點(diǎn)的信息含量不是一致分布的,因此T2統(tǒng)計(jì)曲線中的奇異點(diǎn)(SP)包含動(dòng)態(tài)行為更多的信息,SP可以為不連續(xù)的點(diǎn),趨勢(shì)發(fā)生變化的點(diǎn)和極值點(diǎn)。本發(fā)明中利用SP來檢測(cè)古龍酸發(fā)酵階段的變動(dòng)。
和現(xiàn)有技術(shù)相比,本發(fā)明的有益效果在于:
本發(fā)明方法可用于檢測(cè)古龍酸發(fā)酵階段的變動(dòng),也可用于實(shí)時(shí)指導(dǎo)離線采樣分析的時(shí)間,尤其是,一旦檢測(cè)到T2統(tǒng)計(jì)曲線奇異點(diǎn),可以進(jìn)行采集離線分析數(shù)據(jù),而不是在任意指定的時(shí)間進(jìn)行采樣。
附圖說明
圖1為本發(fā)明的批次412在線pH和液位曲線圖。
圖2為批次412的運(yùn)行結(jié)果圖。
圖3為批次416在線pH和液位曲線圖。
圖4為批次416的運(yùn)行結(jié)果圖。
具體實(shí)施方式
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中結(jié)合附圖進(jìn)一步詳細(xì)闡述。
對(duì)象:某制藥公司古龍酸工業(yè)發(fā)酵批次。這些批次均在240m3氣升式發(fā)酵罐、標(biāo)準(zhǔn)配方等相同條件下進(jìn)行操作,初始發(fā)酵時(shí)投入一定體積的山梨糖,發(fā)酵到中段流加相同體積的山梨糖,流加操作在一小時(shí)左右時(shí)間完成,可認(rèn)為是瞬態(tài)流加。發(fā)酵過程中通過流加堿液來調(diào)節(jié)pH值。在線測(cè)量的變量為pH、液位高度、通氣量、溫度。由于通氣量始終能保證溶解氧達(dá)到飽和狀態(tài),因此不會(huì)對(duì)發(fā)酵狀態(tài)產(chǎn)生影響,不考慮該變量;溫度通過控制冷卻水能達(dá)到基本不變值,不考慮該變量。將流加山梨糖引起的液位升高去除后液位的高度變化值可以體現(xiàn)流加堿液的多少,因此,可將處理后的液位高度作為一個(gè)參數(shù);pH也是與古龍酸的產(chǎn)生相關(guān)的一個(gè)重要參數(shù)。
利用pH值和處理后的液位高度建立帶時(shí)滯窗口的PCA模型,D經(jīng)試差法選擇為7.32h,τ為0.665h,從而d=11,發(fā)酵過程中每一時(shí)刻狀態(tài)由帶時(shí)間滯后的24維向量來表征。T2統(tǒng)計(jì)量計(jì)算中主元個(gè)數(shù)r分別選取為2和3,即分別采用2個(gè)主元(圖2和圖4中的2pc)和3個(gè)主元(圖2和圖4中的3pc)。圖1為批次412的在線數(shù)據(jù),圖2為采用本發(fā)明方法得出的T2統(tǒng)計(jì)曲線及奇異點(diǎn),從而得到發(fā)酵階段的劃分,包括延遲期、生產(chǎn)期、指數(shù)生產(chǎn)期等。圖3為批次416的在線數(shù)據(jù)示意圖,采用本發(fā)明方法得出的T2統(tǒng)計(jì)曲線及奇異點(diǎn)如圖4所示,從而得到416批次發(fā)酵階段的劃分,包括延遲期、生產(chǎn)期、指數(shù)生產(chǎn)期等。由圖2和圖4可看出,含有3個(gè)主元的T2統(tǒng)計(jì)量對(duì)過程狀態(tài)的變化敏感,其奇異點(diǎn)個(gè)數(shù)多于已知的發(fā)酵階段的個(gè)數(shù),額外的奇異點(diǎn)可能對(duì)應(yīng)生物的形態(tài)上或生理上的變化。因此本發(fā)明采用3個(gè)主元,即a=3。將發(fā)酵車間的37個(gè)發(fā)酵批次進(jìn)行分析后可以發(fā)現(xiàn)生產(chǎn)期結(jié)束的時(shí)刻在25.14~30.99h之間波動(dòng)。另外,由于工業(yè)發(fā)酵車間一般間隔若干小時(shí)(如:4小時(shí))進(jìn)行離線采樣,對(duì)底物濃度和產(chǎn)物濃度進(jìn)行采樣分析,本發(fā)明得到的統(tǒng)計(jì)曲線上的奇異點(diǎn)可以用來指導(dǎo)離線采樣時(shí)間,奇異點(diǎn)出現(xiàn)后可以對(duì)工藝人員給出進(jìn)行離線采樣分析的建議。