專利名稱::包括聚合酶鏈反應(yīng)(pcr)在內(nèi)的核酸擴(kuò)增程序的控制的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及控制聚合酶鏈反應(yīng)的循環(huán)條件的優(yōu)化。優(yōu)化PCR擴(kuò)增的溫度控制需要仔細(xì)考慮反應(yīng)條件。這種反應(yīng)以及必需反應(yīng)成分之間的相互作用的復(fù)雜特性表明無(wú)法簡(jiǎn)單地采用傳統(tǒng)的動(dòng)力學(xué)分析方法來(lái)預(yù)測(cè)最佳循環(huán)條件。本方法通過(guò)綜合采用“灰箱”建模、遺傳算法和神經(jīng)網(wǎng)絡(luò)對(duì)于給定循環(huán)條件下的擴(kuò)增水平進(jìn)行模型構(gòu)建和預(yù)測(cè)來(lái)解決上述問(wèn)題。此法可用來(lái)確定溫度軌跡的哪一部分對(duì)反應(yīng)具有最大的影響。遺傳算法用來(lái)建立溫度軌跡變化對(duì)擴(kuò)增影響的模型。因而,這些算法可用于確定能夠改善反應(yīng)結(jié)果的溫度循環(huán)。將模型構(gòu)建與擴(kuò)增過(guò)程的在線監(jiān)控聯(lián)系起來(lái),就有可能實(shí)現(xiàn)反應(yīng)的實(shí)時(shí)優(yōu)化。這對(duì)于諸如基于PCR的診斷等質(zhì)量控制要求高的方法尤為重要。美國(guó)專利第4683195號(hào)(Mullisetal.,CetusCorporation)公布了一個(gè)通過(guò)聚合酶鏈反應(yīng)(PCR)進(jìn)行核酸擴(kuò)增的方法。設(shè)計(jì)相應(yīng)于被擴(kuò)增靶序列兩旁區(qū)域的、長(zhǎng)度通常為10-40堿基的短寡聚核苷酸序列。這些引物過(guò)量地與靶序列DNA混合。再加入合適的緩沖液、氯化鎂離子、熱穩(wěn)定聚合酶和自由核苷酸。熱循環(huán)過(guò)程一般將DNA擴(kuò)增幾百萬(wàn)倍。擴(kuò)增通過(guò)溫度循環(huán)實(shí)現(xiàn)。先在95℃將靶DNA變性,然后通常降溫至40-60℃,使引物與分開(kāi)的DNA鏈退火。升溫至聚合酶的最適溫度,通常為72℃,聚合酶延伸引物、復(fù)制靶序列。這一系列事件重復(fù)多次(通常為20-40次)。在最初的幾個(gè)循環(huán)中,靶序列被復(fù)制。在隨后的循環(huán)中,復(fù)制產(chǎn)物被復(fù)制,使靶序列呈指數(shù)擴(kuò)增。由于反應(yīng)成分之間存在復(fù)雜的相互作用,不可能用傳統(tǒng)動(dòng)力學(xué)表示法對(duì)PCR進(jìn)行數(shù)學(xué)描述。(參見(jiàn)“Asimpleprocedureforoptimizingthepolymerasechainreaction(PCR)usingmodifiedTaguchimethods”,CobbandClarkson(1994),NucleicAcidsResearch.Vol.22,No.18,pp.3801-3805)。已知Mg2+和三磷酸脫氧核苷會(huì)通過(guò)改變變性、退火和延伸溫度下引物與模板的雜交和解離動(dòng)力學(xué),影響引發(fā)和延伸效率。這些成分還會(huì)影響聚合酶識(shí)別及延伸上述雙鏈的效率。最佳擴(kuò)增所需Mg2+和三磷酸脫氧核苷的濃度在很大程度上取決于靶序列及引物序列,而引物3’端的核苷酸對(duì)于錯(cuò)配延伸的效率有重要影響。某些錯(cuò)配核苷酸組合可能在某些條件下會(huì)更有效地?cái)U(kuò)增。反應(yīng)中存在過(guò)量Mg2+時(shí)可能會(huì)造成非特異擴(kuò)增產(chǎn)物的積累,而如果濃度較低則可能減少產(chǎn)物產(chǎn)量。此外,三磷酸脫氧核苷可結(jié)合Mg2+離子,因而,改變dNTP濃度時(shí)需要對(duì)MgCl2濃度作相應(yīng)調(diào)整。PCR的優(yōu)化通常需要通過(guò)對(duì)重要的反應(yīng)參數(shù)進(jìn)行反復(fù)的試驗(yàn)-錯(cuò)誤調(diào)整來(lái)完成。這樣得到的優(yōu)化了的反應(yīng)通常也不是萬(wàn)能的,而是會(huì)受到溫度軌跡的些微變化和/或反應(yīng)混合物組成的波動(dòng)的影響。反應(yīng)的復(fù)雜性以及某種程度上的不確定性表明模型建立并不容易。在已建立的模型中(見(jiàn)‘Polymerasechainreactionengineering’Hsuetal.,(1997),BiotechnologyandBioengineering,Vol.55,No.2,pp.359-366),重要的反應(yīng)元素被忽略了。關(guān)鍵在于,由于受熱循環(huán)器的程序設(shè)定方法(即設(shè)定相應(yīng)于變性、延伸和退火步驟的幾個(gè)固定溫度)的影響,目前的模型假定,變性、延伸和退火發(fā)生于循環(huán)中的固定溫度。但這是過(guò)分簡(jiǎn)化,因?yàn)檫@些步驟的速度是溫度依賴的,它們發(fā)生在一個(gè)寬的溫度范圍之內(nèi)。從理論上看,特定模板序列的擴(kuò)增應(yīng)遵循指數(shù)函數(shù),即,在理想條件下,被擴(kuò)增的模板的量在每一個(gè)反應(yīng)循環(huán)之后應(yīng)該翻番。但是,擴(kuò)增的準(zhǔn)確性和速率受制于反應(yīng)成分之間的復(fù)雜的相互作用,因此,理論最佳值總是達(dá)不到的。在通常條件下,由于在反應(yīng)靠后的循環(huán)中待延伸的雙鏈數(shù)目超過(guò)了酶活性所能處理的數(shù)目,反應(yīng)產(chǎn)物的積累受到限制。此時(shí),產(chǎn)物積累呈線性增加。使問(wèn)題更為復(fù)雜的是,聚合酶由于長(zhǎng)時(shí)間暴露于超過(guò)80℃的溫度而熱失活。通過(guò)仔細(xì)考慮退火溫度、退火時(shí)間和退火斜坡可以優(yōu)化擴(kuò)增。通過(guò)改變斜坡速度補(bǔ)償引發(fā)率損失,可增加退火溫度從而避免非特異引發(fā)。這樣就可增加靶序列呈指數(shù)增加的循環(huán)范圍。引發(fā)率以及產(chǎn)生引發(fā)的溫度范圍取決于游離Mg2+的量。由于Taq聚合酶過(guò)度接觸變性高溫(一般為≥94℃,1-5分鐘)后會(huì)發(fā)生失活,在變性時(shí)間和斜坡方面作類似的優(yōu)化將影響擴(kuò)增(參見(jiàn)’KineticsofinactivationforthermostableDNApolymeraseenzymes’,MohapatraandHsu,(1996),BiotechnologyTechniques,Vol.10,pp.569-572)。盡管通常過(guò)量使用聚合酶,但PCR反應(yīng)中一次次變性步驟對(duì)聚合酶失活的量有很大影響。另外,這些溫度條件會(huì)使DNA模板發(fā)生脫嘌呤(通常在94℃時(shí)每分鐘每2kb一次)。因?yàn)樵谶_(dá)到設(shè)定的變性溫度前后變性都在發(fā)生(一般在70℃和90℃之間DNA變性速度隨溫度增加),改變斜坡時(shí)間可限制暴露于94℃的時(shí)間。聚合酶,如Taq的性質(zhì)已經(jīng)被很好地研究。它們表現(xiàn)出經(jīng)典的溫度依賴性,在高溫時(shí)延伸速度逐漸增加,活性達(dá)到最大值(通常大約在70℃),然后活性逐漸下降(一般在≥80℃時(shí))。延伸發(fā)生在較寬的溫度范圍內(nèi)。根據(jù)在這一范圍內(nèi)的總延伸量,可縮短延伸時(shí)間。例如,在約60℃時(shí),會(huì)發(fā)生大量的延伸,在這個(gè)溫度雜交的寡聚核苷酸會(huì)立刻被延伸。延伸時(shí)間可縮短,在某些情況下可取消。本發(fā)明尋求實(shí)現(xiàn)用于控制聚合酶鏈反應(yīng)的循環(huán)條件的優(yōu)化。按照本發(fā)明的一個(gè)方面可得到在權(quán)利要求1中描述的優(yōu)化用于控制聚合酶鏈反應(yīng)的循環(huán)條件的方法。首推實(shí)施例給出了可實(shí)現(xiàn)PCR的智能控制的方法。這是通過(guò)采用隸屬函數(shù)建立(反應(yīng)事件與溫度的關(guān)系),遺傳算法和人工神經(jīng)網(wǎng)絡(luò)的一種全新結(jié)合對(duì)擴(kuò)增水平進(jìn)行建模和預(yù)測(cè)來(lái)實(shí)現(xiàn)的。隸屬函數(shù)部分推斷決定特定反應(yīng)擴(kuò)增程度的各種反應(yīng)參數(shù)并給出清楚的定義。遺傳算法用于確定每一溫度循環(huán)步驟的最適時(shí)間。神經(jīng)網(wǎng)絡(luò)部分用來(lái)增強(qiáng)隸屬法則和隸屬函數(shù)。經(jīng)過(guò)最初的訓(xùn)練,神經(jīng)網(wǎng)絡(luò)可在不斷從輸入信號(hào)中得到新東西時(shí)更新隸屬函數(shù)。這一方法可用來(lái)精確預(yù)測(cè)最優(yōu)反應(yīng)條件(圖1)。此法最好用于將一個(gè)熱循環(huán)器的程序移植到另一個(gè)熱循環(huán)器上。首先,根據(jù)第一個(gè)熱循環(huán)器的熱性能計(jì)算變性、退火和延伸的相對(duì)基值。然后,考慮兩個(gè)熱循環(huán)器性能上的差異,將上述基值移植到第二個(gè)熱循環(huán)器上。下面通過(guò)例子及相伴示意圖描述本發(fā)明的一個(gè)實(shí)施例。這些圖示包括圖1為一“智能”熱循環(huán)器控制的示意圖。這一控制利用特定反應(yīng)事件隸屬函數(shù)和遺傳算法預(yù)測(cè)設(shè)定循環(huán)條件下的擴(kuò)增水平。圖2顯示采用自學(xué)控制過(guò)程預(yù)測(cè)擴(kuò)增水平。圖3為顯示模板去向的S形隸屬函數(shù)。圖4為采用目標(biāo)、退火和延伸隸屬函數(shù)建立PCR擴(kuò)增模型的例子。圖5(a)為優(yōu)選遺傳算法中關(guān)鍵事件的示意圖。圖5(b)顯示圖5(a)中遺傳算法的運(yùn)算。圖6(a)和圖6(b)分別顯示一點(diǎn)和二點(diǎn)交換的例子。圖7為人工神經(jīng)網(wǎng)絡(luò)的一個(gè)設(shè)置和一個(gè)三層人工神經(jīng)網(wǎng)絡(luò)的示意圖。圖8為S形傳遞函數(shù)。S形增益為0.25-2.00。圖9至圖15是與優(yōu)選方法相關(guān)的結(jié)果。近來(lái)已有實(shí)時(shí)監(jiān)控PCR過(guò)程的新技術(shù)(例如5’端熒光核酸酶化學(xué)--PEAppliedBiosystem和溴化乙錠熒光(見(jiàn)”KineticPCRanalysisreal-timemonitoringofDNAamplificationreactions”Higuchietal.,(1993),Biotechnology.Vol.11,pp.1026-1030)。這些方法可對(duì)反應(yīng)過(guò)程中形成的產(chǎn)物進(jìn)行定量,而實(shí)時(shí)監(jiān)控的主要好處產(chǎn)生于可精確預(yù)測(cè)和保持最佳擴(kuò)增的算法。本申請(qǐng)中介紹的方法可與產(chǎn)物檢測(cè)系統(tǒng)結(jié)合,為PCR提供實(shí)時(shí)動(dòng)態(tài)監(jiān)控,隨反應(yīng)進(jìn)行連續(xù)更新循環(huán)條件,保持最佳運(yùn)行。通常需要仔細(xì)考慮PCR條件以優(yōu)化擴(kuò)增水平。但由于聚合酶鏈反應(yīng)的復(fù)雜性,不能簡(jiǎn)單地運(yùn)用傳統(tǒng)動(dòng)力學(xué)方法預(yù)測(cè)最佳條件。加之,反應(yīng)成分之間還存在復(fù)雜的相互作用。首選實(shí)施例尋求通過(guò)計(jì)算循環(huán)途徑中整個(gè)溫度范圍內(nèi)變性、退火和延伸的量預(yù)測(cè)擴(kuò)增水平來(lái)克服一直與PCR優(yōu)化相關(guān)的問(wèn)題。采用將隸屬函數(shù)運(yùn)用于上述每一事件的“灰箱”建模、遺傳算法和人工神經(jīng)網(wǎng)絡(luò)的全新結(jié)合,可以預(yù)測(cè)擴(kuò)增水平。對(duì)神經(jīng)網(wǎng)絡(luò)產(chǎn)生的權(quán)重的分析可用來(lái)在循環(huán)事件的每一步所需時(shí)間上定義反應(yīng)最佳點(diǎn)。這個(gè)過(guò)程可描述如下ⅰ采用灰箱建模定義最適退火、延伸和變性溫度和這些事件發(fā)生的溫度范圍。ⅱ將隸屬函數(shù)運(yùn)用于每一事件,從而預(yù)測(cè)給定循環(huán)的擴(kuò)增水平。ⅲ運(yùn)用遺傳算法確定每一階段的最適時(shí)間。ⅳ可運(yùn)用神經(jīng)網(wǎng)絡(luò)確認(rèn)和/或更改預(yù)測(cè)的擴(kuò)增水平。ⅴ實(shí)時(shí)監(jiān)控可用來(lái)進(jìn)一步完善這一過(guò)程。這一方法為適用于PCR的控制軟件提供了基礎(chǔ)。這類軟件可運(yùn)用于標(biāo)準(zhǔn)熱循環(huán)器控制。這一方法還首次介紹了優(yōu)化PCR的智能控制過(guò)程。定義成員函數(shù)優(yōu)選方法的基礎(chǔ)包括將PCR的重要元素(變性、退火和延伸)轉(zhuǎn)變?yōu)橐幌盗须`屬函數(shù)。首先,通過(guò)對(duì)反應(yīng)進(jìn)行“灰箱”建模建立各種影響反應(yīng)特性的參數(shù)的隸屬函數(shù)系列和法則。參數(shù)指影響模板變性、引物退火和引物/模板雙鏈延伸的因素。用一個(gè)規(guī)則庫(kù)將這些事件與擴(kuò)增循環(huán)中特定溫度聯(lián)系起來(lái)。每一反應(yīng)變量的明確數(shù)值被用來(lái)預(yù)測(cè)單個(gè)或多個(gè)循環(huán)的擴(kuò)增水平。采用隸屬函數(shù)能夠建立PCR的動(dòng)態(tài)模型,考慮整個(gè)溫度循環(huán)中,而不象傳統(tǒng)建模方法中只是特定階段的,各種過(guò)程的速度的變化??梢哉J(rèn)為,PCR包含三個(gè)主要事件,即雙鏈模板的變性,引物退火至單鏈變性模板上以及這些雙鏈的聚合。這些過(guò)程進(jìn)行的速度依賴于溫度。反應(yīng)中各種成分之間的相互作用也影響速度和最佳值。建立這些過(guò)程的“灰箱”模型使這些事件的錄屬函數(shù)得以與特定溫度相關(guān)聯(lián)(圖2)。遺傳算法可用來(lái)調(diào)整分配給每個(gè)階段的時(shí)間(t1-t6)以優(yōu)化擴(kuò)增,限制組分相互作用、失活、脫嘌呤等的影響。神經(jīng)網(wǎng)絡(luò)部分被用來(lái)了解開(kāi)始時(shí)可用的時(shí)間以減少計(jì)算階段最佳值的時(shí)間。變性隸屬函數(shù)DNA模板的變性可用S形融解曲線表示。模板的退火溫度定義為一半DNA變性時(shí)的溫度。70℃以下幾乎不發(fā)生變性。在此溫度之上變性速度迅速增加。酶失活和模板脫嘌呤速度在高溫時(shí)也增加。變性主要發(fā)生在循環(huán)中的一個(gè)溫度范圍內(nèi),即,在溫度上升至設(shè)定變性溫度,從這一溫度下降和在這一溫度時(shí)。計(jì)算在達(dá)到設(shè)定變性溫度前后以及在變性溫度時(shí)的變性速度可以大大減少設(shè)定變性時(shí)間。這就將酶失活和脫嘌呤量降至最低。因此,擴(kuò)增效率得以提高。雙鏈模板的疊加而成的、氫鍵連接的堿基對(duì)之間的具有協(xié)同性的相互作用在融解時(shí)逐步被破壞直至兩條鏈完全分開(kāi)。模板變性的隸屬函數(shù)(Mdenature)因而可以用S形曲線定義(圖3),增益為qdenature’模板分子的預(yù)測(cè)Tm和最適變性溫度定義的中點(diǎn)為S(X)denature。增益qdenature和中點(diǎn)S(X)denature用作神經(jīng)網(wǎng)絡(luò)部分的修正量。歸納出的曲線還可以用來(lái)定義變性隸屬關(guān)系(例如,布爾型,梯形,三角形和動(dòng)態(tài)的)。通常,含AT和GC堿基對(duì)的天然DNA的Tm值約為72℃,多聚AT模板Tm值約為60℃,和多聚GC模板的Tm值約為90℃。退火隸屬函數(shù)退火隸屬關(guān)系定義引物與模板的雜交速度。開(kāi)始時(shí),引發(fā)溫度Tp(或Tm-5℃)用來(lái)定義取決于引物長(zhǎng)度的最適雜交。通常,Tp和Tm由下列方程式之一得到·Tp=[22+1.46·(2·GC+AT)]·Tm=[(A+T)·2℃]+[(G+C)·4℃]其中,J+為單價(jià)陰離子濃度,1為寡聚核苷酸長(zhǎng)度,F(xiàn)A為甲酰胺。雜交隸屬函數(shù)(Manneal)為S形曲線(圖3)。其最大值由引物Tp值或Tm-5℃決定。歸納出的曲線還可以用來(lái)定義隸屬關(guān)系(例如,布爾型,梯形,三角形和動(dòng)態(tài)的)。發(fā)生退火的溫度范圍取決于反應(yīng)混合物中自由鎂離子的濃度。中點(diǎn)S(X)anneal和增益qanneal定義發(fā)生退火的溫度范圍。兩者與反應(yīng)中自由Mg2+濃度緊密相關(guān)。增益qanneal和中點(diǎn)S(X)anneal用作神經(jīng)網(wǎng)絡(luò)部分的修正量。延伸隸屬函數(shù)別人先前已經(jīng)詳細(xì)描述了Taq活性對(duì)溫度的依賴性(參見(jiàn)”DeoxyribonucleicacidpolymerasefromtheextremethermophileTHERMUSaquaticus”,Chienetal.,(1976),JournalofBacteriology.Vol.127,No.3,pp.1550-1557)。雙鏈聚合的隸屬函數(shù)由一最大值由最適溫度定義的曲線表示。最適溫度將取決于所用的聚合酶。一般在70℃左右。歸納出的曲線也可以用來(lái)定義隸屬關(guān)系(即布爾型,梯形,三角形和鐘形的)。圖4為一單個(gè)PCR循環(huán)時(shí)間為t秒時(shí)樣品管溫度的反應(yīng)隸屬關(guān)系Mdenature,Manneal和Mextension的數(shù)值。調(diào)整這些循環(huán)事件之間或事件之中的時(shí)間t可優(yōu)化所能得到的擴(kuò)增量。由于優(yōu)化過(guò)程以這些事件的減少為先決條件,因此在優(yōu)化過(guò)程中降低擴(kuò)增的因素(例如,脫嘌呤、Taq聚合酶失活等)會(huì)被減少。神經(jīng)網(wǎng)絡(luò)算法用來(lái)確定這些事件中哪些對(duì)反應(yīng)結(jié)果影響最大。采用遺傳算法確定最適軌跡時(shí)間由于改變變性、退火和延伸任一設(shè)定時(shí)間都會(huì)改變擴(kuò)增水平,優(yōu)化反應(yīng)的方法不是一目了然的,也不是計(jì)算量很大的。這里介紹的方法非常獨(dú)特地利用遺傳算法克服這些困難。保存一系列可能的問(wèn)題解決方案,并根據(jù)進(jìn)化原則(即選擇、突變和/或重組(交換))不斷更新系列。重組從這個(gè)系列(親本)中選出方案對(duì),并通過(guò)結(jié)合親本元素產(chǎn)生一系列新方案(子代),將新方案插入新的方案系列。選擇的原則要求“好”的方案優(yōu)先于“壞”的方案被選中。這可以通過(guò)定義適合度函數(shù)做到。適合度函數(shù)根據(jù)每個(gè)方案的“好”的程度給它一個(gè)數(shù)值。選擇會(huì)確保只有適合度最好的方案(染色體)在將來(lái)的系列中增殖。突變被用來(lái)修改系列中的一些方案而不影響其他方案。因此,遺傳算法尋求在一起時(shí)會(huì)形成好的方案的基因組合(共適應(yīng)基因)。遺傳算法的一般性定義并不存在。這些算法可以從Holland的工作中抽象出來(lái)(參見(jiàn)“Adaptationinnaturalandartificialsystems”.Holland,(1975).TheUniversityofMichiganPress;AnnArbor)。本方法中使用的遺傳算法的示意圖見(jiàn)圖6。它有下列步驟ⅰ啟動(dòng)染色體的最初系列(通常n=25…100)可隨機(jī)建立或者通過(guò)將下文介紹的人工神經(jīng)網(wǎng)絡(luò)部分產(chǎn)生的輸入染色體“拆裝”來(lái)建立。這就縮短了算法用來(lái)尋求最適值的時(shí)間。ⅱ評(píng)估評(píng)估每個(gè)染色體的適合度。采用前已說(shuō)明的隸屬函數(shù)以及單個(gè)染色體給定的循環(huán)時(shí)間計(jì)算擴(kuò)增量。然后,給出這些染色體的適合度函數(shù)。這些函數(shù)會(huì)給每個(gè)染色體的表現(xiàn)進(jìn)行數(shù)值編碼。ⅲ發(fā)掘?qū)⒕哂凶罡哌m合度分值(即在最短的每步耗時(shí)情況下的最高預(yù)測(cè)擴(kuò)增)的染色體半隨機(jī)地、一次或多次置于配對(duì)子集中。從系列中隨機(jī)抽取兩個(gè)染色體。將具有最高適合度分值的染色體置于配對(duì)子集中。將兩個(gè)染色體放回到系列中。重復(fù)選擇過(guò)程直到配對(duì)子集排滿。這就確保低適合度染色體從配對(duì)集合中剔除。被選作親本的機(jī)會(huì)與染色體的標(biāo)準(zhǔn)適合度呈正相關(guān)。這意味著好的染色體一般將產(chǎn)生較多的后代。但是,這一過(guò)程的隨機(jī)性意味著較差的方案偶爾也會(huì)產(chǎn)生后代。增加優(yōu)越函數(shù)也是有好處的。這樣,任一親代中最好的方案不加改動(dòng)地被復(fù)制到子代中,所有其他子代均按常規(guī)得到。ⅳ探索使用重組和突變算符修改后代染色體中的染色體(圖5)。隨機(jī)選擇配對(duì)子集中兩個(gè)染色體并交配。交配概率為一可控制的功能,一般用較高值(≈0.90)。重組算符用來(lái)在兩個(gè)親本染色體之間進(jìn)行基因交換,產(chǎn)生兩個(gè)子代。圖5顯示一個(gè)三個(gè)個(gè)體的系列。每一個(gè)體有一適合度函數(shù)F?;谶@些適合度,選擇過(guò)程給予第一個(gè)個(gè)體0個(gè)拷貝,第二個(gè)個(gè)體2個(gè)拷貝,第三個(gè)個(gè)體1個(gè)拷貝。選擇后,按概率使用遺傳算符,第一個(gè)個(gè)體的第一個(gè)字符由1突變?yōu)?,其余二個(gè)個(gè)體經(jīng)交叉形成新個(gè)體(修改自Forrest(1993).Science,Vol.261,pp.872-878)。重組可以是一點(diǎn)和/或二點(diǎn)交叉(圖6)。使用一點(diǎn)交叉時(shí),在染色體上選擇一交叉點(diǎn)。到那一點(diǎn)為止的兩個(gè)親本的基因發(fā)生交換。發(fā)生二點(diǎn)交叉時(shí),選擇二個(gè)交叉點(diǎn)。兩點(diǎn)之間的基因發(fā)生交換。其他交換模式,如部分圖解交換(PMX),順序交換(OX)和循環(huán)交換(CX)也可采用。所有子代產(chǎn)生于兩個(gè)親本的交換。二個(gè)子代個(gè)體同時(shí)產(chǎn)生。子代在下一代中取代親本。單基因突變是另一可控功能,通常用低突變率(≈0.001),定義為(N*L1/2)-1。其中,N是系列大小,L是染色體長(zhǎng)度。ⅴ這一系列的事件重復(fù)一定代數(shù)直到發(fā)生收斂。擁擠取代可用來(lái)減少過(guò)早收斂。一個(gè)子代個(gè)體與大量現(xiàn)有親本個(gè)體比較,并取代最象自己的一個(gè)親代個(gè)體。擁擠取代本質(zhì)上就是相似個(gè)體之間的取代。這就使亞系列能夠檢查遺傳搜尋空間的不同部分。這對(duì)于具有大量的、分散適合度極值的多形搜尋空間特別有用。遺傳算法的基本結(jié)構(gòu)可以歸納如下建立系列評(píng)估染色體計(jì)算標(biāo)準(zhǔn)化適合度關(guān)于系列的輸出統(tǒng)計(jì)學(xué)對(duì)每一個(gè)下一代(產(chǎn)生和評(píng)估侯選置換者以侯選者取代系列中的成員重新評(píng)估未改變成員適合度標(biāo)準(zhǔn)化關(guān)于系列的輸出統(tǒng)計(jì)學(xué))根據(jù)循環(huán)中特定階段的最短/最長(zhǎng)時(shí)間和所需的時(shí)間分辨率(表1),循環(huán)軌跡中的每一個(gè)時(shí)間(基因,t1…t6)轉(zhuǎn)換為位I={0,1}1。這些位組合起來(lái)形成代表單個(gè)循環(huán)總的時(shí)間軌跡的位串(染色體)。首先,根據(jù)給每個(gè)階段的最小和最大時(shí)間,建立一個(gè)隨機(jī)系列位串??墒褂媒?jīng)過(guò)根據(jù)變性、退火和延伸步驟的隸屬函數(shù)訓(xùn)練已能夠設(shè)置初始時(shí)間的神經(jīng)網(wǎng)絡(luò)(注傳統(tǒng)的二進(jìn)制編碼有一個(gè)缺點(diǎn),即在某些情況下,為將數(shù)值改變1,所有位都必須改變。這就使通過(guò)突變使一個(gè)已經(jīng)接近最佳值的個(gè)體更接近最適值較難。由于采用葛萊碼時(shí),任何數(shù)值增加或減少1總是單位變化,因而較為可取。)表1編碼t6,即熱循環(huán)器由退火(72℃)加熱至變性(94℃)所需時(shí)間的位數(shù)據(jù)。最大允許時(shí)間設(shè)為120秒(每秒5℃過(guò)渡)<tablesid="table1"num="001"><table>解離位大小位數(shù)據(jù)∑(t1…t6)1秒7位111100042位2秒6位11110036位5秒5位1100030位10秒4位110024位</table></tables>循環(huán)中每個(gè)事件的最短時(shí)間是熱循環(huán)器性能限定的。一般而言,最低斜坡速度設(shè)為0.5℃/秒到1℃/秒之間。最高斜坡速度通常無(wú)需設(shè)得比5℃/秒高。因此,循環(huán)步驟的最長(zhǎng)時(shí)間取決于斜坡速度和相繼步驟之間的溫差。擴(kuò)增采用由系列中每一染色體決定的時(shí)間軌跡和已經(jīng)介紹的隸屬函數(shù)建立模型。適合度打分是根據(jù)在可能的最短時(shí)間內(nèi)保持對(duì)極端溫度最少暴露情況下獲得的最大擴(kuò)增。極端溫度可能增加引發(fā)錯(cuò)誤、失活和脫嘌呤。在某些情況下,定義其他適合度特征可能是有益的(例如,對(duì)于RAPD、差異顯示等,可能需要增加引發(fā)錯(cuò)誤)。在系列中的所有個(gè)體都被評(píng)估后,它們的適合度用作進(jìn)行發(fā)掘和探索、選擇用于下一輪選擇的染色體的基礎(chǔ)。經(jīng)過(guò)一定數(shù)目的重復(fù),最適溫度軌跡在染色體系列中的出現(xiàn)頻率會(huì)很高。神經(jīng)網(wǎng)絡(luò)選擇本申請(qǐng)使用前饋神經(jīng)網(wǎng)絡(luò)。它具有一個(gè)輸入層,一或多個(gè)隱藏層和一個(gè)輸出層(圖7)。每個(gè)節(jié)點(diǎn)含代表外部信號(hào)或其他節(jié)點(diǎn)輸出的一系列加權(quán)輸入Wi。隱藏節(jié)點(diǎn)的數(shù)目為可變參數(shù)。加權(quán)輸入之和采用非線性S形變換函數(shù)變換。f(x)=11+e-x/θ]]>其中,f(x)的范圍是0-1,x是輸入的加權(quán)和,q是增益。改變q會(huì)改變曲線形狀。Q值小則S形函數(shù)的斜率較陡(例如,q=1.0)。相反,q值大則曲線斜度較緩(例如,q=2.0)。輸入表示溫度控制事件的瞬變時(shí)間和這些事件的溫度范圍(圖8)。每一個(gè)變量有一個(gè)輸入節(jié)點(diǎn)。輸入節(jié)點(diǎn)將加權(quán)輸入信號(hào)傳遞到隱藏層中的節(jié)點(diǎn)。輸入層中的節(jié)點(diǎn)i和隱藏層中的節(jié)點(diǎn)j之間的連接用加權(quán)因子Wij來(lái)表示。因此,對(duì)于隱藏層中的每一個(gè)j節(jié)點(diǎn)都存在一個(gè)權(quán)重向量Wi。這些權(quán)重在訓(xùn)練過(guò)程中被改變。每層還有一個(gè)可解決數(shù)據(jù)中非零偏差的偏向輸入。偏向值開(kāi)始時(shí)總是設(shè)成能夠調(diào)零。權(quán)重矢量中包括將偏向與相應(yīng)層相接的一項(xiàng)。這項(xiàng)權(quán)重也可在訓(xùn)練時(shí)改變。可以運(yùn)用其他函數(shù)(正切、正鉉、余玄、線性等)。在初期訓(xùn)練程序中,向網(wǎng)絡(luò)重復(fù)提供一系列輸入模式及其相應(yīng)預(yù)期輸出。同時(shí),一邊調(diào)節(jié)權(quán)重。繼續(xù)這一過(guò)程直至形成預(yù)期實(shí)測(cè)輸出之間的所需程度的感覺(jué)??梢圆捎貌煌膶W(xué)習(xí)算法。但反傳是目前的優(yōu)選算法。預(yù)期輸出的誤差反傳通過(guò)網(wǎng)絡(luò),利用廣義增量法則確定對(duì)權(quán)重的調(diào)整(參見(jiàn)”P(pán)aralleldistributedprocessingexplorationsinthemicrostructureofcognition”.Part1.RumelhartandMcClelland,(1986).MITPress;Cambridge,MA)。輸出層項(xiàng)由下列公式給出。δpk=(tpk-Opk)Opk(l-Opk)]]>其中,dpk為輸出節(jié)點(diǎn)k的觀察p的誤差項(xiàng),tpk是觀察p的預(yù)期輸出,opk是實(shí)際節(jié)點(diǎn)輸出,opk(l-opk)為S形函數(shù)的導(dǎo)數(shù)。隱藏層的節(jié)點(diǎn)j的誤差項(xiàng)為S形函數(shù)導(dǎo)數(shù)乘以輸出誤差項(xiàng)與輸出層權(quán)重之積的和。δpj=Opj(l-Opj)Σk-1kδpkWkj]]>得自輸出和隱藏層的誤差項(xiàng)通過(guò)調(diào)節(jié)它們相應(yīng)層的權(quán)重反傳通過(guò)網(wǎng)絡(luò)。權(quán)重調(diào)節(jié),或δ權(quán)重,可按下列公式計(jì)算。其中,△Wij為隱藏層中節(jié)點(diǎn)j與輸入層中節(jié)點(diǎn)i之間的權(quán)重的變化。η為學(xué)習(xí)速度,dpi為隱藏層節(jié)點(diǎn)j觀察p的誤差項(xiàng),opi為輸入層節(jié)點(diǎn)i觀察p的測(cè)得輸出,a是動(dòng)量,n和n-1分別為當(dāng)前和過(guò)去的迭代。整套p訓(xùn)練觀察在重復(fù)次數(shù)n超過(guò)p時(shí)要重復(fù)表示。相似的方法可用來(lái)調(diào)節(jié)連接節(jié)點(diǎn)的隱藏層與下一個(gè)隱藏層之間的以及末端隱藏層與輸出層之間的權(quán)重。訓(xùn)練前,所有權(quán)重均用隨機(jī)數(shù)值。神經(jīng)網(wǎng)絡(luò)算法是用來(lái)聯(lián)系隸屬函數(shù)與定義每一擴(kuò)增階段時(shí)間軌跡的。訓(xùn)練后,這個(gè)程序可用來(lái)非常精確地預(yù)測(cè)擴(kuò)增水平。比較預(yù)測(cè)的擴(kuò)增水平與實(shí)時(shí)監(jiān)控可幫助進(jìn)一步優(yōu)化反應(yīng)。B.D.Cobb和J.M.Clarkson(1994)的方法提供了評(píng)估各種反應(yīng)要素對(duì)反應(yīng)擴(kuò)增水平的影響的快捷方法。這可用于訓(xùn)練此法的神經(jīng)網(wǎng)絡(luò)部分。神經(jīng)網(wǎng)絡(luò)從反應(yīng)中獲得關(guān)鍵信息來(lái)預(yù)測(cè)擴(kuò)增水平。一個(gè)采用5,5,3,1格式、具有二個(gè)隱藏層的、五道輸入的網(wǎng)絡(luò)被用來(lái)從退火溫度、模板、引物、dNTP和Mg2+濃度等數(shù)據(jù)預(yù)測(cè)擴(kuò)增。利用表2條件進(jìn)行了27個(gè)訓(xùn)練反應(yīng)。表2用來(lái)訓(xùn)練一個(gè)含五個(gè)輸入節(jié)點(diǎn)、二個(gè)分別具有五個(gè)和三個(gè)節(jié)點(diǎn)的隱藏層和一個(gè)信號(hào)輸出層的四層神經(jīng)網(wǎng)絡(luò)的反應(yīng)條件/擴(kuò)增水平<tablesid="table2"num="002"><table>反應(yīng)溫度引物模板dNTPs(mM)Mg2+(mM)擴(kuò)增14510500.112245101000.222345101500.33544520500.235545201000.310645201500.12074530500.320845301000.130945301500.210105010500.1121150101000.2231250101500.334135020500.2311450201000.3131550201500.124165030500.3251750301000.1341850301500.213195510500.1102055101000.2212155101500.335225520500.2352355201000.3102455201500.122255530500.3202655301000.1332755301500.210</table></tables>從每個(gè)反應(yīng)獲得的擴(kuò)增量按0到5打分。這些數(shù)據(jù)被用來(lái)通過(guò)反傳和S形轉(zhuǎn)換函數(shù)訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò)。當(dāng)然,這一過(guò)程并不局限于采用這些轉(zhuǎn)換函數(shù)和學(xué)習(xí)算法。圖9-15顯示訓(xùn)練過(guò)程中神經(jīng)網(wǎng)絡(luò)的輸出以及每次輸入是怎樣相互關(guān)聯(lián)的。從這些數(shù)據(jù)可見(jiàn),反應(yīng)最適溫度顯然在50℃左右。表3-5介紹了網(wǎng)絡(luò)信息(注采用這些數(shù)據(jù)時(shí),遺傳算法可用來(lái)試驗(yàn)許多輸入信號(hào)并選擇最大輸出,從而定義反應(yīng)最適值。)表3網(wǎng)絡(luò)訓(xùn)練信息網(wǎng)絡(luò)名稱無(wú)名稱層數(shù)4輸入層布5轉(zhuǎn)換函數(shù)線性隱藏層1節(jié)點(diǎn)5轉(zhuǎn)換函數(shù)S型隱藏層2節(jié)點(diǎn)3轉(zhuǎn)換函數(shù)S型輸出層節(jié)點(diǎn)1轉(zhuǎn)換函數(shù)S型連接完全訓(xùn)練信息重復(fù)775訓(xùn)練誤差0.002895學(xué)習(xí)速率0.111424動(dòng)量因素0.800000快速擴(kuò)增系數(shù)0.000000輸入節(jié)點(diǎn)C/qnet97t/samples/PCRInput.txt輸入起始柱1標(biāo)傳輸入是輸出節(jié)點(diǎn)C/輸出起始柱1標(biāo)準(zhǔn)輸出是訓(xùn)練模型27測(cè)試模型0表4一個(gè)四層神經(jīng)網(wǎng)絡(luò)PCR擴(kuò)增訓(xùn)練目標(biāo)和預(yù)測(cè)輸出表5網(wǎng)絡(luò)權(quán)重及調(diào)整增量網(wǎng)絡(luò)權(quán)重和調(diào)整增量網(wǎng)絡(luò)名稱無(wú)名稱重復(fù)10000應(yīng)用目前,PCR技術(shù)面臨的主要挑戰(zhàn)是發(fā)展能夠控制溫度循環(huán)軌跡優(yōu)化擴(kuò)增水平的“智能”儀器。這需要大量技術(shù)注入以定義循環(huán)條件。最佳值的發(fā)現(xiàn)需要通過(guò)反復(fù)的試驗(yàn)-失敗實(shí)驗(yàn)。從實(shí)驗(yàn)室時(shí)間、操作者時(shí)間和物質(zhì)消耗考慮,這是昂貴的。最適條件常找不到。而使用次最適條件時(shí),難以解釋和分析擴(kuò)增結(jié)果。這里介紹的方法可用來(lái)通過(guò)對(duì)循環(huán)條件的智能控制優(yōu)化熱循環(huán)條件。它利用這樣一個(gè)事實(shí),即變性、退火和延伸不局限于固定的溫度,而發(fā)生于循環(huán)中的一個(gè)溫度范圍內(nèi)。建立這些事件的全循環(huán)的模型使每個(gè)事件的時(shí)間得以優(yōu)化。作為優(yōu)化的結(jié)果,錯(cuò)誤引發(fā)、失活和脫嘌呤事件也因減少了接觸促進(jìn)這些事件的條件而減少。這一方法可以通過(guò)考慮加熱塊與樣品溫度之差而進(jìn)一步改善。這兩者之間有明顯滯后。這種滯后對(duì)擴(kuò)增水平有很大影響。用反應(yīng)混合物的細(xì)節(jié)(如Mg2+濃度,dNTPs,引物序列,模板數(shù)據(jù)等)建立隸屬函數(shù)。用反應(yīng)數(shù)據(jù)和預(yù)測(cè)模板大小建立反應(yīng)模型、確定擴(kuò)增水平。用遺傳算法優(yōu)化循環(huán)的時(shí)間形態(tài)。這就不需要操作者編程,提供了程序標(biāo)準(zhǔn)化的框架。將擴(kuò)增的在線監(jiān)控與本法相結(jié)合,可以實(shí)時(shí)、動(dòng)態(tài)地維持最適擴(kuò)增條件。這在診斷方面特別有用。在診斷應(yīng)用上,保證擴(kuò)增的有效是質(zhì)量控制的關(guān)鍵因素。比較預(yù)期的和實(shí)際的擴(kuò)增可以確定反應(yīng)在哪里出現(xiàn)問(wèn)題。這些信息可用來(lái)更新循環(huán)條件以維持最適擴(kuò)增或提醒使用者擴(kuò)增出了問(wèn)題。對(duì)于NAA技術(shù)未來(lái)的挑戰(zhàn)包括將這項(xiàng)技術(shù)從醫(yī)院實(shí)驗(yàn)室的分析者下放,從而實(shí)現(xiàn)實(shí)地應(yīng)用(例如,在地方衛(wèi)生診所應(yīng)用)。醫(yī)院實(shí)驗(yàn)室由于實(shí)驗(yàn)室空間以及雇傭技術(shù)人員而有較高的附加開(kāi)銷。上述技術(shù)下放有很多問(wèn)題。不良操作條件、樣品制備上的差別、操作者的失誤均會(huì)影響擴(kuò)增及數(shù)據(jù)解釋。對(duì)能補(bǔ)償操作環(huán)境變化的穩(wěn)定的擴(kuò)增條件和質(zhì)控程序的需要將使基于PCR的診斷更快地被接受。作為一種定性試驗(yàn),重要的性能特點(diǎn)應(yīng)被了解,并針對(duì)每一應(yīng)用進(jìn)行確定。樣品類型和診所條件會(huì)影響NAA試驗(yàn)結(jié)果的解釋。由于臨床樣品中存在抑制劑,操作環(huán)境的改變或操作者的錯(cuò)誤,經(jīng)常出現(xiàn)假陰性的PCR結(jié)果。假陽(yáng)性結(jié)果可能由于試劑被靶序列污染而出現(xiàn)。靈敏度設(shè)置(例如,對(duì)基因拷貝數(shù)、退火溫度的靈敏度)和在設(shè)置的靈敏度附近重復(fù)性差的區(qū)域可根據(jù)PCR性能特點(diǎn)弄確切。這些特點(diǎn)以及樣品類型和測(cè)試的臨床目的為考慮質(zhì)控提供了框架。本申請(qǐng)?zhí)峁┝司S持最適擴(kuò)增、迅速確定決定特定擴(kuò)增臨界值的因素的基礎(chǔ)。采用我們的方法優(yōu)化的反應(yīng)本身具有較好的可靠性。因此,這個(gè)過(guò)程可用作標(biāo)準(zhǔn)優(yōu)化程序的基礎(chǔ)。對(duì)于諸如循環(huán)儀器性能變化等變量的可靠性會(huì)增加特異性和靈敏度。此外,從本程序中得到的大量信息為實(shí)現(xiàn)反應(yīng)表現(xiàn)的嚴(yán)格質(zhì)控提供了基礎(chǔ)。從有限數(shù)量的反應(yīng)中即可獲得關(guān)于熱循環(huán)器運(yùn)行表現(xiàn)、反應(yīng)混合物中必需成分、操作環(huán)境和提供測(cè)試核酸材料的量的變化的重要信息。重要的一點(diǎn)是,首選方法提供了一種“內(nèi)置”在不同條件下操作的能力的方法。這種方法還通過(guò)連續(xù)監(jiān)控分析程序的表現(xiàn)反饋優(yōu)化隨后的分析。本申請(qǐng)對(duì)其享有優(yōu)先權(quán)的英國(guó)專利申請(qǐng)第9720926.6號(hào)中公布的內(nèi)容以及伴隨本申請(qǐng)的摘要中公布的內(nèi)容作為參考納入本文。權(quán)利要求1.一種通過(guò)變性、退火和延伸事件建立錄屬關(guān)系數(shù)值的優(yōu)化用于控制聚合酶鏈反應(yīng)的方法,用以確定反應(yīng)中每一事件的相對(duì)基值,和用遺傳示方法,確定完成每一事件所需最適時(shí)間。2.依據(jù)權(quán)利要求1的一種方法,其中,變性、退火和延伸的相對(duì)基值通過(guò)給出隸屬關(guān)系數(shù)值算出。3.依據(jù)權(quán)利要求2的一種方法。其中,隸屬關(guān)系數(shù)值被用來(lái)確定在特定時(shí)間或通過(guò)一系列時(shí)間點(diǎn)變性、退火和延伸的相對(duì)量。4.依據(jù)權(quán)利要求1的一種方法,其中,遺傳算法被用來(lái)確定變性、退火和延伸的最適時(shí)間。5.依據(jù)權(quán)利要求1的一種方法,其中,所述方法被用來(lái)使PCR程序標(biāo)準(zhǔn)化或用來(lái)優(yōu)化PCR程序。6.依據(jù)權(quán)利要求1的一種方法,其中,所述方法被用來(lái)將一個(gè)熱循環(huán)器的程序轉(zhuǎn)移至另一個(gè)熱循環(huán)器。首先,考慮源循環(huán)器的熱性能,計(jì)算變性、退火和延伸的相對(duì)基值。然后,在考慮兩個(gè)循環(huán)器性能上的差異的情況下,將它們轉(zhuǎn)移到靶循環(huán)器上。7.依據(jù)權(quán)利要求1的一種方法,其中,采用在線監(jiān)控以提供可用來(lái)對(duì)計(jì)算得出的循環(huán)時(shí)間進(jìn)行調(diào)整的反應(yīng)表現(xiàn)的反饋信息。8.依據(jù)任一前述權(quán)利要求的一個(gè)方法。其中,一個(gè)神經(jīng)網(wǎng)絡(luò)被用來(lái)獲得最適循環(huán)條件的信息。9.依據(jù)任一前述權(quán)利要求的一個(gè)方法。其中,神經(jīng)網(wǎng)絡(luò)被用來(lái)計(jì)算、確認(rèn)或修改擴(kuò)增的計(jì)算水平。10.一種將神經(jīng)網(wǎng)絡(luò)用來(lái)根據(jù)一套給定反應(yīng)標(biāo)準(zhǔn)預(yù)測(cè)擴(kuò)增水平的方法。11.依據(jù)權(quán)利要求10的一種方法,其中,給予神經(jīng)網(wǎng)絡(luò)的訓(xùn)練輸入為正交陣列,而輸出代表從一個(gè)相關(guān)PCR得到的擴(kuò)增水平。12.根據(jù)權(quán)利要求11的一種方法,其中,正交陣列被用來(lái)減少給予神經(jīng)網(wǎng)絡(luò)的訓(xùn)練輸入的數(shù)目。13.根據(jù)任一前述要求的方法,其中,確定的特性是靈敏性設(shè)置。14.根據(jù)任一前述要求的方法,其中,確定的特性是在設(shè)置的靈敏度附近可重復(fù)的區(qū)域。15.根據(jù)任一前述的方法,其中本方法通過(guò)確定預(yù)測(cè)擴(kuò)增水平的偏差被用作質(zhì)量控制程度。16.一個(gè)優(yōu)化用于控制聚合酶鏈反應(yīng)的循環(huán)條件的系統(tǒng),包括用于建立變性、退火和延伸事件隸屬關(guān)系數(shù)值的處理方法,在反應(yīng)中,確定每個(gè)事件的相對(duì)基值;利用遺傳算法確定完成每一事件所需最適時(shí)間的處理方法。全文摘要一個(gè)通過(guò)給出變性、退火和延伸事件的隸屬關(guān)系數(shù)值以確定反應(yīng)中每個(gè)事件的相對(duì)基值并利用遺傳算法確定完成每一事件所需最適時(shí)間來(lái)優(yōu)化用于控制聚合酶鏈反應(yīng)的循環(huán)條件的系統(tǒng)。文檔編號(hào)G06N3/00GK1279792SQ9881153公開(kāi)日2001年1月10日申請(qǐng)日期1998年10月5日優(yōu)先權(quán)日1997年10月3日發(fā)明者約翰·邁克爾·克拉克森,本杰明·戴維·科布申請(qǐng)人:分子感應(yīng)器有限公司