專利名稱:利用雙s形函數(shù)曲線擬合和levenberg-marquardt算法及標準化的pcr肘確定的制作方法
技術領域:
本發(fā)明一般地涉及用于處理表示S形曲線或生長曲線的數(shù)據(jù)的系統(tǒng)和方法,并且更具體地涉及用于確定PCR擴增曲線中的特征周期閾值(Ct)或肘值(elbow value)的系統(tǒng)和方法。
背景技術:
聚合酶鏈反應(PCR)是一種用于酶合成或擴增限定的核酸序列的離體方法。該反應典型地利用兩種寡核苷酸引物,這兩種寡核苷酸引物雜交成相對股并且位于模板或要被擴增的目標DNA序列的側面。通過熱穩(wěn)定DNA聚合酶來催化這些引物的延伸。包括由聚合酶引起的模板變性、引物退火和退火引物的延伸的一系列重復周期導致特定DNA片斷的指數(shù)累積。熒光探針或標記典型地被用于促進擴增過程的檢測和量化的方法中。
在圖1中示出了典型的實時PCR曲線,其中針對典型的PCR過程畫出了熒光強度值對周期數(shù)。在這種情況下,在PCR過程的每一周期中監(jiān)控PCR產(chǎn)物的形成。通常在溫度循環(huán)器中測量擴增,該溫度循環(huán)器包括用于在擴增反應過程中測量熒光信號的部件和裝置。這種溫度循環(huán)器的例子是Roche Diagnostics LightCycler(Cat.No.20110468)。借助熒光標記的雜交探針來例如檢測擴增產(chǎn)物,該熒光標記的雜交探針僅僅在它們被結合到目標核酸上時才發(fā)射熒光信號,或者在某些情況下也借助結合到雙股DNA上的熒光染料來例如檢測擴增產(chǎn)物。
對于典型的PCR曲線來說,識別在基線區(qū)域末端處的通常被稱為肘值或周期閾值(Ct)的過渡點極其有助于理解PCR擴增過程的特征。該Ct值可被用作PCR過程的效率的量度。例如,針對要被分析的所有反應確定所規(guī)定的信號閾值,并且針對目標核酸以及針對例如標準或看家(housekeeping)基因的參考核酸確定用于達到該閾值所需的周期數(shù)(Ct)。基于針對目標核酸和參考核酸所獲得的Ct值,可以確定目標分子的絕對或相對拷貝數(shù)(Gibson等人的Genome Research 6995-1001;Bieche等人的Cancer Research 592759-2765,1999年;WO97/46707;WO97/46712;WO97/46714)。圖1中的在基線區(qū)域15的末端處的肘值(20)將在周期數(shù)30的區(qū)域中。
可以利用幾種現(xiàn)有方法來確定PCR曲線中的肘值。例如,各種當前方法將實際的肘值(Ct)確定為這樣的值,在該值的情況下熒光達到被稱為AFL(任意熒光值)的預定水平。其它當前方法可以利用周期數(shù),其中熒光對周期數(shù)的二階導數(shù)達到最大值。所有這些方法都具有嚴重的缺點。例如,一些方法對異常(有噪聲的)數(shù)據(jù)敏感,并且AFL值方法對具有高基線的數(shù)據(jù)集不適用。特別是在高滴定量的情況下,用于確定圖1中所示的生長曲線的基線停止(或基線的終點)的傳統(tǒng)方法不能令人滿意地工作。此外,這些算法典型地具有被拙劣地定義的、線性相關的并且(如果可能)常常非常難以優(yōu)化的多個(例如50或更多)參數(shù)。
因此,期望提供用于確定曲線、例如S形曲線或生長曲線、以及尤其是PCR曲線中的肘值的系統(tǒng)和方法,該系統(tǒng)和方法克服上述的和其它的缺點。
發(fā)明內(nèi)容
本發(fā)明提供用于確定S形或生長型曲線中的例如肘值的特征過渡值的、新穎的、有效的系統(tǒng)和方法。在一種實施方案中,本發(fā)明的系統(tǒng)和方法特別有助于確定PCR擴增曲線中的周期閾值(Ct)。
根據(jù)本發(fā)明,具有通過Levenberg-Marquardt(LM)回歸方法所確定的參數(shù)的雙S形函數(shù)被用于找到擬合PCR數(shù)據(jù)集的曲線的近似。一旦已經(jīng)確定了參數(shù),就可以利用一個或多個所確定的參數(shù)來使曲線標準化。如果選擇用于計算擴增曲線的Ct值的任意熒光水平(AFI)方法,則標準化對于確定Ct值來說是有利的。在標準化之后,通過應用求根算法以確定表示標準化曲線的函數(shù)的根來處理該標準化曲線,其中所述根對應于Ct值。該Ct值然后被返回并可以被顯示或另外被用于進一步的處理。
在本發(fā)明的第一方面中,提供一種計算機實現(xiàn)的、確定生長曲線的基線區(qū)域的末端處的點的方法,該方法包括以下步驟-接收表示生長曲線的數(shù)據(jù)集,所述數(shù)據(jù)集包括多個數(shù)據(jù)點,每一個數(shù)據(jù)點都具有一對坐標值;-通過將Levenberg-Marquardt(LM)回歸方法應用于雙S形函數(shù)以確定該函數(shù)的參數(shù)來計算擬合數(shù)據(jù)集的曲線的近似;-利用所確定的參數(shù)使該曲線標準化,以生成標準化曲線;以及-處理該標準化曲線,以確定生長曲線的基線區(qū)域的末端處的點的坐標值。
在本發(fā)明的第二方面中,提供一種計算機可讀介質(zhì),該計算機可讀介質(zhì)包括用于控制處理器以確定生長曲線的基線區(qū)域的末端處的點的代碼,其中該代碼包括指令,所述指令用于-接收表示生長曲線的數(shù)據(jù)集,所述數(shù)據(jù)集包括多個數(shù)據(jù)點,每一個數(shù)據(jù)點都具有一對坐標值;-通過將Levenberg-Marquardt(LM)回歸方法應用于雙S形函數(shù)以確定該函數(shù)的參數(shù)來計算擬合數(shù)據(jù)集的曲線的近似;-利用所確定的參數(shù)使該曲線標準化,以生成標準化曲線;以及-處理該標準化曲線,以確定生長曲線的基線區(qū)域的末端處的點的坐標值。
在本發(fā)明的又一方面中,提供一種動態(tài)聚合酶鏈反應(PCR)系統(tǒng),該系統(tǒng)包括-動態(tài)聚合酶鏈反應分析模塊,該動態(tài)聚合酶鏈反應分析模塊產(chǎn)生表示動態(tài)聚合酶鏈反應擴增曲線的聚合酶鏈反應數(shù)據(jù)集,所述數(shù)據(jù)集包括多個數(shù)據(jù)點,每一個數(shù)據(jù)點都具有一對坐標值,其中所述數(shù)據(jù)集包括感興趣區(qū)域中的數(shù)據(jù)點,該感興趣區(qū)域包括周期閾值(Ct);以及-智能模塊,該智能模塊適于通過以下方式來處理聚合酶鏈反應數(shù)據(jù)集以確定周期閾值-通過將Levenberg-Marquardt(LM)回歸方法應用于雙S形函數(shù)以確定該函數(shù)的參數(shù)來計算擬合數(shù)據(jù)集的曲線的近似;-利用所確定的參數(shù)來使該曲線標準化,以生成標準化曲線;以及-處理該標準化曲線,以確定生長曲線的基線區(qū)域的末端處的點的坐標值,其中所述點表示生長曲線的周期閾值(Ct)。
圖1示出被繪制為熒光強度對周期數(shù)的典型PCR生長曲線的例子;圖2示出用于確定生長曲線的基線區(qū)域的終點或PCR曲線的Ct值的方法流程;圖3示出根據(jù)本發(fā)明的一個實施例的峰值識別和替換方法的詳細方法流程;圖4示出包括參數(shù)a-g的雙S形方程的分解;圖5示出參數(shù)(d)對曲線和(e)的位置、拐點的x值的影響;圖6示出針對不同參數(shù)集的三個曲線形狀的例子;圖7示出根據(jù)一個方面的用于確定雙S形方程參數(shù)(e)和(g)的值的方法;圖8示出用于初始參數(shù)集的Levenberg-Marquardt回歸方法的方法流程;圖9示出根據(jù)一個實施例的用于確定PCR過程的肘值的更詳細的方法流程;圖10示出PCR數(shù)據(jù)集的圖;圖11示出在利用方程(7)的基線減去和除法方法標準化之后圖10的數(shù)據(jù)集;圖12示出另一PCR數(shù)據(jù)集的圖;圖13示出在利用方程(7)的基線減去和除法方法標準化之后圖12的數(shù)據(jù)集;圖14示出描述軟件和硬件資源之間的關系的一般框圖。
具體實施例方式
本發(fā)明提供用于確定S形或生長曲線中的過渡值、例如基線區(qū)域的終點或動態(tài)PCR擴增曲線的肘值或Ct值的系統(tǒng)和方法。在某些方面中,具有通過Levenberg-Marquardt(LM)回歸方法確定的參數(shù)的雙S形函數(shù)被用于找到曲線的近似。一旦已經(jīng)確定參數(shù),利用一個或多個所確定的參數(shù)可以使該曲線標準化。如果選擇任意熒光水平(AFI)方法來計算擴增曲線的Ct值,則標準化對于確定Ct值來說是有利的。在標準化之后,通過應用用于確定表示標準化曲線的函數(shù)的根的求根(root-finding)算法來處理標準化曲線,其中所述根對應于Ct值。該Ct值然后被返回并可被顯示或另外被用于進一步的處理。
在圖1中示出了在PCR過程的上下文中的擴增曲線10的一個例子。如所示的那樣,曲線10包括停滯期區(qū)域15和指數(shù)生長期區(qū)域25。停滯期區(qū)域15一般被稱作基線或基線區(qū)域。這種曲線10包括連接停滯期和指數(shù)生長期區(qū)域的感興趣的過渡區(qū)域20。區(qū)域20一般被稱作肘或肘區(qū)域。肘區(qū)域20典型地限定基線的終點和基本過程的生長或擴增率的過渡。識別區(qū)域20中的特定過渡點可以有助于分析基本過程的特性。在典型的PCR曲線中,識別被稱為肘值或周期閾值(Ct)的過渡點極其有助于理解PCR過程的效率特性。
可以提供類似的S形曲線或生長曲線的其它方法包括細菌法、酶法和結合法。在細菌生長曲線中,例如,感興趣的過渡點已被稱作停滯期中的時間θ。產(chǎn)生可根據(jù)本發(fā)明來分析的數(shù)據(jù)曲線的其它特定方法包括鏈置換擴增(SDA)方法、基于核酸序列的擴增(NASBA)方法和轉錄介導的擴增(TMA)方法。可以分別在Wang,Sha-Sha等人的“Homogeneous Real-Time Detection of Single-NucleotidePolymorphisms by Strand Displacement Amplification on the BDProbeTec ET System”(Clin Chem 200349(10)1599)和Weusten,JosJ.A.M.等人的“Principles of Quantitation of Viral Loads UsingNucleic Acid Sequence-Based Amplification in Combination WithHomogeneous Detection Using Molecular Beacons”(Nucleic AcidsResearch,2002 30(6)26)中找到SDA和NASBA方法和數(shù)據(jù)曲線的例子。因此,盡管本文的剩余部分將在本發(fā)明對PCR曲線的適用性方面來討論本發(fā)明的實施例和方面,但應理解的是,本發(fā)明可以被應用于涉及其它方法的數(shù)據(jù)曲線。
如圖1中所示,例如可在二維坐標系統(tǒng)中表示典型的PCR生長曲線的數(shù)據(jù),其中PCR周期數(shù)定義x軸并且累積的多核苷酸生長的指示器定義y軸。典型地,如圖1中所示,累積生長的指示器是熒光強度值,因為熒光標記的使用可能是最廣泛使用的標記方案。然而,應理解的是,可以根據(jù)所使用的具體標記和/或檢測方案使用其它指示器。累積信號生長的其它有用的指示器的例子包括發(fā)光強度、化學發(fā)光強度、生物發(fā)光強度、磷光強度、電荷轉移、電壓、電流、功率、能量、溫度、粘性、光散射、放射性強度、反射率、透射率和吸收率。周期的定義也可以包括時間、方法周期、單元操作周期和再生周期。
一般方法概述根據(jù)本發(fā)明,可以參照圖2簡要地描述用于確定單個S形曲線中的過渡值、例如動態(tài)PCR擴增曲線的肘值或Ct值的方法100的一個實施例。在步驟110中,接收或另外獲取表示曲線的實驗數(shù)據(jù)集。在圖1中示出了所繪制的PCR數(shù)據(jù)集的例子,其中對于PCR曲線來說y軸和x軸分別表示熒光強度和周期數(shù)。在某些方面中,數(shù)據(jù)集應包括連續(xù)的并且沿著軸等間隔的數(shù)據(jù)。
在本發(fā)明的示范性實施例中,可以通過利用傳統(tǒng)的個人計算機系統(tǒng)來實施該方法,該個人計算機系統(tǒng)包括、但不限于用于輸入數(shù)據(jù)集的例如鍵盤、鼠標等的輸入裝置;用于表示曲線區(qū)域中的感興趣的特定點的顯示裝置、例如監(jiān)控器;對于執(zhí)行該方法中的每一步驟來說必要的處理裝置、例如CPU;例如調(diào)制解調(diào)器的網(wǎng)絡接口;用于存儲數(shù)據(jù)集、在處理器上運行的計算機代碼等的數(shù)據(jù)存儲裝置。此外,也可以在PCR裝置中實施該方法。
在圖14中顯示了根據(jù)本發(fā)明的系統(tǒng)。該圖示出說明軟件和硬件資源之間的關系的一般框圖。該系統(tǒng)包括可以位于溫度循環(huán)器裝置中的動態(tài)PCR分析模塊和是計算機系統(tǒng)的一部分的智能模塊。經(jīng)由網(wǎng)絡連接或直接連接將數(shù)據(jù)集(PCR數(shù)據(jù)集)從分析模塊傳輸至智能模塊,或反之亦然。由在處理器上運行的并存儲于智能模塊的存儲裝置上的計算機代碼根據(jù)如圖2中所示的方法來處理數(shù)據(jù)集,并在處理之后,將數(shù)據(jù)集傳輸回分析模塊的存儲裝置,其中可以在顯示裝置上顯示所修改的數(shù)據(jù)。在具體實施例中,也可以在PCR數(shù)據(jù)獲取裝置中實現(xiàn)智能模塊。
在方法100在駐留于例如溫度循環(huán)器的PCR數(shù)據(jù)獲取裝置中的智能模塊(例如執(zhí)行指令的處理器)中實施的情況下,在數(shù)據(jù)正被收集時數(shù)據(jù)集可以被實時地提供給智能模塊,或者數(shù)據(jù)集可以被存儲于存儲單元或緩沖器中,并在已經(jīng)完成實驗之后被提供給智能模塊。類似地,數(shù)據(jù)集可以經(jīng)由通向獲取裝置的網(wǎng)絡連接(例如LAN、VPN、內(nèi)部網(wǎng)、因特網(wǎng)等)或直接連接(例如USB或其它直接有線或無線連接)被提供給單獨的系統(tǒng)、例如桌上計算機系統(tǒng)或其它計算機系統(tǒng),或在例如CD、DVD、軟盤等的便攜式介質(zhì)上被提供。在某些方面中,數(shù)據(jù)集包括具有一對坐標值(或二維矢量)的數(shù)據(jù)點。對于PCR數(shù)據(jù)來說,該對坐標值典型地表示周期數(shù)和熒光強度值。在已經(jīng)在步驟110中接收或獲取數(shù)據(jù)集之后,可以分析該數(shù)據(jù)集以確定基線區(qū)域的終點。
在步驟120中,計算曲線的近似。在該步驟的過程中,在一個實施例中,具有通過Levenberg-Marquardt(LM)回歸方法或其它回歸方法所確定的參數(shù)的雙S形函數(shù)被用于找到表示數(shù)據(jù)集的曲線的近似。該近似據(jù)說是“穩(wěn)健的”,因為異常數(shù)據(jù)或峰值點對曲線擬合的質(zhì)量具有最小的影響。圖2示出所接收的數(shù)據(jù)集和通過根據(jù)本發(fā)明將Levenberg-Marquardt回歸方法用于確定雙S形函數(shù)的參數(shù)所確定的數(shù)據(jù)集的穩(wěn)健近似的圖。
在某些方面中,在處理數(shù)據(jù)集以便確定基線區(qū)域的終點之前去除或替換數(shù)據(jù)集中的異常數(shù)據(jù)或峰值點。在數(shù)據(jù)集在步驟110中被獲取之前或之后可以發(fā)生峰值去除。圖3示出用于識別并替換表示PCR或其它生長曲線的數(shù)據(jù)集中的峰值點的方法流程。
在步驟130中,在步驟120中所確定的參數(shù)被用于使曲線標準化,如將在下面更詳細地描述的那樣。以該方式進行的標準化允許在不必確定或指定曲線的基線區(qū)域的終點或基線停止位置的情況下確定Ct值。在步驟140中,然后處理標準化曲線以確定Ct值,如將在下面更詳細地描述的那樣。
LM回歸方法圖3的步驟502至524也示出用于近似數(shù)據(jù)集的曲線并確定擬合函數(shù)的參數(shù)(步驟120)的方法流程。根據(jù)本發(fā)明的一個實施例,這些參數(shù)可以被用于使曲線標準化、例如修改或去除表示S形或生長型曲線、例如PCR曲線的數(shù)據(jù)集的基線斜率(步驟130)。在已經(jīng)處理了數(shù)據(jù)集以產(chǎn)生具有被去除或被替換的峰值點的、修改后的數(shù)據(jù)集的情況下,可以根據(jù)步驟502至524來處理修改后的無峰值的數(shù)據(jù)集,以確定擬合函數(shù)的參數(shù)。
在所示出的一個實施例中,Levenberg-Marquardt(LM)方法被用于計算數(shù)據(jù)集的穩(wěn)健的曲線近似。該LM方法是非線性回歸方法;它是一種使非線性函數(shù)和數(shù)據(jù)集之間的距離最小化的迭代技術。該方法的作用就像最陡下降方法和Gauss-Newton方法的組合一樣在當前近似并不很好地擬合時,它的作用就像最陡下降方法一樣(更慢,但更可靠地收斂),但在當前近似變得更精確時,于是它的作用將像Gauss-Newtom方法一樣(更快,但不太可靠地收斂)。該LM回歸方法被廣泛地用于解決非線性回歸問題。
一般,該LM回歸方法包括需要各種輸入并提供輸出的算法。在一個方面中,該輸入包括要處理的數(shù)據(jù)集、被用于擬合數(shù)據(jù)的函數(shù)以及函數(shù)的參數(shù)或變量的初始猜測。該輸出包括用于使函數(shù)和數(shù)據(jù)集之間的距離最小化的函數(shù)的參數(shù)集。
根據(jù)一個實施例,擬合函數(shù)是以下形式的雙S形f(x)=a+bx+c(1+exp-d(x-e))(1+exp-f(x-g)).---(1)]]>作為擬合函數(shù)的該方程的選擇基于其擬合典型的PCR曲線或其它生長曲線可能采用的不同曲線形狀的靈活性和能力。本領域的技術人員應理解,可以隨意地使用上面的擬合函數(shù)或其它擬合函數(shù)的變型。
雙S形方程(1)具有7個參數(shù)a、b、c、d、e、f和g。該方程可被分解為常數(shù)、斜率和雙S形的和。雙S形自身是兩個S形的相乘。圖4示出雙S形方程(1)的分解。參數(shù)d、e、f和g決定兩個S形的形狀。為了示出它們對最終曲線的影響,考慮單個S形11+exp-d(x-e),---(2)]]>其中參數(shù)d決定曲線的“銳度”,并且參數(shù)e決定拐點的x值。圖5示出參數(shù)d對曲線的影響以及參數(shù)e對拐點的x值的位置的影響。在下面,表1描述參數(shù)對雙S形曲線的影響。
表1雙S形參數(shù)描述
在一個方面中,為了防止曲線采用不切實際的形狀,應限制雙S形方程的“銳度”參數(shù)d和f。因此,在一個方面中,d<-1或d>1.1或f<-1或f>1.1的任何迭代都被認為是不成功的。在其它方面中,可以使用對參數(shù)d和f的不同限制。
因為Levenberg-Marquardt算法是迭代算法,所以典型地需要用于擬合的函數(shù)的參數(shù)的初始猜測。初始猜測越好,近似將越好,并且算法將向局部最小值收斂就越不可能。由于雙S形函數(shù)的復雜性和PCR曲線或其它生長曲線的各種形狀,所以對每一參數(shù)的一次初始猜測可能不足以防止算法有時向局部最小值收斂。因此,在一個方面中,輸入多個(例如3個或更多個)初始參數(shù)集并保存最佳結果。在一個方面中,大部分參數(shù)被保持為在所使用的多個參數(shù)集上恒定;僅僅參數(shù)c、d和f可以對于多個參數(shù)集中的每一個來說是不同的。圖6示出針對不同參數(shù)集的三個曲線形狀的例子。這三個參數(shù)集的選擇指示表示PCR數(shù)據(jù)的曲線的三種可能的不同形狀。應理解的是,可以處理多于三個的參數(shù)集并保存最佳結果。
如圖3中所示,在步驟510中確定LM方法的初始輸入?yún)?shù)。這些參數(shù)可以通過操作者輸入或可以被計算。根據(jù)一個方面,根據(jù)如下面所論述的步驟502、504和506確定或設置參數(shù)。
初始參數(shù)(a)的計算參數(shù)(a)是基線的高度;它的值對于所有初始參數(shù)集來說是相同的。在一個方面中,在步驟504中,參數(shù)(a)被賦予數(shù)據(jù)集中的第三個最低y軸值、例如熒光值。這提供穩(wěn)健的計算。當然,在其它方面中,參數(shù)(a)可被隨意地賦予任何其它熒光值、例如最低y軸值、第二最低值等等。
初始參數(shù)(b)的計算參數(shù)(b)是基線和曲線的平穩(wěn)段的斜率。它的值對于所有初始參數(shù)集來說是相同的。在一個方面中,在步驟502中,將0.01的靜態(tài)值賦予(b),因為理想地不應存在任何斜率。在其它方面中,參數(shù)(b)可被賦予不同值,例如范圍從0至大約0.5的值。
初始參數(shù)(c)的計算參數(shù)(c)表示曲線的絕對強度;對于PCR數(shù)據(jù)來說,參數(shù)(c)典型地表示曲線的AFI。為了計算AFI,曲線的平穩(wěn)段的高度是重要的。為了以穩(wěn)健的方式計算該AFI,在一個方面中,在步驟504中,第三個最高y軸值、例如熒光值被賦予為曲線的平穩(wěn)段的高度。然后,AFI=曲線的平穩(wěn)段的高度-基線的高度=第三個最高熒光值-(a)。在其它方面中,參數(shù)(c)可被隨意地賦予任何其它熒光值、例如最高y軸值、下一最高y軸值等。
如圖6中所示,對于最后兩個參數(shù)集來說,c=AFI。對于第一個參數(shù)集來說,c=AFI+2。該改變是由于通過第一個參數(shù)集所建模的曲線的形狀,該形狀不具有曲線的平穩(wěn)段。
參數(shù)(d)和(f)的計算參數(shù)(d)和(f)限定兩個S形的銳度。因為不存在針對這些參數(shù)基于曲線來給出近似的方法,所以在一個方面中在步驟502中使用三個靜態(tài)代表值。應理解的是,其它靜態(tài)或非靜態(tài)值可被用于參數(shù)(d)和/或(f)。這些對對所遇到的PCR曲線的最普遍的形狀建模。在下面,表2示出針對如圖6中所示的不同參數(shù)集的(d)和(f)的值。
表2參數(shù)d和f的值
參數(shù)(e)和(g)的計算在步驟506中,確定參數(shù)(e)和(g)。參數(shù)(e)和(g)限定兩個S形的拐點。在一個方面中,它們在所有初始參數(shù)集中都采用相同的值。參數(shù)(e)和(g)可以具有相同或不同的值。為了找到近似,在一個方面中,使用超過強度、例如熒光的平均值的第一點(其不是峰值)的x值。根據(jù)該方面的用于確定(e)和(g)的值的方法在圖7中被示出并在下面進行論述。
參照圖7,最初,確定曲線(例如熒光強度)的平均值。接著確定超過平均值的第一數(shù)據(jù)點。然后確定是否a.該點不位于曲線的起點附近、例如在最初的5個周期內(nèi);b.該點不位于曲線的終點附近、例如在最后的5個周期內(nèi);以及c.該點周圍的導數(shù)(例如在它周圍的2個點的半徑中)沒有顯示出符號的任何改變。如果它們顯示出符號的任何改變,則該點可能是峰值并且因此應被丟棄。
在下面,表3示出根據(jù)一個方面的如圖6中所使用的初始參數(shù)值的例子。
表3初始參數(shù)值
返回圖3,一旦在步驟510中設置了所有參數(shù),就利用輸入數(shù)據(jù)集、函數(shù)和參數(shù)執(zhí)行LM方法520。傳統(tǒng)上,Levenberg-Marquardt方法被用于解決非線性最小平方問題。傳統(tǒng)的LM方法計算被定義為曲線近似和數(shù)據(jù)集之間的誤差的平方和的距離量度。然而,當最小化該平方和時,它給予異常數(shù)據(jù)一個重要的權重,因為它們的距離大于非峰值數(shù)據(jù)點的距離,這常常導致不合宜的曲線或不太理想的曲線。因此,根據(jù)本發(fā)明的一個方面,通過最小化絕對誤差的和來計算近似和數(shù)據(jù)集之間的距離,因為這不給予異常數(shù)據(jù)同樣大的權重。在該方面中,通過下式來給出近似和數(shù)據(jù)之間的距離距離=∑|y數(shù)據(jù)-y近似|。 (3)如上所述,在一個方面中,如在步驟522和524中所示,輸入并處理多個(例如3個)初始參數(shù)集中的每一個并保存最佳結果,其中最佳參數(shù)是在方程(3)中提供最小或最小化距離的參數(shù)集。在一個方面中,大部分參數(shù)在多個參數(shù)集中被保持恒定;僅僅c、d和f可以對于每一個參數(shù)集來說是不同的。應理解的是,可以使用任何數(shù)量的初始參數(shù)集。
圖8示出根據(jù)本發(fā)明的用于參數(shù)集的LM方法520的方法流程。如上面所解釋的,Levenberg-Marquardt方法的作用可以就像最陡下降方法或像Gauss-Newton方法一樣。它的作用取決于衰減因數(shù)λ。λ越大,Levenberg-Marquardt算法的作用就將越像最陡下降方法一樣。另一方面,λ越小,Levenberg-Marquardt算法的作用就將越像Gauss-Newton方法一樣。在一個方面中,λ以0.001開始。應理解的是,λ可以以任何其它值開始,例如從大約0.000001至大約1.0。
如前所述,Levenberg-Marquardt方法是迭代技術。根據(jù)一個方面,如圖8中所示,在每一次迭代過程中執(zhí)行下面的操作1.計算在先的近似的Hessian矩陣(H)。
2.計算在先的近似的轉置Jacobian矩陣(JT)。
3.計算在先的近似的距離向量(d)。
4.使Hessian矩陣對角線增大當前衰減因數(shù)λHaug=Hλ (4)5.求解增大的方程Haugχ=JTd(5)6.將增大的方程的解x添加到函數(shù)的參數(shù)中。
7.計算新的近似和曲線之間的距離。
8.如果具有新的參數(shù)集的距離小于具有先前的參數(shù)集的距離●認為該迭代是成功的。
●保存或存儲該新的參數(shù)集。
●將衰減因數(shù)λ例如減小因數(shù)10。
如果具有新的參數(shù)集的距離大于具有先前的參數(shù)集的距離●認為該迭代是不成功的。
●丟棄該新的參數(shù)集。
●將衰減因數(shù)λ例如增大因數(shù)10。
在一個方面中,圖8的LM方法迭代,直至達到了下列標準之一1.已經(jīng)運行了規(guī)定次數(shù)的(N次)迭代。該第一標準防止算法無限地迭代下去。例如,在如圖10中所示的一個方面中,缺省迭代值N是100。如果算法能夠收斂,則100次迭代應足以使算法收斂。一般地,N的范圍可以從小于10至100或更大。
2.兩次成功迭代之間的距離的差值小于閾值、例如0.0001。當該差值變得非常小時,已經(jīng)達到所期望的精度并且繼續(xù)迭代是無意義的,因為解不會變得顯著更好。
3.衰減因數(shù)λ超過規(guī)定值,例如大于1020。當λ變得非常大時,該算法不會比當前解更好地收斂,因此繼續(xù)迭代是無意義的。一般地,該規(guī)定值可以大大小于或大于1020。
在已經(jīng)確定了參數(shù)之后,可以利用一個或者多個所確定的參數(shù)來使曲線標準化。例如,在一個方面中,曲線可以通過減去曲線的線性生長部分而被標準化或調(diào)節(jié)為具有零斜率。在數(shù)學上,這被表示為dataNew(BLS)=data-(a+bx), (6)其中dataNew(BLS)是在基線減去之后的標準化信號,例如被減去或被去除線性生長或基線斜率的數(shù)據(jù)集(數(shù)據(jù))。參數(shù)a和b的值是通過利用用于使曲線回歸的LM方程所確定的那些值,并且x是周期數(shù)。因此,對于沿著x軸的每一個數(shù)據(jù)值來說,從數(shù)據(jù)中減去常數(shù)a和斜率b乘以x值,以生成具有零斜率的數(shù)據(jù)曲線。在某些方面中,在對數(shù)據(jù)集應用LM回歸方法以確定標準化參數(shù)之前從數(shù)據(jù)集中去除峰值點。
在另一方面中,曲線可以根據(jù)下面的方程被標準化或被調(diào)節(jié)為具有零斜率dataNew(BLSD)=(data-(a+bx))/a, (7)其中dataNew(BLSD)是在基線減去和除法之后的標準化信號、例如被減去或被去除線性生長或基線斜率并且結果被a除的數(shù)據(jù)集(數(shù)據(jù))。參數(shù)a和b的值是通過利用用于使曲線回歸的LM方程所確定的那些值,并且x是周期數(shù)。因此,對于沿著x軸的每一個數(shù)據(jù)值來說,從數(shù)據(jù)中減去常數(shù)a和斜率b乘以x值并且用參數(shù)a的值來除該結果,以生成具有零斜率的數(shù)據(jù)曲線。在某些方面中,在對數(shù)據(jù)集應用LM回歸方法以確定標準化參數(shù)之前從數(shù)據(jù)集中去除峰值點。
在又一方面中,曲線可以根據(jù)下面的方程被標準化或被調(diào)節(jié)dataNew(BLD)=data/a, (8)其中da taNew(BLD)是在基線除法之后的標準化信號、例如被參數(shù)a除的數(shù)據(jù)集(數(shù)據(jù))。參數(shù)a和b的值是通過利用用于使曲線回歸的LM方程所確定的那些值,并且x是周期數(shù)。在某些方面中,在對數(shù)據(jù)集應用LM回歸方法以確定標準化參數(shù)之前從數(shù)據(jù)集中去除峰值點。
本領域的技術人員應理解,其它標準化方程可以被用于利用如通過Levenberg-Marquardt或其它回歸方法所確定的參數(shù)來標準化和/或修改基線。
在已經(jīng)利用方程(6)、(7)或(8)中的一個或其它標準化方程使曲線標準化之后,可以確定Ct值。在一個方面中,對標準化曲線應用求根過程或方法。求根過程、算法或方法是典型地通過迭代地進行以改善解直至已經(jīng)滿足收斂標準來確定函數(shù)的一個根或多個根的方法。有用的求根方法包括Newton方法(也稱為Newton-Raphson方法)、平分法、衰減的Newton方法、BFGS、準Newton方法、正割法、Brent的主軸方法以及這些和其它求根方法的各種變型方案??梢栽谟蒀ambridge University Press出版的“Numerical Recipes In CTheArt of Scientific Computing”的第9章中找到這些和其它求根方法的例子。其它求根方法對于本領域的技術人員來說將是顯而易見的。
在某些方面中,將標準化曲線設置為等于AFL值的函數(shù),該函數(shù)可以根據(jù)所使用的標準化方法而改變。例如,為了針對上述三種標準化方法中的每一種指定一個AFI值,應實施附加的規(guī)則,以允許求根方法適當?shù)厥諗?,如方?6)和(7)標準化為“0”,并且方程(8)標準化為“1”。因此,在一個方面中,當使用方程(8)時,方程(1)被設置為等于AFL值,而如果使用方程(6)或(7),則方程(1)被設置為等于AFL-1。在數(shù)學上,這在下面針對方程(6)、(7)和(8)的標準化方法中的每一種被示出。在一個方面中,當使用方程(6)的基線減去方法時,將求根過程或方法應用于下面的方程AFL-1=c(1+exp-d(x-e))(1+exp-f(x-g))---(9)]]>在一個方面中,當使用方程(7)的基線減去和除法方法時,將求根過程或方法應用于下面的方程AFL-1=(c/a)(1+exp-d(x-e))(1+exp-f(x-g))---(10)]]>在一個方面中,當使用方程(8)的基線除法方法時,將求根過程或方法應用于下面的方程AFL=1a[a+bx+c(1+exp-d(x-e))(1+exp-f(x-g))]---(11)]]>應理解的是,典型地通過如對于本領域技術人員來說眾所周知的試驗顯影劑來提供或確定AFL值。此外,應理解的是,對于不同的試驗來說,使用不同的標準化方程可能是更有利的。例如對于HPV試驗來說,使用根據(jù)方程(6)的標準化方法可能是更有利的,因為這種類型的試驗典型地具有高基線。對于HCV試驗來說,使用根據(jù)方程(7)或方程(8)的標準化方法可能是更有利的。本領域技術人員將容易理解,根據(jù)具體的試驗,哪一種標準化方法可能是更合適的。
在圖9中示出了根據(jù)一個實施例的、用于確定動態(tài)PCR曲線中的肘值或Ct值的更詳細的方法流程。在步驟910中,獲取數(shù)據(jù)集。在駐留于例如溫度循環(huán)器的PCR數(shù)據(jù)獲取裝置中的智能模塊(例如執(zhí)行指令的處理器)中實施確定方法的情況下,在數(shù)據(jù)正被收集時數(shù)據(jù)集可以被實時地提供給智能模塊,或者數(shù)據(jù)集可以被存儲于存儲單元或緩沖器中,并在已經(jīng)完成試驗之后被提供給智能模塊。類似地,數(shù)據(jù)集可以經(jīng)由通向獲取裝置的網(wǎng)絡連接(例如LAN、VPN、內(nèi)部網(wǎng)、因特網(wǎng)等)或直接連接(例如USB或其它直接有線或無線連接)被提供給單獨的系統(tǒng)、例如桌上計算機系統(tǒng),或在例如CD、DVD、軟盤等的便攜式介質(zhì)上被提供。
在已經(jīng)接收或獲取數(shù)據(jù)集之后,在步驟920中,確定曲線的近似。在該步驟過程中,在一個實施例中,具有通過Levenberg-Marquardt回歸方法所確定的參數(shù)的雙S形函數(shù)被用于找到表示數(shù)據(jù)集的曲線的近似。此外,在如參照圖3所述的步驟920之前,可以從數(shù)據(jù)集中去除峰值點。例如,在步驟910中獲取的數(shù)據(jù)集可以是已經(jīng)去除峰值的數(shù)據(jù)集。在步驟930中,使曲線標準化。在某些方面中,利用上述方程(6)、(7)或(8)中的一個使曲線標準化。例如,可以利用如在步驟920中所確定的雙S形方程的參數(shù)將基線設置為零斜率,以便如經(jīng)由上面的方程(6)那樣減去基線斜率。在步驟940中,對標準化曲線應用求根方法或過程以便確定根,所述根對應于肘值或Ct值。所應用的求根方法可以包括上面論述的算法中的任何一個或對于本領域技術人員來說將顯而易見的任何其它算法。在步驟950中,結果被返回,例如被返回至執(zhí)行分析的系統(tǒng)或請求分析的獨立系統(tǒng)。在步驟960中,顯示Ct值。也可以顯示例如整個數(shù)據(jù)集或曲線近似的附加數(shù)據(jù)。可以利用與執(zhí)行圖9的分析的系統(tǒng)相耦合的顯示裝置、例如監(jiān)控器屏幕或打印機再現(xiàn)圖形顯示,或者可將數(shù)據(jù)提供給獨立系統(tǒng)以便在顯示裝置上再現(xiàn)。
例子對圖10中所示的數(shù)據(jù)應用雙S形/LM方法產(chǎn)生如在下面的表1中所示的方程(1)中的七個參數(shù)的值
表1a8.74168b0.0391099c51.7682d0.250381e8.09951f0.548204g15.7799然后這些數(shù)據(jù)根據(jù)方程(7)(基線減去和除法)被標準化,以產(chǎn)生圖11中所示出的圖形。圖11中所示出的實線是方程(1)對已經(jīng)根據(jù)方程(7)被標準化的數(shù)據(jù)集的雙S形/LM應用。對于這種情況的AFL值是1.5。因此利用AFL-1等于0.5的方程(10)并利用BFGS準Newton方法來求根,給出12.07的Ct值。
在圖12中示出了該雙S形/LM方法的另一例子。圖12中的實線是具有表2中所示出的參數(shù)值的數(shù)據(jù)的雙S形/LM曲線擬合。
表2估計a1.47037b0.00933534c10.9464d0.79316e35.9085f0.108165g49.193在對該數(shù)據(jù)集應用標準化方程(7)之后,結果與雙S形/LM曲線擬合一起在圖13中被示出。在表2中示出了這種情況的參數(shù)值。對于這種情況的AFL值是1.5,因此利用AFL-1等于0.5的方程(10)并利用BFGS準Newton方法來求根,給出35.24的Ct值。
結論根據(jù)本發(fā)明的一個方面,提供一種計算機執(zhí)行的、確定生長曲線的基線區(qū)域的末端處的點的方法。該方法典型地包括接收表示生長曲線的數(shù)據(jù)集并且通過將Levenberg-Marquardt(LM)回歸方法應用于雙S形函數(shù)以確定函數(shù)的參數(shù)來計算擬合數(shù)據(jù)集的曲線的近似的步驟,該數(shù)據(jù)集包括多個數(shù)據(jù)點,每一個數(shù)據(jù)點具有一對坐標值。該方法進一步典型地包括利用所確定的參數(shù)來使曲線標準化以產(chǎn)生標準化曲線,并且處理標準化曲線以確定生長曲線的基線區(qū)域的末端處的點的坐標值。在一個方面中,數(shù)據(jù)集表示動態(tài)聚合酶鏈反應(PCR)方法的擴增生長曲線,并且基線區(qū)域的末端處的點表示動態(tài)PCR曲線的肘或周期閾值(Ct)。在本發(fā)明的其它方面中,數(shù)據(jù)集表示動態(tài)聚合酶鏈反應(PCR)方法、細菌法、酶法或結合法的生長曲線。在具體實施例中,數(shù)據(jù)集表示動態(tài)聚合酶鏈反應(PCR)方法的生長曲線,并且基線區(qū)域的末端處的點表示生長曲線的肘或周期閾值(Ct)。
在本發(fā)明的某些方面中,標準化包括減去表示曲線的數(shù)據(jù)集的線性生長部分。在某一實施例中,處理包括對標準化曲線應用求根方法。在另一實施例中,求根方法包括從由Newton方法、平分法、衰減的Newton方法、BFGS方法、準Newton方法、正割法和Brent的主軸方法組成的組中選擇的方法。
在某些方面中,雙S形函數(shù)具有下面的形式a+bx+c(1+exp-d(x-e))(1+exp-f(x-g))]]>,其中計算包括迭代地確定函數(shù)的參數(shù)a、b、c、d、e、f和g中的一個或多個。在某一實施例中,至少確定參數(shù)數(shù)a和b,并且標準化包括從曲線中減去線性生長部分a+bx。在又一確定的實施例中,處理標準化曲線包括對標準化曲線應用求根算法并將標準化曲線設置為等于任意熒光水平(AFL)-1。在具體實施例中,至少確定參數(shù)a和b,并且標準化包括從曲線中減去線性生長部分a+bx,并用參數(shù)a來除結果。
在另一實施例中,至少確定參數(shù)a,并且標準化包括用參數(shù)a來除曲線。在某一實施例中,處理標準化曲線包括對標準化曲線應用求根算法,并將標準化曲線設置為等于任意熒光水平(AFL)。在另一確定的實施例中,處理標準化曲線包括對標準化曲線應用求根算法,并將標準化曲線設置為等于任意熒光水平(AFL)-1。在又一確定的實施例中,該對坐標值表示擴增多核苷酸的累積和周期數(shù)。在具體實施例中,通過熒光強度值、發(fā)光強度值、化學發(fā)光強度值、磷光強度值、電荷轉移值、生物發(fā)光強度值或吸收率值之一來表示擴增多核苷酸的累積。
根據(jù)本發(fā)明的另一方面,提供一種計算機可讀介質(zhì),該計算機可讀介質(zhì)包括用于控制處理器以確定生長曲線的基線區(qū)域的末端處的點的代碼。該代碼典型地包括指令,該指令用于接收表示生長曲線的數(shù)據(jù)集并且通過將Levenberg-Marquardt(LM)回歸方法應用于雙S形函數(shù)以確定函數(shù)的參數(shù)來計算擬合數(shù)據(jù)集的曲線的近似,其中該數(shù)據(jù)集包括多個數(shù)據(jù)點,每一個數(shù)據(jù)點都具有一對坐標值。該代碼也典型地包括用于利用所確定的參數(shù)使曲線標準化以產(chǎn)生標準化曲線并且處理該標準化曲線以確定生長曲線的基線區(qū)域的末端處的點的坐標值的指令。在一個方面中,數(shù)據(jù)集表示動態(tài)聚合酶鏈反應(PCR)方法、細菌法、酶法或結合法的生長曲線。在具體方面中,曲線是動態(tài)聚合酶鏈反應(PCR)方法的擴增曲線,并且基線區(qū)域的末端處的點表示動態(tài)PCR曲線的肘或周期閾值(Ct)。在某些方面中,標準化包括減去曲線的線性生長部分。在某些方面中,代碼可以進一步包括用于返回或顯示基線區(qū)域的末端處的點的坐標值的指令。
在某些實施例中,該對坐標值表示擴增多核苷酸的累積和周期數(shù)。在具體實施例中,通過熒光強度值、發(fā)光強度值、化學發(fā)光強度值、磷光強度值、電荷轉移值、生物發(fā)光強度值或吸收率值之一來表示擴增多核苷酸的累積。
在某一實施例中,用于標準化的指令包括用于從數(shù)據(jù)集中減去線性生長部分的指令。在另一確定的實施例中,用于處理的指令包括用于對標準化曲線應用求根方法的指令。在具體實施例中,求根方法包括從由Newton方法、平分法、衰減的Newton方法、BFGS方法、準Newton方法、正割法、Brent的主軸方法組成的組中選擇的方法。
在某些方面中,雙S形函數(shù)具有下面的形式a+bx+c(1+exp-d(x-e))(1+exp-f(x-g))]]>,并且其中用于計算的指令包括用于迭代地確定函數(shù)的參數(shù)a、b、c、d、e、f和g中的一個或多個的指令。在某一實施例中,至少確定參數(shù)數(shù)a和b,并且其中用于標準化的指令包括用于從曲線中減去線性生長部分a+bx的指令。在具體實施例中,用于處理標準化曲線的指令包括用于對標準化曲線應用求根算法并將標準化曲線設置為等于任意熒光水平(AFL)-1的指令。
在另一具體實施例中,其中至少確定參數(shù)a和b,并且用于標準化的指令包括用于從曲線中減去線性生長部分a+bx并用參數(shù)a來除結果的指令。具體地,用于處理標準化曲線的指令可以包括用于對標準化曲線應用求根算法并將標準化曲線設置為等于任意熒光水平(AFL)-1的指令。
在其它某些方面中,至少確定參數(shù)a,并且用于標準化的指令包括用于用參數(shù)a來除曲線的指令。在具體實施例中,用于處理標準化曲線的指令包括用于對標準化曲線應用求根算法并將標準化曲線設置為等于任意熒光水平(AFL)的指令。
根據(jù)本發(fā)明的又一方面,提供一種動態(tài)聚合酶鏈反應(PCR)系統(tǒng)。該系統(tǒng)典型地包括動態(tài)聚合酶鏈反應分析模塊,該動態(tài)聚合酶鏈反應分析模塊產(chǎn)生表示動態(tài)PCR擴增曲線的PCR數(shù)據(jù)集,該數(shù)據(jù)集包括多個數(shù)據(jù)點,每一個數(shù)據(jù)點都具有一對坐標值,其中該數(shù)據(jù)集包括感興趣區(qū)域中的數(shù)據(jù)點,該感興趣區(qū)域包括周期閾值(Ct),并且該系統(tǒng)包括智能模塊,該智能模塊適于處理PCR數(shù)據(jù)集以確定周期閾值。該智能模塊典型地通過以下方式來處理數(shù)據(jù)集,即通過將Levenberg-Marquardt(LM)回歸方法應用于雙S形函數(shù)以確定函數(shù)的參數(shù)來計算擬合數(shù)據(jù)集的曲線的近似、利用所確定的參數(shù)來使曲線標準化以產(chǎn)生標準化曲線、以及處理標準化曲線以確定生長曲線的基線區(qū)域的末端處的點的坐標值,其中該點表示生長曲線的周期閾值(Ct)。
在根據(jù)本發(fā)明的系統(tǒng)的某一實施例中,標準化包括從數(shù)據(jù)集中減去線性生長部分。在另一確定的實施例中,處理包括對標準化曲線應用求根方法。在具體實施例中,求根方法包括從由Newton方法、平分法、衰減的Newton方法、BFGS方法、準Newton方法、正割法和Brent的主軸方法組成的組中選擇的方法。
在另一方面中,該對坐標值表示擴增多核苷酸的累積和周期數(shù)。在某些實施例中,通過熒光強度值、發(fā)光強度值、化學發(fā)光強度值、磷光強度值、電荷轉移值、生物發(fā)光強度值或吸收率值之一來表示擴增多核苷酸的累積。
在某些實施例中,動態(tài)PCR分析模塊駐留在動態(tài)溫度循環(huán)器裝置中,并且智能模塊包括通信耦合至分析模塊的處理器。在具體實施例中,智能模塊包括駐留在通過網(wǎng)絡連接或直接連接之一耦合至分析模塊的計算機系統(tǒng)中的處理器。
在某些方面中,雙S形函數(shù)具有下面的形式a+bx+c(1+exp-d(x-e))(1+exp-f(x-g))]]>,并且其中計算包括迭代地確定函數(shù)的參數(shù)a、b、c、d、e、f和g中的一個或多個。在某一實施例中,至少確定參數(shù)a和b,并且標準化包括從曲線中減去線性生長部分a+bx。在具體實施例中,處理標準化曲線包括對標準化曲線應用求根算法并將標準化曲線設置為等于任意熒光水平(AFL)-1。
在另一實施例中,其中至少確定參數(shù)a和b,并且標準化包括從曲線中減去線性生長部分a+bx,并用參數(shù)a來除結果。在具體實施例中,處理標準化曲線包括對標準化曲線應用求根算法并將標準化曲線設置為等于任意熒光水平(AFL)-1。
在另一確定的實施例中,至少確定參數(shù)a,并且標準化包括用參數(shù)a來除曲線。在具體實施例中,處理標準化曲線包括對標準化曲線應用求根算法并將標準化曲線設置為等于任意熒光水平(AFL)。
參照說明書的包括附圖和權利要求的剩余部分,將認識到本發(fā)明的其它特征和優(yōu)點。下面根據(jù)附圖詳細地描述本發(fā)明的進一步的特征和優(yōu)點以及本發(fā)明的各種實施例的結構和操作。在附圖中,相似的參考數(shù)字表示相同或功能相似的元件。
應理解的是,包括曲線近似和求根方法的Ct確定方法可以以在計算機的處理器上運行的計算機代碼來實施。該代碼包括用于控制處理器以實施Ct確定方法的各個方面和步驟的指令。該代碼典型地被存儲在硬盤、RAM或例如CD、DVD等的便攜式介質(zhì)上。類似地,可以在例如溫度循環(huán)器的PCR裝置中實施該方法,該溫度循環(huán)器包括執(zhí)行存儲于耦合至處理器的存儲單元中的指令的處理器??梢酝ㄟ^通向代碼源的網(wǎng)絡連接或直接連接或利用眾所周知的便攜式介質(zhì)將包括這種指令的代碼下載至PCR裝置存儲單元。
本領域技術人員應理解的是,可以利用例如C、C++、C#、Fortran、VisualBasic等的多種編程語言以及例如Mathematica的、提供有助于數(shù)據(jù)可視化和分析的預先打包的例行程序、函數(shù)和程序的應用來對本發(fā)明的肘確定方法進行編碼。應用的另一例子是MATLAB_。
雖然已經(jīng)通過例子并根據(jù)具體實施例描述了本發(fā)明,但應理解的是本發(fā)明并不局限于所公開的實施例。相反,旨在覆蓋對本領域技術人員來說將是顯而易見的各種修改和相似的配置。因此,所附的權利要求的范圍應符合最寬泛的解釋,以便包括所有的這種修改和相似的配置。
權利要求
1.一種計算機實現(xiàn)的、確定生長曲線的基線區(qū)域的末端處的點的方法,該方法包括以下步驟-接收表示生長曲線的數(shù)據(jù)集,所述數(shù)據(jù)集包括多個數(shù)據(jù)點,每一個數(shù)據(jù)點都具有一對坐標值;-通過將Levenberg-Marquardt(LM)回歸方法應用于雙S形函數(shù)以確定該函數(shù)的參數(shù)來計算擬合所述數(shù)據(jù)集的曲線的近似;-利用所確定的參數(shù)使該曲線標準化,以生成標準化曲線;以及-處理該標準化曲線,以確定生長曲線的基線區(qū)域的末端處的點的坐標值。
2.如權利要求1所述的方法,其中標準化包括從所述數(shù)據(jù)集中減去線性生長部分。
3.如權利要求1所述的方法,其中處理包括對所述標準化曲線應用求根方法,并且其中該求根方法包括從由Newton方法、平分法、衰減的Newton方法、BFGS方法、準Newton方法、正割法和Brent的主軸方法組成的組中選擇的方法。
4.如權利要求1所述的方法,其中所述雙S形函數(shù)具有下面的形式a+bx+c(1+exp-d(x-e))(1+exp-f(x-g)),]]>并且其中計算包括迭代地確定所述函數(shù)的參數(shù)a、b、c、d、e、f和g中的一個或多個。
5.如權利要求4所述的方法,其中至少確定參數(shù)a和b,并且其中標準化包括從所述曲線中減去線性生長部分a+bx。
6.如權利要求5所述的方法,其中處理該標準化曲線包括對標準化曲線應用求根算法并將標準化曲線設置為等于任意熒光水平(AFL)-1。
7.如權利要求4所述的方法,其中至少確定參數(shù)a,并且其中標準化包括用參數(shù)a來除所述曲線。
8.如權利要求7所述的方法,其中處理該標準化曲線包括對標準化曲線應用求根算法并將標準化曲線設置為等于任意熒光水平(AFL)。
9.如權利要求4所述的方法,其中至少確定參數(shù)a和b,并且其中標準化包括從所述曲線中減去線性生長部分a+bx并用參數(shù)a來除結果。
10.如權利要求9所述的方法,其中處理該標準化曲線包括對標準化曲線應用求根算法并將標準化曲線設置為等于任意熒光水平(AFL)-1。
11.如權利要求1所述的方法,其中所述數(shù)據(jù)集表示動態(tài)聚合酶鏈反應(PCR)方法的生長曲線,并且其中基線區(qū)域的末端處的點表示生長區(qū)域的肘或周期閾值(Ct)。
12.一種計算機可讀介質(zhì),該計算機可讀介質(zhì)包括用于控制處理器以確定生長曲線的基線區(qū)域的末端處的點的代碼,該代碼包括指令,所述指令用于-接收表示生長曲線的數(shù)據(jù)集,所述數(shù)據(jù)集包括多個數(shù)據(jù)點,每一個數(shù)據(jù)點都具有一對坐標值;-通過將Levenberg-Marquardt(LM)回歸方法應用于雙S形函數(shù)以確定該函數(shù)的參數(shù)來計算擬合所述數(shù)據(jù)集的曲線的近似;-利用所確定的參數(shù)來使該曲線標準化,以生成標準化曲線;以及-處理該標準化曲線,以確定生長曲線的基線區(qū)域的末端處的點的坐標值。
13.如權利要求12所述的計算機可讀介質(zhì),其中雙S形函數(shù)具有下面的形式a+bx+c(1+exp-d(x-e))(1+exp-f(x-g)),]]>并且其中用于計算的指令包括用于迭代地確定該函數(shù)的參數(shù)a、b、c、d、e、f和g中的一個或多個的指令。
14.如權利要求12所述的計算機可讀介質(zhì),其中該代碼進一步包括用于返回或顯示基線區(qū)域的末端處的點的坐標值的指令。
15.一種動態(tài)聚合酶鏈反應(PCR)系統(tǒng),該系統(tǒng)包括-動態(tài)聚合酶鏈反應分析模塊,該動態(tài)聚合酶鏈反應分析模塊產(chǎn)生表示動態(tài)聚合酶鏈反應擴增曲線的聚合酶鏈反應數(shù)據(jù)集,所述數(shù)據(jù)集包括多個數(shù)據(jù)點,每一個數(shù)據(jù)點都具有一對坐標值,其中所述數(shù)據(jù)集包括感興趣區(qū)域中的數(shù)據(jù)點,該感興趣區(qū)域包括周期閾值(Ct);以及-智能模塊,該智能模塊適于通過以下方式來處理所述聚合酶鏈反應數(shù)據(jù)集以確定周期閾值-通過將Levenberg-Marquardt(LM)回歸方法應用于雙S形函數(shù)以確定該函數(shù)的參數(shù)來計算擬合所述數(shù)據(jù)集的曲線的近似;-利用所確定的參數(shù)使該曲線標準化,以生成標準化曲線;以及-處理該標準化曲線,以確定生長曲線的基線區(qū)域的末端處的點的坐標值,其中所述點表示生長曲線的周期閾值(Ct)。
16.如權利要求15所述的系統(tǒng),其中所述雙S形函數(shù)具有下面的形式a+bx+c(1+exp-d(x-e))(1+exp-f(x-g)),]]>并且其中計算包括迭代地確定該函數(shù)的參數(shù)a、b、c、d、e、f和g中的一個或多個。
全文摘要
本發(fā)明涉及用于確定S形或生長型曲線中的例如肘值的特征過渡值、例如PCR擴增曲線中的周期閾值(Ct)的系統(tǒng)和方法。具有通過Levenberg-Marquardt(LM)回歸方法所確定的參數(shù)的雙S形函數(shù)被用于找到擬合PCR數(shù)據(jù)集的曲線的近似。一旦已經(jīng)確定了參數(shù),就可以利用一個或多個所確定的參數(shù)來使曲線標準化。如果選擇用于計算擴增曲線的周期閾值的任意熒光水平(AFI)方法,則標準化對于確定周期閾值來說是有利的。在標準化之后,通過應用求根算法以確定表示標準化曲線的函數(shù)的根來處理該標準化曲線,所述根對應于周期閾值。該周期閾值然后被返回并可以被顯示或另外被用于進一步的處理。
文檔編號C12Q1/68GK1987880SQ20061016937
公開日2007年6月27日 申請日期2006年12月19日 優(yōu)先權日2005年12月20日
發(fā)明者L·弗蘭西奧利, R·克諾貝爾, R·T·庫爾尼克 申請人:霍夫曼-拉羅奇有限公司