專利名稱:識(shí)別統(tǒng)計(jì)線性數(shù)據(jù)的制作方法
識(shí)別統(tǒng)計(jì)線性數(shù)據(jù)
相關(guān)申請(qǐng)的交叉引用
本申請(qǐng)要求2005年5月13日提交的題為"SYSTEMS AND METHODS FOR IDENTIFYING STATISTICALLY FLAT DATA IN A DATA SET (用于識(shí)別數(shù)據(jù) 集中的統(tǒng)計(jì)平坦(flat)數(shù)據(jù)的系統(tǒng)和方法)的美國(guó)臨時(shí)申請(qǐng)60/681,182,以及 與其相關(guān)且同時(shí)提交的題為"DETERMINATION OF BASELINE END CYCLE IN REAL TIME PCR USING DERIVATIVE PEAK ANALYSIS (使用導(dǎo)數(shù)峰值分 析確定實(shí)時(shí)PCR中的基線末端周期)(律師案號(hào)002558-072200US)"的序 列號(hào)No. 60/680,765的美國(guó)臨時(shí)申請(qǐng)的優(yōu)先權(quán),這些申請(qǐng)的公開通過(guò)引用全部 結(jié)合于此。本申請(qǐng)還涉及以下共同受讓、同時(shí)提交的題為"BASELINING
AMPLIFICATION DATA (擴(kuò)增數(shù)據(jù)的基線設(shè)定)"的美國(guó)專利申請(qǐng)No._
(律師案號(hào)002558-072210US)。這些申請(qǐng)的各自公開通過(guò)一般引用全部結(jié) 合于此。
背景技術(shù):
本發(fā)明一般涉及數(shù)據(jù)處理系統(tǒng)和方法,尤其涉及用于識(shí)別諸如聚合 酶鏈?zhǔn)椒磻?yīng)(PCR)的擴(kuò)增過(guò)程的數(shù)據(jù)集內(nèi)統(tǒng)計(jì)線性數(shù)據(jù)的系統(tǒng)和方法。
許多試驗(yàn)過(guò)程呈現(xiàn)數(shù)量的擴(kuò)增。例如,在PCR中,數(shù)量可對(duì)應(yīng)于DNA鏈中 已被復(fù)制部分的數(shù)目,在擴(kuò)增階段或擴(kuò)增區(qū)的期間,該數(shù)量顯著增加。其它呈現(xiàn)擴(kuò) 增的試驗(yàn)過(guò)程包括細(xì)菌生長(zhǎng)過(guò)程。通過(guò)試驗(yàn)設(shè)備經(jīng)由數(shù)據(jù)信號(hào)來(lái)檢測(cè)該數(shù)量,并分 析其數(shù)據(jù)點(diǎn)以確定關(guān)于擴(kuò)增的信息。作為數(shù)據(jù)分析的一部分,獲知擴(kuò)增是否可能發(fā) 生是重要的;否則,工作將浪費(fèi)在分析非擴(kuò)增數(shù)據(jù)上。如果數(shù)據(jù)是統(tǒng)計(jì)線性的,則 未發(fā)生擴(kuò)增。
理想情況下,來(lái)自擴(kuò)增檢測(cè)設(shè)備的數(shù)據(jù)可能是單調(diào)且連續(xù)的信號(hào),因此很容 易識(shí)別數(shù)據(jù)或其部分是否具有統(tǒng)計(jì)線性品質(zhì)。然而,來(lái)自擴(kuò)增設(shè)備的信號(hào)通常包含 噪聲,因而使信號(hào)品質(zhì)難以識(shí)別。噪聲本身出現(xiàn)在來(lái)自設(shè)備的信號(hào)的各個(gè)數(shù)據(jù)點(diǎn)中, 并具有在例如DNA鏈的實(shí)際數(shù)目的真實(shí)信號(hào)上發(fā)生的隨機(jī)波動(dòng)。因而,數(shù)據(jù)需要 進(jìn)行處理以便能識(shí)別線性品質(zhì)。一種用于處理數(shù)據(jù)以判定其是否為統(tǒng)計(jì)線性的典型現(xiàn)有方法是通過(guò)線性最小
二乘方(LSQ)擬合。LSQ擬合的相關(guān)值可用于判定是否充分?jǐn)M合。通過(guò)標(biāo)準(zhǔn)約定, 相關(guān)值0與不良擬合相關(guān),因此數(shù)據(jù)不是線性,而值l表示良好線性擬合。問(wèn)題在 于,存在噪聲時(shí),對(duì)于看起來(lái)統(tǒng)計(jì)線性的數(shù)據(jù),相關(guān)值可能接近0或1。此外,相 關(guān)值并不對(duì)應(yīng)于可提供額外理解和效能的物理值。因而,相關(guān)值不是可以接受的標(biāo) 準(zhǔn),尤其對(duì)于噪聲極大的數(shù)據(jù)而言。
因此,期望提供用于處理具有噪聲的數(shù)據(jù)集、以及用于識(shí)別該數(shù)據(jù)集是否為 統(tǒng)計(jì)線性并且克服了上述及其它問(wèn)題的系統(tǒng)和方法。
發(fā)明內(nèi)容
因此,本發(fā)明的實(shí)施例提供了針對(duì)處理數(shù)據(jù)以判定數(shù)據(jù)是否呈現(xiàn)統(tǒng)計(jì)線性品 質(zhì)的方法和系統(tǒng)。統(tǒng)計(jì)線性數(shù)據(jù)表示數(shù)據(jù)一般不向下或向上彎曲或者以其它方式顯 示擴(kuò)增。這種數(shù)據(jù)通常呈大致線性,其中較大噪聲信號(hào)疊加其上??蓮膶?shí)時(shí)PCR 過(guò)程或呈現(xiàn)擴(kuò)增或生長(zhǎng)的其它過(guò)程接收該數(shù)據(jù)。
根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例,提供了處理數(shù)據(jù)的方法。該方法通常包括 接收具有信號(hào)分量和噪聲分量的原始數(shù)據(jù)點(diǎn)集。原始數(shù)據(jù)集被擬合到線性函數(shù)。在
一個(gè)方面中,該擬合通過(guò)對(duì)數(shù)據(jù)集計(jì)算線性最小二乘方擬合來(lái)實(shí)現(xiàn)。該方法還包括 計(jì)算原始數(shù)據(jù)集與線性擬合之間的殘差,以及計(jì)算原始數(shù)據(jù)集與線性擬合之間的殘 差量度。在一個(gè)方面中,該量度是標(biāo)準(zhǔn)偏差。
該方法還通常包括通過(guò)計(jì)算經(jīng)平滑的數(shù)據(jù)集以及計(jì)算經(jīng)平滑的數(shù)據(jù)集與原始 數(shù)據(jù)集之間的殘差來(lái)估算數(shù)據(jù)集中存在的噪聲分量。經(jīng)平滑的數(shù)據(jù)點(diǎn)基于該經(jīng)平滑 數(shù)據(jù)點(diǎn)局部的原始數(shù)據(jù)點(diǎn)的值。在一個(gè)方面中,低通濾波器用于計(jì)算經(jīng)平滑的數(shù)據(jù) 集。示例性低通濾波器包括Savitzy-Golay濾波器、數(shù)字濾波器或數(shù)字平滑多項(xiàng)式 濾波器。在另一個(gè)方面中,經(jīng)平滑的數(shù)據(jù)點(diǎn)的值是落在包圍該經(jīng)平滑數(shù)據(jù)點(diǎn)的窗口 內(nèi)的原始數(shù)據(jù)點(diǎn)的平均值。
該方法通常還包括計(jì)算所估算噪聲的殘差的量度,以及比較量度以便判定原 始數(shù)據(jù)集是否呈現(xiàn)統(tǒng)計(jì)線性品質(zhì)。比較可包括計(jì)算第一與第二量度的比值,以便判 定比值小于還是大于預(yù)定值。在一個(gè)方面中,預(yù)定值在l的量級(jí)上。
在較佳方面中,在諸如獨(dú)立計(jì)算機(jī)、網(wǎng)絡(luò)附連計(jì)算機(jī)的處理器或諸如實(shí)時(shí)PCR 機(jī)器的數(shù)據(jù)采集設(shè)備中實(shí)現(xiàn)該方法。實(shí)時(shí)PCR機(jī)器的一個(gè)示例是由 Bio-RadLaboratories提供的iCycler iQ系統(tǒng)。根據(jù)本發(fā)明的另一個(gè)示例性實(shí)施例,提供了具有適于引導(dǎo)信息處理設(shè)備執(zhí)行 處理數(shù)據(jù)以判定曲線是否呈現(xiàn)線性品質(zhì)的操作的多個(gè)指令的信息存儲(chǔ)介質(zhì)。在一個(gè)
方面中,信息存儲(chǔ)介質(zhì)是RAM或ROM單元、硬盤、CD、 DVD或其它便攜式介質(zhì)。
根據(jù)本發(fā)明的另一個(gè)示例性實(shí)施例,提供了PCR檢測(cè)系統(tǒng)。該P(yáng)CR檢測(cè)系統(tǒng) 包括用于產(chǎn)生具有信號(hào)分量和噪聲分量的原始數(shù)據(jù)點(diǎn)集的檢測(cè)器,并且包括用于處 理數(shù)據(jù)以判定該數(shù)據(jù)是否呈現(xiàn)線性品質(zhì)的邏輯。
對(duì)包括附圖和權(quán)利要求的本說(shuō)明書剩余部分的參考將實(shí)現(xiàn)本發(fā)明的其它特征 和優(yōu)點(diǎn)。以下將參照附圖詳細(xì)描述本發(fā)明的其它特征和優(yōu)點(diǎn)以及本發(fā)明各個(gè)實(shí)施例 的結(jié)構(gòu)和操作。在附圖中,相似的附圖標(biāo)記表示相同或功能相似的要素。
圖1示出了PCR擴(kuò)增曲線的一個(gè)示例。
圖2示出了呈現(xiàn)噪聲和統(tǒng)計(jì)線性品質(zhì)的實(shí)時(shí)PCR數(shù)據(jù)集。
圖3示出了呈現(xiàn)噪聲和擴(kuò)增的實(shí)時(shí)PCR數(shù)據(jù)集。
圖4示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的處理數(shù)據(jù)集以判定該數(shù)據(jù)集是否呈現(xiàn) 統(tǒng)計(jì)線性品質(zhì)的方法。
圖5A示出了對(duì)呈現(xiàn)統(tǒng)計(jì)線性品質(zhì)的數(shù)據(jù)集進(jìn)行的線性擬合。
圖5B示出了對(duì)呈現(xiàn)擴(kuò)增品質(zhì)的數(shù)據(jù)集進(jìn)行的線性擬合。
圖6A示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的實(shí)時(shí)PCR數(shù)據(jù)的經(jīng)平滑數(shù)據(jù)集。
圖6B示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的實(shí)時(shí)PCR數(shù)據(jù)的估算噪聲。
圖7示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的處理實(shí)時(shí)PCR數(shù)據(jù)的系統(tǒng)。
具體實(shí)施例方式
本發(fā)明提供了用于處理數(shù)據(jù)集并識(shí)別該數(shù)據(jù)集是否為統(tǒng)計(jì)線性、以及將這種 線性數(shù)據(jù)集與包含擴(kuò)增信號(hào)的數(shù)據(jù)集區(qū)別開的技術(shù)。在較佳方面中,對(duì)于處理來(lái)自 PCR生長(zhǎng)或擴(kuò)增過(guò)程的數(shù)據(jù)以便在進(jìn)一步分析該數(shù)據(jù)之前識(shí)別和移除統(tǒng)計(jì)線性數(shù) 據(jù),本發(fā)明尤其有用。然而,應(yīng)該理解,本發(fā)明的技術(shù)適于處理可能包括噪聲的任 何數(shù)據(jù)集或曲線,尤其是除此之外可能呈現(xiàn)諸如細(xì)菌生長(zhǎng)過(guò)程的生長(zhǎng)或擴(kuò)增的曲 線。
圖1示出了 PCR曲線100的一個(gè)示例,其中繪制了典型PCR過(guò)程的強(qiáng)度值110相對(duì)于周期數(shù)120。值110可以是任意感興趣的任意物理量,而周期數(shù)可以是 與該過(guò)程的時(shí)間或步驟數(shù)相關(guān)聯(lián)的任意單位。這些擴(kuò)增曲線通常具有線性區(qū)域 130、緊隨其后的擴(kuò)增區(qū)域140以及之后的漸近區(qū)域150,如圖1所示。可能還存 在諸如向下彎曲數(shù)據(jù)的附加類型的品質(zhì)。擴(kuò)增區(qū)域可具有指數(shù)、反曲(sigmoidal)、 高階多項(xiàng)式或其它類型的邏輯函數(shù)或模擬生長(zhǎng)的邏輯曲線。
為了理解所涉及的試驗(yàn)過(guò)程,識(shí)別擴(kuò)增區(qū)域140的位置和形狀是很重要的。 例如,在PCR過(guò)程中,可能期望識(shí)別擴(kuò)增的開始,它發(fā)生在基線區(qū)域(線性區(qū)域 130)末端。識(shí)別位置的步驟是識(shí)別可能的擴(kuò)增區(qū)域是否確實(shí)存在,因?yàn)镻CR過(guò)程 可能不呈現(xiàn)任何擴(kuò)增。然而,由于實(shí)時(shí)PCR數(shù)據(jù)具有噪聲,所以可能難以識(shí)別數(shù) 據(jù)集是否可能呈現(xiàn)擴(kuò)增或等價(jià)于它是否不是統(tǒng)計(jì)線性。
例如,圖2示出了由具有包括信號(hào)和噪聲的數(shù)據(jù)點(diǎn)240的數(shù)據(jù)集構(gòu)成的實(shí)時(shí) PCR曲線200的線性區(qū)域230。注意,即使對(duì)于產(chǎn)生恒定信號(hào)的設(shè)備,也必須將該 數(shù)據(jù)分割成數(shù)據(jù)點(diǎn)以便分析。噪聲導(dǎo)致數(shù)據(jù)點(diǎn)的波動(dòng)??傮w而言,數(shù)據(jù)通常以線性 方式向上移動(dòng)(即正斜率)。然而,由于曲線200在點(diǎn)與點(diǎn)之間完全非線性,所以 一般的線性品質(zhì)無(wú)法通過(guò)在沿曲線的任意一點(diǎn)上直接分析曲線200來(lái)判定。直接分 析曲線200可能會(huì)錯(cuò)誤地判定數(shù)據(jù)不呈現(xiàn)統(tǒng)計(jì)線性品質(zhì)。本發(fā)明的實(shí)施例可有效地 判定數(shù)據(jù)是否呈現(xiàn)統(tǒng)計(jì)線性品質(zhì)。
此外,區(qū)分具有線性品質(zhì)的數(shù)據(jù)曲線和具有擴(kuò)增品質(zhì)的數(shù)據(jù)曲線是很重要的。 圖3示出了呈現(xiàn)擴(kuò)增的實(shí)時(shí)PCR曲線300。最初,數(shù)據(jù)在區(qū)域330中呈現(xiàn)線性品 質(zhì),而在隨后周期中,區(qū)域340中存在擴(kuò)增。本發(fā)明的實(shí)施例是穩(wěn)定并一致地精確 區(qū)分僅具有線性品質(zhì)的PCR曲線200和諸如PCR曲線300的可能具有擴(kuò)增區(qū)域的 PCR曲線。
圖4示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的處理數(shù)據(jù)以判定該數(shù)據(jù)是否呈現(xiàn)統(tǒng)計(jì) 線性品質(zhì)的方法400。數(shù)據(jù)集由數(shù)據(jù)點(diǎn)構(gòu)成,并且表示具有信號(hào)分量和噪聲分量的 曲線。
在步驟405,首先收集或接收數(shù)據(jù)集??赏ㄟ^(guò)任意機(jī)制來(lái)接收該數(shù)據(jù)集。例如, 該數(shù)據(jù)集可通過(guò)駐留在諸如iCycler iQ設(shè)備的PCR數(shù)據(jù)采集設(shè)備或類似的PCR分 析設(shè)備中的(執(zhí)行指令的)處理器來(lái)采集??稍谑占瘮?shù)據(jù)時(shí)將數(shù)據(jù)集實(shí)時(shí)地提供給 處理器,或者可將其存儲(chǔ)在存儲(chǔ)器單元或緩沖器中并在試驗(yàn)完成之后提供給處理 器。類似地,可經(jīng)由到采集設(shè)備的網(wǎng)絡(luò)連接(例如LAN、 VPN、內(nèi)聯(lián)網(wǎng)、因特網(wǎng) 等)或直接連接(例如USB或其它直接接線或無(wú)線連接)將數(shù)據(jù)集提供給諸如臺(tái)式計(jì)算機(jī)系統(tǒng)的分離系統(tǒng),或者設(shè)置在諸如CD、 DVD、軟盤等的便攜式介質(zhì)上提 供給獨(dú)立計(jì)算機(jī)系統(tǒng)。在接收或采集到數(shù)據(jù)集之后,可對(duì)該數(shù)據(jù)進(jìn)行分析。
在步驟410,對(duì)數(shù)據(jù)集計(jì)算線性擬合。通常,擬合定義了衡量數(shù)據(jù)集與擬合之 間的一致或差異的優(yōu)質(zhì)函數(shù)(merit function) S ,其中優(yōu)質(zhì)函數(shù)的較小值通常表示 用于擬合的較好參數(shù)。例如,在線性最小二乘方擬合中,優(yōu)質(zhì)函數(shù)是數(shù)據(jù)值y與擬
合函數(shù)/(x,)之間差值的平方,其中對(duì)于N個(gè)數(shù)據(jù)點(diǎn),/(x,))2。在PCR
過(guò)程中,y是數(shù)據(jù)強(qiáng)度,而x是周期數(shù)。圖5A示出了 PCR曲線200的線性擬合 510。圖5B示出了 PCR曲線300的線性擬合550。
對(duì)于不同數(shù)據(jù)點(diǎn),優(yōu)質(zhì)函數(shù)可包括對(duì)優(yōu)質(zhì)函數(shù)的不同加權(quán)基值(contribution) 或歸一化因子。在取差值之前,優(yōu)質(zhì)函數(shù)還可按比例換算數(shù)據(jù)點(diǎn)值或?qū)?shù)據(jù)點(diǎn)取函 數(shù)??稍谝?c值的數(shù)據(jù)與不同x值的/(x)之間取差值。例如,優(yōu)質(zhì)函數(shù)中的一項(xiàng)可
表示從數(shù)據(jù)曲線到線性擬合的線的長(zhǎng)度,其中該線與線性擬合垂直。這發(fā)生在不同 的周期數(shù)處,除非線性擬合的斜率為0。本領(lǐng)域技術(shù)人員將意識(shí)到可使用的許多不 同的優(yōu)質(zhì)函數(shù)。
在步驟415,計(jì)算數(shù)據(jù)與線性擬合之間的殘差i 。殘差i 是與數(shù)據(jù)點(diǎn)偏離線性
擬合的誤差相對(duì)應(yīng)的一組值。例如,殘差可以是每個(gè)周期數(shù)的線性擬合值與實(shí)際數(shù) 據(jù)點(diǎn)的差值,表示成《=1^-/(;0,它是殘差的標(biāo)準(zhǔn)形式。在一些實(shí)施例中,殘差
與用于確定線性擬合的優(yōu)質(zhì)函數(shù)的值相關(guān)。在其它實(shí)施例中,殘差是不同的值。在 圖5A中,誤差520用于計(jì)算曲線200與線性擬合510之間的殘差i 的值。在圖5B 中,誤差560用于計(jì)算曲線300與線性擬合550之間的殘差i 的值。
在步驟420中,計(jì)算數(shù)據(jù)與線性擬合之間的殘差量度cr,。該量度是由一組殘
差值得到的單個(gè)值。在一個(gè)實(shí)施例中,殘差是標(biāo)準(zhǔn)偏差,表示成cT,」丄i:《2 。 一
些實(shí)施例可具有各個(gè)殘差值的加權(quán)值,而其它實(shí)施例可將各個(gè)殘差值或所有殘差值 代入到附加函數(shù)或其它函數(shù)。本領(lǐng)域技術(shù)人員將意識(shí)到可使用的許多不同的量度。
在步驟425中,計(jì)算數(shù)據(jù)集中出現(xiàn)的估算噪聲分量。假設(shè)數(shù)據(jù)由真實(shí)信號(hào)和 噪聲的兩個(gè)分量構(gòu)成。因而,噪聲是真實(shí)信號(hào)與實(shí)際數(shù)據(jù)點(diǎn)之間的差。然而,真實(shí) 信號(hào)不可能直接測(cè)量,因?yàn)楫?dāng)檢測(cè)信號(hào)時(shí),總是添加有或出現(xiàn)噪聲。
真實(shí)信號(hào)被估算為由經(jīng)平滑的數(shù)據(jù)點(diǎn)構(gòu)成的經(jīng)平滑數(shù)據(jù)集。圖6A示出了 PCR 曲線300的經(jīng)平滑的數(shù)據(jù)集670。經(jīng)平滑的數(shù)據(jù)點(diǎn)的值是基于經(jīng)平滑的數(shù)據(jù)點(diǎn)局部的多個(gè)原始數(shù)據(jù)點(diǎn)的函數(shù)G。術(shù)語(yǔ)局部涉及數(shù)據(jù)點(diǎn)的X值與被計(jì)算的數(shù)據(jù)點(diǎn)相距多 遠(yuǎn)。例如,如果一個(gè)點(diǎn)與另一個(gè)點(diǎn)相差預(yù)定數(shù)目(窗口)的周期,則該點(diǎn)在另一個(gè) 點(diǎn)局部。三個(gè)或五個(gè)周期的窗口被證明為適當(dāng)?shù)?,但是也可使用其它窗口,諸如 10或20個(gè)周期或以上。還可使用可變窗口值,即可使用不同窗口來(lái)計(jì)算各個(gè)經(jīng)平 滑的數(shù)據(jù)點(diǎn)。此外,可使用具有分?jǐn)?shù)個(gè)周期的窗口,例如其中內(nèi)插分?jǐn)?shù)個(gè)數(shù)據(jù)點(diǎn)。 窗口也可以關(guān)于數(shù)據(jù)點(diǎn)不對(duì)稱,即可使用數(shù)據(jù)點(diǎn)之前的一個(gè)點(diǎn)以及該數(shù)據(jù)點(diǎn)之后的 三個(gè)點(diǎn)。
一旦x值之差逼近所使用的總范圍一即周期總數(shù),則該點(diǎn)不再是局部。
在一個(gè)實(shí)施例中,函數(shù)G是移動(dòng)平均值或低通濾波器。例如,函數(shù)G可對(duì)指 定周期數(shù)內(nèi)的原始數(shù)據(jù)點(diǎn)取平均值,即居中平均值。因此,在一個(gè)實(shí)施例中, G(^):^^2k,其中L是所計(jì)算的經(jīng)平滑的數(shù)據(jù)點(diǎn)的下標(biāo)(index),而K為
所用窗口。
同時(shí),在步驟425,計(jì)算經(jīng)平滑的數(shù)據(jù)與原始數(shù)據(jù)之間的殘差。該殘差被定義 成估算噪聲。經(jīng)平滑的數(shù)據(jù)與原始數(shù)據(jù)之間的殘差可以以相同方式定義成原始數(shù)據(jù)
與線性擬合之間的殘差,或者這些殘差可以以不同方式定義。圖6B示出了與PCR 曲線300和經(jīng)平滑的數(shù)據(jù)集670相關(guān)聯(lián)的估算噪聲分量680。噪聲分量680與信號(hào) 670的疊加形成數(shù)據(jù)曲線300。
在步驟430,計(jì)算經(jīng)平滑的數(shù)據(jù)與原始數(shù)據(jù)之間的殘差量度 。 值用作固 有噪聲幅度的量度。在一個(gè)實(shí)施例中,A是標(biāo)準(zhǔn)偏差??梢砸韵嗨苹虿煌姆绞?定義量度o^和c^ 。
在步驟435,將第一量度C7,與第二量度^進(jìn)行比較以判定數(shù)據(jù)集是否呈現(xiàn)線 性品質(zhì)。在一個(gè)實(shí)施例中,取(T,與a2的比值。如果比值小于或大于預(yù)定值,則數(shù)
據(jù)被判定為呈現(xiàn)線性品質(zhì)。例如,如果^/072小于1的量級(jí)上的值,例如1.5,則該 數(shù)據(jù)被判定為線性。等效地,可使用表達(dá)式C7^(v^2。該表達(dá)式說(shuō)明數(shù)據(jù)與線性
擬合之差的量度必須小于數(shù)據(jù)中出現(xiàn)的估算噪聲的量度的常數(shù)倍。在某些實(shí)施例
中,Co的值可變化。
常數(shù)Co與噪聲定義以及其它值并不唯一的事實(shí)相關(guān)。c。的值可通過(guò)檢查大量 數(shù)據(jù)集來(lái)獲得,以便于獲得該數(shù)的合理值。研究表明當(dāng)使用標(biāo)準(zhǔn)殘差的標(biāo)準(zhǔn)偏差時(shí), 值1.5適于作為常數(shù)(Cq)。當(dāng)使用其它殘差或殘差的量度時(shí),其它值可能更適合。 通常,co的值在1的量級(jí)上時(shí)應(yīng)當(dāng)工作良好。
一旦數(shù)據(jù)已被識(shí)別為統(tǒng)計(jì)平坦(線性),例如沒(méi)有向下或向上彎曲或者以其它方式顯示擴(kuò)增,則放棄對(duì)該數(shù)據(jù)的進(jìn)一步分析。
在某些方面中,用于控制處理器以實(shí)現(xiàn)本發(fā)明的數(shù)據(jù)處理技術(shù)的代碼和指令 存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)或信息存儲(chǔ)介質(zhì)上,諸如RAM或ROM單元、硬盤驅(qū)動(dòng)器、
CD、 DVD或其它便攜式介質(zhì)。
圖7示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的系統(tǒng)700。所示系統(tǒng)包括在樣品容器 710內(nèi)的諸如細(xì)菌或DNA的樣品705。來(lái)自樣品的諸如熒光強(qiáng)度值的物理特征715 由檢測(cè)器720來(lái)檢測(cè)。包括噪聲分量的信號(hào)725從檢測(cè)器720發(fā)送到邏輯系統(tǒng)730。 來(lái)自信號(hào)725的數(shù)據(jù)可存儲(chǔ)在本地存儲(chǔ)器735或外部存儲(chǔ)器740或存儲(chǔ)設(shè)備745 中。在一個(gè)實(shí)施例中,模-數(shù)轉(zhuǎn)換器將模擬信號(hào)轉(zhuǎn)換成數(shù)字形式。
邏輯系統(tǒng)730可以是或可包括計(jì)算機(jī)系統(tǒng)、ASIC、微處理器等。它還可包括 顯示器(例如監(jiān)視器、LED顯示器等)和用戶輸入設(shè)備(例如鼠標(biāo)、鍵盤、按鈕 等)或與它們耦合。邏輯系統(tǒng)730和其它組件可以是獨(dú)立或網(wǎng)絡(luò)連接計(jì)算機(jī)系統(tǒng)的 一部分,或者它們可直接附加到或結(jié)合到熱循環(huán)設(shè)備。邏輯系統(tǒng)730還可包括在處 理器750中執(zhí)行的優(yōu)化軟件。
根據(jù)一個(gè)實(shí)施例,邏輯系統(tǒng)730包括用于處理數(shù)據(jù)和識(shí)別統(tǒng)計(jì)平坦數(shù)據(jù)的指 令。盡管這些指令也可在諸如軟盤、CD、 DVD等的任何軟件存儲(chǔ)介質(zhì)上提供,但 是較佳地將指令下載并存儲(chǔ)在存儲(chǔ)器模塊735、 740或745 (例如硬盤驅(qū)動(dòng)器或諸 如本地或附加RAM或ROM的其它存儲(chǔ)器)中。應(yīng)該理解,可通過(guò)諸如C、 C++、 Java、 Visual Basic及其它、或諸如VBScript、 JavaScript、 Perl的任何腳本語(yǔ)言、 或諸如XML的標(biāo)記語(yǔ)言來(lái)實(shí)現(xiàn)用于實(shí)現(xiàn)本發(fā)明的諸方面的計(jì)算機(jī)代碼。此外,各 種語(yǔ)言和協(xié)議可用于根據(jù)本發(fā)明的諸方面的數(shù)據(jù)和命令的外部和內(nèi)部存儲(chǔ)以及傳 輸。
應(yīng)該理解,本文所述的過(guò)程是說(shuō)明性的,而且變化和更改是可能的。順序描 述的步驟可并行執(zhí)行,步驟的次序可改變,并且步驟可被更改或組合。
雖然本發(fā)明作為示例并就具體實(shí)施例而得到描述,但是應(yīng)該理解本發(fā)明并不 局限于所公開的實(shí)施例。相反,它旨在涵蓋對(duì)于本領(lǐng)域技術(shù)人員而言顯而易見的各 種更改和相似配置。因此,對(duì)所附權(quán)利要求書的范圍應(yīng)當(dāng)給予最寬泛的解釋,以便 包括所有這些更改和相似配置。
權(quán)利要求
1.一種處理數(shù)據(jù)集以判定所述數(shù)據(jù)集是否呈現(xiàn)統(tǒng)計(jì)線性品質(zhì)的方法,所述方法包括接收具有信號(hào)分量和噪聲分量的原始數(shù)據(jù)點(diǎn)集;將所述原始數(shù)據(jù)集擬合到線性函數(shù);計(jì)算所述原始數(shù)據(jù)集與所述經(jīng)擬合的線性函數(shù)之間的殘差;計(jì)算所述原始數(shù)據(jù)集與所述經(jīng)擬合的線性函數(shù)之間的所述殘差的第一量度;估算所述原始數(shù)據(jù)集中存在的所述噪聲分量,通過(guò)i)通過(guò)確定一組經(jīng)平滑的數(shù)據(jù)點(diǎn)來(lái)計(jì)算經(jīng)平滑的數(shù)據(jù)集,其中經(jīng)平滑的數(shù)據(jù)點(diǎn)的值是基于所述經(jīng)平滑的數(shù)據(jù)點(diǎn)局部的多個(gè)原始數(shù)據(jù)點(diǎn)的值;以及ii)計(jì)算所述經(jīng)平滑的數(shù)據(jù)集與所述原始數(shù)據(jù)集之間的殘差;計(jì)算所述經(jīng)平滑的數(shù)據(jù)集與所述原始數(shù)據(jù)集之間的所述殘差的第二量度;以及將所述第一量度與所述第二量度進(jìn)行比較以判定所述原始數(shù)據(jù)集是否呈現(xiàn)線性品質(zhì)。
2. 如權(quán)利要求1所述的方法,其特征在于,擬合所述原始數(shù)據(jù)集包括使用最 小二乘方擬合。
3. 如權(quán)利要求1所述的方法,其特征在于,計(jì)算所述經(jīng)平滑的數(shù)據(jù)集包括使 用低通濾波器。
4. 如權(quán)利要求l所述的方法,其特征在于,經(jīng)平滑的數(shù)據(jù)點(diǎn)的值是落在包圍 所述經(jīng)平滑的數(shù)據(jù)點(diǎn)窗口內(nèi)的所述原始數(shù)據(jù)點(diǎn)的平均值。
5. 如權(quán)利要求4所述的方法,其特征在于,所述窗口為5個(gè)單位。
6. 如權(quán)利要求1所述的方法,其特征在于,所述第一量度與所述第二量度各 自為標(biāo)準(zhǔn)偏差。
7. 如權(quán)利要求1所述的方法,其特征在于,比較包括計(jì)算所述第一與第二量 度的比值以便判定所述比值是小于還是大于預(yù)定值。
8. 如權(quán)利要求7所述的方法,其特征在于,所述預(yù)定值在l的量級(jí)上。
9. 如權(quán)利要求l所述的方法,其特征在于,所述數(shù)據(jù)表示PCR擴(kuò)增曲線。
10. 如權(quán)利要求l所述的方法,其特征在于,所述方法在處理器中實(shí)現(xiàn)。
11. 如權(quán)利要求io所述的方法,其特征在于,所述處理器結(jié)合在獨(dú)立計(jì)算機(jī) 系統(tǒng)、網(wǎng)絡(luò)化計(jì)算機(jī)系統(tǒng)或?qū)崟r(shí)PCR機(jī)器之一中。
12. —種具有適于引導(dǎo)信息處理設(shè)備執(zhí)行處理數(shù)據(jù)以判定所述數(shù)據(jù)是否呈現(xiàn)線性品質(zhì)的操作的多個(gè)指令的信息存儲(chǔ)介質(zhì),所述操作包括步驟接收具有信號(hào)分量和噪聲分量的原始數(shù)據(jù)點(diǎn)集; 將所述原始數(shù)據(jù)集擬合到線性函數(shù);計(jì)算所述原始數(shù)據(jù)集與所述經(jīng)擬合的線性函數(shù)之間的殘差; 計(jì)算所述原始數(shù)據(jù)集與所述經(jīng)擬合的線性函數(shù)之間的所述殘差的第一量度; 估算所述原始數(shù)據(jù)集中存在的所述噪聲分量,通過(guò)i) 通過(guò)確定一組經(jīng)平滑的數(shù)據(jù)點(diǎn)來(lái)計(jì)算經(jīng)平滑的數(shù)據(jù)集,其中經(jīng)平滑的數(shù)據(jù)點(diǎn)的值是基于所述經(jīng)平滑的數(shù)據(jù)點(diǎn)局部的多個(gè)原始數(shù)據(jù)點(diǎn)的值;以及ii) 計(jì)算所述經(jīng)平滑的數(shù)據(jù)集與所述原始數(shù)據(jù)集之間的殘差; 計(jì)算所述經(jīng)平滑的數(shù)據(jù)集與所述原始數(shù)據(jù)集之間的所述殘差的第二量度;以及將所述第一量度與所述第二量度進(jìn)行比較以判定所述原始數(shù)據(jù)集是否呈現(xiàn)線 性品質(zhì)。
13. 如權(quán)利要求12所述的信息存儲(chǔ)介質(zhì),其特征在于,擬合所述原始數(shù)據(jù)集 包括使用最小二乘方擬合。
14. 如權(quán)利要求12所述的信息存儲(chǔ)介質(zhì),其特征在于,計(jì)算所述經(jīng)平滑的數(shù) 據(jù)集包括使用低通濾波器。
15. 如權(quán)利要求12所述的信息存儲(chǔ)介質(zhì),其特征在于,經(jīng)平滑的數(shù)據(jù)點(diǎn)的值 是落在包圍所述經(jīng)平滑的數(shù)據(jù)點(diǎn)的窗口內(nèi)的所述原始數(shù)據(jù)點(diǎn)的平均值。
16. 如權(quán)利要求12所述的信息存儲(chǔ)介質(zhì),其特征在于,所述第一量度與所述 第二量度各自為標(biāo)準(zhǔn)偏差。
17. 如權(quán)利要求12所述的信息存儲(chǔ)介質(zhì),其特征在于,所述比較包括計(jì)算所 述第一與第二量度的比值以便判定所述比值是小于還是大于預(yù)定值。
18. 如權(quán)利要求12所述的信息存儲(chǔ)介質(zhì),其特征在于,所述數(shù)據(jù)表示PCR擴(kuò) 增曲線。
19. 一種PCR檢測(cè)系統(tǒng)包括檢測(cè)器,用于產(chǎn)生具有信號(hào)分量和噪聲分量的原始數(shù)據(jù)點(diǎn)集; 邏輯,用于處理數(shù)據(jù)以判定所述數(shù)據(jù)是否呈現(xiàn)線性品質(zhì),通過(guò)將所述原始數(shù)據(jù)集擬合到線性函數(shù);計(jì)算所述原始數(shù)據(jù)集與所述經(jīng)擬合的線性函數(shù)之間的殘差;計(jì)算所述原始數(shù)據(jù)集與所述經(jīng)擬合的線性函數(shù)之間的所述殘差的第一度估算所述原始數(shù)據(jù)集中存在的所述噪聲分量,通過(guò)i) 通過(guò)確定一組經(jīng)平滑的數(shù)據(jù)點(diǎn)來(lái)計(jì)算經(jīng)平滑的數(shù)據(jù)集,其中經(jīng)平滑的數(shù)據(jù)點(diǎn)的值是基于所述經(jīng)平滑的數(shù)據(jù)點(diǎn)局部的多個(gè)原始數(shù)據(jù)點(diǎn)的值;以及ii) 計(jì)算所述經(jīng)平滑的數(shù)據(jù)集與所述原始數(shù)據(jù)集之間的殘差; 計(jì)算所述經(jīng)平滑的數(shù)據(jù)集與所述原始數(shù)據(jù)集之間的所述殘差的第二量度;以及將所述第一量度與所述第二量度進(jìn)行比較以判定所述原始數(shù)據(jù)集是否呈 現(xiàn)線性品質(zhì)。
20. 如權(quán)利要求19所述的PCR檢測(cè)系統(tǒng),其特征在于,擬合所述原始數(shù)據(jù)集 包括使用最小二乘方擬合。
21. 如權(quán)利要求19所述的PCR檢測(cè)系統(tǒng),其特征在于,計(jì)算所述經(jīng)平滑的數(shù) 據(jù)集包括使用低通濾波器。
22. 如權(quán)利要求19所述的PCR檢測(cè)系統(tǒng),其特征在于,經(jīng)平滑的數(shù)據(jù)點(diǎn)的值 是落在包圍所述經(jīng)平滑的數(shù)據(jù)點(diǎn)的窗口內(nèi)的所述原始數(shù)據(jù)點(diǎn)的平均值。
23. 如權(quán)利要求19所述的PCR檢測(cè)系統(tǒng),其特征在于,所述第一量度與所述 第二量度各自為標(biāo)準(zhǔn)偏差。
24. 如權(quán)利要求19所述的PCR檢測(cè)系統(tǒng),其特征在于,所述比較包括計(jì)算所 述第一與第二量度的比值以便判定所述比值是小于還是大于預(yù)定值。
全文摘要
提供了用于處理具有噪聲的數(shù)據(jù)集以判定該數(shù)據(jù)集是否呈現(xiàn)統(tǒng)計(jì)線性品質(zhì)的方法、裝置和系統(tǒng)?;跀?shù)據(jù)的局部特性計(jì)算真實(shí)數(shù)據(jù)信號(hào),而根據(jù)真實(shí)數(shù)據(jù)信號(hào)對(duì)數(shù)據(jù)中的噪聲進(jìn)行估算。然后,將估算噪聲的量度與數(shù)據(jù)集的線性擬合特性進(jìn)行比較。
文檔編號(hào)G06F19/00GK101292245SQ200680016219
公開日2008年10月22日 申請(qǐng)日期2006年5月12日 優(yōu)先權(quán)日2005年5月13日
發(fā)明者J·雷納 申請(qǐng)人:生物輻射實(shí)驗(yàn)室股份有限公司