欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

質(zhì)譜法生物標(biāo)記測(cè)定的制作方法

文檔序號(hào):5831046閱讀:399來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):質(zhì)譜法生物標(biāo)記測(cè)定的制作方法
專(zhuān)利說(shuō)明質(zhì)譜法生物標(biāo)記測(cè)定 本發(fā)明涉及對(duì)生物標(biāo)記的測(cè)定。特別是,本發(fā)明描述了能夠通過(guò)質(zhì)譜法自動(dòng)篩選樣品中生物標(biāo)記的存在的多重測(cè)定。
多種生物學(xué)標(biāo)記,稱(chēng)為生物標(biāo)記,已經(jīng)通過(guò)生化和分子生物學(xué)應(yīng)用于醫(yī)學(xué)和毒理狀態(tài)而被鑒定和研究。生物標(biāo)記可在組織和生物液中發(fā)現(xiàn),所述血液是用于生物標(biāo)記研究的最常見(jiàn)生物液。
生物標(biāo)記可具有可預(yù)測(cè)的能量,并且因而可用于預(yù)測(cè)或檢測(cè)特定病癥或疾病的存在,水平,類(lèi)型或階段(包括特定微生物或毒素的存在或水平),對(duì)特定病癥或疾病的易感性(包括遺傳易感性),或?qū)μ囟ㄖ委煹姆磻?yīng)(包括藥物治療)。據(jù)認(rèn)為,通過(guò)提高研究和研發(fā)計(jì)劃的效能,生物標(biāo)記將在藥物發(fā)現(xiàn)和研發(fā)的未來(lái)起著越來(lái)越重要的作用。生物標(biāo)記可用作診斷試劑,疾病進(jìn)展的監(jiān)控物,治療的監(jiān)控物和臨床結(jié)果的預(yù)測(cè)物。例如,多種生物標(biāo)記研究計(jì)劃正試圖鑒定特定癌癥和特定心血管和免疫疾病的標(biāo)記物。
完整的蛋白可利用基于凝膠以及液相的分離技術(shù)以多種方式測(cè)定。使用了具有溶解的蛋白的二維凝膠電泳,其中蛋白根據(jù)電荷和大小被分離。蛋白被分離,使得同質(zhì)異構(gòu)形式以及翻譯后的修飾分離。通過(guò)染色技術(shù)定量蛋白,其中可利用預(yù)染色和后染色技術(shù)。代謝標(biāo)記也允許線性范圍延伸多達(dá)5個(gè)數(shù)量級(jí),提供毫微微摩爾(femtomolar)范圍內(nèi)的靈敏度。從切除的凝膠斑進(jìn)行蛋白鑒定?;瘜W(xué)降解和修飾之后消化蛋白。產(chǎn)生的肽混合物從分離的凝膠樣品中抽提,并且然后通過(guò)質(zhì)譜法鑒定。
多維HPLC(高效液相色譜)可用作分離蛋白或肽的良好的替代方法。蛋白或肽混合物連續(xù)通過(guò)產(chǎn)生更高分辨率的色譜固定相或維度。HPLC對(duì)于許多實(shí)驗(yàn)方法是靈活的,并且可由于它們?cè)诜蛛x感興趣的特定蛋白或肽類(lèi)中的適宜性和相互之間以及與下游檢測(cè)和鑒定質(zhì)譜方法的兼容性而選擇多種固定和活動(dòng)相。高效液相色譜法目前對(duì)于溶質(zhì)分離是最好的方法,其也允許高度再現(xiàn)地自動(dòng)化操作。這些類(lèi)型的多裝置分離平臺(tái)的在線構(gòu)造普遍地應(yīng)用于蛋白質(zhì)組學(xué)研究中。
質(zhì)譜法(MS)也是一種蛋白質(zhì)組學(xué)領(lǐng)域的關(guān)鍵要素。事實(shí)上,MS是此領(lǐng)域中用于研究和表征純化蛋白的主要工具。蛋白質(zhì)組和MS的界面連接,展現(xiàn)出數(shù)百或數(shù)千的蛋白,是通過(guò)凝膠技術(shù)產(chǎn)生的,其中在單個(gè)凝膠上可獲得高分辨率。研究者正成功地利用MS的能力以代替原先給予蛋白質(zhì)組動(dòng)力的二維凝膠。
質(zhì)譜法(MS)的應(yīng)用和發(fā)展以鑒定通過(guò)液相分離技術(shù)和/或基于凝膠的分離技術(shù)分離的蛋白質(zhì)或肽已經(jīng)在蛋白質(zhì)和肽表達(dá)分析中產(chǎn)生了顯著技術(shù)進(jìn)步。對(duì)于蛋白質(zhì)和肽的質(zhì)譜表征有兩種主要的方法基質(zhì)輔助激光解吸電離(MALDI)和電霧化離子化(ESI)。利用多種方法,MALDI和ESI離子來(lái)源可與飛行時(shí)間(TOF)或其他類(lèi)型的質(zhì)譜分析法組合以確定肽的質(zhì)量或序列。
在MALDI中,肽與基質(zhì)共結(jié)晶,并且用激光脈沖。這種處理使肽蒸發(fā)和離子化。帶電的肽的分子量(質(zhì)量)然后在TOF分析器中確定。在這種裝置中,電場(chǎng)加速了帶電分子朝向檢測(cè)器,并且其使得離子化的肽到達(dá)檢測(cè)器的時(shí)長(zhǎng)的差異(它們的飛行時(shí)間)揭示了肽的分子量,更小的肽更快地到達(dá)檢測(cè)器。這種方法產(chǎn)生了肽混合物的質(zhì)量輪廓-也就是,混合物中肽的分子量和數(shù)量的輪廓。這種輪廓可然后用于從蛋白質(zhì)序列數(shù)據(jù)庫(kù)中鑒定已知的蛋白質(zhì)。
通過(guò)將ESI-MS界面制備到液相色譜(LC/MS/MS),來(lái)自LC-柱的洗脫肽被引入質(zhì)譜儀的離子源中。對(duì)非常細(xì)的針施加電壓。然后所述針將液滴噴入質(zhì)譜分析器中,在其中所述液滴蒸發(fā)并且肽離子相應(yīng)于各種電荷狀態(tài)并從測(cè)定序列的位置釋放,所述電荷狀態(tài)是分段的(fragmented)。在LC/MS/MS中,研究者利用了微毛細(xì)管LC裝置以最初分離肽。
質(zhì)譜法(MS)是一種有價(jià)值的分析技術(shù),因?yàn)樗叨褥`敏地測(cè)量生物分子的內(nèi)在性質(zhì)。因此MS可用于測(cè)量寬范圍的分子類(lèi)型(蛋白,肽,或任何其他生物分子)和寬范圍的樣品類(lèi)型/生物材料。正確的樣品制備已知對(duì)于MS信號(hào)產(chǎn)生和光譜分辨和靈敏度是關(guān)鍵的。樣品制備因此對(duì)于分析的總的可行性和靈敏度是關(guān)鍵的。
蛋白是很難通過(guò)液相色譜分離技術(shù)分離的生物大分子,因?yàn)樵谏V柱材料,固定相,的顆粒中的不利的物質(zhì)轉(zhuǎn)移。然而,可通過(guò)將連接兩個(gè)相鄰氨基酸的肽鍵破壞而使蛋白成為更小單元(肽或多肽)形式。這可通過(guò)蛋白酶,能夠相互作用和溶解其他蛋白上的肽鍵的蛋白,的酶切而完成。胰蛋白酶是最常用的蛋白酶,用于蛋白表達(dá)分析研究中。酶降解之后,產(chǎn)生的肽復(fù)合混合物將通過(guò)毛細(xì)管色譜法分離和分餾。樣品中消化蛋白的全體的所有肽在此階段是未分離的。從相應(yīng)蛋白產(chǎn)生的肽在色譜分餾步驟中將不會(huì)分離為一個(gè)單元,而是與從樣品中所有其他蛋白產(chǎn)生的肽一起分離。來(lái)自毛細(xì)管的高度拆分(resolved)和分離的洗脫肽,最通常地基于電荷和疏水性而被分餾。分離的肽從平臺(tái)的色譜部分在線引入質(zhì)譜儀,由此避免可能的污染。肽然后進(jìn)行質(zhì)量測(cè)定(m/z),以捕獲在給定時(shí)間窗口中的所有肽。接下來(lái),為測(cè)序(MS/MS)而選擇許多肽質(zhì)量,基于它們?cè)诮o定的時(shí)間窗口的豐度(abundance)。這依靠電霧化離子化離子阱質(zhì)譜系統(tǒng)通過(guò)新的離子取樣界面而進(jìn)行。界面利用線性四極作為離子導(dǎo)向器和離子阱以提高阱的性能。在線性四極中捕獲的離子證明提高了系統(tǒng)的負(fù)載循環(huán)。在線性四極中捕獲的離子的偶極激發(fā)用于噴射不需要的離子。
在1990年第一次成功地使用儀器之后,利用電霧化離子化(ESI)的離子阱質(zhì)譜法已經(jīng)成為用于痕量分析的廣泛使用的工具。電霧化是可離子化重要分析物例如肽和蛋白的緩和的來(lái)源。ESI中產(chǎn)生的高度帶電的離子可擴(kuò)展質(zhì)量分析器的范圍。阱質(zhì)譜儀具有良好的性能例如靈活的串聯(lián)的MS性能(MS n......)。在本離子化方法中,通過(guò)在一些形成的片段離子在阱中不穩(wěn)定的條件下加速入質(zhì)量選擇性線性離子阱而活化前體離子。時(shí)間遲延之后,改變離子阱的穩(wěn)定性參數(shù)以允許先前為不穩(wěn)定的片段的捕獲。結(jié)果是源于具有改變的內(nèi)能分配的前體離子的產(chǎn)品離子光譜。允許前體離子進(jìn)入線性離子阱之后,遵循前體內(nèi)能分配的演變?cè)S多毫秒是可能的。時(shí)間-延遲的片段化產(chǎn)品離子光譜典型地顯示出降低的連續(xù)的片段化產(chǎn)品,產(chǎn)生更容易解釋的光譜。對(duì)于時(shí)間-遲延的片段化重要的幾種重要實(shí)驗(yàn)參數(shù)已被鑒定并被討論。這些技術(shù)對(duì)于小前體離子和多電荷肽都是有用。
串聯(lián)質(zhì)譜法(MS/MS)是大多數(shù)對(duì)于復(fù)合混合物的現(xiàn)代質(zhì)譜研究的核心。片段化涉及通過(guò)與目標(biāo)氣體碰撞的前體離子的活化,并且可產(chǎn)生帶電和中性的片段。片段離子的性質(zhì),以及它們的強(qiáng)度,通常指示了前體離子的結(jié)構(gòu)并且因而可產(chǎn)生對(duì)于鑒定未知分析物的有用信息,并提供用于不同類(lèi)分析物的有用的篩選技術(shù)。通過(guò)多種碰撞的活化延長(zhǎng)了活化時(shí)間并且使得更高的能量?jī)?chǔ)存入前體離子中。更高的碰撞氣體壓力也暗示了更高的碰撞弛豫率。
在通過(guò)2D凝膠電泳的蛋白分離和通過(guò)質(zhì)譜法的分析的結(jié)合已被建立為用于生物標(biāo)記分析的同時(shí),能夠分析幾種生物標(biāo)記的多系統(tǒng)目前正處于實(shí)驗(yàn)階段。
許多疾病已經(jīng)顯示出與生物標(biāo)記的復(fù)合模式有關(guān),其可以用于診斷疾病或指示病人對(duì)藥物治療的反應(yīng)。這些模式經(jīng)常涉及幾種生物標(biāo)記,需要多種同時(shí)的分析。因此,需要能夠同時(shí)測(cè)試多種生物標(biāo)記的系統(tǒng)。理想地,該系統(tǒng)可以是自動(dòng)化的。
發(fā)明概述 本發(fā)明提供了對(duì)于樣品中生物標(biāo)記的測(cè)定,其是自動(dòng)化的并且是精確的。本測(cè)定依賴(lài)于質(zhì)譜法以鑒定生物標(biāo)記,并且在本文中稱(chēng)為質(zhì)譜法生物標(biāo)記測(cè)定(MSBA)。
本發(fā)明提供了用于確定一種或多種多肽生物標(biāo)記在,優(yōu)選,人測(cè)試樣品中的存在的方法,其可包括非人測(cè)試樣品,其典型地限制于一定體積的生物液中,所述生物液包含天然存在的蛋白和包含在一定量的組織,血液或其他臨床上獲得的樣本中的肽。
本方法優(yōu)選包含下述步驟 (a)使樣品進(jìn)行質(zhì)譜(MS)分析并記錄每個(gè)檢測(cè)信號(hào)的保留時(shí)間指數(shù)和相應(yīng)的質(zhì)量; (b)使相應(yīng)于每個(gè)信號(hào)的質(zhì)量與參考數(shù)據(jù)庫(kù)相關(guān)聯(lián),所述參考數(shù)據(jù)庫(kù)含有來(lái)自已知疾病或生物改變的標(biāo)準(zhǔn)組的生物標(biāo)記質(zhì)量,以形成每個(gè)測(cè)試樣品信號(hào)和來(lái)自參考數(shù)據(jù)庫(kù)中標(biāo)準(zhǔn)組生物標(biāo)記的生物標(biāo)記之間的相關(guān)性,并拋棄那些質(zhì)量不與主數(shù)據(jù)組中的參考生物標(biāo)記質(zhì)量相關(guān)的測(cè)試信號(hào); (c)儲(chǔ)存那些質(zhì)量與標(biāo)準(zhǔn)數(shù)據(jù)中的參考生物標(biāo)記相關(guān)的測(cè)試樣品信號(hào); (d)通過(guò)利用相似性度量將每個(gè)信號(hào)的MS光譜與數(shù)據(jù)庫(kù)中參考生物標(biāo)記的MS光譜匹配,確定每個(gè)儲(chǔ)存信號(hào)和參考生物標(biāo)記之間的相關(guān)性,以界定一組陽(yáng)性相關(guān)信號(hào); (d)測(cè)量陽(yáng)性相關(guān)的每個(gè)儲(chǔ)存測(cè)試信號(hào),并利用辨別函數(shù)對(duì)它的絕對(duì)信號(hào)強(qiáng)度或相對(duì)信號(hào)強(qiáng)度記分; (e)將閾值應(yīng)用于獲自辨別函數(shù)的得分值,以確定生物標(biāo)記的存在或不存在。
優(yōu)選,本發(fā)明的方法利用測(cè)試樣品篩選階段的主數(shù)據(jù)組(masterdata set)。
有利地,本方法過(guò)濾和篩選數(shù)據(jù)組的質(zhì)量和序列特性,所述特性基于與主數(shù)據(jù)組中某種鑒定的蛋白序列相關(guān)的電荷,質(zhì)量,序列光譜的唯一性質(zhì)。
因此,在第一方面,本發(fā)明提供了用于確定在樣品中一種或多種多肽生物標(biāo)記的存在的方法,包括步驟 (a)使樣品進(jìn)行質(zhì)譜(MS)分析并記錄每個(gè)檢測(cè)信號(hào)的保留時(shí)間指數(shù)和對(duì)應(yīng)的質(zhì)量; (b)使對(duì)應(yīng)于每個(gè)信號(hào)的質(zhì)量與生物標(biāo)記質(zhì)量的參考數(shù)據(jù)庫(kù)相關(guān)聯(lián),以形成每個(gè)信號(hào)和參考生物標(biāo)記之間的相關(guān)性,并拋棄那些質(zhì)量不與參考生物標(biāo)記質(zhì)量相關(guān)的信號(hào); (c)儲(chǔ)存那些質(zhì)量與參考生物標(biāo)記相關(guān)的信號(hào); (d)通過(guò)利用相似性度量將每個(gè)信號(hào)的MS光譜與數(shù)據(jù)庫(kù)中參考生物標(biāo)記的MS光譜匹配,確認(rèn)每個(gè)儲(chǔ)存信號(hào)和參考生物標(biāo)記之間的相關(guān)性,以界定一組陽(yáng)性相關(guān)信號(hào); (d)測(cè)量每個(gè)陽(yáng)性相關(guān)信號(hào)的強(qiáng)度,并利用辨別函數(shù)對(duì)它的絕對(duì)信號(hào)強(qiáng)度或相對(duì)信號(hào)強(qiáng)度記分; (e)將閾值應(yīng)用于獲自辨別函數(shù)的得分值,以確定生物標(biāo)記的存在或不存在。
本發(fā)明的方法允許使用者同時(shí)分析樣品中成百上千的生物標(biāo)記。本方法依賴(lài)于生物標(biāo)記的數(shù)據(jù)庫(kù),其已經(jīng)顯示為與疾病相關(guān),其包含了每個(gè)生物標(biāo)記的質(zhì)量和光譜數(shù)據(jù),并且允許所述生物標(biāo)記通過(guò)MSBA軟件在給定的樣品中精確地鑒定。通過(guò)篩選存在于樣品中的肽并基于保留時(shí)間指數(shù)排除不期望的序列,其與肽到達(dá)MS檢測(cè)器的時(shí)間相關(guān),超過(guò)30,000個(gè)序列可在數(shù)分鐘內(nèi)被分析,并且給定的生物標(biāo)記高度置信地鑒定。本方法是可自動(dòng)化的,高通量的,并且可被相對(duì)不熟練的技術(shù)人員操作。
樣品可在不進(jìn)行先前分離操作而進(jìn)行MS分析。在所述實(shí)施方式中,優(yōu)選通過(guò)利用靜電納米電霧化原理直接輸注,流動(dòng)注射或樣品富集流動(dòng)注射,而分析樣品。
有利地,在MS分析之前處理樣品,優(yōu)選在將它們負(fù)載到MS上之前分離樣品成分。例如,樣品處理包括通過(guò)單相或多相高壓液相色譜法(HPLC)的樣品分離。
MS系統(tǒng)自身優(yōu)選是電霧化離子化(ESI)MS,基質(zhì)輔助激光解吸電離-飛行時(shí)間(MALDI-TOF)MS或表面增強(qiáng)激光解吸電離-飛行時(shí)間(SELDI-TOF)MS。
根據(jù)本發(fā)明的方法有利地是自動(dòng)化的并且在計(jì)算機(jī)控制下實(shí)施。通過(guò)與所述生物標(biāo)記的參考數(shù)據(jù)比較而鑒定樣品中生物標(biāo)記;優(yōu)選,多種生物標(biāo)記的參考質(zhì)量和MS光譜數(shù)據(jù)儲(chǔ)存在計(jì)算機(jī)上。
對(duì)于給定的生物標(biāo)記的參考MS光譜優(yōu)選是通過(guò)聚類(lèi)計(jì)算(clustering calculation)而由實(shí)際和測(cè)量數(shù)據(jù)獲得的平均光譜。
本發(fā)明的方法可以兩種方式實(shí)現(xiàn);利用內(nèi)標(biāo)以提供用于定量信號(hào)強(qiáng)度的參考,和不利用所述標(biāo)準(zhǔn)。因而,在一個(gè)實(shí)施方式中,在通過(guò)MS分析之前將一種或多種內(nèi)標(biāo)添加到樣品中。優(yōu)選,內(nèi)標(biāo)是標(biāo)記的。
在本發(fā)明的所述實(shí)施中,通過(guò)測(cè)量生物標(biāo)記信號(hào)強(qiáng)度并將它與一種或多種已知內(nèi)標(biāo)的信號(hào)強(qiáng)度比較,而對(duì)每個(gè)生物標(biāo)記信號(hào)的絕對(duì)信號(hào)強(qiáng)度記分。
在替代實(shí)施中,不添加內(nèi)標(biāo)處理樣品。在所述實(shí)施方式中,通過(guò)測(cè)量患者中個(gè)別生物標(biāo)記信號(hào)強(qiáng)度與患者組的參考信號(hào)強(qiáng)度之間的比例,而對(duì)相對(duì)信號(hào)強(qiáng)度記分。
生物標(biāo)記可描述為“客觀地測(cè)量并評(píng)價(jià)為正常生物過(guò)程,病理過(guò)程,或?qū)χ委煾深A(yù)的藥理反應(yīng)的指示的一種特征”。生物標(biāo)記是與特定病癥或疾病相關(guān)的任何可鑒定和可測(cè)量的指示物,所述情況下具有生物標(biāo)記存在或水平與所述病癥或疾病的一些方面的相關(guān)性(包括所述病癥或疾病的存在,水平或改變的水平,類(lèi)型,階段,易感性,或?qū)τ糜谥委熕霾“Y或疾病的藥物的反應(yīng)性)。相關(guān)性可以是定性,定量,或定性和定量。典型地,生物標(biāo)記是化合物,化合物片段或化合物組。所述化合物可以是發(fā)現(xiàn)于或產(chǎn)生自生物體的任何化合物,包括蛋白(和肽),核酸和其他化合物。
樣品可以是任何感興趣的生物物質(zhì),但有利地是生物組織并且優(yōu)選地是生物液例如血液或血漿。
本發(fā)明的方法依賴(lài)于觀察到的MS信號(hào)與已知生物標(biāo)記的參考質(zhì)量和MS光譜的相關(guān)性。參考數(shù)據(jù)優(yōu)選儲(chǔ)存在計(jì)算機(jī)服務(wù)器上,其允許整個(gè)方法在計(jì)算機(jī)控制下實(shí)施。
通過(guò)比較將信號(hào)與參考標(biāo)準(zhǔn)相關(guān),例如利用如本文所述計(jì)算機(jī)函數(shù)。優(yōu)選地,信號(hào)根據(jù)是否獲得相似性的閾值表征為“陽(yáng)性”或“陰性”;陰性并且不獲得相似性閾值的信號(hào)在MSBA方法中被拋棄,同時(shí)那些陽(yáng)性的信號(hào)與生物標(biāo)記匹配并且導(dǎo)致對(duì)生物樣品中所述生物標(biāo)記的存在的診斷。
根據(jù)MSBA測(cè)定的實(shí)施,參考添加到生物樣品中的已知對(duì)照標(biāo)準(zhǔn),或通過(guò)與患者組中計(jì)算出的參考強(qiáng)度比較,而測(cè)量信號(hào)強(qiáng)度。
在用標(biāo)準(zhǔn)實(shí)施的情況下,通過(guò)存在于樣品中的生物標(biāo)記信號(hào)和添加到樣品中的內(nèi)標(biāo)的比例而計(jì)算生物標(biāo)記信號(hào)的MSBA得分。在多重測(cè)定中的所有生物標(biāo)記將以相同方式分析,導(dǎo)致最終的MSBA得分因子。
為在MSBA方法中建立絕對(duì)的定量,優(yōu)選利用內(nèi)部(calibrant)標(biāo)準(zhǔn)。所述標(biāo)準(zhǔn)例如是同位素標(biāo)記的,使得測(cè)定讀出在蛋白序列方面高度精確,并且在絕對(duì)定量方面是有利的。在MSBA篩選中校準(zhǔn)序列的建立將允許血液或任何其他臨床樣品中絕對(duì)蛋白生物標(biāo)記水平的測(cè)量。
提供了一種新方法,由用于檢測(cè)和定量蛋白序列生物標(biāo)記的多個(gè)連接步驟組成,具有多重的讀出,其中2-100個(gè),但不限于其,的生物標(biāo)記的表達(dá)水平可在單個(gè)MSBA讀出中描繪出(mapped)。MSBA系統(tǒng)建立于液相平臺(tái)上,其可處理單線診斷描繪,或同時(shí)平行處理樣品的多重配置流程,由此提高系統(tǒng)的容量和通量。MSBA方法的檢測(cè)模式是通過(guò)質(zhì)譜法的精確的質(zhì)量鑒定和序列確定和接下來(lái)的定量。
本方法可應(yīng)用于任何類(lèi)型的生物樣品,其為液體形式或可轉(zhuǎn)化為液體形式。MSBA方法還可處理來(lái)自任何類(lèi)型的細(xì)胞的,或生物技術(shù)的方法的樣品,其中例如測(cè)量相對(duì)于時(shí)間的動(dòng)力學(xué)輪廓。通過(guò)接下來(lái)隨著時(shí)間樣品自動(dòng)地引入MSBA平臺(tái),實(shí)施相對(duì)于時(shí)間的分析。MSBA診斷輪廓測(cè)量的整個(gè)分析能力是完全計(jì)算機(jī)控制的,包括通過(guò)衡量區(qū)別和最終MSBA得分診斷的質(zhì)量信號(hào)評(píng)價(jià),序列分析,多重定量。在此平臺(tái)上運(yùn)行的MSBA循環(huán)中的所有中間步驟通過(guò)專(zhuān)用算法進(jìn)行評(píng)價(jià),所述專(zhuān)用算法作出精確的判定,從產(chǎn)生于自任何給定的生物樣品的MSBA分析的每個(gè)循環(huán)的大量數(shù)據(jù)中作出判定。
MSBA方法使得鑒定了特定肽以及其生物化學(xué)修飾的變體的鑒定,其表現(xiàn)為分離的實(shí)體或存在于蛋白和肽的復(fù)合混合物之內(nèi)。每種肽可通過(guò)特定的氨基酸序列限定,其可通過(guò)其精確的質(zhì)量或其對(duì)于給定的免疫學(xué)試劑的獨(dú)特免疫親和結(jié)合性質(zhì)而選擇性鑒定。
本方法允許鑒定統(tǒng)計(jì)學(xué)顯著的蛋白性質(zhì)和其修飾形式。而且,可能測(cè)量樣品中每種生物標(biāo)記的相對(duì)數(shù)量,甚至在不利用內(nèi)標(biāo)的情況下。或者,通過(guò)利用內(nèi)標(biāo)可對(duì)任何給定生物樣品中每種生物標(biāo)記分別進(jìn)行絕對(duì)定量,其中內(nèi)標(biāo)(例如,n=1-20)是生物標(biāo)記的蛋白序列。這些內(nèi)標(biāo)可然后制定為冷(cold)氨基酸序列,或?yàn)橥凰貥?biāo)記氨基酸序列。除了可能的標(biāo)記例外之外,標(biāo)準(zhǔn)具有與選擇的生物標(biāo)記同一的序列。
本方法結(jié)合了產(chǎn)生特定的處理,離析,分離,和鑒定存在于生物材料樣品中的獨(dú)特蛋白序列的幾種關(guān)鍵步驟。本方法可應(yīng)用于人臨床樣品。本方法還可應(yīng)用于源于非人動(dòng)物的樣品。
我們提供了用于鑒定獨(dú)特蛋白序列的性質(zhì)的多步驟方法,所述性質(zhì)表現(xiàn)為例如來(lái)自生物樣品的原子質(zhì)量單元的實(shí)體,其已經(jīng)證明在給定的多重生物標(biāo)記組中具有數(shù)量上的改變,其大小例如在給定樣品中可在2-100的范圍內(nèi)變動(dòng)。
我們還提供了確定或確認(rèn)在任何特定生物樣品中的生物標(biāo)記具有蛋白序列的生物標(biāo)記組的多重?cái)?shù)量改變的方法,其在臨床,細(xì)胞或任何其他類(lèi)型樣品中被預(yù)先確定。這種數(shù)量改變最終通過(guò)MSBA算法計(jì)算以產(chǎn)生MSBA得分,其將成為診斷性讀出。
而且,統(tǒng)計(jì)學(xué)顯著的相似性可被檢測(cè)并登記為獨(dú)特的蛋白序列性質(zhì)或多種肽的性質(zhì)。確定統(tǒng)計(jì)學(xué)顯著的相似性涉及利用公眾可獲取的蛋白和基因序列數(shù)據(jù)庫(kù)以及特別為滿足MSBA方法的要求而發(fā)展的算法。
用于生物標(biāo)記鑒定的方法步驟的整合是有利的。整合的方法依賴(lài)于下述原理1)高質(zhì)量的生物醫(yī)學(xué)臨床材料,2)具有接下來(lái)的液相分離的可再現(xiàn)和高速的樣品處理,3)精確的定量和定性確定多重組的生物標(biāo)記和4)將依次控制數(shù)據(jù)產(chǎn)生和計(jì)算和允許多重蛋白序列組中生物標(biāo)記的分離的算法。
附圖簡(jiǎn)述

圖1顯示了MSBA原理的示意圖。
圖2更詳細(xì)地例示了MSBA中涉及的數(shù)據(jù)處理方法。
圖3顯示了來(lái)自血樣的質(zhì)譜,所述血樣來(lái)自肺病患者。鑒定了樣品中的多種生物標(biāo)記。
圖4顯示了從多重測(cè)定中制作的生物標(biāo)記注解的例子,表現(xiàn)為MS光譜,其中通過(guò)MSBA軟件和接下來(lái)的代表產(chǎn)生的CVLFPYGGCQGNGNK生物標(biāo)記的MS/MS光譜識(shí)別生物標(biāo)記。
圖5顯示了如實(shí)施例2所述評(píng)價(jià)MSBA模型的可預(yù)測(cè)性的例子,所述MSBA模型對(duì)于19個(gè)患者的樣品數(shù)據(jù)具有11種生物標(biāo)記信號(hào)。利用了當(dāng)作盲樣品的10種例子和9種對(duì)照。利用等式5計(jì)算對(duì)于每個(gè)受試者的MSBA得分。在此實(shí)施例中,MSBA得分等于1或大于1的受試者診斷為病例(紅圈)。否則該受試者被認(rèn)為是對(duì)照(藍(lán)圈)。預(yù)測(cè)精確度是100%。
圖6顯示了如實(shí)施例3所述利用對(duì)于96個(gè)患者的樣品數(shù)據(jù)具有10種信號(hào)的MSBA模型的自身辨別結(jié)果。每個(gè)點(diǎn)代表一個(gè)患者,并且垂直軸線代表辨別得分(z),其利用等式6計(jì)算。如果得分>0,則將其解釋為病例(紅圈),否則該受試者被認(rèn)為是對(duì)照(藍(lán)圈)。預(yù)測(cè)精確度是83.3%。
發(fā)明詳述 生物標(biāo)記 FDA對(duì)于生物標(biāo)記的定義是“客觀地測(cè)量并評(píng)價(jià)為正常生物過(guò)程,病理過(guò)程,或?qū)χ委煾深A(yù)的藥理反應(yīng)的指示的一種特征”。
如本文所用,術(shù)語(yǔ)“生物標(biāo)記”指可用于監(jiān)測(cè)疾病的存在或進(jìn)展的多肽,與上述FDA定義一致。
生物標(biāo)記可用作診斷試劑,疾病進(jìn)展的監(jiān)測(cè)物,治療的監(jiān)測(cè)物和臨床結(jié)果的預(yù)測(cè)物。例如,多重生物標(biāo)記研究計(jì)劃正試圖鑒定特定癌癥和特定心血管和免疫疾病的標(biāo)記。
一些這些疾病相關(guān)蛋白可鑒定為新的藥物靶標(biāo),并且一些可用于疾病進(jìn)展的生物標(biāo)記。所述生物標(biāo)記可用于提高新藥的臨床研發(fā)或用于研發(fā)特定疾病的新的診斷法。
疾病相關(guān)蛋白是本領(lǐng)域已知的,并且已經(jīng)建立了它們用作疾病的生物標(biāo)記的用途。所述生物標(biāo)記可通過(guò)本發(fā)明方法監(jiān)測(cè)。然而,可鑒定新的疾病相關(guān)蛋白。例如,可通過(guò)下述方法獲得疾病相關(guān)蛋白的監(jiān)測(cè)。蛋白樣品獲取自單個(gè)患者或患者組。這些樣品可以是細(xì)胞,組織,或生物液,其被處理以提取和富集蛋白和/或肽組分。典型地,本方法需要分配入液相中,但也可包括附著于固體基質(zhì)的蛋白和/或肽成分的建立。分離和分析(蛋白質(zhì)組學(xué),肽組學(xué))之后,通過(guò)定性和定量測(cè)量對(duì)于疾病和健康受試者產(chǎn)生了蛋白表達(dá)指紋圖譜。這些指紋圖譜可用作區(qū)別個(gè)體和/或建立和/或追蹤某種自然或疾病過(guò)程的獨(dú)特的鑒定物。這些原型指紋圖譜對(duì)于每種獨(dú)立樣品/受試者建立,并在計(jì)算機(jī)數(shù)據(jù)庫(kù)中記錄為數(shù)值。然后利用生物信息工具分析該指紋圖譜,以鑒定和選擇蛋白或肽,所述蛋白或肽存在于原型指紋圖譜中并且其表達(dá)在源于健康和疾病受試者樣品中可有差別地存在或沒(méi)有差別地存在。這些蛋白/肽然后進(jìn)一步被表征并且產(chǎn)生了詳細(xì)的輪廓,其鑒定蛋白或肽的特征性物理性質(zhì)。單一的蛋白/肽或蛋白/肽組可被確定以與某種自然或疾病過(guò)程顯著相關(guān)。
質(zhì)譜法 質(zhì)譜法是用于蛋白和肽的分析的選擇方法?,F(xiàn)代生物標(biāo)記發(fā)現(xiàn)研究應(yīng)用了兩種主要質(zhì)譜法原理MALDI-TOF(基質(zhì)輔助激光解吸電離飛行時(shí)間)質(zhì)譜法,其中蛋白以晶體狀態(tài)進(jìn)行分析,和ESI(電霧化離子化)質(zhì)譜法,其中蛋白以液體狀態(tài)進(jìn)行分析。另外,MALDI的表面增強(qiáng)芯片應(yīng)用,稱(chēng)為表面增強(qiáng)激光解吸電離(SELDI),已被廣泛用于生物標(biāo)記發(fā)現(xiàn)研究中。見(jiàn)例如,Petricoin等人,Lancet,16,572-577,2002;Alexe等人,Proteomics.2004,4766-4783;和Liotta等人,EndocrRelat Cancer.2004 Dec;11(4)585-7。
表面增強(qiáng)激光解吸/電離(SELDI)-TOF-MS技術(shù)利用了結(jié)合于測(cè)定靶板的色譜表面。板上的蛋白結(jié)合材料然后通過(guò)MALDI-MS直接分析。SELDI測(cè)定主要是低分子量范圍的肽和蛋白。這種技術(shù)對(duì)于主要的,對(duì)于沒(méi)有整合出適當(dāng)?shù)脑谇暗募兓桨傅闹械蓉S富的肽和蛋白是可應(yīng)用的。SELDI技術(shù)主要導(dǎo)致一種模式,從該模式中,可利用肽的MALDI-TOF-TOF鑒定測(cè)序。
多-裝置分離平臺(tái)保證了利用電霧化離子化色譜法在線地,或利用離子化原理例如基質(zhì)輔助激光解吸電離色譜法的離線地,構(gòu)建高分辨率的肽分離方法。見(jiàn)例如,Aebersold,R.&Goodlett,D.R.Chem.Rev.2001,101,269-295;Mann,等人,Annu.Rev.Biochem,2001.70,437-473;Wolters,等人Anal.Chem.73,5683-5690(2001);和Washburn,等人,Nat.Biotechnol.19,242-247(2001)。
質(zhì)譜法(MS)也是蛋白質(zhì)組學(xué)領(lǐng)域的關(guān)鍵要素。事實(shí)上,MS是本領(lǐng)域用于研究和表征蛋白結(jié)構(gòu)和序列的主要工具。見(jiàn)Aebersold,R.&Mann,M.Mass spectrometry-based proteomics.Nature 422,198-207(2003);Steen,H.和M.Mann(2004).Nat Rev Mol Cell Biol 5(9)699-711;和Olsen,J.V.和M.Mann(2004)Proc Natl Acad Sci U S A101(37)13417-22。
研究者正成功地利用MS的功效以代替最初給予蛋白質(zhì)組推動(dòng)力的二維凝膠。利用ESI和液相色譜(LC)/MS/MS,將一種電壓應(yīng)用于一種非常細(xì)的針,所述針包含肽混合物,產(chǎn)生肽序列,從LC-柱洗脫。所述針然后將液滴噴射入質(zhì)譜分析器中,在其中液滴蒸發(fā)并且肽離子被釋放。在LC/MS/MS中,研究者利用了微毛細(xì)管LC裝置以起始地分離肽。
質(zhì)譜法(MS)是一種有價(jià)值的分析技術(shù),因?yàn)樗叨褥`敏地測(cè)量生物分子的內(nèi)在性質(zhì),它的質(zhì)量。因此,MS可用于測(cè)量寬范圍的樣品類(lèi)型/生物材料中的寬范圍的分子類(lèi)型(蛋白,肽,或任何其他生物分子)。
正確的樣品制備可影響MS信號(hào)產(chǎn)生和光譜分辨率和靈敏度。高分辨率分離系統(tǒng)例如單維高壓液相色譜法(LC)和多維液相色譜法(LC/LC)可直接與質(zhì)譜法連接。這種連接允許快速自動(dòng)化地獲得和收集大的數(shù)據(jù)組,其代表了在產(chǎn)生的質(zhì)譜中的定量和序列信息。這種整合的鳥(niǎo)槍蛋白質(zhì)組學(xué)技術(shù)稱(chēng)為MudPIT(多維蛋白鑒定技術(shù))。見(jiàn)Eng等人,J Am Soc Mass Spectrom 1994,5976-989;Link等人,NatBiotechnol.1999 Jul;17(7)676-82;Washburn等人,Nat Biotechnol.2001Mar;19(3)242-7;Lin等人,American Genomic/Proteomic Technology,2001 1(1)38-46;和Tabb等人,J.Proteome Res.2002 121-26。
在鳥(niǎo)槍蛋白質(zhì)組學(xué)方法中,分析通過(guò)特定蛋白消化酶例如胰蛋白酶和其他內(nèi)-和外-肽酶/蛋白酶產(chǎn)生的肽,而不是完整的蛋白。這種片段化提供了明確的優(yōu)點(diǎn),因?yàn)樯踔练浅4蟮牡鞍祝渚哂懈淖兊奈锢砗突瘜W(xué)特征例如非常疏水,或非常堿性的蛋白,可以被分析。所述蛋白類(lèi)否則是很難處理的。這些蛋白將產(chǎn)生大小和數(shù)量足以允許精確的蛋白注解和鑒定的肽混合物。然而,既然從各自每種蛋白產(chǎn)生了幾種肽,待分析混合物的復(fù)雜性提高了。結(jié)果,對(duì)于鳥(niǎo)槍方法需要相當(dāng)大的儀器時(shí)間和計(jì)算能力。然而,蛋白表達(dá)信息的資源是廣泛的,并且在完全自動(dòng)化的設(shè)置中產(chǎn)生,并且同時(shí)地實(shí)時(shí)鑒定蛋白。
為能夠處理代表了多種程度的疾病的不同患者樣品,可應(yīng)用不同方法調(diào)整和校準(zhǔn)產(chǎn)生的液相色譜法色譜和質(zhì)譜??赏ㄟ^(guò)一種軟件方法進(jìn)行這種歸一化,由此產(chǎn)生于整個(gè)實(shí)驗(yàn)的總的信號(hào)產(chǎn)生被利用并與多種分析患者樣品的總的信號(hào)產(chǎn)生進(jìn)行比較。所有信號(hào)的平均值和共同體將被校準(zhǔn)以允許差別定量。
在第二方法中,預(yù)定量的肽標(biāo)準(zhǔn)被添加到樣品中。這種添加將在樣品消化之前和之后,之前或之后進(jìn)行。利用的標(biāo)準(zhǔn)將是合成為同位素標(biāo)記序列的實(shí)際生物標(biāo)記序列,或沒(méi)有同位素標(biāo)記,并且加入樣品(spiked with the sample)。
在蛋白質(zhì)組學(xué)領(lǐng)域中標(biāo)記技術(shù)用于定量的臨床蛋白調(diào)整研究的用途是非常普遍的。通過(guò)利用多種結(jié)合化學(xué),多種標(biāo)記技術(shù)已經(jīng)被發(fā)展并且被應(yīng)用。在蛋白質(zhì)組學(xué)領(lǐng)域最普遍應(yīng)用的標(biāo)記是ICAT和ITRAQ標(biāo)記。見(jiàn)Parker等人,Mol.Cell.Proteomics,625-659,3,2004;Ross等人,Cell.Proteomics,3,1153-1169,2004;和DeSouza等人,J.ProteomeRes.,2005,4,377-386。
樣品分離 單,或多維HPLC(高效液相色譜)將用作用于分離蛋白或肽的優(yōu)選選擇方法。蛋白或肽混合物通過(guò)連續(xù)的色譜固定相或維,其產(chǎn)生更高的分辨率。HPLC對(duì)于許多實(shí)驗(yàn)方法是可適用的,并且可由于它們對(duì)于分離感興趣的特定蛋白或肽類(lèi)的適合性和相互之間和與下游監(jiān)測(cè)和鑒定質(zhì)譜方法的兼容性而選擇多種固定和移動(dòng)相。HPLC用于分離已被蛋白水解酶消化的臨床樣品,其中產(chǎn)生了相應(yīng)的酶產(chǎn)品,肽混合物。樣品制備方法應(yīng)用于蛋白樣品例如血液,組織,或任何其他類(lèi)型的生物液。見(jiàn)例如,Schulte等人,Expert Rev.Diagn.,5(2),2005,145-157;Chertov等人,Expert Rev.Diagn.,5(2),2005,139-145;Adkins等人,Mol.Cell.Proteomics,1(12),2002 947-955;Pieper等人,Proteomics.2003 Jul;3(7)1345-64;和Anderson,N.L.& Anderson,N.G.Mol.CellProteom.20021,845-867。
相應(yīng)的肽混合物通過(guò)連續(xù)的色譜固定相或維,其產(chǎn)生了高分辨率。HPLC對(duì)于許多實(shí)驗(yàn)方法是靈活的;在本發(fā)明的設(shè)置中,產(chǎn)生了一種特別地消除了在人血樣品中表達(dá)的高豐度組分的蛋白的最優(yōu)化,由此在中等,和低等豐度區(qū)域產(chǎn)生蛋白的富集。肽和蛋白的分離是基于肽序列,肽序列的功能組,以及物理性質(zhì)。
MSBA-操作原理 在將樣品進(jìn)行MSBA之前,在大多數(shù)情況下需要樣品處理和制備步驟。在MSBA方法之前引入此步驟是為了消除干擾試劑和基質(zhì)組分,由此促進(jìn)提高的總的可檢測(cè)性,導(dǎo)致注解以及總的靈敏性的增加。然而,在某些實(shí)施方案中,樣品制備可免除,特別是當(dāng)生物標(biāo)記處于更高的豐度并且樣品復(fù)雜性很低時(shí)。本領(lǐng)域技術(shù)人員將能夠確定制備步驟是否是關(guān)鍵的。
MSBA平臺(tái)可以多種不同方式操作,主要地通過(guò)樣品的性質(zhì)和其復(fù)雜性而確定。
通過(guò)多重分析在患者樣品中定性和定量確定生物標(biāo)記蛋白序列??衫脴?biāo)記和未標(biāo)記MSBA原理,根據(jù)兩種可能的原理利用MSBA測(cè)定構(gòu)型內(nèi)標(biāo)添加原理和沒(méi)有內(nèi)標(biāo)原理。
一般方法 樣品制備之后,樣品注射入MSBA平臺(tái)。
接下來(lái)采取下述操作; 步驟1A 首先,生物標(biāo)記MS-信號(hào)需要在樣品中鑒定。
在生物液樣品中篩選與保留時(shí)間指數(shù)和各自生物標(biāo)記相應(yīng)質(zhì)量相關(guān)的生物標(biāo)記名單質(zhì)量+/-1道爾頓的預(yù)先確定名單。獲自大多數(shù)MSBA測(cè)定的相關(guān)保留時(shí)間指數(shù)在數(shù)分鐘內(nèi)確定,并且具有大約+/-2%的可變性,然而這種數(shù)值可能改變。
如圖1所示,通過(guò)將實(shí)時(shí)質(zhì)譜與MSBA參考光譜庫(kù)匹配而實(shí)施這些步驟。
接下來(lái),將MS光譜中的質(zhì)量與生物標(biāo)記參考名單的質(zhì)量進(jìn)行比較,至大約+/-1道爾頓。
步驟1B 當(dāng)生物標(biāo)記候選質(zhì)量被鑒定為具有參考名單中+/-1Da之內(nèi)匹配的MS光譜的生物標(biāo)記時(shí),其信息保存在MSBA-服務(wù)器上。如果該質(zhì)量是不正確的,MSBA篩選不將光譜文件儲(chǔ)存到服務(wù)器上。
這些操作通過(guò)文件共享和進(jìn)程通信(例如用戶-服務(wù)器類(lèi)型通信)機(jī)制實(shí)施。
步驟2A 當(dāng)MS-光譜中的質(zhì)量特性被鑒定時(shí),開(kāi)始質(zhì)量鑒定和序列特性分析。
MSBA軟件之內(nèi)的模式匹配步驟將鑒定某種相似性度量,例如余弦相關(guān)性。利用相似性度量,確定了正確的蛋白序列。通過(guò)光譜匹配進(jìn)行這種確認(rèn)。通過(guò)比較樣品光譜和MSBA數(shù)據(jù)庫(kù)中的參考光譜進(jìn)行這種光譜匹配。對(duì)于此階段的陽(yáng)性特性,需要0.8或更高的余弦相關(guān)性因子以確認(rèn)精確的蛋白序列。對(duì)于替代的相似性度量的等價(jià)閾值對(duì)于本領(lǐng)域技術(shù)人員是明顯的。
參考光譜的比較和評(píng)價(jià)以下述方式進(jìn)行。
MS/MS光譜表示為一列成對(duì)數(shù)(doublets)(m,v),其中m代表質(zhì)荷比,v表示離子信號(hào)強(qiáng)度值。通過(guò)用mb的間隔對(duì)m進(jìn)行二進(jìn)制擴(kuò)展(binning),(mb=bin的實(shí)際寬度)MS/MS光譜還可表示為矢量其中它的長(zhǎng)度(n)等于bin的數(shù)量,并且每一要素(element)的值是在每一bin之內(nèi)的所有信號(hào)的強(qiáng)度總和。這是MS/MS光譜的輪廓(profile)表現(xiàn)。
兩種不同的MS/MS光譜

的余弦相關(guān)性(S)可如根據(jù)等式1(eq1)的余弦相關(guān)性計(jì)算
S的值在0到1之間變化。A值為0表示兩個(gè)矢量是完全獨(dú)立的,在S矢量值為1時(shí),這表示這兩個(gè)矢量的方向是相同的。
注意兩個(gè)MS/MS光譜矢量必須具有相同的二進(jìn)制擴(kuò)展(binning),即,如果一個(gè)矢量的m的二進(jìn)制擴(kuò)展(binning)是500-501,501-502,...1999-2000,則另一光譜必須以相同方式二進(jìn)制擴(kuò)展(binned)。結(jié)果,兩個(gè)矢量的長(zhǎng)度必須是相同的。
為判斷測(cè)量的MS信號(hào)是否是正確的生物標(biāo)記,測(cè)量信號(hào)的MS/MS部分被提取出來(lái),并通過(guò)利用例如上述余弦相關(guān)性與樣品的MS/MS參考光譜比較。
如果余弦相關(guān)性值S等于或大于預(yù)定的閾值,例如0.8,則判斷測(cè)量的信號(hào)源于參考組中的推定生物標(biāo)記。
下述部分描述了如何構(gòu)建從許多個(gè)體患者中作為組特異性光譜獲得的參考光譜。
對(duì)于每種候選生物標(biāo)記,一旦建立了所述生物標(biāo)記,應(yīng)收集幾種MS/MS光譜以構(gòu)建參考MS/MS光譜圖。這是來(lái)自實(shí)際和測(cè)量數(shù)據(jù)組的平均光譜,并且通過(guò)聚類(lèi)計(jì)算而獲得。
所述參考光譜的構(gòu)建的例子如下 (1)為目標(biāo)生物標(biāo)記收集多重MS/MS光譜。這些MS/MS光譜必須通過(guò)MASCOT,SEQUEST或其他程序以給定的確信水平確認(rèn)為獲自目標(biāo)生物標(biāo)記。
(2)研究了具有上述類(lèi)似性的每種收集的MS/MS光譜的相似性。這通過(guò)利用相似性度量的聚類(lèi)計(jì)算而實(shí)施。這種聚類(lèi)計(jì)算實(shí)施到相似性度量降低到預(yù)定閾值。這些聚類(lèi)計(jì)算之后,產(chǎn)生了在MS/MS光譜之內(nèi)的所有保留的蛋白序列離子的概括名單。接下來(lái)的步驟是除去來(lái)自聚類(lèi)計(jì)算的概括名單中的保留的蛋白序列離子。
(3)利用來(lái)自聚類(lèi)的建立的和合格的概括MS/MS光譜,可能計(jì)算光譜矢量的每種要素的算術(shù)平均數(shù)。這種平均矢量現(xiàn)在可用作MS/MS參考光譜。
(4)在聚類(lèi)方法過(guò)程中,可能獲得從患者組產(chǎn)生多于一種參考的結(jié)果。
a)在該例子中,有多于一種的聚類(lèi)包含在MS/MS光譜輪廓圖中的差別。設(shè)置于這些環(huán)境上的標(biāo)準(zhǔn)是這些組需要具有可信賴(lài)的目標(biāo)生物標(biāo)記鑒定。然后有可能產(chǎn)生和利用用于一種目標(biāo)的多于一種的參考光譜。如果具有在組中不同但與相同注解的蛋白相關(guān)的MS/MS片段離子,將出現(xiàn)所述情況。
b)還可能獲得具有聚類(lèi)分析數(shù)據(jù)的情形,其中具有生物標(biāo)記輪廓圖中的差別。那將表示可從患者群例如不同顯型中建立幾種個(gè)體組。在這些情況下,比較多重模式將是顯型特異性的。但是,在顯型之間還可能存在生物標(biāo)記重疊。
如下所例示的,這些確認(rèn)算法在高通量篩選操作的MSBA平臺(tái)之內(nèi)實(shí)時(shí)應(yīng)用和利用。
步驟2B 一旦鑒定了陽(yáng)性生物標(biāo)記質(zhì)量,質(zhì)譜儀(例如Finnigan LTQ)將停留在質(zhì)量目標(biāo)之上,以進(jìn)行生物標(biāo)記離子信號(hào)的重復(fù)掃描。掃描的數(shù)量將依賴(lài)于每種特定蛋白序列產(chǎn)生的得分匹配,但將校準(zhǔn)到生物標(biāo)記的陽(yáng)性特性。掃描窗口將通過(guò)MSBA軟件自動(dòng)確定。
對(duì)于陽(yáng)性相關(guān)性的標(biāo)準(zhǔn)在余弦相關(guān)性相似性度量中將是高于或等于0.8。
接下來(lái)的隨后步驟是通過(guò)利用具有蛋白數(shù)據(jù)庫(kù)的商業(yè)搜索引擎例如MSCOT或SEQUEST或任何其他搜索引擎產(chǎn)生蛋白序列的統(tǒng)計(jì)學(xué)顯著的特性,以確認(rèn)它是正確的生物標(biāo)記特性。
MSBA系統(tǒng)將僅僅儲(chǔ)存和存檔在生物標(biāo)記質(zhì)量和序列范圍之內(nèi)的信號(hào)和數(shù)據(jù)文件。產(chǎn)生自該測(cè)定的所有其他數(shù)據(jù)不轉(zhuǎn)移到MSBA數(shù)據(jù)庫(kù)。
步驟3 多重生物標(biāo)記測(cè)定讀出的計(jì)算 多重生物標(biāo)記測(cè)定讀出的計(jì)算通過(guò)應(yīng)用MSBA算法而實(shí)施,所述MSBA算法由計(jì)算診斷性MSBA得分的辨別函數(shù)組成。
辨別函數(shù)定義為函數(shù)x1,...,xn,其中xi代表第i個(gè)生物標(biāo)記的n絕對(duì)或相對(duì)信號(hào)強(qiáng)度。辨別函數(shù)的輸出根據(jù)診斷結(jié)果必須是陽(yáng)性或陰性值。例如,如果診斷為陽(yáng)性,辨別函數(shù)的輸出值必須是陽(yáng)性的,反之亦然。
例如,利用的辨別函數(shù)為等式2 其中n是用于診斷的多重生物標(biāo)記的數(shù)量。xi是第i個(gè)生物標(biāo)記的絕對(duì)或相對(duì)信號(hào)強(qiáng)度,并且xtotal是MS測(cè)量的總信號(hào)強(qiáng)度。
還有包括在MSBA軟件的算法中的權(quán)重因子。
矢量{a1,...,an,aθ}是確定分離的超平面法矢量的方向的權(quán)矢量,其將n維信號(hào)強(qiáng)度空間分為兩種診斷陽(yáng)性和診斷陰性。確定權(quán)矢量的方法的一個(gè)例子在后將進(jìn)行描述,然而,可利用多重算法,例如,支撐矢量機(jī)(Support Vector Machine),人工神經(jīng)網(wǎng)絡(luò)(Artificial NeuralNetwork)及其他,以確定權(quán)矢量。
辨別函數(shù)的另一例子包括在MSBA算法中并且定義如下 αfp(x1,...,xn)-βfn(x1,...,xn)(Eq3) 函數(shù)fp和fn是產(chǎn)生一組待診斷患者中的測(cè)量的生物標(biāo)記和數(shù)組MSBA服務(wù)器中的參考生物標(biāo)記信號(hào)之間的相似性或距離的度量的任意函數(shù)。fp表示來(lái)自診斷陽(yáng)性參考的相似性或差異函數(shù),并且fn表示來(lái)自診斷陰性參考的相似性或差異函數(shù)。
α和β是可用于不相等地加權(quán)診斷陽(yáng)性和診斷陰性度量的系數(shù)。
如果函數(shù)fp和fn產(chǎn)生了類(lèi)似性度量,則當(dāng)?shù)仁?產(chǎn)生陽(yáng)性值時(shí)患者樣品將診斷為陽(yáng)性。如果該函數(shù)產(chǎn)生距離度量,等式3的陽(yáng)性值表示診斷陰性。
所述函數(shù)的一個(gè)例子是歐幾里德距離(Euclidean distance),其中yi是在待診斷患者中第i個(gè)生物標(biāo)記信號(hào)強(qiáng)度, 并且xi是參考組的第i個(gè)生物標(biāo)記信號(hào)強(qiáng)度。
另一例子是以下式的回歸分析的預(yù)測(cè)值的標(biāo)準(zhǔn)誤差 其中n是生物標(biāo)記信號(hào)的數(shù)量,xi是患者樣品的第i個(gè)測(cè)量信號(hào)強(qiáng)度,并且yi是通過(guò)利用線性回歸線從每個(gè)xi中預(yù)測(cè)的值,其通過(guò)測(cè)量的xi的信號(hào)和參考信號(hào)之間最小二乘擬合而計(jì)算。
圖2中概述了整個(gè)軟件方案,包括控制方法內(nèi)的每個(gè)特定步驟的算法。
步驟4 生物標(biāo)記注解和定量 MSBA測(cè)定平臺(tái)建立在 A)分離的原理 B)非分離的原理 在非分離原理的情況中,我們能夠進(jìn)行生物標(biāo)記注解和定量,通過(guò) (a)直接的MS-分析 i)通過(guò)利用靜電納米電霧化原理將生物樣品直接輸注。利用一次性的納米噴射針,其中每個(gè)納米噴射針將僅僅暴露于一個(gè)生物樣品,由此回避了樣品超載和記憶效果。
ii)流動(dòng)注射分析模式,其中樣品作為插塞(plug)注射。插塞內(nèi)選擇的樣品體積與各自的生物標(biāo)記蛋白序列的信號(hào)強(qiáng)度直接相關(guān)。對(duì)于低豐度生物標(biāo)記還可能利用大(幾ml)樣品注射體積,由此到達(dá)質(zhì)譜儀的離子信號(hào)效能的飽和(穩(wěn)定狀態(tài))。
(iii)通過(guò)利用色譜固相提取富集柱的MS分析的樣品富集流動(dòng)注射。這種步驟允許同時(shí)清潔,通過(guò)清除樣品內(nèi)的基質(zhì)成分,和生物標(biāo)記的痕量富集。這種方法的優(yōu)點(diǎn)是有可能從高度復(fù)雜的樣品來(lái)源例如組織提取物中分析生物標(biāo)記。
另外,在樣品富集模式(iii)中,我們能夠產(chǎn)生在2-500范圍但不限于此的信號(hào)擴(kuò)增因子。另外,本方法將提高以低水平表達(dá)的生物標(biāo)記的可檢測(cè)性,以及蛋白序列注解的精確性。
B)在分離分析中,液相色譜法(LC)整合的生物標(biāo)記鑒定依賴(lài)于LC的高分辨率,其可在單柱模式中(見(jiàn)圖x)操作,或在多柱模式中利用柱轉(zhuǎn)換操作,其中樣品以連續(xù)模式分析,由此提高樣品通量。
MSBA編程 此處是計(jì)算權(quán)重矢量(或模型)和利用支撐矢量機(jī)算法預(yù)測(cè)診斷的核心部分的示例代碼。這種代碼以R-Language寫(xiě)成。一種模型(model)從訓(xùn)練數(shù)據(jù)組(train)構(gòu)建,并然后被利用以產(chǎn)生給定測(cè)試數(shù)據(jù)組(test)的預(yù)測(cè)(pred)。數(shù)據(jù)組train和test是包含多種數(shù)量的數(shù)據(jù)點(diǎn)的數(shù)據(jù)框架,其由包含診斷結(jié)果的目標(biāo)diag(分類(lèi)值“陽(yáng)性”或“陰性”,該值對(duì)于pred的例子是空的),和包含每個(gè)生物標(biāo)記的信號(hào)強(qiáng)度和總信號(hào)強(qiáng)度的矢量組成。MSBA編程將依賴(lài)于產(chǎn)生于在兩個(gè)患者組上實(shí)施的蛋白序列篩選的數(shù)據(jù),生物標(biāo)記產(chǎn)生于所述患者組。
在MSBA軟件之內(nèi)的編程通過(guò)下述方式實(shí)施 庫(kù)(e1071) model<-svm(Diag~.,數(shù)據(jù)=train) ##上述等式可計(jì)算模型,但太簡(jiǎn)單而不能反映等式2. ##選擇的支撐矢量是model$SV ##并且權(quán)重矢量是model$coefs pred<-predict(model,test) 實(shí)施例 下述實(shí)施例是來(lái)自肺癌研究的例示,所述研究通過(guò)在人血樣中的LC-MS蛋白輪廓測(cè)量而實(shí)施。分析了兩個(gè)患者組,具有差異蛋白表達(dá)差別的病例和對(duì)照癌癥組被分析。
實(shí)施例1 實(shí)驗(yàn)細(xì)節(jié) 從每個(gè)患者大約取6ml血到包含肝素鈉鹽的采樣試管中,并且上下混合2-3次。然后,在4℃下以2,000xg離心10分鐘。從上清液中獲得三ml的血漿。樣品在-80℃冷凍保存。接下來(lái),蛋白從血漿中抽提并且在耗盡豐富的人血漿白蛋白和IgG之后進(jìn)行胰蛋白酶消化。如前所述(WO06100446),等分試樣的分餾血漿樣品然后通過(guò)LC-MS,然后MS/MS進(jìn)行分析。
MSBA設(shè)計(jì) 多重生物標(biāo)記概括設(shè)計(jì)代表了在肺癌研究中患者生物標(biāo)記的多重表達(dá)數(shù)據(jù)。
產(chǎn)生于MSBA方法的10-重生物標(biāo)記診斷讀出分別例示了每個(gè)和每種生物標(biāo)記(見(jiàn)圖3)。數(shù)量差別,即在MSBA數(shù)據(jù)庫(kù)中已知和儲(chǔ)存的倍數(shù)改變的差別(見(jiàn)圖1)與數(shù)量差別一起用于測(cè)定生物標(biāo)記。產(chǎn)生于肺癌研究的生物標(biāo)記數(shù)據(jù)從診斷多重MSBA讀出中正確地將所有這些患者鑒定為陽(yáng)性。
所有這些10個(gè)患者的得分在0.80-1.0的范圍內(nèi)。
圖4顯示了從多重測(cè)定中得到的生物標(biāo)記注解的例子,其通過(guò)其中生物標(biāo)記被MSBA軟件識(shí)別的MS光譜,和接下來(lái)的代表了得到的CVLFPYGGCQGNGNK生物標(biāo)記的MS/MS光譜(見(jiàn)圖4)表示。MSBA匹配,利用應(yīng)用了余弦相關(guān)性的MSBA-數(shù)據(jù)庫(kù)中的參考生物標(biāo)記光譜,顯示余弦相關(guān)性等于或高于0.8。
表1代表MSBA-數(shù)據(jù)產(chǎn)生的細(xì)節(jié),其中分析了被調(diào)節(jié)的生物標(biāo)記的預(yù)定質(zhì)量。
表1 實(shí)施例2 下述另一實(shí)施例是源于肺疾病病例-對(duì)照研究,其通過(guò)在人血樣品中的LC-MS蛋白輪廓測(cè)量(profiling)而實(shí)施。分析兩個(gè)患者組,具有差異的蛋白表達(dá)分析的病例和對(duì)照肺疾病組。
實(shí)驗(yàn)細(xì)節(jié) 血漿樣品收集和制備的程序與上述實(shí)施例相同。
MSBA模型建立和評(píng)價(jià) 由10個(gè)病例和36個(gè)對(duì)照組成的46個(gè)患者樣品數(shù)據(jù)用于構(gòu)建MSBA模型。我們已經(jīng)分別構(gòu)建了包含14,8,26,8,和11個(gè)信號(hào)的5個(gè)不同的MSBA模型。組合了5個(gè)模型之后,顯示出最后的MSBA模型(5th)具有顯著的辨別能力。由此我們?cè)谙旅娌襟E中僅僅使用第5個(gè)模型。最后模型的11個(gè)信號(hào)的LC-MS信息(保留時(shí)間(分鐘)/MS-值(m/z))如下11.6/485.2,12.5/608.1,18.3/547.0,20.2/681.3,21.1/575.1,21.3/531.5,25.5/561.6,23.1/514.5,32.5/682.2,44.0/985.2,48.7/945.8。
為評(píng)價(jià)模型的可預(yù)測(cè)性,我們利用10個(gè)病例和9個(gè)對(duì)照嘗試預(yù)測(cè)病例/對(duì)照,將其當(dāng)作盲樣品。根據(jù)上述MSBA診斷程序(也例示于圖2),對(duì)每個(gè)測(cè)試樣品鑒定11-重生物標(biāo)記信號(hào),并進(jìn)行每個(gè)峰信號(hào)的定量。從所有11-重信號(hào)的數(shù)量中,利用上式(等式5)計(jì)算每個(gè)受試者的MSBA得分。在此實(shí)施例中,MSBA得分等于或大于1的受試者診斷為病例(表2,MSBA診斷)。結(jié)果,我們可正確預(yù)測(cè)所有樣品,即,辨別能力為100%(見(jiàn)圖5)。
實(shí)施例3 下述實(shí)施例也源于肺疾病病例-對(duì)照研究,其通過(guò)在兩個(gè)患者組(病例和對(duì)照)的人血樣品中的LC-MS蛋白輪廓測(cè)量(profiling)而實(shí)施。在此實(shí)施例中,另一組的多重生物標(biāo)記用于構(gòu)建MSBA模型,其具有大得多的不同患者數(shù)據(jù)組。
實(shí)驗(yàn)細(xì)節(jié) 血漿樣品收集和制備的程序與上述實(shí)施例相同。
MSBA模型建立和評(píng)價(jià) 由21個(gè)病例和75個(gè)對(duì)照組成的96個(gè)患者的樣品數(shù)據(jù)用作訓(xùn)練數(shù)據(jù)組。當(dāng)樣品數(shù)量提高時(shí),樣品變異性也提高。因此首先我們應(yīng)用了Smirnov測(cè)試以除去異常信號(hào)。結(jié)果,包含很多異常值的5個(gè)樣品也從分析組中除去。利用t-測(cè)試的結(jié)果,我們構(gòu)建了包含100個(gè)候選生物標(biāo)記信號(hào)的起始MSBA模型。然后通過(guò)遞歸地應(yīng)用判別式分析從辨別模型中除去最小貢獻(xiàn)信號(hào),最后我們獲得了具有10個(gè)信號(hào)的MSBA模型。見(jiàn)表3的10重標(biāo)記信號(hào)列表。
在此實(shí)施例中,為計(jì)算判別式得分(z),我們利用了另一下式表示的記分函數(shù)。
z=∑ai·xi+C(Eq.6) (xi信號(hào)強(qiáng)度,ai&C表3所述系數(shù)) 如果分值是陽(yáng)性,其解釋為病例,否則為對(duì)照。
為評(píng)價(jià)模型的可預(yù)測(cè)性,我們利用相同的數(shù)據(jù)組(21個(gè)病例+75個(gè)對(duì)照,總共96個(gè))嘗試預(yù)測(cè)病例/對(duì)照。根據(jù)上述MSBA診斷程序(也例示于圖2),對(duì)每個(gè)樣品鑒定了10-重生物標(biāo)記信號(hào),對(duì)每個(gè)峰信號(hào)進(jìn)行定量。從所有10-重信號(hào)的數(shù)量中,利用上式(等式6)計(jì)算每個(gè)受試者的MSBA得分。在此實(shí)施例中,MSBA得分等于或大于0的受試者診斷為病例。表4和圖6顯示自辨別結(jié)果。在圖6中,每個(gè)點(diǎn)代表一個(gè)患者,并且垂直軸代表判別式得分(z)。在此實(shí)施例中,靈敏性是85.7%,特異性是82.7%,并且預(yù)測(cè)精確性是83.3%。
表2
表3
表4


權(quán)利要求
1.確定樣品中一種或多種多肽生物標(biāo)記存在的方法,所述方法包括以下步驟
(a)使樣品進(jìn)行質(zhì)譜(MS)分析并且記錄每個(gè)檢測(cè)信號(hào)的保留時(shí)間指數(shù)和相應(yīng)質(zhì)量;
(b)使相應(yīng)于每個(gè)信號(hào)的質(zhì)量與生物標(biāo)記質(zhì)量的參考數(shù)據(jù)庫(kù)相關(guān)聯(lián),以形成每個(gè)信號(hào)和參考生物標(biāo)記之間的相關(guān)性,并拋棄那些質(zhì)量不與參考生物標(biāo)記質(zhì)量相關(guān)的信號(hào);
(c)儲(chǔ)存那些質(zhì)量與參考生物標(biāo)記相關(guān)的信號(hào);
(d)通過(guò)利用相似性度量將每個(gè)信號(hào)的MS光譜與數(shù)據(jù)庫(kù)中參考生物標(biāo)記的MS光譜匹配,確定每個(gè)儲(chǔ)存信號(hào)和參考生物標(biāo)記之間的相關(guān)性,以界定一組陽(yáng)性相關(guān)信號(hào);
(d)測(cè)量每個(gè)陽(yáng)性相關(guān)信號(hào)的強(qiáng)度,并利用辨別函數(shù)對(duì)它的絕對(duì)信號(hào)強(qiáng)度或相對(duì)信號(hào)強(qiáng)度記分;
(e)將閾值應(yīng)用于獲自辨別函數(shù)的得分值,以確定生物標(biāo)記的存在或不存在。
2.權(quán)利要求1的方法,其中使測(cè)試樣品在沒(méi)有預(yù)先的分離操作的情況下進(jìn)行MS分析。
3.權(quán)利要求2的方法,其中通過(guò)利用靜電納米電霧化原理的直接輸注、流動(dòng)注射分析或樣品富集流動(dòng)注射分析測(cè)試樣品。
4.權(quán)利要求1的方法,其中測(cè)試樣品在MS分析之前被處理。
5.權(quán)利要求4的方法,其中所述樣品處理包括通過(guò)單相或多相高壓液相色譜法(HPLC)的樣品分離。
6.前述任一項(xiàng)權(quán)利要求的方法,其中MS是電霧化離子化(ESI)MS、基質(zhì)輔助激光解吸電離-飛行時(shí)間(MALDI-TOF)MS或表面增強(qiáng)激光解吸電離-飛行時(shí)間(SELDI-TOF)MS。
7.前述任一項(xiàng)權(quán)利要求的方法,其中用于多種生物標(biāo)記的參考質(zhì)量和MS光譜數(shù)據(jù)以電子形式或紙件形式儲(chǔ)存。
8.前述任一項(xiàng)權(quán)利要求的方法,其中用于給定的生物標(biāo)記的參考MS光譜是通過(guò)聚類(lèi)計(jì)算而由實(shí)際和測(cè)量數(shù)據(jù)獲得的平均光譜。
9.前述任一項(xiàng)權(quán)利要求的方法,其中參考肽的一種或多種內(nèi)標(biāo)在MS分析之前加入到樣品中。
10.權(quán)利要求9的方法,其中內(nèi)標(biāo)用分子標(biāo)簽標(biāo)記。
11.權(quán)利要求9的方法,其中內(nèi)標(biāo)被標(biāo)記并包括在主數(shù)據(jù)組中。
12.權(quán)利要求11的方法,其中絕對(duì)信號(hào)強(qiáng)度通過(guò)測(cè)量生物標(biāo)記信號(hào)強(qiáng)度并將其與一種或多種已知內(nèi)標(biāo)比較而記分。
13.權(quán)利要求1-9任一項(xiàng)的方法,其中在沒(méi)有添加內(nèi)標(biāo)的情況下處理樣品。
14.權(quán)利要求13的方法,其中通過(guò)測(cè)量患者中個(gè)體生物標(biāo)記信號(hào)強(qiáng)度和患者組的參考信號(hào)強(qiáng)度之間的比例而對(duì)相對(duì)信號(hào)強(qiáng)度記分。
15.權(quán)利要求13的方法,其是完全自動(dòng)化的。
16.權(quán)利要求1的方法,其中計(jì)算來(lái)自MS信號(hào)強(qiáng)度的得分的辨別函數(shù)任選包括利用任何臨床變量,例如臨床檢查結(jié)果和/或臨床觀察的表型和/或醫(yī)療記錄。
17.確定疾病的存在的診斷方法,所述方法包括比較測(cè)試樣品的蛋白序列生物標(biāo)記與參考生物標(biāo)記,其中參考生物標(biāo)記包括表1中鑒定的肽。
全文摘要
本發(fā)明提供了確定樣品中一種或多種生物標(biāo)記存在的方法,包括步驟(a)使樣品進(jìn)行質(zhì)譜(MS)分析并且記錄每個(gè)檢測(cè)信號(hào)的保留時(shí)間指數(shù)和相應(yīng)質(zhì)量;(b)使相應(yīng)于每個(gè)信號(hào)的質(zhì)量與生物標(biāo)記質(zhì)量的參考數(shù)據(jù)庫(kù)相關(guān)聯(lián),以形成每個(gè)信號(hào)和參考生物標(biāo)記之間的相關(guān)性,并拋棄那些質(zhì)量不與參考生物標(biāo)記質(zhì)量相關(guān)的信號(hào);(c)儲(chǔ)存那些質(zhì)量與參考生物標(biāo)記相關(guān)的信號(hào);(d)通過(guò)利用相似性度量將每個(gè)信號(hào)的MS光譜與數(shù)據(jù)庫(kù)中參考生物標(biāo)記的MS光譜匹配,確定每個(gè)儲(chǔ)存信號(hào)和參考生物標(biāo)記之間的相關(guān)性,以界定一組陽(yáng)性相關(guān)信號(hào);(d)測(cè)量每個(gè)陽(yáng)性相關(guān)信號(hào)的強(qiáng)度,并利用辨別函數(shù)對(duì)它的絕對(duì)信號(hào)強(qiáng)度或相對(duì)信號(hào)強(qiáng)度記分;(e)將閾值應(yīng)用于獲自辨別函數(shù)的得分值,以確定生物標(biāo)記的存在或不存在。
文檔編號(hào)G01N33/68GK101611313SQ200780021900
公開(kāi)日2009年12月23日 申請(qǐng)日期2007年6月13日 優(yōu)先權(quán)日2006年6月13日
發(fā)明者西村俊秀, 荻原淳, 川村猛, T·卡瓦卡米, 京野完, 金澤光洋, F·尼貝里, G·馬科-瓦加, 安養(yǎng)寺久榮 申請(qǐng)人:阿斯利康(英國(guó))有限公司, 醫(yī)學(xué)普羅特歐斯科普有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
沂南县| 高雄县| 台中市| 临沂市| 大悟县| 温宿县| 恩施市| 汾西县| 宜宾市| 新巴尔虎左旗| 苍南县| 芜湖县| 宣恩县| 南溪县| 通江县| 嘉义市| 皋兰县| 仪征市| 沾化县| 铜陵市| 陕西省| 垦利县| 和顺县| 青岛市| 南京市| 青神县| 叶城县| 杭锦后旗| 新丰县| 迭部县| 黄陵县| 任丘市| 钟山县| 尼玛县| 枣强县| 伽师县| 柘荣县| 华池县| 开原市| 安岳县| 岗巴县|