專利名稱:質量標記物的制作方法
技術領域:
本發(fā)明涉及用于標記分析物(具體是生物分子如核酸和蛋白質)的有用的化合物。具體而言,本發(fā)明涉及采用質譜法使用特殊的質量標記物進行分析的方法。
標記感興趣的分子的各種方法在本領域中是已知的,包括放射性原子、熒光染料、發(fā)光試劑、電子俘獲劑和光吸收染料。這些標記系統(tǒng)的每一種都具有使其適合于某些應用而非其它應用的特征。由于安全原因,對非放射性標記系統(tǒng)的興趣已導致熒光標記方案的廣泛的商業(yè)發(fā)展,尤其是用于遺傳分析的熒光標記。熒光標記方案使得相對少量的分子能同時進行標記,通??赏瑫r使用4種標記物,也可能達到8種。但是,檢測裝置的成本和分析所產(chǎn)生的信號的難度限制了可在熒光檢測方案中同時使用的標記物的數(shù)量。
最近,在質譜法領域中已開發(fā)了一種檢測可斷裂地連接于它們相關的感興趣分子的標記物的方法。在許多分子生物學應用中,人們需要能在分析之前分離出感興趣的分子。通常進行液相分離。近年來,質譜法已發(fā)展了許多用于液相分離的界面,這使得質譜法可特別有效地用作這些應用的檢測系統(tǒng)。直到最近才采用液相色譜質譜法直接檢測分析物離子或它們的片段離子。但是,對于許多應用,如核酸分析,分析物的結構可從間接的標記而得以確定。這尤其對于采用質譜法是有利的,因為復雜的生物分子(如DNA)具有復雜的質譜,并且其檢測具有相對差的敏感性。間接檢測指可使用相關的標記物分子來鑒別原始的分析物,該標記物被設計用于敏感性檢測,并具有簡單的質譜。簡單的質譜使得可同時使用多種標記物分析大量的分析物。
PCT/GB98/00127描述了共價連接于可斷裂的標記物的核酸探針的陣列,所述標記物可采用質譜法檢測到,該方法可鑒別共價連接的核酸探針的序列。此申請中的標記的探針具有Nu-L-M的結構,其中Nu是共價連接于L的核酸,L是可斷裂的連接物,它共價連接于M,M是質量標記物。在此應用中,較佳的可斷裂的連接物在質譜儀的離子源中斷裂。此申請公開了多種離子化方法和使用四極質量分析儀、飛行時間(Time of flight,TOF)分析儀和磁性扇形場儀器進行的分析,將它們作為采用質譜法分析質量標記物的特殊方法。
PCT/GB94/01675公開了可斷裂地連接于質量標記分子的配體和特殊的核酸。較佳的可斷裂連接物是光可斷裂的。此申請公開了基質輔助的激光解吸電離(MALDI)TOF質譜法作為采用質譜法分析質量標記物的特殊方法。
PCT/US97/22639公開了可釋放的非揮發(fā)性質量標記物分子。在優(yōu)選的實施方式中,這些標記物含有聚合物,通常是生物聚合物,這些聚合物可斷裂地連接于反應性基團或配體(即探針)。優(yōu)選的可斷裂的連接物似乎在化學上和酶學上是可斷裂的。此申請公開了MALDI TOF質譜法作為采用質譜法分析質量標記物的特殊方法。
PCT/US97/01070、PCT/US97/01046和PCT/US97/01304公開了可斷裂地連接于質量標記分子的配體和特殊的核酸。較佳的可斷裂的連接物似乎是化學可斷裂的或光可斷裂的。這些申請公開了許多離子化方法和使用四極質量分析儀、TOF分析儀和扇形磁場儀器進行的分析,將它們作為采用質譜法分析質量標記物的特殊方法。
分析物材料所產(chǎn)生的質譜對污染物非常敏感?;旧?,可電離的導入質譜儀中的任何材料都將出現(xiàn)在質譜中。這意味著對于許多分析,需要在將分析物導入質譜儀前進行小心地純化。對于高通量系統(tǒng),為了通過使用質量標記物對分析物進行間接分析的目的,需要避免任何不需的樣品制備步驟。即,需要能檢測污染材料背景中的標記物,并能確定所檢測到的峰事實上與標記物相符?,F(xiàn)有的技術沒有公開在以檢測系統(tǒng)為基礎的質譜法中改進信噪比的方法或組合物,或者可提供證明譜中由質量標記物的存在引起的質量峰的方法或組合物。
為了在液相層析或電泳分離后檢測分析物,需要使所使用的標記物對分離過程產(chǎn)生的干擾最小。如果使用這類分析物的陣列,則需要陣列中的各個成員對與它們連相關的分析物的影響與其它標記物相同。這在某種程度上與質量標記的意圖有抵觸,這種意圖產(chǎn)生基于其質量在質譜儀中可分解的標記物陣列。質量標記物較佳應可被分解成4道爾頓,以防止一種標記物的同位素峰受到其它標記物的同位素峰的干擾。這意味著為了產(chǎn)生250個不同的質量標記物,可能需要標記物的范圍擴展到約1000道爾頓,可能還更多,因為重要的是產(chǎn)生被4道爾頓精確分離的大陣列的標記物。這個質量范圍質量將幾乎肯定會產(chǎn)生對采用質譜法進行檢測的任何分離過程產(chǎn)生不同影響的質量標記物。這對儀器設計也有關系,因為隨著質量范圍的增加超過了質譜儀可檢測離子的范圍,儀器的成本也增加。
因此,本發(fā)明的一個目的是解決與上述現(xiàn)有技術相關的問題,并提供在污染背景中可檢測到的質量標記物,以及作為質量標記物的身份可被證實的標記物。此外,本發(fā)明的一個目的是提供在壓縮的質量范圍內(nèi)可被分解的標記物的陣列,這樣這些標記物不會對分離過程有太多干擾,以及提供在質荷比的有限范圍內(nèi)檢測離子的質譜儀中可容易地被檢測到的標記物的陣列。
本發(fā)明還有一個目的是提供分析生物分子的方法,該方法利用本發(fā)明的標記物使通量、信噪比和這些檢測的敏感性最大化,具體是在遺傳分析中,更具體是用在分析蛋白質的雙向凝膠電泳中。
此外,下面公開的質量標記物的設計使得為檢測質量標記物的目的而設計出一種簡易的串聯(lián)質譜儀。第一質量分析儀僅僅需要選擇有限量的其質量相對低的離子。第二質量分析儀僅僅需要檢測少量的斷裂產(chǎn)物。
因此,本發(fā)明提供一組兩個或多個質量標記物,組中的各個標記物含有通過可斷裂的連接物連接于質量歸一化部分的質量指示部分,此部分具有抗碎裂性,其中,組中各標記物的聚集質量(aggregate mass)可相同或不同,并且,組中各標記物的質量指示部分的質量可相同或不同,其中,在組中具有共同質量的質量指示部分的任何類的標記物中,各標記物具有不同于該類中所有其它標記物的聚集質量,并且,在組中具有共同聚集質量的任何類的標記物中,各標記物具有其質量不同于該類中所有其它質量指示部分的質量的質量指示部分,這樣,采用質譜法分析時組中所有的質量標記物都可互相區(qū)分。
術語“質量指示部分”在本文中指采用質譜法檢測到的部分,而術語“質量歸一化部分”在本文中指采用質譜法不一定能檢測到的部分,但是它的存在確保了質量標記物具有所需的聚集質量。組中標記物的數(shù)量并沒有特殊的限制,但條件是該組含有許多的標記物。但是,組中含有兩種以上、三種以上、四種以上或五種以上的標記物較佳。
本發(fā)明還提供質量標記物的陣列,該陣列含有兩組以上上述陣列標記物,其中,任一組中各質量標記物的聚集質量與陣列中其它組中的每個質量標記物的聚集質量不同。
本發(fā)明還提供一種分析方法,該方法包括采用質譜法鑒別不同于分析物的質量標記物或其組合,從而檢測分析物,其中,質量標記物是上述的標記物組或其陣列中的質量標記物。
現(xiàn)在,本發(fā)明將結合附圖僅采用舉例方式作更詳細的描述,其中
圖1顯示三重四極質譜儀的示意性布局圖;圖2顯示形成本發(fā)明的標記物組的10個片段,包括5個質量歸一化部分(M0-M4)和5個質量指示部分(X0-X4),其中,將氟原子取代基用作質量調(diào)節(jié)部分;圖3顯示本發(fā)明一組5個標記物,由圖2的質量歸一化部分和質量指示部分形成;圖4顯示本發(fā)明一組5個質量標記物,其中,所有的標記物的質量不同,但該組中所有的質量指示物具有相同的質量;圖5顯示標記分析物(如寡核苷酸與質量標記物結合)的例子,這樣,質量標記物的結合具有唯一的可鑒別分析物的質譜;圖6顯示成組的質量標記物的陣列,各組具有相同質量系列的修飾基團(S),并且,由于其基底苯基上的氟取代基的數(shù)量的緣故,各組互不相同;圖7顯示成組的質量標記物的陣列,各組具有相同質量系列的修飾基團(S),并且,由于質量系列修飾基團中苯基醚的數(shù)量的緣故,各組互不相同;圖8闡述了本發(fā)明的“混合模式”實施方式,該圖顯示了當存在0或1的相對量時,三種標記物P、Q和R的所有組合的8種可能的唯一質譜中的4種;圖9闡述本發(fā)明的“混合模式”實施方式,該圖顯示了當存在0、1或2的相對量時,三種標記物P、Q、R、S和T的所有組合的243種可能的唯一質譜中的8種(如果T維持恒定,作為內(nèi)部標準,則有81種可能的質譜);圖10顯示通過擴大質量歸一化部分和質量指示部分,以允許進行更大范圍的取代而可形成的標記物組有多大——這組標記物有9個成員,以及用氟原子取代基作為質量調(diào)節(jié)部分而形成的標記物組有多大——這組標記物至少有8個成員,這便于采用本發(fā)明的混合模式對寡核苷酸陣列中的256個四聚體進行標記;圖11顯示質譜1,這是個含有從所有的離子A+、B+、C+和D+的峰的完整的質譜;圖12顯示質譜2,這個質譜僅僅是A+的質譜,通過在質譜儀的第一四極(Q1)中選擇A+離子而產(chǎn)生的質譜;圖13顯示質譜3,這是第一離子A1+(與A+具有相同的質荷比)和A1+、P+和Q+的斷裂產(chǎn)物的質譜;
圖14顯示質譜4,這是第二離子A2+(與A+具有相同的質荷比)和A2+、X+和Y+的斷裂產(chǎn)物的質譜;圖15顯示質譜5,當兩類這樣的離子(A1+和A2+)存在時,選擇A+離子而形成的質譜;圖16顯示質譜6,這是個在質譜儀的三極矩中形成的譜,當兩類在Q2中通過碰撞誘導了所選擇離子的解離的這樣的離子(A1+和A2+)存在時,在Q1中選擇A+離子,在Q3中選擇已知的撞擊產(chǎn)物A1+(P+)——這種方法可使A1+和A2+分解;圖17顯示質譜7,這是本發(fā)明一組5種質量標記物的二維譜,其中,在Q1(第一維)中選擇質量MX,在Q3(第二維)中選擇5種不同的質量X0、X1、X2、X3和X4;圖18顯示質譜8,這是本發(fā)明一組4種質量標記物的二維譜,其中,在Q1(第一維)中選擇4種不同的質量M0X0、M1X0、M2X0和M3X0,在Q3(第二維)中選擇單一質量M0;圖19顯示質譜9,這是含有由M0-M3和X0-X3的所有組合形成的標記物的一組質量標記物的二維譜,其中,在Q1(第一維)中選擇7種不同的質量,在Q3(第二維)中選擇4種不同的質量X0-X3;圖20顯示使用本發(fā)明的質量標記物進行典型的斷裂過程的示意圖,本發(fā)明的質量標記物與它們的分析物發(fā)生熱斷裂,或者使用電噴射離子化使它們斷裂;圖21顯示使用本發(fā)明的一組5個質量標記物在二維質譜中進行選擇的示意圖。
圖22顯示本發(fā)明的氘化的質量標記物;圖23顯示本發(fā)明的進一步氘化的質量標記物;圖24顯示具有H2N-gly-1eu-ala-ser-glu-COOH序列的兩條肽樣品的理論譜,各樣品與圖23中的式子所述的一種標記物連接。
在一個較佳實施方式中,本發(fā)明提供上述一組質量標記物,其中,組中各標記物具有有共同質量的質量指示部分,并且組中各標記物具有唯一的聚集質量。這種第一類型的標記物組的例子在圖4中給出。
在另一可選擇的更佳的實施方式中,組中各標記物具有共同的聚集質量,并且組中各標記物具有有唯一質量的質量指示部分。這種第二類型的標記物組的例子在圖3中給出。
該組標記物并不受到上述兩個較佳實施方式的限制,可包括如兩種類型的標記物,但條件是,如上所述,所有的標記物通過質譜法分析都是可區(qū)分的。
較佳的是,在第二類型的標記物組中,組中各質量指示部分具有共同的基本結構,組中各質量歸一化部分具有共同的基本結構,并且組中各質量標記物含有一個或多個質量調(diào)節(jié)部分,該質量調(diào)節(jié)部分被連接于質量指示部分和/或質量歸一化部分的基本結構上或者位于這些結構之中。在這個實施方式中,組中每一個質量指示部分含有不同數(shù)量的質量調(diào)節(jié)部分,組中每一質量標記物具有相同數(shù)量的質量調(diào)節(jié)部分。
在整篇說明書中,所述的“共同的基本結構”是指兩個或多個部分共享有一個結構,該結構具有基本上相同的結構構架、骨架或核心。這種構架或骨架可以是如苯基醚部分。該構架或骨架可含有與其側接的取代基,或者用其中沒有改變共同的基本結構的原子或同位素取代。
通常,上述第二類型的標記物組含有具有下式的質量標記物M(A)y-L-X(A)z式中,M是質量歸一化部分,X是質量指示部分,A是質量調(diào)節(jié)部分,L是可斷裂的連接物,y和z是0或0以上的整數(shù),y+z是1或1以上的整數(shù)。較佳的是,M是抗碎裂性基團,L是在與其它分子或原子碰撞時易斷裂的連接物,X較佳是預先電離的具有抗碎裂性的基團。M和X的質量總和與該組的所有成員相同。較佳的是,M和X具有相同的基本結構或核心結構,這種結構被質量調(diào)節(jié)部分修飾。該質量調(diào)節(jié)部分確保M和X的質量總和與組中所有的質量標記物相同,但保證了每個X具有不同的(唯一的)質量。
具有上述結構的優(yōu)選質量標記物組是其組中每種標記物具有下述結構的組 式中,R是氫或者是取代的或未取代的脂族、芳族、環(huán)狀的或雜環(huán)狀的基團,L是可斷裂的連接物,A是質量調(diào)節(jié)部分,每個p是相同的,并且是0或0以上的整數(shù),每個y′可以相同或不同,為0-4的整數(shù),所有的y′的總和等于y,每個z′可以相同或不同,是0-4的整數(shù),所有的z′的總和等于z。較佳的是,R是H,L是酰胺鍵,p=0,A是氟原子。
在本文中,R基團上的取代模式根本不受到限制。取代基可包括任何有機基團和/或一種或多種選自元素周期表中的IIIA、IVA、VA、VIA或VIIA族的原子,如B、Si、N、P、O或S原子或者鹵原子(如F、Cl、Br或I)。
當取代基包括有機基團時,該有機基團可包括烴基。烴基可包括直鏈基團、支鏈基團或者環(huán)狀基團。獨立地,所述烴基可包括脂族基團或芳族基團。同樣獨立地,該烴基可包括飽和的或不飽和的基團。
當烴含有不飽和基團時,它可含有一個或多個烯烴官能度和/或一個或多個炔烴官能度。當烴含有直鏈或支鏈基團時,它可含有一個或多個伯、仲和/或叔烷基。當烴含有環(huán)狀基團時,它可含有芳環(huán)、脂族環(huán)、雜環(huán)基團和/或這些基團的融合環(huán)衍生物。因而所述環(huán)狀基團可含有苯、萘、蒽、茚、芴、吡啶、喹啉、噻吩、苯并噻吩、呋喃、苯并呋喃、吡咯、吲哚、咪唑、噻唑和或噁唑基團,以及上述基團的區(qū)域異構體(regioisomer)。
對烴基中的碳原子數(shù)并沒有特殊的限制,但通常,烴基含有1-40個碳原子。因而,烴基可以是低級烴(1-6個碳原子)或高級烴(7個或7個以上碳原子,如7-40個碳原子)。環(huán)狀基團的環(huán)中的原子數(shù)也沒有特殊的限制,但環(huán)狀基團的環(huán)可含有3-10個原子,如3、4、5、6或7個原子。
上述定義的含有雜原子的基團以及上面定義的其它基團可含有一個或多個雜原子,這些雜原子選自元素周期表中的IIIA、IVA、VA、VIA或VIIA族中的任何原子,如B、Si、N、P、O或S原子或者鹵原子(如F、Cl、Br或I)。因而,取代基可含有有機化學中一個或多個任何一種普通官能團,如羥基、羧基、酯基、醚基、醛基、酮基、胺基、酰胺基、亞胺基、巰基、硫醚基、硫酸根、磺酸根和磷酸根。取代基還可含有這些基團的衍生物,如羧酸酐和羧酸鹵化物。
此外,任何取代基可含有兩種以上上述定義的取代基和/或官能團的組合。
對本發(fā)明質量標記物的陣列并沒有特殊的限制,只要它們含有大量的本發(fā)明的陣列標記物組。較佳的是,所述陣列含有兩組以上、三組以上、四組以上或五組或五組以上質量標記物。較佳的是,陣列中各質量標記物具有下述任一結構(S)x-M(A)y-L-X(A)zM(A)y-(S)x-L-X(A)z其中,S是質量系列修飾基團,M是質量歸一化部分,X是質量指示部分,A是質量調(diào)節(jié)部分,L是可斷裂的連接物,x是0或0以上整數(shù),y和z是0或0以上整數(shù),y+z是1或1以上整數(shù)。
上述類型的質量標記物的優(yōu)選陣列是其質量標記物具有下述任一結構的陣列 式中,R是氫或者是取代的或未取代的脂族、芳族、環(huán)狀的或雜環(huán)狀的基團,每個p是相同的,并且是0或0以上的整數(shù),x是0或0以上的整數(shù),任一組中的每個x與該陣列中其它每組中的x不同,每個y′可以相同或不同,為0-4的整數(shù),所有的y′的總和等于y,每個z′可以相同或不同,是0-4的整數(shù),所有的z′的總和等于z。圖7描述了這種類型的陣列。
在另一較佳的方面,質量標記物的陣列可含有具有下述任一結構的陣列標記物S(A*)r-M(A)y-L-X(A)zM(A)y-S(A*)r-L-X(A)z式中,S是質量系列修飾基團,M是質量歸一化部分,X是質量指示部分,A是所述質量指示部分和質量歸一化部分的質量調(diào)節(jié)部分,A*可以與A相同或不同,且是所述質量系列修飾基團的質量調(diào)節(jié)部分,L是可斷裂的連接物,r是0或0以上的整數(shù),陣列中有一組或多組質量標記物的r至少為1,y和z是0或0以上的整數(shù),x+y是1或1以上整數(shù)。較佳的是,M是抗斷裂基團,L是在與別的分子或原子碰撞時易斷裂的連接物,X較佳是預先電離的、具有抗碎裂性的基團。S一般是基團,這樣標記物組的陣列的各成員含有其質量較佳以4道爾頓與該陣列中的其它每個成員中的其它每個S相分離的S。從而,各不同組的質量標記物具有不同(唯一)的質量。
上述后一種類型的質量標記物的較佳陣列是其陣列標記物具有下述任一結構的陣列 式中,R是氫或者是取代的或未取代的脂族、芳族、環(huán)狀的或雜環(huán)狀的基團,每個p是相同的,并且是0或0以上的整數(shù),x是0或0以上的整數(shù),陣列中所有的質量標記物的x都相同,每個y′可以相同或不同,為0-4的整數(shù),所有的y′的總和等于y,每個z′可以相同或不同,是0-4的整數(shù),所有的z′的總和等于z,每個r′可以相同或不同,所有r′的總和等于r。圖6描述了這種類型的陣列。
在本發(fā)明的上述組和陣列中,對M、X和S基團的共同的基本結構并沒有特殊的限制,它們可包括環(huán)狀的和/或非環(huán)狀的基團。對M、X和S的性質也沒有特殊的限制。但是,較佳的是,M和/或X,和/或S含有基本(核心)結構——環(huán)狀基團,如芳基、環(huán)烷基或雜環(huán)基。這些基團可以是未取代的,但較佳是取代的基團。M、X和/或S可分別含有由上述環(huán)狀單體形成的寡聚物或聚合物,其中環(huán)狀單體通過抗斷裂的鍵或基團連接。
對于M、X和S,芳基醚,如苯基醚基團及其寡聚物和聚合物,尤其是取代的芳基醚是優(yōu)選的共同的基本結構。
對可斷裂的連接基團L并沒有什么特殊的限制。但是,較佳的是,L含有可通過碰撞而斷裂的基團,和/或L在質譜儀中可斷裂。較佳的是,基團L含有酰胺鍵。
在另一較佳的方面中,本發(fā)明提供可與分析物分子反應的質量標記物組和陣列,所述質量標記物具有下述形式Re-L′-標記物 或者 Re-L′-S-標記物式中,Re是使質量標記物與分析物分子中的適當?shù)墓倌芑鶊F共價地反應的反應性的官能度或基團,如(但不限于)核苷酸寡核苷酸、多核苷酸、氨基酸、肽或多肽。L′是可斷裂或不可斷裂的連接物,標記物是上述定義的組或陣列中任一種質量標記物。S的定義與上面的相同。L′可以是可斷裂的連接物,如果需要,它可以是如上所定義的可斷裂的連接物L。
在本發(fā)明上述方面的較佳實施方式中,L和/或L′在質譜儀中可斷裂,并且較佳在質譜儀的離子源中可斷裂。連接基團在上下文的討論中提到用于將感興趣的分子連接到本發(fā)明的質量標記化合物上的連接基團。各種各樣的連接物在本領域中是已知的,這類連接物可被引入本發(fā)明的質量標記物及其共價連接的分析物之間。這類連接物中的一些是可斷裂的。寡乙二醇或聚乙二醇或它們的衍生物可用作連接物,如在Maskos,U.和Southern,E.M.,《核酸研究》(Nucleic Acids Research),201679-1684,1992中所公開的那些連接物。雖然基于琥珀酸的連接物通常是堿不穩(wěn)定性,并因而與許多寡核苷酸合成儀中進行的堿介導的去保護步驟不相容,從而使它們在標記寡核苷酸的應用中較少優(yōu)選使用,但是它們還是被廣泛應用。
丙炔醇是雙功能連接物,它提供的連接在寡核苷酸合成的條件下穩(wěn)定,并且是用于本發(fā)明涉及寡核苷酸應用的優(yōu)選連接物。類似地,6-氨基己醇是連接適當官能化的分子的有用的雙功能試劑,它也是優(yōu)選的連接物。
各種已知的可斷裂的連接基團可與本發(fā)明的化合物一起使用,如光可斷裂的連接物。鄰位-硝基芐基是已知的光斷裂的連接物,尤其是2-硝基芐酯和在芐胺鍵斷裂的2-硝基芐胺。關于可斷裂的連接物的綜述,可參見Lloyd-Williams等人,Tetrahedron49,11065-11133,1993,該文中包括了許多光可斷裂的連接物和化學可斷裂的連接物。
WO 00/02895公開了乙烯基砜化合物作為可斷裂的連接物,這類化合物也可用于本發(fā)明,尤其是用于標記多肽、肽和氨基酸。本文將該申請的內(nèi)容納入作為參考。
WO 00/02895公開了硅化合物用作連接物,這類連接物在氣相中通被堿斷裂。這些連接物也可用于本發(fā)明,尤其是涉及標記寡核苷酸的應用。本文將申請的內(nèi)容納入作為參考。
在下面的討論中將提到使本發(fā)明的化合物連接于其它化合物(不論是報道基團或者是分析物分子)的反應性官能度Re??蓪⒍喾N反應性官能度引入本發(fā)明的質量標記物中。
下面的表1列出可與生物分子中發(fā)現(xiàn)的親核官能度反應,產(chǎn)生兩個實體間的共價鍵的一些反應性官能度。對于寡核苷酸合成,常常在分子的末端引入伯胺或硫醇,使該分子被標記。可將下面列出的任何一個官能度引入本發(fā)明的化合物中,使質量標記物被連接到感興趣的分子上。如果需要,可使用反應性官能度來引入另一具有另一反應性官能度的連接基團。表1中的內(nèi)容并不詳盡,本發(fā)明并不局限于僅使用這些列出的官能度。
表1 應注意的是,在使用本發(fā)明的質量指示物標記寡核苷酸的應用中。上述一些反應性官能度或它們的所產(chǎn)生的連接基團在引入寡核苷酸合成儀前可能要進行保護。較佳的是,未保護的酯、硫醚和硫酯、胺以及酰胺鍵最好被取消,因為它們在寡核苷酸合成儀中通常是不穩(wěn)定的。各種各樣的保護基團在本領域中是已知的,可使用這些保護基團來保護化學鍵不發(fā)生不需要的副反應。
下面的討論將提到“帶電官能度”和增溶基團??蓪⑦@些基團引入質量標記物(如本發(fā)明的質量指示物)中,以促進電離和溶解。指示物的選擇取決于使用陽離子檢測還是陰離子檢測。表2列出了一些官能度,這些官能度可被引入質量指示物中,以促進陽電離或陰電離。表中的內(nèi)容并不詳盡,本發(fā)明并不局限于僅使用這些所列出的官能度。
表2 WO 00/02893公開了為了改進質量指示物的電離而使用金屬離子結合部分,如冠醚或卟啉。這些部分也可用于本發(fā)明的質量指示物。
本發(fā)明的質量指示物的成分較佳具有抗碎裂性,這樣該指示物的斷裂位點可由易于被碰撞引起的解離所破壞的鍵的引入所控制。芳基醚是這類具有抗碎裂性的化合物的例子,它們可用于本發(fā)明。這些化合物也是化學惰性的或者是熱穩(wěn)定的。WO 99/32501更詳細地討論了聚醚在質譜法中的應用,本文將此申請的內(nèi)容納入作為參考。
過去,芳基醚合成的一般方法是以芳基溴與苯酚在銅粉末的存在下,在約200℃時的Ullmann偶聯(lián)為基礎〔代表性文獻H.Stetter、G.Duve,Chemische Berichte,87(1954),1699〕。已使用不同的金屬催化劑發(fā)展了芳基醚合成的較溫和的方法,但反應的溫度仍為100-120℃〔M.Iyoda、M.Sakaitani、H.Otsuka、M.Oda,Tetrahedron Letters,26(1985),477〕。這是生產(chǎn)聚醚質量標記物的優(yōu)選途徑。參見下面的實施例中給予的FT77的合成。最近發(fā)表的方法提供一種生產(chǎn)聚醚質量標記物的最佳途徑,因為該途徑是在比較早方法更溫和的條件下進行的(D.E.Evans、J.L Katz、T.R.West,Tetrahedron Lett.,39(1998),2937〕。
本發(fā)明還提供一組兩個或多個探針,組中各探針不同,它們與唯一的質量標記物或質量標記物的唯一組合連接,這些質量標記物選自上述定義的質量標記物的組或陣列。
還提供的是探針的陣列,該陣列含有兩組或多組探針,其中,任一組中的各探針連接于唯一的質量標記物或者質量標記物的唯一的組合,這些質量標記物選自上述定義的質量標記物組,并且,其中任一組中的探針連接于相同的質量標記物組中的質量標記物,并且各組探針連接于上述定義的質量標記物陣列中唯一的質量標記物組的質量標記物。
在一個實施方式中,各探針較佳連接于質量標記物的唯一組合,各組合可通過質量標記物組中的各質量標記物的存在或缺乏而得以區(qū)分,和/或通過連接于探針的各質量標記物的數(shù)量而得以區(qū)分。這就是本發(fā)明的“混合模式”,因為探針可被連接于質量標記物的混合物。
在上述方面,對探針的性質并沒有特殊的限制。但較佳的是,各探針包含生物分子??墒褂萌魏紊锓肿?,但該生物分子較佳選自DNA、RNA、寡核苷酸、核酸堿基、肽、多肽、蛋白質和氨基酸。
在一個較佳實施方式中,本發(fā)明提供具有下述形式的質量標記的分析物組和陣列,如核苷酸、寡核苷酸和多核苷酸分析物-L′-標記物 或者 分析物-L′-S-標記物式中,L′和S的定義如上,標記物是選自上述任何組和陣列中的質量標記物。
在上述方面,對分析物的性質并沒有特殊的限制。但較佳的是,各分析物包含生物分子??墒褂萌魏紊锓肿?,但該生物分子較佳選自DNA、RNA、寡核苷酸、核酸堿基、肽、多肽、蛋白質和氨基酸。
在一個實施方式中,各分析物較佳連接于獨特的質量標記物的組合,各組合通過質量標記物組中各質量標記物的存在或缺乏而得以區(qū)分,和/或通過連接于探針的各質量標記物的數(shù)量而得以區(qū)別。如上所述,這就是本發(fā)明的“混合模式”,因為探針可連接于質量標記物的混合物。
如上所述,本發(fā)明提供一種分析的方法,該方法包括通過采用質譜法鑒別對分析物獨特的質量標記物或質量標記物的組合,從而檢測該分析物,其中,質量標記物是上述質量標記物的組和陣列中的質量標記物。這類方法并沒有特殊的限制,只要它有利于使用本發(fā)明的質量標記物鑒別分析物。例如,該方法可以是核酸測序的方法,或者是通過檢測樣品中蛋白質的數(shù)量來描述一個或多個基因的表達的方法。該方法特別有利,因為它可用于容易地同時分析大量的分析物。但該方法還具有單獨分析單種分析物的優(yōu)點,因為使用本發(fā)明的質量標記物,可獲得比常規(guī)質譜更清楚的質譜,從而使得該方法準確和敏感。
在另一較佳實施方式中,本發(fā)明提供一種方法,該方法包括(a)使一種或多種分析物與探針組或探針陣列接觸,組或陣列中的各探針對至少一種分析物特異,其中,各探針如上所述;(b)通過檢測對分析物特異的探針鑒別分析物。
在這個實施方式中,較佳的是,在采用質譜法檢測質量標記物之前,先從探針上解離下標記物。
這個
具體實施例方式
的方法的性質并沒有特殊的限制。但較佳的是,該方法包括使一種或多種核酸與一組雜交探針接觸。該組雜交探針通常包括達到256個四聚體的組,組中各探針具有不同組合的核酸堿基。這個方法可適合用于鑒別靶核酸的存在,或者可用于一種或多種核酸模板的引物延伸測序的逐步式的方法。
本發(fā)明的質量標記物特別適合用于二維分析的方法,這主要是由于大量的標記物可同時得以區(qū)分。因而,這些標記物可用于雙向凝膠電泳的方法,或者用于二維質譜法。
因而,在一方面,本發(fā)明提供一種二維質譜法分析的方法,它包括(a)提供一種或多種分析物,各分析物用對該分析物唯一的質量標記物或質量標記物的組合標記,其中,這些質量標記物選自上述質量標記物組或陣列;(b)將質量標記物從分析物中解離;(c)檢測質量標記物;(d)在質譜儀中解離質量標記物,以從質量歸一化部分中釋放出質量指示部分;(e)檢測質量指示部分;(f)在第一方向上,在質量標記物的質譜的基礎上鑒別分析物,在第二方向上鑒別質量指不部分的質譜。
在此方法中,較佳的是,在步驟(c)中,選擇質量的質量標記物或者質量的選擇范圍是選擇為檢測而選擇的。還較佳的是,在步驟(e)中,具有特殊的質量或質量的特殊范圍的質量指示部分是為檢測而選擇的。
在另一方面,本發(fā)明提供一種分析的方法,該方法包括(a)在分析物的第一特性的基礎上,對標記的分析物的混合物進行第一分離處理;(b)在分析物的第二特性的基礎上,對分離的分析物進行第二分離處理;(c)通過檢測分析物的標記物,從而檢測該分析物;其中,分析物用選自上述質量標記物組或陣列的質量標記物標記。
分析物的特性沒有特殊的限制。但是,在這個實施方式的步驟(a)和/或(b)中,較佳是根據(jù)分析物的長度或質量將它們分離。還較佳的是,在步驟(a)和/或(b)中,分析物是根據(jù)它們的等電點而被分離。通常,這些分析物含有一個或多個蛋白質、多肽、肽、氨基酸或核酸,或者它們的片段。特別優(yōu)選的是,在各個分離步驟中使用凝膠電泳。在這個實施方式中,該方法是雙向凝膠電泳法。
在另一方面,本發(fā)明提供一種表征核酸的方法,該方法包括;(a)提供一組核酸片段,各片段具有可斷裂地連接于其上、用于鑒別該片段特征的質量標記物,這些質量標記物選自上述質量標記物組或陣列;(b)在它們的長度的基礎上分離這些片段;(c)解離各片段,以釋放出其質量標記物;(d)采用質譜法測定各質量標記物,以描述片段的長度與各片段特征的關系。
通常,本發(fā)明這方面的方法用于表征cDNA。較佳的是,此方法包括(a)使含有一組含一種或多種cDNA或其片段的樣品暴露于斷裂劑中,該斷裂劑識別預定的序列,并在距離預定序列已知偏移位置的基準位點上進行切割,從而產(chǎn)生一組末端片段,所述預定序列接近各cDNA或其片段的一端;(b)將銜接子寡核苷酸連接于各基準位點上,該寡核苷酸含有樣品斷裂劑的識別位點;(c)將這組末端片段暴露于樣品斷裂劑中,該斷裂劑與上述識別位點結合,并從該識別位點開始,在已知偏移位置的樣品位點上進行切割,從而在各個末端片段中產(chǎn)生來自未知序列和預定長度達到6個堿基的的粘性末端序列;
(d)根據(jù)序列的長度將該組末端片段分成亞組;(e)如下測定各粘性末端序列(i)用標記的雜交探針陣列探測,該陣列含有所有可能的預定長度的堿基序列;(ii)連接這些雜交到粘性末端序列上的探針;(iii)通過鑒別標記物,較佳是通過定量標記物,測定哪些探針被連接。其中,這些標記物是來自上述組或陣列的質量標記物。
在這個方法中,較佳采用毛細管電泳、HPLC或凝膠電泳分離末端片段組。
在本發(fā)明的又一方面中,本發(fā)明提供一種表征核酸的方法,該方法包括,在至少一種標記的末端堿基的存在下,從一個或多個核酸模板產(chǎn)生Sanger梯核酸片段,然后鑒別該片段的長度及其末端堿基,其中,該標記物對該末端堿基特異,并且是來自上面定義的組或陣列中的質量標記物。
在本發(fā)明的這個方面,較佳的是,所有四種末端堿基都在相同反應區(qū)中存在。該方法通常包括,從存在于相同反應區(qū)中的大量核酸模板產(chǎn)生Sanger梯核酸片段,然后鑒別所產(chǎn)生的各核酸片段的長度、產(chǎn)生該片段的模板的身份以及該片段的末端堿基,其中,在產(chǎn)生這些片段之前,先使標記的引物核苷酸或寡核苷酸雜交到各模板上,而各引物上的標記物對該引物所雜交的模板特異,從而鑒別該模板。對鑒別模板的這類標記物沒有特殊的限制。但較佳的是,該鑒別模板用的標記物是選自上面定義的組和陣列中的質量標記物。
本發(fā)明方法的另一方面提供一種核酸測序的方法,該方法包括(a)獲得靶核酸組,該組中包含一條或多條將要測序的單鏈DNA,每條DNA以唯一的量存在,并具有一個引物,為該核酸提供雙鏈部分用于連接;(b)使核酸組與雜交探針的陣列接觸,各探針包含可斷裂地連接于預定長度的已知堿基序列上的標記物,該陣列包含該預定長度的所有可能的堿基序列,這些堿基序列不能相互連接,其中,在連接酶的存在下,在使具有與位于各核酸的雙鏈部分附近的單鏈核酸互補的堿基序列的探針與該雙鏈部分連接的條件下,進行接觸,從而形成延伸的雙鏈部分,該部分不能與更多的探針連接;(c)除去所有未連接的探針;接著進行如下步驟(d)將連接的探針解離,釋放出各標記物;(e)記錄各標記物的數(shù)量;
(f)激活延伸的雙鏈部分,使能夠在其上進行連接;其中(g)步驟(b)和(f)作為一輪循環(huán),重復進行足夠多次,以通過測定釋放的各標記物的序列來測定單鏈核酸或各單鏈核酸的序列;其中,雜交探針的標記物是來自上面定義的組和陣列中的各標記物。
在本發(fā)明的這個方面,較佳的是,雜交探針是一組256個四聚體,組中各探針具有不同組合的核酸堿基。
如已經(jīng)提到的,較佳的是,在本方法所有的上述方面中,通過采用質譜法同時分析物的質量標記物或質量標記物的組合,從而檢測兩種或多種分析物。
本發(fā)明的混合模式可用于上述所有的方法。在這個實施方式中,由選自質量標記物組或陣列中的質量標記物的獨特組合鑒別各分析物,各組合由該組或陣列中的各質量標記物的存在與否加以區(qū)別,和/或由各質量標記物的數(shù)量加以區(qū)分。
如果本方法用于兩種或多種分析物的同時分析,則在一些方面,較佳的是,在采用質譜法檢測質量標記物之前,先根據(jù)這些分析物的質量將它們分離。較佳的是,分離步驟是色譜步驟(如液相色譜法)或凝膠電泳。類型2的標記物在這些實施方式中是特別有利的,因為該組中所有標記物的聚集質量相同,因此,在進行色譜分離步驟中,所有分析物的移動性同樣受到這些標記物的影響。
通常,在本發(fā)明的方法中,用來檢測質量標記物的質譜儀包含一個或多個質量分析儀,這些質量分析儀能使特定的質量或質量范圍的離子通過,以進行檢測,和/或它們能使離子解離。較佳的是,使用這種質量分析儀選擇對一種或多種已知的質量標記物特異的特定質量或質量范圍的離子,使所選擇的離子解離,然后檢測解離產(chǎn)物,鑒別出能指示所選擇的質量標記物的離子模型。在特別優(yōu)選的方法中,質譜儀包含三個四極質量分析儀。在這個實施方式中,第一質量分析儀通常用于選擇具有特定質量或質量范圍的離子,第二質量分析儀用于解離所選擇的離子,而第三分析儀用于檢測可得到的離子。
上述方法的一個較佳實施方式提供了一種分析質量標記的分析物分子的方法,該方法包括1.從質量標記物所結合的感興趣的分子上將該質量標記物解離;2.使解離的質量標記物電離;3.選擇預定質荷比的離子,該質荷比對應于質量分析儀中已知質量標記物的優(yōu)選離子的質荷比;4.通過碰撞誘導這些選擇的離子解離;5.檢測碰撞產(chǎn)物以鑒別指示所選擇的質量標記物的碰撞產(chǎn)物。
較佳的是,從質量標記物結合的核酸中解離質量標記物的過程是在質譜儀中進行的,較佳在離子源中進行。還較佳的是,質量標記物是預先電離的。在這個實施方式中,這些標記物僅需從液相或固相轉變成氣相(如果這些質量標記物是在液相或固相中的話)。通常,由質譜儀的離子源中的質量標記物的解離引起質量標記物的電離步驟。
較佳的是,在串聯(lián)儀器的第一質量分析儀中進行選擇預定質荷比的離子的第3步。然后,根據(jù)上述第4步,將所選擇的離子導入分離的碰撞孔中,它們在這些孔中與氣體或固體表面碰撞。然后,根據(jù)上述第5步,將碰撞產(chǎn)物導入串聯(lián)儀器的另一質量分析儀中,以檢測碰撞產(chǎn)物。用于本發(fā)明的典型的串聯(lián)儀器包括三重四極質譜儀、串聯(lián)式扇形場儀器和四極飛行時間質譜儀。
還優(yōu)選的是,上述選擇預定質荷比的離子的第三步、使所選擇的離子與氣體碰撞的第四步和檢測碰撞產(chǎn)物的第五步是在質譜儀的相同區(qū)域內(nèi)進行的。這可以在如離子俘獲質量分析儀和傅立葉變換離子回旋共振質譜儀中進行。
在另一優(yōu)選的實施方式中,本發(fā)明提供一種分析質量標記的分析物分子的方法,該方法包括1.從質量標記物所結合的感興趣的分子上將該質量標記物解離;2.使解離的質量標記物電離;3.選擇預定質荷比的離子,該質荷比對應于質量分析儀中已知質量標記物的優(yōu)選離子的質荷比;4.通過碰撞誘導這些選擇的離子解離;5.檢測一種以上的碰撞產(chǎn)物,以鑒別指示所選擇的質量標記物的碰撞產(chǎn)物離子模型,又可鑒別標記的核酸。
在本發(fā)明的這個實施方式的優(yōu)選方面,從質量標記物結合的核酸上解離質量標記物的過程是在質譜儀中進行的,較佳是在離子源中進行。
在這個實施方式的某些優(yōu)選方面,質量標記物是預先電離的,僅需將它們由液相或固相轉變成氣相(如果質量標記物是在液相或固相中的話)。
在其它優(yōu)選的方面,由質譜儀離子源中的質量標記物的解離引起質量標記物的電離步驟。
在某些方面,在串聯(lián)儀器的第一質量分析儀中進行選擇具有預定質荷比的離子的第3步。然后,根據(jù)上述第4步,將所選擇的離子導入分離的碰撞孔中,在該孔中,這些離子與氣體或固體表面碰撞。然后,根據(jù)上述第5步,將碰撞產(chǎn)物導入串聯(lián)儀器的另一質量分析儀中,檢測碰撞產(chǎn)物。典型的串聯(lián)儀器包括三重四極質譜儀、串聯(lián)式扇形場儀器和四極飛行時間質譜儀。
在另一較佳實施方式中,所述選擇具有預定質荷比的離子的第3步、使所選擇的離子與氣體碰撞的第4步和檢測碰撞產(chǎn)物的第5步是在質譜儀的相同區(qū)域內(nèi)進行的。這可以在離子俘獲質量分析儀和傅立葉變換離子回旋共振質譜儀中進行。串聯(lián)質譜法以損失一些敏感性為代價,采用串聯(lián)質譜法(MS/MS)檢測本發(fā)明的質量標記物在選擇性方面可獲得極大的增益。為了闡述本發(fā)明,現(xiàn)在對串聯(lián)質譜法進行一些討論,在此參照三重四極質譜儀進行描述。三重四極可容易地闡述MS/MS的原理。
四極質量分析儀主要是一個質量過濾器,它可在任何時候設置為僅使具有特定質荷比的離子通過。四極包含4個平行的棒狀電極,這些電極形成一個通道。將由正弦射頻電勢疊加的直流電勢施加到棒狀電極上。進入由平行的棒狀電極形成的通道的離子跟蹤復雜的軌道,對于特定的直流電勢和射頻電勢,只有具有預定質荷比的離子具有穩(wěn)定的軌道,這將使它們通過該通道。通過改變所施加的電勢,可將該四極制成超越整個質荷比范圍的掃描,該質荷比可達到約4000。
圖1顯示三重四極(Q)的排列。三個分離的四極質譜分析儀串聯(lián)連接。第一個四極下文稱為Q1,類似地,第二個四極稱為Q2,第三個稱為Q3。四極Q1和Q3通常以掃描模式使用。掃描的速率非常高。或者,可將Q1和Q3用作“門”,這些門僅使經(jīng)選擇的離子通過。四極Q2以非掃描的模式使用,其中,它起到離子聚焦設備的作用。當Q2是高真空時,所有的離子都通過Q2。當將氣體注入Q2中時,進入的離子與氣體碰撞,許多離子獲得足夠的能量來斷裂。這就是“碰撞誘導解離”(CID)。
研究了三重四極的一個特殊用途。假設離子是在離子源(A+、B+、C+、D+等)中產(chǎn)生的。如果使所有的這些離子通過Q1,而Q2和Q3以掃描模式運行,則會產(chǎn)生完全的質譜(圖11的質譜1)。質譜1顯示包含分子的離子A+到D+以及各種各樣的碎片離子的質譜。
現(xiàn)在,假設Q1設置為僅僅可通過A+離子,Q2處于低壓狀態(tài)。A+離子通過Q2和Q3,并被檢測到(圖12中的質譜2)。新的質譜現(xiàn)在已“清除”了被Q1拒絕的其它離子(B+、C+等)。通過將Q1設置為在對應于感興趣的分析物的特定離子種類的有限質量系列內(nèi)掃描,可從注入質譜儀中的同一樣品中檢測到多種分析物。這稱為“選擇性離子監(jiān)測”。
然而,三重四極可用于獲得進一步的選擇性。A+可從幾種來源獲得(如,幾種離子可具有相同的質荷比,都為100,但有不同的組成,如C7H16、C6H12O、C5H8O等)。假設兩有種組成的A+離子(A1+和A2+),它們都具有相同的標稱質量(圖13和14中的質譜3和4)。如果在Q1中選擇A+離子,并在Q2中進行CID,則Q3的掃描將產(chǎn)生圖15所示的質譜5。這就是“混合”質譜。
假設已知離子P+、Q+(或僅僅是P+)可清楚地揭示A1+的存在。即,已知發(fā)生A1+→P++Q+的斷裂(反應)。不在Q3中掃描所有的離子,取而代之的是將Q3設置為僅檢測P+離子。從而,在離開離子源后,離子A+、B+……被還原成正確的A+(=A1+、A2+)離子,這些離子進入Q2中。
經(jīng)CID后,僅有碎片離子P+被選擇,這些離子僅僅是A1+的特征。這被稱為“單一或選擇性反應監(jiān)測”,這種監(jiān)測是高度選擇的。更一般地說,進入Q1的離子的完全質譜(圖11的質譜1)在Q3中被還原成P+(圖16中的質譜6),而已知這些離子僅僅涉及A1+。
在隨后的一些討論中,實施例涉及使用本發(fā)明的質量標記物鑒別核苷酸或寡核苷酸。同樣可能的是,本發(fā)明的標記物可與蛋白質或肽或其它分析物一起使用,并且為了實施例的目的提及了寡核苷酸。為了分析寡核苷酸,假定質量標記物通過可斷裂的連接物共價連接于寡核苷酸。可采用各種機制將連接物斷裂,這些機制包括熱斷裂、化學斷裂、錐形電壓(cone voltage)斷裂或光致斷裂。在下述關于質量標記物的性能的討論中,假設這些標記物已在電離期間或之前從它們所結合的核酸中解離下來。英國專利申請GB 9815163.2和GB 9815164.0公開了優(yōu)選的可斷裂的連接物及其使用方法。圖20用示意圖列出了優(yōu)選的斷裂方法。
根據(jù)本發(fā)明的第一方面,可將選擇性離子監(jiān)測(SIM)與選擇性反應監(jiān)測(SRM)結合的原理用于質量標記技術,從而產(chǎn)生二維檢測方法。如果A1+是從質量標記物獲得的離子,并因此是已知的組成和端裂模式的離子,那么在電離步驟中,不論產(chǎn)生多少離子,都可在沒有其它離子的任何干擾的情況下,通過在三重四極的第一四極中使A+離子通過,然后檢測A1+斷裂產(chǎn)物,即在三重四極的第三極中僅通過P+離子,從而鑒別該質量標記物。要檢測哪一個M/Z范圍是無關緊要的,并且也不再需要在質譜中尋找“清晰”的窗口。
如上所述,本發(fā)明的一個方面提供可以式M-L-X表示的質量標記物。作為一個例子,A1+可以是下式所示的標記物的分子離子 因此,M是芐基,L是酰胺鍵,X是吡啶基。將芐基環(huán)連接到吡啶基環(huán)的酰胺鍵特別易于通過碰撞而斷裂。因此,在碰撞時,A1+產(chǎn)生以下碎片離子 這表示P+。因此,P+的檢測意味著存在A1+,也即存在標記物中的一種。該標記物已被從所有其它離子中選擇性地鑒別出來,這有效地消除了“背景”污染。這意味著標記的分析物不需要完全純化,并且這些標記物不需要在質譜儀外從分析物中解離和分離出來。采用這一原理,通??商峁┮活愑米髻|量標記物的有用的化合物,所有這些標記物具有通式M-L-X,其中,M通過易斷裂的鍵L(如酰胺鍵)連接于X,而X是用SRM檢測的離子。因此,X與以上所示的斷裂產(chǎn)物類似,稱為P+。
根據(jù)本發(fā)明的一個方面,以上闡述的質量標記物的結構通??商峁┮唤M有用的質量標記物,所有的標記物都具有相同的質量,但是它們?nèi)砸子诒籗RM分解。使M0、M1……M4和X0、X1……X4成為M-L-X一半的同位形,其中L是連接M和X的酰胺鍵??稍俅问褂蒙鲜鰳悠?。如果這種結構被氟取代,則可產(chǎn)生圖2所示的成分。這些標記物成分可組合形成如下的質量標記物MX(暫時忽略可斷裂的鍵L)M0X4、M1X3、M2X2、M3X1、M4X0這五種物質具有完全相同的質量(圖3)。因此,如果在三重四極的Q1中選擇一種質量標記物,則僅有其質量等于MmXn(m=0-4,n=4-0)的離子會被選擇。Q1被設置為僅尋找MX離子。如圖21所示,如果在Q2中進行CID,則可將Q3設置為儀讓離子X0、X1、X2、X3和X4通過。
因此,在所有具有相同質量的標記物中,在Q1中會有5種質量標記物被選擇,然后可在Q3中鑒別下面所示的斷裂反應。如果在Q3中檢測到139的質量,則它必須由M3X1產(chǎn)生,依此類推M0X4+→X4+(m/z 193)M1X3+→X3+(m/z 175)M2X2+→X2+(m/z 157)M3X1+→X1+(m/z 139)M0X4+→X0+(m/z 121)本方法的選擇過程可用圖17中的二維質譜——質譜7形象化表示。
在另一方法中,可合成不同組的質量標記物。在這種分析模式中,SRM與“選擇性離子監(jiān)測”(SIM)組合。在SIM模式的分析中,第一四極(Q1)選擇性掃描了預定的質量,僅讓具有預定質量的離子通過。
再次考慮到圖2和3中的M0、M1、M2、M3、M4和X0,可組合這些標記物成分可組合產(chǎn)生5種具有不同質量的標記物,分別是M0X0、M1X0、M2X0、M3X0和M4X0?,F(xiàn)在,假設三重四極的Q1設置為選擇這5種質量,那么Q3僅需設置為檢測1個質量(X0),如圖4所示。
因此,質譜儀僅檢測1種固定的離子(X0)。由于X0必須僅僅來自M0X0、M1X0、M2X0、M3X0和M4X0,并且已知這些物質已在Q1中被選擇,所以這提供了質量標記的另一種模式?,F(xiàn)在,可由5個特殊的“單一反應”中的一個來鑒別5種不同的分析物M0X0→X0M1X0→X0M2X0→X0M3X0→X0M4X0→X0這產(chǎn)生了不同的二維質譜,如圖18的質譜8所示。
可將上述兩種方法組合。假設選擇M0、M1、M2、M3表示二核苷酸的第一個堿基。第二個堿基的特點以X0、X1、X2和X3表示,產(chǎn)生16種不同的質量標記物,如表3所示
表3
各質量標記物將具有7種不同質量中的一種,它們可在串聯(lián)儀器的第一質量分析儀中選擇。使用第二質量分析儀中鑒別的碰撞產(chǎn)物鑒別二聚體。因此,用8種標記物成分可能產(chǎn)生16種質量標記物。所有這些標記物的完全質量二維質譜在圖19的質譜9中顯示。類似地,如果需要256種質量標記物,則兩組16種成分,即M0到M15和X0到X15,會產(chǎn)生足夠的標記物,其中,各標記物會具有31種不同的質量中的一種。
根據(jù)本發(fā)明的另一方面,使用質量系列修飾基團還可能產(chǎn)生質量標記物組的陣列。根據(jù)本發(fā)明的這個方面,組中各標記物具有相同的質量,但是可被SRM分解的一組標記物,可通過將組中的各成員連接到質量系列修飾基團上而擴展成附加組標記物,所述質量系列修飾基團將該組中各成員的質量按預定量轉移,從而產(chǎn)生總質量與第一組不同的第二組標記物。因此,在質量分析儀的第一四極中采用SIM,使兩組不同的質量標記物離子通過,然后通過監(jiān)測兩組標記物的相同的碎片種類,在第三四極中分析碰撞產(chǎn)物。使用不同的質量系列修飾基團,可產(chǎn)生與在質譜儀中輕松地分析那樣清楚的許多不同組的標記物。
較佳的是,質量系列修飾基團(S)是抗碎裂性基團,這樣當各個S基團連接到標記物組中的各成員上時,產(chǎn)生新的標記物組,這些基團明顯地從標記物的陣列中的其它每一個標記物中分解。在本文中,“可分解”指陣列中的各組標記物較佳以至少約4道爾頓與其它每一組分離。這將確保質譜中一種標記物的同位素峰不會與另一種標記物的峰重疊。在本發(fā)明這方面的優(yōu)選實施方式中,S基團是取代的或未取代的環(huán)狀基團,如芳基、環(huán)烷基和雜環(huán)基,優(yōu)選通過醚鍵連接于SRM可分解的質量標記基團組的成員。陣列中的各組可具有相同的S基團,但具有不同水平的取代,以確保各組互不相同。這類標記物的陣列的例子在圖6中顯示。在此陣列中,F(xiàn)原子用作取代基(調(diào)節(jié)部分),但可使用其它的取代基,如甲基。應弄清楚的是,這類標記物的陣列對任何結合的分析物分子的移動性將具有非常類似的影響。
可使用甲基取代的苯基將附加組的標記物加到這種陣列中,也可用甲基和氟基取代的苯基。甲基與氟基的質量的不同之處在于甲基比氟基少4道爾頓,這樣可產(chǎn)生如此明顯的陣列的標記物,這些標記物對所結合的分析物的移動性的影響或許是最小的。
在本發(fā)明這方面的其它優(yōu)選的實施方式中,S基團是環(huán)狀基團如芳基、環(huán)烷基和雜環(huán)基的寡聚物或聚合物,這些基團也可以是取代的基團。尤其是,優(yōu)選的S基團是聚芳基醚。這種陣列的一個例子在圖7中顯示。
根據(jù)本發(fā)明的另一方面,通過用本發(fā)明質量標記物的不同組合標記分析物,可進一步利用上述原理。如上所述,這個實施方式是混合模式標記。當必須鑒別大量分析物中的任何一個單獨的分析物時,例如,在組合化學中,可選擇標記物如M0X3、M1X2、M2X1、M3X0的混合物。該混合物與分析物連接,這樣將存在特定數(shù)量的各標記物。例如,aM0X3+bM1X2+cM2X1+dM3X0,其中a=b=b=d=1(圖5)。如果等量的四種標記物(a=b=c=d=0.25)在相同的反應中結合于一種分析物,則它們之間的化學連接反應不可能區(qū)分。當寡核苷酸被標記時,該寡聚物將以每個核苷酸或寡核苷酸1個以上標記物被質量標記。表4顯示三種質量標記物的形式表4 <p>本文中提到的所有出版物、專利和專利申請,如同各個出版物、專利或專利申請被具體地和個別地指出全文引用作為參考一樣,在同一范圍被全文引用作為參考。
表1
可以看出該原理可延伸。在本發(fā)明的一些方面中,最好是要采用上述策略標記256種可能的四聚體。需要產(chǎn)生7種不同的標記物,這些標記物以上面顯示的所有可能的組合比例混合?;蛘?,如果這些標記物是圖6或7中顯示的形式,則如圖6所示,通過使用4種不同的質量系列修飾基團,以產(chǎn)生不同組的5種標記物,從而可產(chǎn)生上述實施例所示的4組81種編碼類型。這會產(chǎn)生足夠的標記物,以編碼所有可能的256種四聚體。
本發(fā)明這方面的原理還可進一步延伸??紤]含有所有256種可能的天然核苷酸的組合的DNA四聚體庫。該系列中的每個四聚體可以1到256的數(shù)字表示,即AAAA表示為1,AAAC表示為2,到TTTT表示為256。
數(shù)值1到256以二進制表示,例如,可表示為計算機存儲寄存器中表示的數(shù)目的形式。在寄存器中有一系列的開關,這些開關可表示數(shù)值28、27、26、25、24、23、22、21和20。為了表示1-256中的任何一個數(shù)值,這些開關處于開和關的狀態(tài),以便這些二進制數(shù)的冪的總和表示原始的十進制數(shù),如下面的表6所示表6
使用質量標記物分子可獲得與這些數(shù)值類似的表示方法,其中,儲存器中的各開關由特定分子的存在或缺乏表示。因而,為了鑒別四聚體,可使用標記物的混合物標記該四聚體,該混合物表示鑒別該四聚體的數(shù)量,例如,如果AACG由數(shù)字7表示,則可用表示22的分子與表示21和20的分子的混合物標記該四聚體,從而將其鑒別。
事實上,在用不同數(shù)量的特定取代基或同位素(如不同數(shù)量的質量調(diào)節(jié)部分,如氟原子或不同的氘同位素)取代核心分子的基礎上,這些分子可表示為一系列的分子。因此,20可由無氟取代基的核心分子表示,21可由具有1個氟取代基的核心分子表示,類似地,28可由具有8個氟取代基的核心分子表示。當采用質譜法分析這些分子時,它們可與互補的成分組合,以產(chǎn)生9種同量異位的標記物,這些標記物可在串聯(lián)儀器中分析。
因此,在四聚體為AACG的例子中,可用上面顯示的標記物0、1和2標記此寡聚物。很明顯,如圖10所示,其它所有可能的四聚體可以這種二進制的方式表示,并且僅僅需要8種基本的標記物來鑒別它們。采用SRM進行DNA測序使用上述形式的質量標記物可有效地進行Sanger測序梯分析。Sanger方法學的常規(guī)DNA測序使用DNA聚合酶將大量的二脫氧/脫氧核苷酸加到寡核苷酸引物中,然后以模板特異性的方式退火,產(chǎn)生單鏈DNA模板。當將終止核苷酸,即二脫氧核苷酸加到模板補充物中時,可隨機終止此過程。當在變性聚丙烯酰胺凝膠上或毛細管中分離隨機終止的鏈時,產(chǎn)生了“DNA梯”。通常采用聚丙烯酰胺凝膠電泳,根據(jù)長度分離終止片段,接著檢測該“DNA梯”,可收集到序列信息。在常規(guī)的半自動和自動DNA測序儀中(如Perkin Elmer的ABI377或MolecularDynamics的MegaBACE),使用熒光標記物F1、F2、F3和F4,通過將熒光標記物加到一種終止核苷酸中或者反應中使用的引物中,從而鑒別出四種終止堿基A、C、G和T。然后尋找通過掃描凝膠或毛細管的檢測器的四種染料,讀取此序列梯。其它熒光檢測形式也是可能的。給單一模板測序在質譜法中,用熒光標記物替換質量標記物(如圖3所示的M0X4、M1X3、M2X2、M3X1、M4X0)?,F(xiàn)在,用M1X3標記腺苷的二脫氧終止子。類似地,用M2X2標記胞苷的二脫氧終止子,用M3X1標記鳥苷的終止子,用M4X0標記胸苷的終止子。以在線的方式,在條帶從毛細管中洗脫出來時,將它們噴射入適當?shù)拇?lián)質量分析儀的離子源中,如根據(jù)本發(fā)明的一個方面用于分析質量標記的核酸的三重四極。通常,在離子源中,這些標記物從序列梯各片段的終止堿基中解離下來,進入三重四極的第一質量分析儀Q1中。Q1設置為僅僅讓MX的分子離子通過,而Q3設置為尋找標記物X0到X4??赡苄枰氖?,質量中的一種,比如X4應用作內(nèi)部標準,即該質量總是存在,而X0、X1、X2和X3是相對于X4進行測量的。
在另一種方法中,可用圖4所示的4種標記物標記這四種終止核苷酸,這樣現(xiàn)在用M1X0標記腺苷的二脫氧終止子。類似地,用M2X0標記胞苷的二脫氧終止子,用M3X0標記鳥苷的終止子,而用M4X0標記胸苷的終止子。如果需要,可將標記物M0X0用作內(nèi)部標準。在這個實施方式中,三重四極的Q1設置為讓標記物M4X0到M0X0的分子離子通過,而Q3設置為尋找標記物X0。
除了核苷酸終止子標記的測序外,也可進行引物標記的測序。PCT/GB98/02048提供了引物標記的測序的詳細描述,該測序可使用本發(fā)明的質量標記物。具有質量標記物的模板的多重測序使用本發(fā)明的質量標記物可同時分析一種以上的模板,這是因為可開發(fā)4種以上的標記物。這意味著可產(chǎn)生多組4種標記物,以根據(jù)上述基于最初由Sanger設計的方法進行多模板的分析。關于核酸模板的多重測序的詳細描述由PCT/GB98/02048提供,該測序可使用本發(fā)明的質量標記物。
可將圖6或7所示形式的質量標記物用于多重分析多DNA序列。在質譜儀中可通過不同的質量系列修飾物從其它每一組中分解的各組5個標記物,可用于鑒別單一模板,如果需要,可將一個多余的標記物用作大小/數(shù)量的標準。但是,4個一組的標記物已足以進行測序,大小標準不是必需的。因而,使用圖6所示的20個標記物的陣列來同時分析5個模板的Sanger反應產(chǎn)物是可能的。基因表達的描述(Profiling)已發(fā)展了各種分析從聚腺苷酸化信使RNA衍生的互補DNA群的方法。大量的這種方法是以通過電泳分離擴增的cDNA庫,檢測不同大小的擴增產(chǎn)物或限制產(chǎn)物為基礎。通常,這些技術的基礎是由衍生自聚腺苷酸化信使RNA的互補DNA(cDNA)庫中的成員產(chǎn)生特征性的限制片段或擴增產(chǎn)物。
示差顯示〔Laing和Pardee,《科學》(Science),257,967-971,1992〕是基于電泳的基因表達描述的經(jīng)典方法。已發(fā)展了這種技術的概念,導致這種技術得以改進地繼承。基于“分子指標”的表達描述方法使用了IIS型或IP型的限制性內(nèi)切核酸酶如Sibson(PCT/GB93/0145)或Kato(EP0 735 144 A1),這是一類繼承的例子。尤其是WO 98/48047公開了基于毛細管電泳質譜法(CEMS)的分子指標法。
在此方法中,使用錨定的和生物素化的多腺苷引物合成cDNA,這可確保所有的cDNA以固定的長度的短多A尾終止。在“錨定引物”cDNA制備中,使用具有大約18個脫氧胸苷殘基的寡核苷酸俘獲和注入攜帶mRNA的多A,該寡核苷酸的3′端具有三種剩余的堿基中的一種,它將引物錨定在多A鏈的末端上。引物的生物素化使cDNA被固定在抗生物素蛋白化的固相載體上。可用普通的II類限制性內(nèi)切核酸酶切割這些被俘獲的cDNA。這使3′末端的限制性片段留在固相載體上,而其它片段則被洗掉。將一個銜接子連接到所得的已知的粘性末端上。將該銜接子設計成攜帶II類限制性內(nèi)切核酸酶結合位點。這些酶結合它們的靶序列,但在遠離結合位點確定數(shù)量的堿基處將潛伏DNA(underlying DNA)切割。這些酶中的某些產(chǎn)生交錯切口;例如,fok1產(chǎn)生不明確的4bp粘性末端。如果用這種酶處理cDNA群,則粘性末端將暴露在群中各cDNA的銜接末端中。使用一類銜接子分子來探測那4種暴露的堿基。有了4bp的不明確的粘性末端,將存在256種可能的候選物。為了鑒別這些探針,使用可斷裂的連接物使這些探針標記上質量標記物,以致一種獨特的質量標記物鑒別256種可能的4bp銜接子中的每一種。這產(chǎn)生了一組根據(jù)普通的II類限制性內(nèi)切核酸酶的切割而具有不同長度的片段,和該cDNA的5′末端上256種可能的質量標記的銜接子的一種。
然后在長度的基礎上,采用毛細管電泳,接著分析連接于cDNA片段末端的質量標記物,從而分離這些質量標記的3′限制性片段。直接將CE柱填充到電噴射質譜儀或相等的質譜儀中。在電離時,這些標記物在質譜儀中從它們所結合的限制性片段中解離下來。測定各條帶中存在的對應于不同的限制性片段長度的從毛細管電泳柱上洗脫下來的各質量標記物的數(shù)量。這個過程獲得各cDNA的信號,可用這種信號檢索數(shù)據(jù)庫。
這種技術較佳是使用256種質量標記物。采用常規(guī)的方法進行質量標記可產(chǎn)生質量標記物陣列,這些質量標記物以約4道爾頓分離,該陣列跨越了1000道爾頓以上的質量范圍。不可能的是,在所有的標記物都對所結合的cDNA限制性片段的遷移產(chǎn)生相同的影響時可產(chǎn)生這些標記物的陣列。這意味著必須使用復雜的校正算法來計算移動中的差異,并精確測定片段長度。但是,本發(fā)明的這些質量指示物和相關的質量標記物非常適合用于上述方法,以產(chǎn)生其對相關的分析物分子的遷移的影響相同的質量指示物陣列,以及直接測定具有高敏感性和優(yōu)異的信噪比的片段長度。
第二類電泳技術是以采用普通的II類限制性內(nèi)切核酸酶為基礎,該酶用于將引物序列導入cDNA限制性片段中。使用標記的引物進行的PCR擴增可產(chǎn)生不同的限制性片段,這可用于鑒別它們所結合的mRNA。這類方法包括US5,712,126中所述的方法,該文公開了一種將銜接子導入限制性內(nèi)切核酸酶消化的cDNA片段中的方法,該銜接子使選擇性擴增以及3′末端cDNA片段的標記得以進行。類似地,WO 99/02727公開了一種擴增3′末端限制性片段的方法,該方法使用固相載體和探測鄰近已知限制性位點的未知序列的PCR引物。在這種技術中,使用生物素錨定的引物制備cDNA,這確保了所有的cDNA都以具有固定長度的短多A尾終止,并且所有的cDNA都可固定在固相基質上。多T引物可在其5′端額外攜帶一引物序列。然后用普通的II類限制性內(nèi)切核酸酶切割俘獲的cDNA。將銜接子連接到所得的已知的粘性末端上。該銜接子設計為攜帶一個引物序列。然后使所得的雙鏈構建物變性。如果需要,可將沒有固定的鏈洗掉。將一類與銜接子引物互補的引物加到上述經(jīng)變性的混合物中,該引物在鄰近該銜接子引物的未知序列上有4個堿基的重疊。這4個堿基的重疊產(chǎn)生256種可能的引物。為了鑒別這些探針,使用可斷裂的連接物將它們標記上質量標記物,這樣,在質譜儀中,256種可能的4bp重疊中的每一種都可用唯一的可鑒別的標記物鑒別。這產(chǎn)生了一組根據(jù)普通的II類限制性內(nèi)切核酸酶的切割而具有不同長度的片段,和在cDNA的5′末端的256種可能的質量標記的引物的一種。視需要,可進行變性和引物延伸循環(huán)多次。如果僅僅用銜接子引物位點,則可進行線性擴增。這使cDNA定量的失真比指數(shù)擴增小。如果需要進行指數(shù)擴增,那么用于俘獲mRNA的多T寡聚物還必須攜帶一個引物位點。如果必須分析少的組織樣品,那么盡管存在潛在的cDNA頻率失真,但可能仍需要進行指數(shù)擴增。
再一,在限制性片段的長度的基礎上,采用毛細管電泳,接著分析cDNA片段末端上的質量標記物,從而分離出質量標記物的3′限制性片段。這種技術與WO98/48047中公開的一樣,較佳是使用256種質量標記物進行,因而同樣地受益于本發(fā)明質量標記物的有利特征。
因此,在本發(fā)明的另一方面,本發(fā)明提供一種分析的方法,該方法包括下述步驟1.提供一組具有不同長度的質量標記的核酸片段,其中這些質量標記物表現(xiàn)出標記的核酸的特征;2.在標記的片段的大小的基礎上將它們分離;3.從標記的片段分離質量標記物;4.在質譜儀中檢測質量標記物。
在本發(fā)明這方面的某些實施方式中,該試驗測定核酸或一系列核酸的序列。在以Sanger梯的產(chǎn)生為基礎的測序實施方式中,質量標記物鑒別各片段的終止核苷酸,并且,各片段由一組4種標記物鑒別。在Sanger測序實施方式中,標記物是以質量標記的引物或標記的終止核苷酸導入的。
在本發(fā)明這方面的其它實施方式中,該試驗用于測定表達的RNA分子的身份和數(shù)量。在優(yōu)選的實施方式中,采用WO 98/48047或WO 99/02727中公開的方法制備質量標記的核酸。在采用這些方法的實施方式中,分別通過質量標記的銜接子的連接作用或質量標記的引物的延伸作用,將質量標記物導入核酸片段中。對于本領域熟練的技術人員來說,應清楚的是,基于核酸片段大小的基因表達描述的其它方法,如PCT/GB93/0145、EP-A-0 735 144或US5,712,126中公開的方法,都適于使用本發(fā)明的標記物。
在本發(fā)明的優(yōu)選實施方式中,在尺寸的基礎上分離分析物的步驟是采用毛細管電泳或高效液相層析法進行,使用如Transgenomic Inc.(San Jose,加利福尼亞州,美國)提供的和US5,585,236、US5,772,889以及其它申請中公開的系統(tǒng)。較佳的是,這種分離是使用質譜儀以在線的方式進行。
在優(yōu)選的實施方式中,將質量標記物從它們所結合的分析物中分離出來的步驟在質譜儀的離子源中進行。在PCT/GB98/00127中公開了使質量標記物在質譜儀的離子源中易于從它所結合的分析物上解離的連接物。在PCT/GB98/00127中公開了增加采用質譜法檢測質量標記物的敏感性的化合物。
對于本領域熟練的技術人員來說,應清楚的是,其它定尺寸的試驗也適于使用本發(fā)明的質量標記物,包括如Grossman P.D.等人在《核酸研究》〔“Nucleic AcidsResearch”,1994年10月25日,22(21)4527-34)中公開的復合的基因型試驗。這種試驗將極大地受益于復合到較高數(shù)量級并仍容易地分解片段大小的能力。蛋白質表達描述和雙向凝膠電泳描述蛋白質的技術,即編錄組織中表達的所有蛋白質的身份和數(shù)量的技術,在自動化或處理量方面還沒有得到很好的發(fā)展。描述一組蛋白質的傳統(tǒng)方法是雙向電泳〔R.A.Van Bogelen.,E.R.Olson,《雙向蛋白質凝膠在生物技術中的應用》(“Application of two-dimensional protein gels in biotechnology”),Biotechnol.Ann.Rev.,169-103,1995〕。在這個方法中,在窄的凝膠帶上分離從生物樣品中抽提得到的蛋白質樣品。第一次分離通常在蛋白質的等電點基礎上將它們分離。然后將整條凝膠帶靠一長方形的凝膠(如聚丙烯酰胺凝膠)的一個邊緣放置。之后,凝膠帶中被分離的蛋白質在第二條凝膠帶中根據(jù)它們的大小被電泳分離,如采用十二烷基硫酸鈉-聚丙烯酰胺凝膠電泳(SDS-PAGE)。這種方法的速度慢,而且很難自動化。它在其最簡單的顯現(xiàn)方面也相對不敏感。一旦分離結束,蛋白質必須是可見的。這通常涉及到使用可在視覺上檢測的試劑或熒光染色凝膠。也采用放射性標記和放射自顯影術。在另外一些方法中,在分離前,可先使熒光染料可共價連接于樣品中的蛋白質。染料的共價添加可改變蛋白質的移動性,因而,這有時不太可取,尤其是如果是與雙向凝膠影像的公眾數(shù)據(jù)庫進行比較的情況。使蛋白質在凝膠上可視化后,通常需要在凝膠的特定點上鑒別蛋白質。通常將該點從凝膠中切下,從凝膠基質中抽提蛋白質。然后采用各種技術鑒別抽提得到的蛋白質。優(yōu)選的技術包括蛋白質的消化,接著進行微測序。已作了許多改進,以增加雙向凝膠電泳對蛋白質的分辨率,并增進該系統(tǒng)的敏感性。增進雙向凝膠電泳的敏感性及其分辨率的一種方法是采用質譜法分析凝膠的特定位點中的蛋白質〔Jungblut P.,Thiede B.,《采用MALDI質譜法從雙向凝膠中鑒別蛋白質》(“Proteinidentification from 2-D gels be MALDI mass spectrometry”),Mass Spectrom.Rev.,16,145-162,1997〕。這樣的一種方法是在凝膠中進行胰蛋白酶消化,接著采用質譜法分析胰蛋白酶消化片段,產(chǎn)生肽質量指紋。如果需要序列信息,可進行串聯(lián)質譜法分析。
目前,雙向分析是相對慢的“批量”方法。它的再現(xiàn)性也不是非常好,而且分析凝膠也很昂貴。由于基于凝膠的分析的大多數(shù)成本都在對各凝膠的處理上,所以,需要的是能在雙向凝膠上同時復合許多樣品。如果用不同的、獨立的可檢測的標記物標記不同樣品中的蛋白質是可能的話,那么可在同一凝膠上同時分析各樣品中的蛋白質。這對于需要隨著特定生物體中的相同蛋白質在多個時間點上的性質進行的研究特別有價值,例如,在監(jiān)測細菌如何在一預定的時間過程中對藥物應答的研究中。類似地,將從多位患有相同疾病的患者獲得的活檢材料與相應的對照進行比較,需要確保從不同的樣品獲得的相同蛋白質在凝膠上的相同位點停止。使所有的樣品在相同的凝膠上移動,可對不同的樣品進行比較,而勿需考慮到凝膠分離的再現(xiàn)性。為了達到這個目標,需要對不同樣品中的蛋白質的移動性的影響相同的一系列標記物,這樣各樣品中被不同的標記物標記的特定蛋白質仍將停留在凝膠的相同位置上,而與其標記物無關。
最近,在采用質譜法分析由液相色譜或毛細管電泳分級分離的全蛋白質方面已作出嘗試〔Dolnik V,《蛋白質的毛細管區(qū)帶電泳》(“Capillary zone electrophoreisof proteins”),Electrophoresis,18,2353-2361,1997〕。已測試了利用毛細管電泳質譜法的在線系統(tǒng)。但是,采用質譜法分析全蛋白質受到許多困難的困擾。第一個困難是,對復雜的質譜進行分析需要使單種蛋白質達到多種電離狀態(tài)。第二個主要缺點是,目前對于高分子量的種類,即其質量大于約4千道爾頓的離子,質譜儀的質量分辨率還非常差,因此要分辨質量接近的蛋白質是困難的。第三個缺點是,采用串聯(lián)質譜法對全蛋白質作進一步分析也是困難的,因為全蛋白質的斷裂模型非常復雜,且難以解釋。
PCT/GB98/00201和PCT/GB99/03258描述了通過分離從混合物中的蛋白質得到的C末端肽,并采用質譜法對它們進行分析,從而表征蛋白質的復雜混合物的方法。所述的方法可用于測定樣品中蛋白質存在與否,但不會得出這些樣品之間的比較數(shù)據(jù)。這些方法沒有描述同時分析多個樣品的技術,而這類技術對于多樣品中的蛋白質表達水平的定量比較或許是必需的。
EP-A-0 594 164描述了在使用N末端測序試劑在C末端肽測序的方法中分離從蛋白質得到的C末端肽的方法。在此方法中,用在C末端一側的賴氨酸殘基解離的內(nèi)肽酶消化感興趣的蛋白質。所得的肽與DITC聚苯乙烯反應,該DITC聚苯乙烯與所有游離的氨基基團反應??捎萌宜?TFA)解離與DITC聚苯乙烯反應的N末端氨基,從而釋放出所有肽的N末端。但是,賴氨酸的ε-氨基沒有被解離,因此,所有的非末端肽被保留在載體上,僅有C末端肽釋放。根據(jù)該文獻,回收這些C末端肽用于微測序。
《自然生物技術》〔Nature Biotechnology,17994-999(1999)〕公開了采用“同位素編碼的親和標記物”俘獲從蛋白質得到的肽,從而進行蛋白質表達分析。在這篇文章中,作者描述了生物素連接物的使用,該連接物與巰基反應,以俘獲帶有半胱氨酸的肽。從一個來源得到的蛋白質樣品與生物素連接物反應,然后用內(nèi)肽酶解離。然后,在抗生物素蛋白化的珠上可分離含有肽的生物素化的半胱氨酸,用于接下來的質譜分析。通過用生物素連接物標記一個樣品,和用生物素連接物的變性形式標記第二個樣品,可對兩個樣品進行定量比較。然后使樣品中的各肽表示為質譜中的一對峰,其中,相對峰高度表示它們的相對表達水平。
這篇文獻中的方法有許多局限。在這種“同位素編碼”方法的各種局限中,第一個是,蛋白質中巰基的存在的可靠性——許多蛋白質沒有巰基,而其它有一些。在這種方法的一個變化中,可將連接物設計成與其它側鏈反應(如胺),但是,由于許多蛋白質含有一種以上賴氨酸殘基,這這種方法中,每個蛋白質將分離出多條肽。這可能不會減少足以進行質譜法分析的樣品的復雜性。含有太多種類的樣品可能會受到“離子抑制”的困擾,即某些種類比其它種類優(yōu)先電離,這種情況通常出現(xiàn)在較不復雜的樣品中的質譜中。通過蛋白質的側鏈將其俘獲通常要么使每種蛋白質產(chǎn)生太多的肽,要么使某些蛋白質一起遺漏。
這種方法的第二個局限是用來在比較從不同樣品得到的蛋白質的表達水平的方法中。使用親和標記物的不同的同位素變體標記各樣品,每種樣品中的每條肽在質譜中會產(chǎn)生額外的峰,這意味著如果一起分析兩份樣品,則在質譜中將會有兩倍多的峰。類似地,如果一起分析三份樣品,質譜將比單獨分析一份樣品要復雜三倍。試圖采用這種方法比較兩份或三份樣品是可行的,但是,這很可能是一種局限,因為峰數(shù)增加會增加兩種不同的肽在質譜中具有重疊峰的可能性。
該文獻的作者報道的另一局限是由標記物引起的移動性的改變。這些作者報道,在用未變性的標記物標記的相同的肽之后,標記了變性的生物素標記物的肽有一點洗脫。
綜上所述,本發(fā)明的又一目的是,提供同時測定復雜的多肽混合物的許多樣品中多肽的身份和相對數(shù)量的改進方法。本發(fā)明這方面的另一目的是,確保所有的蛋白質在分析中表現(xiàn)。本發(fā)明的這方面還有一個目的是,提供可對多份樣品同時進行定量分析,在與從單一樣品得到的質譜進行比較時,沒有顯著地增加質譜的復雜性的質量標記物和技術。本發(fā)明這方面的最后一個目的是,提供對標記的肽的移動性具有相同的影響的標記物,這樣在色譜法分離后具有不同標記物的相同肽的樣品將一同洗脫。
因此,本發(fā)明另一優(yōu)選的實施方式提供一種分析含有一種以上蛋白質的蛋白質樣品的方法,該方法包括1.用至少一種分離的可分解的質量標記物標記樣品中的肽、多肽和/或蛋白質,該質量標記物從本發(fā)明的組和陣列中獲得,這樣,各肽、多肽和/或蛋白質都被標記上對該蛋白質唯一的標記物或其組合;2.采用質譜法分析這些標記的肽、多肽和/或蛋白質,較佳是根據(jù)本發(fā)明的一個方面如串聯(lián)質譜法進行分析,以檢測連接于蛋白質的標記物。然后可鑒別該樣品中的標記的肽,并測定它們的相對表達水平。
較佳的是,對多份樣品采用上述方法。還較佳的是,對于許多樣品中的每一份樣品,在進行上述標記步驟(1)之前,先使用斷裂劑(尤其是序列特異性斷裂劑)將肽從混合物中的多肽中分離出來。在標記步驟(1)后,如果需要可將樣品集中。任選地,在標記步驟(1)和/或集中樣品后,采用凝膠電泳、等電聚焦電泳、液相色譜法或其它適當?shù)姆椒?,將肽、多肽?或蛋白質從樣品中分離出來,較佳是產(chǎn)生分離的部分。這些部分可以是凝膠上的條帶或點,或者是從色譜法分離得到的液體部分??墒褂玫诙N分離步驟進一步分離從一個分離步驟中獲得的部分。類似地,進一步分離得到的部分可再次分級分離,直到蛋白質足以分解,以用于接下去的分析步驟中。
因此,本發(fā)明的這個方面提供本發(fā)明上述標記物和方法的進一步應用。本發(fā)明標記物組或陣列可用于增加生物體中蛋白質的雙向凝膠電泳分析的處理量。每一種質量標記物都會以相同的方式改變它所結合的蛋白質的移動性,但它仍可獨立地被檢測到。在將質譜法用于分析從雙向凝膠電泳獲得的蛋白質的已知用途中,如肽質量指紋法,需要從凝膠中抽提出蛋白質,并將其純化,以除去去污劑(如SDS)和來自凝膠的其它污染。本發(fā)明的標記物可使從凝膠得到的蛋白質的相對未純化的抽提物直接導入質譜儀中,然后可采用本發(fā)明的方法,在污染材料的背景中鑒別結合的標記物。
在本發(fā)明這方面的一個特別優(yōu)選的實施方式中,對多份樣品采用下述方法1.對于許多樣品中的每一份,使用序列特異性斷裂劑從混合物中的多肽中分離肽;2.用本發(fā)明的標記物標記各樣品中分離的肽,這樣每份樣品由獨特的標記物鑒別
3.集中標記的樣品;4.任選地,采用色譜法或電泳法分離該集中的和標記的肽;5.采用串聯(lián)質譜法分析標記的樣品,以鑒別樣品中標記的肽和測定它們的相對表達水平。
本發(fā)明這方面的另一優(yōu)選實施方式提供了一種分析一系列蛋白質樣品的方法,各樣品含有一種以上蛋白質,該方法包括1.使各份樣品的蛋白質與至少一種分離的可分解的質量標記物發(fā)生共價反應,該質量標記物從本發(fā)明的組和陣列中獲得,這樣,各樣品的蛋白質被標記上一種或多種質量標記物,該標記物不同于和其它每一份樣品的蛋白質反應的標記物;2.集中質量標記的樣品;3.采用凝膠電泳、等電聚焦電泳、液相色譜法或其它適當?shù)姆椒ǚ蛛x該集中的樣品,以產(chǎn)生分離的部分。這些部分可以是凝膠上的條帶或點,或者是從色譜法分離得到的液體部分??墒褂玫诙N分離技術進一步分離從一個分離步驟中獲得的部分。類似地,進一步分離得到的部分可再次分級分離,直到所述蛋白質足以分解,以用于接下去的分析步驟中;4.采用質譜法分析這些部分,較佳的是,根據(jù)本發(fā)明的一個方面檢測連接于蛋白質的標記物。
本發(fā)明這方面的又一優(yōu)選實施方式提供一種鑒別樣品中的蛋白質的方法,該樣品含有一種以上蛋白質,該方法包括1.使樣品中的蛋白質與至少一種分離的可分解的質量標記物發(fā)生共價反應,該質量標記物從本發(fā)明的組和陣列中獲得;2.采用凝膠電泳、等電聚焦電泳、液相色譜法或其它適當?shù)姆椒ǚ蛛x蛋白質,以產(chǎn)生分離的部分。這些部分可以是凝膠上的條帶或點,或者是從色譜法分離得到的液體部分。可使用第二種分離技術進一步分離從一個分離步驟中獲得的部分。類似地,進一步分離得到的部分可再次分級分離,直到所述蛋白質足以分解,以用于接下去的分析步驟中;3.用序列特異性斷裂劑消化該部分中的蛋白質;4.任選地使樣品中的蛋白質與附加的質量標記物反應;5.采用液相色譜質譜法分析消化的部分,其中,通過檢測連接于這些肽的質量標記物,測定質量標記的肽從液相色譜柱步驟中洗脫出來的時間。較佳是根據(jù)本發(fā)明的一個方面進行質譜分析,以檢測連接于蛋白質的標記物;6.比較步驟5的液相色譜質譜法分析得到的標記的肽的洗脫特征與數(shù)據(jù)庫中的特征,也確定該蛋白質以前是否已被鑒別。
本發(fā)明這方面的又一優(yōu)選實施方式提供從一系列蛋白質樣品中鑒別一種蛋白質的方法,所述各樣品含有一種以上的蛋白質,該方法包括;1.使各份樣品的蛋白質與至少一種分離的可分解的質量標記物發(fā)生共價反應,該質量標記物從本發(fā)明的組和陣列中獲得,這樣,各樣品的蛋白質被標記上一種或多種質量標記物,該標記物不同于和其它每一份樣品的蛋白質反應的標記物;2.集中質量標記的樣品;3.采用凝膠電泳、等電聚焦電泳、液相色譜法或其它適當?shù)姆椒ǚ蛛x該集中的樣品,以產(chǎn)生分離的部分。這些部分可以是凝膠上的條帶或點,或者是從色譜法分離得到的液體部分??墒褂玫诙N分離技術進一步分離從一個分離步驟中獲得的部分。類似地,進一步分離得到的部分可再次分級分離,直到蛋白質足以分解,以用于接下去的分析步驟中;4.用序列特異性斷裂劑消化所述部分中的蛋白質,以產(chǎn)生針對樣品中的各蛋白質的特征肽;5.任選地使樣品中的蛋白質與附加的質量標記物反應;6.采用液相色譜質譜法分析消化的部分,其中,通過檢測連接于這些肽的質量標記物,測定質量標記的肽從液相色譜柱步驟中洗脫出來的時間。較佳是根據(jù)本發(fā)明的一個方面進行質譜分析,以檢測連接于所述蛋白質的標記物;7.比較步驟6的液相色譜質譜法分析得到的標記的肽的洗脫特征與數(shù)據(jù)庫中的特征,也確定該蛋白質以前是否已經(jīng)被鑒別。
本發(fā)明上述優(yōu)選實施方式的步驟1涉及本發(fā)明的質量標記物與一組蛋白質的反應性側鏈的共價反應。本領域已知該反應性側鏈官能度可以選擇性地反應。反應性側鏈包括賴氨酸、絲氨酸、蘇氨酸、酪氨酸和半胱氨酸。半胱氨酸常自身交聯(lián),形成二硫鍵。為了本發(fā)明的目的,不需要將這些二硫鍵破壞,但半胱氨酸側鏈可以是高度反應性的,并且易于與各種試劑反應。如果該二硫鍵存在,可使用巰基乙醇將它們還原成一對巰基。巰基在弱堿性的條件下可被碘乙酸(Aldrich)選擇性加帽,這促進了硫醇鹽離子的形成(Mol.Microbiol.,52293,1991)。適當?shù)娜鯄A是碳酸鹽。為了本發(fā)明的目的,其反應性官能度是碘乙?;谋景l(fā)明的質量標記物可與分析物蛋白質的巰基反應。在其它實施方式中,可用其反應性官能度是異氰酸鹽基的質量標記物處理該組蛋白質。異氰酸鹽幾乎專門地與蛋白質N末端的α-氨基反應,并且與任何賴氨酸ε-氨基反應,即在溫和條件下(即,室溫,中性溶劑)與伯胺反應,產(chǎn)生脲衍生物。也可將這些試劑制成在較高溫度下,在適當?shù)拇呋瘎?如吡啶)或錫化合物(如甲錫烷基月桂酸二丁酯)的存在下,與任何攜帶羥基的側鏈(如絲氨酸、蘇氨酸和酪氨酸側鏈)反應,以產(chǎn)生尿烷衍生物。在另一實施方式中,可用其反應性官能度是甲硅烷基(如氯硅烷)的質量標記物處理該組蛋白質。這些化合物易與大多數(shù)反應性官能基團反應。胺衍生物在水性條件下不穩(wěn)定,因此如果需要,可將它們水解成游離的胺。還可將磺酰氯用作質量標記物上的反應性基團,用于選擇性地與具有游離胺(如賴氨酸)的質量標記物反應。羧酸側鏈處理也可與本發(fā)明的標記物反應,雖然通常需要激活這些側鏈,以確保它們會反應。通常將乙酸酐用于此目的。這會形成游離羧酸的混合酐,然后可使這種混合酐與親核官能度(如胺)反應。
上述特殊的實施方式僅僅是闡述使側鏈官能度選擇性地與質量標記物反應的優(yōu)選方法的例子。各種各樣的反應性基團在本領域中是已知的,它們當中的許多種都可用于完成本發(fā)明這些方面的第一步。還需要的是,使樣品中蛋白質的一種類型以上的側鏈與不同的質量標記物反應。如果要同時分析多份樣品,則可使用兩種或多種標記物標記每一份樣品。這會從各蛋白質中獲得更多的信息,從而有助于該蛋白質的鑒別。
在本發(fā)明這個方面的后兩個實施方式的步驟3和4中,C末端被修飾的蛋白質與序列特異性斷裂劑反應。在一些實施方式中,可使用序列特異性內(nèi)切蛋白酶,如胰蛋白酶、胰凝乳蛋白酶、凝血酶或其它酶。斷裂劑也可以是化學劑。這些試劑較佳是可揮發(fā)的,以便使未反應的試劑易于去除。適當?shù)幕瘜W斷裂劑包括溴化氰和BNPS-甲基吲哚,前者在甲硫氨酸殘基處解離,后者在色氨酸殘基處解離(D.LCrimmins等人,Anal.Biochem.,18727-38,1990)。
在本發(fā)明這個方面的上述優(yōu)選實施方式中,分級分離蛋白質的步驟較佳是采用雙向凝膠電泳進行,在第一向中進行等電聚焦電泳,在第二向中進行SDS-PAGE。然后使凝膠可視化,以鑒別蛋白質已遷移到凝膠上的哪個位置上。然后將這些點從凝膠上切下,之后從切下的凝膠點中抽提出蛋白質。然后,采用電噴射質譜法或其它一些合適的電離方法直接分析這些抽提得到的蛋白質?;蛘?,可使用質譜儀(如HPLC質譜儀)在線進行進一步的分級分離。
在本發(fā)明這方面的后兩個優(yōu)選實施方式的步驟3和4中,可使消化的蛋白質任選地與本發(fā)明附加的質量標記物反應。這對于本發(fā)明同時分析多份樣品的后一個優(yōu)選實施方式更為重要。大多數(shù)的酶消化和一些化學斷裂方法使游離的胺留在經(jīng)消化的分級分離的蛋白質的所得肽上,這些胺可與質量標記物反應。這意味著在所有的肽上將出現(xiàn)相同的標記物,并且可選擇性檢測這些標記物,從而使該分析的敏感性最大化。
在本發(fā)明這方面的后兩個優(yōu)選實施方式的步驟6和7中,通過消化分級分離的蛋白質產(chǎn)生的肽的洗脫特征可用于檢索預先形成的數(shù)據(jù)庫,以確定這些蛋白質以前是否已被鑒別??刹捎么?lián)質譜法進一步分析從液相色譜柱上洗脫出來并進入質譜儀中的肽,以確定可用來鑒別蛋白質的序列信息。可使用肽序列數(shù)據(jù)檢索蛋白質序列數(shù)據(jù)庫,或可將其翻譯成核酸序列數(shù)據(jù),以檢索核酸序列數(shù)據(jù)庫。翻譯后修飾的肽的分離碳水化合物常常以蛋白質的翻譯后修飾出現(xiàn)。這些碳水化合物常常具有羰基。可將羰基標記,使蛋白質攜帶這類修飾,從而將它們檢測或分離。生物胞素酰肼(Pierce & Warriner Ltd,Chester,UK)與許多碳水化合物種類中的羰基反應〔E.A.Bayer等人,Anal.Biochem.,170,271-281,《生物胞素酰肼——采用親和素-生物素技術進行的糖綴合物中的唾液酸、半乳糖和其它糖類的選擇性標記物》(“Biocytin hydrazide——a selective label for sialic acid,galactose,and others sugars inglycoconjugates using avidin biotin technology″),1988〕。從而可將復雜的混合物中具有碳水化合物修飾的蛋白質生物素化。然后可用內(nèi)切蛋白酶(如胰蛋白酶)處理蛋白質混合物,以從蛋白質中獲得肽。然后,可使用抗生物素蛋白化的固相載體分離生物素化的并由此進行碳水化合物修飾的肽。可以這種方式處理一系列的樣品,并使所獲得的肽與本發(fā)明的質量標記物反應,這樣從各樣品得到的肽都具有質量標記物或質量標記物的組合,這些質量標記物與從該樣品獲得的肽是相關的。較佳的是,從各樣品得到的肽具有不同的質量標記物。然后,采用液相色譜串聯(lián)質譜法分析這些質量標記的具有碳水化合物的肽。
許多研究組已經(jīng)報道了與各種蛋白質中的磷酸酪氨酸殘基結合產(chǎn)生的抗體的方法〔例如,參見A.R.Frackelton等人,Methods Enzymol.,201,79-92,《抗磷酸酪酸的單克隆抗體的產(chǎn)生及其在含有磷酸酪氨酸的蛋白質的親和純化中的應用》(“Generation of monoclonal antibodies against phosphotyrosine and their use foraffinity purification of phosphotyrosine-containing proteins″),1991,以及MethodsEnzymol.中的其它文章〕。這意味著通過親和層析,使用這些抗體作為親和柱配體,可分離出已由酪氨酸磷酸化作用進行翻譯后修飾的大比例的蛋白質。
這些磷酸酪氨酸結合抗體可用于本發(fā)明的內(nèi)容中,以分離出含有磷酸酪氨酸殘基的肽。因此,可用序列特異性內(nèi)肽酶處理復雜混合物中的蛋白質,以產(chǎn)生游離的肽。然后,可使這些肽通過抗磷酸酪氨酸抗體柱,該柱會留住含有磷酸酪氨酸基團的肽??梢赃@種方式處理一系列的樣品,所獲得的肽與本發(fā)明的質量標記物反應,這樣,從各樣品獲得的肽具有質量標記物或質量標記物組合,這些標記物與從該樣品得到的肽是相關的。較佳的是,從各樣品獲得的肽具有不同的質量標記物。然后,可采用液相色譜串聯(lián)質譜法分析這些質量標記的具有磷酸酪氨酸的肽。從蛋白質中分離的末端肽本發(fā)明蛋白質表達描述的優(yōu)選方法是,僅僅從樣品的各蛋白質中分離出一條肽。如果所分離的肽片段足夠長,則該片段對于它的親本蛋白質是特異的。在本發(fā)明這個方面的第一步中,從許多份復雜蛋白質混合物的樣品中的每一份中的各蛋白質分離出肽。在這個方面的一些實施方式中,較佳是分離出末端的肽。末端肽的分離保證了每種蛋白質至一條且僅有一條肽被分離。在PCT/GB98/00201和PCT/GB99/03258中討論了從多肽的末端分離肽的方法。
因此,本發(fā)明的這個方面提供一種蛋白質描述的方法,該方法包括(a)用斷裂劑處理含有一組許多多肽的樣品,已知該斷裂劑識別多肽鏈中的特殊氨基酸殘基或序列,以在切割位點進行解離,從而將該組多肽解離,產(chǎn)生肽段;(b)從其片段化的樣品中分離出一組肽片段,這些片段具有作為參考末端的多肽的N末端或C末端,每條肽在另一端在接近該參考末端處具有切割位點;(c)在分離這些肽片段之前或之后,用從本發(fā)明的質量標記物組或陣列獲得的質量標記物或質量標記物的組合標記多肽的每一個參考末端,其中,各參考末端與它的標記物或標記物的組合是相關的;(d)采用質譜法測定一條或多條分離的片段的特征序列,所述特征序列是從切割位點開始有預定數(shù)量的氨基酸殘基的序列;其中,特征序列表征了各多肽。
本發(fā)明這個方面提供的另一優(yōu)選的方法是,使用第二種斷裂劑來產(chǎn)生更多的片段,這些片段可自身被鑒別,并可用于表征它們的親本多肽或蛋白質。這種方法包括(a)使含有一條或多條多肽的樣品與第一斷裂劑接觸,產(chǎn)生多肽片段;(b)分離出一條或多條多肽片段,各片段含有從其被片段化的樣品中獲得的多肽的N末端或C末端;(c)在分離多肽片段之前或之后,用從本發(fā)明的質量標記物組或陣列獲得的質量標記物或質量標記物的組合標記多肽的每一個末端,其中,各末端與它的標記物或標記物的組合是相關的;(d)采用質譜法鑒別分離的片段;(e)使用第二種斷裂劑,對該樣品重復上述步驟(a)-(d),所述第二種斷裂劑在與第一斷裂劑作用位點不同的位點上解離;(f)由步驟(d)和(e)中鑒別得到的片段表征上述樣品中的一條或多條多肽。
在上述兩種方法中,標記參考末端的步驟可在分離片段之前或之后進行,如果需要,也可在將這些片段從它們的親本多肽或蛋白質解離下來之前進行。
關于肽片段的分離,在本發(fā)明這方面的優(yōu)選實施方式中,可采用下述方法從蛋白質的復雜混合物中分離末端肽,該方法包括以下步驟1.用Lys-C特異性斷裂酶完全消化蛋白質的復雜混合物,即在最接近賴氨酸殘基的肽鍵處切割的試劑,該殘基在C末端一側;2.使所得的肽與活化的固相載體接觸,該載體將與游離的氨基反應;3.任選地使俘獲的肽與雙功能性試劑反應,該試劑具有至少一個胺反應性官能度;4.使俘獲的肽與一種試劑接觸,該試劑在載體上的各肽的α氨基上進行解離。不是C末端的所有的肽具有將它們共價連接于固相載體的賴氨酸殘基。從而,游離的C末端肽被選擇性釋放;
5.任選地,使所釋放的肽與第二種固相載體接觸,該肽將與步驟3中使用的該雙功能性試劑的第二反應性官能度反應,以俘獲不與第一載體正確反應的任何肽;6.回收在溶液中保持游離的肽。
在本方法的優(yōu)選實施方式中,復雜混合物中的蛋白質被一種試劑變性、還原及處理,以在蛋白質中加上巰基。標準的方法涉及,在pH8.5的具有作為變性劑的高濃度鹽酸胍(6-8M)的緩沖液中,在作為還原劑的過量的巰基乙醇或二硫蘇糖醇,以及過量的加帽劑(如乙烯吡啶)存在下,使這些蛋白質變性。
在本方法的步驟1中,用Lys-C特異性斷裂酶完全消化蛋白質的復雜混合物,該酶可以是如從產(chǎn)酶溶桿菌(Lysobacter enzymogenes)(Boehringer Mannheim)獲得的內(nèi)肽酶Lys-C。
在本方法的步驟2中,使所得的肽與固相載體接觸,該載體與胺反應。在優(yōu)選的實施方式中,該固相載體是用異硫氰酸鹽化合物衍生化得到的。在一個實施方式中,使該組肽在堿的存在下與異硫氰酸鹽玻璃(DITC玻璃,Sigma-Aldrich Ltd,Dorset,England)反應。這將通過任何游離的氨基使該載體俘獲所有的肽。
步驟3是任選的,但該步驟是較佳的。可能很難保證所有的非C末端肽與第一固相載體在賴氨酸側鏈氨基和N末端α-氨基上完全反應。僅通過賴氨酸側鏈氨基反應的肽在接下去的步驟中將維持著與該載體連接。僅通過它們的α-氨基反應的肽將與C末端肽一起從載體上解離下來。這個步驟使非C末端肽與C末端肽得以區(qū)分。在這個任選的步驟中,雙功能性試劑可是M-琥珀酰亞胺基[4-乙烯基磺?;鵠苯甲酸酯(從Pierce & Warriner Ltd.,Chester,UK獲得的SVSB)。這種化合物含有連接于巰基反應性乙烯基砜部分的胺反應性N-羥基琥珀酰亞胺酯。該化合物非常易于通過酯官能度與胺反應,而不需乙烯基砜的反應,并且在較后階段它可單獨與巰基反應。因而,SVSB在弱堿性的條件下與載體上所有的游離胺反應。在大大過量的SVSB化合物存在下,并且假設載體上的肽是固定的,則SVSB將僅通過琥珀酰亞胺官能度與肽反應,而使乙烯基砜部分保持游離,以用于進一步的反應。在另一實施方式中,任何未反應的胺可與偶聯(lián)于胺反應性官能度的生物素反應,如N-羥基琥珀酰亞胺(NHS)生物素(Sigma-Aldrich Ltd.,Dorset,England)。這使不完全反應的肽在隨后被俘獲在抗生物素蛋白化的珠上,或者在親和俘獲柱中的抗生物素蛋白化的樹脂上。
在本發(fā)明的步驟4中,使俘獲的肽與在載體上各肽的α-氨基上解離的試劑接觸。在將DITC玻璃用作胺反應性載體的實施方式中,使肽與適當?shù)膿]發(fā)性酸反應,如三氟乙酸(TFA),這種酸將N末端氨基酸從載體上各肽中解離下來。不是C末端的所有的肽都具有將它們共價連接于固相載體的賴氨酸殘基。因而,游離的C末端肽被選擇性地釋放。
任選的步驟5是優(yōu)選的,尤其是如果進行任選的步驟3的話。通過此步驟將除去沒有與胺反應性載體完全反應的非C末端肽。如果SVSB用于標記僅通過它們的α-氨基反應的非C末端肽的話,則它們將具有反應性官能度,這種官能度將使它們可與用適當?shù)挠H核劑(優(yōu)選巰基)衍生得到的固相載體反應。如果在步驟4中使用了DITC玻璃(這種做法是優(yōu)選的),則可使用TFA將肽從載體上釋放出來。通過將TFA蒸發(fā)掉,以三氟乙酸鹽的形式回收釋放的肽。然后,將肽再懸浮在pH約為7的緩沖液中,或者就放在適當?shù)闹行匀軇┲?,如二甲基甲酰胺、二甲基亞砜或水與丙酮的混合物。然后,將肽加到經(jīng)巰基衍生化的載體中。在pH7,在SVSB處理的肽上剩余的乙烯基官能度將幾乎專門與巰基載體反應,而不與由肽從DITC玻璃載體上解離而暴露出來的游離胺反應。巰基衍生化的Tentagel可從RappPolymere GmbH(Tubingen,德國)購得,或者可通過將硅膠與3-巰基丙基三甲氧基硅烷培育而制備巰基衍生化的載體。
在本方法的步驟6中,回收釋放的肽。如果采用任選的步驟3和5,則肽可能存在于各種各樣的溶劑或緩沖液中。在優(yōu)選的實施方式中,將選擇具有揮發(fā)性的溶劑或緩沖液。如果直接從第一載體(在優(yōu)選實施方式中,該載體是DITC玻璃)中回收肽,這些肽有可能存在于可揮發(fā)的TFA中。較佳是采用蒸發(fā)溶劑或緩沖液的方法從這些可揮發(fā)的溶劑或緩沖液中回收這些肽。采用這種方法分離的肽將具有游離的α-氨基,這些氨基可用于與本發(fā)明的標記物反應。標記分離的肽可在本發(fā)明這方面描述的蛋白質表達描述中使用本發(fā)明任一種質量標記物。圖22和23所示的質量標記物特別優(yōu)選用于本發(fā)明,尤其是本發(fā)明的這個方面。這些化合物具有乙烯基砜反應性基團,該基團使這些化合物能與游離的胺和巰基進行加成反應。如果每條肽僅需一種標記物,那么可在用序列特異性內(nèi)肽酶解離前,先用加帽劑處理復雜混合物中的蛋白質。苯基、乙基和甲基乙烯基砜將與游離的胺和巰基反應,并將它們封住,同時仍允許胰蛋白酶對該加帽的蛋白質進行解離。如果乙烯基砜部分尤其是乙基乙烯基砜和甲基乙烯基砜沒有被封阻,則賴氨酸的ε胺殘基將與兩個乙烯基砜部分反應。
在連接標記物后,這些標記的肽將具有一個質量,該質量由于該標記物的質量而變動。肽的質量可足以鑒別源蛋白質。在這個例子中,僅需對標記物進行檢測,這可通過用三重四極監(jiān)測進行的選擇反應而實現(xiàn),下文將有詳細描述。簡言之,三重四極的第一四極設置為讓其質荷比對應于感興趣的肽的離子通過,將其調(diào)整為標記物的質量。然后,在第二四極中,使所選擇的離子進行碰撞誘導解離(CID)。在用于肽分析的各種條件下,這些離子將大部分在分子中的酰胺鍵上片段化。圖22和23中的標記物具有酰胺鍵,該鍵在斷裂時釋放出標記物的末端預電離部分。雖然標記物都具有相同的質量,但是末端部分是不同的,因為在酰胺鍵的任一側鏈上的取代基不同。因此,這些標記物互不相同。結合了特定質量的離子的標記物片段的存在應可證實該離子是肽,并且從不同樣品得到的標記物的相對峰高度將給出肽的樣品中肽的相對數(shù)量的信息。如果因為樣品中許多末端肽都具有相同的末端質量,或者因為該肽是未知,而該質量不足以鑒別肽,則可通過完整的CID質譜分析來測定序列信息。圖24顯示兩份樣品的肽的理論質譜,該肽具有H2N-gly-leu-ala-ser-glu-COOH的序列,其中,各樣品連接于一種具有圖23所示的式子的標記物。該質譜是理想化的,因為它僅僅顯示b系列片段,而沒有顯示其它的片段或任何噪聲峰,但是,它闡述了該質譜被清楚地分成對應于肽片段峰的較高質量區(qū)域,和對應于質量標記物峰的較低質量區(qū)域。如果需要,該肽片段峰可用于鑒別肽,而該質量標記物峰則給出關于肽的相對數(shù)量的信息。采用色譜法或電泳分離標記的肽在本發(fā)明的這個方面中,較佳的是,在進行質譜分析之前的步驟中,先對標記的末端肽進行色譜法分離。較佳是進行高效液相色譜法(HPLC),該儀器可直接與質譜儀連接,這樣在肽從色譜柱上洗脫下來后進行在線分析??刹捎肏PLC進行各種分離技術,但較流行的做法是在進行質譜法之前,采用反向色譜法進行肽的分離。毛細管區(qū)帶電泳是另一分離方法,此方法也可直接與質譜儀連接,以自動分析洗脫的樣品。這些和其它分級分離的技術都可在采用質譜法進行分析之前應用,以減少肽的混合物的復雜性。采用串聯(lián)質譜法進行蛋白質定量和鑒別在本發(fā)明這方面的方法中,采用串聯(lián)質譜法分析標記的分離肽。
如早先所討論的,串聯(lián)質譜儀對具有預定質荷比的離子進行了選擇和片段化,如通過碰撞誘導解離(CID)。然后,可檢測這些片段,提供關于所選擇離子的結構信息。在串聯(lián)質譜儀中采用CID分析肽時,觀察到特征性的斷裂模式,由此可測定肽的序列。天然的肽通常在肽骨架的酰胺鍵上隨機地斷裂,產(chǎn)生一系列成為該肽的特征的離子。通常將離子的電荷保留在該離子的N末端片段上的CID片段序列稱為an、bn、cn等,分別指在第n個肽鍵上解離得到的片段。類似地,將電荷保留在離子的C末端片段上的片段系列稱為xn、yn、zn等。這種表示法在下述示意圖1中描述 示意圖1胰蛋白酶和凝血酶是用于串聯(lián)質譜法的優(yōu)選的斷裂劑,因為它們在分子的兩端產(chǎn)生具有堿性基團的肽,即在N末端產(chǎn)生α-氨基,在C末端產(chǎn)生賴氨酸或精氨酸側鏈。這有利于形成帶雙倍電荷的離子,其中,帶電中心在該分子的相反的末端上。這些帶雙倍電荷的離子經(jīng)CID后產(chǎn)生C末端離子系列和N末端離子系列。這有助于確定肽的序列。一般而言,在給定肽的CID質譜中觀察到只有一種或兩種可能的離子系列。在以四極為基礎的儀器的典型的低能碰撞中,N末端片的b系列或C末端片段的y系列占優(yōu)。如果分析帶雙倍電荷的離子,則常常檢測到這兩個系列。通常,y系列比b系列占優(yōu)。
如果用于本發(fā)明方法的分離肽是如上述采用DITC玻璃分離得到的C末端肽,則這些肽在分離后,在它們的N末端將具有游離的胺,這有利于使用本發(fā)明的標記物進行標記。如上所述,這些標記物都可具有相同的質量,這樣所分析的每份樣品中的等價的肽的質量將改變相同的量。這些肽的CID將從標記物中產(chǎn)生片段。標記物片段的強度可表示要測定的每份樣品中的等價肽的相對數(shù)量。只要電荷仍保留在標記物上,將本發(fā)明的質量標記物共價連接于分離肽的N末端,將使片段離子的b系列的質量被標記物的質量改變。由于用于每一份分析樣品的標記物的質量相同,所以只要標記的肽的碰撞誘導斷裂在肽骨架上發(fā)生,對于所有的樣品,將只有一種離子系列產(chǎn)生。這意味著由其片段離子鑒別標記的肽是可能的,并且對于任何給定的肽,不管同時分析的樣品的數(shù)量是多少,肽的片段系列將只有一種。標記物自身的片段化將產(chǎn)生各樣品的峰特征。這些峰將在相對低的質量范圍內(nèi)產(chǎn)生(見圖24)。在三重四極儀器的幫助下,較佳是使用選擇的反應監(jiān)測,以獲得這些峰的最敏感的檢測。這些峰的相對敏感性將是原始樣品中獲得的肽的源蛋白質的相對量的指示。在天然的肽中,片段離子的b系列的強度比y系列低。由于具有了包括如季銨中心的適當?shù)膲A性質量標記物或“預電離”的質量標記物,離子片段的b系列的強度得以增強。遺憾的是,如果使用C末端肽,則不能保證C末端氨基酸是堿性的,因此y系列的片段離子可能是弱的。使用y系列測定結構信息可能需要這些肽的C末端攜帶一個堿基或一個“預電離”的基團。
所獲得的質譜的“噪音”使得采用串聯(lián)質譜法對蛋白質,尤其是蛋白質的混合物進行的分析變得復雜。從生物樣品中分離得到的蛋白質通常受到緩沖劑、變性劑和去污劑的污染,所有這些試劑都將峰引入質譜中。結果,在質譜中污染峰比肽的峰還要多,從而鑒別出對應于肽的峰就成為一個主要的問題,尤其是難以分離的小樣品蛋白質。結果,在進詳細的CID分析前,先要采用各種方法來測定哪個峰對應于肽。以三重四極為基礎的儀器允許進行“前體離子掃描”〔參見WilmM.等人,Anal.Chem.,68(3)527-33,《未分離的肽混合物的母離子掃描》(“Parention scans of unseparated peptide mixtures″),1996〕。以“單一反應監(jiān)測”的模式進行三重四極處理,其中,第一四極掃描整個質量范圍,然后在第二四極中使每一個通過的離子進行CID處理。將第三四極設置為僅檢測一種特異性片段離子,該離子通常是從肽得到的特征性片段離子,如銨離子。采用四極/飛行時間質譜儀的另一方法,通過鑒別進行CID處理時產(chǎn)生質荷比比母離子高的子系離子的離子,從而掃描帶雙倍電荷的離子。鑒別帶雙倍電荷的離子的另一方法是,在光譜中尋找具有適當強度比的僅分開0.5道爾頓的峰組,這類峰組可能指示該離子是相同的,區(qū)別僅在于分子中存在13C的比例。
通過使用本發(fā)明的質量標記物標記肽,可展望獲得一種新形式的前體離子掃描,其中,在對該標記的肽進行CID處理后,由對應于本發(fā)明的質量標記物的片段的存在來鑒別肽峰。特別是,可使用一種以上質量標記物標記采用本發(fā)明方法從各樣品中分離得到的肽??墒褂谩扒绑w離子掃描”標記物和樣品特異性標記物的等摩爾混合物標記各樣品中的肽,其中,該“前體離子掃描”用于所有的樣品中。這樣,不同樣品中肽的水平變化將不會對前體離子掃描中的肽峰的鑒別產(chǎn)生不利的影響。
鑒別和選擇肽離子后,較佳是對它們進行CID處理。所得的CID質譜通常是非常復雜的,并且確定CID質譜中哪些峰對應于有意義的肽片段系列是由質譜法確定肽的序列中的另一問題。Shevchenko等人,Rapid Commun.Mass Spec.,11,1015-1024(1997)描述了另一種方法,該方法涉及用1∶1的16O/18O水中的胰蛋白酶處理蛋白質,以進行分析。水解反應產(chǎn)生兩組肽,第一組肽的末端羧基含有16O,第二組的末端羧基含有18O。因此,對于樣品中的每一條肽,應有相等強度的雙峰,該雙峰的距離是2道爾頓。這會被固有的肽同位素峰變得略微復雜,但可用于雙峰的CID質譜的自動掃描??赏ㄟ^兩個片段的差別確定雙峰間的質量差異,以鑒別其氨基酸。如果分離了N末端肽,那么這種方法可與本發(fā)明的方法一起應用。
權利要求
1.一組兩種或多種質量標記物,組中各質量標記物包含通過可斷裂的連接物連接于質量歸一化部分的質量指示部分,該質量指示部分具有抗碎裂性,其中,組中各標記物的聚集質量可以相同或不同,組中各標記物的質量指示部分的質量可相同或不同,其中,在組中具有共同質量的質量指示部分的標記物的任何組合中,各標記物具有與該組合中的所有其它標記物不同的聚集質量,并且,在組中具有共同的聚集質量的標記物的任何組合中,各標記物具有其質量不同于該組合中所有其它質量指示部分的質量的質量指示部分,這樣組中所有的質量標記物可通過質譜法得以相互區(qū)分。
2.如權利要求1所述的一組質量標記物,其特征在于,所述組中的各標記物含有具有共同質量的質量指示部分,并且組中各標記物具有唯一的聚集質量。
3.如權利要求1所述的一組質量標記物,其特征在于,所述組中各標記物含有具有獨特質量的質量指示部分,并且組中各標記物具有共同的聚集質量。
4.如權利要求3所述的一組質量標記物,其特征在于,所述組中的各質量指示部分具有共同的基本結構,組中各質量歸一化部分具有共同的基本結構,此結構可與所述質量指示部分的共同基本結構相同或不同,并且,組中各質量標記物包含一個或多個質量調(diào)節(jié)部分,該質量調(diào)節(jié)部分連接于所述質量指示部分和/或質量歸一化部分的基本結構上,或位于所述結構中,這樣,組中每一個質量指示部分包含不同數(shù)量的質量調(diào)節(jié)部分,且組中每一個質量標記物具有相同數(shù)量的質量調(diào)節(jié)部分。
5.如權利要求4所述的一組質量標記物,其特征在于,所述組中的各質量標記物具有下述結構M(A)y-L-X(A)z式中,M是質量歸一化部分,X是質量指示部分,A是質量調(diào)節(jié)部分,L是可斷裂的連接物,y和z是0或0以上的整數(shù),y+z是1或1以上的整數(shù)。
6.如權利要求4或5所述的一組質量標記物,其特征在于,所述質量調(diào)節(jié)部分選自(a)位于所述質量指示部分和/或質量歸一化部分的基本結構內(nèi)的同位素取代基;(b)連接于所述質量指示部分和/或質量歸一化部分的基本結構的取代基原子或基團。
7.如權利要求6所述的一組質量標記物,其特征在于,所述質量調(diào)節(jié)部分選自鹵原子取代基、甲基和2H或13C同位素取代基。
8.如權利要求7所述的一組質量標記物,其特征在于,所述質量調(diào)節(jié)部分是氟原子取代基。
9.如前述權利要求中任一項所述的一組質量標記物,其特征在于,將所述質量指示部分連接于所述質量歸一化部分的可斷裂連接物是可通過碰撞而斷裂的連接物。
10.如權利要求9所述的一組質量標記物,其特征在于,所述可斷裂的連接物包含酰胺鍵。
11.如前述權利要求中任一項所述的一組質量標記物,其特征在于,所述質量指示部分和/或質量歸一化部分包含抗斷裂基團。
12.如權利要求11所述的一組質量標記物,其特征在于,所述質量歸一化部分包含苯基。
13.如前述權利要求中任一項所述的一組質量標記物,其特征在于,所述質量指示部分包含預電離的基團。
14.如權利要求13所述的一組質量標記物,其特征在于,所述質量指示部分包含N-甲基吡啶基,或包含選自以下的基團-NH2、-NR2、-NR3+、-SR3+、-SO3-、-PO4-、-PO3-、-CO2- 和 式中,R是氫或取代的或未取代的脂族、芳族、環(huán)狀或雜環(huán)狀基團。
15.如權利要求5-14中任一項所述的一組質量標記物,其特征在于,所述組中各標記物具有下述結構 式中,R是氫或者是取代的或未取代的脂族、芳族、環(huán)狀的或雜環(huán)狀的基團;L是可斷裂的連接物;A是質量調(diào)節(jié)部分;每個p是相同的,并且是0或0以上的整數(shù);每個y′可以相同或不同,是0-4的整數(shù),任一標記物的所有y′的總和等于y;每個z′可以相同或不同,是0-4的整數(shù),任一標記物的所有z′的總和等于z;y+z是1或1以上的整數(shù)。
16.如權利要求15所述的一組質量標記物,其特征在于,所述R是H,L是酰胺鍵,p=0,A是氟原子。
17.質量標記物的陣列,它包含兩組或多組權利要求3-16中任一項所述的質量標記物,其特征在于,該陣列中任一組的每一種質量標記物的聚集質量與該陣列中其它每一組的每種質量標記物的聚集質量不同。
18.如權利要求17所述的質量標記物陣列,其特征在于,至少一組中的每種質量標記物包含具有共同質量的質量系列修飾基團,任一組的每種質量標記物中的該質量系列修飾基團的質量與該陣列中其它任一組的每種質量標記物中的質量系列修飾基團不同。
19.如權利要求18所述的質量標記物陣列,其特征在于,所述質量系列修飾基團連接于所述質量標記物,這樣,在解離質量標記物的可斷裂的連接物后,質量系列修飾基團與所述質量指示部分分離。
20.如權利要求18或19所述的質量標記物陣列,其特征在于,所述陣列中各組的質量系列修飾基團具有共同的基本結構,并且陣列中任一組的每種質量標記物具有與該組其它質量標記物相同數(shù)量的質量系列修飾基團,且具有與該陣列中其它每一組的質量標記物不同數(shù)量的質量系列修飾基團。
21.如權利要求20所述的質量標記物陣列,其特征在于,所述陣列中的每種質量標記物具有下述任一種結構(S)x-M(A)y-L-X(A)zM(A)y-(S)x-L-X(A)z其中,S是質量系列修飾基團;M是質量歸一化部分;X是質量標記部分;A是質量調(diào)節(jié)部分;L是可斷裂的連接物;x是0或0以上整數(shù);y和z是0或0以上整數(shù);y+z是1或1以上整數(shù)。
22.如權利要求18-21中任一項所述的質量標記物陣列,其特征在于,所述質量系列修飾基團包含芳基醚基團。
23.如權利要求21或22所述的質量標記物陣列,其特征在于,所述陣列中各質量標記物具有下述任一結構 式中,R是氫或者是取代的或未取代的脂族、芳族、環(huán)狀的或雜環(huán)狀的基團;每個p是相同的,并且是0或0以上的整數(shù);x是0或0以上的整數(shù),該陣列的任一組中的每種質量標記物的x相同,任一組中的x與該陣列中其它每組中的x不同;每個y′可以相同或不同,是0-4的整數(shù),任一標記物中所有y′的總和等于y;每個z′可以相同或不同,是0-4的整數(shù),任一標記物中的所有z′的總和等于z;y+z是1或1以上的整數(shù)。
24.如權利要求18或19所述的質量標記物陣列,其特征在于,所述陣列中每一組的質量系列修飾基團具有共同的基本結構,至少一組的質量標記物的所述質量系列修飾基團包含一個或多個質量調(diào)節(jié)部分,該質量調(diào)節(jié)部分連接于所述質量系列修飾基團的基本結構上,或位于該結構之中。
25.如權利要求24所述的質量標記物陣列,其特征在于,所述陣列中每一組的每種質量標記物具有相同數(shù)量的質量系列修飾基團,其中,任一組的各質量標記物中的質量系列修飾基團與該組其它每種標記物中的質量系列修飾基團具有相同數(shù)量的質量調(diào)節(jié)部分,其中,任一組的質量標記物中的質量系列修飾基團的質量調(diào)節(jié)部分的數(shù)量與該陣列中其它每一組的標記物中的質量系列修飾基團的不同。
26.如權利要求25所述的質量標記物陣列,其特征在于,所述陣列中的每一組包含具有下述任一結構的質量標記物S(A*)r-M(A)y-L-X(A)zM(A)y-S(A*)r-L-X(A)z式中,S是質量系列修飾基團;M是質量歸一化部分;X是質量指示部分;A是所述質量指示部分和質量歸一化部分的質量調(diào)節(jié)部分;A*可以與A相同或不同,為所述質量系列修飾基團的質量調(diào)節(jié)部分;L是可斷裂的連接物;r是0或0以上的整數(shù),陣列中有一組或多組陣列標記物的r至少為1;y和z是0或0以上的整數(shù),y+z是1或1以上整數(shù)。
27.如權利要求26所述的質量標記物陣列,其特征在于,所述陣列中每組包含具有下述任一結構的質量標記物 式中,R是氫或者是取代的或未取代的脂族、芳族、環(huán)狀的或雜環(huán)狀的基團;每個p是相同的,并且是0或0以上的整數(shù);x是0或0以上的整數(shù),陣列中所有的質量標記物的x都相同;每個y′可以相同或不同,是0-4的整數(shù);任一標記物所有的y′的總和等于y;每個z′可以相同或不同,是0-4的整數(shù),任一標記物所有的z′的總和等于z;y+z是1或1以上的整數(shù);每個r′可以相同或不同,任一標記物所有r′的總和等于r,r是0或0以上的整數(shù),并且對于該陣列中的一組或多組質量標記物,r至少為1。
28.如權利要求17-27中任一項所述的質量標記物陣列,其特征在于,所述任一組的質量標記物的質量與該陣列中其它每一組的質量標記物的質量相差4道爾頓或以上。
29.一組兩種或多種探針,其特征在于,組中各探針不同,它們連接于獨特的質量標記物或質量標記物的獨特組合,所述質量標記物來自權利要求1-28中任一項所述的質量標記物組或陣列。
30.含有兩組或多組探針的探針陣列,其特征在于,任一組中的各探針連接于獨特的質量標記物或質量標記物的獨特組合,所述質量標記物來自權利要求1-16中任一項所定義的質量標記物組,其中,任一組中的探針連接于相同的質量標記物組的質量標記物,且每組探針連接于來自獨特的質量標記物組的質量標記物,該組來自權利要求17-28中任一項所定義的質量標記物陣列。
31.如權利要求29或30所述的探針組或陣列,其特征在于,所述各探針連接于質量標記物的獨特組合,每種組合由該質量標記物組中每種質量標記物的存在與否得以區(qū)別,和/或由連接于該探針的各質量標記物的數(shù)量加以區(qū)別。
32.如權利要求29-31中任一項所述的探針組或陣列,其特征在于,所述各探針包含生物分子。
33.如權利要求32所述的探針組或陣列,其特征在于,所述生物分子選自DNA、RNA、寡核苷酸、核酸堿基、蛋白質和/或氨基酸。
34.一種分析方法,該方法包括,采用質譜法鑒別與分析物相關的質量標記物或質量標記物的組合,從而檢測分析物,其特征在于,所述質量標記物是權利要求1-28中任一項所定義的質量標記物組或陣列的質量標記物。
35.如權利要求34所述的方法,其特征在于,采用質譜法鑒別質量標記物或質量標記物的組合,從而同時檢測兩種或多種分析物。
36.如權利要求34或35所述的方法,其特征在于,由來自質量標記物組或陣列的質量標記物的獨特組合鑒別每種分析物,各種組合由所述標記物組或陣列中的每種標記物的存在與否而得以區(qū)別,和/或由各質量標記物的數(shù)量而加以區(qū)別。
37.如權利要求34-36中任一項所述的鑒別兩種或多種分析物的方法,其特征在于,在采用質譜法檢測質量標記物之前,先根據(jù)所述分析物的質量將它們分離。
38.如權利要求37所述的方法,其特征在于,采用色譜法或電泳進行分離。
39.如權利要求34-38中任一項所述的方法,其特征在于,用于檢測質量標記物的質譜儀包括一個或多個質量分析儀,這些質量分析儀能使具有特定質量或質量范圍的離子通過,以進行檢測,和/或能使離子分解。
40.如權利要求39所述的方法,其特征在于,使用質量分析儀選擇對一種或多種已知的質量標記物特異的具有特定質量或質量范圍的離子,使所選擇的離子分解,然后檢測分解產(chǎn)物,以鑒別指示所選擇的質量標記物的離子模型。
41.如權利要求39或40所述的方法,其特征在于,所述質譜儀包括三個四極質量分析儀。
42.如權利要求40或41所述的方法,其特征在于,所述第一質量分析儀用于選擇具有特定質量或質量范圍的離子,第二質量分析儀用于分解所選擇的離子,第三個質量分析儀用于檢測所產(chǎn)生的離子。
43.如權利要求34-42中任一項所述的方法,其特征在于,所述方法包括(a)使一種或多種分析物與一組探針或者探針陣列接觸,其中,所述探針是權利要求29-33中任一項所定義的探針;(b)通過檢測與分析物相關的探針鑒別分析物。
44.如權利要求43所述的方法,其特征在于,在采用質譜法檢測所述質量標記物前,先將質量標記物從所述探針上解離下來。
45.如權利要求43或44所述的方法,其特征在于,所述方法包括使一種或多種核酸與一組雜交探針接觸。
46.如權利要求45所述的方法,其特征在于,所述一組雜交探針是具有256個以內(nèi)的四聚體的組,組中各探針具有不同的核酸堿基的組合。
47.一種二維質譜分析法,其特征在于,該方法包括(a)提供一種或多種分析物,各分析物用質量標記物或質量標記物的組合標記,其中,這些質量標記物來自權利要求1-28中任一項所定義的質量標記物組或陣列;(b)使所述質量標記物與所述分析物解離;(c)檢測質量標記物;(d)在質譜儀中分解質量標記物,以從質量歸一化部分釋放出質量指示部分;(e)檢測質量指示部分;(f)在所述質量標記物的質譜和所述質量指示部分的質譜的基礎上鑒別分析物。
48.如權利要求47所述的方法,其特征在于,在所述(c)步驟中,選擇具有選定的質量或質量范圍的質量標記物用于檢測,和/或在(e)步驟中,選擇具有特定質量或特定的質量范圍的質量指示部分用于檢測。
49.一種分析的方法,其特征在于,該方法包括(a)在分析物的第一特性的基礎上,對標記的分析物的混合物進行第一分離處理;(b)在分析物的第二特性的基礎上,對所得的分離分析物進行第二分離處理;(c)通過檢測分析物的標記物,從而檢測該分析物;其中,這些分析物用來自權利要求1-28中任一項所定義的質量標記物組或陣列標記的質量標記物標記。
50.如權利要求49所述的方法,其特征在于,在(a)步驟和/或(b)步驟中,根據(jù)所述分析物的長度或質量將它們分離。
51.如權利要求49或50所述的方法,其特征在于,在(a)步驟和/或(b)步驟中,根據(jù)所述分析物的等電點將它們分離。
52.如權利要求49-51中任一項所述的方法,其特征在于,所述分析物包括蛋白質、多肽、肽、氨基酸或核酸,或者它們的片段。
53.如權利要求49-52中任一項所述的雙向凝膠電泳法。
54.一種表征核酸的方法,其特征在于,該方法包括(a)提供一組核酸片段,各片段具有可斷裂地連接于其上、鑒別該片段的特征的質量標記物,這些質量標記物來自權利要求1-28中任一項所定義的質量標記物組或陣列的質量標記物;(b)在它們的長度的基礎上分離這些片段;(c)解離各片段,使其釋放出其質量標記物;(d)采用質譜法測定各質量標記物,以描述各片段的特征與片段長度的關系。
55.如權利要求54所述的方法,將該方法用于表征cDNA,其特征在于,它包括(a)使含有一組含一種或多種cDNA或其片段的樣品暴露于斷裂劑中,該斷裂劑識別預定的序列,并在距離預定序列已知偏移位置的基準位點上進行切割,從而產(chǎn)生一組末端片段,所述預定序列接近各cDNA或其片段的一端;(b)將銜接子寡核苷酸連接于各基準位點上,該寡核苷酸含有樣品斷裂劑的識別位點;(c)將這組末端片段暴露于樣品斷裂劑中,該斷裂劑與上述識別位點結合,并在距離該識別位點已知偏移位置的樣品位點上進行切割,從而在各個末端片段中產(chǎn)生來自未知序列和預定長度達6個堿基的粘性末端序列;(d)根據(jù)序列的長度將該組末端片段分成亞組;(e)如下測定各粘性末端序列(i)用標記的雜交探針陣列探測,該陣列含有所有可能的預定長度的堿基序列;(ii)連接這些雜交到粘性末端序列上的探針;(iii)通過鑒別標記物,較佳是通過定量標記物,測定哪些探針被連接,其中,這些標記物是來自權利要求1-28中任一項所述的組或陣列的質量標記物。
56.如權利要求55所述的方法,其特征在于,采用毛細管電泳、HPLC或凝膠電泳分離末端片段組。
57.一種表征核酸的方法,其特征在于,該方法包括在至少一種標記的末端堿基的存在下,從一個或多個核酸模板中產(chǎn)生Sanger梯核酸片段,然后鑒別該片段的長度及其末端堿基,其中該標記物與該末端堿基是相關的,并且是來自權利要求1-28中任一項所述的組或陣列中的質量標記物。
58.如權利要求57所述的方法,其特征在于,所述所有四種末端堿基出現(xiàn)在相同的反應區(qū)中。
59.如權利要求59或60所述的方法,其特征在于,該方法包括從出現(xiàn)在相同反應區(qū)中的大量核酸模板中產(chǎn)生Sanger梯核酸片段,然后鑒別所產(chǎn)生的各核酸片段的長度、產(chǎn)生該片段的模板的種類以及該片段的末端堿基,其中,在產(chǎn)生這些片段之前,先使標記的引物核苷酸或寡核苷酸雜交到各模板上,各引物上的標記物對該引物所雜交的模板特異,從而允許鑒別該模板。
60.如權利要求59所述的方法,其特征在于,鑒別模板的標記物是來自權利要求1-28中任一項所述的組或陣列的質量標記物。
61.一種核酸測序的方法,其特征在于,該方法包括(a)獲得靶核酸組,該組包含一條或多條將要測序的單鏈DNA,每條DNA以唯一的量存在,并具有一個引物,為核酸提供雙鏈部分用于連接;(b)使核酸組與雜交探針陣列接觸,各探針包含可斷裂地連接于預定長度的已知堿基序列上的標記物,該陣列包含該預定長度的所有可能的堿基序列,這些堿基序列不能相互連接,其中,在連接酶的存在下,在使具有與位于各核酸的雙鏈部分附近的單鏈核酸互補的堿基序列的探針與該雙鏈部分連接的條件下,進行接觸,從而形成延伸的雙鏈部分,該部分不能與更多的探針連接;(c)除去所有未連接的探針;接著進行如下步驟(d)解離連接的探針,釋放出各標記物;(e)記錄各標記物的數(shù)量;(f)激活延伸的雙鏈部分,使能夠在其上進行連接;其中(g)步驟(b)和(f)作為一輪循環(huán),重復進行足夠多次,以通過測定釋放的各標記物的序列來測定單鏈核酸或各單鏈核酸的序列;其中,雜交探針的標記物是來自權利要求1-28中任一項所述的組或陣列中的各標記物。
62.如權利要求61所述的方法,其特征在于,所述雜交探針是一組256個四聚體,組中各探針具有不同組合的核酸堿基。
63.一種表征含有肽、多肽和/或蛋白質的樣品的方法,其特征在于,該方法包括(a)提供含有肽、多肽和/或蛋白質的樣品,每種肽、多肽和/或蛋白質具有可斷裂地連接于其上的質量標記物或質量標記物的組合,所述質量標記物來自權利要求1-28中任一項所述的組或陣列的質量標記物,其中,各肽、多肽和/或蛋白質與其標記物或標記物組合相關;(b)分析這些標記的肽、多肽和/或蛋白質,以檢測所述標記物。
64.如權利要求63所述的方法,其特征在于,通過斷裂劑對含有多肽和/或蛋白質的樣品的作用形成肽,由此提供所述樣品。
65.如權利要求63或64所述的方法,其特征在于,在進行分析前,先采用色譜法或電泳分離所述標記的肽、多肽和/或蛋白質。
66.如權利要求63-65中任一項所述的方法,其特征在于,提供多份樣品。
67.如權利要求66所述的方法,其特征在于,在進行分析前,先將所述多份樣品集中。
68.如權利要求63-67中任一項所述的方法,其特征在于,所述樣品中的一種或多種肽、多肽和/或蛋白質經(jīng)過了翻譯后修飾,含有碳水化合物,并且,該方法包括,通過碳水化合物的羰基連接生物素,使修飾的肽、多肽或蛋白質進行生物素化。
69.如權利要求63-67中任一項所述的方法,其特征在于,所述樣品中的一種或多種肽、多肽和/或蛋白質經(jīng)由酪氨酸磷酸化作用而被翻譯后修飾,且該方法包括,采用親和層析法,使用抗磷酸酪氨酸抗體分離這些修飾的肽、多肽和/或蛋白質。
70.如權利要求63-69中任一項所述的方法,其特征在于,所述方法包括,從各肽、多肽和/或蛋白質中分離出單一的肽片段。
71.如權利要求70所述的方法,其特征在于,所述各分離的片段是末端片段。
72.如權利要求71所述的方法,其特征在于,所述方法包括(a)用斷裂劑處理含有一組含許多多肽的樣品,已知該斷裂劑識別多肽鏈中的特殊氨基酸殘基或序列,以在切割位點進行解離,從而將該組多肽解離,產(chǎn)生肽片段;(b)從其所片段化的樣品中分離出一組肽片段,這些片段具有作為參考末端的多肽的N末端或C末端,每條肽在另一端在接近該參考末端處具有切割位點;(c)在分離這些肽片段之前或之后,用來自權利要求1-28中任一項所述的質量標記物組或陣列的質量標記物或質量標記物的組合標記多肽的每一個參考末端,其中,各參考末端與它的標記物或標記物的組合相關;(d)采用質譜法測定一條或多條分離的片段的特征序列,所述特征序列是從切割位點開始有預定數(shù)量的氨基酸殘基的序列;其中,特征序列表征了各多肽。
73.如權利要求71所述的方法,其特征在于,所述方法包括(a)使含有一條或多條多肽的樣品與第一斷裂劑接觸,產(chǎn)生多肽片段;(b)分離出一條或多條多肽片段,各片段含有片段化樣品的多肽的N末端或C末端;(c)在分離多肽片段之前或之后,用來自權利要求1-28中任一項所述的質量標記物組或陣列的質量標記物或質量標記物的組合標記多肽的每一個末端,其中,各末端與它的標記物或標記物的組合相關;(d)采用質譜法鑒別分離的片段;(e)使用第二種斷裂劑,對該樣品重復上述步驟(a)-(d),所述第二種斷裂劑在與第一斷裂劑作用位點不同的位點上解離;(f)由步驟(d)和(e)中鑒別得到的片段表征上述樣品中的一條或多條多肽。
74.權利要求1-28中任一項所述的標記物組或陣列中的質量標記物在分析方法中的應用。
75.如權利要求74所述的應用,其特征在于,所述應用是在雙向電泳分析中。
76.如權利要求74所述的應用,其特征在于,所述應用是在二維質譜分析中。
77.如權利要求74-76中任一項所述的應用,其特征在于,所述應用是在對一個或多個核酸的測序方法中。
78.如權利要求74-76中任一項所述的應用,其特征在于,所述應用是在基因表達描述法中。
79.如權利要求74-76中任一項所述的應用,其特征在于,所述應用是在蛋白質表達描述法中。
80.如權利要求74-76中任一項所述的應用,其特征在于,所述應用是在核酸分類的方法中。
全文摘要
提供了一組兩種或多種質量標記物,組中各質量標記物包含通過可斷裂的連接物連接于質量歸一化部分的質量指示部分,該質量指示部分具有抗碎裂性,其中,組中各標記物的聚集質量可以相同或不同,組中各標記物的質量指示部分的質量可相同或不同,其中,在組中具有共同質量的質量指示部分的標記物的任何組合中,各標記物具有與該組合中的所有其它標記物不同的聚集質量,并且,在組中具有共同的聚集質量的標記物的任何組合中,各標記物具有其質量不同于該組合中所有其它質量指示部分的質量的質量指示部分,這樣組中所有的質量標記物可由質譜法得以相互區(qū)分。
文檔編號C07B61/00GK1427953SQ0180904
公開日2003年7月2日 申請日期2001年3月14日 優(yōu)先權日2000年3月14日
發(fā)明者G·施密斯, A·H·托馬斯, R·A·W·約翰斯通 申請人:X齊里昂有限兩合公司