本申請是以下申請的分案申請:申請日,2012年07月27日;申請?zhí)枺?01280046897.0(pct/gb2012/051819);發(fā)明名稱,“用于檢測核苷酸修飾的方法”。本發(fā)明涉及修飾的胞嘧啶殘基的檢測,特別地,涉及包含修飾的胞嘧啶殘基的核苷酸的測序。5-甲基胞嘧啶(5mc)是充分研究的、在基因沉默和基因組穩(wěn)定性中扮演著重要角色的表觀遺傳dna標(biāo)記,并發(fā)現(xiàn)其富含于cpg二核苷酸中(1)。在后生動物中,5mc可通過10-11轉(zhuǎn)位(tet)家族的酶氧化成5-羥甲基胞嘧啶(5hmc)(2,3)。5hmc的整體水平大概比5mc的整體水平低10倍,并在組織之間變化(4)。相對高數(shù)量的5hmc(~所有胞嘧啶的0.4%)存在于胚胎干(es)細(xì)胞中,其中5hmc被認(rèn)為在建立和/或維護(hù)多能性中發(fā)揮作用(2,3,5-9)。5hmc已被提議在活躍的dna脫甲基中作為中間體,例如通過脫氨基或經(jīng)由進(jìn)一步的利用tet酶將5hmc氧化為5-甲酰基胞嘧啶(5fc)和5-羧基胞嘧啶(5cc),隨后是涉及胸苷嘧啶-dna糖基酶(tdg)的堿基切除修復(fù)或在復(fù)制中未能保持標(biāo)記(10)。然而,5hmc本身也可構(gòu)成表觀遺傳標(biāo)記。在總基因組dna中通過包括薄層色譜法和串聯(lián)液相色譜-質(zhì)譜法的分析方法檢測和定量5hmc的水平是可能的(2,11,12)。因此,映射5hmc的基因組位置迄今為止通過富集法實現(xiàn),該方法采用化學(xué)法或抗體用于dna碎片的5hmc特異性沉淀,然后對dna碎片進(jìn)行測序(6-8、13-15)。這些拖下(pull-down)方法具有相對較差的分辨率(10s-100s的核苷酸),并且只給出相對的定量信息,這在富集中有可能受到分配偏置??闪炕?mc的單核苷酸序列已使用重亞硫酸鹽測序(bs-seq)完成,所述重亞硫酸鹽測序利用重亞硫酸鹽介導(dǎo)的胞嘧啶脫氨基為尿嘧啶,這樣相應(yīng)的5mc的轉(zhuǎn)化是較慢的(16)。但是,人們已經(jīng)認(rèn)識到,5mc和5hmc在重亞硫酸鹽反應(yīng)中脫氨基都是很慢的,因此這兩個堿基不能夠被區(qū)別(17,18)。兩個相對新的和簡潔的單分子方法在以單核苷酸的分辨率檢測5mc和5hmc中顯示出希望。單分子實時測序(smrt)已在基因組dna中被示出以檢測衍生的5hmc(19)。然而,包含5hmc的dna碎片的富集是必需的,它將導(dǎo)致定量信息的損失(19)。5mc可通過smrt被檢測到,盡管具有較低的精確度(19)。此外,smrt具有相對高的測序錯誤比率(20),修飾的峰值呼叫(calling)是不精確的(19),并且所述平臺還不能測序整個基因組。蛋白質(zhì)和固態(tài)納米孔可以溶解5hmc中的5mc,并且,利用進(jìn)一步的開發(fā),有可能測序未擴(kuò)增的dna分子(21,22)。本發(fā)明人已設(shè)計了允許修飾的胞嘧啶殘基(如5-甲基胞嘧啶(5mc)、5-羥甲基胞嘧啶(5hmc)和5-甲?;奏?5fc))以單核苷酸的分辨率區(qū)別于胞嘧啶(c)的方法。這些方法適用于所有的測序平臺,并且例如在基因組dna和/或rna的分析中可能是有用的。本發(fā)明的一方面提供了一種在樣品核苷酸序列中識別修飾的胞嘧啶殘基的方法,包括:(i)提供包括樣品核苷酸序列的多核苷酸群體,(ii)氧化或還原所述群體的第一部分,(iii)用重亞硫酸鹽處理氧化或還原的所述群體的第一部分和所述群體的第二部分,(iv)在步驟ii)和iii)后,測序所述群體的第一和第二部分中的多核苷酸,以分別生成第一和第二核苷酸序列,以及;(v)識別對應(yīng)于樣品核苷酸序列中的胞嘧啶殘基的第一和第二核苷酸序列中的殘基。在第一和第二核苷酸序列中識別對應(yīng)于樣品核苷酸序列中的胞嘧啶殘基的殘基,表明胞嘧啶殘基的修飾。例如,胞嘧啶殘基可能存在于樣品核苷酸序列中的一個或多個位置。在第一和第二核苷酸序列中的這些一個或多個位置上的殘基可以被識別。在樣品核苷酸序列的位置上修飾的胞嘧啶可從第一和第二核苷酸序列中分別在那位置上識別的殘基的組合被識別(如c和c、u和u、c和u、或u和c)。通過不同組合表明胞嘧啶的修飾,如表1所示。修飾的胞嘧啶殘基可能包含在5位的修飾。適當(dāng)修飾的胞嘧啶包括5-取代的胞嘧啶。在胞嘧啶5位可被取代的基團(tuán)包括:甲基(m);羥甲基(hm)或甲?;?f)基團(tuán)。在本文中描述的方法可用于識別和/或區(qū)別樣品核苷酸序列中的胞嘧啶(c)、5-甲基胞嘧啶(5mc)、5-羥甲基胞嘧啶(5hmc)和5-甲?;奏?5fc)。例如,本文中描述的方法可用于將由胞嘧啶(c)、5-甲基胞嘧啶(5mc)、5-羥甲基胞嘧啶(5hmc)和5-甲?;奏?5fc)組成的組中的一個殘基區(qū)別于組中的其它殘基。優(yōu)選的,修飾的胞嘧啶殘基,如5-羥甲基胞嘧啶,在步驟ii)的氧化或還原之前,在所述群體的第一部分中并未標(biāo)記,例如并未標(biāo)記有取代基,如葡萄糖。在本發(fā)明的一些實施例中,所述群體中的多核苷酸的第一部分可以被氧化。例如,多核苷酸的第一部分中5-羥甲基胞嘧啶殘基通過氧化可以被轉(zhuǎn)化為5-甲酰基胞嘧啶(5fc),之后多核苷酸的第一部分用重亞硫酸鹽處理。在樣品核苷酸序列中識別修飾的胞嘧啶殘基的方法可以包括:(i)提供包括樣品核苷酸序列的多核苷酸群體,(ii)氧化所述群體的第一部分,(iii)用重亞硫酸鹽處理氧化的所述群體的第一部分和所述群體的第二部分,(iv)在步驟ii)和iii)后,測序所述群體的第一和第二部分中的多核苷酸,以分別生成第一和第二核苷酸序列,以及;(v)識別對應(yīng)于樣品核苷酸序列中的胞嘧啶殘基的第一和第二核苷酸序列中的殘基。在第一和第二核苷酸序列中的一個或兩個位置上識別出的殘基為第一和第二核苷酸序列中的一個或兩個中的胞嘧啶,表明樣品核苷酸序列中胞嘧啶殘基為5-甲基胞嘧啶或5-羥甲基胞嘧啶。在樣品核苷酸序列中5-羥甲基胞嘧啶(5hmc)可被識別。第一核苷酸序列中的位置上的對應(yīng)于樣品核苷酸序列中的胞嘧啶的尿嘧啶殘基和第二核苷酸序列中相同位置上的胞嘧啶,表明樣品核苷酸序列中的胞嘧啶殘基為5-羥甲基胞嘧啶(5hmc)。例如,在樣品核苷酸序列中識別5-羥甲基胞嘧啶(5hmc)殘基或在樣品核苷酸序列中將5-羥甲基胞嘧啶(5hmc)區(qū)別于胞嘧啶(c)、5-甲基胞嘧啶和5-甲?;奏?5fc)的方法可包括:(i)提供包括樣品核苷酸序列的多核苷酸群體,(ii)氧化所述群體的第一部分,(iii)用重亞硫酸鹽處理氧化的所述群體的第一部分和所述群體的第二部分,(iv)在步驟ii)和iii)后,測序所述群體的第一和第二部分中的多核苷酸,以分別生成第一和第二核苷酸序列,以及;(v)識別對應(yīng)于樣品核苷酸序列中的胞嘧啶殘基的第一和第二核苷酸序列中的殘基;其中,在第一核苷酸序列中存在尿嘧啶殘基和在第二核苷酸序列中存在胞嘧啶,表明在樣品核苷酸序列中的胞嘧啶殘基為5-羥甲基胞嘧啶。5-甲基胞嘧啶(5mc)在樣品核苷酸序列中可被識別。在第一和第二兩個核苷酸序列中位置上的對應(yīng)于樣品核苷酸序列中的胞嘧啶殘基的胞嘧啶,表明樣品核苷酸序列中的胞嘧啶殘基為5-甲基胞嘧啶(5mc)。例如,在樣品核苷酸序列中識別5-甲基胞嘧啶或在樣品核苷酸序列中將5-甲基胞嘧啶區(qū)別于胞嘧啶(c)、5-羥甲基胞嘧啶(5hmc)和5-甲?;奏?5fc)的方法可包括:(i)提供包括樣品核苷酸序列的多核苷酸群體,(ii)氧化所述群體的第一部分,(iii)用重亞硫酸鹽處理氧化的所述群體的第一部分和所述群體的第二部分,(iv)在步驟ii)和iii)后,測序所述群體的第一和第二部分中的多核苷酸,以分別生成第一和第二核苷酸序列,以及;(v)識別對應(yīng)于樣品核苷酸序列中的胞嘧啶殘基的第一和第二核苷酸序列中的殘基,其中,在第一和第二兩個核苷酸序列中存在胞嘧啶,表明樣品核苷酸序列中的胞嘧啶殘基為5-甲基胞嘧啶(5mc)。在第一和第二兩個核苷酸序列兩者中的位置上的對應(yīng)于樣品核苷酸序列中的胞嘧啶的尿嘧啶殘基,表明在樣品核苷酸序列中的胞嘧啶殘基不是5-甲基胞嘧啶,也不是5-羥甲基胞嘧啶,即,胞嘧啶殘基為未修飾的胞嘧啶或5-甲?;奏?。表1示出了在樣品核苷酸序列中的位置上的胞嘧啶修飾的總結(jié),所述胞嘧啶的修飾通過在第一和第二核苷酸序列中的該位置上的胞嘧啶和尿嘧啶的具體組合表明。所述多核苷酸群體的第一和第二部分可用重亞硫酸鹽處理和/或同時的或相繼的測序。在一些實施例中,在步驟ii)中第一部分被氧化,可以不用處理第二部分來識別或區(qū)別樣品核苷酸序列中修飾的胞嘧啶殘基。例如,表1示出,氧化及用重亞硫酸鹽處理所述多核苷酸群體的第一部分足以在樣品核苷酸序列中識別5-甲基胞嘧啶。在樣品核苷酸序列中識別5-甲基胞嘧啶或?qū)?-甲基胞嘧啶區(qū)別于胞嘧啶(c)、5-羥甲基胞嘧啶(5hmc)和5-甲?;奏?5fc)的方法可包括:(i)提供包括樣品核苷酸序列的多核苷酸群體,(ii)氧化所述群體,(iii)用重亞硫酸鹽處理氧化的所述群體,(iv)在步驟ii)和iii)后,測序所述群體的多核苷酸,以生成處理的核苷酸序列,以及;(v)識別處理的核苷酸序列中的、對應(yīng)于樣品核苷酸序列中的胞嘧啶殘基的殘基,其中,在處理的核苷酸序列中存在胞嘧啶表明樣品核苷酸序列中的胞嘧啶殘基為5-甲基胞嘧啶(5mc)。在本發(fā)明的一些實施例中,所述群體的多核苷酸的第一部分可在步驟ii)中被還原。在樣品核苷酸序列中識別修飾的胞嘧啶殘基的方法可包括:(i)提供包括樣品核苷酸序列的多核苷酸群體,(ii)還原所述群體的第一部分,(iii)用重亞硫酸鹽處理還原的所述群體的第一部分和所述群體的第二部分,(iv)在步驟ii)和iii)后,測序所述群體的第一和第二部分的多核苷酸,以分別生成第一和第二核苷酸序列,以及;(v)識別對應(yīng)于樣品核苷酸序列中的胞嘧啶殘基的第一和第二核苷酸序列中的殘基。該方法用于在樣品核苷酸序列中識別和/或區(qū)別5-甲?;奏?5fc)。在實施例中,第一部分被還原,第一核苷酸序列中的位置上的對應(yīng)于樣品核苷酸序列中的胞嘧啶的胞嘧啶和第二核苷酸序列中這個位置上的尿嘧啶殘基表明樣品核苷酸序列中的胞嘧啶殘基為5-甲?;奏?;在第一和第二核苷酸序列中位置上的對應(yīng)于樣品核苷酸序列中的胞嘧啶殘基的尿嘧啶表明樣品核苷酸序列中的胞嘧啶殘基為未修飾的胞嘧啶;并且在第一和第二兩個核苷酸序列兩者中的位置上的對應(yīng)于樣品核苷酸序列中的胞嘧啶殘基的胞嘧啶表明樣品核苷酸序列中的胞嘧啶殘基為5-甲基胞嘧啶(5mc)或5-羥甲基胞嘧啶(5hmc)。表1示出了在樣品核苷酸序列中位置上的胞嘧啶修飾的總結(jié),所述胞嘧啶修飾通過在第一和第二核苷酸序列中位置上的胞嘧啶和尿嘧啶的具體組合表明。在一些實施例中,本發(fā)明的方法可包括測序已被氧化或用重亞硫酸鹽處理的多核苷酸的第一部分;已用重亞硫酸鹽處理的多核苷酸的第二部分;已被還原或用重亞硫酸鹽處理的所述群體的多核苷酸的第三部分。例如,方法可包括:(i)提供包括樣品核苷酸序列的多核苷酸群體,(ii)提供所述群體的第一、第二和第三部分,(iii)氧化所述群體的第一部分,(iv)還原所述群體的第三部分,(v)用重亞硫酸鹽處理所述群體的第一、第二和第三部分,(vi)在步驟iii)、iv)和v)后,測序所述群體的第一、第二和第三部分中的多核苷酸,以分別生成第一、第二和第三核苷酸序列,以及;(vii)識別對應(yīng)于樣品核苷酸序列中的胞嘧啶殘基的第一、第二和第三核苷酸序列中的殘基。例如,該方法可用于從胞嘧啶和/或其它修飾的胞嘧啶中識別和/或區(qū)別樣品核苷酸序列中的5-甲?;奏?5fc)。第一和第二核苷酸序列中位置上的、對應(yīng)于樣品核苷酸序列中的胞嘧啶殘基的尿嘧啶和第三核苷酸序列中這個位置上的胞嘧啶表明樣品核苷酸序列中的胞嘧啶殘基為5-甲?;奏?。在第一、第二和第三核苷酸序列中位置上的、對應(yīng)于樣品核苷酸序列中的胞嘧啶殘基的胞嘧啶表明樣品核苷酸序列中的胞嘧啶殘基為5-甲基胞嘧啶(5mc)。在第二和第三核苷酸序列中位置上的、對應(yīng)于樣品核苷酸序列中的胞嘧啶的胞嘧啶和第一核苷酸序列中這個位置上的尿嘧啶殘基表明樣品核苷酸序列中的胞嘧啶殘基為5-羥甲基胞嘧啶(5hmc)。在第一、第二和第三核苷酸序列中位置上的、對應(yīng)于樣品核苷酸序列中的胞嘧啶殘基的尿嘧啶表明樣品核苷酸序列中的胞嘧啶殘基為未修飾的胞嘧啶。表1示出了,在樣品核苷酸序列中位置上的胞嘧啶修飾的總結(jié),所述胞嘧啶修飾通過在第一、第二和第三核苷酸序列中位置上的胞嘧啶和尿嘧啶的具體組合表明。樣品核苷酸序列可能已被認(rèn)知或它可能已被確定。樣品核苷酸序列為所述群體中未處理的多核苷酸的序列,即尚未被氧化、還原或用重亞硫酸鹽處理的多核苷酸。在樣品核苷酸序列中,修飾的胞嘧啶不能區(qū)別于胞嘧啶。5-甲基胞嘧啶、5-甲酰基胞嘧啶和5-羥甲基胞嘧啶的修飾的胞嘧啶均被表明是或確定為樣品核苷酸序列中的胞嘧啶殘基。例如,本文中描述的任意一種方法可進(jìn)一步包括:提供包括樣品核苷酸序列的多核苷酸群體的第四部分;以及測序第四部分中的所述多核苷酸以生成樣品核苷酸序列。第四部分中多核苷酸的序列可通過任意適合的測序技術(shù)確定。在樣品核苷酸序列中一個或多個胞嘧啶殘基的位置可被確定。這可通過標(biāo)準(zhǔn)序列分析完成。由于修飾的胞嘧啶不區(qū)別于胞嘧啶,那么在樣品核苷酸序列中的胞嘧啶殘基可以是胞嘧啶、5-甲基胞嘧啶、5-甲?;奏せ?-羥甲基胞嘧啶。第一和第二核苷酸序列以及可選的第三核苷酸序列可與樣品核苷酸序列相比較。例如,在第一和第二序列及可選的第三核苷酸序列中的位置上的、對應(yīng)于樣品核苷酸序列中一個或多個胞嘧啶殘基的殘基可被識別。樣品核苷酸序列中胞嘧啶殘基的修飾可由第一和第二核苷酸序列以及可選的第三核苷酸序列中對應(yīng)位置上的核苷酸的識別來確定。所述群體中多核苷酸均包含相同的樣品核苷酸序列,即,樣品核苷酸序列與所述群體中所有的多核苷酸相同。然后,如本文所描述的,可確定對樣品核苷酸序列中胞嘧啶殘基的不同處理效果。樣品核苷酸序列可以是基因組序列。例如,所述序列可包括基因序列的全部的或部分,包括外顯子、內(nèi)含子或上游或下游調(diào)控基因的基因序列,或所述序列可包括與基因無關(guān)的基因組序列。在一些實施例中,所述樣品核苷酸序列可包括一個或多個cpg島。適合的多核苷酸包括dna,優(yōu)選為基因組dna,和/或rna,如基因組rna(如哺乳動物、植物或病毒的基因組rna)、mrna、trna、rrna和非編碼rna。包括樣品核苷酸序列的多核苷酸可以從細(xì)胞樣品中得到或分離,所述細(xì)胞樣品例如為哺乳動物細(xì)胞,優(yōu)選為人類細(xì)胞。適合的樣品包括分離的細(xì)胞和組織樣品,如活檢。已在包括胚胎干細(xì)胞(escs)和神經(jīng)細(xì)胞的一系列細(xì)胞類型中檢測到包括5hmc和5fc的修飾的胞嘧啶殘基(2,3,11,37,38)。適合的細(xì)胞包括體細(xì)胞和生殖系細(xì)胞。適合的細(xì)胞可處于培養(yǎng)的任意階段,包括徹底或部分分化的細(xì)胞或未分化的細(xì)胞或多能細(xì)胞,包括干細(xì)胞,如成熟或成體干細(xì)胞、胎兒干細(xì)胞或胚胎干細(xì)胞。適合的細(xì)胞還可包括誘導(dǎo)多能干細(xì)胞(ipsc),所述誘導(dǎo)多能干細(xì)胞根據(jù)標(biāo)準(zhǔn)技術(shù)可來源于任意類型的體細(xì)胞。例如,包括樣品核苷酸序列的多核苷酸可從神經(jīng)細(xì)胞中得到或分離,所述神經(jīng)細(xì)胞包括神經(jīng)元和神經(jīng)膠質(zhì)細(xì)胞、收縮肌肉細(xì)胞、平滑肌細(xì)胞、肝細(xì)胞、激素合成細(xì)胞、皮脂細(xì)胞、胰島細(xì)胞、腎上腺皮質(zhì)細(xì)胞、纖維母細(xì)胞、角質(zhì)細(xì)胞、內(nèi)皮和尿路上皮細(xì)胞、骨細(xì)胞和軟骨細(xì)胞。適合的細(xì)胞包括疾病相關(guān)的細(xì)胞,例如癌細(xì)胞,如癌、肉瘤、淋巴瘤、胚細(xì)胞瘤或生殖系腫瘤細(xì)胞。適合的細(xì)胞包括具有遺傳性疾病基因型的細(xì)胞,如亨丁頓舞蹈癥、囊胞性纖維癥、鐮狀細(xì)胞疾病、苯丙酮酸尿、唐氏綜合癥或馬方綜合征。從細(xì)胞樣品中提取和分離基因組dna和rna的方法是本領(lǐng)域公知的。例如,基因組dna和rna可使用任意適當(dāng)?shù)姆蛛x技術(shù)分離,如苯酚/氯仿提取和酒精沉淀法、氯化銫梯度離心、固相陰離子交換色譜法和以硅膠為基礎(chǔ)的技術(shù)。在一些實施例中,在分離后,從細(xì)胞中分離的全部基因組dna和rna可直接被用作如本文所描述的多核苷酸的群體。在其它實施例中,分離的基因組dna和/或rna或許要經(jīng)受進(jìn)一步的準(zhǔn)備步驟。基因組dna和/或rna可以是碎片的,例如通過超聲波法、剪切或核酸內(nèi)切酶消化以產(chǎn)生基因組dna碎片。可如本文中所描述的,使用基因組dna和/或rna的碎片。適合的基因組dna和/或rna的碎片可基于尺寸或其它標(biāo)準(zhǔn)。在一些實施例中,可如本文中所描述的,使用富含cpg島(cgi)的基因組dna和/或rna的碎片?;蚪Mdna和/或rna可以是變性的,例如通過加熱或用變性劑處理。適用于基因組dna和rna變性的方法在本領(lǐng)域中是公知的。在一些實施例中,在氧化或還原和用重亞硫酸鹽處理、或單獨用重亞硫酸鹽處理之前,基因組dna和/或rna可被修改用于測序。修改的本質(zhì)取決于所采用的測序方法。例如,對于一些測序方法,在分裂之后,引物可被結(jié)合到基因組dna和/或rna碎片的自由端。適合的引物可包含5mc,以防止引物序列在如本文所描述的氧化或還原和用重亞硫酸鹽處理、或單獨用重亞硫酸鹽處理的過程中改變。在其它實施例中,在如本文所描述的氧化、還原和/或用重亞硫酸鹽處理之后,基因組dna和/或rna可被修改用于測序。在分餾、變性、修改和/或其它準(zhǔn)備步驟之后,基因組dna和/或rna可通過任意適合的技術(shù)純化。在準(zhǔn)備之后,多核苷酸群體可被提供為如本文所描述的適于進(jìn)一步處理的形式。例如,多核苷酸群體在如本文所描述的處理之前可存在于沒有緩沖液的水溶液中。如本文所描述使用的多核苷酸可以是單鏈或雙鏈。多核苷酸群體可以被分為兩個、三個、四個或多個單獨的部分,它們中的每一個包含有包括樣品核苷酸序列的多核苷酸。這些部分可如本文所描述的被分別處理或測序。優(yōu)選的,在氧化和/或還原之前,多核苷酸的這些部分不會被處理成添加標(biāo)簽或添加取代基團(tuán)(如葡萄糖)至樣品核苷酸序列中的5-羥甲基胞嘧啶殘基。包括樣品核苷酸序列的多核苷酸群體的第一部分可被氧化。在樣品核苷酸序列中氧化可轉(zhuǎn)化任意的5-羥甲基胞嘧啶為5-甲酰基胞嘧啶。氧化可以是無酶介導(dǎo)的氧化,例如使用有機(jī)的或無機(jī)的化學(xué)氧化劑,優(yōu)選地在變性的條件下。所述第一部分可通過用氧化劑處理被氧化。所述氧化劑為任意適于使醇生成醛的試劑。所述氧化劑或氧化步驟采用的條件可被選擇為使得任意的5-羥甲基胞嘧啶被選擇性氧化。因此,在多核苷酸中實質(zhì)上沒有其它官能團(tuán)在氧化步驟中被氧化。因此,氧化步驟不會引發(fā)其中存在的任意的胸腺嘧啶或5-甲基胞嘧啶殘基反應(yīng)。所述氧化劑或所述條件可被選擇為最小化或防止所述多核苷酸的任何降解。氧化劑的使用可導(dǎo)致一些對應(yīng)的5-羧基胞嘧啶產(chǎn)物的形成。這類產(chǎn)物的形成對本文中描述的識別方法不會產(chǎn)生負(fù)面影響。在用于轉(zhuǎn)化5-甲?;奏槟蜞奏さ闹貋喠蛩猁}反應(yīng)條件下,還可以觀察到5-羧基胞嘧啶被轉(zhuǎn)化為尿嘧啶??梢岳斫獾氖?,通過氧化5-羥甲基胞嘧啶得到的5-甲?;奏さ膮⒖家部梢允峭ㄟ^上述氧化得到的包括5-羧基胞嘧啶的產(chǎn)物的參考。上述氧化劑可以是無酶氧化劑,例如,有機(jī)的或無機(jī)的化學(xué)化合物。適合的氧化劑在本領(lǐng)域中是公知的,包括金屬氧化物,如kruo4、mno2和kmno4。尤其有用的氧化劑是在水性條件下可使用的那些,因為這樣操作所述多核苷酸是最為方便的。然而,適用于有機(jī)溶劑中的氧化劑也可以在可行時被使用。在一些實施例中,所述氧化劑可包括過釕酸鹽陰離子(ruo4-)。適合的過釕酸鹽氧化劑包括有機(jī)的和無機(jī)的過釕酸鹽,如過釕酸鉀(kruo4)和其它金屬過釕酸鹽;季銨陽離子過釕酸鹽,如四丙基過釕酸銨(tpap)和四丁基過釕酸銨(tbap);聚合物負(fù)載的過釕酸鹽(psp)和四苯基膦釕。有利地,所述氧化劑或氧化條件還可在變性狀態(tài)保存多核苷酸。在用所述氧化劑處理之后,第一部分中的多核苷酸可被純化??墒褂萌我膺m合的核酸純化技術(shù)進(jìn)行純化。適合的核酸純化技術(shù)包括離心柱層析。所述多核苷酸可能經(jīng)受進(jìn)一步、重復(fù)的氧化步驟。采取這種步驟以最大程度的轉(zhuǎn)化5-羥甲基胞嘧啶為5-甲?;奏ぁ6嗪塑账峋哂凶銐虻哪軌蚨瓮嘶鸬亩壗Y(jié)構(gòu)可能是必要的。所述多核苷酸的任意退火部分可限制或防止氧化劑進(jìn)入到具有保護(hù)5-羥甲基胞嘧啶不受氧化效果的所述結(jié)構(gòu)的那個部分中。在一些實施例中,多核苷酸群體的第一部分例如,可經(jīng)受用氧化劑處理的多個循環(huán)后再純化。例如,進(jìn)行一個、兩個、三個或多于三個的循環(huán)。在一些實施例中,包括樣品核苷酸序列的多核苷酸群體的第一部分可被還原。在其它實施例中,包括樣品核苷酸序列的多核苷酸群體的第三部分可被還原。還原的多核苷酸的第一或第三部分轉(zhuǎn)化樣品核苷酸序列中的5-甲?;奏埢鶠?-羥甲基胞嘧啶。多核苷酸的第一或第三部分可通過用還原劑處理被還原。所述還原劑為任意適于使醛生成醇的試劑。所述還原劑或還原步驟采用的條件可被選擇為使得任意的5-甲?;奏け贿x擇性還原(即對于5-甲?;奏?,還原劑或還原條件是有選擇性的)。因此,在多核苷酸中實質(zhì)上沒有其它官能團(tuán)在還原步驟中被還原。所述還原劑或所述條件可被選擇以最小化或防止所述多核苷酸的任何降解。適合的還原劑在本領(lǐng)域中是公知的,并包括nabh4、nacnbh4和libh4。尤其有用的還原劑是在水性條件下可使用的那些,因為這樣操作所述多核苷酸是最為方便的。然而,適用于有機(jī)溶劑中的還原劑也可以在可行時被使用。在分別地氧化和還原之后,用重亞硫酸鹽處理所述群體的第一部分以及可選的第三部分。沒有被氧化或還原的所述群體的第二部分也用重亞硫酸鹽處理。用重亞硫酸鹽處理將多核苷酸中的胞嘧啶和5-甲酰基胞嘧啶殘基轉(zhuǎn)化為尿嘧啶。如上面所看到的,在多核苷酸中存在有5-羧基胞嘧啶(如氧化步驟的產(chǎn)物),這個5-羧基胞嘧啶在重亞硫酸鹽處理中轉(zhuǎn)化為尿嘧啶。不希望受到理論的束縛,我們認(rèn)為,5-甲?;奏さ姆磻?yīng)通過損失甲?;缘玫桨奏?,然后進(jìn)行后續(xù)的脫氨基以得到尿嘧啶。我們認(rèn)為,5-羧基胞嘧啶是通過后續(xù)的脫羧和脫氨步驟得到尿嘧啶的。在如本文中所描述的將多核苷酸中的胞嘧啶和5-甲?;奏ざ呋?-羧基胞嘧啶殘基轉(zhuǎn)化為尿嘧啶的情況下,可以進(jìn)行重亞硫酸鹽處理。所述群體的部分可通過與重亞硫酸鹽陰離子(hso32-)培養(yǎng)來用重亞硫酸鹽進(jìn)行處理。使用重亞硫酸鹽陰離子(hso32-)轉(zhuǎn)化核酸中未甲基化的胞嘧啶在本領(lǐng)域中是標(biāo)準(zhǔn)操作,適合的試劑和條件對于技術(shù)人員是公知的(39-42)。許多適合的方案和試劑也可市售可得(例如epitecttm,qiagennl;ezdnamethylationtm酶研究公司(zymoresearchcorp)ca;cp基因組超快重亞硫酸鹽修飾盒(cpgenometurbobisulfitemodificationkit);密理博(millipore))。本文中所描述的方法的特征是轉(zhuǎn)化未甲基化的胞嘧啶(可在5-甲?;奏せ?-羧基胞嘧啶的原位產(chǎn)生)為尿嘧啶。這一反應(yīng)典型的通過使用重亞硫酸鹽實現(xiàn)。然后,在本發(fā)明的總體方面中,任意試劑或反應(yīng)條件可被用于影響胞嘧啶到尿嘧啶的轉(zhuǎn)化。這類試劑盒條件可被選擇,以使5-甲基胞嘧啶很少反應(yīng)或不反應(yīng),并且更具體的,以使5-甲基胞嘧啶很少反應(yīng)或不反應(yīng)以形成尿嘧啶。所述試劑、或可選的進(jìn)一步的試劑也可影響5-甲酰基胞嘧啶或5-羧基胞嘧啶到胞嘧啶或尿嘧啶的轉(zhuǎn)化。在培養(yǎng)之后,多核苷酸的所述部分可被固定、洗滌、變性、洗脫和/或進(jìn)行其它所需的處理。在一些實施例中,所述群體的多核苷酸的第一、第二和第三部分可在如本文中所描述的處理之后被擴(kuò)增。這可有助于進(jìn)一步的操作和/或測序。多核苷酸的第一、第二和第三部分的改變的序列可在擴(kuò)增后備保存。適合的多核苷酸擴(kuò)增技術(shù)在本領(lǐng)域是公知的,包括pcr。多核苷酸的第一、第二和第三部分中的位置上的尿嘧啶(u)殘基的存在可通過擴(kuò)增的多核苷酸相應(yīng)的那個位置上的胸腺嘧啶(t)殘基的存在被表明或識別。如上面所描述的,多核苷酸在氧化、還原和/或重亞硫酸鹽處理之后修改為兼容于測序技術(shù)或平臺。修改的本質(zhì)取決于測序技術(shù)或平臺。例如,對于索來薩-啟迪(solexa-illumina)測序,處理的多核苷酸可以是碎片的,例如通過超聲法或限制性內(nèi)切核酸酶處理,根據(jù)需要修復(fù)了多核苷酸的自由端,并將引物連結(jié)到自由端上。多核苷酸可使用任意適合的低或高通量測序技術(shù)或平臺測序,包括桑格(sanger)測序(43)、索來薩-啟迪(solexa-illumina)測序(44)、以結(jié)合為基礎(chǔ)的(ligation-based)測序(solidtm)(45)、焦磷酸測序(46);斯特羅布(strobe)測序(smrttm)(47,48);和半導(dǎo)體陣列(semiconductorarray)測序(iontorrenttm)(49)。適用于多核苷酸測序的方案、試劑和裝置在本領(lǐng)域是公知的,并且是市售可得的。對應(yīng)于樣品核苷酸序列中胞嘧啶的第一、第二和/或第三核苷酸序列中位置上的殘基可以被識別。樣品核苷酸序列中位置上的胞嘧啶殘基的修飾可從如本文中所描述的第一、第二以及可選的第三核苷酸序列中對應(yīng)位置上的殘基的識別來確定。樣品核苷酸序列中胞嘧啶修飾的程度和數(shù)量可被確定。例如,與未甲基化的胞嘧啶相比,樣品核苷酸序列中的5-羥甲基胞嘧啶和/或5-甲基胞嘧啶的比例或數(shù)量可被確定。如本文所描述的多核苷酸,例如,多核苷酸群體或所述群體的第一、第二、第三和第四的1、2、3或全部的4個部分可被固定在載體上。實心載體是不可溶的、非凝膠狀的呈現(xiàn)表面的主體,所述多核苷酸被固定在所述表面上。適合的載體的實例包括載玻片、微孔板、膜或微球。所述載體可以是顆?;蚬腆w形式,包括例如盤、試管、珠、球、過濾器、織物、聚合物或膜。多核苷酸可以,例如,被固定到惰性聚合物、96孔板、其它在核酸測序中或在其它研究環(huán)境中使用的裝置、設(shè)備或材料。固定多核苷酸到實心載體表面在本領(lǐng)域中是公知的。在一些實施例中,所述載體本身可以被固定。例如,微球可以固定在第二固體表面上。在一些實施例中,多核苷酸群體的第一、第二、第三和/或第四部分在測序之前可被擴(kuò)增。優(yōu)選的,多核苷酸的部分在用重亞硫酸鹽處理后被擴(kuò)增。適用于多核苷酸擴(kuò)增的方法在本領(lǐng)域是公知的。在擴(kuò)增后,多核苷酸群體的擴(kuò)增部分可被測序。利用基于計算機(jī)的序列分析,核苷酸序列可被比較,并且第一、第二和/或第三核苷酸序列中位置上的、對應(yīng)于樣品核苷酸序列胞嘧啶的殘基可被識別。胞嘧啶修飾大于閾值的核苷酸序列(如cpg島)可以被識別。例如,其中大于1%、大于2%、大于3%、大于4%、大于5%的胞嘧啶為羥甲基化的一個或多個核苷酸序列可以被識別。利用任意適合的計算機(jī)系統(tǒng)和軟件可進(jìn)行基于計算機(jī)的序列分析。典型的計算機(jī)系統(tǒng)包括中央處理單元(cpu)、輸入方式、輸出方式和數(shù)據(jù)存儲方式(如ram)。優(yōu)選的提供顯示屏或其它圖像顯示。所述計算機(jī)可操作地連接到dna和/或rna測序儀。例如,計算機(jī)系統(tǒng)可包括與本文所述的第一、第二和/或第三核苷酸序列相比,適合于識別樣品核苷酸序列中修飾的胞嘧啶的處理器。例如,所述處理器可適合于;(a)識別樣品核苷酸序列中胞嘧啶殘基的位置,(b)識別樣品核苷酸序列中該胞嘧啶殘基位置上的第一、第二和/或第三核苷酸序列中的殘基,(c)根據(jù)對所述殘基的識別,確定樣品核苷酸序列中該位置上存在或不存在修飾的胞嘧啶殘基。所述樣品核苷酸序列和第一、第二和第三核苷酸序列可從dna和/或rna測序儀送入處理器。所述序列可被顯示,例如在顯示器上。所述計算機(jī)系統(tǒng)可進(jìn)一步包括用于存儲數(shù)據(jù)的存儲設(shè)備。核苷酸序列如基因組序列,和5fc、5hmc和其它修飾的胞嘧啶殘基的位置可被存儲于另一或相同存儲設(shè)備上,和/或被發(fā)送至輸出設(shè)備或在顯示器上顯示。這可有助于修飾的胞嘧啶(如基因組dna中的5hmc和5fc)的映射。識別和映射胞嘧啶修飾(如基因組中的5fc和5hmc)可用于神經(jīng)發(fā)育和功能及細(xì)胞分化、分裂和增殖的研究,以及疾病(如癌)的預(yù)知和診斷。因此,利用本文所描述的方法來識別和/或映射修飾的胞嘧啶(如5fc和5hmc)也可用于疾病中。本發(fā)明的另一方面提供了用于如上所述的識別樣品核苷酸序列中修飾的胞嘧啶殘基的方法的試劑盒,所述試劑盒包括:a.氧化劑和/或還原劑;和b.重亞硫酸鹽試劑。適合的氧化劑、還原劑和重亞硫酸鹽試劑已在前面進(jìn)行了描述。試劑盒可進(jìn)一步包括對照多核苷酸群體,所述對照多核苷酸群體包括一個或多個修飾的胞嘧啶殘基,例如胞嘧啶(c)、5-甲基胞嘧啶(5mc)、5-羥甲基胞嘧啶(5hmc)或5-甲?;奏?5fc)。在一些實施例中,對照多核苷酸群體可被分裂為一個或多個部分,每個部分都包括不同的修飾的胞嘧啶殘基。試劑盒可包括用于如上所描述的識別修飾的胞嘧啶殘基的方法的說明。試劑盒可包括本方法所需的一個或多個其它試劑,如緩沖液、測序或其它試劑。用于識別修飾的胞嘧啶的試劑盒可包括一個或多個用于執(zhí)行本方法的物品和/或試劑,如提供測試樣品本身的、包括dna和/或rna分離和純化試劑的裝置,以及樣品操作容器,這些部件通常是無菌的??紤]到本發(fā)明公開的內(nèi)容,本發(fā)明的多個進(jìn)一步的方面和實施例對于本領(lǐng)域的那些技術(shù)人員將是顯而易見的。說明書提到的所有文件出于所有的目的通過引用它們的全部合并在此。本文中使用的“和/或”被認(rèn)為是具體公開了兩個具體特征的每一個,或帶有或不帶有其它部件的部件。例如(a和/或b)被認(rèn)為是具體公開了(i)a,(ii)b和(iii)a和b的每一個,正如在文中單獨的列出每一個。除非文中另有說明,上文列出的特征的描述和定義不應(yīng)被限制為本發(fā)明的任何特殊方面或?qū)嵤├?,并且等同于被描述的所有方面和實施例而?yīng)用。本發(fā)明的某些方面和實施例現(xiàn)將參照如下描述的附圖以舉例方式說明。圖1顯示了5hmc的單堿基分辨率測序方法。圖1a示出了由氫氧化鈉在不同時間點淬滅的2'-脫氧-5-甲酰胞嘧啶核苷(d5fc)和nahso3的反應(yīng),之后通過高效液相色譜法(hplc)分析。誤差線是重復(fù)三次的標(biāo)準(zhǔn)偏差。圖1b示出了重亞硫酸鹽的氧化反應(yīng)式:在5hmc氧化成5fc后,用重亞硫酸鹽處理和naoh以將5fc轉(zhuǎn)化為尿嘧啶(u)。r基團(tuán)為dna。圖1c示出了概括bs-seq(重亞硫酸鹽測序)和oxbs-seq(氧化重亞硫酸鹽測序)技術(shù)的圖和表。bs-seq包含了用重亞硫酸鹽處理輸入dna,然后測序、緊隨其后進(jìn)行放大。oxbs-seq包含了輸入dna的氧化,之后用重亞硫酸鹽處理并放大,然后測序。通過比較輸入、bs-seq和oxbs-seq輸出,c、5mc和5hmc可被區(qū)分、映射和定量。圖2a示出的2'脫氧-5-甲?;奏さ闹貋喠蛩猁}分布表明,整體的脫羰加上脫氨基為尿嘧啶。圖2b示出的2'脫氧-5-羧基胞嘧啶的重亞硫酸鹽分布表明,脫羧為胞嘧啶,之后脫氨基為尿嘧啶。圖3示出了通過質(zhì)譜氧化作用的定量(圖3a、3b、3d)和通過啟迪(illumina)測序氧化的重亞硫酸鹽處理的定量(圖3c)。圖3a示出了在kruo4氧化之前和之后,在15mer單鏈dna寡核苷酸中5hmc和5fc的水平(歸一化到t的峰面積)。圖3b示出了在兩個連續(xù)的kruo4氧化的之前和之后,在135mer雙鏈dna碎片中5hmc和5fc的水平(歸一化到引物序列中5mc的濃度)。圖3c示出了如通過包含單一5hmcpg(122mer)或多個5hmcpg(135mer)的兩個雙鏈dna碎片在氧化的重亞硫酸鹽處理后由illumina(啟迪)測序確定的胞嘧啶(c)到胸腺嘧啶(t)的轉(zhuǎn)化水平(每個堿基得到至少950,000次讀出片段(reads))。5mc還存在于比較轉(zhuǎn)化率的這些鏈中。圖3d示出了在kruo4氧化之前和之后,測定的es細(xì)胞dna(j1)中5hmc和5fc的水平(歸一化到引物序列中5mc的濃度)。所有的誤差線為標(biāo)準(zhǔn)偏差。圖4示出了通過用kruo4氧化處理合成的含有胞嘧啶(c)的15mer單鏈(ss)dna(重復(fù)三次)(圖4a)、合成的包含5mc的15mer單鏈dna(重復(fù)三次)(圖4b)和基因組es細(xì)胞j1dna(超聲重復(fù)2次和非超聲重復(fù)2次)(圖4c)后測量核苷酸比率的變化確定氧化后胞嘧啶降解的程度。通過hplc分析的氧化后核苷酸的峰面積除以氧化前核苷酸的峰面積測得百分比變化。誤差線為標(biāo)準(zhǔn)偏差。圖5示出了由包含5hmc的140bpdna分子在氧化前(圖5a)和后(圖5b)消化得到的核苷酸的hplc跡線。圖6示出了由包含5fc的15bpdna鏈在重亞硫酸鹽處理前(圖6a)和后(圖6b)消化得到的核苷酸的hplc跡線。圖7示出了由包含5fc的140bpdna分子在還原前(圖7a)和后(圖7b)消化得到的核苷酸的hplc跡線。圖8示出了在oxbs處理后包含c、5mc或5hmc的具有clai位點(atcgat)的122merdna鏈的桑格(sanger)測序。色譜圖示出了模板鏈的相對序列。在cdna中,在相對鏈中c完全被轉(zhuǎn)化為u,如色譜圖中示出為a而不是g。5mcdna不會被轉(zhuǎn)化,如在色譜圖中示出為g。5hmcdna大部分被轉(zhuǎn)化,在色譜圖中示出為a,在該實驗中具有少量的未轉(zhuǎn)化的g。圖9示出了通過oxrrbs在cgi定量的5mc和5hmc的水平。圖9a示出了在rrbs和oxrrbs數(shù)據(jù)集之間每個cgi的未轉(zhuǎn)化的胞嘧啶的分?jǐn)?shù)(fraction)的比較;在oxrrbs數(shù)據(jù)集中具有統(tǒng)計學(xué)顯著較低分?jǐn)?shù)的cgi(紅色)為羥甲基化cgi;利用相對模式使用cgi的數(shù)量(黑色)估計了3.7%的錯誤發(fā)現(xiàn)率。圖9b示出了在具有各自修飾顯著水平的cgi中5mc和5hmc水平的分布。圖9c示出了基因組rrbs和oxrrbs分布與(h)medip-seq分布重合的實施例(6)。cgi由綠條表示;為了清楚起見,cgi外部數(shù)據(jù)被掩蔽(灰色區(qū)域)。oxrrbs跡線中的每個條代表了單一的cpg(在dna的任一鏈中)。在面板下部的區(qū)域中放大突出了本方法的單核苷酸分辨率。圖9d示出了利用glucms-qpcr驗證的選定cgi的5mc和5hmc的水平。顯示了oxrrbs在單個mspi位點的值,其中誤差線代表了95%置信區(qū)間。重復(fù)進(jìn)行g(shù)lucms-qpcr,其中條形代表了平均值,黑點代表了單個重復(fù)。這兩種技術(shù)顯示出良好的相關(guān)性。圖10示出了在用kruo4氧化前(圖10a)和后(圖10b),rna鏈(seqidno:7)消化為核苷酸的hplc色譜圖。相同的條件被用于dna氧化。核苷酸的保留時間如下:c-1.2分鐘、u-1.7分鐘、g-3.5分鐘、a-6.5分鐘。圖11示出了包含5-甲?;奏?5fc)(部分序列所示-acgga5fcgta)的合成的100merdna鏈在用nabh4和重亞硫酸鹽處理(redbs-seq)還原后的sanger(桑格)測序跡線。色譜圖示出了部分序列(tacgtccat-其中黑體位置來自5fc或c)的反向互補(bǔ)序列。5fc和c的位置(括號中)示于圖11中的模板鏈上。在重亞硫酸鹽條件下5fc和c脫氨基。然而,5fc由還原步驟而不是脫氨基被轉(zhuǎn)化為5hmc,盡管c脫氨基不受影響。這允許以單堿基分辨率區(qū)分5fc和c。表1示出了胞嘧啶和修飾的胞嘧啶在經(jīng)過各種處理后的測序結(jié)果。表2示出了胞嘧啶(1a)、5-甲基胞嘧啶(5mc;1b)、5-羥甲基胞嘧啶(5hmc;1c)和5-甲?;奏?5fc;1d)的結(jié)構(gòu)。表3示出了一些水溶性氧化劑實例氧化dna中5hmc的效率的概要。表4和表5分別示出了dna(圖4,圖5和6)和rna(圖10)的hplc跡線中峰的保留時間。試驗1、方法1.1用mno2將d5hmctp氧化成d5fctp和d5cctp于497.5μl水中的2.5μld5hmctp(100mm,bioline)和51.6mgmno2(對于d5fctp)或500mgmno2(對于d5cctp)(阿爾法埃莎(alphaaeser))在50℃振搖2小時30分鐘。然后,使用amiconultra(超過濾器)0.5ml10kda柱(密理博(millipore))通過過濾除去mno2,將樣品凍干。將三磷酸核苷酸懸浮(5mm),并用堿性磷酸酶(新英格蘭生物實驗室(newenglandbiolabs))在37℃下過夜脫去磷酸。1.2d5fc和d5cc核苷的重亞硫酸氫鹽時間過程將9μld5fc或d5cc(5mm)、0.5μlda(0.1m,roche)和2.5μl水混合,然后添加33μl4mnahso3(mp生化制品)。將其分為三個15μl的反應(yīng),在50℃的暗處放置。在不同時間點取出0.5μl的部份,并加入2.5μl水和2μlnaoh(1m)。在室溫下至少放置30分鐘后,將它們注入hplc。測量了峰面積,將其與d5fc、d5cc、dc或du的校正曲線相關(guān)聯(lián),并標(biāo)準(zhǔn)化為色譜中da的水平。1.3用于hplc分析的dna消化dna如通過文獻(xiàn)方案(30)消化,用amiconultra0.5ml10kda柱純化,并利用agilent1100在eclipse(伊克里斯)xdb-c183.5μm,3.0x150mm柱上以1ml/min通過hplc分析。柱溫度保持在45℃。洗脫緩沖液為緩沖液a(500mm醋酸銨(費舍爾(fisher)),ph5),緩沖液b(乙腈(acetonitrile))和緩沖液c(h2o)。緩沖液a在整個運行中保持為1%,對于剩余的緩沖液的梯度為0分鐘-0.5%b,2分鐘-1%b,8分鐘-4%b,10分鐘-95%b。2'-脫氧核苷酸的保留時間如下:2'-脫氧-5-羧基胞苷(1.0分鐘),2'-脫氧胞苷(1.8分鐘),2'-脫氧-5-羥甲基胞苷(2.1分鐘),2'-脫氧尿苷(2.7分鐘),2'-脫氧-5-甲基胞苷(4.0分鐘),2'-脫氧鳥苷(4.5分鐘),2'-脫氧-5-甲?;?5.4分鐘),2'-脫氧胸苷(5.7分鐘),2'-脫氧腺苷(7.4分鐘)。使用相同的方案來消化用于hplc分析的rna。1.4單鏈和雙鏈pna序列15mer寡核苷酸購于包含胞嘧啶、5-甲基胞嘧啶或5-羥甲基胞嘧啶的iba。122mer和135mer雙鏈dna模板和引物購于biomers。引物中所有的c為5-甲基胞嘧啶。5-羥甲基胞嘧啶通過pcr利用d5hmctp和fermentasdreamtaq聚合酶加入到所有其他胞嘧啶位置的鏈中。1.5一般還原dna(約1μg-10μl)與40μlnabh4(每微升10,000當(dāng)量)在冰上培育5分鐘。之后,將反應(yīng)物在暗處在25℃用開口的蓋子振搖1小時。該反應(yīng)物用快速旋轉(zhuǎn)寡核苷酸柱(羅氏(roche))純化。1.6氧化反應(yīng)一般氧化dna用naoh(0.05m最終濃度)在冰上形成了24μl,之后加入1μlkruo4溶液(阿爾法埃莎(alphaaeser))(0.05mnaoh中15mm),將該反應(yīng)置于冰上1小時,期間偶爾渦流。將反應(yīng)物用小型快速旋轉(zhuǎn)寡核苷酸柱(羅氏)純化(在4次600μlh2o洗滌后)。這些條件也被用于rna的氧化。單鏈dna氧化按照一般氧化方法氧化1μg15mer合成的單鏈dna。合成的雙鏈dna雙氧化雙鏈dna用乙醇沉淀,然后通過小型快速旋轉(zhuǎn)寡核苷酸柱過濾(在4次600μlh2o洗滌后)。合成的雙鏈dna需要雙氧化反應(yīng),因為naoh變性并不是100%的對單一同源dna碎片的溶液有效(不同于基因組dna)。1μgdna在0.05mnaoh(總體積19μl)中在37℃下變性30分鐘。然后將反應(yīng)物快速在冰上冷卻,并靜置5分鐘。隨后根據(jù)一般氧化方法來氧化該反應(yīng)物,但總體積為20μl。該dna在0.05mnaoh(總體積24μl)中在37℃下再次變性30分鐘。然后再次將反應(yīng)物快速在冰上冷卻,靜置5分鐘,并根據(jù)一般氧化氧化。基因組dna的一般氧化dna(1μg或更少)在氧化之前先用乙醇沉淀,然后通過小型快速旋轉(zhuǎn)寡核苷酸柱過濾(在4次600μl水洗滌后)。dna在0.05mnaoh(24μl或40μl總體積)中在37℃下變性30分鐘。然后將反應(yīng)物快速在冰上冷卻,靜置5分鐘,并根據(jù)一般氧化氧化。1.7氧化的重亞硫酸鹽處理的雙鏈dna的sanger(桑格)和illumina(啟迪)測序?qū)τ趕anger測序,1μg的包含c、5mc和5hmc的122merdna根據(jù)雙鏈dna雙氧化被氧化,并根據(jù)制造商的ffpe樣品的說明利用qiagenepitect試劑盒進(jìn)行重亞硫酸鹽處理,不同之處在于熱循環(huán)被反復(fù)執(zhí)行兩次。然后將這些樣品提供給桑格測序(源生物科學(xué)(sourcebioscience))。對于illumina測序,1μg的包含5hmc的122mer和135merdna用drai(2μl,新英格蘭生物實驗室(newenglandbiolabs))和sspl(1μl,新英格蘭生物實驗室)消化過夜。將消化的條帶用fermentasgenejet凝膠提取試劑盒凝膠純化,并利用nebnextdna樣品預(yù)控制混合設(shè)置1來結(jié)合甲基化的連接體(adaptor)(啟迪(illumina))。在如上述氧化和重亞硫酸鹽處理后,利用pfuturbocx(安捷倫)和連接體特異性引物(illumina)擴(kuò)增(18個循環(huán))連接的碎片,之后利用ampurexp珠(agencourt)純化。1.8質(zhì)譜核苷來源于根據(jù)制造商的說明通過用dna降解加(酶研究)消化的dna,并通過在配有納電噴霧離子源(proxeon)的ltqorbitrapvelos質(zhì)譜儀(熱電科學(xué)(thermoscientific))上的lc-ms/ms進(jìn)行分析。在高分辨率全掃描模式下(對于質(zhì)子化準(zhǔn)分子離子r>40,000,對于伴隨的質(zhì)子化堿基碎片離子r>50,000)及在選擇的反應(yīng)監(jiān)測(srm)模式下獲得了5hmc、5fc以及與5mc和t相關(guān)的質(zhì)譜數(shù)據(jù),所述選擇的反應(yīng)監(jiān)測(srm)模式監(jiān)測到了258->142.0611(5hmc)、256->140.0455(5fc)、242->126.0662(5mc)和243->127.0502(t)的轉(zhuǎn)換。母體離子被選定用于具有4個質(zhì)量單位分離窗的srm,并通過具有20%的相對碰撞能量的hcd分裂,其中碎片離子的r>14,000。從5hmc和5fc相關(guān)離子的離子色譜圖中提取的峰面積被歸一化為來自5mc(存在時)或t中的那些,并相對于三磷酸核苷酸或寡核苷酸的消化獲得的標(biāo)準(zhǔn),通過外部校正定量。1.9es(胚胎)干細(xì)胞培養(yǎng)和dna提取j1es細(xì)胞(129s4/svjae)購自atcc(目錄(cat.)scrc-1010),并在37℃和5%co2的條件下在完整的es培養(yǎng)基(dmem4500mg/l葡萄糖、4mml-谷氨酰胺和110mg/l丙酮酸鈉、15%胎牛血清、100ml培養(yǎng)基中100u青霉素/100μg鏈霉素、0.1mm非必需氨基酸、50μμβ-巰基乙醇、103ulifesgro)中的γ-照射的pmef培養(yǎng)層上培養(yǎng)?;蚪Mdna利用qiagenallprepdna/rna迷你試劑盒從傳代14或20次的es細(xì)胞中制備。1.10oxrrbs根據(jù)先前公開的方案制備了氧化和非氧化的dna的rrbs庫(31)。簡單地說,用mspi(fermentas)消化2μg的基因組dna,然后用klenow(fermentas)進(jìn)行末端修復(fù)和加a尾,并用t4dna連接酶(neb)連接甲基化的連接體(illumina)。連接體-連接的mspi消化的dna在3%瓊脂糖凝膠上進(jìn)行并選擇大小(110-380bp),隨后用qiagenqiaquick純化凝膠快速和乙醇沉淀進(jìn)行純化。在氧化之前,選擇了大小的dna通過小型快速旋轉(zhuǎn)寡核苷酸柱(在4次600μl水洗滌后)過濾,以去除任何最后殘留的緩沖液/鹽,并調(diào)整最終體積到25μl。保留5μl該溶液用于產(chǎn)生非氧化庫。根據(jù)基因組dna的一般氧化方法氧化剩余的溶液。根據(jù)制造商的ffpe樣品的說明,使用qiagenepitect試劑盒對氧化和非氧化的dna樣品進(jìn)行重亞硫酸鹽處理,不同的是要運行熱循環(huán)兩次以上。利用pfuturbocx(安捷倫)和連接體特異性引物(illumina)擴(kuò)增(18個循環(huán))完成最終的庫擴(kuò)增(18次循環(huán)),在這之后用ampurexp珠(agencourt)純化該庫。1.11測序和讀取校準(zhǔn)在illuminagaiix平臺上執(zhí)行測序(單端,40bp讀出片段)。在對前三個堿基對應(yīng)用無鞍處理之后,利用olb版1.8通過再處理原始圖像命名的為堿基(32)。利用俾斯麥(bismark)v0.6.4(33)、使用選項-n1-l40–序列(phred)64-品質(zhì)(quals)--普通(vanilla)進(jìn)行小鼠基因組(第ncbim37版)的重亞硫酸鹽讀取校正。執(zhí)行單個的通道5’單體序列的俾斯麥校正更為嚴(yán)格(-n0);發(fā)布的用于讀取校正的共有序列為l1a(34)、l1tf和l1gf(35)單體亞型。根據(jù)3’mspi位點的測序讀出片段中klenow填充處的未轉(zhuǎn)化的胞嘧啶的數(shù)量估計重亞硫酸鹽轉(zhuǎn)化率,其中3’mspi位點的測序讀出片段足夠短使得能夠通過這些位點讀出。讀取序列的品質(zhì)在3'端依然很高。預(yù)計重亞硫酸鹽的轉(zhuǎn)化率在99.8%和99.9%之間變化。1.12oxrrbs數(shù)據(jù)處理在cgi(25)中轉(zhuǎn)化的和未轉(zhuǎn)化的胞嘧啶的數(shù)量分別取自每個bs和oxbs數(shù)據(jù)集。對于每個cpg位置,將每個oxbs數(shù)據(jù)集中未轉(zhuǎn)化的胞嘧啶的百分比作為5mc的數(shù)量,并且從bs數(shù)據(jù)集中未轉(zhuǎn)化的胞嘧啶的百分比中減去這個值得到5hmc的數(shù)量。在每個cgi中通過來自所有的cpg涵蓋的匯集數(shù)據(jù)計算了每個cgi的整體值。少于10次讀取的cpg被排除在外,因為它們是從整體cgi5mc值中偏離超過20%的5mc估計值或從整體cgi5mc值中偏離超過10%的5mc估計值的cpg。在這離群值篩選步驟之后,只有5個代表性的cpg或多個的cgi被分析。為了測試包含5mc水平顯著高于oxbs數(shù)據(jù)集的重亞硫酸鹽轉(zhuǎn)化錯誤的cgi,利用benjamini-kochberg的0.01校正p值截止進(jìn)行了二項式檢驗。類似地,二項式檢驗用于在bs數(shù)據(jù)集中選擇具有顯著未轉(zhuǎn)化胞嘧啶值的cgi;在這些中,bs和oxbs數(shù)據(jù)集之間的差異通過應(yīng)用fisher測試,并利用0.05的校正p值截止進(jìn)行了測試。在oxbs數(shù)據(jù)集中具有顯著較低的未轉(zhuǎn)化胞嘧啶碎片的cgi被認(rèn)為是羥甲基化的cgi。具有相反模式的cgi被假設(shè)為是偽像,并用于估計錯誤發(fā)現(xiàn)率。1.13glucms-qpcr如先前所述(6),通過glucms-qpcr在mspi位點定量5mc和5hmc水平。2、結(jié)果我們追求的策略是在dna中通過采用對5hmc具有選擇性的化學(xué)反應(yīng)將5mc區(qū)別于5hmc,特別是通過化學(xué)方法除去羥甲基基團(tuán),從而轉(zhuǎn)化5hmc為c,然后可通過重亞硫酸鹽介導(dǎo)的脫氨作用容易地將c轉(zhuǎn)化為u。在我們關(guān)于5-甲?;奏?5fc)的化學(xué)反應(yīng)研究過程中,我們在重亞硫酸鹽的條件下觀察到5-fc脫羰和脫氨后轉(zhuǎn)化為尿嘧啶(u),其中5mc保持不變(圖1a)。這個以前未報告的轉(zhuǎn)化表明,可通過選擇性地氧化5hmc為5fc,然后在兩步工藝中將5fc轉(zhuǎn)化為u來進(jìn)行5mc測序(圖1b)。在傳統(tǒng)的bs-seq導(dǎo)致5mc和5hmc被檢測為c時,這種“氧化的重亞硫酸鹽”測序(oxbs-seq)的方法僅在5mc位點上得到了c,因此,允許我們通過比較bs-seq和oxbs-seq的讀數(shù)來確定5hmc在特定核苷酸位點的數(shù)量(圖1c)。確定了2'脫氧-5-甲酰基胞嘧啶和2'脫氧-5-羧基胞嘧啶的重亞硫酸鹽分布(圖2a和2b)。用2.9mnahso4培養(yǎng)2'脫氧-5-甲?;奏ず?'脫氧-5-羧基胞嘧啶。在不同的時間點取反應(yīng)的小樣,并與0.3mnaoh反應(yīng)。將這些直接注射到hplc中用于分析。hplc分布分別于與整體的脫羰或脫羧相一致,以使胞嘧啶在快速脫氨后轉(zhuǎn)化為尿嘧啶。因此,我們需要利用溫和的、與水介質(zhì)兼容的、選擇性的通過其他堿基和dna骨架的氧化劑來具體氧化5hmc到5fc。測試了一系列的可能適合的水溶性氧化劑(表3),我們發(fā)現(xiàn)過釕酸鉀(kruo4)擁有我們所尋求的性能和轉(zhuǎn)換效率。kruo4基本上可以氧化醇類和碳-碳雙鍵(23)。然而,在我們的反應(yīng)中研究了包含5hmc的合成的15rner單鏈dna(ssdna),我們在kruo4反應(yīng)下建立的條件對于5hmc的伯醇具有高度特異性(通過質(zhì)譜定量轉(zhuǎn)化5hmc到5fc,圖3a)。包含c或5mc,而不是5hmc的15mer單鏈dna并沒有顯示出與kruo4的任何堿基特異性反應(yīng)(圖4a、b)。我們還意識到,kruo4氧化劑可以繼續(xù)反應(yīng)為羧酸(23),但在dna中5hmc在的情況下,我們僅觀察到了醛(5fc),即使用適度過量的氧化劑。在添加氧化劑之前的初始變性步驟中,kruo4氧化劑還能夠氧化樣品中的5hmc為雙鏈dna(dsdna);這導(dǎo)致了5hmc到5fc的定量產(chǎn)率和通過質(zhì)譜判斷的一樣(圖3b)。制備了140bpdna分子(seqidno:1),所述dna分子中通過pcr利用5-甲基胞嘧啶引物和hmctp并入了45個5hmc核苷。利用kruo4氧化dna。在氧化之前和之后,用核酸酶、磷酸二酯酶i和堿性磷酸酶將dna消化為核苷。然后將該混合物注入到hplc中以得到示于圖5a(氧化前)和5b(氧化后)中的跡線。觀察到了5hmc到5fc幾乎完整的轉(zhuǎn)化,而未對其它核苷有活性。含有3個5fc殘基的單鏈15bpdna分子(seqidno:2)用如上所描述的重亞硫酸鹽處理。在用重亞硫酸鹽處理之前和之后,用核酸酶、磷酸二酯酶i和堿性磷酸酶將dna消化為核苷。然后將該混合物注入到hplc中以得到示于圖6a和6b中的跡線。在重亞硫酸鹽處理之后,只有5fc殘留的非常小的峰,以及存在的可忽略不計的胞嘧啶。圖6b中的尿嘧啶峰來源于5fc,以及未修飾的c的脫氨基。制備了140bpdna分子(seqidno:1),所述dna分子中通過pcr并入了45個5hmc核苷。利用如上所描述的nabh4還原dna。在還原之前和之后,用核酸酶、磷酸二酯酶i和堿性磷酸酶將dna樣品消化為核苷。然后將核苷的混合物注入到hplc中以得到示于圖7a(還原前)和7b(還原后)中的跡線。觀察到了5fc到5hmc完整的轉(zhuǎn)化。對122個堿基對的雙鏈dna(seqidno:3)中clai位點(atcgat)氧化的重亞硫酸鹽轉(zhuǎn)化率進(jìn)行了研究,以測試氧化重亞硫酸鹽方法的效率和選擇性。在中央具有單cpg的雙鏈122個堿基對的dna碎片(在claiatcgat限制位點的情況下,seqidno:3)通過pcr利用5-甲基胞嘧啶引物和ctp、5mctp或5hmctp的任一一種進(jìn)行擴(kuò)增。擴(kuò)增的產(chǎn)物在引物區(qū)域中含有5-甲基胞嘧啶,在cpg中央含有cpg、5mcpg或5hmcpg。如上所述,含有c、5mc或5hmc任一一種的三個合成的122mer雙鏈dna的每一個用kruo4氧化,然后進(jìn)行常規(guī)的重亞硫酸鹽轉(zhuǎn)化方案。對每三個鏈的每一個進(jìn)行sanger測序(圖8)。含有c的鏈完全轉(zhuǎn)化為u(圖8左面板),含有5mc的鏈并沒有轉(zhuǎn)化(圖8中間面板),含有5hmc的鏈大部分定量轉(zhuǎn)化為u,并帶著未轉(zhuǎn)化的c的跡線(圖8右面板)。這顯示出主要的腺嘌呤峰來自轉(zhuǎn)化的材料,殘留的鳥嘌呤峰來自少數(shù)未轉(zhuǎn)化的材料。為了獲得精確測量的5hmc到u的轉(zhuǎn)化效率,在氧化重亞硫酸鹽處理后對含有5hmc的合成鏈進(jìn)行了illumina測序。觀察到了94.5%的整體5hmc到u的轉(zhuǎn)化水平(圖3c)。氧化重亞硫酸鹽方案還被應(yīng)用于在一系列不同情況下包含多個5hmc殘基的第二鏈,并示出了類似的5hmc到u的高轉(zhuǎn)化效率(94.7%)(圖3c)。最后,對基因組dna進(jìn)行了kruo4氧化,并示出了通過質(zhì)譜定量獲得的5hmc到5fc的轉(zhuǎn)化(圖3d),沒有明顯的c降解(圖4c)。這些原理實驗的證據(jù)表明,氧化重亞硫酸鹽方案將具體地轉(zhuǎn)化dna中的5hmc到u,保持c和5mc不變,允許在寬泛使用的平臺(oxbs-seq)上進(jìn)行定量、單核苷酸分辨率的測序。之后,我們使用了氧化重亞硫酸鹽原理以在小鼠es細(xì)胞的基因組dna中以高分辨率定量地映射5hmc。我們選擇結(jié)合氧化重亞硫酸鹽和還原表示的重亞硫酸鹽測序(rrbs)(24),這允許用于高度富集cpg島(cgi)的基因組的一部分的選擇性序列,從而保證足夠的測序深度以檢測這種低豐度的標(biāo)記。因此,我們創(chuàng)立了實現(xiàn)每cpg~120個讀出片段的平均測序深度的rrbs和oxrrbs數(shù)據(jù)集,其中,當(dāng)匯集時產(chǎn)生了每cpg平均約3,300個甲基呼叫。在應(yīng)用深度和廣度截止后(見材料和方法),55%(12,660)的所有的cgi(25)被覆蓋在我們的數(shù)據(jù)集中。我們的rrbs(即非氧化的)數(shù)據(jù)與已發(fā)布的rrbs和bs-seq數(shù)據(jù)集有良好的相關(guān)性(24,26)。為了識別含有5hmc的cgi,我們利用嚴(yán)格的標(biāo)準(zhǔn)對rrbs和oxrrbs數(shù)據(jù)集之間的差異進(jìn)行了測試(見材料和方法)。據(jù)預(yù)計,最顯著的差異起源于在與rrbs設(shè)置相比時,在oxrrbs設(shè)置中具有較低比例的未轉(zhuǎn)化的胞嘧啶的cgi。具有逆轉(zhuǎn)趨勢的cgi被用來估計3.7%的錯誤發(fā)現(xiàn)率(圖9a)。我們識別了800個含有5hmc的cgi,其中平均3.3%(范圍0.2-18.5%)的cpg羥甲基化(圖9a和b)。我們還識別了4577個平均8.1%的cpg甲基化的含有5mc的cgi(圖9b)。我們在相同的es干細(xì)胞系、但通道數(shù)目不同的獨立重復(fù)的生物樣品中進(jìn)行了測序,其中通過質(zhì)譜法具有5hmc的還原水平(0.10%對所有c的0.16%),并一致發(fā)現(xiàn)更少的含有5hmc的cgi。重要的是,存在于兩個樣品中的含有5hmc的cgi表現(xiàn)出良好的定量重現(xiàn)性。為了證實我們的方法,我們選擇了21個包含mspi限制位點的cgi,并通過glucms-qpcr在這些cpg上量化了5hmc和5mc水平(28)(圖9d)。我們在oxrrbs和glucms-qpcr定量之間發(fā)現(xiàn)了良好的相關(guān)性(對于5mc和5hmc分別為r=0.86,p=5e-7和r=0.52,p=0.01)。研究了含有5-甲?;奏?5fc)的dna鏈的還原重亞硫酸鹽轉(zhuǎn)化率(rebs-seq)。給含有序列acgga5fcgta的合成的100merdna鏈(seqidno:8)通入nabh4進(jìn)行還原,然后進(jìn)行常規(guī)的重亞硫酸鹽轉(zhuǎn)化方案。之后對該鏈進(jìn)行sanger測序(圖11)。圖11顯示的測序跡線代表了反向互補(bǔ)序列(tacgtccat)的一部分。5fc和c的位置為黑體,并在圖11中的括號內(nèi)示出了模板鏈。如前所示,5fc和c在重亞硫酸鹽條件下脫氨基以形成u,如圖11的反向互補(bǔ)序列中a所示的。然而,用nabh4還原轉(zhuǎn)化5fc到5hmc,這并不是脫氨基成u,如圖11的反向互補(bǔ)序列中g(shù)所示的。因此,還原的重亞硫酸鹽測序(redbs-seq)允許在單堿基分辨率區(qū)別5fc和c。總之,我們已表明,oxbs-seq方法在單核苷酸水平可靠地映射和量化5mc和5hmc。氧化的重亞硫酸鹽還可與非測序的下游方法(如在這里說明的sequenom)兼容。因此,通過與重亞硫酸鹽處理的和氧化的和重亞硫酸鹽處理的基因組dna的序列相比,確定5-甲基胞嘧啶、5-羥甲基胞嘧啶連同非修飾的胞嘧啶的存在是可能的。例如,在重亞硫酸鹽處理的和氧化的和重亞硫酸鹽處理的基因組dna序列的相同位置上尿嘧啶殘基表明未修飾的胞嘧啶的存在。在重亞硫酸鹽處理的和氧化的和重亞硫酸鹽處理的基因組dna序列的相同位置上的胞嘧啶殘基表明5-甲基胞嘧啶的存在。在氧化的和重亞硫酸鹽處理的基因組dna序列中的胞嘧啶殘基還表明5-甲基胞嘧啶的存在。在重亞硫酸鹽處理的基因組dna序列中的胞嘧啶殘基以及在氧化的和重亞硫酸鹽處理的基因組dna序列中的相同位置上的尿嘧啶殘基表明5-羥甲基胞嘧啶的存在。5-甲?;奏ひ部蓽y序至單核苷酸分辨率。5fc可利用nabh4(如通過hplc示出的)在基因組dna中定量的還原為hmc。通過比較未處理的、重亞硫酸鹽處理的、氧化和重亞硫酸鹽處理的以及還原和重亞硫酸鹽處理的基因組dna,所有三個已知的哺乳動物胞嘧啶修飾物(5-甲基胞嘧啶、5-羥甲基胞嘧啶和5-甲?;奏?的存在連同非修飾的胞嘧啶可被確定。例如,在i)重亞硫酸鹽處理的,ii)氧化的和重亞硫酸鹽處理的和iii)還原的和重亞硫酸鹽處理的基因組dna(uuu)序列中的相同位置處的尿嘧啶殘基表明未修飾的胞嘧啶的存在。在i)重亞硫酸鹽處理的,ii)氧化的和重亞硫酸鹽處理的和iii)還原的和重亞硫酸鹽處理的基因組dna(ccc)序列中的相同位置處的胞嘧啶殘基表明5-甲基胞嘧啶的存在。在重亞硫酸鹽處理的基因組dna序列中的胞嘧啶;在氧化的和重亞硫酸鹽處理的基因組dna序列中相同位置處的尿嘧啶,可選的在還原的和重亞硫酸鹽處理的基因組dna(cuc)序列中的相同位置處的胞嘧啶表明5-羥甲基胞嘧啶的存在。在重亞硫酸鹽處理的基因組dna序列中的尿嘧啶;在還原的和重亞硫酸鹽處理的基因組dna序列中相同位置處的胞嘧啶;以及可選的在氧化的和重亞硫酸鹽處理的基因組dna(ucu)序列中的相同位置處的尿嘧啶表明5-甲?;奏さ拇嬖?。當(dāng)未處理的基因組dna被測序時,修飾的和未修飾的胞嘧啶被讀取為胞嘧啶。在圖10中所示的hplc色譜圖證實了在28核苷酸rna鏈(seqidno:7)被氧化后沒有觀察到rna的降解。這一結(jié)果意味著,氧化方法也可兼容的用于測序修飾的胞嘧啶殘基,如本文中所描述的rna中的5hmc。參考文獻(xiàn)1.a.m.deatonetalgenesdev.25,1010(may15,2011).2.m.tahilianietal.science324,930(may15,2009).3.s.itoetal.nature466,1129(aug26,2010).4.a.szwagierczaketalnucleicacidsres,(aug4,2010).5.k.p.kohetal.cellstemcell8,200(feb4,2011).6.g.ficzetal.,nature473,398(may19,2011).7.k.williamsetal.nature473,343(may19,2011).8.w.a.pastoretal.nature473,394(may19,2011).9.y.xuetal.mol.cell42,451(may20,2011).10.m.r.brancoetalnat.rev.genet.13,7(jan,2012).11.s.kriaucionisetalscience324,929(may15,2009).12.m.munzeletal.angew.chem.int.ed.49,5375(jul2010).13.h.wuetal.genesdev.25,679(apr1,2011).14.s.g.jinetalnuc.acids.res.39,5015(jul,2011).15.c.x.songetal..nat.biotechnol.29,68(jan,2011).16.m.frommeretal.pnas.u.s.a.89,1827(mar1992).17.y.huangetal.plosone5,e8888(2010).18.c.nestoretalbiotechniques48,317(apr,2010).19.c.x.songetal.nat.methods,(nov20,2011).20.j.eidetal.science323,133(jan2,2009).21.e.v.wallaceetal.chem.comm.46,8195(nov21,2010).22.m.wanunuetal.j.am.chem.soc.,(dec14,2010).23.g.green,wetaljchemsocperkt1,681(1984).24.a.meissneretal.nature454,766(aug7,2008).25.r.s.illingworthetal.plosgenetics6,(sep,2010).26.m.b.stadleretal.nature480,490(dec22,2011).27.j.borgeletaletalnat.genet.42,1093(dec,2010).28.s.m.kinneyetal.j.biol.chem.286,24685(jul15,2011).29.n.laneetal.genesis35,88(feb,2003).30.e.p.quinlivanetal3rd,anal.biochem.373,383(feb2008).31.h.guetal.nat.protoc.6,468(apr,2011).32.f.kruegeretalplosone6,e16607(2011).33.f.kruegeretalbioinformatics27,1571(jun1,2011).34.s.a.schichmanetalmol.biol.evol.10,552(may,1993).35.j.l.goodieretal.genomeresearch11,1677(oct,2001).36.c.qinetal.mol.carcinog.49,54(jan,2010).37.lietalnucleicacids(2011)articleid87072638.pfaffeneder,t.etal(2011)angewandte.50.1-639.lister,r.etal(2008)cell.133.523-53640.wangetal(1980)nucleicacidsresearch.8(20),4777-479041.hayatsuetal(2004)nucleicacidssymposiumseriesno.48(1),261-26242.listeretal(2009)nature.462.315-2243.sanger,f.etalpnasusa,1977,74,546344.bentleyetalnature,456,53-59(2008)45.kjmckernanetalgenomeres.(2009)19:1527-154146.mronaghietalscience(1998)2815375363-36547.eidetalscience(2009)3235910133-13848.korlachetalmethodsinenzymology472(2010)431-455)49.rothbergetal(2011)nature475348-352).模型序列修飾的核苷酸為黑斜體140個堿基對的雙鏈dna模型(seqidno:1):cacatcccacactatacactcatacatacctgctcacgacgacgctgtacacctacgtactcgtgcacgctcgtcacgtgatcgaccatgactctgacgcactgaggtatgggaagtagtgagtagattgtagtaaggag15個核苷酸長度的單鏈dna模型(seqidno:2):gagacgacgtacagg122個堿基對的雙鏈dna模型(seqidno:3):cacatcccacactatacactcatacataccatttaaataaattaaataatattaatatatcgattaataataaataataattaattaatattgggaagtagtgagtagattgtagtaaggag135個堿基對的雙鏈dna模型(seqidno:4):cacatcccacactatacactcatacataccatttaacgataaattacaataacgtatctaatcatatcgattaactaatcgaaataataattacgcattaatattgggaagtagtgagtagattgtagtaaggag雙鏈dna正向引物(seqidno:5):cacatcccacactatacactcatacatacc雙鏈dna反向引物(seqidno:6):ctccttactacaatctactcactacttccc28個核苷酸的rna模型序列(seqidno:7):uguggggagggcggggcggggucugggg含有序列的100個核苷酸5fc(seqidno:8)[5fc位置用黑斜體表明]gacggacgtacgatcgagcgaggtcttgggtcagcaggtggcgactgttagctcagatggctagcaagtgggtatgtatgagtgtatagtgtgggatgtg表1表2氧化劑評論kruo4完全轉(zhuǎn)化為醛cro3沒有觀察到氧化pdc沒有觀察到氧化pcc沒有觀察到氧化mno2觀察到了少量的醛,但用過量的氧化劑會有很大程度的降解表3堿基保留時間/分鐘c1.85hmc2.1u2.7g4.55fc5.3t5.7a7.3表4hplc峰的保留時間(dna)堿基保留時間/分鐘c1.3u1.8g3.7a6.7表5hplc峰的保留時間(rna)。當(dāng)前第1頁12