本發(fā)明涉及生物檢測
技術(shù)領(lǐng)域:
,尤其涉及用于預(yù)測乳腺癌的生物標(biāo)記物組合、試劑盒及使用方法。
背景技術(shù):
:隨著當(dāng)今社會的發(fā)展,惡性腫瘤已成為目前人類的主要?dú)⑹种?。而對于女性惡性腫瘤,由于乳腺癌是世界范圍內(nèi)造成婦女發(fā)病和死亡的重要原因,因而乳腺癌在女性惡性腫瘤中居于首位。大量研究表明,乳腺癌發(fā)病的原因大多是環(huán)境因素和遺傳因素共同作用的結(jié)果,而遺傳性乳腺癌在所有發(fā)病的乳腺癌中僅占有5-10%,因此,大多數(shù)乳腺癌無法通過乳腺癌易感基因的突變檢測來確定是否發(fā)生乳腺癌病變。最近研究發(fā)現(xiàn),DNA(deoxyribonucleicacid,脫氧核糖核酸)甲基化狀態(tài)與乳腺癌的發(fā)生發(fā)展密切相關(guān)。DNA甲基化主要出現(xiàn)在DNA鏈鳥嘌呤前的胞嘧啶(即CpG位點(diǎn)),CpG位點(diǎn)在甲基轉(zhuǎn)移酶的催化作用下添加甲基,CpG位點(diǎn)被甲基化,即DNA甲基化。當(dāng)DNA甲基化達(dá)到一定程度時(shí),常規(guī)的右手雙螺旋型B-DNA向左手雙螺旋型Z-DNA發(fā)生過渡。相對于B-DNA,Z-DNA的結(jié)構(gòu)收縮、螺旋加深,這使得許多能夠與蛋白質(zhì)結(jié)合的原件縮入螺旋溝內(nèi),導(dǎo)致DNA轉(zhuǎn)錄起始困難,從而使得基因無法正常表達(dá),即基因失活。人體存在的抑癌基因、致癌基因、DNA修復(fù)基因以及細(xì)胞周期調(diào)節(jié)基因等眾多基因中都含有CpG位點(diǎn),當(dāng)抑癌基因中的CpG位點(diǎn)高度甲基化時(shí),抑癌基因的基因表達(dá)被抑制,抑癌基因失活,進(jìn)而導(dǎo)致抑癌基因喪失正常的抑癌功能;當(dāng)致癌基因中的CpG位點(diǎn)甲基化比率較低時(shí),致癌基因表達(dá)活躍,癌細(xì)胞的表達(dá)量增加,當(dāng)癌細(xì)胞的表達(dá)量增加到一定程度時(shí)則發(fā)生癌變。同時(shí),人體中還存在與甲基轉(zhuǎn)移酶的作用相反的去甲基酶,通過去甲基酶和甲基轉(zhuǎn)移酶的作用能夠使DNA甲基化狀態(tài)呈現(xiàn)可逆狀態(tài),因此,基因中DNA的甲基化水平或甲基化率能夠作為衡量癌變的指標(biāo)。另外,去甲基酶和甲基轉(zhuǎn)移酶的含量會因?yàn)樯瞽h(huán)境、飲食、藥物等方式的不同而不同,因而能夠通過改變生活環(huán)境、飲食、藥物等來避免和減緩乳腺癌的發(fā)生發(fā)展。生物標(biāo)記物是一種能夠反映細(xì)胞生長增殖特性的標(biāo)志物,能夠在生物體受到嚴(yán)重?fù)p害之前,從分子、細(xì)胞等生物學(xué)水平上反應(yīng)人體的異?;?,這種異?;饕憩F(xiàn)在生化代謝過程中的變化、異常代謝產(chǎn)物含量以及生理活性物質(zhì)的異常表現(xiàn)等,因此,通過檢測生物標(biāo)記物能夠得知人體當(dāng)前所處的狀態(tài)。生物標(biāo)記物能夠標(biāo)記特定的基因,如與乳腺癌相關(guān)的抑癌基因、致癌基因以及DNA修復(fù)基因等,以反映出當(dāng)前機(jī)體是否癌變。目前,DNA甲基化與乳腺癌的研究大多集中在單一基因的研究,因而生物標(biāo)記物也為單一生物標(biāo)記物。由于乳腺癌腫瘤在分裂生長的過程中,子細(xì)胞會出現(xiàn)基因方面的改變,使得乳腺癌腫瘤的生長速度、侵襲能力、治療以及預(yù)后方面產(chǎn)生差異,即乳腺癌腫瘤存在異質(zhì)性和復(fù)雜性,因而基因的突變以及復(fù)雜性使得單一生物標(biāo)記物不能準(zhǔn)確指示DNA的甲基化狀態(tài)和甲基化率,進(jìn)而單一基因的研究也就不能準(zhǔn)確地表明DNA甲基化與乳腺癌的關(guān)系。另外,單一生物標(biāo)記物在應(yīng)用時(shí)存在較為嚴(yán)重的假陽性和假陰性問題,且檢測靈敏度低,這使得檢測結(jié)果的準(zhǔn)確度降低。技術(shù)實(shí)現(xiàn)要素:本發(fā)明提供一種用于預(yù)測乳腺癌的生物標(biāo)記物組合、試劑盒及使用方法,以解決現(xiàn)有生物標(biāo)記物在指示DNA的甲基化狀態(tài)和甲基化率時(shí)靈敏度低、準(zhǔn)確度低的問題。第一方面,本發(fā)明提供一種用于預(yù)測乳腺癌的生物標(biāo)記物組合,所述組合為甲基化引物組合,所述甲基化引物組合包括:根據(jù)端?;騌AD50設(shè)計(jì)的序列為TTATATGTTATGTGATTATTGGAAATTAT的正向引物和序列為TTCCCAAAACTTAATCCTAAAACTC的反向引物;根據(jù)端?;騌TEL設(shè)計(jì)的序列為GGGTTGGGTGTTAGTGAGTGT的正向引物和序列為CAACTCCCATACCCCAAAAA的反向引物;根據(jù)端粒基因TERC設(shè)計(jì)的序列為AAAATTTGTAGAGTAGGAATTAAGTTG的正向引物和序列為CCCCAAACCTAACTAACTAAAC的反向引物;和/或,根據(jù)端?;騎RF1設(shè)計(jì)的序列為TAGTAGAATAGGAATTTTGGGAGT的正向引物和序列為AATACAACCTTAACTAAAAC的反向引物。第二方面,所述試劑盒包括甲基化引物組合。第三方面,本發(fā)明提供一種用于檢測DNA樣品中DNA片段的目標(biāo)基因位置的甲基化率的方法,所述方法包括:DNA樣本經(jīng)亞硫酸鹽處理后采用甲基化引物組合分別靶向PCR擴(kuò)增,得到包含測序Tag序列的靶向PCR擴(kuò)增產(chǎn)物;向所述包含測序Tag序列的靶向PCR擴(kuò)增產(chǎn)物中插入上游通用測序引物和下游帶條形碼的測序引物,以區(qū)別不同樣本的靶向PCR擴(kuò)增產(chǎn)物;其中,相同樣本的所述靶向PCR擴(kuò)增產(chǎn)物插入上游通用測序引物和條形碼相同的所述下游帶條形碼的測序引物,不同樣本的所述靶向PCR擴(kuò)增產(chǎn)物插入上游通用測序引物和條形碼不同的所述帶條形碼的下游測序引物;所述反應(yīng)體系分別PCR擴(kuò)增,得到不同樣本的PCR擴(kuò)增產(chǎn)物;將不同樣本的所述PCR擴(kuò)增產(chǎn)物等比例混合構(gòu)成擴(kuò)增子文庫;所述擴(kuò)增子文庫經(jīng)純化、定量和質(zhì)控后得到甲基化測序文庫;對所述甲基化測序文庫雙端測序、樣本拆分和甲基化信息分析,得到各樣本DNA中目的基因各CpG位點(diǎn)的甲基化狀態(tài)和甲基化率。結(jié)合第三方面,所述靶向PCR擴(kuò)增的擴(kuò)增條件為:95℃保持10分鐘,95℃變性保持15秒,58℃退火保持30秒,72℃延伸保持60秒,共40個(gè)循環(huán);所述PCR擴(kuò)增的擴(kuò)增條件為:95℃保持10分鐘,95℃變性保持15秒,60℃退火保持30秒,72℃延伸保持60秒,共15個(gè)循環(huán),循環(huán)結(jié)束后在72℃下延伸反應(yīng)3分鐘。第四方面,本發(fā)明提供一種用于預(yù)測乳腺癌的生物標(biāo)記物組合,所述組合為qPCR引物組合,所述qPCR引物組合包括:根據(jù)端?;騌AD50設(shè)計(jì)的序列為TGGATATGCGAGGACGATG的正向引物和序列為TGTTGGCTCATCCAAGGCA的反向引物;根據(jù)端?;騌TEL設(shè)計(jì)的序列為CATCGATGCTGTTGAGCTGC的正向引物和序列為GGATGATCTGGTCCAGCGAG的反向引物;根據(jù)端?;騎ERC設(shè)計(jì)的序列為CATGTGTGAGCCGAGTCCTG的正向引物和序列為GAAGAGGAACGGAGCGAGTC的反向引物;根據(jù)端?;騎RF1設(shè)計(jì)的序列為GTCTGCGGTAACTGAATCCTCA的正向引物和序列為TTGTTGCTGGGTTCCATGTT的反向引物;和/或,根據(jù)參考基因GAPDH設(shè)計(jì)的序列為CCTCTCCCCAGCCAAAGAAG的正向引物和序列為TGACCCTTTTTGGACTTCAG的反向引物。第五方面,本發(fā)明提供一種用于預(yù)測乳腺癌的試劑盒,所述試劑盒包括qPCR引物組合。第六方面,本發(fā)明提供一種用于預(yù)測乳腺癌的生物標(biāo)記物組合,所述組合包括甲基化引物組合和qPCR引物組合。第七方面,本發(fā)明提供一種用于預(yù)測乳腺癌的試劑盒,所述試劑盒包括包含有甲基化引物組合和qPCR引物組合的生物標(biāo)記物組合。第八方面,本發(fā)明提供一種用于檢測核酸樣品中目標(biāo)基因位置的目標(biāo)基因甲基化率和目標(biāo)基因表達(dá)量的方法,采用包含有甲基化引物組合和qPCR引物組合的生物標(biāo)記物組合,其中,甲基化引物組合用于檢測目的基因的甲基化率,qPCR引物組合用于檢測目的基因的表達(dá)量。第九方面,本發(fā)明提供的生物標(biāo)記物組合在制備預(yù)測乳腺癌試劑、乳腺癌復(fù)發(fā)檢測試劑或乳腺癌治療用藥評估試劑中的應(yīng)用。本發(fā)明的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:在細(xì)胞分裂過程中,隨著DNA分子的不斷復(fù)制,端粒的長度不斷縮小,當(dāng)端??s小至幾近沒有時(shí),細(xì)胞會立即激活凋亡機(jī)制,細(xì)胞走向凋亡;而僅存在于造血細(xì)胞、干細(xì)胞、生殖細(xì)胞以及癌細(xì)胞中的端粒酶能夠延長端粒的長度,使得細(xì)胞不會因端粒的縮短而凋亡,因此端粒與細(xì)胞增殖有關(guān)。癌細(xì)胞中端粒酶的活性比造血細(xì)胞等正常細(xì)胞中端粒酶的活性大,因而癌細(xì)胞中端粒的延長長度大于造血細(xì)胞等正常細(xì)胞中端粒的延長長度,繼而癌細(xì)胞的細(xì)胞增殖速度較快。在本發(fā)明提供的用于預(yù)測乳腺癌的生物標(biāo)記物組合、試劑盒中,引物設(shè)計(jì)基因選自與癌細(xì)胞增殖相關(guān)的端?;颍绕溥x自在乳腺癌組織和正常組織中甲基化率差異最為顯著的四種端?;騌AD50、RTEL、TERC和TRF1。分別根據(jù)四種端?;虻膯幼訁^(qū)設(shè)計(jì)目標(biāo)基因的甲基化引物,形成甲基化引物組合,用以檢測目的基因啟動子區(qū)的甲基化狀態(tài)和甲基化率;分別根據(jù)四種端?;虻木幋a區(qū)設(shè)計(jì)目標(biāo)基因的qPCR引物,形成qPCR引物組合,檢測目的基因的表達(dá)量水平。由于本發(fā)明提供的生物標(biāo)記物組合是根據(jù)在乳腺癌組織和正常組織中甲基化率差異最為顯著的端?;蚨O(shè)計(jì),因而在檢測樣本是否為乳腺癌時(shí),生物標(biāo)記物組合能夠特異性的捕獲和擴(kuò)增檢測樣本中的特定DNA片段,使得檢測靈敏度提高,而且還具有較好的抗噪性、靈活性和準(zhǔn)確度,且重復(fù)性好,能夠應(yīng)用于乳腺癌的早期預(yù)測、治療用藥評估檢測和預(yù)后復(fù)發(fā)檢測等。本發(fā)明提供的用于預(yù)測乳腺癌的方法操作快速、方法簡便,具有較好的可行性與預(yù)測效果。應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本發(fā)明。附圖說明此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本發(fā)明的實(shí)施例,并與說明書一起用于解釋本發(fā)明的原理。為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,對于本領(lǐng)域普通技術(shù)人員而言,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明實(shí)施例提供的預(yù)測乳腺癌腫瘤組織的ROC曲線(receiveroperatingcharacteristiccurve,受試者工作特征曲線)圖。具體實(shí)施方式這里將詳細(xì)地對示例性實(shí)施例進(jìn)行說明,其示例表示在附圖中。下面的描述涉及附圖時(shí),除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本發(fā)明相一致的所有實(shí)施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本發(fā)明的一些方面相一致的裝置和方法的例子。端粒是存在于真核細(xì)胞線狀染色體末端具有高度重復(fù)的TTAGGG序列的一小段DNA-蛋白質(zhì)復(fù)合體,具有保持染色體完整性和控制細(xì)胞分離周期的特性。端粒存在于任何能夠提取出的人類DNA樣本中,每次細(xì)胞分裂時(shí),由于端?;蛟诩?xì)胞分裂時(shí)不能完全復(fù)制,因而每條染色體的端粒長度會逐漸變短。當(dāng)端粒縮小至幾近沒有時(shí),細(xì)胞會立即激活凋亡機(jī)制,細(xì)胞走向凋亡。而僅存在于造血細(xì)胞、干細(xì)胞、生殖細(xì)胞以及癌細(xì)胞中的端粒酶能夠延長端粒的長度,使得細(xì)胞不會因端粒的縮短而凋亡,因此端粒與細(xì)胞增殖有關(guān)。研究表明,端粒酶的激活是腫瘤發(fā)生的基本步驟,端粒酶等相關(guān)蛋白的持續(xù)表達(dá)能夠使得腫瘤細(xì)胞獲得無限繁殖的能力,且癌細(xì)胞中端粒酶的活性比造血細(xì)胞等正常細(xì)胞中端粒酶的活性大,因而癌細(xì)胞中端粒的延長長度大于造血細(xì)胞等正常細(xì)胞中端粒的延長長度,繼而癌細(xì)胞的細(xì)胞增殖速度較快,因此,端粒在癌癥的發(fā)生發(fā)展中具有重要的作用。DNA甲基化檢測技術(shù)具有損傷小、敏感度高的特性,且DNA的甲基化狀態(tài)的改變通常出現(xiàn)在癌變之前,因而可通過基因中DNA的甲基化水平或甲基化率衡量正常細(xì)胞是否發(fā)生癌變。在本發(fā)明實(shí)施例提供的生物標(biāo)記物、試劑盒及甲基化測試方法中所涉及的序列如表1所示。表1:序列在本發(fā)明實(shí)施例提供的生物標(biāo)記物中,選取與乳腺癌相關(guān)的端?;蛟O(shè)計(jì)引物。在選擇端粒基因時(shí),選取在乳腺癌組織和正常組織中甲基化率差異最為顯著的四種端粒基因RAD50、RTEL、TERC和TRF1作為引物設(shè)計(jì)的基礎(chǔ)基因。具體地,分別根據(jù)端粒基因RAD50、RTEL、TERC和TRF1的啟動子區(qū)設(shè)計(jì)甲基化引物,形成甲基化引物組合,用以檢測目的基因啟動子區(qū)的甲基化狀態(tài)和甲基化率。根據(jù)四種端粒基因RAD50、RTEL、TERC和TRF1設(shè)計(jì)的甲基化引物序列請參考表2。表2:甲基化引物序列編號基因名稱正向引物(5'-3')反向引物(5'-3')1RAD50SEQ1SEQ22RTELSEQ3SEQ43TERCSEQ5SEQ64TRF1SEQ7SEQ8本發(fā)明實(shí)施例提供的四組甲基化引物以及四組甲基化引物組成的甲基化引物組合中的各組特異性擴(kuò)增引物序列均能夠特異性的地捕獲待測樣本中的特定DNA片段,即目的基因,并通過PCR反應(yīng)(PolymeraseChainReaction,聚合酶鏈反應(yīng))擴(kuò)增目的基因,進(jìn)而得出目的基因的甲基化水平。本發(fā)明實(shí)施例還提供一種用于預(yù)測乳腺癌的試劑盒,該試劑盒包括第一輪PCR擴(kuò)增試劑和第二輪PCR擴(kuò)增試劑。第一輪PCR擴(kuò)增試劑包括緩沖溶液、亞硫酸鹽、dNTP(deoxy-ribonucleosidetriphosphate,脫氧核糖核苷三磷酸)、酶混合液和第一輪靶向PCR擴(kuò)增引物。第二輪PCR擴(kuò)增試劑包括緩沖溶液、dNTP、酶混合液和第二輪PCR擴(kuò)增引物?;谕景l(fā)明實(shí)施例提供的生物標(biāo)記物組合相同的原因,試劑盒能夠檢測出目的基因的甲基化水平。進(jìn)一步,第一輪靶向PCR擴(kuò)增引物包括如表2所示的甲基化引物或甲基化引物組合。每個(gè)正向引物的5'端添加序列SEQ19,每個(gè)反向引物的5'端添加序列SEQ20。第二輪PCR擴(kuò)增引物包括上游通用測序引物序列P1和下游帶條形碼的測序引物序列Index1-6。具體地,亞硫酸鹽用于處理待測樣本中提取出的基因組DNA,以使基因組DNA中的胞嘧啶(C)轉(zhuǎn)變?yōu)槟蜞奏?U),而已甲基化的胞嘧啶不受影響,進(jìn)而便于得知基因組DNA中的甲基化狀態(tài)和甲基化率。在本發(fā)明實(shí)施例中,緩沖溶液為TE緩沖液用于溶解核酸,能夠穩(wěn)定和儲存DNA和RNA。反應(yīng)預(yù)混液為PCR反應(yīng)體系的基礎(chǔ)液,酶混合液包括DNA聚合酶和MgCl2(氯化鎂)等試劑。每對甲基化引物中的正向引物和反向引物均包括特異性擴(kuò)增序列和與特異性擴(kuò)增序列5'端連接的測序接頭序列,而特異性擴(kuò)增序列如表2所示,測序接頭序列則為正向測序Tag序列和反向測序Tag序列,其中,正向測序Tag序列和反向測序Tag序列是測序的必要前置步驟。正向測序Tag序列的具體序列為表1中的SEQ19所示序列,反向測序Tag序列的具體序列為表1中的SEQ20所示序列。上游通用測序引物序列和下游帶條形碼的測序引物序列用于擴(kuò)增并標(biāo)記不同樣本中提取的DNA。上游通用測序引物序列如表1中P1所示,下游帶條形碼的測序引物序列如表1中Index1-6所示。本發(fā)明實(shí)施例還提供一種用于檢測DNA樣品中DNA片段的目標(biāo)基因位置的甲基化率的方法,該方法包括:S101:DNA樣本經(jīng)亞硫酸鹽處理后采用甲基化引物組合進(jìn)行靶向PCR擴(kuò)增,得到包含測序Tag序列的靶向PCR擴(kuò)增產(chǎn)物。采用DNA提取試劑從待測人體的乳腺組織樣本中提取DNA樣本,將DNA樣本通過亞硫酸鹽處理,以使DNA中的未甲基化的胞嘧啶轉(zhuǎn)變?yōu)槟蜞奏?。亞硫酸鹽處理后的DNA樣本使用分光光度計(jì)定量,以保證有足夠的DNA樣本參與到下一步反應(yīng)中。在本發(fā)明實(shí)施例中,DNA提取試劑可以為TIANampGenomicDNAKit。定量后的DNA樣本在甲基化引物組合的作用下發(fā)生靶向PCR擴(kuò)增,即發(fā)生第一輪PCR擴(kuò)增反應(yīng),以通過特異性的甲基化引物捕獲DNA樣本中的特定DNA片段,即捕獲目的基因,完成第一輪PCR擴(kuò)增。第一輪PCR擴(kuò)增在捕獲的目的基因的同時(shí),擴(kuò)增產(chǎn)物的兩端連接有如表1中SEQ19和SEQ20所示的測序Tag序列。靶向PCR擴(kuò)增的擴(kuò)增條件為:95℃保持10分鐘,95℃變性保持15秒,58℃退火保持30秒,72℃延伸保持60秒,共40個(gè)循環(huán)。第一輪PCR擴(kuò)增后得到的靶向PCR擴(kuò)增產(chǎn)物采用TE緩沖液稀釋100倍,進(jìn)而便于穩(wěn)定和儲存DNA。S102:向所述包含測序Tag序列的靶向PCR擴(kuò)增產(chǎn)物中插入上游通用測序引物和下游帶條形碼的測序引物,以區(qū)別不同樣本的靶向PCR擴(kuò)增產(chǎn)物;其中,相同樣本的所述靶向PCR擴(kuò)增產(chǎn)物插入上游通用測序引物和條形碼相同的所述下游帶條形碼的測序引物,不同樣本的所述靶向PCR擴(kuò)增產(chǎn)物插入上游通用測序引物和條形碼不同的所述下游帶條形碼的測序引物。根據(jù)不同樣本的靶向PCR擴(kuò)增產(chǎn)物添加上游通用測序引物和條形碼不同的下游帶條形碼的測序引物。由于下游條形碼不同的帶條形碼的測序引物不同,所有的引物形成引物混合物。上游通用測序引物的序列如表1中P1所示,下游帶條形碼的測序引物的序列如表1中Index1-6所示。在本發(fā)明實(shí)施例中,上游通用測序引物和下游帶條形碼的測序引物的濃度均為2μM/L。7μl的預(yù)混液、1μl已插入測序Tag序列的靶向PCR擴(kuò)增產(chǎn)物以及2μl第二輪PCR引物混合液構(gòu)成PCR擴(kuò)增的反應(yīng)體系。S103:所述反應(yīng)體系分別PCR擴(kuò)增,得到不同樣本的PCR擴(kuò)增產(chǎn)物。不同樣本的反應(yīng)體系分別PCR擴(kuò)增,得到不同樣本的PCR擴(kuò)增產(chǎn)物。PCR擴(kuò)增的擴(kuò)增條件為:95℃保持10分鐘,95℃變性保持15秒,60℃退火保持30秒,72℃延伸保持60秒,共15個(gè)循環(huán),循環(huán)結(jié)束后在72℃下延伸反應(yīng)3分鐘。S104:將不同的所述PCR擴(kuò)增產(chǎn)物等比例混合構(gòu)成擴(kuò)增子文庫;將不同樣本的PCR擴(kuò)增產(chǎn)物按照1:1:…:1的等比例混合,以保證各樣本的數(shù)據(jù)是均一的。等比例混合后的PCR擴(kuò)增產(chǎn)物構(gòu)成擴(kuò)增子文庫。S105:所述擴(kuò)增子文庫經(jīng)純化、定量和質(zhì)控后得到甲基化測序文庫。擴(kuò)增子文庫通過AgencourtAMPureXPsystem純化處理,以去除多余的引物和非特異性擴(kuò)增產(chǎn)物。通過芯片生物分析儀檢測純化處理后的擴(kuò)增子文庫中的擴(kuò)增產(chǎn)物片段的大小,以避免影響最后的測序數(shù)據(jù)的質(zhì)量。進(jìn)一步,擴(kuò)增子文庫通過dsDNAHSAssayKit進(jìn)行精確定量和質(zhì)控,形成甲基化測序文庫。S106:對所述甲基化測序文庫雙端測序、樣本拆分和甲基化信息分析,得到各樣本DNA中目的基因各CpG位點(diǎn)的甲基化狀態(tài)和甲基化率。甲基化測序文庫采用MiSeqReagentKitv2500cycles試劑盒在MiSeq測序儀上完成雙端2*250bp的測序,以獲得更多的測序數(shù)據(jù),減少后續(xù)的分析錯(cuò)誤,其中,測序數(shù)據(jù)包括甲基化數(shù)據(jù)。雙端測序結(jié)束后,將測序數(shù)據(jù)按照樣本條形碼的不同拆分為不同的樣本數(shù)據(jù),并使用Bismark軟件將多個(gè)不同樣本的測序數(shù)據(jù)與人類參考基因組序列對比,即可得知各樣本每個(gè)基因上單個(gè)CpG位點(diǎn)的甲基化率。計(jì)算每個(gè)基因上CpG位點(diǎn)的甲基化率的算術(shù)平均值,得到各樣本DNA中目的基因的甲基化率。Logistic回歸分析法是一種研究二分類觀察結(jié)果和一些影響因素之間關(guān)系的多變量分析方法。根據(jù)Logistic回歸分析法建立Logistic回歸模型,Logistic回歸模型的預(yù)測值在0-1之間,Logistic回歸模型默認(rèn)的判別值為0.5,即≥0.5或<0.5。在疾病研究過程中,通過Logistic回歸分析法能夠分析出疾病和各危險(xiǎn)因素之間的定量關(guān)系。在本發(fā)明實(shí)施例中,通過Logistic回歸分析法建立Logistic回歸模型,以從各樣本DNA中目的基因的甲基化率分析出樣本是否為乳腺癌樣本。同樣的,在本發(fā)明實(shí)施例中,預(yù)測值的判別為Logistic回歸模型默認(rèn)的判別值。當(dāng)預(yù)測值大于或等于0.5時(shí),樣本判定為乳腺癌樣本。當(dāng)預(yù)測值小于0.5時(shí),樣本判定為正常乳腺組織。本發(fā)明實(shí)施例還提供了另一組生物標(biāo)記物組合,該生物標(biāo)記物組合中的分別根據(jù)端?;騌AD50、RTEL、TERC和/或TRF1的編碼區(qū)設(shè)計(jì)為qPCR(QuantitativePolymeraseChainReaction,定量聚合酶鏈反應(yīng))引物,四組qPCR引物單獨(dú)或組合形成qPCR引物組合。qPCR引物組合以RNA(RibonucleicAcid,核糖核酸)為基礎(chǔ),能夠檢測出目的基因的表達(dá)量水平。GAPDH基因被稱為管家基因,幾乎在所有組織中都高水平表達(dá),且在同種細(xì)胞或者組織中的蛋白質(zhì)表達(dá)量一般是恒定的,因而被廣泛用作基因表達(dá)量試驗(yàn)的標(biāo)準(zhǔn)化內(nèi)參。在本發(fā)明實(shí)施例中,同樣采用GAPDH基因作為標(biāo)準(zhǔn)化內(nèi)參。根據(jù)端?;騌AD50、RTEL、TERC和TRF1設(shè)計(jì)的qPCR引物的序列以及GAPDH基因的序列請參考表3。表3:qPCR引物序列及GAPDH基因序列編號基因名稱正向引物(5'-3')反向引物(5'-3')1RAD50SEQ9SEQ102RTELSEQ11SEQ123TERCSEQ13SEQ144TRF1SEQ15SEQ165GAPDHSEQ17SEQ18本發(fā)明實(shí)施例還提供一種用于預(yù)測乳腺癌的試劑盒,該試劑盒包括如表3所示的qPCR引物組合?;谕景l(fā)明實(shí)施例提供的生物標(biāo)記物組合相同的原因,該試劑盒能夠檢測出目的基因的表達(dá)量水平。進(jìn)一步,試劑盒還包括逆轉(zhuǎn)錄酶、去核酸酶水和PCR預(yù)混液。其中,逆轉(zhuǎn)錄酶用于將所有的RNA逆轉(zhuǎn)錄為cDNA(complementarydeoxyribonucleicacid,互補(bǔ)脫氧核糖核酸),以便于qPCR擴(kuò)增反應(yīng)。去核酸酶水(Nuclease-freeWater)能夠避免其他核酸污染本發(fā)明實(shí)施例中cDNA,影響測試結(jié)果。PCR預(yù)混液為PCR反應(yīng)體系的基礎(chǔ)液,在本發(fā)明實(shí)施例中,PCR預(yù)混液選用5μl2xSYBRGreenPCRmastermix。本發(fā)明實(shí)施例還提供一種用于檢測RNA樣品中RNA片段的目標(biāo)基因位置的表達(dá)量水平的方法,該方法包括:S201:樣本的總RNA逆轉(zhuǎn)錄為cDNA。提取組織樣本中的總RNA,將總RNA使用逆轉(zhuǎn)錄酶逆轉(zhuǎn)錄為cDNA。S202:所述cDNA、參考基因、qPCR引物組合、去核酸酶水和PCR預(yù)混液構(gòu)成反應(yīng)體系。2μl的cDNA、1μl參考基因、qPCR引物組合、2μl去核酸酶水和5μlPCR預(yù)混液構(gòu)成反應(yīng)體系,其中,qPCR引物組合中每組qPCR引物的用量為1μl,濃度為2μΜ/L。S203:所述反應(yīng)體系qPCR擴(kuò)增,得到qPCR擴(kuò)增產(chǎn)物,所述qPCR擴(kuò)增產(chǎn)物通過測序系統(tǒng)檢測得到所述參考基因的循環(huán)閾值及所述cDNA中目的基因的循環(huán)閾值;反應(yīng)體系進(jìn)行qPCR擴(kuò)增,得到qPCR擴(kuò)增產(chǎn)物。其中,qPCR擴(kuò)增的擴(kuò)增條件為:95℃保持10分鐘,95℃變性保持15秒,60℃退火保持30秒,72℃延伸保持60秒,共40個(gè)循環(huán)。反應(yīng)體系在qPCR擴(kuò)增反應(yīng)的過程中能夠得出熔解曲線(MeltingCurveAnalysis),通過熔解曲線分析qPCR擴(kuò)增產(chǎn)物的純度。另外,通過測序系統(tǒng)檢測能夠得知參考基因的循環(huán)閾值(Ct,Thresholdcycle)和cDNA中目的基因的循環(huán)閾值。S204:根據(jù)所述參考基因的循環(huán)閾值及所述cDNA中目的基因的循環(huán)閾值確定所述目的基因表達(dá)量的平均循環(huán)閾值。同一組織樣本平行測試三次,計(jì)算目的基因三次Ct值的算術(shù)平均值以及參考基因三次Ct值的算術(shù)平均值。將目的基因的Ct值算術(shù)平均值減去參考基因的Ct值算術(shù)平均值能夠確定目的基因表達(dá)量的平均循環(huán)閾值(dCt,deltavalueofCyclethreshold)。在本發(fā)明實(shí)施例中,確定目的基因表達(dá)量后,同樣通過Logistic回歸分析法判定樣本是否為乳腺癌樣本。預(yù)測值的判別為Logistic回歸模型默認(rèn)的判別值。本發(fā)明實(shí)施例還提供一組生物標(biāo)記物組合,該生物標(biāo)記物包括甲基化引物組合和qPCR引物組合,甲基化引物組合和qPCR引物組合的具體引物序列,此處不再贅述。由于本發(fā)明實(shí)施例提供的生物標(biāo)記物組合是根據(jù)在乳腺癌組織和正常組織中甲基化率差異最為顯著的端粒基因而設(shè)計(jì),因而在檢測樣本是否為乳腺癌時(shí),生物標(biāo)記物組合能夠特異性的捕獲和擴(kuò)增檢測樣本中的特定DNA片段,使得檢測靈敏度提高,而且還具有較好的抗噪性、靈活性和準(zhǔn)確度,且重復(fù)性好,能夠應(yīng)用于乳腺癌的早期預(yù)測、治療用藥評估檢測和預(yù)后復(fù)發(fā)檢測等。本發(fā)明實(shí)施例還提供一種用于預(yù)測乳腺癌的試劑盒,該試劑盒包括甲基化引物組合和qPCR引物組合?;谕景l(fā)明實(shí)施例提供的生物標(biāo)記物組合相同的原因,試劑盒能夠同時(shí)檢測出目的基因的甲基化水平和目的基因表達(dá)量水平。進(jìn)一步,根據(jù)本發(fā)明實(shí)施例提供的包含甲基化引物組合的用于預(yù)測乳腺癌的試劑盒和包含qPCR引物組合的用于預(yù)測乳腺癌的試劑盒,本發(fā)明實(shí)施例提供的試劑盒還包括亞硫酸鹽、TE緩沖液、反應(yīng)預(yù)混液、第一輪PCR引物、第二輪PCR引物、逆轉(zhuǎn)錄酶、去核酸酶水和PCR預(yù)混液。基于本發(fā)明實(shí)施例提供的用于檢測DNA樣品中DNA片段的目標(biāo)基因位置的甲基化率的方法以及用于檢測RNA樣品中RNA片段的目標(biāo)基因位置的表達(dá)量水平的方法,本發(fā)明實(shí)施例提供一種用于檢測核酸樣品中目標(biāo)基因位置的目標(biāo)基因甲基化率和目標(biāo)基因表達(dá)量的方法。在本發(fā)明實(shí)施例提供的方法中,包括用于檢測DNA樣品中DNA片段的目標(biāo)基因位置的甲基化率的方法以及用于檢測RNA樣品中RNA片段的目標(biāo)基因位置的表達(dá)量水平的方法,以能夠同時(shí)檢測目標(biāo)基因的甲基化率以及目標(biāo)基因的表達(dá)量水平,進(jìn)而便于分析樣本是否為乳腺癌樣本。本發(fā)明實(shí)施例提供的包括甲基化引物組合的生物標(biāo)記物組合、包括qPCR引物組合的生物標(biāo)記物組合以及同時(shí)包括甲基化引物組合和qPCR引物組合的生物標(biāo)記物組合均能夠用于制備預(yù)測乳腺癌的試劑,以便于預(yù)測是組織樣本否為乳腺癌樣本。進(jìn)一步,上述三種生物標(biāo)記物組合還能夠用于制備乳腺癌治療試劑,以便于在乳腺癌治療的過程中檢測分析乳腺癌的治療療效以及治療進(jìn)程。更進(jìn)一步,上述三種生物標(biāo)記物組合還能夠用于制備乳腺癌復(fù)發(fā)檢測試劑,以便于在乳腺癌治療后期監(jiān)測乳腺癌是否復(fù)發(fā)。本發(fā)明實(shí)施例提供的包括甲基化引物組合的試劑盒、包括qPCR引物組合的試劑盒以及同時(shí)包括甲基化引物組合和qPCR引物組合的試劑盒均能夠用于制備預(yù)測乳腺癌的試劑,以便于預(yù)測是組織樣本否為乳腺癌樣本。進(jìn)一步,上述三種試劑盒還能夠用于制備乳腺癌治療試劑,以便于在乳腺癌治療的過程中檢測分析乳腺癌的治療療效以及治療進(jìn)程。更進(jìn)一步,上述三種試劑盒還能夠用于制備乳腺癌復(fù)發(fā)檢測試劑,以便于在乳腺癌治療后期監(jiān)測乳腺癌是否復(fù)發(fā)。為評估本發(fā)明實(shí)施例提供的三種生物標(biāo)記物組合在制備預(yù)測乳腺癌的試劑中所起的預(yù)測效果,結(jié)合Logistic回歸分析法確定的回歸模型,通過敏感性(Sensitivity)、特異性(Specificity)、準(zhǔn)確性(Accuracy)和ROC(ReceiverOperatingCharacteristicCurve,受試者工作特征曲線)曲線的AUC(AreaUnderCurve)值四種評估指標(biāo)評定三種生物標(biāo)記物組合的預(yù)測效果。敏感性的計(jì)算公式為Sensitivity=TP/(TP+FN),特異性的計(jì)算公式為Specificity=TN/(TN+FP),準(zhǔn)確性的計(jì)算公式為Accuracy=(TP+TN)/(TP+FP+TN+FN),其中,TP-truepositive;FP-falsepositive;TN-truenegative;FN-falsenegative。ROC曲線由橫軸的1-特異性和縱軸的敏感性組成,能夠反映兩個(gè)模型數(shù)值在取不同的分類閾值時(shí)的相對關(guān)系。ROC曲線能夠用于評估不同生物標(biāo)記物組的預(yù)測性能,用ROC曲線下的面積AUC作為測量值來評估基因集合預(yù)測性能的優(yōu)劣。在評定三種生物標(biāo)記物組合的預(yù)測效果時(shí),四種評估指標(biāo)的指標(biāo)值均在[0,1]之間,指標(biāo)值越高時(shí),說明根據(jù)生物標(biāo)記物組合確定的回歸模型的模型預(yù)測效果越好。下面結(jié)合具體實(shí)施例說明本發(fā)明實(shí)施例提供的三種生物標(biāo)記物組合的性能評估以及預(yù)測乳腺癌的預(yù)測效果。選取114例未接受化療或放療的乳腺癌病人的腫瘤組織以及乳腺正常組織,其中,腫瘤組織和正常組織各占一半。對114例組織樣本同時(shí)進(jìn)行目的基因的甲基化檢測和表達(dá)量檢測。同時(shí)包括甲基化引物組合和qPCR引物組合的生物標(biāo)記物組合所建立的模型標(biāo)記為1,包含甲基化引物組合的生物標(biāo)記物組合所建立的模型標(biāo)記為2,包括qPCR引物組合的生物標(biāo)記物組合所建立的模型標(biāo)記為3。在甲基化檢測和表達(dá)量檢測過程中,通過留一交叉驗(yàn)證法(Leaveoneoutcrossvalidation,LOOCV)計(jì)算出回歸模型的CVerror(CrossValidationPredictionError,交叉驗(yàn)證預(yù)測誤差)。CVerror值越低,則表示回歸模型的模擬越精確,且能夠排除過擬合現(xiàn)象。目的基因Logistic回歸模型的性能評估的結(jié)果值請參考表4,性能評估結(jié)果請參考附圖1。在甲基化檢測階段,各樣本之間具有較好的均一性,且目的基因的測序深度滿足分析所需要的319X的平均測序深度。經(jīng)過甲基化測序,87%的測序數(shù)據(jù)對比到PCR擴(kuò)增產(chǎn)物的序列位置。大于97%的樣本測序數(shù)據(jù)落在平均測序讀數(shù)的兩倍范圍以內(nèi)。根據(jù)4組甲基化引物得出的4個(gè)目的基因在腫瘤組織中的平均甲基化率顯著高于正常組織,P值為3.54E-35。在表達(dá)量檢測階段,目的基因在腫瘤組織中的dCt值顯著高于正常組織,即腫瘤組織中的目的基因表達(dá)低于正常組織中的目的基因表達(dá)。相對于端?;騌AD50、RTEL、TERC和TRF1設(shè)計(jì)的甲基化引物,P值經(jīng)Holm法矯正后的數(shù)值分別為1.07E-13,1.03E-5,2.38E-14,3.14E-13。上述結(jié)果表明,根據(jù)端?;騌AD50、RTEL、TERC和TRF1設(shè)計(jì)的甲基化引物具有很好的腫瘤特異性。表4:目的基因Logistic回歸模型的性能評估的結(jié)果值模型CVerror敏感性特異性準(zhǔn)確性AUC10.1100.8320.890.8610.94720.1370.7940.8620.8290.89730.1700.7380.7610.7500.846由表4可知,回歸模型1-3的敏感性、特異性、準(zhǔn)確性和AUC四個(gè)指標(biāo)的數(shù)值均高于0.7,而特異性越高假陽性越低,敏感性越高假陰性越低,由此說明,單獨(dú)采用甲基化引物組合、qPCR引物組合以及組合使用甲基化引物組合和qPCR引物組合均能夠很好的鑒別出乳腺癌樣本。由附圖1可知,曲線的隨機(jī)波動程度較低,從而體現(xiàn)出重復(fù)性和抗噪性較好。在回歸模型1-3中,回歸模型1在敏感性、特異性、準(zhǔn)確性和AUC四個(gè)指標(biāo)的數(shù)值均最高,而CVerror值最低,僅為0.110。由此說明同時(shí)包括甲基化引物組合和qPCR引物組合的生物標(biāo)記物組合更加能夠準(zhǔn)確的預(yù)測樣本是否為乳腺癌樣本。本發(fā)明實(shí)施例提供的生物標(biāo)記組合由于根據(jù)在乳腺癌組織和正常組織中甲基化率差異最為顯著的端?;蚨O(shè)計(jì),因而在檢測樣本是否為乳腺癌時(shí),生物標(biāo)記物組合能夠特異性的捕獲和擴(kuò)增檢測樣本中的特定DNA片段,使得檢測靈敏度提高,而且還具有較好的抗噪性、靈活性和準(zhǔn)確度,且重復(fù)性好,能夠應(yīng)用于乳腺癌的早期預(yù)測、治療用藥評估檢測和預(yù)后復(fù)發(fā)檢測等。本發(fā)明提供的用于預(yù)測乳腺癌的方法操作快速、方法簡便,具有較好的可行性與預(yù)測效果,有潛力運(yùn)用于乳腺癌風(fēng)險(xiǎn)評估等領(lǐng)域,具有較大的臨床價(jià)值和潛在意義。本領(lǐng)域技術(shù)人員在考慮說明書及實(shí)踐這里發(fā)明的公開后,將容易想到本發(fā)明的其它實(shí)施方案。本申請旨在涵蓋本發(fā)明的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本發(fā)明的一般性原理并包括本發(fā)明未公開的本
技術(shù)領(lǐng)域:
中的公知常識或慣用技術(shù)手段。說明書和實(shí)施例僅被視為示例性的,本發(fā)明的真正范圍和精神由下面的權(quán)利要求指出。應(yīng)當(dāng)理解的是,諸如“第一”和“第二”等之類的關(guān)系術(shù)語僅僅用來將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來,而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。本發(fā)明并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本發(fā)明的范圍僅由所附的權(quán)利要求來限制。SEQUENCELISTING<110>湖南圣維基因科技有限公司<120>用于預(yù)測乳腺癌的生物標(biāo)記物組合、試劑盒及使用方法<130>2016<160>18<170>PatentInversion3.3<210>1<211>29<212>DNA<213>人工序列<400>1ttatatgttatgtgattattggaaattat29<210>2<211>25<212>DNA<213>人工序列<400>2ttcccaaaacttaatcctaaaactc25<210>3<211>21<212>DNA<213>人工序列<400>3gggttgggtgttagtgagtgt21<210>4<211>20<212>DNA<213>人工序列<400>4caactcccataccccaaaaa20<210>5<211>27<212>DNA<213>人工序列<400>5aaaatttgtagagtaggaattaagttg27<210>6<211>22<212>DNA<213>人工序列<400>6ccccaaacctaactaactaaac22<210>7<211>24<212>DNA<213>人工序列<400>7tagtagaataggaattttgggagt24<210>8<211>20<212>DNA<213>人工序列<400>8aatacaaccttaactaaaac20<210>9<211>19<212>DNA<213>人工序列<400>9tggatatgcgaggacgatg19<210>10<211>19<212>DNA<213>人工序列<400>10tgttggctcatccaaggca19<210>11<211>20<212>DNA<213>人工序列<400>11catcgatgctgttgagctgc20<210>12<211>20<212>DNA<213>人工序列<400>12ggatgatctggtccagcgag20<210>13<211>20<212>DNA<213>人工序列<400>13catgtgtgagccgagtcctg20<210>14<211>20<212>DNA<213>人工序列<400>14gaagaggaacggagcgagtc20<210>15<211>22<212>DNA<213>人工序列<400>15gtctgcggtaactgaatcctca22<210>16<211>20<212>DNA<213>人工序列<400>16ttgttgctgggttccatgtt20<210>17<211>20<212>DNA<213>人工序列<400>17cctctccccagccaaagaag20<210>18<211>20<212>DNA<213>人工序列<400>18tgaccctttttggacttcag20<210>19<211>33<212>DNA<213>人工序列<400>19tcgtcggcagcgtcagatgtgtataagagacag33<210>20<211>34<212>DNA<213>人工序列<400>20gtctcgtgggctcggagatgtgtataagagacag34<210>21<211>62<212>DNA<213>人工序列<400>21aatgatacggcgaccaccgagatctacactcgtcggcagcgtcagatgtgtataagagac60ag62<210>22<211>68<212>DNA<213>人工序列<400>22caagcagaagacggcatacgagatgtatcgtcgtgtctcgtgggctcggagatgtgtata60agagacag68<210>23<211>68<212>DNA<213>人工序列<400>23caagcagaagacggcatacgagatgtgtatgcgtgtctcgtgggctcggagatgtgtata60agagacag68<210>24<211>68<212>DNA<213>人工序列<400>24caagcagaagacggcatacgagattgctcgtagtgtctcgtgggctcggagatgtgtata60agagacag68<210>25<211>68<212>DNA<213>人工序列<400>25caagcagaagacggcatacgagatgtcgtcgtctgtctcgtgggctcggagatgtgtata60agagacag68<210>26<211>68<212>DNA<213>人工序列<400>26caagcagaagacggcatacgagatgtgcgtgtgtgtctcgtgggctcggagatgtgtata60agagacag68<210>27<211>68<212>DNA<213>人工序列<400>27caagcagaagacggcatacgagatgcgtcgtgtagtctcgtgggctcggagatgtgtata60agagacag68當(dāng)前第1頁1 2 3