一種同時(shí)完成基因位點(diǎn)、染色體及連鎖分析的方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及基因組序列分析領(lǐng)域和生物信息學(xué)領(lǐng)域,具體設(shè)及一種利用MALBAC擴(kuò) 增技術(shù)結(jié)合高通量測(cè)序,一步完成單細(xì)胞單基因疾病、染色體疾病及連鎖分析的方法。
【背景技術(shù)】
[0002] 遺傳疾病是指人體中的遺傳物質(zhì)(染色體或者線粒體DNA上的基因序列)發(fā)生改變 而引起的疾病,近年來遺傳病的發(fā)病率逐年增高。在我國(guó),每年有多達(dá)數(shù)萬例染色體異常的 患兒出生,染色體異常患兒至今仍無法治愈。而目前已經(jīng)發(fā)現(xiàn)的單基因遺傳疾病有7000多 種,其中已經(jīng)明確致病基因的有4000多種,雖然單基因遺傳病的單個(gè)病種發(fā)病率較低,但由 于其種類繁多,所W在出生活嬰中的總體發(fā)病率和人群中的總體患病率并不低,并且大部 分單基因遺傳病具有致死性、致殘性或致崎性,除少部分可W通過某些治療手段進(jìn)行校正 夕h大部分至今尚無有效的治療手段。解決上述問題的根本途徑就是進(jìn)行出生前或胚胎移 植前診斷,避免此類患兒的出生,因此,胚胎著床前遺傳診斷對(duì)預(yù)防單基因遺傳病及染色體 遺傳病的發(fā)生和傳遞具有重要的科學(xué)及社會(huì)意義。
[0003] 遺傳病的胚胎植入前遺傳學(xué)診斷(PGD)是生殖醫(yī)學(xué)重要內(nèi)容,可W阻斷在胚胎著 床前,避免患兒出生,從而避免和減少遺傳病的發(fā)生,減輕家庭和社會(huì)的經(jīng)濟(jì)負(fù)擔(dān)。目前,胚 胎著床前遺傳學(xué)診斷主要采用FISH和單細(xì)胞PCR技術(shù),W及近幾年應(yīng)用到臨床PGD的CGH array和SNP array技術(shù)。其中,應(yīng)用FISH進(jìn)行胚胎篩選受到探針的限制,不能同時(shí)檢測(cè)所有 染色體狀態(tài);單細(xì)胞固定易導(dǎo)致信號(hào)丟失,單細(xì)胞PCR技術(shù)易造成等位基因脫扣(ADO),從而 引起誤診;CGH array只能診斷染色體數(shù)目改變及大片段染色體結(jié)構(gòu)(非平衡易位,重復(fù)、缺 失),而SNP array雖能進(jìn)行所有CGH能診斷的染色體異常,分辨率較CGH提高,但不能同時(shí)完 成單基因遺傳病和染色體疾病的診斷??梢姡F(xiàn)有的胚胎植入前遺傳學(xué)診斷技術(shù)仍存在各 種不足,無法滿足實(shí)際需求,在使用和推廣上均受到一定的限制。
[0004] 此外,連鎖分析方法現(xiàn)有的主要是采用STR和SNP兩種遺傳標(biāo)記。多重巧光PCR技術(shù) 將多重PCR結(jié)合巧光探針檢測(cè)STR分型,由于STR連鎖標(biāo)記較少,應(yīng)用到具體案例中可能會(huì)沒 有可用STR位點(diǎn),所W進(jìn)行臨床檢測(cè)前需要做大量預(yù)實(shí)驗(yàn)工作,STR遺傳標(biāo)記大多距離致病 位點(diǎn)距離較遠(yuǎn),易發(fā)生染色體重組導(dǎo)致誤診,且檢測(cè)成本較高,故此技術(shù)無法進(jìn)行批量檢 測(cè)。而忍片和探針捕獲SNP的方法,與普通PCR捕獲SNP方法相比較,成本偏高,周期偏長(zhǎng)。
[0005] 現(xiàn)有技術(shù)無法通過一步檢測(cè)同時(shí)完成單基因遺傳病、染色體異常和連鎖分析Ξ 項(xiàng),而由少量細(xì)胞獲得的全基因組樣本,實(shí)驗(yàn)過程中分別進(jìn)行多種檢測(cè)容易出現(xiàn)等位基因 脫扣(ADO)、污染等現(xiàn)象,本領(lǐng)域急需一種能夠解決該問題的技術(shù)方案。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明的目的就是針對(duì)上述現(xiàn)有技術(shù)中的不足,提供一種同時(shí)完成基因位點(diǎn)、染 色體及連鎖分析的方法,利用MALBAC擴(kuò)增技術(shù)結(jié)合高通量測(cè)序,一步完成胚胎單基因遺傳 病、染色體疾病及連鎖分析等綜合性檢測(cè),適用范圍廣,避免了使用多方法、多步驟分別進(jìn) 行單基因遺傳病突變位點(diǎn)、染色體疾病和連鎖分析的檢測(cè)。本發(fā)明操作簡(jiǎn)單、工作周期短, 實(shí)踐可行性強(qiáng),尤其利用高通量測(cè)序方法,檢測(cè)和數(shù)據(jù)分析快速。
[0007] 為了實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案具體如下所示:
[0008] -種同時(shí)完成基因位點(diǎn)、染色體及連鎖分析的方法,包括W下各步驟:
[0009] (1)胚胎細(xì)胞樣本的獲得:通過單精子注射獲得受精卵,培養(yǎng)至囊胚期在外滋養(yǎng)層 細(xì)胞分離獲得包含3-10個(gè)細(xì)胞的樣本,其中胚胎細(xì)胞可W選自人或者其他哺乳動(dòng)物。
[0010] (2)全基因組擴(kuò)增:在樣本中加入裂解液放入PCR儀中進(jìn)行裂解、失活蛋白酶,對(duì)獲 得的細(xì)胞裂解樣本進(jìn)行全基因組擴(kuò)增,優(yōu)選采用多重退火環(huán)狀擴(kuò)增技術(shù)(MALBAC)實(shí)現(xiàn);具 體而言,在細(xì)胞裂解樣本中加入預(yù)擴(kuò)增混合液進(jìn)行第一輪線性擴(kuò)增,之后再加入擴(kuò)增混合 液進(jìn)行第二輪指數(shù)擴(kuò)增,將擴(kuò)增產(chǎn)物進(jìn)行純化;MLBA訝廣增后的產(chǎn)物在300-2000bp之間。
[0011] 其中,第一輪線性擴(kuò)增的條件為:
[0012] (1)90-98°C 反應(yīng) 90s-5min;
[0013] (2)15-25°C 反應(yīng) 30s-lmin;
[0014] (3)25-35°C 反應(yīng) 30s-lmin;
[0015] (4)35-45°C 反應(yīng) 20s-lmin;
[0016] (5)45-55°C 反應(yīng) 20s-lmin;
[0017] (6)55-65°C 反應(yīng) 20s-lmin;
[001 引(7)65-85°C 反應(yīng) 2min-6min;
[0019] (8)90-98°C 反應(yīng) 10-40S;
[0020] (9)45-65°C 反應(yīng) 5-20s;
[0021] (10)重復(fù)步驟(2)到步驟(9)5至20個(gè)循環(huán)。
[0022] 第二輪指數(shù)擴(kuò)增的條件為:
[0023] (1)90-98°C 反應(yīng) 10S-50S;
[0024] (2)90-98°C 反應(yīng) 10S-40S;
[00 巧](3)45-65°C 反應(yīng) 20S-45S;
[00%] (4)65-80°C 反應(yīng) 75s-5min;
[0027] (5)重復(fù)步驟(2)到步驟(4)10至30個(gè)循環(huán);
[00%] (6)將擴(kuò)增后的產(chǎn)物在0-5°C保存。
[0029] (3)目的基因突變位點(diǎn)擴(kuò)增:在完成引物設(shè)計(jì)、引物評(píng)估之后,將目的基因突變位 點(diǎn)進(jìn)行普通PCR擴(kuò)增獲得PCR產(chǎn)物,將同一樣本的PCR產(chǎn)物與步驟(2)中獲得的片段化的基因 組DNA按照1:(1-100)的質(zhì)量比混合。其中在進(jìn)行引物設(shè)計(jì)時(shí),引物長(zhǎng)度為20-2加 P,擴(kuò)增片 段大小根據(jù)測(cè)序用的reads來進(jìn)行調(diào)整設(shè)計(jì),單端的不能超過reads長(zhǎng)度,雙端的不能超過2 倍長(zhǎng)。
[0030] (4)MALBA訝廣增產(chǎn)物與目的基因突變位點(diǎn)進(jìn)行建庫。
[0031] (5)采用高通量測(cè)序平臺(tái),對(duì)樣本進(jìn)行測(cè)序;如果只進(jìn)行單基因致病位點(diǎn)和染色體 拷貝數(shù)變異(CNV)分析,每個(gè)標(biāo)本測(cè)序平均深度最低為基因組的0.1倍;如果要同時(shí)獲得SNP 連鎖信息,每個(gè)標(biāo)本需測(cè)序平均深度最低為基因組的2倍。
[0032] (6)數(shù)據(jù)分析
[0033] (6.1)將步驟(5)獲得的測(cè)序結(jié)果去掉接頭W及低質(zhì)量數(shù)據(jù),采用比對(duì)軟件比對(duì)到 參考基因組;
[0034] (6.2)下機(jī)的數(shù)據(jù)經(jīng)質(zhì)控后比對(duì)到參考序列上,統(tǒng)計(jì)位點(diǎn)的等位基因的分布及其 頻率,檢測(cè)目的基因位點(diǎn)突變信息;
[0035] (6.3)下機(jī)的數(shù)據(jù)經(jīng)質(zhì)控后比對(duì)到參考序列上,序列按照一定窗口進(jìn)行GC矯正,W 幾千例MLBA訝廣增的單細(xì)胞數(shù)據(jù)為數(shù)據(jù)庫進(jìn)行修正,最終檢測(cè)出染色體拷貝數(shù)變異(CNV);
[0036] (6.4)采用5^-單體型進(jìn)行連鎖分析:
[0037] (6.4.1)選擇SNP區(qū)域,界定在目的基因上下游1M范圍內(nèi);
[0038] (6.4.2)用軟件獲得目標(biāo)區(qū)域的SNP,所述軟件包括但不限于samtools mpileup, GATK,RreeBayes,化'5。日11 中的至少一種;
[0039] (6.4.3)SNP過濾:等位基因雜合度差異最低為10%,除去潛在錯(cuò)誤的SNP;
[0040] (6.4.4)篩選區(qū)分型SNP,并構(gòu)建父本和母本SNP-單體型:同一SNP位點(diǎn),在父本和 母本的4個(gè)等位基因堿基中,有1個(gè)堿基不同于其他3個(gè)即可區(qū)分;
[0041 ] (6.4.5)分析SNP-單體型:胚胎SNP-單體型有2個(gè),分別遺傳自父本和母本各1條, 根據(jù)區(qū)分型SNP和孟德爾遺傳原理,判斷其SNP-單體型具體哪個(gè)是父源遺傳,哪個(gè)是母源遺 傳;其中區(qū)分型SNP最低為10個(gè),若有3個(gè)W上SNP錯(cuò)誤,此胚胎SNP-單體型數(shù)據(jù)視為數(shù)據(jù)量 不足,難W進(jìn)行分析;
[0042] (6.4.6)結(jié)果分析:根據(jù)步驟(6.4.4)確定父本和母本SNP-單體型,區(qū)分出與致病 位點(diǎn)連鎖的單體型,將胚胎所在SNP的具體等位基因?qū)Ρ?,根?jù)孟德爾遺傳原理,判斷胚胎 是否攜帶致病基因位點(diǎn)。
[0043] 優(yōu)選地,所述步驟(2)中第一輪線性擴(kuò)增的條件為:
[0044] (1)94°C 反應(yīng) 3min;
[0045] (2)20°C 反應(yīng) 40s;
[0046] (3)30°C 反應(yīng) 40s;
[0047] (4)40°C 反應(yīng) 30s;
[004引(5)50°C 反應(yīng) 30s;
[0049] (6)60°C 反應(yīng) 30s;
[0050] (7)70。(3反應(yīng)4111111;
[0化1] (8)95°C 反應(yīng) 20s;
[0化2] (9)58°C 反應(yīng) 10s;
[0053] (10)重復(fù)步驟(2)到步驟(9)8個(gè)循環(huán)。
[0054] 優(yōu)選地,所述步驟(2)中第二輪指數(shù)擴(kuò)增的條件為:
[0化5] (1)94°C 反應(yīng) 30s;
[0化6] (2)94°C 反應(yīng) 20s;
[0化7] (3)58°C 反應(yīng) 30s;
[0化引(4)72°C 反應(yīng) 3min;
[0059] (5)重復(fù)步驟(2)到步驟(4)17個(gè)循環(huán);
[0060] (6