本發(fā)明屬于醫(yī)藥健康領(lǐng)域,具體地說,本發(fā)明涉及一種染色體非整倍體和1M以上拷貝數(shù)變異檢測方法及其應(yīng)用。
背景技術(shù):
:胚胎植入前遺傳學(xué)篩查(Pre-implantationGeneticScreening,PGS)是體外授精-胚胎移植(InVitroFertilization-embryoTransfer,IVF)這一生殖助孕過程中的一種輔助技術(shù)。該技術(shù)能夠減少因染色體數(shù)目或者結(jié)構(gòu)異常而導(dǎo)致的IVF失敗,提高受孕率。一些研究發(fā)現(xiàn),在體外受精形成的胚胎中,大約50%左右的胚胎存在染色體的異常,可導(dǎo)致早期胚胎丟失、自然流產(chǎn)和死產(chǎn),是限制IVF成功的重要原因之一。PGS是在人類輔助生殖技術(shù)的基礎(chǔ)上,對植入前的胚胎進行染色體非整倍體和拷貝數(shù)變異的檢測,選擇正常的胚胎進行植入,以期提高IVF成功率。隨著運用PGS技術(shù)獲得成功妊娠的病例在1995年被首次報道后,這項技術(shù)的使用逐漸增加。但是由于之前的技術(shù)成本高、通量低的特點,限制了PGS技術(shù)在臨床上的廣泛應(yīng)用。因此,為了降低成本、提高通量,本領(lǐng)域迫切需要開發(fā)新的染色體非整倍體和拷貝數(shù)變異的檢測技術(shù)。技術(shù)實現(xiàn)要素:本發(fā)明的目的在于提供一種染色體非整倍體和拷貝數(shù)變異檢測方法及其應(yīng)用。本發(fā)明的第一方面,提供了一種檢測染色體非整倍體和基因拷貝數(shù)變異的方法,所述方法包括步驟:(1)提供待測樣本,并對所述樣本進行全基因組測序獲得全基因組序列;(2)提供檢測流程參考文件:(2.1)生成窗口文件提供參考基因組,將參考基因組按照步驟(1)中測得序列的長度隨機打斷成模擬read(讀段)并將其重新比對到參考基因組上;其中,每個窗口含有n個read(讀段),相鄰窗口間的重合區(qū)域含有0.1n~0.4n個讀段;(2.2)提供全基因組校正基線文件(2.2.1)提供正常參考樣本,并對所述正常參考樣本進行全基因組測序;(2.2.2)將所述正常參考樣本的全基因組序列比對到所述參考基因組上,提取唯一比對的read,去掉其中比對位置相同的read,(2.2.3)根據(jù)(2.2.2)中比對read的坐標(biāo)信息,計算落入(2.1)中每個窗口內(nèi)的read數(shù)ri,j,對于一個樣本計算對應(yīng)窗口參考基因組上的GC含量,比對上序列的GC含量,相對序列數(shù)Ri,j=ri,j/M;其中,M是此樣本常染色體的所有窗口的平均read數(shù),ri,j為此窗口的read數(shù);其中,定義gs為比對上序列的GC含量,gr為對應(yīng)窗口參考基因組上的GC含量;對于gs和gr按x%的GC含量間隔計算在此范圍內(nèi)序列數(shù)的中位值則窗口i的矯正系數(shù)為則每個窗口矯正后的序列數(shù)累計全基因組常染色體的值除以總的窗口數(shù)得到矯正值M′,最終對于窗口i矯正后的序列數(shù)為針對每種性別的所有參考樣本取相同窗口的中位值做為最終基線文件內(nèi)每個窗口的參考值;(3)待測樣本分析(3.1)初始斷點查找逐個遍歷待測樣本全基因組序列中的窗口,選擇窗口相鄰的左右兩端等量的窗口數(shù)進行游程檢驗,得到每個窗口對應(yīng)的檢測P值;對所有P值進行排序去掉非顯著的窗口位置,得到初始斷點集合B={b1,b2,b3……};(3.2)更新P值對(3.1)中獲得的斷點,分別對相鄰斷點左右兩端區(qū)間內(nèi)的深度值進行二輪統(tǒng)計得到每個斷點對應(yīng)新的P值;(3.3)最終斷點查找在(3.2)斷點P值的基礎(chǔ)上,對于一特定斷點,分別于該特定斷點左右兩斷點區(qū)間進行統(tǒng)計檢驗,并在循環(huán)中刪除不顯著斷點;獲得每個斷點區(qū)間的P值和深度值的均值;(3.4)斷點過濾根據(jù)斷點P值顯著性判斷是否為真實斷點,根據(jù)深度值的大小判斷是缺失還是重復(fù);根據(jù)斷點區(qū)間大小判斷檢測精度;(3.5)結(jié)果報告根據(jù)變異區(qū)間坐標(biāo)給出染色體條帶信息、所屬基因類型、疾病類型等。在另一優(yōu)選例中,所述步驟(2)中,還包括步驟:(2.3)構(gòu)建數(shù)據(jù)質(zhì)控體系在比對完成后根據(jù)比對信息計算樣本唯一比對率、重復(fù)率、唯一比對read數(shù)目、錯配率、GC含量;根據(jù)數(shù)據(jù)分布特點,選用百分位數(shù)法估計正常值范圍;確定以上5個指標(biāo)在參考樣本中的波動范圍;(2.4)過濾已知假陽性信號從參考樣本的檢測結(jié)果中得到由于系統(tǒng)誤差導(dǎo)致的假陽性信號,作為檢測樣本的過濾庫;過濾掉與ENCODE計劃中列出(TheENCODEProjectConsortium2012)基因組上微衛(wèi)星的區(qū)域,端粒酶和著絲粒區(qū)域重合的窗口;去掉參考基因組上的窗口內(nèi)比對率低的窗口。在另一優(yōu)選例中,所述步驟(3)中,所述斷點P值為1e-10,所述深度值中設(shè)定缺失閾值為0.7、重復(fù)閾值為1.3,斷點區(qū)間大小為≥1M。在另一優(yōu)選例中,所述步驟(2.1)中,所述參考基因組為NCBI數(shù)據(jù)庫中的標(biāo)準人類參考基因組序列,例如可以為hg18,NCBIBuild36;hg19,NCBIBuild37。在另一優(yōu)選例中,所述步驟(2.1)中,n為50K-200K,優(yōu)選地n為100K,相鄰窗口間重合區(qū)域含有0.2n-0.3n個read。在另一優(yōu)選例中,所述步驟(2.2.3)中,x%為約0.1%-5%;優(yōu)選為0.5%-2%;更優(yōu)選為約1%。在另一優(yōu)選例中,所述步驟(3.5)中,選用大于1M的區(qū)間為最終的拷貝數(shù)變異區(qū)間,進行結(jié)果輸出。在另一優(yōu)選例中,所述方法用于大于1M的CNVs以及染色體非整倍體檢測。在另一優(yōu)選例中,所述方法中待測樣本為單細胞樣本,或多細胞樣本。在另一優(yōu)選例中,所述方法為非診斷目的。應(yīng)理解,在本發(fā)明范圍內(nèi)中,本發(fā)明的上述各技術(shù)特征和在下文(如實施例)中具體描述的各技術(shù)特征之間都可以互相組合,從而構(gòu)成新的或優(yōu)選的技術(shù)方案。限于篇幅,在此不再一一累述。附圖說明圖1顯示了GC含量矯正前后各個GC間隔內(nèi)深度波動分布(上:矯正前;下:矯正后)。圖2顯示了檢測原理示意圖。圖3顯示了Array-CGH簡單原理示意圖。圖4顯示了SNParray簡單原理示意圖。圖5顯示了基線文件建立流程。圖6顯示了單樣本檢測流程。圖7顯示了Sample1胚胎核型結(jié)果46,XY,del(17p11.2)(1.95M)。圖8顯示了Sample1胚胎WGA擴增效果和變異顯示:46,XY,del(17p11.2)(1.95M)。圖9顯示了Sample2胚胎核型結(jié)果47,XX,+21。圖10顯示了Sample2胚胎WGA擴增效果和變異顯示:47,XX,+21。圖11顯示了Sample3胚胎核型結(jié)果46,XX,del(1)(p36.33-p36.32)(1.54M)。圖12顯示了Sample3胚胎WGA擴增效果和變異顯示:46,XX,del(1)(p36.33-p36.32)(1.54M)。具體實施方式本發(fā)明人通過廣泛而深入的研究,獲得一種基于BGIseq-500測序儀的染色體非整倍體和拷貝數(shù)變異檢測方法及其應(yīng)用,實驗結(jié)果表明,使用本發(fā)明的方法可以簡單、快速、準確的對染色體非整倍體和拷貝數(shù)變異進行檢測。在描述本發(fā)明之前,應(yīng)當(dāng)理解本發(fā)明不限于所述的具體方法和實驗條件,因為這類方法和條件可以變動。還應(yīng)當(dāng)理解本文所用的術(shù)語其目的僅在于描述具體實施方案,并且不意圖是限制性的,本發(fā)明的范圍將僅由所附的權(quán)利要求書限制。除非另外定義,否則本文中所用的全部技術(shù)與科學(xué)術(shù)語均具有如本發(fā)明所屬領(lǐng)域的普通技術(shù)人員通常理解的相同含義。如本文所用,在提到具體列舉的數(shù)值中使用時,術(shù)語“約”意指該值可以從列舉的值變動不多于1%。例如,如本文所用,表述“約100”包括99和101和之間的全部值(例如,99.1、99.2、99.3、99.4等)。雖然在本發(fā)明的實施或測試中可以使用與本發(fā)明中所述相似或等價的任何方法和材料,本文在此處例舉優(yōu)選的方法和材料。胚胎植入前染色體非整倍體篩查目前,針對胚胎植入前染色體非整倍體篩查的方法主要有,熒光原位雜交(FluorescenceInSituHybridization,FISH)技術(shù),比較基因組雜交(ComparativeGenomicHybridization,CGH)技術(shù),微陣列(Microarrays)技術(shù)和二代測序技術(shù)(NextGenerationSequencing,NGS)。近年來發(fā)展起來的微陣列技術(shù)有微陣列比較基因組雜交(ArrayComparativeGenomicHybridization,array-CGH)技術(shù)和單核苷酸多態(tài)性微陣列(SingleNucleotidePolymorphism-basedArray,SNParray)技術(shù)。FISH實驗原理:用生物素或者地高辛標(biāo)記的核酸探針同便于觀察的有絲分裂中期細胞的染色體特異性結(jié)合,然后用帶有熒光基團的特異親和素與探針結(jié)合,在熒光顯微鏡下通過熒光分布來觀察染色體情況。CGH實驗原理:用不同顏色的熒光染料分別標(biāo)記待測DNA跟對照DNA,兩種DNA等量混合后與處于有絲分裂中期的染色體雜交,用相應(yīng)的軟件分析熒光顯微鏡所成圖像。如果待測DNA信號強于對照DNA信號,證明有染色體三體或者CNVs重復(fù),反之,則證明有染色體單體或者CNVs缺失;如果二者信號相當(dāng),則證明染色體正常。Array-CGH實驗原理同CGH很相似,只是用帶有基因組片段克隆載體的microarray代替了CGH中的有絲分裂中期染色體,它的分辨率高于CGH,簡單的原理圖見圖3所示。SNParray實驗原理:用帶有單鏈SNP片段探針的microarray同片段化的單鏈基因組DNA雜交,捕獲基因組DNA的SNP位點,并通過軟件分析得出基因組SNP情況,簡單原理見圖4。FISH技術(shù)及CGH技術(shù)由于受到探針的局限,僅能完成部分染色體的檢測,并不能反應(yīng)全部23條染色體的情況,并且檢測分辨率較低,因此染色體異常的胚胎檢出率并沒有達到理想水平,從而限制了其廣泛應(yīng)用。Array-CGH技術(shù)和SNParray技術(shù)由于其快速準確及高分辨率的特性已初步用于臨床,但高昂的價格及檢測過程中過量信息帶來的分析困難是該項技術(shù)存在的缺點。同時,熒光顯微鏡成像的人為觀察以及圖像分析軟件之間的矛盾,也會對實驗的重復(fù)性產(chǎn)生不好的影響。隨著單細胞測序技術(shù)的不斷發(fā)展,NGS作為PGS檢測的新技術(shù)已經(jīng)成為一種新的趨勢。通過對所挑取細胞的全基因組擴增產(chǎn)物進行高通量大規(guī)模并行基因組測序,并對測序結(jié)果進行統(tǒng)計學(xué)信息分析,能夠判斷胚胎是否存在非整倍體或者大于1M的CNVs,并且,不同于FISH技術(shù)及CGH技術(shù),本發(fā)明不受探針的限制,可以反應(yīng)全部染色體的情況。同時,由于標(biāo)簽(Barcode)接頭的存在,可以對多個樣品pooling后并行上機測序,同Array-CGH技術(shù)和SNParray技術(shù)相比,在保證快速準確及高分辨率的基礎(chǔ)上,能夠大大的降低檢測成本。自動化建庫和自動化測序的可行性能夠最大程度的減少人為干擾。在本發(fā)明的一個優(yōu)選地實施方式中,本發(fā)明提供了一種低成本、高通量適合臨床廣泛應(yīng)用的PGS檢測技術(shù),基于新一代的測序儀BGIseq-500(華大基因),本發(fā)明提供了一種能夠用于篩查植入前胚胎染色體非整倍體以及大于1M的拷貝數(shù)變異(CopyNumberVariation,CNVs)的方法以及基于該方法的試劑盒。本發(fā)明可以對IVF周期中卵裂球期或囊胚期胚胎的一個或多個細胞進行染色體非整倍體檢測,以判斷胚胎是否存在染色體非整倍性或者拷貝數(shù)變異。同時,本發(fā)明適用于所有進行IVF的人群,尤其是以下高風(fēng)險人群:女性高齡;反復(fù)IVF植入失敗;反復(fù)流產(chǎn);嚴重的男性因素導(dǎo)致的不育;夫婦一方為染色體平衡易位攜帶者或生育過染色體疾病患兒。本發(fā)明檢測結(jié)果作為胚胎是否進行植入的依據(jù)之一,可供臨床參考。根據(jù)本發(fā)明的檢測方法概括如下:選取胚胎D3卵裂球以及D5囊胚外滋養(yǎng)層細胞作為篩查材料,提取1個或8個左右的細胞,因每個細胞中的DNA的含量約為6pg不足以建庫上機,因此需要進行全基因組擴增(WholeGenomeAmplification,WGA)以增加起始DNA模版量,再經(jīng)過片段選擇,末端修復(fù),接頭連接,文庫pooling,擴增及上機測序,獲得樣本的測序數(shù)據(jù)。當(dāng)胚胎細胞中某條染色體為三體或單體時,該染色體的拷貝率與正常的二倍體相比會有所升高或降低,運用生物統(tǒng)計學(xué)進行信息分析,非整倍體可被準確檢測。具體統(tǒng)計原理如下:通過序列比對獲得每條染色體有效序列數(shù)量,按照基因組上劃定好的窗口,獲得每個窗口內(nèi)的有效序列數(shù)。按照參考基因組上不同窗口內(nèi)GC含量的差異,將GC含量從大到小劃分為0.001的區(qū)域,統(tǒng)計每個區(qū)域中的有效序列數(shù),根據(jù)對照樣本計算相同GC間隔范圍內(nèi)的序列數(shù)的標(biāo)準差和平均值,以此對待測樣本的序列數(shù)進行標(biāo)準化和矯正,獲得代表每個窗口矯正后的序列數(shù)。循環(huán)遍歷基因組上的每個窗口,取其左右等量的若干個窗口進行統(tǒng)計檢驗,每個點會得到一個代表這個點兩側(cè)差異的P值,留下P值最小的若干點作為候選斷點。選取上一個斷點到該斷點的區(qū)域以及該斷點到下一個斷點的區(qū)域,對這兩個區(qū)域中矯正后的序列數(shù)做游程檢驗得到檢測P值,確定相鄰兩個斷點之間的區(qū)域為檢驗窗口,從而對窗口進行合并,為進一步對合并的窗口進行過濾,計算該片段中有些序列數(shù)的平均值與閾值范圍進行比較,若低于此范圍則為缺失,高于則為重復(fù)。根據(jù)各個染色體上不同窗口對應(yīng)的拷貝率值和顯著性差異值做出測試樣品的峰圖和核型圖,整個PGS過程的簡單檢測原理見圖2.本發(fā)明使用BGIseq-500測序方法對胚胎D3卵裂球或者D5囊胚外滋養(yǎng)層細胞染色體的拷貝數(shù)變異(CopyNumberVariations,CNVs)和整倍體情況進行分析檢測。本發(fā)明雖然在具體實例中使用的是細胞系單細胞,但在實際應(yīng)用中不僅僅只限于單細胞,本發(fā)明適用于大于1M的CNVs以及染色體非整倍體檢測,所以單細胞,多細胞,還有大于1M的CNVs,以及非整倍體的檢測均受本專利的保護。本發(fā)明的主要步驟如下:(1)胚胎D3卵裂球或者D5囊胚外滋養(yǎng)層細胞采集;(2)胚胎細胞全基因組擴增;(3)測序文庫制備;(4)DNA測序反應(yīng);(5)下機數(shù)據(jù)分析。以上所述方法在本實驗中具體的實施如下:1.胚胎D3卵裂球或者D5囊胚外滋養(yǎng)層細胞采集在受精卵發(fā)育至第三天卵裂球期,透明帶打孔活檢出1個胚胎細胞,洗滌后置于裝有4μL細胞保存液的PCR管中;或在受精卵發(fā)育至第五天囊胚期,在顯微操作儀下采用激光打孔的方法活檢1個胚胎細胞,洗滌后置于裝有4μL細胞保存液的PCR管中,短暫離心;保存有細胞的PCR管可以直接進行細胞全基因組擴增,也可以將PCR管直立保存在-80℃,禁止上下顛倒。2.胚胎細胞全基因組擴增對胚胎細胞進行WGA,具體的擴增過程包括三個步驟。第一,細胞裂解:向已經(jīng)收集到細胞的PCR管中加入由細胞裂解緩沖液和細胞裂解酶配置的混合液,在75℃下反應(yīng)10min,95℃下反應(yīng)4min,使細胞裂解,并釋放出其中的DNA。第二,前擴增:向上步反應(yīng)液中加入由前擴增緩沖液和前擴增酶配置的混合液,在95℃下反應(yīng)2min,然后在95℃15s,15℃50s,25℃40s,35℃30s,65℃40s,75℃40s下反應(yīng)12個循環(huán)。第三,后擴增:向前一步反應(yīng)液中加入由后擴增緩沖液,后擴增酶和去核酸酶水配置的混合液,在95℃下反應(yīng)2min,然后在95℃15s,65℃1min,75℃1min下循環(huán)14次,反應(yīng)完成后的擴增產(chǎn)物可直接用于下游分析或置于-20℃冰箱保存。3.測序文庫制備對細胞的WGA產(chǎn)物進行文庫構(gòu)建,具體的文庫構(gòu)建過程包括四個步驟:DNA打斷回收、末端修復(fù)、接頭連接、PCR擴增。第一,DNA打斷回收:對WGA產(chǎn)物進行定量,取一定量的WGA產(chǎn)物,向其中加入由DNA打斷酶和DNA打斷緩沖液組成的混合液,在37℃下反應(yīng)5min,75℃下反應(yīng)15min;然后對反應(yīng)液進行磁珠兩步法純化,進行片段選擇。第二,末端修復(fù):對片段選擇后的產(chǎn)物進行定量,取一定量的片段選擇后的產(chǎn)物,向其中加入由末端修復(fù)緩沖液和末端修復(fù)酶配置的混合液,在37℃下反應(yīng)30min,然后在75℃下反應(yīng)15min。第三,接頭連接:向上步末端修復(fù)反應(yīng)液中加入由連接緩沖液和連接酶配置的混合液,然后向其中加入標(biāo)簽接頭1-48(每個樣本單獨一個接頭),在20℃下反應(yīng)20min,使用磁珠純化連接反應(yīng)產(chǎn)物。第四,PCR擴增,向上步反應(yīng)純化后的DNA中,加入由PCR反應(yīng)液和PCR引物配置的混合液,在98℃下反應(yīng)2min,然后在98℃15s,56℃15s,72℃30s下循環(huán)12個cycles,在72℃下延伸5min,4℃保持;擴增完成后,使用磁珠純化,并測定純化后樣本的濃度。4.DNA測序反應(yīng)基于二代高通量測序技術(shù),在cPASBGIseq-500測序平臺(華大基因)進行上機測序。其中儀器的參數(shù)設(shè)置及操作方法都要嚴格按照操作手冊進行。雖然本發(fā)明中所用儀器為BGIseq-500,本發(fā)明中的測序循環(huán)數(shù)為SE28+10,但由于儀器以及建庫、測序方法會不斷升級,所以在實際應(yīng)用中,本發(fā)明不限于這一種儀器,不限于這一種建庫方法,不限于這一種循環(huán)數(shù),適用于BGIseq系列中的各種建庫方法、測序平臺以及測序方法。5下機數(shù)據(jù)分析流程5.1確定檢測流程參考文件(1)窗口文件基因組上的不同區(qū)域存在不同類型的特殊序列,比如高GC含量區(qū)域,端粒附近重復(fù)率較高區(qū)域,N堿基區(qū)域。這些異常會導(dǎo)致比對過程中各個區(qū)域的比對效率差異很大。為了避免基因組本身對比對造成的影響,通過以下過程生成窗口文件。將參考基因組(NCBI數(shù)據(jù)庫中的標(biāo)準人類參考基因組序列,例如可以為hg18,NCBIBuild36)。在本實施方式中選用hg19,NCBIBuild37。將參考基因組按照測得序列的長度隨機打斷,之后生成模擬下機樣本數(shù)據(jù)并將其重新比對到參考基因組上。在本實施方式中保證每個窗口含有100Kread,相鄰窗口間重合區(qū)域含有20Kread,最終將全基因組劃分為131290個窗口,也可以根據(jù)落入read數(shù)的差異選擇其他窗口長度。根據(jù)測的得參考樣本以單個窗口為單位橫向比較所有窗口內(nèi)深度的波動值,剔除掉波動較大的窗口。(2)基線文件選擇一定數(shù)量的已知正常核型的男女胚胎作為參考樣本,按照上述實驗步驟測的下機數(shù)據(jù)。根據(jù)檢測精度差異選擇合適的單樣本數(shù)據(jù)量。在本實施方式中單樣本原始下機數(shù)據(jù)量為(8.38M-35.22M)。基于正常胚胎樣本獲得全基因組校正基線文件,在本實施方式中個選擇30例男女正常胚胎作為正常參考樣本。另外本實施方式中考慮到短read特點優(yōu)先選用BWA(Burrows-WheelerAligner)作為實施方式中短序的比對軟件,也可以選用其他短序列比對軟件。將所測的正常樣本用BWA比對到參考基因組上根據(jù)獲得的SAM文件信息,提取唯一比對的read,去掉其中比對位置相同的read后用于后續(xù)分析。根據(jù)比對read的坐標(biāo)信息,計算落入每個窗口內(nèi)的read數(shù)ri,j,針對之前劃定的窗口,對于一個樣本計算對應(yīng)窗口參考基因組上的GC含量,比對上序列的GC含量,相對序列數(shù)Ri,j=ri,j/M;M是此樣本常染色體的所有窗口的平均序列數(shù),ri,j為此窗口的序列數(shù),其中定義gs和gr分別為比對上序列的GC含量和對應(yīng)窗口參考基因組上的GC含量;對于gs和gr按1%的GC含量間隔計算在此范圍內(nèi)序列數(shù)的中位值也可按其他間隔進行計算。則窗口i的矯正系數(shù)為則每個窗口矯正后的序列數(shù)累計全基因組常染色體的值除以總的窗口數(shù)得到矯正值M′,最終對于窗口i矯正后的序列數(shù)為針對每種性別的所有參考樣本取相同窗口的中位值做為最終基線文件內(nèi)每個窗口的參考值。(3)數(shù)據(jù)質(zhì)控體系在比對完成后根據(jù)比對信息計算樣本唯一比對率,重復(fù)率,唯一比對read數(shù)目,錯配率,GC含量等。根據(jù)數(shù)據(jù)分布特點,本實施方式中選用百分位數(shù)法估計正常值范圍(在數(shù)據(jù)不符合正態(tài)分布和偏態(tài)分布情況下)采用范圍為5%和95%,采用估計軟件為:SPSSStatistics17.0。可確定以上5個指標(biāo)在參考樣本中的波動范圍,也可以選用其他可表征測序特點的指標(biāo)作為質(zhì)控范圍。(4)已知假陽性信號過濾從參考樣本的檢測結(jié)果中得到由于系統(tǒng)誤差導(dǎo)致的假陽性信號,作為檢測樣本的過濾庫。過濾掉與ENCODE計劃中列出(TheENCODEProjectConsortium2012)基因組上微衛(wèi)星的區(qū)域,端粒酶和著絲粒區(qū)域重合的窗口。去掉參考基因組上的窗口內(nèi)比對率低的窗口。5.2單個樣本檢測根據(jù)過濾后的窗口信息以及對應(yīng)的深度值進行下面的檢測過程。找基因組上的斷點坐標(biāo)主要有以下步驟:初始斷點查找逐個遍歷樣本中的窗口,選擇窗口相鄰的左右兩端等量的窗口數(shù)進行游程檢驗(WaldA,WolfowitzJ.Onatestwhethertwosamplesarefromthesamepopulation[J].TheAnnalsofMathematicalStatistics,1940,11(2):147-162.),得到每個窗口對應(yīng)的檢測P值。對所有P值進行排序去掉非顯著的窗口位置,得到初始斷點集合B={b1,b2,b3……}。更新P值對于上述步驟中獲得斷點,分別對相鄰斷點左右兩端區(qū)間內(nèi)的深度值進行二輪統(tǒng)計得到每個斷點對應(yīng)新的P值。最終斷點查找在上述斷點P值得基礎(chǔ)上,對某一斷點來說分別于左右兩斷點區(qū)間進行統(tǒng)計檢驗,并在循環(huán)中刪除不顯著斷點。獲得每個斷點區(qū)間的P值和深度值的均值。斷點過濾根據(jù)斷點P值顯著性判斷是否為真實斷點,根據(jù)深度值得大小判斷是缺失還是重復(fù)。根據(jù)斷點區(qū)間大小判斷檢測精度。在本實施方式中P值為1e-10,缺失閾值為0.7,重復(fù)閾值為1.3,選用大于1M的區(qū)間為最終的拷貝數(shù)變異區(qū)間。結(jié)果報告根據(jù)變異區(qū)間坐標(biāo)給出染色體條帶信息,所屬基因類型,疾病類型等。并用全基因組深度分布圖來質(zhì)控WGA擴增質(zhì)量,作為衡量檢測結(jié)果的重要指標(biāo)。本發(fā)明結(jié)合BGIseq-500對胚胎D3卵裂球或者D5囊胚外滋養(yǎng)層細胞染色體的拷貝數(shù)變異(CopyNumberVariations,CNVs)和整倍體情況進行分析檢測。本發(fā)明雖然在具體實例中使用的是3-8個細胞系細胞,但在實際應(yīng)用中不僅僅只限于多細胞,本發(fā)明適用于大于1M的CNVs以及染色體非整倍體檢測,所以單細胞,多細胞,還有大于1M的CNVs,以及非整倍體的檢測均受本申請權(quán)利要求的保護。雖然本發(fā)明中所用儀器為BGIseq-500,本發(fā)明中的測序循環(huán)數(shù)為SE28+10,但由于儀器以及建庫、測序方法會不斷升級,所以在實際應(yīng)用中,本發(fā)明不限于這一種儀器,不限于這一種建庫方法,不限于這一種循環(huán)數(shù),適用于BGIseq系列中的各種建庫方法、測序平臺以及測序方法。在本發(fā)明的一個優(yōu)選地實施方式中,可以開發(fā)PCR-free建庫,取消PCR擴增過程,不但減少文庫構(gòu)建的時間,對測序bias也會有所改善。本發(fā)明的主要優(yōu)點在于:第一,能夠在24小時內(nèi)給出PGS的檢測結(jié)果,在保證準確度以及靈敏性的基礎(chǔ)上,大大縮短了PGS的檢測時間,能夠幫助孕婦植入新鮮的胚胎;第二,能夠同時檢測多個樣本,大大降低了檢測成本;第三,能夠檢測人的全部染色體情況,不論是大于1M的CNVs,還是非整倍體的胚胎細胞都能檢出;第四,可以在同醫(yī)院合作的聯(lián)合實驗室中進行檢測,大大提高了檢測效率,以及產(chǎn)能。下面結(jié)合具體實施例,進一步詳陳本發(fā)明。應(yīng)理解,這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實施例中未注明詳細條件的實驗方法,通常按照常規(guī)條件如美國Sambrook.J等著《分子克隆實驗室指南》(黃培堂等譯,北京:科學(xué)出版社,2002年)中所述的條件,或按照制造廠商所建議的條件。除非另外說明,否則百分比和份數(shù)按重量計算。以下實施例中所用的實驗材料和試劑如無特別說明均可從市售渠道獲得。實施例1本發(fā)明使用商業(yè)購買的細胞系,共有3個實施例,具體信息見下表表1實施例中樣本的Array-CGH結(jié)果樣本名Array-CGH結(jié)果Sample146,XY.ishdel(17)(p11.2p11.2)(1.98M)Sample247,XX,+21Sample346,XX.ishdel(1)(p36.33)(1.63M)1.獲取細胞系細胞購買已經(jīng)明確知道核型的細胞系細胞Sample1、Sample2以及Sample3(細胞系名稱分別為GM20743,GM03606,以及GM22977,購買自CoriellInstitute,USA),消化細胞,用顯微操作儀(Eppendorf,NK2)分選細胞。向消化后的細胞中加入Hochest(LIFETECHNOLOGIES,1660845)染色液,室溫下避光染色15min。將染色后的細胞懸液平鋪于已預(yù)先平鋪了用PBS(LIFETECHNOLOGIES,14190-144)稀釋的1%BSA(NEB,B9001S)的載玻片表面,挑取1個明場下有明顯細胞形貌及熒光場符合條件的有核細胞至做好標(biāo)記的PCR管(AXYGEN,MCT-150-C),PCR管根據(jù)實驗要求提前添加4μLPBS作為底液,挑選完成后,離心,準備進行單細胞擴增反應(yīng)。2.細胞樣本全基因組擴增使用本發(fā)明中的試劑,具體的擴增過程包括三個步驟:第一,細胞裂解:向已經(jīng)收集到細胞的PCR管中加入由細胞裂解緩沖液和細胞裂解酶配置的混合液,在75℃下反應(yīng)10min,95℃下反應(yīng)4min,裂解細胞,釋放出DNA。第二,前擴增:向上步反應(yīng)液中加入由前擴增緩沖液和前擴增酶配置的混合液,在95℃下反應(yīng)2min,然后在95℃15s,15℃50s,25℃40s,35℃30s,65℃40s,75℃40s下反應(yīng)12個循環(huán)。第三,后擴增:向前一步反應(yīng)液中加入由后擴增緩沖液,后擴增酶和去核酸酶水配置的混合液,在95℃下反應(yīng)2min,然后在95℃15s,65℃1min,75℃1min下循環(huán)14次,反應(yīng)完成后的擴增產(chǎn)物可直接用于下游分析或置于-20℃冰箱保存。3.測序文庫制備采用本發(fā)明中的試劑對細胞的WGA產(chǎn)物進行文庫構(gòu)建,具體的文庫構(gòu)建過程包括四個步驟:DNA打斷回收、末端修復(fù)、接頭連接、PCR擴增。第一,DNA打斷回收:對WGA產(chǎn)物進行定量,取一定量的WGA產(chǎn)物,向其中加入由DNA打斷酶和DNA打斷緩沖液組成的混合液,在37℃下反應(yīng)5min,75℃下反應(yīng)15min;然后對反應(yīng)液進行磁珠兩步法純化,進行片段選擇。第二,末端修復(fù):對片段選擇后的產(chǎn)物進行定量,取一定量的片段選擇后的產(chǎn)物,向其中加入由末端修復(fù)緩沖液和末端修復(fù)酶配置的混合液,在37℃下反應(yīng)30min,然后在75℃下反應(yīng)15min。第三,接頭連接:向上步末端修復(fù)反應(yīng)液中加入由連接緩沖液和連接酶配置的混合液,然后向其中加入標(biāo)簽接頭1-48(每個樣本單獨一個接頭),在20℃下反應(yīng)20min,使用磁珠純化連接反應(yīng)產(chǎn)物。第四,PCR擴增,向上步反應(yīng)純化后的DNA中,加入由PCR反應(yīng)液和PCR引物配置的混合液,在98℃下反應(yīng)2min,然后在98℃15s,56℃15s,72℃30s下循環(huán)12個cycles,在72℃下延伸5min,4℃保持;擴增完成后,使用磁珠純化,并測定純化后樣本的濃度。4.DNA測序反應(yīng)將PCR純化后的樣品等量pooling后,在華大自主研發(fā)的cPASBGIseq-500測序平臺進行上機測序。測序試劑采用本發(fā)明中試劑,其中儀器的參數(shù)設(shè)置及操作方法都要嚴格按照操作手冊進行。5.數(shù)據(jù)分析(1)序列比對本實施例中用BWA軟件(版本號:0.7.7-r441)將測得的樣本read比對回參考基因組(hg19,NCBIBuild37)。根據(jù)比對結(jié)果獲得比對信息如表2從比對結(jié)果中挑出唯一比對的序列,去掉重復(fù)序列后用于下面的分析。根據(jù)比對產(chǎn)生的信息對樣本進行質(zhì)控。表2實施例中樣本比對的基本信息樣本名總序列數(shù)唯一比對率有效序列數(shù)重復(fù)率GC含量變異系數(shù)Sample121,766,4510.525111,428,9500.07850.42620.2988Sample215,861,2230.58327,530,1140.18600.38070.2333Sample323,680,6810.552010,876,0760.16800.37270.1954(2)數(shù)據(jù)矯正在以GC含量為橫坐標(biāo),標(biāo)準化后的深度值為縱坐標(biāo)的圖中。將GC含量按0.01間隔,統(tǒng)計間隔內(nèi)的深度值波動,按照方法中的步驟,公式對數(shù)據(jù)進行校正,如圖1。(3)斷點查找兩步法判斷斷點位置第一步逐個遍歷樣本中的窗口,選擇窗口相鄰的左右兩端等量的窗口數(shù)進行游程檢驗,得到每個窗口對應(yīng)的檢測P值。對所有P值進行排序去掉非顯著的窗口位置,得到初始斷點集合B={b1,b2,b3……}。對于上述步驟中獲得斷點,分別對相鄰斷點左右兩端區(qū)間內(nèi)的深度值進行二輪統(tǒng)計得到每個斷點對應(yīng)新的P值。在上述斷點P值得基礎(chǔ)上,對某一斷點來說分別于左右兩斷點區(qū)間進行統(tǒng)計檢驗,并在循環(huán)中刪除不顯著斷點。獲得每個斷點區(qū)間的P值和深度值的均值。(4)結(jié)果報告根據(jù)檢測P值為1e-10,缺失閾值小于為0.7,重復(fù)閾值大于1.3,選用大于1M的區(qū)間為最終的拷貝數(shù)變異區(qū)間,進行結(jié)果輸出。表3實施例中樣本的檢測結(jié)果通過表3的結(jié)果可以看出,本發(fā)明的檢測結(jié)果與array-CGH的結(jié)果具有很好的一致性。以上結(jié)果表明,本發(fā)明使用的胚胎植入前染色體CNVs以及非整倍體檢測方法,以BGIseq-500上的二代高通量測序技術(shù)為基礎(chǔ),能夠在24小時之內(nèi)檢測出大于2M的CNVs或者非整倍體的胚胎細胞,大大縮短了檢測時間,能夠幫助孕婦植入新鮮的胚胎,方法簡單、快速、有效。本發(fā)明使用二代高通量建庫以及測序方法,保證了檢測結(jié)果的準確性以及靈敏度,同時能夠?qū)崿F(xiàn)自動化操作。在本發(fā)明提及的所有文獻都在本申請中引用作為參考,就如同每一篇文獻被單獨引用作為參考那樣。此外應(yīng)理解,在閱讀了本發(fā)明的上述講授內(nèi)容之后,本領(lǐng)域技術(shù)人員可以對本發(fā)明作各種改動或修改,這些等價形式同樣落于本申請所附權(quán)利要求書所限定的范圍。當(dāng)前第1頁1 2 3