欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

確定混合測序數(shù)據(jù)中讀段的樣本源的方法及裝置制造方法

文檔序號:485737閱讀:305來源:國知局
確定混合測序數(shù)據(jù)中讀段的樣本源的方法及裝置制造方法
【專利摘要】本發(fā)明提供了一種確定混合測序數(shù)據(jù)中讀段的樣本源的方法及裝置,混合測序數(shù)據(jù)由多個讀段組成,該方法包括:利用多個標(biāo)簽分別標(biāo)記多個核酸樣本,使得每個核酸樣本至少帶有一條或多條標(biāo)簽以區(qū)分其它核酸樣本,記錄每個核酸樣本與其所帶的標(biāo)簽的對應(yīng)關(guān)系;混合多個核酸樣本,對混合核酸樣本進(jìn)行核酸序列測定,獲得混合測序數(shù)據(jù);將混合測序數(shù)據(jù)與參考序列比對,獲得比對結(jié)果,從比對結(jié)果中篩選出與參考序列不完全匹配而且不匹配部分的長度不小于比標(biāo)簽小1bp的長度的讀段;依據(jù)篩選出的讀段的信息和標(biāo)簽與樣本的對應(yīng)關(guān)系,確定混合測序數(shù)據(jù)中讀段源自的核酸樣本。
【專利說明】確定混合測序數(shù)據(jù)中讀段的樣本源的方法及裝置

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及混合數(shù)據(jù)處理技術(shù),特別是混合測序數(shù)據(jù)中數(shù)據(jù)來源的樣本的確定方 法和裝置。

【背景技術(shù)】
[0002] Sanger測序是確定基因分型的金標(biāo)準(zhǔn),飛行時間質(zhì)譜檢測能夠?qū)崿F(xiàn)定點檢測基因 分型,比如深圳華大基因推出的一款產(chǎn)品針對四個耳聾常見突變基因的20個位點進(jìn)行質(zhì) 譜檢測,這20個位點在我國耳聾人群的致病因素中占據(jù)主要作用,還有全外顯子組測序, 三種方法都具有各自的局限性,比如Sanger和質(zhì)譜法通量低、成本高,而全外顯子組測序 則不能有效利用全部測序數(shù)據(jù)。
[0003] 先天性耳聾是一類常見疾病,在我國新生兒中的發(fā)病率高于1%。,其中60%以上 是遺傳因素導(dǎo)致的。因此,除了常規(guī)的醫(yī)學(xué)診斷方法,通過測定相關(guān)基因的基因分型、判斷 是否發(fā)生基因突變,可以輔助醫(yī)生診斷新生兒是否患有耳聾。
[0004] 根據(jù)國內(nèi)研究人員針對我國人群中耳聾基因突變進(jìn)行分子流行病學(xué)調(diào)查的結(jié)果, GJB2、GJB3、SLC26A4和12sRNA的突變最為常見,在人群中的突變比例高達(dá)40%,在這四個 基因上的突變位點是導(dǎo)致遺傳性耳聾發(fā)生的常見突變。


【發(fā)明內(nèi)容】

[0005] 本發(fā)明一方面提供了一種確定混合測序數(shù)據(jù)中讀段的樣本源的方法,混合測序數(shù) 據(jù)由多個讀段組成,該方法包括:A.利用多個標(biāo)簽分別標(biāo)記多個核酸樣本,使得每個核酸 樣本至少帶有一條或多條標(biāo)簽以區(qū)分其它核酸樣本,記錄所述每個核酸樣本與其所帶的標(biāo) 簽的對應(yīng)關(guān)系;B.混合所述多個核酸樣本,對混合核酸樣本進(jìn)行核酸序列測定,獲得混合 測序數(shù)據(jù);C.將所述混合測序數(shù)據(jù)與參考序列比對,獲得比對結(jié)果,從所述比對結(jié)果中篩 選出與所述參考序列不完全匹配而且不匹配部分的長度不小于比A中的標(biāo)簽小lbp的長度 的讀段。
[0006] 本發(fā)明另一方面提供了一種確定混合測序數(shù)據(jù)中讀段的樣本源的裝置,混合測序 數(shù)據(jù)由多個讀段組成,該裝置包括:樣本標(biāo)記單元,用以實現(xiàn)利用多個標(biāo)簽分別標(biāo)記多個核 酸樣本,使得每個核酸樣本至少帶有一條或多條標(biāo)簽以區(qū)分其它核酸樣本,記錄每個核酸 樣本與其所帶的標(biāo)簽的對應(yīng)關(guān)系;混合測序單元,與樣本標(biāo)記單元相連,用以混合獲自樣本 標(biāo)記單元的標(biāo)簽標(biāo)記過的多個核酸樣本,以及對混合核酸樣本進(jìn)行核酸序列測定,獲得混 合測序數(shù)據(jù);比對篩選單元,與混合測序單元相連,用以實現(xiàn)將混合測序數(shù)據(jù)與參考序列 比對,獲得比對結(jié)果,以及從比對結(jié)果中篩選出與參考序列不完全匹配而且不匹配部分的 長度不小于比所述標(biāo)簽小lbp的長度的讀段;歸類單元,與樣本標(biāo)記單元和比對篩選單元 相連,用以實現(xiàn)利用從比對篩選單元中篩選出的讀段的信息和所述樣本標(biāo)記單元的對應(yīng)關(guān) 系,確定混合測序數(shù)據(jù)中讀段源于的核酸樣本。
[0007] 利用本發(fā)明一方面提供的確定混合測序數(shù)據(jù)中數(shù)據(jù)的樣本源的方法或裝置,將多 個樣本核酸的混合測序后的混合數(shù)據(jù)正確對應(yīng)到樣本源,使得不浪費測序通量,特別是適 合于每個樣本數(shù)據(jù)量需求相對低而測序通量相對高的平臺。

【專利附圖】

【附圖說明】
[0008] 本發(fā)明的上述和/或附加的方面和優(yōu)點從結(jié)合下面附圖對實施方式的描述中將 變得明顯和容易理解,其中:
[0009] 圖1是本發(fā)明的一個【具體實施方式】中的文庫構(gòu)建示意圖;
[0010] 圖2是本發(fā)明的一個【具體實施方式】中的確定混合測序數(shù)據(jù)中讀段的樣本源的裝 置示意圖。

【具體實施方式】
[0011] 根據(jù)本發(fā)明的一個實施方式,提供了一種確定混合測序數(shù)據(jù)中讀段的樣本源的方 法,混合測序數(shù)據(jù)是由多個讀段組成,所說方法包括:
[0012] A.利用多個標(biāo)簽分別標(biāo)記多個核酸樣本,使得每個核酸樣本至少帶有一條或多條 標(biāo)簽以區(qū)分其它核酸樣本,記錄所述每個核酸樣本與其所帶的標(biāo)簽的對應(yīng)關(guān)系;
[0013] B.混合所述多個核酸樣本,對混合核酸樣本進(jìn)行核酸序列測定,獲得混合測序數(shù) 據(jù);
[0014] C.將所述混合測序數(shù)據(jù)與參考序列比對,獲得比對結(jié)果,從所述比對結(jié)果中篩選 出與所述參考序列不完全匹配而且不匹配部分的長度不小于比A中的標(biāo)簽小lbp的長度的 讀段;
[0015] D.依據(jù)C中篩選出的讀段的信息和A中的對應(yīng)關(guān)系,確定所述混合測序數(shù)據(jù)中讀 段源于的核酸樣本。
[0016] 根據(jù)本發(fā)明的一個【具體實施方式】,A中標(biāo)簽長度為5?12bp。A中的標(biāo)簽可以選 自SEQ ID N0 :27?124所示的序列。SEQ ID N0 :27?124序列見表1,這組標(biāo)簽,是發(fā)明 人考慮序列長度、堿基組成、堿基位置比例、與其它標(biāo)簽堿基的關(guān)系設(shè)計大量序列,多次試 驗篩選獲得的,這組標(biāo)簽的部分或者全部可以置于同一反應(yīng)體系中而又相互之間不干擾影 響,而且不千擾常規(guī)體系內(nèi)的其它反應(yīng)物或反應(yīng),比如不影響文庫構(gòu)建中的各反應(yīng)體系及 反應(yīng),測序芯片上的固定序列等。
[0017] 表 1
[0018]

【權(quán)利要求】
1. 確定混合測序數(shù)據(jù)中讀段的樣本源的方法,所述混合測序數(shù)據(jù)由多個讀段組成,所 述方法包括: A. 利用多個標(biāo)簽分別標(biāo)記多個核酸樣本,使得每個核酸樣本至少帶有一條或多條標(biāo)簽 以區(qū)分其它核酸樣本,記錄所述每個核酸樣本與其所帶的標(biāo)簽的對應(yīng)關(guān)系; B. 混合所述多個核酸樣本,對混合核酸樣本進(jìn)行核酸序列測定,獲得混合測序數(shù)據(jù); C. 將所述混合測序數(shù)據(jù)與參考序列比對,獲得比對結(jié)果,從所述比對結(jié)果中篩選出與 所述參考序列不完全匹配而且不匹配部分的長度不小于比A中的標(biāo)簽小lbp的長度的讀 段; D. 依據(jù)C中篩選出的讀段的信息和A中的對應(yīng)關(guān)系,確定所述混合測序數(shù)據(jù)中讀段源 于的核酸樣本。
2. 權(quán)利要求1的方法,其特征在于,A中標(biāo)簽長度為5?12bp。
3. 權(quán)利要求2的方法,其特征在于,A中的標(biāo)簽選自SEQ ID NO :27?124所示的序列。
4. 權(quán)利要求1的方法,其特征在于,A中利用標(biāo)簽標(biāo)記核酸樣本是通過標(biāo)簽引物擴(kuò)增所 述核酸樣本的至少一部分核酸來實現(xiàn)的。
5. 權(quán)利要求4的方法,其特征在于,所述標(biāo)簽引物由位于5 '端的標(biāo)簽連接引物序列構(gòu) 成。
6. 權(quán)利要求5的方法,其特征在于,所述標(biāo)簽引物中的標(biāo)簽為選自SEQ ID NO :27?124 所示的序列。
7. 權(quán)利要求5的方法,其特征在于,所述標(biāo)簽引物中的引物序列選自SEQ ID NO :1和2, SEQ ID NO :3 和 4, SEQ ID NO :5 和 6, SEQ ID NO :7 和 8, SEQ ID NO :9 和 10, SEQ ID NO : 11 和 12, SEQ ID NO :13 和 14, SEQ ID NO :15 和 16, SEQ ID NO :17 和 18, SEQ ID NO :19 和 20, SEQ ID NO :21 和 22, SEQ ID NO :23 和 24 以及 SEQ ID NO :25 和 26 所示的 13 對序列 中的至少1對; 任選的,所述標(biāo)簽引物中的引物序列選自SEQ ID N0:1和2,SEQ ID N0:3和4,SEQ ID NO :5 和 6, SEQ ID NO :7 和 8, SEQ ID NO :9 和 10, SEQ ID NO :11 和 12, SEQ ID NO :13 和 14, SEQ ID NO :15 和 16, SEQ ID NO :17 和 18, SEQ ID NO :19 和 20, SEQ ID NO :21 和 22, SEQ ID NO :23和24以及SEQ ID NO :25和26所示的13對序列中的至少2對; 任選的,所述標(biāo)簽引物中的引物序列選自SEQ ID N0:1和2,SEQ ID N0:3和4,SEQ ID NO :5 和 6, SEQ ID NO :7 和 8, SEQ ID NO :9 和 10, SEQ ID NO :11 和 12, SEQ ID NO :13 和 14, SEQ ID NO :15 和 16, SEQ ID NO :17 和 18, SEQ ID NO :19 和 20, SEQ ID NO :21 和 22, SEQ ID NO :23和24以及SEQ ID NO :25和26所示的13對序列中的至少5對; 任選的,所述標(biāo)簽引物中的引物序列選自SEQ ID N0:1和2,SEQ ID N0:3和4,SEQ ID NO :5 和 6, SEQ ID NO :7 和 8, SEQ ID NO :9 和 10, SEQ ID NO :11 和 12, SEQ ID NO :13 和 14, SEQ ID NO :15 和 16, SEQ ID NO :17 和 18, SEQ ID NO :19 和 20, SEQ ID NO :21 和 22, SEQ ID NO :23和24以及SEQ ID NO :25和26所示的13對序列中的至少10對; 任選的,所述標(biāo)簽引物中的引物序列為SEQ ID NO :1和2, SEQ ID NO :3和4, SEQ ID NO :5 和 6, SEQ ID NO :7 和 8, SEQ ID NO :9 和 10, SEQ ID NO :11 和 12, SEQ ID NO :13 和 14, SEQ ID NO :15 和 16, SEQ ID NO :17 和 18, SEQ ID NO :19 和 20, SEQ ID NO :21 和 22, SEQ ID NO :23和24以及SEQ ID NO :25和26所示的13對序列。
8. 權(quán)利要求1的方法,其特征在于,在獲得混合測序數(shù)據(jù)之后,去除所述混合測序數(shù)據(jù) 中長度不小于50bp的讀段。
9. 權(quán)利要求1的方法,其特征在于,C進(jìn)一步包括依據(jù)所述不匹配部分在讀段中的位置 對所述篩選出的讀段進(jìn)行分類,獲得第一讀段和第二讀段,所述第一讀段中的讀段的兩個 末端都與所述參考序列不匹配,所述第二讀段中的讀段的兩個末端中的一個與所述參考序 列不匹配。
10. 權(quán)利要求9的方法,其特征在于,比對所述第一讀段中的每個讀段中的與所述參考 序列都不匹配的兩個末端,去除所述兩個末端不互相匹配的以及兩個末端互相匹配的長度 小于比A中標(biāo)簽小lbp的長度的讀段。
11. 權(quán)利要求1-10任一方法,其特征在于,B中核酸序列測序是在半導(dǎo)體芯片測序平臺 上進(jìn)行的。
12. 權(quán)利要求11的方法,其特征在于,B中核酸序列測定包括混合核酸樣本的測序文庫 的構(gòu)建。
13. 確定混合測序數(shù)據(jù)中讀段的樣本源的裝置,所述混合測序數(shù)據(jù)由多個讀段組成,所 述裝置包括: 樣本標(biāo)記單元,用以實現(xiàn)利用多個標(biāo)簽分別標(biāo)記多個核酸樣本,使得每個核酸樣本至 少帶有一條或多條標(biāo)簽以區(qū)分其它核酸樣本,記錄所述每個核酸樣本與其所帶的標(biāo)簽的對 應(yīng)關(guān)系; 混合測序單元,與所述樣本標(biāo)記單元相連,用以混合獲自所述樣本標(biāo)記單元的標(biāo)簽標(biāo) 記過的多個核酸樣本,以及對混合核酸樣本進(jìn)行核酸序列測定,獲得混合測序數(shù)據(jù); 比對篩選單元,與所述混合測序單元相連,用以實現(xiàn)將所述混合測序數(shù)據(jù)與參考序列 比對,獲得比對結(jié)果,以及從所述比對結(jié)果中篩選出與所述參考序列不完全匹配而且不匹 配部分的長度不小于比所述標(biāo)簽小lbp的長度的讀段; 歸類單元,與所述樣本標(biāo)記單元和所述比對篩選單元相連,用以實現(xiàn)利用從所述比對 篩選單元中篩選出的讀段的信息和所述樣本標(biāo)記單元的對應(yīng)關(guān)系,確定所述混合測序數(shù)據(jù) 中讀段源于的核酸樣本。
【文檔編號】C12Q1/68GK104232760SQ201410427151
【公開日】2014年12月24日 申請日期:2014年8月26日 優(yōu)先權(quán)日:2014年8月26日
【發(fā)明者】陳祖煜, 馮大飛 申請人:深圳華大基因醫(yī)學(xué)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
新和县| 临汾市| 宁晋县| 黄龙县| 鄯善县| 全椒县| 元江| 广丰县| 云南省| 阿克陶县| 漳州市| 绥棱县| 桃园县| 开江县| 招远市| 凉山| 茌平县| 吉木乃县| 宁强县| 广灵县| 鄄城县| 东乡县| 临清市| 施秉县| 德令哈市| 泾源县| 鄂州市| 建宁县| 涞源县| 涞水县| 潢川县| 翼城县| 南昌市| 丹寨县| 大城县| 长沙县| 淮北市| 柘城县| 呼伦贝尔市| 贵港市| 兴隆县|