欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

棉花微衛(wèi)星標(biāo)記位點(diǎn)開(kāi)發(fā)方法與微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的微衛(wèi)星標(biāo)記的長(zhǎng)度檢測(cè)方法與流程

文檔序號(hào):12097907閱讀:201來(lái)源:國(guó)知局

本發(fā)明涉及生物技術(shù)領(lǐng)域,特別涉及一種棉花微衛(wèi)星標(biāo)記位點(diǎn)開(kāi)發(fā)方法與微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的微衛(wèi)星標(biāo)記的長(zhǎng)度檢測(cè)方法。



背景技術(shù):

微衛(wèi)星標(biāo)記又稱(chēng)短串聯(lián)重復(fù)序列(short tandem repeats,STR)或簡(jiǎn)單重復(fù)序列(simple sequence repeats,SSR),指由2個(gè)以上核苷酸為重復(fù)單元串聯(lián)重復(fù)構(gòu)成。微衛(wèi)星標(biāo)記位點(diǎn)指的是在基因組上含有微衛(wèi)星標(biāo)記的座位,微衛(wèi)星標(biāo)記位點(diǎn)在基因組上數(shù)量豐富且均勻分布,微衛(wèi)星標(biāo)記位點(diǎn)的開(kāi)發(fā)指的是尋找基因組上的微衛(wèi)星標(biāo)記位點(diǎn)的過(guò)程。不同樣本中,同一個(gè)微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的微衛(wèi)星標(biāo)記的重復(fù)單元的重復(fù)次數(shù)可能不同,在樣本間存在長(zhǎng)度變異,因此微衛(wèi)星標(biāo)記位點(diǎn)的多態(tài)性主要指同一個(gè)微衛(wèi)星標(biāo)記位點(diǎn)的不同微衛(wèi)星標(biāo)記的長(zhǎng)度多態(tài)性。微衛(wèi)星標(biāo)記檢測(cè)技術(shù)指的是檢測(cè)微衛(wèi)星標(biāo)記位點(diǎn)中的微衛(wèi)星標(biāo)記的長(zhǎng)度的技術(shù)。不同樣本的微衛(wèi)星標(biāo)記的長(zhǎng)度多態(tài)性可以用來(lái)對(duì)樣本的身份進(jìn)行鑒定,因此,微衛(wèi)星標(biāo)記技術(shù)的應(yīng)用十分廣泛,包括生物多樣性鑒定、動(dòng)植物品種指紋身份證鑒定等等。

傳統(tǒng)的棉花微衛(wèi)星標(biāo)記位點(diǎn)的開(kāi)發(fā)與檢測(cè)包括以下步驟:基因組提取、基因組片段化、連接接頭、擴(kuò)增、與簡(jiǎn)單重復(fù)序列雜交、純化雜交產(chǎn)物、雜交產(chǎn)物克隆、克隆產(chǎn)物大腸桿菌轉(zhuǎn)化、挑取單克隆、對(duì)每一個(gè)單克隆的目標(biāo)位點(diǎn)進(jìn)行一代測(cè)序、分析測(cè)序結(jié)果獲得微衛(wèi)星標(biāo)記位點(diǎn)、在多個(gè)棉花樣本中檢驗(yàn)微衛(wèi)星標(biāo)記位點(diǎn)的多態(tài)性、開(kāi)發(fā)出多態(tài)性高的微衛(wèi)星標(biāo)記位點(diǎn)、逐一擴(kuò)增并電泳檢測(cè)每一個(gè)待檢測(cè)的樣品中的每一個(gè)待檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)中的微衛(wèi)星標(biāo)記。

在實(shí)現(xiàn)本發(fā)明的過(guò)程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問(wèn)題:

棉花微衛(wèi)星標(biāo)記位點(diǎn)的開(kāi)發(fā)與檢測(cè)流程復(fù)雜、通量低、極其耗時(shí)費(fèi)力;其次,微衛(wèi)星標(biāo)記位點(diǎn)的電泳檢測(cè)的分辨率低,檢測(cè)結(jié)果不準(zhǔn)確,準(zhǔn)確的結(jié)果需要參考樣本等進(jìn)行校正。由此派生的問(wèn)題包括:開(kāi)發(fā)出來(lái)的微衛(wèi)星標(biāo)記位點(diǎn)少,通常200個(gè)以?xún)?nèi),占基因組上所有微衛(wèi)星標(biāo)記位點(diǎn)的1%左右;用于檢驗(yàn)微衛(wèi)星標(biāo)記位點(diǎn)多態(tài)性的棉花樣本也少,通常在數(shù)十個(gè)左右,因此多態(tài)性檢證結(jié)果不準(zhǔn)確;微衛(wèi)星標(biāo)記位點(diǎn)的側(cè)翼序列保守性未知,影響擴(kuò)增微衛(wèi)星標(biāo)記位點(diǎn)的引物的通用性;檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)的數(shù)量有限,一般在一個(gè)待檢測(cè)的樣品中檢測(cè)數(shù)十個(gè)微衛(wèi)星標(biāo)記位點(diǎn),導(dǎo)致建立的樣本的DNA身份證信息不完整、不準(zhǔn)確。



技術(shù)實(shí)現(xiàn)要素:

為了解決現(xiàn)有技術(shù)的問(wèn)題,本發(fā)明實(shí)施例提供了一種棉花微衛(wèi)星標(biāo)記位點(diǎn)開(kāi)發(fā)方法與微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的微衛(wèi)星標(biāo)記的長(zhǎng)度檢測(cè)方法。所述技術(shù)方案如下:

一方面,本發(fā)明實(shí)施例提供了一種棉花微衛(wèi)星標(biāo)記位點(diǎn)開(kāi)發(fā)方法,所述方法包括:

將n個(gè)具有多態(tài)性的棉花樣本等質(zhì)量混合,獲得混合樣本,其中n>1;

提取所述混合樣本的基因組;

將所述混合樣本的基因組片段化,獲得基因組片段;

將多個(gè)具有簡(jiǎn)單重復(fù)序列的探針作為探針組,利用所述探針組中的每個(gè)探針?lè)謩e與所述基因組片段進(jìn)行雜交,獲得多個(gè)雜交溶液,對(duì)多個(gè)所述雜交溶液中成功雜交的基因組片段分別進(jìn)行純化,得到多個(gè)純化的雜交基因組片段;

將多個(gè)所述純化的雜交基因組片段等質(zhì)量混合后,利用高通量測(cè)序檢測(cè)混合后的所述純化的雜交基因組片段,獲得第一高通量測(cè)序片段;

從所述第一高通量測(cè)序片段中,篩選有效的所述高通量測(cè)序片段,所述有效的高通量測(cè)序片段包括微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的微衛(wèi)星標(biāo)記;

根據(jù)所述有效的高通量測(cè)序片段中的微衛(wèi)星標(biāo)記的兩側(cè)序列的同源性對(duì)所述有效的高通量測(cè)序片段進(jìn)行分類(lèi),同一類(lèi)的所述有效的高通量測(cè)序片段為同一個(gè)微衛(wèi)星標(biāo)記位點(diǎn)的所述有效的高通量測(cè)序片段,若同一個(gè)所述微衛(wèi)星標(biāo)記位點(diǎn)的所述有效的高通量測(cè)序片段的條數(shù)≥α1,則成功開(kāi)發(fā)一個(gè)所述微衛(wèi)星標(biāo)記位點(diǎn),其中,α1為第一判定閾值且α1≥(高通測(cè)序深度×有效的高通量測(cè)序片段的比例/基因組上能檢測(cè)到的微衛(wèi)星標(biāo)記位點(diǎn)數(shù))×概率保證。

通常,為了便于純化所述雜交溶液中成功雜交的基因組片段,可以對(duì)探針進(jìn)行功能化標(biāo)記,例如可以

利用生物素標(biāo)記的具有簡(jiǎn)單重復(fù)序列的探針與所述基因組片段進(jìn)行雜交,獲得雜交溶液;

利用鏈霉親和素磁珠純化所述雜交溶液中成功雜交的基因組片段,獲得純化的基因組片段。

在上述步驟中由于探針具有生物素標(biāo)記,使得成功雜交的基因組片段也被生物素標(biāo)記,從而可以利用鏈霉親和素磁珠從所述雜交溶液中純化出來(lái)。所述利用生物素標(biāo)記和鏈霉親和素磁珠純化的技術(shù)為公知技術(shù)。

具體地,α1≥20。

具體地,所述微衛(wèi)星標(biāo)記指由≥2個(gè)堿基組成的重復(fù)單元串聯(lián)重復(fù)構(gòu)成的序列。

具體地,所述有效的高通量測(cè)序片段中的所述微衛(wèi)星標(biāo)記的兩側(cè)序列的堿基數(shù)均≥1個(gè),且所述有效的高通量測(cè)序片段中的所述微衛(wèi)星標(biāo)記中至少有一側(cè)的序列的堿基數(shù)≥10個(gè)。

具體地,所述從成功開(kāi)發(fā)的所述微衛(wèi)星標(biāo)記位點(diǎn)中,選擇所述待檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)的方法包括:

選擇所述待檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)的標(biāo)準(zhǔn)為H值最大的所述微衛(wèi)星標(biāo)記位點(diǎn),其中,H值為所述微衛(wèi)星標(biāo)記位點(diǎn)的多態(tài)性指數(shù),其中,i為按所述微衛(wèi)星標(biāo)記位點(diǎn)的所述有效的高通量測(cè)序片段中的微衛(wèi)星標(biāo)記的長(zhǎng)度進(jìn)行分類(lèi)時(shí),第i個(gè)類(lèi)別,S為所述類(lèi)別的數(shù)目,ai為第i個(gè)類(lèi)別的有效的所述高通量測(cè)序片段的數(shù)目占總的有效的所述高通量測(cè)序片段的數(shù)目的比例。

具體地,選擇所述n個(gè)具有多態(tài)性的棉花樣本的方法包括:選擇外部形態(tài)不同的棉花樣本、生物分類(lèi)不同的棉花樣本、標(biāo)記互不相同的棉花樣本或不同生態(tài)區(qū)域的野生資源的棉花樣本。

具體地,所述探針的數(shù)量為12個(gè),每個(gè)所述探針的簡(jiǎn)單重復(fù)序列中的重復(fù)單元為CT、GA、TG、AC、TA、TGT、CCA、ATC、CCT、AGA、ATG或CAA,每個(gè)所述探針的簡(jiǎn)單重復(fù)序列的重復(fù)次數(shù)為6~20,優(yōu)選為6~15,例如重復(fù)次數(shù)為8或12。

具體地,所述探針的序列如序列表中SEQ IN NO:1-SEQ IN NO:12所示。

另一方面,本發(fā)明實(shí)施例提供了一種上述開(kāi)發(fā)方法成功開(kāi)發(fā)的微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的微衛(wèi)星標(biāo)記的長(zhǎng)度檢測(cè)方法,所述檢測(cè)方法包括:

從成功開(kāi)發(fā)的所述微衛(wèi)星標(biāo)記位點(diǎn)中,選擇待檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn);

利用多重?cái)U(kuò)增引物擴(kuò)增所述待檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的微衛(wèi)星標(biāo)記,得到擴(kuò)增產(chǎn)物,將所述擴(kuò)增產(chǎn)物進(jìn)行高通量測(cè)序,得到第二高通量測(cè)序片段,通過(guò)分析所述第二高通量測(cè)序片段,獲得所述微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的微衛(wèi)星標(biāo)記的長(zhǎng)度。

具體地,所述從成功開(kāi)發(fā)的所述微衛(wèi)星標(biāo)記位點(diǎn)中,選擇所述待檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)的方法包括:

選擇所述待檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)的標(biāo)準(zhǔn)為H值最大的所述微衛(wèi)星標(biāo)記位點(diǎn),其中,H值為所述微衛(wèi)星標(biāo)記位點(diǎn)的多態(tài)性指數(shù),其中,i為按所述微衛(wèi)星標(biāo)記位點(diǎn)的所述有效的高通量測(cè)序片段中的微衛(wèi)星標(biāo)記的長(zhǎng)度進(jìn)行分類(lèi)時(shí),第i個(gè)類(lèi)別,i為自然數(shù);ai為第i個(gè)類(lèi)別的有效的所述高通量測(cè)序片段的數(shù)目占總的有效的所述高通量測(cè)序片段的數(shù)目的比例。

具體地,制備所述多重?cái)U(kuò)增引物的方法包括:

從選擇的所述待檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)的所有所述有效的高通量測(cè)序片段中,提取所述微衛(wèi)星標(biāo)記并挑選出最長(zhǎng)的所述微衛(wèi)星標(biāo)記作為多重?cái)U(kuò)增引物的模版序列的微衛(wèi)星標(biāo)記;

從選擇的所述待檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)的所有所述有效的高通量測(cè)序片段中,提取所述微衛(wèi)星標(biāo)記的左側(cè)序列并挑出長(zhǎng)度大于α2個(gè)堿基的所有序列,從挑選出的所述所有序列中,挑選出頻率最高的序列,以所述頻率最高的序列作為參考序列,將所述參考序列與所有的所述微衛(wèi)星標(biāo)記的左側(cè)序列進(jìn)行比對(duì),在所述頻率最高的序列中獲得每一個(gè)堿基的覆蓋倍數(shù)和變異頻率;在所述頻率最高的序列中,將所述覆蓋倍數(shù)≤1/α3或所述變異頻率≥α3的堿基變?yōu)镹后作為所述多重?cái)U(kuò)增引物的模板序列的左側(cè)序列,其中,N為A、T、C和G四種堿基中任意一種及以上的堿基;α2為第二判定閾值,α2=(所述第一高通量測(cè)序片段的平均長(zhǎng)度-所述多重?cái)U(kuò)增引物的微衛(wèi)星標(biāo)記位點(diǎn)的長(zhǎng)度)÷2;α3為第三判定閾值,α3≥5×(1-所述第一高通量測(cè)序片段的準(zhǔn)確度);

按照與所述多重?cái)U(kuò)增引物的模板序列的左側(cè)序列相同的方法,獲得多重?cái)U(kuò)增引物序列的模板序列的右側(cè)序列;

將所述多重?cái)U(kuò)增引物的模板序列的左側(cè)序列、所述多重?cái)U(kuò)增引物的模板序列的微衛(wèi)星標(biāo)記和所述多重?cái)U(kuò)增引物的模板序列的右側(cè)序列依次連接,得到所述微衛(wèi)星標(biāo)記位點(diǎn)的多重?cái)U(kuò)增引物的模板序列,利用所述微衛(wèi)星標(biāo)記位點(diǎn)的多重?cái)U(kuò)增引物的模板序列,獲得所述多重?cái)U(kuò)增引物。

具體地,獲得所述微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的所述微衛(wèi)星標(biāo)記的長(zhǎng)度的方法為:去除所述第二高通量測(cè)序片段中的所述微衛(wèi)星標(biāo)記后,獲得所述第二高通量測(cè)序片段的左邊界序列和所述第二高通量測(cè)序片段的右邊界序列;利用所述左邊界序列和所述右邊界序列將所述第二高通量測(cè)序片段中的每個(gè)片段比對(duì)到所述待檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)上;截取每一個(gè)所述待檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)的所述第二高通量測(cè)序片段中的所述微衛(wèi)星標(biāo)記;將獲得的所述微衛(wèi)星標(biāo)記按長(zhǎng)度進(jìn)行分類(lèi),并計(jì)算第i個(gè)類(lèi)別的真實(shí)度Ri=Ni/Nmax,其中,i為按所述微衛(wèi)星標(biāo)記位點(diǎn)的所述有效的高通量測(cè)序片段中的微衛(wèi)星標(biāo)記的長(zhǎng)度進(jìn)行分類(lèi)時(shí),第i個(gè)類(lèi)別,Ni為所述第i個(gè)類(lèi)別的所述第二高通量測(cè)序片段的數(shù)量,Nmax為所有類(lèi)別的所述第二高通量測(cè)序片段的數(shù)量的最大值;若所述真實(shí)度Ri≥α4,則所述第i個(gè)類(lèi)別的所述微衛(wèi)星標(biāo)記的長(zhǎng)度為所述微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的所述微衛(wèi)星標(biāo)記的長(zhǎng)度,若所述真實(shí)度Ri<α4,則所述第i個(gè)類(lèi)別的微衛(wèi)星標(biāo)記的長(zhǎng)度不為所述微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的所述微衛(wèi)星標(biāo)記的長(zhǎng)度,其中,α4為第四判定閾值且α4=0.15。

具體地,將所述混合樣本的基因組片段化的方法為機(jī)械打斷或酶切。

本發(fā)明實(shí)施例提供的技術(shù)方案帶來(lái)的有益效果是:本發(fā)明提供的棉花微衛(wèi)星標(biāo)記位點(diǎn)的開(kāi)發(fā)與檢測(cè)技術(shù)簡(jiǎn)單、快捷、高通量、全面且準(zhǔn)確。時(shí)間消耗由1~2年縮短到1~2天;開(kāi)發(fā)出的微衛(wèi)星標(biāo)記位點(diǎn)數(shù)量由基因組中所有微衛(wèi)星標(biāo)記位點(diǎn)的1%左右提高到接近100%;檢驗(yàn)微衛(wèi)星標(biāo)記位點(diǎn)的多態(tài)性的棉花樣本的數(shù)量由數(shù)十個(gè)提升到不受限制,多態(tài)性結(jié)果檢驗(yàn)的準(zhǔn)確性大為提高;可獲得微衛(wèi)星標(biāo)記位點(diǎn)的側(cè)翼序列的保守性,確保了擴(kuò)增微衛(wèi)星標(biāo)記位點(diǎn)的引物的通用性;將多個(gè)微衛(wèi)星標(biāo)記位點(diǎn)作為一個(gè)位點(diǎn)檢測(cè),而不是逐一檢測(cè),多個(gè)待檢測(cè)的棉花樣本只進(jìn)行一次檢測(cè),而不是多次檢測(cè),極大地減少了微衛(wèi)星標(biāo)記位點(diǎn)檢測(cè)的工作量,因此,檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)的數(shù)量幾乎不受限制。微衛(wèi)星標(biāo)記位點(diǎn)檢測(cè)的結(jié)果為堿基,正確率接近100%;微衛(wèi)星標(biāo)記位點(diǎn)檢測(cè)分辨率提升至最高分率:?jiǎn)螇A基;不再需要參照品種對(duì)檢測(cè)結(jié)果進(jìn)行校正。

具體實(shí)施方式

為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將對(duì)本發(fā)明實(shí)施方式作進(jìn)一步地詳細(xì)描述。

本發(fā)明實(shí)施例中未注明或詳細(xì)描述的操作流程或操作規(guī)范均為普通分子生物學(xué)技術(shù)人員所熟知的操作。本發(fā)明實(shí)施例中未注明的試劑或生物材料均為市場(chǎng)上銷(xiāo)售的常用試劑或生物材料,均為普通分子生物學(xué)技術(shù)人員所熟知的,且可以在市場(chǎng)上購(gòu)買(mǎi)到。

實(shí)施例

棉花微衛(wèi)星標(biāo)記位點(diǎn)的開(kāi)發(fā)方法:

將n個(gè)具有多態(tài)性的棉花樣本等量混合,獲得混合樣本,其中n>1。

具有多態(tài)性的樣本包括:外部形態(tài)不同的棉花樣本(形態(tài)多態(tài)性)、生物分類(lèi)(如不同亞種、變種或品種)不同的棉花樣本、標(biāo)記(如蛋白質(zhì)標(biāo)記)互不相同的棉花樣本或不同生態(tài)區(qū)域的野生資源的棉花樣本,其中,所選擇的棉花樣本越多(n值越大),多態(tài)性越豐富,所開(kāi)發(fā)出的微衛(wèi)星標(biāo)記位點(diǎn)的適用性越廣。本實(shí)施例中,待開(kāi)發(fā)的微衛(wèi)星標(biāo)記位點(diǎn)的物種為棉花,所選擇的棉花為不同的棉花品種,它們分別是:鄂雜棉11F1、創(chuàng)雜棉21、中棉所63、銀興棉4號(hào)、中棉所72、中棉所66、同舟雜棉6號(hào)、冀棉616、銀興棉5號(hào)、益豐3號(hào)、創(chuàng)雜棉28、創(chuàng)雜棉27、荊雜棉166F1、中棉所59、冀創(chuàng)棉1、魯棉研23、冀創(chuàng)18F1、創(chuàng)雜棉20、冀棉169、晉棉-26、邯雜306、德棉998、魯05H9、石抗278、泗雜棉6號(hào)、冀棉616、魯棉研28號(hào)、中植棉8號(hào)、國(guó)欣棉9號(hào)、奧棉6號(hào)、國(guó)欣棉8號(hào)、欣抗棉318、嘉星5號(hào)、瑞雜816、新陸中60號(hào)和科抗棉2號(hào),共36個(gè)品種,這些棉花品種是中國(guó)廣泛使用的品種,公開(kāi)且公知,于市場(chǎng)上采購(gòu)獲得。其中,微衛(wèi)星標(biāo)記指由≥2個(gè)堿基組成的重復(fù)單元串聯(lián)重復(fù)構(gòu)成的序列。

取以上36個(gè)棉花品種的等質(zhì)量葉片并混合,提取混合樣本的基因組,提取方法按照天根生化科技(北京)有限公司的貨號(hào)為DP320的新型植物基因組提取試劑盒的操作手冊(cè)進(jìn)行。在本實(shí)施例中所選的棉花樣本為葉片,作為公知常識(shí),該棉花樣本還可以取自種子等部位。

將混合樣本的基因組片段化,獲得基因組片段。具體地,將混合樣本的基因組片段化的方法包括:機(jī)械打斷或酶切?;蚪M片段化的長(zhǎng)度控制在高通量測(cè)序時(shí)可檢測(cè)的片段長(zhǎng)度范圍內(nèi)。本實(shí)施例中,高通量測(cè)序采用PROTON高通量測(cè)序儀的PI芯片,其檢測(cè)長(zhǎng)度約為200bp,因此,獲取的基因組片段的長(zhǎng)度的峰值也盡量控制在200bp附近。本實(shí)施例采用自動(dòng)聲波聚焦破碎儀Covaris S220(美國(guó)Covaris生產(chǎn),型號(hào)為S220)破碎混合樣本的基因組,破碎方法按該儀器的操作手冊(cè)《DNA Shearing with S220/E220Focused-ultrasonicator》(版本號(hào):010308Rev G)中所記載的獲取200bp(峰值)目標(biāo)片段的方法進(jìn)行,破碎后即獲得混合樣本的基因組片段,采用美國(guó)Quawell公司生產(chǎn)的Q5000分光光度計(jì)按其雙鏈DNA的程序?qū)蚪M片段進(jìn)行檢測(cè)后,將濃度稀釋或濃縮到100ng/μL,獲得基因組片段。

將多個(gè)生物素標(biāo)記的具有簡(jiǎn)單重復(fù)序列的探針作為探針組,利用探針組與基因組片段進(jìn)行雜交,獲得雜交溶液。具有簡(jiǎn)單重復(fù)序列的探針中的重復(fù)單元的堿基數(shù)≥2個(gè)。具體地,探針的簡(jiǎn)單重復(fù)序列中的重復(fù)單元為CT、GA、TG、AC、TA、TGT、CCA、ATC、CCT、AGA、ATG或CAA,這12個(gè)探針可以與所有可能的2堿基和3堿基為重復(fù)單元的微衛(wèi)星標(biāo)記進(jìn)行雜交,因此,可以用于所有物種中的基因組片段中的微衛(wèi)星標(biāo)記的釣取。前期實(shí)驗(yàn)中,我們檢測(cè)了不同探針長(zhǎng)度鉤取微衛(wèi)星標(biāo)記的效率,發(fā)現(xiàn)探針的簡(jiǎn)單重復(fù)序列的重復(fù)次數(shù)為6~20時(shí),效率較高,優(yōu)選的重復(fù)次數(shù)為6~15,例如8或12。在本實(shí)施例中,該探針組包括12個(gè)探針,這12個(gè)探針的序列分別如序列表中SEQ IN NO:1-SEQ IN NO:12所示。以上探針均由北京擎科新業(yè)生物技術(shù)有限公司合成并進(jìn)行5’端生物素標(biāo)記。前期的實(shí)驗(yàn)表明,將不同探針?lè)謩e釣取基因組片段中的微衛(wèi)星標(biāo)記的效率優(yōu)于將所有探針混合后釣取基因組片段中的微衛(wèi)星標(biāo)記的效率,因此,在本實(shí)施例中利用不同探針?lè)謩e釣取基因組片段中的微衛(wèi)星標(biāo)記,具體地,將以上每個(gè)探針?lè)謩e用無(wú)酶水溶解為等摩爾濃度(10pM/μL)的溶液,取以上探針組中的12個(gè)探針各1μL分別與5μg混合樣本的基因組片段混勻后雜交,分別獲得12種雜交溶液。雜交的程序?yàn)椋?5℃10分鐘,65℃10分鐘,37℃10分鐘。

利用鏈霉親和素磁珠純化雜交溶液中成功雜交的基因組片段,獲得純化的基因組片段。具體地,利用鏈霉親和素磁珠分別純化12種雜交溶液,其純化過(guò)程為:將獲得的12種中的1種雜交溶液置于磁力架(美國(guó)Invitrogen公司生產(chǎn))上,至雜交溶液澄清后,吸去溶液,用無(wú)酶水清洗磁珠2次,取10μL無(wú)酶水與鏈霉親和素磁珠混合,于PCR儀中95℃加熱5分鐘,迅速置于磁力架上,獲得的溶液即為第一個(gè)探針的純化的雜交基因組片段。按與獲取的第一個(gè)探針的純化的雜交基因組片段相同的方法,依次獲取所有12個(gè)純化的雜交基因組片段,將它們混合在一起,即最終獲得所有探針的純化的雜交基因組片段。為了能夠成功純化雜交基因組片段,在本實(shí)施例中,采用生物素標(biāo)記的具有簡(jiǎn)單重復(fù)序列的探針配合鏈霉親和素磁珠的方式,在其它實(shí)施例中,也可以采用其它的方式進(jìn)行基因組片段的雜交和純化。

利用二代高通量測(cè)序檢測(cè)純化的雜交基因組片段,獲得第一高通量測(cè)序片段。利用DNA文庫(kù)制備試劑盒(由英國(guó)NEB公司生產(chǎn),貨號(hào)為E6270L)并按該試劑盒的操作手冊(cè)構(gòu)建二代高通量測(cè)序文庫(kù),利用獲得的二代高通量測(cè)序文庫(kù)和試劑盒Ion PI Template OT2 200Kit v2(美國(guó)invirtrigen公司生產(chǎn),貨號(hào)為4485146)進(jìn)行測(cè)序前的ePCR(Emulsion PCR,乳化聚合酶鏈反應(yīng))擴(kuò)增,操作方法按該試劑盒的操作手冊(cè)進(jìn)行,獲得ePCR擴(kuò)增產(chǎn)物。利用ePCR擴(kuò)增產(chǎn)物和試劑盒Ion PI Sequencing 200Kit v2(美國(guó)invirtrigen公司生產(chǎn),貨號(hào)為4485149)在Proton二代高通量測(cè)序儀上進(jìn)行高通量測(cè)序,操作方法按該試劑盒的操作手冊(cè)進(jìn)行。在本實(shí)施例中,高通量測(cè)序量設(shè)置為10M測(cè)序片段(1M=100萬(wàn)),測(cè)序長(zhǎng)度設(shè)置為500cycle(循環(huán)),測(cè)序結(jié)束后,獲得第一高通量測(cè)序片段。

從第一高通量測(cè)序片段中,篩選有效的高通量測(cè)序片段。其中,有效的高通量測(cè)序片段包括微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的微衛(wèi)星標(biāo)記,有效的高通量測(cè)序片段中的微衛(wèi)星標(biāo)記的兩側(cè)序列的堿基數(shù)均≥1個(gè),且有效的高通量測(cè)序片段中的微衛(wèi)星標(biāo)記中至少有一側(cè)的序列的堿基數(shù)≥10個(gè)。分析第一高通量測(cè)序片段中的每一條片段是否含有微衛(wèi)星標(biāo)記,去掉不含有微衛(wèi)星標(biāo)記的第一高通量測(cè)序片段。在保留下來(lái)的第一高通量測(cè)序片段中,分析微衛(wèi)星標(biāo)記的兩側(cè)序列的堿基數(shù)是否均≥1個(gè),如果是,則表明微衛(wèi)星標(biāo)記在第一高通量測(cè)序片段中是完整的,這一點(diǎn)是必要的,因?yàn)槲⑿l(wèi)星標(biāo)記的多態(tài)性是指微衛(wèi)星標(biāo)記的長(zhǎng)度多態(tài)性,只有確保微衛(wèi)星標(biāo)記是完整的,才能正確獲得微衛(wèi)星標(biāo)記的長(zhǎng)度多態(tài)性,以便正確地進(jìn)行后續(xù)分析。微衛(wèi)星標(biāo)記的兩側(cè)序列均小于10個(gè)堿基的第一高通量測(cè)序片段無(wú)法準(zhǔn)確地進(jìn)行后續(xù)的同源性分析,會(huì)因?yàn)樾蛄羞^(guò)短而引入誤差,因此,進(jìn)一步去掉微衛(wèi)星標(biāo)記的兩側(cè)序列均小于10個(gè)堿基的第一高通量測(cè)序片段。經(jīng)過(guò)以上流程,最終保留下來(lái)的第一高通測(cè)序片段即為有效的高通量測(cè)序片段。

其中,在分析第一高通量測(cè)序片段中的每一條片段是否含有微衛(wèi)星標(biāo)記時(shí),可以采用現(xiàn)有技術(shù)中常用的分析軟件進(jìn)行分子,也可以簡(jiǎn)單的通過(guò)人工對(duì)每個(gè)第一高通量測(cè)序片段進(jìn)行判斷。

根據(jù)有效的高通量測(cè)序片段中的微衛(wèi)星標(biāo)記的兩側(cè)序列的同源性對(duì)有效的高通量測(cè)序片段進(jìn)行分類(lèi),同一類(lèi)的有效的高通量測(cè)序片段為同一個(gè)微衛(wèi)星標(biāo)記位點(diǎn)的有效的高通量測(cè)序片段,若同一個(gè)微衛(wèi)星標(biāo)記位點(diǎn)的有效的高通量測(cè)序片段的條數(shù)≥α1,則成功開(kāi)發(fā)一個(gè)微衛(wèi)星標(biāo)記位點(diǎn),其中,α1為第一判定閾值且α1≥(高通測(cè)序深度×有效的高通量測(cè)序片段的比例/基因組上能檢測(cè)到的微衛(wèi)星標(biāo)記位點(diǎn)數(shù))×概率保證。α1的具體取值可根據(jù)高通量測(cè)序的深度進(jìn)行調(diào)整。將有效的高通量測(cè)序片段中的微衛(wèi)星標(biāo)記去掉,將剩余的兩側(cè)序列合并成一條完整的序列,采用軟件Megablast(版本2.2.26)在合并后的完整的序列間進(jìn)行成對(duì)的比對(duì)分析,比對(duì)的各參數(shù)設(shè)置為:參數(shù)-e設(shè)置為1e-5;參數(shù)-p設(shè)置為0;參數(shù)–v設(shè)置為5000;參數(shù)-m設(shè)置為1。將具有同源性(同源性指在DNA序列上相似)的有效的高通量測(cè)序片段歸為同一類(lèi),同時(shí)計(jì)算類(lèi)別內(nèi)包含的有效的高通量測(cè)序片段的數(shù)量,若包含的有效的高通量測(cè)序片段的數(shù)量≥α1條時(shí),則該類(lèi)別的有效的高通量測(cè)序片段為一個(gè)成功開(kāi)發(fā)的微衛(wèi)星標(biāo)記位點(diǎn)的高通量測(cè)序片段。其具體原理如下:基因組上同一個(gè)微衛(wèi)星標(biāo)記位點(diǎn)在高通量測(cè)序過(guò)程中,可能被檢測(cè)到多次,由于高通量測(cè)序的對(duì)象為包含了多個(gè)具有多態(tài)性的樣本的混合樣本,因此,同一個(gè)微衛(wèi)星標(biāo)記位點(diǎn)中的微衛(wèi)星標(biāo)記的長(zhǎng)度存在多態(tài)性變異,微衛(wèi)星標(biāo)記位點(diǎn)的兩側(cè)序列也存在變異,因此,不能要求同一個(gè)微衛(wèi)星標(biāo)記位點(diǎn)的所有有效的高通量測(cè)序片段的序列完全相同,只能根據(jù)高通量測(cè)序片段的同源性來(lái)判定是否為同一微衛(wèi)星標(biāo)記位點(diǎn),其中,高通量測(cè)序片段包括微衛(wèi)星標(biāo)記與微衛(wèi)星標(biāo)記的兩側(cè)序列,因此,高通量測(cè)序片段的同源性可以是微衛(wèi)星標(biāo)記的同源性或者微衛(wèi)星標(biāo)記的兩側(cè)序列的同源性。不同的微衛(wèi)星標(biāo)記位點(diǎn)中的微衛(wèi)星標(biāo)記可能相同,因此,不能根據(jù)微衛(wèi)星標(biāo)記的同源性判定有效的高通量測(cè)序片段是否屬于同一微衛(wèi)星標(biāo)記位點(diǎn),只能根據(jù)微衛(wèi)星標(biāo)記位點(diǎn)的兩側(cè)序列的同源性判定有效的高通量測(cè)序片段是否屬于同一微衛(wèi)星標(biāo)記位點(diǎn)。之所以要求同一個(gè)微衛(wèi)星標(biāo)記位點(diǎn)的有效的高通量測(cè)序片段的數(shù)量≥α1是為了防止諸如樣本被污染等難以控制的因素造成的假陽(yáng)性。α1≥3是生物信息學(xué)中確認(rèn)一個(gè)片段真實(shí)存在時(shí),一般采用的閾值,α1的具體取值可根據(jù)高通量測(cè)序的深度進(jìn)行調(diào)整,可按以下公式計(jì)算:α1≥(高通測(cè)序深度×有效的高通量測(cè)序片段的比例/基因組上的能檢測(cè)到的微衛(wèi)星標(biāo)記位點(diǎn)數(shù))×概率保證,其中,在統(tǒng)計(jì)上,概率保證一般取值為5%或1%。本實(shí)施例中,高通量測(cè)序的深度為1000萬(wàn)條,有效的高通量測(cè)序片段的比例一般為40%左右,一般基因組上的能檢測(cè)到的微衛(wèi)星標(biāo)記位點(diǎn)為1萬(wàn)個(gè)左右,因此,平均每個(gè)微衛(wèi)星標(biāo)記位點(diǎn)包含的有效的高通量測(cè)序片段為400條,實(shí)際的微衛(wèi)星標(biāo)記位點(diǎn)的測(cè)序深度呈現(xiàn)正態(tài)分布,所以,一般低于平均有效的高通量測(cè)序片段數(shù)1/20(5%)的分布較少。因此,本實(shí)施例中,α1取值為20條。按以上流程和標(biāo)準(zhǔn),本實(shí)施例中,共成功開(kāi)發(fā)出17888個(gè)微衛(wèi)星標(biāo)記位點(diǎn)。

選擇待檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)的標(biāo)準(zhǔn)為H值最大的微衛(wèi)星標(biāo)記位點(diǎn),其中,H值為微衛(wèi)星標(biāo)記位點(diǎn)的多態(tài)性指數(shù),其中,i為按微衛(wèi)星標(biāo)記位點(diǎn)的有效的高通量測(cè)序片段中的微衛(wèi)星標(biāo)記的長(zhǎng)度進(jìn)行分類(lèi)時(shí),第i個(gè)類(lèi)別,i為自然數(shù);ai為第i個(gè)類(lèi)別的有效的高通量測(cè)序片段的數(shù)目占總的有效的高通量測(cè)序片段的數(shù)目的比例。如表1的假定的微衛(wèi)星標(biāo)記位點(diǎn)按有效的高通量測(cè)序片段中的微衛(wèi)星標(biāo)記的長(zhǎng)度進(jìn)行分類(lèi),共有3種:(TG)20、(TG)21和(TG)22,因此S=3;該微衛(wèi)星標(biāo)記位點(diǎn)的總的有效的高通量測(cè)序片段的數(shù)目為40,其中,第1種微衛(wèi)星標(biāo)記(TG)20的數(shù)目為3條,因此a1=3/40=7.50%,同樣計(jì)算a2=32/40=80%,a3=5/40=12.50%。將以上值代入H的計(jì)算公式獲得該微衛(wèi)星標(biāo)記位點(diǎn)的H值為0.98。

按與表1的假定的微衛(wèi)星標(biāo)記位點(diǎn)相同的計(jì)算方法,計(jì)算本實(shí)施例中所有成功開(kāi)發(fā)出的所有微衛(wèi)星標(biāo)記位點(diǎn)的H值,所有獲得的微衛(wèi)星標(biāo)記位點(diǎn)的H值由大到小排列,選擇排序前50位的微衛(wèi)星標(biāo)記位點(diǎn)為本實(shí)施中待檢測(cè)的樣本中需要檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)。參數(shù)50根據(jù)實(shí)際需要定,例如,在棉花純度鑒定時(shí),1個(gè)微衛(wèi)星標(biāo)記位點(diǎn)即可,在棉花指紋圖譜構(gòu)建時(shí),一般選擇50個(gè)左右的微衛(wèi)星標(biāo)記位點(diǎn),在品種間實(shí)質(zhì)性派生關(guān)系分析時(shí),則要求選擇大概300個(gè)微衛(wèi)星標(biāo)記位點(diǎn)才能滿(mǎn)足要求。之所以選擇H值最大的微衛(wèi)星標(biāo)記位點(diǎn),是因?yàn)樗鼈兊膮^(qū)分能力最強(qiáng),用最少的微衛(wèi)星標(biāo)記位點(diǎn)可以盡可能區(qū)分更多的樣本并提供盡可能多的信息,而區(qū)分樣本是微衛(wèi)星標(biāo)記技術(shù)最核心的任務(wù)。

提取微衛(wèi)星標(biāo)記位點(diǎn)的所有有效的高通量測(cè)序片段中的微衛(wèi)星標(biāo)記,如表1所列的假定的微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的微衛(wèi)星標(biāo)記為3條(TG)20、32條(TG)21和5條(TG)22的集合。提取微衛(wèi)星標(biāo)記位點(diǎn)的所有有效高通量測(cè)序片段中的微衛(wèi)星標(biāo)記的左側(cè)序列組成微衛(wèi)星標(biāo)記位點(diǎn)的左側(cè)序列,如表1的假定的微衛(wèi)星標(biāo)記位點(diǎn)的左側(cè)序列為3條(A)2G(A)2、5條(A)87G(A)3、27條(A)86G(A)3和5條(A)81G(A)4的集合。同樣的方法,獲得微衛(wèi)星標(biāo)記位點(diǎn)的右側(cè)序列,如表1的假定的微衛(wèi)星標(biāo)記的右側(cè)序列為3條(A)4G(A)80、5條(A)3G(A)2、27條(A)3G(A)81和5條2G(A)85的集合。

棉花微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的微衛(wèi)星標(biāo)記的長(zhǎng)度的檢測(cè)方法:

從成功開(kāi)發(fā)的微衛(wèi)星標(biāo)記位點(diǎn)中,選擇待檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn),設(shè)計(jì)擴(kuò)增待檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)的多重?cái)U(kuò)增引物。下面以表1中的假定的微衛(wèi)星標(biāo)記位點(diǎn)為例,介紹如何選擇微衛(wèi)星標(biāo)記位點(diǎn)并設(shè)計(jì)多重?cái)U(kuò)增引物。

設(shè)計(jì)擴(kuò)增選擇的微衛(wèi)星標(biāo)記位點(diǎn)的多重?cái)U(kuò)增引物的方法包括:從選擇的微衛(wèi)星標(biāo)記位點(diǎn)的所有有效的高通量測(cè)序片段中,提取微衛(wèi)星標(biāo)記,從中挑選出最長(zhǎng)的微衛(wèi)星標(biāo)記,作為多重?cái)U(kuò)增引物設(shè)計(jì)的微衛(wèi)星標(biāo)記;如表1的假定的微衛(wèi)星標(biāo)記位點(diǎn)中,(TG)22為最長(zhǎng)的微衛(wèi)星標(biāo)記,因此,(TG)22為該微衛(wèi)星標(biāo)記位點(diǎn)的多重?cái)U(kuò)增引物設(shè)計(jì)的模板序列的微衛(wèi)星標(biāo)記。之所以選擇最長(zhǎng)的微衛(wèi)星標(biāo)記是保證所設(shè)計(jì)的多重?cái)U(kuò)增引物所擴(kuò)增的微衛(wèi)星位點(diǎn)的長(zhǎng)度不會(huì)超過(guò)多重PCR的擴(kuò)增能力,從而減少微衛(wèi)星檢測(cè)時(shí)的數(shù)據(jù)缺失。

從選擇的微衛(wèi)星標(biāo)記位點(diǎn)的所有有效的高通量測(cè)序片段中,提取微衛(wèi)星標(biāo)記的左側(cè)序列,從中挑出長(zhǎng)度大于α2個(gè)堿基的所有序列,α2為第二判定閾值,α2=(二代高通量測(cè)序技術(shù)所能檢測(cè)的第一高通量測(cè)序片段的平均長(zhǎng)度-多重?cái)U(kuò)增引物的微衛(wèi)星標(biāo)記位點(diǎn)的長(zhǎng)度)÷2。本實(shí)施例中,第一高通量測(cè)序片段的平均長(zhǎng)度為200bp,多重?cái)U(kuò)增引物設(shè)計(jì)的微衛(wèi)星標(biāo)記的長(zhǎng)度為44(TG重復(fù)22次,長(zhǎng)度為44),因此α2=78bp。因此,微衛(wèi)星標(biāo)記的左側(cè)序列中,挑出的長(zhǎng)度大于α2的所有序列為5條(A)87G(A)3、27條(A)86G(A)3和5條(A)81G(A)4的集合。從挑選出的所有序列中,挑選出頻率最高的序列,例如上述挑出的長(zhǎng)度大于α2的所有序列中,頻率最高的序列為(A)86G(A)3。以頻率最高的序列作為參考序列與所有的微衛(wèi)星標(biāo)記的左側(cè)序列進(jìn)行比對(duì),獲得頻率最高的序列中每一個(gè)堿基的覆蓋倍數(shù)和變異頻率。例如,表1的假定的微衛(wèi)星標(biāo)記位點(diǎn)中,應(yīng)該以(A)86G(A)3為參考序列與所有的左側(cè)序列進(jìn)行比對(duì),比對(duì)時(shí),參考序列(A)86G(A)3的5’端的第1個(gè)堿基為A,其被覆蓋了5+27=32倍,由于該位置全是A,因此,變異頻率為0,(A)86G(A)3的5’端的第87個(gè)堿基為G,其同樣被覆蓋了5+27=32倍,其中,不為G的堿基有5個(gè)(在5條(A)81G(A)4中),因此變異頻率為5÷(5+27+5)=0.175,按以上方法,計(jì)算獲得(A)86G(A)3中每一個(gè)堿基的覆蓋倍數(shù)和變異頻率。將頻率最高的序列中的覆蓋倍數(shù)≤1/α3或變異頻率≥α3的堿基變?yōu)镹后作為多重?cái)U(kuò)增引物設(shè)計(jì)的左側(cè)序列,其中,N為A、T、C和G四種堿基中任意一種及以上的堿基;α3為第三判定閾值,α3≥5×(1-第一高通量測(cè)序片段的準(zhǔn)確度),α3的具體值根據(jù)多重?cái)U(kuò)增引物的通用性的要求的嚴(yán)格程度和高通量測(cè)序的深度進(jìn)行調(diào)整,要求通用性越強(qiáng)或高通量測(cè)序深度越深,則α3的值越小。在本實(shí)施例中,高通量測(cè)序的準(zhǔn)確度為99%,因此α3≥5×(1-99%)=5%,本實(shí)施例要求所設(shè)計(jì)的多重?cái)U(kuò)增引物的通用性強(qiáng),因此,α3取值為5%。因此,在表1的假定的微衛(wèi)星標(biāo)記位點(diǎn)中,將出頻率最高的序列((A)86G(A)3)中的覆蓋倍數(shù)≤1/5%=20或變異頻率≥0.05的堿基記為變?yōu)镹后作為多重?cái)U(kuò)增引物的模板序列的左側(cè)序列。對(duì)于(A)86G(A)3第1個(gè)堿基,其被覆蓋了32倍且變異頻率為0,因此,不改變?yōu)镹,對(duì)于(A)86G(A)3第86個(gè)堿基,其覆蓋倍數(shù)32倍但變異頻率為0.175≥0.05,因此,將該堿基變?yōu)镹,按此規(guī)則,在表1的假定的微衛(wèi)星標(biāo)記位點(diǎn)中,多重?cái)U(kuò)增引物的模板序列的左側(cè)序列為(A)85NNN(A)2。變異頻率高的堿基混合樣本中變異度大,因此,所設(shè)計(jì)的多重?cái)U(kuò)增引物通用性差,覆蓋倍數(shù)低的堿基誤差大,把它們都變成N后,在后續(xù)的多重引物設(shè)計(jì)流程中,就可以避開(kāi)這些堿基位點(diǎn),以確保設(shè)計(jì)出來(lái)的多重?cái)U(kuò)增引物可以在不同樣本間通用。傳統(tǒng)的微衛(wèi)星標(biāo)記開(kāi)發(fā)由于工作量的限制,一個(gè)微衛(wèi)星標(biāo)記的邊界序列往往只能被檢測(cè)到一次或少數(shù)幾次,不能獲得并避開(kāi)引物設(shè)計(jì)區(qū)的變異堿基,難以保障擴(kuò)增引物的通用性,易造成數(shù)據(jù)缺失。

按與多重?cái)U(kuò)增引物的模板序列的左側(cè)序列完全相同的方法,獲得多重?cái)U(kuò)增引物的模板序列的右側(cè)序列。在表1的假定的微衛(wèi)星標(biāo)記位點(diǎn)中,多重?cái)U(kuò)增引物的模板序列的右側(cè)序列為(A)2NNN(A)80。將多重?cái)U(kuò)增引物的模板序列的左側(cè)序列、多重?cái)U(kuò)增引物的模板序列的微衛(wèi)星標(biāo)記和多重?cái)U(kuò)增引物的模板序列的右側(cè)序列依次連接,得到微衛(wèi)星標(biāo)記位點(diǎn)的多重?cái)U(kuò)增引物的模板序列,利用微衛(wèi)星標(biāo)記位點(diǎn)的多重?cái)U(kuò)增引物的模板序列,獲得多重?cái)U(kuò)增引物。表1中的假定的微衛(wèi)星標(biāo)記位點(diǎn)的多重?cái)U(kuò)增引物的模板序列為(A)85NNN(A)2(TG)22(A)2NNN(A)80。

按與上述相同的方法與參數(shù),獲得本實(shí)施中最終選擇的50個(gè)微衛(wèi)星標(biāo)記位點(diǎn)的多重?cái)U(kuò)增引物的模板序列。

表1一個(gè)假定的微衛(wèi)星標(biāo)記位點(diǎn)的第一高通量測(cè)序片段

表1所示的第一高通量測(cè)序片段類(lèi)型中,帶下劃線(xiàn)的部分代表微衛(wèi)星標(biāo)記,括號(hào)內(nèi)的字母表示微衛(wèi)星標(biāo)記的重復(fù)單元,括號(hào)后的數(shù)字代表重復(fù)單元的重復(fù)次數(shù)。

利用所有微衛(wèi)星標(biāo)記位點(diǎn)的多重?cái)U(kuò)增引物的模板序列設(shè)計(jì)擴(kuò)增選擇的微衛(wèi)星標(biāo)記位點(diǎn)的多重?cái)U(kuò)增引物。具體方法如下:將獲得的50個(gè)微衛(wèi)星標(biāo)記位點(diǎn)的多重?cái)U(kuò)增引物的模板序列用100個(gè)N連接起來(lái),構(gòu)建成一個(gè)人工參考基因組。登錄多重PCR引物在線(xiàn)設(shè)計(jì)網(wǎng)頁(yè)https://ampliseq.com/,在“Application type”選項(xiàng)選擇“DNA Hotspot designs(single-pool)”。并在“Select the genome you wish to use”選項(xiàng)中選擇“Custom”后,上傳構(gòu)建人工參考基因組?!癉NA Type”選項(xiàng)選擇“Standard DNA”。在“Add Hotspot”選項(xiàng)中,填入構(gòu)建的人工參考基因組中每一個(gè)微衛(wèi)星標(biāo)記的起始位置與終止位置,最后點(diǎn)擊“Submit targets”按鈕提交并獲得多重?cái)U(kuò)增引物的序列。本實(shí)施例中,所選擇的50個(gè)微衛(wèi)星標(biāo)記位點(diǎn)中,成功設(shè)計(jì)了多重?cái)U(kuò)增引物的微衛(wèi)星標(biāo)記位點(diǎn)為48個(gè),這個(gè)48個(gè)微衛(wèi)星標(biāo)記位點(diǎn)即為待檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)。本實(shí)施例采用美國(guó)賽默飛世爾公司提供的多重PCR技術(shù),其能夠同時(shí)擴(kuò)增多至12000個(gè)測(cè)試區(qū)域,因此,本發(fā)明有能力一次性檢測(cè)12000個(gè)微衛(wèi)星標(biāo)記位點(diǎn),這是傳統(tǒng)的微衛(wèi)星標(biāo)記位點(diǎn)檢測(cè)能力的12000倍。

通過(guò)多重?cái)U(kuò)增引物擴(kuò)增待檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的微衛(wèi)星標(biāo)記,得到擴(kuò)增產(chǎn)物,將擴(kuò)增產(chǎn)物進(jìn)行高通量測(cè)序,得到第二高通量測(cè)序片段。本實(shí)施例中,待檢測(cè)的樣本為武漢棉花田中取的100株棉花葉片,將100株棉花葉片等量混合后獲得混合樣本,利用植物基因組DNA提取試劑盒(貨號(hào):DP305,生產(chǎn)公司:天根生化科技(北京)有限公司)按其操作手冊(cè)提供的方法提取獲得混合樣本的基因組DNA。采用所設(shè)計(jì)的48對(duì)多重?cái)U(kuò)增引物和文庫(kù)構(gòu)建試劑盒2.0(由美國(guó)LifeTechnology公司生產(chǎn),貨號(hào)為4475345)并按該試劑盒的操作手冊(cè)對(duì)混合樣本的基因組DNA進(jìn)行擴(kuò)增,構(gòu)建高通量測(cè)序文庫(kù),利用獲得的高通量測(cè)序文庫(kù)和試劑盒Ion PI Template OT2 200Kit v2(美國(guó)invirtrigen公司生產(chǎn),貨號(hào)為4485146)進(jìn)行測(cè)序前的ePCR(Emulsion PCR,乳化聚合酶鏈反應(yīng))擴(kuò)增,操作方法按該試劑盒的操作手冊(cè)進(jìn)行,獲得ePCR產(chǎn)物。利用ePCR產(chǎn)物和試劑盒Ion PI Sequencing 200Kit v2(美國(guó)invirtrigen公司生產(chǎn),貨號(hào)為4485149)在Proton二代高通量測(cè)序儀上進(jìn)行高通量測(cè)序,操作方法按該試劑盒的操作手冊(cè)進(jìn)行。在本實(shí)施例中,高通量測(cè)序量設(shè)置為1M測(cè)序片段(1M=100萬(wàn)),高通量測(cè)序長(zhǎng)度設(shè)置為500cycle(循環(huán)),測(cè)序結(jié)束后,獲得第二高通量測(cè)序產(chǎn)物。

通過(guò)分析第二高通量測(cè)序產(chǎn)物,獲得微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的微衛(wèi)星標(biāo)記的長(zhǎng)度。具體方法為:去除第二高通量測(cè)序片段中的微衛(wèi)星標(biāo)記后,獲得第二高通量測(cè)序片段的左邊界序列和第二高通量測(cè)序片段的右邊界序列;利用左邊界序列和右邊界序列將第二高通量測(cè)序片段中的每個(gè)片段比對(duì)到待檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)上;截取每一個(gè)待檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)的第二高通量測(cè)序片段中的微衛(wèi)星標(biāo)記;將獲得的微衛(wèi)星標(biāo)記按長(zhǎng)度進(jìn)行分類(lèi),并計(jì)算第i個(gè)類(lèi)別的真實(shí)度Ri=Ni/Nmax,其中,Ni為第i個(gè)類(lèi)別的第二高通量測(cè)序片段的數(shù)量,Nmax為所有類(lèi)別的第二高通量測(cè)序片段的數(shù)量的最大值;若真實(shí)度Ri≥α4,則第i個(gè)類(lèi)別的微衛(wèi)星標(biāo)記的長(zhǎng)度為微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的微衛(wèi)星標(biāo)記的長(zhǎng)度,若真實(shí)度Ri<α4,則第i個(gè)類(lèi)別的微衛(wèi)星標(biāo)記的長(zhǎng)度不為微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的微衛(wèi)星標(biāo)記的長(zhǎng)度,其中,α4為第四判定閾值。微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的微衛(wèi)星標(biāo)記的多態(tài)性是由于微衛(wèi)星標(biāo)記中的簡(jiǎn)單重復(fù)序列的重復(fù)次數(shù)不一致造成的長(zhǎng)度多態(tài)性,因此,微衛(wèi)星標(biāo)記位點(diǎn)的檢測(cè)主要是指檢測(cè)微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的微衛(wèi)星標(biāo)記的長(zhǎng)度。一般的物種為二倍體,如果樣本是純合的,那么,同一個(gè)微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)應(yīng)該只包含一種微衛(wèi)星標(biāo)記的等位位點(diǎn),如果樣本是雜合的,則同一個(gè)微衛(wèi)星標(biāo)記位點(diǎn)有2個(gè)不同微衛(wèi)星標(biāo)記的等位位點(diǎn)。如果樣本是多倍體,如棉花和棉花,則判定標(biāo)準(zhǔn)也應(yīng)該做相應(yīng)調(diào)整。微衛(wèi)星標(biāo)記位點(diǎn)在進(jìn)行多重?cái)U(kuò)增時(shí),微衛(wèi)星標(biāo)記擴(kuò)增可能會(huì)產(chǎn)生滑動(dòng),因此,在第二高通量測(cè)序片段中,部分由于滑動(dòng)產(chǎn)生的微衛(wèi)星標(biāo)記的長(zhǎng)度與混合樣本中的真實(shí)的微衛(wèi)星標(biāo)記的長(zhǎng)度不相同,從而形成干擾噪音,真實(shí)度Ri可以反應(yīng)了干擾噪音的強(qiáng)弱,Ri值越大,則干擾越小。因此,需要設(shè)定一個(gè)真實(shí)度的判定閾值α4以確定第i種類(lèi)別中的微衛(wèi)星標(biāo)記是否真實(shí)存在。在缺乏已有參考資料的情況下且為純合體(一個(gè)位點(diǎn)只可能有一種基因型)時(shí),α4一般取值為0.6;若為雜合體時(shí),則可利用0.6/X作為α4的值,其中,X為待檢測(cè)物種的倍性水平,例如若為4倍體,則α4的值為0.6/4=0.15。若已知的滑動(dòng)產(chǎn)生的微衛(wèi)星標(biāo)記干擾的大小,則可以制定更具體的標(biāo)準(zhǔn)。例如,當(dāng)已知某個(gè)微衛(wèi)星標(biāo)記位點(diǎn)在100次檢測(cè)中,有95次以上的滑動(dòng)產(chǎn)生的干擾微衛(wèi)星標(biāo)記的比例均小于0.3,那么,我們可以將α4的取值確定為0.3,那么,我們有95%的置信度保障我們獲得的第i個(gè)類(lèi)別的微衛(wèi)星標(biāo)記的基因型是真實(shí)存在的。值得一提的是,若α4取值較大,則判定微衛(wèi)星標(biāo)記真實(shí)存在時(shí)犯錯(cuò)的概率就較低,但可能將部分真實(shí)存在的微衛(wèi)星標(biāo)記誤判為不存在;相反,若α4取值較小,則更多真實(shí)存在的微衛(wèi)星標(biāo)記將被判斷出來(lái),但判定微衛(wèi)星標(biāo)記真實(shí)存在時(shí)犯錯(cuò)的概率就較高。因此,本實(shí)施例中α4的取值只是其中一種方式,需要根據(jù)實(shí)際需要或者已有的研究結(jié)果進(jìn)行調(diào)整。在本實(shí)施例子中,因?yàn)槿狈⒖假Y料確定α4的值且待測(cè)樣本為二倍體,為雜合體,所以,α4取值為0.6/4=0.15。由于滑動(dòng)產(chǎn)生的虛假的微衛(wèi)星標(biāo)記與真實(shí)的微衛(wèi)星標(biāo)記的擴(kuò)增產(chǎn)物長(zhǎng)度差異不大,而且傳統(tǒng)的微衛(wèi)星標(biāo)記的檢測(cè)方法多為電泳,無(wú)法區(qū)分較小的長(zhǎng)度差異,即使能夠區(qū)分,也無(wú)法準(zhǔn)確定量,因此,傳統(tǒng)的微衛(wèi)星標(biāo)記檢測(cè)時(shí),無(wú)法計(jì)算或無(wú)法準(zhǔn)確計(jì)算Ri的值,造成大量的不準(zhǔn)確甚至錯(cuò)誤的結(jié)論。

下面再次假定表1為一個(gè)檢測(cè)到的微衛(wèi)星標(biāo)記位點(diǎn),說(shuō)明如何檢測(cè)混合樣本中待檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)。在表1中假定的微衛(wèi)星標(biāo)記位點(diǎn)的第二高通量測(cè)序片段中,截取的微衛(wèi)星標(biāo)記為3條(TG)20、32條(TG)21和5條(TG)22的集合,將截取的微衛(wèi)星標(biāo)記按重復(fù)單元分類(lèi),均為T(mén)G,保留出現(xiàn)頻率最高的重復(fù)單元的微衛(wèi)星標(biāo)記,它們?yōu)?條(TG)20、32條(TG)21和5條(TG)22的集合;將保留下來(lái)的微衛(wèi)星標(biāo)記進(jìn)一步按長(zhǎng)度進(jìn)行分類(lèi),共獲得3個(gè)類(lèi)別,分別為(TG)20、(TG)21和(TG)22。在這3個(gè)類(lèi)別中,占有最多的第二高通量測(cè)序片段的數(shù)量的類(lèi)別為第2個(gè)類(lèi)別(TG)21,即Nmax=N2=32。第1個(gè)類(lèi)別(TG)20占有的第二高通量測(cè)序片段的數(shù)量為3條,即N1=3,那么,R1=3/32<α4=0.15,因此,判定第1個(gè)類(lèi)別(TG)20并不是真實(shí)存在的,是由滑動(dòng)引起的。同樣,計(jì)算R2=1,R3=5/32,根據(jù)同樣的標(biāo)準(zhǔn),判定,第2個(gè)和第3類(lèi)別是真實(shí)存在的。因此,混合樣本中待檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的微衛(wèi)星標(biāo)記的長(zhǎng)度為類(lèi)別2和類(lèi)別3的微衛(wèi)星標(biāo)記的長(zhǎng)度,即表1中假定的待檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的微衛(wèi)星標(biāo)記的長(zhǎng)度為42bp和44bp(第二個(gè)類(lèi)別TG重復(fù)21次,因此其長(zhǎng)度為21×2bp=42bp;第三個(gè)類(lèi)別TG重復(fù)22次,因此其長(zhǎng)度為22×2bp=44bp)。

按與上述假定的實(shí)施例中相同的方法和參數(shù)再次進(jìn)行檢測(cè),成功檢測(cè)了本實(shí)施例中,48個(gè)待檢測(cè)的微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的微衛(wèi)星標(biāo)記的長(zhǎng)度。

本發(fā)明實(shí)施例提供的微衛(wèi)星標(biāo)記位點(diǎn)的開(kāi)發(fā)方法與檢測(cè)方法快捷、簡(jiǎn)單、全面、準(zhǔn)確。傳統(tǒng)的微衛(wèi)星標(biāo)記位點(diǎn)的開(kāi)發(fā)方法,由于工作量大,只能發(fā)現(xiàn)基因組中大約1%左右的微衛(wèi)星標(biāo)記位點(diǎn),也只能在小于100個(gè)樣本中驗(yàn)證微衛(wèi)星標(biāo)記位點(diǎn)的多態(tài)性。對(duì)于本發(fā)明來(lái)說(shuō),理論上可以發(fā)現(xiàn)基因組上所有微衛(wèi)星標(biāo)記位點(diǎn),針對(duì)棉花的微衛(wèi)星開(kāi)發(fā)的實(shí)施例中,發(fā)現(xiàn)了1萬(wàn)多個(gè)微衛(wèi)星標(biāo)記位點(diǎn),大致為棉花所有微衛(wèi)星標(biāo)記位點(diǎn)的50%,因此,在微衛(wèi)星標(biāo)記位點(diǎn)的發(fā)現(xiàn)能力上,提高了50倍,如果增加高通量的測(cè)序量(這是很容易辦到的),則可以將微衛(wèi)星標(biāo)記位點(diǎn)的發(fā)現(xiàn)能力提高到80倍甚至接近100倍,都是比較容易實(shí)現(xiàn)的。本發(fā)明實(shí)施例是將微衛(wèi)星標(biāo)記位點(diǎn)的開(kāi)發(fā)(發(fā)現(xiàn))與多態(tài)性檢測(cè)合二為一,并沒(méi)有付出額外的工作,但對(duì)于傳統(tǒng)的微衛(wèi)星標(biāo)記位點(diǎn)的多態(tài)性檢測(cè)工作來(lái)說(shuō),是耗時(shí)且難以實(shí)現(xiàn)的,如在36個(gè)棉花品種中檢測(cè)17888個(gè)微衛(wèi)星標(biāo)記位點(diǎn)的多態(tài)性,相當(dāng)于傳統(tǒng)的檢測(cè)中做了36*17888=643968次PCR擴(kuò)增與電泳,這個(gè)工作量是不可想象的。除此之外,傳統(tǒng)的微衛(wèi)星標(biāo)記位點(diǎn)的開(kāi)發(fā)技術(shù)由于工作量大,沒(méi)有能力檢測(cè)同一個(gè)微衛(wèi)星標(biāo)記位點(diǎn)的多個(gè)序列,所以,不能分析多重?cái)U(kuò)增引物的保守性,導(dǎo)致開(kāi)發(fā)出來(lái)的微衛(wèi)星標(biāo)記的多重?cái)U(kuò)增引物的通用性差,而本發(fā)明實(shí)施例解決了這一問(wèn)題。以本發(fā)明的棉花微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的微衛(wèi)星標(biāo)記的長(zhǎng)度的檢測(cè)方法中一次檢測(cè)了48個(gè)微衛(wèi)星標(biāo)記位點(diǎn)為例,對(duì)于傳統(tǒng)的檢測(cè)方法來(lái)說(shuō),則需要48次PCR擴(kuò)增和電泳。對(duì)于本發(fā)明來(lái)說(shuō),即使是檢測(cè)1萬(wàn)個(gè)微衛(wèi)星標(biāo)記位點(diǎn),其工作量也不會(huì)增加,但對(duì)于傳統(tǒng)的檢測(cè)方法來(lái)說(shuō),工作量則增加了1萬(wàn)倍。傳統(tǒng)的檢測(cè)方法是通過(guò)電泳判定微衛(wèi)星標(biāo)記的長(zhǎng)度,但電泳是存在誤差的,因此,需要參照品種進(jìn)行對(duì)比,從而增加了檢測(cè)的工作量,而且,很少有實(shí)驗(yàn)室能夠有一套完整的參照品種,而本發(fā)明實(shí)施例采用的是高通量測(cè)序,獲得的是堿基序列,由于所得結(jié)果是絕對(duì)值,所以沒(méi)有誤差,因此,不再需要參照品種。此外,電泳檢測(cè)無(wú)法分辨不同單株,比如,本發(fā)明在棉花檢測(cè)中的樣本是100個(gè)單株的混合,在電泳結(jié)果中,無(wú)法準(zhǔn)確計(jì)算同一個(gè)微衛(wèi)星標(biāo)記位點(diǎn)的不同微衛(wèi)星標(biāo)記的比例,因此,無(wú)法分辨單株,從而無(wú)法計(jì)算雜株率等重要指標(biāo)。

以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。

序列表

<110> 江漢大學(xué)

<120> 棉花微衛(wèi)星標(biāo)記位點(diǎn)開(kāi)發(fā)方法與微衛(wèi)星標(biāo)記位點(diǎn)內(nèi)的微衛(wèi)星標(biāo)記的長(zhǎng)度檢測(cè)方法

<160>12

<170>PatentIn version 3.4

<210> 1

<211>24

<212>DNA

<213>人工序列

<400> 1

ctctctctct ctctctctct ctct 24

<210> 2

<211>24

<212>DNA

<213>人工序列

<400> 2

gagagagaga gagagagaga gaga 24

<210> 3

<211>24

<212>DNA

<213>人工序列

<400> 3

tgtgtgtgtg tgtgtgtgtg tgtg 24

<210> 4

<211>24

<212>DNA

<213>人工序列

<400> 4

acacacacac acacacacac acac 24

<210> 5

<211>24

<212>DNA

<213>人工序列

<400> 5

tatatatata tatatatata tata 24

<210> 6

<211>24

<212>DNA

<213>人工序列

<400> 6

tgttgttgtt gttgttgttg ttgt 24

<210> 7

<211>24

<212>DNA

<213>人工序列

<400> 7

ccaccaccac caccaccacc acca 24

<210> 8

<211>24

<212>DNA

<213>人工序列

<400> 8

atcatcatca tcatcatcat catc 24

<210> 9

<211>24

<212>DNA

<213>人工序列

<400> 9

cctcctcctc ctcctcctcc tcct 24

<210> 10

<211>24

<212>DNA

<213>人工序列

<400> 10

agaagaagaa gaagaagaag aaga 24

<210> 11

<211>24

<212>DNA

<213>人工序列

<400> 11

atgatgatga tgatgatgat gatg 24

<210> 12

<211>24

<212>DNA

<213>人工序列

<400> 12

caacaacaac aacaacaaca acaa 24

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
延安市| 永嘉县| 禹城市| 彭州市| 崇礼县| 吉木乃县| 邮箱| 姜堰市| 永春县| 嘉峪关市| 灵宝市| 巩留县| 罗甸县| 吉安市| 孙吴县| 沧源| 呼伦贝尔市| 桐柏县| 布拖县| 朝阳县| 克东县| 中方县| 大同市| 萝北县| 西昌市| 武汉市| 长沙县| 连江县| 邹平县| 永靖县| 柳江县| 军事| 南安市| 游戏| 洪泽县| 桐庐县| 黔南| 光山县| 宝坻区| 彝良县| 靖州|