本發(fā)明涉及遺傳育種
技術領域:
,特別涉及一種利用全基因組測序進行分離鑒定與精細定位水稻農藝性狀基因的方法。
背景技術:
:在農業(yè)作物里,許多農藝性狀都是由一個或多個基因調控的。尤其是一些重要農藝性狀,往往都是由幾個基因共同調控,這些基因被稱之為數量性狀位點(quantitativetraitloci,QTLs)。QTLs同樣控制著許多水稻重要性狀,尤其是一些產量相關的農藝性狀。因此鑒定和分離QTLs一直是水稻研究的重點方向。目前,在水稻中已有許多QTLs被定位,但只有其中的一小部分被克隆,缺乏高效的QTLs克隆方法是其中一大制約因素。常規(guī)的QTLs克隆方法主要是圖位克隆法,首先利用初級群體(F2或RIL)對目標性狀的QTLs進行初步定位,確定主效QTL及其兩側分子標記;利用回交并結合分子標記輔助選擇獲得遺傳背景單一且表型穩(wěn)定的高世代回交后代(BCnF1),再篩選目標區(qū)域雜合的近等基因系,構建NIL-F2群體進行精細定位,獲得候選基因。在這一過程中獲得遺傳穩(wěn)定的回交后代及雙親在該QTL區(qū)間內的多態(tài)性是能否成功克隆到QTL的關鍵。傳統(tǒng)的QTL定位方法費時費力,且對材料間的多態(tài)性要求甚高。隨著DNA測序技術的發(fā)展,全基因組測序(Whole-genomesequencing,WGS)越來越多地被應用到植物基因的定位與克隆當中。WGS首先是被用于分析基因組間的遺傳多態(tài)性,隨后通過測序獲得的豐富的遺傳多樣性被應用于全基因組關聯分析(genome-wideassociationstudies,GWAS)。隨著一些模式植物的基因組序列被組裝完成后,以這些基因組為參照序列的第二代測序技術(next-generationsequencing,NGS)在基因的定位與克隆,尤其是QTLs的發(fā)掘上發(fā)揮了重要作用。測序獲得的高密度遺傳多態(tài)性大大提高了QTLs定位的精度。利用NGS結合分離群體分組分析法(Bulked-segregantanalysis,BSA)方法,已分離鑒定多個擬南芥突變體基因和一些水稻的QTLs。而在此基礎上發(fā)展的QTL-seq技術,更為QTLs的快速準確定位提供了新的方法。技術實現要素:本發(fā)明的目的在于提供一種利用全基因組測序進行分離鑒定與精細定位水稻農藝性狀基因的方法,該方法能快速準確的鑒定并精細定位水稻QTLs,為其進一步的克隆與功能分析打下堅實基礎。本發(fā)明解決其技術問題所采用的技術方案是:一種利用全基因組測序進行分離鑒定與精細定位水稻農藝性狀基因的方法,(1)以目標性狀具有差異的兩份水稻材料為親本進行雜交,再以一方親本為輪回親本進行連續(xù)回交,獲得目標性狀分離、目標性狀控制基因位點有且僅有雜合和輪回親本兩種基因型的3-6代回交F1群體;(2)選取3-6代回交F1群體中目標性狀差異最大的兩個單株分別進行全基因組重測序,或選取3-6代回交F1群體中與輪回親本在目標性狀上差異最大的單株及該輪回親本分別進行全基因組重測序;(3)以區(qū)間內雜合態(tài)多態(tài)的分布頻率為統(tǒng)計指標,對步驟(2)全基因組重測序結果中的雜合位點進行比較分析,獲得兩份水稻材料間在雜合位點分布頻率具有顯著差異的區(qū)段,選取攜帶目標性狀的測序單株中的雜合位點頻率顯著大的區(qū)段為調控目標性狀的候選基因區(qū)段;(4)參照步驟(3)序列分析結果,在調控目標性狀的候選基因區(qū)段設計引物,再利用步驟(2)測序的回交F1群體中目標基因為雜合型的單株自交產生的F2群體作為圖位克隆群體,對候選基因區(qū)段與目標性狀間的連鎖關系進行分析,對控制目標性狀的基因位點進行分離鑒定與精細定位。作為優(yōu)選,步驟(1)中的回交選擇帶有隱性性狀一方親本為輪回親本進行回交,每代回交都選取帶有顯性性狀的單株為父本。作為優(yōu)選,步驟(4)中在調控目標性狀的候選基因區(qū)段每1000kb-3000kb設計一對引物。本發(fā)明的有益效果是:方法不僅能快速準確的鑒定并精細定位水稻一個或多個主效數量性狀基因,同時也可分離鑒定多個互作基因位點,為進一步的克隆與功能分析打下堅實基礎。附圖說明圖1是本發(fā)明的技術路線圖;圖2是比較各世代材料的表型。a:水稻大粒品種KSHJ,小粒品種HZ及其F1的籽粒比較;b:BC4F1中大粒單株(LG)與小粒單株(SG)在粒型上的差異;c:SG與LG成熟期表型圖。圖3大粒材料與小粒材料在差異雜合位點分布頻率的比較結果。圖4大?;虻年P聯分析及精細定位。圖5BC4F1中光葉親本與長茸毛單株測序結果雜合區(qū)段分析。圖6葉毛發(fā)生相關基因LH5與LH6的定位。具體實施方式下面通過具體實施例,對本發(fā)明的技術方案作進一步的具體說明。本發(fā)明中,若非特指,所采用的原料和設備等均可從市場購得或是本領域常用的。下述實施例中的方法,如無特別說明,均為本領域的常規(guī)方法。實施例:材料與方法:水稻材料:兩組帶有不同性狀差異的水稻被用來驗證試驗方法。其中一組為粒型有明顯差異的水稻品種況絲華巨(KSHJ,大粒秈稻品種)和華占(HZ,小粒秈稻品種),以華占為輪回親本進行連續(xù)回交,獲得BC4F1群體,從該群體中選取一大粒單株及一小粒單株作為測序樣本;另一組為葉片表面帶長茸毛的水稻秈稻品種菲B10和光葉美國稻品種Cypress,以Cypress為輪回親本進行連續(xù)回交,獲得BC4F1群體,從該群體中選取一葉表面長茸毛單株及輪回親本Cypress作為測序樣本。本發(fā)明使用的所有種質資源均由中國水稻研究所種質資源庫提供?;蚪MDNA樣品的備制及測序:四份測序樣品的DNA用DNeasyPlantMiniKit(QIAGEN)提取,每份樣品大約10ug高純度DNA被用于后續(xù)測序。所有的測序工作和前期的數據預處理,包括去除無效數據,去除接頭序列等均由杭州聯川生物技術有限公司完成。序列的比對分析:以網上提供的水稻基因組序列為參照序列(http://ensembl.gramene.org/Oryza_indica/Info/Index和http://plants.ensembl.org/Oryza_sativa/Location/),將測序樣本的序列分別與之進行比較,分別得到兩者與參照序列具有差異的位點。對以上差異位點進行歸類分析,可分為兩者間相同或不同的差異位點。再選取兩者特有的差異位點中的雜合位點進行分析,以區(qū)間內雜合態(tài)多態(tài)的在染色體上的分布頻率為統(tǒng)計指標,比較兩份樣品的統(tǒng)計結果,獲得兩份水稻材料間在雜合位點分布頻率具有顯著差異的區(qū)段,將帶有目標性狀樣品的雜合位點顯著多于另一樣本的染色體區(qū)段作為控制目標基因的候選區(qū)段。目標基因的定位分析:參照序列分析結果,在候選區(qū)段內設計引物,以BC4F1為定位群體,對檢測到的差異序列與目標性狀進行關聯分析,確定目標基因所在的位點。以目標性狀分離的BC4F2大群體為精細定位群體,對目標基因進行精細定位。結果與分析本發(fā)明的基本原理本發(fā)明中用到的定位與克隆水稻農藝性狀基因的方法如圖1所示,該技術結合了全基因組測序和傳統(tǒng)QTLs定位克隆方法,可快速準確地定位水稻農藝性狀基因,并為水稻農藝性狀基因的克隆及功能分析打下深厚的材料基礎。首先我們選取目標性狀有差異的兩份材料進行雜交,選擇帶有隱性性狀一方親本為輪回親本進行回交,每代回交都選取帶有顯性性狀的單株為父本。如果調控目標性狀的基因為單個基因或一主效QTL,則每代回交F1中目標性狀的分離比應該都接近于1:1,且在帶有顯性性狀的單株中調控目標性狀的DNA區(qū)域為雜合態(tài),帶有隱性性狀的單株則為純合態(tài)。因此,只需從回交F1中選取帶有最大顯性性狀和隱性性狀單株各一株進行基因組重測序。通過比較F1中的顯性性狀單株與隱性單株基因組中雜合態(tài)DNA的差異即能找出目標性狀所在的基因位點。如果是多個基因調控目標性狀,則在F1群體中選取目標性狀表現最顯著的一株,并選取輪回親本作為比較樣本。理論上雜交F1代所有的核染色體DNA都是雜合態(tài)的,即一半來自于母本,另一半來自于父本,每回交一代,核染色體DNA中雜合的就減少50%?;亟?-5代后F1中雜合態(tài)的DNA是全基因組的6.25%-3.125%,以水稻基因組(430M)為例就只剩大約13.5M-27M的DNA序列為雜合態(tài),其它區(qū)段都是純合的且與輪回親本一致,后續(xù)的定位工作只需分析這10%不到的基因組序列。從回交F1中選取帶有最大顯性性狀和隱性性狀單株或輪回親本進行基因組重測序。為保證有足夠的數據進行分析,對每個單株都進行10倍覆蓋的測序。將測序結果與網上已有的參照基因組,例如OryzasativaJaponica(http://plants.ensembl.org/Oryza_sativa/Info/Index?db=core)進行比較,獲得兩份材料與參照基因組比較后在SNP和INDEL多態(tài)上的分布結果。統(tǒng)計出一定區(qū)間內雜合態(tài)多態(tài)的分布頻率,比較兩份材料在雜合態(tài)多態(tài)的分布頻率上的差異,將比較所得的差異作為獲選的目標基因,并參照測序結果在這些區(qū)域內設計引物,利用測序的顯性回交單株的后代F2為圖位克隆群體,對獲選位點與目標性狀間的連鎖關系進行分析,獲得目標性狀基因并進一步精細定位該基因。對一水稻粒型主效基因的精細定位況絲華巨是一份大粒材料,其在粒長,粒寬及粒厚上均大于另一水稻經典秈稻材料華占,兩者的雜交F1也明顯大于華占(圖2a)。以華占為輪回親本,選取大粒性狀的F1進行連續(xù)回交,獲得BC4F1,從中選取一大粒單株(largegrainplant,LG)及一小粒單株(smallgrainplant,SG)作為測序樣品,從表1中可知LG在粒長,粒寬,粒厚及百粒重等表型上與SG均有著顯著的差異。在長寬厚上均有10%左右的增長,最終導致粒重有近30%的增長。但其他性狀如株型等方面都極為相似(圖2c)。表1BC4F1中大粒材料(LG)和小粒材料(SG)在粒型和粒重性狀上的比較籽粒性狀大粒材料(LG)小粒材料(SG)P值粒長(mm)10.55±0.189.36±0.274.28045E-22粒寬(mm)2.52±0.082.34±0.097.23077E-10粒厚(mm)2.11±0.081.93±0.12.09201E-08百粒重(g)2.93±0.052.24±0.043.59818E-08對大粒樣本(LG)和小粒樣本(SG)進行雙端(PEpairedend)測序,其中大粒樣本獲得讀長(reads)數目45776244條,共4577624400bp,其中高質量的數據(>Q20)3847153413bp,占總數84.04%;小粒樣本(LG)獲得讀長(reads)數目45846502條,共4584650200bp,其中高質量的數據(>Q20)3810236166bp,占總數83.11%。應用滑動窗口法去除低質量片段和含N比例在10%以上的reads,最終LG獲得(>Q30)3878195963bp,覆蓋基因組10.4倍,SG獲得(>Q30)3838631152bp,覆蓋基因組10.3倍。表2多態(tài)統(tǒng)計表將兩份材料序列分別與網上提供的秈稻基因組序列(ASM465v1)進行比較,獲得兩者與參照序列的差異位點。從表2我們可以看出,LG和SG與參照序列比對后獲得的多態(tài)性都比較豐富,平均每kb就有1-2個多態(tài);其中在LG里多態(tài)出現的最大間隔為131947bp,在SG里為125308bp。對兩份材料的比對結果進行進一步分析,得到在兩份材料里有差異的多態(tài)位點,這些差異位點包括只在一份材料里出現的多態(tài)位點或在一份材料里是雜合多態(tài)位點,而另一份材料里為純合多態(tài)位點。從這些差異位點中選擇測序深度大于5且AF值大于20%小于80%的位點作為可靠的雜合位點進行統(tǒng)計,從統(tǒng)計的表中我們也可以發(fā)現雜合態(tài)出現的頻率一般為0.16左右,在第1,8,11號染色體兩份樣品的雜合頻率明顯高于其他染色體,推測這3條染色體兩份材料都有雜合區(qū)域;而在第2染色體僅LG的雜合頻率異常偏高,在第3、12染色體僅SG的雜合頻率偏高,推測這三條染色體上僅一份材料出現雜合區(qū)域。為進一步鑒定出兩份材料在基因組上的差別,我們統(tǒng)計了500kb區(qū)間雜合態(tài)多態(tài)出現的頻率。結果表明如圖3(和附圖3對應嗎,是的)所示,在染色體2,5,11各有一段區(qū)域是LG雜合頻率遠高于SG,由此推測在染色體2,5,11中表現出差異的區(qū)域很可能是大?;虼嬖诘奈稽c,因此將基因組區(qū)段CHR2(chr2:18000000..33500000),CHR5(chr5:21000000..25000000)及CHR11(chr11:16500000-18500000)作為候選基因位點。以測序結果為依據,在候選基因區(qū)段設計INDEL引物,以SG和LG的基因組DNA為模板,利用LG的后代即BC4F2群體為QTL定位群體,對分析所得的三個候選位點每隔2000kb左右設計一對INDEL引物(表3),利用QTLIciMapping軟件對這些標記與粒型的關聯性進行分析。在chr2-2區(qū)間內我們選用了8對引物,在其他兩個區(qū)間各選用2對引物,一共12對引物用作連鎖分析。從BC4F2中隨機選取76株作為QTL定位群體。最終將一個主效QTL定位于chr2-2的引物CHR2-9和CHR2-10之間,該QTL對粒長,粒寬,粒厚及千粒重均有很大的效應(圖4),我們命名為qGS2。表3大粒基因關聯分析引物在CHR2-9和CHR2-10之間根據測序結果進一步設計引物(表4),擴大定位群體BC4F2至5210株,最終將qGS2基因定位在CHR2-30和CHR2-21之間的39.5kb區(qū)間內。表4GS2基因精細定位引物對水稻互作基因的定位:兩個水稻葉片長茸毛發(fā)生相關基因的精細定位菲B10是一份葉片帶有長茸毛的品種,而cypress是一份光葉水稻,兩者的雜交F1表現為長茸毛性狀。以cypress為輪回親本,并在F1中選取長茸毛植株進行多代回交,獲得BC4F1。對31株BC4F1的長茸毛性狀進行調查,其中8株為長茸毛,其他23株為非長茸毛,分離比接近3:1,推測長茸毛為兩個基因控制。從BC4F1分別選取一株帶長茸毛單株(HL)及一株光葉(GL)進行基因組重測序。通過測序,GL獲得高質量的reads51552068條,7499073075bp,平均覆蓋率大于19.55倍,覆蓋了水稻基因組的94.7%的區(qū)段,HL獲得高質量的reads70293248條,10228526261bp,平均覆蓋率大于26.72倍,覆蓋了水稻基因組的95.07%的區(qū)段。與參考基因組序列對比后GL獲得多態(tài)1695933個,HL獲得多態(tài)1880781個,其中我們選取depth>=5,變異頻率在0.2至0.8之間的為可信雜合位點,depth>=5,變異頻率為1的為可信的純合位點進行下一步分析。對比兩組多態(tài),我們獲得差異多態(tài)HL179477個,GL為80943個,統(tǒng)計500kb區(qū)間內兩份材料差異多態(tài)的分布(表5),并進行比對,如圖5所示,我們分別在第2,3,5,6號染色體上獲得了一個差異區(qū)段。利用測序結果設計這4個區(qū)間內的indel標記(表6),對31株BC4F1進行關聯分析。結果表明chr5和chr6兩個區(qū)段與長茸毛性狀共分離,當這兩個位點都為雜合時表現為長茸毛,兩個位點都是純合時表現為光葉,僅有一個位點雜合時表現為無茸毛,并推測這兩個基因間的互作為累加效應(additiveeffect)(表7)。將兩個位點分別命名為LH5和LH6。利用測序單株HL的后代276株BC4F2群體,并根據測序結果設計引物進行定位分析(表8),我們將LH5定位在引物LH5-11與LH5-7之間的228kb范圍內,LH6定位在引物LH6-4與LH6-6之間406kb范圍內。表5多態(tài)統(tǒng)計表表6水稻葉片表面長茸毛相候選位點關聯分析引物表7利用31株BC4F1對差異位點進行連鎖分析表8水稻葉片表面長茸毛相關基因M5和M6的精細定位對定位區(qū)間內的基因進行分析,我們認為LH5即為前人克隆的光葉基因WOX3,而LH6為一新基因,選取BC4F2中LH5為WOX3,LH6為雜合的單株后代2300株對LH6進行精細定位。首先對2300株后代在引物M6-4和引物M6-6之間的重組單株進行篩選,共篩選到27株,在該區(qū)間內設計indel引物5對,將該基因最終定位在58.8kb范圍內(圖6)。討論重測序技術因其準確、高效的特點目前已被廣泛應用于基因定位中,包括對突變基因、質量性狀基因的克隆,對QTLs的定位也有報道。本發(fā)明則提供了一種新的利用重測序來定位克隆QTLs的策略。與傳統(tǒng)圖位克隆相比,通過重測序可獲得足夠多的分子標記用于定位,在選擇親本時只需考慮目標性狀差異而無需考慮親本間的遺傳多態(tài)性,親本的選擇余地更大。例如在本實驗中我們選用的材料為兩份秈稻材料,在利用SSR標記對兩份材料間的多態(tài)進行篩選時多態(tài)率低于10%,一條染色體上僅能找到1-3對有多態(tài)的SSR標記,這樣的多態(tài)分布顯然不符合定位的要求。通過重測序,我們僅在目標基因附近1000kb(chr2:30000000-31000000)內就找到INDEL標記94個,SNP標記822個,因此有足夠豐富的多態(tài)以供選擇。傳統(tǒng)的QTL定位時,往往需要先用初級群體對QTL進行初步定位,然后結合分子標記輔助選擇構建近等基因系等群體進行精細定位,工作量非常巨大。而本研究先直接構建高世代回交材料,先對遺傳背景進行了同一化處理;利用重測序快速確定候選區(qū)域,僅需利用差異區(qū)間內的少數幾對引物及相對較小的一個定位群體即能將獲得QTLs精細定位。同時在對基因進行定位分析時,我們僅選取了差異區(qū)段內的12對引物對76株BC4F2進行連鎖分析,即獲得了目標QTLs,大大減少了工作量。在將重測序技術引入到QTLs定位的QTL-seq技術中,其原理是對F2或重組自交系中性狀分離的20-50個單株混樣進行重測序,快速的獲得QTLs。通過該技術能快速獲得QTLs,但要克隆到該目標性狀,仍需要進一步構建分離群體,尤其是復雜性狀的克隆,通常還是需要獲得NearlyIsogenicLines(NILs)來克隆該基因,并進一步利用NILs來驗證其功能。與QTL-seq相比在新的策略里是先獲得高代回交材料,從回交F2代中,利用測序獲得的標記對遺傳背景進行篩選,我們能很快獲得NILs,這樣就在定位到QTLs的同時也獲得了克隆目標基因所需要的NILs,因此在通過重測序后很快就能有效的克隆到目標基因。同時在對重測序數據進行分析時,我們也采用了與QTL-seq技術不同的方法。在QTL-seq中至少要已知其中一方親本的序列,將其作為參照基因組與兩份待測材料進行比對,分析SNP-index即統(tǒng)計材料與參照序列不同的SNP出現的頻率來確定QTLs。而在本發(fā)明中所用材料無需是已知序列材料,也無需對親本進行測序分析,測序的結果只需與已知的水稻序列比較,如網上提供的粳稻日本晴序列,秈稻9311序列等。通過分析與參考序列多態(tài)位點的雜合屬性來確定QTLs候選區(qū)域,分析方法更簡便直接,材料要求更低。相比于以往的技術,該技術能更有效的對目標QTLs進行克隆,而不是僅僅停留在分離定位這一階段。尤其在育種過程中,我們通常會將一些通過反復回交的方式將某一優(yōu)良性狀導入到其他品種當中,以進一步改良該品種。在此過程中應用新的策略不僅能對一些基因進行克隆,也能使這些基因更快的應用于育種中。同時我們也預想如果回交的群體足夠大,我們也能將與目標性狀相關的基因逐一克隆到。以上所述的實施例只是本發(fā)明的一種較佳的方案,并非對本發(fā)明作任何形式上的限制,在不超出權利要求所記載的技術方案的前提下還有其它的變體及改型。當前第1頁1 2 3