專利名稱:一種快速方便轉(zhuǎn)基因插入位點(diǎn)鑒定技術(shù)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及生物技術(shù)領(lǐng)域:
,更具體地,本發(fā)明涉及一種轉(zhuǎn)基因插入位點(diǎn)鑒定方法。
背景技術(shù):
轉(zhuǎn)基因技術(shù)自上世紀(jì)80年代出現(xiàn)以來(lái),迅速在建立人類疾病的動(dòng)物模型、基因功能的在體研究、基因工程育種、以及畜牧業(yè)生產(chǎn)、生物制藥等方面獲得了廣泛應(yīng)用。特別是人類基因組計(jì)劃及眾多模式生物基因組測(cè)序計(jì)劃完成后,基因功能的研究即功能基因組學(xué)研究成為目前乃至本世紀(jì)醫(yī)學(xué)和整個(gè)生命科學(xué)研究面臨的最大機(jī)遇和挑戰(zhàn),轉(zhuǎn)基因動(dòng)物模型已成為在生物活體內(nèi)系統(tǒng)研究基因功能、轉(zhuǎn)錄表達(dá)調(diào)控、胚胎發(fā)育、人類疾病發(fā)病機(jī)制及篩選新藥或新療法最重要的技術(shù)手段之一,是功能基因組學(xué)研究不可或缺的技術(shù)支撐。
然而,小鼠轉(zhuǎn)基因技術(shù)也存在巨大缺陷轉(zhuǎn)基因以近乎隨機(jī)的方式整合在基因組中,轉(zhuǎn)基因整合可能導(dǎo)致三種結(jié)果,一是轉(zhuǎn)基因高表達(dá),二是轉(zhuǎn)基因受附近基因組結(jié)構(gòu)和序列的影響而不表達(dá)或低表達(dá),三是整合位點(diǎn)處的內(nèi)源基因或其它功能元件被破壞導(dǎo)致功能缺失(據(jù)Palmiter對(duì)153個(gè)轉(zhuǎn)基因小鼠系的統(tǒng)計(jì),約7%的轉(zhuǎn)基因小鼠系出現(xiàn)了插入突變引起的肢體異常或純合胚胎致死,估計(jì)未出現(xiàn)外觀表型的插入突變更為常見(jiàn))。這些因素給基因功能研究、動(dòng)物模型應(yīng)用等造成極大干擾。
在轉(zhuǎn)基因動(dòng)物技術(shù)建立后的短短六年,全世界就產(chǎn)生了數(shù)千個(gè)轉(zhuǎn)基因小鼠系。目前,估計(jì)世界上已產(chǎn)生轉(zhuǎn)基因小鼠系數(shù)萬(wàn)個(gè),僅新建的上海南方模式生物研究中心2002年就生產(chǎn)了二百余個(gè)轉(zhuǎn)基因小鼠系。這是遺傳學(xué)、醫(yī)學(xué)、功能基因組學(xué)、乃至整個(gè)生命科學(xué)研究的巨大資源寶庫(kù)。但是由于長(zhǎng)期以來(lái)一直缺乏經(jīng)濟(jì)快速鑒定整合位點(diǎn)的方法,對(duì)這一寶貴資源的開(kāi)發(fā)還十分有限。如果能精確確定轉(zhuǎn)基因的整合位點(diǎn)及附近的基因組序列,建立相應(yīng)的轉(zhuǎn)基因整合位點(diǎn)數(shù)據(jù)庫(kù),將會(huì)對(duì)全基因組水平的基因表達(dá)調(diào)控機(jī)制研究、轉(zhuǎn)基因表達(dá)與動(dòng)物表型的因果關(guān)系分析、運(yùn)用轉(zhuǎn)基因動(dòng)物模型進(jìn)行藥物開(kāi)發(fā)和疾病治療研究以及對(duì)因轉(zhuǎn)基因整合導(dǎo)致失活的內(nèi)源基因功能研究等方面產(chǎn)生巨大影響。
研究人員在轉(zhuǎn)基因動(dòng)物出現(xiàn)以后很快就對(duì)轉(zhuǎn)基因整合位點(diǎn)予以了充分關(guān)注,各國(guó)研究人員對(duì)原核注射產(chǎn)生的轉(zhuǎn)基因動(dòng)物中轉(zhuǎn)基因整合的拷貝數(shù)、轉(zhuǎn)基因的串聯(lián)方式、轉(zhuǎn)基因與整合位點(diǎn)旁側(cè)的基因組序列的關(guān)系進(jìn)行了大量的研究,取得了一定成果。結(jié)果表明,絕大多數(shù)情況下轉(zhuǎn)基因是多拷貝整合的,有時(shí)甚至高達(dá)數(shù)百拷貝;轉(zhuǎn)基因主要以頭尾(head-to-tail)相連的方式整合在基因組內(nèi)的單一位點(diǎn),僅在少數(shù)情況下,可出現(xiàn)多位點(diǎn)整合、轉(zhuǎn)基因內(nèi)部缺失或重排,偶爾會(huì)導(dǎo)致基因組序列重復(fù)、缺失和染色體易位等。然而這些研究未能建立經(jīng)濟(jì)快速鑒定轉(zhuǎn)基因整合位點(diǎn)的方法并推廣應(yīng)用。盡管運(yùn)用個(gè)體基因組文庫(kù)篩選法、質(zhì)粒回收法、反式PCR(inverse PCR)等獲得了少量的轉(zhuǎn)基因/基因組整合位點(diǎn)處的序列,但由于費(fèi)時(shí)費(fèi)力,或轉(zhuǎn)基因多拷貝整合的特點(diǎn),中間的拷貝會(huì)與末尾的拷貝競(jìng)爭(zhēng)PCR,及整合后轉(zhuǎn)基因序列變化的影響,給獲得轉(zhuǎn)基因/基因組整合位點(diǎn)處的序列造成很大困難。而且,當(dāng)時(shí)基因組計(jì)劃尚未實(shí)施,確定轉(zhuǎn)基因的定位和被破壞的內(nèi)源基因是十分煩瑣也是十分困難的。這些限制致使相關(guān)研究在近幾年幾乎處于停滯狀態(tài)。目前,國(guó)際上小鼠基因組測(cè)序計(jì)劃已基本完成,使轉(zhuǎn)基因整合位點(diǎn)的常規(guī)鑒定成為可能,現(xiàn)在唯一需要的是建立獲得轉(zhuǎn)基因/基因組結(jié)合處序列的簡(jiǎn)單方法,就可以建立相應(yīng)數(shù)據(jù)庫(kù),充分開(kāi)發(fā)轉(zhuǎn)基因動(dòng)物資源。
綜上所述,本領(lǐng)域迫切需要開(kāi)發(fā)一種快速方便鑒定轉(zhuǎn)基因插入位點(diǎn)的方法。
發(fā)明內(nèi)容本發(fā)明的目的是提供一種確定轉(zhuǎn)基因插入位點(diǎn)的方法。所述方法可操作性強(qiáng),不受轉(zhuǎn)基因多拷貝串聯(lián)整合及轉(zhuǎn)基因后序列發(fā)生變化的影響。
在本發(fā)明的第一方面,提供了一種確定轉(zhuǎn)基因插入位點(diǎn)的方法,包括步驟(a)對(duì)于待確定轉(zhuǎn)基因插入位點(diǎn)的基因組DNA,用限制性內(nèi)切酶進(jìn)行消化,從而獲得消化后的基因組片段,然后在消化后的基因組片段兩端連接接頭,從而形成在兩端帶有接頭的基因組片段;(b)以載體序列特異性引物和接頭序列特異性引物,對(duì)步驟(a)中兩端帶有接頭的基因組片段進(jìn)行PCR擴(kuò)增,從而獲得PCR產(chǎn)物,其中所述的PCR產(chǎn)物對(duì)應(yīng)于位于載體與接頭之間的基因組DNA序列;(c)對(duì)步驟(b)中的PCR產(chǎn)物進(jìn)行測(cè)序;(d)根據(jù)步驟(c)的測(cè)序結(jié)果,確定轉(zhuǎn)基因的插入位點(diǎn)。
在另一優(yōu)選例中,步驟(a)中所述的限制性內(nèi)切酶選自下組(i).將基因組DNA切割為平均長(zhǎng)度小于1kb片段的一種限制性內(nèi)切酶;(ii).數(shù)種限制性內(nèi)切酶的混合物,其中所述的數(shù)種(2-10種)限制性內(nèi)切酶是產(chǎn)生相同粘性末端的限制性內(nèi)切酶,并且所述的混合物將基因組DNA切割為平均長(zhǎng)度小于1kb片段;(iii)數(shù)種限制性內(nèi)切酶的混合物,其中所述的數(shù)種(2-10種)限制性內(nèi)切酶是產(chǎn)生相同平頭末端的限制性內(nèi)切酶,并且所述的混合物將基因組DNA切割為平均長(zhǎng)度小于1kb片段;附加條件是,如果若選用的第一限制性內(nèi)切酶E1可以切割載體序列,在步驟(b)與(c)之間加步驟(b′)即在添加接頭之后,用可切斷位于兩個(gè)E1間載體頭尾相連部的第二限制性內(nèi)切酶E2消化已加接頭的連接產(chǎn)物。
在另一優(yōu)選例中,所述的限制性內(nèi)切酶選自下組●單一的在基因組中切割位點(diǎn)分布較多的Sau3AI、MspI、NdeII、AccII、AluI、HphI、MboII等識(shí)別位點(diǎn)序列為4個(gè)或5個(gè)堿基的限制性內(nèi)切酶;●切割后產(chǎn)生相同粘性末端的數(shù)種同尾酶的組合如BamHI、BglII、BclI、MboI、XhoII聯(lián)合酶切;NheI、XbaI、SpeI、AvrII的聯(lián)合酶切;●產(chǎn)生平末端的限制性內(nèi)切酶的組合如EcoRV、NruI、PmacI、XmnI、PshAI、BstZ17I、SmaI、SspI、PvuII等產(chǎn)生平末端的酶的組合。
在另一優(yōu)選例中,所述的第二限制性內(nèi)切酶E2的具有以下特征●是與第一限制性內(nèi)切酶不同的限制性內(nèi)切酶,●可以切斷兩個(gè)E1間載體頭尾相連部的限制性內(nèi)切酶,
●不切割兩個(gè)E1間載體/基因組接合部的載體序列。
在另一優(yōu)選例中,E2可以選自PvuII、KpnI、BamHI、EcoRI、BglII等常用的限制性內(nèi)切酶。
在另一優(yōu)選例中,所用的限制性內(nèi)切酶E2是PvuII和KpnI。
在另一優(yōu)選例中,所述的接頭具有以下特征a.接頭是由兩條單鏈DNA退火而成,退火后接頭雙鏈端形成能與方法1或2所用的限制性內(nèi)切酶切割后產(chǎn)生的末端匹配的末端結(jié)構(gòu)(如果酶切后產(chǎn)生粘性末端,接頭雙鏈端5′突出可與之形成堿基配對(duì)而退火,如果是平末端,則接頭接頭雙鏈端也為平末端);b.接頭中兩條單鏈DNA長(zhǎng)度不同,一條較長(zhǎng),其長(zhǎng)度范圍為40bp-100bp,在其單鏈區(qū)可以作為兩條巢式引物的模板;而另一條較短,其長(zhǎng)度范圍為6-20bp,其5′端堿基磷酸化,3′端堿基氨基化;c.接頭序列單鏈區(qū)不能與限制性內(nèi)切酶消化后轉(zhuǎn)基因載體/基因組結(jié)合部的載體序列區(qū)任何一段序列相同。
在另一優(yōu)選例中,所述的載體序列特異性引物具有以下特征●引物序列的選擇以限制性內(nèi)切酶消化后轉(zhuǎn)基因載體/基因組結(jié)合部的載體序列為模板,●引物序列可以與接頭序列特異性引物配對(duì)用于PCR反應(yīng)。
在另一優(yōu)選例中,所述基因組DNA是哺乳動(dòng)物的基因組DNA、或植物細(xì)胞的基因組DNA。
更佳地,所述的基因組DNA來(lái)自羊、牛、小鼠、大鼠、兔子、狗、猴的基因組。
在另一優(yōu)選例中,在步驟(d)中,還包括(1)根據(jù)測(cè)序結(jié)果,確定轉(zhuǎn)基因片段插入后基因組結(jié)構(gòu)有無(wú)變化(如缺失或重排);或者(2)進(jìn)行轉(zhuǎn)基因表達(dá)與表型的因果關(guān)系分析;或者(3)進(jìn)行轉(zhuǎn)基因基因型的鑒定。
在另一優(yōu)選例中,所述的轉(zhuǎn)基因基因型鑒定包括步驟以轉(zhuǎn)基因的基因組DNA為模板,用第一、第二和第三引物在同一體系中進(jìn)行PCR擴(kuò)增,其中,第一引物的序列對(duì)應(yīng)于轉(zhuǎn)基因整合位點(diǎn)附近序列(載體側(cè)翼)的序列;第二引物的序列對(duì)應(yīng)于整合位點(diǎn)另一側(cè)野生型基因組的序列,并且第一引物和第二引物構(gòu)成第一引物對(duì);第三引物的序列對(duì)應(yīng)于載體序列,并且第一引物和第三引物構(gòu)成第二引物對(duì);其中,根據(jù)以下標(biāo)準(zhǔn)判斷基因型如果只出現(xiàn)第一引物對(duì)的擴(kuò)增產(chǎn)物,就表明是野生型;如果只出現(xiàn)第二引物對(duì)的擴(kuò)增產(chǎn)物,就表明是轉(zhuǎn)基因純合型;如果同時(shí)出現(xiàn)第一引物對(duì)的擴(kuò)增產(chǎn)物和第二引物對(duì)的擴(kuò)增產(chǎn)物,就表明是轉(zhuǎn)基因雜合型(具體機(jī)制如圖6所示)。
在另一優(yōu)選例中,提供了一種用于本發(fā)明上述方法的轉(zhuǎn)基因載體,其特征在于,所述的載體是具有SEQ ID NO1所示序列的載體。
本發(fā)明的其它方面由于本文的公開(kāi)內(nèi)容,對(duì)本領(lǐng)域的技術(shù)人員而言是顯而易見(jiàn)的。
圖1顯示了本發(fā)明的一種通用的轉(zhuǎn)基因載體。
圖2顯示了利用所述通用的轉(zhuǎn)基因載體進(jìn)行的轉(zhuǎn)基因及整合位點(diǎn)鑒定的流程。
圖3顯示了PCR鑒定轉(zhuǎn)基因整合位點(diǎn)的原理。
圖4顯示了pEGFP-PLAG1轉(zhuǎn)基因質(zhì)粒的結(jié)構(gòu)。
圖5顯示了接頭的示意圖。
圖6顯示了轉(zhuǎn)基因基因型鑒定的示意圖。
具體實(shí)施方式本發(fā)明人經(jīng)過(guò)廣泛而深入的研究,針對(duì)現(xiàn)有其它轉(zhuǎn)基因整合位點(diǎn)鑒定方法易受轉(zhuǎn)基因多拷貝串聯(lián)整合及整合后序列改變的影響的局限,建立了一種簡(jiǎn)便易行的轉(zhuǎn)基因整合位點(diǎn)鑒定的方法。
同時(shí),本發(fā)明人還設(shè)計(jì)并利用一種通用載體及標(biāo)準(zhǔn)化方法,對(duì)近百個(gè)轉(zhuǎn)基因小鼠系進(jìn)行了整合位點(diǎn)鑒定,建立了整合位點(diǎn)明確的轉(zhuǎn)基因小鼠資源庫(kù)。
本發(fā)明提供一種快速方便轉(zhuǎn)基因插入位點(diǎn)鑒定方法,所述方法原理簡(jiǎn)單,可操作性強(qiáng),不受轉(zhuǎn)基因多拷貝串聯(lián)整合及轉(zhuǎn)基因后序列發(fā)生變化的影響,所述方法理論上能對(duì)所有類型轉(zhuǎn)基因進(jìn)行整合位點(diǎn)鑒定。利用這一方法可以滿足人們?cè)诙虝r(shí)間內(nèi)對(duì)大多數(shù)轉(zhuǎn)基因進(jìn)行整合位點(diǎn)鑒定的需要。
本發(fā)明還提供了所述方法的用途,尤其是建立整合位點(diǎn)明確的轉(zhuǎn)基因小鼠資源庫(kù)。
具體地,本發(fā)明采用的PCR鑒定轉(zhuǎn)基因整合位點(diǎn)的原理見(jiàn)圖3轉(zhuǎn)基因主要以多拷貝首尾相連的方式整合在基因組中。用內(nèi)切酶E1酶切轉(zhuǎn)基因小鼠基因組DNA,然后在片段兩端連接特殊設(shè)計(jì)的接頭;在普通的genome walking(基因組步移法)中,此時(shí)即可用載體特異性引物和接頭引物PCR擴(kuò)增獲得未知序列,但由于轉(zhuǎn)基因的多拷貝整合,中間拷貝的載體頭尾相連部轉(zhuǎn)基因DNA會(huì)競(jìng)爭(zhēng)PCR而難以獲得含轉(zhuǎn)基因/基因組結(jié)合處序列的片段(圖3A中左面所示)。
在本發(fā)明一種策略中,本發(fā)明人用內(nèi)切酶E2(可切斷位于兩E1間載體頭尾相連部)酶切已加接頭的連接產(chǎn)物,從而使中間拷貝的載體頭尾相連部轉(zhuǎn)基因DNA不能進(jìn)行PCR擴(kuò)增,只有含轉(zhuǎn)基因/基因組結(jié)合處序列的片段能擴(kuò)增(圖3A中右面所示)。
在本發(fā)明的另一種策略中,用一系列不切割載體DNA的產(chǎn)生平末端的限制性內(nèi)切酶Ebs消化轉(zhuǎn)基因基因組DNA,使酶切后轉(zhuǎn)基因載體DNA側(cè)翼(限制性酶切斷端與載體之間)的DNA片段的平均長(zhǎng)度足夠短,便于用PCR的方法擴(kuò)增,然后在消化后基因組片段兩端連接接頭,以載體特異性引物和接頭引物擴(kuò)增載體側(cè)翼序列,通過(guò)控制PCR反應(yīng)的延伸時(shí)間,則圖3B中最下方所示的兩種片段將被優(yōu)先擴(kuò)增。
更具體的,所述轉(zhuǎn)基因插入位點(diǎn)鑒定方法,選自以下兩種策略策略1包括步驟a用限制性內(nèi)切酶E1消化轉(zhuǎn)基因基因組DNA,然后在消化后基因組片段兩端連接接頭;b′用可切斷位于兩E1間載體頭尾相連部的限制性內(nèi)切酶E2消化已加接頭的連接產(chǎn)物;
b以載體序列特異性引物和接頭序列特異性引物進(jìn)行PCR擴(kuò)增位于載體與接頭之間的基因組DNA片段。
策略2包括步驟a用一系列不切割載體DNA的產(chǎn)生平末端的限制性內(nèi)切酶Ebs消化轉(zhuǎn)基因基因組DNA,然后在消化后基因組片段兩端連接接頭;b以載體序列特異性引物和接頭序列特異性引物進(jìn)行PCR擴(kuò)增位于載體與接頭之間的基因組DNA片段。
將上述方法中所獲得的PCR產(chǎn)物克隆、測(cè)序,將測(cè)序結(jié)果在Genebank(www.ncbi.nlm.nih.gov)和UCSC小鼠基因組序列數(shù)據(jù)庫(kù)(www.genome.ucsc.edu)進(jìn)行序列比對(duì),確定轉(zhuǎn)基因片段的插入位點(diǎn)及附近的基因組序列,根據(jù)這些序列信息可以明確轉(zhuǎn)基因插入的基因位點(diǎn)、插入后有無(wú)內(nèi)源基因結(jié)構(gòu)的破壞、插入后是否引起附近基因組結(jié)構(gòu)的改變(如缺失、重排),將這些信息與小鼠系及其表型對(duì)應(yīng),建立轉(zhuǎn)基因小鼠資源庫(kù),對(duì)于基因功能研究是寶貴的模式生物資源。
限制性內(nèi)切酶在本發(fā)明中,步驟(a)中所述的限制性內(nèi)切酶的選用有以下特點(diǎn)a.在基因組中切割位點(diǎn)分布較多的從而可將基因組DNA切割為平均長(zhǎng)度小于1kb的一種限制性內(nèi)切酶,或幾種產(chǎn)生平末端(或相同粘性末端)的限制性內(nèi)切酶的聯(lián)合;b.若選用的限制性內(nèi)切酶可以切割載體序列(命名其為E1,E1可以是一種酶或幾種酶的聯(lián)合,如a所述),則在步驟(b)與(c)之間加步驟(b′),即在添加接頭之后,用可切斷位于兩個(gè)E1間載體頭尾相連部的第二限制性內(nèi)切酶E2消化已加接頭的連接產(chǎn)物。
代表性的所述的限制性內(nèi)切酶例子包括單一的在基因組中切割位點(diǎn)分布較多的Sau3AI、MspI、NdeII、AccII、AluI、HphI、MboII等識(shí)別位點(diǎn)序列為4個(gè)或5個(gè)堿基的限制性內(nèi)切酶;也可以是切割后產(chǎn)生相同粘性末端的幾種同尾酶的組合如BamHI、BglII、BclI、MboI、XhoII聯(lián)合酶切,NheI、XbaI、SpeI、AvrII的聯(lián)合酶切或是一組產(chǎn)生平末端的限制性內(nèi)切酶的組合如EcoRV、NruI、PmacI、XmnI、PshAI、BstZ17I、SmaI、SspI、PvuII等產(chǎn)生平末端的酶的合理組合。
第二限制性內(nèi)切酶E2的選擇符合以下幾個(gè)特點(diǎn)a、第一限制性內(nèi)切酶以外的限制性內(nèi)切酶,b、可以切斷兩個(gè)E1間載體頭尾相連部的限制性內(nèi)切酶,c、不切割兩個(gè)E1間載體/基因組接合部的載體序列代表性的第二限制性內(nèi)切酶E2可以選自PvuII、KpnI、BamHI、EcoRI、BglII等常用的限制性內(nèi)切酶。
在另一優(yōu)選例中,所用的限制性內(nèi)切酶是PvuII和KpnI。
接頭可用于本發(fā)明的方法的所述接頭具有以下特征a.接頭是由兩條單鏈DNA退火而成,如圖5所示,退火后接頭雙鏈端形成能與方法1或2所用的限制性內(nèi)切酶切割后產(chǎn)生的末端匹配的末端結(jié)構(gòu)(如果酶切后產(chǎn)生粘性末端,接頭雙鏈端5′突出可與之形成堿基配對(duì)而退火,如果是平末端,則接頭接頭雙鏈端也為平末端)b.接頭中兩條單鏈DNA長(zhǎng)度不同,一條較長(zhǎng),其長(zhǎng)度范圍為40bp-100bp,在其單鏈區(qū)可以作為兩條巢式引物的模板;而另一條較短,其長(zhǎng)度范圍為6-20bp,其5′端堿基磷酸化,3′端堿基氨基化。
c.接頭序列單鏈區(qū)不能與限制性內(nèi)切酶消化后轉(zhuǎn)基因載體/基因組結(jié)合部的載體序列區(qū)任何一段序列相同。
載體序列特異性引物可用于本發(fā)明的載體序列特異性引物具有以下特征a引物序列的選擇以限制性內(nèi)切酶消化后轉(zhuǎn)基因載體/基因組結(jié)合部的載體序列為模板,b引物序列可以與接頭序列特異性引物配對(duì)用于PCR反應(yīng)在另一優(yōu)選例中,所述基因組DNA是哺乳動(dòng)物的基因組DNA、或植物細(xì)胞的基因組DNA。
載體可用于本發(fā)明的載體沒(méi)有特別限制,可以是常規(guī)的轉(zhuǎn)基因載體。代表性的載體包括(但并不限于)pCDNA3.1、pEGFP-C1、pET系列載體、pCI-neo等常用的用于基因表達(dá)的質(zhì)粒載體。
此外,根據(jù)上述原理及實(shí)施結(jié)果,本發(fā)明人提供了一種優(yōu)化的轉(zhuǎn)基因通用載體,該載體上有優(yōu)化的E2限制性內(nèi)切酶切位點(diǎn)KpnI和PvuII及優(yōu)化的載體特異性引物序列區(qū),使利用不同轉(zhuǎn)基因載體獲得轉(zhuǎn)基因DNA后復(fù)雜多樣的酶切和引物篩選變成單一化、標(biāo)準(zhǔn)化的過(guò)程,可大大提高整合位點(diǎn)鑒定效率。
具體地,本發(fā)明提供了利于整合位點(diǎn)鑒定的一種通用的轉(zhuǎn)基因載體及利用此載體獲得的轉(zhuǎn)基因整合位點(diǎn)鑒定的標(biāo)準(zhǔn)化方法。所述的通用載體的結(jié)構(gòu)如圖1所示,其全序列為ggtacctcat atgccaagta cgccccctat tgccaaaatg tcgtaacaac tccgccccgc 60tgtacaagta ctcagatcTC GAGCTCAAGC TTCGAATTCC GGGATCCACC GGATCTAGAT 120AACTGATCAT AATCAGCCAT ACCACATTTG TAGAGGTTTT ACTTGCTTTA AAAAACCTCC 180CACACCTCCC CCTGAACCTG AAACATAAAA TGAATGCAAT TGTTGTTGTT AACTTGTTTA 240TTGCAGCTTA TAATGGTTAC AAATAAAGCA ATAGCATCAC AAATTTCACA AATAAAGCAT 300TTTTTTCACT GCATTCTAGT TGTGGTTTGT CCAAACTCAT CAATGTATCT TAACGCGTAA 360ATTGTAAGCG TTAATATTTT GTTAAAATTC GCGTTAAATT TTTGTTAAAT CAGCTCATTT 420TTTAACCAAT AGGCCGAAAT CGGCAAAATC CCTTATAAAT CAAAAGAATA GACCGAGATA 480GGGTTGAGTG TTGTTCCAGT TTGGAACAAG AGTCCACTAT TAAAGAACGT GGACTCCAAC 540GTCAAAGGGC GAAAAACCGT CTATCAGGGC GATGGCCCAC TACGTGAACC ATCACCCTAA 600TCAAGTTTTT TGGGGTCGAG GTGCCGTAAA GCACTAAATC GGAACCCTAA AGGGAGCCCC 660CGATTTAGAG CTTGACGGGG AAAGCCGGCG AACGTGGCGA GAAAGGAAGG GAAGAAAGCG 720AAAGGAGCGG GCGCTAGGGC GCTGGCAAGT GTAGCGGTCA CGCTGCGCGT AACCACCACA 780CCCGCCGCGC TTAATGCGCC GCTACAGGGC GCGTCAGGTG GCACTTTTCG GGGAAATGTG 840CGCGGAACCC CTATTTGTTT ATTTTTCTAA ATACATTCAA ATATGTATCC GCTCATGAGA 900CAATAACCCT GATAAATGCT TCAATAATAT TGAAAAAGGA AGAGTCCTGA GGCGGAAAGA 960ACCAGCTGTG GAATGTGTGT CAGTTAGGGT GTGGAAagtc cccaggctcc ccagcagcgg 1020ccgcgtcgac CGATGCCCTT GAGAGCCTTC AACCCAGTCA GCTCCTTCCG GTGGGCGCGG 1080GGCATGACTA TCGTCGCCGC ACTTATGACT GTCTTCTTTA TCATGCAACT CGTAGGACAG 1140GTGCCGGCAG CGCTCTTCCG CTTCCTCGCT CACTGACTCG CTGCGCTCGG TCGTTCGGCT 1200GCGGCGAGCG GTATCAGCTC ACTCAAAGGC GGTAATACGG TTATCCACAG AATCAGGGGA 1260TAACGCAGGA AAGAACATGT GAGCAAAAGG CCAGCAAAAG GCCAGGAACC GTAAAAAGGC 1320CGCGTTGCTG GCGTTTTTCC ATAGGCTCCG CCCCCCTGAC GAGCATCACA AAAATCGACG 1380CTCAAGTCAG AGGTGGCGAA ACCCGACAGG ACTATAAAGA TACCAGGCGT TTCCCCCTGG 1440AAGCTCCCTC GTGCGCTCTC CTGTTCCGAC CCTGCCGCTT ACCGGATACC TGTCCGCCTT 1500TCTCCCTTCG GGAAGCGTGG CGCTTTCTCA TAGCTCACGC TGTAGGTATC TCAGTTCGGT 1560GTAGGTCGTT CGCTCCAAGC TGGGCTGTGT GCACGAACCC CCCGTTCAGC CCGACCGCTG 1620CGCCTTATCC GGTAACTATC GTCTTGAGTC CAACCCGGTA AGACACGACT TATCGCCACT 1680GGCAGCAGCC ACTGGTAACA GGATTAGCAG AGCGAGGTAT GTAGGCGGTG CTACAGAGTT 1740CTTGAAGTGG TGGCCTAACT ACGGCTACAC TAGAAGAACA GTATTTGGTA TCTGCGCTCT 1800GCTGAAGCCA GTTACCTTCG GAAAAAGAGT TGGTAGCTCT TGATCCGGCA AACAAACCAC 1860CGCTGGTAGC GGTGGTTTTT TTGTTTGCAA GCAGCAGATT ACGCGCAGAA AAAAAGGATC 1920TCAAGAAGAT CCTTTGATCT TTTCTACGGG GTCTGACGCT CAGTGGAACG AAAACTCACG 1980TTAAGGGATT TTGGTCATGA GATTATCAAA AAGGATCTTC ACCTAGATCC TTTTAAATTA 2040
AAAATGAAGT TTTAAATCAA TCTAAAGTAT ATATGAGTAA ACTTGGTCTG ACAGTTACCA 2100ATGCTTAATC AGTGAGGCAC CTATCTCAGC GATCTGTCTA TTTCGTTCAT CCATAGTTGC 2160CTGACTCCCC GTCGTGTAGA TAACTACGAT ACGGGAGGGC TTACCATCTG GCCCCAGTGC 2220TGCAATGATA CCGCGAGACC CACGCTCACC GGCTCCAGAT TTATCAGCAA TAAACCAGCC 2280AGCCGGAAGG GCCGAGCGCA GAAGTGGTCC TGCAACTTTA TCCGCCTCCA TCCAGTCTAT 2340TAATTGTTGC CGGGAAGCTA GAGTAAGTAG TTCGCCAGTT AATAGTTTGC GCAACGTTGT 2400TGCCATTGCT ACAGGCATCG TGGTGTCACG CTCGTCGTTT GGTATGGCTT CATTCAGCTC 2460CGGTTCCCAA CGATCAAGGC GAGTTACATG ATCCCCCATG TTGTGCAAAA AAGCGGTTAG 2520CTCCTTCGGT CCTCCGATCG TTGTCAGAAG TAAGTTGGCC GCAGTGTTAT CACTCATGGT 2580TATGGCAGCA CTGCATAATT CTCTTACTGT CATGCCATCC GTAAGATGCT TTTCTGTGAC 2640TGGTGAGTAC TCAACCAAGT CATTCTGAGA ATAGTGTATG CGGCGACCGA GTTGCTCTTG 2700CCCGGCGTCA ATACGGGATA ATACCGCGCC ACATAGCAGA ACTTTAAAAG TGCTCATCAT 2760TGGAAAACGT TCTTCGGGGC GAAAACTCTC AAGGATCTTA CCGCTGTTGA GATCCAGTTC 2820GATGTAACCC ACTCGTGCAC CCAACTGATC TTCAGCATCT TTTACTTTCA CCAGCGTTTC 2880TGGGTGAGCA AAAACAGGAA GGCAAAATGC CGCAAAAAAG GGAATAAGGG CGACACGGAA 2940ATGTTGAATA CTCATACTCT TCCTTTTTCA ATATTATTGA AGCATTTATC AGGGTTATTG 3000TCTCATGAGC GGATACATAT TTGAATGTAT TTAGAAAAAT AAACAAATAG GGGTTCCGCG 3060CACATTTCCC CGAAAAGTGC CACCTGACGC GCCCTGTAGC GGCGCATTAA GCGCGGCGGG 3120TGTGGTGGTT ACGCGCAGCG TGACCGCTAC ACTTGCCAGC GCCCTAGCGC CCGCTCCTTT 3180CGCTTTCTTC CCTTCCTTTC TCGCCACGTT CGCCGGCTTT CCCCGTCAAG CTCTAAATCG 3240GGGGCTCCCT TTAGGGTTCC GATTTAGTGC TTTACGGCAC CTCGACCCCA AAAAACTTGA 3300TTAGGGTGAT GGTTCACGTA GTGGGCCATC GCCCTGATAG ACGGTTTTTC GCCCTTTGAC 3360GTTGGAGTCC ACGTTCTTTA ATAGTGGACT CTTGTTCCAA ACTGGAACAA CACTCAACCC 3420TATCTCGGTC TATTCTTTTG ATTTATAAGG GATTTTGCCG ATTTCGGCCT ATTGGTTAAA 3480AAATGAGCTG ATTTAACAAA AATTTAACGC GAATTTTAAC AAAATATTAA CGCTTACAAT 3540TTGCCATTCG CCATTCAGGC TGCGCAACTG TTGGGAAGGG CGATCGGTGC GGGCCTCTTC 3600GCTATTACGC CAGCCCAAGC TACCATGATA AGTAAGTAAT ATTAAGGTAC GGGAGGTACT 3660TGGAGCGGCC GCAATAAAAT ATCTTTATTT TCATTACATC TGTGTGTTGG TTTTTTGTGT 3720GAATCGATAG TACTAACATA CGCTCTCCAT CAAAACAAAA CGAAACAAAA CAAACTAGCA 3780AAATAGGCTG TCCCCAGTGC AAGTGCAGGT GCCAGAACAT TTCTCTATCG ATA 3833(SEQ ID NO1)其中,7-32AdaP6為載體5′端通用引物33-58AdaP5為載體5′端通用引物74-102MCS(多克隆位點(diǎn)區(qū),啟動(dòng)子和目的基因克隆在這一區(qū)域)110-160SV40 early mRNA polyA(多聚腺苷酸加尾信號(hào))210-660f1 single-strand DN A origin(f1單鏈DNA復(fù)制起點(diǎn))801-827AdaP3為載體3′端通用引物950-977AdaP4為載體3′端通用引物860-1017SV40 early promoter(part)SV40早期啟動(dòng)子(部分)1333ColE1-derived plasmid replication origin(ColE1來(lái)源的質(zhì)粒復(fù)制起點(diǎn))
2095-2955Ampr(氨芐青霉素抗性基因)3087-3542f1 single-strand DNA origin(f1單鏈DNA復(fù)制起點(diǎn))3673-3826Synthetic poly(A)signal(多聚腺苷酸加尾信號(hào))(參見(jiàn)圖1描述載體的各個(gè)元件)。
利用所述載體的轉(zhuǎn)基因及整合位點(diǎn)鑒定的標(biāo)準(zhǔn)化方法的步驟為a將啟動(dòng)子和目的基因克隆在這一載體的多克隆位點(diǎn)區(qū)(MCS),以NotI酶切,回收兩個(gè)NotI酶切位點(diǎn)之間的線性化片段用于轉(zhuǎn)基因。
b用適當(dāng)?shù)姆椒ǖ姆椒ǐ@得轉(zhuǎn)基因生物或細(xì)胞后,按圖2所示的流程進(jìn)行整合位點(diǎn)鑒定。
本發(fā)明還提供了一種整合位點(diǎn)明確的轉(zhuǎn)基因小鼠資源庫(kù),資源庫(kù)中每一種轉(zhuǎn)基因動(dòng)物轉(zhuǎn)基因定位及被破壞內(nèi)源基因明確。
在本發(fā)明還提供了一種轉(zhuǎn)基因動(dòng)物基因型鑒定的方法,包括以下步驟a利用本發(fā)明上述方法獲得轉(zhuǎn)基因整合位點(diǎn)及其附近的基因組序列;b根據(jù)轉(zhuǎn)基因整合位點(diǎn)附近序列(載體側(cè)翼)設(shè)計(jì)的引物1,根據(jù)整合位點(diǎn)另一側(cè)野生型基因組序列設(shè)計(jì)引物2與引物1配對(duì),根據(jù)載體序列設(shè)計(jì)引物3與引物1配對(duì),以轉(zhuǎn)基因基因組為模板,三引物在同一體系中進(jìn)行PCR,則有三種結(jié)果分別代表三種基因型(見(jiàn)圖6)。
本發(fā)明的主要優(yōu)點(diǎn)在于(a)可以快速鑒定轉(zhuǎn)基因的整合位點(diǎn)。
(b)準(zhǔn)確性高。
(c)通用性好。
下面結(jié)合具體實(shí)施例,進(jìn)一步闡述本發(fā)明。應(yīng)理解,這些實(shí)施例僅用于說(shuō)明本發(fā)明而不用于限制本發(fā)明的范圍。下列實(shí)施例中未注明具體條件的實(shí)驗(yàn)方法,通常按照常規(guī)條件如Sambrook等人,分子克隆實(shí)驗(yàn)室手冊(cè)(New YorkCold Spring Harbor Laboratory Press,1989)中所述的條件,或按照制造廠商所建議的條件。
實(shí)施例1pEGFP-PLAG1轉(zhuǎn)基因小鼠整合位點(diǎn)鑒定(策略1)pEGFP-PLAG1轉(zhuǎn)基因質(zhì)粒是將含PLAG1完整編碼框及翻譯起始密碼前100余個(gè)堿基的片段克隆到pCMV-EGFP(購(gòu)自Clontech)載體的EcoRI位點(diǎn)構(gòu)建而成,其結(jié)構(gòu)如圖4所示。質(zhì)粒經(jīng)NsiI酶切后回收3.8kb的片段用于顯微注射。
分析上述轉(zhuǎn)基因載體片段序列中酶切位點(diǎn)分布情況,確定以Sau3AI作為限制性內(nèi)切酶E1酶切轉(zhuǎn)基因小鼠基因組,故設(shè)計(jì)合成以下接頭DNA(兩鏈退火后形成Sau3AI接頭)接頭15′-GTA ATA CGA CTC ACT ATA GGG CAC GCG TGGTCG ACG GCC CGG GCT GGT-3′(SEQ ID NO2)接頭25′-PO4-GATC ACC AGC CC-N2H-3′(5′-OH用PO4取代,3′-OH用N2H取代)(SEQ ID NO3)以TE或水溶解至50pmol/μl,臨用前各取5μl(等摩爾數(shù))混合,80℃10分鐘后自然降溫到室溫退火。
以Sau3AI消化5-10μg轉(zhuǎn)基因小鼠基因組DNA,電泳觀察酶切完全后,以酚氯仿抽提,乙醇沉淀純化后,DNA定量。取約0.5μg酶切回收后DNA與退火后的接頭DNA按一定比例混合(摩爾數(shù)1∶50),T4DNA連接酶(Biolabs)連接過(guò)夜。70℃,15min滅活連接酶,以QIAGEN凝膠回收試劑盒純化連接反應(yīng)液,溶于滅菌水中。
根據(jù)轉(zhuǎn)基因載體序列,PvuII為載體5′端限制性內(nèi)切酶E2,BglI作為載體3′端限制性內(nèi)切酶E2,建立兩個(gè)酶切體系,分別以PvuII、BglI消化上述與接頭連接后基因組DNA,以酚氯仿抽提,乙醇沉淀純化酶切反應(yīng)液,溶于TE或滅菌水中。按如下方法進(jìn)行巢式PCR,擴(kuò)增載體兩側(cè)基因組片段。
根據(jù)兩端接頭序列設(shè)計(jì)引物adaP15′-GTA ATA CGA CTC ACT ATA GGG C-3′(SEQ ID NO4)adaP25′-ACT ATA GGG CAC GCG TGG T-3′(SEQ ID NO5)
根據(jù)載體兩端序列設(shè)計(jì)如下兩對(duì)引物5out5′-GGG GCG GAG TTG TTA CGA CAT TTT GG-3′(SEQ IDNO6)5in5′-CAA TAG GGG GCG TAC TTG GCA TAT GA-3′(SEQID NO7)3out5′-CAC CTC CCC CTG AAC CTG AAA CAT A-3′(SEQ IDNO8)3in5′-CCC ACT ACG TGA ACC ATC ACC CTA A-3′(SEQ IDNO9)以上述純化PvuII酶切反應(yīng)液為模板,引物5out與adaP1配對(duì)進(jìn)行第一輪PCR,擴(kuò)增條件為95℃3min變性后,94℃30s,65℃30s,72℃30s,30個(gè)循環(huán)后72℃延伸5min。以第一輪PCR反應(yīng)液為模板,引物5in與adaP2配對(duì)進(jìn)行第二輪PCR,擴(kuò)增條件為95℃3min變性后,94℃30s,66℃30s,72℃30s,30個(gè)循環(huán)后72℃延伸5min。電泳檢測(cè)擴(kuò)增條帶,凝膠回收后測(cè)序或T-A克隆后測(cè)序獲得載體5′一側(cè)插入位點(diǎn)序列。同理,以上述純化BglI酶切反應(yīng)液為模板,引物3out與adaP1配對(duì)進(jìn)行第一輪PCR,引物3in與adaP2配對(duì)進(jìn)行第二輪PCR,獲得載體3′一側(cè)插入位點(diǎn)序列。
根據(jù)測(cè)序結(jié)果在Genbank(www.ncbi.nlm.nih.gov)和UCSC小鼠基因組序列數(shù)據(jù)庫(kù)(www.genome.ucsc.edu)進(jìn)行序列比對(duì),確定轉(zhuǎn)基因載體插入位置及其側(cè)翼序列。
實(shí)施例2pEGFP-PLAG1轉(zhuǎn)基因小鼠整合位點(diǎn)鑒定(策略2)設(shè)計(jì)合成以下接頭DNA(兩鏈退火后形成平末端接頭)接頭15′-GTA ATA CGA CTC ACT ATA GGG CAC GCG TGGTCG ACG GCC CGG GCT GGT-3′(SEQ ID NO10)接頭25′-PO4-ACC AGC CC-N2H-3′(5′-OH用PO4取代,3′-OH用N2H取代)(SEQ ID NO11)以TE或水溶解至50pmol/μl,臨用前各取5μl(等摩爾數(shù))混合,80℃10分鐘后自然降溫到室溫退火。
分析如實(shí)施例1中圖示的轉(zhuǎn)基因載體序列,找出一系列不切割載體DNA的產(chǎn)生平末端的限制性內(nèi)切酶EcoRV、NruI、PmacI、XmnI、PshAI、BstZ17I。
取5-10μg轉(zhuǎn)基因小鼠基因組DNA,依次以EcoRV、NruI、PmacI、XmnI消化(即一種酶消化后65℃15min滅活酶,乙醇沉淀純化后,換另一種酶切),電泳觀察酶切完全后,以酚氯仿抽提,乙醇沉淀純化后,DNA定量。取約0.5μg酶切回收后DNA與退火后的接頭DNA按一定比例混合(摩爾數(shù)1∶50),T4DNALigase(Biolabs)連接過(guò)夜。70℃,15min滅活連接酶,以QIAGEN凝膠回收試劑盒純化連接反應(yīng)液,溶于TE或滅菌水中。
根據(jù)兩端接頭序列設(shè)計(jì)引物adaP15′-GTA ATA CGA CTC ACT ATA GGG C-3′(SEQ ID NO12)adaP25′-ACT ATA GGG CAC GCG TGG T-3′(SEQ ID NO13)根據(jù)載體兩端序列設(shè)計(jì)如下兩對(duì)引物5out25′-AGC GCT AGC GGA TCT GAC GGT TCA CTA A-3′(SEQ ID NO14)5in25′-GGA AAT CCC CGT GAG TCA AAC CGC TAT C-3′(SEQ ID NO15)3out25′-AAG TAC CAC CCT CCC ACG TTT CCA TCA A-3′(SEQ ID NO16)3in25′-GCT ACA GGG CGC GTC AGG TGG CAC TTT-3′(SEQ ID NO17)以上述純化連接反應(yīng)液為模板,引物5out2與adaP1配對(duì),進(jìn)行第一輪PCR,擴(kuò)增條件為95℃3min變性后,94℃30s,68℃30s,72℃30s,30個(gè)循環(huán)后72℃延伸5min。以第一輪PCR反應(yīng)液為模板,引物5in2與adaP2配對(duì)進(jìn)行第二輪PCR,擴(kuò)增條件為95℃3min變性后,94℃30s,68℃30s,72℃30s,30個(gè)循環(huán)后72℃延伸5min。電泳檢測(cè)擴(kuò)增條帶,凝膠回收后測(cè)序或T-A克隆后測(cè)序獲得載體5′一側(cè)插入位點(diǎn)序列。同理,以上述純化BglI酶切反應(yīng)液為模板,引物3out2與adaP1配對(duì)進(jìn)行第一輪PCR,引物3in2與adaP2配對(duì)進(jìn)行第二輪PCR,獲得載體3′一側(cè)插入位點(diǎn)序列。
根據(jù)測(cè)序結(jié)果在Genbank(www.ncbi.nlm.nih.gov)和UCSC小鼠基因組序列數(shù)據(jù)庫(kù)(www.genome.ucsc.edu)進(jìn)行序列比對(duì),確定插入位置及其側(cè)翼序列。
實(shí)施例3利用通用載體Inte-vector建立轉(zhuǎn)基因小鼠系及轉(zhuǎn)基因小鼠整合位點(diǎn)鑒定將IAP啟動(dòng)子和基因KIF18A3(第1到11外顯子)cDNA序列克隆在通用載體Inte-vector(序列SEQ ID NO1所示)的多克隆位點(diǎn)區(qū)的XhoI與BamHI位點(diǎn)間,完成轉(zhuǎn)基因質(zhì)粒構(gòu)建,以NotI酶切,回收兩個(gè)NotI酶切位點(diǎn)之間的線性化片段用于轉(zhuǎn)基因。
按照實(shí)施例1所述方法以Sau3AI消化轉(zhuǎn)基因小鼠基因組,純化后與接頭連接(同實(shí)施例1)按照通用載體序列,PvuII為載體5′端限制性內(nèi)切酶E2,KpnI為載體3′端限制性內(nèi)切酶E2,建立兩個(gè)酶切體系,分別以PvuII、KpnI消化上述與接頭連接后基因組DNA,以酚氯仿抽提,乙醇沉淀純化酶切反應(yīng)液,溶于TE或滅菌水中。按如下方法進(jìn)行巢式PCR,擴(kuò)增載體兩側(cè)基因組片段。
通用引物序列如下AdaP1GTAATACGACTCACTATAGGGC(SEQ ID NO18)AdaP2ACTATAGGGCACGCGTGGT(SEQ ID NO19)AdaP3GCTACAGGGCGCGTCAGGTGGCACTTT(SEQ ID NO20)AdaP4AGGCGGAAAGAACCAGCTGTGGAATGTG(SEQ ID NO21)AdaP5GGGGCGGAGTTGTTACGACATTTTGG(SEQ ID NO22)AdaP6CAATAGGGGGCGTACTTGGCATATGA(SEQ ID NO23)其中,AdaP3、AdaP4、AdaP5、AdaP6在載體中的相應(yīng)位置見(jiàn)
發(fā)明內(nèi)容
中通用載體圖注。
以上述純化PvuII酶切反應(yīng)液為模板,引物AdaP5與adaP1配對(duì),引物AdaP6與adaP2配對(duì)進(jìn)行第二輪PCR,電泳檢測(cè)擴(kuò)增條帶,凝膠回收后測(cè)序或T-A克隆后測(cè)序獲得載體5′一側(cè)插入位點(diǎn)序列。同理,以上述純化KpnI酶切反應(yīng)液為模板,引物AdaP3與adaP1配對(duì)進(jìn)行第一輪PCR,引物AdaP4與adaP2配對(duì)進(jìn)行第二輪PCR,獲得載體3′一側(cè)插入位點(diǎn)序列。
根據(jù)測(cè)序結(jié)果在Genbank(www.ncbi.nlm.nih.gov)和UCSC小鼠基因組序列數(shù)據(jù)庫(kù)(www.genome.ucsc.edu)進(jìn)行序列比對(duì),確定插入位置及其側(cè)翼序列。
實(shí)施例4在本實(shí)施例中,利用實(shí)施例1和2中所示的方法,對(duì)pEGFP-PLAG1轉(zhuǎn)基因小鼠8個(gè)系的整合位點(diǎn)及插入后破壞基因進(jìn)行了鑒定。結(jié)果如下表1所示。
表1
L表示品系;Left表示載體5′端插入位點(diǎn);Right表示載體3′端如插入位點(diǎn);Interrupted gene表示被破壞的內(nèi)源基因。
其中,21系小鼠表現(xiàn)出雄性小鼠不育的表型,進(jìn)一步研究表明此表型與內(nèi)源基因kif18A功能破壞密切相關(guān)。
在本發(fā)明提及的所有文獻(xiàn)都在本申請(qǐng)中引用作為參考,就如同每一篇文獻(xiàn)被單獨(dú)引用作為參考那樣。此外應(yīng)理解,在閱讀了本發(fā)明的上述講授內(nèi)容之后,本領(lǐng)域技術(shù)人員可以對(duì)本發(fā)明作各種改動(dòng)或修改,這些等價(jià)形式同樣落于本申請(qǐng)所附權(quán)利要求
書(shū)所限定的范圍。
序列表<110>王,鑄剛<120>一種快速方便轉(zhuǎn)基因插入位點(diǎn)鑒定技術(shù)<130>059989<160>23<170>PatentIn version 3.3<210>1<211>3833<212>DNA<213>人工序列<220>
<221>misc_feature<223>載體<400>1ggtacctcat atgccaagta cgccccctat tgccaaaatg tcgtaacaac tccgccccgc 60tgtacaagta ctcagatctc gagctcaagc ttcgaattcc gggatccacc ggatctagat 120aactgatcat aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc 180cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta 240ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 300ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct taacgcgtaa 360attgtaagcg ttaatatttt gttaaaattc gcgttaaatt tttgttaaat cagctcattt 420tttaaccaat aggccgaaat cggcaaaatc ccttataaat caaaagaata gaccgagata 480gggttgagtg ttgttccagt ttggaacaag agtccactat taaagaacgt ggactccaac 540gtcaaagggc gaaaaaccgt ctatcagggc gatggcccac tacgtgaacc atcaccctaa 600tcaagttttt tggggtcgag gtgccgtaaa gcactaaatc ggaaccctaa agggagcccc 660cgatttagag cttgacgggg aaagccggcg aacgtggcga gaaaggaagg gaagaaagcg 720aaaggagcgg gcgctagggc gctggcaagt gtagcggtca cgctgcgcgt aaccaccaca 780cccgccgcgc ttaatgcgcc gctacagggc gcgtcaggtg gcacttttcg gggaaatgtg 840cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 900caataaccct gataaatgct tcaataatat tgaaaaagga agagtcctga ggcggaaaga 960accagctgtg gaatgtgtgt cagttagggt gtggaaagtc cccaggctcc ccagcagcgg 1020ccgcgtcgac cgatgccctt gagagccttc aacccagtca gctccttccg gtgggcgcgg 1080ggcatgacta tcgtcgccgc acttatgact gtcttcttta tcatgcaact cgtaggacag 1140gtgccggcag cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct 1200gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga 1260taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 1320cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 1380ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 1440aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 1500tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt 1560gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 1620cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 1680ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 1740cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct 1800gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 1860cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 1920tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 1980ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta 2040aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca 2100atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc 2160ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc 2220tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc 2280agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat 2340
taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt 2400tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc 2460cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag 2520ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt 2580tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac 2640tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg 2700cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat 2760tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc 2820gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc 2880tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa 2940atgttgaata ctcatactct tcctttttca atattattga agcatttatc agggttattg 3000tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg 3060cacatttccc cgaaaagtgc cacctgacgc gccctgtagc ggcgcattaa gcgcggcggg 3120tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt 3180cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg 3240ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga 3300ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac 3360gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc 3420tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct attggttaaa 3480aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa cgcttacaat 3540ttgccattcg ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc 3600gctattacgc cagcccaagc taccatgata agtaagtaat attaaggtac gggaggtact 3660tggagcggcc gcaataaaat atctttattt tcattacatc tgtgtgttgg ttttttgtgt 3720gaatcgatag tactaacata cgctctccat caaaacaaaa cgaaacaaaa caaactagca 3780aaataggctg tccccagtgc aagtgcaggt gccagaacat ttctctatcg ata 3833<210>2<211>48<212>DNA<213>人工序列<220>
<221>misc_feature<223>接頭<400>2gtaatacgac tcactatagg gcacgcgtgg tcgacggccc gggctggt 48<210>3<211>12<212>DNA<213>人工序列<220>
<221>misc_feature<223>接頭<400>3gatcaccagc cc 12<210>4<211>22<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>4gtaatacgac tcactatagg gc 22
<210>5<211>19<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>5actatagggc acgcgtggt 19<210>6<211>26<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>6ggggcggagt tgttacgaca ttttgg 26<210>7<211>26<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>7caataggggg cgtacttggc atatga 26<210>8<211>25<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>8cacctccccc tgaacctgaa acata 25<210>9<211>25<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>9cccactacgt gaaccatcac cctaa 25<210>10<211>48
<212>DNA<213>人工序列<220>
<221>misc_feature<223>接頭<400>10gtaatacgac tcactatagg gcacgcgtgg tcgacggccc gggctggt 48<210>11<211>8<212>DNA<213>人工序列<220>
<221>misc_feature<223>接頭<400>11accagccc 8<210>12<211>22<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>12gtaatacgac tcactatagg gc 22<210>13<211>19<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>13actatagggc acgcgtggt 19<210>14<211>28<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>14agcgctagcg gatctgacgg ttcactaa 28<210>15<211>28<212>DNA<213>人工序列
<220>
<221>misc_feature<223>引物<400>15ggaaatcccc gtgagtcaaa ccgctatc 28<210>16<211>28<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>16aagtaccacc ctcccacgtt tccatcaa 28<210>17<211>27<212>DNA<213>人工序列<220>
<22t>misc_feature<223>引物<400>17gctacagggc gcgtcaggtg gcacttt 27<210>18<211>22<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>18gtaatacgac tcactatagg gc 22<210>19<211>19<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>19actatagggc acgcgtggt 19<210>20<211>27<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>20gctacagggc gcgtcaggtg gcacttt 27<210>21<211>28<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>21aggcggaaag aaccagctgt ggaatgtg 28<210>22<211>26<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>22ggggcggagt tgttacgaca ttttgg 26<210>23<211>26<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>23caataggggg cgtacttggc atatga 26
權(quán)利要求
1.一種確定轉(zhuǎn)基因插入位點(diǎn)的方法,其特征在于,包括步驟(a)對(duì)于待確定轉(zhuǎn)基因插入位點(diǎn)的基因組DNA,用限制性內(nèi)切酶進(jìn)行消化,從而獲得消化后的基因組片段,然后在消化后的基因組片段兩端連接接頭,從而形成在兩端帶有接頭的基因組片段;(b)以載體序列特異性引物和接頭序列特異性引物,對(duì)步驟(a)中兩端帶有接頭的基因組片段進(jìn)行PCR擴(kuò)增,從而獲得PCR產(chǎn)物,其中所述的PCR產(chǎn)物對(duì)應(yīng)于位于載體與接頭之間的基因組DNA序列;(c)對(duì)步驟(b)中的PCR產(chǎn)物進(jìn)行測(cè)序;(d)根據(jù)步驟(c)的測(cè)序結(jié)果,確定轉(zhuǎn)基因的插入位點(diǎn)。
2.如權(quán)利要求
1所述的方法,其特征在于,步驟(a)中所述的限制性內(nèi)切酶選自下組(i).將基因組DNA切割為平均長(zhǎng)度小于1kb片段的一種限制性內(nèi)切酶;(ii).數(shù)種限制性內(nèi)切酶的混合物,其中所述的數(shù)種(2-10種)限制性內(nèi)切酶是產(chǎn)生相同粘性末端的限制性內(nèi)切酶,并且所述的混合物將基因組DNA切割為平均長(zhǎng)度小于1kb片段;(iii)數(shù)種限制性內(nèi)切酶的混合物,其中所述的數(shù)種(2-10種)限制性內(nèi)切酶是產(chǎn)生相同平頭末端的限制性內(nèi)切酶,并且所述的混合物將基因組DNA切割為平均長(zhǎng)度小于1kb片段;附加條件是,如果若選用的第一限制性內(nèi)切酶E1可以切割載體序列,在步驟(b)與(c)之間加步驟(b′)即在添加接頭之后,用可切斷位于兩個(gè)E1間載體頭尾相連部的第二限制性內(nèi)切酶E2消化已加接頭的連接產(chǎn)物。
3.如權(quán)利要求
1所述的方法,其特征在于,所述的限制性內(nèi)切酶選自下組●一種在基因組中識(shí)別位點(diǎn)序列為4個(gè)或5個(gè)堿基的限制性內(nèi)切酶Sau3AI、MspI、NdeII、AccII、AluI、HphI、MboII;●切割后產(chǎn)生相同粘性末端的數(shù)種同尾酶的組合BamHI、BglII、BclI、MboI、XhoII的組合;NheI、XbaI、SpeI、AvrII的組合;●產(chǎn)生平末端的數(shù)種限制性內(nèi)切酶的組合EcoRV、NruI、PmacI、XmnI、PshAI、BstZ17I、SmaI、SspI、PvuII等產(chǎn)生平末端的酶的組合。
4.如權(quán)利要求
3所述的方法,其特征在于,所述的第二限制性內(nèi)切酶E2的具有以下特征●是與第一限制性內(nèi)切酶不同的限制性內(nèi)切酶,●可以切斷兩個(gè)E1間載體頭尾相連部的限制性內(nèi)切酶,●不切割兩個(gè)E1間載體/基因組接合部的載體序列。
5.如權(quán)利要求
1所述的方法,其特征在于,所述的接頭具有以下特征a.接頭是由兩條單鏈DNA退火而成,退火后接頭雙鏈端形成能與限制性內(nèi)切酶切割后產(chǎn)生的末端匹配的末端結(jié)構(gòu);b.接頭中兩條單鏈DNA長(zhǎng)度不同,一條較長(zhǎng),其長(zhǎng)度范圍為40bp-100bp,在其單鏈區(qū)可以作為兩條巢式引物的模板;而另一條較短,其長(zhǎng)度范圍為6-20bp,其5′端堿基磷酸化,3′端堿基氨基化;c.接頭序列單鏈區(qū)不能與限制性內(nèi)切酶消化后轉(zhuǎn)基因載體/基因組結(jié)合部的載體序列區(qū)任何一段序列相同。
6.如權(quán)利要求
1所述的方法,其特征在于,所述的載體序列特異性引物具有以下特征●引物序列的選擇以限制性內(nèi)切酶消化后轉(zhuǎn)基因載體/基因組結(jié)合部的載體序列為模板,●引物序列可以與接頭序列特異性引物配對(duì)用于PCR反應(yīng)。
7.如權(quán)利要求
1所述的方法,其特征在于,所述基因組DNA是哺乳動(dòng)物的基因組DNA、或植物細(xì)胞的基因組DNA。
8.如權(quán)利要求
1所述的方法,其特征在于,在步驟(d)中,還包括(1)根據(jù)測(cè)序結(jié)果,確定轉(zhuǎn)基因片段插入后基因組結(jié)構(gòu)有無(wú)變化(如缺失或重排);或者(2)進(jìn)行轉(zhuǎn)基因表達(dá)與表型的因果關(guān)系分析;或者(3)進(jìn)行轉(zhuǎn)基因基因型的鑒定。
9.如權(quán)利要求
8所述的方法,其特征在于,所述的轉(zhuǎn)基因基因型鑒定包括步驟以轉(zhuǎn)基因的基因組DNA為模板,用第一、第二和第三引物在同一體系中進(jìn)行PCR擴(kuò)增,其中,第一引物的序列對(duì)應(yīng)于轉(zhuǎn)基因整合位點(diǎn)附近序列(載體側(cè)翼)的序列;第二引物的序列對(duì)應(yīng)于整合位點(diǎn)另一側(cè)野生型基因組的序列,并且第一引物和第二引物構(gòu)成第一引物對(duì);第三引物的序列對(duì)應(yīng)于載體序列,并且第一引物和第三引物構(gòu)成第二引物對(duì);其中,根據(jù)以下標(biāo)準(zhǔn)判斷基因型如果只出現(xiàn)第一引物對(duì)的擴(kuò)增產(chǎn)物,就表明是野生型;如果只出現(xiàn)第二引物對(duì)的擴(kuò)增產(chǎn)物,就表明是轉(zhuǎn)基因純合型;如果同時(shí)出現(xiàn)第一引物對(duì)的擴(kuò)增產(chǎn)物和第二引物對(duì)的擴(kuò)增產(chǎn)物,就表明是轉(zhuǎn)基因雜合型。
10.一種用于權(quán)利要求
1所述的方法的轉(zhuǎn)基因載體,其特征在于,所述的載體是具有SEQ ID NO1所示序列的載體。
專利摘要
本發(fā)明公開(kāi)了一種確定轉(zhuǎn)基因插入位點(diǎn)的方法,其特點(diǎn)為通過(guò)限制性內(nèi)切酶消化,接頭連接和PCR等簡(jiǎn)單易行的步驟獲得位于載體與接頭之間的基因組DNA序列而確定轉(zhuǎn)基因插入位點(diǎn)。本發(fā)明的方法可用于確定外源基因整合位點(diǎn)及附近的基因組序列以及進(jìn)行轉(zhuǎn)基因表達(dá)與表型的因果關(guān)系分析等。
文檔編號(hào)C12N15/63GK1995384SQ200610023132
公開(kāi)日2007年7月11日 申請(qǐng)日期2006年1月6日
發(fā)明者王鑄鋼 申請(qǐng)人:王鑄鋼導(dǎo)出引文BiBTeX, EndNote, RefMan