專利名稱:一種發(fā)卡結構介導的測定5′端側翼未知序列的方法
技術領域:
本發(fā)明屬于生物工程技術領域,是一種涉及限制性內切酶(Restriction Endonuclease)酶切、發(fā)卡結構(Hairpin Structure)連接禾口巢式 PCR(Nest Polymerase Chain Reaction)擴增等技術,基于已知DNA(Deoxyribonucleic Acid)序列測定其5'端 側翼未知DNA序列的方法。
背景技術:
隨著基因工程技術及互聯(lián)網(wǎng)的發(fā)展,越來越多的基因序列被公布并可為廣大科研 工作者所利用,但是報道的基因中有相當一部分只獲得了部分DNA序列。當我們不了解某 個基因完整的DNA序列時,就無法對該基因進行結構和功能的深入研究。在分子生物學及 微生物育種研究中,經(jīng)常需要克隆已知DNA序列的側翼區(qū)域,如分離基因的調控區(qū)、獲得基 因的排布信息、分析轉基因的插入位點、構建圖位克隆中的重疊群等。目前根據(jù)已知DNA序 列鑒定其兩端未知序列的方法極其有限,從而使這項工作變得繁重和棘手。隨機測序法是 通過大量地隨機測定DNA序列并借助計算機進行排序的方法來獲取目的DNA序列。該方法 存在很大的偶然性,通常會耗費很大的人力和物力。3'-和5' -RACE(3‘ and 5' Rapid Amplification of cDNA Ends)法是在已知部分mRNA序列的情況下獲取目的基因完整的 mRNA序列。RACE法只能獲取目的基因的可轉錄序列部分,而不能確定其上下游調控元件序 列。另外,該方法步驟較繁瑣,mRNA又極其不穩(wěn)定,反轉錄還特別容易受到豐度低和高級結 構的影響,因此效果也不是很理想。而利用同位素或生物素標記探針對基因組或DNA文庫 進行雜交篩選的方法,則更是費時費力。
發(fā)明內容
本發(fā)明的目的是提供一種操作簡便、應用范圍廣、成本低廉、高效準確、發(fā)卡結構 介導的PCR擴增方法,能夠基于已知DNA序列確定其5'端側翼未知DNA序列。本發(fā)明的技術方案①選用限制性內切酶單酶切基因組DNA ;②將純化的酶切產(chǎn) 物與發(fā)卡結構進行連接;③選定發(fā)卡結構上的一段特異性序列作為5'端引物、兩條靠近 未知序列端的已知DNA序列上的特異性序列作為3'端引物;④以發(fā)卡結構連接物為模板, 用設計的引物進行巢式PCR擴增,并對其擴增片段進行克隆和測序。具體步驟如下(1)引物及發(fā)卡結構的設計基于已知DNA序列設計兩條3'端特異性引物,命 名為 Primer-Rl 和 Primer_R2 (18_22bp) ;Primer-R2 的 3'端距待測序列要保留 30bp 以 上長度,比Primer-Rl接近待測定的未知序列(見圖1和圖3);設計一條易形成發(fā)卡結 構的寡聚核苷酸序列,命名為HS0(41bp);基于HSO設計一條5'端特異性引物,命名為 HSO-F(18bp)。HSO 5' -NNNNCTACTGGCATGGGCGAGTAATCCGCCCATGCCAGTAG-3'或 5' -CTACTGGCA TGGGCGAGTAATCCGCCCATGCCAGTAGNNNN-3',HSO-F :ATCCGCCCATGCCAGTAG-3,,
其中NNNN為隨機寡聚核苷酸,其位置、序列和長度需要根據(jù)步驟(2)選用的限制 性內切酶的特性而定。(2)限制 性內切酶的選擇分析已知DNA序列上的限制性內切酶位點,選用從 Primer-Rl到待測的未知序列之間沒有酶切位點的內切酶。本發(fā)明可供選擇常用的產(chǎn)生 5'末端突出四個堿基的限制性內切酶有EcoR I ,Hind IILBgl IKSal I ,BamH I、Nco I、 Xba I和Xho I等,產(chǎn)生3'末端突出四個堿基的有Aat IKPst I ,Sac I和Sph I等,產(chǎn)生 5'末端突出兩個堿基的有Cla I ,Msp I和Nde I等。(3)發(fā)卡結構的制備對合成的寡聚核苷酸序列HSO進行94°C熱變性,隨后緩慢降 溫至25°C并保持一定時間,即可形成發(fā)卡結構。(4)PCR模板的構建采用步驟(2)選擇的內切酶對基因組DNA進行單酶切,純化 的酶切產(chǎn)物與步驟(3)獲得的發(fā)卡結構連接,即可作為PCR模板。(5)巢式PCR擴增以步驟(4)的發(fā)卡結構連接物為模板,用HSO-F和Primer-Rl 為引物進行第一輪PCR擴增;再以首輪PCR擴增產(chǎn)物為模板,用HSO-F和Primer-R2為引物 進行第二輪PCR擴增。將兩輪PCR(巢式PCR)擴增產(chǎn)物進行瓊脂糖凝膠電泳檢測,根據(jù)巢 式PCR原理可快速驗證其擴增的產(chǎn)物是否為目的片段。本發(fā)明與現(xiàn)行的方法相比,具有如下的優(yōu)點(1)操作簡便。與隨機測序法相比,避免了對基因組進行大規(guī)模的測序,也無需進 行繁瑣的計算和排序工作,從而節(jié)省了大量的人力、時間和財力。(2)應用范圍廣。在已知部分DNA序列的基礎上,發(fā)卡結構介導的PCR擴增可應用 于各種不同基因的5'端側翼未知序列的測定。(3)操作限制少。只要有90bp左右的已知DNA序列就足夠操作,而且可供選擇的 限制性內切酶較多。(4)引物特異性強。本發(fā)明通過利用發(fā)卡結構介導的PCR方法,把隨機引物的擴增 轉變成特異性引物的擴增,大幅度提高了 PCR擴增的特異性和效率。(5)結果驗證簡捷。巢式PCR擴增可快速驗證其擴增的產(chǎn)物是否為目標DNA片段, 具有簡捷、準確和實用性強等特點。(6)未知序列長度不限。由于基因組DNA的酶切位點是隨機分布的,本發(fā)明可獲取 未知序列長達幾Kb的片段,而且序列的準確性和真實性不會因長度的增加而影響。(7)成本低廉。本發(fā)明的核心還是簡單的PCR擴增,所以無需昂貴的儀器和試劑
品.ο
圖1 粘性末端的5'端側翼未知DNA序列克隆示意圖宇佐美曲霉(Aspergillus usamii)EOOl基因組DNA經(jīng)產(chǎn)生3‘粘性末端的限制性 內切酶Pst I酶切,純化后與發(fā)卡結構連接構建PCR模板。圖2:宇佐美曲霉EOOl第10家族木聚糖酶基因(xynlOA)5'端側翼的測序結果圖3:5'粘性末端的5'端側翼未知DNA序列克隆示意圖宇佐美曲霉(Aspergillus usamii)EOOl基因組DNA經(jīng)產(chǎn)生5‘粘性末端的限制性 內切酶Msp I酶切,純化后與發(fā)卡接頭連接構建PCR模板。
圖4 宇佐美曲霉EOOl第11家族木聚糖酶基因(xynllA)5'端側翼的測序結果
具體實施例方式以下結合具體實施 例,進一步闡述本發(fā)明的操作方法。但是這些實施例僅用于詳 細說明本發(fā)明,而不用于限制本發(fā)明的范圍。實施例1宇佐美曲霉(Aspergillus usamii)E001 xynlOA啟動子序列的測定。(I)DNA酶切產(chǎn)物的制備選用Pst I對宇佐美曲霉基因組DNA進行單酶切。構建 如下酶切體系10 X H Buffer 2μ 1, Pst I 2 μ 1,基因組DNA 10 μ 1,無菌水6 μ 1 ;將上述 體系在37°C水浴中反應4h。酶切純化產(chǎn)物(20 μ 1)命名為xynlOAP。(2)發(fā)卡結構的制備=HSO(IOOym0VL) 2 μ 1,無菌水8 μ 1,充分混勻;94°C變性 3min,緩慢降溫(1°C /s)至25°C后恒溫退火30min。(3)xynlOAP 與發(fā)卡結構的連接10XT4 DNA Ligase Buffer Iul,HSO 3μ 1, xynlOAP 5μ 1,T4 DNA Ligase 1 μ 1 ; 16°C連接過夜。(4) xynlOA 啟動子第一輪 PCR 擴增10 X PCR Buffer 2. 5 μ 1,dNTP 1. 5 μ 1, HSO 連接物 2 μ 1,HSO-F 0. 5 μ 1,XynlOA-Rl 0. 5 μ 1,無菌水 17. 75 μ 1,Taq 酶 0. 25 μ 1 ; 94 °C 5min,30 個循環(huán)(94°C 30s,56°C 30s, 72 °C lmin),72°C IOmin0 目的產(chǎn)物命名為 xynlOAP-Out ο(5) xynlOA 啟動子第二輪 PCR 擴增10 X PCR Buffer 2· 5 μ 1,dNTP 1· 5 μ 1, xynlOAP-Out 0· 5 μ 1,HSO-F 0· 5 μ 1,Xynl0A-R20. 5 μ 1,無菌水 19. 25 μ 1,Taq 酶 0. 25 μ 1 ; 94 0C 5min,30 個循環(huán)(94°C 30s,55°C 30s, 72 °C lmin),72°C IOmin0 目的產(chǎn)物命名為 xynlOAP-In。(6) xynlOAP-In的克隆和測序將xynlOAP-In按照割膠回收試劑盒說明書上的操 作步驟進行割膠回收,將純化的產(chǎn)物克隆到PUCm-T載體上進行測序,結果如圖2所示。實施例2宇佐美曲霉(Aspergillus usamii)E001 xynllA啟動子序列的測定。(I)DNA酶切產(chǎn)物的制備選用Msp I對宇佐美曲霉基因組DNA進行酶切。構建如 下酶切體系10XT Buffer 2 μ l,Msp I 2 μ 1,0. 1% BSA 2 μ 1,基因組DNA 10 μ 1,無菌水 4μ 1 ;將該體系在37°C水浴中反應4h。酶切純化產(chǎn)物(20 μ 1)命名為xynllAP。(2)發(fā)卡接頭的制備=HSO(IOOym0VL) 2 μ 1,無菌水8 μ 1,充分混勻;94°C變性 3min,緩慢降溫(1°C /s)至25°C后恒溫退火30min。(3)xynllAP 與發(fā)卡結構的連接10XT4 DNA Ligase Buffer 1 μ 1, HSO 3μ 1, xynllAP 5μ1,Τ4 DNA Ligase 1 μ 1 ;16°C連接過夜。(4)xynllA 啟動子第一輪 PCR 擴增10XPCR Buffer 2. 5 μ 1, dNTP 1. 5μ 1, HSO 連接物 2 μ 1,HSO-F 0. 5 μ 1,XynllA-Rl 0. 5 μ 1,無菌水 17. 75 μ 1,Taq 酶 0. 25 μ 1 ; 94 0C 5min,30 個循環(huán)(94°C 30s,56°C 30s, 72 °C lmin),72°C IOmin0 目的產(chǎn)物命名為 xynlIAP-Out ο(5) xynl IA 啟動子第二輪 PCR 擴增10X PCR Buffer 2. 5 μ 1, dNTP 1. 5μ 1, xynl IAP-Out 0· 5 μ 1,HSO-F 0· 5 μ 1,Xynl 1A-R20. 5 μ 1,無菌水 19. 25 μ 1,Taq 酶 0· 25 μ 1 ;94 °C 5min,30 個循環(huán)(94°C 30s,55°C 30s, 72 °C lmin),72°C IOmin0 目的產(chǎn)物命名為 xynlIAP-In0 (6) xynlIAP-In的克隆和測 序將xynllAP-In按照割膠回收試劑盒說明書上的操 作步驟進行割膠回收,將純化的產(chǎn)物克隆到PUCm-T載體上進行測序,結果如圖4所示。
權利要求
1.一種發(fā)卡結構介導的PCR擴增已知DNA序列5'端側翼未知序列的方法,其特征在 于選用限制性內切酶單酶切基因組DNA ;將純化的酶切產(chǎn)物與發(fā)卡結構進行連接;利用引 物設計軟件選定發(fā)卡結構上的一段特異性序列作為5'端引物以及兩條靠近未知序列端的 已知DNA序列上的互補序列作為3'端引物;以發(fā)卡結構連接物為模板,采用設計的引物進 行巢式PCR擴增以獲取已知DNA序列5'端側翼的未知序列;(1)引物及發(fā)卡結構的設計依據(jù)已知DNA序列設計兩條3'端特異性引物,命名為 Primer-Rl和Primer_R2 (18_22bp) ;Primer-R2的3'端距待測序列要保留30bp以上長度, 它比ft~imer-Rl接近待測定的未知序列;設計一條易形成發(fā)卡結構的寡聚核苷酸序列,命 名為HS(K41bp);基于HSO設計一條5'端特異性引物,命名為HSO-F(ISbp);HSO 5' -NNNNCTACTGGCATGGGCGAGTAATCCGCCCATGCCAGTAG-3'或 5 ‘ -CTACTGGCATGGGCGAGTAATCCGCCCATGCCAGTAGNNNN-3‘,HSO-F 5‘ -ATCCGCCCATGCCAGTAG-3’,其中NNNN為隨機寡聚核苷酸,其位置、序列和長度需要根據(jù)步驟( 選用的限制性內 切酶的特性而定;(2)限制性內切酶的選擇分析已知DNA序列上的限制性內切酶位點,選用從 Primer-Rl到待測的未知序列之間沒有酶切位點的內切酶;本發(fā)明可供選擇常用的產(chǎn)生 5'末端突出四個堿基的限制性內切酶有EcoR I ,Hind IILBgl IKSal I ,BamH I、Nco I、 Xba I和Xho I等;產(chǎn)生3'末端突出四個堿基的有Aat II, Pst K Sac I和Sph I等;產(chǎn) 生5'末端突出兩個堿基的有Cla I ,Msp I和Nde I等;(3)發(fā)卡結構的形成對合成的寡聚核苷酸序列HSO進行94°C熱變性3min,隨后緩慢 降溫至25°C并保持30min,即可形成發(fā)卡結構;G)PCR模板的構建采用步驟(2)選擇的內切酶對基因組DNA進行單酶切,純化的酶 切產(chǎn)物與步驟(3)形成的發(fā)卡結構進行連接,即可作為PCR模板;(5)巢式PCR擴增以步驟(4)的發(fā)卡結構連接物為模板,用HSO-F和ft~imer-Rl為引 物進行第一輪PCR擴增;再以首輪PCR擴增產(chǎn)物為模板,用HSO-F和ft~imer-R2為引物進行 第二輪PCR擴增;將兩輪PCR (巢式PCR)擴增產(chǎn)物進行瓊脂糖凝膠電泳檢測,根據(jù)巢式PCR 原理可快速驗證其擴增的產(chǎn)物是否為目的片段。
2.根據(jù)權利要求1所述的方法,操作過程中所使用的反應體系和條件如下(1)按如下的體系和條件單酶切宇佐美曲霉EOOl基因組DNA(以I^stI為例) IOXHBuffer 2μ 1, Pst I 2 μ 1,基因組DNA 10 μ 1,無菌水6 μ 1 ;將該體系在37°C水浴中 反應4h ;純化回收酶切產(chǎn)物并溶于20 μ 1無菌水中;酶切純化產(chǎn)物命名為xynlOAP ;(2)按如下體系和條件形成發(fā)卡結構=HSO(IOOym0VL)2 μ 1,去離子水8 μ 1,混勻; 94°C熱變性3min,隨后緩慢降溫(1°C /s)至25°C后恒溫退火30min ;(3)按如下的體系和條件連接xynlOAP與發(fā)卡結構HS0:10XT4DNA Ligase Buffer 1 μ 1,HSO 3 μ 1,xynlOAP 5μ 1,Τ4 DNA Ligase 1 μ 1 ; 16°C連接過夜;(4)按如下的體系和條件進行第一輪PCR擴增10XPCRBuffer 2. 5 μ 1, dNTP 1. 5μ 1,步驟(3)連接產(chǎn)物 2 μ 1,HSO-F 0· 5 μ 1,XynlOA-RlO. 5 μ 1,無菌水 17. 75 μ 1, Taq 酶 0. 25μ 1 ;94°C 5min,30 個循環(huán)(94°C 30s, 56 °C 30s, 72 °C lmin),72°C IOmin;首輪 PCR 擴增產(chǎn)物命名為xynlOAP-Out ;按如下的體系和條件進行第二輪PCR擴增10XPCR Buffer2. 5 μ 1, dNTP 1. 5μ 1, xynlOAP-Out 0. 5μ 1, HSO-F 0· 5 μ 1,XynlOA_R2 0· 5 μ 1,無菌水 19. 25μ 1,Taq 酶 0. 25μ 1 ;94°C 5min,30 個循(94°C 30s, 55°C 30s, 72°C lmin),72°C IOmin ;第二輪PCR擴增產(chǎn)物命名為xynlOAP-In。
全文摘要
本發(fā)明是一種涉及限制性內切酶酶切、發(fā)卡結構連接和巢式PCR擴增等技術,基于已知DNA序列測定其5′端側翼未知DNA序列的方法。該方法通過合成一條易形成發(fā)卡結構的寡聚核苷酸序列;選用單一限制性內切酶酶切基因組DNA,純化后與發(fā)卡結構連接;利用引物設計軟件選定發(fā)卡結構上的一段特異性序列作為5′端引物、兩條靠近未知序列端的已知DNA序列上的互補序列作為3′端引物;以發(fā)卡結構連接物為模板,采用設計的引物進行巢式PCR擴增以獲取已知DNA序列5′端側翼的未知序列。本發(fā)明具有操作簡便、應用范圍廣、操作限制少、引物特異性強、結果驗證簡捷、未知序列長度不限和成本低廉等特點。
文檔編號C12Q1/68GK102140503SQ20101055090
公開日2011年8月3日 申請日期2010年11月19日 優(yōu)先權日2010年11月19日
發(fā)明者吳靜, 唐存多, 張慧敏, 李劍芳, 汪俊卿, 鄔敏辰, 高金湖 申請人:江南大學