專利名稱:用于切除靶核酸的核酸、組合物和方法
技術(shù)領(lǐng)域:
本申請?zhí)峁┑暮怂?、組合物、和方法通常涉及分子生物學(xué)和基因工程領(lǐng)域。
2.
背景技術(shù):
在很多領(lǐng)域,包括代謝工程、工業(yè)微生物學(xué)、合成生物學(xué)、和基礎(chǔ)分子遺傳學(xué)研究中,都需要利用基因工程技術(shù)從宿主細(xì)胞基因組或游離基因中切除靶核酸。然而,此前用于除去靶核酸的方法在應(yīng)用方面受到了約束和限制。例如,利用位點(diǎn)特異性重組酶方法除去會遺留有害的特異性重組酶結(jié)合位點(diǎn),這些位點(diǎn)會在宿主細(xì)胞中產(chǎn)生潛在的基因組不穩(wěn)定性。其他方法產(chǎn)生切除事件的頻率較低,因而,有必要找到一些方法,通過生長選擇經(jīng)歷切除事件的稀有宿主細(xì)胞。需要提供一種核酸、組合物、和方法,用于從宿主細(xì)胞基因組或游離基因中高頻率和高精確度地切除靶核酸,而不會產(chǎn)生潛在的基因組不穩(wěn)定性。3.發(fā)明概述本申請?zhí)峁┝艘环N核酸、組合物、和方法,用于切除宿主細(xì)胞基因組的一個或多個基因座。第一方面,本申請?zhí)峁┝艘环N可切除的核酸構(gòu)建體,從5’至3’方向包括:a)第一串聯(lián)重復(fù)核酸,b)第一歸巢核酸內(nèi)切酶識別位點(diǎn),c)靶核酸,d)第二歸巢核酸內(nèi)切酶識別位點(diǎn)以及e)第二串聯(lián)重復(fù)核酸。在某些實(shí)施方式中,可切除的核酸構(gòu)建體整合至宿主細(xì)胞基因組中。在某些實(shí)施方式中,第二歸巢核酸內(nèi)切酶識別位點(diǎn)是可選的。第一和第二歸巢核酸內(nèi)切酶識別位點(diǎn)用于歸巢核酸內(nèi)切酶剪切可切除的核酸構(gòu)建體。歸巢核酸內(nèi)切酶與歸巢核酸內(nèi)切酶識別位點(diǎn)結(jié)合能夠剪切位于或鄰近歸巢核酸內(nèi)切酶識別位點(diǎn)的可切除的核酸構(gòu)建體。在某些實(shí)施方式中,每個第一和第二歸巢核酸內(nèi)切酶識別位點(diǎn)獨(dú)立地包含14-40個核苷酸堿基對。在某些實(shí)施方式中,每個第一和第二歸巢核酸內(nèi)切酶識別位點(diǎn)獨(dú)立地由14-40個核苷酸堿基對組成。在某些實(shí)施方式中,每個歸巢核酸內(nèi)切酶識別位點(diǎn)獨(dú)立地由20-40個核苷酸堿基對組成。在某些實(shí)施方式中,每個歸巢核酸內(nèi)切酶識別位點(diǎn)獨(dú)立地由25-40個核苷酸堿基對組成。在某些實(shí)施方式中,每個歸巢核酸內(nèi)切酶識別位點(diǎn)獨(dú)立地由30-40個核苷酸堿基對組成。在某些實(shí)施方式中,每個歸巢核酸內(nèi)切酶識別位點(diǎn)獨(dú)立地由35-40個核苷酸堿基對組成。在某些實(shí)施方式中,每個歸巢核酸內(nèi)切酶識別位點(diǎn)獨(dú)立地由24個核苷酸堿基對組成。在某些實(shí)施方式中,第一或第二歸巢核酸內(nèi)切酶識別位點(diǎn)中的至少一個是選自下組的歸巢核酸內(nèi)切酶的識別位點(diǎn):LAGLIDADG (SEQ ID NO:1)歸巢核酸內(nèi)切酶、HNH歸巢核酸內(nèi)切酶、His-Cys盒歸巢核酸內(nèi)切酶、GIY-YIG (SEQ ID NO:2)歸巢核酸內(nèi)切酶、和藍(lán)藻歸巢核酸內(nèi)切酶。在某些實(shí)施方式中,每個第一和第二歸巢核酸內(nèi)切酶識別位點(diǎn)獨(dú)立地選自下組的歸巢核酸內(nèi)切酶的識別位點(diǎn):laglidadg (seq id no:1)歸巢核酸內(nèi)切酶、hnh歸巢核酸內(nèi)切酶、His-Cys盒 歸巢核酸內(nèi)切酶、GIY-YIG (SEQ ID NO:2)歸巢核酸內(nèi)切酶、和藍(lán)藻歸巢核酸內(nèi)切酶。在某些實(shí)施方式中,第一或第二歸巢核酸內(nèi)切酶識別位點(diǎn)中的至少一個是選自下組的歸巢核酸內(nèi)切酶的識別位點(diǎn):1-CreI, 1-MsoI, 1-SceI, 1-SceIV, H-DreI, 1-HmuI,1-PpoI, 1-DirI, 1-NjaI, 1-NanI, 1-NitI, 1-TevI, 1-TevII, 1-TevIII, F-TevI, F-TevII,F-Cph1、P1-Mga1、1-Csm1、1-CeuI^P P1-SceI。在一些實(shí)施方式中,每個第一和第二歸巢核酸內(nèi)切酶識別位點(diǎn)獨(dú)立地選自下組的歸巢核酸內(nèi)切酶的識別位點(diǎn):1-CreI, 1-MsoI, 1-SceI, Ι-SceIV、H-Dre1、1-HmuI, 1-PpoI,1-Dir1、1-Nja1、1-Nan1、1-Nit1、1-Tev1、1-TevI1、1-TevII1、F-Tev1、F-TevI1、F-Cph1、P1-MgaI, 1-CsmI, 1-Ceu1、和Pl-Scel。在特定實(shí)施方式中,第一或第二歸巢核酸內(nèi)切酶識別位點(diǎn)中的至少一個是1-SceI識別位點(diǎn)。在特定實(shí)施方式中,第一或第二歸巢核酸內(nèi)切酶識別位點(diǎn)中的至少一個是F-CphI識別位點(diǎn)。靶核酸裂解后,可以通過第一和第二串聯(lián)重復(fù)促進(jìn)染色體內(nèi)重組來修復(fù)宿主細(xì)胞的基因組。在某些實(shí)施方式中,每個第一和第二串聯(lián)重復(fù)核酸獨(dú)立地包含至少18個核苷酸堿基對。在某些實(shí)施方式中,每個第一和第二串聯(lián)重復(fù)核酸獨(dú)立地由18至500個核苷酸堿基對組成。在某些實(shí)施方式中,每個第一和第二串聯(lián)重復(fù)核酸獨(dú)立地由18至200個核苷酸堿基對組成。在某些實(shí)施方式中,宿主細(xì)胞是酵母細(xì)胞,并且每個第一和第二串聯(lián)重復(fù)核酸獨(dú)立地由18至200個核苷酸堿基對組成。在某些實(shí)施方式中,靶核酸編碼選擇性標(biāo)記。在某些實(shí)施方式中,選擇性標(biāo)記選自下組:URA3、潮霉素B磷酸轉(zhuǎn)移酶、氨基糖苷磷酸轉(zhuǎn)移酶、博來霉素抗性基因和草胺膦N-乙酰轉(zhuǎn)移酶。在某些實(shí)施方式中,上文所述的可切除的核酸構(gòu)建體進(jìn)一步包括連接至所述第一串聯(lián)重復(fù)5’端的第一基因組整合位點(diǎn),以及連接至所述第二串聯(lián)重復(fù)3’端的第二基因組整合位點(diǎn)。有利地,第 一和第二基因組整合位點(diǎn)可以促進(jìn)可切除的核酸構(gòu)建體整合至宿主細(xì)胞基因組。在另一個方面,本申請?zhí)峁┝艘环N宿主細(xì)胞,其包括上文所述的可切除的核酸構(gòu)建體。在某些實(shí)施方式中,可切除的核酸構(gòu)建體進(jìn)一步包括連接至所述第一串聯(lián)重復(fù)5’端的第一整合位點(diǎn),以及連接至所述第二串聯(lián)重復(fù)3’端的第二整合位點(diǎn)。在某些實(shí)施方式中,宿主細(xì)胞是原核細(xì)胞。在某些實(shí)施方式中,宿主細(xì)胞是真核細(xì)胞。在某些實(shí)施方式中,宿主細(xì)胞是單細(xì)胞真核生物體。在某些實(shí)施方式中,宿主細(xì)胞是酵母細(xì)胞。在某些實(shí)施方式中,宿主細(xì)胞是單倍體酵母細(xì)胞。在其他實(shí)施方式中,宿主細(xì)胞是二倍體酵母細(xì)胞。在某些實(shí)施方式中,宿主細(xì)胞是釀酒酵母菌株的酵母細(xì)胞。在某些實(shí)施方式中,宿主細(xì)胞進(jìn)一步包括載體,其包含編碼歸巢核酸內(nèi)切酶的歸巢核酸內(nèi)切酶核酸,其中所述歸巢核酸內(nèi)切酶能夠在第一和第二歸巢核酸內(nèi)切酶識別位點(diǎn)中的至少一個位點(diǎn)處或其附近結(jié)合及剪切。在一些實(shí)施方式中,載體包含編碼歸巢核酸內(nèi)切酶的歸巢核酸內(nèi)切酶核酸,所述歸巢核酸內(nèi)切酶能夠在每個第一和第二歸巢核酸內(nèi)切酶識別位點(diǎn)的位點(diǎn)處或其附近結(jié)合及剪切。在某些實(shí)施方式中,載體包含啟動子元件,其控制編碼歸巢核酸內(nèi)切酶的歸巢核酸內(nèi)切酶核酸的表達(dá)。某些實(shí)施方式中,啟動子元件是誘導(dǎo)型啟動子。在某些實(shí)施方式中,啟動子元件是組成型啟動子。
在另一個方面,本申請?zhí)峁┝艘环N宿主細(xì)胞,其包含上文所述的整合至宿主細(xì)胞基因組的可切除的核酸構(gòu)建體。在一些實(shí)施方式中,可切除的核酸構(gòu)建體從5’至3’方向包括:a)第一串聯(lián)重復(fù)核酸,b)第一歸巢核酸內(nèi)切酶識別位點(diǎn),c)靶核酸,d)第二歸巢核酸內(nèi)切酶識別位點(diǎn)以及e)第二串聯(lián)重復(fù)核酸。在某些實(shí)施方式中,宿主細(xì)胞進(jìn)一步包括載體,其包含編碼歸巢核酸內(nèi)切酶的歸巢核酸內(nèi)切酶核酸,所述歸巢核酸內(nèi)切酶能夠在第一或第二歸巢核酸內(nèi)切酶識別位點(diǎn)中的至少一個位點(diǎn)處或其附近結(jié)合及剪切。在某些實(shí)施方式中,歸巢核酸內(nèi)切酶核酸編碼歸巢核酸內(nèi)切酶,所述歸巢核酸內(nèi)切酶能夠在每個第一和第二歸巢核酸內(nèi)切酶識別位點(diǎn)處或其附近結(jié)合及剪切。在某些實(shí)施方式中,歸巢核酸內(nèi)切酶是1-SceI。在某些實(shí)施方式中,歸巢核酸內(nèi)切酶是F-CphI。在另一個方面,本申請?zhí)峁┝艘环N試劑盒,其包含上文所述的可切除的核酸構(gòu)建體;和載體,其包含編碼歸巢核酸內(nèi)切酶的歸巢核酸內(nèi)切酶核酸,所述歸巢核酸內(nèi)切酶能夠在所述第一或第二歸巢核酸內(nèi)切酶識別位點(diǎn)中的至少一個位點(diǎn)處或其附近結(jié)合及剪切。在某些實(shí)施方式中,歸巢核酸內(nèi)切酶是1-Scel。在某些實(shí)施方式中,歸巢核酸內(nèi)切酶是F-CphI。在另一個方面,本申請?zhí)峁┝艘环N從宿主細(xì)胞的基因組中切除至少一個靶核酸的方法。在某些實(shí)施方式中,宿主細(xì)胞從5’至3’方向包括以下核酸:a)第一串聯(lián)重復(fù)核酸,b)第一歸巢核酸內(nèi)切酶識別位點(diǎn),c)靶核酸,d)第二歸巢核酸內(nèi)切酶識別位點(diǎn)以及e)第二串聯(lián)重復(fù)核酸。在某些實(shí)施方式中,該方法包括在宿主細(xì)胞中表達(dá)歸巢核酸內(nèi)切酶,使得歸巢核酸內(nèi)切酶在第一或第二歸巢核酸內(nèi)切酶識別位點(diǎn)中的至少一個位點(diǎn)處或其附近結(jié)合及剪切。在該方法的某些實(shí)施方式中,歸巢核酸內(nèi)切酶在每個第一和第二歸巢核酸內(nèi)切酶識別位點(diǎn)處或其附近結(jié)合及剪切。某些實(shí)施方式中,第一和第二歸巢核酸內(nèi)切酶識別位點(diǎn)中的至少一個是1-SceI識別位點(diǎn)。在某些實(shí)施方式中,第一和第二歸巢核酸內(nèi)切酶識別位點(diǎn)中的至少一個是F-CphI識別位點(diǎn)。在另一個方面,本申請?zhí)峁┝艘环N從宿主細(xì)胞基因組中同時切除至少兩個靶核酸的方法,所述宿主細(xì)胞包含至少兩個可切除的核酸構(gòu)建體,其中每個可切除的核酸構(gòu)建體獨(dú)立地從5’至3’方向包括:a)第一串聯(lián)重復(fù)核酸;b)第一歸巢核酸內(nèi)切酶識別位點(diǎn);c)靶核酸;d)第二歸巢核酸內(nèi)切 酶識別位點(diǎn);以及e)第二串聯(lián)重復(fù)核酸。在某些實(shí)施方式中,該方法包括在所述宿主細(xì)胞中將所述至少兩個可切除的核酸構(gòu)建體與歸巢核酸內(nèi)切酶接觸,使得歸巢核酸內(nèi)切酶在每個可切除的核酸構(gòu)建體中的第一或第二歸巢核酸內(nèi)切酶識別位點(diǎn)中的至少一個位點(diǎn)處或其附近剪切。在某些實(shí)施方式中,該方法包括在宿主細(xì)胞中將所述至少兩個可切除的核酸構(gòu)建體與一個或多個歸巢核酸內(nèi)切酶接觸,使得一個或多個歸巢核酸內(nèi)切酶在每個可切除的核酸構(gòu)建體中的第一或第二歸巢核酸內(nèi)切酶識別位點(diǎn)中的至少一個位點(diǎn)處或其附近剪切。優(yōu)選地,通過由第一和第二串聯(lián)重復(fù)介導(dǎo)的重組形成帶有靶核酸切除的基因組核酸。在某些實(shí)施方式中,新形成的基因組核酸包含第三串聯(lián)重復(fù),其為第一和第二串聯(lián)重復(fù)重組的產(chǎn)物。在優(yōu)選的實(shí)施方式中,在宿主細(xì)胞中僅存的可切除的核酸內(nèi)切酶構(gòu)建體部分為第三串聯(lián)重復(fù),其長度可以是低至18個核苷酸堿基對。本申請?zhí)峁┑慕M合物和方法有利于從宿主細(xì)胞基因組或游尚基因中精確和有效地切除一個或多個靶核酸,同時不會產(chǎn)生潛在的基因組不穩(wěn)定性。在基因工程中存在很多例子,需要在選定的基因組或游離基因的基因座除去靶核酸。例如,上文所述的組合物和方法能夠有利地用于除去選擇性標(biāo)記物,以使其能夠在同一宿主細(xì)胞或其后代中重復(fù)使用?!皹?biāo)記物再利用”可以用于在使用有限的選擇性標(biāo)記物組的宿主生物體內(nèi)需要進(jìn)行多個基因工程事件的情況。本申請?zhí)峁┑慕M合物和方法還可以用于在將宿主細(xì)胞釋放至生產(chǎn)或天然環(huán)境之前,從宿主細(xì)胞內(nèi)除去不需要的核酸(例如,抗生素抗性標(biāo)記物)。進(jìn)一步地,所述的組合物和方法可以用于宿主細(xì)胞及其后代中特定基因表達(dá)的啟動或關(guān)閉。為了關(guān)閉基因,所述的組合物和方法可以用于,例如,切除核酸,所述核酸表示一個或多個基因的順式作用調(diào)控元件、某些或全部的其編碼序列、或一個或多個其轉(zhuǎn)錄激活因子。為了啟動基因的表達(dá),可以將核酸的干擾性伸展切除,以便在特定基因表達(dá)所需的元件之間形成所需的鄰近相互作用。4.附圖簡述
圖1??汕谐暮怂針?gòu)建體的實(shí)施方式。圖1A:可切除的核酸構(gòu)建體,從5’至3’方向包括:第一串聯(lián)重復(fù)核酸(“DR1”);第一歸巢核酸內(nèi)切酶識別位點(diǎn)(“ESI”);靶核酸(“靶核酸”);第二歸巢核酸內(nèi)切酶識別位點(diǎn)(“ES2”);以及第二串聯(lián)重復(fù)核酸(“DR2”)。圖1B:圖1A中描述的可切除的核酸構(gòu)建體,進(jìn)一步包括連接至第一歸巢核酸內(nèi)切酶識別位點(diǎn)5’端的第一整合位點(diǎn)(ISl)和連接至第二串聯(lián)重復(fù)核酸3’端的第二整合位點(diǎn)(IS2)。圖2。可切除的核酸構(gòu)建體通過整合位點(diǎn)介導(dǎo)的同源性重組將靶核酸敲除和/或敲入至宿主細(xì)胞基因組的特定基因座。靶核酸的兩側(cè)為兩個拷貝的歸巢核酸內(nèi)切酶限制性位點(diǎn)(分別為ESl和ES2),其兩側(cè)為剪切后直接修復(fù)的兩個串聯(lián)重復(fù)(分別為DRl和DR2)。圖3。靶核酸的切除。在某些實(shí)施方式中,通過一個或多個相應(yīng)歸巢核酸內(nèi)切酶(HE)對每個第一和第二歸巢核酸內(nèi)切酶(圖3A)識別位點(diǎn)(分別為ESl和ES2)的剪切形成了三個核酸片段:(I)基因組或游離基因核酸的左臂(2)包含靶核酸的核酸片段以及(3)基因組或游離基因核酸的右臂(圖3B)。剪切后,宿主細(xì)胞內(nèi)的內(nèi)源性5’至3’核酸外切酶迅速降解每個核酸片段的一條鏈,破壞包含靶核酸的核酸片段,并留下基因組或游離基因核酸的左臂(4)和右臂(5)的3’尾(圖3C)。圖4。靶核酸的切除(續(xù)上)。左臂和右臂的單鏈降解使各臂暴露出其串聯(lián)重復(fù),串聯(lián)重復(fù)相互互補(bǔ)(圖4A)。串聯(lián)重復(fù)的互補(bǔ)區(qū)形成異源雙鏈(圖4B,6),并且通過宿主細(xì)胞蛋白促進(jìn)其重組。右臂(7)和左臂(8)的單鏈3’端最末端之間不是互補(bǔ)的,因此其不是第一和第二串聯(lián)重復(fù)的互補(bǔ)區(qū)形成的異源雙鏈的一部分。這些最末端不互補(bǔ)的3’末端能夠被瓣狀核酸酶剪切。最后,通過修復(fù)DNA合成和DNA連接酶對異源雙鏈進(jìn)行填充并將缺口封閉,以形成靶核酸精確切除的完整的基因組或游離基因核酸(圖4C)。5.具體實(shí)施方式
的詳述5.1 定義如本申請所使用的,術(shù)語“歸巢核酸內(nèi)切酶”指若干核酸內(nèi)切酶中的任意一種,所述核酸內(nèi)切酶的天然的生物學(xué)功能為催化基因轉(zhuǎn)化事件,以便將特定基因的編碼核酸內(nèi)切酶的等位基因擴(kuò)展到該基因的無核酸內(nèi)切酶的等位基因中。參見,例如Chevalier,NucleicAcids Resl (29): 3757-74 (2001) ; Jacquier, Cell41:383-94 (1985)。已知至少有五個不同的歸巢核酸內(nèi)切酶家族,包括:1) LAGLIDADG (SEQ ID NO:1)歸巢核酸內(nèi)切酶,2)HNH歸巢核酸內(nèi)切酶,3)His-Cys盒歸巢核酸內(nèi)切酶,4)GIY-YIG (SEQ ID N0:2)歸巢核酸內(nèi)切酶和5)藍(lán)藻歸巢核酸內(nèi)切酶。參見,例如Stoddard, Quarterly Review ofBiophysics38(l):49-95(2006)。這些家族的特定歸巢核酸內(nèi)切酶的例子包括但不限于:1-CreI, 1-MsoI, 1-SceI, 1-SceIV, H-DreI, 1-HmuI, 1-PpoI, 1-DirI, 1-NjaI, 1-NanI,1-Nit1、1-Tev1、1-TevI1、1-TevII1、F-Tev1、F-TevI1、F-Cph1、P1-Mga1、1-Csm1、1-Ceu1、和P1-Sce10本領(lǐng)域技術(shù)人員公知此類核酸內(nèi)切酶的天然或人工變體包含在本定義的范圍內(nèi),所述變體可以識別和剪切處于或在其附近的相同或相似的歸巢核酸內(nèi)切酶限制性位點(diǎn)。如本申請所使用的,術(shù)語“歸巢核酸內(nèi)切酶識別位點(diǎn)”指特定歸巢核酸內(nèi)切酶識別的核酸。歸巢核酸內(nèi)切酶與歸巢核酸內(nèi)切酶識別位點(diǎn)結(jié)合之后,能夠在歸巢核酸內(nèi)切酶識別位點(diǎn)處或其附近形成雙鏈斷裂。如本申請所使用的,術(shù)語“附近”指與特定核酸的距離為約I至約100個、I至約75個、I至約50個、I至約25個、I至約20個、I至約15個、I至約10個、或者I至約5個
核苷酸。如本申請所使用的,關(guān)于歸巢核酸內(nèi)切酶的術(shù)語“剪切”指在特定的核酸中形成雙鏈斷裂的作用。根據(jù)本領(lǐng)域技術(shù)人員的理解,雙鏈斷裂可以留下平末端或粘性末端(即,5’或3’突出)。如本申請所使用的,術(shù)語“串聯(lián)重復(fù)”指一組兩個或多個核酸的部分核酸,其中各成員與其他成員之間具有充分的核苷酸同源性以介導(dǎo)其彼此之間的重組。串聯(lián)重復(fù)與串聯(lián)的其他成員之間排布在相同方向(“正向串聯(lián)重復(fù)”)或相反方向(“反向串聯(lián)重復(fù)”)。如本申請所使用的,術(shù)語“靶DNA片段”指使用本申請所述的組合物和方法從宿主細(xì)胞基因組中切除的任意靶DNA片段。有用的例子包括但不限于:蛋白編碼序列、選擇性標(biāo)記、報告基因、熒光標(biāo)記物編碼序列、啟動子、增強(qiáng)子、終止子、轉(zhuǎn)錄激活因子、轉(zhuǎn)錄抑制因子、轉(zhuǎn)錄激活因子結(jié)合位點(diǎn)、轉(zhuǎn) 錄抑制因子結(jié)合位點(diǎn)、內(nèi)含子、外顯子、poly-A尾、多克隆位點(diǎn)、核定位信號、mRNA穩(wěn)定信號、整合基因座、表位標(biāo)簽編碼序列、降解信號、或任何其他的天然產(chǎn)生的或合成的DNA分子。在某些實(shí)施方式中,靶DNA片段可以是天然來源的。或者,靶DNA片段可以完全是體外產(chǎn)生的合成來源的。而且,靶DNA可以包含分離的天然來源的DNA分子的任意組合,或者分離的天然來源的DNA分子與合成的DNA分子的任意組合。例如,靶DNA片段可以包含可操作地連接至蛋白編碼序列的異源性啟動子、連接至poly-A尾的蛋白編碼序列、在框架內(nèi)與表位標(biāo)簽編碼序列連接的蛋白編碼序列等等。如本申請所使用的,術(shù)語“載體”指能夠在細(xì)胞中復(fù)制的染色體外的核酸分子,并且插入序列可以與其可操作地連接,以使得插入序列復(fù)制。有用的例子包括但不限于環(huán)狀DNA分子如質(zhì)粒構(gòu)建體、噬菌體構(gòu)建體、粘粒載體等,以及線性核酸構(gòu)建體(例如,λ噬菌體構(gòu)建體、細(xì)菌人工染色體(BAC)、酵母人工染色體(YAC)等)。載體可以包括表達(dá)信號,如啟動子和/或終止子、選擇性標(biāo)記物如賦予抗生素抗性的基因、以及可以使插入序列克隆的一個或多個限制性位點(diǎn)。載體可以具有其他的獨(dú)特性質(zhì)(如其能夠調(diào)節(jié)插入DNA的尺寸)。如本申請所使用的,術(shù)語“基因組”指宿主細(xì)胞中含有的染色體和游離基因DNA。5.2可切除的核酸構(gòu)建體在一個方面,本申請?zhí)峁┝艘环N可切除的核酸構(gòu)建體,從5’至3’方向包括:a)第一串聯(lián)重復(fù)(DRl)、b)靶DNA片段(D),和c)第二串聯(lián)重復(fù)(DR2),和分別定位于DRl和D之間或者D和DR2之間的第一歸巢核酸內(nèi)切酶識別位點(diǎn)(ES1),以及任選地分別定位于D和DR2之間或者DRl和D之間的第二歸巢核酸內(nèi)切酶識別位點(diǎn)(ES2)(圖1A)。因此,在某些實(shí)施方式中,可切除的核酸構(gòu)建體從5’至3’方向包括:a)第一串聯(lián)重復(fù)(DRl)、b)第一歸巢核酸內(nèi)切酶識別位點(diǎn)(ESI)、c)靶DNA片段(D)、以及d)第二串聯(lián)重復(fù)(DR2)。在某些實(shí)施方式中,可切除的核酸構(gòu)建體從5’至3’方向包括:a)第一串聯(lián)重復(fù)(DRl)、b)靶DNA片段(D)、c)第一歸巢核酸內(nèi)切酶識別位點(diǎn)(ESI)、以及d)第二串聯(lián)重復(fù)(DR2)。在某些實(shí)施方式中,可切除的核酸構(gòu)建體從5’至3’方向包括:a)第一串聯(lián)重復(fù)(DRl)、b)第一歸巢核酸內(nèi)切酶識別位點(diǎn)(ESl)、c)靶DNA片段(D)、d)第二歸巢核酸內(nèi)切酶識別位點(diǎn)(ES2)、以及e)第_■串聯(lián)重復(fù)(DR2)。在某些實(shí)施方式中,上文所述的可切除的核酸構(gòu)建體進(jìn)一步包括連接至第一串聯(lián)重復(fù)5’端的第一基因組整合序列(ISl)和連接至第二串聯(lián)重復(fù)3’端的第二基因組整合序列(IS2)。因此,在某些實(shí)施方式中,可切除的核酸構(gòu)建體從5’至3’方向包括:a)第一整合序列(IS1)、b)第一串聯(lián)重復(fù)(DR1)、c)第一歸巢核酸內(nèi)切酶識別位點(diǎn)(ESI)、d)靶DNA片段(D)、e)第二串聯(lián)重復(fù)(DR2)、以及f)第二整合序列(IS2)。在某些實(shí)施方式中,可切除的核酸構(gòu)建體從5’至3’方向包括:a)第一整合序列(ISl)、b)第一串聯(lián)重復(fù)(DRl)、c)靶DNA片段(D)、d)第一歸巢核酸內(nèi)切酶識別位點(diǎn)(ESI)、e)第二串聯(lián)重復(fù)(DR2)、以及f)第二整合序列(IS2)。在某些實(shí)施方式中,可切除的核酸構(gòu)建體從5’至3’方向包括:a)第一整合序列(ISI)、b )第一串聯(lián)重復(fù)(DRl)、c )第一歸巢核酸內(nèi)切酶識別位點(diǎn)(ES I)、d )靶DNA片段(D)、e)第二歸巢核酸內(nèi)切酶識別位點(diǎn)(ES2)、f )第二串聯(lián)重復(fù)(DR2)、以及g)第二整合序列(IS2)。優(yōu)選地,第一和第二整合序列能夠促進(jìn)可切除的核酸構(gòu)建體整合至宿主細(xì)胞基因組。可切除的核酸構(gòu)建體,當(dāng)整合至宿主細(xì)胞基因組時,能夠高頻率和高精確度地從宿主細(xì)胞基因組中切除靶DNA片段(D)。在某些實(shí)施方式中,可切除的核酸構(gòu)建體是線性DNA分子。可切除的核酸構(gòu)建體可以用于促進(jìn)在基因工程應(yīng)用中切除選擇性標(biāo)記物,或在將生物體釋放至生產(chǎn)環(huán)境或自然環(huán)境之前時除去抗生素抗性標(biāo)記物。還可以將其用于在宿主細(xì)胞及其后代中持續(xù)性地啟動或關(guān)閉基因的表達(dá)。為了阻止基因的表達(dá),可以將其順式作用調(diào)控序列、其編碼序列、或編碼轉(zhuǎn)錄激活因子的基因切除。為了觸發(fā)基因的表達(dá),可以將轉(zhuǎn)錄抑制因子的基因或DNA結(jié)合位點(diǎn)切除,以使得其調(diào)控基因表達(dá),或?qū)NA的干擾性鏈切除,以便在特定基因表達(dá)所需的元件之間產(chǎn)生所需的鄰近相互作用??梢酝ㄟ^本領(lǐng)域技術(shù)人員公知的任何技術(shù)制備可切除的核酸構(gòu)建體。在一些實(shí)施方式中,使用聚合酶鏈?zhǔn)椒磻?yīng)(PCR)和本領(lǐng)域公知的分子克隆技術(shù)制備可切除的核酸構(gòu)建體。參見,例如 PCR Technology !Principles and Applications for DNAAmplification, ed.HA Erlich, Stockton Press, New York, N.Y.(1989) ;Sambrook etal., 2001, Molecular Cloning - A Laboratory Manual, 3rd edition, Cold Spring HarborLaboratory, Cold Spring Harbor, NY ;PCR Technology!Principles and Applicationsfor DNA Amplification, ed.HA Erlich, Stockton Press, New York, N.Y.(1989)。將在下文中對可切除的核酸構(gòu)建體的各個元件進(jìn)行詳細(xì)討論。5.2.1.歸巢 核酸內(nèi)切酶識別位點(diǎn)可切除的核酸構(gòu)建體包括至少一個歸巢核酸內(nèi)切酶識別位點(diǎn)(ES1),和任選地第二歸巢核酸內(nèi)切酶識別位點(diǎn)(ES2)。在某些實(shí)施方式中,可切除的核酸構(gòu)建體僅包括第一歸巢核酸內(nèi)切酶識別位點(diǎn),ESl可以位于第一串聯(lián)重復(fù)(DRl)的3’端和靶DNA片段(D)的5’端,或者靶DNA片段(D)的3’端和第二串聯(lián)重復(fù)(DR2)的5’端。在某些實(shí)施方式中,可切除的核酸構(gòu)建體包括第一和第二歸巢核酸內(nèi)切酶識別位點(diǎn),ESl位于第一串聯(lián)重復(fù)(DRl)的3’端和靶DNA片段(D)的5’端,并且ES2位于靶DNA片段(D)的3’端和第二串聯(lián)重復(fù)(DR2)的5’端。在一些實(shí)施方式中,ESl位于D內(nèi)。歸巢核酸內(nèi)切酶識別位點(diǎn)使得相應(yīng)的歸巢核酸內(nèi)切酶能夠在歸巢核酸內(nèi)切酶識別位點(diǎn)處或其附近剪切可切除的核酸構(gòu)建體。歸巢核酸內(nèi)切酶識別位點(diǎn)的長度范圍為14-40個核苷酸堿基對。在某些實(shí)施方式中,每個歸巢核酸內(nèi)切酶識別位點(diǎn)由14-40個核苷酸組成。在某些實(shí)施方式中,每個歸巢核酸內(nèi)切酶識別位點(diǎn)由18-40個核苷酸組成。在某些實(shí)施方式中,每個歸巢核酸內(nèi)切酶識別位點(diǎn)由20-40個核苷酸組成。 在某些實(shí)施方式中,每個歸巢核酸內(nèi)切酶識別位點(diǎn)由25-40個核苷酸組成。在某些實(shí)施方式中,每個歸巢核酸內(nèi)切酶識別位點(diǎn)由30-40個核苷酸組成。在某些實(shí)施方式中,每個歸巢核酸內(nèi)切酶識別位點(diǎn)由35-40個核苷酸組成。在某些實(shí)施方式中,每個歸巢核酸內(nèi)切酶識別位點(diǎn)由 14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、
29、30、31、32、33、34、35、36、37、38、39或40個核苷酸組成。在某些實(shí)施方式中,每個歸巢核酸內(nèi)切酶識別位點(diǎn)由24個核苷酸組成。在某些實(shí)施方式中,ESl位于DRl的3’端和D的5’端。在某些實(shí)施方式中,ESl位于DRl的3’端。在某些實(shí)施方式中,ESl緊鄰DRl的3’端。在某些實(shí)施方式中,ESl位于DRl的3’端的下游。在某些實(shí)施方式中,ESl位于D的5’端。在某些實(shí)施方式中,ESl緊鄰D的5’端。在某些實(shí)施方式中,ESl位于D的5’端的上游。在某些實(shí)施方式中,ESl位于D的3’端和DR2的5’端。在某些實(shí)施方式中,ESl位于D的3’端。在某些實(shí)施方式中,ESl緊鄰D的3’端。在某些實(shí)施方式中,ESl位于D的3’端的下游。在某些實(shí)施方式中,ESl位于DR2的5’端。在某些實(shí)施方式中,ESl緊鄰DR2的5’端。在某些實(shí)施方式中,ES2位于DR2的5’端的上游。在某些實(shí)施方式中,ES2,當(dāng)與ESl組合時,其位于D的3’端和DR2的5’端。在某些實(shí)施方式中,ES2位于D的3’端。在某些實(shí)施方式中,ES2緊鄰D的3’端。在某些實(shí)施方式中,ES2位于D的3’端的下游。在某些實(shí)施方式中,ES2位于DR2的5’端。在某些實(shí)施方式中,ES2緊鄰DR2的5’端。在某些實(shí)施方式中,ES2位于DR2的5’端的上游。在某些實(shí)施方式中,當(dāng)ESl和ES2均存在時,ESl和ES2彼此之間以相反方向排布。在某些實(shí)施方式中,當(dāng)ESl和ES2均存在時,ESl和ES2彼此之間以相同方向排布。在某些實(shí)施方式中,ESl和ES2是本領(lǐng)域公知的任意歸巢核酸內(nèi)切酶的識別位點(diǎn)。多種類型的歸巢核酸內(nèi)切酶(但不是那些來自第II組內(nèi)含子的歸巢核酸內(nèi)切酶)催化帶有4bp的3’單鏈突出端的交錯的雙鏈斷裂(DSB)。在某些實(shí)施方式中,ESl和ES2中的至少一個是選自下組的歸巢核酸內(nèi)切酶識別位點(diǎn):laglidadg (seq id no:1)歸巢核酸內(nèi)切酶、HNH歸巢核酸內(nèi)切酶、His-Cys盒歸巢核酸內(nèi)切酶、GIY-YIG (SEQ ID N0:2)歸巢核酸內(nèi)切酶、和藍(lán)藻歸巢核酸內(nèi)切酶。在一些實(shí)施方式中,每個ESl和ES2為選自下組的歸巢核酸內(nèi)切酶識別位點(diǎn):LAGLIDADG (SEQ ID NO:1)歸巢核酸內(nèi)切酶、HNH歸巢核酸內(nèi)切酶、His-Cys盒歸巢核酸內(nèi)切酶、GIY-YIG (SEQ ID NO:2)歸巢核酸內(nèi)切酶、和藍(lán)藻歸巢核酸內(nèi)切酶。參見,例如 Stoddard, Quarterly Review of Biophysics38 (I): 49-95 (2006)。這些家族在其保守的核酸酶活性位點(diǎn)核心基序和催化機(jī)制、生物學(xué)和基因組分布、以及與非歸巢核酸酶系統(tǒng)廣泛的相互關(guān)系方面存在較大差異。來自這些家族的有用的特異性歸巢核酸內(nèi)切酶的例子包括,但不限于:1-CreI (參見,Rochaix et al., NucleicAcids Res.13:975-984 (1985) )、1-MsoI (參見,Lucas et al., Nucleic AcidsRes.29:960-969(2001) )、1-SceI (參見,F(xiàn)oury et al., FEBS Lett.440:325-331 (1998))、1-SceIV (參見,Moran et al., Nucleic Acids Res.20:4069-4076 (1992) )、H-DreI (參見,Chevalier et al.,Mol.Celll0:895_905 (2002) )、1-HmuI (參見,Goodrich-Blairet al.,Cell63:417-424(1990) ;Goodrich-Blair et al.,Cell84:211-221 (1996))、1-PpoI (參見,Muscarella et al.,Mo I.Ce 11.Bio I.10: 3386-3396 (1990))、1-DirI (參見,Johansen et al.,Cell76:725-734(1994) ;Johansen, Nucleic AcidsRes.21:4405(1993) )、1-NjaI (參見,Elde et al., Eur.J.Biochem.259:281-288 (1999);De Jonckheere et al., J.Eukaryot.Microbiol.41:457-463 (1994) )> 1-NanI (參見,Eldeet al., S.Eur.J.Biochem.259: 281-288 (1999) ;De Jonckheere et al., J.Eukaryot.Microbiol.41:457-463 (1994) )、1-NitI (參見,De Jonckheere et al., J.Eukaryot.Microbiol.41:457-463(1994) ;Elde et al.,Eur.J.Biochem.259:281-288 (1999))、1-TevI (參見,Chu et al.,Cell45:157-166 (1986) )、1-TevII (參見,Tomaschewskiet al., Nucleic Acids Res.15: 3632-3633 (1987) )、1-TevIII (參見,Eddy etal., Genes Dev.5: 1032-1041 (1991) )> F-TevI (參見,F(xiàn)ujisawa et al., NucleicAcids Res.13: 7473-7481 (1985) )、F-TevII (參見,Kadyrov et al., Dokl.Biochem.339:145-147 (1994) ;Kaliman, Nucleic Acids Res.18: 4277 (1990))、F-CphI (參見,Zeng et al., Curr.Biol.19:218-222(2009) ), P1-MgaI (參見,Saves et al., Nucleic Acids Res.29:4310-4318 (2001) )> 1-CsmI (參見,Colleauxet al.,Mol.Gen.Genet.223: 288-296 (1990) )、1-CeuI (參見,Turmel et al., J.Mol.Biol.218:293-311 (1991))和 P1-SceI (參見,Hirata et al., J.Biol.Chem.265:6726-6733(1990))。在某些實(shí)施方式中,ESI或ES2中的至少一個是選自下組的歸巢核酸內(nèi)切酶識別位點(diǎn):1-Cre1、1-Mso1、1-Scel、1-SceIV、H-Dre1、1-Hmu1、1-Ppo1、1-Dir1、1-Nja1、1-Nan1、1-Nit1、1-Tev1、1-TevI1、1-TevII1、F-Tev1、F-TevI1、F-Cph1、P1-Mga1、1-Csm1、1-Ceu1、和P1-SceI。在一些實(shí)施方式中,每個ESl和ES2為選自下組的歸巢核酸內(nèi)切酶識別位點(diǎn):1-Cre1、1-Mso1、1-Sce1、1-SceIV, H-Dre1、1-Hmu1、1-Ppo1、1-Dir1、1-Nja1、1-Nan1、1-Nit1、1-Tev1、1-TevI1、1-TevII1、F-Tev1、F-TevI1、F-Cph1、P1-Mga1、1-Csm1、1-Ceu1、和 Pl-Scel。在本申請?zhí)峁┑慕M合物和方法的特定實(shí)施方式中,選擇ESl和ES2的依據(jù)為宿主細(xì)胞的野生型(非工程化的)核DNA中沒有歸巢核酸內(nèi)切酶識別位點(diǎn)。例如,在野生型(非工程化的)釀酒酵母的核DNA 中不含 1-Sce1、P1-MtuII(ppsl)、P1-MgaI(ppsl)、和 F-CphI 識別位點(diǎn)(參見,例如 Curr Biol2009; 19:218-22; Proc Natl Acad Sci U S A1988; 85:6022-6; JBiol Chem2002;277:16257-64;J Biol Chem2002;277:40352-61;和 Nucleic AcidsRes2001; 29:4310-8),而VDE aka P1-SceI位點(diǎn)在某些菌株中存在,但在其他菌株中不存在(參見,例如Nucleic Acids Res2001; 29:4215-23)。這樣,在本申請?zhí)峁┑慕M合物和方法的某些實(shí)施方式中,ESl和ES2為1-SceI識別位點(diǎn),宿主細(xì)胞為釀酒酵母細(xì)胞。在某些實(shí)施方式中,ESl和ES2為P1-MtuII (ppsl)識別位點(diǎn),宿主細(xì)胞為釀酒酵母細(xì)胞。在某些實(shí)施方式中,ESl和ES2為P1-MgaI (ppsl)識別位點(diǎn),宿主細(xì)胞為釀酒酵母細(xì)胞。在某些實(shí)施方式中,ESl和ES2為F-CphI識別位點(diǎn),宿主細(xì)胞為釀酒酵母細(xì)胞。在某些實(shí)施方式中,ESl和ES2的選擇依據(jù)為滿足下述標(biāo)準(zhǔn)中的一項(xiàng)或多項(xiàng):(I)在宿主細(xì)胞的整個野生型(非工程化的)基因組(即,包括線粒體DNA)中不含歸巢核酸內(nèi)切酶識別位點(diǎn);(2)不表達(dá)相應(yīng)的歸巢核酸內(nèi)切酶,歸巢核酸內(nèi)切酶的識別位點(diǎn)不會被剪切;以及(3)相應(yīng)歸巢核酸內(nèi)切酶的核表達(dá),例如為誘導(dǎo)剪切基因上整合的靶核酸,對宿主細(xì)胞是無害的。在某些實(shí)施方式中,除了在宿主細(xì)胞的野生型(非工程化的)核DNA中不存在以夕卜,ESl和ES2還滿足上文所列標(biāo)準(zhǔn)中的一項(xiàng)、兩項(xiàng)、或者全部三項(xiàng)。5.2.2.串聯(lián)重復(fù)可切除的核酸構(gòu)建體包括第一和第二串聯(lián)重復(fù)。第一串聯(lián)重復(fù)(DRl)位于靶DNA片段(D)的5’端,并且第二串聯(lián)重復(fù)(DR2)位于靶DNA片段(D)的3’端。第一和第二串聯(lián)重復(fù)能夠介導(dǎo)可切除的核酸構(gòu)建體經(jīng)歸巢核酸內(nèi)切酶剪切后的剩余部分重組。串聯(lián)重復(fù)彼此之間位于相同方向(正向串聯(lián)重復(fù))能夠有利于通過單鏈退火途徑 介導(dǎo)宿主細(xì)胞內(nèi)的染色體內(nèi)重組。參見,例如Ivanov etal.,Geneticsl42:693-704(1996)。DRl和DR2可以是能夠介導(dǎo)可切除的核酸構(gòu)建體經(jīng)歸巢核酸內(nèi)切酶剪切后的剩余部分重組的任意串聯(lián)重復(fù)??赡苡绊懘祟愔亟M的串聯(lián)重復(fù)性質(zhì)包括但不限于:長度、GC含量、與宿主細(xì)胞基因組的天然序列的同源性、以及串聯(lián)重復(fù)之間的序列同一性程度??梢圆捎萌我庥嬎銠C(jī)程序以及相關(guān)參數(shù)確定序列同一性的程度,包括本申請中描述的那些,如BLAST2.2.2或FASTA3.0t78版,使用默認(rèn)參數(shù)設(shè)置。在某些實(shí)施方式中,DRl位于ESl的5’端。在某些實(shí)施方式中,DRl緊鄰ESl的5’端。在某些實(shí)施方式中,DRl位于ESl的5’端的上游。在某些實(shí)施方式中,DR2位于ESl的3’端,或當(dāng)ESl和ES2均存在時,位于ES2的3’端。在某些實(shí)施方式中,DR2緊鄰ESl的3’端,或當(dāng)ESl和ES2均存在時,緊鄰ES2的3’端。在某些實(shí)施方式中,DR2位于ESl的3’端的下游,或當(dāng)ESl和ES2均存在時,位于ES2的3’端的下游。在某些實(shí)施方式中,每個DRl和DR2獨(dú)立地包含至少18個核苷酸堿基對。在某些實(shí)施方式中,每個DRl和DR2獨(dú)立地包含18至500個核苷酸堿基對。在某些實(shí)施方式中,每個第一和第二串聯(lián)重復(fù)核酸獨(dú)立地由18至500、18至495、18至490、18至485、18至480、18 至 475、18 至 470、18 至 465、18 至 460、18 至 455、18 至 450、18 至 445、18 至 440、18 至435、18 至 430、18 至 425、18 至 420、18 至 415、18 至 410、18 至 405、18 至 400、18 至 395、18至 390、18 至 385、18 至 380、18 至 375、18 至 370、18 至 365、18 至 360、18 至 355、18 至 350、18 至 345、18 至 340、18 至 335、18 至 330、18 至 325、18 至 320、18 至 315、18 至 310、18 至
305,18至 300、18 至 295、18 至 290、18 至 285、18 至 280、18 至 275、18 至 270、18 至 265、18至 260、18 至 255、18 至 250、18 至 245、18 至 240、18 至 235、18 至 230、18 至 225、18 至 220、18 至 215、18 至 210、18 至 205、18 至 200、18 至 195、18 至 190、18 至 185、18 至 180、18 至175,18至 170,18 至 165,18 至 160,18 至 155,18 至 150,18 至 145,18 至 140,18 至 135,18至 130、18 至 125、18 至 120、18 至 115、18 至 110、18 至 105、18 至 100、18 至 95、18 至 90、18至 85、18 至 80、18 至 75、18 至 70、18 至 65、18 至 60、18 至 55、18 至 50、18 至 45、18 至 40、18至35、18至30、18至25、或18至20個核苷酸堿基對組成。在某些實(shí)施方式中,每個DRl和 DR2 獨(dú)立地由 18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、
39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、
64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、
89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、
111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199 或 200 個核苷酸堿基對組成。在某些實(shí)施方式中,每個DRl和DR2獨(dú)立地由18至200個核苷酸堿基對組成。在某些實(shí)施方式中,每個DRl和DR2獨(dú)立地由18至150個核苷酸堿基對組成。在某些實(shí)施方式中,每個DRl和DR2獨(dú)立地由18至100個核苷酸堿基對組成。在某些實(shí)施方式中,每個DRl和DR2獨(dú)立地由18至80個核苷酸堿基對組成。在某些實(shí)施方式中,DRl和DR2具有至少25%的核苷酸序列同一性。在某些實(shí)施方式中,DRl和DR2具有至少30%的核苷酸序列同一性。在某些實(shí)施方式中,DRl和DR2具有至少35%的核苷酸序列同一性。在某些實(shí)施方式中,DRl和DR2具有至少40%的核苷酸序列同一性。在某些實(shí)施方式中,DRl和DR2具有至少45%的核苷酸序列同一性。在某些實(shí)施方式中,DRl和DR2具有至少50%的核苷酸序列同一性。在某些實(shí)施方式中,DRl和DR2具有至少60%的核苷酸序列同一性。在某些實(shí)施方式中,DRl和DR2具有至少65%的核苷酸序列同一性。在某些實(shí)施方式中,DRl和DR2具有至少70%的核苷酸序列同一性。在某些實(shí)施方式中,DRl和DR2具有至少75%的核苷酸序列同一性。在某些實(shí)施方式中,DRl和DR2具有至少80%的核苷酸序列同一性。在某些實(shí)施方式中,DRl和DR2具有至少85%的核苷酸序列同一'I"生。在某些實(shí)施方式中,DRl和DR2具有至少90%的核苷酸序列同一'丨生。在某些實(shí)施方式中,DRl和DR2具有至少95%的核苷酸序列同一性。在某些實(shí)施方式中,DRl和DR2具有至少99%的核苷酸序列同一性。在某些實(shí)施方式中,DRl和DR2具有100%的核苷酸序列同一'I"生。在優(yōu)選的實(shí)施方式中,DRl和DR2彼此之間位于相同方向(B卩,它們是正向串聯(lián)重復(fù))。5.2.3.靶 DNA 片段可切除的核酸構(gòu)建體包含靶DNA片段(D)。在某些實(shí)施方式中,靶DNA片段(D)位于第一歸巢核酸內(nèi)切酶識別位點(diǎn)(ESl)的3’端。在某些實(shí)施方式中,存在第二歸巢核酸內(nèi)切酶識別位點(diǎn)(ES2 ),靶DNA片段(D)位于ES2的5 ’端。在某些實(shí)施方式中,靶DNA片段(D)位于第一歸巢核酸內(nèi)切酶識別位點(diǎn)(ESl)的3’端和第二串聯(lián)重復(fù)(DR2)的5’端。在某些實(shí)施方式中,靶DNA片段(D)位于第一串聯(lián)重復(fù)(DRl)的3’端和第一歸巢核酸內(nèi)切酶識別位點(diǎn)(ESl)的5 ’端。
在某些實(shí)施方式中,D的5’端位于ESl的3’端。在某些實(shí)施方式中,D的5’端緊鄰ESl的3’端。在某些實(shí)施方式中,D的5’端位于ESl的3’端的下游。在某些實(shí)施方式中,D的5’端位于DRl的3’端。在某些實(shí)施方式中,D的5’端緊鄰DRl的3’端。在某些實(shí)施方式中,D的5’端位于DRl的3’端的下游。在某些實(shí)施方式中,當(dāng)ESl與ES2組合存在時,D的3’端位于ES2的5’端。在某些實(shí)施方式中,當(dāng)ESl與ES2組合存在時,D的3’端緊鄰ES2的5’端。在某些實(shí)施方式中,當(dāng)ESl與ES2組合存在時,D的3’端位于ES2的5’端的上游。在某些實(shí)施方式中,D的3’端位于DR2的5’端。在某些實(shí)施方式中,D的3’端緊鄰DR2的5’端。在某些實(shí)施方式中,D的3’端位于DR2的5’端的上游。靶DNA片段可以是被本領(lǐng)域技術(shù)人員視為有用的任意靶DNA片段。例如,靶DNA片段可以包含能夠被“敲入”宿主基因組并且隨后通過剪切被“敲除”的感興趣的基因。在某些實(shí)施方式中,靶核酸可以包含選擇性標(biāo)記,其可以用于選擇可切除核酸構(gòu)建體與宿主基因組的整合,并且隨后通過剪切將其從宿主基因組中除去。靶DNA片段的有用的例子包括但不限于:蛋白編碼序列、選擇性標(biāo)記、報告基因、熒光標(biāo)記物編碼序列、啟動子、增強(qiáng)子、終止子、轉(zhuǎn)錄激活因子、轉(zhuǎn)錄抑制因子、轉(zhuǎn)錄激活因子結(jié)合位點(diǎn)、轉(zhuǎn)錄抑制因子結(jié)合位點(diǎn)、內(nèi)含子、外顯子、poly-A尾、多克隆位點(diǎn)、核定位信號、mRNA穩(wěn)定信號、整合基因座、表位標(biāo)簽編碼序列、降解信號、或任何其他的天然產(chǎn)生的或合成的DNA分子。在某些實(shí)施方式中,DNA片段可以是天然來源的?;蛘?,靶DNA片段可以完全是體外產(chǎn)生的合成來源的。而且,靶DNA可以包含分離的天然來源的DNA分子的任意組合,或者分離的天然來源的DNA分子與合成的DNA分子的任意組合。例如,靶DNA片段可以包含可操作地連接至蛋白編碼序列的異源性啟動子、連接至poly-A尾的蛋白編碼序列、在框架內(nèi)與表位標(biāo)簽編碼序列連接的蛋白編碼 序列等等。靶DNA片段可以通過本領(lǐng)域公知的標(biāo)準(zhǔn)方法從克隆的DNA (例如,DNA “文庫”)中獲得,可以通過化學(xué)合成、通過cDNA克隆、或通過對基因組DNA或其片段的克隆、從所需的細(xì)胞中純化、或通過PCR擴(kuò)增和克隆等方法獲得。參見,例如,Sambrook et al., Molecular Cloning, A Laboratory Manual, 3d.ed., ColdSpring Harbor Laboratory Press, Cold Spring Harbor, New York (2001) ;Glover,D.M.(ed.), DNA Cloning: A Practical Approach, 2d.ed., MRL Press, Ltd., Oxford, U.K.(1995)。在某些實(shí)施方式中,D包含可操作地連接至編碼歸巢核酸內(nèi)切酶的核酸的啟動子元件。例如,可切除的核酸構(gòu)建體包含第一和第二識別位點(diǎn),例如對于歸巢核酸內(nèi)切酶F-CphI而言,靶DNA片段可以包括編碼F-CphI的核酸序列,該核酸序列可操作地連接至啟動子元件。在具體實(shí)施方式
中,控制編碼歸巢核酸內(nèi)切酶的核酸表達(dá)的啟動子元件是誘導(dǎo)型啟動子,例如釀酒酵母的半乳糖誘導(dǎo)型啟動子(例如,GALU GAL7、和GALlO基因的啟動子),這樣靶DNA片段的切除,包括編碼歸巢核酸內(nèi)切酶的序列,可以被選擇性切除,例如在可切除的核酸構(gòu)建體整合至宿主細(xì)胞基因組以后切除。在某些實(shí)施方式中,歸巢核酸內(nèi)切酶選自下組:LAGLIDADG (SEQ ID NO:1)歸巢核酸內(nèi)切酶、HNH歸巢核酸內(nèi)切酶、His-Cys盒歸巢核酸內(nèi)切酶、GIY-YIG(SEQ ID N0:2)歸巢核酸內(nèi)切酶、和藍(lán)藻歸巢核酸內(nèi)切酶。在一些實(shí)施方式中,歸巢核酸內(nèi)切酶選自下組:1-Cre1、1-Mso1、1-Sce1、1-SceIV、H-Dre1、1-Hmu1、1-Ppo1、1-Dir1、1-Nja1、1-Nan1、1-Nit1、1-Ngr1、1-Tev1、1-TevI1、1-TevII1、F-Tev1、F-TevI1、F-Cph1、P1-Mga1、P1-MtuI1、1-Csm1、1-Pan1、1-Ceu1、和 P1-Sce10 在具體實(shí)施方式
中,歸巢核酸內(nèi)切酶是1-Scel。在某些實(shí)施方式中,歸巢核酸內(nèi)切酶是F-CphI。在某些實(shí)施方式中,D編碼一個或多個選擇性標(biāo)記。在某些實(shí)施方式中,選擇性標(biāo)記是抗生素抗性標(biāo)記??股乜剐詷?biāo)記是用于構(gòu)建重組核酸序列的質(zhì)粒載體中通常具有的。例如,PBR和pUC-衍生質(zhì)粒中含有細(xì)菌抗藥性標(biāo)記AMPlr或BLA基因作為選擇性標(biāo)記(參見,Sutcliffe, J.G.,et al.,Proc.Natl.Acad.Sc1.U.S.A.75:3737 (1978) )。BLA基因編碼酶Tem-1,其功能為β-內(nèi)酰胺酶,并負(fù)責(zé)細(xì)菌對β-內(nèi)酰胺抗生素的抗性,如窄譜頭孢菌素、頭霉素、和碳烯青霉素(厄他培南)、頭孢孟多、和頭孢哌酮,以及除替莫西林以外的所有抗革蘭氏陰性細(xì)菌青霉素。其他有用的選擇性標(biāo)記包括但不限于:NAT1、PAT、AUR1-C、PDR4, SMRl、CAT、小鼠dhfr、HPH、DSDA、KANK、和SH BLE基因。諾爾斯鏈霉菌的NATl基因編碼諾爾斯菌素N-乙?;D(zhuǎn)移酶,并具有諾爾斯菌素抗性。來自于S.viridochromogenes Tu94的PAT基因編碼草胺膦N-乙酰基轉(zhuǎn)移酶,并具有雙丙氨磷抗性。來自釀酒酵母的AURl-C基因具有金擔(dān)子素A (AbA)抗性,金擔(dān)子素A是由出芽金擔(dān)子菌產(chǎn)生的對出芽酵母釀酒酵母具有毒性的抗真菌抗生素。TOR4基因?qū)?淺藍(lán)菌素具有抗性。SMRl基因?qū)奏谆锹【哂锌剐?。來自Tn9轉(zhuǎn)座子的CAT編碼序列對氯霉素具有抗性。小鼠dhfr基因?qū)装钡示哂锌剐?。肺炎克雷伯菌的HPH基因編碼潮霉素B磷酸轉(zhuǎn)移酶,并對潮霉素B具有抗性。大腸桿菌的DSDA基因編碼D-絲氨酸脫氨酶,并用于酵母在以D-絲氨酸作為唯一氮源的平板上生長。Tn903轉(zhuǎn)座子的KANk基因編碼氨基糖苷類磷酸轉(zhuǎn)移酶,并對G418具有抗性。來自印度斯坦鏈異壁菌的SH BLE基因編碼Zeocin結(jié)合蛋白,并對Zeocin (博來霉素)具有抗性。在其他實(shí)施方式中,選擇性標(biāo)記包含可用于選擇酵母宿主菌株的轉(zhuǎn)化細(xì)胞的酵母基因。在某些實(shí)施方式中,選擇性標(biāo)記挽救宿主菌株中的缺陷體,例如營養(yǎng)缺陷體。在此類實(shí)施方式中,宿主菌株包含導(dǎo)致宿主營養(yǎng)缺陷型表型的氨基酸生物合成途徑中的一個或多個基因的功能破壞,例如HIS3、LEU2、LYSl、ΜΕΤ15、和TRPl,或者導(dǎo)致宿主營養(yǎng)缺陷型表型的核苷酸生物合成途徑中的一個或多個基因的功能破壞,例如ADE2和URA3。在具體實(shí)施方式
中,基因修飾的酵母宿主菌株包含URA3基因的功能破壞。在宿主酵母中導(dǎo)致營養(yǎng)缺陷型表型的功能破壞可以是點(diǎn)突變、部分或全部基因刪除、或者核苷酸的插入或取代。氨基酸或核苷酸生物合成途徑中的功能突變導(dǎo)致宿主菌株成為營養(yǎng)缺陷型突變體,其與原養(yǎng)型野生型菌株不同,在未添加一種或多種營養(yǎng)物的培養(yǎng)基中不能最適生長。然后,可以將宿主菌株中的功能破壞生物合成基因作為營養(yǎng)缺陷型基因標(biāo)記,隨后可以將其挽救,例如引入一個或多個質(zhì)粒,其包含被破壞的生物合成基因的功能性拷貝。利用URA3、TRPUP LYS2酵母基因作為選擇性標(biāo)記具有顯著優(yōu)勢,因?yàn)槭雇瑫r進(jìn)行陽性和陰性選擇成為可能。陽性選擇通過URA3、TRP1、和LYS2突變的營養(yǎng)缺陷型補(bǔ)償進(jìn)行,而陰性選擇分別利用特異性抑制劑5-氟-乳清酸(F0A)、5-氟鄰氨基苯甲酸、和a-氨基己二酸(aAA)進(jìn)行,這些抑制劑阻止原養(yǎng)型菌株生長,但是可以分別用于URA3、TRP1、和LYS2突變體生長。URA3基因編碼乳清苷_5’磷酸脫羧酶,該酶是尿嘧啶生物合成所需的。可以在含有FOA的培養(yǎng)基中對ura3-(或ura5_)細(xì)胞進(jìn)行選擇,F(xiàn)OA殺死全部URA3+細(xì)胞,而非ura3-細(xì)胞,因?yàn)镕OA在脫羧酶的作用下似乎轉(zhuǎn)化成毒性化合物5-氟尿嘧啶。在FOA培養(yǎng)基上的陰性選擇具有較高的分辨能力,通常低于10_2的FOA-抗性菌落即為Ura+。FOA選擇方法可以用于在單倍體菌株中通過突變產(chǎn)生ura3標(biāo)記,并且更重要的是,用于選擇那些不具有含URA3質(zhì)粒的細(xì)胞。TRPl基因編碼磷酸核糖鄰氨基苯甲酸異構(gòu)酶,該酶催化色氨酸生物合成的第三步。使用5-氟鄰氨基苯甲酸進(jìn)行的反選擇包括利用菌株進(jìn)行代謝拮抗作用,所述菌株缺乏將鄰氨基苯甲酸轉(zhuǎn)化為色氨酸所需的酶,因此這些菌株對5-氟鄰氨基苯甲酸具有抗性。LYS2基因編碼氨基乙二酸還原酶,該酶是賴氨酸生物合成所需的。Lys2-和lys5-突變體可以在缺乏正常氮源但含有賴氨酸和aAA的培養(yǎng)基中生長,但是Lys2-和lys5-正常菌株不行。顯然,lys2和lys5突變導(dǎo)致賴氨酸生物合成中的毒性中間體蓄積,該中間體由高水平的aAA形成,但是這些突變體仍能夠使用aAA作為氮源。與FOA選擇方法類似,含有LYS2的質(zhì)??梢苑奖愕貜膌ys2宿主中清除。在其他實(shí)施方式中,選擇性標(biāo)記是不同于挽救營養(yǎng)缺陷型突變標(biāo)記的標(biāo)記。例如,酵母宿主細(xì)胞菌株可以包含不同于營養(yǎng)缺陷型突變的突變,例如不會導(dǎo)致宿主死亡并且也不會對菌株的預(yù)期用途(例如工業(yè)發(fā)酵)造成不良效應(yīng)的突變,只要能夠通過已知的選擇方法鑒定這些突變即可。5.2.4.基因組整合序列在某些實(shí)施方式中,可切除的核酸構(gòu)建體包括第一和第二基因組整合序列?;蚪M整合序列用于將本申請所述的可切除的核酸構(gòu)建體整合至宿主細(xì)胞的基因組,例如通過宿主細(xì)胞介導(dǎo)的同源重組。為了通過同源重組將可切除的核酸構(gòu)建體整合至基因組,可切除的核酸構(gòu)建體優(yōu)選地包括在一個末端包含上游基因組整合序列(ISl)的核酸序列,并且在另一個末端包含下游基因 組整合序列(IS2)的核酸序列,其中各基因組整合序列的長度和序列同一性足以啟動宿主細(xì)胞與其染色體的同源重組。在某些實(shí)施方式中,第一基因組整合序列(ISl)位于第一串聯(lián)重復(fù)(DRl)的5’端,并且第二基因組整合序列(IS2)位于第二串聯(lián)重復(fù)(DR2)的3’端。在一些實(shí)施方式中,ISl位于DRl的5’端。在某些實(shí)施方式中,ISl緊鄰DRl的5’端。在某些實(shí)施方式中,ISl位于DRl的5’端的上游。在一些實(shí)施方式中,IS2位于DR2的3’端。在某些實(shí)施方式中,IS2緊鄰DR2的3’端。在某些實(shí)施方式中,IS2位于DR2的3’端的下游。第一和第二基因組整合序列使得可切除的核酸構(gòu)建體通過同源重組整合至宿主細(xì)胞基因組例如酵母基因組的特定基因座。將可切除的核酸構(gòu)建體靶向整合至宿主細(xì)胞基因組可以提供有用的益處。例如,可以將可切除的核酸構(gòu)建體整合至宿主細(xì)胞基因組中的感興趣的基因,從而“敲除”感興趣的基因,并使其表現(xiàn)為非功能性(圖2)?;蛘撸汕谐暮怂針?gòu)建體的靶向整合可以用于將感興趣的基因“敲入”特定基因座或“敲入”感興趣的基因附近的調(diào)控元件,例如以活化或上調(diào)感興趣的基因的表達(dá)。可能影響可切除的核酸構(gòu)建體在特定基因座整合的性質(zhì)包括但不限于:基因組整合序列的長度、可切除的核酸構(gòu)建體的全長、以及基因組整合基因座的核苷酸序列或位置。例如,在基因組整合序列的一條鏈與宿主細(xì)胞基因組中特定基因座的一條鏈之間形成有效的異源雙鏈體可能依賴于基因組整合序列的長度?;蚪M整合序列長度的有效范圍為50至5,000個核苷酸。關(guān)于基因組整合序列與基因座之間同源性有效長度的討論,參見Hastyet al.,Mol Cell Biolll:5586-91(1991)。ISl和IS2可以包含具有足夠長度、并且與宿主細(xì)胞基因座具有足夠的序列同一性的任意核苷酸序列,用于可切除核酸構(gòu)建體的基因組整合。在某些實(shí)施方式中,“足夠的序列同一性”指在長度為至少20個堿基對、至少50個堿基對、至少100個堿基對、至少250個堿基對、至少500個堿基對、或500個以上堿基對的范圍內(nèi),序列與宿主細(xì)胞的基因座具有至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%、或100%同一性。在一些實(shí)施方式中,宿主細(xì)胞基因座的長度為100、200、300、400、500、600、700、800、900、1000、I100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900 或 5,000 個核苷酸??梢圆捎萌我庥嬎銠C(jī)程序以及相關(guān)參數(shù)確定序列同一性的程度,包括本申請中描述的那些,如BLAST2.2.2或FASTA3.0t78版,使用默認(rèn)參數(shù)設(shè)置。在一些實(shí)施方式中,每個ISl和IS2包含具有足夠的長度、并且與原核細(xì)胞基因座具有足夠的序列同一性的核苷酸序列,以使得可切除的核酸構(gòu)建體整合至原核細(xì)胞的基因座。在一些實(shí)施方式中,每個ISl和IS2包含具有足夠的長度、并且與真核細(xì)胞基因座具有足夠的序列同一性的核苷酸序列,以使得可切除的核酸構(gòu)建體整合至真核細(xì)胞的基因座。在一些實(shí)施方式中,每個ISl和IS2包含具有足夠的長度、并且與酵母基因座具有足夠的序列同一性的核苷酸序列,以使得可切除的核酸構(gòu)建體整合至酵母的基因座。在一些實(shí)施方式中,每個ISl和IS2包含具有足夠的長度、并且與釀酒酵母基因座具有足夠的序列同一性的核苷酸序列,以使得可切除的核酸構(gòu)建體整合至釀酒酵母的基因座。用于整合可切除的核酸構(gòu)建體的適宜的釀酒酵母的基因座包括但不限于NDT80、HO、GAL80、HTX3、GAL2和GAL1-GAL10-GAL7 基因座。在一些實(shí)施方式中,每個ISl和IS2獨(dú)立地由約50至5,000個核苷酸組成。在一些實(shí)施方式中,每個ISl和IS2獨(dú)立地包含約50至5,000個核苷酸。在一些實(shí)施方式中,每個ISl和IS2獨(dú)立地由約100至2,500個核苷酸組成。在一些實(shí)施方式中,每個ISl和IS2獨(dú)立地由約100至1,000個核苷酸組成。在某些實(shí)施方式中,每個ISl和IS2獨(dú)立地由約250至750個核苷酸組成。在某些實(shí)施方式中,每個ISl和IS2獨(dú)立地由約100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900 或 5,000個核苷酸組成。在某些實(shí)施方式中,每個ISl和IS2獨(dú)立地由約500個核苷酸組成??梢圆捎帽绢I(lǐng)域技術(shù)人員公知的任意技術(shù)制備包含第一和第二基因組整合序列的可切除的核酸構(gòu)建體。在一些實(shí)施方式中,使用重疊延伸PCR和本領(lǐng)域公知的分子克隆技術(shù)制備包含第一和第二整合序列的可切除的核酸構(gòu)建體。參見,例如U.S.專利申請
發(fā)明者柯爾斯頓·R·本杰明 申請人:阿邁瑞斯公司