欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

使用靶向核酸內(nèi)切酶進(jìn)行哺乳動物基因組的表觀遺傳修飾的制作方法

文檔序號:12285397閱讀:512來源:國知局
使用靶向核酸內(nèi)切酶進(jìn)行哺乳動物基因組的表觀遺傳修飾的制作方法與工藝

本公開涉及基因組序列的表觀遺傳修飾。具體而言,本公開內(nèi)容涉及包含具有預(yù)定表觀遺傳修飾的染色體整合的核酸序列的遺傳改造細(xì)胞系。

背景

基因功能異常和基因表達(dá)模式改變是許多疾病和病狀的關(guān)鍵特征。越來越多的證據(jù)表明,表觀遺傳改變與遺傳畸變共同參與引起調(diào)控異常?;蚪MDNA的表觀遺傳修飾的檢測和量化的最近進(jìn)展正在產(chǎn)生用于許多疾病(例如,癌癥)的新一代診斷和預(yù)后測定。此外,表觀遺傳改變已被證實(shí)與對某些疾病治療方案的敏感性水平相關(guān),并且因此被用于治療決策中。

僅管基于表觀遺傳修飾的診斷和預(yù)后測定以及治療方案的開發(fā)有所進(jìn)展,但目前仍缺乏可用于評估表觀遺傳改變狀態(tài)的細(xì)胞參照標(biāo)準(zhǔn)。

發(fā)明概述

近年來,利用基因組編輯技術(shù)的進(jìn)展來修飾人細(xì)胞的基因組以產(chǎn)生反映出臨床樣本中觀測到的基因型的疾病模型一直備受關(guān)注。除了出于研究目的分析表型之外,遺傳或表觀遺傳改造細(xì)胞還可用作臨床測定的基因分型參照或標(biāo)準(zhǔn)。此類工程參照細(xì)胞系的優(yōu)點(diǎn)是:(1)它們在進(jìn)行細(xì)胞裂解(或福爾馬林固定、石蠟包埋(FFPE)提取)、DNA分離和擴(kuò)增的所有后續(xù)的診斷處理步驟的天然細(xì)胞和基因組環(huán)境內(nèi)提供了DNA測定模板,以及(2)可以將遺傳的或表觀遺傳的改變模型化成穩(wěn)定且提供大量基因組DNA的細(xì)胞類型。

本公開的一個方面提供了包含具有預(yù)定表觀遺傳修飾的至少一種染色體整合核酸的遺傳改造細(xì)胞系,其中所述預(yù)定表觀遺傳修飾與已知的診斷、預(yù)后和/或?qū)膊≈委煹拿舾行运较嚓P(guān)。在一些方面,所述表觀遺傳修飾是胞嘧啶的修飾,例如胞嘧啶的甲基化。在某些方面,表觀遺傳修飾的核酸與和疾病有關(guān)的基因的控制元件或控制元件的一部分的核酸具有基本的序列同一性。在其它方面,表觀遺傳修飾的核酸與和疾病有關(guān)的基因的編碼區(qū)或編碼區(qū)的一部分的核酸具有基本的序列同一性。本文提供了具有與疾病和/或疾病治療結(jié)果有關(guān)的表觀遺傳改變的基因的實(shí)例。在一些方面,表觀遺傳修飾的核酸可以替換表觀遺傳修飾的核酸所來源于的內(nèi)源性染色體序列。因此,內(nèi)源性染色體序列的天然表觀遺傳狀態(tài)可以變成插入的合成核酸的預(yù)定表觀遺傳狀態(tài)。另選地,具有預(yù)定表觀遺傳修飾的核酸可以在具有相鄰的絕緣元件或有助于維持插入的核酸的預(yù)定表觀遺傳修飾狀態(tài)的其它元件的基因座諸如AAVS1、CCR5或SOSA26處插入。在此類情況下,可以使對應(yīng)于合成的表觀遺傳修飾序列的內(nèi)源性染色體序列失活或缺失。整合的核酸的表觀遺傳修飾狀態(tài)可以是穩(wěn)定的或亞穩(wěn)定的。具有表觀遺傳修飾的核酸可以使用靶向性核酸內(nèi)切酶來插入目標(biāo)染色體位置中。靶向性核酸內(nèi)切酶可以是鋅指核酸酶、基于CRISPR的核酸內(nèi)切酶、大范圍核酸酶、轉(zhuǎn)錄激活因子樣效應(yīng)物核酸酶(TALEN)、I-TevI核酸酶或相關(guān)單體雜交體或人工的靶向DNA雙鏈斷裂誘導(dǎo)劑。任選地,包含整合的表觀遺傳修飾序列的細(xì)胞還可以包含至少一種編碼重組蛋白的核酸。工程細(xì)胞系可以是哺乳動物細(xì)胞系,包括人細(xì)胞系。

包含具有預(yù)定表觀遺傳修飾的整合核酸的工程細(xì)胞或細(xì)胞系具有若干用途。在某些方面,攜帶改變調(diào)控區(qū)的表觀遺傳狀態(tài)的合成序列的插入的工程細(xì)胞可以用于控制或改變基因表達(dá)。例如,具有除了不正常修飾的(即,不正常甲基化的或過甲基化的)內(nèi)源性調(diào)控染色體序列之外的或代替其的表觀遺傳修飾的合成序列(諸如,甲基化序列)的插入的細(xì)胞可用于改變基因表達(dá)。相反地,使用沒有表觀遺傳修飾的合成序列替換已知具有表觀遺傳修飾的內(nèi)源性調(diào)控序列或插入沒有表觀遺傳修飾的合成序列可以用于改變基因表達(dá)。在另一方面,可以使用具有表觀遺傳修飾序列的插入的工程細(xì)胞基于插入序列的表觀遺傳修飾模式或狀態(tài)的先驗(yàn)知識來分析修飾序列在細(xì)胞中的表觀遺傳穩(wěn)定性。在其它方面,具有表觀遺傳修飾序列的插入的工程細(xì)胞可以憑借它們已知的或預(yù)定的表觀遺傳修飾狀態(tài)而在診斷和/或預(yù)后測定中用作參照細(xì)胞系,所述表觀遺傳修飾狀態(tài)允許工程細(xì)胞在所述測定中充當(dāng)診斷和/或預(yù)后標(biāo)準(zhǔn)。在另外方面,具有表觀遺傳修飾序列的插入的細(xì)胞可以在測定中用來評估藥物治療方案的適用性(參見,圖3)。因此,表觀遺傳修飾的序列和含有所述序列的細(xì)胞可以在用于診斷疾病(諸如,癌癥)、預(yù)測疾病結(jié)果、監(jiān)測疾病行為和測量對靶向療法的應(yīng)答的測定中用作參照標(biāo)準(zhǔn)。

本公開還提供用于預(yù)測受試者中疾病對治療性處理的響應(yīng)性、診斷受試者的疾病或預(yù)測受試者的疾病的預(yù)后的試劑盒,其中試劑盒包括至少一種具有預(yù)定表觀遺傳修飾的核酸,所述預(yù)定表觀遺傳修飾與已知的診斷、預(yù)后或?qū)膊≈委煹拿舾行运较嚓P(guān)。

本公開的其它方面和迭代在以下進(jìn)行了更詳細(xì)的描述。

附圖簡述

圖1A示出使用鋅指核酸酶(ZFN)技術(shù)進(jìn)行的合成的甲基化DNA的靶向整合。示出了AAVS1靶位點(diǎn)被靶向ZFN裂解,并且包含19bp MGMT基因片段的供體序列通過細(xì)胞DNA修復(fù)過程整合到靶位點(diǎn)中。

圖1B示出三種不同的預(yù)定甲基化模式。*符號是指MGMT基因片段內(nèi)的四個CpG位點(diǎn)(即,1、2、3、4)。

圖2示出合成甲基化模式隨時間推移的穩(wěn)定性。繪出了在培養(yǎng)物中49天或80天后菌落#1或菌落#7中MGMT基因片段中的每個CpG位點(diǎn)處的甲基化百分比。

圖3呈現(xiàn)了示出使用MGMT啟動子甲基化狀態(tài)以確定是否將替莫唑胺開具處方以治療成膠質(zhì)細(xì)胞瘤的示意圖。

發(fā)明詳述

本公開提供包含表觀遺傳修飾的合成核酸,以及包含如本文所詳述的所述合成序列的工程細(xì)胞或細(xì)胞系。表觀遺傳修飾對疾病表型(特別是關(guān)于癌癥)的影響被日益理解。包含具有根據(jù)本公開的表觀遺傳修飾的合成序列的細(xì)胞可模型化成穩(wěn)定且提供可用于研究和臨床目的的大量基因組DNA的細(xì)胞類型。本公開的細(xì)胞還可以充當(dāng)用于涉及哺乳動物細(xì)胞中的表觀遺傳修飾的測定的生理上相關(guān)的和穩(wěn)健的細(xì)胞參照標(biāo)準(zhǔn)。此類標(biāo)準(zhǔn)可用于診斷和預(yù)后測定以及個體受試者中治療方案的評估。

I.具有預(yù)定表觀遺傳修飾的核酸

(a)表觀遺傳修飾

本公開提供具有預(yù)定表觀遺傳修飾的核酸,其中所述預(yù)定表觀遺傳修飾與已知的診斷、預(yù)后或?qū)膊≈委煹拿舾行运较嚓P(guān)。一般來講,表觀遺傳修飾的核酸是以化學(xué)方法產(chǎn)生所述表觀遺傳修飾的合成核酸。在一個方面,所述表觀遺傳修飾為胞嘧啶修飾。胞嘧啶修飾可以是本領(lǐng)域普通技術(shù)人員已知的任何此類修飾,諸如胞嘧啶的甲基化(包括5-甲基胞嘧啶(5mC)、3-甲基胞嘧啶(3mC)和5-羥甲基胞嘧啶)、5-甲?;奏?5fC)和5-羧基胞嘧啶(5caC)。在一個實(shí)施方案中,所述表觀遺傳修飾是胞嘧啶的甲基化,包括例如5-甲基胞嘧啶(5mC)、3-甲基胞嘧啶(3mC)和5-羥甲基胞嘧啶。在一種情況下,修飾的胞嘧啶為5-甲基胞嘧啶。在一個實(shí)施方案中,所述甲基化的胞嘧啶存在于CpG中,所述CpG可以以單個CpG位點(diǎn)存在或聚集在CpG簇(稱為CpG島)中。

在一個方面,胞嘧啶修飾是甲基化狀態(tài)胞嘧啶的修飾,其包括甲基化和羥甲基化兩者。甲基化狀態(tài)是指諸如序列中甲基化胞嘧啶殘基的數(shù)目或百分比(即,甲基化水平)或序列內(nèi)甲基化殘基的模式的特征。預(yù)定甲基化狀態(tài)可以基于目標(biāo)基因以及產(chǎn)物的預(yù)期用途進(jìn)行定制。在一些方面,細(xì)胞參照標(biāo)準(zhǔn)合乎希望地表現(xiàn)出高水平的甲基化,或另選地,可能優(yōu)選低甲基化或無甲基化。應(yīng)當(dāng)理解,用于計(jì)算甲基化水平的若干不同的準(zhǔn)則是本領(lǐng)域的普通技術(shù)人員已知的。例如,甲基化水平可以是特定的CpG島中甲基化殘基的百分比,或若干CpG島上的甲基化的平均值。本領(lǐng)域的技術(shù)人員將理解,除CpG島之外的特征結(jié)構(gòu)也可以是甲基化的,諸如一般具有CHG和CHH形式的序列,其中H為A、C或T(例如,CAG、CTG、CAA、CAT等等)。還可以跨越整個染色體序列總體地測量甲基化水平。

可以使用任何適合的慣例將核酸描述為甲基化的或非甲基化的。例如,如果在特定的島中至少10%的CpG殘基是甲基化的,那么本領(lǐng)域的普通技術(shù)人員可以認(rèn)為核酸是甲基化的,而如果小于10%的CpG殘基是甲基化的,那么可以認(rèn)為核酸是非甲基化的。當(dāng)然,如果除CpG殘基之外的特征結(jié)構(gòu)是甲基化的,那么也可以視情況將此類甲基化包括在計(jì)算中。另選地,也可以將核酸描述為具有一定百分比的甲基化水平,例如,約1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的胞嘧啶殘基是甲基化的。還應(yīng)當(dāng)理解,設(shè)想了居間值。還設(shè)想了具有0%或約0%甲基化的核酸。本領(lǐng)域的普通技術(shù)人員還易于定性地鑒定甲基化水平,例如,“高”、“中等”或“低”。在必要時參考以下方面可以容易地定義此類術(shù)語:(1)在正?;蚪】导?xì)胞的內(nèi)源性染色體序列中發(fā)現(xiàn)的甲基化水平,(2)在具有特定表型的細(xì)胞的內(nèi)源性染色體序列中發(fā)現(xiàn)的甲基化水平,所述特定表型包括但不限于異常表型或疾病表型和/或具有藥物治療敏感性或抗性的表型,(3)在對應(yīng)于正常基因表達(dá)水平的內(nèi)源性染色體序列中發(fā)現(xiàn)的甲基化水平;以及(4)在對應(yīng)于異?;虮磉_(dá)水平(即,過表達(dá)或低表達(dá))的內(nèi)源性染色體序列中發(fā)現(xiàn)的甲基化水平。

甲基化狀態(tài)可以指目標(biāo)核酸中的單獨(dú)的或與甲基化殘基百分比組合的特定甲基化模式。然而,應(yīng)當(dāng)理解,本領(lǐng)域的普通技術(shù)人員能夠解釋本公開的核酸的甲基化與取自受試者的樣本中檢測到的內(nèi)源性染色體序列的甲基化之間的異同,以及先前已知的或確定的甲基化水平和/或模式。

用于確定甲基化的水平和/或模式的方法在本領(lǐng)域中是已知的,并且包括例如,數(shù)字量化(Li等,Nature Biotechnology,27:858-863(2009)和補(bǔ)充材料(doi:10.1038/nbt.1559));甲基化特異性PCR(MSP),其涉及使染色體序列與亞硫酸氫鈉反應(yīng),隨后進(jìn)行PCR(Herman等,PNAS,93:9821-9826(1996);Gonzalgo等,Cancer Res.,57:594-599(1997);Hegi等,Clin.Cancer Res.,10:1871-1874(2004));全基因組硫酸氫鹽測序(BS-Seq);HELP測定,其涉及限制性內(nèi)切酶區(qū)別地裂解甲基化和未甲基化的DNA的能力(使用甲基化敏感性限制性內(nèi)切酶或依賴甲基化的限制性內(nèi)切酶);ChIP-on-chip測定,其基于抗體結(jié)合到DNA甲基化相關(guān)蛋白的能力;限制性標(biāo)記的基因組掃描,其類似于HELP測定(Hayashizaki等,Electrophoresis,14:251-258(1993);Costello等,Nat Genet,24:132-138(2000));甲基化DNA免疫沉淀(MeDIP),其用于分離甲基化DNA片段;硫酸氫鹽處理的DNA的焦磷酸測序(Tost等,BioTechniques,35:152-156(2003));MS-qFRET(Bailey等,Genome Res,19:1455-1461(2009));定量差異甲基化區(qū)(QDMR);甲基敏感的southern印跡(類似于HELP測定);甲基化熒光(MethylLight)、MS HRM、(在Biochemistry,Genetics and Molecular Biology,第5章“DNA Methylation-from Genomics to Technology;T.Tatarinova和O.Kerton編,In-Tech,2012年3月,第93-116頁中的McCarthy等,“A Quantitative,Sensitive,and Bisulfate-free Method for Analysis of DNA Methylation”);GLIB(Pastor等,Nature,473:394-397(2011));抗CMS(Pastor等,Nature,473:394-397(2011));以及CpG結(jié)合蛋白的使用,所述CpG結(jié)合蛋白用于將天然DNA分成甲基化和未甲基化部分。在Szwagierczak等,Nuc.Acids Res.,38:e181(2010)中描述了檢測DNA甲基化(包括5-羥甲基胞嘧啶)的其它方法。

(b)具有預(yù)定表觀遺傳修飾的核酸的序列

具有本文公開的預(yù)定表觀遺傳修飾的核酸通常具有與目標(biāo)基因的轉(zhuǎn)錄控制元件、轉(zhuǎn)錄控制元件的一部分、編碼區(qū)或編碼區(qū)的一部分的核苷酸序列具有基本的序列同一性的核苷酸序列,其中所述目標(biāo)基因與疾病或病癥有關(guān)。如本文所用,短語“基本的序列同一性”是指具有至少約75%序列同一性的序列。在各方面,具有表觀遺傳修飾的合成染色體序列可以與目標(biāo)基因具有約75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。

在一些方面,具有預(yù)定表觀遺傳修飾的核酸與和目標(biāo)基因有關(guān)的轉(zhuǎn)錄控制元件的核酸具有基本的序列同一性。所述控制元件可以是啟動子、增強(qiáng)子、沉默子、基因座控制元件或調(diào)控基因轉(zhuǎn)錄的任何序列。所述轉(zhuǎn)錄控制元件可以位于目標(biāo)基因的上游、下游,或目標(biāo)基因的編碼區(qū)或非編碼區(qū)(例如,內(nèi)含子)內(nèi)。在具體方面,所述控制元件是位于轉(zhuǎn)錄起始位點(diǎn)的上游或目標(biāo)基因的5'區(qū)內(nèi)的啟動子或啟動子的一部分。在一些方面,控制元件的表觀遺傳修飾(例如,胞嘧啶甲基化)完全或部分地沉默基因的轉(zhuǎn)錄。

在其它方面,具有預(yù)定表觀遺傳修飾的核酸與和疾病有關(guān)的基因的編碼區(qū)(即,一個或多個外顯子)或編碼區(qū)的一部分的核酸具有基本的序列同一性。在一個實(shí)施方案中,具有預(yù)定表觀遺傳修飾的核酸與對應(yīng)的天然或內(nèi)源性染色體序列(即,在正常的或非患病細(xì)胞中的對應(yīng)的內(nèi)源性序列或在正常基因表達(dá)(不同于過表達(dá)和低表達(dá))過程中發(fā)現(xiàn)的對應(yīng)的內(nèi)源性序列)相比是過甲基化的。在另一個實(shí)施方案中,具有預(yù)定表觀遺傳修飾的核酸與對應(yīng)的天然或內(nèi)源性染色體序列相比是低甲基化的。包含外顯子和內(nèi)含子的染色體區(qū)域已知通過CpG位置(其可以作為CpG島存在或不作為CpG島存在)的甲基化來調(diào)節(jié)基因表達(dá)。除了如本文所提供的許多其它實(shí)例之外,具有已知的外顯子和內(nèi)含子甲基化應(yīng)答的基因的實(shí)例還包括MGMT和CXCR4。

在一些方面,具有預(yù)定表觀遺傳修飾的核酸來源于與疾病有關(guān)的基因。目標(biāo)基因包括已知具有表觀遺傳修飾序列的那些基因以及與疾病諸如癌癥、自身免疫疾病(諸如1型糖尿病、炎性腸病)、炎性疾病(諸如哮喘)、代謝障礙、自閉癥譜系障礙和與異?;虮磉_(dá)有關(guān)的其它病狀有關(guān)的那些基因。特定的目標(biāo)基因包括MGMT、BRCA1、BRCA2、Septin9、PITX2、GSTP1、APC、RASSF1、HER2、P15INK4B、p16INK4A、Rb、E-cad以及在本節(jié)中描述的其它基因。此外,下表A提供了目標(biāo)基因的非限制性列表。

本文描述的基因包括已知被啟動子區(qū)中的表觀遺傳修飾(諸如,被異常的DNA甲基化)完全或部分地沉默的基因(Jones等,Cell,128:683-692(2007);Jones等,Nat.Genet.,21:163-167(1999);Jones等,Nat.Rev.Genet.,3,415-428(2002))。例如過甲基化,特別是高水平的5-甲基胞嘧啶,是通過啟動子區(qū)抑制轉(zhuǎn)錄從而阻止受影響的基因的表達(dá)的主要表觀遺傳修飾之一。眾所周知,某些癌癥與基因的過甲基化的啟動子區(qū)有關(guān),所述基因諸如腫瘤抑制基因(例如,Rb、p16ink4a、p15ink4b、p73、APC和VHL)、轉(zhuǎn)錄因子基因(例如,GATA-4、GATA-5、HIC1和E-鈣粘素)、DNA修復(fù)基因(例如,BRCA1、WRN、FANCF、RAD51C、MGMT、MLH1、MSH2、NEIL1、FANCB、MSH4、ATM和GSTP1)、涉及細(xì)胞周期調(diào)控的基因(例如,p16ink4a、p15ink4b、p14arf和CDKN2B)、涉及凋亡的基因、涉及轉(zhuǎn)移和侵襲的基因(例如,CDH1、TIMP3和DAPK)和代謝酶基因。例如,乳腺癌、卵巢癌、胃腸(胃和結(jié)腸)癌、胰腺癌、肝癌、腎癌、結(jié)直腸癌、肺癌、膀胱癌、宮頸癌、腦癌、神經(jīng)膠質(zhì)瘤、白血病、黑色素瘤、前列腺癌以及頭頸癌與BRCA1、WRN、FANCF、RAD51C、MGMT、MLH1、MSH2、NEIL1、FANCB、MSH4、Rb、p16ink4a、p15ink4b、p73、APC、VHL、GATA-4、GATA-5、HIC1、E-鈣粘素、p14arf、CDH1、TIMP3、DAPK和ATM(即,乳腺—GSTP1、BRCA1、p16ink4a、WRN;卵巢—BRCA1、WRN、FANCF、GSTP1、p16ink4a、RAD51C;結(jié)直腸—MGMT、APC、WRN、MLH1、p16ink4a、p14arf、MSH2;頭頸—MGMT、MLH1、NEIL1、FANCB、MSH4、p16ink4a、DAPK、ATM;膀胱—p16ink4a、DAPK;宮頸—p16ink4a;黑色素瘤—p16ink4a;神經(jīng)膠質(zhì)瘤—p16ink4a;胃腸—p16ink4a、p14arf、MLH1、MGMT、APC;肝—GSTP1;前列腺—GSTP1;肺—DAPK、MGMT、p16ink4a)的過甲基化的啟動子區(qū)有關(guān)??缭S多人類腫瘤類型的若干不同基因中的基因啟動子甲基化的特征在Esteller等,Cancer Res,61:3225-3229(2001)以及本文引用的許多參考文獻(xiàn)中有所報(bào)道。另參見,Baylor,Nature Clinical Practice Oncology,2:S4-S11(2005)。

本文所述的基因還包括啟動子區(qū)的表觀遺傳修飾(諸如,異常DNA甲基化)已被證實(shí)與特定的預(yù)后或?qū)δ承┲委煼桨?諸如,某些化學(xué)療法)的敏感性有關(guān)的基因。例如,mgmt啟動子的甲基化一直與對替莫唑胺的響應(yīng)性相關(guān)。參見,例如,Hegi等,Clin.Cancer Res.10(6):1871-4(2004);Hegi等,New England J.Med.352(10):997-1003(2005);Boots-Sprenger等,Modern Pathol.26(7):922-9(2013)。同樣地,brca1和brca2啟動子的甲基化已經(jīng)作為用于確定乳腺癌預(yù)后的制定的診斷方案的一部分來檢查。參見,例如,Abkevich等,Br.J.Cancer,107(10):1776-82(2012)。另外,用于Septin9的甲基化測定已用于結(jié)直腸癌的病理評估。參見,例如,Grutzmann等,PLos One,3(11):e3759(2008)。而且,E-鈣粘蛋白啟動子的甲基化與腫瘤抑制能力減少和轉(zhuǎn)移的可能性增加有關(guān)。參見,例如,Graff等,Cancer Res.55(22):5195-9(1995)。

本文提供的其它基因包括總體低甲基化與癌癥的發(fā)展和進(jìn)展有關(guān)的基因。例如,5-羥甲基胞嘧啶的缺失是黑素瘤的表觀遺傳標(biāo)志(Lian等,2012,Cell,150:1135-1146);總體低甲基化與乳腺癌中抑制的染色質(zhì)結(jié)構(gòu)域和基因沉默有關(guān)(Hon等,2012,Genome Res22(2);246-58);并且在人類結(jié)腸癌組織中觀測到總體低甲基化(Hernandez-Blazquez等,2000,Gut 47:689-93)。

目標(biāo)基因還包括與自閉癥譜系障礙(ASD)的發(fā)生和/或嚴(yán)重性有關(guān)的基因。雖然ASD的遺傳力估計(jì)值很高,但是ASD的一致的單卵雙生對(ASD-concordant monozygotic twin pairs)之間的癥狀嚴(yán)重性的明顯差異表明了非遺傳性表觀遺傳因素在ASD病因中的作用。(參見,C.Wong等,Mol.Psychiatry 2013(1-9),先進(jìn)的在線出版物,2013年4月23日;doi:10.1038/mp.2013.41)。此類基因包括例如MBD4、AUTS2、MAP2、GABRB3、AFF2、NLGN2、JMJD1C、SNRPN、SNURF、UBE3A、KCNJ10、NFYC、PTPRCAP、RNF185、TINF2、AFF2、GNB2、GRB2、MAP4、PDHX、PIK3C3、SMEK2、THEX1、TCP1、ANKS1A、APXL、BPI、EFTUD2、NUDCD3、SOCS2、NUP43、CCT6A、CEP55、FCJ12505、SRF、DNPEP、TSNAX、FERD3L、RCN2、MBTPS2、PKIA、DAPP1、CCDC41、HOXC5、RPL14、PSMB7、TAF7、INHBB、HNRPA0、MC3R20、BDKRB1、FDFT1、RAD50、21cg03660451、RECQL5、ZNF499、ARHGAP15、PTPRCAP、C18orf22、RAFTLIN、C14orf143、SUPT5H、ANXA1、C16orf46、GAPDH、FKBP4、LOC112937、SLC30A3、ZNF681、SELENBP1、ELA2、DUSP2、CDC42SE1、PNMA2、POU4F3、DIDO1、SCUBE3、CASP8、THRAP5、ETS1、PXDN、TMEM161A、HOXA9、C11orf1、MGC3207、OR2L13、C19orf33、P2RY11、NRXN1和ISL1。

表A列出了示例性基因。

表A.目標(biāo)基因

(c)核酸類型

具有本文公開的預(yù)定表觀遺傳修飾的核酸可以是單鏈的、雙鏈的、線型的或環(huán)狀的RNA、DNA。在表觀遺傳修飾的核酸是雙鏈的迭代中,在兩條鏈上的表觀遺傳修飾模式可以相同或不同。在一些實(shí)施方案中,兩條鏈可以缺乏表觀遺傳修飾。在其它實(shí)施方案中,兩條鏈中的一條可以具有表觀遺傳修飾(即,半修飾的)。在另外的實(shí)施方案中,兩條鏈都可以具有表觀遺傳修飾(即,雙修飾的)。在一些情況下,具有預(yù)定表觀遺傳修飾的核酸可以是單鏈線型分子,例如寡核苷酸。在其它情況下,表觀遺傳修飾的核酸可以是雙鏈線型分子。雙鏈線型核酸可以通過兩條互補(bǔ)的單鏈核酸的退火來制備,或者此類核酸可以通過更長的雙鏈核酸的酶促裂解來制備。在一些方面,雙鏈線型核酸可以具有與由靶向核酸內(nèi)切酶產(chǎn)生的突出端相匹配的突出端。(如以下所詳述的,可以使用靶向性核酸內(nèi)切酶來在細(xì)胞基因組中的特定靶向的位置處插入具有預(yù)定表觀遺傳修飾的核酸)。所述突出端長度可以是一個、兩個、三個、四個、五個或更多個核苷酸。在其它迭代中,具有表觀遺傳修飾的線型(單鏈的或雙鏈的)核酸中的一些或全部核苷酸可以通過硫代磷酸酯鍵連接。例如,任一端或兩端上的末端的兩個、三個、四個或更多個核苷酸可以具有硫代磷酸酯鍵。在其它方面,表觀遺傳修飾的核酸可以是環(huán)狀的。例如,如下文所詳述的,具有預(yù)定表觀遺傳修飾的核酸可以是較大的多核苷酸(例如,質(zhì)粒載體)的一部分。

具有表觀遺傳修飾的核酸的長度可以變化。一般來講,表觀遺傳修飾的核酸的長度可以在約5個核苷酸(nt)或堿基對(bp)至約200,000nt/bp范圍內(nèi)。在某些實(shí)施方案中,表觀遺傳修飾的核酸的長度可以在約5nt/bp至約200nt/bp、約200nt/bp至約1000nt/bp、約1000nt/bp至約5000nt/bp、約5,000nt/bp至約20,000nt/bp或約20,000nt/bp至約200,000nt/bp范圍內(nèi)。

在一些方面,表觀遺傳修飾的核酸還可以包含至少一個旁側(cè)序列。所述旁側(cè)序列可以在上游、在下游或兩者。在一個方面,表觀遺傳修飾的核酸可以側(cè)接包含限制性核酸內(nèi)切酶位點(diǎn)的上游和/或下游序列。如上所述,表觀遺傳修飾的核酸可以側(cè)接(在上游、在下游或兩者)與由靶向性核酸內(nèi)切酶產(chǎn)生的突出端相匹配的突出端。在另外的方面,表觀遺傳修飾的核酸可以側(cè)接(在上游、在下游或兩者)至少一個絕緣元件,所述絕緣元件可以使表觀遺傳修飾的核酸的表觀遺傳修飾穩(wěn)定。絕緣元件在本領(lǐng)域中是已知的,參見,例如,West等Genes&Dev.16:271-88(2002);Barkess等,Epigenomics 4(1):67-80,(2012)。

在另外的方面,表觀遺傳修飾的核酸可以側(cè)接(在上游、在下游或兩者)與由靶向性核酸內(nèi)切酶識別的靶位點(diǎn)的一側(cè)上的序列具有基本的序列同一性的序列。例如,表觀遺傳修飾的核酸可以側(cè)接上游序列和下游序列,所述上游序列和下游序列中的每個都與分別位于由靶向性核酸內(nèi)切酶識別的靶位點(diǎn)的上游或下游的序列具有基本的序列同一性。在此類情況下,表觀遺傳修飾的核酸可以通過同源介導(dǎo)的過程來插入靶向的染色體位置中。如上所述,短語“基本的序列同一性”是指具有至少約75%序列同一性的序列。因此,側(cè)接表觀遺傳修飾的核酸的上游和下游序列可以與靶向位點(diǎn)的上游或下游的序列具有約75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。在非限制性的實(shí)例中,側(cè)接表觀遺傳修飾的核酸的上游和下游序列可以分別與靶向位點(diǎn)的上游或下游的染色體序列具有約95%或100%的序列同一性。

在一些方面,上游序列可以與直接位于靶向位點(diǎn)上游(即,與靶向位點(diǎn)相鄰)的染色體序列共用基本的序列同一性。在其它方面,上游序列可以與位于靶向位點(diǎn)上游約一百(100)個核苷酸內(nèi)的染色體序列共用基本的序列同一性。因此,例如,上游序列可以與位于靶向位點(diǎn)上游約1至約20、約21至約40、約41至約60、約61至約80或約81至約100個核苷酸的染色體序列共用基本的序列同一性。在一個實(shí)施方案中,下游序列與直接位于目標(biāo)位點(diǎn)下游(即,與靶向位點(diǎn)相鄰)的染色體序列共用基本的序列同一性。在其它方面,下游序列可以與位于靶向位點(diǎn)下游約一百(100)個核苷酸內(nèi)的染色體序列共用基本的序列同一性。因此,例如,下游序列可以與位于靶向位點(diǎn)下游約1至約20、約21至約40、約41至約60、約61至約80或約81至約100個核苷酸的染色體序列共用基本的序列同一性。每個上游或下游序列的長度可以在約10個核苷酸至約5000個核苷酸范圍內(nèi)。在一些方面,上游和下游序列可以包含約10至約50、約50至約100、約100至約500、約500至約1000、約1000至約2000或約2000至約個核苷酸。在某些方面,上游和下游序列的長度可以在約20至約500個核苷酸范圍內(nèi)。

在其它方面,表觀遺傳修飾的核酸可以側(cè)接(在上游、在下游或兩者)由靶向性核酸內(nèi)切酶識別(或裂解)的至少一個序列。在具體方面,表觀遺傳修飾的核酸可以在兩側(cè)側(cè)接由靶向性核酸內(nèi)切酶識別的靶位點(diǎn)。在此類情況下,靶向性核酸內(nèi)切酶也可以裂解包含表觀遺傳修飾的核酸的較大的多核苷酸,從而釋放作為線型分子的表觀遺傳修飾的核酸,所述線型分子具有與由靶向性核酸內(nèi)切酶產(chǎn)生的染色體DNA中的突出端相匹配的突出端。結(jié)果,包含所述表觀遺傳修飾的核酸的釋放序列可以通過直接連接來插入所需的染色體位置中。因此,待連接的序列末端可以是平末端或粘性末端。

在表觀遺傳修飾的核酸側(cè)接如以上所詳述的至少一個另外序列的實(shí)施方案中,表觀遺傳修飾的核酸可以是較大的多核苷酸的一部分。在一些情況下,包含表觀遺傳修飾的核酸和另外的序列的較大的多核苷酸可以是線型的。在其它情況下,包含表觀遺傳修飾的核酸和另外的序列的多核苷酸可以是環(huán)狀的。例如,它可以是載體的一部分。

在表觀遺傳修飾的核酸是載體的一部分的實(shí)施方案中,可以使用多種載體。適合的載體包括但不限于質(zhì)粒載體、噬菌粒、粘粒、人工/微型染色體、轉(zhuǎn)座子以及病毒載體。在一個實(shí)施方案中,表觀遺傳修飾的核酸存在于質(zhì)粒載體中。適合的質(zhì)粒載體的非限制性實(shí)例包括pUC、pBR322、pET、pBluescript及其變體。所述載體可以包含另外的序列,諸如復(fù)制起點(diǎn)、選擇標(biāo)記序列(例如,抗生素抗性基因)等等。另外的信息可見于“Current Protocols in Molecular Biology”Ausubel等,John Wiley&Sons,New York,2003或“Molecular Cloning:A Laboratory Manual”Sambrook和Russell,Cold Spring Harbor Press,Cold Spring Harbor,NY,第3版,2001中。

在一些實(shí)施方案中,包括表觀遺傳修飾的核酸的載體還可以包含編碼標(biāo)記蛋白的序列。在一個方面,所述標(biāo)記蛋白是熒光蛋白。適合的熒光蛋白的非限制性實(shí)例包括綠色熒光蛋白(例如,GFP、GFP-2、tagGFP、turboGFP、EGFP、Emerald、Azami Green、單體Azami Green、CopGFP、AceGFP、ZsGreen1)、黃色熒光蛋白(例如,YFP、EYFP、Citrine、Venus、YPet、PhiYFP、ZsYellow1)、藍(lán)色熒光蛋白(例如,EBFP、EBFP2、Azurite、mKalama1、GFPuv、Sapphire、T-sapphire)、青色熒光蛋白(例如,ECFP、Cerulean、CyPet、AmCyan1、Midoriishi-Cyan)、紅色熒光蛋白(mKate、mKate2、mPlum、DsRed單體、mCherry、mRFP1、DsRed-Express、DsRed2、DsRed-單體、HcRed-Tandem、HcRed1、AsRed2、eqFP611、mRasberry、mStrawberry、Jred)以及橙色熒光蛋白(mOrange、mKO、Kusabira-Orange、單體Kusabira-Orange、mTangerine、tdTomato)。

(d)表觀遺傳修飾的核酸的產(chǎn)生

表觀遺傳修飾的核酸可以使用常規(guī)亞磷酰胺固相寡核苷酸合成技術(shù)來合成,但其中標(biāo)準(zhǔn)的胞嘧啶亞磷酰胺在適當(dāng)?shù)奈恢锰幈恍揎椀陌奏喠柞0诽鎿Q。修飾的胞嘧啶亞磷酰胺諸如5-甲基胞嘧啶亞磷酰胺、5-羥甲基胞嘧啶亞磷酰胺、5-甲?;奏喠柞0贰?-羧基胞嘧啶亞磷酰胺、3-甲基胞嘧啶亞磷酰胺等是可商購獲得的。當(dāng)使用修飾的胞嘧啶亞磷酰胺時,本領(lǐng)域的技術(shù)人員熟悉用于修改標(biāo)準(zhǔn)的合成和去保護(hù)步驟的適合的方法。

II.包含具有表觀遺傳修飾的核酸的細(xì)胞

本公開還提供了遺傳改造細(xì)胞或細(xì)胞系,所述遺傳改造細(xì)胞或細(xì)胞系包含至少一種具有如以上第I節(jié)中所詳述的預(yù)定表觀遺傳修飾的合成核酸。一般來講,遺傳改造細(xì)胞或細(xì)胞系包含至少一種染色體整合的表觀遺傳修飾的核酸,其中所述表觀遺傳修飾與已知的診斷、預(yù)后或?qū)膊≈委煹拿舾行运较嚓P(guān)。包含染色體整合的表觀遺傳修飾的核酸的細(xì)胞或細(xì)胞系可以通過本領(lǐng)域普通技術(shù)人員已知的任何方法來制備。所述表觀遺傳修飾優(yōu)選為穩(wěn)定的,使得所述細(xì)胞或細(xì)胞系可以可靠地用于本文描述的任何用途,例如為控制基因表達(dá)、在診斷和預(yù)后測定中充當(dāng)參照標(biāo)準(zhǔn)和/或評估治療方案。穩(wěn)定的修飾合乎希望地在整個細(xì)胞的生長和培養(yǎng)期間維持,并且包含具有穩(wěn)定的表觀遺傳修飾的染色體整合核酸的細(xì)胞可以使用本領(lǐng)域普通技術(shù)人員已知的技術(shù)來制備為細(xì)胞系。然而,在一些方面,所述表觀遺傳修飾可以是亞穩(wěn)定的??梢允褂脭y帶亞穩(wěn)定修飾的細(xì)胞來在對應(yīng)于所述表觀遺傳修飾的核酸的內(nèi)源性染色體序列中基于表觀遺傳修飾模式或狀態(tài)的先驗(yàn)知識精確地分析表觀遺傳穩(wěn)定性??梢允褂萌缦挛乃龅陌邢蛐院怂醿?nèi)切酶介導(dǎo)的基因組編輯來修飾細(xì)胞的基因組以包含具有預(yù)定修飾的核酸。

在本文公開的細(xì)胞或細(xì)胞系中,所述表觀遺傳修飾的核酸可以在具有未修飾的或天然的表觀遺傳狀態(tài)的對應(yīng)內(nèi)源性染色體序列的基因座處插入,其中所述內(nèi)源性染色體序列已經(jīng)缺失或失活。例如,所述表觀遺傳修飾的核酸可以與所述表觀遺傳修飾的核酸所來源于的同源內(nèi)源性染色體序列交換。另選地,表觀遺傳修飾的核酸可以在表觀遺傳修飾穩(wěn)定的基因座處插入,所述基因座諸如具有相鄰的絕緣元件的基因座,例如基因組安全港諸如AAVS1、ROSA26、HPRT和CCR5基因座。在此實(shí)施方案中,可以任選地使對應(yīng)于表觀遺傳修飾的合成序列的內(nèi)源性染色體序列失活或缺失。如本文中所進(jìn)一步詳細(xì)討論的,表觀遺傳修飾的合成核酸與目標(biāo)基因的調(diào)控序列(即,控制元件)或編碼序列具有基本的序列同一性。

(a)細(xì)胞類型

本公開設(shè)想的細(xì)胞可以變化并且將會變化。一般來講,所述細(xì)胞是真核細(xì)胞。在各種方面,所述細(xì)胞可以是人細(xì)胞、非人哺乳動物細(xì)胞、非哺乳類脊椎動物細(xì)胞、無脊椎動物細(xì)胞、昆蟲細(xì)胞、植物細(xì)胞、酵母細(xì)胞或單細(xì)胞真核生物。所述細(xì)胞可以是成體細(xì)胞或胚細(xì)胞(例如,胚胎)。在其它方面,所述細(xì)胞可以是干細(xì)胞。適合的干細(xì)胞包括但不限于胚胎干細(xì)胞、ES樣干細(xì)胞、胎兒干細(xì)胞、成體干細(xì)胞、多能干細(xì)胞、誘導(dǎo)多能干細(xì)胞、多潛能干細(xì)胞、寡能干細(xì)胞、單能干細(xì)胞以及其它干細(xì)胞。在示例性方面,所述細(xì)胞是哺乳動物細(xì)胞。

在一些方面,所述細(xì)胞是細(xì)胞系細(xì)胞。適合的哺乳動物細(xì)胞的非限制性實(shí)例包括中國倉鼠卵巢(CHO)細(xì)胞、幼小倉鼠腎(BHK)細(xì)胞;小鼠骨髓瘤NS0細(xì)胞、小鼠胚胎成纖維細(xì)胞3T3細(xì)胞(NIH3T3)、小鼠B淋巴瘤A20細(xì)胞;小鼠黑素瘤B16細(xì)胞;小鼠成肌細(xì)胞C2C12細(xì)胞;小鼠骨髓瘤SP2/0細(xì)胞;小鼠胚胎間質(zhì)C3H-10T1/2細(xì)胞;小鼠癌瘤CT26細(xì)胞、小鼠前列腺DuCuP細(xì)胞;小鼠乳房EMT6細(xì)胞;小鼠肝細(xì)胞瘤Hepa1c1c7細(xì)胞;小鼠骨髓瘤J5582細(xì)胞;小鼠上皮MTD-1A細(xì)胞;小鼠心肌MyEnd細(xì)胞;小鼠腎RenCa細(xì)胞;小鼠胰腺RIN-5F細(xì)胞;小鼠黑素瘤X64細(xì)胞;小鼠淋巴瘤YAC-1細(xì)胞;大鼠成膠質(zhì)細(xì)胞瘤9L細(xì)胞;大鼠B淋巴瘤RBL細(xì)胞;大鼠成神經(jīng)細(xì)胞瘤B35細(xì)胞;大鼠肝細(xì)胞瘤細(xì)胞(HTC);水牛鼠肝BRL 3A細(xì)胞;犬腎細(xì)胞(MDCK);犬乳腺(CMT)細(xì)胞;大鼠骨肉瘤D17細(xì)胞;大鼠單核細(xì)胞/巨噬細(xì)胞DH82細(xì)胞;猴腎SV-40轉(zhuǎn)化的成纖維細(xì)胞(COS7)細(xì)胞;猴腎CVI-76細(xì)胞;非洲綠猴腎(VERO-76)細(xì)胞;人胚腎細(xì)胞(HEK293、HEK293T);人宮頸癌細(xì)胞(HELA);人肺細(xì)胞(W138);人肝細(xì)胞(Hep G2);人U2-OS骨肉瘤細(xì)胞、人A549細(xì)胞、人A-431細(xì)胞、人SW48細(xì)胞、人HCT116細(xì)胞和人K562細(xì)胞。哺乳動物細(xì)胞系的廣泛列表可見于美國典型培養(yǎng)物保藏中心(American Type Culture Collection)目錄(ATCC,Manassas,VA)中。在具體實(shí)施方案中,所述細(xì)胞是人細(xì)胞系細(xì)胞。

(b)任選的核酸

在一些方面,包含本文公開的表觀遺傳修飾的核酸的細(xì)胞還可以包含編碼重組蛋白的至少一種核酸序列。編碼重組蛋白的核酸可以位于細(xì)胞的染色體中或者其可以是染色體外的。一般來講,編碼的重組蛋白是異源的,意指所述蛋白質(zhì)對于細(xì)胞不是天然的。在一些方面,所述重組蛋白可以是治療性蛋白質(zhì)。示例性重組治療性蛋白包括但不限于抗體、抗體片段、單克隆抗體、人源化抗體、人源化單克隆抗體、嵌合抗體、IgG分子、IgG重鏈、IgG輕鏈、IgA分子、IgD分子、IgE分子、IgM分子、疫苗、生長因子、細(xì)胞因子、干擾素、白介素、激素、凝血(或凝結(jié))因子、血液組分、酶、營養(yǎng)蛋白質(zhì)、前述任一者蛋白質(zhì)的功能性片段或功能性變體,或包含前述蛋白質(zhì)和/或其功能性片段或變體中的任一種的融合蛋白。

在其它方面,所述重組蛋白可以是賦予細(xì)胞改善的特性或賦予第一重組蛋白改善的特性的蛋白質(zhì)。改善的特性的非限制性實(shí)例包括增加的穩(wěn)健性、增加的生存力、增加的存活、增加的增殖、增加的細(xì)胞周期進(jìn)展(即,增加的G1期至S期的進(jìn)展)、增加的細(xì)胞生長、增加的細(xì)胞大小、增加的內(nèi)源性蛋白的產(chǎn)生、增加的異源蛋白的產(chǎn)生、增加的重組蛋白穩(wěn)定性、改變的重組蛋白質(zhì)的翻譯后加工以及任何上述情況的組合。在一些方面,改善細(xì)胞特性的蛋白質(zhì)可以是過表達(dá)的。適合的蛋白的非限制性實(shí)例包括絲氨酸蛋白酶抑制劑蛋白(例如,SerpinB1)、細(xì)胞調(diào)控蛋白、細(xì)胞周期控制蛋白、凋亡抑制劑、代謝途徑蛋白、翻譯后修飾蛋白、人工轉(zhuǎn)錄因子、轉(zhuǎn)錄激活因子、轉(zhuǎn)錄抑制劑和增強(qiáng)子蛋白。

在另外的實(shí)施方案中,重組蛋白可以是標(biāo)記蛋白諸如熒光蛋白(以上詳述了其實(shí)例),或選擇性標(biāo)記蛋白諸如次黃嘌呤-鳥嘌呤轉(zhuǎn)磷酸核糖基酶(HPRT)、二氫葉酸還原酶(DHFR)和/或谷氨酰胺合酶(GS)或由抗生素抗性基因編碼的蛋白質(zhì)。

III.使用靶向核酸內(nèi)切酶來產(chǎn)生包含具有預(yù)定表觀遺傳修飾的染色體整合核酸的細(xì)胞

本公開的另一個方面提供了用于制備以上第II節(jié)中詳述的細(xì)胞的方法。所述方法包括將具有預(yù)定表觀遺傳修飾的合成核酸插入細(xì)胞的基因組中,以及任選地使對應(yīng)的內(nèi)源性序列失效(失活)或缺失。表觀遺傳修飾的核酸可以具有胞嘧啶修飾,諸如甲基化(包括5-甲基胞嘧啶(5mC)、3-甲基胞嘧啶(3mC)和5-羥甲基胞嘧啶)、5-甲?;奏?5fC)和5-羧基胞嘧啶(5caC)。在具體方面,所述修飾為胞嘧啶甲基化。與正常細(xì)胞或具有特定表型的細(xì)胞的對應(yīng)的內(nèi)源性序列中發(fā)現(xiàn)的甲基化水平相比,或與對應(yīng)于正?;虮磉_(dá)水平或異?;虮磉_(dá)水平(即,過表達(dá)或低表達(dá))的序列中發(fā)現(xiàn)的甲基化水平相比,合成核酸可以是過甲基化或低甲基化的。

表觀遺傳修飾的核酸可以在對應(yīng)的內(nèi)源性序列的基因座處插入或者可以在不同的基因座(例如,賦予了表觀遺傳修飾的核酸穩(wěn)定性的基因座)處插入。

表觀遺傳修飾的核酸可以例如完全地替換對應(yīng)的內(nèi)源性染色體序列。此類替換(內(nèi)源性序列的缺失和合成的表觀遺傳修飾序列的插入)可以使用本領(lǐng)域已知的方法(諸如使用靶向核酸內(nèi)切酶)來完成。另選地,表觀遺傳修飾的核酸可以在基因組內(nèi)有利的基因座處插入,所述有利的基因座諸如具有相鄰的絕緣元件或在染色體整合之前幫助維持表觀遺傳修飾的核酸的表觀遺傳修飾狀態(tài)(或模式)的其它遺傳元件的基因座。具有穩(wěn)定影響的基因座被稱為基因組安全港位點(diǎn),并且包括諸如AAVS1、CCR5、HPRT和ROSA26的基因座。外源性絕緣元件也可以鄰近表觀遺傳修飾的核酸放置以有助于維持所需的修飾狀態(tài)。因此,在一個方面,表觀遺傳修飾的核酸和絕緣元件都可以置于對應(yīng)的內(nèi)源性染色體序列的基因座處。如上所述,可以使用靶向性核酸內(nèi)切酶將表觀遺傳學(xué)修飾核酸整合到目標(biāo)基因組基因座中。

可以使用任何適合的靶向性核酸內(nèi)切酶以在對應(yīng)的內(nèi)源性序列的基因座或其它有利的基因座處插入表觀遺傳修飾的核酸。例如,所述靶向性核酸內(nèi)切酶可以是鋅指核酸酶、基于CRISPR的核酸內(nèi)切酶、大范圍核酸酶、轉(zhuǎn)錄激活因子樣效應(yīng)物核酸酶(TALEN)、I-TevI核酸酶或相關(guān)單體雜交體、或人工的靶向DNA雙鏈斷裂誘導(dǎo)劑。例如,當(dāng)同時插入表觀遺傳修飾的目標(biāo)核酸時,成對的鋅指核酸酶完成非同源末端連接(NHEJ)。參見,例如Orlando等,Nuc.Acids Res.,38(15):e152(2010)。另選地,可以使用修飾的RNA指導(dǎo)的核酸內(nèi)切酶或轉(zhuǎn)錄激活因子樣效應(yīng)物核酸酶(TALEN)。使用I-TevI的催化結(jié)構(gòu)域而產(chǎn)生的TALEN可以如Beurdeley等,Nat.Commun.4:1762doi:10.1038/ncomms2782(2013)中所述的那樣來制備和使用。本領(lǐng)域的普通技術(shù)人員將理解,還可以使用雜交核酸內(nèi)切酶,諸如在Kleinstiver等,PNAS 109(21):8061-6(2012)中所述的融合到鋅指核酸內(nèi)切酶或LAGLIDADG歸巢核酸內(nèi)切酶支架的I-Tev核酸酶結(jié)構(gòu)域。也可以使用人工的靶向DNA雙鏈斷裂誘導(dǎo)劑諸如在Katada等,Nuc.Acid Res.40(11):e81(2012)中所述的ARCUT(人工的限制性DNA剪切物)以在本發(fā)明方法中促進(jìn)同源重組。

本公開包括用于使用靶向性核酸內(nèi)切酶(諸如,本文所述的靶向性核酸內(nèi)切酶中的任一種)來將具有預(yù)定表觀遺傳修飾的合成核酸插入真核細(xì)胞中的方法。所述方法包括(i)將至少一種靶向性核酸內(nèi)切酶或編碼所述至少一種靶向性核酸內(nèi)切酶的核酸引入細(xì)胞中,其中每個靶向性核酸內(nèi)切酶靶向細(xì)胞的內(nèi)源性染色體序列中的位點(diǎn),以及(ii)將至少一種具有預(yù)定表觀遺傳修飾的合成核酸引入細(xì)胞中。在一些方面,所述表觀遺傳修飾的核酸可以是包含突出端的線型序列,所述突出端與由靶向性核酸內(nèi)切酶產(chǎn)生的那些突出端相匹配。在其它方面,表觀遺傳修飾的核酸可以側(cè)接與細(xì)胞基因組中的靶向裂解位點(diǎn)的一側(cè)具有基本的序列同一性的上游和下游序列。在另外的方面,表觀遺傳修飾的核酸可以側(cè)接由靶向性核酸內(nèi)切酶識別的靶位點(diǎn)。所述方法還包括培養(yǎng)細(xì)胞,使得靶向性核酸內(nèi)切酶引入至少一種雙鏈斷裂,所述雙鏈斷裂由DNA修復(fù)過程修復(fù),所述DNA修復(fù)過程導(dǎo)致表觀遺傳修飾的核酸插入靶向位點(diǎn)中和/或?qū)е掳邢蛭稽c(diǎn)處內(nèi)源性染色體序列的失活。例如,可以使用靶向性核酸內(nèi)切酶以在靶向基因座處產(chǎn)生一種雙鏈斷裂,其中包含相匹配突出端的表觀遺傳修飾的核酸與內(nèi)源性染色體序列連接,從而在靶向基因座處插入所述表觀遺傳修飾的核酸并且使所述內(nèi)源性染色體序列破裂/失活。所述靶向基因座可以對應(yīng)于表觀遺傳修飾的核酸所來源于的內(nèi)源性染色體序列,或者所述靶向基因座可以是基因組安全港位點(diǎn)。另選地,可以使用靶向性核酸內(nèi)切酶來產(chǎn)生一種雙鏈斷裂,其中將包含同源的上游和下游序列的表觀遺傳修飾的核酸通過同源介導(dǎo)的修復(fù)過程來插入裂解位點(diǎn)中。在另一方面,可以使用兩種靶向性核酸內(nèi)切酶來在目標(biāo)基因座內(nèi)的靶向位點(diǎn)處產(chǎn)生兩種雙鏈斷裂,其中表觀遺傳修飾的核酸在雙鏈斷裂的修復(fù)過程中與內(nèi)源性染色體序列交換。在又一方面,可以使用第一靶向性核酸內(nèi)切酶來在插入了表觀遺傳修飾的核酸的第一基因座處產(chǎn)生雙鏈斷裂,并且使用第二靶向性核酸內(nèi)切酶來在第二基因座處產(chǎn)生雙鏈斷裂,所述斷裂由易錯DNA修復(fù)過程修復(fù),使得在第二基因座處引入失活性突變。例如,所述第一基因座可以是賦予表觀遺傳修飾的核酸穩(wěn)定性的位點(diǎn),并且所述第二基因座可以對應(yīng)于表觀遺傳修飾的核酸所來源于的內(nèi)源性染色體序列。

(a)靶向性核酸內(nèi)切酶

在本文公開的方法中使用的靶向性核酸內(nèi)切酶的類型可以變化并且將會變化。如上所述,所述靶向性核酸內(nèi)切酶可以是大范圍核酸酶、轉(zhuǎn)錄激活因子樣效應(yīng)物核酸酶(TALEN)、I-TevI核酸酶或相關(guān)單體雜交體和人工的靶向DNA雙鏈斷裂誘導(dǎo)劑、鋅指核酸酶(ZFN)或基于CRISPR的核酸內(nèi)切酶。所述靶向性核酸內(nèi)切酶可以是天然存在的蛋白質(zhì)或工程蛋白質(zhì)。

在一些方面,所述靶向性核酸內(nèi)切酶可為大范圍核酸酶。大范圍核酸酶是以大的識別位點(diǎn)為特征的脫氧核糖核酸內(nèi)切酶,即識別位點(diǎn)通常在約12個堿基對至約40個堿基對的范圍內(nèi)。由于這個要求,識別位點(diǎn)通常僅在任何給定基因組中出現(xiàn)一次。在大范圍核酸酶中,名為LAGLIDADG的歸巢核酸內(nèi)切酶的家族已成為用于基因組和基因組工程研究的有價(jià)值工具(Chevalier等,Nuc Acids Mol.Biol.16:33-27(2005))。可以通過使用本領(lǐng)域技術(shù)人員所熟知的技術(shù)修飾大范圍核酸酶的識別序列來使所述大范圍核酸酶靶向特定染色體序列。參見,例如,Silva等,Curr.Gene Ther.11(1):11-27(2011);Baxter等,Nuc.Acids Res.40(160:7985-8000(22012)。

在其它方面,靶向性核酸內(nèi)切酶可為轉(zhuǎn)錄激活因子樣效應(yīng)物(TALE)核酸酶。TALE是來自植物病原體黃單胞菌屬(Xanthomonas)的轉(zhuǎn)錄因子,其可易于工程化以結(jié)合新的DNA靶標(biāo)。TALE或其截短形式可以連接到核酸內(nèi)切酶(諸如FokI)的催化結(jié)構(gòu)域以產(chǎn)生被稱為TALE核酸酶或TALEN的靶向性核酸內(nèi)切酶。關(guān)于另外的信息,參見,Joung等,Nature Rev.Mol.Cell Biol.14:49-55(2013)。使用I-TevI的催化結(jié)構(gòu)域而產(chǎn)生的TALEN可以如Beurdeley等,Nat.Commun.4:1762 doi:10.1038/ncomms2782(2013)所述的那樣來制備和使用。

在另外的方面,所述靶向性核酸內(nèi)切酶可以是I-TevI核酸酶或相關(guān)的單體雜交體,諸如在Kleinstiver等,PNAS,109(21):8061-6(2012)中所述的融合到鋅指核酸內(nèi)切酶或LAGLIDADG歸巢核酸內(nèi)切酶支架的I-Tev核酸酶結(jié)構(gòu)域。

在其它方面,所述靶向性核酸酶可為人工的靶向DNA雙鏈斷裂誘導(dǎo)劑??梢允褂萌斯さ陌邢駾NA雙鏈斷裂誘導(dǎo)劑諸如在Katada等,Nuc.Acid Res.40(11):e81(2012)中所述的ARCUT(人工的限制性DNA剪切物)以在本發(fā)明方法中促進(jìn)同源重組。

(i)鋅指核酸酶

在另外的方面,靶向性核酸內(nèi)切酶可為鋅指核酸酶(ZFN)。通常,鋅指核酸酶包含DNA結(jié)合結(jié)構(gòu)域(即鋅指)和裂解結(jié)構(gòu)域(即核酸酶),兩者均在以下有所描述。

鋅指結(jié)合結(jié)構(gòu)域。可以將鋅指結(jié)合結(jié)構(gòu)域工程化以識別和結(jié)合于所選擇的任何核酸序列。參見,例如Beerli等(2002)Nat.Biotechnol.20:135-141;Pabo等(2001)Ann.Rev.Biochem.70:313-340;Isalan等(2001)Nat.Biotechnol.19:656-660;Segal等(2001)Curr.Opin.Biotechnol.12:632-637;Choo等(2000)Curr.Opin.Struct.Biol.10:411-416;Zhang等(2000)J.Biol.Chem.275(43):33850-33860;Doyon等(2008)Nat.Biotechnol.26:702-708;和Santiago等(2008)Proc.Natl.Acad.Sci.USA 105:5809-5814。與天然存在的鋅指蛋白相比,工程化的鋅指結(jié)合結(jié)構(gòu)域可以具有新型的結(jié)合特異性。工程化方法包括但不限于合理的設(shè)計(jì)和各種類型的選擇。合理的設(shè)計(jì)包括例如,使用包含雙重、三重和/或四重核苷酸序列和單獨(dú)鋅指氨基酸序列的數(shù)據(jù)庫,其中每個雙重、三重或四重核苷酸序列與鋅指的結(jié)合所述具體三重或四重序列的一個或多個氨基酸序列有關(guān)。參見,例如美國專利號6,453,242和6,534,261,所述專利的公開內(nèi)容以引用的方式整體并入本文。作為實(shí)例,可以使用美國專利6,453,242中所描述的算法來設(shè)計(jì)鋅指結(jié)合結(jié)構(gòu)域以靶向預(yù)選序列。也可以使用替代方法(諸如使用非簡并識別密碼表的合理設(shè)計(jì))來設(shè)計(jì)鋅指結(jié)合結(jié)構(gòu)域以靶向特定序列(Sera等(2002)Biochemistry 41:7074-7081)。用于鑒定DNA序列中潛在的靶位點(diǎn)和設(shè)計(jì)鋅指結(jié)合結(jié)構(gòu)域的公開可用的基于網(wǎng)絡(luò)的工具分別見于www.zincfingertools.org和zifit.partners.org/ZiFiT/(Mandell等(2006)Nuc.Acid Res.34:W516-W523;Sander等(2007)Nuc.Acid Res.35:W599-W605)。

可以設(shè)計(jì)鋅指結(jié)合結(jié)構(gòu)域以識別并結(jié)合長度為約3個核苷酸至約21個核苷酸(例如長度為約9個至約18個核苷酸)范圍內(nèi)的DNA序列。每個鋅指識別區(qū)(即鋅指)識別并結(jié)合3個核苷酸。一般來講,本文公開的鋅指核酸酶的鋅指結(jié)合結(jié)構(gòu)域包含至少三個鋅指識別區(qū)(即,鋅指)。所述鋅指結(jié)合結(jié)構(gòu)域可例如包含四個鋅指識別區(qū)。另選地,鋅指結(jié)合結(jié)構(gòu)域可包含五個或六個鋅指識別區(qū)??梢栽O(shè)計(jì)鋅指結(jié)合結(jié)構(gòu)域以結(jié)合任何適合的靶DNA序列。參見例如美國專利號6,607,882;6,534,261和6,453,242,所述專利的公開內(nèi)容以引用的方式整體并入本文。

選擇鋅指識別區(qū)的示例性方法包括噬菌體展示和雙雜交系統(tǒng),并且在美國專利號5,789,538;5,925,523;6,007,988;6,013,453;6,410,248;6,140,466;6,200,759和6,242,568以及WO 98/37186;WO 98/53057;WO 00/27878;WO 01/88197和GB 2,338,237中有所公開,所述專利中的每個均以引用的方式整體并入本文。此外,已在例如WO02/077227中描述了鋅指結(jié)合結(jié)構(gòu)域的結(jié)合特異性的增強(qiáng),所述專利的公開內(nèi)容以引用的方式整體并入本文。

用于設(shè)計(jì)和構(gòu)造融合蛋白(和其編碼多核苷酸)的鋅指結(jié)合結(jié)構(gòu)域和方法是本領(lǐng)域技術(shù)人員己知的,并且詳細(xì)描述于美國專利申請公布號20050064474和20060188987中,各所述專利均以引用的方式整體并入本文??梢允褂眠m合的接頭序列(包括例如長度為五個或更多個氨基酸的接頭)將鋅指識別區(qū)和/或多指鋅指蛋白連接在一起。關(guān)于長度為六個或更多個氨基酸的接頭序列的非限制性實(shí)例參見美國專利號6,479,626;6,903,185;和7,153,949,所述專利的公開內(nèi)容以引用的方式整體并入本文。本文所述的鋅指結(jié)合結(jié)構(gòu)域可以包括蛋白質(zhì)的個別鋅指(和另外的結(jié)構(gòu)域)之間的適合的接頭的組合。

裂解結(jié)構(gòu)域。鋅指核酸酶也包括裂解結(jié)構(gòu)域。鋅指核酸酶的裂解結(jié)構(gòu)域部分可從任何核酸內(nèi)切酶或核酸外切酶獲得。裂解結(jié)構(gòu)域可來源于的核酸內(nèi)切酶的非限制性實(shí)例包括但不限于限制性核酸內(nèi)切酶和歸巢核酸內(nèi)切酶。參見,例如New England Biolabs目錄(www.neb.com)或Belfort等(1997)Nucleic Acids Res.25:3379-3388。裂解DNA的其它酶是己知的(例如,S1核酸酶、綠豆核酸酶、胰腺DNA酶I、微球菌核酸酶、酵母HO核酸內(nèi)切酶)。另參見Linn等(編)Nucleases,Cold Spring Harbor Laboratory Press,1993。這些酶(或其功能片段)中的一個或多個可以用作裂解結(jié)構(gòu)域的來源。

裂解結(jié)構(gòu)域還可以來源于出于裂解活性需要二聚化的如上所述的酶或其部分。裂解可能需要兩個鋅指核酸酶,因?yàn)槊總€核酸酶包含活性酶二聚體的單體。另選地,單一鋅指核酸酶可包含兩個單體以產(chǎn)生活性酶二聚體。如本文所用,“活性酶二聚體”是能夠裂解核酸分子的酶二聚體。兩個裂解單體可以來源于相同核酸內(nèi)切酶(或其功能片段),或每個單體可以來源于不同的核酸內(nèi)切酶(或其功能片段)。

當(dāng)使用兩個裂解單體來形成活性酶二聚體時,兩個鋅指核酸酶的識別位點(diǎn)優(yōu)選經(jīng)布置以便兩個鋅指核酸酶與其各自識別位點(diǎn)的結(jié)合使裂解單體彼此置于允許裂解單體例如通過二聚化來形成活性酶二聚體的空間定向中。因此,識別位點(diǎn)的近側(cè)邊緣可以由約5個至約18個核苷酸隔開。例如,近側(cè)邊緣可由約5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17或18個核苷酸隔開。然而,應(yīng)當(dāng)理解,任何整數(shù)個核苷酸或核苷酸對(例如約2個至約50個核苷酸對或更多個核苷酸對)都可插入兩個識別位點(diǎn)之間。例如像本文詳細(xì)描述的鋅指核酸酶的識別位點(diǎn)的近側(cè)邊緣可由6個核苷酸隔開。一般來講,裂解位點(diǎn)位于識別位點(diǎn)之間。

限制核酸內(nèi)切酶(限制酶)存在于許多物種中,并且能夠序列特異性地結(jié)合DNA(在識別位點(diǎn)處)以及在結(jié)合位點(diǎn)處或附近裂解DNA。某些限制酶(例如,IIS型)在遠(yuǎn)離識別位點(diǎn)的位點(diǎn)處裂解DNA,并且具有可分開的結(jié)合結(jié)構(gòu)域和裂解結(jié)構(gòu)域。例如,IIS型酶FokI在距它的一條鏈上的識別位點(diǎn)9個核苷酸處和在距它的另一條鏈上的識別位點(diǎn)13個核苷酸處催化DNA的雙鏈裂解。參見,例如美國專利號5,356,802;5,436,150和5,487,994;以及Li等(1992)Proc.Natl.Acad.Sci.USA 89:4275-4279;Li等(1993)Proc.Natl.Acad.Sci.USA90:2764-2768;Kim等(1994a)Proc.Natl.Acad.Sci.USA 91:883-887;Kim等(1994b)J.Biol.Chem.269:31,978-31,982。因此,鋅指核酸酶可以包含來自至少一個IIS型限制酶的裂解結(jié)構(gòu)域以及一個或多個可經(jīng)或不可經(jīng)工程化的鋅指結(jié)合結(jié)構(gòu)域。示例性IIS型限制酶在例如國際公布WO 07/014,275中描述,所述公布的公開內(nèi)容以引用方式整體并入本文。另外的限制酶也含有可分開的結(jié)合結(jié)構(gòu)域和裂解結(jié)構(gòu)域,并且本公開也設(shè)想了這些酶。參見,例如Roberts等(2003)Nucleic Acids Res.31:418-420。

裂解結(jié)構(gòu)域可與結(jié)合結(jié)構(gòu)域分開的示例性IIS型限制酶是FokI。這種特定的酶以二聚體的形式起作用(Bitinaite等(1998)Proc.Natl.Acad.Sci.USA 95:10,570-10,575)。因此,出于本公開的目的,在鋅指核酸酶中使用的FokI酶的部分被認(rèn)為是裂解單體。因此,對于使用FokI裂解結(jié)構(gòu)域的靶向的雙鏈裂解,可以使用兩個各自包含F(xiàn)okI裂解單體的鋅指核酸酶以重構(gòu)活性酶二聚體。另選地,也可使用含有鋅指結(jié)合結(jié)構(gòu)域和兩個FokI裂解單體的單一多肽分子。

裂解結(jié)構(gòu)域可以包含一個或多個最大限度地減少或阻止均二聚化的工程化裂解單體,如例如在美國專利公布號20050064474、20060188987和20080131962中所描述的,所述專利中的每個均以引用的方式整體并入本文。通過非限制實(shí)例,在FokI的位置446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537和538處的氨基酸殘基都是用于影響FokI裂解半結(jié)構(gòu)域的二聚化的靶標(biāo)。形成專性雜二聚體的FokI的示例性工程化裂解單體包括成對單體,其中第一裂解單體包括在FokI的氨基酸殘基位置490和538處的突變并且第二裂解單體包括在氨基酸殘基位置486和499處的突變(Miller等,2007,Nat.Biotechnol,25:778-785;Szczpek等,2007,Nat.Biotechnol,25:786-793)。例如,在一個結(jié)構(gòu)域(E490K、1538K)中,位置490處的Glu(E)可以變成Lys(K)并且位置538處的Ile(I)可以變成K,并且在另一個裂解結(jié)構(gòu)域(Q486E、I499L)中,位置486處的Gln(Q)可以變成E并且在位置499處的I可以變成Leu(L)。在另一方面,修飾的FokI裂解結(jié)構(gòu)域可以包含三個氨基酸變化(Doyon等2011,Nat.Methods,8:74-81)。例如,一個修飾的FokI裂解結(jié)構(gòu)域(其被稱為ELD)可以包含Q486E、I499L、N496D突變,并且另一個修飾的FokI裂解結(jié)構(gòu)域(其被稱為KKR)可以包含E490K、I538K、H537R突變。

另外的結(jié)構(gòu)域。在一些方面,鋅指核酸酶還包含至少一種核定位信號或序列(NLS)。NLS是促進(jìn)鋅指核酸酶蛋白質(zhì)轉(zhuǎn)運(yùn)到真核細(xì)胞的細(xì)胞核中的氨基酸序列。一般來講,NLS包含一段堿性氨基酸。核定位信號在本領(lǐng)域是已知的(參見,例如Makkerh等人(1996)Current Biology 6:1025-1027;Lange等,J.Biol.Chem.,2007,282:5101-5105)。例如,在一個實(shí)施方案中,NLS可以是單分型序列,諸如PKKKRKV(SEQ ID NO:1)或PKKKRRV(SEQ ID NO:2)。在另一個實(shí)施方案中,NLS可以是二分型序列。在又一個實(shí)施方案中,NLS可以是KRPAATKKAGQAKKKK(SEQ ID NO:3)。NLS可以位于鋅指核酸酶的N末端、C末端或內(nèi)部位置中。

在其它方面,鋅指核酸酶也可以包含至少一個細(xì)胞穿透結(jié)構(gòu)域。在一個實(shí)施方案中,細(xì)胞穿透結(jié)構(gòu)域可以是來源于HIV-1TAT蛋白的細(xì)胞穿透肽序列。例如,TAT細(xì)胞穿透序列可以是GRKKRRQRR RPPQPKKKRKV(SEQ ID NO:4)。在另一個實(shí)施方案中,細(xì)胞穿透結(jié)構(gòu)域可以是TLM(PLSSIFSRIGDPPKKKRKV;SEQ ID NO:5),一種來源于人乙型肝炎病毒的細(xì)胞穿透肽序列。在又一實(shí)施方案中,細(xì)胞穿透結(jié)構(gòu)域可以是MPG(GALFLGWLGAAGSTMGAPKKKRKV;SEQ ID NO:6或GALFLGFLGAAGSTMGAWSQPKKKRKV;SEQ I D NO:7)。在另外的實(shí)施方案中,細(xì)胞穿透結(jié)構(gòu)域可以是Pep-1(KET WWETWWTEWSQPKKKRKV;SEQ ID NO:8)、VP22,一種來源于單純皰疹病毒的細(xì)胞穿透肽或聚精氨酸肽序列。細(xì)胞穿透結(jié)構(gòu)域可位于蛋白的N末端、C末端或內(nèi)部位置中。

在其它方面,鋅指核酸酶還可以包含至少一個標(biāo)記結(jié)構(gòu)域。標(biāo)記結(jié)構(gòu)域的非限制性實(shí)例包括熒光蛋白、純化標(biāo)簽和表位標(biāo)簽。在一個實(shí)施方案中,標(biāo)記結(jié)構(gòu)域可為熒光蛋白。適合的熒光蛋白的非限制性實(shí)例包括綠色熒光蛋白(例如,GFP、GFP-2、tagGFP、turboGFP、EGFP、Emerald、Azami Green、單體Azami Green、CopGFP、AceGFP、ZsGreen1)、黃色熒光蛋白(例如YFP、EYFP、Citrine、Venus、YPet、PhiYFP、ZsYellow1)、藍(lán)色熒光蛋白(例如EBFP、EBFP2、Azurite、mKalama1、GFPuv、Sapphire、T-sapphire)、青色熒光蛋白(例如ECFP、Cerulean、CyPet、AmCyan1、Midoriishi-Cyan)、紅色熒光蛋白(mKate、mKate2、mPlum、DsRed單體、mCherry、mRFP1、DsRed-Express、DsRed2、DsRed-單體、HcRed-Tandem、HcRed1、AsRed2、eqFP611、mRasberry、mStrawberry、Jred)以及橙色熒光蛋白(mOrange、mKO、Kusabira-Orange、單體Kusabira-Orange、mTangerine、tdTomato)或任何其它適合的熒光蛋白。在另一個實(shí)施方案中,標(biāo)記結(jié)構(gòu)域可以是純化標(biāo)簽和/或表位標(biāo)簽。適合的標(biāo)簽包括但不限于,谷胱甘肽-S-轉(zhuǎn)移酶(GST)、幾丁質(zhì)結(jié)合蛋白(CBP)、麥芽糖結(jié)合蛋白、硫氧還蛋白(TRX)、聚(NANP)、串聯(lián)親和純化(TAP)標(biāo)簽、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、HA、nus、Softag 1、Softag 3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、6xHis、生物素羧基載體蛋白(BCCP)和鈣調(diào)蛋白。標(biāo)記結(jié)構(gòu)域可以位于鋅指核酸酶蛋白的N末端、C末端或內(nèi)部位置中。

(ii)基于CRISPR的核酸內(nèi)切酶

在其它方面,靶向性核酸內(nèi)切酶可以是基于CRISPR的核酸內(nèi)切酶,其包含至少一個允許核酸內(nèi)切酶進(jìn)入真核細(xì)胞的細(xì)胞核內(nèi)的核定位信號?;贑RISPR的核酸內(nèi)切酶是RNA指導(dǎo)的核酸內(nèi)切酶,其包含至少一個核酸酶結(jié)構(gòu)域和至少一個與指導(dǎo)RNA相互作用的結(jié)構(gòu)域。指導(dǎo)RNA將基于CRISPR的核酸內(nèi)切酶定向到核酸的靶向位點(diǎn),在所述位點(diǎn)基于CRISPR的核酸內(nèi)切酶裂解靶向的核酸序列中的至少一條鏈。由于指導(dǎo)RNA為靶向裂解提供特異性,那么基于CRISPR的核酸內(nèi)切酶是普適的,并且可以與不同的指導(dǎo)RNA一起使用以裂解不同的靶核酸序列。

基于CRISPR的核酸內(nèi)切酶是來源于CRISPR/Cas系統(tǒng)的RNA指導(dǎo)的核酸內(nèi)切酶。細(xì)菌和古細(xì)菌已經(jīng)進(jìn)化了基于RNA的適應(yīng)性免疫系統(tǒng),其使用CRISPR(規(guī)律成簇的交替的短回文重復(fù))和Cas(CRISPR有關(guān)的)蛋白以檢測和消滅入侵的病毒或質(zhì)粒??梢酝ㄟ^提供靶向特異性的合成指導(dǎo)RNA編程CRISPR/Cas核酸內(nèi)切酶以引入靶向的位點(diǎn)特異性的雙鏈斷裂(Jinek等,2012,Science,337:816-821)。

基于CRISPR的核酸內(nèi)切酶可以來源于CRISPR/Cas I型、II型或III型系統(tǒng)。適合的CRISPR/Cas蛋白的非限制性實(shí)例包括Cas3、Cas4、Cas5、Cas5e(或CasD)、Cas6、Cas6e、Cas6f、Cas7、Cas8a1、Cas8a2、Cas8b、Cas8c、Cas9、Cas10、Cas10d、CasF、CasG、CasH、Csy1、Csy2、Csy3、Cse1(或CasA)、Cse2(或CasB)、Cse3(或CasE)、Cse4(或CasC)、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csz1、Csx15、Csf1、Csf2、Csf3、Csf4和Cu1966。

在一個實(shí)施方案中,基于CRISPR的核酸內(nèi)切酶來源于II型CRISPR/Cas系統(tǒng)。在示例性實(shí)施方案中,基于CRISPR的核酸內(nèi)切酶來源于Cas9蛋白。Cas9蛋白可以來源于釀膿鏈球菌(Streptococcus pyogenes)、嗜熱鏈球菌(Streptococcus thermophilus)、鏈球菌屬種(Streptococcus sp.)、達(dá)松維爾擬諾卡氏菌(Nocardiopsis dassonvillei)、始旋鏈霉菌(Streptomyces pristinaespiralis)、綠產(chǎn)色鏈霉菌(Streptomyces viridochromogenes)、綠產(chǎn)色鏈霉菌(Streptomyces viridochromogenes)、玫瑰鏈孢囊菌(Streptosporangium roseum)、玫瑰鏈孢囊菌(Streptosporangium roseum)、酸熱脂環(huán)酸芽孢桿菌(Alicyclobacillus acidocaldarius)、假蕈狀芽孢桿菌(Bacillus pseudomycoides)、還原硒酸鹽芽抱桿菌(Bacillus selenitireducens)、西伯利亞微小桿菌(Exiguobacterium sibiricum)、德氏乳桿菌(Lactobacillus delbrueckii)、唾液乳桿菌(Lactobacillus salivarius)、海洋微顫菌(Microscilla marina)、伯克氏菌目細(xì)菌(Burkholderiales bacterium)、萘降解極地單胞菌(Polaromonas naphthalenivorans)、極地單胞菌屬種(Polaromonas sp.)、瓦氏鱷球藻(Crocosphaera watsonii)、藍(lán)桿藻屬種(Cyanothece sp.)、銅綠微囊藻(Microcystis aeruginosa)、聚球藻屬種(Synechococcus sp.)、阿拉伯糖醋鹽桿菌(Acetohalobium arabaticum)、丹氏制氨菌(Ammonifex degensii)、Caldicelulosiruptor becscii、暫定種金礦菌(Candidatus Desulforudis)、肉毒梭菌(Clostridium botulinum)、艱難梭菌(Clostridium difficile)、大芬戈?duì)柕戮?Finegoldia magna)、嗜熱鹽堿厭氧菌(Natranaerobius thermophilus)、熱丙酸鹽暗色厭氧香腸狀菌(Pelotomaculum thermopropionicum)、喜溫酸硫桿菌(Acidithiobacillus caldus)、氧化亞鐵酸硫桿菌(Acidithiobacillus ferrooxidans)、酒色異著色菌(Allochromatium vinosum)、海桿菌屬種(Marinobacter sp.)、嗜鹽亞硝化球菌(Nitrosococcus halophilus)、瓦氏亞硝化球菌(Nitrosococcus watsoni)、游海假交替單胞菌(Pseudoalteromonas haloplanktis)、消旋纖線桿菌(Ktedonobacter racemifer)、調(diào)查甲烷鹽菌(Methanohalobium evestigatum)、多變魚腥藻(Anabaena variabilis)、泡沫節(jié)球藻(Nodularia spumigena)、念珠藻屬種(Nostoc sp.)、極大節(jié)旋藻(Arthrospira maxima)、鈍頂節(jié)旋藻(Arthrospira platensis)、節(jié)旋藻屬種(Arthrospira sp.)、鞘絲藻屬種(Lyngbya sp.)、原形微鞘藻(Microcoleus chthonoplastes)、顫藻屬種(Oscillatoria sp.)、運(yùn)動石袍菌(Petrotoga mobilis)、非洲棲熱腔菌(Thermosipho africanus)或海洋無核綠藻(Acaryochloris marina)。在一個具體實(shí)施方案中,基于CRISPR的核酸酶來源于釀膿鏈球菌的Cas9蛋白。

一般來講,CRISPR/Cas蛋白包含至少一個RNA識別和/或RNA結(jié)合結(jié)構(gòu)域。RNA識別和/或RNA結(jié)合結(jié)構(gòu)域與指導(dǎo)RNA相互作用使得CRISPR/Cas蛋白定向到特定基因組或基因組序列。CRISPR/Cas蛋白也可以包含核酸酶結(jié)構(gòu)域(即DNA酶或RNA酶結(jié)構(gòu)域)、DNA結(jié)合結(jié)構(gòu)域、螺旋酶結(jié)構(gòu)域、蛋白質(zhì)相互作用結(jié)構(gòu)域、二聚化結(jié)構(gòu)域以及其它結(jié)構(gòu)域。

本文使用的基于CRISPR的核酸內(nèi)切酶可以是野生型CRISPR/Cas蛋白、修飾的CRISPR/Cas蛋白、或野生型或修飾的CRISPR/Cas蛋白的片段??梢孕揎桟RISPR/Cas蛋白以增加核酸結(jié)合親和性和/或特異性,改變酶活性,和/或修改蛋白質(zhì)的另一特性。例如,CRISPR/Cas蛋白的核酸酶(即DNA酶、RNA酶)結(jié)構(gòu)域可以是修飾的、缺失的或失活的。可以截短CRISPR/Cas蛋白以去除對蛋白質(zhì)的功能不必要的結(jié)構(gòu)域。也可以截短或修飾CRISPR/Cas蛋白以優(yōu)化蛋白質(zhì)的活性或與CRISPR/Cas蛋白融合的效應(yīng)子結(jié)構(gòu)域。

在一些實(shí)施方案中,基于CRISPR的核酸內(nèi)切酶可以來源于野生型Cas9蛋白或其片段。在其它實(shí)施方案中,基于CRISPR的核酸內(nèi)切酶可以來源于修飾的Cas9蛋白。例如,可以修飾Cas9蛋白的氨基酸序列以改變蛋白質(zhì)的一種或多種特性(例如,核酸酶活性、親和性、穩(wěn)定性等等)。另選地,可以將不涉及RNA指導(dǎo)的裂解的Cas9蛋白的結(jié)構(gòu)域從蛋白質(zhì)中消除,使得修飾的Cas9蛋白小于野生型Cas9蛋白。

一般來講,Cas9蛋白包含至少兩個核酸酶(即DNA酶)結(jié)構(gòu)域。例如,Cas9蛋白可以包含RuvC樣核酸酶結(jié)構(gòu)域和HNH樣核酸酶結(jié)構(gòu)域。RuvC和HNH結(jié)構(gòu)域一起作用來剪切單鏈以在DNA中完成雙鏈斷裂(Jinek等,2012,Science,337:816-821)。在一個實(shí)施方案中,基于CRISPR的核酸內(nèi)切酶來源于Cas9蛋白并且包含兩個功能核酸酶結(jié)構(gòu)域,所述兩個功能核酸酶結(jié)構(gòu)域一起將雙鏈斷裂引入靶向位點(diǎn)。

靶位點(diǎn)由天然存在的通常具有約14-15bp長度的CRISPR/Cas系統(tǒng)識別(Cong等,2013,Science,339:819-823)。除了與指導(dǎo)RNA的5'末端互補(bǔ)的序列(即,稱為原型間隔區(qū)序列)之后緊跟著(3'或下游)共有序列之外,靶位點(diǎn)沒有序列限制。此共有序列又稱為原型間隔區(qū)相鄰基序(或PAM)。PAM的實(shí)例包括但不限于,NGG、NGGNG和NNAGAAW(其中N被定義為任何核苷酸,并且W被定義為A或T)。在典型長度時,在靶基因組內(nèi)僅靶位點(diǎn)的約5%-7%會是獨(dú)特的,這表明脫靶效應(yīng)可能是顯著的??梢酝ㄟ^需要兩個結(jié)合事件延伸靶位點(diǎn)的長度。例如,可以修飾基于CRISPR的核酸內(nèi)切酶使得它們僅可以裂解雙鏈序列的一條鏈(即轉(zhuǎn)變?yōu)榍锌诿?。因此,基于CRISPR的切口酶與兩個不同的指導(dǎo)RNA結(jié)合使用將會基本上加倍靶位點(diǎn)的長度,同時仍然執(zhí)行雙鏈斷裂。

在一些實(shí)施方案中,可以修飾Cas9來源的核酸內(nèi)切酶以僅含有一個功能核酸酶結(jié)構(gòu)域(RuvC樣或HNH樣核酸酶結(jié)構(gòu)域)。例如,可以修飾Cas9來源的蛋白質(zhì)使得核酸酶結(jié)構(gòu)域中的一個缺失或突變,使它不再有功能性(即所述結(jié)構(gòu)域缺乏核酸酶活性)。在一些實(shí)施方案中,其中核酸酶結(jié)構(gòu)域中的一個失活,Cas9來源的蛋白質(zhì)能夠?qū)⑶锌谝腚p鏈核酸中(此蛋白被稱為“切口酶”),但是不能裂解雙鏈DNA。例如,RuvC樣結(jié)構(gòu)域中的天冬氨酸向丙氨酸(D10A)的轉(zhuǎn)變將Cas9來源的蛋白質(zhì)轉(zhuǎn)變?yōu)椤癏NH”切口酶。同樣,HNH結(jié)構(gòu)域中的組氨酸向丙氨酸(H840A)的轉(zhuǎn)變(在一些情況下,組氨酸位于位置839)將Cas9來源的蛋白質(zhì)轉(zhuǎn)變?yōu)椤癛uvC”切口酶。因此,例如,在一個實(shí)施方案中,Cas9來源的切口酶在RuvC樣結(jié)構(gòu)域中具有天冬氨酸至丙氨酸(D10A)的轉(zhuǎn)變。在另一個實(shí)施方案中,Cas9來源的切口酶在HNH結(jié)構(gòu)域中具有組氨酸向丙氨酸(H840A或H839A)的轉(zhuǎn)變??梢允褂檬熘姆椒ㄐ揎桟as9來源的切口酶的RuvC樣和HNH樣核酸酶結(jié)構(gòu)域,所述方法諸如定點(diǎn)誘變、PCR介導(dǎo)的誘變和全基因合成以及本領(lǐng)域中已知的其它方法。

在其它實(shí)施方案中,基于CRISPR的核酸內(nèi)切酶的兩個核酸酶結(jié)構(gòu)域都可以被突變、失活或缺失,并且所得到的蛋白質(zhì)可以與異源的裂解結(jié)構(gòu)域結(jié)合以產(chǎn)生基于CRISPR的融合蛋白。因此,通過指導(dǎo)RNA將所得的融合蛋白導(dǎo)向靶位點(diǎn),并且通過異源的裂解結(jié)構(gòu)域介導(dǎo)裂解。在某些實(shí)施方案中,異源的裂解結(jié)構(gòu)域可以來源于II-S型核酸內(nèi)切酶。II-S型核酸內(nèi)切酶在通常距離識別位點(diǎn)若干個堿基對的位點(diǎn)裂解DNA,并且本身具有可分開的識別結(jié)構(gòu)域和裂解結(jié)構(gòu)域。這些酶一般是單體,所述單體瞬時締合形成二聚體以在交錯位置裂解DNA的每條鏈。適合的II-S型核酸內(nèi)切酶的非限制性實(shí)例包括BfiI、BpmI、BsaI、BsgI、BsmBI、BsmI、BspMI、FokI、MboII和SapI。在示例性方面,融合蛋白的裂解結(jié)構(gòu)域是FokI裂解結(jié)構(gòu)域或其衍生物,這在以上第(III)節(jié)(a)(i)中有所詳述。

一般來講,基于CRISPR的核酸內(nèi)切酶包含至少一種核定位信號或序列(NLS)。適合的NLS包括但不限于PKKKRKV(SEQ ID NO:1)、PKKKRRV(SEQ ID NO:2)和KRPAATKKAGQAKKKK(SEQ ID NO:3)。NLS可位于基于CRISPR的核酸內(nèi)切酶的N末端、C末端或內(nèi)部位置中。

另外的結(jié)構(gòu)域。在其它方面,基于CRISPR的核酸內(nèi)切酶也可以包含至少一種細(xì)胞穿透結(jié)構(gòu)域。在一個實(shí)施方案中,細(xì)胞穿透結(jié)構(gòu)域可以是來源于HIV-1TAT蛋白的細(xì)胞穿透肽序列。例如,TAT細(xì)胞穿透序列可以是GRKKRRQRRRPPQPKKKRKV(SEQ ID NO:4)。在另一個實(shí)施方案中,細(xì)胞穿透結(jié)構(gòu)域可以是TLM(PLSSIFSRIGDPPK KKRKV;SEQ ID NO:5),一種來源于人乙型肝炎病毒的細(xì)胞穿透肽序列。在又一實(shí)施方案中,細(xì)胞穿透結(jié)構(gòu)域可以是MPG(GALFLG WLGAAGSTMGAPKKKRKV;SEQ ID NO:6或GALFLGFLGAAGS TMGAWSQPKKKRKV;SEQ ID NO:7)。在另外的實(shí)施方案中,細(xì)胞穿透結(jié)構(gòu)域可以是Pep-1(KETWWETWWTEWSQPKKKRKV;SE Q ID NO:8)、VP22,一種來源于單純皰疹病毒的細(xì)胞穿透肽或聚精氨酸肽序列。細(xì)胞穿透結(jié)構(gòu)域可以位于基于CRISPR的核酸內(nèi)切酶的N末端、C末端或內(nèi)部位置中

在其它實(shí)施方案中,基于CRISPR的核酸內(nèi)切酶可以包含至少一個標(biāo)記結(jié)構(gòu)域。標(biāo)記結(jié)構(gòu)域的非限制性實(shí)例包括熒光蛋白、純化標(biāo)簽和表位標(biāo)簽。在一個實(shí)施方案中,標(biāo)記結(jié)構(gòu)域可為熒光蛋白。適合的熒光蛋白的非限制性實(shí)例包括綠色熒光蛋白(例如,GFP、GFP-2、tagGFP、turboGFP、EGFP、Emerald、Azami Green、單體Azami Green、CopGFP、AceGFP、ZsGreen1)、黃色熒光蛋白(例如YFP、EYFP、Citrine、Venus、YPet、PhiYFP、ZsYellow1)、藍(lán)色熒光蛋白(例如EBFP、EBFP2、Azurite、mKalama1、GFPuv、Sapphire、T-sapphire)、青色熒光蛋白(例如ECFP、Cerulean、CyPet、AmCyan1、Midoriishi-Cyan)、紅色熒光蛋白(mKate、mKate2、mPlum、DsRed單體、mCherry、mRFP1、DsRed-Express、DsRed2、DsRed-單體、HcRed-Tandem、HcRed1、AsRed2、eqFP611、mRasberry、mStrawberry、Jred)以及橙色熒光蛋白(mOrange、mKO、Kusabira-Orange、單體Kusabira-Orange、mTangerine、tdTomato)或任何其它適合的熒光蛋白。在另一個實(shí)施方案中,標(biāo)記結(jié)構(gòu)域可以是純化標(biāo)簽和/或表位標(biāo)簽。適合的標(biāo)簽包括但不限于,谷胱甘肽-S-轉(zhuǎn)移酶(GST)、幾丁質(zhì)結(jié)合蛋白(CBP)、麥芽糖結(jié)合蛋白、硫氧還蛋白(TRX)、聚(NANP)、串聯(lián)親和純化(TAP)標(biāo)簽、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、HA、nus、Softag1、Softag 3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、6xHis、生物素羧基載體蛋白(BCCP)和鈣調(diào)蛋白。標(biāo)記結(jié)構(gòu)域可位于蛋白質(zhì)的N末端、C末端或內(nèi)部位置中。

指導(dǎo)RNA。基于CRISPR的核酸內(nèi)切酶還需要至少一個將基于CRISPR的核酸內(nèi)切酶定向到特定靶位點(diǎn)的指導(dǎo)RNA,在所述位點(diǎn)處基于CRISPR的核酸內(nèi)切酶裂解靶向序列中的至少一條鏈。除了序列之后緊跟著(在下游)共有序列之外,靶位點(diǎn)沒有序列限制性。此共有序列又稱為原型間隔區(qū)相鄰基序(PAM)。PAM的實(shí)例包括但不限于,NGG、NGGNG和NNAGAAW(其中N被定義為任何核苷酸,并且W被定義為A或T)。靶位點(diǎn)可以處于基因的編碼區(qū)、基因的啟動子控制元件、基因的內(nèi)含子、基因之間的控制區(qū)等等。

指導(dǎo)RNA包含三個區(qū):與靶位點(diǎn)處的序列互補(bǔ)的5'端的第一區(qū),形成莖環(huán)結(jié)構(gòu)的第二內(nèi)部區(qū)以及基本上保持單鏈的第三3'區(qū)。每個指導(dǎo)RNA的第一區(qū)都不同,使得每個指導(dǎo)RNA將基于CRISPR的核酸內(nèi)切酶導(dǎo)向特定靶位點(diǎn)。每個指導(dǎo)RNA的第二區(qū)和第三區(qū)在所有指導(dǎo)RNA中可以相同。

指導(dǎo)RNA的第一區(qū)與靶位點(diǎn)的序列互補(bǔ)使得指導(dǎo)RNA的第一區(qū)與靶位點(diǎn)的序列堿基配對。在各種實(shí)施方案中,指導(dǎo)RNA的第一區(qū)可以包含10個核苷酸至多于約25個核苷酸。例如,在基因組序列中指導(dǎo)RNA的第一區(qū)與靶位點(diǎn)之間的堿基配對的區(qū)域的長度可以為約10、11、12、13、14、15、16、17、18、19、20、22、23、24、25或多于25個核苷酸。在一個示例性實(shí)施方案中,指導(dǎo)RNA的第一區(qū)的長度為約20個核苷酸。

指導(dǎo)RNA也包含形成次級結(jié)構(gòu)的第二區(qū)。在一些實(shí)施方案中,所述次級結(jié)構(gòu)包含莖(或發(fā)夾結(jié)構(gòu))和環(huán)。莖和環(huán)的長度可以變化。例如,環(huán)的長度可為約3至約10個核苷酸,并且莖的長度可以在約6至約20個堿基對的范圍內(nèi)。莖可以包含1至10個核苷酸的一個或多個突起。因此,第二區(qū)的總長度可以在約16至約60個核苷酸的長度范圍內(nèi)。在一個示例性實(shí)施方案中,環(huán)的長度為約4個核苷酸,并且莖包含約12個堿基對。

指導(dǎo)RNA在3'末端也包含基本上保持單鏈的第三區(qū)。因此,第三區(qū)與目標(biāo)細(xì)胞中的任何基因組序列都沒有互補(bǔ)性,并且與指導(dǎo)RNA的其余部分也沒有互補(bǔ)性。第三區(qū)的長度可以變化。一般來講,第三區(qū)的長度多于約4個核苷酸。例如,第三區(qū)的長度可以在約5至約30個核苷酸的長度范圍內(nèi)。

在一些實(shí)施方案中,指導(dǎo)RNA包含一個分子。在其它實(shí)施方案中,指導(dǎo)RNA可以包含兩個分開的分子。第一RNA分子可以包含指導(dǎo)RNA的第一區(qū)和指導(dǎo)RNA的第二區(qū)的“莖”的一半。第二RNA分子可以包含指導(dǎo)RNA的第二區(qū)的“莖”的另一半和指導(dǎo)RNA的第三區(qū)。因此,在本實(shí)施方案中,第一和第二RNA分子各自含有彼此互補(bǔ)的核苷酸序列。例如,在一個實(shí)施方案中,第一和第二RNA分子各自包含與其它序列堿基配對以形成功能性指導(dǎo)RNA的序列(具有約6個至約20個核苷酸)。

(b)向細(xì)胞中遞送靶向性核酸內(nèi)切酶和合成DNA

所述方法包括將至少一種靶向性核酸內(nèi)切酶或編碼至少一種靶向性核酸內(nèi)切酶的核酸引入細(xì)胞中。適合的細(xì)胞在以上第(II)節(jié)(a)中有所詳述。在一些方面,可以將靶向性核酸內(nèi)切酶作為純化的分離蛋白引入細(xì)胞中。在此類情況下,靶向性核酸內(nèi)切酶還可以包含至少一個細(xì)胞穿透結(jié)構(gòu)域。細(xì)胞穿透結(jié)構(gòu)域的實(shí)例在以上描述鋅指核酸酶和基于CRISPR的核酸內(nèi)切酶的章節(jié)中詳述??梢允褂帽绢I(lǐng)域熟知的技術(shù)在細(xì)菌或真核細(xì)胞中表達(dá)或純化靶向性核酸內(nèi)切酶。

在其它方面,可以將靶向性核酸內(nèi)切酶作為核酸引入細(xì)胞中。核酸可以是DNA或RNA。在編碼核酸是mRNA的方面,mRNA可被5'加帽和/或3'聚腺苷酸化。在靶向性核酸內(nèi)切酶是鋅指核酸酶的實(shí)施方案中,編碼核酸可以是mRNA。編碼鋅指核酸酶的mRNA可以被5'加帽和3'聚腺苷酸化。用于制備RNA的方法以及用于mRNA加帽和多腺苷酸化的方法在本領(lǐng)域中是已知的。

在另外的方面,編碼靶向性核酸內(nèi)切酶的核酸可以是DNA。DNA可以是線型的或環(huán)狀的。在某些方面,編碼靶向性核酸內(nèi)切酶的DNA可以是載體的一部分。適合的載體包括質(zhì)粒載體、噬菌粒、粘粒、人工/微型染色體、轉(zhuǎn)座子以及病毒載體。在非限制性實(shí)例中,編碼靶向性核酸內(nèi)切酶的DNA存在于質(zhì)粒載體中。適合的質(zhì)粒載體的非限制性實(shí)例包括pUC、pBR322、pET、pBluscript及其變體。將編碼靶向性核酸內(nèi)切酶的DNA可操作地連接至至少一個表達(dá)控制序列。特別是,可以將DNA編碼序列可操作地連接至用于目標(biāo)細(xì)胞中表達(dá)的啟動子控制序列。啟動子控制序列可以是組成型的、調(diào)控型的或組織特異性的。適合的組成型啟動子控制序列包括但不限于巨細(xì)胞病毒立即早期啟動子(CMV)、猿猴病毒(SV40)啟動子、腺病毒主要晚期啟動子、勞斯(Rous)氏肉瘤病毒(RSV)啟動子、小鼠乳腺腫瘤病毒(MMTV)啟動子、磷酸甘油酸激酶(PGK)啟動子、延伸因子(ED1)-α啟動子、泛素蛋白啟動子、肌動蛋白啟動子、微管蛋白啟動子、免疫球蛋白啟動子、其片段或前述任一者的組合。適合的調(diào)控型啟動子控制序列的實(shí)例包括但不限于被熱休克、金屬、類固醇、抗生素或乙醇調(diào)控的那些調(diào)控型啟動子控制序列。組織特異性啟動子的非限制性實(shí)例包括B29啟動子、CD14啟動子、CD43啟動子、CD45啟動子、CD68啟動子、結(jié)蛋白啟動子、彈性蛋白酶-1啟動子、內(nèi)皮糖蛋白啟動子、纖連蛋白啟動子、Flt-1啟動子、GFAP啟動子、GPIIb啟動子、ICAM-2啟動子、INF-β啟動子、Mb啟動子、NphsI啟動子、OG-2啟動子、SP-B啟動子、SYN1啟動子和WASP啟動子。啟動子序列可以是野生型的或它可以被修飾以用于更高效的或有效的表達(dá)。載體可包含另外的表達(dá)控制序列(例如,增強(qiáng)子序列、Kozak序列、聚腺苷酸化序列、轉(zhuǎn)錄終止序列等)、選擇性標(biāo)記序列(例如,抗生素抗性基因)、復(fù)制起點(diǎn)等。本領(lǐng)域的技術(shù)人員熟悉適當(dāng)?shù)妮d體、啟動子、其它載體控制元件。

在一些方面,其中靶向性核酸酶是基于CRISPR的核酸內(nèi)切酶并且將基于CRISPR的核酸內(nèi)切酶作為核酸引入細(xì)胞中,編碼核酸可以是被優(yōu)化的用于在目標(biāo)真核細(xì)胞內(nèi)有效地翻譯成蛋白質(zhì)的密碼子。例如,可以優(yōu)化密碼子用于在人、小鼠、大鼠、倉鼠、牛、豬、貓、狗、魚、兩棲類、植物、酵母、昆蟲等等中的表達(dá)(參見密碼子使用數(shù)據(jù)庫于www.kazusa.or.jp/codon)。密碼子優(yōu)化程序可以作為免費(fèi)軟件(例如在genomes.urv.es/OPTIMIZER的OPTIMIZER;在www.genscript.com/codon_opt.html的來自GenScript的OptimumGeneTM)獲得。也可以獲得商業(yè)的密碼子優(yōu)化程序。

另外,當(dāng)靶向性核酸內(nèi)切酶是基于CRISPR的核酸內(nèi)切酶時,所述方法還包括向細(xì)胞遞送至少一種指導(dǎo)RNA。一般來講,基于CRISPR的核酸內(nèi)切酶與指導(dǎo)RNA的比率為約1:1。在一些方面,可以將指導(dǎo)RNA作為RNA分子引入。例如,當(dāng)核酸內(nèi)切酶作為蛋白質(zhì)被引入時,可以將基于CRISPR的核酸內(nèi)切酶和指導(dǎo)RNA作為蛋白質(zhì)/RNA復(fù)合體引入。在其它方面,可以將指導(dǎo)RNA作為DNA分子引入細(xì)胞中。在此類實(shí)施方案中,可以將指導(dǎo)RNA編碼序列可操作地連接至用于真核細(xì)胞中指導(dǎo)RNA表達(dá)的啟動子控制序列。例如,可以將RNA編碼序列可操作地連接至由RNA聚合酶III(Pol III)識別的啟動子序列。適合的Pol III啟動子的實(shí)例包括但不限于哺乳動物U6或H1啟動子。因此,在某些情況下,可以將基于CRISPR的核酸內(nèi)切酶和指導(dǎo)RNA作為DNA序列引入細(xì)胞中。在一些迭代中,編碼基于CRISPR的核酸內(nèi)切酶的DNA序列和指導(dǎo)RNA可以是同一載體的部分。

所述方法也包括將至少一種具有預(yù)定表觀遺傳修飾的合成DNA序列引入細(xì)胞中。表觀遺傳修飾的核酸在以上第(I)節(jié)中有所詳述。在一些方面,表觀遺傳修飾的核酸可以包含如以上第(I)節(jié)中所詳述的另外的序列(例如,末端突出端、與靶向基因組基因組附近的序列有基本的序列同一性的旁側(cè)序列、旁側(cè)靶向性核酸內(nèi)切酶識別位點(diǎn)、絕緣元件等等)。

可以通過多種方法將靶向性核酸內(nèi)切酶分子和表觀遺傳修飾的合成核酸遞送至細(xì)胞。在一個方面,可以通過轉(zhuǎn)染方法遞送分子。適合的轉(zhuǎn)染方法包括核轉(zhuǎn)染(或電穿孔)、磷酸鈣介導(dǎo)的轉(zhuǎn)染、陽離子聚合物轉(zhuǎn)染(例如DEAE-葡聚糖或聚氮丙啶)、病毒轉(zhuǎn)導(dǎo)、病毒體轉(zhuǎn)染、病毒粒子轉(zhuǎn)染、脂質(zhì)體轉(zhuǎn)染、陽離子脂質(zhì)體轉(zhuǎn)染、免疫脂質(zhì)體轉(zhuǎn)染、非脂質(zhì)體脂質(zhì)轉(zhuǎn)染、樹狀聚合物轉(zhuǎn)染、熱休克轉(zhuǎn)染、磁轉(zhuǎn)染、脂質(zhì)轉(zhuǎn)染、基因槍遞送、刺穿轉(zhuǎn)染(impalefection)、超聲穿孔(sonoporation)、光學(xué)轉(zhuǎn)染和專有試劑增強(qiáng)的核酸的吸收。轉(zhuǎn)染方法在本領(lǐng)域中是熟知的(參見,例如“Current Protocols in Molecular Biology”Ausubel等,John Wiley&Sons,New York,2003或“Molecular Cloning:A Laboratory Manual”Sambrook和Russell,Cold Spring Harbor Press,Cold Spring Harbor,NY,第3版,2001)。在另一方面,可通過顯微注射來向細(xì)胞中遞送所述分子。例如,所述分子可經(jīng)顯微注射到細(xì)胞的細(xì)胞核或細(xì)胞質(zhì)中。

靶向性核酸內(nèi)切酶分子和表觀遺傳修飾的合成核酸可同時或依次遞送至細(xì)胞。靶向性核酸內(nèi)切酶分子與表觀遺傳修飾的合成核酸的比率可以在約1:10至約10:1的范圍內(nèi)。在各個方面,靶向性核酸內(nèi)切酶分子與表觀遺傳修飾的合成核酸的比率為約1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1或10:1。非限制性的示例性比率為約1:1。

(c)使用鋅指核酸酶進(jìn)行修飾

可以使用鋅指核酸酶將表觀遺傳修飾的合成核酸整合到細(xì)胞的基因組中。如上詳述,所述方法包括(a)(i)將至少一種鋅指核酸酶或編碼至少一種鋅指核酸酶的核酸引入細(xì)胞中,其中將每個鋅指工程化以識別細(xì)胞基因組中的靶向位點(diǎn)并將雙鏈斷裂引入所述靶向位點(diǎn),以及(ii)將至少一種合成的表觀遺傳修飾的核酸引入細(xì)胞中以插入基因組中,并且(b)孵育所述細(xì)胞使得在由所述鋅指核酸酶產(chǎn)生雙鏈斷裂的修復(fù)時,所述表觀遺傳修飾的合成序列插入細(xì)胞的基因組中。

在一個方面,表觀遺傳修飾的合成核酸側(cè)接與由鋅指核酸酶產(chǎn)生的那些突出端相匹配的突出端。例如,包含突出端的表觀遺傳修飾的合成核酸可作為線型的寡核苷酸引入,或者它可在表觀遺傳修飾的合成核酸是較大的多核苷酸的一部分時原位產(chǎn)生,在所述較大的多核苷酸中表觀遺傳修飾的合成核酸側(cè)接由鋅指核酸酶識別的靶位點(diǎn)。在任一種情況下,可以使用一種鋅指核酸酶來在基因組中的靶向位點(diǎn)處引入一種雙鏈斷裂,并且表觀遺傳修飾的合成核酸可通過由非同源的末端連接DNA修復(fù)過程介導(dǎo)的直接連接來插入所述位點(diǎn)中。表觀遺傳修飾合成核酸插入基因組位置中使內(nèi)源性染色體序列破裂或失活。另選地,可以使用兩種鋅指核酸酶以在基因組中引入兩種雙鏈斷裂,并且表觀遺傳修飾的合成核酸可與內(nèi)源性染色體序列(其為離體的或缺失的)交換。

在另一個方面,表觀遺傳修飾的合成核酸側(cè)接分別與靶向裂解位點(diǎn)的上游和下游序列具有基本的序列同一性的上游和下游序列。例如,可以使用一種鋅指核酸酶以在基因組的靶向位點(diǎn)處引入一種雙鏈斷裂,其中在雙鏈斷裂被同源介導(dǎo)的DNA修復(fù)過程修復(fù)時,表觀遺傳修飾的合成核酸插入內(nèi)源性染色體序列中或與內(nèi)源性染色體序列的一部分交換。另選地,可以使用第一鋅指核酸酶來在第一基因座處通過如以上所直接詳述的同源介導(dǎo)的過程插入表觀遺傳修飾的合成核酸,并且可以使用第二鋅指核酸酶來在第二基因座處引入雙鏈斷裂,其中第二基因座處的斷裂可以由在第二基因座處引入失活突變的易錯的、非同源末端連接修復(fù)過程修復(fù)。失活突變可以是至少一個核苷酸的缺失、至少一個核苷酸的插入、至少一個核苷酸的取代或其組合。

在上述迭代中的任一個中,表觀遺傳修飾的合成核酸可以替換對應(yīng)的內(nèi)源性染色體序列。另選地,表觀遺傳修飾的合成核酸可在賦予了表觀遺傳修飾穩(wěn)定性的安全港基因座或位點(diǎn)處插入。在此迭代中,可以使對應(yīng)于表觀遺傳修飾的合成核酸的內(nèi)源性染色體序列缺失或失活(如本文所詳述的)。

(d)使用基于CRISPR的核酸內(nèi)切酶進(jìn)行的修飾

也可以使用基于CRISPR的核酸內(nèi)切酶將表觀遺傳修飾的合成核酸插入細(xì)胞的基因組中。所述方法包括(a)(i)將至少一種基于CRISPR的核酸內(nèi)切酶或編碼至少一種基于CRISPR的核酸內(nèi)切酶的核酸引入細(xì)胞中,其中每個基于CRISPR的核酸內(nèi)切酶能夠裂解靶向基因組序列的至少一條鏈,和(ii)將至少一種指導(dǎo)RNA和編碼至少一種指導(dǎo)RNA的DNA引入細(xì)胞中,其中每個指導(dǎo)RNA將基于CRISPR的核酸內(nèi)切酶定向到基因組中的靶向位點(diǎn),以及(iii)將至少一種表觀遺傳修飾的合成核酸引入細(xì)胞中以插入基因組中,并且(b)孵育所述細(xì)胞使得所述表觀遺傳修飾的合成核酸在DNA修復(fù)過程中插入基因組中。

在一些方面,基于CRISPR的核酸內(nèi)切酶含有兩個功能性核酸酶結(jié)構(gòu)域使得它裂解雙鏈序列的兩條鏈。例如,一種基于CRISPR的核酸酶(或編碼核酸)和一種指導(dǎo)RNA(或編碼DNA)可引入細(xì)胞中(連同表觀遺傳修飾的合成核酸)。在表觀遺傳修飾的合成核酸側(cè)接與由基于CRISPR的核酸酶產(chǎn)生的那些突出端相匹配的突出端的情況下,表觀遺傳修飾的合成核酸可通過基于非同源的修復(fù)過程直接與染色體DNA連接。在具有表觀遺傳修飾的表觀遺傳修飾的合成核酸側(cè)接分別與靶向裂解位點(diǎn)的上游和下游序列共用基本的序列同一性的上游和下游序列的情況下,所述表觀遺傳修飾的合成核酸可通過同源介導(dǎo)的修復(fù)過程插入內(nèi)源性染色體序列中或與內(nèi)源性染色體序列的一部分交換。

在其它方面,修飾基于CRISPR的核酸內(nèi)切酶以含有一個功能性核酸酶結(jié)構(gòu)域使得它裂解雙鏈序列的一條鏈(因此,它是切口酶)?;贑RISPR的切口酶可以與兩種不同的指導(dǎo)RNA一起使用以在雙鏈的相反鏈中引入切口,其中兩個缺口足夠接近以構(gòu)建雙鏈斷裂。為介導(dǎo)此裂解,將兩個指導(dǎo)RNA取向?yàn)?'-面向-5'構(gòu)型(即,上游指導(dǎo)RNA結(jié)合到基因組靶標(biāo)的有義鏈,并且下游指導(dǎo)RNA結(jié)合到基因組靶標(biāo)的反義鏈)。因此,所述方法可以包括將一種基于CRISPR的切口酶(或編碼核酸)、兩種指導(dǎo)RNA(或編碼DNA)和表觀遺傳修飾的合成核酸引入細(xì)胞中。在表觀遺傳修飾的合成核酸側(cè)接與由基于CRISPR的切口酶系統(tǒng)產(chǎn)生的那些突出端相匹配的突出端的情況下,所述表觀遺傳修飾的合成核酸可通過基于非同源的修復(fù)過程直接與染色體DNA連接。在表觀遺傳修飾的合成核酸側(cè)接分別與靶向裂解位點(diǎn)的上游和下游序列共用基本的序列同一性的上游和下游序列的情況下,所述表觀遺傳修飾的合成核酸可通過同源介導(dǎo)的修復(fù)過程插入內(nèi)源性染色體序列中或與內(nèi)源性染色體序列的一部分交換。

在其它方面,基于CRISPR的核酸酶(或編碼核酸)和兩種指導(dǎo)RNA(或編碼DNA)可引入細(xì)胞中以在基因組序列中介導(dǎo)兩種雙鏈斷裂。相似地,基于CRISPR的切口酶(或編碼核酸)和四種指導(dǎo)RNA可引入細(xì)胞中以在基因組序列中介導(dǎo)兩種雙鏈斷裂。在表觀遺傳修飾的合成核酸側(cè)接與由基于CRISPR的蛋白質(zhì)產(chǎn)生的那些突出端相匹配的突出端的情況下,所述表觀遺傳修飾的合成核酸可直接與染色體序列連接,從而用表觀遺傳修飾的合成序列替換內(nèi)源性染色體序列。在表觀遺傳修飾的合成核酸側(cè)接分別與靶向裂解位點(diǎn)的上游和下游序列具有基本的序列同一性的上游和下游序列的迭代中,所述表觀遺傳修飾的合成核酸可通過同源介導(dǎo)的修復(fù)過程插入染色體序列中或與染色體序列交換。另選地,表觀遺傳修飾的合成序列可通過同源介導(dǎo)的修復(fù)過程插入雙鏈斷裂位點(diǎn)中的一個中,并且可以由非同源修復(fù)過程通過引入失活突變(即缺失、插入、取代至少一個核苷酸)來使另一個雙鏈斷裂位點(diǎn)突變或失活。

在基于CRISPR的核酸內(nèi)切酶介導(dǎo)的迭代中的任一個中,表觀遺傳修飾的合成核酸可以替換對應(yīng)的內(nèi)源性染色體序列。另選地,表觀遺傳修飾的合成核酸可在賦予了表觀遺傳修飾穩(wěn)定性的安全港基因座或位點(diǎn)處插入。在此迭代中,可以使對應(yīng)于表觀遺傳修飾的合成核酸的內(nèi)源性染色體序列缺失或失活(如本文所詳述的)。

IV.用途

具有預(yù)定表觀遺傳修飾的合成核酸和包含所述核酸的細(xì)胞具有若干用途。在某些方面,攜帶修飾調(diào)控區(qū)的表觀遺傳狀態(tài)的表觀遺傳修飾的核酸的插入的工程細(xì)胞可以用于控制或改變基因的表達(dá)。例如,具有表觀遺傳修飾的核酸(諸如甲基化核酸)的插入除了或代替不正常修飾的(即,不正常甲基化的或過甲基化的)調(diào)控染色體序列的細(xì)胞可用于改變基因表達(dá)。相反地,使用不含表觀遺傳修飾的合成核酸替換已知具有表觀遺傳修飾的內(nèi)源性調(diào)控序列或插入不含表觀遺傳修飾的合成核酸可以用于改變基因表達(dá)。

在其它方面,包含表觀遺傳修飾的合成序列(其中的表觀遺傳修飾是穩(wěn)定的)的細(xì)胞可以充當(dāng)診斷或基因分型標(biāo)準(zhǔn)。例如,表觀遺傳修飾的合成核酸和包含所述核酸的細(xì)胞可以在測定中用作參照標(biāo)準(zhǔn),所述測定用于診斷疾病(諸如癌癥)、預(yù)測疾病的結(jié)果、監(jiān)測疾病的行為、確定疾病的適當(dāng)?shù)闹委熀蜏y量對靶向治療的應(yīng)答。此類參照標(biāo)準(zhǔn)的規(guī)定在工程化細(xì)胞系中是有利的,因?yàn)?1)它們在進(jìn)行細(xì)胞裂解(或FFPE提取)、DNA分離和擴(kuò)增的所有后續(xù)的診斷處理步驟的天然細(xì)胞和基因組環(huán)境內(nèi)提供了DNA測定模板,以及(2)可以將遺傳的或表觀遺傳的改變模型化成穩(wěn)定且提供大量基因組DNA的細(xì)胞類型。

例如,MGMT的表達(dá)已被證實(shí)可以在使用烷化劑治療的成膠質(zhì)細(xì)胞瘤患者中用作診斷和/或預(yù)測標(biāo)記。MGMT的表達(dá)與使用烷化劑(諸如替莫唑胺)治療的差的結(jié)果相關(guān),因?yàn)镸GMT酶對抗由烷化劑引起的DNA損傷。MGMT啟動子的甲基化模式可以被用作MGMT表達(dá)的指示物。因此,具有MGMT啟動子高水平甲基化的患者可以從替莫唑胺治療中得益,然而具有低水平MGMT啟動子甲基化的患者對替莫唑胺無應(yīng)答(圖3)。參見,例如Hegi等,2004,Clin.Cancer Res.10(6):1871-4;Hegi等,2005,New England J.Med.352(10):997-1003;Boots-Sprenger等,2013,Modern Pathol.26(7):922-9。在又一種情況下,已經(jīng)將BRCA1基因的甲基化與雜合性丟失(LOH)測量結(jié)合使用以預(yù)測某些卵巢癌是否是使用PARP抑制劑或鉑鹽治療的候選(Abkevich等,2012,Br J Cancer 107(10):1776-82。因此,包含過甲基化或低甲基化的MGMT或BRCA1序列的工程化細(xì)胞可以用作用于評估甲基化狀態(tài)的參照標(biāo)準(zhǔn)。另外,當(dāng)具有良好表征水平甲基化的患者樣本不存在時,具有靶向甲基化模式的工程化細(xì)胞可以充當(dāng)對照樣本以開發(fā)和表征新的檢測測定或充當(dāng)研究和診斷實(shí)驗(yàn)室的設(shè)立和維護(hù)中的質(zhì)量對照標(biāo)準(zhǔn)。

在另外的方面,可以使用包含表觀遺傳修飾序列(其中的表觀遺傳修飾是亞穩(wěn)定的)的工程化細(xì)胞基于插入序列的表觀遺傳修飾模式或狀態(tài)的先驗(yàn)知識來分析細(xì)胞中修飾序列的表觀遺傳穩(wěn)定性。例如,可以使用所述序列以分析響應(yīng)于藥物、環(huán)境或飲食因素的基因座的表觀遺傳穩(wěn)定性。特別是,人工甲基化的基因座可以充當(dāng)起始點(diǎn)以“重置”甲基化模式并且研究是什么生物學(xué)因素導(dǎo)致了后續(xù)的甲基化和基因表達(dá)的變化。例如,在飲食補(bǔ)充之后,體重和毛色的變化與鼠的肥胖相關(guān)基因的甲基化狀態(tài)之間存在為人熟知的關(guān)系(Dolinoy等,2007,Pediatric Research,61:30R)。因?yàn)榭梢允褂冒邢蛐院怂醿?nèi)切酶(如上所詳述)在精確的位置處插入化學(xué)修飾的序列,所以所述修飾的序列可置于天然染色體環(huán)境中,所述天然染色體環(huán)境仍受可為目標(biāo)染色體區(qū)域所獨(dú)有的任何基因座特異性表觀遺傳調(diào)控因子支配。使用異位的甲基化DNA序列進(jìn)行的此類基因座特異性的實(shí)驗(yàn)是不可能的。

在又一方面,包含表觀遺傳修飾的合成序列的工程化細(xì)胞可以用作包含表觀遺傳修飾序列的基因組DNA的來源。例如,DNA可以使用標(biāo)準(zhǔn)技術(shù)從活細(xì)胞或固定細(xì)胞中提取、擴(kuò)增并分析。另選地,可以在細(xì)胞中原位分析(例如,通過原位PCR、原位蛋白質(zhì)印記(in situ Western)、免疫組織化學(xué)和其它適合的程序)具有表觀遺傳修飾的合成染色體序列。

V.試劑盒

本發(fā)明還提供了包含本文描述的表觀遺傳修飾的合成序列和/或包含所述序列的細(xì)胞的試劑盒。在一個實(shí)施方案中,提供了用于預(yù)測受試者的疾病對治療性處理或方案(諸如癌癥治療)的響應(yīng)性的試劑盒,所述試劑盒包括具有與已知的治療結(jié)果相關(guān)的預(yù)定胞嘧啶修飾的至少一種合成核酸,連同用于解釋參照標(biāo)準(zhǔn)(即表觀遺傳修飾的合成序列)與取自受試者的樣本的比較的文件。所述試劑盒還包含對照染色體序列。在另一個實(shí)施方案中,提供了用于診斷受試者樣本的疾病的試劑盒,所述試劑盒包括具有與已知的疾病狀態(tài)相關(guān)的預(yù)定胞嘧啶修飾的至少一種合成核酸,連同用于解釋參照標(biāo)準(zhǔn)與取自受試者的樣本的比較的文件。所述試劑盒還包含對照染色體序列。在另一個實(shí)施方案中,提供了用于預(yù)測受試者樣本中疾病的結(jié)果和嚴(yán)重性的試劑盒,所述試劑盒包括具有與已知的疾病的預(yù)后相關(guān)的預(yù)定胞嘧啶修飾的至少一種合成核酸,連同用于解釋參照標(biāo)準(zhǔn)與取自受試者的樣本的比較的文件。所述試劑盒還包含對照染色體序列。

在其它實(shí)施方案中,所述試劑盒包括一系列多種表觀遺傳修飾的合成序列,其中所述試劑盒的每個合成序列都具有不同的預(yù)定胞嘧啶修飾,所述胞嘧啶修飾與不同的已知的(1)對疾病治療的敏感性水平、(2)疾病的診斷或(3)疾病的預(yù)后相關(guān)。此系列提供了多個標(biāo)準(zhǔn),受試者樣本的胞嘧啶修飾可以與所述標(biāo)準(zhǔn)對比以(1)確定疾病的診斷,或(2)確定疾病的預(yù)后,或(3)評估治療方案的結(jié)果。在這些不同的試劑盒的任一個中,試劑盒還可以包括一個或多個對照染色體序列以及用于解釋參照標(biāo)準(zhǔn)與取自受試者的樣本的比較的文件。

在一些方面,在一種或多種固定細(xì)胞中提供表觀遺傳修飾的合成序列。當(dāng)提供具有多種胞嘧啶修飾的合成序列時,無論它們是否并入細(xì)胞中,所述樣本都將以獨(dú)立的清楚標(biāo)記的包裝提供。

定義

除非另外定義,否則本文所使用的所有技術(shù)性和科學(xué)性術(shù)語具有本發(fā)明所屬領(lǐng)域中的技術(shù)人員通常所理解的含義。下列參考文獻(xiàn)為技術(shù)人員提供了許多本發(fā)明所用的術(shù)語的一般定義:Singleton等,Dictionary of Microbiology and Molecular Biology(第2版1994);The Cambridge Dictionary of Science and Technology(Walker編,1988);The Glossary of Genetics,第5版,R.Rieger等(編),Springer Verlag(1991);和Hale和Marham,The Harper Collins Dictionary of Biology(1991)。如本文所用,除非另外指明,否則以下術(shù)語具有賦予其的含義。

當(dāng)介紹本公開或其一個或多個優(yōu)選方面的要素時,冠詞“一個/種(a)”、“一個/種(an)”、“所述/該(the)”以及“所述(said)”意圖意指存在一個或多個要素。術(shù)語“包含(comprising)”、“包括(including)”和“具有(having)"意圖是包括性的,并且意味著除了所列要素之外,可能還有額外的要素。

如本文互換使用的,術(shù)語“CpG位置”和“CpG位點(diǎn)”是指DNA區(qū)域,其中的胞嘧啶核苷酸在堿基線型序列中沿長度在鳥嘌呤核苷酸的下一個出現(xiàn),其中“CpG”是“-C-磷酸-G-”鍵聯(lián)的縮寫,即胞嘧啶和鳥嘌呤由單個磷酸鹽隔開。術(shù)語“CpG島”是指CpG位點(diǎn)簇。

如本文所用,術(shù)語“內(nèi)源性序列”是指細(xì)胞天然具有的染色體序列。

如本文所用,術(shù)語“外源性序列”是指不是細(xì)胞天然具有的序列,或在細(xì)胞基因組中的天然位置處于不同的染色體位置的染色體序列。

如本文所用,“基因”是指編碼基因產(chǎn)物的DNA區(qū)域(包括外顯子和內(nèi)含子)以及調(diào)控基因產(chǎn)物的產(chǎn)生的所有DNA區(qū)域,無論所述調(diào)控序列是否與編碼序列和/或轉(zhuǎn)錄序列相鄰。因此,基因包括但不一定限于,啟動子序列、終止子、翻譯調(diào)控序列(諸如核糖體結(jié)合位點(diǎn)和內(nèi)部核糖體進(jìn)入位點(diǎn))、增強(qiáng)子、沉默子、絕緣子、邊界元件、復(fù)制起點(diǎn)、基質(zhì)附著位點(diǎn)以及基因座控制區(qū)。

術(shù)語“異源的”是指不是內(nèi)源的或不是目標(biāo)細(xì)胞天然的實(shí)體。例如,異源蛋白是指來源于或最初來源于外源性來源(諸如外源引入的核酸序列)的蛋白。在一些情況下,異源蛋白由目標(biāo)細(xì)胞不正常地產(chǎn)生。

術(shù)語“核酸”和“多核苷酸”是指呈線型或環(huán)狀構(gòu)象且呈單鏈或雙鏈形式的脫氧核糖核苷酸或核糖核苷酸聚合物。出于本公開的目的,這些術(shù)語不應(yīng)相對于聚合物的長度被解釋為限制性的。術(shù)語可包括天然核苷酸的已知類似物,以及在堿基、糖和/或磷酸部分(如硫代磷酸酯骨架)中被修飾的核苷酸。一般來講,特定核苷酸的類似物具有相同堿基配對特異性;即A的類似物將與T堿基配對。

術(shù)語“核苷酸”是指脫氧核糖核苷酸或核糖核苷酸。核苷酸可為標(biāo)準(zhǔn)核苷酸(即腺苷、鳥苷、胞苷、胸苷和尿苷)或核苷酸類似物。核苷酸類似物是指具有修飾的嘌呤或嘧啶堿基或修飾的核糖部分的核苷酸。核苷酸類似物可為天然存在的核苷酸(例如肌苷)或非天然存在的核苷酸。核苷酸的糖或堿基部分上的修飾的非限制性實(shí)例包括添加(或移除)乙?;?、氨基、羧基、羧甲基、羥基、甲基、磷?;土虼蓟鶊F(tuán),以及用其它原子取代堿基的碳和氮原子(例如7-脫氮嘌呤)。核苷酸類似物也包括雙脫氧核苷酸、2'-O-甲基核苷酸、鎖定核酸(LNA)、肽核酸(PNA)和嗎啉代寡核苷酸。

術(shù)語“多肽”與“蛋白質(zhì)”可互換用于指代氨基酸殘基的聚合物。

用于測定核酸和氨基酸序列同一性的技術(shù)在本領(lǐng)域中是已知的。通常,所述技術(shù)包括測定基因的mRNA的核苷酸序列和/或測定由其編碼的氨基酸序列,以及將這些序列與第二核苷酸或氨基酸序列進(jìn)行比較。也可以這個方式測定和比較基因組序列。一般來講,同一性是指兩個多核苷酸或多肽序列的核苷酸對核苷酸或氨基酸對氨基酸的分別的精確對應(yīng)。兩個或更多個序列(多核苷酸或氨基酸)可通過確定它們的同一性百分比來進(jìn)行比較。兩個序列(無論核酸或氨基酸序列)的同一性百分比是兩個比對序列之間的精確匹配的數(shù)目除以較短序列的長度且乘以100。核酸序列的近似比對由Smith和Waterman,Advances in Applied Mathematics 2:482-489(1981)的局部同源性算法提供。通過使用由Dayhoff,Atlas of Protein Sequences and Structure,M.O.Dayhoff編,5增刊.3:353-358,National Biomedical Research Foundation,Washington,D.C.,USA開發(fā),且由Gribskov,Nucl.Acids Res.14(6):6745-6763(1986)加以標(biāo)準(zhǔn)化的計(jì)分矩陣,這個算法可應(yīng)用于氨基酸序列。用以確定序列同一性百分比的這個算法的示例性執(zhí)行程序由Genetics Computer Group(Madison,Wis.)在“BestFit”實(shí)用程序中提供。用于計(jì)算序列之間的同一性或類似性百分比的其它適合的程序通常在本領(lǐng)域中是已知的,例如另一比對程序是以缺省參數(shù)加以使用的BLAST。例如,BLASTN和BLASTP可使用以下缺省參數(shù)來加以使用:遺傳密碼=標(biāo)準(zhǔn);過濾器=無;鏈=兩者;截?cái)啵?0;預(yù)期=10;矩陣=BLOSUM62;描述=50個序列;排序依據(jù)=高分;數(shù)據(jù)庫=非冗余,GenBank+EMBL+DDBJ+PDB+GenBank CDS翻譯+Swiss蛋白+Spupdate+PIR。這些程序的細(xì)節(jié)可見于GenBank網(wǎng)站上。

因?yàn)榭稍诓幻撾x本發(fā)明的范圍下對上述動物、細(xì)胞和方法做出各種變化,所以在以上描述中和在以下給出的實(shí)施例中含有的所有事項(xiàng)都應(yīng)解釋為說明性的而非具有限制性意義。

實(shí)施例

以下實(shí)施例說明本發(fā)明的某些方面。

實(shí)施例1:合成的甲基化DNA的穩(wěn)定整合

此研究的目的是確定合成的甲基化DNA是否可以使用ZFN靶向的基因組修飾來穩(wěn)定地整合到細(xì)胞的染色體中。將具有不同的甲基化模式的人O6-甲基鳥嘌呤-DNA甲基轉(zhuǎn)移酶(MGMT)基因的片段插入人細(xì)胞的19號染色體上的AAVS1基因座的靶向位點(diǎn)中。圖1A示出了策略。

合成包含來自人MGMT基因的19nt序列(即,5'-CGACGCCCGCAGGTCCTCG-3',SEQ ID NO:9)和。HindIII限制性核酸內(nèi)切酶位點(diǎn)(5'-AAGCTT-3')的兩種單鏈寡脫氧核苷酸(ssODN)以進(jìn)行集落篩選。命名為1至4(從5'至3')的CpG位點(diǎn)在SEQ ID NO:9中以下劃線表示。一種ssODN在CpG位點(diǎn)上含有5-甲基胞嘧啶。還合成兩條互補(bǔ)的(甲基化或未甲基化的)ssODN。將所述ssODN的各種組合以終濃度95μM在退火緩沖液(含有5mM的Tris.HCl、pH 8.0,0.5mM的EDTA、pH 8.0,50mM的NaCl)中退火,以形成非甲基化的、半甲基化的和雙甲基化的雙鏈寡脫氧核苷酸(dsODN)(參見圖1B)。dsODN上的突出端設(shè)計(jì)來與由FokI酶在靶向人AAVS1基因座的鋅指核酸酶的裂解位點(diǎn)處產(chǎn)生的5'-GCCA-3'突出端相匹配。

將100μl體積的一百萬個人K562細(xì)胞使用3.2μL的95μM dsODN連同5.0μg的AAVS1 ZFN RNA進(jìn)行核轉(zhuǎn)染,重復(fù)進(jìn)行三次實(shí)驗(yàn)。在核轉(zhuǎn)染后的第2、6、8和10天收獲細(xì)胞的等分試樣,使用PCR來擴(kuò)增攜帶整合序列的區(qū)域并且將PCR產(chǎn)物進(jìn)行HindIII消化。每天在每種條件下(即,非甲基化的dsODN+ZFN、半甲基化的dsODN+ZFN和雙甲基化的dsODN+ZFN)檢測264bp和180bp的片段。

培養(yǎng)20天后,將核轉(zhuǎn)染的細(xì)胞進(jìn)行FAC分揀得到單個的活細(xì)胞,并接種在96孔板上。核轉(zhuǎn)染三十五天后,將來源于各單個細(xì)胞集落的細(xì)胞分成兩部分:將一部分冷凍,并且篩選另一部分以供dsODN序列的整合。提取基因組DNA,將攜帶整合序列的AAVS1區(qū)域進(jìn)行PCR擴(kuò)增,并且將PCR產(chǎn)物通過HindIII酶消化以進(jìn)行RFLP分析。通過HindIII消化篩選大約1300個細(xì)胞集落,并且將那些具有正確的大小的HindIII片段的集落進(jìn)行常規(guī)的DNA測序。鑒定了具有25b p的片段(即,19bp的MGMT片段和HindIII位點(diǎn))正確插入AAVS1基因座的三個等位基因中的一個中的總計(jì)18個單細(xì)胞克隆。具體地,5個集落具有未甲基化插入的正確整合;4個集落具有半甲基化插入的正確整合;并且9個集落具有雙甲基化插入的正確整合。修飾AA VS1基因座的序列為5'-CCTTACCTCTCTAGTCTGTGCTAGCTCTTCCAGCCCCCTGTCATGGCATCTTCCAGGGGTCCGAGAGCTCAGCTAGTCTTCTTCCTCCAACCCGGGCCCCTATGTCCACTTCAGGACAGCATGTTTGCTGCCTCCAGGGATCCTGTGTCCCCGAGCTGGGACCACCTTATATTCCCAGGGCCGGTTAATGTGGCTCTGGTTCTGGGTACTTTTATCTGTCCCCTCCACCCCACAGTGGGGCCACGACGCCCGCAGGTCCTCGAAGCTTGCCACTAGGGACAGGATTGGTGACAGAAAAGCCCCATCCTTAGGCCTCCTCCTTCCTAGTCTCCTGATATTGGGTCTAACCCCCACCTCCTGTTAGGCAGATTCCTTATCTGGTGACACACCCCCATTTCCTGGAGCCATCTCTCTCCTTGCCAGAACCTCTAAGGTTTGCTTACG-3'(SEQ ID NO:10;以粗體示出25bp插入序列,以斜體示出HindIII位點(diǎn))。這些數(shù)據(jù)顯示,合成的甲基化D NA可以穩(wěn)定地整合到人細(xì)胞的基因組中。

實(shí)施例2:合成的甲基化DNA的穩(wěn)定維持

此研究的目的是確定整合到基因組中的合成的甲基化DNA的甲基化狀態(tài)是否可以穩(wěn)定地維持。使具有MGMT片段在AAVS1基因座(參見,實(shí)施例1)的三個等位基因中的每個中的正確插入的九個細(xì)胞集落再生長兩周。通過焦磷酸測序(EpigenDx,Hopkinton,MA)確定每個集落的甲基化狀態(tài)。核轉(zhuǎn)染后49天的甲基化分析示于表1中。

使集落#1(非甲基化的)和集落#7(雙甲基化的)的副本(A、B)再生長31天。通過焦磷酸測序確定每個集落的甲基化狀態(tài)(核轉(zhuǎn)染后80天),并且示于表2中。圖2總結(jié)了轉(zhuǎn)染后49天和80天在這些兩個不同的等位基因中的每個CpG位點(diǎn)處的甲基化狀態(tài)。這些數(shù)據(jù)顯示,甲基化狀態(tài)可以從合成的DNA傳遞到基因組基因座,并且預(yù)定的DNA甲基化模式可以在很大程度上在世代間維持。

實(shí)施例3:具有穩(wěn)定的MGMT甲基化模式的細(xì)胞的用途

具有穩(wěn)定的MGMT甲基化模式的細(xì)胞(諸如以上制備的那些細(xì)胞)可以在用于確定患成膠質(zhì)細(xì)胞瘤患者的適合的治療過程的測定中用作診斷對照??梢苑治龌颊吣[瘤樣本中MGMT啟動子甲基化水平,并且與具有穩(wěn)定的MGMT的對照(參照)細(xì)胞的MGMT啟動子甲基化水平相比較。例如,可以使用標(biāo)準(zhǔn)程序從腫瘤樣本和對照樣本中提取DNA。將提取的DNA使用亞硫酸氫鹽處理,使用甲基化特異性PCR來擴(kuò)增,并測序。另選地,使用焦磷酸測序確定提取的DNA的甲基化狀態(tài)。另選地,通過免疫組織化學(xué)在固定細(xì)胞中使用針對MGMT產(chǎn)生的甲基化特異性抗體分析MGMT啟動子的甲基化狀態(tài)。然后,可將患者樣本的甲基化狀態(tài)與對照細(xì)胞的甲基化狀態(tài)相比較。如果取自患者的樣本的甲基化水平低于對照細(xì)胞,則認(rèn)為腫瘤對于MGMT甲基化呈陰性,并且不施用替莫唑胺。如果取自患者的樣本的甲基化水平等于或大于對照細(xì)胞,則認(rèn)為腫瘤對于MGMT甲基化呈陽性,并且施用替莫唑胺(參見圖3)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
迭部县| 青龙| 无极县| 大冶市| 邓州市| 巨野县| 塔河县| 孝感市| 长顺县| 同江市| 濉溪县| 固始县| 马山县| 封丘县| 鹿邑县| 梁河县| 马关县| 祥云县| 永顺县| 南皮县| 蕲春县| 湟中县| 东明县| 福泉市| 陆河县| 綦江县| 七台河市| 鲁甸县| 舞钢市| 富源县| 五大连池市| 肃南| 阜平县| 庆阳市| 和田市| 澄城县| 萨迦县| 阜城县| 连云港市| 克山县| 屏山县|