專利名稱:合成5’utr、表達載體以及增強轉(zhuǎn)基因表達的方法
合成5’ UTR、表達載體以及增強轉(zhuǎn)基因表達的方法發(fā)明背景 發(fā)明領(lǐng)域本發(fā)明屬于生物技術(shù)領(lǐng)域。具體地說,本發(fā)明涉及對真核細胞中基因表達轉(zhuǎn)錄后 控制的改進。
背景技術(shù):
真核細胞基因表達在DNA轉(zhuǎn)錄為初級mRNA后要經(jīng)過若干控制點。初級mRNA轉(zhuǎn)錄 本包含編碼部分(外顯子)和非編碼部分(內(nèi)含子)。在mRNA的剪接過程中,內(nèi)含子被剪 切掉并從轉(zhuǎn)錄本中去除,外顯子則被拼接起來產(chǎn)生成熟的信使RNA (mRNA)。剪接作用作為一 個控制點,通過在多種組合中增加和去除外顯子而從單個基因產(chǎn)生多個蛋白質(zhì)同種型。該 過程被稱為選擇性剪接,發(fā)生在稱為剪接體的嚴(yán)密調(diào)控多組件結(jié)構(gòu)中,受胞內(nèi)和胞外信號 轉(zhuǎn)導(dǎo)通路的控制。蛋白質(zhì)編碼區(qū)內(nèi)的選擇性剪接作用可以導(dǎo)致產(chǎn)生具有不同功能的多個同種型。 此外,剪接作用已表明可以顯著增強哺乳動物細胞的蛋白質(zhì)合成(Huang和Gorman,1990 Nucleic Acids Research 18(4) :937_947)。其機制仍然未知。選擇性剪接也會發(fā)生在轉(zhuǎn) 錄本的非翻譯區(qū),可以為最終轉(zhuǎn)錄本提供增強子和穩(wěn)定區(qū)域,從而增強蛋白質(zhì)翻譯。在合成基因構(gòu)建體的5’端調(diào)節(jié)區(qū)增加剪接元件已表明可以增強基因表達,理 論上是由細胞核到胞質(zhì)的mRNA轉(zhuǎn)運增強造成的(Huang和Gorman,supra ;Choi等,1991 Molecular and Cellular Biology 11(6) :3070_3074)?;谶@項研究結(jié)果,市場上買到的 哺乳動物表達載體的啟動子和多克隆位點之間常含有內(nèi)含子。而內(nèi)含子與其它調(diào)控區(qū)的組 合是否具有增強基因表達的作用則尚未得到評估。發(fā)明概述本發(fā)明提供了為增強宿主細胞中合成基因構(gòu)建體轉(zhuǎn)基因組件的表達而設(shè)計的合 成5’ UTR多核苷酸序列。不受理論的限制,所述合成5’ UTR設(shè)計成通過增強RNA的轉(zhuǎn)運和 穩(wěn)定性來增強轉(zhuǎn)基因表達。所述合成5’ UTR序列包含含有第一真核基因的剪接位點的多核苷酸片段,該多核 苷酸片段融合于編碼在RNA和蛋白質(zhì)水平上都保持穩(wěn)定的第二真核基因的5’UTR序列的多 核苷酸片段。在一個實施方式中,所述5’UTR序列是嵌合序列,包含含有一個肌質(zhì)網(wǎng)/內(nèi)質(zhì) 網(wǎng)鈣ATP酶基因的剪接位點的多核苷酸片段,以及含有酪蛋白基因5’ UTR的至少一部分的 多核苷酸片段。本發(fā)明的5’ UTR多核苷酸序列用于增強合成基因構(gòu)建體中感興趣序列或感興趣 編碼區(qū)的表達??梢岳弥亟MDNA技術(shù)將合成5’UTR序列插入病毒或非病毒載體上啟動子 和感興趣核苷酸序列之間。合成5’UTR序列任選側(cè)接包含限制性核酸內(nèi)切酶位點和限制性 核酸內(nèi)切酶活性所需的其它核苷酸的核苷酸序列。側(cè)翼序列任選提供載體內(nèi)的克隆位點。本發(fā)明還提供了包含合成5’ UTR的載體。在本發(fā)明的實施方式中,所述載體是真 核表達載體。
本發(fā)明還提供了增強真核細胞中轉(zhuǎn)基因表達的方法。方法包括以下步驟,將含有 剪接位點的第一真核基因的多核苷酸片段與含有至少一部分5’ UTR的第二真核基因的多 核苷酸片段融合在一起形成嵌合多核苷酸序列從而產(chǎn)生合成5’ UTR序列,然后將嵌合多核 苷酸序列插入表達載體中啟動子和感興趣序列之間。申請人:出乎意料地發(fā)現(xiàn),將包含肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因的內(nèi)含子的多核苷 酸片段與包含酪蛋白基因的至少一部分的多核苷酸片段融合產(chǎn)生的合成5’ UTR序列,可以 增強基因表達。如本文詳述,與對照相比,合成5’UTR兩個不同實施方式在分別被含有合成 5’ UTR的表達載體轉(zhuǎn)染的兩種不同類型的細胞中均增強了報告基因的表達。因此,本發(fā)明的一個目的就是為增強真核細胞中轉(zhuǎn)基因表達而提供一種合成 5’ UTR序列,其包含與含有至少一部分異源5’非翻譯區(qū)的多核苷酸片段融合的含有剪接位 點的多核苷酸片段。本發(fā)明的另一目的是為增強真核細胞中轉(zhuǎn)基因表達而提供一種合成5’ UTR序列, 其包含與含有至少一部分異源5’非翻譯區(qū)的多核苷酸片段融合的含有內(nèi)含子的多核苷酸 片段。本發(fā)明還有另一目的是為增強真核細胞中轉(zhuǎn)基因表達而提供一種合成5’ UTR序 列,其包含與含有至少一部分異源5’非翻譯區(qū)的多核苷酸片段融合的含有內(nèi)含子的一個多 核苷酸片段,所述內(nèi)含子包含相鄰?fù)怙@子的側(cè)翼5’端和3’端部分。本發(fā)明還有另一目的是提供可以插入載體的合成5’ UTR序列。本發(fā)明還有另一目的是提供包含合成5’ UTR的載體。本發(fā)明還有另一個目的是提供包含合成5’ UTR的宿主細胞。序列說明SEQ ID N0:1表示合成5,UTR序列的一個實施方式,所述序列包含Mlu I限制性 位點,SEQ ID NO :2,Kpn I 限制性位點,SEQ ID NO :3,Mfe I 限制性位點。SEQ ID N0:1 在 本文也稱作5U2。SEQ ID NO 2表示犬SERCA2內(nèi)含子2序列的一個實施方式,所述序列具有一個突 變的推定共有polyA位點,外顯子2的一部分側(cè)接5’端和外顯子3的一部分側(cè)接3’端。 SEQ ID NO :2是家犬第26號染色體上一段突變的部分序列,鳥槍法全基因組序列(公開登 錄號 NC_006608. 2)。SEQ ID N0:3表示牛酪蛋白5,UTR序列的一個實施方式。SEQ ID NO 3是全長牛 酪蛋白0 mRNA的部分序列(公開登錄號NM_181008)。SEQ ID NO 4表示犬野生型SERCA2內(nèi)含子2序列的一個實施方式,外顯子2的一 部分側(cè)接5’端和外顯子3的一部分側(cè)接3’端。SEQ ID NO :4是家犬第26號染色體的部 分序列,鳥槍法全基因組序列(公開登錄號NC_006608. 2)。SEQ ID NO 5表示人野生型SERCA2內(nèi)含子2序列的一個實施方式,第2個外顯子 2側(cè)接5’端和外顯子3側(cè)接3’端。SEQ ID NO 5是智人第12號染色體的部分序列,參比 裝配體,完整序列(公開登錄號NC_000012)。SEQ ID NO 6表示小鼠野生型SERCA2內(nèi)含子2序列的一個實施方式,外顯子2側(cè) 接5’端和外顯子3側(cè)接3’端。SEQ ID NO :6是小鼠第5號染色體的部分序列,參比裝配 體(公開登錄號NC_000071)。
6
SEQ ID NO 7表示合成5’ UTR序列的一個實施方式,所述序列包含Asc I限制性 位點,Mlu I限制性位點,SEQ ID NO :4,Kpn I限制性位點,SEQ IDN0 :3,Mfe I限制性位 點。SEQ ID NO :7在本文也稱作INXN-1。SEQ ID NO :8表示小鼠酪蛋白5,UTR序列的一個實施方式。SEQ IDN0:8是小鼠 酪蛋白3,mRNA(cDNA克隆MGC 91065)的部分序列(公開登錄號BC080709)。SEQ ID NO :9表示大鼠酪蛋白5,UTR序列的一個實施方式。SEQ IDN0:9是褐鼠 酪蛋白3 (Csn2)mRNA的部分序列(公開登錄號NM_017120)。SEQ ID NO: 10表示綿羊酪蛋白5,UTR序列的一個實施方式。SEQ IDN0:10是綿 羊酪蛋白0 (CSN2)mRNA的部分序列(公開登錄號NM_001009373)。SEQ ID N0:11表示犬SERCA2的外顯子3。SEQ ID NO 11是家犬第26號染色體 的部分序列,鳥槍法全基因組序列(公開登錄號NC_006608. 2)。SEQ ID NO :12表示包含合成5,UTR的載體序列的一個實施方式。SEQID N0 12 所示載體包含SEQ ID NO :1,如圖10所示。SEQ ID NO :13表示包含合成5,UTR的載體序列的另一個實施方式。SEQ ID NO: 13所示載體包含SEQ ID NO :7,如圖11所示。SEQ ID NO 14表示包含對照(polyG)合成5’ UTR的載體,如圖9所示。在上述任一序列中,T(胸腺嘧啶)都可以被U(尿嘧啶)取代。
圖1A是SEQ ID NO 4所示多核苷酸的示意圖。圖1B是SEQ ID NO 5所示多核苷酸和SEQ ID NO 6所示多核苷酸的示意圖。圖1C描述SEQ ID NO 2和SEQ ID NO :4_6所示多核苷酸。SERCA2的第2個內(nèi)含 子用黑色突出顯示。相鄰?fù)怙@子或其部分沒有突出顯示。圖2A是SEQ ID NO 1所示多核苷酸的示意圖。圖2B是SEQ ID NO 7所示多核苷酸的示意圖。圖3A是插入表達載體中啟動子和感興趣序列之間的合成5’ UTR的示意圖。圖3B是插入表達載體中啟動子和克隆位點之間的合成5’ UTR的示意圖。圖4描述了在HEK-293細胞中檢測本發(fā)明合成5,UTR實施方式的結(jié)果。圖5描述了在1080細胞中檢測本發(fā)明合成5’ UTR實施方式的結(jié)果。圖6描述了檢測本發(fā)明合成5,UTR實施方式的結(jié)果,以相對于HEK-293細胞和 1080細胞中的對照的增長倍數(shù)表示,其中對照值標(biāo)準(zhǔn)化為1。圖7描述了實施例1中使用的對照載體(VVN-2712),其中0 -半乳糖苷酶(LacZ) 編碼序列缺少5’ UTR并操作性連接于CMV啟動子。圖8描述了實施例1中使用的對照載體(VVN-2713),其中所述載體缺少5’UTR和 LacZ o圖9描述了實施例1中使用的載體(VVN-8318),其中0 -半乳糖苷酶(LacZ)編碼 序列操作性連接于polyG 5’ UTR和CMV啟動子。圖10描述了實施例1中使用的載體(VVN-8277),其中0 -半乳糖苷酶(LacZ)編 碼序列操作性連接于本發(fā)明的5’ UTR(5U2)和CMV啟動子。
圖11描述了實施例1中使用的載體(VVN-8276),其中0 -半乳糖苷酶(LacZ)編 碼序列操作性連接于本發(fā)明的5’ UTR(INXN-l)和CMV啟動子。圖12是含有圖4-6所述實施例1數(shù)據(jù)的表格。圖13描述了包含第二內(nèi)含子和外顯子2及外顯子3的馬SERCA2基因組序列和 mRNA序列的部分比對結(jié)果。第二內(nèi)含子的5’端和3’端分別用箭頭標(biāo)出。圖7-11使用下列縮寫CMV pro =巨細胞病毒啟動子,LacZ = LacZ編碼序列, SV40pA = SV40 polyA,Amp =氨芐青霉素抗性基因,Neo =新霉素抗性基因,MCS =多克隆 位點,SPL-1 =外顯子2SERCA2的一部分+內(nèi)含子2SERCA2+外顯子3 SERCA2的一部分, UTR-1 = 5,UTR酪蛋白的一部分。發(fā)明詳述下列定義適用于整個說明書、附圖和權(quán)利要求書。在說明書和權(quán)利要求書中使用 而沒有在此作出定義的術(shù)語則具有本領(lǐng)域中通常的含義。本發(fā)明中使用的術(shù)語“一個”或“一”時,表示“至少一個”或“一個或多個”,另外
說明的除外。“核酸”、“核酸分子”、“核酸序列”、“寡核苷酸”、“寡核苷酸序列”、“核苷酸序列”、 “多核苷酸”以及“多核苷酸序列”可以互換使用,指以單鏈形式或雙鏈螺旋的核糖核苷(腺 嘌呤核苷、鳥嘌呤核苷、尿嘧啶核苷或胞嘧啶核苷;“RNA分子”)或脫氧核糖核苷(脫氧腺 嘌呤核苷、脫氧鳥嘌呤核苷、脫氧胸腺嘧啶核苷火脫氧胞嘧啶核苷;“DNA分子”)的磷酸酯 多聚體形式,或它們的任何磷酸酯類似物,例如硫代磷酸酯和硫酯。雙鏈DNA-DNA、DNA-RNA 和RNA-RNA螺旋是可能的。術(shù)語“核酸分子”,特別是DNA或RNA分子只是指該分子的一級 結(jié)構(gòu)和二級結(jié)構(gòu),并不限于任何具體的三級形式。因此,此術(shù)語包括在線形或環(huán)狀DNA分子 (例如,限制性片段)、質(zhì)粒、超螺旋化DNA和染色體中發(fā)現(xiàn)的雙鏈DNA,等等。討論特定雙 鏈DNA分子結(jié)構(gòu)時,本文可根據(jù)沿DNA的非轉(zhuǎn)錄鏈(即,具有與mRNA的同源序列的鏈)僅 以5’到3’方向給出序列的正常慣例描述序列?!爸亟MDNA分子”是經(jīng)分子生物學(xué)方法操作 的DNA分子。DNA包括但并不限于cDNA、基因組DNA、質(zhì)粒DNA、合成DNA以及半合成DNA。與多核苷酸序列一起使用的術(shù)語“片段”(例如“多核苷酸片段”)是指相對于參比 核酸長度降低并在共同部分包含與參比核酸相同的核苷酸序列的核苷酸序列。本發(fā)明的這 種核酸片段可以適當(dāng)?shù)匕谧鳛槠涑煞值妮^大多核苷酸中。所述片段包含長度為至少6、 8、9、10、12、15、18、20、21、22、23、24、25、30、39、40、42、45、48、50、51、54、57、60、63、66、70、 75、78、80、90、100、105、120、135、150、200、300、500、720、900、1000 或 1500 個本發(fā)明核酸的 連續(xù)核苷酸或由它們構(gòu)成。術(shù)語“嵌合”是指組成片段在天然狀態(tài)上不連續(xù)。例如,嵌合多核苷酸是指包含天 然狀態(tài)不連續(xù)片段的多核苷酸。與多核苷酸序列一起使用的術(shù)語“合成”是指與野生型多核苷酸序列不同的非天 然多核苷酸(或多核苷酸的一部分)。例如,一個合成基因(或基因的一部分)可以包含一 段或多段天然狀態(tài)不連續(xù)的核酸序列(嵌合序列),和/或可包含取代、插入、缺失及它們組
1=1 o“基因”是指包含編碼功能分子(例如多肽或RNA)的核苷酸的多核苷酸,包括cDNA 核酸或基因組DNA核酸。通常認為,編碼多肽或RNA的基因組DNA包括非編碼區(qū)(即內(nèi)含
8子),非編碼區(qū)從成熟mRNA上剪切下,從而不會在編碼同樣多核苷酸的cDNA或RNA中出現(xiàn)。 “基因”可以包含表達特定RNA、蛋白質(zhì)或多肽的核酸片段。“基因”還可在編碼序列上游(5’ 非編碼序列)和下游(3’非編碼序列)包含調(diào)控序列。“基因”還可包含三鏈形成寡核苷酸 (TF0)。“天然基因”是指在自然界發(fā)現(xiàn)的帶有其自身調(diào)控序列的基因?!扒逗匣颉被颉爸?組基因”是指不屬于天然基因的任何基因,包含無法在自然界一起找到的調(diào)控和/或編碼序 列。因此,嵌合基因可包含來源不同的調(diào)控序列和編碼序列,或來源相同但是按照不同于自 然方式排列的調(diào)控序列和編碼序列。嵌合基因可包含來源不同的編碼序列和/或來源不同 的調(diào)控序列。“內(nèi)源基因”是指位于生物體基因組內(nèi)其天然位置的天然基因?!巴鈦怼被颉巴庠础被颉ⅰ爱愒础被蚧颉稗D(zhuǎn)基因”是指通常無法在宿主細胞或生物 體中找到的,而是通過基因轉(zhuǎn)移引入宿主細胞和生物體的基因。轉(zhuǎn)基因可包含插入非天然 生物體的天然基因、嵌合基因或合成基因。轉(zhuǎn)基因也可以是內(nèi)源基因的cDNA形式。轉(zhuǎn)基因 還可以是內(nèi)源突變基因的非突變形式,或內(nèi)源非突變基因的突變形式。轉(zhuǎn)基因還可以是治 療基因或?qū)嶒灮颍鐖蟾婊颉^D(zhuǎn)基因可以直接引入宿主生物體的靶細胞,或通過轉(zhuǎn)移 轉(zhuǎn)化細胞,例如自體細胞而間接引入宿主生物體?;虻摹?’非翻譯區(qū)”或“5’ UTR”應(yīng)理解為轉(zhuǎn)錄成初級RNA轉(zhuǎn)錄本(前體mRNA) 并位于編碼序列上游的一部分基因。初級轉(zhuǎn)錄本是初始RNA產(chǎn)物,包含內(nèi)含子和外顯子,由 DNA轉(zhuǎn)錄產(chǎn)生。許多初級轉(zhuǎn)錄本必須經(jīng)過RNA加工以形成具有生理活性的RNA。形成成熟 mRNA的加工過程包括修飾末端、切除內(nèi)含子、加帽和/或從前體RNA上剪切出各rRNA分子。 因此,mRNA的5’UTR是不會被翻譯成蛋白質(zhì)并位于編碼序列上游的一部分mRNA。在基因組 序列中,5’UTR通常被定義為位于轉(zhuǎn)錄起始點和起始密碼子之間的區(qū)域。脊椎動物mRNA的 5’非翻譯區(qū)(5’UTR)長度可以是幾十個堿基到幾百個堿基(Crowe等,2006 BMC Genomics 7 :16)?!昂铣?’ UTR”是一種不同于野生型5’ UTR多核苷酸序列的非天然5’ UTR。合成 5’UTR可以包含一段或多段在天然狀態(tài)上不連續(xù)的核酸序列(嵌合序列),和/或可包含取 代、插入、缺失及它們的組合?!凹艚狱c”、“內(nèi)含子_外顯子剪接點”或“剪接位點”是能被細胞的剪接裝置識別的 真核前體mRNA內(nèi)含子邊界處的區(qū)域,在此處,相鄰的兩個外顯子被拼接,內(nèi)含子被切除。剪 接位點由5’和3’內(nèi)含子/外顯子交界處的保守序列所示。對于絕大多數(shù)內(nèi)含子,最保守的 序列側(cè)接內(nèi)含子5’端的GU序列和側(cè)接3’端的AG。然而上述共有序列也有已知的例外情 況,例如具有AU-AC剪接位點的內(nèi)含子。內(nèi)含子/外顯子交界處的5’剪接位點被稱為“剪 接供體”位點。內(nèi)含子/外顯子交界處的3’剪接位點被稱為“剪接受體”位點?!凹艚芋w”是用作細胞剪接裝置的大的核糖核蛋白復(fù)合物。剪接體包含在前體 mRNA底物上進行裝配的核內(nèi)小分子核糖核蛋白(snRNP)亞基。snRNP本身又包含核內(nèi)小 RNA(snRNA)和若干蛋白質(zhì)亞基。在剪接反應(yīng)過程中,通過與snRNA的堿基配對識別前體 mRNA內(nèi)的剪接位點?!爱愒础?DNA是指天然狀態(tài)下在細胞或細胞染色體部位中不存在的DNA。因此異源 DNA含有細胞以外來源的基因?!爱愒?DNA還可含有天然狀態(tài)下在細胞中存在、但是位于非 天然位置的基因。此外,“異源”DNA分子可以是包含與宿主DNA片段,例如轉(zhuǎn)錄啟動子操作 性連接的非宿主DNA片段的DNA分子。相反地,異源DNA分子可包含與外源啟動子操作性連接的內(nèi)源基因。此外,“異源”可以是指來自與參比DNA分子或片段的不同進化起源的基 因的DNA分子或片段。術(shù)語“基因組”包括染色體以及線粒體、葉綠體、病毒DNA或RNA。術(shù)語“探針”是指可以與互補的單鏈靶核酸進行堿基配對形成雙鏈分子的單鏈核 酸分子。DNA “編碼序列”指編碼多肽的雙鏈DNA序列,當(dāng)置于合適調(diào)控序列的控制下,其可 以在體外、體內(nèi)的細胞內(nèi)或在細胞外,例如試管內(nèi)轉(zhuǎn)錄和翻譯成多肽。“合適的調(diào)控序列”是 指位于編碼序列上游(5’非編碼序列)、當(dāng)中或下游(3’非編碼序列)的核苷酸序列,對轉(zhuǎn) 錄、RNA的加工或穩(wěn)定性、或相關(guān)編碼序列的翻譯產(chǎn)生影響。調(diào)控序列可以包括啟動子、翻 譯前導(dǎo)序列、內(nèi)含子、多聚腺苷酸化識別序列、RNA加工位點、效應(yīng)子結(jié)合位點和莖環(huán)結(jié)構(gòu)。 編碼序列的邊界由5’(氨基)端的起始密碼子和3’(羧基)端的終止密碼子決定。編碼 序列包括但并不限于原核、真核或嵌合序列、來自mRNA的cDNA、基因組DNA序列以及甚至合 成DNA序列。“開放讀框”縮寫作0RF,指一段核酸序列(DNA、cDNA或RNA),包含翻譯起始信號或 起始密碼子,例如ATG或AUG,以及終止密碼子,所述片段具有翻譯成多肽序列的潛能。術(shù)語“下游”是指位于參比核苷酸序列3’端的核苷酸序列。具體地說,下游核苷 酸序列通常涉及位于轉(zhuǎn)錄起始點之后的序列。例如,基因的翻譯起始密碼子位于轉(zhuǎn)錄起始 點的下游。術(shù)語“上游”是指位于參比核苷酸序列5’端的核苷酸序列。具體地說,上游核苷 酸序列通常涉及位于編碼序列或轉(zhuǎn)錄起始點5’側(cè)的序列。例如,大多數(shù)啟動子位于轉(zhuǎn)錄起 始點的上游。與DNA序列相關(guān)的“化學(xué)合成”指組分核苷酸在體外裝配。人工化學(xué)合成DNA可 以采用熟知的方法進行,或者可利用可商品化購得的機器進行自動化化學(xué)合成。因此,為達 到最佳的基因表達效果,可以基于核苷酸序列的優(yōu)化對基因進行修飾加工,以反映出宿主 細胞的密碼子偏好。本領(lǐng)域普通技術(shù)人員能夠理解,如果使用的密碼子與宿主偏好的密碼 子相符,基因表達的成功率會增大??梢砸罁?jù)檢測源于有序列信息可用的宿主的基因來確 定偏好密碼子。術(shù)語“限制性內(nèi)切酶”和“限制酶”可以互換使用,指在雙鏈DNA中與特定核苷酸 序列結(jié)合并在其中進行切割的酶。“多肽”、“肽”和“蛋白質(zhì)”可以互換使用,指包含共價結(jié)合的氨基酸殘基的多聚體 化合物。氨基酸具有以下的通用結(jié)構(gòu)“多聚酶鏈?zhǔn)椒磻?yīng)”縮寫作PCR,指一種體外酶促擴增特定核酸序列的方法。PCR涉 及一系列重復(fù)的溫度循環(huán)反應(yīng),每個循環(huán)包括三個階段模板核酸變性,分離出靶分子鏈; 單鏈PCR寡核苷酸引物與模板核酸退火,;利用DNA多聚酶對退火引物進行延伸反應(yīng)。術(shù)語“同源性”指兩個多核苷酸或兩個多肽部分之間的相同性百分比??赏ㄟ^本 領(lǐng)域已知的技術(shù)測定一個部分的序列與另一部分的序列之間的對應(yīng)性。例如,可通過比對 序列信息并利用不難獲得的計算機程序來直接比較兩個多肽分子之間的序列信息從而測 定同源性?;蛘?,可通過同源性區(qū)域之間能形成穩(wěn)定雙鏈體的條件下使得多核苷酸雜交,然 后用單鏈同源性核酸酶消化并測定消化片段的大小來測定同源性。
在本發(fā)明中使用的所有語法形式和拼寫變化的術(shù)語“同源的”,是指具有“共同進 化起源”的蛋白質(zhì)之間的關(guān)系,包括來自超家族的蛋白質(zhì)(例如免疫球蛋白超家族)和來 自不同物種的同源蛋白質(zhì)(例如肌球蛋白輕鏈等)(Reeck等,Cell 50:667(1987))。如高 度的序列相似性所反映,所述蛋白(及其編碼基因)具有序列同源性。然而,在通常的使用 和本申請中,術(shù)語“同源的”在被副詞“高度”修飾時,可指序列相似性而不是共同的進化起 源。因此,所有語法形式和拼寫變化的術(shù)語“序列相似性”指可能具有或不具有共同進 化起源的核酸或蛋白質(zhì)的氨基酸序列之間的相同性或?qū)?yīng)性程度(見Reeck等,Cell 50 667(1987))。在一個實施方式中,當(dāng)兩段DNA序列在規(guī)定長度上有至少約21% (優(yōu)選地至 少約50%,更加優(yōu)選地至少約75 %、90%、95%、96%、97%、98%或99% )的核苷酸相匹配 時,稱“基本上同源的”或“基本上相似的”??衫眯蛄袛?shù)據(jù)庫中可得的標(biāo)準(zhǔn)軟件,或在,例 如特定體系所規(guī)定的嚴(yán)謹性條件下采用Southern雜交實驗來比較序列,從而鑒定基本上 同源的序列。設(shè)定合適的雜交條件為本領(lǐng)域已知技術(shù)(見,例如Sambrook等,1989,下文)。本文所用的“基本上相似”指這樣一種核酸片段,其中一個或多個核苷酸堿基中的 改變導(dǎo)致一個或多個氨基酸取代,但是并不影響DNA序列編碼的蛋白質(zhì)的功能性質(zhì)。“基本 上相似”還指這樣一種核酸片段,其中一個或多個核苷酸堿基中的改變不影響該核酸片段 通過反義或共_阻遏技術(shù)介導(dǎo)基因表達改變的能力。“基本上相似”還指本發(fā)明核酸片段的 修飾物,例如缺失或插入不實質(zhì)性影響所得轉(zhuǎn)錄物功能特性的一個或多個核苷酸堿基。因 此,應(yīng)該知道本發(fā)明包括多個具體的示范性序列。與測定編碼產(chǎn)物的生物學(xué)活性的保留程 度一樣,所提出的各種修飾是本領(lǐng)域的常規(guī)技術(shù)。此外,本領(lǐng)域技術(shù)人員知道,還可以通過在嚴(yán)謹條件下的雜交能力來確定本發(fā)明 所包括的基本上相似的序列。當(dāng)單鏈形式的核酸分子可在合適的溫度和溶液離子強度的 條件下與另一核酸分子退火時,稱該核酸分子可與另一核酸分子,例如cDNA、基因組DNA或 RNA“雜交”(見Sambrook等,1989,infra)。雜交和洗滌條件為已知技術(shù),例子見Sambrook, J. , Fritsch, E. F.禾口 Maniatis, T. Molecular Cloning, A Laboratory Manual (分子克隆 實驗室手冊),第二版,冷泉港實驗室出版社(Cold Spring Harbor Laboratory Press),冷 泉港(1989),尤其是其中的第11章和表11. 1。溫度和溶液離子強度條件決定雜交的“嚴(yán)謹 性”??梢哉{(diào)整嚴(yán)謹條件來以篩選適度相似的片段,例如遠相關(guān)生物體的同源性序列, 到高度相似片段,例如復(fù)制極其相關(guān)生物體的功能酶的基因。對于同源核酸的初級篩選來 說,可以采用對應(yīng)Tm為55°C的低嚴(yán)謹性雜交條件,例如,5XSSC,0. 1 % SDS,0. 25%牛奶,無 甲酰胺;或30%甲酰胺,5XSSC,0. 5% SDS。中等嚴(yán)謹性雜交條件的對應(yīng)Tm稍高,例如,40% 甲酰胺,5X或6XSSC。高嚴(yán)謹性雜交條件的對應(yīng)Tm最高,例如,50%甲酰胺,5X或6XSSC。雜交要求兩個核酸必須含有互補序列,雖然依賴于雜交嚴(yán)謹性,但是仍然可能發(fā) 生堿基之間的錯配。術(shù)語“互補”用來描述能夠相互雜交的核苷酸堿基之間的關(guān)系。例如, 對于DNA,腺嘌呤與胸腺嘧啶互補,胞嘧啶與鳥嘌呤互補。因此,本發(fā)明也包括與本文公開或 使用的完整序列以及基本上相似的核酸序列互補的分離核酸片段。在一個實施方式中,多核苷酸檢測采用的雜交條件包括在55°C的Tm下進行雜交 步驟,以及前述其它條件。在另一個實施方式中,Tm為60°C ;在某些實施方式中,Tm為63°C
11或 65°C。雜交后洗滌也決定嚴(yán)謹性條件。一套優(yōu)選條件采用一系列洗滌,開始用6XSSC、 0.5% SDS,在室溫下洗滌15分鐘(min),接著用2XSSC、0. 5% SDS,在45°C下重復(fù)洗滌30 分鐘,再用0. 2XSSC、0. 5% SDS,在50°C下重復(fù)洗滌兩次,每次30分鐘。另一個嚴(yán)謹條件的 實施例采用較高的溫度,除最后用0. 2XSSC、0. 5% SDS的兩次30分鐘洗滌的溫度升高到 60°C外,其它洗滌條件與前述相同。還有一個高度嚴(yán)謹條件的實施例在最后兩次漂洗中采 用0. 1XSSC,0. 1% SDS,65°C。雜交要求兩個核酸必須含有互補序列,雖然依賴于雜交嚴(yán)謹 性,但是仍然可能發(fā)生堿基之間的錯配。核酸雜交合適的嚴(yán)謹性依賴于本領(lǐng)域熟知的核酸長度和互補程度。兩段核苷酸序 列之間的相似性和同源性越高,具有此兩段序列的核酸雜交體的Tm值就越高。核酸雜交的 相對穩(wěn)定性(對應(yīng)于更高的Tm)按以下順序遞減RNA:RNA,DNA:RNA, DNA:DNA。對于長度 大于100個核苷酸的雜交體,已推導(dǎo)出計算Tm的公式(見Sambrook等,同上,9. 50-0. 51)。 對于較短的核酸,即寡核苷酸的雜交,錯配發(fā)生的位置更為重要,寡核苷酸的長度決定其特 異性(見 Sambrook 等,同上,11. 7-11. 8)。在一個實施方式中,多核苷酸檢測采用的雜交條件包括在濃度小于500mM的鹽溶 液中、至少37°C下進行雜交步驟,以及用2XSSPE在至少63°C下進行洗滌步驟。在另一個實 施方式中,雜交條件包括在濃度小于200mM的鹽溶液中、至少37°C下進行雜交步驟。在某些 實施方式中,雜交條件包括雜交和洗滌步驟均采用2XSSPE和63°C。可雜交核酸的長度,例如,是至少約10個核苷酸??呻s交核酸的最小長度可能是 至少約15個核苷酸;至少約20個核苷酸;或至少約30個核苷酸。此外,本領(lǐng)域技術(shù)人員能 夠理解,如果需要可以根據(jù)例如探針長度等因素調(diào)整溫度和洗滌溶液離子濃度。本發(fā)明的基本上相似的核酸片段是其DNA序列與本文報道的核酸片段的DNA序列 具有至少70%相同的核酸片段。本發(fā)明的核酸片段包括其DNA序列與本文報道的核酸片段 的DNA序列具有至少80%、90%、95%、96%、97%、98%和99%相同的核酸片段。術(shù)語“對應(yīng)于”在本文用來指相似或同源的序列,無論精確位置與檢測相似性和同 源性的參比分子是否相同。核酸或氨基酸序列的比對可包括空位。因此術(shù)語“對應(yīng)于”指 序列相似性,而不是氨基酸殘基或核苷酸堿基的編號。氨基酸或核苷酸序列的“實質(zhì)性部分”包含足夠的多肽氨基酸序列或基因核苷酸 序列,從而本領(lǐng)域技術(shù)人員通過人工序列評估或使用算法,例如BLAST (局部序列比對基本 檢索工具;Altschul等,J.MoI.Biol. 215 =403410(1993))進行計算機自動序列比較識別和 鑒定來推定該多肽或基因;BLAST算法,是互聯(lián)網(wǎng)上的公共可用資源。通常,10個或更多個 毗連的氨基酸或30個或更多個核苷酸的序列是推測性鑒定與已知蛋白質(zhì)或基因同源的多 肽或核酸序列所需。此外,對于核苷酸序列,包含20個到30個連續(xù)核苷酸的基因特異性寡 核苷酸探針可用于基因鑒定(例如Southern雜交)和分離(例如細菌菌落或噬菌斑的原 位雜交)的序列依賴性方法。另外,12個到15個堿基的短寡核苷酸可在PCR中用作擴增引 物,來獲得包含此引物的特定核酸片段。因此,核苷酸序列的“實質(zhì)性部分”包含足夠的序 列以特異性鑒定和/或分離包含此序列的核酸片段。本領(lǐng)域已知的術(shù)語“相同性百分比”是通過比較序列測定的兩條或更多條多肽序 列或兩條或更多條多核苷酸序列之間的關(guān)系。在本領(lǐng)域中,“相同性”還表示多肽或多核苷酸序列之間的序列關(guān)聯(lián)性程度,例如通過這些序列諸鏈之間的匹配測定的。不難通過已 知的方法計算“相同性”和“相似性”,所述方法包括但不限于以下描述的Computational Molecular Biology (計算分子生物學(xué))(Lesk,A.M.編)牛津大學(xué)出版社(Oxford University Press),紐約(1988) ;Biocomputing Informatics and Genome Projects (生 物計算信息和基因組項目)(Smith,D.W.編)學(xué)術(shù)出版社(Academic Press),紐約 (1993) ;Computer Analysis of Sequence Data(序列數(shù)據(jù)的計算機分析),第 I 部分 (Griffin, A.M.和 Griffin,H. G.編)休瑪効卩出版社(HumanaPress),新澤西州(1994); Sequence Analysis in Molecular Biology(^^^^^W^^J^lif) (von Heinje,G. IS) 學(xué)術(shù)出版社(1987);和 Sequence Analysis Primer(序列分析引物)(Gribskov,M.和 Devereux, J.編)斯托克頓出版社,紐約(1991)。測定相同性的方法設(shè)計成能給出所測試 序列之間的最佳匹配。測定相同性和相似性的方法編成公眾可得的計算機程序。可利用威 斯康星州麥迪遜市DNA星公司的激光基因生物信息學(xué)計算套件的大型比對程序(Megalign program of the LASERGENE bioinformaticscomputing suite, DNASTAR Inc. , Madison, WI)進行序列比對和相同性百分比計算??衫脜?shù)默認(GAP PENALTY = 10,GAP LENGTH PENALTY = 10)的群集比對方法(Clustal method of alignment) (Higgins 等,CABIOS. 5 151(1989))進行序列的多重比對。利用群集方法進行成對比對的默認參數(shù)可以選擇為 KTUPLE 1,GAP PENALTY = 3,WINDOW = 5 和 DIAGONALSSAVED = 5。術(shù)語“序列分析軟件”指可用于分析核苷酸或氨基酸序列的任何計算機算法或 軟件程序。“序列分析軟件”可以商品化購得或獨立開發(fā)的。典型的序列分析軟件包括但 不限于GCG程序套件(威斯康星軟件包(Wisconsinpackage)9.0版,遺傳學(xué)計算機課題 組(GCG),麥迪遜,威斯康星州)、BLASTP、BLASTN、BLASTX (Altschul 等,J. Mol. Biol. 215 403(1990))和DNASTAR (DNA星公司,圣帕克街1228號(S.Park St.),麥迪遜,威斯康星州, 53715美國)。在本申請的內(nèi)容中,應(yīng)該知道除非另有規(guī)定,利用序列分析軟件進行分析時, 分析的結(jié)果將依據(jù)引用的程序的“默認值”。本文所用的“默認值”表示首次啟動時,軟件原 始加載的任何一組數(shù)值或參數(shù)。本發(fā)明中使用的術(shù)語“表達”或“基因表達”是指通過基因“轉(zhuǎn)錄”(即,通過RNA 聚合酶的酶促作用)將編碼在基因中的遺傳信息轉(zhuǎn)化為RNA(例如mRNA、rRNA、tRNA或 snRNA),對于蛋白質(zhì)編碼基因,通過mRNA “翻譯”成蛋白質(zhì)的過程?;虮磉_在過程中的許 多階段受到調(diào)控?!吧险{(diào)”或“激活”是指增加基因表達產(chǎn)物(即RNA或蛋白質(zhì))的調(diào)控,而 “下調(diào)”或“阻遏”是指減少產(chǎn)量的調(diào)控。參與上調(diào)或下調(diào)過程的因子(例如轉(zhuǎn)錄因子)常 分別稱為“激活物”或“阻遏物”。出于本發(fā)明的目的,靶基因可通過與下調(diào)RNA分子的特異 性相互作用而“轉(zhuǎn)錄后”下調(diào)。術(shù)語“轉(zhuǎn)錄與翻譯調(diào)控序列”是指在宿主細胞中表達編碼序列的DNA調(diào)控序列,例 如啟動子、增強子、終止子等。術(shù)語“操作性連接”指核酸序列與一個核酸片段的結(jié)合,因此一個的功能受另一個 的影響。例如,當(dāng)啟動子能影響編碼序列的表達時(即此編碼序列處于此啟動子的轉(zhuǎn)錄調(diào) 控下),稱該啟動子操作性連接于該編碼序列。編碼序列可以有義或反義方向操作性連接于 調(diào)控序列?!拜d體”指用于將核酸克隆和/或傳遞入宿主細胞的任何運載體。。載體可以是可與另一 DNA區(qū)段相連從而復(fù)制所連區(qū)段的復(fù)制子?!皬?fù)制子”指用作DNA體內(nèi)復(fù)制的自主單 元,即能在其本身控制下復(fù)制的任何遺傳元件(例如,質(zhì)粒、噬菌體、粘粒、染色體、病毒)。 術(shù)語“載體”包括在體外、離體或體內(nèi)將核酸引入宿主細胞的病毒和非病毒媒介。術(shù)語“載 體”也可包括小環(huán)DNA。例如,載體可以是沒有細菌DNA序列的質(zhì)粒。去除富含CpG區(qū)域 的細菌DNA序列已被證明可以減少轉(zhuǎn)基因表達沉默,使來自質(zhì)粒DNA載體的表達持續(xù)更久 (見例如 Ehrhardt,A.等(2003) Hum Gene Ther 10 215-25 ;Yet,N. S. (2002) Mo I Ther 5 731-38 ;Chen, Z. Y.等(2004)Gene Ther 11:856-64)。術(shù)語“載體”還可以包括轉(zhuǎn)座子,例 如“睡美人”(Sle印ing Beauty) (Izsvak 等,J. Mol. Biol. 302 :93_102 (2000)),或人工染色 體。本領(lǐng)域有大量的已知載體可以用來進行核酸操作、將反應(yīng)元件和啟動子整合入基 因內(nèi)等,或?qū)⒑怂徂D(zhuǎn)移到宿主細胞內(nèi)。可用的載體包括,例如質(zhì)?;蛐揎棽《?,包括例如入 噬菌體衍生物等噬菌體,或PBR322或pUC質(zhì)粒衍生物或Bluescript載體等質(zhì)粒。更大的載 體,例如人工染色體(細菌(BAC)、酵母(YAC)或人(HAC)的人工染色體),可以用來容納更 大的插入片段。例如,可以通過把合適的DNA片段連接到所選的具有互補粘性末端的載體, 將對應(yīng)于反應(yīng)元件或啟動子的DNA片段插入到合適的載體?;蛘?,可以把核苷酸序列(接 頭)連接到DNA末端,對DNA分子的兩端進行酶促修飾或生成任何位點。此類載體經(jīng)工程 改造可含有可選擇的標(biāo)記基因,以便篩選被載體轉(zhuǎn)染或轉(zhuǎn)化的細胞。本發(fā)明的包含多核苷 酸的重組載體可包含要在其中擴增或表達的細胞宿主的一個或多個復(fù)制起點、標(biāo)記或可選 擇的標(biāo)記。術(shù)語“可選擇標(biāo)記”指鑒定因子,通常是能基于標(biāo)記基因的作用而選擇的抗生素或 化學(xué)耐受基因(即耐受抗生素、耐受除草劑)、比色標(biāo)記、酶、熒光標(biāo)記等,其中該作用用于 示蹤感興趣核酸的遺傳性和/或鑒定或選擇遺傳了該感興趣核酸的細胞或生物體。本領(lǐng)域 已知并使用的可選擇標(biāo)記的例子包括提供氨芐青霉素、鏈霉素、慶大霉素、卡那霉素、潮霉 素、雙丙氨酰膦除草劑、磺酰胺等耐受性的基因;和用作表型標(biāo)記的基因,即,花青甙調(diào)節(jié)基 因、異戊烯轉(zhuǎn)移酶基因(isopentanyl transferase gene)等術(shù)語“報道基因”指編碼能依據(jù)報道基因的作用而得到鑒定的鑒定因子的核酸, 其中該作用用于示蹤感興趣核酸的遺傳性,鑒定已遺傳了感興趣核酸的細胞或生物體,和/ 或檢測基因表達誘導(dǎo)或轉(zhuǎn)錄。本領(lǐng)域已知并使用的報道基因的例子包括但不限于螢光素 酶(Luc)、熒光蛋白,例如綠色熒光蛋白(GFP)、氯霉素乙酰轉(zhuǎn)移酶(CAT)、半乳糖苷酶 (LacZ)、葡糖醛酸糖苷酶(Gus)等。可選擇標(biāo)記基因也可視作報道基因。術(shù)語“質(zhì)粒”指常攜帶基因的染色體外元件,其不是細胞中心代謝的一部分,通常 是環(huán)狀雙鏈DNA分子的形式。這種元件可以是衍生自任何來源的單鏈或雙鏈DNA或RNA,線 形、環(huán)狀或超螺旋的自發(fā)復(fù)制序列、基因組整合序列、噬菌體或核苷酸序列,其中許多核苷 酸序列連接或重組入獨特構(gòu)建物中,該構(gòu)建物能將所選基因產(chǎn)物的啟動子片段和DNA序列 連同合適的3’非翻譯序列引入細胞?!翱寺≥d體”是指復(fù)制子,其是單元長度的核酸,例如DNA,其順序復(fù)制并包含復(fù)制 起點,例如質(zhì)粒、噬菌體或粘粒,另一個核酸片段可以連接到復(fù)制點從而復(fù)制所連接的片 段??寺≥d體可以在一種類型的細胞中復(fù)制而在另一種類型的細胞中表達(“穿梭載體”)。術(shù)語“表達載體”指載體、質(zhì)?;蜻\載體,其設(shè)計成能在轉(zhuǎn)化入宿主細胞后表達所
14插入的核酸序列。克隆的基因,即,插入的核酸序列通常置于調(diào)控元件,例如啟動子、最小啟 動子、增強子等的控制下。可用于驅(qū)動核酸在所需宿主細胞中表達的啟動調(diào)控區(qū)或啟動子 多種多樣,并為本領(lǐng)域技術(shù)人員所熟悉??赏ㄟ^本領(lǐng)域已知的方法,例如轉(zhuǎn)染、電穿孔、顯微注射、轉(zhuǎn)導(dǎo)、細胞融合、DEAE葡 聚糖、磷酸鈣沉淀、脂質(zhì)轉(zhuǎn)染(溶酶體融合)、利用基因槍或DNA載體運輸?shù)鞍讓⑤d體引入所 需的宿主細胞(參見,例如 Wu 等,J.Biol. Chem. 267 =963(1992) ;Wu 等,J. Biol. Chem. 263 14621(1988);和Hartmut等,1990年3月15日提交的加拿大專利申請?zhí)?,012,311)。真核載體的例子包括但并不限于斯特拉塔基因公司(Stratagene)購得的 pW-LNE0、pSV2CAT、p0G44、pXTl 和 pSG ;從 APB 公司(AmershamPharmacia Biotech)購得的 pSVK3、pBPV、pMSG 和 pSVL ;以及從克隆技術(shù)公司(Clontech)購得的 pCMVDsRed2_express、 pIRES2-DsRed2、pDsRed2_Mito、pCMV_EGFP。此外還有其它許多公知而可商品化購得的載 體。例如,美國專利申請?zhí)?004/0185556、美國專利申請?zhí)?1/233,246以及國際專利 申請?zhí)朩02005/040336和W02005/116231描述了包含分子插入支點以供快速插入和除去基 因程序元件的有用載體?!皢幼印焙汀皢幼有蛄小笨苫Q使用,指可以控制編碼序列或功能性RNA表達的 DNA序列。通常,編碼序列位于啟動子序列的3’端。啟動子可以完全衍生自天然基因,或由 衍生自天然發(fā)現(xiàn)的不同啟動子的不同元件構(gòu)成,或者甚至包含合成的DNA區(qū)段。本領(lǐng)域技 術(shù)人員能夠理解,不同啟動子可以在不同組織或不同類型的細胞中、或在發(fā)育的不同階段、 或?qū)Σ煌h(huán)境或生理條件起反應(yīng)而指導(dǎo)基因表達。促使基因在大多數(shù)類型的細胞中并在大多數(shù)時間內(nèi)表達的啟動子通常稱為“組成 啟動子”。促使基因在特定類型的細胞中表達的啟動子通常稱為“條件啟動子”。條件啟動 子的非限制性例子有“細胞特異性啟動子”或“組織特異性啟動子”。促使基因在發(fā)育或細 胞分化的特定階段表達的啟動子通常被稱為“發(fā)育特異性啟動子”或“細胞分化特異性啟動 子”。在與誘導(dǎo)啟動子的藥劑、生物分子、化學(xué)品、配體、光等接觸或用這些物質(zhì)處理細胞后 得到誘導(dǎo)并導(dǎo)致基因表達的啟動子通常稱為“誘導(dǎo)型啟動子”或“可調(diào)節(jié)啟動子”??烧T導(dǎo) 啟動子的一個非限制性例子是TetO可誘導(dǎo)啟動子。還應(yīng)知道,由于在大多數(shù)情況中,調(diào)控 序列的確切邊界并未完全限定,不同長度的DNA片段可具有相同的啟動子活性。啟動子序列通常在其3’端以轉(zhuǎn)錄起始點為界,向上游延伸(5’方向)以包含在可 檢測背景水平啟動轉(zhuǎn)錄所需的最少數(shù)量的堿基或元件。在啟動子序列中可以發(fā)現(xiàn)轉(zhuǎn)錄起始 點(通過,例如核酸酶S1作圖不難限定),以及負責(zé)結(jié)合RNA聚合酶的蛋白質(zhì)結(jié)合區(qū)域(共 有序列)。在RNA聚合酶將編碼序列轉(zhuǎn)錄成mRNA時,編碼序列處于細胞中轉(zhuǎn)錄與翻譯調(diào)控序 列的“控制之下”,接著經(jīng)反式RNA剪接(如果編碼序列包含內(nèi)含子)和翻譯成編碼序列編 碼的蛋白質(zhì)。終止調(diào)控區(qū),即終止子或多聚腺苷酸化序列還可衍生自對優(yōu)選宿主而言各種天然 的基因。任選地,終止位點可不是必需的,但最好包含。在本發(fā)明的一個實施方式中,終止 調(diào)控區(qū)可以由以下組分構(gòu)成或衍生自它們合成序列、合成多聚腺苷酸化信號、SV40晚期 多聚腺苷酸化信號、SV40多聚腺苷酸化信號、牛生長激素(BGH)多聚腺苷酸化信號、病毒終止子序列等。術(shù)語“轉(zhuǎn)染”指細胞攝取外源性或異源的RNA或DNA。當(dāng)這種RNA或DNA被引入細 胞,稱該細胞被外源性或異源的RNA或DNA “轉(zhuǎn)染”。轉(zhuǎn)染的RNA或DNA可以整合(共價相 連)入構(gòu)成細胞基因組的染色體DNA?!稗D(zhuǎn)化”指將核酸片段傳遞入宿主生物體的基因組,從而導(dǎo)致遺傳學(xué)穩(wěn)定的遺傳 性。術(shù)語“調(diào)節(jié)”是指誘導(dǎo)、降低或抑制核酸或基因表達,從而分別誘導(dǎo)、降低或抑制蛋 白質(zhì)或多肽生成?!癛NA轉(zhuǎn)錄本”是指RNA聚合酶催化的DNA序列轉(zhuǎn)錄的產(chǎn)物。當(dāng)RNA轉(zhuǎn)錄本是DNA 序列的完美互補拷貝時,被稱為初級轉(zhuǎn)錄本,或者它可以是衍生自初級轉(zhuǎn)錄本的轉(zhuǎn)錄后加 工的RNA序列,稱為成熟mRNA。“信使RNA(mRNA),,是指沒有內(nèi)含子并可以被細胞翻譯成蛋 白質(zhì)的RNA?!癱DNA”是指與mRNA互補并來自mRNA的雙鏈DNA。“有義”RNA是指包括mRNA 在內(nèi)的RNA轉(zhuǎn)錄本,同樣可以被細胞翻譯成蛋白質(zhì)。本發(fā)明的一個實施方式是包含第一多核苷酸片段和第二多核苷酸片段的合成 5’ UTR多核苷酸,其中a.第一多核苷酸片段包含第一真核基因的至少一個剪接位點;b.第二多核苷酸片段包含第二真核基因的至少一部分5’非翻譯區(qū);以及c.第一多核苷酸片段位于第二多核苷酸片段的5’端。在本發(fā)明的另一實施方式中,所述合成5’ UTR是包含第一多核苷酸片段和第二多 核苷酸片段的嵌合多核苷酸,其中a.第一多核苷酸片段包含肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因的第2個內(nèi)含子;b.第二多核苷酸片段包含酪蛋白基因的至少一部分5’非翻譯區(qū)(5’ UTR);以及c.第一多核苷酸片段位于第二多核苷酸片段的5’端。包含肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因的第2個內(nèi)含子的多核苷酸片段可以衍生自任 何真核肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因。在本發(fā)明的一個實施方式中,包含真核肌質(zhì)網(wǎng)/內(nèi)質(zhì) 網(wǎng)鈣ATP酶基因的第2個內(nèi)含子的多核苷酸片段衍生自SERCA2基因。在其它實施方式中, 它衍生自SERCA1或SERCA3基因。作為包含所述第2個內(nèi)含子的多核苷酸片段來源的肌質(zhì) 網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因可以來自任何其它真核物種。在一個實施方式中,肌質(zhì)網(wǎng)/內(nèi)質(zhì) 網(wǎng)鈣ATP酶基因來自哺乳動物。在另一個實施方式中,肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因來自 鳥類。在另一個實施方式中,肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因來自魚類。在特定的實施方式 中,包含所述第2個內(nèi)含子的多核苷酸片段來自人、狗、小鼠的肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基 因。在其它特定的實施方式中,包含所述第2個內(nèi)含子的多核苷酸片段來自大鼠、黑猩猩、 雞、馬、奶牛、麇鹿、豬、貓、獼猴或斑馬魚的肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因。在本發(fā)明的另一實施方式中,包含肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因的第2個內(nèi)含子 的多核苷酸片段包含側(cè)接5’端的外顯子2的一部分和側(cè)接3’端的外顯子3的一部分。在 另一實施方式中,包含肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因的第2個內(nèi)含子的多核苷酸片段包含 側(cè)接5’端的整個外顯子2和側(cè)接3’端的整個外顯子3。包含肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因的第2個內(nèi)含子的多核苷酸片段的長度可以為 至少約50個核苷酸。在其它實施方式中,包含肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因的第2個內(nèi)
16含子的多核苷酸片段的長度可以為至少約60、70、80、90、100、110、120、130、140、150、160、 170、180、190、200、210、220、230、240 或 250 個核苷酸。在本發(fā)明的另一實施方式中,包含肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因的第2個內(nèi)含子 的多核苷酸片段在推定共有polyA位點具有突變。在另一實施方式中,包含肌質(zhì)網(wǎng)/內(nèi)質(zhì) 網(wǎng)鈣ATP酶基因的第2個內(nèi)含子的多核苷酸片段包含外顯子2的5’端側(cè)翼部分和外顯子 3的3’端側(cè)翼部分,在推定共有polyA位點具有突變,衍生自犬SERCA2基因;在一個特定 的實施方式中由SEQ IDN0:2表示。在其它實施方式中,包含肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因的第2個內(nèi)含子的多核苷 酸片段是野生型或突變的部分SERCA2序列。所述多核苷酸片段可以衍生自任何物種的任 何全長SERCA2基因。例如,在一個實施方式中,包含肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因的第2 個內(nèi)含子的多核苷酸片段是野生型的部分犬SERCA2基因組序列,其包含側(cè)接5’端的外顯 子2的一部分和側(cè)接3’端的外顯子3的一部分;在一個特定的實施方式中,由SEQ ID NO 4表示。SEQ ID NO :4如圖1A和圖1C所示。在另一實施方式中,包含肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣 ATP酶基因的第2個內(nèi)含子的多核苷酸片段是野生型的部分人SERCA2基因組序列,其包含 側(cè)接5’端的外顯子2和側(cè)接3’端的外顯子3 ;在一個特定的實施方式中,由SEQ ID NO 5 表示。在另一實施方式中,包含肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因的第2個內(nèi)含子的多核苷酸 片段是野生型的部分小鼠SERCA2基因組序列,其包含側(cè)接5’端的外顯子2和側(cè)接3’端的 外顯子3 ;在一個特定的實施方式中,由SEQ ID NO 6表示。SEQ ID NO 5和SEQ ID NO 6 如圖1B和圖1C所示。在其它實施方式中,包含肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因的第2個內(nèi) 含子的多核苷酸片段是突變型或野生型的部分褐鼠SERCA2序列、馬SERCA2序列、牛SERCA2 序列、黑猩猩SERCA2序列、貓SERCA2序列、兔SERCA2序列、野豬SERCA2序列、獼猴SERCA2 序列、鹿SERCA2序列、雞SERCA2序列或斑馬魚SERCA2序列。包含酪蛋白基因5’非翻譯區(qū)的至少一部分的多核苷酸片段可以來自任何哺乳動 物。在一個實施方式中,包含至少一部分5’非翻譯區(qū)的多核苷酸片段來自牛酪蛋白基 因;在一個特定的實施方式中由SEQ ID N0:3表示。在另一個實施方式中,包含至少一部 分5’非翻譯區(qū)的多核苷酸片段來自小鼠酪蛋白基因;在一個特定的實施方式中由SEQ ID N0:8表示。在另一個實施方式中,包含至少一部分5’非翻譯區(qū)的多核苷酸片段來自大 鼠酪蛋白基因;在一個特定的實施方式中由SEQ ID NO :9表示。在另一個實施方式中, 包含至少一部分5’非翻譯區(qū)的多核苷酸片段來自綿羊酪蛋白基因;在一個特定的實施 方式中由SEQ ID N0:10表示。在其它實施方式中,包含至少一部分5’非翻譯區(qū)的多核苷 酸片段來自水牛酪蛋白基因、山羊酪蛋白基因、馬酪蛋白基因、野豬酪蛋 白基因、駱駝酪蛋白基因、兔酪蛋白基因或犬酪蛋白基因。包含酪蛋白基因5’非翻譯區(qū)的至少一部分的多核苷酸片段的長度可以為至少約 25個核苷酸。在其它實施方式中,包含至少一部分5’UTR的酪蛋白基因的多核苷酸片段的 長度可以為至少約30、35、40、45、50、55、60、65、70、75、85、90、100個或更多個核苷酸。在另 一實施方式中,包含酪蛋白基因5’UTR的至少一部分的多核苷酸片段可以代表至少約50% 的天然5’ UTR序列。在其它實施方式中,包含酪蛋白基因5’ UTR的至少一部分的多核苷 酸片段可以代表至少約55%、60%、65%、70%、75%、80%、85%、90%、95%或更多的天然 5’ UTR序列。在另一實施方式中,包含酪蛋白基因5’ UTR的至少一部分的多核苷酸片段可
17以代表整個天然5’ UTR序列。在其它實施方式中,各組件(包含肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因的第2個內(nèi)含子 的多核苷酸片段和包含一個酪蛋白基因5’UTR的至少一部分的多核苷酸片段)的功能變體 用來構(gòu)建合成5’UTR。功能變體包括取代、插入和缺失變體及其組合。取代變體是指核苷 酸序列中至少一個堿基被去除并有一個不同堿基插入其位置的那些變體。核酸的插入變體 是指在序列的預(yù)定位置上引入一個或多個核苷酸的那些變體。核酸的缺失變體的特征在于 從核酸中去除一個或多個核苷酸??梢源嬖谌〈⑷笔Щ虿迦氲娜魏谓M合,只要組件的功能 維持大致相同,即當(dāng)功能變體用于本發(fā)明合成5’ UTR時,可以使感興趣的序列、合成基因或 轉(zhuǎn)基因的表達增強。此外,可以用與本文公開的包含肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因的第2個內(nèi)含子的 多核苷酸片段的特定實施方式(SEQ ID N0:2、SEQ ID NO :4、SEQID NO :5和SEQ ID NO 6) 同源的序列,以及與包含酪蛋白基因5’ UTR的至少一部分的多核苷酸片段的特定實施方式 (SEQ ID N0:3、SEQ ID NO :8、SEQID NO :9和SEQ ID NO 10)同源的序列來構(gòu)建合成5,UTR。 如前所述,構(gòu)建合成5’ UTR的片段的合適來源包括任何真核物種的肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP 酶基因和任何哺乳動物的酪蛋白基因。在一個實施方式中,包含肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶 基因的第2個內(nèi)含子的多核苷酸片段衍生自犬SERCA2、小鼠SERCA2或人SERCA2的同源物。 在另一實施方式中,包含酪蛋白基因5’ UTR的至少一部分的多核苷酸片段來自牛酪蛋 白、小鼠酪蛋白、大鼠酪蛋白或綿羊酪蛋白的同源物。檢索和鑒定肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶同源物或酪蛋白5’UTR同源物的方法為本領(lǐng) 域技術(shù)人員所知。此類方法包括將SEQ ID NO :2-6和8-10表示的序列以計算機可讀形式 與公共數(shù)據(jù)庫和互聯(lián)網(wǎng),例如MIPS、GenBank或EMBL核酸序列數(shù)據(jù)庫中的序列進行比較,序 列的比對或比較采用本領(lǐng)域公知的算法,例如GAP(Needleman和Wunsch,J. MoL Biol. 48 ; 443453(1970))、BESTFIT(Miller, ff.,Myers, E. ff.禾口 Lipman, D. J.,J. MoL Biol. 215 403-410 (1990))、FASTA 和 TFASTA (ff. R. Pearson 和 D. J. Lipman Proc. Natl. Acad. Sci. USA 85 =2444-2448(1988)) 實施BLAST分析的軟件是美國國家生物技術(shù)信息中心的公眾可得 資源。合適的同源物可以通過使用BLAST默認參數(shù)(BL0SUM62矩陣,空位開放罰分11和空 位延伸罰分1)鑒定。此外,犬、人或小鼠SERCA2的同源物也可以通過在SERCA2基因的保守序列上進行 檢索來鑒定。例如,犬SERCA2的外顯子3的全序列,例如SEQID N0 11可以在BLAST檢索 中用作查詢序列??梢灶A(yù)見,與將包含內(nèi)含子序列的序列用作查詢序列相比,在BLAST檢索 中將外顯子序列作為查詢序列會獲得更多的SERCA2同源物。相似地,牛、小鼠、大鼠或綿羊
酪蛋白的同源物也可以通過將編碼部分作為查詢序列進行檢索而鑒定。也可分析基因組序列以便鑒定肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶同源物或酪蛋白5’UTR同 源物。有若干算法和軟件工具可用以鑒定原始DNA序列中的基因。此類工具通常將對DNA 序列統(tǒng)計參數(shù)的分析與基于同源性鑒定數(shù)據(jù)庫中同源序列的方法結(jié)合在一起。雖然單用 這些方法對于良好預(yù)測無一是可靠的,但將多種程序結(jié)合通??梢垣@得良好結(jié)果。此類工 具在互聯(lián)網(wǎng)上屬于公共可用的資源,公知例子包括GeneMark(Borodovsky,M.和Mclninch J. GeneMark parallel Gene Recognition for both DNA Strands (DNA 鏈的平行基因識別).Computers&Chemistry,17,123-133 (1993))、基因定位器和內(nèi)插馬爾科夫模型(Gene Locator and Interpolated MarkovModeler) (GLIMMER) (A. L. Delcher 等,Improved microbial geneidentification with GLIMMER(利用 GLIMMER 改進微生 物基因鑒定).Nucleic Acids Research, 27,4636-4641. (1999))、基因識別和裝配因特網(wǎng) 連接(Gene Recognition and Assembly Internet Link) (GRAIL)、基因掃描(GenScan) (Burge, C.禾口 Karlin, S.Prediction of complete gene structures inhuman genomic DNA(人基因組DNA中完整基因結(jié)構(gòu)的預(yù)測).J.MoL Biol. 268,78-94 (1997))以及基因構(gòu) 建(GeneBuilder)(Milanesi L.等,GeneBuilder :interactive in silico prediction of genes structure (基因構(gòu)建基因結(jié)構(gòu)的silico預(yù)測中的交互作用).Bioinformatics, 15(7) :612-621(1999))。組合分析可以由 TIGR 組合程序(J.E.Allen 等,Computational gene prediction using multiplesources of evidence (利用多證據(jù)來源的計算機基因 預(yù)測).Genome Research, 14(1),142-148(2004))完成,它利用來自其它詮釋軟件,例如 GeneMark、GlimmerM、GRAIL、GenScan和Fgenes的輸出結(jié)果對基因模型作出預(yù)測。它采用 統(tǒng)計算法來識別對應(yīng)于基因模型的不同形式的證據(jù)。肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因的第2個內(nèi)含子可以通過常規(guī)方法鑒定,例如在成 對比對程序中將基因的基因組DNA序列與它的mRNA或cDNA序列進行比較。同源區(qū)域代表 外顯子,而cDNA序列中缺乏但是基因組DNA中存在的間插序列則代表內(nèi)含子。內(nèi)含子序列 的開始和結(jié)束可以由其5’端側(cè)翼的GT和3’端側(cè)翼的AG確定。通過這種方法,由公開登 錄號NM_001003214代表的犬SERCA2的mRNA序列可用于在犬SERCA2基因組序列中鑒定內(nèi) 含子,而人和小鼠的SERCA2的mRNA序列(分別為NM_170665和NM_009722)則可以用來在 各自的基因組序列中鑒定內(nèi)含子。肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶同源物或酪蛋白5’ UTR同源物也可以通過探測另一個 物種的基因組或cDNA片段文庫而鑒定。例如,可以將感興趣物種的基因組DNA切成大小合 適的片段以便插入所選載體,例如質(zhì)?;颉⑤d體。接著,用合適的限制酶對載體進行消化, 之后與基因組片段的完整混合物進行連接。用載體轉(zhuǎn)化細菌細胞,再將其涂布在瓊脂糖平 板上。然后將菌落或噬菌斑DNA轉(zhuǎn)印到膜上。在一個實施方式中,將由SEQ ID N0:2-6和 8-10所示的片段或其一部分用作標(biāo)記探針,與含有同源序列的文庫的克隆DNA進行雜交。 相似的步驟可以用來篩選cDNA文庫。此外,可以將由SEQID N0 :2_6和8_10所示的片段或 其一部分用作基因組或cDNA Southern雜交實驗的標(biāo)記探針來鑒定同源物。在其它實施方 式中,更為保守的序列用作Southern雜交實驗的探針或篩選文庫,例如包含肌質(zhì)網(wǎng)/內(nèi)質(zhì) 網(wǎng)鈣ATP酶基因(例如,SEQ ID N0:11)或酪蛋白基因的編碼區(qū)或其一部分的序列??梢酝ㄟ^適當(dāng)組合溫度、鹽濃度、甲酰胺百分比,降低雜交實驗的嚴(yán)謹性來選擇合 適的雜交條件以允許一個片段與來自另一個物種的探針進行雜交(部分錯配的探針_靶序 列雜交體)。例如,可以通過降低溫度或升高鹽濃度來降低雜交實驗的嚴(yán)謹性。確定合適雜 交條件的步驟是本領(lǐng)域的公知技術(shù),在Sambrook (2001)Molecular Cloning :a laboratory manual (分子克隆實驗室手冊),第3版,冷泉港實驗室出版社,CSH,紐約中有描述。本發(fā)明的另一個實施方式是與SEQ ID N0:l_10之一所示多核苷酸具有至少 80%、85%、90%、95%、96%、97%、98%或 99%相同的多核苷酸。本發(fā)明的另一實施方式是包含SEQ ID NO :2和4-6之一所示多核苷酸與SEQ ID NO 3和8-10之一所示多核苷酸的合成5,UTR。
19
本發(fā)明的另一實施方式是包含與SEQ ID NO :2和4-6之一所示多核苷酸有至少 80%、85%、90%、95%、96%、97%、98%或 99%相同的多核苷酸,以及與 SEQ ID NO :3 和 8-10之一所示多核苷酸有至少80%、85%、90%、95%、96%、97%、98%或99%相同的多核 苷酸的合成5,UTR。本發(fā)明的另一個實施方式是包含與SEQ ID NO :1所示多核苷酸具有至少80%、 85%、90%、95%、96%、97%、98%或99%相同的多核苷酸的合成基因構(gòu)建體。本發(fā)明的另一個實施方式是包含與SEQ ID NO :7所示多核苷酸具有至少80%、 85%、90%、95%、96%、97%、98%或99%相同的多核苷酸的合成基因構(gòu)建體。在另一個實施方式中,所述合成5’ UTR序列缺乏妨礙插入弗吉尼亞州布萊克斯堡 的英特列克星敦公司(Intrexon Corp.,Blacksburg,VA)的UltraVector產(chǎn)生系統(tǒng)的限制 性位點,如通過引用納入本文的W02007/038276所述。在一個特定實施方式中,所述合成 5,UTR序列缺乏下列限制性內(nèi)切酶的內(nèi)部識別序列AsiS I、Pac I、Sbf I、Fse I、Asc I、 MIuI、SnaB I,Not I.Sal I、Swa I、Rsr II.Bsiff I、Mfe I、Nhe I、Nsi I、CIaI、Nde I、Nsi I、Kpn I、Nco I 和 Pst I。合成5’ UTR序列任選在5’端和3’端具有限制性位點,幫助序列克隆入載體。在 一個特定的實施方式中,所述合成5’ UTR序列在5’端含有Mlu I識別序列和在3’端含有 Mfe I識別序列。在一個特定的實施方式中,所述合成5,UTR由SEQ ID N0:1表示。SEQID N0:1包 含下列特征Mlu I限制性位點、SEQ ID N0:2、Kpn I限制性位點、SEQ ID N0:3、Mfe I限 制性位點。SEQ ID N0:1如圖2A所示。在另一特定的實施方式中,所述合成5,UTR由SEQ ID N0:7表示。SEQID N0:7包 含下列特征Asc I限制性位點、Mlu I限制性位點、SEQ ID NO :4、Kpn I限制性位點、SEQ ID NO :3、Mfe I限制性位點。SEQ ID NO :7如圖2B所示。在一個實施方式中,所述合成5’ UTR序列的長度少于約500個核苷酸。在另一個 實施方式中,所述合成5’ UTR序列的長度少于約400個核苷酸。在另一個實施方式中,所 述合成5’ UTR序列的長度少于約350個核苷酸。在另一個實施方式中,所述合成5’ UTR序 列的長度少于約300個核苷酸。在另一個實施方式中,所述合成5’ UTR序列的長度少于約 240個核苷酸。在另一個實施方式中,所述合成5’ UTR序列的長度少于約200個核苷酸。在本發(fā)明的另一個實施方式中,所述合成5’ UTR多核苷酸是真核表達載體的組 分,包含第一多核苷酸片段和第二多核苷酸片段,其中a.第一多核苷酸片段包含第一真核基因的至少一個剪接位點;b.第二多核苷酸片段包含第二真核基因的5’非翻譯區(qū)(5’ UTR)的至少一部分; 以及c.第一多核苷酸片段位于第二多核苷酸片段的5’端。在一個實施方式中,包含至少一個剪接位點的多核苷酸片段是本文所述的真核肌 質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因的片段。在另一個實施方式中,包含至少一部分5’非翻譯區(qū)的 多核苷酸片段是本文所述的酪蛋白基因的片段。本發(fā)明還提供了包含本文所述合成5’UTR的載體??紤]的載體包括本文所述合成 5’ UTR多核苷酸序列的任一實施方式。例如,本發(fā)明的一個實施方式是包含合成5’ UTR多核苷酸序列的載體,所述合成5’ UTR多核苷酸序列包含含有真核肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶 基因的第2內(nèi)含子的多核苷酸片段與含有酪蛋白基因5’ UTR的至少一部分的多核苷酸片 段。本發(fā)明的另一個實施方式是包含與SEQ ID NO: 1-10之一所示多核苷酸具有至少 80%、85%、90%、95%、96%、97%、98%或99%相同的多核苷酸的載體。在另一個實施方式中,所述載體是包含含有合成5’ UTR的合成基因構(gòu)建體的表達 載體。合成基因構(gòu)建體可以包含側(cè)接合成5’ UTR—端的啟動子和側(cè)接合成5’ UTR另一端 的待表達感興趣序列。合成基因構(gòu)建體還可包含一個多聚腺苷酸化位點。例如,本發(fā)明的另一個實施方式是包含合成基因構(gòu)建體的表達載體,所述合成基 因構(gòu)建體沿5’端至3’端方向包含啟動子、嵌合多核苷酸和待表達的感興趣序列,其中a.嵌合多核苷酸包含含有至少一個剪接位點的第一真核基因的多核苷酸片段,與 含有至少一部分5’非翻譯區(qū)的第二真核基因的多核苷酸片段;和b.嵌合多核苷酸位于啟動子和感興趣的待表達序列之間,其中第一真核基因的多 核苷酸片段朝啟動子定位,第二真核基因的多核苷酸片段朝待表達的感興趣序列定位。圖3A顯示插入載體骨架的本發(fā)明合成基因構(gòu)建體的一個實施方式。在這個實施 方式中,圖3A中的SPL指包含至少一個剪接位點的多核苷酸片段,UTR指包含至少一部分 5’非翻譯區(qū)的多核苷酸片段。SPL和UTR—起構(gòu)成合成5’UTR。合成基因構(gòu)建體的啟動子 定位成指導(dǎo)合成5’ UTR和感興趣序列的RNA表達。此外,待表達的感興趣序列包含翻譯啟 動的起始密碼子。包含此載體結(jié)構(gòu)的示范性表達載體由圖10和圖11顯示。圖10中載體的序列由 SEQ ID NO 12提供;圖11中載體的序列由SEQ ID NO 13提供。在另一個實施方式中,所述載體是沿5’端至3’端方向包含啟動子、嵌合多核苷酸 和克隆位點的表達載體,其中a.嵌合多核苷酸包含含有至少一個剪接位點的第一真核基因的多核苷酸片段,與 含有至少一部分5’非翻譯區(qū)的第二真核基因的多核苷酸片段;以及b.嵌合多核苷酸位于啟動子和克隆位點之間,其中第一真核基因的多核苷酸片段 朝啟動子定位,第二真核基因的多核苷酸片段朝克隆位點定位。表達載體的克隆位點可以包含一個或多個獨特的限制性位點,從而可插入感興趣 序列。在另一實施方式中,克隆位點包含重組酶附著位點,從而感興趣序列可通過位點特異 性重組方式插入。所述表達載體的一個實施方式如圖3B所示。在圖3B中,SPL是指包含剪接位點 的多核苷酸片段,UTR是指包含至少一部分5’非翻譯區(qū)的多核苷酸片段。SPL和UTR—起 構(gòu)成合成5,UTR。表達載體中包含剪接位點的多核苷酸片段可以是任何真核基因的片段。可用于表 達載體內(nèi)的示范性多核苷酸片段包括含有本文所述真核肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因的剪 接位點的多核苷酸片段。此外,包含至少一部分5’非翻譯區(qū)的多核苷酸片段可以是任何真 核基因的片段。可以用于表達載體內(nèi)的示范性多核苷酸片段包括含有本文所述酪蛋白基因 的5’非翻譯區(qū)的至少一部分的多核苷酸片段。本發(fā)明的表達載體還可包含一個或多個位于感興趣序列或克隆位點下游的附加
21多核苷酸序列,以便與感興趣序列所編碼多肽產(chǎn)生框內(nèi)融合。例如,感興趣序列下游的附加 多核苷酸可以編碼表位標(biāo)簽、報道分子或純化標(biāo)簽。表位標(biāo)簽為本領(lǐng)域已知,包括myc、血 凝素(HA)和FLAG。報道分子的例子包括綠色熒光蛋白及其變體、半乳糖苷酶(LacZ)、 葡糖苷酸酶(Gus)、氯霉素乙?;D(zhuǎn)移酶(CAT)和熒光素酶。純化標(biāo)簽的例子包括His6 和GST。表達載體還可以包含位于感興趣序列或克隆位點下游的polyA位點。根據(jù)所需結(jié)果,含有合成5’ UTR的表達載體的啟動子部分可以是組成型啟動子、 非組成型啟動子、組織特異性啟動子(組成型或非組成型)、致病或疾病相關(guān)啟動子、發(fā)育 特異性啟動子或選擇性調(diào)控啟動子,例如可誘導(dǎo)啟動子。不同的選擇性調(diào)控啟動子受到不 同機制的調(diào)控。例如,當(dāng)用四環(huán)素處理含有啟動子和其它必需的細胞因子的細胞時,四環(huán) 素誘導(dǎo)啟動子被激活而表達下游的編碼序列。其它可誘導(dǎo)啟動子被其它藥物或因子激活。 RHE0SWITCH是一個可誘導(dǎo)啟動子系統(tǒng),可以從馬薩諸塞州伊普斯維奇市新英格蘭生物實驗 室(New England Biolabs, Ipswich, MA)購得。溫度敏感性啟動子也可以用來增強或降低 基因表達。本發(fā)明的一個實施方式包括含有表達受可誘導(dǎo)啟動子調(diào)控的合成5’UTR的基因 構(gòu)建體。本發(fā)明包括的實施方式中,包含合成5’ UTR的載體骨架包含適用于在真核細胞中 表達感興趣序列的序列。在一個實施方式中,包含合成5’ UTR的載體骨架包含適用于在哺 乳動物細胞中表達感興趣序列的序列。哺乳動物表達載體可以包含非轉(zhuǎn)錄元件,例如連接 于待表達的感興趣序列的復(fù)制起點、合適的啟動子和增強子,以及其它5’或3’側(cè)翼非轉(zhuǎn)錄 序列和5’或3’非翻譯序列,例如必需的核糖體結(jié)合位點、多聚腺苷酸化位點和轉(zhuǎn)錄終止序 列。哺乳動物表達載體的例子為本領(lǐng)域所公知,包括英杰公司(Invitrogen)的pcDNA3和 pRSVneo(ATTC)。例如,含有合成5’ UTR的表達載體的啟動子部分可以是動物或哺乳動物啟動 子。動物或哺乳動物啟動子的例子包括SV40早期(SV40e)啟動子區(qū)域,包含于勞氏肉 瘤病毒(RSV)的3’長末端重復(fù)序列(LTR)中的啟動子,E1A啟動子或腺病毒(Ad)主要 晚期啟動子(MLP)基因,巨細胞病毒(CMV)早期啟動子,單純皰疹病毒(HSV)胸苷激酶 (TK)啟動子,延伸因子la (EF1)啟動子,磷酸甘油酸激酶(PGK)啟動子,泛素(Ubc)啟 動子,白蛋白啟動子,小鼠金屬硫蛋白-L啟動子和轉(zhuǎn)錄調(diào)控區(qū)域的調(diào)控序列,遍在啟動子 (ubiquitouspromoter) (HPRT、波形蛋白、0 -肌動蛋白、微管蛋白等),中間絲的啟動子(索 蛋白、神經(jīng)絲、角蛋白、GFAP等),治療基因的啟動子(MDR相關(guān)、CFTR或因子VIII —類因子 等),致病或疾病相關(guān)啟動子,表現(xiàn)出組織特異性并已用于轉(zhuǎn)基因動物的啟動子,例如在胰 腺腺泡細胞中具有活性的彈性蛋白酶I基因調(diào)控區(qū)域;在胰腺0細胞中具有活性的胰島 素基因調(diào)控區(qū)域,在淋巴細胞中具有活性的免疫球蛋白基因調(diào)控區(qū)域,在睪丸,乳腺,淋巴 和肥大細胞中具有活性的小鼠乳腺瘤病毒調(diào)控區(qū)域;白蛋白基因,在肝臟中具有活性的Apo AI和Apo All調(diào)控區(qū)域,在肝臟中具有活性的a-胎蛋白基因調(diào)控區(qū)域、在肝臟中具有活性 的a 1-抗胰蛋白酶基因調(diào)控區(qū)域,在骨髓細胞中具有活性的球蛋白基因調(diào)控區(qū)域,在 腦的少突膠質(zhì)細胞中具有活性的髓磷脂堿蛋白基因調(diào)控區(qū)域,在骨骼肌中具有活性的肌球 蛋白輕鏈-2基因調(diào)控區(qū)域,在下丘腦中具有活性的促性腺激素釋放激素基因調(diào)控區(qū)域,丙 酮酸激酶啟動子,絨毛蛋白啟動子,脂肪酸結(jié)合腸蛋白的啟動子,平滑肌細胞肌動蛋白 啟動子等。表達載體內(nèi)的啟動子可以通過添加增強子或調(diào)控序列等得到修飾。
含有合成5’ UTR的表達載體的感興趣序列部分可以是來自任何真核基因或其部 分的序列、或天然或非天然的編碼或非編碼序列。可用于本發(fā)明的編碼序列的非限制性例 子包括報道分子(例如熒光素酶、半乳糖苷酶、熒光蛋白)、表位、實驗多肽或治療多肽 的編碼序列。感興趣核酸序列的其它例子包括RNA分子,例如小RNA、微小RNA、核糖體RNA、 治療RNA和核酶。在本發(fā)明的另一方面,多個非冗余的合成5’ UTR用于單個載體內(nèi)的多基因構(gòu)建體 中。在另一實施方式中,所述載體是一種包含含有合成5’ UTR的合成基因構(gòu)建體的基 因治療載體。基因治療載體可以是任何本領(lǐng)域已知的基因治療載體,包括非病毒載體或病 毒載體,例如腺病毒載體、腺相關(guān)病毒(AAV)載體或逆轉(zhuǎn)錄病毒載體。如圖3A所示,合成基 因構(gòu)建體可以包含側(cè)接合成5’ UTR的5’端的啟動子和側(cè)接合成5’ UTR的3’端的感興趣 治療基因。啟動子可以是組成型啟動子、組織特異性啟動子和可誘導(dǎo)啟動子,或本文所述的 其它啟動子??梢园牖蛑委熭d體的感興趣治療基因類別的例子包括但并不限于,細 胞因子、趨化因子、激素、抗體、工程改造的免疫球蛋白樣分子、單鏈抗體、融合蛋白、酶、免 疫協(xié)同刺激分子、免疫調(diào)節(jié)分子、靶蛋白反式顯性負突變體、毒素、條件性毒素、化療或放療 增敏劑、抗原、腫瘤抑制蛋白、生長因子、膜蛋白、血管活性蛋白和肽、抗病毒蛋白或其變體 的編碼基因。感興趣治療基因的具體例子數(shù)量眾多,包括但并不限于促紅細胞生成素、胰島 素、VEGF、FGF、因子 VIII、因子 IX、內(nèi)皮抑素、血管抑素、GDNF、BDNF、NGF、EGF、CFTR、PEGF、 IFN-a 、IFN-y、IL-1、IL-2、IL-4、IL-6、IL-7、IL-10、IL-12、IL_21、GM-CSF、G-CSF、M_CSF、 TNF-a、TNF-0、TGF-a、TGF-0、CD40、水蛭素以及類似基因。本發(fā)明還提供了包含本發(fā)明多核苷酸序列的試劑盒。例如,在一個實施方式中,本 發(fā)明提供包含至少一段與SEQ ID NO :1-10之一所示多核苷酸具有至少80%、85%、90%、 95%、96%、97%、98%或99%相同的多核苷酸的試劑盒。試劑盒可以包含前述可以進行組 裝的載體或組分。例如,試劑盒可包括可以在限制酶消化作用下線性化的載體,從而允許使 用者插入合成5’ UTR或合成5’ UTR的各組件。試劑盒可以進一步包含其它供載體組裝的 組分,例如限制酶、連接酶、緩沖液以及類似組分。本發(fā)明還提供在宿主細胞中表達基因產(chǎn)物或感興趣序列的方法。例如,本發(fā)明的另一實施方式是表達基因產(chǎn)物的方法,包括用包含本文所述合成 5’ UTR的合成基因構(gòu)建體轉(zhuǎn)染宿主細胞。本發(fā)明的另一實施方式是表達基因產(chǎn)物的方法,包括用包含與SEQ IDN0 :1或SEQ ID NO 7所示多核苷酸具有至少80%、85%、90%、95%、96%、97%、98%或99%相同的多 核苷酸的合成基因構(gòu)建體轉(zhuǎn)染宿主細胞。本發(fā)明的另一個實施方式是在宿主細胞中表達感興趣序列的方法,包括下列步 驟a.用包含本文所述合成基因構(gòu)建體的表達載體轉(zhuǎn)染宿主細胞;以及b.在適合實現(xiàn)所述感興趣序列表達的條件下培養(yǎng)所述宿主細胞。宿主細胞中表達感興趣序列的另一方法中,感興趣序列可以插入包含啟動子、合 成5’ UTR和克隆位點的本文所述表達載體。例如,本發(fā)明的另一個實施方式是在宿主細胞中表達感興趣序列的方法,包括下列步驟a.將待表達的感興趣序列插入包含啟動子、合成5’UTR和克隆位點的本文所述表 達載體的克隆位點,其中待表達的感興趣序列包括RNA或多肽編碼序列;b.用所述表達載體轉(zhuǎn)染宿主細胞;以及c.在適合實現(xiàn)所述感興趣序列表達的條件下培養(yǎng)所述宿主細胞。在宿主細胞中表達所感興趣序列的另一方法中,合成5’ UTR可以插入表達載體的 啟動子和感興趣序列之間,使得合成5’ UTR中包含真核基因剪接元件的部分朝啟動子定 位,包含另一真核基因的5’ UTR的至少一部分的部分朝感興趣的序列定位。例如,本發(fā)明的另一實施方式是在宿主細胞中表達感興趣序列的方法,包括下列 步驟a.將本文所述的合成5’ UTR插入到表達載體的啟動子和待表達的感興趣序列之 間,其中待表達的感興趣序列包括RNA或多肽編碼序列;b.用所述表達載體轉(zhuǎn)染宿主細胞;以及c.在適合實現(xiàn)所述感興趣序列表達的條件下培養(yǎng)所述宿主細胞。本發(fā)明的另一實施方式是在宿主細胞中表達感興趣序列的方法,包括以下步驟a.將與SEQ ID N0:1或SEQ ID NO :7所示多核苷酸具有至少80%、85%、90%、 95%、96%、97%、98%或99%相同的多核苷酸插入到表達載體的啟動子和待表達的感興趣 序列之間,其中待表達的感興趣序列包括RNA或多肽編碼序列;b.用所述表達載體轉(zhuǎn)染宿主細胞;以及c.在適合實現(xiàn)所述感興趣序列表達的條件下培養(yǎng)所述宿主細胞。本發(fā)明的方法可以通過常規(guī)技術(shù)實現(xiàn)。除另外闡述外,重組DNA技術(shù)的操作根 據(jù)(Sambrook,同上)或 Ausubel 等(1994), Current Protocols inMolecular Biology, Current Protocols (最新分子生物學(xué)方法)的卷1和2中描述的標(biāo)準(zhǔn)操作程序進行。本發(fā)明還提供了包含合成5’UTR的宿主細胞??紤]的宿主細胞包括本文描述的合 成5 ’ UTR多核苷酸序列的任一實施方式。例如,本發(fā)明的另一個實施方式是包含合成5,UTR 多核苷酸序列的宿主細胞,所述合成5’ UTR多核苷酸序列包含與含有酪蛋白基因5’ UTR區(qū) 的至少一部分的多核苷酸片段相融合的含有真核肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因第2內(nèi)含子 的多核苷酸片段。在一個實施方式中,宿主細胞是哺乳動物宿主細胞。在特定的實施方式中,宿主細 胞是倉鼠細胞、小鼠細胞、大鼠細胞、兔細胞、貓細胞、狗細胞、牛細胞、山羊細胞、奶牛細胞、 豬細胞、馬細胞、綿羊細胞、猿細胞、猴細胞、黑猩猩細胞或人細胞。包含合成5’ UTR的本發(fā) 明宿主細胞的特定例子包括但并不限于A549、ARPE-19、CH3/10T1/2、C2C12、aco2、C0S7、 FL-83B、HEK-293、HEPG2、HeLa、HT-1080、MDCK、P19、SH-SY5Y、Sol 8 和 U87。本發(fā)明的宿主細胞被包含合成5’UTR的多核苷酸轉(zhuǎn)染。宿主細胞轉(zhuǎn)染是本領(lǐng)域的 公知技術(shù),可以通過多種方法來實現(xiàn),包括但并不限于電穿孔、病毒感染、質(zhì)粒/載體轉(zhuǎn)染、 非病毒載體介導(dǎo)的轉(zhuǎn)染、粒子轟擊以及類似方法。所需基因產(chǎn)物的表達包括在合適的條件 下培養(yǎng)轉(zhuǎn)染的宿主細胞以及測量轉(zhuǎn)染基因的表達。培養(yǎng)條件和真核細胞中基因表達的操作 程序是在本領(lǐng)域的公知技術(shù)。本發(fā)明還提供了包含本文所述合成5’ UTR的宿主生物體。合成5’ UTR可以在體
24內(nèi)直接插入宿主生物體的基因組中。例如,在一個實施方式中,通過將含有本發(fā)明的合成 5’ UTR的載體直接引入宿主生物體,從而合成5’ UTR引入宿主生物體以取代野生型5’ UTR, 合成5’ UTR的側(cè)翼序列與被取代的野生型5’ UTR的側(cè)翼序列同源。在另一實施方式中,通 過將包含基因構(gòu)建體的整合載體引入宿主生物體,從而包含合成5’ UTR的合成基因構(gòu)建體 插入宿主生物體的基因組內(nèi)??梢钥刂撇迦氲慕M織特異性,例如通過載體的給予途徑。在另 一實施方式中,通過將包含基因構(gòu)建體的非整合載體引入宿主生物體,從而包含合成5’UTR 的合成基因構(gòu)建體引入宿主生物體。合成5’ UTR或包含合成5’ UTR的合成基因構(gòu)建體也可以通過離體方法引入宿主 生物體。例如,可以用包含合成5’ UTR的載體轉(zhuǎn)化自體或非自體細胞,然后引入宿主生物 體。在另一實施方式中,利用位點特異性重組酶系統(tǒng),例如Cre/loxP系統(tǒng)將合成 5’ UTR引入宿主細胞基因組或生物體。在此實施方式中,可以通過將修飾的lox位點引入 基因組和阻止整合入的DNA被再次切除的供體載體而將DNA片段,例如將包含合成5’ UTR 的片段或含有合成5’UTR的合成基因構(gòu)建體穩(wěn)定整合到基因組(參見通過引用納入本文的 見 Metzger 和 Feil,CurrentOpinion in Biotechnology,10 :470_476 (1999))。此外,異種 特異性loxP位點可以引入("floxed")基因組以側(cè)接待取代的區(qū)域(Metzger和Feil,同 上),例如供體質(zhì)粒上的內(nèi)源5’UTR和合成5’UTR。含引入基因組的loxP染色體位點的轉(zhuǎn) 基因動物可以與在組織或細胞特異性啟動子驅(qū)動下表達Cre重組酶的轉(zhuǎn)基因小鼠進行雜 交,此技術(shù)為本領(lǐng)域已知技術(shù)。對此雜交后代給予包含合成5’ UTR的供體質(zhì)??梢栽谔囟?組織或類型細胞中產(chǎn)生整合。在其它實施方式中,利用其它位點特異性重組酶系統(tǒng)將合成5’ UTR引入到宿主生 物體的基因組,例如通過引用納入本文的美國專利申請公開號20060172377公開的系統(tǒng)。本發(fā)明的另一實施方式是包含與SEQ ID N0:l_10所示多核苷酸具有至少80%、 85%、90%、95%、96%、97%、98%或99%相同的多核苷酸的非人生物體。本發(fā)明的另一實施方式是包含含有與SEQ ID N0:l_10所示多核苷酸具有至少 80%、85%、90%、95%、96%、97%、98%或99%相同的多核苷酸的合成基因構(gòu)建體的非人 類生物體。此外,可以構(gòu)建包含合成5’ UTR或含有合成5’ UTR的基因構(gòu)建體的轉(zhuǎn)基因生物, 例如小鼠。例如,向受精的小鼠卵母細胞原核注射包含合成5’ UTR的合適載體,可以產(chǎn)生 轉(zhuǎn)基因小鼠?;蛘撸梢詫⑤d體引入到小鼠胚胎干細胞,然后再將胚胎干細胞注射到小鼠囊 胚。接著,轉(zhuǎn)化的合子或囊胚移植到假孕雌鼠體內(nèi)。采用PCR或Southern雜交在最后產(chǎn)生 的幼崽中篩選所述多核苷酸。之后,雜合的轉(zhuǎn)基因動物可以相互雜交,產(chǎn)生純合子。在一個 實施方式中,通過同源重組,合成5’ UTR取代了轉(zhuǎn)基因動物中感興趣基因的內(nèi)源5’ UTR。因此,本發(fā)明的另一實施方式是包含合成5’ UTR多核苷酸序列的轉(zhuǎn)基因動物,合 成5’ UTR多核苷酸序列包含與含有酪蛋白基因5’ UTR的至少一部分的片段相融合的含有 第2內(nèi)含子的真核肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因的片段。本發(fā)明的另一個實施方式是包含與SEQ ID N0:l_10所示多核苷酸具有至少 80%、85%、90%、95%、96%、97%、98%或99%相同的多核苷酸的轉(zhuǎn)基因生物體。本發(fā)明的另一個實施方式是包含含有與SEQ ID NO :1_10所示多核苷酸具有至少80%、85%、90%、95%、96%、97%、98%或99%相同的多核苷酸的合成基因構(gòu)建體的轉(zhuǎn)基 因生物體。下列實施例是對本發(fā)明實施方式的說明,并不以任何實施方式限制本發(fā)明。對于 本領(lǐng)域普通技術(shù)人員顯而易見的其它適當(dāng)改進和改動屬于本發(fā)明的構(gòu)思和范圍之內(nèi)。實施例實施例1構(gòu)建三種不同形式的合成5’UTR,插入載體中,其中人巨細胞病毒(CMV)啟動子指 導(dǎo)半乳糖苷酶報道基因(LacZ編碼序列)表達。在第一種形式中,polyG(12)作為合 成5’ UTR插入啟動子和0 -半乳糖苷酶報道基因之間(圖9)。在第二種形式中,稱為5U2 的SEQ ID N0:1作為合成5,UTR插入啟動子和0 -半乳糖苷酶報道基因之間(圖10)。在 第三種形式中,稱為INXN-1的SEQ ID NO 7作為合成5,UTR插入啟動子和0 -半乳糖苷 酶報道基因之間(圖11)。各轉(zhuǎn)基因在3’端調(diào)控區(qū)域具有SV40多聚腺苷酸化序列。包含 5U2或INXN-1合成5,UTR的各載體的通用形式如圖3A所示。用各載體瞬時轉(zhuǎn)染HEK-293 細胞和1080細胞。根據(jù)以下方案,使用應(yīng)用生物系統(tǒng)公司(Applied Biosystem)的Galacto-Star 系統(tǒng)(目錄號 BM100S、BM300S、BM2500S、BY100S、BY300S、BY2500S)測量細胞的 3 -半 乳糖苷酶。室溫下,將細胞在50 PL裂解液(Galacto-Star 系統(tǒng))中裂解10分鐘。將 100 uL Galacton-Star 底物等分置于白色不透明96孔微板的孔中。往100 y L的 Galacton-Star 底物中加入10 y L細胞裂解液,溫育30分鐘。用微板光度計檢測光信號。HEK-293細胞的結(jié)果如圖4所示。與含有polyG作為合成5,UTR的載體相比,0 -半 乳糖苷酶報道基因在用含有INXN-1或5U2合成5’ UTR的載體轉(zhuǎn)染的HEK-293細胞中的表 達顯著增強。圖5顯示,含有polyG作為5’ UTR的載體相比,報道基因在用含有INXN-1或 5U2的載體轉(zhuǎn)染的1080細胞中表達增強。轉(zhuǎn)基因在含有polyG 5’ UTR的載體中的表達水 平與其在不含5’ UTR的對照(VVN-2712,圖7,數(shù)據(jù)見圖12)中的表達水平相似。用于測量 實驗背景的陰性對照是不含半乳糖苷酶的載體(VVN-2713,圖8,數(shù)據(jù)見圖12)。圖6顯 示,與含有polyG作為5’ UTR的合成報道基因相比,含有INXN-1合成5’ UTR的合成半 乳糖苷酶報道基因在HEK-293細胞和1080細胞中的表達高約7. 5倍和2. 5倍;而與含有 polyG作為5,UTR的合成報道基因相比,含有5U2合成5,UTR的合成報道基因在HEK-293 細胞和1080細胞中的表達分別高約8倍和約2. 5倍。實施例2采用blastn算法和默認參數(shù),將SEQ ID NO 4作為查詢序列在GenBank非冗余核 苷酸公共數(shù)據(jù)庫中進行檢索,得到表1列出的下列代表性SERCA2同源物。SEQ ID N0:4表 示SEQ ID NO 7所示合成5,UTR的組件。表1 利用公共可用程序DNA Strider 1. 4f 17 (見 Marck,C,Nucleic AcidsResearch 16(5) 1829-1837(1988)和 Douglas,S, Molecular Biotechnology3(1) :37_45(1995)對 DNA Strider的說明)的成對比對功能,將表1的BLAST檢索結(jié)果中鑒定的馬基因組的片 段(公開登錄號AM137440)與馬SERCA2的mRNA序列NM_001081765進行比較。序列比對 采用Blocks方法,對錯配罰分和空位罰分采用默認參數(shù)。馬基因組和mRNA序列的比對部 分如圖13所示,箭頭標(biāo)出部分為馬SERCA2基因的第2內(nèi)含子的起點和終點。相對內(nèi)含子 5’的同源區(qū)域表示外顯子2,相對內(nèi)含子3’的同源區(qū)域表示外顯子3。然后合成代表包含第2個內(nèi)含子的馬SERCA2基因片段的寡核苷酸,并利用重組 DNA技術(shù)將其與SEQ ID NO 3融合,構(gòu)建出合成5,UTR。之后將合成5,UTR插入到載體中 人巨細胞病毒啟動子(CMV)和熒光素酶報道基因之間。接著,用此載體和帶有polyG 5'UTR 的對照載體轉(zhuǎn)染3T3細胞。用光度計檢測熒光素酶活性,并在兩套細胞之間進行相對光單 位的比較。與用含有polyG 5’ UTR的載體轉(zhuǎn)染的細胞相比,報道基因在用含有合成5’ UTR 的載體轉(zhuǎn)染的細胞中表達增強。實施例3采用blastn算法和默認參數(shù),將SEQ ID NO 3作為查詢序列在GenBank非冗余核 苷酸公共數(shù)據(jù)庫中進行檢索,得到在表2中列出的下列代表性同源物。SEQ ID N0:3表示 由SEQ ID NO 1和SEQ ID NO 7表示的合成5,UTR的牛酪蛋白5,UTR組件。表2 表1中列出的各代表性SERCA2基因的第2內(nèi)含子是通過使用成對比對程序?qū)⒒?因組序列與其各自的mRNA序列進行比較而鑒定的。合成的第一套寡核苷酸包含各SERCA2 同源物的SERCA2的第2內(nèi)含子。然后合成的第二套寡核苷酸代表表2中鑒定的各0 -酪 蛋白同源物的5’ UTR的至少一部分。5’ UTR部分包含表2的BLAST結(jié)果中鑒定的查詢覆 蓋范圍的部分。然后采用重組DNA技術(shù),將包含SERCA2的第2內(nèi)含子的第一套寡核苷酸中 的獨特一員或SEQ ID NO 2和4-6所示寡核苷酸與包含5,UTR的至少一部分的第二套寡 核苷酸中的獨特一員或SEQ ID N0:3和8-10所示寡核苷酸相融合,其中包含SERCA2的第 2內(nèi)含子的寡核苷酸融合在包含部分5’ UTR的寡核苷酸的5’端,構(gòu)建出一套合成5’ UTR。 之后通過PCR在合成5’ UTR的各末端添加限制性位點。再將各獨特的合成5’ UTR插入載 體中人CMV啟動子和lacZ啟動子之間。接著用各載體以及含polyG 5’ UTR的對照載體轉(zhuǎn) 染96孔板中的1080細胞。用實施例1中描述的試驗檢測半乳糖苷酶活性,再比較相 對于polyG 5’ UTR的表達水平。在完整描述了本發(fā)明之后,本領(lǐng)域普通技術(shù)人員應(yīng)該理解,可以在廣泛和等同的 條件和其它參數(shù)范圍內(nèi)實施本發(fā)明,而不影響本發(fā)明或其任何實施方式的范圍。
28
權(quán)利要求
一種嵌合多核苷酸,其包含第一多核苷酸片段和第二多核苷酸片段,其中a.所述第一多核苷酸片段包含肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因的第2內(nèi)含子;b.所述第二多核苷酸片段包含酪蛋白基因的5’非翻譯(5’UTR)區(qū)的至少一部分;和c.所述第一多核苷酸片段位于所述第二多核苷酸片段的5’端。
2.如權(quán)利要求1所述的嵌合多核苷酸,其特征在于,所述第一多核苷酸片段還包含肌 質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因的外顯子2的至少一部分。
3.如權(quán)利要求1所述的嵌合多核苷酸,其特征在于,所述第一多核苷酸片段還包含肌 質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因的外顯子3的至少一部分。
4.如權(quán)利要求1所述的嵌合多核苷酸,其特征在于,所述第一多核苷酸片段是犬 SERCA2基因、人SERCA2基因或小鼠SERCA2的片段,所述第二多核苷酸片段是牛β _酪蛋白 基因、小鼠酪蛋白基因、大鼠酪蛋白基因或綿羊酪蛋白基因的片段。
5.如權(quán)利要求1所述的嵌合多核苷酸,其特征在于,所述第一多核苷酸片段與SEQID NO 2和4-6之一具有至少80%相同,所述第二多核苷酸片段與SEQ ID NO 3和8_10之一 具有至少80%相同。
6.如權(quán)利要求1所述的嵌合多核苷酸,其特征在于,所述第一多核苷酸片段包含與含 有SEQ ID NO 4的至少60個連續(xù)核苷酸的多核苷酸具有至少80%相同的多核苷酸,所述 第二多核苷酸包含與含有SEQ ID NO 3的至少30個連續(xù)核苷酸的多核苷酸具有至少80% 相同的多核苷酸。
7.如權(quán)利要求1所述的嵌合多核苷酸,其特征在于,所述第一多核苷酸包含SEQID NO :2,所述第二多核苷酸包含SEQ ID NO :3。
8.如權(quán)利要求1所述的嵌合多核苷酸,其特征在于,所述第一多核苷酸包含SEQID NO :4,所述第二多核苷酸包含SEQ ID NO :3。
9.如權(quán)利要求1所述的嵌合多核苷酸,其特征在于,所述嵌合多核苷酸與SEQID NO 1具有至少80%相同。
10.如權(quán)利要求1所述的嵌合多核苷酸,其特征在于,所述嵌合多核苷酸與SEQID NO 7具有至少80%相同。
11.一種真核表達載體的合成5’ UTR多核苷酸組件,其包含第一多核苷酸片段和第二 多核苷酸片段,其中a.所述第一多核苷酸片段包含第一真核基因的至少一個剪接位點;b.所述第二多核苷酸片段包含第二真核基因的5’非翻譯區(qū)(5’UTR)的至少一部分;禾口c.所述第一多核苷酸片段位于所述第二多核苷酸片段的5’端。
12.如權(quán)利要求11所述的合成5’UTR多核苷酸,其特征在于,所述第一多核苷酸片段 包含所述第一真核基因的內(nèi)含子。
13.如權(quán)利要求12所述的合成5’UTR多核苷酸,其特征在于,所述第一多核苷酸片段 還包含所述第一真核基因5’側(cè)接外顯子的至少一部分。
14.如權(quán)利要求12所述的合成5’UTR多核苷酸,其特征在于,所述第一多核苷酸片段 還包含所述第一真核基因3’側(cè)接外顯子的至少一部分。
15.如權(quán)利要求11-14中任一項所述的合成5’UTR多核苷酸,其特征在于,所述第一真核基因是真核肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因,所述第二真核基因是酪蛋白基因。
16.如權(quán)利要求1-14中任一項所述的多核苷酸,其特征在于,所述多核苷酸缺少下列 限制性內(nèi)切酶的識別序列AsiS I, Pac I, Sbf I, Fse I,Asc I, MIu I, SnaB I, Not I.Sal I, Swa I, Rsr II, Bsiff I,Mfe I, Nhe I, Nsi I, Cla I, Nde I, Nsi I,Kpn I, Nco I 禾口 PstIo
17.如權(quán)利要求1-14中任一項所述的多核苷酸,其特征在于,所述多核苷酸在5’端和 3’端包含限制性位點以幫助克隆入載體。
18.如權(quán)利要求16所述的多核苷酸,其特征在于,所述嵌合多核苷酸在5’端包含Mlu I的識別序列和在3’端包含Mfe I的識別序列。
19.包含如權(quán)利要求1-14中任一項所述的多核苷酸的載體。
20.包含如權(quán)利要求1-14中任一項所述的多核苷酸的合成基因構(gòu)建體。
21.包含如權(quán)利要求1-14中任一項所述的多核苷酸的宿主細胞。
22.包含如權(quán)利要求1-10中任一項所述的多核苷酸的非人類生物體。
23.包含如權(quán)利要求1-10中任一項所述的多核苷酸的轉(zhuǎn)基因生物體。
24.包含如權(quán)利要求1-14中任一項所述的多核苷酸的一種試劑盒。
25.一種包含合成基因構(gòu)建體的表達載體,其中所述合成基因構(gòu)建體沿5’端至3’端的 方向包含啟動子、嵌合多核苷酸和感興趣的表達序列,其中a.所述嵌合多核苷酸包含含有至少一個剪接位點的第一真核基因的多核苷酸片段,與 含有5’非翻譯區(qū)的至少一部分的第二真核基因的多核苷酸片段;和b.所述嵌合多核苷酸位于所述啟動子和待表達的感興趣序列之間,其中所述第一真核 基因的多核苷酸片段朝所述啟動子定位,所述第二真核基因的多核苷酸片段朝待表達的感 興趣序列定位。
26.—種表達載體,其沿5’端至3’端的方向包含啟動子、嵌合多核苷酸和克隆位點,其中a.所述嵌合多核苷酸包含含有至少一個剪接位點的第一真核基因的多核苷酸片段,與 含有5’非翻譯區(qū)的至少一部分的第二真核基因的多核苷酸片段;和b.所述嵌合多核苷酸位于所述啟動子和克隆位點之間,其中所述第一真核基因的多核 苷酸片段朝所述啟動子定位,所述第二真核基因的多核苷酸片段朝所述克隆位點定位。
27.如權(quán)利要求25或26所述的表達載體,其特征在于,所述第一真核基因是肌質(zhì)網(wǎng)/ 內(nèi)質(zhì)網(wǎng)鈣ATP酶基因,所述第二真核基因是酪蛋白基因。
28.如權(quán)利要求25或26所述的表達載體,其特征在于,所述嵌合多核苷酸與SEQID NO :1或SEQ ID NO 7具有至少80%相同。
29.一種在宿主細胞中表達感興趣序列的方法,包括下列步驟a.用如權(quán)利要求25所述的表達載體轉(zhuǎn)染宿主細胞;和b.在適合實現(xiàn)所述感興趣序列表達的條件下培養(yǎng)所述宿主細胞。
30.一種在宿主細胞中表達感興趣序列的方法,包括下列步驟a.將待表達的感興趣序列插入如權(quán)利要求26所述表達載體內(nèi)的克隆位點;b.用所述表達載體轉(zhuǎn)染宿主細胞;和c.在適合實現(xiàn)所述感興趣序列表達的條件下培養(yǎng)所述宿主細胞。
31.如權(quán)利要求29或30所述的方法,其特征在于,所述第一真核基因是肌質(zhì)網(wǎng)/內(nèi)質(zhì) 網(wǎng)鈣ATP酶基因,所述第二真核基因是酪蛋白基因。
32.如權(quán)利要求29或30所述的方法,其特征在于,所述嵌合多核苷酸與SEQID NO=I 或SEQ ID NO :7具有至少80%相同。
全文摘要
本發(fā)明提供包含第一多核苷酸片段和第二多核苷酸片段的合成5’UTR,其中所述第一多核苷酸片段包含第一真核基因的至少一個剪接位點,所述第二多核苷酸片段包含第二真核基因的至少一部分5’非翻譯區(qū),所述第一多核苷酸片段位于所述第二多核苷酸片段的5’端。在一個實施方式中,所述第一多核苷酸片段包含肌質(zhì)網(wǎng)/內(nèi)質(zhì)網(wǎng)鈣ATP酶基因的第2內(nèi)含子,所述第二多核苷酸片段包含真核酪蛋白基因的至少一部分5’非翻譯區(qū)。當(dāng)位于表達載體內(nèi)的啟動子和轉(zhuǎn)基因之間時,所述合成5’UTR有利于增強轉(zhuǎn)基因表達。本發(fā)明還提供包含合成5’UTR的載體和使用合成5’UTR增強轉(zhuǎn)基因表達的方法。
文檔編號C07H21/04GK101855233SQ200880116471
公開日2010年10月6日 申請日期2008年9月26日 優(yōu)先權(quán)日2007年9月26日
發(fā)明者T·瑞德 申請人:英特瑞克斯頓股份有限公司