本發(fā)明屬于生物制藥領(lǐng)域,涉及在哺乳動物細胞中高效多點插入非天然氨基酸的系統(tǒng)以及在哺乳動物細胞中表達蛋白質(zhì)(例如抗體,糖基化蛋白)的非天然氨基酸的高效多點插入方法。
背景技術(shù):
:1.基因密碼子擴展技術(shù)蛋白質(zhì)在生物體內(nèi)承擔了高度多樣性的功能,包括維持細胞結(jié)構(gòu)穩(wěn)定性,催化體內(nèi)化學反應(yīng),通過信號傳導調(diào)節(jié)細胞反應(yīng),通過免疫系統(tǒng)靶向外源分子等等。蛋白質(zhì)僅僅用20種天然氨基酸執(zhí)行了一系列顯著功能,僅有的20種天然氨基酸攜有的功能基團數(shù)量有限,無法滿足化學、生物科學研究對蛋白質(zhì)結(jié)構(gòu)和功能的需求。目前,化學修飾、基因定點突變等蛋白質(zhì)修飾方法都依賴于20種天然氨基酸本身;其用于修飾改造的功能基團僅有巰基、羥基、羧基、氨基等幾種有限基團,功能化方式十分有限,而且很難做到蛋白質(zhì)的定點修飾。近年來遺傳密碼擴展技術(shù)發(fā)展迅速,利用琥珀終止密碼子uag為有義編碼子,通過引入相應(yīng)的正交trna及氨酰trna合成酶,最終可以將帶有特殊功能團的非天然氨基酸定點引入蛋白質(zhì)中,已成為蛋白質(zhì)修飾的有力工具。到目前為止,這一技術(shù)已經(jīng)將上百種非天然氨基酸成功地定點表達在蛋白質(zhì)表面,涉及的非天然氨基酸包括含有疊氮、炔基、酮基、醛基、烯基、酰胺基、硝基、磷酸根、磺酸根等多樣性功能基團,可進行多種生物正交反應(yīng),如:點擊化學、光敏感、糖基化、光交聯(lián)等反應(yīng)。2.基因密碼子擴展技術(shù)在真核細胞中的發(fā)展基因密碼子擴展技術(shù)起源于大腸桿菌e.coli中,將其拓展到真核表達體系中面臨的一個挑戰(zhàn)是trna的轉(zhuǎn)錄和加工在原核和真核細胞中存在差異,主要的區(qū)別是,e.colitrna的轉(zhuǎn)錄是通過trna基因上游的啟動子,而真核細胞trna基因的轉(zhuǎn)錄是通過trna序列內(nèi)部的啟動元件a-和b-box,而在e.colitrna中加入a-和b-box將會破壞trna的活性,因此一大難題就是如何在真核細胞中有效表達原核正交的trna,使其正確參與真核細胞的蛋白質(zhì)翻譯過程。第三類rna聚合酶iii啟動子(type-3poliii)的使用可以有效解決以上難題,type-3poliii負責轉(zhuǎn)錄u6,7sk,hy4,hy5和h1核內(nèi)小rna。該類啟動子轉(zhuǎn)錄序列依靠的是啟動子自身的啟動元件,不需要任何內(nèi)源性轉(zhuǎn)錄元件(例如a-和b-box)存在于下游的編碼序列中。以人類u6核內(nèi)小rna的啟動子為例,啟動元件由啟動子tata框的上游、近端序列元素(pse)和末端序列元素(dse)組成。另外,type-3poliii能夠轉(zhuǎn)錄出具有正確5’末端的trna,不需要進一步的轉(zhuǎn)錄后加工。因此,目前國際上利用u6/h1啟動子轉(zhuǎn)錄原核trna,在多種真核細胞中,如hek293細胞,hela細胞和初級神經(jīng)元細胞,均證明有效。3.基因密碼子擴展技術(shù)在蛋白質(zhì)藥物開發(fā)中的應(yīng)用非天然氨基酸修飾蛋白應(yīng)用前景廣泛,例如在體蛋白質(zhì)功能探針,通過光交聯(lián)捕捉蛋白-蛋白瞬間作用,協(xié)助鑒定結(jié)構(gòu)和新蛋白的組學研究。此外,該技術(shù)在蛋白質(zhì)純化,材料科學,診斷學,藥物篩選,綠色能源等領(lǐng)域也有實際應(yīng)用價值。我們將突出介紹其在蛋白質(zhì)藥物開發(fā)中的應(yīng)用。2014年,蛋白質(zhì)藥物市場市值已經(jīng)超過1610.5億美元。蛋白質(zhì)藥物可分為多肽和基因工程藥物、單克隆抗體和基因工程抗體、重組疫苗;與以往的小分子藥物相比,蛋白質(zhì)藥物具有高活性、特異性強、低毒性、靶向性強、有利于臨床應(yīng)用的特點,已成為醫(yī)藥產(chǎn)品中的重要組成部分。除蛋白質(zhì)本身很強的治療效果外,針對蛋白質(zhì)的修飾(如聚合物或者藥物偶聯(lián))可以改善或者增加新的藥代動力學性質(zhì)。一系列的蛋白質(zhì)偶聯(lián)藥物已經(jīng)批準臨床使用,包括peg化修飾蛋白,抗體偶聯(lián)藥物(adc),多糖類蛋白結(jié)合疫苗。第一代蛋白質(zhì)偶聯(lián)技術(shù)的缺陷在于對偶聯(lián)位點的不可控性,所以傳統(tǒng)的修飾方法是非定點非定量的,并不適合大規(guī)模生產(chǎn)制備的質(zhì)量控制。因此,現(xiàn)在的研究聚焦于對修飾位點的精確導向。非天然氨基酸修飾技術(shù)位點可控的優(yōu)點,使其很快應(yīng)用于該領(lǐng)域。以抗體偶聯(lián)藥物為例,將非天然氨基酸引入到抗體的任意位置,在adc的構(gòu)建上有以下優(yōu)勢:非天然氨基酸只插入到毒素偶聯(lián)的特定位置,不影響其他氨基酸殘基和二硫鍵;每個抗體偶聯(lián)的毒素數(shù)目可以被有效調(diào)整,而不犧牲同質(zhì)產(chǎn)品的產(chǎn)率。目前,國際上allozyme和ambrx公司都已經(jīng)在致力于將該技術(shù)應(yīng)用于開發(fā)治療腫瘤的adc。4.基因密碼子擴展技術(shù)應(yīng)用的瓶頸利用終止密碼子編碼非天然氨基酸最大的瓶頸是全長蛋白質(zhì)產(chǎn)率,通常,大腸桿菌表達系統(tǒng)產(chǎn)量僅在1-10mg/l,而哺乳動物細胞表達體系則更低,這極大限制了該項技術(shù)在工業(yè)生產(chǎn)中的應(yīng)用。產(chǎn)率有限的一個主要原因是釋放因子(rf)會與正交trna競爭性識別終止密碼子,導致蛋白質(zhì)翻譯提前終止。目前,在大腸桿菌體系有以下幾種內(nèi)源性方法用于提高非天然氨基酸插入效率:1.減少釋放因子rf的競爭作用。在原核生物中,rf1負責識別終止密碼子uaa和uag,rf2負責識別終止密碼子uaa和uga,rf3協(xié)助兩者的功能。2011年,王磊等人(johnson,d.etal.naturechemicalbiology,2011,7:779-786)敲除了大腸桿菌中編碼rf1的基因prfa,由于rf1基因被移除會導致大腸桿菌死亡,于是他們過表達了rf2來維持基因工程改造細菌生存,最后獲得了一株能高效多點插入uaa的工程菌。但是,在酵母和哺乳動物細胞體系敲除rf1是不可行的,因為真核生物只有一個釋放因子erf1識別三個終止密碼子。2.通過文庫篩選,進化出正交的核糖體或結(jié)構(gòu)優(yōu)化的翻譯延長因子ef-tu,使細胞內(nèi)翻譯相關(guān)因子與正交trna/氨酰trna合成酶匹配。但是文庫篩選的方法很難直接轉(zhuǎn)移到哺乳動物細胞中。因此,如何實現(xiàn)哺乳動物表達體系的高效多點插入非天然氨基酸依舊是個國際難題。面對現(xiàn)在哺乳動物細胞體系非天然氨基酸插入效率低的問題,提高非天然氨基酸的插入效率,實現(xiàn)其在哺乳動物細胞中的高效多點插入,將有效促進基因密碼子擴展技術(shù)在蛋白質(zhì)藥物開發(fā)中的應(yīng)用。下面以綠色熒光蛋白gfp和hcv病毒包膜e2蛋白為例說明本發(fā)明的技術(shù)背景,但是下述內(nèi)容無論如何都不能理解為其是現(xiàn)有技術(shù)的承認,也無論無何都不能認為本發(fā)明的僅僅適用于gfp和e2蛋白。(1)gfp綠色熒光蛋白gfp是最常用的報告基因,也是指示非天然氨基酸插入的有力工具,其由238個氨基酸組成,其基因序列如seqidno:1,氨基酸序列如seqidno:14所示。所示。(2)hcve2蛋白丙型肝炎由丙型肝炎病毒(hcv)感染所致,據(jù)世界衛(wèi)生組織估計,全球有1.7億人感染hcv。在我國健康人群抗hcv陽性率為0.7%~3.1%,約3800萬人。hcv為一有包膜呈球形的正單鏈rna病毒。hcv基因組為單股正鏈rna,全長約9500堿基?;蚪M兩側(cè)分別為5’和3’非編碼區(qū),中間為開放讀碼框(orf),分為結(jié)構(gòu)區(qū)和非結(jié)構(gòu)區(qū)。結(jié)構(gòu)區(qū)包括核心蛋白區(qū)(c)和兩個包膜蛋白區(qū)(e1、e2),分別編碼核心蛋白和包膜蛋白。其中,hcv包膜e2蛋白介導hcv與靶細胞的結(jié)合,是涉及hcv感染性的最關(guān)鍵蛋白,也是抗hcv病毒藥物開發(fā)和疫苗研制的一個重要靶點。e2是一個高度糖基化蛋白,含糖基化位點約11個,因此,只適合在真核細胞(如哺乳動物細胞)表達體系中表達。其基因序列如seqidno:2所示。氨基酸序列如seqidno:15所示。技術(shù)實現(xiàn)要素::發(fā)明人經(jīng)過對現(xiàn)有技術(shù)的思考和研究,利用古甲烷球菌的trna(trnapyl)和吡咯賴氨酰-trna合成酶(mmpylrs)對和綠色熒光蛋白gfp/hcv病毒包膜e2蛋白為模式說明本發(fā)明的技術(shù)手段。發(fā)明人通過優(yōu)化正交trna的表達量和條件性減少釋放因子erf1的競爭作用,來促進終止密碼子uag被trna識別。優(yōu)化正交trna的表達量主要是優(yōu)化trna的啟動子和優(yōu)化trna/氨酰trna合成酶的比例;條件性減少釋放因子erf1主要是利用慢病毒轉(zhuǎn)導技術(shù)可誘導過表達對uag識別能力降低的突變型erf1蛋白。最終我們實現(xiàn)了非天然氨基酸在哺乳動物細胞中的高效多點插入。相比于其它方法,本發(fā)明的優(yōu)點可體現(xiàn)在如下中的一個或幾個:1.獲得了一個能更好啟動原核trna的真核啟動子。2.獲得了一個高效插入非天然氨基酸的載體。3.獲得了一個經(jīng)多西環(huán)素誘導后,能提高非天然氨基酸插入效率的穩(wěn)定細胞系。4.可以在蛋白質(zhì)任意多個位點引入非天然氨基酸,從而創(chuàng)造可以定點多點特異性修飾的蛋白;5.利用非天然氨基酸上特有的活性基團,可以實現(xiàn)高效,特異性的修飾目的;具體地,在本發(fā)明的一個具體的實施方案中,提供了引入非天然氨基酸的目的蛋白(例如gfp/e2蛋白),主要通過四個步驟:(1)構(gòu)建含有在選定的位點上具有琥珀密碼子突變的編碼目的蛋白基因的載體,(2)構(gòu)建并獲得pxh-n3質(zhì)粒,(3)構(gòu)建并獲得穩(wěn)定細胞系hek293-xh,(4)將步驟(1)與(2)在hek293-xh宿主細胞中共表達,且在培養(yǎng)基中加入多西環(huán)素和非天然氨基酸,最后從細胞中獲得引入突變的目的蛋白(例如突變型gfp/e2)。該突變系統(tǒng)的原理在于:突變型的trnapyl/pylrs滿足下列關(guān)系:(1):突變型的trnapyl不能利用宿主細胞的賴氨酰trna合成酶,只能被突變型的pylrs?;?;(2):突變型的pylrs只能?;痶rnapyl,不能酰化其它trna,因此,突變型trnapyl和pylrs之間的關(guān)系是正交性的,即突變型的pylrs只能?;蛔冃蛅rnapyl,同時突變型的trnapyl只能被突變型的pylrs?;?,也就是說同一質(zhì)粒中的突變型的trnapyl和pylrs是絕對的相互專一的。這種正交性的酶并且是只有這種酶可以把非天然氨基酸?;竭@種正交的trna上,并且只能?;@種trna,而不能?;渌膖rna。獲得的正交賴氨酰trna合酶/trna系統(tǒng),使非天然氨基酸(例如naek)與琥珀密碼子相對應(yīng),從而將非天然氨基酸定點引入到目的蛋白中。更為具體地,本發(fā)明提供了:1.評價非天然氨基酸插入效率的定量體系。要精確評價非天然氨基酸的插入效率,就需要一套能定量測量終止密碼子通讀效率的系統(tǒng)。發(fā)明人把海腎熒光素酶基因renilla和螢火蟲熒光素酶基因firefly融合克隆到pgl4載體上,在兩者的連接片段上引入琥珀密碼子uag,得到了雙報告載體pgl4-2luc-tag,其序列如seqidno:3所示。類似的,將琥珀密碼子替換成赭石密碼子(uaa),得到了評價終止密碼子uaa通讀效率的雙報告載體pgl4-2luc-taa;將琥珀密碼子替換成蛋白石密碼子(uga),得到了評價終止密碼子uga通讀效率的雙報告載體pgl4-2luc-tga。2.骨架載體pxh,該載體專門用于攜帶正交賴氨酰trna合酶/trna,該載體是由puc19載體改造獲得的穿梭載體,具有能在真核細胞中復制、分子量小、自帶多克隆位點等優(yōu)點,其序列如seqidno:6所示。3.真核7sk(人源)啟動子用于轉(zhuǎn)錄trna,7sk啟動子也是type-3poliii中的一種,通過比較,我們發(fā)現(xiàn)其轉(zhuǎn)錄trna的效率優(yōu)于國際上常用的u6或h1啟動子。7sk啟動子序列如seqidno:7所示。4.輔助載體pxh-n3,其序列如seqidno:8所示。.其可以較高水平的在哺乳動物細胞中(例如293t細胞)插入非天然氨基酸naek。其原理在于:經(jīng)過優(yōu)化trna啟動子后,進一步確定串聯(lián)trnapyl的個數(shù),該質(zhì)粒攜帶4個串聯(lián)重復的,以7sk為啟動子的突變型trnapyl,該trnapyl只能識別并攜帶naek這種結(jié)構(gòu)的非天然氨基酸;該質(zhì)粒同時還攜帶有只能?;搕rnapyl,而不能?;渌黷rna的突變型pylrs。其中,突變型的trnapyl序列如seqidno:9所示。突變型的pylrs序列如seqidno:10所示。5.表達載體pcdna3.1-gfp/e2,其攜帶了編碼突變型目的蛋白(例如gfp/e2蛋白)的核酸分子。示例性地,seqidno:1編碼的蛋白的第y39位/k101位/e132位/e172位,或編碼seqidno:2編碼的蛋白的第q26位/m73位/w86位/d150位,或其他對活性及穩(wěn)定性影響較小的位點的一個或多個氨基酸的密碼子被突變?yōu)殓昝艽a子。6.表達載體pcdna3.1-erf1,其攜帶了編碼突變型人源真核釋放因子erf1的核酸分子。示例性地,所述核酸分子特定位點的某個氨基酸密碼子被突變?yōu)槠渌被崦艽a子。其中,人源真核釋放因子erf1序列如seqidno:11所示,其氨基酸序列如seqidno:16所示。7.能提高非天然氨基酸插入效率的erf1e55r突變體,其中erf第55位的谷氨酸glu被突變?yōu)榫彼醓rg,尤其是將seqidno:16所示的真核釋放因子erf1第55位的谷氨酸glu突變?yōu)榫彼醓rg。通過比較發(fā)現(xiàn),將55位的glu突變成arg,選擇性增加琥珀密碼子的通讀效率,而較少影響赭石密碼子和蛋白石密碼子的通讀效果最理想,因此,該突變體有利于插入非天然氨基酸。8.雙病毒載體psd400和psd31-teto,其中,psd400的序列如seqidno:12所示。psd31-teto的序列如seqidno:13所示。其組合使用可實現(xiàn)目的蛋白的可誘導表達,其原理利用了目前應(yīng)用最多的是四環(huán)素調(diào)節(jié)系統(tǒng),即tet-on及tet-off系統(tǒng)。這一系統(tǒng)是根據(jù)大腸埃希氏菌屬tnl0的四環(huán)素抗性操縱子的結(jié)構(gòu)特點構(gòu)建的,這一抗性操縱子包含一個四環(huán)素抑制蛋白(tetr)、一個特異性的dna結(jié)合位點及四環(huán)素操縱序列(teto)。將teto引入到啟動子上,無四環(huán)素存在的條件下,tetr呈二聚體狀態(tài)并與teto結(jié)合,轉(zhuǎn)錄不能起始。四環(huán)素(tetracycline)或四環(huán)素類似物-多西環(huán)素(doxycycline)可以與tetr結(jié)合使其構(gòu)象發(fā)生改變,從而導致tetr與teto分離,轉(zhuǎn)錄可以起始。將四環(huán)素可調(diào)控系統(tǒng)與慢病毒載體相結(jié)合,使基因的條件性表達和基因敲除都成為可能。其中,psd400載體攜帶tetr基因,psd31-teto載體攜帶含有teto序列的cmv啟動子,用于表達目的蛋白(例如erf1e55r突變體)。9.穩(wěn)定細胞系hek293-xh,該細胞系由雙病毒轉(zhuǎn)導獲得,通過多西環(huán)素可以可誘導表達erf1e55r突變體,其會和細胞內(nèi)源性野生型erf1競爭結(jié)合erf3,從而減少了erf1-erf3復合物的形成,降低了erf1和正交trna競爭性識別琥珀密碼子的作用。因此,只需要在該穩(wěn)定細胞系中加入多西環(huán)素,就可以提高非天然氨基酸插入效率。10.定點突變的蛋白,例如gfp/e2,其4個位點上的氨基酸被突變?yōu)榉翘烊话被?,所述非天然氨基酸為含有疊氮基團的非天然氨基酸lys-azido(naek),后說明均以此非天然氨基酸為例。本系統(tǒng)也適用于含有光交聯(lián)基團的非天然氨基酸dizpk。示例性地,所述突變位點選自seqidno:1和/或seqidno:2編碼的蛋白中任意一個或多個位點上的氨基酸。優(yōu)選地,所述突變位點選自:seqidno:1所示核酸編碼的蛋白的第tyr39位/lys101位/glu132位/glu172位等對活性影響較小的位點;或seqidno:2所示核酸編碼的蛋白的第gln26位/met73位/trp86位/asp150位等對活性影響較小的位點。11.定點突變的目的蛋白,其與示于突變前目的蛋白的氨基酸的序列的區(qū)別在于第n位的氨基酸被突變?yōu)閚aek,所述突變氨基酸在蛋白中的連接方式如下式所示:由r1到r2的方向為氨基酸序列的n末端到c末端方向,r1為的第1至第n-1位氨基酸殘基,r2為第n+1位至c末端的氨基酸殘基,r4為12.制備含有非天然氨基酸的目的蛋白(例如gfp/e2)的方法,包括步驟:(1)選擇步驟:在目的蛋白的氨基酸序列中選擇期望突變的一個或多個特定氨基酸位點;(2)基因突變:將編碼對應(yīng)于(1)中選擇的位點的目的蛋白的氨基酸的密碼子用基因工程方法突變?yōu)殓昝艽a子;(3)表達載體構(gòu)建:將(2)基因突變步驟得到的突變的目的蛋白的編碼序列與合適的真核表達載體(pcdna3.1)可操作地連接,得到突變序列表達載體;(4)表達:將(3)得到的突變序列表達載體與項目4中的pxh-n3質(zhì)粒共同轉(zhuǎn)染項目9中的hek293-xh宿主細胞,將轉(zhuǎn)染成功后的宿主細胞在含有naek和多西環(huán)素的培養(yǎng)基中培養(yǎng),在適當?shù)臅r間收集細胞;(5)提取總蛋白,檢測含有非天然氨基酸的目的蛋白(例如gfp/e2)產(chǎn)量;本發(fā)明還提供了一種穩(wěn)定細胞系hek293-xh(保藏于中國微生物菌種保藏管理委員會普通微生物中心、保藏地址為北京市朝陽區(qū)北辰西路1號院3號中國科學院微生物研究所、保藏日期為2015年11月17日、保藏號為cgmccno:11593的細胞系;其分類命名為人hek-293t細胞),其含有本發(fā)明確證過的erf1e55r突變體。示例性地,本發(fā)明的穩(wěn)定細胞系為保藏號為cgmccno:11593的細胞系。附圖說明:圖1:質(zhì)粒pgl4-2luc-tag圖譜圖2:質(zhì)粒pxh圖譜圖3:質(zhì)粒pxh-n3圖譜圖4:質(zhì)粒psd31-teto圖譜圖5:trna啟動子效率的比較a:構(gòu)建的攜帶一拷貝數(shù)啟動子及trna載體示意圖;b:westernblot驗證各類型啟動子啟動trna對非天然氨基酸單點插入效率的影響,從左至右啟動子名稱分別為:u1,mu6,h1,hu6,7sk;圖示7sk啟動子相對其余啟動子非天然氨基酸插入型蛋白表達效率最高;c:細胞水平上,綠色熒光蛋白成像驗證各啟動子非天然氨基酸單點插入效率;與圖b結(jié)果相符合;d:不同啟動子對雙報告載體pgl4-2luc-tag通讀效率的影響,從左至右分別為u1、mu6、h1、hu6、7sk啟動子,7sk啟動子通讀效率最高,與圖b/c結(jié)果相符合。圖6:pxh-n3載體的優(yōu)化及構(gòu)建a:構(gòu)建的攜帶不同拷貝數(shù)7sk啟動子及trna載體示意圖;b:westernblot和綠色熒光蛋白成像檢測串聯(lián)不同個數(shù)7sk啟動子及trna對非天然氨基酸單點插入效率的影響,從左至右分別為1、2、3、4以及5個7sk-trna串聯(lián)單位,由圖可知在7sk啟動子下,串聯(lián)4個trna的非天然氨基酸單點插入效率最高;c:不同拷貝數(shù)7sk啟動子及trna對雙報告載體pgl4-2luc-tag通讀效率的影響,從左至右分別為1、2、3、4以及5個7sk-trna串聯(lián)單位,由圖可知在7sk啟動子下,串聯(lián)4個trna的通讀效率最高,與圖b結(jié)果相符合;d:westernblot和綠色熒光蛋白成像檢測串聯(lián)不同個數(shù)7sk啟動子及trna對非天然氨基酸雙點插入效率的影響,從左至右分別為1、2、3、4以及5個7sk-trna串聯(lián)單位,由圖可知與單點插入一樣,串聯(lián)4個7sk啟動子及trna的非天然氨基酸雙點插入效率最高。圖7:erf1突變位點的選擇a.原核和真核釋放因子的比較;b.負責識別終止密碼子的erf1n端結(jié)構(gòu)域晶體結(jié)構(gòu)示意圖(songhaiweietal.cell,2000,100:311–321);根據(jù)文獻報道(polinakryuchkovaetal.nucleicacidsresearch,2013,1–14),由圖所示,選擇可能選擇性降低tag識別能力的位點進行突變,主要包括glu55位,tyr125位和asn129位;c.利用雙報告載體pgl4-2luc-tag/taa/tga檢測不同erf1突變體對三個終止密碼子tag/taa/tga通讀率的影響,從左至右分別為空白組、wterf1(野生型)、突變體e55d(55位的谷氨酸突變成天門冬氨酸)、e55a、e55q、e55r、y125f、n129p以及e55r/n129p雙突變體。由圖可知e55r選擇性增加tag通讀率效果最理想,基本上不影響taa/tga的通讀。圖8:不同erf1突變體對非天然氨基酸插入效率的影響a.利用雙報告載體pgl4-2luc-tag檢測瞬時轉(zhuǎn)染不同erf1突變體對非天然氨基酸插入效率的影響:從左至右分別為空白組、wterf1(野生型)、突變體e55d、e55a、e55q、e55r、y125f、n129p、e55r/n129p雙突變體以及內(nèi)參;由圖可知e55r增加非天然氨基酸插入效率效果最理想。b.westernblot和綠色熒光蛋白成像檢測瞬時轉(zhuǎn)染不同erf1突變體對非天然氨基酸單點插入效率的影響,從左上至右下分別為空白組、e55r/n129p雙突變體、突變體e55d、e55a、e55q、e55r、y125f以及n129p,由圖可知在突變體e55r的非天然氨基酸單點插入效率最高;c.westernblot和綠色熒光蛋白成像檢測瞬時轉(zhuǎn)染不同erf1突變體對非天然氨基酸雙點插入效率的影響,從左上至右下分別為空白組、e55r/n129p雙突變體、突變體e55d、e55a、e55q、e55r、y125f以及n129p,由圖可知,同單點一致,突變體e55r的非天然氨基酸雙點插入效率最高。圖9:可誘導表達目的蛋白雙慢病毒系統(tǒng)的構(gòu)建a.構(gòu)建的psd400(a1)和psd31-teto(a2)雙慢病毒載體示意圖;b.將目的蛋白e55r或者對照紅色熒光蛋白(rfp)克隆到psd31-teto病毒載體上,包裝病毒,篩選出hek293-e55r穩(wěn)定細胞系以及對照細胞系hek293-rfp;c.通過對照細胞系hek293-rfp表達的紅色熒光蛋白成像,檢測加入多西環(huán)素后不同誘導時間對rfp蛋白表達的影響。從左到右分別為誘導0小時、24小時、36小時、48小時、72小時、96小時,由圖可知隨著誘導時間的增加,rfp表達量逐漸增加,誘導72小時后,其表達量比較理想。d.通過對照細胞系hek293-rfp表達的紅色熒光蛋白成像,檢測加入不同濃度多西環(huán)素后誘導對rfp蛋白表達的影響。從左到右多西環(huán)素濃度分別為0nm、10nm、25nm、50nm、100nm、1000nm,由圖可知隨著多西環(huán)素濃度的增加,rfp表達量逐漸增加,多西環(huán)素濃度為1000nm時,其表達量比較理想。圖10:多西環(huán)素誘導穩(wěn)定細胞系對非天然氨基酸插入效率的影響a:westernblot檢測不同多西環(huán)素誘導hek293-e55r(左圖)或?qū)φ战Mhek293-rfp穩(wěn)定細胞系(右圖)對非天然氨基酸單點插入效率的影響。從左到右多西環(huán)素濃度分別為0nm、10nm、25nm、50nm、100nm、1000nm,由圖可知隨著多西環(huán)素濃度的增加,hek293-e55r穩(wěn)定系中全長目的蛋白表達量逐漸增加,多西環(huán)素濃度為1000nm時,其表達量是不誘導組的2倍。而與之對比的hek293-rfp穩(wěn)定系全長目的蛋白表達量不受多西環(huán)素濃度影響,排除了多西環(huán)素本身對非天然氨基酸插入效率的影響。b:綠色熒光蛋白成像檢測不同多西環(huán)素誘導hek293-e55r對非天然氨基酸單點插入效率的影響,與westernblot結(jié)果一致,隨著多西環(huán)素濃度的增加,hek293-e55r穩(wěn)定系中反映gfp蛋白表達量的熒光強度逐漸增加。c:雙報告載體pgl4-2luc-tag檢測不同多西環(huán)素誘導hek293-e55r(左圖)或?qū)φ战Mhek293-rfp穩(wěn)定細胞系(右圖)對非天然氨基酸單點插入效率的影響。從左到右多西環(huán)素濃度分別為0nm、10nm、25nm、50nm、100nm、1000nm,由圖可知隨著多西環(huán)素濃度的增加,hek293-e55r穩(wěn)定系非天然氨基酸插入效率逐漸增加,多西環(huán)素濃度為1000nm時,其效率是不誘導組的2倍,與圖a/b結(jié)果相吻合。d:westernblot和綠色熒光蛋白成像檢測不同多西環(huán)素誘導hek293-e55r穩(wěn)定細胞系對非天然氨基酸雙點插入效率的影響。從左到右多西環(huán)素濃度分別為0nm、10nm、25nm、50nm、100nm、1000nm,由圖可知,與單點一致,隨著多西環(huán)素濃度的增加,hek293-e55r穩(wěn)定系中全長目的蛋白表達量逐漸增加,多西環(huán)素濃度為1000nm時,其表達量是不誘導組的4倍。圖11:非天然氨基酸在不同蛋白上的多點(n>3)插入a:雙報告載體pgl4-2luc-tag檢測pxh-n3載體結(jié)合多西環(huán)素誘導hek293-e55r穩(wěn)定細胞系對非天然氨基酸單點插入效率的影響。從圖可知,兩者結(jié)合后,非天然氨基酸單點插入效率接近90%。b:顯示四個琥珀密碼子突變位點的gfp晶體結(jié)構(gòu)示意圖;c:westernblot和綠色熒光蛋白成像檢測非天然氨基酸在gfp蛋白上的一至四點插入,從左至右分別為野生型gfp,分別含有1、2、3、4個琥珀密碼子的gfp,可以看出,加入多西環(huán)素后,gfp表達量隨突變位點增多而降低的趨勢有所緩解,其中,非天然氨基酸的四點插入產(chǎn)率大概為野生型的20%。d:顯示四個突變位點的hcve2晶體結(jié)構(gòu)示意圖;e:westernblot檢測非天然氨基酸在e2蛋白上的一至四點插入,其中,非天然氨基酸的四點插入產(chǎn)率大概為野生型的20%。為了更好地理解本發(fā)明,發(fā)明人用實施例對具體試驗進行闡述和說明,其中所述實施例僅用于說明,并不限定本發(fā)明的保護范圍。任何與本發(fā)明等價的變體或者實施方案都包括在本發(fā)明中。實施例1:基因載體的構(gòu)建(1)雙報告質(zhì)粒的構(gòu)建及獲得海腎熒光素酶基因renilla作為內(nèi)參,用肽段ggggs作為連接片段,融合表達在螢火蟲熒光素酶基因firefly的n端,在兩者的連接片段上引入琥珀密碼子uag,得到了雙報告載體pgl4-2luc-tag。類似地,將琥珀密碼子替換成赭石密碼子(uaa)或者蛋白石密碼子(uga),分別得到了評價終止密碼子uaa/uga通讀效率的雙報告載體pgl4-2luc-taa、pgl4-2luc-tga。(2)輔助質(zhì)粒的構(gòu)建及獲得通過條件的優(yōu)化及嘗試,確定4個trna由7sk啟動子串聯(lián)表達為最優(yōu),將trna合成酶(phers),4個串聯(lián)的7sk-trnapyl通過基因亞克隆方法克隆進同一載體(pxh)上,構(gòu)建并獲得pxh-n3輔助載體,該質(zhì)??梢员磉_特異識別非天然氨基酸naek的trna和trna合成酶。(3)psd31-teto質(zhì)粒的構(gòu)建及獲得以pcdna4tm/to/myc-hisa(invitrogen)質(zhì)粒為模板,經(jīng)過pcr獲得內(nèi)含兩個四環(huán)素操作子(2xteto2)的cmv啟動子。將該啟動子克隆到抗性改造為潮霉素b(hygromycinb)慢病毒載體psd31-sv40-hygro上,獲得psd31-teto質(zhì)粒,其序列如seqidno:13所示。(4)erf1突變位點的選擇和引物設(shè)計根據(jù)erf1的晶體結(jié)構(gòu),erf1識別終止密碼子的結(jié)構(gòu)域,根據(jù)文獻報道(polinakryuchkovaetal.nucleicacidsresearch,2013,1–14),本發(fā)明選擇了可能選擇性降低琥珀密碼子tag識別能力而不影響其它終止密碼子的位點進行突變,主要包括glu55位,tyr125位和asn129位;發(fā)明人針對以上位點,設(shè)計能夠使編碼所述氨基酸的密碼子突變?yōu)槠渌被岬囊铮唧w引物如下表所示。表1:erf1突變引物列表突變位點序列(5’‐3’方向)erf1‐e55r‐forgtggcaaaaatgttagcggatcgctttggaactgcatctaacerf1‐e55r‐revgttagatgcagttccaaagcgatccgctaacatttttgccacerf1‐e55q‐forgtggcaaaaatgttagcggatcagtttggaactgcatctaacerf1‐e55q‐revgttagatgcagttccaaactgatccgctaacatttttgccacerf1‐e55a‐forgtggcaaaaatgttagcggatgcctttggaactgcatctaacerf1‐e55a‐revgttagatgcagttccaaaggcatccgctaacatttttgccacerf1‐e55d‐forgtggcaaaaatgttagcggatgattttggaactgcatctaacerf1‐e55d‐revgttagatgcagttccaaaatcatccgctaacatttttgccacerf1‐y125f‐forccaattaatacgtcattgttcttgtgtgacaacaaattccatacagaggerf1‐y125f‐revcctctgtatggaatttgttgtcacacaagaacaatgacgtattaattggerf1‐n129p‐forcgtcattgtatttgtgtgaccccaaattccatacagaggctcerf1‐n129p‐revgagcctctgtatggaatttggggtcacacaaatacaatgacg利用定點突變試劑盒(lightningsite-directedmutagenesiskits,catalog#210518),按說明書操作野生型erf1表達載體pcdna3.1-erf1-wt為模板將erf1的第e55位,第y125位和第n129位這幾個位點的氨基酸密碼子突變?yōu)槠渌被?序列),構(gòu)建得到表達質(zhì)粒表達載體pcdna3.1-erf1,經(jīng)測序驗證突變成功。(5)gfp/e2突變位點的選擇和引物設(shè)計對了證明非天然氨基酸可以實現(xiàn)多點插入,發(fā)明人針對gfp的tyr39位/lys101位/glu132位/glu172位位點,或e2蛋白的gln26位/met73位/trp86位/asp150位位點進行同時突變,設(shè)計能夠使編碼所述氨基酸的密碼子突變?yōu)殓昝艽a子的引物,具體引物如下表所示。表2:gfp突變引物列表突變位點序列(5’‐3’方向)gfp‐y39‐forggcgagggcgatgccacctagggcaagctgaccctgaagttcgfp‐y39‐revgaacttcagggtcagcttgccctaggtggcatcgccctcgccgfp‐k101‐forgcgcaccatcttcttctaggacgacggcaactacaagacccgfp‐k101‐revgggtcttgtagttgccgtcgtcctagaagaagatggtgcgcgfp‐e132‐forgggcatcgacttcaagtaggacggcaacatcctggggcgfp‐e132‐revgccccaggatgttgccgtcctacttgaagtcgatgcccgfp‐e172‐forgatccgccacaacatctaggacggcagcgtgcagctcgfp‐e172‐revgagctgcacgctgccgtcctagatgttgtggcggatc表3:e2突變引物列表突變位點序列(5’‐3’方向)e2‐q26‐forcttagcaccaggcgccaagtagaacatccaactgatcaacace2‐q26‐revgtgttgatcagttggatgttctacttggcgcctggtgctaage2‐m73‐forcttcaggctgccccgagaggtaggccagctgccaacgccttacte2‐m73‐revagtaaggcgttggcagctggcctacctctcggggcagcctgaage2‐w86‐forctgattttccccagggctagggccccatcagccatgcce2‐w86‐revggcatggctgatggggccctagccctggggaaaatcage2‐d150‐forcctacaactggggtgaaaattagacggacgtcttcgtcctcaace2‐d150‐revgttgaggacgaagacgtccgtctaattttcaccccagttgtagg利用定點突變試劑盒(lightningsite-directedmutagenesiskits,catalog#210518),按說明書操作,以野生型gfp/e2表達載體pcdna3.1-gfp/e2-wt為模板將表2-表3中位點的氨基酸密碼子突變?yōu)殓杲K止密碼子,構(gòu)建得到表達質(zhì)粒(pcdna3.1-gfp-4tag、pcdna3.1-e2-4tag),經(jīng)測序驗證突變成功。實施例2:定點突變的gfp/e2的表達和鑒定本發(fā)明中構(gòu)建pxh-n3質(zhì)粒中含有源自古甲烷球菌的trna(trnapyl)和吡咯賴氨酰-trna合成酶(pylrs)基因,在表達細胞中,以琥珀終止密碼子(tag)為有義編碼子,能夠使非天然氨基酸naek摻入到蛋白中,從而造成目的蛋白的定點突變。下面,發(fā)明人對naek的摻入可能性和突變蛋白質(zhì)的生產(chǎn)性能進行了檢測。1:非天然氨基酸naek的合成和鑒定非天然氨基酸lys-azido的化學合成反應(yīng)式如下如上式所述,將原料1(2-溴乙醇)2.3ml溶于90ml丙酮以及15ml水的混合溶液,加入nan33.12g,60℃油浴加熱回流反應(yīng)20h。冷卻至室溫,旋蒸除去丙酮,無水乙醚萃取(30ml×8),無水na2so4干燥,旋蒸除去溶劑得2.62g無色液體產(chǎn)物2。將產(chǎn)物2(500mg,5.74mmol)加入到三光氣(1.70g,5.74mmol)的thf(10ml)溶液中。0℃攪拌反應(yīng)8h,溶劑蒸干。剩余物在真空下干燥1h,得到無色油狀產(chǎn)物3。將3溶解在1.5ml的thf中并緩慢加入boc-lys-oh(1.7g,6.88mmol)的1mnaoh(20ml)/thf(5ml)的溶液中。0℃攪拌反應(yīng)12h并逐漸升溫到室溫。重新將反應(yīng)液冷卻到0℃并用0℃的1m的鹽酸溶液將反應(yīng)液ph值調(diào)整至2~3。反應(yīng)液用etoac萃取(30ml×5),有機層用2×100ml的飽和食鹽水洗滌。無水na2so4干燥有機層、過濾、旋蒸除去溶劑得到1.65g無色粘稠液體產(chǎn)物4不用進一步純化。將4溶于15mlch2cl2中,攪拌下緩慢滴加15mltfa,室溫下反應(yīng)30min后蒸出溶劑,剩余液體產(chǎn)物用5ml甲醇溶解,加入100ml乙醚,析出大量白色固體沉淀,過濾干燥得到1.38g白色固體終產(chǎn)物5。1hnmr(d2o):δ=1.22-1.45(m,4h),1.67-1.73(m,2h),2.99(m,2h),3.38(m,2h),3.70(m,1h),4.09(m,2h).13cnmr(d2o):δ=21.4,28.4,29.6,39.5,53.4,56.2,57.8,116.0(tfa),153.1,162.3(tfa),172.9.hrms:m/zcalcdforc9h17n5o4[m]+:259.1281;found:259.1283,證明得到的lys-azido結(jié)構(gòu)正確。2:突變gfp/e2的naek多點摻入及鑒定(1)以攜帶有4個琥珀密碼子的的突變型gfp為例:將實施例1的步驟5獲得的pcdna3.1-gfp-4tag,以及實施例1的步驟2的pxh-n3以1:2比例混合,再與轉(zhuǎn)染試劑megatrans1.0按1:3比例混合,共同加入hek293-e55r穩(wěn)定細胞系中,6小時后換液加入濃度為1mm的naek以及多西環(huán)素,至細胞于37℃,5%co2的孵箱中繼續(xù)培養(yǎng);(2)隨后對hek293-e55r穩(wěn)定細胞系的多西環(huán)素誘導時間和誘導濃度等對突變型表達條件進行優(yōu)化,如圖8所示,最終確定1000nm的多西環(huán)素誘導72hr后裂解細胞收集蛋白;3:突變gfp/e2的鑒定(1)設(shè)計對照組,將加入野生型gfp/e2的表達細胞作為對照,做相同轉(zhuǎn)染處理;(2)收集蛋白,直接加入sds-page上樣緩沖液煮樣處理,并做sds-page電泳及westernblot分析,對比目的位置蛋白質(zhì)條帶,可明顯觀察到加入naek組表達出與野生型蛋白大小一致的全長gfp/e2,如圖7所示。(3)將突變型gfp通過抗flag標簽的beads純化,考馬斯亮藍染色,將條帶進行質(zhì)譜鑒定,確證gfp的特定位點引入了非天然氨基酸naek。當前第1頁12