含有富含亮氨酸重復(fù)序列的融合蛋白及其制法和應(yīng)用的制作方法
【專利摘要】本發(fā)明公開了一種含有富含亮氨酸重復(fù)序列的融合蛋白及其制法和應(yīng)用。具體的,本發(fā)明涉及一種融合蛋白,所述的融合蛋白自N端至C端具有以下結(jié)構(gòu):A—X—E—Y1—Y2式Ia;A—Y2—Y1—E—X式Ib;其中,A為任選的分泌信號肽;X為Slit2蛋白(神經(jīng)導(dǎo)向因子2)富含亮氨酸的重復(fù)序列1-2(LRRs1-2)元件;E為酶切位點;Y1為第一標(biāo)簽多肽元件;Y2為第二標(biāo)簽短肽元件,所述第二標(biāo)簽短肽元件為His標(biāo)簽元件;“—”表示連接上述元件的肽鍵或肽接頭。本發(fā)明融合蛋白有助于LRR正確折疊,形成有活性的功能多肽,而且可以簡便地通過一次酶切就將兩種標(biāo)簽元件清除,從而制得高純度、高活性的LRR序列。
【專利說明】含有富含亮氨酸重復(fù)序列的融合蛋白及其制法和應(yīng)用
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及生物分子領(lǐng)域,尤其涉及含有富含亮氨酸重復(fù)序列的融合蛋白及其制 法和應(yīng)用。
【背景技術(shù)】
[0002] 神經(jīng)導(dǎo)向因子Slit是一種在進化上高度保守的分泌型細胞外基質(zhì)糖蛋白,其 基因在1988年發(fā)現(xiàn)在中樞神經(jīng)系統(tǒng)的形成中發(fā)揮作用。Slit是一組相對分子質(zhì)量為 170-190kDa的細胞外分泌蛋白,對軸突生長和神經(jīng)元遷移起導(dǎo)向作用的軸突定向分子族成 員之一。
[0003] Slit蛋白是作為Roundabout (Robo)的配體發(fā)揮多功能的導(dǎo)向分子,它不僅具有 調(diào)節(jié)神經(jīng)軸突生長方向、引導(dǎo)神經(jīng)細胞遷移、影響神經(jīng)細胞形態(tài)分化的功能。近年來的研究 發(fā)現(xiàn),Slit在血管生成、心臟形態(tài)發(fā)生、腫瘤細胞遷移等多種生理過程中也發(fā)揮作用。
[0004] 在脊椎動物中存在3種Slit基因,即Slitl、Slit2、Slit3,并在各種生物組織中 廣泛表達。
[0005] S1 i t蛋白的主要結(jié)構(gòu)包括N端的胞外分泌信號肽,4個連續(xù)的富含亮氨酸 的重復(fù)序列(leucine-rich repeat,LRRs),也被命名為D1-D4結(jié)構(gòu)域,串聯(lián)的6-9個 EGF (epidermal growth factor)樣功能區(qū),一個laminin G樣結(jié)構(gòu)域和一個富含半光氨酸 的C末端結(jié)構(gòu)域。
[0006] Slit2能夠抑制神經(jīng)膠質(zhì)瘤、纖維肉瘤、乳腺癌、口腔鱗癌細胞的遷移,Slit3能 夠抑制惡性黑色素瘤細胞的遷移,也有報道稱Slit2能夠促進乳腺癌和結(jié)直腸癌細胞的轉(zhuǎn) 移。目前,Slit2對血管生成的作用仍存在爭議,關(guān)于Slit2促進血管生成和抑制血管生成 的兩方面作用都有文獻報道。Dunaway等發(fā)現(xiàn),在Slit2單獨存在時,體外和體內(nèi)實驗都證 明其能促進血管生成;然而在Ephrin-Al存在時,Slit2則能抑制血管生成,說明體外相對 簡單的細胞實驗環(huán)境得到的結(jié)果并不能完全反映體內(nèi)的真實作用。
[0007] Anil Prasad等人的研究表明,過度表達Slit2可以抑制乳腺癌細胞以及小鼠體 內(nèi)腫瘤的生長;Tseng等人的研究表明Slit2可以減緩肺癌的發(fā)展過程;Yuasa-Kawada等 人報道了 Slit蛋白能夠抑制乳腺癌細胞的遷移;Werbowetski-Ogilvie等人報道了 Slit2 能抑制成神經(jīng)管細胞瘤細胞的侵襲;Yiin等人報道了 Slit2能抑制大腦中神經(jīng)膠質(zhì)細胞瘤 細胞的侵襲。綜合考慮Slit2和/或Robol基因在腫瘤中存在廣泛的啟動子甲基化而導(dǎo)致 功能的缺失,以及Slit2對腫瘤發(fā)生發(fā)展的抑制作用。
[0008] 為了研究和應(yīng)用,有必要對Slit蛋白或其片段進行表達和分離純化。然而,由于 天然蛋白的含量有限,分離困難,因此需要開發(fā)高效的重組生產(chǎn)工藝。
[0009] 在重組生產(chǎn)工藝中,高效地生產(chǎn)出構(gòu)象正確且便于分離和純化的目的蛋白,常常 是較為困難的。常用的大腸桿菌表達系統(tǒng)雖然可以較高效地表達目的蛋白,但卻常常需要 復(fù)雜的復(fù)性工藝,且復(fù)性后的目標(biāo)蛋白的活性往往難以令人滿意。
[0010] 當(dāng)采用真核表達系統(tǒng)進行表達時,雖然避免了復(fù)性工藝,但目標(biāo)蛋白的正確折疊、 如何實現(xiàn)高表達水平以及如何有效分離目標(biāo)蛋白仍然是難點,尤其是對于某些短肽或含重 復(fù)序列的多肽而言。
[0011] 獲得了含目標(biāo)蛋白的培養(yǎng)液(或發(fā)酵產(chǎn)物)后,可采用各種不同的純化手段進行 分離純化。目前,一種常用的分離純化重組蛋白的方法為親和層析技術(shù)。
[0012] 以采用的His標(biāo)簽為例,6XHis是專門設(shè)計用于重組蛋白質(zhì)純化工作的標(biāo)簽蛋 白,是目前最常見的表達方式,其表達純化技術(shù)都很成熟,而且相對比便宜,它的優(yōu)點是表 達方便而且基本不影響蛋白的活性。通常帶組氨酸蛋白都可以在天然情況下被鎳瓊脂糖凝 膠或鎳NTA瓊脂糖凝膠吸附,但是因為His標(biāo)簽非常小,如果在融合蛋白折疊過程中被折疊 到蛋白內(nèi)部而導(dǎo)致His標(biāo)簽不容易暴露的話,則很難開展蛋白純化工作;同時His標(biāo)簽確實 還存在特異性不夠的問題。
[0013] 通常,使用His標(biāo)簽技術(shù)分離所得的蛋白質(zhì)純度約為90%左右,而現(xiàn)有技術(shù)中,使 蛋白進一步純化的工藝和步驟都相對較為繁瑣,且添加的蛋白或肽段常會對目標(biāo)蛋白的活 性造成干擾,導(dǎo)致目標(biāo)蛋白的表達不準(zhǔn)確或雜質(zhì)過多。
[0014] 綜上所述,為了簡便高效地制備高純度、高活性的重組蛋白,本領(lǐng)域迫切需要開發(fā) 高效簡便的生產(chǎn)工藝。
【發(fā)明內(nèi)容】
[0015] 本發(fā)明的目的就是提供一種高效簡便的生產(chǎn)外源蛋白的方法,從而簡便高效地制 備高純度、高活性的重組蛋白。
[0016] 本發(fā)明提供了一種融合蛋白,所述的融合蛋白自N端至C端具有式la或lb所述 的結(jié)構(gòu):
[0017] A-X-E-Yl-Y2 式 la ;
[0018] A - Y2-Yl-E- X 式 lb ;
[0019] 其中,
[0020] A為任選的分泌信號肽;
[0021] X 為 Slit2 蛋白的富含亮氨酸的重復(fù)序列 1-2 (leucine-rich repeatl-2, LRR1-2) 元件;
[0022] E為酶切位點;
[0023] Y1為第一標(biāo)簽多肽元件;
[0024] Y2為第二標(biāo)簽短肽元件,所述第二標(biāo)簽短肽元件為His標(biāo)簽元件;
[0025] "一,,表示連接上述元件的肽鍵或肽接頭。
[0026] 在另一優(yōu)選例中,所述的融合蛋白具有位于N端的分泌信號肽。
[0027] 在另一優(yōu)選例中,所述的分泌信號肽是來自于Slit2的分泌信號肽、或來自于其 他蛋白的分泌信號肽。
[0028] 在另一優(yōu)選例中,所述的分泌信號肽在其N端具有或不具有起始氨基酸Met。
[0029] 在另一優(yōu)選例中,所述的第一標(biāo)簽多肽元件的46aa。
[0030] 在另一優(yōu)選例中,在X和E之間的"一"為肽鍵。
[0031] 在另一優(yōu)選例中,在Y1和Y2之間無蛋白酶切位點。
[0032] 在另一優(yōu)選例中,在Y1和Y2之間的"一"為肽鍵。
[0033] 在另一優(yōu)選例中,所述的酶切位點是TEV蛋白酶的酶切位點。
[0034] (LeuGluValLeuPheGlnGlyPro, SEQ ID NO. :3)
[0035] 在另一優(yōu)選例中,所述的肽接頭長度為3-15個氨基酸;較佳地5-10個氨基酸。
[0036] 在另一優(yōu)選例中,所述的Slit2蛋白來源于哺乳動物。
[0037] 在另一優(yōu)選例中,所述的Slit2蛋白來源于人、大鼠、小鼠;更佳地,來源于人。
[0038] 在另一優(yōu)選例中,所述的Y1包括SEQ ID N0. : 2所示的改良型親和素標(biāo)簽(Strap II標(biāo)簽)、鏈親和素(Strepavidin)標(biāo)簽。
[0039] 在另一優(yōu)選例中,所述的His標(biāo)簽元件包括8 XHis標(biāo)簽元件和6 XHis標(biāo)簽元件。
[0040] 在另一優(yōu)選例中,所述的Y1為Strap II標(biāo)簽,而Y2為8XHis標(biāo)簽元件。
[0041] 在另一優(yōu)選例中,所述的S1U2LRR1-2的氨基酸序列如SEQ ID N0. :5所示。
[0042] 本發(fā)明第二方面,提供了一種分離的多核苷酸,所述的多核苷酸編碼本發(fā)明第一 方面所述的融合蛋白。
[0043] 在另一優(yōu)選例中,所述的多核苷酸序列如SEQ ID N0. :6所示。
[0044] 本發(fā)明第三方面,提供了一種表達載體,所述的表達載體含有本發(fā)明第二方面所 述的多核苷酸。
[0045] 在另一優(yōu)選例中,所述的表達載體包括真核表達載體、原核表達載體。
[0046] 本發(fā)明第四方面,提供了一種宿主細胞,所述的宿主細胞含有本發(fā)明第三方面所 述的表達載體或轉(zhuǎn)染了本發(fā)明第二方面所述的多核苷酸。
[0047] 在另一優(yōu)選例中,所述的宿主細胞包括哺乳動物細胞;較佳地包括CH0細胞、293 細胞。
[0048] 本發(fā)明第五方面,提供了一種制備Slit2LRRl-2蛋白的方法,所述的方法包括步 驟:
[0049] (i)在合適的表達條件下,培養(yǎng)如本發(fā)明第四方面所述的宿主細胞,從而表達本發(fā) 明第一方面所述的融合蛋白;
[0050] (ii)從培養(yǎng)體系中分離純化出本發(fā)明第一方面所述的融合蛋白;
[0051] (iii)對所述的融合蛋白,用針對元件E的蛋白酶進行酶解,從而制得 Slit2LRRl-2。
[0052] 在另一優(yōu)選例中,在步驟(ii)中,先用針對Y1元件的親和層析進行第一次分離; 然后用針對Y2元件的親和層析進行第二次分離。
[0053] 在另一優(yōu)選例中,在步驟(iii)中,還包括將S1U2LRR1-2與多肽E - Y1-Y2或 Y2 - Y1-E分開,從而制得純化的S1U2LRR1-2。
[0054] 本發(fā)明第六方面,提供了一種制備Slit2LRRl-2蛋白的方法,所述的方法包括步 驟:
[0055] 對本發(fā)明第一方面所述的融合蛋白,用針對元件E的蛋白酶進行酶解,從而制得 Slit2LRRl-2。
[0056] 本發(fā)明第七方面,提供了一種純化的S1U2LRR1-2蛋白,是通過本發(fā)明第五或第 六方面所述的方法生產(chǎn)制備的。
[0057] 應(yīng)理解,在本發(fā)明范圍內(nèi)中,本發(fā)明的上述各技術(shù)特征和在下文(如實施例)中具 體描述的各技術(shù)特征之間都可以互相組合,從而構(gòu)成新的或優(yōu)選的技術(shù)方案。限于篇幅,在 此不再一一累述。
【專利附圖】
【附圖說明】
[0058] 圖1為原始的pcDNA3. 1 (_)質(zhì)粒的圖譜;
[0059] 圖2顯示了實施例1中的真核表達Slit2蛋白的LRR1-2結(jié)構(gòu)域部分序列的表達 質(zhì)粒的構(gòu)建方法的流程圖;
[0060] 圖3為Slit2蛋白的LRR1-2結(jié)構(gòu)域部分序列的RT-PCR擴增電泳圖;
[0061] 圖4為Strap II蛋白標(biāo)簽、His蛋白標(biāo)簽以及TEV酶切位點序列的PCR擴增電泳 圖;
[0062] 圖5為構(gòu)建好的pcDNA3. 1 (_)/Slit2LRRl_2質(zhì)粒的圖譜;
[0063] 圖6為Western Blot方法檢測構(gòu)建質(zhì)粒的蛋白表達圖。
【具體實施方式】
[0064] 本發(fā)明人經(jīng)過廣泛而深入的研究,首次意外地發(fā)現(xiàn),在LRR序列的一端(尤其是C 端)添加第一標(biāo)簽多肽元件和第二標(biāo)簽短肽元件,不僅有助于LRR正確折疊,形成有活性的 功能多肽,而且可以極其簡便地通過一次酶切就將兩種標(biāo)簽元件清除,從而制得高純度、高 活性的LRR序列。在此基礎(chǔ)上完成了本發(fā)明。
[0065] 術(shù)語
[0066] 如本文所用,"本發(fā)明蛋白"、"本發(fā)明融合蛋白"、"具有式la或lb的融合蛋白"可 互換使用,均指具有式la或lb的融合蛋白,其N端至C端分別含有任選的分泌信號肽、目 標(biāo)基因、酶切位點、第一標(biāo)簽多肽元件以及第二標(biāo)簽短肽元件;或任選的分泌信號肽、第二 標(biāo)簽短肽元件、第一標(biāo)簽多肽元件、酶切位點以及目標(biāo)基因。本發(fā)明融合蛋白的一個顯著特 點是在C端或N端具有可通過酶切去除的連續(xù)串聯(lián)標(biāo)簽元件。此外,應(yīng)理解,所述術(shù)語還包 括重組融合蛋白的活性片段和衍生物。
[0067] 如本文所用,"分離的"是指物質(zhì)從其原始環(huán)境中分離出來(如果是天然的物質(zhì), 原始環(huán)境即是天然環(huán)境)。如活體細胞內(nèi)的天然狀態(tài)下的多核苷酸和多肽是沒有分離純化 的,但同樣的多核苷酸或多肽如從天然狀態(tài)中同存在的其他物質(zhì)中分開,則為分離純化的。 [0068] 如本文所用,術(shù)語"標(biāo)簽蛋白"、"標(biāo)簽"、"標(biāo)簽蛋白元件"、"標(biāo)簽元件"可互換使用, 均指可用于分離純化具有本發(fā)明式la或lb的融合蛋白的標(biāo)簽多肽。
[0069] Slit2 蛋白及其 LRR
[0070] Slit2蛋白的全長序列如SEQ ID N0. :13所示,編碼其蛋白的核苷酸序列如SEQID N0. :12所示。本發(fā)明S1U2LRR1-2蛋白的序列如SEQ ID N0. :5所示,編碼其蛋白的核苷酸 序列如SEQ ID N0. :4所示。
[0071] 本發(fā)明Slit2蛋白來源于哺乳動物,優(yōu)選地,來源于人、大鼠、小鼠。
[0072] 如本文所用,"S1U2LRR1-2蛋白"是指Slit2蛋白的LRR1-2結(jié)構(gòu)域。
[0073] 如本文所用,"純化的S1U2LRR1-2蛋白"是指S1U2LRR1-2蛋白基本上不含天然 與其相關(guān)的其它蛋白、脂類、糖類或其它物質(zhì)。本領(lǐng)域的技術(shù)人員能用標(biāo)準(zhǔn)的蛋白質(zhì)純化技 術(shù)純化S1U2LRR1-2蛋白?;旧霞兊牡鞍自诜沁€原聚丙烯酰胺凝膠上能產(chǎn)生單一的主 帶。
[0074] 肽鍵或肽接頭
[0075] 本發(fā)明的具有式la或lb的融合蛋白各元件之間可以直接以肽鍵相連接,或者通 過肽接頭連接。作為本發(fā)明的一種優(yōu)選的方式,所述的具有式la或lb的融合蛋白各元件 之間通過肽鍵之間連接,從而形成融合蛋白。
[0076] 通常,過短的肽接頭可在融合蛋白內(nèi)部造成空間位阻,影響蛋白的正確折疊,過長 的肽接頭可能增加融合蛋白的免疫原性,還可能影響融合蛋白的活性和功能。因此,可用于 本發(fā)明的肽接頭一般包括3-15個氨基酸;較佳地為5-10個氨基酸。
[0077] 具有連續(xù)串聯(lián)標(biāo)簽元件的融合蛋白
[0078] 本發(fā)明融合蛋白的氨基端(或羧基端)連續(xù)地含有兩個標(biāo)簽元件(如式la或lb 所示)。
[0079] A-X-E-Yl-Y2 式 la
[0080] A-Y2-Yl-E-X 式 lb
[0081] 其中,A、X、E、Y1、Y2的定義如上所述。
[0082] 對于第一標(biāo)簽多肽元件Y1而言,優(yōu)選的Y1選自下組:改良型親和素標(biāo)簽(Strap II標(biāo)簽)(長度為46aa)、鏈親和素(Str印II標(biāo)簽)(長度為9aa)。
[0083] 改良型親和素標(biāo)簽(Strap II標(biāo)簽)是在鏈親和素(Str印II標(biāo)簽)的基礎(chǔ)上改 良過的一種標(biāo)簽蛋白,其多肽序列如SEQ ID N0. :2所示,編碼其多肽的核苷酸序列如SEQ ID N0. :1 所示。
[0084] 本發(fā)明Strap II標(biāo)簽與Str印II標(biāo)簽的純化方式可以是相同或基本相同,即通 過與生物素的親和力進行層析。與Str印II標(biāo)簽相比,Strap II標(biāo)簽(SEQ ID NO. :2)增 加了標(biāo)簽的親和性,其優(yōu)點在于純化過程在生理條件下進行,使用的脫硫生物素溫和程度 的洗脫保護了靶蛋白的活性。而且,避免了常規(guī)Strep II標(biāo)簽的純化技術(shù)需要進行封閉處 理步驟。
[0085] Y2為第二標(biāo)簽短肽元件,且為His標(biāo)簽元件??捎糜诒景l(fā)明的His標(biāo)簽元件包括 6XHis或8XHis短肽,優(yōu)選的,為8XHis標(biāo)簽元件。
[0086] 此外,Y1和Y2之間無蛋白酶切位點,并以肽鍵直接連接。
[0087] 連續(xù)串聯(lián)標(biāo)簽的蛋白表達方案,一方面是結(jié)合兩種載體的優(yōu)點,避免存在的問題, 另一方面可以優(yōu)化蛋白純化步驟,提高純化后蛋白的純度,盡量減少來自動物源性的污染 和純化過程中的離子性污染。
[0088] 在本發(fā)明融合蛋白中,在元件Y1和X之間為蛋白酶酶切位點,可以包括本領(lǐng)域常 用的用于分離純化蛋白的酶切位點,如TEV蛋白酶、Hrv3C蛋白酶。附加條件是,在本發(fā)明 融合蛋白的其他元件序列中,不含有該酶切位點。
[0089] TEV蛋白酶是來源于煙草蝕紋病毒(TEV)的Nla蛋白酶經(jīng)改進后的50kDa的蛋白 酶,經(jīng)過設(shè)計后與天然TEV蛋白酶相比其穩(wěn)定性更好。此蛋白酶被用來切除純化后融合蛋 白的親和標(biāo)簽;并且該酶是經(jīng)由6 XHis標(biāo)簽純化而得(含組氨酸標(biāo)簽),純度達99%,剪切 反應(yīng)完畢后可通過Ni親和層析去除。在PH7. 0, 30°C時可達到最佳活性,但在PH5. 5-8. 5和 4-30°C的廣泛范圍內(nèi)TEV蛋白酶皆有活性,使得反應(yīng)條件的選擇可根據(jù)目的蛋白的情況而 修改。
[0090] -種可用于本發(fā)明的蛋白酶酶切位點為TEV蛋白酶,如SEQ ID N0. : 3所示。
[0091] 此外,在本發(fā)明的融合蛋白的N端,可具有或不具有分泌信號肽。當(dāng)具有分泌信號 肽時,有助于實現(xiàn)融合蛋白的分泌表達,以便提高純化效率。在本發(fā)明中,適用的分泌信號 肽包括來自于Slit2的分泌信號肽、或來外源導(dǎo)入的自于其他蛋白的分泌信號肽。其中,來 源于Slit2的分泌信號肽的核苷酸序列如SEQ ID N0. :14所不,其編碼的信號肽序列如SEQ ID N0. : 15 所示。
[0092] 編碼序列和重組生產(chǎn)
[0093] 對于本發(fā)明的融合蛋白而言,本發(fā)明的多核苷酸可以是DNA形式或RNA形式。DNA 形式包括cDNA、基因組DNA或人工合成的DNA。DNA可以是單鏈的或是雙鏈的。DNA可以是 編碼鏈或非編碼鏈。
[0094] 本發(fā)明還涉及上述多核苷酸的變異體,其編碼與本發(fā)明有相同的氨基酸序列的蛋 白質(zhì)片段、類似物和衍生物。此多核苷酸的變異體可以是天然發(fā)生的等位變異體或非天然 發(fā)生的變異體。這些核苷酸變異體包括取代變異體、缺失變異體和插入變異體。如本領(lǐng)域 所知的,等位變異體是一個多核苷酸的替換形式,它可能是一個或多個核苷酸的取代、缺失 或插入,但不會從實質(zhì)上改變其編碼多肽的功能。
[0095] 如本文所用,術(shù)語"引物"指的是在與模板配對,在DNA聚合酶的作用下能以其為 起點進行合成與模板互補的DNA鏈的寡居核苷酸的總稱。引物可以是天然的RNA、DNA,也可 以是任何形式的天然核苷酸。引物甚至可以是非天然的核苷酸如LNA或ZNA等。引物"大 致上"(或"基本上")與模板上一條鏈上的一個特殊的序列互補。引物必須與模板上的一 條鏈充分互補才能開始延伸,但引物的序列不必與模板的序列完全互補。比如,在一個3' 端與模板互補的引物的5'端加上一段與模板不互補的序列,這樣的引物仍大致上與模板 互補。只要有足夠長的引物能與模板充分的結(jié)合,非完全互補的引物也可以與模板形成引 物-模板復(fù)合物,從而進行擴增。
[0096] 本發(fā)明融合蛋白的各元件的核苷酸全長序列或其片段通??梢杂肞CR擴增法、重 組法或人工合成的方法獲得。對于PCR擴增法,可根據(jù)已公開的有關(guān)核苷酸序列,尤其是開 放閱讀框序列來設(shè)計引物,并用市售的cDNA庫或按本領(lǐng)域技術(shù)人員已知的常規(guī)方法所制 備的cDNA庫作為模板,擴增而得有關(guān)序列。當(dāng)序列較長時,常常需要進行兩次或多次PCR 擴增,然后再將各次擴增出的片段按正確次序拼接在一起。
[0097] -旦獲得了有關(guān)的序列,就可以用重組法來大批量地獲得有關(guān)序列。這通常是將 其克隆入載體,再轉(zhuǎn)入細胞,然后通過常規(guī)方法從增殖后的宿主細胞中分離得到有關(guān)序列。 [0098] 此外,還可用人工合成的方法來合成有關(guān)序列,尤其是片段長度較短時。通常,通 過先合成多個小片段,然后再進行連接可獲得序列很長的片段。
[0099] 應(yīng)用PCR技術(shù)擴增DNA/RNA的方法被優(yōu)選用于獲得本發(fā)明的基因。用于PCR的引 物可根據(jù)本文所公開的本發(fā)明的序列信息適當(dāng)?shù)剡x擇,并可用常規(guī)方法合成??捎贸R?guī)方 法如通過凝膠電泳分離和純化擴增的DNA/RNA片段。
[0100] 本發(fā)明也涉及包含本發(fā)明的多核苷酸的載體,以及用本發(fā)明的載體或融合蛋白編 碼序列經(jīng)基因工程產(chǎn)生的宿主細胞,以及制備本發(fā)明所述融合蛋白的方法。
[0101] 通過常規(guī)的重組DNA技術(shù),可利用本發(fā)明的多核苷酸序列可用來表達或生產(chǎn)重組 蛋白。一般來說有以下步驟:
[0102] (1).用本發(fā)明的編碼本發(fā)明蛋白的多核苷酸(或變異體),或用含有該多核苷酸 的重組表達載體轉(zhuǎn)化或轉(zhuǎn)導(dǎo)合適的宿主細胞;
[0103] (2).在合適的培養(yǎng)基中培養(yǎng)的宿主細胞;
[0104] (3).從培養(yǎng)基或細胞中分離、純化蛋白質(zhì)。
[0105] 本領(lǐng)域的技術(shù)人員熟知的方法能用于構(gòu)建含本發(fā)明蛋白的編碼DNA序列和合適 的轉(zhuǎn)錄/翻譯控制信號的表達載體。這些方法包括體外重組DNA技術(shù)、DNA合成技術(shù)、體內(nèi) 重組技術(shù)等。所述的DNA序列可有效連接到表達載體中的適當(dāng)啟動子上,以指導(dǎo)mRNA合成。 表達載體還包括翻譯起始用的核糖體結(jié)合位點和轉(zhuǎn)錄終止子。
[0106] 包含上述的適當(dāng)DNA序列以及適當(dāng)啟動子或者控制序列的載體,可以用于轉(zhuǎn)化適 當(dāng)?shù)乃拗骷毎?,以使其能夠表達蛋白質(zhì)。
[0107] 宿主細胞可以是原核細胞,如細菌細胞;或是低等真核細胞,如酵母細胞;或是高 等真核細胞,如哺乳動物細胞。代表性例子有:大腸桿菌,鏈霉菌屬的細菌細胞;真菌細胞 如酵母;植物細胞;果蠅S2或Sf9的昆蟲細胞;CHO、C0S、或293細胞的動物細胞等。
[0108] 用重組DNA轉(zhuǎn)化宿主細胞可用本領(lǐng)域技術(shù)人員熟知的常規(guī)技術(shù)進行。當(dāng)宿主為原 核生物如大腸桿菌時,能吸收DNA的感受態(tài)細胞可在指數(shù)生長期后收獲,用CaCl2法處理, 所用的步驟在本領(lǐng)域眾所周知。另一種方法是使用MgCl 2。如果需要,轉(zhuǎn)化也可用電穿孔的 方法進行。當(dāng)宿主是真核生物,可選用如下的DNA轉(zhuǎn)染方法:磷酸鈣共沉淀法,常規(guī)機械方 法如顯微注射、電穿孔、脂質(zhì)體包裝等。
[0109] 獲得的轉(zhuǎn)化子可以用常規(guī)方法培養(yǎng),表達本發(fā)明的基因所編碼的多肽。根據(jù)所用 的宿主細胞,培養(yǎng)中所用的培養(yǎng)基可選自各種常規(guī)培養(yǎng)基。在適于宿主細胞生長的條件下 進行培養(yǎng)。當(dāng)宿主細胞生長到適當(dāng)?shù)募毎芏群?,用合適的方法(如溫度轉(zhuǎn)換或化學(xué)誘導(dǎo)) 誘導(dǎo)選擇的啟動子,將細胞再培養(yǎng)一段時間。
[0110] 在上面的方法中的蛋白質(zhì)可在細胞內(nèi)、或在細胞膜上表達、或分泌到細胞外。如果 需要,可利用其物理的、化學(xué)的和其它特性通過各種分離方法分離和純化蛋白。這些方法是 本領(lǐng)域技術(shù)人員所熟知的。這些方法的例子包括但并不限于:常規(guī)的復(fù)性處理、用蛋白沉淀 劑處理(鹽析方法)、離心、滲透破菌、超處理、超離心、分子篩層析(凝膠過濾)、吸附層析、 離子交換層析、高效液相層析(HPLC)和其它各種液相層析技術(shù)及這些方法的結(jié)合。
[0111] 表達載體
[0112] 在獲得了編碼本發(fā)明融合蛋白的DNA序列之后,將其連入合適的表達載體,再轉(zhuǎn) 入合適的宿主細胞。最后通過培養(yǎng)轉(zhuǎn)化后的宿主細胞,通過分離純化得到本發(fā)明的融合蛋 白。
[0113] 因此,本發(fā)明還提供了包含編碼所述融合蛋白的核酸分子的載體。所述的載體還 可包含與所述核酸分子的序列操作性相連的表達調(diào)控序列,以便于所述融合蛋白的表達。
[0114] 如本文所用,"操作性相連"或"可操作地連于"指這樣一種狀況,即線性DNA序列 的某些部分能夠影響同一線性DNA序列其它部分的活性。例如,如果信號肽DNA作為前體 表達并參與多肽的分泌,那么信號肽(分泌前導(dǎo)序列)DNA就是可操作地連于多肽DNA ;如 果啟動子控制序列的轉(zhuǎn)錄,那么它就是可操作地連于編碼序列;如果核糖體結(jié)合位點被置 于能使其翻譯的位置時,那么它是可操作地連于編碼序列。一般"可操作地連于"意味著相 鄰近,而對于分泌前導(dǎo)序列則意味著在閱讀框中相鄰。
[0115] 在本發(fā)明中,任何合適的載體都可以使用,比如一些用于細菌、真菌、酵母和哺乳 動物細胞的克隆和表達的載體,如Pouwels等,克隆載體:實驗室手冊(Elsevier最新版) 中所描述的??蛇x用本領(lǐng)域已知的各種載體如市售的載體。比如,選用市售的載體,然后將 編碼本發(fā)明新融合蛋白的核苷酸序列可操作地連于表達調(diào)控序列,形成蛋白表達載體。
[0116] 可用于本發(fā)明的一種優(yōu)選的真核表達載體可以為pcDNA3. 1 (_)(購自Invitrogen 公司)。
[0117] 表達載體包括連接有合適的轉(zhuǎn)錄和翻譯調(diào)控序列的融合蛋白DNA序列,如來源于 哺乳動物、微生物、病毒或昆蟲的基因。調(diào)控序列可包括轉(zhuǎn)錄啟動子、操縱子、增強子、核糖 體結(jié)合位點或控制轉(zhuǎn)錄和翻譯起始和終止的合適序列。在融合蛋白序列需要調(diào)節(jié)序列功能 的時候,則連接合適的調(diào)控序列。這樣,啟動子序列被連接在編碼融合蛋白DNA序列前端。 在宿主細胞內(nèi)的復(fù)制的能力通常由復(fù)制起始點控制。用于轉(zhuǎn)化株識別的篩選基因也可加入 表達載體。
[0118] 另外,非天然的Slit2蛋白的信號肽的編碼序列可以引入表達載體。例如:信號肽 (分泌引導(dǎo)物)序列可以和與融合蛋白編碼序列融合,從而使翻譯的融合蛋白可分泌到細 胞外。信號肽可增強宿主細胞向胞外分泌嵌合多肽。信號肽在多肽從細胞內(nèi)分泌出來的過 程中可被切去。
[0119] 生產(chǎn)Slit2 LRR1-2蛋白的方法
[0120] 本發(fā)明還包括生產(chǎn)融合蛋白以及純化的Slit2 LRR1-2蛋白的方法,所述方法包括 培養(yǎng)含有融合蛋白編碼核酸的宿主細胞,從而培養(yǎng)本發(fā)明融合蛋白,從培養(yǎng)體系中分離純 化出權(quán)利要求1所述的融合蛋白;以及對所述的融合蛋白,用針對元件E的蛋白酶進行酶 解,從而制得純化的S1U2LRR1-2蛋白。
[0121] 在分離本發(fā)明融合蛋白的標(biāo)簽元件時,可以使用分別針對不同標(biāo)簽元件的親和 層析進行兩次分離后,再使用針對酶切位點的蛋白酶進行酶解,從而分離出純度更高的 Slit2LRRl-2 蛋白。
[0122] 所述的融合蛋白包括S1U2LRR1-2或其活性片段。所述方法可包括讓細胞表達編 碼的融合蛋白,以及使表達的融合蛋白的復(fù)性。此外所述方法還可包括復(fù)性的融合蛋白的 分離和/或純化。
[0123] 可將上述制備獲得的融合蛋白純化為基本均一的性質(zhì),例如在SDS-PAGE電泳上 呈單一條帶。例如,當(dāng)重組蛋白為分泌表達時,可以采用商品化的超濾膜來分離所述蛋白, 例如Millipore、Pellicon等公司產(chǎn)品,首先將表達上清濃縮。濃縮液可采用凝膠層析的方 法進一步加以純化,或采用離子交換層析的方法純化。例如陰離子交換層析(DEAE等)或 陽離子交換層析。凝膠基質(zhì)可為瓊脂糖、葡聚糖、聚酰胺等常用于蛋白純化的基質(zhì)。Q-或 SP-基團是較為理想的離子交換基團。最后,還可用羥基磷灰石吸附層析,金屬螯合層析,疏 水相互作用層析和反相高效液相色譜(RP-HPLC)等方法對上述純化產(chǎn)物進一步精制純化。
[0124] 可利用含有Slit2LRRl-2結(jié)構(gòu)域的特異性抗體、受體或配體的親和層析柱對表達 的融合性多肽進行純化。根據(jù)所使用的親和柱的特性,可利用常規(guī)的方法,如高鹽緩沖液、 改變pH等方法洗脫結(jié)合在親和柱上的融合性多肽。
[0125] 重組蛋白以及編碼該重組蛋白的核酸可利用適當(dāng)?shù)姆椒ㄖ苽?,例如,化學(xué)合成、重 組表達,或其合并應(yīng)用。參見John Wiley&Sons,Inc2000年出版的《Current Protocols in Molecular Biology》,以及 Cold Spring Harbor Laboratory Pressl989 年出版的 ((Molecular Coning:A Laboratory Manual〉〉。
[0126] 本發(fā)明的有益效果
[0127] 1.本發(fā)明融合蛋白獨特的連續(xù)串聯(lián)標(biāo)簽元件設(shè)計,尤其是經(jīng)改良的Strap II標(biāo) 簽,其長度合適,使表達的蛋白在宿主細胞中能夠得到各種修飾,能在不影響蛋白質(zhì)折疊的 情況下,最大程度的還原其天然構(gòu)象,使S1U2LRR1-2蛋白能于宿主細胞中表達,其表達量 高,且表達完整、準(zhǔn)確。
[0128] 2.本發(fā)明融合蛋白的連續(xù)串聯(lián)標(biāo)簽元件設(shè)計使目標(biāo)蛋白更易純化,且標(biāo)簽元件能 通過一次酶切完整切除,制備工藝簡單,制得的S1U2LRR1-2蛋白純度高,活性強。
[0129] 下面結(jié)合具體實施例,進一步闡述本發(fā)明。應(yīng)理解,這些實施例僅用于說明本 發(fā)明而不用于限制本發(fā)明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照 常規(guī)條件,例如Sambrook等人,分子克?。簩嶒炇沂謨裕∟ew York:Cold Spring Harbor Laboratory Press, 1989)中所述的條件,或按照制造廠商所建議的條件。除非另外說明,否 則百分比和份數(shù)是重量百分比和重量份數(shù)。
[0130] 實施例 1 構(gòu)建 pcDNA3. 1 (_)/Slit2LRRl_2 載體
[0131] 方法:采用外切酶法構(gòu)建質(zhì)粒。構(gòu)建質(zhì)粒的過程,共PCR擴增2段片段(信號肽序 列+目標(biāo)序列、酶切位點+標(biāo)簽蛋白序列),進行2次片段連接插入。所使用的引物分別是 Primerl、Primer2〇
[0132] 外切酶法具體步驟:
[0133] 1、配制反應(yīng)體系:載體片段(BamHI酶切后膠回收并測定濃度)和PCR片段(PCR 后膠回收并測定濃度)各50ng,lullOx外切酶buffer,補充ddH20至10ul ;
[0134] 2、冰上放置5min,加入lul稀釋至20U/ul的外切酶III(Takara公司),混勻后冰 上放置60min ;
[0135] 3、加入lulO. 5M EDTA(pH8. 0)溶液終止反應(yīng),之后65°C水浴5min ;
[0136] 4、水浴后冰上放置5min ;
[0137] 5、轉(zhuǎn)化連接產(chǎn)物。
[0138] 引物:
[0139] Primerl-F :CCACACTGGACTAGTATGCGCGGCGTTGGCTGG SEQ ID NO. :8
[0140] Primerl-R :ACCGAGCTCGGATCCTTATGAACAACGGAATTTCTTG SEQ ID NO. :9
[0141] Primer2-F :AAATTCCGTTGTTCACTGGAAGTGCTGTTCCAG SEQ ID NO. : 10
[0142] Primer2-R :ACCGAGCTCGGATCCTTAGTGGTGGTGGTGGTGGTG SEQ ID NO. :11
[0143] 結(jié)果:目標(biāo)序列、酶切位點+標(biāo)簽蛋白序列的擴增結(jié)果圖3和4所示,圖中可見,信 號肽序列+目標(biāo)序列、酶切位點+標(biāo)簽蛋白序列擴增成功。
[0144] 實施例 2pcDNA3. 1 (_)/Slit2LRRl_2 的成功表達
[0145] 方法:為了檢測構(gòu)建的質(zhì)粒是否成功表達,通過把質(zhì)粒轉(zhuǎn)染到AD293細胞中,之后 經(jīng)標(biāo)簽蛋白8XHis來做Western Blot,檢測融合蛋白是否成功表達。
[0146] 材料:High glucose DMEM培養(yǎng)基、胎牛血清均購自HyClone公司;轉(zhuǎn)染試劑 Magetran購自O(shè)rigene公司;AD293細胞用含10%胎牛血清的High glucose DMEM培養(yǎng)液 培養(yǎng)。倒置顯微鏡為Olympus產(chǎn)品,突光倒置顯微鏡為Nikon公司產(chǎn)品。
[0147] 步驟:
[0148] 2. 1.將凍存的細胞復(fù)蘇培養(yǎng),傳代3至4次使細胞達到良好的生長狀態(tài),進行鋪 板檢測。Magetran試劑轉(zhuǎn)染貼壁細胞。
[0149] 2. 2.接種AD293細胞至6孔板,用含10%胎牛血清的High glucose DMEM培 養(yǎng)基培養(yǎng)至密度約為70%-80%時可用于轉(zhuǎn)染。將Magetran試劑及質(zhì)粒pcDNA3. 1 (-) / S1U2LRR1-2溶液平衡至室溫,在離心管內(nèi)準(zhǔn)備下列混合液:200μ lopti-DMEM、2y g質(zhì)粒、 6μ1 Magetran轉(zhuǎn)染試劑,震蕩混勻后靜置室溫孵育lOmin。給細胞更換新的培養(yǎng)基后將混 合液加入培養(yǎng)盤中,搖勻。置于37°C、5%C02培養(yǎng)箱中培養(yǎng),培養(yǎng)12小時候移除培養(yǎng)基,更 換為新鮮的含10%胎牛血清的High glucoseDMEM培養(yǎng)基繼續(xù)培養(yǎng),轉(zhuǎn)染48h后,收蛋白用 于Western Blot檢測質(zhì)粒的蛋白表達情況。
[0150] 2. 3去除培養(yǎng)基后加入4°C PBS將細胞用細胞刮刮下來放入1. 5ml離心管中,2000 轉(zhuǎn)5min離心,去除上清。接著開始裂解細胞,將RIPA強裂解液與蛋白酶抑制劑,100:1的比 例混合后加到細胞沉淀中,4°C搖晃裂解lh后,4°C,14000g離心30min,取上清即樣品。最 后測樣品蛋白濃度,并加入Loading buffer煮沸8min,再調(diào)平上樣量用SDS-聚丙烯凝膠電 泳跑膠。電泳3小時,轉(zhuǎn)膜2小時,之后抗體孵育,一抗2小時,顯色曝光。
[0151] 結(jié)果:Western Blot檢測結(jié)果如圖6所示。轉(zhuǎn)染質(zhì)粒組蛋白表達正常,而轉(zhuǎn)染空 載組沒有檢測到蛋白表達,說明所構(gòu)建的真核表達質(zhì)粒能正常的在真核細胞中表達,質(zhì)粒 構(gòu)建成功。
[0152] 實施例3表達量的測試
[0153] 將一個純化得到的已知濃度(20 μ g/ml)的HisGFP蛋白作為對照,用Western Blot的方法進行蛋白表達量的測定。
[0154] 具體方法同實施例2,先轉(zhuǎn)染細胞,之后做Western Blot檢測。區(qū)別在于,跑 SDS-PAGE電泳時,加入一定已知量的HisGFP蛋白作為陽性對照。
[0155] 曝光得到結(jié)果后,通過對條帶進行灰度分析,計算得到蛋白的表達量。
[0156] 實施例4S1U2LRR1-2蛋白的純化
[0157] 方法及材料:由于采用的蛋白表達系統(tǒng)是哺乳動物高效表達系統(tǒng),選擇的細胞是 廣泛用于蛋白表達的經(jīng)過優(yōu)化的中國倉鼠卵巢細胞CH0-S,而表達載體中有加入胞外分泌 信號肽,因此采用懸浮培養(yǎng)的方法,使細胞在高密度情況下分泌盡可能多的蛋白到培養(yǎng)液 中,收集培養(yǎng)液用于后續(xù)蛋白純化。
[0158] 純化方法:
[0159] 4. 1先用針對第一標(biāo)簽多肽元件的生物素親和柱進行層析,再用針對第二標(biāo)簽短 肽元件的Ni親和柱進行層析;或
[0160] 4. 2先用針對第二標(biāo)簽短肽元件的Ni親和柱進行層析,再用針對第一標(biāo)簽多肽元 件的生物素親和柱進行層析。
[0161] 首先,對純化得到的蛋白片段進行定量,按比例的加入TEV蛋白酶進行酶切,去除 蛋白標(biāo)簽。
[0162] 酶切緩沖液:50mMTris7. 5,500mM NaCl,5%Glycerol 的反應(yīng)體系,于 4°C過夜酶 切。
[0163] 酶切過后體系內(nèi)的標(biāo)簽蛋白片段和TEV蛋白酶均可通過Ni親和層析去除。
[0164] 實施例5純化的S1U2LRR1-2的測定
[0165] 方法:純化得到S1U2LRR1-2蛋白之后,將采用細胞生物學(xué)實驗進行功能檢測。其 中,細胞劃痕實驗和Transwell細胞遷移實驗進行蛋白功能的初步判斷。
[0166] 劃痕實驗借鑒了體外細胞致傷愈合實驗?zāi)P?,在體外培養(yǎng)的單層細胞上,劃痕致 傷,然后加入藥物觀察其抑制腫瘤細胞遷移的能力。
[0167] 胰酶消化對數(shù)生長期細胞,計數(shù)調(diào)整細胞濃度為2-10X 105個/ml,24孔板每孔加 入500ul細胞懸液,37°C細胞培養(yǎng)箱中培養(yǎng)24h,使細胞貼壁。用10uL移液槍槍頭(或者無 菌牙簽)在單層細胞上呈"一"字劃痕,用PBS清洗3次,然后加入用2%FBS培養(yǎng)基配好的 不同的S1U2LRR1-2蛋白片段(可設(shè)置濃度梯度)溶液,取3-4個平行樣本,依據(jù)腫瘤細胞 的侵襲能力不同,37°C培養(yǎng)12-24h。鏡下拍照測量細胞遷移的面積。
[0168] Transwell細胞遷移實驗主要采用24孔板小室。用膠原(collagen)包被 Transwell小室(Millipore公司)底部膜。消化細胞,PBS洗1-2遍,用含0. 2%BSA的無血 清培養(yǎng)基重懸細胞,計數(shù)后調(diào)整細胞密度至1-10 X 1〇5,取細胞懸液200 μ 1加入Transwell 小室,24孔板下室加入500 μ 1含血清的培養(yǎng)基,其中加入不同的S1U2LRR1-2蛋白片段。 依據(jù)腫瘤細胞的侵襲能力不同,37°C培養(yǎng)12-48h。采用結(jié)晶紫染色細胞,鏡下拍照計數(shù)穿過 的細胞數(shù),評價S1U2LRR1-2蛋白片段對腫瘤細胞侵襲能力的影響。
[0169] 在本發(fā)明提及的所有文獻都在本申請中引用作為參考,就如同每一篇文獻被單獨 引用作為參考那樣。此外應(yīng)理解,在閱讀了本發(fā)明的上述講授內(nèi)容之后,本領(lǐng)域技術(shù)人員可 以對本發(fā)明作各種改動或修改,這些等價形式同樣落于本申請所附權(quán)利要求書所限定的范 圍。
[0001] 序列表 <110> 李華順 <120〉含有富含亮氨酸重復(fù)序列的融合蛋白及其制法和應(yīng)用 <130> P2013-0429 <160> 15 <170> Patentln version 3. 5 <2i0> i <211> 138 <212> DM <213> S核苷酸 <220> <221> CDS <222> (1)·. (138) <400> 1 Ctg tcc acc ggt ggc age gat gag aag acc act ggt tgg aga ggt ggc 48 Leu Sei"· Thr Gly Ser Asp Glu Lys Thr Thr Glv Trp Arg Gly Gly 1 5 ' 10 * 15· ' cat gtt gtg gaa ggc ttg get ggt ga,a ttg gaa caa ttg aga gcc cgt 96 His Val Val GLu Gly Leu Ala Gly GJu Leu Glu Gin Leu Arg Ala Arg 20 2B 30 ctg gag cat cac cca caa ggc caa aga gaa cca ggc age ggc 138 Leu Glu His His Pro Gin Glv Gin Arg Glu Pro Gly Ser Gly 35 40 45 <210> 2 <211> 46 <212> PRT <213〉人 TJt:列 <400> 2 Leu Scr Thr G1y G1y Sor Asp Glu Lys Thr Thr Giy Trp Arg Gly Gly 15 10 15 His Val Val Glu Glv Leu Ma Glv Glu Leu Glu Gin Leu Arg Ala Arg 20 25 30 Lou Glu His His Pro Gin Gly Gin Arg Glu Pro Gly Scr Glv 35 40 45 <210> 3 <211> 8 <212> Ρ1Π' <2i3>人X序列 <220> <221> MISCFMTURE <223>人1:序列 <400> 3 Leu Glu Val Leu Phe Gin G1y Pro 1 5 <210> 4 <211> 1374 <212> DNA <213> 智人(Homo sapiens) <220> <221> CDS <222> (1).. (1374)
[0002] <400> 4 cag tgc tct tgc teg ggc age aca gtg gac tgt cac ggg ct'g geg ctg 48 Glti Cvs Ser Cys Ser Glv Ser Thr Val Asp Cys His Gly Leu Ala Leu 1 5 10 15 ege age gig ccc agg aal ale ccc ege aac acc gag aga clg gal tia 96 Arg Ser Val Pro Arg Asn lie Pro Arg Asn Thr Glu Arg Leu Asp Leu 20 25 30 aat gga aat aac ate aca aga att aeg aag aca gat ttt get ggt ett 144 Asn Gly Asn Aso lie Thr Arg lie Thr Lvs Thr Asp Phe Ala Glv Leu 35 40 45 aga cat eta aga gtt ett cag ett atg gag aat aag att age acc att. 192 Arg His Leu Arg Val Leu Gin Leu Met Glu Asn Lys lie Ser Tlrr lie 50 55 60 gaa aga gga gca ttc cag gat ett aaa gaa eta gag aga ctg cgt tta 240 Glu Arg Gly Ala Phe Gin Asp Leu Ly,s Glu Leu Glu Arg Leu Arg Leu 65 ' 70 ' 75 80 aac aga aat cac ett cag ctg ttt cct gag ttg ctg ttt ett ggg act 288 Asn Arg Asn His Leu Gin Leu Phe Pro Glu Leu Leu Phe Leu Gly Thr 85 90 95 geg aag eta tac agg ett gat etc agt gaa aac caa att cag gca ate 336 Ala Lys Leu Tvr Arg Leu Asp Leu Ser Glu Asn Gin lie Gin Ala He 100 105 110 cca agg aaa get ttc cgt ggg gca gtt gac ata aaa aat ttg caa ctg 384 Pro Arg Lys Ala Phe Arg Gly Ala Val Asp lie Lys Asn Leu Gin Leu 115 120 125 gat tac aac cag ate age tgt att gaa gat ggg gca ttc agg get etc 432 Asp Τυγ Asn G丄n lie Ser Cys 丄ie Giu Asp /Ua Phe Arg Ala leu 130 135 140 egg gac ctg gaa gtg etc act etc aac aat aac aac att act aga ett 480 Arg Asp Leu Glu Val Leu Thr Leu Asn Asn Asn Asn lie Thr Arg Leu 145 150 155 160 tct gtg gca agt ttc aac cat atg cct aaa ett agg act ttt ega ctg 528 Ser Val Ala Ser Phe Asn His Met Pro Lys Leu Arg Thr Phe Arg Leu 165 170 175 cat tea aac aac ctg tat tgt gac tgc cac ctg gee tgg etc tee gac 576 His Ser Asn Asn Leu Tyr Cys Asp Cys His Leu Ala Trp Leu Ser Asp 180 185 190 tgg ett ege caa agg cct egg gtt ggt ctg tac act cag tgt atg ggc 624 Trp Lou Arg Gin Arg Pro Arg Val Gly Leu Tyr Thr Gin Cys Met Gly 195 200 205 ^ ccc tee cac ctg aga ggc cat aat gta gee gag gtt caa aaa ega gaa 672 Pro Ser His Leu Arg Gly His Asn Val Ala Glu Val Gin Lys Arg Glu 210 215 220 ttt gxc tgc agt ggt cac cag tea ttt atg get cct tct tgt agt gtt 720 Phe Val Cys Ser Gly His Gin Ser Phe Met Ala Pro Ser Cys Ser Val 225 ' 230 235 ' 240 ttg cac tgc cct gee gee tgt acc tgt age aac aat ate gta gac tgt 768 Leu His Cys Pro Ala Ala Cys Thr Cys Ser Asn Asn lie Val Asd Cys ' 245 ' ' 250 255 cgt ggg aaa ggt etc act gag ate ccc aca aat ett cca gag acc ate 816 Arg Gly Lys Gly Leu Thr Glu lie Pro Thr Asn Leu Pro Glu Thr lie ^ 260 265 270 aca gaa ata cgt ttg gaa cag aac aca ate aaa gtc ate cct cct gga 864 Thr Glu lie Arg Leu Glu Gin Asn Thr lie Lys Val He Pro Pro G1y 275 280 ' 285 ^ get ttc tea cca tat aaa aag ett aga ega att gac ctg age aat aat 912 Ala Phe Ser Pro Tyr Lys Lys Leu Arg Arg He Asp Leu Ser Asn Asn 290 ' ' 295 300 cag ate tct gaa ett gca cca gat get ttc caa gga eta ege tct ctg 960 Gin lie Ser Glu Leu Ala Pro Asp Ala Phe Gin Gly Leu Arg Ser Leu 305 310 315 ^ 320 aat tea ett gtc etc tat gga aat aaa ate aca gaa etc ccc aaa agt 1008 Asn Ser Leu Val Leu Tyr Gly Asn Lys lie Thr Glu Leu Pro Lys Ser 325 ' 330 335 tta ttt gaa gga ctg ttt tee tta cag etc eta tta ttg aat gee aac 1056 Leu Phe Glu Glv Leu Phe Ser Leu Gin Leu Leu Leu Leu Asn Ala Asn 340 345 350
[0003] aag ata aac tgc c.tt egg gta gat get ttt cag gat etc cac aac ttg 1104 Lys lie Asn Cys Leu Arg Val Asp Ala Phe Gin Asp Leu His Asn Leu ' 355 360 365 _ aac ett etc tee eta tat gac aac aag ett cag acc ate rcc aag ggg 1152 Asn Len Leu Ser Leu Τγτ Asp Asn Lys Leu Gin Thr lie Ala Lys Glv 370 ' 375 ^ 380 ' acc ttt tea cct ett egg gee att caa act atg cat ttg gee cag aac 1200 Thr Phe Ser Pro Leu Arg Ala lie Cln Thr Met His Leu Ala Gin Asn 385 390 395 400 ccc ttt att tgt gac tgc cat etc aag tgg eta geg gat tat etc cat 124-8 Pro Phe lie Cys Asp Cys His Leu Lys Trp Leu Ala Asp Tyr Leu His 405 410 415 acc aac cc-g att gag acc agt ggt gee cgt tgc acc age ccc ege ege 1296 Thr Asn Pro Tie Glu Thr Ser Gly Ala Arg Cys Thr Ser Pro Arg Arg 420 425 430 ctg gca aac aaa aga att gga cag ate aaa age aag aaa ttc cgt tgt 1344 Leu Ala Asn LyvS Arg lie Glv Gin lie Lvs Ser Lys Lys Plie Arg Cvs 43E 440 445 tea ate aaa age aag aaa ttc cgt tgt tea 1371 Ser ile Lys Ser Lys Lys Phe Arg Cys Ser 450 ' ' 455 <210> δ <21?> 158 <212> PRT <213> fiACHomo sapiens) <400> 5 Gin Cys Ser Cys Ser Gly Ser Thr Val Asp Cys His Gly Leu Ala Leu 1 5 10 15 Arg Ser Val Pro Arg Asn Ile Pro Arg Asn Thr Glu Arg Leu Asp Leu 20 25 30 Asn Gly Asn Asn lie Thr Arg lie Thr Lys Thr Asp Phe Ala Gly Leu 35 40 45 Arg His Leu Arg Val Leu Gin Leu Met Glu Asn Lvs Ile Ser Thr Ile 50 55 60 Glu Arg Gly Ala F^he Gin Asp Leu Lys Glu Leu Glu Arg Leu Arg Leu 65 ' 70 75 80 Asn Arg Asn His Leu Gin Leu Phe Pro Glu Leu Leu Phe Leu Gly Thr RB 90 95 Ala Lys Leu Tvr Arg Leu Asp Leu Ser Glu Asn Gin Ile Gin Ala Ile 100 105 110 Pro Arg Lvs Ala Phe Arg Gly A1p Yal Asp Ile Lys Asn Leu Gin Leu 115 120 125 Asp Tvr Asn Gin Tie Ser Cys Tie Glu Asp Gly Ala Phe Arg Ala Leu 130 135 140 Arg Asp Leu Giu Val Leu Thr Leu Asn Asn Asn Asn lie Thr Arg Leu 145 150 155 160 Ser Val Ala Ser Phe Asn His Mel Pro Lvs Leu Arg Thr Phe Ai-g Leu 165 170 175 His Ser Asn Asn Leu Tyr Cys Asp Cys His Leu Ala Trp Leu Ser Asp 180 185 190 Trp Leu Arg Gin Arg Pro Arg Val Gly Leu Tvr Thr Gin Cys Met Glv 195 200 205 Pro Ser His Leu Arg Gly His Asn Val Ala Glu Val Gin Lts Arg Glu 210 215 220 ^ Phe Val Cys Ser Gly His Glri Ser Phe Met Ala Pro Ser Cys Ser Val 225 ^ 230 235 ^ 240 Leu His Cvs Pro Ala Ala Cvs Thr Cys Ser Asn Asn Ile Val Asp Cys 245 250 255 Arg Gly Lys Gly Lou Thr Glu Ilo Pro Thr Asn Leu Pro Glu Thr lie 260 265 270 Thr Clu Ile Arg Leu Giu Gin Asn Thr Ι1θ Lvs Val lie Pro Pro Gly 275 280 285 Ala Phe Ser Pro Tyr Lys Lys Leu Arg Arg lie Asp Lei] Ser Asn Asn 290 295 300 Gin lie Ser Giu Len Ala Pro Asp Ala Phe Gin Gly Leu Arg Ser Leu
[0004] 305 310 315 320 Asn Ser Leu Val Leu Tyr Gly Asn Lvs lie Thr Glu Leu Pro Lys Ser 325 ' 330 335 Leu Phe Glu Gly Leu Phe Ser Leu Gin Leu Leu Leu Leu Asn Ala Asn 340 345 350 Lys lie Asn Cys Leu Arg Val Asp Ala Phe Gin Asp Leu His Asn Leu 355 360 365 Asn Leu Leu Ser Leu Tyr Asp Asn Lys Leu Gin Thr lie Ala Lys Cly 370 375 380 Thr Phe Ser Pro Leu Arg Ala lie Gin Thr Met Iiis Leu Ala Gin Asn 385 390 395 400 Pro Phe lie Cys Asp Cy^s His Leu Lys Tip Leu Ala Asp Tvr Lea His ^ 405 410 ^ 415 Thr Asn Pro lie Glu Thr Ser Gly Ala Arg Cys Thr Ser Pro Arg Arg 420 425 430 Leu Ala Asn Lys Arg lie G1y Gin He Lvs Ser Lys Lys Phe Ai'g Cvs 435 440 445 Ker 11 r I,vs Sei' Lys I.y.s Phe Arg Cvs Ser 450 ' 455 - <210> 6 <211> 1626 <212> DNA <213>人工序列 <220> <22i> CDS <222> (1).. (1626) <400> 6 atg ege ggc gtt ggc tgg cag atg ctg tc.c ctg teg ctg ggg tta gtg 48 Met Arg Gly Val Gly Trp Gin Met Leu Ser Leu Ser Leu Gly Leu Val 1 ' 5 ' 10 15 ctg geg ate ctg aac aag gtg gca ccg cag geg tgc ccg geg cag tgc 96 Leu Ala lie Leu Asn Lys Val Ala Pro Gin Ala Cys Pro Ala Gin Cys 20 ' 25 ' 30 tet tgc teg ggc age aca gtg gac igt cac ggg ctg geg ctg ege age 144 Ser Cys Ser Gly Ser Thr Val Asp Cys Iiis Gly Leu Ala Leu Arg Ser 35 40 ' 45 gtg ccc agg aat ate ccc ege aac acc g&g aga ctg gat tta aat gga, 192 Va.1 Pro Arg Asn Tie Pro hrg Asn Thr Gilt Arg Asp Leu Asn Glv 50 55 60 * aat aac ate aca aga att aeg aag aca gat ttt get ggt ett aga cat 240 Asn Asn lie Thr Arg He Thr Lys Thr Asp Phe Ala Gly Leu Arg His 65 70 75 80 eta aga gtt c.tt cag ett atg gag aat aag att a,gc acc art. gaa aga 288 Leu Arg Val Leu Gin Leu Met Glu Asn Lvs lie Ser Thr lie Glu Arg 85 90 95 gga gca ttc cag gat ett aaa gaa eta gag aga ctg cgt tta aac aga 336 Glv Ala Phe Glu Asp Leu Lys Glu Leu Glu Arg Leu Arg Leu Asn Arg ^ 100 " 105 110 aat cac ett cag ctg tt-t. cct gag ttg ctg ttt ett ggg act geg aag 384 Asn His Leu Gin Leu Phe Pro Glu Leu Leu Phe Leu Gly Thr Ala Lys 115 120 125 eta tac agg ett gat etc agt gaa aac caa att cag gca ate cca agg 432 Leu Tyr Are Leu Asp Leu Ser Glu Asn Gin lie Gin Ala lie Pro Arg 130 135 140 aaa get ttc cgt ggg gca gtt gac ata aaa aat ttg caa ctg gat tac i80 Lys Ala Phe Arg Gly Ala Val Asp lie Lys Asn Leu Gin Leu Asp Tyr 145 150 155 160 aac cag ate age tgt att gaa. gat ggg gca ttc agg get etc egg gac 528 Asn Gin lie Ser Cys lie Glu Asp Gly Ala Pho Arg Ala Leu Arg Asp 165 170 175 ctg gaa gtg etc act etc aac aat aac aac att act aga ert tet gtg 576 Leu Glu Val Leu Thr Leu Asn Asn Asn Asn lie Thr Arg Leu Ser Val 180 185 190 gea agt ttc aac cat atg cct aaa ett agg act ttt ega ctg cat tea 624 Ala Ser Phe Asn His Met Pro Lys Leu Arg Thr Phe Arg Leu His Ser
[0005] 195 200 205 aac aac ctg tat tgt gac tgc cac ctg gcc tgg etc tee gac tgg ett 672 Asn Asn Leu Tyr €vs Asp Cys His Leu Ala Trp Leu Ser Asp Trp Leu 210 215 220 ege caa agg cct egg gtt ggt ctg tac act cag tgt atg ggc ccc tee 720 Arg Gin Arg Pro Arg Val Gly i.eu Tvr Thr Gin Cys Met Gly Pro Ser 225 230 . ^ 235 240 cac ctg aga ggc cat aat gta gcc gag gtt caa aaa ega gaa ttt gtc 768 His Leu Arg Gly His Asn Yal Ala Glu Yal Gin Lys Arg Glu Phe Val 245 250 255 tgc. agt- ggt- cac cag tea ttt atg get cct tet tgt agt gtt ttg cac 816 Cvs Ser G1y His CIn Ser Phe Met. Ala Pro Ser Cys Ser Val Leu His 260 265 270 tgc cct gcc gcc tgt acc tgt age aac aat ate gta gac tgt cgt ggg 864 Cvs Pro Ala Ala Cys Thr Cvs Ser Asa Asn lie Val Asp Cys Arg Glv " 275 " 280 285 . aaa ggt etc act gag ate ccc aca aat ett cca gag acc ate aca gaa 912 Lys Gly Leu Thr Glu lie Pro Thr Asn Leu Pro Glu Thr lie Thr Glu 290 295 300 ato, cgt ttg gaa cag aac aca ate aaa gtc ate cct cct gga get ttc 960 lie Arg Leu Glu Gin Asn Thr lie Lys Val lie Pro Pro GIy Ala Phe 305 310 ^ 315 ^ 320 tea cca tat aaa aag ett aga ega att gac ctg age aat aat cag ate 1008 Ser Pro Tyr ^rs Lvs Leu Arg Ai'g Ilo Asp Leu Sor Asn Asn Gin lie 325 330 335 tet gaa ett gca cca gat get t-tc caa gga eta ege tet ctg aat tea 1056 Ser Glu Leu Ala Pro Asp A上a Phe G丄n Gly leu Arg Ser hen Asn Ser 340 345 350 ett gtc etc- tat gga aat aaa ate aca gaa etc ccc aaa agt tta ttt 1104 Leu VaJ Leu Tyr Glv Asn Lys lie Thr Glu Leu Pro Lys Ser Leu Phe 355 360 365 gaa gga ctg ttt tee tta cag etc eta tta ttg aat gcc aac aag ata 1152 Glu Gly Leu Phe Ser Leu Gin Leu Leu Leu Leu Asn Ala Asn Lys lie 370 375 380 ^ aac tgc ett egg gta gat. gei, 11.1; cag gB,t. etc cac aac ttg aac ett 1200 Asn Cys Leu Arg Val Asp Ala Phe Gin Asp Leu His Aen Leu Asn Leu 385 390 395 400 etc tee ct.a tat gac aac aag ett cag acc ate gcc aag ggg acc ttt 1248 Len Ser Leu Tyr Asp Asn I.ys Leu Gin Thr Tie Ala Lvs G1y Thr Phe 405 ~ 410 415 tea cct ett egg gee at.t caa act atg cat ttg gcc cag aac ccc ttt 1296 Ser Pro Leu Arg Ala lie Gin Thr Met His Leu Ala Gin Asn Pro Phe 420 425 430 att tgt gac tgc cat etc aag tgg eta geg gat tat etc cat acc aac 1344 lie Cvs Asp Cys His Leu Lys Trp Leu Ala Asp Tyr Leu His Thr Asn 435 440 445 ccg att gag acc agt ggt gcc cgt tgc acc age ccc ege ege ctg gca 1392 Pro lie Glu Thr Ser Gly Ala Arg Cvs Thi - Ser Pro Arg Arg Lm Ala 450 455 ^ 460 aac aaa aga att gga cag ate aaa age aag aaa ttc cgt tgt tea ctg 1440 Asn Lys Arg lie Gly Gin lie Lys Ser Lvs Lys Phe Arg Cys Ser Leu 465 470 475 480 gaa gtg ctg ttc cag ggc cct ctg tee acc ggt ggc age gat gag aag 1488 Glu Val Leu Phe Gin Glv Pro Leu Ser Thr Glv Gly Ser Asp Glu Lys 485 " 490 495 acc act ggt tgg aga ggt· ggc cat gtt gtg gaa ggc ttg get ggt gaa 1536 Thr Thr Gly Trp Arg Glv Gly His Val Vai Glu Gly Leu Ala Gly Glu 500 505 ' 510 ttg gaa caa ttg aga gcc cgt ctg gag cat cac cca caa ggc caa aga 1584 Leu Glu Gin Leu Arg Aia Arg Leu GJ_u iiis Uis Pro Gin Gly Gin Arg 515 520 525 gaa cca ggc age ggc cac cac cac car rpr rac car r-nc ta?i 1626 Glu Pro Gly Ser Glv His His His His His His His 530 535 540 <210> 7 <211> 541 <212> PRT
[0006] <213>人工序列 <400> 7 Met Arg Glv Val Gly Trp Gin Met Leu Ser Leu Ser Leu Glv Leu ¥al 15 10 15 Leu Ala lie Leu Asn Lys Yal Ala Pro Gin Ala Cys Pro Ala Gin Cys 20 25 30 Ser Cys Ser Γτ?γ Ser Thr Val Asp Cys His Crly i.eu Ala. I.eu Arg Ser 35 40 ' 15 Val Pro Arg Asn lie Pro Arg Asn Thr Glu Arg Leu Asp Leu Asn Gly 50 55 60 ' Asn Asn lie Thr Arg lie Thr Lys Thr Asp Phe Ala Gly Leu Arg His 65 70 75 ^ 80 Leu Arg Val Lou Gin Lou Met Glu Asn Lys He Scr Thr lie Glu Arg 85 90 95 Gly Ala Phe Gin Asp Leu Lys Glu Leu Glu Arg Leu Arg Leu Asn Arg 100 105 110 Asn Ilis Leu Gin Leu Phe Pro Glu Leu Leu Phe Leii Gly Thr Ala Lys 115 120 125 ' Leu Tyr Arg Leu Asp Leu Ser Glu Asn Gin lie Gin Ala lie Pro Arg 130 135 140 Lys Ala Phe Arg Gly Ala Val Asp lie Lys Asn Leu Gin Leu Asp Tyr 145 150 155 160 Asn Gin He Ser C^s He Glu Asp Gly Ala Phe Arg Ala Leu Arg Asp 165 170 175 Leu Glu Val Leu Thr Leu Asn Asn Asn Asn Tie Thr Arg I.eu Ser Val 180 185 190 Ala Ser Fhe Asn His Met Pro Lys Leu Arg Thr Phe Arg Leu His Ser 195 200 205 Asn Asn Leu Tyr Cys Asp €vs His Leu Ala Trp Leu Ser Asp Trp Leu 210 2*15 220 Arg Gin Arg Pro Arg Val Gly Leu Tyr Thr Gin Cvs Met Glv Pro Ser 225 230 235 240 His Leu Arg Gly His Asn Val Ala Glu Val Gin Lvs Arg Glu Phe Val 245 250 255 Cys Ser Gly His Gin Ser Phe Met Ala Pro Ser Cvs Ser Val Leu His I 260 265 ' 270 Cys Pro Ala Ala Cys Thr Cvs Ser Asn Asn lie Val Asp Os Arg Gly ' 275 ' ' 280 285 ' Lys Gly Leu Thr Glu He Pro Thr Asn Leu Pro Glu Thr lie Thr Glu 290 295 300 lie Arg Leu Glu Gin Asn Thr lie Lys Val lie Pro Pro Glv Ala Phe 305 310 315 320 Ser Pro Tyr Lvs Lys Leu Arg Arg lie Asp Leu Ser Asn Asn Gin lie 325 330 335 Ser Glu Leu Ala Pro Asp Ala Phe Gin Gly Leu Arg Ser Leu Asn Ser 340 345 ^ 350 Leu Val Leu Tyr Gly Asn Lys lie Thr Glu Leu Pro Lvs Ser Leu Phe 355 360 365 Glu Gly Leu Phe Ser Leu Gin Leu Leu Leu Leu Asn Ala Asn Lys lie 370 375 380 Asn Cys Leu Arg Val Asp Ala Phe Gin Asp Leu His Asn Leu Asn Leu 385 390 395 400 Leu Ser Len Tyr Asp Asn \,ys Leu Gin Thr Tie Ala, Lys Glv Thr Phe ^ 405 ~ 410 415 Ser Pro Leu Arg Aia lie G_Ln Thr Met His Leu Ma Gin Asn Pro Phe 420 425 430 lie Cys Asp Cys His Leu Lvs Trp Leu Ala Asp Tyr Leu His Thr Asn ' 435 " 440 445 Pro lie Glu Thr Ser Glv Ala Arg Cys Thr Ser Pro Arg Arg Leu Ala 450 455 460 Asn Lys Arg He Gly Gin lie Lys Ser Lys Lys Phe Arg Cvs Ser Leu 465 470 475 480 Glu Yal Leu Phe Gin Gly Pro Leu Ser Thr Gly Glv .Ser Asp Glu Lys ?185 ' 490 495 Thr Thr Gly Trp Arg Gly Gly His Val Val Glu Glv Leu Ala Glv Glu 500 505 510
[0007] Leu Glu Gin Leu Arg Ala Arg Leu Glu His His Pro Gin Gly Gin Arg 515 520 525 Glu Pro G1y Ser Gly His His His His His His His His 530 535 540 <210> 8 <211> 33 <212> DMA <213:>寡核ff酸 <220> <221> misc feature <223> 人工序列 <400> 8 ccacactgga ctagtatgcg cggcgttggc tgg 33 <210> 9 <211> 37 <212》DNA <213>寡核苷酸 <220> <221> miscfcaturc <223> 人-!:序列 <400> 9 acc.gagctcg gatccttatg aacaacggaa tttcttg 37 <210> 10 <2M> 33 <212> DNA <213>寡核苷酸 <220> <22! > mi ac_featiirp <223>人工序列 <400> 10 aaa1tccgtl gltcactgga agtgcigtlc cag 33 <210> 1? <211> 36 <212> DM <213〉寡核苷酸 <220> <221> iiiisc_feature <223> 人-T:序列 <400> 11 accgagctcg gatccttagt ggtggtggig giggtg 36 <210> 12 <211 :> 4590 <212> DNA <213> 智人(Homo sapiens) <220> <221> CDS <222> (1).. (4590) <400> 12 afg cgc ggc gtt ggc tgg cag at_g ctg t_cc ct,g rcg ctg ggg tta gtg 48 Met Arg GIy Val Glv Trp Gin Met Leu Ser Leu Ser Leu Gly Leu Val 15 10 15 ctg gcg ate ctg aac aag gtg gca ccg cag geg tgc ccg geg cag tgc 96 Leu Ala lie Leu Asn Lys Val Ala Pro Gin Ala Cys Pro Ala Gin Cys
[0008] 20 25 30 tct tgc teg ggc age aca gtg gac tgt cac ggg ctg geg ctg ege age 144 Ser Cvs Ser Gly Ser Thr Val Asp Cvs His Gly Leu Ala Leu Arg Ser 35 40 45 gtg ccc agg aat a.tc ccc ege aac acc gag aga ctg gat tta aat gga. 192 Val Pro Arg Asn lie Pro Arg Asn Thr Glu Arg Leu Asp Leu Asn Glv 50 55 60 ' aat aac ate aca aga att aeg aag aca gat ttt get ggt ett aga cat 240 Asn Asn lie Thr Arg lie Thr Lys Thr Asp Phe Ala Gly Leu Arg His 65 70 75 80 eta aga gtt ett cag ett atg gag aat aag att age acc att gaa aga 288 Leu Arg Val Leu Glri Leu Met Glu Asn Lys lie Ser Thi' lie Glu Arg 85 90 95 gga gca t,tc cag gat ett. aaa gaa eta gag aga ctg cgt tta aac aga 336 Gly Ala Fhe Gin Asp Leu Lys Glu l,eu GLu Arg Leu Arg Leu Asn Arg 100 105 110 aat cac ett cag clg l 丨-丨 eel gag Ug rig It t cti ggg act geg aag 384 Asn His Lei! Gin Phe Pro filu Lem Lon Phe Lei] dy ?Π?τ a Lys 115 120 125 ' eta tac agg ett gat etc agt gaa aac caa att cag gca ate cca agg 432 Leu Tvr Arg Leu Asp Leu Ser Glu Asn Gin lie Gin Aia lie Pro Arg 130 135 140 aaa get ttc cgt ggg gca gtt gac ata aaa aat ttg caa ctg gat tac 480 Lys Ala Phe Arg Glv Ala Val Asp He Lvs Asn Leu Gin Leu Asp Tyr 145 150 155 160 aac cag ate age tgt att gaa gat ggg gca ttc agg get etc egg gac 528 Asn Gin He Ser Cys He Glu Asp Gly Ala Phe Arg Ala Leu Arg Asd 165 170 175 ctg gaa gtg etc a,ct etc aac aat aac aac att act aga ett tct gtg 576 Leu Glu Val Leu Thr Leu Asn Asn Asn Asn lie Thr Arg Leu Ser Val 180 185 190 gca agt ttc aac cat atg eel: aaa ett agg act ttt ega ctg cat tea 624 Ala Ser Phe Asn Ilis Met Pro Lys Leu Arg Thr Phe Arg Leu His Ser 195 200 205 aac aac ctg tat tgt gac tgc cac ctg gee tgg etc tee gac tgg ett 672 Asn Asn Leu Tvr Cys Asp Cvs His Leu Ala Trp Leu Ser Asp Trp Leu 210 215 220 ege caa agg cct egg gtt ggt ctg tac act cag tgt atg ggc ccc tee 720 Arg Gin Arg Pro Arg V-al GIy Leu Tvr Thr Gin Cys Met GIy Pro Ser 225 230 235 240 C.3.C ctg aga ggc cat. aa.f. gta. gee gag gtt. caa a.aa ega gaa ttt gtc 768 His Leu Arg Gly His Asn Val Ala Glu Val Gin Lvs Arg Glu Phe Val 245 250 255 tgc agt ggt cac cag tea ttt atg get cct tct tgt o,gt gtt ttg cac 816 Cys Ser Gly His Gin Ser Phe Met, Ala Pi.u Ser Cys Se_r Val Leu ~ 260 265 ' 270 tgc cct gee gee tgt acc tgt age aac aat ate gta gac tgt cgt ggg 864 Cys Pro Ala Ala Cys Thr Cvs Ser Asn Asn lie Val Asp Cys Arg Gly " 275 . ' 280 285 ' aaa ggi etc ac l gag ate ccc aca aai cU_ cca gag acc ate aca· gaa· 912 Lys Gly Leu Thr Glu lie Pro Thr Asn Leu Pro Glu Thr lie Thr Glu "290 295 300 ata cgt ttg gaa cag aac aca ate aaa gtc ate cct cct gga get ttc 960 lie Arg Leu Glu Gin Asn Thr He Lys Val II? Pro Pro Gly Ala Phe 305 310 315 ' 320 tea cca tat aaa a,ag ett aga ega att gac ctg age aat aat cag ate 1UU8 Ser Pro Tyr Lys Lys Lou Arg Arg lie Asp Leu Ser Asn Asn Gin lie 325 330 335 tct gaa ett geo cca gat get ttc caa gga eta ege tct ctg aat tea 1056 Ser Glu Leu Ala Pro Asp Ala Phe Gin Glv Leu Arg Ser Leu Asn Ser 340 345 350 ett gtc etc- tat gga aat aaa ate aca gaa etc ccc aaa agt tta ttt 1104 Leu Val Leu Tyr Gly Asn Lys lie Thr Glu Leu Pro Lys Ser Leu Phe 355 ' 360 365 _ gaa gga ctg ttt tee tta cag etc. eta tta ttg aat gee aac aag ata 1152 Glu Glv hen Fhe Ser Leu Gin. Leu Leu Leu Leu Asn Ala Asn Lvs lie 370 375 380 ' aac tgc eLt egg gta gal gel Lit cag gat etc cac aac tig aac cl? 1200
[0009] Asn Cvs Leu Arg Vai Asp Ala Phe Gin Asp Leu His Asn Leu Asn Leu 385 390 395 400 etc tcc eta tat. gac aac aag ett cag acc ate gee aag ggg acc ttt 1248 Leu Ser Leu Tyr Asp Asn Lys Leu Gin Thr lie Ala Lys Gly Thr Phe 405 · 410 415 tea cct ett egg gee att caa act atg cat t,tg gee cag aac ccc ttt 1296 Ser Pro Leu Aig Ala lie Gin Thr Met His Leu Ala Gin Asn Pro Phe 420 42B 430 att tgt gac tgc cat etc aag tgg eta geg gat tat etc cat acc aac 1311 He Cvs Asp Cys His Leu Lvs Trp Leu Ala Asp Tyr Leu His Thr Asn 435 ' 440 ' 445 ccg all gag acc agl ggl gee egl igc acc age ccc ege ege clg gca 1392 Pro Tie Gin Thr Ser G'fy Ala. Arg Cys Thr Ser Pro Arg Arg Leu Ala 450 455 * 460 aac ctaa aga att gget cag ate aae. ctge actg aeta ttc cgt tgt tea get 1440 Asn Lys Arg lie Gly Gin lie Lys Ser Lys Lys Phe Arg Cys Ser Ala 465 470 475 480 aaa gaa cag tat ttc att cca ggt aca gaa gat tat ega tea aaa tta 1488 Lys Glu Gin Tyr Phe lie Pro Glv Thr Glu Asp Tyr Arg Sox* Lys Lou 485 490 495 agt gga gac tgc ttt geg gat ctg get tgc cct gaa aag tgt ege tgt 1536 Ser Gly Asp Cys Phe Ala Asp Leu Ala Cys Pro Glu Lys Cys Arg Cys 500 505 510 gaa gga acc aca gta gat tgc tet aat caa aag etc aac aaa ate ccg 1584 Gla Glv Thr Thr Vai Asp Cvs Ser Asn Gin Lys Leu Asn Lvs lie Pio 515 ' 520 525 gag cac att ccc cag tac act gca gag 1:tg cgt etc aat aat aat gaa 1632 Glu Ilis lie Pro Gin Tyr Thr Ala Glu Leu Arg Leu Asn Asn Asn Glu 530 · 535 540 ill acc gig Itg gaa gee aca gga ale ill aag aaa clt eel caa Ha 1680 Phe Thr Vai Leo Glu Ala. Thr G1 v~ Tie Phe Lys Lvs T,eii Pro Gin Leu 545 550 - 555 560 cgt aaa ata aac ttt age aac aat aag ate aca gat att gag gag gga. 1728 Arg Lys lie Asn Phe Ser Asn Asn Lys lie Thr Asp lie Glu Glu Glv 565 570 575 gca. ttt gaa gga gr,a tet. ggt. gt.R. aat gaa ata. ctr. eft. a eg a.gt aat. 1776 Ala Phe Glu Gly Ala Ser Gly Vai Asn Glu lie Leu Leu Thr Ser Asn 580 585 590 cgt ttg gaa aat gtg cag cat aag atg ttc aag gga ttg gaa age etc 1824 Arg Leu Glu Asn Vai Glu His Lys Met Plie Lvs Glv Leu Glu Ser Leu 595 600 ^ 605 aaa act ttg atg ttg aga age aat ega ata acc tgt gtg ggg aat gac 1872 Lys Thr Leu Met Leu Arg Ser Asn Arg lie Thr Cys Vai Gly Asn Asp "610 615 620 ' agt ttc ata gga etc agt tet gtg cgt ett tet ttg tat gat aat 1920 Ser Phe lie Gly Leu Ser Ser Vai Arg Leu Leu Ser Leu Tyr ksp Asn 625 ' 630 635 · 640 caa att act aca gtt gca cca ggg gca ttt gat act etc cat tet tta 1968 Gin lie Thr Thr Vai Ala Pro Glv Ala Phe Asp Thr Leu His Ser Leu 645 650 655 tet act eta aac etc ttg gee aat cct ttt aac tgt aac tgc tac ctg 2016 Ser Thr Leu Asn Leu Leu Ala Asn Pro Phe Asn Cys Asn Cys Tyr Lou 660 665 670 get tgg ttg gga gag tgg ctg aga aag aag aga att gtc aeg gga aat 2064 Ala Trp Leu Gly Glu Trp Leu Ai'g Lvs Lvs Arg lie Vai Thr Gly Asa 675 680 B85 cct aga tgt caa aaa cca tac ttc ctg aaa gaa ata ccc ate cag gat 2112 Pro Arg Cys Glu Lys Pro Tyr Phe Leu Lys Glu lie Pro He Gin Asu 690 69B 700 gtg gee att cag gac ttc act. tgt gat gac gga aat gat gac aat. agt 2160 Vai Ala He Gin Asp Phe Thr Cys Asp Asp Gly Asn Asp Asp Asn Ser 705 710 ' 715 720 Lgc tec cca ell icl ege tgl cct act gaa tgt cici igc 1 ig gal aca 2208 Cys Ser Pro Leu Ser Arg Cys Prn Thr Glu Cys Thr Cys Leu Asp Thr ^ 725 ' 730 ' 735 gtc gtc ega tgt age aac aag ggt ttg aag gtc ttg ccg aaa ggt att 2256 Vai Vai Arg Cys Ser Asn Lys Glv Leu Lvs Vai Leu Pro Lys Glv lie 740 745 750
[0010] cca aga gat gtc aca gag ttg tat ctg gat gga aac caa ttt aca ctg 2304 Pro Arg Asp Val Thi' Glu Leu Tyr Leu Asp Gly Asn Gin Phe Thr Leu 755 760 ' 765 gtt ccc aag gaa etc tcc aac t.ac aaa cat tta aca ctt ata gac tta 2352 Val Pro Lvs Glu Leu Ser Asn Tyr Lys His Leu Thr Leu lie Asp Leu 770 775 780 agt aac aac aga ata age aeg ctt tet aat cag age ttc age aac atg 2400 Ser Asn Asn Arg lie Ser Thr Leu Ser Asn Gin Ser Phe Ser Asn Met 785 790 795 800 acc cag etc etc acc tta att ctt agt tac aac cgt ctg aga tgt att 244-8 Thr Gin Leu Leu Thr Leu lie Leu Ser Tyr Asn Arg Leu Arg Cys lie 805 810 815 cct cct ege acc ttt gat gga tta, aag tet ctt ega tta ctt tet eta 2196 Pro Pro Arg Thr Phe Asp Gly Leu Lvs Ser Leu Arg Leu Leu Ser Leu 820 825 830 cat gga aat gac att tet gtt gtg cct gaa ggt get ttc aat gat ctt 2544 His Gly Asn Asp lie Ser Val ¥al Pro Glu Gly Ala Phe Asn Asp Leu 83E 840 ' 845 tet gca tta tea cat eta gca att gga gcc aac ccc ctt tac tgt gat 2592 Ser Ala Leu Ser His Leu Ala lie Gly Ala Asn Fro Leu Tyr Cys Asd 850 855 ' 860 Lgl aac atg cag tgg tla tcc gac igg gtg aitg leg gaa tat aag gag 2640 Cys Asn Met Gin Trp Leu vSer Asp Trp Yal Lys Ser Gin Tvr Lys Glu 865 870 875 ' ' 880 cct gga att get cgt tgt get ggt cct gga gaa atg gca gat aaa ctt 2688 Pro Glv He Ala Arg Cys Ala Glv Pro Gly Glu Met Ala Asp Lys Leu 885 890 895 tta etc aca act ccc tcc aaa aaa ttt acc tgt caa ggt cct gtg gat 2736 Lou Leu Thr Thr Pro Scr Lys Lys Phe Thr Cys Gin Gly Pro Val Asd 900 905 910 gtc aat att eta get aag tgt aac ccc tgc eta tea aat ccg tgt aaa 2784 Val Asn lie Leu Ala Lys Cys Asn Pro Cys Leu Ser Asn Pro Cys Ljs 915 920 ' 925 ' aat gat ggc aca tgt aat agt gat cca gtt gac ttt tac ega tgc acc 2832 Asn Asp Gly Thr Cys Asn Ser Asp Pro Val Asp Phe Tyr Arg Cys Tiir 930 ' 935 940 ' tgt cca tat ggt ttc aag ggg cag gac tgt gat gtc cca att cat gcc 2880 Ors Pro Tyr Giv Phe Lys Giv GJ_n Asp Cys Asp Vai Pro lie liis Aia 945 950 ' 955 960 tgc ate agt aac cca tgt aaa cat gga gga act tgc cac tta aag gaa, 292S Cys Tie Ser Asn Fro Cys l.vs Hi s (rly Gly Thr Cys His I,eu I.ys Gin ^ 965 ' 970 ' 975 gga gaa gaa gat gga ttc tgg tgt att tgt get gat gga ttt gaa gga 2976 Gly Glu Glu Asp Glv Phe Trp Cys lie Cvs Ala Asp Gly Phe Glu Gly 980 985 990 ga,a aat tgt gaa gtc aac gtt gat gat tgt gaa gat aat gac tgt gaa 3024 Glu Asn Cvs Glu Vai Asn Val Asp Asp Cys Glu Asp Asn Asp Cys Glu 995 1000 1005 aat aat tet aca tgt gtc gat ggc att aat aac tac aca tgc ctt 3069 Asn Asn Ser Thr Cys Val Asd Gly He Asn Asn Tyr Thr Cys Leu 1010 * 1015 ' 1020 ' tgc cca cct gag tat aca ggt gag ttg tgt gag gag aag ctg gac 3114 Cys Pro Pro Glu Tvr Thr Gly Glu Leu Cys Glu Glu Lys Leu Asp 1025 ' 1030 ^ 1035 ttc tgt gcc cag gac ctg aac ccc tgc cag cac gat tea aag tgc 3159 Phe Cys Ala Gin Asp Leu Asn Pro Cys Gin His Asd Ser Lys Cys 1040 1045 " 1050 ' ale cla ac t cca aag gga U,c y,aa tgl gac tgc aca cca ggg lac 3204 lie Leu Thr Pro Lys Gly Phe Lys Cys Asp Cys Thr Pro Glv Tyr 1055 1060 1065 gta ggt gaa cac tgc gac ate gat ttt gac gac tgc caa gac aac 3249 Val Gly Glu His Cys Asp lie Asp Phe Asp Asp C^s Gin Asp Asn 1070 1075 1080 aag tgt aaa aac gga gcc cac tgc aca gat gca gtg aac ggc tat 3294 Lys Cys Lys Asn Gly Ala His Cys Tlxr Asp Ala Val Asn Gly Tyr 1085 1090 1095 aeg tgc ata tgc ccc gaa ggt tac agt ggc ttg ttc tgt gag ttt 3339 Thr Cys lie Cys Pro Glu Gly Tyr Ser Gly Leu Phe Cvs Glu Plie
[0011] 1100 1105 1110 tct cca ccc atg gtc etc cct cgt acc age ccc tgt gat aat ttt 3384 Ser Pro Pro Met Val Leu Pro Arg Thr Ser Pro Cys Asp Asn Phe 1115 1120 1125 gat tgt cag aat gga get cag tgt ate gtc aga ata. aat gag cca. 3429 Asp Cys Gin Asn Glv Ala Gin Cys lie Val Arg lie Asn Glu Pro 1130 1135 1140 ata tgt cag tgt ttg cct ggc tat cag gga gaa aag tgt gaa aaa 3474 lie Cys Gin Cys Leu Pro Gly Tyr Gin Gly Glu Lys Cys Glu Lys 1145 1150 1155 ttg gtt agt gtg aat ttt ata aac aaa gag tct tat eft cag att 3519 Leu Val Ser Val Asn Phe lie Asn Lys Glu Ser Τυγ Leu Gin lie 1160 1165 ' 1170 cct tea gc(、aag gt t egg cct cag aeg aac π丨 h acy d t cag att 3564 Fro Ser Aia Lys Val Arg Fro Gin Tkr Asn He I'hr Leu Gin lie 1175 1180 1185 gee aca gal. gaa gac age gga ale ctc ci-g tal aag ggi gac aaa 3609 Ala Thr Asp Gin A.sp Ser Glv T]e Leu i.eu Tyr I.ys Gly Asp Lys 1190 1195 ' 1200 ' ' gac cat ate geg gtet gaa etc tat egg ggg cgt gtt cgt gee age 3654 Asp His lie Ala Val Glu Leu Tyr Arg G1y Arg Val Arg Ala Ser 1205 1210 1215 tat gac acc ggc tct cat cca get tct gee att tac agt gtg gag 3699 Tyr Asp Thr Gly Ser His Pro Ala Ser Ala lie Tyr Ser Val Glu 1220 1225 1230 aca, ate oat gat gga aac ttc cac att gtg gaa eta ett gee ttg 3744 Thr lie Asn Asp Gly Asn Phe His lie Val Glu Leu Leu Ala Leu 1235 1240 1245 gat cag agt etc tct ttg tee gtg gat ggt ggg aac ccc aaa ate 3789 Asd Gin Ser Leu Ser Leu Ser Val Asp G1y Gly Asn Pro Lys lie 1250 1255 ^ 1260 ate act aac ttg tea aag cag tee act ctg aat ttt gac tct cca 3834 lie Thr Asn Leu Ser Lys Gin Ser Thr Leu Asn Phe Asp Ser Pro 1265 . 1270 1275 etc tat gta gga ggc atg cca ggg aag agt aac gtg gca tct ctg 3879 Leu Tyr Val Gly Giy Met Pro Gly Lrs Ser Asn Yal Ala Ser Leu 1280 1285 1290 ege cag gee cct ggg cag aac gga acc age ttc cac ggc tgc ate 3924 Arg Gin Ala Pro GIy Gin Asn Gly Thr Ser Phe His Glv Cys lie 1295 1300 ' 1305 egg aac r,tt tac ate aac agt gag ctg eng gac ttc cag a.ag gtg 3969 Arg Asn Leu Tyr lie Asn Ser Glu Leu Gin Asp Phe Gin Lys Val 1310 1315 1320 ccg atg caa aca ggc att ttg cct ggc tgt gag cca tgc cac aag 4014 Pro Met Gin Tin- Glv lie Leu Pro Glv Cvs Glu Pro Cys His Lvs 1325 1330 1335 aag gtg tgt gee cat ggc aca tgc cag ccc age age cag gca ggc 1059 Lys Yal Cys Ala His Glv Thr Cys Gin Pro Ser Ser Gin Ala Gly "1340 1345 1350 " lie acc tgc gag Lgc cag gaa gga igg aig ggg ccc cic Igl gac 4104 Phe Thr Cys Glu Cys Gin Glu Gly Trp Met Gly Pro Leu Cys Asp 1355 ' 1360 ' 1365 ^ caa egg acc aat gac cct tgc ett gga aat aaa tgc gta cat ggc 414-9 Gin Arg Thr Asn Asp Pro Cys Leu Glv Asn Lys Cys Val His Gly 1370 1375 1380 acc tgc ttg ccc ate aat geg ttc tee tac age tgt aag tgc ttg 1191 Thr Cys Leu Pro lie Asn Ala Phe Ser Tvr Ser Cys Lys Cys Leu 1385 1390 1395 gag ggc cat gga ggt gtc etc tgt gat gaa gag gag gat ctg ttt 4239 Glu Gly His Gly Gly Val Leu Cys Asp Glu Glu Glu Asp Leu Phe 1400 1405 1410 aac cca tgc cag geg ate aag tgc aag cac ggg aag tgc agg ett 4284 Asn Pro Cys Gin Aia lie Lys Cys Lys His Gly Lys Cys Arg Leu 1415 1420 ' 1425 tea ggt ctg ggg cag ccc tac tgt gaa tgc age agt gga tac aeg 4329 Ser Gly Leu Gly Gin Fro Tvr Cys Giu CVs Ser Ser GIt Tyr Thr 1430 ' 1435 ' 1440 ' ' ggg gac age tgt gal ega, gaa ate tel tgl ega ggg gaa agg ala 4374
[0012] Glv Asp Ser Cys Asp Arg Glu lie Ser Cys Arg Gly Glu Arg lie 1445 1450 1455 aga gat tat tac caa aag cag cag ggc tat get get tgc caa aca 44丄ii Arg Asp Tyr ?γτ Gin Lys Gin Gin Gly Tvr Ala Ala Cys Gin Thr 1460 1465 ' 1470 acc aag aag gtg tcc cgpi tta gag tgc aga ggt ggg tgt gca gga 4?6 ] Thr Lys Lys Val Ser Arg Leu Glu Cys Arg Gly Gly Cys Ala Gly 1475 1480 ' 1485 ^ ggg cag tgc tgt gga ccg ctg agg age aag egg egg aaa tac tet .1509 Gly Gin Cvs Cvs Giy Fro Leu Arg Ser Lys Arg Arg Lvs Tvr Ser 1490 ' * 1495 ' 1500 ' i.lc gaa tgc act gac ggc tec lee li.丨 gig gac: gag git. gag aaa 4554 Phe Glu Cys Thr Asp Glv Ser Ser Phe Val Asp Glu Ve1 G1u Lvs 1505 1510 1515 · gtg gtg aag tgc ggc tgt aeg agg tgt gtg tec taa 4590 Val Yal Lys Cys Giy Cys Thr Arg Cys Val Ser 1520 1525 <210> 13 <211> 1529 <212> PRT <213> 智人(Homo sapiens) <400> 13 Met Arg Gly Val Gly Trp Gin Met Leu Ser Leu Ser Leu Gly Leu Val 15 10 15 Leu Ala lie Leu Asn Lys Val Ala Pro Gin Ala Cys Pro Ala Gin Cys 20 ' 25 ' 30 ^ Ser Cys Ser Gly Ser Thr Val Asp. Cys His Gly Leu Ala Leu Arg Ser 35 ' 40 ' 45 Yal Pro Arg Asn lie Pro Arg Asn Thr Glu Arg Leu Asp Leu Asn Gly 50 55 60 Asn Asn lie Thr Arg lie Thr Lys Thr Asp Phe Ala Gly Leu Arg His 65 70 75 80 !,eu Ars Yal Leu Gin Leu Met Glu Asn Lvs Tie Ser Thr Tie Glu Ars 85 90 95 G丄y Ala Phe Gin Asp Leu Lys Glu Leu Glu Arg Leu Axg Leu Asn Arg 100 ~ 105 110 Asn His Leu Gin Leu Phe Pro Glu Leu Leu Phe Leu Glv Thr Ala Lvs 115 120 125 ~ Leu Tyr Arg Leu Asp Leu Ser Glu Asn Gin lie Gin Ala He Pro Arg 130 135 140 Lys Ala Phe Arg Glv Ala Val Asp lie Lvs Asn Leu Cln Leu Asp Tvr 145 150 155 160 Asn Gin lie Ser Cys lie Glu AvSp Gly Ala Phe Arg Ala Leu Arg Asp 165 170 175 Leu Glu Val Leu Thr Leu Asn Asn Asn Asn lie Thr Arg Leu Ser Val 180 185 190 Ala Ser Phe Asn His Met. Pro Lys Leu Arg Thr Phe Arg Leu His Ser 195 200 205 Asn Asn Lou Tyr Cys Asp Cvs His Leu Ala Trp Leu Ser Asp Trp Lou 210 215 220 Arg Gin Arg Pro Arg Val Gly Leu Tyr Thr Gin Cys Met Glv Pro Ser 225 230 235 240 iiis Leu Ai:g Glv Itis Asn Val Ala Glu Val Gin Lys Arg Glu Fhe Val 245 250 ' 255 Cys Ser Gly His Gin Ser Phe Met Ala Pro Ser Cys Ser Val Leu His " 260 265 ' 270 Cys Pro Ala Ala Cys Thr Cys Ser Asn Asn He Val Asp Cys Arg Gly 275 280 285 Lys Gly Leu Thr Glu lie Pro Thr Asn Leu Pro Glu Thr lie Thr Glu 290 295 300 Tie Arg Leu Glu Gin Asn Thr Tie I.ya Yal Tie Pro Fra Gly Ala Phe 305 310 ^ 315 ^ 320 Ser Pro Tvr Lys Lys Leu Arg Arg lie Asp Leu Ser Asn Asn Gin lie ' ' 325 330 335 Ser Glu Leu Ala Pro Asp Ala Phe Gin Gly Leu Arg Ser Leu Asn Ser
[0013] 340 34δ 350 Leu Val Leu Tvr GIy Asn Lvs lie Thr Glu Leu Pro Lys Ser Leu Phe 355 ' 360 365 Glu Glv Leu Phe Ser Leu Gin Leu Leu Leu Leu Asn Ala Asn Lys lie 370 375 380 Asn Cys Leu Arg Val Asp Ala Phc Gin Asp Lou His Asn Lou Asn Leu 385 390 395 400 Leu Ser Leu Tvr Asp Asn Lys Leu Gin Thr lie Ala Lvs Gly Thr Phe 405 410 · 415 Ser Pro Leu Arg Ala lie Gin Thr Met Ills Leu Ala Gin Asn Pro Phe 420 425 430 lie Cys Asp Cys His Lea Lvs Tip Leu Ala ksp Tyr Lea His Thr Asn ' 435 ^ 440 445 Pro He Glu Thr Ser Glv Ala ArR Cys Thr Ser Pro Arg Ars Leu Ala 450 455 4t>0 Asn Lys Arg lie GIy Gin lie Lys Ser Lys Lys Phe Arg Cys Ser Ala 465 470 475 480 Lys Gin Gin Tvr Phe He Pro Gly Thr G]u Asp Tyr Arg Ser I.ys i.mi ' ' 485 ' 490 ' 495 Ser Gly Asp Cys Phe Ala Asp Leu Ala Cys Pro Glu Lys Cvs Arg Cys " 500 505 ' 510 ^ Glu Gly Thr Thr Val Asp Cys Ser Asn GIji Lys Leu Asn Lys He Pro 515 520 525 Glu His He Pro Gin Tyr Thr Ala Glu Leu Arg Leu Asn Asn Asn Glu 530 535 540 Phe Thr Val Leu Glu Ala Thr Gly He Phe Lys Lvs Leu Pro Gin Leu 545 550 555 560 Arg Lys lie Asn Phe Ser Asn Asn Lys lie Thr Asp lie Glu Glu Gly ' 565 ' 570 575 ' Ala Phe Glu Glv Ala Ser Gly Val Asn Glu lie Leu Leu Thr Ser Asn 580 ' 585 590 Atr Leu Glu Asn Val Gin His Lys Met Phe Lys Gly Leu Glu Ser Leu 595 600 605 Lys Thr Leu Met Leu Arg Scr Asn Arg lie Thr Cys Val Glv Asn Asp 610 615 620 Ser Phe lie Gly Leu Ser Ser Val Arg Leu Leu Ser Leu Tyr Asp Asn 625 630 635 640 Gin lie Thr Thr Val Ala Pro Gly Ala Phe Asp Thr Leu His Ser Leu 645 ' 650 655 Ser Thr Leu Asn Leu Leu Ala Asn Pro Phe Asn Cvs Asn Cys TVr Leu ββ? 665 * 670 Ala Trp Leu GIy Glu Trp Leu Arg Lys Lys Arg lie Val Thr Gly Asn 675 ' 680 685 Pro Arg Cys Gin Lys Pro Tvr Phe Leu Lys Glu lie Pro lie Gin Asp 690 695 700 Val Ala Tie Gin Asp Phe Thr Cys Asp Asp Glv Asn Asp Asp Asn Ser 705 710 ~ 715 720 Cys Ser Pro Leu Ser Arg Cys Pio Thr Glu Cys Thr Cys Leu Asp Thr ' 725 ' 730 · 735 Val Val Arg Cvs Ser Asti Lvs Gly Leu Lys Val Leu Pro Lvs Gly lie 740 " 745 750 ' Pro Arg Asp Val Thr Glu Leu Tyr Leu Asp Gly Asn Gin Phe Thr Leu 755 760 765 Val Pro Lys Glu Leu Ser Asn Tvr Lys His Leu Thr Leu lie Asp Leu 770 775 780 Ser Asn Asn Arg He Ser Thr Leu Ser Asn Gin Ser Phe Ser Asn Met 785 790 795 800 Thr Gin Leu Leu Thr Leu lie Leu Ser Tyr Asn Arg Leu Arg (Vs 丁]p 805 810 815 Pro Pro Arg Thr Phe Asp Glv Lou Lvs Ser Leu Arg Leu Lou Sor Leu 820 825 830 His Glv Asn Asp lie Scr Vol \%1 Pro Glu Gly Ma Phc Asn Asp Lou 835 840 845 Ser Ala Leu Ser His Leu Ala lie Glv Ala Asn Pro Leu Tvr Cys Asp 850 855 860 Cys Asn Met Gin Trp Leu Ser Asp Trp Val Lys Ser Giu Tyr Lys Giu 865 870 875 ^ 880 Pro Gly lie Ala Arg Cys Ala Gly Pro Gly Glu Met Ala Asp Lys Leu
[0014] 885 890 895 Leu Leu Thr Thr Pro Ser Lys Lys Phe Thr Os Gin Gly Pro Val Asp 900 905 ' 910 ¥al Asn lie Leu Ala Lys Cys Asn Pro Cvs Leu Ser Asn Pro Cys Lvs 915 920 925 Asn Asp G1y Thr Cvs Asn Ser Asp Pro Val Asp Phc Tyr Arg Cys Thr 930 ' 935 940 Cys Pro Tvr Gly Phe Lvs Glv Gin Asp Cvs Asp Val Pro lie His Ala 945 950 955 960 Cys lie Ser Asn Pro Cys Lys Iiis Gly Glv Thr Cvs His Leu Lys Glu 965 970 ' 975 Gly Glu Glu Asp Gly Phe Trp Cys lie Cys Ala Asp Gly Phe Glu Gly ^ 080 ^ 985 990 - Glu Asn Cys Glu Val Asn Val Asp Asp Cvs Glu Asp Asn Asp Cys Glu 995 1000 1005 Asn Asn Ser Thr Cys Val Asp Gly lie Asn Asn Tvr Thr Cys Leu 3010 ' 1015 1020 Cy.s Pro Pro Gin Tyr Thr Gly Gin i.eu Cys Gin Glu i,y,s i.au Asp ' 1025 ' 1030 ' 1035 Fhe Cvs Ala Gin Asd Leu Asn Pro Cys Gin His Asp Ser Lys Cys 1040 * 1045 1050 ' He Leu Thr Pro Lys Glv Phe Lvs Cys Asp Cys Tin· Pro Gly Tyr 1055 1060 1065 Val Gly Glu His Cys Asp lie Asp Phe Asp Asp Cvs Gin Asp Asn 1070 1075 1080 Lys Cys Lys Asn Gly Ala His Cys Thr Asp Ala Val Asn Gly Tyr 1085 1090 1095 Thr Cvs lie Cys Pro Glu Gly Tyr Ser Gly Leu Phe Cvs Glu Phe 1100 ' 1105 1110 Ser Pro Pro Met Val Leu Pro Arg Thr Ser Pro Cys Asp Asn Phe 1115 1120 1125 Asp Cys Gin Asn Gly Ala Gin Cys lie Val Arg lie Asn Glu Pro 1130 1135 1140 lie Cys Gin Cys Leu Pro Gly Tyr Gin Gly Glu Lys Cts Glu Lys 1145 1150 1155 Leu Val Ser Val Asn Phe lie Asn Lys Glu Ser Tyr Leu Gin lie 1160 1165 1170 Pro Ser Ala Lys Val Arg Pro Gin Thr Asn lie Thr Leu Gin lie 1175 ' 1180 1185 Ala Thr Asp Glu Asd Ser Gly lie Leu Leu Tyr Lvs Glv Asp Lys I 190 * I 195 · 1200 · · Asp His lie Ala ¥al Glu Leu Tyr Arg Glv Arg Val Arg Ala Ser 1205 1210 1215 Tyr Asp Thr Gly Ser His Pro Ala Ser Ala lie Tyr Ser Val Glu 1220 1225 1230 Thr Tie Asn Asp Gly Asn Phe His Tie Val Gin Leu Leu Ala Leu 1235 1240 1245 Asp Gin Ser Leu Ser Leu Ser Val Asp Glv Glv Asn Pro Lys lie 1250 1255 * 1260 ^ lie Thr Asn Leu Ser Lys Glo Ser Thr Leu Asn Phe Asp Ser Pro 1265 ' 1270 1275 Leu Tyr Val Gly Gly Met Pro Gly Lys Ser Asn Val Ala Ser Leu 1280 ' 1285 1290 Arg Gin Ala Pro Glv Gin Asn Gly Thr Ser Phe His Gly Cys lie 1295 1300 1305 Arg Asn Leu Tyr lie Asn Ser Glu Leu Gin Asp Phe Gin Lys Val 1310 [ 1315 1320 Pro Met Gin Thr Gly lie Leu Pro Glv Cys Glu Pro Cys His Lvs 1325 1330 ' ' 1335 ' Lys Val Cys Ala His Gly Thr Cvs Gin Pro Ser Ser Gin Ala Gly 1340 1345 1350 Plic Thr Cys Glu Cvs Gin Glu Glv Trp Met Glv Pro Lou Cys Asp 1355 1360 1365 Gin Arg Thr Asn Asp Pro Cvs Leu Gly Asn Lys Cvs Val His Gly 1370 1375 1380 Thr Cys Leu Pro lie Asn Aia Phe Ser Tyr Ser Cys Lys Cys Leu 1385 1390 1395 Glu Gly His Gly Gly Val Leu Cys Asp Glu Glu Glu Asp Leu Phe
[0015] 1400 1405 1410 Asn Pro Cys Gin Ala lie Lvs Cvs Lys His Gly Lys Cys Arg Leu 1415 1420 1425 Ser Gly Leu Glv Gin Pro Tvr Cvs Glu Cys Ser Ser Gly Tyr Thr 1430 1435 1440 Gly Asp Ser Cys Asp Arg Glu lie Ser Cys Arg G1y Glu Arg lie 1445 1450 1455 Arg Asp Tyr Tyr Gin Lys Gin Gin Gly Tyr Ala Ala Cvs Gin Thr 1460 1465 1470 Thr Lys Lys Val Ser Arg Leu Glu Cys Arg Gly Gly Cys Ala Gly 1475 1480 1485 Gly Gin Cys Cys G1y Pro Leu Arg Ser Lys Arg Arg Lys Tyr Ser 1490 1495 1500 Phe Glu Cys Thr Asp Gly Ser Ser Phe Val Asp Glu Yal Glu Lys 1505 1510 1515 Val Yal Lys Cys G1y Cys Thr Arg Cys Val Ser 1520 1525 <210> 14 <211> 90 <212> DNA <213> 智人(Homo sapiens) <220> <221> CDS <222> (1).. (90) <400> 14 atg cgc ggc gtt ggc tgg cag atg ctg tcc ctg teg ctg ggg tta gtg 48 Met Arg Gly Val Gly Trp Gin Met Leu Ser Leu Ser Leu Gly Leu Val 15 10 15 ctg geg ate ctg aac aag gtg gca ccg cag geg tgc ccg geg 90 Leu Ala lie Leu Asn Lys Val Ala Pro Gin Ala Cys Pro Ala 20 25 30 <210> 15 <211> 30 <212> PRT <213〉智人(Homo sapiens) <400> 15 Met Arg Gly Val Gly Trp Gin Met Leu Ser Leu Ser Leu Gly Leu Val 1 5 10 15 Leu Ala lie Leu Asn Lys Val Ala Pro Gin Ala Cys Pro Ala 20 25 30
【權(quán)利要求】
1. 一種融合蛋白,其特征在于,所述的融合蛋白自N端至C端具有式la或lb所述的結(jié) 構(gòu): A-X-E-Y1-Y2 式 la ; A-Y2-Υ1-Ε-X 式 lb ; 其中, A為任選的分泌信號肽; X為Slit2蛋白的富含亮氨酸的重復(fù)序列1-2 (leucine-rich repeatl-2, LRR1-2)元 件; E為酶切位點; Y1為第一標(biāo)簽多肽元件; Y2為第二標(biāo)簽短肽元件,所述第二標(biāo)簽短肽元件為His標(biāo)簽元件; "一"表示連接上述元件的肽鍵或肽接頭。
2. 如權(quán)利要求1所述的融合蛋白,其特征在于,所述的Y1包括SEQ ID NO. : 2所示的改 良型親和素標(biāo)簽(Strap II標(biāo)簽)、鏈親和素(Strepavidin)標(biāo)簽。
3. 如權(quán)利要求1所述的融合蛋白,其特征在于,所述的Y1為Strap II標(biāo)簽,而Y2為 8XHis標(biāo)簽元件。
4. 如權(quán)利要求1所述的融合蛋白,其特征在于,所述的S1U2LRR1-2的氨基酸序列如 SEQ ID NO. :5 所示。
5. -種分離的多核苷酸,其特征在于,所述的多核苷酸編碼權(quán)利要求1所述的融合蛋 白。
6. -種表達載體,其特征在于,所述的表達載體含有權(quán)利要求5所述的多核苷酸。
7. -種宿主細胞,其特征在于,所述的宿主細胞含有權(quán)利要求6所述的表達載體或轉(zhuǎn) 染了權(quán)利要求5所述的多核苷酸。
8. 如權(quán)利要求7所述的宿主細胞,其特征在于,所述的宿主細胞包括哺乳動物細胞;較 佳地包括CH0細胞、293細胞。
9. 一種制備S1U2LRR1-2蛋白的方法,其特征在于,所述的方法包括步驟: (i) 在合適的表達條件下,培養(yǎng)如權(quán)利要求8所述的宿主細胞,從而表達權(quán)利要求1所 述的融合蛋白; (ii) 從培養(yǎng)體系中分離純化出權(quán)利要求1所述的融合蛋白; (iii) 對所述的融合蛋白,用針對元件E的蛋白酶進行酶解,從而制得S1U2LRR1-2。
10. -種制備S1U2LRR1-2蛋白的方法,其特征在于,所述的方法包括步驟: 對權(quán)利要求1所述的融合蛋白,用針對元件E的蛋白酶進行酶解,從而制得 Slit2LRRl-2。
11. 一種純化的S1U2LRR1-2蛋白,其特征在于,是通過權(quán)利要求9或10所述的方法生 產(chǎn)制備的。
【文檔編號】C12P21/02GK104119445SQ201310150884
【公開日】2014年10月29日 申請日期:2013年4月26日 優(yōu)先權(quán)日:2013年4月26日
【發(fā)明者】李華順 申請人:李華順