專利名稱:生產(chǎn)膠原的植物及其生成和使用方法
技術(shù)領(lǐng)域:
和背景本發(fā)明涉及生產(chǎn)膠原的植物及其生成和使用方法。更具體而言,本發(fā)明涉及用于生成能夠生產(chǎn)高水平羥基化膠原鏈的植物的新方法,所述膠原鏈能夠形成天然的三股螺旋I型膠原纖維。
膠原是負(fù)責(zé)脊椎動(dòng)物和許多其他多細(xì)胞生物的結(jié)構(gòu)完整性的主要結(jié)構(gòu)蛋白。I型膠原代表原型的纖維膠原,并且是大多數(shù)組織中的主要膠原類型。
I型膠原是骨和腱中占優(yōu)勢(shì)的膠原組分,并且大量發(fā)現(xiàn)于皮膚、主動(dòng)脈和肺中。I型膠原纖維提供極大的抗張強(qiáng)度和有限的伸長(zhǎng)性。I型膠原的最豐富的分子形式是由2種不同的α鏈[α1(I)]2和α2(I)組成的異源三聚體(Inkinen,2003)。所有纖維膠原分子都包含由重復(fù)的Gly-X-Y三聯(lián)體構(gòu)建的3種多肽鏈,其中X和Y可以是任何氨基酸,但通常是亞氨基酸脯氨酸和羥脯氨酸。
形成原纖維的膠原作為包含球狀N-和C-末端延伸前肽的前體前膠原而合成。前膠原的生物合成是牽涉多種不同的翻譯后修飾的復(fù)雜過程,所述翻譯后修飾包括脯氨酸和賴氨酸羥基化、N-連接的和O-連接的糖基化以及鏈內(nèi)和鏈間二硫鍵的形成。執(zhí)行這些修飾的酶以協(xié)同的方式起作用以確保正確排列和熱穩(wěn)定的三股螺旋分子的折疊和裝配。
每種前膠原分子由3種多肽鏈組成成分在粗面內(nèi)質(zhì)網(wǎng)內(nèi)裝配。因?yàn)槎嚯逆湽卜g地穿過內(nèi)質(zhì)網(wǎng)膜移位(translocate),所以脯氨酸和賴氨酸殘基的羥基化發(fā)生在Gly-X-Y重復(fù)區(qū)域內(nèi)。一旦多肽鏈完全移位到內(nèi)質(zhì)網(wǎng)腔內(nèi),C-前肽就折疊。3種前-α鏈隨后經(jīng)由其C-前肽結(jié)合以形成三聚體分子,從而允許Gly-X-Y重復(fù)區(qū)域在其C-末端形成成核點(diǎn),確保鏈的正確排列。Gly-X-Y區(qū)域隨后在C-至-N方向折疊以形成三股螺旋。
多肽鏈修飾和三股螺旋形成之間的時(shí)間關(guān)系是關(guān)鍵的,因?yàn)楦彼釟埢牧u基化是確保三股螺旋在體溫下的穩(wěn)定性必需的,一旦形成,三股螺旋就不再充當(dāng)羥基化酶的底物。C-前肽(以及較少程度上的N-前肽)在前膠原通過細(xì)胞的過程中保持前膠原可溶(Bulleid等人,2000)。在前膠原分子分泌進(jìn)入細(xì)胞外基質(zhì)后或在這個(gè)過程中,通過前膠原N-和C-蛋白酶去除前肽,從而觸發(fā)膠原分子自發(fā)地自身裝配為原纖維(Hulmes,2002)。通過前膠原N-和C-蛋白酶去除前肽使前膠原的溶解性降低了>10000倍,并且是發(fā)動(dòng)膠原自身裝配成纖維所必需和充分的。對(duì)這個(gè)裝配過程關(guān)鍵的是在三股螺旋結(jié)構(gòu)域末端被稱為端肽的短的非三股螺旋肽,它確保原纖維結(jié)構(gòu)內(nèi)的膠原分子的正確記錄,并降低自身裝配的臨界濃度(Bulleid等人,2000)。在自然中,膠原的三股螺旋結(jié)構(gòu)的穩(wěn)定性需要由脯氨酰-4-羥化酶(P4H)對(duì)脯氨酸的羥基化,以在膠原鏈內(nèi)形成羥脯氨酸殘基。
表達(dá)膠原鏈的植物是本領(lǐng)域已知的,參見例如,美國(guó)專利號(hào)6,617,431和(Merle等人,2002,Ruggiero等人,2000)。盡管植物能夠合成包含羥脯氨酸的蛋白質(zhì),但與哺乳動(dòng)物P4H相比,負(fù)責(zé)在植物細(xì)胞中合成羥脯氨酸的脯氨酰羥化酶顯示出相對(duì)寬松的底物序列特異性,并因此只在Gly-X-Y三聯(lián)體的Y位置包含羥脯氨酸的膠原生產(chǎn)需要植物共表達(dá)膠原和P4H基因(Olsen等人,2003)。
生產(chǎn)依賴于植物中天然存在的羥基化機(jī)制的人膠原的嘗試得到了在脯氨酸羥基化方面弱的膠原(Merle等人,2002)。這種膠原在低于30℃的溫度下熔解或失去其三股螺旋結(jié)構(gòu)。膠原和脯氨酰-羥化酶的共表達(dá)產(chǎn)生穩(wěn)定羥基化的膠原,它在生物學(xué)上與體溫時(shí)的應(yīng)用相關(guān)(Merle等人,2002)。
賴氨酰羥化酶(LH,EC 1.14.11.4)、半乳糖基轉(zhuǎn)移酶(EC2.4.1.50)和葡糖基轉(zhuǎn)移酶(EC 2.4.1.66)是在膠原翻譯后修飾中牽涉的酶。它們序貫地將特定位置中的賴氨酰殘基修飾為羥賴氨酰、半乳糖基羥賴氨酰和葡糖基半乳糖基羥賴氨酰殘基。這些結(jié)構(gòu)是膠原特有的并且是其功能活性必需的(Wang等人,2002)。單獨(dú)的人的酶,賴氨酰羥化酶3(LH3)可以催化羥賴氨酸連接的碳水化合物形成中的所有3個(gè)連續(xù)步驟(Wang等人,2002)。
煙草中表達(dá)的人膠原的羥賴氨酸形成少于2%的在牛膠原中發(fā)現(xiàn)的羥賴氨酸(0.04%殘基/1.88%殘基)。這提示植物內(nèi)源性的賴氨酰羥化酶不能充分地使膠原中的賴氨酸羥基化。
在將本發(fā)明變?yōu)閷?shí)踐的同時(shí),本發(fā)明人揭示了膠原鏈的有效羥基化依賴于膠原鏈連同能夠正確修飾這種多肽的酶的隔離。
發(fā)明概述根據(jù)本發(fā)明的一個(gè)方面,提供了在植物或被分離的植物細(xì)胞中生產(chǎn)膠原的方法,其包括在植物或被分離的植物細(xì)胞中,以能夠使至少一種類型的膠原α鏈和外源性P4H積聚在缺乏內(nèi)源性P4H活性的亞細(xì)胞區(qū)室中的方式,表達(dá)至少一種類型的膠原α鏈和外源性P4H,從而在植物中生產(chǎn)膠原。
根據(jù)本發(fā)明的一個(gè)另外的方面,提供了根據(jù)下文描述的本發(fā)明的優(yōu)選實(shí)施方案中進(jìn)一步的特征,該方法進(jìn)一步包括在缺乏內(nèi)源性P4H活性的亞細(xì)胞區(qū)室中表達(dá)外源性LH3。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,至少一種類型的膠原α鏈包括用于靶向質(zhì)外體或液泡的信號(hào)肽。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,至少一種類型的膠原α鏈缺乏ER靶向序列或保留序列。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,至少一種類型的膠原α鏈表達(dá)于包含DNA的植物細(xì)胞器中。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,外源性P4H包括用于靶向質(zhì)外體或液泡的信號(hào)肽。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,外源性P4H缺乏ER靶向序列或保留序列。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,外源性P4H表達(dá)于包含DNA的植物細(xì)胞器中。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,至少一種類型的膠原α鏈?zhǔn)铅?鏈。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,至少一種類型的膠原α鏈?zhǔn)铅?鏈。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,至少一種類型的膠原α鏈包括C-末端和/或N-末端前肽。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,植物選自煙草、玉米、苜蓿、稻、馬鈴薯、大豆、番茄、小麥、大麥、低芥酸菜子(Canola)和棉花。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,至少一種類型的膠原α鏈或外源性P4H只在植物的部分中表達(dá)。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,植物的部分是葉、種子、根、塊莖或莖。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,外源性P4H能夠使至少一種類型的膠原α鏈的Gly-X-Y三聯(lián)體的Y位置特異性羥基化。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,外源性P4H是人P4H。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,對(duì)植物實(shí)施應(yīng)激條件。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,應(yīng)激條件選自干旱、鹽度、損傷、寒冷和噴射應(yīng)激誘導(dǎo)化合物。
根據(jù)本發(fā)明的另一方面,提供了基因修飾植物或被分離的植物細(xì)胞,其能夠積聚具有羥基化模式的膠原α鏈,所述羥基化模式與當(dāng)膠原α鏈表達(dá)于人細(xì)胞中時(shí)產(chǎn)生的模式相同。
根據(jù)本發(fā)明的再一方面,提供了基因修飾植物或被分離的植物細(xì)胞,其能夠在缺乏內(nèi)源性P4H活性的亞細(xì)胞區(qū)室中積聚膠原α鏈。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,基因修飾植物進(jìn)一步包括外源性P4H。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,至少一種類型的膠原α鏈包括用于靶向質(zhì)外體或液泡的信號(hào)肽。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,至少一種類型的膠原α鏈缺乏ER靶向序列或保留序列。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,至少一種類型的膠原α鏈表達(dá)于包含DNA的植物細(xì)胞器中。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,外源性P4H包括用于靶向質(zhì)外體或液泡的信號(hào)肽。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,外源性P4H缺乏ER靶向序列或保留序列。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,外源性P4H表達(dá)于包含DNA的植物細(xì)胞器中。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,膠原α鏈?zhǔn)铅?鏈。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,膠原α鏈?zhǔn)铅?鏈。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,膠原α鏈包括C-末端和/或N-末端前肽。
根據(jù)本發(fā)明的再一方面,提供了植物系統(tǒng),其包括能夠積聚膠原α1鏈的第一種基因修飾植物,和能夠積聚膠原α2鏈的第二種基因修飾植物。
根據(jù)本發(fā)明的再一方面,提供了植物系統(tǒng),其包括能夠積聚膠原α1鏈和膠原α2鏈的第一種基因修飾植物,以及能夠積聚P4H的第二種基因修飾植物。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,第一種基因修飾植物和第二種基因修飾植物中的至少一種進(jìn)一步包括外源性P4H。
根據(jù)本發(fā)明的再一方面,提供了生產(chǎn)纖維膠原的方法,其包括(a)在第一種植物中表達(dá)膠原α1鏈;(b)在第二種植物中表達(dá)膠原α2鏈;其中在第一種植物和第二種植物中的表達(dá)被這樣設(shè)置,從而使得膠原α1鏈和膠原α2鏈各自能夠在缺乏內(nèi)源性P4H活性的亞細(xì)胞區(qū)室中積聚;和(c)使第一種植物與第二種植物雜交,并選擇表達(dá)膠原α1鏈和膠原α2鏈的后代,從而生產(chǎn)纖維膠原。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,該方法進(jìn)一步包括在第一種植物和第二種植物的每一種中表達(dá)外源性P4H。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,膠原α1鏈和膠原α2鏈中的每一種包括用于靶向質(zhì)外體或液泡的信號(hào)肽。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,膠原α1鏈和膠原α2鏈中的每一種缺乏ER靶向序列或保留序列。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,步驟(a)和(b)經(jīng)由在包含DNA的植物細(xì)胞器中的表達(dá)來實(shí)現(xiàn)。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,外源性P4H包括用于靶向質(zhì)外體或液泡的信號(hào)肽。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,外源性P4H缺乏ER靶向序列或保留序列。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,外源性P4H表達(dá)于包含DNA的植物細(xì)胞器中。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,膠原α1鏈和膠原α2鏈中的每一種包括C-末端和/或N-末端前肽。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,外源性P4H能夠使至少一種類型的膠原α鏈的Gly-X-Y三聯(lián)體的Y位置特異性羥基化。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,外源性P4H是人P4H。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,對(duì)第一種植物和第二種植物實(shí)施應(yīng)激條件。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,應(yīng)激條件選自干旱、鹽度、損傷、重金屬毒性和寒冷應(yīng)激。
根據(jù)本發(fā)明的再一方面,提供了生產(chǎn)纖維膠原的方法,其包括(a)在第一種植物中表達(dá)膠原α1鏈和膠原α2鏈,其中在第一種植物中的表達(dá)被這樣設(shè)置,從而使得膠原α1鏈和膠原α2鏈各自能夠在缺乏內(nèi)源性P4H活性的亞細(xì)胞區(qū)室中積聚;(b)在第二種植物中表達(dá)外源性P4H,其能夠在缺乏內(nèi)源性P4H活性的亞細(xì)胞區(qū)室中積聚;和(c)使第一種植物與第二種植物雜交,并選擇表達(dá)膠原α1鏈、膠原α2鏈和P4H的后代,從而生產(chǎn)纖維膠原。
根據(jù)本發(fā)明的再一方面,提供了核酸構(gòu)建體,其包括置于在植物細(xì)胞中起作用的啟動(dòng)子的轉(zhuǎn)錄控制下、編碼人P4H的多核苷酸。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,啟動(dòng)子選自CaMV 35S啟動(dòng)子、遍在蛋白啟動(dòng)子、rbcS啟動(dòng)子和SVBV啟動(dòng)子。
根據(jù)本發(fā)明的再一方面,提供了基因修飾植物或被分離的植物細(xì)胞,其能夠表達(dá)膠原α1鏈、膠原α2鏈、P4H、LH3和蛋白酶C和/或蛋白酶N。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,膠原α1鏈和膠原α2鏈各自能夠在缺乏內(nèi)源性植物P4H活性的亞細(xì)胞區(qū)室中積聚。
根據(jù)本發(fā)明的再一方面,提供了基因修飾植物或被分離的植物細(xì)胞,其能夠積聚具有溫度穩(wěn)定性特征的膠原,所述溫度穩(wěn)定性特征與哺乳動(dòng)物膠原的特征相同。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,膠原是I型膠原。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,哺乳動(dòng)物膠原是人膠原。
根據(jù)本發(fā)明的再一方面,提供了對(duì)于在植物中的表達(dá)進(jìn)行最優(yōu)化的膠原編碼序列。
根據(jù)所述優(yōu)選實(shí)施方案中再進(jìn)一步的特征,膠原編碼序列為由SEQ ID NO1所闡明的。
本發(fā)明通過提供能夠表達(dá)正確羥基化的膠原鏈成功地解決了目前已知構(gòu)造的缺點(diǎn),所述膠原鏈能夠裝配為具有與人膠原類似特性的膠原。
除非另外定義,本文所使用的所有技術(shù)和科學(xué)術(shù)語具有與本發(fā)明所屬領(lǐng)域普通技術(shù)人員通常理解相同的含義。盡管與本文所述那些相似或等同的方法和材料可以用于本發(fā)明的實(shí)踐或測(cè)試中,但下文還是描述了適當(dāng)?shù)姆椒ê筒牧?。在沖突的情況下,以本專利說明書包括定義為準(zhǔn)。此外,材料、方法和實(shí)施例僅是舉例說明的,并不預(yù)期是限制性的。
附圖簡(jiǎn)述本發(fā)明在此處僅通過例子參考附圖進(jìn)行描述?,F(xiàn)在特別詳細(xì)地參考附圖,要強(qiáng)調(diào)的是所顯示的細(xì)節(jié)通過例子來進(jìn)行并且僅用于本發(fā)明優(yōu)選實(shí)施方案的舉例說明性討論的目的,并且為了提供被認(rèn)為是本發(fā)明的原理和概念方面最有用和易于理解的描述而呈現(xiàn)。在這點(diǎn)上,不試圖顯示比基本理解本發(fā)明所需細(xì)節(jié)更多的本發(fā)明的結(jié)構(gòu)細(xì)節(jié),附圖采用的描述使得本發(fā)明的幾種形式如何能夠在實(shí)踐中體現(xiàn)對(duì)于本領(lǐng)域技術(shù)人員是顯而易見的。
在附圖中
圖1a-d舉例說明了用于轉(zhuǎn)化測(cè)試植物的各種表達(dá)盒和載體的構(gòu)建。作為本研究的部分合成的所有編碼序列對(duì)于煙草中的表達(dá)是最優(yōu)化的。
圖2舉例說明了各種共轉(zhuǎn)化方法。每種表達(dá)盒由編碼序列的短名表示。編碼序列在表1中詳細(xì)說明。每個(gè)共轉(zhuǎn)化通過2個(gè)pBINPLUS二元載體來進(jìn)行。每個(gè)長(zhǎng)方形表示攜帶1、2或3個(gè)表達(dá)盒的單個(gè)pBINPLUS載體。啟動(dòng)子和終止子在實(shí)施例1中詳細(xì)說明。
圖3是轉(zhuǎn)化體的多重PCR篩選,顯示出對(duì)于膠原α1鏈(324bp片段)或膠原α2鏈(537bp片段)或二者陽(yáng)性的植物。
圖4是由共轉(zhuǎn)化2、3和4產(chǎn)生的轉(zhuǎn)基因植物的蛋白質(zhì)印跡分析。從煙草共轉(zhuǎn)化體#2、#3和#4中提取總可溶性蛋白,并用抗-膠原I抗體(來自Chemicon Inc.的#AB745)進(jìn)行檢測(cè)。大小標(biāo)記是來自Fermentas Inc.的#SM0671。W.T.是野生型煙草。陽(yáng)性膠原條帶在對(duì)于I型膠原α1或α2或二者為PCR陽(yáng)性的植物中可見。來自人胎盤的500ng I型膠原(來自Chemicon Inc.的#CC050,通過胃蛋白酶消化從人胎盤中提取)的陽(yáng)性對(duì)照條帶代表來自轉(zhuǎn)基因植物的樣品中的約0.3%總可溶性蛋白(約150μg)。如通過I型膠原抗體的抗羧基末端前肽(來自Chemicon Inc.的#MAB1913)所檢測(cè)的,在人膠原樣品中約140kDa的較大條帶是含有其C-前肽的前膠原。在人膠原樣品中約120kDa的較小條帶是不含前肽的膠原。由于其罕見的組成,富含脯氨酸的蛋白質(zhì)(包括膠原)作為具有高于預(yù)期的分子量的條帶在聚丙烯酰胺凝膠上一致遷移。因此,分子量約95kDa、不含前肽的膠原鏈作為約120kDa的條帶遷移。
圖5是由共轉(zhuǎn)化#8(攜帶與膠原鏈翻譯地融合的質(zhì)外體(appoplast)信號(hào))產(chǎn)生的轉(zhuǎn)基因植物的蛋白質(zhì)印跡分析。從轉(zhuǎn)基因煙草葉中提取總可溶性蛋白,并用抗-膠原I抗體(來自Chemicon Inc.的#AB745)進(jìn)行檢測(cè)。陽(yáng)性膠原α2條帶在植物8-141中可見。來自人胎盤的I型膠原(來自Chemicon Inc.的#CC050)充當(dāng)對(duì)照。
圖6a-b舉例說明根據(jù)熱處理和胰蛋白酶或胃蛋白酶消化證實(shí)的膠原三股螺旋裝配和熱穩(wěn)定性,在圖6a中-對(duì)來自煙草2-9(只表達(dá)膠原α1且不表達(dá)P4H)和3-5(表達(dá)膠原α1+2以及人P4Hα和β亞基)的總可溶性蛋白實(shí)施熱處理(38℃或43℃15分鐘),隨后為胰蛋白酶消化(室溫20分鐘),并用抗-膠原I抗體在蛋白質(zhì)印跡方法中進(jìn)行檢測(cè)。陽(yáng)性對(duì)照是500ng人膠原I樣品+野生型煙草的總可溶性蛋白。在圖6b中-從轉(zhuǎn)基因煙草13-6(表達(dá)膠原Iα1和α2鏈-由箭標(biāo)指出,人P4Hα和β亞基以及人LH3)提取總可溶性蛋白,并實(shí)施熱處理(33℃、38℃或42℃20分鐘),立即在冰上冷卻以防止三股螺旋重新裝配,并于室溫(約22℃)與胃蛋白酶一起溫育30分鐘,隨后在標(biāo)準(zhǔn)蛋白質(zhì)印跡方法中用抗-膠原I抗體(來自Chemicon Inc.的#AB745)進(jìn)行檢測(cè)。陽(yáng)性對(duì)照是~50ng人膠原I樣品(來自Chemicon Inc.的#CC050,通過胃蛋白酶消化從人胎盤中提取),將其加到從野生型煙草中提取的總可溶性蛋白中。
圖7舉例說明了對(duì)野生型煙草進(jìn)行的RNA印跡分析。印跡用煙草P4H cDNA進(jìn)行探測(cè)。
圖8是由共轉(zhuǎn)化2、3和13產(chǎn)生的轉(zhuǎn)基因植物的蛋白質(zhì)印跡分析。從煙草共轉(zhuǎn)化體提取總可溶性蛋白,并用抗人P4Hα和β以及抗膠原I抗體進(jìn)行檢測(cè)。
優(yōu)選實(shí)施方案的描述本發(fā)明是關(guān)于表達(dá)并積聚膠原的植物,所述植物可用于生產(chǎn)顯示哺乳動(dòng)物膠原特征的膠原和膠原纖維。
參考附圖和附加的描述可以更好地理解本發(fā)明的原理和操作。
在詳細(xì)解釋本發(fā)明的至少一個(gè)實(shí)施方案之前,應(yīng)當(dāng)理解本發(fā)明在其應(yīng)用方面不局限于下文描述中闡明或由實(shí)施例示例的細(xì)節(jié)。本發(fā)明能夠是其他實(shí)施方案、或以各種方式加以實(shí)踐或執(zhí)行。同樣,應(yīng)當(dāng)理解本文所采用的措辭和術(shù)語是用于描述的目的且不應(yīng)被視為限制。
生產(chǎn)膠原的植物是本領(lǐng)域已知的。盡管此類植物可以用于生產(chǎn)膠原鏈以及膠原,但此類鏈?zhǔn)遣徽_地羥基化的,并因此無論是在植物中還是不在植物中,其自身的裝配導(dǎo)致內(nèi)在不穩(wěn)定的膠原。
在將本發(fā)明變?yōu)閷?shí)踐的同時(shí),本發(fā)明人設(shè)計(jì)了植物表達(dá)方法,它確保膠原鏈的正確羥基化并因此使得能夠在植物中生產(chǎn)膠原,所述膠原緊密地模仿人I型膠原的特征(例如,溫度穩(wěn)定性)。
因此,根據(jù)本發(fā)明的一個(gè)方面,提供了基因修飾植物,它能夠表達(dá)至少一種類型的膠原α鏈,并將其積聚在缺乏內(nèi)源性P4H活性的亞細(xì)胞區(qū)室中。
如本文所使用的,短語“基因修飾植物”指任何低等(例如蘚類)或高等(維管)植物或組織或其被分離的細(xì)胞(例如細(xì)胞懸浮液),它用外源性多核苷酸序列穩(wěn)定或瞬時(shí)轉(zhuǎn)化。植物的例子包括煙草、玉米、苜蓿、稻、馬鈴薯、大豆、番茄、小麥、大麥、低芥酸菜子、棉花、胡蘿卜以及低等植物例如蘚類。
如本文所使用的,短語“膠原鏈”指膠原亞基,例如膠原纖維的α1或2鏈,優(yōu)選I型纖維。如本文所使用的,短語“膠原”指被裝配的膠原三聚體,在I型膠原的情況下它包括2個(gè)α1鏈和1個(gè)α2鏈。膠原纖維是缺乏末端前肽C和N的膠原。
如本文所使用的,短語“缺乏內(nèi)源性P4H活性的亞細(xì)胞區(qū)室”指細(xì)胞的任何被區(qū)室化的區(qū)域,它不包括植物P4H或具有植物樣P4H活性的酶。此類亞細(xì)胞區(qū)室的例子包括液泡、質(zhì)外體和細(xì)胞質(zhì),以及細(xì)胞器例如葉綠體、線粒體等。
任何類型的膠原鏈都可以由本發(fā)明的基因修飾植物表達(dá)。例子包括形成原纖維的膠原(I、II、III、V和XI型)、形成網(wǎng)絡(luò)的膠原(IV、VIII和X型)、與原纖維表面結(jié)合的膠原(IX、XII和XIV型)、作為跨膜蛋白存在的膠原(XIII和XVII型)、或形成11nm周期性珠狀絲的膠原(VI型)。關(guān)于進(jìn)一步的描述請(qǐng)參見Hulmes,2002。
優(yōu)選地,表達(dá)的膠原鏈?zhǔn)荌型膠原α1和/2鏈。表達(dá)的膠原α鏈可以由來源于任何哺乳動(dòng)物的任何多核苷酸序列編碼。優(yōu)選地,編碼膠原α鏈的序列是人的并且由SEQ ID NO1和4闡明。
一般地,在植物中表達(dá)的α膠原鏈可以包括或不包括其末端前肽(即前肽C和前肽N)。
Ruggiero等人(2000)指出前膠原經(jīng)由植物蛋白水解活性的處理不同于在人中的正常處理,并且前肽C通過植物蛋白水解活性去除,盡管切割位點(diǎn)不明。前肽C的切割可以在三聚體裝配之前(3種C-前肽的結(jié)合是發(fā)動(dòng)三聚體裝配所必需的)發(fā)生在前膠原肽上。
經(jīng)由植物蛋白水解活性的N-前肽切割發(fā)生在成熟植物中而不發(fā)生在小植物中。此類切割去除來自N端肽的2個(gè)氨基酸(17個(gè)中的2個(gè))。
C-前肽(以及較少程度上的N-前肽)在前膠原通過動(dòng)物細(xì)胞的過程中保持前膠原可溶(Bulleid等人,2000),并且預(yù)期在植物細(xì)胞中有類似作用。在前膠原分子分泌進(jìn)入細(xì)胞外基質(zhì)后或在這個(gè)過程中,通過前膠原N-和C-蛋白酶去除前肽,從而觸發(fā)膠原分子自發(fā)地自身裝配為原纖維(Hulmes,2002)。通過前膠原N-和C-蛋白酶去除前肽使前膠原的溶解性降低了>10000倍,并且是發(fā)動(dòng)膠原自身裝配成纖維所必需和充分的。對(duì)這個(gè)裝配過程關(guān)鍵的是在三股螺旋結(jié)構(gòu)域末端被稱為端肽的短的非三股螺旋肽,它確保原纖維結(jié)構(gòu)內(nèi)的膠原分子的正確記錄,并降低自身裝配的臨界濃度(Bulleid等人,2000)。現(xiàn)有技術(shù)描述了在膠原生產(chǎn)過程中利用胃蛋白酶切割前肽(Bulleid等人2000)。然而胃蛋白酶破壞端肽,并且因此,胃蛋白酶提取的膠原不能形成有序的原纖維結(jié)構(gòu)(Bulleid等人2000)。
形成人P4Hβ亞基的蛋白質(zhì)二硫鍵異構(gòu)酶(PDI)顯示在三聚體裝配之前與C-前肽結(jié)合,因此在鏈的裝配過程中還充當(dāng)分子侶伴(Ruggiero等人,2000)。在不同植物中表達(dá)的人前膠原I N-蛋白酶和前膠原C-蛋白酶的使用可以產(chǎn)生更類似于天然的人膠原的膠原,并且可以形成有序的原纖維結(jié)構(gòu)。
在其中N或C前肽或二者包括在表達(dá)的膠原鏈中的情況下,本發(fā)明的基因修飾植物還可表達(dá)分別的蛋白酶(即,C或N或二者)。編碼此類蛋白酶的多核苷酸序列由SEQ ID NO18(蛋白酶C)和20(蛋白酶N)示例。此類蛋白酶可以被這樣表達(dá),從而使得它們?cè)谂c膠原鏈相同的亞細(xì)胞區(qū)室中積聚。
表達(dá)的膠原鏈在缺乏內(nèi)源性P4H活性的亞細(xì)胞區(qū)室中的積聚可以經(jīng)由幾種方法中的任何一種來實(shí)現(xiàn)。
例如,表達(dá)的膠原鏈可以包括用于將表達(dá)的蛋白靶向亞細(xì)胞區(qū)室例如質(zhì)外體或細(xì)胞器(例如葉綠體)的信號(hào)序列。適當(dāng)?shù)男盘?hào)序列的例子包括葉綠體轉(zhuǎn)運(yùn)肽(包括在Swiss-Prot的登錄號(hào)P07689中,氨基酸1-57)和線粒體轉(zhuǎn)運(yùn)肽(包括在Swiss-Prot的登錄號(hào)P46643中,氨基酸1-28)。下文實(shí)施例部分提供了適當(dāng)?shù)男盘?hào)序列的另外例子以及關(guān)于在植物細(xì)胞的膠原鏈表達(dá)中采用此類信號(hào)序列的指導(dǎo)方針。
可替代地,當(dāng)在植物中表達(dá)時(shí),膠原鏈的序列可以以改變膠原細(xì)胞定位的方式進(jìn)行修飾。
如上文所提及的,植物的ER包括不能使膠原鏈正確羥基化的P4H。膠原α鏈天然地包括ER靶向序列,它指導(dǎo)表達(dá)的膠原進(jìn)入ER,在其中它被翻譯后修飾(包括不正確的羥基化)。因此,ER靶向序列的去除將導(dǎo)致缺乏翻譯后修飾(包括任何羥基化)的膠原鏈的細(xì)胞質(zhì)積聚。
下文實(shí)施例部分的實(shí)施例1描述了缺乏ER序列的膠原序列的生產(chǎn)。
再可替代地,膠原鏈可以被表達(dá)并積聚在包含DNA的細(xì)胞器例如葉綠體或線粒體中。葉綠體表達(dá)的進(jìn)一步描述在下文中提供。
如上文所提及的,α鏈的羥基化是穩(wěn)定的I型膠原裝配所必需的。因?yàn)橥ㄟ^本發(fā)明基因修飾植物表達(dá)的α鏈積聚在缺乏內(nèi)源性P4H活性的區(qū)室內(nèi),所以必須從植物、植物組織或細(xì)胞中分離此類鏈并在體外進(jìn)行羥基化。此類羥基化可以通過Turpeenniemi-Hujanen和Myllyla(Concomitant hydroxylation of proline and lysine residues in collagenusing purified enzymes in vitro.Biochim Biophys Acta.1984 Jul 16;800(l)59-65)所述方法實(shí)現(xiàn)。
盡管此類體外羥基化可以產(chǎn)生正確羥基化的膠原鏈,但它的實(shí)現(xiàn)是困難且代價(jià)高的。
為了克服體外羥基化的局限,本發(fā)明的基因修飾植物優(yōu)選還共表達(dá)P4H,它能使膠原α鏈正確羥基化[即只在Gly-X-Y三聯(lián)體的脯氨酸(Y)位置上羥基化]。P4H是由2個(gè)亞基α和β組成的酶。二者都是形成活性酶所必需的,而β亞基還具有侶伴功能。
通過本發(fā)明的基因修飾植物表達(dá)的P4H優(yōu)選是人P4H,它由例如SEQ ID NO12和14編碼。此外,還可使用顯示增強(qiáng)的底物特異性的P4H突變體或P4H同源物。
適當(dāng)?shù)腜4H同源物由NCBI編號(hào)NP_179363鑒定的鼠耳芥屬(Arabidopsis)氧化還原酶示例。由本發(fā)明人進(jìn)行的這種蛋白質(zhì)序列和人P4Hα亞基的逐對(duì)比對(duì)揭示了任何已知的植物P4H同源物的功能結(jié)構(gòu)域之間的最高同源性。
因?yàn)镻4H需要與表達(dá)的膠原鏈共積聚,所以其編碼序列優(yōu)選相應(yīng)地進(jìn)行修飾(加入信號(hào)序列、可能阻止ER靶向的缺失,等等)。
在哺乳動(dòng)物細(xì)胞中,膠原還通過賴氨酰羥化酶、半乳糖基轉(zhuǎn)移酶和葡糖基轉(zhuǎn)移酶進(jìn)行修飾。這些酶序貫地將特定位置的賴氨酰殘基修飾為羥賴氨酰、半乳糖基羥賴氨酰和葡糖基半乳糖基羥賴氨酰殘基。單獨(dú)的人的酶,賴氨酰羥化酶3(LH3)可以催化羥賴氨酸連接的碳水化合物形成中的所有3個(gè)連續(xù)步驟。
因此,本發(fā)明的基因修飾植物還優(yōu)選表達(dá)哺乳動(dòng)物L(fēng)H3。編碼LH3的序列例如SEQ ID NO22所闡明的那些可以用于此類用途。
上文描述的膠原鏈和修飾酶可以由穩(wěn)定整合或瞬時(shí)表達(dá)的核酸構(gòu)建體進(jìn)行表達(dá),所述核酸構(gòu)建體包括編碼α鏈和/或修飾酶(例如P4H和LH3)、置于植物功能啟動(dòng)子的轉(zhuǎn)錄控制下的多核苷酸序列。此類核酸構(gòu)建體(它在本文中也被稱為表達(dá)構(gòu)建體)可以被設(shè)置為在遍及完整植物、限定的植物組織或限定的植物細(xì)胞、或在植物的限定發(fā)育階段進(jìn)行表達(dá)。此類構(gòu)建體還可包括選擇標(biāo)記(例如抗生素抗性)、增強(qiáng)子元件和用于細(xì)菌復(fù)制的復(fù)制起點(diǎn)。
應(yīng)當(dāng)理解包括2種可表達(dá)的插入片段(例如2個(gè)α鏈類型、或α鏈和P4H)的構(gòu)建體優(yōu)選包括適合于每種插入片段的單獨(dú)啟動(dòng)子,或可替代地,此類構(gòu)建體可以表達(dá)包括來自單個(gè)啟動(dòng)子的2個(gè)插入序列的單個(gè)轉(zhuǎn)錄物嵌合體。在這種情況下,嵌合轉(zhuǎn)錄物包括在2個(gè)插入序列之間的IRES序列,從而使得下游插入片段可以從那里被翻譯。
本發(fā)明的構(gòu)建體可以采用眾多植物功能表達(dá)啟動(dòng)子和增強(qiáng)子,它們可以是組織特異性、發(fā)育特異性、組成型或誘導(dǎo)型的,下文提供了一些例子。
如本說明書此處和隨后的權(quán)利要求部分所使用的,短語“植物啟動(dòng)子”或“啟動(dòng)子”包括可以指導(dǎo)植物細(xì)胞(包括包含DNA的細(xì)胞器)中的基因表達(dá)的啟動(dòng)子。此類啟動(dòng)子可以來源于植物、細(xì)菌、病毒、真菌或動(dòng)物來源。此類啟動(dòng)子可以是組成型的,即能夠指導(dǎo)在多個(gè)植物組織中的高水平基因表達(dá),組織特異性的,即能夠指導(dǎo)在一種或多種特定植物組織中的基因表達(dá),誘導(dǎo)型的,即能夠在刺激下指導(dǎo)基因表達(dá),或嵌合的,即由至少2個(gè)不同的啟動(dòng)子部分形成。
因此,所使用的植物啟動(dòng)子可以是組成型啟動(dòng)子、組織特異性啟動(dòng)子、誘導(dǎo)型啟動(dòng)子或嵌合啟動(dòng)子。
組成型植物啟動(dòng)子的例子包括,但不限于,CaMV35S和CaMV19S啟動(dòng)子、FMV34S啟動(dòng)子、甘蔗桿狀病毒(sugarcane bacilliformbadnavirus)啟動(dòng)子、CsVMV啟動(dòng)子、鼠耳芥ACT2/ACT8肌動(dòng)蛋白啟動(dòng)子、鼠耳芥遍在蛋白UBQ1啟動(dòng)子、大麥葉硫素BTH6啟動(dòng)子和稻肌動(dòng)蛋白啟動(dòng)子。
組織特異性啟動(dòng)子的例子包括,但不限于,豆菜豆蛋白貯存蛋白啟動(dòng)子、DLEC啟動(dòng)子、PHS啟動(dòng)子、玉米醇溶蛋白貯存蛋白啟動(dòng)子、來自大豆的羽扇豆球蛋白γ啟動(dòng)子、AT2S1基因啟動(dòng)子、來自鼠耳芥的ACT11肌動(dòng)蛋白啟動(dòng)子、來自歐洲油菜(Brassica napus)的napA啟動(dòng)子和馬鈴薯patatin基因啟動(dòng)子。
誘導(dǎo)型啟動(dòng)子是由特異性的刺激例如應(yīng)激條件(包括例如光、溫度、化學(xué)制劑、干旱、高鹽度、滲透壓休克)、氧化劑條件或在致病性的情況下誘導(dǎo)的啟動(dòng)子,并且包括,但不限于,來源于豌豆rbcS基因的光誘導(dǎo)型啟動(dòng)子,來自苜蓿rbcS基因的啟動(dòng)子,在干旱時(shí)活化的啟動(dòng)子DRE、MYC和MYB;在高鹽度和滲透壓應(yīng)激下活化的啟動(dòng)子INT、INPS、prxEa、Ha hsp17.7G4和RD21,以及在致病性應(yīng)激下活化的啟動(dòng)子hsr203J和str246C。
優(yōu)選地,本發(fā)明使用的啟動(dòng)子是強(qiáng)組成型啟動(dòng)子,從而使得構(gòu)建體插入片段的超表達(dá)在植物轉(zhuǎn)化后實(shí)現(xiàn)。
應(yīng)當(dāng)理解,本發(fā)明所使用的任何構(gòu)建體類型都可以利用每種構(gòu)建體類型中相同或不同的選擇標(biāo)記共轉(zhuǎn)化到相同的植物中??商娲?,第一種構(gòu)建體類型可以導(dǎo)入第一種植物中,而第二種構(gòu)建體類型可以導(dǎo)入第二種等基因植物中,之后由此產(chǎn)生的轉(zhuǎn)基因植物可以進(jìn)行雜交并選擇雙重轉(zhuǎn)化體的后代。此類后代的進(jìn)一步自交可以用于產(chǎn)生2種構(gòu)建體的純合系。
存在將核酸構(gòu)建體導(dǎo)入單子葉植物和雙子葉植物的各種方法(Potrykus,I.,Annu.Rev.Plant.Physiol.,Plant.Mol.Biol.(1991)42205-225;Shimamoto等人,Nature(1989)338274-276)。此類方法依賴于核酸構(gòu)建體或其部分穩(wěn)定整合到植物基因組中,或在其中這些序列不由植物后代遺傳的情況下依賴于核酸構(gòu)建體的瞬時(shí)表達(dá)。
此外,存在可以將核酸構(gòu)建體直接導(dǎo)入包含DNA的細(xì)胞器例如葉綠體的DNA中的幾種方法。
存在實(shí)現(xiàn)外源序列例如包括在本發(fā)明的核酸構(gòu)建體內(nèi)的那些穩(wěn)定地基因組整合到植物基因組中的2種基本方法(i)土壤桿菌屬(Agrobaclerium)-介導(dǎo)的基因轉(zhuǎn)移Klee等人(1987)Annu.Rev.Plant Physiol.38467-486;Klee和Rogers,CellCulture and Somatic Cell Genetics of Plants,第6卷,MolecularBiology of Plant Nuclear Genes,eds.Schell,J.,和Vasil,L.K.,Academic Publishers,San Diego,Calif.(1989)第2-25頁(yè);Gatenby,Plant Biotechnology,eds.Kung,S.和Arntzen,C.J.,ButterworthPublishers,Boston,Mass.(1989)第93-112頁(yè)。
(ii)DNA直接攝取Paszkowski等人,Cell Culture and SomaticCell Genetics of Plants,第6卷,Molecular Biology of Plant NuclearGenes eds.Schell,J.,和Vasil,L.K.,Academic Publishers,San Diego,Calif.(1989)第52-68頁(yè);包括用于將DNA直接攝入原生質(zhì)體中的方法,Toriyama,K.等人(1988)Bio/Technology 61072-1074。通過植物細(xì)胞短暫電休克誘導(dǎo)的DNA攝取Zhang等人Plant Cell Rep.(1988)7379-384.Fromm等人Nature(1986)319791-793。通過粒子轟擊,Klein等人Bio/Technology(1988)6559-563;McCabe等人Bio/Technology(1988)6923-926;Sanford,Physiol.Plant.(1990)79206-209;通過使用微量移液管系統(tǒng),Neuhaus等人,Theor.Appl.Genet.(1987)7530-36;Neuhaus和Spangenberg,Physiol.Plant.(1990)79213-217;或通過將DNA與發(fā)芽的花粉直接溫育,DeWet等人Experimental Manipulation of Ovule Tissue,eds.Chapman,G.P.和Mantell,S.H.和Daniels,W.Longman,London,(1985)第197-209頁(yè);和Ohta,Proc.Natl.Acad.Sci.USA(1986)83715-719,將DNA注射到植物細(xì)胞或組織中。
土壤桿菌屬系統(tǒng)包括質(zhì)粒載體的使用,所述質(zhì)粒載體包含整合到植物基因組DNA中的限定的DNA片段。植物組織的接種方法依賴于植物物種和土壤桿菌屬送遞系統(tǒng)而變。廣泛使用的方法是葉盤法,它可以由任何組織外植體來進(jìn)行,所述外植體提供用于發(fā)動(dòng)整個(gè)植物分化的良好來源。Horsch等人Plant Molecular Biology Manual A5,Kluwer Academic Publishers,Dordrecht(1988)第1-9頁(yè)。補(bǔ)充方法采用與真空滲透組合的土壤桿菌屬送遞系統(tǒng)。土壤桿菌屬系統(tǒng)在轉(zhuǎn)基因雙子葉植物的制備中尤其可行。
存在直接將DNA轉(zhuǎn)移到植物細(xì)胞中的各種方法。在電穿孔中,使原生質(zhì)體短暫地暴露在強(qiáng)電場(chǎng)中。在顯微注射中,利用極小的微量移液管將DNA機(jī)械地直接注射到細(xì)胞中。在微粒轟擊中,DNA吸附在微粒例如硫酸鎂晶體、鎢顆粒或金顆粒上,并且微粒物理加速進(jìn)入細(xì)胞或植物組織中。
轉(zhuǎn)化后進(jìn)行植物繁殖。最常見的植物繁殖法是通過種子。然而通過種子繁殖的再生具有由于雜合性而在農(nóng)作物中缺少一致性的缺陷,因?yàn)楦鶕?jù)孟德爾定律決定的遺傳變異,種子通過植物產(chǎn)生?;旧?,每個(gè)種子在遺傳上不同并且每個(gè)將伴隨其自身的特殊性狀生長(zhǎng)。因此,優(yōu)選被轉(zhuǎn)化的植物被這樣生產(chǎn),從而使得再生的植物具有與親本轉(zhuǎn)基因植物相同的性狀和特征。因此,優(yōu)選被轉(zhuǎn)化的植物通過微繁殖(micropropagation)進(jìn)行再生,所述微繁殖提供被轉(zhuǎn)化植物的快速、一致的生殖。
可以用于瞬時(shí)表達(dá)包括在本發(fā)明的核酸構(gòu)建體內(nèi)的被分離核酸的瞬時(shí)表達(dá)法包括,但不限于,如上所述的顯微注射和轟擊,但在有利于瞬時(shí)表達(dá)的條件下,和病毒介導(dǎo)的表達(dá),其中包括核酸構(gòu)建體的被包裝或未包裝的重組病毒載體用于感染植物組織或細(xì)胞,從而使得其中確立的繁殖的重組病毒表達(dá)非病毒的核酸序列。
已顯示對(duì)于植物宿主轉(zhuǎn)化有用的病毒包括CaMV、TMV和BV。利用植物病毒的植物轉(zhuǎn)化描述于美國(guó)專利號(hào)4,855,237(BGV)、EP-A67,553(TMV)、日本公開申請(qǐng)?zhí)?3-14693(TMV)、EPA 194,809(BV)、EPA 278,667(BV);和Gluzman,Y.等人,Communications in MolecularBiologyViral Vectors,Cold Spring Harbor Laboratory,New York,pp.172-189(1988)中。用于在多種宿主包括植物中表達(dá)外來DNA的假病毒顆粒描述于WO 87/06261中。
用于在植物中導(dǎo)入和表達(dá)非病毒性外源核酸序列的植物RNA病毒的構(gòu)建由上述參考文獻(xiàn)以及Dawson,W.O.等人,Virology(1989)172285-292;Takamatsu等人EMBO J.(1987)6307-311;French等人Science(1986)2311294-1297;和Takamatsu等人FEBS Letters(1990)26973-76證實(shí)。
當(dāng)病毒是DNA病毒時(shí),可以對(duì)病毒自身進(jìn)行構(gòu)建。可替代地,病毒可以首先克隆到細(xì)菌質(zhì)粒中以用于容易地構(gòu)建含有外來DNA的所需病毒載體。病毒隨后可以從質(zhì)粒中切除。如果病毒是DNA病毒,則可以將細(xì)菌的復(fù)制起點(diǎn)附著在病毒DNA上,所述病毒DNA隨后通過細(xì)菌進(jìn)行復(fù)制。這種DNA的轉(zhuǎn)錄和翻譯將產(chǎn)生外殼蛋白,它將使病毒DNA殼體化。如果病毒是RNA病毒,則該病毒通常作為cDNA被克隆并插入質(zhì)粒中。質(zhì)粒隨后用于制備所有構(gòu)建體。RNA病毒隨后通過轉(zhuǎn)錄質(zhì)粒的病毒序列并翻譯病毒基因以產(chǎn)生使病毒RNA殼體化的外殼蛋白來產(chǎn)生。
用于在植物中導(dǎo)入和表達(dá)非病毒性外源核酸序列的植物RNA病毒的構(gòu)建由上述參考文獻(xiàn)以及美國(guó)專利號(hào)5,316,931證實(shí),所述外源核酸序列例如本發(fā)明構(gòu)建體中包括的那些。
在一個(gè)實(shí)施方案中,提供了植物病毒性核酸,其中天然的外殼蛋白編碼序列已從病毒核酸中缺失,已插入非天然的植物病毒外殼蛋白的編碼序列和非天然的啟動(dòng)子,優(yōu)選非天然的外殼蛋白編碼序列的亞基因組啟動(dòng)子,其能夠在植物宿主中表達(dá),包裝重組的植物病毒核酸,并確保通過重組的植物病毒核酸全身地感染宿主??商娲?,外殼蛋白基因可以通過在其中插入非天然的核酸序列來滅活,從而產(chǎn)生蛋白質(zhì)。重組的植物病毒核酸可以包含一個(gè)或多個(gè)另外的非天然的亞基因組啟動(dòng)子。每個(gè)非天然的亞基因組啟動(dòng)子都能夠在植物宿主中轉(zhuǎn)錄或表達(dá)鄰近基因或核酸序列,并且不能互相重組以及與天然的亞基因組啟動(dòng)子重組。如果包括超過一個(gè)的核酸序列,則插入的非天然(外來)核酸序列可以鄰近天然的植物病毒亞基因組啟動(dòng)子、或鄰近天然的和非天然的植物病毒亞基因組啟動(dòng)子。非天然的核酸序列在亞基因組啟動(dòng)子控制下在宿主植物中被轉(zhuǎn)錄或表達(dá),以生產(chǎn)所需產(chǎn)品。
在第二個(gè)實(shí)施方案中,提供的重組的植物病毒核酸與第一個(gè)實(shí)施方案中的一樣,只是除了將天然的外殼蛋白編碼序列置于鄰近一個(gè)非天然的外殼蛋白亞基因組啟動(dòng)子而不是非天然的外殼蛋白編碼序列。
在第三個(gè)實(shí)施方案中,提供重組的植物病毒核酸,其中天然外殼蛋白的基因鄰近其亞基因組啟動(dòng)子,且一個(gè)或多個(gè)非天然亞基因組啟動(dòng)子已插入到病毒核酸中。插入的非天然的亞基因組啟動(dòng)子能夠在植物宿主中轉(zhuǎn)錄或表達(dá)鄰近基因,并且不能互相重組及與天然的亞基因組啟動(dòng)子重組。插入的非天然的核酸序列可以鄰近非天然的亞基因組植物病毒啟動(dòng)子,從而使得所述序列在亞基因組啟動(dòng)子控制下在宿主植物中被轉(zhuǎn)錄或表達(dá),以生產(chǎn)所需產(chǎn)品。
在第四個(gè)實(shí)施方案中,提供的重組的植物病毒核酸與第三個(gè)實(shí)施方案中的一樣,只是除了天然的外殼蛋白編碼序列由非天然的外殼蛋白編碼序列替代。
病毒載體通過由重組的植物病毒核酸編碼的外殼蛋白進(jìn)行殼體化,以生產(chǎn)重組的植物病毒。重組的植物病毒核酸或重組的植物病毒用于感染適當(dāng)?shù)乃拗髦参?。重組的植物病毒核酸能夠在宿主中復(fù)制、在宿主中全身地?cái)U(kuò)散、并且在宿主中轉(zhuǎn)錄或表達(dá)外來基因(被分離的核酸),以生產(chǎn)所需蛋白。
用于將外源核酸序列導(dǎo)入葉綠體基因組的技術(shù)是已知的。這種技術(shù)包括下列過程。首先,植物細(xì)胞被化學(xué)處理以便將每個(gè)細(xì)胞的葉綠體數(shù)目減少至約一個(gè)。隨后,外源核酸經(jīng)由粒子轟擊導(dǎo)入細(xì)胞中以用于將至少一種外源核酸分子導(dǎo)入葉綠體中。選擇外源核酸從而使得它能夠經(jīng)由同源重組整合到葉綠體基因組中,所述同源重組易于通過葉綠體固有的酶來實(shí)現(xiàn)。為此,外源核酸除了目的基因之外還包括至少一個(gè)核酸段,它來源于葉綠體基因組。此外,外源核酸包括選擇標(biāo)記,它通過序貫選擇過程以用于確定所有或基本上所有的葉綠體基因組拷貝在此類選擇后將包括外源核酸。關(guān)于這種技術(shù)的進(jìn)一步的細(xì)節(jié)在美國(guó)專利號(hào)4,945,050和5,693,507中找到,所述專利引入本文作為參考。因此多肽可以通過葉綠體的蛋白質(zhì)表達(dá)系統(tǒng)來生產(chǎn)并且變得整合到葉綠體內(nèi)膜中。
上述轉(zhuǎn)化方法可以用于在任何物種的植物、或植物組織或來源于那里的被分離的植物細(xì)胞中生產(chǎn)膠原鏈和/或修飾酶以及被裝配的膠原(含或不含前肽)。
優(yōu)選的植物是能夠積聚大量本文描述的膠原鏈、膠原和/或加工酶的那些。還可根據(jù)其對(duì)應(yīng)激條件的抗性和其中表達(dá)的組分或被裝配的膠原可以被提取的容易性來選擇此類植物。優(yōu)選的植物的例子包括煙草、玉米、苜蓿、稻、馬鈴薯、大豆、番茄、小麥、大麥、低芥酸菜子和棉花。
膠原纖維廣泛地用于食物和化妝品工業(yè)中。因此,盡管由植物表達(dá)的膠原纖維組分(α鏈)和修飾酶在膠原的工業(yè)合成中找到功用,但由于其簡(jiǎn)單性和成本效率,優(yōu)選在植物中生產(chǎn)完整的膠原。
幾種方法可以用于在植物中生成I型膠原。例如可以從表達(dá)膠原α1和P4H(和任選的LH3)的植物中分離膠原α1鏈并且將其與膠原α2鏈混合,所述膠原α2鏈從表達(dá)膠原α2和P4H(和任選的LH3以及蛋白酶C和/或N)的植物中分離。因?yàn)槟z原α1鏈自動(dòng)地自身裝配為三股螺旋,所以在混合之前可能必須使此類同源三聚體變性,且與膠原α2鏈一起復(fù)性。
優(yōu)選地,表達(dá)膠原α1和P4H(和任選的LH3以及蛋白酶C和/或N)的第一種植物可以與表達(dá)膠原α2的第二種(且優(yōu)選等基因的)植物雜交,或可替代地,表達(dá)2種α鏈的第一種植物可以與表達(dá)P4H和任選的LH3以及蛋白酶C和/或N的第二種植物雜交。
應(yīng)當(dāng)指出盡管上述植物育種方法使用2種單獨(dú)轉(zhuǎn)化的植物,但使用3種或更多種單獨(dú)轉(zhuǎn)化的植物的方法也可采用,所述植物各自表達(dá)1種或2種組分。
本領(lǐng)域的普通技術(shù)人員知道各種植物育種技術(shù)并且因此本文不提供此類技術(shù)的進(jìn)一步描述。
盡管植物育種方法是優(yōu)選的,但應(yīng)當(dāng)指出表達(dá)膠原α1和2、P4H和LH3(和任選的蛋白酶C和/或N)的單個(gè)植物可以經(jīng)由數(shù)個(gè)轉(zhuǎn)化事件產(chǎn)生,每個(gè)所述轉(zhuǎn)化事件被設(shè)計(jì)用于將再一個(gè)可表達(dá)的組分導(dǎo)入細(xì)胞中。在這種情況下,每個(gè)轉(zhuǎn)化事件的穩(wěn)定性可以利用特異性的選擇標(biāo)記進(jìn)行驗(yàn)證。
在任何情況下,轉(zhuǎn)化和植物育種方法都可以用于生成表達(dá)任何數(shù)目的組分的任何植物。目前優(yōu)選的是表達(dá)膠原α1和2鏈、P4H、LH3和至少一種蛋白酶(例如蛋白酶C和/或N)的植物。如下文實(shí)施例部分將進(jìn)一步描述的,此類植物積聚在最高達(dá)42℃的溫度下顯示出穩(wěn)定性的膠原。
由育種產(chǎn)生的后代,或可替代地,多重轉(zhuǎn)化的植物可以通過使用核酸或蛋白質(zhì)探針(例如抗體)證實(shí)外源mRNA和/或多肽的存在來選擇。后面的方法是優(yōu)選的,因?yàn)樗軌蚨ㄎ凰磉_(dá)的多肽組分(通過例如,探測(cè)分級(jí)分離的植物提取物),并因此同樣證實(shí)了用于正確加工和裝配的潛力。適當(dāng)?shù)奶结樀睦釉谙挛膶?shí)施例部分提供。
一旦表達(dá)膠原的后代被鑒別,此類植物就進(jìn)一步在使膠原鏈以及修飾酶最大化表達(dá)的條件下進(jìn)一步培育。
因?yàn)橛坞x的脯氨酸積聚可以促進(jìn)不同的富含脯氨酸的蛋白質(zhì)的過度生產(chǎn),所述蛋白質(zhì)包括由本發(fā)明的基因修飾植物表達(dá)的膠原鏈,所以優(yōu)選的培育條件是增加被培育植物中游離脯氨酸積聚的那些。
游離脯氨酸響應(yīng)于廣泛的環(huán)境應(yīng)激而在多種植物中積聚,所述環(huán)境應(yīng)激包括剝奪、鹽化、低溫、高溫、病原體感染、重金屬毒性、無氧生活、養(yǎng)分缺乏、大氣污染和紫外線照射(Hare和Cress,1997)。
游離脯氨酸還可響應(yīng)于經(jīng)由化合物例如ABA,或應(yīng)激誘導(dǎo)化合物例如銅鹽、百草枯(paraquate)、水楊酸等處理植物或土壤而積聚。
因此,表達(dá)膠原的后代可以在不同的應(yīng)激條件(例如50mM-最高達(dá)250mM的不同的NaCl濃度)下生長(zhǎng)。為了進(jìn)一步增強(qiáng)膠原的生產(chǎn),將檢查各種應(yīng)激條件對(duì)膠原表達(dá)的作用,并關(guān)于植物生活力、生物量和膠原積聚進(jìn)行最優(yōu)化。
植物組織/細(xì)胞優(yōu)選在成熟期進(jìn)行收獲,并且利用眾所周知的現(xiàn)有技術(shù)的提取方法分離膠原纖維,下文描述了一種此類方法。
轉(zhuǎn)基因植物的葉子在液氮下被磨成粉末,并且于4℃在包含0.2MNaCl的0.5M乙酸中提取勻漿物60小時(shí)。通過離心去除不溶的材料。包含重組膠原的上清液在0.4M和0.7M NaCl下進(jìn)行鹽分級(jí)分離。包含重組的異源三聚體膠原的0.7M NaCl沉淀物溶解于0.1M乙酸中并針對(duì)其進(jìn)行透析,并儲(chǔ)存于-20℃(根據(jù)Ruggiero等人,2000)。
在檢查下列實(shí)施例后本發(fā)明的其他目的、優(yōu)點(diǎn)和新型特征對(duì)于本領(lǐng)域的普通技術(shù)人員而言將是顯而易見的,所述實(shí)施例不預(yù)期是限制性的。另外,如上文所描繪的和下文權(quán)利要求部分所請(qǐng)求保護(hù)的本發(fā)明的各種實(shí)施方案和方面中的每一個(gè)在下列實(shí)施例中都能找到實(shí)驗(yàn)支持。
實(shí)施例現(xiàn)在參考下列實(shí)施例,所述實(shí)施例與上述說明書一起以非限制性的方式舉例說明本發(fā)明。
一般地,本文所使用的術(shù)語和本發(fā)明中使用的實(shí)驗(yàn)程序包括分子、生物化學(xué)、微生物學(xué)和重組DNA技術(shù)。此類技術(shù)在文獻(xiàn)中得到充分說明。參見,例如“Molecular CloningA laboratory Manual”Sambrook等人(1989);“Current Protocols in Molecular Biology”第I-III卷Ausubel,R.M.,ed.(1994);Ausubel等人,“CurrentProtocols in Molecular Biology”,John Wiley和Sons,Baltimore,Maryland(1989);Perbal,“A Practical Guide to MolecularCloning”,John Wiley & Sons,New York(1988);Watson等人,“Recombinant DNA”,Scientific American Books,New York;Birren等人(eds),“Genome AnalysisA Laboratory Manual Series”,第1-4卷,Cold Spring Harbor Laboratory Press,New York(1998);美國(guó)專利號(hào)4,666,828;4,683,202;4,801,531;5,192,659和5,272,057中所闡明的方法;“Cell BiologyA Laboratory Handbook”,第I-III卷Cellis,J.E.,ed.(1994);“Current Protocols in Immunology”第I-III卷Coligan J.E.,ed.(1994);Stites等人(eds),“Basic and ClinicalImmunology”(第8版),Appleton & Lange,Norwalk,CT(1994);Mishell和Shiigi(eds),“Selected Methods in Cellular Immunology”,W.H.Freeman and Co.,New York(1980);可用的免疫測(cè)定廣泛描述于專利和科學(xué)文獻(xiàn)中,參見,例如,美國(guó)專利號(hào)3,791,932;3,839,153;3,850,752;3,850,578;3,853,987;3,867,517;3,879,262;3,901,654;3,935,074;3,984,533;3,996,345;4,034,074;4,098,876;4,879,219;5,011,771和5,281,521;“Oligonucleotide Synthesis”Gait,M.J.,ed.(1984);“Nucleic Acid Hybridization”Hames,B.D.,和Higgins S.J.,eds.(1985);“Transcription and Translation”Hames,B.D.,和Higgins S.J.,Eds.(1984);“Animal Cell Culture”Freshney,R.I,ed.(1986);“Immobilized Cells and Enzymes”IRL Press,(1986);“A Practical Guide to Molecular Cloning”Perbal,B.,(1984)和“Methods in Enzymology”第1-317卷,Academic Press;“PCRProtocolsA Guide To Methods And Applications”,Academic Press,San Diego,CA(1990);Marshak等人,“Strategies for ProteinPurification and Characterization-A Laboratory Course Manual”CSHL Press(1996);所有這些都如本文完全闡明的那樣引入本文作為參考。這個(gè)文件自始至終提供了其他的一般參考文獻(xiàn)。其中的程序被認(rèn)為是本領(lǐng)域眾所周知的并且為了讀者的方便而提供。其中包含的所有信息都引入本文作為參考。
實(shí)施例1構(gòu)建體和轉(zhuǎn)化方案
圖1a-d中舉例說明了在這項(xiàng)工作中使用的表達(dá)盒和載體的構(gòu)建。這項(xiàng)工作中的所有編碼序列都對(duì)于在煙草中的表達(dá)進(jìn)行最優(yōu)化,并與所需側(cè)翼區(qū)(SEQ ID NO1、4、7、12、14、16、18、20、22)一起進(jìn)行化學(xué)合成。
圖1a-編碼與液泡信號(hào)或質(zhì)外體信號(hào)(由SEQ IDNO7編碼)融合的、或不含信號(hào)的Col1和Col2的合成基因(SEQ ID1、4)在由菊花rbcS1啟動(dòng)子和5′UTR(SEQ ID NO10)以及菊花rbcS1 3′UTR和終止子(SEQ ID NO11)組成的表達(dá)盒中進(jìn)行克隆。將完整的表達(dá)盒克隆到pBINPLUS植物轉(zhuǎn)化載體的多克隆位點(diǎn)中(van Engelen等人,1995,Transgenic Res 4288-290)。
圖1b-編碼與液泡信號(hào)或質(zhì)外體信號(hào)(由SEQ ID NO7編碼)融合的、或不含信號(hào)的P4Hβ-人、P4Hα-人和P4H-植物(SEQ ID NO12、14和16)的合成基因在由載體pJD330攜帶的CaMV 35S啟動(dòng)子和TMVω序列和土壤桿菌屬胭脂堿合成酶(NOS)終止子組成的表達(dá)盒中進(jìn)行克隆(Galili等人,1987,Nucleic Acids Res 153257-3273)。將完整的表達(dá)盒克隆到攜帶Col1或Col2表達(dá)盒的pBINPLUS載體的多克隆位點(diǎn)中。
圖1c-編碼與液泡信號(hào)或質(zhì)外體信號(hào)(由SEQ ID NO7編碼)融合的蛋白酶C和蛋白酶N(SEQ ID NO18、20)的合成基因在由菊花rbcS1啟動(dòng)子和5′UTR(SEQ ID NO10)以及菊花rbcS13′UTR和終止子(SEQ ID NO11)組成的表達(dá)盒中進(jìn)行克隆。將完整的表達(dá)盒克隆到pBINPLUS植物轉(zhuǎn)化載體的多克隆位點(diǎn)中。
圖1d-編碼與液泡信號(hào)或質(zhì)外體信號(hào)(由SEQ ID NO7編碼)融合的、或不含信號(hào)的、具有側(cè)翼的草莓鑲脈病毒(SVBV)啟動(dòng)子(NCBI編號(hào)AF331666REGION623..950版本AF331666.1GI13345788)并由土壤桿菌屬章魚堿(octopin)合酶(OCS)終止子(NCBI編號(hào)Z37515REGION1344..1538版本Z37515.1GI886843)終止的LH3的合成基因(SEQ ID NO22)在攜帶Col1和P4Hβ表達(dá)盒的pBINPLUS載體的多克隆位點(diǎn)中進(jìn)行克隆。
在圖2中舉例說明了利用
圖1中描述的表達(dá)盒進(jìn)入宿主植物的共轉(zhuǎn)化方案。每個(gè)表達(dá)盒插入片段由編碼序列的短名表示。編碼序列和相關(guān)的SEQ ID NO描述于表1中。每次共轉(zhuǎn)化由2個(gè)pBINPLUS二元載體來進(jìn)行。每個(gè)長(zhǎng)方形表示攜帶1、2或3個(gè)表達(dá)盒的單個(gè)pBINPLUS載體。啟動(dòng)子和終止子在
圖1中詳細(xì)說明。
實(shí)施例2植物膠原表達(dá)下表1中列出的編碼蛋白質(zhì)的合成的多核苷酸序列對(duì)于在煙草植物中的表達(dá)進(jìn)行設(shè)計(jì)和最優(yōu)化。
表1-表達(dá)的蛋白質(zhì)的列表
信號(hào)肽(i)用于巰基蛋白酶aleurain前體(NCBI編號(hào)P05167GI113603)的大麥基因的液泡信號(hào)序列MAHARVLLLALAVLATAAVAVASSSSFADSNPIRPVTDRAASTLA(SEQ IDNO24)。
(ii)鼠耳芥(Arabidopsis thaliana)內(nèi)切-1,4-β-葡聚糖酶的質(zhì)外體信號(hào)(Cell,NCBI編號(hào)CAA67156.1GI2440033);SEQ ID NO.9,由SEQ ID NO.7編碼。
質(zhì)粒的構(gòu)建如實(shí)施例1所教導(dǎo)的構(gòu)建植物表達(dá)載體,每種被構(gòu)建的表達(dá)載體的組成經(jīng)由限制酶切分析和測(cè)序進(jìn)行確認(rèn)。
構(gòu)建包括下列表達(dá)盒的表達(dá)載體1.膠原α12.膠原α1+人P4Hβ亞基3.膠原α1+人P4Hβ亞基+人LH34.膠原α25.膠原α2+人P4Hα亞基6.膠原α2+鼠耳芥P4H7.人P4Hβ亞基+人LH38.人P4Hα亞基上述編碼序列中的每一種都與液泡轉(zhuǎn)運(yùn)肽或質(zhì)外體轉(zhuǎn)運(yùn)肽翻譯地融合,或在其中預(yù)期細(xì)胞質(zhì)積聚的情況下,缺乏任何轉(zhuǎn)運(yùn)肽序列。
植物轉(zhuǎn)化和PCR篩選煙草植物(煙草(Nicotiana tabacum),Samsun NN)根據(jù)圖2中教導(dǎo)的轉(zhuǎn)化方案由上述表達(dá)載體進(jìn)行轉(zhuǎn)化。
所得的轉(zhuǎn)基因植物經(jīng)由多重PCR利用4種引物進(jìn)行篩選,所述引物被設(shè)計(jì)為能夠擴(kuò)增膠原α1的324bp片段和膠原α2的537bp片段(表2)。圖3舉例說明了多重PCR篩選的結(jié)果。
表2-用于擴(kuò)增膠原α1的324bp片段和膠原α2的537bp片段的多重PCR的引物列表
實(shí)施例3在轉(zhuǎn)基因煙草植物中的人膠原的檢測(cè)通過在0.5ml 50mM Tris-HCl pH=7.5中與“完整的”蛋白酶抑制劑混合物(來自Roche Diagnostics GmbH的產(chǎn)品#1836145,1片劑/50ml緩沖液)一起磨碎500mg葉子,從煙草轉(zhuǎn)化體2、3和4中提取總可溶性蛋白。粗提取物與250μl包含10%β-巰基乙醇和8%SDS的4×樣品應(yīng)用緩沖液混合,將樣品煮沸7分鐘并在13000rpm下離心8分鐘。將20μl上清液加載到10%聚丙烯酰胺凝膠中并在標(biāo)準(zhǔn)蛋白質(zhì)印跡程序中用抗-膠原I(變性的)抗體(來自Chemicon Inc.的#AB745)進(jìn)行測(cè)試(圖4)。W.T.是野生型煙草。在對(duì)于I型膠原α1或α2或二者PCR陽(yáng)性的植物中可見陽(yáng)性膠原條帶。來自人胎盤的500ng I型膠原(來自Chemicon Inc.的#CC050)的陽(yáng)性對(duì)照條帶代表來自轉(zhuǎn)基因植物的樣品中的約0.3%總可溶性蛋白(約150μg)。
當(dāng)膠原靶向液泡時(shí),檢測(cè)到表達(dá)預(yù)期分子量的、最高達(dá)~1%總可溶性蛋白的膠原的植物(圖4)。成功地實(shí)現(xiàn)了全長(zhǎng)膠原亞細(xì)胞靶向質(zhì)外體(圖5)。在細(xì)胞質(zhì)中表達(dá)膠原(即沒有靶向肽)的植物沒有將膠原積聚至可檢測(cè)的水平,從而顯示在植物中的膠原亞細(xì)胞靶向作用對(duì)于成功是關(guān)鍵的。
此外,與顯示對(duì)缺少N-前肽的膠原實(shí)施重要的蛋白質(zhì)水解作用的Ruggiero等人2000和Merle等人2002研究相反,使用本方法,含有C-前肽和N-前肽的全長(zhǎng)膠原蛋白質(zhì)以高水平積聚在亞細(xì)胞區(qū)室中。
現(xiàn)在的數(shù)據(jù)還清晰地顯示各自表達(dá)不同膠原鏈類型的2種植物雜交是有利的,因?yàn)樗沟媚軌蜻x擇表達(dá)最佳水平的每種鏈類型的植物和后續(xù)的植物雜交,以獲得所需生產(chǎn)膠原的植物。
由本發(fā)明的植物生產(chǎn)的膠原包括天然的前肽,并因此預(yù)期形成比通過蛋白質(zhì)水解純化的人對(duì)照大的蛋白質(zhì)。計(jì)算出的不含羥基化或糖基化的膠原α1和α2鏈分子量如下含有前肽的Col1-136kDa,不含前肽的Col1-95kDa、含有前肽的Col2-127kDa、不含前肽的Col2-92kDa。
如圖4中可見的,轉(zhuǎn)化體3-5和3-49中的Col1條帶看起來比其他植物中的Col1條帶大。這提示膠原鏈中通過由α和β亞基組成的人脯氨酸4-羥化酶全酶進(jìn)行脯氨酸羥基化,所述α和β亞基在這些植物中共表達(dá)并靶向與人膠原鏈相同的亞細(xì)胞區(qū)室(例如液泡)。
實(shí)施例4在轉(zhuǎn)基因植物中的膠原三股螺旋裝配和熱穩(wěn)定性通過轉(zhuǎn)基因植物的總粗蛋白提取物的熱變性、隨后為胰蛋白酶或胃蛋白酶消化,來測(cè)試在轉(zhuǎn)基因植物中的膠原三股螺旋的裝配和螺旋的熱穩(wěn)定性(圖6a-b)。
在第一個(gè)實(shí)驗(yàn)中,來自煙草2-9(只表達(dá)膠原α1,且不表達(dá)P4H)和3-5(表達(dá)膠原α1+2和P4H)的總可溶性蛋白通過下列操作提取在0.5ml 50mM Tris-HCl pH=7.5中磨碎500mg葉子,在13000rpm下離心10分鐘,并收集上清液。對(duì)50μl上清液實(shí)施熱處理(于33℃或43℃15分鐘),并隨后立即置于冰上。通過向每種樣品加入6μl溶于50mM Tris-HCl pH=7.5的1mg/ml胰蛋白酶開始胰蛋白酶消化。樣品在室溫(約22℃)下溫育20分鐘。通過加入20μl包含10%β巰基乙醇和8%SDS的4×樣品應(yīng)用緩沖液來終止消化,將樣品煮沸7分鐘并在13000rpm下離心7分鐘。將50μl上清液加載到10%聚丙烯酰胺凝膠上并利用標(biāo)準(zhǔn)蛋白質(zhì)印跡程序經(jīng)由抗-膠原I抗體(來自Chemicon Inc.的#AB745)進(jìn)行測(cè)試。陽(yáng)性對(duì)照是~500ng人膠原I樣品(來自Chemicon Inc.的#CC050,通過胃蛋白酶消化從人胎盤中提取),將其加入從野生型煙草中提取的50μl總可溶性蛋白中。
如圖6a中所示,在植物#3-5中形成的膠原三股螺旋以及對(duì)照人膠原在33℃對(duì)變性有抗性。相反,由植物#2-9形成的膠原在33℃變性。這種熱穩(wěn)定性方面的差異提示在轉(zhuǎn)化體#3-5中的成功的三股螺旋裝配和翻譯后的脯氨酸羥基化,所述轉(zhuǎn)化體#3-5表達(dá)膠原α1和膠原α2以及P4Hβ和α亞基。
轉(zhuǎn)化體#2-9中的2個(gè)條帶可以表示二聚體或三聚體,它們?cè)谂cSDS和巰基乙醇一起煮沸7分鐘后是穩(wěn)定的。類似的條帶在人膠原(上面的圖)和轉(zhuǎn)化體#3-5中可見??赡艿慕忉屖遣煌陕菪械?種肽之間的共價(jià)鍵(交聯(lián)),所述共價(jià)鍵在2個(gè)賴氨酸通過賴氨酸氧化酶氧化脫氨后形成。
在第二個(gè)實(shí)驗(yàn)中,來自轉(zhuǎn)基因煙草13-6(表達(dá)膠原Iα1和α2鏈-由箭標(biāo)指出,人P4Hα和β亞基以及人LH3)的總可溶性蛋白通過下列操作提取在0.5ml 100mM Tris-HCl pH=7.5和300mM NaCl中磨碎500mg葉子,在10000rpm下離心7分鐘,并收集上清液。對(duì)50μl上清液實(shí)施熱處理(于33℃、38℃或42℃20分鐘),并隨后立即置于冰上。通過向每種樣品加入溶于10mM乙酸的4.5μl 0.1M HCl和4μl 2.5mg/ml胃蛋白酶開始胃蛋白酶消化。樣品在室溫(約22℃)下溫育30分鐘。通過加入5μl無緩沖的1M Tris來終止消化。每種樣品與22μl包含10%β巰基乙醇和8%SDS的4×樣品應(yīng)用緩沖液混合,煮沸7分鐘并在13000rpm下離心7分鐘。將40μl上清液加載到10%聚丙烯酰胺凝膠上并在標(biāo)準(zhǔn)蛋白質(zhì)印跡程序中用抗-膠原I抗體(來自Chemicon Inc.的#AB745)進(jìn)行測(cè)試。陽(yáng)性對(duì)照是加入從野生型煙草中提取的總可溶性蛋白中的~50ng人膠原I(來自Chemicon Inc.的#CC050,通過胃蛋白酶消化從人胎盤中提取)。
如圖6b中舉例說明的,在植物#13-6中形成的膠原三股螺旋在42℃對(duì)變性有抗性。前肽的切割首先在33℃可見,并且當(dāng)溫度升至38℃并再升至42℃時(shí)效力逐漸增加。被切割的膠原三股螺旋結(jié)構(gòu)域在凝膠上顯示出的遷移與胃蛋白酶處理的人膠原的遷移相似。在這個(gè)實(shí)驗(yàn)中使用的人膠原通過胃蛋白酶的蛋白水解作用從人胎盤中提取出來,并且因此缺少前肽和某些端肽。
實(shí)施例5植物P4H表達(dá)天然的植物P4H的誘導(dǎo)煙草P4H cDNA被克隆并用作探針以測(cè)定將誘導(dǎo)內(nèi)源性P4H表達(dá)的條件和處理。RNA印跡分析(圖7)清晰地顯示,P4H以相對(duì)高的水平表達(dá)于苗端并以低水平表達(dá)于葉中。P4H水平在磨損處理(在下面的圖中的“創(chuàng)傷”)后4小時(shí)在葉中被顯著誘導(dǎo)。利用其他應(yīng)激條件達(dá)到類似結(jié)果(未顯示)。
轉(zhuǎn)基因煙草植物中入P4Hα和β亞基以及膠原α1和α2鏈的檢測(cè)使用抗人P4Hα亞基抗體(來自ICN Biomedicals Inc.的#63-163)、抗人P4Hβ亞基抗體(來自Chemicon Inc.的#MAB2701)和抗膠原I抗體(來自Chemicon Inc.的#AB745)實(shí)現(xiàn)轉(zhuǎn)基因煙草植物中人P4Hα和β亞基以及I型膠原α1和α2鏈的檢測(cè)。用這些抗體探測(cè)的蛋白質(zhì)印跡結(jié)果顯示于圖8中。
在植物13-6(還轉(zhuǎn)化有人LH3)中確認(rèn)P4Hα、P4Hβ和膠原Iα1和α2條帶的表達(dá)。計(jì)算出的包括液泡信號(hào)肽的P4Hα和β的分子量分別為65.5kDa和53.4kDa。計(jì)算出的含有前肽、不含羥基化或糖基化的膠原α1和α2鏈的分子量分別為136kDa和127kDa。
應(yīng)當(dāng)理解本發(fā)明的某些特征還可與單個(gè)實(shí)施方案組合提供,所述特征為了清晰起見在分開的實(shí)施方案的背景中進(jìn)行描述。相反地,本發(fā)明的各種特征還可分開或以任何適當(dāng)?shù)膩喗M合提供,所述特征為了簡(jiǎn)短起見在單個(gè)實(shí)施方案的背景中進(jìn)行描述。
盡管本發(fā)明已結(jié)合其具體實(shí)施方案進(jìn)行了描述,但明顯的是,多種替代方案、修飾和改變對(duì)于本領(lǐng)域技術(shù)人員將是顯而易見的。因此,它預(yù)期包含落在附加權(quán)利要求的精神和廣泛范圍內(nèi)的所有此類替代方案、修飾和改變。本說明書中提到的所有公開出版物、專利和專利申請(qǐng)以及GenBank編號(hào)都整體引入本說明書作為參考,其程度相當(dāng)于每個(gè)單獨(dú)的公開出版物、專利或?qū)@暾?qǐng)或GenBank編號(hào)被具體地和單獨(dú)地說明引入本文作為參考。此外,本申請(qǐng)中的任何參考文獻(xiàn)的引用或鑒定不應(yīng)被解釋為承認(rèn)此類參考文獻(xiàn)可作為本發(fā)明的現(xiàn)有技術(shù)。
參考文獻(xiàn)(其他參考文獻(xiàn)在文件中引用)1.Bulleid NJ,John DC,Kadler KE.Recombinant expression systems for theproduction of collagen.Biochem Soc Trans.2000;28(4)350-3.Review.PMID10961917[PubMed-indexed for MEDLINE]2.Hare PD,Cress WA.Metabolic implications of stress-induced prolineaccumulation in plants.Plant Growth Regulation 1997;2179-102.
3.Hieta R,Myllyharju J.Cloning and characterization of a low molecularweight prolyl 4-hydroxylase from Arabidopsis thaliana.Effective hydroxylation ofproline-rich,collagen-like,and hypoxia-inducible transcription factor alpha-likepeptides.J Biol Chem.2002 Jun 28;277(26)23965-71.Epub 2002 Apr 25.PMID11976332[PubMed-indexed for MEDLINE]4.Hulmes DJ.Building collagen molecules,fibrils,and suprafibrillar structures.J Struct Biol.2002 Jan-Feb;137(1-2)2-10.Review.PMID12064927[PubMed-indexed for MEDLINE]5.Inkinen K.Connective tissue formation in wound healing.An experimentalstudy.Academic Dissertation,September 2003.University of Helsinki,F(xiàn)aculty ofScience,Department of Biosciences,Division of Biochemistry(ISBN 952-10-1313-3)http://ethesis.helsinki.fi/julkaisut/mat/bioti/vk/inkinen/6.Merle C,Perret S,Lacour T,Jonval V,Hudaverdian S,Garrone R,RuggieroF,Theisen M.Hydroxylated human homotrimeric collagen I in Agrobacteriumtumefaciens-mediated transient expression and in transgenic tobacco plant.FEBSLett.2002 Mar 27;515(1-3)114-8.PMID11943205[PubMed-indexed forMEDLINE]7.Olsen D,Yang C,Bodo M,Chang R,Leigh S,Baez J,Carmichael D,PeralaM,Hamalainen ER,Jarvinen M,Polarek J.Recombinant collagen and gelatin for drugdelivery.Adv Drug Deliv Rev.2003 Nov 28;55(12)1547-67.PMID14623401[PubMed-in process]8.Ruggiero F,Exposito JY,Boumat P,Gruber V,Perret S,Comte J,Olagnier B,Garrone R,Theisen M.Triple helix assembly and processing of human collagen produced in transgenictobacco plants.FEBS Lett.2000 Mar 3;469(1)132-6.PMID10708770[PubMed-indexed for MEDLINE]9.Tanaka M,Sato K,Uchida T.Plant prolyl hydroxylase recognizes poly(L-proline)II helix.J Biol Chem.1981 Nov 25;256(22)11397-400.PMID6271746[PubMed-indexed for MEDLINE]10.Wang C,Luosujarvi H,Heikkinen J,Risteli M,Uitto L,Myllyla R.The thirdactivity for lysyl hydroxylase 3galactosylation of hydroxylysyl residues in collagensin vitro.Matrix Biol.2002 Nov;21(7)559-66.PMID12475640[PubMed-indexedfor MEDLINE]
序列表<110>CollPlant Ltd.
<120>生產(chǎn)膠原的植物及其生成和使用方法<130>CPCH0761218P<160>28<170>PatentIn version 3.3<210>1<211>4662<212>DNA<213>人工序列<220>
<223>含有與人膠原α1(I)鏈融合的大麥巰基蛋白酶aleurain前體基因的維管信號(hào)序列編碼區(qū)和側(cè)翼區(qū)的合成序列<400>1gcgatgcatg taatgtcatg agccacatga tccaatggcc acaggaacgt aagaatgtag60atagatttga ttttgtccgt tagatagcaa acaacattat aaaaggtgtg tatcaatacg120aactaattca ctcattggat tcatagaagt ccattcctcc taagtatcta aaccatggct180cacgctcgtg ttctcctcct cgctctcgct gttttggcaa cagctgctgt ggctgtggct240tctagttctt cttttgctga ttcaaaccct attagacctg ttactgatag agcagcttcc300actttggctc aattgcaaga ggagggccag gttgagggcc aagatgagga tatccctcca360attacatgcg tgcaaaatgg cttgcgttac cacgataggg atgtgtggaa acctgaacct420tgtcgtatct gtgtgtgtga taacggcaag gtgctctgcg atgatgttat ctgcgatgag480acaaaaaatt gccctggcgc tgaagttcct gagggcgagt gttgccctgt gtgccctgat540ggttccgagt ccccaactga tcaggaaact actggcgtgg agggcccaaa aggagatact600ggtccacgtg gtcctagggg tccagcaggt cctccaggta gagatggtat tccaggccag660
cctggattgc caggaccacc aggcccacct ggcccaccag gacctcctgg tcttggtgga720aatttcgctc cacaactctc ttatggctat gatgagaagt caacaggtgg tatttccgtt780ccaggtccta tgggaccatc cggaccaaga ggtctcccag gtcctccagg tgctcctgga840cctcaaggct ttcaaggacc tccaggcgaa ccaggagaac caggcgcttc tggaccaatg900ggcccaaggg gaccacctgg cccaccagga aaaaatggcg atgatggcga agctggaaag960cctggtcgtc ctggagagag aggtcctcct ggcccacagg gtgcaagagg cttgccagga1020actgctggct tgcctggaat gaagggacat aggggcttct ccggcctcga tggcgctaag1080ggtgatgctg gccctgctgg accaaagggc gagccaggtt cccctggaga aaacggtgct1140cctggacaaa tgggtcctcg tggacttcca ggagaaaggg gtcgtccagg cgctccagga1200ccagcaggtg ctaggggaaa cgatggtgca acaggcgctg ctggccctcc tggcccaact1260ggtcctgctg gccctccagg attcccaggc gcagttggag ctaaaggaga agcaggacca1320cagggcccta ggggttctga aggacctcag ggtgttagag gtgaaccagg tcctccaggc1380ccagctggag cagctggtcc agcaggaaat ccaggtgctg atggtcaacc tggagctaag1440ggcgctaatg gcgcaccagg tatcgcaggc gcaccaggtt ttcctggcgc tagaggccca1500agtggtcctc aaggaccagg tggaccacca ggtccaaaag gcaattctgg cgaacctggc1560gctccaggtt ctaaaggaga tactggtgct aaaggcgaac caggacctgt tggtgttcag1620ggtcctcctg gtcctgctgg agaagaagga aaaagaggtg ctcgtggaga accaggacca1680actggacttc ctggacctcc tggtgaacgt ggcggacctg gctcaagggg tttccctgga1740gctgatggag tggcaggtcc aaaaggccct gctggagaga gaggttcacc aggtccagct1800ggtcctaagg gctcccctgg tgaagcaggt agaccaggcg aagcaggatt gccaggcgca1860aagggattga caggctctcc tggtagtcct ggcccagatg gaaaaacagg cccaccaggt1920ccagcaggac aagatggacg tccaggccca ccaggtcctc ctggagcaag gggacaagct1980
ggcgttatgg gttttccagg acctaaaggt gctgctggag agccaggaaa ggcaggtgaa2040agaggagttc ctggtccacc aggagcagtg ggtcctgctg gcaaagatgg tgaagctgga2100gcacagggcc ctccaggccc tgctggccca gctggcgaac gtggagaaca aggcccagct2160ggtagtccag gatttcaagg attgcctggc cctgctggcc ctccaggaga agcaggaaaa2220cctggagaac aaggagttcc tggtgatttg ggagcacctg gaccttcagg agcacgtggt2280gaaagaggct tccctggcga gaggggtgtt caaggtccac caggtccagc aggacctaga2340ggtgctaatg gcgctcctgg caacgatgga gcaaaaggtg atgctggtgc tcctggcgca2400cctggaagtc agggtgctcc tggattgcaa ggaatgcctg gagagagggg tgctgctggc2460ttgccaggcc caaagggcga taggggtgat gctggaccaa aaggtgctga tggatcccca2520ggaaaagatg gagttcgtgg tcttactggc ccaatcggac ctccaggccc tgctggcgct2580ccaggtgata agggcgaaag tggcccaagt ggacctgctg gacctactgg tgctagaggt2640gcacctggtg ataggggtga acctggacca cctggtccag ctggttttgc tggtcctcct2700ggagctgatg gacaacctgg cgcaaagggt gaaccaggtg atgctggcgc aaagggagat2760gctggtccac ctggacctgc tggtccagca ggcccccctg ggccaatcgg taatgttgga2820gcaccaggtg ctaagggagc taggggttcc gctggtccac ctggagcaac aggatttcca2880ggcgctgctg gtagagttgg cccaccaggc ccatccggaa acgcaggccc tcctggtcct2940ccaggtcctg ctggcaagga gggtggcaaa ggaccaaggg gcgaaactgg ccctgctggt3000agacctggcg aagttggccc tcctggacca ccaggtccag caggagaaaa aggttcccca3060ggagctgatg gcccagctgg tgctccagga actccaggcc ctcaaggtat tgctggacag3120agaggcgttg tgggactccc tggtcaaagg ggagagagag gatttccagg cttgccagga3180cctagtggag aacctggaaa acaaggccca tcaggcgcta gtggagagcg tggacctcct3240ggccctatgg gacctcctgg attggctggc ccacctggcg aatcaggtcg tgaaggcgca3300
ccaggcgcag aaggatcacc tggaagagat ggatcccctg gtgctaaagg cgatcgtgga3360gaaactggtc cagcaggccc accaggcgca ccaggtgcac ctggcgctcc aggacctgtg3420ggaccagctg gaaaatccgg agataggggc gagacaggcc cagcaggacc agctggacct3480gttggccctg ctggcgctcg tggaccagca ggacctcaag gaccaagggg agataaggga3540gaaacaggcg aacaaggcga taggggcatt aagggtcata ggggttttag tggcctccag3600ggtcctcctg gcccacctgg atcaccagga gaacagggac catctggtgc ttccggccca3660gctggtccaa gaggacctcc aggatcagct ggtgcacctg gaaaagatgg tcttaacggt3720ctcccaggac caatcggccc tccaggacct agaggaagaa caggagatgc tggccctgtt3780ggccctccag gacctcctgg tccaccaggt ccacctggtc ctccatcagc tggattcgat3840ttttcatttc ttccacagcc accacaagag aaagctcacg atggcggcag atattaccgt3900gctgatgatg ctaacgttgt tagggataga gatttggaag tggatacaac tttgaaatcc3960ctctcccagc aaattgaaaa cattagatct ccagaaggtt cacgtaaaaa cccagctaga4020acatgtcgtg atttgaaaat gtgtcactcc gattggaaaa gtggtgaata ctggattgat4080ccaaatcagg gctgtaatct cgatgctatc aaagttttct gtaacatgga aacaggcgaa4140acatgcgttt atcctactca accttccgtg gctcagaaaa attggtacat ctcaaaaaat4200cctaaagata agaggcacgt ttggttcggt gaaagtatga ctgatggatt tcaatttgag4260tacggcggtc aaggtagtga tccagctgat gtggctattc aactcacatt tttgcgtctt4320atgtccacag aggcatcaca aaacatcact taccactgca aaaacagtgt ggcttatatg4380gatcaacaaa caggaaacct taagaaggct cttcttttga agggctcaaa cgagattgag4440attagagcag agggcaactc aaggtttact tattcagtta ctgttgatgg ctgcacttca4500catactggcg cttggggtaa aacagttatc gagtataaga ctacaaaaac atcaagactc4560ccaatcattg atgttgctcc tctcgatgtt ggcgctcctg atcaagagtt cggttttgat4620
gtgggcccag tttgtttcct ctaatgagct cgcggccgca tc 4662<210>2<211>4662<212>DNA<213>人工序列<220>
<223>與人膠原α1(I)鏈融合的大麥巰基蛋白酶aleurain前體基因的維管信號(hào)序列和側(cè)翼區(qū)的合成序列<220>
<221>CDS<222>(175)..(4644)<400>2gcgatgcatg taatgtcatg agccacatga tccaatggcc acaggaacgt aagaatgtag 60atagatttga ttttgtccgt tagatagcaa acaacattat aaaaggtgtg tatcaatacg 120aactaattca ctcattggat tcatagaagt ccattcctcc taagtatcta aacc atg 177Met1gct cac gct cgt gtt ctc ctc ctc gct ctc gct gtt ttg gca aca gct 225Ala His Ala Arg Val Leu Leu Leu Ala Leu Ala Val Leu Ala Thr Ala5 10 15gct gtg gct gtg gct tct agt tct tct ttt gct gat tca aac cct att 273Ala Val Ala Val Ala Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro Ile20 25 30aga cct gtt act gat aga gca gct tcc act ttg gct caa ttg caa gag 321Arg Pro Val Thr Asp Arg Ala Ala Ser Thr Leu Ala Gln Leu Gln Glu35 40 45gag ggc cag gtt gag ggc caa gat gag gat atc cct cca att aca tgc 369Glu Gly Gln Val Glu Gly Gln Asp Glu Asp Ile Pro Pro Ile Thr Cys50 55 60 65gtg caa aat ggc ttg cgt tac cac gat agg gat gtg tgg aaa cct gaa 417Val Gln Asn Gly Leu Arg Tyr His Asp Arg Asp Val Trp Lys Pro Glu
70 75 80cct tgt cgt atc tgt gtg tgt gat aac ggc aag gtg ctc tgc gat gat465Pro Cys Arg Ile Cys Val Cys Asp Asn Gly Lys Val Leu Cys Asp Asp85 90 95gtt atc tgc gat gag aca aaa aat tgc cct ggc gct gaa gtt cct gag513Val Ile Cys Asp Glu Thr Lys Asn Cys Pro Gly Ala Glu Val Pro Glu100 105 110ggc gag tgt tgc cct gtg tgc cct gat ggt tcc gag tcc cca act gat561Gly Glu Cys Cys Pro Val Cys Pro Asp Gly Ser Glu Ser Pro Thr Asp115 120 125cag gaa act act ggc gtg gag ggc cca aaa gga gat act ggt cca cgt609Gln Glu Thr Thr Gly Val Glu Gly Pro Lys Gly Asp Thr Gly Pro Arg130 135 140 145ggt cct agg ggt cca gca ggt cct cca ggt aga gat ggt att cca ggc657Gly Pro Arg Gly Pro Ala Gly Pro Pro Gly Arg Asp Gly Ile Pro Gly150 155 160cag cct gga ttg cca gga cca cca ggc cca cct ggc cca cca gga cct705Gln Pro Gly Leu Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro165 170 175cct ggt ctt ggt gga aat ttc gct cca caa ctc tct tat ggc tat gat753Pro Gly Leu Gly Gly Asn Phe Ala Pro Gln Leu Ser Tyr Gly Tyr Asp180 185 190gag aag tca aca ggt ggt att tcc gtt cca ggt cct atg gga cca tcc801Glu Lys Ser Thr Gly Gly Ile Ser Val Pro Gly Pro Met Gly Pro Ser195 200 205gga cca aga ggt ctc cca ggt cct cca ggt gct cct gga cct caa ggc849Gly Pro Arg Gly Leu Pro Gly Pro Pro Gly Ala Pro Gly Pro Gln Gly210 215 220 225ttt caa gga cct cca ggc gaa cca gga gaa cca ggc gct tct gga cca897Phe Gln Gly Pro Pro Gly Glu Pro Gly Glu Pro Gly Ala Ser Gly Pro230 235 240atg ggc cca agg gga cca cct ggc cca cca gga aaa aat ggc gat gat945Met Gly Pro Arg Gly Pro Pro Gly Pro Pro Gly Lys Asn Gly Asp Asp
245 250 255ggc gaa gct gga aag cct ggt cgt cct gga gag aga ggt cct cct ggc 993Gly Glu Ala Gly Lys Pro Gly Arg Pro Gly Glu Arg Gly Pro Pro Gly260 265 270cca cag ggt gca aga ggc ttg cca gga act gct ggc ttg cct gga atg1041Pro Gln Gly Ala Arg Gly Leu Pro Gly Thr Ala Gly Leu Pro Gly Met275 280 285aag gga cat agg ggc ttc tcc ggc ctc gat ggc gct aag ggt gat gct1089Lys Gly His Arg Gly Phe Ser Gly Leu Asp Gly Ala Lys Gly Asp Ala290 295 300 305ggc cct gct gga cca aag ggc gag cca ggt tcc cct gga gaa aac ggt1137Gly Pro Ala Gly Pro Lys Gly Glu Pro Gly Ser Pro Gly Glu Asn Gly310 315 320gct cct gga caa atg ggt cct cgt gga ctt cca gga gaa agg ggt cgt1185Ala Pro Gly Gln Met Gly Pro Arg Gly Leu Pro Gly Glu Arg Gly Arg325 330 335cca ggc gct cca gga cca gca ggt gct agg gga aac gat ggt gca aca1233Pro Gly Ala Pro Gly Pro Ala Gly Ala Arg Gly Asn Asp Gly Ala Thr340 345 350ggc gct gct ggc cct cct ggc cca act ggt cct gct ggc cct cca gga1281Gly Ala Ala Gly Pro Pro Gly Pro Thr Gly Pro Ala Gly Pro Pro Gly355 360 365ttc cca ggc gca gtt gga gct aaa gga gaa gca gga cca cag ggc cct1329Phe Pro Gly Ala Val Gly Ala Lys Gly Glu Ala Gly Pro Gln Gly Pro370 375 380 385agg ggt tct gaa gga cct cag ggt gtt aga ggt gaa cca ggt cct cca1377Arg Gly Ser Glu Gly Pro Gln Gly Val Arg Gly Glu Pro Gly Pro Pro390 395 400ggc cca gct gga gca gct ggt cca gca gga aat cca ggt gct gat ggt1425Gly Pro Ala Gly Ala Ala Gly Pro Ala Gly Asn Pro Gly Ala Asp Gly405 410 415caa cct gga gct aag ggc gct aat ggc gca cca ggt atc gca ggc gca1473Gln Pro Gly Ala Lys Gly Ala Asn Gly Ala Pro Gly Ile Ala Gly Ala
420 425 430cca ggt ttt cct ggc gct aga ggc cca agt ggt cct caa gga cca ggt1521Pro Gly Phe Pro Gly Ala Arg Gly Pro Ser Gly Pro Gln Gly Pro Gly435 440 445gga cca cca ggt cca aaa ggc aat tct ggc gaa cct ggc gct cca ggt1569Gly Pro Pro Gly Pro Lys Gly Asn Ser Gly Glu Pro Gly Ala Pro Gly450 455 460 465tct aaa gga gat act ggt gct aaa ggc gaa cca gga cct gtt ggt gtt1617Ser Lys Gly Asp Thr Gly Ala Lys Gly Glu Pro Gly Pro Val Gly Val470 475 480cag ggt cct cct ggt cct gct gga gaa gaa gga aaa aga ggt gct cgt1665Gln Gly Pro Pro Gly Pro Ala Gly Glu Glu Gly Lys Arg Gly Ala Arg485 490 495gga gaa cca gga cca act gga ctt cct gga cct cct ggt gaa cgt ggc1713Gly Glu Pro Gly Pro Thr Gly Leu Pro Gly Pro Pro Gly Glu Arg Gly500 505 510gga cct ggc tca agg ggt ttc cct gga gct gat gga gtg gca ggt cca1761Gly Pro Gly Ser Arg Gly Phe Pro Gly Ala Asp Gly Val Ala Gly Pro515 520 525aaa ggc cct gct gga gag aga ggt tca cca ggt cca gct ggt cct aag1809Lys Gly Pro Ala Gly Glu Arg Gly Ser Pro Gly Pro Ala Gly Pro Lys530 535 540 545ggc tcc cct ggt gaa gca ggt aga cca ggc gaa gca gga ttg cca ggc1857Gly Ser Pro Gly Glu Ala Gly Arg Pro Gly Glu Ala Gly Leu Pro Gly550 555 560gca aag gga ttg aca ggc tct cct ggt agt cct ggc cca gat gga aaa1905Ala Lys Gly Leu Thr Gly Ser Pro Gly Ser Pro Gly Pro Asp Gly Lys565 570 575aca ggc cca cca ggt cca gca gga caa gat gga cgt cca ggc cca cca1953Thr Gly Pro Pro Gly Pro Ala Gly Gln Asp Gly Arg Pro Gly Pro Pro580 585 590ggt cct cct gga gca agg gga caa gct ggc gtt atg ggt ttt cca gga2001Gly Pro Pro Gly Ala Arg Gly Gln Ala Gly Val Met Gly Phe Pro Gly
595 600 605cct aaa ggt gct gct gga gag cca gga aag gca ggt gaa aga gga gtt2049Pro Lys Gly Ala Ala Gly Glu Pro Gly Lys Ala Gly Glu Arg Gly Val610 615 620 625cct ggt cca cca gga gca gtg ggt cct gct ggc aaa gat ggt gaa gct2097Pro Gly Pro Pro Gly Ala Val Gly Pro Ala Gly Lys Asp Gly Glu Ala630 635 640gga gca cag ggc cct cca ggc cct gct ggc cca gct ggc gaa cgt gga2145Gly Ala Gln Gly Pro Pro Gly Pro Ala Gly Pro Ala Gly Glu Arg Gly645 650 655gaa caa ggc cca gct ggt agt cca gga ttt caa gga ttg cct ggc cct2193Glu Gln Gly Pro Ala Gly Ser Pro Gly Phe Gln Gly Leu Pro Gly Pro660 665 670gct ggc cct cca gga gaa gca gga aaa cct gga gaa caa gga gtt cct2241Ala Gly Pro Pro Gly Glu Ala Gly Lys Pro Gly Glu Gln Gly Val Pro675 680 685ggt gat ttg gga gca cct gga cct tca gga gca cgt ggt gaa aga ggc2289Gly Asp Leu Gly Ala Pro Gly Pro Ser Gly Ala Arg Gly Glu Arg Gly690 695 700 705ttc cct ggc gag agg ggt gtt caa ggt cca cca ggt cca gca gga cct2337Phe Pro Gly Glu Arg Gly Val Gln Gly Pro Pro Gly Pro Ala Gly Pro710 715 720aga ggt gct aat ggc gct cct ggc aac gat gga gca aaa ggt gat gct2385Arg Gly Ala Asn Gly Ala Pro Gly Asn Asp Gly Ala Lys Gly Asp Ala725 730 735ggt gct cct ggc gca cct gga agt cag ggt gct cct gga ttg caa gga2433Gly Ala Pro Gly Ala Pro Gly Ser Gln Gly Ala Pro Gly Leu Gln Gly740 745 750atg cct gga gag agg ggt gct gct ggc ttg cca ggc cca aag ggc gat2481Met Pro Gly Glu Arg Gly Ala Ala Gly Leu Pro Gly Pro Lys Gly Asp755 760 765agg ggt gat gct gga cca aaa ggt gct gat gga tcc cca gga aaa gat2529Arg Gly Asp Ala Gly Pro Lys Gly Ala Asp Gly Ser Pro Gly Lys Asp
770 775 780 785gga gtt cgt ggt ctt act ggc cca atc gga cct cca ggc cct gct ggc2577Gly Val Arg Gly Leu Thr Gly Pro Ile Gly Pro Pro Gly Pro Ala Gly790 795 800gct cca ggt gat aag ggc gaa agt ggc cca agt gga cct gct gga cct2625Ala Pro Gly Asp Lys Gly Glu Ser Gly Pro Ser Gly Pro Ala Gly Pro805 810 815act ggt gct aga ggt gca cct ggt gat agg ggt gaa cct gga cca cct2673Thr Gly Ala Arg Gly Ala Pro Gly Asp Arg Gly Glu Pro Gly Pro Pro820 825 830ggt cca gct ggt ttt gct ggt cct cct gga gct gat gga caa cct ggc2721Gly Pro Ala Gly Phe Ala Gly Pro Pro Gly Ala Asp Gly Gln Pro Gly835 840 845gca aag ggt gaa cca ggt gat gct ggc gca aag gga gat gct ggt cca2769Ala Lys Gly Glu Pro Gly Asp Ala Gly Ala Lys Gly Asp Ala Gly Pro850 855 860 865cct gga cct gct ggt cca gca ggc ccc cct ggg cca atc ggt aat gtt2817Pro Gly Pro Ala Gly Pro Ala Gly Pro Pro Gly Pro Ile Gly Asn Val870 875 880gga gca cca ggt gct aag gga gct agg ggt tcc gct ggt cca cct gga2865Gly Ala Pro Gly Ala Lys Gly Ala Arg Gly Ser Ala Gly Pro Pro Gly885 890 895gca aca gga ttt cca ggc gct gct ggt aga gtt ggc cca cca ggc cca2913Ala Thr Gly Phe Pro Gly Ala Ala Gly Arg Val Gly Pro Pro Gly Pro900 905 910tcc gga aac gca ggc cct cct ggt cct cca ggt cct gct ggc aag gag2961Ser Gly Asn Ala Gly Pro Pro Gly Pro Pro Gly Pro Ala Gly Lys Glu915 920 925ggt ggc aaa gga cca agg ggc gaa act ggc cct gct ggt aga cct ggc3009Gly Gly Lys Gly Pro Arg Gly Glu Thr Gly Pro Ala Gly Arg Pro Gly930 935 940 945gaa gtt ggc cct cct gga cca cca ggt cca gca gga gaa aaa ggt tcc3057Glu Val Gly Pro Pro Gly Pro Pro Gly Pro Ala Gly Glu Lys Gly Ser
950 955 960cca gga gct gat ggc cca gct ggt gct cca gga act cca ggc cct caa3105Pro Gly Ala Asp Gly Pro Ala Gly Ala Pro Gly Thr Pro Gly Pro Gln965 970 975ggt att gct gga cag aga ggc gtt gtg gga ctc cct ggt caa agg gga3153Gly Ile Ala Gly Gln Arg Gly Val Val Gly Leu Pro Gly Gln Arg Gly980 985 990gag aga gga ttt cca ggc ttg cca gga cct agt gga gaa cct gga aaa 3201Glu Arg Gly Phe Pro Gly Leu Pro Gly Pro Ser Gly Glu Pro Gly Lys995 1000 1005caa ggc cca tca ggc gct agt gga gag cgt gga cct cct ggc cct 3246Gln Gly Pro Ser Gly Ala Ser Gly Glu Arg Gly Pro Pro Gly Pro1010 1015 1020atg gga cct cct gga ttg gct ggc cca cct ggc gaa tca ggt cgt 3291Met Gly Pro Pro Gly Leu Ala Gly Pro Pro Gly Glu Ser Gly Arg1025 1030 1035gaa ggc gca cca ggc gca gaa gga tca cct gga aga gat gga tcc 3336Glu Gly Ala Pro Gly Ala Glu Gly Ser Pro Gly Arg Asp Gly Ser1040 1045 1050cct ggt gct aaa ggc gat cgt gga gaa act ggt cca gca ggc cca 3381Pro Gly Ala Lys Gly Asp Arg Gly Glu Thr Gly Pro Ala Gly Pro1055 1060 1065cca ggc gca cca ggt gca cct ggc gct cca gga cct gtg gga cca 3426Pro Gly Ala Pro Gly Ala Pro Gly Ala Pro Gly Pro Val Gly Pro1070 1075 1080gct gga aaa tcc gga gat agg ggc gag aca ggc cca gca gga cca 3471Ala Gly Lys Ser Gly Asp Arg Gly Glu Thr Gly Pro Ala Gly Pro1085 1090 1095gct gga cct gtt ggc cct gct ggc gct cgt gga cca gca gga cct 3516Ala Gly Pro Val Gly Pro Ala Gly Ala Arg Gly Pro Ala Gly Pro1100 1105 1110caa gga cca agg gga gat aag gga gaa aca ggc gaa caa ggc gat 3561Gln Gly Pro Arg Gly Asp Lys Gly Glu Thr Gly Glu Gln Gly Asp
1115 1120 1125agg ggc att aag ggt cat agg ggt ttt agt ggc ctc cag ggt cct3606Arg Gly Ile Lys Gly His Arg Gly Phe Ser Gly Leu Gln Gly Pro1130 1135 1140cct ggc cca cct gga tca cca gga gaa cag gga cca tct ggt gct3651Pro Gly Pro Pro Gly Ser Pro Gly Glu Gln Gly Pro Ser Gly Ala1145 1150 1155tcc ggc cca gct ggt cca aga gga cct cca gga tca gct ggt gca3696Ser Gly Pro Ala Gly Pro Arg Gly Pro Pro Gly Ser Ala Gly Ala1160 1165 1170cct gga aaa gat ggt ctt aac ggt ctc cca gga cca atc ggc cct3741Pro Gly Lys Asp Gly Leu Asn Gly Leu Pro Gly Pro Ile Gly Pro1175 1180 1185cca gga cct aga gga aga aca gga gat gct ggc cct gtt ggc cct3786Pro Gly Pro Arg Gly Arg Thr Gly Asp Ala Gly Pro Val Gly Pro1190 1195 1200cca gga cct cct ggt cca cca ggt cca cct ggt cct cca tca gct3831Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Ser Ala1205 1210 1215gga ttc gat ttt tca ttt ctt cca cag cca cca caa gag aaa gct3876Gly Phe Asp Phe Ser Phe Leu Pro Gln Pro Pro Gln Glu Lys Ala1220 1225 1230cac gat ggc ggc aga tat tac cgt gct gat gat gct aac gtt gtt3921His Asp Gly Gly Arg Tyr Tyr Arg Ala Asp Asp Ala Asn Val Val1235 1240 1245agg gat aga gat ttg gaa gtg gat aca act ttg aaa tcc ctc tcc3966Arg Asp Arg Asp Leu Glu Val Asp Thr Thr Leu Lys Ser Leu Ser1250 1255 1260cag caa att gaa aac att aga tct cca gaa ggt tca cgt aaa aac4011Gln Gln Ile Glu Asn Ile Arg Ser Pro Glu Gly Ser Arg Lys Asn1265 1270 1275cca gct aga aca tgt cgt gat ttg aaa atg tgt cac tcc gat tgg4056Pro Ala Arg Thr Cys Arg Asp Leu Lys Met Cys His Ser Asp Trp
1280 1285 1290aaa agt ggt gaa tac tgg att gat cca aat cag ggc tgt aat ctc4101Lys Ser Gly Glu Tyr Trp Ile Asp Pro Asn Gln Gly Cys Asn Leu1295 1300 1305gat gct atc aaa gtt ttc tgt aac atg gaa aca ggc gaa aca tgc4146Asp Ala Ile Lys Val Phe Cys Asn Met Glu Thr Gly Glu Thr Cys1310 1315 1320gtt tat cct act caa cct tcc gtg gct cag aaa aat tgg tac atc4191Val Tyr Pro Thr Gln Pro Ser Val Ala Gln Lys Asn Trp Tyr Ile1325 1330 1335tca aaa aat cct aaa gat aag agg cac gtt tgg ttc ggt gaa agt4236Ser Lys Asn Pro Lys Asp Lys Arg His Val Trp Phe Gly Glu Ser1340 1345 1350atg act gat gga ttt caa ttt gag tac ggc ggt caa ggt agt gat4281Met Thr Asp Gly Phe Gln Phe Glu Tyr Gly Gly Gln Gly Ser Asp1355 1360 1365cca gct gat gtg gct att caa ctc aca ttt ttg cgt ctt atg tcc4326Pro Ala Asp Val Ala Ile Gln Leu Thr Phe Leu Arg Leu Met Ser1370 1375 1380aca gag gca tca caa aac atc act tac cac tgc aaa aac agt gtg4371Thr Glu Ala Ser Gln Asn Ile Thr Tyr His Cys Lys Asn Ser Val1385 1390 1395gct tat atg gat caa caa aca gga aac ctt aag aag gct ctt ctt4416Ala Tyr Met Asp Gln Gln Thr Gly Asn Leu Lys Lys Ala Leu Leu1400 1405 1410ttg aag ggc tca aac gag att gag att aga gca gag ggc aac tca4461Leu Lys Gly Ser Asn Glu Ile Glu Ile Arg Ala Glu Gly Asn Ser1415 1420 1425agg ttt act tat tca gtt act gtt gat ggc tgc act tca cat act4506Arg Phe Thr Tyr Ser Val Thr Val Asp Gly Cys Thr Ser His Thr1430 1435 1440ggc gct tgg ggt aaa aca gtt atc gag tat aag act aca aaa aca4551Gly Ala Trp Gly Lys Thr Val Ile Glu Tyr Lys Thr Thr Lys Thr
1445 1450 1455tca aga ctc cca atc att gat gtt gct cct ctc gat gtt ggc gct4596Ser Arg Leu Pro Ile Ile Asp Val Ala Pro Leu Asp Val Gly Ala1460 1465 1470cct gat caa gag ttc ggt ttt gat gtg ggc cca gtt tgt ttc ctc4641Pro Asp Gln Glu Phe Gly Phe Asp Val Gly Pro Val Cys Phe Leu1475 1480 1485taa tgagctcgcg gccgcatc 4662<210>3<211>1489<212>PRT<213>人工序列<220>
<223>與人膠原α1(I)鏈融合的大麥巰基蛋白酶aleurain前體基因的維管信號(hào)序列和側(cè)翼區(qū)的合成序列<400>3Met Ala His Ala Arg Val Leu Leu Leu Ala Leu Ala Val Leu Ala Thr1 5 10 15Ala Ala Val Ala Val Ala Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro20 25 30Ile Arg Pro Val Thr Asp Arg Ala Ala Ser Thr Leu Ala Gln Leu Gln35 40 45Glu Glu Gly Gln Val Glu Gly Gln Asp Glu Asp Ile Pro Pro Ile Thr50 55 60Cys Val Gln Asn Gly Leu Arg Tyr His Asp Arg Asp Val Trp Lys Pro65 70 75 80
Glu Pro Cys Arg Ile Cys Val Cys Asp Asn Gly Lys Val Leu Cys Asp85 90 95Asp Val Ile Cys Asp Glu Thr Lys Asn Cys Pro Gly Ala Glu Val Pro100 105 110Glu Gly Glu Cys Cys Pro Val Cys Pro Asp Gly Ser Glu Ser Pro Thr115 120 125Asp Gln Glu Thr Thr Gly Val Glu Gly Pro Lys Gly Asp Thr Gly Pro130 135 140Arg Gly Pro Arg Gly Pro Ala Gly Pro Pro Gly Arg Asp Gly Ile Pro145 150 155 160Gly Gln Pro Gly Leu Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly165 170 175Pro Pro Gly Leu Gly Gly Asn Phe Ala Pro Gln Leu Ser Tyr Gly Tyr180 185 190Asp Glu Lys Ser Thr Gly Gly Ile Ser Val Pro Gly Pro Met Gly Pro195 200 205Ser Gly Pro Arg Gly Leu Pro Gly Pro Pro Gly Ala Pro Gly Pro Gln210 215 220Gly Phe Gln Gly Pro Pro Gly Glu Pro Gly Glu Pro Gly Ala Ser Gly225 230 235 240Pro Met Gly Pro Arg Gly Pro Pro Gly Pro Pro Gly Lys Asn Gly Asp245 250 255
Asp Gly Glu Ala Gly Lys Pro Gly Arg Pro Gly Glu Arg Gly Pro Pro260 265 270Gly Pro Gln Gly Ala Arg Gly Leu Pro Gly Thr Ala Gly Leu Pro Gly275 280 285Met Lys Gly His Arg Gly Phe Ser Gly Leu Asp Gly Ala Lys Gly Asp290 295 300Ala Gly Pro Ala Gly Pro Lys Gly Glu Pro Gly Ser Pro Gly Glu Asn305 310 315 320Gly Ala Pro Gly Gln Met Gly Pro Arg Gly Leu Pro Gly Glu Arg Gly325 330 335Arg Pro Gly Ala Pro Gly Pro Ala Gly Ala Arg Gly Asn Asp Gly Ala340 345 350Thr Gly Ala Ala Gly Pro Pro Gly Pro Thr Gly Pro Ala Gly Pro Pro355 360 365Gly Phe Pro Gly Ala Val Gly Ala Lys Gly Glu Ala Gly Pro Gln Gly370 375 380Pro Arg Gly Ser Glu Gly Pro Gln Gly Val Arg Gly Glu Pro Gly Pro385 390 395 400Pro Gly Pro Ala Gly Ala Ala Gly Pro Ala Gly Asn Pro Gly Ala Asp405 410 415Gly Gln Pro Gly Ala Lys Gly Ala Asn Gly Ala Pro Gly Ile Ala Gly420 425 430
Ala Pro Gly Phe Pro Gly Ala Arg Gly Pro Ser Gly Pro Gln Gly Pro435 440 445Gly Gly Pro Pro Gly Pro Lys Gly Asn Ser Gly Glu Pro Gly Ala Pro450 455 460Gly Ser Lys Gly Asp Thr Gly Ala Lys Gly Glu Pro Gly Pro Val Gly465 470 475 480Val Gln Gly Pro Pro Gly Pro Ala Gly Glu Glu Gly Lys Arg Gly Ala485 490 495Arg Gly Glu Pro Gly Pro Thr Gly Leu Pro Gly Pro Pro Gly Glu Arg500 505 510Gly Gly Pro Gly Ser Arg Gly Phe Pro Gly Ala Asp Gly Val Ala Gly515 520 525Pro Lys Gly Pro Ala Gly Glu Arg Gly Ser Pro Gly Pro Ala Gly Pro530 535 540Lys Gly Ser Pro Gly Glu Ala Gly Arg Pro Gly Glu Ala Gly Leu Pro545 550 555 560Gly Ala Lys Gly Leu Thr Gly Ser Pro Gly Ser Pro Gly Pro Asp Gly565 570 575Lys Thr Gly Pro Pro Gly Pro Ala Gly Gln Asp Gly Arg Pro Gly Pro580 585 590Pro Gly Pro Pro Gly Ala Arg Gly Gln Ala Gly Val Met Gly Phe Pro595 600 605
Gly Pro Lys Gly Ala Ala Gly Glu Pro Gly Lys Ala Gly Glu Arg Gly610 615 620Val Pro Gly Pro Pro Gly Ala Val Gly Pro Ala Gly Lys Asp Gly Glu625 630 635 640Ala Gly Ala Gln Gly Pro Pro Gly Pro Ala Gly Pro Ala Gly Glu Arg645 650 655Gly Glu Gln Gly Pro Ala Gly Ser Pro Gly Phe Gln Gly Leu Pro Gly660 665 670Pro Ala Gly Pro Pro Gly Glu Ala Gly Lys Pro Gly Glu Gln Gly Val675 680 685Pro Gly Asp Leu Gly Ala Pro Gly Pro Ser Gly Ala Arg Gly Glu Arg690 695 700Gly Phe Pro Gly Glu Arg Gly Val Gln Gly Pro Pro Gly Pro Ala Gly705 710 715 720Pro Arg Gly Ala Asn Gly Ala Pro Gly Asn Asp Gly Ala Lys Gly Asp725 730 735Ala Gly Ala Pro Gly Ala Pro Gly Ser Gln Gly Ala Pro Gly Leu Gln740 745 750Gly Met Pro Gly Glu Arg Gly Ala Ala Gly Leu Pro Gly Pro Lys Gly755 760 765Asp Arg Gly Asp Ala Gly Pro Lys Gly Ala Asp Gly Ser Pro Gly Lys770 775 780
Asp Gly Val Arg Gly Leu Thr Gly Pro Ile Gly Pro Pro Gly Pro Ala785 790 795 800Gly Ala Pro Gly Asp Lys Gly Glu Ser Gly Pro Ser Gly Pro Ala Gly805 810 815Pro Thr Gly Ala Arg Gly Ala Pro Gly Asp Arg Gly Glu Pro Gly Pro820 825 830Pro Gly Pro Ala Gly Phe Ala Gly Pro Pro Gly Ala Asp Gly Gln Pro835 840 845Gly Ala Lys Gly Glu Pro Gly Asp Ala Gly Ala Lys Gly Asp Ala Gly850 855 860Pro Pro Gly Pro Ala Gly Pro Ala Gly Pro Pro Gly Pro Ile Gly Asn865 870 875 880Val Gly Ala Pro Gly Ala Lys Gly Ala Arg Gly Ser Ala Gly Pro Pro885 890 895Gly Ala Thr Gly Phe Pro Gly Ala Ala Gly Arg Val Gly Pro Pro Gly900 905 910Pro Ser Gly Asn Ala Gly Pro Pro Gly Pro Pro Gly Pro Ala Gly Lys915 920 925Glu Gly Gly Lys Gly Pro Arg Gly Glu Thr Gly Pro Ala Gly Arg Pro930 935 940Gly Glu Val Gly Pro Pro Gly Pro Pro Gly Pro Ala Gly Glu Lys Gly945 950 955 960
Ser Pro Gly Ala Asp Gly Pro Ala Gly Ala Pro Gly Thr Pro Gly Pro965 970 975Gln Gly Ile Ala Gly Gln Arg Gly Val Val Gly Leu Pro Gly Gln Arg980 985 990Gly Glu Arg Gly Phe Pro Gly Leu Pro Gly Pro Ser Gly Glu Pro Gly995 1000 1005Lys Gln Gly Pro Ser Gly Ala Ser Gly Glu Arg Gly Pro Pro Gly1010 1015 1020Pro Met Gly Pro Pro Gly Leu Ala Gly Pro Pro Gly Glu Ser Gly1025 1030 1035Arg Glu Gly Ala Pro Gly Ala Glu Gly Ser Pro Gly Arg Asp Gly1040 1045 1050Ser Pro Gly Ala Lys Gly Asp Arg Gly Glu Thr Gly Pro Ala Gly1055 1060 1065Pro Pro Gly Ala Pro Gly Ala Pro Gly Ala Pro Gly Pro Val Gly1070 1075 1080Pro Ala Gly Lys Ser Gly Asp Arg Gly Glu Thr Gly Pro Ala Gly1085 1090 1095Pro Ala Gly Pro Val Gly Pro Ala Gly Ala Arg Gly Pro Ala Gly1100 1105 1110Pro Gln Gly Pro Arg Gly Asp Lys Gly Glu Thr Gly Glu Gln Gly1115 1120 1125
Asp Arg Gly Ile Lys Gly His Arg Gly Phe Ser Gly Leu Gln Gly1130 1135 1140Pro Pro Gly Pro Pro Gly Ser Pro Gly Glu Gln Gly Pro Ser Gly1145 1150 1155Ala Ser Gly Pro Ala Gly Pro Arg Gly Pro Pro Gly Ser Ala Gly1160 1165 1170Ala Pro Gly Lys Asp Gly Leu Asn Gly Leu Pro Gly Pro Ile Gly1175 1180 1185Pro Pro Gly Pro Arg Gly Arg Thr Gly Asp Ala Gly Pro Val Gly1190 1195 1200Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Ser1205 1210 1215Ala Gly Phe Asp Phe Ser Phe Leu Pro Gln Pro Pro Gln Glu Lys1220 1225 1230Ala His Asp Gly Gly Arg Tyr Tyr Arg Ala Asp Asp Ala Asn Val1235 1240 1245Val Arg Asp Arg Asp Leu Glu Val Asp Thr Thr Leu Lys Ser Leu1250 1255 1260Ser Gln Gln Ile Glu Asn Ile Arg Ser Pro Glu Gly Ser Arg Lys1265 1270 1275Asn Pro Ala Arg Thr Cys Arg Asp Leu Lys Met Cys His Ser Asp1280 1285 1290
Trp Lys Ser Gly Glu Tyr Trp Ile Asp Pro Asn Gln Gly Cys Asn1295 1300 1305Leu Asp Ala Ile Lys Val Phe Cys Asn Met Glu Thr Gly Glu Thr1310 1315 1320Cys Val Tyr Pro Thr Gln Pro Ser Val Ala Gln Lys Asn Trp Tyr1325 1330 1335Ile Ser Lys Asn Pro Lys Asp Lys Arg His Val Trp Phe Gly Glu1340 1345 1350Ser Met Thr Asp Gly Phe Gln Phe Glu Tyr Gly Gly Gln Gly Ser1355 1360 1365Asp Pro Ala Asp Val Ala Ile Gln Leu Thr Phe Leu Arg Leu Met1370 1375 1380Ser Thr Glu Ala Ser Gln Asn Ile Thr Tyr His Cys Lys Asn Ser1385 1390 1395Val Ala Tyr Met Asp Gln Gln Thr Gly Asn Leu Lys Lys Ala Leu1400 1405 1410Leu Leu Lys Gly Ser Asn Glu Ile Glu Ile Arg Ala Glu Gly Asn1415 1420 1425Ser Arg Phe Thr Tyr Ser Val Thr Val Asp Gly Cys Thr Ser His1430 1435 1440Thr Gly Ala Trp Gly Lys Thr Val Ile Glu Tyr Lys Thr Thr Lys1445 1450 1455
Thr Ser Arg Leu Pro Ile Ile Asp Val Ala Pro Leu Asp Val Gly1460 1465 1470Ala Pro Asp Gln Glu Phe Gly Phe Asp Val Gly Pro Val Cys Phe1475 1480 1485Leu<210>4<211>4362<212>DNA<213>人工序列<220>
<223>含有與人膠原α2(I)鏈融合的大麥巰基蛋白酶aleurain前體基因的維管信號(hào)序列編碼區(qū)和側(cè)翼區(qū)的合成序列<400>4gcgatgcatg taatgtcatg agccacatga tccaatggcc acaggaacgt aagaatgtag60atagatttga ttttgtccgt tagatagcaa acaacattat aaaaggtgtg tatcaatacg120aactaattca ctcattggat tcatagaagt ccattcctcc taagtatcta aaccatggct180cacgctcgtg ttctcctcct cgctctcgct gttttggcaa cagctgctgt ggctgtggct240tcaagttcta gttttgctga ttccaaccca attcgtccag ttactgatag agcagcttcc300actttggctc aattgcttca agaagaaact gtgaggaagg gccctgctgg cgataggggc360cctaggggcg aaaggggtcc accaggacct ccaggcaggg atggcgaaga tggtccaact420ggccctcctg gacctcctgg ccctccaggg ccacccggct tgggcggaaa cttcgcagct480caatacgatg gcaagggtgt tggtcttggt cctggtccta tgggcttgat gggacctaga540ggcccacctg gtgctgctgg tgctcctgga ccacagggtt ttcagggacc agctggcgag600ccaggagagc caggccaaac aggaccagct ggtgcaaggg gacctgctgg acctcctgga660
aaagctggtg aagatggtca cccaggcaaa ccaggacgtc ctggcgaaag aggtgttgtt720ggaccacaag gcgctagggg atttccaggt acacctggat tgccaggttt taagggcatt780cgtggtcata acggcctcga tggattgaag ggacagcctg gcgcacctgg cgttaagggt840gaacctggag caccaggtga aaacggtact cctggccaga ctggtgcaag aggactccca900ggtgaaaggg gtagagttgg tgctcctgga cctgctggag ctaggggtag tgatggtagt960gttggtcctg tgggccctgc tggtccaatc ggttccgctg gcccacctgg attcccaggc1020gctccaggac ctaaaggaga aatcggtgct gtgggtaacg caggtcctac tggtccagca1080ggtcctcgtg gagaagtggg attgccagga ctttctggtc cagtgggccc tccaggcaac1140cctggagcta acggcttgac aggagctaaa ggcgcagcag gactccctgg agtggctggc1200gcaccaggat tgcctggtcc aaggggtatc ccaggccctg ttggcgcagc tggagctact1260ggtgcacgtg gacttgttgg cgaaccaggc cctgctggat caaaaggcga gtctggaaat1320aagggagaac ctggttctgc tggacctcaa ggtcctcctg gaccttctgg agaagaagga1380aaaaggggac caaatggcga ggctggatca gcaggtccac caggaccacc tggacttcgt1440ggatcccctg gtagtagagg acttccaggc gctgatggta gagcaggcgt tatgggacca1500ccaggaagta gaggagcatc cggtccagca ggagttaggg gtcctaacgg agatgctggt1560agaccaggtg aaccaggtct tatgggccca aggggcctcc caggtagtcc aggaaatatc1620ggccctgctg gaaaagaagg ccctgttgga cttccaggta ttgatggacg tcctggccct1680attggcccag caggtgcaag aggagaacct ggcaatattg gatttccagg accaaagggt1740ccaacaggcg atcctggaaa aaatggagat aagggtcatg ctggattggc aggcgcaagg1800ggcgctcctg gtccagatgg aaacaacggc gcacagggtc cacctggccc tcagggtgtt1860caaggcggaa aaggcgaaca aggcccagct ggaccaccag gctttcaagg cttgccagga1920ccaagtggtc cagcaggtga agttggcaag ccaggcgagc gtggacttca tggcgagttt1980
ggactccctg gaccagcagg accaaggggt gaaagaggcc ctcctggaga gagtggcgct2040gctggaccaa caggcccaat cggtagtaga ggtcctagtg gacctccagg cccagatgga2100aataagggtg aaccaggagt tgtgggcgct gttggaacag ctggtccttc aggaccatca2160ggactcccag gcgagagagg cgctgctggc attcctggag gaaaaggtga aaaaggcgaa2220cctggcctcc gtggcgaaat cggaaatcct ggacgtgatg gtgctcgtgg tgcacacggc2280gctgtgggcg ctccaggccc tgctggtgct actggtgata gaggagaggc tggcgcagct2340ggcccagcag gtcctgctgg cccaaggggt agtcctggtg aaagaggcga agttggacct2400gctggcccta acggctttgc tggccctgct ggagcagcag gtcaacctgg cgctaaaggt2460gaaaggggcg gaaagggccc aaaaggtgaa aatggcgttg tgggaccaac tggtccagtg2520ggcgcagctg gacctgctgg tccaaatgga ccaccaggac cagcaggtag tagaggagat2580ggtggacctc caggaatgac aggttttcca ggtgctgctg gtagaacagg acctcctggt2640cctagtggta tttctggtcc accaggacca ccaggtcctg ctggaaaaga aggattgagg2700ggtccacgtg gtgatcaagg accagtgggc agaactggtg aagttggcgc agtgggacca2760cctggttttg ctggagaaaa gggcccttct ggagaggcag gaacagctgg tcctcctggt2820acacctggac ctcaaggact tttgggtgca cctggtattc tcggattgcc aggaagtagg2880ggcgaacgtg gacttcctgg cgtggcagga gcagttggag aacctggccc tctcggaatc2940gcaggcccac caggcgcaag aggaccacca ggagctgttg gatcaccagg cgtgaatggt3000gcacctggcg aggctggtcg tgatggaaac ccaggaaatg atggcccacc aggaagagat3060ggtcaacctg gacacaaagg cgagaggggc tacccaggaa atattggccc agttggtgct3120gctggcgcac caggcccaca cggtccagtt ggaccagcag gaaaacacgg taatcgtggc3180gaaacaggcc cttcaggccc agtgggacct gctggtgctg ttggcccaag aggaccatct3240ggacctcaag gcattagagg cgataaggga gagcctggcg aaaaaggacc tagaggcttg3300
cctggtttta aaggacacaa cggtctccaa ggacttccag gtatcgctgg tcatcatgga3360gatcagggtg ctcctggatc agtgggtcca gcaggtccta gaggcccagc aggcccttcc3420ggtccagcag gaaaggatgg acgtactggc caccctggaa ctgtgggccc tgctggaatt3480agaggtcctc aaggtcatca gggccctgct ggccctccag gtccaccagg tcctccaggc3540ccaccaggag tttcaggtgg tggttacgat tttggttacg atggtgattt ttaccgtgct3600gatcaaccta gaagtgctcc ttctctccgt cctaaagatt atgaagttga tgctactttg3660aaatcactta acaaccagat tgagactctt ctcacacctg agggatcaag aaagaatcca3720gcacgtacat gccgtgatct cagacttagt cacccagagt ggtcaagtgg ctattattgg3780attgatccta atcagggttg tacaatggag gctatcaaag tttactgtga ttttccaact3840ggagagacat gtattagggc acaacctgag aacattccag ctaaaaattg gtatcgttcc3900tctaaagata agaaacatgt ttggctcgga gagactatta acgctggttc tcagttcgag3960tataatgttg agggcgttac ttctaaagag atggcaactc agctcgcttt tatgagattg4020ctcgctaact acgcatccca aaacatcact tatcactgca aaaattccat tgcatatatg4080gatgaggaga caggaaattt gaagaaagca gttattctcc aaggtagtaa cgatgttgag4140cttgtggctg agggaaatag tagattcact tacacagttt tggtggatgg atgctcaaag4200aaaactaatg agtggggcaa gacaatcatt gagtacaaga caaataagcc ttctaggctc4260ccatttctcg atattgcacc tcttgatatc ggaggagctg atcacgagtt ttttgttgat4320atcggacctg tttgttttaa gtaatgagct cgcggccgca tc 4362<210>5<211>4362<212>DNA<213>人工序列<220>
<223>與人膠原α2(I)鏈融合的大麥巰基蛋白酶aleurain前體基因的維管信號(hào)序列和側(cè)翼區(qū)的合成序列<220>
<221>CDS<222>(175)..(4344)<400>5gcgatgcatg taatgtcatg agccacatga tccaatggcc acaggaacgt aagaatgtag 60atagatttga ttttgtccgt tagatagcaa acaacattat aaaaggtgtg tatcaatacg 120aactaattca ctcattggat tcatagaagt ccattcctcc taagtatcta aacc atg177Met1gct cac gct cgt gtt ctc crc ctc gct ctc gct gtt ttg gca aca gct225Ala His Ala Arg Val Leu Leu Leu Ala Leu Ala Val Leu Ala Thr Ala5 10 15gct gtg gct gtg gct tca agt tct agt ttt gct gat tcc aac cca att273Ala Val Ala Val Ala Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro Ile20 25 30cgt cca gtt act gat aga gca gct tcc act ttg gct caa ttg ctt caa321Arg Pro Val Thr Asp Arg Ala Ala Ser Thr Leu Ala Gln Leu Leu Gln35 40 45gaa gaa act gtg agg aag ggc cct gct ggc gat agg ggc cct agg ggc369Glu Glu Thr Val Arg Lys Gly Pro Ala Gly Asp Arg Gly Pro Arg Gly50 55 60 65gaa agg ggt cca cca gga cct cca ggc agg gat ggc gaa gat ggt cca417Glu Arg Gly Pro Pro Gly Pro Pro Gly Arg Asp Gly Glu Asp Gly Pro70 75 80act ggc cct cct gga cct cct ggc cct cca ggg cca ccc ggc ttg ggc465Thr Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Leu Gly85 90 95gga aac ttc gca gct caa tac gat ggc aag ggt gtt ggt ctt ggt cct513Gly Asn Phe Ala Ala Gln Tyr Asp Gly Lys Gly Val Gly Leu Gly Pro100 105 110
ggt cct atg ggc ttg atg gga cct aga ggc cca cct ggt gct gct ggt561Gly Pro Met Gly Leu Met Gly Pro Arg Gly Pro Pro Gly Ala Ala Gly115 120 125gct cct gga cca cag ggt ttt cag gga cca gct ggc gag cca gga gag609Ala Pro Gly Pro Gln Gly Phe Gln Gly Pro Ala Gly Glu Pro Gly Glu130 135 140 145cca ggc caa aca gga cca gct ggt gca agg gga cct gct gga cct cct657Pro Gly Gln Thr Gly Pro Ala Gly Ala Arg Gly Pro Ala Gly Pro Pro150 155 160gga aaa gct ggt gaa gat ggt cac cca ggc aaa cca gga cgt cct ggc705Gly Lys Ala Gly Glu Asp Gly His Pro Gly Lys Pro Gly Arg Pro Gly165 170 175gaa aga ggt gtt gtt gga cca caa ggc gct agg gga ttt cca ggt aca753Glu Arg Gly Val Val Gly Pro Gln Gly Ala Arg Gly Phe Pro Gly Thr180 185 190cct gga ttg cca ggt ttt aag ggc att cgt ggt cat aac ggc ctc gat801Pro Gly Leu Pro Gly Phe Lys Gly Ile Arg Gly His Asn Gly Leu Asp195 200 205gga ttg aag gga cag cct ggc gca cct ggc gtt aag ggt gaa cct gga849Gly Leu Lys Gly Gln Pro Gly Ala Pro Gly Val Lys Gly Glu Pro Gly210 215 220 225gca cca ggt gaa aac ggt act cct ggc cag act ggt gca aga gga ctc897Ala Pro Gly Glu Asn Gly Thr Pro Gly Gln Thr Gly Ala Arg Gly Leu230 235 240cca ggt gaa agg ggt aga gtt ggt gct cct gga cct gct gga gct agg945Pro Gly Glu Arg Gly Arg Val Gly Ala Pro Gly Pro Ala Gly Ala Arg245 250 255ggt agt gat ggt agt gtt ggt cct gtg ggc cct gct ggt cca atc ggt993Gly Ser Asp Gly Ser Val Gly Pro Val Gly Pro Ala Gly Pro Ile Gly260 265 270tcc gct ggc cca cct gga ttc cca ggc gct cca gga cct aaa gga gaa 1041Ser Ala Gly Pro Pro Gly Phe Pro Gly Ala Pro Gly Pro Lys Gly Glu275 280 285
atc ggt gct gtg ggt aac gca ggt cct act ggt cca gca ggt cct cgt1089Ile Gly Ala Val Gly Asn Ala Gly Pro Thr Gly Pro Ala Gly Pro Arg290 295 300 305gga gaa gtg gga ttg cca gga ctt tct ggt cca gtg ggc cct cca ggc1137Gly Glu Val Gly Leu Pro Gly Leu Ser Gly Pro Val Gly Pro Pro Gly310 315 320aac cct gga gct aac ggc ttg aca gga gct aaa ggc gca gca gga ctc1185Asn Pro Gly Ala Asn Gly Leu Thr Gly Ala Lys Gly Ala Ala Gly Leu325 330 335cct gga gtg gct ggc gca cca gga ttg cct ggt cca agg ggt atc cca1233Pro Gly Val Ala Gly Ala Pro Gly Leu Pro Gly Pro Arg Gly Ile Pro340 345 350ggc cct gtt ggc gca gct gga gct act ggt gca cgt gga ctt gtt ggc1281Gly Pro Val Gly Ala Ala Gly Ala Thr Gly Ala Arg Gly Leu Val Gly355 360 365gaa cca ggc cct gct gga tca aaa ggc gag tct gga aat aag gga gaa1329Glu Pro Gly Pro Ala Gly Ser Lys Gly Glu Ser Gly Asn Lys Gly Glu370 375 380 385cct ggt tct gct gga cct caa ggt cct cct gga cct tct gga gaa gaa1377Pro Gly Ser Ala Gly Pro Gln Gly Pro Pro Gly Pro Ser Gly Glu Glu390 395 400gga aaa agg gga cca aat ggc gag gct gga tca gca ggt cca cca gga1425Gly Lys Arg Gly Pro Asn Gly Glu Ala Gly Ser Ala Gly Pro Pro Gly405 410 415cca cct gga ctt cgt gga tcc cct ggt agt aga gga ctt cca ggc gct1473Pro Pro Gly Leu Arg Gly Ser Pro Gly Ser Arg Gly Leu Pro Gly Ala420 425 430gat ggt aga gca ggc gtt atg gga cca cca gga agt aga gga gca tcc1521Asp Gly Arg Ala Gly Val Met Gly Pro Pro Gly Ser Arg Gly Ala Ser435 440 445ggt cca gca gga gtt agg ggt cct aac gga gat gct ggt aga cca ggt1569Gly Pro Ala Gly Val Arg Gly Pro Asn Gly Asp Ala Gly Arg Pro Gly450 455 460 465
gaa cca ggt ctt atg ggc cca agg ggc ctc cca ggt agt cca gga aat1617Glu Pro Gly Leu Met Gly Pro Arg Gly Leu Pro Gly Ser Pro Gly Asn470 475 480atc ggc cct gct gga aaa gaa ggc cct gtt gga ctt cca ggt att gat1665Ile Gly Pro Ala Gly Lys Glu Gly Pro Val Gly Leu Pro Gly Ile Asp485 490 495gga cgt cct ggc cct att ggc cca gca ggt gca aga gga gaa cct ggc1713Gly Arg Pro Gly Pro Ile Gly Pro Ala Gly Ala Arg Gly Glu Pro Gly500 505 510aat att gga ttt cca gga cca aag ggt cca aca ggc gat cct gga aaa1761Asn Ile Gly Phe Pro Gly Pro Lys Gly Pro Thr Gly Asp Pro Gly Lys515 520 525aat gga gat aag ggt cat gct gga ttg gca ggc gca agg ggc gct cct1809Asn Gly Asp Lys Gly His Ala Gly Leu Ala Gly Ala Arg Gly Ala Pro530 535 540 545ggt cca gat gga aac aac ggc gca cag ggt cca cct ggc cct cag ggt1857Gly Pro Asp Gly Asn Asn Gly Ala Gln Gly Pro Pro Gly Pro Gln Gly550 555 560gtt caa ggc gga aaa ggc gaa caa ggc cca gct gga cca cca ggc ttt1905Val Gln Gly Gly Lys Gly Glu Gln Gly Pro Ala Gly Pro Pro Gly Phe565 570 575caa ggc ttg cca gga cca agt ggt cca gca ggt gaa gtt ggc aag cca1953Gln Gly Leu Pro Gly Pro Ser Gly Pro Ala Gly Glu Val Gly Lys Pro580 585 590ggc gag cgt gga ctt cat ggc gag ttt gga ctc cct gga cca gca gga2001Gly Glu Arg Gly Leu His Gly Glu Phe Gly Leu Pro Gly Pro Ala Gly595 600 605cca agg ggt gaa aga ggc cct cct gga gag agt ggc gct gct gga cca2049Pro Arg Gly Glu Arg Gly Pro Pro Gly Glu Ser Gly Ala Ala Gly Pro610 615 620 625aca gge cca atc ggt agt aga ggt cct agt gga cct cca ggc cca gat2097Thr Gly Pro Ile Gly Ser Arg Gly Pro Ser Gly Pro Pro Gly Pro Asp630 635 640
gga aat aag ggt gaa cca gga gtt gtg ggc gct gtt gga aca gct ggt2145Gly Asn Lys Gly Glu Pro Gly Val Val Gly Ala Val Gly Thr Ala Gly645 650 655cct tca gga cca tca gga ctc cca ggc gag aga ggc gct gct ggc att2193Pro Ser Gly Pro Ser Gly Leu Pro Gly Glu Arg Gly Ala Ala Gly Ile660 665 670cct gga gga aaa ggt gaa aaa ggc gaa cct ggc ctc cgt ggc gaa atc2241Pro Gly Gly Lys Gly Glu Lys Gly Glu Pro Gly Leu Arg Gly Glu Ile675 680 685gga aat cct gga cgt gat ggt gct cgt ggt gca cac ggc gct gtg ggc2289Gly Asn Pro Gly Arg Asp Gly Ala Arg Gly Ala His Gly Ala Val Gly690 695 700 705gct cca ggc cct gct ggt gct act ggt gat aga gga gag gct ggc gca2337Ala Pro Gly Pro Ala Gly Ala Thr Gly Asp Arg Gly Glu Ala Gly Ala710 715 720gct ggc cca gca ggt cct gct ggc cca agg ggt agt cct ggt gaa aga2385Ala Gly Pro Ala Gly Pro Ala Gly Pro Arg Gly Ser Pro Gly Glu Arg725 730 735ggc gaa gtt gga cct gct ggc cct aac ggc ttt gct ggc cct gct gga2433Gly Glu Val Gly Pro Ala Gly Pro Asn Gly Phe Ala Gly Pro Ala Gly740 745 750gca gca ggt caa cct ggc gct aaa ggt gaa agg ggc gga aag ggc cca2481Ala Ala Gly Gln Pro Gly Ala Lys Gly Glu Arg Gly Gly Lys Gly Pro755 760 765aaa ggt gaa aat ggc gtt gtg gga cca act ggt cca gtg ggc gca gct2529Lys Gly Glu Asn Gly Val Val Gly Pro Thr Gly Pro Val Gly Ala Ala770 775 780 785gga cct gct ggt cca aat gga cca cca gga cca gca ggt agt aga gga2577Gly Pro Ala Gly Pro Asn Gly Pro Pro Gly Pro Ala Gly Ser Arg Gly790 795 800gat ggt gga cct cca gga atg aca ggt ttt cca ggt gct gct ggt aga2625Asp Gly Gly Pro Pro Gly Met Thr Gly Phe Pro Gly Ala Ala Gly Arg805 810 815
aca gga cct cct ggt cct agt ggt att tct ggt cca cca gga cca cca2673Thr Gly Pro Pro Gly Pro Ser Gly Ile Ser Gly Pro Pro Gly Pro Pro820 825 830ggt cct gct gga aaa gaa gga ttg agg ggt cca cgt ggt gat caa gga2721Gly Pro Ala Gly Lys Glu Gly Leu Arg Gly Pro Arg Gly Asp Gln Gly835 840 845cca gtg ggc aga act ggt gaa gtt ggc gca gtg gga cca cct ggt ttt2769Pro Val Gly Arg Thr Gly Glu Val Gly Ala Val Gly Pro Pro Gly Phe850 855 860 865gct gga gaa aag ggc cct tct gga gag gca gga aca gct ggt cct cct2817Ala Gly Glu Lys Gly Pro Ser Gly Glu Ala Gly Thr Ala Gly Pro Pro870 875 880ggt aca cct gga cct caa gga ctt ttg ggt gca cct ggt att ctc gga2865Gly Thr Pro Gly Pro Gln Gly Leu Leu Gly Ala Pro Gly Ile Leu Gly885 890 895ttg cca gga agt agg ggc gaa cgt gga ctt cct ggc gtg gca gga gca2913Leu Pro Gly Ser Arg Gly Glu Arg Gly Leu Pro Gly Val Ala Gly Ala900 905 910gtt gga gaa cct ggc cct ctc gga atc gca ggc cca cca ggc gca aga2961Val Gly Glu Pro Gly Pro Leu Gly Ile Ala Gly Pro Pro Gly Ala Arg915 920 925gga cca cca gga gct gtt gga tca cca ggc gtg aat ggt gca cct ggc3009Gly Pro Pro Gly Ala Val Gly Ser Pro Gly Val Asn Gly Ala Pro Gly930 935 940 945gag gct ggt cgt gat gga aac cca gga aat gat ggc cca cca gga aga3057Glu Ala Gly Arg Asp Gly Asn Pro Gly Asn Asp Gly Pro Pro Gly Arg950 955 960gat ggt caa cct gga cac aaa ggc gag agg ggc tac cca gga aat att3105Asp Gly Gln Pro Gly His Lys Gly Glu Arg Gly Tyr Pro Gly Asn Ile965 970 975ggc cca gtt ggt gct gct ggc gca cca ggc cca cac ggt cca gtt gga3153Gly Pro Val Gly Ala Ala Gly Ala Pro Gly Pro His Gly Pro Val Gly980 985 990
cca gca gga aaa cac ggt aat cgt ggc gaa aca ggc cct tca ggc cca 3201Pro Ala Gly Lys His Gly Asn Arg Gly Glu Thr Gly Pro Ser Gly Pro995 1000 1005gtg gga cct gct ggt gct gtt ggc cca aga gga cca tct gga cct3246Val Gly Pro Ala Gly Ala Val Gly Pro Arg Gly Pro Ser Gly Pro1010 1015 1020caa ggc att aga ggc gat aag gga gag cct ggc gaa aaa gga cct3291Gln Gly Ile Arg Gly Asp Lys Gly Glu Pro Gly Glu Lys Gly Pro1025 1030 1035aga ggc ttg cct ggt ttt aaa gga cac aac ggt ctc caa gga ctt3336Arg Gly Leu Pro Gly Phe Lys Gly His Asn Gly Leu Gln Gly Leu1040 1045 1050cca ggt atc gct ggt cat cat gga gat cag ggt gct cct gga tca3381Pro Gly Ile Ala Gly His His Gly Asp Gln Gly Ala Pro Gly Ser1055 1060 1065gtg ggt cca gca ggt cct aga ggc cca gca ggc cct tcc ggt cca3426Val Gly Pro Ala Gly Pro Arg Gly Pro Ala Gly Pro Ser Gly Pro1070 1075 1080gca gga aag gat gga cgt act ggc cac cct gga act gtg ggc cct3471Ala Gly Lys Asp Gly Arg Thr Gly His Pro Gly Thr Val Gly Pro1085 1090 1095gct gga att aga ggt cct caa ggt cat cag ggc cct gct ggc cct3516Ala Gly Ile Arg Gly Pro Gln Gly His Gln Gly Pro Ala Gly Pro1100 1105 1110cca ggt cca cca ggt cct cca ggc cca cca gga gtt tca ggt ggt3561Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Val Ser Gly Gly1115 1120 1125ggt tac gat ttt ggt tac gat ggt gat ttt tac cgt gct gat caa3606Gly Tyr Asp Phe Gly Tyr Asp Gly Asp Phe Tyr Arg Ala Asp Gln1130 1135 1140cct aga agt gct cct tct ctc cgt cct aaa gat tat gaa gtt gat3651Pro Arg Ser Ala Pro Ser Leu Arg Pro Lys Asp Tyr Glu Val Asp1145 1150 1155
gct act ttg aaa tca ctt aac aac cag att gag act ctt ctc aca3696Ala Thr Leu Lys Ser Leu Asn Asn Gln Ile Glu Thr Leu Leu Thr1160 1165 1170cct gag gga tca aga aag aat cca gca cgt aca tgc cgt gat ctc3741Pro Glu Gly Ser Arg Lys Asn Pro Ala Arg Thr Cys Arg Asp Leu1175 1180 1185aga ctt agt cac cca gag tgg tca agt ggc tat tat tgg att gat3786Arg Leu Ser His Pro Glu Trp Ser Ser Gly Tyr Tyr Trp Ile Asp1190 1195 1200cct aat cag ggt tgt aca atg gag gct atc aaa gtt tac tgt gat3831Pro Asn Gln Gly Cys Thr Met Glu Ala Ile Lys Val Tyr Cys Asp1205 1210 1215ttt cca act gga gag aca tgt att agg gca caa cct gag aac att3876Phe Pro Thr Gly Glu Thr Cys Ile Arg Ala Gln Pro Glu Asn Ile1220 1225 1230cca gct aaa aat tgg tat cgt tcc tct aaa gat aag aaa cat gtt3921Pro Ala Lys Asn Trp Tyr Arg Ser Ser Lys Asp Lys Lys His Val1235 1240 1245tgg ctc gga gag act att aac gct ggt tct cag ttc gag tat aat3966Trp Leu Gly Glu Thr Ile Asn Ala Gly Ser Gln Phe Glu Tyr Asn1250 1255 1260gtt gag ggc gtt act tct aaa gag atg gca act cag ctc gct ttt4011Val Glu Gly Val Thr Ser Lys Glu Met Ala Thr Gln Leu Ala Phe1265 1270 1275atg aga ttg ctc gct aac tac gca tcc caa aac atc act tat cac4056Met Arg Leu Leu Ala Asn Tyr Ala Ser Gln Asn Ile Thr Tyr His1280 1285 1290tgc aaa aat tcc att gca tat atg gat gag gag aca gga aat ttg4101Cys Lys Asn Ser Ile Ala Tyr Met Asp Glu Glu Thr Gly Asn Leu1295 1300 1305aag aaa gca gtt att ctc caa ggt agt aac gat gtt gag ctt gtg4146Lys Lys Ala Val Ile Leu Gln Gly Ser Asn Asp Val Glu Leu Val1310 1315 1320
gct gag gga aat agt aga ttc act tac aca gtt ttg gtg gat gga4191Ala Glu Gly Ash Ser Arg Phe Thr Tyr Thr Val Leu Val Asp Gly1325 1330 1335tgc tca aag aaa act aat gag tgg ggc aag aca atc att gag tac4236Cys Ser Lys Lys Thr Asn Glu Trp Gly Lys Thr Ile Ile Glu Tyr1340 1345 1350aag aca aat aag cct tct agg ctc cca ttt ctc gat att gca cct4281Lys Thr Asn Lys Pro Set Arg Leu Pro Phe Leu Asp Ile Ala Pro1355 1360 1365ctt gat atc gga gga gct gat cac gag ttt ttt gtt gat atc gga4326Leu Asp Ile Gly Gly Ala Asp His Glu Phe Phe Val Asp Ile Gly1370 1375 1380cct gtt tgt ttt aag taa tgagctcgcg gccgcatc 4362Pro Val Cys Phe Lys1385<210>6<211>1389<212>PRT<213>人工序列<220>
<223>含有與人膠原α2(I)鏈融合的大麥巰基蛋白酶aleurain前體基因的維管信號(hào)序列編碼區(qū)和側(cè)翼區(qū)的合成序列<400>6Met Ala His Ala Arg Val Leu Leu Leu Ala Leu Ala Val Leu Ala Thr1 5 10 15Ala Ala Val Ala Val Ala Ser Ser Ser Set Phe Ala Asp Ser Asn Pro20 25 30Ile Arg Pro Val Thr Asp Arg Ala Ala Set Thr Leu Ala Gln Leu Leu35 40 45
Gln Glu Glu Thr Val Arg Lys Gly Pro Ala Gly Asp Arg Gly Pro Arg50 55 60Gly Glu Arg Gly Pro Pro Gly Pro Pro Gly Arg Asp Gly Glu Asp Gly65 70 75 80Pro Thr Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Leu85 90 95Gly Gly Asn Phe Ala Ala Gln Tyr Asp Gly Lys Gly Val Gly Leu Gly100 105 110Pro Gly Pro Met Gly Leu Met Gly Pro Arg Gly Pro Pro Gly Ala Ala115 120 125Gly Ala Pro Gly Pro Gln Gly Phe Gln Gly Pro Ala Gly Glu Pro Gly130 135 140Glu Pro Gly Gln Thr Gly Pro Ala Gly Ala Arg Gly Pro Ala Gly Pro145 150 155 160Pro Gly Lys Ala Gly Glu Asp Gly His Pro Gly Lys Pro Gly Arg Pro165 170 175Gly Glu Arg Gly Val Val Gly Pro Gln Gly Ala Arg Gly Phe Pro Gly180 185 190Thr Pro Gly Leu Pro Gly Phe Lys Gly Ile Arg Gly His Asn Gly Leu195 200 205Asp Gly Leu Lys Gly Gln Pro Gly Ala Pro Gly Val Lys Gly Glu Pro210 215 220
Gly Ala Pro Gly Glu Asn Gly Thr Pro Gly Gln Thr Gly Ala Arg Gly225 230 235 240Leu Pro Gly Glu Arg Gly Arg Val Gly Ala Pro Gly Pro Ala Gly Ala245 250 255Arg Gly Ser Asp Gly Ser Val Gly Pro Val Gly Pro Ala Gly Pro Ile260 265 270Gly Ser Ala Gly Pro Pro Gly Phe Pro Gly Ala Pro Gly Pro Lys Gly275 280 285Glu Ile Gly Ala Val Gly Asn Ala Gly Pro Thr Gly Pro Ala Gly Pro290 295 300Arg Gly Glu Val Gly Leu Pro Gly Leu Ser Gly Pro Val Gly Pro Pro305 310 315 320Gly Asn Pro Gly Ala Asn Gly Leu Thr Gly Ala Lys Gly Ala Ala Gly325 330 335Leu Pro Gly Val Ala Gly Ala Pro Gly Leu Pro Gly Pro Arg Gly Ile340 345 350Pro Gly Pro Val Gly Ala Ala Gly Ala Thr Gly Ala Arg Gly Leu Val355 360 365Gly Glu Pro Gly Pro Ala Gly Ser Lys Gly Glu Ser Gly Asn Lys Gly370 375 380Glu Pro Gly Ser Ala Gly Pro Gln Gly Pro Pro Gly Pro Ser Gly Glu385 390 395 400
Glu Gly Lys Arg Gly Pro Asn Gly Glu Ala Gly Ser Ala Gly Pro Pro405 410 415Gly Pro Pro Gly Leu Arg Gly Ser Pro Gly Ser Arg Gly Leu Pro Gly420 425 430Ala Asp Gly Arg Ala Gly Val Met Gly Pro Pro Gly Ser Arg Gly Ala435 440 445Ser Gly Pro Ala Gly Val Arg Gly Pro Asn Gly Asp Ala Gly Arg Pro450 455 460Gly Glu Pro Gly Leu Met Gly Pro Arg Gly Leu Pro Gly Ser Pro Gly465 470 475 480Asn Ile Gly Pro Ala Gly Lys Glu Gly Pro Val Gly Leu Pro Gly Ile485 490 495Asp Gly Arg Pro Gly Pro Ile Gly Pro Ala Gly Ala Arg Gly Glu Pro500 505 510Gly Asn Ile Gly Phe Pro Gly Pro Lys Gly Pro Thr Gly Asp Pro Gly515 520 525Lys Asn Gly Asp Lys Gly His Ala Gly Leu Ala Gly Ala Arg Gly Ala530 535 540Pro Gly Pro Asp Gly Asn Asn Gly Ala Gln Gly Pro Pro Gly Pro Gln545 550 555 560Gly Val Gln Gly Gly Lys Gly Glu Gln Gly Pro Ala Gly Pro Pro Gly565 570 575
Phe Gln Gly Leu Pro Gly Pro Ser Gly Pro Ala Gly Glu Val Gly Lys580 585 590Pro Gly Glu Arg Gly Leu His Gly Glu Phe Gly Leu Pro Gly Pro Ala595 600 605Gly Pro Arg Gly Glu Arg Gly Pro Pro Gly Glu Ser Gly Ala Ala Gly610 615 620Pro Thr Gly Pro Ile Gly Ser Arg Gly Pro Ser Gly Pro Pro Gly Pro625 630 635 640Asp Gly Asn Lys Gly Glu Pro Gly Val Val Gly Ala Val Gly Thr Ala645 650 655Gly Pro Ser Gly Pro Ser Gly Leu Pro Gly Glu Arg Gly Ala Ala Gly660 665 670Ile Pro Gly Gly Lys Gly Glu Lys Gly Glu Pro Gly Leu Arg Gly Glu675 680 685Ile Gly Asn Pro Gly Arg Asp Gly Ala Arg Gly Ala His Gly Ala Val690 695 700Gly Ala Pro Gly Pro Ala Gly Ala Thr Gly Asp Arg Gly Glu Ala Gly705 710 715 720Ala Ala Gly Pro Ala Gly Pro Ala Gly Pro Arg Gly Ser Pro Gly Glu725 730 735Arg Gly Glu Val Gly Pro Ala Gly Pro Asn Gly Phe Ala Gly Pro Ala740 745 750
Gly Ala Ala Gly Gln Pro Gly Ala Lys Gly Glu Arg Gly Gly Lys Gly755 760 765Pro Lys Gly Glu Asn Gly Val Val Gly Pro Thr Gly Pro Val Gly Ala770 775 780Ala Gly Pro Ala Gly Pro Asn Gly Pro Pro Gly Pro Ala Gly Ser Arg785 790 795 800Gly Asp Gly Gly Pro Pro Gly Met Thr Gly Phe Pro Gly Ala Ala Gly805 810 815Arg Thr Gly Pro Pro Gly Pro Ser Gly Ile Ser Gly Pro Pro Gly Pro820 825 830Pro Gly Pro Ala Gly Lys Glu Gly Leu Arg Gly Pro Arg Gly Asp Gln835 840 845Gly Pro Val Gly Arg Thr Gly Glu Val Gly Ala Val Gly Pro Pro Gly850 855 860Phe Ala Gly Glu Lys Gly Pro Ser Gly Glu Ala Gly Thr Ala Gly Pro865 870 875 880Pro Gly Thr Pro Gly Pro Gln Gly Leu Leu Gly Ala Pro Gly Ile Leu885 890 895Gly Leu Pro Gly Ser Arg Gly Glu Arg Gly Leu Pro Gly Val Ala Gly900 905 910Ala Val Gly Glu Pro Gly Pro Leu Gly Ile Ala Gly Pro Pro Gly Ala915 920 925
Arg Gly Pro Pro Gly Ala Val Gly Ser Pro Gly Val Asn Gly Ala Pro930 935 940Gly Glu Ala Gly Arg Asp Gly Asn Pro Gly Asn Asp Gly Pro Pro Gly945 950 955 960Arg Asp Gly Gln Pro Gly His Lys Gly Glu Arg Gly Tyr Pro Gly Asn965 970 975Ile Gly Pro Val Gly Ala Ala Gly Ala Pro Gly Pro His Gly Pro Val980 985 990Gly Pro Ala Gly Lys His Gly Asn Arg Gly Glu Thr Gly Pro Ser Gly995 1000 1005Pro Val Gly Pro Ala Gly Ala Val Gly Pro Arg Gly Pro Ser Gly1010 1015 1020Pro Gln Gly Ile Arg Gly Asp Lys Gly Glu Pro Gly Glu Lys Gly1025 1030 1035Pro Arg Gly Leu Pro Gly Phe Lys Gly His Asn Gly Leu Gln Gly1040 1045 1050Leu Pro Gly Ile Ala Gly His His Gly Asp Gln Gly Ala Pro Gly1055 1060 1065Ser Val Gly Pro Ala Gly Pro Arg Gly Pro Ala Gly Pro Ser Gly1070 1075 1080Pro Ala Gly Lys Asp Gly Arg Thr Gly His Pro Gly Thr Val Gly1085 1090 1095
Pro Ala Gly Ile Arg Gly Pro Gln Gly His Gln Gly Pro Ala Gly1100 1105 1110Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Val Ser Gly1115 1120 1125Gly Gly Tyr Asp Phe Gly Tyr Asp Gly Asp Phe Tyr Arg Ala Asp1130 1135 1140Gln Pro Arg Ser Ala Pro Ser Leu Arg Pro Lys Asp Tyr Glu Val1145 1150 1155Asp Ala Thr Leu Lys Ser Leu Asn Asn Gln Ile Glu Thr Leu Leu1160 1165 1170Thr Pro Glu Gly Ser Arg Lys Asn Pro Ala Arg Thr Cys Arg Asp1175 1180 1185Leu Arg Leu Ser His Pro Glu Trp Ser Ser Gly Tyr Tyr Trp Ile1190 1195 1200Asp Pro Asn Gln Gly Cys Thr Met Glu Ala Ile Lys Val Tyr Cys1205 1210 1215Asp Phe Pro Thr Gly Glu Thr Cys Ile Arg Ala Gln Pro Glu Asn1220 1225 1230Ile Pro Ala Lys Asn Trp Tyr Arg Ser Ser Lys Asp Lys Lys His1235 1240 1245Val Trp Leu Gly Glu Thr Ile Asn Ala Gly Ser Gln Phe Glu Tyr1250 1255 1260
Asn Val Glu Gly Val Thr Ser Lys Glu Met Ala Thr Gln Leu Ala1265 1270 1275Phe Met Arg Leu Leu Ala Asn Tyr Ala Ser Gln Asn Ile Thr Tyr1280 1285 1290His Cys Lys Asn Ser Ile Ala Tyr Met Asp Glu Glu Thr Gly Asn1295 1300 1305Leu Lys Lys Ala Val Ile Leu Gln Gly Ser Asn Asp Val Glu Leu1310 1315 1320Val Ala Glu Gly Asn Ser Arg Phe Thr Tyr Thr Val Leu Val Asp1325 1330 1335Gly Cys Ser Lys Lys Thr Asn Glu Trp Gly Lys Thr Ile Ile Glu1340 1345 1350Tyr Lys Thr Asn Lys Pro Ser Arg Leu Pro Phe Leu Asp Ile Ala1355 1360 1365Pro Leu Asp Ile Gly Gly Ala Asp His Glu Phe Phe Val Asp Ile1370 1375 1380Gly Pro Val Cys Phe Lys1385<210>7<211>127<212>DNA<213>人工序列<220>
<223>含有擬南芥內(nèi)切-1,4-β-葡聚糖酶的質(zhì)外體信號(hào)編碼區(qū)和側(cè)翼區(qū)的合成序列
<400>7gccatggcta ggaagtcttt gattttccca gtgattcttc ttgctgtgct tcttttctct60ccacctattt actctgctgg acacgattat agggatgctc ttaggaagtc atctatggct120caattgc 127<210>8<211>127<212>DNA<213>人工序列<220>
<223>擬南芥內(nèi)切-1,4-β-葡聚糖酶的質(zhì)外體信號(hào)和側(cè)翼區(qū)的合成序列<220>
<221>CDS<222>(10)..(120)<400>8gccatggct agg aag tct ttg att ttc cca gtg att ctt ctt gct gtg ctt51Arg Lys Ser Leu Ile Phe Pro Val Ile Leu Leu Ala Val Leu1 5 10ctt ttc tct cca cct att tac tct gct gga cac gat tat agg gat gct 99Leu Phe Ser Pro Pro Ile Tyr Ser Ala Gly His Asp Tyr Arg Asp Ala15 20 25 30ctt agg aag tca tct atg gct caattgc 127Leu Arg Lys Ser Ser Met Ala35<210>9<211>37<212>PRT<213>人工序列<220>
<223>擬南芥內(nèi)切-1,4-β-葡聚糖酶的質(zhì)外體信號(hào)和側(cè)翼區(qū)的合成序列<400>9
Arg Lys Ser Leu Ile Phe Pro Val Ile Leu Leu Ala Val Leu Leu Phe1 5 10 15Ser Pro Pro Ile Tyr Ser Ala Gly His Asp Tyr Arg Asp Ala Leu Arg20 25 30Lys Ser Ser Met Ala35<210>10<211>1037<212>DNA<213>人工序列<220>
<223>菊花rbcS1啟動(dòng)子和5’UTR<400>10aaatggcgcg ccaagcttag acaaacaccc cttgttatac aaagaatttc gctttacaaa60atcaaattcg agaaaataat atatgcacta aataagatca ttcggatcca atctaaccaa120ttacgatacg ctttgggtac acttgatttt tgtttcagta gttacatata tcttgtttta180tatgctatct ttaaggatct tcactcaaag actatttgtt gatgttcttg atggggctcg240gaagatttga tatgatacac tctaatcttt aggagatacc agccaggatt atattcagta300agacaatcaa attttacgtg ttcaaactcg ttatcttttc atttaatgga tgagccagaa360tctctataga atgattgcaa tcgagaatat gttcggccga tatccctttg ttggcttcaa420tattctacat atcacacaag aatcgaccgt attgtaccct ctttccataa aggaacacac480agtatgcaga tgcttttttc ccacatgcag taacataggt attcaaaaat ggctaaaaga540agttggataa caaattgaca actatttcca tttctgttat ataaatttca caacacacaa600aagcccgtaa tcaagagtct gcccatgtac gaaataactt ctattatttg gtattgggcc660
taagcccagc tcagagtacg tgggggtacc acatatagga aggtaacaaa atactgcaag720atagccccat aacgtaccag cctctcctta ccacgaagag ataagatata agacccaccc780tgccacgtgt cacatcgtca tggtggttaa tgataaggga ttacatcctt ctatgtttgt840ggacatgatg catgtaatgt catgagccac atgatccaat ggccacagga acgtaagaat900gtagatagat ttgattttgt ccgttagata gcaaacaaca ttataaaagg tgtgtatcaa960tacgaactaa ttcactcatt ggattcatag aagtccattc ctcctaagta tctaaacata1020tgcaattgtc gactaaa 1037<210>11<211>975<212>DNA<213>人工序列<220>
<223>菊花rbcS1 3’UTR和終止子<400>11aaaaggatcc gcggccgcat aagttttact atttaccaag acttttgaat attaaccttc60ttgtaacgag tcggttaaat ttgattgttt agggttttgt attatttttt tttggtcttt120taattcatca ctttaattcc ctaattgtct gttcatttcg ttgtttgttt ccggatcgat180aatgaaatgt aagagatatc atatataaat aataaattgt cgtttcatat ttgcaatctt240tttttacaaa cctttaatta attgtatgta tgacattttc ttcttgttat attaggggga300aataatgtta aataaaagta caaaataaac tacagtacat cgtactgaat aaattaccta360gccaaaaagt acacctttcc atatacttcc tacatgaagg cattttcaac attttcaaat420aaggaatgct acaaccgcat aataacatcc acaaattttt ttataaaata acatgtcaga480cagtgattga aagattttat tatagtttcg ttatcttctt ttctcattaa gcgaatcact540acctaacacg tcattttgtg aaatattttt tgaatgtttt tatatagttg tagcattcct600
cttttcaaat tagggtttgt ttgagatagc atttcagccg gttcatacaa cttaaaagca660tactctaatg ctggaaaaaa gactaaaaaa tcttgtaagt tagcgcagaa tattgaccca720aattatatac acacatgacc ccatatagag actaattaca cttttaacca ctaataatta780ttactgtatt ataacatcta ctaattaaac ttgtgagttt ttgctagaat tattatcata840tatactaaaa ggcaggaacg caaacattgc cccggtactg tagcaactac ggtagacgca900ttaattgtct atagtggacg cattaattaa ccaaaaccgc ctctttcccc ttcttcttga960agcttgagct ctttt 975<210>12<211>1633<212>DNA<213>人工序列<220>
<223>含有與人脯氨酰4-羥化酶β亞基融合的大麥巰基蛋白酶aleurain前體基因的維管信號(hào)序列編碼區(qū)和側(cè)翼區(qū)的合成序列<400>12ctcgagtaaa ccatggctca tgctagggtt ttgcttttgg ctcttgctgt tcttgctact60gctgctgttg ctgtggcttc ttcttcatct ttcgctgatt ctaacccaat taggccagtg120actgatagag ctgcttctac tcttgctcaa ttggtcgaca tggatgctcc agaagaggag180gatcacgttc ttgtgcttag gaagtctaac ttcgctgaag ctcttgctgc tcacaagtac240cttcttgtgg agttttatgc tccttggtgc ggacattgca aagctcttgc tccagagtat300gctaaggctg ctggaaagtt gaaggctgag ggatctgaaa ttaggcttgc taaagtggat360gctactgagg agtctgatct tgctcaacag tacggagtta ggggataccc aactattaag420ttcttcagga acggagatac tgcttctcca aaggagtata ctgctggaag ggaggctgat480gatattgtga actggcttaa gaagagaact ggaccagctg ctactactct tccagatgga540gctgctgctg aatctcttgt ggagtcatct gaggtggcag tgattggatt cttcaaggat600
gtggagtctg attctgctaa gcagttcctt caagctgctg aggctattga tgatattcca660ttcggaatta cttctaactc tgatgtgttc tctaagtacc agcttgataa ggatggagtg720gtgcttttca agaaattcga tgagggaagg aacaatttcg agggagaggt gacaaaggag780aaccttcttg atttcattaa gcacaaccag cttccacttg tgattgagtt cactgagcag840actgctccaa agattttcgg aggagagatt aagactcaca ttcttctttt ccttccaaag900tctgtgtctg attacgatgg aaagttgtct aacttcaaga ctgctgctga gtctttcaag960ggaaagattc ttttcatttt cattgattct gatcacactg ataaccagag gattcttgag1020ttcttcggac ttaagaagga agagtgccca gctgttaggc ttattactct tgaggaggag1080atgactaagt acaagccaga gtctgaagaa cttactgctg agaggattac tgagttctgc1140cacagattcc ttgagggaaa gattaagcca caccttatgt ctcaagagct tccagaggat1200tgggataagc agccagttaa ggtgttggtg ggtaaaaact tcgaggatgt ggctttcgat1260gagaagaaga acgtgttcgt ggagttctac gcaccttggt gtggtcactg taagcagctt1320gctccaattt gggataagtt gggagagact tacaaggatc acgagaacat tgtgattgct1380aagatggatt ctactgctaa cgaggtggag gctgttaagg ttcactcttt cccaactttg1440aagttcttcc cagcttctgc tgataggact gtgattgatt acaacggaga aaggactctt1500gatggattca agaagttcct tgagtctgga ggacaagatg gagctggaga tgatgatgat1560cttgaggatt tggaagaagc tgaggagcca gatatggagg aggatgatga tcagaaggct1620gtgtgatgag ctc 1633<210>13<211>537<212>PRT<213>人工序列<220>
<223>含有與人脯氨酰4-羥化酶β亞基融合的大麥巰基蛋白酶aleurain前體基因的維管信號(hào)序列和側(cè)翼區(qū)的合成序列<400>13Met Ala His Ala Arg Val Leu Leu Leu Ala Leu Ala Val Leu Ala Thr1 5 10 15Ala Ala Val Ala Val Ala Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro20 25 30Ile Arg Pro Val Thr Asp Arg Ala Ala Ser Thr Leu Ala Gln Leu Val35 40 45Asp Met Asp Ala Pro Glu Glu Glu Asp His Val Leu Val Leu Arg Lys50 55 60Ser Asn Phe Ala Glu Ala Leu Ala Ala His Lys Tyr Leu Leu Val Glu65 70 75 80Phe Tyr Ala Pro Trp Cys Gly His Cys Lys Ala Leu Ala Pro Glu Tyr85 90 95Ala Lys Ala Ala Gly Lys Leu Lys Ala Glu Gly Ser Glu Ile Arg Leu100 105 110Ala Lys Val Asp Ala Thr Glu Glu Set Asp Leu Ala Gln Gln Tyr Gly115 120 125Val Arg Gly Tyr Pro Thr Ile Lys Phe Phe Arg Asn Gly Asp Thr Ala130 135 140Set Pro Lys Glu Tyr Thr Ala Gly Arg Glu Ala Asp Asp Ile Val Asn145 150 155 160
Trp Leu Lys Lys Arg Thr Gly Pro Ala Ala Thr Thr Leu Pro Asp Gly165 170 175Ala Ala Ala Glu Ser Leu Val Glu Ser Ser Glu Val Ala Val Ile Gly180 185 190Phe Phe Lys Asp Val Glu Ser Asp Ser Ala Lys Gln Phe Leu Gln Ala195 200 205Ala Glu Ala Ile Asp Asp Ile Pro Phe Gly Ile Thr Ser Asn Ser Asp210 215 220Val Phe Ser Lys Tyr Gln Leu Asp Lys Asp Gly Val Val Leu Phe Lys225 230 235 240Lys Phe Asp Glu Gly Arg Asn Asn Phe Glu Gly Glu Val Thr Lys Glu245 250 255Asn Leu Leu Asp Phe Ile Lys His Asn Gln Leu Pro Leu Val Ile Glu260 265 270Phe Thr Glu Gln Thr Ala Pro Lys Ile Phe Gly Gly Glu Ile Lys Thr275 280 285His Ile Leu Leu Phe Leu Pro Lys Ser Val Ser Asp Tyr Asp Gly Lys290 295 300Leu Ser Asn Phe Lys Thr Ala Ala Glu Ser Phe Lys Gly Lys Ile Leu305 310 315 320Phe Ile Phe Ile Asp Ser Asp His Thr Asp Asn Gln Arg Ile Leu Glu325 330 335
Phe Phe Gly Leu Lys Lys Glu Glu Cys Pro Ala Val Arg Leu Ile Thr340 345 350Leu Glu Glu Glu Met Thr Lys Tyr Lys Pro Glu Ser Glu Glu Leu Thr355 360 365Ala Glu Arg Ile Thr Glu Phe Cys His Arg Phe Leu Glu Gly Lys Ile370 375 380Lys Pro His Leu Met Ser Gln Glu Leu Pro Glu Asp Trp Asp Lys Gln385 390 395 400Pro Val Lys Val Leu Val Gly Lys Asn Phe Glu Asp Val Ala Phe Asp405 410 415Glu Lys Lys Asn Val Phe Val Glu Phe Tyr Ala Pro Trp Cys Gly His420 425 430Cys Lys Gln Leu Ala Pro Ile Trp Asp Lys Leu Gly Glu Thr Tyr Lys435 440 445Asp His Glu Asn Ile Val Ile Ala Lys Met Asp Ser Thr Ala Asn Glu450 455 460Val Glu Ala Val Lys Val His Ser Phe Pro Thr Leu Lys Phe Phe Pro465 470 475 480Ala Ser Ala Asp Arg Thr Val Ile Asp Tyr Asn Gly Glu Arg Thr Leu485 490 495Asp Gly Phe Lys Lys Phe Leu Glu Ser Gly Gly Gln Asp Gly Ala Gly500 505 510
Asp Asp Asp Asp Leu Glu Asp Leu Glu Glu Ala Glu Glu Pro Asp Met515 520 525Glu Glu Asp Asp Asp Gln Lys Ala Val530 535<210>14<211>1723<212>DNA<213>人工序列<220>
<223>含有與人脯氨酰4-羥化酶α-1亞基融合的大麥巰基蛋白酶aleurain前體基因的維管信號(hào)序列編碼區(qū)和側(cè)翼區(qū)的合成序列<400>14ctcgagtaaa ccatggctca tgctagggtt ttgcttttgg ctcttgctgt tcttgctact60gctgctgttg ctgtggcttc ttcttcatct ttcgctgatt ctaacccaat taggccagtg120actgatagag ctgcttctac tcttgctcaa ttggtcgaca tgcacccagg attcttcact180tctattggac agatgactga tcttattcac actgagaagg atcttgtgac ttctcttaag240gattacatta aggctgagga ggataagttg gagcagatta agaagtgggc tgagaagttg300gataggctta cttctactgc tacaaaagat ccagagggat tcgttggtca tccagtgaac360gctttcaagt tgatgaagag gcttaacact gagtggagtg agcttgagaa ccttgtgctt420aaggatatgt ctgatggatt catttctaac cttactattc agaggcagta cttcccaaat480gatgaggatc aagtgggagc tgctaaggct cttcttaggc ttcaggatac ttacaacctt540gatactgata caatttctaa gggaaacctt ccaggagtta agcacaagtc tttccttact600gctgaggatt gcttcgagct tggaaaggtt gcatacactg aggctgatta ctaccacact660gagctttgga tggaacaagc tcttaggcaa cttgatgagg gagagatttc tactattgat720aaggtgtcag tgcttgatta cctttcttac gctgtgtacc agcagggtga tcttgataag780
gctcttttgc ttactaagaa gttgcttgag cttgatccag aacatcagag ggctaacgga840aaccttaagt acttcgagta cattatggct aaggaaaagg atgtgaacaa gtctgcttct900gatgatcagt ctgatcaaaa gactactcca aagaagaagg gagtggctgt tgattatctt960cctgagaggc agaagtatga gatgttgtgt aggggagagg gtattaagat gactccaagg1020aggcagaaga agttgttctg caggtatcac gatggaaaca ggaacccaaa gttcattctt1080gctccagcta agcaagaaga tgagtgggat aagccaagga ttattaggtt ccacgatatt1140atttctgatg ctgagattga gattgtgaag gatcttgcta agccaagact taggagggct1200actatttcta accctattac tggtgatctt gagactgtgc actacaggat ttctaagtct1260gcttggcttt ctggatacga gaacccagtg gtgtctagga ttaacatgag gattcaggat1320cttactggac ttgatgtgtc tactgctgag gagcttcaag ttgctaacta cggagttgga1380ggacaatatg agccacactt cgatttcgct aggaaggatg agccagatgc ttttaaggag1440cttggaactg gaaacaggat tgctacttgg cttttctaca tgtctgatgt ttctgctgga1500ggagctactg ttttcccaga agtgggagct tctgtttggc caaagaaggg aactgctgtg1560ttctggtaca accttttcgc ttctggagag ggagattact ctactaggca tgctgcttgc1620ccagttcttg ttggaaacaa gtgggtgtca aacaagtggc ttcatgagag gggacaagag1680tttagaaggc catgcactct ttctgagctt gagtgatgag ctc 1723<210>15<211>567<212>PRT<213>人工序列<220>
<223>含有與人脯氨酰4-羥化酶α-1亞基融合的大麥巰基蛋白酶aleurain前體基因的維管信號(hào)序列和側(cè)翼區(qū)的合成序列<400>15
Met Ala His Ala Arg Val Leu Leu Leu Ala Leu Ala Val Leu Ala Thr1 5 10 15Ala Ala Val Ala Val Ala Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro20 25 30Ile Arg Pro Val Thr Asp Arg Ala Ala Ser Thr Leu Ala Gln Leu Val35 40 45Asp Met His Pro Gly Phe Phe Thr Ser Ile Gly Gln Met Thr Asp Leu50 55 60Ile His Thr Glu Lys Asp Leu Val Thr Ser Leu Lys Asp Tyr Ile Lys65 70 75 80Ala Glu Glu Asp Lys Leu Glu Gln Ile Lys Lys Trp Ala Glu Lys Leu85 90 95Asp Arg Leu Thr Ser Thr Ala Thr Lys Asp Pro Glu Gly Phe Val Gly100 105 110His Pro Val Asn Ala Phe Lys Leu Met Lys Arg Leu Asn Thr Glu Trp115 120 125Ser Glu Leu Glu Asn Leu Val Leu Lys Asp Met Ser Asp Gly Phe Ile130 135 140Ser Asn Leu Thr Ile Gln Arg Gln Tyr Phe Pro Asn Asp Glu Asp Gln145 150 155 160Val Gly Ala Ala Lys Ala Leu Leu Arg Leu Gln Asp Thr Tyr Asn Leu165 170 175
Asp Thr Asp Thr Ile Ser Lys Gly Asn Leu Pro Gly Val Lys His Lys180 185 190Ser Phe Leu Thr Ala Glu Asp Cys Phe Glu Leu Gly Lys Val Ala Tyr195 200 205Thr Glu Ala Asp Tyr Tyr His Thr Glu Leu Trp Met Glu Gln Ala Leu210 215 220Arg Gln Leu Asp Glu Gly Glu Ile Ser Thr Ile Asp Lys Val Ser Val225 230 235 240Leu Asp Tyr Leu Ser Tyr Ala Val Tyr Gln Gln Gly Asp Leu Asp Lys245 250 255Ala Leu Leu Leu Thr Lys Lys Leu Leu Glu Leu Asp Pro Glu His Gln260 265 270Arg Ala Asn Gly Asn Leu Lys Tyr Phe Glu Tyr Ile Met Ala Lys Glu275 280 285Lys Asp Val Asn Lys Ser Ala Ser Asp Asp Gln Ser Asp Gln Lys Thr290 295 300Thr Pro Lys Lys Lys Gly Val Ala Val Asp Tyr Leu Pro Glu Arg Gln305 310 315 320Lys Tyr Glu Met Leu Cys Arg Gly Glu Gly Ile Lys Met Thr Pro Arg325 330 335Arg Gln Lys Lys Leu Phe Cys Arg Tyr His Asp Gly Asn Arg Asn Pro340 345 350
Lys Phe Ile Leu Ala Pro Ala Lys Gln Glu Asp Glu Trp Asp Lys Pro355 360 365Arg Ile Ile Arg Phe His Asp Ile Ile Ser Asp Ala Glu Ile Glu Ile370 375 380Val Lys Asp Leu Ala Lys Pro Arg Leu Arg Arg Ala Thr Ile Ser Asn385 390 395 400Pro Ile Thr Gly Asp Leu Glu Thr Val His Tyr Arg Ile Ser Lys Ser405 410 415Ala Trp Leu Ser Gly Tyr Glu Asn Pro Val Val Ser Arg Ile Asn Met420 425 430Arg Ile Gln Asp Leu Thr Gly Leu Asp Val Ser Thr Ala Glu Glu Leu435 440 445Gln Val Ala Asn Tyr Gly Val Gly Gly Gln Tyr Glu Pro His Phe Asp450 455 460Phe Ala Arg Lys Asp Glu Pro Asp Ala Phe Lys Glu Leu Gly Thr Gly465 470 475 480Asn Arg Ile Ala Thr Trp Leu Phe Tyr Met Ser Asp Val Ser Ala Gly485 490 495Gly Ala Thr Val Phe Pro Glu Val Gly Ala Ser Val Trp Pro Lys Lys500 505 510Gly Thr Ala Val Phe Trp Tyr Asn Leu Phe Ala Ser Gly Glu Gly Asp515 520 525
Tyr Ser Thr Arg His Ala Ala Cys Pro Val Leu Val Gly Asn Lys Trp530 535 540Val Ser Asn Lys Trp Leu His Glu Arg Gly Gln Glu Phe Arg Arg Pro545 550 555 560Cys Thr Leu Ser Glu Leu Glu565<210>16<211>928<212>DNA<213>人工序列<220>
<223>含有與植物脯氨酰4-羥化酶植物融合的大麥巰基蛋白酶aleurain前體基因的維管信號(hào)序列編碼區(qū)和側(cè)翼區(qū)的合成序列<400>16ctcgagtaaa ccatggctca tgctagggtt ttgcttttgg ctcttgctgt tcttgctact60gctgctgttg ctgtggcttc ttcttcatct ttcgctgatt ctaacccaat taggccagtg120actgatagag ctgcttctac tcttgctcaa ttggtcgaca tgcttggtat tctttctctt180ccaaacgcta acaggaactc ttctaagact aacgatctta ctaacattgt gaggaagtct240gagacttctt ctggagatga ggagggaaat ggagaaagat gggtggaagt gatttcttgg300gagccaaggg ctgttgttta ccacaacttc cttactaatg aggagtgcga gcaccttatt360tctcttgcta agccatctat ggtgaagtct actgtggtgg atgagaaaac tggaggatct420aaggattcaa gagtgaggac ttcatctggt actttcctta ggaggggaca tgatgaagtt480gtggaagtta ttgagaagag gatttctgat ttcactttca ttccagtgga gaacggagaa540ggacttcaag ttcttcacta ccaagtggga caaaagtacg agccacacta cgattacttc600cttgatgagt tcaacactaa gaacggagga cagaggattg ctactgtgct tatgtacctt660
tctgatgtgg atgatggagg agagactgtt tttccagctg ctaggggaaa catttctgct720gttccttggt ggaacgagct ttctaagtgt ggaaaggagg gactttctgt gcttccaaag780aaaagggatg ctcttctttt ctggaacatg aggccagatg cttctcttga tccatcttct840cttcatggag gatgcccagt tgttaaggga aacaagtggt catctactaa gtggttccac900gtgcacgagt tcaaggtgta atgagctc 928<210>17<211>302<212>PRT<213>人工序列<220>
<223>含有與植物脯氨酰4-羥化酶植物融合的大麥巰基蛋白酶aleurain前體基因的維管信號(hào)序列和側(cè)翼區(qū)的合成序列<400>17Met Ala His Ala Arg Val Leu Leu Leu Ala Leu Ala Val Leu Ala Thr1 5 10 15Ala Ala Val Ala Val Ala Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro20 25 30Ile Arg Pro Val Thr Asp Arg Ala Ala Ser Thr Leu Ala Gln Leu Val35 4 0 45Asp Met Leu Gly Ile Leu Ser Leu Pro Asn Ala Asn Arg Asn Ser Ser50 55 60Lys Thr Asn Asp Leu Thr Asn Ile Val Arg Lys Ser Glu Thr Ser Ser65 70 75 80Gly Asp Glu Glu Gly Asn Gly Glu Arg Trp Val Glu Val Ile Ser Trp
85 90 95Glu Pro Arg Ala Val Val Tyr His Asn Phe Leu Thr Asn Glu Glu Cys100 105 110Glu His Leu Ile Ser Leu Ala Lys Pro Ser Met Val Lys Ser Thr Val115 120 125Val Asp Glu Lys Thr Gly Gly Ser Lys Asp Ser Arg Val Arg Thr Ser130 135 140Ser Gly Thr Phe Leu Arg Arg Gly His Asp Glu Val Val Glu Val Ile145 150 155 160Glu Lys Arg Ile Ser Asp Phe Thr Phe Ile Pro Val Glu Asn Gly Glu165 170 175Gly Leu Gln Val Leu His Tyr Gln Val Gly Gln Lys Tyr Glu Pro His180 185 190Tyr Asp Tyr Phe Leu Asp Glu Phe Asn Thr Lys Asn Gly Gly Gln Arg195 200 205Ile Ala Thr Val Leu Met Tyr Leu Ser Asp Val Asp Asp Gly Gly Glu210 215 220Thr Val Phe Pro Ala Ala Arg Gly Asn Ile Ser Ala Val Pro Trp Trp225 230 235 240Asn Glu Leu Ser Lys Cys Gly Lys Glu Gly Leu Ser Val Leu Pro Lys245 250 255Lys Arg Asp Ala Leu Leu Phe Trp Asn Met Arg Pro Asp Ala Ser Leu
260 265 270Asp Pro Ser Ser Leu His Gly Gly Cys Pro Val Val Lys Gly Asn Lys275 280 285Trp Ser Ser Thr Lys Trp Phe His Val His Glu Phe Lys Val290 295 300<210>18<211>2689<212>DNA<213>人工序列<220>
<223>含有人前膠原C-蛋白酶編碼區(qū)和側(cè)翼區(qū)的合成序列<400>18agatctatcg atgcatgcca tggtaccgcg ccatggctca attggctgca acatcaaggc60ctgaaagagt ttggccagat ggtgttattc ctttcgttat tggtggaaac tttactggat120ctcagagagc agtttttaga caagctatga gacattggga aaagcacact tgtgtgacat180tccttgaaag gactgatgaa gattcttata ttgtgttcac ataccgtcca tgtggatgct240gctcatatgt tggtagaagg ggaggaggtc cacaagcaat ttctattgga aaaaactgcg300ataagttcgg aattgtggtg catgaattgg gacatgttgt tggtttctgg cacgaacaca360caaggccaga tagggatagg cacgtgtcta ttgtgaggga aaacattcag ccaggtcaag420agtacaattt tcttaagatg gaacctcaag aggtggaatc tctcggagag acttacgact480tcgactccat catgcactac gcaaggaata ctttcagcag gggcatcttc ttggatacca540ttgtgcctaa gtacgaggtg aacggcgtta agccacctat tggtcaaagg actaggctct600ctaagggtga tattgcacag gctaggaagc tctacaaatg tccagcatgc ggagaaactc660ttcaggattc cactggcaac ttctcatctc cagagtaccc aaacggatac tctgctcata720
tgcactgtgt ttggaggatc tcagtgactc ctggagagaa gatcatcctc aacttcactt780ccctcgatct ctatcgttct aggctctgtt ggtacgacta tgtggaagtg agagatggct840tctggagaaa ggctccactt agaggaaggt tctgcggatc taaacttcct gagccaatcg900tgtctactga ttccagattg tgggtggagt tcaggtcctc ttctaattgg gttggcaagg960gcttttttgc tgtgtacgag gctatttgtg gcggcgacgt gaaaaaggac tacggacata1020ttcaaagtcc aaattaccca gatgattacc gtccttcaaa agtgtgtatt tggaggattc1080aagtgagtga gggtttccat gttggattga cattccaatc tttcgaaatt gagagacacg1140attcatgcgc atacgattat ttggaagtga gagatggaca ctctgaatct tctacactta1200ttggaaggta ctgcggttat gagaaacctg atgatattaa gtctacttct agtaggttgt1260ggcttaaatt tgtgtcagat ggttctatta acaaggctgg tttcgcagtg aacttcttca1320aggaagtgga tgaatgctca agacctaaca gaggaggatg tgagcaaaga tgccttaaca1380ctttgggaag ttacaagtgt tcttgcgatc ctggatacga gttggctcct gataagagaa1440gatgcgaagc tgcttgcggt ggttttttga caaaattgaa cggatctatt acttctcctg1500gatggccaaa agagtaccca cctaataaga attgcatttg gcagcttgtt gcacctactc1560agtaccgtat ttcattgcaa ttcgattttt tcgagactga gggtaatgat gtgtgcaagt1620acgatttcgt ggaagtgaga tcaggtctta ctgctgatag taaattgcac ggaaagttct1680gcggatctga aaaaccagaa gtgattacat cacagtacaa caatatgagg gtggagttca1740aatctgataa tactgtttct aaaaaaggtt ttaaggcaca tttcttttct gataaggacg1800agtgctctaa agataatggt ggttgccagc aggattgcgt gaacacattc ggttcatatg1860agtgccaatg ccgtagtgga tttgttcttc acgataacaa acatgattgc aaagaggcag1920gttgcgatca caaggtgaca tctacttcag gtactatcac atctccaaac tggcctgata1980agtatccttc aaaaaaagaa tgtacatggg caatttcttc tacaccaggt catagggtta2040
agttgacatt catggagatg gatattgaga gtcaaccaga gtgcgcttat gatcatcttg2100aggtgttcga tggaagggat gctaaggctc ctgttcttgg tagattctgt ggtagtaaaa2160agccagaacc agtgcttgca acaggatcta ggatgttcct tagattctac tctgataact2220cagttcagag gaaaggattc caagctagtc acgcaactga atgcggtgga caagttagag2280cagatgttaa gactaaggat ctttactcac acgcacagtt cggagataac aactaccctg2340gaggagttga ttgcgagtgg gttattgtgg ctgaagaggg atacggagtt gagcttgttt2400tccagacatt cgaggtggag gaggaaactg attgcggtta cgattatatg gaactttttg2460atggatacga tagtactgct ccaagacttg gaaggtattg tggtagtggt ccaccagaag2520aggtgtactc agctggagat agtgttcttg ttaagttcca cagtgatgat acaattacta2580agaagggatt ccatcttaga tatacttcaa ctaagtttca ggatactctt cattctagga2640agtaatgagc tcgcggccgc atccaagctt ctgcagacgc gtcgacgtc2689<210>19<211>870<212>PRT<213>人工序列<220>
<223>含有人前膠原C-蛋白酶和側(cè)翼區(qū)的合成序列<400>19Met Ala Gin Leu Ala Ala Thr Ser Arg Pro Glu Arg Val Trp Pro Asp1 5 10 15Gly Val Ile Pro Phe Val Ile Gly Gly Asn Phe Thr Gly Ser Gln Arg20 25 30Ala Val Phe Arg Gln Ala Met Arg His Trp Glu Lys His Thr Cys Val35 40 45
Thr Phe Leu Glu Arg Thr Asp Glu Asp Ser Tyr Ile Val Phe Thr Tyr50 55 60Arg Pro Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Gly Gly Pro65 70 75 80Gln Ala Ile Ser Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile Val Val85 90 95His Glu Leu Gly His Val Val Gly Phe Trp His Glu His Thr Arg Pro100 105 110Asp Arg Asp Arg His Val Ser Ile Val Arg Glu Asn Ile Gln Pro Gly115 120 125Gln Glu Tyr Asn Phe Leu Lys Met Glu Pro Gln Glu Val Glu Ser Leu130 135 140Gly Glu Thr Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg Asn Thr145 150 155 160Phe Ser Arg Gly Ile Phe Leu Asp Thr Ile Val Pro Lys Tyr Glu Val165 170 175Asn Gly Val Lys Pro Pro Ile Gly Gln Arg Thr Arg Leu Ser Lys Gly180 185 190Asp Ile Ala Gln Ala Arg Lys Leu Tyr Lys Cys Pro Ala Cys Gly Glu195 200 205Thr Leu Gln Asp Ser Thr Gly Asn Phe Ser Ser Pro Glu Tyr Pro Asn210 215 220
Gly Tyr Ser Ala His Met His Cys Val Trp Arg Ile Ser Val Thr Pro225 230 235 240Gly Glu Lys Ile Ile Leu Asn Phe Thr Ser Leu Asp Leu Tyr Arg Ser245 250 255Arg Leu Cys Trp Tyr Asp Tyr Val Glu Val Arg Asp Gly Phe Trp Arg260 265 270Lys Ala Pro Leu Arg Gly Arg Phe Cys Gly Ser Lys Leu Pro Glu Pro275 280 285Ile Val Ser Thr Asp Ser Arg Leu Trp Val Glu Phe Arg Ser Ser Ser290 295 300Asn Trp Val Gly Lys Gly Phe Phe Ala Val Tyr Glu Ala Ile Cys Gly305 310 315 320Gly Asp Val Lys Lys Asp Tyr Gly His Ile Gln Ser Pro Asn Tyr Pro325 330 335Asp Asp Tyr Arg Pro Ser Lys Val Cys Ile Trp Arg Ile Gln Val Ser340 345 350Glu Gly Phe His Val Gly Leu Thr Phe Gln Ser Phe Glu Ile Glu Arg355 360 365His Asp Ser Cys Ala Tyr Asp Tyr Leu Glu Val Arg Asp Gly His Ser370 375 380Glu Ser Ser Thr Leu Ile Gly Arg Tyr Cys Gly Tyr Glu Lys Pro Asp385 390 395 400
Asp Ile Lys Ser Thr Ser Ser Arg Leu Trp Leu Lys Phe Val Ser Asp405 410 415Gly Ser Ile Asn Lys Ala Gly Phe Ala Val Asn Phe Phe Lys Glu Val420 425 430Asp Glu Cys Ser Arg Pro Asn Arg Gly Gly Cys Glu Gln Arg Cys Leu435 440 445Asn Thr Leu Gly Ser Tyr Lys Cys Ser Cys Asp Pro Gly Tyr Glu Leu450 455 460Ala Pro Asp Lys Arg Arg Cys Glu Ala Ala Cys Gly Gly Phe Leu Thr465 470 475 480Lys Leu Asn Gly Ser Ile Thr Ser Pro Gly Trp Pro Lys Glu Tyr Pro485 490 495Pro Asn Lys Asn Cys Ile Trp Gln Leu Val Ala Pro Thr Gln Tyr Arg500 505 510Ile Ser Leu Gln Phe Asp Phe Phe Glu Thr Glu Gly Asn Asp Val Cys515 520 525Lys Tyr Asp Phe Val Glu Val Arg Ser Gly Leu Thr Ala Asp Ser Lys530 535 540Leu His Gly Lys Phe Cys Gly Ser Glu Lys Pro Glu Val Ile Thr Ser545 550 555 560Gln Tyr Asn Asn Met Arg Val Glu Phe Lys Ser Asp Asn Thr Val Ser565 570 575
Lys Lys Gly Phe Lys Ala His Phe Phe Ser Asp Lys Asp Glu Cys Ser580 585 590Lys Asp Asn Gly Gly Cys Gln Gln Asp Cys Val Asn Thr Phe Gly Ser595 600 605Tyr Glu Cys Gln Cys Arg Ser Gly Phe Val Leu His Asp Asn Lys His610 615 620Asp Cys Lys Glu Ala Gly Cys Asp His Lys Val Thr Ser Thr Ser Gly625 630 635 640Thr Ile Thr Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Lys Lys Glu645 650 655Cys Thr Trp Ala Ile Ser Ser Thr Pro Gly His Arg Val Lys Leu Thr660 665 670Phe Met Glu Met Asp Ile Glu Ser Gln Pro Glu Cys Ala Tyr Asp His675 680 685Leu Glu Val Phe Asp Gly Arg Asp Ala Lys Ala Pro Val Leu Gly Arg690 695 700Phe Cys Gly Ser Lys Lys Pro Glu Pro Val Leu Ala Thr Gly Ser Arg705 710 715 720Met Phe Leu Arg Phe Tyr Ser Asp Asn Ser Val Gln Arg Lys Gly Phe725 730 735Gln Ala Ser His Ala Thr Glu Cys Gly Gly Gln Val Arg Ala Asp Val740 745 750
Lys Thr Lys Asp Leu Tyr Ser His Ala Gln Phe Gly Asp Asn Asn Tyr755 760 765Pro Gly Gly Val Asp Cys Glu Trp Val Ile Val Ala Glu Glu Gly Tyr770 775 780Gly Val Glu Leu Val Phe Gln Thr Phe Glu Val Glu Glu Glu Thr Asp785 790 795 800Cys Gly Tyr Asp Tyr Met Glu Leu Phe Asp Gly Tyr Asp Ser Thr Ala805 810 815Pro Arg Leu Gly Arg Tyr Cys Gly Ser Gly Pro Pro Glu Glu Val Tyr820 825 830Ser Ala Gly Asp Ser Val Leu Val Lys Phe His Ser Asp Asp Thr Ile835 840 845Thr Lys Lys Gly Phe His Leu Arg Tyr Thr Ser Thr Lys Phe Gln Asp850 855 860Thr Leu His Ser Arg Lys865 870<210>20<211>2912<212>DNA<213>人工序列<220>
<223>含有人前膠原I N-蛋白酶編碼區(qū)和側(cè)翼區(qū)的合成序列<400>20gcgccatggc tcaattgagg agaagggcta ggagacacgc agctgatgat gattacaaca 60
ttgaagtttt gcttggtgtt gatgatagtg tggtgcaatt ccacggaaaa gagcatgttc120agaaatatct tttgacactt atgaatattg tgaacgaaat ctaccatgat gagtctttgg180gagcacacat taacgtggtt cttgtgagga ttattcttct ttcatacggt aaatctatgt240cacttattga gattggaaac ccttctcagt ctcttgagaa tgtgtgcaga tgggcatacc300ttcaacagaa gcctgatact ggacacgatg agtatcacga tcacgctatt ttccttacaa360ggcaggattt cggtccaagt ggaatgcaag gatatgctcc tgttactggt atgtgccacc420ctgttaggtc ttgtacactt aaccacgagg atggtttttc atctgctttc gtggtggctc480atgagacagg tcatgttttg ggaatggaac atgatggaca gggtaataga tgtggagatg540aagtgagact tggttcaatt atggctcctc ttgttcaagc tgcttttcat aggttccact600ggagtaggtg ttcacagcaa gagttgagta gataccttca ttcttacgat tgcttgcttg660atgatccatt tgctcatgat tggccagctt tgcctcaact tcctggattg cactactcta720tgaacgagca gtgcagattt gatttcggtc ttggttacat gatgtgcaca gctttcagga780ctttcgatcc atgcaaacag ttgtggtgtt cacacccaga taacccatat ttctgtaaaa840caaaaaaagg tccaccactt gatggtacta tgtgcgcacc tggaaagcac tgcttcaagg900gacactgcat ttggcttact cctgatattc ttaaaaggga tggatcatgg ggagcttggt960ctccattcgg aagttgctca agaacttgcg gaacaggtgt taagtttaga actaggcagt1020gcgataatcc acaccctgct aatggtggta gaacttgctc tggacttgct tacgattttc1080agttgtgttc taggcaagat tgccctgata gtcttgctga ttttagagaa gagcaatgta1140gacagtggga tctttacttt gagcacggcg acgctcagca ccactggctt ccacacgagc1200atagagatgc aaaagaaagg tgtcaccttt attgcgagag tagagagact ggagaggtgg1260tgtcaatgaa gagaatggtg cacgatggta caaggtgttc ttataaggat gcattctctt1320tgtgtgtgag gggagattgc aggaaagtgg gttgtgatgg agtgattgga tctagtaagc1380
aagaagataa gtgcggagtg tgcggaggag ataactctca ttgcaaggtt gtgaaaggaa1440cttttacaag atcaccaaaa aaacacggtt acattaagat gttcgaaatt cctgctggag1500caaggcattt gcttattcag gaagtggatg caacatctca ccacttggca gtgaaaaacc1560ttgagactgg aaaattcatt ttgaacgagg agaacgatgt tgatgcatct agtaagactt1620tcattgcaat gggtgttgaa tgggagtata gggatgagga tggaagggaa acacttcaaa1680caatgggtcc tcttcatgga acaattactg tgttggtgat tccagtggga gatacaaggg1740tgtcattgac atacaagtat atgattcacg aggatagtct taacgttgat gataacaacg1800ttttggaaga agattctgtg gtttacgagt gggctcttaa gaaatggtca ccttgctcta1860agccatgtgg tggaggaagt cagttcacta agtatggttg taggaggagg cttgatcata1920agatggttca taggggattt tgcgcagcac ttagtaagcc aaaggcaatt aggagggctt1980gtaaccctca agaatgctea caaccagttt gggtgacagg agagtgggag ccatgttcac2040aaacatgcgg aagaactgga atgcaagtta gatcagttag atgcattcaa cctcttcatg2100ataacactac aagaagtgtg cacgcaaaac actgtaacga tgctaggcca gagagtagaa2160gagcttgctc tagggaactt tgccctggta gatggagggc aggaccttgg agtcagtgct2220ctgtgacatg tggaaacggt actcaggaaa gacctgttcc atgtagaact gctgatgata2280gtttcggaat ttgtcaggag gaaaggccag aaacagctag gacttgtaga cttggacctt2340gtcctaggaa tatttctgat cctagtaaaa aatcatacgt ggtgcaatgg ttgagtaggc2400cagatccaga ttcaccaatt aggaagattt cttcaaaagg acactgccag ggtgataaga2460gtattttctg cagaatggaa gttcttagta ggtactgttc tattccaggt tataacaaac2520tttcttgtaa gagttgcaac ttgtataaca atcttactaa cgtggagggt agaattgaac2580ctccaccagg aaagcacaac gatattgatg tgtttatgcc tactcttcct gtgccaacag2640ttgcaatgga agttagacct tctccatcta ctccacttga ggtgccactt aatgcatcaa2700
gtactaacgc tactgaggat cacccagaga ctaacgcagt tgatgagcct tataagattc2760acggacttga ggatgaggtt cagccaccaa accttattcc taggaggcca agtccttacg2820aaaaaactag aaatcagagg attcaggagc ttattgatga gatgaggaaa aaggagatgc2880ttggaaagtt ctaatgagct cgcggccgca tc 2912<210>21<211>962<212>PRT<213>人工序列<220>
<223>含有人前膠原IN-蛋白酶和側(cè)翼區(qū)的合成序列<400>21Met Ala Gln Leu Arg Arg Arg Ala Arg Arg His Ala Ala Asp Asp Asp1 5 10 15Tyr Asn Ile Glu Val Leu Leu Gly Val Asp Asp Ser Val Val Gln Phe20 25 30His Gly Lys Glu His Val Gln Lys Tyr Leu Leu Thr Leu Met Asn Ile35 40 45Val Asn Glu Ile Tyr His Asp Glu Ser Leu Gly Ala His Ile Asn Val50 55 60Val Leu Val Arg Ile Ile Leu Leu Ser Tyr Gly Lys Ser Met Ser Leu65 70 75 80Ile Glu Ile Gly Asn Pro Ser Gln Ser Leu Glu Asn Val Cys Arg Trp85 90 95Ala Tyr Leu Gln Gln Lys Pro Asp Thr Gly His Asp Glu Tyr His Asp
100 105 110His Ala Ile Phe Leu Thr Arg Gln Asp Phe Gly Pro Ser Gly Met Gln115 120 125Gly Tyr Ala Pro Val Thr Gly Met Cys His Pro Val Arg Ser Cys Thr130 135 140Leu Asn His Glu Asp Gly Phe Ser Ser Ala Phe Val Val Ala His Glu145 150 155 160Thr Gly His Val Leu Gly Met Glu His Asp Gly Gln Gly Asn Arg Cys165 170 175Gly Asp Glu Val Arg Leu Gly Ser Ile Met Ala Pro Leu Val Gln Ala180 185 190Ala Phe His Arg Phe His Trp Ser Arg Cys Ser Gln Gln Glu Leu Ser195 200 205Arg Tyr Leu His Ser Tyr Asp Cys Leu Leu Asp Asp Pro Phe Ala His210 215 220Asp Trp Pro Ala Leu Pro Gln Leu Pro Gly Leu His Tyr Ser Met Asn225 230 235 240Glu Gln Cys Arg Phe Asp Phe Gly Leu Gly Tyr Met Met Cys Thr Ala245 250 255Phe Arg Thr Phe Asp Pro Cys Lys Gln Leu Trp Cys Ser His Pro Asp260 265 270Asn Pro Tyr Phe Cys Lys Thr Lys Lys Gly Pro Pro Leu Asp Gly Thr
275 280 285Met Cys Ala Pro Gly Lys His Cys Phe Lys Gly His Cys Ile Trp Leu290 295 300Thr Pro Asp Ile Leu Lys Arg Asp Gly Ser Trp Gly Ala Trp Ser Pro305 310 315 320Phe Gly Ser Cys Ser Arg Thr Cys Gly Thr Gly Val Lys Phe Arg Thr325 330 335Arg Gln Cys Asp Asn Pro His Pro Ala Asn Gly Gly Arg Thr Cys Ser340 345 350Gly Leu Ala Tyr Asp Phe Gln Leu Cys Ser Arg Gln Asp Cys Pro Asp355 360 365Ser Leu Ala Asp Phe Arg Glu Glu Gln Cys Arg Gln Trp Asp Leu Tyr370 375 380Phe Glu His Gly Asp Ala Gln His His Trp Leu Pro His Glu His Arg385 390 395 400Asp Ala Lys Glu Arg Cys His Leu Tyr Cys Glu Ser Arg Glu Thr Gly405 410 415Glu Val Val Ser Met Lys Arg Met Val His Asp Gly Thr Arg Cys Ser420 425 430Tyr Lys Asp Ala Phe Ser Leu Cys Val Arg Gly Asp Cys Arg Lys Val435 440 445Gly Cys Asp Gly Val Ile Gly Ser Ser Lys Gln Glu Asp Lys Cys Gly
450 455 460Val Cys Gly Gly Asp Asn Ser His Cys Lys Val Val Lys Gly Thr Phe465 470 475 480Thr Arg Ser Pro Lys Lys His Gly Tyr Ile Lys Met Phe Glu Ile Pro485 490 495Ala Gly Ala Arg His Leu Leu Ile Gln Glu Val Asp Ala Thr Ser His500 505 510His Leu Ala Val Lys Asn Leu Glu Thr Gly Lys Phe Ile Leu Asn Glu515 520 525Glu Asn Asp Val Asp Ala Ser Ser Lys Thr Phe Ile Ala Met Gly Val530 535 540Glu Trp Glu Tyr Arg Asp Glu Asp Gly Arg Glu Thr Leu Gln Thr Met545 550 555 560Gly Pro Leu His Gly Thr Ile Thr Val Leu Val Ile Pro Val Gly Asp565 570 575Thr Arg Val Ser Leu Thr Tyr Lys Tyr Met Ile His Glu Asp Ser Leu580 585 590Asn Val Asp Asp Asn Asn Val Leu Glu Glu Asp Ser Val Val Tyr Glu595 600 605Trp Ala Leu Lys Lys Trp Ser Pro Cys Ser Lys Pro Cys Gly Gly Gly610 615 620Ser Gln Phe Thr Lys Tyr Gly Cys Arg Arg Arg Leu Asp His Lys Met
625 630 635 640Val His Arg Gly Phe Cys Ala Ala Leu Ser Lys Pro Lys Ala Ile Arg645 650 655Arg Ala Cys Asn Pro Gln Glu Cys Ser Gln Pro Val Trp Val Thr Gly660 665 670Glu Trp Glu Pro Cys Ser Gln Thr Cys Gly Arg Thr Gly Met Gln Val675 680 685Arg Ser Val Arg Cys Ile Gln Pro Leu His Asp Asn Thr Thr Arg Ser690 695 700Val His Ala Lys His Cys Asn Asp Ala Arg Pro Glu Ser Arg Arg Ala705 710 715 720Cys Ser Arg Glu Leu Cys Pro Gly Arg Trp Arg Ala Gly Pro Trp Ser725 730 735Gln Cys Ser Val Thr Cys Gly Asn Gly Thr Gln Glu Arg Pro Val Pro740 745 750Cys Arg Thr Ala Asp Asp Ser Phe Gly Ile Cys Gln Glu Glu Arg Pro755 760 765Glu Thr Ala Arg Thr Cys Arg Leu Gly Pro Cys Pro Arg Asn Ile Ser770 775 780Asp Pro Ser Lys Lys Ser Tyr Val Val Gln Trp Leu Ser Arg Pro Asp785 790 795 800Pro Asp Ser Pro Ile Arg Lys Ile Ser Ser Lys Gly His Cys Gln Gly
805 810 815Asp Lys Ser Ile Phe Cys Arg Met Glu Val Leu Ser Arg Tyr Cys Ser820 825 830Ile Pro Gly Tyr Asn Lys Leu Ser Cys Lys Ser Cys Asn Leu Tyr Asn835 840 845Asn Leu Thr Asn Val Glu Gly Arg Ile Glu Pro Pro Pro Gly Lys His850 855 860Asn Asp Ile Asp Val Phe Met Pro Thr Leu Pro Val Pro Thr Val Ala865 870 875 880Met Glu Val Arg Pro Ser Pro Ser Thr Pro Leu Glu Val Pro Leu Asn885 890 895Ala Ser Ser Thr Asn Ala Thr Glu Asp His Pro Glu Thr Asn Ala Val900 905 910Asp Glu Pro Tyr Lys Ile His Gly Leu Glu Asp Glu Val Gln Pro Pro915 920 925Asn Leu Ile Pro Arg Arg Pro Ser Pro Tyr Glu Lys Thr Arg Asn Gln930 935 940Arg Ile Gln Glu Leu Ile Asp Glu Met Arg Lys Lys Glu Met Leu Gly945 950 955 960Lys Phe<210>22
<2ll>2888<212>DNA<213>人工序列<220>
<223>含有與人賴氨酰羥化酶3融合的大麥巰基蛋白酶aleurain前體基因的維管信號(hào)序列編碼區(qū)和側(cè)翼區(qū)的合成序列<400>22gcgaattcgc tagctatcac tgaaaagaca gcaagacaat ggtgtctcga tgcaccagaa60ccacatcttt gcagcagatg tgaagcagcc agagtggtcc acaagacgca ctcagaaaag120gcatcttcta ccgacacaga aaaagacaac cacagctcat catccaacat gtagactgtc180gttatgcgtc ggctgaagat aagactgacc ccaggccagc actaaagaag aaataatgca240agtggtccta gctccacttt agctttaata attatgtttc attattattc tctgcttttg300ctctctatat aaagagcttg tattttcatt tgaaggcaga ggcgaacaca cacacagaac360ctccctgctt acaaaccaga tcttaaacca tggctcacgc tagggttttg cttcttgctc420ttgctgttct tgctactgct gctgttgctg tggcttcttc aagttctttc gctgattcta480acccaattag gccagtgact gatagagctg cttctactct tgctcaattg agatctatgt540ctgatagacc aaggggaagg gatccagtta atccagagaa gttgcttgtg attactgtgg600ctactgctga gactgaagga taccttagat tccttaggag tgctgagttc ttcaactaca660ctgtgaggac tcttggactt ggagaagaat ggaggggagg agatgttgct agaactgttg720gaggaggaca gaaagtgaga tggcttaaga aagagatgga gaagtacgct gatagggagg780atatgattat tatgttcgtg gattcttacg atgtgattct tgctggatct ccaactgagc840ttttgaagaa attcgttcag tctggatcta ggcttctttt ctctgctgag tctttttgtt900ggccagaatg gggacttgct gagcaatatc cagaagtggg aactggaaag agattcctta960actctggagg attcattgga ttcgctacta ctattcacca gattgtgagg cagtggaagt1020acaaggatga cgatgatgat cagcttttct acactaggct ttaccttgat ccaggactta1080
gggagaagtt gtctcttaac cttgatcaca agtctaggat tttccagaac cttaacggtg1140ctcttgatga ggttgtgctt aagttcgata ggaacagagt gaggattagg aacgtggctt1200acgatactct tcctattgtg gtgcatggaa acggaccaac aaaactccag cttaactacc1260ttggaaacta cgttccaaac ggatggactc cagaaggagg atgtggattc tgcaatcagg1320ataggagaac tcttccagga ggacaaccac caccaagagt tttccttgct gtgttcgttg1380aacagccaac tccattcctt ccaagattcc ttcagaggct tcttcttttg gattacccac1440cagatagggt gacacttttc cttcacaaca acgaggtttt ccacgagcca cacattgctg1500attcttggcc acagcttcag gatcatttct ctgctgtgaa gttggttggt ccagaagaag1560ctctttctcc aggagaagct agggatatgg ctatggattt gtgcaggcag gatccagagt1620gcgagttcta cttctctctt gatgctgatg ctgtgcttac taaccttcag actcttagga1680ttcttattga ggagaacagg aaagtgattg ctccaatgct ttctaggcac ggaaagttgt1740ggtctaattt ctggggtgct ctttctcctg atgagtacta cgctagatca gaggactacg1800tggagcttgt tcagagaaag agagtgggag tttggaacgt tccttatatt tctcaggctt1860acgtgattag gggagatact cttaggatgg agcttccaca gagggatgtt ttctctggat1920ctgatactga tccagatatg gctttctgca agtctttcag ggataaggga attttccttc1980acctttctaa ccagcatgag ttcggaagat tgcttgctac ttcaagatac gatactgagc2040accttcatcc tgatctttgg cagattttcg ataacccagt ggattggaag gagcagtaca2100ttcacgagaa ctactctagg gctcttgaag gagaaggaat tgtggagcaa ccatgcccag2160atgtttactg gttcccactt ctttctgagc aaatgtgcga tgagcttgtt gctgagatgg2220agcattacgg acaatggagt ggaggtagac atgaggattc taggcttgct ggaggatacg2280agaacgttcc aactgtggat attcacatga agcaagtggg atacgaggat caatggcttc2340agcttcttag gacttatgtg ggaccaatga ctgagtctct tttcccagga taccacacta2400
aggctagggc tgttatgaac ttcgttgtga ggtatcgtcc agatgagcaa ccatctctta2460ggccacacca cgattcttct actttcactc ttaacgtggc tcttaaccac aagggacttg2520attatgaggg aggaggatgc cgtttcctta gatacgattg cgtgatttct tcaccaagaa2580agggatgggc tcttcttcat ccaggaaggc ttactcatta ccacgaggga cttccaacta2640cttggggaac tagatatatt atggtgtctt tcgtggatcc atgactgctt taatgagata2700tgcgagacgc ctatgatcgc atgatatttg ctttcaattc tgttgtgcac gttgtaaaaa2760acctgagcat gtgtagctca gatccttacc gccggtttcg gttcattcta atgaatatat2820cacccgttac tatcgtattt ttatgaataa tattctccgt tcaatttact gattgtccag2880aattcgcg 2888<210>23<211>764<212>PRT<213>人工序列<220>
<223>含有與人賴氨酰羥化酶3融合的大麥巰基蛋白酶aleurain前體基因的維管信號(hào)序列和側(cè)翼區(qū)的合成序列<400>23Met Ala His Ala Arg Val Leu Leu Leu Ala Leu Ala Val Leu Ala Thr1 5 10 15Ala Ala Val Ala Val Ala Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro20 25 30Ile Arg Pro Val Thr Asp Arg Ala Ala Ser Thr Leu Ala Gln Leu Arg35 40 45Ser Met Ser Asp Arg Pro Arg Gly Arg Asp Pro Val Asn Pro Glu Lys
50 55 60Leu Leu Val Ile Thr Val Ala Thr Ala Glu Thr Glu Gly Tyr Leu Arg65 70 75 80Phe Leu Arg Ser Ala Glu Phe Phe Asn Tyr Thr Val Arg Thr Leu Gly85 90 95Leu Gly Glu Glu Trp Arg Gly Gly Asp Val Ala Arg Thr Val Gly Gly100 105 110Gly Gln Lys Val Arg Trp Leu Lys Lys Glu Met Glu Lys Tyr Ala Asp115 120 125Arg Glu Asp Met Ile Ile Met Phe Val Asp Ser Tyr Asp Val Ile Leu130 135 140Ala Gly Ser Pro Thr Glu Leu Leu Lys Lys Phe Val Gln Ser Gly Ser145 150 155 160Arg Leu Leu Phe Ser Ala Glu Ser Phe Cys Trp Pro Glu Trp Gly Leu165 170 175Ala Glu Gln Tyr Pro Glu Val Gly Thr Gly Lys Arg Phe Leu Asn Ser180 185 190Gly Gly Phe Ile Gly Phe Ala Thr Thr Ile His Gln Ile Val Arg Gln195 200 205Trp Lys Tyr Lys Asp Asp Asp Asp Asp Gln Leu Phe Tyr Thr Arg Leu210 215 220Tyr Leu Asp Pro Gly Leu Arg Glu Lys Leu Ser Leu Asn Leu Asp His
225 230 235 240Lys Ser Arg Ile Phe Gln Asn Leu Asn Gly Ala Leu Asp Glu Val Val245 250 255Leu Lys Phe Asp Arg Asn Arg Val Arg Ile Arg Asn Val Ala Tyr Asp260 265 270Thr Leu Pro Ile Val Val His Gly Asn Gly Pro Thr Lys Leu Gln Leu275 280 285Asn Tyr Leu Gly Asn Tyr Val Pro Asn Gly Trp Thr Pro Glu Gly Gly290 295 300Cys Gly Phe Cys Asn Gln Asp Arg Arg Thr Leu Pro Gly Gly Gln Pro305 310 315 320Pro Pro Arg Val Phe Leu Ala Val Phe Val Glu Gln Pro Thr Pro Phe325 330 335Leu Pro Arg Phe Leu Gln Arg Leu Leu Leu Leu Asp Tyr Pro Pro Asp340 345 350Arg Val Thr Leu Phe Leu His Asn Asn Glu Val Phe His Glu Pro His355 360 365Ile Ala Asp Ser Trp Pro Gln Leu Gln Asp His Phe Ser Ala Val Lys370 375 380Leu Val Gly Pro Glu Glu Ala Leu Ser Pro Gly Glu Ala Arg Asp Met385 390 395 400Ala Met Asp Leu Cys Arg Gln Asp Pro Glu Cys Glu Phe Tyr Phe Ser
405 410 415Leu Asp Ala Asp Ala Val Leu Thr Asn Leu Gln Thr Leu Arg Ile Leu420 425 430Ile Glu Glu Asn Arg Lys Val Ile Ala Pro Met Leu Ser Arg His Gly435 440 445Lys Leu Trp Ser Asn Phe Trp Gly Ala Leu Ser Pro Asp Glu Tyr Tyr450 455 460Ala Arg Ser Glu Asp Tyr Val Glu Leu Val Gln Arg Lys Arg Val Gly465 470 475 480Val Trp Asn Val Pro Tyr Ile Ser Gln Ala Tyr Val Ile Arg Gly Asp485 490 495Thr Leu Arg Met Glu Leu Pro Gln Arg Asp Val Phe Ser Gly Ser Asp500 505 510Thr Asp Pro Asp Met Ala Phe Cys Lys Ser Phe Arg Asp Lys Gly Ile515 520 525Phe Leu His Leu Ser Asn Gln His Glu Phe Gly Arg Leu Leu Ala Thr530 535 540Ser Arg Tyr Asp Thr Glu His Leu His Pro Asp Leu Trp Gln Ile Phe545 550 555 560Asp Asn Pro Val Asp Trp Lys Glu Gln Tyr Ile His Glu Asn Tyr Ser565 570 575Arg Ala Leu Glu Gly Glu Gly Ile Val Glu Gln Pro Cys Pro Asp Val
580 585 590Tyr Trp Phe Pro Leu Leu Ser Glu Gln Met Cys Asp Glu Leu Val Ala595 600 605Glu Met Glu His Tyr Gly Gln Trp Ser Gly Gly Arg His Glu Asp Ser610 615 620Arg Leu Ala Gly Gly Tyr Glu Asn Val Pro Thr Val Asp Ile His Met625 630 635 640Lys Gln Val Gly Tyr Glu Asp Gln Trp Leu Gln Leu Leu Arg Thr Tyr645 650 655Val Gly Pro Met Thr Glu Ser Leu Phe Pro Gly Tyr His Thr Lys Ala660 665 670Arg Ala Val Met Asn Phe Val Val Arg Tyr Arg Pro Asp Glu Gln Pro675 680 685Ser Leu Arg Pro His His Asp Ser Ser Thr Phe Thr Leu Asn Val Ala690 695 700Leu Asn His Lys Gly Leu Asp Tyr Glu Gly Gly Gly Cys Arg Phe Leu705 710 715 720Arg Tyr Asp Cys Val Ile Ser Ser Pro Arg Lys Gly Trp Ala Leu Leu725 730 735His Pro Gly Arg Leu Thr His Tyr His Glu Gly Leu Pro Thr Thr Trp740 745 750Gly Thr Arg Tyr Ile Met Val Ser Phe Val Asp Pro
755 760<210>24<211>45<212>PRT<213>人工序列<220>
<223>大麥巰基蛋白酶aleurain前體基因的液泡信號(hào)序列<400>24Met Ala His Ala Arg Val Leu Leu Leu Ala Leu Ala Val Leu Ala Thr1 5 10 15Ala Ala Val Ala Val Ala Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro20 25 30Ile Arg Pro Val Thr Asp Arg Ala Ala Ser Thr Leu Ala35 40 45<210>25<211>24<212>DNA<213>人工序列<220>
<223>單鏈DNA寡核苷酸<400>25atcaccagga gaacagggac catc 24<210>26<211>29<212>DNA<213>人工序列<220>
<223>單鏈DNA寡核苷酸
<400>26tccacttcca aatctctatc cctaacaac 29<210>27<211>23<212>DNA<213>人工序列<220>
<223>單鏈DNA寡核苷酸<400>27aggcattaga ggcgataagg gag 23<210>28<211>27<212>DNA<213>人工序列<220>
<223>單鏈DNA寡核苷酸<400>28tcaatccaat aatagccact tgaccac 2權(quán)利要求
1.在植物或被分離的植物細(xì)胞中生產(chǎn)膠原的方法,其包括在所述植物或所述被分離的植物細(xì)胞中,以能夠使所述至少一種類型的所述膠原α鏈和所述外源性P4H積聚在缺乏內(nèi)源性P4H活性的亞細(xì)胞區(qū)室中的方式,表達(dá)至少一種類型的膠原α鏈和外源性P4H,從而在所述植物中生產(chǎn)膠原。
2.權(quán)利要求1的方法,其進(jìn)一步包括在所述缺乏內(nèi)源性P4H活性的亞細(xì)胞區(qū)室中表達(dá)外源性LH3。
3.權(quán)利要求1的方法,其中所述至少一種類型的所述膠原α鏈包括用于靶向質(zhì)外體或液泡的信號(hào)肽。
4.權(quán)利要求1的方法,其中所述至少一種類型的所述膠原α鏈缺乏ER靶向序列或保留序列。
5.權(quán)利要求1的方法,其中所述至少一種類型的所述膠原α鏈表達(dá)于包含DNA的植物細(xì)胞器中。
6.權(quán)利要求1的方法,其中所述外源性P4H包括用于靶向質(zhì)外體或液泡的信號(hào)肽。
7.權(quán)利要求1的方法,其中所述外源性P4H缺乏ER靶向序列或保留序列。
8.權(quán)利要求1的方法,其中所述外源性P4H表達(dá)于包含DNA的植物細(xì)胞器中。
9.權(quán)利要求1的方法,其中所述至少一種類型的所述膠原α鏈?zhǔn)铅?鏈。
10.權(quán)利要求1的方法,其中所述至少一種類型的所述膠原α鏈?zhǔn)铅?鏈。
11.權(quán)利要求1的方法,其中所述至少一種類型的所述膠原α鏈包括C-末端和/或N-末端前肽。
12.權(quán)利要求1的方法,其中所述植物選自煙草、玉米、苜蓿、稻、馬鈴薯、大豆、番茄、小麥、大麥、低芥酸菜子、胡蘿卜和棉花。
13.權(quán)利要求1的方法,其中所述至少一種類型的所述膠原α鏈或所述外源性P4H只表達(dá)于所述植物的部分中。
14.權(quán)利要求13的方法,其中所述植物的所述部分是葉、種子、根、塊莖或莖。
15.權(quán)利要求1的方法,其中所述外源性P4H能夠使所述至少一種類型的所述膠原α鏈的Gly-X-Y三聯(lián)體的Y位置特異性羥基化。
16.權(quán)利要求14的方法,其中所述外源性P4H是人P4H。
17.權(quán)利要求1的方法,其中對(duì)所述植物實(shí)施應(yīng)激條件。
18.權(quán)利要求17的方法,其中所述應(yīng)激條件選自干旱、鹽度、損傷、寒冷和噴射應(yīng)激誘導(dǎo)化合物。
19.基因修飾植物或被分離的植物細(xì)胞,其能夠積聚具有羥基化模式的膠原α鏈,所述羥基化模式與當(dāng)所述膠原α鏈表達(dá)于人細(xì)胞中時(shí)產(chǎn)生的模式相同。
20.基因修飾植物或被分離的植物細(xì)胞,其能夠在缺乏內(nèi)源性P4H活性的亞細(xì)胞區(qū)室中積聚膠原α鏈。
21.權(quán)利要求19或20的基因修飾植物,其進(jìn)一步包括外源性P4H。
22.權(quán)利要求20的基因修飾植物,其中所述至少一種類型的所述膠原α鏈包括用于靶向質(zhì)外體或液泡的信號(hào)肽。
23.權(quán)利要求19或20的基因修飾植物,其中所述至少一種類型的所述膠原α鏈缺乏ER靶向序列或保留序列。
24.權(quán)利要求19或20的基因修飾植物,其中所述至少一種類型的所述膠原α鏈表達(dá)于包含DNA的植物細(xì)胞器中。
25.權(quán)利要求21的基因修飾植物,其中所述外源性P4H包括用于靶向質(zhì)外體或液泡的信號(hào)肽。
26.權(quán)利要求21的基因修飾植物,其中所述外源性P4H缺乏ER靶向序列或保留序列。
27.權(quán)利要求21的基因修飾植物,其中所述外源性P4H表達(dá)于包含DNA的植物細(xì)胞器中。
28.權(quán)利要求19或20的基因修飾植物,其中所述膠原α鏈?zhǔn)铅?鏈。
29.權(quán)利要求19或20的基因修飾植物,其中所述膠原α鏈?zhǔn)铅?鏈。
30.權(quán)利要求19或20的基因修飾植物,其中所述膠原α鏈包括C-末端和/或N-末端前肽。
31.植物系統(tǒng),其包括能夠積聚膠原α1鏈的第一種基因修飾植物,和能夠積聚膠原α2鏈的第二種基因修飾植物。
32.權(quán)利要求31的植物系統(tǒng),其中所述第一種基因修飾植物和所述第二種基因修飾植物中的至少一種進(jìn)一步包括外源性P4H。
33.生產(chǎn)原纖維膠原的方法,其包括(a)在第一種植物中表達(dá)膠原α1鏈;(b)在第二種植物中表達(dá)膠原α2鏈,其中在所述第一種植物和所述第二種植物中的表達(dá)被這樣設(shè)置,從而使得所述膠原α1鏈和所述膠原α2鏈各自能夠在缺乏內(nèi)源性P4H活性的亞細(xì)胞區(qū)室中積聚;和(c)使所述第一種植物與所述第二種植物雜交,并選擇表達(dá)所述膠原α1鏈和所述膠原α2鏈的后代,從而生產(chǎn)原纖維膠原。
34.權(quán)利要求30的方法,其進(jìn)一步包括在所述第一種植物和所述第二種植物的每一種中表達(dá)外源性P4H。
35.權(quán)利要求33的方法,其中所述膠原α1鏈和所述膠原α2鏈中的每一種包括用于靶向質(zhì)外體或液泡的信號(hào)肽。
36.權(quán)利要求1的方法,其中所述膠原α1鏈和所述膠原α2鏈中的每一種缺乏ER靶向序列或保留序列。
37.權(quán)利要求1的方法,其中步驟(a)和(b)經(jīng)由在包含DNA的植物細(xì)胞器中的表達(dá)來實(shí)現(xiàn)。
38.權(quán)利要求34的方法,其中所述外源性P4H包括用于靶向質(zhì)外體或液泡的信號(hào)肽。
39.權(quán)利要求34的方法,其中所述外源性P4H缺乏ER靶向序列或保留序列。
40.權(quán)利要求34的方法,其中所述外源性P4H表達(dá)于包含DNA的植物細(xì)胞器中。
41.權(quán)利要求1的方法,其中所述膠原α1鏈和所述膠原α2鏈中的每一種包括C-末端和/或N-末端前肽。
42.權(quán)利要求34的方法,其中所述外源性P4H能夠使所述至少一種類型的所述膠原α鏈的Gly-X-Y三聯(lián)體的Y位置特異性羥基化。
43.權(quán)利要求34的方法,其中所述外源性P4H是人P4H。
44.權(quán)利要求1的方法,其中對(duì)所述第一種植物與所述第二種植物實(shí)施應(yīng)激條件。
45.權(quán)利要求44的方法,其中所述應(yīng)激條件選自干旱、鹽度、損傷、重金屬毒性和寒冷應(yīng)激。
46.生產(chǎn)原纖維膠原的方法,其包括(a)在第一種植物中表達(dá)膠原α1鏈和膠原α2鏈,其中在所述第一種植物中的表達(dá)被這樣設(shè)置,從而使得所述膠原α1鏈和所述膠原α2鏈各自能夠在缺乏內(nèi)源性P4H活性的亞細(xì)胞區(qū)室中積聚;(b)在第二種植物中表達(dá)能夠在所述缺乏內(nèi)源性P4H活性的亞細(xì)胞區(qū)室中積聚的外源性P4H;和(c)使所述第一種植物與所述第二種植物雜交,并選擇表達(dá)所述膠原α1鏈、所述膠原α2鏈和所述P4H的后代,從而生產(chǎn)原纖維膠原。
47.核酸構(gòu)建體,其包括置于在植物細(xì)胞中起作用的啟動(dòng)子的轉(zhuǎn)錄控制下、編碼人P4H的多核苷酸。
48.權(quán)利要求47的核酸構(gòu)建體,其中所述啟動(dòng)子選自CaMV 35S啟動(dòng)子、遍在蛋白啟動(dòng)子、rbcS啟動(dòng)子和SVBV啟動(dòng)子。
49.基因修飾植物或被分離的植物細(xì)胞,其能夠表達(dá)膠原α1鏈、膠原α2鏈、P4H、LH3以及蛋白酶C和/或蛋白酶N。
50.權(quán)利要求49的基因修飾植物或被分離的植物細(xì)胞,其中所述膠原α1鏈和所述膠原α2鏈各自能夠在缺乏內(nèi)源性植物P4H活性的亞細(xì)胞區(qū)室中積聚。
51.基因修飾植物或被分離的植物細(xì)胞,其能夠積聚具有溫度穩(wěn)定性特征的膠原,所述特征與哺乳動(dòng)物膠原的特征相同。
52.權(quán)利要求51的基因修飾植物或被分離的植物細(xì)胞,其中所述膠原是I型膠原。
53.權(quán)利要求51的基因修飾植物或被分離的植物細(xì)胞,其中所述哺乳動(dòng)物膠原是人膠原。
全文摘要
提供了在植物中生產(chǎn)膠原的方法和生產(chǎn)膠原的植物。該方法通過以能夠使膠原α鏈積聚在缺乏內(nèi)源性P4H活性的亞細(xì)胞區(qū)室中的方式,在植物中表達(dá)至少一種類型的膠原α鏈來實(shí)現(xiàn),從而在植物中生產(chǎn)膠原。
文檔編號(hào)A01H5/00GK101065491SQ200580040821
公開日2007年10月31日 申請(qǐng)日期2005年9月28日 優(yōu)先權(quán)日2004年9月29日
發(fā)明者O·肖塞約夫, H·斯泰恩 申請(qǐng)人:膠原植物有限公司