欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

具有抑制癌細胞生長功能的新的人蛋白及其編碼序列的制作方法

文檔序號:3486342閱讀:1217來源:國知局
專利名稱:具有抑制癌細胞生長功能的新的人蛋白及其編碼序列的制作方法
技術領域
本發(fā)明屬于生物技術領域,具體地說,本發(fā)明涉及新的編碼具有抑癌功能的人蛋白的多核苷酸和此多核苷酸編碼的多肽。本發(fā)明還涉及此多核苷酸和多肽的用途和制備。
背景技術
人基因組學研究目前是國際上的熱點,除人染色體DNA大規(guī)模測序,表達序列測序(EST)的方法外,還缺少從功能開始的篩選具有功能基因的高通量的方法。
癌癥是危害人類健康的主要疾病之一。為了有效地治療和預防腫瘤,目前人們已越來越關注腫瘤的基因治療。因此,本領域迫切需要開發(fā)研究具有抑癌功能的人蛋白及其激動劑/抑制劑。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一類新的具有抑癌功能的人蛋白多肽以及其片段、類似物和衍生物。
本發(fā)明的另一目的是提供編碼這些多肽的多核苷酸。
本發(fā)明的另一目的是提供生產(chǎn)這些多肽的方法以及該多肽和編碼序列的用途。
在本發(fā)明的第一方面,提供新穎的分離出的具有抑癌功能的蛋白多肽,它包含具有選自下組的氨基酸序列的多肽SEQ ID NO3、6、9、12、15;或其保守性變異多肽、或其活性片段、或其活性衍生物。
較佳地,該多肽是具有選自下組的氨基酸序列的多肽SEQ ID NO3、6、9、12、15。
在本發(fā)明的第二方面,提供了一種分離的多核苷酸,它包含一核苷酸序列,該核苷酸序列與選自下組的一種核苷酸序列有至少85%相同性(a)編碼上述的具有抑癌功能的蛋白多肽的多核苷酸;(b)與多核苷酸(a)互補的多核苷酸。較佳地,該多核苷酸編碼的多肽具有選自下組的氨基酸序列SEQ ID NO3、6、9、12、15。更佳地,該多核苷酸的序列選自下組SEQ ID NO2、5、8、11、14的編碼區(qū)序列或全長序列。
在本發(fā)明的第三方面,提供了含有上述多核苷酸的載體,以及被該載體轉(zhuǎn)化或轉(zhuǎn)導的宿主細胞或者被上述多核苷酸直接轉(zhuǎn)化或轉(zhuǎn)導的宿主細胞。
在本發(fā)明的第四方面,提供了制備具有抑癌功能的蛋白活性的多肽的制備方法,該方法包含(a)在適合表達具有抑癌功能的蛋白的條件下,培養(yǎng)上述被轉(zhuǎn)化或轉(zhuǎn)導的宿主細胞;(b)從培養(yǎng)物中分離出具有抑癌功能的蛋白活性的多肽。
在本發(fā)明的第五方面,提供了與上述的具有抑癌功能的蛋白多肽特異性結(jié)合的抗體。還提供了可用于檢測的核酸分子,它含有上述的多核苷酸中連續(xù)10個核苷酸至全長核苷酸,較佳地它含有連續(xù)的約10-800個核苷酸。
在本發(fā)明的第六方面,提供了一種藥物組合物,它含有安全有效量的本發(fā)明的具有抑癌功能的蛋白多肽以及藥學上可接受的載體。這些藥物組合物可治療癌癥以及細胞異常增殖等病癥。
本發(fā)明的其它方面由于本文的公開內(nèi)容,對本領域的技術人員而言是顯而易見的。
具體實施例方式
本發(fā)明采用大規(guī)模cDNA克隆轉(zhuǎn)染癌細胞,在獲得具有抑癌作用的基礎上,經(jīng)測序證明為新的基因,進一步得到全長cDNA克隆。DNA轉(zhuǎn)染試驗證明,本發(fā)明的具有抑癌功能的蛋白對癌細胞(肝癌細胞)具有抑制克隆形成的作用,其抑制率在50%或50%以上。
如本文所用,“分離的”是指物質(zhì)從其原始環(huán)境中分離出來(如果是天然的物質(zhì),原始環(huán)境即是天然環(huán)境)。如活體細胞內(nèi)的天然狀態(tài)下的多聚核苷酸和多肽是沒有分離純化的,但同樣的多聚核苷酸或多肽如從天然狀態(tài)中同存在的其他物質(zhì)中分開,則為分離純化的。
如本文所用,“分離的具有抑癌功能的蛋白或多肽”是指具有抑癌功能的蛋白多肽基本上不含天然與其相關的其它蛋白、脂類、糖類或其它物質(zhì)。本領域的技術人員能用標準的蛋白質(zhì)純化技術純化具有抑癌功能的蛋白?;旧霞兊亩嚯脑诜沁€原聚丙烯酰胺凝膠上能產(chǎn)生單一的主帶。
本發(fā)明的多肽可以是重組多肽、天然多肽、合成多肽,優(yōu)選重組多肽。本發(fā)明的多肽可以是天然純化的產(chǎn)物,或是化學合成的產(chǎn)物,或使用重組技術從原核或真核宿主(例如,細菌、酵母、高等植物、昆蟲和哺乳動物細胞)中產(chǎn)生。根據(jù)重組生產(chǎn)方案所用的宿主,本發(fā)明的多肽可以是糖基化的,或可以是非糖基化的。本發(fā)明的多肽還可包括或不包括起始的甲硫氨酸殘基。
本發(fā)明還包括具有抑癌功能的人蛋白的片段、衍生物和類似物。如本文所用,術語“片段”、“衍生物”和“類似物”是指基本上保持本發(fā)明的天然具有抑癌功能的人蛋白相同的生物學功能或活性的多肽。本發(fā)明的多肽片段、衍生物或類似物可以是(i)有一個或多個保守或非保守性氨基酸殘基(優(yōu)選保守性氨基酸殘基)被取代的多肽,而這樣的取代的氨基酸殘基可以是也可以不是由遺傳密碼編碼的,或(ii)在一個或多個氨基酸殘基中具有取代基團的多肽,或(iii)成熟多肽與另一個化合物(比如延長多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前導序列或分泌序列或用來純化此多肽的序列或蛋白原序列)。根據(jù)本文的教導,這些片段、衍生物和類似物屬于本領域熟練技術人員公知的范圍。
本發(fā)明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因組DNA或人工合成的DNA。DNA可以是單鏈的或是雙鏈的。DNA可以是編碼鏈或非編碼鏈。以FP3420蛋白(在本申請中,蛋白質(zhì)的命名采用其克隆編號)為例,編碼成熟多肽的編碼區(qū)序列可以與SEQ ID NO2所示的編碼區(qū)序列相同或者是簡并的變異體。如本文所用,“簡并的變異體”在本發(fā)明中是指編碼具有SEQ ID NO3的蛋白質(zhì),但與SEQ ID NO2所示的編碼區(qū)序列有差別的核酸序列。再以FP7019蛋白(在本申請中,蛋白質(zhì)的命名采用其克隆編號)為例,編碼成熟多肽的編碼區(qū)序列可以與SEQ ID NO5所示的編碼區(qū)序列相同或者是簡并的變異體。如本文所用,“簡并的變異體”在本發(fā)明中是指編碼具有SEQ IDNO6的蛋白質(zhì),但與SEQ ID NO5所示的編碼區(qū)序列有差別的核酸序列。對于本發(fā)明的其他具有抑癌功能的蛋白,可依此類推。
編碼成熟多肽的多核苷酸包括只編碼成熟多肽的編碼序列;成熟多肽的編碼序列和各種附加編碼序列;成熟多肽的編碼序列(和任選的附加編碼序列)以及非編碼序列。
術語“編碼多肽的多核苷酸”可以是包括編碼此多肽的多核苷酸,也可以是還包括附加編碼和/或非編碼序列的多核苷酸。
本發(fā)明還涉及上述多核苷酸的變異體,其編碼與本發(fā)明有相同的氨基酸序列的多肽或多肽的片段、類似物和衍生物。此多核苷酸的變異體可以是天然發(fā)生的等位變異體或非天然發(fā)生的變異體。這些核苷酸變異體包括取代變異體、缺失變異體和插入變異體。如本領域所知的,等位變異體是一個多核苷酸的替換形式,它可能是一個或多個核苷酸的取代、缺失或插入,但不會從實質(zhì)上改變其編碼的多肽的功能。
本發(fā)明還涉及與上述的序列雜交且兩個序列之間具有至少50%,較佳地至少70%,更佳地至少80%相同性的多核苷酸。本發(fā)明特別涉及在嚴格條件下與本發(fā)明所述多核苷酸可雜交的多核苷酸。在本發(fā)明中,“嚴格條件”是指(1)在較低離子強度和較高溫度下的雜交和洗脫,如0.2×SSC,0.1%SDS,60℃;或(2)雜交時加有變性劑,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)僅在兩條序列之間的相同性至少在95%以上,更好是97%以上時才發(fā)生雜交。并且,可雜交的多核苷酸編碼的多肽與SEQID NO3所示的成熟多肽有相同的生物學功能(以FP3420蛋白為例)和活性。
本發(fā)明還涉及與上述的序列雜交的核酸片段。如本文所用,“核酸片段”的長度至少含15個核苷酸,較好是至少30個核苷酸,更好是至少50個核苷酸,最好是至少100個核苷酸以上。核酸片段可用于核酸的擴增技術(如PCR)以確定和/或分離編碼具有抑癌功能的蛋白的多聚核苷酸。
本發(fā)明中的多肽和多核苷酸優(yōu)選以分離的形式提供,更佳地被純化至均質(zhì)。
本發(fā)明的DNA序列能用幾種方法獲得。例如,用本領域熟知的雜交技術分離DNA。這些技術包括但不局限于1)用探針與基因組或cDNA文庫雜交以檢出同源性核苷酸序列,和2)表達文庫的抗體篩選以檢出具有共同結(jié)構(gòu)特征的克隆的DNA片段。
編碼具有抑癌功能的蛋白的特異DNA片段序列產(chǎn)生也能用下列方法獲得1)從基因組DNA分離雙鏈DNA序列;2)化學合成DNA序列以獲得所需多肽的雙鏈DNA。
上述提到的方法中,分離基因組DNA最不常用。當需要的多肽產(chǎn)物的整個氨基酸序列已知時,DNA序列的直接化學合成是經(jīng)常選用的方法。如果所需的氨基酸的整個序列不清楚時,DNA序列的直接化學合成是不可能的,選用的方法是cDNA序列的分離。分離感興趣的cDNA的標準方法是從高表達該基因的供體細胞分離mRNA并進行逆轉(zhuǎn)錄,形成質(zhì)粒或噬菌體cDNA文庫。提取mRNA的方法已有多種成熟的技術,試劑盒也可從商業(yè)途徑獲得(Qiagene)。而構(gòu)建cDNA文庫也是通常的方法(Sambrook,et al.,MolecularCloning,A Laboratory Manual,Cold Spring Harbor Laboratory.New York,1989)。還可得到商業(yè)供應的cDNA文庫,如Clontech公司的不同cDNA文庫。當結(jié)合使用聚合酶反應技術時,即使極少的表達產(chǎn)物也能克隆。
可用常規(guī)方法從這些cDNA文庫中篩選本發(fā)明的基因。這些方法包括(但不限于)(1)DNA-DNA或DNA-RNA雜交;(2)標志基因的功能出現(xiàn)或喪失;(3)測定具有抑癌功能的蛋白的轉(zhuǎn)錄本的水平;(4)通過免疫學技術或測定生物學活性,來檢測基因表達的蛋白產(chǎn)物。上述方法可單用,也可多種方法聯(lián)合應用。
在第(1)種方法中,雜交所用的探針是與本發(fā)明的多核苷酸的任何一部分同源,其長度至少15個核苷酸,較好是至少30個核苷酸,更好是至少50個核苷酸,最好是至少100個核苷酸。此外,探針的長度通常在2kb之內(nèi),較佳地為1kb之內(nèi)。此處所用的探針通常是在本發(fā)明的基因DNA序列信息的基礎上化學合成的DNA序列。本發(fā)明的基因本身或者片段當然可以用作探針。DNA探針的標記可用放射性同位素,熒光素或酶(如堿性磷酸酶)等。
在第(4)種方法中,檢測具有抑癌功能的蛋白基因表達的蛋白產(chǎn)物可用免疫學技術如Western印跡法,放射免疫沉淀法,酶聯(lián)免疫吸附法(ELISA)等。
應用PCR技術擴增DNA/RNA的方法(Saiki,et al.Science 1985;2301350-1354)被優(yōu)選用于獲得本發(fā)明的基因。特別是很難從文庫中得到全長的cDNA時,可優(yōu)選使用RACE法(RACE-cDNA末端快速擴增法),用于PCR的引物可根據(jù)本文所公開的本發(fā)明的序列信息適當?shù)剡x擇,并可用常規(guī)方法合成。可用常規(guī)方法如通過凝膠電泳分離和純化擴增的DNA/RNA片段。
如上所述得到的本發(fā)明的基因,或者各種DNA片段等的核苷酸序列的測定可用常規(guī)方法如雙脫氧鏈終止法(Sanger et al.PNAS,1977,745463-5467)。這類核苷酸序列測定也可用商業(yè)測序試劑盒等。為了獲得全長的cDNA序列,測序需反復進行。有時需要測定多個克隆的cDNA序列,才能拼接成全長的cDNA序列。
本發(fā)明也涉及包含本發(fā)明的多核苷酸的載體,以及用本發(fā)明的載體或具有抑癌功能的蛋白編碼序列經(jīng)基因工程產(chǎn)生的宿主細胞,以及經(jīng)重組技術產(chǎn)生本發(fā)明所述多肽的方法。
通過常規(guī)的重組DNA技術(Science,1984;2241431),可利用本發(fā)明的多聚核苷酸序列可用來表達或生產(chǎn)重組的具有抑癌功能的蛋白多肽。一般來說有以下步驟(1).用本發(fā)明的編碼具有抑癌功能的人蛋白的多核苷酸(或變異體),或用含有該多核苷酸的重組表達載體轉(zhuǎn)化或轉(zhuǎn)導合適的宿主細胞;(2).在合適的培養(yǎng)基中培養(yǎng)的宿主細胞;(3).從培養(yǎng)基或細胞中分離、純化蛋白質(zhì)。
本發(fā)明中,具有抑癌功能的人蛋白多核苷酸序列可插入到重組表達載體中。術語“重組表達載體”指本領域熟知的細菌質(zhì)粒、噬菌體、酵母質(zhì)粒、植物細胞病毒、哺乳動物細胞病毒如腺病毒、逆轉(zhuǎn)錄病毒或其他載體。在本發(fā)明中適用的載體包括但不限于在細菌中表達的基于T7的表達載體(Rosenberg,et al.Gene,1987,56125);在哺乳動物細胞中表達的pMSXND表達載體(Lee and Nathans,J Bio Chem.2633521,1988)和在昆蟲細胞中表達的來源于桿狀病毒的載體??傊?,只要能在宿主體內(nèi)復制和穩(wěn)定,任何質(zhì)粒和載體都可以用。表達載體的一個重要特征是通常含有復制起點、啟動子、標記基因和翻譯控制元件。
本領域的技術人員熟知的方法能用于構(gòu)建含具有抑癌功能的人蛋白編碼DNA序列和合適的轉(zhuǎn)錄/翻譯控制信號的表達載體。這些方法包括體外重組DNA技術、DNA合成技術、體內(nèi)重組技術等(Sambroook,et al.)。所述的DNA序列可有效連接到表達載體中的適當啟動子上,以指導mRNA合成。這些啟動子的代表性例子有大腸桿菌的lac或trp啟動子;λ噬菌體PL啟動子;真核啟動子包括CMV立即早期啟動子、早期和晚期SV40啟動子、反轉(zhuǎn)錄病毒的LTRs和其他一些已知的可控制基因在原核或真核細胞或其病毒中表達的啟動子。表達載體還包括翻譯起始用的核糖體結(jié)合位點和轉(zhuǎn)錄終止子。
此外,表達載體優(yōu)選地包含一個或多個選擇性標記基因,以提供用于選擇轉(zhuǎn)化的宿主細胞的表型性狀,如真核細胞培養(yǎng)用的二氫葉酸還原酶、新霉素抗性以及綠色熒光蛋白(GFP),或用于大腸桿菌的四環(huán)素或氨芐青霉素抗性。
包含上述的適當DNA序列以及適當啟動子或者控制序列的載體,可以用于轉(zhuǎn)化適當?shù)乃拗骷毎允蛊淠軌虮磉_蛋白質(zhì)。
宿主細胞可以是原核細胞,如細菌細胞;或是低等真核細胞,如酵母細胞;或是高等真核細胞,如哺乳動物細胞。代表性例子有大腸桿菌,鏈霉菌屬;鼠傷寒沙門氏菌的細菌細胞;真菌細胞如酵母;植物細胞;果蠅S2或Sf9的昆蟲細胞;CHO、COS或Bowes黑素瘤細胞的動物細胞等。
本發(fā)明的多核苷酸在高等真核細胞中表達時,如果在載體中插入增強子序列時將會使轉(zhuǎn)錄得到增強。增強子是DNA的順式作用因子,通常大約有10到300個堿基對,作用于啟動子以增強基因的轉(zhuǎn)錄??膳e的例子包括在復制起始點晚期一側(cè)的100到270個堿基對的SV40增強子、在復制起始點晚期一側(cè)的多瘤增強子以及腺病毒增強子等。
本領域一般技術人員都清楚如何選擇適當?shù)妮d體、啟動子、增強子和宿主細胞。
用重組DNA轉(zhuǎn)化宿主細胞可用本領域技術人員熟知的常規(guī)技術進行。當宿主為原核生物如大腸桿菌時,能吸收DNA的感受態(tài)細胞可在指數(shù)生長期后收獲,用CaCl2法處理,所用的步驟在本領域眾所周知??晒┻x擇的是用MgCl2。如果需要,轉(zhuǎn)化也可用電穿孔的方法進行。當宿主是真核生物,可選用如下的DNA轉(zhuǎn)染方法磷酸鈣共沉淀法,常規(guī)機械方法如顯微注射、電穿孔、脂質(zhì)體包裝等。
獲得的轉(zhuǎn)化子可以用常規(guī)方法培養(yǎng),表達本發(fā)明的基因所編碼的多肽。根據(jù)所用的宿主細胞,培養(yǎng)中所用的培養(yǎng)基可選自各種常規(guī)培養(yǎng)基。在適于宿主細胞生長的條件下進行培養(yǎng)。當宿主細胞生長到適當?shù)募毎芏群?,用合適的方法(如溫度轉(zhuǎn)換或化學誘導)誘導選擇的啟動子,將細胞再培養(yǎng)一段時間。
在上面的方法中的重組多肽可包被于細胞內(nèi)、細胞外或在細胞膜上表達或分泌到細胞外。如果需要,可利用其物理的、化學的和其它特性通過各種分離方法分離和純化重組的蛋白。這些方法是本領域技術人員所熟知的。這些方法的例子包括但并不限于常規(guī)的復性處理、用蛋白沉淀劑處理(鹽析方法)、離心、滲透破菌、超處理、超離心、分子篩層析(凝膠過濾)、吸附層析、離子交換層析、高效液相層析(HPLC)和其它各種液相層析技術及這些方法的結(jié)合。
重組的具有抑癌功能的人蛋白或多肽有多方面的用途。這些用途包括(但不限于)直接做為藥物治療具有抑癌功能的蛋白功能低下或喪失所致的疾病(如癌癥),和用于篩選促進或?qū)咕哂幸职┕δ艿牡鞍坠δ艿目贵w、多肽或其它配體。例如,抗體可用于激活或抑制具有抑癌功能的人蛋白的功能。用表達的重組具有抑癌功能的人蛋白篩選多肽庫可用于尋找有治療價值的能抑制或刺激具有抑癌功能的人蛋白功能的多肽分子。
本發(fā)明也提供了篩選藥物以鑒定提高(激動劑)或阻遏(拮抗劑)具有抑癌功能的人蛋白的藥劑的方法。激動劑提高具有抑癌功能的人蛋白刺激細胞增殖等生物功能,而拮抗劑阻止和治療與細胞過度增殖有關的紊亂如各種癌癥。例如,能在藥物的存在下,將哺乳動物細胞或表達具有抑癌功能的人蛋白的膜制劑與標記的具有抑癌功能的人蛋白一起培養(yǎng)。然后測定藥物提高或阻遏此相互作用的能力。
具有抑癌功能的人蛋白的拮抗劑包括篩選出的抗體、化合物、受體缺失物和類似物等。所述的拮抗劑可以與具有抑癌功能的人蛋白結(jié)合并消除其功能,或是抑制具有抑癌功能的人蛋白的產(chǎn)生,或是與多肽的活性位點結(jié)合使多肽不能發(fā)揮生物學功能。具有抑癌功能的人蛋白的拮抗劑可用于治療用途。
在篩選作為拮抗劑的化合物時,可以將本發(fā)明蛋白加入生物分析測定中,通過測定化合物影響具有抑癌功能的蛋白和其受體之間的相互作用來確定化合物是否是拮抗劑。用上述篩選化合物的同樣方法,可以篩選出起拮抗劑作用的受體缺失物和類似物。
本發(fā)明的多肽可直接用于疾病治療,例如,各種惡性腫瘤、和細胞異常增殖等。
本發(fā)明的多肽,及其片段、衍生物、類似物或它們的細胞可以用來作為抗原以生產(chǎn)抗體。這些抗體可以是多克隆或單克隆抗體。多克隆抗體可以通過將此多肽直接注射動物的方法得到。制備單克隆抗體的技術包括雜交瘤技術,三瘤技術,人B-細胞雜交瘤技術,EBV-雜交瘤技術等。
可以將本發(fā)明的多肽和拮抗劑與合適的藥物載體組合后使用。這些載體可以是水、葡萄糖、乙醇、鹽類、緩沖液、甘油以及它們的組合。組合物包含安全有效量的多肽或拮抗劑以及不影響藥物效果的載體和賦形劑。這些組合物可以作為藥物用于疾病治療。
本發(fā)明還提供含有一種或多種容器的藥盒或試劑盒,容器中裝有一種或多種本發(fā)明的藥用組合物成分。與這些容器一起,可以有由制造、使用或銷售藥品或生物制品的政府管理機構(gòu)所給出的指示性提示,該提示反映出生產(chǎn)、使用或銷售的政府管理機構(gòu)許可其在人體上施用。此外,本發(fā)明的多肽可以與其它的治療化合物結(jié)合使用。
藥物組合物可以以方便的方式給藥,如通過局部、靜脈內(nèi)、腹膜內(nèi)、肌內(nèi)、皮下、鼻內(nèi)或皮內(nèi)的給藥途徑。具有抑癌功能的蛋白以有效地治療和/或預防具體的適應癥的量來給藥。施用于患者的具有抑癌功能的蛋白的量和劑量范圍將取決于許多因素,如給藥方式、待治療者的健康條件和診斷醫(yī)生的判斷。
具有抑癌功能的人蛋白的多聚核苷酸也可用于多種治療目的?;蛑委熂夹g可用于治療由于具有抑癌功能的蛋白的無表達或異常/無活性的具有抑癌功能的蛋白的表達所致的細胞增殖、發(fā)育或代謝異常。重組的基因治療載體可用于治療具有抑癌功能的蛋白表達或活性異常所致的疾病。來源于病毒的表達載體如逆轉(zhuǎn)錄病毒、腺病毒、腺病毒相關病毒、單純皰疹病毒、細小病毒等可用于將具有抑癌功能的蛋白基因轉(zhuǎn)移至細胞內(nèi)。構(gòu)建攜帶具有抑癌功能的蛋白基因的重組病毒載體的方法可見于已有文獻(Sambrook,etal.)。另外重組具有抑癌功能的人蛋白基因可包裝到脂質(zhì)體中轉(zhuǎn)移至細胞內(nèi)。
抑制具有抑癌功能的人蛋白mRNA的寡聚核苷酸(包括反義RNA和DNA)以及核酶也在本發(fā)明的范圍之內(nèi)。核酶是一種能特異性分解特定RNA的酶樣RNA分子,其作用機制是核酶分子與互補的靶RNA特異性雜交后進行核酸內(nèi)切作用。反義的RNA和DNA及核酶可用已有的任何RNA或DNA合成技術獲得,如固相磷酸酰胺化學合成法合成寡核苷酸的技術已廣泛應用。反義RNA分子可通過編碼該RNA的DNA序列在體外或體內(nèi)轉(zhuǎn)錄獲得。這種DNA序列已整合到載體的RNA聚合酶啟動子的下游。為了增加核酸分子的穩(wěn)定性,可用多種方法對其進行修飾,如增加兩側(cè)的序列長度,核糖核苷之間的連接應用磷酸硫酯鍵或肽鍵而非磷酸二酯鍵。
多聚核苷酸導入組織或細胞內(nèi)的方法包括將多聚核苷酸直接注入到體內(nèi)組織中;或在體外通過載體(如病毒、噬菌體或質(zhì)粒等)先將多聚核苷酸導入細胞中,再將細胞移植到體內(nèi)等。
本發(fā)明的多肽還可用作肽譜分析,例如,多肽可用物理的、化學或酶進行特異性切割,并進行一維或二維或三維的凝膠電泳分析。
本發(fā)明還提供了針對具有抑癌功能的人蛋白抗原決定簇的抗體。這些抗體包括(但不限于)多克隆抗體、單克隆抗體、嵌合抗體、單鏈抗體、Fab片段和Fab表達文庫產(chǎn)生的片段。這些抗體可用常規(guī)方法制備??咕哂幸职┕δ艿娜说鞍椎目贵w可用于免疫組織化學技術中,檢測活檢標本中的具有抑癌功能的人蛋白。
與具有抑癌功能的人蛋白結(jié)合的單克隆抗體也可用放射性同位素標記,注入體內(nèi)可跟蹤其位置和分布。本發(fā)明中的抗體可用于治療或預防與具有抑癌功能的人蛋白相關的疾病。給予適當劑量的抗體可以刺激或阻斷具有抑癌功能的人蛋白的產(chǎn)生或活性。
抗體也可用于設計針對體內(nèi)某一特殊部位的免疫毒素。如具有抑癌功能的人蛋白高親和性的單克隆抗體可與細菌或植物毒素(如白喉毒素,蓖麻蛋白,紅豆堿等)共價結(jié)合。
多克隆抗體的生產(chǎn)可用具有抑癌功能的人蛋白或多肽免疫動物,如家兔,小鼠,大鼠等。多種佐劑可用于增強免疫反應,包括但不限于弗氏佐劑等。
具有抑癌功能的人蛋白單克隆抗體可用雜交瘤技術生產(chǎn)(Kohler and Milstein.Nature,1975,256495-497)。將人恒定區(qū)和非人源的可變區(qū)結(jié)合的嵌合抗體可用已有的技術生產(chǎn)(Morrison et al,PNAS,1985,816851)。而已有的生產(chǎn)單鏈抗體的技術(U.S.Pat No.4946778)也可用于生產(chǎn)抗具有抑癌功能的人蛋白的單鏈抗體。
能與本發(fā)明蛋白結(jié)合的多肽分子可通過篩選由各種可能組合的氨基酸結(jié)合于固相物組成的隨機多肽庫而獲得。篩選時,必須對具有抑癌功能的人蛋白分子進行標記。
本發(fā)明還涉及定量和定位檢測具有抑癌功能的人蛋白水平的診斷試驗方法。這些試驗是本領域所熟知的,且包括FISH測定和放射免疫測定。試驗中所檢測的具有抑癌功能的人蛋白水平,可以用作解釋具有抑癌功能的人蛋白在各種疾病中的重要性和用于診斷具有抑癌功能的蛋白起作用的疾病。
具有抑癌功能的蛋白的多聚核苷酸可用于具有抑癌功能的蛋白相關疾病的診斷和治療。在診斷方面,具有抑癌功能的蛋白的多聚核苷酸可用于檢測具有抑癌功能的蛋白的表達與否或在疾病狀態(tài)下具有抑癌功能的蛋白的異常表達。如具有抑癌功能的蛋白DNA序列可用于對活檢標本的雜交以判斷具有抑癌功能的蛋白的表達異常。雜交技術包括Southern印跡法,Northern印跡法、原位雜交等。這些技術方法都是公開的成熟技術,相關的試劑盒都可從商業(yè)途徑得到。本發(fā)明的多核苷酸的一部分或全部可作為探針固定在微陣列(Microarray)或DNA芯片(又稱為“基因芯片”)上,用于分析組織中基因的差異表達分析和基因診斷。用具有抑癌功能的蛋白特異的引物進行RNA-聚合酶鏈反應(RT-PCR)體外擴增也可檢測具有抑癌功能的蛋白的轉(zhuǎn)錄產(chǎn)物。
檢測具有抑癌功能的蛋白基因的突變也可用于診斷具有抑癌功能的蛋白相關的疾病。具有抑癌功能的蛋白突變的形式包括與正常野生型具有抑癌功能的蛋白DNA序列相比的點突變、易位、缺失、重組和其它任何異常等。可用已有的技術如Southern印跡法、DNA序列分析、PCR和原位雜交檢測突變。另外,突變有可能影響蛋白的表達,因此用Northern印跡法、Western印跡法可間接判斷基因有無突變。
本發(fā)明的序列對染色體鑒定也是有價值的。這些序列會特異性地針對某條人染色體具體位置且并可以與其雜交。目前,需要鑒定染色體上的各基因的具體位點。然而現(xiàn)在只有很少的基于實際序列數(shù)據(jù)(重復多態(tài)性)的染色體標記物可用于標記染色體位置。為了將這些序列與疾病相關基因相關聯(lián)。第一步就是將本發(fā)明DNA序列定位于染色體上。
簡而言之,根據(jù)cDNA制備PCR引物(優(yōu)選15-35bp),可以將序列定位于染色體上。然后,將這些引物用于PCR篩選含各條人染色體的體細胞雜合細胞。只有那些含有相應于引物的人基因的雜合細胞會產(chǎn)生擴增的片段。
體細胞雜合細胞的PCR定位法,是將DNA定位到具體染色體的快捷方法。使用本發(fā)明的的寡核苷酸引物,通過類似方法,可利用一組來自特定染色體的片段或大量基因組克隆而實現(xiàn)亞定位??捎糜谌旧w定位的其它類似策略包括原位雜交、用標記的流式分選的染色體預篩選和雜交預選,從而構(gòu)建染色體特異的cDNA庫。
將cDNA克隆與中期染色體進行熒光原位雜交(FISH),可以在一個步驟中精確地進行染色體定位。此技術的綜述,參見Verma等,Human Chromosomesa Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到準確的染色體位置,此序列在染色體上的物理位置就可以與基因圖數(shù)據(jù)相關聯(lián)。這些數(shù)據(jù)可見于例如,V.Mckusick,Mendelian Inheritance in Man(可通過與Johns Hopkins University Welch Medical Library聯(lián)機獲得)。然后可通過連鎖分析,確定基因與業(yè)已定位到染色體區(qū)域上的疾病之間的關系。
接著,需要測定患病和未患病個體間的cDNA或基因組序列差異。如果在一些或所有的患病個體中觀察到某突變,而該突變在任何正常個體中未觀察到,則該突變可能是疾病的病因。比較患病和未患病個體,通常涉及首先尋找染色體中結(jié)構(gòu)的變化,如從染色體水平可見的或用基于cDNA序列的PCR可檢測的缺失或易位。
本發(fā)明的具有抑癌功能的蛋白核苷酸全長序列或其片段通??梢杂肞CR擴增法、重組法或人工合成的方法獲得。對于PCR擴增法,可根據(jù)本發(fā)明所公開的有關核苷酸序列,尤其是開放閱讀框序列來設計引物,并用市售的cDNA庫或按本領域技術人員已知的常規(guī)方法所制備的cDNA庫作為模板,擴增而得有關序列。當序列較長時,常常需要進行兩次或多次PCR擴增,然后再將各次擴增出的片段按正確次序拼接在一起。
一旦獲得了有關的序列,就可以用重組法來大批量地獲得有關序列。這通常是將其克隆入載體,再轉(zhuǎn)入細胞,然后通過常規(guī)方法從增殖后的宿主細胞中分離得到有關序列。
此外,還可用人工合成的方法來合成有關序列,尤其是片段長度較短時。通常,通過先合成多個小片段,然后再進行連接可獲得序列很長的片段。
目前,已經(jīng)可以完全通過化學合成來編碼本發(fā)明蛋白(或其片段,或其衍生物)的DNA序列。然后可將該DNA序列引入本領域中的各種DNA分子(如載體)和細胞中。此外,還可通過化學合成將突變引入本發(fā)明蛋白序列中。
此外,由于本發(fā)明的具有抑癌功能的蛋白具有源自人的天然氨基酸序列,因此,與來源于其他物種的同族蛋白相比,預計在施用于人時將具有更高的活性和/或更低的副作用(例如在人體內(nèi)的免疫原性更低或沒有)。
下面結(jié)合具體實施例,進一步闡述本發(fā)明。應理解,這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規(guī)條件如Sambrook等人,分子克隆實驗室手冊(New YorkCold Spring HarborLaboratory Press,1989)中所述的條件,或按照制造廠商所建議的條件。注意,在核苷酸和氨基酸組合序列中,(1)給出的是起始和終止編碼子第一個核苷酸的位置,(2)分子量單位是道爾頓。
實施例1cDNA基因的獲得及對癌細胞克隆形成的抑制作用FP3420、FP7019、FP12591、FP13812和FP15256來自用常規(guī)方法構(gòu)建的人胎兒cDNA文庫。取胎兒組織(FP克隆),用Trizol試劑(GIBCO BRL公司)按廠方說明書提取總RNA,用mRNA提純試劑盒(Pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文庫構(gòu)建試劑盒(Stratagene公司)構(gòu)建上述mRNA的cDNA文庫。其中反轉(zhuǎn)錄酶改用MMLV-RT-Superscript II(GIBCO BRL),反轉(zhuǎn)錄反應在42℃進行。轉(zhuǎn)化XL 10-Gold感受細胞,獲得了1×106cfu/μg cDNA滴度的cDNA文庫。第一輪隨機挑取cDNA克隆,其后以高豐度cDNA克隆和已證明有抑癌細胞生長功能的cDNA克隆為探針,雜交篩選cDNA文庫,挑取弱陽性及陰性克隆。用Qiagen96孔板質(zhì)粒抽提試劑盒,按廠家說明書進行質(zhì)粒DNA的提取。質(zhì)粒DNA和空載體同時轉(zhuǎn)染肝癌細胞系7721。100ng DNA酒精沉淀干燥后,加6μl H2O溶解,待轉(zhuǎn)染。每份DNA樣品中加0.7μl脂質(zhì)體及9.3μl無血清培液,混勻后,室溫放置10分鐘。每管中加150μl無血清培液,均分加入3孔生長于96孔板的7721細胞中,37℃放置2小時,每孔再加50μl無血清培液,37℃24小時。每孔換100μl全培液,37℃24小時,換含G418的全培液100μl,37℃24-48小時,邊觀察,邊換G418濃度不等的培液。約2-3次后,直到鏡檢細胞有克隆形成,計數(shù)。發(fā)現(xiàn)上述克隆有抑制癌細胞克隆形成作用,結(jié)果如下表所示。
cDNA克隆轉(zhuǎn)染細胞(7721)克隆形成情況

對cDNA克隆采用雙脫氧終止法,在ABI377 DNA自動測序儀上測定其一端近500bp的核苷酸序列。分析后,確定為新基因克隆,進行另一端測序,仍未獲得全長cDNA序列,設計引物,再次進行測序,直到獲得全長序列(SEQ ID NO1、4、7、10、13)。
實施例2從胎盤或胎兒cDNA中PCR獲得全長基因取3、6、9月齡的胎盤組織(PP克隆)或胎兒組織(FP克隆),用Trizol試劑(GIBCOBRL公司)按廠方說明書提取總RNA,用mRNA提純試劑盒(Pharmacia公司)提取mRNA。用MMLV-RT-Superscript II(GIBCO BRL),反轉(zhuǎn)錄酶在42℃進行反轉(zhuǎn)錄反應,獲得胎盤cDNA。利用各個基因的特異引物(如下表所示),按97℃3′1個循環(huán)。94℃30″60℃30″72℃1′35個循環(huán),72℃10′1個循環(huán)進行PCR擴增,獲得含有完整開放閱讀框序列的各蛋白基因的擴增產(chǎn)物。擴增產(chǎn)物經(jīng)測序驗證,與實施例1測得的序列相符,隨后用常規(guī)技術將擴增產(chǎn)物轉(zhuǎn)入宿主細胞,獲得重組蛋白(SEQ ID NOSEQ ID NO3、6、9、12、15)。
基因特異引物

實施例3cDNA克隆序列分析1.FP3420A核苷酸序列(SEQ ID NO1)長度2554個堿基1 GCTGTGTTGT CTAGGCTGGT CTCAAACTCT GGGGCTCAAG TGATCCTCCC ACCTTGGCCT61 CCCAAAGTGC TGGGATTGCA GGCATGGGCC ACCACAACCG GCTCTGCTTT TACTTTTTAA121 ATGTAGCTAC TAATAAATCA AAAACTACAT ATGTAGCTCC CATTACATGT TCACTGAACA181 GCACTGGTCC AGGTATAGAG GAAAGAAGGC CAGGCAGCGG GAAGGAAGGG AATGGCTGGG241 TACAGCAGGC ATGGGGCGGG CAGACTTGAG AAGCCTTGGT GACAGTGTGC ACATAGGAGT301 CAGGGTGGAG GTGATGTGAA GGGTAGGCAC AGAGGCCAGG GGGAGGAAGG TGGTGTCATT361 CACTTATGCA GGAGGATGGG GAGGAGCAGA CTCGAGGGAA GAGGATGGCC TCAGTTTGGG421 GAAAGGTGAA GAGGGCAGTG GGGGAGCACT CCTGTGAGGA TGCCCAACAG ACGTCAGGCT481 TCTTGTCCAG ACCTGCCCCC TGAGTCTGAC CTTCGCTTGT CCCATGCTGC CTCCCTTCTC541 AGCCTGGGGC TGGTCTCACC CAAGCCAGGG GGGCAGAACC GTGCTCGGGC TCCGTTGCCC601 CTTGTCTGCC ATTCACAGTG ATCCTGCTGG AGCTTGGACA CCGGGGTCCG GGCTCAGGTG661 GATGCCTTGG CCAGAGAAGG GAGTTCTCGC AGAGACGCAT GCCAACAGCC ACAATAAGTC721 AGACAATTCT GTTTTTCCAA CAGAGGGAGA GGGATGCAGA GTAGAGAGCA AAACCCTCTT781 TTCCTTCCCG TTCAGTTCGT GTTCCCCACC CTGCTTTCTT CCTCAAAAAG CCTCTGGAAA841 ACTTCACTCC CAGCCCCAGG GCATGTGCCC ATTCCGTCTC ATCTCCTTCC CTTTCTGCAT901 TTTAAAACCC AAGAAAATAT CCTGGAAGGA GAAGAACATT TGCTGAAGAA CAGGGGAGGG961 GAAGAAACCC AGCCAGAGCA GGAAAGGCTG TAACTCTCCT GTGCTGATGA CTGTGGCCCT1021 GCCTCTGCAG AACATATTCC ACTGCGCCAT GTCCCTGGAC CAGCTCTACT TCACCCGCCC1081 CGTGCCCCTG CATTCTGGCT ACCGCTGCCC TCTCCAGGGC CTGTATCTCT GTGGAAGTGG1141 GGCTCATCCT GGTGAGTGAC CTGGAGTCCC ACTACCCTGT GGGGACTGGG AGGGCTCACT1201 GGAGGCCAGA GACTTGGAGA AGGAGGAAGT TAAGCAATGA AGGTGGCAGA GAGGGAGGGG1261 AGCAGGGAAC TCCCAACATA AGCTGCCCTG TGTTCAGAAT TATCCATGCA CAGGTGAGCA1321 CACAGCCGCT GCCTCCACCA GGCTGACCAC AGCCCACAGT TGAGCTCACA CCTCCCCTTC1381 AGGAGGCCTG GGGATGCATC CTGGTGGAGG CATCTCACCA CATTCCAATG TGGGGTTGTG1441 AGAGACCCAT GTCCCTAAAT TCCCCATCCG TATATATATT TAGACAGGGC TTCACGCTAT1501 CGCCTAGGCT GGAGGTGCAG TGGTATGATC ACAGCTCACT GCAGCCTCAA CCTCCTGGGC1561 TCAAGTGATC CTCCTGCCTC GGCCTCTGGA GTAGGTGGGA CTACAGGTGT GTGCCACCAT1621 GCCTGGCTAA TTTTTTATTC TTTTGTGGAG ATGGGTTTTG TTAGGTTGCC CGGGCTGGTC1681 TCGAACTCCC GCGCTGAAGT GATCCTCTCC ACTCAGCTTC CCAAAGTGCT GGGATTAGAG1741 GCCTCCATCC ATATTTTTAG ACCAGGAAGG ATGGATAAAG TTAACTTCTT CAACTTTACA1801 ATTCTTTCTT GTGCGCATTC CAAGCCTAAC GGAGCTGGCT GAGGCTGTCA TTTGCTATGC1861 ACACTTTCTC TCAGCTGTGT AGACTTGGTA CCCTGGAAAG AGTCTGGGCT TACACATCTT1921 CCCCCTCCCC CCAGCCCCTT ATTCTGAAAT TTTAACTTCA CTTACTAAGC GTGTGCCCAT1981 CCAGCACGTC CACCCTCAGC CGTTGAGACT GTGGGCTGTG GACCTGGCCC CTCCCCAGAC2041 CTTTGGTGCA GGAAGCCTGG AGGGAGCCAG AATCTATTGA GCGGCTGTCT TAGGTGATTC2101 CAGTGCCCAT GCCCCCGGAC CCCTCTAACC AGCCCCACTC TGCTTTGTTG CTGGATCTCT2161 GTAAGCCCTG TCCCCACCCC CACCCTGGCA GGTTTTTGAG CGGAGCTTTG GTTCATAGGA2221 GATTCCCTTC CAGGAGGAGG TGTGATGGGA GCTGCTGGGC GAAATGCAGC ACATGTGGCC2281 TTTAGGGACC TCAAGAGCAT GTGACCCTGA ACCAGCTCTG ACCCAGGAAG AAGACTCCAC2341 CCCTGAATTC CAAGTGCTCC ATTGGATCAG CTTCCCAGGA AGTTCAGCTT CGGGTTAGTA2401 CATAAGGCCA CCACAATGCT CAAGAAATTA TTTTAGAAAA AACGTACGAG TTACATTTAG2461 TGCAAGTTGA CCTTATGCCC ATGCCTCCAT ACATGGACTG GTTCTGTTTT ATTAAAACTA2521 ATATTTCATA CAGATTAAAA AAAAAAAAAA AAAAB核苷酸序列(SEQ ID NO3)長度140個氨基酸1 MLPPFSAWGW SHPSQGGRTV LGLRCPLSAI HSDPAGAWTP GSGLRWMPWP EKGVLAETHA61 NSHNKSDNSV FPTEGEGCRV ESKTLFSFPF SSCSPPCFLP QKASGKLHSQ PQGMCPFRLI121 SFPFCILKPK KISWKEKNICC.核苷酸及氨基酸組合序列(SEQ ID NO2)克隆號和蛋白名稱FP3420起始編碼子524 ATG 終止編碼子944 TGA 蛋白質(zhì)分子量15409.981G CTG TGT TGT CTA GGC TGG TCT CAA ACT CTG GGG CTC AAG TGA TCC TCC CAC CTT GGC 5859 CTC CCA AAG TGC TGG GAT TGC AGG CAT GGG CCA CCA CAA CCG GCT CTG CTT TTA CTT TTT118119 AAA TGT AGC TAC TAA TAA ATC AAA AAC TAC ATA TGT AGC TCC CAT TAC ATG TTC ACT GAA178179 CAG CAC TGG TCC AGG TAT AGA GGA AAG AAG GCC AGG CAG CGG GAA GGA AGG GAA TGG CTG238239 GGT ACA GCA GGC ATG GGG CGG GCA GAC TTG AGA AGC CTT GGT GAC AGT GTG CAC ATA GGA298299 GTC AGG GTG GAG GTG ATG TGA AGG GTA GGC ACA GAG GCC AGG GGG AGG AAG GTG GTG TCA358359 TTC ACT TAT GCA GGA GGA TGG GGA GGA GCA GAC TCG AGG GAA GAG GAT GGC CTC AGT TTG418419 GGG AAA GGT GAA GAG GGC AGT GGG GGA GCA CTC CTG TGA GGA TGC CCA ACA GAC GTC AGG478479 CTT CTT GTC CAG ACC TGC CCC CTG AGT CTG ACC TTC GCT TGT CCC ATG CTG CCT CCC TTC5381 Met Leu Pro Pro Phe 5539 TCA GCC TGG GGC TGG TCT CAC CCA AGC CAG GGG GGC AGA ACC GTG CTC GGG CTC CGT TGC5986 Ser Ala Trp Gly Trp Ser His Pro Ser Gln Gly Gly Arg Thr Val Leu Gly Leu Arg Cys 25599 CCC TTG TCT GCC ATT CAC AGT GAT CCT GCT GGA GCT TGG ACA CCG GGG TCC GGG CTC AGG65826 Pro Leu Ser Ala Ile His Ser Asp Pro Ala Gly Ala Trp Thr Pro Gly Ser Gly Leu Arg 45659 TGG ATG CCT TGG CCA GAG AAG GGA GTT CTC GCA GAG ACG CAT GCC AAC AGC CAC AAT AAG71846 Trp Met Pro Trp Pro Glu Lys Gly Val Leu Ala Glu Thr His Ala Asn Ser His Asn Lys 65719 TCA GAC AAT TCT GTT TTT CCA ACA GAG GGA GAG GGA TGC AGA GTA GAG AGC AAA ACC CTC77866 Ser Asp Asn Ser Val Phe Pro Thr Glu Gly Glu Gly Cys Arg Val Glu Ser Lys Thr Leu 85779 TTT TCC TTC CCG TTC AGT TCG TGT TCC CCA CCC TGC TTT CTT CCT CAA AAA GCC TCT GGA83886 Phe Ser Phe Pro Phe Ser Ser Cys Ser Pro Pro Cys Phe Leu Pro Gln Lys Ala Ser Gly105839 AAA CTT CAC TCC CAG CCC CAG GGC ATG TGC CCA TTC CGT CTC ATC TCC TTC CCT TTC TGC898106 Lys Leu His Ser Gln Pro Gln Gly Met Cys Pro Phe Arg Leu Ile Ser Phe Pro Phe Cys125899 ATT TTA AAA CCC AAG AAA ATA TCC TGG AAG GAG AAG AAC ATT TGC TGA AGA ACA GGG GAG958126 Ile Leu Lys Pro Lys Lys Ile Ser Trp Lys Glu Lys Asn Ile Cys ***141959 GGG AAG AAA CCC AGC CAG AGC AGG AAA GGC TGT AAC TCT CCT GTG CTG ATG ACT GTG GCC 10181019 CTG CCT CTG CAG AAC ATA TTC CAC TGC GCC ATG TCC CTG GAC CAG CTC TAC TTC ACC CGC10781079 CCC GTG CCC CTG CAT TCT GGC TAC CGC TGC CCT CTC CAG GGC CTG TAT CTC TGT GGA AGT11381139 GGG GCT CAT CCT GGT GAG TGA CCT GGA GTC CCA CTA CCC TGT GGG GAG TGG GAG GGC TCA11981199 CTG GAG GCC AGA GAC TTG GAG AAG GAG GAA GTT AAG CAA TGA AGG TGG CAG AGA GGG AGG12581259 GGA GCA GGG AAC TCC CAA CAT AAG CTG CCC TGT GTT CAG AAT TAT CCA TGC ACA GGT GAG13181319 CAC ACA GCC GCT GCC TCC ACC AGG CTG ACC ACA GCC CAC AGT TGA GCT CAC ACC TCC CCT13781379 TCA GGA GGC CTG GGG ATG CAT CCT GGT GGA GGC ATC TCA CCA CAT TCC AAT GTG GGG TTG14381439 TGA GAG ACC CAT GTC CCT AAA TTC CCC ATC CGT ATA TAT ATT TAG ACA GGG CTT CAC GCT14981499 ATC GCC TAG GCT GGA GGT GCA GTG GTA TGA TCA CAG CTC ACT GCA GCC TCA ACC TCC TGG15581559 GCT CAA GTG ATC CTC CTG CCT CGG CCT CTG GAG TAG GTG GGA CTA CAG GTG TGT GCC ACC16181619 ATG CCT GGC TAA TTT TTT ATT CTT TTG TGG AGA TGG GTT TTG TTA GGT TGC CCG GGC TGG16781679 TCT CGA ACT CCC GCG CTG AAG TGA TCC TCT CCA CTC AGC TTC CCA AAG TGC TGG GAT TAG17381739 AGG CCT CCA TCC ATA TTT TTA GAC CAG GAA GGA TGG ATA AAG TTA ACT TCT TCA ACT TTA17981799 CAA TTC TTT CTT GTG CGC ATT CCA AGC CTA ACG GAG CTG GCT GAG GCT GTC ATT TGC TAT18581859 GCA CAC TTT CTC TCA GCT GTG TAG ACT TGG TAC CCT GGA AAG AGT CTG GGC TTA CAC ATC19181919 TTC CCC CTC CCC CCA GCC CCT TAT TCT GAA ATT TTA ACT TCA CTT ACT AAG CGT GTG CCC19781979 ATC CAG CAC GTC CAC CCT CAG CCG TTG AGA CTG TGG GCT GTG GAC CTG GCC CCT CCC CAG20382039 ACC TTT GGT GCA GGA AGC CTG GAG GGA GCC AGA ATC TAT TGA GCG GCT GTC TTA GGT GAT20982099 TCC AGT GCC CAT GCC CCC GGA CCC CTC TAA CCA GCC CCA CTC TGC TTT GTT GCT GGA TCT21582159 CTG TAA GCC CTG TCC CCA CCC CCA CCC TGG CAG GTT TTT GAG CGG AGC TTT GGT TCA TAG22182219 GAG ATT CCC TTC CAG GAG GAG GTG TGA TGG GAG CTG CTG GGC GAA ATG CAG CAC ATG TGG22782279 CCT TTA GGG ACC TCA AGA GCA TGT GAC CCT GAA CCA GCT CTG ACC CAG GAA GAA GAC TCC23382339 ACC CCT GAA TTC CAA GTG CTC CAT TGG ATC AGC TTC CCA GGA AGT TCA GCT TCG GGT TAG23982399 TAC ATA AGG CCA CCA CAA TGC TCA AGA AAT TAT TTT AGA AAA AAC GTA CGA GTT ACA TTT24582459 AGT GCA AGT TGA CCT TAT GCC CAT GCC TCC ATA CAT GGA CTG GTT CTG TTT TAT TAA AAC25182519 TAA TAT TTC ATA CAG ATT AAA AAA AAA AAA AAA AAA25542.FP7019A核苷酸序列(SEQ ID NO4)長度2175個堿基1 GGCTTCACGG GCTGGGAGAG GGTTCTGCCC TCCTTCATCC AGACAGCAGG TCTCATCCTA61 GGTCCTTAGA GAAAAGTGCC TGGAGGGCTT TTAAGGAGTC ACAGTGCCAT CACATGCTCA121 AACATCTCCA CAATGGTGCA AGGATCACAG TGCAGATGCC ACCTACAATC GAGGGCCACT181 GGGTCTCCAC AGGCTGTGAA GTAAGGTCAG GCCCAGAGTT CATCACAAGG TCCTACAGAT241 TCTACCACAA TAACACCTTC AAGGCCTACC AATTTTATTA TGGCAGCAAC CGGTGCACAA301 ATCCCACTTA TACTCTCATC ATCCGGGGCA AGATCCGCCT CCGCCAGCCT CCTGGATCAT361 CCGAGGGGGC ACGGAAGCCG ACTACCAGCT GCACAACGTC CAGGTGATCT GCCACACAGA421 GGCGGTGGCC GAGAAGCTCG GCCAGCAGGT GAACCGCACA TGCCCGGGCT TCCTCGCAGA481 CGGGGGTCCC TGGGTGCAGG ACGTGGCCTA TGACCTCTGG CGAGAGGAGA ACGGCTGTGA541 GTGCACCAAG GCCGTGAACT TTGCCATGCA TGAACTTCAG CTCATCCGGG TGGAGAAGCA601 GTACCTTCAC CACAACCTCG ACCACCTGGT CGAGGAGCTC TTCCTTGGTG ACATTCACAC661 TGATGCCACC CAGAGGATGT TCTACCGGCC CTCCAGTTAC CAGCCCCCTC TGCAGAATGC721 CAAGAACCAC GACCATGCCT GCATCGCCTG TCGGATCATC TATCGGTCAG ACGAGCACCA781 CCCTCCCATC CTGCCCCCAA AGGCAGACCT GACCATCGGC CTGCACGGGG AGTGGGTGAG841 CCAGCGCTGT GAGGTGCGCC CCGAAGTCCT CTTCCTCACC CGCCACTTCA TCTTCCATGA901 CAACAACAAC ACCTGGGAGG GCCACTACTA CCACTACTCA GACCCGGTGT GCAAGCACCC961 CACCTTCTCC ATCTACGCCC GGGGCCGTTA CAGCCGGGGC GTCCTCTCGT CCAGGGTCAT1021 GGGAGGCACC GAGTTCGTGT TCAAAGTGAA TCACATGAAG GTCACCCCCA TGGATGCGGC1081 CACAGCCTCA CTGCTAAACG TCTTCAACGG GAATGAGTGC GGGGCCGAGG GCTCCTGGCA1141 GGTGGGCATC CAGCAGGATG TGACCCACAC CAATGGCTGC GTGGCCCTGG GCATCAAACT1201 ACCTCACACG GAGTACGAGA TCTTCAAAAT GGAACAGGAT GCCCGGGGGC GCTATCTGCT1261 GTTCAACGGT CAGAGGCCCA GCGACGGGTC CAGCCCAGAC AGGCCAGAGA AGAGAGCCAC1321 GTCCTACCAG ATGCCCTTGG TCCAGTGTGC CTCCTCTTCG CCGAGGGCAG AGGACCTTGC1381 AGAAGACAGT GGAAGCAGCC TGTATGGCCG GGCCCCTGGG AGGCACACCT GGTCCCTGCT1441 GCTGGCTGCA CTTGCCTGCC TTGTCCCTCT GCTGCATTGG AACATCCGCA GATAGAAGTT1501 TTAGAAAGTT CTATTTTTCC AAACCAGGAT TCCTTACTAT TGACAGATTT TCTTTACCAA1561 AAGAAAAGAC ATTTATTCTT TTGATGCACT TGAATGCCAG AGAACTGTCC TTCTTTTTCT1621 CCTCTCCCTC CCTCCCAGCC CCTGAGTCAT GAACAGCAAG GAGTGTTTGA AGTTTCTGCT1681 TTGAACTCCG TCCAGCCTGA TCCCTGGCCT GAGCAACTTC ACAACAGTAA TTGCACTTTA1741 AGACAGCCTA GAGTTCTGGA CGAGCGTGTT TGGTAGCAGG GATGAAAGCT AGGGCCTCTT1801 ATTTTTTTCT CTTAATTATT ATTATATTTC TGAGTTAAAC TTAGAAGAAA CAACTATCAA1861 GCTACAACTT TTCCTGCCAT TTTCCTGTGG TTGCAGCCTG TCTTCCTTTG AAATTGTTTT1921 ACTCTCTGAG TTTTATATGC TGGAATCCAA TGCAGAGTTG GTTTGGGACT GTGATCAAGA1981 CACCTTTTAT TAATAAAGAA GAGACACAGG TGTAGATATG TATATACAAA AAGATGTACG2041 GTCTGGCCAA ACCACCTTCC CAGCCTTTAT GCAAAAAAAG GGGAGAATCA AAGCTTTCAT2101 TTCAGAAATG TTGCGTGGAA AAGTATCTGT AATTAAAGTT TCGAAGTAAT TTAACCTAAA2161 AAAAAAAAAA AAAAAB核苷酸序列(SEQ ID NO6)長度309個氨基酸1 MHELQLIRVE KQYLHHNLDH LVEELFLGDI HTDATQRMFY RPSSYQPPLQ NAKNHDHACI61 ACRIIYRSDE HHPPILPPKA DLTIGLHGEW VSQRCEVRPE VLFLTRHFIF HDNNNTWEGH121 YYHYSDPVCK HPTFSIYARG RYSRGVLSSR VMGGTEFVFK VNHMKVTPMD AATASLLNVF181 NGNECGAEGS WQVGIQQDVT HTNGCVALGI KLPHTEYEIF KMEQDARGRY LLFNGQRPSD241 GSSPDRPEKR ATSYQMPLVQ CASSSPRAED LAEDSGSSLY GRAPGRHTWS LLLAALACLV301 PLLHWNIRRC.核苷酸及氨基酸組合序列(SEQ ID NO5)克隆號和蛋白名稱FP7019起始編碼子566 ATG 終止編碼子1493 TAG 蛋白質(zhì)分子量35253.101G GCT TCA CGG GCT GGG AGA GGG TTC TGC CCT CCT TCA TCC AGA CAG CAG GTC TCA TCC 5859 TAG GTC CTT AGA GAA AAG TGC CTG GAG GGC TTT TAA GGA GTC ACA GTG CCA TCA CAT GCT118119 CAA ACA TCT CCA CAA TGG TGC AAG GAT CAC AGT GCA GAT GCC ACC TAC AAT CGA GGG CCA178179 CTG GGT CTC CAC AGG CTG TGA AGT AAG GTC AGG CCC AGA GTT CAT CAC AAG GTC CTA CAG238239 ATT CTA CCA CAA TAA CAC CTT CAA GGC CTA CCA ATT TTA TTA TGG CAG CAA CCG GTG CAC298299 AAA TCC CAC TTA TAC TCT CAT CAT CCG GGG CAA GAT CCG CCT CCG CCA GCC TCC TGG ATC358359 ATC CGA GGG GGC ACG GAA GCC GAC TAC CAG CTG CAC AAC GTC CAG GTG ATC TGC CAC ACA418419 GAG GCG GTG GCC GAG AAG CTC GGC CAG CAG GTG AAC CGC ACA TGC CCG GGC TTC CTC GCA478479 GAC GGG GGT CCC TGG GTG CAG GAC GTG GCC TAT GAC CTC TGG CGA GAG GAG AAC GGC TGT538539 GAG TGC ACC AAG GCC GTG AAC TTT GCC ATG CAT GAA CTT CAG CTC ATC CGG GTG GAG AAG5981 Met His Glu Leu Gln Leu Ile Arg Val Glu Lys 11599 CAG TAC CTT CAC CAC AAC CTC GAC CAC CTG GTC GAG GAG CTC TTC CTT GGT GAC ATT CAC65812 Gln Tyr Leu His His Asn Leu Asp His Leu Val Glu Glu Leu Phe Leu Gly Asp Ile His 31659 ACT GAT GCC ACC CAG AGG ATG TTC TAC CGG CCC TCC AGT TAC CAG CCC CCT CTG CAG AAT71832 Thr Asp Ala Thr Gln Arg Met Phe Tyr Arg Pro Ser Ser Tyr Gln Pro Pro Leu Gln Asn 51719 GCC AAG AAC CAC GAC CAT GCC TGC ATC GCC TGT CGG ATC ATC TAT CGG TCA GAC GAG CAC77852 Ala Lys Asn His Asp His Ala Cys Ile Ala Cys Arg Ile Ile Tyr Arg Ser Asp Glu His 71779 CAC CCT CCC ATC CTG CCC CCA AAG GCA GAC CTG ACC ATC GGC CTG CAC GGG GAG TGG GTG83872 His Pro Pro Ile Leu Pro Pro Lys Ala Asp Leu Thr Ile Gly Leu His Gly Glu Trp Val 91839 AGC CAG CGC TGT GAG GTG CGC CCC GAA GTC CTC TTC CTC ACC CGC CAC TTC ATC TTC CAT 89892 Ser Gln Arg Cys Glu Val Arg Pro Glu Val Leu Phe Leu Thr Arg His Phe Ile Phe His 111899 GAC AAC AAC AAC ACC TGG GAG GGC CAC TAC TAC CAC TAC TCA GAC CCG GTG TGC AAG CAC 958112 Asp Asn Asn Asn Thr Trp Glu Gly His Tyr Tyr His Tyr Ser Asp Pro Val Cys Lys His 131959 CCC ACC TTC TCC ATC TAC GCC CGG GGC CGT TAC AGC CGG GGC GTC CTC TCG TCC AGG GTC1018132 Pro Thr Phe Ser Ile Tyr Ala Arg Gly Arg Tyr Ser Arg Gly Val Leu Ser Ser Arg Val 1511019 ATG GGA GGC ACC GAG TTC GTG TTC AAA GTG AAT CAC ATG AAG GTC ACC CCC ATG GAT GCG1078152 Met Gly Gly Thr Glu Phe Val Phe Lys Val Asn His Met Lys Val Thr Pro Met Asp Ala 1711079 GCC ACA GCC TCA CTG CTA AAC GTC TTC AAC GGG AAT GAG TGC GGG GCC GAG GGC TCC TGG1138172 Ala Thr Ala Ser Leu Leu Asn Val Phe Asn Gly Asn Glu Cys Gly Ala Glu Gly Ser Trp 1911139 CAG GTG GGC ATC CAG CAG GAT GTG ACC CAC ACC AAT GGC TGC GTG GCC CTG GGC ATC AAA1198192 Gln Val Gly Ile Gln Gln Asp Val Thr His Thr Asn Gly Cys Val Ala Leu Gly Ile Lys 2111199 CTA CCT CAC ACG GAG TAC GAG ATC TTC AAA ATG GAA CAG GAT GCC CGG GGG CGC TAT CTG1258212 Leu Pro His Thr Glu Tyr Glu Ile Phe Lys Met Glu Gln Asp Ala Arg Gly Arg Tyr Leu 2311259 CTG TTC AAC GGT CAG AGG CCC AGC GAC GGG TCC AGC CCA GAC AGG CCA GAG AAG AGA GCC1318232 Leu Phe Asn Gly Gln Arg Pro Ser Asp Gly Ser Ser Pro Asp Arg Pro Glu Lys Arg Ala 2511319 ACG TCC TAC CAG ATG CCC TTG GTC CAG TGT GCC TCC TCT TCG CCG AGG GCA GAG GAC CTT1378252 Thr Ser Tyr Gln Met Pro Leu Val Gln Cys Ala Ser 5er Ser Pro Arg Ala Glu Asp Leu 2711379 GCA GAA GAC AGT GGA AGC AGC CTG TAT GGC CGG GCC CCT GGG AGG CAC ACC TGG TCC CTG1438272 Ala Glu Asp Ser Gly Ser Ser Leu Tyr Gly Arg Ala Pro Gly Arg His Thr Trp Ser Leu 2911439 CTG CTG GCT GCA CTT GCC TGC CTT GTC CCT CTG CTG CAT TGG AAC ATC CGC AGA TAG AAG1498292 Leu Leu Ala Ala Leu Ala Cys Leu Val Pro Leu Leu His Trp Asn Ile Arg Arg *** 3101499 TTT TAG AAA GTT CTA TTT TTC CAA ACC AGG ATT CCT TAC TAT TGA CAG ATT TTC TTT ACC15581559 AAA AGA AAA GAC ATT TAT TCT TTT GAT GCA CTT GAA TGC CAG AGA ACT GTC CTT CTT TTT16181619 CTC CTC TCC CTC CCT CCC AGC CCC TGA GTC ATG AAC AGC AAG GAG TGT TTG AAG TTT CTG16781679 CTT TGA ACT CCG TCC AGC CTG ATC CCT GGC CTG AGC AAC TTC ACA ACA GTA ATT GCA CTT17381739 TAA GAC AGC CTA GAG TTC TGG ACG AGC GTG TTT GGT AGC AGG GAT GAA AGC TAG GGC CTC17981799 TTA TTT TTT TCT CTT AAT TAT TAT TAT ATT TCT GAG TTA AAC TTA GAA GAA ACA ACT ATC18581859 AAG CTA CAA CTT TTC CTG CCA TTT TCC TGT GGT TGC AGC CTG TCT TCC TTT GAA ATT GTT19181919 TTA CTC TCT GAG TTT TAT ATG CTG GAA TCC AAT GCA GAG TTG GTT TGG GAC TGT GAT CAA19781979 GAC ACC TTT TAT TAA TAA AGA AGA GAC ACA GGT GTA GAT ATG TAT ATA CAA AAA GAT GTA20382039 CGG TCT GGC CAA ACC ACC TTC CCA GCC TTT ATG CAA AAA AAG GGG AGA ATC AAA GCT TTC20982099 ATT TCA GAA ATG TTG CGT GGA AAA GTA TCT GTA ATT AAA GTT TCG AAG TAA TTT AAC CTA21582159 AAA AAA AAA AAA AAA AA 21753.FP12591A核苷酸序列(SEQ ID NO7)長度1937個堿基1 GGTCAGCTTT GTCACTGGTT ATGCGATCCC CACTGTCTGC GTCGGCCTTG CTTTTGTGGT61 CTTCCTCTGT GGCCAGAGCG TTTTCATCAC CAAGCCTCCT GATGGCAGTG CCTTCACCGA121 CATGTTCAAG ATACTGACGT ATTCCTGCTG TTCCCAGAAG CGAAGTGGAG AGCGCCAGAG181 TAATGGATGC AGACAACATA TGTTTTACAG AGTCTTCATT TGAGGATTCC AGAAATTTCA241 AATATTACAA CCACTCCTCA CACGCTCCCT GCAGCCTGGC TGACCATGTT TGATGCTGTG301 CTCATCCTCC TGCTCATCCC TCTGAAGGAC AAACTGGTCG ATCCCATTTT GAGAAGACAT361 GGCCTGCTCC CATCCTCCCT GAAGAGGATC GCCGTGGGCA TGTTCTTTGT CATGTGCTCA421 GCCTTTGCTG CAGGAATTTT GGAGAGTAAA AGGCTGAACC TTGTTAAAGA GAAAACCATT481 AATCAGACCA TCGGCAACGT CGTCTACCAT GCTGCCGATC TGTCGCTGTG GTGGCAGGTG541 CCGCAGTACT TGCTGATTGG GATCAGCGAG ATCTTTGCAA GTATCGCAGG CCTGGAATTT601 GCATACTCAG CTGCCCCCAA GTCCATGCAG AGTGCCATAA TGGGCTTGTT CTTTTTCTTC661 TCTGGCCGTC GGGTCGTTCG TGGGTTCTGG ACTGCTGGCA CTGGTGTCTA TCAAAGCCAT721 CGGATGGATG AGCAGTCACA CAGACTTTGG TAATATTAAC GGCTGCTATT TGAACTATTA781 CTTTTTTCTT CTGGCTGCTA TTCAAGGAGC TACCCTCCTG CTTTTCCTCA TTATTTCTGT841 GAAATATGAC CATCATCGAG ACCATCAGCG ATCAAGAGCC AATGGCGTGC CCACCAGCAG901 GAGGGCCTGA CCTTCCTGAG GCCATGTGCG GTTTCTGAGG CTGACATGTC AGTAACTGAC961 TGGGGTGCAC TGAGAACAGG CAAGACTTTA AATTCCCATA AAATGTCTGA CTTCACTGAA1021 ACTTGCATGT TGCCTGGATT GATTTCTTCT TTCCCTCTAT CCAAAGGAGC TTGGTAAGTG1081 CCTTACTGCA GCGTGTCTCC TGGCACGCTG GGCCCTCCGG GAGGAGAGCT GCAGATTTCG1141 AGTATGTCGC TTGTCATTCA AGGTCTCTGT GAATCCTCTA GCTGGGTTCC CTTTTTTACA1201 GAAACTCACA AATGGAGATT GCAAAGTCTT GGGGAACTCC ACGTGTTAGT TGGCATCCCA1261 GTTTCTTAAA CAAATAGTAT CACCTGCTTC CCATAGCCAT ATCTCACTGT AAAAAAAAAA1321 ATTAATAAAC TGTTACTTAT ATTTAAGAAA GTGAGGATTT TTTTTTTTTA AAGATAAAAG1381 CATGGTCAGA TGCTGCAAGG ATTTTACAAT AAATGCCATA TTTATGGTTT CCTTCCTGAG1441 AACAGTCTTG CTCTTGCCAT GTTCTTTGAT TTAGGCTGGT AGTAAACACA TTTCATCTGC1501 TGCTTCAAAA AGTACTTACT TTTTAAACCA TCAACATTAC TTTTCTTTCT TAAGGCAAGG1561 CATGCATAAG AGTCATTTGA GACCATGTGT CCCATCTCAA GCCACAGAGC AACTCACGGG1621 GTACTTCACA CCTTACCTAG TCAGAGTGCT TATATATAGC TTTATTTTGG TACGATTGAG1681 ACTAAAGACT GATCATGGTT GTATGTAAGG AAAACATTCT TTTGAACAGA AATAGTGTAA1741 TTAAAAATAA TTGAAAGTGT TAAATGTGAA CTTGAGCTGT TTGACCAGTC ACATTTTTGT1801 ATTGTTACTG TACGTGTATC TGGGGCTTCT CCGTTTGTTA ATACTTTTTC TGTATTTGTT1861 GCTGTATTTT TGGCATAACT TTATTATAAA AAGCATCTCA AATGCGAAAA AAAAAAAAAA1921 AAAAAAAAAA AAAAAAAB核苷酸序列(SEQ ID NO9)長度188個氨基酸1 MQTTYVLQSL HLRIPEISNI TTTPHTLPAA WLTMFDAVLI LLLIPLKDKL VDPILRRHGL61 LPSSLKRIAV GMFFVMCSAF AAGILESKRL NLVKEKTINQ TIGNVVYHAA DLSLWWQVPQ121 YLLIGISEIF ASIAGLEFAY SAAPKSMQSA IMGLFFFFSG RRVVRGFWTA GTGVYQSHRM181 DEQSHRLWC.核苷酸及氨基酸組合序列(SEQ ID NO8)克隆號和蛋白名稱FP12591起始編碼子187 ATG 終止編碼子751 TAA 蛋白質(zhì)分子量21193.801 GGT CAG CTT TGT CAC TGG TTA TGC GAT CCC CAC TGT CTG CGT CGG CCT TGC TTT TGT GGT 6061 CTT CCT CTG TGG CCA GAG CGT TTT CAT CAC CAA GCC TCC TGA TGG CAG TGC CTT CAC CGA120121 CAT GTT CAA GAT ACT GAC GTA TTC CTG CTG TTC CCA GAA GCG AAG TGG AGA GCG CCA GAG180181 TAA TGG ATG CAG ACA ACA TAT GTT TTA CAG AGT CTT CAT TTG AGG ATT CCA GAA ATT TCA2401 Met Gln Thr Thr Tyr Val Leu Gln Ser Leu His Leu Arg Ile Pro Glu Ile Ser 18241 AAT ATT ACA ACC ACT CCT CAC ACG CTC CCT GCA GCC TGG CTG ACC ATG TTT GAT GCT GTG30019 Asn Ile Thr Thr Thr Pro His Thr Leu Pro Ala Ala Trp Leu Thr Met Phe Asp Ala Val 38301 CTC ATC CTC CTG CTC ATC CCT CTG AAG GAC AAA CTG GTC GAT CCC ATT TTG AGA AGA CAT36039 Leu Ile Leu Leu Leu Ile Pro Leu Lys Asp Lys Leu Val Asp Pro Ile Leu Arg Arg His 58361 GGC CTG CTC CCA TCC TCC CTG AAG AGG ATC GCC GTG GGC ATG TTC TTT GTC ATG TGC TCA 42059 Gly Leu Leu Pro Ser Ser Leu Lys Arg Ile Ala Val Gly Met Phe Phe Val Met Cys Ser 78421 GCC TTT GCT GCA GGA ATT TTG GAG AGT AAA AGG CTG AAC CTT GTT AAA GAG AAA ACC ATT 48079 Ala Phe Ala Ala Gly Ile Leu Glu Ser Lys Arg Leu Asn Leu Val Lys Glu Lys Thr Ile 98481 AAT GAG ACC ATC GGC AAC GTC GTC TAC CAT GCT GCC GAT CTG TCG CTG TGG TGG CAG GTG 54099 Asn Gln Thr Ile Gly Asn Val Val Tyr His Ala Ala Asp Leu Ser Leu Trp Trp Gln Val 118541 CCG CAG TAC TTG CTG ATT GGG ATC AGC GAG ATC TTT GCA AGT ATC GCA GGC CTG GAA TTT 600119 Pro Gln Tyr Leu Leu Ile Gly Ile Ser Glu Ile Phe Ala Ser Ile Ala Gly Leu Glu Phe 138601 GCA TAC TCA GCT GCC CCC AAG TCC ATG CAG AGT GCC ATA ATG GGC TTG TTC TTT TTC TTC 660139 Ala Tyr Ser Ala Ala Pro Lys Ser Met Gln Ser Ala Ile Met Gly Leu Phe Phe Phe Phe 158661 TCT GGC CGT CGG GTC GTT CGT GGG TTC TGG ACT GCT GGC ACT GGT GTC TAT CAA AGC CAT 720159 Ser Gly Arg Arg Val Val Arg Gly Phe Trp Thr Ala Gly Thr Gly Val Tyr Gln Ser His 178721 CGG ATG GAT GAG CAG TCA CAC AGA CTT TGG TAA TAT TAA CGG CTG CTA TTT GAA CTA TTA 780179 Arg Met Asp Glu Gln Ser His Arg Leu Trp *** 189781 CTT TTT TCT TCT GGC TGC TAT TCA AGG AGC TAC CCT CCT GCT TTT CCT CAT TAT TTC TGT 840841 GAA ATA TGA CCA TCA TCG AGA CCA TCA GCG ATC AAG AGC CAA TGG CGT GCC CAC CAG CAG 900901 GAG GGC CTG ACC TTC CTG AGG CCA TGT GCG GTT TCT GAG GCT GAC ATG TCA GTA ACT GAC 960961 TGG GGT GCA CTG AGA ACA GGC AAG ACT TTA AAT TCC CAT AAA ATG TCT GAC TTC ACT GAA10201021 ACT TGC ATG TTG CCT GGA TTG ATT TCT TCT TTC CCT CTA TCC AAA GGA GCT TGG TAA GTG10801081 CCT TAC TGC AGC GTG TCT CCT GGC ACG CTG GGC CCT CCG GGA GGA GAG CTG CAG ATT TCG11401141 AGT ATG TCG CTT GTC ATT CAA GGT CTC TGT GAA TCC TCT AGC TGG GTT CCC TTT TTT ACA12001201 GAA ACT CAC AAA TGG AGA TTG CAA AGT CTT GGG GAA CTC CAC GTG TTA GTT GGC ATC CCA12601261 GTT TCT TAA ACA AAT AGT ATC ACC TGC TTC CCA TAG CCA TAT CTC ACT GTA AAA AAA AAA13201321 ATT AAT AAA CTG TTA CTT ATA TTT AAG AAA GTG AGG ATT TTT TTT TTT TAA AGA TAA AAG13801381 CAT GGT CAG ATG CTG CAA GGA TTT TAC AAT AAA TGC CAT ATT TAT GGT TTC CTT CCT GAG14401441 AAC AGT CTT GCT CTT GCC ATG TTC TTT GAT TTA GGC TGG TAG TAA ACA CAT TTC ATC TGC15001501 TGC TTC AAA AAG TAC TTA CTT TTT AAA CCA TCA ACA TTA CTT TTC TTT CTT AAG GCA AGG15601561 CAT GCA TAA GAG TCA TTT GAG ACC ATG TGT CCC ATC TCA AGC CAC AGA GCA ACT CAC GGG16201621 GTA CTT CAC ACC TTA CCT AGT CAG AGT GCT TAT ATA TAG CTT TAT TTT GGT ACG ATT GAG16801681 ACT AAA GAC TGA TCA TGG TTG TAT GTA AGG AAA ACA TTC TTT TGA ACA GAA ATA GTG TAA17401741 TTA AAA ATA ATT GAA AGT GTT AAA TGT GAA CTT GAG CTG TTT GAC CAG TCA CAT TTT TGT18001801 ATT GTT ACT GTA CGT GTA TCT GGG GCT TCT CCG TTT GTT AAT ACT TTT TCT GTA TTT GTT18601861 GCT GTA TTT TTG GCA TAA CTT TAT TAT AAA AAG CAT CTC AAA TGC GAA AAA AAA AAA AAA19201921 AAA AAA AAA AAA AAA AA 19374.FP13812A核苷酸序列(SEQ ID NO10)長度2791個堿基1 GAATTACCTT TGTTACCGAG TTCATGCGAA CATTCTTCAA CAGGTTAGGG CTGTCGTAGT61 TCTATTTTAA TACTCCAGTC ATTTTCTAAA TATTCTCTGT TCTCTGGGCT TCCCTAACAG121 TGAGGTGATG TCCCAACGCT TCTCAGGCTG CGTGGACTCC TTGTTCCTGG GTTGCTCAGG181 ACGCTCATGG AGTAAGGCTT GCCCAGCGCC CTTCCCCAGC TGGGCTTGGT CCCCTGACCG241 CCCAGCAGCT GCGTCTCCTT TCCCTGGATT CTGGTCTTGA GCATTTCCTC CGCAAATGTG301 CCCGAGATTG GAGAAGTCAA AGCTCCTCTG AGTCATAAGG GAAAGTTATG CACACTTAAA361 TTTAGCTGAA CACTCATTTT TATAGTATTG ACTTTTTTAT GACCTCGATA AACTTGGTTC421 ATGGTGAAAG GCAGTCTCTG TCCTTGGTAT GGTAGAAAGG CCTGGTGGTG AGGACCCACG481 CCAGACAGAC GCGAGGCAGA CACGGGACAC ATGCCAGATG GGCAGACGCG AGGCACGTGG541 TTCTGAGGGC TCCTCAGAGG CCCACATGCC AGGACCGCCC AGCCGCCCTC CTCCAGATCT601 ACCCGGCCAC CCTCCCCCAG GCCTGCCCAA CCACCTTCCC CCAGCCCTGA GAAACCCTCG661 ACCGCCACCT CCCCTGCCAC CCTCCCCCAG CCCTGAGGGG CCTGTGGGCT CCTTGTCGGG721 AGCAGGCTGG GCTGCAGGTG TCACCACAGC CTGGTCCAGC TATAGGCTTC TCTAGTATTA781 GCACCTCTGC CCCTCACAGT GCCTAGTGGC CCAGGCCCAG CTCTGTCCCC ATGTTACAGA841 TGGGGACACC GAGCCACGGC CAGGACCAGT GACTTGCCGA GGTTGTGGGC TGGGGTGCTC901 CTGGCTGATC CCCGGGTTCT TGGCTCCCTG AGAGTGCGAG ATGCCGTGTC TGTGAGGTGC961 CTGCAGCATC GAACGCTTCG GATACAGAAC CAGTTTTCTT CCTCATTTCA GTGACGTGGC1021 ACCAGCTGGC TTTTGCTGAC CATTGTGGCA ACAGGCTGAG GCTGTGGCCT GGGTTCACCA1081 CTACTCTCTA TTTTTCAGGG CAAGGCTGCA GCTCTACCGG ACGCGGGACA TGGGCTGGGG1141 CGTGCGGTCC CTGCAGGACA TCCCACCAGG CACCTTTGTC TGCGAGTATG TTGGGGAGCT1201 GATTTCAGAC TCAGAAGCCG ACGTTCGAGA GGAAGATTCT TACCTCTTTG ATCTCGACAA1261 TAAGGACGGG GAGGTTTACT GCATCGACGC GCGGTTCTAC GGGAACGTCA GCCGGTTCAT1321 CAACCACCAC TGCGAGCCCA ACCTGGTGCC CGTGCGCGTG TTCATGGCCC ACCAGGACCT1381 GCGGTTCCCC CGGATCGCCT TCTTCAGCAC CCGCCTGATC GAGGCCGGCG AGCAGCTCGG1441 GTTTGACTAT GGAGAGCGCT TCTGGGACAT CAAAGGCAAG CTCTTCAGCT GCCGCTGCGG1501 CTCCCCCAAG TGCCGGCACT CGAGCGCGGC CCTGGCCCAG CGTCAGGCCA GCGCGGCCCA1561 GGAGGCCCAG GAGGACGGCT TGCCCGACAC CAGCTCCGCG GCTGCCGCCG ACCCCCTATG1621 AGACGCCGCC GGCCAGCGGG GCGCTCGGGA GCCAGGGACC GCCGCGTCGC CGATTAGAGG1681 ACGAGGAGGA GAGATTCCGC ACGCAACCGA AAGGGTCCTT CGGGGCTGCG CCGCCGGCTT1741 CCTGGAGGGG TCGGAGGTGA GGCTGCAGCC CCTGCGGGCG GGTGTGGATG CCTCCCAGCC1801 ACCTTCCCAG ACCTGCGGCC TCACCGCGGG CCCAGTGCCC AGGCTGGAGC GCACACTTTG1861 GTCCGCGCGC CAGAGACGCT GGGAGTCCGC ACTGGCATCA CCTTCTGAGT TTCTGATGCT1921 GATTTGTCGT TGCGAAGTTT CTCGTTTCTT CCTCTGACCT CCGAGGTCCC CGCTGCACCA1981 CGGGGTTGCT CTGTTCTCCT GTCCGGCCCA GACTCTTCTG TGTGGCGCCG CCGAAGCCAC2041 CGTTAGCGCG AGCTGCTCCG TTCGCCCTGC CCACGGCCTG CGTGGCTGGG GCCGAGTCCC2101 AGGGGCCGCA CGGAGGGCAC AGTCTCCTGT CAGGCTCGGA GAGGTCAGGA GACCGACCCC2161 ACCACTAACT TTGGAGAAAA TGTGGGTTTG CTTTTTAAAG GAATCCTATA TCTAGTCCTA2221 TATATCAAAC CTCTAACTGA CGTTTCTTTT CGAGGAAGTG GCTTGGTGGG TGCAGCCCCC2281 GCCGGTTCCG TTGACGCTGG CACCTTCTGT TGATTTTTTA AGCCACATGC TATGATGAAT2341 AAACTGATTT ATTTTCTACC ATTACTGAAC ATTAGGACAA ACACAAAATA AAAAACAGAA2401 CACAGACAAC GGTGCTGATT CTGGTGTGGT TTCTACTCAC CACGTGAAAT AAACTATCAA2461 CTGTATAAAG AGAACAAAGT GATTTTAGAA TAAAATGCAG GAAAAACTTT TTTAAAGATG2521 TTAGTCTTGT AGCGTGAATA AATTTGCCAT CACCTTTTGT GTGGTGGCCT GGCAGGTCAT2581 ATACTTTTTT TTGGCATATA CCTTTTTAAA GACTGTAATT AGTGCAGTAA CAGTGGGGTT2641 TTTTTTGTGC AACTCTTCTA AAAACATTCA TAATGCAGTC ATGTTTATTT TTTTCTGTTA2701 AAATGTTTTT GACAGTTTTA AGAGCAGTCT TTTGGCTCTG ACCATTTCTT GTTCTGTTTC2761 CAATGAAATC AATAAAAAAA AAAAAAAAAA AB核苷酸序列(SEQ ID NO12)長度163個氨基酸1 MGWGVRSLQD IPPGTFVCEY VGELISDSEA DVREEDSYLF DLDNKDGEVY CIDARFYGNV61 SRFINHHCEP NLVPVRVFMA HQDLRFPRIA FFSTRLIEAG EQLGFDYGER FWDIKGKLFS121 CRCGSPKCRH SSAALAQRQA SAAQEAQEDG LPDTSSAAAA DPLC.核苷酸及氨基酸組合序列(SEQ ID NO11)克隆號和蛋白名稱FP13812起始編碼子1130 ATG 終止編碼子1619 TGA 蛋白質(zhì)分子量18231.341 G AAT TAC CTT TGT TAC CGA GTT CAT GCG AAC ATT CTT CAA CAG GTT AGG GCT GTC GTA 5859 GTT CTA TTT TAA TAC TCC AGT CAT TTT CTA AAT ATT CTC TGT TCT CTG GGC TTC CCT AAC 118119 AGT GAG GTG ATG TCC CAA CGC TTC TCA GGC TGC GTG GAC TCC TTG TTC CTG GGT TGC TCA 178179 GGA CGC TCA TGG AGT AAG GCT TGC CCA GCG CCC TTC CCC AGC TGG GCT TGG TCC CCT GAC 238239 CGC CCA GCA GCT GCG TCT CCT TTC CCT GGA TTC TGG TCT TGA GCA TTT CCT CCG CAA ATG 298299 TGC CCG AGA TTG GAG AAG TCA AAG CTC CTC TGA GTC ATA AGG GAA AGT TAT GCA CAC TTA 358359 AAT TTA GCT GAA CAC TCA TTT TTA TAG TAT TGA CTT TTT TAT GAC CTC GAT AAA CTT GGT 418419 TCA TGG TGA AAG GCA GTC TCT GTC CTT GGT ATG GTA GAA AGG CCT GGT GGT GAG GAC CCA 478479 CGC CAG ACA GAC GCG AGG CAG ACA CGG GAC ACA TGC CAG ATG GGC AGA CGC GAG GCA CGT 538539 GGT TCT GAG GGC TCC TCA GAG GCC CAC ATG CCA GGA CCG CCC AGC CGC CCT CCT CCA GAT 598599 CTA CCC GGC CAC CCT CCC CCA GGC CTG CCC AAC CAC CTT CCC CCA GCC CTG AGA AAC CCT 658659 CGA CCG CCA CCT CCC CTG CCA CCC TCC CCC AGC CCT GAG GGG CCT GTG GGC TCC TTG TCG 718719 GGA GCA GGC TGG GCT GCA GGT GTC ACC ACA GCC TGG TCC AGC TAT AGG CTT CTC TAG TAT 778779 TAG CAC CTC TGC CCC TCA CAG TGC CTA GTG GCC CAG GCC CAG CTC TGT CCC CAT GTT ACA 838839 GAT GGG GAC ACC GAG CCA CGG CCA GGA CCA GTG ACT TGC CGA GGT TGT GGG CTG GGG TGC 898899 TCC TGG CTG ATC CCC GGG TTC TTG GCT CCC TGA GAG TGC GAG ATG CCG TGT CTG TGA GGT 958959 GCC TGC AGC ATC GAA CGC TTC GGA TAC AGA ACC AGT TTT CTT CCT CAT TTC AGT GAC GTG10181019 GCA CCA GCT GGC TTT TGC TGA CCA TTG TGG CAA CAG GCT GAG GCT GTG GCC TGG GTT CAC10781079 CAC TAC TCT CTA TTT TTC AGG GCA AGG CTG CAG CTC TAC CGG ACG CGG GAC ATG GGC TGG11381 Met Gly Trp 31139 GGC GTG CGG TCC CTG CAG GAC ATC CCA CCA GGC ACC TTT GTC TGC GAG TAT GTT GGG GAG11984 Gly Val Arg Ser Leu Gln Asp Ile Pro Pro Gly Thr Phe Val Cys Glu Tyr Val Gly Glu 231199 CTG ATT TCA GAC TCA GAA GCC GAC GTT CGA GAG GAA GAT TCT TAC CTC TTT GAT CTC GAC125824 Leu Ile Ser Asp Ser Glu Ala Asp Val Arg Glu Glu Asp Ser Tyr Leu Phe Asp Leu Asp 431259 AAT AAG GAC GGG GAG GTT TAC TGC ATC GAC GCG CGG TTC TAC GGG AAC GTC AGC CGG TTC131844 Asn Lys Asp Gly Glu Val Tyr Cys Ile Asp Ala Arg Phe Tyr Gly Asn Val Ser Arg Phe 631319 ATC AAC CAC CAC TGC GAG CCC AAC CTG GTG CCC GTG CGC GTG TTC ATG GCC CAC CAG GAC137864 Ile Asn His His Cys Glu Pro Asn Leu Val Pro Val Arg Val Phe Met Ala His Gln Asp 831379 CTG CGG TTC CCC CGG ATC GCC TTC TTC AGC ACC CGC CTG ATC GAG GCC GGC GAG CAG CTC143884 Leu Arg Phe Pro Arg Ile Ala Phe Phe Ser Thr Arg Leu Ile Glu Ala Gly Glu Gln Leu 1031439 GGG TTT GAC TAT GGA GAG CGC TTC TGG GAC ATC AAA GGC AAG CTC TTC AGC TGC CGC TGC1498104 Gly Phe Asp Tyr Gly Glu Arg Phe Trp Asp Ile Lys Gly Lys Leu Phe Ser Cys Arg Cys 1231499 GGC TCC CCC AAG TGC CGG CAC TCG AGC GCG GCC CTG GCC CAG CGT CAG GCC AGC GCG GCC1558124 Gly Ser Pro Lys Cys Arg His Ser Ser Ala Ala Leu Ala Gln Arg Gln Ala Ser Ala Ala 1431559 CAG GAG GCC CAG GAG GAC GGC TTG CCC GAC ACC AGC TCC GCG GCT GCC GCC GAC CCC CTA1618144 Gln Glu Ala Gln Glu Asp Gly Leu Pro Asp Thr Ser Ser Ala Ala Ala Ala Asp Pro Leu 1631619 TGA GAC GCC GCC GGC CAG CGG GGC GCT CGG GAG CCA GGG ACC GCC GCG TCG CCG ATT AGA1678164 *** 1641679 GGA CGA GGA GGA GAG ATT CCG CAC GCA ACC GAA AGG GTC CTT CGG GGC TGC GCC GCC GGC17381739 TTC CTG GAG GGG TCG GAG GTG AGG CTG CAG CCC CTG CGG GCG GGT GTG GAT GCC TCC CAG17981799 CCA CCT TCC CAG ACC TGC GGC CTC ACC GCG GGC CCA GTG CCC AGG CTG GAG CGC ACA CTT18581859 TGG TCC GCG CGC CAG AGA CGC TGG GAG TCC GCA CTG GCA TCA CCT TCT GAG TTT CTG ATG19181919 CTG ATT TGT CGT TGC GAA GTT TCT CGT TTC TTC CTC TGA CCT CCG AGG TCC CCG CTG CAC19781979 CAC GGG GTT GCT CTG TTC TCC TGT CCG GCC CAG ACT CTT CTG TGT GGC GCC GCC GAA GCC20382039 ACC GTT AGC GCG AGC TGC TCC GTT CGC CCT GCC CAC GGC CTG CGT GGC TGG GGC CGA GTC20982099 CCA GGG GCC GCA CGG AGG GCA CAG TCT CCT GTC AGG CTC GGA GAG GTC AGG AGA CCG ACC21582159 CCA CCA CTA ACT TTG GAG AAA ATG TGG GTT TGC TTT TTA AAG GAA TCC TAT ATC TAG TCC22182219 TAT ATA TCA AAC CTC TAA CTG ACG TTT CTT TTC GAG GAA GTG GCT TGG TGG GTG CAG CCC22782279 CCG CCG GTT CCG TTG ACG CTG GCA CCT TCT GTT GAT TTT TTA AGC CAC ATG CTA TGA TGA23382339 ATA AAC TGA TTT ATT TTC TAC CAT TAC TGA ACA TTA GGA CAA ACA CAA AAT AAA AAA CAG23982399 AAC ACA GAC AAC GGT GCT GAT TCT GGT GTG GTT TCT ACT CAC CAC GTG AAA TAA ACT ATC24582459 AAC TGT ATA AAG AGA ACA AAG TGA TTT TAG AAT AAA ATG CAG GAA AAA CTT TTT TAA AGA25182519 TGT TAG TCT TGT AGC GTG AAT AAA TTT GCC ATC ACC TTT TGT GTG GTG GCC TGG CAG GTC25782579 ATA TAC TTT TTT TTG GCA TAT ACC TTT TTA AAG ACT GTA ATT AGT GCA GTA ACA GTG GGG26382639 TTT TTT TTG TGC AAC TCT TCT AAA AAC ATT CAT AAT GCA GTC ATG TTT ATT TTT TTC TGT26982699 TAA AAT GTT TTT GAC AGT TTT AAG AGC AGT CTT TTG GCT CTG ACC ATT TCT TGT TCT GTT27582759 TCC AAT GAA ATC AAT AAA AAA AAA AAA AAA AAA27915.FP15256A核苷酸序列(SEQ ID NO13)長度2337個堿基1 GGACCCTGTC TCAAAAAAAA AAAAAAAAAA AAAAGAAGAA AAAGAAGAAG CTGCATTTGC61 ATAACGAAAG CAGTGGTTTT ACTTAGAATG GTGTGTTCAT TTGAGGTGCC TTGGGAGGGA121 TGAGTAGAGA TTATCAGGGA GCAGGGAGCC TAAAAACCCC AAACCACCCT TGGCACCATC181 ATGGAACGAG TCACGTACTT TGGTTTTTTT TTTCAATCAT ATCATACCGA AGTTTATTGA241 TGACATCAAA CAAAAATTTC TGTAACAAAA AAGGCAGGGT TGGGTGCTGG GATTACAGGT301 GTGAGCCGCT GCACCCGGCC TCAAACATGA TTTTAGATCT TTTTTTTTGT TTTTGTTTTT361 CTTTTTCAAA GTAGTCATTC TTCACTGAGA AGGAACACAT ACCAAGGTTA GTGGGTTTGA421 TCATTTGAAA AATGGCAGCA CCATTCATTT TAAACATTTT CTGGCTTTTT ACTATGGAAT481 CTCTCATGGT ATAAAAATAA ATTTTAGATT TTTCAGAGCC AAAATGAAAA TACTTTAGAA541 CAAAATCAGG CCAAATCTTT GGAATTCAAA GTGGCTGAAC ACCTAAAAGA AACAGAATAT601 AAAACTCGCC AATTACGTGT CTTCCCAGAG GTCTGGACAG AATTTCTTTC TAATAATTTG661 GACATTTCTT CCCTTTGCCA GTGATACGGG AACAACACCT CCAGAGAGTG GTATTTTTGG721 ATTTATGATA AACTTCTCTG CATTTCTTGG TAAGTACACA ATAATTATTA TAAATAATTG781 AAAAGCTCAC AATTCCAAGT GAAGTTGATG TGTCATTTGT AGTTTTCATA TAATTTTTAT841 TTTATTTTAT TTATTTTTTC TGAGACGGGG TCTCTGTCAT CCAGGCTGGA GTGCAGTGGC901 GTGATCACGG CTCACTGCAG CCTCGACCTG CCGGGCTCAG GCAGTCCTCC CACCTCAGCC961 TCCGGAGTAG CTGGTGCTGC AGGTGCACAC CACCACGCCC AGCTAATTTT TTGTAGTTTT1021 TTGTAGAGAT GGGGTTTCAC CATGTTGCCA GGCTGGCCTT GAGCTCCCGG GCTTCAGTGA1081 TCCACCTGCC TTGGCCTCTC AAAGTGCTGA ACTTATAGGT GTGAGCCACT GCACACGGCC1141 TTGTGTATAA TTTTTTTAAA AGCACAATCT TTGCAGCTAG ATTTTTGTCC TATTTTGAGA1201 AACTGAAGTT AAAAGATATA AAAAATTATG GCTTTATTAG AGAACTATAC TTTAATTAGT1261 AATTTGTAAC AGGATTTGCT GTAGGTGGTT TTAAATACCA AACTTCTGGA ACGGATTTTA1321 AGTGCAATTT AGTTTTTAAA AGTGTTGATT TATGGTCAAG ACACTTATGT AAGCCAAAGA1381 CACCCAATGC GTAAGCTAAG TTTCTCAAAG TGTATTCTGA AGGCAAGCTG ATGAAAAGTC1441 ACCTGGAGTT CTCGTAAAAT GCAGGTTCCT GGGCCATGCT ACTCAACCAG AACCTTTGGG1501 AGTGTGGGTT CCTGAAGATG TGTTGTAAAC AAGCACTCTA GGGGACTTGG TTTCTCACTA1561 AAGTTTGAGG ACCATTGACA AAGGCATTAT CTTACCTGTT AGAGAAAGGG GACAGGTGGA1621 GCAAGGAATA GTATGATTTT TCTTTTCAGT TCCTCAGATG TACCTAAGAT GCAGATGATA1681 GGGTGCAACC TTGTCATAAG CCAATTAATG TAATGCATAT TAATTACAAC TATTGTATAA1741 TTAATGTAAA GCTCAGTCTT CTATAAGGTG ATTCAAGTAT ATAGATATCA GATGTGGGGC1801 ATTTTCTCTT AGTCCTTCTA TAATCTCCCC CCAAACAATC AAGTGTTTGC CAAGGGCCTA1861 TCTTGTAACC AACGCTTTCT GTTCCTCTCT ACTGGTACAG TGTGAGAAGG GACAGTGATG1921 CTGACCCTAC TTAGTGACTT GGCATTTTGG AATTTGTTCA TCCTACTTGG TAGCAGGAAA1981 GTTTCACCGC ATCACCATTT GTAGTCCTCC TAAAGTTTTG GAGGTGAGCA AGGGGAAGTA2041 GCAATATGGA GTCAGTCAAT CCCAGTGCCC TCTTACACCA TCCTTGCCAA GAATCCAGAC2101 TTGGAAAACA GAGAGATTAT TTTATCACAG CAAGTGATAA ATACGGCTTT TGCTTCTGAA2161 TAAAGCAGAA ACTGACAAAT ATATTCATTT GAAATAGTCT ATGTGAGCTC ATGCCTGTAA2221 TTCTAGCATT TTGGGAGGCT GAAGCAGGAG GATCTGTTGA GCCCGGGAGT TCAAGACCAG2281 CCTGGGCAAT GTGGTGAGAT CTCATCTCTA CAAAAAGTTA AAAAAAAAAA AAAAAAAB核苷酸序列(SEQ ID NO15)長度84個氨基酸1 MSRDYQGAGS LKTPNHPWHH HGTSHVLWFF FSIISYRSLL MTSNKNFCNK KGRVGCWDYR61 CEPLHPASNM ILDLFFCFCF SFSKC.核苷酸及氨基酸組合序列(SEQ ID NO14)克隆號和蛋白名稱FP15256起始編碼子120 ATG 終止編碼子372 TAG 蛋白質(zhì)分子量9880.911 GG ACC CTG TCT CAA AAA AAA AAA AAA AAA AAA AAG AAG AAA AAG AAG AAG CTG CAT TTG 5960 CAT AAC GAA AGC AGT GGT TTT ACT TAG AAT GGT GTG TTC ATT TGA GGT GCC TTG GGA GGG 119120 ATG AGT AGA GAT TAT CAG GGA GCA GGG AGC CTA AAA ACC CCA AAC CAC CCT TGG CAC CAT 1791 Met Ser Arg Asp Tyr Gln Gly Ala Gly Ser Leu Lys Thr Pro Asn His Pro Trp His His 20180 CAT GGA ACG AGT CAC GTA CTT TGG TTT TTT TTT TCA ATC ATA TCA TAC CGA AGT TTA TTG 23921 His Gly Thr Ser His Val Leu Trp Phe Phe Phe Ser Ile Ile Ser Tyr Arg Ser Leu Leu 40240 ATG ACA TCA AAC AAA AAT TTC TGT AAC AAA AAA GGC AGG GTT GGG TGC TGG GAT TAC AGG 29941 Met Thr Ser Asn Lys Asn Phe Cys Asn Lys Lys Gly Arg Val Gly Cys Trp Asp Tyr Arg 60300 TGT GAG CCG CTG CAC CCG GCC TCA AAC ATG ATT TTA GAT CTT TTT TTT TGT TTT TGT TTT 35961 Cys Glu Pro Leu His Pro Ala Ser Asn Met Ile Leu Asp Leu Phe Phe Cys Phe Cys Phe 80360 TCT TTT TCA AAG TAG TCA TTC TTC ACT GAG AAG GAA CAC ATA CCA AGG TTA GTG GGT TTG 41981 Ser Phe Ser Lys *** 85420 ATC ATT TGA AAA ATG GCA GCA CCA TTC ATT TTA AAC ATT TTC TGG CTT TTT ACT ATG GAA 479480 TCT CTC ATG GTA TAA AAA TAA ATT TTA GAT TTT TCA GAG CCA AAA TGA AAA TAC TTT AGA 539540 ACA AAA TCA GGC CAA ATC TTT GGA ATT CAA AGT GGC TGA ACA CCT AAA AGA AAC AGA ATA 599600 TAA AAC TCG CCA ATT ACG TGT CTT CCC AGA GGT CTG GAC AGA ATT TCT TTC TAA TAA TTT 659660 GGA CAT TTC TTC CCT TTG CCA GTG ATA CGG GAA CAA CAC CTC CAG AGA GTG GTA TTT TTG 719720 GAT TTA TGA TAA ACT TCT CTG CAT TTC TTG GTA AGT ACA CAA TAA TTA TTA TAA ATA ATT 779780 GAA AAG CTC ACA ATT CCA AGT GAA GTT GAT GTG TCA TTT GTA GTT TTC ATA TAA TTT TTA 839840 TTT TAT TTT ATT TAT TTT TTC TGA GAC GGG GTC TCT GTC ATC CAG GCT GGA GTG CAG TGG 899900 CGT GAT CAC GGC TCA CTG CAG CCT CGA CCT GCC GGG CTC AGG CAG TCC TCC CAC CTC AGC 959960 CTC CGG AGT AGC TGG TGC TGC AGG TGC ACA CCA CCA CGC CCA GCT AAT TTT TTG TAG TTT10191020 TTT GTA GAG ATG GGG TTT CAC CAT GTT GCC AGG CTG GCC TTG AGC TCC CGG GCT TCA GTG10791080 ATC CAC CTG CCT TGG CCT CTC AAA GTG CTG AAC TTA TAG GTG TGA GCC ACT GCA CAC GGC11391140 CTT GTG TAT AAT TTT TTT AAA AGC ACA ATC TTT GCA GCT AGA TTT TTG TCC TAT TTT GAG11991200 AAA CTG AAG TTA AAA GAT ATA AAA AAT TAT GGC TTT ATT AGA GAA CTA TAC TTT AAT TAG12591260 TAA TTT GTA ACA GGA TTT GCT GTA GGT GGT TTT AAA TAC CAA ACT TCT GGA ACG GAT TTT13191320 AAG TGC AAT TTA GTT TTT AAA AGT GTT GAT TTA TGG TCA AGA CAC TTA TGT AAG CCA AAG13791380 ACA CCC AAT GCG TAA GCT AAG TTT CTC AAA GTG TAT TCT GAA GGC AAG CTG ATG AAA AGT14391440 CAC CTG GAG TTC TCG TAA AAT GCA GGT TCC TGG GCC ATG CTA CTC AAC CAG AAC CTT TGG14991500 GAG TGT GGG TTC CTG AAG ATG TGT TGT AAA CAA GCA CTC TAG GGG ACT TGG TTT CTC ACT15591560 AAA GTT TGA GGA CCA TTG ACA AAG GCA TTA TCT TAC CTG TTA GAG AAA GGG GAC AGG TGG16191620 AGC AAG GAA TAG TAT GAT TTT TCT TTT CAG TTC CTC AGA TGT ACC TAA GAT GCA GAT GAT16791680 AGG GTG CAA CCT TGT CAT AAG CCA ATT AAT GTA ATG CAT ATT AAT TAC AAC TAT TGT ATA17391740 ATT AAT GTA AAG CTC AGT CTT CTA TAA GGT GAT TCA AGT ATA TAG ATA TCA GAT GTG GGG17991800 CAT TTT CTC TTA GTC CTT CTA TAA TCT CCC CCC AAA CAA TCA AGT GTT TGC CAA GGG CCT18591860 ATC TTG TAA CCA ACG CTT TCT GTT CCT CTC TAC TGG TAC AGT GTG AGA AGG GAC AGT GAT19191920 GCT GAC CCT ACT TAG TGA CTT GGC ATT TTG GAA TTT GTT CAT CCT ACT TGG TAG CAG GAA19791980 AGT TTC ACC GCA TCA CCA TTT GTA GTC CTC CTA AAG TTT TGG AGG TGA GCA AGG GGA AGT20392040 AGC AAT ATG GAG TCA GTC AAT CCC AGT GCC CTC TTA CAC CAT CCT TGC CAA GAA TCC AGA20992100 CTT GGA AAA CAG AGA GAT TAT TTT ATC ACA GCA AGT GAT AAA TAC GGC TTT TGC TTC TGA21592160 ATA AAG CAG AAA CTG ACA AAT ATA TTC ATT TGA AAT AGT CTA TGT GAG CTC ATG CCT GTA22192220 ATT CTA GCA TTT TGG GAG GCT GAA GCA GGA GGA TCT GTT GAG CCC GGG AGT TCA AGA CCA22792280 GCC TGG GCA ATG TGG TGA GAT CTC ATC TCT ACA AAA AGT TAA AAA AAA AAA AAA AAA A 2337
序列表<110>上海新世界基因技術開發(fā)有限公司<120>具有抑制癌細胞生長功能的新的人蛋白及其編碼序列<130>017521<160>15<170>PatentIn version 3.0<210>1<211>2554<212>DNA<213>智人(Homo sapiens)<400>1gctgtgttgt ctaggctggt ctcaaactct ggggctcaag tgatcctccc accttggcct 60cccaaagtgc tgggattgca ggcatgggcc accacaaccg gctctgcttt tactttttaa120atgtagctac taataaatca aaaactacat atgtagctcc cattacatgt tcactgaaca180gcactggtcc aggtatagag gaaagaaggc caggcagcgg gaaggaaggg aatggctggg240tacagcaggc atggggcggg cagacttgag aagccttggt gacagtgtgc acataggagt300cagggtggag gtgatgtgaa gggtaggcac agaggccagg gggaggaagg tggtgtcatt360cacttatgca ggaggatggg gaggagcaga ctcgagggaa gaggatggcc tcagtttggg420gaaaggtgaa gagggcagtg ggggagcact cctgtgagga tgcccaacag acgtcaggct480tcttgtccag acctgccccc tgagtctgac cttcgcttgt cccatgctgc ctcccttctc540agcctggggc tggtctcacc caagccaggg gggcagaacc gtgctcgggc tccgttgccc600cttgtctgcc attcacagtg atcctgctgg agcttggaca ccggggtccg ggctcaggtg660gatgccttgg ccagagaagg gagttctcgc agagacgcat gccaacagcc acaataagtc720agacaattct gtttttccaa cagagggaga gggatgcaga gtagagagca aaaccctctt780ttccttcccg ttcagttcgt gttccccacc ctgctttctt cctcaaaaag cctctggaaa840acttcactcc cagccccagg gcatgtgccc attccgtctc atctccttcc ctttctgcat900tttaaaaccc aagaaaatat cctggaagga gaagaacatt tgctgaagaa caggggaggg960gaagaaaccc agccagagca ggaaaggctg taactctcct gtgctgatga ctgtggccct 1020gcctctgcag aacatattcc actgcgccat gtccctggac cagctctact tcacccgccc 1080cgtgcccctg cattctggct accgctgccc tctccagggc ctgtatctct gtggaagtgg 1140ggctcatcct ggtgagtgac ctggagtccc actaccctgt ggggactggg agggctcact 1200ggaggccaga gacttggaga aggaggaagt taagcaatga aggtggcaga gagggagggg 1260agcagggaac tcccaacata agctgccctg tgttcagaat tatccatgca caggtgagca 1320cacagccgct gcctccacca ggctgaccac agcccacagt tgagctcaca cctccccttc 1380aggaggcctg gggatgcatc ctggtggagg catctcacca cattccaatg tggggttgtg 1440agagacccat gtccctaaat tccccatccg tatatatatt tagacagggc ttcacgctat 1500cgcctaggct ggaggtgcag tggtatgatc acagctcact gcagcctcaa cctcctgggc 1560tcaagtgatc ctcctgcctc ggcctctgga gtaggtggga ctacaggtgt gtgccaccat 1620gcctggctaa ttttttattc ttttgtggag atgggttttg ttaggttgcc cgggctggtc 1680tcgaactccc gcgctgaagt gatcctctcc actcagcttc ccaaagtgct gggattagag 1740gcctccatcc atatttttag accaggaagg atggataaag ttaacttctt caactttaca 1800attctttctt gtgcgcattc caagcctaac ggagctggct gaggctgtca tttgctatgc 1860acactttctc tcagctgtgt agacttggta ccctggaaag agtctgggct tacacatctt 1920ccccctcccc ccagcccctt attctgaaat tttaacttca cttactaagc gtgtgcccat 1980ccagcacgtc caccctcagc cgttgagact gtgggctgtg gacctggccc ctccccagac 2040ctttggtgca ggaagcctgg agggagccag aatctattga gcggctgtct taggtgattc 2100cagtgcccat gcccccggac ccctctaacc agccccactc tgctttgttg ctggatctct 2160gtaagccctg tccccacccc caccctggca ggtttttgag cggagctttg gttcatagga 2220gattcccttc caggaggagg tgtgatggga gctgctgggc gaaatgcagc acatgtggcc 2280tttagggacc tcaagagcat gtgaccctga accagctctg acccaggaag aagactccac 2340ccctgaattc caagtgctcc attggatcag cttcccagga agttcagctt cgggttagta 2400cataaggcca ccacaatgct caagaaatta ttttagaaaa aacgtacgag ttacatttag 2460tgcaagttga ccttatgccc atgcctccat acatggactg gttctgtttt attaaaacta 2520atatttcata cagattaaaa aaaaaaaaaa aaaa 2554<210>2<211>2554<212>DNA<213>智人(Homo sapiens)<220><221>CDS<222>(524)..(943)<400>2gctgtgttgt ctaggctggt ctcaaactct ggggctcaag tgatcctccc accttggcct 60cccaaagtgc tgggattgca ggcatgggcc accacaaccg gctctgcttt tactttttaa120atgtagctac taataaatca aaaactacat atgtagctcc cattacatgt tcactgaaca180gcactggtcc aggtatagag gaaagaaggc caggcagcgg gaaggaaggg aatggctggg240tacagcaggc atggggcggg cagacttgag aagccttggt gacagtgtgc acataggagt300cagggtggag gtgatgtgaa gggtaggcac agaggccagg gggaggaagg tggtgtcatt360cacttatgca ggaggatggg gaggagcaga ctcgagggaa gaggatggcc tcagtttggg420gaaaggtgaa gagggcagtg ggggagcact cctgtgagga tgcccaacag acgtcaggct480tcttgtccag acctgccccc tgagtctgac cttcgcttgt ccc atg ctg cct ccc 535Met Leu Pro Pro1ttc tca gcc tgg ggc tgg tct cac cca agc cag ggg ggc aga acc gtg 583Phe Ser Ala Trp Gly Trp Ser His Pro Ser Gln Gly Gly Arg Thr Val5 10 15 20ctc ggg ctc cgt tgc ccc ttg tct gcc att cac agt gat cct gct gga 631Leu Gly Leu Arg Cys Pro Leu Ser Ala Ile His Ser Asp Pro Ala Gly25 30 35gct tgg aca ccg ggg tcc ggg ctc agg tgg atg cct tgg cca gag aag 679Ala Trp Thr Pro Gly Ser Gly Leu Arg Trp Met Pro Trp Pro Glu Lys40 45 50gga gtt ctc gca gag acg cat gcc aac agc cac aat aag tca gac aat 727Gly Val Leu Ala Glu Thr His Ala Asn Ser His Asn Lys Ser Asp Asn55 60 65tct gtt ttt cca aca gag gga gag gga tgc aga gta gag agc aaa acc 775Ser Val Phe Pro Thr Glu Gly Glu Gly Cys Arg Val Glu Ser Lys Thr70 75 80ctc ttt tcc ttc ccg ttc agt tcg tgt tcc cca ccc tgc ttt ctt cct 823Leu Phe Ser Phe Pro Phe Ser Ser Cys Ser Pro Pro Cys Phe Leu Pro85 90 95 100caa aaa gcc tct gga aaa ctt cac tcc cag ccc cag ggc atg tgc cca 871Gln Lys Ala Ser Gly Lys Leu His Ser Gln Pro Gln Gly Met Cys Pro105 110 115ttc cgt ctc atc tcc ttc cct ttc tgc att tta aaa ccc aag aaa ata 919Phe Arg Leu Ile Ser Phe Pro Phe Cys Ile Leu Lys Pro Lys Lys Ile120 125 130tcc tgg aag gag aag aac att tgc tgaagaacag gggaggggaa gaaacccagc973Ser Trp Lys Glu Lys Asn Ile Cys135 140cagagcagga aaggctgtaa ctctcctgtg ctgatgactg tggccctgcc tctgcagaac 1033atattccact gcgccatgtc cctggaccag ctctacttca cccgccccgt gcccctgcat 1093tctggctacc gctgccctct ccagggcctg tatctctgtg gaagtggggc tcatcctggt 1153gagtgacctg gagtcccact accctgtggg gactgggagg gctcactgga ggccagagac 1213ttggagaagg aggaagttaa gcaatgaagg tggcagagag ggaggggagc agggaactcc 1273caacataagc tgccctgtgt tcagaattat ccatgcacag gtgagcacac agccgctgcc 1333tccaccaggc tgaccacagc ccacagttga gctcacacct ccccttcagg aggcctgggg 1393atgcatcctg gtggaggcat ctcaccacat tccaatgtgg ggttgtgaga gacccatgtc 1453cctaaattcc ccatccgtat atatatttag acagggcttc acgctatcgc ctaggctgga 1513ggtgcagtgg tatgatcaca gctcactgca gcctcaacct cctgggctca agtgatcctc 1573ctgcctcggc ctctggagta ggtgggacta caggtgtgtg ccaccatgcc tggctaattt 1633tttattcttt tgtggagatg ggttttgtta ggttgcccgg gctggtctcg aactcccgcg 1693ctgaagtgat cctctccact cagcttccca aagtgctggg attagaggcc tccatccata 1753tttttagacc aggaaggatg gataaagtta acttcttcaa ctttacaatt ctttcttgtg 1813cgcattccaa gcctaacgga gctggctgag gctgtcattt gctatgcaca ctttctctca 1873gctgtgtaga cttggtaccc tggaaagagt ctgggcttac acatcttccc cctcccccca 1933gccccttatt ctgaaatttt aacttcactt actaagcgtg tgcccatcca gcacgtccac 1993cctcagccgt tgagactgtg ggctgtggac ctggcccctc cccagacctt tggtgcagga 2053agcctggagg gagccagaat ctattgagcg gctgtcttag gtgattccag tgcccatgcc 2113cccggacccc tctaaccagc cccactctgc tttgttgctg gatctctgta agccctgtcc 2173ccacccccac cctggcaggt ttttgagcgg agctttggtt cataggagat tcccttccag 2233gaggaggtgt gatgggagct gctgggcgaa atgcagcaca tgtggccttt agggacctca 2293agagcatgtg accctgaacc agctctgacc caggaagaag actccacccc tgaattccaa 2353gtgctccatt ggatcagctt cccaggaagt tcagcttcgg gttagtacat aaggccacca 2413caatgctcaa gaaattattt tagaaaaaac gtacgagtta catttagtgc aagttgacct 2473tatgcccatg cctccataca tggactggtt ctgttttatt aaaactaata tttcatacag 2533attaaaaaaa aaaaaaaaaa a2554<210>3<211>140<212>PRT<213>智人(Homo sapiens)<400>3Met Leu Pro Pro Phe Ser Ala Trp Gly Trp Ser His Pro Ser Gln Gly1 5 10 15Gly Arg Thr Val Leu Gly Leu Arg Cys Pro Leu Ser Ala Ile His Ser20 25 30Asp Pro Ala Gly Ala Trp Thr Pro Gly Ser Gly Leu Arg Trp Met Pro35 40 45Trp Pro Glu Lys Gly Val Leu Ala Glu Thr His Ala Asn Ser His Asn50 55 60Lys Ser Asp Asn Ser Val Phe Pro Thr Glu Gly Glu Gly Cys Arg Val65 70 75 80Glu Ser Lys Thr Leu Phe Ser Phe Pro Phe Ser Ser Cys Ser Pro Pro85 90 95Cys Phe Leu Pro Gln Lys Ala Ser Gly Lys Leu His Ser Gln Pro Gln100 105 110Gly Met Cys Pro Phe Arg Leu Ile Ser Phe Pro Phe Cys Ile Leu Lys115 120 125Pro Lys Lys Ile Ser Trp Lys Glu Lys Asn Ile Cys130 135 140<210>4<211>2175<212>DNA<213>智人(Homo sapiens)<400>4ggcttcacgg gctgggagag ggttctgccc tccttcatcc agacagcagg tctcatccta 60ggtccttaga gaaaagtgcc tggagggctt ttaaggagtc acagtgccat cacatgctca120aacatctcca caatggtgca aggatcacag tgcagatgcc acctacaatc gagggccact180gggtctccac aggctgtgaa gtaaggtcag gcccagagtt catcacaagg tcctacagat240tctaccacaa taacaccttc aaggcctacc aattttatta tggcagcaac cggtgcacaa300atcccactta tactctcatc atccggggca agatccgcct ccgccagcct cctggatcat360ccgagggggc acggaagccg actaccagct gcacaacgtc caggtgatct gccacacaga420ggcggtggcc gagaagctcg gccagcaggt gaaccgcaca tgcccgggct tcctcgcaga480cgggggtccc tgggtgcagg acgtggccta tgacctctgg cgagaggaga acggctgtga540gtgcaccaag gccgtgaact ttgccatgca tgaacttcag ctcatccggg tggagaagca600gtaccttcac cacaacctcg accacctggt cgaggagctc ttccttggtg acattcacac660tgatgccacc cagaggatgt tctaccggcc ctccagttac cagccccctc tgcagaatgc720caagaaccac gaccatgcct gcatcgcctg tcggatcatc tatcggtcag acgagcacca780ccctcccatc ctgcccccaa aggcagacct gaccatcggc ctgcacgggg agtgggtgag840ccagcgctgt gaggtgcgcc ccgaagtcct cttcctcacc cgccacttca tcttccatga900caacaacaac acctgggagg gccactacta ccactactca gacccggtgt gcaagcaccc960caccttctcc atctacgccc ggggccgtta cagccggggc gtcctctcgt ccagggtcat 1020gggaggcacc gagttcgtgt tcaaagtgaa tcacatgaag gtcaccccca tggatgcggc 1080cacagcctca ctgctaaacg tcttcaacgg gaatgagtgc ggggccgagg gctcctggca 1140ggtgggcatc cagcaggatg tgacccacac caatggctgc gtggccctgg gcatcaaact 1200acctcacacg gagtacgaga tcttcaaaat ggaacaggat gcccgggggc gctatctgct 1260gttcaacggt cagaggccca gcgacgggtc cagcccagac aggccagaga agagagccac 1320gtcctaccag atgcccttgg tccagtgtgc ctcctcttcg ccgagggcag aggaccttgc 1380agaagacagt ggaagcagcc tgtatggccg ggcccctggg aggcacacct ggtccctgct 1440gctggctgca cttgcctgcc ttgtccctct gctgcattgg aacatccgca gatagaagtt 1500ttagaaagtt ctatttttcc aaaccaggat tccttactat tgacagattt tctttaccaa 1560aagaaaagac atttattctt ttgatgcact tgaatgccag agaactgtcc ttctttttct 1620cctctccctc cctcccagcc cctgagtcat gaacagcaag gagtgtttga agtttctgct 1680ttgaactccg tccagcctga tccctggcct gagcaacttc acaacagtaa ttgcacttta 1740agacagccta gagttctgga cgagcgtgtt tggtagcagg gatgaaagct agggcctctt 1800atttttttct cttaattatt attatatttc tgagttaaac ttagaagaaa caactatcaa 1860gctacaactt ttcctgccat tttcctgtgg ttgcagcctg tcttcctttg aaattgtttt 1920actctctgag ttttatatgc tggaatccaa tgcagagttg gtttgggact gtgatcaaga 1980caccttttat taataaagaa gagacacagg tgtagatatg tatatacaaa aagatgtacg 2040gtctggccaa accaccttcc cagcctttat gcaaaaaaag gggagaatca aagctttcat 2100ttcagaaatg ttgcgtggaa aagtatctgt aattaaagtt tcgaagtaat ttaacctaaa 2160aaaaaaaaaa aaaaa 2175<210>5<211>2175<212>DNA<213>智人(Homo sapiens)<220><221>CDS<222>(566)..(1492)<400>5ggcttcacgg gctgggagag ggttctgccc tccttcatcc agacagcagg tctcatccta 60ggtccttaga gaaaagtgcc tggagggctt ttaaggagtc acagtgccat cacatgctca120aacatctcca caatggtgca aggatcacag tgcagatgcc acctacaatc gagggccact180gggtctccac aggctgtgaa gtaaggtcag gcccagagtt catcacaagg tcctacagat240tctaccacaa taacaccttc aaggcctacc aattttatta tggcagcaac cggtgcacaa300atcccactta tactctcatc atccggggca agatccgcct ccgccagcct cctggatcat360ccgagggggc acggaagccg actaccagct gcacaacgtc caggtgatct gccacacaga420ggcggtggcc gagaagctcg gccagcaggt gaaccgcaca tgcccgggct tcctcgcaga480cgggggtccc tgggtgcagg acgtggccta tgacctctgg cgagaggaga acggctgtga540gtgcaccaag gccgtgaact ttgcc atg cat gaa ctt cag ctc atc cgg gtg 592Met His Glu Leu Gln Leu Ile Arg Val1 5gag aag cag tac ctt cac cac aac ctc gac cac ctg gtc gag gag ctc 640Glu Lys Gln Tyr Leu His His Asn Leu Asp His Leu Val Glu Glu Leu10 15 20 25ttc ctt ggt gac att cac act gat gcc acc cag agg atg ttc tac cgg 688Phe Leu Gly Asp Ile His Thr Asp Ala Thr Gln Arg Met Phe Tyr Arg30 35 40ccc tcc agt tac cag ccc cct ctg cag aat gcc aag aac cac gac cat 736Pro Ser Ser Tyr Gln Pro Pro Leu Gln Asn Ala Lys Asn His Asp His45 50 55gcc tgc atc gcc tgt cgg atc atc tat cgg tca gac gag cac cac cct 784Ala Cys Ile Ala Cys Arg Ile Ile Tyr Arg Ser Asp Glu His His Pro60 65 70ccc atc ctg ccc cca aag gca gac ctg acc atc ggc ctg cac ggg gag 832Pro Ile Leu Pro Pro Lys Ala Asp Leu Thr Ile Gly Leu His Gly Glu75 80 85tgg gtg agc cag cgc tgt gag gtg cgc ccc gaa gtc ctc ttc ctc acc 880Trp Val Ser Gln Arg Cys Glu Val Arg Pro Glu Val Leu Phe Leu Thr90 95 100 105cgc cac ttc atc ttc cat gac aac aac aac acc tgg gag ggc cac tac 928Arg His Phe Ile Phe His Asp Asn Asn Asn Thr Trp Glu Gly His Tyr
110 115 120tac cac tac tca gac ccg gtg tgc aag cac ccc acc ttc tcc atc tac 976Tyr His Tyr Ser Asp Pro Val Cys Lys His Pro Thr Phe Ser Ile Tyr125 130 135gcc cgg ggc cgt tac agc cgg ggc gtc ctc tcg tcc agg gtc atg gga 1024Ala Arg Gly Arg Tyr Ser Arg Gly Val Leu Ser Ser Arg Val Met Gly140 145 150ggc acc gag ttc gtg ttc aaa gtg aat cac atg aag gtc acc ccc atg 1072Gly Thr Glu Phe Val Phe Lys Val Asn His Met Lys Val Thr Pro Met155 160 165gat gcg gcc aca gcc tca ctg cta aac gtc ttc aac ggg aat gag tgc 1120Asp Ala Ala Thr Ala Ser Leu Leu Asn Val Phe Asn Gly Asn Glu Cys170 175 180 185ggg gcc gag ggc tcc tgg cag gtg ggc atc cag cag gat gtg acc cac 1168Gly Ala Glu Gly Ser Trp Gln Val Gly Ile Gln Gln Asp Val Thr His190 195 200acc aat ggc tgc gtg gcc ctg ggc atc aaa cta cct cac acg gag tac 1216Thr Asn Gly Cys Val Ala Leu Gly Ile Lys Leu Pro His Thr Glu Tyr205 210 215gag atc ttc aaa atg gaa cag gat gcc cgg ggg cgc tat ctg ctg ttc 1264Glu Ile Phe Lys Met Glu Gln Asp Ala Arg Gly Arg Tyr Leu Leu Phe220 225 230aac ggt cag agg ccc agc gac ggg tcc agc cca gac agg cca gag aag 1312Asn Gly Gln Arg Pro Ser Asp Gly Ser Ser Pro Asp Arg Pro Glu Lys235 240 245aga gcc acg tcc tac cag atg ccc ttg gtc cag tgt gcc tcc tct tcg 1360Arg Ala Thr Ser Tyr Gln Met Pro Leu Val Gln Cys Ala Ser Ser Ser250 255 260 265ccg agg gca gag gac ctt gca gaa gac agt gga agc agc ctg tat ggc 1408Pro Arg Ala Glu Asp Leu Ala Glu Asp Ser Gly Ser Ser Leu Tyr Gly270 275 280cgg gcc cct ggg agg cac acc tgg tcc ctg ctg ctg gct gca ctt gcc 1456Arg Ala Pro Gly Arg His Thr Trp Ser Leu Leu Leu Ala Ala Leu Ala285 290 295tgc ctt gtc cct ctg ctg cat tgg aac atc cgc aga tagaagtttt 1502Cys Leu Val Pro Leu Leu His Trp Asn Ile Arg Arg300 305agaaagttct atttttccaa accaggattc cttactattg acagattttc tttaccaaaa 1562gaaaagacat ttattctttt gatgcacttg aatgccagag aactgtcctt ctttttctcc 1622tctccctccc tcccagcccc tgagtcatga acagcaagga gtgtttgaag tttctgcttt 1682gaactccgtc cagcctgatc cctggcctga gcaacttcac aacagtaatt gcactttaag 1742acagcctaga gttctggacg agcgtgtttg gtagcaggga tgaaagctag ggcctcttat 1802ttttttctct taattattat tatatttctg agttaaactt agaagaaaca actatcaagc 1862tacaactttt cctgccattt tcctgtggtt gcagcctgtc ttcctttgaa attgttttac 1922tctctgagtt ttatatgctg gaatccaatg cagagttggt ttgggactgt gatcaagaca 1982ccttttatta ataaagaaga gacacaggtg tagatatgta tatacaaaaa gatgtacggt 2042ctggccaaac caccttccca gcctttatgc aaaaaaaggg gagaatcaaa gctttcattt 2102cagaaatgtt gcgtggaaaa gtatctgtaa ttaaagtttc gaagtaattt aacctaaaaa 2162aaaaaaaaaa aaa 2175<210>6<211>309<212>PRT<213>智人(Homo sapiens)<400>6Met His Glu Leu Gln Leu Ile Arg Val Glu Lys Gln Tyr Leu His His1 5 10 15Asn Leu Asp His Leu Val Glu Glu Leu Phe Leu Gly Asp Ile His Thr20 25 30Asp Ala Thr Gln Arg Met Phe Tyr Arg Pro Ser Ser Tyr Gln Pro Pro35 40 45Leu Gln Asn Ala Lys Asn His Asp His Ala Cys Ile Ala Cys Arg Ile50 55 60Ile Tyr Arg Ser Asp Glu His His Pro Pro Ile Leu Pro Pro Lys Ala65 70 75 80Asp Leu Thr Ile Gly Leu His Gly Glu Trp Val Ser Gln Arg Cys Glu85 90 95Val Arg Pro Glu Val Leu Phe Leu Thr Arg His Phe Ile Phe His Asp100 105 110Asn Asn Asn Thr Trp Glu Gly His Tyr Tyr His Tyr Ser Asp Pro Val115 120 125Cys Lys His Pro Thr Phe Ser Ile Tyr Ala Arg Gly Arg Tyr Ser Arg130 135 140Gly Val Leu Ser Ser Arg Val Met Gly Gly Thr Glu Phe Val Phe Lys145 150 155 160Val Asn His Met Lys Val Thr Pro Met Asp Ala Ala Thr Ala Ser Leu165 170 175Leu Asn Val Phe Asn Gly Asn Glu Cys Gly Ala Glu Gly Ser Trp Gln180 185 190Val Gly Ile Gln Gln Asp Val Thr His Thr Asn Gly Cys Val Ala Leu195 200 205Gly Ile Lys Leu Pro His Thr Glu Tyr Glu Ile Phe Lys Met Glu Gln210 215 220Asp Ala Arg Gly Arg Tyr Leu Leu Phe Asn Gly Gln Arg Pro Ser Asp225 230 235 240Gly Ser Ser Pro Asp Arg Pro Glu Lys Arg Ala Thr Ser Tyr Gln Met245 250 255Pro Leu Val Gln Cys Ala Ser Ser Ser Pro Arg Ala Glu Asp Leu Ala260 265 270Glu Asp Ser Gly Ser Ser Leu Tyr Gly Arg Ala Pro Gly Arg His Thr275 280 285Trp Ser Leu Leu Leu Ala Ala Leu Ala Cys Leu Val Pro Leu Leu His290 295 300Trp Asn Ile Arg Arg305<210>7<211>1937<212>DNA<213>智人(Homo sapiens)<400>7ggtcagcttt gtcactggtt atgcgatccc cactgtctgc gtcggccttg cttttgtggt 60cttcctctgt ggccagagcg ttttcatcac caagcctcct gatggcagtg ccttcaccga120catgttcaag atactgacgt attcctgctg ttcccagaag cgaagtggag agcgccagag180taatggatgc agacaacata tgttttacag agtcttcatt tgaggattcc agaaatttca240aatattacaa ccactcctca cacgctccct gcagcctggc tgaccatgtt tgatgctgtg300ctcatcctcc tgctcatccc tctgaaggac aaactggtcg atcccatttt gagaagacat360ggcctgctcc catcctccct gaagaggatc gccgtgggca tgttctttgt catgtgctca420gcctttgctg caggaatttt ggagagtaaa aggctgaacc ttgttaaaga gaaaaccatt480aatcagacca tcggcaacgt cgtctaccat gctgccgatc tgtcgctgtg gtggcaggtg540ccgcagtact tgctgattgg gatcagcgag atctttgcaa gtatcgcagg cctggaattt600gcatactcag ctgcccccaa gtccatgcag agtgccataa tgggcttgtt ctttttcttc660tctggccgtc gggtcgttcg tgggttctgg actgctggca ctggtgtcta tcaaagccat720cggatggatg agcagtcaca cagactttgg taatattaac ggctgctatt tgaactatta780cttttttctt ctggctgcta ttcaaggagc taccctcctg cttttcctca ttatttctgt840gaaatatgac catcatcgag accatcagcg atcaagagcc aatggcgtgc ccaccagcag900gagggcctga ccttcctgag gccatgtgcg gtttctgagg ctgacatgtc agtaactgac960tggggtgcac tgagaacagg caagacttta aattcccata aaatgtctga cttcactgaa 1020acttgcatgt tgcctggatt gatttcttct ttccctctat ccaaaggagc ttggtaagtg 1080ccttactgca gcgtgtctcc tggcacgctg ggccctccgg gaggagagct gcagatttcg 1140agtatgtcgc ttgtcattca aggtctctgt gaatcctcta gctgggttcc cttttttaca 1200gaaactcaca aatggagatt gcaaagtctt ggggaactcc acgtgttagt tggcatccca 1260gtttcttaaa caaatagtat cacctgcttc ccatagccat atctcactgt aaaaaaaaaa 1320attaataaac tgttacttat atttaagaaa gtgaggattt ttttttttta aagataaaag 1380catggtcaga tgctgcaagg attttacaat aaatgccata tttatggttt ccttcctgag 1440aacagtcttg ctcttgccat gttctttgat ttaggctggt agtaaacaca tttcatctgc 1500tgcttcaaaa agtacttact ttttaaacca tcaacattac ttttctttct taaggcaagg 1560catgcataag agtcatttga gaccatgtgt cccatctcaa gccacagagc aactcacggg 1620gtacttcaca ccttacctag tcagagtgct tatatatagc tttattttgg tacgattgag 1680actaaagact gatcatggtt gtatgtaagg aaaacattct tttgaacaga aatagtgtaa 1740ttaaaaataa ttgaaagtgt taaatgtgaa cttgagctgt ttgaccagtc acatttttgt 1800attgttactg tacgtgtatc tggggcttct ccgtttgtta atactttttc tgtatttgtt 1860gctgtatttt tggcataact ttattataaa aagcatctca aatgcgaaaa aaaaaaaaaa 1920aaaaaaaaaa aaaaaaa 1937<210>8<211>1937<212>DNA<213>智人(Homo sapiens)<220><221>CDS<222>(187)..(750)<400>8ggtcagcttt gtcactggtt atgcgatccc cactgtctgc gtcggccttg cttttgtggt 60cttcctctgt ggccagagcg ttttcatcac caagcctcct gatggcagtg ccttcaccga120catgttcaag atactgacgt attcctgctg ttcccagaag cgaagtggag agcgccagag180taatgg atg cag aca aca tat gtt tta cag agt ctt cat ttg agg att 228Met Gln Thr Thr Tyr Val Leu Gln Ser Leu His Leu Arg Ile1 5 10cca gaa att tca aat att aca acc act cct cac acg ctc cct gca gcc 276Pro Glu Ile Ser Asn Ile Thr Thr Thr Pro His Thr Leu Pro Ala Ala15 20 25 30tgg ctg acc atg ttt gat gct gtg ctc atc ctc ctg ctc atc cct ctg 324Trp Leu Thr Met Phe Asp Ala Val Leu Ile Leu Leu Leu Ile Pro Leu35 40 45aag gac aaa ctg gtc gat ccc att ttg aga aga cat ggc ctg ctc cca 372Lys Asp Lys Leu Val Asp Pro Ile Leu Arg Arg His Gly Leu Leu Pro50 55 60tcc tcc ctg aag agg atc gcc gtg ggc atg ttc ttt gtc atg tgc tca 420Ser Ser Leu Lys Arg Ile Ala Val Gly Met Phe Phe Val Met Cys Ser65 70 75gcc ttt gct gca gga att ttg gag agt aaa agg ctg aac ctt gtt aaa 468Ala Phe Ala Ala Gly Ile Leu Glu Ser Lys Arg Leu Asn Leu Val Lys80 85 90gag aaa acc att aat cag acc atc ggc aac gtc gtc tac cat gct gcc 516Glu Lys Thr Ile Asn Gln Thr Ile Gly Asn Val Val Tyr His Ala Ala95 100 105 110gat ctg tcg ctg tgg tgg cag gtg ccg cag tac ttg ctg att ggg atc 564Asp Leu Ser Leu Trp Trp Gln Val Pro Gln Tyr Leu Leu Ile Gly Ile115 120 125agc gag atc ttt gca agt atc gca ggc ctg gaa ttt gca tac tca gct 612Ser Glu Ile Phe Ala Ser Ile Ala Gly Leu Glu Phe Ala Tyr Ser Ala130 135 140gcc ccc aag tcc atg cag agt gcc ata atg ggc ttg ttc ttt ttc ttc 660Ala Pro Lys Ser Met Gln Ser Ala Ile Met Gly Leu Phe Phe Phe Phe145 150 155tct ggc cgt cgg gtc gtt cgt ggg ttc tgg act gct ggc act ggt gtc 708Ser Gly Arg Arg Val Val Arg Gly Phe Trp Thr Ala Gly Thr Gly Val160 165 170tat caa agc cat cgg atg gat gag cag tca cac aga ctt tgg 750Tyr Gln Ser His Arg Met Asp Glu Gln Ser His Arg Leu Trp175 180 185taatattaac ggctgctatt tgaactatta cttttttctt ctggctgcta ttcaaggagc810taccctcctg cttttcctca ttatttctgt gaaatatgac catcatcgag accatcagcg870atcaagagcc aatggcgtgc ccaccagcag gagggcctga ccttcctgag gccatgtgcg930gtttctgagg ctgacatgtc agtaactgac tggggtgcac tgagaacagg caagacttta990aattcccata aaatgtctga cttcactgaa acttgcatgt tgcctggatt gatttcttct 1050ttccctctat ccaaaggagc ttggtaagtg ccttactgca gcgtgtctcc tggcacgctg 1110ggccctccgg gaggagagct gcagatttcg agtatgtcgc ttgtcattca aggtctctgt 1170gaatcctcta gctgggttcc cttttttaca gaaactcaca aatggagatt gcaaagtctt 1230ggggaactcc acgtgttagt tggcatccca gtttcttaaa caaatagtat cacctgcttc 1290ccatagccat atctcactgt aaaaaaaaaa attaataaac tgttacttat atttaagaaa 1350gtgaggattt ttttttttta aagataaaag catggtcaga tgctgcaagg attttacaat 1410aaatgccata tttatggttt ccttcctgag aacagtcttg ctcttgccat gttctttgat 1470ttaggctggt agtaaacaca tttcatctgc tgcttcaaaa agtacttact ttttaaacca 1530tcaacattac ttttctttct taaggcaagg catgcataag agtcatttga gaccatgtgt 1590cccatctcaa gccacagagc aactcacggg gtacttcaca ccttacctag tcagagtgct 1650tatatatagc tttattttgg tacgattgag actaaagact gatcatggtt gtatgtaagg 1710aaaacattct tttgaacaga aatagtgtaa ttaaaaataa ttgaaagtgt taaatgtgaa 1770cttgagctgt ttgaccagtc acatttttgt attgttactg tacgtgtatc tggggcttct 1830ccgtttgtta atactttttc tgtatttgtt gctgtatttt tggcataact ttattataaa 1890aagcatctca aatgcgaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 1937<210>9<211>188<212>PRT<213>智人(Homo sapiens)<400>9Met Gln Thr Thr Tyr Val Leu Gln Ser Leu His Leu Arg Ile Pro Glu1 5 10 15Ile Ser Asn Ile Thr Thr Thr Pro His Thr Leu Pro Ala Ala Trp Leu20 25 30Thr Met Phe Asp Ala Val Leu Ile Leu Leu Leu Ile Pro Leu Lys Asp35 40 45Lys Leu Val Asp Pro Ile Leu Arg Arg His Gly Leu Leu Pro Ser Ser50 55 60Leu Lys Arg Ile Ala Val Gly Met Phe Phe Val Met Cys Ser Ala Phe65 70 75 80Ala Ala Gly Ile Leu Glu Ser Lys Arg Leu Asn Leu Val Lys Glu Lys85 90 95Thr Ile Asn Gln Thr Ile Gly Asn Val Val Tyr His Ala Ala Asp Leu100 105 110Ser Leu Trp Trp Gln Val Pro Gln Tyr Leu Leu Ile Gly Ile Ser Glu115 120 125Ile Phe Ala Ser Ile Ala Gly Leu Glu Phe Ala Tyr Ser Ala Ala Pro130 135 140Lys Ser Met Gln Ser Ala Ile Met Gly Leu Phe Phe Phe Phe Ser Gly145 150 155 160Arg Arg Val Val Arg Gly Phe Trp Thr Ala Gly Thr Gly Val Tyr Gln165 170 175Ser His Arg Met Asp Glu Gln Ser His Arg Leu Trp180 185<210>10<211>2791<212>DNA<213>智人(Homo sapiens)<400>10gaattacctt tgttaccgag ttcatgcgaa cattcttcaa caggttaggg ctgtcgtagt 60tctattttaa tactccagtc attttctaaa tattctctgt tctctgggct tccctaacag120tgaggtgatg tcccaacgct tctcaggctg cgtggactcc ttgttcctgg gttgctcagg180acgctcatgg agtaaggctt gcccagcgcc cttccccagc tgggcttggt cccctgaccg240cccagcagct gcgtctcctt tccctggatt ctggtcttga gcatttcctc cgcaaatgtg300cccgagattg gagaagtcaa agctcctctg agtcataagg gaaagttatg cacacttaaa360tttagctgaa cactcatttt tatagtattg acttttttat gacctcgata aacttggttc420atggtgaaag gcagtctctg tccttggtat ggtagaaagg cctggtggtg aggacccacg480ccagacagac gcgaggcaga cacgggacac atgccagatg ggcagacgcg aggcacgtgg540ttctgagggc tcctcagagg cccacatgcc aggaccgccc agccgccctc ctccagatct600acccggccac cctcccccag gcctgcccaa ccaccttccc ccagccctga gaaaccctcg660accgccacct cccctgccac cctcccccag ccctgagggg cctgtgggct ccttgtcggg720agcaggctgg gctgcaggtg tcaccacagc ctggtccagc tataggcttc tctagtatta780gcacctctgc ccctcacagt gcctagtggc ccaggcccag ctctgtcccc atgttacaga840tggggacacc gagccacggc caggaccagt gacttgccga ggttgtgggc tggggtgctc900ctggctgatc cccgggttct tggctccctg agagtgcgag atgccgtgtc tgtgaggtgc960ctgcagcatc gaacgcttcg gatacagaac cagttttctt cctcatttca gtgacgtggc 1020accagctggc ttttgctgac cattgtggca acaggctgag gctgtggcct gggttcacca 1080ctactctcta tttttcaggg caaggctgca gctctaccgg acgcgggaca tgggctgggg 1140cgtgcggtcc ctgcaggaca tcccaccagg cacctttgtc tgcgagtatg ttggggagct 1200gatttcagac tcagaagccg acgttcgaga ggaagattct tacctctttg atctcgacaa 1260taaggacggg gaggtttact gcatcgacgc gcggttctac gggaacgtca gccggttcat 1320caaccaccac tgcgagccca acctggtgcc cgtgcgcgtg ttcatggccc accaggacct 1380gcggttcccc cggatcgcct tcttcagcac ccgcctgatc gaggccggcg agcagctcgg 1440gtttgactat ggagagcgct tctgggacat caaaggcaag ctcttcagct gccgctgcgg 1500ctcccccaag tgccggcact cgagcgcggc cctggcccag cgtcaggcca gcgcggccca 1560ggaggcccag gaggacggct tgcccgacac cagctccgcg gctgccgccg accccctatg 1620agacgccgcc ggccagcggg gcgctcggga gccagggacc gccgcgtcgc cgattagagg 1680acgaggagga gagattccgc acgcaaccga aagggtcctt cggggctgcg ccgccggctt 1740cctggagggg tcggaggtga ggctgcagcc cctgcgggcg ggtgtggatg cctcccagcc 1800accttcccag acctgcggcc tcaccgcggg cccagtgccc aggctggagc gcacactttg 1860gtccgcgcgc cagagacgct gggagtccgc actggcatca ccttctgagt ttctgatgct 1920gatttgtcgt tgcgaagttt ctcgtttctt cctctgacct ccgaggtccc cgctgcacca 1980cggggttgct ctgttctcct gtccggccca gactcttctg tgtggcgccg ccgaagccac 2040cgttagcgcg agctgctccg ttcgccctgc ccacggcctg cgtggctggg gccgagtccc 2100aggggccgca cggagggcac agtctcctgt caggctcgga gaggtcagga gaccgacccc 2160accactaact ttggagaaaa tgtgggtttg ctttttaaag gaatcctata tctagtccta 2220tatatcaaac ctctaactga cgtttctttt cgaggaagtg gcttggtggg tgcagccccc 2280gccggttccg ttgacgctgg caccttctgt tgatttttta agccacatgc tatgatgaat 2340aaactgattt attttctacc attactgaac attaggacaa acacaaaata aaaaacagaa 2400cacagacaac ggtgctgatt ctggtgtggt ttctactcac cacgtgaaat aaactatcaa 2460ctgtataaag agaacaaagt gattttagaa taaaatgcag gaaaaacttt tttaaagatg 2520ttagtcttgt agcgtgaata aatttgccat caccttttgt gtggtggcct ggcaggtcat 2580atactttttt ttggcatata cctttttaaa gactgtaatt agtgcagtaa cagtggggtt 2640ttttttgtgc aactcttcta aaaacattca taatgcagtc atgtttattt ttttctgtta 2700aaatgttttt gacagtttta agagcagtct tttggctctg accatttctt gttctgtttc 2760caatgaaatc aataaaaaaa aaaaaaaaaa a 2791<210>11<211>2791<212>DNA<213>智人(Homo sapiens)<220><221>CDS<222>(1130)..(1618)<400>11gaattacctt tgttaccgag ttcatgcgaa cattcttcaa caggttaggg ctgtcgtagt 60tctattttaa tactccagtc attttctaaa tattctctgt tctctgggct tccctaacag120tgaggtgatg tcccaacgct tctcaggctg cgtggactcc ttgttcctgg gttgctcagg180acgctcatgg agtaaggctt gcccagcgcc cttccccagc tgggcttggt cccctgaccg240cccagcagct gcgtctcctt tccctggatt ctggtcttga gcatttcctc cgcaaatgtg300cccgagattg gagaagtcaa agctcctctg agtcataagg gaaagttatg cacacttaaa360tttagctgaa cactcatttt tatagtattg acttttttat gacctcgata aacttggttc420atggtgaaag gcagtctctg tccttggtat ggtagaaagg cctggtggtg aggacccacg480ccagacagac gcgaggcaga cacgggacac atgccagatg ggcagacgcg aggcacgtgg540ttctgagggc tcctcagagg cccacatgcc aggaccgccc agccgccctc ctccagatct600acccggccac cctcccccag gcctgcccaa ccaccttccc ccagccctga gaaaccctcg660accgccacct cccctgccac cctcccccag ccctgagggg cctgtgggct ccttgtcggg720agcaggctgg gctgcaggtg tcaccacagc ctggtccagc tataggcttc tctagtatta780gcacctctgc ccctcacagt gcctagtggc ccaggcccag ctctgtcccc atgttacaga840tggggacacc gagccacggc caggaccagt gacttgccga ggttgtgggc tggggtgctc900ctggctgatc cccgggttct tggctccctg agagtgcgag atgccgtgtc tgtgaggtgc960ctgcagcatc gaacgcttcg gatacagaac cagttttctt cctcatttca gtgacgtggc 1020accagctggc ttttgctgac cattgtggca acaggctgag gctgtggcct gggttcacca 1080ctactctcta tttttcaggg caaggctgca gctctaccgg acgcgggac atg ggc tgg 1138Met Gly Trp1ggc gtg cgg tcc ctg cag gac atc cca cca ggc acc ttt gtc tgc gag 1186Gly Val Arg Ser Leu Gln Asp Ile Pro Pr0 Gly Thr Phe Val Cys Glu5 10 15tat gtt ggg gag ctg att tca gac tca gaa gcc gac gtt cga gag gaa 1234Tyr Val Gly Glu Leu Ile Ser Asp Ser Glu Ala Asp Val Arg Glu Glu20 25 30 35gat tct tac ctc ttt gat ctc gac aat aag gac ggg gag gtt tac tgc 1282Asp Ser Tyr Leu Phe Asp Leu Asp Asn Lys Asp Gly Glu Val Tyr Cys40 45 50atc gac gcg cgg ttc tac ggg aac gtc agc cgg ttc atc aac cac cac 1330Ile Asp Ala Arg Phe Tyr Gly Asn Val Ser Arg Phe Ile Asn His His55 60 65tgc gag ccc aac ctg gtg ccc gtg cgc gtg ttc atg gcc cac cag gac 1378Cys Glu Pro Asn Leu Val Pro Val Arg Val Phe Met Ala His Gln Asp70 75 80ctg cgg ttc ccc cgg atc gcc ttc ttc agc acc cgc ctg atc gag gcc 1426Leu Arg Phe Pro Arg Ile Ala Phe Phe Ser Thr Arg Leu Ile Glu Ala85 90 95ggc gag cag ctc ggg ttt gac tat gga gag cgc ttc tgg gac atc aaa 1474Gly Glu Gln Leu Gly Phe Asp Tyr Gly Glu Arg Phe Trp Asp Ile Lys100 105 110 115ggc aag ctc ttc agc tgc cgc tgc ggc tcc ccc aag tgc cgg cac tcg 1522Gly Lys Leu Phe Ser Cys Arg Cys Gly Ser Pro Lys Cys Arg His Ser120 125 130agc gcg gcc ctg gcc cag cgt cag gcc agc gcg gcc cag gag gcc cag 1570Ser Ala Ala Leu Ala Gln Arg Gln Ala Ser Ala Ala Gln Glu Ala Gln135 140 145gag gac ggc ttg ccc gac acc agc tcc gcg gct gcc gcc gac ccc cta 1618Glu Asp Gly Leu Pro Asp Thr Ser Ser Ala Ala Ala Ala Asp Pro Leu150 155 160tgagacgccg ccggccagcg gggcgctcgg gagccaggga ccgccgcgtc gccgattaga 1678ggacgaggag gagagattcc gcacgcaacc gaaagggtcc ttcggggctg cgccgccggc 1738ttcctggagg ggtcggaggt gaggctgcag cccctgcggg cgggtgtgga tgcctcccag 1798ccaccttccc agacctgcgg cctcaccgcg ggcccagtgc ccaggctgga gcgcacactt 1858tggtccgcgc gccagagacg ctgggagtcc gcactggcat caccttctga gtttctgatg 1918ctgatttgtc gttgcgaagt ttctcgtttc ttcctctgac ctccgaggtc cccgctgcac 1978cacggggttg ctctgttctc ctgtccggcc cagactcttc tgtgtggcgc cgccgaagcc 2038accgttagcg cgagctgctc cgttcgccct gcccacggcc tgcgtggctg gggccgagtc 2098ccaggggccg cacggagggc acagtctcct gtcaggctcg gagaggtcag gagaccgacc 2158ccaccactaa ctttggagaa aatgtgggtt tgctttttaa aggaatccta tatctagtcc 2218tatatatcaa acctctaact gacgtttctt ttcgaggaag tggcttggtg ggtgcagccc 2278ccgccggttc cgttgacgct ggcaccttct gttgattttt taagccacat gctatgatga 2338ataaactgat ttattttcta ccattactga acattaggac aaacacaaaa taaaaaacag 2398aacacagaca acggtgctga ttctggtgtg gtttctactc accacgtgaa ataaactatc 2458aactgtataa agagaacaaa gtgattttag aataaaatgc aggaaaaact tttttaaaga 2518tgttagtctt gtagcgtgaa taaatttgcc atcacctttt gtgtggtggc ctggcaggtc 2578atatactttt ttttggcata taccttttta aagactgtaa ttagtgcagt aacagtgggg 2638ttttttttgt gcaactcttc taaaaacatt cataatgcag tcatgtttat ttttttctgt 2698taaaatgttt ttgacagttt taagagcagt cttttggctc tgaccatttc ttgttctgtt 2758tccaatgaaa tcaataaaaa aaaaaaaaaa aaa2791<210>12<211>163<212>PRT<213>智人(Homo sapiens)<400>12Met Gly Trp Gly Val Arg Ser Leu Gln Asp Ile Pro Pro Gly Thr Phe1 5 10 15Val Cys Glu Tyr Val Gly Glu Leu Ile Ser Asp Ser Glu Ala Asp Val20 25 30Arg Glu Glu Asp Ser Tyr Leu Phe Asp Leu Asp Asn Lys Asp Gly Glu35 40 45Val Tyr Cys Ile Asp Ala Arg Phe Tyr Gly Asn Val Ser Arg Phe Ile50 55 60Asn His His Cys Glu Pro Asn Leu Val Pro Val Arg Val Phe Met Ala65 70 75 80His Gln Asp Leu Arg Phe Pro Arg Ile Ala Phe Phe Ser Thr Arg Leu85 90 95Ile Glu Ala Gly Glu Gln Leu Gly Phe Asp Tyr Gly Glu Arg Phe Trp100 105 110Asp Ile Lys Gly Lys Leu Phe Ser Cys Arg Cys Gly Ser Pro Lys Cys115 120 125Arg His Ser Ser Ala Ala Leu Ala Gln Arg Gln Ala Ser Ala Ala Gln130 135 140Glu Ala Gln Glu Asp Gly Leu Pro Asp Thr Ser Ser Ala Ala Ala Ala145 150 155 160Asp Pro Leu<210>13<211>2337<212>DNA<213>智人(Homo sapiens)<400>13ggaccctgtc tcaaaaaaaa aaaaaaaaaa aaaagaagaa aaagaagaag ctgcatttgc 60ataacgaaag cagtggtttt acttagaatg gtgtgttcat ttgaggtgcc ttgggaggga120tgagtagaga ttatcaggga gcagggagcc taaaaacccc aaaccaccct tggcaccatc180atggaacgag tcacgtactt tggttttttt tttcaatcat atcataccga agtttattga240tgacatcaaa caaaaatttc tgtaacaaaa aaggcagggt tgggtgctgg gattacaggt300gtgagccgct gcacccggcc tcaaacatga ttttagatct ttttttttgt ttttgttttt360ctttttcaaa gtagtcattc ttcactgaga aggaacacat accaaggtta gtgggtttga420tcatttgaaa aatggcagca ccattcattt taaacatttt ctggcttttt actatggaat480ctctcatggt ataaaaataa attttagatt tttcagagcc aaaatgaaaa tactttagaa540caaaatcagg ccaaatcttt ggaattcaaa gtggctgaac acctaaaaga aacagaatat600aaaactcgcc aattacgtgt cttcccagag gtctggacag aatttctttc taataatttg660gacatttctt ccctttgcca gtgatacggg aacaacacct ccagagagtg gtatttttgg720atttatgata aacttctctg catttcttgg taagtacaca ataattatta taaataattg780aaaagctcac aattccaagt gaagttgatg tgtcatttgt agttttcata taatttttat840tttattttat ttattttttc tgagacgggg tctctgtcat ccaggctgga gtgcagtggc900gtgatcacgg ctcactgcag cctcgacctg ccgggctcag gcagtcctcc cacctcagcc960tccggagtag ctggtgctgc aggtgcacac caccacgccc agctaatttt ttgtagtttt 1020ttgtagagat ggggtttcac catgttgcca ggctggcctt gagctcccgg gcttcagtga 1080tccacctgcc ttggcctctc aaagtgctga acttataggt gtgagccact gcacacggcc 1140ttgtgtataa tttttttaaa agcacaatct ttgcagctag atttttgtcc tattttgaga 1200aactgaagtt aaaagatata aaaaattatg gctttattag agaactatac tttaattagt 1260aatttgtaac aggatttgct gtaggtggtt ttaaatacca aacttctgga acggatttta 1320agtgcaattt agtttttaaa agtgttgatt tatggtcaag acacttatgt aagccaaaga 1380cacccaatgc gtaagctaag tttctcaaag tgtattctga aggcaagctg atgaaaagtc 1440acctggagtt ctcgtaaaat gcaggttcct gggccatgct actcaaccag aacctttggg 1500agtgtgggtt cctgaagatg tgttgtaaac aagcactcta ggggacttgg tttctcacta 1560aagtttgagg accattgaca aaggcattat cttacctgtt agagaaaggg gacaggtgga 1620gcaaggaata gtatgatttt tcttttcagt tcctcagatg tacctaagat gcagatgata 1680gggtgcaacc ttgtcataag ccaattaatg taatgcatat taattacaac tattgtataa 1740ttaatgtaaa gctcagtctt ctataaggtg attcaagtat atagatatca gatgtggggc 1800attttctctt agtccttcta taatctcccc ccaaacaatc aagtgtttgc caagggccta 1860tcttgtaacc aacgctttct gttcctctct actggtacag tgtgagaagg gacagtgatg 1920ctgaccctac ttagtgactt ggcattttgg aatttgttca tcctacttgg tagcaggaaa 1980gtttcaccgc atcaccattt gtagtcctcc taaagttttg gaggtgagca aggggaagta 2040gcaatatgga gtcagtcaat cccagtgccc tcttacacca tccttgccaa gaatccagac 2100ttggaaaaca gagagattat tttatcacag caagtgataa atacggcttt tgcttctgaa 2160taaagcagaa actgacaaat atattcattt gaaatagtct atgtgagctc atgcctgtaa 2220ttctagcatt ttgggaggct gaagcaggag gatctgttga gcccgggagt tcaagaccag 2280cctgggcaat gtggtgagat ctcatctcta caaaaagtta aaaaaaaaaa aaaaaaa 2337<210>14<211>2337<212>DNA<213>智人(Homo sapiens)<220><221>CDS<222>(120)..(371)<400>14ggaccctgtc tcaaaaaaaa aaaaaaaaaa aaaagaagaa aaagaagaag ctgcatttgc 60ataacgaaag cagtggtttt acttagaatg gtgtgttcat ttgaggtgcc ttgggaggg 119atg agt aga gat tat cag gga gca ggg agc cta aaa acc cca aac cac 167Met Ser Arg Asp Tyr Gln Gly Ala Gly Ser Leu Lys Thr Pro Asn His1 5 10 15cct tgg cac cat cat gga acg agt cac gta ctt tgg ttt ttt ttt tca 215Pro Trp His His His Gly Thr Ser His Val Leu Trp Phe Phe Phe Ser20 25 30atc ata tca tac cga agt tta ttg atg aca tca aac aaa aat ttc tgt 263Ile Ile Ser Tyr Arg Ser Leu Leu Met Thr Ser Asn Lys Asn Phe Cys35 40 45aac aaa aaa ggc agg gtt ggg tgc tgg gat tac agg tgt gag ccg ctg 311Asn Lys Lys Gly Arg Val Gly Cys Trp Asp Tyr Arg Cys Glu Pro Leu50 55 60cac ccg gcc tca aac atg att tta gat ctt ttt ttt tgt ttt tgt ttt 359His Pro Ala Ser Asn Met Ile Leu Asp Leu Phe Phe Cys Phe Cys Phe65 70 75 80tct ttt tca aag tagtcattct tcactgagaa ggaacacata ccaaggttag 411Ser Phe Ser Lystgggtttgat catttgaaaa atggcagcac cattcatttt aaacattttc tggcttttta471ctatggaatc tctcatggta taaaaataaa ttttagattt ttcagagcca aaatgaaaat531actttagaac aaaatcaggc caaatctttg gaattcaaag tggctgaaca cctaaaagaa591acagaatata aaactcgcca attacgtgtc ttcccagagg tctggacaga atttctttct651aataatttgg acatttcttc cctttgccag tgatacggga acaacacctc cagagagtgg711tatttttgga tttatgataa acttctctgc atttcttggt aagtacacaa taattattat771aaataattga aaagctcaca attccaagtg aagttgatgt gtcatttgta gttttcatat831aatttttatt ttattttatt tattttttct gagacggggt ctctgtcatc caggctggag891tgcagtggcg tgatcacggc tcactgcagc ctcgacctgc cgggctcagg cagtcctccc951acctcagcct ccggagtagc tggtgctgca ggtgcacacc accacgccca gctaattttt 1011tgtagttttt tgtagagatg gggtttcacc atgttgccag gctggccttg agctcccggg 1071cttcagtgat ccacctgcct tggcctctca aagtgctgaa cttataggtg tgagccactg 1131cacacggcct tgtgtataat ttttttaaaa gcacaatctt tgcagctaga tttttgtcct 1191attttgagaa actgaagtta aaagatataa aaaattatgg ctttattaga gaactatact 1251ttaattagta atttgtaaca ggatttgctg taggtggttt taaataccaa acttctggaa 1311cggattttaa gtgcaattta gtttttaaaa gtgttgattt atggtcaaga cacttatgta 1371agccaaagac acccaatgcg taagctaagt ttctcaaagt gtattctgaa ggcaagctga 1431tgaaaagtca cctggagttc tcgtaaaatg caggttcctg ggccatgcta ctcaaccaga 1491acctttggga gtgtgggttc ctgaagatgt gttgtaaaca agcactctag gggacttggt 1551ttctcactaa agtttgagga ccattgacaa aggcattatc ttacctgtta gagaaagggg 1611acaggtggag caaggaatag tatgattttt cttttcagtt cctcagatgt acctaagatg 1671cagatgatag ggtgcaacct tgtcataagc caattaatgt aatgcatatt aattacaact 1731attgtataat taatgtaaag ctcagtcttc tataaggtga ttcaagtata tagatatcag 1791atgtggggca ttttctctta gtccttctat aatctccccc caaacaatca agtgtttgcc 1851aagggcctat cttgtaacca acgctttctg ttcctctcta ctggtacagt gtgagaaggg 1911acagtgatgc tgaccctact tagtgacttg gcattttgga atttgttcat cctacttggt 1971agcaggaaag tttcaccgca tcaccatttg tagtcctcct aaagttttgg aggtgagcaa 2031ggggaagtag caatatggag tcagtcaatc ccagtgccct cttacaccat ccttgccaag 2091aatccagact tggaaaacag agagattatt ttatcacagc aagtgataaa tacggctttt 2151gcttctgaat aaagcagaaa ctgacaaata tattcatttg aaatagtcta tgtgagctca 2211tgcctgtaat tctagcattt tgggaggctg aagcaggagg atctgttgag cccgggagtt 2271caagaccagc ctgggcaatg tggtgagatc tcatctctac aaaaagttaa aaaaaaaaaa 2331aaaaaa 2337<210>15<211>84<212>PRT<213>智人(Homo sapiens)<400>15Met Ser Arg Asp Tyr Gln Gly Ala Gly Ser Leu Lys Thr Pro Asn His1 5 10 15Pro Trp His His His Gly Thr Ser His Val Leu Trp Phe Phe Phe Ser20 25 30Ile Ile Ser Tyr Arg Ser Leu Leu Met Thr Ser Asn Lys Asn Phe Cys35 40 45Asn Lys Lys Gly Arg Val Gly Cys Trp Asp Tyr Arg Cys Glu Pro Leu50 55 60His Pro Ala Ser Asn Met Ile Leu Asp Leu Phe Phe Cys Phe Cys Phe65 70 75 80Ser Phe Ser Lys
權利要求
1.一種分離的具有抑癌功能的人蛋白,其特征在于,它包含具有選自下組的氨基酸序列的多肽SEQ ID NO3、6、9、12、15;或其保守性變異多肽、或其活性片段、或其活性衍生物。
2.如權利要求1所述的多肽,其特征在于,該多肽是具有選自下組的氨基酸序列的多肽SEQ ID NO3、6、9、12、15。
3.一種分離的多核苷酸,其特征在于,它包含一核苷酸序列,該核苷酸序列與選自下組的一種核苷酸序列有至少85%相同性(a)編碼如權利要求1和2所述多肽的多核苷酸;(b)與多核苷酸(a)互補的多核苷酸。
4.如權利要求3所述的多核苷酸,其特征在于,該多核苷酸編碼的多肽具有選自下組的氨基酸序列SEQ ID NO3、6、9、12、15。
5.如權利要求3所述的多核苷酸,其特征在于,該多核苷酸的序列選自下組SEQ ID NO2、5、8、11、14的編碼區(qū)序列或全長序列。
6.一種載體,其特征在于,它含有權利要求3所述的多核苷酸。
7.一種遺傳工程化的宿主細胞,其特征在于,它是選自下組的一種宿主細胞(a)用權利要求6所述的載體轉(zhuǎn)化或轉(zhuǎn)導的宿主細胞;(b)用權利要求3所述的多核苷酸轉(zhuǎn)化或轉(zhuǎn)導的宿主細胞。
8.一種具有抑癌功能的人蛋白活性的多肽的制備方法,其特征在于,該方法包含(a)在適合表達具有抑癌功能的人蛋白的條件下,培養(yǎng)權利要求7所述的宿主細胞;(b)從培養(yǎng)物中分離出具有抑癌功能的人蛋白活性的多肽。
9.一種能與權利要求1所述的具有抑癌功能的人蛋白特異性結(jié)合的抗體。
10.一種藥物組合物,其特征在于,它含有安全有效量的權利要求1所述的蛋白以及藥學上可接受的載體。
全文摘要
本發(fā)明公開了一類新的具有抑癌功能的人蛋白,編碼此多肽的多核苷酸和經(jīng)重組技術產(chǎn)生該多肽的方法。本發(fā)明還公開了此多肽用于治療多種疾病如癌癥等的方法。本發(fā)明還公開了抗此多肽的拮抗劑及其治療作用。本發(fā)明還公開了編碼這類新的具有抑癌功能的人蛋白的多核苷酸的用途。
文檔編號C07H21/00GK1429840SQ0114528
公開日2003年7月16日 申請日期2001年12月30日 優(yōu)先權日2001年12月30日
發(fā)明者顧健人, 楊勝利 申請人:上海新世界基因技術開發(fā)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
浠水县| 镇平县| 观塘区| 谢通门县| 阿克陶县| 黑水县| 嵩明县| 百色市| 张家口市| 定日县| 庄河市| 铜山县| 新泰市| 庆云县| 辽中县| 嘉兴市| 潮州市| 迁西县| 乐清市| 秀山| 平远县| 铜梁县| 交口县| 宁陕县| 常山县| 新密市| 墨竹工卡县| 石城县| 梁平县| 汾西县| 彭泽县| 旌德县| 壤塘县| 淮南市| 漠河县| 陇南市| 盈江县| 梓潼县| 马尔康县| 吉林省| 东平县|