欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于在細胞表面上表達多肽的組合物和方法與流程

文檔序號:11528773閱讀:1344來源:國知局
用于在細胞表面上表達多肽的組合物和方法與流程

交叉參考

本申請要求2014年11月10日申請的美國臨時專利申請第62/077,756號的權(quán)益,所述申請案以全文引用的方式并入本文中。



背景技術(shù):

在真核細胞(例如,酵母細胞)表面上表達蛋白質(zhì),即稱為表面呈現(xiàn)的技術(shù)可以用于各種各樣的目的。舉例來說,因為酵母是真核的,所以將酵母用于表面呈現(xiàn)對(例如,經(jīng)由定向演化)改造和修飾哺乳動物蛋白來說非常適合,所述改造和修飾需要翻譯后修飾以用于有效折疊和活性(例如,細胞表面和分泌蛋白,如抗體、受體、細胞因子等)。在表面呈現(xiàn)的一個實例中,目標(biāo)蛋白與aga2p蛋白融合,在配對期間,酵母自然地使用所述aga2p蛋白調(diào)節(jié)細胞-細胞接觸。目前的表面呈現(xiàn)方法需要表達多種基因,且在所呈現(xiàn)目標(biāo)蛋白的空間可及性方面受到限制。在本領(lǐng)域中,需要以例如實現(xiàn)可調(diào)節(jié)的(“可調(diào)式”)可及性水平的方式實現(xiàn)目標(biāo)蛋白的單順反子表達和表面呈現(xiàn)的組合物和方法。

公開案

博德(boder)等人,《自然·生物技術(shù)(natbiotechnol)》.1997年6月;15(6):553-7;美國專利申請?zhí)枺?0110076752



技術(shù)實現(xiàn)要素:

提供通過使目標(biāo)蛋白(poi)與呈現(xiàn)部分(例如,具有信號多肽、莖多肽以及表面錨定多肽的部分)融合產(chǎn)生表面可及融合蛋白而在真核細胞(例如,哺乳動物細胞、真菌細胞、酵母細胞等)表面上呈現(xiàn)poi的方法和組合物。在一些情況下,將表面可及融合蛋白作為核酸的一部分(例如,重組表達載體)引入真核細胞中。提供包括對呈現(xiàn)部分(例如,具有信號多肽、莖多肽以及表面錨定多肽的部分)進行編碼的核苷酸序列的核酸。在一些情況下,本發(fā)明的核酸包括插入poi的插入位點。在一些情況下,本發(fā)明的核酸包括對poi進行編碼的核苷酸序列。在一些情況下,莖多肽是合成莖多肽,且本文中披露各種例示性合成莖多肽。在一些情況下,表面錨定多肽是糖基磷脂酰肌醇(gpi)錨定域。在一些情況下,gpi錨定域是合成gpi錨定域。在一些情況下,表面錨定多肽是跨膜域。

提供用于測量試劑與poi的結(jié)合的方法(例如,確定試劑是否可以與poi結(jié)合)。還提供用于識別與poi結(jié)合的試劑的方法(例如,篩檢與給定poi結(jié)合的試劑的測試化合物);用于識別與給定試劑結(jié)合的多肽的方法(例如,當(dāng)試劑以特定濃度存在時與試劑結(jié)合的多肽,例如識別以大于或等于預(yù)定值的親和力與試劑結(jié)合的多肽);以及用于產(chǎn)生與試劑結(jié)合的變體多肽的方法,所述變體多肽的親和力不同于(例如,大于)衍生出所述變體的多肽的親和力。

還提供包括本發(fā)明組合物的各種組分的試劑盒,且所述試劑盒可以用于實踐本發(fā)明的方法。

附圖說明

圖1a-1c.使用長度可變的gpi錨定“莖”控制肽可及性。(圖1a)肽與酵母細胞表面連接的一個實施例的示意圖:分泌目標(biāo)蛋白(poi)(此處是改造的sirpa變體cv1)作為表面可及融合蛋白,其中poi與以下融合:(i)信號多肽(其將蛋白質(zhì)引向分泌路徑,但其可以經(jīng)由翻譯后加工與蛋白質(zhì)割裂)、(ii)莖多肽(合成序列,其長度可以在廣泛長度范圍內(nèi)改變)、(iii)gpi錨定物(例如,合成gpi錨定物)以及任選地(iv)表位標(biāo)記(所示為ha表位標(biāo)記)。(圖1b)實驗結(jié)果,其顯示莖長度(以氨基酸計)與以下3種標(biāo)記探針的表面染色之間的關(guān)系:抗ha抗體(約150kd)、cd47-鏈霉親和素四聚體(約100kd)以及cd47-生物素單體(約15kda)。(圖1c)呈現(xiàn)與不同長度莖連接的cv-1的酵母的代表性流式細胞測量圖,所述不同長度莖同時染有抗ha抗體(alexa488)和cd47-生物素單體(alexa647)。測試莖序列的長度(以氨基酸的數(shù)目計)在各圖上方列出。

圖2a-2b.本發(fā)明的組合物和方法與其它酵母菌株相容。(圖2a)肽與酵母細胞表面連接的示意圖。分泌改造的sirpa變體cv1作為與ha表位標(biāo)記和長度為649個氨基酸的合成莖以及合成gpi錨定物的融合物(即,cv1是表達為表面可及融合多肽的目標(biāo)蛋白(poi))。相比于圖1a-1c中所用的bj5465,用于這些實驗的酵母菌株是yvh10。yvh10酵母過度表達酵母蛋白質(zhì)二硫鍵異構(gòu)酶(pdi),使得所分泌含有二硫鍵的蛋白質(zhì)能夠具有更大折疊能力。(圖2b)呈現(xiàn)與莖(649個氨基酸)連接的cv-1的yvh10酵母的代表性流式細胞測量圖,所述莖同時染有抗ha抗體(alexa488)和cd47-生物素單體(alexa647)。

具體實施方式

提供通過使目標(biāo)蛋白(poi)與信號多肽、莖多肽以及表面錨定多肽融合產(chǎn)生表面可及融合蛋白而在真核細胞(例如,哺乳動物細胞、真菌細胞、酵母細胞等)表面上呈現(xiàn)poi的方法和組合物。在一些情況下,將表面可及融合蛋白作為核酸的一部分(例如,重組表達載體)引入真核細胞中。提供包括對信號多肽、莖多肽以及表面錨定多肽進行編碼的核苷酸序列的核酸。在一些情況下,本發(fā)明的核酸包括和插入poi的插入位點。在一些情況下,本發(fā)明的核酸包括對poi進行編碼的核苷酸序列。在一些情況下,莖多肽是合成莖多肽,且本文中披露各種例示性合成莖多肽。在一些情況下,表面錨定多肽是糖基磷脂酰肌醇(gpi)錨定域。在一些情況下,gpi錨定域是合成gpi錨定域。

提供用于測量試劑與poi的結(jié)合的方法(例如,確定試劑是否可以與poi結(jié)合)。還提供用于識別與poi結(jié)合的試劑的方法(例如,篩檢與給定poi結(jié)合的試劑的測試化合物);用于識別與給定試劑結(jié)合的多肽的方法(例如,當(dāng)試劑以特定濃度存在時與試劑結(jié)合的多肽,例如識別以大于或等于預(yù)定值的親和力與試劑結(jié)合的多肽);以及用于產(chǎn)生與試劑結(jié)合的變體多肽的方法,所述變體多肽的親和力不同于(例如,大于)衍生出所述變體的多肽的親和力。

還提供包括本發(fā)明組合物的各種組分的試劑盒,且所述試劑盒可以用于實踐本發(fā)明的方法。

在描述本方法和組合物之前,應(yīng)理解本發(fā)明不限于所述特定方法或組合物,因此可理所當(dāng)然地發(fā)生變化。還應(yīng)理解,本文所用的術(shù)語只出于描述特定實施例的目的,而不希望具有限制性,因為本發(fā)明的范圍將僅由所附權(quán)利要求書限定。

在提供數(shù)值范圍的情況下,應(yīng)理解還專門披露所述范圍的上限與下限之間的每個中間值,直到下限單位的十分之一(除非上下文另外明確規(guī)定)。所述范圍內(nèi)的任何所述值或中間值與那個所述范圍內(nèi)的任何其它所述或中間值之間的每個更小范圍涵蓋于本發(fā)明中。這些更小范圍的上限和下限可以獨立地包括或不包括于所述范圍內(nèi),且本發(fā)明中還涵蓋其中任一限值包括于更小范圍內(nèi)、兩個限值均不包括于更小范圍內(nèi)或兩個限值均包括于更小范圍內(nèi)的每個范圍(除了所述范圍內(nèi)專門排除的任何限值之外)。在所述范圍包括限值中的一個或兩個的情況下,排除所包括的那些限值中的任一個或兩個的范圍也包括于本發(fā)明中。

除非另外定義,否則本文所用的所有技術(shù)和科學(xué)術(shù)語均具有與本發(fā)明所屬領(lǐng)域的一般技術(shù)人員通常所理解相同的含義。雖然與本文所描述的類似或等效的任何方法和材料均可以用于本發(fā)明的實踐或測試,但現(xiàn)在描述一些潛在且優(yōu)選的方法和材料。本文提及的所有公開案均以引入的方式并入本文中,以披露且描述與所列公開案相關(guān)的方法和/或材料。應(yīng)理解,在存在抵觸的范圍內(nèi),本發(fā)明取代了所并入公開案的任何披露內(nèi)容。

如所屬領(lǐng)域的技術(shù)人員在閱讀本發(fā)明后將明白,本文所描述和說明的個別實施例中的每一個均具有各別組分和特征,所述特征可以在不脫離本發(fā)明的范圍或精神的情況下輕易地與其它若干實施例中的任一個的特征分離或與其組合。任何所述方法均可以所述事件的順序或以邏輯上可能的任何其它順序來進行。

必須指出,除非上下文另外明確規(guī)定,否則如本文和所附權(quán)利要求書中所用,單數(shù)形式“一(a/an)”和“所述(the)”包括復(fù)數(shù)個提及物。因此,舉例來說,對“細胞”的提及包括多個所述細胞,且對“所述肽”的提及包括提及所屬領(lǐng)域的技術(shù)人員已知的一或多個肽和其等效物,例如多肽等。

提供本文所論述的公開案僅用于在本申請的申請日之前對其進行披露。不應(yīng)將本文中的任何內(nèi)容理解為承認本發(fā)明無權(quán)憑借先前發(fā)明而先于所述公開案。此外,所提供的公開日期可以不同于可能需要獨立確認的實際公開日期。

定義

在下文描述中,使用所屬領(lǐng)域中慣常使用的多個術(shù)語。為了清楚且連貫地理解本說明書與權(quán)利要求書和針對所述術(shù)語所給定的范圍,提供以下定義。

術(shù)語“多肽”、“肽”和“蛋白質(zhì)”在本文中可互換使用以指代氨基酸殘基的聚合物。所述術(shù)語也適用于氨基酸聚合物,其中一或多個氨基酸殘基是天然存在的相應(yīng)氨基酸的人工化學(xué)模擬物,且適用于天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。

術(shù)語“氨基酸”是指天然存在和合成的氨基酸,以及以與天然存在的氨基酸類似的方式起作用的氨基酸類似物和氨基酸模擬物。天然存在的氨基酸是由遺傳密碼編碼的氨基酸,以及后續(xù)被修飾的那些氨基酸,例如羥基脯氨酸、γ-羧基谷氨酸以及o-磷酸絲氨酸。氨基酸類似物是指基本化學(xué)結(jié)構(gòu)與天然存在的氨基酸相同(即,α碳與氫、羧基、氨基以及r基團結(jié)合)的化合物,例如高絲氨酸、正亮氨酸、蛋氨酸亞砜、蛋氨酸甲基锍。所述類似物具有被修飾的r基團(例如,正亮氨酸)或被修飾的肽主鏈,但基本化學(xué)結(jié)構(gòu)保持與天然存在的氨基酸相同。氨基酸模擬物是指結(jié)構(gòu)不同于氨基酸的一般化學(xué)結(jié)構(gòu)但以與天然存在的氨基酸類似的方式起作用的化合物。

如當(dāng)指代本發(fā)明組合物的組分(例如,合成莖多肽、合成表面錨定多肽、合成信號多肽等)時所用,術(shù)語“合成”意指非天然存在的組分。舉例來說,合成莖多肽按照定義包含非天然存在的氨基酸序列,合成表面錨定多肽按照定義包含非天然存在的氨基酸序列,且合成信號多肽按照定義包含非天然存在的氨基酸序列。

在最廣泛的意義上使用術(shù)語“抗體”且具體地說,其涵蓋單克隆抗體(包括全長單克隆抗體)、多克隆抗體、多特異性抗體(例如,雙特異性抗體)以及抗體片段(例如,fab片段),只要其展現(xiàn)所要生物活性即可。“抗體(ab)”和“免疫球蛋白(ig)”是具有相同結(jié)構(gòu)特征的糖蛋白??贵w對特定抗原展現(xiàn)結(jié)合特異性,而免疫球蛋白則包括缺乏抗原特異性的抗體和其它抗體類分子。后一種多肽例如是由淋巴系統(tǒng)在低水平上產(chǎn)生且由骨髓瘤在提高的水平上產(chǎn)生。

“天然抗體和免疫球蛋白”通常是約150,000道爾頓的雜四聚體糖蛋白,由兩條相同的輕(l)鏈和兩條相同的重(h)鏈構(gòu)成。每條輕鏈通過一個共價二硫鍵與重鏈連接,而在不同免疫球蛋白同型的重鏈之間二硫鍵的數(shù)目不同。每條重鏈和輕鏈還具有規(guī)則間隔的鏈內(nèi)二硫橋鍵。每條重鏈在一端處具有可變域(vh),接著是多個恒定域。每條輕鏈在一端處具有可變域(vl)且在其另一端處具有恒定域;輕鏈的恒定域與重鏈的第一恒定域?qū)R,且輕鏈可變域與重鏈的可變域?qū)R。人們認為是特定氨基酸殘基形成了輕鏈與重鏈可變域之間的介面(科西亞(clothia)等人,《分子生物學(xué)雜志(j.mol.biol.)》186:651(1985);諾瓦特尼(novotny)和哈伯(haber),《美國國家科學(xué)院院刊(proc.natl.acad.sci.u.s.a.)》82:4592(1985))。

術(shù)語“可變”是指如下事實:在抗體之間,可變域的某些部分在序列上廣泛不同,且用于每種特定抗體對其特定抗原的結(jié)合和特異性。然而,可變性并非均勻分布于整個抗體可變域中。其集中在三個稱為互補決定區(qū)(cdr)或高變區(qū)的區(qū)段,所述區(qū)段位于輕鏈和重鏈可變域中??勺冇虻母叨缺J夭糠址Q為框架(fr)。天然重鏈和輕鏈的可變域各自包含四個fr區(qū),其基本上采用b薄片構(gòu)型,通過三個cdr連接,形成連接b薄片結(jié)構(gòu)的環(huán),且在一些情況下形成b薄片結(jié)構(gòu)的一部分。每條鏈中的cdr均通過fr區(qū)緊鄰在一起且與來自另一鏈的cdr促成抗體的抗原結(jié)合位點的形成(參見卡巴特(kabat)等人,《具有免疫學(xué)重要性的蛋白質(zhì)序列(sequencesofproteinsofimmunologicalinterest)》,第五版,美國國立衛(wèi)生研究院(nationalinstituteofhealth),馬里蘭州貝塞斯達(bethesda,md.)(1991))。恒定域不直接參與抗體與抗原的結(jié)合,但展現(xiàn)各種效應(yīng)子功能,如抗體參與抗體依賴性細胞毒性。

抗體的消化(例如,使用如木瓜蛋白酶、無花果蛋白酶等酶)產(chǎn)生:兩個相同的抗原結(jié)合片段,稱為“fab”片段,每個片段均具有單個抗原結(jié)合位點;和殘余“fc”片段,其名稱反映其能夠輕易地結(jié)晶。胃蛋白酶處理產(chǎn)生f(ab')2片段,所述片段具有兩個抗原組合位點且仍然能夠交聯(lián)抗原。

“fv”是含有完整的抗原識別和結(jié)合位點的最小抗體片段。在雙鏈fv物質(zhì)中,這種區(qū)域是由一個重鏈可變域與一個輕鏈可變域經(jīng)由非共價緊密結(jié)合而成的二聚體組成。在單鏈fv物質(zhì)(scfv)中,一個重鏈可變域與一個輕鏈可變域可以通過柔性肽連接子共價連接,因此輕鏈和重鏈可以類似于雙鏈fv物質(zhì)的“二聚”結(jié)構(gòu)結(jié)合。在這種構(gòu)型中,每個可變域的三個cdr均相互作用以界定vh-vl二聚體表面上的抗原結(jié)合位點。六個cdr共同賦予抗體抗原結(jié)合特異性。然而,即使單個可變域(或包含僅三個對抗原具有特異性的cdr的fv的一半)也具有識別且結(jié)合抗原的能力,雖然親和力低于完整結(jié)合位點。關(guān)于scfv的綜述,參見普魯克通(pluckthun),《單克隆抗體的藥理學(xué)(thepharmacologyofmonoclonalantibodies)》,第113卷,羅森堡(rosenburg)和穆爾(moore)編,施普林格出版社(springer-verlag),紐約(newyork),第269-315頁(1994)。

fab片段還含有輕鏈的恒定域和重鏈的第一恒定域(ch1)。fab'片段與fab片段的不同之處在于,重鏈ch1域的羧基末端增加了幾個殘基,包括一或多個來自抗體鉸鏈區(qū)的半胱氨酸。fab'-sh是本文關(guān)于fab'的名稱,其中恒定域的半胱氨酸殘基具有游離硫醇基。f(ab')2抗體片段最初產(chǎn)生為在其之間具有鉸鏈半胱氨酸的fab'片段對。還已知抗體片段的其它化學(xué)偶聯(lián)。

如本文中所用,“抗體片段”和其所有語法變化形式定義為完整抗體的一部分,所述部分包含完整抗體的抗原結(jié)合位點或可變區(qū),其中所述部分不含完整抗體fc區(qū)的重鏈恒定域(即,ch2、ch3和ch4,這視抗體同型而定)??贵w片段的實例包括:fab、fab'、fab'-sh、f(ab')2以及fv片段;雙功能抗體;任何抗體片段,即主要結(jié)構(gòu)由一個不間雜的鄰接氨基酸殘基序列組成的多肽(在本文中稱為“單鏈抗體片段”或“單鏈多肽”),包括(但不限于)(1)單鏈fv(scfv)分子,(2)含有僅一個輕鏈可變域的單鏈多肽或其含有輕鏈可變域的三個cdr的片段而無相關(guān)重鏈部分,(3)含有僅一個重鏈可變區(qū)的單鏈多肽或其含有重鏈可變區(qū)的三個cdr的片段而無相關(guān)輕鏈部分,以及(4)包含來自非人類物種的單個ig域或其它特定單域結(jié)合模塊的納米抗體;和由抗體片段形成的多特異性或多價結(jié)構(gòu)。在包含一或多條重鏈的抗體片段中,重鏈可以含有完整抗體非fc區(qū)中存在的任何恒定域序列(例如,igg同型中的ch1),和/或可以含有完整抗體中存在的任何鉸鏈區(qū)序列,和/或可以含有與重鏈的鉸鏈區(qū)序列或恒定域序列融合或位于重鏈的鉸鏈區(qū)序列或恒定域序列中的亮氨酸拉鏈序列。

如在本發(fā)明中所用,術(shù)語“表位”意指抗體互補位所結(jié)合的抗原上的任何抗原決定子。表位決定子通常由根據(jù)表面化學(xué)活性分組的分子(如氨基酸或糖側(cè)鏈)組成,且通常具有特定的三維結(jié)構(gòu)特征以及特定的電荷特征。

當(dāng)在本文中使用時,術(shù)語“標(biāo)記”是指直接或間接與分子共軛的可檢測化合物或組合物。舉例來說,試劑可以稱為“可檢測標(biāo)記的”或可以稱為包括可檢測標(biāo)記。標(biāo)記本身可能是可檢測的(直接可檢測標(biāo)記)(例如,放射性同位素標(biāo)記、如熒光化學(xué)加合物的熒光標(biāo)記等),或者標(biāo)記可以是間接可檢測的,例如就酶促標(biāo)記來說,酶可以催化底物化合物或組合物的化學(xué)改變,且反應(yīng)產(chǎn)物是可檢測的。間接標(biāo)記的一個實例是生物素,其可以使用鏈霉親和素檢測。任何適宜的直接或間接標(biāo)記均可以用于本文所描述的組合物和方法。

如本文中所用,術(shù)語“重組”意指特定核酸(dna或rna)是克隆、限制、聚合酶鏈反應(yīng)(pcr)和/或接合步驟的各種組合的產(chǎn)物,所述步驟產(chǎn)生結(jié)構(gòu)編碼序列或非編碼序列可區(qū)別于天然系統(tǒng)中存在的內(nèi)源性核酸的構(gòu)筑體。對多肽進行編碼的dna序列可以由cdna片段或由一連串合成寡核苷酸拼接以提供合成核酸,所述合成核酸能夠由細胞或無細胞轉(zhuǎn)錄與翻譯系統(tǒng)中所含有的重組轉(zhuǎn)錄單元表達。包含相關(guān)序列的基因組dna也可以用于形成重組基因或轉(zhuǎn)錄單元。在距離開放閱讀框5'或3'處可以存在未翻譯的dna序列,其中所述序列不干擾編碼區(qū)的控制或表達,且實際上可以通過各種機制用于調(diào)節(jié)所要產(chǎn)物的生產(chǎn)。對未翻譯的rna進行編碼的dna序列也可以視為重組的。因此,舉例來說,術(shù)語“重組”核酸是指非天然存在的核酸,例如,是通過人類干預(yù)使兩個以其它方式分離的序列區(qū)段人工組合而制得的核酸。這種人工組合往往通過化學(xué)合成手段或通過對分離的核酸區(qū)段進行人工控制(例如,通過基因工程技術(shù))來實現(xiàn)。通常進行所述組合以用對同一氨基酸、保守氨基酸或非保守氨基酸進行編碼的密碼子代替密碼子?;蛘撸M行所述組合以將具有所要功能的核酸區(qū)段連接在一起,從而產(chǎn)生所要功能組合。這種人工組合往往通過化學(xué)合成手段或通過對分離的核酸區(qū)段進行人工控制(例如,通過基因工程技術(shù))來實現(xiàn)。當(dāng)重組核酸對多肽進行編碼時,所編碼多肽的序列可以是天然存在的(“野生型”)或可以是天然存在的序列的變體(例如,突變體)。

“載體”是另一dna區(qū)段(例如,“插入序列”)可以連接的復(fù)制子,如質(zhì)體、噬菌體、病毒或粘質(zhì)體,以使所連接的區(qū)段在細胞中復(fù)制和/或表達?!氨磉_載體”是具有表達盒的載體(例如,具有作為表達盒的插入序列)?!氨磉_盒”包括可操作地連接于啟動子的dna序列(編碼或非編碼)?!翱刹僮鞯剡B接”是指一種并接,其中如此描述的組分處于允許其按預(yù)定方式發(fā)揮作用的關(guān)系。舉例來說,如果啟動子影響核苷酸序列的轉(zhuǎn)錄(例如,核苷酸序列的表達),那么啟動子可操作地連接于核苷酸序列。因此,術(shù)語“重組表達載體”或“dna構(gòu)筑體”在本文中可互換使用以指代具有插入序列的表達載體,其中表達載體是重組的(即,包括非天然存在的序列)。重組表達載體通常出于表達和/或擴增插入序列的目的或用于構(gòu)筑其它重組核苷酸序列而產(chǎn)生。

組合物

本發(fā)明提供通過將目標(biāo)蛋白(poi)表達為表面可及融合蛋白而在細胞表面上表達poi(即,表面呈現(xiàn))的組合物和方法。術(shù)語“表面可及融合蛋白”在本文中用于描述具有信號多肽、目標(biāo)蛋白(poi)、莖多肽以及表面錨定多肽的多肽。

信號多肽

術(shù)語“信號多肽”與“信號序列”在本文中可互換使用以指代存在于或接近分泌路徑蛋白質(zhì)(例如,分泌蛋白、gpi錨定蛋白等)的n端的氨基酸序列,所述序列靶向蛋白質(zhì)以將其傳送到內(nèi)質(zhì)網(wǎng)(er)的內(nèi)腔中。如所屬領(lǐng)域中已知,信號序列在其長度和其氨基酸組成上極其可變。然而,信號序列的長度往往是約15-30個氨基酸,且通常包括5-10個疏水性氨基酸的嵌段。

分泌路徑的許多蛋白質(zhì)(例如,分泌蛋白)在翻譯(共翻譯)期間易位到er(例如,進入er內(nèi)腔)。然而,一些小分泌蛋白(如酵母配對因子α(約70個氨基酸))在翻譯后轉(zhuǎn)移到er內(nèi)腔中。來自不同蛋白質(zhì)的信號序列可以互換地起作用。在一些情況下,信號序列在加工蛋白質(zhì)期間斷裂(例如,不再存在于成熟蛋白質(zhì)上)。因此,在一些情況下,本發(fā)明的信號多肽在加工表面可及融合蛋白期間斷裂(例如,不再存在于成熟蛋白質(zhì)上,所述成熟蛋白質(zhì)呈現(xiàn)在細胞表面上)。在一些情況下,信號多肽在加工蛋白質(zhì)期間不發(fā)生斷裂(即,存在于成熟蛋白質(zhì)中)。

本發(fā)明的信號多肽可以天然存在于其受到表達的宿主細胞中,或可以是宿主細胞的異源多肽,只要其可操作以將表面可及融合蛋白轉(zhuǎn)移到分泌路徑中即可。本發(fā)明的信號多肽可以是具有良好特征的信號序列,或可以是衍生自分泌路徑的任何蛋白質(zhì)的任何信號多肽。在一些情況下,本發(fā)明的信號多肽是合成信號多肽,即序列不以天然存在的蛋白質(zhì)形式存在(相對于天然存在的蛋白質(zhì)而修飾)。

在一些實施例中,本發(fā)明的表面可及融合蛋白包括來自經(jīng)由翻譯后途徑進入er的蛋白質(zhì)(或衍生自蛋白質(zhì))的信號多肽(在本文中稱為翻譯后信號多肽)。在一些實施例中,本發(fā)明的表面可及融合蛋白包括來自經(jīng)由預(yù)翻譯途徑進入er的蛋白質(zhì)(或衍生自蛋白質(zhì))的信號多肽(在本文中稱為預(yù)翻譯信號多肽)。

所屬領(lǐng)域的一般技術(shù)人員已知適用于本發(fā)明組合物、試劑盒以及方法的許多信號序列,且可以使用任何適宜的信號多肽。舉例來說,所屬領(lǐng)域的一般技術(shù)人員將能夠輕易地識別適用于本發(fā)明組合物、試劑盒以及方法的信號多肽。可以使用在目標(biāo)宿主細胞(例如,真核細胞、哺乳動物細胞、真菌細胞、酵母細胞等)中起作用的任何適宜的信號多肽。信號序列的選擇可以考慮例如蛋白質(zhì)呈現(xiàn)在細胞(例如,酵母細胞)表面的所要含量。舉例來說,當(dāng)需要呈現(xiàn)高含量的蛋白質(zhì)時,來自α配對因子的信號序列可以適用,但在一些情況下,在細胞表面需要較少蛋白質(zhì),且在所述情況下,可以使用其它信號多肽(例如,來自pho5p、suc2p等的信號肽)。

在一些情況下,相對于表面可及融合蛋白將表達于其上的細胞類型,信號多肽是異源多肽。舉例來說,如果,將在酵母細胞中表達表面可及融合蛋白,那么信號多肽可以來自(例如,可以衍生自)除酵母細胞之外的細胞類型(例如,哺乳動物細胞、脊椎動物細胞、無脊椎動物細胞等),或來自不同種屬的酵母細胞,所述種屬不同于將在其中表達表面可及融合蛋白的種屬。

在一些情況下,信號多肽來自(例如,衍生自)將表達表面可及融合蛋白的相同細胞類型(例如,在一些情況下來自相同種屬)。舉例來說,如果將在酵母細胞中表達表面可及融合蛋白,那么信號多肽可以來自酵母蛋白(例如,在一些情況下來自相同種屬的酵母)。例示性信號多肽包括(但不限于)來自(或衍生自)以下酵母蛋白的信號多肽:配對因子α、aga2p、pho5p以及suc2p。

適合信號多肽的實例包括(但不限于)以下物質(zhì):

來自配對因子α的信號多肽:

mrfpsiftavlfaassalaapantttedetaqipaeavidysdlegdfdaaalplsnstnnglsstnttiasiaakeegvqldkrea(seqidno:11)

來自配對因子α的信號多肽(更短):

mrfpsiftavlfaassalaa(seqidno:12)

來自aga2p的信號多肽

mqllrcfsifsviasvlaq(seqidno:13)

來自pho5p的信號多肽

mfksvvysilaaslanag(seqidno:14)

來自suc2p的信號多肽

mllqaflfllagfaakisas(seqidno:15)

來自天蠶抗菌肽-a的信號多肽(來自刻克羅普斯蠶蛾/天蠶蛾(hyalophoracecropia/cecropiamoth)):

mnfsrifffvfacltalamvna(seqidno:16)

來自基因銀行(genbank)aio03624.1的信號多肽

mraflalifltfvmnvess(seqidno:17)

在一些情況下,信號多肽所包括的氨基酸序列與seqidno:11-17中任一種所闡述的氨基酸序列的氨基酸序列一致性為60%或更高(70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、98%或更高、99%或更高、99.5%或更高、99.8%或更高、99.9%或更高、或100%氨基酸序列一致性)。

如下文更詳細地描述,在一些情況下,表面錨定多肽包括tm域(例如,ii型tm域),其位置使表面可及融合蛋白為ii型膜蛋白(即,表面錨定多肽的位置將接近表面可及融合蛋白的n端而非c端)。如所屬領(lǐng)域的一般技術(shù)人員將輕易地理解,在所述情況下,表面可及融合蛋白可以包括適于ii型膜蛋白的信號多肽。

目標(biāo)蛋白

如本文中所用,術(shù)語“目標(biāo)蛋白”、“poi”或“目標(biāo)多肽”是指任何目標(biāo)氨基酸序列。在一些情況下,poi是完整蛋白質(zhì)(例如,天然存在的完整蛋白質(zhì)、完整蛋白質(zhì)的修飾形式等)。在一些情況下,poi是蛋白質(zhì)的片段,且可以是任何目標(biāo)片段。舉例來說,如果希望研究蛋白質(zhì)特定部分(例如,域、胞外域、蛋白質(zhì)結(jié)合域、酶促域、表位、無已知功能或疑似功能的蛋白質(zhì)的一部分等)的結(jié)合或功能,那么目標(biāo)特定部分可以稱為poi。衍生poi的蛋白質(zhì)可以是任何蛋白質(zhì)(例如,抗體、配位體、和受體、膜蛋白、分泌蛋白、胞內(nèi)蛋白、定位于特定細胞器的蛋白質(zhì)、胞質(zhì)蛋白、酶等)。poi可以是天然存在的序列或非天然存在的序列(例如,合成氨基酸序列、天然存在的序列的突變/修飾形式等)。

在一些情況下,在本發(fā)明的方法中使用多種poi(例如,兩種或更多種不同的poi)。在一些情況下,兩種或更多種不同poi中的至少兩種彼此相似。舉例來說,在一些情況下,本發(fā)明的方法是可以用于識別以較強或較弱親和力與特定化合物結(jié)合的變體的篩檢方法。因此,可以使用作為彼此變體(例如,通過誘變而產(chǎn)生)的多種poi。在一些情況下,兩種或更多種poi中的至少兩種在氨基酸序列中相差1到20個氨基酸(例如,1到19個氨基酸、1到18個氨基酸、1到17個氨基酸、1到16個氨基酸、1到15個氨基酸、1到14個氨基酸、1到13個氨基酸、1到12個氨基酸、1到11個氨基酸、1到10個氨基酸、1到9個氨基酸、1到8個氨基酸、1到7個氨基酸、1到6個氨基酸、1到5個氨基酸、1到4個氨基酸、1到3個氨基酸、1到2個氨基酸、或1個氨基酸)。

莖多肽

在本文中也稱為“合成莖多肽”的“莖多肽”是被設(shè)計成從細胞表面清除poi的合成序列(非天然存在的序列),且其具有惰性,因此poi與莖多肽不會相互作用。莖多肽打算提供poi與細胞表面的連接,同時允許poi在不受表面影響的情況下折疊(且在一些情況下起作用)。此外,使用合成莖多肽(例如,在一些情況下,外加合成表面錨定多肽,如合成gpi多肽)可以確保非所要重組不會在酵母基因組中出現(xiàn),所述基因組介于酵母基因組序列與對合成莖(和/或合成表面錨定多肽)進行編碼的核苷酸序列之間。

可以用于設(shè)計莖多肽的設(shè)計特征包括:氨基酸序列中的低復(fù)雜性、多肽的整體酸性特征、多肽的高親水性、多肽中缺少規(guī)定的二級或三級結(jié)構(gòu)特征、高密度的o連接的糖基化位點以及對莖多肽進行編碼的核苷酸序列中的低自身相似性。在一些情況下,將所有這些特征考慮在內(nèi),因此莖多肽的特征在于:低氨基酸序列復(fù)雜性、整體酸性特征、高親水性、缺少規(guī)定的二級或三級結(jié)構(gòu)特征、高密度的o連接的糖基化位點,且對莖多肽進行編碼的核苷酸序列的特征在于低自身相似性。在一些情況下,莖多肽包含在表達于真核細胞(例如,酵母細胞)中后很大程度上o-糖基化的氨基酸序列。在一些情況下,本發(fā)明的莖多肽(和對莖多肽進行編碼的核苷酸序列)可以考慮(即,包括)上述特征中的任一種或全部(例如,以任何組合形式)。

如上所述,在一些情況下,莖多肽包含在表達于真核細胞(例如,酵母細胞)中后很大程度上o-糖基化的氨基酸序列。在一些情況下,莖多肽(例如,合成莖多肽)在5個氨基酸跨度內(nèi)所包含的氨基酸序列具有1或更多個區(qū)(例如,2或更多個、3或更多個、4或更多個、5或更多個、6或更多個、或7或更多個區(qū)),具有2到5個o連接的糖基化位點(例如,2到4個、2到3個、3到5個、3到4個、4到5個、2、3、4或5個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)在10個氨基酸跨度內(nèi)所包含的氨基酸序列具有1或更多個區(qū)(例如,2或更多個、3或更多個、4或更多個、5或更多個、6或更多個、或7或更多個區(qū)),具有2到5個o連接的糖基化位點(例如,2到4個、2到3個、3到5個、3到4個、4到5個、2、3、4或5個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)在20個氨基酸跨度內(nèi)所包含的氨基酸序列具有1或更多個區(qū)(例如,2或更多個、3或更多個、4或更多個、5或更多個、6或更多個、或7或更多個區(qū)),具有2到5個o連接的糖基化位點(例如,2到4個、2到3個、3到5個、3到4個、4到5個、2、3、4或5個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)在50個氨基酸跨度內(nèi)所包含的氨基酸序列具有1或更多個區(qū)(例如,2或更多個、3或更多個、4或更多個、5或更多個、6或更多個、或7或更多個區(qū)),具有2到5個o連接的糖基化位點(例如,2到4個、2到3個、3到5個、3到4個、4到5個、2、3、4或5個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)在100個氨基酸跨度內(nèi)所包含的氨基酸序列具有1或更多個區(qū)(例如,2或更多個、3或更多個、4或更多個、5或更多個、6或更多個、或7或更多個區(qū)),具有2到5個o連接的糖基化位點(例如,2到4個、2到3個、3到5個、3到4個、4到5個、2、3、4或5個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)在200個氨基酸跨度內(nèi)所包含的氨基酸序列具有1或更多個區(qū)(例如,2或更多個、3或更多個、4或更多個、5或更多個、6或更多個、或7或更多個區(qū)),具有2到5個o連接的糖基化位點(例如,2到4個、2到3個、3到5個、3到4個、4到5個、2、3、4或5個o連接的糖基化位點)。

在一些情況下,莖多肽(例如,合成莖多肽)所包含的氨基酸序列具有一或多個o連接的糖基化位點(例如,2或更多個、3或更多個、4或更多個、5或更多個、6或更多個、7或更多個、8或更多個、9或更多個、或10或更多個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)所包含的氨基酸序列具有1到10個o連接的糖基化位點(例如,1到9個、1到8個、1到7個、2到10個、2到9個、2到8個、或2到7個o連接的糖基化位點)。

在一些情況下,莖多肽(例如,合成莖多肽)所包含的氨基酸序列每20個氨基酸具有1或更多個o連接的糖基化位點(例如,1.2或更多個、1.4或更多個、1.6或更多個、1.8或更多個、2或更多個、2.2或更多個、2.4或更多個、2.6或更多個、2.8或更多個、或3或更多個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)所包含的氨基酸序列每40個氨基酸具有1或更多個o連接的糖基化位點(例如,1.2或更多個、1.4或更多個、1.6或更多個、1.8或更多個、2或更多個、2.2或更多個、2.4或更多個、2.6或更多個、2.8或更多個、或3或更多個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)所包含的氨基酸序列每50個氨基酸具有1或更多個o連接的糖基化位點(例如,1.2或更多個、1.4或更多個、1.6或更多個、1.8或更多個、2或更多個、2.2或更多個、2.4或更多個、2.6或更多個、2.8或更多個、或3或更多個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)所包含的氨基酸序列每100個氨基酸具有0.5或更多個o連接的糖基化位點(例如,0.6或更多個、0.7或更多個、0.8或更多個、0.9或更多個、1或更多個、1.1或更多個、1.2或更多個、1.3或更多個、1.5或更多個、或2或更多個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)所包含的氨基酸序列每100個氨基酸具有1或更多個o連接的糖基化位點(例如,1.2或更多個、1.4或更多個、1.6或更多個、1.7或更多個、1.8或更多個、2或更多個、2.2或更多個、2.4或更多個、2.6或更多個、2.8或更多個、或3或更多個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)所包含的氨基酸序列每200個氨基酸具有0.5或更多個o連接的糖基化位點(例如,0.6或更多個、0.7或更多個、0.8或更多個、0.9或更多個、1或更多個、1.1或更多個、1.2或更多個、1.3或更多個、1.5或更多個、或2或更多個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)所包含的氨基酸序列每200個氨基酸具有1或更多個o連接的糖基化位點(例如,1.2或更多個、1.4或更多個、1.6或更多個、1.7或更多個、1.8或更多個、2或更多個、2.2或更多個、2.4或更多個、2.6或更多個、2.8或更多個、或3或更多個o連接的糖基化位點)。

莖多肽可以具有任何所要長度。舉例來說,在一些情況下,莖多肽包含長度在10到2000個氨基酸范圍內(nèi)的多肽序列(例如,20到2000個氨基酸、50到2000個氨基酸、20到1500個氨基酸、50到1500個氨基酸、20到1000個氨基酸、50到1000個氨基酸、20到800個氨基酸、50到800個氨基酸、100到2000個氨基酸、100到1500個氨基酸、100到1000個氨基酸、100到800個氨基酸、10到100個氨基酸、20到100個氨基酸、40個氨基酸到100個氨基酸、101到200個氨基酸、201到300個氨基酸、301到400個氨基酸、401到500個氨基酸、501到600個氨基酸、601到700個氨基酸、701到800個氨基酸、801到900個氨基酸、901到1000個氨基酸、1001到1500個氨基酸、或1501到2000個氨基酸)。在一些情況下,莖多肽包含長度為10或更多個氨基酸的多肽序列(例如,20或更多個、30或更多個、40或更多個、50或更多個、60或更多個、70或更多個、80或更多個、90或更多個、100或更多個、125或更多個、150或更多個、200或更多個、250或更多個、300或更多個、350或更多個、400或更多個、450或更多個、或500或更多個氨基酸)。

在一些情況下,莖多肽的長度可以用于使表面可及融合蛋白接近具有限定分子量的試劑。舉例來說,如果莖多肽較短(例如,100個氨基酸或更少),那么較大試劑則因為空間位阻而無法接近表面可及融合蛋白的poi。因此,可以“調(diào)節(jié)”莖多肽的長度來與所要試劑相匹配。舉例來說,如果將要篩檢化合物庫來與給定poi結(jié)合,但又僅關(guān)注低于一定分子量(閾值分子量)的化合物,那么則可以選擇一定長度的莖多肽以向高于所述閾值分子量的化合物提供空間位阻。換句話說,可以通過選擇適當(dāng)長度的莖多肽以將針對給定poi的空間可及性“調(diào)節(jié)”到所要分子量截斷值。莖多肽的長度越大,空間位阻越小,且可及性越大(即,當(dāng)莖多肽的長度增加,可以用于與表面可及融合蛋白的poi結(jié)合的試劑的尺寸也增加)。關(guān)于說明性實例,參見下文工作實例(圖1a-1c和圖2a-2b)。

適合莖多肽包括(但不限于)此處提供的實例:

s19(19個氨基酸)(seqidno:31)

ggggsggggsgstgggggs

s41(41個氨基酸)(seqidno:32)

qtsspsreasvstsstsssasqssdptttssstvstpatga

s232(232個氨基酸)(seqidno:33)

qtsspsteasvstsstsssasqssdptttsssssssspssqseeisssptvsttpstssssssmtsttttksiststtssapvtdvtvssspskststststetsktptsmteytsstsiistpvshsqtglsassssssttsgssstksessttsgssqsvestsshatvlansaemvttsssssstsemsltstatsvpvsssssttystsastqavtttssstvsttss

s465(465個氨基酸)(seqidno:34

qtsspsteasvstsstsssasqssdptttsssssssspssqseeisssptvsttpstssssssmtsttttksiststtssapvtdvtvssspskststststetsktptsmteytsstsiistpvshsqtglsassssssttsgssstksessttsgssqsvestsshatvlansaemvttsssssstsemsltstatsvpvsssssttystsastqavtttssstvsttsssttltsafthssttssdqppsdttspstthephvttqtssetssskssstsssstsqtsesatpsdsvspgsststsssstststsissgetttssssssatttsnsatlsvsttqtsieasssttstssstittssssahissksqssitypssstssstsssissesesfestsaedapstapsssvssksststtsststssstpspspssvsssstsslttsavstpat

s649(649個氨基酸)(seqidno:35)

qtsspsteasvstsstsssasqssdptttsssssssspssqseeisssptvsttpstssssssmtsttttksiststtssapvtdvtvssspskststststetsktptsmteytsstsiistpvshsqtglsassssssttsgssstksessttsgssqsvestsshatvlansaemvttsssssstsemsltstatsvpvsssssttystsastqavtttssstvsttsssttltsafthssttssdqppsdttspstthephvttqtssetssskssstsssstsqtsesatpsdsvspgsststsssstststsissgetttssssssatttsnsatlsvsttqtsieasssttstssstittssssahissksqssitypssstssstsssissesesfestsaedapstapsssvssksststtsststssstpspspssvsssstsslttsavstpatshsqstvvttttittstgpvmstttaysssstsssessevqsvmsstpsststttssestsssstastspstsqtfetsptiggvpsttsfvstpttklshttstmtaqsdsksthssststedksstasavdestttststesttsvtsgtshsakesssnskvyssqtahssisvasspstk

在一些情況下,本發(fā)明合成莖多肽所包括的氨基酸序列與seqidno:31-35中任一種(例如,32-35、33-35、34-35)所闡述的氨基酸序列的氨基酸序列一致性為60%或更高(70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、98%或更高、99%或更高、99.5%或更高、99.8%或更高、99.9%或更高、或100%氨基酸序列一致性)。在一些情況下,本發(fā)明合成莖多肽所包括的氨基酸序列與seqidno:32-35中任一種所闡述的氨基酸序列的氨基酸序列一致性為60%或更高(70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、98%或更高、99%或更高、99.5%或更高、99.8%或更高、99.9%或更高、或100%氨基酸序列一致性)。在一些情況下,本發(fā)明合成莖多肽所包括的氨基酸序列與seqidno:33-35中任一種所闡述的氨基酸序列的氨基酸序列一致性為60%或更高(70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、98%或更高、99%或更高、99.5%或更高、99.8%或更高、99.9%或更高、或100%氨基酸序列一致性)。

表面錨定多肽

表面可及融合蛋白的本發(fā)明表面錨定多肽將融合蛋白錨定在細胞表面。在一些情況下,表面錨定多肽是(或衍生自)糖基磷脂酰肌醇(gpi)錨定域。各種細胞表面蛋白(包括酶、外殼蛋白、表面抗原以及粘附分子)經(jīng)由gpi錨定物與質(zhì)膜連接(布里科夫(burikofer)等人.2002《美國實驗生物科學(xué)家聯(lián)合會雜志(fasebj)》15:545)。gpi是翻譯后添加的脂質(zhì)錨定物;因此,與具有不同跨膜域且與特定細胞質(zhì)延伸部分連接的常規(guī)多肽錨定物不同,gpi錨定物使用常見脂質(zhì)結(jié)構(gòu)來與膜連接,所述結(jié)構(gòu)無關(guān)于與其連接的蛋白質(zhì)(英格倫(englund)等人,阿努爾(annul)修訂.《生物化學(xué)(biochem)》.62:121(1993))。

合成gpi錨定蛋白作為前體,其在n端或接近n端處具有可斷裂的疏水性信號序列,所述序列使蛋白質(zhì)靶向內(nèi)質(zhì)網(wǎng)(er)的內(nèi)腔,且在c端或接近c端處具有引導(dǎo)gpi錨定的可斷裂的信號序列(gpi錨定域)。在將gpi錨定物添加到具有g(shù)pi錨定域的蛋白質(zhì)時,gpi錨定域的全部或一部分從蛋白質(zhì)上斷裂開,且gpi錨定物與蛋白質(zhì)連接。gpi錨定域包括通過親水性間隔區(qū)與gpi連接位點(ω位點)分離的疏水性區(qū)域。

已在整個廣泛范圍的真核生物物種(從人類到昆蟲、酵母、細菌以及真菌)內(nèi)識別gpi錨定蛋白。已識別許多蛋白質(zhì)的gpi錨定域(例如,參見凱爾斯(cares)等人,《科學(xué)(science)》243:1196(1989))。已成功地將gpi錨定信號改造到其它蛋白質(zhì)的c端上,并且將這些gpi錨定蛋白質(zhì)覆蓋在細胞表面上且其具有功能性。(安德森(anderson)等人,p.n.a.s.93:5894(1996);不倫瑞克(brunschwig)等人,《免疫治療期刊(j.immunother)》.22:390(1999))。

適合gpi錨定域的實例包括(但不限于)以下參考文獻中所披露的gpi錨定域:杜林,t.l.(doering,t.l.)等人.(1990)《生物化學(xué)雜志(j.biol.chem.)》265:611-614;麥康維爾,m.j.(mcconville,m.j.)等人.(1993)《生物化學(xué)雜志(biochem.j.)》294:305-324;以及pct公開案wo2003017944;所有文獻均以全文引用的方式并入本文中。

任何適宜的gpi錨定域均可以用作表面錨定多肽。適用于本發(fā)明方法和組合物的gpi表面錨定多肽(例如,釀酒酵母(s.cerevisiae)蛋白中存在的gpi序列)的實例包括(但不限于):

iqqnftstslmistyegkasiffsaelgsiiflllsyllf(seqidno:51)

ekstnssssatsknagaamdmgffsagvgaaiagaaamll(seqidno:52)

sllksaasatsssqssskskgaagiieiplifralaelynlvl(seqidno:53)

ssgasssssksskgnaaimapigqttplvglltaiimsim(seqidno:54)

aqanvsasassssssskkskgaapelvpatsfmgvvaavgvall(seqidno:55)

gpgekarknnaapgpsnfnsiklfgvtagsaavagallll(seqidno:56)

sstgmlsptsssstrkengghnlnppffarfitaifhhi(seqidno:57)

ssfsssggssesttkkqnagykyrssfsfsllsfisyfll(seqidno:58)

ykstvngkvasvmsnstngatagthiaygagafavgalll(seqidno:59)

sgnlttstasatstsskrnvgdhivpslpltlisllfafi(seqidno:60)

gkngaksqgsskkmensapknifidafkmsvyavftvlfsiif(seqidno:61)

tgsssasssskskgvgnivnvsfsqsgylalfaglisall(seqidno:62)

asgssthkknagnalvnysnlntntfigvlsvisavfgli(seqidno:63)

edadedkddlkrkhrnsasisgpllplglcllfftfslff(seqidno:64)

gpi表面錨定多肽可以來自(例如,衍生自)以下蛋白質(zhì),其包括(但不限于):配對型蛋白凝集素-a-1(aga1)、凝結(jié)蛋白(例如,flo1)、sed1、cwp1、cwp2、tip1、tir1/srp1、ccw14、cis3、cwp1、pir1以及pir3。在一些情況下,本發(fā)明表面錨定多肽所包含的氨基序列與seqidno:51-64中任一種所闡述的氨基酸序列的氨基酸序列一致性為60%或更高(60%或更高、70%或更高、80%或更高、90%或更高、92%或更高、95%或更高、或100%氨基酸序列一致性)。在一些情況下,本發(fā)明表面錨定多肽所包含的氨基序列與seqidno:51中所闡述的氨基酸序列的氨基酸序列一致性為60%或更高(60%或更高、70%或更高、80%或更高、90%或更高、92%或更高、95%或更高、或100%氨基酸序列一致性)。

在一些情況下,表面錨定多肽是異源的(例如,相對于將在其中表達表面可及融合蛋白的宿主細胞,來自不同種屬或來自不同有機體的gpi錨定域)。使用異源表面錨定多肽(例如,在一些情況下,外加合成莖多肽)可以降低非所要重組將在酵母基因組中出現(xiàn)的概率,所述基因組介于酵母基因組序列與對異源表面錨定多肽(和/或合成莖多肽)進行編碼的核苷酸序列之間。

在一些情況下,表面錨定多肽是合成多肽(即,包含非天然存在的氨基酸序列的表面錨定多肽)。使用合成表面錨定多肽(例如,合成gpi錨定域)(在一些情況下,外加合成莖多肽)可以降低非所要重組將在酵母基因組中出現(xiàn)的概率,所述基因組介于酵母基因組序列與對合成表面錨定多肽(和/或合成莖多肽)進行編碼的核苷酸序列之間。

適合合成(例如,雜交)gpi表面錨定多肽的實例是:qiqssmveistyagsansvnagagagalflllslaii(seqidno:71)。

在一些情況下,本發(fā)明表面錨定多肽(例如,gpi錨定域)所包含的氨基序列與seqidno:51-64和71中任一種所闡述的氨基酸序列(gpi錨定域氨基酸序列)的氨基酸序列一致性為60%或更高(60%或更高、70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、92%或更高、95%或更高、或100%氨基酸序列一致性)。在一些情況下,本發(fā)明合成表面錨定多肽所包含的氨基序列與seqidno:71中所闡述的氨基酸序列的氨基酸序列一致性為60%或更高(60%或更高、70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、92%或更高、95%或更高、或100%氨基酸序列一致性)。在一些情況下,本發(fā)明的合成表面錨定多肽包含seqidno:71中所闡述的氨基酸序列。

因此,在一些情況下,表面可及融合蛋白包括gpi錨定域作為表面錨定多肽。因此,gpi錨定域可以位于信號多肽和莖多肽的c端。在所述情況下,poi將位于莖多肽的n端和信號多肽的c端(例如,介于信號多肽與莖多肽之間)。因此,在一些情況下(例如,當(dāng)表面可及融合蛋白包括gpi錨定域作為表面錨定多肽時),從n端到c端,表面可及融合蛋白的組分包括信號多肽、poi、莖多肽(例如,合成莖多肽)以及表面錨定多肽(例如,gpi錨定域)。因此,在一些情況下,呈現(xiàn)部分(如下文所論述)和/或表面可及融合蛋白包括gpi錨定域作為表面錨定多肽。在一些情況下,表面可及融合蛋白還可以包括一或多個標(biāo)記,如下文更加詳細地論述。

在一些實施例中,表面錨定多肽包含插入細胞質(zhì)膜中的跨膜(tm)域(例如,跨膜螺旋)。

在一些情況下,表面可及融合蛋白是i型膜蛋白(例如,具有i型tm域作為表面錨定多肽)。因此,tm域可以位于信號多肽和莖多肽的c端。在所述情況下,poi將位于莖多肽的n端和信號多肽的c端(例如,介于信號多肽與莖多肽之間)。換句話說,在所述情況下,tm域的位置將接近表面可及融合蛋白的c端,且poi和莖多肽都將位于tm域的n端。因此,在一些情況下(例如,當(dāng)表面可及融合蛋白是i型膜蛋白且包括tm域作為表面錨定多肽時),從n端到c端,表面可及融合蛋白的組分包括信號多肽、poi、莖多肽(例如,合成莖多肽)以及表面錨定多肽(例如,tm域、i型tm域)。因此,在一些情況下,呈現(xiàn)部分(如下文所論述)和/或表面可及融合蛋白包括i型tm域作為表面錨定多肽。在一些情況下,表面可及融合蛋白還可以包括一或多個標(biāo)記,如下文更加詳細地論述。

在一些情況下,表面可及融合蛋白是ii型膜蛋白(例如,具有ii型tm域作為表面錨定多肽)。因此,tm域可以位于信號多肽的c端和莖多肽的n端。在所述情況下,poi將位于莖多肽的c端。換句話說,在所述情況下,tm域的位置將接近表面可及融合蛋白的n端,且莖多肽和poi都將位于tm域的c端。因此,在一些情況下(例如,當(dāng)表面可及融合蛋白是ii型膜蛋白且包括tm域作為表面錨定多肽時),從n端到c端,表面可及融合蛋白的組分包括信號多肽、表面錨定多肽(例如,tm域、ii型tm域)、莖多肽(例如,合成莖多肽)以及poi。因此,在一些情況下,呈現(xiàn)部分(如下文所論述)和/或表面可及融合蛋白包括ii型tm域作為表面錨定多肽。在一些情況下,表面可及融合蛋白還可以包括一或多個標(biāo)記,如下文更加詳細地論述。

標(biāo)記

在一些情況下,本發(fā)明的表面可及融合蛋白包括標(biāo)記。如本文中所用,術(shù)語“標(biāo)記”是包含可(直接和/或間接)檢測且提供輕易追蹤和/或純化的氨基酸序列的多肽。所屬領(lǐng)域的一般技術(shù)人員將已知適合標(biāo)記的實例,且可以使用任何適宜的標(biāo)記。適合標(biāo)記的實例包括(但不限于)可直接檢測的標(biāo)記(例如,熒光多肽,如綠色熒光蛋白(gfp)、yfp、rfp、cfp、mcherry、tdtomato等);和親和力標(biāo)記(例如,組氨酸標(biāo)記,如6xhis標(biāo)記;血球凝集素(ha)標(biāo)記;flag標(biāo)記;myc標(biāo)記等)。在一些情況下,表面可及融合蛋白包括多于一個標(biāo)記。因此,在一些情況下,本發(fā)明的表面可及融合蛋白包括一或多個標(biāo)記(2或更多個、3或更多個、或4或更多個標(biāo)記,或1、2、3或4個標(biāo)記)。

標(biāo)記可以位于表面可及融合蛋白內(nèi)的任何位置。舉例來說,標(biāo)記可以位于:(i)信號多肽的c端和poi的n端;和/或(ii)poi的c端和合成莖多肽的n端。在表面可及融合蛋白具有多于一個標(biāo)記的情況下,標(biāo)記可以位于poi的任一端(例如,一或多個標(biāo)記位于信號多肽的c端和poi的n端,且一或多個標(biāo)記位于poi的c端和合成莖多肽的n端)。在一些情況下,標(biāo)記依次定位(即,彼此緊接)。

表面可及融合蛋白

本發(fā)明的表面可及融合蛋白是包括多種組分的單一蛋白質(zhì)(例如,由多肽組分構(gòu)成的蛋白質(zhì),所述多肽組分是模塊化的且通過肽鍵連接在一起,以使其構(gòu)成單一蛋白質(zhì))。本發(fā)明表面可及融合蛋白的各種組分(例如,信號多肽、poi、標(biāo)記、莖多肽、表面錨定多肽)可以直接相繼連接(無介入氨基酸),或者可以由連接子氨基酸(例如,任何數(shù)目的連接子氨基酸)隔開。舉例來說,在一些情況下,不存在將本發(fā)明表面可及融合蛋白的兩種給定組分隔開的氨基酸。在一些情況下,存在一或多個將本發(fā)明表面可及融合蛋白的兩種給定組分隔開的氨基酸(例如,2或更多個、3或更多個、4或更多個、5或更多個、6或更多個、7或更多個、8或更多個、9或更多個、10或更多個、15或更多個、20或更多個、25或更多個、30或更多個、或40或更多個氨基酸)。在一些情況下,存在20或更少個將本發(fā)明表面可及融合蛋白的兩種給定組分隔開的氨基酸(例如,15或更少個、10或更少個、9或更少個、8或更少個、7或更少個、6或更少個、5或更少個、4或更少個、3或更少個、或2或更少個氨基酸)。

在一些情況下,本發(fā)明的表面可及融合蛋白由信號多肽、poi、莖多肽以及表面錨定多肽組成。在一些情況下,本發(fā)明的表面可及融合物由信號多肽、poi、莖多肽、表面錨定多肽以及一或多個標(biāo)記組成。在一些情況下,本發(fā)明的表面可及融合蛋白基本上由信號多肽、poi、莖多肽以及表面錨定多肽組成。在一些情況下,本發(fā)明的表面可及融合物基本上由信號多肽、poi、莖多肽、表面錨定多肽以及一或多個標(biāo)記組成。

適合表面可及融合蛋白的兩個說明性實例描述于下文中。在所述兩個實例中,cv1是待呈現(xiàn)的poi。前述改造的蛋白質(zhì)以高親和力與cd47結(jié)合。在以下兩個實例中,cv1在酵母細胞上呈現(xiàn)為表面可及融合蛋白,其系栓于莖(649個氨基酸)和兩個不同gpi錨定物中的一個上:

“cv1pyds649hm”

信號序列:配對因子α前導(dǎo)子(氨基酸1-87)(seqidno:11)

目標(biāo)蛋白:cv1(氨基酸90-208)(seqidno:7)

ha表位標(biāo)記(氨基酸211-219)(seqidno:8)

莖:含649個氨基酸的莖(氨基酸220-868)(seqidno:35)

表面錨定物:雜交gpi錨定域(氨基酸871-907)(seqidno:71)

mrfpsiftavlfaassalaapantttedetaqipaeavidysdlegdfdaaalplsnstnnglsstnttiasiaakeegvqldkreasaeeelqiiqpdksvlvaagetatlrctitslfpvgpiqwfrgagpgrvliynqrqgpfprvttvsdttkrnnmdfsirignitpadagtyycikfrkgspddvefksgagtelsvrakpsgsypydvpdyaqtsspsteasvstsstsssasqssdptttsssssssspssqseeisssptvsttpstssssssmtsttttksiststtssapvtdvtvssspskststststetsktptsmteytsstsiistpvshsqtglsassssssttsgssstksessttsgssqsvestsshatvlansaemvttsssssstsemsltstatsvpvsssssttystsastqavtttssstvsttsssttltsafthssttssdqppsdttspstthephvttqtssetssskssstsssstsqtsesatpsdsvspgsststsssstststsissgetttssssssatttsnsatlsvsttqtsieasssttstssstittssssahissksqssitypssstssstsssissesesfestsaedapstapsssvssksststtsststssstpspspssvsssstsslttsavstpatshsqstvvttttittstgpvmstttaysssstsssessevqsvmsstpsststttssestsssstastspstsqtfetsptiggvpsttsfvstpttklshttstmtaqsdsksthssststedksstasavdestttststesttsvtsgtshsakesssnskvyssqtahssisvasspstkgaqiqssmveistyagsansvnagagagalflllslaii(seqidno:9)

“cv1pyds649αm”

信號序列:配對因子α前導(dǎo)子(氨基酸1-87)(seqidno:11)

目標(biāo)蛋白:cv1(氨基酸90-208)(seqidno:7)

ha表位標(biāo)記(氨基酸211-219)(seqidno:8)

莖:含649個氨基酸的莖(氨基酸220-868)(seqidno:35)

表面錨定物:agg1pgpi錨定域:(氨基酸871-910)(seqidno:51)

mrfpsiftavlfaassalaapantttedetaqipaeavidysdlegdfdaaalplsnstnnglsstnttiasiaakeegvqldkreasaeeelqiiqpdksvlvaagetatlrctitslfpvgpiqwfrgagpgrvliynqrqgpfprvttvsdttkrnnmdfsirignitpadagtyycikfrkgspddvefksgagtelsvrakpsgsypydvpdyaqtsspsteasvstsstsssasqssdptttsssssssspssqseeisssptvsttpstssssssmtsttttksiststtssapvtdvtvssspskststststetsktptsmteytsstsiistpvshsqtglsassssssttsgssstksessttsgssqsvestsshatvlansaemvttsssssstsemsltstatsvpvsssssttystsastqavtttssstvsttsssttltsafthssttssdqppsdttspstthephvttqtssetssskssstsssstsqtsesatpsdsvspgsststsssstststsissgetttssssssatttsnsatlsvsttqtsieasssttstssstittssssahissksqssitypssstssstsssissesesfestsaedapstapsssvssksststtsststssstpspspssvsssstsslttsavstpatshsqstvvttttittstgpvmstttaysssstsssessevqsvmsstpsststttssestsssstastspstsqtfetsptiggvpsttsfvstpttklshttstmtaqsdsksthssststedksstasavdestttststesttsvtsgtshsakesssnskvyssqtahssisvasspstkgaiqqnftstslmistyegkasiffsaelgsiiflllsyllf(seqidno:10)

核酸

本發(fā)明的方面包括:用于表達表面可及融合蛋白的核酸、對表面可及融合蛋白進行編碼的核酸以及使用所述核酸的方法(例如,用以在細胞表面上表達表面可及融合蛋白、用于篩檢與表面可及融合蛋白結(jié)合的化合物、用于篩檢與目標(biāo)化合物結(jié)合的多肽等)。在一些情況下,本發(fā)明的核酸是重組表達載體(例如,用于表達本發(fā)明的表面可及融合蛋白)。

在一些情況下,用于表達表面可及融合蛋白的本發(fā)明核酸不包括對目標(biāo)蛋白(poi)進行編碼的核苷酸序列。舉例來說,核酸可以是包括poi的前體(例如,介于對信號多肽和莖多肽進行編碼的核苷酸序列之間)。舉例來說,核酸可以包括對信號多肽、莖多肽以及表面錨定多肽(且在一些情況下,對標(biāo)記)進行編碼的核苷酸序列,上述所有均可操作地連接于相同啟動子,其中啟動子在目標(biāo)真核宿主細胞(例如,真核細胞、哺乳動物細胞、真菌細胞、酵母細胞、釀酒酵母細胞等)中具有功能性,但核酸可能不包括對poi進行編碼的核苷酸。在一些情況下,所述核酸是重組表達載體。

在一些情況下,核酸(例如,重組表達載體)包括插入poi的插入位點。舉例來說,插入對poi進行編碼的核苷酸的插入位點可以存在于對以下進行編碼的核苷酸之間:信號多肽與莖多肽(信號:莖接合點)、信號多肽與標(biāo)記(信號:標(biāo)記接合點)、標(biāo)記與莖多肽(標(biāo)記:莖接合點)和/或第一標(biāo)記與第二標(biāo)記(標(biāo)記:標(biāo)記接合點)。在一些情況下,插入對poi進行編碼的核苷酸的插入位點與對莖多肽進行編碼的核苷酸相鄰定位。

所屬領(lǐng)域的一般技術(shù)人員已知用于各種技術(shù)的插入位點,且可以使用任何適宜的插入位點。換句話說,插入位點可以用于任何控制核酸序列的方法。舉例來說,在一些情況下,插入位點可以是多克隆位點(例如,包括一或多個限制酶位點的位點)、用于接合獨立克隆的位點、用于基于重組的克隆的位點(例如,基于att位點的重組)、由基于crispr(例如,cas9)的技術(shù)所識別的核苷酸序列等。在一些情況下,插入位點可以由對本發(fā)明表面可及融合蛋白的一種組分進行編碼的核苷酸與對本發(fā)明表面可及融合蛋白的另一種組分進行編碼的核苷酸的接合點來限定(例如,信號:莖接合點、標(biāo)記:莖接合點和/或標(biāo)記:標(biāo)記接合點),因此不存在介入核苷酸。插入位點可以具有任何所要長度,且不必與3'組分(例如,對莖多肽和表面錨定多肽進行編碼的核苷酸)同框,因為插入位點打算受到修飾(例如,在一些情況下被替換)以包括對目標(biāo)蛋白進行編碼的核苷酸序列。所屬領(lǐng)域的一般技術(shù)人員將了解,在插入位點插入對poi進行編碼的核苷酸后,其需要與上游序列(例如,對信號多肽進行編碼的序列)和下游序列(例如,對莖多肽和表面錨定多肽進行編碼的序列)同框。

因此,在一些情況下,(用于在細胞表面上表達目標(biāo)多肽的)本發(fā)明核酸包括對呈現(xiàn)部分進行編碼的核苷酸序列。如本文所用,“呈現(xiàn)部分”是指除poi之外,本發(fā)明表面可及融合蛋白的組分的組合。舉例來說,呈現(xiàn)部分可以包括信號多肽、莖多肽(例如,合成莖多肽)以及表面錨定多肽(未必按所述順序)。在一些情況下,按從n端到c端的順序,呈現(xiàn)部分包括信號多肽、莖多肽(例如,合成莖多肽)以及表面錨定多肽(例如,gpi錨定域、i型tm域等)。在一些情況下,按從n端到c端的順序,呈現(xiàn)部分包括信號多肽、表面錨定多肽(例如,ii型tm域、來自ii型膜蛋白的tm域等)以及莖多肽(例如,合成莖多肽)。當(dāng)本發(fā)明的核酸不包括poi時(例如,當(dāng)核酸包括poi的插入位點時、當(dāng)核酸打算用于插入對poi進行編碼的核苷酸序列時等),在插入對po進行編碼的核苷酸序列之前,對呈現(xiàn)部分的組分進行編碼的核苷酸不必彼此同框。舉例來說,其可以在插入對poi進行編碼的核苷酸序列之后彼此同框,因此所編碼的表面可及融合蛋白包括呈現(xiàn)部分的組分(即,信號多肽、莖多肽以及表面錨定多肽;其順序可以視上述表面錨定多肽的性質(zhì)而變化)。在所述情況下,核酸仍然可以稱為包括對呈現(xiàn)部分進行編碼的核苷酸序列。

在一些情況下,本發(fā)明的呈現(xiàn)部分包括信號多肽、莖多肽以及表面錨定多肽。在一些情況下,本發(fā)明的呈現(xiàn)部分包括信號多肽、莖多肽、表面錨定多肽以及一或多個標(biāo)記。在一些情況下,本發(fā)明的呈現(xiàn)部分由信號多肽、莖多肽以及表面錨定多肽組成。在一些情況下,本發(fā)明的呈現(xiàn)部分由信號多肽、莖多肽、表面錨定多肽以及一或多個標(biāo)記組成。在一些情況下,本發(fā)明的呈現(xiàn)部分基本上由信號多肽、莖多肽以及表面錨定多肽組成。在一些情況下,本發(fā)明的呈現(xiàn)部分基本上由信號多肽、莖多肽、表面錨定多肽以及一或多個標(biāo)記組成。

舉例來說,在一些情況下,(用于在細胞表面上表達目標(biāo)多肽的)本發(fā)明核酸包括對以下進行編碼的核苷酸序列:(i)對信號多肽進行編碼的第一核苷酸序列;(ii)對合成莖多肽進行編碼的第二核苷酸序列;以及(iii)對表面錨定多肽進行編碼的第三核苷酸序列。在一些情況下,(i)、(ii)以及(iii)沿5'到3'方向相對于彼此定位并且可操作地連接于相同啟動子,其中啟動子在宿主細胞(例如,真核細胞、脊椎動物細胞、無脊椎動物細胞、哺乳動物細胞、真菌細胞、酵母細胞等)中具有功能性。在一些所述情況下,核酸包括插入對目標(biāo)蛋白(poi)進行編碼的核苷酸序列的(上述)插入位點,其中插入位點位于(i)的3'處和(ii)的5'處。在一些情況下,核酸還包括對標(biāo)記進行編碼的核苷酸序列(例如,其位置使其與對其它組分[(i)、(ii)以及(iii)]進行編碼的核苷酸序列中的至少一種同框)。

在一些情況下(例如,當(dāng)本發(fā)明的核酸包括對呈現(xiàn)部分進行編碼的核苷酸序列時),上文(i)、(ii)以及(iii)沿5'到3'方向相對于彼此定位,其順序為:(i)、(iii)以及(ii)(例如,當(dāng)表面錨定多肽是tm域且表面可及融合蛋白將為ii型膜蛋白時),且可操作地連接于相同啟動子,其中啟動子在宿主細胞(例如,真核細胞、脊椎動物細胞、無脊椎動物細胞、哺乳動物細胞、真菌細胞、酵母細胞等)中具有功能性。在一些所述情況下,核酸包括插入對目標(biāo)蛋白(poi)進行編碼的核苷酸序列的(上述)插入位點,其中插入位點位于(ii)的3'處。在一些情況下,核酸還包括對標(biāo)記進行編碼的核苷酸序列(例如,其位置使其與對其它組分[(i)、(ii)以及(iii)]進行編碼的核苷酸序列中的至少一種同框)。

對表面可及融合蛋白進行編碼的核酸包括對表面可及融合蛋白(具有信號多肽、目標(biāo)蛋白(poi)、莖多肽以及表面錨定多肽的融合蛋白)(且在一些情況下,具有標(biāo)記)進行編碼的核苷酸序列。在一些情況下,對表面可及融合蛋白進行編碼的核苷酸序列可操作地連接于啟動子,所述啟動子在目標(biāo)真核宿主細胞(例如,真核細胞、哺乳動物細胞、真菌細胞、酵母細胞、釀酒酵母細胞等)中具有功能性。

因此,在一些情況下,(例如,對表面可及融合蛋白進行編碼的)本發(fā)明核酸包括:(i)對信號多肽進行編碼的第一核苷酸序列;(ii)對目標(biāo)蛋白(poi)進行編碼的第二核苷酸序列;(iii)對合成莖多肽進行編碼的第三核苷酸序列;以及(iv)對表面錨定多肽進行編碼的第四核苷酸序列。在一些所述情況下,(i)、(ii)、(iii)以及(iv)從5'到3'按[(i)、(ii)、(iii)以及(iv)]的順序定位,且彼此同框以使其共同對包括信號多肽、poi、莖多肽以及表面錨定多肽(例如,在一些情況下,按所述順序)的表面可及融合蛋白進行編碼。在一些情況下,所編碼的表面可及融合蛋白還包括標(biāo)記,因此核酸包括對所述標(biāo)記進行編碼的核苷酸序列。在一些情況下,對表面可及融合蛋白進行編碼的核苷酸序列可操作地連接于啟動子,所述啟動子在目標(biāo)真核宿主細胞(例如,真核細胞、哺乳動物細胞、真菌細胞、酵母細胞、釀酒酵母細胞等)中具有功能性。

在一些情況下,(例如,對表面可及融合蛋白進行編碼的)本發(fā)明核酸包括:(i)對信號多肽進行編碼的第一核苷酸序列;(ii)對表面錨定多肽(例如,當(dāng)表面可及融合蛋白是ii型膜蛋白時,其為tm域)進行編碼的第二核苷酸序列;(iii)對合成莖多肽進行編碼的第三核苷酸序列;以及(iv)對目標(biāo)蛋白(poi)進行編碼的第四核苷酸序列。在一些所述情況下,(i)、(ii)、(iii)以及(iv)從5'到3'按[(i)、(ii)、(iii)以及(iv)]的順序定位,且彼此同框以使其共同對包括信號多肽、表面錨定多肽、莖多肽以及poi(例如,在一些情況下,按所述順序)的表面可及融合蛋白進行編碼。在一些情況下,所編碼的表面可及融合蛋白還包括標(biāo)記,因此核酸包括對所述標(biāo)記進行編碼的核苷酸序列。在一些情況下,對表面可及融合蛋白進行編碼的核苷酸序列可操作地連接于啟動子,所述啟動子在目標(biāo)真核宿主細胞(例如,真核細胞、哺乳動物細胞、真菌細胞、酵母細胞、釀酒酵母細胞等)中具有功能性。

如本文所用,“啟動子序列”或“啟動子”是能夠結(jié)合rna聚合酶且引發(fā)下游(3'方向)編碼或非編碼序列的轉(zhuǎn)錄的dna調(diào)節(jié)區(qū)。出于本發(fā)明的目的,啟動子序列由轉(zhuǎn)錄引發(fā)位點在其3'端處定界,且向上游(5'方向)延伸,以包括以在背景上可檢測的水平引發(fā)轉(zhuǎn)錄所必需的至少最小數(shù)目的堿基或要素。啟動子序列內(nèi)將存在引起rna聚合酶結(jié)合的蛋白質(zhì)結(jié)合域。真核啟動子往往(而非始終)將含有“tata”框和“cat”框。包括誘導(dǎo)型啟動子的各種啟動子可以用于驅(qū)動本發(fā)明的各種載體。啟動子可以是構(gòu)成性活性啟動子(即,在構(gòu)成上處于活性/”啟用”狀態(tài)的啟動子)。啟動子可以是誘導(dǎo)型啟動子(即,狀態(tài)為活性/”啟用”或非活性/“停用”的啟動子由外部刺激控制,例如存在特定溫度、化合物或蛋白質(zhì))。

可以使用任何適宜的啟動子,且所屬領(lǐng)域的一般技術(shù)人員可輕易地獲得許多啟動子。應(yīng)了解,啟動子必須在表達表面可及融合蛋白的細胞(例如,真核細胞、真菌細胞、酵母細胞、脊椎動物細胞、哺乳動物細胞、無脊椎動物細胞等)中具有功能性。適用于酵母表達載體的啟動子的實例包括(但不限于):aox1啟動子、半乳糖誘導(dǎo)型啟動子(例如,pgal1、pgal1-10、pgal4、pgal10等)、磷酸甘油酸激酶(ppgk)啟動子、細胞色素c(pcyc1)啟動子、醇脫氫酶i(padh1)啟動子等。

其它例示性啟動子包括(但不限于):sv40早期啟動子、鼠標(biāo)乳腺腫瘤病毒長末端重復(fù)(ltr)啟動子;腺病毒主要晚期啟動子(admlp);單純性皰疹病毒(hsv)啟動子、巨細胞病毒(cmv)啟動子(如cmv即刻早期啟動子區(qū)域(cmvie))、勞斯氏肉瘤病毒(roussarcomavirus,rsv)啟動子、人類u6小核啟動子(u6)(宮岸(miyagishi)等人,《自然·生物技術(shù)(naturebiotechnology)》20,497-500(2002))、增強型u6啟動子(例如,夏(xia)等人,《核酸研究(nucleicacidsres.)》2003年9月1日;31(17))、人類h1啟動子(h1)等。

誘導(dǎo)型啟動子的實例包括(但不限于):t7rna聚合酶啟動子、t3rna聚合酶啟動子、異丙基-β-d-硫代吡喃半乳糖苷(iptg)調(diào)節(jié)型啟動子、乳糖誘導(dǎo)型啟動子、熱休克啟動子、四環(huán)素調(diào)節(jié)型啟動子、類固醇調(diào)節(jié)型啟動子、金屬調(diào)節(jié)型啟動子、雌激素受體調(diào)節(jié)型啟動子等。因此,誘導(dǎo)型啟動子可以由包括(但不限于)以下的分子調(diào)節(jié):多西環(huán)素(doxycycline);rna聚合酶,例如t7rna聚合酶;雌激素受體;雌激素受體融合物等。

上述核酸中的任一種均可以是重組表達載體(其可以包括用于表達本發(fā)明表面可及融合蛋白的任何適宜的啟動子,包括(但不限于)上述啟動子中的任一種)。在一些實施例中,本發(fā)明的重組表達載體在宿主細胞中是可操作的,以直接表達且呈現(xiàn)表面可及融合蛋白。在一些實施例中,本發(fā)明的重組表達載體在酵母細胞中是可操作的,以引導(dǎo)表面可及融合蛋白的表達和呈現(xiàn)。

各種重組表達載體是所屬領(lǐng)域中所已知的且可購得,其滿足酵母中重組基因表達的各種要求。大部分酵母載體是穿梭載體,其含有允許對其進行選擇且在細菌(例如,大腸桿菌(e.coli))中擴增的序列,因此允許適宜的擴增和隨后的活體外變異。許多常見酵母穿梭載體來源于pbr322。其含有在大腸桿菌中促進保持高拷貝數(shù)的復(fù)制起點(例如,cole1復(fù)制起點)和可選擇性抗生素標(biāo)記物(例如,β-內(nèi)酰胺酶基因、四環(huán)素抗性基因,其分別賦予針對安比西林(ampicillin)和四環(huán)素的抗性)。特定酵母穿梭載體包括(但不限于)美國專利第5,866,404號和第6,897,353號中所描述的酵母穿梭載體。適用于實踐本文所描述方法(例如(但不限于)在如巴斯德畢赤酵母(pichiapastoris)(即,巴斯德畢赤酵母宿主細胞)的種屬中表達本發(fā)明的表面可及融合蛋白)的其它酵母載體描述于美國專利第5,707,828號、第6,730,499號、美國專利公開案第20060270041號以及pct公開案第wo2005040395號和第wo200231178號中。

酵母載體可以含有標(biāo)記物基因,所述標(biāo)記物基因允許選擇含有所要質(zhì)體的轉(zhuǎn)化子。最常使用的酵母標(biāo)記物基因的實例包括(但不限于)ura3、his3、leu2、trp1以及l(fā)ys2,其與宿主細胞中的特定營養(yǎng)缺陷型突變體互補。因為ura3和lys2酵母標(biāo)記物基因允許使用正選擇和負選擇方案,所以其具有額外優(yōu)點。也可以使用向酵母宿主細胞賦予顯性抗藥表現(xiàn)型的可選標(biāo)記物基因,如分別賦予對潮霉素b和諾爾絲菌素的抗性的hph和nat基因(參見佐藤(sato)等人,《酵母(yeast)》22:583-591(2005))。大部分當(dāng)前使用的酵母穿梭載體屬于以下三種廣泛類別中的一種:(i)整合型載體、(ii)自主復(fù)制的高拷貝數(shù)載體或(iii)自主復(fù)制的低拷貝數(shù)載體。

許多適合的表達載體是所屬領(lǐng)域的技術(shù)人員所已知的,且許多表達載體是市售的。通過舉例提供以下載體;針對真核宿主細胞:pxt1、psg5(斯塔津(stratagene))、psvk3、pbpv、pmsg以及psvlsv40(法瑪西亞(pharmacia))。然而,可以使用任何其它載體,只要其與宿主細胞相容即可。

在一些實施例中,重組表達載體是病毒構(gòu)筑體,例如,重組腺相關(guān)病毒構(gòu)筑體(參見例如,美國專利第7,078,387號)、重組腺病毒構(gòu)筑體、重組慢病毒構(gòu)筑體、重組逆轉(zhuǎn)錄病毒構(gòu)筑體等。適合表達載體包括(但不限于):病毒載體(例如,基于以下的病毒載體:牛痘病毒;脊髓灰質(zhì)炎病毒;腺病毒(參見例如,李(li)等人,《眼科研究與視力學(xué)(investopthalmolvissci)》35:25432549,1994;波納斯(borras)等人,《基因療法(genether)》6:515524,1999;李(li)和戴維森(davidson),《美國國家科學(xué)院院刊(pnas)》92:77007704,1995;坂本(sakamoto)等人,《人類基因療法(hgenether)》5:10881097,1999;wo94/12649、wo93/03769;wo93/19191;wo94/28938;wo95/11984以及wo95/00655);腺相關(guān)病毒(參見例如,阿里(ali)等人,《人類基因療法(humgenether)》9:8186,1998;弗蘭納里(flannery)等人,《美國國家科學(xué)院院刊》94:69166921,1997;班尼特(bennett)等人,《眼科研究與視力學(xué)》38:28572863,1997;久瑪麗(jomary)等人,《基因療法》4:683690,1997;羅玲(rolling)等人,《人類基因療法》10:641648,1999;阿里等人,《人類分子遺傳學(xué)(hummolgenet)》5:591594,1996;斯瑞瓦斯特娃(srivastava),wo93/09239;薩姆斯基(samulski)等人,《病毒學(xué)雜志(j.vir.)》(1989)63:3822-3828;蒙德爾森(mendelson)等人,《病毒學(xué)(virol.)》(1988)166:154-165;以及弗洛狄(flotte)等人,《美國國家科學(xué)院院刊》(1993)90:10613-10617);sv40;單純性皰疹病毒;人類免疫缺陷病毒(參見例如,三好(miyoshi)等人,《美國國家科學(xué)院院刊》94:1031923,1997;高橋(takahashi)等人,《病毒學(xué)雜志(jvirol)》73:78127816,1999);逆轉(zhuǎn)錄病毒載體(例如,鼠類白血病病毒、脾壞死病毒,以及衍生自逆轉(zhuǎn)錄病毒的載體,如勞斯氏肉瘤病毒(roussarcomavirus)、哈維肉瘤病毒(harveysarcomavirus)、禽白血病病毒、慢病毒、人類免疫缺陷病毒、骨髓增生性肉瘤病毒以及乳腺腫瘤病毒)等。

視所用的宿主/載體系統(tǒng)而定,表達載體中可使用多種適合轉(zhuǎn)錄與翻譯控制要素(包括構(gòu)成性和誘導(dǎo)型啟動子、轉(zhuǎn)錄增強子要素、轉(zhuǎn)錄終止子等)中的任一種(參見例如,比特(bitter)等人(1987)《酶學(xué)方法(methodsinenzymology)》,153:516-544)。

在一些情況下,對本發(fā)明表面可及融合蛋白的組分進行編碼的核苷酸操作地連接到轉(zhuǎn)錄終止序列(例如,以促進適當(dāng)?shù)膍rna加工)。因此,在一些情況下,本發(fā)明的重組表達載體包括終止序列。轉(zhuǎn)錄終止要素(終止序列)的實例包括(但不限于)若干酵母基因的終止序列,如cyc1、adh1、aro4、trp1、act1以及ypt1。可以使用任何適宜的終止序列。

具有對本發(fā)明表面可及融合蛋白進行編碼的核苷酸序列的本發(fā)明dna核酸的一個說明性實例是seqidno:6中所闡述的8584核苷酸(nt)載體。在此實例中,信號多肽是由核苷酸856-1113(seqidno:1)編碼的配對因子α前導(dǎo)子;目標(biāo)蛋白(poi)是由核苷酸1123-1479(seqidno:2)編碼的cv1;合成莖多肽(649個氨基酸)由核苷酸1513-3459(seqidno:4)編碼;并且表面錨定多肽是由核苷酸3466-3576(seqidno:5)編碼的合成雜交gpi序列。此例示性核酸還具有對ha表位標(biāo)記進行編碼的核苷酸(核苷酸1486-1512)(seqidno:3)。

宿主細胞

本發(fā)明的方面包括:包括上述表面可及融合蛋白和/或核酸(例如,用于表達表面可及融合蛋白的核酸和/或?qū)Ρ砻婵杉叭诤系鞍走M行編碼的核酸)的細胞(即,宿主細胞)。術(shù)語“宿主細胞”在本文中用于指代本發(fā)明的表面可及融合蛋白將在其中表達并呈現(xiàn)的細胞;或指代核酸在其中擴增的細胞。宿主細胞可以用于表達來自本發(fā)明核酸(如重組表達載體(例如,真核宿主細胞))的本發(fā)明表面可及融合蛋白,和/或使本發(fā)明的重組表達載體(例如,真核宿主細胞或原核宿主細胞)增殖。

在一些情況下,本發(fā)明的宿主細胞是原核細胞。舉例來說,在一些情況下,出于增殖和/或純化重組表達載體的目的,(具有對表面可及融合蛋白進行編碼的核苷酸的)本發(fā)明重組表達載體處于原核細胞的內(nèi)部。因此,在一些情況下,原核細胞(例如,細菌細胞,如大腸桿菌細胞)包括上述核酸(例如,重組表達載體)。

在一些情況下,適合的宿主細胞是單細胞真核有機體的細胞、真菌細胞、酵母細胞、動物細胞、無脊椎動物(例如,果蠅、刺胞動物、棘皮動物、線蟲等)細胞、脊椎動物(例如,魚、兩棲動物、爬行動物、鳥、哺乳動物)細胞、哺乳動物(例如,豬、奶牛、山羊、綿羊、嚙齒動物、大鼠、小鼠、非人類靈長類動物、人類等)細胞等。

在一些情況下,適合的宿主細胞是真菌細胞。任何真菌細胞(例如,任何適宜的真菌種屬)均為適合的。在一些情況下,適合的宿主細胞是酵母細胞??梢允褂萌魏芜m宜的酵母細胞種屬。適合酵母種屬(即,適合酵母細胞的種屬)的說明性實例包括(但不限于):釀酒酵母(saccharomycescerevisiae)、粟酒裂殖酵母(schizosaccharomycespombe)、啤酒酵母(saccharomycesuvaruium)、巴斯德畢赤酵母(合成巴斯德駒形氏酵母(komagataellapastoris))、多形漢遜酵母(hansenulapolymorpha)(合成擬多形緒方氏酵母(ogataeaparapolymorpha))、解脂耶羅威亞酵母(yarrowialipolytica)、樹干畢赤酵母(pichiastipitis)(合成木糖發(fā)酵酵母(scheffersomycesstipitis))、馬克斯克魯維酵母(kluyveromycesmarxianus)、嗜鞣管囊酵母(pachysolentannophilus)、博伊丁假絲酵母(candidaboidinii)、白假絲酵母(candidaalbicans)以及索諾拉沙漠假絲酵母(candidasorenensi)。

引入核酸(例如,重組表達載體)的適合方法(也稱為“轉(zhuǎn)化”和/或“轉(zhuǎn)染”)包括(例如):病毒感染、轉(zhuǎn)染、脂質(zhì)體轉(zhuǎn)染、核轉(zhuǎn)染、電穿孔、磷酸鈣沉淀、聚乙烯亞胺(pei)介導(dǎo)轉(zhuǎn)染、deae葡聚糖介導(dǎo)轉(zhuǎn)染、脂質(zhì)體介導(dǎo)轉(zhuǎn)染、粒子槍技術(shù)、磷酸鈣沉淀、直接顯微注射、納米粒子介導(dǎo)核酸傳送(參見例如,帕尼亞姆(panyam)等人《先進藥物傳遞評論(advdrugdelivrev.)》2012年9月13日.pii:s0169-409x(12)00283-9.doi:10.1016/j.addr.2012.09.023)等??梢允褂萌魏芜m宜的方法。

對引入核酸方法的選擇通常視轉(zhuǎn)化的細胞類型和發(fā)生轉(zhuǎn)化的環(huán)境而定。舉例來說,當(dāng)轉(zhuǎn)化真菌細胞(如酵母)時,可以使用如使用乙酸鋰、單股載體dna、和/或peg(在一些情況下,伴隨熱休克)的方案。所屬領(lǐng)域的一般技術(shù)人員將能夠輕易地確定將本發(fā)明的核酸引入所要宿主細胞中的適當(dāng)方案。各種轉(zhuǎn)化方法的一般論述可以在奧斯貝(ausubel)等人,《精編分子生物學(xué)實驗指南(shortprotocolsinmolecularbiology)》,第3版,威利父子(wiley&sons),1995中找到。

舉例來說,使細胞與包含本發(fā)明核酸的病毒粒子接觸以用于病毒載體傳送。逆轉(zhuǎn)錄病毒(例如,慢病毒)尤其適合。常用的逆轉(zhuǎn)錄病毒載體是“有缺陷的”,即無法產(chǎn)生增殖性感染所需的病毒蛋白。相反,載體的復(fù)制需要包裝細胞系中的生長。為了產(chǎn)生包含目標(biāo)核酸的病毒粒子,通過包裝細胞系將包含所述核酸的逆轉(zhuǎn)錄病毒核酸包裝到病毒衣殼中。不同包裝細胞系提供并入衣殼中的不同包膜蛋白(單嗜性、雙嗜性或異嗜性),這種包膜蛋白決定病毒粒子針對細胞的特異性(對鼠類和大鼠具有單嗜性;對大部分哺乳動物(包括人類、狗和小鼠)細胞類型具有雙嗜性;并且對大部分哺乳動物細胞類型(除了鼠類細胞之外)具有異嗜性。適當(dāng)包裝細胞系可以用于確保包裝的病毒粒子靶向細胞。將具有目標(biāo)核酸的逆轉(zhuǎn)錄病毒載體引入包裝細胞系中的方法和收集由包裝系產(chǎn)生的病毒粒子的方法是所屬領(lǐng)域中已知的。

方法

本發(fā)明的方面包括使用上述表面可及融合蛋白和核酸的方法。所提供的方法用于:(i)在真核細胞中表達目標(biāo)蛋白(poi)(例如,在真核細胞表面上呈現(xiàn)poi);(ii)測量試劑與poi的結(jié)合(例如,在一些情況下,確定試劑是否可以與poi結(jié)合);(iii)識別與poi結(jié)合的試劑(化合物)(例如,篩檢與poi結(jié)合的試劑的測試化合物);(iv)識別與試劑結(jié)合的多肽(例如,當(dāng)試劑以特定濃度存在時與試劑結(jié)合的多肽,例如識別以大于或等于預(yù)定值的親和力與試劑結(jié)合的多肽);(v)產(chǎn)生與試劑結(jié)合的變體多肽,所述變體多肽的親和力不同于(例如,大于)衍生出所述變體的多肽的親和力等。

(i)表達方法

在一些實施例中,本發(fā)明的方法是在真核細胞中表達目標(biāo)蛋白(poi)(例如,在真核細胞表面上呈現(xiàn)poi)的方法。所述方法包括:將包括poi的本發(fā)明表面可及融合蛋白引入細胞(例如,任何所要宿主細胞)中。舉例來說,所述方法可以包括:將具有對表面可及融合蛋白進行編碼的核苷酸序列的核酸引入真核細胞(例如,上述宿主細胞,如真菌細胞、酵母細胞、哺乳動物細胞等)中,其中表面可及融合蛋白包括信號多肽、poi、莖多肽以及表面錨定多肽(且在一些情況下,包括標(biāo)記)。包括poi的表面可及融合蛋白可以通過以下方式引入細胞中:(i)直接作為蛋白質(zhì)(例如,在一些情況下,使用蛋白質(zhì)轉(zhuǎn)導(dǎo)域);(ii)作為對蛋白質(zhì)進行編碼的rna;(iii)或作為對蛋白質(zhì)進行編碼的dna。在一些情況下(例如,當(dāng)表面可及融合蛋白作為dna引入細胞中時),對表面可及融合蛋白進行編碼的核苷酸可操作地連接于可在細胞中操作的啟動子。

在一些情況下,在真核細胞中表達目標(biāo)蛋白(poi)(例如,在真核細胞表面上呈現(xiàn)poi)的方法進一步包括下文所述方法步驟的任何組合。

(ii)測量結(jié)合的方法

在一些實施例中,本發(fā)明的方法是測量試劑與poi的結(jié)合(例如,在一些情況下,確定試劑是否可以與poi結(jié)合)的方法。測量試劑與poi的結(jié)合的方法可以包括在真核細胞(例如,任何目標(biāo)真核宿主細胞,如哺乳動物細胞、真菌細胞、酵母細胞等)表面上呈現(xiàn)poi(例如,參見上文“表達方法”)。

測量試劑與poi的結(jié)合的方法包括使真核細胞(通過在細胞表面上將poi呈現(xiàn)為表面可及融合蛋白來表達poi的細胞)與試劑接觸。試劑(在本文中也稱為“測試化合物”)可以是任何能與poi結(jié)合的試劑。舉例來說,適合試劑包括任何化學(xué)實體、藥劑、藥物、肽、抗體、抗體結(jié)合片段、小分子化合物,包括可以測試(例如,篩檢)其與一或多個poi的潛在結(jié)合的已知和潛在的治療化合物。舉例來說,在一些情況下,poi包括抗體的抗原結(jié)合域,且試劑(例如,測試試劑)是肽(在一些情況下是已知與抗體結(jié)合的肽變體)。在一些情況下,poi是針對抗體的表位(或已知表位的變體),且試劑是抗體或抗體的抗原結(jié)合域。在一些情況下,poi是配位體/受體對的配位體或受體結(jié)合區(qū)(或其變體)。

在一些情況下,試劑包括可檢測標(biāo)記(例如,可以直接或間接地檢測試劑)。在一些情況下,直接標(biāo)記試劑(例如,試劑可以包括可直接檢測的加合物,如熒光加合物)。在一些情況下,間接標(biāo)記試劑(例如,試劑可以包括可間接檢測的加合物,如生物素)。

在一些情況下,測量與poi結(jié)合(即,與表面可及融合蛋白結(jié)合)的試劑量可以通過(例如,如下所述定量地或定性地)測量與表達表面可及融合蛋白的細胞結(jié)合的試劑量來實現(xiàn)。

如本文中所用,“測量量”可以提供定性或定量結(jié)果,且因此,如本文中所用的短語涵蓋定量以及定性測量值。舉例來說,在一些情況下,當(dāng)定性地測量量時,測量與poi結(jié)合的試劑量包括確定試劑是否與poi結(jié)合(例如,是否與表達包括poi的表面可及融合蛋白的細胞結(jié)合;在方案結(jié)束時是否存在等)。在一些情況下,測量與poi結(jié)合的試劑量包括確定試劑與poi的結(jié)合是否超過特定結(jié)合閾值。因此,在一些情況下,測量量的步驟包括確定試劑是否與poi結(jié)合的步驟(例如,與表面可及融合蛋白結(jié)合,與表達表面可及融合蛋白的細胞結(jié)合等)。在一些情況下,對量進行測量為是否存在試劑提供了單純的“是”或“否”測定結(jié)果。

同樣地,在一些實施例中,測量量包括確定與表面可及融合蛋白結(jié)合的試劑量的定量測定值(例如,使用流式細胞測量術(shù)、elisa或任何其它可以定量地測量給定方案結(jié)束時所存在的(例如,最終洗滌步驟后所存在的)試劑量的方法。所結(jié)合試劑的量(含量)可以表示為與特定檢定相關(guān)的任意單位(例如,螢光單位,如平均熒光強度(mfi)),或者可以表示為具有規(guī)定單位的絕對值(例如,分子的數(shù)目(例如,mol)、蛋白質(zhì)分子的數(shù)目、試劑的濃度等)。此外,可以比較定量測量的量(含量)與參考值的量,以導(dǎo)出表示標(biāo)準化測量量的標(biāo)準化值。因此,測量量的步驟可以是以定性方式(“存在”與“不存在”;“是,超過預(yù)定閾值”與“否,不超過預(yù)定閾值”;等)或以定量方式進行檢測。

如流式細胞測量術(shù)和elisa的技術(shù)可以用于定性和定量測量步驟。舉例來說,兩種技術(shù)均可以用于(例如,以熒光單位,如平均熒光強度(mfi))測定所存在試劑的定量的量,還可以用于單純地確定存在量是否超過特定閾值。

(iii)識別試劑的方法

在一些實施例中,本發(fā)明的方法是識別與poi結(jié)合的試劑(化合物)(例如,篩檢與poi結(jié)合的試劑的測試化合物)的方法。識別與poi結(jié)合的試劑的方法包括:在真核細胞(例如,任何目標(biāo)真核宿主細胞,如哺乳動物細胞、真菌細胞、酵母細胞等)表面上呈現(xiàn)poi,使細胞與試劑接觸,以及(定量地和/或定性地)測量與細胞結(jié)合的試劑量。

在一些情況下,給定表面可及融合蛋白可以呈現(xiàn)于兩種或更多種細胞的表面上(例如,呈現(xiàn)于兩種或更多種單獨種群細胞的細胞表面上),且每種細胞(例如,每一單獨種群的細胞)均與不同試劑接觸。因此,可以篩檢兩種或更多種試劑(例如,試劑庫)以識別哪些(如果存在的話)試劑會與將poi表達為表面可及融合蛋白的細胞結(jié)合。

如上所述,在一些情況下,poi包括抗體的抗原結(jié)合域,且試劑(例如,測試試劑)是肽(在一些情況下是已知與抗體結(jié)合的肽變體);在一些情況下,poi是針對抗體的表位(或已知表位的變體),且試劑是抗體或抗體的抗原結(jié)合域;并且在一些情況下,poi是配位體/受體對的配位體或受體結(jié)合區(qū)(或其變體)。在一些所述情況下,方法可以包括誘變步驟(例如,使用任何適宜的方法,如隨機或定點pcr方案)。舉例來說,可以產(chǎn)生兩種或更多種測試試劑(例如,測試試劑庫)(例如,作為彼此變體的兩種或更多種試劑),且試劑可以用于接觸表達本發(fā)明表面可及融合蛋白的細胞,且可以識別與細胞結(jié)合的那些試劑。

在一些情況下,可以控制試劑的濃度,因此將僅識別出那些以特定(或更佳)親和力結(jié)合的試劑。在一些情況下,可以使用不同濃度的給定試劑來接觸每種細胞(例如,單獨種群的細胞)。因此,所述方法可以用于確定在不同的試劑濃度下,試劑與給定poi的結(jié)合是否得以維持(其例如可以用于估測試劑針對poi的親和力)。舉例來說,可以在10nm、100nm以及1000nm下使用試劑來接觸三種不同的細胞種群,每一細胞種群均表達相同的表面可及融合蛋白??梢栽诿糠N濃度下確定試劑是否結(jié)合,且可以估測結(jié)合親和力。舉例來說,相比于在1000nm下結(jié)合但在100nm或10nm下不結(jié)合的試劑,可以說在全部三種濃度下均結(jié)合的試劑以更高親和力與給定poi結(jié)合。

在一些情況下,表達表面可及融合蛋白的細胞可以在同一時間(同時)與兩種或更多種試劑接觸,其中試劑彼此有區(qū)別(例如,其中每種試劑具有不同的可檢測標(biāo)記)。作為說明性實例,給定細胞或給定種群的細胞可以與10種不同的試劑接觸,其中每種試劑包括不同的可檢測標(biāo)記(例如,不同的熒光標(biāo)記)。在適當(dāng)洗滌后,可以(定量地和/或定性地)測量每種可檢測標(biāo)記的量。舉例來說,可以使用所述方法來匯集多種不同的試劑,以從不與表面可及融合蛋白結(jié)合的試劑中識別與表面可及融合蛋白結(jié)合的試劑。

(iv)識別多肽的方法

在一些實施例中,本發(fā)明的方法是識別與試劑結(jié)合的多肽(例如,當(dāng)試劑以特定濃度存在時與試劑結(jié)合的多肽,例如識別以大于或等于預(yù)定值的親和力與試劑結(jié)合的多肽)的方法。識別與試劑結(jié)合的多肽的方法包括在真核細胞(例如,任何目標(biāo)真核宿主細胞,如哺乳動物細胞、真菌細胞、酵母細胞等)表面上呈現(xiàn)poi。所述方法可以與上文用于識別試劑的方法相同,而這時所使用的可以保持不變(或以特定濃度使用),但試劑用于接觸以下兩種或更多種細胞,其中兩種或更多種細胞中的至少兩種表達(正在呈現(xiàn))呈不同表面可及融合蛋白形式的不同poi??梢?定性地或定量地)測量試劑與每種細胞(或每一種群的細胞)的結(jié)合,且可以由此確定兩種或更多種poi中的哪些可以與給定試劑結(jié)合(或與給定濃度的給定試劑結(jié)合)。

(v)產(chǎn)生變體多肽的方法

在一些實施例中,本發(fā)明的方法是產(chǎn)生與試劑結(jié)合的變體多肽的方法,所述變體多肽的親和力不同于(例如,大于)衍生出所述變體的多肽的親和力。所述方法包括產(chǎn)生一或多種變體多肽的步驟(例如,使用任何適宜的方法來產(chǎn)生變體,如基于pcr的誘變)。舉例來說,除了將在表面可及融合蛋白的poi部分相差一或多個氨基酸之外,變體多肽將與初始表面可及融合蛋白相同。隨后,測量試劑與所產(chǎn)生變體中的一或多個的結(jié)合量將用于識別哪些變體會與試劑結(jié)合。

如上所述,在一些情況下,poi包括抗體的抗原結(jié)合域,且試劑(例如,測試試劑)是肽(在一些情況下是已知與抗體結(jié)合的肽變體);在一些情況下,poi是針對抗體的表位(或已知表位的變體),且試劑是抗體或抗體的抗原結(jié)合域;并且在一些情況下,poi是配位體/受體對的配位體或受體結(jié)合區(qū)(或其變體)。在一些所述情況下,方法可以包括誘變步驟(例如,使用任何適宜的方法,如隨機或定點pcr方案)。舉例來說,可以產(chǎn)生兩種或更多種poi(兩種或更多種表面可及融合蛋白)(例如,從而產(chǎn)生表面可及融合蛋白庫)(例如,其中poi是彼此的變體和/或初始poi的變體)。隨后,試劑可以用于接觸表達兩種或更多種表面可及融合蛋白(變體)的細胞(例如,不同種群的細胞),且隨后可以識別與試劑結(jié)合的那些poi。

與上文類似,在一些情況下,可以控制試劑的濃度,因此將僅識別出那些以特定(或更佳)親和力與試劑結(jié)合的poi。在一些情況下,可以使用不同濃度的給定試劑來接觸每種細胞(例如,單獨種群的細胞、細胞庫的多種復(fù)本等)。因此,所述方法可以用于僅識別當(dāng)試劑以給定濃度存在時可以與給定試劑結(jié)合的那些poi。作為說明性實例,可以(經(jīng)由表達表面可及融合蛋白的接觸細胞)使兩種或更多種不同的poi與給定濃度(例如,100nm)的試劑接觸,且可以識別大量與試劑結(jié)合的poi。隨后,可以使用較低濃度的試劑(例如,10nm)重新篩檢poi,以限制所識別poi的數(shù)目。

針對上文方法中的任一種或全部,可以使用各種對照。舉例來說,具有對照poi(或無poi)的表面可及融合蛋白可以用于向在不存在結(jié)合的情況下所預(yù)期的信號量提供對照。所屬領(lǐng)域的一般技術(shù)人員將輕易地設(shè)想所述各種對照,且可以使用任何適宜的對照。

試劑盒

還提供所述方法中使用的試劑盒。本發(fā)明的試劑盒可以包括上述表面可及融合蛋白和/或核酸中的任一種。舉例來說,在一些情況下,適合的試劑盒包括上述用于表達表面可及融合蛋白的核酸(例如,重組表達載體),或?qū)Ρ砻婵杉叭诤系鞍走M行編碼的核酸(例如,重組表達載體)。在一些情況下,試劑盒包括兩種或更多種dna核酸(例如,重組表達載體)。

在一些情況下,試劑盒包括用于表達表面可及融合蛋白的兩種或更多種本發(fā)明的dna核酸(例如,重組表達載體)。試劑盒可以包括:包括對poi進行編碼的核苷酸的核酸、不包括對poi進行編碼的核苷酸的核酸、包括插入對poi進行編碼的核苷酸的插入位點的核酸等。在一些情況下,兩種或更多種dna核酸中的至少兩種包括插入poi的插入位點。

在一些情況下,由兩種或更多種dna核酸中的至少兩種編碼的合成莖多肽具有不同長度。舉例來說,在一些情況下,由兩種或更多種dna核酸中的至少兩種編碼的莖多肽(例如,合成莖多肽)具有介于以下范圍內(nèi)的長度:20到100個氨基酸、40個氨基酸到100個氨基酸、101到200個氨基酸、201到300個氨基酸、301到400個氨基酸、401到500個氨基酸、501到600個氨基酸、601到700個氨基酸、701到800個氨基酸、801到900個氨基酸、901到1000個氨基酸、或1001到1500個氨基酸。在一些情況下,由兩種或更多種dna核酸中的至少兩種編碼的合成莖多肽具有不同長度,且各具有介于以下范圍內(nèi)的長度:20到100個氨基酸、40個氨基酸到100個氨基酸、101到200個氨基酸、201到300個氨基酸、301到400個氨基酸、401到500個氨基酸、501到600個氨基酸、601到700個氨基酸、701到800個氨基酸、801到900個氨基酸、901到1000個氨基酸、或1001到1500個氨基酸。因此,在一些情況下,試劑盒可以包括多種dna核酸(例如,用于表達本發(fā)明的表面可及融合蛋白),其中由多種dna核酸編碼的莖多肽涵蓋一定長度范圍。

在一些情況下,由兩種或更多種dna核酸中的至少兩種編碼的合成莖多肽具有不同序列(例如,即使其長度相同)。

作為說明性實例,試劑盒的一種核酸(例如,重組表達)可能對長度介于20到100個氨基酸范圍內(nèi)的莖多肽進行編碼,且另一種可能對長度介于101到200個氨基酸范圍內(nèi)的莖多肽進行編碼。換句話說,試劑盒可以具有對多種不同莖多肽(例如,長度和/或序列不同)進行編碼的多種核酸(例如,重組表達載體)。所述試劑盒將允許使用多種不同的表面可及融合蛋白來進行本發(fā)明的方法,即使在一些情況下不同融合蛋白的poi相同。同樣地,在一些情況下,兩種或更多種dna核酸中的至少兩種對以下進行編碼:不同信號多肽、不同標(biāo)記(和/或標(biāo)記的不同布置,即對標(biāo)記進行編碼的核苷酸相對于另一編碼組分的不同定位)和/或不同表面錨定多肽(例如,不同gpi錨定物)。在一些情況下,兩種或更多種dna核酸中的至少兩種具有不同的插入位點。設(shè)想上文的任何或所有組合。

上述試劑盒中的任一種可以進一步包括一或多種額外試劑,其中所述額外試劑可以選自:稀釋緩沖液;復(fù)原溶液;洗滌緩沖液;對照試劑;對照表達載體;試劑;具有本發(fā)明核酸的宿主細胞;不具有本發(fā)明核酸的宿主細胞(例如,用于表達表面可及融合蛋白的核酸、對表面可及融合蛋白進行編碼的核酸等)等。本發(fā)明試劑盒的組分可以處于單獨容器中(例如,不同試管、多孔板的不同孔等),且在一些情況下可以組合于單一容器中。

除了上文組分之外,(在某些實施例中)本發(fā)明的試劑盒還可以進一步包括用于實踐本發(fā)明方法的說明。這些說明可以各種形式存在于本發(fā)明的試劑盒中,所述形式中的一或多種可以存在于試劑盒中??梢猿尸F(xiàn)這些說明的一種形式為適合媒介或基板(例如,上面印刷有信息的紙片)上的印刷信息,其處于試劑盒的包裝中,處于藥品說明書中等。這些說明的另一形式為上面已記錄有信息的計算機可讀媒介,例如磁盤、光盤(cd)、閃存驅(qū)動器等??梢猿尸F(xiàn)這些說明到另一形式為網(wǎng)址,可以經(jīng)由因特網(wǎng)使用所述網(wǎng)址在刪除的網(wǎng)站上獲得信息。

效用

本文所描述的組合物和方法可以用于研發(fā)新型真菌細胞(例如,新型酵母菌株)以用于各種目的,包括(但不限于)化學(xué)品和多肽的發(fā)酵生產(chǎn)。此外,本文所描述的組合物和方法可以用于各種研究目的,包括在酵母上表達誘變的蛋白質(zhì)或其它組合庫。相比于其它方法,本文所描述的組合物和方法使用單順反子載體,使其能夠用于廣泛多種酵母菌株和種屬。此外,本文所描述的組合物和方法(例如,通過改變莖多肽的長度)來實現(xiàn)目標(biāo)蛋白的選擇性(“可調(diào)式”)可及性,可以對其進行控制以限制底物或結(jié)合配偶體的分子量。在真核細胞(例如,真菌細胞、酵母細胞等)表面上表達蛋白質(zhì)出于各種不同的目的而在業(yè)界得到廣泛使用。本文所描述的組合物和方法允許直接且簡單地表達任何與合成莖多肽融合的所要蛋白質(zhì)(目標(biāo)蛋白)。因為可以使用單順反子載體將poi呈現(xiàn)為表面可及融合蛋白的一部分,所以能將系統(tǒng)輕易地移植到各種酵母菌株和種屬中。

現(xiàn)已充分地描述本發(fā)明,所屬領(lǐng)域的一般技術(shù)人員將明白,可以在不脫離本發(fā)明的精神或范圍的情況下作出各種改變和修改。

實驗

提出以下實例以便向所屬領(lǐng)域的一般技術(shù)人員完整地披露且描述如何制備和使用本發(fā)明,且并不打算限制本發(fā)明人視為其發(fā)明的范圍,也不打算表示下文實驗是所進行的全部或唯一實驗。已努力確保關(guān)于所用數(shù)值(例如,量、溫度等)的準確性,但應(yīng)說明一些實驗誤差和偏差的原因。除非另外指示,否則份數(shù)是重量份,分子量是重量平均分子量,溫度是以攝氏度計,且壓力是大氣壓或接近大氣壓。

本說明書中所引用的所有公開案和專利申請均以引用的方式并入本文中,就如同各個別公開案或?qū)@暾垖iT且單獨地指出以引用的方式并入一般。

本發(fā)明已根據(jù)特定實施例來描述,所述特定實施例由本發(fā)明人發(fā)現(xiàn)或提出以包含實踐本發(fā)明的優(yōu)選方式。所屬領(lǐng)域的技術(shù)人員應(yīng)了解,根據(jù)本發(fā)明,在不脫離本發(fā)明的預(yù)定范圍的情況下,可以對舉例說明的特定實施例作出多種修改和改變。舉例來說,由于密碼子冗余,因此可以在不影響蛋白質(zhì)序列的情況下,對潛在dna序列作出改變。此外,出于生物學(xué)功能等效性考量,可以不在種類或量上影響生物學(xué)作用的情況下,對蛋白質(zhì)結(jié)構(gòu)作出改變。希望所有所述修改包括于所附權(quán)利要求書的范圍內(nèi)。

實例

實例1

圖1a-1c描繪了使用長度可變的gpi-錨定“莖多肽”確定是否可以“調(diào)節(jié)”可及性而進行的實驗。用于這些實驗的酵母菌株是bj5465。圖1a描繪了肽與酵母細胞表面連接的一個實施例的示意圖:分泌目標(biāo)蛋白(poi)(此處是改造的sirpa變體cv1)作為表面可及融合蛋白,其中poi與以下融合:(i)信號多肽(其將蛋白質(zhì)引向分泌路徑,但其可以經(jīng)由翻譯后加工與蛋白質(zhì)割裂)、(ii)莖多肽(合成序列,其長度可以在廣泛長度范圍內(nèi)改變)、(iii)gpi錨定物(例如,合成gpi錨定物)以及任選地(iv)表位標(biāo)記(所示為ha表位標(biāo)記)。

圖1b描繪了實驗結(jié)果,其顯示莖長度(以氨基酸計)與以下3種不同尺寸(不同分子量)的標(biāo)記探針的表面染色之間的關(guān)系:抗ha抗體(約150kd)、cd47-鏈霉親和素四聚體(約100kd)(其與cv1,即用于這些實驗的poi結(jié)合)以及cd47-生物素單體(約15kda)(其同樣與cv1結(jié)合)。圖1c描繪了呈現(xiàn)與不同長度莖連接的cv-1的酵母的代表性流式細胞測量圖,所述不同長度莖同時染有抗ha抗體(alexa488)和cd47-生物素單體(alexa647)。測試莖序列的長度(以氨基酸的數(shù)目計)在各圖上方列出。數(shù)據(jù)顯示莖長度可以用于“選擇”特定分子量的化合物。舉例來說,y軸上所描繪的是150kd抗ha抗體的結(jié)合,當(dāng)莖多肽長度為19或41個氨基酸時,其并未很好地結(jié)合于表面可及融合多肽,而當(dāng)莖多肽長度為232、465或649個氨基酸時,發(fā)生結(jié)合。相反,即使當(dāng)莖多肽長度為19個氨基酸時,cd47-生物素(x軸)仍與表面可及融合多肽結(jié)合,而當(dāng)莖多肽長度為41、232、465或649個氨基酸時,結(jié)合更牢固。

圖2a-2b描繪了用于確定本發(fā)明的組合物和方法是否與其它酵母菌株相容而進行的實驗。a)肽與酵母細胞表面連接的示意圖。分泌改造的sirpa變體cv1作為與ha表位標(biāo)記和長度為649個氨基酸的合成莖以及合成gpi錨定物的融合物(即,cv1是表達為表面可及融合多肽的目標(biāo)蛋白(poi))。相比于圖1a-1c中所用的bj5465,用于這些實驗的酵母菌株是yvh10。yvh10酵母過度表達酵母蛋白質(zhì)二硫鍵異構(gòu)酶(pdi),使得所分泌含有二硫鍵的蛋白質(zhì)能夠具有更大折疊能力。b)呈現(xiàn)與莖(649個氨基酸)連接的cv-1的yvh10酵母的代表性流式細胞測量圖,所述莖同時染有抗ha抗體(alexa488)和cd47-生物素單體(alexa647)。因此,數(shù)據(jù)顯示,本發(fā)明的組合物和方法實際上與其它酵母菌株相容。

實例2:針對高親和力pd-1結(jié)合的人類pd-l1蛋白的定向演化

目標(biāo):識別以高親和力和特異性與t細胞表達的pd-1結(jié)合的pd-l1突變體,由此競爭性地抑制與pd-l1的互動,所述pd-l1表達于腫瘤細胞或腫瘤浸潤免疫細胞的表面上。

方法:從與pd-1蛋白互動的區(qū)域中選擇人類pd-l1蛋白的穩(wěn)定子單元;選擇可能對這種互動至關(guān)重要的氨基酸殘基,且通過pcr和吉布森克隆(gibsoncloning)產(chǎn)生質(zhì)體庫,所述質(zhì)體對與連接gpi的錨定物連接的pd-l1突變體進行編碼(根據(jù)本專利中所描述的主要技術(shù));用電穿孔將質(zhì)體庫導(dǎo)入酵母或真菌菌株中;誘發(fā)突變體蛋白的表面呈現(xiàn);通過評估與標(biāo)記的可溶性重組pd-1蛋白的互動來選擇高親和力結(jié)合子;在分離一片高親和力pd-1結(jié)合子后,從所得酵母種群中提取dna,且測定所存在變體的序列;分析序列的結(jié)合親和力,且組裝一致的變體序列以使結(jié)合親和力達到最大。

實例3:針對高親和力il-2結(jié)合的人類il2rβ可溶性片段的定向演化

目標(biāo):識別以高親和力和特異性與內(nèi)源性il-2結(jié)合的細胞因子受體子單元il2rβ突變體,由此充當(dāng)阻止il-2與內(nèi)源性il-2受體復(fù)合物互動的競爭性儲集器。

方法:從與il-2蛋白互動的區(qū)域中選擇人類il2rβ蛋白的穩(wěn)定子單元;選擇可能對這種互動至關(guān)重要的氨基酸殘基,且通過pcr和吉布森克隆產(chǎn)生質(zhì)體庫,所述質(zhì)體對與連接gpi的錨定物連接的il2rβ突變體進行編碼(根據(jù)本專利中所描述的主要技術(shù));用電穿孔將質(zhì)體庫導(dǎo)入酵母或真菌菌株中;誘發(fā)突變體蛋白的表面呈現(xiàn);通過評估與標(biāo)記的可溶性重組子il-2蛋白的互動來選擇高親和力結(jié)合子;在分離一片高親和力il-2結(jié)合子后,從所得酵母種群中提取dna,且測定所存在變體的序列;分析序列的結(jié)合親和力,且組裝一致的變體序列以使結(jié)合親和力達到最大。

實例4:人類抗體庫的酵母表面呈現(xiàn)

目標(biāo):出于產(chǎn)生針對任何已知的細胞表面或分泌蛋白的高親和力、高特異性治療性人類單克隆抗體的目的,在酵母表面上將人類抗體結(jié)合域表達為抗原結(jié)合片段(fab)或單鏈可變片段(scfv)。

方法:通過基因合成產(chǎn)生質(zhì)體庫,所述質(zhì)體對與連接gpi的錨定物融合的人類抗體結(jié)合區(qū)變體(呈fab或scfv形式)進行編碼(根據(jù)本專利中所描述的主要技術(shù));用電穿孔將質(zhì)體庫導(dǎo)入酵母或真菌菌株中;誘發(fā)抗體片段的表面呈現(xiàn);通過評估與標(biāo)記的可溶性重組蛋白(其相當(dāng)于蛋白質(zhì)結(jié)合的所要區(qū)域)的互動來選擇高親和力結(jié)合子(例如,為了產(chǎn)生將與pd-1結(jié)合并阻止其與pd-l1互動的治療性抗體,將使用包括與pd-l1的互動區(qū)域的pd-1標(biāo)記片段來淘選庫);在分離一片高親和力結(jié)合子后,從所得酵母種群中提取dna,且測定所存在抗體變體的序列;分析作為重組抗體的個別序列的結(jié)合親和力。

實例5:替代性架構(gòu)庫的酵母表面呈現(xiàn)

目標(biāo):出于產(chǎn)生針對任何已知的細胞表面或分泌蛋白的高親和力、高特異性治療性人類單克隆抗體的目的,在酵母表面上表達替代性架構(gòu)庫,其包括(但不限于)纖連蛋白、免疫球蛋白、打結(jié)素、達爾潘蛋白(darpin)、抗運載蛋白。

方法:通過基因合成產(chǎn)生質(zhì)體庫,所述質(zhì)體對與連接gpi的錨定物融合的人類抗體結(jié)合區(qū)變體(呈fab或scfv形式)進行編碼(根據(jù)本專利中所描述的主要技術(shù));用電穿孔將質(zhì)體庫導(dǎo)入酵母或真菌菌株中;誘發(fā)替代性架構(gòu)蛋白的表面呈現(xiàn);通過評估與標(biāo)記的可溶性重組蛋白(其相當(dāng)于蛋白質(zhì)結(jié)合的所要區(qū)域)的互動來選擇高親和力結(jié)合子(例如,為了產(chǎn)生將與pd-1結(jié)合并阻止其與pd-l1互動的治療性替代架構(gòu)蛋白質(zhì),將使用包括與pd-l1的互動區(qū)域的pd-1標(biāo)記片段來淘選庫);在分離一片高親和力結(jié)合子后,從所得酵母種群中提取dna,且測定所存在替代性架構(gòu)的序列;分析作為重組蛋白的個別序列的結(jié)合親和力。

實例6:對翻譯的cdna進行酵母表面呈現(xiàn)從而以無偏性方式識別目標(biāo)標(biāo)靶的互動蛋白質(zhì)

目標(biāo):出于淘選目標(biāo)蛋白以基于與目標(biāo)蛋白的結(jié)合來識別新的互動配偶體的目的,在酵母表面上表達由cdna集合編碼的蛋白質(zhì),例如來自腫瘤衍生的細胞系或正常細胞類型。

方法:通過基因合成產(chǎn)生質(zhì)體庫,所述質(zhì)體對與連接gpi的錨定物融合的目標(biāo)細胞類型所衍生的cdna進行編碼(根據(jù)本專利中所描述的主要技術(shù));用電穿孔將質(zhì)體庫導(dǎo)入酵母或真菌菌株中;誘發(fā)替代性架構(gòu)蛋白的表面呈現(xiàn);通過評估與標(biāo)記的可溶性目標(biāo)重組蛋白的互動來選擇高親和力結(jié)合子;在分離一片對與目標(biāo)蛋白互動的蛋白質(zhì)進行表達的酵母后,從所得酵母種群中提取dna,且測定所存在替代性架構(gòu)的序列以識別負責(zé)cdna。

序列表

<110>阿龍·m·林

安德魯·c·克魯瑟

阿施施·曼格里克

<120>用于在細胞表面上表達多肽的組合物和方法

<130>stan-1154wo

<150>us62/077,756

<151>2014-11-10

<160>71

<170>patentinversion3.5

<210>1

<211>258

<212>dna

<213>人工序列

<220>

<223>合成序列

<400>1

atgagattcccatctatcttcaccgctgttttgttcgctgcttcttctgctttggctgct60

ccagctaacaccaccaccgaagacgaaaccgctcaaatcccagctgaagctgttatcgac120

tactctgacttggaaggtgacttcgacgctgctgctttgccattgtctaactctaccaac180

aacggtttgtcttctaccaacaccaccatcgcttctatcgctgctaaggaagaaggtgtt240

caattggacaagagagaa258

<210>2

<211>357

<212>dna

<213>人工序列

<220>

<223>合成序列

<400>2

gaggaggagctgcagattattcagcctgacaagtccgtgttggttgcagctggagagaca60

gccactctgcgctgcactattacctctctgtttcctgtggggcccatccagtggttcaga120

ggagctggaccaggccgggtattaatctacaatcaaaggcagggccccttcccccgggta180

acaactgtttcagacactacaaagagaaacaacatggacttttccatccgcatcggtaac240

atcaccccagcagatgccggcacctactactgtattaagttccggaaagggagccccgat300

gacgtggagtttaagtctggagcaggcactgagctgtctgtgcgcgccaaaccctct357

<210>3

<211>27

<212>dna

<213>人工序列

<220>

<223>合成序列

<400>3

tacccatacgatgttccagattacgct27

<210>4

<211>1947

<212>dna

<213>人工序列

<220>

<223>合成序列

<400>4

caaacatcctcaccctctacagaagcatcagtatcaacctctagtacctcttcctctgct60

tcacaatcatctgacccaactacaacatcttcgtccagttcatcgtcttccccatcttcc120

caatctgaggaaatttcatcatcaccgacggtctcaactacaccatcaacttcttcatca180

tcttcctcaatgacttcaaccaccacaacaaagtcaatctcaacttccactacaagttca240

gctccagttacagatgtgacagtttcctcatcgcctagtaaatctacctctacttcgaca300

agtacagaaacatctaaaacacctacttcaatgacagagtatacatctagtacatcgata360

atttcgactccagttagtcactcgcagacaggtttgtcggcttcatcaagttcatcatct420

acaacatccggttcttcgtccactaaatcagaaagttcgacaacatctggctcttcccag480

tccgtggaatcaacctccagccacgccactgttcttgctaattccgcagaaatggtcaca540

acatcctctagttcatcctcaacatccgaaatgtcattaactagtactgctaccagtgta600

ccagtctcatctagtagcagtacgacatattctactagcgcatctacacaagccgtcact660

acaacatcttcttccactgtatctacaacttcttctagtacaacgttaacaagcgcattc720

acacattcttcaaccacatcgtccgaccagccacccagcgacactacaagtccatctacg780

acacacgaacctcatgtaaccactcagacgtcatcagaaacatcttcttctaagtcatct840

tctacttcttcttcaagtacatctcaaacctctgagtctgcaacaccatccgattccgta900

tcacctggaagttctacatcaacatcttctagtagcacttctacttccacttctatttcc960

agtggagaaacgacaacttcttcttcttcatcatctgccacgaccacttctaacagcgca1020

accttgtcagtctctaccacacaaacttcgattgaagccagttcatctactacatctaca1080

tctagttcaacaattacaacttcaagtagtagcgctcacatatcgtcgaaatctcaatct1140

agtattacctatccctcttcctcgacatcttcatctacatcgtcctcaatttctagcgaa1200

tctgaaagttttgaatcgacatcagcagaagatgctccatcaacagcaccttcatcaagt1260

gtctcttctaagagttctacctctacaacatcaagcacatcgacatcttcaagcactcca1320

tctccatcaccatcttccgtgagttcttcctccaccagctcattgacaacttctgctgta1380

tcaacaccagctacctctcattctcaaagtactgtagtaaccaccactactattactaca1440

tcaacaggtccagtgatgtctacgacaacagcttattcttctagttctactagcagctcg1500

gaatcttctgaggttcagtctgtcatgtcatctacgcctagttcaacatcaacaacaacc1560

agttcggaatctacttcatctagctccacagcttctacctcaccatcaacctcgcaaact1620

ttcgaaacttctcctactataggaggtgtcccctcaaccacttcatttgtctctacgcca1680

acaacgaaattgtcgcacactacttccactatgacagcacagtccgatagtaagtctacc1740

cactcctcaagcacatcgacagaagataaatcatccactgcttctgcagttgacgaaagc1800

actacaacatccacttccacggagtctactacatcagtaacatcaggcacctcccattcc1860

gctaaagaatcttcgtcaaattctaaggtgtatagttcacagacagcacactcatccata1920

agtgttgcatcatcacctagtacaaag1947

<210>5

<211>111

<212>dna

<213>人工序列

<220>

<223>合成序列

<400>5

caaatccaatcttctatggttgaaatctctacctacgctggttctgctaactctgttaac60

gctggtgctggtgctggtgctttgttcttgttgttgtctttggctatcatc111

<210>6

<211>8584

<212>dna

<213>人工序列

<220>

<223>合成序列

<400>6

ggtacccgacaggttatcagcaacaacacagtcatatccattctcaattagctctaccac60

agtgtgtgaaccaatgtatccagcaccacctgtaaccaaaacaattttagaagtactttc120

actttgtaactgagctgtcatttatattgaattttcaaaaattcttactttttttttgga180

tggacgcaaagaagtttaataatcatattacatggcattaccaccatatacatatccata240

tacatatccatatctaatcttacttatatgttgtggaaatgtaaagagccccattatctt300

agcctaaaaaaaccttctctttggaactttcagtaatacgcttaactgctcattgctata360

ttgaagtacggattagaagccgccgagcgggtgacagccctccgaaggaagactctcctc420

cgtgcgtcctcgtcttcaccggtcgcgttcctgaaacgcagatgtgcctcgcgccgcact480

gctccgaacaataaagattctacaatactagcttttatggttatgaagaggaaaaattgg540

cagtaacctggccccacaaaccttcaaatgaacgaatcaaattaacaaccataggatgat600

aatgcgattagttttttagccttatttctggggtaattaatcagcgaagcgatgattttt660

gatctattaacagatatataaatgcaaaaactgcataaccactttaactaatactttcaa720

cattttcggtttgtattacttcttattcaaatgtaataaaagtatcaacaaaaaattgtt780

aatatacctctatactttaacgtcaaggagaaaaaaccccggatcgaattcaaccctcac840

taaagggcggccgccatgagattcccatctatcttcaccgctgttttgttcgctgcttct900

tctgctttggctgctccagctaacaccaccaccgaagacgaaaccgctcaaatcccagct960

gaagctgttatcgactactctgacttggaaggtgacttcgacgctgctgctttgccattg1020

tctaactctaccaacaacggtttgtcttctaccaacaccaccatcgcttctatcgctgct1080

aaggaagaaggtgttcaattggacaagagagaagctagcgcagaggaggagctgcagatt1140

attcagcctgacaagtccgtgttggttgcagctggagagacagccactctgcgctgcact1200

attacctctctgtttcctgtggggcccatccagtggttcagaggagctggaccaggccgg1260

gtattaatctacaatcaaaggcagggccccttcccccgggtaacaactgtttcagacact1320

acaaagagaaacaacatggacttttccatccgcatcggtaacatcaccccagcagatgcc1380

ggcacctactactgtattaagttccggaaagggagccccgatgacgtggagtttaagtct1440

ggagcaggcactgagctgtctgtgcgcgccaaaccctctggatcctacccatacgatgtt1500

ccagattacgctcaaacatcctcaccctctacagaagcatcagtatcaacctctagtacc1560

tcttcctctgcttcacaatcatctgacccaactacaacatcttcgtccagttcatcgtct1620

tccccatcttcccaatctgaggaaatttcatcatcaccgacggtctcaactacaccatca1680

acttcttcatcatcttcctcaatgacttcaaccaccacaacaaagtcaatctcaacttcc1740

actacaagttcagctccagttacagatgtgacagtttcctcatcgcctagtaaatctacc1800

tctacttcgacaagtacagaaacatctaaaacacctacttcaatgacagagtatacatct1860

agtacatcgataatttcgactccagttagtcactcgcagacaggtttgtcggcttcatca1920

agttcatcatctacaacatccggttcttcgtccactaaatcagaaagttcgacaacatct1980

ggctcttcccagtccgtggaatcaacctccagccacgccactgttcttgctaattccgca2040

gaaatggtcacaacatcctctagttcatcctcaacatccgaaatgtcattaactagtact2100

gctaccagtgtaccagtctcatctagtagcagtacgacatattctactagcgcatctaca2160

caagccgtcactacaacatcttcttccactgtatctacaacttcttctagtacaacgtta2220

acaagcgcattcacacattcttcaaccacatcgtccgaccagccacccagcgacactaca2280

agtccatctacgacacacgaacctcatgtaaccactcagacgtcatcagaaacatcttct2340

tctaagtcatcttctacttcttcttcaagtacatctcaaacctctgagtctgcaacacca2400

tccgattccgtatcacctggaagttctacatcaacatcttctagtagcacttctacttcc2460

acttctatttccagtggagaaacgacaacttcttcttcttcatcatctgccacgaccact2520

tctaacagcgcaaccttgtcagtctctaccacacaaacttcgattgaagccagttcatct2580

actacatctacatctagttcaacaattacaacttcaagtagtagcgctcacatatcgtcg2640

aaatctcaatctagtattacctatccctcttcctcgacatcttcatctacatcgtcctca2700

atttctagcgaatctgaaagttttgaatcgacatcagcagaagatgctccatcaacagca2760

ccttcatcaagtgtctcttctaagagttctacctctacaacatcaagcacatcgacatct2820

tcaagcactccatctccatcaccatcttccgtgagttcttcctccaccagctcattgaca2880

acttctgctgtatcaacaccagctacctctcattctcaaagtactgtagtaaccaccact2940

actattactacatcaacaggtccagtgatgtctacgacaacagcttattcttctagttct3000

actagcagctcggaatcttctgaggttcagtctgtcatgtcatctacgcctagttcaaca3060

tcaacaacaaccagttcggaatctacttcatctagctccacagcttctacctcaccatca3120

acctcgcaaactttcgaaacttctcctactataggaggtgtcccctcaaccacttcattt3180

gtctctacgccaacaacgaaattgtcgcacactacttccactatgacagcacagtccgat3240

agtaagtctacccactcctcaagcacatcgacagaagataaatcatccactgcttctgca3300

gttgacgaaagcactacaacatccacttccacggagtctactacatcagtaacatcaggc3360

acctcccattccgctaaagaatcttcgtcaaattctaaggtgtatagttcacagacagca3420

cactcatccataagtgttgcatcatcacctagtacaaagggcgcccaaatccaatcttct3480

atggttgaaatctctacctacgctggttctgctaactctgttaacgctggtgctggtgct3540

ggtgctttgttcttgttgttgtctttggctatcatctaatgattaattaactcgagatct3600

gataacaacagtgtagatgtaacaaaatcgactttgttcccactgtacttttagctcgta3660

caaaatacaatatacttttcatttctccgtaaacaacatgttttcccatgtaatatcctt3720

ttctatttttcgttccgttaccaactttacacatactttatatagctattcacttctata3780

cactaaaaaactaagacaattttaattttgctgcctgccatatttcaatttgttataaat3840

tcctataatttatcctattagtagctaaaaaaagatgaatgtgaatcgaatcctaagaga3900

attgagctccaattcgccctatagtgagtcgtattacaattcactggccgtcgttttaca3960

acgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccc4020

cttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcg4080

cagcctgaatggcgaatggcgcgacgcgccctgtagcggcgcattaagcgcggcgggtgt4140

ggtggttacgcgcagcgtgaccgctacacttgccagcgccctagcgcccgctcctttcgc4200

tttcttcccttcctttctcgccacgttcgccggctttccccgtcaagctctaaatcgggg4260

gctccctttagggttccgatttagtgctttacggcacctcgaccccaaaaaacttgatta4320

gggtgatggttcacgtagtgggccatcgccctgatagacggtttttcgccctttgacgtt4380

ggagtccacgttctttaatagtggactcttgttccaaactggaacaacactcaaccctat4440

ctcggtctattcttttgatttataagggattttgccgatttcggcctattggttaaaaaa4500

tgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaacgtttacaatttc4560

ctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcaggcaagtgcac4620

aaacaatacttaaataaatactactcagtaataacctatttcttagcatttttgacgaaa4680

tttgctattttgttagagtcttttacaccatttgtctccacacctccgcttacatcaaca4740

ccaataacgccatttaatctaagcgcatcaccaacattttctggcgtcagtccaccagct4800

aacataaaatgtaagctttcggggctctcttgccttccaacccagtcagaaatcgagttc4860

caatccaaaagttcacctgtcccacctgcttctgaatcaaacaagggaataaacgaatga4920

ggtttctgtgaagctgcactgagtagtatgttgcagtcttttggaaatacgagtctttta4980

ataactggcaaaccgaggaactcttggtattcttgccacgactcatctccatgcagttgg5040

acgatatcaatgccgtaatcattgaccagagccaaaacatcctccttaggttgattacga5100

aacacgccaaccaagtatttcggagtgcctgaactatttttatatgcttttacaagactt5160

gaaattttccttgcaataaccgggtcaattgttctctttctattgggcacacatataata5220

cccagcaagtcagcatcggaatctagagcacattctgcggcctctgtgctctgcaagccg5280

caaactttcaccaatggaccagaactacctgtgaaattaataacagacatactccaagct5340

gcctttgtgtgcttaatcacgtatactcacgtgctcaatagtcaccaatgccctccctct5400

tggccctctccttttcttttttcgaccgaattaattcttaatcggcaaaaaaagaaaagc5460

tccggatcaagattgtacgtaaggtgacaagctatttttcaataaagaatatcttccact5520

actgccatctggcgtcataactgcaaagtacacatatattacgatgctgtctattaaatg5580

cttcctatattatatatatagtaatgtcgtttatggtgcactctcagtacaatctgctct5640

gatgccgcatagttaagccagccccgacacccgccaacacccgctgacgcgccctgacgg5700

gcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatg5760

tgtcagaggttttcaccgtcatcaccgaaacgcgcgagacgaaagggcctcgtgatacgc5820

ctatttttataggttaatgtcatgataataatggtttcttaggacggatcgcttgcctgt5880

aacttacacgcgcctcgtatcttttaatgatggaataatttgggaatttactctgtgttt5940

atttatttttatgttttgtatttggattttagaaagtaaataaagaaggtagaagagtta6000

cggaatgaagaaaaaaaaataaacaaaggtttaaaaaatttcaacaaaaagcgtacttta6060

catatatatttattagacaagaaaagcagattaaatagatatacattcgattaacgataa6120

gtaaaatgtaaaatcacaggattttcgtgtgtggtcttctacacagacaagatgaaacaa6180

ttcggcattaatacctgagagcaggaagagcaagataaaaggtagtatttgttggcgatc6240

cccctagagtcttttacatcttcggaaaacaaaaactattttttctttaatttctttttt6300

tactttctatttttaatttatatatttatattaaaaaatttaaattataattatttttat6360

agcacgtgatgaaaaggacccaggtggcacttttcggggaaatgtgcgcggaacccctat6420

ttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgata6480

aatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgccct6540

tattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaa6600

agtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaa6660

cagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttt6720

taaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcgg6780

tcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagca6840

tcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataa6900

cactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgctttttt6960

tcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagc7020

cataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaa7080

actattaactggcgaactacttactctagcttcccggcaacaattaatagactggatgga7140

ggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgc7200

tgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccaga7260

tggtaagccctcccgtatcgtagttatctacacgacgggcagtcaggcaactatggatga7320

acgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcaga7380

ccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggat7440

ctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgtt7500

ccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttct7560

gcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgcc7620

ggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagatacc7680

aaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcacc7740

gcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtc7800

gtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctg7860

aacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagata7920

cctacagcgtgagcattgagaaagcgccacgcttcccgaagggagaaaggcggacaggta7980

tccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccaggggggaacgc8040

ctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtg8100

atgctcgtcaggggggccgagcctatggaaaaacgccagcaacgcggcctttttacggtt8160

cctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgt8220

ggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccga8280

gcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccc8340

cgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcggg8400

cagtgagcgcaacgcaattaatgtgagttacctcactcattaggcaccccaggctttaca8460

ctttatgcttccggctcctatgttgtgtggaattgtgagcggataacaatttcacacagg8520

aaacagctatgaccatgattacgccaagctcggaattaaccctcactaaagggaacaaaa8580

gctg8584

<210>7

<211>119

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>7

gluglugluleuglnileileglnproasplysservalleuvalala

151015

alaglygluthralathrleuargcysthrilethrserleuphepro

202530

valglyproileglntrppheargglyalaglyproglyargvalleu

354045

iletyrasnglnargglnglypropheproargvalthrthrvalser

505560

aspthrthrlysargasnasnmetasppheserileargileglyasn

65707580

ilethrproalaaspalaglythrtyrtyrcysilelysphearglys

859095

glyserproaspaspvalgluphelysserglyalaglythrgluleu

100105110

servalargalalysproser

115

<210>8

<211>9

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>8

tyrprotyraspvalproasptyrala

15

<210>9

<211>907

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>9

metargpheproserilephethralavalleuphealaalaserser

151015

alaleualaalaproalaasnthrthrthrgluaspgluthralagln

202530

ileproalaglualavalileasptyrseraspleugluglyaspphe

354045

aspalaalaalaleuproleuserasnserthrasnasnglyleuser

505560

serthrasnthrthrilealaserilealaalalysglugluglyval

65707580

glnleuasplysargglualaseralagluglugluleuglnileile

859095

glnproasplysservalleuvalalaalaglygluthralathrleu

100105110

argcysthrilethrserleupheprovalglyproileglntrpphe

115120125

argglyalaglyproglyargvalleuiletyrasnglnargglngly

130135140

propheproargvalthrthrvalseraspthrthrlysargasnasn

145150155160

metasppheserileargileglyasnilethrproalaaspalagly

165170175

thrtyrtyrcysilelysphearglysglyserproaspaspvalglu

180185190

phelysserglyalaglythrgluleuservalargalalysproser

195200205

glysertyrprotyraspvalproasptyralaglnthrserserpro

210215220

serthrglualaservalserthrserserthrserserseralaser

225230235240

glnserseraspprothrthrthrserserserserserserserser

245250255

proserserglnserglugluileserserserprothrvalserthr

260265270

thrproserthrsersersersersersermetthrserthrthrthr

275280285

thrlysserileserthrserthrthrserseralaprovalthrasp

290295300

valthrvalserserserproserlysserthrserthrserthrser

305310315320

thrgluthrserlysthrprothrsermetthrglutyrthrserser

325330335

thrserileileserthrprovalserhisserglnthrglyleuser

340345350

alaserserserserserserthrthrserglyserserserthrlys

355360365

sergluserserthrthrserglyserserglnservalgluserthr

370375380

serserhisalathrvalleualaasnseralaglumetvalthrthr

385390395400

serserserserserserthrserglumetserleuthrserthrala

405410415

thrservalprovalserserserserserthrthrtyrserthrser

420425430

alaserthrglnalavalthrthrthrserserserthrvalserthr

435440445

thrserserserthrthrleuthrseralaphethrhisserserthr

450455460

thrserseraspglnproproseraspthrthrserproserthrthr

465470475480

hisgluprohisvalthrthrglnthrsersergluthrserserser

485490495

lysserserserthrserserserserthrserglnthrsergluser

500505510

alathrproseraspservalserproglyserserthrserthrser

515520525

serserserthrserthrserthrserileserserglygluthrthr

530535540

thrserserserserserseralathrthrthrserasnseralathr

545550555560

leuservalserthrthrglnthrserileglualaserserserthr

565570575

thrserthrserserserthrilethrthrserserserseralahis

580585590

ileserserlysserglnserserilethrtyrproserserserthr

595600605

serserserthrserserserileserserglusergluserpheglu

610615620

serthrseralagluaspalaproserthralaproserserserval

625630635640

serserlysserserthrserthrthrserserthrserthrserser

645650655

serthrproserproserproserservalserserserserthrser

660665670

serleuthrthrseralavalserthrproalathrserhissergln

675680685

serthrvalvalthrthrthrthrilethrthrserthrglyproval

690695700

metserthrthrthralatyrserserserserthrserserserglu

705710715720

sersergluvalglnservalmetserserthrproserserthrser

725730735

thrthrthrsersergluserthrserserserserthralaserthr

740745750

serproserthrserglnthrphegluthrserprothrileglygly

755760765

valproserthrthrserphevalserthrprothrthrlysleuser

770775780

histhrthrserthrmetthralaglnseraspserlysserthrhis

785790795800

serserserthrserthrgluasplysserserthralaseralaval

805810815

aspgluserthrthrthrserthrserthrgluserthrthrserval

820825830

thrserglythrserhisseralalysgluserserserasnserlys

835840845

valtyrserserglnthralahisserserileservalalaserser

850855860

proserthrlysglyalaglnileglnsersermetvalgluileser

865870875880

thrtyralaglyseralaasnservalasnalaglyalaglyalagly

885890895

alaleupheleuleuleuserleualaileile

900905

<210>10

<211>910

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>10

metargpheproserilephethralavalleuphealaalaserser

151015

alaleualaalaproalaasnthrthrthrgluaspgluthralagln

202530

ileproalaglualavalileasptyrseraspleugluglyaspphe

354045

aspalaalaalaleuproleuserasnserthrasnasnglyleuser

505560

serthrasnthrthrilealaserilealaalalysglugluglyval

65707580

glnleuasplysargglualaseralagluglugluleuglnileile

859095

glnproasplysservalleuvalalaalaglygluthralathrleu

100105110

argcysthrilethrserleupheprovalglyproileglntrpphe

115120125

argglyalaglyproglyargvalleuiletyrasnglnargglngly

130135140

propheproargvalthrthrvalseraspthrthrlysargasnasn

145150155160

metasppheserileargileglyasnilethrproalaaspalagly

165170175

thrtyrtyrcysilelysphearglysglyserproaspaspvalglu

180185190

phelysserglyalaglythrgluleuservalargalalysproser

195200205

glysertyrprotyraspvalproasptyralaglnthrserserpro

210215220

serthrglualaservalserthrserserthrserserseralaser

225230235240

glnserseraspprothrthrthrserserserserserserserser

245250255

proserserglnserglugluileserserserprothrvalserthr

260265270

thrproserthrsersersersersersermetthrserthrthrthr

275280285

thrlysserileserthrserthrthrserseralaprovalthrasp

290295300

valthrvalserserserproserlysserthrserthrserthrser

305310315320

thrgluthrserlysthrprothrsermetthrglutyrthrserser

325330335

thrserileileserthrprovalserhisserglnthrglyleuser

340345350

alaserserserserserserthrthrserglyserserserthrlys

355360365

sergluserserthrthrserglyserserglnservalgluserthr

370375380

serserhisalathrvalleualaasnseralaglumetvalthrthr

385390395400

serserserserserserthrserglumetserleuthrserthrala

405410415

thrservalprovalserserserserserthrthrtyrserthrser

420425430

alaserthrglnalavalthrthrthrserserserthrvalserthr

435440445

thrserserserthrthrleuthrseralaphethrhisserserthr

450455460

thrserseraspglnproproseraspthrthrserproserthrthr

465470475480

hisgluprohisvalthrthrglnthrsersergluthrserserser

485490495

lysserserserthrserserserserthrserglnthrsergluser

500505510

alathrproseraspservalserproglyserserthrserthrser

515520525

serserserthrserthrserthrserileserserglygluthrthr

530535540

thrserserserserserseralathrthrthrserasnseralathr

545550555560

leuservalserthrthrglnthrserileglualaserserserthr

565570575

thrserthrserserserthrilethrthrserserserseralahis

580585590

ileserserlysserglnserserilethrtyrproserserserthr

595600605

serserserthrserserserileserserglusergluserpheglu

610615620

serthrseralagluaspalaproserthralaproserserserval

625630635640

serserlysserserthrserthrthrserserthrserthrserser

645650655

serthrproserproserproserservalserserserserthrser

660665670

serleuthrthrseralavalserthrproalathrserhissergln

675680685

serthrvalvalthrthrthrthrilethrthrserthrglyproval

690695700

metserthrthrthralatyrserserserserthrserserserglu

705710715720

sersergluvalglnservalmetserserthrproserserthrser

725730735

thrthrthrsersergluserthrserserserserthralaserthr

740745750

serproserthrserglnthrphegluthrserprothrileglygly

755760765

valproserthrthrserphevalserthrprothrthrlysleuser

770775780

histhrthrserthrmetthralaglnseraspserlysserthrhis

785790795800

serserserthrserthrgluasplysserserthralaseralaval

805810815

aspgluserthrthrthrserthrserthrgluserthrthrserval

820825830

thrserglythrserhisseralalysgluserserserasnserlys

835840845

valtyrserserglnthralahisserserileservalalaserser

850855860

proserthrlysglyalaileglnglnasnphethrserthrserleu

865870875880

metileserthrtyrgluglylysalaserilephepheseralaglu

885890895

leuglyserileilepheleuleuleusertyrleuleuphe

900905910

<210>11

<211>87

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>11

metargpheproserilephethralavalleuphealaalaserser

151015

alaleualaalaproalaasnthrthrthrgluaspgluthralagln

202530

ileproalaglualavalileasptyrseraspleugluglyaspphe

354045

aspalaalaalaleuproleuserasnserthrasnasnglyleuser

505560

serthrasnthrthrilealaserilealaalalysglugluglyval

65707580

glnleuasplysarggluala

85

<210>12

<211>20

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>12

metargpheproserilephethralavalleuphealaalaserser

151015

alaleualaala

20

<210>13

<211>19

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>13

metglnleuleuargcyspheserilepheservalilealaserval

151015

leualagln

<210>14

<211>18

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>14

metphelysservalvaltyrserileleualaalaserleualaasn

151015

alagly

<210>15

<211>20

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>15

metleuleuglnalapheleupheleuleualaglyphealaalalys

151015

ileseralaser

20

<210>16

<211>22

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>16

metasnpheserargilephephephevalphealacysleuthrala

151015

leualametvalasnala

20

<210>17

<211>19

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>17

metargalapheleualaleuilepheleuthrphevalmetasnval

151015

gluserser

<210>18

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>18

000

<210>19

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>19

000

<210>20

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>20

000

<210>21

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>21

000

<210>22

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>22

000

<210>23

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>23

000

<210>24

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>24

000

<210>25

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>25

000

<210>26

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>26

000

<210>27

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>27

000

<210>28

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>28

000

<210>29

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>29

000

<210>30

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>30

000

<210>31

<211>19

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>31

glyglyglyglyserglyglyglyglyserglyserthrglyglygly

151015

glyglyser

<210>32

<211>41

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>32

glnthrserserproserargglualaservalserthrserserthr

151015

serserseralaserglnserseraspprothrthrthrserserser

202530

thrvalserthrproalathrglyala

3540

<210>33

<211>232

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>33

glnthrserserproserthrglualaservalserthrserserthr

151015

serserseralaserglnserseraspprothrthrthrserserser

202530

serserserserserproserserglnserglugluileserserser

354045

prothrvalserthrthrproserthrsersersersersersermet

505560

thrserthrthrthrthrlysserileserthrserthrthrserser

65707580

alaprovalthraspvalthrvalserserserproserlysserthr

859095

serthrserthrserthrgluthrserlysthrprothrsermetthr

100105110

glutyrthrserserthrserileileserthrprovalserhisser

115120125

glnthrglyleuseralaserserserserserserthrthrsergly

130135140

serserserthrlyssergluserserthrthrserglysersergln

145150155160

servalgluserthrserserhisalathrvalleualaasnserala

165170175

glumetvalthrthrserserserserserserthrserglumetser

180185190

leuthrserthralathrservalprovalserserserserserthr

195200205

thrtyrserthrseralaserthrglnalavalthrthrthrserser

210215220

serthrvalserthrthrserser

225230

<210>34

<211>465

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>34

glnthrserserproserthrglualaservalserthrserserthr

151015

serserseralaserglnserseraspprothrthrthrserserser

202530

serserserserserproserserglnserglugluileserserser

354045

prothrvalserthrthrproserthrsersersersersersermet

505560

thrserthrthrthrthrlysserileserthrserthrthrserser

65707580

alaprovalthraspvalthrvalserserserproserlysserthr

859095

serthrserthrserthrgluthrserlysthrprothrsermetthr

100105110

glutyrthrserserthrserileileserthrprovalserhisser

115120125

glnthrglyleuseralaserserserserserserthrthrsergly

130135140

serserserthrlyssergluserserthrthrserglysersergln

145150155160

servalgluserthrserserhisalathrvalleualaasnserala

165170175

glumetvalthrthrserserserserserserthrserglumetser

180185190

leuthrserthralathrservalprovalserserserserserthr

195200205

thrtyrserthrseralaserthrglnalavalthrthrthrserser

210215220

serthrvalserthrthrserserserthrthrleuthrseralaphe

225230235240

thrhisserserthrthrserseraspglnproproseraspthrthr

245250255

serproserthrthrhisgluprohisvalthrthrglnthrserser

260265270

gluthrserserserlysserserserthrserserserserthrser

275280285

glnthrsergluseralathrproseraspservalserproglyser

290295300

serthrserthrserserserserthrserthrserthrserileser

305310315320

serglygluthrthrthrserserserserserseralathrthrthr

325330335

serasnseralathrleuservalserthrthrglnthrserileglu

340345350

alaserserserthrthrserthrserserserthrilethrthrser

355360365

serserseralahisileserserlysserglnserserilethrtyr

370375380

proserserserthrserserserthrserserserileserserglu

385390395400

sergluserphegluserthrseralagluaspalaproserthrala

405410415

proserserservalserserlysserserthrserthrthrserser

420425430

thrserthrserserserthrproserproserproserservalser

435440445

serserserthrserserleuthrthrseralavalserthrproala

450455460

thr

465

<210>35

<211>649

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>35

glnthrserserproserthrglualaservalserthrserserthr

151015

serserseralaserglnserseraspprothrthrthrserserser

202530

serserserserserproserserglnserglugluileserserser

354045

prothrvalserthrthrproserthrsersersersersersermet

505560

thrserthrthrthrthrlysserileserthrserthrthrserser

65707580

alaprovalthraspvalthrvalserserserproserlysserthr

859095

serthrserthrserthrgluthrserlysthrprothrsermetthr

100105110

glutyrthrserserthrserileileserthrprovalserhisser

115120125

glnthrglyleuseralaserserserserserserthrthrsergly

130135140

serserserthrlyssergluserserthrthrserglysersergln

145150155160

servalgluserthrserserhisalathrvalleualaasnserala

165170175

glumetvalthrthrserserserserserserthrserglumetser

180185190

leuthrserthralathrservalprovalserserserserserthr

195200205

thrtyrserthrseralaserthrglnalavalthrthrthrserser

210215220

serthrvalserthrthrserserserthrthrleuthrseralaphe

225230235240

thrhisserserthrthrserseraspglnproproseraspthrthr

245250255

serproserthrthrhisgluprohisvalthrthrglnthrserser

260265270

gluthrserserserlysserserserthrserserserserthrser

275280285

glnthrsergluseralathrproseraspservalserproglyser

290295300

serthrserthrserserserserthrserthrserthrserileser

305310315320

serglygluthrthrthrserserserserserseralathrthrthr

325330335

serasnseralathrleuservalserthrthrglnthrserileglu

340345350

alaserserserthrthrserthrserserserthrilethrthrser

355360365

serserseralahisileserserlysserglnserserilethrtyr

370375380

proserserserthrserserserthrserserserileserserglu

385390395400

sergluserphegluserthrseralagluaspalaproserthrala

405410415

proserserservalserserlysserserthrserthrthrserser

420425430

thrserthrserserserthrproserproserproserservalser

435440445

serserserthrserserleuthrthrseralavalserthrproala

450455460

thrserhisserglnserthrvalvalthrthrthrthrilethrthr

465470475480

serthrglyprovalmetserthrthrthralatyrserserserser

485490495

thrserserserglusersergluvalglnservalmetserserthr

500505510

proserserthrserthrthrthrsersergluserthrserserser

515520525

serthralaserthrserproserthrserglnthrphegluthrser

530535540

prothrileglyglyvalproserthrthrserphevalserthrpro

545550555560

thrthrlysleuserhisthrthrserthrmetthralaglnserasp

565570575

serlysserthrhisserserserthrserthrgluasplysserser

580585590

thralaseralavalaspgluserthrthrthrserthrserthrglu

595600605

serthrthrservalthrserglythrserhisseralalysgluser

610615620

serserasnserlysvaltyrserserglnthralahisserserile

625630635640

servalalaserserproserthrlys

645

<210>36

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>36

000

<210>37

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>37

000

<210>38

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>38

000

<210>39

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>39

000

<210>40

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>40

000

<210>41

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>41

000

<210>42

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>42

000

<210>43

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>43

000

<210>44

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>44

000

<210>45

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>45

000

<210>46

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>46

000

<210>47

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>47

000

<210>48

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>48

000

<210>49

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>49

000

<210>50

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>50

000

<210>51

<211>40

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>51

ileglnglnasnphethrserthrserleumetileserthrtyrglu

151015

glylysalaserilephepheseralagluleuglyserileilephe

202530

leuleuleusertyrleuleuphe

3540

<210>52

<211>40

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>52

glulysserthrasnserserserseralathrserlysasnalagly

151015

alaalametaspmetglyphepheseralaglyvalglyalaalaile

202530

alaglyalaalaalametleuleu

3540

<210>53

<211>43

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>53

serleuleulysseralaalaseralathrserserserglnserser

151015

serlysserlysglyalaalaglyileilegluileproleuilephe

202530

argalaleualagluleutyrasnleuvalleu

3540

<210>54

<211>40

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>54

serserglyalaserserserserserlysserserlysglyasnala

151015

alailemetalaproileglyglnthrthrproleuvalglyleuleu

202530

thralaileilemetserilemet

3540

<210>55

<211>44

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>55

alaglnalaasnvalseralaseralaserserserserserserser

151015

lyslysserlysglyalaalaprogluleuvalproalathrserphe

202530

metglyvalvalalaalavalglyvalalaleuleu

3540

<210>56

<211>40

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>56

glyproglyglulysalaarglysasnasnalaalaproglyproser

151015

asnpheasnserilelysleupheglyvalthralaglyseralaala

202530

valalaglyalaleuleuleuleu

3540

<210>57

<211>39

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>57

serserthrglymetleuserprothrserserserserthrarglys

151015

gluasnglyglyhisasnleuasnproprophephealaargpheile

202530

thralailephehishisile

35

<210>58

<211>40

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>58

serserpheserserserglyglysersergluserthrthrlyslys

151015

glnasnalaglytyrlystyrargserserpheserpheserleuleu

202530

serpheilesertyrpheleuleu

3540

<210>59

<211>40

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>59

tyrlysserthrvalasnglylysvalalaservalmetserasnser

151015

thrasnglyalathralaglythrhisilealatyrglyalaglyala

202530

phealavalglyalaleuleuleu

3540

<210>60

<211>40

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>60

serglyasnleuthrthrserthralaseralathrserthrserser

151015

lysargasnvalglyasphisilevalproserleuproleuthrleu

202530

ileserleuleuphealapheile

3540

<210>61

<211>43

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>61

glylysasnglyalalysserglnglyserserlyslysmetgluasn

151015

seralaprolysasnilepheileaspalaphelysmetservaltyr

202530

alavalphethrvalleupheserileilephe

3540

<210>62

<211>40

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>62

thrglyserserseralaserserserserlysserlysglyvalgly

151015

asnilevalasnvalserpheserglnserglytyrleualaleuphe

202530

alaglyleuileseralaleuleu

3540

<210>63

<211>40

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>63

alaserglyserserthrhislyslysasnalaglyasnalaleuval

151015

asntyrserasnleuasnthrasnthrpheileglyvalleuserval

202530

ileseralavalpheglyleuile

3540

<210>64

<211>40

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>64

gluaspalaaspgluasplysaspaspleulysarglyshisargasn

151015

seralaserileserglyproleuleuproleuglyleucysleuleu

202530

phephethrpheserleuphephe

3540

<210>65

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>65

000

<210>66

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>66

000

<210>67

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>67

000

<210>68

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>68

000

<210>69

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>69

000

<210>70

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>70

000

<210>71

<211>37

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>71

glnileglnsersermetvalgluileserthrtyralaglyserala

151015

asnservalasnalaglyalaglyalaglyalaleupheleuleuleu

202530

serleualaileile

35

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
衡阳县| 临沭县| 织金县| 武安市| 五大连池市| 闵行区| 玉环县| 扬中市| 沙坪坝区| 阳东县| 汉川市| 平罗县| 慈溪市| 崇阳县| 罗源县| 普陀区| 平泉县| 宁夏| 宁远县| 大丰市| 皋兰县| 永年县| 团风县| 卢龙县| 仙游县| 石棉县| 丹阳市| 渑池县| 长治县| 思南县| 育儿| 方城县| 湖北省| 赣州市| 盐边县| 富源县| 平南县| 印江| 彰化市| 宣威市| 鄂尔多斯市|