專(zhuān)利名稱(chēng)::構(gòu)建融合文庫(kù)的方法和組合物及該文庫(kù)的用途的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及編碼NAM酶融合蛋白質(zhì)的基因文庫(kù)和識(shí)別目的核酸的使用方法。
背景技術(shù):
:DNA技術(shù)和生物信息學(xué)的改進(jìn)使科學(xué)界能夠獲得一些微生物的天然基因組序列,同時(shí)高等真核生物和哺乳動(dòng)物的基因組序列也接近完成。各種生物體DNA序列的迅速積累表現(xiàn)出巨大的潛在科學(xué)和商業(yè)機(jī)會(huì)。但是,在許多情況下,獲得的天然序列不能翻譯成它們所編碼的生物、制藥或工業(yè)方面有用的信息。因此,本領(lǐng)域需要有效地、系統(tǒng)地和盡可能地揭示天然和合成的DNA序列的功能和作用。揭示給定DNA序列潛在功能的幾種普通方法已有報(bào)道。一種方法是依靠生物信息學(xué)工具,這也是發(fā)現(xiàn)基因和靶目標(biāo)的基本方法。生物信息學(xué)軟件可從幾個(gè)專(zhuān)門(mén)從事將序列數(shù)據(jù)組織錄入計(jì)算機(jī)數(shù)據(jù)庫(kù)的公司獲得。研究者能夠?qū)⑽炊ㄐ缘暮怂嵝蛄信c數(shù)據(jù)庫(kù)中已知基因的序列相比較,由此就能提出關(guān)于核酸序列編碼的基因產(chǎn)物的功能的理論。但是,生物信息學(xué)軟件很昂貴,通常需要為有效使用而進(jìn)行大量的訓(xùn)練,且僅能使研究者推測(cè)一個(gè)編碼的基因產(chǎn)物的可能功能。此外,越來(lái)越多的DNA序列經(jīng)過(guò)鑒定發(fā)現(xiàn)與已知功能的基因之間沒(méi)有序列上的聯(lián)系,而且對(duì)于許多所謂“已知”的基因也發(fā)現(xiàn)了許多新的特性。因此,生物信息學(xué)只提供了有限的信息,必須謹(jǐn)慎使用。所有信息學(xué)預(yù)測(cè)的特性需要實(shí)驗(yàn)證實(shí)。另一個(gè)關(guān)聯(lián)序列數(shù)據(jù)與功能的方法是對(duì)單個(gè)基因功能進(jìn)行試驗(yàn)性的檢測(cè)。在以前描述的方法中,核酸序列采用許多表達(dá)構(gòu)建物的任何一種來(lái)表達(dá)以獲得一個(gè)編碼的肽,然后經(jīng)過(guò)檢測(cè)來(lái)鑒定具有所需特性的肽。許多以前描述的方法中固有的難點(diǎn)是將目標(biāo)特性與其編碼核酸序列聯(lián)系起來(lái)。換句話來(lái)說(shuō),當(dāng)將大量的核酸和肽序列及其探明的編碼功能集中在一起時(shí),就越來(lái)越難鑒定和分離具有所需功能的編碼序列。通過(guò)將表達(dá)的肽和編碼它的遺傳物質(zhì)連接起來(lái)緩解了與處理大量核酸序列集,如基因文庫(kù)相關(guān)的主要難題。一個(gè)將肽與其編碼核酸聯(lián)系起來(lái)的方法是使用多核糖體顯現(xiàn)。多核糖體顯現(xiàn)方法主要包括在體外翻譯RNA,并將新生蛋白復(fù)合到其相應(yīng)的RNA上。復(fù)合體是通過(guò)控制編碼序列來(lái)構(gòu)建的,這樣核糖體就不會(huì)釋放新生蛋白或RNA。通過(guò)回收目標(biāo)蛋白,研究者可以獲得相應(yīng)的RNA,因此經(jīng)已知的方法如逆轉(zhuǎn)錄酶結(jié)合PCR將RNA轉(zhuǎn)變成DNA后,就可以獲得編碼的DNA序列。然而,多核糖體顯現(xiàn)的方法只能在體外進(jìn)行,操作困難,且需要無(wú)核酶的環(huán)境。由于體外翻譯機(jī)制的起始蛋氨酸密碼子替換和較少完整進(jìn)程的性-質(zhì),這種方法不適用于大的蛋白。另外,RNA-蛋白-核糖體復(fù)合體是不穩(wěn)定的,因此限制了適合多核糖體顯現(xiàn)復(fù)合體所用的篩選方法和工具。另一個(gè)采用基因文庫(kù)連接蛋白和編碼核酸分子的常用方法涉及在細(xì)胞、病毒、噬菌體和酵母的外表面上顯現(xiàn)蛋白。例如通過(guò)將變異蛋白表達(dá)為病毒包被蛋白的一個(gè)成分,蛋白自然與其在病毒顆?;蚣?xì)胞宿主內(nèi)的編碼DNA相連接,這可以容易地進(jìn)行分離。然后純化和分析該DNA。其他在基因文庫(kù)構(gòu)建物內(nèi)連接蛋白和DNA分子的系統(tǒng)也有描述,如國(guó)際專(zhuān)利申請(qǐng)WO93/08278,WO98/37186,和WO99/11785。然而,這些方法具有一些不是最需要的特性。首先,表達(dá)的蛋白和相應(yīng)的cDNA是非共價(jià)結(jié)合的。得到的復(fù)合體不穩(wěn)定或不適合許多篩選步驟。其次,設(shè)計(jì)的顯現(xiàn)系統(tǒng)局限于體外或原核異種表達(dá)系統(tǒng),它們不能提供研究真核肽所必須的蛋白修飾或折疊機(jī)制。不正確折疊或修飾的蛋白經(jīng)常缺乏所需蛋白的天然功能,且通常非常不穩(wěn)定。第三,如果在一個(gè)生物微粒的表面顯現(xiàn),表達(dá)的蛋白經(jīng)常要經(jīng)歷顯現(xiàn)系統(tǒng)固有的不需要的生物選擇。例如,在細(xì)菌性病毒,如噬菌體上顯現(xiàn)蛋白時(shí),表達(dá)的蛋白將組合為細(xì)菌病毒包被蛋白的一部分,并在細(xì)菌病毒的表面上顯現(xiàn)。細(xì)菌病毒結(jié)合的變異蛋白與周?chē)h(huán)境的相互作用以及蛋白整合細(xì)菌病毒被膜,可損害變異蛋白的構(gòu)型和活性。而且,即使蛋白整合到細(xì)菌病毒的衣殼中,顯現(xiàn)的蛋白也可能不具有活性所需的正確的幾何或化學(xué)計(jì)量形式。第四,使用生物微粒構(gòu)建大型表面顯現(xiàn)文庫(kù)需要大量的時(shí)間,且研究者必須小心以確保生物微粒,如病毒或噬菌體,保持存活。第五,已知不同的宿主在進(jìn)行蛋白翻譯時(shí),具有不同的密碼子選擇傾向。例如,在原核系統(tǒng),用于細(xì)菌病毒顯現(xiàn)的表達(dá)系統(tǒng)中,至少有五個(gè)通??稍诓溉閯?dòng)物細(xì)胞中識(shí)別的密碼子在蛋白翻譯過(guò)程中不容易被細(xì)菌所識(shí)別。因此具有這些密碼子的哺乳動(dòng)物序列在細(xì)菌中不能被翻譯或翻譯效率非常低,引起明顯的陰性篩選結(jié)果。鑒于以上的觀點(diǎn),在本領(lǐng)域仍然需要一個(gè)基因文庫(kù)和使用的方法,該文庫(kù)可使一個(gè)變異或未知肽很容易地與其編碼序列相聯(lián)系。本發(fā)明就提供了這樣的文庫(kù)和方法。另外,本發(fā)明可在天然細(xì)胞環(huán)境中鑒定相關(guān)的蛋白,這是采用真核系統(tǒng)的一個(gè)明顯的優(yōu)勢(shì)。從此處提供的發(fā)明描述中,本發(fā)明的這些和其他優(yōu)勢(shì),以及附加的發(fā)明特性是顯而易見(jiàn)的。發(fā)明概述根據(jù)在本文概括的目的,本發(fā)明提供了融合核酸的文庫(kù),每個(gè)融合核酸包含編碼核酸修飾(NAM)酶的核酸,和編碼候選蛋白的核酸。候選蛋白中至少有兩個(gè)是不同的。在一個(gè)優(yōu)選的實(shí)施方案中,NAM酶是一個(gè)Rep蛋白。同樣,優(yōu)選的實(shí)施方案采用了融合核酸,該融合核酸由編碼表現(xiàn)結(jié)構(gòu)的核酸、編碼標(biāo)記物的核酸或編碼靶向序列的核酸組成。在另外一個(gè)實(shí)施方案中,本發(fā)明提供了融合多肽文庫(kù),每個(gè)融合多肽包括NAM酶和候選蛋白,其中候選蛋白中至少有兩個(gè)是不同的。在一個(gè)優(yōu)選的實(shí)施方案中,NAM酶是一個(gè)Rep蛋白。同樣地,優(yōu)選的實(shí)施方案采用融合多肽,該融合多肽由表現(xiàn)結(jié)構(gòu),標(biāo)記物或靶向序列組成。在另一個(gè)實(shí)施方案中,發(fā)明提供了表達(dá)載體的文庫(kù),每一個(gè)表達(dá)載體包括一段融合核酸,該融合核酸由編碼NAM酶的核酸、編碼候選蛋白的核酸和可被NAM酶識(shí)別的酶附著序列(EAS)。候選蛋白中至少有兩個(gè)是不同的。在一個(gè)優(yōu)選的實(shí)施方案中,NAM酶是一個(gè)Rep蛋白。同樣地,優(yōu)選的實(shí)施方案采用融合核酸,該融合核酸由編碼表現(xiàn)結(jié)構(gòu)的核酸、編碼標(biāo)記物的核酸或編碼靶向序列的核酸組成。一個(gè)優(yōu)選的實(shí)施方案也采用包含至少20個(gè)核苷酸的EASs。在一個(gè)另外的實(shí)施方案中,本發(fā)明提供了核酸/蛋白(NAP)結(jié)合物的文庫(kù),每個(gè)結(jié)合物含有包括NAM酶和候選蛋白的融合多肽。NAP結(jié)合物也包括一個(gè)表達(dá)載體,該載體包括一段融合核酸和一段可被NAM酶識(shí)別的酶附著序列(EAS),融合核酸包括含有編碼NAM酶的核酸和編碼候選蛋白的核酸的融合核酸。EAS和NAM酶是共價(jià)結(jié)合的。候選蛋白中至少有兩個(gè)是不同的。在一個(gè)優(yōu)選的實(shí)施方案中,NAM酶是一個(gè)Rep蛋白。同樣地,優(yōu)選的實(shí)施方案采用融合核酸,該融合核酸包括編碼表現(xiàn)結(jié)構(gòu)的核酸、編碼標(biāo)記物的核酸或編碼靶向序列的核酸。一個(gè)優(yōu)選的實(shí)施方案也采用包含至少20個(gè)核苷酸的EASs。本發(fā)明還進(jìn)一步提供了含有本發(fā)明組成成分的宿主細(xì)胞。在另外一個(gè)方面,本發(fā)明提供了真核宿主細(xì)胞文庫(kù),每個(gè)文庫(kù)包含一個(gè)表達(dá)載體,該載體含有一段融合核酸和一個(gè)可被NAM酶識(shí)別的酶附著序列(EAS),所述的融合核酸包括編碼NAM酶的核酸和編碼候選蛋白的核酸。候選蛋白中至少有兩個(gè)是不同的。在一個(gè)優(yōu)選的實(shí)施方案中,NAM酶是一個(gè)Rep蛋白。同樣地,優(yōu)選的實(shí)施方案采用融合核酸,該融合核酸包括編碼表現(xiàn)結(jié)構(gòu)的核酸、編碼標(biāo)記物的核酸或編碼靶向序列的核酸。一個(gè)優(yōu)選的實(shí)施方案也采用包含至少20個(gè)核苷酸的EASs。在另一個(gè)方面,本發(fā)明提供了真核宿主細(xì)胞文庫(kù),每個(gè)文庫(kù)包含一個(gè)核酸/蛋白(NAP)結(jié)合物。每個(gè)NAP包括含有NAM酶和候選蛋白的融合多肽。NAP結(jié)合物也包括一個(gè)表達(dá)載體,該表達(dá)載體包括融合核酸和可被NAM酶識(shí)別的酶附著序列(EAS),所述的融合核酸包括含有編碼NAM酶的核酸和編碼候選蛋白的核酸的融合核酸。EAS和NAM酶是共價(jià)結(jié)合的。候選蛋白中至少有兩個(gè)是不同的。在一個(gè)優(yōu)選的實(shí)施方案中,NAM酶是Rep蛋白。同樣地,優(yōu)選的實(shí)施方案采用融合核酸,該融合核酸包括編碼表現(xiàn)結(jié)構(gòu)的核酸、編碼標(biāo)記物的核酸或編碼靶向序列的核酸。一個(gè)優(yōu)選的實(shí)施方案也采用包含至少20個(gè)核苷酸的EASs。在另外一個(gè)方面,本發(fā)明提供了篩選方法,它包括將一個(gè)NAP結(jié)合物文庫(kù)加入到至少一個(gè)靶分子上,并確定NAP結(jié)合物與靶目標(biāo)的結(jié)合。在再一個(gè)方面,本發(fā)明提供了篩選方法,它包括提供一個(gè)由至少一個(gè)NAP結(jié)合物組成的宿主真核細(xì)胞文庫(kù),并篩選改變了表現(xiàn)型的宿主細(xì)胞。在另外一個(gè)方面,本發(fā)明提供了篩選方法,它包括提供一個(gè)含有至少一個(gè)表達(dá)載體的真核宿主細(xì)胞文庫(kù),并篩選改變了表現(xiàn)型的宿主細(xì)胞。本發(fā)明進(jìn)一步提供了篩選方法,它包括在產(chǎn)生一個(gè)融合多肽的條件下提供一個(gè)包括至少一個(gè)表達(dá)載體的真核宿主細(xì)胞文庫(kù),其中候選蛋白至少有兩個(gè)是不同的。該方法進(jìn)一步包括溶解細(xì)胞,其中所述的EAS和NAM酶以共價(jià)鍵結(jié)合形成一個(gè)NAP結(jié)合物。加入一個(gè)靶分子并測(cè)定靶分子與NAP結(jié)合物的結(jié)合。圖1描述了從腺伴隨病毒2中分離的Rep78的核苷酸序列。圖2描述了從腺伴隨病毒2中分離的Rep78的氨基酸序列。圖3描述了從腺伴隨病毒2中分離的主包被蛋白A的核苷酸序列。圖4描述了從腺伴隨病毒2中分離的主包被蛋白A的氨基酸序列。圖5描述了從腺伴隨病毒4中分離的Rep蛋白的核苷酸序列。圖6描述了從腺伴隨病毒4中分離的Rep蛋白的氨基酸序列。圖7描述了從腺伴隨病毒3B中分離的Rep78的核苷酸序列。圖8描述了從腺伴隨病毒3B中分離的Rep78的氨基酸序列。圖9描述了從腺伴隨病毒3中分離的非結(jié)構(gòu)蛋白的核苷酸序列。圖10描述了從腺伴隨病毒3中分離的非結(jié)構(gòu)蛋白的氨基酸序列。圖11描述了從腺伴隨病毒1中分離的非結(jié)構(gòu)蛋白的核苷酸序列。圖12描述了從腺伴隨病毒1中分離的非結(jié)構(gòu)蛋白的氨基酸序列。圖13描述了從腺伴隨病毒6中分離的Rep78的核苷酸序列。圖14描述了從腺伴隨病毒6中分離的Rep78的氨基酸序列。圖15描述了從腺伴隨病毒2中分離的Rep68的核苷酸序列。圖16描述了從腺伴隨病毒2中分離的Rep68的氨基酸序列。圖17描述了從腺伴隨病毒2中分離的主包被蛋白A’(alt.)的核苷酸序列。圖18描述了從腺伴隨病毒2中分離的主包被蛋白A’(alt.)的氨基酸序列。圖19描述了從腺伴隨病毒2中分離的主包被蛋白A”(alt.)的核苷酸序列。圖20描述了從腺伴隨病毒2中分離的主包被蛋白A”(alt.)的氨基酸序列。圖21描述了從腺伴隨病毒5中分離的一個(gè)Rep蛋白的核苷酸序列。圖22描述了從腺伴隨病毒5中分離的一個(gè)Rep蛋白的氨基酸序列。圖23描述了從腺伴隨病毒2中分離的主包被蛋白Aa(alt.)的核苷酸序列。圖24描述了從腺伴隨病毒2中分離的主包被蛋白Aa(alt.)的氨基酸序列。圖25描述了從Barbarie鴨細(xì)小病毒中分離的Rep蛋白的核苷酸序列。圖26描述了從Barbarie鴨細(xì)小病毒中分離的Rep蛋白的氨基酸序列。圖27描述了從鵝細(xì)小病毒中分離的Rep蛋白的核苷酸序列。圖28描述了從鵝細(xì)小病毒中分離的Rep蛋白的氨基酸序列。圖29描述了從麝香鴨細(xì)小病毒中分離的NS1的核苷酸序列。圖30描述了從麝香鴨細(xì)小病毒中分離的NS1的氨基酸序列。圖31描述了從鵝細(xì)小病毒中分離的NS1的核苷酸序列。圖32描述了從鵝細(xì)小病毒中分離的NS1的氨基酸序列。圖33描述了從花栗鼠細(xì)小病毒中分離的非結(jié)構(gòu)蛋白1的核苷酸序列。圖34描述了從花栗鼠細(xì)小病毒中分離的非結(jié)構(gòu)蛋白1的氨基酸序列。圖35描述了從豬尾狀獼猴細(xì)小病毒中分離的非結(jié)構(gòu)蛋白的核苷酸序列。圖36描述了從豬尾狀獼猴細(xì)小病毒中分離的非結(jié)構(gòu)蛋白的氨基酸序列。圖37描述了從猿細(xì)小病毒中分離的NS1的核苷酸序列。圖38描述了從猿細(xì)小病毒中分離的NS1蛋白的氨基酸序列。圖39描述了從恒河猴細(xì)小病毒中分離的NS蛋白的核苷酸序列。圖40描述了從恒河猴細(xì)小病毒中分離的NS蛋白的氨基酸序列。圖41描述了從B19病毒中分離的非結(jié)構(gòu)蛋白的核苷酸序列。圖42描述了從B19病毒中分離的非結(jié)構(gòu)蛋白的氨基酸序列。圖43描述了從赤病毒B19中分離的orf1的核苷酸序列。圖44描述了從赤病毒B19中分離的orf1產(chǎn)物的氨基酸序列。圖45描述了從人皰疹病毒6B中分離的U94的核苷酸序列。圖46描述了從人皰疹病毒6B中分離的U94的氨基酸序列。圖47描述了一個(gè)Rep蛋白的酶附著位點(diǎn)。圖48描述了在染色體19上發(fā)現(xiàn)的Rep68和Rep78酶附著位點(diǎn)。圖49A-49N描述了本發(fā)明表達(dá)載體的優(yōu)選實(shí)施方案。發(fā)明詳述近來(lái),可以鑒定與信號(hào)傳導(dǎo)通路和疾病狀態(tài)相關(guān)的蛋白,以及可以影響這些通路和疾病狀態(tài)的化合物的篩選技術(shù)正成為人們研究的焦點(diǎn)。這些技術(shù)中的許多依靠在實(shí)驗(yàn)中,如結(jié)合或功能性實(shí)驗(yàn)中篩選大型文庫(kù),包括人工合成的或天然存在的蛋白類(lèi)或肽類(lèi)。今天面對(duì)高通量篩選技術(shù)的問(wèn)題之一是難以闡明“命中”的鑒定,也就是說(shuō),在許多候選者不存在所需特性的背景下產(chǎn)生所需的效應(yīng)的一個(gè)分子。本發(fā)明是建立一種新的方法,可以迅速和容易的鑒定這些“命中”序列。本發(fā)明依賴(lài)于核酸修飾酶的使用,這些酶特異地與包含編碼它們的序列的核酸分子共價(jià)結(jié)合。目標(biāo)蛋白(如,被篩選的或者與疾病相關(guān)蛋白結(jié)合或有表現(xiàn)型效應(yīng)的候選物)與核酸修飾(NAM)酶融合(直接地或間接地,如下所概述)。NAM酶通過(guò)共價(jià)將其自身與相應(yīng)的NAM附著序列結(jié)合(稱(chēng)為酶附著序列(EAS))。因此,通過(guò)使用由NAM酶編碼區(qū)和候選蛋白和NAM酶附著序列組成的載體,候選蛋白可以通過(guò)共價(jià)鍵連接到在翻譯中編碼它的核酸上。因此,在篩選后,具有所需特性的候選物可以采用多種方法,如PCR擴(kuò)增,被迅速地分離。這可促使快速鑒定有用的候選蛋白,并得以進(jìn)行快速篩選和確認(rèn)。因此,本發(fā)明提供了含有編碼融合核酸的核酸序列的核酸分子文庫(kù),該融合核酸編碼一個(gè)核酸修飾酶和一個(gè)候選蛋白。對(duì)于“核酸”或“寡核酸”或在此語(yǔ)法等同者是指至少兩個(gè)核苷共價(jià)地結(jié)合在一起。本發(fā)明的核酸一般含有磷酸二酯鍵,雖然在有些時(shí)候也包括核酸類(lèi)似物,這樣可能有替換的主鏈,特別是當(dāng)靶分子是核酸時(shí),包括例如,磷酰胺(Beaucage等人,四面體(Tetrahedron)49(10)1925(1993)和其中文獻(xiàn);Letsinger,有機(jī)化學(xué)雜志(J.Org.Chem.)353800(1970);Sprinzl等人,歐洲生物化學(xué)雜志(Eur.J.Biochem.)81579(1977);Letsinger等人,核酸研究(Nucl.AcidsRes.)143487(1986);Sawai等人,Chem.Lett.805(1984),Letsinger等人,J.Am.Chem.Soc.1104470(1988);和Pauwels等人,ChemicaScripta26141(1986))、硫代磷酸酯(Mag等人,核酸研究(NucleicAcidsRes.)191437(1991);和美國(guó)專(zhuān)利第5,644,048)、二硫代磷-酸酯(Briu等人,J.Am.Chem.Soc.1112321(1989))、O-甲基磷酰胺聯(lián)合(見(jiàn)Eckstein,寡核苷酸和類(lèi)似物一個(gè)實(shí)用的方法,牛津大學(xué)出版社)、和肽核酸主鏈和聯(lián)合(見(jiàn)Egholm,J.Am.Chem.Soc.1141895(1992);Meier等人,Chem.Int.Ed.Engl.311008(1992);Nielsen,自然,365566(1993);Carlsson等人,自然380207(1996),所有這些均加入作為參考)。其他核酸類(lèi)似物包括那些具有正性主鏈(positivebackbones)(Denpcy等人,美國(guó)國(guó)家科學(xué)院院刊(Proc.Natl.Acad.Sci.USA)926097(1995)、非離子性主鏈(美國(guó)專(zhuān)利第5,386,023,5,637,684,5,602,240,5,216,141和4,469,863;Kiedrowshi等人,Angew.Chem.Intl.Ed.English30423(1991);Letsinger等人,美國(guó)化學(xué)社會(huì)生物學(xué)雜志(J.Am.Chem.Soc.)1104470(1988);Letsinger等人,核苷和核苷酸(Nucleoside&Nucleotide)131597(1994);第2和3章,ASC系列討論會(huì)580,“反義研究中的碳水化合物修飾”,Y.S.Sanghui和P.DanCook編輯;Mesmaeker等人,生物有機(jī)化學(xué)和醫(yī)學(xué)化學(xué)手冊(cè)(Bioorganic&MedicinalChem.Lett.)4395(1994);Jeffs等人,分子生物學(xué)核磁共振雜志(J.BiomolecularNMR)3417(1994);TetrahedronLett.37743(1996))和非核糖主干,包括那些在美國(guó)專(zhuān)利第5,235,033和5,034,506,和第6和第7章,ASC系列討論會(huì)580,“反義研究中的碳水化合物修飾”,Y.S.Sanghui和P.DanCook編輯.中所描述的。含有一個(gè)或多個(gè)碳環(huán)糖的核酸也包括在核酸定義中(見(jiàn)Jenkins等人,化學(xué)社會(huì)生物學(xué)進(jìn)展(Chem.Soc.Rev.)(1995)169-176頁(yè))。有幾個(gè)核酸類(lèi)似物在Rawls,C&E新聞,1997年6月2日,第35頁(yè)中有描述。所有這些文獻(xiàn)在此特別加入作為參考。可以對(duì)這些核糖-磷酸主鏈進(jìn)行修飾以促進(jìn)其他成分的加入,如標(biāo)記物,或增加這些分子在生理環(huán)境中的穩(wěn)定性和半衰期。正如本領(lǐng)域技術(shù)人員可以理解的那樣,所有這些核酸類(lèi)似物都可發(fā)現(xiàn)應(yīng)用在本發(fā)明中。另外,可以制備天然存在的核酸和類(lèi)似物的混合物,或可選擇地制備不同核酸類(lèi)似物的混合物,和天然存在的核酸和類(lèi)似物的混合物。如指定的,核酸可以是單鏈或雙鏈,或含有指定的兩個(gè)雙鏈或單-鏈序列的一部分。核酸可以是DNA,包括基因組和cDNA,RNA或一個(gè)雜交物,其中核酸含有任何脫氧核糖和核糖核苷酸的組合,和任何堿基的組合,包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鳥(niǎo)嘌呤、次黃苷、xathanine(黃嘌呤)、hypoxathanine(次黃嘌呤)、異胞嘧啶、異鳥(niǎo)嘌呤等等。如在此所使用的,術(shù)語(yǔ)“核苷”包括核苷酸和核苷和核苷酸類(lèi)似物,以及修飾的核苷如氨基修飾的核苷。另外,“核苷”包括非天然存在的類(lèi)似結(jié)構(gòu)。因此,例如一個(gè)肽類(lèi)核酸的單一單位,每個(gè)含有一個(gè)堿基,在此都被稱(chēng)為核苷。本發(fā)明提供了含有編碼融合核酸的核酸序列的核酸分子文庫(kù)。在此的“融合核酸”是指聯(lián)系在一起的一批核酸成分(如,肽編碼序列)。盡管不需要,融合核酸仍?xún)?yōu)選編碼融合多肽。在此“融合多肽”或“融合肽”或語(yǔ)法上的等同成分是指由一批蛋白成分組成的蛋白質(zhì),這些成分一般在天然狀態(tài)下是未連接的,它們通過(guò)各自的氨基和/或羧基末端經(jīng)肽鍵連接以形成一個(gè)單一的連續(xù)的多肽。本文中的一批指至少兩個(gè),優(yōu)選的實(shí)施方案一般使用兩個(gè)成分??梢岳斫獾氖堑鞍壮煞挚梢灾苯舆B接或通過(guò)一個(gè)如下所述的肽連接子/間隔基連接。另外,應(yīng)該注意的是在一些實(shí)施方案中,正如以下會(huì)詳細(xì)描述的那樣,融合核酸可以編碼不融合的蛋白成分;例如,盡管一般編碼每個(gè)成分的核酸是融合的,但融合核酸可能包含一個(gè)被去除的內(nèi)含子,留下兩個(gè)不相關(guān)的蛋白成分。而且,如下面所概述的,也可使用附加的成分,如包括靶向序列的融合配體等等。融合核酸編碼核酸修飾酶(NAM)和候選蛋白。在此的“核酸修飾酶”或“NAM酶”是指使用核酸,特別是DNA作為底物并將其自身共價(jià)結(jié)合于核酸酶附著(EA)序列的酶??梢怨矁r(jià)結(jié)合于堿基、核糖部分或磷酸部分。NAM酶包括,但不限于,螺旋酶、拓?fù)洚悩?gòu)酶、聚合酶、旋轉(zhuǎn)酶、重組酶、轉(zhuǎn)座酶、限制酶和核酸酶。如下面所概述的,NAM酶包括天然和非天然的變異體。雖然許多DNA結(jié)合肽是已知的,如那些參與核酸固縮、轉(zhuǎn)錄調(diào)節(jié)、以及類(lèi)似情況的結(jié)合肽,但是優(yōu)選與核酸,即DNA,共價(jià)結(jié)合的酶,特別是參與復(fù)制的肽類(lèi)。一些NAM酶可以與DNA形成共價(jià)連接而不切割DNA。例如,人們相信,參與DNA修復(fù)的酶可以識(shí)別核酸區(qū)域并與之共價(jià)結(jié)合,該核酸區(qū)域可以是雙鏈也可以是單鏈。這種NAM酶適合在融合酶文庫(kù)中使用。但是,最優(yōu)選的是可以切割DNA以形成共價(jià)連接的DNANAM酶,如病毒復(fù)制肽。優(yōu)選地,NAM酶是一個(gè)可以識(shí)別核酸底物的特異序列或構(gòu)型,并發(fā)揮其酶活性使其與核酸底物形成一個(gè)共價(jià)復(fù)合體的蛋白質(zhì)。優(yōu)選地,該酶作用于不同構(gòu)象的核酸,特別是DNA上,包括但不限于單鏈DNA、雙鏈DNA、Z-型DNA,等。合適的NAM酶包括,但不限于,參與復(fù)制的酶如腺伴隨病毒(AAV)的Rep68和Rep78、細(xì)小病毒的NS1和H-1、噬菌體phi-29末端蛋白、55Kd腺病毒蛋白及其衍生物。在一個(gè)優(yōu)選的實(shí)施方案中,NAM酶是一個(gè)Rep蛋白。Rep蛋白包括,但不限于Rep78、Rep68和在相關(guān)病毒中發(fā)現(xiàn)的功能類(lèi)似物。Rep蛋白,包括其功能類(lèi)似物,可從許多來(lái)源中分離,包括細(xì)小病毒、赤病毒、皰疹病毒和其他相關(guān)病毒。本領(lǐng)域普通技術(shù)人員可以理解,天然的Rep蛋白可以通過(guò)本領(lǐng)域已知的技術(shù)進(jìn)行誘變和設(shè)計(jì),以便提高其活性或降低其潛在的毒性。這樣試驗(yàn)性的改良可以與其相應(yīng)EAS的天然或變異體一起進(jìn)行。優(yōu)選的Rep蛋白之一是AAVRep蛋白。腺伴隨病毒(AAV)Rep蛋白由病毒基因組的左側(cè)開(kāi)放閱讀框編碼。AAVRep蛋白,如Rep68和Rep78,調(diào)節(jié)AAV的轉(zhuǎn)錄、激活A(yù)AV的復(fù)制、并顯示抑制異源性啟動(dòng)子的轉(zhuǎn)錄(Chiorini等人,病毒學(xué)雜志(J.Virol.),68(2),797-804(1994),在此全部加入作為參考)。Rep68和Rep78蛋白,部分通過(guò)共價(jià)附著于AAV末端反向重復(fù)序列而起作用(Prasad等人,病毒學(xué),229,183-192(1997);Prasad等人,病毒學(xué),214360(1995);兩個(gè)文獻(xiàn)在此全部加入作為參考)。這些Rep蛋白通過(guò)AAV啟始點(diǎn)的一個(gè)位點(diǎn)特異性和鏈特異性?xún)?nèi)切酶切口在末端分解位點(diǎn)發(fā)揮作用,然后通過(guò)經(jīng)過(guò)一個(gè)推斷的酪氨酸連接與切口部位的5’末端共價(jià)結(jié)合。Rep68和Rep78分別來(lái)源于轉(zhuǎn)錄物的不同拼接。Rep68的核酸序列見(jiàn)圖15,其蛋白序列見(jiàn)圖16;從不同來(lái)源分離的Rep78蛋白的核酸和蛋白序列見(jiàn)圖1,2,7,8,13和14。如在下面進(jìn)一步概述的,Rep蛋白的功能性片段、變異體和同源物也包括在Rep蛋白的定義中;在這種情況下,變異體優(yōu)選包括具有核酸結(jié)合活性和內(nèi)切酶活性的變異體。下面討論的Rep68和Rep78的相應(yīng)酶附著位點(diǎn)見(jiàn)圖47和圖48,并在實(shí)施例1-中闡明。在一個(gè)優(yōu)選的實(shí)施方案中,NAM酶是NS1。NS1是細(xì)小病毒中的非結(jié)構(gòu)蛋白,是Rep78的功能同源物,也與DNA共價(jià)結(jié)合(Cotmore等人,病毒學(xué)雜志(J.Virol.),62(3),851-860(1998),在此特別加入作為參考)。從不同來(lái)源中分離的NS1蛋白的核苷酸和氨基酸序列見(jiàn)圖9-12、29-34、37和38。如在下面進(jìn)一步概述的,NS1蛋白的片段和變異體也包括在NS1蛋白的定義中。在一個(gè)優(yōu)選的實(shí)施方案中,NAM酶是細(xì)小病毒H-1蛋白,已知它也可與DNA形成共價(jià)連接(見(jiàn),如,Tseng等人,美國(guó)國(guó)家科學(xué)院院刊(Proc.Natl.Acad.Sci.USA),76(11),5539-5543(1979),在此特別加入作為參考)。如在下面進(jìn)一步概述的,H-1蛋白的片段和變異體也包括在H-1蛋白的定義中。在一個(gè)優(yōu)選的實(shí)施方案中,NAM酶是噬菌體phi-29末端蛋白,已知它也可與DNA形成共價(jià)連接(見(jiàn),如,Germendia等人,核酸研究(NucleicAcidResearch),16(3),5727-5740(1988),在此特別加入作為參考)。如在下面進(jìn)一步概述的,phi-29蛋白的片段和變異體也包括在phi-29蛋白的定義中。NAM酶也可以是腺病毒55Kd(a55)蛋白,已知它也可與DNA形成共價(jià)連接;見(jiàn)Desiderio和Kelly,分子生物學(xué)雜志(J.Mol.Biol.),98,319-337(1981),在此特別加入作為參考。如在下面進(jìn)一步概述的,a55蛋白的片段和變異體也包括在a55蛋白的定義中。適合用做NAM酶的其他Rep同源物的核酸序列和氨基酸序列見(jiàn)圖3-6、17-28、35、36和39-46。一些DNA結(jié)合酶在物理或化學(xué)刺激下形成共價(jià)連接,例如,紫外線誘導(dǎo)的DNA和連接蛋白間的交聯(lián)、或與喜樹(shù)堿(CPT)相關(guān)的化學(xué)誘導(dǎo)的DNA-拓?fù)洚悩?gòu)酶I共價(jià)復(fù)合體的捕獲(如,Hertzberg等人,生物化學(xué)雜志(J.Biol.Chem.),265,19287-19295(1990))。形成誘導(dǎo)的共價(jià)連接的NAM酶適用于本發(fā)明的一些實(shí)施方案。本發(fā)明NAM酶的定義中也包括保留生物學(xué)活性(如共價(jià)結(jié)合核酸分子能力)的氨基酸序列變異體。這些變異體屬于三類(lèi)中的一類(lèi)或多類(lèi)替換、插入或缺失(如,片段)變異體。這些變異體通??稍诰幋aNAM-蛋白的DNA中,通過(guò)核苷酸的位點(diǎn)特異性誘變來(lái)制備,采用序列盒或PCR誘變或其他本領(lǐng)域熟知的技術(shù),產(chǎn)生編碼變異體的DNA,之后在這里概述的細(xì)胞培養(yǎng)物中表達(dá)重組DNA。但是具有達(dá)到大約100-150個(gè)殘基的變異NAM蛋白片段可以采用已建立的技術(shù)通過(guò)體外合成或肽連接來(lái)制備。氨基酸序列變異體通過(guò)預(yù)先確定的變異的特性來(lái)定性,該特性將其與天然存在的NAM蛋白氨基酸序列的等位基因或種間變異區(qū)分開(kāi)。變異體一般具有與天然存在的類(lèi)似物相同性質(zhì)的生物活性,盡管如下面將更詳細(xì)概述的,也可以選擇具有修飾特性的變異體。雖然引入一個(gè)氨基酸序列變異體的位點(diǎn)或區(qū)域是預(yù)先確定的,突變作用本身不需要預(yù)先確定。例如,為了優(yōu)化在一個(gè)給定位點(diǎn)進(jìn)行突變,在目標(biāo)密碼子或區(qū)域可以進(jìn)行隨機(jī)誘變,并為所需活性的最佳組合篩選表達(dá)的NAM變異體。在已知序列DNA的預(yù)定位點(diǎn)上形成替換突變體的技術(shù)是公知的,如M13引物誘變和PCR誘變。篩選突變體、變異體、同源物等,可以應(yīng)用常規(guī)的方法如,結(jié)合實(shí)驗(yàn)、親合性實(shí)驗(yàn)、肽構(gòu)型圖譜等,采用NAM蛋白活性的測(cè)定來(lái)完成。氨基酸替換一般是單一的殘基;插入通常以大約1到20個(gè)氨基酸的順序,盡管也可接受較大的插入物。缺失的范圍是大約1到20個(gè)殘基,盡管在某些情況下,缺失可以更大一些,如當(dāng)要去除非必需區(qū)域時(shí)??梢允褂锰鎿Q、缺失、插入或它們?nèi)魏蔚慕M合來(lái)得到最終的衍生物。一般這些改變只在幾個(gè)氨基酸上進(jìn)行以使分子的改變最小化。但是在特定的情況下也可耐受更大的改變。當(dāng)需要NAM蛋白特性發(fā)生小的變化時(shí),一般根據(jù)下表進(jìn)行替換表1原始?xì)埢痉缎蕴鎿QAlaSerArgLysAsnGln,HisAspGluCysSerGlnAsnGluAspGlyProHisAsn,GlnIleLeu,ValLeuIle,ValLysArg,Gln,GluMetLeu,IlePheSerMet,Leu,TyrThrThrTrpSerTyrTyrValTrp,PheIle,Leu在功能或免疫特性方面的實(shí)質(zhì)性改變是通過(guò)選擇保守程度不如表1所示的替代物來(lái)實(shí)現(xiàn)的。例如,替代物可能更明顯地影響變更區(qū)域的多肽主鏈結(jié)構(gòu),例如,α-螺旋或β-片層結(jié)構(gòu);靶位點(diǎn)分子的電荷或疏水性;或側(cè)鏈的多少。一般期望在多肽特性上產(chǎn)生最大變化的替代是(a)一個(gè)親水殘基,如絲氨酰或蘇氨?;?,替代(或被替代為)一個(gè)疏水殘基,如亮氨酰、異亮氨酰、苯丙氨酰、纈氨?;虮滨;?;(b)一個(gè)半胱氨酸或脯氨酸替代(或被替代為)任何其他的殘基;(c)一個(gè)具有正電側(cè)鏈的殘基,如賴(lài)氨酰、精氨酰或組氨?;娲?或被替代為)一個(gè)負(fù)電殘基,如谷氨?;蛱於滨;?;或(d)一個(gè)具有體積較大側(cè)鏈的殘基,如苯丙氨酸,替代(或被替代為)一個(gè)不具有側(cè)鏈的殘基,如甘氨酸。一般變異體可發(fā)揮如天然存在的類(lèi)似物同樣性質(zhì)的生物活性,盡管變異體也按照需要被選擇來(lái)修飾NAM蛋白的特性??晒┻x擇的是,可以對(duì)變異體進(jìn)行設(shè)計(jì),以改變NAM蛋白的生物活性。例如,糖基化-位點(diǎn)可能改變或被去除。同樣地,可以在內(nèi)切酶區(qū)域或核酸識(shí)別位點(diǎn)內(nèi)進(jìn)行功能性誘變。而且,可以去除非必需區(qū)域以形成NAM酶的片段。另外,一些實(shí)施方案采用多聯(lián)體(concatameric)構(gòu)建物來(lái)影響多價(jià)性,并增加結(jié)合動(dòng)力學(xué)或效率。例如,可以制備含有多個(gè)NAM編碼區(qū)或多個(gè)EASs的構(gòu)建物。NAM蛋白的定義中也包括其他NAM同源物,以及從包括病毒的其他微生物中來(lái)源的NAM蛋白,它們可以用本領(lǐng)域已知的方法進(jìn)行克隆和表達(dá)。因此,探針或變性聚合酶鏈?zhǔn)椒磻?yīng)(PCR)引物序列可以用來(lái)發(fā)現(xiàn)其他相關(guān)的NAM蛋白。正如本領(lǐng)域技術(shù)人員可以認(rèn)可的那樣,特別有用的探針和/或PCR引物序列包括NAM核酸序列的獨(dú)特區(qū)域。如本領(lǐng)域中通常已知的,優(yōu)選的PCR引物長(zhǎng)度大約為15到35個(gè)核苷酸,優(yōu)選大約20至大30個(gè)核苷酸,按需要可以含有次黃苷。PCR反應(yīng)的條件在本領(lǐng)域是已知的。除了編碼NAM酶的核酸,本發(fā)明的融合核酸也編碼候選蛋白質(zhì)。在此的“蛋白質(zhì)”是指至少兩個(gè)共價(jià)結(jié)合的氨基酸,包括蛋白質(zhì)、多肽、寡肽和肽類(lèi)。蛋白質(zhì)可能由天然存在的氨基酸和肽鍵、或合成的擬肽(peptidomimetic)結(jié)構(gòu)組成,當(dāng)靶分子為蛋白時(shí)后者特別有用。因此,如在此所用的“氨基酸”或“肽殘基”,是指天然存在的和合成的氨基酸。例如,同型苯丙氨酸、瓜氨酸和noreleucine是本發(fā)明目的所考慮的氨基酸?!鞍被帷币舶▉啺被釟埢?,如脯氨酸和羥脯氨酸。側(cè)鏈可能是(R)或(S)構(gòu)型。在優(yōu)選的實(shí)施方案中,氨基酸是(S)或L-構(gòu)型。如果使用非天然存在的側(cè)鏈,就可以采用非氨基酸取代,例如,以避免或延緩體外降解。也可以加入化學(xué)保護(hù)基團(tuán)或其他化學(xué)取代基。因此,本發(fā)明可以發(fā)現(xiàn)用于基于模板的合成系統(tǒng)。在此的“候選蛋白”是指在本發(fā)明的測(cè)定中要被檢測(cè)結(jié)合、聯(lián)系或效應(yīng)的蛋白,包括體外(如,無(wú)細(xì)胞系統(tǒng))或來(lái)自體內(nèi)(在細(xì)胞內(nèi))。候選肽具有至少一個(gè)所需的目標(biāo)特性。所需的目標(biāo)特性將取決于本發(fā)明的特殊實(shí)施方案。“目標(biāo)特性”是指關(guān)注的活性。任選地,目標(biāo)特性直接或間接地用于鑒定一個(gè)融合蛋白-表達(dá)載體結(jié)合物亞群,因此可以從融合蛋白文庫(kù)中回收所需的NAP結(jié)合物。目標(biāo)特性包括,如,介導(dǎo)編碼的顯現(xiàn)肽與配體結(jié)合的能力,酶活性,模擬一個(gè)給定因子的能力,-改變細(xì)胞生理學(xué)、結(jié)構(gòu)或其他物理特性,包括但不限于,肽類(lèi)的電磁性或分光性能,的能力。如下面所概述的,在融合物中一般使用候選蛋白文庫(kù)。如本領(lǐng)域技術(shù)人員可以理解的那樣,候選蛋白文庫(kù)的來(lái)源可以特別地依系統(tǒng)最終用途的不同而異。在一個(gè)優(yōu)選的實(shí)施方案中,候選蛋白來(lái)源于cDNA文庫(kù)。cDNA文庫(kù)可來(lái)源于許多不同的細(xì)胞,特別是在此所概述的宿主細(xì)胞,并包括從真核和原核細(xì)胞、病毒、用病毒或其他病原體感染的細(xì)胞、基因工程改造的細(xì)胞等產(chǎn)生的cDNA文庫(kù)。如下面所概述的優(yōu)選的實(shí)施方案,包括從不同個(gè)體,如不同的患者,特別是人類(lèi)患者中制備的cDNA文庫(kù)。cDNA文庫(kù)可以是完全的文庫(kù)或部分文庫(kù)。而且,候選蛋白文庫(kù)可以來(lái)自單一或多個(gè)cDNA來(lái)源;也就是說(shuō),從多個(gè)細(xì)胞類(lèi)型或多個(gè)個(gè)體或多種病原體來(lái)源的cDNA可以在篩選中組合。cDNA文庫(kù)可能使用整個(gè)cDNA構(gòu)建物或分級(jí)分離構(gòu)建物,包括隨機(jī)或有目的的分級(jí)分離。適當(dāng)?shù)姆旨?jí)分離技術(shù)包括酶性、化學(xué)或機(jī)械性的分級(jí)分離。在一個(gè)優(yōu)選的實(shí)施方案中,候選蛋白來(lái)源于基因組文庫(kù)。如上所述,基因組文庫(kù)可來(lái)源于任何數(shù)目的不同的細(xì)胞,特別是那些在此概述的宿主細(xì)胞,并包括從真核和原核細(xì)胞、病毒、病毒或其他病原體感染的細(xì)胞、基因工程改造的細(xì)胞、等產(chǎn)生的基因組文庫(kù)。如下面概述的優(yōu)選實(shí)施方案,包括從不同個(gè)體如不同的患者,特別是人類(lèi)患者中制備的基因組文庫(kù)?;蚪M文庫(kù)可能是完全的文庫(kù)或部分的文庫(kù)。而且,候選蛋白文庫(kù)可能來(lái)自單一或多種基因組來(lái)源;也就是說(shuō),來(lái)源于多個(gè)細(xì)胞類(lèi)型或多個(gè)個(gè)體或多個(gè)病原體的基因組DNA可以在篩選中組合?;蚪M文庫(kù)可使用整個(gè)基因組構(gòu)建物或分級(jí)分離構(gòu)建物,包括隨機(jī)或有目的的分級(jí)分離。適合的分級(jí)分離技術(shù)包括酶性的、化學(xué)或機(jī)械的分級(jí)分離。在這點(diǎn)上,在一個(gè)基因文庫(kù)載體中NAM酶與來(lái)源于基因組DNA的核酸的結(jié)合具有新穎性。因此,本發(fā)明進(jìn)一步提供了一個(gè)分離的和純化的核酸分子,該分子由編碼NAM酶的核酸序列組成,該NAM酶與從基因組DNA中分離的一個(gè)核酸序列融合。這樣的一個(gè)分離的和純化的核酸分子在這里所述的本發(fā)明方法中特別有用。優(yōu)選地,該分離的和純化的核酸分子進(jìn)一步由位于編碼NAM酶的核酸序列和基因組DNA之間的一個(gè)拼接供體序列或拼接受體序列組成。拼接供體和/或拼接受體序列插入到分離的和純化的核酸序列中,可形成編碼NAM酶的轉(zhuǎn)錄體和基因組DNA片段的外顯子。以前的技術(shù)方法沒(méi)有意識(shí)到將基因組DNA有效地連接到一個(gè)NAM酶上,使基因組DNA產(chǎn)物可以與編碼它的核酸分子聯(lián)系在一起的可能性。本領(lǐng)域技術(shù)人員可以理解合適的調(diào)節(jié)序列也可以整合入分離的和純化的核酸分子中。在一個(gè)優(yōu)選的實(shí)施方案中,本發(fā)明也提供了確定基因組DNA中開(kāi)放閱讀框的方法。在該實(shí)施方案中,由基因組核酸編碼的候選蛋白優(yōu)選直接與NAM酶的N末端而不是C末端融合。因此,如果產(chǎn)生了一個(gè)功能性的NAM酶,那么基因組DNA就是融合在正確的閱讀框中。在使用標(biāo)記物時(shí)這一點(diǎn)尤其有用。另外,該文庫(kù)也可采用已知的技術(shù)(暴露于誘變劑、易錯(cuò)PCR、易錯(cuò)轉(zhuǎn)錄、組合拼接(如cre-lox重組))隨后被誘變。用這種方法可制備原核和真核蛋白以在這里描述的系統(tǒng)中篩選。在這個(gè)實(shí)施方案中特別優(yōu)選的是細(xì)菌、真菌、病毒、植物和動(dòng)物(如哺乳動(dòng)物)蛋白的文庫(kù),優(yōu)選后者,特別優(yōu)選人類(lèi)的蛋白。候選蛋白在大小上可以不同。如果是cDNA或基因組文庫(kù),蛋白可從20或30個(gè)氨基酸到上千個(gè)氨基酸,優(yōu)選從大約50到1000(如75、150、350、750或更多),特別優(yōu)選從100到500(如200、300或400)。當(dāng)候選蛋白是肽類(lèi)時(shí),肽的大小從大約3到50個(gè)氨基酸,優(yōu)選從大約5到20個(gè)氨基酸,特別優(yōu)選從大約7到15個(gè)氨基酸。肽類(lèi)可能是如上所述的天然存在的蛋白的水解物、隨機(jī)肽、或“有偏差的”隨機(jī)肽。“隨機(jī)的”或在此的語(yǔ)法等同者是指每個(gè)核酸和肽分別主要由隨機(jī)的核苷酸和氨基酸組成。因?yàn)橐话氵@些隨機(jī)的肽(或下面討論的核酸)是化學(xué)合成的,因此它們可能在任何位置插入任何核苷酸或氨基酸。可以設(shè)計(jì)合成過(guò)程以產(chǎn)生隨機(jī)的蛋白或核酸,使得在序列長(zhǎng)度內(nèi)形成所有或大多數(shù)可能的組合,因此形成一個(gè)隨機(jī)的候選生物活性蛋白質(zhì)樣物質(zhì)文庫(kù)。在一個(gè)優(yōu)選的實(shí)施方案中,候選蛋白文庫(kù)與NAM酶融合,文庫(kù)的每個(gè)成員都包括一個(gè)不同的候選蛋白。但是,如本領(lǐng)域技術(shù)人員可以理解的那樣,文庫(kù)的不同成員可能是再生或復(fù)制的,導(dǎo)致某些文庫(kù)成員是相同的。文庫(kù)應(yīng)該提供結(jié)構(gòu)上足夠多樣的表達(dá)產(chǎn)物群,引起從概率論上足夠范圍的細(xì)胞反應(yīng),以提供一個(gè)或多個(gè)具有所需效應(yīng)的細(xì)胞。因此,一個(gè)相互作用文庫(kù)必須足夠大以便至少其成員之一具有可以使其與某些分子親合的結(jié)構(gòu),這些分子包括靶蛋白和非蛋白、或其他在目的測(cè)定中是必需的,或具有有效活性的因子。雖然很難測(cè)量一個(gè)相互作用文庫(kù)所需的絕對(duì)大小,其免疫反應(yīng)屬性提供了一個(gè)線索107-108種不同的抗體可提供至少一種組合,該組合與一個(gè)微生物可接觸的大多數(shù)潛在抗原具有足夠的親合性反應(yīng)。已公開(kāi)的體外篩選技術(shù)表明一個(gè)大小為107至108的文庫(kù)足以發(fā)現(xiàn)與靶分子具有親合性的結(jié)構(gòu)。一個(gè)長(zhǎng)度為7到20個(gè)氨基酸的肽的所有組合文庫(kù)具有編碼207(109)至2020的潛力。因此,擁有107至108的文庫(kù),本發(fā)明的方法在理論上可以使7個(gè)氨基酸獲得全部相互作用文庫(kù)的“能夠?qū)嶋H應(yīng)用的”子集,和2020文庫(kù)形狀的子集。因此,在一個(gè)優(yōu)選的實(shí)施方案中,至少106,優(yōu)選至少107,更優(yōu)選至少108和最優(yōu)選至少109個(gè)不同的表達(dá)產(chǎn)物同時(shí)在受試方法中進(jìn)行分析,盡管不太復(fù)雜(如,102、103、104或105個(gè)不同的表達(dá)產(chǎn)物)或更復(fù)雜(如1010、1011或1012個(gè)不同的表達(dá)產(chǎn)物)的文庫(kù)也適用于本發(fā)明。優(yōu)選的方法使文庫(kù)的大小和多樣性達(dá)到最大。在由寡核苷酸合成編碼的任何文庫(kù)系統(tǒng)中,很難對(duì)最后將插入到肽結(jié)構(gòu)中的密碼子進(jìn)行完全的控制。對(duì)于編碼終止信號(hào)的密碼子(TAA、TGA、TAG)尤其如此。在用NNN作為隨機(jī)區(qū)進(jìn)行的合成中,密碼子有3/64或4.69%的機(jī)會(huì)是終止密碼子。因此,在一個(gè)10個(gè)殘基的肽中,很有可能46.7%的肽將過(guò)早終止。減少這種情況的一個(gè)方法是具有編碼為NNK的隨機(jī)殘基,其中K=T或G。這就可以對(duì)所有可能的氨基酸(輕度改變其相對(duì)表達(dá)式)進(jìn)行編碼,但很重要的是它防止了兩個(gè)終止殘基TAA和TGA的編碼。因此,編碼一個(gè)10個(gè)氨基酸肽的文庫(kù)將有15.6%的機(jī)率過(guò)早終止。可選擇的是,也可將候選蛋白與NAM酶的C末端融合,盡管在有些時(shí)候,與N末端的融合意味著過(guò)早終止的蛋白導(dǎo)致NAM酶缺乏,使這些樣品在檢測(cè)中消失。在一個(gè)實(shí)施方案中,文庫(kù)是完全隨機(jī)化的,在任何位置沒(méi)有序列優(yōu)先或恒定。在一個(gè)優(yōu)選的實(shí)施方案中,文庫(kù)是有偏離的。也就是說(shuō),序列中的一些位置是保持恒定的,或選自有限數(shù)目的可能性。例如,-在一個(gè)優(yōu)選的實(shí)施方案中,核苷酸或氨基酸殘基在限定的類(lèi)型中是隨機(jī)化的,如疏水氨基酸、親水殘基、空間偏離(小或大)殘基,為交聯(lián)傾向形成半胱氨酸,為SH-3區(qū)、PDZ區(qū)形成脯氨酸,為磷酸化位點(diǎn)形成絲氨酸、蘇氨酸、酪氨酸或組氨酸等,或?qū)︵堰实?。在一個(gè)優(yōu)選的實(shí)施方案中,偏離是朝向與已知分子類(lèi)型相互作用的肽類(lèi)或核酸的。例如,當(dāng)候選蛋白是一個(gè)肽時(shí),已知許多細(xì)胞內(nèi)的信號(hào)傳導(dǎo)是經(jīng)多肽的短區(qū)與其他多肽的小肽區(qū)域相互作用而實(shí)現(xiàn)的。例如,以前已經(jīng)顯示一個(gè)來(lái)源于HIV-1被膜胞漿域的短區(qū)可以阻斷細(xì)胞鈣調(diào)蛋白的作用。與來(lái)自黃蜂的黃蜂毒素同源的Fas胞漿域的區(qū)域可以限定在一個(gè)短肽區(qū),具有誘導(dǎo)死亡的凋亡或G蛋白誘導(dǎo)功能。爪蟾抗菌肽,來(lái)自爪蟾的天然肽,具有有效的抗腫瘤和抗微生物活性。已經(jīng)表明蛋白激酶C同工酶(βPKC)的短肽片段,可阻斷刺激后βPKC在爪蟾卵細(xì)胞中的核轉(zhuǎn)位。短的SH-3目標(biāo)肽已經(jīng)用做與SH-3蛋白特異結(jié)合的假底物。當(dāng)然這是一個(gè)可獲得的具有生物活性的肽類(lèi)的簡(jiǎn)短列表,因?yàn)樵诖祟I(lǐng)域的文獻(xiàn)非常豐富。因此,許多小肽對(duì)細(xì)胞內(nèi)信號(hào)傳導(dǎo)級(jí)聯(lián)具有潛在活性是有先例的。另外,任何分子數(shù)目的激動(dòng)劑和拮抗劑也可構(gòu)成候選蛋白隨機(jī)化偏離的基礎(chǔ)。因此,許多分子或蛋白結(jié)構(gòu)區(qū)適合作為產(chǎn)生隨機(jī)化偏離候選蛋白的起始點(diǎn)。已知大量的小分子結(jié)構(gòu)區(qū),可以賦有一種普通的功能,結(jié)構(gòu)或親合性。另外,如本專(zhuān)業(yè)可以理解的,弱氨基酸同源性的區(qū)域可能具有強(qiáng)的結(jié)構(gòu)同源性。許多這樣的分子,結(jié)構(gòu)區(qū),和/或相應(yīng)的共有序列是已知的,包括但不限于,SH-2結(jié)構(gòu)區(qū),SH-3結(jié)構(gòu)區(qū),血小板-白細(xì)胞C激酶底物,死亡結(jié)構(gòu)區(qū),蛋白酶切割/識(shí)別點(diǎn),酶抑制劑,酶的底物,Traf等。同樣,已知有許多含有適用于本發(fā)明結(jié)構(gòu)區(qū)的核酸結(jié)合蛋白。例如,已知亮氨酸拉鏈的共有序列。在一個(gè)優(yōu)選的實(shí)施方案中,制備了與偏離的SH-3結(jié)構(gòu)區(qū)結(jié)合的寡核苷酸/肽。SH-3結(jié)構(gòu)區(qū)已經(jīng)顯示可以識(shí)別短的目標(biāo)基序(SH-3結(jié)構(gòu)區(qū)結(jié)合肽),在一個(gè)線性序列中大約10到12個(gè)殘基可以被編碼為與目標(biāo)SH-3結(jié)構(gòu)區(qū)有高親合性的短肽。已經(jīng)提議要獲得SH-3結(jié)構(gòu)區(qū)結(jié)合蛋白的共有序列。因此,在一個(gè)優(yōu)選的實(shí)施方案中,寡核苷/肽用以下偏離制備1.XXXPPXPXX,其中X是一個(gè)隨機(jī)化殘基。2.(在殘基11至-2的位置中)1110987654321MetGlyaa11aa10aa9aa8aa7ArgProLeuProProhyd0-1-2ProhydhydGlyGlyProProSTOPatgggcnnknnknnknnknnkagacctctgcctccasbkgggsbksbkggaggcccacctTAA1。在該實(shí)施方案中,提示N末端旁側(cè)區(qū)域在結(jié)合親合性上有最大的效應(yīng),因此是完全隨機(jī)化的。“Hyd”表示偏離朝向一個(gè)疏水殘基,如-Val,Ala,Gly,Leu,Pro,Arg。為了編碼一個(gè)疏水的偏離殘基,采用“sbk”密碼子偏離結(jié)構(gòu)。在遺傳編碼中檢查密碼子將確保其通常編碼疏水殘基。s=g、c;b=t、g、c;v=a、g、c;m=a、c;k=t、g;n=a、t、g、c。因此,在一個(gè)優(yōu)選的實(shí)施方案中,候選蛋白是一個(gè)結(jié)構(gòu)性標(biāo)記,它可以分離具有該結(jié)構(gòu)的目標(biāo)蛋白。也就是,對(duì)于亮氨酸拉鏈,NAM酶與一個(gè)亮氨酸拉鏈序列的融合可使該融合體與其他亮氨酸拉鏈拉開(kāi),使大量亮氨酸拉鏈蛋白迅速分離。另外,結(jié)構(gòu)性標(biāo)記(可能僅僅是蛋白本身)可促使形成異多聚體蛋白復(fù)合物,然后作為復(fù)合體檢測(cè)活性。也就是說(shuō),許多蛋白,如許多真核轉(zhuǎn)錄因子,作為異多聚體復(fù)合物起作用,可采用本發(fā)明進(jìn)行檢測(cè)。另外,與cDNA、基因組或隨機(jī)文庫(kù)不同,候選蛋白文庫(kù)可能是一個(gè)構(gòu)建的文庫(kù);也就是,它可能被構(gòu)建為僅含有指定類(lèi)型的成員,或類(lèi)型的組合。例如,可以建立免疫球蛋白文庫(kù),或G蛋白偶聯(lián)受體、腫瘤抑制基因、蛋白酶、轉(zhuǎn)錄因子、磷酸酶、激酶等的文庫(kù)。融合核酸可以由許多構(gòu)型的NAM酶和候選蛋白組成,包括直接和間接的融合體,它包括N-和C-末端融合體和內(nèi)部融合體。在一個(gè)優(yōu)選的實(shí)施方案中,NAM酶和候選蛋白是直接融合的。在這-個(gè)實(shí)施方案中,設(shè)計(jì)了一個(gè)直接的,編碼NAM酶的核酸和候選蛋白在框內(nèi)的融合。融合肽文庫(kù)可構(gòu)建為N-和/或C-末端融合體和內(nèi)部融合體。因此,NAM酶編碼區(qū)可能是候選蛋白編碼區(qū)的3’或5’端,或候選蛋白編碼區(qū)可能插入到NAM酶的編碼區(qū)內(nèi)的一個(gè)適當(dāng)位置中。在該實(shí)施方案中,可能需要將候選蛋白插入到一個(gè)NAM酶的外環(huán)中,作為直接插入物或替代幾個(gè)NAM酶殘基。這在隨機(jī)候選蛋白例子中特別需要,因?yàn)樗鼈兘?jīng)常需要一些支架或表現(xiàn)結(jié)構(gòu)以形成一個(gè)構(gòu)象上的限制結(jié)構(gòu)。例如,采用綠熒光蛋白(GFP)作為表達(dá)隨機(jī)肽文庫(kù)的一個(gè)支架,這種普通的觀點(diǎn),見(jiàn)例如WO99/20574,在此特別加入作為參考。在一個(gè)優(yōu)選的實(shí)施方案中,NAM酶和候選蛋白是間接融合的。間接融合完成后使得融合的成分仍然附著,如通過(guò)使用連接子,或以某種導(dǎo)致融合成分變得分離的方式完成。如本專(zhuān)業(yè)技術(shù)人員可理解的,可使用大量不同類(lèi)型的連接子,包括可切割的和不可切割的連接子;這種切割也可發(fā)生在核酸水平,或在蛋白水平。在一個(gè)優(yōu)選的實(shí)施方案中,連接子可用來(lái)功能性地分離NAM酶和候選蛋白。也就是,一個(gè)直接融合系統(tǒng)可在空間上或功能上阻礙候選蛋白與其目的結(jié)合配體的相互作用,因此融合結(jié)合體的自由程度越大越有用。類(lèi)似的情況可見(jiàn)于單鏈抗體區(qū)域,其中連接子的加入使之具有功能。在一個(gè)優(yōu)選的實(shí)施方案中,采用已知具有可塑性的連接子。例如,有用的連接子包括甘氨酸-絲氨酸聚合體(包括,例如(GS)n,和(GGGS)n,其中n是至少為1的整數(shù)),甘氨酸-丙氨酸聚合體,丙氨酸-絲氨酸聚合體,以及其他可塑連接子如振腿(shaker)鉀通道的系鏈,和其它本專(zhuān)業(yè)技術(shù)人員可理解的,大量的可塑連接子。優(yōu)選甘氨酸-絲氨酸聚合體,因?yàn)樵诙咧械陌被嵯鄬?duì)均是未組織的,因此能夠在多種成分之間作為一個(gè)中性的系鏈。第二,絲氨酸是親水性的,因此能夠溶解那些球狀的甘氨酸鏈。第三,已經(jīng)表明同樣的鏈在連接像單鏈抗體這樣的重組蛋白的亞單位中是起作用的。用來(lái)構(gòu)建間接融合酶的連接子可能是一個(gè)可切割的連接子??汕懈畹倪B接子可在核酸或蛋白水平上起作用。也就是,切割(在該意義上是指NAM酶和候選蛋白是分離的)可發(fā)生在轉(zhuǎn)錄過(guò)程中,或者在翻譯前-或翻譯后。關(guān)于可切割的連接子,切割的發(fā)生可能是切割功能構(gòu)建入核酸的結(jié)果。在該實(shí)施方案中,例如可使用可切割的核酸序列,或?qū)⑶懈詈怂岬男蛄小@?,?xì)胞要去除的內(nèi)含子序列可放置于NAM酶的編碼區(qū)域和候選蛋白之間。在一個(gè)優(yōu)選的實(shí)施方案中,連接子是異二聚化的結(jié)構(gòu)區(qū)。在該實(shí)施方案中,NAM酶和候選蛋白融合成異二聚化結(jié)構(gòu)區(qū)(或如果需要多價(jià)性,是多聚結(jié)構(gòu)區(qū)),使這兩個(gè)蛋白在翻譯后聯(lián)系起來(lái)。在一個(gè)優(yōu)選的實(shí)施方案中,使用可切割的蛋白連接子。在該實(shí)施方案中,融合核酸包括可能隨后被切割的一個(gè)蛋白序列的編碼序列,其切割一般是通過(guò)一個(gè)蛋白酶進(jìn)行。如本專(zhuān)業(yè)技術(shù)人員可以理解的那樣,可使用涉及(普)遍(存)在蛋白酶的切割位點(diǎn),如那些結(jié)構(gòu)性存在于大多數(shù)或所有宿主細(xì)胞系統(tǒng)中的遍在蛋白酶??蛇x擇的是,可使用對(duì)應(yīng)于細(xì)胞特異蛋白酶的切割位點(diǎn)。同樣地,也可使用僅在特定細(xì)胞周期或時(shí)相中被誘導(dǎo)的,或是特異信號(hào)事件的蛋白酶的切割位點(diǎn)。已知有大量可能的蛋白質(zhì)切割位點(diǎn)。例如,被一個(gè)蛋白酶識(shí)別并切割的、或在暴露于某種化學(xué)物質(zhì)后被切割的序列是可考慮的可切割連接子。可以發(fā)現(xiàn)這在體外系統(tǒng)中特別有用,如下面所概述的,因?yàn)樵隗w外環(huán)境中,外源酶可被加入到周?chē)h(huán)境中,或可以純化NAP結(jié)合物,并可加入切割劑。例如,可切割的連接子包括但不限于,牛凝乳酶的前序列、枯草桿菌蛋白酶的前序列、2a位點(diǎn)(Ryan等人,遺傳病毒學(xué)雜志(J.Gen.Virol.)722727(1991);Ryan等人,歐洲分子生物學(xué)雜志(EMBOJ.)13928(1994);Donnelly等人,遺傳病毒學(xué)雜志(J.Gen.Virol.)7813(1997);Hellen等人,生物化學(xué)(Biochem.),28(26)9881(1989);和Mattion等人,病毒學(xué)雜志(J.Virol.)708124(1996)),包括人免疫缺陷病毒蛋白酶的逆轉(zhuǎn)錄病毒蛋白酶前序列、和被胰蛋白酶識(shí)別并切割的序列(歐洲專(zhuān)利578472,Takasuga等人,生物化學(xué)雜志(J.Biochem.)112(5)652(1992))、Xa因子(Gardella等人,生物學(xué)化學(xué)(J.Biol.Chem.)265(26)15854(1990),WO9006370)、膠原酶(J03280893,Tajima等人,J.Ferment.Bioeng.72(5)362(1991),WO9006370)、梭菌蛋白酶(EP578472)、枯草桿菌蛋白酶(包括突變體64A枯草桿菌蛋白酶,F(xiàn)orsberg等人,蛋白化學(xué)雜-志(J.ProteinChem.)10(5)517(1991))、凝乳酶、酵母KEX2蛋白酶(Bourbonnais等人,生物學(xué)化學(xué)雜志(J.Bio.Chem.)263(30)15342(1988))、凝血酶(Forsberg等人,見(jiàn)前;Abath等人,生物技術(shù)(BioTechniques)10(2)178(1991))、金黃色葡萄球菌V8蛋白酶或在Glu殘基后切割的類(lèi)似的內(nèi)源蛋白酶-Glu-C(歐洲專(zhuān)利578472,Ishizaki等人,應(yīng)用微生物生物工程雜志(Appl.Microbiol.Biotechnol.)36(4)483(1992))、被煙草蝕病毒NIa蛋白酶切割(Parks等人,Anal.Biochem.216(2)413(1994))內(nèi)源蛋白酶-Lys-C(美國(guó)專(zhuān)利第4,414,332號(hào))和內(nèi)源蛋白酶-Asp-N、奈瑟菌屬2型IgA蛋白酶(Pohlner等人,生物技術(shù)(Bio/Technology)10(7)799-804(1992))、可溶性酵母內(nèi)源蛋白酶yscF(歐洲專(zhuān)利467839)、糜蛋白酶(Altman等人,ProteinEng.4(5)593(1991))、腸肽酶(WO9006370)、溶葡萄球菌素、多聚甘氨酸特異內(nèi)源蛋白酶(歐洲專(zhuān)利316748),等,見(jiàn)如,Marston,F(xiàn).A.O.(1986)Biol.Chem.J.240,1-12。作為化學(xué)切割位點(diǎn)的特殊氨基酸位點(diǎn)包括但不限于,被溴化氰切割的蛋氨酸(Shen,PNASUSA814627(1984);Kempe等人,基因39239(1985);Kuliopulos等人,J.Am.Chem.Soc.1164599(1994);Moks等人,生物技術(shù)(Bio/Technology)5379(1987);Ray等人,生物技術(shù)(Bio/Technology)1164(1993))、Asp-Pro鍵的酸性切割(Wingender等人,生物學(xué)化學(xué)雜志(J.Biol.Chem.)264(8)4367(1989);Gram等人,生物技術(shù)(Bio/Technology)121017(1994)),和在Asn-Gly鍵上的羥胺切割(Moks,見(jiàn)前)。除了NAM酶、候選蛋白和連接子,融合核酸可由其他功能的附加編碼序列組成。如本專(zhuān)業(yè)技術(shù)人員可以理解的,在此的討論是針對(duì)這些其他成分與在此描述的融合核酸的融合體;但是,它們也可從融合蛋白中分離,如下面所概述的,更可以是一個(gè)由融合核酸組成的表達(dá)載體的成分。因此,在一個(gè)優(yōu)選的實(shí)施方案中,融合體與一個(gè)融合配體連接。在此的“融合配體”或“功能基團(tuán)”是指可與候選蛋白相連的一段序列,該序列給該類(lèi)型中文庫(kù)的所有成員賦予了一種共有的功能或能力。融合配體可以是異源性的(如,對(duì)宿主細(xì)胞來(lái)說(shuō)非天然的),或合成的-(對(duì)任何細(xì)胞都是非天然的)。適當(dāng)?shù)娜诤吓潴w包括但不限于a)以一個(gè)構(gòu)象限制或穩(wěn)定形式提供給候選蛋的表現(xiàn)結(jié)構(gòu),如下面所定義的,包括異源-或同源二聚體或多聚體序列;b)目標(biāo)序列,如下面所定義的,它可使候選蛋白定位于一個(gè)亞細(xì)胞或細(xì)胞外區(qū)室中或整合入感染的有機(jī)體中,如那些被病毒或病原體感染的有機(jī)體;c)如下面所定義的挽救序列,它可使NAP結(jié)合物純化或分離;d)穩(wěn)定性序列,可賦予候選蛋白或編碼它的核酸穩(wěn)定性保護(hù)它(們)免遭降解,例如對(duì)蛋白溶解性降解的抵抗力;e)連接子序列;或f)任何a),b),c),d)和e)的組合,以及所需的連接子序列。在一個(gè)優(yōu)選的實(shí)施方案中,融合配體是一個(gè)表現(xiàn)結(jié)構(gòu)。“表現(xiàn)結(jié)構(gòu)”或在此的語(yǔ)法等同成分是指一個(gè)氨基酸序列,當(dāng)它與候選蛋白融合時(shí),可導(dǎo)致候選蛋白呈現(xiàn)一個(gè)構(gòu)象限制的形式。當(dāng)候選蛋白是隨機(jī)卷曲,偏性隨機(jī)卷曲或偽隨機(jī)肽時(shí),這特別有用。蛋白之間的相互作用大部分是通過(guò)構(gòu)象限制的結(jié)構(gòu)區(qū)。盡管具有自由旋轉(zhuǎn)氨基和羧基末端的小肽具有專(zhuān)業(yè)中已知的有效功能,這些肽結(jié)構(gòu)很難轉(zhuǎn)變?yōu)樗巹?,因?yàn)樗鼈儾荒茴A(yù)測(cè)擬肽(peptidomimetic)合成的側(cè)鏈位置。因此肽類(lèi)在構(gòu)象限制結(jié)構(gòu)中的提呈將益于后續(xù)藥物的產(chǎn)生,似乎也將使肽與靶蛋白的結(jié)合具有更高親合性。這個(gè)事實(shí)已經(jīng)在采用生物學(xué)在噬菌體系統(tǒng)中產(chǎn)生短肽的組合文庫(kù)產(chǎn)生系統(tǒng)中被認(rèn)識(shí)到了。因此合成的表現(xiàn)結(jié)構(gòu),如人工合成的多肽,能夠?qū)⒁粋€(gè)自由卷曲的肽排列為一個(gè)構(gòu)象限制的結(jié)構(gòu)區(qū)。一般這樣的表現(xiàn)結(jié)構(gòu)包括與自由卷曲肽的N末端相連的第一部分,以及與肽的C末端相連的第二部分;也就是,盡管可能生成變異體,但是肽仍插入到表現(xiàn)結(jié)構(gòu)中,如下所述。為了增加隨機(jī)表達(dá)產(chǎn)物的功能性分離,當(dāng)它在靶細(xì)胞中表達(dá)時(shí),選擇和或設(shè)計(jì)的表現(xiàn)結(jié)構(gòu)應(yīng)具有最小的生物學(xué)活性。優(yōu)選的表現(xiàn)結(jié)構(gòu)通過(guò)將肽提呈到一個(gè)外環(huán)上,來(lái)最大程度的增加其可進(jìn)入性。因此,適當(dāng)?shù)谋憩F(xiàn)結(jié)構(gòu)包括但不限于,小體結(jié)構(gòu),二聚化序列,β-片層反轉(zhuǎn)上的環(huán)和卷曲螺旋干結(jié)構(gòu),其中對(duì)結(jié)構(gòu)不太重要的殘基是隨機(jī)卷曲化的,鋅指結(jié)構(gòu)區(qū),半胱氨酸連接(二硫鍵)結(jié)構(gòu),轉(zhuǎn)谷氨酰胺酶連接結(jié)構(gòu),環(huán)肽,B-環(huán)結(jié)構(gòu),螺旋筒或束,亮氨酸拉鏈基序,等。在一個(gè)優(yōu)選的實(shí)施方案中,表現(xiàn)結(jié)構(gòu)是一個(gè)卷曲螺旋結(jié)構(gòu),可使自由卷曲的肽提呈在一個(gè)外環(huán)上。如,見(jiàn),Myszka等人,生物化學(xué)(Biochem.)332362-2373(1994),在此加入作為參考,和圖3)。采用這種系統(tǒng),研究者已經(jīng)分離了與合適的靶目標(biāo)具有高親和作用的肽。通常,卷曲螺旋結(jié)構(gòu)可允許6到20個(gè)之間的隨機(jī)位置。一個(gè)優(yōu)選的卷曲螺旋表現(xiàn)結(jié)構(gòu)實(shí)施例見(jiàn)Martin等人,歐洲分子生物學(xué)雜志(EMBOJ.)13(22)5303-5309(1994)的文獻(xiàn),該文獻(xiàn)加入作為參考。在一個(gè)優(yōu)選的實(shí)施方案中,表現(xiàn)結(jié)構(gòu)是一個(gè)小體結(jié)構(gòu)。一個(gè)“小體”主要由一個(gè)最小的抗體互補(bǔ)區(qū)組成。小體表現(xiàn)結(jié)構(gòu)一般提供兩個(gè)自由卷曲區(qū)域,在折疊的蛋白上該區(qū)域沿三級(jí)結(jié)構(gòu)的一個(gè)單一面排列。例如,見(jiàn)Bianchi等人,分子生物學(xué)雜志(J.Mol.Biol.)236(2)649-59(1994),和在此引用的文獻(xiàn),所有在此引入作為參考。研究者們發(fā)現(xiàn)這個(gè)最小的結(jié)構(gòu)區(qū)在溶液中是穩(wěn)定的,他們已經(jīng)采用噬菌體選擇系統(tǒng)在組合文庫(kù)中篩選有肽區(qū)的小體,該小體與前-炎性因子IL-6有很高的結(jié)合親和性,Kd=10-7。一個(gè)優(yōu)選的小體表現(xiàn)結(jié)構(gòu)如下MGRNSQATSGFTFSHFYMEWVRGGEYIAASRHKHNKYTTEYSASVKGRYIVSRDTSQSILYLQKKKGPP(SEQIDNO1)。粗體的下劃線區(qū)域是可以自由卷曲的區(qū)域。在第一個(gè)自由卷曲的區(qū)域中,斜體的苯丙氨酸必須是固定的。整個(gè)肽在卷曲螺旋的實(shí)施方案中的三寡核苷酸變異體中進(jìn)行克隆,因此可以允許兩個(gè)不同的隨機(jī)區(qū)域同時(shí)加入。這個(gè)實(shí)施方案在末端采用非回文序列的BstXI位點(diǎn)。在一個(gè)的實(shí)施方案中,表現(xiàn)結(jié)構(gòu)是一段一般含有兩個(gè)半胱氨酸殘基的序列,這樣可能形成一個(gè)二硫鍵,產(chǎn)生一個(gè)構(gòu)象限制的序列。當(dāng)采用分泌的目標(biāo)序列時(shí)特別優(yōu)選該實(shí)施方案。如本專(zhuān)業(yè)技術(shù)人員可理解的,許多隨機(jī)序列,有或沒(méi)有間隔物或連接子序列,可能排列在半胱氨酸殘基旁。在其他的實(shí)施方案中,有效的表現(xiàn)結(jié)構(gòu)可能由隨機(jī)區(qū)域本身產(chǎn)生。例如,隨機(jī)區(qū)域可能用半胱氨酸殘基來(lái)“摻雜”,在適當(dāng)?shù)难趸€原條件下,可能形成高度交聯(lián)的結(jié)構(gòu)化的構(gòu)型,類(lèi)似于一個(gè)表現(xiàn)結(jié)構(gòu)。同樣,可以控制自由卷曲區(qū)域,使其包含特定數(shù)量的殘基以具有β-片層或α-螺旋結(jié)構(gòu)。在一個(gè)實(shí)施方案中,表現(xiàn)結(jié)構(gòu)是一個(gè)二聚化或多聚化序列。一個(gè)二聚化序列可允許一個(gè)候選蛋白與另一個(gè)候選蛋白,包括肽,非共價(jià)結(jié)合,并具有足夠的親和性以致于在正常的生理?xiàng)l件下仍然保持連接狀態(tài)。如果每個(gè)細(xì)胞產(chǎn)生兩個(gè)蛋白,然后二聚化,形成一個(gè)108(104×104)的有效文庫(kù),這就有效地保證了小的候選蛋白文庫(kù)(例如,104)成為大的文庫(kù)。如果需要,可允許形成更大的蛋白,或結(jié)構(gòu)更復(fù)雜的復(fù)合體分子。二聚體可以是同型二聚體或雜二聚體。二聚化序列可能是一個(gè)可自我聚合的單一序列,或兩個(gè)序列。也就是,用二聚化序列1編碼第一個(gè)候選蛋白,以及用二聚化序列2編碼第二個(gè)候選蛋白的核酸,這樣在將其引入一個(gè)細(xì)胞中并表達(dá)核酸的過(guò)程中,二聚化序列1與二聚化序列2相連形成一個(gè)新的結(jié)構(gòu)。合適的二聚化序列將包括大量的序列。許多蛋白-蛋白相互作用位點(diǎn)是已知的。另外,二聚化序列可能也是采用標(biāo)準(zhǔn)的方法闡明的,如酵母雙雜交系統(tǒng),傳統(tǒng)的生物親合性結(jié)合實(shí)驗(yàn),或甚至采用本發(fā)明方法。在一個(gè)優(yōu)選的實(shí)施方案中,融合配體是一個(gè)靶向序列。如本專(zhuān)業(yè)技術(shù)人員可理解的那樣,蛋白在細(xì)胞內(nèi)的定位是一個(gè)增加有效濃度和確定功能的簡(jiǎn)單方法。例如,當(dāng)定位在線粒體膜上時(shí),RAF1可以抑制BCL-2的抗凋亡效應(yīng)。同樣,膜結(jié)合Sos可誘導(dǎo)Ras介導(dǎo)的T細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)。這些機(jī)制被認(rèn)為是依靠限制配體搜索空位的原理,也就是說(shuō),一個(gè)蛋白在漿膜上的定位將其對(duì)配體的搜索限制在膜附近的有限空間范圍內(nèi),而不是細(xì)胞漿的三維空間。可以選擇的是,也可簡(jiǎn)單地通過(guò)定位性質(zhì)來(lái)增加一個(gè)蛋白的濃度。將蛋白穿梭進(jìn)入核內(nèi)可將其限定在一個(gè)更小的空間內(nèi),因此增加了其濃度。最后,配體或靶目標(biāo)可能被簡(jiǎn)單的定位在一個(gè)特異的區(qū)室中,抑制劑必須被相應(yīng)的定位。因此,合適的靶向序列包括但不限于,在保留了表達(dá)產(chǎn)物的生物活性的同時(shí),能夠使表達(dá)產(chǎn)物與一個(gè)預(yù)先確定的分子或一類(lèi)分子結(jié)合的結(jié)合序列,(例如通過(guò)采用酶抑制劑或底物序列來(lái)靶向一類(lèi)相關(guān)的酶);傳導(dǎo)選擇性降解其本身或共同結(jié)合蛋白信號(hào)的序列;能將候選表達(dá)產(chǎn)物結(jié)構(gòu)性定位于一個(gè)預(yù)先確定的細(xì)胞場(chǎng)所的信號(hào)序列,這些場(chǎng)所包括a)亞細(xì)胞場(chǎng)所,如高爾基體,內(nèi)質(zhì)網(wǎng),核,核仁,核膜,線粒體,葉綠體,分泌囊泡,溶酶體和細(xì)胞膜,或在已被感染的細(xì)胞的病原體或病毒內(nèi);和b)經(jīng)一個(gè)分泌信號(hào)定位于細(xì)胞外場(chǎng)所。特別優(yōu)選的是定位于亞細(xì)胞場(chǎng)所或經(jīng)分泌到達(dá)細(xì)胞外。在一個(gè)優(yōu)選的實(shí)施方案中,靶向序列是一個(gè)核定位信號(hào)(NLS)。NLSs一般是短的,帶正電的(堿性的)結(jié)構(gòu)區(qū),可作為引導(dǎo)它們所在的整個(gè)蛋白進(jìn)入細(xì)胞的核中。大量的NLS氨基酸序列已經(jīng)被報(bào)道,包括單堿性NLS’s如SV40(猴病毒)大T抗原(ProLysLysLysArgLysVal)的,Kalderon(1984)等人,細(xì)胞,39499-509;人視黃酸受體-β核定位信號(hào);NFkBp50(見(jiàn),例如Ghosh等人,細(xì)胞621019(1990));NFkBp65(見(jiàn),例如Nolan等人,細(xì)胞64961(1991));和其他(見(jiàn),例如Boulikas,細(xì)胞生物化學(xué)雜志(J.Cell.Biochem.)55(1)32-58(1994),在此加入作為參考)和雙堿性NLS’s,其實(shí)施例為爪蟾屬(非洲爪蟾)蛋白,核質(zhì)蛋白(見(jiàn),例如,Dingwall等人,細(xì)胞,30449-458,1982和Dingwall等人,細(xì)胞生物學(xué)雜志(J.Cell.Biol.),107641-849;1988)。大量的定位研究證明在合成肽中插入的或嫁接在正常不靶向于細(xì)胞核的報(bào)告蛋白上的NLSs可使這些肽和報(bào)告蛋白在核中濃縮。例如,見(jiàn),Dingwall和Laskey,細(xì)胞生物學(xué)進(jìn)展年報(bào)(Ann.Rev.CellBiol.),2367-390,1986;Bonnerot等人,美國(guó)國(guó)家科學(xué)院院刊(Proc.Natl.Acad.Sci.USA),846795-6799,1987;Galileo人等,美國(guó)國(guó)家科學(xué)院院刊(Proc.Natl.Acad.Sci.USA),87458-462,1990。在一個(gè)優(yōu)選的實(shí)施方案中,靶向序列是一個(gè)膜錨著信號(hào)序列。這一點(diǎn)特別有用,除了許多細(xì)胞內(nèi)的事件起源于胞膜以外,還因?yàn)樵S多寄生蟲(chóng)和病原體與膜結(jié)合。因此,膜結(jié)合肽文庫(kù)對(duì)于在這些過(guò)程中鑒定重要的成分以及發(fā)現(xiàn)有效的抑制劑是有用的。另外,許多藥物與膜相關(guān)蛋白互相作用。發(fā)明提供了將候選蛋白提呈在細(xì)胞外或在細(xì)胞漿空間內(nèi)的方法。對(duì)于細(xì)胞外的提呈,在候選蛋白的羧基末端提供一個(gè)膜錨著區(qū)域。候選蛋白區(qū)在細(xì)胞表面表達(dá),并提呈于細(xì)胞外空間,因此他可以結(jié)合其他的表面分子(影響其功能)或在細(xì)胞外介質(zhì)中存在的分子。這些分子的結(jié)合能賦予在細(xì)胞上表達(dá)結(jié)合該分子的一個(gè)肽的功能。細(xì)胞漿區(qū)域可以是中性的或可能含有一個(gè)結(jié)構(gòu)區(qū),當(dāng)細(xì)胞外候選-蛋白區(qū)被結(jié)合時(shí),可以將一個(gè)功能賦予該細(xì)胞(一個(gè)激酶,磷酸酶的激活,結(jié)合其他細(xì)胞成分影響功能)。同樣,含有候選蛋白的區(qū)域可能被包含在一個(gè)細(xì)胞漿區(qū)域,跨膜區(qū)和細(xì)胞外區(qū)仍然不變或具有限定的功能。另外,應(yīng)該注意的是在這個(gè)實(shí)施方案中,以及在此概述的其他實(shí)施方案中,可能NAP結(jié)合物的形成是發(fā)生在篩選之后;也就是,融合蛋白在細(xì)胞外表面表達(dá),就意味著不能與核酸結(jié)合。但是以后隨著細(xì)胞的溶解可能會(huì)與核酸結(jié)合。膜錨著序列在本領(lǐng)域中是已知的,其基礎(chǔ)是哺乳動(dòng)物跨膜分子的遺傳幾何構(gòu)型?;谝粋€(gè)信號(hào)肽,肽被插入到膜中(在此指定為ssTM),并需要一個(gè)疏水的跨膜區(qū)(在此稱(chēng)為T(mén)M)??缒さ鞍妆徊迦氲侥ぶ校虼司幋a跨膜結(jié)構(gòu)區(qū)5’的區(qū)域在細(xì)胞外的,序列的3’變?yōu)榧?xì)胞內(nèi)的。當(dāng)然,如果這些跨膜結(jié)構(gòu)區(qū)放置在可變區(qū)的5’端,它們將作為一個(gè)細(xì)胞內(nèi)結(jié)構(gòu)區(qū)進(jìn)行錨著,這在一些實(shí)施方案中可能是需要的。SsTMs和TMs已知為大量的膜結(jié)合蛋白,這些序列可能相應(yīng)地用來(lái)或者與一個(gè)特殊蛋白配對(duì),或者與從一個(gè)不同蛋白中提取的每個(gè)成分配對(duì),或可選擇的是這些序列可能是合成的,并作為人工傳遞結(jié)構(gòu)區(qū)完全來(lái)源于共有序列。膜錨著序列,包括ssTM和TM,已知為大量的蛋白,它們中的任何一個(gè)都可能被使用。特別優(yōu)選的膜錨著序列包括但不限于,那些來(lái)源于CD8,ICAM-2,IL-8R,CD4和LFA-1的序列。有用的膜錨著序列包括,例如,這些序列來(lái)自1)I類(lèi)整合性膜蛋白如IL-2受體β鏈(殘基1-26是信號(hào)序列,241-265是跨膜殘基;見(jiàn)Hatakeyama等人,科學(xué)(Science)244551(1989)和vonHeijne等人,歐洲生物化學(xué)雜志(Eur.J.Biochem.174671(1988))和胰島素受體β鏈(殘基1-27是信號(hào)序列,957-959是跨膜結(jié)構(gòu)區(qū),960-1382是細(xì)胞漿結(jié)構(gòu)區(qū);見(jiàn)Hatakeyama,見(jiàn)前,和Ebina等人,細(xì)胞40747(1985));2)II類(lèi)整合性膜蛋白如中性肽鏈內(nèi)切酶(殘基29-51是跨膜結(jié)構(gòu)區(qū),2-28是細(xì)胞漿結(jié)構(gòu)區(qū);見(jiàn)Malfroy等人,生物化學(xué)和生物物理學(xué)研究通訊(Biochem.Biophys.Res.Commun.)14459(1987));3)III類(lèi)蛋白如人細(xì)胞色素P450NF25(Hatakeyama,見(jiàn)前);和4)IV類(lèi)蛋白-如人P-糖蛋白(Hatakeyama,見(jiàn)前)。特別優(yōu)選的是CD8和ICAM-2。例如,來(lái)自CD8和ICAM-2的信號(hào)序列位于轉(zhuǎn)錄物的5’末端。在CD8時(shí)這些包括氨基酸1-32(例如,見(jiàn)Nakauchi等人,PNASUSA825126(1985))和在ICAM-2時(shí)包括1-21(例如,見(jiàn),Staunton等人,自然(Nature)(London)33961(1989))。這些前導(dǎo)序列將構(gòu)建物輸送到膜上,而疏水的跨膜結(jié)構(gòu)區(qū),位于隨機(jī)候選區(qū)的3’區(qū),則在膜上錨著構(gòu)建物。這些跨膜結(jié)構(gòu)區(qū)包括來(lái)自CD8的145-195位氨基酸(Nakauchi,見(jiàn)前)和來(lái)自ICAM-2(Stauton,見(jiàn)前)的224-256氨基酸。可以選擇的是,膜錨著序列包括GPI錨,可在分子和脂質(zhì)雙層之間通過(guò)一個(gè)糖基-磷酸肌醇鍵形成一個(gè)共價(jià)鍵,例如在DAF中(見(jiàn),例如,Homans等人,自然(Nature)333(6170)269-72(1988),和Moran等人,生物學(xué)化學(xué)雜志(J.Biol.Chem.)2661250(1991))。為了做到這一點(diǎn),來(lái)自Thy-1的GPI序列可被插入到可變區(qū)的3’以替代一個(gè)跨膜序列。同樣,肉豆蔻化序列可作為膜錨著序列,已知c-src的肉豆蔻化可使其返回到漿膜上。這是一個(gè)簡(jiǎn)單和有效的膜定位方法,假定蛋白質(zhì)的第一個(gè)14個(gè)氨基酸負(fù)責(zé)這個(gè)功能(見(jiàn)Cross等人,分子細(xì)胞生物學(xué)(Mol.Cell.Biol.)4(9)1834(1984);Spencer等人,科學(xué)(Science)2621019-1024(1993),兩個(gè)文獻(xiàn)在此加入作為參考)。已經(jīng)表明這個(gè)基序在報(bào)告基因的定位中是有效的,可以用來(lái)錨著TCR的zeta鏈。這個(gè)基序位于可變區(qū)的5’是為了將構(gòu)建物定位于漿膜。其他修飾如棕櫚酰化,可用來(lái)在漿膜上錨著構(gòu)建物;例如,來(lái)自G蛋白偶聯(lián)受體激酶GPK6序列(例如,見(jiàn)Stoffel等人,生物化學(xué)雜志(J.Biol.Chem.)26927791(1994));來(lái)自視紫質(zhì)(例如,見(jiàn)Barnstable等,J.Mol.Neurosci.5(3)207(1994));和p21H-ras1蛋白(例如,見(jiàn)Capon等人,自然(Nature)30233(1983))的棕櫚酰化序列。在一個(gè)優(yōu)選的實(shí)施方案中,靶向序列是一個(gè)溶菌酶(lysosomal)的靶向序列,包括,例如,一個(gè)溶酶體的降解序列如Lamp-2(KFERQ;Dice,紐約學(xué)院科學(xué)年報(bào)(Ann.N.Y.Acad.Sci.)67458(1992);或來(lái)自Lamp-1或Lamp-2的溶酶體膜序列(例如,見(jiàn)Uthayakumar等人,細(xì)胞分子生物學(xué)研究(Cell.Mol.Biol.Res.)41405(1995)(例如,-見(jiàn)Konecki等人,生物化學(xué)生物物理學(xué)研究通訊(Biochem.Biophys.Res.Comm.)2051-5(1994))??梢赃x擇的是,靶向序列可由一個(gè)線粒體定位序列組成,包括線粒體基質(zhì)序列(如,酵母乙醇脫氫酶III;Schatz,歐洲生化雜志(Eur.J.Biochem.)1651-6(1987));線粒體內(nèi)膜序列(酵母細(xì)胞色素c氧化酶亞單位IV;Schatz,見(jiàn)前);線粒體膜間間隔序列(酵母細(xì)胞色素c1;Schatz,見(jiàn)前)或線粒體外膜序列(酵母70kD外膜蛋白;Schatz,見(jiàn)前)。靶序列也可由內(nèi)質(zhì)網(wǎng)序列組成,包括來(lái)自鈣網(wǎng)蛋白(Pelham,皇家社會(huì)倫敦學(xué)報(bào)(RoyalSocietyLondonTransactions)B;1-10(1992))或腺病毒E3/19K蛋白(例如,見(jiàn)Jackson等人,歐洲分子生物學(xué)雜志(EMBOJ.)93153(1990))。而且,靶向序列還包括過(guò)氧化物酶序列(例如,來(lái)自熒光素酶的過(guò)氧化物基質(zhì)序列;Keller等人,PNASUSA43264(1987));法尼基化序列(例如,P21H-ras1;Capon,見(jiàn)前);瓏牛兒?;蛄?例如,蛋白rab-5A;Farnsworth,PNASUSA9111963(1994));或破環(huán)序列(細(xì)胞周期蛋白B1;Klotzbucher等人,歐洲分子生物學(xué)雜志(EMBOJ.)13053(1996))。在一個(gè)優(yōu)選的實(shí)施方案中,靶向序列是一個(gè)分泌性的信號(hào)序列,能影響候選蛋白的分泌。有大量已知的分泌性信號(hào)序列,位于可變肽區(qū)的5’,從肽區(qū)上被切割以影響其向細(xì)胞外空間的分泌。分泌信號(hào)序列及其向不相關(guān)蛋白的傳遞是為人熟知的,如,Silhavy等人,(1985)微生物進(jìn)展(Microbiol.Rev.)49,398-418。這在產(chǎn)生一個(gè)肽時(shí)特別有用,該肽能結(jié)合在一個(gè)靶細(xì)胞而不是宿主細(xì)胞的表面上,或影響其生理學(xué)功能。以這種方式,生長(zhǎng)于細(xì)胞鄰近的引起肽文庫(kù)表達(dá)的靶細(xì)胞浸在分泌的肽中。由于一個(gè)肽的存在造成生理學(xué)改變的靶細(xì)胞,和分泌的細(xì)胞可通過(guò)任何一種選擇方案和引起確定效應(yīng)的肽來(lái)定位,如通過(guò)結(jié)合于一個(gè)表面受體的肽或被內(nèi)化,以及結(jié)合于細(xì)胞內(nèi)的靶目標(biāo)。大量實(shí)施例的效應(yīng)包括那些設(shè)計(jì)者細(xì)胞因子(如一個(gè)能引起造血干細(xì)胞分裂和維持全能的干細(xì)胞因子),一個(gè)引起癌細(xì)胞自發(fā)凋亡的因子,與靶細(xì)胞的細(xì)胞表面結(jié)合并特異標(biāo)記它們的因子,等等。與膜錨著的實(shí)施方案類(lèi)似,NAP結(jié)合物的形成也可能發(fā)生在篩選之后;也就是,具有分泌的融合蛋白就意味著它不能與核酸結(jié)合。但是以后隨著細(xì)胞的溶解可能會(huì)完成與核酸的結(jié)合。合適的分泌序列是已知的,包括,例如,來(lái)自IL-2(例如,見(jiàn)Villinger等人,免疫學(xué)雜志(J.Immunol.)1553946(1995)),生長(zhǎng)激素(例如,見(jiàn)Roskam等人,核酸研究(NucleicAcidsRes.)730(1979));前胰島素原(例如,見(jiàn)Bell等人,自然(Nature)28426(1980));和流感HA蛋白(例如,見(jiàn)Sekiwawa等人,PNAS803563))的信號(hào)。一個(gè)特別優(yōu)選的分泌信號(hào)序列是來(lái)自分泌的細(xì)胞因子IL-4的前導(dǎo)信號(hào)序列。在一個(gè)優(yōu)選的實(shí)施方案中,融合配體是一個(gè)挽救序列(有時(shí)在此也指“純化標(biāo)記”或“修復(fù)特性”)。一個(gè)挽救序列是一個(gè)可以用來(lái)純化或分離候選蛋白或NAP結(jié)合物的一個(gè)序列。因此,例如,肽挽救序列包括與Ni親和柱一起使用的純化序列,如His6標(biāo)記,和用于檢測(cè),免疫沉淀或FACS(熒光激活細(xì)胞分類(lèi)術(shù))的抗原決定簇標(biāo)記的純化序列。適當(dāng)?shù)目乖瓫Q定簇標(biāo)記包括myc(與市售的9E10抗體一起使用),細(xì)菌酶BirA,流感標(biāo)記,lacZ和GST的BSP生物素化靶序列。挽救序列可在一個(gè)結(jié)合反應(yīng),一個(gè)酶反應(yīng),一個(gè)物理特性或一個(gè)化學(xué)特性的基礎(chǔ)上使用??梢赃x擇的是,挽救序列包括一個(gè)唯一的寡核苷酸序列作為一個(gè)探針目標(biāo)位點(diǎn),經(jīng)PCR、相關(guān)技術(shù)或雜交使構(gòu)建物迅速和容易的分離。在一個(gè)優(yōu)選的實(shí)施方案中,融合配體是一個(gè)穩(wěn)定的序列可以賦予候選蛋白或編碼它的核酸以穩(wěn)定性。因此,例如,在初始蛋氨酸后可以通過(guò)加入甘氨酸穩(wěn)定肽類(lèi),保護(hù)肽類(lèi),防止其如perVarshavsky’sN-末端規(guī)則(N-EndRule)泛化,因此使其在細(xì)胞漿中的半衰期更長(zhǎng)。同樣,兩個(gè)在C末端的脯氨酸可給予肽很強(qiáng)的抵抗羧肽酶作用的能力。在脯氨酸前存在兩個(gè)甘氨酸可以使雙-脯氨酸初始反應(yīng)中的柔性和預(yù)防結(jié)構(gòu)在候選蛋白結(jié)構(gòu)中遺傳。因此,優(yōu)選的穩(wěn)定序列如下MG(X)nGGPP,其中X是任何氨基酸,n是至少為4的整數(shù)。另外,連接子序列,如上所述,如果需要可在任何構(gòu)型中使用。另外,融合配體,包括表現(xiàn)結(jié)構(gòu),可以是修飾的,自由卷曲的,-和/或成熟的,以改變隨機(jī)表達(dá)產(chǎn)物的表現(xiàn)方向。例如,在環(huán)袢的堿基處的決定簇可以被修飾以輕微修飾內(nèi)環(huán)肽三級(jí)結(jié)構(gòu),該結(jié)構(gòu)保持自由卷曲的氨基酸序列。如果需要可以使用結(jié)合的融合配體。因此,例如,在存在或不存在連接子序列的情況下,可以使用任何數(shù)目的表現(xiàn)結(jié)構(gòu),靶向序列,挽救序列和穩(wěn)定序列的結(jié)合。同樣,如在此所述的,融合配體可以與在此描述的表達(dá)載體的任何成分相連它們可以與NAM酶、候選蛋白,或EAS直接融合,如下所述,或與這些成分是分離的,被包含在表達(dá)載體中。除了編碼NAM酶和候選蛋白的序列,以及可選擇的融合配體,本發(fā)明的核酸優(yōu)選包含一個(gè)酶附著序列。在此“酶附著序列”或“EAS”是指所選的、調(diào)節(jié)與NAM酶的附著的核酸序列。這樣的EAS核酸序列擁有特殊的序列或特殊的化學(xué)或結(jié)構(gòu)構(gòu)型,使NAM酶和EAS附著。EAS可包括其天然構(gòu)型的DNA或RNA序列,或者是雜交體。EASs也包括插入到本發(fā)明核酸分子中的修飾的核酸序列或合成序列。EASs還包括非天然堿基或雜交的非天然和天然(如,在自然界中發(fā)現(xiàn)的)堿基。正如本專(zhuān)業(yè)技術(shù)人員可以理解的那樣,EAS的選擇將依賴(lài)于NAM酶,因?yàn)閱蝹€(gè)NAM酶可識(shí)別特異的序列,因此它們的使用是配對(duì)的。因此,合適的NAM/EAS對(duì)是可以被Rep蛋白(有時(shí)在此指“RepEASs”)識(shí)別的序列和該Rep蛋白,H-1識(shí)別序列和H-1等。另外,與野生型或天然存在的EAS相比,可以應(yīng)用調(diào)節(jié)與NAM酶更好的共價(jià)結(jié)合的EASs。在一個(gè)優(yōu)選的實(shí)施方案中,EAS是雙鏈。通過(guò)實(shí)施例的方式,一個(gè)合適的EAS是含有特異的可與相應(yīng)的NAM酶相互作用的特性的一段雙鏈核酸序列。例如,Rep68和Rep78可識(shí)別一個(gè)包含在一個(gè)AAVITR中的EAS,AAVITR的序列見(jiàn)實(shí)施例1。另外,已經(jīng)表明這些Rep蛋白也可以在人染色體19中識(shí)別一個(gè)類(lèi)-ITR區(qū)域,該區(qū)域的序列見(jiàn)圖48。一個(gè)EAS也包括超螺旋的DNA,一個(gè)拓?fù)洚悩?gòu)酶可與其相互作用,形成共價(jià)中間復(fù)合體??梢赃x擇的是,一個(gè)EAS是一個(gè)可被能形成共價(jià)連接的一個(gè)改變的限制酶識(shí)別的限制性酶位點(diǎn),。最后,一個(gè)EAS可包括一個(gè)RNA序列和/或結(jié)構(gòu),特異的蛋白可與該RNA序列和/或結(jié)構(gòu)相互作用,并形成穩(wěn)定的復(fù)合體(例如,見(jiàn)Romaniuk和Uhlenbeck,生-物化學(xué)(Biochemistry),24,4239-44(1985))。本發(fā)明依靠NAM酶和EAS的特異結(jié)合以調(diào)節(jié)融合酶與核酸分子的連接。一個(gè)本專(zhuān)業(yè)普通技術(shù)人員將會(huì)理解,使用一個(gè)由一個(gè)小核酸序列構(gòu)成的EAS將會(huì)導(dǎo)致NAM酶與表達(dá)載體和宿主細(xì)胞基因組的非特異結(jié)合,非特異結(jié)合的程度依賴(lài)于在載體或宿主基因組中的出現(xiàn)的、可以接受的EAS基序的頻率。因此,本發(fā)明的EAS優(yōu)選包括一段具有足夠長(zhǎng)度的核酸序列,這樣可以產(chǎn)生特異的融合蛋白-編碼的核酸分子的附著。例如,EAS的長(zhǎng)度優(yōu)選超過(guò)5個(gè)核苷酸,更優(yōu)選地,EAS的長(zhǎng)度超過(guò)10個(gè)核苷酸,如優(yōu)選至少有12,15,20,25,30,35,40,45或50個(gè)核苷酸的EAS。而且,優(yōu)選EAS以非常限定的方式存在于宿主細(xì)胞基因組中,這樣至多,每個(gè)基因組僅結(jié)合一個(gè)或兩個(gè)NAM酶,如在一個(gè)人細(xì)胞基因組中不超過(guò)一次。在一些情況下,EAS在一個(gè)宿主細(xì)胞,如一個(gè)人類(lèi)細(xì)胞基因組,中存在許多次,融合蛋白被附著于宿主細(xì)胞基因組上的表達(dá)載體和非表達(dá)載體編碼的可能性增加,因此這不是我們所期望的。例如,噬菌體P2A蛋白識(shí)別一個(gè)相對(duì)短的DNA識(shí)別序列。如果這樣,在哺乳動(dòng)物細(xì)胞中使用P2A蛋白將引起蛋白在宿主基因組的全長(zhǎng)中結(jié)合,并很難鑒定所需的核酸序列。因此,優(yōu)選的實(shí)施方案將排除使用P2A作為一個(gè)NAM酶。本專(zhuān)業(yè)普通技術(shù)人員將會(huì)理解,在本發(fā)明中使用的NAM酶或相應(yīng)的EAS可以被進(jìn)行處理,以增加融合蛋白-核酸分子復(fù)合體的穩(wěn)定性。只要NAM酶與其相應(yīng)的EAS形成共價(jià)鍵,在此就可考慮這樣的處理。因此,在一個(gè)優(yōu)選的實(shí)施方案中,發(fā)明的核酸包括(i)含有編碼一個(gè)NAM酶和一個(gè)候選蛋白序列的一個(gè)融合核酸,和(ii)一個(gè)EAS。這些核酸優(yōu)選整合入一個(gè)表達(dá)載體中;因此提供表達(dá)載體的文庫(kù),有時(shí)在此指“NAM酶表達(dá)載體”。表達(dá)載體既可以是自我復(fù)制的染色體外載體,這些載體可整合入一個(gè)宿主基因組,也可以是能或不能自我復(fù)制的線性核酸。因此,線性核酸分子可以特別的包括在表達(dá)載體的定義中。因此表達(dá)載體可包括,質(zhì)粒,質(zhì)粒-脂質(zhì)體復(fù)合體,噬菌體載體,和病毒載體,如腺伴隨病毒(AAV)為基礎(chǔ)的載體,逆轉(zhuǎn)錄病毒載體,單純皰疹病毒(HSV)為基礎(chǔ)的載體和腺伴隨病毒為基礎(chǔ)的載體??梢圆捎脴?biāo)準(zhǔn)的重組DNA技術(shù)制備核酸分子和任何這些表達(dá)載體,其方法的描述見(jiàn),例如,Sambrook等人,分子克隆,實(shí)驗(yàn)室手冊(cè),第二版,ColdSpringHarbor出版社,ColdSpringHarbor,N.Y.(1989),和Ausubel等人,當(dāng)代分子生物學(xué)方法,GreenePublishingAssociates和JohnWiley&Sons,紐約,N.Y.(1994)。一般來(lái)說(shuō),這些表達(dá)載體含有有效連接至編碼NAM蛋白的核酸上的、調(diào)節(jié)轉(zhuǎn)錄和翻譯的核酸序列。術(shù)語(yǔ)“控制序列”是指在一個(gè)特殊的宿主有機(jī)體內(nèi)表達(dá)一個(gè)有效連接的編碼序列所必需的DNA序列。適合于原核細(xì)胞的控制序列,例如,包括一個(gè)啟動(dòng)子,可選擇的一個(gè)操縱子序列,和一個(gè)核糖體結(jié)合位點(diǎn)。已知真核細(xì)胞可應(yīng)用啟動(dòng)子,多聚腺苷酸化信號(hào)和增強(qiáng)子。當(dāng)一個(gè)核酸與另一個(gè)核酸序列處于功能性關(guān)系的位置時(shí),該核酸是“有效連接”的。例如,如果作為一個(gè)參與多肽分泌的前蛋白表達(dá)時(shí),前序列或分泌引導(dǎo)子的DNA有效連接到編碼多肽的DNA上;如果一個(gè)啟動(dòng)子或增強(qiáng)子影響了序列的轉(zhuǎn)錄,該啟動(dòng)子或增強(qiáng)子就與編碼序列有效連接;或如果一個(gè)核糖體結(jié)合位點(diǎn)的定位利于翻譯,該核糖體結(jié)合位點(diǎn)與編碼序列就是有效連接。一般來(lái)說(shuō),“有效連接”是指被連接的DNA序列是相鄰的,在分泌引導(dǎo)子情況下,是相鄰的并處于閱讀階段。但是,增強(qiáng)子并不一定是相鄰的。在合適的限制位點(diǎn)通過(guò)3’,-5’磷酸二酯鍵連接完成連接。如果這樣的位點(diǎn)不存在,可根據(jù)常規(guī)經(jīng)驗(yàn)使用合成的寡核苷酸連接蛋白或連接子。如本專(zhuān)業(yè)技術(shù)人員可理解的那樣,轉(zhuǎn)錄和翻譯調(diào)節(jié)核酸一般適合用于表達(dá)NAM蛋白的宿主細(xì)胞;例如,優(yōu)選使用來(lái)自細(xì)菌的轉(zhuǎn)錄和翻譯調(diào)節(jié)核酸序列以在細(xì)菌中表達(dá)NAM蛋白。對(duì)于各種宿主細(xì)胞,本專(zhuān)業(yè)已知有許多類(lèi)型的適當(dāng)?shù)谋磉_(dá)載體和合適的調(diào)節(jié)序列。一般地,轉(zhuǎn)錄和翻譯調(diào)節(jié)序列可以包括但不限于,啟動(dòng)子序列、核糖體結(jié)合位點(diǎn)、轉(zhuǎn)錄起始和終止序列、翻譯起始和終止序列、以及增強(qiáng)子、沉默子或激活子序列。在一個(gè)優(yōu)選的實(shí)施方案中,調(diào)節(jié)序列包括啟動(dòng)子及轉(zhuǎn)錄起始和終止序列?!皢?dòng)子”是一段引導(dǎo)RNA聚合酶連接,因而促進(jìn)RNA合成的核酸序列。啟動(dòng)子序列包括結(jié)構(gòu)性和可誘導(dǎo)性啟動(dòng)子序列。結(jié)構(gòu)性啟動(dòng)子的實(shí)施例包括但不限于,CMV立即-早期啟動(dòng)子、RSV長(zhǎng)末端重復(fù)區(qū)、鼠乳腺瘤病毒(MMTV)啟動(dòng)子,等。合適的可誘導(dǎo)性啟動(dòng)子包括但不限于,IL-8啟動(dòng)子、金屬硫蛋白誘導(dǎo)性啟動(dòng)子系統(tǒng)、細(xì)菌lacZYA表達(dá)系統(tǒng)、四環(huán)素表達(dá)系統(tǒng)、和T7聚合酶系統(tǒng)。啟動(dòng)子可以是天然存在的啟動(dòng)子、雜交啟動(dòng)子、或合成的啟動(dòng)子。雜交啟動(dòng)子,其組合成分超過(guò)一個(gè)啟動(dòng)子,也是本專(zhuān)業(yè)已知的,并可用于本發(fā)明。另外,表達(dá)載體可能包括其他的成分。例如,表達(dá)載體可能具有兩個(gè)復(fù)制系統(tǒng)(如復(fù)制啟始點(diǎn)),因此可使它保留在兩個(gè)有機(jī)體中,例如在動(dòng)物細(xì)胞中表達(dá),在原核宿主中克隆和擴(kuò)增。此外,對(duì)整合表達(dá)載體--在大多數(shù)實(shí)施方案中一般不優(yōu)選--來(lái)說(shuō),表達(dá)載體含有至少一段與宿主細(xì)胞基因組同源的序列,優(yōu)選排列在表達(dá)構(gòu)建物旁邊的兩個(gè)同源序列。通過(guò)為載體中的包含物選擇合適的同源序列,整合的載體可能被引導(dǎo)到宿主細(xì)胞中的特定位置。整合載體的構(gòu)建物和適當(dāng)?shù)倪x擇和篩選方法在本專(zhuān)業(yè)中是已知的,并在如Mansour等人,細(xì)胞,51503(1988)和Murray,基因轉(zhuǎn)移和表達(dá)方法,分子生物學(xué)方法,第7卷(CliftonHumana出版社,1991)中有描述。應(yīng)當(dāng)注意到,本發(fā)明的組合物和方法允許特殊的染色體分離。例如,由于人類(lèi)第19號(hào)染色體含有一個(gè)Rep結(jié)合序列(如EAS),當(dāng)NAM酶是Rep時(shí),NAP結(jié)合物將與第19號(hào)染色體一起形成。細(xì)胞溶解之后進(jìn)行免疫沉淀,采用對(duì)Rep蛋白本身的抗體(如不需要候選蛋白)、或?qū)θ诤虾蜻x蛋白的抗體、或?qū)兓瘶?biāo)記物的抗體,可以純化染色體。這是一項(xiàng)重大的進(jìn)步,優(yōu)于目前的染色體純化技術(shù)。因此,通過(guò)將EAS位點(diǎn)選擇性或非選擇性地整合入染色體,就可以純化不同的染色體。另外,在一個(gè)優(yōu)選的實(shí)施方案中,表達(dá)載體包含一個(gè)選擇基因,可選擇含有表達(dá)載體的轉(zhuǎn)化宿主細(xì)胞,特別是在哺乳動(dòng)物細(xì)胞,確保了載體的穩(wěn)定性,因?yàn)椴缓d體的細(xì)胞一般將會(huì)死亡。選擇基因在本專(zhuān)業(yè)中為人熟知,并根據(jù)宿主細(xì)胞的不同而異。在此的“選擇基因”是任何一種基因,它所編碼的基因產(chǎn)物賦予含有載體的細(xì)胞以新的表現(xiàn)型。這些表現(xiàn)型包括,例如,促進(jìn)或延緩細(xì)胞的生長(zhǎng)。這些表現(xiàn)型也包括對(duì)選擇劑的抗性。合適的選擇劑包括但不限于,新霉素(或其類(lèi)似物G418)、殺稻瘟菌素S、histinidolD、爭(zhēng)光霉素、嘌呤霉素、-潮霉素B和其他藥物。表達(dá)載體也可以包括標(biāo)記蛋白的編碼序列,例如,綠色熒光蛋白,它能夠,例如,迅速地鑒定成功轉(zhuǎn)導(dǎo)的細(xì)胞。在一個(gè)優(yōu)選的實(shí)施方案中,表達(dá)載體在要表達(dá)的基因的上游或下游包含了一個(gè)RNA剪接序列,以便增加基因表達(dá)的水平。見(jiàn)Barret等人,核酸研究(NucleicAcidsRes.)1991;Groos等人,分子細(xì)胞生物學(xué)(Mol.Cell.Biol.)1987;和Budiman等人,分子細(xì)胞生物學(xué)(Mol.Cell.Biol.)1988。一個(gè)表達(dá)載體系統(tǒng)是逆轉(zhuǎn)錄病毒載體系統(tǒng),如一般在Mann等人,細(xì)胞,33153-9(1993);Pear等人,美國(guó)國(guó)家科學(xué)院院刊(Proc.Natl.Acad.Sci.U.S.A.),90(18)8392-6(1993);Kitamura等人,美國(guó)國(guó)家科學(xué)院院刊(Proc.Natl.Acad.Sci.U.S.A.),929146-50(1995);Kinsella等人,人類(lèi)基因治療(HumanGeneTherapy),7;1405-13;Hofmann等人,美國(guó)國(guó)家科學(xué)院院刊(Proc.Natl.Acad.Sci.U.S.A.),935185-90;Choate等人,人類(lèi)基因治療(HumanGeneTherapy),72247(1996);PCT/US97/01019和PCT/US97/01048,和這里引用的文獻(xiàn)中所描述的,在此特別引用作為參考。本發(fā)明的融合蛋白可在適當(dāng)?shù)恼T導(dǎo)或引起融合蛋白產(chǎn)生的條件下,通過(guò)培養(yǎng)核酸轉(zhuǎn)化的宿主細(xì)胞來(lái)生產(chǎn),優(yōu)選的轉(zhuǎn)化的核酸是在此概述的表達(dá)載體。適合融合蛋白生產(chǎn)的條件會(huì)依選擇的表達(dá)載體和宿主細(xì)胞不同而異,并由專(zhuān)業(yè)技術(shù)人員采用常規(guī)的方法容易地確定。例如,在表達(dá)載體中使用構(gòu)成性啟動(dòng)子將需要優(yōu)化宿主細(xì)胞的生長(zhǎng)和增殖,而使用可誘導(dǎo)的啟動(dòng)子要求適當(dāng)?shù)纳L(zhǎng)條件來(lái)誘導(dǎo)。另外,在一些實(shí)施方案中,收獲的時(shí)間是重要的。例如,用于昆蟲(chóng)細(xì)胞的桿狀病毒系統(tǒng)是細(xì)胞溶解性病毒,因此收獲時(shí)間的選擇對(duì)于產(chǎn)物的產(chǎn)量來(lái)說(shuō)是關(guān)鍵的。任何能夠承受外源DNA導(dǎo)入和隨后蛋白產(chǎn)生的宿主細(xì)胞均適用于本發(fā)明。宿主細(xì)胞的選擇部分地依賴(lài)于要進(jìn)行的測(cè)定;例如,體外(invitro)系統(tǒng)可使用任意數(shù)目的真核或原核生物,而離體(exvivo)系統(tǒng)優(yōu)選使用動(dòng)物細(xì)胞,特別是哺乳動(dòng)物細(xì)胞并特別強(qiáng)調(diào)人類(lèi)細(xì)胞。因此,適合的宿主細(xì)胞包括酵母、細(xì)菌、古細(xì)菌、植物和昆蟲(chóng)及動(dòng)物細(xì)胞,包括哺乳動(dòng)物細(xì)胞,特別是人類(lèi)細(xì)胞。宿主細(xì)胞可以是天然細(xì)胞,原代細(xì)胞,包括從病態(tài)組織或生物體中分離出來(lái)者,細(xì)胞系(又是那些源于疾病組織的細(xì)胞),基因改造的細(xì)胞,等。特別感興趣的是果蠅黑素原細(xì)胞、釀酒酵母和其他酵母菌、大腸桿菌、芽孢桿菌屬枯草菌,SF9細(xì)胞、C129細(xì)胞、293細(xì)胞、鏈孢菌屬、BHK、CHO、COS,和HeLa細(xì)胞、成纖維細(xì)胞、雪旺氏細(xì)胞系,等。見(jiàn)ATCC細(xì)胞系目錄,在此特別加入作為參考。在一個(gè)優(yōu)選的實(shí)施方案中,融合蛋白在哺乳動(dòng)物細(xì)胞中表達(dá)。哺乳動(dòng)物表達(dá)系統(tǒng)在本專(zhuān)業(yè)領(lǐng)域中也是已知的,包括,如逆轉(zhuǎn)錄病毒和腺病毒系統(tǒng)。哺乳動(dòng)物啟動(dòng)子是任何能結(jié)合哺乳動(dòng)物RNA聚合酶,并啟動(dòng)一個(gè)進(jìn)入mRNA的融合蛋白編碼序列的下游(3’)轉(zhuǎn)錄的DNA序列。一個(gè)啟動(dòng)子將有一個(gè)轉(zhuǎn)錄啟始區(qū)和一個(gè)TATA框,前者通常位于編碼序列5’端的近端,后者利用一個(gè)轉(zhuǎn)錄啟始位點(diǎn)上游定位的25-30個(gè)堿基對(duì)。TATA框被認(rèn)為介導(dǎo)RNA聚合酶II在正確的位點(diǎn)開(kāi)始RNA合成。哺乳動(dòng)物啟動(dòng)子還將含有一個(gè)上游啟動(dòng)子元件(增強(qiáng)子元件),典型地位于TATA框上游的100至200堿基對(duì)之內(nèi)。上游啟動(dòng)子元件決定著轉(zhuǎn)錄起始的速率,并能在任一方向起作用。具有特殊用途的哺乳動(dòng)物啟動(dòng)子是來(lái)自哺乳動(dòng)物病毒基因的啟動(dòng)子,因?yàn)椴《净蚪?jīng)常高度表達(dá)并具有廣泛的宿主范圍。實(shí)施例包括SV40早期啟動(dòng)子、小鼠乳腺瘤病毒LTR啟動(dòng)子、腺病毒主要延遲啟動(dòng)子、單純皰疹病毒啟動(dòng)子和CMV啟動(dòng)子。代表性地,被哺乳動(dòng)物細(xì)胞識(shí)別的轉(zhuǎn)錄終止和多聚腺苷序列是位于翻譯終止密碼子3’端的調(diào)節(jié)區(qū),并與啟動(dòng)子元件一起位于編碼序列的側(cè)面。成熟mRNA的3’末端是通過(guò)位點(diǎn)特異的翻譯后切割和多聚腺苷化而形成的。轉(zhuǎn)錄終止子和多聚腺苷化信號(hào)的實(shí)施例包括來(lái)自SV40的那些。引導(dǎo)外源核酸進(jìn)入哺乳動(dòng)物宿主和其它宿主的方法在本專(zhuān)業(yè)內(nèi)為人熟知,并隨著所用的宿主細(xì)胞不同而異。技術(shù)包括葡聚糖介導(dǎo)的轉(zhuǎn)染、鈣磷沉淀法、1,5-二甲基-1,5-二氮十一亞甲基聚甲溴化物介導(dǎo)的轉(zhuǎn)染、原生質(zhì)體融合、電擊孔法、病毒感染、在脂質(zhì)體內(nèi)包封多聚核苷酸、和將DNA直接微注射進(jìn)細(xì)胞核。在一個(gè)優(yōu)選的實(shí)施方案中,在細(xì)菌系統(tǒng)中產(chǎn)生了NAM融合體。細(xì)菌表達(dá)系統(tǒng)是可以廣泛獲得的,包括例如質(zhì)粒。一個(gè)適合的細(xì)菌啟動(dòng)子是能夠結(jié)合細(xì)菌RNA聚合酶并啟動(dòng)進(jìn)入mRNA的融合體的編碼序列下游(3’)轉(zhuǎn)錄的任何核酸序列。細(xì)菌啟動(dòng)子具有一個(gè)通常位于編碼序列5’端近端的轉(zhuǎn)錄起始區(qū)。此轉(zhuǎn)錄啟始區(qū)典型地包括一個(gè)RNA聚合酶結(jié)合位點(diǎn)和一個(gè)轉(zhuǎn)錄起始位點(diǎn)。編碼代謝通路酶的序列提供了特別有用的啟動(dòng)子序列。實(shí)施例包括來(lái)自糖代謝酶的啟動(dòng)子序列,如半乳糖、乳糖和麥芽糖,以及來(lái)自生物合成酶,如色氨酸的序列。也可使用來(lái)自噬菌體的啟動(dòng)子,并為本專(zhuān)業(yè)已知技術(shù)。此外,也可使用合成的啟動(dòng)子和雜交的啟動(dòng)子,例如,tac啟動(dòng)子是trp和lac啟動(dòng)子序列的雜交體。進(jìn)一步,細(xì)菌啟動(dòng)子可以包括具有結(jié)合細(xì)菌RNA聚合酶并啟動(dòng)轉(zhuǎn)錄能力的、天然存在的非細(xì)菌來(lái)源的啟動(dòng)子。除了功能性啟動(dòng)子序列以外,也需要一個(gè)有效的核糖體結(jié)合位點(diǎn)。在大腸桿菌,核糖體結(jié)合位點(diǎn)被稱(chēng)為Shine-Delagarno(SD)序列,包括一個(gè)起始密碼子和位于啟始密碼子上游3-11核苷酸位的3-9個(gè)核苷酸長(zhǎng)度的序列。表達(dá)載體也可包括一個(gè)信號(hào)肽序列,以使融合蛋白在細(xì)菌或其它細(xì)胞中分泌。如本專(zhuān)業(yè)所熟知的,信號(hào)序列典型地編碼一個(gè)含有疏水氨基酸的信號(hào)肽,引導(dǎo)蛋白從細(xì)胞中分泌。蛋白分泌進(jìn)培養(yǎng)基(革蘭陽(yáng)性細(xì)菌)或周質(zhì)腔內(nèi),后者位于細(xì)胞內(nèi)膜和外膜之間(革蘭陰性細(xì)菌)。細(xì)菌表達(dá)載體還可包含一個(gè)可選擇的標(biāo)記基因,以選擇被轉(zhuǎn)化的細(xì)菌株。適合的篩選基因包括使細(xì)菌對(duì)藥物如氨芐青霉素、氯霉素、紅霉素、卡那霉素、新霉素和四環(huán)素產(chǎn)生抗性的基因??蛇x擇的標(biāo)記還包括生物合成基因,如那些在組氨酸、色氨酸和亮氨酸生物合成通路中的基因。其中適合的細(xì)菌細(xì)胞含有例如,其中用于枯草桿菌、大腸桿菌、乳脂鏈球菌和青紫鏈球菌(Streptococcuslividans)的載體。細(xì)菌表達(dá)載體可用本專(zhuān)業(yè)熟知的技術(shù)轉(zhuǎn)化進(jìn)細(xì)菌宿主細(xì)胞,如氯化鈣處理、電擊孔法、和其它方法。應(yīng)用細(xì)菌細(xì)胞的一個(gè)好處是能夠繁殖含表達(dá)載體的細(xì)胞,從而產(chǎn)生克隆種群。NAM融合蛋白也可以在昆蟲(chóng)細(xì)胞如Sf9細(xì)胞中產(chǎn)生。用于昆蟲(chóng)細(xì)胞轉(zhuǎn)化作用的表達(dá)載體,特別是桿狀病毒為基礎(chǔ)的表達(dá)載體,為本專(zhuān)業(yè)所熟知,并在如,O’Reilly等人,桿狀病毒表達(dá)載體實(shí)驗(yàn)室手冊(cè)(紐約牛津大學(xué)出版社,1994)中有所描述。此外,NAM融合蛋白可以在酵母細(xì)胞中產(chǎn)生。酵母表達(dá)系統(tǒng)在本專(zhuān)業(yè)內(nèi)為人熟知,包括例如釀酒酵母、白色念珠菌和麥芽糖念珠菌、多形漢遜酵母、脆弱克羅維酵母和乳酸克羅維酵母、畢赤Guillerimondii和P.pastoris、非洲粟酒裂殖酵母和Yarrowialipolytica的表達(dá)載體。優(yōu)選的在酵母中表達(dá)的啟動(dòng)子序列包括可誘導(dǎo)的GAL1,10啟動(dòng)子、來(lái)自乙醇脫氫酶、烯醇酶、葡萄糖激酶、葡萄糖-6-磷酸異構(gòu)酶、甘油醛-3-磷酸-脫氫酶、已糖激酶、磷酸果糖激酶、3-磷酸甘油酸變位酶、丙酮酸激酶以及酸性磷酸酶基因。酵母選擇性標(biāo)記包括ADE2、HIS4、LEU2、TRP1和ALG7,它們具有對(duì)衣霉素的抗性;新霉素磷酸轉(zhuǎn)移酶基因具有對(duì)G418的抗性;CUP1基因使得酵母可以在有銅離子存在的情況下生長(zhǎng)。應(yīng)用酵母細(xì)胞的一個(gè)好處是能夠繁殖含載體的細(xì)胞,從而產(chǎn)生克隆種群。優(yōu)選的表達(dá)載體見(jiàn)圖49A-49N。除了這里概述的組分,包括NAM酶-候選蛋白融合體、EASs、連接子、融合配體等以外,表達(dá)載體可含有一些其它組分,包括如這里概述的選擇基因(特別包括生長(zhǎng)促進(jìn)或生長(zhǎng)抑制功能)、可活化元件、重組信號(hào)(如cre和lox位點(diǎn))和標(biāo)記物。優(yōu)選地,本發(fā)明的融合肽、融合核酸、結(jié)合物等,進(jìn)一步含有一個(gè)標(biāo)記成分。再且,關(guān)于本發(fā)明的融合配體,標(biāo)記可以被融合到一個(gè)或多個(gè)其它組分上,例如,在NAM酶和候選蛋白仍然附著時(shí)融合到NAM融合蛋白上,或當(dāng)發(fā)生分裂時(shí)融合到任一組分上,或分別融合到自身啟動(dòng)子上。此外,如在下面進(jìn)一步描述的,檢測(cè)系統(tǒng)的其它組分可被標(biāo)記。標(biāo)記可以是直接或間接的檢測(cè)標(biāo)記,在這里有時(shí)被稱(chēng)做“初級(jí)”和“次級(jí)”標(biāo)記。這里的“檢測(cè)標(biāo)記”或“可檢測(cè)標(biāo)記”是指允許檢測(cè)的部分。這可能是初級(jí)標(biāo)記或次級(jí)標(biāo)記。因此,檢測(cè)標(biāo)記可能是初級(jí)標(biāo)記(如可直接檢測(cè))或次級(jí)標(biāo)記(可間接檢測(cè))。大體上,標(biāo)記分為4類(lèi)a)同位素標(biāo)記,可能是放射活性的或重同位素;b)磁、電、溫度標(biāo)記;c)有顏色的或熒光的染料或部分;和d)結(jié)合配體。標(biāo)記也可以包括酶(辣根過(guò)氧化酶等)和磁性顆粒。在一個(gè)優(yōu)選實(shí)施方案中,檢測(cè)標(biāo)記是初級(jí)標(biāo)記。一個(gè)初級(jí)標(biāo)記是可以直接檢測(cè)的,如熒光基團(tuán)。優(yōu)選的標(biāo)記包括,例如,生色基團(tuán)或磷光劑,但最好是熒光染料或部分。熒光基團(tuán)可以是“小分子”熒光源或蛋白質(zhì)熒光源。在一個(gè)優(yōu)選的實(shí)施方案中,特別對(duì)于靶分子的標(biāo)記,如下所述,適用于本發(fā)明的染料包括但不限于,熒光的鑭系復(fù)合物包括銪和鋱、熒光素、羅丹明、四甲基羅丹明、伊紅、藻紅、香豆素、甲基-香豆素、量子點(diǎn)(也稱(chēng)做“微結(jié)晶”)、芘、孔雀(Malacite)綠、二苯乙烯、金星黃、級(jí)聯(lián)藍(lán)(CascadeBlue)、得克薩斯紅、Cy染料(Cy3、Cy5等)、alexa染料、藻紅蛋白、bodipy和其它在RichardP.Haugland著的第6版分子探針手冊(cè)中所描述者,在此特別加入作為參考。在一個(gè)優(yōu)選的實(shí)施方案中,例如當(dāng)標(biāo)記附著在融合多肽或?qū)⒆鳛楸磉_(dá)載體的一部分表達(dá)時(shí),使用蛋白質(zhì)熒光源。適合的自發(fā)熒光蛋白包括但不限于,來(lái)自Aequorea和其變異體的綠熒光蛋白(GFP);包括但不限于GFP(Chalfie等人,科學(xué)263(5148)802-805(1994));增強(qiáng)的GFP(EGFP;Clontech-基因庫(kù)進(jìn)入號(hào)U55762)),藍(lán)熒光蛋白(BFP;QuantumBiotechnologies,Inc.1801deMaisonneuveBlvd.West,8thFloor,Montreal(Quebec)CanadaH3H1J9;Stauber,R.H.生物技術(shù)(Biotechniques)24(3)462-471(1998);Heim,R.和Tsien,R.Y.Curr.Biol.6178-182(1996))和增強(qiáng)的黃熒光蛋白(EYFP;ClontechLaboratories,Inc.,1020EastMeadowCircle,PaloAlto,CA94303)。此外,近期報(bào)道有來(lái)自Renilla種屬的自發(fā)熒光蛋白。見(jiàn)WO92/15673;WO95/07463;WO98/14605;WO98/26277;WO99/49019;美國(guó)專(zhuān)利5,292,658;美國(guó)專(zhuān)利5,418,155;美國(guó)專(zhuān)利5,683,888;美國(guó)專(zhuān)利5,741,668;美國(guó)專(zhuān)利5,777,079;美國(guó)專(zhuān)利5,804,387;美國(guó)專(zhuān)利5,874,304;美國(guó)專(zhuān)利5,876,995;和美國(guó)專(zhuān)利5,925,558;所有這些均特別加入作為參考。在一個(gè)優(yōu)選的實(shí)施方案中,標(biāo)記蛋白是Aequorea綠熒光蛋白或其變異體之一;見(jiàn)Cody等人,生物化學(xué)(Biochemistry)321212-1218(1993);和Inouye和Tsuji,F(xiàn)EBSLett.341277-280(1994),兩者在此均特別加入作為參考。在一個(gè)優(yōu)選的實(shí)施方案中,使用一個(gè)次級(jí)可檢測(cè)標(biāo)記。次級(jí)標(biāo)記是間接檢測(cè)的標(biāo)記;例如,次級(jí)標(biāo)記可以結(jié)合或與一個(gè)用于檢測(cè)的初級(jí)標(biāo)記起反應(yīng),可以作用于一個(gè)附加產(chǎn)物上以產(chǎn)生一個(gè)初級(jí)標(biāo)記(如酶類(lèi)),或可使含次級(jí)標(biāo)記的化合物與非標(biāo)記物質(zhì)分離,等等。次級(jí)標(biāo)記包括但不限于,結(jié)合配體對(duì)之一;化學(xué)可修飾的部分;酶如辣根過(guò)氧化酶、堿性磷酸酶、熒光素酶等;以及細(xì)胞表面標(biāo)志,等。在一個(gè)優(yōu)選的實(shí)施方案中,次級(jí)標(biāo)記是一個(gè)結(jié)合配體對(duì)。例如,標(biāo)記可以是一個(gè)半抗原或抗原,將與其結(jié)合配體結(jié)合。在一個(gè)優(yōu)選的實(shí)施方案中,結(jié)合配體可被附著在固體支持物上以使含標(biāo)記的組分與不含者分離。例如,適合的結(jié)合配體對(duì)包括但不限于抗原(如蛋白(包括肽))和抗體(包括其片段(FAbs等));蛋白和小分子,包括生物素/抗生物素蛋白鏈菌素;酶類(lèi)和底物或抑制劑;其它蛋白-蛋白反應(yīng)對(duì);受體-配體;和碳水化合物及其結(jié)合配體。也使用核酸-核酸結(jié)合蛋白對(duì)。總之,盡管不是所有實(shí)施方案都需要,配體對(duì)中較小者與系統(tǒng)組分附著以加入檢測(cè)中。優(yōu)選的結(jié)合配體對(duì)包括但不限于生物素(或亞胺-生物素)和抗生物素蛋白鏈菌素、地高辛和Abs,等。在一個(gè)優(yōu)選的實(shí)施方案中,結(jié)合配體對(duì)包括一個(gè)初級(jí)檢測(cè)標(biāo)記(例如與檢測(cè)組分附著)和一個(gè)將與初級(jí)檢測(cè)標(biāo)記特異結(jié)合的抗體。關(guān)于“特異結(jié)合”,這里是指配體對(duì)結(jié)合的特異性足以將配體對(duì)和系統(tǒng)的其它組分或污染物區(qū)分開(kāi)來(lái)。在檢測(cè)條件下結(jié)合將足以保持連接,包括沖洗步驟以去除非特異結(jié)合。在一些實(shí)施方案中,配體對(duì)的解離常數(shù)將小于大約10-4-10-6M-1,優(yōu)選小于大約10-5-10-9M-1,特別優(yōu)選為小于大約10-7-10-9M-1。在一個(gè)優(yōu)選的實(shí)施方案中,次級(jí)標(biāo)記是一個(gè)化學(xué)可修飾的部分。在該實(shí)施方案中,含有活性功能基團(tuán)的標(biāo)記摻入檢測(cè)組分中。然后,功能基團(tuán)接著被一個(gè)初級(jí)標(biāo)記標(biāo)記。合適的功能基團(tuán)包括但不限于,氨基、羧基、順丁烯二酰亞胺基、橋氧基和硫醇基,氨基和硫醇基是特別優(yōu)選的。例如,含氨基的初級(jí)標(biāo)記可以與含氨基的次級(jí)標(biāo)記連接,例如采用本專(zhuān)業(yè)已知的連接子;例如已為人熟知的同-或異-雙功能連接子(見(jiàn)1994PierceChemicalCompany目錄,交叉連接子的技術(shù)章節(jié),155-200頁(yè),在此加入作為參考)。為控制融合酶與EAS的連接,構(gòu)建表達(dá)載體以提供進(jìn)一步的選擇是有益處的。例如,EAS能夠以無(wú)功能的兩部分導(dǎo)入核酸分子,在酶介導(dǎo)或非酶介導(dǎo)的同源重組作用下,如cre-lox介導(dǎo)的重組,結(jié)合起來(lái),形成一個(gè)有功能的EAS。同樣地,引用的cre-lox因素也可以用于控制功能融合酶的形成。cre-lox重組的控制優(yōu)選通過(guò)在可誘導(dǎo)啟動(dòng)子控制下,引導(dǎo)重組酶基因進(jìn)入表達(dá)系統(tǒng)而調(diào)節(jié),無(wú)論在同一個(gè)核酸分子上或在另一個(gè)表達(dá)載體上??傊?,一旦本發(fā)明的表達(dá)載體形成,它們可以有兩種結(jié)局之一,僅僅舉例為它們被導(dǎo)入無(wú)細(xì)胞翻譯系統(tǒng)產(chǎn)生在體外檢測(cè)的核酸/蛋白(NAP)結(jié)合物文庫(kù),或者,優(yōu)選地導(dǎo)入宿主細(xì)胞,在那里形成NAP結(jié)合物;細(xì)胞可被任意地溶解和相應(yīng)地檢測(cè)。在一個(gè)優(yōu)選的實(shí)施方案中,制成表達(dá)載體并導(dǎo)入無(wú)細(xì)胞系統(tǒng)以翻譯,在NAP酶與EAS附著后形成了一個(gè)核酸/蛋白(NAP)結(jié)合物。關(guān)于這里的“核酸/蛋白結(jié)合物”或“NAP結(jié)合物”是指NAP酶和EAS間的共價(jià)結(jié)合,使得含EAS的表達(dá)載體與NAP酶共價(jià)連接。適合的無(wú)細(xì)胞翻譯系統(tǒng)在本專(zhuān)業(yè)內(nèi)已知。一旦形成,NAP結(jié)合物如以下所概述被用于檢測(cè)。在一個(gè)優(yōu)選的實(shí)施方案中,本發(fā)明的表達(dá)載體被導(dǎo)入這里概述的宿主細(xì)胞中。關(guān)于“導(dǎo)入”或在此的語(yǔ)法等同者是指核酸以一種適于隨后核酸表達(dá)的方式進(jìn)入細(xì)胞。引導(dǎo)方法在很大程度上由靶細(xì)胞類(lèi)型決定,在以下會(huì)有討論。方法的舉例包括CaPO4沉淀、脂質(zhì)體融合、脂質(zhì)轉(zhuǎn)染、電擊孔法、病毒感染、基因槍?zhuān)鹊?。侯選核酸可穩(wěn)定地整合進(jìn)宿主細(xì)胞基因組中(例如,用這里概述的逆轉(zhuǎn)錄病毒引導(dǎo)),或可暫時(shí)地或穩(wěn)定地存在于細(xì)胞漿內(nèi)(即,通過(guò)應(yīng)用傳統(tǒng)的質(zhì)粒、應(yīng)用標(biāo)準(zhǔn)調(diào)節(jié)序列、選擇標(biāo)記,等等)。適合的宿主細(xì)胞概述如上,真核細(xì)胞、哺乳動(dòng)物和人類(lèi)細(xì)胞均是優(yōu)選的。許多前面描述的方法涉及細(xì)菌細(xì)胞內(nèi)肽文庫(kù)的表達(dá)。然而,本專(zhuān)業(yè)內(nèi)可以理解的是,翻譯機(jī)制如密碼子選擇、蛋白折疊機(jī)制和例如哺乳動(dòng)物肽的翻譯后修飾,如果該修飾一定要發(fā)生的話,在細(xì)菌細(xì)胞內(nèi)是無(wú)法實(shí)現(xiàn)或改變的。細(xì)菌細(xì)胞內(nèi)篩選的肽文庫(kù)經(jīng)常涉及短氨基酸序列的表達(dá),它們不能模擬蛋白質(zhì)的天然結(jié)構(gòu)。篩選這些小的、亞片段序列不能有效地測(cè)定天然蛋白質(zhì)的功能,因?yàn)槔缱R(shí)別其受體的小配體的需求很容易地被沒(méi)有天然結(jié)構(gòu)的小片段滿(mǎn)足。由于沒(méi)有三維結(jié)構(gòu)的復(fù)雜性,因此簡(jiǎn)化了結(jié)合的要求。本發(fā)明的一個(gè)優(yōu)點(diǎn)是能夠在天然環(huán)境和天然蛋白結(jié)構(gòu)的情況下表達(dá)和篩選未知肽的能力。融合酶與其相應(yīng)表達(dá)載體的共價(jià)結(jié)合使得可在除細(xì)菌之外的有機(jī)體內(nèi)篩選肽。一旦導(dǎo)入一個(gè)真核宿主細(xì)胞內(nèi),核酸分子即轉(zhuǎn)運(yùn)到核內(nèi),在此發(fā)生復(fù)制和轉(zhuǎn)錄。轉(zhuǎn)錄產(chǎn)物遷移到細(xì)胞漿以進(jìn)行翻譯和翻譯后修飾。然而,產(chǎn)生的肽和相應(yīng)的核酸分子必須相遇以進(jìn)行連接,這個(gè)過(guò)程被真核細(xì)胞的區(qū)室化所阻礙。NAM酶-EAS識(shí)別可以四種方式發(fā)生,無(wú)論如何本發(fā)明只是舉例而無(wú)意限制。首先,宿主細(xì)胞可以進(jìn)行一個(gè)周期的分裂,在此過(guò)程中核的包膜破裂。第二,宿主細(xì)胞可被用病毒感染,并在核包膜上打孔。第三,特殊的核定位或轉(zhuǎn)運(yùn)信號(hào)可被導(dǎo)入進(jìn)融合酶。最后,宿主細(xì)胞細(xì)胞器可被用本專(zhuān)業(yè)已知的方法破壞。上述方法的最終結(jié)果是將表達(dá)載體轉(zhuǎn)移進(jìn)與融合酶相同的環(huán)境中。DNA結(jié)合蛋白和前述表達(dá)文庫(kù)附著位點(diǎn)之間的非共價(jià)作用不能經(jīng)受起真核細(xì)胞內(nèi)使融合蛋白與其表達(dá)載體結(jié)合所需的步驟。其它在本專(zhuān)業(yè)描述的DNA-蛋白連接,如那些應(yīng)用細(xì)菌P2ADNA結(jié)合肽者,需要結(jié)合肽保持與其編碼DNA有直接接觸而使結(jié)合得以發(fā)生,即,翻譯必須發(fā)生在編碼序列的近端(見(jiàn),例如,Lindahl,病毒學(xué)(Virology),42,522-533(1970))。這種連接只在原核系統(tǒng)中可以完成而在真核細(xì)胞中不能產(chǎn)生。一旦NAM酶表達(dá)載體被導(dǎo)入進(jìn)宿主細(xì)胞,細(xì)胞就被任意地溶解。細(xì)胞溶解通過(guò)任何適合的技術(shù)完成,如本專(zhuān)業(yè)已知的各種技術(shù)的任一種(見(jiàn),例如,Sambrook等人,分子克隆,實(shí)驗(yàn)室指南,第二版,ColdSpringHarborPress,ColdSpringHarbor,N.Y.(1989),和Ausubel等人,現(xiàn)代分子生物學(xué)方法,GreenePublishingAssociates和JohnWiley&Sons,NewYork,N.Y.(1994),因此在此特別加入作為參考)。大多數(shù)細(xì)胞溶解的方法涉及給予化學(xué)、酶或機(jī)械刺激。盡管融合酶與其編碼核酸分子的連接是共價(jià)連接,因此可以比非共價(jià)鍵經(jīng)受更多樣的條件,但仍應(yīng)注意要保證融合酶-核酸分子復(fù)合物保持完整,即融合酶仍然與表達(dá)載體連在一起。在一個(gè)優(yōu)選的實(shí)施方案中,NAP結(jié)合物可在細(xì)胞溶解后被純化或分離。理想狀態(tài)是,含融合蛋白-核酸分子復(fù)合物的溶解物與得到的大部分細(xì)胞碎片分離開(kāi),以加速與靶目標(biāo)的相互作用。例如,NAP結(jié)合物可從表達(dá)后通常與其共同存在的一些或所有蛋白和化合物中分離或純化出來(lái),因而可能實(shí)質(zhì)上是純的。例如,一個(gè)分離的NAP結(jié)合物至少不伴有一些通常在天然(未純化)狀態(tài)下與其相連的物質(zhì),在一個(gè)給定樣本的總蛋白中,按重量?jī)?yōu)選的組成大約至少為0.5%,更優(yōu)選地至少大約5%或更多。一個(gè)基本上純的蛋白按重量至少包括75%或以上的總蛋白,優(yōu)選至少80%以上,特別優(yōu)選地大約90%以上。NAP結(jié)合物根據(jù)樣本中存在的其它組分的種類(lèi),可采用本專(zhuān)業(yè)技術(shù)人員已知的各種方法分離或純化。標(biāo)準(zhǔn)的純化方法包括電泳、分子、免疫學(xué)和色譜技術(shù),包括離子交換、疏水性、親合性、反相HPLC色譜法、凝膠過(guò)濾和色譜聚焦。也使用超濾和透濾技術(shù)與蛋白濃縮技術(shù)的結(jié)合。關(guān)于適合的純化技術(shù)的一般指導(dǎo)見(jiàn),Scopes,R.,蛋白純化,Springer-Verlag,NY(1982)。所需要的純化程度根據(jù)NAP結(jié)合物應(yīng)用的不同而異。在某些情況下,不需要純化。因此,本發(fā)明提供的NAP結(jié)合物是溶解的、可選擇性純化或分離的,或者包含在宿主細(xì)胞內(nèi)。如果需要的話,一旦表達(dá)和純化,NAP結(jié)合物可在多種應(yīng)用中使用,包括體外和離體的篩選技術(shù)。本專(zhuān)業(yè)的一個(gè)普通技術(shù)人員將理解,本發(fā)明方法的體外和離體實(shí)施方案在數(shù)個(gè)研究領(lǐng)域內(nèi)可使用。例如,本發(fā)明可應(yīng)用于診斷檢測(cè)中,并可在數(shù)個(gè)學(xué)科中被用于研究,包括但不限于,臨床藥理學(xué)、功能性遺傳學(xué)、藥物遺傳學(xué)、農(nóng)業(yè)化學(xué)、環(huán)境安全評(píng)價(jià)、化學(xué)傳感器、營(yíng)養(yǎng)生物學(xué)、化妝品研究和酶學(xué)。在一個(gè)優(yōu)選的實(shí)施方案中,NAP結(jié)合物被用在體外篩選技術(shù)中。在此實(shí)施方案中,制備了NAP結(jié)合物,并進(jìn)行了篩選以結(jié)合和/或調(diào)節(jié)靶分子的生物活性。本發(fā)明的一個(gè)強(qiáng)勢(shì)是可以識(shí)別結(jié)合到候選蛋白上的靶分子。如下面更充分概述的,這一點(diǎn)有廣泛的應(yīng)用,包括闡明信號(hào)傳導(dǎo)通路的成員、闡明一個(gè)藥物或其它目的化合物的結(jié)合配體,等。因此,NAP結(jié)合物被用于檢測(cè)靶分子。關(guān)于“靶分子”或在此的語(yǔ)法等同者,是指一種相互作用所尋找的分子;此術(shù)語(yǔ)是本專(zhuān)業(yè)技術(shù)人員普遍理解的。靶分子包括生物學(xué)的或非生物學(xué)的目標(biāo)分子。生物學(xué)靶分子是指任何限定的和非限定的生物學(xué)顆粒,如巨分子復(fù)合物,包括病毒、細(xì)胞、組織和其組合物,是作為細(xì)胞內(nèi)生物學(xué)反應(yīng)的結(jié)果而產(chǎn)生的。非生物學(xué)靶分子是指作為人或非人類(lèi)活動(dòng)的結(jié)果在細(xì)胞外產(chǎn)生的分子或結(jié)構(gòu)。本發(fā)明的文庫(kù)也可被用于化學(xué)上限定的靶分子和化學(xué)上非限定的靶分子。“化學(xué)上限定的靶分子”是指那些具有已知化學(xué)性質(zhì)和/或組成的靶分子;“化學(xué)上非限定的靶分子”是指具有未知或部分已知化學(xué)性質(zhì)/組成的靶分子。因此,適合的靶分子包含各種不同的種類(lèi),包括但不限于,細(xì)胞、病毒、蛋白(特別地包括酶、細(xì)胞表面受體、離子通道、轉(zhuǎn)錄因子,和由致病基因產(chǎn)生或在疾病狀態(tài)中表達(dá)的蛋白)、碳水化合物、脂肪酸和類(lèi)脂、核酸,化學(xué)成分如小分子、農(nóng)藥、藥物、離子(特別是金屬離子)、多聚體和其它生物材料。因此,例如與集合物(天然存在的和合成的)或其他生物材料的結(jié)合,可用本發(fā)明的方法和成分實(shí)現(xiàn)。在一個(gè)方面,靶分子是一段核酸序列,且目的候選蛋白有與該核酸序列結(jié)合的能力。本發(fā)明很好地適于鑒定DNA結(jié)合肽和其編碼序列,以及被DNA結(jié)合肽識(shí)別和結(jié)合的靶核酸。已知DNA-蛋白質(zhì)相互作用在控制基因表達(dá)和染色體結(jié)構(gòu)上發(fā)揮重要作用,從而決定著某個(gè)細(xì)胞的整體基因程序。據(jù)估計(jì)只有5%的人類(lèi)基因組參與編碼蛋白質(zhì)。因此,其余95%可能是DNA結(jié)合蛋白作用的位點(diǎn),從而控制著許多遺傳程序,如調(diào)節(jié)基因表達(dá)。盡管在人基因組中存在的DNA結(jié)合肽的數(shù)量尚不清楚,但可獲得的許多基因組完整序列信息揭示了全部“底物”,即DNA結(jié)合肽可能作用的DNA序列的整個(gè)組成部分。因此,在遺傳學(xué)研究中它將有益于(1)識(shí)別編碼DNA結(jié)合肽的核酸序列,和(2)決定這些DNA結(jié)合肽的底物。目前用于測(cè)定蛋白-DNA相互作用的方法集中在研究DNA和特異蛋白靶分子的個(gè)別相互作用上。多種生物化學(xué)和分子檢測(cè)包括DNA印記、核酶保護(hù)、凝膠遷移和親合性色譜結(jié)合,被用于研究蛋白質(zhì)-DNA相互作用。盡管這些方法對(duì)于測(cè)定個(gè)別DNA-蛋白質(zhì)相互作用是有用的,它們并不適于在基因組水平大規(guī)模分析這些相互作用。因此,在本專(zhuān)業(yè)內(nèi)需要進(jìn)行DNA結(jié)合蛋白和其作用的DNA序列的大規(guī)模分析。本發(fā)明的方法和文庫(kù)對(duì)這種分析可用于這些分析。例如,編碼潛在DNA結(jié)合肽的融合酶文庫(kù)可以篩選靶DNA片段群。靶DNA片段群可以是,例如隨機(jī)DNA、片段的基因組DNA、變性序列或多種一級(jí)、二級(jí)或三級(jí)結(jié)構(gòu)的DNA序列。如果需要,DNA結(jié)合肽-底物結(jié)合的特異性可以通過(guò)改變靶DNA識(shí)別序列的長(zhǎng)度而改變。測(cè)定潛在的DNA結(jié)合肽與靶DNA片段群中一員的結(jié)合,并進(jìn)一步對(duì)被DNA結(jié)合肽結(jié)合的特定DNA識(shí)別序列進(jìn)行研究。為加速融合酶-靶核酸復(fù)合物的鑒定,DNA片段群可以被結(jié)合到例如珠子上,或構(gòu)建成微芯片上的DNA列陣。因此,應(yīng)用本發(fā)明的方法,一個(gè)本專(zhuān)業(yè)普通技術(shù)人員可以鑒定DNA結(jié)合肽,鑒定DNA結(jié)合肽的編碼序列,并確定DNA結(jié)合肽識(shí)別和結(jié)合的核酸序列。因此,在一個(gè)實(shí)施方案中,本發(fā)明提供了根據(jù)其相對(duì)位置生成DNA結(jié)合序列和DNA結(jié)合蛋白圖譜的方法,以提供用蛋白和序列注解的染色體圖譜。然后,一個(gè)包含這些信息的數(shù)據(jù)庫(kù)將可以對(duì)基因表達(dá)概貌、疾病表現(xiàn)型和藥理遺傳學(xué)數(shù)據(jù),以及類(lèi)似物進(jìn)行關(guān)聯(lián)。因此,在篩選系統(tǒng)中使用NAP結(jié)合物檢測(cè)對(duì)靶分子的結(jié)合和/或篩選侯選物質(zhì)的調(diào)節(jié)靶分子活性的能力??傊Y選系統(tǒng)首先被設(shè)計(jì)成可以發(fā)現(xiàn)能夠與靶分子結(jié)合的候選蛋白,然后這些蛋白被用在評(píng)價(jià)候選蛋白調(diào)節(jié)靶分子生物活性能力的檢測(cè)中。因此,可以進(jìn)行幾種不同的檢測(cè);結(jié)合檢測(cè)和活性檢測(cè)。如將被本專(zhuān)業(yè)人員理解的那樣,這些檢測(cè)可用各種配置進(jìn)行,包括液相檢測(cè)和應(yīng)用有支持載體的系統(tǒng)。在一個(gè)優(yōu)選的實(shí)施方案中,檢測(cè)包括將本發(fā)明的NAP結(jié)合物與一個(gè)靶分子結(jié)合,并確定NAP結(jié)合物的候選蛋白與靶分子的結(jié)合。優(yōu)選地,NAP結(jié)合物文庫(kù)(如包括不同候選蛋白的文庫(kù))接觸單一型靶分子、多數(shù)靶分子、或靶分子的一個(gè)或更多文庫(kù)。一般地,在一個(gè)這里方法的優(yōu)選實(shí)施方案中,本發(fā)明的一個(gè)組成部分,NAP結(jié)合物或靶分子,不擴(kuò)散地與一個(gè)具有獨(dú)立的樣本接受區(qū)域(如微滴定板、列陣,等)的不溶性支持物結(jié)合。不溶性支持物可由任何測(cè)定成分能夠結(jié)合的組分制成,并容易地與可溶性物質(zhì)分離,另外與篩選的總體方法相容。該支持物的表面可以是固體的或多孔的,并為任何合適的形狀。適合的不溶性支持物的例子包括微滴定板、列陣、膜和珠。典型地由玻璃、塑料(如聚苯乙烯)、多糖、尼龍或硝酸纖維、特氟隆,等制成。微滴定板和列陣特別合適,因?yàn)榭梢詰?yīng)用少量的試劑和樣本同時(shí)進(jìn)行大量的檢測(cè)??梢赃x擇的是,可應(yīng)用微珠基質(zhì)的檢測(cè),特別是使用熒光激活的細(xì)胞分類(lèi)術(shù)(FACS)。結(jié)合檢測(cè)成分的特殊方法并不重要,只要與反應(yīng)試劑和本發(fā)明的總體方法相容,保持組分的活性并不擴(kuò)散就可以。優(yōu)選的結(jié)合方法包括應(yīng)用抗體(當(dāng)?shù)鞍捉Y(jié)合到支持物上時(shí)不在空間上阻斷配體結(jié)合位點(diǎn)或活化序列)、介導(dǎo)與“粘性”或離子支持物上的結(jié)合、化學(xué)交聯(lián)、應(yīng)用標(biāo)記的成分(如檢測(cè)成分是生物素化的和表面含有鏈霉素抗生物素蛋白,等)、在表面上合成靶分子,等等。在NAP結(jié)合物或靶分子結(jié)合后,多余的未結(jié)合物質(zhì)通過(guò)適當(dāng)?shù)姆椒ㄈコ?,包括例如化學(xué)的、物理的和生物學(xué)的分離技術(shù)。然后,樣本接受表面可通過(guò)與牛血清白蛋白(BSA)、酪蛋白或其他無(wú)害蛋白質(zhì)或其他部分孵育而被封閉。在一個(gè)優(yōu)選的實(shí)施方案中,靶分子結(jié)合到支持物上,并加入NAP結(jié)合物進(jìn)行檢測(cè)。也可以NAP結(jié)合物結(jié)合到支持物上加入靶分子進(jìn)行檢測(cè)。新的結(jié)合試劑包括特異性抗體、在化學(xué)文庫(kù)的篩選系統(tǒng)中鑒定的非天然結(jié)合試劑、肽類(lèi)似物,等。特別感興趣的是對(duì)人細(xì)胞具有低毒性的試劑的篩選檢測(cè)。確定靶分子和候選蛋白結(jié)合可采用多種測(cè)定方法,包括但不限于標(biāo)記的體外蛋白-蛋白結(jié)合試驗(yàn)、電泳遷移率試驗(yàn)、蛋白結(jié)合的免疫檢測(cè)、標(biāo)記測(cè)定、功能試驗(yàn)(磷酸化試驗(yàn)等),等等。候選蛋白與靶分子結(jié)合的測(cè)定可用幾種方法進(jìn)行。在一個(gè)優(yōu)選的實(shí)施方案中,組分之一,優(yōu)選可溶性成分,被標(biāo)記,通過(guò)測(cè)定標(biāo)記來(lái)直接檢測(cè)結(jié)合。例如,可以將NAP結(jié)合物附著于固體支持物上,加入標(biāo)記的靶分子(例如含熒光標(biāo)記的靶分子),去除多余的試劑,并確定標(biāo)記是否存在于固體支持物上。此系統(tǒng)也可相反地進(jìn)行,靶分子(或一個(gè)靶文庫(kù))被結(jié)合到支持物上,加入一個(gè)NAP結(jié)合物,優(yōu)選含有初級(jí)或次級(jí)標(biāo)記者。例如,含有與GFP或變異體融合的NAP結(jié)合物是特別有用的。如本專(zhuān)業(yè)已知的,可以使用多種封閉和沖洗步驟。如本專(zhuān)業(yè)人員將理解的那樣,還可以在固定到支持物上之前使NAP結(jié)合物與靶分子接觸。在一個(gè)優(yōu)選實(shí)施方案中,固體支持物是一個(gè)排列格式;即應(yīng)用一個(gè)含有一個(gè)或多個(gè)與列陣附著的靶分子或NAP結(jié)合物文庫(kù)的生物芯片。這在核酸結(jié)合蛋白的檢測(cè)中特別有用,如本專(zhuān)業(yè)熟知的核酸生物芯片。在該實(shí)施方案中,核酸靶在列陣上加入NAP結(jié)合物。同樣,可以使用靶蛋白文庫(kù)的蛋白質(zhì)生物芯片,加入標(biāo)記的NAP結(jié)合物??蛇x擇的是,通過(guò)系統(tǒng)的核酸組分,或者通過(guò)蛋白組分可將NAP結(jié)合物附著到芯片上。這也可以用微珠基質(zhì)的系統(tǒng)進(jìn)行;例如,為測(cè)定核酸結(jié)合蛋白,可以用微珠或其他固體支持物進(jìn)行標(biāo)準(zhǔn)的“分裂和混合”技術(shù),或任何標(biāo)準(zhǔn)的寡核苷酸合成方案,以制備序列文庫(kù)。然后加入NAP結(jié)合物文庫(kù)以測(cè)定結(jié)合到特定序列的候選蛋白。在一些實(shí)施方案中,只有組分之一被標(biāo)記;可選擇地,可用不同的標(biāo)記物標(biāo)記在一個(gè)以上組分上。在一個(gè)優(yōu)選的實(shí)施方案中,候選蛋白的結(jié)合通過(guò)采用競(jìng)爭(zhēng)結(jié)合檢測(cè)而確定。在該實(shí)施方案中,競(jìng)爭(zhēng)者是一個(gè)已知與靶分子結(jié)合的結(jié)合部分,如抗體、肽、結(jié)合配體、配體,等。在某些情況下,在靶分子和結(jié)合部分之間存在競(jìng)爭(zhēng)性結(jié)合,結(jié)合部分代替了靶分子。因此,本發(fā)明的優(yōu)選應(yīng)用是測(cè)定一個(gè)藥物將結(jié)合的組分。即,有許多藥物,其作用的靶目標(biāo)未知,或僅部分已知。從藥物和含有其作用的細(xì)胞類(lèi)型的cDNA表達(dá)產(chǎn)物文庫(kù)的NAP結(jié)合物出發(fā),可闡明藥物所結(jié)合的蛋白。通過(guò)識(shí)別信號(hào)傳導(dǎo)通路中的其他蛋白或靶分子,這些新識(shí)別的蛋白可作為反向篩選的工具用于其他的藥物篩選,或概括化學(xué)誘導(dǎo)事件。此外,采用同樣的方法進(jìn)行毒性研究是可能的;通過(guò)鑒定某些藥物不希望結(jié)合的蛋白,可以用該信息設(shè)計(jì)沒(méi)有這些不合需要副作用的藥物衍生物。另外,侯選藥物可以進(jìn)行這些類(lèi)型的篩選以尋找任一或所有類(lèi)型的相互作用,包括不希望的結(jié)合反應(yīng)。同樣,也可能使用藥物衍生物文庫(kù)作為靶目標(biāo),以提供一個(gè)二維的分析??稍跈z測(cè)中使用陽(yáng)性對(duì)照和陰性對(duì)照。優(yōu)選地,所有對(duì)照和測(cè)試樣本至少進(jìn)行三次以獲得統(tǒng)計(jì)學(xué)顯著的結(jié)果。所有樣本孵育的時(shí)間足以使試劑結(jié)合到蛋白上。孵育后,對(duì)所有樣本進(jìn)行沖洗使其不含非特異結(jié)合物質(zhì),所測(cè)定結(jié)合的數(shù)量,一般為標(biāo)記試劑的量。例如,在使用放射標(biāo)記時(shí),樣本可在閃爍計(jì)數(shù)器內(nèi)計(jì)數(shù)以測(cè)定結(jié)合化合物的量。同樣,ELISA技術(shù)通常是優(yōu)選的。許多其他的試劑可在篩選試驗(yàn)中使用。包括例如,但不限于,鹽類(lèi)、中性蛋白如白蛋白、去垢劑等,它們可被用于促進(jìn)最佳的蛋白-蛋白結(jié)合和/或減少非特異或背景反應(yīng)。另外,還有改善檢測(cè)效率的試劑可以使用,如蛋白酶抑制劑、核酶抑制劑、抗微生物劑、輔因子如cAMP、ATP等。組分混合物可以以結(jié)合所必需的任何順序加入。還可以進(jìn)行調(diào)節(jié)靶分子活性的試劑的篩選。如本專(zhuān)業(yè)人員將理解的那樣,真正的篩選將依賴(lài)于識(shí)別靶分子。在一個(gè)優(yōu)選的實(shí)施方案中,篩選能夠調(diào)節(jié)靶分子活性的候選蛋白的方法包括,如上所述將NAP結(jié)合物加入靶樣本中,測(cè)定靶目標(biāo)生物活性的改變。本文中“調(diào)節(jié)”或“改變”包括活性增加、活性下降、或展示活性的類(lèi)型或種類(lèi)改變。因此,在此實(shí)施方案中,候選蛋白應(yīng)當(dāng)與靶分子結(jié)合(盡管這不是必需的),并如這里所定義的改變其生物學(xué)或生物化學(xué)活性。方法包括上面總體概述的體外篩選方法,并離體篩選改變了靶分子的表現(xiàn)、分布、活性或數(shù)量的細(xì)胞。可選擇地,候選蛋白可被確定為不干擾靶分子活性,這在測(cè)定藥物-藥物的相互作用中有用。因此,在該實(shí)施方案中,其方法包括結(jié)合一個(gè)靶分子,優(yōu)選一個(gè)NAP結(jié)合物文庫(kù),并評(píng)價(jià)其對(duì)靶分子生物活性的影響。這可以用很多種的方法進(jìn)行,如本專(zhuān)業(yè)人員將理解的那樣。在這些體外系統(tǒng)如無(wú)細(xì)胞系統(tǒng)中,在任一實(shí)施方案如體外結(jié)合或活性檢測(cè)中,一旦發(fā)現(xiàn)一個(gè)“命中”,NAP結(jié)合物即被回收以鑒定候選蛋白?;厥誑AP結(jié)合物可以用許多方法進(jìn)行,正如本專(zhuān)業(yè)人員將理解的那樣,并將依賴(lài)所用系統(tǒng)的類(lèi)型和結(jié)構(gòu)。在一個(gè)優(yōu)選的實(shí)施方案中,如這里所概括的,應(yīng)用了一個(gè)挽救標(biāo)記或“回收性能”。如上面概述的,“回收性能”是在結(jié)合到靶目標(biāo)時(shí)能使融合酶分離的性能。例如,靶目標(biāo)可被構(gòu)建與生物素相連,它能夠應(yīng)用一個(gè)包被有鏈菌抗生物素的親合柱使靶目標(biāo)結(jié)合的融合酶復(fù)合物分離。可選擇地,該靶目標(biāo)可以附著在磁珠上,可以收集磁珠并通過(guò)改變周?chē)艌?chǎng)將其與未結(jié)合的候選蛋白分開(kāi)。可選擇地,當(dāng)靶標(biāo)不含挽救標(biāo)記時(shí),NAP結(jié)合物可含有挽救標(biāo)記。例如,親合性標(biāo)記可被整合進(jìn)融合蛋白本身。同樣,融合酶-核酸分子復(fù)合物也可通過(guò)免疫沉淀法被回收。可選擇地,挽救標(biāo)記可含有獨(dú)特的載體序列,該序列可被用于PCR擴(kuò)增編碼候選蛋白的核酸序列。在后一個(gè)實(shí)施方案中,如果使用的PCR序列在此區(qū)域之外(不覆蓋此區(qū)域),就可不必打斷核酸和蛋白間的共價(jià)連接。在一個(gè)優(yōu)選的實(shí)施方案中,在分離目標(biāo)NAP結(jié)合物后,可以通過(guò)應(yīng)用,例如,無(wú)核酶的蛋白酶、加入非特異性核酸、或任何其它優(yōu)先消化蛋白質(zhì)而非核酸的條件來(lái)切斷融合酶和其編碼核酸分子間的共價(jià)連接??刹捎萌魏芜m合的方法純化核酸分子,如本專(zhuān)業(yè)已知的那些方法,然后可用于進(jìn)一步擴(kuò)增、測(cè)序或演變成編碼所需候選蛋白的核酸序列。適合的擴(kuò)增技術(shù)包括PCR、OLA、SDA、NASBA、TMA、Q-βR等所有形式?!懊小毙畔⒌男蛄袘?yīng)用在下面討論。在一個(gè)優(yōu)選的實(shí)施方案中,NAP結(jié)合物被用于離體的篩選技術(shù)中。在此實(shí)施方案中,本發(fā)明的表達(dá)載體被導(dǎo)入宿主細(xì)胞以篩選具有所需性能,如能夠改變細(xì)胞表現(xiàn)型的候選蛋白。本發(fā)明方法的一個(gè)優(yōu)點(diǎn)是融合酶文庫(kù)的篩選可以在細(xì)胞內(nèi)完成。本專(zhuān)業(yè)的一個(gè)普通技術(shù)人員會(huì)理解,相對(duì)于在體外溶解細(xì)胞篩選的方法,在其自然條件中篩選候選蛋白的好處。在離體或體內(nèi)的篩選方法中,不同的肽以其天然構(gòu)型展示,并在其它可能的干擾或增強(qiáng)性的細(xì)胞試劑存在的情況下被篩選。因此,細(xì)胞內(nèi)篩選提供了候選蛋白實(shí)際活性的更準(zhǔn)確的圖譜,從而能更好的預(yù)測(cè)離體或在體的肽活性。此外,可以觀察候選蛋白對(duì)細(xì)胞生理學(xué)的影響。因此,我們發(fā)現(xiàn)本發(fā)明在篩選真核細(xì)胞中特別有用。離體和/或體內(nèi)篩選可以以幾種方式進(jìn)行。在一個(gè)優(yōu)選的實(shí)施方案中,不必知道靶目標(biāo);相反地,含本發(fā)明表達(dá)載體的細(xì)胞因表現(xiàn)型的改變而被篩選出來(lái)。如下概述,具有改變了表現(xiàn)型的細(xì)胞被分離,并識(shí)別了與NAP結(jié)合物結(jié)合的靶分子,盡管如本專(zhuān)業(yè)人員將理解以及這里概述的那樣,也可以在形成NAP結(jié)合物之前融合多肽和靶分子結(jié)合??蛇x擇地,靶目標(biāo)可外源地加入細(xì)胞,并進(jìn)行結(jié)合和/或靶活性調(diào)節(jié)的篩選。在后一實(shí)施方案中,靶目標(biāo)應(yīng)當(dāng)能夠穿透膜,例如,通過(guò)直接穿透或經(jīng)過(guò)膜轉(zhuǎn)運(yùn)蛋白、或與轉(zhuǎn)運(yùn)成分如脂類(lèi)部分或下面描述的HIV-轉(zhuǎn)移活化基因融合。一般,實(shí)驗(yàn)條件允許篩選前在細(xì)胞內(nèi)形成NAP結(jié)合物,盡管這不是需要的。即,NAM融合酶與EAS的附著可發(fā)生在篩選過(guò)程中的任何時(shí)刻,之前、之中或之后,只要在細(xì)胞或含有不同融合核酸的細(xì)胞溶解物混合前,實(shí)驗(yàn)條件能使附著過(guò)程發(fā)生。如本專(zhuān)業(yè)那些技術(shù)人員將理解的,本實(shí)施方案所用的細(xì)胞類(lèi)型的范圍可以很廣泛?;旧希梢允褂萌魏握婧嘶蛟思?xì)胞,優(yōu)選哺乳動(dòng)物細(xì)胞,特別是小鼠、大鼠、靈長(zhǎng)類(lèi)和人類(lèi)細(xì)胞。宿主細(xì)胞可以是單細(xì)胞,或細(xì)胞群,如在細(xì)胞培養(yǎng)物、組織、器官、器官系統(tǒng)或有機(jī)體(如昆蟲(chóng)、植物或動(dòng)物)中。如在下面更充分描述的,篩選系統(tǒng)的建立是細(xì)胞在存在候選蛋白的情況下具有可選擇的表現(xiàn)型。如在下面更充分描述的,只要設(shè)計(jì)成適合的篩選系統(tǒng)以選擇具有改變了表現(xiàn)型的細(xì)胞,與許多疾病狀態(tài)相關(guān)聯(lián)的細(xì)胞類(lèi)型就特別有用,其中該表現(xiàn)型是細(xì)胞內(nèi)存在侯選物的結(jié)果。因此,適合的細(xì)胞類(lèi)型包括但不限于,所有類(lèi)型腫瘤細(xì)胞(特別是黑色素瘤,髓性白血病,肺、乳腺、卵巢、結(jié)腸、腎、前列腺、胰腺和睪丸的癌瘤)、心肌細(xì)胞、內(nèi)皮細(xì)胞、上皮細(xì)胞、淋巴細(xì)胞(T-細(xì)胞和B細(xì)胞)、肥大細(xì)胞、嗜酸細(xì)胞、血管內(nèi)膜細(xì)胞、肝細(xì)胞、白細(xì)胞包括單核細(xì)胞,干細(xì)胞如造血系統(tǒng)、神經(jīng)、皮膚、肺、腎、肝和肌細(xì)胞的干細(xì)胞(用于篩選分化和去分化因子),破骨細(xì)胞、軟骨細(xì)胞和其它結(jié)締組織細(xì)胞、角脘細(xì)胞、黑素細(xì)胞、肝細(xì)胞、腎細(xì)胞和脂肪細(xì)胞。適合的細(xì)胞也包括已知的研究用細(xì)胞,包括但不限于,JurkatT細(xì)胞、NIH3T3細(xì)胞、CHO、Cos等。見(jiàn)ATCC細(xì)胞系目錄,在此特別加入作為參考。在一個(gè)實(shí)施方案中,細(xì)胞可能是基因工程的,即含有外源的核酸,例如含靶分子。在一個(gè)優(yōu)選的實(shí)施方案中,第一批多數(shù)細(xì)胞被篩選。即,根據(jù)改變的表現(xiàn)型篩選導(dǎo)入了表達(dá)載體的細(xì)胞。因此,在此實(shí)施方案中,候選蛋白的作用見(jiàn)于其形成的同一細(xì)胞內(nèi);即自分泌作用。對(duì)于在此的“多數(shù)細(xì)胞”是指粗略從大約103細(xì)胞到108或109細(xì)胞,從106到108是優(yōu)選的。該多數(shù)細(xì)胞含有一個(gè)細(xì)胞文庫(kù),其中,盡管如本專(zhuān)業(yè)技術(shù)人員會(huì)理解的,文庫(kù)中的一些細(xì)胞可能不含有表達(dá)載體,一些細(xì)胞可能含有多于一個(gè)載體,通常文庫(kù)中的每個(gè)細(xì)胞含有NAP結(jié)合物分子庫(kù)的一個(gè)成員,即不同的候選蛋白。在一個(gè)優(yōu)選的實(shí)施方案中,表達(dá)載體被導(dǎo)進(jìn)第一批多數(shù)細(xì)胞,候選蛋白的作用在第二批或第三批多數(shù)細(xì)胞中篩選到,不同于第一批多數(shù)細(xì)胞,即通常是一個(gè)不同的細(xì)胞類(lèi)型。這就是,候選蛋白以細(xì)胞外作用影響第二批細(xì)胞;即內(nèi)分泌或旁分泌作用。這些采用標(biāo)準(zhǔn)的技術(shù)進(jìn)行。第一批多數(shù)細(xì)胞可生長(zhǎng)在一種培養(yǎng)基里或培養(yǎng)基上,將培養(yǎng)基與第二批多數(shù)細(xì)胞接觸并檢測(cè)其效應(yīng)??蛇x擇地,可直接接觸細(xì)胞。因此,“接觸”是功能性接觸,包括直接和間接的接觸。在此實(shí)施方案中,第一批多數(shù)細(xì)胞可被篩選或不被篩選。如果必要,細(xì)胞被置于適合融合核酸表達(dá)的條件(如當(dāng)使用可誘導(dǎo)啟動(dòng)子時(shí))以產(chǎn)生候選蛋白。因此,本發(fā)明方法優(yōu)選包括引導(dǎo)一個(gè)融合核酸的分子文庫(kù)或表達(dá)載體進(jìn)入多數(shù)細(xì)胞,由此產(chǎn)生一個(gè)細(xì)胞文庫(kù)。優(yōu)選地,兩個(gè)或多個(gè)核酸包含編碼不同候選蛋白的不同核酸序列。然后如下面更充分概括的,在多數(shù)細(xì)胞中篩選具有改變了表現(xiàn)型的細(xì)胞。表現(xiàn)型的改變是由于候選蛋白的存在。對(duì)于“改變的表現(xiàn)型”或“改變的生理學(xué)”或這里其他的語(yǔ)法等同者是指細(xì)胞表現(xiàn)型在某些方面發(fā)生改變,優(yōu)選某些可檢測(cè)的和/或可測(cè)量的方面。如本領(lǐng)域內(nèi)將理解的那樣,本發(fā)明的一個(gè)強(qiáng)項(xiàng)是廣泛的細(xì)胞類(lèi)型和用本方法可被檢測(cè)的潛在表現(xiàn)型改變。因此,可被觀察、檢測(cè)或測(cè)量的任何表現(xiàn)型改變可能是這里的篩選方法的基礎(chǔ)。適合的表現(xiàn)型改變包括但不限于大體的生理學(xué)改變?nèi)缂?xì)胞形態(tài)、細(xì)胞生長(zhǎng)、細(xì)胞活力、對(duì)基質(zhì)或其它細(xì)胞的粘附、和細(xì)胞密度的改變;一個(gè)或多個(gè)RNAs、蛋白質(zhì)、脂類(lèi)、激素、細(xì)胞因子或其他分子表達(dá)的改變;一個(gè)或多個(gè)RNAs、蛋白質(zhì)、脂類(lèi)、激素、細(xì)胞因子或其他分子;均衡狀態(tài)(即半衰期)的改變或,一個(gè)或多個(gè)RNAs、蛋白質(zhì)、脂類(lèi)、激素、細(xì)胞因子或其他分子的改變;一個(gè)或多個(gè)RNAs、蛋白質(zhì)、脂類(lèi)、激素、細(xì)胞因子或其他分子定位的改變;一個(gè)或多個(gè)RNAs、蛋白質(zhì)、脂類(lèi)、激素、細(xì)胞因子、受體或其他分子生物活性或特異活性的改變;離子、細(xì)胞因子、激素、生長(zhǎng)因子或其他分子分泌的改變;細(xì)胞膜電位、極化作用、完整性或轉(zhuǎn)運(yùn)的改變;傳染性、易感性、潛伏期、粘附、攝取病毒和細(xì)菌性病原體的改變;等等。對(duì)于“能夠改變表現(xiàn)型”這里是指候選蛋白能夠以某種可檢測(cè)和/或可測(cè)量的方式改變細(xì)胞的表現(xiàn)型。改變的表現(xiàn)型可被各種各樣的方法檢測(cè),如下面更充分描述的,通常將依賴(lài)和對(duì)應(yīng)于被改變的表現(xiàn)型。一般地,用下面的方法檢測(cè)改變的表現(xiàn)型,例如細(xì)胞形態(tài)的顯微鏡分析;標(biāo)準(zhǔn)的細(xì)胞活力鑒定,包括細(xì)胞死亡的增加和細(xì)胞活力的增加,例如,細(xì)胞現(xiàn)在對(duì)由病毒、細(xì)菌、細(xì)菌的或合成的毒素引起的細(xì)胞死亡具有抵抗性;標(biāo)準(zhǔn)的標(biāo)記試驗(yàn)如檢測(cè)特定細(xì)胞或分子的存在或其水平的熒光指示劑試驗(yàn),包括FACS或其它染料染色技術(shù);在細(xì)胞殺死后靶化合物表達(dá)的生物化學(xué)檢測(cè);等。本方法在例如癌癥應(yīng)用中是有用的。快速和特異性地殺死腫瘤細(xì)胞的能力是癌癥化療的基礎(chǔ)。通常,應(yīng)用本發(fā)明的方法,可以將隨機(jī)或直接的文庫(kù)(包括cDNA文庫(kù))導(dǎo)入任何腫瘤細(xì)胞中(原位的或培養(yǎng)的),自身識(shí)別的肽誘導(dǎo)凋亡、細(xì)胞死亡、喪失分裂或減少細(xì)胞生長(zhǎng)。這可重新開(kāi)始做,或通過(guò)對(duì)已知肽制劑的有偏倚的隨機(jī)化進(jìn)行,已知肽物質(zhì)如抑制血管壁生長(zhǎng)的血管生長(zhǎng)抑素??蛇x擇地,本發(fā)明的方法可以與其他癌癥治療(如藥物或放射)聯(lián)合以使細(xì)胞致敏,從而在接觸第二個(gè)藥劑后迅速引起特異性的凋亡、細(xì)胞死亡、喪失分裂或細(xì)胞生長(zhǎng)下降。同樣,本方法可用于與已知的癌癥治療結(jié)合,以篩選使治療更有效或較少毒性的激動(dòng)劑。這在生產(chǎn)如紫杉酚而使化療非常昂貴時(shí)特別優(yōu)選。在一個(gè)優(yōu)選的實(shí)施方案中,本發(fā)明在涉及感染性生物的試驗(yàn)中也有用途。細(xì)胞內(nèi)生物如分枝桿菌、李斯特桿菌屬、沙門(mén)氏菌、肺囊蟲(chóng)、耶爾森氏菌屬、利什曼原蟲(chóng)、克魯斯錐蟲(chóng),可以在細(xì)胞內(nèi)存在和復(fù)制,并在免疫抑制的病人體內(nèi)活動(dòng)。目前已有上市的藥物和研究中的藥物,它們對(duì)這些生物僅部分有效或無(wú)效。侯選文庫(kù)可以被插入特定的感染有這些生物的細(xì)胞內(nèi)(感染前或后),所選擇的候選蛋白以類(lèi)似于細(xì)胞內(nèi)“抗生素肽”的方式,與爪蟾抗菌肽一樣促進(jìn)這些生物的細(xì)胞內(nèi)破壞。此外,可以選擇增強(qiáng)已經(jīng)在服用中的藥物的殺滅特性的候選肽,這些服用中的藥物本身效力不足,但當(dāng)與侯選文庫(kù)中的特定肽聯(lián)合使用時(shí),則通過(guò)協(xié)同機(jī)制明顯改變了其療效。最后,可以分離改變這些細(xì)胞內(nèi)生物代謝的候選蛋白,其作用方式為通過(guò)抑制一個(gè)關(guān)鍵的生物活動(dòng)而終止它們的細(xì)胞內(nèi)生命周期。在一個(gè)優(yōu)選的實(shí)施方案中,本發(fā)明的組合物和方法被用于測(cè)定蛋白-蛋白相互作用,類(lèi)似于應(yīng)用一個(gè)雙雜交的篩選。這一點(diǎn)可以以各種方法和各種形式進(jìn)行。如本專(zhuān)業(yè)技術(shù)人員將理解的那樣,本實(shí)施方案和其它這里概述者可以進(jìn)行“一維”分析或“多維”分析。即,一個(gè)NAP結(jié)合物文庫(kù)可以碰上一個(gè)單一靶分子或靶文庫(kù)。可選擇地,超過(guò)一個(gè)NAP結(jié)合物文庫(kù)可以相遇。在一個(gè)優(yōu)選的實(shí)施方案中,本發(fā)明的組合物和方法被用于發(fā)現(xiàn)蛋白藥物,特別是在細(xì)胞表面上與靶目標(biāo)相互作用的蛋白藥物。在一個(gè)優(yōu)選的實(shí)施方案中,如上所概述的,采用核酸作為靶目標(biāo),本發(fā)明的組合物和方法被用于發(fā)現(xiàn)DNA或核酸結(jié)合蛋白。在一個(gè)優(yōu)選的實(shí)施方案中,本發(fā)明的組合物和方法被用于篩選降低對(duì)宿主細(xì)胞毒性的NAM酶。例如,本發(fā)明的Rep蛋白對(duì)某些宿主細(xì)胞可以是有毒性的。本發(fā)明的方法可被用于鑒定或產(chǎn)生毒性降低的Rep蛋白。在此特別的實(shí)施方案中,在本發(fā)明結(jié)合物中使用了Rep變異體或作為替換的隨機(jī)肽,以觀察細(xì)胞毒性以及與EAS的結(jié)合親合性。關(guān)于EASs,本發(fā)明方法還可被用于鑒定新的或改良的EASs,以用在本發(fā)明的表達(dá)載體中。對(duì)一個(gè)特定目的NAM酶的EAS也可以用本發(fā)明的方法鑒定。NAM酶和EAS共價(jià)結(jié)構(gòu)的形成可以采用本專(zhuān)業(yè)內(nèi)介紹的適當(dāng)方法確定,如在美國(guó)專(zhuān)利5545529中所描述的。一般地,侯選NAM酶可用多種宿主表達(dá),如細(xì)菌或哺乳動(dòng)物細(xì)胞。然后表達(dá)的蛋白可用侯選DNA序列檢測(cè),這種片段文庫(kù)來(lái)自克隆NAM酶的基因組。在適合條件(如包含輔因子)下,NAM酶和DNA片段文庫(kù)間的接觸得以形成共價(jià)NAM酶-DNA結(jié)合物。然后該混合物可以用多種技術(shù)進(jìn)行分離。然后將分離的結(jié)合核酸序列進(jìn)行鑒定和測(cè)序。這些序列可通過(guò)多種誘變技術(shù)被進(jìn)一步檢測(cè)。確定的序列基序然后可被用作EAS。在一個(gè)優(yōu)選的實(shí)施方案中,本發(fā)明的組合物和方法被用于藥理遺傳學(xué)研究。例如,通過(guò)從具有不同表現(xiàn)型的個(gè)體中構(gòu)建文庫(kù)并檢測(cè)其對(duì)應(yīng)的靶分子,可以產(chǎn)生不同的結(jié)合概貌。因此,優(yōu)選的實(shí)施方案應(yīng)用不同的NAP結(jié)合物對(duì)靶分子的不同結(jié)合概貌來(lái)闡明疾病基因、SNPs或蛋白。在一個(gè)優(yōu)選的實(shí)施方案中,一旦檢測(cè)到一個(gè)改變了表現(xiàn)型的細(xì)胞,該細(xì)胞即從沒(méi)有改變表現(xiàn)型的群體中分離出來(lái)。這可用許多方式進(jìn)行,如本專(zhuān)業(yè)已知的,并在某些情況下依賴(lài)于測(cè)定或篩選系統(tǒng)。適合的分離技術(shù)包括但不限于,F(xiàn)ACS,采用補(bǔ)體的溶胞選擇,細(xì)胞克隆,用Fluorimager掃描,“生存”蛋白的表達(dá),細(xì)胞表面蛋白或其它分子的誘導(dǎo)表達(dá),它們可被加上熒光或標(biāo)記以進(jìn)行物理分離;表達(dá)一個(gè)將非熒光分子改變?yōu)闊晒夥肿拥拿?;在無(wú)或緩慢生長(zhǎng)的背景下過(guò)度生長(zhǎng);細(xì)胞死亡和DNA分離或其它細(xì)胞活力指示劑染料,等等。在一個(gè)優(yōu)選的實(shí)施方案中,如上所概述的,NAP結(jié)合物從陽(yáng)性細(xì)胞中分離。這可以許多方法進(jìn)行。在一個(gè)優(yōu)選的實(shí)施方案中,與NAP構(gòu)建物常見(jiàn)的DNA區(qū)域互補(bǔ)的引物,或與文庫(kù)的特殊成分,例如如上所述的一個(gè)挽救序列,被用于“挽救”獨(dú)特的候選蛋白序列??蛇x擇地,候選蛋白用一個(gè)挽救序列分離。因此,例如,含抗原表位標(biāo)記或純化序列的挽救序列可用于采用免疫沉淀或親合柱對(duì)候選蛋白的分離。在某些情況下,如下面概述的,如果在候選蛋白和靶分子間有足夠強(qiáng)的結(jié)合作用,這也可分離初級(jí)靶分子??蛇x擇地,肽可用質(zhì)譜分析檢測(cè)。一旦被挽救,可以確定候選蛋白和融合核酸的序列。該信息然后可被以數(shù)種方式應(yīng)用,如基因組數(shù)據(jù)庫(kù)。對(duì)于體外、離體和體內(nèi)篩選方法,一旦鑒定出“命中”序列,其結(jié)果被優(yōu)先證實(shí)。如本專(zhuān)業(yè)技術(shù)人員理解的那樣,可以采用多種適合的方法。在一個(gè)優(yōu)選的實(shí)施方案中,候選蛋白被重新合成并再次導(dǎo)入靶細(xì)胞內(nèi)以證實(shí)其效果。這一點(diǎn)可用重組的方法進(jìn)行,如通過(guò)用表達(dá)載體(或修飾版本,如用不再是融合體一部分的候選蛋白)轉(zhuǎn)化天然細(xì)胞,或可選擇地應(yīng)用HIV-轉(zhuǎn)移活化基因蛋白融合體、類(lèi)似物和相關(guān)的蛋白,使之非常高效的被靶細(xì)胞攝取。見(jiàn)例如,F(xiàn)awell等人,PNASUSA91664(1994);Frankel等人,細(xì)胞551189(1988);Savion等人,生物學(xué)化學(xué)雜志(J.Biol.Chem.)2561149(1981);Derossi等人,生物學(xué)化學(xué)雜志(J.Biol.Chem.)26910444(1994);和Baldin等人,歐洲分子生物學(xué)雜志(EMBOJ.)91511(1990),所有這些均加入作為參考。此外,對(duì)于體外和離體篩選方法,步驟可能是反復(fù)使用的。即,候選蛋白的序列被用于產(chǎn)生更多的候選蛋白。例如,蛋白序列可能是第二輪隨機(jī)化周期(偏倚的)的基礎(chǔ),以形成具有增加或改變活性的作用物。可選擇地,第二輪隨機(jī)化周期可改變作用物的親合性。進(jìn)一步,如果候選蛋白是一個(gè)隨機(jī)肽,可能期望將識(shí)別的作用物的隨機(jī)區(qū)放進(jìn)其它表現(xiàn)結(jié)構(gòu)中,或改變表現(xiàn)結(jié)構(gòu)的恒定區(qū)序列以改變候選蛋白的構(gòu)型/形狀。采用本發(fā)明文庫(kù)的方法可涉及多輪的篩選以鑒定目的核酸。例如,一旦一個(gè)核酸分子被鑒定,就可以用不同的靶分子重復(fù)本方法。多個(gè)文庫(kù)可以同時(shí)或相繼和/或以結(jié)合方式篩選,以確保準(zhǔn)確的結(jié)果。此外,通過(guò)包括將一個(gè)鑒定的候選蛋白作為后續(xù)篩選周期的靶目標(biāo),可以重復(fù)應(yīng)用本方法以描繪旁路或代謝過(guò)程的圖譜。在一個(gè)優(yōu)選的實(shí)施方案中,候選蛋白被用于識(shí)別靶分子,如候選蛋白與之相互作用的分子。如將被本專(zhuān)業(yè)技術(shù)人員理解的那樣,有可能是蛋白直接與之結(jié)合或作用的初級(jí)靶分子,也可能是次級(jí)靶分子,它們是受蛋白作用物影響的信號(hào)傳導(dǎo)通路的一部分;這些可能被稱(chēng)為“確證的靶分子”。在一個(gè)優(yōu)選的實(shí)施方案中,候選蛋白被用于分離靶分子。例如,如這里概括的,如果靶分子是蛋白質(zhì),應(yīng)用抗原表位標(biāo)記或純化序列可以經(jīng)過(guò)生物化學(xué)手段(共免疫沉淀法、親合柱,等)純化初級(jí)靶分子??蛇x擇地,當(dāng)肽在細(xì)菌內(nèi)表達(dá)和純化時(shí),可以被用作針對(duì)細(xì)菌cDNA表達(dá)文庫(kù)的探針,該文庫(kù)由靶細(xì)胞類(lèi)型的mRNA制成?;颍目稍诮湍富虿溉閯?dòng)物兩或三雜交系統(tǒng)中被用作“誘餌”。這種相互作用克隆方法在分離DNA-結(jié)合蛋白和其它相互作用蛋白成分中是非常有用的。肽(類(lèi))可與其它藥學(xué)激動(dòng)劑結(jié)合以研究所討論的信號(hào)傳導(dǎo)通路的上位關(guān)系。還可能經(jīng)人工合成制備標(biāo)記肽,并用其篩選在噬菌體中表達(dá)的一個(gè)cDNA文庫(kù)以尋找與標(biāo)記肽結(jié)合的那些cDNA。一旦初級(jí)靶分子已經(jīng)鑒定,可用初級(jí)靶作為“誘餌”用同樣的方式鑒定次級(jí)靶分子。用此方式,可以闡明信號(hào)傳導(dǎo)通路。同樣,還可能發(fā)現(xiàn)對(duì)次級(jí)靶分子特異的蛋白作用物,使數(shù)種蛋白作用物作用在單一通路上,例如,聯(lián)合治療。在一個(gè)優(yōu)選的實(shí)施方案中,本發(fā)明的方法和組合物可用自動(dòng)系統(tǒng)執(zhí)行。許多系統(tǒng)通常直接使用96(或更多)孔微滴定板,但如本專(zhuān)業(yè)技術(shù)人員將理解的那樣,可使用許多不同的板或構(gòu)造。此外,這里概述的任何或所有步驟可能是自動(dòng)的;因此,例如,系統(tǒng)可能是完全或部分自動(dòng)的。多種自動(dòng)化元件可被用于執(zhí)行本發(fā)明方法或產(chǎn)生本發(fā)明的組合物,包括但不限于,一個(gè)或多個(gè)自動(dòng)化臂;放置微孔板的平板機(jī)械手;移動(dòng)并將板蓋置于無(wú)交叉污染平臺(tái)的自動(dòng)加蓋機(jī)械手;用一次性吸頭分配樣本的吸頭裝置;用于分配樣本的可沖洗吸頭裝置;96孔載樣板;冷卻的試劑架;微滴定板吸液管位(可隨意冷卻);平板和吸頭分層塔以及計(jì)算機(jī)系統(tǒng)。完全自動(dòng)化或微流體系統(tǒng)包括自動(dòng)液體、顆粒、細(xì)胞和生物體處理器,包括高通量吸液器以進(jìn)行所有篩選程序步驟。這包括液體、顆粒、細(xì)胞和生物體操作,如抽吸、分散、混合、稀釋、沖洗、準(zhǔn)確的容量轉(zhuǎn)移;回收和丟棄吸液器吸頭;和重復(fù)等容積移液操作以從一次樣本抽吸中多次傳送。這些操作是無(wú)交叉污染的液體、顆粒、細(xì)胞和生物體轉(zhuǎn)移。此設(shè)備自動(dòng)重復(fù)執(zhí)行將微孔板樣本到過(guò)濾器、隔膜、和/或子板、高密度轉(zhuǎn)移、全板連續(xù)稀釋、和高容量運(yùn)行。在一個(gè)優(yōu)選的實(shí)施方案中,使用了化學(xué)來(lái)源的顆粒、平板、試管、磁顆粒、或其它對(duì)檢測(cè)成分有特異性的固相基質(zhì)。微孔板、試管或其它任何固相基質(zhì)的結(jié)合表面包括,非極性表面、高極性表面、促進(jìn)共價(jià)結(jié)合的改良的右旋糖苷包被、抗體包被、為結(jié)合融和蛋白或肽的親合媒介,表面固定的蛋白如重組蛋白A或G、核苷樹(shù)脂或包被、和其它親合性基質(zhì),在本發(fā)明中是有用的。在一個(gè)優(yōu)選的實(shí)施方案中,裝載多孔平板、多試管、小試管、深孔平板、微離心管、冷凍瓶、方孔平板、過(guò)濾器、鑿子、導(dǎo)光纖維、微珠和其它固相基質(zhì)的平臺(tái),或有多種容量的平臺(tái)被容納在一個(gè)可升級(jí)的組件平臺(tái)上以增加容量。此組件平臺(tái)包括各種速度的軌道攪拌器、電打孔器,和用于多來(lái)源樣本的多位置工作平臺(tái)、樣本和試劑稀釋、實(shí)驗(yàn)平板、樣本和試劑儲(chǔ)器、吸液器吸頭和有效的沖洗站。在一個(gè)優(yōu)選的實(shí)施方案中,用熱循環(huán)器和熱調(diào)節(jié)系統(tǒng)穩(wěn)定熱交換器,如控制單元或平臺(tái),的溫度,為樣本孵育提供從4℃~100℃的準(zhǔn)確的溫度控制。在一個(gè)優(yōu)選的實(shí)施方案中,具有單或多個(gè)磁性探頭、親合性探頭或吸液管的可更換吸液頭(單腔或多腔)自動(dòng)控制液體、顆粒、細(xì)胞和生物體。多孔或多管磁性分離器或平臺(tái)以單或多樣本形式操縱液體、顆粒、細(xì)胞和生物體。在一些優(yōu)選的實(shí)施方案中,設(shè)備將包括一個(gè)探測(cè)器,根據(jù)標(biāo)記物和實(shí)驗(yàn)方法可以是多種不同的探測(cè)器。在一個(gè)優(yōu)選的實(shí)施方案中,有用的探測(cè)器包括具有多熒光道的顯微鏡;平板讀數(shù)器以用單波和雙波長(zhǎng)終末點(diǎn)提供熒光、紫外和可見(jiàn)分光光度的檢測(cè)和動(dòng)力學(xué)性能,熒光回聲能量傳遞(FRET),發(fā)光,淬滅,雙光子激發(fā)和密度重新分布;CCD相機(jī)以捕捉并將數(shù)據(jù)和圖象轉(zhuǎn)換為定量格式;和一個(gè)計(jì)算機(jī)工作站。這些將能夠監(jiān)測(cè)特殊標(biāo)記物在細(xì)胞、組織和生物體上的大小、生長(zhǎng)和表現(xiàn)型表達(dá);靶分子確認(rèn);引導(dǎo)最優(yōu)化;用公用或?qū)S械臄?shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)分析、采集、組織、和高通量篩選系統(tǒng)的整合。這些設(shè)備可以安裝在一個(gè)消毒的層流和通風(fēng)櫥內(nèi),或是封閉的、獨(dú)立的系統(tǒng),適合在多孔板或試管中進(jìn)行細(xì)胞培養(yǎng)生長(zhǎng)和轉(zhuǎn)化,以及危險(xiǎn)的操作?;罴?xì)胞將在可控的生長(zhǎng)條件下生長(zhǎng),在活細(xì)胞檢測(cè)的時(shí)間里控制溫度、濕度和氣體。自動(dòng)的細(xì)胞轉(zhuǎn)化和自動(dòng)的集落采集將促進(jìn)所需細(xì)胞的快速篩選。流式細(xì)胞儀或毛細(xì)電泳形式可被用于單獨(dú)捕捉磁性和其它微珠、顆粒、細(xì)胞和生物體。靈活的硬件和軟件使得設(shè)備適于多種應(yīng)用。軟件程序模塊可建立、修改和運(yùn)行該方法。系統(tǒng)診斷模塊可進(jìn)行設(shè)備校準(zhǔn)、校正連接并啟動(dòng)運(yùn)行。定制工具、實(shí)驗(yàn)室器皿和液體、顆粒、細(xì)胞和生物體的轉(zhuǎn)移方式可執(zhí)行不同的應(yīng)用要求。數(shù)據(jù)庫(kù)可儲(chǔ)存方法和參數(shù)。自動(dòng)和計(jì)算機(jī)界面可允許設(shè)備間的交流。在一個(gè)優(yōu)選的實(shí)施方案中,自動(dòng)工作站包括一個(gè)或多個(gè)加熱或冷卻部分。依反應(yīng)和試劑,可能需要冷卻或加熱,可以用許多已知的加熱或冷卻系統(tǒng)完成,包括Peltier系統(tǒng)。在一個(gè)優(yōu)選的實(shí)施方案中,自動(dòng)裝置包括一個(gè)與內(nèi)存和一組輸入/輸出設(shè)施(如鍵盤(pán)、鼠標(biāo)、監(jiān)視器、打印機(jī)等)通過(guò)數(shù)據(jù)傳送總線聯(lián)系的中央處理器。中央處理器、內(nèi)存、輸入/輸出設(shè)備和數(shù)據(jù)傳送總線間的交互作用為本專(zhuān)業(yè)已知技術(shù)。因此,根據(jù)要進(jìn)行的實(shí)驗(yàn),多種不同的程序存儲(chǔ)在CPU存儲(chǔ)器中。上面描述的篩選一個(gè)融合酶-核酸分子復(fù)合物庫(kù)以獲得編碼所需候選蛋白的核酸的方法,僅以候選蛋白的所需靶特性為依據(jù)。候選蛋白的序列或結(jié)構(gòu)不必知道。本發(fā)明的一個(gè)顯著優(yōu)點(diǎn)是在篩選過(guò)程中不需要候選蛋白的事先信息,只要鑒定的編碼核酸序列的產(chǎn)物具有生物學(xué)活性,如與靶向的化學(xué)或結(jié)構(gòu)部分的特異性連接。然后,鑒定的核酸分子可以被用來(lái)理解作為候選蛋白與靶目標(biāo)反應(yīng)的結(jié)果的細(xì)胞過(guò)程,以及任何隨后的治療或毒性活性是可能的。實(shí)施例下面的實(shí)施例用來(lái)更充分地描述應(yīng)用上面描述的本發(fā)明的方法,以及考慮設(shè)置進(jìn)行本發(fā)明各種方面的最佳模式??梢岳斫膺@些實(shí)施例決不是用來(lái)限制此發(fā)明的真正范圍,而是以舉例說(shuō)明的目的而列出。實(shí)施例1此實(shí)施例顯示了一個(gè)表達(dá)的融合蛋白與其編碼核酸分子的結(jié)合。編碼一個(gè)重組體Rep78-編碼DNA融合片段的質(zhì)粒pML2000,用本專(zhuān)業(yè)已知的方法構(gòu)建(見(jiàn),如,Sambrook等人,見(jiàn)上)。質(zhì)粒pML2000具有下列特征在大腸桿菌中有功能的一個(gè)DNA復(fù)制起點(diǎn);在哺乳動(dòng)物細(xì)胞中有功能的一個(gè)SV40復(fù)制起點(diǎn);在宿主細(xì)胞中有活性的結(jié)構(gòu)啟動(dòng)子,特別是CMV啟動(dòng)子;和一個(gè)AAV血清型2反向末端重復(fù)單位(ITR)序列的一個(gè)拷貝。關(guān)于其它組成部分的ITR方向性不明顯。AAVITR來(lái)源的核酸序列為5’-AGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCG-3’。以前已經(jīng)證明ITR序列的二倍結(jié)構(gòu)足以與Rep68變異體相互反應(yīng)(Chiorini等人,1994,見(jiàn)上)。得到的質(zhì)粒DNA在大腸桿菌內(nèi)擴(kuò)增并用DNAmaxiprep試劑盒(PromegaInc.,WI)純化。純化的DNA經(jīng)過(guò)磷酸鈣沉淀或電穿孔技術(shù)轉(zhuǎn)染進(jìn)組織培養(yǎng)的HEK293細(xì)胞(ATCC,MD)。在轉(zhuǎn)染后48小時(shí),收獲細(xì)胞并用1%TritonX-100在標(biāo)準(zhǔn)磷酸鹽緩沖鹽水中(PBS)溶解。在5000×g離心30分鐘后,上清被用于隨后的生化定性。pML2000在宿主細(xì)胞內(nèi)的表達(dá)使得(i)修飾的Rep78蛋白與參考配體以融合蛋白的形式表達(dá),和(ii)融合蛋白與連接信號(hào)在病毒或質(zhì)粒載體內(nèi)共價(jià)結(jié)合。采用抗-HA或抗-REP抗體經(jīng)過(guò)免疫印跡分析檢測(cè)重組體eREP的表達(dá)。特異抗體結(jié)合可通過(guò)ECL化學(xué)發(fā)光系統(tǒng)(Amersham-PharmaciaBiotech,IN)顯示。功能性Rep78蛋白的表達(dá)以前在哺乳動(dòng)物細(xì)胞培養(yǎng)系統(tǒng)中已經(jīng)證實(shí)。(Li等人,病毒學(xué)雜志(J.Virol.),71,5236-5243(1997))。形成DNA-eREP復(fù)合物的能力由下面的實(shí)驗(yàn)檢測(cè)。宿主細(xì)胞分別用兩個(gè)質(zhì)粒,pML2000和pML2000(ΔITR)轉(zhuǎn)染,以及用二者的聯(lián)合進(jìn)行轉(zhuǎn)染。對(duì)每一個(gè)相關(guān)的轉(zhuǎn)染,加入總量為10μg的DNA以獲得相似水平的eREP蛋白表達(dá)。轉(zhuǎn)染后48小時(shí),收獲細(xì)胞并制備蛋白溶解物。為檢測(cè)表達(dá)的eREP蛋白和質(zhì)粒DNA間的共價(jià)結(jié)合,溶解物首先煮沸5分鐘,并立即在冰上冷卻。每份樣本煮沸溶解物的一份分裝與抗-REP抗體混合,隨后用過(guò)量蛋白A瓊脂糖(Sigma,MO)孵育。在充分沖洗后,蛋白A瓊脂糖小珠被轉(zhuǎn)移到PCR試管中。通過(guò)聚合酶鏈反應(yīng)擴(kuò)增各質(zhì)粒特異的區(qū)域以檢測(cè)結(jié)合質(zhì)粒的存在。轉(zhuǎn)染的質(zhì)粒pML2000被蛋白A瓊脂糖沉淀而pML2000(ΔITR)不沉淀。形成的eREP-pML2000復(fù)合物耐熱,與eREP和表達(dá)質(zhì)粒pML2000間的共價(jià)結(jié)合一致。此外,該相互作用是ITR序列特異的,類(lèi)似于以前的體外和體內(nèi)數(shù)據(jù)(Yang等人,病毒學(xué)雜志(J.Virol.)66,6058-6069,(1992);Chiorini等人,病毒學(xué)雜志(J.Virol.)68,797-804(1994))。本實(shí)施例說(shuō)明了適用于在本發(fā)明方法中應(yīng)用的載體的構(gòu)建。結(jié)果表明酶-載體復(fù)合物在Rep蛋白表達(dá)后形成,且Rep蛋白與其編碼載體的結(jié)合是共價(jià)的。實(shí)施例2下面的實(shí)施例闡明了使用親合柱鑒定和分離核酸分子的方法,該核酸分子編碼具有靶特性的基因產(chǎn)物。為回收具有所需特性的蛋白,購(gòu)買(mǎi)了一個(gè)化學(xué)成分,例如FK506(CalBiochemInc.,CA),并用商品化化學(xué)連接試劑與生物素化學(xué)連接。在共軛連接后,化合物經(jīng)過(guò)標(biāo)準(zhǔn)的層析技術(shù)純化,并由NMR確證。為固定化合物,固定劑-496孔平板首先用10μg/ml抗生蛋白鏈菌素(SA)包被。包被后,添加溶于PBS的生物素化-FK506以飽和所有的結(jié)合位點(diǎn)。在去除過(guò)剩的生物素化-FK506后,包被的孔然后用1%BSAPBS封閉。沖洗后,用于親合性篩選的固定的化合物就制備好了。含融合酶-表達(dá)載體復(fù)合物的溶解物文庫(kù)通過(guò)首先用cDNA文庫(kù)轉(zhuǎn)染大約108哺乳動(dòng)物HEK細(xì)胞而制備,該cDNA文庫(kù)系用常規(guī)分子生物學(xué)技術(shù)從小鼠RNA中制備的。轉(zhuǎn)染48小時(shí)后,收獲細(xì)胞并通過(guò)離心收集。通過(guò)實(shí)施例1描述的溶解步驟,在存在蛋白酶抑制劑的情況下溶解細(xì)胞。通過(guò)5000×g離心30分鐘進(jìn)行總的粗溶解物的澄清。制備的細(xì)胞溶解物或者儲(chǔ)存在-80℃,或者立即用在經(jīng)生物素化-FK506包被的固定劑-4孔中。用生物素化-FK506孵育后,溶解物從固定劑-4平板中移出。然后,用12孔Nunc便攜式?jīng)_洗器(Corning,NY)用PBS充分沖洗板孔。通過(guò)用1%胰酶孵育,將結(jié)合的融合酶-表達(dá)載體復(fù)合物從生物素化-FK506上釋放出來(lái)。回收的DNA用Tris緩沖的苯酚提取兩次,并在1μg糖原存在的情況下,用標(biāo)準(zhǔn)的乙醇沉淀步驟沉淀。沉淀的DNA用70%乙醇沖洗一次,并用電穿孔法轉(zhuǎn)入細(xì)菌中。分離的DNA可進(jìn)一步如所期望的,接受下一周期的親合性篩選。本實(shí)施例闡明了應(yīng)用本發(fā)明的方法,分離編碼一個(gè)肽的核酸,該肽具有所需特性,即與FK506結(jié)合的能力。實(shí)施例3下面的實(shí)施例闡明了給插入表達(dá)載體以形成一個(gè)融合酶文庫(kù)的cDNA片段定性的方法。可以通過(guò)采用標(biāo)準(zhǔn)的方案和對(duì)NAM酶,如Rep78,特異的抗體,用ELISA定性cDNA編碼的具有所需特性的肽。因此,如果一個(gè)cDNA克隆編碼與FK506反應(yīng)的肽,可以推測(cè),含有相關(guān)質(zhì)粒DNA的細(xì)胞溶解物將對(duì)FK506包被的板孔有特異性,而對(duì)抗生蛋白鏈菌素(SA)包被的或其它陰性對(duì)照包被的板孔則沒(méi)有特異性。同樣,可以推測(cè),一個(gè)對(duì)照質(zhì)粒不會(huì)引起溶解物產(chǎn)生任何ELISA信號(hào)。按實(shí)施例2描述進(jìn)行的兩輪親合性篩選后,隨機(jī)選擇單個(gè)細(xì)菌轉(zhuǎn)化體克隆。在3mlLB氨芐青霉素(100μg/ml)中過(guò)夜培養(yǎng)單個(gè)克隆,采用標(biāo)準(zhǔn)的miniprepDNA試劑盒(Promega,WI)分離DNA。通過(guò)暫時(shí)轉(zhuǎn)染進(jìn)HEK293細(xì)胞獲得eREP-變異體肽融合蛋白的表達(dá)。轉(zhuǎn)染后48小時(shí),按實(shí)施例2的描述制備細(xì)胞溶解物。澄清的溶解物立即用于ELISA或儲(chǔ)存在-70℃。為準(zhǔn)備ELISA,首先用SA單獨(dú)或SA+生物素-FK506包被96孔平板。然后用pH7.4的1%BSA磷酸緩沖鹽水(PBS)封閉板孔。在用SA預(yù)包被后,板孔用添加有0.05%Tween-20的PBS(PBT)沖洗3次。在每孔中加進(jìn)100μl1∶10稀釋的溶解物以啟動(dòng)融合酶-表達(dá)載體復(fù)合物與孔表面的結(jié)合。4℃60分鐘后,平板用PBT沖洗4次。用兔抗-REP抗體檢測(cè)eREPDNA-融合酶結(jié)合部分肽的結(jié)合。用PBT沖洗4次后,繼續(xù)在平板上加入含堿性磷酸酶結(jié)合的羊抗兔抗體(GIBCO-BRL,MD)的PBS/0.1%BSA溶液(每孔100μl,25℃1小時(shí)),隨后用p-硝基苯基磷酸鹽(4mg/ml)的1M鹽酸二乙醇胺,pH9.8/0.24mMMgCl2溶液(每孔200μl)處理6-100分鐘。在一個(gè)E-max平板讀數(shù)儀(MolecularDevicesInc.,CA)上測(cè)試405nm光密度(O.D.)以對(duì)結(jié)合進(jìn)行定量化。陰性對(duì)照由用對(duì)照谷胱甘肽-S轉(zhuǎn)移酶(GST)融合或如所指定的其它對(duì)照包被的孔組成。對(duì)照質(zhì)粒,如不含F(xiàn)K506結(jié)合肽編碼序列的質(zhì)粒,不在ELISA測(cè)試中產(chǎn)生信號(hào)。含具有靶特性-FK506結(jié)合-的肽的融合酶用ELISA實(shí)驗(yàn)進(jìn)行鑒定。所有實(shí)驗(yàn)至少重復(fù)一次都獲得相似的結(jié)果。本實(shí)施例說(shuō)明了通過(guò)融合酶-表達(dá)載體連接,采用一個(gè)融合酶文庫(kù)鑒定一個(gè)含有所需活性的肽,和鑒定編碼靶功能的核酸的方法。實(shí)施例4下面的實(shí)施例說(shuō)明了應(yīng)用融合酶文庫(kù)鑒定一個(gè)DNA結(jié)合肽、編碼DNA結(jié)合肽的核酸分子、和被DNA結(jié)合肽識(shí)別的核酸序列的方法。一個(gè)融合酶文庫(kù)按實(shí)施例1的描述構(gòu)建。產(chǎn)生一群隨機(jī)DNA序列,為由融合酶文庫(kù)編碼的DNA結(jié)合肽提供DNA結(jié)合底物。DNA合成樹(shù)脂(珠)用于制造一個(gè)含NotI限制性酶切位點(diǎn)的25個(gè)堿基(盒I)的前導(dǎo)寡核苷酸。合成后,樹(shù)脂分為4等份以進(jìn)行下一步的合成,其中加入A、T、G或C(每份加入不同的堿基類(lèi)型)。一個(gè)循環(huán)后,將樹(shù)脂混合并分成4等份以進(jìn)行后續(xù)的循環(huán),其中每份分裝物中分別加入另外的A、T、G或C。相關(guān)的混合和分離步驟重復(fù)12次以產(chǎn)生12mer隨機(jī)寡核苷酸盒(ROC)。然后混合樹(shù)脂,并加入另外20堿基的盒(盒II)。分裂-混合合成步驟可形成隨機(jī)寡核苷酸DNA片段,其中樹(shù)脂混合物有“每珠一個(gè)序列”。換句話說(shuō),在每個(gè)珠上附著許多單一寡核苷酸的拷貝。為獲得雙鏈DNA結(jié)合底物,得到的樹(shù)脂混合物用Klenow酶的緩沖液沖洗。經(jīng)沖洗的樹(shù)脂與合成的寡核苷酸和一個(gè)與盒II互補(bǔ)的延伸引物混合?;旌衔锛訜岬?0℃,緩慢降溫到25℃,并冷卻到4℃,使延伸引物與模板雜交。得到的樹(shù)脂混合物在存在dNTPs的標(biāo)準(zhǔn)條件下,在Klenow酶緩沖液中孵育,使延伸反應(yīng)得以進(jìn)行。然后用標(biāo)準(zhǔn)PBS緩沖液沖洗得到的具有雙鏈DNA的樹(shù)脂,并在含有疊氮鈉條件下4℃儲(chǔ)存。為鑒定DNA結(jié)合蛋白的基因或編碼序列,附著有DNA片段的樹(shù)脂與編碼公認(rèn)DNA結(jié)合肽的融合酶文庫(kù)4℃孵育12小時(shí)。珠-REP融合酶復(fù)合物被REP的初級(jí)抗體標(biāo)記。孵育后,混合物與含預(yù)結(jié)合次級(jí)抗體的磁珠孵育。孵育后,加熱珠-樹(shù)脂混合物以變性蛋白,并拆開(kāi)磁珠-寡核苷酸樹(shù)脂復(fù)合物。磁珠用標(biāo)準(zhǔn)的手段去除,因而分離了共沉淀的無(wú)磁性DNA-樹(shù)脂。此材料可作為集中池或經(jīng)過(guò)單一磁珠分析的過(guò)程,用于PCR擴(kuò)增和測(cè)序分析??蛇x擇的是,得到的混合物通過(guò)5000×g10分鐘離心沉淀并用PBS充分沖洗。在樹(shù)脂上的結(jié)合蛋白-cDNA復(fù)合物用蛋白酶K處理。編碼所需融合酶的核酸用標(biāo)準(zhǔn)的DNA制備方法回收。如果需要,回收的質(zhì)粒被導(dǎo)入哺乳動(dòng)物宿主內(nèi)并用于隨后輪次的親合性篩選。由DNA結(jié)合肽識(shí)別的結(jié)合序列可以通過(guò)對(duì)結(jié)合DNA與特定的NAM酶-DNA結(jié)合肽融合的PCR產(chǎn)物測(cè)序而確定。DNA結(jié)合肽可以用本專(zhuān)業(yè)已知的蛋白分析方法鑒定??偲饋?lái)說(shuō),這里所用的方法可以產(chǎn)生一系列編碼DNA結(jié)合蛋白的cDNA及其相應(yīng)的結(jié)合序列。例如,一旦用隨機(jī)寡核苷酸識(shí)別了一個(gè)結(jié)合序列,就可以進(jìn)行一個(gè)同源性研究以確定人基因組中所有的候選位點(diǎn),所述的侯選位點(diǎn)代表了一個(gè)給定DNA結(jié)合蛋白的可能的結(jié)合位點(diǎn)。令人信服地,人基因組的一個(gè)完整的蛋白-DNA相互作用圖譜/數(shù)據(jù)庫(kù)就可以產(chǎn)生了。這里引用的所有文獻(xiàn),包括專(zhuān)利、專(zhuān)利申請(qǐng)和公開(kāi),均在此完全加入作為參考。雖然本發(fā)明著重于優(yōu)選實(shí)施方案的描述,但也可以使用優(yōu)選實(shí)施方案的變化形式,且傾向于不按這里特別描述的那樣來(lái)實(shí)施本發(fā)明。因此,本發(fā)明包括所有在本發(fā)明精神和范疇內(nèi)的改良方案,如下面權(quán)利要求所詳細(xì)說(shuō)明的。權(quán)利要求1.一種融合核酸文庫(kù),每一個(gè)融合核酸包括a)編碼Rep蛋白的核酸;和b)編碼候選蛋白的核酸;其中至少兩個(gè)所述的候選蛋白是不同的。2.一種融合多肽文庫(kù),每一個(gè)融合多肽包括a)Rep蛋白;和b)候選蛋白;其中至少兩個(gè)所述的候選蛋白是不同的。3.一種表達(dá)載體文庫(kù),每一個(gè)表達(dá)載體包括a)融合核酸包括i)編碼Rep蛋白的核酸;和ii)編碼候選蛋白的核酸;其中至少兩個(gè)所述候選蛋白是不同的;以及b)由所述Rep蛋白識(shí)別的酶附著序列(EAS)。4.一種核酸/蛋白(NAP)結(jié)合物文庫(kù),每一個(gè)NAP結(jié)合物包括a)融合多肽包括i)Rep蛋白;和ii)候選蛋白;b)表達(dá)載體包括i)融合核酸包括1)編碼所述Rep蛋白的核酸;和2)編碼所述候選蛋白的核酸;其中至少兩個(gè)所述候選蛋白是不同的;以及ii)酶附著序列(EAS)其中所述EAS和所述Rep蛋白是共價(jià)連接的。5.一種表達(dá)載體文庫(kù),每一個(gè)表達(dá)載體包括a)融合核酸分子包括(i)編碼核酸修飾(NAM)酶的核酸序列;(ii)編碼候選蛋白的核酸序列;和b)由所述NAM酶識(shí)別的超過(guò)20個(gè)核苷酸的酶附著序列。6.一種核酸/蛋白(NAP)結(jié)合物文庫(kù),每一個(gè)NAP結(jié)合物包括a)融合多肽包括i)NAM酶;和ii)候選蛋白;b)表達(dá)載體包括i)融合核酸包括1)編碼所述NAM酶的核酸;和2)編碼所述候選蛋白的核酸;其中至少兩個(gè)所述候選蛋白是不同的;以及ii)超過(guò)20個(gè)核苷酸的酶附著序列(EAS);其中所述EAS和所述NAM酶是共價(jià)連接的。7.一種融合核酸文庫(kù),每一個(gè)融合核酸包括a)編碼核酸修飾(NAM)酶的核酸序列;b)編碼候選蛋白的核酸序列;和c)編碼表現(xiàn)結(jié)構(gòu)的核酸序列。8.一種融合多肽文庫(kù),每一個(gè)融合多肽包括a)核酸修飾(NAM)酶;b)候選蛋白;和c)表現(xiàn)結(jié)構(gòu)。9.一種表達(dá)載體文庫(kù),每一個(gè)表達(dá)載體包括a)融合核酸包括(i)編碼核酸修飾(NAM)酶的核酸序列;(ii)編碼候選蛋白的核酸序列;和(iii)編碼表現(xiàn)結(jié)構(gòu)的核酸序列;和b)由所述NAM酶識(shí)別的EAS。10.一種核酸/蛋白(NAP)結(jié)合物文庫(kù),每一個(gè)NAP結(jié)合物包括a)融合多肽包括i)NAM酶;ii)候選蛋白;iii)表現(xiàn)結(jié)構(gòu);b)表達(dá)載體包括i)融合核酸包括1)編碼所述NAM酶的核酸;和2)編碼所述候選蛋白的核酸;3)編碼所述表現(xiàn)結(jié)構(gòu)的核酸;其中至少兩個(gè)所述候選蛋白是不同的;和ii)酶附著序列(EAS);其中所述EAS和所述NAM酶是共價(jià)連接的。11.一種融合核酸文庫(kù),每一個(gè)融合核酸包括a)編碼核酸修飾(NAM)酶的核酸序列;b)編碼候選蛋白的核酸序列;和c)編碼靶序列的核酸序列。12.一種融合多肽文庫(kù),每一個(gè)融合多肽包括a)核酸修飾(NAM)酶;b)候選蛋白;和c)靶序列。13.一種表達(dá)載體文庫(kù),每一個(gè)表達(dá)載體包括a)融合核酸包括(i)編碼核酸修飾(NAM)酶的核酸序列;(ii)編碼候選蛋白的核酸序列;和(iii)編碼靶序列的核酸序列;以及b)由所述NAM酶識(shí)別的EAS。14.一種核酸/蛋白(NAP)結(jié)合物文庫(kù),每一個(gè)NAP結(jié)合物包括a)融合多肽包括i)NAM酶;ii)候選蛋白;iii)靶序列;b)表達(dá)載體包括i)融合核酸包括1)編碼所述NAM酶的核酸;和2)編碼所述候選蛋白的核酸;3)編碼所述靶序列的核酸;其中至少兩個(gè)所述的候選蛋白是不同的;以及c)酶附著序列(EAS);其中所述EAS和所述NAM酶是共價(jià)連接的。15.一種融合核酸文庫(kù),每一個(gè)融合核酸包括a)編碼核酸修飾(NAM)酶的核酸序列;b)編碼候選蛋白的核酸序列;和c)編碼標(biāo)記物的核酸序列。16.一種融合多肽文庫(kù),每一個(gè)融合多肽包括a)核酸修飾(NAM)酶;b)候選蛋白;和c)標(biāo)記物。17.一種表達(dá)載體文庫(kù),每一個(gè)表達(dá)載體包括a)融合核酸包括(i)編碼核酸修飾(NAM)酶的核酸序列;(ii)編碼候選蛋白的核酸序列;和(iii)編碼標(biāo)記物的核酸序列;以及b)一種由所述NAM酶識(shí)別的EAS。18.一種核酸/蛋白(NAP)結(jié)合物文庫(kù),每一個(gè)NAP結(jié)合物包括a)融合多肽包括i)NAM酶;ii)候選蛋白;iii)標(biāo)記物;b)表達(dá)載體包括i)融合核酸包括1)編碼所述NAM酶的核酸;和2)編碼所述候選蛋白的核酸;3)編碼所述標(biāo)記物的核酸;其中至少兩個(gè)所述候選蛋白是不同的;以及ii)酶附著序列(EAS);其中所述EAS和所述Rep蛋白是共價(jià)連接的。19.根據(jù)權(quán)利要求1、3、4、5、6、7、9、10、11、13、14、15、17或18中所述的文庫(kù),其中所述的編碼候選蛋白的核酸序列來(lái)源于cDNA。20.根據(jù)權(quán)利要求1、3、4、5、6、7、9、10、11、13、14、15、17或18中所述的文庫(kù),其中所述的編碼候選蛋白的核酸序列來(lái)源于基因組DNA。21.根據(jù)權(quán)利要求1、3、4、5、6、7、9、10、11、13、14、15、17或18中所述的文庫(kù),其中所述的核酸是直接融合的。22.根據(jù)權(quán)利要求1、3、4、5、6、7、9、10、11、13、14、15、17或18中所述的文庫(kù),其中所述的核酸是間接融合的。23.根據(jù)權(quán)利要求5、6、7、8、9、10、11、12、13、14、15、16、17或18中所述的文庫(kù),其中所述的NAM酶是Rep蛋白。24.根據(jù)權(quán)利要求1、2、3、4或23中所述的文庫(kù),其中所述的Rep蛋白是Rep68。25.根據(jù)權(quán)利要求1、2、3、4或23中所述的文庫(kù),其中所述的Rep蛋白是Rep78。26.一種含權(quán)利要求1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18中所述文庫(kù)的宿主細(xì)胞。27.一種真核宿主細(xì)胞文庫(kù),每一個(gè)宿主細(xì)胞包括a)核酸/蛋白(NAP)結(jié)合物包括i)融合多肽包括1)NAM酶;和2)候選蛋白;ii)表達(dá)載體包括1)融合核酸包括A)編碼所述NAM酶的核酸;和B)編碼所述候選蛋白的核酸;其中至少兩個(gè)所述的候選蛋白是不同的;和2)酶附著序列(EAS);其中所述的EAS和所述的NAM酶是共價(jià)連接的。28.根據(jù)權(quán)利要求27中所述的文庫(kù),其中所述的真核宿主細(xì)胞是哺乳動(dòng)物細(xì)胞。29.一種篩選方法包括a)給至少一個(gè)靶分子添加一個(gè)NAP結(jié)合物文庫(kù),其中每個(gè)所述NAP結(jié)合物包括i)融合多肽包括1)NAM酶;和2)候選蛋白;ii)表達(dá)載體包括1)融合核酸包括A)編碼所述NAM酶的核酸;和B)編碼所述候選蛋白的核酸;其中至少兩個(gè)所述的侯選蛋白是不同的;以及2)超過(guò)20個(gè)核苷酸的酶附著序列(EAS);其中所述EAS和所述NAM酶是共價(jià)連接的;以及b)確定NAP結(jié)合物與所述靶分子的結(jié)合。30.根據(jù)權(quán)利要求29所述的方法,其中所述的方法是在無(wú)細(xì)胞的系統(tǒng)中進(jìn)行的。31.根據(jù)權(quán)利要求29所述的方法,其中所述的方法是在離體進(jìn)行的。32.根據(jù)權(quán)利要求29所述的方法,其中所述的靶分子是被標(biāo)記的。33.根據(jù)權(quán)利要求29所述的方法,其中所述的NAP結(jié)合物是被標(biāo)記的。34.根據(jù)權(quán)利要求29所述的方法,其中所述的NAM酶是Rep蛋白。35.一種篩選方法包括a)提供一個(gè)宿主真核細(xì)胞文庫(kù),每個(gè)真核細(xì)胞包括i)至少一個(gè)NAP結(jié)合物包括1)融合多肽包括A)NAM酶;和B)候選蛋白;2)表達(dá)載體包括A)融合核酸包括i)編碼所述NAM酶的核酸;和ii)編碼所述候選蛋白的核酸;其中至少兩個(gè)所述候選蛋白是不同的;和iii)酶附著序列(EAS);其中所述EAS和所述NAM酶是共價(jià)連接的;以及b)篩選所述細(xì)胞的改變的表現(xiàn)型。36.一種篩選方法包括a)提供一個(gè)宿主真核細(xì)胞文庫(kù),每個(gè)包括至少一個(gè)表達(dá)載體,包括i)融合核酸包括1)編碼核酸修飾(NAM)酶的核酸序列;和2)編碼候選蛋白的核酸序列;以及ii)由所述NAM酶識(shí)別的EAS;b)篩選所述宿主細(xì)胞的改變的表現(xiàn)型。37.一種篩選方法包括a)提供一個(gè)真核宿主細(xì)胞文庫(kù),每個(gè)包括至少一個(gè)表達(dá)載體,包括i)融合核酸包括1)編碼核酸修飾(NAM)酶的核酸序列;和2)編碼候選蛋白的核酸序列;以及ii)由所述NAM酶識(shí)別的EAS;在融合多肽產(chǎn)生的條件下,其中至少兩個(gè)所述候選蛋白是不同的;和b)溶解所述的細(xì)胞,其中所述的EAS和所述NAM酶共價(jià)連接以形成NAP結(jié)合物。c)添加至少一個(gè)靶分子;d)確定所述的靶分子與一個(gè)NAP結(jié)合物的結(jié)合。38.根據(jù)權(quán)利要求37所述的方法,其中所述的靶分子是在所述溶解作用之前添加的。39.根據(jù)權(quán)利要求37所述的方法,其中所述的靶分子是在所述溶解作用之后添加的。全文摘要本發(fā)明提供了融合核酸文庫(kù),其中每個(gè)融合核酸都包括編碼一個(gè)核酸修飾(NAM)酶的核酸和編碼一個(gè)候選蛋白質(zhì)的核酸。本發(fā)明還提供了一個(gè)包括核酸修飾(NAM)酶和候選蛋白質(zhì)的融合多肽文庫(kù),以及一個(gè)表達(dá)載體文庫(kù),每個(gè)表達(dá)載體包括:(i)包括編碼一個(gè)核酸修飾(NAM)酶的核酸和編碼一個(gè)候選蛋白質(zhì)的核酸的一個(gè)融合核酸,和(ii)一個(gè)EAS。候選蛋白質(zhì)中至少兩個(gè)是不同的。優(yōu)選NAM酶是一個(gè)Rep蛋白。優(yōu)選EAS的長(zhǎng)度超過(guò)20個(gè)核苷酸。同樣地,優(yōu)選的實(shí)施方案采用的融合核酸包含編碼表現(xiàn)結(jié)構(gòu)的核酸、編碼標(biāo)記物的核酸或編碼靶向序列的核酸。本發(fā)明也提供了核酸/蛋白(NAP)結(jié)合物文庫(kù),每個(gè)NAP結(jié)合物都包括一個(gè)含有NAM酶和候選蛋白質(zhì)的融合多肽。NAP結(jié)合物也包括一個(gè)表達(dá)載體,該表達(dá)載體含有一個(gè)融合核酸和被NAM酶識(shí)別的酶附著序列(EAS),其中融合核酸包括含有編碼NAM酶的核酸和編碼候選蛋白的核酸的融合核酸。EAS和NAM酶是共價(jià)結(jié)合的。本發(fā)明還提供了宿主細(xì)胞文庫(kù)和篩選的方法。文檔編號(hào)C12N15/10GK1378593SQ00814124公開(kāi)日2002年11月6日申請(qǐng)日期2000年8月18日優(yōu)先權(quán)日1999年8月20日發(fā)明者李民申請(qǐng)人:約翰斯霍普金斯大學(xué)醫(yī)學(xué)院