專利名稱:用于產(chǎn)生高多樣性文庫的方法
背景技術(shù):
本發(fā)明總體上涉及到產(chǎn)生和變換重組文庫的方法。
分離一個目的核酸或氨基酸序列需要一個數(shù)量龐大的高多樣性重組文庫,該庫可代表一個特定的類型,并可用一種或多種檢測技術(shù)鑒定出該種類。這樣的文庫有助于分離出有用的化合物和其編碼序列,這些化合物包括治療劑、研究診斷劑和農(nóng)用試劑。
另外,目的文庫可專門設(shè)計成包含某一化合物的數(shù)目眾多的可能的變體。此類文庫可用于檢測化合物的改進型,例如檢出一具最佳療效的化合物。
增加文庫多樣性的方法對于這些或其它應(yīng)用十分有益,它代表了蛋白設(shè)計產(chǎn)業(yè)的一個重要焦點。
發(fā)明概要本發(fā)明總體上的特點在于一種生成核酸文庫的方法,該方法包括(a)產(chǎn)生一批單鏈核酸模板,每個模板包括一編碼序列和一可操作地連接的啟動子序列;(b)用同所述模板基本互補的單鏈核酸片段混合物與所述模板群雜交,這些片段短于模板;(c)讓步驟(b)的每一種雜交體產(chǎn)物與缺失鏈置換活性的DNA聚合酶和DNA連接酶接觸,以這些片段為引物合成基本同模板互補的第二條核酸鏈;和(d)讓步驟(c)的產(chǎn)物與RNA聚合酶接觸,以產(chǎn)生RNA文庫,該庫由第二條鏈轉(zhuǎn)錄而成。
在優(yōu)選的方案中,將該方法用于向文庫引入一個或多個突變;通過切割雙鏈核酸分子產(chǎn)生基本互補的單鏈核酸片段混合物;通過合成隨機寡核苷酸產(chǎn)生基本互補的單鏈核酸片段混合物;單鏈核酸模板來自攜帶核酸的M13噬菌體,通過基因Ⅵ外切酶或λ外切酶消化雙鏈中的一條,通過鏈親合素結(jié)合生物素化的單鏈核酸,或通過對RNA反轉(zhuǎn)錄而獲得;基本互補的單鏈核酸片段混合物至少包括100個不同種類的片段;步驟(b)在每單鏈模板用1到約1000個片段條件下進行,用步驟(c)產(chǎn)物的一條鏈作模板,并對步驟(b)和(c)進行重復(fù);在每一輪中,用步驟(c)的產(chǎn)物作核酸模板重復(fù)步驟(b)和(c);該方法進一步涉及一個或多個單鏈核酸的片段,它們同單鏈核酸模板形成同源雙螺旋,步驟(b)在可形成同源雙螺旋片段存在的情況下進行;啟動子為T7啟動子;DNA聚合酶是T4DNA聚合酶;本方法還涉及在接觸步驟(d)之前對步驟(c)產(chǎn)物進行擴增;本方法還涉及到步驟(e)將RNA文庫翻譯成為蛋白質(zhì)文庫;該方法還涉及到步驟(e)將一氨基酸受體分子連接到基本上每一RNA庫成員的編碼序列的3′端;本方法還涉及步驟(f)翻譯RNA文庫而產(chǎn)生一個RNA-蛋白質(zhì)融合文庫。
在第二個方面,本發(fā)明的特點還在于一種減少一群核酸分子中序列的變異的方法。該方法包括(a)產(chǎn)生第一群具變化的序列的單鏈核酸模板,基本上每一模板包括一編碼序列和一可操作地連接的啟動子序列;(b)用基本同第一群模板互補的第二群單鏈核酸片段與第一群雜交,這些片段均短于模板且屬于基本上相同的序列;(c)令步驟(b)的雜交產(chǎn)物同缺乏鏈置換活性的DNA聚合酶和DNA連接酶相接觸,以這些片段為引物合成基本與模板互補的第二核酸鏈;和(d)令步驟(c)的產(chǎn)物同RNA聚合酶相接觸以產(chǎn)生一群RNA分子,這些RNA分子由第二條核酸鏈轉(zhuǎn)錄而成,且相對于第一群單鏈核酸模板序列變異減少。
在優(yōu)選方案中,本方法被用于從第一組單鏈核酸模板中去除一個或多個突變;步驟(b)涉及到用兩群或更多群不同的基本互補單鏈片斷同第一群單鏈模板進行雜交;通過切開雙鏈核酸分子產(chǎn)生第二群基本互補的核酸片段;通過合成隨機寡核苷酸來產(chǎn)生第二群基本互補的核酸片段;單鏈核酸模板產(chǎn)自攜帶該核酸的M13噬菌體,或用基因Ⅵ外切酶或λ外切酶降消化雙鏈核酸中的一條,或用鏈親合素俘獲生物素化的單核酸鏈,或通過反轉(zhuǎn)錄RNA來獲得。步驟(b)在每個單鏈模板用1到約1000單鏈核酸片段的條件下進行;步驟(c)產(chǎn)物的單鏈被用作模板,并對步驟(b)和(c)進行重復(fù);在每一輪中,用步驟(c)的產(chǎn)物作核酸模板重復(fù)步驟(b)和(c);啟動子為T7啟動子;DNA聚合酶為T4DNA聚合酶;本方法還涉及在接觸步驟(d)之前對核酸步驟(c)產(chǎn)物進行擴增;本方法還涉及步驟(e)將RNA文庫翻譯成為蛋白質(zhì)文庫;該方法還涉及到步驟(e)將一氨基酸受體分子連接到RNA庫基本上每一成員的編碼序列的3′端;本方法進一步涉及步驟(f)翻譯該群RNA分子而產(chǎn)生一個RNA-蛋白質(zhì)融合文庫。
在第三個方面,本發(fā)明的特點還在于一種產(chǎn)生核酸文庫的方法,該方法包括(a)產(chǎn)生一群單鏈核酸模板,每模板包括一編碼序列;(b)產(chǎn)生一群具有不同序列的單鏈核酸分子,它們同單鏈模板基本互補;(c)在足以形成雙聚體的情況下,令這些具有不同序列的單鏈核酸分子同單鏈核酸模板群雜交;和(d)讓雙螺旋與一種或多種切割/修復(fù)酶接觸,在可令這些酶修復(fù)雙螺旋中錯配堿基對的條件下作用。
在一優(yōu)選方案中,本方法進一步涉及到產(chǎn)生一群來自步驟(d)產(chǎn)物的單鏈模板并重復(fù)步驟(c)和(d);在每一輪中,用步驟(d)產(chǎn)物作單鏈模板重復(fù)步驟(c)和(d)。
在第四個方面,本發(fā)明的特點還在于產(chǎn)生了一種產(chǎn)核酸文庫的方法,該方法包括(a)產(chǎn)生一群單鏈核酸模板,每模板包括一編碼序列;(b)利用同單鏈核酸模板基本互補的核酸片段混合物與這一群單鏈核酸模板雜交,這些片段的長度短于模板;(c)令步驟(b)的每一種雜交產(chǎn)物與缺乏鏈置換活性的DNA聚合酶及DNA連接酶相接觸,以片段為引物來合成同核酸模板基本互補的第二核酸鏈;(d)以一種或多種切割/修復(fù)酶作用于步驟(c)的產(chǎn)物,作用在可使這些酶修復(fù)產(chǎn)物中的錯配堿基的條件下進行。
在優(yōu)選方案中,本方法還涉及產(chǎn)生一群來自于步驟(d)的單鏈模板并對步驟(b)-(d)進行重復(fù);重復(fù)(b)-(d)時,每一輪使用來自于步驟(d)的產(chǎn)物的一群單鏈模板。
在本發(fā)明第三和第四方面的優(yōu)選方案中,與切割/修復(fù)酶的接觸在生物體內(nèi)完成(如在細菌細胞中);與切割/修復(fù)酶的接觸在體外完成;單鏈核酸模板產(chǎn)自攜帶該核酸的M13噬菌體,或用基因Ⅵ外切酶或λ外切酶消化雙鏈核酸模板的一條鏈,或用鏈親合素俘獲生物素化的單核酸鏈或反轉(zhuǎn)錄RNA來獲得。步驟(b)每個單鏈核酸模板使用1到約1000具有不同序列的單鏈核酸分子或單鏈核酸片段的條件下進行;本方法進一步涉及步驟(e)擴增步驟(d)的產(chǎn)物;每一編碼序列均與啟動子序列可操作地連接;本方法還進一步涉及步驟(e)將步驟(d)的產(chǎn)物轉(zhuǎn)錄以產(chǎn)生一RNA文庫;本方法還進一步涉及步驟(f)翻譯該RNA文庫以產(chǎn)生一蛋白質(zhì)文庫;本方法還涉及步驟(f)將一氨基酸受體分子連接于RNA文庫基本上每一成員的編碼序列的3′末端;本方法進一步涉及步驟(g)翻譯該RNA文庫以產(chǎn)生一RNA-蛋白質(zhì)融合文庫。
在這里使用的“文庫”指的至少108個含核酸和/或氨基酸組分的分子,優(yōu)選為至少1010個,更優(yōu)選至少1012個;最優(yōu)選為至少1014個分子。
核酸片段“混合物”指至少100個核酸片段,優(yōu)選為至少500個,更優(yōu)選為至少1000個,最優(yōu)選為至少1500個片段。
“啟動子序列”指的是具有有功能的RNA聚合酶結(jié)合位點并能使鄰近的編碼序列轉(zhuǎn)錄的任何核酸序列。
“基本互補”指一條核酸鏈具有足量的可以同另一核酸鏈形成沃森-克里克堿基對的核苷酸而在兩種核酸之間產(chǎn)生一個或多個雙鏈區(qū)域??梢哉J為不需要一個核酸分子中的每一核苷酸均與另一基本互補的反向鏈中的核苷酸形成沃森-克里克堿基對;同時,在“基本互補的單鏈核酸混合物中”,相當一部分片段包含有一個或多個可與“單鏈核酸模板”形成錯配的核苷酸。
“鏈置換活性”指的是聚合酶或與其相關(guān)的解旋酶打斷兩個核酸鏈之間堿基配對的能力。
“突變”指的是任何核苷酸的變化,它包括可引起不同表型的序列變化或沉默變化。
“雙螺旋”指的是兩條核酸鏈具備的互補序列足以維持雜交體的情況下退火形成的結(jié)構(gòu)。一個雙螺旋可是“同源雙螺旋”或“異源雙螺旋”?!巴措p螺旋中”,一條鏈的所有核苷酸均與另一條反向中核苷酸形成配對?!爱愒措p螺旋”指兩條核酸分子中,由于一個或多個錯配,一條鏈中的一個或多個核苷酸沒有或不能同另一條中的一個或多個核苷酸形成適當配對,在這種情況下退火形成的結(jié)構(gòu)。不同類型的異源雙螺旋的例子包括表現(xiàn)出一個或多個核苷酸交換或插入與缺失突變的雙螺旋。
“隨機寡核苷酸”指的是一些寡核苷酸混合物,它們在一個或多個核苷酸位置上有變動。隨機寡核苷酸可通過完全或部分隨機合成的方法產(chǎn)生,也可以直接方式有目的地變動某個核苷酸。
“氨基酸受體分子”指的是任一可通過核糖體肽酰轉(zhuǎn)移酶催化而摻入生長中的蛋白鏈C端的分子。典型的“氨基酸受體分子”包括(ⅰ)一個核苷或核苷樣部分(如腺苷或腺苷類似物(可以在N-6氨基位二甲基化)),(ⅱ)一個氨基酸或氨基酸樣部分(如20個D或L-氨基酸中的任何一個或其類似物(如O-甲基-酪氨酸或在Ellman etal.,Meth.Enzymol.202:301,1991述及的任何氨基酸類似物)),和(ⅲ)兩者之間的連接(如在3′位置上的酯、酰胺或酮連接物,2′位置亦可,但不如3′);優(yōu)選的這一連接不要明顯地干擾天然核糖核苷構(gòu)型中的環(huán)的折疊。氨基酸受體可以具有一個親核體,這可以是一個氨基基團、羥基基團或疏基基團,但不限于此。另外,氨基酸受體可以包括核苷類似物、氨基酸類似物或一具核苷-氨基酸復(fù)合結(jié)構(gòu)的類似物。
將氨基酸受體分子連至編碼序列的“3′端”意指將氨基酸受體分子置于編碼序列的最后一個密碼子之后。這一術(shù)語包括,但不限于恰好位于編碼序列3′端的氨基酸受體分子,同時也包括該分子同最后一個密碼子相隔一段間插的編碼或非編碼序列(如,一段與暫停位點相關(guān)的序列)的情況。該術(shù)語還包括這樣的結(jié)構(gòu)其中,編碼或非編碼序列位于氨基酸受體分子之后(即3′末端)。同時,本術(shù)語還包括,但不限于這樣的情況,一個氨基酸受體分子與編碼序列共價相連(直接或通過核酸間隔序列間接相連),也包括通過某些非共價鏈相連的情況,如同一連有氨基酸受體的核酸鏈與編碼鏈3′端附近雜交。
“RNA-蛋白”融合意指任何包含有通過酰胺鍵與蛋白共價結(jié)合的核糖核酸的分子。該共價鍵抗核糖體裂解。
“蛋白質(zhì)”指的是兩個或兩個以上天然生成或修飾過的氨基酸以一個或多個肽鍵相連的分子?!暗鞍住薄ⅰ半摹焙汀岸嚯摹痹谶@里是可交換使用的。
“一群具變化序列的單鏈模板”意指具有只有一個或幾個核苷位點不同的序列的一群核酸。
“切割/修復(fù)酶”指的是可以去除錯配堿基或環(huán)并代之以標準堿基對(即A∶T或G∶C)的酶的任意組合。
附圖簡述
圖1是一種產(chǎn)生高多樣性RNA-蛋白質(zhì)融合文庫的典型片段重組方法的圖解。該方法中的片段來自已引入序列變異的雙鏈DNA分子。
圖2是第二種典型片段重組方法的起始步驟的圖解。該方法中的片段是已引入序列變異的合成寡核苷酸。
詳述本發(fā)明涉及到很多新的用于核酸序列隨機重組、產(chǎn)生具遺傳變異的DNA、RNA和蛋白質(zhì)文庫的相關(guān)方法。如下文的詳述,在一種優(yōu)選方案中,這一技術(shù)在體外進行以產(chǎn)生傳統(tǒng)的蛋白質(zhì)文庫或RNA-蛋白質(zhì)融合文庫,這兩者均可用于與用于從文庫群中選擇目的蛋白或多肽(或它們的相關(guān)編碼序列)的多種方法的任一種結(jié)合使用。這一通用的方法提供了一種以非偏倚的方式向蛋白質(zhì)文庫引入突變的手段,以及一種從文庫或選定的庫中除去非所需突變的技術(shù),還可在其后的選擇中“回交”出一組分子。
片段重組根據(jù)本發(fā)明的一種優(yōu)選方法,可通過產(chǎn)生突變片段并用其同未突變片段(一般為野生型)進行隨機重組以產(chǎn)生文庫。這一通用方法的一個例子可見圖1。如圖所示,突變首先被隨機引入一初始雙鏈DNA序列(稱“dsDNA(init)”)。這產(chǎn)生了一群突變的雙鏈DNA序列,圖1中稱為“dsDNA(mut)”??赏ㄟ^任何手段引入這些突變,包括PCR突變法(該方法依賴于Taq聚合酶的錯配修復(fù)能力低的機制),位點特異突變或模板特異突變(例見Joyce and Inoue,Nucl.Acids Res.,17:177,1989)。這一群包含突變的DNA隨之用多種標準方法切成片段。例如,用一種或幾種核酸酶部分降解DNA(如DNaseI,微球核酸酶,限制性內(nèi)切酶或P1核酸酶),或可進行化學降解,如利用Fe·EDTA.另外,還可通過在多聚化(如PCR擴增)時限制核苷的消耗來產(chǎn)生包含有突變的片段,或進行簡單的物理切割(如超聲處理)。較理想的片段長約25-1000個堿基對,最理想的長50-150個堿基對。
隨后,加熱這些DNA片段,然后將之同已確認為初始DNA非編碼鏈(或稱負鏈)的全長單鏈DNA模板一起退火。另外,這一雜交混合物中還包括另一種片段,有時稱之為“終止子片段”(Joyce andInoue,Nucl.Acids Res.17:171,1989)。這一終止片段與單鏈模板的3′端互補并提供一個聚合反應(yīng)的引物,它與模板的結(jié)合不依賴于隨機退火的突變片段的數(shù)量和性質(zhì)。
單鏈模板可通過任何標準技術(shù)生成,如利用攜帶DNA序列的M13噬菌體,或利用基因Ⅵ核酸外切酶(Nikiforov et a1,PCR MethodAppl.3:285,1994)或λ核酸外切酶(Higuchi and Ochman,Nucl.AcidsRes17:5865,1989)降解dsDNA(init)分子的編碼鏈,或通過固定化的鏈親合素俘獲生物素化的DNA鏈(Joyce and Inoue,Nucl.AcidsRes.17:171,1989),或通過對RNA進行反轉(zhuǎn)錄。將模板同片段相混合以進行雜交,混合比例不得低于每模板分子一個片段,不得高于每模板分子1000個片段。片段同模板的比較例較低時產(chǎn)生的子代鏈更接近于模板,比例較高時則更接近于片段??赏ㄟ^標準方法來確定雜交條件,并被設(shè)計成能形成模板與片段的異源雙螺旋。雜交技術(shù)的示例可見于stemmer.美國專利No.5,605,793。
片段在與模板退火后,用缺乏鏈置換活性的DNA聚合酶和DNA連接酶將其連接起來。適用于該目的的DNA聚合酶包括T4DNA聚合酶和來自大腸桿菌的重組DNA polⅡ(例見Hughes et al.,J.Biol Chem.266:4568,1991),但不限于以上兩種。任何DNA連接酶(如T4DNA連接酶)均可使用。在這一步,可先用DNA聚合酶后用DNA連接酶處理于DNA雙螺旋,也可同時使用這兩種酶,例見Joyce和Inove(Nucl.AcidsRes17:711,1989)。如圖1所示,本步生成一群雙鏈DNA(稱為“dsDNA(lib)”),其中每一成員基本都在一條鏈上有1到多個引入的突變。由于最初引入的突變和退火的片段數(shù)量和性質(zhì)都是隨機的,該群DNA中不同的雙螺旋具有不同的突變序列。
這一用于生成雙鏈DNA文庫的通用方法有一個替代方法,可見圖2。此替代方法中,一些單鏈寡核苷酸片段被合成出來,它們同初始雙鏈DNA分子的編碼鏈部分相對應(yīng)。這些寡核苷酸片段以長5-2000個核苷酸為宜,最適長度為20-100個核苷酸,并以標準的核酸合成方法來產(chǎn)生。這些帶有隨機或半隨機突變的寡核苷酸可通過標準方法來合成。這些寡核苷酸優(yōu)選每20個核苷酸有3個以內(nèi)的引入錯配,同時應(yīng)避免讀碼框內(nèi)的終止密碼子。另外。在某些情況下,還可通過引入非天然的強親合性堿基對,如C-5丙炔尿嘧啶或C-5-丙炔胞嘧啶,以增強寡核苷酸的雜交能力,這是有益甚至是必需的。這些技術(shù)可見于Wagneret al,Science260:1510,1993。
隨后,用這些含有突變的寡核苷酸片段同單鏈模板雜交,這些模板同上一方法一樣是全長的,其序列與初始DNA的非編碼鏈(負鏈)一致。同上文所述,片段用DNA聚合酶和DNA連接酶來連接以產(chǎn)生雙鏈DNA文庫(dsDNA(lib))。這一文庫也包括一群雙螺旋分子,其中有一組不同的編碼鏈,它們的區(qū)別在于突變的數(shù)量、位置和同一性。
如果需要,以上步驟均可利用片段或寡核苷途徑進行重復(fù)以向DNA分子引入不同數(shù)量的突變。具體地講,可以突變鏈為初始單鏈模板,用突變片段或寡核苷酸與這些鏈退火并進行多聚化和連接。
回交方法如上文概述,本發(fā)明的方法被用于向一初始DNA序列引入突變。另外,這些技術(shù)可用于除去或減少DNA文庫中的不需要的突變發(fā)生的頻率,根據(jù)這一方法,dsDNA(mut)在被切成片段后同野生型序列的寡核苷酸或同未突變或野生型的DNA(wtDNA)的特定片段一起加入到單鏈模板中。這些片段是相互分離的鏈(如必需),將其同全長單鏈一起退火,再如上文用DNA聚合酶或T4連接酶將之連接。相對相應(yīng)的突變片段而言,使用高濃度的未突變寡核苷酸或片段所產(chǎn)生的文庫中,不需要的突變被降至最少甚至消除。
此方法還可用于現(xiàn)有的含有在突變的文庫,以同樣減少或除去不需要的序列。該方法涉及到一具有突變序列的初始文庫以及野生序列的片段或寡核苷酸的退火、多聚化和連接,操作同上文所述。
RNA、蛋白質(zhì)或RNA-蛋白質(zhì)文庫在本發(fā)明的一個優(yōu)選方案中,上文述及的DNA文庫還進一步包括RNA聚合酶如SPb或T7聚合酶的結(jié)合位點。這些位點例見Milligan etal.,Proc.Natl.Acad.Sci.USA87:696,1990。該位點位于編碼序列的上游,這一位置使序列得以轉(zhuǎn)錄。一般此類位點位于編碼序列上游5-2000個堿基對處。
包含有RNA聚合酶結(jié)合位點的文庫可通過上文提及的方法予以變動。多聚化和連接之后,可直接轉(zhuǎn)錄dsDNA(lib)以產(chǎn)生RNA文庫,如利用體外轉(zhuǎn)錄系統(tǒng),還可將dsDNA(lib)直接轉(zhuǎn)錄并翻譯以產(chǎn)生蛋白質(zhì)文庫,如利用體外轉(zhuǎn)錄和翻譯系統(tǒng)。體外轉(zhuǎn)錄和體外翻譯系統(tǒng)的例子包括T7轉(zhuǎn)錄系統(tǒng)和兔網(wǎng)織紅細胞、麥胚芽、酵母及大腸桿菌翻譯系統(tǒng)。
如果需要,可通過在轉(zhuǎn)錄前進行鏈特異性擴增來增加文庫中每一RNA或蛋白的拷貝數(shù)。例如,PCR擴增可通過在多聚化和連接步驟中向突變鏈引入統(tǒng)一的引物結(jié)合序列以同引物結(jié)合。這些序列可作為錯配或DNA一端或兩端的延伸而并入。這可使新生鏈擴增時不擴增模板鏈。還可以通過對與新生鏈3′端互補的單一寡核苷酸引物進行多輪的退火和延伸以進行線性擴增。隨后的PCR和轉(zhuǎn)錄過程產(chǎn)生的RNA主要對應(yīng)于突變序列,只有一小部分由模板序列產(chǎn)生。
在一個優(yōu)選方案中,上述用于引入突變或回交去除不需要的突變的方法可被用于產(chǎn)生高多樣性的RNA-蛋白質(zhì)文庫。該文庫的建立可通過將一個包含有不水解的氨基酸受體分子如嘌呤霉素的接頭連至文庫(如,按上文方法創(chuàng)建的文庫)的RNA3′端來完成。產(chǎn)生RNA-蛋白質(zhì)融合文庫的例子可見于Szostak et al.,USSN09/007,005;及Robertset al.,Proc.Natl.Acad.Sci.USA94:12297,1997。隨后對這些RNA的翻譯產(chǎn)生了一個RNA蛋白融合分子庫,它可用于體外選擇實驗。
此外,如果需要,RNA或RNA-蛋白融合分子經(jīng)選擇后可用作標準PCR的模板以獲得相關(guān)編碼序列。這樣,本方法就提供了一個可用于片段重組、分子回交、蛋白和/多肽選擇和其相關(guān)編碼序列選擇的手段,這些均在體外系統(tǒng)完成。
切割/修復(fù)除片段重組方法之外,切割/修復(fù)也可用于變動庫中的序列。這一方法可用于產(chǎn)生DNA、RNA和RNA-蛋白質(zhì)融合文庫。該技術(shù)的依據(jù)在于按上文任一種方法產(chǎn)生的dsDNA(lib)自身帶有特定數(shù)量的錯配堿基對。為產(chǎn)生文庫序列的多樣性,這些錯配需在體外用切割/修復(fù)酶加以修復(fù)??衫萌我磺懈?修復(fù)系統(tǒng)來進行修復(fù)(例見Jaiwal et al.,Nucl.Acids Res.26:2l84,1998;或Fortini et al.,Biochemistry37:3575,1998)。
切割/修復(fù)步驟還可通過將dsDNA(lib)轉(zhuǎn)入細菌或酶母菌株以利用它們的修復(fù)系統(tǒng)在體內(nèi)來完成。該步驟也可通過將文庫轉(zhuǎn)化入一標準的體內(nèi)切割/修復(fù)系統(tǒng)來完成。該系統(tǒng)的例子可見于Campbell etal.,Mutat Res.211:181,1989;Bishop and kolodner.Mol.Cell Biol.6:3401,1986;Fishel et al.,J.Mol.Biol188:147,1986;和Westmoreland et.al.,Genetics145:29,1997。
由于以上的修復(fù)過程是隨機進行的,這一切割/修復(fù)方法有時可導(dǎo)致突變引入文庫序列且其它時候也可能造成編碼鏈回交成野生型序列。
在以上方法的一個替代方法中,體外或體內(nèi)的切割/修復(fù)可利用dsDNA(mut)(如,按上述方法產(chǎn)生的dsDNA(mut)和dsDNA(init)或wtDNA作為底物來產(chǎn)生多樣性文庫。在該技術(shù)中,混合物的鏈被分開并重新退火,然后在體外與切割/修復(fù)酶共溫浴或轉(zhuǎn)化入細菌以利用細菌的切割/修復(fù)系統(tǒng)(如上文提及的系統(tǒng))??梢栽摲椒▽⑼蛔冸S機引入序列,也可將野生序列回交到dsDNA(mut)分子中。
權(quán)利要求
1.用于生成核酸文庫的方法,該方法包括(a)產(chǎn)生一群單鏈核酸模板,每個模板包括一編碼序列和一可操作地連接的啟動子序列;(b)用同所述模板基本互補的單鏈核酸片段混合物與所述模板群雜交,這些片段短于所述核酸模板;(c)讓步驟(b)的每一種雜交產(chǎn)物與缺乏鏈置換活性的DNA聚合酶和DNA連接酶相接觸,以這些片段為引物合成基本同模板互補的第二條核酸鏈;和(d)讓步驟(c)的產(chǎn)物與RNA聚合酶接觸以產(chǎn)生RNA文庫,該文庫由第二條核酸鏈轉(zhuǎn)錄而成。
2.權(quán)利要求1的方法,其中,所述方法的方法應(yīng)用于向該文庫中引入一個或多個突變。
3.用于減少一群核酸分子中的序列變異的方法,該方法包括(a)產(chǎn)生第一群具變化的序列的單鏈核酸模板,基本上每一模板包括一編碼序列和一可操作連接啟動子序列;(b)用基本同單鏈核酸模板互補的第二群單鏈核酸片段與第一群雜交,這些片段均短于所述核酸模板并基本屬于同一序列;(c)令步驟(b)的雜交產(chǎn)物同缺乏鏈置換活性的DNA聚合酶和DNA連接酶接觸,以這些片段為引物合成基本與核酸模板互補的第二鏈;(d)令步驟(c)的產(chǎn)物同RNA聚合酶相作用以產(chǎn)生一群RNA分子,這些RNA分子由第二條鏈轉(zhuǎn)錄而成,且相對于第一群單鏈核酸模板變異較小。
4.權(quán)利要求3的方法,其中,所述方法應(yīng)用于消除所述的第一群單鏈核酸模板中的一個或多個突變。
5.權(quán)利要求3的方法,其中,步驟(b)包括用第一群單鏈核酸模板同兩群或多群基本互補的單鏈核酸片段進行雜交。
6.權(quán)利要求1或3的方法,其中,基本互補的單鏈核酸片段混合物由解開雙鏈核酸分子或合成隨機寡核苷酸而生成。
7.權(quán)利要求1或3的方法,其中,所述的單鏈核酸模板是用攜帶該核酸的M13噬菌體、或用基因Ⅵ外切酶成λ外切酶降解雙鏈核酸模板的一條鏈,或用鏈親合素俘獲生物素化的單鏈核酸,或?qū)NA進行反轉(zhuǎn)錄而獲得。
8.權(quán)利要求1或3的方法,其中,所述的基本互補的單鏈核酸片段混合物包括至少約100種不同的核酸片段。
9.權(quán)利要求1或3的方法,其中,步驟(b)在每個單鏈核酸模板用1到約1000個片段的條件下進行。
10.權(quán)利要求1或3的方法,其中,步驟(c)的單鏈產(chǎn)物被用作核酸模板且步驟(b)和(c)重復(fù)進行。
11.權(quán)利要求10的方法,其中,在每一輪中用步驟(c)產(chǎn)物作核酸模板而重復(fù)進行所述的(b)和(c)。
12.權(quán)利要求1的方法,其中,所述的方法進一步包括產(chǎn)生一個或多個單鏈核酸模板,這些模板可與所述的單鏈核酸模板形成同源雙螺旋,同時,步驟(b)在存在可形成同源雙螺旋的片段的情況下進行。
13.權(quán)利要求1或3的方法,其中,所述的啟動子為T7啟動子。
14.權(quán)利要求1或3的方法,其所述的DNA聚合酶為T4DNA聚合酶。
15.權(quán)利要求1或3的方法,其中,所述的方法進一步包括在接觸步驟(d)之前對步驟(c)的產(chǎn)物進行擴增。
16.權(quán)利要求1或3的方法,其中,所述方法進一步包括步驟(e)翻譯RNA文庫以產(chǎn)生蛋白質(zhì)文庫。
17.權(quán)利要求1或3的方法,其中,所述方法進一步包括步驟(e)將所述的RNA文庫基本上每一成員的編碼序列3′端與一氨基酸受體分子連接。
18.權(quán)利要求17的方法,其中,該方法進一步包括步驟(f)翻譯所述的RNA文庫以產(chǎn)生一個RNA-蛋白質(zhì)融合文庫。
19.一種用于產(chǎn)生核酸文庫的方法,該方法包括(a)產(chǎn)生一群單鏈核酸模板,每模板包括一編碼序列;(b)產(chǎn)生一群具有不同序列的單鏈核酸分子,它們同所述單鏈核酸模板群基本互補;(c)在可充分形成雙螺旋的情況下,令這些具不同序列的單鏈核酸分子同單鏈核酸模板雜交;和(d)讓雙螺旋與一種或多種切割/修復(fù)酶接觸,在可令這些酶修復(fù)雙螺旋中錯配堿基的條件下作用。
20.權(quán)利要求19的方法,其中,該方法還包括產(chǎn)生一群來自于步驟(d)產(chǎn)物的單鏈模板,并重復(fù)步驟(c)和(d)。
21.權(quán)利要求20的方法,其中在每一輪中用步驟(d)的產(chǎn)物作單鏈模板重復(fù)步驟(c)和(d)。
22.用于產(chǎn)生核酸文庫的方法,該方法包括(a)產(chǎn)生一群單鏈核酸模板,每模板包括一編碼序列;(b)利用同單鏈核酸模板基本互補的核酸片段混合物與單鏈核酸模板雜交,這些片段長度短于所述核酸模板;(c)令步驟(b)的雜交產(chǎn)物與缺乏鏈置換活性的DNA聚合酶及DNA連接酶相接觸,以該片段為引物來合成同該核酸模板基本互補的第二核酸鏈;(d)讓一種或多種切割/修復(fù)接觸步驟(c)的產(chǎn)物,作用在可使這些酶修復(fù)產(chǎn)物中的錯配堿基的條件下進行。
23.權(quán)利要求22的方法,其中,所述方法進一步包括產(chǎn)生來自步驟(d)產(chǎn)物的一群單鏈模板,并重復(fù)步驟(b)-(d)。
24.權(quán)利要求23的方法,其中,所述在每一輪中,來自步驟(d)產(chǎn)物的單鏈模板重復(fù)步驟(b)-(d)。
25.權(quán)利要求19或22的方法,其中,與所述切割/修復(fù)酶的接觸在體內(nèi)進行。
26.權(quán)利要求25的方法,其中,與所述切割/修復(fù)酶的接觸在細菌細胞內(nèi)進行。
27.權(quán)利要求19或22的方法,其中,與切割/修復(fù)酶的接觸在體外進行。
28.權(quán)利要求19或22的方法,其所述的單鏈核酸模板產(chǎn)自于攜帶該核酸的M13噬菌體,或用基因Ⅵ外切酶或λ外切酶降解雙鏈核酸模板的一條鏈,或用鏈親合素俘獲生物素化的單鏈核酸,或?qū)NA進行反轉(zhuǎn)錄而獲得。
29.權(quán)利要求19或22的方法,其中,步驟(b)在每個單鏈核酸模板使用1-約1000個含不同序列的單鏈核酸分子或單鏈核酸片段的條件下進行。
30.權(quán)利要求19或22的方法,其中,該方法進一步包括(e)擴增步驟(d)的產(chǎn)物。
31.權(quán)利要求19或22中的方法,其中,每一所述的編碼序列與一啟動子可操作地連接。
32.權(quán)利要求31的方法,其中,該方法進一步包括(e)轉(zhuǎn)錄步驟(d)的產(chǎn)物以產(chǎn)生一RNA文庫。
33.權(quán)利要求32的方法,其中,該方法進一步包括(f)翻譯該RNA文庫以產(chǎn)生蛋白質(zhì)文庫。
34.權(quán)利要求32的方法,其中,該方法進一步包括(f)將所述RNA文庫中基本上每一成員編碼序列的3′端連接上一氨基酸受體分子。
35.權(quán)利要求34的方法,其中,該方法進一步包括(g)翻譯該RNA文庫以產(chǎn)生RNA-蛋白質(zhì)融合文庫。
全文摘要
本發(fā)明披露了一種產(chǎn)生核酸文庫的方法,該方法包括:(a)產(chǎn)生一群單鏈核酸模板,每個模板包括一編碼序列和一可操作地連接的啟動子序列;(b)用同所述單鏈核酸模板基本互補的單鏈核酸片段混合物與所述模板群雜交,這些片段短于模板;(c)令步驟(b)的每一種雜交產(chǎn)物同缺乏鏈置換活性的DNA聚合酶和DNA連接酶相接觸,以這些片段為引物合成基本同模板互補的第二條核酸鏈;和(d)讓步驟(c)的產(chǎn)物與RNA聚合酶接觸以產(chǎn)生RNA文庫,該文庫由第二條鏈轉(zhuǎn)錄而成。
文檔編號C12P19/34GK1308683SQ99807977
公開日2001年8月15日 申請日期1999年6月29日 優(yōu)先權(quán)日1998年6月29日
發(fā)明者R·瓦格納, M·C·賴特, B·克雷德爾 申請人:菲洛斯公司