列,并且其并未有 意地經(jīng)人工處理而修飾。
[0029] 當(dāng)用于指例如細(xì)胞、核酸或多肽時(shí),"重組的"指材料或?qū)?yīng)于該材料的天然或自 然形式的材料,其已經(jīng)以在自然界中并不存在的方式來(lái)修飾,或者雖與其相同但從合成材 料和/或通過(guò)使用重組技術(shù)的處理而產(chǎn)生或得到。其中,非限制性實(shí)例包括表達(dá)在細(xì)胞的 天然(非重組的)形式內(nèi)未發(fā)現(xiàn)的基因的重組細(xì)胞,或表達(dá)在其他情況下以不同水平表達(dá) 的天然基因的重組細(xì)胞。
[0030] "序列同一性的百分比"、"百分比同一性"和"百分比同一的"在本文中用于指多核 苷酸序列之間或多肽序列之間的比較,并且通過(guò)在比較窗口上比較兩條最佳比對(duì)的序列來(lái) 確定,其中為了兩條序列的最佳比對(duì),比較窗口內(nèi)的多核苷酸或多肽序列的部分可以包含 與參考序列相比的添加或缺失(即缺口)。百分比是這樣計(jì)算的,通過(guò)確定在兩條序列中出 現(xiàn)相同的核酸堿基或氨基酸殘基的位置的數(shù)目或者核酸堿基或氨基酸殘基與缺口對(duì)齊的 位置的數(shù)目以產(chǎn)生匹配位置的數(shù)目,將匹配位置的數(shù)目除以比較窗口中的位置總數(shù)并將結(jié) 果乘以100以產(chǎn)生序列同一性的百分比。使用BLAST和BLAST 2. 0算法進(jìn)行最佳比對(duì)和百 分比序列同一性的確定(例鈕餐叭…M〇L Bid、23S;鄉(xiāng)丨相 Aksefei 等人,19'??, Nuddc Adds Rw BS94402)、進(jìn)行 BLAST 分析的軟件從National Center for Biotechnology Information網(wǎng)站上是公眾可獲得 的。
[0031] 簡(jiǎn)述之,BLAST分析包括首先通過(guò)確定查詢序列中長(zhǎng)度W的短字符來(lái)確定高評(píng)分 序列對(duì)(HSPs),當(dāng)與數(shù)據(jù)庫(kù)序列中相同長(zhǎng)度的字符比對(duì)時(shí),其匹配或滿足某些正值的閾值 分值T。T稱為鄰近字符分值閾值(Altschul等人,見上文)。這些初始的鄰近字符匹配作 為種子用于開始檢索以發(fā)現(xiàn)包含它們的更長(zhǎng)HSPs。字符匹配隨后沿每一序列在兩個(gè)方向上 延伸,遠(yuǎn)至累積比對(duì)分值能夠增加。對(duì)于核苷酸序列,使用參數(shù)M(對(duì)匹配殘基對(duì)的獎(jiǎng)勵(lì)分 值;始終>〇)和N(對(duì)錯(cuò)配殘基的懲罰分值;始終〈0)計(jì)算累積分值。對(duì)于氨基酸序列,使 用評(píng)分矩陣計(jì)算累積分值。當(dāng)出現(xiàn)以下情況時(shí),在每一方向上字符匹配的延伸停止:累積比 對(duì)分值以數(shù)量X從它的最大實(shí)現(xiàn)值掉落;由于積累了一個(gè)或多個(gè)負(fù)評(píng)分殘基比對(duì),累積分 值變?yōu)榱慊虻陀诹?;或到達(dá)任一序列的末端。BLAST算法參數(shù)W、T和X確定了比對(duì)的靈敏 度和速度。BLASTN程序(用于核苷酸序列)使用字符長(zhǎng)(W)為11、期望值(E)為10、M=5、 N=-4和兩條鏈的比較作為缺省值。對(duì)于氨基酸序列,BLASTP程序使用字符長(zhǎng)(W)為3、期 望值(E)為10、和BL0SUM62評(píng)分矩陣作為缺省值(見Henikoff和Henikoff, 1989,Proc Natl Acad Sci USA 89:10915)。
[0032] 在提供兩條序列的百分比同一性方面,與BLAST功能類似的大量其他算法是 可得的。可以通過(guò)以下進(jìn)行用于比較的序列最佳比對(duì),例如,通過(guò)Smith和Waterman, 1981,Adv. Appl. Math. 2:482 的局部同源性算法、通過(guò) Needleman 和 Wunsch, 1970, J. Mol. Biol. 48:443 的同源性比對(duì)算法、通過(guò) Pearson 和 Lipman, 1988,Proc. Natl. Acad. Sci. USA 85:2444的相似性檢索方法、通過(guò)這些算法的計(jì)算機(jī)化執(zhí)行(在GCG Wisconsin Software Package 中的 GAP、BESTFIT、FASTA 和 TFASTA)、或通過(guò)目檢進(jìn)行(通 常參見,Current Protocols in Molecular Biology,F(xiàn). M. Ausubel 等人編輯,Current Protocols,Greene Publishing Associates, Inc?和 John Wiley & Sons, Inc.,之間合 資,(1995 Supplement) (Ausubel))。此外,序列比對(duì)和百分比序列同一性的確定可以使用 GCG Wisconsin Software package (Accelrys, Madison WI)中的BESTFIT或GAP程序,使 用提供的缺省參數(shù)。
[0033] "實(shí)質(zhì)上的同一性"指在至少20個(gè)殘基位置的比較窗口上、通常在至少30-50個(gè)殘 基的窗口上與參考序列比較時(shí),具有至少80%序列同一性的多核苷酸或多肽序列、優(yōu)選至 少85 %序列同一性、更優(yōu)選至少89 %序列同一性、更優(yōu)選至少95 %序列同一性、并且甚至 更優(yōu)選至少99%序列同一性的多核苷酸或多肽序列,其中通過(guò)比較參考序列與包括在比較 窗口上參考序列的總計(jì)20 %或更少的缺失或添加的序列來(lái)計(jì)算序列同一性的百分比。在應(yīng) 用于多肽的具體實(shí)施方案中,術(shù)語(yǔ)"實(shí)質(zhì)上的同一性"表示當(dāng)最佳比對(duì)時(shí),諸如通過(guò)程序GAP 或BESTFIT使用缺省缺口權(quán)重時(shí),兩條多肽序列共有至少80%序列同一性,優(yōu)選至少89% 序列同一性、更優(yōu)選至少95%序列同一性或更高(例如,99%序列同一性)。優(yōu)選地,不相 同的殘基位置通過(guò)保守氨基酸取代而不同。
[0034] "立體選擇性"指化學(xué)或酶促反應(yīng)中一種立體異構(gòu)體超過(guò)另一個(gè)的優(yōu)選形成。立 體選擇性可以是部分的,其中一種立體異構(gòu)體的形成優(yōu)于另一種,或者立體選擇性可以是 完全的,其中僅形成一種立體異構(gòu)體。當(dāng)立體異構(gòu)體是對(duì)映體時(shí),立體選擇性稱為對(duì)映選擇 性,即一種對(duì)映體在兩者的總和中的分?jǐn)?shù)(通常報(bào)道為百分比)。或者它通常在本領(lǐng)域中報(bào) 道為(通常為百分比)根據(jù)公式[主要對(duì)映體一次要對(duì)映體]/[主要對(duì)映體+次要對(duì) 映體]從中計(jì)算的對(duì)映體過(guò)量(e.e.)。在立體異構(gòu)體是非對(duì)映異構(gòu)體的情況下,立體選擇 性稱為非對(duì)映立體選擇性,即一種非對(duì)映體在兩種非對(duì)映體的混合物中的分?jǐn)?shù)(通常報(bào)道 為百分比),通??蛇x地報(bào)道為非對(duì)映體過(guò)量(d. e.)。對(duì)映體過(guò)量和非對(duì)映體過(guò)量是立體 異構(gòu)體過(guò)量的類型。
[0035] "高度立體選擇的"指能夠以至少約85%立體異構(gòu)體過(guò)量轉(zhuǎn)化底物(例如式(2a)) 至它對(duì)應(yīng)的產(chǎn)物(例如式(la))的化學(xué)或酶促反應(yīng)。
[0036] "轉(zhuǎn)化"指底物至對(duì)應(yīng)產(chǎn)物的酶促轉(zhuǎn)化。"百分比轉(zhuǎn)化"指在指定條件下一段時(shí)間 內(nèi)轉(zhuǎn)化為產(chǎn)物的底物的百分比。因此,例如,轉(zhuǎn)氨酶多肽的"酶促活性"或"活性"可以表示 為底物至產(chǎn)物的"百分比轉(zhuǎn)化"。
[0037] "穩(wěn)定的"指本文描述的固定化酶在含有有機(jī)溶劑的溶劑體系中保持它們的結(jié)構(gòu) 構(gòu)象和/或它們的活性的能力。在某些實(shí)施方案中,穩(wěn)定的固定化酶在含有有機(jī)溶劑的溶 劑體系中每小時(shí)失去少于10%的活性。優(yōu)選地,本文描述的穩(wěn)定的固定化酶在含有有機(jī)溶 劑的溶劑體系中每小時(shí)失去少于9%的活性。優(yōu)選地,本文描述的穩(wěn)定的固定化酶在含有有 機(jī)溶劑的溶劑體系中每小時(shí)失去少于8%的活性。優(yōu)選地,本文描述的穩(wěn)定的固定化酶在含 有有機(jī)溶劑的溶劑體系中每小時(shí)失去少于7%的活性。優(yōu)選地,本文描述的穩(wěn)定的固定化酶 在含有有機(jī)溶劑的溶劑體系中每小時(shí)失去少于6%的活性。優(yōu)選地,本文描述的穩(wěn)定的固定 化酶在含有有機(jī)溶劑的溶劑體系中每小時(shí)失去少于5%的活性。優(yōu)選地,本文描述的穩(wěn)定的 固定化酶在含有有機(jī)溶劑的溶劑體系中每小時(shí)失去少于4%的活性。優(yōu)選地,本文描述的穩(wěn) 定的固定化酶在含有有機(jī)溶劑的溶劑體系中每小時(shí)失去少于3%的活性。優(yōu)選地,本文描述 的穩(wěn)定的固定化酶在含有有機(jī)溶劑的溶劑體系中每小時(shí)失去少于2%的活性。優(yōu)選地,本文 描述的穩(wěn)定的固定化酶在含有有機(jī)溶劑的溶劑體系中每小時(shí)失去少于1%的活性。
[0038] 如在本文公開的多肽的上下文中使用的"氨基酸"或"殘基"指在序列位置上的具 體單體。
[0039] "親水氨基酸或殘基"指按照Eisenberg等人,1984,J. Mol. Biol. 179:125-142 的標(biāo)準(zhǔn)化的共有疏水性標(biāo)度(consensus hydrophobicity scale), 具有顯示出低于零的疏水性的側(cè)鏈的氨基酸或殘基。遺傳編碼的親水氨基酸包括
[0040] "酸性氨基酸或殘基"指當(dāng)該氨基酸包含于肽或多肽中時(shí),具有顯示出低于約6的 PK值的側(cè)鏈的親水氨基酸或殘基。酸性氨基酸通常在生理pH下具有由于缺少氫離子而帶 負(fù)電荷的側(cè)鏈。遺傳編碼的酸性氨基酸包括L Glu (E)和L Asp (D)。
[0041] "堿性氨基酸或殘基"指當(dāng)該氨基酸包含于肽或多肽中時(shí),具有顯示出高于約6的 pKa值的側(cè)鏈的親水氨基酸或殘基。堿性氨基酸通常在生理pH下具有由于與水合氫離子結(jié) 合而帶正電荷的側(cè)鏈。遺傳編碼的堿性氨基酸包括LArg(R)和LLys(K)。
[0042] "極性氨基酸或殘基"指具有在生理pH下不帶電的側(cè)鏈的親水氨基酸或殘基,但其 具有至少一個(gè)這樣的鍵,其中由兩個(gè)原子共同分配的一對(duì)電子由所述原子之一更緊密地占 據(jù)。遺傳編碼的極性氨基酸包括L Asn (N)、L Gin(Q)、LSer (S)和L Thr⑴。
[0043] "疏水氨基酸或殘基"指按照Eisenberg等人,1984,J.Mol.Biol. 179:125-142的標(biāo)準(zhǔn)化的共有疏水性標(biāo)度,具有顯不出尚于零的疏水性的側(cè)鏈的氣基酸或殘基。遺傳編 碼的疏水U坫酸包詁 LPm(P),LS[le(IXLVa】(VXLLeii(L),L
[0044] "芳香族氨基酸或殘基"指具有包括至少一個(gè)芳香環(huán)或芳香雜環(huán)的側(cè)鏈的親水或 疏水氨基酸或殘基。遺傳編碼的芳香族氨基酸包括L Phe (F)、L Tyr (Y)、L His (H)和L Trp (W)。本文中將L His (H)組氨酸分類為親水殘基或受限殘基。
[0045] "非極性氨基酸或殘基"指具有在生理pH下不帶電的側(cè)鏈的疏水氨基酸或殘 基,并且其具有這樣的鍵,其中由兩個(gè)原子共同分配的一對(duì)電子通常由兩個(gè)原子的每 一個(gè)同等占據(jù)(即,側(cè)鏈不是極性的)。遺傳編碼的非極性氨基酸包括
[0046] "脂肪族氨基酸或殘基"指具有脂肪族烴側(cè)鏈的疏水氨基酸或殘基。遺傳編碼的脂 肪族氨基酸包拒
[0047] "半胱氨酸"或LCys(C)是不同尋常的,在于它可以與其他LCys(C)氨基酸或 其他含硫烷基或巰基的氨基酸形成二硫橋鍵。"半胱氨酸類殘基"包括半胱氨酸和包含可用 于形成二硫橋鍵的巰基部分的其他氨基酸。LCys(C)(和具有含SH側(cè)鏈的其他氨基酸) 以還原的游離SH或氧化的二硫橋鍵形式存在于肽中的能力影響LCys(C)促成肽的凈疏 水特征還是親水特征。盡管按照Eisenberg的標(biāo)準(zhǔn)化的共有標(biāo)度(Eisenberg等人,1984, 見上文),LCys(C)顯示出0. 29的疏水性,但應(yīng)該理解出于本公開的目的,將LCys(C) 分類至它自身唯一的組內(nèi)。
[0048] "含羥基氨基酸或殘基"指含羥基(-OH)部分的氨基酸。遺傳編碼的含羥基氨基酸 包括 L Ser (S)、L Thr (T)和 L-Tyr (Y)。
[0049] 轉(zhuǎn)氨酶 通常,轉(zhuǎn)氨酶催化酮至手性胺的直接氨基化。轉(zhuǎn)氨酶的實(shí)例包括任何具有從伯胺(3) 向受體羰基化合物(2)轉(zhuǎn)移氨基(NH2)和氫原子、將胺供體轉(zhuǎn)化為它對(duì)應(yīng)的羰基化合物(4) 并將受體轉(zhuǎn)化為它對(duì)應(yīng)的伯胺(1)的酶促能力的多肽:
其中當(dāng)獨(dú)立地獲得時(shí),R1、R2、R3和R 4的每一個(gè)是未取代的或取代有一個(gè)或多個(gè)對(duì)酶無(wú) 抑制性的基團(tuán)的烷基、烷基芳基或芳基。R1和R3在結(jié)構(gòu)或手性上可以分別與R2和R 4相同 或不同?;鶊F(tuán)R1和R2或R3和R 4-同可以形成未取代的、取代的或與其他環(huán)稠合的環(huán)。
[0050] 本文描述了包含重組轉(zhuǎn)氨酶的固定化轉(zhuǎn)氨酶,所述重組轉(zhuǎn)氨酶能夠?qū)?-氧 代 _4-[3-(三氟甲基)-5,6_二氫[1,2,4]三唑并[4,3-a]吡嗪-7(8功-基]-1-(2,4,5-三 氟苯基)丁-2-酮("酮酰胺底物")轉(zhuǎn)化成(2功-4-氧代-4-[3-(三氟甲基)-5, 6-二氫 [1,2, 4]三唑并[4, 3-a]吡嗪-7 (8功-基]-1-(2, 4, 5-三氟苯基)丁-2-胺("產(chǎn)物")。
[0051] 在本文描述的固定化轉(zhuǎn)氨酶的某些實(shí)施方案中,所述固定化轉(zhuǎn)氨酶包括轉(zhuǎn)氨 酶,其能夠在氨基供體存在的情況下,將4-氧代-4-[3-(三氟甲基)-5, 6-二氫[1,2, 4] 三唑并[4,3-<3]吡嗪-7(8功-基]-1-(2,4,5-三氟苯基)丁-2-酮("酮酰胺底 物")轉(zhuǎn)化成(2功-4-氧代-4-[3-(三氟甲基)-5,6_二氫[1,2,4]三唑并[4,3-a]吡 嗪-7 (8功-基]-1- (2, 4, 5-三氟苯基)丁 -2-胺("產(chǎn)物")至通過(guò)分析技術(shù)(諸如HPLC-UV 吸