欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

磷脂酶,編碼磷脂酶的核酸以及制備和應(yīng)用磷脂酶的方法

文檔序號:394463閱讀:429來源:國知局
專利名稱:磷脂酶,編碼磷脂酶的核酸以及制備和應(yīng)用磷脂酶的方法
技術(shù)領(lǐng)域
本發(fā)明總體上與磷脂酶,編碼磷脂酶的多核苷酸,制備以及應(yīng)用這些多核苷酸和多肽的方法。特別地,本發(fā)明提供具有磷脂酶活性的新穎多肽,編碼它們的核酸以及與它們結(jié)合的抗體。也提供工業(yè)方法和包括應(yīng)用這些磷脂酶的產(chǎn)品。
背景技術(shù)
磷脂酶是水解磷脂的酯鍵的酶。與它們在磷脂代謝的重要性相對應(yīng),這些酶廣泛存在于真核和原核生物中。磷脂酶影響代謝,生物膜的形成和重組,并且磷脂酶也涉及信號的級聯(lián)。按照磷脂分子攻擊的鍵的位置,已知有幾種類型的特異性不同的磷脂酶。磷脂酶Al (PLAl)去除1-位的脂肪酸而產(chǎn)生游離的脂肪酸和1-溶血-2-?;字?。磷脂酶 A2(PLA2)去除2-位的脂肪酸而產(chǎn)生游離的脂肪酸和1-?;?2-溶血磷脂。PLAl和PLA2 酶可能是在細(xì)胞內(nèi)也可以在細(xì)胞外,是膜結(jié)合的或者可溶的。發(fā)現(xiàn)胞內(nèi)的PLA2存在于幾乎所有的哺乳動(dòng)物細(xì)胞中。磷脂酶C(PLC)去除磷酸組分,產(chǎn)生1,2 二?;视秃土谆?。磷脂酶D(PLD)產(chǎn)生1,2_ 二?;视土姿岷蛪A性基團(tuán)。PLC和PLD在細(xì)胞功能和信號傳導(dǎo)中是重要的。PLD曾經(jīng)是在生物催化中主要的磷脂酶(參見,如,Godfrey,T. and West S. (1996) 工業(yè)酶學(xué),299-300,Stockton Press, New York)。馬鈴薯塊蓮儲藏蛋白(Patatins)是另一類磷脂酶,認(rèn)為其作用如同PLA(參見例如,Hirsctiberg HJ,et al. , (2001),Eur J Biochem 268(19) :5037-44)。普通的含油種子,如大豆,油菜籽,向日葵籽,芝麻和花生用于油的來源和原料。在榨油的過程中,種子用機(jī)械和熱處理。油分離,并且用溶劑從粗粉中分離。應(yīng)用蒸餾法,從油中分離出溶劑并且回收。油經(jīng)過“脫膠(degummed)”并且進(jìn)行精練。粗粉中的溶劑組分可以通過“脫溶劑烤爐”的熱處理來蒸發(fā),隨后,粗粉干燥和冷卻。當(dāng)溶劑通過蒸餾分離以后,產(chǎn)生的粗油經(jīng)過特殊的脫膠程序和物理精練的方法加工成為食用油。也可以作為原料產(chǎn)生脂肪酸和甲基酯。粗粉可以用做動(dòng)物飼料(animal rations) 0脫膠(degumming)是精練植物油的第一步,脫膠設(shè)計(jì)為去除與油一起抽提、但影響以后的工藝過程的污染磷脂。這些磷脂僅僅以無水形式溶于植物油中,如果通過簡單的水合作用,磷脂可以沉淀并去除。水合作用一般通過少量的水與充分干燥的油連續(xù)混合進(jìn)行。典型地,水的量是磷脂含量的75%,磷脂的量典型地是1到1.5%。雖然假如在50°C到 80°C的范圍內(nèi),油的粘度會降低,水合膠的分離更好,但是溫度條件并不高度嚴(yán)格。很多油脫膠(oil degumming)的方法目前都在使用。油脫膠的過程可以通過使用磷脂酶進(jìn)行酶協(xié)助。磷脂酶Al和A2已經(jīng)應(yīng)用于不同商業(yè)過程中的油脫膠過程,如 “ENZYMAX 脫膠”(Lurgi Life Science Technologies GmbH,Germany)。也已經(jīng)考慮磷脂酶C(PLC)應(yīng)用于油的脫膠,因?yàn)榱字窩在磷脂上作用產(chǎn)生的磷酸組分是水溶性的, 并且容易去除,而且甘油二酯與油在一起,降低了損失;參見,如Godfrey,Τ. and West S. (1996)工業(yè)酶學(xué) pp. 299-300,Stockton Press, New York, Dahlke (1998) "An enzymatic process for the physical refining of seed oils, " Chem. Eng. Technol. 21:278-281, Clausen(2001)"Enzymatic oil degumming by a novel microbial phospholipase,"Eur. J. Lipid Sci. Technol. 103 :333_340o高磷脂油(high phosphatide oils),例如黃豆,蕓苔和向日葵的處理方法不同于別的油如棕櫚的處理方法。不像低磷脂油的蒸汽或“物理精練”處理過程,這些高磷油需要特定的化學(xué)和機(jī)械處理去除含磷的磷脂。這些油一般通過化學(xué)精練的過程,化學(xué)精練過程必需中和形成皂的游離脂肪酸和一種不溶性的膠組成。中和過程對于去除游離脂肪酸和磷脂非常有效,但是該過程也導(dǎo)致了顯著的產(chǎn)率損失和質(zhì)量的下降。在一些情況下,高磷脂的粗制油在苛性中和前進(jìn)行脫膠。利用卵磷脂的大豆油就是這種情況,其中的油首先用水或者酸來脫膠。植物固醇(phytosterols)(植物甾醇(plant sterols))是天然產(chǎn)物的三萜家族的成員,其包括超過100種不同的植物固醇和超過4000種其它種類的三萜??傮w上,認(rèn)為植物固醇是由于增加類固醇/磷脂的比例而導(dǎo)致膜的硬化從而穩(wěn)定植物的細(xì)胞膜。在化學(xué)上,植物固醇在結(jié)構(gòu)上非常類似于膽固醇。主要的植物固醇是谷留醇,蕓苔固醇和豆固醇。其它的包括豆留烯醇(二氫谷留醇),二氫谷留醇,24-脫氫膽固醇,海綿留醇,海綿甾醇,Y-谷甾醇和菜子甾醇。植物留醇是健康和營養(yǎng)工業(yè)中的重要的農(nóng)產(chǎn)品。它們用于制造化妝品的乳化劑并且為激素藥物的生產(chǎn)提供大多數(shù)留體中間體和前體。植物留醇的飽和類似物以及它們的酯已經(jīng)被認(rèn)為是益于心血管健康的有效的降低膽固醇的試劑。植物留醇通過在腸腔中抑制膽固醇的吸收來降低血清中的膽固醇水平,并且植物留醇在很低的水平具有免疫調(diào)節(jié)特征, 包括T淋巴細(xì)胞增強(qiáng)的細(xì)胞應(yīng)答和抗癌癥細(xì)胞系的天然殺傷細(xì)胞的細(xì)胞毒性。此外,它們在治療肺結(jié)核,風(fēng)濕性關(guān)節(jié)炎,控制Hiv-感染的病人和馬拉松選手的免疫壓力抑制的臨床研究中的治療效應(yīng)已經(jīng)得到證明。植物固醇的酯類,也指植物甾醇酯,由美國食品藥品管理局(FDA)批準(zhǔn)為GRAS ( — 般認(rèn)為安全,Generally Recognized As Safe),用于人造黃油,并在1999年推廣。2000年 9月,F(xiàn)DA也提出一個(gè)過渡性的規(guī)定,其準(zhǔn)許了含有植物留醇酯類的食品的健康申明標(biāo)記 (health-claiming labeling)。因此,用植物甾醇酯類進(jìn)行營養(yǎng)強(qiáng)化的食品是高度預(yù)期被消費(fèi)者接受的。發(fā)明概述本發(fā)明提供包括與本發(fā)明的典型序列,例如SEQ ID NO :1,SEQ ID NO :3,SEQ ID NO 5, SEQ ID NO :7,SEQ ID NO :9,SEQ ID NO :11,SEQ ID NO :13,SEQ ID NO :15,SEQ ID NO 17, SEQ ID NO :19,SEQ ID NO :21,SEQ ID NO :23,SEQ ID NO :25,SEQ ID NO :27,SEQ ID NO 29, SEQ ID N0. 31,SEQ ID NO :33,SEQ ID NO :35,SEQ ID NO :37,SEQ ID NO :39, SEQ ID NO 41, SEQ ID NO :43,SEQ ID NO :45,SEQ ID NO :47,SEQ ID NO :49,SEQ ID NO 51,SEQ ID NO :53,SEQ ID NO :55,SEQ ID NO :57,SEQ ID NO :59,SEQ ID NO :61,SEQ ID NO 63, SEQ ID NO :65,SEQ ID NO :67,SEQ ID NO :69,SEQ ID NO -Jl, SEQ ID NO :73,SEQID NO 75, SEQ ID NO :77,SEQ ID NO :79,SEQ ID NO :81,SEQ ID NO :83,SEQ ID NO :85, SEQ ID NO87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO :93,SEQ ID NO:95,SEQ ID NO 97,SEQ ID NO 99, SEQ ID NO 101, SEQ ID NO 103, SEQ ID NO :105在至少大約 10,15,20, 25,30,35,40,45,50,75,100,150,200,250,300,350,400,450,500,550,600,650,700,750, 800,850,900,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1450,1500,1550, 1600,1650,1700,1750,1800,1850,1900,1950,2000,2050,2100,2200,2250,2300,2350, 2400,M50,2500,或者更多的殘基范圍內(nèi)具有至少大約50%, 51 %, 52%, 53%, 54%, 55%, 56 %, 57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 %,或者更多的或者完全的(100%)的序列同一性的核酸序列的分離的或者重組的核酸,編碼具有磷脂酶,例如磷脂酶A,C或者D活性的至少一個(gè)多肽,同時(shí)序列同一性用序列比較算法分析或者目測檢查來確定。發(fā)明提供包括與SEQ ID NO :1 在至少大約 10,15,20,25,30,35,40,45,50,75, 100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850 更多連續(xù)的殘
基范圍內(nèi)具有至少 81 %,82 %,83 %,84%,85 %,86 %,87 %,88 %,89 %,90 %,91 %,92 %, 93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100% )序列同一性的核酸序列的分離的或者重組的核酸,其中該核酸編碼具有磷脂酶,例如磷脂酶A,B,C或者D活性的至少一個(gè)多肽,同時(shí)序列同一性用序列比較算法分析或者目測檢查來確定。發(fā)明提供包括與SEQ ID NO :3 在至少大約 10,15,20,25,30,35,40,45,50,75, 100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850 更多連續(xù)的殘基范圍內(nèi)具有至少 78 %,79 %,80 %,81 %,82 %,83 %,84 %,85 %,86 %,87 %,88 %,89 %, 90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100% ) 序列同一性的核酸序列的分離的或者重組的核酸,其中核酸編碼具有磷脂酶,例如磷脂酶 A,B,C或者D活性的至少一個(gè)多肽,同時(shí)序列同一性用序列比較算法分析或者目測檢查來確定。發(fā)明提供包括與SEQ ID NO :5 在至少大約 10,15,20,25,30,35,40,45,50,75, 100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850 更多連續(xù)殘基范圍內(nèi)具有至少 78%, 79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%, 91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100% )序列同一性的核酸序列的分離的或者重組的核酸,其中核酸編碼具有磷脂酶,例如磷脂酶A,B,C 或者D活性的至少一個(gè)多肽,同時(shí)序列同一性用序列比較算法分析或者目測檢查來確定。發(fā)明提供包括與SEQ ID NO :7 在至少大約 10,15,20,25,30,35,40,45,50,75, 100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850 更多連續(xù)殘基范圍內(nèi)具有至少 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%,60%,61%,62%, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 % , 93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100% )序列同一性的核酸序列的分離的或者重組的核酸,其中核酸編碼具有磷脂酶,例如磷脂酶A,B,C或者D活性的至少一個(gè)多肽,同時(shí)序列同一性用序列比較算法分析或者目測檢查來確定。在可選擇的方面,分離的或者重組的核酸編碼包括在序列SEQ ID NO 2, SEQ ID NO 4, SEQ ID NO :6,或者SEQ ID NO :8中闡明的序列的多肽。一方面,這些多肽具有磷脂酶,例如,磷脂酶A,B,C或者D活性。一方面,序列比較算法是BLAST算法,如BLAST 2. 2. 2版算法。一方面,篩選設(shè)置(filtering setting)設(shè)為 blastall-p,blastp-d "nr pataa”_F F,所有其它可選項(xiàng) (options)設(shè)為默認(rèn)值。一方面,磷脂酶活性包括催化甘油磷酸酯鍵的水解(即,切斷甘油磷酸酯鍵)。磷脂酶活性可以包括催化植物油中磷脂的酯鍵的水解。植物油磷脂可以包括油籽的磷脂。磷脂酶活性包括磷脂酶C (PLC)活性,磷脂酶A (PLA)活性,如磷脂酶Al或者磷脂酶A2活性, 磷脂酶D(PLD)活性,如磷脂酶Dl或者磷脂酶D2活性或者patatin活性。磷脂酶活性可以包括糖蛋白的水解,如,在馬鈴薯塊莖中發(fā)現(xiàn)的糖蛋白的水解。磷脂酶活性可以包括馬鈴薯塊莖儲藏蛋白(patatin)的酶活性,磷脂酶活性可以包括脂酰水解酶(LAH)活性。一方面,分離的或者重組的核酸編碼具有熱穩(wěn)定性的磷脂酶活性的多肽。多肽可以在包括大約37°C到95°C ;大約55°C到85°C,70°C到95°C,或者大約90°C到95°C之間的溫度范圍的條件下保持磷脂酶活性。另一方面,分離或者重組的核酸編碼具有耐熱的磷脂酶活性的多肽。多肽可以在暴露于37°C到95°C的溫度范圍內(nèi)或者高于55°C到85°C的范圍內(nèi)后仍保持磷脂酶活性。一方面,多肽在PH 4.5下,暴露于高于901到951的范圍后仍保持磷脂酶活性。多肽在包括大約pH 7,pH 6. 5,pH 6. 0,pH 5. 5,pH 5,或者pH 4. 5的條件下可以保持磷脂酶的活性。多肽可以在包括溫度范圍為大約40°C到大約70°C的條件下保持磷脂酶活性。一方面,分離的或者重組的核酸包括在嚴(yán)謹(jǐn)條件下與在SEQ ID NO :1,SEQ ID NO: 3, SEQ ID NO :5,或SEQ ID NO :7中闡明的序列雜交的核酸,其中該核酸編碼具有磷脂酶活性的多肽。正如在此所述的,核酸可以是基因或者轉(zhuǎn)錄本的至少大約10,20,30,40,50,60, 70,80,90,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850 殘基或者全長殘基,具有或者不具有信號序列。正如在此所述的,嚴(yán)謹(jǐn)條件可以是高度嚴(yán)謹(jǐn),中度嚴(yán)謹(jǐn)或者低嚴(yán)謹(jǐn)性。嚴(yán)謹(jǐn)條件可以包括洗滌步驟,如,包括在0. 2 X SSC,大約65 °C條件下洗滌大約15分鐘的洗滌步驟。發(fā)明提供用于鑒定編碼具有磷脂酶,例如磷脂酶活性的多肽的核酸的核酸探針, 其中該探針包括發(fā)明的序列,例如在SEQ ID NO 1, SEQ ID NO :3,SEQ ID NO :5,或者SEQ ID NO 7 中闡明的序列的至少 10,20,30,40,50,60,70,80,90,100,150,200,250,300,350, 400,450,500,550,600,650,700,750,800,850個(gè)或者更多的連續(xù)堿基,該探針通過結(jié)合或者雜交確定核酸。探針可以包括含有在SEQ ID NO 1, SEQ ID NO :3,SEQ ID N0:5,和/或 SEQ ID NO 7中闡明的序列的至少大約10到50,大約20到60,大約30到70,大約40到 80,或者大約60到100的連續(xù)堿基的寡聚核苷酸。發(fā)明提供用于鑒定編碼具有磷脂酶,如,磷脂酶活性的多肽的核酸的核酸探針其中探針包括發(fā)明的核酸,例如在至少大約10,20,30,40,50,60,70,80,90,100,150,200, 250,300,350,400,450,500,550,600,650,700,750,800,850 或者更多連續(xù)殘基的范圍內(nèi),與 SEQ ID NO 1, SEQ ID NO :3,SEQ ID N0:5,和/或SEQ ID NO :7 或者它們的亞序列具有至少 50 %,51 %,52 %,53 %,54 %,55 %,56 %,57 %,58 %,59 %,60 %,61 %,62 %,63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 % , 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100%)的序列同一性的核酸, 其中序列同一性通過序列比較算法分析或者目測檢查確定。發(fā)明提供用于擴(kuò)增編碼具有磷脂酶活性的多肽的核酸的擴(kuò)增引物序列對,其中引物對可以擴(kuò)增包括發(fā)明的核酸序列或者片段或者亞序列的核酸序列。擴(kuò)增弓I物序列的每一個(gè)成員可能包括含有至少大約10到50個(gè)連續(xù)堿基元列,或者大約12,13,14,15,16,17,18, 19,20,21,22,23,24,或者25個(gè)連續(xù)堿基元列的寡聚核苷酸。發(fā)明提供擴(kuò)增引物對,其中引物對包括具有如發(fā)明的核酸的大約第一個(gè)(5' 端)12,13,14,15,16,17,18,19,20,21,22,23,24,或者25個(gè)殘基所闡明的序列的第一成員,和具有與第一成員的互補(bǔ)鏈的第一個(gè)(5' ) 12,13,14,15,16,17,18,19,20,21,22,23, 24,或者25個(gè)殘基所闡明的序列的第二成員。應(yīng)用發(fā)明的擴(kuò)增引物對,發(fā)明提供通過擴(kuò)增,例如,聚合酶鏈?zhǔn)椒磻?yīng)(PCR)產(chǎn)生的磷脂酶。應(yīng)用發(fā)明的擴(kuò)增引物對,發(fā)明提供通過擴(kuò)增,例如,聚合酶鏈?zhǔn)椒磻?yīng)(PCR)制備磷脂酶的方法。一方面,擴(kuò)增引物擴(kuò)增來自文庫的核酸,如,基因文庫(gene library),如環(huán)境文庫(environmental library)。發(fā)明提供擴(kuò)增編碼具有磷脂酶活性的多肽的核酸的方法,包括用可以擴(kuò)增發(fā)明的核酸序列或者其片段或者其亞序列的擴(kuò)增引物序列來擴(kuò)增模板核酸序列。擴(kuò)增引物可以是發(fā)明的擴(kuò)增引物對。發(fā)明提供包括發(fā)明的核酸或者它的亞序列的表達(dá)盒(expression cassettes)。一方面,表達(dá)盒可以包括連接啟動(dòng)子的核酸。啟動(dòng)子可以是病毒的,細(xì)菌的,哺乳動(dòng)物或者植物啟動(dòng)子。一方面,植物啟動(dòng)子可以是馬鈴薯,水稻,玉米,小麥,煙草或者大麥啟動(dòng)子。啟動(dòng)子可以是組成型啟動(dòng)子。組成型啟動(dòng)子可以包括CaMV35S。另一方面,啟動(dòng)子可以是可誘導(dǎo)的啟動(dòng)子。一方面,啟動(dòng)子可以是組織一特異性啟動(dòng)子或者環(huán)境調(diào)控或者發(fā)育調(diào)控啟動(dòng)子。因此,啟動(dòng)子可以是,如,種子一特異性,葉子一特異性,根一特異性,莖一特異性或者脫落一誘導(dǎo)的啟動(dòng)子。一方面,表達(dá)盒可以進(jìn)一步包括植物的或者植物病毒的表達(dá)載體。發(fā)明提供包括發(fā)明的表達(dá)盒(如載體)或者發(fā)明的核酸的克隆載體??寺≥d體可以是病毒載體,質(zhì)粒,噬菌體,噬菌質(zhì)粒,粘粒,fosmid,細(xì)菌噬菌體或者人工染色體。病毒載體可以包括腺病毒載體,逆轉(zhuǎn)錄病毒載體或者腺相關(guān)病毒載體??寺≥d體可以包括細(xì)菌人造染色體(BAC),質(zhì)粒,細(xì)菌噬菌體Pl衍生載體(PAC),酵母人造染色體(YAC),或者哺乳動(dòng)物人造染色體(MAC)。發(fā)明提供含有發(fā)明核酸或者發(fā)明表達(dá)盒(如,載體)或者發(fā)明克隆載體的轉(zhuǎn)化的細(xì)胞。一方面,轉(zhuǎn)化細(xì)胞可以是細(xì)菌細(xì)胞,哺乳動(dòng)物細(xì)胞,真菌細(xì)胞,酵母細(xì)胞,昆蟲細(xì)胞或者植物細(xì)胞。一方面,植物細(xì)胞可以是馬鈴薯,小麥,水稻,玉米,煙草或者大麥細(xì)胞。發(fā)明提供包括發(fā)明的核酸或者發(fā)明的表達(dá)盒(如,載體)的轉(zhuǎn)基因非一人類動(dòng)物。 一方面,動(dòng)物是小鼠。發(fā)明提供包括發(fā)明的核酸或者發(fā)明的表達(dá)盒(如,載體)的轉(zhuǎn)基因植物。轉(zhuǎn)基因植物可以是玉米植物,馬鈴薯植物,番茄植物,小麥植物,油籽植物,油菜籽植物,大豆植物, 水稻植物,大麥植物,或煙草植物。發(fā)明提供包括發(fā)明的核酸或發(fā)明的表達(dá)盒(例如,載體) 的轉(zhuǎn)基因種子。轉(zhuǎn)基因種子可以是玉米種子,小麥種子,油籽,油菜籽(蕓苔植物),大豆種子,棕櫚種子,向日葵種子,芝麻種子,花生或煙草植物種子。發(fā)明提供含有在嚴(yán)謹(jǐn)條件下可以與發(fā)明的核酸互補(bǔ)或雜交的核酸序列的反義寡核苷酸。發(fā)明提供抑制細(xì)胞內(nèi)磷脂酶信使翻譯的方法,包括往細(xì)胞中施用或者在細(xì)胞中表達(dá)包括在嚴(yán)謹(jǐn)條件下可以與發(fā)明的核酸互補(bǔ)或雜交的核酸序列的反義寡核苷酸。發(fā)明提供包括在嚴(yán)謹(jǐn)條件下可以與發(fā)明的核酸互補(bǔ)或雜交的核酸序列的反義寡聚核苷酸。發(fā)明提供抑制細(xì)胞內(nèi)磷脂酶信使翻譯的方法,包括往細(xì)胞中施用或者在細(xì)胞中表達(dá)包括在嚴(yán)謹(jǐn)條件下可以與發(fā)明的核酸互補(bǔ)或雜交的核酸序列的反義寡核苷酸。反義寡聚核苷酸可以是在10到50,大約20到60,大約30到70,大約40到80,大約60到100,大約70到110,或者大約80到120個(gè)堿基的長度。發(fā)明提供抑制細(xì)胞內(nèi)磷脂酶如,磷脂酶信使翻譯的方法,包括往細(xì)胞中施用或者在細(xì)胞中表達(dá)包括在嚴(yán)謹(jǐn)條件下可以與發(fā)明的核酸互補(bǔ)或雜交的核酸序列的反義寡核苷酸。發(fā)明提供包括發(fā)明序列的亞序列的雙鏈抑制RNA(RNAi)分子。一方面,RNAi長度是大約15,16,17,18,19,20,21,22,23,24,25或者更多的雙鏈核苷酸。發(fā)明提供在細(xì)胞內(nèi)抑制磷脂酶,如磷脂酶表達(dá)的方法,包括往細(xì)胞中施用或者在細(xì)胞中表達(dá)雙鏈抑制RNA (RNAi), 其中RNA包括發(fā)明序列的亞序列。發(fā)明提供包括與發(fā)明的典型多肽或肽在至少大約25,50,75,100,125,150,175, 200,225,250,275,300,325,350或者更多殘基,或者全長的多肽范圍內(nèi)具有至少大約 50 %, 51 %, 52 %, 53 %, 54 %, 55 %, 56 %, 57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95^,96%,97^,98%,99%,或者更多,或者完全的(100%)同一性的氨基酸序列的分離的或者重組的多肽,序列同一性通過序列比較算法分析或者通過目測觀察來確定。發(fā)明的典型多肽或者肽序列包括SEQ ID NO 2, SEQ ID NO :4,SEQ ID NO 6或者SEQ ID NO :8。 一方面,發(fā)明提供包括與SEQ ID NO :2具有至少81%,82%,83%,84%,85%,86%,87%, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 %,或者更多,或者完全的(100%)序列同一性的氨基酸序列的分離的或者重組的多肽。一方面,發(fā)明提供包括與 SEQ ID NO :4 具有至少 78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%, 89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的 (100%)序列同一性的氨基酸序列的分離的或者重組的多肽。一方面,發(fā)明提供包括與SEQ ID NO 6 具有至少 78 %,79 %,80 %,81 %,82 %,83 %,84 %,85 %,86 %,87 %,88 %,89 %, 90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100% ) 序列同一性的氨基酸序列的分離的或者重組的多肽。一方面,發(fā)明提供包括與SEQ ID NO 8 具有至少 50 %,51 %,52 %,53 %,54 %,55 %,56 %,57 %,58 %,59 %,60 %,61 %,62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93%,94%,95%,96%,97%,98%,99%或者更多,或者完全的(100%)序列同一性的氨基酸序列的分離的或者重組的多肽。發(fā)明提供由發(fā)明的核酸編碼的分離的或者重組的多肽。 在可選擇方面,多肽可以具有如SEQ ID NO 2, SEQ ID N0:4,SEQ ID NO :6,或者SEQ ID NO: 8中闡明的序列。多肽可以具有磷脂酶活性,如,磷脂酶A,B,C或者D活性。發(fā)明提供含有缺乏信號序列的發(fā)明的多肽的分離的或者重組的多肽,一方面,缺乏信號肽的多肽與SEQ ID而2的殘基30到287具有至少81%,82%,83%,84%,85%, 86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99% 或者更多序列同一性,缺乏信號肽的多肽具有與SEQ ID NO 4的殘基25到283有至少78^,79%, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95%,96%,97%,98%,99%,或者更多序列同一性的氨基酸序列,與SEQ ID NO :6的殘基 26 到 280 有至少 78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%, 90 %, 91 %, 92 %, 93 % , 94 %, 95 %, 96 %, 97 %, 98 %, 99 %,或者更多序列同一性的氨基酸序列,與 SEQ ID N0:8 的殘基 40 到 330 有至少 50%,51%,52%,53%,,55%,56%, 57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 %,或者更多的序列同一性的氨基酸序列。序列同一性通過序列比較算法分析或者通過目測觀察確定。發(fā)明的另一方面提供分離的或者重組的多肽或者肽,分離的或者重組的多肽或者肽包括發(fā)明的多肽或肽序列,與之實(shí)質(zhì)上的一致序列,與之互補(bǔ)序列的至少10,15,20,25, 30,35,40,45,50,55,60,65,70,75,80,85,90,95 或者 100 或者更多的連續(xù)堿基。肽可以是, 例如,產(chǎn)生免疫性的片段,基元(如,結(jié)合位點(diǎn))或者活性位點(diǎn)。一方面,發(fā)明分離的或者重組的多肽(有或沒有信號序列)具有磷脂酶活性。一方面,磷脂酶活性包括催化甘油磷酸酯鍵的水解(即,切割甘油磷酸酯鍵)。磷脂酶活性包括催化植物油中磷脂的酯鍵的水解。植物油磷脂可以包括油籽的磷脂。磷脂酶活性可以包括磷脂酶C (PLC)的活性,磷脂酶A (PLA)活性,如磷脂酶Al或者磷脂酶A2的活性,磷脂酶 D(PLD)的活性,如磷脂酶Dl或者磷脂酶D2的活性。磷脂酶活性可以包括水解糖蛋白,如, 馬鈴薯儲存塊莖中的糖蛋白。磷脂酶活性可以包括脂酰水解酶(LAH)活性。一方面,磷脂酶活性是熱穩(wěn)定性的。多肽可以在包括溫度范圍在大約37°C到大約 95°C之間,大約55°C到大約85°C之間,大約70°C到大約95°C之間,或者大約90°C到大約 95°C之間的條件下保持磷脂酶活性。另一方面,磷脂酶活性可以是耐熱的。多肽可以在暴露于溫度范圍高于37°C到大約95°C,或者在高于55°C到大約85°C下后仍保持磷脂酶活性。 一方面,多肽可以在暴露于溫度范圍在90°C到大約95°C,在pH4. 5下后仍保持磷脂酶活性。一方面,多肽可以在包括大約pH 6. 5,pH 6,pH 5. 5,pH 5,pH 4. 5或者pH 4的條件下保持磷脂酶活性。另一方面,多肽可以在包括大約PH 7,pH 7. 5,pH 8,pH 8. 5,pH 9, ρΗ9· 5,pH 10,pH 10. 5,或pH 11的條件下保持磷脂酶活性。一方面,分離的或者重組的多肽可以包括發(fā)明的多肽,其缺乏信號序列。一方面, 分離的或者重組的多肽可以包括含有異源信號序列,如異源的磷脂酶或者非一磷脂酶的信號序列的本發(fā)明多肽。發(fā)明提供含有與SEQ ID NO :2的1到四殘基有至少95%,96%,97%,98%,99%, 或者更多序列同一性的分離的或者重組的肽,含有與SEQ ID Ν0:4的1到對殘基有至少95%,96%,97%,98%,99%,或者更多序列同一性的分離的或者重組的肽,含有與SEQ ID NO 6的1到25殘基有至少95%,96%,97%,98%,99%,或者更多序列同一性的分離的或者重組的肽,含有與SEQ ID N0:8的1到39殘基有至少95%,96%,97%,98%,99%,或者更多序列同一性的分離的或者重組的肽,和別的在其它的SEQ ID列表中闡明的信號序列, 其中序列同一性通過序列比較算法分析或者通過目測觀察來確定。這些肽可以作為內(nèi)源性磷脂酶或者其它磷脂酶,或者外源蛋白(非磷脂酶或者其它蛋白)的信號肽序列。一方面,發(fā)明提供包括第一結(jié)構(gòu)域和至少第二結(jié)構(gòu)域的嵌合蛋白,第一結(jié)構(gòu)域包括發(fā)明的信號序列。蛋白可以是融合蛋白。第二結(jié)構(gòu)域可以包括酶,酶可以是磷脂酶。發(fā)明提供包括至少第一結(jié)構(gòu)域和至少第二結(jié)構(gòu)域的嵌合多肽,第一結(jié)構(gòu)域包括發(fā)明的信號肽(SP)或催化結(jié)構(gòu)域(CD),或發(fā)明的磷脂酶的活性位點(diǎn),第二結(jié)構(gòu)域包括異源多肽或肽,其中異源多肽或者肽與信號肽(SP)或者催化結(jié)構(gòu)域(CD)之間并沒有天然的聯(lián)系。 一方面,異源多肽或者肽不是磷脂酶。異源多肽或者肽可以是信號肽(SP)或者催化結(jié)構(gòu)域 (CD)的氨基末端,羧基末端或者羧基和氨基末端。發(fā)明提供分離的或者重組的編碼嵌合多肽的核酸,其中嵌合多肽包括至少第一結(jié)構(gòu)域和至少第二結(jié)構(gòu)域,第一結(jié)構(gòu)域含有發(fā)明多肽的信號肽(SP)或者催化結(jié)構(gòu)域(CD)或者活性位點(diǎn),第二結(jié)構(gòu)域包括異源多肽或者肽,其中異源多肽或者肽與信號肽(SP)或者催化結(jié)構(gòu)域(CD)之間并不是天然聯(lián)合。一方面,磷脂酶活性包括在大約37°C下,每毫克蛋白大約100到大約1000單位的特異活性。另一方面,磷脂酶活性包括每毫克蛋白大約500到大約700單位的特異活性。 可選擇的,磷脂酶活性包括在大約37°C下,每毫克蛋白大約500到大約1200單位的特異活性。一方面,磷脂酶活性包括在大約37°C下,每毫克蛋白大約750到大約1000單位的特異活性。另一方面,耐熱性包含在加熱至升高的溫度以后,在37°C下保持至少一半磷脂酶的特異活性??蛇x擇的,耐熱性包含在加熱至升高的溫度以后,在37°C下每毫克蛋白保持大約 500到大約1200單位的特異活性。發(fā)明提供發(fā)明分離的或者重組的多肽,其中多肽包括至少一個(gè)糖基化位點(diǎn),一方面,糖基化可以是N-連接糖基化。一方面,多肽可以是在畢赤酵母(P.pastoris)或者裂變酵母(S pombe.)表達(dá)后進(jìn)行糖基化。發(fā)明提供包括發(fā)明多肽的蛋白制備,其中蛋白制備包括液相,固相或者凝膠。發(fā)明提供包括發(fā)明多肽和第二個(gè)蛋白或者結(jié)構(gòu)域的異源二聚物。異源二聚物的第二成員可以是不同的磷脂酶,不同的酶或者另一個(gè)蛋白。一方面,第二結(jié)構(gòu)域可以是多肽, 異源二聚物可以是融合蛋白。一方面,第二結(jié)構(gòu)域可以是抗原決定簇或者標(biāo)記。一方面,發(fā)明提供包括發(fā)明多肽的同源二聚物。發(fā)明提供具有磷脂酶活性的固定化多肽,其中多肽包含發(fā)明的多肽,發(fā)明核酸編碼的多肽,或者包括發(fā)明多肽和第二結(jié)構(gòu)域的多肽。一方面,多肽可以固定于細(xì)胞,金屬,樹脂,多聚物,陶瓷,玻璃,微電極,石墨顆粒,珠子,凝膠,金屬板,陣列或者毛細(xì)管。發(fā)明提供包含固定多肽的陣列,其中多肽是發(fā)明的磷脂酶或者發(fā)明核酸編碼的多肽。發(fā)明提供含有發(fā)明的固定化核酸的陣列。發(fā)明提供含有發(fā)明的固定化抗體的陣列。發(fā)明提供特異結(jié)合于發(fā)明多肽或者發(fā)明的核酸編碼的多肽的分離的或者重組的抗體??贵w可以是單克隆抗體或者多克隆抗體。發(fā)明提供含有發(fā)明抗體的雜交瘤。
發(fā)明提供分離和鑒定具有磷脂酶活性的多肽的方法,包括以下步驟(a)提供發(fā)明的抗體;(b)提供含有多肽的樣品;以及(c)在抗體特異結(jié)合于多肽的條件下,步驟(a) 的抗體與步驟(b)的樣品接觸,然后分離和鑒定磷脂酶。發(fā)明提供制備抗一磷脂酶抗體的方法,包括向非一人類動(dòng)物以足夠的量施用發(fā)明的核酸或者發(fā)明的多肽,產(chǎn)生體液免疫應(yīng)答,從而制備抗一磷脂酶抗體。發(fā)明提供產(chǎn)生重組的多肽的方法,包含以下的步驟(a)提供可操作地連接于啟動(dòng)子的發(fā)明的核酸,以及(b)在多肽表達(dá)的條件下表達(dá)步驟(a)的核酸,然后產(chǎn)生重組多肽。核酸可以包括與SEQ ID NO :1序列在至少大約100個(gè)殘基的范圍內(nèi),具有至少85%的同一性的序列,與SEQ ID NO 3的序列在至少大約100個(gè)殘基的范圍內(nèi),具有至少80%的同一性的序列,與SEQ ID NO :5序列在至少大約100個(gè)殘基的范圍內(nèi),具有至少80%的同一性的序列,或者與SEQ ID NO :7序列在至少大約100個(gè)殘基的范圍內(nèi),具有至少70%的同一性的序列,其中序列同一性通過序列比較算法分析或者目視檢測觀察來確定。核酸可以包括在嚴(yán)謹(jǐn)?shù)臈l件下與SEQ ID NO 1所列核酸或者亞序列,與SEQ ID NO 3所列核酸或者亞序列,與SEQ ID NO :5所列核酸或者亞序列,與SEQ ID NO :7所列核酸或者亞序列雜交的核酸。方法進(jìn)一步包括用步驟(a)的核酸轉(zhuǎn)化宿主細(xì)胞,隨后表達(dá)步驟(a)的核酸,然后在轉(zhuǎn)化的細(xì)胞中產(chǎn)生重組的多肽。方法進(jìn)一步包括把步驟(a)的核酸插入到宿主非人類動(dòng)物中,隨后表達(dá)步驟(a)的核酸,然后在宿主非人動(dòng)物中產(chǎn)生重組多肽。發(fā)明提供鑒定具有磷脂酶活性的多肽的方法,包括以下的步驟(a)提供發(fā)明的多肽或者編碼發(fā)明多肽的核酸,或者片段或者變異體,(b)提供磷脂酶底物;(c)步驟(a)的多肽或者片段或者變異體與步驟(b)的底物接觸,檢測底物的量的增加或者反應(yīng)產(chǎn)物的量的減少,其中底物的量的減少或者反應(yīng)產(chǎn)物的量的增加檢測了具有磷脂酶活性的多肽。在可選擇的方面,核酸可以包括與SEQ ID NO :1在至少大約100個(gè)殘基的范圍內(nèi),具有至少 85%的同一性的序列,與SEQ ID NO :3在至少大約100個(gè)殘基的范圍內(nèi),具有至少80%的同一性的序列,與SEQ ID NO :5在至少大約100個(gè)殘基的范圍內(nèi),具有至少80%的同一性的序列,或者與SEQ ID NO :7在至少大約100個(gè)殘基的范圍內(nèi),具有至少70%的同一性的序列,其中序列同一性通過序列比較算法分析或者目視檢測觀察來確定。核酸可以包括在嚴(yán)謹(jǐn)?shù)臈l件下與SEQ ID NO :1所列核酸或者亞序列,與SEQ ID NO :3所列核酸或者亞序列, 與SEQ ID NO :5所列核酸或者亞序列,與SEQ ID NO :7所列核酸或者亞序列雜交的核酸。發(fā)明提供確定磷脂酶底物的方法,包括以下步驟(a)提供發(fā)明的多肽或者編碼發(fā)明多肽的核酸;(b)提供檢測底物;以及(c)步驟(a)的多肽與步驟(b)的檢測底物接觸, 檢測底物的量的增加或者反應(yīng)產(chǎn)物的量的減少,其中底物的量的減少或者反應(yīng)產(chǎn)物的量的增加確定底物為磷脂酶底物。在可選擇的方面,核酸可以包括與SEQ ID NO :1在至少大約 100個(gè)殘基的范圍內(nèi),具有至少85%的同一性的序列,與SEQ ID NO :3在至少大約100個(gè)殘基的范圍內(nèi),具有至少80%的同一性的序列,與SEQ ID NO :5在至少大約100個(gè)殘基的范圍內(nèi),具有至少80%的同一性的序列,或者與SEQ ID NO :7在至少大約100個(gè)殘基的范圍內(nèi),具有至少70 %的同一性的序列,其中序列同一性通過序列比較算法分析或者可視的檢測觀察來確定。在可選擇的方面,核酸可以包括在嚴(yán)謹(jǐn)?shù)臈l件下與SEQ ID NO :1所列核酸或者亞序列,與SEQ ID NO 3所列核酸或者亞序列,與SEQ ID NO 5所列核酸或者亞序列, 與SEQ ID NO 7所列核酸或者亞序列雜交的核酸。
發(fā)明提供確定是否化合物特異結(jié)合于磷脂酶的方法,包括以下步驟(a)在允許核酸翻譯成多肽的條件下,表達(dá)核酸或者包括該核酸的載體,其中核酸和載體包括發(fā)明的核酸或者載體;或者,提供發(fā)明的多肽,(b)使多肽與檢測化合物接觸;并且,(C)確定是否檢測化合物特異結(jié)合于多肽,從而確定該化合物特異地結(jié)合于磷脂酶。在可選擇的方面, 核酸可以包括與SEQ ID NO :1在至少大約100個(gè)殘基的范圍內(nèi),具有至少85%的同一性的序列,與SEQ ID NO :3在至少大約100個(gè)殘基的范圍內(nèi),具有至少80%的同一性的序列,與 SEQ ID NO :5在至少大約100個(gè)殘基的范圍內(nèi),具有至少80%的同一性的序列,或者與SEQ ID NO 7在至少大約100個(gè)殘基的范圍內(nèi),具有至少70%的同一性的序列,其中序列同一性通過序列比較算法分析或者可視的檢測觀察來確定。在可選擇的方面,核酸可以包括在嚴(yán)謹(jǐn)?shù)臈l件下與SEQ ID NO :1所列核酸或者亞序列,與SEQ ID NO :3所列核酸或者亞序列,與 SEQ ID NO :5所列核酸或者亞序列,與SEQ ID NO :7所列核酸或者亞序列雜交的核酸。發(fā)明提供確定磷脂酶活性的調(diào)節(jié)物的方法,包括以下步驟(a)提供發(fā)明的多肽或者編碼發(fā)明多肽的核酸;(b)提供檢測化合物;以及(c)步驟(a)的多肽與步驟(b)的檢測化合物接觸,測定磷脂酶的活性,其中在檢測化合物存在的條件下檢測的磷脂酶活性與在無檢測化合物存在的條件下檢測的磷脂酶活性相比得到的變化證明檢測化合物調(diào)節(jié)磷脂酶的活性。在可選擇的方面,核酸可以包括與SEQ ID NO :1在至少大約100個(gè)殘基的范圍內(nèi),具有至少85%的同一性的序列,與SEQ ID NO :3在至少大約100個(gè)殘基的范圍內(nèi),具有至少80%的同一性的序列,與SEQ ID NO :5在至少大約100個(gè)殘基的范圍內(nèi),具有至少 80%的同一性的序列,或者與SEQ ID NO :7在至少大約100個(gè)殘基的范圍內(nèi),具有至少70% 的同一性的序列,其中序列同一性通過序列比較算法分析或者可視的檢測觀察來確定。在可選擇的方面,核酸可以包括在嚴(yán)謹(jǐn)?shù)臈l件下與SEQ ID NO :1所列核酸或者亞序列,與SEQ ID NO :3所列核酸或者亞序列,與SEQ ID NO :5所列核酸或者亞序列,與SEQ ID N0:7所列核酸或者亞序列雜交的核酸。一方面,磷脂酶活性通過提供磷脂酶底物并且檢測底物的量的增加或者反應(yīng)產(chǎn)物的量的減少測定。與不存在檢測化合物的條件下底物或者反應(yīng)產(chǎn)物的量相比較,在存在檢測化合物的條件下,底物的量的減少或者反應(yīng)產(chǎn)物的量的增加證明檢測化合物是磷脂酶活性的激活劑。與不存在檢測化合物的條件下底物或者反應(yīng)產(chǎn)物的量相比較,在存在檢測化合物的條件下,底物的量的增加或者反應(yīng)產(chǎn)物的量的減少證明檢測化合物是磷脂酶活性的抑制劑。發(fā)明提供包含處理器和數(shù)據(jù)存儲設(shè)備的計(jì)算機(jī)系統(tǒng),其中所述的數(shù)據(jù)存儲設(shè)備已經(jīng)存儲了發(fā)明的多肽序列或者發(fā)明的核酸序列。一方面,計(jì)算機(jī)系統(tǒng)可以進(jìn)一步包括序列比較算法,和已經(jīng)存儲了至少一個(gè)參照序列的數(shù)據(jù)存儲設(shè)備。序列比較算法可以包括表明多態(tài)性的計(jì)算機(jī)程序。計(jì)算機(jī)系統(tǒng)可以進(jìn)一步包括鑒定所述序列的一個(gè)或者多個(gè)特征的鑒定器。發(fā)明提供已經(jīng)存儲了包括發(fā)明的多肽序列或發(fā)明的核酸序列的序列的計(jì)算機(jī)可讀存儲介質(zhì)。發(fā)明提供鑒定序列的特征的方法,包括以下步驟(a)應(yīng)用鑒定序列的一個(gè)或者多個(gè)特征的計(jì)算機(jī)程序來讀取序列,其中該序列包括發(fā)明的多肽序列或者發(fā)明的核酸序列;和(b)用計(jì)算機(jī)程序鑒定序列中的一個(gè)或者多個(gè)特征。
發(fā)明提供比較第一序列和第二序列的方法,包括以下步驟(a)應(yīng)用比較序列的計(jì)算機(jī)程序讀取第一序列和第二序列,其中第一序列包括發(fā)明的多肽序列或者發(fā)明的核酸序列;并且,(b)用計(jì)算機(jī)程序確定第一序列和第二序列的差別。一方面,確定第一序列和第二序列的差異的步驟進(jìn)一步包括確定多態(tài)性的步驟。一方面,方法進(jìn)一步包括鑒定序列中一個(gè)或者多個(gè)特征的鑒定器(以及鑒定器的應(yīng)用)。一方面,方法包括用計(jì)算機(jī)程序讀取第一序列,鑒定序列中的一個(gè)或者多個(gè)特征。發(fā)明提供從環(huán)境樣品中分離或者回收編碼具有磷脂酶活性的多肽的核酸的方法, 包括以下步驟(a)提供擴(kuò)增編碼具有磷脂酶活性的多肽的核酸的擴(kuò)增引物序列對,其中引物對可以擴(kuò)增發(fā)明的核酸(如,SEQ ID NO :1或者亞序列,SEQ ID NO :3或者亞序列,SEQ ID NO :5核酸或者亞序列,SEQ ID NO :7核酸或者亞序列。等等);(b)從環(huán)境樣品中分離核酸或者處理環(huán)境樣品以便樣品中的核酸可以與擴(kuò)增引物對雜交;和(c)步驟(b)的核酸和步驟(a)的擴(kuò)增引物對結(jié)合,并且從環(huán)境樣品中擴(kuò)增核酸,隨后從環(huán)境樣品中分離或者回收編碼具有磷脂酶活性的多肽的核酸。一方面,擴(kuò)增引物序列對的每一個(gè)成員包括含有發(fā)明的核酸序列的至少大約10到50連續(xù)堿基的寡核苷酸。一方面,擴(kuò)增引物序列對是發(fā)明的擴(kuò)增對。發(fā)明提供從環(huán)境樣品中分離或者回收編碼具有磷脂酶活性的多肽的核酸的方法, 包括以下步驟(a)提供包含發(fā)明的核酸序列,或者亞序列的多核苷酸探針;(b)從環(huán)境樣品中分離核酸或者處理環(huán)境樣品以便樣品中的核酸可以與步驟(a)的多核苷酸探針雜交; (c)步驟(b)的分離的核酸或者經(jīng)處理的環(huán)境樣品與步驟(a)的多核苷酸探針結(jié)合;和(d) 與步驟(a)的多核苷酸探針特異雜交的核酸分離,因此從環(huán)境樣品中分離或者回收編碼具有磷脂酶活性的多肽的核酸。在可選擇的方面,環(huán)境樣品包括水樣品,液體樣品,土壤樣品, 氣體樣品或者生物樣品。在可選擇的方面,生物樣品來源于細(xì)菌細(xì)胞,原生動(dòng)物細(xì)胞,昆蟲細(xì)胞,酵母細(xì)胞,植物細(xì)胞,真菌細(xì)胞或者哺乳動(dòng)物細(xì)胞。發(fā)明提供產(chǎn)生編碼磷脂酶的核酸的變異體的方法,包括以下步驟(a)提供包括發(fā)明核酸的模板核酸;(b)模板序列中修飾,缺失或者添加一個(gè)或者多個(gè)核苷酸,或者它們的組合,產(chǎn)生模板核酸的變異體。一方面,該方法進(jìn)一步包括表達(dá)變異核酸,產(chǎn)生變異磷脂酶多肽??蛇x擇的方面, 修飾,添加或者缺失由錯(cuò)誤傾向PCR,重排,寡聚核苷酸定向誘變,組裝PCR,有性PCR誘變, 體內(nèi)誘變,盒式誘變,回歸整體誘變,指數(shù)整體誘變,定點(diǎn)誘變,基因重裝配,基因位點(diǎn)飽和誘變(GSSM),合成連接重裝配(SLR)和/或其組合的方法來引入。在可選擇的方面,修飾, 添加或者缺失由以下方法引入,包括重組,回歸序列重組,磷硫修飾的DNA誘變,含有尿嘧啶的模板誘變,缺口雙螺旋誘變,點(diǎn)錯(cuò)配修復(fù)誘變,修復(fù)一缺陷宿主株誘變,化學(xué)誘變,放射誘變,缺失誘變,限制選擇誘變,限制純化誘變,人工基因誘變,整體誘變,嵌合核酸多聚體的產(chǎn)生和/或它們的組合。一方面,該方法被反復(fù)重復(fù),直到產(chǎn)生與模板核酸編碼的磷脂酶相比,具有改變的或者不同的活性或者改變的或者不同的穩(wěn)定性的磷脂酶。一方面,改變的或者不同的活性是在酸性條件下的磷脂酶活性,其中模板核酸編碼的磷脂酶在酸性條件下沒有活性。一方面,改變的或者不同的活性是在較高的溫度下的磷脂酶活性。其中模板核酸編碼的磷脂酶在較高溫度的條件下沒有活性。一方面,該方法反復(fù)重復(fù),直到產(chǎn)生與模板核酸的密碼子選擇相比具有改變的密碼子選擇的序列編碼的磷脂酶。該方法反復(fù)重復(fù),直到產(chǎn)生與模板核酸產(chǎn)生的信使相比具有更高或更低水平的信使表達(dá)或者信使穩(wěn)定性的磷脂酶基因。發(fā)明提供改變編碼磷脂酶的核酸中密碼子,增強(qiáng)其在宿主細(xì)胞中表達(dá)的方法,該方法包括(a)提供發(fā)明的編碼磷脂酶的核酸;(b)鑒定步驟(a)的核酸中的非優(yōu)選的或者較不優(yōu)選的密碼子,并且用編碼相同氨基酸的優(yōu)選的或者中性應(yīng)用的密碼子替換,其中優(yōu)選的密碼子是在宿主細(xì)胞的基因編碼區(qū)中超常出現(xiàn)的密碼子,非一優(yōu)選的或者較不優(yōu)選的密碼子是在宿主細(xì)胞的基因編碼區(qū)中不常出現(xiàn)的密碼子,從而修飾改變核酸,增強(qiáng)其在宿主細(xì)胞的表達(dá)。發(fā)明提供在編碼磷脂酶的核酸中修飾密碼子的方法,該方法包括(a)提供發(fā)明的編碼磷脂酶的核酸;并且,(b)確定步驟(a)的核酸中的密碼子,作為被取代的密碼子,把它用編碼同一個(gè)氨基酸的不同的密碼子替換,從而修飾編碼磷脂酶的核酸中的密碼子。發(fā)明提供修飾編碼磷脂酶的核酸中的密碼子的方法,增強(qiáng)其在宿主細(xì)胞中的表達(dá),該方法包括(a)提供發(fā)明的編碼磷脂酶的核酸,并且(b)鑒定步驟(a)的核酸中的非優(yōu)選的或者較不優(yōu)選的密碼子,用編碼相同氨基酸的優(yōu)選的或者中性應(yīng)用的密碼子來替換, 其中優(yōu)選的密碼子是在宿主細(xì)胞的基因編碼區(qū)中超常出現(xiàn)的密碼子,不優(yōu)選的或者較不優(yōu)選的密碼子是在宿主細(xì)胞的基因編碼區(qū)中不常出現(xiàn)的密碼子,從而修飾核酸,增強(qiáng)其在宿主細(xì)胞的表達(dá)。發(fā)明提供修飾編碼磷脂酶的核酸的密碼子的方法,降低其在宿主細(xì)胞的表達(dá),該方法包括,(a)提供發(fā)明的編碼磷脂酶的核酸;和,(b)鑒定步驟(a)的核酸中的至少一個(gè)優(yōu)選的密碼子并且用編碼相同氨基酸的不優(yōu)選的或者較不優(yōu)選的密碼子替換,其中優(yōu)選的密碼子是在宿主細(xì)胞的基因編碼區(qū)中超常出現(xiàn)的密碼子,不優(yōu)選的或者較不優(yōu)選的密碼子是在宿主細(xì)胞的基因編碼區(qū)中不常出現(xiàn)的密碼子,從而修飾核酸,降低其在宿主細(xì)胞的表達(dá)。 可選擇的方面,宿主細(xì)胞是細(xì)菌細(xì)胞,真菌細(xì)胞,昆蟲細(xì)胞,酵母細(xì)胞,植物細(xì)胞或者哺乳動(dòng)物細(xì)胞。發(fā)明提供產(chǎn)生編碼很多經(jīng)修飾的磷脂酶活性位點(diǎn)或底物結(jié)合位點(diǎn)的核酸文庫的方法,其中經(jīng)修飾的活性位點(diǎn)或者底物結(jié)合位點(diǎn)來源于包括編碼第一活性位點(diǎn)或者第一底物結(jié)合位點(diǎn)的序列的第一核酸,該方法包括(a)編碼第一個(gè)活性位點(diǎn)或者第一個(gè)底物結(jié)合位點(diǎn)的第一核酸序列,其中第一核酸序列包括發(fā)明的核酸,(b)提供一套在第一個(gè)核酸的多個(gè)靶密碼子編碼天然產(chǎn)生的氨基酸的突變體的誘變寡聚核苷酸;和,(c)應(yīng)用這套誘變的寡聚核苷酸,產(chǎn)生一套編碼活性位點(diǎn)或者編碼底物結(jié)合位點(diǎn)的突變核酸,在每一個(gè)被誘變的氨基酸密碼子處,突變核酸編碼氨基酸突變體,從而產(chǎn)生編碼修飾的磷脂酶活性位點(diǎn)或者底物結(jié)合位點(diǎn)的核酸文庫。在可選擇的方面,該方法包括通過包括優(yōu)化的定點(diǎn)進(jìn)化系統(tǒng), 基因定點(diǎn)飽和誘變O^SSM),和合成連接重裝配(SLR)的方法,誘變步驟(a)的第一核酸。方法進(jìn)一步包括通過包括錯(cuò)誤傾向PCR,重排,寡核苷酸定向突變,裝配PCR,有性PCR誘變,體內(nèi)誘變,盒式誘變,回歸整體誘變,指數(shù)整體誘變,定點(diǎn)誘變,基因重裝配,基因位點(diǎn)飽和誘變(GSSM),合成連接重裝配(SLR)和其組合的方法誘變步驟(a)的第一核酸或者突變體。 方法進(jìn)一步包括通過包括重組,回歸序列重組,磷硫修飾的DNA誘變,含有尿嘧啶的模板的誘變,缺口雙螺旋誘變,點(diǎn)錯(cuò)配修復(fù)誘變,修復(fù)一缺陷宿主株誘變,化學(xué)誘變,放射誘變,缺失誘變,限制選擇誘變,限制純化誘變,人工基因誘變,整體誘變,嵌合核酸多聚體的產(chǎn)生和它們的組合的方法誘變步驟(a)的第一核酸或者變異體。發(fā)明提供制備小分子的方法,包括以下步驟(a)提供可以合成或者修飾小分子的多個(gè)生物合成酶,其中一個(gè)酶包括由發(fā)明核酸編碼的磷脂酶;(b)對步驟(a)的至少一個(gè)酶提供底物,(c)在利于生物催化反應(yīng)進(jìn)行的條件下,步驟(b)的底物和酶反應(yīng),通過一系列生物催化反應(yīng)產(chǎn)生小分子。發(fā)明提供修飾小分子的方法,包括以下步驟(a)提供由發(fā)明核酸編碼的磷脂酶; (b)提供小分子;(c)在利于磷脂酶催化的酶反應(yīng)進(jìn)行的條件下,步驟(a)的酶與步驟(b) 的小分子反應(yīng),從而通過磷脂酶反應(yīng)修飾小分子。一方面,方法包括為步驟(a)的酶提供很多的小分子底物,從而產(chǎn)生了經(jīng)修飾的小分子文庫,該小分子文庫通過至少一個(gè)由磷脂酶催化的酶促反應(yīng)產(chǎn)生。一方面,方法進(jìn)一步包括很多的額外酶,在利于很多酶催化的生物催化反應(yīng)的條件下,通過很多酶促反應(yīng)產(chǎn)生由很多酶促反應(yīng)產(chǎn)生的經(jīng)修飾的小分子文庫。一方面,方法進(jìn)一步包括檢測文庫的步驟,確定在文庫中是否存在表現(xiàn)出所需活性的特定的經(jīng)修飾的小分子。該檢測文庫的步驟可以進(jìn)一步包括通過檢測經(jīng)過修飾的小分子的部分存在或者不存在具有所需活性的特定經(jīng)修飾的小分子部分,系統(tǒng)性地去除干擾,在庫中選擇一個(gè)用于產(chǎn)生經(jīng)修飾的小分子部分的生物催化反應(yīng),并且確定至少一種特定的生物催化反應(yīng),該反應(yīng)產(chǎn)生了特定的具有所需活性的經(jīng)修飾的小分子。發(fā)明提供用于確定磷脂酶的功能性片段方法,其包括以下的步驟(a)提供包括發(fā)明氨基酸序列的磷脂酶;(b)缺失步驟(a)序列中的多個(gè)氨基酸殘基,并且測定余下的序列的磷脂酶活性,從而確定磷脂酶的功能性片段。一方面,磷脂酶活性通過提供磷脂酶底物,測定底物的量的增加或者反應(yīng)產(chǎn)物的量的減少來測定。一方面,與不存在檢測化合物條件下確定的底物或者反應(yīng)產(chǎn)物的量相比較,在檢測化合物存在的條件下,底物的量的減少或者反應(yīng)產(chǎn)物的量的增加鑒定檢測化合物是磷脂酶活性的激活劑。發(fā)明提供切割磷酸甘油酯鍵的方法,包括以下步驟(a)提供具有磷脂酶活性的多肽,其中多肽包括發(fā)明的氨基酸序列,或者多肽由發(fā)明的核酸序列編碼;(b)提供包括磷酸甘油酯鍵的組合物;(C)在多肽切割磷酸甘油酯鍵的條件下,把步驟(a)的多肽與步驟 (b)的組合物接觸。一方面,條件包括大約pH5到大約5. 5之間,或者大約pH4. 5到大約5. 0 之間。一方面,條件包括大約40°C到大約70°C溫度之間。一方面,該組合物包括植物油。一方面,該組合物包括油籽磷脂。一方面,切割反應(yīng)可以產(chǎn)生水可抽提的磷酸化的堿和甘油二發(fā)明提供油脫膠(oil degumming)的方法,包括以下步驟(a)提供具有磷脂酶活性的多肽,其中多肽包括發(fā)明的氨基酸序列,或者多肽由發(fā)明的核酸序列編碼;(b)提供包括植物油的組合物;(c)在多肽切割植物油的酯鍵的條件下,把步驟(a)的多肽與步驟(b) 的植物油接觸,從而進(jìn)行油的脫膠。一方面,植物油包括油籽。植物油可以包括棕櫚油,油菜籽,玉米油,大豆油,蕓苔油,芝麻油,花生油,或者葵花子油。一方面,方法進(jìn)一步包括加入發(fā)明的磷脂酶,另外的磷脂酶或者它們的組合。發(fā)明提供轉(zhuǎn)化非水合的磷脂成水合形式的方法,包括以下步驟(a)提供具有磷脂酶活性的多肽,其中多肽包括發(fā)明的氨基酸序列,或者多肽由發(fā)明的核酸編碼;(b)提供包括非水合磷脂的組合物;(c)在多肽切割非水合磷脂的酯鍵的條件下,把步驟(a)的多肽與步驟(b)的非水合磷脂接觸,從而非水合磷脂轉(zhuǎn)化為水合形式。
發(fā)明提供使油脫膠的方法,包括以下步驟(a)提供組成包括發(fā)明的具有磷脂酶活性的多肽,或者由發(fā)明核酸編碼的多肽;(b)提供包括脂肪或者油的組合物,脂肪或者油含有磷脂;(c)在多肽可以對含有磷脂的組合物進(jìn)行脫膠的條件下,把步驟(a)的多肽與步驟(b)的組合物進(jìn)行接觸(在發(fā)明的多肽可以催化磷脂水解的條件下)。一方面,含油的組合物包括植物,動(dòng)物,藻或者魚的油。植物油可以包括大豆油,油菜籽油,玉米油,棕櫚仁的油,蕓苔油,葵花油,芝麻油或者花生油。多肽可以水解含油組合物中水合的和/或非水合的磷脂中的磷酸。多肽可以水解甘油磷脂鍵處的磷酸,產(chǎn)生甘油二酯和水溶性的磷酸化合物。多肽可以有磷脂酶C,B,A或者D的活性。一方面,加入了磷脂酶D活性和磷酸酶活性。接觸可以包括水解油中水合的磷脂。水解條件可以包括在堿性PH下,溫度為大約20°C 到40°C之間。堿性條件可以包括大約pH 8到pH 10的pH。水解條件可以包括反應(yīng)時(shí)間為 3到10分鐘。水解條件可以包括水解油中水合的或者非水合的磷脂,溫度為大約50°C到 60°C,pH大約為pH 5到pH 6. 5,應(yīng)用的反應(yīng)時(shí)間為大約30到60分鐘。多肽可以結(jié)合于濾膜,含有磷脂的脂肪或者油通過濾膜。多肽可以加入到含有磷脂的脂肪或者油的溶液中,然后溶液通過濾膜過濾。發(fā)明提供轉(zhuǎn)化非一水合的磷脂為水合形式的方法,包括以下的步驟(a)提供包括具有發(fā)明磷脂酶活性的多肽的組成,或者由發(fā)明的核酸序列編碼的多肽;(b)提供包括非一水合的磷脂的組合物;并且(c)在多肽轉(zhuǎn)化非一水合的磷脂為水合的磷脂形式的條件下,把步驟(a)的多肽與步驟(b)組合物接觸。多肽可以具有磷脂酶C的活性。多肽可以具有磷脂酶D的活性并且也加入磷酸酶。發(fā)明提供堿法凈化含有磷脂的組合物的方法,包括以下步驟(a)提供包含發(fā)明的具有磷脂酶活性的多肽或者由發(fā)明核酸編碼的多肽的組合物;(b)提供包含磷脂的組合物,并且(c)在堿法凈化前,堿法凈化中或者后,把步驟(a)的多肽與步驟(b)的組合物接觸。多肽可以具有磷脂酶C的活性。多肽可以在堿法凈化前加入,并且含有磷脂的組成可以包括植物,并且多肽可以以轉(zhuǎn)基因方式在植物中表達(dá),具有磷脂酶活性的多肽可以在壓榨種籽或者其它植物部分的過程中加入,或者具有磷脂酶活性的多肽在壓榨后或者在凈化前加入。多肽可以在堿法凈化中加入,并且依據(jù)磷的水平和游離脂肪酸的水平加入不同水平的酸和堿。多肽可以在堿法凈化后加入在分離前的劇烈攪拌器或者保持混合器中,隨后在離心機(jī)中,皂腳中,清洗水中進(jìn)行,或者在漂白或者除臭步驟中進(jìn)行加熱步驟。發(fā)明提供純化植物留醇或者三萜的方法,包括以下的步驟(a)提供包括發(fā)明的具有磷脂酶活性的多肽的組合物,或者多肽由發(fā)明核酸編碼;(b)提供含有植物留醇或者三萜的組合物;并且(c)在多肽可以催化組合物中的磷脂的水解的條件下,把步驟(a)的多肽與步驟(b)的組合物接觸。多肽可以具有磷脂酶C的活性。植物留醇或者三萜可以包括植物留醇。植物留醇可以來源于植物油。植物油可以包括椰子油,蕓苔油,可可黃油,玉米油,棉籽油,亞麻油,橄欖油,棕櫚油,花生油,來自稻麩子的油,紅花油,芝麻油,大豆油,或者葵花油。該方法可以包括應(yīng)用非極性溶劑來定量地提取游離的植物留醇和留醇類脂肪酸酯。植物留醇或者三萜可以包括谷留醇,菜油留醇,豆留醇,豆留烷醇,谷留烷醇, 谷甾烷醇,鏈留醇,海綿留醇,多孔留醇,Y-谷留醇或者菜籽甾醇。發(fā)明提供精練粗油的方法,包括以下步驟(a)提供包括發(fā)明的具有磷脂酶活性的多肽的組合物,或者多肽由發(fā)明的核酸編碼;(b)提供包括含有磷脂的油的組合物;并且(C)在多肽催化組合物中的磷脂水解的條件下,把步驟(a)的多肽與步驟(b)的組合物接觸。多肽可以具有磷脂酶C的活性。多肽可以在加入到組分水溶液的情況下具有磷脂酶活性。水的水平可以是在0. 5到5%之間。處理時(shí)間可以少于2小時(shí),少于大約60分鐘,少于大約30分鐘,少于大約15分鐘,或者少于5分鐘。水解條件可以包括溫度范圍在大約25到 70°C之間,水解條件可以包括應(yīng)用苛性堿,水解條件可以包括pH范圍為大約pH 3到pH 10 之間,PH 4到pH9之間,或者pH 5到pH 8之間。水解條件可以包括在接觸步驟(c)后加入乳化劑和/或進(jìn)行混合。該方法可以包括加入去乳化劑和/或加熱來促進(jìn)水相的分離。 該方法可以包括在接觸步驟前進(jìn)行脫膠,通過離心收集卵磷脂,然后再加入PLC,PLC和/或 PLA,去除非水合的磷脂。對于食用油,該方法可以包括粗油的水脫膠到少于lOppm,對于生物柴油,然后通過物理精練至少到大約50ppm。該方法可以包括加入酸來增強(qiáng)非水合磷脂的水合。發(fā)明的一個(gè)或者多個(gè)具體例子的細(xì)節(jié)在附加圖表和以下說明中進(jìn)行闡明。發(fā)明的其它特征,目標(biāo),以及優(yōu)勢將通過描述和圖表以及權(quán)利要求得到闡明。用于各種目的的所有出版物,專利,專利申請,GenBank序列以及美國模式菌種收集中心(ATCC)保藏物,在此一并引用和參考。附圖簡述以下的圖是本發(fā)明的實(shí)施方案的例示性說明,并不意味著限制權(quán)利要求所包含的發(fā)明范圍。

圖1是計(jì)算機(jī)系統(tǒng)的框圖,具體的細(xì)節(jié)說明參見下文。圖2是過程200的一個(gè)方面的流程圖,為了確定新序列和數(shù)據(jù)庫中的序列之間的同源性水平,把新的核苷酸或蛋白質(zhì)序列與數(shù)據(jù)庫中的序列相比較,具體的細(xì)節(jié)說明參見下文。圖3是說明在計(jì)算機(jī)中確定是否兩個(gè)序列是否是同源的過程的實(shí)施方案的流程圖,具體細(xì)節(jié)說明參見下文。圖4是說明鑒定器過程的一個(gè)方面的流程圖,檢測序列中特征的存在,具體的細(xì)節(jié)說明參見下文。圖5A,5B和5C用圖表說明用于同時(shí)PLC-介導(dǎo)脫膠的典型兩相系統(tǒng),具體的細(xì)節(jié)說明參見下文。圖6用圖表說明應(yīng)用發(fā)明的磷脂酶的典型的植物油精練過程。圖7用圖表說明用于物理精練油的發(fā)明的典型脫膠過程,具體的細(xì)節(jié)說明參見下文。圖8用圖表說明用發(fā)明的磷脂酶C進(jìn)行磷脂的水解,具體的細(xì)節(jié)說明參見下文。圖9用圖表說明用發(fā)明的磷脂酶C作為“堿法凈化輔助”(長混合堿法凈化),具體的細(xì)節(jié)說明參見下文。圖10用圖表說明用發(fā)明的磷脂酶C作為脫膠輔助,具體的細(xì)節(jié)說明參見下文。不同圖中的類似參考符號說明類似元素發(fā)明祥述發(fā)明提供磷脂酶(如,磷脂酶A,B,C和D,馬鈴薯塊莖儲藏蛋白酶),編碼它們的核酸。以及制備和應(yīng)用它們的方法。發(fā)明提供可以有效地切割油,如植物油,例如油籽磷脂中的甘油磷酸酯鍵的酶,產(chǎn)生水可提取的磷酸化的堿和甘油二酯。一方面,發(fā)明的磷脂酶具有脂酰水解酶(LAH)的活性??蛇x擇的方面,發(fā)明的磷脂酶可以切割卵磷脂,磷脂酰乙醇胺, 磷脂酰絲氨酸,和鞘磷脂中的甘油磷酸酯鍵。發(fā)明的磷脂酶(如,磷脂酶A,B,C和D,馬鈴薯塊莖儲藏蛋白酶)可以用于植物油的酶法脫膠,因?yàn)榱姿峤M分在水中可溶,并且容易去除。甘油二酯產(chǎn)物將仍存留在油中,從而降低損失。發(fā)明的PLCs可以用于商業(yè)上的油脫膠中,加入到或者替換PLAls和PLAk,諸如ENZYMAX 工藝,其中磷脂是由PLAl和PLA2水解的。一方面,發(fā)明的磷脂酶在較高的和/或較低的溫度下,或者在較寬的溫度范圍內(nèi), 具有活性,例如,它們可以在溫度范圍在20到90°C,30到80°C,或者在40到70°C下具有活性。發(fā)明也提供發(fā)明的磷脂酶,其在堿性PH或者酸性pH下具有活性,例如低的水酸度。可選擇的方面,發(fā)明的磷脂酶可以在酸性PH低至ρΗ6· 5,ρΗ6· 0,ρΗ5· 5,ρΗ5· 0,ρΗ4· 5,ρΗ4· 0,和 ρΗ3. 5仍具有活性。可選擇的方面,發(fā)明的磷脂酶可以在堿性ρΗ高至ρΗ7. 5,ρΗ8. 0,ρΗ8. 5, ΡΗ9.0,和ρΗ9.5仍具有活性。一方面,發(fā)明的磷脂酶在低水活性(低的水含量)條件下,在溫度范圍40到70°C之間具有活性。發(fā)明也提供進(jìn)一步修飾本發(fā)明的典型磷脂酶的方法,以便產(chǎn)生具有理想特性的酶。例如,由發(fā)明方法產(chǎn)生的磷脂酶可以具有改變了的底物特異性,底物結(jié)合特異性,底物切割形式,熱穩(wěn)定性,PH/活性曲線,pH/穩(wěn)定性曲線(如在較低pH值,例如pH小于6或者 PH小于5或者較高的pH值,如pH大于9的情況下熱穩(wěn)定性提高),對于氧化作用的穩(wěn)定性, Ca2+的依賴性,特異性活性,類似特性。發(fā)明提供對于任何感興趣特性的改變。例如,這些改變可以導(dǎo)致與原磷脂酶相比的變異體,具有改變的PH和溫度活性曲線。一方面,發(fā)明的磷脂酶在不同的植物油處理步驟,如植物油提取中,特別地,在稱為“油脫膠”的過程中去除“磷脂膠”中的使用,如在此所述。植物油產(chǎn)生于不同的植物來源,如大豆,油菜,花生,芝麻,葵花和玉米。發(fā)明的磷脂酶可以在任何植物油處理過程中用于替代PLA,例如磷脂酶A2。^X術(shù)語“磷脂酶”包括具有磷脂酶活性的酶,例如,切割油中,如植物油中的甘油磷酸酯鍵(催化水解甘油磷酸酯鍵)。發(fā)明的磷脂酶活性可以產(chǎn)生水可提取的磷酸化的堿以及甘油二酯。發(fā)明的磷脂酶活性也包括在高溫,低溫,堿性PH和酸性pH下水解甘油磷酸酯鍵。術(shù)語“磷脂酶活性”也包括切割甘油磷酸酯,產(chǎn)生水可提取的磷酸化的堿以及甘油二酯。術(shù)語“磷脂酶活性”也包括切割磷脂中甘油和磷酸的酯鍵。術(shù)語“磷脂酶活性”也包括其它的活性,如結(jié)合底物的能力,如油,例如植物油,底物也包括植物和動(dòng)物的卵磷脂,磷脂酰乙醇胺,磷脂酰絲氨酸,和鞘磷脂。磷脂酶活性可以包括磷脂酶C(PLC)的活性,磷脂酶 A(PLA)的活性,如磷脂酶Al或者磷脂酶A2的活性,磷脂酶B (PLB)活性,如磷脂酶Bl或者磷脂酶B2的活性,磷脂酶D (PLD)的活性,如磷脂酶Dl或者磷脂酶D2的活性。磷脂酶活性可以包括水解糖蛋白,如馬鈴薯塊莖中或者任何茄屬植物(Solanum),如,馬鈴薯(Solanum tuberosum.)中的糖蛋白。磷脂酶活性可以包括patatin酶活性,如patatin酯酶活性(見, 例如,Jimenez (2002)Biotechnol. Prog. 18 :635-640)。磷脂酶活性可以包括脂酰水解酶 (LAH)活性。術(shù)語“抗體”包括源自模式的或者實(shí)質(zhì)上由免疫球蛋白基因或者免疫球蛋白基因的片段編碼的肽或者多肽,可以特異地結(jié)合于抗原或者抗原決定簇,見,例如Fundamental Immunology, Third Edition, W. B. Paul, ed. , Raven Press, N. Y. (1993) ;Wilson (1994) J. Immunol. Methods 175 :267-273 ;Yarmush (1992)J. Biochem. Biophys. Methods 25 85-97。術(shù)語抗體包括抗原結(jié)合部分,即,“抗原結(jié)合位點(diǎn)”(例如,保持了結(jié)合抗原能力的片段,亞序列,互補(bǔ)決定區(qū)(⑶Rs),包括(i)Fab片段,包括由VL,VH, CL和CHl結(jié)構(gòu)域組成的單價(jià)片段;(ii)F(ab’)2片段,包括在鉸鏈區(qū)通過二硫鍵連接兩個(gè)Fab片段的二價(jià)片段; (iii)包括VH和CHl結(jié)構(gòu)域的Fd片段;(iv)包括抗體單臂的VL和VH結(jié)構(gòu)域的Fv片段, (ν)含有 VH 結(jié)構(gòu)域的 dAb 片段(Ward et al.,(1989) Nature 341 :544-546);以及(vi)分離的互補(bǔ)決定區(qū)(⑶R)。作為參考,單鏈抗體也包括于術(shù)語“抗體”中。在此應(yīng)用的術(shù)語“陣列,,或者“微陣列,,或者“生物芯片,,或者“芯片,,是許多靶元素,每一個(gè)靶元素包括確定量的一個(gè)或者多個(gè)多肽(包括抗體)或者固定于底物表面積的確定區(qū)域的核酸,參見以下進(jìn)一步的具體討論。正如在此所用的術(shù)語“計(jì)算機(jī)”,“計(jì)算機(jī)程序”和“處理器”在上下文廣泛應(yīng)用,并且用于所有的這樣的設(shè)備,如以下所述的。“編碼序列”或者“序列編碼”特定的多肽或者蛋白,是指當(dāng)置于合適的調(diào)控序列的控制下可以轉(zhuǎn)錄和翻譯成多肽或者蛋白的核酸序列。在此使用的術(shù)語“表達(dá)盒”是指在與這樣的序列相容的宿主細(xì)胞中可以影響結(jié)構(gòu)基因表達(dá)(即,編碼蛋白質(zhì),如本發(fā)明的磷脂酶的序列)的核苷酸序列。表達(dá)盒包括至少一個(gè)可以可操作地連接至編碼多肽的序列上的啟動(dòng)子;并且,可選擇地,還有其它的序列例如,轉(zhuǎn)錄終止信號。另外的必要的或者有助于影響表達(dá)的因子也可以應(yīng)用,例如,增強(qiáng)子。正如在此所應(yīng)用的“可操作地連接”是指在上游連接啟動(dòng)子與DNA序列,這樣該啟動(dòng)子介導(dǎo)了該DNA序列的轉(zhuǎn)錄。這樣,表達(dá)盒也包括質(zhì)粒,表達(dá)載體,重組病毒,任何形式的重組的“裸露DNA”載體,和類似物?!拜d體”包括可以感染,轉(zhuǎn)染,瞬間或者永久轉(zhuǎn)導(dǎo)細(xì)胞的核酸。可以認(rèn)為載體可以是裸露的核酸,或者與蛋白或者脂類復(fù)合的核酸。載體可選擇地包括病毒或者細(xì)胞的核酸和/或蛋白,和/或膜(如,細(xì)胞膜,病毒的脂類包膜,等等)。載體包括,但不限于復(fù)制子(如,RNA復(fù)制子,細(xì)菌噬菌體),其中DNA片段可以結(jié)合到其上,變成復(fù)制狀態(tài)。這樣的載體包括,但不限于是RNA,自主復(fù)制的環(huán)狀或者線性的DNA或者RNA(如,質(zhì)粒, 病毒,以及類似物,見,如,美國專利No. 5,217,879),并且也包括表達(dá)的和非表達(dá)的質(zhì)粒。其中描述重組微生物或者細(xì)胞培養(yǎng)物是作為宿主培養(yǎng)“表達(dá)載體”,其包括染色體外的環(huán)狀和線性DNA,并且已經(jīng)整合進(jìn)入宿主染色體的DNA。其中載體保存在宿主細(xì)胞中,該載體可以在細(xì)胞有絲分裂中作為自主結(jié)構(gòu)穩(wěn)定地在細(xì)胞中復(fù)制,或者整合入宿主基因組中?!百|(zhì)粒”的命名為在名稱前加上小寫字母“P”和/或接下來是大寫字母和/或數(shù)字。在此使用的起始質(zhì)??梢再I到,在非限制的基礎(chǔ)上可以公開獲得,或者按照出版的程序從已有的質(zhì)粒構(gòu)建。此外,與那些在此描述的質(zhì)粒等價(jià)的質(zhì)粒是在本領(lǐng)域是已知的,并且對普通技術(shù)人員而言是顯而易見的。術(shù)語“基因”是指DNA片段,涉及在產(chǎn)生多肽鏈,包括,除此之外,在編碼區(qū)的前面和后面的區(qū)域,如頭部和尾部,啟動(dòng)子和增強(qiáng)子,當(dāng)適合時(shí),還有單個(gè)編碼片段(外顯子)之間的插入序列(內(nèi)含子)。正如在此應(yīng)用的短語“核酸”或者“核酸序列”是指寡核苷酸,核苷酸,多聚核苷酸,或者是指它們的任何之一的片段,是指基因組或者合成來源的DNA或者RNA (如,mRNA, rRNA, tRNA, iRNA),其可以是單鏈的或者雙鏈的,并且可以代表有義鏈或者無義鏈,是指肽核酸(PNA),或者是指天然的或者起始于合成的任何DNA樣或者RNA樣的物質(zhì),包括如, iRNA,核糖核蛋白(如雙鏈iRNA,如iRNPs)。術(shù)語包括核酸,即,寡核苷酸,包括天然核苷酸的已知類似物。術(shù)語也包括具有合成骨架的核酸樣結(jié)構(gòu),見,如,Mata (1997) Toxicol. Appl. Pharmacol. 144 :189-197 ;Strauss-Soukup (1997)Biochemistry 36 :8692-8698 ; Samstag(1996)Antisense Nucleic Acid Drug Dev 6 :153_156。在此應(yīng)用的“氨基酸”或者“氨基酸序列,,是指寡肽,肽,多肽,或者蛋白序列,或者是指以上任何這些的任何一個(gè)的片段、部分或亞基,并且是指天然產(chǎn)生或者合成的分子。在此應(yīng)用的術(shù)語“多肽”和“蛋白,,是指通過肽鍵或者修飾的肽鍵連接在一起的氨基酸,即,肽等排體,可以含有不是20個(gè)基因編碼的氨基酸的修飾氨基酸。術(shù)語“多肽”也指肽或者多肽片段,基元(motif),類似物。術(shù)語也包括糖基化的多肽。發(fā)明的肽或者多肽也包括所有“模擬”和“肽模擬”形式,以下進(jìn)一步描述。正如在此所應(yīng)用的,術(shù)語“分離的”是指從起始的環(huán)境中分離的物質(zhì)(如,如果是天然發(fā)生的,那么就是天然環(huán)境)。例如,存在于活動(dòng)物中的天然發(fā)生的多聚核苷酸或者多肽不是分離的,但是,如果該同樣的多核苷酸或者多肽,與天然系統(tǒng)中的一些或者所有的共存物分離,那么就是分離的。這樣的多核苷酸可以是載體的一部分和/或這樣的多核苷酸或者多肽可以是一個(gè)組合物的一部分,并且仍然是分離,因?yàn)檫@樣的載體或者組合物不是天然環(huán)境的一部分。正如在此使用的,分離的物質(zhì)或者組合物可以是“純化”的組合物,即, 它并不需要絕對的純度;更正確地,認(rèn)為其是相對性的定義。從文庫中得到的單個(gè)核酸可以經(jīng)過常規(guī)純化為電泳均一性??蛇x擇的方面,發(fā)明提供從基因組DNA或者從文庫中的其它序列中或者其它的環(huán)境中純化至少一個(gè),兩個(gè),三個(gè),四個(gè),五個(gè)或者更多數(shù)量級的核酸。
正如在此應(yīng)用的,術(shù)語“重組”是指核酸鄰近于“骨架”核酸,而在天然環(huán)境下它們并不鄰近。一方面,核酸代表了核酸“骨架分子”群體中5%或者更多數(shù)目的插入物的核酸。 按照發(fā)明,“骨架分子”包括核酸,如表達(dá)載體,自主復(fù)制核酸,病毒,整合的核酸,和其他的載體或者用于保持或者操作感興趣的核酸插入物的核酸。一方面,富集的核酸代表了重組骨架分子群體中的15%,20%,30%,40%,50%,60%,70%,80%,90%或者更多數(shù)目的核酸插入物。“重組”多肽或者蛋白是指由重組DNA技術(shù)產(chǎn)生的多肽或者蛋白,如,從編碼所需多肽或者蛋白的外源DNA構(gòu)建物轉(zhuǎn)化的細(xì)胞產(chǎn)生。“合成的”多肽或者蛋白是那些通過化學(xué)合成制備的多肽或者蛋白,如以下進(jìn)一步的描述。正如以下進(jìn)一步討論的,當(dāng)啟動(dòng)啟動(dòng)子處轉(zhuǎn)錄的RNA聚合酶轉(zhuǎn)錄編碼序列成為 mRNA時(shí),啟動(dòng)子序列是“可操作地連接于”編碼序列。“寡聚核苷酸”是指單鏈多聚脫氧核苷酸或者化學(xué)合成的兩個(gè)互補(bǔ)的多聚脫氧核苷酸鏈。這樣合成的寡聚核苷酸在5’沒有磷酸,并且在不用激酶和ATP加入磷酸的情況下, 不能連接于另一個(gè)寡聚核苷酸。合成的寡聚核苷酸將連接于沒有脫磷酸化的片段。上下文中的兩個(gè)核酸或者多肽“實(shí)質(zhì)上相同”的短語,是指當(dāng)使用任何已知的序列比較算法,如以下詳細(xì)討論的,或者通過目測的方法檢測,比較和對齊為最大同一性時(shí),兩個(gè)或者多個(gè)序列至少具有50%,60%,70%,75%,80%,85%,90%,95%,98%或者99%的核苷酸或者氨基酸殘基(序列)的同一性。在可選擇的方面,發(fā)明提供與發(fā)明的典型序列,如,SEQ ID NO 1,SEQ ID NO :2,SEQ ID NO :3,SEQ ID NO :4,SEQ ID NO :5,SEQ ID NO :6, SEQ ID NO 7, SEQ ID NO :8,等等,在核酸或者多肽的至少大約100個(gè)殘基,150個(gè)殘基,200 個(gè)殘基,300個(gè)殘基,400個(gè)殘基,或者從大約50個(gè)殘基到全長的區(qū)域范圍內(nèi)實(shí)質(zhì)上具有同一性的核酸和多肽序列。發(fā)明的核酸可以是在整個(gè)長度的多肽編碼區(qū)域?qū)嵸|(zhì)上一致。另外的,“實(shí)質(zhì)上一致”的氨基酸序列是與參考序列不同的序列,其中具有一個(gè)或者多個(gè)保守性或者非保守性的氨基酸取代,缺失,或者插入,特別地,當(dāng)這樣的取代發(fā)生在分子的非活性位點(diǎn)的一個(gè)位置,并且假設(shè),多肽實(shí)質(zhì)上保持了它的功能特性。保守氨基酸的取代,例如,用一個(gè)氨基酸取代另一個(gè)同類的氨基酸(如,用一個(gè)疏水氨基酸,如異亮氨酸, 纈氨酸,亮氨酸,或者甲硫氨酸,取代另一個(gè),或者用極性氨基酸取代另一個(gè)極性氨基酸, 如,用賴氨酸取代精氨酸,用谷氨酸取代天冬氨酸或者,谷酰胺取代天冬酰胺)??梢匀笔б粋€(gè)或者多個(gè)氨基酸,例如,從磷脂酶多肽中缺失,得到多肽結(jié)構(gòu)的修飾,而并不顯著改變其生物活性。例如,對于磷脂酶的生物活性,并不需要氨基或者羧基端氨基酸,可以去除。發(fā)明的修飾的多肽序列可以通過很多的方法分析其磷脂酶活性,包括讓改變的多肽序列與磷脂酶底物接觸,并且確定是否修飾的多肽減少了分析中的特異底物的量或者增加了功能性磷脂酶與底物的酶促反應(yīng)的生物產(chǎn)物的量,如以下詳細(xì)說明的?!半s交”是指通過堿基配對,核酸鏈與互補(bǔ)鏈結(jié)合的過程。雜交反應(yīng)可能是敏感的并且具有選擇性,這樣在樣品量很低的濃度下可以鑒定感興趣的特定的序列。合適的嚴(yán)謹(jǐn)條件可以通過例如,預(yù)雜交和雜交溶液中的鹽和甲酰胺濃度,或者雜交溫度來確定,并且本領(lǐng)域是熟知的。例如,嚴(yán)謹(jǐn)性的增加可以通過降低鹽濃度,增加甲酰胺的濃度,或者提高雜交溫度,改變雜交時(shí)間予以實(shí)現(xiàn),如以下所詳細(xì)描述??蛇x擇的方面,發(fā)明的核酸通過它們可以與在此所闡明的不同的嚴(yán)謹(jǐn)條件下雜交的能力(如,高,中,和低)來確定。術(shù)語“變異體”是指在一個(gè)或者多個(gè)堿基對,密碼子,內(nèi)含子,外顯子,或者氨基酸殘基(分別)改變的發(fā)明的多聚核苷酸或者多肽,但仍保持發(fā)明的磷脂酶的生物活性。變異體可以通過很多種方法產(chǎn)生,例如,錯(cuò)誤傾向PCR,重排,寡聚核苷酸定向誘變,裝配PCR, 有性PCR誘變,體外誘變,盒式誘變,回歸整體誘變,指數(shù)整體誘變,定點(diǎn)誘變,基因重裝配, GSSM和它們的組合。在此包括了產(chǎn)生在pH或溫度下具有活性的磷脂酶突變體,例如,不同與野生型磷脂酶的技術(shù)。術(shù)語“飽和誘變”或者“GSSM”包括應(yīng)用變性的寡聚核苷酸引物在多聚核苷酸中引入點(diǎn)突變的方法,如下的詳細(xì)解釋。術(shù)語“優(yōu)化的定向進(jìn)化系統(tǒng)”或者“優(yōu)化的定向進(jìn)化”包括重組裝相關(guān)核酸序列片段的方法,例如,相關(guān)基因,以下詳細(xì)解釋。術(shù)語“合成連接重組裝”或者“SLR”包括以非隨機(jī)的方式連接寡聚核苷酸片段的方法,以下詳細(xì)解釋。核酸的產(chǎn)生和操作發(fā)明提供核酸(如,典型的SEQ ID NO :1,SEQ ID N0:3,SEQ ID N0:5,SEQ ID NO: 7,SEQ ID NO :9, SEQ ID NO :11, SEQ ID NO: 13,SEQ ID NO: 15,SEQ ID NO: 17,SEQ ID NO: 19,SEQ ID NO :21, SEQ ID NO :23, SEQ ID NO :25, SEQ ID NO :27, SEQ ID NO :29, SEQ ID NO :31, SEQ ID NO :33, SEQ ID NO :35, SEQ ID NO :37, SEQ ID NO :39, SBQ ID NO :41,SEQ ID NO :43, SEQ ID NO :45, SEQ ID NO :47, SEQ ID NO :49, SEQ ID NO :51,SEQ ID NO :53,SEQ ID NO 55, SEQ ID NO -.57, SEQ ID NO :59,SBQ ID NO :61,SEQ ID NO :63,SEQ ID NO 65,SEQ ID NO :67,SEQ ID NO :69,SEQ ID NO :71,SEQ ID NO :73,SEQ ID NO :75,SEQ ID NO 77, SEQ ID NO :79,SEQ ID NO :81,SEQ ID NO :83,SEQ ID NO :85,SBQ ID NO :87,SEQ ID NO 89, SEQ ID NO :91,SEQ ID NO :93,SEQ ID NO :95,SEQ ID NO :97,SEQ ID NO :99, SEQ ID NO :101, SEQ ID NO :103, SEQ ID NO 105),包括編碼發(fā)明的多肽和磷脂酶的表達(dá)盒,如表達(dá)載體。發(fā)明也包括應(yīng)用發(fā)明的核酸發(fā)現(xiàn)新的磷脂酶序列的方法。也提供用于修飾的本發(fā)明核酸的方法,例如,合成連接重裝配,優(yōu)化的定向進(jìn)化系統(tǒng)和/或飽和誘變。發(fā)明的核酸可以是制備的,合成和/或通過,如,克隆和表達(dá)cDNA文庫,通過PCR 擴(kuò)增信使或者基因組DNA,和類似方法進(jìn)行操作。在實(shí)踐本發(fā)明的方法中,通過操作模板核酸,可以修飾同源基因,正如在此所述的。本發(fā)明可以和本領(lǐng)域已知的其它任何方法或者方案或者裝置結(jié)合進(jìn)行實(shí)踐,這些在科學(xué)和專利的文獻(xiàn)中有很好的描述。一般技術(shù)用于實(shí)踐本發(fā)明的核酸,不管是RNA,iRNA,反義核酸,cDNA,基因組DNA,載體,病毒或者它們的雜合體,都可以自不同的來源分離,遺傳工程,擴(kuò)增,和/或表達(dá)/重組產(chǎn)生。 從這些核酸產(chǎn)生的重組多肽可以單獨(dú)分離或者克隆,并且檢測所需的活性。可以應(yīng)用任何重組表達(dá)系統(tǒng),包括細(xì)菌,哺乳動(dòng)物,酵母,昆蟲或者植物細(xì)胞表達(dá)系統(tǒng)??蛇x擇地,這些核酸可以通過已知的化學(xué)合成技術(shù)在體外合成,正如在如 Adams(1983)J. Am. Chem, Soc. 105 661 ;Belousov (1997)Nucleic Acids Res. 25 3440-3444 ;Frenkel(1995)Free Radic. Biol. Med. 19 :373-380 ;Blommers(1994) Biochemistry 33 :7886-7896 ;Narang(1979)Meth. Enzymol. 68 :90, Brown (1979)Meth. Enzymo 1. 68 :109 ;Beaucage (1981) Tetra. Lett. 22 :1859 ;美國專利 4,458,066 中描述的。用于核酸操作的技術(shù),如,亞克隆,探針標(biāo)記(如,使用Klenow聚合酶的隨機(jī)引物標(biāo)記,切口平移,擴(kuò)增),測序,雜交等等,這些方法在科學(xué)和專利文獻(xiàn)中有說明,見, 如,Sambrook,ed. , MOLECULAR CLONING A LABORATORY MANUAL(2ND ED.), Vols.1-3, Cold Spring Harbor Laboratory, (1989) ;CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Ausubel, ed. John Wiley&Sons,Inc., New York(1997) ;LABORATORY TECHNIQUES IN BI0CHEMSTRY AND MOLECULAR BIOLOGY HYBRIDIZATION WITH NUCLEIC ACID PROBES, Part I.Theory and Nucleic Acid Preparation, Tijssen, ed. Elsevier, N. Y. (1993)。另一個(gè)用于實(shí)踐發(fā)明的方法,即獲得和操作核酸的有用方法是從基因組樣品中克隆,并且如果需要,篩選和再克隆從例如,基因組克隆或者cDNA克隆中分離或者擴(kuò)增的插入物。在發(fā)明方法中使用的核酸的來源包括包含于如,哺乳動(dòng)物人工染色體(MACs)中的基因組或者cDNA文庫,見如,美國專利5,721,118,6,025,155 ;人的人工染色體,見,如, Rosenfeld(1997)Nat. Genet. 15 333-3; 5,酵母人工染色體(YAC);細(xì)菌人工染色體(BAC); Pl 人工染色體,見,如,Woon (1998) Genomics 50 :306-316 ;Pl-來源的載體(PACs),見,如, Kern(1997)Biotechniques 23 120-1M,粘粒,重組病毒,噬菌體或者質(zhì)粒。一方面,編碼發(fā)明多肽的核酸在適當(dāng)?shù)碾A段與可以引起翻譯的多肽或者片段分泌的先導(dǎo)序列裝配在一起。發(fā)明提供融合蛋白和編碼融合蛋白的核酸。發(fā)明的多肽可以與異種的肽或者多肽融合,如N-末端鑒定肽,其賦予了所需的特征,如增加的穩(wěn)定性或者純化方法的簡化。發(fā)明的肽和多肽也可以合成并且以與一個(gè)或者多個(gè)另外的結(jié)構(gòu)域連接的融合蛋白形式進(jìn)行表達(dá),從而,如,產(chǎn)生更具免疫原性的肽,更容易分離的重組合成肽,鑒定和分離抗體和表達(dá)抗體的B細(xì)胞,等等。測定和純化促進(jìn)結(jié)構(gòu)域包括,如,可以在固定的金屬上純化的金屬鏊合肽,如,聚組氨酸序列片(polyhistidine tracks)和組氨酸-色氨酸模塊 (histidine-tryptophan),可以在固定的免疫球蛋白上純化的蛋白A結(jié)構(gòu)域,以及在FLAGS 伸展 / 親禾口純化系統(tǒng)(FLAGS extension/affinity purification system, Immunex Corp, Seattle WA)中使用的結(jié)構(gòu)域。在純化的結(jié)構(gòu)域和含有基元的肽或者多肽之間包含可以切割的如因子)(a或者腸激酶(lnvitrogemSan Diego CA)的接頭序列,以便于純化。例如,表達(dá)載體可能包括連接于六個(gè)組氨酸殘基的編碼抗原決定簇的核酸序列,然后是硫氧還蛋白和腸激酶切割位點(diǎn)(見,如,Williams (1995) Biochemistry 34:1787-1797,Dobeli (1998) Protein Expr. Purif. 12 :404-414)。腸激酶切割位點(diǎn)提供從融合蛋白的殘留物中純化抗原決定簇的方法,同時(shí)組氨酸殘基有利于檢測和純化。關(guān)于編碼融合蛋白的載體以及應(yīng)用融合蛋白的技術(shù)在科學(xué)和專利文獻(xiàn)中有很好的說明,見,例如,Kroll (1993)DNA Cell. Biol., 12 :441-53。轉(zhuǎn)錄和翻譯控制序列發(fā)明提供可操作地與表達(dá)控制序列(如,轉(zhuǎn)錄和翻譯)如,啟動(dòng)子或者增強(qiáng)子連接的發(fā)明的核酸(如,DNA)序列,指導(dǎo)或者調(diào)控RNA的合成/表達(dá)。表達(dá)控制序列可以在表達(dá)載體中。典型的細(xì)菌啟動(dòng)子包括lacl,lacZ,T3,T7,gpt,λ冊,PL和trp啟動(dòng)子。典型的真核啟動(dòng)子包括CMV即刻早期,HSV胸腺嘧啶激酶激酶,早期和晚期SV40,來自逆轉(zhuǎn)錄病毒的LTRs(長末端重復(fù)序列)和鼠金屬硫蛋白I。適于在細(xì)菌中表達(dá)多肽的啟動(dòng)子包括大腸桿菌Iac或者trp啟動(dòng)子,IacI啟動(dòng)子, IacZ啟動(dòng)子,T3啟動(dòng)子,T7啟動(dòng)子,gpt啟動(dòng)子,λ冊啟動(dòng)子,λ PL啟動(dòng)子,來自編碼糖酵解的酶的操縱子的啟動(dòng)子如,3-磷酸甘油激酶(PGK),和酸性磷酸酶啟動(dòng)子。真核啟動(dòng)子包括CMV即刻早期啟動(dòng)子,HSV胸腺嘧啶激酶啟動(dòng)子,熱休克啟動(dòng)子,早期和晚期SV40啟動(dòng)子, 來自逆轉(zhuǎn)錄病毒的LTRs,和鼠金屬硫蛋白-I啟動(dòng)子。也可以應(yīng)用已知的在原核或者真核細(xì)胞或者其病毒中控制基因表達(dá)的其它啟動(dòng)子。表達(dá)載體(expression vectors)禾口克隆(運(yùn))載體(cloning vehicles)發(fā)明提供包括發(fā)明的核酸,如,編碼發(fā)明額磷脂酶的序列的表達(dá)載體和克隆載體, 發(fā)明的表達(dá)載體和克隆載體可以包括病毒顆粒,桿狀病毒,噬菌體,質(zhì)粒,噬菌粒,粘粒, fosmids,細(xì)菌人工染色體,病毒DNA (如,牛痘,腺病毒,禽類痘病毒,偽狂犬病病毒和SV40 衍生物),以Pl為基礎(chǔ)的人工染色體,酵母質(zhì)粒,酵母人工染色體,以及對感興趣的特定宿主(如桿狀菌,曲霉屬(Aspergillus)和酵母)特異的任何其它載體。發(fā)明的載體可以包括染色體的,非染色體的和合成的DNA序列。很多合適的載體為本領(lǐng)域技術(shù)熟練人員所了解,并且可以買到。典型的載體包括細(xì)菌的PQE載體Oliagen),pBluescript質(zhì)粒,pNH 載體,(λ-ZAP 載體(Stratagene) ;ptrc99a, pKK223-3, pDR540, pRIT2T(Pharmacia);真核的PXTI,pSG5 (Stratagene),pSVK3,pBPV,pMSG,pSVLSV40 (Pharmacia)。然而,也可以應(yīng)用任何其它的質(zhì)?;蜉d體,只要可以在宿主中復(fù)制并且可繁殖。低拷貝數(shù)或者高拷貝數(shù)的載體可以應(yīng)用于本發(fā)明。表達(dá)載體可以包括啟動(dòng)子,用于翻譯起始的核糖體結(jié)合位點(diǎn)和轉(zhuǎn)錄終止子。載體也包括擴(kuò)增表達(dá)的合適序列。哺乳動(dòng)物表達(dá)載體可以包括復(fù)制起始位點(diǎn),任何必要的核糖體結(jié)合位點(diǎn),多聚腺苷酸化位點(diǎn),剪接供體和接納位點(diǎn),轉(zhuǎn)錄終止序列,和5'側(cè)非轉(zhuǎn)錄序列。一些方面,源于SV40的剪接和多聚腺苷酸化位點(diǎn)的DNA序列可以用于提供所需的非一轉(zhuǎn)錄遺傳元件?!矫?,表達(dá)載體含有一個(gè)或者多個(gè)選擇性標(biāo)記基因,使得可以選擇含有這些載體的宿主細(xì)胞。這些選擇標(biāo)記包括編碼二氫葉酸還原酶的基因或?qū)φ婧思?xì)胞培養(yǎng)有新霉素抗性的基因,大腸桿菌中賦予抗四環(huán)素或者抗氨芐青霉素的基因,以及釀酒酵母 (S. cerevisiae)的TRPl基因。啟動(dòng)子區(qū)域可以使用氯霉素轉(zhuǎn)移酶(CAT)載體或者具有選擇標(biāo)記的其它載體,從任何所需基因中選擇。在真核細(xì)胞中表達(dá)多肽或者其片段的載體也包括用于增加表達(dá)水平的增強(qiáng)子。增強(qiáng)子是DNA的順式作用元件,一般長度從大約10到大約300bp,其作用于啟動(dòng)子,增強(qiáng)啟動(dòng)子的轉(zhuǎn)錄。例子包括在復(fù)制起點(diǎn)的晚期側(cè)100到270bp的SV40增強(qiáng)子,巨細(xì)胞病毒的早期啟動(dòng)子增強(qiáng)子,在復(fù)制起點(diǎn)的晚期側(cè)的多瘤增強(qiáng)子,和腺病毒增強(qiáng)子。DNA序列可以以不同的程序插入到載體中??傮w上,DNA序列連接于載體上所需的位置,是在用適合的限制性內(nèi)切酶消化切下插入片段和消化切割載體之后進(jìn)行的??蛇x擇地,插入片段和載體兩者可以以平端的形式連接。在專業(yè)上已知不同的克隆技術(shù),例如,如在Ausubel和Sambrook中所描述的技術(shù)。這樣的程序和其它程序被認(rèn)為是屬于本領(lǐng)域的技術(shù)人員的范圍之內(nèi)。載體可以是質(zhì)粒,病毒顆?;蛘呤删w的形式。其它的載體包括染色體的,非染色體的和合成的DNA序列,SV40的衍生物;細(xì)菌質(zhì)粒,噬菌體DNA,桿狀病毒,酵母質(zhì)粒,源于質(zhì)粒和噬菌體DNA組合的載體,病毒DNA如牛痘,腺病毒,禽類痘病毒,和偽狂犬病病毒。在原核和真核宿主中使用的多種克隆和表達(dá)載體,在如Sambrook中所說明的??梢詰?yīng)用的特定細(xì)菌載體包括可以買到的含有以下克隆載體遺傳學(xué)元件的質(zhì) pBR322(ATCC 37017), pKK223-3(Pharmacia Fine Chemicals, Uppsala, Sweden),
GEMl(Promega Biotec, Madison, WI, USA)pQE70, pQE60, pQE-9 (Qiagen), pDIO, psiX174, pBlueScript II KS, pNH8A, pNH16a, pNH18A, pNH46A(Stratagene), ptrc99a, pKK223_3, PKK223-3, pDR540, pRIT5 (Pharmacia),pKK232_8 和 pCM7。特定的真核載體包括 pSV2CAT, pOG44, pXTI, pSG(Stratagene)pSVK3, pBPV, pMSG,和 ρSVL(Pharmacia)。然而,任何其它的載體也可以應(yīng)用,只要它在宿主細(xì)胞可以復(fù)制和繁殖。宿主細(xì)胞和轉(zhuǎn)化細(xì)胞發(fā)明也提供包括發(fā)明核酸序列,如,編碼發(fā)明磷脂酶的序列,發(fā)明的載體的轉(zhuǎn)化的細(xì)胞。宿主細(xì)胞可以是技術(shù)熟練人員所熟悉的任何宿主細(xì)胞,包括原核細(xì)胞,真核細(xì)胞, 如,細(xì)菌細(xì)胞,真菌細(xì)胞,酵母細(xì)胞,哺乳動(dòng)物細(xì)胞,昆蟲細(xì)胞,或者植物細(xì)胞。典型的細(xì)菌細(xì)胞包括大腸桿菌E. coli,鏈霉菌Mi^ptomyces,枯草桿菌Bacillus subtilis,沙門氏菌 Salmonella typhimurium 禾口假單胞菌 Pseudomonas,鏈霉菌 Streptomyces,禾口葡萄球菌 Maphylococcus屬中的各種種類。典型的昆蟲細(xì)胞包括果蠅S2 (Drosophila S2)和草地夜蛾Sf9 (Spodoptera Sf9)。典型的動(dòng)物細(xì)胞包括CHO,COS或者Bowes melanoma或者任何小鼠或者人類細(xì)胞系。適當(dāng)?shù)乃拗鞯倪x擇是在專業(yè)知識的范圍內(nèi)。載體可以應(yīng)用任何不同的技術(shù)引入到宿主細(xì)胞,包括轉(zhuǎn)化,轉(zhuǎn)染,轉(zhuǎn)導(dǎo),病毒感染,基因槍,或者Ti-介導(dǎo)的基因轉(zhuǎn)移。特定的方法包括磷酸鈣轉(zhuǎn)染,DEAE-Dextran介導(dǎo)的轉(zhuǎn)染,脂質(zhì)體轉(zhuǎn)染,或者電穿孔(Davis, L.,Dibner, M.,Battey,I.,Basic Methods in Molecular Biology, (1986))。適當(dāng)?shù)?,工程化的宿主?xì)胞可以在傳統(tǒng)營養(yǎng)培養(yǎng)基中培養(yǎng),可以修改以便適于活化啟動(dòng)子,選擇轉(zhuǎn)化子或者擴(kuò)增發(fā)明的基因。隨后轉(zhuǎn)化適當(dāng)?shù)乃拗髦?,并且該宿主株生長至適當(dāng)?shù)募?xì)胞密度,通過適當(dāng)?shù)姆椒ㄕT導(dǎo)所選擇的啟動(dòng)子(如,溫度變換或者化學(xué)誘導(dǎo)),細(xì)胞被額外培養(yǎng)一段時(shí)間,使得它們產(chǎn)生所需的多肽或者其片段。細(xì)胞通過離心收集,通過物理或者化學(xué)的方法破碎,得到的粗提取物保留用于進(jìn)一步的純化。用于表達(dá)蛋白的微生物細(xì)胞可以通過方便的方法破碎,包括反復(fù)冷凍一融化循環(huán),機(jī)械破碎,或者應(yīng)用細(xì)胞裂解試劑。這樣的方法為技術(shù)熟練人員所熟悉。表達(dá)的多肽或者片段可以通過下述方法從重組細(xì)胞培養(yǎng)物中回收純化,包括硫酸銨或者乙醇沉淀,酸抽提,陽離子或者陰離子交換層析,磷酸纖維素層析,疏水相互作用層析,親和層析,羥基磷灰石層析和植物凝集素層析。如果必要的話,可以在實(shí)現(xiàn)多肽的構(gòu)象中應(yīng)用蛋白重新折疊步驟。如果需要,可以應(yīng)用高效液相色譜(HPLC)進(jìn)行最終的純化步驟。各種哺乳動(dòng)物培養(yǎng)系統(tǒng)可以用來表達(dá)重組蛋白。哺乳動(dòng)物表達(dá)系統(tǒng)的例子包括可以從相容性載體中表達(dá)蛋白的猴腎成纖維細(xì)胞C0S-7細(xì)胞系和其它的細(xì)胞系,如C127, 3T3, CHO, Hela 和 BHK 細(xì)胞系。宿主細(xì)胞中的構(gòu)建物可以應(yīng)用傳統(tǒng)的方式來產(chǎn)生重組序列編碼的基因產(chǎn)物。依賴于在重組產(chǎn)生程序中采用的宿主,含有載體的宿主細(xì)胞產(chǎn)生的多肽可以是糖基化或者是非糖基化的。發(fā)明的多肽可以包括,也可以不包括起始的甲硫氨酸氨基酸殘基。無細(xì)胞的翻譯系統(tǒng)可能也用于產(chǎn)生發(fā)明的多肽。無細(xì)胞翻譯系統(tǒng)可以應(yīng)用從在帶有啟動(dòng)子的編碼多肽或者其片段的核酸的DNA構(gòu)建物轉(zhuǎn)錄的mRNA。一些方面,DNA構(gòu)建物可以,在體外轉(zhuǎn)錄反應(yīng)前,先線性化。然后轉(zhuǎn)錄的mRNA與合適的無細(xì)胞翻譯提取物如,兔網(wǎng)織紅細(xì)胞提取物一起溫育來產(chǎn)生所需的多肽或者片段。表達(dá)載體可以含有一個(gè)或者多個(gè)選擇性標(biāo)記基因,提供用于選擇轉(zhuǎn)化的宿主細(xì)胞的表型特征,如,二氫葉酸還原酶和真核細(xì)胞培養(yǎng)的新霉素抗性,或者如大腸桿菌中的四環(huán)素或者氨芐青霉素抗性。核酸的擴(kuò)增在實(shí)踐發(fā)明時(shí),編碼發(fā)明多肽的核酸,或者修飾的核酸可以再生,如通過擴(kuò)增。發(fā)明提供用于擴(kuò)增編碼具有磷脂酶活性的多肽的核酸的擴(kuò)增引物序列對。一方面,引物對可以擴(kuò)增發(fā)明的核酸序列,如,包括典型的SEQ ID NO :1,或者其一個(gè)亞序列;如SEQ ID NO 3 所闡明的一個(gè)序列,或者其一個(gè)亞序列;如SEQ ID NO :5所闡明的一個(gè)序列,或者其一個(gè)亞序列;如SEQ ID NO :7所闡明的一個(gè)序列,或者其一個(gè)亞序列,等等。技術(shù)熟練人員可以設(shè)計(jì)這些序列的任何部分或全長的擴(kuò)增引物序列對。發(fā)明提供用于擴(kuò)增編碼具有磷脂酶活性的多肽的核酸的擴(kuò)增引物序列對,其中引物對可以擴(kuò)增包括發(fā)明序列的核酸,或者其片段或亞序列。用于擴(kuò)增的引物序列對的一個(gè)或每一個(gè)成員可以包括含有該序列的至少大約10到50個(gè)連續(xù)堿基的寡聚核苷酸,或者包括含有該序列的大約12,13,14,15,16,17,18,19,20,21,22,23,24,或者25個(gè)連續(xù)堿基的
寡聚核苷酸。
發(fā)明提供擴(kuò)增引物對,其中引物對包括具有在發(fā)明核酸的大約第一個(gè)(5' )12, 13,14,15,16,17,18,19,20,21,22,23,24,或者25個(gè)殘基中闡明的序列的第一成員,和具有在第一成員的互補(bǔ)鏈的大約第一個(gè)(5 ‘ ) 12,13,14,15,16,17,18,19,20,21,22,23,24, 或者25個(gè)殘基中闡明的序列的第二成員。發(fā)明提供通過擴(kuò)增產(chǎn)生的磷脂酶,如應(yīng)用本發(fā)明的擴(kuò)增引物對的多聚酶鏈?zhǔn)椒磻?yīng)(PCR)。發(fā)明提供使用發(fā)明的擴(kuò)增引物對,通過擴(kuò)增,例如, 多聚酶鏈?zhǔn)椒磻?yīng)(PCR)制備發(fā)明磷脂酶的方法。一方面,擴(kuò)增引物擴(kuò)增從文庫,例如,基因文庫,如環(huán)境文庫中得到的核酸。擴(kuò)增反應(yīng)也可以用于定量樣品中(如在細(xì)胞樣品中的信使的量)的核酸,標(biāo)記的核酸(如,用于分析或者印跡)的量,確定核酸,或者定量樣品中特異核酸的量。發(fā)明的一方面,對分離自細(xì)胞或者DNA文庫的信使進(jìn)行擴(kuò)增。技術(shù)熟練人員可以選擇和設(shè)計(jì)合適的寡聚核苷酸擴(kuò)增引物。擴(kuò)增的方法為技術(shù)熟練人員所熟悉,并且包括,如,多聚酶鏈?zhǔn)椒磻?yīng), PCR(見,如,PCR PROTOCOLS, A GUIDE TO METHODS AND APPLICATIONS, ed. Innis,Academic Press, N.Y. (1990)和 PCR STRATEGIES(1995),ed. Innis, Academic Press, Inc.,N.Y.,連接酶鏈?zhǔn)椒磻?yīng)(LCR)(見,如,Wu (1989) Genomics 4 :560,Landegren (1988) Science 241 1077,Barringer (1990)Gene 89 :117);轉(zhuǎn)錄擴(kuò)增(見,如,Kwoh(1989)Proc. Natl. Acad. Sci. USA 86 :1173),和自支持序列復(fù)制(見如,Guatelli (1990)Proc. Natl, Asad. Sci. USA 87 :1874) ,Q-β 復(fù)制酶擴(kuò)增(見,如,Simth (1997) J. Clin. Microbiol. 35 :1477-1491),自動(dòng)的 Q-β 復(fù)制酶擴(kuò)增分析(見,如,Burg(1996)Mol. Cell. Probes 10 :257-271)和其它 RNA 聚合酶介導(dǎo)的技術(shù)(如,NASBA, Cangene, Mississauga, Ontario),也見,例如,Berger (1987) Methods Enzymo 1. 152 :307-316 ;Sambrook ;Ausubel ;美國專利 4,683,195 和 4,683,202 ; Sooknanan(1995)Biotechnology 13 :563_564。確定序列同一性的水平發(fā)明提供包括與發(fā)明的典型核酸(例如,SEQ ID NO :1,SEQ ID N0:3,SBQ ID NO: 5,SEQ ID NO 7, SEQ ID NO -.9, SEQ ID NO :11, SEQ ID NO :13, SEQ ID NO :15, SEQ ID NO 17,SEQ ID NO :19, SEQ ID NO :21, SEQ ID NO :23, SEQ ID NO :25, SEQ ID NO :27, SEQ ID NO :29, SEQ ID NO :31,SEQ ID NO :33, SEQ ID NO :35, SEQ ID NO :37, SEQ ID NO :39, SEQ ID NO :41, SEQ ID NO :43, SEQ ID NO :45, SEQ ID NO :47, SEQ ID NO :49, SEQ ID NO :51, SEQ ID NO :53, SEQ ID NO :55, SEQ ID NO :57, SEQ ID NO :59, SEQ ID NO :61,SEQ ID NO 63,SEQ ID NO :65, SEQ ID NO :67, SEQ ID NO :69, SEQ ID NO :71, SEQ ID NO :73, SEQ ID NO :75, SEQ ID NO :77, SEQ ID NO :79, SEQ ID NO :81,SEQ ID NO :83, SEQ ID NO :85, SEQ ID NO :87, SEQ ID NO :89, SEQ ID NO :91,SEQ ID NO :93, SEQ ID NO :95, SEQ ID NO :97, SEQ ID NO :99, SEQ ID NO :101, SEQ ID NO :103, SEQ ID NO :105,和編碼 SEQ ID NO :2, SEQ ID NO :4, SEQ ID NO :6,SEQ ID NO :8,SEQ ID NO :10, SEQ ID NO :12, SEQ ID NO :14, SEQ ID NO :16, SBQ ID NO :18, SEQ ID NO :20, SEQ ID NO :22, SEQ ID NO :24, SEQ ID NO 26,SEQ ID NO :28, SEQ ID NO :30, SEQ ID NO :32, SEQ ID NO :34, SEQ ID NO :36, SEQ ID NO :38, SEQ ID NO :40, SEQ ID NO :42, SBQ ID NO :44, SEQ ID NO :46, SEQ ID NO :48, SEQ ID NO :50, SEQ ID NO :52, SEQ ID NO :54, SEQ ID NO :56, SEQ ID NO :58, SEQ ID NO :60, SEQ ID NO :62, SEQ ID NO :64, SEQ ID NO :66, SEQ ID NO :68, SEQ ID NO :70, SEQ ID NO 72,SEQ ID NO :74, SEQ ID NO :76, SEQ ID NO :78, SEQ ID NO :80, SEQ ID NO :82, SEQ IDNO 84, SEQ ID NO :86,SEQ ID NO :88,SEQ ID NO :90,SEQ ID NO :92,SEQ ID NO :94,SEQ ID NO 96, SEQ ID NO :98,SEQ ID NO :100,SEQ ID NO :102,SEQ ID NO :104,SEQ ID NO 106 的核酸)在至少大約 50,75,100,150,200,250,300,350,400,450,500,550,600,650, 700,750,800,850,900,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1450, 1500,1550或者更多的殘基范圍內(nèi)具有至少大約50 %,51 %,52 %,53 %,54%,55 %,56 %, 57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 % , 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 %,或者更多,或者完全的(100% )序列同一性的序列的核酸。發(fā)明提供含有與發(fā)明的典型多肽具有至少大約 50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95%,96%,97%,98%,99%,或者更多,或者完全(100 % )的序列同一性的序列的多肽。序列同一性(同源性)的范圍可以應(yīng)用任何計(jì)算機(jī)程序和相關(guān)參數(shù)來確定,包括那些在此所說明的,如用默認(rèn)參數(shù)的BLAST 2. 2. 2.或者FASTA 3. 0t78版。在可選擇的實(shí)施方案中,序列同一性可以在核酸或者多肽的至少大約5,10,20, 30,40,50,100,150,200,250,300,350,400個(gè)連續(xù)的殘基,或者全長的范圍內(nèi)。序列同一性 (同源性)的程度可以應(yīng)用任何計(jì)算機(jī)程序和相關(guān)聯(lián)的參數(shù)來確定,包括那些在此所說明的,如使用默認(rèn)參數(shù)的BLAST 2. 2. 2.或者FASTA3. 0t78版。同源性序列也包括RNA序列,其中在核酸序列中尿嘧啶替代了胸腺嘧啶。同源序列可以應(yīng)用在此說明的任何程序得到或者可以由校正序列錯(cuò)誤得到。應(yīng)該理解到的是,在此所列的核酸序列可以以傳統(tǒng)的單一字母的形式來代表(見,如,Stryer, Lubert. Biochemistry 3rd Ed.,W. H. Freeman&Co.,New York)或者以記錄序列中的核苷酸的同一性的任何其他形式來代表。在發(fā)明的這一方面,在此指明的各種序列比較程序得以使用。蛋白和/或核酸序列同一性(同源性)可以應(yīng)用技術(shù)上已知的任何序列比較算法和程序評估。這樣的算法和程序包括,但不限于,TBLASTN, BLASTP, FASTA, TFASTA,和 CLUSTALW(Pearson 和 Lipman, Proc. Natl. Acad. Sci. USA 85(8) :2444-2448,1988 ;Altschul et al. , J.Mol. Biol.215(3) :403-410,1990 ;Thompson et al.,Nucleic Acids Res. 22(2) :4673-4680, 1994 ;Higgins et al.,Methods Enzymo1. 266 :383-402,1996 ;Altschul et al.,J. Mol. Biol.215(3) :403-410,1990 ;Altschul et al. , Nature Genetics 3:266—272,1993)。同源性或者同一性可以應(yīng)用序列分析軟件來測定(如,遺傳學(xué)計(jì)算機(jī)組的序列分析軟件包,Uinversity of Wisconsin Biotechnology Center, 1710 University Avenue, Madison, WI 5370 。這樣的軟件通過對各種缺失,替換,或者其它的修飾進(jìn)行同源性水平賦值比較相似的序列。在兩個(gè)或者多個(gè)核酸或者多肽序列的語境下,術(shù)語“同源性”和“同一性”是指兩個(gè)或者多個(gè)序列或者亞序列,當(dāng)在比較窗口或者指定區(qū)域中應(yīng)用任何數(shù)量的序列比較算法或者手動(dòng)排列和目測來測定,通過比較和排列以便獲得最大的一致性時(shí),它們是相同的或者具有氨基酸殘基或者核苷酸的特異百分比。對于序列比較,一個(gè)序列可以作為參照序列(典型序列 SEQ ID NO 1, SEQ ID N0:2,SEQ ID N0:3,SEQ ID N0:4,SEQ IDNO 5, SEQ ID NO :6,SEQ ID NO -J, SEQ ID N0:8,等等)與待測序列進(jìn)行比較。當(dāng)應(yīng)用序列比較算法,待測序列和參照序列被輸入到計(jì)算機(jī)中,如果必要指定亞序列坐標(biāo),指定序列算法程序參數(shù)??梢詰?yīng)用默認(rèn)程序參數(shù),或者指定選擇性參數(shù)。序列比較算法依據(jù)程序參數(shù),計(jì)算待測序列和參照序列同一性的百分比。 在此應(yīng)用的“比較窗口 ”,包括涉及連續(xù)殘基的數(shù)目的任何一個(gè)片段。例如,在發(fā)明可選擇的方面,連續(xù)殘基的范圍從20到全長的發(fā)明的典型序列,例如,SEQ ID N0:1,SEQ ID NO 2, SEQ ID NO :3,SEQ ID NO :4,SEQ ID NO :5,SEQ ID NO :6,SEQ ID NO :7,SEQ ID NO 8,等等,當(dāng)兩個(gè)序列優(yōu)化地排列后,與參照序列的相同數(shù)目的連續(xù)位置進(jìn)行比較。如果參照序列與發(fā)明的典型序列,例如 SEQ ID NO 1, SEQ ID N0:2,SEQ ID N0:3,SEQ ID N0:4,SEQ ID NO :5, SEQ ID NO :6,SEQ ID NO -J, SEQ ID NO :8 等具有必要的序列同一性,如,50%, 51 %, 52 %, 53 %, 54 %, 55 %, 56 %, 57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96^,97^,98^,99%,或者更多的序列同一性,該序列是屬于發(fā)明的范圍。在可選擇的實(shí)施方案中,當(dāng)兩個(gè)序列優(yōu)化地排列后,從大約20到600,大約50到200,和大約100到150范圍的序列與參照序列的同樣的連續(xù)位置比較。用于比較的序列比對方法為技術(shù)熟練人員所熟悉。用于比較的優(yōu)化序列比對可以用,例如,Smith & Waterman, Adv. Appl. Math. 2 :482, 1981的局部同源性算法,Needleman & ffunsch, J. Mol. Biol. 48 :443,1970的同源排列算法, Person& Lipman, Proc, Nat' 1. Acad. Sci. USA 85 :2444,1988 的搜索相似性法,通過計(jì)算機(jī)化這些算法(Wisconsin的遺傳學(xué)軟件包,遺傳學(xué)計(jì)算機(jī)組,575 Science Dr,Madison, WI的GAP,BESTFIT, FASTA,和TFASTA)或者通過手動(dòng)排列和目測完成。其它的用于確定同源性或者同一性的算法包括,例如,除了(在生物信息國家中心的基本局部排列搜索工具) BLAST程序外,ALIGN,AMAS (多排列的序列分析),AMPS (蛋白多序列比對),ASSET (比對片段的統(tǒng)計(jì)評估工具),BANDS,BESTSC0R,BI0SCAN(生物序列比較分析節(jié)點(diǎn)),BLIMPS(BLocks IMProved Marcher),F(xiàn)ASTA,Intervals& Points,BMB,CLUSTAL V,CLUSTAL W,CONSENSUS, LC0NSENSUS, WCONSENSUS, Smith-Waterman 算法,DARWIN, Las Vegas 算法,F(xiàn)NAT (強(qiáng)迫核苷酸比對工具),Framealign,F(xiàn)ramesearch, DYNAMIC, FILTER, FSAP (Fristensky 序列分析包),GAP (通用比對程序),GENAL, GIBBS, GenQuest, ISSC (靈敏的序列比較),LALIGN(局部序列比對),LCP(局部含量程序),MACAW(多比對構(gòu)建&分析工作臺),MAP(多比對程序),MBLKP,MBLKN, PIMA(模式誘導(dǎo)的多序列比對),SAGA(遺傳算法的序列比對)和 WHAT-IF。這樣的比對程序也可以用于篩查基因組數(shù)據(jù)庫,鑒定具有實(shí)質(zhì)上同一性序列的多核苷酸序列。目前已經(jīng)有很多基因組數(shù)據(jù)庫,例如,人類基因組的實(shí)質(zhì)上部分可以作為人類基因組測序計(jì)劃(Gibbs,19%)的一部分。幾個(gè)基因組已經(jīng)測序完成,如,生殖道支原 # M genitalium(Fraser et al. , 1995), ψ'^tM Μ. jannaschii (Bult et al. , 1996), 流感嗜血菌 H influenzae (Fleischmann et al. , 1995),大腸桿菌 E coli (Blattner et al.,1997),禾口酵母(S. cerevisiae) (Mewes et al.,1997),禾口果D. melanogaster (Adams et al.,2000)。模式生物的基因組測序中已經(jīng)取得了顯著的進(jìn)展,如小鼠,線蟲,和擬南芥 Arabadopsis sp.。含有具功能性信息注解的基因組信息的數(shù)據(jù)庫由不同的組織保持,并且可以通過因特網(wǎng)進(jìn)行訪問。
BLAST, BLAST 2. 0和BLAST 2. 2. 2算法也用于實(shí)踐發(fā)明。這些算法在,如, Altschul (1977)Nuc. Acids Res. 25 :3389-3402,Altschul(1990)J. Mol. Biol. 215 :403-410 中有描述。進(jìn)行BLAST分析的軟件可以通過生物技術(shù)信息國家中心(the National Center for Biotechnology Information)公開得到。此算法包括首先通過確定詢問序列中長度為W的短詞,當(dāng)與數(shù)據(jù)庫中相同長度的詞對齊時(shí),其或者匹配或者滿足正值閾得分T,從而確定高分值序列對(HSPs)。T值是指作為鄰近詞的分?jǐn)?shù)閾值(Altschul (1990),見上文)。 這些起始的鄰近詞命中作為起始搜索的起始,從而發(fā)現(xiàn)更長的含有鄰近詞的HSI^s。只要積累的比對值可以增加,詞命中就沿著每個(gè)序列向兩個(gè)方向延伸。對于核苷酸序列,積累值的計(jì)算應(yīng)用參數(shù)M(匹配殘基對的獎(jiǎng)勵(lì)得分值;一般情況下大于0)。對于氨基酸序列,應(yīng)用記分矩陣來計(jì)算累積值。當(dāng)累積的比對得分值從其最大所得值跌落到數(shù)量X ;由于一個(gè)或者多個(gè)負(fù)值殘基的比對的積累,累積值趨向零或者零以下;或者任何一個(gè)序列的到達(dá)了末端, 單詞命中的延伸在每一個(gè)方向終止。BLAST算法參數(shù)W,T,和X決定了比對的靈敏度和速度。BLASTN程序(對于核苷酸序列)使用字母長度(W)為11,期望值(E)為10,M = 5,N ="4的默認(rèn)值并且比較兩條鏈。對于氨基酸序列,BLASTP程序使用字母長度為3,期望值 (E)為 10 的默認(rèn)值,BLOSUM62 記分矩陣(見 Henikoff & Henikoff (I989) Proc. Natl. Acad. Sci. USA 89 :10915)比對值(B)為50,期望值(E)為10,M = 5,N = _4,并且比較兩條鏈。 BLAST算法也對兩個(gè)序列之間的相似性進(jìn)行統(tǒng)計(jì)分析(見,如,Karlin & Altschul (1993) Proc. Natl. Acad. Sci. USA 90 :5873)。由BLAST算法提供的一個(gè)相似性測定是最小總概率 (P(N)),其通過兩個(gè)核苷酸之間或者氨基酸序列之間隨機(jī)配對,提供概率的指標(biāo)。例如,在檢測核酸和參照序列比較時(shí),如果最小的總概率小于大約0. 2,更優(yōu)選的是小于大約0. 01, 最優(yōu)選的小于大約0. 001,那么認(rèn)為核酸與參考序列相似。一方面,蛋白質(zhì)和核酸序列的同源性應(yīng)用基本局部比對搜索工具(“BLAST”)評估。例如,五個(gè)特異性的BLAST程序可以用于以下任務(wù)(I)BLASTP和BLAST3把氨基酸詢問序列與蛋白序列數(shù)據(jù)庫進(jìn)行比較。(2) BLASTN把核酸詢問序列與核酸序列數(shù)據(jù)庫進(jìn)行比較。( BLASTX把詢問的核苷酸序列的六個(gè)框架的翻譯產(chǎn)物(兩個(gè)鏈)與蛋白序列數(shù)據(jù)庫進(jìn)行比較。(4)TBLASTN把詢問的蛋白序列與六個(gè)閱讀框架(雙鏈)中翻譯的核酸序列數(shù)據(jù)庫進(jìn)行比較,并且 TBLASTX把詢問核酸的六個(gè)閱讀框架的翻譯與數(shù)據(jù)庫中核苷酸序列的六個(gè)閱讀框架的翻譯進(jìn)行比較。BLAST 程序通過鑒定相似片段來鑒定同源序列,相似片段在此是指詢問氨基酸或者核酸序列之間的“高分值片段對”,檢測序列優(yōu)選的從蛋白質(zhì)或者核酸序列數(shù)據(jù)庫中獲得。高分值片段配對優(yōu)選地通過記分矩陣鑒定(比對),它們中的很多為技術(shù)熟練人員所熟悉。優(yōu)選地,應(yīng)用的記分矩陣是 BL0SUM62 矩陣(Gonnet et al.,Science 256 1443-1445,1992,Henikoff 和Henikoff,Proteins 17 :49-61,1993)。較不優(yōu)選地,PAM或者PAM250矩陣也可以應(yīng)用 (見,例如,Schwartz和Dayhoff, eds.,1978,檢測距離關(guān)系的矩陣蛋白質(zhì)序列和結(jié)構(gòu)集, 華盛頓國家生物醫(yī)學(xué)研究基金會)。發(fā)明的一方面,為了確定是否核酸具有發(fā)明范圍內(nèi)的必需序列同一性,應(yīng)用NCBI BLAST 2. 2. 2程序,默認(rèn)值的選擇是blastp。在BLAST 2. 2. 2程序中,有大約38個(gè)設(shè)定的選擇。在發(fā)明的典型方面,除了默認(rèn)的過濾設(shè)置外,所有都應(yīng)用默認(rèn)值(即除了過濾設(shè)定為關(guān)閉,所有的參數(shù)設(shè)定為默認(rèn)值),在該位置上應(yīng)用不進(jìn)行過濾“-F F”設(shè)置。一般由于序列的長度,默認(rèn)過濾的使用經(jīng)常導(dǎo)致Karlin-Altschul違背。
發(fā)明的典型方面的使用的默認(rèn)值包括“低復(fù)雜性過濾on>字長3> 矩陣Blosum62>缺口成本存在值11> 延伸1”其它的默認(rèn)值設(shè)置為低復(fù)雜性過濾關(guān)閉(off),蛋白質(zhì)字母長度為3,BL0SUM62 矩陣,缺口存在補(bǔ)償-11,并且缺口延伸補(bǔ)償-1。典型的NCBI BLAST 2. 2. 2程序設(shè)置在以下的實(shí)施例1中闡明。注意,“-W”選擇默認(rèn)值為0。這是指,如果沒有設(shè)置,對于蛋白,字母長度默認(rèn)值為3,對于核苷酸字母長度默認(rèn)值為11。計(jì)算機(jī)系統(tǒng)和計(jì)算機(jī)稈序產(chǎn)品為了確定和鑒定序列同一性,結(jié)構(gòu)同源性,基元等等,發(fā)明的序列可以在任何計(jì)算機(jī)可以讀取的介質(zhì)上儲存,記錄和操作。相應(yīng)地,發(fā)明提供計(jì)算機(jī),計(jì)算機(jī)系統(tǒng),計(jì)算機(jī)可讀介質(zhì),計(jì)算機(jī)程序產(chǎn)品和等等可以記錄和儲存發(fā)明的核酸和多肽序列,例如,發(fā)明的典型序列,如,SEQ ID NO 1, SEQ ID N0:2,SEQ ID N0:3,SEQ ID N0:4,SEQ ID N0:5,SEQ ID NO: 6,SEQ ID NO :7, SEQ ID NO :8,等等的產(chǎn)品。正如在此使用的,單詞“記錄的”和“存儲的” 是指在計(jì)算機(jī)介質(zhì)上儲存信息的過程。熟練的技術(shù)人員可以很容易地采用任何已知的方法在計(jì)算機(jī)的可讀介質(zhì)上記錄信息,產(chǎn)生含有一個(gè)或者多個(gè)發(fā)明的核酸和/或多肽序列的產(chǎn)品。發(fā)明的另一方面是具有記錄發(fā)明的至少一個(gè)核酸和/或多肽序列的計(jì)算機(jī)可讀介質(zhì)。計(jì)算機(jī)可讀介質(zhì)包括磁性可讀介質(zhì),光學(xué)可讀介質(zhì),電子可讀介質(zhì)和磁性/光學(xué)介質(zhì)。例如,計(jì)算機(jī)可讀介質(zhì)可以是硬盤,軟盤,磁帶,⑶_R0M,DVD,隨機(jī)存取存儲器(RAM),只讀存儲器(ROM)以及其它類型的技術(shù)人員熟知的其它媒介。發(fā)明的方面包括系統(tǒng)(如,以因特網(wǎng)為基礎(chǔ)的系統(tǒng)),特別的計(jì)算機(jī)系統(tǒng),其存儲和操作在此說明的序列和序列信息。計(jì)算機(jī)系統(tǒng)100的一個(gè)實(shí)施例在圖1的方塊圖中有說明。正如在此所使用的,“計(jì)算機(jī)系統(tǒng)”是指用于分析發(fā)明的核苷酸和多肽序列的硬件組件, 軟件組件,以及數(shù)據(jù)存儲組件。計(jì)算機(jī)系統(tǒng)100可以包括用于序列數(shù)據(jù)處理,訪問和操作的處理器。處理器105可以是任何已知類型的中央處理器如,例如,Intel公司的奔騰III處理器或者Sun,Motorola, Compaq, AMD或者IBM公司相似的處理器。計(jì)算機(jī)系統(tǒng)100是一般目的的系統(tǒng),其包括處理器105和用于存儲數(shù)據(jù)的一個(gè)或者多個(gè)內(nèi)部數(shù)據(jù)存儲組件110, 和一個(gè)或者多個(gè)用于檢索存儲于數(shù)據(jù)存儲裝置的數(shù)據(jù)的數(shù)據(jù)檢索裝置。熟練的技術(shù)人員可以很容易地應(yīng)用任何一個(gè)目前可得到的合適的計(jì)算機(jī)系統(tǒng)。一方面,計(jì)算機(jī)系統(tǒng)100包括連接于總線的處理器105,該總線連接于主存儲器 115,(優(yōu)選地,作為RAW執(zhí)行)和一個(gè)或者更多的內(nèi)部數(shù)據(jù)存儲裝置110,如硬盤驅(qū)動(dòng)器和 /或其它的具有數(shù)據(jù)存儲的計(jì)算機(jī)可讀介質(zhì)。計(jì)算機(jī)系統(tǒng)100可以進(jìn)一步包括一個(gè)或者多個(gè)用于讀取存儲于內(nèi)部數(shù)據(jù)存儲裝置110的數(shù)據(jù)的數(shù)據(jù)檢索裝置118。數(shù)據(jù)檢索裝置118可以為,例如,軟盤驅(qū)動(dòng)器,光盤驅(qū)動(dòng)器,磁帶驅(qū)動(dòng)器或者可以連接于遠(yuǎn)端數(shù)據(jù)存儲系統(tǒng)的調(diào)制解調(diào)器(如通過因特網(wǎng))等等。在一些具體情況下,內(nèi)部的數(shù)據(jù)存儲裝置110是可移動(dòng)的計(jì)算機(jī)可讀介質(zhì)如,軟盤,光盤,磁帶,等等。含有控制邏輯和/或其中記錄的數(shù)據(jù)。當(dāng)數(shù)據(jù)存儲組件插入到數(shù)據(jù)檢索裝置中時(shí),計(jì)算機(jī)系統(tǒng)100可以優(yōu)勢地包括或者通過適當(dāng)?shù)能浖?zhí)行來讀取控制邏輯和/或數(shù)據(jù)。計(jì)算機(jī)系統(tǒng)100包括用于給計(jì)算機(jī)應(yīng)用者顯示輸出的結(jié)果的顯示器120。應(yīng)當(dāng)注意到計(jì)算機(jī)系統(tǒng)100可以在網(wǎng)絡(luò)中或者寬帶網(wǎng)中連接于其它的計(jì)算機(jī)系統(tǒng)125a-c,提供集中地接到計(jì)算機(jī)系統(tǒng)100。連接和處理發(fā)明的核酸或者氨基酸序列的軟件可以在執(zhí)行過程中駐留在主存儲器115中。一些方面,計(jì)算機(jī)系統(tǒng)100可以進(jìn)一步包括比較發(fā)明的核酸序列的序列比較算法。算法和序列可以儲存在計(jì)算機(jī)可讀的介質(zhì)中?!靶蛄斜容^算法”是指一個(gè)或者多個(gè)程序, 可以安裝在(局域地或者遠(yuǎn)程地)計(jì)算機(jī)系統(tǒng)100上,把核酸序列與別的核酸序列和/或在數(shù)據(jù)存儲方式中存儲的化合物相比較。例如,序列比較算法可以把典型的序列的核苷酸序列,如,存儲在計(jì)算機(jī)可讀介質(zhì)中的SEQ ID NO 1, SEQ ID N0:2,SEQ ID N0:3,SEQ ID. NO 4,SEQ ID NO 5, SEQ ID NO :6,SEQ ID NO :7, SBQ ID NO :8 等等與存儲在計(jì)算機(jī)可讀介質(zhì)中的參照序列進(jìn)行比較,確定同源性或者結(jié)構(gòu)基元。以上算法應(yīng)用的參數(shù)可以依據(jù)所研究的序列長度和同源性水平而加以變化。一些方面,算法使用的參數(shù)可以在使用者沒有給出指令的情況下,應(yīng)用默認(rèn)參數(shù)。圖2是說明過程200的流程圖,把新的核苷酸或者蛋白序列和數(shù)據(jù)庫的序列加以比較,確定新序列和數(shù)據(jù)庫序列之間的同源性水平。序列數(shù)據(jù)庫可以是在儲存于計(jì)算機(jī)系統(tǒng)100的私人數(shù)據(jù)庫, 或者公開數(shù)據(jù)庫,如通過因特網(wǎng)可以查到的GENBANK。過程200在起始狀態(tài)201開始,并且移動(dòng)到狀態(tài)202,其中待比較的新序列儲存于計(jì)算機(jī)系統(tǒng)100的存儲器中。正如以上所討論的,存儲器可以是任何類型的存儲器,包括RAM或者內(nèi)部存儲裝置。過程200隨后移至狀態(tài)204,其中的序列數(shù)據(jù)庫開放用于分析和比較。進(jìn)程200然后移至狀態(tài)206,其中讀取存儲在數(shù)據(jù)庫的第一序列至計(jì)算機(jī)的存儲器中。在狀態(tài)210下進(jìn)行比較,確定是否第一序列與第二序列一樣。值得注意的是,本步驟并不限于進(jìn)行新序列和數(shù)據(jù)庫中的第一序列進(jìn)行精確的比較。技術(shù)熟練人員熟悉比較兩個(gè)核苷酸或者蛋白序列的方法,盡管它們并不相同。例如,為了提高兩個(gè)待檢測序列的同源性水平,可以在一個(gè)序列中引入缺口。在比較過程中控制是否引入缺口或者其它的特征到序列中的參數(shù)一般由計(jì)算機(jī)系統(tǒng)的使用者輸入。一旦在狀態(tài)210的情況下,進(jìn)行了兩個(gè)序列的比較,那么在決定狀態(tài)210就作出是否兩個(gè)序列一樣的確定。當(dāng)然,術(shù)語“同樣”并不限于完全絕對一樣的序列。在使用者輸入的同源性參數(shù)內(nèi)的序列將在過程200中被標(biāo)記為“相同的”。如果確定了兩個(gè)序列是一樣的,過程200移至狀態(tài)214,其中來自數(shù)據(jù)庫的序列的名稱給使用者顯示出來。該狀態(tài)告訴使用者顯示了名稱的序列具有輸入所限制的同一性。一旦儲存序列的名稱給使用者顯示出來,過程200移至決定狀態(tài)218,作出是否在數(shù)據(jù)庫中有更多的序列的結(jié)論。如果在數(shù)據(jù)庫中沒有更多的序列,那么過程200終止于結(jié)束狀態(tài)220。然而,如果在數(shù)據(jù)庫中存在更多的序列,那么過程200移至狀態(tài)224,其中指示器移到數(shù)據(jù)庫中下一個(gè)序列,以便可以與新序列進(jìn)行比較。以這種方式,比對新序列并且與數(shù)據(jù)庫中的每一個(gè)序列進(jìn)行比較。應(yīng)當(dāng)注意,如果在決定狀態(tài)212作出了決定,序列沒有同源性,那么過程200將立即移至決定狀態(tài)218,確定在數(shù)據(jù)庫中是否有其它的序列用于比較。同樣地,發(fā)明的一方面是包括處理器,儲存有發(fā)明的核酸序列的數(shù)據(jù)存儲裝置以及用于進(jìn)行比較的序列比較軟件的計(jì)算機(jī)系統(tǒng)。序列比較器可以指示待比較序列之間的同源性水平或者鑒定結(jié)構(gòu)基元,或者可以確定與核酸密碼子和多肽密碼相比較的序列中的結(jié)構(gòu)基元。圖3是說明計(jì)算機(jī)中過程250的一個(gè)具體例子,確定是否兩個(gè)序列具有同源性的流程圖。過程250開始于起始狀態(tài)252,并且隨后移至狀態(tài)254,其中待比較的第一序列存儲于存儲器中。待比較的第二序列隨后在狀態(tài)256存儲于存儲器中。過程250然后移至狀態(tài)沈0,其中讀取第一序列的第一個(gè)字母,然后移至狀態(tài)沈2,其中讀取第二序列的第一個(gè)字母。應(yīng)當(dāng)理解如果序列是核苷酸序列,那么字母是A,T,C,G,或者U。如果序列是蛋白序列,那么字母為單個(gè)的氨基酸序列密碼,以便第一序列與第二序列可以很容易地進(jìn)行比較。 在決定狀態(tài)264作出是否兩個(gè)字母是一樣的決定。如果它們一樣,過程250移至狀態(tài)沈8, 來讀取第一和第二序列的下一個(gè)字母,然后確定是否下一個(gè)字母是相同的。如果相同,過程 250繼續(xù)該循環(huán)一直到兩個(gè)字母不同。如果確定下一個(gè)兩個(gè)字母不同,過程250移至決定態(tài)274,確定是否在序列中有任何更多的字母來讀取。如果沒有更多的字母來讀取,那么過程250移至狀態(tài)276,其中第一和第二序列的同源性水平給使用者顯示出來。同源性水平通過計(jì)算序列間的相同字母的數(shù)目占第一序列總的字母數(shù)的比例來確定。這樣,如果在第一個(gè)100個(gè)核苷酸序列中比對的每一個(gè)字母與第二序列的每一個(gè)字母一樣,同源性水平將是 100%??蛇x擇地,計(jì)算機(jī)程序可以比較參照序列與發(fā)明的序列,確定是否序列在一個(gè)或者多個(gè)位置上不同。程序可以記錄發(fā)明序列和參照序列中插入,缺失或者替換核苷酸或者氨基酸殘基的長度和同一性,計(jì)算機(jī)程序可以是確定是否參照序列與發(fā)明的序列相比含有單一核苷酸多態(tài)性(SNP),或者是否發(fā)明的序列含有已知序列的SNP的程序。這樣,在一些方面,計(jì)算機(jī)程序是鑒定SNPs的程序。該方法可以通過以上說明的計(jì)算機(jī)系統(tǒng)來完成并且該方法在圖3中有說明。該方法可以通過應(yīng)用計(jì)算機(jī)程序讀取發(fā)明序列和參照序列來進(jìn)行,并且用計(jì)算機(jī)程序來鑒定差異。另一方面,以計(jì)算機(jī)為基礎(chǔ)的系統(tǒng)包括鑒定發(fā)明的核酸或者多肽特征的鑒定器。 “鑒定器”是指一個(gè)或者多個(gè)鑒定核酸序列的一些特征的程序。例如,鑒定器可以包括鑒定核酸序列中開放閱讀框架(ORF)的程序。圖4是說明用于檢測序列中存在特征的鑒定器程序300的一個(gè)方面的流程圖。過程300起始于起始狀態(tài)302然后移至狀態(tài)304,其中待檢測特征的第一序列存儲于計(jì)算機(jī)系統(tǒng)100的存儲器115。過程300然后移至狀態(tài)306,在該狀態(tài)下,開放具有序列特征的數(shù)據(jù)庫。這樣數(shù)據(jù)庫將包括每一個(gè)特征屬性和特征名稱的菜單。例如,特征名稱可以是“起始密碼子”,特征屬性為“ATG”。另一個(gè)例子是特征名稱為 “TAATAA盒”,特征屬性為“TAATAA”。這樣的數(shù)據(jù)庫是由威斯康辛大學(xué)遺傳學(xué)計(jì)算機(jī)組制作。 可選擇地,特征可以是結(jié)構(gòu)多肽基元如α螺旋,β折疊,或者功能性多肽基元如,酶的活性位點(diǎn),螺旋一轉(zhuǎn)角一螺旋基元或者其它的技術(shù)熟練人員所熟知的基元。一旦在狀態(tài)306特征數(shù)據(jù)庫開放,過程300移至狀態(tài)308,其中第一特征從數(shù)據(jù)庫中讀取。然后在狀態(tài)310中進(jìn)行第一特征的屬性與第一序列的比較。然后在狀態(tài)316下作出決定是否在第一序列發(fā)現(xiàn)有特征的屬性。如果發(fā)現(xiàn)屬性,過程300移至狀態(tài)318,其中發(fā)現(xiàn)特征的名稱顯示給使用者。 過程300然后移至決定狀態(tài)320,在其中作出是否在數(shù)據(jù)庫中存在更多的特征的決定。如果不存在更多的特征,過程300終止于結(jié)束狀態(tài)324。然而,如果數(shù)據(jù)庫中有更多的特征,過程
40300在狀態(tài)3 讀取下一個(gè)序列特征,并且循環(huán)至狀態(tài)310,其中下一個(gè)特征的屬性與第一序列進(jìn)行比較。如果在狀態(tài)316并沒有在第一序列中發(fā)現(xiàn)特征屬性,過程300直接移至決定狀態(tài)320,作出是否有更多的特征存在于數(shù)據(jù)庫中的確定。這樣,一方面,發(fā)明提供鑒定開放閱讀框架(ORFs)的計(jì)算機(jī)程序。發(fā)明的多肽和核酸序列可以以不同的形式用不同的數(shù)據(jù)處理程序存儲并且處理。例如,序列可以以如文本的字處理文件儲存,如,Miorosoft WORD或者WORDPERFECT 或者那些技術(shù)熟練人員熟悉的不同的數(shù)據(jù)程序的ASCII文件,如,DB2, SYBASE,或者 ORACLE。此外,很多的計(jì)算機(jī)程序和數(shù)據(jù)庫可以作為序列比較算法,鑒定器,或者,參照核苷酸序列或者多肽序列的來源,與發(fā)明的核酸序列比較。用于實(shí)踐發(fā)明的程序和數(shù)據(jù)庫包括,但不限于:MacPattern (EMBL) , DiscoveryBase (Molecular Applications Group), GeneMine(Molecular Applications Group), Look(Molecular Applications Group), MacLook(Molecular Applications Group), BLAST 禾口 BLAST2(NCBI), BLASTN 和 BLASTX(Altschul et al, J. Mol. Biol. 215 :403,1990), FASTA(Pearson 禾口 Lipman, Proc. Natl. Acad. Sci. USA, 85 :2444, 1988),F(xiàn)ASTDB (Brutlag et al. Comp. App. Biosci.6 :237-245,1990), Catalyst(Molecular Simulations Inc. ), Catalyst/ SHAPE(Molecular Simulations Inc.), Cerius 2.DBAccess(Molecular Simulations Inc.), HypoGen(Molecular Simulations Inc.), Insight II, (Molecular Simulations Inc.),Discover(Molecular Simulations Inc.),CHARMm(Molecular Simulations Inc.), Felix (Molecular Simulations Inc.), (Molecular Simulations Inc.), QuanteMM, (Molecular Simulations Inc.), Homology(Molecular Simulations Inc.), Modeler (Molecular Simulations Inc.), ISIS (Molecular Simulations Inc.), Quanta/Protein Design (Molecular Simulations Inc.), WebLab(Molecular Simulations Inc.), WebLab Diversity Explorer (Molecular Simulations Inc.), Gene Explorer(Molecular Simulations Inc.), SeqFold (Molecular Simulations he.),MDL 可用的化學(xué)品目錄數(shù)據(jù)庫,MDL的藥物數(shù)據(jù)報(bào)告數(shù)據(jù)庫,綜合藥物化學(xué)數(shù)據(jù)庫(the Comprehensive Medicinal Chemistry database), Derwent' s 1 :!^ . 弓 1 -, BioByteMasterFile, Genbank數(shù)據(jù)庫,和Genseqn數(shù)據(jù)庫。很多其它的程序和數(shù)據(jù)庫對于技術(shù)熟練人員是顯然的??梢詰?yīng)用以上程序檢測的基元包括序列編碼的亮氨酸拉鏈,螺旋一轉(zhuǎn)角一螺旋基元,糖基化位點(diǎn),泛素化位點(diǎn),α螺旋,和β折疊,編碼信號肽的信號序列,信號肽引導(dǎo)編碼蛋白的分泌,轉(zhuǎn)錄調(diào)控涉及的序列,如,同源盒,酸性分枝,酶活性位點(diǎn),底物結(jié)合位點(diǎn),和酶切割位點(diǎn)。核酸的雜交發(fā)明提供可以在嚴(yán)謹(jǐn)?shù)臈l件下,與發(fā)明的典型序列,例如,在SEQ ID N0:1,SEQ ID NO 3, SEQ ID NO :5,SEQ ID NO :7,SEQ ID NO :9,SEQ ID NO :11,SBQ ID NO :13,SEQ ID NO 15, SBQ ID NO :17,SEQ ID NO :19,SBQ ID NO :21,SEQ ID NO :23,SEQ ID NO :25,SEQ ID NO 27, SEQ ID NO :29,SEQ ID NO :31,SEQ ID NO :33,SEQ ID NO :35,SEQ ID NO :37, SEQ ID NO 39, SEQ ID NO :41,SEQ ID NO :43,SEQ ID NO :45,SEQ ID NO :47,SEQ ID NO 49,SEQ ID NO :51,SEQ ID NO :53,SEQ ID NO :55,SEQ ID NO :57,SEQ ID NO :59,SEQ IDNO 61, SEQ ID NO :63,SEQ ID NO :65,SEQ ID NO :67,SEQ ID NO :69,SEQ ID NO :71,SEQ ID NO 73, SEQ ID NO :75,SEQ ID NO -Jl, SEQ ID NO :79,SEQ ID NO :81,SEQ ID NO :83, SEQ ID NO85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO :91,SEQ ID NO:93,SEQ ID NO 95,SEQ ID NO 97, SEQ ID NO 99, SEQ ID NO 101, SEQ ID NO 103, SEQ ID NO :105 中闡明的序列,或者編碼包括在 SEQ ID NO 2, SEQ ID NO :4,SEQ ID NO :6,SEQ ID NO :8,SEQ ID NO 10, SEQ ID NO :12,SEQ ID NO :14,SEQ ID NO :16,SEQ ID NO :18,SEQ ID NO :20,SEQ ID NO 22, SEQ ID NO :24,SEQ ID NO :26,SEQ ID NO :28,SEQ ID NO :30,SEQ ID NO :32, SEQ ID NO 34, SEQ ID NO :36,SEQ ID NO :38,SEQ ID NO :40,SEQ ID NO :42,SEQ ID NO 44,SEQ ID NO :46,SEQ ID NO :48,SEQ ID NO :50,SEQ ID NO :52,SEQ ID NO :54,SEQ ID NO 56, SEQ ID NO :58,SEQ ID NO :60,SEQ ID NO :62,SEQ ID NO :64,SEQ ID NO :66,SEQ ID NO 68, SEQ ID NO :70,SEQ ID NO -J2, SEQ ID NO :74,SEQ ID NO :76,SEQ ID NO :78, SEQ ID NO80,SEQ ID NO :82,SEQ ID NO:84,SEQ ID NO :86,SEQ ID NO:88,SEQ ID NO 90,SEQ ID NO :92,SEQ ID NO :94,SEQ ID NO :96,SEQ ID NO :98,SEQ ID NO :100,SEQ ID NO :102, SEQ ID NO 104, SEQ ID NO :106中闡明序列的多肽的核酸雜交的分離的或者重組的核酸。嚴(yán)謹(jǐn)條件可以是高度嚴(yán)謹(jǐn)條件,中度嚴(yán)謹(jǐn)條件,低度嚴(yán)謹(jǐn)條件,包括在此說明的高度和降低嚴(yán)謹(jǐn)性的條件。在可選擇的具體情況下,通過在嚴(yán)謹(jǐn)條件下雜交能力所定義的發(fā)明的核酸可以是大約5個(gè)殘基到全長分子之間,例如,發(fā)明的典型核酸。例如,它們的長度可以是至少 5,10,15,20,25,30,35,40,50,55,60,65,70,75,80,90,100,150,200,250,300, 350,400個(gè)殘基。比全長核酸較短的核酸也包括在內(nèi)。這些核酸可以用于如雜交探針,標(biāo)記探針,PCR寡聚核苷酸探針,iRNA(單鏈或者雙鏈),反義或者編碼抗體結(jié)合肽(抗原決定簇)的序列,基元,活性位點(diǎn)和類似物。一方面,發(fā)明的核酸通過其可以在高的嚴(yán)謹(jǐn)性條件下雜交的能力定義,高嚴(yán)謹(jǐn)性包括條件為大約37°C到42°C,大約50%的甲酰胺。一方面,發(fā)明的核酸通過其可以在降低的嚴(yán)謹(jǐn)性條件下雜交的能力定義,降低的嚴(yán)謹(jǐn)性包括條件為大約30°C到35°C,大約35%到 25%的甲酰胺??蛇x擇地,發(fā)明的核酸通過其可以在高嚴(yán)謹(jǐn)性條件下雜交的能力定義,高嚴(yán)謹(jǐn)性包括條件為42°C,50(%的甲酰胺中,5XSSPE,0. 3%的SDS,以及作為封閉核酸的重復(fù)序列,如cot-1或者鮭魚精DNA(例如,200n/ml剪切的和變性的鮭魚精DNA)。一方面,發(fā)明的核酸通過其可以在降低的嚴(yán)謹(jǐn)條件下雜交的能力定義,降低的嚴(yán)謹(jǐn)性包括條件為降低的溫度;35 °C,含有;35 %的甲酰胺。雜交以后,濾膜可以在50°C,用6XSSC,0. 5%的SDS洗膜。認(rèn)為超過25%的甲酰胺的這些條件是“中度”條件,而小于25%的甲酰胺的條件是“低度”條件?!爸卸取彪s交條件的一個(gè)特定例子是當(dāng)以上的雜交在30%的甲酰胺下進(jìn)行?!暗蛧?yán)謹(jǐn)性”的特定例子是當(dāng)上述雜交在10%的甲酰胺下進(jìn)行。與特定水平的嚴(yán)謹(jǐn)性相對應(yīng)的溫度范圍可以進(jìn)一步通過計(jì)算該核酸中嘌呤與嘧啶的比例來細(xì)化,并且相應(yīng)地調(diào)節(jié)溫度。發(fā)明的核酸也通過其可以在Ausubel和Sambrook 中所述的高度,中度,低度嚴(yán)謹(jǐn)性條件下雜交的能力來定義。以上范圍和條件的變化為技術(shù)熟練人員所熟悉,雜交條件在以下有進(jìn)一步的討論。寡聚核苷酸探針和應(yīng)用方法發(fā)明也提供用于鑒定編碼具有磷脂酶活性的多肽的核酸的核酸探針。一方面,探針包括在 SEQ ID NO 1, SEQ ID NO :3,SEQ ID NO :5,SEQ ID NO -J, SEQ ID NO :9,SEQ ID NO 11,SEQ ID NO :13,SEQ ID NO :15,SEQ ID NO :17,SEQ ID NO :19,SEQ ID NO :21,SEQ ID NO 23, SEQ ID NO :25,SEQ ID NO :27,SEQ ID NO :29,SEQ ID NO :31,SEQ ID NO :33, SEQ ID NO 35, SEQ ID NO :37,SEQ ID NO :39,SEQ ID NO :41,SEQ ID NO :43,SEQ ID NO 45,SEQ ID NO :47,SEQ ID NO :49,SEQ ID NO :51,SEQ ID NO :53,SEQ ID NO :55,SEQ ID NO 57, SEQ ID NO :59,SEQ ID NO :61,SEQ ID NO :63,SEQ ID NO :65,SEQ ID NO :67,SEQ ID NO 69, SEQ ID NO -Jl, SEQ ID NO :73,SEQ ID NO :75,SEQ ID NO -Jl, SEQ ID NO :79, SEQ ID NO81,SEQ ID NO:83,SEQ ID NO:85,SEQ ID NO :87,SEQ ID NO:89,SEQ ID NO 91,SEQ ID NO :93,SEQ ID NO :95,SEQ ID NO :97,SEQ ID NO :99,SEQ ID NO :101,SEQ ID NO :103, SEQ ID NO :105中闡明的序列的至少10個(gè)連續(xù)堿基??蛇x擇地,發(fā)明的探針可以是發(fā)明的序列中所闡明的序列的至少大約5,6,7,8,9,10,11,12,13,14,15,16,17,18,19, 20,21,22,23,24,25,30,35,40,50,55,60,65,70,75,80,90,100,150,大約 10 到 50,大約 20 到60,大約30到70個(gè)連續(xù)堿基。探針通過結(jié)合或者雜交來鑒定核酸。探針可以用于本發(fā)明的陣列中,見以下討論,包括,例如,毛細(xì)管陣列。發(fā)明的探針也可以用于分離其它的核酸或者多肽。發(fā)明的探針可以用于確定是否生物樣品,如土壤樣品,含有具有發(fā)明的核酸序列的生物或者含有核酸來源的生物。在這一程序中,獲得潛在地隱藏了從其中分離核酸的生物體的生物樣品,并且從樣品中獲得核酸。核酸在允許探針與樣品中存在的任何互補(bǔ)序列特異雜交的條件下與探針接觸。如果必要,探針與互補(bǔ)序列特異雜交的條件可以通過將探針與已知含有互補(bǔ)序列核酸的樣品中的互補(bǔ)序列接觸來確定,同時(shí)對照序列為不含有互補(bǔ)序列??梢愿淖冸s交條件,如雜交緩沖液中的鹽濃度,雜交緩沖液中的甲酰胺濃度,或者雜交溫度,來使得探針特異性地與互補(bǔ)的核酸序列雜交(見,特異雜交條件的討論)。如果樣品中含有核酸自其中分離的生物,檢測探針特異的雜交。雜交可以通過用檢檢測劑,如放射性同位素,熒光染料或者可以催化形成可檢測產(chǎn)物的酶,標(biāo)記探針進(jìn)行檢測。應(yīng)用標(biāo)記的探針來檢測在樣品中存在互補(bǔ)的核酸的很多方法為技術(shù)熟練人員所熟悉。 這些方法包括Southern印跡,Northern印跡,菌落雜交程序,以及斑點(diǎn)印跡雜交。每一個(gè)程序的具體方法參見Ansubel和Sambrook。可選擇地,多于一個(gè)探針(至少一種可以與存在于核酸樣品中的任何互補(bǔ)序列雜交的探針)可以在擴(kuò)增反應(yīng)中使用,確定是否樣品中含有具有發(fā)明的核酸序列的生物(如, 核酸自其中分離的生物)。一方面,探針包括寡核苷酸。一方面,擴(kuò)增反應(yīng)可以包括PCR反應(yīng)。PCR的具體方法在Ansubel和Sambrook的書中有說明(參見擴(kuò)增反應(yīng)的討論)。在這樣的程序中,樣品中的核酸與探針接觸,進(jìn)行擴(kuò)增反應(yīng),檢測得到的任何擴(kuò)增產(chǎn)物。擴(kuò)增產(chǎn)物可以通過反應(yīng)產(chǎn)物進(jìn)行凝膠電泳來檢測,并且用如溴乙啶的插入試劑來染膠??蛇x擇的, 一個(gè)或者多個(gè)探針可以用放射性同位素標(biāo)記,并且在凝膠電泳后,通過放射自顯影檢測是否存在放射性標(biāo)記的擴(kuò)增產(chǎn)物。來源于發(fā)明的核酸序列的近3’或者5’端的探針也可以用染色體步行程序來確定含有另外的,如基因組序列的克隆。這樣的方法允許從宿主生物體中分離編碼另外感興趣蛋白的基因。一方面,發(fā)明的核酸作為探針鑒定和分離相關(guān)的核酸。在一些方面,這樣確定的相關(guān)核酸可以是來自于非發(fā)明核酸首次自其中分離的生物體的cDNA或者基因組DNA,通過這樣的程序,核酸樣品與探針在允許探針特異地與相關(guān)序列雜交的條件下接觸。探針與來源于相關(guān)生物體的核酸雜交后,應(yīng)用以上說明的任何方法來檢測。在核酸雜交反應(yīng)中,用于達(dá)到特定嚴(yán)謹(jǐn)性水平的條件可以根據(jù)待雜交核酸的性質(zhì)來進(jìn)行改變。例如,在選擇雜交條件中要考慮長度,互補(bǔ)水平,核酸雜交區(qū)域的核苷酸序列組成(如,GC對AT含量的比率),以及核酸類型(如,RNA對DNA)。另外考慮是否核酸中的一個(gè)是固定于,如濾膜上。雜交可以在低嚴(yán)謹(jǐn)性,中度嚴(yán)謹(jǐn)性或者高嚴(yán)謹(jǐn)性的條件下進(jìn)行。作為核酸雜交的一個(gè)例子,含有固定的變性的核酸的多聚膜首先在45°C下,在含有0. 9M NaCl, 50mM NaH2PO4,PH 7. 0,5. OmM Na2EDTA, 0.5% SDS, 10XDenhardt ‘ s 和 0.5mg/ml 多核腺苷酸的溶液中預(yù)雜交30分鐘。大約2X 107cpm(特異活性4_9X 108cpm/ug)的32P末端標(biāo)記的寡聚核苷酸探針加入到溶液中。在12-16小時(shí)的溫育以后,膜在室溫(RT)下于含有 0. 5% SDS 的 lXSET(150mM NaCl, 20mM Tris 鹽酸,PH 7. 8,ImM Na2EDTA)中洗滌 30 分鐘, 然后在新鮮配制的IX SET,寡聚核苷酸探針的Tm-10°C下,再洗滌30分鐘。然后將膜暴露于自顯影膠片上來檢測雜交信號。通過改變鑒定核酸,如可以與探針雜交的cDNA或者基因組DNA,時(shí)所用的雜交條件的嚴(yán)謹(jǐn)性,可以鑒定和分離與探針具有不同同源性水平的核酸。嚴(yán)謹(jǐn)性變化可以通過在低于探針熔鏈溫度的改變溫度下進(jìn)行雜交來進(jìn)行。熔鏈溫度Tm,是(在確定的離子強(qiáng)度和PH值的條件下)50%的靶序列與完全互補(bǔ)探針雜交的溫度。對于特定的探針, 非常嚴(yán)謹(jǐn)性的條件是選擇等于或者低于特定探針Tm值5°C。探針的熔鏈溫度可以通過以下的經(jīng)驗(yàn)公式計(jì)算。對于長度為14到70個(gè)核苷酸長度的探針,熔鏈溫度(Tm)的計(jì)算應(yīng)用以下公式=Tm = 81. 5+16. 6 (log[Na+])+0. 41 (G+C 部分)-(600/N),其中 N 是探針的長度。如果雜交是在含有甲酰胺的溶液中進(jìn)行,熔鏈溫度的計(jì)算用以下的公式=Tm = 81. 5+16. 6 (log[Na+] )+0. 41 (G+C 部分)-(0. 63 % 甲酰胺)-(600/N)其中 N 是探針的長度。 預(yù)雜交可以在6 X SSC, 5 X Denhardt ‘ s試劑,0. 5% SDS, 100 μ g變性的鮭魚精DNA片段或者6XSSC,5XDenhardr' s試劑,0. 5% SDS,100 μ g變性的鮭魚精DNA片段,50%甲酰胺中進(jìn)行。SSC和Denhardt' s以及其它溶液的配方見,例如,Sambrook。雜交是通過加入可檢測到的探針于以上所列的預(yù)雜交溶液中進(jìn)行,其中的探針包括雙鏈DNA。探針在加入到雜交溶液之前先要進(jìn)行變性。濾膜首先與雜交溶液充分接觸一段時(shí)間,使得探針與含有互補(bǔ)序列或者同源序列的cDNA或者基因組DNA雜交。對于長度超過200個(gè)核苷酸的探針,雜交在比Tm低15到25°C進(jìn)行。對于較短的探針如寡聚核苷酸探針,雜交在比Tm低5到10°C進(jìn)行。一方面,在6X SSC中,大約是68°C進(jìn)行雜交。一方面, 在含有50%甲酰胺的溶液,溫度大約為42°C進(jìn)行雜交。認(rèn)為前述的所有雜交認(rèn)為是在高嚴(yán)謹(jǐn)性條件下進(jìn)行。雜交以后,濾膜洗滌去除任何非特異結(jié)合的可以檢測到的探針。洗膜所用的嚴(yán)謹(jǐn)性也可以根據(jù)雜交的核酸的性質(zhì),雜交核酸的長度,互補(bǔ)的程度,核苷酸序列的組成(如, GC對AT的含量),以及核酸類型(如,RNA對DNA)來進(jìn)行變化。逐漸增高嚴(yán)謹(jǐn)性條件的洗膜例子如下2XSSC,室溫下0. SDS 15分鐘,(低嚴(yán)謹(jǐn)性);0. 1 X SSC,室溫下0. 5% SDS30分鐘到1小時(shí)(中度嚴(yán)謹(jǐn)性);0. 1XSSC,0. 5% SDS,雜交溫度和68°C之間15到30 分鐘(高嚴(yán)謹(jǐn)性);0. 15M NaCl,在72°C下15分鐘(很高嚴(yán)謹(jǐn)性),最后低嚴(yán)謹(jǐn)性洗滌可以在0.1 X SSC室溫下進(jìn)行。以上的例子僅僅是用于洗膜的一系列條件。技術(shù)熟練人員應(yīng)該了解對于不同嚴(yán)謹(jǐn)性的洗滌有很多不同的方法(recipes)??梢耘c探針雜交的核酸可以通過放射自顯影或者其它傳統(tǒng)的技術(shù)來確定。可以改變以上的程序來鑒定具有與探針序列具有降低的同源性水平的核酸。例如為了獲得與探針序列具有降低的同源性水平的核酸,可以應(yīng)用不太嚴(yán)謹(jǐn)?shù)臈l件。例如,在含有Na+濃度為大約IM的雜交緩沖液中,雜交溫度可以從68°C到42°C以5°C的幅度降低。雜交后,濾膜用 2XSSC,0.5% SDS在雜交溫度下洗膜。認(rèn)為高于50°C的條件為“中度”條件,低于50°C的條件為“低度”條件?!爸卸取彪s交條件的一個(gè)例子是當(dāng)以上的雜交在55°C的條件下進(jìn)行。 “低嚴(yán)謹(jǐn)性”雜交條件的一個(gè)例子是當(dāng)以上的雜交在45°C的條件下進(jìn)行??蛇x擇地,雜交在緩沖液,如含有甲酰胺的6X SSC中,在42°C下進(jìn)行。在這種情況下,雜交緩沖液中甲酰胺的濃度可以以5 %的幅度從50 %降低到0 %來確定對探針具有降低的同源性水平的克隆。雜交后,濾膜可以用6 X SSC,0. 5 % SDS在50°C下洗滌,認(rèn)為當(dāng)甲酰胺濃度大于25%為“中度”條件,而低于25%為“低度”條件?!爸卸取彪s交條件的一個(gè)例子是當(dāng)以上的雜交在30%的甲酰胺中進(jìn)行?!暗蛧?yán)謹(jǐn)性”雜交條件的一個(gè)例子是當(dāng)以上的雜交在10%的甲酰胺中進(jìn)行。發(fā)明的這些探針和方法可以用于分離具有與發(fā)明的核酸序列有至少大約99%, 98%,97%,至少95%,至少90%,至少85%,至少80%,至少75%,至少70%,至少65%, 至少60 %,至少55 %,或者至少50 %的序列同源性的序列的核酸,該核酸包括至少大約10, 15,20,25,30,35,40,50,75,100,150,200,250,300,350,400,或者 500 個(gè)連續(xù)的堿基和與之互補(bǔ)的序列。同源性可以應(yīng)用在此所述的比對算法測定。例如,同源的多聚核苷酸可以具有在此說明的一個(gè)編碼序列的天然發(fā)生等位基因突變體的編碼序列。這樣的等位基因突變體與發(fā)明的核酸比較,可以具有取代,缺失或者插入一個(gè)或者多個(gè)核苷酸。此外,發(fā)明的探針和方法可以用于分離編碼與發(fā)明多肽具有至少大約99%,至少 95%,至少90%,至少85%,至少80%,至少75%,至少70%,至少65%,至少60%,至少 55%,,或者至少50%的序列同一性(同源性)的多肽的核酸,應(yīng)用序列比對算法(如,使用默認(rèn)參數(shù)的FASTA版本3. 0t78的算法,或者具有在此闡明的典型設(shè)置的BLAST 2. 2. 2程序)確定的,該多肽具有其至少5,10,15,20,25,30,35,40,50,75,100,或者150個(gè)連續(xù)的氨基酸。抑制磷脂酶的表達(dá)發(fā)明進(jìn)一步提供與發(fā)明的核酸序列如磷脂酶編碼核酸互補(bǔ)的核酸(如,反義序列)。反義序列可以抑制磷脂酶編碼基因的轉(zhuǎn)運(yùn),剪接或者轉(zhuǎn)錄。抑制可以通過靶向基因組DNA或者信使RNA起作用。靶核酸的轉(zhuǎn)錄或者功能可以被抑制,例如,通過雜交和/或切割。發(fā)明提供的特別有效的一套抑制物包括可以結(jié)合磷脂酶基因或者信使PNA的寡聚核苷酸,在每一種情況下,阻止或者抑制磷脂酶的產(chǎn)生或者功能。結(jié)合是通過序列特異性的雜交實(shí)現(xiàn)的。另一類有用的抑制物包括引起磷脂酶信使RNA失活或者切割的寡聚核苷酸。寡聚核苷酸可以具有引起切割的酶活性,如核酶。寡聚核苷酸可以通過化學(xué)修飾或者接合到可以切割互補(bǔ)核酸的酶或成分上。操作人員可以從很多不同的此類寡聚核苷酸所構(gòu)成的文庫中篩選出具有所需活性的這樣寡聚核苷酸。磷脂酶表達(dá)的抑制可以具有多種不同的工業(yè)用途。例如,抑制磷脂酶的表達(dá)可以減慢或者阻止酸敗。當(dāng)脂類或多肽,如,結(jié)構(gòu)脂類或者多肽,被酶降解時(shí),可能發(fā)生酸敗。這可以導(dǎo)致水果和蔬菜的變質(zhì)或者腐敗。一方面,應(yīng)用可以抑制磷脂酶的表達(dá)和/或活性的本發(fā)明的組分,例如,抗體,反義寡聚核苷酸,核酶和RNAi可以用于減緩或者阻止酸敗。這樣,一方面,發(fā)明提供包括應(yīng)用于植物或者植物產(chǎn)品(如,水果,種籽,根,葉,等等)的方法和組分的本發(fā)明的抗體,反義寡聚核苷酸,核酶和RNAi,用于阻止或者延緩酸敗。這些組分也可以由植物表達(dá)(如,轉(zhuǎn)基因植物)或者其它生物(如,用本發(fā)明的磷脂酶基因轉(zhuǎn)化的細(xì)菌或者其它微生物)。用于抑制磷脂酶表達(dá)的本發(fā)明的組分(如反義,iRNA,核酶,抗體)可以作為藥物的組分。反義寡聚核苷酸發(fā)明提供可以結(jié)合磷脂酶信使的反義寡聚核苷酸,反義寡聚核苷酸可以通過靶向 mRNA來抑制磷脂酶活性。設(shè)計(jì)反義寡聚核苷酸的策略在科學(xué)和專利文獻(xiàn)中有說明,并且技術(shù)熟練人員可以應(yīng)用發(fā)明的新試劑設(shè)計(jì)這樣的磷脂酶寡聚核苷酸。例如,基因步行/RNA 作圖方法來篩查有效的反義寡聚核苷酸為技術(shù)熟練人員所了解,見,如,Ho (2000)Methods Enzymo 1. 314 168-183,描述了 RNA圖譜分析,RNA圖譜分析以標(biāo)準(zhǔn)的分子技術(shù)為基礎(chǔ),給有效的反義序列的篩選提供了簡易的和可靠的方法。也見Smith(2000)Eur. J. Pharm. Sci. 11 191-198。也可以應(yīng)用天然產(chǎn)生的核酸作為反義寡聚核苷酸。反義寡聚核苷酸可以是任何長度;例如,在可選擇的方面,反義寡聚核苷酸在大約5到100,大約10到80,大約15到60, 大約18到40之間。優(yōu)化的長度可以通過常規(guī)的篩查來確定。反義寡聚核苷酸可以以任何濃度存在。優(yōu)化的濃度可以通過常規(guī)的篩查來確定。已知有許多合成的,非天然產(chǎn)生的核苷和核酸類似物可以解決潛在的問題。例如,可以應(yīng)用含有非離子性骨架,如N-(2-氨基乙基)甘氨酸單位的肽核酸(PNAs)。也可以應(yīng)用具有磷硫連接的反義寡聚核苷酸,如,WO 97/03211 ;WO 96/39154 所述;Mata (1997) ^Toxicol Appl Pharmacol 144 :189-197 ;反義治療學(xué),ed. Agrawal (Humana Press, Totowa, N. J. , 1996) 發(fā)明提供的具有合成的DNA骨架類似物的反義寡聚核苷酸也可以包括磷-二硫,甲基磷酸,磷阿米酮,烷基磷三酯,氨基磺酸鹽,3’ -硫代乙縮醛,甲叉(甲基亞胺),3' -N-氨基甲酸酯劑,和嗎啉代氨基甲酸酯核酸, 如以上所述??梢詰?yīng)用組合化學(xué)的方法產(chǎn)生大量的寡核苷酸,這些寡核苷酸是可以快速篩選對任何靶具有適當(dāng)結(jié)合親和性和特異性的寡聚核苷酸,如發(fā)明的有義和反義的磷脂酶序列 (見,如,Gold(1995) J. of Biol. Chem. 270 :13581-13584)。抑制性核酶發(fā)明提供可以結(jié)合磷脂酶信使的核酶,其可以通過靶向mRNA來抑制磷脂酶的酶活性。設(shè)計(jì)核酶和選擇用于靶向的磷脂酶特異的反義序列在科學(xué)和專利文獻(xiàn)中有說明,并且技術(shù)熟練人員可以應(yīng)用發(fā)明的新試劑設(shè)計(jì)這樣的核酶。核酶通過核酶的靶RNA結(jié)合部分結(jié)合靶RNA起作用,核酶的靶RNA結(jié)合部分靠近RNA的酶活部分,酶活部分切割靶RNA。這樣,核酶通過互補(bǔ)的堿基配對識別并且結(jié)合靶RNA,并且一旦結(jié)合于正確的位點(diǎn),將以酶的方式來切割并且使靶RNA失活。如果切割發(fā)生在編碼序列,以這種方式的靶RNA的切割將破壞其引發(fā)編碼蛋白合成的能力。當(dāng)核酶結(jié)合并且切割其靶RNA后,一般情況下,將從RNA上釋放,然后對新的靶重復(fù)結(jié)合和切割過程。在一些情況下,核酶的酶本質(zhì)決定了其比其它技術(shù)如反義技術(shù)(其中核酸分子簡單地結(jié)合于核酸靶來阻止其轉(zhuǎn)錄,翻譯或者與其它分子的結(jié)合)更優(yōu)越,因?yàn)樽鳛橹委熖幚碛行У谋匾暮嗣傅幕钚詽舛鹊陀诜戳x寡聚核苷酸的濃度。這一潛在的優(yōu)點(diǎn)反映了核酶可以以酶的方式起作用的能力。這樣,單一的核酶分子可以切割靶RNA的很多分子。此外, 核酶是典型的高度特異性的抑制劑,其抑制的特異性不僅僅依賴于結(jié)合的堿基配對機(jī)制, 也依賴于分子抑制其結(jié)合的RNA表達(dá)的機(jī)制。即,抑制是通過切割RNA靶來引起的,并且特異性是通過切割的靶RNA的切割率占切割的非靶RNA中的切割率的比率來確定。這一切割機(jī)制依賴于涉及堿基配對的另外的因子。這樣,核酶的特異性作用高于結(jié)合于同一個(gè)RNA 位點(diǎn)的反義寡聚核苷酸。具有酶活的核酶RNA分子可以形成錘頭基元,但是也可以形成發(fā)夾,肝炎δ病毒,I類內(nèi)含子或者toaseP樣的RNA(與RNA的引導(dǎo)序列有關(guān))基元。這樣的錘頭基元的例子在 Rossi (1992)Aids Research and Human Retroviruses 8 :183 中有說明;發(fā)夾基元在 Hampel(1989)Biochemistry 28 :4929,禾口 Hampel(1990)Nuc. Acids Res. 18 :299 中有說明;肝炎δ病毒基元在Perrotta(1992)Biochemistry 31 :16中有說明;RNaseP基元在 Guerrier-Takada(1983)Cell 35 :849 中有說明;并且 I 類內(nèi)含子在 Cech U. S. Pat. No. 4, 987,071中有說明。列舉這些特異基元的目的不是在于對此進(jìn)行限制;技術(shù)熟練人員可以認(rèn)識到本發(fā)明的酶RNA分子具有與一個(gè)或者多個(gè)靶基因RNA區(qū)域互補(bǔ)的特異性底物結(jié)合位點(diǎn),并且在底物結(jié)合位點(diǎn)中或者周圍具有賦予該分子的RNA切割活性的核苷酸序列。RNA 干涉(RNAi)一方面,發(fā)明提供包括發(fā)明的磷脂酶序列的RNA抑制分子,叫做“RNAi”分子。 RNAi分子包括雙鏈RNA(dsRNA)分子。RNAi可以抑制磷脂酶基因的表達(dá)。一方面,RNAi是長度為大約15,16,17,18,19,20,21,22,23,24,25或者更長的雙螺旋核苷酸。雖然發(fā)明并不受限于任何特別的作用機(jī)理,但是RNAi可以進(jìn)入細(xì)胞,并且造成相似或相同序列的單鏈 RNA(ssRNA),包括內(nèi)源性mRNA的降解。當(dāng)細(xì)胞暴露于雙鏈RNA (dsANA)時(shí),來自同源基因的 mRNA被選擇性地被降解,該過程叫做RNA干涉(RNAi)。RNAi背后的可能的基本機(jī)理是與特異的基因序列配對的雙鏈RNA(dsANA)斷裂形成短片段,叫做短干擾RNA,這些短片段可以觸發(fā)與其序列配對的mRNA的降解。一方面,發(fā)明的RNAi在基因沉默治療中使用,見,例如 Shuey (2002) Drug Discov. Today 7 :1040_1046。一方面,發(fā)明提供使用發(fā)明的 RNAi 選擇性降解RNA的方法。該方法可以在體外,離體或在體內(nèi)進(jìn)行。一方面,發(fā)明的RNAi分子可以用于在細(xì)胞,器官或動(dòng)物內(nèi)產(chǎn)生功能缺失的突變。產(chǎn)生和使用RNAi分子選擇性降解RNA的方法在本領(lǐng)域眾所周知,見,例如美國專利號6,506,559 ;6, 511,824 ;6, 515, 109 ;6, 489, 127。核酸修飾本發(fā)明提供產(chǎn)生發(fā)明的核酸的變異體的方法,例如,那些編碼磷脂酶的核酸。這些方法可以重復(fù)或者在不同的組合中使用,產(chǎn)生與模板核酸編碼的磷脂酶相比具有改變的或不同活性或者改變的或不同穩(wěn)定性的磷脂酶。這些方法也可以重復(fù)或者在不同的組合中使用,例如,產(chǎn)生基因/信息表達(dá),信息翻譯或者信息穩(wěn)定性的變異。另一方面,細(xì)胞的遺傳組分可以通過,例如離體的同源基因修飾,然后再插入細(xì)胞中而加以改變。本發(fā)明的核酸可以通過任何方法改變。例如,無規(guī)則或隨機(jī)方法,或者,非隨機(jī)方
47法,或者“定向進(jìn)化”方法?;虻碾S機(jī)突變的方法在技術(shù)上眾所周知,見,例如,美國專利號5,830,696。例如,誘變劑可以用于隨機(jī)突變基因。誘變劑包括,例如,紫外線或者Y-輻射,或者化學(xué)誘變劑,例如,絲裂霉素,亞硝酸,光致活性補(bǔ)骨脂素,它們單獨(dú)使用或組合使用,誘導(dǎo)可以通過重組修復(fù)的可修復(fù)DNA斷裂。別的化學(xué)誘變劑包括,例如,重亞硫酸鈉,亞硝酸,羥胺,胼或者甲酸。別的誘變劑是核苷酸前體的類似物,例如,亞硝基胍,5-溴尿嘧啶,2-氨基嘌呤,或者吖啶氮蒽。這些試劑可以在PCR反應(yīng)時(shí)代替核苷酸前體加入,從而把序列變異。嵌入試劑例如原黃素,吖啶黃,阿的平等等也可以使用。任何分子生物學(xué)技術(shù)都可以使用,例如,隨機(jī)PCR誘變,見,例如,Rice (1992) Proc. Natl. Acad. Sci. USA 89 :5467-5471 ;或者組合多重盒式誘變,見,例如 Crameri (1995) Biotechniques 18 194-196。做為選擇,核酸,例如,基因,可以在隨機(jī)分裂后重新裝配,見, 例如,美國專利號 6,291,242 ;6,287,862 ;6,287,861 ;5,955,358 ;5,830,721 ;5,824,514 ; 5,811,238 ;5,605,793??蛇x擇的方面,可以通過錯(cuò)誤傾向PCR,重排,寡核苷酸一定向的誘變,裝配PCR,有性PCR誘變,體外誘變,盒式誘變,回歸整體誘變,指數(shù)整體誘變,位點(diǎn)專一誘變,基因重裝配,基因位點(diǎn)飽和誘變(GSSW),合成的連接重裝配(SLI ),重組,回歸序列重組,磷硫修飾的DNA誘變,含有尿嘧啶的模板誘變,缺口雙螺旋誘變,點(diǎn)錯(cuò)配修復(fù)誘變,修復(fù)缺失宿主株變異,化學(xué)誘變,放射產(chǎn)生的誘變,缺失誘變,限制選擇誘變,限制純化誘變, 人造基因合成,整體誘變,嵌合核酸多聚體產(chǎn)生,和/或這些方法和別的方法的組合導(dǎo)入修飾,添加或缺失。以下出版物描述了多種可以與發(fā)明的方法結(jié)合的回歸重組程序和/或方法Stemmer (1999) "Molecular breeding of viruses for targeting and other clinical properties,,Tumor Targeting 4 1-4, Ness(1999)Nature Biotechnology 17 :893-896, Chang(1999) "Evolution of a cytokine using DNA family ShufflingnNature Biotechnology 17 :793-797,65 Minshull(1999) "Protein evolution by molecular breeding,,Current Opinion in Chemical Biology 3 :284-290, Christians (1999)"Directed evolution of thymidine kinase for AZT phosphorylation using DNA family shuffling”Nature Biotechnology 17 :259-264,Crameri(1998) “DNA shuffling of a family of genes from diverse species accelerates directed evolutionnNature 391 :288-291,Crameri(1997) "Molecular evolution of an arsenate detoxification pathway by DNA shuffling,,,Nature Biotechnology 15 :436-438, Zhang (1997)"Directed evolution of an effective fucosidase from a.galactosidase by DNA shuffling and screening"Proc. Natl. Acad. Sci. USA 94 :4504-4509, Patten et al. (1997)"Applications of DNA Shuffling to Pharmaceuticals and Vaccines"Current Opinion in Biotechnology 8 :724-733, Crameri et al. (1996) "Construction and evolution of antibody-phage libraries by DNA shuffling,,Nature Medicine 2 100-103, Crameri et ai. (1996) "Improved green fluorescent protein by molecular evolution using DNA shuffling,,Nature Biotechnology 14 :315-319, Gates et al. (1996) "Affinity selective isolation of ligands from peptide libraries through display on a lac repressor ' headpiece dimer" , Journal of MolecularBiology 255 :373-386, Stemmer (1996) “Sexual PCR and Assembly PCR,,In :The Encyclopedia of Molecular Biology. VCH Publishers,New York. pp. 447-457, Crameri and Stemmer(1995) “Combinatorial multiple cassette mutagenesis creates all the permutations of mutant and wildtype cassettes,,Bio Techniques 18:194-195, Stemmer et al. (1995) “Single-step assembly of a gene and entire plasmid form large numbers of oligodeoxyobonucleotides,,Gene,164 :49-53, Stemmor (1995) “The Evolution of Molecular Computation,,Science 270:1510,Stemmer (1995) "Searching Sequence Space,,Bio/Technology 13 :549-553 ;Stemmer(1994) “Rapid evolution of a protein in vitro by DNA shuffling"Nature 370 :389-391, and Stemmer(1994) "DNA shuffling by random fragmentation and reassembly :In vitro recombination for molecular evolution. ” Proc. Natl. Acad. Sci. USA 91 :10747-10751.
產(chǎn)生多樣性的誘變方法包括,例如定向誘變(Ling et al. (1997) "Approashes to DNA mutagenesis :an overview,,Anal Biochem. 254 (2) :157-178 ;Dale et al. (19 96) “OligonucIeotide-directed random mutagenesis using the phosphorothioate method”Methods Mol.Biol.57 :369-374, Smith(1985) “In vitro mutagenesis"Ann. Rev.Genet. 19 :423-462, Botstein& Shortle(1985) “Strategies and applications of in vitro mutagenesis ' Science 229:1193-1201, Carter(1986) "Site-directed mutagenesis “ Biochem.J.237 1-7 ;and Kunkel (1987) “The efficiency of oligonucleotide directed mutagenesis,,in Nucleic Acids& Molecular Biology (Eckstein, F. and Lilley, D. M. J. eds. , Springer Verlag,Berlin));使用含尿啼陡的模板進(jìn)行誘變(kunkel (1985) “Rapid and efficient site-specific mutagenesis without phenotypic selection”,Proc. Natl. Acad. Sci. USA 82 :488-492, Kunkel et al. (1987) “Rapid and efficient site-specific mutagenesis without phenotypic selection"Methods in Enzymol. 154,367-382, and Bass et al. (1988) "Mutant Trp repressors with new DNA-binding specificities" Science 242 :240_245),寡核苷 M ^ ^ (Methods in Enzymol. 100 :468-500(1983), Methods in Enzymol. 154 329-350 (1987),Zoller & Smith (1982)"Oligonucleotide-directed mutagenesis using M13-derived vectors :an efficient and general procedure for the production of point mutations in any DNA fragment,,Nucleic Acids Res. 10 :6487-6500, Zoller & Smith(1983) "Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13 vectors"Methods in Enzymol. 100 :468-500, and Zoller & Smith(1987) “01 igonucleotide-directed mutagenesis :a simple method using two oligonucleotide primers and a single-stranded DNA template,,Methods in Enzymol. 154 :329-350); iMMMM^i DNA (Taylor et al. (1985) “The use of phosphorothioate-modified DNA in restriction enzyme reactions to prepare nicked DNA,,Nucl. Acids Res. 13 8749-8764, Taylor et al. (1985)"The rapid generation of οligonucleotide-directed mutations at high frequency using phosphorothioate-modif ied DNA,,Nuc1. Acids Res. 13 :8765-8787 (1985) ;Nakamaye (1986) "Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application tooligonucleotide-directed mutagenesis,,Nucl. Acids Res. 14 :9679-9698, Sayers et al. (1988) "Y_T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis^Nucl. Acids Res. 16 :791-802,and Sayers et al. (1988) “Strand specific cleavage of phosphorothioate-containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide,,Nucl. Acids Res. 16 :803-814); 使用有缺口的雙螺旋 DNA 進(jìn)行誘變(Kramer et al. (1984) “The gapped duplex DNA approach to oligonucleotide-directed mutation construction,,Nucl. Asids Res. 12 9441-9456 ;Kramer&Fritz (1987)Methods in Enzymo1. "01igonucleotide-directe d construction of mutations via gapped duplex DNA,,154:350-367 ;Kramer et al. (1988) “improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construction of mutations,,Nuc 1. Acids Res. 16 :7207 ;and Fritz et al. (1988) "Oligonucleotide-directed construction of mutations :a gapped duplex DNA procedure without enzymatic reactions in vitro" Nucl. Acids Res. 16 :6987-6999).發(fā)明的方法中使用的另外方案包括點(diǎn)錯(cuò)配修復(fù)(Kramer(1984) "Point Mismatch Repair”Cell 38 :879-887),使用修復(fù)缺陷宿主菌株進(jìn)行誘變(Carter et al. (1985) “Improved oligonucleotide site-directed mutagenesis using M13 vectors" Nucl. Acids Res. 13 :4431-4443,禾口 Carter (1987) “Improved oligonucleotide-directed mutagenesis using M13 veotorsMethods in Enzymo1. 154 382-403),缺失誘變(Eghtedarzadeh (1986) “Use of oligonucleotides to generate large deletions Vucl. Asids Res. 14 :5115),選擇限制和選擇限制和純化限制(Wells et al. (1986) "Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin”Phil.Trans.K Soc. Lond. A 317 :415-423),通過全基因合成進(jìn)行誘變(Nambiar et al. (1984) "Total synthesis and cloning of a gene coding for the ribonuclease S protein^Science 223 :1299-1301 ;Sakamar and Khorana (1988)"Total synthesis and expression of a gene for the α -subunit of bovine rod outer segment guanine nucleotide-binding protein(transducin),,Nucl.Asids Res. 14 6361-6372, Wells et al. (1985) “Cassette mutagenesis :an efficient method for generation of multiple mutations at defined sites,,Gene 34 :315_323,禾口Gnmdstrom et al. (1985) "Oligonucleotide-directed mutagenesis by microscale ^shot-gun'gene synthesis"Nucl. Asids Res. 13 :3305-3316),雙鏈斷裂修復(fù)(Mandecki (1986), Arnold(1993) "Protein engineering for unusual environments,,Current Opinion in Biotechnology 4 :450455. "Oligonucleotides directed double-strand break repair in plasmids of Escherichia coli :a method for site-specific mutagenesis,,Proc· Natl. Acad. Sci. USA,83 :7177-7181)。以上許多方法的另外細(xì)節(jié)可以在Methods in Enzymology Volume 1 中找到,此書也描述了針對不同誘變方法的故障檢測問題的有用控制。也參見Stemmer 的美國專利 5,605,793 (Feb. 25,1997),“Methods for In Vitro Recombination ;,、temmer 等人的美國專利 5,811,238 (S印.22,1998) “Methodsfor Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination ;,、temmer 等人的美國專利 5,830,721 (Nov. 3,1998), "DNA Mutagenesis by Random Fragmentation and Reassembly ;,,Stemmer 等人的美國專禾Ij 5,834,252 (Nov. 10,1998) “End—Complementary Polymerase Reaction ; ” Minshull 等人的美國專利 5,837,458(Nov. 17,1998),“Methods and Compositions for Cellular and Metabolic Engineering ; ” WO 95/22625,Stemmer 禾口 Cramen,“Mutagenesis by Random Fragmentation and Reassembly ; ”Stemmer 禾口 Lipschutz 的 WO 96/33207 “End Complementary Polymerase Chain React ion ;,,Stemmer 禾口 Crameri 的 WO 97/20078"Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination ; ”Mmshull 禾口 Stemmor 的 WO 97/35966, "Methods and Compositions for Cellular and Metabolic Engineering ;,,Punnonen ^AWWO 99/41402 "Targeting of Genetic Vaccine Vectors ; " Punnonen ^AW WO 99/41 383 "Antigen Library Immunization ; " Punnonen ^AW WO 99/41369 "Genetic Vaccine Vector Engineering ; ”Punnonen 等人的 WO 99/41368 “Optimization of Immunomodulatory Properties of Genetic Vaccines ; ”Stemmer 禾口 Crameri 的 EP 752008 “DNA Mutagenesis by Random Fragmentation and Reassembly ; ”Stemmer 的 EP 0932670 "Evolving Cellular DNA Uptake by Recursive Sequence Recombination ; " Stemmer ^ 人白勺 WO 99/23107, "Modification of Virus Tropism and Host Range by Viral Genome Shuffling ; ” Apt 等人的 WO 99/21979,“Human Papillomavirus Vectors ; ” del Cardayre ^AW WO 98/31837 "Evolution of Whole Cells and Organisms by Recursive Sequence Recombination ; ”Patten 禾口 Stemmer 的 WO 98/27230 "Methods and Compositions for PolyPeptide Engineering,,,Stemmer 入白勺 WO 98/27230, "Methods for Optimization of Gene Therapy by Recursive Sequence Shuffling and Selection,,,WO 00/00632,“Methods for Generating Highly Diverse Libraries,” WO 00/09679,“Methods for Obtaining in Vitro Recombined Polynucleotide Sequence Banks and Resulting Sequences,,,Arnold 等人 的 WO 98/42832,“Recombination of polynucleotide Sequences Using Random or Defined Primers, "Arnold ^ A W WO 99/29902, "Method for Creating Polynucleotide and Polypeptide Sequences,Iind的WO 98/41653,"An in Vitro Method for Construction of a DNA Library, , Borchert^AWWO 98/41622 "Method for constructing a Library Using DNA Shuffling,”和Pati和Zarling的WO 98/42727/<Sequence Alterations using Homologous Recombination. ” 某些美國申請?zhí)峁┝岁P(guān)于多種不同產(chǎn)生方法的另外細(xì)節(jié),包括fatten等人的 “SHUFFLING OF C0D0N ALTEAED GENES”,歸檔于 1999 年 9 月 28 日,(U. S. Ser. No.09/407,800), del Cardayre 等人的“EVOLUTION OF WHOLE CELLS AND ORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION”,歸檔于 1998 年 7 月 15 日(U. S. Ser. No. 09/166, 188)和 1999 年 7 月 15 日(U. S. Ser. No 09/354, 922) ;Crameri 等人的 "OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION”,歸檔于 1999 年 9 月 28 日(U. S. Ser. No. 09/408,392)和 Crameri 等人的“OLIGONUCLEOTIDE MEDIATED NUCLEIC
51ACID RECOMBINATION”,歸檔于 2000 年 1 月 18 日(PCT/US00/01203) ;Welch 等人的 "USE OF CODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETIC SHUFFLING,,, 歸檔于 1999 年 9 月沘日(U. S. Ser. No. 09/408, 393) ;Selifonov 等人的 ‘‘METHODS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDS & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS",歸檔于 2000 年 1 月 18 日(PCT/US00/01202)和,例如,Selifonov 等人的"METHODS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDS & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS",歸檔于 2000 年 7 月 18 日(U. S. Ser. No. 09/618,579), Selifonov 禾P Stemmer 的"METHODS OF POPULATING DATA STRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS,,,歸檔于 2000 年 1 月 18 日(PCT/US00/01138) ;Affholter 的 "SINGLE-STRANDED NUCLEIC ACID TEMPLATE-MEDIATED RECOMBINATION AND NUCLEIC ACID FRAGMENT ISOLATION,,,歸檔于 2000 年 9 月 6 日(U. S. Ser. NO. 09/656,549)。非隨機(jī)的,或者“定向進(jìn)化”的方法包括,例如,飽和誘變(GSSM),合成的連接重組裝(SLR),或者這些方法的組合用于修飾發(fā)明的核酸,產(chǎn)生具有新的或者性質(zhì)改變(例如, 在高的酸性或堿性,高溫,等等條件下具有活性)的磷脂酶。修飾的核酸編碼的多肽可以在檢測磷脂酶前篩查其活性或者別的活性。可以使用任何檢測的形式或者方案。例如,使用毛細(xì)管陣列平臺,見,例如,美國專利6,280,926 ;5, 939,250。飽和誘變,或者GSSM發(fā)明的一個(gè)方面,非隨機(jī)的基因修飾,“定向進(jìn)化過程”用于產(chǎn)生具有新的或者改變的特性的磷脂酶。本方法的各種變化已經(jīng)被稱為“基因位點(diǎn)一飽和誘變”,“位點(diǎn)飽和誘變”,“飽和誘變”或者簡單地為“GSSM”。飽和誘變可以與別的誘變過程相結(jié)合。見,例如, 美國專利6,171,820 ;6, 238,884。一方面,GSSM包括提供模板多核苷酸和多數(shù)的寡核苷酸, 其中每種寡核苷酸包括一個(gè)與模板多核苷酸同源的序列,因此靶向模板多核苷酸的特異序列,每種寡核苷酸包括一個(gè)同源基因的變異體的序列;通過使用寡核苷酸復(fù)制模板多核苷酸產(chǎn)生包括非隨機(jī)序列變異體的子代多核苷酸,因此產(chǎn)生包括同源基因序列變異體的多核苷酸。一方面,為了產(chǎn)生一套子代多肽,其中在每個(gè)氨基酸位置都是全范圍的單氨基酸取代,例如酶活性位點(diǎn)或者配基結(jié)合位點(diǎn)中的氨基酸殘基被靶向修飾,將含有簡并N,N, G/ T序列的密碼子引物用于往多核苷酸中引入點(diǎn)突變。這些寡核苷酸可以包括連續(xù)的第一同源序列,簡并N,N, G/T序列,和任選地,第二同源序列。從使用這些寡核苷酸得到的下游的子代翻譯產(chǎn)物包括沿著多肽的每個(gè)氨基酸位點(diǎn)的所有可能的氨基酸變異,因?yàn)镹,N, G/T序列的簡并性包括所有20種氨基酸的密碼子。一方面,一個(gè)這樣的簡并寡核苷酸(包括,例如,一個(gè)簡并N,N, G/T盒)用于使母本多核苷酸模板中的每個(gè)最初密碼子形成全范圍的密碼子取代。另一方面,為了使母本多核苷酸模板中的至少兩個(gè)最初密碼子形成全范圍的密碼子取代,使用至少兩個(gè)簡并盒一或者在相同的寡核苷酸中,或者在不相同的寡核苷酸中。 例如,一個(gè)寡核苷酸中可以含有多于一個(gè)N,N, G/T序列,可以在多于一個(gè)位點(diǎn)引入氨基酸突變。此N,N, G/T序列的大多數(shù)可以直接相鄰,或者被一個(gè)或多于一個(gè)的另外核苷酸序列分隔開。另一方面,適用于引入添加或者缺失的寡核苷酸可以單獨(dú)使用或者與含有N,N,G/ T序列的密碼子合并使用,引入氨基酸添加,缺失,和/或取代的任何組合或者排列組合。一方面,使用含有相鄰的N,N,G/T三聯(lián)體,即簡并的(N,N,G/T)n序列的寡核苷酸,可以同時(shí)誘變兩個(gè)或者更多相鄰的氨基酸位點(diǎn)。另一方面,使用具有比N,N, G/T序列簡并性小的簡并盒。例如,理想的是在一些例子中(例如,在寡核苷酸中)使用包括僅僅一個(gè)N 的簡并的三聯(lián)體序列,其中所述N可以在三聯(lián)體的第一,第二或者第三位置上。包含任何別的堿基的任何組合和排列組合可以在三聯(lián)體的剩下兩個(gè)位置上使用??蛇x擇地,理想的是在一些例子中(例如,在寡核苷酸中)使用簡并的N,N,N三聯(lián)體序列。一方面,簡并的三聯(lián)體(例如,N, N, G/T三聯(lián)體)的使用可以使得系統(tǒng)的和容易的在多肽中的每個(gè)氨基酸位置上產(chǎn)生全范圍的可能的天然氨基酸(全部20種氨基酸)(在可選擇的方面,該方法也包括在每個(gè)氨基酸殘基,或者密碼子,位置上產(chǎn)生少于所有可能的取代)。例如,對于100個(gè)氨基酸的多肽,可以產(chǎn)生2000個(gè)不同的種類(S卩,每個(gè)位置20種可能的氨基酸X 100個(gè)氨基酸位置)。通過使用含有簡并的N,N,G/T三聯(lián)體的寡核苷酸或一套寡核苷酸,32個(gè)單獨(dú)的序列可以編碼所有20種可能的天然氨基酸。因此,在其中,母本多核苷酸序列被使用至少一個(gè)這樣的寡核苷酸飽和誘變的反應(yīng)容器中,可以產(chǎn)生編碼20 種不同多肽的32種不同的子代多核苷酸。相反,在定點(diǎn)誘變中使用非簡并的寡核苷酸可以導(dǎo)致每個(gè)反應(yīng)容器中僅僅有一種多肽產(chǎn)物。非簡并寡核苷酸可以任選地與公開的簡并引物組合使用;例如,非簡并寡核苷酸可以用于在一個(gè)處理中的多核苷酸中產(chǎn)生特異的點(diǎn)突變。 這就提供了一種產(chǎn)生特異的沉默點(diǎn)突變,可以導(dǎo)致相應(yīng)的氨基酸改變的點(diǎn)突變,和導(dǎo)致終止密碼子產(chǎn)生和相應(yīng)的多肽片段表達(dá)的點(diǎn)突變的方法。一方面,每個(gè)飽和誘變反應(yīng)容器中都含有編碼至少20種子代多肽(例如,磷脂酶) 分子的多核苷酸,這樣所有20種天然氨基酸相應(yīng)地在母本多肽的經(jīng)誘變密碼子位置上的特異氨基酸位置上呈現(xiàn)出來(別的方面使用少于所有20種天然氨基酸的組合)。每個(gè)飽和誘變反應(yīng)容器所產(chǎn)生的32重簡并子代多肽可以進(jìn)行克隆擴(kuò)增(例如,使用,例如表達(dá)載體克隆到合適的宿主,例如大腸桿菌(E. coli)宿主中)和表達(dá)篩選。當(dāng)單獨(dú)的子代多肽通過篩選鑒定具有有利的特性改變時(shí)(當(dāng)與母本多肽比較,例如在堿性或酸性條件下具有增加的磷脂酶活性時(shí)),可以相應(yīng)測序鑒定其中含有的有利的氨基酸取代。一方面,如在此公開的,使用飽和誘變誘變母本多肽中的每個(gè)氨基酸位置,有利的氨基酸改變可以在多于一個(gè)氨基酸位置上得到鑒定??梢援a(chǎn)生含有全部或部分這些有利的氨基酸取代的組合的一個(gè)或多個(gè)新的子代分子。例如,假如一個(gè)多肽中的每3個(gè)氨基酸位置中都可以鑒定到2個(gè)特異的有利氨基酸改變,在每個(gè)位置,排列包括3個(gè)可能(最初的氨基酸沒有改變,和兩個(gè)有利改變中的每一個(gè)),并且有三個(gè)位置。因此,總的可能性就有 3X3X3或者27種,包括以前檢測到的7種可能性_6種是點(diǎn)突變(即,三個(gè)位置中的每一個(gè)都有兩種可能性)和在任何位置都沒有改變。另一方面,為了改變序列,定點(diǎn)飽和誘變可以與任何隨機(jī)的或非隨機(jī)方法一起使用,例如,合成的連接重組裝(見下文),重排,嵌合化,重組和別的誘變過程和誘變劑。本發(fā)明提供以重復(fù)方式使用任何誘變過程,包括飽和誘變。合成的連接重組裝(SLR)發(fā)明提供叫做“合成的連接重組裝”,或者簡單地為“SLR”,的非隨機(jī)基因修飾系統(tǒng)產(chǎn)生具有新的或者改變的特性的磷脂酶,這是一種“定向的進(jìn)化過程”。SLR是非隨機(jī)的把寡核苷酸片段連接在一起的方法。此方法與隨機(jī)的寡核苷酸重排不同,因?yàn)楹怂針?gòu)件不是改組的,串聯(lián)的或者隨機(jī)地嵌合的,而是非隨機(jī)的組裝,見,例如,美國專利申請系列號
5(USSN) 09/332, 835, H g Synthetic Ligation Reassembty in Directed Evolution", 于1999年6月14日歸檔("USSN 09/332, 835”)。一方面,SLR包括以下步驟(a)提供模板多核苷酸,其中模板多核苷酸包括編碼同源基因的序列;(b)提供多個(gè)構(gòu)件多核苷酸,其中設(shè)計(jì)的構(gòu)件多核苷酸用于與模板多核苷酸以一個(gè)預(yù)定序列進(jìn)行交叉重組裝,并且構(gòu)件多核苷酸包括一個(gè)是同源基因的變異體的序列,和一個(gè)與模板多核苷酸兩側(cè)的變異序列同源的序列;(c)構(gòu)件多核苷酸與模板多核苷酸合并,這樣構(gòu)件多核苷酸與模板多核苷酸交叉重組裝,產(chǎn)生包括同源基因序列變異體的多核苷酸。SLR并不依賴于將要重排的多核苷酸之間的高水平同源性的存在。因此,此方法可以用于非隨機(jī)產(chǎn)生包括多于101°°種不同的嵌合體的子代分子庫(或套)。SLR可以用于產(chǎn)生包括多于101°°°種不同子代嵌合體的庫。因此,本發(fā)明的方面包括產(chǎn)生一套最終嵌合核酸分子的非隨機(jī)方法,其掠過設(shè)計(jì)所選擇的全面組裝順序。此方法包括步驟設(shè)計(jì)產(chǎn)生眾多具有可用的相互兼容連接末端的特異核酸構(gòu)件,把這些核酸構(gòu)件組裝,這樣得到設(shè)計(jì)的全面組裝順序。假如構(gòu)件可以以預(yù)確定的順序偶聯(lián)起來,那么核酸構(gòu)件的相互兼容連接末端進(jìn)行組裝被認(rèn)為對于這種類型的順序組裝是“可用的”。因此,核酸構(gòu)件偶聯(lián)的全面組裝順序是由連接末端的設(shè)計(jì)決定的。假如使用步驟多于一步的話,那么核酸構(gòu)件偶聯(lián)的全面組裝順序也由組裝步驟的相繼順序所確定。一方面,退火的構(gòu)件部分用酶處理,例如連接酶(例如,T4DNA連接酶),得到構(gòu)件部分的共價(jià)連接。—方面,寡核苷酸構(gòu)件是通過分析的序列模板進(jìn)行設(shè)計(jì)的,序列模板作為產(chǎn)生最終嵌合多核苷酸核酸子代的基礎(chǔ)。這些母本寡核苷酸模板作為設(shè)計(jì)待誘變的例如,嵌合的或改組的核酸構(gòu)件的序列信息來源。本方法的一方面,為了選擇一個(gè)或多個(gè)分界點(diǎn),把大多數(shù)母本核酸模板的序列進(jìn)行比對。分界點(diǎn)可以位于同源區(qū)域,并且包括一個(gè)或多個(gè)核苷酸。這些分界點(diǎn)優(yōu)選的由至少兩個(gè)祖代模板所共同所有。因此,為了母本多核苷酸重排,分界點(diǎn)可以用于描繪產(chǎn)生的寡核苷酸構(gòu)件的界限。在祖代分子中確定和選擇的分界點(diǎn)作為最終嵌合子代分子組裝的潛在的的嵌合點(diǎn)。分界點(diǎn)可以是由至少兩個(gè)母本多核苷酸序列具有的同源區(qū)域(包括至少一個(gè)同源核苷酸堿基)。做為選擇,分界點(diǎn)可以是由至少一半的母本多核苷酸序列具有的同源區(qū)域,或者分界點(diǎn)可以是由至少三份之二的母本多核苷酸序列具有的同源區(qū)域。甚至更優(yōu)選的適用的分界點(diǎn)是由至少四分之三的母本多核苷酸序列具有的同源區(qū)域,或者分界點(diǎn)可以是由幾乎全部母本多核苷酸序列具有的同源區(qū)域。一方面,分界點(diǎn)是由全部母本多核苷酸序列具有的同源區(qū)域。一方面,為了產(chǎn)生子代嵌合多核苷酸的完備文庫,連接重組裝過程要深入的進(jìn)行。 換句話說,所有可能的核苷酸構(gòu)件的順序組合都在最終的嵌合核酸分子組中表現(xiàn)出來。同時(shí),在另一個(gè)具體例子中,每個(gè)組合中的組裝順序(即,每個(gè)最終嵌合核酸的5’到3’序列中每個(gè)構(gòu)件的組裝順序)都如以上描述的(或者非隨機(jī)的)設(shè)計(jì)。因?yàn)楸景l(fā)明的非隨機(jī)特性,所有不需要的副產(chǎn)物的可能性大大降低。另一方面,連接重組裝方法是系統(tǒng)地進(jìn)行的。例如,為了產(chǎn)生子代分子的系統(tǒng)性劃分的文庫,劃分的區(qū)域可以系統(tǒng)地,例如逐個(gè)地篩選出來,可以實(shí)施此方法。換句話說,通過選擇性的和明智的使用特異核酸構(gòu)件,同時(shí)選擇性的和明智的使用后繼步驟的組裝反應(yīng),本發(fā)明提供可以在幾個(gè)反應(yīng)容器的每一個(gè)中都得到子代產(chǎn)物的特異組的設(shè)計(jì)。這就使得可以進(jìn)行系統(tǒng)的檢測和篩選程序。因此,這些方法可以使在更小的組中對一個(gè)待檢測的潛在的非常大數(shù)目的子代分子進(jìn)行系統(tǒng)檢測。因?yàn)榭梢砸愿叨褥`活,卻是完備和系統(tǒng)的方式,特別是當(dāng)祖先分子中具有低水平的同源性時(shí)進(jìn)行嵌合,所以這些方法提供了包括大數(shù)目的子代分子的文庫(或者組)的產(chǎn)生。因?yàn)楸具B接重組裝發(fā)明的非隨機(jī)特性,所以產(chǎn)生的子代分子,優(yōu)選包括具有由設(shè)計(jì)所選擇的全面組裝順序的最終嵌合核酸分子文庫。飽和誘變和完善的定點(diǎn)進(jìn)化方法也可以用于產(chǎn)生不同的子代分子種類。關(guān)于分界點(diǎn)的選擇,核酸構(gòu)件的大小和數(shù)目,偶聯(lián)的大小和設(shè)計(jì),本發(fā)明提供了選擇和控制的自由,這一點(diǎn)是應(yīng)該予以理解的。而且,應(yīng)該理解的是,對于本發(fā)明的可操作性來說,分子內(nèi)同源性的要求并不高。實(shí)際上,分界點(diǎn)甚至可以選擇在很少或沒有分子內(nèi)同源性的區(qū)域。例如,因?yàn)槊艽a子的擺動(dòng),即, 密碼子的簡并性,核苷酸取代可以引入核酸構(gòu)件中而不會改變在相應(yīng)的祖代模板中編碼的氨基酸。作為選擇,可以改變密碼子,這樣最初的氨基酸被改變。為了增加分子內(nèi)同源分界點(diǎn)的發(fā)生率,從而增加構(gòu)件中可以得到的偶聯(lián)的數(shù)目,本發(fā)明提供這樣的可以引入核酸構(gòu)件中的取代,這反過來會產(chǎn)生更大數(shù)目的子代嵌合分子。另一方面,構(gòu)件產(chǎn)生的步驟的合成特性允許核苷酸(例如,一個(gè)或者多個(gè)核苷酸, 可以是,例如密碼子或內(nèi)含子或者調(diào)控序列)的設(shè)計(jì)和引入,其以后可以被任選在體外過程(例如,通過誘變)或者體內(nèi)過程(例如,通過利用宿主微生物的基因剪切能力)中除去。在許多情況中,應(yīng)該理解的是,除了產(chǎn)生適用的分界點(diǎn)的潛在好處之外,由于許多別的原因,這些核苷酸的弓丨入也是理想的。一方面,核酸構(gòu)件用于引入內(nèi)含子。因此,根據(jù)在此描述的方法,功能性的內(nèi)含子被引入進(jìn)生產(chǎn)的人造基因中。人工引入的內(nèi)含子在宿主細(xì)胞中可以功能性的用于基因剪切中,以天然產(chǎn)生的內(nèi)含子作用功能性的方式進(jìn)行基因剪切。優(yōu)化的定向進(jìn)化系統(tǒng)發(fā)明提供非隨機(jī)的基因修飾系統(tǒng),叫做“優(yōu)化的定向進(jìn)化系統(tǒng)”,產(chǎn)生具有新的或者改變的特性的磷脂酶。優(yōu)化的定向進(jìn)化針對的是使用重復(fù)輪次的還原性重配、重組和選擇這個(gè)重復(fù)循環(huán),從而通過重組進(jìn)行核酸的定向分子進(jìn)化。優(yōu)化的定向進(jìn)化可以產(chǎn)生大量的進(jìn)化的嵌合序列,其中產(chǎn)生的群體大大富含具有預(yù)確定數(shù)目的交換事件的序列。交換事件是嵌合序列中的一個(gè)點(diǎn),其中序列中的交換發(fā)生于從一個(gè)母本變異體到另一個(gè)母本變異體。這樣的點(diǎn)一般在兩個(gè)母本連接在一起形成一個(gè)單一序列的寡核苷酸的接頭處都具有。此方法可以計(jì)算寡核苷酸序列的正確濃度,這樣最終序列的嵌合總體由于選擇數(shù)目的交換事件而得到富集。這提供了針對選擇具有預(yù)確定數(shù)目的交換事件的嵌合變異體的更大控制。另外,與別的系統(tǒng)相比,此方法提供了開發(fā)巨大數(shù)目的可能蛋白變異體空間的合宜方法。以前,假如嵌合分子產(chǎn)生,例如,在反應(yīng)過程中產(chǎn)生了 IO13個(gè)嵌合分子,檢測這樣高數(shù)目的特異活性的嵌合變異體是十分困難的。而且,子代群體中的一大部分將具有非常高數(shù)目的交換事件,這導(dǎo)致蛋白質(zhì)具有增加水平的特異活性的可能性降低。通過使用這些方法,嵌合分子群體可以富集具有特定數(shù)目交換事件的變異體。因此,雖然在反應(yīng)過程中可以產(chǎn)生IO13嵌合分子,但是選擇用于進(jìn)一步分析的每個(gè)分子最可能,例如,僅僅有三個(gè)交換事件。因?yàn)榈玫降淖哟后w可以傾向于具有預(yù)定數(shù)目的交換事件,所以嵌合分子之間的函數(shù)
55變量的范圍減小。當(dāng)計(jì)算從最初母本多核苷酸得到的可能影響特定性狀的寡核苷酸時(shí),這提供了更易控制的變量數(shù)目。產(chǎn)生嵌合子代多核苷酸的一個(gè)方法是產(chǎn)生每個(gè)母本序列的片段或部分的對應(yīng)寡核苷酸。每個(gè)寡核苷酸優(yōu)選的包括獨(dú)特的重疊區(qū)域,這樣當(dāng)寡核苷酸混合在一起,得到每個(gè)寡核苷酸片段以正確順序組裝的新的變異體。在USSN 09/332,835中可以發(fā)現(xiàn)另外的信息。每個(gè)母本變異體產(chǎn)生的寡核苷酸的數(shù)目與最終產(chǎn)生的嵌合分子中得到的交換總數(shù)目之間具有相關(guān)性。例如,為了發(fā)現(xiàn)具有,例如在高溫下具有更大活性的嵌合變異體,三個(gè)母本核苷酸序列變異體可能經(jīng)過連接反應(yīng)。作為一個(gè)例子,對應(yīng)于每個(gè)母本變異體的每部分產(chǎn)生一組50個(gè)寡核苷酸序列。相應(yīng)地,在連接重組裝過程中,在每個(gè)嵌合序列中可以有高達(dá) 50個(gè)交換事件。每個(gè)產(chǎn)生的嵌合多核苷酸以改變的順序含有從每個(gè)母本變異體得到的寡核苷酸的概率是很低的。假如每個(gè)寡核苷酸片段在連接反應(yīng)中以相同摩爾數(shù)存在,那么可能在相同母本多核苷酸得到的多個(gè)位點(diǎn)寡核苷酸中將彼此緊靠的相鄰,從而不會導(dǎo)致交換事件。假如在本例子中,從每個(gè)母本得到的每個(gè)寡核苷酸的濃度在連接步驟中保持恒定,那么有1/3的機(jī)會(假設(shè)為3個(gè)母本)從相同母本變異體得到的寡核苷酸將在嵌合序列中連接,而且并不產(chǎn)生交換。相應(yīng)地,在給定母本變異體的組數(shù)目,對應(yīng)于每個(gè)變異體的寡核苷酸的數(shù)目,和連接反應(yīng)的每一步驟中每個(gè)變異體的濃度的情況下,確定概率濃度函數(shù)(PDF),可以用于預(yù)測連接反應(yīng)的每一步驟中可能發(fā)生的交換事件的群體。以下描述確定PDF的統(tǒng)計(jì)學(xué)和數(shù)學(xué)。 通過利用這些方法,人們可以計(jì)算這樣的概率濃度函數(shù),從而富集在特定連接反應(yīng)中得到的預(yù)確定交換事件數(shù)目的嵌合子代群體。而且,交換事件的靶數(shù)目可以預(yù)確定,然后對系統(tǒng)進(jìn)行編程,計(jì)算連接反應(yīng)的每一步驟中每個(gè)母本寡核苷酸的起始數(shù)量,得到關(guān)于預(yù)確定數(shù)目的交換事件的概率濃度函數(shù)。這些方法針對的是使用還原性重配,重組和選擇這個(gè)重復(fù)循環(huán),使得可以通過重組進(jìn)行編碼多肽的核酸的定向分子進(jìn)化。此系統(tǒng)可以產(chǎn)生大數(shù)量的進(jìn)化的嵌合序列,其中產(chǎn)生的群體大大富集了具有預(yù)確定數(shù)目的交換事件的序列。交換事件是嵌合序列中的點(diǎn),其中序列的變換發(fā)生于從一個(gè)母本變異體到另一個(gè)母本樣板田。這樣的點(diǎn)一般在兩個(gè)母本連接形成一個(gè)單一序列的寡核苷酸連接處。該方法可以計(jì)算寡核苷酸序列的正確濃度,這樣附件所選定數(shù)目的交換事件的序列的最終嵌合群體。這提供了對選擇具有預(yù)確定數(shù)目的交換事件的嵌合變異體的更多控制。另外,與別的系統(tǒng)相比,此方法提供了開發(fā)巨大數(shù)目的可能蛋白變異體空間的合宜方法。通過使用在此描述的方法,嵌合分子群體可以富集那些具有特定數(shù)目的交換事件的變異體。因此,雖然人們?nèi)匀豢梢栽诜磻?yīng)過程中產(chǎn)生IO13嵌合分子,選擇的進(jìn)行進(jìn)一步分析的每個(gè)分子最可以具有,例如,只有三個(gè)交換事件。因?yàn)榈玫降淖哟后w傾向于具有預(yù)確定交換事件,所有嵌合分子之間的函數(shù)變量的范圍減小。當(dāng)計(jì)算從最初母本多核苷酸得到的可能影響特定性狀的寡核苷酸時(shí),這提供了更易控制的變量數(shù)目。一方面,方法通過產(chǎn)生對應(yīng)于每個(gè)母本片段或部分的寡核苷酸,產(chǎn)生了嵌合子代核苷酸序列。每個(gè)寡核苷酸優(yōu)選的包括獨(dú)特的重疊區(qū)域,這樣當(dāng)寡核苷酸混合在一起,得到每個(gè)寡核苷酸片段以正確順序組裝的新的變異體。也見USSN 09/332,835。每個(gè)母本變異體產(chǎn)生的寡核苷酸的數(shù)目與最終產(chǎn)生的嵌合分子中得到的交換總數(shù)目之間具有相關(guān)性。例如,為了發(fā)現(xiàn)具有,例如在高溫下具有更大活性的嵌合變異體,三個(gè)母本核苷酸序列變異體可能經(jīng)過連接反應(yīng)。一個(gè)例子,對應(yīng)于每個(gè)母本變異體的每部分產(chǎn)生一組50個(gè)寡核苷酸序列。相應(yīng)的,在連接重組裝過程中,在每個(gè)嵌合序列中可以有高達(dá)50個(gè)交換事件。每個(gè)產(chǎn)生的嵌合多核苷酸以改變的順序含有從每個(gè)母本變異體得到的寡核苷酸的概率是很低的。假如每個(gè)寡核苷酸片段在連接反應(yīng)中以相同摩爾數(shù)存在,那么可能在相同母本多核苷酸得到的多個(gè)位點(diǎn)寡核苷酸中將彼此緊靠的相鄰,從而不會導(dǎo)致交換事件。假如在本例子中,從每個(gè)母本得到的每個(gè)寡核苷酸的濃度在連接步驟中保持恒定, 那么有1/3的機(jī)會(假設(shè)為3個(gè)母本)從相同母本變異體得到的寡核苷酸將在嵌合序列中連接,而且并不產(chǎn)生交換。相應(yīng)地,確定概率濃度函數(shù)(PDF),預(yù)測連接反應(yīng)的每一步驟中可能發(fā)生的交換事件群體,是在給定母本變異體的組數(shù)、對應(yīng)于每個(gè)變異體的寡核苷酸數(shù)目、和連接反應(yīng)的每一步驟中每個(gè)變異體的濃度的條件下。以下描述確定PDF的統(tǒng)計(jì)學(xué)和數(shù)學(xué)。通過利用這些方法,人們可以計(jì)算這樣的概率濃度函數(shù),從而富集在特定連接反應(yīng)中得到的預(yù)確定交換事件數(shù)目的嵌合子代群體。而且,交換事件的靶數(shù)目可以預(yù)確定,然后對系統(tǒng)進(jìn)行編程,計(jì)算連接反應(yīng)的每一步驟中每個(gè)母本寡核苷酸的起始數(shù)量,得到關(guān)于預(yù)確定數(shù)目的交換事件的概率濃度函數(shù)。確定交換事件發(fā)明的具體例子包括系統(tǒng)和軟件,可以接受所需交換概率濃度函數(shù)(PDF),要重組裝的母本基因的數(shù)目和重組裝中片段的數(shù)目,作為輸入。此程序的輸出是“片段PDF”,可以用于確定產(chǎn)生重裝配基因的配方和那些基因的預(yù)計(jì)交換PDF。優(yōu)選地,在此描述的處理用 MATLAB (Mathworks,Natick, masschusetts),一種程序語言和技術(shù)計(jì)算發(fā)展環(huán)境進(jìn)行。重復(fù)過程在本發(fā)明的實(shí)踐過程中,這些過程可以反復(fù)重復(fù)。例如,對改變的磷脂酶表型的核酸(或者,核酸)進(jìn)行鑒定,再分離,再修飾,活性再檢測。此過程可以反復(fù)重復(fù),直到得到所需的表型。例如,整個(gè)生物化學(xué)的合成代謝或者分解代謝途徑可以工程進(jìn)細(xì)胞中,包括磷脂酶活性。相似地,假如確定特定的寡核苷酸對于所需性狀沒有影響(例如,新的磷脂酶表型),那么可以通過合成包括待除去序列的更大母本寡核苷酸,把它作為變量除去。因?yàn)樾蛄信c更大序列合并阻止了交換事件,所以在子代多核苷酸中此序列沒有任何變化。此確定哪種寡核苷酸與所需性狀最為相關(guān),哪種寡核苷酸與所需性狀無關(guān)的反復(fù)過程,可以允許對所有可能蛋白質(zhì)變異體的有效開發(fā),這些變異體可能個(gè)年個(gè)特定性狀或活性。體內(nèi)改組在提供發(fā)明的多肽變異體,例如,抗體,磷脂酶,和類似物的本發(fā)明方法中使用分子的體內(nèi)改組。體內(nèi)改組可以利用正常性狀的細(xì)胞,得到重組的多聚體。雖然體內(nèi)重組提供了獲得分子多樣性的主要天然途徑,但是遺傳重組仍然是相對復(fù)雜的過程,涉及1)同源性的識別;幻導(dǎo)致產(chǎn)生重組交叉的鏈切割,鏈侵入,和代謝步驟,和最后幻交叉轉(zhuǎn)變成為分離的重組分子。交叉的形成要求同源序列的識別。一方面,發(fā)明提供由至少第一個(gè)多核苷酸和第二個(gè)多核苷酸產(chǎn)生雜交多核苷酸的方法。發(fā)明可以用于通過引入具有至少部分序列同源性的一個(gè)區(qū)域的至少第一多核苷酸和第二多核苷酸于合適的宿主細(xì)胞中而產(chǎn)生雜交多核苷酸。部分序列同源性區(qū)域促進(jìn)導(dǎo)致產(chǎn)生雜交多核苷酸的序列識別的過程。正如在此使用的,術(shù)語“雜交多核苷酸”是任何由本發(fā)明的方法產(chǎn)生的核苷酸序列,含有從至少兩個(gè)最初多核苷酸序列得到的序列。這樣的雜交多核苷酸可以由促進(jìn)DNA分子間的序列整合的分子間重組事件產(chǎn)生。另外,這樣的雜交多核苷酸可以由利用重復(fù)序列,改變DNA分子中的核苷酸序列的分子內(nèi)還原性重配過程產(chǎn)生。產(chǎn)生序列變異體發(fā)明也提供使用發(fā)明的核酸和多肽產(chǎn)生發(fā)明的核酸和磷脂酶序列變異體,或者分離的磷脂酶,例如,磷脂酶的序列變異體的方法。一方面,發(fā)明提供發(fā)明的磷脂酶基因的變異體,變異體可以使用任何方法改變,包括,例如隨機(jī)方法,或者非隨機(jī)方法或者“定向進(jìn)化”方法,如以上描述。分離的變異體可以是天然發(fā)生的。變異體也可以體外產(chǎn)生。變異體可以使用基因工程技術(shù),例如定點(diǎn)誘變,隨機(jī)化學(xué)誘變,核酸外切酶III缺失程序和標(biāo)準(zhǔn)克隆技術(shù)產(chǎn)生。 做為選擇,這樣的變異體,片段,類似物或衍生物可以使用化學(xué)合成或者修飾程序產(chǎn)生。產(chǎn)生變異體的別的方法也被那些技術(shù)熟練人員所熟悉。這些方法包括修飾天然分離得到的核酸序列,產(chǎn)生編碼具有特性的多肽的核酸的程序,多肽的特性增加它們在工業(yè)或?qū)嶒?yàn)室應(yīng)用中的價(jià)值。在這些程序中,產(chǎn)生并且定性許多與天然分離得到的序列相比具有一個(gè)或多個(gè)核苷酸差異的變異體序列。這些核苷酸差異可以產(chǎn)生與天然分離物得到的核酸編碼的多肽相比的氨基酸變化。例如,變異體可以使用錯(cuò)誤傾向PCR產(chǎn)生。在錯(cuò)誤傾向PCR中,PCR在DNA聚合酶復(fù)制忠實(shí)度度低的情況下進(jìn)行,這樣在PCR產(chǎn)物的全長中獲得高比率的點(diǎn)突變。錯(cuò)誤傾向 PCR 在,例如 Leung,D. W.,等,技術(shù),1 :11-15,1989)和 Caldwell,R. C. &Joyce G. F.,PCR 方法應(yīng)用,2 :28-33,1992中有描述。簡要而言,在這些程序中,為了在全長的PCR產(chǎn)物中得到高比率的變突變,待誘變的核酸與PCR引物,反應(yīng)緩沖液,MgCl2, MnCl2, Taq聚合酶和合適濃度的dNTP混合。例如,反應(yīng)使用20毫微微摩爾(fmoles)待誘變的核酸,每種PCR引物 30 皮摩爾,反應(yīng)緩沖液包括 50mM KCl, IOmM Tris HCl (PH8. 3)和 0.01% 明膠,7mM MgCl2, 0. 5mM MnCl2, 5 單位的 Taq 聚合酶,0. 2mM dGTP,0. 2mM dATP, ImM dCTP 和 ImM dTTP。PCR進(jìn)行30個(gè)循環(huán),每個(gè)循環(huán)為94°C 1分鐘,45°C 1分鐘,72°C 1分鐘。然而,這些參數(shù)可以適當(dāng)?shù)母淖?。誘變發(fā)核酸克隆進(jìn)入合適的載體中,評估誘變的核酸編碼的多肽的活性。變異體也可以使用寡核苷酸定向誘變產(chǎn)生,在感興趣的任何和克隆DNA中得到位點(diǎn)專一的變異。寡核苷酸誘變在,例如,Reidhaar-Olson (1988) kience 241 :53-57中有描述。簡要地,在這些程序中,合成待引入的克隆DNA中多數(shù)具有一個(gè)或多個(gè)突變的雙鏈寡核苷酸,并且插入待誘變的克隆DNA中?;厥蘸薪?jīng)誘變的DNA的克隆,評定經(jīng)誘變的DNA編碼的多肽的活性。產(chǎn)生變異體的另一個(gè)方法是組裝PCR。組裝PCR涉及從小DNA片段中得到的PCR 產(chǎn)物的組裝。在相同管中平行發(fā)生了許多不同的PCR反應(yīng),一個(gè)反應(yīng)的產(chǎn)物是另一個(gè)反應(yīng)產(chǎn)物的引物。組裝PCR在,例如美國專利5,965,408中描述。另一種產(chǎn)生變異體的方法是有性PCR誘變。在有性PCR誘變中,在體外,強(qiáng)迫同源重組在不同的,但是高度相關(guān)的DNA序列之間發(fā)生,是基于序列同源性的DNA分子隨機(jī)斷裂的結(jié)果,然后通過PCR反應(yīng)中引物延伸從而固定交換。有性PCR誘變在,例如,Stenlnier (1994)Proc. Natl. Acad. Sci. USA 91 :10747-10751 中描述。簡要地,在此程序中,待重組的多數(shù)核酸都用DNA酶消化,產(chǎn)生平均大小為50-200個(gè)核苷酸的片段。純化所需平均大小的片段,再懸浮于PCR混合物中。在促進(jìn)核酸片段之間重組的條件下進(jìn)行PCR。 例如,通過把純化的片段以10-30ng/y 1的濃度再懸浮于每種dNTP 0. 2mM,2. 2mM MgCl2, 50mM KCl,IOmM Tris HCl,PH 9. 0 和 0. Triton X-100 的溶液中進(jìn)行 PCR。以反應(yīng)混合物的100 1加入2. 5單位Taq聚合酶,使用以下方案進(jìn)行PCR :94°C 60秒,94°C 30秒, 50-550C 30秒,72°C 30秒(30-45次),72°C 5分鐘。然而,這些參數(shù)可以適當(dāng)?shù)母淖?。一些方面,寡核苷酸可以包括在PCR反應(yīng)中。另一方面,DNA聚合酶Klenow片段可以在第一組 PCR反應(yīng)中使用,Taq聚合酶可以在隨后組的PCR反應(yīng)中使用。分離重組序列,評估重組序列編碼的多肽的活性。變異體也可以通過體內(nèi)誘變產(chǎn)生。在一些具體例子中,序列中感興趣的隨機(jī)突變通過在細(xì)菌株,例如一個(gè)或多個(gè)DNA修復(fù)途徑中具有突變的大腸桿菌中增殖感興趣序列而產(chǎn)生。這樣的“突變”菌株具有比野生型母本高的隨機(jī)突變率。DNA在這些菌株中的一種中增殖將最終產(chǎn)生DNA中的隨機(jī)突變。適合于體內(nèi)誘變的突變菌株在,例如PCT
發(fā)明者D·拉姆, G·黑爾伍德, N·巴頓, S·格拉馬蒂科瓦 申請人:維萊尼姆公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
丽水市| 浠水县| 海林市| 壤塘县| 海口市| 垣曲县| 扶绥县| 措勤县| 喀喇沁旗| 滦南县| 桃园县| 龙陵县| 天长市| 西林县| 天祝| 天全县| 西藏| 清原| 扎兰屯市| 阿城市| 舒兰市| 新郑市| 全南县| 镇宁| 班戈县| 台前县| 榕江县| 高阳县| 博白县| 和平县| 临西县| 保德县| 遂川县| 石柱| 绥棱县| 尼勒克县| 内丘县| 西乌珠穆沁旗| 内乡县| 济阳县| 尼木县|