專利名稱:越野他汀的生物合成基因簇及其應(yīng)用的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于微生物基因資源和基因工程領(lǐng)域,具體涉及抗腫瘤抗生素越野他汀(Kosinostatin)的生物合成基因簇的克隆、分析、功能研究及其應(yīng)用。
背景技術(shù):
越野他汀(Kosinostatin)是2002年由日本科學(xué)家Tamotsu Furumai從富山灣深海中分離得到的小單孢菌Micromonospora sp.TP-A0468所產(chǎn)生的具有良好抗腫瘤抗菌活性的天然產(chǎn)物[J.Antibiot.(Tokyo) 55, 128 - 133 (2002) ] 0 2007年埃及科學(xué)家El-Naggar, M.Y.再次從鏈霉菌 Streptomyces violaceusniger strain HAL64 中分離得到[J.Microbiol.45,262 - 267(2007)]。對(duì)于革蘭氏陽(yáng)性菌,越野他汀具有良好的生物活性(例如對(duì)于Bacillus subtilisATCC6633,MIC = 39ng/mL);對(duì)于革蘭氏陰性菌和酵母,越野他汀具有中等的生物活性;對(duì)于腫瘤細(xì)胞,越野他汀具有良好的生物活性(IC50約為0.10 μ M),其抗腫瘤活性要優(yōu)于阿
霉素O越野他汀分子由三部分組成:蒽環(huán)骨架、含氮雜環(huán)以及?;拿撗跫禾菃卧?。其中的蒽環(huán)骨架是以II型PKS的方式合成的。II型PKS由miniPKS以及相關(guān)的負(fù)責(zé)折疊、環(huán)化、氧化還原以及其他修飾的后修飾酶組成。闡明蒽環(huán)骨架的合成機(jī)理對(duì)于豐富人們對(duì)蒽環(huán)類天然產(chǎn)物的認(rèn)識(shí)、改造蒽環(huán)類天然產(chǎn)物的合成路徑以產(chǎn)生價(jià)值更高的“非天然”天然產(chǎn)物都有重要意義。分子的含氮雜環(huán)和脫氧糖基均是藥效基團(tuán),而且結(jié)構(gòu)比較新穎,但是目前的對(duì)其合成途徑還不甚了解,推測(cè)其合成機(jī)制是比較獨(dú)特的。因此,闡明這兩個(gè)基團(tuán)的合成過(guò)程,理解其生物合成的酶學(xué)機(jī)制,將大大提升人們對(duì)抗菌抗腫瘤天然產(chǎn)物構(gòu)效關(guān)系及生物合成原理的認(rèn)識(shí)。因此,本領(lǐng)域迫切需要闡明越野他汀生物合成的酶學(xué)機(jī)制,從而實(shí)現(xiàn)對(duì)越野他汀分子的改造,以期獲得活性更高、專一性更強(qiáng)、毒性更低的中間體和衍生物。
發(fā)明內(nèi)容
本發(fā)明涉及具有良好抗腫瘤活性的越野他汀的生物合成基因簇的克隆、測(cè)序、分析、功能研究及其應(yīng)用。本發(fā)明第一方面,提供了越野他汀的生物合成基因簇,所述基因簇包括編碼越野他汀生物合成所涉及的55個(gè)基因,具體為:I) II 型聚酮合成酶 PKS 相關(guān)基因:kstAl, kstA2, kstA3, kstDl, kstD2, kstD3,kstD4, kstD5, kstD6, kstD7, kstD8, kstD9, kstDIO, kstDll, kstD12, kstD13, kstD14 ;共 17個(gè)基因:kstAl位于基因簇核苷酸序列 第9943-11505位,編碼腺苷酰化酶,長(zhǎng)度為422個(gè)
氨基酸;
kstA2位于基因簇核苷酸序列第11507-11770位,編碼肽酰載體蛋白(PCP),長(zhǎng)度為402個(gè)氨基酸;kstA3位于基因簇核苷酸序列第26548-26805位,編碼?;d體蛋白,長(zhǎng)度為85個(gè)
氨基酸;kstDl位于基因簇核苷酸序列第9140-9946位,編碼2,3_環(huán)環(huán)化酶,長(zhǎng)度為268個(gè)
氨基酸;kstD2位于基因簇核苷酸序列第20823-216026位,編碼酮基還原酶,長(zhǎng)度為259個(gè)
氨基酸;kstD3位于基因簇核苷酸序列第22658-21699位,編碼芳香化酶,長(zhǎng)度為319個(gè)氨
基酸;kstD4位于基因簇核苷酸序列第23481-22696位,編碼C_9位酮基還原酶,長(zhǎng)度為261個(gè)氨基酸;kstD5位于基因簇核苷酸序列第23591-24049位,編碼單氧化酶,長(zhǎng)度為152個(gè)氨
基酸;kstD6位于基因簇核苷酸序列第26861-27295位,編碼第四環(huán)環(huán)化酶,長(zhǎng)度為144
個(gè)氨基酸;kstD7位于基因簇核苷酸序列第27391-28233位,編碼NAD (P)H:黃素氧化還原酶,長(zhǎng)度為280個(gè)氨基酸;kstD8位于基因簇核苷酸序列第28260-29156位,編碼單氧化酶,長(zhǎng)度為298個(gè)氨
基酸;kstD9位于基因簇核苷酸序列第32267-33358位,編碼羧酸酯酶,長(zhǎng)度為363個(gè)氨
基酸;kstDIO位于基因簇核苷酸序列第32267-33358位,編碼第四環(huán)環(huán)化酶,長(zhǎng)度為150
個(gè)氨基酸;kstDl I位于基因簇核苷酸序列第52203-51685位,編碼脫氫酶,長(zhǎng)度為172個(gè)氨基酸;kstD12位于基因簇核苷酸序列第54953-54498位,編碼羥化酶,長(zhǎng)度為151個(gè)氨基酸;kstD13位于基因簇核苷酸序列第60078-58579位,編碼FAD依賴的或者包含BBE結(jié)構(gòu)域的氧化還原酶,長(zhǎng)度為499個(gè)氨基酸;kstD14位于基因簇核苷酸序列第60258-61118位,編碼甲基轉(zhuǎn)移酶,長(zhǎng)度為286個(gè)
氨基酸;2)非核糖體聚妝合成酶 NRPS 相關(guān)基因:kstBl, kstB2, kstEl, kstE2, kstE3,kstE4, kstE5, kstE6 ;共 8 個(gè)基因:kstBl位于基因簇核苷酸序列第9943-11505位,編碼NRPS腺苷化酶,長(zhǎng)度為520
個(gè)氨基酸;kstB2位于基因簇核苷酸序列第11507-11770位,編碼酰基載體蛋白,長(zhǎng)度為87個(gè)
氨基酸;kstEl位于基因 簇核苷酸序列第13618-13992位,編碼L-ectoine合成酶,長(zhǎng)度為124個(gè)氨基酸;kstE2位于基因簇核苷酸序列第14017-15156位,編碼?;o酶A脫氫酶,長(zhǎng)度為379個(gè)氨基酸;kstE3位于基因簇核苷酸序列第55079-55924位,編碼羥化酶,長(zhǎng)度為281個(gè)氨基酸;kstE4位于基因簇核苷酸序列第58555-57470位,編碼雙氧化酶,長(zhǎng)度為361個(gè)氨
基酸;kstE5位于基因簇核苷酸序列第61163-61852位,編碼氨基轉(zhuǎn)移酶,長(zhǎng)度為229個(gè)
氨基酸;kstE6位于基因簇核苷酸序列第63435-64280位,編碼脫甲酰酶,長(zhǎng)度為281個(gè)氨
基酸;3)乙酸化的糖基合成相關(guān)基因:kstCl, kstC2, kstC3, kstC4, kstC5, kstC6,kstC7, kstC8, kstC9 ;共 9 個(gè)基因:kstCl位于基因簇核苷酸序列第19574-18678位,編碼dTDP-葡萄糖合成酶,長(zhǎng)度為298個(gè)氨基酸;kstC2位于基因簇核苷酸序列第19786-20775位,編碼dTDP-葡萄糖_4,6_脫水酶,長(zhǎng)度為329個(gè)氨基酸;kstC3位于基因 簇核苷酸序列第37944-37360位,編碼3,5_表異構(gòu)酶,長(zhǎng)度為194
個(gè)氨基酸;kstC4位于基因簇核苷酸序列第38165-39175位,編碼糖基轉(zhuǎn)移酶輔助蛋白,長(zhǎng)度為336個(gè)氨基酸;kstC5位于基因簇核苷酸序列第39198-40496位,編碼糖基轉(zhuǎn)移酶,長(zhǎng)度為432個(gè)
氨基酸;kstC6位于基因簇核苷酸序列第40496-41992位,編碼2,3_己糖脫水酶,長(zhǎng)度為498個(gè)氨基酸;kstC7位于基因簇核苷酸序列第41989-43014位,編碼丙酮酸脫氫酶α亞基,長(zhǎng)度為341個(gè)氨基酸;kstC8位于基因簇核苷酸序列第43031-44068位,編碼丙酮酸脫氫酶β亞基,長(zhǎng)度為345個(gè)氨基酸;kstC9位于基因簇核苷酸序列第53344-52361位,編碼己糖_3_酮基還原酶,長(zhǎng)度為327個(gè)氨基酸;4)負(fù)責(zé)吡咯吡咯二并環(huán)形成的后修飾基因:kstFl,kstF2,kstF3,kstF4,kstF5,kstF6 ;共6個(gè)基因:kstFl位于基因簇核苷酸序列第11773-12807位,編碼鄰氨基苯甲酸磷酸核糖轉(zhuǎn)移酶,長(zhǎng)度為344個(gè)氨基酸;kstF2位于基因簇核苷酸序列第12800-13621位,編碼色氨酸合成酶α亞基,長(zhǎng)度為273個(gè)氨基酸;kstF3位于基因簇核苷酸序列第15160-15855位,編碼鄰氨基苯甲酸磷酸核糖異構(gòu)酶,長(zhǎng)度為231個(gè)氨基酸;
kstF4位于基因簇核苷酸序列第15920-16618位,編碼吲哚甘油_3_磷酶合成酶,長(zhǎng)度為232個(gè)氨基酸;kstF5位于基因簇核苷酸序列第54495-53452位,編碼Enoyl還原酶,長(zhǎng)度為347個(gè)氨基酸;kstF6位于基因簇核苷酸序列第61849-63372位,編碼羧化酶,長(zhǎng)度為507個(gè)氨基酸;5)抗性基因:kstRsl, kstRs2, kstRs3, kstRs4, kstRs5, kstRs6, kstRs7 ;共 7 個(gè)基因kstRsl位于基因簇核苷酸序列第30224-31300位,編碼ABC轉(zhuǎn)運(yùn)蛋白,長(zhǎng)度為358
個(gè)氨基酸;kstRs2位于基因簇核苷酸序列第31297-32130位,編碼ABC轉(zhuǎn)運(yùn)蛋白,長(zhǎng)度為277
個(gè)氨基酸;kstRs3位于基因簇核苷酸序列第35584-34109位,編碼外排蛋白,長(zhǎng)度為491個(gè)氨
基酸;kstRs4位于基因簇核苷酸序列第36608-35625位,編碼轉(zhuǎn)運(yùn)蛋白,長(zhǎng)度為327個(gè)氨
基酸;kstRs5位于基因簇 核苷酸序列第44236-47025位,編碼SNF2/RAD54家族解螺旋酶,長(zhǎng)度為929個(gè)氨基酸;kstRs6位于基因簇核苷酸序列第47037-48338位,編碼抗性蛋白,長(zhǎng)度為433個(gè)氨
基酸;kstRs7位于基因簇核苷酸序列第57431-56853位,編碼抗性蛋白,長(zhǎng)度為192個(gè)氨
基酸;6)調(diào)節(jié)基因:kstRgl, kstRg2, kstRg3, kstRg4, kstl g5,共 5 個(gè)基因:kgtRgl位于基因簇核苷酸序列第17553-16669位,編碼轉(zhuǎn)錄激活因子,長(zhǎng)度為294個(gè)氨基酸;kgtRg2位于基因簇核苷酸序列第29233-30021位,編碼轉(zhuǎn)錄調(diào)節(jié)因子,長(zhǎng)度為262個(gè)氨基酸;kgtRg3位于基因簇核苷酸序列第50317-49112位,編碼調(diào)節(jié)因子,長(zhǎng)度為401個(gè)氨
基酸;kgtRg4位于基因簇核苷酸序列第51422-51649位,編碼調(diào)節(jié)因子,長(zhǎng)度為75個(gè)氨
基酸;kgtRg5位于基因簇核苷酸序列第56007-56840位,編碼調(diào)節(jié)因子,長(zhǎng)度為277個(gè)氨
基酸;7)其他基因:kstUl, kstU2, kstU3 ;共 3 個(gè):kgtUl位于基因簇核苷酸序列第48388-48822位,編碼未知功能蛋白,長(zhǎng)度為144個(gè)氨基酸;kgtU2位于基因簇核苷酸序列第50774-50304位,編碼未知功能蛋白,長(zhǎng)度為156個(gè)氨基酸;kgtU3位于基因簇核苷酸序列第51216-50785位,編碼未知功能蛋白,長(zhǎng)度為143個(gè)氨基酸。在另一優(yōu)選例中,所述基因簇包括以下II型聚酮合成酶PKS相關(guān)基因:kstAl,kstA2, kstA3, kstDl, kstD2, kstD3, kstD4, kstD5, kstD6, kstD7, kstD8, kstD9, kstDIO,kstDll, kstD12, kstD13 和 kstD14 ;和 / 或以下非核糖體聚妝合成酶NRPS相關(guān)基因:kstBl, kstB2, kstEl, kstE2, kstE3,kstE4, kstE5 和 kstE6 ;和 / 或以下乙酸化的糖基合成相關(guān)基因:kstCl,kstC2, kstC3, kstC4, kstC5, kstC6,kstC7, kstC8 和 kstC9 ;和 / 或以下負(fù)責(zé)吡咯吡咯二并環(huán)形成的后修飾基因:kstFl,kstF2,kstF3,kstF4,kstF5,kstF6。在另一優(yōu)選例中,所述基因簇包括以下抗性基因:kstRsl,kstRs2,kstRs3,kstRs4, kstRs5, kstRs6 和 kstRs7 ;和 / 或以下調(diào)節(jié)基因:kstRgl,kstRg2, kstRg3, kstRg4 和 kstRg5。在另一優(yōu) 選例中,所述基因簇的序列選自SEQ ID N0.:1中第1-64280位,第9140-64280 位,或第 1-67842 位。本發(fā)明第二方面,提供了一種越野他汀的生物合成相關(guān)蛋白,所述的蛋白的氨基酸序列選自如SEQ ID N0.:2-56所示的氨基酸序列。在另一優(yōu)選例中,所述的生物合成相關(guān)蛋白是SEQ ID N0.:3所示的腺苷?;浮T诹硪粌?yōu)選例中,所述的生物合成相關(guān)蛋白是SEQ ID N0.:4所示的肽酰載體蛋白。在另一優(yōu)選例中,所述的生物合成相關(guān)蛋白是SEQ ID N0.:37所示的糖基轉(zhuǎn)移酶。本發(fā)明第三方面,提供了一種越野他汀的生物合成相關(guān)基因,所述的合成相關(guān)基因編碼權(quán)本發(fā)明第二方面所述的越野他汀的生物合成相關(guān)蛋白。在另一優(yōu)選例中,所述的生物合成相關(guān)基因是選自以下基因的一種或多種:kstAl, kstA2, kstA3, kstDl, kstD2, kstD3, kstD4, kstD5, kstD6, kstD7, kstD8,kstD9, kstDIO, kstDll, kstD12,kstD13,kstD14, kstBl,kstB2,kstEl,kstE2,kstE3,kstE4,kstE5, kstE6, kstCl, kstC2, kstC3, kstC4, kstC5, kstC6, kstC7, kstC8, kstC9, kstFl,kstF2, kstF3, kstF4, kstF5, kstF6, kstRsl,kstRs2, kstRs3, kstRs4, kstRs5, kstRs6,kstRs7, kstRgl, kstRg2, kstRg3, kstRg4, kstRg5。在另一優(yōu)選例中,所述合成相關(guān)基因的核苷酸序列的信息見(jiàn)表I。本發(fā)明第四方面,提供了一種本發(fā)明第一方面所述的越野他汀生物合成基因簇,或本發(fā)明第二方面所述的生物合成相關(guān)蛋白的用途,用于催化合成抗生素越野他汀及類似物。本發(fā)明第五方面,提供了一種表達(dá)載體,所述表達(dá)載體含有本發(fā)明第一方面所述的越野他汀的生物合成基因簇或本發(fā)明第三方面所述的越野他汀的生物合成相關(guān)基因。本發(fā)明第六方面,提供了一種重組的宿主細(xì)胞,所述宿主細(xì)胞含有本發(fā)明第五方面所述的表達(dá)載體,或其染色體上整合有外源的本發(fā)明第一方面所述的越野他汀的生物合成基因簇或本發(fā)明第三方面所述的越野他汀的生物合成相關(guān)基因。在另一優(yōu)選例中,所述重組的宿主細(xì)胞包括鏈霉菌、大腸桿菌。
本發(fā)明第七方面,提供了一種產(chǎn)生越野他汀的方法,包括步驟:培養(yǎng)本發(fā)明第六方面所述的宿主細(xì)胞,從而表達(dá)越野他汀,以及從培養(yǎng)物中分離越野他汀。本發(fā)明第七方面,提供了一種小單胞菌((Micromonospora sp),所述的小單胞菌中,本發(fā)明第一方面所述的越野他汀的生物合成基因簇中一個(gè)或多個(gè)基因被失活,從而不產(chǎn)生越野他汀。在另一優(yōu)選例中,所述的被失活基因選自kstBl,kstB2,或kstC5。本發(fā)明第八方面,提供了一種kstBl基因或其蛋白的用途,用于制備腺苷?;钢苿蛴糜诖呋佘挣;磻?yīng)。在另一優(yōu)選例中,所述的腺苷?;高x自下組:(a)氨基酸序列如SEQ ID N0.:3所示的蛋白;(b)包含(a)所限定的序列經(jīng)過(guò)一個(gè)或多個(gè)(較佳地1-10個(gè),更佳地1_5個(gè))氨基酸殘基的取代、缺失或添加而形成的序列,且基本具有(a)所限定的多肽功能的由(a)衍生的多肽。本發(fā)明第九方面,提供了一種kstB2基因或其蛋白的用途,用于制備肽酰載體蛋白制劑。在另一優(yōu)選例中,所述的肽酰載體蛋白選自下組:(a)氨基酸序列如SEQ ID N0.:4所示的蛋白;(b)包含(a) 所限定的序列經(jīng)過(guò)一個(gè)或多個(gè)(較佳地1-10個(gè),更佳地1-5個(gè))氨基酸殘基的取代、缺失或添加而形成的序列,且基本具有(a)所限定的多肽功能的由(a)衍生的多肽。本發(fā)明第十方面,提供了一種kstC5基因或其蛋白的用途,用于制備糖基轉(zhuǎn)移酶制劑。在另一優(yōu)選例中,所述的糖基轉(zhuǎn)移酶選自下組:(a)氨基酸序列如SEQ ID N0.:37所示的蛋白;(b)包含(a)所限定的序列經(jīng)過(guò)一個(gè)或多個(gè)(較佳地1-10個(gè),更佳地1-5個(gè))氨基酸殘基的取代、缺失或添加而形成的序列,且基本具有(a)所限定的多肽功能的由(a)衍生的多肽。應(yīng)理解,在本發(fā)明范圍內(nèi)中,本發(fā)明的上述各技術(shù)特征和在下文(如實(shí)施例)中具體描述的各技術(shù)特征之間都可以互相組合,從而構(gòu)成新的或優(yōu)選的技術(shù)方案。限于篇幅,在
此不再一一累述。
圖1顯示了越野他汀的化學(xué)結(jié)構(gòu)式,其中,圖1A為越野他汀(Kosinostatin,KST),圖1B為其異構(gòu)體異醌環(huán)素B (Isoquinocycline B, ISO)。圖2顯示了越野他汀生物合成基因簇的基因結(jié)構(gòu)和限制性內(nèi)切酶譜。其中,圖2A顯示了 2個(gè)不交疊的黏粒fMHM6-10-18、fZQ3_7和一個(gè)亞克隆質(zhì)粒pPsc6代表了小單抱菌Micromonospora sp.TP-A0468基因組已測(cè)序的82.5kb DNA區(qū)域,字母B代表限制性內(nèi)切酶Bam HI ;圖2B顯示了越野他汀生物合成基因簇的基因組成。
圖3顯不了越野他汀在小單抱菌Micromonospora sp.TP-A0468中的生物合成途徑。其中CoA:輔酶A ;ACP:?;d體蛋白;PCP:肽酰載體蛋白;1:越野他??;2:異醌環(huán)素B0圖4顯不了 Micromonospora sp.TP-A0468野生型菌株發(fā)酵產(chǎn)物的液相色譜-質(zhì)譜(LC-MS)分析。其中ISO:異醌環(huán)素B ;KST:越野他汀。圖5顯示了越野他汀生物合成基因簇相關(guān)性的證實(shí)與基因簇邊界確定。其中ISO:異醌環(huán)素 B ;KST:越野他汀;WT:Micromonospora sp TP-A0468 野生型菌株;Λ kstBl:kstBl基因置換突變株;Aorf(-2):orf (-2)基因中斷突變株;Λ orf (-1):orf(-l)基因中斷突變株;Aorf (+1):orf(+l)基因中斷突變株;Λ orf (+2):orf(+2)基因中斷突變株。由圖5可見(jiàn),敲除orf (-1)與orf(+l)之間的基因,對(duì)越野他汀的產(chǎn)生造成影響;相反,敲除其他基因,對(duì)越野他汀的產(chǎn)生沒(méi)有影響。圖6顯示了糖基合成相關(guān)基因置換突變菌株發(fā)酵產(chǎn)物的高效液相-質(zhì)譜聯(lián)用(LC-MS)分析。圖6A:野生型發(fā)酵產(chǎn)物;圖6B:kstC8基因置換的突變體發(fā)酵產(chǎn)物;圖6C:kstC3基因置換的突變體發(fā)酵產(chǎn)物;圖6D:B中化合物I的[M+H]+分子量;圖6E:B中化合物2的[M+H] +分子量;圖6F:C中化合物I的[M+H] +分子量;圖6G:C中化合物2的[M+H] +分子量。其中,ISO:異醌環(huán)素B ;KST:越野他汀。1:化合物I,即異醌環(huán)素B脫糖基產(chǎn)物;2:化合物H,即越野他汀脫糖基產(chǎn)物。由圖6可見(jiàn),敲除kstBl、kstD3等基因之后,相關(guān)突變株不再產(chǎn)生越野他汀。敲除kstC3、kstC7、kstC8等基因之后,相關(guān)突變株能夠產(chǎn)生越野他汀脫去糖基的類似物。圖7顯示了 k stBl和kstB2基因功能的研究。圖7A腺苷化酶保守區(qū)域氨基酸殘基分析。Al-AlO:腺苷?;钢械?0個(gè)保守氨基酸基序。圖7B腺苷?;?KstBl)與肽酰載體蛋白(KstB2)在大腸桿菌中的異源表達(dá)。2,3:蛋白標(biāo)準(zhǔn)大小;1:異源表達(dá)純化后的KstBl ;4:異源表達(dá)純化后的KstB2。圖7C腺苷?;窴stBl活化煙酸并轉(zhuǎn)移到KstB2上形成煙酰-KstB2。PCP:肽酰載體蛋白,及KstB2 ;1:apo形式的KstB2 ;2:holo形式的KstB2 ;3:煙酰-KstB2。由圖7可見(jiàn),KstBl能夠活化煙酸并將煙酸轉(zhuǎn)移到肽酰載體蛋白(PCP,KstB2)上形成煙酰-PCP,這是含氮邊鏈合成的起始步驟。圖8顯示了越野他汀生物合成基因簇中部分基因的敲除實(shí)驗(yàn)結(jié)果:驗(yàn)證正確的基因敲除突變株與野生型同時(shí)進(jìn)行發(fā)酵,發(fā)酵之后的提取液用HPLC檢測(cè)。HPLC結(jié)果能夠反映基因的敲除是否對(duì)越野他汀的產(chǎn)生造成影響,以及基因敲除突變株中是否有新化合物出現(xiàn)。WT:小單孢菌M.sp.TP-A0468野生型;IS0:異醌環(huán)素B ;KST,越野他汀。由圖8A-L可見(jiàn),在各個(gè)基因敲除突變株中,有的完全中斷了越野他汀的產(chǎn)生,有的產(chǎn)量有所變化,有的有新化合物出現(xiàn)。圖9顯示了越野他汀生物合成基因簇中部分基因在大腸桿菌中的異源表達(dá)結(jié)果,其中,純化之后的基因表達(dá)產(chǎn)物用SDS-聚丙烯酰胺凝膠電泳(SDS-PAGE)檢測(cè)大小與純度。在每幅電泳圖中M標(biāo)的條帶表蛋白標(biāo)準(zhǔn)分子量,相應(yīng)的基因表達(dá)廣物在條帶的上方標(biāo)出。圖10顯示了基因敲除重組質(zhì)粒的構(gòu)建方法。圖11顯不了糖基轉(zhuǎn)移酶基因kstC5功能研究kstC5敲除的突變株(Λ kstC5)產(chǎn)生化合物22和化合物22a,與野生型的產(chǎn)物越野他汀、異醌環(huán)素B相比,化合物22和22a缺失了乙酰糖基單元;不含KstC5的突變株細(xì)胞裂解液不能催化22/22a轉(zhuǎn)化為越野他汀/異醌環(huán)素B,而包含KstC5的野生型細(xì)胞裂解液可以。由此可見(jiàn),糖基轉(zhuǎn)移酶基因kstC5編碼產(chǎn)物的功能是將乙酰糖基單元轉(zhuǎn)移到化合物22和22a上,形成最終的產(chǎn)物越野他汀(KST)和異醌環(huán)素B (ISO)。
具體實(shí)施例方式本發(fā)明人經(jīng)過(guò)廣泛而深入的研究,以小單孢菌來(lái)源的越野他汀為目標(biāo)分子,從克隆其在Micromonospora sp.TP-A0468中的生物合成基因簇出發(fā),采用微生物學(xué)、分子生物學(xué)、生物信息學(xué)、生物化學(xué)及有機(jī)化學(xué)相結(jié)合的方法研究其生物合成,首次鑒定了越野他汀的生物合成基因簇,具體地,所述基因簇包括55個(gè)基因:17個(gè)II型聚酮合成酶PKS相關(guān)基因,8個(gè)非核糖體聚 肽合成酶NRPS相關(guān)基因,9個(gè)與乙?;奶腔铣上嚓P(guān)的基因,6個(gè)負(fù)責(zé)吡咯吡咯二并環(huán)形成的后修飾基因,7個(gè)抗性基因,5個(gè)調(diào)節(jié)基因,3個(gè)對(duì)越野他汀的生物合成無(wú)明顯作用的基因。在此基礎(chǔ)上,完成了本發(fā)明。越野他汀越野他汀(Kosinostatin,結(jié)構(gòu)如圖1A所不)是2002年由日本科學(xué)家TamotsuFurumai從富山灣深海中分離得到的小單抱菌Micromonospora sp.TP-A0468所產(chǎn)生的具有良好抗腫瘤抗菌活性的天然產(chǎn)物[J.Antibiot.(Tokyo) 55, 128 - 133(2002)]。越野他汀分子由三部分組成:蒽環(huán)骨架、含氮雜環(huán)以及?;拿撗跫禾菃卧?。其中的蒽環(huán)骨架是以II型PKS的方式合成的。人們認(rèn)為miniPKS —般由丙二酰-ACP經(jīng)過(guò)脫羧產(chǎn)生的乙酸單元轉(zhuǎn)移至KS活性位點(diǎn)而起始,而后KS催化ACP上丙二酰硫酯脫去二氧化碳形成碳負(fù)離子與KS上?;l(fā)生Claisen縮合在ACP上形成相應(yīng)的硫酯結(jié)構(gòu),接著轉(zhuǎn)移至KS活性位點(diǎn)而完成兩碳單元的延伸。當(dāng)聚酮通道充滿時(shí),聚酮酰-ACP離開(kāi)體系發(fā)生隨后的酮基還原、環(huán)化、氧化等后修飾。在化學(xué)定義上,蒽環(huán)類抗生素為7,8,9,10-四氫-5,12-萘并醌的衍生物,一般呈現(xiàn)紅色或橙色。從生物合成角度看,蒽環(huán)類抗生素是由II型PKS體系催化形成的。在這一催化體系中,KS a,KS β與ACP是II型PKS的核心蛋白,它們通過(guò)相互作用形成minimalPKS異源復(fù)合物。其中的KSa負(fù)責(zé)催化合成砌塊之間的Claisen縮合,從而將C鏈延長(zhǎng);而1 3控制著Claisen縮合發(fā)生的次數(shù),從而決定最終形成的C鏈的長(zhǎng)度,因此又稱為鏈延伸因子(CLF) 0合成過(guò)程中的聚酮鏈結(jié)合在ACP上形成聚酮酰ACP。合成結(jié)束后的聚酮鏈與KSa、KS β脫離,經(jīng)環(huán)化、氧化、還原、甲基化以及其它一些后修飾形成成熟的蒽環(huán)骨架結(jié)構(gòu)。(如圖3所示)在越野他汀的生物合成過(guò)程中同時(shí)會(huì)產(chǎn)生它的異構(gòu)體異醌環(huán)素B (如圖1B所示),它們的不同之處在于螺環(huán)中心C原子的立體構(gòu)型不同。二者純化后在溶液中亦會(huì)發(fā)生緩慢的自發(fā)轉(zhuǎn)化。
體外生化實(shí)驗(yàn)顯示越野他汀抑制人DNA拓?fù)洚悩?gòu)酶1、II,其IC50分別為10-30 μ M 和 3-10 μ M[J.Antibiot.(Tokyo) 55,128 - 133 (2002)]。異醌環(huán)素 B 的抗菌活性只有越野他汀的十分之一,而越野他汀和異醌環(huán)素B脫去糖基之后的糖苷部分生物活性均急劇降低。推測(cè)原因是越野他汀與異醌環(huán)素及它們的糖苷相比,具有更高的細(xì)胞通透性和更高的DNA親和能力。對(duì)于革蘭氏陽(yáng)性菌,越野他汀具有良好的生物活性;對(duì)于革蘭氏陰性菌和酵母,越野他汀具有中等的生物活性;對(duì)于腫瘤細(xì)胞,越野他汀具有良好的生物活性(IC5tl約為
0.10 μ M),其抗腫瘤活性要優(yōu)于阿霉素。越野他汀生物合成基因簇的確定首先,根據(jù)已經(jīng)報(bào)道的蒽環(huán)類抗生素KSa和KSP的氨基酸序列,分析它們的保守序列,設(shè)計(jì)了簡(jiǎn)并引物(For(KS):ATCACCGTGGCCTGYTTYGAYGCSATC-3’ (SEQ ID N0.:57),Rev (CLF):CCGGTGTTGACSGSRTAGAACCANGC (SEQ ID N0.:58);其中,S=C 或 G, Y=C 或 T, R=A 或G)進(jìn)行PCR,從Micromonospora sp TP-A1304基因組DNA中擴(kuò)增得到了 1.1kb的片段,克隆入pGEM-T Easy載體。DNA序列分析表明插入片段的一端與諾加霉素生物合成中的鏈延伸因子Snoa2同源性最高[Identities=68%,Positives=78%],而另一端與諾加霉素生物合成中的酮基合成酶Snoal同源性最高[Identities=79%, Positives=85%],因此,該片段很可能與越野他汀的生物合成相關(guān)。將上述克隆得到的基因片段進(jìn)行地高辛標(biāo)記,用于文庫(kù)篩選。對(duì)篩選到的正確黏粒測(cè)序,利用已知序 列信息進(jìn)行染色體步移,直至得到的黏粒能夠完整地覆蓋整個(gè)基因簇。使用基因簇序列同源性在線分析軟件FramePlot4.0beta(http: //nocardia.nih.g0.1p/fE4/),對(duì)所獲得的82,504bp核苷酸序列進(jìn)行的分析發(fā)現(xiàn)了 75個(gè)orf和I個(gè)不完整的orf (圖 2B)。目的蛋白氨基酸序列同源性分析是使用美國(guó)國(guó)家生物信息中心提供的Blast搜索引擎(http: //www.ncb1.nlm.nih.gov/blast/)。序列中各個(gè)基因?qū)?yīng)的核苷酸位置和編碼蛋白功能的生物信息學(xué)分析結(jié)果如表I所示(與越野他汀生物合成不相關(guān)的基因僅顯示了一部分)。以上內(nèi)容表明,越野他汀的生物合成基因簇是通過(guò)同源序列克隆得到,同時(shí),越野他汀生物合成基因簇中的保守基因也可以用作同源探針或者其他形式的同源參考序列來(lái)篩選與越野他汀類似的次級(jí)代謝產(chǎn)物的生物合成基因簇。表I
權(quán)利要求
1.一種越野他汀的生物合成基因簇,其特征在于,所述基因簇包括編碼越野他汀生物合成所涉及的55個(gè)基因,具體為:1)II 型聚酮合成酶 PKS 相關(guān)基因:kstAl, kstA2, kstA3, kstDl, kstD2, kstD3, kstD4,kstD5, kstD6, kstD7, kstD8, kstD9, kstDIO, kstDll, kstD12, kstD13, kstD14 ;共 17 個(gè)基因: kstAl位于基因簇核苷酸序列第9943-11505位,編碼腺苷?;?,長(zhǎng)度為422個(gè)氨基酸; kstA2位于基因簇核苷酸序列第11507-11770位,編碼肽酰載體蛋白(PCP),長(zhǎng)度為402個(gè)氨基酸; kstA3位于基因簇核苷酸序列第26548-26805位,編碼?;d體蛋白,長(zhǎng)度為85個(gè)氨基酸; kstDl位于基因簇核苷酸序列第9140-9946位,編碼2,3-環(huán)環(huán)化酶,長(zhǎng)度為268個(gè)氨基酸; kstD2位于基因簇核苷酸序列第20823-216026位,編碼酮基還原酶,長(zhǎng)度為259個(gè)氨基酸; kstD3位于基因簇核苷酸序列第22658-21699位,編碼芳香化酶,長(zhǎng)度為319個(gè)氨基酸; kstD4位于基因簇核苷酸序列第23481-22696位,編碼C-9位酮基還原酶,長(zhǎng)度為261個(gè)氨基酸; kstD5位于基因簇核苷酸序列第23591-24049位,編碼單氧化酶,長(zhǎng)度為152個(gè)氨基酸; kstD6位于基因簇核苷酸序列第26861-27295位,編碼第四環(huán)環(huán)化酶,長(zhǎng)度為144個(gè)氨基酸; kstD7位于基因簇核苷酸序列第27391-28233位,編碼NAD⑵H:黃素氧化還原酶,長(zhǎng)度為280個(gè)氨基酸; kstD8位于基因簇核苷酸序列第28260-29156位,編碼單氧化酶,長(zhǎng)度為298個(gè)氨基酸; kstD9位于基因簇核苷酸序列第32267-33358位,編碼羧酸酯酶,長(zhǎng)度為363個(gè)氨基酸; kstDIO位于基因簇核苷酸序列第32267-33358位,編碼第四環(huán)環(huán)化酶,長(zhǎng)度為150個(gè)氨基酸; kstDll位于基因簇核苷酸序列第52203-51685位,編碼脫氫酶,長(zhǎng)度為172個(gè)氨基酸;kstD12位于基因簇核苷酸序列第54953-54498位,編碼羥化酶,長(zhǎng)度為151個(gè)氨基酸;kstD13位于基因簇核苷酸序列第60078-58579位,編碼FAD依賴的或者包含BBE結(jié)構(gòu)域的氧化還原酶,長(zhǎng)度為499個(gè)氨基酸; kstD14位于基因簇核苷酸序列第60258-61118位,編碼甲基轉(zhuǎn)移酶,長(zhǎng)度為286個(gè)氨基酸; 2)非核糖體聚妝合成酶NRPS 相關(guān)基因:kstBl, kstB2, kstEl, kstE2, kstE3, kstE4,kstE5, kstE6 ;共 8 個(gè)基因:kstBl位于基因簇核苷酸序列第9943-11505位,編碼NRPS腺苷化酶,長(zhǎng)度為520個(gè)氨基酸; kstB2位于基因簇核苷酸序列第11507-11770位,編碼?;d體蛋白,長(zhǎng)度為87個(gè)氨基酸; kstEl位于基因簇核苷酸序列第13618-13992位,編碼L-ectoine合成酶,長(zhǎng)度為124個(gè)氨基酸; kstE2位于基因簇核苷酸序列第14017-15156位,編碼?;o酶A脫氫酶,長(zhǎng)度為379個(gè)氨基酸; kstE3位于基因簇核苷酸序列第55079-55924位,編碼羥化酶,長(zhǎng)度為281個(gè)氨基酸; kstE4位于基因簇核苷酸序列第58555-57470位,編碼雙氧化酶,長(zhǎng)度為361個(gè)氨基酸; kstE5位于基因簇核苷酸序列第61163-61852位,編碼氨基轉(zhuǎn)移酶,長(zhǎng)度為229個(gè)氨基酸; kstE6位于基因簇核苷酸序列第63435-64280位,編碼脫甲酰酶,長(zhǎng)度為281個(gè)氨基酸; 3)乙酸化的糖基合成相關(guān)基因:kstCl,kstC2, kstC3, kstC4, kstC5, kstC6, kstC7,kstC8, kstC9 ;共 9 個(gè)基因: kstCl位于基因簇核苷酸序列第19574-18678位,編碼dTDP-葡萄糖合成酶,長(zhǎng)度為298個(gè)氨基酸; kstC2位于基因簇核苷酸序列第19786-20775位,編碼dTDP-葡萄糖-4,6-脫水酶,長(zhǎng)度為329個(gè)氨基酸; kstC3位于基因簇核苷酸序列第37944-37360位,編碼3,5-表異構(gòu)酶,長(zhǎng)度為194個(gè)氨基酸; kstC4位于基因簇核苷酸序列第38165-39175位,編碼糖基轉(zhuǎn)移酶輔助蛋白,長(zhǎng)度為336個(gè)氨基酸; kstC5位于基因簇核苷酸序列第39198-40496位,編碼糖基轉(zhuǎn)移酶,長(zhǎng)度為432個(gè)氨基酸; kstC6位于基因簇核苷酸序列第40496-41992位,編碼2,3-己糖脫水酶,長(zhǎng)度為498個(gè)氨基酸; kstC7位于基因簇核苷酸序列第41989-43014位,編碼丙酮酸脫氫酶α亞基,長(zhǎng)度為341個(gè)氨基酸; kstC8位于基因簇核苷酸序列第43031-44068位,編碼丙酮酸脫氫酶β亞基,長(zhǎng)度為345個(gè)氨基酸; kstC9位于基因簇核苷酸序列第53344-52361位,編碼己糖_3_酮基還原酶,長(zhǎng)度為327個(gè)氨基酸; 4)負(fù)責(zé)吡咯吡咯二并環(huán)形成的后修飾基因:kstFl,kstF2,kstF3,kstF4,kstF5,kstF6 ;共6個(gè)基因: kstFl位于基因簇核苷酸序列第11773-12807位,編碼鄰氨基苯甲酸磷酸核糖轉(zhuǎn)移酶,長(zhǎng)度為344個(gè)氨基酸;kstF2位于基因簇核苷酸序列第12800-13621位,編碼色氨酸合成酶α亞基,長(zhǎng)度為273個(gè)氨基酸; kstF3位于基因簇核苷酸序列第15160-15855位,編碼鄰氨基苯甲酸磷酸核糖異構(gòu)酶,長(zhǎng)度為231個(gè)氨基酸; kstF4位于基因簇核苷酸序列第15920-16618位,編碼吲哚甘油_3_磷酶合成酶,長(zhǎng)度為232個(gè)氨基酸; kstF5位于基因簇核苷酸序列第54495-53452位,編碼Enoyl還原酶,長(zhǎng)度為347個(gè)氨基酸; kstF6位于基因簇核苷酸序列第61849-63372位,編碼羧化酶,長(zhǎng)度為507個(gè)氨基酸; 5)抗性基因:kstRsl,kstRs2, kstRs3, kstRs4, kstRs5, kstRs6, kstRs7 ;共 7 個(gè)基因 kstRsl位于基因簇核苷酸序列第30224-31300位,編碼ABC轉(zhuǎn)運(yùn)蛋白,長(zhǎng)度為358個(gè)氨基酸; kstRs2位于基因 簇核苷酸序列第31297-32130位,編碼ABC轉(zhuǎn)運(yùn)蛋白,長(zhǎng)度為277個(gè)氨基酸; kstRs3位于基因簇核苷酸序列第35584-34109位,編碼外排蛋白,長(zhǎng)度為491個(gè)氨基酸; kstRs4位于基因簇核苷酸序列第36608-35625位,編碼轉(zhuǎn)運(yùn)蛋白,長(zhǎng)度為327個(gè)氨基酸; kstRs5位于基因簇核苷酸序列第44236-47025位,編碼SNF2/RAD54家族解螺旋酶,長(zhǎng)度為929個(gè)氨基酸; kstRs6位于基因簇核苷酸序列第47037-48338位,編碼抗性蛋白,長(zhǎng)度為433個(gè)氨基酸; kstRs7位于基因簇核苷酸序列第57431-56853位,編碼抗性蛋白,長(zhǎng)度為192個(gè)氨基酸; 6)調(diào)節(jié)基因:kstRgl,kstRg2, kstRg3, kstRg4, kstRg5,共 5 個(gè)基因: kgtRgl位于基因簇核苷酸序列第17553-16669位,編碼轉(zhuǎn)錄激活因子,長(zhǎng)度為294個(gè)氨基酸; kgtRg2位于基因簇核苷酸序列第29233-30021位,編碼轉(zhuǎn)錄調(diào)節(jié)因子,長(zhǎng)度為262個(gè)氨基酸; kgtRg3位于基因簇核苷酸序列第50317-49112位,編碼調(diào)節(jié)因子,長(zhǎng)度為401個(gè)氨基酸; kgtRg4位于基因簇核苷酸序列第51422-51649位,編碼調(diào)節(jié)因子,長(zhǎng)度為75個(gè)氨基酸; kgtRg5位于基因簇核苷酸序列第56007-56840位,編碼調(diào)節(jié)因子,長(zhǎng)度為277個(gè)氨基酸; 7)其他基因:kstUl,kstU2, kstU3 ;共 3 個(gè): kgtUl位于基因簇核苷酸序列第48388-48822位,編碼未知功能蛋白,長(zhǎng)度為144個(gè)氨基酸; kgtU2位于基因簇核苷酸序列第50774-50304位,編碼未知功能蛋白,長(zhǎng)度為156個(gè)氨基酸; kgtU3位于基因簇核苷酸序列第51216-50785位,編碼未知功能蛋白,長(zhǎng)度為143個(gè)氨基酸。
2.如權(quán)利要求1所述的基因簇,其特征在于,所述基因簇包括以下II型聚酮合成酶PKS 相關(guān)基因:kstAl, kstA2, kstA3, kstDl, kstD2, kstD3, kstD4, kstD5, kstD6, kstD7,kstD8, kstD9, kstDIO, kstDll, kstD12, kstD13 和 kstD14 ;和 / 或 以下非核糖體聚妝合成酶NRPS相關(guān)基因:kstBl, kstB2, kstEl, kstE2, kstE3, kstE4,kstE5 和 kstE6 ;和 / 或 以下乙酸化的糖基合成相關(guān)基因:kstCl, kstC2, kstC3, kstC4, kstC5, kstC6, kstC7,kstC8 和 kstC9 ;和 / 或 以下負(fù)責(zé)吡咯吡咯二并環(huán)形成的后修飾基因:kstFl, kstF2,kstF3,kstF4,kstF5,kstF6。
3.如權(quán)利要求1所述的基因簇,其特征在于,所述基因簇包括以下抗性基因:kstRsl,kstRs2, kstRs3, kstRs4, kstRs5, kstRs6 和 kstRs7 ;和 / 或以下調(diào)節(jié)基因:kstRgl, kstRg2, kstRg3, kstRg4 和 kstRg5。
4.如權(quán)利要求1所述的基因簇,其特征在于,所述基因簇的序列選自SEQIDN0.:1中第1-64280 位,第 9140-64280 位,或第 1-67842 位。
5.一種越野他汀的生物合成相關(guān)蛋白,其特征在于,所述的蛋白的氨基酸序列選自如SEQ ID N0.: 2-56所示的氨基酸序列。
6.越野他汀的生物合成相關(guān)基因,其特征在于,所述的合成相關(guān)基因編碼權(quán)利要求5所述的越野他汀的生物合成相關(guān)蛋白。
7.如權(quán)利要求1所述的越野他汀生物合成基因簇,或權(quán)利要求5所述的生物合成相關(guān)蛋白的用途,其特征在于,用于催化合成抗生素越野他汀及類似物。
8.—種表達(dá)載體,其特征在于,所述表達(dá)載體含有權(quán)利要求1所述的越野他汀的生物合成基因簇或權(quán)利要求6所述的越野他汀的生物合成相關(guān)基因。
9.一種重組的宿主細(xì)胞,其特征在于,所述宿主細(xì)胞含有權(quán)利要求8所述的表達(dá)載體,或其染色體上整合有外源的權(quán)利要求1所述的越野他汀的生物合成基因簇或權(quán)利要求6所述的越野他汀的生物合成相關(guān)基因。
10.一種產(chǎn)生越野他汀的方法,其特征在于,包括步驟:培養(yǎng)權(quán)利要求9所述的宿主細(xì)胞,從而表達(dá)越野他汀,以及從培養(yǎng)物中分離越野他汀。
11.一種小單胞菌((Micromonospora sp),其特征在于,所述的小單胞菌中,權(quán)利要求1所述的越野他汀的生物合成基因簇中一個(gè)或多個(gè)基因被失活,從而不產(chǎn)生越野他汀。
12.—種kstBl基因或其蛋白的用途,其特征在于,用于制備腺苷?;钢苿蛴糜诖呋佘挣;磻?yīng)。
13.—種kstB2基因或其蛋白的用途,其特征在于,用于制備肽酰載體蛋白制劑。
14.一種kstC5基因或其蛋白的用途,其特征在于,用于制備糖基轉(zhuǎn)移酶制劑。
全文摘要
本發(fā)明涉及越野他汀的生物合成基因簇,具體地,是由一種小單孢菌Micromonospora sp.TP-A0468產(chǎn)生的具有抗腫瘤活性的蒽環(huán)類抗生素——越野他汀的生物合成基因簇的克隆、測(cè)序、分析、功能研究及其應(yīng)用。整個(gè)基因簇共包含55個(gè)基因17個(gè)II型聚酮合成酶(PKS)相關(guān)基因;8個(gè)非核糖體聚肽合成酶(NRPS)相關(guān)基因;9個(gè)糖基合成相關(guān)基因;6個(gè)特殊的后修飾基因;7個(gè)抗性基因;5個(gè)調(diào)節(jié)基因以及3個(gè)無(wú)明確功能的基因。通過(guò)對(duì)上述生物合成基因的遺傳操作可阻斷越野他汀的生物合成,或使其產(chǎn)量發(fā)生改變,或產(chǎn)生新的化合物。該基因簇可用于蒽環(huán)類化合物的基因工程、蛋白表達(dá)、酶催化反應(yīng)等,也可用于尋找和發(fā)現(xiàn)用于醫(yī)藥、工業(yè)或農(nóng)業(yè)的化合物或基因、蛋白。
文檔編號(hào)C12N1/20GK103215282SQ20131012178
公開(kāi)日2013年7月24日 申請(qǐng)日期2013年4月9日 優(yōu)先權(quán)日2013年4月9日
發(fā)明者唐功利, 馬宏敏, 周強(qiáng), 張轉(zhuǎn) 申請(qǐng)人:中國(guó)科學(xué)院上海有機(jī)化學(xué)研究所