專利名稱:具有增強的產(chǎn)量相關性狀的植物及其制備方法
具有增強的產(chǎn)量相關性狀的植物及其制備方法本發(fā)明總體上涉及分子生物學領域并涉及用于通過調(diào)節(jié)植物中編碼 PATL (PATELLIN)多肽或PRP38 (RNA加工因子前體38)或GATA樣多肽或ADA2 (轉(zhuǎn)錄銜接頭 2)多肽或WDR23樣多肽的核酸的表達而增強植物產(chǎn)量相關性狀的方法。本發(fā)明也涉及具有 編碼PATL多肽或PRP38或GATA樣或ADA2多肽或WDR23樣的核酸的受調(diào)節(jié)表達的植物,所 述植物相對于對應野生型植物或其他對照植物具有增強的產(chǎn)量相關性狀。本發(fā)明也提供了 在本發(fā)明方法中有用的迄今未知的PATL或PRP38或GATA樣或ADA2或DR23樣核酸和構建 體。 在一個實施方案中,本發(fā)明還涉及用于通過調(diào)節(jié)編碼GATA樣多肽的核酸在植物 中的表達來改善植物生長特征的方法。本發(fā)明還涉及具有編碼GATA樣多肽的核酸的受 調(diào)節(jié)的表達的植物,所述植物相對于對應的野生型植物或其他對照植物具有改善的生長特 征。本發(fā)明也提供了在本發(fā)明方法中有用的構建體。在另一個實施方案中,本發(fā)明還涉及用于通過增加編碼WD40重復(WDR) 23樣多肽 的核酸序列在植物中的表達來增強各種植物產(chǎn)量相關性狀的方法。本發(fā)明還涉及具有編碼 WD 23樣多肽的核酸的增加的表達的植物,所述植物相對于對照植物具有增強的產(chǎn)量相關 性狀。此外,本發(fā)明涉及編碼具有上述植物產(chǎn)量增加活性的上述多肽的特定核酸序列、包含 所述核酸序列的核酸構建體、載體和植物。持續(xù)增長的世界人口和農(nóng)業(yè)用可耕地供應萎縮刺激了有關提高農(nóng)業(yè)效率的研究。 常規(guī)的作物及園藝學改良手段利用選擇育種技術以鑒定具有受歡迎特征的植物。然而,此 類選擇育種技術具有幾個缺陷,即這些技術一般耗費很多勞動并且產(chǎn)生這樣的植物,其經(jīng) 常含有異源的遺傳組分,其可能不總導致受歡迎性狀從親代植物傳遞下去。分子生物學進 展已經(jīng)允許人類改良動物及植物的種質(zhì)。植物的遺傳工程使得可以分離和操作遺傳物質(zhì) (一般處于DNA或RNA形式)并且隨后導入該遺傳物質(zhì)至植物中。此類技術具有產(chǎn)生具備 多種經(jīng)濟學、農(nóng)學或園藝學改良性狀的作物或植物的能力。具有特殊經(jīng)濟意義的性狀是提高的產(chǎn)量。產(chǎn)量通常定義為來自作物的經(jīng)濟價值的 可測量結(jié)果。該結(jié)果可以就數(shù)量和/或品質(zhì)方面進行定義。產(chǎn)量直接取決于幾個因素,例 如器官的數(shù)目和大小、植物構造(例如枝的數(shù)目)、種子產(chǎn)生、葉衰老等。根發(fā)育、養(yǎng)分攝入、 脅迫耐受性和早期生長勢(early vigor)也可以是決定產(chǎn)量的重要因素。優(yōu)化前述因素因 而可以有助于提高作物產(chǎn)量。種子產(chǎn)量是特別重要的性狀,因為許多植物的種子對人和動物營養(yǎng)是重要的。作 物如谷物、稻、小麥、卡諾拉油菜和大豆占超過一半的人類總熱量攝入,無論通過直接消費 種子本身或通過消費基于加工的種子而產(chǎn)生的肉產(chǎn)品。作物也是糖、油及工業(yè)加工中所用 許多類型代謝物的來源。種子含有胚(新枝條(Shoot)和新根的起源)和胚乳(萌發(fā)期間 和籽苗早期生長期間用于胚生長的養(yǎng)分來源)。種子發(fā)育涉及多種基因并且需要代謝物從 根、葉和莖轉(zhuǎn)移至正在生長的種子中。胚乳尤其同化糖類、油和蛋白質(zhì)的代謝前體并且將它 們合成為貯藏大分子以灌滿籽粒。植物生物量是飼料作物如苜蓿、飼用谷物和干草的產(chǎn)量。產(chǎn)量的許多代用物已經(jīng)用于谷物作物。它們當中主要是對植物尺寸的估計。植物尺寸可以根據(jù)物種和發(fā)育階段以多種方式測量,不過包括總植物干重、地上部分干重、地上部分鮮重、葉面積、莖體積、植物 高度、蓮座叢直徑、葉長度、根長度、根質(zhì)量、分蘗數(shù)和葉數(shù)。許多物種維持在給定發(fā)育階段 上植物不同部分的尺寸之間的保守比率。這些異速增長關系用來從這些尺寸量值之一外推 至另一種尺寸量值(例如 Tittonell 等,2005Agric Ecosys & Environ 105:213)。在發(fā)育 早期的植物尺寸一般與發(fā)育中稍后的植物尺寸相關。具有較大葉面積的較大植物通常可以 比較小的植物吸收更多光線和二氧化碳并且因而可能會在相同的時段期間獲得更大重量 (Fasoula和Tollenaar 2005 Maydica 50:39)。此外,這也是植物應當初始實現(xiàn)較大尺寸 的微環(huán)境優(yōu)勢或遺傳優(yōu)勢的潛在延續(xù)。存在針對植物尺寸和生長速率的強遺傳組分(例如 ter Steege等,2005 PlantPhysiology 139 1078),并且因而對于一系列各異遺傳表型,在 一種環(huán)境條件下的植物尺寸很可能關聯(lián)于另一種環(huán)境條件下的尺寸(Hittalmani等,2003 Theoretical AppliedGenetics 107:679)。以這種方式,使用標準環(huán)境作為作物在田間于 不同位置及時間所遭遇的多樣且動態(tài)環(huán)境的代用物。對于許多作物的另一個重要性狀是早期生長勢。改善早期生長勢是現(xiàn)代稻育種計 劃在溫帶和熱帶稻品種方面的重要目標。長根對于水栽稻中正確土壤固定是重要的。在稻 直接播種至被淹沒田地的情況下,以及在植物必須從水中迅速萌發(fā)的情況下,較長的枝條 與生長勢相關。在實施條播的情況下,較長的中胚軸和胚芽鞘對良好出苗是重要的。將早 期生長勢人工改造到植物內(nèi)的能力在農(nóng)業(yè)中將是極重要的。例如,不良的早期生長勢已經(jīng) 限制了基于玉米帶種質(zhì)(Corn Belt germplasm)在歐洲大西洋地區(qū)引種玉米(Zea mayes L.)雜種。收獲指數(shù)即種子產(chǎn)量對地上部分干重的比率在許多環(huán)境條件下是相對穩(wěn)定的并 且因而可以經(jīng)常獲得植物尺寸與谷物產(chǎn)量之間的強相關(例如Rebetzke等,2002 Crop Science 42:739)。這些過程是內(nèi)在聯(lián)系的,因為谷物生物量的主要部分取決于植物葉和 蓮的現(xiàn)有和儲備光合生產(chǎn)率(Gardener等,1985 Physiology of Crop Plants. Iowa State UniversityPress,第68-73頁)。因此,選擇植物尺寸(甚至在發(fā)育的早期)已經(jīng)用作未來 潛在產(chǎn)能的指示物(例如 Tittonell 等,2005 Agric Ecosys & Environl05 :213)。當檢驗 遺傳差異對脅迫耐受性的影響時,使土壤屬性、溫度、水和養(yǎng)分有效性和光強度標準化的能 力是溫室或植物生長室環(huán)境與田間相比的固有優(yōu)勢。然而,產(chǎn)量因不良授粉所致的人為限 制可能限制這些受控環(huán)境檢驗產(chǎn)量差異的用途,其中所述的不良授粉因缺少風和昆蟲或成 熟根或根冠生長的足夠空間引起。因此,在標準化條件下在生長室或溫室測量發(fā)育早期的 植物尺寸是提供潛在遺傳產(chǎn)量優(yōu)勢指示的標準操作。另一個重要性狀是改良的非生物性脅迫耐受性。非生物性脅迫是世界范圍作物 損失的主要原因,對于大多數(shù)主要作物植物而言平均產(chǎn)量降低超過50% (Wang等,(2003) Planta 218:1_14)。非生物性脅迫可以由干旱、鹽度、極端溫度、化學毒性養(yǎng)分、(大分子和 /或微量元素)過量或匱乏、輻射和氧化脅迫引起。提高植物的非生物性脅迫耐受性能力將 在世界范圍對農(nóng)民是巨大的經(jīng)濟優(yōu)勢并且將允許在不利條件期間及在本來不可能栽培作 物的陸地上栽培作物。因而可以通過優(yōu)化前述因素之一提高作物產(chǎn)量。取決于最終用途,對某些產(chǎn)量性狀的改良可能優(yōu)先于其它產(chǎn)量性狀。例如對于應用如飼料或木材生產(chǎn)或生物燃料資源而言,增加植物營養(yǎng)體部分可能是希望的,而對于應用如面粉、淀粉或油生產(chǎn)而言,種子參數(shù)提高可能是特別希望的。即便在種子參數(shù)當中,某 些參數(shù)可以更優(yōu)先于其它參數(shù),這取決于用途。多種機制可以有助于提高種子產(chǎn)量,無論其 形式為提高的種子尺寸或提高的種子數(shù)目。增強植物中產(chǎn)量相關性狀(種子產(chǎn)量和/或生物量)的一種方法可以是通過調(diào)節(jié) 植物的內(nèi)在生長機制如細胞周期或參與植物生長或參與防御機制的多種信號傳導途徑。現(xiàn)在已經(jīng)發(fā)現(xiàn)可以通過調(diào)節(jié)植物中編碼PATL(Patellin)多肽或PRP38 (RNA加工 因子前體38)或ADA2(轉(zhuǎn)錄銜接頭2)多肽或WD40重復(WDR) 23樣多肽的核酸的表達而增 強植物中多種產(chǎn)量相關性狀又發(fā)現(xiàn)可通過調(diào)節(jié)植物中編碼GATA樣(目的蛋白)的核酸表達而改善多種生長 特征。增強的產(chǎn)量相關性狀包含以下一項或多項提高的每株植物種子總產(chǎn)量、提高的 種子飽滿率、提高的種子充數(shù)量、提高的收獲指數(shù)或提高的千粒重。脂類(lipids)是在非極性溶劑(如氯仿或醚)中可溶的物質(zhì)。脂類是活生物體 中的必需成分。如糖脂、磷脂和膽固醇的脂類是細胞膜的關鍵結(jié)構成分,而甘油三酯是生物 能源分子。磷脂酰肌醇(PtdIns)和磷脂酰膽堿(PtdCho)是磷脂的實例。脂類和蛋白質(zhì)間 的相互作用在將涉及多種過程(如細胞信號發(fā)放和細胞增殖)的蛋白質(zhì)和糖脂靶向至特 定的膜和細胞內(nèi)部位中起作用。多種蛋白質(zhì)與脂類的生物合成、轉(zhuǎn)運和吸收相關。此外, 涉及信號轉(zhuǎn)導和蛋白質(zhì)導向的關鍵蛋白質(zhì)具有翻譯后附加至其的脂類衍生基團(Stryer, L. (1995)Biochemistry, W. H. Freeman 和 Co.,New York N. Y.,第 264-267 頁,934)。磷脂酰肌醇/磷脂酰膽堿轉(zhuǎn)移蛋白質(zhì)(PIPT)是通過促進在真核細胞的不同 膜區(qū)室中轉(zhuǎn)移,而涉及PtdIns和PtdCho代謝協(xié)調(diào)的遍在蛋白質(zhì)。在酵母中,主要的 PIPT是SEC14蛋白質(zhì),它是從高爾基體外側(cè)網(wǎng)絡分泌必需的(Bankatis等,1989,J. Cell Biol. 108:1271-81)。在植物和其他高等生物中發(fā)現(xiàn)了類似的蛋白質(zhì)。在植物中,幾種 SEC14同源物已被描述為與釀酒酵母(S. cereviSiae)SEC14蛋白質(zhì)具有約25%的氨基酸序 列相似性,在一些情況下,已通過secl4-l溫度敏感型酵母突變體的互補在實驗上驗證了 假定的Ptdlns/PtdCho轉(zhuǎn)移功能(Jouarmic等,1998)。據(jù)報道,植物SEC14蛋白質(zhì)在多種 生物學過程中發(fā)揮作用,如胞質(zhì)分裂、高滲脅迫誘導的信號發(fā)放途徑、多種膜間的小泡運輸 或結(jié)瘤作用期間的膜生物發(fā)生(Allen-Baume 等,2002 ;FEBsLetters 531 74-80 ;Peterman 等,2004.Plant Phys. 136:3080_3094 ;Monks 2001,Plant Cell 13:1205_19 ;Kapranov 等,2001 Plant Celll3 :1369_1382)。在擬南芥(Arabidopsisthaliana)中,已報道 Patellinl (PATLl)蛋白質(zhì)(SEC14 同源物蛋白質(zhì)家族成員)在胞質(zhì)分裂期間定位至細胞板和顯示具有PtdIns結(jié)合活性。 PATLl是擬南芥中六種蛋白質(zhì)的小家族的成員,其特征在于存在SEC14和GOLD (高爾基體動 力學)結(jié)構域這兩種保守結(jié)構域。SEC14結(jié)構域見于酵母的SEC14蛋白質(zhì)和見于RhoGAP、RhoGEF和asGAP、神經(jīng)纖維 瘤蛋白(NFl)。該結(jié)構域還見于多種可以作為視覺周期功能成分的視黃醛/維甲醛結(jié)合蛋 白質(zhì)的C端,和Trio蛋白質(zhì)中,Trio蛋白質(zhì)是整合和放大涉及肌動蛋白重建的信號的多功 能因子。SEC14有時稱為CRAL_TRI0結(jié)構域。SEC14結(jié)構域涉及脂類結(jié)合(Sha和Luo. 1999.,Biochim Biophys Acta. 1441 :268_77)。GOLD結(jié)構域是見于幾種真核高爾基體和脂類運輸?shù)鞍踪|(zhì)的蛋白質(zhì)組件。其長度一 般在90-150氨基酸之間。在GOLD結(jié)構域超家族中觀察到的大部分大小差異可追蹤至見于 該結(jié)構域的一些版本中的單個巨大的低復雜性插入片段。GOLD結(jié)構域存在于可與膜相互作 用,或在多種蛋白質(zhì)與細胞骨架絲的相互作用中有作用的蛋白質(zhì)中,如動物SEC14蛋白質(zhì) 或酵母氧固醇(oxysterol)結(jié)合蛋白質(zhì)同源物3 (0SH3)。預測GOLD結(jié)構域介導多中蛋白 質(zhì)-蛋白質(zhì)相互作用(Anantharaman 等,2002. Genome Biol. 3)。專利申請WO 2004/09014描述了涉及脅迫耐性的部分PATL蛋白質(zhì)。細胞中信使RNA(mRNA)的合成和功能需要包含轉(zhuǎn)錄、加工、轉(zhuǎn)運、翻譯和降解的一 系列事件。RNA加工指翻譯后修飾RNA的事件。在真核生物中,大多數(shù)新生前mRNA包含內(nèi) 含子,內(nèi)含子的切除導致外顯子的精確連接以產(chǎn)生成熟mRNA,成熟mRNA是被核糖體用來翻 譯為蛋白質(zhì)的RNA形式。RNA的轉(zhuǎn)錄后修飾還包含影響穩(wěn)定性和翻譯效率的5’端帽化和3’ 端聚腺苷化 。mRNA翻譯和周轉(zhuǎn)間的關系對基因表達調(diào)節(jié)和細胞正確發(fā)揮作用很關鍵。在真 核生物中,數(shù)十種蛋白質(zhì)涉及RNA代謝。這種蛋白質(zhì)的實例是前mRNA剪接因子PRP38。酵母PRP38是在前mRNA剪接缺陷的釀酒酵母的溫度敏感型突變體遺傳篩選中鑒 定的(Blanton等,1992,Mol. Cel. Biol. 12,3939-3947)。插入序列從真核前mRNA轉(zhuǎn)錄本的 切除發(fā)生于細胞核內(nèi)稱為剪接體的巨大的復雜結(jié)構上。剪接體通過兩個步驟的機制進行內(nèi) 含子切除,該機制包含(i)內(nèi)含子上在5’剪接位點切割和連接內(nèi)含子5’端核苷酸至3’端 附近的腺苷和(ii)在3’剪接位點切割和外顯子連接。剪接體的組裝通過Ul、l^U4/U6 和TO snRNP(小核糖核蛋白U1-U6)的相繼加入來進行。在組裝過程后期,U4從剪接體解 離。據(jù)信,導致前mRNA分子中內(nèi)含子切除的剪接的催化事件發(fā)生在U4解離之后。在酵母 中,據(jù)報道,PRP38對剪接體組裝不是必要的,但其是導致剪接體催化激活的構象變化必需 的(Xie 等,(1998) EMBO Journal 17 卷 pp. 2938-2946)。在擬南芥中,依照其與SR蛋白質(zhì)的序列相似性,PRP38蛋白質(zhì)(AtPRP38)被稱為 SRLl (SR 樣 1) (Forment 等,Plant J. 2002 年 6 月;30 (5) :511_9)。但是,PRP38 在結(jié)構上 不同于其他SR蛋白質(zhì)。SR蛋白質(zhì)一般包含RRM結(jié)構域(RNA結(jié)合結(jié)構域)和RS結(jié)構域 (Kalyna 和 Barta Biochem Soc Trans. 2004 32 :561_4·),而 AtPRP38 包含 RS 結(jié)構域但缺 少RRM結(jié)構域。WO 01/81599描述了用編碼幾種SR蛋白質(zhì)的核酸在酵母和植物中改良脅迫耐性 的方法。已發(fā)現(xiàn)SRLl及其他在前mRNA剪接中起作用的蛋白質(zhì)在植物對非生物脅迫的響應 中發(fā)揮重要作用(Lee 等,2006Plant Cell. Jul ;18 (7) 1736-49) GATA家族形成真核生物Cys2/Cys2型鋅指轉(zhuǎn)錄因子(見于如細胞狀黏菌、植物、 真菌、線蟲、昆蟲、棘皮動物、脊椎動物)中的主要家族之一,其包含1個或2個高度保守的 鋅指DNA結(jié)合結(jié)構域。DNA結(jié)合的共有序列是CX2CX17_2(ICX2C,并包含由保守的4個半胱氨酸 配位(coordinate)的鋅原子(Omichinski等,1993 ;Reyes等,2004)。此結(jié)構域之后一般 是堿性區(qū)域。其特征性地在GATA識別序列(A/T)GATA(A/G)處結(jié)合DNA (Martin和Orkin, 1990 ;Omichinski等,2003)。動物的GATA在第二和第三個半胱氨酸之間一般包含17個殘 基,而在真菌中這一數(shù)目可以是17-18 (很少是19或20)。植物在第二和第三個半胱氨酸之 間具有18或20個殘基。
在人類中,最初的GATAl被鑒定為促進球蛋白基因表達所需的轉(zhuǎn)錄因子(Pevny 等,1991)。第一種植物GATA(NTLl)作為粗糙鏈孢霉(Neurospora crassa)轉(zhuǎn)錄因子 NIT2(在氮限制條件中激活氮代謝酶基因表達的蛋白質(zhì))的植物同源物分離自煙草。NTLl 在第二和第三個半胱氨酸之間包含18個間隔(CX2CX18CX2C) (Daniel-Vedele和Caboche, 1997)。擬南芥和稻(Oryza sativa)基因組中分別存在29和28個編碼假定的GATA轉(zhuǎn)錄 因子(CX2CX18sa2ciCX2C)的基因座(Reyes等,2004)擬南芥僅具有帶一個GATA結(jié)構域的蛋白 質(zhì),而稻具有兩種包含兩個GATA結(jié)構域的蛋白質(zhì)和一種包含三個GATA結(jié)構域的蛋白質(zhì)。稻 轉(zhuǎn)錄因子數(shù)據(jù)庫(DRTF,Gao 等,Bioinformatics 2006,22,1286-1287)提出秈稻(Indica) 中有28種GATA,粳稻(Japonica)中有23種GATA。稻和擬南芥中的轉(zhuǎn)錄因子GATA家族可 以劃分為7個亞家族,這些亞家族中的一些在兩個物種中均存在,而其他亞家族是兩個物 種之一獨有的。GATA-樣蛋白質(zhì)(HAN)在強組成型35S啟動子控制下的異位表達嚴重地影響植物的生存力和發(fā)育(Zhao等,Plant Cell 16,2586-2600,2004)。轉(zhuǎn)化的植物矮小,具有異常 形成的葉和較小且畸形的花序。US2007/0250956公開OsGATAll及其對提高種子產(chǎn)量的用途。植物中的轉(zhuǎn)錄調(diào)節(jié)是許多生物學過程的基礎,如對環(huán)境的適應和代謝和生理平 衡的調(diào)節(jié)。因此,改變植物中的基因轉(zhuǎn)錄可導致植物生長和發(fā)育的顯著改變。這種特性 可用來改良作物植物的性能。存在數(shù)百種控制基因表達的基因,其中只有少數(shù)已顯示在 調(diào)節(jié)其在植物中的表達時對農(nóng)業(yè)的目的性狀具有有益作用(Vinocur和Altman,2005, CurrentOpinion in Biotechnology 16,123-132 ;Gutterson 禾口 Reuber 2004. Current Opinion in Plant Biology,7,465-471)。為增強產(chǎn)量性狀調(diào)節(jié)基因表達的可用性將有助 于改良作物性能,并最終有利于基于農(nóng)業(yè)的產(chǎn)業(yè)。在真核生物中,基因表達與導致啟動子變得更易于接近RNA聚合酶II和轉(zhuǎn)錄裝 置的其他成分的染色質(zhì)修飾相偶聯(lián)。兩類主要的蛋白質(zhì)復合物影響染色質(zhì)動力學。一類 包含ATP依賴的染色質(zhì)重建器(SWI/SNF相關復合物),第二類包含修飾組蛋白蛋白質(zhì)的復 合物。一種這類組蛋白修飾由組蛋白乙酰轉(zhuǎn)移酶(HAT)介導,可通過存在于核心組蛋白N 端中的特定賴氨酸殘基乙?;?Narlikar等,2002 Cell 108,475-487)。作為轉(zhuǎn)錄輔激活 物起作用的原型組蛋白乙酰轉(zhuǎn)移酶之一稱為Gcn5。在酵母中,Gcn5形成已知包含如ADA、 SAGA、SALSA和SLIK的銜接頭蛋白質(zhì)的不同蛋白質(zhì)復合物[18-20]。已在包括植物的高等 真核生物中鑒定了同源復合物。在擬南芥中,已描述了兩種編碼ADA2蛋白質(zhì)的旁系同源基 因(Stockinger 等,2001 Nucleic acid research 29,1524-1533)。通用轉(zhuǎn)錄因子募集RNA聚合酶II至啟動子的TATA框,而轉(zhuǎn)錄激活因子結(jié)合至稱 為上游激活位點(UAS)的特定DNA序列。通用轉(zhuǎn)錄因子可直接或通過銜接頭蛋白質(zhì)與轉(zhuǎn) 錄激活因子相互作用。雖然也已經(jīng)描述了通過DNA結(jié)合結(jié)構域的相互作用,但銜接頭蛋白 質(zhì)一般通過激活結(jié)構域與轉(zhuǎn)錄激活因子相互作用(Mao等,2006. Biochimica etBiophysica Acta 1759 69-79)。在擬南芥中,據(jù)報道ADA2蛋白質(zhì)增強GCN5在體外乙?;M蛋白的能力和調(diào)節(jié) GCN5的底物特異性。此外,GCN5可在植物同源物獨有而真菌和動物同源物缺乏的基序處乙 酰化ADA2蛋白質(zhì)(Mao等,2006)。已發(fā)現(xiàn)ADA2b和GCN5中的T-DNA插入突變對植物的生長和發(fā)育具有多效性,包含矮小的尺寸、異常的根發(fā)育和花內(nèi)短的花瓣和雄蕊(Vlachonasios 等,2003The Plant Cell,15卷,626-638)。還已經(jīng)公開了來自其他植物物種的編碼轉(zhuǎn)錄銜 接頭蛋白質(zhì)的基因(W00003026)。許多不同細胞過程的調(diào)節(jié)需要蛋白質(zhì)相互作用結(jié)構域進行多肽彼此間結(jié)合,和與 磷脂、小分子或核酸結(jié)合的用途。一種這類蛋白質(zhì)相互作用結(jié)構域稱為WD重復(參見綜述 Smith等,(1999)TIBS 24:181-185)。包含WD重復的蛋白質(zhì)大量存在于大部分生物中,例 如,人類(H. sapiens)中超過300種、秀麗隱桿線蟲(C. elegans)中超過140種、擬南芥中 超過390種和釀酒酵母中超過90種。雖然通過WD重復(一條多肽中4-16個拷貝之間) 的存在而在結(jié)構上相關,但這些蛋白質(zhì)具有極多樣的功能。通過Gly-His (GH) 二肽N端距Trp-Asp (WD) 二肽(位于基序的C端)10-20個殘 基,長度一般為大約40 (但至多60)個殘基(因此稱為“WD40”),在一級結(jié)構上粗略地定義 WD重復。但是,GH 二肽和WD 二肽都不是絕對保守。GH和WD之間是保守的核心序列,其可 以用可從例如在英國的European Bioinformatics Institute(EBI)所擁有的InterPro獲 得的算法鑒定。InterPro是蛋白質(zhì)家族、結(jié)構域和功能位點的數(shù)據(jù)庫,其中可將見于已知蛋 白質(zhì)的可鑒定特征應用于未知蛋白質(zhì)序列。據(jù)預測,WD40蛋白質(zhì)形成β螺旋槳_樣結(jié)構(環(huán)狀重復結(jié)構),其包 含三個潛在 的相互作用表面頂部、底部和環(huán)狀面。這種擴展的表面積允許WD40蛋白質(zhì)可逆地與數(shù)個 蛋白質(zhì)形成復合物,從而協(xié)調(diào)涉及數(shù)組蛋白質(zhì)的相繼和/或同時相互作用。涉及WD40蛋白質(zhì)的非常重要的蛋白質(zhì)復合物中有一類多蛋白質(zhì)泛素Ε3連接酶, Cullin4(CUL4)和損傷DNA結(jié)合蛋白質(zhì)1 (DDBl)是其核心蛋白質(zhì)(Higa等,(2007)Cell Division 2 5 ;Angers 等,(2006)Nature 443:590-593 ;Higa 等,(2006)Nature Cell Biol 8(11) :1277-1283 ;He 等,(2006)Genes & Development 20:2949-2954)。這種復合物為底 物募集機制錨定WD40蛋白質(zhì)作為分子銜接頭,底物隨后被泛素化和破壞。這些WD蛋白質(zhì) 形成稱為DCAF (DDB1-CUL4A結(jié)合因子)的亞類,它們在兩個連續(xù)的WD40重復末端包含兩個 保守的DxR基序(He等(2006)見上)。一種此類WD40蛋白質(zhì)WDR23 (WD重復巡;也稱為DCAFl 1)與見于植物的WD40蛋 白質(zhì)具有顯著的一級序列同一性。最先在紫草(Lithospermum erythrorhizon)中將這種 WD40蛋白質(zhì)鑒定為克隆14B(LEC14B ;NCBI檢索號D83074)。在專利申請W02002/016655中,SEQ ID NO :2577涉及編碼WDR23-樣多肽的擬南 芥核酸序列,描述了用SEQ ID NO =I-SEQ IDNO :5379中的任意一個或多個來鑒定植物細胞 已暴露過的脅迫條件的方法。在美國專利申請US2004/034888中,SEQ ID N0:13,294涉及 編碼WDR23-樣多肽的擬南芥核酸序列,描述了用SEQ ID NO =I-SEQ IDNO :36,564中的任意 一個或多個來產(chǎn)生具有改良特性的植物的方法。令人驚奇地,現(xiàn)已發(fā)現(xiàn)調(diào)節(jié)編碼PRP38多肽的核酸的表達使植物具有增強的(或 改良的)產(chǎn)量相關性狀,尤其是相對于對照植物的提高的產(chǎn)量,也在除由鹽、干旱、寒冷或 冰凍引起的滲透脅迫的條件中。還令人驚奇地,現(xiàn)已發(fā)現(xiàn)調(diào)節(jié)(優(yōu)選提高)編碼GATA-樣多肽的核酸的表達使植 物相對于對照植物具有顯著提高的千粒重(TKW),而如種子數(shù)(飽滿種子或總種子數(shù))的其 他種子產(chǎn)量參數(shù)未顯著提高。
此外,令人驚奇地,現(xiàn)已發(fā)現(xiàn)調(diào)節(jié)編碼ADA2多肽的核酸的表達使植物相對于對照 植物具有增強的產(chǎn)量相關性狀,尤其是提高的產(chǎn)量。還令人驚奇地,現(xiàn)已發(fā)現(xiàn)提高編碼如本文定義的WDR23-樣多肽的核酸序列的表 達使植物相對于對照植物具有提高的產(chǎn)量相關性狀。此外,令人驚奇地,現(xiàn)已發(fā)現(xiàn)調(diào)節(jié)編碼PATL多肽的核酸的表達使植物相對于對照 植物具有增強的產(chǎn)量相關性狀,尤其是提高的產(chǎn)量。根據(jù)本發(fā)明的一個實施方案,提供了相對于對照植物在植物中改良(或增強)產(chǎn) 量相關性狀的方法,其包括調(diào)節(jié)編碼PATL多肽、或PRP38、或ADA2多肽的核酸在植物中的表 達。根據(jù)另一個實施方案,提供了相對于對照植物提高千粒重(TKW)的方法,其包括 調(diào)節(jié)(優(yōu)選提高)編碼GATA-樣多肽的核酸在植物中的表達。根據(jù)另一個實施方案,提供了相對于對照植物在植物中增強產(chǎn)量相關性狀的方 法,其包括提高編碼如本文定義的WDR23-樣多肽的核酸序列在植物中的表達。提高的產(chǎn)量 相關性狀包含以下一種或多種提高的每株植物的 種子總產(chǎn)量、提高的種子飽滿率、提高的 飽滿種子數(shù)、提高的收獲指數(shù)或提高的千粒重。定義多肽/蛋白質(zhì)術語“多肽”和“蛋白質(zhì)”在本文中可相互交換地使用并且指由肽鍵連接起來的任 意長度聚合物形式的氨基酸。多核苷酸/核酸/核酸序列/核苷酸序列術語“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”、“核酸分子”在本文中可相 互交換地使用并且指任意長度的聚合非分支形式的核苷酸,即核糖核苷酸或脫氧核糖核苷 酸或這二者的組合。對照植物選擇合適的對照植物是實驗設計的例行部分并且可以包括相應的野生型植物或 無目的基因的相應植物。對照植物一般是相同的植物物種或甚至是與待評估植物相同的品 種。對照植物也可以是待評估植物的失效合子。失效合子是因分離而丟失轉(zhuǎn)基因的個體。 如本文中所用的“對照植物”不僅指完整植物,也指植物部分,包括種子和種子部分。同源物蛋白質(zhì)的“同源物”包括這樣的肽、寡肽、多肽、蛋白質(zhì)和酶,它們相對于非修飾的 所討論蛋白質(zhì)具有氨基酸取代、缺失和/或插入并且與衍生它們的非修飾蛋白質(zhì)具有相似 的生物學活性和功能活性。缺失指從蛋白質(zhì)中移除一個或多個氨基酸。插入指一個或多個氨基酸殘基被導入蛋白質(zhì)中的預定位點。插入可以包含氨基端 融合和/或羧基端融合以及序列內(nèi)插入單個或多個氨基酸。通常,在氨基酸序列內(nèi)部的插 入物比氨基端融合物或羧基端融合物小約1至10個殘基級別。氨基端或羧基端融合蛋白 或融合肽的例子包括如酵母雙雜交系統(tǒng)中所用的轉(zhuǎn)錄激活物的結(jié)合結(jié)構域或激活結(jié)構域、 噬菌體外殼蛋白、(組氨酸)-6-標簽、谷胱甘肽S-轉(zhuǎn)移酶-標簽、蛋白A、麥芽糖結(jié)合蛋白、 二氫葉酸還原酶、Tag · 100表位、c-myc表位、FLAG -表位、lacZ、CMP (鈣調(diào)蛋白結(jié)合肽)、HA表位、蛋白C表位和VSV表位。取代指以具有相似特性(如相似的疏水性、親水性、抗原性、形成或破壞α -螺旋 結(jié)構或折疊結(jié)構的傾向性)的其他氨基酸替代蛋白質(zhì)的氨基酸。氨基酸取代一般是單 個殘基的,但是根據(jù)給予多肽的功能性約束條件,可以是簇集的;插入通常是約1至10個 氨基酸殘基級別。氨基酸取代優(yōu)選地是保守性氨基酸取代。保守性取代表是本領域熟知的 (見例如 Creighton (1984) Proteins. W. H. Freeman 禾口 Company (編)禾口下表 1)。表1 保守性氨基酸取代的例子 氨基酸取代、缺失和/或插入可以使用本領域熟知的肽合成技術如固相肽合成法 等或通過重組DNA操作輕易地進行。用于操作DNA序列以產(chǎn)生蛋白質(zhì)的取代、插入或缺 失變體的方法是本領域熟知的。例如,用于在DNA的預定位點處產(chǎn)生取代突變的技術是 本領域技術人員熟知的并且包括M13誘變法、T7-Gen體外誘變法(USB,Cleveland, OH)、 QuickChange位點定向誘變法(Stratagene,San Diego, CA)、PCR介導的位點定向誘變或其 他位點定向誘變法。衍生物“衍生物”包括這樣的肽、寡肽、多肽,其中與天然存在形式蛋白質(zhì)(如Patellin或 RNA加工因子前體38或GATA樣多肽或銜接頭2或WDR23樣多肽)的氨基酸序列相比較, 它們包含非天然存在氨基酸殘基對氨基酸的取代或非天然存在氨基酸殘基的添加。蛋白質(zhì) 的“衍生物”也包括這樣的肽、寡肽、多肽,其中與所述多肽的天然存在形式的氨基酸序列相 比,它們包含天然存在的改變(糖基化、?;愇於┗?、磷酸化、肉豆蔻酰化、硫酸化等) 的氨基酸殘基或非天然存在的改變的氨基酸殘基。與衍生出衍生物的氨基酸序列相比較,該衍生物可以也包含與所述氨基酸序列共價或非共價結(jié)合的一個或多個非氨基酸取代基 或添加物(例如報道分子或其他配體),如所結(jié)合旨在促進檢測該衍生物的報道分子,和相 對于天然存在蛋白質(zhì)的氨基酸序列而言,包含非天然存在的氨基酸殘基。此外,“衍生物”也 包括天然存在形式的蛋白質(zhì)與標簽肽如FLAG、HIS6或硫氧還蛋白(對標簽肽的綜述,參見 Terpe, Appl. Microbiol. Biotechnol. 60,523-533,2003)的融合物。直向同源物/旁系同源物直向同源物和旁系同源物包括用來描述基因祖先關系的進化概念。旁系同源物是 相同物種內(nèi)因祖先基因復制而起源的基因;直向同源物是來自不同生物的因物種形成而起 源的基因,并且也衍生于共同的祖先基因。結(jié)構域術語“結(jié)構域”指在進化相關性蛋白質(zhì)的序列比對結(jié)果上的特定位置處保守的一 組氨基酸。盡管在其他位置處的氨基酸可以在同源物之間不同,然而在特定位置處高度保 守的氨基酸指示在蛋白質(zhì)結(jié)構、穩(wěn)定性或功能方面很可能是必需的氨基酸。結(jié)構域因其在 蛋白質(zhì)同源物家族的比對序列中高程度保守而鑒定,故它們可以用作鑒定物來確定所討論 的任意多肽是否屬于先前已鑒定的多肽家族?;?共有序列/標簽術語“基序”或“共有序列,,或“標簽”指在進化相關蛋白質(zhì)的序列中的短保守區(qū) 域。基序往往是結(jié)構域的高度保守部分,但是也可以僅包括該結(jié)構域的部分,或可以位于保 守結(jié)構域之外(若該基序的全部氨基酸位于定義的結(jié)構域之外)。雜交如本文中所定義的術語“雜交”是其中基本上同源的互補核苷酸序列相互復性的 過程。雜交過程可以完全在溶液中進行,即兩種互補性核酸均處在溶液中。雜交過程也可 以用固定至基質(zhì)如磁珠、瓊脂糖凝膠(Si5Pharose)珠或任何其他樹脂的互補性核酸之一進 行。雜交過程也可以用固定至固體支持物如硝酸纖維素膜或尼龍膜上或通過例如照相平版 印刷術固定至例如硅玻璃支持物(后者稱作核酸陣列或微陣列或稱作核酸芯片)的互補性 核酸之一進行。為使雜交發(fā)生,核酸分子通常被熱變性或化學變性,以將雙鏈解鏈成兩條單 鏈和/或去除來自單鏈核酸的發(fā)夾或其他二級結(jié)構。術語“嚴格性”指雜交發(fā)生的條件。雜交的嚴格性受諸條件如溫度、鹽濃度、離子 強度和雜交緩沖液組成的影響。通常,將低嚴格條件選擇成在定義的離子強度和PH處,低 于特定序列的熱解鏈溫度(Tm)約30°C。中等嚴格條件是當所述溫度在Tm以下20°C時,并 且高嚴格條件是當所述溫度在Tm以下10°C時。高嚴格雜交條件一般用于分離與靶核酸序 列具有高序列相似性的雜交序列。然而,核酸可以在序列上偏離且依舊編碼基本上相同的 多肽,原因是遺傳密碼的簡并性。因而,有時候可能需要中等嚴格雜交條件以鑒定此類核酸 分子。Tm是在定義的離子強度和pH處的下述溫度,其中50%的靶序列在所述溫度與完 全匹配的探針雜交。取決于溶液條件和探針的堿基組成及長度。例如,較長的序列在更高 溫度上特異性雜交。最大雜交速率從低于1約16°C直至32°C獲得。雜交溶液中一價陽離 子的存在降低了兩條核酸鏈之間的靜電排斥作用,因而促進雜交體形成;這種作用對于直 到0. 4M的鈉濃度是顯而易見的(對于更高的濃度而言,可以忽略這種作用)。甲酰胺降低DNA-DNA和DNA-RNA雙鏈體的解鏈溫度,每百分數(shù)的甲酰胺降低0. 6至0. 7°C,且添加50% 甲酰胺允許在30至45°C雜交,盡管雜交速率會降低。堿基對錯配降低雜交速率和雙鏈體的 熱穩(wěn)定性。平均且對于大的探針而言,Tm下降約rc/每^堿基錯配。根據(jù)雜交體的類型, Tm可以使用以下等式計算1)DNA-DNA 雜交體(Meinkoth 和 Wahl,Anal. Biochem.,138 :267_284,1984)Tm = 81. 5"C +16. 6 X Iog10 [Na+] a+0. 41X % [G/Cb]-500 X LT1-O. 61 X % 甲酰胺2) DNA-RNA 雜交體或 RNA-RNA 雜交體Tm = 79. 8+18. 5 (loglO [Na+]a) +0. 58(% G/Cb)+ll. 8(% G/Cb) 2_820/Lc3)寡DNA雜交體或寡RNAd雜交體對少于20個核苷酸而言Tm = 2 (In)對20-35 個核苷酸而言Tm = 22+1. 46 (In)a或者用于其他一價陽離子,但是僅在0. 01-0. 4M范圍內(nèi)是精確的。b僅對30 % -75 %范圍內(nèi)的% GC是精確的。cL =雙鏈體的堿基對長度。dOligo,寡核苷酸;In,=引物的有效長度=2 X (G/C數(shù))+ (A/T數(shù))??梢允褂迷S多已知技術中任意一種技術控制非特異性結(jié)合,例如將膜以含有蛋白 質(zhì)的溶液封閉、添加異源RNA、異源DNA和SDS至雜交緩沖液,并且用RNA酶處理。對于非 同源性探針,可以通過變換以下條件之一 (i)漸進地降低復性溫度(例如從68°C至42°C) 或(ii)漸進地降低甲酰胺濃度(例如從50%至0%)進行一系列雜交。技術人員了解可 以在雜交期間變更并且會維持或改變所述嚴格條件的多個參數(shù)。除了雜交條件之外,雜交特異性一般還取決于雜交后洗液的功能。為除去因非特 異性雜交引起的背景,用稀釋的鹽溶液洗滌樣品。此類洗液的關鍵因素包括最終洗滌溶液 的離子強度和溫度鹽濃度越低且洗滌溫度越高,則洗滌的嚴格性越高。洗滌條件一般在 雜交嚴格性上或低于所述雜交嚴格性進行。陽性雜交產(chǎn)生至少兩倍于背景信號的信號。通 常,用于核酸雜交測定法或基因擴增檢測方法的適宜嚴格條件如上所述。也可以選擇嚴格 性更高或更低的條件。技術人員了解可以在洗滌期間變更并且會維持或改變所述嚴格條件 的多個參數(shù)。例如,用于長度大于50個核苷酸的DNA雜交體的典型高嚴格雜交條件包括在65°C 于IXSSC中或在42°C于IXSSC和50%甲酰胺中雜交,隨后在65°C于0. 3XSSC中洗滌。 用于長度大于50個核苷酸的DNA雜交體的中等嚴格雜交條件的例子包括在50°C于4X SSC 或在401于6\55(和50%甲酰胺中雜交,隨后在50°C于2XSSC中洗滌。雜交體的長度是 雜交核酸的預期長度。當序列已知的核酸雜交時,可以通過比對序列并鑒定本文中所述的 保守區(qū)而確定雜交體長度。IXSSC是0. 15MNaCl和15mM檸檬酸鈉;雜交溶液和洗滌溶液可 以額外地包括5XDenhardt試劑、0. 5-1. 0% SDSUOOy g/ml變性的片段化鮭精DNA,0. 5% 焦磷酸鈉。出于定義嚴格性水平的目的,可以參考Sambrook等(2001)Molecular Cloning :a laboratory manual,第三版,Cold Spring HarborLaboratory Press, CSH, New York 或參 考Current Protocols inMolecular Biology, John Wiley & Sons,N.Y. (1989禾口年度更新 版)。
剪接變體如本文中所用的術語“剪接變體”包括其中已經(jīng)切除、取代、置換或添加所選內(nèi)含 子和/或外顯子或其中已經(jīng)縮短或加長內(nèi)含子的核酸序列的變體。此類變體將是基本上保 留蛋白質(zhì)的生物學活性的一類變體;這可以通過選擇性保留蛋白質(zhì)的功能片段實現(xiàn)。此類 剪接變體可以在自然界中找到或可以人工制備。用于預測和分離此類剪接變體的方法是本 領域熟知的(見例如 Foissac 和 Schiex(2005)BMC Bioinformatics. 6 25)。等位變體等位基因或等位變體是給定基因位于相同染色體位置處的備選形式。等位變體包 含單核苷酸多態(tài)性(SNP)和小的插入/缺失多態(tài)性(INDEL)。INDEL的大小通常小于lOObp。 SNP和INDEL形成大部分生物的天然存在多態(tài)性株系中的序列變體的最大集合?;蚋慕M/定向進化基因改組或定向進化由反復DNA改組,隨后適當篩選和/或選擇以產(chǎn)生編碼具 有改良生物學活性的蛋白質(zhì)的核酸或其部分的變體而組成(Castle等,(2004)Science 304(5674) 1151-4 ;美國專利 5,811,238 和 6,395,547)。調(diào)節(jié)元件/調(diào)控序列/啟動子術語“調(diào)節(jié)元件”、“調(diào)控序列”和“啟動子”均在本文中可相互交換地使用并且在廣 泛含義上意指能夠?qū)崿F(xiàn)與它們相連接的序列表達的調(diào)節(jié)性核酸序列。術語“啟動子”一般指 位于基因轉(zhuǎn)錄起點上游并參與識別和結(jié)合RNA聚合酶和其他蛋白質(zhì),因而指導有效鏈接的 核酸轉(zhuǎn)錄的核酸調(diào)控序列。前述術語包括從經(jīng)典真核基因組基因(包括對于精確轉(zhuǎn)錄啟動 所需的TATA框,具有或沒有CCAAT框序列)衍生的轉(zhuǎn)錄調(diào)節(jié)序列和應答發(fā)育性刺激和/或 外部刺激或以組織特異性方式而改變基因表達的其它調(diào)節(jié)元件(即上游激活序列、增強子 和沉默子)。本術語還包括經(jīng)典原核基因的轉(zhuǎn)錄調(diào)節(jié)序列,在此情況下它可以包括一個-35 框序列和/或一個- ο框轉(zhuǎn)錄調(diào)節(jié)序列。術語“調(diào)節(jié)元件”也包含賦予、激活或增加核酸分 子在細胞、組織或器官中表達的人工融合分子或衍生物?!爸参飭幼印卑閷е参锛毎芯幋a序列節(jié)段表達的調(diào)節(jié)元件。因此,植物啟 動子不必須是植物來源的,但可以源自病毒或微生物,例如來自侵襲植物細胞的病毒?!爸?物啟動子”也可以源自植物細胞,例如來自用在本發(fā)明方法中待表達并在本文中描述的核 酸序列轉(zhuǎn)化的植物。這也適用于其他“植物”調(diào)節(jié)信號,如“植物”終止子。在本發(fā)明方法 中有用的核苷酸序列上游的啟動子可以通過一個或多個核苷酸取代、插入和/或缺失進行 修飾,但不影響啟動子、可讀框(ORF)或3’調(diào)節(jié)區(qū)如終止子或遠離ORF存在的其他3’調(diào)節(jié) 區(qū)的功能性或活性。還有可能所述啟動子的活性因修飾其序列或它們被更活躍的啟動子、 甚至來自異源生物的啟動子徹底取代而提高。為了在植物中表達,如上所述,核酸分子必須 有效地連接至或包含在正確的時間點并以所需空間表達模式表達基因的合適啟動子。為鑒定功能性等同啟動子,候選啟動子的啟動子強度和/或表達模式可以例如通 過將此啟動子有效鏈接至報道基因并分析該報道基因在植物的多種組織中的表達水平和 模式進行分析。合適的熟知報道基因包括例如葡糖醛酸酶或半乳糖苷酶。啟動子 活性通過測量葡糖醛酸酶或半乳糖苷酶的酶活性進行分析。啟動子強度和/或表 達模式可以隨后與參考啟動子(如在本發(fā)明方法中使用的一種啟動子)的啟動子強度和/ 或表達模式比較。備選地,啟動子強度可以使用本領域已知方法如RNA印跡法及放射自顯
15影圖的密度計分析法、定量實時?0 或肌- 0 (徹丨(1等,1996661101116 Methods 6 :986_994), 通過量化mRNA水平或通過將本發(fā)明方法中所用核酸的mRNA水平與持家基因(如ISSrRNA) 的mRNA水平比較進行分析。通?!叭鯁幼印币庵蛤?qū)動編碼序列在低水平表達的啟動子。 “低水平”意指在每個細胞約1/10,000轉(zhuǎn)錄物至約1/100,000轉(zhuǎn)錄物、至約1/500,0000轉(zhuǎn) 錄物的水平上。相反,“強啟動子”驅(qū)動編碼序列在高水平或以每個細胞約1/10轉(zhuǎn)錄物至 約1/100轉(zhuǎn)錄物、至約1/1000轉(zhuǎn)錄物表達。一般而言,“中等強度啟動子”意指驅(qū)動編碼序 列以低于強啟動子水平、尤其以在一切情況下低于受35SCaMV啟動子控制時所獲得水平的 水平表達的啟動子。通常,中等強度啟動子對核酸表達的驅(qū)動比35S CaMV啟動子低至少3、 5、10、15、20、25、30、35、40、45、50、60、70、80、90、100 倍。有效連接如本文中所用的術語“有效連接”指啟動子序列與目的基因之間的功能連接,從而 該啟動子序列能夠啟動該目的基因轉(zhuǎn)錄。組成型啟動子“組成型啟動子”指在生長和發(fā)育的大部分期間但不是必需在全部期間,以及在大 多數(shù)環(huán)境條件下,在至少一種細胞、組織或器官中有轉(zhuǎn)錄活性的啟動子。下表2給出組成型 啟動子的例子。表2:組成型啟動子的例子 遍在啟動子遍在啟動子是在生物的全部組織或細胞中基本上有活性的。發(fā)育調(diào)節(jié)型啟動子發(fā)育調(diào)節(jié)型啟動子在某些發(fā)育階段期間或在經(jīng)歷發(fā)育變化的植物的部分中有活 性。誘導型啟動子誘導型啟動子在應答化學刺激(綜述見Gatz 1997,Annu. Rev. PlantPhysiol. Plant Mol.Biol. ,48 :89_108)、環(huán)境刺激或物理刺激時具有誘導或提高的轉(zhuǎn)錄啟動作用, 或可以是“脅迫誘導的”,即當植物暴露于多種脅迫條件時其激活,或是“病原體誘導的”,即 當植物暴露于多種病原體時其激活。器官特異性/組織特異性啟動子器官特異性或組織特異性啟動子是能夠偏好地啟動某些器官或組織如葉、根、種 子組織等中轉(zhuǎn)錄的啟動子。例如,“根特異性啟動子”是這樣的啟動子,該啟動子優(yōu)勢地在植 物根中具有轉(zhuǎn)錄活性,基本上在植物的任何其他部分中無活性,盡管在該植物的這些其他 部分中仍允許任意泄露表達。能夠僅在某些細胞中啟動轉(zhuǎn)錄的啟動子在本文中稱作“細胞 特異性的”。根特異性啟動子的例子列于下表i中。
表i 根特異性啟動子的例子 種子特異性啟動子是能夠在種子組織中優(yōu)勢地具有轉(zhuǎn)錄活性的啟動子,但無需排 他性地在種子組織中有轉(zhuǎn)錄活性(在泄露表達的情況下)。種子特異性啟動子可以在種子 發(fā)育期間和/或萌發(fā)期間有活性。種子特異性啟動子的例子在Qing Qu和Takaiwa(Plant Biotechnol. J. 2,113-125,2004)中給出,所述文獻的公開內(nèi)容如完整所述那樣通過引用方 式并入本文且示于下表ii。表ii 種子特異性啟動子的例子
如本文中所定義的綠色組織特異性啟動子是優(yōu)勢地在綠色組織中具有轉(zhuǎn)錄活性 的啟動子,在植物的任何其它部分內(nèi)基本上無活性,盡管在該植物的這些其他部分中仍允 許任意泄露表達??梢杂脕韺嵤┍景l(fā)明方法的綠色組織特異性啟動子的例子示于下表iii中。表iii 綠色組織特異性啟動子的例子
組織特異性啟動子的另一個例子是分生組織特異性啟動子,其優(yōu)勢地在分生組織 中具有轉(zhuǎn)錄活性,在植物的任何其它部分內(nèi)基本上無活性,盡管在該植物的這些其他部分 中仍允許任意泄露表達??梢杂脕韺嵤┍景l(fā)明方法的分生組織特異性啟動子的例子示于下 表iv中。表iv 分生組織特異性啟動子的例子 終止子 術語“終止子”包括作為轉(zhuǎn)錄單元末端處DNA序列的調(diào)控序列,所述的DNA序列產(chǎn) 生初級轉(zhuǎn)錄物的3’加工和多腺苷酸化及轉(zhuǎn)錄終止的信號。終止子可以從天然基因、從多種 其他植物基因或從T-DNA衍生。待添加的終止子可以從例如胭脂堿合酶或章魚堿合酶基因 或備選地從另一種植物基因或較次優(yōu)選地從任何其他真核基因衍生。
調(diào)節(jié)就表達或基因表達而言,術語“調(diào)節(jié)”意指這樣的過程,其中與對照植物相比,表達 水平因該基因表達而改變,所述表達水平提高或降低。原始、未調(diào)節(jié)的表達可以是結(jié)構性 RNA(rRNA.tRNA)或mRNA的任何類型的表達,隨后是翻譯。術語“調(diào)節(jié)活性”應當意指本發(fā) 明核酸序列或所編碼蛋白質(zhì)的表達的任何改變,這引起植物產(chǎn)量提高和/或生長增加。表達術語“表達”或“基因表達”意指某個特定基因或多個特定基因或特定基因構建體 的轉(zhuǎn)錄。術語“表達”或“基因表達”尤其意指某個基因或某些基因或基因構建體轉(zhuǎn)錄成結(jié) 構性RNA (rRNA.tRNA)或mRNA,所述RNA隨后翻譯成或不翻譯成蛋白質(zhì)。該過程包括DNA的 轉(zhuǎn)錄和所得mRNA產(chǎn)物的加工。增加的表達/過量表達如本文中所用的術語“增加的表達”或“過量表達”意指相對于原有野生型表達水 平為額外的任何形式的表達。在本領域內(nèi)充分報道了用于提高基因或基因產(chǎn)物表達的方法并且這些方法包括 例如由適宜啟動子驅(qū)動的過量表達、使用轉(zhuǎn)錄增強子或翻譯增強子。充當啟動子或增強子 元件的分離核酸可以導入多核苷酸的非異源形式的適宜位置(一般在上游)中,從而上調(diào) 編碼目的多肽的核酸表達。例如,內(nèi)源性啟動子可以在體內(nèi)通過突變、缺失和/或取代加以 改變(見Kmiec,US 5,565,350 ;Zarling等,W09322443),或可以將分離的啟動子以相對于 本發(fā)明基因的恰當方向及距離導入植物細胞,從而控制該基因的表達。若需要多肽表達,通常希望的是在多核苷酸編碼區(qū)的3’末端處包括多腺苷化區(qū) 域。該多腺苷酸化區(qū)域可以從天然基因、從多種其他植物基因或從T-DNA衍生。待添加的 3’末端序列可以從例如胭脂堿合酶或章魚堿合酶基因或備選地從另一種植物基因或較不 優(yōu)選地從任何其他真核基因衍生。內(nèi)含子序列也可以添加至5’非翻譯區(qū)(UTR)或部分編碼序列的編碼序列以提 高細胞質(zhì)中聚集的成熟信使的量。已經(jīng)顯示在植物和動物表達構建體的轉(zhuǎn)錄單位中包 含可剪接內(nèi)含子提高了 mRNA水平及蛋白質(zhì)水平上的基因表達高達1000倍(Buchman和 Berg(1988)Mol. Cell biol. 8 :4395_4405 ;Callis等(1987)Gens Dev 1 :1183_1200)。此種 內(nèi)含子增強基因表達的作用一般在所述內(nèi)含子置于轉(zhuǎn)錄單位的5’末端附近時最強烈。玉米 內(nèi)含子Adhl-S內(nèi)含子1、2和6、Bronze-I內(nèi)含子的用途是本領域已知的。對于總體信息, 見The Maize Handbook,第 116 章,F(xiàn)reeling 和 Walbot 編,Springer,N. Y. (1994)。內(nèi)源基因本文中對“內(nèi)源”基因的稱謂不僅僅指如植物中以其天然形式(即沒有人類任何 干預)存在的所討論基因,還指處于分離形式下的隨后(再)導入植物(轉(zhuǎn)基因)的相同 基因(或基本上同源的核酸/基因)。例如,含有這種轉(zhuǎn)基因的轉(zhuǎn)基因植物可以遭遇轉(zhuǎn)基因 表達的相當大程度地降低和/或內(nèi)源基因表達的實質(zhì)降低。分離的基因可以從生物分離或 可以是人造的,例如通過化學合成法。降低的表達本文中提及的“降低的表達”或“降低或基本消除表達”意指內(nèi)源基因表達和/或 多肽水平和/或多肽活性相對于對照植物的下降。與對照植物相比較,所述降低或基本上消除以增加的優(yōu)選順序是至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90% 或 95%、96%、97%、98%、99% 或更多降低。為了降低或基本消除植物中內(nèi)源基因的表達,需要核酸序列的基本上連續(xù)的核苷 酸的足夠長度。為進行基因沉默,該長度可以短至20、19、18、17、16、15、14、13、12、11、10個 或更少核苷酸,或者該長度可以長至整個基因(包括部分或完整的5’和/或3’ UTR)。基 本上連續(xù)的核苷酸片段可以從編碼Patellin或RNA加工因子前體38或Adaptor2或WDR23 樣多肽的核酸(靶基因)的任何核酸衍生,或從能夠編碼Patellin或RNA加工因子前體38 或銜接頭2或WDR23樣多肽的直向同源物、旁系同源物或同源物的任何核酸衍生。優(yōu)選地, 基本上連續(xù)的核苷酸的片段能夠與靶基因(有義鏈或反義鏈)形成氫鍵,更優(yōu)選地,基本上 連續(xù)的核苷酸片段以增加的優(yōu)選順序與靶基因(有義鏈或反義鏈)具有50%、60%、70%、 80%、85%、90%、95%、96%、97%、98%、99%、100% 的序列同一性。編碼(功能性)多肽 的核酸序列不是本文中所討論用于降低或基本消除內(nèi)源基因表達的多種方法的前提。用于降低或基本上消除植物中內(nèi)源基因表達的多種方法的例子,或降低蛋白質(zhì)的 水平和/或活性的例子是本領域技術人員已知的。例如,本領域技術人員將能夠輕易調(diào)整 用于沉默的公知方法,從而通過利用合適的啟動子在完整植物中或其部分中實現(xiàn)內(nèi)源基因 表達的降低??梢允褂贸R?guī)工具和技術完成表達的這種降低或基本消除。用于降低或基本消除 內(nèi)源基因表達的優(yōu)選方法是在植物中引入并表達基因構建體,其中將核酸(在此情況下, 從目的基因衍生的,或從能夠編碼Patellin或RNA加工因子前體38或銜接頭2或WDR23樣 多肽的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上連續(xù)的核苷酸) 克隆至所述基因構建體,(部分或完全地)作為被間隔序列(非編碼性DNA)隔開的反向重 復序列。另一用于降低或基本消除內(nèi)源基因表達的方法是使用核酸序列或其部分(在此 情況下,所述部分是從目的基因衍生的,或從能夠編碼Patellin或RNA加工因子前體38或 銜接頭2或WDR23樣多肽的直向同源物、旁系同源物或同源物的任何核酸序列中衍生的一 段基本上連續(xù)的核苷酸)的反向重復序列(其優(yōu)選能夠形成發(fā)夾結(jié)構)進行RNA介導的 沉默。RNA沉默方法的另一個例子包括將核酸序列或其部分(在此情況下是從目的基因衍 生的,或從能夠編碼Patellin或RNA加工因子前體38或銜接頭2或WDR23樣多肽的直向 同源物、旁系同源物或同源物的任何核酸序列中衍生的一段基本上連續(xù)的核苷酸)以有義 方向?qū)胫参?。RNA沉默方法的另一個例子包括使用反義核酸序列?;虺聊部梢酝ㄟ^ 插入誘變(例如T-DNA插入或轉(zhuǎn)座子插入)或通過如Angell和Baulcombe ((1999) Plant J. 20(3) 357-62)、(AmpIicon VIGS W098/36083)或 Baulcombe (WO 99/15682)及其他人描 述的策略實現(xiàn)。技術人員熟知其他方法,如使用針對內(nèi)源性多肽的抗體以抑制該多肽在植 物中的功能,或干擾某多肽參與其中的信號傳導途徑。人工和/或天然的微RNA(miRNA)可 以用來敲除基因表達和/或mRNA翻譯。內(nèi)源性miRNA是通常19-24個核苷酸長的單鏈小 RNA??梢詫iT地遺傳工程化一般長度21個核苷酸的人工微RNA(amiRNA)以負向調(diào)節(jié)單個 或多個目的基因的基因表達。選擇植物的微RNA靶的決定因素是本領域熟知的。已經(jīng)定義 了用于靶識別的經(jīng)驗參數(shù)并且可以使用它們輔助特定amiRNA的設計(Schwab等,(2005) Dev Cell 8(4) :517_27)。用于設計并產(chǎn)生amiRNA及其前體的便利工具也是公眾可獲得的(Schwab 等,(2006)Plant Cel 18(5) :1121_33)。在這種優(yōu)選的方法中,使用核酸或其部分(在此情況下,所述部分是從目的基因 衍生的,或從能夠編碼Patellin或RNA加工因子前體38或銜接頭2或WDR23樣多肽的直 向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上連續(xù)的核苷酸)的反向重 復序列(其優(yōu)選能夠形成發(fā)夾結(jié)構),通過RNA介導的沉默作用降低或基本上消除內(nèi)源基因 的表達。在包含調(diào)控序列的表達載體中克隆該反向重復序列。非編碼性DNA核酸序列(間 隔序列,例如基質(zhì)附著區(qū)片段(MAR)、內(nèi)含子、多接頭等)位于形成所述反向重復序列的兩 個反向核酸之間。在反向重復序列轉(zhuǎn)錄后,形成具有(部分或完全)自我互補性結(jié)構的嵌 合RNA。這種雙鏈RNA結(jié)構稱作發(fā)夾RNA (hpRNA)。hpRNA由植物加工成siRNA,該siRNA被 摻入RNA誘導的沉默復合體(RISC)。該RISC進一步切開所述mRNA轉(zhuǎn)錄物,從而相當大程 度地降低待翻譯成多肽的mRNA轉(zhuǎn)錄物的數(shù)目。對于其他一般細節(jié),參見例如Grierson等 (1998)W098/53083 ;Waterhouse 等(1999)WO 99/53050。本發(fā)明方法的實施不取決于在植物中引入并表達將所述核酸作為反向重復序列 克隆到其中的基因構建體,不過可以使用幾種熟知“基因沉默”方法中任何一種或多種方法 來實現(xiàn)相同效果。用于降低內(nèi)源基因表達的一種這樣的方法是RNA介導的基因表達沉默(下調(diào))。 在這種情況下,沉默作用由植物中與內(nèi)源性靶基因?qū)嵸|(zhì)相似的雙鏈RNA序列(dsRNA)觸發(fā)。 這種dsRNA進一步被植物加工成約20個至約26個核苷酸的所謂短干擾RNA (siRNA)。所 述siRNA被摻入RNA誘導的沉默復合體(RISC),其中所述RISC切割內(nèi)源靶基因的mRNA轉(zhuǎn) 錄物,從而相當大程度地將降低待翻譯成多肽的mRNA轉(zhuǎn)錄物的數(shù)目。優(yōu)選地,所述雙鏈RNA 序列與靶基因?qū)NA沉默方法的另一個例子涉及將核酸序列或其部分(在此情況下是從目的基因 衍生的,或從能夠編碼Patellin或RNA加工因子前體38或銜接頭2的直向同源物、旁系同 源物或同源物的任何核酸中衍生的一段基本上連續(xù)的核苷酸)以有義方向?qū)胫参??!坝?義方向”是指與自身mRNA轉(zhuǎn)錄物同源的DNA序列。因而將所述核酸序列的至少一個拷貝導 入植物。這個額外核酸序列會降低內(nèi)源基因表達,從而產(chǎn)生已知為共抑制作用的現(xiàn)象。將 一個核酸序列的幾個額外拷貝導入植物時,基因表達的降低將更明顯,因為高轉(zhuǎn)錄物水平 與觸發(fā)共抑制作用之間存在正相關。RNA沉默方法的另一個例子涉及使用反義核酸序列?!胺戳x”核酸序列包含與編碼 蛋白質(zhì)的“有義”核酸序列互補,即與雙鏈cDNA分子的編碼鏈互補,或與mRNA轉(zhuǎn)錄物序列 互補的核苷酸序列。反義核酸序列優(yōu)選地互補于待沉默的內(nèi)源基因。這種互補性可以存在 于基因的“編碼區(qū)”中和/或其“非編碼區(qū)”中。術語“編碼區(qū)”指包含被翻譯成氨基酸殘基 的密碼子的核苷酸序列的區(qū)域。術語“非編碼區(qū)”指分布在編碼區(qū)側(cè)翼的被轉(zhuǎn)錄但不翻譯 成氨基酸的5’和3’序列(也稱作5’和3’非翻譯區(qū))。反義核酸序列可以根據(jù)Watson和Crick堿基配對規(guī)則設計。反義核酸序列可以互 補于整個核酸序列(在此情況下是從目的基因衍生的,或從能夠編碼Patellin或RNA加工 因子前體38或銜接頭2的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本 上連續(xù)的核苷酸),不過也可以是僅對所述核酸序列的一部分(包括mRNA 5’和3’ UTR)反 義的寡核苷酸。例如,反義寡核苷酸序列可以互補于編碼多肽的mRNA轉(zhuǎn)錄物的翻譯起點周圍的區(qū)域。合適反義寡核苷酸序列的長度是本領域已知的并且可以從約50、45、40、35、30、 25、20、15或10個核苷酸或更小的核苷酸長度開始。本發(fā)明的反義核酸序列可以使用化學 合成反應和酶連接反應,利用本領域已知的方法構建。例如,反義核酸序列(例如反義寡核 苷酸序列)可以使用天然存在核苷酸或以多種方式修飾的核苷酸化學地合成,其中所述的 修飾核苷酸設計旨在增加分子的生物學穩(wěn)定性或增加反義與有義核酸序列之間所形成的 雙鏈體的物理穩(wěn)定性,例如,可以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可以用來產(chǎn) 生反義核酸序列的修飾核苷酸的例子是本領域熟知的。已知的核苷酸修飾包括甲基化、環(huán) 化和‘加帽’及用類似物(如肌苷)取代一個或多個天然存在核苷酸。對核苷酸的其他修 飾作用是本領域熟知的。反義核酸序列可以使用表達載體以生物學方式產(chǎn)生,其中一種核酸序列已經(jīng)以反 義方向亞克隆(即從插入的核酸轉(zhuǎn)錄出的RNA會對目的靶核酸為反義方向)到所述表達載 體中。優(yōu)選地,植物中反義核酸序列的產(chǎn)生借助穩(wěn)定整合的核酸構建體進行,其中所述的核 酸構建體包含啟動子、有效鏈接的反義寡核苷酸和終止子。用于本發(fā)明方法中沉默作用的核酸分子(無論被導入植物中或原位(in situ)地 產(chǎn)生)與mRNA轉(zhuǎn)錄物和/或編碼多肽的基因組DNA雜交或結(jié)合以因而抑制蛋白質(zhì)的表達, 例如通過抑制轉(zhuǎn)錄和/或翻譯做到這一點。雜交可以因形成穩(wěn)定雙鏈體的常規(guī)核苷酸互補 性引起,或例如,在與DNA雙鏈體結(jié)合的反義核酸序列的情況下,因雙螺旋大溝內(nèi)的特異性 相互作用引起。反義核酸序列可以通過在特定組織部位轉(zhuǎn)化或直接注射導入植物。備選 地,反義核酸序列可以被修飾以靶向所選的細胞并且隨后全身性施用。例如,對于全身性施 用,可以修飾反義核酸序列,從而它們與表達在所選細胞表面上的受體或抗原特異性地結(jié) 合,例如通過將所述反義核酸序列連接至與細胞表面受體或抗原結(jié)合的肽或抗體連接而做 到這一點。反義核酸序列也可以使用本文中所述的載體遞送至細胞。根據(jù)另一方面,反義核酸序列是α-端基異構核酸序列。α端基異構核酸序列與 互補RNA形成特定的雙鏈雜交體,在所述雙鏈雜交體中與常見的b-單元相反,所述鏈彼此 平行(Gaultier等(1987) Nucl Ac Resl5 :6625_6641)。反義核酸序列也可以包含2’_0_甲 基核糖核苷酸(Inoue 等(1987) Nucl Ac Res 15,6131-6148)或嵌合RNA-DNA類似物(Inoue 等(1987)FEBS Lett. 215,327-330)。內(nèi)源基因表達的降低或基本上消除也可以使用核酶進行。核酶是具有核糖核酸 酶活性的催化性RNA分子,能夠切割與之具有互補區(qū)域的單鏈核酸序列,如mRNA。因此,核 酶(例如錘頭狀核酶(在Haselhoff和Gerlach (1988) Nature 334,585-591中描述)可 以用來催化地切割編碼多肽的mRNA轉(zhuǎn)錄物,因而相當大程度地降低待翻譯成多肽的mRNA 轉(zhuǎn)錄物的數(shù)目。可以設計對核酸序列具有專一性的核酶(參見例如Cech等美國專利號 4, 987,071 ;和Cech等美國專利號5,116,742)。備選地,與核酸序列相對應的mRNA轉(zhuǎn)錄 物可以用來從RNA分子的匯集物中選出具有特定核糖核酸酶活性的催化性RNA(Bartel和 Szostak(1993) Science 261,1411-1418)。核酶在植物中用于基因沉默的用途是本領域 已知的(例如 Atkins 等(1994) WO 94/00012 ;Lenne 等(1995) W095/03404 ;Lutziger 等 (2000)WO 00/00619 ;Prinsen 等(1997)W097/13865 和 Scott 等(1997)WO 97/38116)。基因沉默也可以通過插入誘變(例如T-DNA插入或轉(zhuǎn)座子插入)或通過如 Angell 和 Baulcombe((1999)Plant J. 20(3) :357_62)、(AmpliconVIGS WO 98/36083)或Baulcombe (W0 99/15682)及其他人描述的策略實現(xiàn)。如果內(nèi)源基因中存在突變和/或在隨后導入植物的分離基因/核酸中存在突變, 基因沉默也可能發(fā)生。所述降低或基本上消除可以由無功能的多肽引起。例如,該多肽可 以與多種相互作用的蛋白質(zhì)結(jié)合;一種或多種突變和/或截短作用因而可以產(chǎn)生仍能夠結(jié) 合相互作用的蛋白質(zhì)(如受體蛋白)但不能展示正常功能的多肽(如信號傳導配體)。基因沉默的另一種方法是瞄準互補于基因調(diào)節(jié)區(qū)(例如啟動子和/或增強子) 的核酸序列以形成阻止靶細胞中基因轉(zhuǎn)錄的三重螺旋結(jié)構。參見Helene,C.,Anticancer Drug Res. 6,569-84,1991 ;Helene 等,Ann. N. Y. Acad. Sci. 660,27-361992 ;和 Maher, L. J. Bioassays 14,807-15,1992。技術人員會熟知其他方法,如使用針對內(nèi)源多肽的抗體以抑制該多肽在植物中 (in planta)的功能,或干擾涉及某多肽的信號傳導途徑。特別地,可以考慮人造分子可能 用于抑制靶多肽的生物學功能,或用于干擾涉及所述靶多肽的信號傳導途徑。備選地,可以建立篩選程序以鑒定植物群體中基因的天然變體,其中所述的變體 編碼具有降低的活性的多肽。也可以使用此類天然變體,例如來進行同源重組。人工和/或天然的微RNA(miRNA)可以用來敲除基因表達和/或mRNA翻譯。內(nèi)源 miRNA是通常19-24個核苷酸長度的單鏈小RNA。它們主要發(fā)揮調(diào)節(jié)基因表達和/或mRNA翻 譯的功能。大多數(shù)的植物微RNA(miRNA)與其靶序列具有完全或接近完全的互補性。然而, 存在具有多達5個錯配的天然靶。它們從具有特征性折返結(jié)構的較長非編碼性RNA由Dicer 家族的雙鏈特異性RNA酶加工得來。加工后,它們通過與RNA誘導的沉默復合體(RISC)的 主要組分-Argonaute蛋白結(jié)合被摻入該復合體。miRNA充當RISC的特異性組分,因為它們 與胞漿中的靶核酸(大多是mRNA)發(fā)生堿基配對。后續(xù)調(diào)節(jié)事件包括靶mRNA切割和摧毀 和/或翻譯抑制。miRNA過量表達的影響因此往往反映為靶基因的mRNA水平降低。可以專門地遺傳工程化一般21個核苷酸長度的人工微RNA(amiRNA)以負向地調(diào) 節(jié)單個或多個目的基因的基因表達。選擇植物的微RNA靶的決定因素是本領域熟知的。 用于靶識別的經(jīng)驗參數(shù)已經(jīng)被定義并可以用來輔助具體amiRNA的設計(Schwab等,Dev. Cell 8,517-527,2005)。用于設計并產(chǎn)生amiRNA及其前體的便利工具也是公眾可獲得的 (Schwab 等,2006 Plant Cell. 2006 18(5) :1121_33)。為了最佳性能,用于降低植物中內(nèi)源基因表達的基因沉默技術需要使用來自單子 葉植物的核酸序列轉(zhuǎn)化單子葉植物,并使用來自雙子葉植物的核酸序列轉(zhuǎn)化雙子葉植物。 優(yōu)選地,將來自任意的給定植物物種的核酸序列導入相同的物種。例如,將來自稻的核酸序 列轉(zhuǎn)化到稻植物中。然而,不絕對要求待導入的核酸序列來自與待導入該核酸序列的植物 相同的植物物種。只要內(nèi)源靶基因與待導入的核酸之間存在實質(zhì)同源性即可。上文描述用于降低或基本上消除植物中內(nèi)源基因表達的多種方法的例子。例如, 本領域技術人員會輕易地能夠調(diào)整用于沉默的前述方法,從而通過利用合適啟動子實現(xiàn)在 完整植物中或其部分中降低內(nèi)源基因的表達。選擇性標記(基因)/報道基因“選擇性標記”、“選擇性標記基因”或“報道基因”包括向細胞賦予表型的任意基 因,其中在所述細胞中表達所述“選擇性標記”、“選擇性標記基因”或“報道基因”以促進鑒 定和/或選擇用本發(fā)明核酸構建體轉(zhuǎn)染或轉(zhuǎn)化的細胞。這些標記基因能夠借助一系列不同原理而鑒定核酸分子的成功轉(zhuǎn)移。合適的標記可以選自賦予抗生素抗性或除草劑抗性、導 入新代謝性狀或允許目視選擇的標記。選擇性標記基因的例子包括賦予抗生素抗性的基因 (如使新霉素和卡那霉素磷酸化的nptll或使潮霉素磷酸化的hpt或賦予針對例如博來霉 素、鏈霉素、四環(huán)素、氯霉素、氨芐青霉素、慶大霉素、遺傳霉素(Geneticin) (G418)、壯觀霉 素或殺稻瘟茵素的抗性的基因)、賦予除草劑抗性的基因(例如提供Basta 抗性的bar ;提 供草甘膦抗性的aroA或gox或賦予針對例如咪唑啉酮、膦絲菌素或磺脲類的抗性的基因) 或提供代謝性狀的基因(如允許植物使用甘露糖作為唯一碳源的manA,或利用木糖的木糖 異構酶,或抗營養(yǎng)性標記如2-脫氧葡萄糖抗性)。目視標記基因的表達導致顏色(例如 β -葡糖醛酸酶、GUS或β -半乳糖苷酶與其有色底物例如X-Gal)、發(fā)光(如螢光素/螢光 素酶系統(tǒng))或熒光(綠色熒光蛋白GFP和其衍生物)的形成。這個名單僅代表少數(shù)的可能 標記。技術人員熟悉此類標記。取決于生物和選擇方法,優(yōu)選不同的標記。已知當核酸穩(wěn)定或瞬時地整合至植物細胞時,僅少數(shù)細胞攝取外來DNA,并且根據(jù) 需要,將外來DNA整合至細胞基因組中,這取決于所用的表達載體和所用的轉(zhuǎn)染技術。為鑒 定并選擇這些整合體,通常將編碼選擇性標記的基因(如上文所述的基因)連同目的基因 一起導入宿主細胞。這些標記可以在這些基因例如通過常規(guī)方法缺失而無功能的突變體中 使用。此外,編碼選擇性標記的核酸分子可以在包含編碼本發(fā)明多肽或在本發(fā)明方法中所 用多肽的序列的相同載體上,或在獨立的載體上導入宿主細胞。已經(jīng)用所導入核酸穩(wěn)定轉(zhuǎn) 染的細胞可以例如通過選擇作用鑒定(例如具有整合的選擇性標記的細胞存活而其他細 胞死亡)。一旦不再需要所述標記基因時,可以從轉(zhuǎn)基因細胞中移除或切除它們。用于標記 移除的技術是本領域已知的,有用的技術在上文定義部分中描述。因為一旦已經(jīng)成功地導入所述標記基因、尤其抗生素抗性基因和除草劑抗性基 因,則這些核酸是轉(zhuǎn)基因宿主細胞中不再需要或不想要的,因此用于導入核酸的本發(fā)明方 法有利地使用能夠移除或切除這些標記基因的技術。一種這樣的方法是所謂共轉(zhuǎn)化法。共 轉(zhuǎn)化法同時使用兩種載體以轉(zhuǎn)化,一種載體攜帶本發(fā)明的核酸而第二種載體攜帶標記基 因。大比例的轉(zhuǎn)化體接受或在植物情況下包含(多達40%或更多的轉(zhuǎn)化體)這兩種載體。 在用農(nóng)桿菌(Agrobacterium)轉(zhuǎn)化的情況下,轉(zhuǎn)化體通常僅接受載體的一部分,即側(cè)翼存 在T-DNA的序列,該序列通常代表表達盒。標記基因隨后可以通過開展雜交從轉(zhuǎn)化植物中 移除。在另一種方法中,整合至轉(zhuǎn)座子的標記基因與想要的核酸一起用于轉(zhuǎn)化(稱作Ac/ Ds技術)。轉(zhuǎn)化體可以與轉(zhuǎn)座酶來源物雜交,或轉(zhuǎn)化體用引起轉(zhuǎn)座酶表達的核酸構建體瞬 時或穩(wěn)定轉(zhuǎn)化。在一些情況下(大約10% ),一旦轉(zhuǎn)化已經(jīng)成功發(fā)生,則轉(zhuǎn)座子從宿主細胞 的基因組跳出并丟失。在其他許多情況下,轉(zhuǎn)座子跳到一個不同位置。在這些情況下,標記 基因必須通過開展雜交予以消除。在微生物學中,開發(fā)了有可能或促進檢測這類事件的技 術。又一種有利方法依賴于所謂重組系統(tǒng);所述方法的優(yōu)勢在于雜交消除作用可以用該重 組系統(tǒng)實行。最知名的該類型系統(tǒng)稱作Cre/lox系統(tǒng)。Crel是移除位于IoxP序列之間序列 的重組酶。若所述標記基因整合于IoxP序列之間,一旦轉(zhuǎn)化已經(jīng)成功發(fā)生,則它因重組酶 表達而被移除。其他重組系統(tǒng)是HIN/HIX、FLP/FRT和REP/STB系統(tǒng)(Tribble等,J. Biol. Chem.,275,2000 :22255_22267 ;VeImurugan 等,J. CellBiol.,149,2000 :553_566)。位點特 異性地整合本發(fā)明核酸序列至植物基因組是可能的。自然,這些方法也可以應用于微生物 如酵母、真菌或細菌。
27
轉(zhuǎn)基因的/轉(zhuǎn)基因/重組為本發(fā)明的目的,“轉(zhuǎn)基因的”、“轉(zhuǎn)基因”或“重組”例如就核酸序列而言,意指包含 所述核酸序列的表達盒、基因構建體或載體,或用本發(fā)明核酸序列、表達盒或載體轉(zhuǎn)化的生 物,這些構建體均通過重組方法產(chǎn)生,其中(a)編碼在本發(fā)明方法中有用的蛋白質(zhì)的核酸序列,或(b)與本發(fā)明核酸序列有效鏈接的基因調(diào)控序列,例如啟動子,或(c)a)和 b)并不位于它們的天然遺傳環(huán)境中或已經(jīng)通過重組方法被修飾,所述的修飾有可能 采取例如取代、添加、倒位或插入一個或多個核苷酸殘基的形式。天然遺傳環(huán)境理解為意指 原初植物中的天然基因組位點或染色體位點或存在于基因組文庫中。在基因組文庫的情況 下,優(yōu)選地保留,至少部分地保留核酸序列的天然遺傳環(huán)境。該環(huán)境分布在所述核酸序列的 至少一側(cè)并且具有至少50bp、優(yōu)選至少500bp、特別優(yōu)選至少lOOObp、最優(yōu)選至少5000bp序 列長度。當通過非天然、合成性(“人工”)方法(例如誘變處理)修飾天然存在表達盒時,該 表達盒-例如所述核酸序列的天然啟動子與編碼如上文所定義在本發(fā)明方法中有用的多 肽的相應核酸序列的天然存在組合_變成轉(zhuǎn)基因表達盒。合適的方法例如在US5,565,350 或WO 00/15815中描述。為本發(fā)明目的,如上所述,將轉(zhuǎn)基因植物因此理解為意指本發(fā)明方法中所用諸核 酸不處于它們在所述植物基因組中的天然基因座處,從而有可能同源或異源地表達所述核 酸。然而,如所提及,轉(zhuǎn)基因還意指盡管本發(fā)明的或本發(fā)明方法中所用的諸核酸處于它們在 植物基因組中的天然位置處,然而相對于天然序列,它們的序列已經(jīng)被修飾,和/或所述天 然序列的調(diào)節(jié)序列已經(jīng)被修飾。轉(zhuǎn)基因優(yōu)選地理解為意指本發(fā)明核酸在基因組中的非天然 基因座處表達,即所述核酸的同源表達或優(yōu)選異源表達發(fā)生。優(yōu)選的轉(zhuǎn)基因植物在本文中 提及。轉(zhuǎn)化如本文中提及的術語“導入”或“轉(zhuǎn)化”包括轉(zhuǎn)移外源多核苷酸至宿主細胞中,無論 轉(zhuǎn)化所用的方法是什么。能夠后續(xù)克隆性增殖(無論通過器官發(fā)生或胚發(fā)生)的植物組織 可以用本發(fā)明的基因構建體轉(zhuǎn)化并且可完整植物以從中再生。所選的具體組織根據(jù)可用于 并且最好適于正在進行轉(zhuǎn)化的具體物種的克隆性增殖系統(tǒng)變化。示例性靶組織包括葉盤、 花粉、胚、子葉、下胚軸、大配子體、愈傷組織、現(xiàn)存的分生組織(例如頂端分生組織、腋芽和 根分生組織)和誘導的分生組織(例如子葉分生組織和下胚軸分生組織)。多核苷酸可以 瞬時或穩(wěn)定地導入宿主細胞并且可以非整合地維持,例如作為質(zhì)粒。備選地,它可以整合至 宿主基因組中。所得的轉(zhuǎn)化植物細胞隨后可以用來以本領域技術人員已知的方式再生出轉(zhuǎn) 化植物。外來基因轉(zhuǎn)移至植物基因組的過程稱作轉(zhuǎn)化。植物物種的轉(zhuǎn)化現(xiàn)在是相當常規(guī)的 技術。有利地,可以使用幾種轉(zhuǎn)化方法中的任何一種方法將目的基因?qū)牒线m的祖先細胞。 描述用于轉(zhuǎn)化并從植物組織或植物細胞再生出植物的方法可以用于瞬時轉(zhuǎn)化或穩(wěn)定轉(zhuǎn)化。 轉(zhuǎn)化方法包括使用脂質(zhì)體、電穿孔法、增加游離DNA攝入的化學品、DNA直接注射至植物、粒 子槍轟擊法、使用病毒或花粉的轉(zhuǎn)化法和微量投射法(microprojection)。轉(zhuǎn)化方法可以選 自用于原生質(zhì)體的鈣 / 聚乙二醇法(Krens,Ε. A.等,(1982)Nature 296,72-74 ;NegrutiuI 等,(1987)PlantMol Biol 8:363-373);原生質(zhì)體的電穿孔法(Shillito R. D.等,(1985) Bio/Technol 3,1099-1102);對植物材料的微量注射法(Crossway A 等,(1986)Mol. Gen Genet 202:179-185) ;DNA 或 RNA 包被粒子轟擊法(Klein TM 等,(1987) Nature 327:70)、 用(非整合性)病毒感染等。包括轉(zhuǎn)基因作物植物在內(nèi)的轉(zhuǎn)基因植物優(yōu)選通過農(nóng)桿菌介導 的轉(zhuǎn)化法產(chǎn)生。有利的轉(zhuǎn)化方法是植物原位(in planta)轉(zhuǎn)化法。為此目的,例如有可能 使農(nóng)桿菌作用于植物種子或有可能用農(nóng)桿菌接種植物分生組織。根據(jù)本發(fā)明,已經(jīng)證明將 轉(zhuǎn)化的農(nóng)桿菌懸液作用于完整植物或至少作用于花原基是特別有利的。隨后培育該植物直 至獲得已處理植物的種子(Clough和Bent,Plant J. (1998) 16,735-743)。用于農(nóng)桿菌介導 稻轉(zhuǎn)化的方法包括用于稻轉(zhuǎn)化的熟知方法,如在以下任意文獻中描述的那些方法歐洲專 利申請 EP 1198985 Al,Aldemita 和 Hodges (Planta 199:612-617,1996) ;Chan 等,(Plant Mol Biol 22(3) :491_506,1993),Hiei 等,(Plant J 6(2) :271_282,1994),其公開內(nèi)容 如充分所述那樣通過引用的方式并入本文。在玉米轉(zhuǎn)化的情況下,優(yōu)選的方法如Ishida 等,(Nat. Biotechnol 14(6) :745_50,1996)或 Frame 等,(Plant Physiol 129(1) 13-22, 2002)描述,其公開內(nèi)容如充分所述那樣通過引用的方式并入本文。所述方法還例如由 B. Jenes等,Techniques for Gene Transfer,在Transgenic Plants,第 1 卷,Engineering and Utilization,編者 S. D. Kung 禾口 R.Wu,Academic Press (1993) 128—143 及在 Potrykus Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991) 205-225)中描述。待表達的核酸 或構建體優(yōu)選地克隆至適于轉(zhuǎn)化根瘤農(nóng)桿菌(Agrobacteriumtumefaciens)的載體,例如 pBinl9 (Bevan等,Nucl. Acids Res. 12(1984)8711)。被這種載體轉(zhuǎn)化的農(nóng)桿菌隨后可以按 照已知方式用于轉(zhuǎn)化植物,例如作為模型使用的植物如擬南芥屬植物(擬南芥在本發(fā)明范 圍不視為作物植物),或作物植物,例如煙草植物,所述方式例如是通過在農(nóng)桿菌溶液中浸 泡擦傷的葉或切碎的葉并隨后在合適培養(yǎng)基中培育它們。借助根瘤農(nóng)桿菌轉(zhuǎn)化植物例如 由Hiifgen和 Willmitzer 在 Nucl. AcidRes. (1988) 16,9877 中描述或尤其從 F. F. White, 用于高等植物中基因轉(zhuǎn)移的載體(Vectors for Gene Transfer in Higher Plants);在 TransgenicPlants,第 1 卷,Engineering and Utilization, S. D. Kung禾口 R. Wu編,Academic Press, 1993,第 15-38 頁中獲知。 除了轉(zhuǎn)化隨后必需再生成完整植物的體細胞之外,也可以轉(zhuǎn)化植物分生組織的 細胞,并且尤其那些發(fā)育成配子的細胞。在這種情況下,轉(zhuǎn)化的配子遵循天然的植物發(fā)育 過程,從而產(chǎn)生轉(zhuǎn)基因植物。因此,例如用農(nóng)桿菌處理擬南芥屬植物的種子并且從正在發(fā) 育的植物獲得種子,其中一定比例的所述植物被轉(zhuǎn)化并且因此是轉(zhuǎn)基因的[Feldman,KA 和 Marks MD (1987)Mol Gen Genet 208 274-289 ;Feldmann K (1992),在編者 C Koncz, N-H Chua 禾口 J Shell, Methods in ArabidopsisResearch. Word Scientific, Singapore, 第274-289頁]。備選方法基于反復移除花序并將蓮座叢中心內(nèi)的切除部位與轉(zhuǎn)化的農(nóng)桿 菌溫育,因而同樣可以在較晚的時間點獲得轉(zhuǎn)化的種子(Chang(1994)Plant J. 5 :551_558 ; Katavic (1994)Mol Gen Genet,245 :363_370)。然而,特別有效的方法是改良真空滲入法, 如“浸花”法。在擬南芥屬植物真空浸潤法的情況下,用農(nóng)桿菌懸液處理在降低壓力下的完 整植物[Bechthold,N(1993). C R Acad Sci Paris Life Sci,316 1194-1199],而在“浸花 法”的情況下,將正在發(fā)育的花組織與表面活性劑處理過的農(nóng)桿菌懸液短暫溫育[Clough, SJ和Bent,AF (1998) The Plant J. 16,735-743]。在這兩種情況下均收獲某個比例的轉(zhuǎn)基因種子,并且這些種子可以通過在如上所述的選擇條件下培育與非轉(zhuǎn)基因種子區(qū)分。此外, 質(zhì)體的穩(wěn)定轉(zhuǎn)化是有利的,因為質(zhì)體在大部分作物中以母系方式遺傳,這降低或消除了借 助花粉的轉(zhuǎn)基因流動風險。葉綠體基因組的轉(zhuǎn)化一般通過已經(jīng)在Klaus等,2004[NatUre Biotechnology 22 (2),225-229]中示意性展示的方法實現(xiàn)。簡而言之,將待轉(zhuǎn)化的序列 連同選擇性標記基因一起克隆至同源于葉綠體基因組的側(cè)翼序列之間。這些同源側(cè)翼序 列指導向原質(zhì)體的位點特異性整合。已經(jīng)對許多不同的植物物種描述質(zhì)體轉(zhuǎn)化過程并且 在Bock(2001)基礎研究和植物生物技術中的轉(zhuǎn)基因質(zhì)體(Transgenicplastids in basic research and plant biotechnology). J Mol Biol. 2001 年月 21 日;312(3) :425_38 或 Maliga, P(2003)質(zhì)體轉(zhuǎn)化技術商業(yè)化進展(Progress towards commercialization of plastid transformationtechnology), Trends Biotechnol. 21, 20-28 中給出綜述。其 他的生物技術進展最近已經(jīng)以無標記質(zhì)體轉(zhuǎn)化體的形式報道,其中可以通過瞬時共整合 的標記基因產(chǎn)生所述無標記質(zhì)體轉(zhuǎn)化體(Klaus等,2004,NatureBiotechnology 22(2), 225-229)。T-DNA 活化標簽技術(T-DNA activation tagging)T-DNA活化標簽技術(Hayashi等,Science (1992) 1350-1353)涉及以如此方式在 目的基因的基因組區(qū)域內(nèi)或基因編碼區(qū)的上游或下游IOkb處插入通常含有啟動子(也可 以是翻譯增強子或內(nèi)含子)的T-DNA,從而該啟動子指導目標基因的表達。一般,目標基因 的天然啟動子對該基因表達的調(diào)節(jié)作用被破壞,并且該基因受新導入的啟動子控制。該啟 動子一般嵌入T-DNA中。這種T-DNA隨機地插入植物基因組,例如借助農(nóng)桿菌感染,并且引 起所插入T-DNA附近的基因受調(diào)節(jié)的表達。所得的轉(zhuǎn)基因植物表現(xiàn)顯性表型,原因在于所 導入啟動子附近的基因受修飾的表達。TILLING術語“TILLING”是“基因組中定向誘導局部損傷法”的縮寫并且指用于產(chǎn)生和/ 或鑒定核酸的誘變技術,其中所述核酸編碼具有改良表達和/或活性的蛋白質(zhì)。TILLING還 允許選擇攜帶此類突變變體的植物。這些突變變體可以表現(xiàn)在強度或在位置或在時間方面 改良的表達(例如,如果所述突變影響啟動子)。這些突變變體可以顯示比其天然形式基 因所表現(xiàn)活性更高的活性。TILLING聯(lián)合了高密度誘變法與高通量篩選法。TILLING中一 般所遵循的步驟是(a) EMS 誘變(Redei GP 和 Koncz C (1992)在 Methods in Arabidopsis Research,Koncz C,Chua NH,Schell J,Singapore 編,World Scientific Publishing Co, 第 16-82 頁;Feldmann 等,(1994)在 Meyerowitz EM, Somerville CR編,Arabidopsis. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY,第 137-172 頁;Lightner 禾口 Caspar T(1998) ^ J Martinez-Zapater, JSalinas Iij^",Methods on Molecular Biology 第 82 卷· Humana Press, Totowa, NJ,第 91-104 頁);(b)制備和匯集個體 DNA ; (c)PCR 擴 增目的區(qū)域;(d)變性和復性以導致異雙鏈體形成;(e)DHPLC,其中匯集物中異雙鏈體的存 在被檢測為色譜圖中的一個額外峰;(f)鑒定突變個體;和(g)將突變PCR產(chǎn)物測序。用于 TILLING 的方法是本領域熟知的(McCallum 等,(2000)Nat Biotechnol 18 :455_457 ;綜述 參見 Stemple (2004) Nat Rev Genet 5(2) 145-50)。同源重組同源重組允許在基因組中限定的所選位置處導入所選核酸。同源重組是生物科學中常規(guī)用于低等生物如酵母或小立碗蘚屬(Physcomitrella)苔蘚的標準技術。已經(jīng)對 模式植物(Offringa 等,(1990) EMBO J 9(10) :3077_84)和作物植物例如稻(Terada 等, (2002)Nat Biotech 20(10) 1030-4 ;Iida 和 Terada(2004) Curr Opin Biotech 15(2) 132-8)描述了用于植物中開展同源重組的方法,并且存在與靶生物無關而通常適用的方法 (Miller 等,Nature Biotechnol. 25,778-785,2007)?!ぎa(chǎn)量術語“產(chǎn)量”通常意指經(jīng)濟價值的可測量結(jié)果,一般與指定作物、與面積并且與時 間間隔有關。單個植物部分基于它們的數(shù)目、大小和/或重量而直接有助于產(chǎn)量,或?qū)嶋H產(chǎn) 量是相對于某作物和年份的每平方米產(chǎn)量,這通過總產(chǎn)量(包括收獲的和評估的產(chǎn)量)除 以播種的平方米數(shù)確定。術語植物的“產(chǎn)量”可以涉及該植物的營養(yǎng)生物量(根和/或枝 條生物量)、涉及繁殖器官和/或涉及繁殖體(如種子)。早期生長勢“早期生長勢”指活躍、健康、充分平衡的生長,尤其是植物生長早期期間,并且可 以因提高的植物適應性所致,其中所述提高的植物適的原因是例如該植物更好地適應環(huán)境 (即優(yōu)化能量源的用途和在枝條與根之間的分配)。具有早期生長勢的植物也顯示提高的 籽苗存活和更佳的作物建立,這往往產(chǎn)生高度均一的田塊(作物以均一方式生長,即大多 數(shù)植物在基本上相同的時間達到各個發(fā)育期)和往往形成更好且更高的產(chǎn)量。因而,早期 生長勢可以通過測量多種因素如千粒重(ThousandKernel Weight)、萌發(fā)百分數(shù)、出苗百分 數(shù)、籽苗生長、籽苗高度、根長度、根和枝條生物量和許多其他因素等確定。提高/改善/增強術語“提高”、“改善”或“增強”是相互可交換的并且在應用含義上應當意指與如本 文中定義的對照植物相比較,至少3%、4%、5%、6%、7%、8%、9%或10%、優(yōu)選至少15% 或20%、更優(yōu)選地25%、30%、35%或40%更多的產(chǎn)量和/或生長。種子產(chǎn)量提高的種子產(chǎn)量自身可以表現(xiàn)為以下一個或多個指標a)種子生物量(種子總重 量)增加,這可以基于單粒種子基礎和/或每株植物和/或每平方米;b)提高的每株植物 花數(shù)目;c)提高的(飽滿)種子數(shù);d)提高的種子飽滿率(其表述為飽滿種子數(shù)與種子總 數(shù)之間的比率);e)提高的收獲指數(shù),其表述為可收獲部分(如種子)產(chǎn)量與總生物量的比 率;f)提高的千粒重(TKW) ; (g)提高的初生穗數(shù),這從計數(shù)的飽滿種子數(shù)及它們的總重量 外推出來。提高的TKW可以因增加的種子尺寸和/或種子重量引起,并且也可以因胚尺寸 和/或胚乳尺寸增加引起。種子產(chǎn)量的提高也可以表現(xiàn)為種子尺寸和/或種子體積的增加。此外,種子產(chǎn)量 提高也可以本身表現(xiàn)為種子面積和/或種子長度和/或種子寬度和/或種子周長的提高。 提高的種子產(chǎn)量也可以產(chǎn)生改良的構造,或可以因改良的構造而出現(xiàn)。綠度指數(shù)從植物的數(shù)字圖像計算如本文中所用的“綠度指數(shù)”。對屬于圖像上植物目標的每 個像素計算綠色值與紅色值的比率(在編碼顏色的RGB模式中)。綠度指數(shù)表述為綠色/ 紅色比超過給定閾值的像素百分數(shù)。在正常生長條件下,在鹽脅迫生長條件下和在養(yǎng)分有 效性降低的生長條件下,植物的綠度指數(shù)在開花前的最后成像中測量。相反,在干旱脅迫生長條件下,植物的綠度指數(shù)在干旱后的首次成像中測量。植物本文中所用的術語“植物”包括完整植物、植物的祖先及子代和包括種子、枝條、 莖、葉、根(包括塊莖)、花和組織、器官在內(nèi)的植物部分,其中每種前述對象包含目的基因/ 核酸。術語“植物”也包括植物細胞、懸浮培養(yǎng)物、愈傷組織、胚、分生組織區(qū)、配子體、孢子 體、花粉和小孢子,同樣其中每種前述對象包含目的基因/核酸。在本發(fā)明方法中特別有用的植物包括屬于植物界(Viridiplantae)超家族、尤 其單子葉和雙子葉植物的全部植物,包括飼用或飼料豆科植物、觀賞植物、糧食作物、樹或 灌木,其中所述植物選自包含以下物種的名單槭樹屬物種(Acer spp·)、獼猴桃屬物種 (Actinidia spp.)、秋葵屬物種(Abelmoschus spp.)、劍麻(Agave sisalana)、冰草屬物 種(Agropyronspp.)、匍匍剪股穎(Agrostis stolonifera)、蔥屬物種(Allium spp·)、覽 屬物禾中(Amaranthus spp·)、歐洲海濱草(Ammophila arenaria)、鳳梨(Ananas comosus)、 番荔枝屬物種(Annona spp.)、旱芹(Apiumgraveolens)、蜘蛛蘭屬物種(Arachis spp·)、
禾中(Artocarpusspp.)(Asparagus officinalis) ^^^M^ft (Avena
spp.)(例如燕麥(Avena sativa)、野燕麥(Avena fatua)、比贊燕麥(Avena byzantina)、 S ^^J^^ft (Avena fatua var. sativa) > ^ft(Avena hybrida) 、P曰杉匕(Averrhoa carambola)、 1^Μ·禾中(Bambusa sp. )、H (Benincasahispida)、EM^ (Bertholletia excelsea)、甜菜(Beta vulgaris)、蕓苔屬物種(Brassica spp.)(例如歐洲油菜(Brassica napus)、蕪青物種(Brassicarapa ssp.)[卡諾拉油菜、油菜籽油菜(oilseed rape)、 Μ. W (turnip rape)])> Cadaba farinosa> ^ (Camellia sinensis)> ^KM (Canna
(Cannabis sativa) >^lJft (Capsicum spp. ) > Carex elata> (Carica papaya) > i; ^jg(Carissa macrocarpa) > ill ^M iItlft (Carya spp. ) > 花(Carthamus tinctorius)、栗屬物禾中(Castanea spp·)、美洲木棉(Ceiba pentandra)、 苦宦(Cichorium endivia)、樟屬物禾中(Cinnamomum spp.)、西瓜(Citrullus lanatus)、 柑桔屬物種(Citrus spp.)、椰子屬物種(Cocos spp.)、咖啡屬物種(Coffea spp·)、芋頭 (Colocasiaesculenta)、非洲梧桐屬物種(Cola spp·)、黃麻屬物種(Corchorus sp·)、芫 ^ (Coriandrum sativum) > ^M i^ft (Corylus spp.) > LijilMiItl ft (Crataegus spp.)、· 紅花(Crocus sativus)、南瓜屬物種(Cucurbita spp·)、香瓜屬物種(Cucumis spp.)、菜 薊屬物種(Cynara spp·)、胡蘿卜(Daucuscarota)、山馬蝗屬物種(Desmodium spp·)、龍 目艮(Dimocarpus longan)、薯裁屬物種(Dioscorea spp.)、神樹屬物種(Diospyros spp.)、 稗屬物種(Echinochloa spp.)、油棕屬(Elaeis)(例如油棕(Elaeis guineensis)、美洲 油棕(Elaeis oleifera)、糝子(Eleusine coracana)、蔗茅屬物種(Erianthussp.)、枇杷 (Eriobotrya japonica)(Eucalyptus sp.) ^iLifM (Eugenia uniflora)
屬物種(Fagopyrum spp.)、7jC青岡屬物種(Fagusspp.)、葦狀羊茅(Festuca arundinacea)、 無花果(Ficus carica)、金桔屬物種(Fortunella spp.)、草莓屬物種(Fragaria spp·)、 銀杏(Ginkgobiloba)、大豆屬物種(Glycine spp.)(例如大豆(Glycine max)、大 豆(Sojahispida)或大豆(Soja max)、陸地棉(Gossypium hirstum)、向日葵屬物種 (Helianthus spp.)(例如向日葵(Helianthus annuus)、長管萱草(Hemerocallis fulva)、 木槿屬物種(Hibiscus spp·)、大麥屬物種(Hordeumspp.)(例如大麥(Hordeum vulgare)、甘薯(Ipomoea batatas)、核桃屬物禾中(Juglans spp·)、萵苣(Lactuca sativa)、 山黧 豆屬物禾中(Lathyrus spp·)、兵豆(Lens culinaris)、亞麻(Linum usitatissimum) > H 枝(Litchichinensis)、百脈根屬物種(Lotus spp.)、棱角絲瓜(Luffa acutangula)、 習習扇豆屬物禾中(Lupinus spp. ) > Luzula sylvatica、番屬物禾中(Lycopersicon spp.) (例如番爺(Lycopersicon esculentum、Lycopersiconlycopersicum、Lycopersicon pyriforme)、硬皮豆屬物種(Macrotylomaspp.)、蘋果屬物種(Malus spp·)、凹緣金虎尾 (Malpighia emarginata)、41 _ 胃(Mammea americana) > τ ^ (Mangifera indica)、 WM^ft (Manihot spp. )(Manilkara zapota)^^!! (Medicago sativa)、H
禾中(Melilotus spp.) ,Μ^Μ^Ψ^ (Mentha spp.) (Miscanthussinensis) >^ 瓜屬物種(Momordica spp.)、黑桑(Morus nigra)、芭蕉屬物種(Musa spp.)、煙草屬物 種(Nicotiana spp·)、木犀欖屬物種(Oleaspp.)、仙人掌屬物種(Opuntia spp·)、鳥足 豆屬物種(Ornithopus spp.)、稻屬些物種(Oryza spp.)(例如稻(Oryza sativa)、闊葉 禾S (Oryza latifolia)、稷(Panicum miliaceum)、柳枝稷(Panicum virgatum)、雞蛋果 (Passifloraedulis)、歐防風(Pastinaca sativa)、狼尾草屬物種(Pennisetum sp·)、鍔 ^cMiItlft (Persea spp.) >H^jr (Petroselinum crispum)、|H (Phalarisarundinacea) > 菜豆屬物種(Phaseolus spp.)、貓尾草(Phleum pratense)、刺葵屬物種(Phoenix spp.)、 南方蘆葦(Phragmites australis)、酸漿屬物種(Physalis spp·)、松屬物種(Pinus spp·)、阿月渾子(Pistacia vera)、豌豆屬物種(Pisum spp·)、早熟禾屬物種(Poa spp·)、 楊屬物種(Populusspp.)、牧豆草屬物種(Prosopis spp.)、李屬物種(Prunus spp.)、番 石槽屬物種(Psidium spp·)、石槽(Punica granatum)、西洋梨(Pyrus communis)、櫟屬 物禾中(Quercus spp.)、蘿卜(Raphanus sativus)、波葉大黃(Rheumrhabarbarum)、茶薦 子屬物種(Ribes spp.)、蓖麻(Ricinus communis)、懸鉤子屬物種(Rubus spp.)、甘蔗 屬物種(Saccharum spp.)、柳屬物種(Salix sp.)、接骨木屬物種(Sambucus spp.)、黑 麥(Secale cereale)、胡麻屬物種(Sesamum spp.)、白芥屬物種(Sinapis sp.)、茄屬物 禾中(Solanumspp.)(例如馬鈴薯(Solanum tuberosum)、紅爺(Solanum integrifolium) 或番爺(Solanum tuberosum)、兩色蜀黍(Sorghum bicolor)、菠菜屬物禾中(Spinacia spp.)、蒲桃屬物種(Syzygium spp.)、萬壽菊屬物種(Tagetesspp.)、酸豆(Tamarindus indica)、可可樹(Theobroma cacao)、車軸草屬物種(Trifolium spp.)、小黑麥屬物種 (Triticale sp.)、Triticosecalerimpaui、小麥屬物種(Triticum spp.)(例如普通小 麥(Triticum aestivum)、硬粒小麥(Triticum durum)、圓柱小麥(Triticum turgidum)、 Triticumhybernum、馬卡小麥(Triticum macha)、普通小麥(Triticum sativum)或普通小 麥(Triticum vulgare)、小金蓮花(Tropaeolum minus)、金蓮花(Tropaeolum majus)、越 桔屬物種(Vaccinium spp.)、野碗豆屬物種(Viciaspp.)、豇豆屬物種(Vigna spp.)、香堇 (Viola odorata)、葡萄屬物禾中(Vitisspp.)、玉蜀黍(Zea mays)、Zizania palustris、^屬 物種(Ziziphus spp.)及其他。發(fā)明詳述令人驚訝地,現(xiàn)在已經(jīng)發(fā)現(xiàn)調(diào)節(jié)植物中編碼PATL多肽或PRP38多肽或GATA樣多 肽或ADA2多肽或WDR23樣多肽的核酸的表達產(chǎn)生相對于對照植物具有增強的產(chǎn)量相關性 狀的植物。根據(jù)第一實施方案,本發(fā)明提供了用于相對于對照植物而言增強植物中產(chǎn)量相關性狀的方法,其包括調(diào)節(jié)植物中編碼PATL多肽或PRP38多肽或GATA樣多肽或ADA2多肽 或WDR23樣多肽的核酸的表達。在一個實施方案中,令人驚訝地,現(xiàn)在已經(jīng)發(fā)現(xiàn)調(diào)節(jié)(優(yōu)選提高)植物中編碼 GATA樣多肽的核酸的表達產(chǎn)生相對于對照植物具有提高的千粒重(TKW)的植物。根據(jù)一個 實施方案,本發(fā)明提供了用于相對于對照植物而言增加植物中TKW的方法,其包括調(diào)節(jié)(優(yōu) 選提高)植物中編碼GATA樣多肽的核酸的表達。在另一個實施方案中,現(xiàn)在已經(jīng)發(fā)現(xiàn)提高植物中編碼如本文定義的WDR23樣多 肽的核酸序列的表達產(chǎn)生相對于對照植物具有增強的產(chǎn)量相關性狀的植物。本發(fā)明提供編 碼WDR23樣多肽的核酸序列和WDR23樣多肽,借此植物中分離核酸序列的提高的表述相對 于對照植物而言增強產(chǎn)量相關性狀。用于調(diào)節(jié)(優(yōu)選提高)編碼PATL多肽或PRP38多肽或GATA樣多肽或ADA2多肽或 WDR23樣多肽的核酸的表達的優(yōu)選方法是通過在植物中引入并表達編碼PATL多肽或PRP38 多肽或GATA樣多肽或ADA2多肽或WDR23樣多肽的核酸和可選地選擇具有增強的產(chǎn)量相關 性狀的植物。下文中對“用于本發(fā)明方法中的蛋白質(zhì)”的任何提及意指如本文中所定義的PATL 多肽或PRP38多肽或GATA樣多肽或ADA2多肽或WDR23樣多肽。下文中對“用于本發(fā)明方 法中的核酸”的任何提及意指能夠編碼此類PATL多肽或PRP38多肽或GATA樣多肽或ADA2 多肽或WDR23樣多肽的核酸。待引入植物的核酸(并因此用于實施本發(fā)明的方法)是任意 編碼下述類型的多肽的核酸序列,,也稱作“PATL核酸”或“PATL基因”或“PRP38核酸”或 "PRP38基因”或“GATA樣核酸”或“GATA樣基因”或“ADA2核酸”或“ADA2基因”或“WDR23 樣核酸序列”或“WDR23樣基因”。如本文中所定義的術語“PATL多肽”指任意多肽,其包含(i)SEC14結(jié)構域和/或(ii) GOLD 結(jié)構域SEC 14和GOLD結(jié)構域通常位于PATL多肽的C-端區(qū)。PATL多肽的N-端長度可 變,且具有比C-端更多樣的氨基酸序列。N-端特征在于富含酸性氨基酸(PI-等電點-大 約為4),例如谷氨酸(E),以及含有多個EEK(谷氨酸-谷氨酸-賴氨酸)重復。另外,預計 N-端序列包括一個或多個卷曲螺旋,該卷曲螺旋是常見的蛋白質(zhì)寡聚化-折疊基序。卷曲 螺旋結(jié)構域通常含有疏水和親水氨基酸殘基,其形成α "螺旋,其在胞質(zhì)環(huán)境中可包住提 供二聚化的熱力學驅(qū)動力的親水氨基酸之間的彼此相對的疏水鏈。卷曲螺旋可使用本領域 充分描述的方法和軟件容易的鑒定,例如使用COIL或PAIRCI0L2 (Lupas等;1991. Science, 252,1162-1164 ;MacDonnell 等 2006. Bioinformatics. ;22(3) :356_8)。圖 1 顯示 SEQ ID NO 2中所示的特征性EEK重復和卷曲螺旋結(jié)構域。用于本發(fā)明方法的優(yōu)選的PATL多肽包含具有一個或多個以下特征的酸性N-端⑴等電點按照遞增的優(yōu)選順序為低于5,4. 5、4、3· 5或3 ;(ii) 一個或多個卷曲螺旋,優(yōu)選按照遞增的優(yōu)選順序為一個、兩個、三個、四個或 五個;(iii) 一個或多個EEK重復,優(yōu)選按照遞增的優(yōu)選順序為一個、兩個、三個、四個、 五個、六個或七個。
本文中PATL多肽的N-端是在SEC14結(jié)構域N-端延伸的蛋白質(zhì)部分。多肽的等電點,即特定分子或表面不攜帶靜電荷時的pH,可由本領域已知的方 法計算(Stryer, 1995),例如使用 Henderson-Hasselbalch 方程式(Henderson (1908), Am.J. Physiol. ,21,173-179 ;Hasselbalc(1917) , Biochemische Zeitschrift,78, 112-144.de Livie, (2003) J. Chem. Educ.,80,146)。通常,PATL多肽在上述N-端之后包含SEC14結(jié)構域。PATL多肽中的SEC14結(jié) 構域包含與酵母Secl4p蛋白質(zhì)同源的區(qū)域,該酵母Secl4p蛋白質(zhì)包含磷脂結(jié)合口袋。酵 母Secl4p中涉及脂類結(jié)合和/或轉(zhuǎn)移的E、K和G氨基酸殘基在PATL多肽中是保守的,其 在SEQ ID NO 2中對應E434、K465和G493 (
圖1)。SEQ ID NO 2的谷氨酸E434和賴氨酸 K465是酵母Secl4p蛋白質(zhì)E207和K239的同源殘基,其形成涉及選擇和結(jié)合PtdIns的鹽 橋。酵母Secl4P的疏水口袋在PATL多肽中也是保守的。PATL多肽可包含通常位于C-端的GOLD結(jié)構域。PATL多肽中的GOLD結(jié)構域富含 賴氨酸殘基,并包含保守序列 KX(IO-Il) (K/R/T)KKKX(0-1) (L/V/A) (L/V/A) YR(參見圖 2), 其與披網(wǎng)格蛋白小泡蛋白質(zhì)中發(fā)現(xiàn)的PtdIns(4,5)P2結(jié)合基序類似。用于本發(fā)明方法的優(yōu)選的PATL多肽包含至少一個如下結(jié)構域(i)SEQ ID NO :71 所示的 SEC14 結(jié)構域Ipeldsvvfyrgadreghpvcynvygefqdkdly ekafgdeekrerfIkwriqllergilsqldfspsgicsmvqvtdlknsppmlgkhravtrqavallqdnypefiakk vfinvpwwylaankmmspfltqrtkskfifaspaksaetlfryiapeqvpvqfgglfk sKi^Mi^ii1 的ifcH1 序與SEQ ID NO 71所示的結(jié)構域或表A中任意多肽中存在的任意SEC14結(jié)構域具有至少 50%、55%、60%、65%、70%、75%、80%、82%、85%、90%、92%、95%、97% 或更高序列同 一性的結(jié)構域;(ii)SEQ ID NO :72 所示的 GOLD 結(jié)構域sdavteltikpssketveipvtenstigwelrvlg wevsygaeftpdaeggytvivqktrkvpaneepimkgsfkvgepgkivltinnpaskkkklIyrskv 或按照遞土曾 的優(yōu)選順序與SEQ ID NO :72所示的結(jié)構域或表A中任意多肽中存在的任意GOLD結(jié)構域具 有至少 50%、55%、60%、65%、70%、75%、80%、82%、85%、90%、92%、95%、97% 或更高 序列同一性的結(jié)構域。用于本發(fā)明方法的進一步優(yōu)選的PATL多肽包含至少一個保守基序分別SEQ ID NO :69/L(L/T)KFLRAR 和 SEQ ID NO :70/(L/F) (Q/E)DNYPEF 所示的基序 Ia 和基序 Ila。用于本發(fā)明方法的PATL多肽優(yōu)選是按照遞增的優(yōu)選順序與表A中給出的任意多 肽具有至少 50%、55%、60%、70%、75%、80%、85%、90%、92%、93%、95%、96%、98%或
更高序列同一性的那些多肽。PATL多肽中包含的SEC14結(jié)構域和GOLD結(jié)構域可通過檢索特定的數(shù)據(jù)鑒定, 該特定的數(shù)據(jù)庫包含覆蓋保守蛋白質(zhì)結(jié)構域和家族的序列多重比對和隱匿馬爾科夫模型 的集合,例如可獲自Sanger Institute,英國的Pfam?;蛘呱鲜鼋Y(jié)構域可通過掃描The Integrated Resource ofProtein Families, Domains 禾口 Sites (InterPro)數(shù)據(jù)庫發(fā)現(xiàn),以 檢測與已知SEC14或GOLD結(jié)構域的顯著序列比對(參見實施例4)。Interpro數(shù)據(jù)庫是常 用的文本和序列-堿基檢索(text-and sequnce-based search)標簽據(jù)書庫的整合界面。 InterPro數(shù)據(jù)庫合并了這些數(shù)據(jù)庫,所述數(shù)據(jù)庫使用不同的方法學及不同程度的有關充分 表征的蛋白質(zhì)的生物學信息以獲得蛋白質(zhì)特征標識(protein signatures) 0合作數(shù)據(jù)庫包括 SWISS-PROT、PROS ITE, TrEMBL, PRINTS、ProDom 和 Pfam、Smart 和 TIGRFAM。Interpro 由英國歐洲生物信息學研究所(EuropeanBioinformatics Institute)維護。本文定義的 兩個多肽或兩個結(jié)構域之間的顯著匹配是按照遞增的優(yōu)選順序具有低于e_5(e的負5次
W \ 1 _10 1 "15 1 "20 1 "25 1 "50 ι -75 ι -100 ι -200 ι -300 ι -400 ι -500 ι -600 / > J- · θ 、丄·θ 、丄·θ 、丄·θ 、丄·θ 、丄·θ 、丄·θ 、丄·θ 、丄·θ 、丄·θ 、丄·θ 、丄·θ 、
1. e_7°°和1. e_8°°的e-值的比對。多肽序列可使用本領域任一已知的方法比對,該方法包 括全局和局部比對方法,例如Blast算法,例如Altschul,SF,等,(1990) J. Mol. Biol. 215 403-10描述的算法。取得與給定序列出現(xiàn)比對結(jié)果的概率作為用于鑒定相似多肽的基礎。 通常用來代表這種概率的參數(shù)稱作e-值(E-值)。所述e_值是S評分可靠性的一個量度。 S評分是待比對的兩個序列的相似性的一個度量。e_值描述給定S評分預期以多少頻率隨 機出現(xiàn)。該e-值可以高至1.0。優(yōu)選地,用于本發(fā)明方法的PATL多肽包含至少一個如下結(jié)構域(i)SEC14結(jié)構域,其當于已知的SEC14結(jié)構域比對時,更優(yōu)選當于表C的任意 SEC14結(jié)構域比對時,按照遞增的優(yōu)選順序的e_值低于e_5(e的負5次冪)、1. e-10U. e_15、
-, -20 -, -25 -, -50 -, -75 -, -100 -, -200 -, -300 -, -400 -, -500 -, -600 -, -700 ^n ι -800
l.e 、l.e 、l.e 、l.e 、l.e 、l.e 、l.e 、l.e 、l.e 、l.e 、l.e ^u 1. e ;(ii)GOLD結(jié)構域,其當于已知的GOLD結(jié)構域比對時,更優(yōu)選當于表C的任意S GOLD結(jié)構域比對時,按照遞增的優(yōu)選順序的e_值低于e_5(e的負5次冪)、1. e-10U. e_15、
-, -20 -, -25 -, -50 -, -75 -, -100 -, -200 -, -300 -, -400 -, -500 -, -600 -, -700 ^n ι -800
l.e 、l.e 、l.e 、l.e 、l.e 、l.e 、l.e 、l.e 、l.e 、l.e 、l.e ^u 1. e 0優(yōu)選地,用于本發(fā)明方法的PATL多肽序列是下述多肽序列,當其用于構建諸如圖 3所示的系統(tǒng)樹時,與該樹中的任意序列聚簇,尤其優(yōu)選與包含SEQ ID NO :2的組Ia中的 序列聚簇。術語“結(jié)構域”和“基序”在文中的“定義”部分定義。存在用于鑒定結(jié)構域的 專業(yè)數(shù)據(jù)庫,如 SMART (Schultz 等(1998) Proc. Natl. Acad. Sci.美國 95,5857-5864 ; Letunic 等(2002)Nucleic Acids Res 30,242-244)、 InterPro(Mulder 等,(2003) Nucl. Acids. Res. 31,315-318)> Prosite(Bucher 禾口 Bairoch(1994), A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretatior^用于生物分子序列基序的廣義圖譜語法及其在自動化序列判讀 中的功能),(在)ISMB-94 ;第二屆分子生物學智能系統(tǒng)國際會議文集.Altman R. ,Brutlag D.,Karp P.,Lathrop R.,Searls D.編,第 53-61 頁,AAAI Press, Menlo Park ;Hulo 等, Nucl. Acids. Res. 32 :D134-D137,(2004))或 Pfam(Bateman 等,Nucleic Acids Research 30(1) =276-280(2002)) 0用于計算機芯片上分析蛋白質(zhì)序列的一組工具可在ExPASY蛋白 質(zhì)組學服務器上獲得(瑞士生物信息學研究所(Gasteiger等,ExPASy the proteomics server for in-depth protein knowledge andanalysis (用于深人認i只禾口分析蛋白質(zhì)白勺蛋 白組學服務器),Nucleic AcidsRes. 31 =3784-3788 (2003)) 0結(jié)構域或基序也可以使用常 規(guī)技術如通過序列比對而鑒定。用于比對序列比較的方法是本領域眾所周知的,此類方法包括GAP、BESTFIT、 BLAST、FASTA 禾口 TFASTA。GAP 使用 Needleman 和 Wunsch 算法((1970) J Mol Biol 48 443-453)以找到使匹配數(shù)最大化并使空位數(shù)最小化的兩個完整序列的全局性(即覆蓋完 整序列的)比對。BLAST算法(Altschul等(1990) J Mol Biol 215 :403_10)計算序列同一 性百分數(shù)并執(zhí)行對兩個序列間相似性的統(tǒng)計分析。用于執(zhí)行BLAST分析的軟件是公眾通過
36國家生物技術信息中心(NCBI)可獲得的。同源物可以使用例如ClustalW序列多重比對算 法(1. 83版本)以默認配對比對參數(shù)和評分方法(以百分數(shù)計)而輕易地鑒定。相似性和同 一性的全局百分數(shù)也可以使用在MatGAT軟件包中可獲得的方法之一而確定(Campanella 等,BMC Bioinformatics. 2003 Jul 10 ;4 :29. MatGAT 用蛋白質(zhì)或 DNA 序列而產(chǎn)生相似性 / 同一 生失巨P車的ISM (an applicationthat generates similarity/identity matrices using protein or DNAsequences))??梢赃M行細微手工編著以優(yōu)化保守基序之間的比對, 如本領域技術人員顯而易見。此外除了使用全長序列以鑒定同源物,也可以使用特定結(jié)構 域。使用上文提及的程序,使用默認參數(shù),針對整個核酸序列或氨基酸序列或針對選擇的 結(jié)構域或保守基序測定了序列同一性值。對于局部比對,Smith-Waterman算法尤其有用 (Smith TF, Waterman MS(1981)J. Mol. Biol 147(1) ; 195-7)。進一步,PATL多肽通常具有磷脂酰肌醇(Phosphatidylinositide,PtdIns)和 / 或磷脂酰膽堿(Ptd Cho)結(jié)合活性。它們優(yōu)選結(jié)合磷脂酰肌醇。磷脂酰肌醇是指任何具有 其sn-甘油3-磷酸殘基酯化為ID-肌-肌醇的1-羥基的糖磷脂(glycophospholipid)。 或者,PATL多肽通常體外催化磷脂酰肌醇(Phosphatidylinosito)和磷脂酰膽堿在膜之間 的轉(zhuǎn)移。測定Ptdlns/PtdCho結(jié)合和,或跨膜轉(zhuǎn)移的方法是本領域眾所周知的(Bankaitis VA 等· (1990). Nature 347 :561_2 ;Peterman 等(2004))。或者,PATL核酸可通過其互補釀酒酵母secl4溫度敏感型突變體的缺陷生長表型 的能力在功能性互補試驗中鑒定。在此體內(nèi)測試能夠在酵母中表達PATL多肽的PATL核酸。 幾種釀酒酵母secl4溫度敏感型突變體菌株和其互補方法是本領域眾所周知的(Kearns 等,(1998)EMBO J. 17,4004-17 ;Kapranov 等,(2001) ;Lee 等,(2000)Biochymbiophys Acta 1486 55-71)。另外,當PATL多肽、PRP38多肽、GATA樣多肽或ADA2多肽在稻中表達且根據(jù)實施 例7和8中概述的本發(fā)明方法提高時,得到具有增強的產(chǎn)量相關形狀的植物,該產(chǎn)量相關性 狀尤其是種子總重量、種子飽滿率、飽滿種子數(shù)和每穗花總數(shù)中的任何一個或多個。本發(fā)明通過用SEQ ID NO 1所示的編碼多肽序列SEQ ID NO :2的核酸序列轉(zhuǎn)化 的植物加以說明,或通過用SEQ ID NO :76所示的編碼多肽序列SEQ ID NO :77的核酸序列 轉(zhuǎn)化的植物加以說明,或通過用SEQID N0:128所示的編碼多肽序列SEQ ID N0:129的核 酸序列轉(zhuǎn)化的植物加以說明,或通過用SEQ ID NO :181所示的編碼多肽序列SEQ IDNO 182 的核酸序列轉(zhuǎn)化的植物加以說明,或通過用SEQ ID N0:215所示的編碼多肽序列WDR23樣 多肽序列SEQ ID NO :216的核酸序列轉(zhuǎn)化的植物加以說明。然而,本發(fā)明的實施不限于這 些序列。本發(fā)明方法可以使用如文中定義的任意PATL-編碼核酸或PATL多肽,PRP38-編 碼核酸或PRP38多肽或GATA樣-編碼核酸或GATA樣多肽或ADA2-編碼核酸或ADA2多肽 或WDR23樣多肽有利地進行。編碼PATL多肽或PRP38多肽或GATA樣多肽或ADA2多肽或WDR23樣多肽的核酸 的實例在本文實施例1的表A中給出。此類核酸可用于實施本發(fā)明的方法。實施例1的表 A中給出的氨基酸序列是SEQID NO 2所示的PATL多肽,或SEQ ID NO 77所示的PRP38多 肽,或SEQ ID NO 129所示的GATA樣多肽,或SEQ ID NO 182所示的ADA2多肽,或SEQ ID NO :216所示的WDR23樣多肽的直向同源物和旁系同源物的序列實例,術語“直向同源物” 和“旁系同源物”如文中所定義。其他直向同源物和旁系同源物可以通過開展所謂交互性blast搜索而容易地鑒定。這通常涉及第一 BLAST,其中所述的第一 BLAST包括提交查詢序 列(例如使用實施例1的表A中列出的任一序列)用于針對任一序列數(shù)據(jù)庫(如公眾可用 的NCBI數(shù)據(jù)庫)的BLAST搜索。當從核苷酸序列開始時,一般使用BLASTN或TBLASTX (使 用標準默認值),并且當從蛋白質(zhì)序列開始時,可以使用BLASTP或TBLASTN(使用標準默認 值)。任選地可以篩選BLAST結(jié)果。隨后提交篩選結(jié)果和非篩選結(jié)果的全長序列以針對來 自生物的序列進行反向BLAST (第二 BLAST),其中查詢序列來自所述的生物(其中在查詢 序列是SEQ ID NO :1或SEQ ID NO :2的情況下,第二 BLAST因而將針對稻序列;或在查詢 序列是 SEQ ID N0:76 或 SEQ ID NO 77、SEQ ID N0:128 或 SEQID NO 129,SEQ ID NO 181 或 SEQ ID N0:182 或 SEQ ID NO :215 或 SEQ ID NO :216 的情況下,第二 BLAST 因而將針對 擬南芥序列)。隨后比較第一和第二 BLAST搜索的結(jié)果。若來自第一 BLAST的高階位命中 源自與查詢序列從其中衍生的物種相同的物種,反向BLAST隨后理想地在最高命中的查詢 序列中產(chǎn)生,則鑒定到旁系同源物;若第一 BLAST的中的高階位命中不源自與查詢序列從 其中衍生的物種相同的物種,并且優(yōu)選地在反向BLAST時產(chǎn)生屬于最高命中之列的查詢序 列,則鑒定到直向同源物。PRP38結(jié)構域是指在可發(fā)揮前_mRNA加工因子功能的多肽中發(fā)現(xiàn)的保守氨基酸序 列。其通常具有大約170個氨基酸的長度,但是例如在0stta_PRP38_l中較短,而在Vitvi_ PRP38_1多肽中較長(參見表C)。PRP38結(jié)構域可由表C中的任一 PRP38結(jié)構域序列所 示,且由任意下列多肽結(jié)構域所示,所述多肽與表C中的任一 PRP38結(jié)構域的序列同一性按 照遞增的優(yōu)選順序為至少 50%,55%,60%,65%,70%,75%,80%,85%,90%,92%,95%, 98%或更高。PRP38結(jié)構域可包含一個或多個SEQ ID N0:123和SEQ ID N0:124所示的更 為保守的序列基序?;蛘撸琍RP38結(jié)構域可定義為與已知PRP38多肽,優(yōu)選與表A中的任一多肽顯著 匹配(significantly aligning)的任意多肽結(jié)構域。本文定義的兩個多肽或兩個結(jié)構域 之間的顯著匹配是按照遞增的優(yōu)選順序具有低于e_5(e的負5次冪)、1. e-10U. e_15、l. e_2°、
1 e"25 1 e-50 1 e_75 1 e-100 1 e-200 1 e-300 1 e-400 1 e-500 1 e-600 1 禾口 1 e-8CI0 的 e_ 倌的
± · O 、丄.C 、丄.C 、丄.C、丄.C、丄.C、丄.C、丄.C、丄.C、丄.C-‘! H ± · O|_| J O I H. |_| J
比對。多肽序列可使用本領域任意已知的方法比對,該方法包括全局和局部比對方法,例如 Blast 算法,例如 Altschul,SF,等,(1990) J. Mol. Biol. 215 :403_10 描述的算法。取得與 給定序列出現(xiàn)比對結(jié)果的概率作為用于鑒定相似多肽的基礎。通常用來代表這種概率的參 數(shù)稱作e-值(E-值)。所述e_值是S評分可靠性的一個量度。S評分是查詢序列與包含 PRP38的查詢序列的相似性的一個度量。e_值描述給定S評分預期以多少頻率隨機出現(xiàn)。 該e-值臨界可以高至1.0。本發(fā)明方法中使用的PRP38多肽優(yōu)選包含下述PRP38結(jié)構域,其當與已知PRP38 結(jié)構域,更優(yōu)選當與表C中的任一 PRP38結(jié)構域比對時,按照遞增的優(yōu)選順序具有低于
γ ι _10 ι -15 ι -20 ι -25 ι -50 ι -75 ι -100 ι -200 ι -300 ι -400 ι -500 ι -600 θ O、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、
1. e_7°° 和 1. e_8°° 的 e-值。多肽中存在的PRP38結(jié)構域可通過檢索特定的數(shù)據(jù)庫鑒定,該特定的數(shù)據(jù)庫包含 覆蓋保守蛋白質(zhì)結(jié)構域和家族的序列多重比對和隱匿馬爾科夫模型的集合,例如可獲自 Sanger Institute,英國的Pfam。本文的實施例2顯示了使用PRP38多肽作為查詢序列的 Pfam檢索到的結(jié)果。
DUF1777結(jié)構域是迄今描述的蛋白質(zhì)的小子集中發(fā)現(xiàn)的保守氨基酸序列。其通常 為140至150個氨基酸的長度,雖然也發(fā)現(xiàn)更短的形式,參見例如Chlre_PRP38_l多肽的 DUF1777結(jié)構域(表C)?;谛蛄型葱?,已在不同的活生物中鑒定了 DUF1777結(jié)構域。DUF 結(jié)構域的編輯(compilation)可見于可獲自Sanger Institute (英國)的Pfam數(shù)據(jù)庫中。 多肽中DUF1777結(jié)構域的存在可容易地通過篩選特定的數(shù)據(jù)庫鑒定,該特定的數(shù)據(jù)庫包含 覆蓋保守蛋白質(zhì)結(jié)構域和家族的序列多重比對和隱匿馬爾科夫模型的集合,例如Pfam。包 含DUF1777結(jié)構域的多肽在檢索Pfam數(shù)據(jù)庫中,將登記為命中之前已知的DUF1777結(jié)構 域。真核來源的蛋白質(zhì)中DUF1777結(jié)構域的氨基酸序列常常是很多變的,僅有少數(shù)幾個氨 基酸殘基是恰好保守的。兩個DUF1777結(jié)構域比對的e_值通常高,一般高于0. 001,更一般 高于0. 01。本發(fā)明方法中使用的PRP38多肽優(yōu)選包含下述DUF1777結(jié)構域,其當與已知 DUF1777結(jié)構域,更優(yōu)選當與表C中的任一 DUF1777結(jié)構域比對時,按照遞增的優(yōu)選順序
且有佃干 1 P-5 1 P-10 1 P-15 1 ρ-20 I P—25 1 P—50 1 ρ—75 1 ρ-100 1 ρ-200 1 ρ-300 1 ρ-400
^^ P^ IIsVj 」 丄、丄、丄、丄、丄、丄、丄、丄、丄、丄、丄>
1. e-5°°、1. e-_、1. e_7°° 和 1. e_8°° 的 e_ 值。本發(fā)明方法中使用的PRP38多肽更優(yōu)選包含下述DUF1777結(jié)構域,其與表C中 的任一 DUF1777結(jié)構域按照遞增的優(yōu)選順序具有至少50 %、55 %、60 %、65 %、70 %、75 %、 80%、85%、90%、92%、95%、98% 或更高的序列同一性。多肽中存在的DUF1777結(jié)構域可通過檢索特定的數(shù)據(jù)庫鑒定,該特定的數(shù)據(jù)庫包 含覆蓋保守蛋白質(zhì)結(jié)構域和家族的序列多重比對和隱匿馬爾科夫模型的集合,例如可獲自 Sanger Institute,英國的Pfam。本文的實施例2顯示了使用PRP38多肽作為查詢序列的 Pfam檢索你的結(jié)果。PRP38多肽可包含RS結(jié)構域。RS結(jié)構域是富含精氨酸(R)和絲氨酸(S)氨基酸 殘基的多肽區(qū)域。RS結(jié)構域包含多個二肽,如序列RS (精氨酸-絲氨酸)、RE(精氨酸-谷 氨酸)、RD (精氨酸-天冬氨酸)所示的二肽。通常二肽跨越PRP38多肽從第4位至第150 位氨基酸的區(qū)域。上述二肽可在聚簇中存在,此類聚簇全部由任一個或多個RS、RE、RD 二肽 組成,且一般長度為4-40個氨基酸。本發(fā)明方法中使用的PRP38多肽優(yōu)選包含一個或多個下述RS、RE、RD 二肽,其為 4、6、8、10、12、14、20、24、30、40、50、100 或最多 150 個氨基酸的一段序列。本發(fā)明方法中使用的PRP38多肽更優(yōu)選包含兩個或多個下述二肽聚簇,該聚簇全 部由RS、RE和/活RD氨基酸殘基組成。更優(yōu)選該PRP38多肽包含4個二肽聚簇,最優(yōu)選的 二肽聚簇由RSRSRSRS所代表。PRP38多肽還可包含任一個或多個下列保守序列基序(iv) SEQ ID NO 120/ 基序 Ib :RRPPSVKASLSVSFGQRAPHRASTRDSSPVRRT,或與基 序Ib按照遞增的優(yōu)選順序具有至少50%,55%,60%,65%,70%,75%,80%,85%,90%, 95%或更高序列同一性的基序;和/或(v)SEQ ID NO 121/ 基序 lib :SPHRA (I/V) GFLYLRY,或與基序 IIb 按照遞增的優(yōu) 選順序具有至少 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高序列同一 性的基序;和/或(Vi)SEQ ID NO 122/基序IIIb :KLKDLYGD,或與基序IIIb按照遞增的優(yōu)選順序具有至少 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高序列同一性的基序。優(yōu)選地,本發(fā)明方法中使用的PRP38多肽包含任一個或多個以下基序(i)基序lb(SEQ ID NO 120),其中任意氨基酸殘基可由保守氨基酸取代和/或多 達50 %的氨基酸殘基可由非保守氨基酸取代。(ii)基序lb(SEQ ID NO :121),其中任意氨基酸殘基可由保守氨基酸取代和/或 多達50 %的氨基酸殘基可由非保守氨基酸取代。(iii)基序lb(SEQ ID NO 122),其中任意氨基酸殘基可由保守氨基酸取代和/或 多達50 %的氨基酸殘基可由非保守氨基酸取代。本發(fā)明方法中使用的PRP38多肽優(yōu)選是下述,其與表A中給出的任意多肽按照遞 增的優(yōu)選順序具有至少 50%,55%,60%,70%,75%,80%,85%,90%,92%,93%,95%, 96% ;98%或更高序列同一性。優(yōu)選地,本發(fā)明方法中使用的PRP38多肽是下述,當其用于構建諸如圖8所示的系 統(tǒng)樹時,與包含SEQ ID NO 77的組Ib中的任意序列聚簇。通常在PRP38多肽中,PRP38結(jié)構域見于N-端,DUF1777結(jié)構域見于C-端。PRP38 多肽一般具有酸性C-端和,并定位于細胞核。另外,PRP38多肽一般具有前_mRNA剪切活性。測定前_mRNA剪切活性的工具和 技術是本領域眾所周知的(Blanton S,等,(1992)Mol Cell Biol 12(9) 3939-47 ;Stevens SW 和 Abelson J(1999)Proc NatlAcad Sci USA 96(13) 7226-31;Gottschalk A,等, (1999)EMBO J18(16) 4535-48 ;Pandit S,等,(2006)Proc Natl Acad Sci USA103(37) 13700-5)。另外,當PRP38多肽根據(jù)實施例7和8中概述的本發(fā)明方法在稻中表達時,得到具 有增強的產(chǎn)量相關形狀的植物,該產(chǎn)量相關性狀尤其是地上部分葉生物量、萌發(fā)勢、種子總 重量、種子飽滿率、收獲指數(shù)和種子總數(shù)中的任何一個或多個。本發(fā)明通過用SEQ ID NO :76所示的編碼多肽序列SEQ ID NO :77的核酸序列轉(zhuǎn)化 的植物加以說明。然而,本發(fā)明的實施不限于這些序列;本發(fā)明方法可以使用如文中定義的 任意PRP38-編碼核酸或PRP38多肽有利地進行。如本文定義的“GATA樣多肽”是指任意包含GATA結(jié)構域的Zn指轉(zhuǎn)錄因子(例如 SMART數(shù)據(jù)庫中以登錄號SM00401所定義的)。優(yōu)選地,本發(fā)明方法中使用的“GATA樣多肽” 是在Zn指的第二個和第三個Cys殘基之間包含18或20個氨基酸的單個GATA結(jié)構域,更 優(yōu)選在Zn指的第二個和第三個Cys殘基之間包含18個氨基酸(CX2CX18CX2C)。術語“鋅指” 或“Zn指”是本領域已知的,指下述序列基序,其中半胱氨酸和/或組氨酸與鋅原子配位,形 成特定功能所需的局部肽結(jié)構。更優(yōu)選,本發(fā)明方法中使用的GATA樣多肽屬于亞家族II,其由Reyes等(Plant Physiol. 134,1718-1732,2004)定義。亞家族II GATA轉(zhuǎn)錄因子一般由具有2或3個外顯 子的基因組成,其中鋅指分處于最后兩個外顯子中。亞家族II GATA轉(zhuǎn)錄因子在Zn指環(huán)中 也具有18個殘基。本發(fā)明方法中使用的GATA樣多肽中的GATA結(jié)構域優(yōu)選包含B型Zn指類,其如 Reyes等,(2004)所定義。BZn指類結(jié)構域在Zn指環(huán)中具有18個殘基,并由保守Ser殘基
40(圖11中示于GATA結(jié)構域的第27位)和保守IRX(R/K)K基序的存在進一步表征。優(yōu)選地,GATA結(jié)構域包含基序Ic和/或基序2c 基序Ic (SEQ ID NO 130)C (S/A/T) (D/E/N) CXT (T/S/A) (K/S) TP (L/M) WR (S/G/N) GP其中X可以是任意氨基酸,X優(yōu)選是N、K、G、H、D中的一個?;?c(SEQ ID NO 131) :GPKSLCNACGIRX(R/K)K其中X可以是任意氨基酸,X優(yōu)選是Q、H、N、S,Y,F(xiàn)中的一個。優(yōu)選地,發(fā)明方法中使用的GATA樣多肽還包含基序3c (SEQ IDNO 132)(A/S) (A/ff) X (L/C) (L/N) (M/L/V) (T/L/A) (L/D) (S/R)其中X可以是任意氨基酸,X優(yōu)選是M、L、V、I、R中的一個。或者,GATA樣蛋白質(zhì)與SEQ ID NO 129所示的氨基酸,按照遞增的優(yōu)選順序具 有至少 14%、15%、20%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、 36%,37%,38%,39%,40%,41 %,42%,43%,44%,45%,46%,47%,48%,49%,50%, 51 52%,53%,54%,55%,56%,57%,58%,59%,60%,61 62%,63%,64%,65%, 66%,67%,68%,69%,70%,71 %,72%,73%,74%,75%,76%,77%,78%,79%,80%, 81 82%,83%,84%,85%,86%,87%,88%,89%,90%,91 92%,93%,94%,95%, 96%、97%、98%或99%的全序列同一性,前提是同源蛋白質(zhì)包含如上定義的GATA結(jié)構域 和一個或多個上述保守基序。全序列同一性使用全局比對算法,例如GAP (GCG Wisconsin Package, Accelrys)程序中的Needleman Wunsch算法測定,優(yōu)選使用默認參數(shù)。與總體序 列同一性相比,當僅考慮保守結(jié)構域(例如GATA結(jié)構域)或基序時,序列同一性通常更高。優(yōu)選地,當多肽序列用于構建例如Reyes等,(2004)中圖11或圖14描述的系統(tǒng)樹 時,與Reyes等,(2004)定義的GATA樣多肽“亞家族II ”組聚簇,而不與任何其他組聚簇, 該“亞家族II”組包含SEQ ID NO 129所示的氨基酸序列。另外,GATA樣多肽(至少以其天然形式)一般具有DNA-結(jié)合活性。GATA-Zn指識 別的共有DNA序列是[AT]GATA[AG]。測定DNA結(jié)合活性的工具和技術是本領域眾所周知 的,參見例如 Teakle 等,(Plant Mol. Biol. 50,43-57,2002),或 Ghirlando 和 Trainor (J. Biol. Chem. 278,45620-45628,2003)。另外,當GATA樣多肽根據(jù)實施例7和8中概述的本發(fā)明方法在稻中表達時,得到 具有提高的千粒重的植物。本發(fā)明通過用SEQ ID NO 128所示的編碼多肽序列SEQ IDNO 129的核酸序列轉(zhuǎn) 化的植物加以說明。然而,本發(fā)明的實施不限于這些序列;本發(fā)明方法可以使用如文中定義 的任意GATA樣-編碼核酸或GATA樣多肽有利地進行。本文定義的“ADA2多肽”是指任意轉(zhuǎn)錄銜接頭多肽,其包含兩個或多個以下基序
(vii) ZZ型鋅(Zn)指結(jié)構域(viii)SANT DNA 結(jié)合結(jié)構域(ix)鈣EF手結(jié)構域(χ) SffIRM 結(jié)構域ZZ型鋅(Zn)指結(jié)構域的原型存在于肌養(yǎng)蛋白,CBP/p300蛋白質(zhì)中。ZZ結(jié)構域中的 Cys-x2-Cys基序是存在于鋅指中的回憶性的(reminiscent)Cys-x2_Cys指節(jié)(knuckle)。該結(jié)構域序列中的4-6個半胱氨酸殘基負責與鋅原子配位,以增強結(jié)構(Ponting等, TrendsBiochem Sci 1996 ;21 :11_13)。ADA2多肽中的ZZ型鋅指結(jié)構域可參與協(xié)助蛋白 質(zhì)-蛋白質(zhì)相互作用。包含ZZ鋅指結(jié)構域的擬南芥ADA2a和ADA2b蛋白質(zhì)的片段已顯示 結(jié)合GCN5蛋白質(zhì)(Mao等,2006)。SANT DNA結(jié)合結(jié)構域是Myb DNA結(jié)合結(jié)構域的亞家族(Aasland等,1996 Trends Biochem Sci 1996 ;21 :87_88)。包含SANTDNA結(jié)合結(jié)構域的多肽特異性識別存在于基因啟 動子中的序列YAAC(G/T)G。本發(fā)明方法中使用的ADA多肽結(jié)合包含序列YAAC(G/T)G的基 因啟動子,其中Y可以是C或T。SffIRM結(jié)構域(Pfam登錄號PF04433)是在真核染色體蛋白質(zhì)中發(fā)現(xiàn)的大約85個 氨基酸的小α-螺旋結(jié)構域。其在首先識別的蛋白質(zhì)SWI3、RSC8和MOIRA之后命名。預測 該結(jié)構域介導染色質(zhì)_蛋白質(zhì)復合體裝配中的蛋白質(zhì)_蛋白質(zhì)相互作用Lenkart等,Proc Natl AcadSci USA. 2006 ;103 :2057_2062)。鈣(Ca)結(jié)合EF手結(jié)構域由兩側(cè)連接十二個殘基的α _螺旋結(jié)構的十二個殘基環(huán) 組成。在EF-手環(huán)中,鈣離子與五角雙錐(pentagonalbipyramidal)構型配位。參與結(jié)合 的六個殘基在第1、3、5、7、9和12位,這些殘基表示為X、Y、Z、-Y、-X和-Z。第12位不變的 Glu 或 Asp 為配位 Ca提供兩個氧(二齒配位體)(Finn 和 Forsen 1995Structure, 3 :7_11)。本發(fā)明方法中使用的優(yōu)選ADA2多肽包含二個或多個以下結(jié)構域(i)SEQ ID NO :207 所示的 ZZ 型鋅(Zn)指結(jié)構域kpglyccnycdkdlsglvrfkcavc mdfdlcvecfsvgvelnrhkn,或與SEQ ID NO 207所示的結(jié)構域或表A中的任一多肽中存在 的任何ZZ型鋅指結(jié)構域按照遞增的優(yōu)選順序具有至少50 %、55 %、60 %、65 %、70 %、75 %、 80%、82%、85%、90%、92%、95%、97%或更高序列同一性的結(jié)構域;(ii)SEQ ID NO 208 所示的 SANT DNA 結(jié)合結(jié)構域vtsdwnadeeillleaiatygfgn wkevadhvgsktttecikhfnsaym,或與SEQ ID NO 208所示的結(jié)構域或表A中的任一多肽中 存在的任何SANT結(jié)構域按照遞增的優(yōu)選順序具有至少50 %、55 %、60 %、65 %、70 %、75 %、 80%、82%、85%、90%、92%、95%、97%或更高序列同一性的結(jié)構域;(iii) SEQ ID NO 209 所示的 Ca 結(jié)合 EF 手結(jié)構域dndaeqlIadmef,或與 SEQ ID NO 209所示的結(jié)構域或表A中的任一多肽中存在的任何Ca結(jié)合EF手結(jié)構域按照遞增的 優(yōu)選順序具有至少 50%、55%、60%、65%、70%、75%、80%、82%、85%、90%、92%、95%、 97%或更高序列同一性的結(jié)構域;(iv) SEQ ID NO :210 所示的 SWIRM 結(jié)構域priysgldtwdvdgllgadllsetekkmcnet rilpvhylkmldiltreikkgqikkksdaysffkvepskvdrvydmlvhkgigdst,或與 SEQ ID NO :210 所 示的結(jié)構域或表A中的任一多肽中存在的任何SWIRM結(jié)構域按照遞增的優(yōu)選順序具有至少 50%、55%、60%、65%、70%、75%、80%、82%、85%、90%、92%、95%、97% 或更高序列同 一性的結(jié)構域。本發(fā)明方法中使用的ADA2多肽優(yōu)選是按照遞增的優(yōu)選順序與表A中的任意多肽 具有至少 50%、55%、60%、70%、75%、80%、85%、90%、92%、93%、95%、96%、98% 或更 高序列同一性的那些多肽。多肽中包含的ZZ型鋅(Zn)指結(jié)構域、SANT DNA結(jié)合、鈣EF手結(jié)構域和SWIRM結(jié) 構域可通過檢索特定的數(shù)據(jù)庫鑒定,該特定的數(shù)據(jù)庫包含覆蓋保守蛋白質(zhì)結(jié)構域和家族的序列多重比對和隱匿馬爾科夫模型的集合,例如可獲自Sanger Institute,英國的Pfam。 或者,上述結(jié)構域可通過掃描 The Integrated Resource of Protein Families, Domains 和Sites(InterPr0)數(shù)據(jù)庫發(fā)現(xiàn),以檢測與已知ZZ型鋅(Zn)指結(jié)構域、SANT DNA結(jié)合、鈣 EF手結(jié)構域和SWIRM結(jié)構域的顯著序列比對。Interpro數(shù)據(jù)庫是常用的文本和序列_堿 基檢索標簽據(jù)書庫的整合界面。InterPro數(shù)據(jù)庫合并了這些數(shù)據(jù)庫,所述數(shù)據(jù)庫使用不同 的方法學及不同程度的有關充分表征的蛋白質(zhì)的生物學信息以獲得蛋白質(zhì)特征標識。合 作數(shù)據(jù)庫包括 SWISS-PROT、PROS ITE, TrEMBL, PRINTS、ProDom 和 Pfam、Smart 和 TIGRFAM。 Interpro由英國歐洲生物信息學研究所維護。本文定義的兩個多肽或兩個結(jié)構域之間的 顯著匹配是按照遞增的優(yōu)選順序具有低于e_5(e的負5次冪)、1. e-10U. e_15、l. e_2°、l. e_25、 1. e-5°、l. e_75、l. e-100U. fU. fU. e-4°°、l. fU. e-_、l. e—7。。和 1. e—8。。的 e-值的比對。 多肽序列可使用本領域任意已知的方法比對,該方法包括全局和局部比對方法,例如Blast 算法,例如Altschul,SF,等,(1990) J. Mol. Biol. 215 :403-10描述的算法。取得與給定序 列出現(xiàn)比對結(jié)果的概率作為用于鑒定相似多肽的基礎。通常用來代表這種概率的參數(shù)稱作 e_值(E-值)。所述e_值是S評分可靠性的一個量度。S評分是待比對的兩個序列的相似 性的一個度量。e-值描述給定S評分預期以多少頻率隨機出現(xiàn)。該e_值可以高至1.0。用于本發(fā)明方法的ADA2多肽優(yōu)選包含兩個或多個以下結(jié)構域(i)ZZ型鋅(Zn)指結(jié)構域,其當與已知ZZ型Zn指結(jié)構域,更優(yōu)選當與表C中的任 一 ZZ型Zn指比對時,按照遞增的優(yōu)選順序具有低于e_5、l. e」°、l. e_15、l. e_2°、l. e_25、l. e_5°、 1 e-75 1 e,0 1 e-200 1 e-300 1 e-400 1 e-500 1 e,0 1 e-700 禾口 1 e,0 的 e_ 倌-
丄、丄、丄、丄、丄、丄、丄、丄!丄|_| J O I PI. y(ii)SANT DNA結(jié)合結(jié)構域,其當與已知SANT DNA結(jié)合結(jié)構域,更優(yōu)選當與表C 中的任一 SANT DNA結(jié)合結(jié)構域比對時,按照遞增的優(yōu)選順序具有低于e_5、l. e-10U. e_15、
ι -20 ι -25 ι -50 ι -75 ι -100 ι -200 ι -300 ι -400 ι -500 ι -600 ι -700 知 ι -800 ΛΑ 丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 々U 丄· Θ ρ nJ
e_值;(iii)鈣EF手結(jié)構域,其當與已知鈣EF手結(jié)構域,更優(yōu)選當與表C中的任一鈣 EF手結(jié)構域比對時,按照遞增的優(yōu)選順序具有低于e_5、l. e-10U. e_15、l. e_2°、l. e_25、l. e_5°、
1 e-75 1 e,0 1 e-200 1 e-300 1 e-400 1 e-500 1 e,0 1 e-700 禾口 1 e,0 的 e_ 倌-
丄、丄、丄、丄、丄、丄、丄、丄!丄|_| J O I PI. y(iv) SWIRM結(jié)構域,其當與已知SWIRM結(jié)構域,更優(yōu)選當與表C中的任一 SWIRM結(jié) 構域比對時,按照遞增的優(yōu)選順序具有低于e_5、l. e-10U. e_15、l. e_2°、l. e_25、l. e_5°、l. e_75、 1 e,0 1 e-200 1 e-300 1 e-400 1 e-500 1 e,0 1 e-700 禾卩 1 e,0 勺 e_ 倌
± · O、丄.C、丄.C、丄.C、丄.C、丄.C、丄.C-‘! H ± · O|_| J O I H. ο或者,ADA2多肽可定義為與已知ADA2多肽,優(yōu)選與表A中的任一多肽顯著匹配的 任意多肽。優(yōu)選地,用于本發(fā)明方法的ADA2多肽序列是下述多肽序列,當其用于構建諸如圖 17所示的系統(tǒng)樹時,與該樹中的任意序列聚簇,尤其優(yōu)選與包含SEQ ID NO 182的組Id中 的序列聚簇。在ADA2多肽中,通常ZZ Zn指結(jié)構域見N-端,SANT-DNA結(jié)合結(jié)構域見于中間部 分,SffIRM結(jié)構域見于C-端.ADA2多肽一般定位于細胞核。植物ADA2多肽可包含核定位 信號,例如圖15中的SEQID NO 182所示。另外,ADA2多肽通常體外增強GCN5乙?;M蛋白的能力,使得GCN5能夠乙?;?核小體組蛋白。測定組蛋白乙?;墓ぞ吆图夹g前已描述(Stockinger等,2001 ;Mao等,2006)。植物細胞中植物來源的ADA2多肽活性的調(diào)控可通過乙?;M行。已提出擬南芥 ADA2b中ADA2a的賴氨酸殘基K257和K215可被乙?;?。本發(fā)明提供編碼WDR23樣多肽的核酸序列和WDR23樣多肽,由此相對于對照植物, 植物中分離的核酸序列的增加的表達增強產(chǎn)量_相關性狀。因此本發(fā)明的一個實施方案提供WDR23樣多肽的分離的核酸序列,其包含(i)SEQ ID NO :219、SEQ ID NO 225 或 SEQ ID NO 229 所示的分離的核酸序列;(ii)SEQ ID NO :219、SEQ ID N0:225或SEQ ID NO :229所示的分離的核酸序列的 互補序列;(iii)編碼 SEQ ID NO :220、SEQ ID N0:226 或 SEQ ID NO :230 所示的多肽序列的 分離的核酸序列;(iv)由于遺傳密碼簡并性的原因可從SEQ ID NO 220、SEQ IDNO 226或SEQ ID NO 230所示的多肽序列推導出來的分離的核酸序列;(ν)能夠在嚴格雜交條件下與 SEQ ID NO 219、SEQ ID NO: 225 或 SEQ ID NO 229 所示的核酸序列或其互補序列雜交的分離的核酸序列;(vi)分離的核酸序列,其編碼下述多肽,所述多肽與SEQ ID NO :220、SEQ ID NO 226或SEQ ID NO :230所示的多肽序列,按照遞增的優(yōu)選順序具有至少50%、55%、60%、 65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99% 或更高氨基酸序列同一 性;(iv)分離的核酸序列,其編碼包含下述結(jié)構域的多肽,所述結(jié)構域與SEQ ID NO 271所示的保守結(jié)構域,按照遞增的優(yōu)選順序具有至少65 %、70%、75 %、80%、85 %、90%、 95%、96%、97%、98%、99%或更高氨基酸序列同一性。本發(fā)明的另一個實施方案還提供下述分離的WDR23樣多肽,其包含(i)SEQ ID NO :220、SEQ ID NO 226 或 SEQ ID NO 230 所示的多月太序列;(ii)與 SEQ ID NO :220、SEQ ID NO 226 或 SEQ ID NO 230 所示的多肽序列按照 遞增的優(yōu)選順序具有至少 50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,96%, 97%、98%、99%氨基酸序列同一性的多肽序列;(iii)包含下述結(jié)構域的多肽,所述結(jié)構域與SEQ ID NO :271所示的保守結(jié)構域, 按照遞增的優(yōu)選順序具有至少 65%,70%,75%,80%,85%,90%,95%,96%,97%,98%,
99%或更高氨基酸序列同一性;(iii)上述(i)至(iii)中任意多肽序列的衍生物。根據(jù)另一實施方案,本發(fā)明提供相對于對照植物,在植物中增強產(chǎn)量-相關性狀 的方法,其包含在植物中增加編碼WDR23樣多肽的核酸序列的表達。增加編碼WDR23樣多肽的核酸序列的表達的優(yōu)選方法是通過在植物中引入和表 達編碼WDR23樣多肽的核酸序列。下文中對“用于本發(fā)明方法中的多肽”的任何提及意指如本文中所定義的WDR23 樣多肽。下文中對“用于本發(fā)明方法中的核酸序列”的任何提及意指能夠編碼此類WDR23 樣多肽的核酸序列。待引入植物的核酸序列(并因此用于實施本發(fā)明的方法)是任意編碼 下述類型的多肽的核酸序列,所述多肽現(xiàn)已描述,在下文中也稱為“WDR23樣核酸序列”或 "WDR23樣基因”。
本文定義的“WDR23樣多肽”是指包含下述結(jié)構域的多肽,所述結(jié)構域與SEQ ID NO 271 所示的保守結(jié)構域(CD)具有至少 65%,70%,75%,80%,85%,90%,95%,98%,
99 %或更高氨基酸序列同一性?;蛘呋蛄硗?,本文定義的“WDR23樣多肽”是指任意下述多肽,其包含⑴至少四 個具有PFAM登錄號PF00400的WD40重復;和(ii)兩個連續(xù)WD40重復末端的至少兩個保 守的DxR基序?;蛘呋蛄硗?,本文定義的“WDR23樣多肽”是指任意下述多肽,其與SEQ ID NO 216所示的WDR23樣多肽或本文表A中給出的任意多肽序列按照遞增的優(yōu)選順序具有至 少 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高氨基酸同一性。多肽序列SEQ ID NO 216的分析示于本文下面的實施例4中。例如,SEQ ID NO 216所示的WDR23樣多肽包含至少四個具有PFAM登錄號PF00400的WD40重復。結(jié)構域還 可以使用諸如序列比對的常規(guī)技術鑒定。本文表A的全長多肽的比對示于圖23。此類比對 可用于鑒定WDR23樣多肽之間的最保守結(jié)構域,例SEQ ID NO :271所示的保守結(jié)構域(⑶) (包含于 SEQ ID NO 216 中)。還可以使用常規(guī)技術(如序列比對)來鑒定結(jié)構域。比對序列以進行比較的 方法為本領域所熟知,這些方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP利用 Needleman和Wunsch ((1970) J Mol Biol 48 :443_453)的算法來尋找兩序列間使匹配數(shù)最 高并使空位數(shù)最少的全局比對(即在完整序列上)。BLAST算法(Altschul等(1990) J Mol Biol 215:403-10)在兩序列間計算百分比序列同一性并進行相似性的統(tǒng)計學分析。用于 進行BLAST分析的軟件在國際生物技術信息中心(National Centre for Biotechnology Information(NCBI))向公眾提供??梢允褂萌缒J配對比對參數(shù)的ClustalW序列多重 比對算法(1.83版)和百分比評分法來容易地鑒定同源物。也可以使用MatGAT軟件包 (Campanella 等,BMC Bioinformatics. 10:29. MatGAT :anapplication that generates similarity/identity matrices using protein orDNA sequences)中提供的一禾中方法石角 定全局的相似性和同一性百分比。本領域技術人員會意識到,可以進行少量手動編輯以優(yōu) 化保守性基序之間的比對。此外,還可以使用特定的結(jié)構域代替全長序列來鑒定同源物。 序列同一性值可是使用默認參數(shù)的上述程序在完整的核酸序列或氨基酸序列上或在所選 擇的結(jié)構域或保守的基序測定的。本文實施例3在表B中描述了 SEQ ID N0:216所示的 WDR23樣多肽和表A中列舉的全長WDR23樣多肽之間的同一性百分比,其可低至54%氨基 酸序列百分比。如果同一性計算在SEQ ID N0:271所示的保守結(jié)構域(⑶)(包含于SEQ ID NO 216中)和表A的WDR23樣多肽的保守結(jié)構域之間進行,同一性百分比可增加至69%, 如圖23所示。此類計算的結(jié)構見于本申請表B。蛋白質(zhì)亞細胞定位預測的工作是很重要的,并已充分研究。了解蛋白質(zhì)的定位有 助于闡明其功能。蛋白質(zhì)定位實驗方法的范圍從免疫定位到使用綠色熒光蛋白(GFP)或 β-葡糖醛酸酶(GUS)標記蛋白質(zhì)。這些方法很準確,但與計算機方法相比需要大量勞動。 從序列數(shù)據(jù)對蛋白質(zhì)定位進行計算機預測近來已取得很大進展。本領域技術人員熟知的 算法在Swiss Institute for Bioinformatics提供的ExPASy蛋白組學工具可獲得,例如 PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTSl、SignalP、TMHMM寸。另外,本發(fā)明方法中使用的WDR23樣多肽(至少以它們的天然形式)一般能夠通 過它們的WD40重復基序與其他多肽相互作。存在多種蛋白質(zhì)_蛋白質(zhì)活性的測試,例如酵 母雙雜交測試、后接質(zhì)譜的串聯(lián)親和純化(TAP)、共親和純化等。高階位命中是具有低E-值的那些命中。E-值越低,評分越顯著(或換句話說,偶 然發(fā)現(xiàn)該命中的幾率越低)。E-值的計算是本領域熟知的。除了 E-值外,比較結(jié)果也由同 一性百分數(shù)評分。同一性百分數(shù)指兩個所比較的核酸(或多肽)序列之間特定長度范圍內(nèi) 相同核苷酸(或氨基酸)的數(shù)目。在大型家族的情況下,可以使用ClustalW,隨后使用鄰接 樹法,以幫助觀察相關基因的聚類并鑒定直向同源物和旁系同源物。核酸變體也可以用于實施本發(fā)明的方法。此類核酸變體的實例包括編碼實施例1 的表A中給出的任一氨基酸序列的同源物和衍生物的核酸,術語“同源物”和“衍生物”如 文中所定義。也可用于本發(fā)明方法中的是編碼實施例1的表A中給出的任一氨基酸序列的 直向同源物或旁系同源物的同源物和衍生物的核酸。用于本發(fā)明方法中的同源物和衍生物 與它們衍生自的未修飾的蛋白質(zhì)具有基本相同的生物和功能活性。 用于實施本發(fā)明方法的其他核酸變體包括編碼PATL或PRP38或GATA樣或ADA2或 WDR23樣多肽的核酸的部分;與編碼PATL或PRP38或GATA樣或ADA2或WDR23樣多肽的核 酸雜交的核酸;編碼PATL或PRP38或GATA樣或ADA2或WDR23樣多肽的核酸的剪接變體; 編碼PATL或PRP38或GATA樣或ADA2或WDR23樣多肽的核酸的等位變體;以及通過基因改 組獲得的編碼PATL或PRP38或GATA樣或ADA2或WDR23樣多肽的核酸的變體。術語雜交 序列、剪接變體、等位變體和基因改組如文中所述。編碼PATL或PRP38或GATA樣或ADA2或WDR23樣多肽的核酸不需要是全長核酸, 因為本發(fā)明方法的實施不依賴全長核酸序列的使用。本發(fā)明提供在植物中增強產(chǎn)量相關性 狀的方法,其包括在植物中引入和表達實施例1的表A中給出的核酸序列中任一個的部分, 或?qū)嵤├?的表A中給出的氨基酸序列中任一個的直向同源物、旁系同源物或同源物的編 碼核酸的部分。核酸的部分可以例如通過對該核酸產(chǎn)生一個或多個缺失而制備。所述的部分可以 以分離的形式加以使用或它們可以與其他編碼性(或非編碼性)序列融合,以便例如產(chǎn)生 組合幾種活性的蛋白質(zhì)。當與其他編碼序列融合時,翻譯時產(chǎn)生的所得多肽可以比對該蛋 白質(zhì)部分所預測的多肽更大。用于本發(fā)明方法中的部分編碼文中定義的PATL或PRP38或ADA2多肽,其與實施 例1的表A中給出的氨基酸序列具有基本相同的生物學活性。用于本發(fā)明方法中的部分包 含下述蛋白質(zhì)結(jié)構域,所述結(jié)構域與表C中定義的保守結(jié)構域中的任一個,按照遞增的優(yōu) 選順序具有 50%、55%、60%、70%、75%、80%、85%、90%、92%、93%、95%、96%、98% 或 更高序列同一性。優(yōu)選地,此部分是在實施例1的表A中給出的任何一種核酸的部分,或?qū)?施例1的表A中給出的氨基酸序列中任一個的直向同源物或旁系同源物的編碼核酸的部 分。此部分的長度優(yōu)選為至少 50、100、150、200、300、400、500、550、600、650、700、750、800、 850、900、950、1000、1200或更多個連續(xù)核苷酸,其中所述的連續(xù)核苷酸是實施例1的表A中 給出的任何一種核酸序列,或是實施例1的表A中給出的氨基酸序列中任一個的直向同源 物或旁系同源物的編碼核酸。優(yōu)選地,此部分編碼下述氨基酸序列的片段,當該氨基酸序列
46用于構建諸如圖3所示的系統(tǒng)樹時,與該樹中的任意序列聚簇,尤其優(yōu)選與包含SEQ ID NO 2的組Ia中的序列聚簇。進一步優(yōu)選地,此部分是核酸SEQ ID NO 76的部分,最優(yōu)選地, 此部分是SEQ ID N0:82所示的部分。優(yōu)選地,此部分編碼下述氨基酸序列的片段,當其用 于構建諸如圖8所示的系統(tǒng)樹時,與包含SEQ ID NO 77的組Ib中的任意序列聚簇。對于GATA樣多肽,用于本發(fā)明方法中的部分編碼文中定義的GATA樣多肽,其與實 施例1的表A中給出的氨基酸序列具有基本相同的生物學活性。優(yōu)選地,此部分是在實施 例1的表A中給出的任何一種核酸的部分,或?qū)嵤├?的表A中給出的氨基酸序列中任一 個的直向同源物或旁系同源物的編碼核酸的部分。此部分的長度優(yōu)選為至少500、550、600、 650、700、750、800、850、900、950、1000、1050個連續(xù)核苷酸,其中所述的連續(xù)核苷酸是實施 例1的表A中給出的任何一種核酸序列,或是實施例1的表A中給出的氨基酸序列中任一個 的直向同源物或旁系同源物的編碼核酸。最優(yōu)選地,此部分是核酸SEQID N0:128的部分。 優(yōu)選地,此部分編碼下述氨基酸序列的片段,當該片段用于構建例如Reyes等,(2004)中圖 11或圖14描述的系統(tǒng)樹時,與Reyes等,(2004)定義的GATA樣多肽“亞家族II”組聚簇, 而不與任何其他組聚簇,該“亞家族II ”組包含SEQ ID NO 129所示的氨基酸序列。用于本發(fā)明方法中的部分編碼文中定義的WDR23樣多肽,其與實施例1的表A中 給出的多肽序列具有基本相同的生物學活性。優(yōu)選地,此部分是在實施例1的表A中給 出的任何一種核酸序列的部分,或?qū)嵤├?的表A中給出的多肽序列中任一個的直向同 源物或旁系同源物的編碼核酸序列的部分。此部分的長度優(yōu)選為至少400、450、500、550、 600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、 1450、1480個或更多個連續(xù)核苷酸,其中所述的連續(xù)核苷酸是實施例1的表A中給出的任何 一種核酸序列,或是實施例1的表A中給出的多肽序列中任一個的直向同源物或旁系同源 物的編碼核酸序列。優(yōu)選地,此部分是編碼下述多肽序列的核酸序列的部分,該多肽包含與 SEQ ID NO :271 所示的保守結(jié)構域(CD)具有至少 65%、70%、75%、80%、85%、90%、95%、 98%、99%或更高氨基酸序列同一性的結(jié)構域。最優(yōu)選地,此部分是核酸序列SEQ IDNO 215 的部分。用于本發(fā)明方法中的另一核酸變體是能夠在降低的嚴格條件下、優(yōu)選在嚴格條件 下與編碼如文中所定義的PATL或PRP38或GATA樣或ADA2或WDR23樣多肽的核酸雜交,或 與如文中所定義的部分雜交的核酸。本發(fā)明提供用于在植物中增強產(chǎn)量相關性狀的方法,其包括在植物中引入并表達 能夠與實施例1的表A中給出的任何一種核酸雜交的核酸,或包括在植物中引入并表達如 此一種核酸,其能夠與實施例1的表A中給出的任意核酸序列的直向同源物、旁系同源物或 同源物的編碼核酸雜交的核酸。用于本發(fā)明方法中的雜交序列編碼文中定義的PATL或PRP38或GATA樣或ADA2 或WDR23樣多肽,其與實施例1的表A中給出的氨基酸序列具有基本相同的生物學活性。 優(yōu)選地,雜交序列能夠與實施例1的表A中給出的任一核酸雜交或與任意這些序列的部分 雜交,其中所述的部分如上文所定義,或者其中雜交序列能夠與實施例1的表A中給出的 任一氨基酸序列的直向同源物或旁系同源物的編碼核酸雜交。最優(yōu)選地,雜交序列能夠與 SEQ ID NO :1所示的核酸或其部分雜交,或與SEQ ID NO :76所示的核酸或其部分雜交,或 與SEQ ID NO :128所示的核酸或其部分雜交,或與SEQ ID NO 181所示的核酸或其部分雜交。關于WDR23樣序列,雜交序列優(yōu)選能夠與編碼下述多肽序列的核酸序列雜交,該多肽包 含與SEQ ID NO :271所示的保守結(jié)構域(CD)具有至少65%、70%、75%、80%、85%、90%、 95%、98%、99%或更高氨基酸序列同一性的結(jié)構域。最優(yōu)選地,雜交序列能夠與SEQ IDNO 215所示的核酸序列或其部分雜交。優(yōu)選地,此雜交序列編碼具有下述氨基酸序列的多肽,當該氨基酸序列為全長并 用于構建諸如圖3所示的系統(tǒng)樹時,與該樹中的任意序列聚簇,尤其優(yōu)選與包含SEQ ID NO 2的組Ia中的序列聚簇,或當其用于構建諸如圖8所示的系統(tǒng)樹時,與包含SEQ ID NO 77 的組Ib中的任意序列聚簇。同樣優(yōu)選地,此雜交序列編碼具有下述氨基酸序列的多肽,當 該氨基酸序列為全長并用于構建例如Reyes等,(2004)中圖11或圖14描述的系統(tǒng)樹時,與 Reyes等,(2004)定義的GATA樣多肽“亞家族II ”組聚簇,而不與任何其他組聚簇,該“亞 家族II”組包含SEQ IDNO 129所示的氨基酸序列。用于本發(fā)明方法中的另一種核酸變體是編碼如上文所定義的PATL或PRP38或 GATA樣或ADA2或WDR23樣多肽的剪接變體,剪接變體如文中所定義。本發(fā)明提供用于在植物中增強產(chǎn)量相關性狀的方法,其包括在植物中引入并表達 實施例1的表A中給出的任何一種核酸序列的剪接變體,或?qū)嵤├?的表A中給出的任意 氨基酸序列的直向同源物、旁系同源物或同源物的編碼核酸的剪接變體。優(yōu)選的剪接變體是SEQ ID NO=I所示的核酸的剪接變體,或編碼SEQ ID NO 2的 直向同源物或旁系同源物的核酸的剪接變體。更優(yōu)選地,剪接變體是SEQ ID NO :1的變體。 優(yōu)選地,當此剪接變體編碼的氨基酸序列用于構建諸如圖3所示的系統(tǒng)樹時,與該樹中的 任意序列聚簇,尤其優(yōu)選與包含SEQ ID NO 2的組Ia中的序列聚簇。其他優(yōu)選的剪接變體是SEQ ID NO :76所示的核酸的剪接變體,或編碼SEQ ID NO 77的直向同源物或旁系同源物的核酸的剪接變體。更優(yōu)選地,剪接變體是SEQ ID N0:76的 變體,剪接變體最優(yōu)選是SEQ IDNO :76所示的剪接變體。優(yōu)選地,當此剪接變體編碼的氨基 酸序列用于構建諸如圖8所示的系統(tǒng)樹時,與包含SEQ ID NO 77的組Ib中的任意序列聚 簇。更優(yōu)選的剪接變體是SEQ ID NO 128所示的核酸的剪接變體,或編碼SEQ ID NO 129的直向同源物或旁系同源物的核酸的剪接變體。優(yōu)選地,當此剪接變體編碼的氨基酸序 列用于構建例如Reyes等,(2004)中圖11或圖14描述的系統(tǒng)樹時,與Reyes等,(2004)定 義的GATA樣多肽“亞家族II ”組聚簇,而不與任何其他組聚簇,該“亞家族II ”組包含SEQ ID NO: 129所示的氨基酸序列。進一步優(yōu)選的剪接變體是SEQ ID NO 181所示的核酸的剪接變體,或編碼SEQ ID NO :182的直向同源物或旁系同源物的核酸的剪接變體。更優(yōu)選地,剪接變體是SEQ ID NO 181的變體。優(yōu)選地,當此剪接變體編碼的氨基酸序列用于構建諸如圖17所示的系統(tǒng)樹時, 與該樹中的任意序列聚簇,尤其優(yōu)選與包含SEQ ID NO :182的組Id中的序列聚簇。人直向同源物WRD23呈現(xiàn)為多個同種型(NCBI登錄號AK057636. 1),因此,也可預 測為編碼WRD23樣多肽的植物核酸序列的剪接變體。對于WDR23樣序列,優(yōu)選的剪接變體是SEQ ID NO :215所示的核酸序列的剪接變 體,或編碼SEQ ID NO :216的直向同源物或旁系同源物的核酸序列的剪接變體。優(yōu)選地,剪 接變體是編碼下述多肽序列的核酸序列的剪接變體,該多肽包含與SEQ ID N0:271所示的
48保守結(jié)構域(CD)具有至少65%、70%、75%、80%、85%、90%、95%、98%、99%或更高氨基 酸同一性的結(jié)構域。用于實施本發(fā)明方法的另一種核酸變體是編碼如上文所定義的PATL或PRP38或 GATA樣或ADA2或WDR23樣多肽的核酸的等位變體,等位變體如文中所定義。本發(fā)明提供用于在植物中增強產(chǎn)量相關性狀的方法,其包括在植物中引入并表達 實施例1的表A中給出的任何一種核酸的等位變體,或包括在植物中引入并表達實施例1 的表A中給出的任意氨基酸序列的直向同源物、旁系同源物或同源物的編碼核酸的等位變 體。用于本發(fā)明方法中的等位變體具有與PATL多肽SEQ ID NO 2和實施例1的表A 中所示的任意氨基酸基本相同的生物學活性。等位變體天然存在,且包含在本發(fā)明方法中 的是這些天然等位基因的用途。優(yōu)選地,等位變體是SEQ ID NO :1的等位變體,或編碼SEQ ID NO :2的直向同源物或旁系同源物的核酸的等位變體。優(yōu)選地,當此等位變體編碼的氨基 酸序列用于構建諸如圖3所示的系統(tǒng)樹時,與該樹中的任意序列聚簇,尤其優(yōu)選與包含SEQ ID NO 2的組Ia中的序列聚簇。用于本發(fā)明方法中的其他等位變體具有與PRP38多肽SEQ IDNO 77和實施例1的 表A中所示的任意氨基酸基本相同的生物學活性。等位變體天然存在,且包含在本發(fā)明方 法中的是這些天然等位基因的用途。優(yōu)選地,等位變體是SEQ ID NO :76的等位變體,或編 碼SEQ IDNO :77的直向同源物或旁系同源物的核酸的等位變體。優(yōu)選地,當此等位變體編 碼的氨基酸序列用于構建諸如圖8所示的系統(tǒng)樹時,與包含SEQ ID NO ,11的組Ib中的任 意序列聚簇。對于GATA樣多肽,用于本發(fā)明方法中的等位變體具有與GATA樣多肽SEQ ID NO 129和實施例1的表A中所示的任意氨基酸基本相同的生物學活性。等位變體天然存在,且 包含在本發(fā)明方法中的是這些天然等位基因的用途。優(yōu)選地,等位變體是SEQ ID NO 128的等位變體,或編碼SEQ IDNO 129的直向同 源物或旁系同源物的核酸的等位變體。優(yōu)選地,當此等位變體編碼的氨基酸序列用于構建 例如Reyes等,(2004)中圖11或圖14描述的系統(tǒng)樹時,與Reyes等,(2004)定義的GATA 樣多肽“亞家族II”組聚簇,而不與任何其他組聚簇,該“亞家族II”組包含SEQ IDNO 129 所示的氨基酸序列。對于ADA2多肽,用于本發(fā)明方法中的等位變體具有與ADA2多肽SEQ ID NO 182 和實施例1的表A中所示的任意氨基酸基本相同的生物學活性。等位變體天然存在,且包 含在本發(fā)明方法中的是這些天然等位基因的用途。優(yōu)選地,等位變體是SEQ ID N0:181的 等位變體,或編碼SEQ ID NO :182的直向同源物或旁系同源物的核酸的等位變體。優(yōu)選地, 當此等位變體編碼的氨基酸序列用于構建諸如圖17所示的系統(tǒng)樹時,與該樹中的任意序 列聚簇,尤其優(yōu)選與包含SEQ ID NO 182的組Id中的序列聚簇。對于WDR23樣多肽,用于本發(fā)明方法中的等位變體具有與WDR23樣多肽SEQ ID NO 216和實施例1的表A中所示的任意多肽基本相同的生物學活性。等位變體天然存在, 且包含在本發(fā)明方法中的是這些天然等位基因的用途。優(yōu)選地,等位變體是SEQ ID N0:215 的等位變體,或編碼SEQ ID NO :216直向同源物或旁系同源物的核酸序列的等位變體。優(yōu) 選地,此等位變體是下述多肽序列的等位變體,該多肽包含與SEQ ID N0:271所示的保守結(jié)構域(CD)具有至少65%、70%、75%、80%、85%、90%、95%、98%、99%或更高氨基酸序列 同一性的結(jié)構域?;蚋慕M或定向進化也可以用來產(chǎn)生編碼如上文定義的PATL或PRP38或GATA樣 或ADA2或WDR23樣多肽的核酸的變體;術語“基因改組”如文中所定義。本發(fā)明提供用于在植物中增強產(chǎn)量相關性狀的方法,其包括在植物中引入并表達 實施例1的表A中給出的任何一種核酸序列的變體,或包括在植物中引入并表達如此核酸 的變體,其中所述的核酸編碼實施例1的表A中給出的任意氨基酸序列的直向同源物、旁系 同源物或同源物,所述變體核酸通過基因改組獲得。優(yōu)選地,通過基因改組獲得的變體核酸編碼的下述氨基酸序列,當其用于構建諸 如圖3所示的系統(tǒng)樹時,與該樹中的任意序列聚簇,尤其優(yōu)選與包含SEQ ID N0:2或SEQ ID NO ,11的組la中的序列聚簇。同樣優(yōu)選地,通過基因改組獲得的變體核酸編碼的下述氨基 酸序列,當其用于構建例如Reyes等,(2004)中圖11或圖14描述的系統(tǒng)樹時,與Reyes等, (2004)定義的GATA樣多肽“亞家族II”組聚簇,而不與任何其他組聚簇,該“亞家族II” 組包含SEQ ID NO: 129所示的氨基酸序列。對于ADA2,優(yōu)選通過基因改組獲得的變體核酸 編碼的下述氨基酸序列,當其用于構建諸如圖17所示的系統(tǒng)樹時,與該樹中的任意序列聚 簇,尤其優(yōu)選與包含SEQ ID NO :182的組Id中的序列聚簇。對于WDR23,通過基因改組獲 得的變體核酸序列編碼的下述多肽序列,其包含與SEQ ID NO :271所示的保守結(jié)構域(⑶) 具有至少65%、70%、75%、80%、85%、90%、95%、98%、99%或更高氨基酸序列同一性的 結(jié)構域。另外,核酸變體也可以通過位點定向誘變獲得。幾種方法可用于實現(xiàn)位點定向誘 變,最常見的是基于 PCR 的方法(Current Protocols inMolecular Biology. Wiley 編)。
編碼PATL或PRP38或GATA樣或ADA2多肽的核酸可以來自任何自然來源或人工來 源。核酸可以從其天然形式就組成和/或基因組環(huán)境方面通過人類有意操作而加以修飾。 編碼PATL或GATA樣多肽的核酸優(yōu)選地來自植物,還優(yōu)選來自單子葉植物,還優(yōu)選來自禾本 科(poaceae),最優(yōu)選地來自稻的核酸。編碼PRP38多肽的核酸優(yōu)選地來自植物,還優(yōu)選來 自雙子葉植物,更優(yōu)選來自十字花科(brasicaceae),該核酸最優(yōu)選來自擬南芥的核酸。編 碼ADA2多肽-encoding核酸優(yōu)選地來自植物,還優(yōu)選來自雙子葉植物,更優(yōu)選來自十字花 科,該核酸最優(yōu)選來自擬南芥的核酸。編碼WDR23樣多肽的核酸序列可以來自任何自然來 源或人工來源。核酸序列可以從其天然形式就組成和/或基因組環(huán)境方面通過人類有意操 作而加以修飾。編碼WDR23樣多肽的核酸序列來自真核生物域(domain),優(yōu)選來自植物界, 進一步優(yōu)選來自雙子葉植物。更優(yōu)選地,編碼WDR23樣多肽的核酸序列來自十字花科,最優(yōu) 選地,編碼WDR23樣多肽的核酸序列來自擬南芥。有利地,本發(fā)明在此提供未知的PATL核酸和多肽序列。本發(fā)明的另一實施方案提供分離的核酸分子,其包含(i)SEQ ID NO 9 ;SEQ ID NO 11 ;SEQ ID NO 13 ;SEQ IDN0 :15 ;SEQ ID NO 17 ; SEQ ID NO 19 ;SEQ ID NO 21 ;SEQID NO 23 ;SEQ ID NO :25和SEQ ID NO :27所示的核酸;(ii)與(i)中給出的任一 SEQ ID NO互補的核酸或其片段;(iii)編碼下述PATL多肽的核酸,所述多肽與SEQ ID NO 10 ;SEQ ID NO 12 ; SEQ ID NO 14 ;SEQ ID NO 16 ;SEQ ID NO 18 ;SEQ ID NO 20 ;SEQ ID NO 22 ;SEQ ID NO 24 ;SEQ ID N0:26和SEQ ID NO :28給出的任一氨基酸序列按照遞增的優(yōu)選順序具有至少 70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高序列同一性;(iv)能夠在嚴格雜交條件下與上述(i)、(ii)或(iii)給出的任一核酸雜交的核酸。本發(fā)明的另一實施方案提供分離的多肽,其包含(i)與 SEQ ID NO 10 ;SEQ ID NO 12 ;SEQ ID NO 14 ;SEQID NO 16 ;SEQ ID NO 18 ;SEQ ID NO 20 ;SEQ ID NO 22 ;SEQID NO 24 ;SEQ ID NO :26和SEQ ID NO :28給出的任 一氨基酸序列按照遞增的優(yōu)選順序具有至少80%、85%、90%、95%、96%、97%、98%、99% 或100%序列同一性的氨基酸序列;(ii) (i)中給出的任意氨基酸序列的衍生物。本發(fā)明方法的實施產(chǎn)生了具有增強的產(chǎn)量相關性狀的植物。特別地,本發(fā)明方法 的實施產(chǎn)生這樣的植物,其相對于對照植物具有提高的產(chǎn)量、尤其提高的種子產(chǎn)量。術語 “產(chǎn)量”和“種子產(chǎn)量”在本文的“定義”部分中更詳細地描述。本文中對增強的產(chǎn)量相關性狀的談及意指植物的一個或多個部分的生物量(重 量)增加,所述的部分可以包括地上(可收獲)部分和/或地下(可收獲)部分。特別地, 此類可收獲部分是種子,并且本發(fā)明方法的實施產(chǎn)生了相對于對照植物的種子產(chǎn)量而言, 具有提高的種子產(chǎn)量的植物。以谷物為例,產(chǎn)量提高可以表現(xiàn)為以下一個或多個指標每平方米已建立的植物 數(shù)目增加、每株植物花序數(shù)的提高、行數(shù)、每行核粒數(shù)、核粒重、千粒重、花序長度/直徑的 提高、種子飽滿率(即飽滿種子數(shù)除以種子總數(shù)并乘以100)提高,及其他。以稻為例,產(chǎn)量 提高可以自身表現(xiàn)為下列一種或多種指標的提高每平方米植物數(shù)、每株植物的花序數(shù)、每 個花序的小穗數(shù)、每個花序的花(小花)數(shù)目(其表述為飽滿種子數(shù)對原發(fā)花序數(shù)的比)、 種子飽滿率(即飽滿種子數(shù)除以種子總數(shù)并乘以100)提高、千粒重提高及其他。本發(fā)明提供相對于對照植物增加產(chǎn)量尤其是植物種子產(chǎn)量的方法,所述方法包括 調(diào)節(jié)編碼如本文定義的PATL或PRP38或GATA樣或ADA2或WDR23樣多肽的核酸在植物中 的表達。由于本發(fā)明的轉(zhuǎn)基因植物具有提高的產(chǎn)量,故這些植物有可能在其生活周期的相 應階段(在其生活周期的至少部分期間)相對于對照植物的生長速率表現(xiàn)出提高的生長速率。提高的生長速率可以是植物的一個或多個部分(包括種子)特有的,或可以基本 上遍及整株植物。具有提高的生長速率的植物可以具備較短的生活周期。植物的生活周期 可以意指從干燥成熟種子生長直至植物已經(jīng)產(chǎn)生與起始材料相似的干燥成熟種子的階段 所需要的時間。這個生活周期可以受諸因素如早期生長勢、生長速率、綠度指數(shù)、開花時間 和種子成熟速度影響。生長速率的提高可以在植物生活周期的一個或多個階段上或基本上 在植物整個生活周期期間發(fā)生。在植物生活周期中早期期間提高的生長速率可以反映增強 的生長勢。生長速率的提高可以改變植物的收獲周期,從而允許植物更晚地播種和/或更 早地收獲,而這本來是不可能的(可以隨更早的開花時間獲得相似效果)。如果大幅提高 生長速率,則可以允許進一步播種相同植物物種的種子(例如播種并收獲稻植物,隨后播 種并收獲其他稻植物,全部稻植物均處于一個常規(guī)生長時期中)。類似地,如果大幅提高生長速率,則可以允許進一步播種不同植物物種的種子(例如播種并收獲谷物植物,隨后例 如播種并任選收獲大豆、馬鈴薯或任何其他合適的植物)。在一些作物植物的例子中,來自 相同根狀莖的額外收獲次數(shù)也可以是可能的。改變植物的收獲周期可以導致每平方米一年 生物量生產(chǎn)提高(原因在于可以培育并收獲任何具體植物的次數(shù)(即在一年中)提高)。 生長速率的提高也可以允許將轉(zhuǎn)基因植物在比其野生型對應物更廣泛的地理區(qū)域內(nèi)培育, 因為培育作物的地域限制往往由栽種時期(早季)或在收獲時期(晚季)的不利環(huán)境條件 決定。如果縮短收獲周期,則可以避開這類不利條件。生長速率可以通過從生長曲線衍生 多個參數(shù)而確定,此類參數(shù)可以是T_Mid(植物達到50%最大植物大小所花費的時間)和 Τ_90(植物達到90%最大植物大小所花費的時間),以及其他。根據(jù)本發(fā)明的一個優(yōu)選特征,本發(fā)明方法的實施產(chǎn)生了相對于對照植物具有提高 的生長速率的植物。因此,根據(jù)本發(fā)明,提供了用于提高植物生長速率的方法,所述方法包 括在植物中調(diào)節(jié)編碼如本文中定義的PATL或PRP38或GATA樣或ADA2或WDR23樣多肽的 核酸表達。在包括植物日常所暴露的脅迫的典型農(nóng)業(yè)生長條件下,出現(xiàn)產(chǎn)量和/或生長速率 的提高。植物一般通過生長得更慢而應答于脅迫暴露。在嚴重脅迫條件下,植物甚至可能 完全停止生長。另一方面,輕度或日常脅迫為植物所暴露的任何下述脅迫,其中所述的脅迫 不導致植物完全停止生長,但同時不能恢復生長。與非脅迫條件下的對照植物相比較,輕 度脅迫在本發(fā)明的意義下導致受脅迫植物的生長降低小于40%、35%或30%、優(yōu)選地小于 25%、20%或15%、更優(yōu)選地小于14%、13%、12%、11%或10%或更低。由于農(nóng)業(yè)實踐(灌 溉、施肥、殺蟲劑處理)的進步,栽培作物植物中并不經(jīng)常遭遇嚴重脅迫。在典型農(nóng)業(yè)條件 下培育的植物可能經(jīng)常遇到輕度脅迫。因此,由輕度脅迫誘導的受損生長對于農(nóng)業(yè)往往是 不受歡迎的特征。輕度脅迫是植物所暴露的常見生物脅迫和/或非生物(環(huán)境)脅迫。非 生物脅迫可以因干旱或過量的水、缺氧脅迫、鹽脅迫、化學毒性、氧化脅迫和熱、寒冷或冰凍 溫度所致。非生物脅迫可以是因水脅迫(尤其因為干旱)、鹽脅迫、氧化脅迫或離子脅迫引 起的滲透脅迫。對于GATA樣,與對照植物相比,無論植物處于非脅迫條件下還是植物暴露于多種 脅迫下,都發(fā)生產(chǎn)量和/或生長速率的增加。對于WDR23,與相當條件下生長的對照植物相 比,無論植物處于非脅迫條件下還是植物暴露于多種脅迫下,都發(fā)生產(chǎn)量相關性狀的增強。 植物一般通過生長得更慢而對暴露于脅迫作出應答。在嚴重脅迫條件下,植物甚至可以完 全停止生長。另一方面,輕微脅迫在本文中定義為植物對其暴露的任何脅迫,其中所述的脅 迫未導致植物完全停止生長而沒有恢復生長的能力。與非脅迫條件下的對照植物相比,輕 微脅迫在本發(fā)明意義中導致受脅迫植物生長降低小于40%、35%或30%,優(yōu)選小于25%、 20%或15%,更優(yōu)選小于14%、13%、12%、11%或10%或更低。由于農(nóng)業(yè)實踐(灌溉、施 肥、殺蟲劑處理)上的進步,在栽培作物植物中并不經(jīng)常遇到嚴重脅迫。因此,由輕微脅迫 誘導的受損生長往往是農(nóng)業(yè)上不希望的特征。輕微脅迫是植物暴露的常見生物性和/或非 生物性(環(huán)境)脅迫。非生物脅迫可以因干旱或水澇、厭氧脅迫、鹽脅迫、化學毒性、氧化脅 迫和熱、寒冷或冰凍溫度所致。生物脅迫一般是由病原體如細菌、病毒、真菌、線蟲和昆蟲引 起的那些脅迫。如本文中所用的術語”非脅迫”條件是允許植物最佳生長的環(huán)境條件。本 領域技術人員清楚對于給定地點的正常土壤條件和氣候條件。
52
特別地,本發(fā)明的方法可以在非脅迫條件下或在輕度干旱條件開展以產(chǎn)生相對于 對照植物具有提高的產(chǎn)量的植物。如Wang等(Planta (2003) 218 1-14)中報道,非生物性 脅迫導致一系列不利地影響植物生長及生產(chǎn)力的形態(tài)學、生理學、生物化學和分子變化。干 旱、鹽度、極端溫度和氧化脅迫已知相互聯(lián)系并可以通過相似的機制誘導生長損害及細胞 損害。Rabbani等(Plant Physiol (2003) 133 1755-1767)描述了干旱脅迫與高鹽度脅迫之 間極高程度的“交互作用”。例如,干旱和/或鹽化作用主要表現(xiàn)為滲透脅迫,從而導致細胞 內(nèi)穩(wěn)態(tài)和離子分布的破壞。經(jīng)常伴隨高溫或低溫、鹽度或干旱脅迫的氧化脅迫可以引起功 能蛋白和結(jié)構蛋白變性。因此,這些多樣的環(huán)境脅迫常常激活相似的細胞信號傳導途徑和 細胞應答,如產(chǎn)生脅迫蛋白、上調(diào)抗氧化物質(zhì)、積累兼容性溶質(zhì)和生長停滯。術語“非脅迫” 條件是允許植物最佳生長的那些環(huán)境條件。本領域技術人員清楚對于給定地點的正常土壤 條件和氣候條件。如本文中所用的術語非脅迫條件包括植物所暴露的偶爾的或平常的輕度 脅迫,如本文定義的,但不包括重度脅迫。相對于可比較條件下培育的對照植物,本發(fā)明方法的實施賦予在非脅迫條件下或 在輕度干旱條件下培育的植物提高的產(chǎn)量。因此,根據(jù)本發(fā)明,提供了用于在非脅迫條件 下或在輕度干旱條件下培育的植物中提高產(chǎn)量的方法,所述方法包括增加植物中編碼PATL 或PRP38或GATA樣或ADA2或WDR23樣多肽的核酸表達。相對于可比較條件下培育的對照植物,本發(fā)明方法的實施賦予在養(yǎng)分缺乏條件 下、尤其在缺氮條件下培育的植物提高的產(chǎn)量。因此,根據(jù)本發(fā)明,提供了用于在養(yǎng)分缺乏 條件下培育的植物中提高產(chǎn)量的方法,所述方法包括調(diào)節(jié)植物中編碼PATL或PRP38或GATA 樣或ADA2或WDR23樣多肽的核酸表達。養(yǎng)分缺乏可以因養(yǎng)分如氮、磷酸鹽和其他含磷化合 物、鉀、鈣、鎘、鎂、錳、鐵和硼及其他元素缺少所致。就WDR23而言,優(yōu)選降低的養(yǎng)分可獲得 性是降低的氮可獲得性。本發(fā)明包括通過本發(fā)明方法可獲得的植物或其部分(包括種子)。所述植物或其 部分包含編碼如上文定義的PATL或PRP38或GATA樣或ADA2或WDR23樣多肽的核酸轉(zhuǎn)基 因。本發(fā)明也提供了基因構建體和載體以促進在植物中導入和/或表達編碼PATL或 PRP38或GATA樣或ADA2或WDR23樣多肽的核酸。所述基因構建體可以插入適于轉(zhuǎn)化至植 物并適于在轉(zhuǎn)化細胞中表達目的基因的載體,所述載體可以是市售的。本發(fā)明也提供了如 本文中定義的基因構建體在本發(fā)明方法中的用途。更具體地,本發(fā)明提供了構建體,其包含(a)編碼如上定義的PATL或PRP38或GATA樣或ADA2或WDR23樣多肽的核酸;(b)能夠驅(qū)動(a)的核酸序列表達的一個或多個調(diào)控序列;和任選地(c)轉(zhuǎn)錄終止序列。優(yōu)選地,編碼PATL或PRP38或GATA樣或ADA2或WDR23樣多肽的核酸如上文定義。 術語“調(diào)控序列”和“終止序列”如本文中定義。對于WDR23,優(yōu)選一種構建體調(diào)控序列是分離自植物基因組的組成型啟動子。物組 成型啟動子的實例是G0S2啟動子,更優(yōu)選地是稻G0S2啟動子,最優(yōu)選地是SEQ ID NO ,212 所示的G0S2啟動子?;蛘撸环N構建體調(diào)控序列是分離自植物基因組的分生組織特異性啟 動子。植物分生組織特異性啟動子的實例是金屬硫蛋白(MT)啟動子,更優(yōu)選地是稻MT啟動子,最優(yōu)選是SEQ ID NO :273所示的MT啟動子。植物用包含上述任意核酸的載體轉(zhuǎn)化。技術人員非常了解必須存在于所述載體上 以便成功轉(zhuǎn)化、選擇和增殖含有目的序列的宿主細胞的遺傳元件。此目的序列有效地與一 個或多個調(diào)控序列(至少與啟動子)連接。有利地,任意類型的啟動子,無論是天然的或合成的,可以用來提高所述核酸序列 的表達。組成型啟動子是在所述方法中特別有用的。優(yōu)選地,所述組成型啟動子也是遍在 啟動子。對于GATA樣多肽,啟動子具有中等強度。對于多種啟動子類型的定義,見本文中 的“定義”部分。應當明白本發(fā)明的應用不限于SEQ ID NO :1所示的編碼PATL多肽的核酸,本發(fā)明 的應用也不限于編碼PATL多肽的核酸在受組成型啟動子驅(qū)動時或在受綠色-組織啟動子 驅(qū)動時的表達。更應當明白本發(fā)明的應用不限于SEQ ID NO :76所示的編碼PRP38多肽的核酸,本 發(fā)明的應用也不限于編碼PRP38多肽的核酸在受組成型啟動子驅(qū)動時或在根特異性啟動 子驅(qū)動時的表達。還應當明白本發(fā)明的應用不限于SEQ ID NO :128所示的編碼GATA樣多肽的核酸, 本發(fā)明的應用也不限于編碼GATA樣多肽的核酸在受組成型啟動子驅(qū)動時的表達。還應當明白本發(fā)明的應用不限于SEQ ID NO 181所示的編碼ADA2多肽的核酸,本 發(fā)明的應用也不限于編碼ADA2多肽的核酸在受組成型啟動子驅(qū)動時或在受綠色-組織啟 動子驅(qū)動時的表達。還應當明白本發(fā)明的應用不限于SEQ ID NO :215所示的編碼WDR23樣多肽的核酸 序列,本發(fā)明的應用也不限于編碼WDR23樣多肽的核酸序列在受組成型或分生組織特異性 啟動子驅(qū)動時的表達。組成型啟動子優(yōu)選為HMG (高遷移組)啟動子,也稱為HMGP啟動子,優(yōu)選來自稻的 HMG啟動子。進一步優(yōu)選地,該組成型啟動子由基本上與SEQ ID NO :33相似的核酸序列代 表,最優(yōu)選該組成型啟動子SEQ ID N0:33所代表。綠色組織特異性啟動子優(yōu)選EXP9 (擴展 蛋白),也稱為EXP,也稱為HMGP啟動子,優(yōu)選來自稻的EXP啟動子。進一步優(yōu)選地,該綠色 組織特異性由基本上與SEQ ID NO :34相似的核酸序列代表,最優(yōu)選該組成型啟動子SEQ ID NO 34所代表。HMG和EXP啟動子的描述和對于組成型和綠色組織特異性啟動子的其他例 子,見本文“定義”部分中的表2。對于PRP38,組成型啟動子優(yōu)選地是G0S2啟動子,優(yōu)選來自稻的G0S2啟動子。進 一步優(yōu)選地,該組成型啟動子由基本上與SEQ IDNO 127相似的核酸序列代表,最優(yōu)選該組 成型啟動子SEQ ID N0:127所代表。對于組成型啟動子的其他例子,見本文“定義”部分中 的表ii。對于GATA樣多肽,組成型啟動子優(yōu)選地是G0S2啟動子,優(yōu)選地是來自稻的G0S2 啟動子。進一步優(yōu)選地,該組成型啟動子由基本上與SEQ ID NO: 135相似的核酸序列代表, 最優(yōu)選地該組成型啟動子SEQ ID N0:135所代表。任選地,一個或多個終止子序列可用于 被引入植物中的構建體。優(yōu)選地,該構建體包括與SEQ ID NO 136基本相似或相同的表達 盒,包括G0S2啟動子和編碼GATA樣多肽SEQ ID NO129的核酸。對于ADA2多肽,組成型啟動子優(yōu)選為HMG(高遷移組)啟動子,也稱為HMGP啟動子,優(yōu)選來自稻的HMG啟動子。進一步優(yōu)選地,該組成型啟動子由基本上與SEQ ID NO 213 相似的核酸序列代表,最優(yōu)選地該組成型啟動子SEQ ID N0:213所代表。綠色組織特異性 啟動子優(yōu)選EXP9 (擴展蛋白),也稱為EXP,也稱為HMGP啟動子,優(yōu)選來自稻的EXP啟動子。 進一步優(yōu)選地,該綠色組織特異性由基本上與SEQ ID NO :214相似的核酸序列代表,最優(yōu)選 地該組成型啟動子SEQID NO 214所代表。HMG和EXP啟動子的描述和對于組成型和綠色 組織特異性啟動子的其他例子,見本文“定義”部分中的表iii。其他調(diào)節(jié)元件可以包括轉(zhuǎn)錄增強子以及翻譯增強子。本領域技術人員將知道可能 適用于實施本發(fā)明的終止子和增強子序列。如定義部分中描述,內(nèi)含子序列也可以添加至 5’非翻譯區(qū)(UTR)或編碼序列中,以提高細胞質(zhì)中積累的成熟信使的量。(除啟動子、增強 子、沉默子、內(nèi)含子序列、3’ UTR和/或5’ UTR區(qū)域之外的)其他調(diào)控序列可以是蛋白質(zhì)/ 或RNA穩(wěn)定化元件。此類序列將是已知的或可以由本領域技術人員輕易地獲得。本發(fā)明的基因構建體可以還包括對于特定細胞類型中維持和/或復制所需要的 復制起點序列。一個例子是當需要基因構建體作為游離型遺傳元件(例如質(zhì)?;蛘沉7?子)在細菌細胞中維持時的復制起點。優(yōu)選的復制起點包括但不限于fl-ori和colEl。為檢測如用于本發(fā)明方法中的核酸序列的成功轉(zhuǎn)移和/或選擇包含這些核酸的 轉(zhuǎn)基因植物,使用標記基因(或報道基因)是有利的。因此,所述基因構建體可以任選地包 含選擇性標記基因。選擇性標記在本文的“定義”部分中更詳細地描述。一旦不再需要所 述標記基因時,可以從轉(zhuǎn)基因細胞中移除或切除它們。用于標記移除的技術是本領域已知 的,有用的技術在上文定義部分中描述。本發(fā)明也提供了用于產(chǎn)生轉(zhuǎn)基因植物的方法,所述轉(zhuǎn)基因植物相對于對照植物具 有增強的產(chǎn)量相關性狀,其中所述方法包括在植物中引入并表達編碼如上文所定義的PATL 或PRP38或GATA樣或ADA2或WDR23樣多肽的任意核酸。更具體地,本發(fā)明提供了用于產(chǎn)生轉(zhuǎn)基因植物的方法,所述轉(zhuǎn)基因植物具有增加 的增強產(chǎn)量相關性狀、尤其提高的種子產(chǎn)量,其中所述方法包括(i)在植物或植物細胞中引入并表達編碼PATL或PRP38或ADA2多肽的核酸;和(ii)在促進植物生長和發(fā)育的條件下培育植物細胞;和任選地(iii)選擇具有增強的產(chǎn)量相關性狀的植物。對于GATA樣多肽,本發(fā)明提供了用于產(chǎn)生轉(zhuǎn)基因植物的方法,所述轉(zhuǎn)基因植物具 有增加的增強產(chǎn)量相關性狀、尤其提高的TKW,其中所述方法包括(i)在植物或植物細胞中引入并表達編碼GATA樣或WDR23樣多肽的核酸;和(ii)在促進植物生長和發(fā)育的條件下培育植物細胞。(i)的核酸可以能夠編碼如本文中所定義的PATL或PRP38或GATA樣或ADA2或 WDR23樣多肽的任意核酸。該核酸可以直接地導入植物細胞或?qū)胫参镒陨?包括導入組織、器官或植物的 任何其他部分)。根據(jù)本發(fā)明的優(yōu)選特征,該核酸優(yōu)選地通過轉(zhuǎn)化作用導入植物。術語“轉(zhuǎn) 化”在本文的“定義”部分中更詳細地描述。基因修飾的植物細胞可以借助技術人員熟悉的全部方法再生。合適的方法可見于 上文提及的 S. D. Kung 和 R. ffu, Potrykus 或HUifgen和 Willmitzer 的出版物。通常在轉(zhuǎn)化后,對植物細胞或細胞群體選擇一個或多個標記的存在性,其中所述標記由隨同目的基因一起共轉(zhuǎn)移的植物可表達基因編碼,隨后將轉(zhuǎn)化材料再生成完整植 物。為了選擇轉(zhuǎn)化的植物,一般使轉(zhuǎn)化中獲得的植物材料經(jīng)歷選擇條件,從而轉(zhuǎn)化植物可以 與非轉(zhuǎn)化植物區(qū)分開。例如,以上述方式獲得的種子可以播種,并且在初始培育時間后,通 過噴灑接受合適的選擇。另一種可能性在于種子根據(jù)需要消毒后,在使用合適選擇劑的瓊 脂板上培育,從而僅轉(zhuǎn)化的種子可以長成植物。備選地,篩選所述轉(zhuǎn)化植物的選擇性標記 (如上文所述的選擇性標記)的存在性。在DNA轉(zhuǎn)移和再生后,推定轉(zhuǎn)化的植物也可以例如使用DNA印跡分析對目的基因 的存在性、拷貝數(shù)和/或基因組構造進行評價。備選地或額外地,新導入的DNA的表達水平 可以使用RNA印跡分析和/或蛋白質(zhì)印跡分析監(jiān)測,這兩項技術均是本領域普通技術人員 熟知的。產(chǎn)生的轉(zhuǎn)化植物可以通過多種方法繁殖,如通過克隆繁殖法或經(jīng)典育種技術。例 如,第一世代(或T1)轉(zhuǎn)化植物可以進行自交并且選擇純合的第二世代(或T2)轉(zhuǎn)化體,并 且1~2植物隨后可以通過經(jīng)典育種技術進一步繁殖。產(chǎn)生的轉(zhuǎn)化生物可以采取多種形式。例 如,它們可以是轉(zhuǎn)化細胞和非轉(zhuǎn)化細胞的嵌合體;克隆性轉(zhuǎn)化體(例如,被轉(zhuǎn)化以含有表達 盒的全部細胞);轉(zhuǎn)化組織和非轉(zhuǎn)化組織的移植體(例如在植物中,與未轉(zhuǎn)化接穗嫁接的轉(zhuǎn) 化根狀莖)。本發(fā)明明確地擴展至由本文中所述的任意方法產(chǎn)生的任意植物細胞或植物,并擴 展至全部植物部分及其繁殖體。本發(fā)明進一步擴展以包括已經(jīng)由前述任意方法產(chǎn)生的原代 轉(zhuǎn)化或轉(zhuǎn)染細胞、組織、器官或完整植物的子代,唯一要求是子代表現(xiàn)與如本發(fā)明方法中的 親本相同的基因型和/或表型特征。本發(fā)明也包括宿主細胞,其包含編碼如上文所定義PATL或PRP38或GATA樣或 ADA2或WDR23樣多肽的分離的核酸。本發(fā)明的優(yōu)選宿主細胞是植物細胞。對于本發(fā)明方法 中所用核酸或載體、表達盒或構建體或載體的宿主植物原則上有利地是能夠合成在本發(fā)明 方法中所使用的多肽的全部植物。本發(fā)明的方法有利地適用于任意植物。特別在本發(fā)明方法中有用的植物包括屬于 植物界超家族、尤其屬于單子葉和雙子葉植物的全部植物,包括飼用或飼料豆科植物、觀賞 植物、糧食作物、樹或灌木。根據(jù)本發(fā)明的一個優(yōu)選實施方案,所述植物是作物植物。作物 植物的例子包括大豆、向日葵、卡諾拉油菜、苜蓿、油菜籽、棉花、番茄、馬鈴薯和煙草。更優(yōu) 選地,所述植物是單子葉植物。單子葉植物的例子包括甘蔗。更優(yōu)選地,所述植物是禾谷植 物。禾谷植物的例子包括稻、玉米、小麥、大麥、稷、黑麥、小黑麥屬、高粱和燕麥。本發(fā)明也擴展至植物的可收獲部分,例如但不限于種子、葉、果實、花、莖、根、根狀 莖、塊莖和球莖,或也擴展至編碼與植物組成型啟動子有效鏈接的WDR23樣(如上文定義) 的分離核酸序列。本發(fā)明進一步涉及衍生自、優(yōu)選直接衍生自此種植物的可收獲部分的產(chǎn) 品,如干燥顆粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白質(zhì)。根據(jù)本發(fā)明的優(yōu)選特征,受調(diào)節(jié)的表達是提高的表達。用于增加核酸或基因或基 因產(chǎn)物表達的方法是本領域中充分報道的并且在定義部分中提供了例子。如上所述,用于調(diào)節(jié)編碼PATL或PRP38或GATA樣或ADA2或WDR23樣多肽的核酸 的優(yōu)選方法是在植物中引入并表達編碼PATL或PRP38或GATA樣或ADA2或WDR23樣多肽 的核酸;然而,也可以使用包括但不限于T-DNA活化標簽法、TILLING、同源重組在內(nèi)的其他
56熟知技術實現(xiàn)實施本方法的效果,即增強產(chǎn)量相關性狀。在定義部分中提供了這些技術的 描述。本發(fā)明也包括編碼如文中所述PATL或PRP38或GATA樣或ADA2或WDR23樣多肽 的核酸的用途,和這些PATL或PRP38或GATA樣或ADA2或WDR23樣多肽在正常生長條件 下、在非生物脅迫生長條件(優(yōu)選地在滲透脅迫生長條件)下和在養(yǎng)分可利用性降低的條 件下、優(yōu)選在氮可利用性降低的生長條件下增強植物中任一前述產(chǎn)量相關性狀的用途。編碼本文中所述PATL或PRP38或GATA樣或ADA2或WDR23樣多肽的核酸,或PATL 或PRP38或GATA樣或ADA2或WDR23樣多肽自身可以用于其中鑒定到DNA標記的育種程序 中,其中所述的DNA標記可以遺傳地與PATL或PRP38或GATA樣或ADA2或WDR23樣編碼多 肽的基因連鎖。所述核酸/基因或PATL或PRP38或GATA樣或ADA2或WDR23樣多肽自身 可以用來定義分子標記。這種DNA或蛋白質(zhì)標記隨后可以在育種程序中用來在本發(fā)明的方 法中選擇具有增強的如上文所定義產(chǎn)量相關性狀的植物。編碼PATL或PRP38或GATA樣或ADA2或WDR23樣多肽的核酸/基因的等位變體 也可以用于標記輔助的育種程序中。此類育種程序有時需要使用例如EMS誘變法通過對 植物進行誘變處理而導入等位變異;備選地,所述程序可以從收集并非故意造成的所謂“自 然”源性等位變體開始。隨后進行等位變體的鑒定,例如通過PCR法。此后是步驟選擇所 討論的和導致產(chǎn)量提高的序列的優(yōu)異等位變體。一般通過監(jiān)測含有所討論序列的不同等位 變體的植物的生長性能實施選擇??梢栽跍厥抑谢蛟谔镩g監(jiān)測生長性能。其他任選步驟包 括將其中鑒定到優(yōu)異等位變體的植物與另一種植物雜交。這可能用來例如產(chǎn)生感興趣的表 型特征的組合。編碼PATL或PRP38或GATA樣或ADA2或WDR23樣多肽的核酸也可以作為探針用 于遺傳地或物理地繪制所述探針構成其一部分的基因并且用作與這些基因連鎖的性狀的 標記。此類信息可以用于植物育種中,以開發(fā)具有所希望表型的品系。編碼PATL或PRP38 或GATA樣或ADA2或WDR23樣多肽的核酸的這種用途僅需要具有至少15個核苷酸長度的 核酸序列。編碼PATL或PRP38或GATA樣或ADA2或WDR23樣多肽的核酸可以用作限制性 片段長度多態(tài)性(RFLP)標記。限制性消化的植物基因組DNA的DNA印跡物(Sambrook J, Fritsch EF 禾口 Maniatis T (1989)Molecular Cloning, A Laboratory Manual)可以用編碼 PATL或PRP38或GATA樣或ADA2或WDR23樣多肽的核酸探測。所得的結(jié)合圖式隨后可以 使用計算機程序如MapMaker (Lander等,(1987)Genomics 1:174-181)開展遺傳分析以構 建遺傳圖。此外,所述核酸可以用來探測含有一組個體的限制性核酸內(nèi)切酶處理的基因組 DNA的DNA印跡物,其中所述的一組個體代表具有定義的遺傳雜交的親本和子代。DNA多態(tài) 性的分離是明顯的并用來計算編碼PATL或PRP38或GATA樣或ADA2或WDR23樣多肽的核 酸在先前使用這個群體獲得的遺傳圖中的位置(Botstein等,(1980)Am. J. Hum. Genet. 32 314-331)。在Bernatzky和 Tanksley (1986) Plant Mol. Biol. Reporter 4 :37_41 中描述了植 物基因來源的探針的產(chǎn)生及其在遺傳作圖中的用途。許多出版物描述了使用上文概述的方 法學或其變例對特定cDNA克隆的遺傳作圖。例如,F(xiàn)2互交群、回交群、隨機交配群、鄰近純 合系和其他個體群體可以用于作圖。此類方法學是本領域技術人員熟知的。所述核酸探針也可以用于物理作圖(即序列在物理圖上的排列;見Hoheisel等在Non-mammalian Genomic Analyasis :A Practical Guide, Academic press 1996,第 319-346頁及其中引用的參考文獻)。在另一個實施方案中,所述核酸探針可以在直接熒光原位雜交(FISH)作圖法 (Trask(1991)Trends Genet. 7 149-154)中使用。盡管當前的FISH作圖法支持使用大的 克隆(幾個kb至幾百個kb ;見Laan等,(1995) Genome Res. 5 13-20),然而靈敏度的改善 可以允許使用更短探針進行FISH作圖。用于遺傳作圖及物理作圖的多種基于核酸擴增的方法可以使用所述核酸而實施。 方法例子包括等位基因特異性擴增法(Kazazian (1989) J. Lab. Clin. Med 11 :95_96)、PCR 擴增片段的多態(tài)性(CAPS ;Sheffield等,(1993) Genomics 16 :325_332)、等位基因特異性 連接(Landegren 等,(1988) Science 241 :1077_1080)、核苷酸延伸反應(Sokolov (1990) NucleicAcid Res. 18 :3671)、放射雜交作圖(Walter 等,(1997)Nat. Genet. 7 22~28)和 Happy 作圖法(Dear 和 Cook(1989)Nucleic Acid Res. 17 :6795_6807)。對于這些方法,使 用一種核酸序列的序列來設計并產(chǎn)生在擴增反應或在引物延伸反應中使用的引物對。此類 引物的設計是本領域技術人員熟知的。在使用基于PCR遺傳作圖的方法中,可能需要在對 應于當前核酸序列的區(qū)域中鑒定作圖交叉的親本之間的DNA序列差異。然而,這對作圖法 而言通常不是必需的。如前文所述,本發(fā)明方法產(chǎn)生了具有增強的產(chǎn)量相關性狀的植物。這些性狀也可 以與經(jīng)濟上有利的其他性狀組合,如其他的產(chǎn)量增強性狀、其他非生物脅迫和生物脅迫耐 受性、調(diào)節(jié)多種構造性特征和/或生物化學特征和/或生理學特征的性狀。在一個實施方案中,本發(fā)明涉及如下概括的主題項IA用于相對于對照植物增強植物中產(chǎn)量相關性狀的方法,其包括調(diào)節(jié)植物中 編碼PATELLIN多肽的核酸的表達和可選地選擇具有增強的產(chǎn)量相關性狀的植物。項2A根據(jù)項IA的方法,其中所述PATELLIN多肽包含至少一個如下結(jié)構域(i)SEQ ID NO :71 所示的 SEC14 結(jié)構域Ipeldsvvfyrgadreghpvcynvygefqdkdlye kafgdeekrerfIkwriqllergilsqldfspsgicsmvqvtdlknsppmlgkhravtrqavallqdnypefiakkv finvpwwylaankmmspf ltqrtkskf ifaspaksaetlfryiapeqvpvqfgglfk, SEQ ID NO -Jl PJf 示的結(jié)構域或出現(xiàn)在表A中的任意多肽中的任意SEC14結(jié)構域以增加的優(yōu)選順序具有至少 50%、55%、60%、65%、70%、75%、80%、82%、85%、90%、92%、95%、97% 或更多的序列 同一性的結(jié)構域;(ii)SEQ ID NO :72 所示的 GOLD 結(jié)構域sdavteltikpssketveipvtenstigwelrvl gwevsygaeftpdaeggytvivqktrkvpaneepimkgsfkvgepgkivltinnpaskkkkllyrskv,或與 SEQ ID NO 72所示的結(jié)構域或出現(xiàn)在表A中的任意多肽中的任意GOLD結(jié)構域以增加的優(yōu)選順 序具有至少 50%、55%、60%、65%、70%、75%、80%、82%、85%、90%、92%、95%、97%或 更多的序列同一性的結(jié)構域。項3A根據(jù)項IA或2A的方法,其中所述受調(diào)節(jié)的表達通過在植物中引入和表達 編碼PATELLIN多肽的核酸實現(xiàn)。項4A根據(jù)任意前述項的方法,其中所述編碼PATELLIN多肽的核酸編碼表A中所 列任一種蛋白質(zhì)或是這種核酸的一部分或能與這種核酸雜交的核酸。項5A根據(jù)任意前述項的方法,其中所述核酸序列編碼表A中所列任意蛋白質(zhì)的直向同源物或旁系同源物。項6A根據(jù)任意前述項的方法,其中所述增強的產(chǎn)量相關性狀包括相對于對照植 物提高的產(chǎn)量,優(yōu)選種子產(chǎn)量。項7A根據(jù)項IA至6A中任一項的方法,其中所述增強的產(chǎn)量相關性狀在缺氮條 件下獲得。項8A根據(jù)項3A至7A中任一項的方法,其中所述核酸有效鏈接至組成型啟動子, 優(yōu)選至G0S2啟動子,最優(yōu)選至來自稻的G0S2啟動子。項9A 根據(jù)任意前述項的方法,其中所述編碼PATELLIN多肽的核酸具有植物起 源,優(yōu)選來自雙子葉植物,進一步優(yōu)選來自禾本科(Poaceae),更優(yōu)選來自稻屬(Oryza),最 優(yōu)選來自稻。項IOA由根據(jù)任一前述項的方法可獲得的植物或其部分,包括種子,其中所述的 植物或其部分包含編碼PATELLIN多肽的重組核酸。項IlA分離的核酸分子,其包含以下特征(i)SEQ ID NO 9 ;SEQ ID NO 11 ;SEQ ID NO 13 ;SEQ ID NO 15 ;SEQ ID NO 17 ; SEQ ID NO 19 ;SEQ ID NO 21 ;SEQ ID NO 23 ;SEQ ID NO 25 和 SEQ ID NO 27 所示的核 酸;(ii)與⑴中給出的任一 SEQ ID NO互補的核酸片段;(iii)編碼 PATELLIN 多肽的核酸,其與 SEQ ID NO 10 ;SEQ IDNO 12 ;SEQ ID NO 14 ;SEQ ID NO 16 ;SEQ ID NO 18 ;SEQ ID NO 20 ;SEQ ID NO 22 ;SEQ ID NO 24 ;SEQ ID NO 26和SEQ ID NO 28中給出的任一氨基酸序列以增加的優(yōu)選順序具有至少70%、75%、 80%,85%,90%,95%,96%,97%,98%,99%^; 100%的序列同一性;(iv)在嚴格條件下能與上面(i)、(ii)或(iii)給出的任一核酸雜交的核酸。項12A分離多肽,其包括(I)氨基酸序列,其與 SEQ ID NO: 10、SEQ ID NO: 12、SEQ ID NO: 14、SEQ ID NO: 16,SEQ ID NO :18、SEQ ID NO 20,SEQ ID NO 22,SEQ ID NO 24 ;SEQ ID NO 26 和 SEQ ID NO 28中給出的任一氨基酸序列以增加的優(yōu)選順序具有至少80%、85%、90%、95%、96%、 97%、98%、99%或100%的序列同一性;(ii) (i)中給出的任意氨基酸序列的衍生物。項13A構建體,其包括(I)編碼如項1A、2A或12A定義的PATELLIN多肽的核酸或根據(jù)項11的核酸;(ii)能驅(qū)動(a)的核酸序列表達的一個或多個調(diào)控序列;和任選地(iii)轉(zhuǎn)錄終止序列。項14A根據(jù)項13A的構建體,其中所述調(diào)控序列之一是組成型啟動子,優(yōu)選G0S2 啟動子,最優(yōu)選來自稻的G0S2啟動子。項15A根據(jù)項13A或14A的構建體在用于產(chǎn)生植物的方法中的用途,所述植物相 對于對照植物具有提高的產(chǎn)量,特別是提高的生物量和/或提高的種子產(chǎn)量。項16A用根據(jù)項13A或14A的構建體轉(zhuǎn)化的植物、植物部分或植物細胞。項17A 用于產(chǎn)生轉(zhuǎn)基因植物的方法,所述的轉(zhuǎn)基因植物相對于對照植物具有提 高的產(chǎn)量、優(yōu)選提高的種子產(chǎn)量,該方法包括
(i)在植物中引入并表達編碼如項項1A,2A或12A中定義的PATELLIN多肽的核酸 或根據(jù)項IlA的核酸;和(ii)在促進植物生長和發(fā)育的條件下培育植物細胞;和任選地(iii)選擇具有增強的產(chǎn)量相關性狀的植物。項18A轉(zhuǎn)基因植物,其因編碼如項項IA或2A中所定義PATELLIN多肽的核酸的 受調(diào)節(jié)的表達而相對于對照植物具有提高的產(chǎn)量、特別是提高的種子產(chǎn)量,或所述轉(zhuǎn)基因 植物衍生的轉(zhuǎn)基因植物細胞。項19A根據(jù)項11A、16A或18A的轉(zhuǎn)基因植物或從其中衍生的轉(zhuǎn)基因植物細胞,其 中所述的植物是作物植物或單子葉植物或禾谷植物,如稻、玉米、小麥、大麥、稷、黑麥、小黑 麥、高粱和燕麥。項20A 根據(jù)項19A的的植物的可收獲部分,其中所述的可收獲部分優(yōu)選地是枝 條生物量和/或種子。項21A 產(chǎn)物,其衍生自根據(jù)項19A的植物和/或根據(jù)項20A的植物的可收獲部 分。項22A編碼PATELLIN多肽的核酸在相對于對照植物提高產(chǎn)量、優(yōu)選提高種子產(chǎn) 量和/或枝條生物量中的用途。項IB用于相對于對照植物增強植物中產(chǎn)量相關性狀的方法,其包括調(diào)節(jié)植物中 編碼PRP38多肽的核酸表達。項2B根據(jù)項IB的方法,其中所述PRP38多肽包含一個或多個如下基序(i) DUFl777 結(jié)構域(ii)RS 結(jié)構域(iii)基序la(SEQ ID NO 120),其中任意氨基酸殘基可由保守氨基酸取代和或達 50 %的氨基酸殘基可由非保守氨基酸取代。(iv)基序la(SEQ ID NO 121),其中任意氨基酸殘基可由保守氨基酸取代和或達 50 %的氨基酸殘基可由非保守氨基酸取代。(ν)基序la(SEQ ID NO 122),其中任意氨基酸殘基可由保守氨基酸取代和或達 50 %的氨基酸殘基可由非保守氨基酸取代。項3B根據(jù)項IB或2B的方法,其中所述受調(diào)節(jié)的表達通過在植物中引入并表達 編碼PRP38多肽的核酸實現(xiàn)。項4B根據(jù)任意前述項的方法,其中所述的編碼PRP38多肽的核酸編碼表A中所 列的任一種蛋白質(zhì)或是這種核酸的一部分或是能夠與這種核酸雜交的核酸。項5B根據(jù)任意前述項的方法,其中所述的核酸序列編碼表A中給出的任意蛋白 質(zhì)的直向同源物或旁系同源物。項6B根據(jù)任意前述項的方法,其中所述的增強的產(chǎn)量相關性狀包括相對于對照 植物提高的產(chǎn)量、優(yōu)選提高的生物量和/或提高的種子產(chǎn)量。項7B根據(jù)項IB至6B中任一項的方法,其中所述增強的產(chǎn)量相關性狀在非脅迫 條件下獲得。項8B根據(jù)項IB至6B中任一項的方法,其中所述的增強的產(chǎn)量相關性狀在缺氮 條件下獲得。
60
項9B根據(jù)項3B至8B中任一項的方法,其中所述的核酸有效鏈接至組成型啟動 子,優(yōu)選至G0S2啟動子,最優(yōu)選至來自稻的G0S2啟動子。項IOB 根據(jù)任意前述項的方法,其中所述的編碼PRP38多肽的核酸序列是植物 來源的,優(yōu)選地來自雙子葉植物,進一步優(yōu)選地來自十字花科,更優(yōu)選地來自擬南芥屬,最 優(yōu)選地來自擬南芥。項IlB由根據(jù)任一前述項的方法可獲得的植物或其部分,包括種子,其中所述的 植物或其部分包含編碼PRP38多肽的重組核酸。項12B構建體,其包含(i)編碼如項1或2定義的PRP38多肽的核酸;(ii)能夠驅(qū)動(a)的核酸序列表達的一個或多個調(diào)控序列;和任選地(iii)轉(zhuǎn)錄終止序列。項13B根據(jù)項12B的構建體,其中所述調(diào)控序列是組成型啟動子,優(yōu)選是G0S2啟 動子,最優(yōu)選地是來自稻的G0S2啟動子。項14B根據(jù)項12B或13B的構建體在用于產(chǎn)生植物的方法中的用途,所述植物相 對于對照植物具有提高的產(chǎn)量,特別是提高的生物量和/或提高的種子產(chǎn)量。項15B用根據(jù)項12B或13B的構建體轉(zhuǎn)化的植物、植物部分或植物細胞。項16B 用于產(chǎn)生轉(zhuǎn)基因植物的方法,所述的轉(zhuǎn)基因植物相對于對照植物具有提 高的產(chǎn)量、特別是提高的生物量和/或提高的種子產(chǎn)量,該方法包括(i)在植物中引入并表達編碼如項IB或2B中所定義的PRP38多肽的核酸;和(ii)在促進植物生長和發(fā)育的條件下培育植物細胞。項17B轉(zhuǎn)基因植物,其因相對于對照植物具有因編碼如項IB或2B中所定義的 PRP38多肽的核酸的受調(diào)節(jié)表達而引起提高產(chǎn)量、特別是提高的生物量和/或提高的種子 產(chǎn)量,或所述轉(zhuǎn)基因植物衍生的轉(zhuǎn)基因植物細胞。項18B根據(jù)項11B、15B或17B的轉(zhuǎn)基因植物,或從其中衍生的轉(zhuǎn)基因植物細胞, 其中所述的植物是作物植物或單子葉植物或禾谷植物,如稻、玉米、小麥、大麥、稷、黑麥、小
黑麥、高粱和燕麥。項19B 根據(jù)項18B的植物的可收獲部分,其中所述的可收獲部分優(yōu)選地是枝條 生物量和/或種子。項20B 產(chǎn)物,其衍生自根據(jù)項18B的植物和/或根據(jù)項19B的植物的可收獲部 分。項21B 編碼PRP38多肽的核酸在植物中相對于對照植物提高產(chǎn)量、特別是提高 種子產(chǎn)量和/或枝條生物量中的用途。項IC用于相對于對照植物提高植物的千粒重、總種子重和飽滿種子數(shù)中一項或 多項的方法,其包括調(diào)節(jié)植物中編碼GATA樣多肽的核酸表達,其中所述的GATA樣多肽屬于 GATA轉(zhuǎn)錄因子的亞家族II且包含GATA結(jié)構域。項2C根據(jù)項IC的方法,其中所述的GATA樣多肽包含一個或多個以下基序⑴基序 Ic :C (S/A/T) (D/E/N) CXT (T/S/A) (K/S) TP (L/M) WR (S/G/N) GP (SEQ ID NO 130),(ii)基序 2c :GPKSLCNACGIRX(R/K)K(SEQ ID NO 131),
(iii)基序 3c (A/S) (A/ff)X(L/C) (L/N) (M/L/V) (T/L/A) (L/D) (S/R) (SEQ ID NO 132)項3C根據(jù)項IC或2C的方法其中所述受調(diào)節(jié)的表達通過在植物中引入并表達編 碼GATA樣多肽的核酸實現(xiàn)。項4C根據(jù)任一前述項的方法,其中所述的編碼GATA樣多肽的核酸編碼表A中所 列的任一種蛋白質(zhì)或是這種核酸的一部分或是能夠與這種核酸雜交的核酸。項5C根據(jù)任一前述項的方法,其中所述的核酸序列編碼表A中給出的任意蛋白 質(zhì)的直向同源物或旁系同源物。項6C根據(jù)項IC至5C任一項的方法,其中所述增強的產(chǎn)量相關性狀在非脅迫條 件下獲得。項7C根據(jù)項3C至6C任一項的方法,其中所述的核酸有效鏈接至組成型啟動子, 優(yōu)選至G0S2啟動子,最優(yōu)選地至來自稻的G0S2啟動子。項8C 根據(jù)任一前述項的方法,其中所述的編碼GATA樣多肽的核酸是植物來源 的,優(yōu)選地來自雙子葉植物,進一步優(yōu)選地來自禾本科,更優(yōu)選地來自稻屬,最優(yōu)選地來自稻。項9C 由根據(jù)任一前述項的方法可獲得的植物或其部分,包括種子,其中所述植 物或其部分包含編碼GATA樣多肽的重組核酸,所述核酸有效連接至植物來源的組成型啟 動子,優(yōu)選至G0S2啟動子,最優(yōu)選地至來自稻的G0S2啟動子。項IOC構建體,其包含⑴編碼如項IC或2C定義中的GATA樣多肽的核酸;(ii)能夠驅(qū)動(a)的核酸序列表達的一個或多個植物來源的調(diào)控序列;和任選地(iii)轉(zhuǎn)錄終止序列。項IlC根據(jù)項IOC的構建體,其中所述調(diào)控序列之一是組成型啟動子,優(yōu)選G0S2 啟動子,最優(yōu)選來自稻的G0S2啟動子。項12C根據(jù)項IOC或IlC的構建體在用于產(chǎn)生植物的方法中的用途,所述植物相 對于對照植物具有提高的產(chǎn)量,包括千粒重、總種子重和飽滿種子數(shù)中一項或多項。項13C用根據(jù)項IOC或IlC的構建體轉(zhuǎn)化的植物、植物部分或植物細胞。項14C 用于產(chǎn)生轉(zhuǎn)基因植物的方法,所述的轉(zhuǎn)基因植物相對于對照植物具有提 高的產(chǎn)量、特別是提高的生物量和/或提高的種子產(chǎn)量,該方法包括(i)在植物中引入并表達編碼如項IC或2C中定義的GATA樣多肽且有效連接至植 物來源的組成型啟動子的核酸;和(ii)在促進植物生長和發(fā)育的條件下培育植物細胞。項15C 轉(zhuǎn)基因植物,其相對于對照植物具有因編碼如項IC或2C中定義的GATA 樣多肽的核酸的受調(diào)節(jié)表達引起的提高的千粒重,或所述轉(zhuǎn)基因植物衍生的轉(zhuǎn)基因植物細 胞。項16C根據(jù)項9C、13C或15C的轉(zhuǎn)基因植物,或從其中衍生的轉(zhuǎn)基因植物細胞,其 中所述的植物是作物植物或單子葉植物或禾谷植物,如稻、玉米、小麥、大麥、稷、黑麥、小黑 麥、高粱和燕麥。項17C根據(jù)項17C的植物的可收獲部分,其中所述的可收獲部分優(yōu)選地是種子。
項18C 產(chǎn)物,其衍生自根據(jù)項16C的植物和/或根據(jù)項17C的植物的可收獲部 分。項19C編碼GATA樣多肽的核酸在植物中相對于對照植物提高千粒重、總種子重 和飽滿種子數(shù)中一項或多項的用途。項ID用于相對于對照植物增強植物中產(chǎn)量相關性狀的方法,其包括調(diào)節(jié)植物中 編碼ADA2多肽的核酸的表達和可選地選擇具有增強的產(chǎn)量相關性狀的植物。項2D根據(jù)項ID的方法,其中所述ADA2多肽包含兩個或多個如下基序(i)SEQ ID NO :207 :kpglyccnycdkdlsglvrfkcavcmdfdlcvecfsvgvelnrhkn所示的 ZZ型鋅指結(jié)構域,或與SEQ ID NO :207所示的結(jié)構域或出現(xiàn)在表A中任意多肽中的任意ZZ 型鋅指結(jié)構域以增加的優(yōu)選順序具有至少50 %、55 %、60 %、65 %、70 %、75 %、80 %、82 %、 85%、90%、92%、95%、97%或更多的序列同一性的結(jié)構域;(ii)SEQ ID NO :208 所示的 SANT DNA 結(jié)合結(jié)構域vtsdwnadeei 11 Ieaiatygfgnwk evadhvgsktttecikhfnsaym,或SEQ ID NO :208所示的結(jié)構域或出現(xiàn)在表A中任意多肽中的 任意SANT DNA結(jié)合結(jié)構域以增加的優(yōu)選順序具有至少50 %、55 %、60 %、65 %、70 %、75 %、 80%、82%、85%、90%、92%、95%、97%或更多的序列同一性的結(jié)構域;(iii)SEQ ID NO :209 所示的 Ca 結(jié)合 EF 手結(jié)構域dndaeqlladmef,或 SEQ ID NO: 209所示的結(jié)構域或出現(xiàn)在表A中任意多肽中的任意Ca結(jié)合EF手結(jié)構域以增加的優(yōu)選順 序具有至少 50%、55%、60%、65%、70%、75%、80%、82%、85%、90%、92%、95%、97% 或 更多的序列同一性的結(jié)構域;(iv) SEQ ID NO :210 所示的 SWIRM 結(jié)構域priysgldtwdvdgllgadllsetekkmcnetr ilpvhylkmldiltreikkgqikkksdaysffkvepskvdrvydmlvhkgigdst, nJ^SEQ ID NO :210所示的 結(jié)構域或出現(xiàn)在表A中任意多肽中的任意SWIRM結(jié)構域以增加的優(yōu)選順序具有至少50%、 55%、60%、65%、70%、75%、80%、82%、85%、90%、92%、95%、97% 或更多的序列同一性 的結(jié)構域。項3D根據(jù)項ID或2D的方法,其中所述受調(diào)節(jié)的表達通過在植物中引入和表達 編碼ADA2多肽的核酸實現(xiàn)。項4D根據(jù)任意前述項的方法,其中所述編碼ADA2多肽的核酸編碼表A中所列任 一種蛋白質(zhì),或是這種核酸的一部分或能與這種核酸雜交的核酸。項5D根據(jù)任意前述項的方法,其中所述核酸序列編碼表A中所列任意蛋白質(zhì)的 直向同源物或旁系同源物。項6D根據(jù)任意前述項的方法,其中所述增強的產(chǎn)量相關性狀包括相對于對照植 物提高的產(chǎn)量,優(yōu)選種子產(chǎn)量。項7D根據(jù)項ID至6D中任一項的方法,其中所述增強的產(chǎn)量相關性狀在輕度脅 迫條件下獲得。項8D根據(jù)項ID至6D中任一項的方法,其中所述增強的產(chǎn)量相關性狀在缺氮條 件下獲得。項9D根據(jù)項3D至8D中任一項的方法,其中所述核酸有效鏈接至組成型啟動子, 優(yōu)選至HMGP啟動子,最優(yōu)選至來自稻的HMGP啟動子。項IOD 根據(jù)任意前述項的方法,其中所述編碼ADA2多肽的核酸具有植物起源,優(yōu)選來自雙子葉植物,進一步優(yōu)選地來自十字花科,更優(yōu)選地來自擬南芥屬,最優(yōu)選地來自 擬南芥。項IlD由根據(jù)任一前述項的方法可獲得的植物或其部分,包括種子,其中所述的 植物或其部分包含編碼ADA2多肽的重組核酸。項12D構建體,其包含(i)編碼如項ID或2D定義的ADA2多肽的核酸;(ii)能夠驅(qū)動(a)的核酸序列表達的一個或多個調(diào)控序列;和任選地(iii)轉(zhuǎn)錄終止序列。項13D 根據(jù)項12D的構建體,其中所述調(diào)控序列之一是組成型啟動子,優(yōu)選是 HMGP啟動子,最優(yōu)選地是來自稻的HMGP啟動子。項14D根據(jù)項12D或13D的構建體在用于產(chǎn)生植物的方法中的用途,所述植物相 對于對照植物具有提高的產(chǎn)量,特別是提高的生物量和/或提高的種子產(chǎn)量。項15D用根據(jù)項12D或13D的構建體轉(zhuǎn)化的植物、植物部分或植物細胞。項16D 用于產(chǎn)生轉(zhuǎn)基因植物的方法,所述的轉(zhuǎn)基因植物相對于對照植物具有提 高的產(chǎn)量、特別是提高的種子產(chǎn)量,該方法包括⑴在植物中引入并表達編碼如項ID或2D中所定義的ADA2多肽的核酸;和(ii)在促進植物生長和發(fā)育的條件下培育植物細胞;和任選地(iii)選擇具有增強的產(chǎn)量相關性狀的植物。項17D轉(zhuǎn)基因植物,其因編碼如項項ID或2D中所定義ADA2多肽的核酸的受調(diào) 節(jié)的表達而相對于對照植物具有提高的產(chǎn)量、特別是提高的種子產(chǎn)量,或所述轉(zhuǎn)基因植物 衍生的轉(zhuǎn)基因植物細胞。項18D根據(jù)項11D、15D或ID的轉(zhuǎn)基因植物或從其中衍生的轉(zhuǎn)基因植物細胞,其 中所述的植物是作物植物或單子葉植物或禾谷植物,如稻、玉米、小麥、大麥、稷、黑麥、小黑 麥、高粱和燕麥。項19D根據(jù)項19的植物的可收獲部分,其中所述的可收獲部分優(yōu)選地是枝條生 物量和/或種子。項20D 產(chǎn)物,其衍生自根據(jù)項18D的植物和/或根據(jù)項19D的植物的可收獲部 分。項21D編碼ADA2多肽的核酸在相對于對照植物提高植物產(chǎn)量、優(yōu)選提高種子產(chǎn) 量和/或枝條生物量中的用途。項IE編碼WD40重復(WDR) 23樣多肽的分離核酸序列,其包括SEQ ID NO 219、SEQ ID NO 225 或 SEQ ID NO 229 所示的分離的核酸序列;(ii)SEQ ID NO :219、SEQ ID N0:225或SEQ ID NO :229所示的分離的核酸序列的 互補序列;(iii)編碼 SEQ ID NO :220、SEQ ID N0:226 或 SEQ ID NO :230 所示的多肽序列的 分離的核酸序列;(iv)由于遺傳密碼簡并性的原因可從SEQ ID NO 220、SEQ IDNO 226或SEQ ID NO 230所示的多肽序列推導出來的分離的核酸序列;(ν)能夠在嚴格雜交條件下與 SEQ ID NO :219、SEQ ID N0:225 或 SEQ ID NO 229
64所示的核酸序列或其互補序列雜交的分離的核酸序列;(vi)分離的核酸序列,其編碼下述多肽,所述多肽與SEQ ID NO :220、SEQ ID NO 226或SEQ ID NO :230所示的多肽序列,按照遞增的優(yōu)選順序具有至少50%、55%、60%、 65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99% 或更高氨基酸序列同一 性;(ν)分離的核酸序列,其編碼包含下述結(jié)構域的多肽,所述結(jié)構域與SEQ ID NO 271所示的保守結(jié)構域,按照遞增的優(yōu)選順序具有至少65%、70%、75%、80%、85%、90%、 95%、96%、97%、98%、99%或更高氨基酸序列同一性。項2E 分離WDR23樣多肽,其包括(i)SEQ ID NO :220、SEQ ID NO 226 或 SEQ ID NO 230 所示的多月太序列;(ii)與 SEQ ID NO :220、SEQ ID NO 226 或 SEQ ID NO 230 所示的多肽序列按照 遞增的優(yōu)選順序具有至少 50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,96%, 97%、98%、99%氨基酸序列同一性的多肽序列;(iii)包含下述結(jié)構域的多肽,所述結(jié)構域與SEQ ID NO :271所示的保守結(jié)構域, 按照遞增的優(yōu)選順序具有至少 65%,70%,75%,80%,85%,90%,95%,96%,97%,98%,
99%或更高氨基酸序列同一性;(iii)上述⑴至(iii)中任意多肽序列的衍生物。項3E 用于相對于對照植物增強產(chǎn)量相關形狀的方法,所述方法包括增加編碼 WDR23樣多肽的核酸序列在植物中表達,所述WDR23樣多肽包含結(jié)構域,所述結(jié)構域與SEQ ID NO 271 所示的保守結(jié)構域(CD)具有至少 65 %、70 %、75 %、80 %、85 %、90 %、95 %、 98%,99%或更高氨基酸序列同一性,和任選地選擇具有增加的產(chǎn)量相關性狀的植物。項4E根據(jù)項3E的方法,其中所述WDR23樣多肽包含⑴至少四個具有PFAM登 錄號PF00400的WD40重復;和(ii)兩個連續(xù)WD40重復末端的至少兩個保守的DxR基序。項5E 根據(jù)項3E或4E的方法,其中所述WDR23樣多肽與SEQID NO :216所示的 WDR23樣多肽或本文表A給出的任意多肽序列或項2E中定義的WDR23樣多肽以增加的優(yōu)選 順序具有至少 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99% 或更高 氨基酸序列同一性。項6E根據(jù)項3E至5E中任一項的方法,其中所述編碼WDR23樣多肽的核酸序列 由表A中給出的任一核酸序列SEQ ID NO或其部分或能與表A中給出的任一核酸序列SEQ ID NO雜交的序列代表。項7E根據(jù)項3E至6E中任一項的方法,其中所述核酸序列編碼表A中所列任意 多肽序列SEQ ID NO的直向同源物或旁系同源物。項8E根據(jù)項3E至7E中任一項的方法,其中所述增加的表達通過T-DNA活化標 簽技術、TILLING或同源重組中任一種或多種實現(xiàn)。項9E根據(jù)項3E至8E中任一項的方法,其中所述增加的表達通過在植物中引入 并表達編碼WDR23樣多肽的核酸序列實現(xiàn)。項IOE根據(jù)項3E至9E中任一項的方法,其中所述增加的產(chǎn)量相關性狀是提高的 每株植物種子總產(chǎn)量、提高的種子飽滿率、提高的飽滿種子數(shù)、提高的收獲指數(shù)、和提高的 千粒重中一項或多項。
項IlE根據(jù)項3E至IOE中任一項的方法,其中所述核酸序列有效連接至組成型 啟動子,優(yōu)選至植物組成型啟動子,更優(yōu)選至G0S2啟動子,最優(yōu)選至SEQ ID NO :272所示的 來自稻的G0S2啟動子。項12E根據(jù)項3E至IOE中任一項的方法,其中所述核酸序列有效連接至分生組 織特異性啟動子,優(yōu)選至植物金屬硫蛋白啟動子,更優(yōu)選至SEQ ID N0:273所示的來自稻的 金屬硫蛋白啟動子。項13E根據(jù)項3E至12E中任一項的方法,其中所述編碼WDR23樣多肽的核酸序 列來自植物界,優(yōu)選來自雙子葉植物,進一步優(yōu)選地來自十字花科,最優(yōu)選地來自擬南芥。項14E由根據(jù)項3E至13E中任一項的方法可獲得的植物、其部分(包括種子)或 植物細胞,其中所述的植物、其部分或細胞包含有效連接至植物組成型啟動子的編碼WDR23 樣多肽的分離的核酸轉(zhuǎn)基因。項15E植物、其部分(包括種子)或植物細胞,其包含根據(jù)項IE的分離的核酸轉(zhuǎn) 基因或包含根據(jù)項2E的編碼WDR23樣多肽的分離核酸序列。項16E構建體,其包含⑴編碼如項1E、2E或3E至7E中任一項定義的WDR23樣多肽的核酸序列;(ii)能夠驅(qū)動(a)的核酸序列表達的一個或多個調(diào)控序列;和任選地(iii)轉(zhuǎn)錄終止序列。項17E根據(jù)項16E的構建體,其中所述調(diào)控序列是植物組成型啟動子,優(yōu)選G0S2 啟動子,更優(yōu)選稻G0S2啟動子,最優(yōu)選SEQ ID NO :272所示的G0S2啟動子。項18E根據(jù)項16E的構建體,其中所述調(diào)控序列是分生組織特異性啟動子,優(yōu)選 金屬硫蛋白(MT)啟動子,更優(yōu)選稻MT啟動子,最優(yōu)選至SEQ ID NO :273所示的MT啟動子。項19E根據(jù)項16E或18E的構建體在用于產(chǎn)生植物的方法中的用途,所述植物相 對于對照植物具有增強的產(chǎn)量相關形狀,所述增強的產(chǎn)量相關形狀是提高的每株植物種子 總產(chǎn)量、提高的種子飽滿率、提高的飽滿種子數(shù)、提高的收獲指數(shù)、和提高的千粒重中一項 或多項。項20E 用根據(jù)項16E至18E中任一項的構建體轉(zhuǎn)化的植物、植物部分或植物細 胞。項21E 用于產(chǎn)生轉(zhuǎn)基因植物的方法,所述的轉(zhuǎn)基因植物相對于對照植物具有增 強的產(chǎn)量相關形狀,該方法包括(i)在植物、植物部分或植物細胞中引入并表達編碼如項IE或3E至7E中任一項 定義的WDR23樣多肽的核酸序列;和(ii)在促進植物生長和發(fā)育的條件下培育植物細胞、植物部分或植物。項22E 轉(zhuǎn)基因植物,其相對于對照植物具有因下述核酸序列的增加的表達引 起的增強的產(chǎn)量相關性狀,或所述轉(zhuǎn)基因植物衍生的轉(zhuǎn)基因植物細胞或轉(zhuǎn)基因植物部分, 所述核酸序列編碼有效連接至植物表達性啟動子,如項IE或3E至7E中任一項定義的的 WDR23樣多肽。項23E根據(jù)項14E、15E、20E或22E的轉(zhuǎn)基因植物,其中所述的植物是作物植物或 單子葉植物或禾谷植物,如稻、玉米、小麥、大麥、稷、黑麥、小黑麥、高粱和燕麥,或從所述轉(zhuǎn) 基因植物衍生的轉(zhuǎn)基因植物細胞。
項24E根據(jù)項23E的植物的可收獲部分,其包含編碼WDR23樣多肽的分離核酸序 列,其中所述的可收獲部分優(yōu)選是種子。項25E 產(chǎn)物,其衍生自根據(jù)項23E的植物和/或根據(jù)項24E的植物的可收獲部 分。項26E編碼如項IE或3E至7E中任一項定義的WDR23樣多肽的核酸序列在增強 產(chǎn)量相關性狀中的用途,所述增強產(chǎn)量相關性狀包括提高的每株植物種子總產(chǎn)量、提高的 種子飽滿率、提高的飽滿種子數(shù)、提高的收獲指數(shù)、和提高的千粒重中一項或多項。附圖簡述本發(fā)明現(xiàn)在將參考以下圖進行描述,其中圖1代表序列SEQ ID NO :2。標出結(jié)構域結(jié)構和功能相關氨基酸。SEC14和GOLD 結(jié)構域以粗體和雙下劃線分別標出。框出涉及Ptdlns/PtdChs結(jié)合/轉(zhuǎn)運活性的氨基酸殘 基,而沿著脂類-結(jié)合口袋的疏水殘基有下劃線。鹽橋結(jié)構域以小寫字母顯示。卷曲螺旋 下標曲線。圖2代表選擇的表Al的PALT多肽的多重比對。圖3顯示選擇的表Al的PALT多肽的系統(tǒng)樹。圖4代表雙元載體,其用于在稻中增加稻G0S2啟動子控制下的PALT編碼核酸的表達。圖5詳述了用于實施本發(fā)明方法的序列的實例。圖6代表序列SEQ ID NO :77。示出保守結(jié)構域和基序PRP38結(jié)構域是下劃線的、 DUF1777結(jié)構域是粗體字的、基序lb, lib, IIIb和IVb是框出的。圖7代表表A2的PRP38多肽的多重比對。圖8顯示表A2的PRP38多肽的系統(tǒng)樹。圖9代表雙元載體,其用于在稻中增加稻G0S2啟動子(pG0S2)控制下的PRP38編 碼核酸的表達。圖10詳述了用于實施本發(fā)明方法的序列的實例。圖11代表SEQ ID NO 129的結(jié)構域結(jié)構,GATA結(jié)構域為粗體且保守基序Ic至3c 是下劃線的。圖12代表表亞組II GATA樣多肽的多重比對。點表示保守殘基,冒號表示高度保 守殘基,且星號表示相同的氨基酸。圖13代表雙元載體,其用于在稻中增加稻G0S2啟動子(pG0S2: GATA樣)控制下 的GATA樣-編碼核酸的表達。圖14詳述了用于實施本發(fā)明方法的序列的實例。圖15代表序列SEQ ID NO :182。示出保守結(jié)構域和基序。框出“KRKK”假定的核 定位信號,粗體顯示ZZ型鋅指結(jié)構域,下劃線和粗體字標出SANT DNA結(jié)合結(jié)構域,斜體和 下劃線標出Ca結(jié)合F手結(jié)構域,且雙下劃線標出SWIRM結(jié)構域。框出蛋白質(zhì)中心部分中的 相關和假定介導ADA2乙?;腖ys (K)殘基。圖16代表表A4的ADA2多肽的多重比對。圖17顯示表A4的ADA2多肽的系統(tǒng)樹。圖18和圖19代表雙元載體,其用于在稻中增加稻HMGP啟動子(圖18)和EXP9啟動子(圖19)控制下的ADA2編碼核酸的表達。圖20詳述了用于實施本發(fā)明方法的序列的實例。圖21代表SEQ ID NO :216所示的WRD23樣的結(jié)構的卡通圖。對應PFAM登錄號 PF00400的D40重復是圖表標出的。圖22顯示人中WRD23的功能。WRD23是多蛋白質(zhì)泛素E3連接酶復合物的部分, 其中Cullin4(CUL4)和損傷DNA結(jié)合蛋白質(zhì)1 (DDBl)是核心蛋白質(zhì)(Higa等,(2007)Cell Division 2 5 ;Angers 等,(2006) Nature 443:590-593 ;Higa 等,(2006) Nature Cell Biol 8(11) :1277-1283 ;He 等,(2006)Genes&Development 20:2949-2954)。這種復合物,例如 WRD23,為底物募集機制錨定WD40蛋白質(zhì)作為分子銜接頭,底物隨后被泛素化和破壞。圖23顯示序列比對,其代表在WD40的兩個連續(xù)的漿(blade)中保守的DxR基序、 在來自人(Homo sapiens)的 WRD23 (NCBI 登錄號 AK057636)、黑曲霉(Aspergillus niger) (NCBI登錄號CAK40817)和表A5的植物WRD23樣多肽。圖 24 顯示表 A5 的 WDR23 樣多肽的 AlignX(來自 Vector NTI10. 3, Invitrogen Corporation)序列多重比對。例SEQ ID NO :271所示的保守結(jié)構域(CD)的起點和終點以 括號顯示。共有序列中對應PF00400的WD40重復以X標出。DxR基序也在共有序列中鑒定。圖25顯示雙元載體,其用于在稻中增加植物表達性啟動子,例如均來自稻的G0S2 啟動子或分生組織啟動子控制下的WDR23樣多肽編碼核酸的表達。圖26詳述了用于實施本發(fā)明方法的序列的實例。
實施例本發(fā)明現(xiàn)在參考如下實施例進行描述,所述實施例僅是示意性的。以下實施例不 意圖完全限定或限制本發(fā)明的范圍。DNA操作除非另外說明,重組DNA技術根據(jù)(Sambrook(2001)Molecular Cloning :a laboratory manual,第 3 版 Cold Spring HarborLaboratory Press, CSH, New York)或 Ausubel 等,(1994), CurrentProtocoIs in Molecular Biology, Current Protocols第1卷和第2卷中描述的標準方案進行。用于植物分子研究工作的標準材料 和方法在BIOS科學出版有限責任公司(BIOS Scientific Publications Ltd(英國))和 Blackwell 科學出版社(Blackwell Scientific Publications (英國))出版的R. D. D. Croy 的 Plant Molecular Biology Labfax (1993)中描述。實施例1 鑒定與本發(fā)明方法中所用核酸序列相關的序列使用數(shù)據(jù)庫序列搜索工具,如基本局部比對工具(BLAST) (Altschul等(1990) J. Mol. Biol. 215 :403-410 ;和 Altschul 等(1997)Nucleic AcidsRes. 25:3389-3402)在國 家生物技術信息中心(NCBI)的Entrez核苷酸數(shù)據(jù)庫中所維護的那些序列內(nèi)鑒定到與本發(fā) 明方法中所用核酸序列相關的(全長cDNA、EST或基因組)序列。該程序用來通過核酸序 列或多肽序列與序列數(shù)據(jù)庫比較并通過計算匹配的統(tǒng)計學顯著性而找到序列間具有局部 相似性的區(qū)域。例如,本發(fā)明所用核酸編碼的多肽使用TBLASTN算法,采用默認設置和過濾 以忽略低復雜性序列抵消。分析的結(jié)果通過配對性比較顯示,并根據(jù)幾率評分(E-值)排 序,其中該評分反映特定比對結(jié)果因偶然而發(fā)生的概率(E-值越低,命中的顯著性越高)。
68除了 E-值外,比較還通過同一性百分數(shù)進行記分。同一性百分數(shù)指兩個所比較核酸(或多 肽)序列之間在特定長度范圍內(nèi)的相同核苷酸(或氨基酸)數(shù)目。表A提供了與本發(fā)明方法中所用的核酸序列相關的核酸序列的列表。在本說明書中使用的術語“表A”將用來說明表A1,和/或A2,和/或A3,和/或 A4,和/或A5的內(nèi)容。在本說明書中使用的術語“表Al”將用來說明表Al的內(nèi)容。在本 說明書中使用的術語“表A2”將用來說明表A2的內(nèi)容。在本說明書中使用的術語“表A3” 將用來說明表A3的內(nèi)容。在本說明書中使用的術語“表A4”將用來說明表A4的內(nèi)容。在 本說明書中使用的術語“表A5”將用來說明表A5的內(nèi)容。在一個優(yōu)選的實施方案中,術語 “表A”意指表Al。在一個優(yōu)選的實施方案中,術語“表A”意指表A2。在一個優(yōu)選的實施方 案中,術語“表A”意指表A3。在一個優(yōu)選的實施方案中,術語“表A”意指表A4。在一個優(yōu) 選的實施方案中,術語“表A”意指表A5。在本說明書中使用的術語“表B ”將用來說明表B1,和/或B2,和/或B3,和/或 B4,和/或B5的內(nèi)容。在本說明書中使用的術語“表Bi”將用來說明表Bl的內(nèi)容。在本 說明書中使用的術語“表B2”將用來說明表B2的內(nèi)容。在本說明書中使用的術語“表B3” 將用來說明表B3的內(nèi)容。在本說明書中使用的術語“表B4”將用來說明表B4的內(nèi)容。在 本說明書中使用的術語“表B5”將用來說明表B5的內(nèi)容。在一個優(yōu)選的實施方案中,術語 “表B”意指表Bi。在一個優(yōu)選的實施方案中,術語“表B”意指表B2。在一個優(yōu)選的實施方 案中,術語“表B”意指表B3。在一個優(yōu)選的實施方案中,術語“表B”意指表B4。在一個優(yōu) 選的實施方案中,術語“表B”意指表B5。在本說明書中使用的術語“表C”將用來說明表Cl,和/或C2,和/或C3,和/或 C4,和/或C5的內(nèi)容。在本說明書中使用的術語“表Cl”將用來說明表Cl的內(nèi)容。在本 說明書中使用的術語“表C2”將用來說明表C2的內(nèi)容。在本說明書中使用的術語“表C3” 將用來說明表C3的內(nèi)容。在本說明書中使用的術語“表C4”將用來說明表C4的內(nèi)容。在 本說明書中使用的術語“表C5”將用來說明表C5的內(nèi)容。在一個優(yōu)選的實施方案中,術語 “表C”意指表Cl。在一個優(yōu)選的實施方案中,術語“表C”意指表C2。在一個優(yōu)選的實施方 案中,術語“表C”意指表C3。在一個優(yōu)選的實施方案中,術語“表C”意指表C4。在一個優(yōu) 選的實施方案中,術語“表C”意指表C5。在本說明書中使用的術語“表D ”將用來說明表D1,和/或D2,和/或D3,和/或 D4,和/或D5的內(nèi)容。在本說明書中使用的術語“表D1”將用來說明表Dl的內(nèi)容。在本 說明書中使用的術語“表D2”將用來說明表D2的內(nèi)容。在本說明書中使用的術語“表D3” 將用來說明表D3的內(nèi)容。在本說明書中使用的術語“表D4”將用來說明表D4的內(nèi)容。在 本說明書中使用的術語“表D5”將用來說明表D5的內(nèi)容。在一個優(yōu)選的實施方案中,術語 “表D”意指表D1。在一個優(yōu)選的實施方案中,術語“表D”意指表D2。在一個優(yōu)選的實施方 案中,術語“表D”意指表D3。在一個優(yōu)選的實施方案中,術語“表D”意指表D4。在一個優(yōu) 選的實施方案中,術語“表D”意指表D5。表Al =PATL核酸和多肽的實例 表A2 :PRP38核酸和多肽的實例 表A3 =GATA樣多肽的實例 表A4 :ADA2核酸和多肽的實例 對于WDR23樣蛋白質(zhì),在一些情況下,相關序列已經(jīng)由研究機構如基因組研究機 構(The Institute for Genomic Research, TIGR)初步地匯編并且公開披露。可以使用 真核生物基因直向同源物(EukaryoticGene Orthologs, EGO)數(shù)據(jù)庫來鑒定此類相關序 列,這可通過關鍵詞搜索或通過使用BLAST算法以目的核酸或多肽序列進行。對于其他 情況,為了特定生物創(chuàng)建了專用核酸序列數(shù)據(jù)庫,例如聯(lián)合基因組研究所(Joint Genome Institute)所作的。對于其他情況,序列獲自私人數(shù)據(jù)庫,其自行努力測序制備,例如歐洲 油菜、向日葵(Helianthus annus)禾口 Linum usitatissum 的數(shù)據(jù)庫。實施例2 =PATL PRP38、GATA樣、ADA2和WDR23樣多肽序列的比對使用來自Vector NTI (Invitrogen)的Alignment X程序進行多肽序列的比對,其 中所述Alignment X程序基于流行的累進比對Clustal W算法(Thompson等(1997)Nucleic Acids Res 25 :4876_4882 ;Chenna 等(2003),Nucleic Acids Res 31 :3497_3500)。默認 值是空位開口罰分的默認值是10,空位延伸罰分是0. 1并且所選的權重矩陣是Blosum 62(如果比對多肽的話)。PATL多肽中序列的保守性在C-端高于N-端。給出共有序列。 示出保守的氨基酸。PATL多肽比對于圖2。比較圖1和圖2,揭示保守結(jié)構域的存在,以及 圖1中所示的關鍵氨基酸殘基出現(xiàn)在圖2的PATL多肽中。PATL多肽的系統(tǒng)樹(圖3)使用 如Vector NTI (Invitrogen)的AlignX程序中所提供的鄰接法聚類算法構建。PRP38多肽中序列的保守性主要在該多肽N-端PRP38結(jié)構域中,N-端結(jié)構域通常 在序列長度和組成上更加多變。PRP38多肽比對于圖7。PRP38多肽的系統(tǒng)樹(圖8)使用 如Vector NTI (Invitrogen)的AlignX程序中所提供的鄰接法聚類算法構建。GATA樣多肽中序列的保守性主要在該多肽的GATA結(jié)構域,C端結(jié)構域、N端結(jié)構 域通常在序列長度和組成上更加多變。GATA樣多肽比對于圖12。
78
ADA2多肽中序列的保守性主要在該多肽的保守型ZZ型Zn指、SANT DNA結(jié)合結(jié)構 域和SWIRM結(jié)構域。給出共有序列。ZZ型Zn指結(jié)構域富含半胱氨酸殘基。ADA2多肽比對 于圖16。ADA2多肽的系統(tǒng)樹(圖17)使用如Vector NTI (Invitrogen)的AlignX程序中 所提供的鄰接法聚類算法構建。表A5中全長WDR23樣多肽序列的序列多重比對使用AlignX算法(來自Vector NTI 10. 3, Invitrogen Corporation)進行。比對的結(jié)果示于本申請的圖23和24。圖23顯示序列比對,其代表在WD40的兩個連續(xù)的漿中保守的DxR基序、在來自人 的WRD23 (NCBI登錄號AK057636)、黑曲霉(NCBI登錄號CAK40817)和表A5的植物WRD23樣多肽。在圖24中,例SEQ ID NO 271所示的保守結(jié)構域(⑶)的起點和終點使用括號顯 示。共有序列中對應PF00400的WD40重復以X標出。DxR基序也在共有序列中鑒定。實施例3 計算在實施本發(fā)明方法中有用的多肽序列之間的全局同一性百分數(shù)使用現(xiàn)有技術領域可獲得的方法之一,即MatGAT(矩陣總體比對工具)軟件 (BMC Bioinformatics. 2003 4:29. MatGAT 使用蛋白質(zhì)序列或DNA序列產(chǎn)生相似性/同一 生失巨P車白勺一 Ρ Μ (an application that S; 13 rates similarity/identity matrices using protein 或 DNA 序歹lj s),Campanella JJ, Bitincka L, Smalley J ;i亥軟件由 Ledion Bitincka維護)確定在實施本發(fā)明方法中有用的全長多肽序列之間的全局相似性和同一 性百分數(shù)。MatGAT軟件對DNA序列或蛋白質(zhì)序列產(chǎn)生相似性/同一性矩陣,無需預先比對 數(shù)據(jù)。該程序使用Myers和Miller全局比對算法(空位開口罰分12和空位延伸罰分2) 執(zhí)行一系列配對比對,使用例如Blosum 62(對于多肽而言)計算相似性和同一性并且隨后 將結(jié)果置于距離矩陣中。在分割線下半部分顯示序列相似性,并且在對角分割線的上半部 分顯示序列同一性。比較中使用的參數(shù)是評分矩陣Blosum62第一空位12延伸空位2表Bl中顯示在多肽序列的全長范圍內(nèi)全局相似性和同一性的軟件分析結(jié)果。在 對角線上方給出同一性百分數(shù)(粗體)而在對角線下方給出相似性百分數(shù)(正常字體)。與0rysa_PATL_l多肽(SEQ ID NO 2)相比,在實施本發(fā)明方法中有用的PATL多 肽序列之間的同一性百分比可低至23. 7%氨基酸同一性。表Bl 在該多肽序列的全長范圍內(nèi)全局相似性和同一性的MatGAT結(jié)果。
對于PRP38多肽,與Arath_PRP38_l多肽(表A2)相比,選自表A2的多肽序列的 全長范圍內(nèi)全局相似性示于表B2。
表B2 :PRP38多肽之間的序列相似性 與SEQ ID NO 77相比,在實施本發(fā)明方法中有用的表B2的PRP38多肽序列之間 的同一性百分比可低至23. 6%氨基酸同一性。對于GATA樣蛋白質(zhì),比較中使用的參數(shù)是評分矩陣Blosum62第一空位11延伸空位1表B3中顯示在多肽序列的全長范圍內(nèi)全局相似性和同一性的軟件分析結(jié)果。在 對角線上方給出同一性百分數(shù)(粗體)而在對角線下方給出相似性百分數(shù)(正常字體)。與SEQ ID NO :129相比,在實施本發(fā)明方法中有用的GATA樣蛋白質(zhì)序列之間的同 一性百分比可低至14%氨基酸同一性。
81
對于ADA2多肽,比較中使用的參數(shù)是評分矩陣Blosum62 第一空位12延伸空位2表B4中顯示在多肽序列的全長范圍內(nèi)全局相似性和同一性的軟件分析結(jié)果。在 對角線上方給出同一性百分數(shù)(粗體)而在對角線下方給出相似性百分數(shù)(正常字體)。與Arath_ADA2_l多肽(SEQ ID NO 182)相比,在實施本發(fā)明方法中有用的ADA2 多肽序列之間的同一性百分比可低至21. 2%氨基酸同一性。表B4 該多肽序列的全長范圍內(nèi)全局相似性和同一性的MatGAT結(jié)果。
表B4 :ADA2多肽之間的序列相似性 對于WDR23樣蛋白質(zhì),比較中使用的參數(shù)是評分矩陣Blosum62第一空位12延伸空位2
表B5中顯示在多肽序列(除了部分多肽序列)的全長范圍內(nèi)全局相似性和同一 性的軟件分析結(jié)果。
與SEQ ID NO :216相比,在實施本發(fā)明方法中有用的全長肽序列之間的同一性百 分比可低至54%氨基酸同一性。在SEQ ID NO 271所示的保守結(jié)構域(CD)(且包含于SEQ IDNO 216)和表A5的 多肽序列的保守結(jié)構域(如圖24中示出的)之間的同一性百分比增加至69%氨基酸同一 性,如表B5. 1所示。實施例4 鑒定在實施本發(fā)明方法中有用的多肽序列中所包含的結(jié)構域通過搜索InterPro數(shù)據(jù)庫鑒定保守結(jié)構域蛋白質(zhì)。蛋白質(zhì)家族、結(jié)構域和位點的 集成資源(InterPro)數(shù)據(jù)庫是針對基于文本及基于序列的搜索法的常用特征標識數(shù)據(jù)庫 的集成界面。InterPro數(shù)據(jù)庫合并了這些數(shù)據(jù)庫,所述數(shù)據(jù)庫使用不同的方法學及不同程 度的有關充分表征的蛋白質(zhì)的生物學信息以獲得蛋白質(zhì)特征標識(protein signatures) 0 合作數(shù)據(jù)庫包括 SWISS-PROT、PROSITE、TrEMBL、Panther、PRINTS、ProDom 和 Pfam、Smart 和 TIGRFAM。Pfam是覆蓋眾多常見蛋白質(zhì)結(jié)構域和家族的序列多重比對結(jié)果和隱匿馬爾科夫 模型(HMM)的龐大集合。Pfam在英國Sanger研究所服務器上維護。Interpro由英國歐洲 生物信息學研究所維護。在表C5中顯示SEQ ID NO 2所示的多肽序列的InterPro掃描結(jié)果。表C5 =SEQ ID NO 2所示的多肽序列的InterPro掃描結(jié)果(主要登錄號)。數(shù)據(jù) 庫登錄號中數(shù)據(jù)庫的縮寫PF =Pfam ;PS =Prosite ;SM =Smart ;SSF =Superfamily0 在表C2中顯示SEQ ID NO :77所示的多肽序列的Pfam掃描結(jié)果。表C2 表A2的 多肽序列的Pfam掃描結(jié)果(主要登錄號)。給出所掃描的多肽(查詢多肽)中氨基酸坐標
91 在表C3中顯示SEQ ID NO 129所示的多肽序列的InterPro掃描結(jié)果。表C3 =SEQ ID NO 129所示的多肽序列的InterPro掃描結(jié)果(主要登錄號)。 在表C4中顯示SEQ ID NO 182所示的多肽序列的Pfam掃描結(jié)果。表C4 =SEQ ID NO 182所示的多肽序列的Pfam掃描結(jié)果(主要登錄號)。表C4:表A4的多肽序列的InterPro掃描結(jié)果(主要登錄號)。給出所掃描的多 肽(查詢多肽)中氨基酸坐標分隔的結(jié)構域(結(jié)構域名稱)。給出命中Pfam輸入的查詢多 肽比對的e-值。 在表C5中顯示SEQ ID NO 216所示的多肽序列的InterPro掃描結(jié)果。表C6 =SEQ ID NO 216所示的多肽序列的InterPro掃描結(jié)果。
實施例5 在本發(fā)明方法中所用的核酸序列的克隆使用定制的擬南芥幼苗cDNA 文庫(在 pCMV Sport 6. O 中;Invitrogen,Paisley, UK)作為模板,通過PCR擴增本在本發(fā)明方法中使用的核酸序列。使用Hifi Taq DNA聚合 酶,在標準條件下使用50 μ 1 PCR混合物中的200ng模板進行PCR。對于 PATL,使用的弓丨物是 SEQ ID NO :73 :5,_ggggacaagtttgtacaaaaaagcaggctta aacaatggcggaggagccac_3,禾口SEQ IDNO 74 ;5‘-ggggaccactttgtacaagaaagctgggtgtggtgaa tctggtgatcagg-3’,其包括用于Gateway重組的AttB位點。也使用標準方法純化擴增的PCR 片段。隨后進行Gateway方法的第一步驟,即BP反應,在此期間所述PCR片段與pD0NR201 質(zhì)粒體內(nèi)重組以產(chǎn)生根據(jù)Gateway術語學的“進入克隆”pOrySa_PATL_l。質(zhì)粒pD0NR201作為Gateway 技術的部分從Invitrogen購買。包含SEQ ID NO=I的進入克隆隨后在LR反應中與用于稻轉(zhuǎn)化的兩個目的載體一 起使用。第一載體含有在T-DNA邊界內(nèi)部的功能性元件植物選擇性標記、可篩選標記表達 盒,和意圖與已經(jīng)克隆在該進入克隆中的目的核酸序列發(fā)生LR體內(nèi)重組的Gateway盒。用 于組成型表達的稻G0S2啟動子(SEQ ID NO 75)位于該Gateway盒上游。在LR重組步驟后,將所得表達載體PG0S2 Orysa_PATL_l (圖4)根據(jù)本領域熟知 的方法轉(zhuǎn)化至農(nóng)桿菌菌株LBA4044中。對于 RP38,使用的弓丨物是 SEQ ID NO 125 5' ggggacaagtttgtacaaaaaagcaggctt aaacaatggcggagatacagtcaaa 3'禾口 SEQ IDNO 126 ;5' ggggaccactttgtacaagaaagctgggtt cacctccaagaggaacca 3’,其包括用于Gateway重組的AttB位點。也使用標準方法純化擴 增的PCR片段。隨后進行Gateway方法的第一步驟,即BP反應,在此期間所述PCR片段與 PD0NR201質(zhì)粒體內(nèi)重組以產(chǎn)生根據(jù)Gateway術語學的“進入克隆”pPRP38。質(zhì)粒pD0NR201 作為Gateway 技術的部分從Invitrogen購買。包含SEQ ID NO :76的進入克隆隨后在LR反應中與用于稻轉(zhuǎn)化的目的載體一起使 用。該載體含有在T-DNA邊界內(nèi)部的植物選擇性標記、可篩選標記表達盒,和意圖與已經(jīng)克 隆在該進入克隆中的目的核酸序列發(fā)生LR體內(nèi)重組的Gateway盒作為功能性元件。用于 組成型表達的稻G0S2啟動子(SEQ ID NO 127)位于該Gateway盒上游。在LR重組步驟后,將所得表達載體pG0S2::PRP38(圖9)根據(jù)本領域熟知的方法 轉(zhuǎn)化至農(nóng)桿菌菌株LBA4044中。對于GATA,使用的引物是prml0133(SEQ ID NO 133 ;有義,起始密碼子是粗體)5’ GGGGACAAGTTTGTACAAAAAAGCAGGCTTAAAC ATG TCTACTATCTACATGAGCCA 3’ 和 prml0134(SEQ ID NO 134 ;反義,互補)5,GGGGACCACTTTGTACAAGAAAGCTGGGTAGCTAGCTAGTTTTGATCAGC 3,,其包括用于 Gateway重組的AttB位點。也使用標準方法純化擴增的PCR片段。隨后進行Gateway方 法的第一步驟,即BP反應,在此期間所述PCR片段與pD0NR201質(zhì)粒體內(nèi)重組以產(chǎn)生根據(jù) Gateway術語學的“進入克隆” pGATA-like。質(zhì)粒pD0NR201作為Gateway 技術的部分從 Invitrogen 購買。包含SEQ ID NO 128的進入克隆隨后在LR反應中與用于稻轉(zhuǎn)化的目的載體一起 使用。該載體含有在T-DNA邊界內(nèi)部的植物選擇性標記、可篩選標記表達盒,和意圖與已經(jīng) 克隆在該進入克隆中的目的核酸序列發(fā)生LR體內(nèi)重組的Gateway盒作為功能性元件。用 于組成型表達的稻G0S2啟動子(SEQ ID NO 135)位于該Gateway盒上游。在LR重組步驟后,將所得表達載體pG0S2: GATA-Iike (圖13)根據(jù)本領域熟知的 方法轉(zhuǎn)化至農(nóng)桿菌菌株LBA4044中。使用定制的稻幼苗cDNA 文庫(在 pCMV Sport 6. O 中;Invitrogen, Paisley, UK) 作為模板,通過PCR擴增本在本發(fā)明方法中使用的核酸序列SEQ ID N0:177。使用Hifi Taq DNA聚合酶,在標準條件下使用50 μ 1 PCR混合物中的200ng模板進行PCR。使用的引物是 prml0106(SEQ ID NO 179 ;有義,啟示密碼子為粗體)5,-ggggacaagtttgtacaaaaaagcagg cttaaacaatgcttcaccattactacagc-3,禾口 prml0107(SEQ ID NO 180 ;反義,互補)5,-gggg accactttgtacaagaaagctgggtcca acgctaatgctacact-3‘,其包括用于 Gateway 重組的 AttB位點。也使用標準方法純化擴增的PCR片段。其他克隆步驟如上所述。對于ADA2,使用的引物是 SEQ ID NO 211 5,-GGGGACAAGTTTGTACAAAAAAGCAGGCTT AAACAATGGGTCGTTCGAAACTAGC-3,和SEQ ID NO 212 ;5‘-GGGGACCACTTTGTACAAGAAAGCTGGGTC ATGTTAGGACCATGAAGCT ATG-3,,其包括用于Gateway重組的AttB位點。也使用標準方法純 化擴增的PCR片段。隨后進行Gateway方法的第一步驟,即BP反應,在此期間所述PCR片 段與pD0NR201質(zhì)粒體內(nèi)重組以產(chǎn)生根據(jù)Gateway術語學的“進入克隆” pAtADA2_l。質(zhì)粒 PD0NR201作為Gateway 技術的部分從Invitrogen購買。包含SEQ ID NO 181的進入克隆隨后在LR反應中與用于稻轉(zhuǎn)化的兩個目的載體 一起使用。第一載體含有在T-DNA邊界內(nèi)部的功能性元件植物選擇性標記、可篩選標記 表達盒,和意圖與已經(jīng)克隆在該進入克隆中的目的核酸序列發(fā)生LR體內(nèi)重組的Gateway 盒。用于組成型表達的稻HMGP啟動子(SEQ ID NO 213)位于該Gateway盒上游。第二載 體在T-DNA邊界內(nèi)部含有上述相同的功能性元件,稻EXP9啟動子(SEQ IDNO 214)位于該 Gateway盒上游。在LR重組步驟后,將所得表達載體pHMG Arath_ADA2_l (圖18)根據(jù)本領域熟知 的方法轉(zhuǎn)化至農(nóng)桿菌菌株LBA4044中。除非另外說明,重組DNA 技術根據(jù)(Sambrook(2001)MolecularCloning :a laboratory manual,第 3 版,Cold Spring Harbor LaboratoryPress, CSH, New York)或 在 Ausubel 等(1994), Current Protocols inMolecular Biology, Current Protocols第 1卷和第2卷中描述的標準方案進行。用于植物分子研究工作的標準材料和方法在BIOS ScientificPublications Ltd (英國)禾口 Blackwell Scientific Publications ()出 版的 R. D. D. Croy 的 Plant Molecular Biology Labfax (1993)中描述。對于WDR23樣多肽,編碼SEQ ID NO 216所示的WDR23樣多肽序列的擬南芥cDNA 使用下述cDNA作為模板進行PCR擴增,所述cDNA合成自生長于不同條件下的擬南芥的不 同組織提取得到的mRNA。包括用于Gateway重組的AttB位點的下列引物用于PCR擴增(v) Prm 09100 (SEQ ID N0:274,正義)5 ’ -GGGGACAAGTTTGTACAAAAAAGCAGGCTTAAACAATGTTTTTTGGACCAAGTGAG-3’(vi)Prm 09101 (SEQ ID NO :275,反義,互補)5 ’ -GGGGACCACTTTGTACAAGAAAGCTGGGTTGTGTAGAGAGACGCATCAGT-3’使用Hifi Taq DNA聚合酶在標準條件下進行PCR。使用標準方法擴增和純化具有 預期長度的PCR片段(包含attB位點)。隨后進行Gateway方法的第一步驟,即BP反應, 在此期間,所述PCR片段與pD0NR201質(zhì)粒在體內(nèi)重組以產(chǎn)生根據(jù)Gateway術語學的“進入 克隆”。質(zhì)粒PD0NR201作為Gateway 技術的部分從Invitrogen購買。實施例5A 在實施本發(fā)明方法中有用的多肽序列的拓撲結(jié)構預測TargetP 1. 1預測真核蛋白的亞細胞定位?;谌魏伟被饲靶蛄腥~綠體轉(zhuǎn)運 肽(cTP)、線粒體靶向肽(mTP)或分泌途徑信號肽(SP)的預測存在性進行定位指派。作為最 終預測基礎的評分并不真正是概率,并且它們不是必需地加合成一體。然而,根據(jù)TargetP, 具有最高評分的定位是最可能的,并且評分之間的關系(可靠性級別)可以指示該預測具 有多大確定性??煽啃约墑e(RC)范圍從1至5,其中1表示最可靠的預測。TargetP在丹 麥技術大學(Technical University of Denmark)的服務器上維護。
對于預測含有氨基端前序列的序列而言,也可以預測潛在的切割位點??梢赃x擇許多參數(shù),如生物組別(非植物或植物)、臨界值集合(無、預定義的臨界 值集合或用戶指定的臨界值集合)和切割位點預測的計算(是或否)。在表D3中呈現(xiàn)SEQ ID NO 129所示的多肽序列的TargetP 1. 1分析的結(jié)果。選 擇“植物”生物組別,未定義臨界值,并且對轉(zhuǎn)運肽的預測長度提出要求。SEQ ID N0:129所 示的多肽序列的亞細胞定位可以是細胞質(zhì)或細胞核,沒有預測到轉(zhuǎn)運肽。表D3 =SEQ ID NO 129所示的多肽序列的TargetP 1. 1分析結(jié)果 許多其他算法可以用來進行此類分析,包括·在丹麥技術大學服務器上維護的ChloroP 1. 1 ;·在澳大利亞布里斯班昆士蘭大學生物科學研究所的服務器上維護的Protein Prowler亞細胞定位預測者1. 2版;·在加拿大阿伯特省埃德蒙頓市阿爾伯塔大學的服務器上維護的PENCE蛋白組分 析專家 PA-GOSUB 2. 5 ;·在丹麥技術大學服務器上維護的TMHMM。實施例6 植物轉(zhuǎn)化稻轉(zhuǎn)化使用含有表達載體的農(nóng)桿菌來轉(zhuǎn)化稻植物。將粳稻栽培品種日本晴(Nipponbare) 的成熟干燥種子脫殼。通過如下方式實施消毒在70%乙醇中孵育1分鐘,隨后在0. 2% HgCl2中孵育30分鐘,隨后用無菌蒸餾水洗滌6次15分鐘。無菌的種子隨后在含有2,4-D 的培養(yǎng)基(愈傷組織誘導培養(yǎng)基)上萌發(fā)。在黑暗中孵育4周后,將胚發(fā)生的盾片衍生性 愈傷組織切下并在相同的培養(yǎng)基上增殖。2周后,將所述愈傷組織通過在同一種培養(yǎng)基上傳 代培養(yǎng)另外2周進行繁殖或增殖。胚發(fā)生的愈傷組織片在新鮮培養(yǎng)基上傳代培養(yǎng)3日,隨 后共培育(以助長細胞分裂活性)。
98
將含有表達載體的農(nóng)桿菌菌株LBA4404用于共培育。農(nóng)桿菌接種在含有適宜抗生 素的AB培養(yǎng)基上并在28°C培養(yǎng)3日。隨后收集細菌并在液體共培育培養(yǎng)基中懸浮至密度 (OD600)約1。該混懸液隨后轉(zhuǎn)移至培養(yǎng)皿內(nèi)并將所述愈傷組織浸入此混懸液中15分鐘。該 愈傷組織隨后在濾紙上蘸干并轉(zhuǎn)移至固化的共培育培養(yǎng)基,并在25°C于黑暗中孵育3日。 共培育的愈傷組織在含2,4-D的培養(yǎng)基上在28°C于黑暗中在存在選擇劑時培育4周。在此 期間,迅速生長的抗性愈傷組織團發(fā)育。將這種材料轉(zhuǎn)移至再生培養(yǎng)基并在光照下孵育后, 胚發(fā)生潛能釋放并且苗在隨后4至5周內(nèi)發(fā)育。將苗從愈傷組織上切下并且在含有植物生 長素的培養(yǎng)基上孵育2至3周,將苗從所述培養(yǎng)基轉(zhuǎn)移至土壤。硬化的苗在溫室中于高濕 度和短日照下培育。對于一個構建體,產(chǎn)生大約35個獨立的TO稻轉(zhuǎn)化體。將原代轉(zhuǎn)化體從組織培養(yǎng)箱 轉(zhuǎn)移至溫室。在定量PCR分析驗證T-DNA插入物的拷貝數(shù)后,僅保留顯示所述選擇劑抗性的 單拷貝轉(zhuǎn)基因植物用于收獲Tl種子。種子隨后在移栽后3至5個月收獲。該方法以超過 50%的比例產(chǎn)生單基因座轉(zhuǎn)化體(Aldemita和Hodgesl996,Chan等1993,Hiei等1994)。玉米轉(zhuǎn)化玉米(玉蜀黍,Zeamays)的轉(zhuǎn)化用 Ishida 等(I996)Nature Biotech 14(6) 745-50描述的改良方法進行。在谷物中,轉(zhuǎn)化是基因型依賴的并且僅特定基因型適合于轉(zhuǎn) 化和再生。近交系A188(明尼蘇達大學)或以A188作為親本的雜交體是用于轉(zhuǎn)化的供體材 料的良好來源,不過也可以成功地使用其他基因型。谷穗從授粉后大約11日(DAP)的谷物 植物收獲,此時不成熟的胚的長度是大約1至1. 2mm。將不成熟的胚與含有所述表達載體的 根瘤農(nóng)桿菌共培育,并且通過器官發(fā)生過程回收轉(zhuǎn)基因植物。切下的胚在愈傷組織誘導培 養(yǎng)基上、隨后在玉米再生培養(yǎng)基上培育,其中所述的培養(yǎng)基含有選擇劑(例如咪唑啉酮,不 過可以使用不同的選擇性標記)。培養(yǎng)板在25°C于光照下孵育2-3周,或直至苗發(fā)育。將 來自每個胚的綠色苗轉(zhuǎn)移至玉米生根培養(yǎng)基并在25°C孵育2-3周,直至根發(fā)育。將生根的 苗移植至溫室中的土壤內(nèi)。從針對所述選擇劑顯示耐受性并且含有單拷貝T-DNA插入物的 植物產(chǎn)生Tl種子。小麥轉(zhuǎn)化小麥的轉(zhuǎn)化用Ishida等(1996)Nature Biotech 14(6) :745_50描述的方法進行。 栽培品種Bobwhite (可從墨西哥CIMMYT獲得)通常用于轉(zhuǎn)化。將不成熟的胚與含有所述表 達載體的根瘤農(nóng)桿菌共培育,并且通過器官發(fā)生過程回收轉(zhuǎn)基因植物。與農(nóng)桿菌孵育后,所 述胚在愈傷組織誘導培養(yǎng)基上、隨后于再生培養(yǎng)基上體外培育,其中所述的培養(yǎng)基含有選 擇劑(例如咪唑啉酮,不過可以使用不同的選擇性標記)。培養(yǎng)板在25°C于光照下孵育2-3 周,或直至苗發(fā)育。將來自每個胚的綠色苗轉(zhuǎn)移至生根培養(yǎng)基并在25°C孵育2-3周,直至根 發(fā)育。將生根的苗移植至溫室中的土壤內(nèi)。從顯示選擇劑耐受性并且含有單拷貝T-DNA插 入物的植物產(chǎn)生Tl種子。大豆轉(zhuǎn)化根據(jù)Texas A&M美國專利5,164,310中描述的改良方法轉(zhuǎn)化大豆。幾個商業(yè)大豆 品種適合于通過這種方法轉(zhuǎn)化。栽培品種Jack (從Illinois種子基金會可獲得)通常用于 轉(zhuǎn)化。將大豆種子消毒以體外播種。從7日齡年幼籽苗切除下胚軸、胚根和一片子葉。進 一步培育上胚軸和剩余的子葉以發(fā)育腋生結(jié)節(jié)。將這些腋生結(jié)節(jié)切下并與含有表達載體的根瘤農(nóng)桿菌孵育。在共培育處理之后,將外植體洗滌并轉(zhuǎn)移至選擇培養(yǎng)基。將再生的苗切 下并置于苗伸長培養(yǎng)基上。將長度不超過Icm的苗置于生根培養(yǎng)基上直至根發(fā)育。將生根 的苗移植至溫室中的土壤內(nèi)。從顯示選擇劑耐受性并且含有單拷貝T-DNA插入物的植物產(chǎn) 生Tl種子。油菜籽/卡諾拉油菜轉(zhuǎn)化使用5-6日齡年幼籽苗的子葉柄和下胚軸作為組織培養(yǎng)用外植體并且根據(jù)Babic 等,(1998,Plant Cell Rep 17 183-188)進行轉(zhuǎn)化。商業(yè)品種 Westar (Agriculture Canada)是用于轉(zhuǎn)化的標準品種,不過也可以使用其他品種。對卡諾拉油菜種子進行表面 消毒以體外播種。從所述體外籽苗切下帶有子葉的子葉柄外植體,并且用(含有表達載體 的)農(nóng)桿菌通過該葉柄外植體的切口末端浸入細菌懸液而接種。所述外植體隨后在23°C, 16小時光照下于含有3mg/l BAP、3%蔗糖、0. 7%植物瓊脂的MSBAP-3培養(yǎng)基上培養(yǎng)2日。 與農(nóng)桿菌共培育2日后,將葉柄外植體轉(zhuǎn)移至含有3mg/l BAP、頭孢噻肟、羧芐青霉素或特 美汀(300mg/l)的MSBAP-3培養(yǎng)基上培養(yǎng)7日,并且隨后在含有頭孢噻肟、羧芐青霉素或特 美汀和選擇劑的MSBAP-3培養(yǎng)基上培養(yǎng),直至苗再生。當苗長度是5-10mm時,將這些苗切 下并轉(zhuǎn)移至苗伸長培養(yǎng)基(MSBAP-0. 5,含有0. 5mg/l BAP)。將長度大約2cm的苗轉(zhuǎn)移至用 于根誘導的生根培養(yǎng)基(MSO)。將生根的苗移植至溫室中的土壤內(nèi)。從顯示選擇劑耐受性 并且含有單拷貝T-DNA插入物的植物產(chǎn)生Tl種子。苜蓿轉(zhuǎn)化使用(McKersie等,1999 Plant Physiol 119:839-847)的方法轉(zhuǎn)化苜蓿的再生 性克隆。苜蓿的再生和轉(zhuǎn)化是基因型依賴性的并且因而需要再生性植物。已經(jīng)描述了獲得 再生性植物的方法。例如,這些再生性植物可以選自栽培品種Range lander (Agriculture Canada)或如Brown DCW禾口AAtanassov(1985. Plant Cell Tissue Culture 4:111—112)所 述的任何其他商業(yè)苜蓿品種。備選地,已經(jīng)選擇RA3品種(威斯康星大學)用于組織培養(yǎng) (Walker等,1978 Am J Bot 65 :654_659)。葉柄外植體與含有表達載體的根瘤農(nóng)桿菌C58C1 pMP90 (McKersie 等,1999 Plant Physiol 119 :839_847)或LBA4404 的過夜培養(yǎng)物共培育。 所述外植體在黑暗中于含有288mg/LPro、53mg/L硫代脯氨酸、4. 35g/L K2S04和100 μ π!乙 酰丁香酮的SH誘導培養(yǎng)基上共培育3日。所述外植體在半濃度的Murashige-Skoog培養(yǎng) 基(Murashige和Skoog,1962)中洗滌并鋪種在不含乙酰丁香酮而含有抑制農(nóng)桿菌生長的 合適選擇劑和合適抗生素的相同SH誘導培養(yǎng)基上。幾周后,將體細胞胚轉(zhuǎn)移至不含生長調(diào) 節(jié)劑、不含抗生素和含有50g/L蔗糖的B0i2Y發(fā)育培養(yǎng)基。隨后在半濃度Murashige-Skoog 培養(yǎng)基上萌發(fā)體細胞胚。將生根的籽苗移植至花缽內(nèi)并且在溫室中培育。從顯示選擇劑耐 受性并且含有單拷貝T-DNA插入物的植物產(chǎn)生Tl種子。棉花轉(zhuǎn)化使用根瘤農(nóng)桿菌,根據(jù)US 5,159,135中所述的方法轉(zhuǎn)化棉花。棉花種子在3%次 氯酸鈉溶液中作20分鐘表面消毒并在含500 μ g/ml頭孢噻肟的蒸餾水中洗滌。隨后將種 子轉(zhuǎn)移至含有50 μ g/m苯菌靈的SH培養(yǎng)基用于萌發(fā)。取下4至6日齡籽苗的下胚軸,切成 0.5cm小片并置于0.8%瓊脂上。農(nóng)桿菌混懸液(每毫升大約IO8個細胞,從含有用目的基 因和合適選擇標記轉(zhuǎn)化的過夜培養(yǎng)物稀釋)用于接種下胚軸外植體。在室溫和光照下3日 后,將組織轉(zhuǎn)移至固體培養(yǎng)基(1.6g/l脫乙酰吉蘭糖膠),所述固體培養(yǎng)基含有具有維生素B5 的 Murashige 和 Skoog 鹽(Gamborg 等,Exp. Cell Res. 50 151-158 (1968)) ,0. lmg/1 2, 4-D、0. lmg/1 6-呋喃甲基氨基嘌呤和750 μ g/ml MgCL2以及殺死殘留細菌的50至100 μ g/ ml頭孢噻肟和400-500 μ g/ml羧芐青霉素。單個細胞系在2至3個月(每隔4至6周傳 代培養(yǎng))后分離并且在用于組織增殖的選擇培養(yǎng)基上進一步培育(30°C,16小時光周期)。 轉(zhuǎn)化的組織隨后在非選擇培養(yǎng)基上進一步培育持續(xù)2至3個月以產(chǎn)生體細胞胚。將至少 4mm長度的外觀健康胚轉(zhuǎn)移至含有精細蛭石中具SH培養(yǎng)基的管內(nèi),所述SH培養(yǎng)基補充有 0. lmg/1吲哚乙酸、6-呋喃甲基氨基嘌呤和赤霉酸。在30°C以16小時光周期培育胚,并且 將處于2至3葉期的小植物轉(zhuǎn)移至具有蛭石和養(yǎng)分的花缽。植物硬化并隨后移至溫室以進 一步培育。對于WDR23樣基因,棉花(陸地棉)的轉(zhuǎn)化使用根瘤農(nóng)桿菌,在下胚軸外植體上進 行。市售品種,例如Coker 130或Coker 312 (SeedCo,Lubbock,TX)是用于轉(zhuǎn)化的標準變 種,但是也可以使用其他變種。表面消毒種子并在黑暗中萌發(fā)。從長約1-1. 5厘米的萌發(fā) 幼苗上切下下胚軸外植體。下胚軸外植體浸沒在包含表達載體的根瘤農(nóng)桿菌接種物中5分 鐘,然后在黑暗中,于24°C下在MS+1.8mg/l KN03+2%葡萄糖上共培育約48小時。外植體 轉(zhuǎn)移到含有合適細菌和植物選擇性標記的相同培養(yǎng)基中(更新幾次),直到可以看見胚性 胼胝體(embryogenic calli)。分離胼胝體并再培養(yǎng)直至出現(xiàn)體細胞胚。源自體細胞胚的 小植株在生根培養(yǎng)基上成熟至根發(fā)育。生根的幼苗轉(zhuǎn)移到溫室中的花缽土壤中。從表現(xiàn)選 擇劑耐受性并含有單拷貝T-DNA插入物的植物中產(chǎn)生Tl種子。實施例6B 使用SEQ ID NO 215所示的核酸序列構建表達載體包含SEQ ID NO 215的進入克隆隨后在LR反應中與用于稻轉(zhuǎn)化法的目的載體一 起使用。該載體含有在T-DNA邊界內(nèi)部的植物選擇性標記、可篩選標記表達盒,和意圖與已 經(jīng)克隆在該進入克隆中的目的核酸序列發(fā)生LR體內(nèi)重組的Gateway盒作為功能性元件。用 于組成型表達的稻G0S2啟動子(SEQ ID NO ,212)位于該Gateway盒上游。也產(chǎn)生用于稻 轉(zhuǎn)化的第二目的載體,其具有用于分生組織特異性表達的稻金屬硫蛋白啟動子(MT ;SEQ ID NO 273)。在LR 重組步驟后,所得表達載體 pG0S2 WDR23-1 ike 和 pMT WDR23-1 ike (圖 25) 根據(jù)本領域熟知的方法獨立轉(zhuǎn)化至農(nóng)桿菌菌株LBA4044中。實施例7 表型評價方法7. 1評價建立產(chǎn)生大約35個獨立的TO稻轉(zhuǎn)化體。將原代轉(zhuǎn)化體從組織培養(yǎng)室轉(zhuǎn)移至溫室以培 育并收獲Tl種子。留下6個事件,其中Tl子代以3 1比例對所述轉(zhuǎn)基因的存在/不存 在分離。對于這些事件中的每個事件,通過監(jiān)測目視標記表達選出大約10株含有該轉(zhuǎn)基因 的Tl籽苗(雜合子和純合子)和大約10株缺少該轉(zhuǎn)基因的Tl籽苗(失效合子)。以隨機 位置并排生長轉(zhuǎn)基因植物和相應的失效合子。溫室條件(非脅迫條件)是短日照(12小時 光照),在光照下28°C和在黑暗中22°C,和70%相對濕度。進行頻繁的澆水,以滿足植物生 長和發(fā)展出健康的外觀的水和養(yǎng)分的需要。植物從播種期至成熟期數(shù)次通過數(shù)字成像室。在每個時間點上,從至少6個不同 角度拍攝每株植物的數(shù)字圖像(2048X 1536像素,1600萬顏色)。干旱篩選
在盆栽土壤中在正常條件下培育來自T2種子的植物直至它們接近齊穗期。隨后 將它們轉(zhuǎn)移至灌溉減少的“干燥”區(qū)。將濕度探測器插入隨機選擇的花缽內(nèi),以監(jiān)測土壤水 含量(SWC)。當SWC下降低于某個閾值時,自動地對所述植物連續(xù)再灌溉直至再次達到正常 水平。隨后將植物再次轉(zhuǎn)移至正常條件。栽培的剩余部分(植物成熟、種子收獲)與不在 非生物脅迫條件下培育的植物相同。如對正常條件下詳述那樣記錄生長和產(chǎn)量參數(shù)。氮利用效率篩選在盆栽土壤中在除營養(yǎng)液之外的正常條件下培育來自T2種子的稻植物。從移植 至成熟期間用含有降低的、通常7至8倍之間更少的氮(N)含量的特定營養(yǎng)液澆灌所述花 缽。栽培的剩余部分(植物成熟、種子收獲)與不在非生物脅迫下培育的植物相同。如對 正常條件下詳述那樣記錄生長和產(chǎn)量參數(shù)。7. 2統(tǒng)計分析F-檢驗使用兩因素ANOVA(變量分析)作為總體評價植物表型特征的統(tǒng)計模型。對用本 發(fā)明基因轉(zhuǎn)化的全部事件的全部植物的全部所測量參數(shù)實施F檢驗。實施F檢驗以檢查該 基因?qū)θ哭D(zhuǎn)化事件的影響并驗證該基因的整體作用(又稱作基因總體作用)。對于該F 檢驗而言,真實基因總體作用顯著性的閾值對于所述F檢驗設置在5%概率水平上。顯著性 F檢驗值指出了基因作用,這意味不僅僅是基因的存在或位置才造成表型上的差異。因為實施了具有重疊事件的兩個實驗,故進行聯(lián)合分析。這用于檢驗對這兩個實 驗影響的一致性,并且如果一致,則用于積累來自兩個實驗的證據(jù)以提高結(jié)論的可信度。所 用的方法是考慮數(shù)據(jù)的多重水平結(jié)構的混合模型法(即實驗_事件_分離子)。通過比較 似然比檢驗與卡方分布(chi squaredistribution)獲得P-值。7. 3測量的參數(shù)生物量相關的參數(shù)測量植物從播種期至成熟期數(shù)次通過數(shù)字成像室。在每個時間點上,從至少6個不同 角度拍攝每株植物的數(shù)字圖像(2048X 1536像素,1600萬顏色)。植物地上部分面積(或葉生物量)通過計數(shù)來自植物地上部分的數(shù)字圖像上與背 景區(qū)別的像素總數(shù)而確定。這個值對相同時間點上從不同角度拍攝的畫面進行平均化并且 通過校正轉(zhuǎn)化成以平方mm表述的物理表面值(physical surface value) 0實驗顯示以這 種方式測量的地上部分植物面積與地上植物部分的生物量相關。地上部分面積是在植物已 經(jīng)達到其最大葉生物量的時間點處所測量的面積。早期生長勢是萌發(fā)后3周的植物(籽 苗)地上部分面積。根生物量的增加表述為總根生物量的增加(測量為植物壽命期間所觀 察到的根最大生物量);或表述為根/冠比增加(測量為根和苗的活躍生長期間根質(zhì)量與 苗質(zhì)量之間的比例)。早期生長勢通過計數(shù)來自植物地上部分的與背景區(qū)別的像素總數(shù)確定。這個值對 相同時間點上從不同角度拍攝的畫面進行平均化并且通過校正轉(zhuǎn)化成以平方mm表述的物 理表面值。下述結(jié)果是針對萌發(fā)后3周的植物。種子相關的參數(shù)測量值將成熟的原發(fā)花序收獲、計數(shù)、裝袋、加條形碼標記并且隨后在干燥箱內(nèi)于37°C干 燥3日。隨后將所述花序脫粒,并且收集和計數(shù)全部種子。使用吹氣裝置將飽滿粒與空粒 分開。棄去空粒并且再次計數(shù)剩余部分。飽滿粒在分析天平上稱重。通過計數(shù)分離步驟后仍留下的飽滿粒的數(shù)目確定飽滿種子數(shù)。種子總產(chǎn)量通過稱量從一株植物收獲的全部飽滿 粒測量。每株植物的種子總數(shù)通過計數(shù)從一株植物收獲的殼數(shù)測量。千粒重(TKW)從計數(shù) 的飽滿種子數(shù)及它們的總重量外推出來。本發(fā)明中的收獲指數(shù)(HI)定義為種子總產(chǎn)量與 地上部分面積(mm2)之間的比率乘以系數(shù)106。如本發(fā)明中定義的每花序總花數(shù)是種子總 數(shù)與成熟原發(fā)花序數(shù)之間的比率。如本發(fā)明中定義的種子飽滿率是飽滿種子數(shù)對種子(或 小花)總數(shù)的比例(表述為%)。鹽脅迫篩選植物在由椰子纖維和argeX(3 1比率)組成的基質(zhì)上培育。在溫室中移植小植 物后,在頭兩周期間使用正常營養(yǎng)液。在這兩周后,添加25mM鹽(NaCl)至所述營養(yǎng)液,直 至收獲植物。如對正常條件下詳述那樣記錄生長和產(chǎn)量參數(shù)。降低的營養(yǎng)(氮)可利用性篩選在除營養(yǎng)液之外的正常條件下在盆栽土壤中培育來自6個事件(T2種子)的植 物。從移植至成熟期間用含有降低的、通常7至8倍之間更少的氮(N)含量的特定營養(yǎng)液 澆灌所述花缽。培育的其余部分(植物成熟、種子收獲)與不在非生物脅迫下培育的植物 相同。如對正常條件下詳述那樣記錄生長和產(chǎn)量參數(shù)。實施例8 轉(zhuǎn)基因植物的表型評價結(jié)果表達G0S2啟動子下的Orysa_PATL_l (SEQ ID NO 1)核酸,且生長于非脅迫條件溫 室(實施例7)中的轉(zhuǎn)基因稻植物的評測結(jié)果如下所示。至少3%的提高在種子重量(種子 總重量)、飽滿種子數(shù)和植物高度中觀察到(表Dl)。表Dl 用pG0S2::SEQ ID NO 1轉(zhuǎn)化的轉(zhuǎn)基因植物(T2植物)的性狀評測結(jié)果。 生長于非脅迫條件溫室(實施例7)中表達AtPRP38_l (SEQ ID NO 76)核酸的轉(zhuǎn)基 因稻植物的評測結(jié)果如下所示。至少5%的提高在地上部分生物量(AreaMax)、萌發(fā)勢(早 期生長勢)、種子總產(chǎn)量、飽滿種子數(shù)、飽滿率、收獲指數(shù)和每株植物種子數(shù)中觀察到(表 D2)。表D2 用pG0S2: :PRP38轉(zhuǎn)化的轉(zhuǎn)基因植物的性狀評測結(jié)果。 在非脅迫條件下表達SEQ ID NO 128所示GATA樣核酸的轉(zhuǎn)基因稻植物的評測顯 示增加的千粒重(共6個事件,總體增加9.1%,p-值0. 00001)。對于其他產(chǎn)量參數(shù)未觀 察到顯著的變化。在非脅迫條件下表達SEQ ID NO: 177所示GATA樣核酸的轉(zhuǎn)基因稻植物的評測顯 示增加的種子總重量(6個中的4個品系,總體增加16.9%,ρ-{t 0. 00001),以及增加的飽 滿種子數(shù)(6個中的4個品系,總體增加16. 0%,ρ-值0. 00001)。對于其他產(chǎn)量參數(shù)未觀
察到顯著的變化。生長于非脅迫條件溫室(實施例7)中表達pHMG或the pEXP啟動子下的Arath_ ADA2_1 (SEQ ID NO 181)核酸的轉(zhuǎn)基因稻植物的評測結(jié)果如下所示。至少3%的提高在種 子重量(種子總重量)、飽滿種子(飽滿率)、每穗花數(shù)和收獲指數(shù)中觀察到(表D4)。表D4 用 pHMG: :SEQ ID NO :181 和用 pEXP: :SEQ ID NO 181 轉(zhuǎn)化的轉(zhuǎn)基因植物
(Tl植物)的性狀評測結(jié)果。
實施例9 在組成型啟動子控制下,表達編碼SEQ ID NO :216所示的WDR23樣多肽 的核酸序列的轉(zhuǎn)基因稻植物的表型評估結(jié)果在組成型表達G0S2啟動子控制下,表達編碼SEQ ID NO :216所示的WDR23樣多肽 的核酸序列的轉(zhuǎn)基因稻植物Tl和T2世代的評估結(jié)果如下所示。如表D5所示,在Tl和T2世代表型分析中,與對應的敗合(對照)相比,轉(zhuǎn)基因 植物的每株種子總產(chǎn)量、種子飽滿率、飽滿種子數(shù)、收獲指數(shù)和千粒重(TKW)均有顯著的提聞。表D5 在組成型表達G0S2啟動子控制下,表達編碼SEQ ID NO 216所示的WDR23 樣多肽的核酸序列的轉(zhuǎn)基因稻植物Tl和T2世代的評估結(jié)果。 實施例10 在分生組織特異性啟動子控制下,表達編碼SEQ ID NO 216所示的 WDR23樣多肽的核酸序列的轉(zhuǎn)基因稻植物的表型評估結(jié)果在分生組織特異性表達金屬硫蛋白MT啟動子控制下,表達編碼SEQID NO 216所 示的WDR23樣多肽的核酸序列的轉(zhuǎn)基因稻植物Tl和T2世代的評估結(jié)果如下所示。如表E所示,在Tl和T2世代表型分析中,與對應的敗合(對照)相比,轉(zhuǎn)基因植物 的每株種子總產(chǎn)量、種子飽滿率、飽滿種子數(shù)、收獲指數(shù)和千粒重(TKW)均有顯著的提高。表E 在分生組織特異性表達MT啟動子控制下,表達編碼SEQ IDNO 216所示的 WDR23樣多肽的核酸序列的轉(zhuǎn)基因稻植物Tl和T2世代的評估結(jié)果。
權利要求
用于相對于對照植物而言增強植物中產(chǎn)量相關性狀的方法,其包括調(diào)節(jié)植物中編碼選自以下的多肽的核酸的表達,a)PATELLIN多肽,和任選地選擇具有增強的產(chǎn)量相關性狀的植物,或b)PRP38多肽,或c)ADA2多肽,和任選地選擇具有增強的產(chǎn)量相關性狀的植物,或d)GATA樣多肽,其中所述GATA樣多肽屬于GATA轉(zhuǎn)錄因子亞家族II,并包含GATA結(jié)構域,或e)WDR23樣多肽,所述WDR23樣多肽包含下述結(jié)構域,所述結(jié)構域與SEQ ID NO271所示的保守結(jié)構域(CD)具有至少65%、70%、75%、80%、85%、90%、95%、98%、99%或更高氨基酸序列同一性,和任選地選擇具有增強的產(chǎn)量相關性狀的植物。
2.根據(jù)權利要求1的方法,其中所述PATELLIN多肽包含至少一個如下結(jié)構域(i)SEQID NO 71 所示的 SEC14 結(jié)構域Ipeldsvvfyrgadreghpvcynvygefqdkdlyekafgdeekrerflkwriqllergilsqldfspsgics mvqvtdlknsppmlgkhravtrqavallqdnypefiakkvfinvpwwylaankmmspfltqrtkskfifaspaksae tlfryiapeqvpvqfgglfk,或按照遞增的優(yōu)選順序與SEQ ID NO :71所示的結(jié)構域或表A中任意多肽中存在的任 意 SEC14 結(jié)構域具有至少 50%,55%,60%,65%,70%,75%,80%,82%,85%,90%,92%, 95%、97%或更高序列同一性的結(jié)構域;(ii)SEQID NO 72 所示的 GOLD 結(jié)構域sdavteltikpssketveipvtenstigweIrvlgwevsygaeftpdaeggytvivqktrkvpaneepimkgs fkvgepgkivltinnpaskkkkllyrskv,或按照遞增的優(yōu)選順序與SEQ ID NO :72所示的結(jié)構域或表A中任意多肽 中存在的任意 GOLD 結(jié)構域具有至少 50%、55%、60%、65%、70%、75%、80%、82%、85%、 90%、92%、95%、97%或更高序列同一性的結(jié)構域。
3.根據(jù)任一前述權利要求的方法,其中所述調(diào)節(jié)的表達是通過在植物中引入和表達下 述核酸實現(xiàn)a)編碼PATELLIN多肽的核酸,或b)編碼PRP38多肽的核酸,或c)編碼GATA樣多肽的核酸,或d)編碼ADA2多肽的核酸,或e)編碼WDR23樣多肽的核酸。
4.根據(jù)任一前述權利要求的方法,其中所述的編碼PATELLIN多肽、PRP38多肽、ADA2 多肽、GATA樣多肽或WDR23樣多肽的核酸編碼表A中所列出的任一蛋白質(zhì),或是此類核酸 的部分,或是能夠與此類核酸雜交的核酸。
5.根據(jù)任一前述權利要求的方法,其中所述的核酸序列編碼表A中給出的任意蛋白質(zhì) 的直向同源物或旁系同源物。
6.根據(jù)任一前述權利要求的方法,其中所述增強的產(chǎn)量相關性狀包括相對于對照植物 而言的提高的產(chǎn)量、千粒重,優(yōu)選是提高的種子產(chǎn)量。
7.根據(jù)權利要求1-6中任一項的方法,其中所述增強的產(chǎn)量相關性狀在缺氮條件下獲得。
8.根據(jù)任一前述權利要求的方法,其中所述編碼多肽的核酸是植物來源的。
9.根據(jù)任一前述權利要求的方法獲得的植物,或其包括種子的部分,其中所述植物或 其部分包含編碼PATELLIN多肽、PRP38多肽、ADA2多肽、GATA樣多肽或WDR23樣多肽的重組核酸。
10.分離的核酸分子,其包含任一下列特征(i)SEQ ID NO 9 ;SEQ ID NO 11 ;SEQ ID NO 13 ;SEQ ID NO 15 ;SEQ ID NO 17 ;SEQ ID NO 19 ;SEQ ID NO 21 ;SEQ ID NO 23 ;SEQID NO 25 和 SEQ ID NO 27 所示的核酸; ( )與(i)中給出的任一 SEQ ID NO互補的核酸片段;(iii)編碼下述PATELLIN多肽的核酸,所述多肽與SEQID NO 10 ;SEQ ID NO 12 ;SEQ ID NO 14 ;SEQ ID NO 16 ;SEQ ID NO 18 ;SEQID NO 20 ;SEQ ID NO 22 ;SEQ ID NO 24 ; SEQ ID N0:26和SEQ IDNO :28給出的任一氨基酸序列按照遞增的優(yōu)選順序具有至少70%、 75%、80%、85%、90%、95%、96%、97%、98%、99%或更高序列同一性;(iv)能夠在嚴格雜交條件下與上述(i)、(ii)或(iii)給出的任一核酸雜交的核酸。
11.分離的多肽,其包含(i)與 SEQ ID N0:10、SEQ ID N0:12、SEQ ID N0:14、SEQ ID N0:16、SEQ ID NO :18、 SEQ ID NO 20,SEQ ID NO :22、SEQ ID NO :24、SEQ ID NO :26 禾口 SEQ ID N0:28 給出的任一 氨基酸序列按照遞增的優(yōu)選順序具有至少80%、85%、90%、95%、96%、97%、98%、99%或 100%序列同一性的氨基酸序列;(i)中給出的任意氨基酸序列的衍生物。
12.構建體,其包含⑴編碼如權利要求1、2或11中定義的PATELLIN多肽、PRP38多肽、ADA2多肽、GATA 樣多肽或WDR23樣多肽的核酸,或根據(jù)權利要求11的核酸;( )能夠驅(qū)動(a)的核酸序列表達的一個或多個調(diào)控序列;和任選地 (iii)轉(zhuǎn)錄終止序列。
13.根據(jù)權利要求12或13的構建體在用于制備植物的方法中的用途,所述植物相對于 對照植物而言具有提高的產(chǎn)量,尤其是提高的生物量和/或提高的種子產(chǎn)量。
14.用根據(jù)權利要求12或13的構建體轉(zhuǎn)化的植物、植物部分或植物細胞。
15.用于產(chǎn)生相對于對照植物而言具有提高的產(chǎn)量,優(yōu)選提高的種子產(chǎn)量的轉(zhuǎn)基因植 物的方法,其包括(i)在植物中引入并表達編碼如權利要求1、2或12中定義的PATELLIN多肽、PRP38多 肽、ADA2多肽、GATA樣多肽或WDR23樣多肽的核酸,或根據(jù)權利要求11的核酸;和 ( )在促進植物生長和發(fā)育的條件下培育所述植物細胞;和任選地 (iii)選擇具有增強的產(chǎn)量相關性狀的植物。
16.轉(zhuǎn)基因植物,其相對于對照植物而言,具有因下述核酸調(diào)節(jié)的表達所引起的提高的 產(chǎn)量,尤其是增提高的種子產(chǎn)量,所述核酸編碼權利要求1或2中定義的編碼PATELLIN多 肽、PRP38多肽、ADA2多肽、GATA樣多肽或WDR23樣多肽,或者從所述轉(zhuǎn)基因植物衍生的轉(zhuǎn) 基因植物細胞。
17.根據(jù)權利要求11、14或16的轉(zhuǎn)基因植物,或從其衍生的轉(zhuǎn)基因植物細胞,其中所述的植物是作物植物或單子葉植物或谷物植物,如稻、玉米、小麥、大麥、稷、黑麥、小黑麥、高 粱和燕麥。
18.根據(jù)權利要求17的植物的可收獲部分,其中所述可收獲部分優(yōu)選是枝條生物量和/或種子。
19.產(chǎn)物,其衍生自根據(jù)權利要求17的植物和/或根據(jù)權利要求18的植物的可收獲部分。
20.編碼下述多肽的核酸在植物中相對于對照植物而言,提高產(chǎn)量,尤其是提高種子產(chǎn) 量和/或枝條生物量中的用途,所述多肽是PATELLIN多肽、PRP38多肽、ADA2多肽、GATA樣 多肽或WDR23樣多肽。
全文摘要
本發(fā)明涉及用于通過調(diào)節(jié)植物中編碼PATL(PATELLIN)多肽,或PRP38(RNA加工因子前體38),或ADA2(轉(zhuǎn)錄銜接頭2)多肽的表達而增強植物產(chǎn)量相關性狀的方法。本發(fā)明也涉及用于通過調(diào)節(jié)植物中GATA樣多肽的核酸的表達而提高千粒重、種子總重量和/或飽滿種子數(shù)的方法。本發(fā)明也涉及用于通過增加植物中編碼WD40重復(WDR)23樣多肽的核酸的表達而增強多種植物產(chǎn)量相關性狀的方法。本發(fā)明也提供了在本發(fā)明方法中有用的迄今未知的PATL核酸和構建體。
文檔編號C12N15/82GK101883783SQ200880118749
公開日2010年11月10日 申請日期2008年11月26日 優(yōu)先權日2007年11月26日
發(fā)明者A·I·桑茲莫林納羅, C·勒佐, J·M·穆萊特薩洛爾特, R·S·薩洛姆, V·弗蘭卡德 申請人:巴斯夫植物科學有限公司