具有增强的产量相关性状的植物及其制备方法

文档序号:571189阅读:555来源:国知局
专利名称:具有增强的产量相关性状的植物及其制备方法
具有增强的产量相关性状的植物及其制备方法本发明总体上涉及分子生物学领域并涉及用于通过调节植物中编码 PATL (PATELLIN)多肽或PRP38 (RNA加工因子前体38)或GATA样多肽或ADA2 (转录衔接头 2)多肽或WDR23样多肽的核酸的表达而增强植物产量相关性状的方法。本发明也涉及具有 编码PATL多肽或PRP38或GATA样或ADA2多肽或WDR23样的核酸的受调节表达的植物,所 述植物相对于对应野生型植物或其他对照植物具有增强的产量相关性状。本发明也提供了 在本发明方法中有用的迄今未知的PATL或PRP38或GATA样或ADA2或DR23样核酸和构建 体。 在一个实施方案中,本发明还涉及用于通过调节编码GATA样多肽的核酸在植物 中的表达来改善植物生长特征的方法。本发明还涉及具有编码GATA样多肽的核酸的受 调节的表达的植物,所述植物相对于对应的野生型植物或其他对照植物具有改善的生长特 征。本发明也提供了在本发明方法中有用的构建体。在另一个实施方案中,本发明还涉及用于通过增加编码WD40重复(WDR) 23样多肽 的核酸序列在植物中的表达来增强各种植物产量相关性状的方法。本发明还涉及具有编码 WD 23样多肽的核酸的增加的表达的植物,所述植物相对于对照植物具有增强的产量相关 性状。此外,本发明涉及编码具有上述植物产量增加活性的上述多肽的特定核酸序列、包含 所述核酸序列的核酸构建体、载体和植物。持续增长的世界人口和农业用可耕地供应萎缩刺激了有关提高农业效率的研究。 常规的作物及园艺学改良手段利用选择育种技术以鉴定具有受欢迎特征的植物。然而,此 类选择育种技术具有几个缺陷,即这些技术一般耗费很多劳动并且产生这样的植物,其经 常含有异源的遗传组分,其可能不总导致受欢迎性状从亲代植物传递下去。分子生物学进 展已经允许人类改良动物及植物的种质。植物的遗传工程使得可以分离和操作遗传物质 (一般处于DNA或RNA形式)并且随后导入该遗传物质至植物中。此类技术具有产生具备 多种经济学、农学或园艺学改良性状的作物或植物的能力。具有特殊经济意义的性状是提高的产量。产量通常定义为来自作物的经济价值的 可测量结果。该结果可以就数量和/或品质方面进行定义。产量直接取决于几个因素,例 如器官的数目和大小、植物构造(例如枝的数目)、种子产生、叶衰老等。根发育、养分摄入、 胁迫耐受性和早期生长势(early vigor)也可以是决定产量的重要因素。优化前述因素因 而可以有助于提高作物产量。种子产量是特别重要的性状,因为许多植物的种子对人和动物营养是重要的。作 物如谷物、稻、小麦、卡诺拉油菜和大豆占超过一半的人类总热量摄入,无论通过直接消费 种子本身或通过消费基于加工的种子而产生的肉产品。作物也是糖、油及工业加工中所用 许多类型代谢物的来源。种子含有胚(新枝条(Shoot)和新根的起源)和胚乳(萌发期间 和籽苗早期生长期间用于胚生长的养分来源)。种子发育涉及多种基因并且需要代谢物从 根、叶和茎转移至正在生长的种子中。胚乳尤其同化糖类、油和蛋白质的代谢前体并且将它 们合成为贮藏大分子以灌满籽粒。植物生物量是饲料作物如苜蓿、饲用谷物和干草的产量。产量的许多代用物已经用于谷物作物。它们当中主要是对植物尺寸的估计。植物尺寸可以根据物种和发育阶段以多种方式测量,不过包括总植物干重、地上部分干重、地上部分鲜重、叶面积、茎体积、植物 高度、莲座丛直径、叶长度、根长度、根质量、分蘖数和叶数。许多物种维持在给定发育阶段 上植物不同部分的尺寸之间的保守比率。这些异速增长关系用来从这些尺寸量值之一外推 至另一种尺寸量值(例如 Tittonell 等,2005Agric Ecosys & Environ 105:213)。在发育 早期的植物尺寸一般与发育中稍后的植物尺寸相关。具有较大叶面积的较大植物通常可以 比较小的植物吸收更多光线和二氧化碳并且因而可能会在相同的时段期间获得更大重量 (Fasoula和Tollenaar 2005 Maydica 50:39)。此外,这也是植物应当初始实现较大尺寸 的微环境优势或遗传优势的潜在延续。存在针对植物尺寸和生长速率的强遗传组分(例如 ter Steege等,2005 PlantPhysiology 139 1078),并且因而对于一系列各异遗传表型,在 一种环境条件下的植物尺寸很可能关联于另一种环境条件下的尺寸(Hittalmani等,2003 Theoretical AppliedGenetics 107:679)。以这种方式,使用标准环境作为作物在田间于 不同位置及时间所遭遇的多样且动态环境的代用物。对于许多作物的另一个重要性状是早期生长势。改善早期生长势是现代稻育种计 划在温带和热带稻品种方面的重要目标。长根对于水栽稻中正确土壤固定是重要的。在稻 直接播种至被淹没田地的情况下,以及在植物必须从水中迅速萌发的情况下,较长的枝条 与生长势相关。在实施条播的情况下,较长的中胚轴和胚芽鞘对良好出苗是重要的。将早 期生长势人工改造到植物内的能力在农业中将是极重要的。例如,不良的早期生长势已经 限制了基于玉米带种质(Corn Belt germplasm)在欧洲大西洋地区引种玉米(Zea mayes L.)杂种。收获指数即种子产量对地上部分干重的比率在许多环境条件下是相对稳定的并 且因而可以经常获得植物尺寸与谷物产量之间的强相关(例如Rebetzke等,2002 Crop Science 42:739)。这些过程是内在联系的,因为谷物生物量的主要部分取决于植物叶和 莲的现有和储备光合生产率(Gardener等,1985 Physiology of Crop Plants. Iowa State UniversityPress,第68-73页)。因此,选择植物尺寸(甚至在发育的早期)已经用作未来 潜在产能的指示物(例如 Tittonell 等,2005 Agric Ecosys & Environl05 :213)。当检验 遗传差异对胁迫耐受性的影响时,使土壤属性、温度、水和养分有效性和光强度标准化的能 力是温室或植物生长室环境与田间相比的固有优势。然而,产量因不良授粉所致的人为限 制可能限制这些受控环境检验产量差异的用途,其中所述的不良授粉因缺少风和昆虫或成 熟根或根冠生长的足够空间引起。因此,在标准化条件下在生长室或温室测量发育早期的 植物尺寸是提供潜在遗传产量优势指示的标准操作。另一个重要性状是改良的非生物性胁迫耐受性。非生物性胁迫是世界范围作物 损失的主要原因,对于大多数主要作物植物而言平均产量降低超过50% (Wang等,(2003) Planta 218:1_14)。非生物性胁迫可以由干旱、盐度、极端温度、化学毒性养分、(大分子和 /或微量元素)过量或匮乏、辐射和氧化胁迫引起。提高植物的非生物性胁迫耐受性能力将 在世界范围对农民是巨大的经济优势并且将允许在不利条件期间及在本来不可能栽培作 物的陆地上栽培作物。因而可以通过优化前述因素之一提高作物产量。取决于最终用途,对某些产量性状的改良可能优先于其它产量性状。例如对于应用如饲料或木材生产或生物燃料资源而言,增加植物营养体部分可能是希望的,而对于应用如面粉、淀粉或油生产而言,种子参数提高可能是特别希望的。即便在种子参数当中,某 些参数可以更优先于其它参数,这取决于用途。多种机制可以有助于提高种子产量,无论其 形式为提高的种子尺寸或提高的种子数目。增强植物中产量相关性状(种子产量和/或生物量)的一种方法可以是通过调节 植物的内在生长机制如细胞周期或参与植物生长或参与防御机制的多种信号传导途径。现在已经发现可以通过调节植物中编码PATL(Patellin)多肽或PRP38 (RNA加工 因子前体38)或ADA2(转录衔接头2)多肽或WD40重复(WDR) 23样多肽的核酸的表达而增 强植物中多种产量相关性状又发现可通过调节植物中编码GATA样(目的蛋白)的核酸表达而改善多种生长 特征。增强的产量相关性状包含以下一项或多项提高的每株植物种子总产量、提高的 种子饱满率、提高的种子充数量、提高的收获指数或提高的千粒重。脂类(lipids)是在非极性溶剂(如氯仿或醚)中可溶的物质。脂类是活生物体 中的必需成分。如糖脂、磷脂和胆固醇的脂类是细胞膜的关键结构成分,而甘油三酯是生物 能源分子。磷脂酰肌醇(PtdIns)和磷脂酰胆碱(PtdCho)是磷脂的实例。脂类和蛋白质间 的相互作用在将涉及多种过程(如细胞信号发放和细胞增殖)的蛋白质和糖脂靶向至特 定的膜和细胞内部位中起作用。多种蛋白质与脂类的生物合成、转运和吸收相关。此外, 涉及信号转导和蛋白质导向的关键蛋白质具有翻译后附加至其的脂类衍生基团(Stryer, L. (1995)Biochemistry, W. H. Freeman 和 Co.,New York N. Y.,第 264-267 页,934)。磷脂酰肌醇/磷脂酰胆碱转移蛋白质(PIPT)是通过促进在真核细胞的不同 膜区室中转移,而涉及PtdIns和PtdCho代谢协调的遍在蛋白质。在酵母中,主要的 PIPT是SEC14蛋白质,它是从高尔基体外侧网络分泌必需的(Bankatis等,1989,J. Cell Biol. 108:1271-81)。在植物和其他高等生物中发现了类似的蛋白质。在植物中,几种 SEC14同源物已被描述为与酿酒酵母(S. cereviSiae)SEC14蛋白质具有约25%的氨基酸序 列相似性,在一些情况下,已通过secl4-l温度敏感型酵母突变体的互补在实验上验证了 假定的Ptdlns/PtdCho转移功能(Jouarmic等,1998)。据报道,植物SEC14蛋白质在多种 生物学过程中发挥作用,如胞质分裂、高渗胁迫诱导的信号发放途径、多种膜间的小泡运输 或结瘤作用期间的膜生物发生(Allen-Baume 等,2002 ;FEBsLetters 531 74-80 ;Peterman 等,2004.Plant Phys. 136:3080_3094 ;Monks 2001,Plant Cell 13:1205_19 ;Kapranov 等,2001 Plant Celll3 :1369_1382)。在拟南芥(Arabidopsisthaliana)中,已报道 Patellinl (PATLl)蛋白质(SEC14 同源物蛋白质家族成员)在胞质分裂期间定位至细胞板和显示具有PtdIns结合活性。 PATLl是拟南芥中六种蛋白质的小家族的成员,其特征在于存在SEC14和GOLD (高尔基体动 力学)结构域这两种保守结构域。SEC14结构域见于酵母的SEC14蛋白质和见于RhoGAP、RhoGEF和asGAP、神经纤维 瘤蛋白(NFl)。该结构域还见于多种可以作为视觉周期功能成分的视黄醛/维甲醛结合蛋 白质的C端,和Trio蛋白质中,Trio蛋白质是整合和放大涉及肌动蛋白重建的信号的多功 能因子。SEC14有时称为CRAL_TRI0结构域。SEC14结构域涉及脂类结合(Sha和Luo. 1999.,Biochim Biophys Acta. 1441 :268_77)。GOLD结构域是见于几种真核高尔基体和脂类运输蛋白质的蛋白质组件。其长度一 般在90-150氨基酸之间。在GOLD结构域超家族中观察到的大部分大小差异可追踪至见于 该结构域的一些版本中的单个巨大的低复杂性插入片段。GOLD结构域存在于可与膜相互作 用,或在多种蛋白质与细胞骨架丝的相互作用中有作用的蛋白质中,如动物SEC14蛋白质 或酵母氧固醇(oxysterol)结合蛋白质同源物3 (0SH3)。预测GOLD结构域介导多中蛋白 质-蛋白质相互作用(Anantharaman 等,2002. Genome Biol. 3)。专利申请WO 2004/09014描述了涉及胁迫耐性的部分PATL蛋白质。细胞中信使RNA(mRNA)的合成和功能需要包含转录、加工、转运、翻译和降解的一 系列事件。RNA加工指翻译后修饰RNA的事件。在真核生物中,大多数新生前mRNA包含内 含子,内含子的切除导致外显子的精确连接以产生成熟mRNA,成熟mRNA是被核糖体用来翻 译为蛋白质的RNA形式。RNA的转录后修饰还包含影响稳定性和翻译效率的5’端帽化和3’ 端聚腺苷化 。mRNA翻译和周转间的关系对基因表达调节和细胞正确发挥作用很关键。在真 核生物中,数十种蛋白质涉及RNA代谢。这种蛋白质的实例是前mRNA剪接因子PRP38。酵母PRP38是在前mRNA剪接缺陷的酿酒酵母的温度敏感型突变体遗传筛选中鉴 定的(Blanton等,1992,Mol. Cel. Biol. 12,3939-3947)。插入序列从真核前mRNA转录本的 切除发生于细胞核内称为剪接体的巨大的复杂结构上。剪接体通过两个步骤的机制进行内 含子切除,该机制包含(i)内含子上在5’剪接位点切割和连接内含子5’端核苷酸至3’端 附近的腺苷和(ii)在3’剪接位点切割和外显子连接。剪接体的组装通过Ul、l^U4/U6 和TO snRNP(小核糖核蛋白U1-U6)的相继加入来进行。在组装过程后期,U4从剪接体解 离。据信,导致前mRNA分子中内含子切除的剪接的催化事件发生在U4解离之后。在酵母 中,据报道,PRP38对剪接体组装不是必要的,但其是导致剪接体催化激活的构象变化必需 的(Xie 等,(1998) EMBO Journal 17 卷 pp. 2938-2946)。在拟南芥中,依照其与SR蛋白质的序列相似性,PRP38蛋白质(AtPRP38)被称为 SRLl (SR 样 1) (Forment 等,Plant J. 2002 年 6 月;30 (5) :511_9)。但是,PRP38 在结构上 不同于其他SR蛋白质。SR蛋白质一般包含RRM结构域(RNA结合结构域)和RS结构域 (Kalyna 和 Barta Biochem Soc Trans. 2004 32 :561_4·),而 AtPRP38 包含 RS 结构域但缺 少RRM结构域。WO 01/81599描述了用编码几种SR蛋白质的核酸在酵母和植物中改良胁迫耐性 的方法。已发现SRLl及其他在前mRNA剪接中起作用的蛋白质在植物对非生物胁迫的响应 中发挥重要作用(Lee 等,2006Plant Cell. Jul ;18 (7) 1736-49) GATA家族形成真核生物Cys2/Cys2型锌指转录因子(见于如细胞状黏菌、植物、 真菌、线虫、昆虫、棘皮动物、脊椎动物)中的主要家族之一,其包含1个或2个高度保守的 锌指DNA结合结构域。DNA结合的共有序列是CX2CX17_2(ICX2C,并包含由保守的4个半胱氨酸 配位(coordinate)的锌原子(Omichinski等,1993 ;Reyes等,2004)。此结构域之后一般 是碱性区域。其特征性地在GATA识别序列(A/T)GATA(A/G)处结合DNA (Martin和Orkin, 1990 ;Omichinski等,2003)。动物的GATA在第二和第三个半胱氨酸之间一般包含17个残 基,而在真菌中这一数目可以是17-18 (很少是19或20)。植物在第二和第三个半胱氨酸之 间具有18或20个残基。
在人类中,最初的GATAl被鉴定为促进球蛋白基因表达所需的转录因子(Pevny 等,1991)。第一种植物GATA(NTLl)作为粗糙链孢霉(Neurospora crassa)转录因子 NIT2(在氮限制条件中激活氮代谢酶基因表达的蛋白质)的植物同源物分离自烟草。NTLl 在第二和第三个半胱氨酸之间包含18个间隔(CX2CX18CX2C) (Daniel-Vedele和Caboche, 1997)。拟南芥和稻(Oryza sativa)基因组中分别存在29和28个编码假定的GATA转录 因子(CX2CX18sa2ciCX2C)的基因座(Reyes等,2004)拟南芥仅具有带一个GATA结构域的蛋白 质,而稻具有两种包含两个GATA结构域的蛋白质和一种包含三个GATA结构域的蛋白质。稻 转录因子数据库(DRTF,Gao 等,Bioinformatics 2006,22,1286-1287)提出籼稻(Indica) 中有28种GATA,粳稻(Japonica)中有23种GATA。稻和拟南芥中的转录因子GATA家族可 以划分为7个亚家族,这些亚家族中的一些在两个物种中均存在,而其他亚家族是两个物 种之一独有的。GATA-样蛋白质(HAN)在强组成型35S启动子控制下的异位表达严重地影响植物的生存力和发育(Zhao等,Plant Cell 16,2586-2600,2004)。转化的植物矮小,具有异常 形成的叶和较小且畸形的花序。US2007/0250956公开OsGATAll及其对提高种子产量的用途。植物中的转录调节是许多生物学过程的基础,如对环境的适应和代谢和生理平 衡的调节。因此,改变植物中的基因转录可导致植物生长和发育的显著改变。这种特性 可用来改良作物植物的性能。存在数百种控制基因表达的基因,其中只有少数已显示在 调节其在植物中的表达时对农业的目的性状具有有益作用(Vinocur和Altman,2005, CurrentOpinion in Biotechnology 16,123-132 ;Gutterson 禾口 Reuber 2004. Current Opinion in Plant Biology,7,465-471)。为增强产量性状调节基因表达的可用性将有助 于改良作物性能,并最终有利于基于农业的产业。在真核生物中,基因表达与导致启动子变得更易于接近RNA聚合酶II和转录装 置的其他成分的染色质修饰相偶联。两类主要的蛋白质复合物影响染色质动力学。一类 包含ATP依赖的染色质重建器(SWI/SNF相关复合物),第二类包含修饰组蛋白蛋白质的复 合物。一种这类组蛋白修饰由组蛋白乙酰转移酶(HAT)介导,可通过存在于核心组蛋白N 端中的特定赖氨酸残基乙酰化(Narlikar等,2002 Cell 108,475-487)。作为转录辅激活 物起作用的原型组蛋白乙酰转移酶之一称为Gcn5。在酵母中,Gcn5形成已知包含如ADA、 SAGA、SALSA和SLIK的衔接头蛋白质的不同蛋白质复合物[18-20]。已在包括植物的高等 真核生物中鉴定了同源复合物。在拟南芥中,已描述了两种编码ADA2蛋白质的旁系同源基 因(Stockinger 等,2001 Nucleic acid research 29,1524-1533)。通用转录因子募集RNA聚合酶II至启动子的TATA框,而转录激活因子结合至称 为上游激活位点(UAS)的特定DNA序列。通用转录因子可直接或通过衔接头蛋白质与转 录激活因子相互作用。虽然也已经描述了通过DNA结合结构域的相互作用,但衔接头蛋白 质一般通过激活结构域与转录激活因子相互作用(Mao等,2006. Biochimica etBiophysica Acta 1759 69-79)。在拟南芥中,据报道ADA2蛋白质增强GCN5在体外乙酰化组蛋白的能力和调节 GCN5的底物特异性。此外,GCN5可在植物同源物独有而真菌和动物同源物缺乏的基序处乙 酰化ADA2蛋白质(Mao等,2006)。已发现ADA2b和GCN5中的T-DNA插入突变对植物的生长和发育具有多效性,包含矮小的尺寸、异常的根发育和花内短的花瓣和雄蕊(Vlachonasios 等,2003The Plant Cell,15卷,626-638)。还已经公开了来自其他植物物种的编码转录衔 接头蛋白质的基因(W00003026)。许多不同细胞过程的调节需要蛋白质相互作用结构域进行多肽彼此间结合,和与 磷脂、小分子或核酸结合的用途。一种这类蛋白质相互作用结构域称为WD重复(参见综述 Smith等,(1999)TIBS 24:181-185)。包含WD重复的蛋白质大量存在于大部分生物中,例 如,人类(H. sapiens)中超过300种、秀丽隐杆线虫(C. elegans)中超过140种、拟南芥中 超过390种和酿酒酵母中超过90种。虽然通过WD重复(一条多肽中4-16个拷贝之间) 的存在而在结构上相关,但这些蛋白质具有极多样的功能。通过Gly-His (GH) 二肽N端距Trp-Asp (WD) 二肽(位于基序的C端)10-20个残 基,长度一般为大约40 (但至多60)个残基(因此称为“WD40”),在一级结构上粗略地定义 WD重复。但是,GH 二肽和WD 二肽都不是绝对保守。GH和WD之间是保守的核心序列,其可 以用可从例如在英国的European Bioinformatics Institute(EBI)所拥有的InterPro获 得的算法鉴定。InterPro是蛋白质家族、结构域和功能位点的数据库,其中可将见于已知蛋 白质的可鉴定特征应用于未知蛋白质序列。据预测,WD40蛋白质形成β螺旋桨_样结构(环状重复结构),其包 含三个潜在 的相互作用表面顶部、底部和环状面。这种扩展的表面积允许WD40蛋白质可逆地与数个 蛋白质形成复合物,从而协调涉及数组蛋白质的相继和/或同时相互作用。涉及WD40蛋白质的非常重要的蛋白质复合物中有一类多蛋白质泛素Ε3连接酶, Cullin4(CUL4)和损伤DNA结合蛋白质1 (DDBl)是其核心蛋白质(Higa等,(2007)Cell Division 2 5 ;Angers 等,(2006)Nature 443:590-593 ;Higa 等,(2006)Nature Cell Biol 8(11) :1277-1283 ;He 等,(2006)Genes & Development 20:2949-2954)。这种复合物为底 物募集机制锚定WD40蛋白质作为分子衔接头,底物随后被泛素化和破坏。这些WD蛋白质 形成称为DCAF (DDB1-CUL4A结合因子)的亚类,它们在两个连续的WD40重复末端包含两个 保守的DxR基序(He等(2006)见上)。一种此类WD40蛋白质WDR23 (WD重复巡;也称为DCAFl 1)与见于植物的WD40蛋 白质具有显著的一级序列同一性。最先在紫草(Lithospermum erythrorhizon)中将这种 WD40蛋白质鉴定为克隆14B(LEC14B ;NCBI检索号D83074)。在专利申请W02002/016655中,SEQ ID NO :2577涉及编码WDR23-样多肽的拟南 芥核酸序列,描述了用SEQ ID NO =I-SEQ IDNO :5379中的任意一个或多个来鉴定植物细胞 已暴露过的胁迫条件的方法。在美国专利申请US2004/034888中,SEQ ID N0:13,294涉及 编码WDR23-样多肽的拟南芥核酸序列,描述了用SEQ ID NO =I-SEQ IDNO :36,564中的任意 一个或多个来产生具有改良特性的植物的方法。令人惊奇地,现已发现调节编码PRP38多肽的核酸的表达使植物具有增强的(或 改良的)产量相关性状,尤其是相对于对照植物的提高的产量,也在除由盐、干旱、寒冷或 冰冻引起的渗透胁迫的条件中。还令人惊奇地,现已发现调节(优选提高)编码GATA-样多肽的核酸的表达使植 物相对于对照植物具有显著提高的千粒重(TKW),而如种子数(饱满种子或总种子数)的其 他种子产量参数未显著提高。
此外,令人惊奇地,现已发现调节编码ADA2多肽的核酸的表达使植物相对于对照 植物具有增强的产量相关性状,尤其是提高的产量。还令人惊奇地,现已发现提高编码如本文定义的WDR23-样多肽的核酸序列的表 达使植物相对于对照植物具有提高的产量相关性状。此外,令人惊奇地,现已发现调节编码PATL多肽的核酸的表达使植物相对于对照 植物具有增强的产量相关性状,尤其是提高的产量。根据本发明的一个实施方案,提供了相对于对照植物在植物中改良(或增强)产 量相关性状的方法,其包括调节编码PATL多肽、或PRP38、或ADA2多肽的核酸在植物中的表 达。根据另一个实施方案,提供了相对于对照植物提高千粒重(TKW)的方法,其包括 调节(优选提高)编码GATA-样多肽的核酸在植物中的表达。根据另一个实施方案,提供了相对于对照植物在植物中增强产量相关性状的方 法,其包括提高编码如本文定义的WDR23-样多肽的核酸序列在植物中的表达。提高的产量 相关性状包含以下一种或多种提高的每株植物的 种子总产量、提高的种子饱满率、提高的 饱满种子数、提高的收获指数或提高的千粒重。定义多肽/蛋白质术语“多肽”和“蛋白质”在本文中可相互交换地使用并且指由肽键连接起来的任 意长度聚合物形式的氨基酸。多核苷酸/核酸/核酸序列/核苷酸序列术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”、“核酸分子”在本文中可相 互交换地使用并且指任意长度的聚合非分支形式的核苷酸,即核糖核苷酸或脱氧核糖核苷 酸或这二者的组合。对照植物选择合适的对照植物是实验设计的例行部分并且可以包括相应的野生型植物或 无目的基因的相应植物。对照植物一般是相同的植物物种或甚至是与待评估植物相同的品 种。对照植物也可以是待评估植物的失效合子。失效合子是因分离而丢失转基因的个体。 如本文中所用的“对照植物”不仅指完整植物,也指植物部分,包括种子和种子部分。同源物蛋白质的“同源物”包括这样的肽、寡肽、多肽、蛋白质和酶,它们相对于非修饰的 所讨论蛋白质具有氨基酸取代、缺失和/或插入并且与衍生它们的非修饰蛋白质具有相似 的生物学活性和功能活性。缺失指从蛋白质中移除一个或多个氨基酸。插入指一个或多个氨基酸残基被导入蛋白质中的预定位点。插入可以包含氨基端 融合和/或羧基端融合以及序列内插入单个或多个氨基酸。通常,在氨基酸序列内部的插 入物比氨基端融合物或羧基端融合物小约1至10个残基级别。氨基端或羧基端融合蛋白 或融合肽的例子包括如酵母双杂交系统中所用的转录激活物的结合结构域或激活结构域、 噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶-标签、蛋白A、麦芽糖结合蛋白、 二氢叶酸还原酶、Tag · 100表位、c-myc表位、FLAG -表位、lacZ、CMP (钙调蛋白结合肽)、HA表位、蛋白C表位和VSV表位。取代指以具有相似特性(如相似的疏水性、亲水性、抗原性、形成或破坏α -螺旋 结构或折叠结构的倾向性)的其他氨基酸替代蛋白质的氨基酸。氨基酸取代一般是单 个残基的,但是根据给予多肽的功能性约束条件,可以是簇集的;插入通常是约1至10个 氨基酸残基级别。氨基酸取代优选地是保守性氨基酸取代。保守性取代表是本领域熟知的 (见例如 Creighton (1984) Proteins. W. H. Freeman 禾口 Company (编)禾口下表 1)。表1 保守性氨基酸取代的例子 氨基酸取代、缺失和/或插入可以使用本领域熟知的肽合成技术如固相肽合成法 等或通过重组DNA操作轻易地进行。用于操作DNA序列以产生蛋白质的取代、插入或缺 失变体的方法是本领域熟知的。例如,用于在DNA的预定位点处产生取代突变的技术是 本领域技术人员熟知的并且包括M13诱变法、T7-Gen体外诱变法(USB,Cleveland, OH)、 QuickChange位点定向诱变法(Stratagene,San Diego, CA)、PCR介导的位点定向诱变或其 他位点定向诱变法。衍生物“衍生物”包括这样的肽、寡肽、多肽,其中与天然存在形式蛋白质(如Patellin或 RNA加工因子前体38或GATA样多肽或衔接头2或WDR23样多肽)的氨基酸序列相比较, 它们包含非天然存在氨基酸残基对氨基酸的取代或非天然存在氨基酸残基的添加。蛋白质 的“衍生物”也包括这样的肽、寡肽、多肽,其中与所述多肽的天然存在形式的氨基酸序列相 比,它们包含天然存在的改变(糖基化、酰化、异戊二烯化、磷酸化、肉豆蔻酰化、硫酸化等) 的氨基酸残基或非天然存在的改变的氨基酸残基。与衍生出衍生物的氨基酸序列相比较,该衍生物可以也包含与所述氨基酸序列共价或非共价结合的一个或多个非氨基酸取代基 或添加物(例如报道分子或其他配体),如所结合旨在促进检测该衍生物的报道分子,和相 对于天然存在蛋白质的氨基酸序列而言,包含非天然存在的氨基酸残基。此外,“衍生物”也 包括天然存在形式的蛋白质与标签肽如FLAG、HIS6或硫氧还蛋白(对标签肽的综述,参见 Terpe, Appl. Microbiol. Biotechnol. 60,523-533,2003)的融合物。直向同源物/旁系同源物直向同源物和旁系同源物包括用来描述基因祖先关系的进化概念。旁系同源物是 相同物种内因祖先基因复制而起源的基因;直向同源物是来自不同生物的因物种形成而起 源的基因,并且也衍生于共同的祖先基因。结构域术语“结构域”指在进化相关性蛋白质的序列比对结果上的特定位置处保守的一 组氨基酸。尽管在其他位置处的氨基酸可以在同源物之间不同,然而在特定位置处高度保 守的氨基酸指示在蛋白质结构、稳定性或功能方面很可能是必需的氨基酸。结构域因其在 蛋白质同源物家族的比对序列中高程度保守而鉴定,故它们可以用作鉴定物来确定所讨论 的任意多肽是否属于先前已鉴定的多肽家族。基序/共有序列/标签术语“基序”或“共有序列,,或“标签”指在进化相关蛋白质的序列中的短保守区 域。基序往往是结构域的高度保守部分,但是也可以仅包括该结构域的部分,或可以位于保 守结构域之外(若该基序的全部氨基酸位于定义的结构域之外)。杂交如本文中所定义的术语“杂交”是其中基本上同源的互补核苷酸序列相互复性的 过程。杂交过程可以完全在溶液中进行,即两种互补性核酸均处在溶液中。杂交过程也可 以用固定至基质如磁珠、琼脂糖凝胶(Si5Pharose)珠或任何其他树脂的互补性核酸之一进 行。杂交过程也可以用固定至固体支持物如硝酸纤维素膜或尼龙膜上或通过例如照相平版 印刷术固定至例如硅玻璃支持物(后者称作核酸阵列或微阵列或称作核酸芯片)的互补性 核酸之一进行。为使杂交发生,核酸分子通常被热变性或化学变性,以将双链解链成两条单 链和/或去除来自单链核酸的发夹或其他二级结构。术语“严格性”指杂交发生的条件。杂交的严格性受诸条件如温度、盐浓度、离子 强度和杂交缓冲液组成的影响。通常,将低严格条件选择成在定义的离子强度和PH处,低 于特定序列的热解链温度(Tm)约30°C。中等严格条件是当所述温度在Tm以下20°C时,并 且高严格条件是当所述温度在Tm以下10°C时。高严格杂交条件一般用于分离与靶核酸序 列具有高序列相似性的杂交序列。然而,核酸可以在序列上偏离且依旧编码基本上相同的 多肽,原因是遗传密码的简并性。因而,有时候可能需要中等严格杂交条件以鉴定此类核酸 分子。Tm是在定义的离子强度和pH处的下述温度,其中50%的靶序列在所述温度与完 全匹配的探针杂交。取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在更高 温度上特异性杂交。最大杂交速率从低于1约16°C直至32°C获得。杂交溶液中一价阳离 子的存在降低了两条核酸链之间的静电排斥作用,因而促进杂交体形成;这种作用对于直 到0. 4M的钠浓度是显而易见的(对于更高的浓度而言,可以忽略这种作用)。甲酰胺降低DNA-DNA和DNA-RNA双链体的解链温度,每百分数的甲酰胺降低0. 6至0. 7°C,且添加50% 甲酰胺允许在30至45°C杂交,尽管杂交速率会降低。碱基对错配降低杂交速率和双链体的 热稳定性。平均且对于大的探针而言,Tm下降约rc/每^碱基错配。根据杂交体的类型, Tm可以使用以下等式计算1)DNA-DNA 杂交体(Meinkoth 和 Wahl,Anal. Biochem.,138 :267_284,1984)Tm = 81. 5"C +16. 6 X Iog10 [Na+] a+0. 41X % [G/Cb]-500 X LT1-O. 61 X % 甲酰胺2) DNA-RNA 杂交体或 RNA-RNA 杂交体Tm = 79. 8+18. 5 (loglO [Na+]a) +0. 58(% G/Cb)+ll. 8(% G/Cb) 2_820/Lc3)寡DNA杂交体或寡RNAd杂交体对少于20个核苷酸而言Tm = 2 (In)对20-35 个核苷酸而言Tm = 22+1. 46 (In)a或者用于其他一价阳离子,但是仅在0. 01-0. 4M范围内是精确的。b仅对30 % -75 %范围内的% GC是精确的。cL =双链体的碱基对长度。dOligo,寡核苷酸;In,=引物的有效长度=2 X (G/C数)+ (A/T数)。可以使用许多已知技术中任意一种技术控制非特异性结合,例如将膜以含有蛋白 质的溶液封闭、添加异源RNA、异源DNA和SDS至杂交缓冲液,并且用RNA酶处理。对于非 同源性探针,可以通过变换以下条件之一 (i)渐进地降低复性温度(例如从68°C至42°C) 或(ii)渐进地降低甲酰胺浓度(例如从50%至0%)进行一系列杂交。技术人员了解可 以在杂交期间变更并且会维持或改变所述严格条件的多个参数。除了杂交条件之外,杂交特异性一般还取决于杂交后洗液的功能。为除去因非特 异性杂交引起的背景,用稀释的盐溶液洗涤样品。此类洗液的关键因素包括最终洗涤溶液 的离子强度和温度盐浓度越低且洗涤温度越高,则洗涤的严格性越高。洗涤条件一般在 杂交严格性上或低于所述杂交严格性进行。阳性杂交产生至少两倍于背景信号的信号。通 常,用于核酸杂交测定法或基因扩增检测方法的适宜严格条件如上所述。也可以选择严格 性更高或更低的条件。技术人员了解可以在洗涤期间变更并且会维持或改变所述严格条件 的多个参数。例如,用于长度大于50个核苷酸的DNA杂交体的典型高严格杂交条件包括在65°C 于IXSSC中或在42°C于IXSSC和50%甲酰胺中杂交,随后在65°C于0. 3XSSC中洗涤。 用于长度大于50个核苷酸的DNA杂交体的中等严格杂交条件的例子包括在50°C于4X SSC 或在401于6\55(和50%甲酰胺中杂交,随后在50°C于2XSSC中洗涤。杂交体的长度是 杂交核酸的预期长度。当序列已知的核酸杂交时,可以通过比对序列并鉴定本文中所述的 保守区而确定杂交体长度。IXSSC是0. 15MNaCl和15mM柠檬酸钠;杂交溶液和洗涤溶液可 以额外地包括5XDenhardt试剂、0. 5-1. 0% SDSUOOy g/ml变性的片段化鲑精DNA,0. 5% 焦磷酸钠。出于定义严格性水平的目的,可以参考Sambrook等(2001)Molecular Cloning :a laboratory manual,第三版,Cold Spring HarborLaboratory Press, CSH, New York 或参 考Current Protocols inMolecular Biology, John Wiley & Sons,N.Y. (1989禾口年度更新 版)。
剪接变体如本文中所用的术语“剪接变体”包括其中已经切除、取代、置换或添加所选内含 子和/或外显子或其中已经缩短或加长内含子的核酸序列的变体。此类变体将是基本上保 留蛋白质的生物学活性的一类变体;这可以通过选择性保留蛋白质的功能片段实现。此类 剪接变体可以在自然界中找到或可以人工制备。用于预测和分离此类剪接变体的方法是本 领域熟知的(见例如 Foissac 和 Schiex(2005)BMC Bioinformatics. 6 25)。等位变体等位基因或等位变体是给定基因位于相同染色体位置处的备选形式。等位变体包 含单核苷酸多态性(SNP)和小的插入/缺失多态性(INDEL)。INDEL的大小通常小于lOObp。 SNP和INDEL形成大部分生物的天然存在多态性株系中的序列变体的最大集合。基因改组/定向进化基因改组或定向进化由反复DNA改组,随后适当筛选和/或选择以产生编码具 有改良生物学活性的蛋白质的核酸或其部分的变体而组成(Castle等,(2004)Science 304(5674) 1151-4 ;美国专利 5,811,238 和 6,395,547)。调节元件/调控序列/启动子术语“调节元件”、“调控序列”和“启动子”均在本文中可相互交换地使用并且在广 泛含义上意指能够实现与它们相连接的序列表达的调节性核酸序列。术语“启动子”一般指 位于基因转录起点上游并参与识别和结合RNA聚合酶和其他蛋白质,因而指导有效链接的 核酸转录的核酸调控序列。前述术语包括从经典真核基因组基因(包括对于精确转录启动 所需的TATA框,具有或没有CCAAT框序列)衍生的转录调节序列和应答发育性刺激和/或 外部刺激或以组织特异性方式而改变基因表达的其它调节元件(即上游激活序列、增强子 和沉默子)。本术语还包括经典原核基因的转录调节序列,在此情况下它可以包括一个-35 框序列和/或一个- ο框转录调节序列。术语“调节元件”也包含赋予、激活或增加核酸分 子在细胞、组织或器官中表达的人工融合分子或衍生物。“植物启动子”包含介导植物细胞中编码序列节段表达的调节元件。因此,植物启 动子不必须是植物来源的,但可以源自病毒或微生物,例如来自侵袭植物细胞的病毒。“植 物启动子”也可以源自植物细胞,例如来自用在本发明方法中待表达并在本文中描述的核 酸序列转化的植物。这也适用于其他“植物”调节信号,如“植物”终止子。在本发明方法 中有用的核苷酸序列上游的启动子可以通过一个或多个核苷酸取代、插入和/或缺失进行 修饰,但不影响启动子、可读框(ORF)或3’调节区如终止子或远离ORF存在的其他3’调节 区的功能性或活性。还有可能所述启动子的活性因修饰其序列或它们被更活跃的启动子、 甚至来自异源生物的启动子彻底取代而提高。为了在植物中表达,如上所述,核酸分子必须 有效地连接至或包含在正确的时间点并以所需空间表达模式表达基因的合适启动子。为鉴定功能性等同启动子,候选启动子的启动子强度和/或表达模式可以例如通 过将此启动子有效链接至报道基因并分析该报道基因在植物的多种组织中的表达水平和 模式进行分析。合适的熟知报道基因包括例如葡糖醛酸酶或半乳糖苷酶。启动子 活性通过测量葡糖醛酸酶或半乳糖苷酶的酶活性进行分析。启动子强度和/或表 达模式可以随后与参考启动子(如在本发明方法中使用的一种启动子)的启动子强度和/ 或表达模式比较。备选地,启动子强度可以使用本领域已知方法如RNA印迹法及放射自显
15影图的密度计分析法、定量实时?0 或肌- 0 (彻丨(1等,1996661101116 Methods 6 :986_994), 通过量化mRNA水平或通过将本发明方法中所用核酸的mRNA水平与持家基因(如ISSrRNA) 的mRNA水平比较进行分析。通常“弱启动子”意指驱动编码序列在低水平表达的启动子。 “低水平”意指在每个细胞约1/10,000转录物至约1/100,000转录物、至约1/500,0000转 录物的水平上。相反,“强启动子”驱动编码序列在高水平或以每个细胞约1/10转录物至 约1/100转录物、至约1/1000转录物表达。一般而言,“中等强度启动子”意指驱动编码序 列以低于强启动子水平、尤其以在一切情况下低于受35SCaMV启动子控制时所获得水平的 水平表达的启动子。通常,中等强度启动子对核酸表达的驱动比35S CaMV启动子低至少3、 5、10、15、20、25、30、35、40、45、50、60、70、80、90、100 倍。有效连接如本文中所用的术语“有效连接”指启动子序列与目的基因之间的功能连接,从而 该启动子序列能够启动该目的基因转录。组成型启动子“组成型启动子”指在生长和发育的大部分期间但不是必需在全部期间,以及在大 多数环境条件下,在至少一种细胞、组织或器官中有转录活性的启动子。下表2给出组成型 启动子的例子。表2:组成型启动子的例子 遍在启动子遍在启动子是在生物的全部组织或细胞中基本上有活性的。发育调节型启动子发育调节型启动子在某些发育阶段期间或在经历发育变化的植物的部分中有活 性。诱导型启动子诱导型启动子在应答化学刺激(综述见Gatz 1997,Annu. Rev. PlantPhysiol. Plant Mol.Biol. ,48 :89_108)、环境刺激或物理刺激时具有诱导或提高的转录启动作用, 或可以是“胁迫诱导的”,即当植物暴露于多种胁迫条件时其激活,或是“病原体诱导的”,即 当植物暴露于多种病原体时其激活。器官特异性/组织特异性启动子器官特异性或组织特异性启动子是能够偏好地启动某些器官或组织如叶、根、种 子组织等中转录的启动子。例如,“根特异性启动子”是这样的启动子,该启动子优势地在植 物根中具有转录活性,基本上在植物的任何其他部分中无活性,尽管在该植物的这些其他 部分中仍允许任意泄露表达。能够仅在某些细胞中启动转录的启动子在本文中称作“细胞 特异性的”。根特异性启动子的例子列于下表i中。
表i 根特异性启动子的例子 种子特异性启动子是能够在种子组织中优势地具有转录活性的启动子,但无需排 他性地在种子组织中有转录活性(在泄露表达的情况下)。种子特异性启动子可以在种子 发育期间和/或萌发期间有活性。种子特异性启动子的例子在Qing Qu和Takaiwa(Plant Biotechnol. J. 2,113-125,2004)中给出,所述文献的公开内容如完整所述那样通过引用方 式并入本文且示于下表ii。表ii 种子特异性启动子的例子
如本文中所定义的绿色组织特异性启动子是优势地在绿色组织中具有转录活性 的启动子,在植物的任何其它部分内基本上无活性,尽管在该植物的这些其他部分中仍允 许任意泄露表达。可以用来实施本发明方法的绿色组织特异性启动子的例子示于下表iii中。表iii 绿色组织特异性启动子的例子
组织特异性启动子的另一个例子是分生组织特异性启动子,其优势地在分生组织 中具有转录活性,在植物的任何其它部分内基本上无活性,尽管在该植物的这些其他部分 中仍允许任意泄露表达。可以用来实施本发明方法的分生组织特异性启动子的例子示于下 表iv中。表iv 分生组织特异性启动子的例子 终止子 术语“终止子”包括作为转录单元末端处DNA序列的调控序列,所述的DNA序列产 生初级转录物的3’加工和多腺苷酸化及转录终止的信号。终止子可以从天然基因、从多种 其他植物基因或从T-DNA衍生。待添加的终止子可以从例如胭脂碱合酶或章鱼碱合酶基因 或备选地从另一种植物基因或较次优选地从任何其他真核基因衍生。
调节就表达或基因表达而言,术语“调节”意指这样的过程,其中与对照植物相比,表达 水平因该基因表达而改变,所述表达水平提高或降低。原始、未调节的表达可以是结构性 RNA(rRNA.tRNA)或mRNA的任何类型的表达,随后是翻译。术语“调节活性”应当意指本发 明核酸序列或所编码蛋白质的表达的任何改变,这引起植物产量提高和/或生长增加。表达术语“表达”或“基因表达”意指某个特定基因或多个特定基因或特定基因构建体 的转录。术语“表达”或“基因表达”尤其意指某个基因或某些基因或基因构建体转录成结 构性RNA (rRNA.tRNA)或mRNA,所述RNA随后翻译成或不翻译成蛋白质。该过程包括DNA的 转录和所得mRNA产物的加工。增加的表达/过量表达如本文中所用的术语“增加的表达”或“过量表达”意指相对于原有野生型表达水 平为额外的任何形式的表达。在本领域内充分报道了用于提高基因或基因产物表达的方法并且这些方法包括 例如由适宜启动子驱动的过量表达、使用转录增强子或翻译增强子。充当启动子或增强子 元件的分离核酸可以导入多核苷酸的非异源形式的适宜位置(一般在上游)中,从而上调 编码目的多肽的核酸表达。例如,内源性启动子可以在体内通过突变、缺失和/或取代加以 改变(见Kmiec,US 5,565,350 ;Zarling等,W09322443),或可以将分离的启动子以相对于 本发明基因的恰当方向及距离导入植物细胞,从而控制该基因的表达。若需要多肽表达,通常希望的是在多核苷酸编码区的3’末端处包括多腺苷化区 域。该多腺苷酸化区域可以从天然基因、从多种其他植物基因或从T-DNA衍生。待添加的 3’末端序列可以从例如胭脂碱合酶或章鱼碱合酶基因或备选地从另一种植物基因或较不 优选地从任何其他真核基因衍生。内含子序列也可以添加至5’非翻译区(UTR)或部分编码序列的编码序列以提 高细胞质中聚集的成熟信使的量。已经显示在植物和动物表达构建体的转录单位中包 含可剪接内含子提高了 mRNA水平及蛋白质水平上的基因表达高达1000倍(Buchman和 Berg(1988)Mol. Cell biol. 8 :4395_4405 ;Callis等(1987)Gens Dev 1 :1183_1200)。此种 内含子增强基因表达的作用一般在所述内含子置于转录单位的5’末端附近时最强烈。玉米 内含子Adhl-S内含子1、2和6、Bronze-I内含子的用途是本领域已知的。对于总体信息, 见The Maize Handbook,第 116 章,Freeling 和 Walbot 编,Springer,N. Y. (1994)。内源基因本文中对“内源”基因的称谓不仅仅指如植物中以其天然形式(即没有人类任何 干预)存在的所讨论基因,还指处于分离形式下的随后(再)导入植物(转基因)的相同 基因(或基本上同源的核酸/基因)。例如,含有这种转基因的转基因植物可以遭遇转基因 表达的相当大程度地降低和/或内源基因表达的实质降低。分离的基因可以从生物分离或 可以是人造的,例如通过化学合成法。降低的表达本文中提及的“降低的表达”或“降低或基本消除表达”意指内源基因表达和/或 多肽水平和/或多肽活性相对于对照植物的下降。与对照植物相比较,所述降低或基本上消除以增加的优选顺序是至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90% 或 95%、96%、97%、98%、99% 或更多降低。为了降低或基本消除植物中内源基因的表达,需要核酸序列的基本上连续的核苷 酸的足够长度。为进行基因沉默,该长度可以短至20、19、18、17、16、15、14、13、12、11、10个 或更少核苷酸,或者该长度可以长至整个基因(包括部分或完整的5’和/或3’ UTR)。基 本上连续的核苷酸片段可以从编码Patellin或RNA加工因子前体38或Adaptor2或WDR23 样多肽的核酸(靶基因)的任何核酸衍生,或从能够编码Patellin或RNA加工因子前体38 或衔接头2或WDR23样多肽的直向同源物、旁系同源物或同源物的任何核酸衍生。优选地, 基本上连续的核苷酸的片段能够与靶基因(有义链或反义链)形成氢键,更优选地,基本上 连续的核苷酸片段以增加的优选顺序与靶基因(有义链或反义链)具有50%、60%、70%、 80%、85%、90%、95%、96%、97%、98%、99%、100% 的序列同一性。编码(功能性)多肽 的核酸序列不是本文中所讨论用于降低或基本消除内源基因表达的多种方法的前提。用于降低或基本上消除植物中内源基因表达的多种方法的例子,或降低蛋白质的 水平和/或活性的例子是本领域技术人员已知的。例如,本领域技术人员将能够轻易调整 用于沉默的公知方法,从而通过利用合适的启动子在完整植物中或其部分中实现内源基因 表达的降低。可以使用常规工具和技术完成表达的这种降低或基本消除。用于降低或基本消除 内源基因表达的优选方法是在植物中引入并表达基因构建体,其中将核酸(在此情况下, 从目的基因衍生的,或从能够编码Patellin或RNA加工因子前体38或衔接头2或WDR23样 多肽的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸) 克隆至所述基因构建体,(部分或完全地)作为被间隔序列(非编码性DNA)隔开的反向重 复序列。另一用于降低或基本消除内源基因表达的方法是使用核酸序列或其部分(在此 情况下,所述部分是从目的基因衍生的,或从能够编码Patellin或RNA加工因子前体38或 衔接头2或WDR23样多肽的直向同源物、旁系同源物或同源物的任何核酸序列中衍生的一 段基本上连续的核苷酸)的反向重复序列(其优选能够形成发夹结构)进行RNA介导的 沉默。RNA沉默方法的另一个例子包括将核酸序列或其部分(在此情况下是从目的基因衍 生的,或从能够编码Patellin或RNA加工因子前体38或衔接头2或WDR23样多肽的直向 同源物、旁系同源物或同源物的任何核酸序列中衍生的一段基本上连续的核苷酸)以有义 方向导入植物。RNA沉默方法的另一个例子包括使用反义核酸序列。基因沉默也可以通过 插入诱变(例如T-DNA插入或转座子插入)或通过如Angell和Baulcombe ((1999) Plant J. 20(3) 357-62)、(AmpIicon VIGS W098/36083)或 Baulcombe (WO 99/15682)及其他人描 述的策略实现。技术人员熟知其他方法,如使用针对内源性多肽的抗体以抑制该多肽在植 物中的功能,或干扰某多肽参与其中的信号传导途径。人工和/或天然的微RNA(miRNA)可 以用来敲除基因表达和/或mRNA翻译。内源性miRNA是通常19-24个核苷酸长的单链小 RNA。可以专门地遗传工程化一般长度21个核苷酸的人工微RNA(amiRNA)以负向调节单个 或多个目的基因的基因表达。选择植物的微RNA靶的决定因素是本领域熟知的。已经定义 了用于靶识别的经验参数并且可以使用它们辅助特定amiRNA的设计(Schwab等,(2005) Dev Cell 8(4) :517_27)。用于设计并产生amiRNA及其前体的便利工具也是公众可获得的(Schwab 等,(2006)Plant Cel 18(5) :1121_33)。在这种优选的方法中,使用核酸或其部分(在此情况下,所述部分是从目的基因 衍生的,或从能够编码Patellin或RNA加工因子前体38或衔接头2或WDR23样多肽的直 向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)的反向重 复序列(其优选能够形成发夹结构),通过RNA介导的沉默作用降低或基本上消除内源基因 的表达。在包含调控序列的表达载体中克隆该反向重复序列。非编码性DNA核酸序列(间 隔序列,例如基质附着区片段(MAR)、内含子、多接头等)位于形成所述反向重复序列的两 个反向核酸之间。在反向重复序列转录后,形成具有(部分或完全)自我互补性结构的嵌 合RNA。这种双链RNA结构称作发夹RNA (hpRNA)。hpRNA由植物加工成siRNA,该siRNA被 掺入RNA诱导的沉默复合体(RISC)。该RISC进一步切开所述mRNA转录物,从而相当大程 度地降低待翻译成多肽的mRNA转录物的数目。对于其他一般细节,参见例如Grierson等 (1998)W098/53083 ;Waterhouse 等(1999)WO 99/53050。本发明方法的实施不取决于在植物中引入并表达将所述核酸作为反向重复序列 克隆到其中的基因构建体,不过可以使用几种熟知“基因沉默”方法中任何一种或多种方法 来实现相同效果。用于降低内源基因表达的一种这样的方法是RNA介导的基因表达沉默(下调)。 在这种情况下,沉默作用由植物中与内源性靶基因实质相似的双链RNA序列(dsRNA)触发。 这种dsRNA进一步被植物加工成约20个至约26个核苷酸的所谓短干扰RNA (siRNA)。所 述siRNA被掺入RNA诱导的沉默复合体(RISC),其中所述RISC切割内源靶基因的mRNA转 录物,从而相当大程度地将降低待翻译成多肽的mRNA转录物的数目。优选地,所述双链RNA 序列与靶基因对应。RNA沉默方法的另一个例子涉及将核酸序列或其部分(在此情况下是从目的基因 衍生的,或从能够编码Patellin或RNA加工因子前体38或衔接头2的直向同源物、旁系同 源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)以有义方向导入植物。“有 义方向”是指与自身mRNA转录物同源的DNA序列。因而将所述核酸序列的至少一个拷贝导 入植物。这个额外核酸序列会降低内源基因表达,从而产生已知为共抑制作用的现象。将 一个核酸序列的几个额外拷贝导入植物时,基因表达的降低将更明显,因为高转录物水平 与触发共抑制作用之间存在正相关。RNA沉默方法的另一个例子涉及使用反义核酸序列。“反义”核酸序列包含与编码 蛋白质的“有义”核酸序列互补,即与双链cDNA分子的编码链互补,或与mRNA转录物序列 互补的核苷酸序列。反义核酸序列优选地互补于待沉默的内源基因。这种互补性可以存在 于基因的“编码区”中和/或其“非编码区”中。术语“编码区”指包含被翻译成氨基酸残基 的密码子的核苷酸序列的区域。术语“非编码区”指分布在编码区侧翼的被转录但不翻译 成氨基酸的5’和3’序列(也称作5’和3’非翻译区)。反义核酸序列可以根据Watson和Crick碱基配对规则设计。反义核酸序列可以互 补于整个核酸序列(在此情况下是从目的基因衍生的,或从能够编码Patellin或RNA加工 因子前体38或衔接头2的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本 上连续的核苷酸),不过也可以是仅对所述核酸序列的一部分(包括mRNA 5’和3’ UTR)反 义的寡核苷酸。例如,反义寡核苷酸序列可以互补于编码多肽的mRNA转录物的翻译起点周围的区域。合适反义寡核苷酸序列的长度是本领域已知的并且可以从约50、45、40、35、30、 25、20、15或10个核苷酸或更小的核苷酸长度开始。本发明的反义核酸序列可以使用化学 合成反应和酶连接反应,利用本领域已知的方法构建。例如,反义核酸序列(例如反义寡核 苷酸序列)可以使用天然存在核苷酸或以多种方式修饰的核苷酸化学地合成,其中所述的 修饰核苷酸设计旨在增加分子的生物学稳定性或增加反义与有义核酸序列之间所形成的 双链体的物理稳定性,例如,可以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可以用来产 生反义核酸序列的修饰核苷酸的例子是本领域熟知的。已知的核苷酸修饰包括甲基化、环 化和‘加帽’及用类似物(如肌苷)取代一个或多个天然存在核苷酸。对核苷酸的其他修 饰作用是本领域熟知的。反义核酸序列可以使用表达载体以生物学方式产生,其中一种核酸序列已经以反 义方向亚克隆(即从插入的核酸转录出的RNA会对目的靶核酸为反义方向)到所述表达载 体中。优选地,植物中反义核酸序列的产生借助稳定整合的核酸构建体进行,其中所述的核 酸构建体包含启动子、有效链接的反义寡核苷酸和终止子。用于本发明方法中沉默作用的核酸分子(无论被导入植物中或原位(in situ)地 产生)与mRNA转录物和/或编码多肽的基因组DNA杂交或结合以因而抑制蛋白质的表达, 例如通过抑制转录和/或翻译做到这一点。杂交可以因形成稳定双链体的常规核苷酸互补 性引起,或例如,在与DNA双链体结合的反义核酸序列的情况下,因双螺旋大沟内的特异性 相互作用引起。反义核酸序列可以通过在特定组织部位转化或直接注射导入植物。备选 地,反义核酸序列可以被修饰以靶向所选的细胞并且随后全身性施用。例如,对于全身性施 用,可以修饰反义核酸序列,从而它们与表达在所选细胞表面上的受体或抗原特异性地结 合,例如通过将所述反义核酸序列连接至与细胞表面受体或抗原结合的肽或抗体连接而做 到这一点。反义核酸序列也可以使用本文中所述的载体递送至细胞。根据另一方面,反义核酸序列是α-端基异构核酸序列。α端基异构核酸序列与 互补RNA形成特定的双链杂交体,在所述双链杂交体中与常见的b-单元相反,所述链彼此 平行(Gaultier等(1987) Nucl Ac Resl5 :6625_6641)。反义核酸序列也可以包含2’_0_甲 基核糖核苷酸(Inoue 等(1987) Nucl Ac Res 15,6131-6148)或嵌合RNA-DNA类似物(Inoue 等(1987)FEBS Lett. 215,327-330)。内源基因表达的降低或基本上消除也可以使用核酶进行。核酶是具有核糖核酸 酶活性的催化性RNA分子,能够切割与之具有互补区域的单链核酸序列,如mRNA。因此,核 酶(例如锤头状核酶(在Haselhoff和Gerlach (1988) Nature 334,585-591中描述)可 以用来催化地切割编码多肽的mRNA转录物,因而相当大程度地降低待翻译成多肽的mRNA 转录物的数目。可以设计对核酸序列具有专一性的核酶(参见例如Cech等美国专利号 4, 987,071 ;和Cech等美国专利号5,116,742)。备选地,与核酸序列相对应的mRNA转录 物可以用来从RNA分子的汇集物中选出具有特定核糖核酸酶活性的催化性RNA(Bartel和 Szostak(1993) Science 261,1411-1418)。核酶在植物中用于基因沉默的用途是本领域 已知的(例如 Atkins 等(1994) WO 94/00012 ;Lenne 等(1995) W095/03404 ;Lutziger 等 (2000)WO 00/00619 ;Prinsen 等(1997)W097/13865 和 Scott 等(1997)WO 97/38116)。基因沉默也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过如 Angell 和 Baulcombe((1999)Plant J. 20(3) :357_62)、(AmpliconVIGS WO 98/36083)或Baulcombe (W0 99/15682)及其他人描述的策略实现。如果内源基因中存在突变和/或在随后导入植物的分离基因/核酸中存在突变, 基因沉默也可能发生。所述降低或基本上消除可以由无功能的多肽引起。例如,该多肽可 以与多种相互作用的蛋白质结合;一种或多种突变和/或截短作用因而可以产生仍能够结 合相互作用的蛋白质(如受体蛋白)但不能展示正常功能的多肽(如信号传导配体)。基因沉默的另一种方法是瞄准互补于基因调节区(例如启动子和/或增强子) 的核酸序列以形成阻止靶细胞中基因转录的三重螺旋结构。参见Helene,C.,Anticancer Drug Res. 6,569-84,1991 ;Helene 等,Ann. N. Y. Acad. Sci. 660,27-361992 ;和 Maher, L. J. Bioassays 14,807-15,1992。技术人员会熟知其他方法,如使用针对内源多肽的抗体以抑制该多肽在植物中 (in planta)的功能,或干扰涉及某多肽的信号传导途径。特别地,可以考虑人造分子可能 用于抑制靶多肽的生物学功能,或用于干扰涉及所述靶多肽的信号传导途径。备选地,可以建立筛选程序以鉴定植物群体中基因的天然变体,其中所述的变体 编码具有降低的活性的多肽。也可以使用此类天然变体,例如来进行同源重组。人工和/或天然的微RNA(miRNA)可以用来敲除基因表达和/或mRNA翻译。内源 miRNA是通常19-24个核苷酸长度的单链小RNA。它们主要发挥调节基因表达和/或mRNA翻 译的功能。大多数的植物微RNA(miRNA)与其靶序列具有完全或接近完全的互补性。然而, 存在具有多达5个错配的天然靶。它们从具有特征性折返结构的较长非编码性RNA由Dicer 家族的双链特异性RNA酶加工得来。加工后,它们通过与RNA诱导的沉默复合体(RISC)的 主要组分-Argonaute蛋白结合被掺入该复合体。miRNA充当RISC的特异性组分,因为它们 与胞浆中的靶核酸(大多是mRNA)发生碱基配对。后续调节事件包括靶mRNA切割和摧毁 和/或翻译抑制。miRNA过量表达的影响因此往往反映为靶基因的mRNA水平降低。可以专门地遗传工程化一般21个核苷酸长度的人工微RNA(amiRNA)以负向地调 节单个或多个目的基因的基因表达。选择植物的微RNA靶的决定因素是本领域熟知的。 用于靶识别的经验参数已经被定义并可以用来辅助具体amiRNA的设计(Schwab等,Dev. Cell 8,517-527,2005)。用于设计并产生amiRNA及其前体的便利工具也是公众可获得的 (Schwab 等,2006 Plant Cell. 2006 18(5) :1121_33)。为了最佳性能,用于降低植物中内源基因表达的基因沉默技术需要使用来自单子 叶植物的核酸序列转化单子叶植物,并使用来自双子叶植物的核酸序列转化双子叶植物。 优选地,将来自任意的给定植物物种的核酸序列导入相同的物种。例如,将来自稻的核酸序 列转化到稻植物中。然而,不绝对要求待导入的核酸序列来自与待导入该核酸序列的植物 相同的植物物种。只要内源靶基因与待导入的核酸之间存在实质同源性即可。上文描述用于降低或基本上消除植物中内源基因表达的多种方法的例子。例如, 本领域技术人员会轻易地能够调整用于沉默的前述方法,从而通过利用合适启动子实现在 完整植物中或其部分中降低内源基因的表达。选择性标记(基因)/报道基因“选择性标记”、“选择性标记基因”或“报道基因”包括向细胞赋予表型的任意基 因,其中在所述细胞中表达所述“选择性标记”、“选择性标记基因”或“报道基因”以促进鉴 定和/或选择用本发明核酸构建体转染或转化的细胞。这些标记基因能够借助一系列不同原理而鉴定核酸分子的成功转移。合适的标记可以选自赋予抗生素抗性或除草剂抗性、导 入新代谢性状或允许目视选择的标记。选择性标记基因的例子包括赋予抗生素抗性的基因 (如使新霉素和卡那霉素磷酸化的nptll或使潮霉素磷酸化的hpt或赋予针对例如博来霉 素、链霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(Geneticin) (G418)、壮观霉 素或杀稻瘟茵素的抗性的基因)、赋予除草剂抗性的基因(例如提供Basta 抗性的bar ;提 供草甘膦抗性的aroA或gox或赋予针对例如咪唑啉酮、膦丝菌素或磺脲类的抗性的基因) 或提供代谢性状的基因(如允许植物使用甘露糖作为唯一碳源的manA,或利用木糖的木糖 异构酶,或抗营养性标记如2-脱氧葡萄糖抗性)。目视标记基因的表达导致颜色(例如 β -葡糖醛酸酶、GUS或β -半乳糖苷酶与其有色底物例如X-Gal)、发光(如萤光素/萤光 素酶系统)或荧光(绿色荧光蛋白GFP和其衍生物)的形成。这个名单仅代表少数的可能 标记。技术人员熟悉此类标记。取决于生物和选择方法,优选不同的标记。已知当核酸稳定或瞬时地整合至植物细胞时,仅少数细胞摄取外来DNA,并且根据 需要,将外来DNA整合至细胞基因组中,这取决于所用的表达载体和所用的转染技术。为鉴 定并选择这些整合体,通常将编码选择性标记的基因(如上文所述的基因)连同目的基因 一起导入宿主细胞。这些标记可以在这些基因例如通过常规方法缺失而无功能的突变体中 使用。此外,编码选择性标记的核酸分子可以在包含编码本发明多肽或在本发明方法中所 用多肽的序列的相同载体上,或在独立的载体上导入宿主细胞。已经用所导入核酸稳定转 染的细胞可以例如通过选择作用鉴定(例如具有整合的选择性标记的细胞存活而其他细 胞死亡)。一旦不再需要所述标记基因时,可以从转基因细胞中移除或切除它们。用于标记 移除的技术是本领域已知的,有用的技术在上文定义部分中描述。因为一旦已经成功地导入所述标记基因、尤其抗生素抗性基因和除草剂抗性基 因,则这些核酸是转基因宿主细胞中不再需要或不想要的,因此用于导入核酸的本发明方 法有利地使用能够移除或切除这些标记基因的技术。一种这样的方法是所谓共转化法。共 转化法同时使用两种载体以转化,一种载体携带本发明的核酸而第二种载体携带标记基 因。大比例的转化体接受或在植物情况下包含(多达40%或更多的转化体)这两种载体。 在用农杆菌(Agrobacterium)转化的情况下,转化体通常仅接受载体的一部分,即侧翼存 在T-DNA的序列,该序列通常代表表达盒。标记基因随后可以通过开展杂交从转化植物中 移除。在另一种方法中,整合至转座子的标记基因与想要的核酸一起用于转化(称作Ac/ Ds技术)。转化体可以与转座酶来源物杂交,或转化体用引起转座酶表达的核酸构建体瞬 时或稳定转化。在一些情况下(大约10% ),一旦转化已经成功发生,则转座子从宿主细胞 的基因组跳出并丢失。在其他许多情况下,转座子跳到一个不同位置。在这些情况下,标记 基因必须通过开展杂交予以消除。在微生物学中,开发了有可能或促进检测这类事件的技 术。又一种有利方法依赖于所谓重组系统;所述方法的优势在于杂交消除作用可以用该重 组系统实行。最知名的该类型系统称作Cre/lox系统。Crel是移除位于IoxP序列之间序列 的重组酶。若所述标记基因整合于IoxP序列之间,一旦转化已经成功发生,则它因重组酶 表达而被移除。其他重组系统是HIN/HIX、FLP/FRT和REP/STB系统(Tribble等,J. Biol. Chem.,275,2000 :22255_22267 ;VeImurugan 等,J. CellBiol.,149,2000 :553_566)。位点特 异性地整合本发明核酸序列至植物基因组是可能的。自然,这些方法也可以应用于微生物 如酵母、真菌或细菌。
27
转基因的/转基因/重组为本发明的目的,“转基因的”、“转基因”或“重组”例如就核酸序列而言,意指包含 所述核酸序列的表达盒、基因构建体或载体,或用本发明核酸序列、表达盒或载体转化的生 物,这些构建体均通过重组方法产生,其中(a)编码在本发明方法中有用的蛋白质的核酸序列,或(b)与本发明核酸序列有效链接的基因调控序列,例如启动子,或(c)a)和 b)并不位于它们的天然遗传环境中或已经通过重组方法被修饰,所述的修饰有可能 采取例如取代、添加、倒位或插入一个或多个核苷酸残基的形式。天然遗传环境理解为意指 原初植物中的天然基因组位点或染色体位点或存在于基因组文库中。在基因组文库的情况 下,优选地保留,至少部分地保留核酸序列的天然遗传环境。该环境分布在所述核酸序列的 至少一侧并且具有至少50bp、优选至少500bp、特别优选至少lOOObp、最优选至少5000bp序 列长度。当通过非天然、合成性(“人工”)方法(例如诱变处理)修饰天然存在表达盒时,该 表达盒-例如所述核酸序列的天然启动子与编码如上文所定义在本发明方法中有用的多 肽的相应核酸序列的天然存在组合_变成转基因表达盒。合适的方法例如在US5,565,350 或WO 00/15815中描述。为本发明目的,如上所述,将转基因植物因此理解为意指本发明方法中所用诸核 酸不处于它们在所述植物基因组中的天然基因座处,从而有可能同源或异源地表达所述核 酸。然而,如所提及,转基因还意指尽管本发明的或本发明方法中所用的诸核酸处于它们在 植物基因组中的天然位置处,然而相对于天然序列,它们的序列已经被修饰,和/或所述天 然序列的调节序列已经被修饰。转基因优选地理解为意指本发明核酸在基因组中的非天然 基因座处表达,即所述核酸的同源表达或优选异源表达发生。优选的转基因植物在本文中 提及。转化如本文中提及的术语“导入”或“转化”包括转移外源多核苷酸至宿主细胞中,无论 转化所用的方法是什么。能够后续克隆性增殖(无论通过器官发生或胚发生)的植物组织 可以用本发明的基因构建体转化并且可完整植物以从中再生。所选的具体组织根据可用于 并且最好适于正在进行转化的具体物种的克隆性增殖系统变化。示例性靶组织包括叶盘、 花粉、胚、子叶、下胚轴、大配子体、愈伤组织、现存的分生组织(例如顶端分生组织、腋芽和 根分生组织)和诱导的分生组织(例如子叶分生组织和下胚轴分生组织)。多核苷酸可以 瞬时或稳定地导入宿主细胞并且可以非整合地维持,例如作为质粒。备选地,它可以整合至 宿主基因组中。所得的转化植物细胞随后可以用来以本领域技术人员已知的方式再生出转 化植物。外来基因转移至植物基因组的过程称作转化。植物物种的转化现在是相当常规的 技术。有利地,可以使用几种转化方法中的任何一种方法将目的基因导入合适的祖先细胞。 描述用于转化并从植物组织或植物细胞再生出植物的方法可以用于瞬时转化或稳定转化。 转化方法包括使用脂质体、电穿孔法、增加游离DNA摄入的化学品、DNA直接注射至植物、粒 子枪轰击法、使用病毒或花粉的转化法和微量投射法(microprojection)。转化方法可以选 自用于原生质体的钙 / 聚乙二醇法(Krens,Ε. A.等,(1982)Nature 296,72-74 ;NegrutiuI 等,(1987)PlantMol Biol 8:363-373);原生质体的电穿孔法(Shillito R. D.等,(1985) Bio/Technol 3,1099-1102);对植物材料的微量注射法(Crossway A 等,(1986)Mol. Gen Genet 202:179-185) ;DNA 或 RNA 包被粒子轰击法(Klein TM 等,(1987) Nature 327:70)、 用(非整合性)病毒感染等。包括转基因作物植物在内的转基因植物优选通过农杆菌介导 的转化法产生。有利的转化方法是植物原位(in planta)转化法。为此目的,例如有可能 使农杆菌作用于植物种子或有可能用农杆菌接种植物分生组织。根据本发明,已经证明将 转化的农杆菌悬液作用于完整植物或至少作用于花原基是特别有利的。随后培育该植物直 至获得已处理植物的种子(Clough和Bent,Plant J. (1998) 16,735-743)。用于农杆菌介导 稻转化的方法包括用于稻转化的熟知方法,如在以下任意文献中描述的那些方法欧洲专 利申请 EP 1198985 Al,Aldemita 和 Hodges (Planta 199:612-617,1996) ;Chan 等,(Plant Mol Biol 22(3) :491_506,1993),Hiei 等,(Plant J 6(2) :271_282,1994),其公开内容 如充分所述那样通过引用的方式并入本文。在玉米转化的情况下,优选的方法如Ishida 等,(Nat. Biotechnol 14(6) :745_50,1996)或 Frame 等,(Plant Physiol 129(1) 13-22, 2002)描述,其公开内容如充分所述那样通过引用的方式并入本文。所述方法还例如由 B. Jenes等,Techniques for Gene Transfer,在Transgenic Plants,第 1 卷,Engineering and Utilization,编者 S. D. Kung 禾口 R.Wu,Academic Press (1993) 128—143 及在 Potrykus Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991) 205-225)中描述。待表达的核酸 或构建体优选地克隆至适于转化根瘤农杆菌(Agrobacteriumtumefaciens)的载体,例如 pBinl9 (Bevan等,Nucl. Acids Res. 12(1984)8711)。被这种载体转化的农杆菌随后可以按 照已知方式用于转化植物,例如作为模型使用的植物如拟南芥属植物(拟南芥在本发明范 围不视为作物植物),或作物植物,例如烟草植物,所述方式例如是通过在农杆菌溶液中浸 泡擦伤的叶或切碎的叶并随后在合适培养基中培育它们。借助根瘤农杆菌转化植物例如 由Hiifgen和 Willmitzer 在 Nucl. AcidRes. (1988) 16,9877 中描述或尤其从 F. F. White, 用于高等植物中基因转移的载体(Vectors for Gene Transfer in Higher Plants);在 TransgenicPlants,第 1 卷,Engineering and Utilization, S. D. Kung禾口 R. Wu编,Academic Press, 1993,第 15-38 页中获知。 除了转化随后必需再生成完整植物的体细胞之外,也可以转化植物分生组织的 细胞,并且尤其那些发育成配子的细胞。在这种情况下,转化的配子遵循天然的植物发育 过程,从而产生转基因植物。因此,例如用农杆菌处理拟南芥属植物的种子并且从正在发 育的植物获得种子,其中一定比例的所述植物被转化并且因此是转基因的[Feldman,KA 和 Marks MD (1987)Mol Gen Genet 208 274-289 ;Feldmann K (1992),在编者 C Koncz, N-H Chua 禾口 J Shell, Methods in ArabidopsisResearch. Word Scientific, Singapore, 第274-289页]。备选方法基于反复移除花序并将莲座丛中心内的切除部位与转化的农杆 菌温育,因而同样可以在较晚的时间点获得转化的种子(Chang(1994)Plant J. 5 :551_558 ; Katavic (1994)Mol Gen Genet,245 :363_370)。然而,特别有效的方法是改良真空渗入法, 如“浸花”法。在拟南芥属植物真空浸润法的情况下,用农杆菌悬液处理在降低压力下的完 整植物[Bechthold,N(1993). C R Acad Sci Paris Life Sci,316 1194-1199],而在“浸花 法”的情况下,将正在发育的花组织与表面活性剂处理过的农杆菌悬液短暂温育[Clough, SJ和Bent,AF (1998) The Plant J. 16,735-743]。在这两种情况下均收获某个比例的转基因种子,并且这些种子可以通过在如上所述的选择条件下培育与非转基因种子区分。此外, 质体的稳定转化是有利的,因为质体在大部分作物中以母系方式遗传,这降低或消除了借 助花粉的转基因流动风险。叶绿体基因组的转化一般通过已经在Klaus等,2004[NatUre Biotechnology 22 (2),225-229]中示意性展示的方法实现。简而言之,将待转化的序列 连同选择性标记基因一起克隆至同源于叶绿体基因组的侧翼序列之间。这些同源侧翼序 列指导向原质体的位点特异性整合。已经对许多不同的植物物种描述质体转化过程并且 在Bock(2001)基础研究和植物生物技术中的转基因质体(Transgenicplastids in basic research and plant biotechnology). J Mol Biol. 2001 年月 21 日;312(3) :425_38 或 Maliga, P(2003)质体转化技术商业化进展(Progress towards commercialization of plastid transformationtechnology), Trends Biotechnol. 21, 20-28 中给出综述。其 他的生物技术进展最近已经以无标记质体转化体的形式报道,其中可以通过瞬时共整合 的标记基因产生所述无标记质体转化体(Klaus等,2004,NatureBiotechnology 22(2), 225-229)。T-DNA 活化标签技术(T-DNA activation tagging)T-DNA活化标签技术(Hayashi等,Science (1992) 1350-1353)涉及以如此方式在 目的基因的基因组区域内或基因编码区的上游或下游IOkb处插入通常含有启动子(也可 以是翻译增强子或内含子)的T-DNA,从而该启动子指导目标基因的表达。一般,目标基因 的天然启动子对该基因表达的调节作用被破坏,并且该基因受新导入的启动子控制。该启 动子一般嵌入T-DNA中。这种T-DNA随机地插入植物基因组,例如借助农杆菌感染,并且引 起所插入T-DNA附近的基因受调节的表达。所得的转基因植物表现显性表型,原因在于所 导入启动子附近的基因受修饰的表达。TILLING术语“TILLING”是“基因组中定向诱导局部损伤法”的缩写并且指用于产生和/ 或鉴定核酸的诱变技术,其中所述核酸编码具有改良表达和/或活性的蛋白质。TILLING还 允许选择携带此类突变变体的植物。这些突变变体可以表现在强度或在位置或在时间方面 改良的表达(例如,如果所述突变影响启动子)。这些突变变体可以显示比其天然形式基 因所表现活性更高的活性。TILLING联合了高密度诱变法与高通量筛选法。TILLING中一 般所遵循的步骤是(a) EMS 诱变(Redei GP 和 Koncz C (1992)在 Methods in Arabidopsis Research,Koncz C,Chua NH,Schell J,Singapore 编,World Scientific Publishing Co, 第 16-82 页;Feldmann 等,(1994)在 Meyerowitz EM, Somerville CR编,Arabidopsis. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY,第 137-172 页;Lightner 禾口 Caspar T(1998) ^ J Martinez-Zapater, JSalinas Iij^",Methods on Molecular Biology 第 82 卷· Humana Press, Totowa, NJ,第 91-104 页);(b)制备和汇集个体 DNA ; (c)PCR 扩 增目的区域;(d)变性和复性以导致异双链体形成;(e)DHPLC,其中汇集物中异双链体的存 在被检测为色谱图中的一个额外峰;(f)鉴定突变个体;和(g)将突变PCR产物测序。用于 TILLING 的方法是本领域熟知的(McCallum 等,(2000)Nat Biotechnol 18 :455_457 ;综述 参见 Stemple (2004) Nat Rev Genet 5(2) 145-50)。同源重组同源重组允许在基因组中限定的所选位置处导入所选核酸。同源重组是生物科学中常规用于低等生物如酵母或小立碗藓属(Physcomitrella)苔藓的标准技术。已经对 模式植物(Offringa 等,(1990) EMBO J 9(10) :3077_84)和作物植物例如稻(Terada 等, (2002)Nat Biotech 20(10) 1030-4 ;Iida 和 Terada(2004) Curr Opin Biotech 15(2) 132-8)描述了用于植物中开展同源重组的方法,并且存在与靶生物无关而通常适用的方法 (Miller 等,Nature Biotechnol. 25,778-785,2007)。·产量术语“产量”通常意指经济价值的可测量结果,一般与指定作物、与面积并且与时 间间隔有关。单个植物部分基于它们的数目、大小和/或重量而直接有助于产量,或实际产 量是相对于某作物和年份的每平方米产量,这通过总产量(包括收获的和评估的产量)除 以播种的平方米数确定。术语植物的“产量”可以涉及该植物的营养生物量(根和/或枝 条生物量)、涉及繁殖器官和/或涉及繁殖体(如种子)。早期生长势“早期生长势”指活跃、健康、充分平衡的生长,尤其是植物生长早期期间,并且可 以因提高的植物适应性所致,其中所述提高的植物适的原因是例如该植物更好地适应环境 (即优化能量源的用途和在枝条与根之间的分配)。具有早期生长势的植物也显示提高的 籽苗存活和更佳的作物建立,这往往产生高度均一的田块(作物以均一方式生长,即大多 数植物在基本上相同的时间达到各个发育期)和往往形成更好且更高的产量。因而,早期 生长势可以通过测量多种因素如千粒重(ThousandKernel Weight)、萌发百分数、出苗百分 数、籽苗生长、籽苗高度、根长度、根和枝条生物量和许多其他因素等确定。提高/改善/增强术语“提高”、“改善”或“增强”是相互可交换的并且在应用含义上应当意指与如本 文中定义的对照植物相比较,至少3%、4%、5%、6%、7%、8%、9%或10%、优选至少15% 或20%、更优选地25%、30%、35%或40%更多的产量和/或生长。种子产量提高的种子产量自身可以表现为以下一个或多个指标a)种子生物量(种子总重 量)增加,这可以基于单粒种子基础和/或每株植物和/或每平方米;b)提高的每株植物 花数目;c)提高的(饱满)种子数;d)提高的种子饱满率(其表述为饱满种子数与种子总 数之间的比率);e)提高的收获指数,其表述为可收获部分(如种子)产量与总生物量的比 率;f)提高的千粒重(TKW) ; (g)提高的初生穗数,这从计数的饱满种子数及它们的总重量 外推出来。提高的TKW可以因增加的种子尺寸和/或种子重量引起,并且也可以因胚尺寸 和/或胚乳尺寸增加引起。种子产量的提高也可以表现为种子尺寸和/或种子体积的增加。此外,种子产量 提高也可以本身表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的提高。 提高的种子产量也可以产生改良的构造,或可以因改良的构造而出现。绿度指数从植物的数字图像计算如本文中所用的“绿度指数”。对属于图像上植物目标的每 个像素计算绿色值与红色值的比率(在编码颜色的RGB模式中)。绿度指数表述为绿色/ 红色比超过给定阈值的像素百分数。在正常生长条件下,在盐胁迫生长条件下和在养分有 效性降低的生长条件下,植物的绿度指数在开花前的最后成像中测量。相反,在干旱胁迫生长条件下,植物的绿度指数在干旱后的首次成像中测量。植物本文中所用的术语“植物”包括完整植物、植物的祖先及子代和包括种子、枝条、 茎、叶、根(包括块茎)、花和组织、器官在内的植物部分,其中每种前述对象包含目的基因/ 核酸。术语“植物”也包括植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子 体、花粉和小孢子,同样其中每种前述对象包含目的基因/核酸。在本发明方法中特别有用的植物包括属于植物界(Viridiplantae)超家族、尤 其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或 灌木,其中所述植物选自包含以下物种的名单槭树属物种(Acer spp·)、猕猴桃属物种 (Actinidia spp.)、秋葵属物种(Abelmoschus spp.)、剑麻(Agave sisalana)、冰草属物 种(Agropyronspp.)、匍匍剪股颖(Agrostis stolonifera)、葱属物种(Allium spp·)、览 属物禾中(Amaranthus spp·)、欧洲海滨草(Ammophila arenaria)、凤梨(Ananas comosus)、 番荔枝属物种(Annona spp.)、旱芹(Apiumgraveolens)、蜘蛛兰属物种(Arachis spp·)、
禾中(Artocarpusspp.)(Asparagus officinalis) ^^^M^ft (Avena
spp.)(例如燕麦(Avena sativa)、野燕麦(Avena fatua)、比赞燕麦(Avena byzantina)、 S ^^J^^ft (Avena fatua var. sativa) > ^ft(Avena hybrida) 、P曰杉匕(Averrhoa carambola)、 1^Μ·禾中(Bambusa sp. )、H (Benincasahispida)、EM^ (Bertholletia excelsea)、甜菜(Beta vulgaris)、芸苔属物种(Brassica spp.)(例如欧洲油菜(Brassica napus)、芜青物种(Brassicarapa ssp.)[卡诺拉油菜、油菜籽油菜(oilseed rape)、 Μ. W (turnip rape)])> Cadaba farinosa> ^ (Camellia sinensis)> ^KM (Canna
(Cannabis sativa) >^lJft (Capsicum spp. ) > Carex elata> (Carica papaya) > i; ^jg(Carissa macrocarpa) > ill ^M iItlft (Carya spp. ) > 花(Carthamus tinctorius)、栗属物禾中(Castanea spp·)、美洲木棉(Ceiba pentandra)、 苦宦(Cichorium endivia)、樟属物禾中(Cinnamomum spp.)、西瓜(Citrullus lanatus)、 柑桔属物种(Citrus spp.)、椰子属物种(Cocos spp.)、咖啡属物种(Coffea spp·)、芋头 (Colocasiaesculenta)、非洲梧桐属物种(Cola spp·)、黄麻属物种(Corchorus sp·)、芫 ^ (Coriandrum sativum) > ^M i^ft (Corylus spp.) > LijilMiItl ft (Crataegus spp.)、· 红花(Crocus sativus)、南瓜属物种(Cucurbita spp·)、香瓜属物种(Cucumis spp.)、菜 蓟属物种(Cynara spp·)、胡萝卜(Daucuscarota)、山马蝗属物种(Desmodium spp·)、龙 目艮(Dimocarpus longan)、薯裁属物种(Dioscorea spp.)、神树属物种(Diospyros spp.)、 稗属物种(Echinochloa spp.)、油棕属(Elaeis)(例如油棕(Elaeis guineensis)、美洲 油棕(Elaeis oleifera)、糝子(Eleusine coracana)、蔗茅属物种(Erianthussp.)、枇杷 (Eriobotrya japonica)(Eucalyptus sp.) ^iLifM (Eugenia uniflora)
属物种(Fagopyrum spp.)、7jC青冈属物种(Fagusspp.)、苇状羊茅(Festuca arundinacea)、 无花果(Ficus carica)、金桔属物种(Fortunella spp.)、草莓属物种(Fragaria spp·)、 银杏(Ginkgobiloba)、大豆属物种(Glycine spp.)(例如大豆(Glycine max)、大 豆(Sojahispida)或大豆(Soja max)、陆地棉(Gossypium hirstum)、向日葵属物种 (Helianthus spp.)(例如向日葵(Helianthus annuus)、长管萱草(Hemerocallis fulva)、 木槿属物种(Hibiscus spp·)、大麦属物种(Hordeumspp.)(例如大麦(Hordeum vulgare)、甘薯(Ipomoea batatas)、核桃属物禾中(Juglans spp·)、莴苣(Lactuca sativa)、 山黧 豆属物禾中(Lathyrus spp·)、兵豆(Lens culinaris)、亚麻(Linum usitatissimum) > H 枝(Litchichinensis)、百脉根属物种(Lotus spp.)、棱角丝瓜(Luffa acutangula)、 习习扇豆属物禾中(Lupinus spp. ) > Luzula sylvatica、番属物禾中(Lycopersicon spp.) (例如番爺(Lycopersicon esculentum、Lycopersiconlycopersicum、Lycopersicon pyriforme)、硬皮豆属物种(Macrotylomaspp.)、苹果属物种(Malus spp·)、凹缘金虎尾 (Malpighia emarginata)、41 _ 胃(Mammea americana) > τ ^ (Mangifera indica)、 WM^ft (Manihot spp. )(Manilkara zapota)^^!! (Medicago sativa)、H
禾中(Melilotus spp.) ,Μ^Μ^Ψ^ (Mentha spp.) (Miscanthussinensis) >^ 瓜属物种(Momordica spp.)、黑桑(Morus nigra)、芭蕉属物种(Musa spp.)、烟草属物 种(Nicotiana spp·)、木犀榄属物种(Oleaspp.)、仙人掌属物种(Opuntia spp·)、鸟足 豆属物种(Ornithopus spp.)、稻属些物种(Oryza spp.)(例如稻(Oryza sativa)、阔叶 禾S (Oryza latifolia)、稷(Panicum miliaceum)、柳枝稷(Panicum virgatum)、鸡蛋果 (Passifloraedulis)、欧防风(Pastinaca sativa)、狼尾草属物种(Pennisetum sp·)、鍔 ^cMiItlft (Persea spp.) >H^jr (Petroselinum crispum)、|H (Phalarisarundinacea) > 菜豆属物种(Phaseolus spp.)、猫尾草(Phleum pratense)、刺葵属物种(Phoenix spp.)、 南方芦苇(Phragmites australis)、酸浆属物种(Physalis spp·)、松属物种(Pinus spp·)、阿月浑子(Pistacia vera)、豌豆属物种(Pisum spp·)、早熟禾属物种(Poa spp·)、 杨属物种(Populusspp.)、牧豆草属物种(Prosopis spp.)、李属物种(Prunus spp.)、番 石槽属物种(Psidium spp·)、石槽(Punica granatum)、西洋梨(Pyrus communis)、栎属 物禾中(Quercus spp.)、萝卜(Raphanus sativus)、波叶大黄(Rheumrhabarbarum)、茶薦 子属物种(Ribes spp.)、蓖麻(Ricinus communis)、悬钩子属物种(Rubus spp.)、甘蔗 属物种(Saccharum spp.)、柳属物种(Salix sp.)、接骨木属物种(Sambucus spp.)、黑 麦(Secale cereale)、胡麻属物种(Sesamum spp.)、白芥属物种(Sinapis sp.)、茄属物 禾中(Solanumspp.)(例如马铃薯(Solanum tuberosum)、红爺(Solanum integrifolium) 或番爺(Solanum tuberosum)、两色蜀黍(Sorghum bicolor)、菠菜属物禾中(Spinacia spp.)、蒲桃属物种(Syzygium spp.)、万寿菊属物种(Tagetesspp.)、酸豆(Tamarindus indica)、可可树(Theobroma cacao)、车轴草属物种(Trifolium spp.)、小黑麦属物种 (Triticale sp.)、Triticosecalerimpaui、小麦属物种(Triticum spp.)(例如普通小 麦(Triticum aestivum)、硬粒小麦(Triticum durum)、圆柱小麦(Triticum turgidum)、 Triticumhybernum、马卡小麦(Triticum macha)、普通小麦(Triticum sativum)或普通小 麦(Triticum vulgare)、小金莲花(Tropaeolum minus)、金莲花(Tropaeolum majus)、越 桔属物种(Vaccinium spp.)、野碗豆属物种(Viciaspp.)、豇豆属物种(Vigna spp.)、香堇 (Viola odorata)、葡萄属物禾中(Vitisspp.)、玉蜀黍(Zea mays)、Zizania palustris、^属 物种(Ziziphus spp.)及其他。发明详述令人惊讶地,现在已经发现调节植物中编码PATL多肽或PRP38多肽或GATA样多 肽或ADA2多肽或WDR23样多肽的核酸的表达产生相对于对照植物具有增强的产量相关性 状的植物。根据第一实施方案,本发明提供了用于相对于对照植物而言增强植物中产量相关性状的方法,其包括调节植物中编码PATL多肽或PRP38多肽或GATA样多肽或ADA2多肽 或WDR23样多肽的核酸的表达。在一个实施方案中,令人惊讶地,现在已经发现调节(优选提高)植物中编码 GATA样多肽的核酸的表达产生相对于对照植物具有提高的千粒重(TKW)的植物。根据一个 实施方案,本发明提供了用于相对于对照植物而言增加植物中TKW的方法,其包括调节(优 选提高)植物中编码GATA样多肽的核酸的表达。在另一个实施方案中,现在已经发现提高植物中编码如本文定义的WDR23样多 肽的核酸序列的表达产生相对于对照植物具有增强的产量相关性状的植物。本发明提供编 码WDR23样多肽的核酸序列和WDR23样多肽,借此植物中分离核酸序列的提高的表述相对 于对照植物而言增强产量相关性状。用于调节(优选提高)编码PATL多肽或PRP38多肽或GATA样多肽或ADA2多肽或 WDR23样多肽的核酸的表达的优选方法是通过在植物中引入并表达编码PATL多肽或PRP38 多肽或GATA样多肽或ADA2多肽或WDR23样多肽的核酸和可选地选择具有增强的产量相关 性状的植物。下文中对“用于本发明方法中的蛋白质”的任何提及意指如本文中所定义的PATL 多肽或PRP38多肽或GATA样多肽或ADA2多肽或WDR23样多肽。下文中对“用于本发明方 法中的核酸”的任何提及意指能够编码此类PATL多肽或PRP38多肽或GATA样多肽或ADA2 多肽或WDR23样多肽的核酸。待引入植物的核酸(并因此用于实施本发明的方法)是任意 编码下述类型的多肽的核酸序列,,也称作“PATL核酸”或“PATL基因”或“PRP38核酸”或 "PRP38基因”或“GATA样核酸”或“GATA样基因”或“ADA2核酸”或“ADA2基因”或“WDR23 样核酸序列”或“WDR23样基因”。如本文中所定义的术语“PATL多肽”指任意多肽,其包含(i)SEC14结构域和/或(ii) GOLD 结构域SEC 14和GOLD结构域通常位于PATL多肽的C-端区。PATL多肽的N-端长度可 变,且具有比C-端更多样的氨基酸序列。N-端特征在于富含酸性氨基酸(PI-等电点-大 约为4),例如谷氨酸(E),以及含有多个EEK(谷氨酸-谷氨酸-赖氨酸)重复。另外,预计 N-端序列包括一个或多个卷曲螺旋,该卷曲螺旋是常见的蛋白质寡聚化-折叠基序。卷曲 螺旋结构域通常含有疏水和亲水氨基酸残基,其形成α "螺旋,其在胞质环境中可包住提 供二聚化的热力学驱动力的亲水氨基酸之间的彼此相对的疏水链。卷曲螺旋可使用本领域 充分描述的方法和软件容易的鉴定,例如使用COIL或PAIRCI0L2 (Lupas等;1991. Science, 252,1162-1164 ;MacDonnell 等 2006. Bioinformatics. ;22(3) :356_8)。图 1 显示 SEQ ID NO 2中所示的特征性EEK重复和卷曲螺旋结构域。用于本发明方法的优选的PATL多肽包含具有一个或多个以下特征的酸性N-端⑴等电点按照递增的优选顺序为低于5,4. 5、4、3· 5或3 ;(ii) 一个或多个卷曲螺旋,优选按照递增的优选顺序为一个、两个、三个、四个或 五个;(iii) 一个或多个EEK重复,优选按照递增的优选顺序为一个、两个、三个、四个、 五个、六个或七个。
本文中PATL多肽的N-端是在SEC14结构域N-端延伸的蛋白质部分。多肽的等电点,即特定分子或表面不携带静电荷时的pH,可由本领域已知的方 法计算(Stryer, 1995),例如使用 Henderson-Hasselbalch 方程式(Henderson (1908), Am.J. Physiol. ,21,173-179 ;Hasselbalc(1917) , Biochemische Zeitschrift,78, 112-144.de Livie, (2003) J. Chem. Educ.,80,146)。通常,PATL多肽在上述N-端之后包含SEC14结构域。PATL多肽中的SEC14结 构域包含与酵母Secl4p蛋白质同源的区域,该酵母Secl4p蛋白质包含磷脂结合口袋。酵 母Secl4p中涉及脂类结合和/或转移的E、K和G氨基酸残基在PATL多肽中是保守的,其 在SEQ ID NO 2中对应E434、K465和G493 (

图1)。SEQ ID NO 2的谷氨酸E434和赖氨酸 K465是酵母Secl4p蛋白质E207和K239的同源残基,其形成涉及选择和结合PtdIns的盐 桥。酵母Secl4P的疏水口袋在PATL多肽中也是保守的。PATL多肽可包含通常位于C-端的GOLD结构域。PATL多肽中的GOLD结构域富含 赖氨酸残基,并包含保守序列 KX(IO-Il) (K/R/T)KKKX(0-1) (L/V/A) (L/V/A) YR(参见图 2), 其与披网格蛋白小泡蛋白质中发现的PtdIns(4,5)P2结合基序类似。用于本发明方法的优选的PATL多肽包含至少一个如下结构域(i)SEQ ID NO :71 所示的 SEC14 结构域Ipeldsvvfyrgadreghpvcynvygefqdkdly ekafgdeekrerfIkwriqllergilsqldfspsgicsmvqvtdlknsppmlgkhravtrqavallqdnypefiakk vfinvpwwylaankmmspfltqrtkskfifaspaksaetlfryiapeqvpvqfgglfk sKi^Mi^ii1 的ifcH1 序与SEQ ID NO 71所示的结构域或表A中任意多肽中存在的任意SEC14结构域具有至少 50%、55%、60%、65%、70%、75%、80%、82%、85%、90%、92%、95%、97% 或更高序列同 一性的结构域;(ii)SEQ ID NO :72 所示的 GOLD 结构域sdavteltikpssketveipvtenstigwelrvlg wevsygaeftpdaeggytvivqktrkvpaneepimkgsfkvgepgkivltinnpaskkkklIyrskv 或按照递土曾 的优选顺序与SEQ ID NO :72所示的结构域或表A中任意多肽中存在的任意GOLD结构域具 有至少 50%、55%、60%、65%、70%、75%、80%、82%、85%、90%、92%、95%、97% 或更高 序列同一性的结构域。用于本发明方法的进一步优选的PATL多肽包含至少一个保守基序分别SEQ ID NO :69/L(L/T)KFLRAR 和 SEQ ID NO :70/(L/F) (Q/E)DNYPEF 所示的基序 Ia 和基序 Ila。用于本发明方法的PATL多肽优选是按照递增的优选顺序与表A中给出的任意多 肽具有至少 50%、55%、60%、70%、75%、80%、85%、90%、92%、93%、95%、96%、98%或
更高序列同一性的那些多肽。PATL多肽中包含的SEC14结构域和GOLD结构域可通过检索特定的数据鉴定, 该特定的数据库包含覆盖保守蛋白质结构域和家族的序列多重比对和隐匿马尔科夫模型 的集合,例如可获自Sanger Institute,英国的Pfam。或者上述结构域可通过扫描The Integrated Resource ofProtein Families, Domains 禾口 Sites (InterPro)数据库发现,以 检测与已知SEC14或GOLD结构域的显著序列比对(参见实施例4)。Interpro数据库是常 用的文本和序列-碱基检索(text-and sequnce-based search)标签据书库的整合界面。 InterPro数据库合并了这些数据库,所述数据库使用不同的方法学及不同程度的有关充分 表征的蛋白质的生物学信息以获得蛋白质特征标识(protein signatures) 0合作数据库包括 SWISS-PROT、PROS ITE, TrEMBL, PRINTS、ProDom 和 Pfam、Smart 和 TIGRFAM。Interpro 由英国欧洲生物信息学研究所(EuropeanBioinformatics Institute)维护。本文定义的 两个多肽或两个结构域之间的显著匹配是按照递增的优选顺序具有低于e_5(e的负5次
W \ 1 _10 1 "15 1 "20 1 "25 1 "50 ι -75 ι -100 ι -200 ι -300 ι -400 ι -500 ι -600 / > J- · θ 、丄·θ 、丄·θ 、丄·θ 、丄·θ 、丄·θ 、丄·θ 、丄·θ 、丄·θ 、丄·θ 、丄·θ 、丄·θ 、
1. e_7°°和1. e_8°°的e-值的比对。多肽序列可使用本领域任一已知的方法比对,该方法包 括全局和局部比对方法,例如Blast算法,例如Altschul,SF,等,(1990) J. Mol. Biol. 215 403-10描述的算法。取得与给定序列出现比对结果的概率作为用于鉴定相似多肽的基础。 通常用来代表这种概率的参数称作e-值(E-值)。所述e_值是S评分可靠性的一个量度。 S评分是待比对的两个序列的相似性的一个度量。e_值描述给定S评分预期以多少频率随 机出现。该e-值可以高至1.0。优选地,用于本发明方法的PATL多肽包含至少一个如下结构域(i)SEC14结构域,其当于已知的SEC14结构域比对时,更优选当于表C的任意 SEC14结构域比对时,按照递增的优选顺序的e_值低于e_5(e的负5次幂)、1. e-10U. e_15、
-, -20 -, -25 -, -50 -, -75 -, -100 -, -200 -, -300 -, -400 -, -500 -, -600 -, -700 ^n ι -800
l.e 、l.e 、l.e 、l.e 、l.e 、l.e 、l.e 、l.e 、l.e 、l.e 、l.e ^u 1. e ;(ii)GOLD结构域,其当于已知的GOLD结构域比对时,更优选当于表C的任意S GOLD结构域比对时,按照递增的优选顺序的e_值低于e_5(e的负5次幂)、1. e-10U. e_15、
-, -20 -, -25 -, -50 -, -75 -, -100 -, -200 -, -300 -, -400 -, -500 -, -600 -, -700 ^n ι -800
l.e 、l.e 、l.e 、l.e 、l.e 、l.e 、l.e 、l.e 、l.e 、l.e 、l.e ^u 1. e 0优选地,用于本发明方法的PATL多肽序列是下述多肽序列,当其用于构建诸如图 3所示的系统树时,与该树中的任意序列聚簇,尤其优选与包含SEQ ID NO :2的组Ia中的 序列聚簇。术语“结构域”和“基序”在文中的“定义”部分定义。存在用于鉴定结构域的 专业数据库,如 SMART (Schultz 等(1998) Proc. Natl. Acad. Sci.美国 95,5857-5864 ; Letunic 等(2002)Nucleic Acids Res 30,242-244)、 InterPro(Mulder 等,(2003) Nucl. Acids. Res. 31,315-318)> Prosite(Bucher 禾口 Bairoch(1994), A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretatior^用于生物分子序列基序的广义图谱语法及其在自动化序列判读 中的功能),(在)ISMB-94 ;第二届分子生物学智能系统国际会议文集.Altman R. ,Brutlag D.,Karp P.,Lathrop R.,Searls D.编,第 53-61 页,AAAI Press, Menlo Park ;Hulo 等, Nucl. Acids. Res. 32 :D134-D137,(2004))或 Pfam(Bateman 等,Nucleic Acids Research 30(1) =276-280(2002)) 0用于计算机芯片上分析蛋白质序列的一组工具可在ExPASY蛋白 质组学服务器上获得(瑞士生物信息学研究所(Gasteiger等,ExPASy the proteomics server for in-depth protein knowledge andanalysis (用于深人认i只禾口分析蛋白质白勺蛋 白组学服务器),Nucleic AcidsRes. 31 =3784-3788 (2003)) 0结构域或基序也可以使用常 规技术如通过序列比对而鉴定。用于比对序列比较的方法是本领域众所周知的,此类方法包括GAP、BESTFIT、 BLAST、FASTA 禾口 TFASTA。GAP 使用 Needleman 和 Wunsch 算法((1970) J Mol Biol 48 443-453)以找到使匹配数最大化并使空位数最小化的两个完整序列的全局性(即覆盖完 整序列的)比对。BLAST算法(Altschul等(1990) J Mol Biol 215 :403_10)计算序列同一 性百分数并执行对两个序列间相似性的统计分析。用于执行BLAST分析的软件是公众通过
36国家生物技术信息中心(NCBI)可获得的。同源物可以使用例如ClustalW序列多重比对算 法(1. 83版本)以默认配对比对参数和评分方法(以百分数计)而轻易地鉴定。相似性和同 一性的全局百分数也可以使用在MatGAT软件包中可获得的方法之一而确定(Campanella 等,BMC Bioinformatics. 2003 Jul 10 ;4 :29. MatGAT 用蛋白质或 DNA 序列而产生相似性 / 同一 生失巨P车的ISM (an applicationthat generates similarity/identity matrices using protein or DNAsequences))。可以进行细微手工编著以优化保守基序之间的比对, 如本领域技术人员显而易见。此外除了使用全长序列以鉴定同源物,也可以使用特定结构 域。使用上文提及的程序,使用默认参数,针对整个核酸序列或氨基酸序列或针对选择的 结构域或保守基序测定了序列同一性值。对于局部比对,Smith-Waterman算法尤其有用 (Smith TF, Waterman MS(1981)J. Mol. Biol 147(1) ; 195-7)。进一步,PATL多肽通常具有磷脂酰肌醇(Phosphatidylinositide,PtdIns)和 / 或磷脂酰胆碱(Ptd Cho)结合活性。它们优选结合磷脂酰肌醇。磷脂酰肌醇是指任何具有 其sn-甘油3-磷酸残基酯化为ID-肌-肌醇的1-羟基的糖磷脂(glycophospholipid)。 或者,PATL多肽通常体外催化磷脂酰肌醇(Phosphatidylinosito)和磷脂酰胆碱在膜之间 的转移。测定Ptdlns/PtdCho结合和,或跨膜转移的方法是本领域众所周知的(Bankaitis VA 等· (1990). Nature 347 :561_2 ;Peterman 等(2004))。或者,PATL核酸可通过其互补酿酒酵母secl4温度敏感型突变体的缺陷生长表型 的能力在功能性互补试验中鉴定。在此体内测试能够在酵母中表达PATL多肽的PATL核酸。 几种酿酒酵母secl4温度敏感型突变体菌株和其互补方法是本领域众所周知的(Kearns 等,(1998)EMBO J. 17,4004-17 ;Kapranov 等,(2001) ;Lee 等,(2000)Biochymbiophys Acta 1486 55-71)。另外,当PATL多肽、PRP38多肽、GATA样多肽或ADA2多肽在稻中表达且根据实施 例7和8中概述的本发明方法提高时,得到具有增强的产量相关形状的植物,该产量相关性 状尤其是种子总重量、种子饱满率、饱满种子数和每穗花总数中的任何一个或多个。本发明通过用SEQ ID NO 1所示的编码多肽序列SEQ ID NO :2的核酸序列转化 的植物加以说明,或通过用SEQ ID NO :76所示的编码多肽序列SEQ ID NO :77的核酸序列 转化的植物加以说明,或通过用SEQID N0:128所示的编码多肽序列SEQ ID N0:129的核 酸序列转化的植物加以说明,或通过用SEQ ID NO :181所示的编码多肽序列SEQ IDNO 182 的核酸序列转化的植物加以说明,或通过用SEQ ID N0:215所示的编码多肽序列WDR23样 多肽序列SEQ ID NO :216的核酸序列转化的植物加以说明。然而,本发明的实施不限于这 些序列。本发明方法可以使用如文中定义的任意PATL-编码核酸或PATL多肽,PRP38-编 码核酸或PRP38多肽或GATA样-编码核酸或GATA样多肽或ADA2-编码核酸或ADA2多肽 或WDR23样多肽有利地进行。编码PATL多肽或PRP38多肽或GATA样多肽或ADA2多肽或WDR23样多肽的核酸 的实例在本文实施例1的表A中给出。此类核酸可用于实施本发明的方法。实施例1的表 A中给出的氨基酸序列是SEQID NO 2所示的PATL多肽,或SEQ ID NO 77所示的PRP38多 肽,或SEQ ID NO 129所示的GATA样多肽,或SEQ ID NO 182所示的ADA2多肽,或SEQ ID NO :216所示的WDR23样多肽的直向同源物和旁系同源物的序列实例,术语“直向同源物” 和“旁系同源物”如文中所定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索而容易地鉴定。这通常涉及第一 BLAST,其中所述的第一 BLAST包括提交查询序 列(例如使用实施例1的表A中列出的任一序列)用于针对任一序列数据库(如公众可用 的NCBI数据库)的BLAST搜索。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX (使 用标准默认值),并且当从蛋白质序列开始时,可以使用BLASTP或TBLASTN(使用标准默认 值)。任选地可以筛选BLAST结果。随后提交筛选结果和非筛选结果的全长序列以针对来 自生物的序列进行反向BLAST (第二 BLAST),其中查询序列来自所述的生物(其中在查询 序列是SEQ ID NO :1或SEQ ID NO :2的情况下,第二 BLAST因而将针对稻序列;或在查询 序列是 SEQ ID N0:76 或 SEQ ID NO 77、SEQ ID N0:128 或 SEQID NO 129,SEQ ID NO 181 或 SEQ ID N0:182 或 SEQ ID NO :215 或 SEQ ID NO :216 的情况下,第二 BLAST 因而将针对 拟南芥序列)。随后比较第一和第二 BLAST搜索的结果。若来自第一 BLAST的高阶位命中 源自与查询序列从其中衍生的物种相同的物种,反向BLAST随后理想地在最高命中的查询 序列中产生,则鉴定到旁系同源物;若第一 BLAST的中的高阶位命中不源自与查询序列从 其中衍生的物种相同的物种,并且优选地在反向BLAST时产生属于最高命中之列的查询序 列,则鉴定到直向同源物。PRP38结构域是指在可发挥前_mRNA加工因子功能的多肽中发现的保守氨基酸序 列。其通常具有大约170个氨基酸的长度,但是例如在0stta_PRP38_l中较短,而在Vitvi_ PRP38_1多肽中较长(参见表C)。PRP38结构域可由表C中的任一 PRP38结构域序列所 示,且由任意下列多肽结构域所示,所述多肽与表C中的任一 PRP38结构域的序列同一性按 照递增的优选顺序为至少 50%,55%,60%,65%,70%,75%,80%,85%,90%,92%,95%, 98%或更高。PRP38结构域可包含一个或多个SEQ ID N0:123和SEQ ID N0:124所示的更 为保守的序列基序。或者,PRP38结构域可定义为与已知PRP38多肽,优选与表A中的任一多肽显著 匹配(significantly aligning)的任意多肽结构域。本文定义的两个多肽或两个结构域 之间的显著匹配是按照递增的优选顺序具有低于e_5(e的负5次幂)、1. e-10U. e_15、l. e_2°、
1 e"25 1 e-50 1 e_75 1 e-100 1 e-200 1 e-300 1 e-400 1 e-500 1 e-600 1 禾口 1 e-8CI0 的 e_ 倌的
± · O 、丄.C 、丄.C 、丄.C、丄.C、丄.C、丄.C、丄.C、丄.C、丄.C-‘! H ± · O|_| J O I H. |_| J
比对。多肽序列可使用本领域任意已知的方法比对,该方法包括全局和局部比对方法,例如 Blast 算法,例如 Altschul,SF,等,(1990) J. Mol. Biol. 215 :403_10 描述的算法。取得与 给定序列出现比对结果的概率作为用于鉴定相似多肽的基础。通常用来代表这种概率的参 数称作e-值(E-值)。所述e_值是S评分可靠性的一个量度。S评分是查询序列与包含 PRP38的查询序列的相似性的一个度量。e_值描述给定S评分预期以多少频率随机出现。 该e-值临界可以高至1.0。本发明方法中使用的PRP38多肽优选包含下述PRP38结构域,其当与已知PRP38 结构域,更优选当与表C中的任一 PRP38结构域比对时,按照递增的优选顺序具有低于
γ ι _10 ι -15 ι -20 ι -25 ι -50 ι -75 ι -100 ι -200 ι -300 ι -400 ι -500 ι -600 θ O、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、
1. e_7°° 和 1. e_8°° 的 e-值。多肽中存在的PRP38结构域可通过检索特定的数据库鉴定,该特定的数据库包含 覆盖保守蛋白质结构域和家族的序列多重比对和隐匿马尔科夫模型的集合,例如可获自 Sanger Institute,英国的Pfam。本文的实施例2显示了使用PRP38多肽作为查询序列的 Pfam检索到的结果。
DUF1777结构域是迄今描述的蛋白质的小子集中发现的保守氨基酸序列。其通常 为140至150个氨基酸的长度,虽然也发现更短的形式,参见例如Chlre_PRP38_l多肽的 DUF1777结构域(表C)。基于序列同源性,已在不同的活生物中鉴定了 DUF1777结构域。DUF 结构域的编辑(compilation)可见于可获自Sanger Institute (英国)的Pfam数据库中。 多肽中DUF1777结构域的存在可容易地通过筛选特定的数据库鉴定,该特定的数据库包含 覆盖保守蛋白质结构域和家族的序列多重比对和隐匿马尔科夫模型的集合,例如Pfam。包 含DUF1777结构域的多肽在检索Pfam数据库中,将登记为命中之前已知的DUF1777结构 域。真核来源的蛋白质中DUF1777结构域的氨基酸序列常常是很多变的,仅有少数几个氨 基酸残基是恰好保守的。两个DUF1777结构域比对的e_值通常高,一般高于0. 001,更一般 高于0. 01。本发明方法中使用的PRP38多肽优选包含下述DUF1777结构域,其当与已知 DUF1777结构域,更优选当与表C中的任一 DUF1777结构域比对时,按照递增的优选顺序
且有佃干 1 P-5 1 P-10 1 P-15 1 ρ-20 I P—25 1 P—50 1 ρ—75 1 ρ-100 1 ρ-200 1 ρ-300 1 ρ-400
^^ P^ IIsVj 」 丄、丄、丄、丄、丄、丄、丄、丄、丄、丄、丄>
1. e-5°°、1. e-_、1. e_7°° 和 1. e_8°° 的 e_ 值。本发明方法中使用的PRP38多肽更优选包含下述DUF1777结构域,其与表C中 的任一 DUF1777结构域按照递增的优选顺序具有至少50 %、55 %、60 %、65 %、70 %、75 %、 80%、85%、90%、92%、95%、98% 或更高的序列同一性。多肽中存在的DUF1777结构域可通过检索特定的数据库鉴定,该特定的数据库包 含覆盖保守蛋白质结构域和家族的序列多重比对和隐匿马尔科夫模型的集合,例如可获自 Sanger Institute,英国的Pfam。本文的实施例2显示了使用PRP38多肽作为查询序列的 Pfam检索你的结果。PRP38多肽可包含RS结构域。RS结构域是富含精氨酸(R)和丝氨酸(S)氨基酸 残基的多肽区域。RS结构域包含多个二肽,如序列RS (精氨酸-丝氨酸)、RE(精氨酸-谷 氨酸)、RD (精氨酸-天冬氨酸)所示的二肽。通常二肽跨越PRP38多肽从第4位至第150 位氨基酸的区域。上述二肽可在聚簇中存在,此类聚簇全部由任一个或多个RS、RE、RD 二肽 组成,且一般长度为4-40个氨基酸。本发明方法中使用的PRP38多肽优选包含一个或多个下述RS、RE、RD 二肽,其为 4、6、8、10、12、14、20、24、30、40、50、100 或最多 150 个氨基酸的一段序列。本发明方法中使用的PRP38多肽更优选包含两个或多个下述二肽聚簇,该聚簇全 部由RS、RE和/活RD氨基酸残基组成。更优选该PRP38多肽包含4个二肽聚簇,最优选的 二肽聚簇由RSRSRSRS所代表。PRP38多肽还可包含任一个或多个下列保守序列基序(iv) SEQ ID NO 120/ 基序 Ib :RRPPSVKASLSVSFGQRAPHRASTRDSSPVRRT,或与基 序Ib按照递增的优选顺序具有至少50%,55%,60%,65%,70%,75%,80%,85%,90%, 95%或更高序列同一性的基序;和/或(v)SEQ ID NO 121/ 基序 lib :SPHRA (I/V) GFLYLRY,或与基序 IIb 按照递增的优 选顺序具有至少 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高序列同一 性的基序;和/或(Vi)SEQ ID NO 122/基序IIIb :KLKDLYGD,或与基序IIIb按照递增的优选顺序具有至少 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高序列同一性的基序。优选地,本发明方法中使用的PRP38多肽包含任一个或多个以下基序(i)基序lb(SEQ ID NO 120),其中任意氨基酸残基可由保守氨基酸取代和/或多 达50 %的氨基酸残基可由非保守氨基酸取代。(ii)基序lb(SEQ ID NO :121),其中任意氨基酸残基可由保守氨基酸取代和/或 多达50 %的氨基酸残基可由非保守氨基酸取代。(iii)基序lb(SEQ ID NO 122),其中任意氨基酸残基可由保守氨基酸取代和/或 多达50 %的氨基酸残基可由非保守氨基酸取代。本发明方法中使用的PRP38多肽优选是下述,其与表A中给出的任意多肽按照递 增的优选顺序具有至少 50%,55%,60%,70%,75%,80%,85%,90%,92%,93%,95%, 96% ;98%或更高序列同一性。优选地,本发明方法中使用的PRP38多肽是下述,当其用于构建诸如图8所示的系 统树时,与包含SEQ ID NO 77的组Ib中的任意序列聚簇。通常在PRP38多肽中,PRP38结构域见于N-端,DUF1777结构域见于C-端。PRP38 多肽一般具有酸性C-端和,并定位于细胞核。另外,PRP38多肽一般具有前_mRNA剪切活性。测定前_mRNA剪切活性的工具和 技术是本领域众所周知的(Blanton S,等,(1992)Mol Cell Biol 12(9) 3939-47 ;Stevens SW 和 Abelson J(1999)Proc NatlAcad Sci USA 96(13) 7226-31;Gottschalk A,等, (1999)EMBO J18(16) 4535-48 ;Pandit S,等,(2006)Proc Natl Acad Sci USA103(37) 13700-5)。另外,当PRP38多肽根据实施例7和8中概述的本发明方法在稻中表达时,得到具 有增强的产量相关形状的植物,该产量相关性状尤其是地上部分叶生物量、萌发势、种子总 重量、种子饱满率、收获指数和种子总数中的任何一个或多个。本发明通过用SEQ ID NO :76所示的编码多肽序列SEQ ID NO :77的核酸序列转化 的植物加以说明。然而,本发明的实施不限于这些序列;本发明方法可以使用如文中定义的 任意PRP38-编码核酸或PRP38多肽有利地进行。如本文定义的“GATA样多肽”是指任意包含GATA结构域的Zn指转录因子(例如 SMART数据库中以登录号SM00401所定义的)。优选地,本发明方法中使用的“GATA样多肽” 是在Zn指的第二个和第三个Cys残基之间包含18或20个氨基酸的单个GATA结构域,更 优选在Zn指的第二个和第三个Cys残基之间包含18个氨基酸(CX2CX18CX2C)。术语“锌指” 或“Zn指”是本领域已知的,指下述序列基序,其中半胱氨酸和/或组氨酸与锌原子配位,形 成特定功能所需的局部肽结构。更优选,本发明方法中使用的GATA样多肽属于亚家族II,其由Reyes等(Plant Physiol. 134,1718-1732,2004)定义。亚家族II GATA转录因子一般由具有2或3个外显 子的基因组成,其中锌指分处于最后两个外显子中。亚家族II GATA转录因子在Zn指环中 也具有18个残基。本发明方法中使用的GATA样多肽中的GATA结构域优选包含B型Zn指类,其如 Reyes等,(2004)所定义。BZn指类结构域在Zn指环中具有18个残基,并由保守Ser残基
40(图11中示于GATA结构域的第27位)和保守IRX(R/K)K基序的存在进一步表征。优选地,GATA结构域包含基序Ic和/或基序2c 基序Ic (SEQ ID NO 130)C (S/A/T) (D/E/N) CXT (T/S/A) (K/S) TP (L/M) WR (S/G/N) GP其中X可以是任意氨基酸,X优选是N、K、G、H、D中的一个。基序2c(SEQ ID NO 131) :GPKSLCNACGIRX(R/K)K其中X可以是任意氨基酸,X优选是Q、H、N、S,Y,F中的一个。优选地,发明方法中使用的GATA样多肽还包含基序3c (SEQ IDNO 132)(A/S) (A/ff) X (L/C) (L/N) (M/L/V) (T/L/A) (L/D) (S/R)其中X可以是任意氨基酸,X优选是M、L、V、I、R中的一个。或者,GATA样蛋白质与SEQ ID NO 129所示的氨基酸,按照递增的优选顺序具 有至少 14%、15%、20%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、 36%,37%,38%,39%,40%,41 %,42%,43%,44%,45%,46%,47%,48%,49%,50%, 51 52%,53%,54%,55%,56%,57%,58%,59%,60%,61 62%,63%,64%,65%, 66%,67%,68%,69%,70%,71 %,72%,73%,74%,75%,76%,77%,78%,79%,80%, 81 82%,83%,84%,85%,86%,87%,88%,89%,90%,91 92%,93%,94%,95%, 96%、97%、98%或99%的全序列同一性,前提是同源蛋白质包含如上定义的GATA结构域 和一个或多个上述保守基序。全序列同一性使用全局比对算法,例如GAP (GCG Wisconsin Package, Accelrys)程序中的Needleman Wunsch算法测定,优选使用默认参数。与总体序 列同一性相比,当仅考虑保守结构域(例如GATA结构域)或基序时,序列同一性通常更高。优选地,当多肽序列用于构建例如Reyes等,(2004)中图11或图14描述的系统树 时,与Reyes等,(2004)定义的GATA样多肽“亚家族II ”组聚簇,而不与任何其他组聚簇, 该“亚家族II”组包含SEQ ID NO 129所示的氨基酸序列。另外,GATA样多肽(至少以其天然形式)一般具有DNA-结合活性。GATA-Zn指识 别的共有DNA序列是[AT]GATA[AG]。测定DNA结合活性的工具和技术是本领域众所周知 的,参见例如 Teakle 等,(Plant Mol. Biol. 50,43-57,2002),或 Ghirlando 和 Trainor (J. Biol. Chem. 278,45620-45628,2003)。另外,当GATA样多肽根据实施例7和8中概述的本发明方法在稻中表达时,得到 具有提高的千粒重的植物。本发明通过用SEQ ID NO 128所示的编码多肽序列SEQ IDNO 129的核酸序列转 化的植物加以说明。然而,本发明的实施不限于这些序列;本发明方法可以使用如文中定义 的任意GATA样-编码核酸或GATA样多肽有利地进行。本文定义的“ADA2多肽”是指任意转录衔接头多肽,其包含两个或多个以下基序
(vii) ZZ型锌(Zn)指结构域(viii)SANT DNA 结合结构域(ix)钙EF手结构域(χ) SffIRM 结构域ZZ型锌(Zn)指结构域的原型存在于肌养蛋白,CBP/p300蛋白质中。ZZ结构域中的 Cys-x2-Cys基序是存在于锌指中的回忆性的(reminiscent)Cys-x2_Cys指节(knuckle)。该结构域序列中的4-6个半胱氨酸残基负责与锌原子配位,以增强结构(Ponting等, TrendsBiochem Sci 1996 ;21 :11_13)。ADA2多肽中的ZZ型锌指结构域可参与协助蛋白 质-蛋白质相互作用。包含ZZ锌指结构域的拟南芥ADA2a和ADA2b蛋白质的片段已显示 结合GCN5蛋白质(Mao等,2006)。SANT DNA结合结构域是Myb DNA结合结构域的亚家族(Aasland等,1996 Trends Biochem Sci 1996 ;21 :87_88)。包含SANTDNA结合结构域的多肽特异性识别存在于基因启 动子中的序列YAAC(G/T)G。本发明方法中使用的ADA多肽结合包含序列YAAC(G/T)G的基 因启动子,其中Y可以是C或T。SffIRM结构域(Pfam登录号PF04433)是在真核染色体蛋白质中发现的大约85个 氨基酸的小α-螺旋结构域。其在首先识别的蛋白质SWI3、RSC8和MOIRA之后命名。预测 该结构域介导染色质_蛋白质复合体装配中的蛋白质_蛋白质相互作用Lenkart等,Proc Natl AcadSci USA. 2006 ;103 :2057_2062)。钙(Ca)结合EF手结构域由两侧连接十二个残基的α _螺旋结构的十二个残基环 组成。在EF-手环中,钙离子与五角双锥(pentagonalbipyramidal)构型配位。参与结合 的六个残基在第1、3、5、7、9和12位,这些残基表示为X、Y、Z、-Y、-X和-Z。第12位不变的 Glu 或 Asp 为配位 Ca提供两个氧(二齿配位体)(Finn 和 Forsen 1995Structure, 3 :7_11)。本发明方法中使用的优选ADA2多肽包含二个或多个以下结构域(i)SEQ ID NO :207 所示的 ZZ 型锌(Zn)指结构域kpglyccnycdkdlsglvrfkcavc mdfdlcvecfsvgvelnrhkn,或与SEQ ID NO 207所示的结构域或表A中的任一多肽中存在 的任何ZZ型锌指结构域按照递增的优选顺序具有至少50 %、55 %、60 %、65 %、70 %、75 %、 80%、82%、85%、90%、92%、95%、97%或更高序列同一性的结构域;(ii)SEQ ID NO 208 所示的 SANT DNA 结合结构域vtsdwnadeeillleaiatygfgn wkevadhvgsktttecikhfnsaym,或与SEQ ID NO 208所示的结构域或表A中的任一多肽中 存在的任何SANT结构域按照递增的优选顺序具有至少50 %、55 %、60 %、65 %、70 %、75 %、 80%、82%、85%、90%、92%、95%、97%或更高序列同一性的结构域;(iii) SEQ ID NO 209 所示的 Ca 结合 EF 手结构域dndaeqlIadmef,或与 SEQ ID NO 209所示的结构域或表A中的任一多肽中存在的任何Ca结合EF手结构域按照递增的 优选顺序具有至少 50%、55%、60%、65%、70%、75%、80%、82%、85%、90%、92%、95%、 97%或更高序列同一性的结构域;(iv) SEQ ID NO :210 所示的 SWIRM 结构域priysgldtwdvdgllgadllsetekkmcnet rilpvhylkmldiltreikkgqikkksdaysffkvepskvdrvydmlvhkgigdst,或与 SEQ ID NO :210 所 示的结构域或表A中的任一多肽中存在的任何SWIRM结构域按照递增的优选顺序具有至少 50%、55%、60%、65%、70%、75%、80%、82%、85%、90%、92%、95%、97% 或更高序列同 一性的结构域。本发明方法中使用的ADA2多肽优选是按照递增的优选顺序与表A中的任意多肽 具有至少 50%、55%、60%、70%、75%、80%、85%、90%、92%、93%、95%、96%、98% 或更 高序列同一性的那些多肽。多肽中包含的ZZ型锌(Zn)指结构域、SANT DNA结合、钙EF手结构域和SWIRM结 构域可通过检索特定的数据库鉴定,该特定的数据库包含覆盖保守蛋白质结构域和家族的序列多重比对和隐匿马尔科夫模型的集合,例如可获自Sanger Institute,英国的Pfam。 或者,上述结构域可通过扫描 The Integrated Resource of Protein Families, Domains 和Sites(InterPr0)数据库发现,以检测与已知ZZ型锌(Zn)指结构域、SANT DNA结合、钙 EF手结构域和SWIRM结构域的显著序列比对。Interpro数据库是常用的文本和序列_碱 基检索标签据书库的整合界面。InterPro数据库合并了这些数据库,所述数据库使用不同 的方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识。合 作数据库包括 SWISS-PROT、PROS ITE, TrEMBL, PRINTS、ProDom 和 Pfam、Smart 和 TIGRFAM。 Interpro由英国欧洲生物信息学研究所维护。本文定义的两个多肽或两个结构域之间的 显著匹配是按照递增的优选顺序具有低于e_5(e的负5次幂)、1. e-10U. e_15、l. e_2°、l. e_25、 1. e-5°、l. e_75、l. e-100U. fU. fU. e-4°°、l. fU. e-_、l. e—7。。和 1. e—8。。的 e-值的比对。 多肽序列可使用本领域任意已知的方法比对,该方法包括全局和局部比对方法,例如Blast 算法,例如Altschul,SF,等,(1990) J. Mol. Biol. 215 :403-10描述的算法。取得与给定序 列出现比对结果的概率作为用于鉴定相似多肽的基础。通常用来代表这种概率的参数称作 e_值(E-值)。所述e_值是S评分可靠性的一个量度。S评分是待比对的两个序列的相似 性的一个度量。e-值描述给定S评分预期以多少频率随机出现。该e_值可以高至1.0。用于本发明方法的ADA2多肽优选包含两个或多个以下结构域(i)ZZ型锌(Zn)指结构域,其当与已知ZZ型Zn指结构域,更优选当与表C中的任 一 ZZ型Zn指比对时,按照递增的优选顺序具有低于e_5、l. e」°、l. e_15、l. e_2°、l. e_25、l. e_5°、 1 e-75 1 e,0 1 e-200 1 e-300 1 e-400 1 e-500 1 e,0 1 e-700 禾口 1 e,0 的 e_ 倌-
丄、丄、丄、丄、丄、丄、丄、丄!丄|_| J O I PI. y(ii)SANT DNA结合结构域,其当与已知SANT DNA结合结构域,更优选当与表C 中的任一 SANT DNA结合结构域比对时,按照递增的优选顺序具有低于e_5、l. e-10U. e_15、
ι -20 ι -25 ι -50 ι -75 ι -100 ι -200 ι -300 ι -400 ι -500 ι -600 ι -700 知 ι -800 ΛΑ 丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 、丄·Θ 々U 丄· Θ ρ nJ
e_值;(iii)钙EF手结构域,其当与已知钙EF手结构域,更优选当与表C中的任一钙 EF手结构域比对时,按照递增的优选顺序具有低于e_5、l. e-10U. e_15、l. e_2°、l. e_25、l. e_5°、
1 e-75 1 e,0 1 e-200 1 e-300 1 e-400 1 e-500 1 e,0 1 e-700 禾口 1 e,0 的 e_ 倌-
丄、丄、丄、丄、丄、丄、丄、丄!丄|_| J O I PI. y(iv) SWIRM结构域,其当与已知SWIRM结构域,更优选当与表C中的任一 SWIRM结 构域比对时,按照递增的优选顺序具有低于e_5、l. e-10U. e_15、l. e_2°、l. e_25、l. e_5°、l. e_75、 1 e,0 1 e-200 1 e-300 1 e-400 1 e-500 1 e,0 1 e-700 禾卩 1 e,0 勺 e_ 倌
± · O、丄.C、丄.C、丄.C、丄.C、丄.C、丄.C-‘! H ± · O|_| J O I H. ο或者,ADA2多肽可定义为与已知ADA2多肽,优选与表A中的任一多肽显著匹配的 任意多肽。优选地,用于本发明方法的ADA2多肽序列是下述多肽序列,当其用于构建诸如图 17所示的系统树时,与该树中的任意序列聚簇,尤其优选与包含SEQ ID NO 182的组Id中 的序列聚簇。在ADA2多肽中,通常ZZ Zn指结构域见N-端,SANT-DNA结合结构域见于中间部 分,SffIRM结构域见于C-端.ADA2多肽一般定位于细胞核。植物ADA2多肽可包含核定位 信号,例如图15中的SEQID NO 182所示。另外,ADA2多肽通常体外增强GCN5乙酰化组蛋白的能力,使得GCN5能够乙酰化 核小体组蛋白。测定组蛋白乙酰化的工具和技术前已描述(Stockinger等,2001 ;Mao等,2006)。植物细胞中植物来源的ADA2多肽活性的调控可通过乙酰化进行。已提出拟南芥 ADA2b中ADA2a的赖氨酸残基K257和K215可被乙酰化。本发明提供编码WDR23样多肽的核酸序列和WDR23样多肽,由此相对于对照植物, 植物中分离的核酸序列的增加的表达增强产量_相关性状。因此本发明的一个实施方案提供WDR23样多肽的分离的核酸序列,其包含(i)SEQ ID NO :219、SEQ ID NO 225 或 SEQ ID NO 229 所示的分离的核酸序列;(ii)SEQ ID NO :219、SEQ ID N0:225或SEQ ID NO :229所示的分离的核酸序列的 互补序列;(iii)编码 SEQ ID NO :220、SEQ ID N0:226 或 SEQ ID NO :230 所示的多肽序列的 分离的核酸序列;(iv)由于遗传密码简并性的原因可从SEQ ID NO 220、SEQ IDNO 226或SEQ ID NO 230所示的多肽序列推导出来的分离的核酸序列;(ν)能够在严格杂交条件下与 SEQ ID NO 219、SEQ ID NO: 225 或 SEQ ID NO 229 所示的核酸序列或其互补序列杂交的分离的核酸序列;(vi)分离的核酸序列,其编码下述多肽,所述多肽与SEQ ID NO :220、SEQ ID NO 226或SEQ ID NO :230所示的多肽序列,按照递增的优选顺序具有至少50%、55%、60%、 65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99% 或更高氨基酸序列同一 性;(iv)分离的核酸序列,其编码包含下述结构域的多肽,所述结构域与SEQ ID NO 271所示的保守结构域,按照递增的优选顺序具有至少65 %、70%、75 %、80%、85 %、90%、 95%、96%、97%、98%、99%或更高氨基酸序列同一性。本发明的另一个实施方案还提供下述分离的WDR23样多肽,其包含(i)SEQ ID NO :220、SEQ ID NO 226 或 SEQ ID NO 230 所示的多月太序列;(ii)与 SEQ ID NO :220、SEQ ID NO 226 或 SEQ ID NO 230 所示的多肽序列按照 递增的优选顺序具有至少 50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,96%, 97%、98%、99%氨基酸序列同一性的多肽序列;(iii)包含下述结构域的多肽,所述结构域与SEQ ID NO :271所示的保守结构域, 按照递增的优选顺序具有至少 65%,70%,75%,80%,85%,90%,95%,96%,97%,98%,
99%或更高氨基酸序列同一性;(iii)上述(i)至(iii)中任意多肽序列的衍生物。根据另一实施方案,本发明提供相对于对照植物,在植物中增强产量-相关性状 的方法,其包含在植物中增加编码WDR23样多肽的核酸序列的表达。增加编码WDR23样多肽的核酸序列的表达的优选方法是通过在植物中引入和表 达编码WDR23样多肽的核酸序列。下文中对“用于本发明方法中的多肽”的任何提及意指如本文中所定义的WDR23 样多肽。下文中对“用于本发明方法中的核酸序列”的任何提及意指能够编码此类WDR23 样多肽的核酸序列。待引入植物的核酸序列(并因此用于实施本发明的方法)是任意编码 下述类型的多肽的核酸序列,所述多肽现已描述,在下文中也称为“WDR23样核酸序列”或 "WDR23样基因”。
本文定义的“WDR23样多肽”是指包含下述结构域的多肽,所述结构域与SEQ ID NO 271 所示的保守结构域(CD)具有至少 65%,70%,75%,80%,85%,90%,95%,98%,
99 %或更高氨基酸序列同一性。或者或另外,本文定义的“WDR23样多肽”是指任意下述多肽,其包含⑴至少四 个具有PFAM登录号PF00400的WD40重复;和(ii)两个连续WD40重复末端的至少两个保 守的DxR基序。或者或另外,本文定义的“WDR23样多肽”是指任意下述多肽,其与SEQ ID NO 216所示的WDR23样多肽或本文表A中给出的任意多肽序列按照递增的优选顺序具有至 少 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高氨基酸同一性。多肽序列SEQ ID NO 216的分析示于本文下面的实施例4中。例如,SEQ ID NO 216所示的WDR23样多肽包含至少四个具有PFAM登录号PF00400的WD40重复。结构域还 可以使用诸如序列比对的常规技术鉴定。本文表A的全长多肽的比对示于图23。此类比对 可用于鉴定WDR23样多肽之间的最保守结构域,例SEQ ID NO :271所示的保守结构域(⑶) (包含于 SEQ ID NO 216 中)。还可以使用常规技术(如序列比对)来鉴定结构域。比对序列以进行比较的 方法为本领域所熟知,这些方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP利用 Needleman和Wunsch ((1970) J Mol Biol 48 :443_453)的算法来寻找两序列间使匹配数最 高并使空位数最少的全局比对(即在完整序列上)。BLAST算法(Altschul等(1990) J Mol Biol 215:403-10)在两序列间计算百分比序列同一性并进行相似性的统计学分析。用于 进行BLAST分析的软件在国际生物技术信息中心(National Centre for Biotechnology Information(NCBI))向公众提供。可以使用如默认配对比对参数的ClustalW序列多重 比对算法(1.83版)和百分比评分法来容易地鉴定同源物。也可以使用MatGAT软件包 (Campanella 等,BMC Bioinformatics. 10:29. MatGAT :anapplication that generates similarity/identity matrices using protein orDNA sequences)中提供的一禾中方法石角 定全局的相似性和同一性百分比。本领域技术人员会意识到,可以进行少量手动编辑以优 化保守性基序之间的比对。此外,还可以使用特定的结构域代替全长序列来鉴定同源物。 序列同一性值可是使用默认参数的上述程序在完整的核酸序列或氨基酸序列上或在所选 择的结构域或保守的基序测定的。本文实施例3在表B中描述了 SEQ ID N0:216所示的 WDR23样多肽和表A中列举的全长WDR23样多肽之间的同一性百分比,其可低至54%氨基 酸序列百分比。如果同一性计算在SEQ ID N0:271所示的保守结构域(⑶)(包含于SEQ ID NO 216中)和表A的WDR23样多肽的保守结构域之间进行,同一性百分比可增加至69%, 如图23所示。此类计算的结构见于本申请表B。蛋白质亚细胞定位预测的工作是很重要的,并已充分研究。了解蛋白质的定位有 助于阐明其功能。蛋白质定位实验方法的范围从免疫定位到使用绿色荧光蛋白(GFP)或 β-葡糖醛酸酶(GUS)标记蛋白质。这些方法很准确,但与计算机方法相比需要大量劳动。 从序列数据对蛋白质定位进行计算机预测近来已取得很大进展。本领域技术人员熟知的 算法在Swiss Institute for Bioinformatics提供的ExPASy蛋白组学工具可获得,例如 PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTSl、SignalP、TMHMM寸。另外,本发明方法中使用的WDR23样多肽(至少以它们的天然形式)一般能够通 过它们的WD40重复基序与其他多肽相互作。存在多种蛋白质_蛋白质活性的测试,例如酵 母双杂交测试、后接质谱的串联亲和纯化(TAP)、共亲和纯化等。高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶 然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了 E-值外,比较结果也由同 一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内 相同核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接 树法,以帮助观察相关基因的聚类并鉴定直向同源物和旁系同源物。核酸变体也可以用于实施本发明的方法。此类核酸变体的实例包括编码实施例1 的表A中给出的任一氨基酸序列的同源物和衍生物的核酸,术语“同源物”和“衍生物”如 文中所定义。也可用于本发明方法中的是编码实施例1的表A中给出的任一氨基酸序列的 直向同源物或旁系同源物的同源物和衍生物的核酸。用于本发明方法中的同源物和衍生物 与它们衍生自的未修饰的蛋白质具有基本相同的生物和功能活性。 用于实施本发明方法的其他核酸变体包括编码PATL或PRP38或GATA样或ADA2或 WDR23样多肽的核酸的部分;与编码PATL或PRP38或GATA样或ADA2或WDR23样多肽的核 酸杂交的核酸;编码PATL或PRP38或GATA样或ADA2或WDR23样多肽的核酸的剪接变体; 编码PATL或PRP38或GATA样或ADA2或WDR23样多肽的核酸的等位变体;以及通过基因改 组获得的编码PATL或PRP38或GATA样或ADA2或WDR23样多肽的核酸的变体。术语杂交 序列、剪接变体、等位变体和基因改组如文中所述。编码PATL或PRP38或GATA样或ADA2或WDR23样多肽的核酸不需要是全长核酸, 因为本发明方法的实施不依赖全长核酸序列的使用。本发明提供在植物中增强产量相关性 状的方法,其包括在植物中引入和表达实施例1的表A中给出的核酸序列中任一个的部分, 或实施例1的表A中给出的氨基酸序列中任一个的直向同源物、旁系同源物或同源物的编 码核酸的部分。核酸的部分可以例如通过对该核酸产生一个或多个缺失而制备。所述的部分可以 以分离的形式加以使用或它们可以与其他编码性(或非编码性)序列融合,以便例如产生 组合几种活性的蛋白质。当与其他编码序列融合时,翻译时产生的所得多肽可以比对该蛋 白质部分所预测的多肽更大。用于本发明方法中的部分编码文中定义的PATL或PRP38或ADA2多肽,其与实施 例1的表A中给出的氨基酸序列具有基本相同的生物学活性。用于本发明方法中的部分包 含下述蛋白质结构域,所述结构域与表C中定义的保守结构域中的任一个,按照递增的优 选顺序具有 50%、55%、60%、70%、75%、80%、85%、90%、92%、93%、95%、96%、98% 或 更高序列同一性。优选地,此部分是在实施例1的表A中给出的任何一种核酸的部分,或实 施例1的表A中给出的氨基酸序列中任一个的直向同源物或旁系同源物的编码核酸的部 分。此部分的长度优选为至少 50、100、150、200、300、400、500、550、600、650、700、750、800、 850、900、950、1000、1200或更多个连续核苷酸,其中所述的连续核苷酸是实施例1的表A中 给出的任何一种核酸序列,或是实施例1的表A中给出的氨基酸序列中任一个的直向同源 物或旁系同源物的编码核酸。优选地,此部分编码下述氨基酸序列的片段,当该氨基酸序列
46用于构建诸如图3所示的系统树时,与该树中的任意序列聚簇,尤其优选与包含SEQ ID NO 2的组Ia中的序列聚簇。进一步优选地,此部分是核酸SEQ ID NO 76的部分,最优选地, 此部分是SEQ ID N0:82所示的部分。优选地,此部分编码下述氨基酸序列的片段,当其用 于构建诸如图8所示的系统树时,与包含SEQ ID NO 77的组Ib中的任意序列聚簇。对于GATA样多肽,用于本发明方法中的部分编码文中定义的GATA样多肽,其与实 施例1的表A中给出的氨基酸序列具有基本相同的生物学活性。优选地,此部分是在实施 例1的表A中给出的任何一种核酸的部分,或实施例1的表A中给出的氨基酸序列中任一 个的直向同源物或旁系同源物的编码核酸的部分。此部分的长度优选为至少500、550、600、 650、700、750、800、850、900、950、1000、1050个连续核苷酸,其中所述的连续核苷酸是实施 例1的表A中给出的任何一种核酸序列,或是实施例1的表A中给出的氨基酸序列中任一个 的直向同源物或旁系同源物的编码核酸。最优选地,此部分是核酸SEQID N0:128的部分。 优选地,此部分编码下述氨基酸序列的片段,当该片段用于构建例如Reyes等,(2004)中图 11或图14描述的系统树时,与Reyes等,(2004)定义的GATA样多肽“亚家族II”组聚簇, 而不与任何其他组聚簇,该“亚家族II ”组包含SEQ ID NO 129所示的氨基酸序列。用于本发明方法中的部分编码文中定义的WDR23样多肽,其与实施例1的表A中 给出的多肽序列具有基本相同的生物学活性。优选地,此部分是在实施例1的表A中给 出的任何一种核酸序列的部分,或实施例1的表A中给出的多肽序列中任一个的直向同 源物或旁系同源物的编码核酸序列的部分。此部分的长度优选为至少400、450、500、550、 600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、 1450、1480个或更多个连续核苷酸,其中所述的连续核苷酸是实施例1的表A中给出的任何 一种核酸序列,或是实施例1的表A中给出的多肽序列中任一个的直向同源物或旁系同源 物的编码核酸序列。优选地,此部分是编码下述多肽序列的核酸序列的部分,该多肽包含与 SEQ ID NO :271 所示的保守结构域(CD)具有至少 65%、70%、75%、80%、85%、90%、95%、 98%、99%或更高氨基酸序列同一性的结构域。最优选地,此部分是核酸序列SEQ IDNO 215 的部分。用于本发明方法中的另一核酸变体是能够在降低的严格条件下、优选在严格条件 下与编码如文中所定义的PATL或PRP38或GATA样或ADA2或WDR23样多肽的核酸杂交,或 与如文中所定义的部分杂交的核酸。本发明提供用于在植物中增强产量相关性状的方法,其包括在植物中引入并表达 能够与实施例1的表A中给出的任何一种核酸杂交的核酸,或包括在植物中引入并表达如 此一种核酸,其能够与实施例1的表A中给出的任意核酸序列的直向同源物、旁系同源物或 同源物的编码核酸杂交的核酸。用于本发明方法中的杂交序列编码文中定义的PATL或PRP38或GATA样或ADA2 或WDR23样多肽,其与实施例1的表A中给出的氨基酸序列具有基本相同的生物学活性。 优选地,杂交序列能够与实施例1的表A中给出的任一核酸杂交或与任意这些序列的部分 杂交,其中所述的部分如上文所定义,或者其中杂交序列能够与实施例1的表A中给出的 任一氨基酸序列的直向同源物或旁系同源物的编码核酸杂交。最优选地,杂交序列能够与 SEQ ID NO :1所示的核酸或其部分杂交,或与SEQ ID NO :76所示的核酸或其部分杂交,或 与SEQ ID NO :128所示的核酸或其部分杂交,或与SEQ ID NO 181所示的核酸或其部分杂交。关于WDR23样序列,杂交序列优选能够与编码下述多肽序列的核酸序列杂交,该多肽包 含与SEQ ID NO :271所示的保守结构域(CD)具有至少65%、70%、75%、80%、85%、90%、 95%、98%、99%或更高氨基酸序列同一性的结构域。最优选地,杂交序列能够与SEQ IDNO 215所示的核酸序列或其部分杂交。优选地,此杂交序列编码具有下述氨基酸序列的多肽,当该氨基酸序列为全长并 用于构建诸如图3所示的系统树时,与该树中的任意序列聚簇,尤其优选与包含SEQ ID NO 2的组Ia中的序列聚簇,或当其用于构建诸如图8所示的系统树时,与包含SEQ ID NO 77 的组Ib中的任意序列聚簇。同样优选地,此杂交序列编码具有下述氨基酸序列的多肽,当 该氨基酸序列为全长并用于构建例如Reyes等,(2004)中图11或图14描述的系统树时,与 Reyes等,(2004)定义的GATA样多肽“亚家族II ”组聚簇,而不与任何其他组聚簇,该“亚 家族II”组包含SEQ IDNO 129所示的氨基酸序列。用于本发明方法中的另一种核酸变体是编码如上文所定义的PATL或PRP38或 GATA样或ADA2或WDR23样多肽的剪接变体,剪接变体如文中所定义。本发明提供用于在植物中增强产量相关性状的方法,其包括在植物中引入并表达 实施例1的表A中给出的任何一种核酸序列的剪接变体,或实施例1的表A中给出的任意 氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的剪接变体。优选的剪接变体是SEQ ID NO=I所示的核酸的剪接变体,或编码SEQ ID NO 2的 直向同源物或旁系同源物的核酸的剪接变体。更优选地,剪接变体是SEQ ID NO :1的变体。 优选地,当此剪接变体编码的氨基酸序列用于构建诸如图3所示的系统树时,与该树中的 任意序列聚簇,尤其优选与包含SEQ ID NO 2的组Ia中的序列聚簇。其他优选的剪接变体是SEQ ID NO :76所示的核酸的剪接变体,或编码SEQ ID NO 77的直向同源物或旁系同源物的核酸的剪接变体。更优选地,剪接变体是SEQ ID N0:76的 变体,剪接变体最优选是SEQ IDNO :76所示的剪接变体。优选地,当此剪接变体编码的氨基 酸序列用于构建诸如图8所示的系统树时,与包含SEQ ID NO 77的组Ib中的任意序列聚 簇。更优选的剪接变体是SEQ ID NO 128所示的核酸的剪接变体,或编码SEQ ID NO 129的直向同源物或旁系同源物的核酸的剪接变体。优选地,当此剪接变体编码的氨基酸序 列用于构建例如Reyes等,(2004)中图11或图14描述的系统树时,与Reyes等,(2004)定 义的GATA样多肽“亚家族II ”组聚簇,而不与任何其他组聚簇,该“亚家族II ”组包含SEQ ID NO: 129所示的氨基酸序列。进一步优选的剪接变体是SEQ ID NO 181所示的核酸的剪接变体,或编码SEQ ID NO :182的直向同源物或旁系同源物的核酸的剪接变体。更优选地,剪接变体是SEQ ID NO 181的变体。优选地,当此剪接变体编码的氨基酸序列用于构建诸如图17所示的系统树时, 与该树中的任意序列聚簇,尤其优选与包含SEQ ID NO :182的组Id中的序列聚簇。人直向同源物WRD23呈现为多个同种型(NCBI登录号AK057636. 1),因此,也可预 测为编码WRD23样多肽的植物核酸序列的剪接变体。对于WDR23样序列,优选的剪接变体是SEQ ID NO :215所示的核酸序列的剪接变 体,或编码SEQ ID NO :216的直向同源物或旁系同源物的核酸序列的剪接变体。优选地,剪 接变体是编码下述多肽序列的核酸序列的剪接变体,该多肽包含与SEQ ID N0:271所示的
48保守结构域(CD)具有至少65%、70%、75%、80%、85%、90%、95%、98%、99%或更高氨基 酸同一性的结构域。用于实施本发明方法的另一种核酸变体是编码如上文所定义的PATL或PRP38或 GATA样或ADA2或WDR23样多肽的核酸的等位变体,等位变体如文中所定义。本发明提供用于在植物中增强产量相关性状的方法,其包括在植物中引入并表达 实施例1的表A中给出的任何一种核酸的等位变体,或包括在植物中引入并表达实施例1 的表A中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的等位变 体。用于本发明方法中的等位变体具有与PATL多肽SEQ ID NO 2和实施例1的表A 中所示的任意氨基酸基本相同的生物学活性。等位变体天然存在,且包含在本发明方法中 的是这些天然等位基因的用途。优选地,等位变体是SEQ ID NO :1的等位变体,或编码SEQ ID NO :2的直向同源物或旁系同源物的核酸的等位变体。优选地,当此等位变体编码的氨基 酸序列用于构建诸如图3所示的系统树时,与该树中的任意序列聚簇,尤其优选与包含SEQ ID NO 2的组Ia中的序列聚簇。用于本发明方法中的其他等位变体具有与PRP38多肽SEQ IDNO 77和实施例1的 表A中所示的任意氨基酸基本相同的生物学活性。等位变体天然存在,且包含在本发明方 法中的是这些天然等位基因的用途。优选地,等位变体是SEQ ID NO :76的等位变体,或编 码SEQ IDNO :77的直向同源物或旁系同源物的核酸的等位变体。优选地,当此等位变体编 码的氨基酸序列用于构建诸如图8所示的系统树时,与包含SEQ ID NO ,11的组Ib中的任 意序列聚簇。对于GATA样多肽,用于本发明方法中的等位变体具有与GATA样多肽SEQ ID NO 129和实施例1的表A中所示的任意氨基酸基本相同的生物学活性。等位变体天然存在,且 包含在本发明方法中的是这些天然等位基因的用途。优选地,等位变体是SEQ ID NO 128的等位变体,或编码SEQ IDNO 129的直向同 源物或旁系同源物的核酸的等位变体。优选地,当此等位变体编码的氨基酸序列用于构建 例如Reyes等,(2004)中图11或图14描述的系统树时,与Reyes等,(2004)定义的GATA 样多肽“亚家族II”组聚簇,而不与任何其他组聚簇,该“亚家族II”组包含SEQ IDNO 129 所示的氨基酸序列。对于ADA2多肽,用于本发明方法中的等位变体具有与ADA2多肽SEQ ID NO 182 和实施例1的表A中所示的任意氨基酸基本相同的生物学活性。等位变体天然存在,且包 含在本发明方法中的是这些天然等位基因的用途。优选地,等位变体是SEQ ID N0:181的 等位变体,或编码SEQ ID NO :182的直向同源物或旁系同源物的核酸的等位变体。优选地, 当此等位变体编码的氨基酸序列用于构建诸如图17所示的系统树时,与该树中的任意序 列聚簇,尤其优选与包含SEQ ID NO 182的组Id中的序列聚簇。对于WDR23样多肽,用于本发明方法中的等位变体具有与WDR23样多肽SEQ ID NO 216和实施例1的表A中所示的任意多肽基本相同的生物学活性。等位变体天然存在, 且包含在本发明方法中的是这些天然等位基因的用途。优选地,等位变体是SEQ ID N0:215 的等位变体,或编码SEQ ID NO :216直向同源物或旁系同源物的核酸序列的等位变体。优 选地,此等位变体是下述多肽序列的等位变体,该多肽包含与SEQ ID N0:271所示的保守结构域(CD)具有至少65%、70%、75%、80%、85%、90%、95%、98%、99%或更高氨基酸序列 同一性的结构域。基因改组或定向进化也可以用来产生编码如上文定义的PATL或PRP38或GATA样 或ADA2或WDR23样多肽的核酸的变体;术语“基因改组”如文中所定义。本发明提供用于在植物中增强产量相关性状的方法,其包括在植物中引入并表达 实施例1的表A中给出的任何一种核酸序列的变体,或包括在植物中引入并表达如此核酸 的变体,其中所述的核酸编码实施例1的表A中给出的任意氨基酸序列的直向同源物、旁系 同源物或同源物,所述变体核酸通过基因改组获得。优选地,通过基因改组获得的变体核酸编码的下述氨基酸序列,当其用于构建诸 如图3所示的系统树时,与该树中的任意序列聚簇,尤其优选与包含SEQ ID N0:2或SEQ ID NO ,11的组la中的序列聚簇。同样优选地,通过基因改组获得的变体核酸编码的下述氨基 酸序列,当其用于构建例如Reyes等,(2004)中图11或图14描述的系统树时,与Reyes等, (2004)定义的GATA样多肽“亚家族II”组聚簇,而不与任何其他组聚簇,该“亚家族II” 组包含SEQ ID NO: 129所示的氨基酸序列。对于ADA2,优选通过基因改组获得的变体核酸 编码的下述氨基酸序列,当其用于构建诸如图17所示的系统树时,与该树中的任意序列聚 簇,尤其优选与包含SEQ ID NO :182的组Id中的序列聚簇。对于WDR23,通过基因改组获 得的变体核酸序列编码的下述多肽序列,其包含与SEQ ID NO :271所示的保守结构域(⑶) 具有至少65%、70%、75%、80%、85%、90%、95%、98%、99%或更高氨基酸序列同一性的 结构域。另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱 变,最常见的是基于 PCR 的方法(Current Protocols inMolecular Biology. Wiley 编)。
编码PATL或PRP38或GATA样或ADA2多肽的核酸可以来自任何自然来源或人工来 源。核酸可以从其天然形式就组成和/或基因组环境方面通过人类有意操作而加以修饰。 编码PATL或GATA样多肽的核酸优选地来自植物,还优选来自单子叶植物,还优选来自禾本 科(poaceae),最优选地来自稻的核酸。编码PRP38多肽的核酸优选地来自植物,还优选来 自双子叶植物,更优选来自十字花科(brasicaceae),该核酸最优选来自拟南芥的核酸。编 码ADA2多肽-encoding核酸优选地来自植物,还优选来自双子叶植物,更优选来自十字花 科,该核酸最优选来自拟南芥的核酸。编码WDR23样多肽的核酸序列可以来自任何自然来 源或人工来源。核酸序列可以从其天然形式就组成和/或基因组环境方面通过人类有意操 作而加以修饰。编码WDR23样多肽的核酸序列来自真核生物域(domain),优选来自植物界, 进一步优选来自双子叶植物。更优选地,编码WDR23样多肽的核酸序列来自十字花科,最优 选地,编码WDR23样多肽的核酸序列来自拟南芥。有利地,本发明在此提供未知的PATL核酸和多肽序列。本发明的另一实施方案提供分离的核酸分子,其包含(i)SEQ ID NO 9 ;SEQ ID NO 11 ;SEQ ID NO 13 ;SEQ IDN0 :15 ;SEQ ID NO 17 ; SEQ ID NO 19 ;SEQ ID NO 21 ;SEQID NO 23 ;SEQ ID NO :25和SEQ ID NO :27所示的核酸;(ii)与(i)中给出的任一 SEQ ID NO互补的核酸或其片段;(iii)编码下述PATL多肽的核酸,所述多肽与SEQ ID NO 10 ;SEQ ID NO 12 ; SEQ ID NO 14 ;SEQ ID NO 16 ;SEQ ID NO 18 ;SEQ ID NO 20 ;SEQ ID NO 22 ;SEQ ID NO 24 ;SEQ ID N0:26和SEQ ID NO :28给出的任一氨基酸序列按照递增的优选顺序具有至少 70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高序列同一性;(iv)能够在严格杂交条件下与上述(i)、(ii)或(iii)给出的任一核酸杂交的核酸。本发明的另一实施方案提供分离的多肽,其包含(i)与 SEQ ID NO 10 ;SEQ ID NO 12 ;SEQ ID NO 14 ;SEQID NO 16 ;SEQ ID NO 18 ;SEQ ID NO 20 ;SEQ ID NO 22 ;SEQID NO 24 ;SEQ ID NO :26和SEQ ID NO :28给出的任 一氨基酸序列按照递增的优选顺序具有至少80%、85%、90%、95%、96%、97%、98%、99% 或100%序列同一性的氨基酸序列;(ii) (i)中给出的任意氨基酸序列的衍生物。本发明方法的实施产生了具有增强的产量相关性状的植物。特别地,本发明方法 的实施产生这样的植物,其相对于对照植物具有提高的产量、尤其提高的种子产量。术语 “产量”和“种子产量”在本文的“定义”部分中更详细地描述。本文中对增强的产量相关性状的谈及意指植物的一个或多个部分的生物量(重 量)增加,所述的部分可以包括地上(可收获)部分和/或地下(可收获)部分。特别地, 此类可收获部分是种子,并且本发明方法的实施产生了相对于对照植物的种子产量而言, 具有提高的种子产量的植物。以谷物为例,产量提高可以表现为以下一个或多个指标每平方米已建立的植物 数目增加、每株植物花序数的提高、行数、每行核粒数、核粒重、千粒重、花序长度/直径的 提高、种子饱满率(即饱满种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量 提高可以自身表现为下列一种或多种指标的提高每平方米植物数、每株植物的花序数、每 个花序的小穗数、每个花序的花(小花)数目(其表述为饱满种子数对原发花序数的比)、 种子饱满率(即饱满种子数除以种子总数并乘以100)提高、千粒重提高及其他。本发明提供相对于对照植物增加产量尤其是植物种子产量的方法,所述方法包括 调节编码如本文定义的PATL或PRP38或GATA样或ADA2或WDR23样多肽的核酸在植物中 的表达。由于本发明的转基因植物具有提高的产量,故这些植物有可能在其生活周期的相 应阶段(在其生活周期的至少部分期间)相对于对照植物的生长速率表现出提高的生长速率。提高的生长速率可以是植物的一个或多个部分(包括种子)特有的,或可以基本 上遍及整株植物。具有提高的生长速率的植物可以具备较短的生活周期。植物的生活周期 可以意指从干燥成熟种子生长直至植物已经产生与起始材料相似的干燥成熟种子的阶段 所需要的时间。这个生活周期可以受诸因素如早期生长势、生长速率、绿度指数、开花时间 和种子成熟速度影响。生长速率的提高可以在植物生活周期的一个或多个阶段上或基本上 在植物整个生活周期期间发生。在植物生活周期中早期期间提高的生长速率可以反映增强 的生长势。生长速率的提高可以改变植物的收获周期,从而允许植物更晚地播种和/或更 早地收获,而这本来是不可能的(可以随更早的开花时间获得相似效果)。如果大幅提高 生长速率,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播 种并收获其他稻植物,全部稻植物均处于一个常规生长时期中)。类似地,如果大幅提高生长速率,则可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例 如播种并任选收获大豆、马铃薯或任何其他合适的植物)。在一些作物植物的例子中,来自 相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每平方米一年 生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。 生长速率的提高也可以允许将转基因植物在比其野生型对应物更广泛的地理区域内培育, 因为培育作物的地域限制往往由栽种时期(早季)或在收获时期(晚季)的不利环境条件 决定。如果缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线衍生 多个参数而确定,此类参数可以是T_Mid(植物达到50%最大植物大小所花费的时间)和 Τ_90(植物达到90%最大植物大小所花费的时间),以及其他。根据本发明的一个优选特征,本发明方法的实施产生了相对于对照植物具有提高 的生长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包 括在植物中调节编码如本文中定义的PATL或PRP38或GATA样或ADA2或WDR23样多肽的 核酸表达。在包括植物日常所暴露的胁迫的典型农业生长条件下,出现产量和/或生长速率 的提高。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可能 完全停止生长。另一方面,轻度或日常胁迫为植物所暴露的任何下述胁迫,其中所述的胁迫 不导致植物完全停止生长,但同时不能恢复生长。与非胁迫条件下的对照植物相比较,轻 度胁迫在本发明的意义下导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于 25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌 溉、施肥、杀虫剂处理)的进步,栽培作物植物中并不经常遭遇严重胁迫。在典型农业条件 下培育的植物可能经常遇到轻度胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是 不受欢迎的特征。轻度胁迫是植物所暴露的常见生物胁迫和/或非生物(环境)胁迫。非 生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻 温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引 起的渗透胁迫。对于GATA样,与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种 胁迫下,都发生产量和/或生长速率的增加。对于WDR23,与相当条件下生长的对照植物相 比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量相关性状的增强。 植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完 全停止生长。另一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁 迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻 微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、 20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施 肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫 诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非 生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁 迫和热、寒冷或冰冻温度所致。生物胁迫一般是由病原体如细菌、病毒、真菌、线虫和昆虫引 起的那些胁迫。如本文中所用的术语”非胁迫”条件是允许植物最佳生长的环境条件。本 领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
52
特别地,本发明的方法可以在非胁迫条件下或在轻度干旱条件开展以产生相对于 对照植物具有提高的产量的植物。如Wang等(Planta (2003) 218 1-14)中报道,非生物性 胁迫导致一系列不利地影响植物生长及生产力的形态学、生理学、生物化学和分子变化。干 旱、盐度、极端温度和氧化胁迫已知相互联系并可以通过相似的机制诱导生长损害及细胞 损害。Rabbani等(Plant Physiol (2003) 133 1755-1767)描述了干旱胁迫与高盐度胁迫之 间极高程度的“交互作用”。例如,干旱和/或盐化作用主要表现为渗透胁迫,从而导致细胞 内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以引起功 能蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号传导途径和 细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。术语“非胁迫” 条件是允许植物最佳生长的那些环境条件。本领域技术人员清楚对于给定地点的正常土壤 条件和气候条件。如本文中所用的术语非胁迫条件包括植物所暴露的偶尔的或平常的轻度 胁迫,如本文定义的,但不包括重度胁迫。相对于可比较条件下培育的对照植物,本发明方法的实施赋予在非胁迫条件下或 在轻度干旱条件下培育的植物提高的产量。因此,根据本发明,提供了用于在非胁迫条件 下或在轻度干旱条件下培育的植物中提高产量的方法,所述方法包括增加植物中编码PATL 或PRP38或GATA样或ADA2或WDR23样多肽的核酸表达。相对于可比较条件下培育的对照植物,本发明方法的实施赋予在养分缺乏条件 下、尤其在缺氮条件下培育的植物提高的产量。因此,根据本发明,提供了用于在养分缺乏 条件下培育的植物中提高产量的方法,所述方法包括调节植物中编码PATL或PRP38或GATA 样或ADA2或WDR23样多肽的核酸表达。养分缺乏可以因养分如氮、磷酸盐和其他含磷化合 物、钾、钙、镉、镁、锰、铁和硼及其他元素缺少所致。就WDR23而言,优选降低的养分可获得 性是降低的氮可获得性。本发明包括通过本发明方法可获得的植物或其部分(包括种子)。所述植物或其 部分包含编码如上文定义的PATL或PRP38或GATA样或ADA2或WDR23样多肽的核酸转基 因。本发明也提供了基因构建体和载体以促进在植物中导入和/或表达编码PATL或 PRP38或GATA样或ADA2或WDR23样多肽的核酸。所述基因构建体可以插入适于转化至植 物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供了如 本文中定义的基因构建体在本发明方法中的用途。更具体地,本发明提供了构建体,其包含(a)编码如上定义的PATL或PRP38或GATA样或ADA2或WDR23样多肽的核酸;(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地(c)转录终止序列。优选地,编码PATL或PRP38或GATA样或ADA2或WDR23样多肽的核酸如上文定义。 术语“调控序列”和“终止序列”如本文中定义。对于WDR23,优选一种构建体调控序列是分离自植物基因组的组成型启动子。物组 成型启动子的实例是G0S2启动子,更优选地是稻G0S2启动子,最优选地是SEQ ID NO ,212 所示的G0S2启动子。或者,一种构建体调控序列是分离自植物基因组的分生组织特异性启 动子。植物分生组织特异性启动子的实例是金属硫蛋白(MT)启动子,更优选地是稻MT启动子,最优选是SEQ ID NO :273所示的MT启动子。植物用包含上述任意核酸的载体转化。技术人员非常了解必须存在于所述载体上 以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。此目的序列有效地与一 个或多个调控序列(至少与启动子)连接。有利地,任意类型的启动子,无论是天然的或合成的,可以用来提高所述核酸序列 的表达。组成型启动子是在所述方法中特别有用的。优选地,所述组成型启动子也是遍在 启动子。对于GATA样多肽,启动子具有中等强度。对于多种启动子类型的定义,见本文中 的“定义”部分。应当明白本发明的应用不限于SEQ ID NO :1所示的编码PATL多肽的核酸,本发明 的应用也不限于编码PATL多肽的核酸在受组成型启动子驱动时或在受绿色-组织启动子 驱动时的表达。更应当明白本发明的应用不限于SEQ ID NO :76所示的编码PRP38多肽的核酸,本 发明的应用也不限于编码PRP38多肽的核酸在受组成型启动子驱动时或在根特异性启动 子驱动时的表达。还应当明白本发明的应用不限于SEQ ID NO :128所示的编码GATA样多肽的核酸, 本发明的应用也不限于编码GATA样多肽的核酸在受组成型启动子驱动时的表达。还应当明白本发明的应用不限于SEQ ID NO 181所示的编码ADA2多肽的核酸,本 发明的应用也不限于编码ADA2多肽的核酸在受组成型启动子驱动时或在受绿色-组织启 动子驱动时的表达。还应当明白本发明的应用不限于SEQ ID NO :215所示的编码WDR23样多肽的核酸 序列,本发明的应用也不限于编码WDR23样多肽的核酸序列在受组成型或分生组织特异性 启动子驱动时的表达。组成型启动子优选为HMG (高迁移组)启动子,也称为HMGP启动子,优选来自稻的 HMG启动子。进一步优选地,该组成型启动子由基本上与SEQ ID NO :33相似的核酸序列代 表,最优选该组成型启动子SEQ ID N0:33所代表。绿色组织特异性启动子优选EXP9 (扩展 蛋白),也称为EXP,也称为HMGP启动子,优选来自稻的EXP启动子。进一步优选地,该绿色 组织特异性由基本上与SEQ ID NO :34相似的核酸序列代表,最优选该组成型启动子SEQ ID NO 34所代表。HMG和EXP启动子的描述和对于组成型和绿色组织特异性启动子的其他例 子,见本文“定义”部分中的表2。对于PRP38,组成型启动子优选地是G0S2启动子,优选来自稻的G0S2启动子。进 一步优选地,该组成型启动子由基本上与SEQ IDNO 127相似的核酸序列代表,最优选该组 成型启动子SEQ ID N0:127所代表。对于组成型启动子的其他例子,见本文“定义”部分中 的表ii。对于GATA样多肽,组成型启动子优选地是G0S2启动子,优选地是来自稻的G0S2 启动子。进一步优选地,该组成型启动子由基本上与SEQ ID NO: 135相似的核酸序列代表, 最优选地该组成型启动子SEQ ID N0:135所代表。任选地,一个或多个终止子序列可用于 被引入植物中的构建体。优选地,该构建体包括与SEQ ID NO 136基本相似或相同的表达 盒,包括G0S2启动子和编码GATA样多肽SEQ ID NO129的核酸。对于ADA2多肽,组成型启动子优选为HMG(高迁移组)启动子,也称为HMGP启动子,优选来自稻的HMG启动子。进一步优选地,该组成型启动子由基本上与SEQ ID NO 213 相似的核酸序列代表,最优选地该组成型启动子SEQ ID N0:213所代表。绿色组织特异性 启动子优选EXP9 (扩展蛋白),也称为EXP,也称为HMGP启动子,优选来自稻的EXP启动子。 进一步优选地,该绿色组织特异性由基本上与SEQ ID NO :214相似的核酸序列代表,最优选 地该组成型启动子SEQID NO 214所代表。HMG和EXP启动子的描述和对于组成型和绿色 组织特异性启动子的其他例子,见本文“定义”部分中的表iii。其他调节元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可能 适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至 5’非翻译区(UTR)或编码序列中,以提高细胞质中积累的成熟信使的量。(除启动子、增强 子、沉默子、内含子序列、3’ UTR和/或5’ UTR区域之外的)其他调控序列可以是蛋白质/ 或RNA稳定化元件。此类序列将是已知的或可以由本领域技术人员轻易地获得。本发明的基因构建体可以还包括对于特定细胞类型中维持和/或复制所需要的 复制起点序列。一个例子是当需要基因构建体作为游离型遗传元件(例如质粒或粘粒分 子)在细菌细胞中维持时的复制起点。优选的复制起点包括但不限于fl-ori和colEl。为检测如用于本发明方法中的核酸序列的成功转移和/或选择包含这些核酸的 转基因植物,使用标记基因(或报道基因)是有利的。因此,所述基因构建体可以任选地包 含选择性标记基因。选择性标记在本文的“定义”部分中更详细地描述。一旦不再需要所 述标记基因时,可以从转基因细胞中移除或切除它们。用于标记移除的技术是本领域已知 的,有用的技术在上文定义部分中描述。本发明也提供了用于产生转基因植物的方法,所述转基因植物相对于对照植物具 有增强的产量相关性状,其中所述方法包括在植物中引入并表达编码如上文所定义的PATL 或PRP38或GATA样或ADA2或WDR23样多肽的任意核酸。更具体地,本发明提供了用于产生转基因植物的方法,所述转基因植物具有增加 的增强产量相关性状、尤其提高的种子产量,其中所述方法包括(i)在植物或植物细胞中引入并表达编码PATL或PRP38或ADA2多肽的核酸;和(ii)在促进植物生长和发育的条件下培育植物细胞;和任选地(iii)选择具有增强的产量相关性状的植物。对于GATA样多肽,本发明提供了用于产生转基因植物的方法,所述转基因植物具 有增加的增强产量相关性状、尤其提高的TKW,其中所述方法包括(i)在植物或植物细胞中引入并表达编码GATA样或WDR23样多肽的核酸;和(ii)在促进植物生长和发育的条件下培育植物细胞。(i)的核酸可以能够编码如本文中所定义的PATL或PRP38或GATA样或ADA2或 WDR23样多肽的任意核酸。该核酸可以直接地导入植物细胞或导入植物自身(包括导入组织、器官或植物的 任何其他部分)。根据本发明的优选特征,该核酸优选地通过转化作用导入植物。术语“转 化”在本文的“定义”部分中更详细地描述。基因修饰的植物细胞可以借助技术人员熟悉的全部方法再生。合适的方法可见于 上文提及的 S. D. Kung 和 R. ffu, Potrykus 或HUifgen和 Willmitzer 的出版物。通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植 物。为了选择转化的植物,一般使转化中获得的植物材料经历选择条件,从而转化植物可以 与非转化植物区分开。例如,以上述方式获得的种子可以播种,并且在初始培育时间后,通 过喷洒接受合适的选择。另一种可能性在于种子根据需要消毒后,在使用合适选择剂的琼 脂板上培育,从而仅转化的种子可以长成植物。备选地,筛选所述转化植物的选择性标记 (如上文所述的选择性标记)的存在性。在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因 的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平 可以使用RNA印迹分析和/或蛋白质印迹分析监测,这两项技术均是本领域普通技术人员 熟知的。产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例 如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并 且1~2植物随后可以通过经典育种技术进一步繁殖。产生的转化生物可以采取多种形式。例 如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达 盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转 化根状茎)。本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩 展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代 转化或转染细胞、组织、器官或完整植物的子代,唯一要求是子代表现与如本发明方法中的 亲本相同的基因型和/或表型特征。本发明也包括宿主细胞,其包含编码如上文所定义PATL或PRP38或GATA样或 ADA2或WDR23样多肽的分离的核酸。本发明的优选宿主细胞是植物细胞。对于本发明方法 中所用核酸或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明 方法中所使用的多肽的全部植物。本发明的方法有利地适用于任意植物。特别在本发明方法中有用的植物包括属于 植物界超家族、尤其属于单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏 植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物 植物的例子包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜籽、棉花、番茄、马铃薯和烟草。更优 选地,所述植物是单子叶植物。单子叶植物的例子包括甘蔗。更优选地,所述植物是禾谷植 物。禾谷植物的例子包括稻、玉米、小麦、大麦、稷、黑麦、小黑麦属、高粱和燕麦。本发明也扩展至植物的可收获部分,例如但不限于种子、叶、果实、花、茎、根、根状 茎、块茎和球茎,或也扩展至编码与植物组成型启动子有效链接的WDR23样(如上文定义) 的分离核酸序列。本发明进一步涉及衍生自、优选直接衍生自此种植物的可收获部分的产 品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。根据本发明的优选特征,受调节的表达是提高的表达。用于增加核酸或基因或基 因产物表达的方法是本领域中充分报道的并且在定义部分中提供了例子。如上所述,用于调节编码PATL或PRP38或GATA样或ADA2或WDR23样多肽的核酸 的优选方法是在植物中引入并表达编码PATL或PRP38或GATA样或ADA2或WDR23样多肽 的核酸;然而,也可以使用包括但不限于T-DNA活化标签法、TILLING、同源重组在内的其他
56熟知技术实现实施本方法的效果,即增强产量相关性状。在定义部分中提供了这些技术的 描述。本发明也包括编码如文中所述PATL或PRP38或GATA样或ADA2或WDR23样多肽 的核酸的用途,和这些PATL或PRP38或GATA样或ADA2或WDR23样多肽在正常生长条件 下、在非生物胁迫生长条件(优选地在渗透胁迫生长条件)下和在养分可利用性降低的条 件下、优选在氮可利用性降低的生长条件下增强植物中任一前述产量相关性状的用途。编码本文中所述PATL或PRP38或GATA样或ADA2或WDR23样多肽的核酸,或PATL 或PRP38或GATA样或ADA2或WDR23样多肽自身可以用于其中鉴定到DNA标记的育种程序 中,其中所述的DNA标记可以遗传地与PATL或PRP38或GATA样或ADA2或WDR23样编码多 肽的基因连锁。所述核酸/基因或PATL或PRP38或GATA样或ADA2或WDR23样多肽自身 可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方 法中选择具有增强的如上文所定义产量相关性状的植物。编码PATL或PRP38或GATA样或ADA2或WDR23样多肽的核酸/基因的等位变体 也可以用于标记辅助的育种程序中。此类育种程序有时需要使用例如EMS诱变法通过对 植物进行诱变处理而导入等位变异;备选地,所述程序可以从收集并非故意造成的所谓“自 然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤选择所 讨论的和导致产量提高的序列的优异等位变体。一般通过监测含有所讨论序列的不同等位 变体的植物的生长性能实施选择。可以在温室中或在田间监测生长性能。其他任选步骤包 括将其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表 型特征的组合。编码PATL或PRP38或GATA样或ADA2或WDR23样多肽的核酸也可以作为探针用 于遗传地或物理地绘制所述探针构成其一部分的基因并且用作与这些基因连锁的性状的 标记。此类信息可以用于植物育种中,以开发具有所希望表型的品系。编码PATL或PRP38 或GATA样或ADA2或WDR23样多肽的核酸的这种用途仅需要具有至少15个核苷酸长度的 核酸序列。编码PATL或PRP38或GATA样或ADA2或WDR23样多肽的核酸可以用作限制性 片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(Sambrook J, Fritsch EF 禾口 Maniatis T (1989)Molecular Cloning, A Laboratory Manual)可以用编码 PATL或PRP38或GATA样或ADA2或WDR23样多肽的核酸探测。所得的结合图式随后可以 使用计算机程序如MapMaker (Lander等,(1987)Genomics 1:174-181)开展遗传分析以构 建遗传图。此外,所述核酸可以用来探测含有一组个体的限制性核酸内切酶处理的基因组 DNA的DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲本和子代。DNA多态 性的分离是明显的并用来计算编码PATL或PRP38或GATA样或ADA2或WDR23样多肽的核 酸在先前使用这个群体获得的遗传图中的位置(Botstein等,(1980)Am. J. Hum. Genet. 32 314-331)。在Bernatzky和 Tanksley (1986) Plant Mol. Biol. Reporter 4 :37_41 中描述了植 物基因来源的探针的产生及其在遗传作图中的用途。许多出版物描述了使用上文概述的方 法学或其变例对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯 合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在Non-mammalian Genomic Analyasis :A Practical Guide, Academic press 1996,第 319-346页及其中引用的参考文献)。在另一个实施方案中,所述核酸探针可以在直接荧光原位杂交(FISH)作图法 (Trask(1991)Trends Genet. 7 149-154)中使用。尽管当前的FISH作图法支持使用大的 克隆(几个kb至几百个kb ;见Laan等,(1995) Genome Res. 5 13-20),然而灵敏度的改善 可以允许使用更短探针进行FISH作图。用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。 方法例子包括等位基因特异性扩增法(Kazazian (1989) J. Lab. Clin. Med 11 :95_96)、PCR 扩增片段的多态性(CAPS ;Sheffield等,(1993) Genomics 16 :325_332)、等位基因特异性 连接(Landegren 等,(1988) Science 241 :1077_1080)、核苷酸延伸反应(Sokolov (1990) NucleicAcid Res. 18 :3671)、放射杂交作图(Walter 等,(1997)Nat. Genet. 7 22~28)和 Happy 作图法(Dear 和 Cook(1989)Nucleic Acid Res. 17 :6795_6807)。对于这些方法,使 用一种核酸序列的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类 引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对 应于当前核酸序列的区域中鉴定作图交叉的亲本之间的DNA序列差异。然而,这对作图法 而言通常不是必需的。如前文所述,本发明方法产生了具有增强的产量相关性状的植物。这些性状也可 以与经济上有利的其他性状组合,如其他的产量增强性状、其他非生物胁迫和生物胁迫耐 受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。在一个实施方案中,本发明涉及如下概括的主题项IA用于相对于对照植物增强植物中产量相关性状的方法,其包括调节植物中 编码PATELLIN多肽的核酸的表达和可选地选择具有增强的产量相关性状的植物。项2A根据项IA的方法,其中所述PATELLIN多肽包含至少一个如下结构域(i)SEQ ID NO :71 所示的 SEC14 结构域Ipeldsvvfyrgadreghpvcynvygefqdkdlye kafgdeekrerfIkwriqllergilsqldfspsgicsmvqvtdlknsppmlgkhravtrqavallqdnypefiakkv finvpwwylaankmmspf ltqrtkskf ifaspaksaetlfryiapeqvpvqfgglfk, SEQ ID NO -Jl PJf 示的结构域或出现在表A中的任意多肽中的任意SEC14结构域以增加的优选顺序具有至少 50%、55%、60%、65%、70%、75%、80%、82%、85%、90%、92%、95%、97% 或更多的序列 同一性的结构域;(ii)SEQ ID NO :72 所示的 GOLD 结构域sdavteltikpssketveipvtenstigwelrvl gwevsygaeftpdaeggytvivqktrkvpaneepimkgsfkvgepgkivltinnpaskkkkllyrskv,或与 SEQ ID NO 72所示的结构域或出现在表A中的任意多肽中的任意GOLD结构域以增加的优选顺 序具有至少 50%、55%、60%、65%、70%、75%、80%、82%、85%、90%、92%、95%、97%或 更多的序列同一性的结构域。项3A根据项IA或2A的方法,其中所述受调节的表达通过在植物中引入和表达 编码PATELLIN多肽的核酸实现。项4A根据任意前述项的方法,其中所述编码PATELLIN多肽的核酸编码表A中所 列任一种蛋白质或是这种核酸的一部分或能与这种核酸杂交的核酸。项5A根据任意前述项的方法,其中所述核酸序列编码表A中所列任意蛋白质的直向同源物或旁系同源物。项6A根据任意前述项的方法,其中所述增强的产量相关性状包括相对于对照植 物提高的产量,优选种子产量。项7A根据项IA至6A中任一项的方法,其中所述增强的产量相关性状在缺氮条 件下获得。项8A根据项3A至7A中任一项的方法,其中所述核酸有效链接至组成型启动子, 优选至G0S2启动子,最优选至来自稻的G0S2启动子。项9A 根据任意前述项的方法,其中所述编码PATELLIN多肽的核酸具有植物起 源,优选来自双子叶植物,进一步优选来自禾本科(Poaceae),更优选来自稻属(Oryza),最 优选来自稻。项IOA由根据任一前述项的方法可获得的植物或其部分,包括种子,其中所述的 植物或其部分包含编码PATELLIN多肽的重组核酸。项IlA分离的核酸分子,其包含以下特征(i)SEQ ID NO 9 ;SEQ ID NO 11 ;SEQ ID NO 13 ;SEQ ID NO 15 ;SEQ ID NO 17 ; SEQ ID NO 19 ;SEQ ID NO 21 ;SEQ ID NO 23 ;SEQ ID NO 25 和 SEQ ID NO 27 所示的核 酸;(ii)与⑴中给出的任一 SEQ ID NO互补的核酸片段;(iii)编码 PATELLIN 多肽的核酸,其与 SEQ ID NO 10 ;SEQ IDNO 12 ;SEQ ID NO 14 ;SEQ ID NO 16 ;SEQ ID NO 18 ;SEQ ID NO 20 ;SEQ ID NO 22 ;SEQ ID NO 24 ;SEQ ID NO 26和SEQ ID NO 28中给出的任一氨基酸序列以增加的优选顺序具有至少70%、75%、 80%,85%,90%,95%,96%,97%,98%,99%^; 100%的序列同一性;(iv)在严格条件下能与上面(i)、(ii)或(iii)给出的任一核酸杂交的核酸。项12A分离多肽,其包括(I)氨基酸序列,其与 SEQ ID NO: 10、SEQ ID NO: 12、SEQ ID NO: 14、SEQ ID NO: 16,SEQ ID NO :18、SEQ ID NO 20,SEQ ID NO 22,SEQ ID NO 24 ;SEQ ID NO 26 和 SEQ ID NO 28中给出的任一氨基酸序列以增加的优选顺序具有至少80%、85%、90%、95%、96%、 97%、98%、99%或100%的序列同一性;(ii) (i)中给出的任意氨基酸序列的衍生物。项13A构建体,其包括(I)编码如项1A、2A或12A定义的PATELLIN多肽的核酸或根据项11的核酸;(ii)能驱动(a)的核酸序列表达的一个或多个调控序列;和任选地(iii)转录终止序列。项14A根据项13A的构建体,其中所述调控序列之一是组成型启动子,优选G0S2 启动子,最优选来自稻的G0S2启动子。项15A根据项13A或14A的构建体在用于产生植物的方法中的用途,所述植物相 对于对照植物具有提高的产量,特别是提高的生物量和/或提高的种子产量。项16A用根据项13A或14A的构建体转化的植物、植物部分或植物细胞。项17A 用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提 高的产量、优选提高的种子产量,该方法包括
(i)在植物中引入并表达编码如项项1A,2A或12A中定义的PATELLIN多肽的核酸 或根据项IlA的核酸;和(ii)在促进植物生长和发育的条件下培育植物细胞;和任选地(iii)选择具有增强的产量相关性状的植物。项18A转基因植物,其因编码如项项IA或2A中所定义PATELLIN多肽的核酸的 受调节的表达而相对于对照植物具有提高的产量、特别是提高的种子产量,或所述转基因 植物衍生的转基因植物细胞。项19A根据项11A、16A或18A的转基因植物或从其中衍生的转基因植物细胞,其 中所述的植物是作物植物或单子叶植物或禾谷植物,如稻、玉米、小麦、大麦、稷、黑麦、小黑 麦、高粱和燕麦。项20A 根据项19A的的植物的可收获部分,其中所述的可收获部分优选地是枝 条生物量和/或种子。项21A 产物,其衍生自根据项19A的植物和/或根据项20A的植物的可收获部 分。项22A编码PATELLIN多肽的核酸在相对于对照植物提高产量、优选提高种子产 量和/或枝条生物量中的用途。项IB用于相对于对照植物增强植物中产量相关性状的方法,其包括调节植物中 编码PRP38多肽的核酸表达。项2B根据项IB的方法,其中所述PRP38多肽包含一个或多个如下基序(i) DUFl777 结构域(ii)RS 结构域(iii)基序la(SEQ ID NO 120),其中任意氨基酸残基可由保守氨基酸取代和或达 50 %的氨基酸残基可由非保守氨基酸取代。(iv)基序la(SEQ ID NO 121),其中任意氨基酸残基可由保守氨基酸取代和或达 50 %的氨基酸残基可由非保守氨基酸取代。(ν)基序la(SEQ ID NO 122),其中任意氨基酸残基可由保守氨基酸取代和或达 50 %的氨基酸残基可由非保守氨基酸取代。项3B根据项IB或2B的方法,其中所述受调节的表达通过在植物中引入并表达 编码PRP38多肽的核酸实现。项4B根据任意前述项的方法,其中所述的编码PRP38多肽的核酸编码表A中所 列的任一种蛋白质或是这种核酸的一部分或是能够与这种核酸杂交的核酸。项5B根据任意前述项的方法,其中所述的核酸序列编码表A中给出的任意蛋白 质的直向同源物或旁系同源物。项6B根据任意前述项的方法,其中所述的增强的产量相关性状包括相对于对照 植物提高的产量、优选提高的生物量和/或提高的种子产量。项7B根据项IB至6B中任一项的方法,其中所述增强的产量相关性状在非胁迫 条件下获得。项8B根据项IB至6B中任一项的方法,其中所述的增强的产量相关性状在缺氮 条件下获得。
60
项9B根据项3B至8B中任一项的方法,其中所述的核酸有效链接至组成型启动 子,优选至G0S2启动子,最优选至来自稻的G0S2启动子。项IOB 根据任意前述项的方法,其中所述的编码PRP38多肽的核酸序列是植物 来源的,优选地来自双子叶植物,进一步优选地来自十字花科,更优选地来自拟南芥属,最 优选地来自拟南芥。项IlB由根据任一前述项的方法可获得的植物或其部分,包括种子,其中所述的 植物或其部分包含编码PRP38多肽的重组核酸。项12B构建体,其包含(i)编码如项1或2定义的PRP38多肽的核酸;(ii)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地(iii)转录终止序列。项13B根据项12B的构建体,其中所述调控序列是组成型启动子,优选是G0S2启 动子,最优选地是来自稻的G0S2启动子。项14B根据项12B或13B的构建体在用于产生植物的方法中的用途,所述植物相 对于对照植物具有提高的产量,特别是提高的生物量和/或提高的种子产量。项15B用根据项12B或13B的构建体转化的植物、植物部分或植物细胞。项16B 用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提 高的产量、特别是提高的生物量和/或提高的种子产量,该方法包括(i)在植物中引入并表达编码如项IB或2B中所定义的PRP38多肽的核酸;和(ii)在促进植物生长和发育的条件下培育植物细胞。项17B转基因植物,其因相对于对照植物具有因编码如项IB或2B中所定义的 PRP38多肽的核酸的受调节表达而引起提高产量、特别是提高的生物量和/或提高的种子 产量,或所述转基因植物衍生的转基因植物细胞。项18B根据项11B、15B或17B的转基因植物,或从其中衍生的转基因植物细胞, 其中所述的植物是作物植物或单子叶植物或禾谷植物,如稻、玉米、小麦、大麦、稷、黑麦、小
黑麦、高粱和燕麦。项19B 根据项18B的植物的可收获部分,其中所述的可收获部分优选地是枝条 生物量和/或种子。项20B 产物,其衍生自根据项18B的植物和/或根据项19B的植物的可收获部 分。项21B 编码PRP38多肽的核酸在植物中相对于对照植物提高产量、特别是提高 种子产量和/或枝条生物量中的用途。项IC用于相对于对照植物提高植物的千粒重、总种子重和饱满种子数中一项或 多项的方法,其包括调节植物中编码GATA样多肽的核酸表达,其中所述的GATA样多肽属于 GATA转录因子的亚家族II且包含GATA结构域。项2C根据项IC的方法,其中所述的GATA样多肽包含一个或多个以下基序⑴基序 Ic :C (S/A/T) (D/E/N) CXT (T/S/A) (K/S) TP (L/M) WR (S/G/N) GP (SEQ ID NO 130),(ii)基序 2c :GPKSLCNACGIRX(R/K)K(SEQ ID NO 131),
(iii)基序 3c (A/S) (A/ff)X(L/C) (L/N) (M/L/V) (T/L/A) (L/D) (S/R) (SEQ ID NO 132)项3C根据项IC或2C的方法其中所述受调节的表达通过在植物中引入并表达编 码GATA样多肽的核酸实现。项4C根据任一前述项的方法,其中所述的编码GATA样多肽的核酸编码表A中所 列的任一种蛋白质或是这种核酸的一部分或是能够与这种核酸杂交的核酸。项5C根据任一前述项的方法,其中所述的核酸序列编码表A中给出的任意蛋白 质的直向同源物或旁系同源物。项6C根据项IC至5C任一项的方法,其中所述增强的产量相关性状在非胁迫条 件下获得。项7C根据项3C至6C任一项的方法,其中所述的核酸有效链接至组成型启动子, 优选至G0S2启动子,最优选地至来自稻的G0S2启动子。项8C 根据任一前述项的方法,其中所述的编码GATA样多肽的核酸是植物来源 的,优选地来自双子叶植物,进一步优选地来自禾本科,更优选地来自稻属,最优选地来自稻。项9C 由根据任一前述项的方法可获得的植物或其部分,包括种子,其中所述植 物或其部分包含编码GATA样多肽的重组核酸,所述核酸有效连接至植物来源的组成型启 动子,优选至G0S2启动子,最优选地至来自稻的G0S2启动子。项IOC构建体,其包含⑴编码如项IC或2C定义中的GATA样多肽的核酸;(ii)能够驱动(a)的核酸序列表达的一个或多个植物来源的调控序列;和任选地(iii)转录终止序列。项IlC根据项IOC的构建体,其中所述调控序列之一是组成型启动子,优选G0S2 启动子,最优选来自稻的G0S2启动子。项12C根据项IOC或IlC的构建体在用于产生植物的方法中的用途,所述植物相 对于对照植物具有提高的产量,包括千粒重、总种子重和饱满种子数中一项或多项。项13C用根据项IOC或IlC的构建体转化的植物、植物部分或植物细胞。项14C 用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提 高的产量、特别是提高的生物量和/或提高的种子产量,该方法包括(i)在植物中引入并表达编码如项IC或2C中定义的GATA样多肽且有效连接至植 物来源的组成型启动子的核酸;和(ii)在促进植物生长和发育的条件下培育植物细胞。项15C 转基因植物,其相对于对照植物具有因编码如项IC或2C中定义的GATA 样多肽的核酸的受调节表达引起的提高的千粒重,或所述转基因植物衍生的转基因植物细 胞。项16C根据项9C、13C或15C的转基因植物,或从其中衍生的转基因植物细胞,其 中所述的植物是作物植物或单子叶植物或禾谷植物,如稻、玉米、小麦、大麦、稷、黑麦、小黑 麦、高粱和燕麦。项17C根据项17C的植物的可收获部分,其中所述的可收获部分优选地是种子。
项18C 产物,其衍生自根据项16C的植物和/或根据项17C的植物的可收获部 分。项19C编码GATA样多肽的核酸在植物中相对于对照植物提高千粒重、总种子重 和饱满种子数中一项或多项的用途。项ID用于相对于对照植物增强植物中产量相关性状的方法,其包括调节植物中 编码ADA2多肽的核酸的表达和可选地选择具有增强的产量相关性状的植物。项2D根据项ID的方法,其中所述ADA2多肽包含两个或多个如下基序(i)SEQ ID NO :207 :kpglyccnycdkdlsglvrfkcavcmdfdlcvecfsvgvelnrhkn所示的 ZZ型锌指结构域,或与SEQ ID NO :207所示的结构域或出现在表A中任意多肽中的任意ZZ 型锌指结构域以增加的优选顺序具有至少50 %、55 %、60 %、65 %、70 %、75 %、80 %、82 %、 85%、90%、92%、95%、97%或更多的序列同一性的结构域;(ii)SEQ ID NO :208 所示的 SANT DNA 结合结构域vtsdwnadeei 11 Ieaiatygfgnwk evadhvgsktttecikhfnsaym,或SEQ ID NO :208所示的结构域或出现在表A中任意多肽中的 任意SANT DNA结合结构域以增加的优选顺序具有至少50 %、55 %、60 %、65 %、70 %、75 %、 80%、82%、85%、90%、92%、95%、97%或更多的序列同一性的结构域;(iii)SEQ ID NO :209 所示的 Ca 结合 EF 手结构域dndaeqlladmef,或 SEQ ID NO: 209所示的结构域或出现在表A中任意多肽中的任意Ca结合EF手结构域以增加的优选顺 序具有至少 50%、55%、60%、65%、70%、75%、80%、82%、85%、90%、92%、95%、97% 或 更多的序列同一性的结构域;(iv) SEQ ID NO :210 所示的 SWIRM 结构域priysgldtwdvdgllgadllsetekkmcnetr ilpvhylkmldiltreikkgqikkksdaysffkvepskvdrvydmlvhkgigdst, nJ^SEQ ID NO :210所示的 结构域或出现在表A中任意多肽中的任意SWIRM结构域以增加的优选顺序具有至少50%、 55%、60%、65%、70%、75%、80%、82%、85%、90%、92%、95%、97% 或更多的序列同一性 的结构域。项3D根据项ID或2D的方法,其中所述受调节的表达通过在植物中引入和表达 编码ADA2多肽的核酸实现。项4D根据任意前述项的方法,其中所述编码ADA2多肽的核酸编码表A中所列任 一种蛋白质,或是这种核酸的一部分或能与这种核酸杂交的核酸。项5D根据任意前述项的方法,其中所述核酸序列编码表A中所列任意蛋白质的 直向同源物或旁系同源物。项6D根据任意前述项的方法,其中所述增强的产量相关性状包括相对于对照植 物提高的产量,优选种子产量。项7D根据项ID至6D中任一项的方法,其中所述增强的产量相关性状在轻度胁 迫条件下获得。项8D根据项ID至6D中任一项的方法,其中所述增强的产量相关性状在缺氮条 件下获得。项9D根据项3D至8D中任一项的方法,其中所述核酸有效链接至组成型启动子, 优选至HMGP启动子,最优选至来自稻的HMGP启动子。项IOD 根据任意前述项的方法,其中所述编码ADA2多肽的核酸具有植物起源,优选来自双子叶植物,进一步优选地来自十字花科,更优选地来自拟南芥属,最优选地来自 拟南芥。项IlD由根据任一前述项的方法可获得的植物或其部分,包括种子,其中所述的 植物或其部分包含编码ADA2多肽的重组核酸。项12D构建体,其包含(i)编码如项ID或2D定义的ADA2多肽的核酸;(ii)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地(iii)转录终止序列。项13D 根据项12D的构建体,其中所述调控序列之一是组成型启动子,优选是 HMGP启动子,最优选地是来自稻的HMGP启动子。项14D根据项12D或13D的构建体在用于产生植物的方法中的用途,所述植物相 对于对照植物具有提高的产量,特别是提高的生物量和/或提高的种子产量。项15D用根据项12D或13D的构建体转化的植物、植物部分或植物细胞。项16D 用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提 高的产量、特别是提高的种子产量,该方法包括⑴在植物中引入并表达编码如项ID或2D中所定义的ADA2多肽的核酸;和(ii)在促进植物生长和发育的条件下培育植物细胞;和任选地(iii)选择具有增强的产量相关性状的植物。项17D转基因植物,其因编码如项项ID或2D中所定义ADA2多肽的核酸的受调 节的表达而相对于对照植物具有提高的产量、特别是提高的种子产量,或所述转基因植物 衍生的转基因植物细胞。项18D根据项11D、15D或ID的转基因植物或从其中衍生的转基因植物细胞,其 中所述的植物是作物植物或单子叶植物或禾谷植物,如稻、玉米、小麦、大麦、稷、黑麦、小黑 麦、高粱和燕麦。项19D根据项19的植物的可收获部分,其中所述的可收获部分优选地是枝条生 物量和/或种子。项20D 产物,其衍生自根据项18D的植物和/或根据项19D的植物的可收获部 分。项21D编码ADA2多肽的核酸在相对于对照植物提高植物产量、优选提高种子产 量和/或枝条生物量中的用途。项IE编码WD40重复(WDR) 23样多肽的分离核酸序列,其包括SEQ ID NO 219、SEQ ID NO 225 或 SEQ ID NO 229 所示的分离的核酸序列;(ii)SEQ ID NO :219、SEQ ID N0:225或SEQ ID NO :229所示的分离的核酸序列的 互补序列;(iii)编码 SEQ ID NO :220、SEQ ID N0:226 或 SEQ ID NO :230 所示的多肽序列的 分离的核酸序列;(iv)由于遗传密码简并性的原因可从SEQ ID NO 220、SEQ IDNO 226或SEQ ID NO 230所示的多肽序列推导出来的分离的核酸序列;(ν)能够在严格杂交条件下与 SEQ ID NO :219、SEQ ID N0:225 或 SEQ ID NO 229
64所示的核酸序列或其互补序列杂交的分离的核酸序列;(vi)分离的核酸序列,其编码下述多肽,所述多肽与SEQ ID NO :220、SEQ ID NO 226或SEQ ID NO :230所示的多肽序列,按照递增的优选顺序具有至少50%、55%、60%、 65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99% 或更高氨基酸序列同一 性;(ν)分离的核酸序列,其编码包含下述结构域的多肽,所述结构域与SEQ ID NO 271所示的保守结构域,按照递增的优选顺序具有至少65%、70%、75%、80%、85%、90%、 95%、96%、97%、98%、99%或更高氨基酸序列同一性。项2E 分离WDR23样多肽,其包括(i)SEQ ID NO :220、SEQ ID NO 226 或 SEQ ID NO 230 所示的多月太序列;(ii)与 SEQ ID NO :220、SEQ ID NO 226 或 SEQ ID NO 230 所示的多肽序列按照 递增的优选顺序具有至少 50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,96%, 97%、98%、99%氨基酸序列同一性的多肽序列;(iii)包含下述结构域的多肽,所述结构域与SEQ ID NO :271所示的保守结构域, 按照递增的优选顺序具有至少 65%,70%,75%,80%,85%,90%,95%,96%,97%,98%,
99%或更高氨基酸序列同一性;(iii)上述⑴至(iii)中任意多肽序列的衍生物。项3E 用于相对于对照植物增强产量相关形状的方法,所述方法包括增加编码 WDR23样多肽的核酸序列在植物中表达,所述WDR23样多肽包含结构域,所述结构域与SEQ ID NO 271 所示的保守结构域(CD)具有至少 65 %、70 %、75 %、80 %、85 %、90 %、95 %、 98%,99%或更高氨基酸序列同一性,和任选地选择具有增加的产量相关性状的植物。项4E根据项3E的方法,其中所述WDR23样多肽包含⑴至少四个具有PFAM登 录号PF00400的WD40重复;和(ii)两个连续WD40重复末端的至少两个保守的DxR基序。项5E 根据项3E或4E的方法,其中所述WDR23样多肽与SEQID NO :216所示的 WDR23样多肽或本文表A给出的任意多肽序列或项2E中定义的WDR23样多肽以增加的优选 顺序具有至少 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99% 或更高 氨基酸序列同一性。项6E根据项3E至5E中任一项的方法,其中所述编码WDR23样多肽的核酸序列 由表A中给出的任一核酸序列SEQ ID NO或其部分或能与表A中给出的任一核酸序列SEQ ID NO杂交的序列代表。项7E根据项3E至6E中任一项的方法,其中所述核酸序列编码表A中所列任意 多肽序列SEQ ID NO的直向同源物或旁系同源物。项8E根据项3E至7E中任一项的方法,其中所述增加的表达通过T-DNA活化标 签技术、TILLING或同源重组中任一种或多种实现。项9E根据项3E至8E中任一项的方法,其中所述增加的表达通过在植物中引入 并表达编码WDR23样多肽的核酸序列实现。项IOE根据项3E至9E中任一项的方法,其中所述增加的产量相关性状是提高的 每株植物种子总产量、提高的种子饱满率、提高的饱满种子数、提高的收获指数、和提高的 千粒重中一项或多项。
项IlE根据项3E至IOE中任一项的方法,其中所述核酸序列有效连接至组成型 启动子,优选至植物组成型启动子,更优选至G0S2启动子,最优选至SEQ ID NO :272所示的 来自稻的G0S2启动子。项12E根据项3E至IOE中任一项的方法,其中所述核酸序列有效连接至分生组 织特异性启动子,优选至植物金属硫蛋白启动子,更优选至SEQ ID N0:273所示的来自稻的 金属硫蛋白启动子。项13E根据项3E至12E中任一项的方法,其中所述编码WDR23样多肽的核酸序 列来自植物界,优选来自双子叶植物,进一步优选地来自十字花科,最优选地来自拟南芥。项14E由根据项3E至13E中任一项的方法可获得的植物、其部分(包括种子)或 植物细胞,其中所述的植物、其部分或细胞包含有效连接至植物组成型启动子的编码WDR23 样多肽的分离的核酸转基因。项15E植物、其部分(包括种子)或植物细胞,其包含根据项IE的分离的核酸转 基因或包含根据项2E的编码WDR23样多肽的分离核酸序列。项16E构建体,其包含⑴编码如项1E、2E或3E至7E中任一项定义的WDR23样多肽的核酸序列;(ii)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地(iii)转录终止序列。项17E根据项16E的构建体,其中所述调控序列是植物组成型启动子,优选G0S2 启动子,更优选稻G0S2启动子,最优选SEQ ID NO :272所示的G0S2启动子。项18E根据项16E的构建体,其中所述调控序列是分生组织特异性启动子,优选 金属硫蛋白(MT)启动子,更优选稻MT启动子,最优选至SEQ ID NO :273所示的MT启动子。项19E根据项16E或18E的构建体在用于产生植物的方法中的用途,所述植物相 对于对照植物具有增强的产量相关形状,所述增强的产量相关形状是提高的每株植物种子 总产量、提高的种子饱满率、提高的饱满种子数、提高的收获指数、和提高的千粒重中一项 或多项。项20E 用根据项16E至18E中任一项的构建体转化的植物、植物部分或植物细 胞。项21E 用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有增 强的产量相关形状,该方法包括(i)在植物、植物部分或植物细胞中引入并表达编码如项IE或3E至7E中任一项 定义的WDR23样多肽的核酸序列;和(ii)在促进植物生长和发育的条件下培育植物细胞、植物部分或植物。项22E 转基因植物,其相对于对照植物具有因下述核酸序列的增加的表达引 起的增强的产量相关性状,或所述转基因植物衍生的转基因植物细胞或转基因植物部分, 所述核酸序列编码有效连接至植物表达性启动子,如项IE或3E至7E中任一项定义的的 WDR23样多肽。项23E根据项14E、15E、20E或22E的转基因植物,其中所述的植物是作物植物或 单子叶植物或禾谷植物,如稻、玉米、小麦、大麦、稷、黑麦、小黑麦、高粱和燕麦,或从所述转 基因植物衍生的转基因植物细胞。
项24E根据项23E的植物的可收获部分,其包含编码WDR23样多肽的分离核酸序 列,其中所述的可收获部分优选是种子。项25E 产物,其衍生自根据项23E的植物和/或根据项24E的植物的可收获部 分。项26E编码如项IE或3E至7E中任一项定义的WDR23样多肽的核酸序列在增强 产量相关性状中的用途,所述增强产量相关性状包括提高的每株植物种子总产量、提高的 种子饱满率、提高的饱满种子数、提高的收获指数、和提高的千粒重中一项或多项。附图简述本发明现在将参考以下图进行描述,其中图1代表序列SEQ ID NO :2。标出结构域结构和功能相关氨基酸。SEC14和GOLD 结构域以粗体和双下划线分别标出。框出涉及Ptdlns/PtdChs结合/转运活性的氨基酸残 基,而沿着脂类-结合口袋的疏水残基有下划线。盐桥结构域以小写字母显示。卷曲螺旋 下标曲线。图2代表选择的表Al的PALT多肽的多重比对。图3显示选择的表Al的PALT多肽的系统树。图4代表双元载体,其用于在稻中增加稻G0S2启动子控制下的PALT编码核酸的表达。图5详述了用于实施本发明方法的序列的实例。图6代表序列SEQ ID NO :77。示出保守结构域和基序PRP38结构域是下划线的、 DUF1777结构域是粗体字的、基序lb, lib, IIIb和IVb是框出的。图7代表表A2的PRP38多肽的多重比对。图8显示表A2的PRP38多肽的系统树。图9代表双元载体,其用于在稻中增加稻G0S2启动子(pG0S2)控制下的PRP38编 码核酸的表达。图10详述了用于实施本发明方法的序列的实例。图11代表SEQ ID NO 129的结构域结构,GATA结构域为粗体且保守基序Ic至3c 是下划线的。图12代表表亚组II GATA样多肽的多重比对。点表示保守残基,冒号表示高度保 守残基,且星号表示相同的氨基酸。图13代表双元载体,其用于在稻中增加稻G0S2启动子(pG0S2: GATA样)控制下 的GATA样-编码核酸的表达。图14详述了用于实施本发明方法的序列的实例。图15代表序列SEQ ID NO :182。示出保守结构域和基序。框出“KRKK”假定的核 定位信号,粗体显示ZZ型锌指结构域,下划线和粗体字标出SANT DNA结合结构域,斜体和 下划线标出Ca结合F手结构域,且双下划线标出SWIRM结构域。框出蛋白质中心部分中的 相关和假定介导ADA2乙酰化的Lys (K)残基。图16代表表A4的ADA2多肽的多重比对。图17显示表A4的ADA2多肽的系统树。图18和图19代表双元载体,其用于在稻中增加稻HMGP启动子(图18)和EXP9启动子(图19)控制下的ADA2编码核酸的表达。图20详述了用于实施本发明方法的序列的实例。图21代表SEQ ID NO :216所示的WRD23样的结构的卡通图。对应PFAM登录号 PF00400的D40重复是图表标出的。图22显示人中WRD23的功能。WRD23是多蛋白质泛素E3连接酶复合物的部分, 其中Cullin4(CUL4)和损伤DNA结合蛋白质1 (DDBl)是核心蛋白质(Higa等,(2007)Cell Division 2 5 ;Angers 等,(2006) Nature 443:590-593 ;Higa 等,(2006) Nature Cell Biol 8(11) :1277-1283 ;He 等,(2006)Genes&Development 20:2949-2954)。这种复合物,例如 WRD23,为底物募集机制锚定WD40蛋白质作为分子衔接头,底物随后被泛素化和破坏。图23显示序列比对,其代表在WD40的两个连续的浆(blade)中保守的DxR基序、 在来自人(Homo sapiens)的 WRD23 (NCBI 登录号 AK057636)、黑曲霉(Aspergillus niger) (NCBI登录号CAK40817)和表A5的植物WRD23样多肽。图 24 显示表 A5 的 WDR23 样多肽的 AlignX(来自 Vector NTI10. 3, Invitrogen Corporation)序列多重比对。例SEQ ID NO :271所示的保守结构域(CD)的起点和终点以 括号显示。共有序列中对应PF00400的WD40重复以X标出。DxR基序也在共有序列中鉴定。图25显示双元载体,其用于在稻中增加植物表达性启动子,例如均来自稻的G0S2 启动子或分生组织启动子控制下的WDR23样多肽编码核酸的表达。图26详述了用于实施本发明方法的序列的实例。
实施例本发明现在参考如下实施例进行描述,所述实施例仅是示意性的。以下实施例不 意图完全限定或限制本发明的范围。DNA操作除非另外说明,重组DNA技术根据(Sambrook(2001)Molecular Cloning :a laboratory manual,第 3 版 Cold Spring HarborLaboratory Press, CSH, New York)或 Ausubel 等,(1994), CurrentProtocoIs in Molecular Biology, Current Protocols第1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料 和方法在BIOS科学出版有限责任公司(BIOS Scientific Publications Ltd(英国))和 Blackwell 科学出版社(Blackwell Scientific Publications (英国))出版的R. D. D. Croy 的 Plant Molecular Biology Labfax (1993)中描述。实施例1 鉴定与本发明方法中所用核酸序列相关的序列使用数据库序列搜索工具,如基本局部比对工具(BLAST) (Altschul等(1990) J. Mol. Biol. 215 :403-410 ;和 Altschul 等(1997)Nucleic AcidsRes. 25:3389-3402)在国 家生物技术信息中心(NCBI)的Entrez核苷酸数据库中所维护的那些序列内鉴定到与本发 明方法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。该程序用来通过核酸序 列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部 相似性的区域。例如,本发明所用核酸编码的多肽使用TBLASTN算法,采用默认设置和过滤 以忽略低复杂性序列抵消。分析的结果通过配对性比较显示,并根据几率评分(E-值)排 序,其中该评分反映特定比对结果因偶然而发生的概率(E-值越低,命中的显著性越高)。
68除了 E-值外,比较还通过同一性百分数进行记分。同一性百分数指两个所比较核酸(或多 肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。表A提供了与本发明方法中所用的核酸序列相关的核酸序列的列表。在本说明书中使用的术语“表A”将用来说明表A1,和/或A2,和/或A3,和/或 A4,和/或A5的内容。在本说明书中使用的术语“表Al”将用来说明表Al的内容。在本 说明书中使用的术语“表A2”将用来说明表A2的内容。在本说明书中使用的术语“表A3” 将用来说明表A3的内容。在本说明书中使用的术语“表A4”将用来说明表A4的内容。在 本说明书中使用的术语“表A5”将用来说明表A5的内容。在一个优选的实施方案中,术语 “表A”意指表Al。在一个优选的实施方案中,术语“表A”意指表A2。在一个优选的实施方 案中,术语“表A”意指表A3。在一个优选的实施方案中,术语“表A”意指表A4。在一个优 选的实施方案中,术语“表A”意指表A5。在本说明书中使用的术语“表B ”将用来说明表B1,和/或B2,和/或B3,和/或 B4,和/或B5的内容。在本说明书中使用的术语“表Bi”将用来说明表Bl的内容。在本 说明书中使用的术语“表B2”将用来说明表B2的内容。在本说明书中使用的术语“表B3” 将用来说明表B3的内容。在本说明书中使用的术语“表B4”将用来说明表B4的内容。在 本说明书中使用的术语“表B5”将用来说明表B5的内容。在一个优选的实施方案中,术语 “表B”意指表Bi。在一个优选的实施方案中,术语“表B”意指表B2。在一个优选的实施方 案中,术语“表B”意指表B3。在一个优选的实施方案中,术语“表B”意指表B4。在一个优 选的实施方案中,术语“表B”意指表B5。在本说明书中使用的术语“表C”将用来说明表Cl,和/或C2,和/或C3,和/或 C4,和/或C5的内容。在本说明书中使用的术语“表Cl”将用来说明表Cl的内容。在本 说明书中使用的术语“表C2”将用来说明表C2的内容。在本说明书中使用的术语“表C3” 将用来说明表C3的内容。在本说明书中使用的术语“表C4”将用来说明表C4的内容。在 本说明书中使用的术语“表C5”将用来说明表C5的内容。在一个优选的实施方案中,术语 “表C”意指表Cl。在一个优选的实施方案中,术语“表C”意指表C2。在一个优选的实施方 案中,术语“表C”意指表C3。在一个优选的实施方案中,术语“表C”意指表C4。在一个优 选的实施方案中,术语“表C”意指表C5。在本说明书中使用的术语“表D ”将用来说明表D1,和/或D2,和/或D3,和/或 D4,和/或D5的内容。在本说明书中使用的术语“表D1”将用来说明表Dl的内容。在本 说明书中使用的术语“表D2”将用来说明表D2的内容。在本说明书中使用的术语“表D3” 将用来说明表D3的内容。在本说明书中使用的术语“表D4”将用来说明表D4的内容。在 本说明书中使用的术语“表D5”将用来说明表D5的内容。在一个优选的实施方案中,术语 “表D”意指表D1。在一个优选的实施方案中,术语“表D”意指表D2。在一个优选的实施方 案中,术语“表D”意指表D3。在一个优选的实施方案中,术语“表D”意指表D4。在一个优 选的实施方案中,术语“表D”意指表D5。表Al =PATL核酸和多肽的实例 表A2 :PRP38核酸和多肽的实例 表A3 =GATA样多肽的实例 表A4 :ADA2核酸和多肽的实例 对于WDR23样蛋白质,在一些情况下,相关序列已经由研究机构如基因组研究机 构(The Institute for Genomic Research, TIGR)初步地汇编并且公开披露。可以使用 真核生物基因直向同源物(EukaryoticGene Orthologs, EGO)数据库来鉴定此类相关序 列,这可通过关键词搜索或通过使用BLAST算法以目的核酸或多肽序列进行。对于其他 情况,为了特定生物创建了专用核酸序列数据库,例如联合基因组研究所(Joint Genome Institute)所作的。对于其他情况,序列获自私人数据库,其自行努力测序制备,例如欧洲 油菜、向日葵(Helianthus annus)禾口 Linum usitatissum 的数据库。实施例2 =PATL PRP38、GATA样、ADA2和WDR23样多肽序列的比对使用来自Vector NTI (Invitrogen)的Alignment X程序进行多肽序列的比对,其 中所述Alignment X程序基于流行的累进比对Clustal W算法(Thompson等(1997)Nucleic Acids Res 25 :4876_4882 ;Chenna 等(2003),Nucleic Acids Res 31 :3497_3500)。默认 值是空位开口罚分的默认值是10,空位延伸罚分是0. 1并且所选的权重矩阵是Blosum 62(如果比对多肽的话)。PATL多肽中序列的保守性在C-端高于N-端。给出共有序列。 示出保守的氨基酸。PATL多肽比对于图2。比较图1和图2,揭示保守结构域的存在,以及 图1中所示的关键氨基酸残基出现在图2的PATL多肽中。PATL多肽的系统树(图3)使用 如Vector NTI (Invitrogen)的AlignX程序中所提供的邻接法聚类算法构建。PRP38多肽中序列的保守性主要在该多肽N-端PRP38结构域中,N-端结构域通常 在序列长度和组成上更加多变。PRP38多肽比对于图7。PRP38多肽的系统树(图8)使用 如Vector NTI (Invitrogen)的AlignX程序中所提供的邻接法聚类算法构建。GATA样多肽中序列的保守性主要在该多肽的GATA结构域,C端结构域、N端结构 域通常在序列长度和组成上更加多变。GATA样多肽比对于图12。
78
ADA2多肽中序列的保守性主要在该多肽的保守型ZZ型Zn指、SANT DNA结合结构 域和SWIRM结构域。给出共有序列。ZZ型Zn指结构域富含半胱氨酸残基。ADA2多肽比对 于图16。ADA2多肽的系统树(图17)使用如Vector NTI (Invitrogen)的AlignX程序中 所提供的邻接法聚类算法构建。表A5中全长WDR23样多肽序列的序列多重比对使用AlignX算法(来自Vector NTI 10. 3, Invitrogen Corporation)进行。比对的结果示于本申请的图23和24。图23显示序列比对,其代表在WD40的两个连续的浆中保守的DxR基序、在来自人 的WRD23 (NCBI登录号AK057636)、黑曲霉(NCBI登录号CAK40817)和表A5的植物WRD23样多肽。在图24中,例SEQ ID NO 271所示的保守结构域(⑶)的起点和终点使用括号显 示。共有序列中对应PF00400的WD40重复以X标出。DxR基序也在共有序列中鉴定。实施例3 计算在实施本发明方法中有用的多肽序列之间的全局同一性百分数使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件 (BMC Bioinformatics. 2003 4:29. MatGAT 使用蛋白质序列或DNA序列产生相似性/同一 生失巨P车白勺一 Ρ Μ (an application that S; 13 rates similarity/identity matrices using protein 或 DNA 序歹lj s),Campanella JJ, Bitincka L, Smalley J ;i亥软件由 Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的全局相似性和同一 性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需预先比对 数据。该程序使用Myers和Miller全局比对算法(空位开口罚分12和空位延伸罚分2) 执行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后 将结果置于距离矩阵中。在分割线下半部分显示序列相似性,并且在对角分割线的上半部 分显示序列同一性。比较中使用的参数是评分矩阵Blosum62第一空位12延伸空位2表Bl中显示在多肽序列的全长范围内全局相似性和同一性的软件分析结果。在 对角线上方给出同一性百分数(粗体)而在对角线下方给出相似性百分数(正常字体)。与0rysa_PATL_l多肽(SEQ ID NO 2)相比,在实施本发明方法中有用的PATL多 肽序列之间的同一性百分比可低至23. 7%氨基酸同一性。表Bl 在该多肽序列的全长范围内全局相似性和同一性的MatGAT结果。
对于PRP38多肽,与Arath_PRP38_l多肽(表A2)相比,选自表A2的多肽序列的 全长范围内全局相似性示于表B2。
表B2 :PRP38多肽之间的序列相似性 与SEQ ID NO 77相比,在实施本发明方法中有用的表B2的PRP38多肽序列之间 的同一性百分比可低至23. 6%氨基酸同一性。对于GATA样蛋白质,比较中使用的参数是评分矩阵Blosum62第一空位11延伸空位1表B3中显示在多肽序列的全长范围内全局相似性和同一性的软件分析结果。在 对角线上方给出同一性百分数(粗体)而在对角线下方给出相似性百分数(正常字体)。与SEQ ID NO :129相比,在实施本发明方法中有用的GATA样蛋白质序列之间的同 一性百分比可低至14%氨基酸同一性。
81
对于ADA2多肽,比较中使用的参数是评分矩阵Blosum62 第一空位12延伸空位2表B4中显示在多肽序列的全长范围内全局相似性和同一性的软件分析结果。在 对角线上方给出同一性百分数(粗体)而在对角线下方给出相似性百分数(正常字体)。与Arath_ADA2_l多肽(SEQ ID NO 182)相比,在实施本发明方法中有用的ADA2 多肽序列之间的同一性百分比可低至21. 2%氨基酸同一性。表B4 该多肽序列的全长范围内全局相似性和同一性的MatGAT结果。
表B4 :ADA2多肽之间的序列相似性 对于WDR23样蛋白质,比较中使用的参数是评分矩阵Blosum62第一空位12延伸空位2
表B5中显示在多肽序列(除了部分多肽序列)的全长范围内全局相似性和同一 性的软件分析结果。
与SEQ ID NO :216相比,在实施本发明方法中有用的全长肽序列之间的同一性百 分比可低至54%氨基酸同一性。在SEQ ID NO 271所示的保守结构域(CD)(且包含于SEQ IDNO 216)和表A5的 多肽序列的保守结构域(如图24中示出的)之间的同一性百分比增加至69%氨基酸同一 性,如表B5. 1所示。实施例4 鉴定在实施本发明方法中有用的多肽序列中所包含的结构域通过搜索InterPro数据库鉴定保守结构域蛋白质。蛋白质家族、结构域和位点的 集成资源(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库 的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同的方法学及不同程 度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识(protein signatures) 0 合作数据库包括 SWISS-PROT、PROSITE、TrEMBL、Panther、PRINTS、ProDom 和 Pfam、Smart 和 TIGRFAM。Pfam是覆盖众多常见蛋白质结构域和家族的序列多重比对结果和隐匿马尔科夫 模型(HMM)的庞大集合。Pfam在英国Sanger研究所服务器上维护。Interpro由英国欧洲 生物信息学研究所维护。在表C5中显示SEQ ID NO 2所示的多肽序列的InterPro扫描结果。表C5 =SEQ ID NO 2所示的多肽序列的InterPro扫描结果(主要登录号)。数据 库登录号中数据库的缩写PF =Pfam ;PS =Prosite ;SM =Smart ;SSF =Superfamily0 在表C2中显示SEQ ID NO :77所示的多肽序列的Pfam扫描结果。表C2 表A2的 多肽序列的Pfam扫描结果(主要登录号)。给出所扫描的多肽(查询多肽)中氨基酸坐标
91 在表C3中显示SEQ ID NO 129所示的多肽序列的InterPro扫描结果。表C3 =SEQ ID NO 129所示的多肽序列的InterPro扫描结果(主要登录号)。 在表C4中显示SEQ ID NO 182所示的多肽序列的Pfam扫描结果。表C4 =SEQ ID NO 182所示的多肽序列的Pfam扫描结果(主要登录号)。表C4:表A4的多肽序列的InterPro扫描结果(主要登录号)。给出所扫描的多 肽(查询多肽)中氨基酸坐标分隔的结构域(结构域名称)。给出命中Pfam输入的查询多 肽比对的e-值。 在表C5中显示SEQ ID NO 216所示的多肽序列的InterPro扫描结果。表C6 =SEQ ID NO 216所示的多肽序列的InterPro扫描结果。
实施例5 在本发明方法中所用的核酸序列的克隆使用定制的拟南芥幼苗cDNA 文库(在 pCMV Sport 6. O 中;Invitrogen,Paisley, UK)作为模板,通过PCR扩增本在本发明方法中使用的核酸序列。使用Hifi Taq DNA聚合 酶,在标准条件下使用50 μ 1 PCR混合物中的200ng模板进行PCR。对于 PATL,使用的弓丨物是 SEQ ID NO :73 :5,_ggggacaagtttgtacaaaaaagcaggctta aacaatggcggaggagccac_3,禾口SEQ IDNO 74 ;5‘-ggggaccactttgtacaagaaagctgggtgtggtgaa tctggtgatcagg-3’,其包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR 片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间所述PCR片段与pD0NR201 质粒体内重组以产生根据Gateway术语学的“进入克隆”pOrySa_PATL_l。质粒pD0NR201作为Gateway 技术的部分从Invitrogen购买。包含SEQ ID NO=I的进入克隆随后在LR反应中与用于稻转化的两个目的载体一 起使用。第一载体含有在T-DNA边界内部的功能性元件植物选择性标记、可筛选标记表达 盒,和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒。用 于组成型表达的稻G0S2启动子(SEQ ID NO 75)位于该Gateway盒上游。在LR重组步骤后,将所得表达载体PG0S2 Orysa_PATL_l (图4)根据本领域熟知 的方法转化至农杆菌菌株LBA4044中。对于 RP38,使用的弓丨物是 SEQ ID NO 125 5' ggggacaagtttgtacaaaaaagcaggctt aaacaatggcggagatacagtcaaa 3'禾口 SEQ IDNO 126 ;5' ggggaccactttgtacaagaaagctgggtt cacctccaagaggaacca 3’,其包括用于Gateway重组的AttB位点。也使用标准方法纯化扩 增的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间所述PCR片段与 PD0NR201质粒体内重组以产生根据Gateway术语学的“进入克隆”pPRP38。质粒pD0NR201 作为Gateway 技术的部分从Invitrogen购买。包含SEQ ID NO :76的进入克隆随后在LR反应中与用于稻转化的目的载体一起使 用。该载体含有在T-DNA边界内部的植物选择性标记、可筛选标记表达盒,和意图与已经克 隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于 组成型表达的稻G0S2启动子(SEQ ID NO 127)位于该Gateway盒上游。在LR重组步骤后,将所得表达载体pG0S2::PRP38(图9)根据本领域熟知的方法 转化至农杆菌菌株LBA4044中。对于GATA,使用的引物是prml0133(SEQ ID NO 133 ;有义,起始密码子是粗体)5’ GGGGACAAGTTTGTACAAAAAAGCAGGCTTAAAC ATG TCTACTATCTACATGAGCCA 3’ 和 prml0134(SEQ ID NO 134 ;反义,互补)5,GGGGACCACTTTGTACAAGAAAGCTGGGTAGCTAGCTAGTTTTGATCAGC 3,,其包括用于 Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。随后进行Gateway方 法的第一步骤,即BP反应,在此期间所述PCR片段与pD0NR201质粒体内重组以产生根据 Gateway术语学的“进入克隆” pGATA-like。质粒pD0NR201作为Gateway 技术的部分从 Invitrogen 购买。包含SEQ ID NO 128的进入克隆随后在LR反应中与用于稻转化的目的载体一起 使用。该载体含有在T-DNA边界内部的植物选择性标记、可筛选标记表达盒,和意图与已经 克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用 于组成型表达的稻G0S2启动子(SEQ ID NO 135)位于该Gateway盒上游。在LR重组步骤后,将所得表达载体pG0S2: GATA-Iike (图13)根据本领域熟知的 方法转化至农杆菌菌株LBA4044中。使用定制的稻幼苗cDNA 文库(在 pCMV Sport 6. O 中;Invitrogen, Paisley, UK) 作为模板,通过PCR扩增本在本发明方法中使用的核酸序列SEQ ID N0:177。使用Hifi Taq DNA聚合酶,在标准条件下使用50 μ 1 PCR混合物中的200ng模板进行PCR。使用的引物是 prml0106(SEQ ID NO 179 ;有义,启示密码子为粗体)5,-ggggacaagtttgtacaaaaaagcagg cttaaacaatgcttcaccattactacagc-3,禾口 prml0107(SEQ ID NO 180 ;反义,互补)5,-gggg accactttgtacaagaaagctgggtcca acgctaatgctacact-3‘,其包括用于 Gateway 重组的 AttB位点。也使用标准方法纯化扩增的PCR片段。其他克隆步骤如上所述。对于ADA2,使用的引物是 SEQ ID NO 211 5,-GGGGACAAGTTTGTACAAAAAAGCAGGCTT AAACAATGGGTCGTTCGAAACTAGC-3,和SEQ ID NO 212 ;5‘-GGGGACCACTTTGTACAAGAAAGCTGGGTC ATGTTAGGACCATGAAGCT ATG-3,,其包括用于Gateway重组的AttB位点。也使用标准方法纯 化扩增的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间所述PCR片 段与pD0NR201质粒体内重组以产生根据Gateway术语学的“进入克隆” pAtADA2_l。质粒 PD0NR201作为Gateway 技术的部分从Invitrogen购买。包含SEQ ID NO 181的进入克隆随后在LR反应中与用于稻转化的两个目的载体 一起使用。第一载体含有在T-DNA边界内部的功能性元件植物选择性标记、可筛选标记 表达盒,和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway 盒。用于组成型表达的稻HMGP启动子(SEQ ID NO 213)位于该Gateway盒上游。第二载 体在T-DNA边界内部含有上述相同的功能性元件,稻EXP9启动子(SEQ IDNO 214)位于该 Gateway盒上游。在LR重组步骤后,将所得表达载体pHMG Arath_ADA2_l (图18)根据本领域熟知 的方法转化至农杆菌菌株LBA4044中。除非另外说明,重组DNA 技术根据(Sambrook(2001)MolecularCloning :a laboratory manual,第 3 版,Cold Spring Harbor LaboratoryPress, CSH, New York)或 在 Ausubel 等(1994), Current Protocols inMolecular Biology, Current Protocols第 1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料和方法在BIOS ScientificPublications Ltd (英国)禾口 Blackwell Scientific Publications ()出 版的 R. D. D. Croy 的 Plant Molecular Biology Labfax (1993)中描述。对于WDR23样多肽,编码SEQ ID NO 216所示的WDR23样多肽序列的拟南芥cDNA 使用下述cDNA作为模板进行PCR扩增,所述cDNA合成自生长于不同条件下的拟南芥的不 同组织提取得到的mRNA。包括用于Gateway重组的AttB位点的下列引物用于PCR扩增(v) Prm 09100 (SEQ ID N0:274,正义)5 ’ -GGGGACAAGTTTGTACAAAAAAGCAGGCTTAAACAATGTTTTTTGGACCAAGTGAG-3’(vi)Prm 09101 (SEQ ID NO :275,反义,互补)5 ’ -GGGGACCACTTTGTACAAGAAAGCTGGGTTGTGTAGAGAGACGCATCAGT-3’使用Hifi Taq DNA聚合酶在标准条件下进行PCR。使用标准方法扩增和纯化具有 预期长度的PCR片段(包含attB位点)。随后进行Gateway方法的第一步骤,即BP反应, 在此期间,所述PCR片段与pD0NR201质粒在体内重组以产生根据Gateway术语学的“进入 克隆”。质粒PD0NR201作为Gateway 技术的部分从Invitrogen购买。实施例5A 在实施本发明方法中有用的多肽序列的拓扑结构预测TargetP 1. 1预测真核蛋白的亚细胞定位。基于任何氨基端前序列叶绿体转运 肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)的预测存在性进行定位指派。作为最 终预测基础的评分并不真正是概率,并且它们不是必需地加合成一体。然而,根据TargetP, 具有最高评分的定位是最可能的,并且评分之间的关系(可靠性级别)可以指示该预测具 有多大确定性。可靠性级别(RC)范围从1至5,其中1表示最可靠的预测。TargetP在丹 麦技术大学(Technical University of Denmark)的服务器上维护。
对于预测含有氨基端前序列的序列而言,也可以预测潜在的切割位点。可以选择许多参数,如生物组别(非植物或植物)、临界值集合(无、预定义的临界 值集合或用户指定的临界值集合)和切割位点预测的计算(是或否)。在表D3中呈现SEQ ID NO 129所示的多肽序列的TargetP 1. 1分析的结果。选 择“植物”生物组别,未定义临界值,并且对转运肽的预测长度提出要求。SEQ ID N0:129所 示的多肽序列的亚细胞定位可以是细胞质或细胞核,没有预测到转运肽。表D3 =SEQ ID NO 129所示的多肽序列的TargetP 1. 1分析结果 许多其他算法可以用来进行此类分析,包括·在丹麦技术大学服务器上维护的ChloroP 1. 1 ;·在澳大利亚布里斯班昆士兰大学生物科学研究所的服务器上维护的Protein Prowler亚细胞定位预测者1. 2版;·在加拿大阿伯特省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE蛋白组分 析专家 PA-GOSUB 2. 5 ;·在丹麦技术大学服务器上维护的TMHMM。实施例6 植物转化稻转化使用含有表达载体的农杆菌来转化稻植物。将粳稻栽培品种日本晴(Nipponbare) 的成熟干燥种子脱壳。通过如下方式实施消毒在70%乙醇中孵育1分钟,随后在0. 2% HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后在含有2,4-D 的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将胚发生的盾片衍生性 愈伤组织切下并在相同的培养基上增殖。2周后,将所述愈伤组织通过在同一种培养基上传 代培养另外2周进行繁殖或增殖。胚发生的愈伤组织片在新鲜培养基上传代培养3日,随 后共培育(以助长细胞分裂活性)。
98
将含有表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生 素的AB培养基上并在28°C培养3日。随后收集细菌并在液体共培育培养基中悬浮至密度 (OD600)约1。该混悬液随后转移至培养皿内并将所述愈伤组织浸入此混悬液中15分钟。该 愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并在25°C于黑暗中孵育3日。 共培育的愈伤组织在含2,4-D的培养基上在28°C于黑暗中在存在选择剂时培育4周。在此 期间,迅速生长的抗性愈伤组织团发育。将这种材料转移至再生培养基并在光照下孵育后, 胚发生潜能释放并且苗在随后4至5周内发育。将苗从愈伤组织上切下并且在含有植物生 长素的培养基上孵育2至3周,将苗从所述培养基转移至土壤。硬化的苗在温室中于高湿 度和短日照下培育。对于一个构建体,产生大约35个独立的TO稻转化体。将原代转化体从组织培养箱 转移至温室。在定量PCR分析验证T-DNA插入物的拷贝数后,仅保留显示所述选择剂抗性的 单拷贝转基因植物用于收获Tl种子。种子随后在移栽后3至5个月收获。该方法以超过 50%的比例产生单基因座转化体(Aldemita和Hodgesl996,Chan等1993,Hiei等1994)。玉米转化玉米(玉蜀黍,Zeamays)的转化用 Ishida 等(I996)Nature Biotech 14(6) 745-50描述的改良方法进行。在谷物中,转化是基因型依赖的并且仅特定基因型适合于转 化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材 料的良好来源,不过也可以成功地使用其他基因型。谷穗从授粉后大约11日(DAP)的谷物 植物收获,此时不成熟的胚的长度是大约1至1. 2mm。将不成熟的胚与含有所述表达载体的 根瘤农杆菌共培育,并且通过器官发生过程回收转基因植物。切下的胚在愈伤组织诱导培 养基上、随后在玉米再生培养基上培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不 过可以使用不同的选择性标记)。培养板在25°C于光照下孵育2-3周,或直至苗发育。将 来自每个胚的绿色苗转移至玉米生根培养基并在25°C孵育2-3周,直至根发育。将生根的 苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的 植物产生Tl种子。小麦转化小麦的转化用Ishida等(1996)Nature Biotech 14(6) :745_50描述的方法进行。 栽培品种Bobwhite (可从墨西哥CIMMYT获得)通常用于转化。将不成熟的胚与含有所述表 达载体的根瘤农杆菌共培育,并且通过器官发生过程回收转基因植物。与农杆菌孵育后,所 述胚在愈伤组织诱导培养基上、随后于再生培养基上体外培育,其中所述的培养基含有选 择剂(例如咪唑啉酮,不过可以使用不同的选择性标记)。培养板在25°C于光照下孵育2-3 周,或直至苗发育。将来自每个胚的绿色苗转移至生根培养基并在25°C孵育2-3周,直至根 发育。将生根的苗移植至温室中的土壤内。从显示选择剂耐受性并且含有单拷贝T-DNA插 入物的植物产生Tl种子。大豆转化根据Texas A&M美国专利5,164,310中描述的改良方法转化大豆。几个商业大豆 品种适合于通过这种方法转化。栽培品种Jack (从Illinois种子基金会可获得)通常用于 转化。将大豆种子消毒以体外播种。从7日龄年幼籽苗切除下胚轴、胚根和一片子叶。进 一步培育上胚轴和剩余的子叶以发育腋生结节。将这些腋生结节切下并与含有表达载体的根瘤农杆菌孵育。在共培育处理之后,将外植体洗涤并转移至选择培养基。将再生的苗切 下并置于苗伸长培养基上。将长度不超过Icm的苗置于生根培养基上直至根发育。将生根 的苗移植至温室中的土壤内。从显示选择剂耐受性并且含有单拷贝T-DNA插入物的植物产 生Tl种子。油菜籽/卡诺拉油菜转化使用5-6日龄年幼籽苗的子叶柄和下胚轴作为组织培养用外植体并且根据Babic 等,(1998,Plant Cell Rep 17 183-188)进行转化。商业品种 Westar (Agriculture Canada)是用于转化的标准品种,不过也可以使用其他品种。对卡诺拉油菜种子进行表面 消毒以体外播种。从所述体外籽苗切下带有子叶的子叶柄外植体,并且用(含有表达载体 的)农杆菌通过该叶柄外植体的切口末端浸入细菌悬液而接种。所述外植体随后在23°C, 16小时光照下于含有3mg/l BAP、3%蔗糖、0. 7%植物琼脂的MSBAP-3培养基上培养2日。 与农杆菌共培育2日后,将叶柄外植体转移至含有3mg/l BAP、头孢噻肟、羧苄青霉素或特 美汀(300mg/l)的MSBAP-3培养基上培养7日,并且随后在含有头孢噻肟、羧苄青霉素或特 美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗长度是5-10mm时,将这些苗切 下并转移至苗伸长培养基(MSBAP-0. 5,含有0. 5mg/l BAP)。将长度大约2cm的苗转移至用 于根诱导的生根培养基(MSO)。将生根的苗移植至温室中的土壤内。从显示选择剂耐受性 并且含有单拷贝T-DNA插入物的植物产生Tl种子。苜蓿转化使用(McKersie等,1999 Plant Physiol 119:839-847)的方法转化苜蓿的再生 性克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得 再生性植物的方法。例如,这些再生性植物可以选自栽培品种Range lander (Agriculture Canada)或如Brown DCW禾口AAtanassov(1985. Plant Cell Tissue Culture 4:111—112)所 述的任何其他商业苜蓿品种。备选地,已经选择RA3品种(威斯康星大学)用于组织培养 (Walker等,1978 Am J Bot 65 :654_659)。叶柄外植体与含有表达载体的根瘤农杆菌C58C1 pMP90 (McKersie 等,1999 Plant Physiol 119 :839_847)或LBA4404 的过夜培养物共培育。 所述外植体在黑暗中于含有288mg/LPro、53mg/L硫代脯氨酸、4. 35g/L K2S04和100 μ π!乙 酰丁香酮的SH诱导培养基上共培育3日。所述外植体在半浓度的Murashige-Skoog培养 基(Murashige和Skoog,1962)中洗涤并铺种在不含乙酰丁香酮而含有抑制农杆菌生长的 合适选择剂和合适抗生素的相同SH诱导培养基上。几周后,将体细胞胚转移至不含生长调 节剂、不含抗生素和含有50g/L蔗糖的B0i2Y发育培养基。随后在半浓度Murashige-Skoog 培养基上萌发体细胞胚。将生根的籽苗移植至花钵内并且在温室中培育。从显示选择剂耐 受性并且含有单拷贝T-DNA插入物的植物产生Tl种子。棉花转化使用根瘤农杆菌,根据US 5,159,135中所述的方法转化棉花。棉花种子在3%次 氯酸钠溶液中作20分钟表面消毒并在含500 μ g/ml头孢噻肟的蒸馏水中洗涤。随后将种 子转移至含有50 μ g/m苯菌灵的SH培养基用于萌发。取下4至6日龄籽苗的下胚轴,切成 0.5cm小片并置于0.8%琼脂上。农杆菌混悬液(每毫升大约IO8个细胞,从含有用目的基 因和合适选择标记转化的过夜培养物稀释)用于接种下胚轴外植体。在室温和光照下3日 后,将组织转移至固体培养基(1.6g/l脱乙酰吉兰糖胶),所述固体培养基含有具有维生素B5 的 Murashige 和 Skoog 盐(Gamborg 等,Exp. Cell Res. 50 151-158 (1968)) ,0. lmg/1 2, 4-D、0. lmg/1 6-呋喃甲基氨基嘌呤和750 μ g/ml MgCL2以及杀死残留细菌的50至100 μ g/ ml头孢噻肟和400-500 μ g/ml羧苄青霉素。单个细胞系在2至3个月(每隔4至6周传 代培养)后分离并且在用于组织增殖的选择培养基上进一步培育(30°C,16小时光周期)。 转化的组织随后在非选择培养基上进一步培育持续2至3个月以产生体细胞胚。将至少 4mm长度的外观健康胚转移至含有精细蛭石中具SH培养基的管内,所述SH培养基补充有 0. lmg/1吲哚乙酸、6-呋喃甲基氨基嘌呤和赤霉酸。在30°C以16小时光周期培育胚,并且 将处于2至3叶期的小植物转移至具有蛭石和养分的花钵。植物硬化并随后移至温室以进 一步培育。对于WDR23样基因,棉花(陆地棉)的转化使用根瘤农杆菌,在下胚轴外植体上进 行。市售品种,例如Coker 130或Coker 312 (SeedCo,Lubbock,TX)是用于转化的标准变 种,但是也可以使用其他变种。表面消毒种子并在黑暗中萌发。从长约1-1. 5厘米的萌发 幼苗上切下下胚轴外植体。下胚轴外植体浸没在包含表达载体的根瘤农杆菌接种物中5分 钟,然后在黑暗中,于24°C下在MS+1.8mg/l KN03+2%葡萄糖上共培育约48小时。外植体 转移到含有合适细菌和植物选择性标记的相同培养基中(更新几次),直到可以看见胚性 胼胝体(embryogenic calli)。分离胼胝体并再培养直至出现体细胞胚。源自体细胞胚的 小植株在生根培养基上成熟至根发育。生根的幼苗转移到温室中的花钵土壤中。从表现选 择剂耐受性并含有单拷贝T-DNA插入物的植物中产生Tl种子。实施例6B 使用SEQ ID NO 215所示的核酸序列构建表达载体包含SEQ ID NO 215的进入克隆随后在LR反应中与用于稻转化法的目的载体一 起使用。该载体含有在T-DNA边界内部的植物选择性标记、可筛选标记表达盒,和意图与已 经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用 于组成型表达的稻G0S2启动子(SEQ ID NO ,212)位于该Gateway盒上游。也产生用于稻 转化的第二目的载体,其具有用于分生组织特异性表达的稻金属硫蛋白启动子(MT ;SEQ ID NO 273)。在LR 重组步骤后,所得表达载体 pG0S2 WDR23-1 ike 和 pMT WDR23-1 ike (图 25) 根据本领域熟知的方法独立转化至农杆菌菌株LBA4044中。实施例7 表型评价方法7. 1评价建立产生大约35个独立的TO稻转化体。将原代转化体从组织培养室转移至温室以培 育并收获Tl种子。留下6个事件,其中Tl子代以3 1比例对所述转基因的存在/不存 在分离。对于这些事件中的每个事件,通过监测目视标记表达选出大约10株含有该转基因 的Tl籽苗(杂合子和纯合子)和大约10株缺少该转基因的Tl籽苗(失效合子)。以随机 位置并排生长转基因植物和相应的失效合子。温室条件(非胁迫条件)是短日照(12小时 光照),在光照下28°C和在黑暗中22°C,和70%相对湿度。进行频繁的浇水,以满足植物生 长和发展出健康的外观的水和养分的需要。植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同 角度拍摄每株植物的数字图像(2048X 1536像素,1600万颜色)。干旱筛选
在盆栽土壤中在正常条件下培育来自T2种子的植物直至它们接近齐穗期。随后 将它们转移至灌溉减少的“干燥”区。将湿度探测器插入随机选择的花钵内,以监测土壤水 含量(SWC)。当SWC下降低于某个阈值时,自动地对所述植物连续再灌溉直至再次达到正常 水平。随后将植物再次转移至正常条件。栽培的剩余部分(植物成熟、种子收获)与不在 非生物胁迫条件下培育的植物相同。如对正常条件下详述那样记录生长和产量参数。氮利用效率筛选在盆栽土壤中在除营养液之外的正常条件下培育来自T2种子的稻植物。从移植 至成熟期间用含有降低的、通常7至8倍之间更少的氮(N)含量的特定营养液浇灌所述花 钵。栽培的剩余部分(植物成熟、种子收获)与不在非生物胁迫下培育的植物相同。如对 正常条件下详述那样记录生长和产量参数。7. 2统计分析F-检验使用两因素ANOVA(变量分析)作为总体评价植物表型特征的统计模型。对用本 发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该 基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。对于该F 检验而言,真实基因总体作用显著性的阈值对于所述F检验设置在5%概率水平上。显著性 F检验值指出了基因作用,这意味不仅仅是基因的存在或位置才造成表型上的差异。因为实施了具有重叠事件的两个实验,故进行联合分析。这用于检验对这两个实 验影响的一致性,并且如果一致,则用于积累来自两个实验的证据以提高结论的可信度。所 用的方法是考虑数据的多重水平结构的混合模型法(即实验_事件_分离子)。通过比较 似然比检验与卡方分布(chi squaredistribution)获得P-值。7. 3测量的参数生物量相关的参数测量植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同 角度拍摄每株植物的数字图像(2048X 1536像素,1600万颜色)。植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上与背 景区别的像素总数而确定。这个值对相同时间点上从不同角度拍摄的画面进行平均化并且 通过校正转化成以平方mm表述的物理表面值(physical surface value) 0实验显示以这 种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是在植物已 经达到其最大叶生物量的时间点处所测量的面积。早期生长势是萌发后3周的植物(籽 苗)地上部分面积。根生物量的增加表述为总根生物量的增加(测量为植物寿命期间所观 察到的根最大生物量);或表述为根/冠比增加(测量为根和苗的活跃生长期间根质量与 苗质量之间的比例)。早期生长势通过计数来自植物地上部分的与背景区别的像素总数确定。这个值对 相同时间点上从不同角度拍摄的画面进行平均化并且通过校正转化成以平方mm表述的物 理表面值。下述结果是针对萌发后3周的植物。种子相关的参数测量值将成熟的原发花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°C干 燥3日。随后将所述花序脱粒,并且收集和计数全部种子。使用吹气装置将饱满粒与空粒 分开。弃去空粒并且再次计数剩余部分。饱满粒在分析天平上称重。通过计数分离步骤后仍留下的饱满粒的数目确定饱满种子数。种子总产量通过称量从一株植物收获的全部饱满 粒测量。每株植物的种子总数通过计数从一株植物收获的壳数测量。千粒重(TKW)从计数 的饱满种子数及它们的总重量外推出来。本发明中的收获指数(HI)定义为种子总产量与 地上部分面积(mm2)之间的比率乘以系数106。如本发明中定义的每花序总花数是种子总 数与成熟原发花序数之间的比率。如本发明中定义的种子饱满率是饱满种子数对种子(或 小花)总数的比例(表述为%)。盐胁迫筛选植物在由椰子纤维和argeX(3 1比率)组成的基质上培育。在温室中移植小植 物后,在头两周期间使用正常营养液。在这两周后,添加25mM盐(NaCl)至所述营养液,直 至收获植物。如对正常条件下详述那样记录生长和产量参数。降低的营养(氮)可利用性筛选在除营养液之外的正常条件下在盆栽土壤中培育来自6个事件(T2种子)的植 物。从移植至成熟期间用含有降低的、通常7至8倍之间更少的氮(N)含量的特定营养液 浇灌所述花钵。培育的其余部分(植物成熟、种子收获)与不在非生物胁迫下培育的植物 相同。如对正常条件下详述那样记录生长和产量参数。实施例8 转基因植物的表型评价结果表达G0S2启动子下的Orysa_PATL_l (SEQ ID NO 1)核酸,且生长于非胁迫条件温 室(实施例7)中的转基因稻植物的评测结果如下所示。至少3%的提高在种子重量(种子 总重量)、饱满种子数和植物高度中观察到(表Dl)。表Dl 用pG0S2::SEQ ID NO 1转化的转基因植物(T2植物)的性状评测结果。 生长于非胁迫条件温室(实施例7)中表达AtPRP38_l (SEQ ID NO 76)核酸的转基 因稻植物的评测结果如下所示。至少5%的提高在地上部分生物量(AreaMax)、萌发势(早 期生长势)、种子总产量、饱满种子数、饱满率、收获指数和每株植物种子数中观察到(表 D2)。表D2 用pG0S2: :PRP38转化的转基因植物的性状评测结果。 在非胁迫条件下表达SEQ ID NO 128所示GATA样核酸的转基因稻植物的评测显 示增加的千粒重(共6个事件,总体增加9.1%,p-值0. 00001)。对于其他产量参数未观 察到显著的变化。在非胁迫条件下表达SEQ ID NO: 177所示GATA样核酸的转基因稻植物的评测显 示增加的种子总重量(6个中的4个品系,总体增加16.9%,ρ-{t 0. 00001),以及增加的饱 满种子数(6个中的4个品系,总体增加16. 0%,ρ-值0. 00001)。对于其他产量参数未观
察到显著的变化。生长于非胁迫条件温室(实施例7)中表达pHMG或the pEXP启动子下的Arath_ ADA2_1 (SEQ ID NO 181)核酸的转基因稻植物的评测结果如下所示。至少3%的提高在种 子重量(种子总重量)、饱满种子(饱满率)、每穗花数和收获指数中观察到(表D4)。表D4 用 pHMG: :SEQ ID NO :181 和用 pEXP: :SEQ ID NO 181 转化的转基因植物
(Tl植物)的性状评测结果。
实施例9 在组成型启动子控制下,表达编码SEQ ID NO :216所示的WDR23样多肽 的核酸序列的转基因稻植物的表型评估结果在组成型表达G0S2启动子控制下,表达编码SEQ ID NO :216所示的WDR23样多肽 的核酸序列的转基因稻植物Tl和T2世代的评估结果如下所示。如表D5所示,在Tl和T2世代表型分析中,与对应的败合(对照)相比,转基因 植物的每株种子总产量、种子饱满率、饱满种子数、收获指数和千粒重(TKW)均有显著的提闻。表D5 在组成型表达G0S2启动子控制下,表达编码SEQ ID NO 216所示的WDR23 样多肽的核酸序列的转基因稻植物Tl和T2世代的评估结果。 实施例10 在分生组织特异性启动子控制下,表达编码SEQ ID NO 216所示的 WDR23样多肽的核酸序列的转基因稻植物的表型评估结果在分生组织特异性表达金属硫蛋白MT启动子控制下,表达编码SEQID NO 216所 示的WDR23样多肽的核酸序列的转基因稻植物Tl和T2世代的评估结果如下所示。如表E所示,在Tl和T2世代表型分析中,与对应的败合(对照)相比,转基因植物 的每株种子总产量、种子饱满率、饱满种子数、收获指数和千粒重(TKW)均有显著的提高。表E 在分生组织特异性表达MT启动子控制下,表达编码SEQ IDNO 216所示的 WDR23样多肽的核酸序列的转基因稻植物Tl和T2世代的评估结果。
权利要求
用于相对于对照植物而言增强植物中产量相关性状的方法,其包括调节植物中编码选自以下的多肽的核酸的表达,a)PATELLIN多肽,和任选地选择具有增强的产量相关性状的植物,或b)PRP38多肽,或c)ADA2多肽,和任选地选择具有增强的产量相关性状的植物,或d)GATA样多肽,其中所述GATA样多肽属于GATA转录因子亚家族II,并包含GATA结构域,或e)WDR23样多肽,所述WDR23样多肽包含下述结构域,所述结构域与SEQ ID NO271所示的保守结构域(CD)具有至少65%、70%、75%、80%、85%、90%、95%、98%、99%或更高氨基酸序列同一性,和任选地选择具有增强的产量相关性状的植物。
2.根据权利要求1的方法,其中所述PATELLIN多肽包含至少一个如下结构域(i)SEQID NO 71 所示的 SEC14 结构域Ipeldsvvfyrgadreghpvcynvygefqdkdlyekafgdeekrerflkwriqllergilsqldfspsgics mvqvtdlknsppmlgkhravtrqavallqdnypefiakkvfinvpwwylaankmmspfltqrtkskfifaspaksae tlfryiapeqvpvqfgglfk,或按照递增的优选顺序与SEQ ID NO :71所示的结构域或表A中任意多肽中存在的任 意 SEC14 结构域具有至少 50%,55%,60%,65%,70%,75%,80%,82%,85%,90%,92%, 95%、97%或更高序列同一性的结构域;(ii)SEQID NO 72 所示的 GOLD 结构域sdavteltikpssketveipvtenstigweIrvlgwevsygaeftpdaeggytvivqktrkvpaneepimkgs fkvgepgkivltinnpaskkkkllyrskv,或按照递增的优选顺序与SEQ ID NO :72所示的结构域或表A中任意多肽 中存在的任意 GOLD 结构域具有至少 50%、55%、60%、65%、70%、75%、80%、82%、85%、 90%、92%、95%、97%或更高序列同一性的结构域。
3.根据任一前述权利要求的方法,其中所述调节的表达是通过在植物中引入和表达下 述核酸实现a)编码PATELLIN多肽的核酸,或b)编码PRP38多肽的核酸,或c)编码GATA样多肽的核酸,或d)编码ADA2多肽的核酸,或e)编码WDR23样多肽的核酸。
4.根据任一前述权利要求的方法,其中所述的编码PATELLIN多肽、PRP38多肽、ADA2 多肽、GATA样多肽或WDR23样多肽的核酸编码表A中所列出的任一蛋白质,或是此类核酸 的部分,或是能够与此类核酸杂交的核酸。
5.根据任一前述权利要求的方法,其中所述的核酸序列编码表A中给出的任意蛋白质 的直向同源物或旁系同源物。
6.根据任一前述权利要求的方法,其中所述增强的产量相关性状包括相对于对照植物 而言的提高的产量、千粒重,优选是提高的种子产量。
7.根据权利要求1-6中任一项的方法,其中所述增强的产量相关性状在缺氮条件下获得。
8.根据任一前述权利要求的方法,其中所述编码多肽的核酸是植物来源的。
9.根据任一前述权利要求的方法获得的植物,或其包括种子的部分,其中所述植物或 其部分包含编码PATELLIN多肽、PRP38多肽、ADA2多肽、GATA样多肽或WDR23样多肽的重组核酸。
10.分离的核酸分子,其包含任一下列特征(i)SEQ ID NO 9 ;SEQ ID NO 11 ;SEQ ID NO 13 ;SEQ ID NO 15 ;SEQ ID NO 17 ;SEQ ID NO 19 ;SEQ ID NO 21 ;SEQ ID NO 23 ;SEQID NO 25 和 SEQ ID NO 27 所示的核酸; ( )与(i)中给出的任一 SEQ ID NO互补的核酸片段;(iii)编码下述PATELLIN多肽的核酸,所述多肽与SEQID NO 10 ;SEQ ID NO 12 ;SEQ ID NO 14 ;SEQ ID NO 16 ;SEQ ID NO 18 ;SEQID NO 20 ;SEQ ID NO 22 ;SEQ ID NO 24 ; SEQ ID N0:26和SEQ IDNO :28给出的任一氨基酸序列按照递增的优选顺序具有至少70%、 75%、80%、85%、90%、95%、96%、97%、98%、99%或更高序列同一性;(iv)能够在严格杂交条件下与上述(i)、(ii)或(iii)给出的任一核酸杂交的核酸。
11.分离的多肽,其包含(i)与 SEQ ID N0:10、SEQ ID N0:12、SEQ ID N0:14、SEQ ID N0:16、SEQ ID NO :18、 SEQ ID NO 20,SEQ ID NO :22、SEQ ID NO :24、SEQ ID NO :26 禾口 SEQ ID N0:28 给出的任一 氨基酸序列按照递增的优选顺序具有至少80%、85%、90%、95%、96%、97%、98%、99%或 100%序列同一性的氨基酸序列;(i)中给出的任意氨基酸序列的衍生物。
12.构建体,其包含⑴编码如权利要求1、2或11中定义的PATELLIN多肽、PRP38多肽、ADA2多肽、GATA 样多肽或WDR23样多肽的核酸,或根据权利要求11的核酸;( )能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地 (iii)转录终止序列。
13.根据权利要求12或13的构建体在用于制备植物的方法中的用途,所述植物相对于 对照植物而言具有提高的产量,尤其是提高的生物量和/或提高的种子产量。
14.用根据权利要求12或13的构建体转化的植物、植物部分或植物细胞。
15.用于产生相对于对照植物而言具有提高的产量,优选提高的种子产量的转基因植 物的方法,其包括(i)在植物中引入并表达编码如权利要求1、2或12中定义的PATELLIN多肽、PRP38多 肽、ADA2多肽、GATA样多肽或WDR23样多肽的核酸,或根据权利要求11的核酸;和 ( )在促进植物生长和发育的条件下培育所述植物细胞;和任选地 (iii)选择具有增强的产量相关性状的植物。
16.转基因植物,其相对于对照植物而言,具有因下述核酸调节的表达所引起的提高的 产量,尤其是增提高的种子产量,所述核酸编码权利要求1或2中定义的编码PATELLIN多 肽、PRP38多肽、ADA2多肽、GATA样多肽或WDR23样多肽,或者从所述转基因植物衍生的转 基因植物细胞。
17.根据权利要求11、14或16的转基因植物,或从其衍生的转基因植物细胞,其中所述的植物是作物植物或单子叶植物或谷物植物,如稻、玉米、小麦、大麦、稷、黑麦、小黑麦、高 粱和燕麦。
18.根据权利要求17的植物的可收获部分,其中所述可收获部分优选是枝条生物量和/或种子。
19.产物,其衍生自根据权利要求17的植物和/或根据权利要求18的植物的可收获部分。
20.编码下述多肽的核酸在植物中相对于对照植物而言,提高产量,尤其是提高种子产 量和/或枝条生物量中的用途,所述多肽是PATELLIN多肽、PRP38多肽、ADA2多肽、GATA样 多肽或WDR23样多肽。
全文摘要
本发明涉及用于通过调节植物中编码PATL(PATELLIN)多肽,或PRP38(RNA加工因子前体38),或ADA2(转录衔接头2)多肽的表达而增强植物产量相关性状的方法。本发明也涉及用于通过调节植物中GATA样多肽的核酸的表达而提高千粒重、种子总重量和/或饱满种子数的方法。本发明也涉及用于通过增加植物中编码WD40重复(WDR)23样多肽的核酸的表达而增强多种植物产量相关性状的方法。本发明也提供了在本发明方法中有用的迄今未知的PATL核酸和构建体。
文档编号C12N15/82GK101883783SQ200880118749
公开日2010年11月10日 申请日期2008年11月26日 优先权日2007年11月26日
发明者A·I·桑兹莫林纳罗, C·勒佐, J·M·穆莱特萨洛尔特, R·S·萨洛姆, V·弗兰卡德 申请人:巴斯夫植物科学有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1