用于改进植物的水分利用效率、肥料利用效率、生物/非生物胁迫耐受性、产量和生物量的...的制作方法

文档序号:3563018阅读:425来源:国知局
专利名称:用于改进植物的水分利用效率、肥料利用效率、生物/非生物胁迫耐受性、产量和生物量的 ...的制作方法
用于改进植物的水分利用效率、肥料利用效率、生物/非生 物胁迫耐受性、产量和生物量的分离多肽、多核苷酸发明领域与背景在本发明的一些实施方案中,本发明涉及新的水通道蛋白多核苷酸和多肽,更准 确但并非唯一地讲是涉及使用所述多核苷酸和多肽提高植物的非生物胁迫耐受性、水分利 用效率(WUE)、肥料利用效率(FUE)、生物量、生长势和/或产量的方法。非生物胁迫条件例如盐分、干旱、洪涝、亚适温和有毒化学污染,给农业植物造成 极大损失。大多数植物进化出保护自身免受这些条件侵害的策略。然而,如果胁迫条件的严 重性太大,持续时间太久,则对大多数农作物的植物发育、生长和产量的影响都十分深远。 此外,大多数农作物都非常易受到非生物胁迫(ABS)的影响,因此对于经济作物产量而言 需要最佳的生长条件。连续暴露于胁迫会引起植物代谢发生较大改变,最终将导致细胞死 亡,结果使产量蒙受损失。全球性供水短缺是影响植物生长和作物产量最严重的农业问题之一,已进行努力 以减轻全球耕地沙漠化和盐碱化的有害作用。为此,Agbiotech公司试图生产耐受不同非 生物胁迫的新的作物品种,主要集中在开发新的可以耐受较长时期缺水的新品种。研究表明,植物对不利环境条件适应是具有多基因性质的复杂遗传特性。当供水 受限时,植物WUE对于作物的存活和产量至关重要。因为世界范围内缺水日渐严重,水质下 降,因此增加水分生产率和植物WUE十分重要。许多环境非生物胁迫例如干旱、低温或高 盐,降低根系导水性,影响植物生长,降低作物生产率。可以通过传统育种或者通过遗传工程产生遗传上改进的植物FUE。在转基因植物 中改进FUE的努力可参见Choo等人的美国专利申请20020046419 ;Edgerton等人的美国 专利申请 20030233670 ;Chomet 等人的美国专利申请 20060179511 ;Yanagisawa 等[Proc. Natl. Acad. Sci. U.S. A. 2004,101 (20) :7833_8] ;Good AG 等[Trends Plant Sci. 2004, 9(12) 597-605];以及Good等人的美国专利第6,084,153号。水通道蛋白(AQP,Aquaporin/water channel protein)参与水分跨膜转运,在环 境和发育条件发生变化的情况下维持细胞水平衡和稳态[Maurel C. Plant aquaporins Novel functions and regulation properties (植物水通道蛋白新的功能与调节性 质).FEBS Lett. 2007,581 (12) :2227_36]。这些蛋白质被认为是能够使水和小的中性溶质 例如尿素和 C02 跨膜转运的主要通道[Maurel C. Plant aquaporins :Novelfunctions and regulation properties (植物水通道蛋白新的功能与调节性质).FEBS Lett. 2007年6月 12日;581 (12) :2227-36]。植物中,AQP以内在蛋白的4个亚家族存在质膜蛋白(PIP)、液 泡膜蛋白(TIP)、碱性小蛋白(SIP)和N0D26样蛋白(NIP)。与动物相比,植物中AQP成员的 总数似乎出人意料的高[Maurel C.,2007 (同上)]。例如,在拟南芥基因组中已鉴定出35种 AQP 基因[Quigley F 等,"From genome tofunction :the Arabidopsis aquaporins (从基 因组到功能拟南芥水通道蛋白)” Genome Biol. 2002,3(1) :RESEARCH0001. 1-1. 17];玉 米中 36 禾中[Chaumont F等,2001,"Aquaporins constitute a large and highlydivergent protein family in maize (水通道蛋白在玉米中构建大量高度趋异的蛋白质家族).Plant
5Physiol”,125(3) :1206_15];水稻中 33 禾中[Sakurai, J.等,2005,Identification of 33 rice aquaporin genes and analysisof their expression and function (33 禾中水禾苗水 通道蛋白基因的鉴定及其表达与功能的分析).Plant Cell Physiol. 46,1568-1577]。植 物中大量的AQP表明在环境条件发生变化的情况下的不同作用和差异性调节[Maurel C., 2007 (同上)]。本发明的发明人的W02004/104162教导了多核苷酸序列和使用同样的多核苷酸 序列提高植物对非生物胁迫的耐受性和/或提高植物生物量的方法。本发明的发明人的W02007/020638教导了多核苷酸序列和使用同样的多核苷酸 序列提高植物对非生物胁迫的耐受性和/或提高植物的生物量、生长势和/或产量的方法。Lian HL 等,2006 (Cell Res. 16 :651_60)在水稻中过量表达 AQP 的 PIPl 亚组成 员。Aharon R. 2003 (Plant Cell, 15 439-47)在转基因烟草植物中过量表达拟南芥质 膜水通道蛋白PIPlb。发明概述本发明一些实施方案的一个方面提供提高植物的非生物胁迫耐受性的方法,所 述方法包括在植物中表达编码包含与选自以下的氨基酸序列有至少80 %同源性的氨基 酸序列的多肽的外源多核苷酸:SEQID NO :33、34、30、27-29、31、32、35-52、1401-1403、 1405-1435、1437-1494、1496-1542、1544-1553、1555-1559、1561-1827、1829-1866、 1868-2450、2453-2458、2460-2463、2465-2481、2483、2485-2746、2765-2769、3052-3065 和 3067-3259,从而提高植物的非生物胁迫耐受性。本发明一些实施方案的一个方面提供提高植物的水分利用效率(WUE)、肥料利用 效率(FUE)、生物量、生长势和/或产量的方法,所述方法包括在植物中表达编码多肽的 外源多核苷酸,所述外源多核苷酸包含与选自以下的氨基酸序列有至少80%同源性的氨 基酸序列:SEQ ID NO :33、34、30、27-29、31、32、35-52、1401-1403、1405-1435、1437-1494、 1496-1542、1544-1553、1555-1559、1561-1827、1829-1866、1868-2450、2453-2458、 2460-2463、2465-2481、2483、2485-2746、2765-2769、3052-3065 和 3067-3259,从而提高植 物的水分利用效率(WUE)、肥料利用效率(FUE)、生物量、生长势和/或产量。本发明一些实施方案的一个方面提供分离多核苷酸,所述多核苷酸包含与选自 以下的核酸序列有至少80%同一性的核酸序列=SEQ IDNO :7、8、4、1-3、5、6、9_26、53_55、 57-87,89-147,149-195,197-206,208-212,214-480,482-519,521-1103,1106-1111, 1113-1116、1118-1134、1136、1138-1400、2748-2764、2843-2857 和 2859-3051。本发明一些实施方案的一个方面提供核酸构建体,所述核酸构建体包含本发明的 分离多核苷酸和指导核酸序列转录的启动子。本发明一些实施方案的一个方面提供分离多肽,所述多肽包含与选自以下的 氨基酸序列有至少80%同源性的氨基酸序列SEQ ID NO :33、34、30、27-29、31、32、 35-52、1401-1403、1405-1435、1437-1494、1496-1542、1544-1553、1555-1559、1561-1827、 1829-1866、1868-2450、2453-2458、2460-2463、2465-2481、2483、2485-2746、2765-2769、 3052-3065 和 3067-3259。本发明一些实施方案的一个方面提供包含外源多肽的植物细胞,所述多肽具有与 选自以下的氨基酸序列有至少80%同源性的氨基酸序列SEQ ID N0:33、34、30、27-29、31、32、35-52、1401-1403、1405-1435、1437-1494、1496-1542、1544-1553、1555-1559、 1561-1827、1829-1866、1868-2450、2453-2458、2460-2463、2465-2481、2483、2485-2746、 2765-2769,3052-3065 和 3067-3259。本发明一些实施方案的一个方面提供包含外源多核苷酸的植物细胞,所述外源多 核苷酸包含与选自以下的核酸序列有至少80%同源性的核酸序列SEQ ID N0:7、8、4、l-3、 5、6、9-26、53-55、57-87、89-147、149-195、197-206、208-212、214-480、482-519、521-1103、 1106-1111、1113-1116、1118-1134、1136、1138-1400、2748-2764、2843-2857 和 2859-3051。本发明一些实施方案的一个方面提供提高植物的非生物胁迫耐受性的方法, 所述方法包括在植物中表达编码多肽的外源多核苷酸,所述多肽包含由SEQ ID N0:33、 34、30、27-29、31、32、35-52、1401-1403、1405-1435、1437-1494、1496-1542、1544-1553、 1555-1559、1561-1827、1829-1866、1868-2450、2453-2458、2460-2463、2465-2481、2483、 2485-2746、2765-2769、3052-3065、3067-3258或3259所示的氨基酸序列,从而提高植物的 非生物胁迫耐受性。本发明一些实施方案的一个方面提供提高植物的水分利用效率(WUE)、肥料利用 效率(FUE)、生物量、生长势和/或产量的方法,所述方法包括在植物中表达编码多肽的 外源多核苷酸,所述多肽包含由 SEQ ID NO :33、34、30、27-29、31、32、35-52、1401-1403、 1405-1435、1437-1494、1496-1542、1544-1553、1555-1559、1561-1827、1829-1866、 1868-2450,2453-2458,2460-2463,2465-2481,2483,2485-2746,2765-2769,3052-3065, 3067-3258或3259所示的氨基酸序列,从而提高植物的水分利用效率(WUE)、肥料利用效率 (FUE)、生物量、生长势和/或产量。本发明一些实施方案的一个方面提供分离多核苷酸,所述多核苷酸包含由SEQ ID NO :7、8、4、1-3、5、6、9-26、53-55、57-87、89-147、149-195、197-206、208-212、214-480、 482-519、521-1103、1106-1111、1113-1116、1118-1134、1136、1138-1400、2748-2764、 2843-2857,2859-3050或3051所示的核酸序列。本发明一些实施方案的一个方面提供核酸构建体,所述核酸构建体包含本发明的 分离多核苷酸和指导核酸序列转录的启动子。本发明一些实施方案的一个方面提供分离多肽,所述多肽包含由SEQ ID NO :33、 34、30、27-29、31、32、35-52、1401-1403、1405-1435、1437-1494、1496-1542、1544-1553、 1555-1559、1561-1827、1829-1866、1868-2450、2453-2458、2460-2463、2465-2481、2483、 2485-2746、2765-2769、3052-3065、3067-3258 或 3259 所示的氨基酸序列。本发明一些实施方案的一个方面提供包含外源多肽的植物细胞,所述多肽具有由 SEQ ID NO :33、34、30、27-29、31、32、35-52、1401-1403、1405-1435、1437-1494、1496-1542、 1544-1553、1555-1559、1561-1827、1829-1866、1868-2450、2453-2458、2460-2463、 2465-2481、2483、2485-2746、2765-2769、3052-3065、3067-3258 或 3259 所示的氨基酸序 列。本发明一些实施方案的一个方面提供包含外源多核苷酸的植物细胞,所述外 源多核苷酸包含由 SEQ ID NO :7、8、4、1-3、5、6、9-26、53-55、57-87、89-147、149-195、 197-206、208-212、214-480、482-519、521-1103、1106-1111、1113-1116、1118-1134、1136、 1138-1400、2748-2764、2843-2857、2859-3050 或 3051 所示的核酸序列。
按照本发明的一些实施方案,所述多核苷酸选自SEQ ID NO :7、8、4、1_3、5、6、 9-26、53-55、57-87、89-147、149-195、197-206、208-212、214-480、482-519、521-1103、 1106-1111、1113-1116、1118-1134、1136、1138-1400、2748-2764、2843-2857 和 2859-3051。按照本发明的一些实施方案,所述氨基酸序列选自SEQ ID NO :33、34、30、27_29、 31、32、35-52、1401-1403、1405-1435、1437-1494、1496-1542、1544-1553、1555-1559、 1561-1827、1829-1866、1868-2450、2453-2458、2460-2463、2465-2481、2483、2485-2746、 2765-2769,3052-3065 和 3067-3259。按照本发明的一些实施方案,所述多肽选自SEQ ID NO :33、34、30、27_29、31、32、 35-52、1401-1403、1405-1435、1437-1494、1496-1542、1544-1553、1555-1559、1561-1827、 1829-1866,1868-2450,2453-2458,2460-2463,2465-2481,2483,2485-2746,2765-2769, 3052-3065 和 3067-3259。按照本发明的一些实施方案,非生物胁迫选自盐分、脱水、低温、高温、重金属毒 性、无氧生活、养分缺乏、养分过量、大气污染和紫外幅射。按照本发明的一些实施方案,所述方法还包括使表达外源多核苷酸的植物在非生 物胁迫下生长。 按照本发明的一些实施方案,所述启动子是组成型启动子。按照本发明的一些实施方案,植物细胞形成植物的一部分。除非另有定义,否则本文使用的所有技术和/或科学术语具有本发明所属领域普 通技术人员通常所理解的含义。尽管类似或等同于本文所述方法与材料的方法与材料可用 于本发明实施方案的实践或试验中,但是下面描述了示例性的方法和/或材料。万一发生 抵触,则以本专利说明书(包括定义)为准。另外,材料、方法和实施例只是说明性的,并不 一定是限制性的。附图简述本发明仅通过实施例并参照附图进行描述。要强调的是,有关具体附图详情,所表 示的具体细节是通过实施例的方式进行的,而且仅仅是为了举例论述本发明优选的实施方 案的目的。在这一点上,附图中的说明使本领域技术人员明白本发明的实施方案是如何体 现在实践中的。在附图中

图1是用于表达本发明的分离多核苷酸序列的pGI 二元质粒示意图。RB-T-DNA 右边界;LB-T-DNA左边界;H-HindI11限制性内切酶;X-XbaI限制性内切酶;B-BamHI限 制性内切酶;S-SalI限制性内切酶;Sm-SmaI限制性内切酶;R-I-EcoRI限制性内切酶; Sc-SacI/SstI/Ecll36II ;(数字)_碱基对长度;NOS pro =胭脂碱合酶启动子;NPT-II =新霉素磷酸转移酶基因;NOS ter =胭脂碱合酶终止子;聚A信号(聚腺苷酸化信号); ⑶Sintron-GUS报道基因(编码序列和内含子)。将本发明一些实施方案的分离多核苷酸 序列克隆至载体中,同时置换⑶S内含子报道基因。图2A-B是在透明琼脂平板中生长的植物根发育的照片。使不同的转基因在透明 琼脂平板中生长10-15天,自第1天开始,每2-5天对平板进行拍照。图2A-在琼脂平板上 12天后拍摄的示例性植物照片。图2B-对根进行分析的示例性照片,其中所测量的根长用 红色箭头表示。
图3A-F直方图表示在200mM氯化钠(NaCl)浇灌方案(分别为图3A-C)下 或在两种不同的水胁迫方案(分别WLI-I和WLI-2 ;图3D-F)下,在市售温室中生长的 T0M-ABST36(黑色条形柱)与对照(白色条形柱)植物的经济果实总产量、植物生物量和 收获指数。与在标准浇灌条件(OmM NaCl和WLI-0)下生长的植物的产量表现进行了比较。 结果是4件独立事件的平均值。*在P <0.05下显著不同。图3G-J是生长在不同条件下的转基因番茄植物或对照植物的照片。图3G-生长在 定时浇灌条件下的T0M-ABST36植物;图3H-生长在定时浇灌条件下的对照植物;图31-在 整个生长季节期间在200mM NaCl浇灌方案下生长后的T0M-ABST36植物;图3J-在整个生 长季节期间在200mM NaCl浇灌方案下生长后的对照植物。本发明具体实施方案详述在本发明的一些实施方案中,涉及新的水通道蛋白多核苷酸和多肽,更准确但并 非唯一地讲是涉及使用同样的多核苷酸和多肽以提高植物的非生物胁迫耐受性、水分利用 效率、肥料利用效率、生物量、生长势和/或产量的方法。在详细解释至少一个本发明的实施方案前,要了解的是,本发明不一定局限于在 下面说明书中给出或在实施例中列举的细节。本发明能够有其它实施方案或者能够以各种 方式实施或进行。在将本发明付诸实施时,本发明的发明人鉴定出新的水通道蛋白(AQP)多核苷酸 和由其编码的多肽。因此,如随后的实施例部分所示,本发明的发明人利用将数字表达分析法 (digital expression analysis)与跨种比较基因组学相结合的生物信息学方法,并从单 子叶和双子叶植物品种两者的1,195个相关EST文库中筛选出7. 2xl06个表达序列标签 (EST)。采用该方法,鉴定出1,114种不同的AQP基因,并且将其进一步分成11个亚组(表 1)。进一步的分析显示,TIP2亚组的EST显著过多呈现在植物根部和暴露在非生物胁迫 (ABS)的植物中,而且由TIP2亚组的多核苷酸(例如SEQID NO :1、2、19_22,表2)编码的多 肽(例如 SEQ ID NO :27-28、45-48,表 2)有着共同的共有序列 TLXFXFAGVGS(SEQ ID NO: 2826)。以在根部的过量呈现、ABS条件和水分水平低的组织(例如种子和花粉)为基础, 鉴定出水通道蛋白基因家族另外的多核苷酸(SEQ ID N0:3-18、23-26,表2)以及其同源物 或直系同源物(orthologue)(多核苷酸的 SEQID NO :53-1400、2844_3051,多肽的 SEQ ID NO 1401-2746,3052-3259 ;表3)。而且,定量RT-PCR分析表明在盐胁迫下,代表性AQP基因 (例如SEQ ID N0:5、6和7)的表达增加,与对盐胁迫敏感的植物(表5,随后实施例部分的 实施例2)相比,这在具有耐盐性的植物中较高。正如在随后实施例部分的实施例3-4中进 一步描述的一样,对代表性AQP多核苷酸进行克隆(表7、8和9),产生过量表达所述克隆的 转基因植物(实施例4)。研究表明这些植物对各种非生物胁迫例如渗透胁迫(表10-14 ; 实施例5)和盐分胁迫(表30-45 ;实施例6)的耐受性提高,肥料利用效率(在氮限制条件 下,表59-68,实施例7)提高,以及在正常条件下[表15-29 (实施例5)、46-58 (实施例6)] 或非生物胁迫(实施例5-8)下的生长、生物量和产量提高。总之,这些结果表明本发明的 AQP多核苷酸和多肽可用于提高植物的非生物胁迫耐受性、水分利用效率、肥料利用效率、 生物量、生长势和/或产量。应当注意的是,在胁迫下影响(例如提高)植物代谢、生长、繁殖和/或生活力的多肽或多核苷酸,还可在最优条件下影响植物生长、生物量、产量和/或生长势。因此,按照本发明的一个方面,提供提高植物的非生物胁迫耐受性、水分利用效 率、肥料利用效率、生长、生物量、产量和/或生长势的方法。所述方法通过在植物中表达编 码包含由SEQ ID NO 2826所示氨基酸共有序列TLXFXFAGVGS的多肽的外源多核苷酸来实 现,其中所述多肽的表达在正常或胁迫条件下提高植物的生物量/生长势和/或产量。研究表明,多肽的活性在结构上与上述共有序列(SEQ ID NO 2826)的完整性 有关。在本发明这一方面的一些实施方案中,所述活性是通常存在于液泡膜(vacimolar membrane (tonoplast))和/或植物细胞质膜中的水分通道活性,并且能够跨膜转运水分和 /或小的中性溶质,例如尿素、硝酸盐和二氧化碳(CO2)。本文使用的术语“非生物胁迫”是指对植物代谢、生长、繁殖和/或生活力的任何 不利作用。因此,非生物胁迫可由亚适度环境生长条件引起,例如盐分、脱水、淹水、冷冻、低 温或高温、重金属毒性、无氧生活、养分缺乏、大气污染或紫外幅射。在背景部分论述了非生 物胁迫的含义。本文使用的术语“非生物胁迫耐受性”是指植物忍受非生物胁迫而不会在代谢、生 长、生产率和/或生活力方面遭受实质改变的能力。本文所使用的术语“水分利用效率(WUE) ”是指植物消耗的每单位水分所产生的有 机物的水平,即植物干重与植物水分利用之比,例如每单位蒸腾所产生的生物量。本文所使用的术语“肥料利用效率”是指从土壤中吸收的一种或多种无机物和有 机部分的摄取、传送、吸收、蓄积、再定位(植物内)和利用,例如氮、磷酸盐和/或钾。本文所使用的术语“植物生物量”是指生长季节内由植物产生的组织量(测量单 位为风干组织的克数),这还可决定或影响植物产量或每生长面积的产量。本文所使用的术语“植物产量”是指每株植物或每个生长季节所产生的组织的量 (用重量/尺寸测定)或数量(数目)。因此产量的提高可以影响人们能够从某一生长面 积和/或生长期的植物中所获取的经济利益。本文所使用的术语“植物生长势”是指在指定时间由植物产生的组织的量(用重 量测量)。因此生长势的提高可以决定或影响植物产量或每生长期或每生长面积的产量。本文所使用的术语“提高/增长”是指与天然植物[即没有用本发明的生物分子 (多核苷酸或多肽)修饰的植物,例如生长在相同生长条件下同一品种的非转化植物)]相 比,植物非生物胁迫耐受性、水分利用效率、肥料利用效率、生长、生物量、产量和/或生长 势提高至少约2%、至少约3%、至少约4%、至少约5%、至少约10%、至少约15%、至少约 20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%。本文所使用的术语“外源多核苷酸”是指可以不是植物内天然表达的异源核酸序 列,或者其在植物中的过量表达是需要的异源核酸序列。可以稳定或瞬时方式将外源多核 苷酸序列导入植物中,以便产生核糖核酸(RNA)分子和/或多肽分子。应当注意的是,外源 多核苷酸可包含与植物内源核酸序列相同或部分同源的核酸序列。按照本发明的一些实施方案,本发明的外源多核苷酸编码具有与选自SEQ ID NO 27-28、45-48、1401-1403、1405-1435、1437-1494、1496-1542、1544-1553、1555-1559、1561、 2449-2450、2453-2458、2460-2463、2465-2481、2483、2484 和 2765 的氨基酸序列有至少约 60 %、至少约65 %、至少约70 %、至少约75 %、至少约80 %、至少约81%、至少约82 %、至少
10约83 %、至少约84 %、至少约85 %、至少约86 %、至少约87 %、至少约88 %、至少约89 %、至 少约90 %、至少约91%、至少约92 %、至少约93 %、至少约94 %、至少约95 %、至少约96 %、 至少约97%、至少约98%、至少约99%或更多比如100%同源性的氨基酸序列的多肽。同源性(例如百分比同源性)可以采用任何同源性比较软件确定,包括例如当自 多肽序列开始时,通过使用默认参数的例如国立生物技术信息中心(National Center of Biotechnology Information, NCBI)的BlastP或TBLASTN软件;或者例如通过使用默认参 数的tBLASTX算法(可通过NCBI获取),这可对核苷酸查询序列(两条链)的6读框概念 翻译产物(six—frame conceptual translation product)与蛋白质序列数据库进 亍比较。同源序列包括直系同源序列和旁系同源序列两者。术语“旁系同源(paralogous),, 是指某一品种基因组内产生旁系同源基因的基因复制。术语“直系同源(orthologous) ”是 指不同生物由于祖先关系所引起的同源基因。在单子叶植物品种中鉴定直系同源物的一种备选方法是进行交互比对检索 (blast)搜索。这可通过第一次比对检索进行,包括使目标序列针对任何序列数据库 进行比对检索,例如公众可获取的NCBI数据库,可参见超文本传输协议(Hypertext TransferProtocol) //www. ncbi. nlm. nih. gov。如果查到水稻的直系同源物,可将目标 序列针对例如可获自NCBI的日本晴水稻(Oryza sativaNipponbare)的28,469个全长 cDNA克隆进行比对检索。可对比对检索结果进行过滤。然后,使过滤结果或未过滤结果 两者的全长序列反过来与目标序列得自其中的生物的序列进行比对检索(第二次比对检 索)。然后比较第一次和第二次比对检索的结果。当在第一次比对检索中产生最高得分 (最佳命中)的序列在第二次比对检索中鉴定查询序列(原始目标序列)为最佳命中时, 便鉴定出直系同源物。利用相同原理找出旁系同源物(paralogue)(同一生物中基因的 同源物)。在大序列家族的情况下,可以运用ClustalW程序[超文本传输协议..Ih·. ebi. ac. uk/Tools/clustalw2/index. html],接着运用有助于目测观察聚簇(clustering) 的邻接系统树(neighbor-joining tree)(超文本传输协议//en. wikipedia. org/wiki/ Neighbor-joining)。按照本发明的一些实施方案,外源多核苷酸编码由如SEQ ID NO :27_28、45_48、 1401-1403、1405-1435、1437-1494、1496-1542、1544-1553、1555-1559、1561、2449-2450、 2453-2458、2460-2463、2465-2481、2483、2484或2765中所示的氨基酸序列组成的多肽。按照本发明的一些实施方案,外源多核苷酸包含与选自SEQ IDNO :1、2、19、20_22、 53-55、57-87、89-141、143-147、149-195、197-206、208-212、214、1102-1103、1106-1111、 1113-1116、1118-1134、1136、2751-2752 和 2748-2750 的核酸序列有至少约 60%、至少约 65 %、至少约70 %、至少约75 %、至少约80 %、至少约81%、至少约82 %、至少约83 %、至少 约84 %、至少约85 %、至少约86 %、至少约87 %、至少约88 %、至少约89 %、至少约90 %、至 少约91 %、至少约92 %、至少约93 %、至少约93 %、至少约94 %、至少约95 %、至少约96 %、 至少约97%、至少约98%、至少约99%、例如100%同一性的核酸序列。同一性(例如百分比同源性)可运用任何同源性比较软件确定,包括例如通过使 用默认参数的例如国立生物技术信息中心(NCBI)的比对BlastN软件。按照本发明的一些实施方案,外源多核苷酸如SEQ ID NO :1、2、19、20_22、 53-55、57-87、89-141、143-147、149-195、197-206、208-212、214、1102-1103、1106-1111、
111113-1116、1118-1134、1136、2751-2752、2748-2749 或 2750 所示。尽管如此,另外的AQP多核苷酸和由其编码的多肽也包括在本发明的教导中。按照本发明的一些实施方案,外源多核苷酸编码具有与SEQ IDN0:33、34、 30、27-29、31、32、35-52、1401-1403、1405-1435、1437-1494、1496-1542、1544-1553、 1555-1559、1561-1827、1829-1866、1868-2450、2453-2458、2460-2463、2465-2481、2483、 2485-2746、2765-2769、3052-3065、3067-3258 或 3259 有至少约 60%、至少约 65%、至少约 70 %、至少约75 %、至少约80 %、至少约85 %、至少约86%、至少约87 %、至少约88 %、至少 约89 %、至少约90 %、至少约91%、至少约92 %、至少约93 %、至少约94 %、至少约95 %、至 少约96%、至少约97%、至少约98%、至少约99%例如100%同源性的氨基酸序列的多肽。按照本发明的一些实施方案,外源多核苷酸编码由如SEQ ID NO :33、34、 30、27-29、31、32、35-52、1401-1403、1405-1435、1437-1494、1496-1542、1544-1553、 1555-1559、1561-1827、1829-1866、1868-2450、2453-2458、2460-2463、2465-2481、2483、 2485-2746、2765-2769、3052-3065、3067-3258 或 3259 所示的氨基酸序列组成的多肽。在示例性实施方案中,外源多核苷酸不编码具有选自SEQ ID NO 1828、1867、 1404、1436、1495、1543、1554、1560、2451、2452、2459、2464、2482、2484 和 3066 的氨基酸序 列的多肽。按照本发明的一些实施方案,外源多核苷酸与SEQ ID NO :7、8、4、1_3、5、6、 9-26、53-55、57-87、89-147、149-195、197-206、208-212、214-480、482-519、521-1103、 1106-1111、1113-1116、1118-1134、1136、1138-1400、2748-2764、2843-2857、2859-3050 或 3051有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至 少约86 %、至少约87 %、至少约88 %、至少约89 %、至少约90 %、至少约91%、至少约92 %、 至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约 99%例如100%同一性。按照本发明的一些实施方案,多核苷酸如SEQ ID N0:7、8、4、l-3、5、6、9-26、 53-55、57-87、89-147、149-195、197-206、208-212、214-480、482-519、521-1103、 1106-1111、1113-1116、1118-1134、1136、1138-1400、2748-2764、2843-2857、2859-3050 或 3051所示。在一个示例性实施方案,外源多核苷酸不是如SEQ ID NO :481、520、56、88、148、 196、207、213、1104、1105、1112、1117、1135、1137 或 2858 所示的多核苷酸。本文所使用的术语“多核苷酸”是指分离的单链或双链核酸序列,并且以RNA序 列、互补多核苷酸序列(cDNA)、基因组多核苷酸序列和/或复合多核苷酸序列(composite polynucleotide sequence)(例如上述的组合)的形式提供。本文所使用的术语“互补多核苷酸序列”是指利用反转录酶或任何其它RNA依赖 性DNA聚合酶使信使RNA反转录的序列。这类序列随后可以利用DNA依赖性DNA聚合酶在 体内或体外扩增。本文所使用的术语“基因组多核苷酸序列”是指从染色体得到(分离)的序列,因 此它代表着染色体的连续部分。本文所使用的术语“复合多核苷酸序列”是指至少部分是互补且至少部分是基因 组的序列。复合序列可包括一些需要编码本发明多肽的外显子序列以及一些介于外显子序列之间的内含子序列。内含子序列可以是任何来源,包括其它基因的内含子序列,通常可包 括保守剪接信号序列。这类内含子序列另可包括顺式作用表达调节元件。按照本发明的一些实施方案,本发明的多核苷酸包含长度不超过5000个的核酸。 按照本发明的一些实施方案,本发明的多核苷酸包含长度不超过4000个的核酸,例如不超 过3000个核酸,例如不超过2500个核酸。可使编码本发明多肽的核酸序列最优化以进行表达。SEQ ID NO :2751中提供了 最优化的核酸序列的非限制性实例,该序列编码包含SEQ ID NO :27所示氨基酸序列的最优 化多肽。这类序列修饰的实例包括但不限于改变G/C含量以更紧密地接近通常存在于目标 植物品种的含量,并且剔除非典型存在于植物品种的密码子,通常亦称密码子优化。术语“密码子优化”是指选择合适的DNA核苷酸用于接近目标植物内密码子用法 的结构基因或其片段内。因此,最适基因或核酸序列是指这样的基因,其中天然基因或天然 存在的基因的核苷酸序列已经修饰以便利用植物内在统计上优选或统计上有利的密码子。 通常在DNA水平上研究核苷酸序列,可以采用任何合适的方法确定优化用于在植物品种中 表达的编码区,例如参见Sardana等(1996,Plant CellReports 15:677-681)。在该方法 中,密码子用法的标准差、密码子用法偏倚的量度,可以通过首先得出天然基因的各个密码 子使用率的平方比例偏差(squared proportional deviation)与高表达的植物基因相比 较,接着计算均方差来计算。所用方程式为=ISDOT = η = IN[(Xn-Yn)/Υη]2/Ν,其中Xn是 指在高表达的植物基因中密码子η的使用频率,其中Yn是指目标基因中密码子η的使用频 率,N是指目标基因中密码子的总数。利用Murray等(1989, Nuc Acids Res. 17 :477_498) 的数据编制双子叶植物的高表达基因的密码子用法表。按照特定植物细胞类型的优选的密码子用法使核酸序列最优化的一种方法是基 于直接利用密码子优化表,而无需进行任何额外的统计学计算,密码子优化表例如通过日 本NIAS(国立农业生物科学研究院(National Institute of Agrobiological Sciences)) DNA库(超文本传输协议·.//■. kazusa. or. jp/codon/)的密码子用法数据库在线提供的 密码子优化表。密码子用法数据库含有多种不同品种的密码子用法表,其中每个密码子用 法表根据Genbank中提供的数据以统计方法确定。通过使用上述密码子用法表确定特定品种(例如水稻)中每个氨基酸最优选或最 有利的密码子,可对编码目标蛋白质的天然存在的核苷酸序列进行密码子优化以用于该特 定植物品种。对于氨基酸,通过用在统计学上较有利的相应密码子置换特定品种基因组中 可能具有低统计发生率的密码子来实现这一点。然而,可以选出一个或多个较不利的密码 子以剔除存在的限制位点,并在可能有用的连接点(5'端和3'端添加信号肽或终止盒, 可用来同时切割和剪接区段产生正确的全长序列的内部位点)上产生新的限制位点,或者 去掉可能负面影响mRNA稳定性或表达的核苷酸序列。事先进行任何修饰的天然存在的编码核苷酸序列可能已含有相当于特定植物品 种中在统计上有利的密码子的多个密码子。因此,天然核苷酸序列的密码子优化可包括确 定天然核苷酸序列内的哪一个密码子对于特定植物不是统计上有利的,并且按照特定植物 的密码子用法表对这些密码子进行修饰,产生密码子最优化的衍生物。假若由修饰核苷酸 序列编码的蛋白质以高于由相应的天然存在的基因或天然基因编码的蛋白质的水平产生, 则用于植物密码子用法的修饰核苷酸序列可以是完全优化或部分优化的。通过改变密码子用法进行合成基因的构建可参见例如PCT专利申请93/07278。因此,本发明包括在上文中描述的核酸序列、其片段、与之杂交的序列、与之同源 的序列、编码具有不同密码子用法的相似多肽的序列、特征在于突变的经改变的序列,所述 突变例如一个或多个天然存在的核苷酸或者人造核苷酸随机或定向方式产生的缺失、插入 或取代。如上所述,本发明的发明人揭示了之前未表征的多肽,该多肽都共有如SEQ ID NO 2826所示的氨基酸共有序列。因此,本发明提供具有与选自 SEQ ID NO :27-28、45_48、1401-1403、1405-1435、 1437-1494、1496-1542、1544-1553、1555-1559、1561、2449-2450、2453-2458、2460_2463、 2465-2481、2483、2484和2765的氨基酸序列有至少约60%、至少约65%、至少约70%、至 少约75 %、至少约80 %、至少约81%、至少约82 %、至少约83 %、至少约84 %、至少约85 %、 至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约 92 %、至少约93 %、至少约93 %、至少约94%、至少约95 %、至少约96 %、至少约97 %、至少 约98%、至少约99%或更多比如100%同源性的氨基酸序列的分离多肽。按照本发明的一些实施方案,本发明提供具有与选自SEQ ID NO :33、34、 30、27-29、31、32、35-52、1401-1403、1405-1435、1437-1494、1496-1542、1544-1553、 1555-1559、1561-1827、1829-1866、1868-2450、2453-2458、2460-2463、2465-2481、2483、 2485-2746、2765-2769、3052-3065 和 3067-3259 的氨基酸序列有至少约 60 %、至少约 65 %、 至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约 84%、至少约85 %、至少约86 %、至少约87 %、至少约88 %、至少约89 %、至少约90 %、至少 约91 %、至少约92 %、至少约93 %、至少约93 %、至少约94 %、至少约95 %、至少约96 %、至 少约97%、至少约98%、至少约99%或更多比如100%同源性的氨基酸序列的分离多肽。按照本发明的一些实施方案,所述多肽如SEQ ID NO :33、34、30、27_29、31、32、 35-52、1401-1403、1405-1435、1437-1494、1496-1542、1544-1553、1555-1559、1561-1827、 1829-1866、1868-2450、2453-2458、2460-2463、2465-2481、2483、2485-2746、2765-2769、 3052-3065,3067-3258 或 3259 中所示。在一个示例性实施方案中,所述多肽不是由SEQ ID NO 1828、1867、1404、1436、 1495、1543、1554、1560、2451、2452、2459、2464、2482、2484 或 3066 所示的多月太。本发明还包括上述多肽的片段和具有突变的多肽,所述突变例如一个或多个天然 存在的氨基酸或人造氨基酸随机或以定向方式产生的缺失、插入或取代。本文使用的术语“植物”包括整株植物;植物的祖先和子代及植物组成部分,包括 种子、苗、茎、根(包括块茎);以及植物细胞、组织和器官。植物可以是任何形式,包括悬 浮培养物、胚、分生组织区、愈伤组织、叶、配子体、孢子体、花粉和小孢子。特别用于本发明 方法的植物包括属于绿色植物(Viridiplantae)总科的全部植物,特别是选自以下的单子 叶植物和双子叶植物,包括豆科饲料或豆科牧草、观赏植物、粮食作物、乔木或灌木金合欢 (Acacia spp.)、槭木(Acer spp.)、称猴桃(Actinidia spp.)、七叶树(Aesculus spp.)、 澳大禾Ij 亚贝壳杉(Agathisaustralis)、Albizia amara、Alsophila tricolor、须芒草 (Andropogon spp.)、花生(Arachis spp)、模榔(Areca catechu)、Astelia fragrans、鹰嘴 紫云英(Astragalus cicer)、多小叶红苏木(Baikiaea pluri juga)、桦木(Betula spp·)、^^r (Brassica spp. )、7^_ (Bruguiera gymnorrhiza)(Burkeaafricana)
Li^l" (Butea frondosa) ΛCadaba f&rinos&、^·^^ (Calliandraspp) Λ^ ^^ (Camellia sinensis)、美人蕉(Canna indica)、辣椒(Capsicumspp.)、决明(Cassia spp.) ΛCentroema pubescens、Chacoomeles spp·、肉桂(Cinnamomum cassia)、小粒咖啡(Coffea arabica)、 Colophospermummopane、Coronillia varia、Cotoneaster serotina、 ill ^ (Crataegus spp.)、黄瓜(Cucumis spp.)、桕木(Cupressus spp.)、银蔽(Cyathea dealbata)、媪 梓(Cydonia oblonga)、臼本柳杉(Cryptomeria japonica)、香茅(Cymbopogon spp.)、 Cynthea (Ie^lbBtB)Mi李(Cydonia oblonga) ΛDalbergiamonetarDavalIia div&hc&t&、 ill 虫马蟥(Desmodium spp.)、粗糖虫丰壳蔽(Dicksonia squarosa)、Dibeteropogon amplectens、Dioclea spp、德扁显(Dolichos spp.)、Dorycnium rectum、Echinochloa pyramidalis、Ehraffiaspp.、禾參〒(Eleusine coracana)、!H| 眉胃(Eragrestis spp.)、 束Ij 桐(Erythrinaspp.)、㈱丰对(Eucalypfus spp.)、Euclea schimperi、Eulalia vi/ losa、养麦(Pagopyrum spp·)、南美稳(Feijoa sellowlana)、草毒(Fragaria spp·)、 千斤拔(Flemingia spp)、Freycinetia banksli、Geranium thunbergii、银杏(GinAgo biloba)、爪口圭大豆(Glycine javanica)、毒鼠豆(Gliricidia spp)、陆地棉(Gossypium hirsutum)、银禅(Grevillea spp.)、Guibourtiacoleosperma、岩黄耆(Hedysarum spp·)、 Hemaffhia altissima、Heteropogon contoffus、大麦(Hordeum vulgare)、Hyparrhenia rufa、小连翅(Hypericum erectum)、Hypeffhelia dissolute、Indigo incamata、鸾 尾(Iris spp.) λ Leptarrhena pyrolifolia、古月枝子(Lespediza spp.)(Lettuca
spp.)、IS ^nfc (Leucaena leucocephala) Λ Loudetia simplex、Lotonus bainesli、H 脉根(Lotus spp.)、Macrotyloma axillare、海棠(Malusspp.)、花叶木薯(Manihot esculenta)、紫花苜猜(Medicago saliva)、水杉(Metasequoia glyptostroboides)、 色蕉(Musa sap i en turn)、烟草(Nicotianum spp.)、驴豆(Onobrychis spp.)、鸡足豆 (Ornithopus spp.)、水禾§ (Oryza spp.)、Peltophorum africanum、各良尾草(Pennisetum spp.)、鱼萼梨(Persea gratissima)、矮牵牛(Petunia spp.)、菜豆(Phaseolus spp.)、 力口 拿禾Ij 海麥(Phoenix canariensis)、Phormium cookianum、石捕(Photiniaspp.)、 Picea glauca、松树(Pinus spp·)、豌豆(Pisum sativam)、新西兰罗汉松(Podocarpus totara)、Pogonarthria fleckii、Pogonaffhria squarrosa、 ^ M (Populus spp.)、 Prosopis cineraria、花方萁松(Pseudotsuga menziesii)、Pterolobium stellatum、矮生西 洋梨(Pyrus communis)、栎树(Quercusspp·)、厚叶石斑木(Rhaphiolepsis umbel lata) Λ Rhopalostylis sapida、Rhusnatalensis、欧洲醋栗(Ribes grossularia)、醋栗(Ribes spp.)、剌槐(Robiniapseudoacacia)、蔷薇(Rosa spp.)、悬钩子(Rubus spp.)、柳树 (Salix spp.)λ Schyzachyrium sanguineum、 Sciadopitys vefficillata、北美红杉 (Sequoiasempervirens)、巨杉(Sequoiadendron giganteum)、高梁(Sorghumbicolor)、 菠菜(Spinacia spp.)、Sporobolus fimbriatus、StiburusalopecuroidesΛ 矮柱花草 (Stylosanthos humilis)、葫戸荼(Tadehagi spp)、落习习杉(Taxodium distichum)、黄背草 (Themeda triandra)、三叶草(Trifolium spp·)、小麦(Triticum spp·)、异叶铁杉(Tsuga heterophylla)、越桔(Vaccinium spp·)、香豆(Vicia spp·)、葡萄(Vitis vinifera)、 W&tsoni&pyr&mid&t&、^/£$_ (Zantedeschia 已ethiopic已)、H (Zea mays)、 、# |、芦笋、青花椰菜、孢子甘蓝、甘蓝、油菜、胡萝卜、花椰菜、芹菜、羽衣甘蓝、亚麻、散叶甘蓝、兵 豆、油菜、秋葵、洋葱、马铃薯、水稻、大豆、稻草、糖甜菜、甘蔗、向日葵、番茄、squash tea、玉 米、小麦、大麦(barely)、黑麦、燕麦、花生、豌豆、兵豆和苜蓿、棉花、油菜籽、油菜、辣椒、向 日葵、烟草、茄子、桉树、乔木、观赏植物、多年生牧草和饲料作物。或者水藻和其它非植物也 可用于本发明的方法。按照本发明的一些实施方案,本发明的方法所使用的植物是农作物,例如水稻、玉 米、小麦、大麦、花生、马铃薯、芝麻、橄榄树、棕榈油、香蕉、大豆、向日葵、油菜(canola)、甘 蔗、苜蓿、小米、豆科植物(菜豆、豌豆)、亚麻、羽扇豆、油菜籽、烟草、杨树和棉花。植物中表达本发明的外源多核苷酸可如下进行用外源多核苷酸转化植物的一个 或多个细胞,接着从转化细胞产生成熟植物,并在适于成熟植物表达外源多核苷酸的条件 下培养成熟植物。按照本发明的一些实施方案,转化通过将包括本发明一些实施方案的外源多核苷 酸和至少一个能够指导外源多核苷酸在植物细胞中转录的启动子的核酸构建体导入植物 细胞来实现。合适的转化方法的更多详情见下文。本文使用的术语“启动子”是指位于基因的转录起始位点上游的DNA区,RNA聚合 酶与之结合启动RNA转录。启动子控制基因在何处(例如植物的哪一个部分)和/或何时 (例如在生物生命中的哪一个阶段或情况下)进行表达。本发明的核酸构建体可以使用任何合适的启动子序列。优选启动子是组成型启动 子、组织特异性启动子或非生物胁迫诱导型启动子。合适的组成型启动子包括例如CaMV 35S启动子(SEQ ID NO :2825 ;0dell等, Nature 313:810-812,1985);拟南芥 At6669 启动子(SEQID NO :2823 ;参见 PCT 公布号 W004081173A2);玉米 Ubi 1 (Christensen 等,Plant Sol. Biol. 18 :675_689,1992);水 稻肌动蛋白(McElroy 等,Plant Cell 2 :163_171,1990) ;pEMU(Last 等,Theor. Appl. Genet.81 :581-588,1991) ;CaMV 19S (Nilsson 等,Physiol. PlantlOO :456_462,1997); G0S2 (de Pater 等,Plant J Nov ; 2 (6) :837_44,1992);泛蛋白(Christensen 等,Plant Mol. Biol. 18 675-689,1992);水稻亲环蛋白(Bucholz 等,Plant Mol Biol. 25(5) 837-43,1994);玉米 H3 组蛋白(L印etit 等,Mol. Gen. Genet. 231 :276_285,1992);肌动蛋 白 2(An 等,Plant J. 10(1) ;107-121,1996)和合成的 Super MAS(Ni 等,The PlantJournal 7 :661-76,1995)。其它组成型启动子包括美国专利第5,659,026,5, 608,149,5. 608,144、 5,604,121,5. 569,597,5. 466,785,5, 399,680,5, 268,463 和 5,608,142 号中的启动子。合适的组织特异性启动子包括但不限于叶特异性启动子[例如参见例如 Yamamoto 等,Plant J. 12 :255_265,1997 ;Kwon 等,Plant Physiol. 105 :357_67,1994 ; Yamamoto 等,Plant Cell Physiol. 35 :773_778,1994 ;Gotor 等,Plant J. 3 :509_18,1993 ; Orozco 等,Plant Mol. Biol. 23 :1129_1138,1993 ;以及 Matsuoka 等,Proc. Natl. Acad. Sci.USA90 =9586-9590,1993];种子优选的启动子[例如得自种子特异性基因(Simon等, Plant Mol. Biol. 5. 191,1985 ;Scofield 等,J. Biol. Chem. 262 -.12202,1987 ;Baszczynski 等,Plant Mol. Biol. 14 :633,1990);巴西坚果白蛋白(Pearson,等,Plant Mol. Biol. 18 235-245,1992);豆球蛋白(Ellis 等,Plant Mol. Biol. 10 :203_214,1988);谷蛋白(水 稻)(Takaiwa 等,Mol. Gen. Genet. 208 15-22,1986 ;Takaiwa 等,FEBS Letts. 221 :43_47,
161987);玉米醇溶蛋白(Matzke 等,Plant Mol Biol, 143). 323-321990) ;napA (Stalberg 等,Planta 199:515-519,1996);小麦 SPA(Albanietal,Plant Cell,9 171-184,1997); 向日葵油质蛋白(Cummins等,Plant Mol. Biol. 19 =873-876,1992)];胚乳特异性启动子 [例如小麦 LMW 和 HMW、麦谷蛋白-1 (Mol Gen Genet 216 81-90,1989 ;NAR 17:461-2); 小麦a、b和g麦醇溶蛋白(EMB03 =1409-15,1984);大麦Itrl启动子、大麦Bi、C、D大 麦醇溶蛋白(Theor Appl Gen 98 1253-62,1999 ;Plant J 4 343-55,1993 ;Mol Gen Genet 250 :750_60,1996);大麦 DOF(Mena 等,The PlantJournal, 116(1) :53_62,1998); Biz2(EP99106056. 7);合成启动子(Vicente-Carbajosa 等,Plant J. 13 :629_640,1998); 水稻谷醇溶蛋白 NRP33、水稻球蛋白 Glb-I (Wu 等,Plant Cell Physiology 39(8)885-889, 1998);水稻 α -球蛋白 REB/OHP-1 (Nakase 等,Plant Mol. Biol. 33 :513_S22,1997);水 稻 ADP-葡萄糖 PP (Trans Res 6 157-68,1997);玉米 ESR 基因家族(Plant J12 :235_46,
1997);高粱(sorgum)Y-高粱醇溶蛋白(PMB 32 1029-35,1996)];胚特异性启动子[例 如水稻 OSHl (Sato 等,Proc. Nati. Acad. Sci. USA, 93 :8117-8122) ;KNOX (Postma-Haarsma 等,Plant Mol. Biol. 39 :257_71,1999),水稻油质蛋白(Wu 等,J. Biochem.,123 :386,
1998)];以及花特异性启动子[例如AtPRP4、查耳酮(chalene)合酶(chsA)(Van der Meer 等,Plant Mol. Biol. 15,95-109,1990) ;LAT52(Twell 等,Mol. Gen Genet. 217 240-245 ; 1989)、apetala-3]。合适的非生物胁迫诱导型启动子包括但不限于盐诱导启动子,例如 RD29A(Yamaguchi-Shinozalei 等,Mol. Gen. Genet. 236 :331_340,1993);干旱诱导性启动 子例如玉米 rabl7 基因启动子(Pla 等,Plant Mol. Biol. 21 :259_266,1993)、玉米 rab28 基因启动子(Busk 等,Plant J. 11 1285-1295,1997)和玉米 Ivr2 基因启动子(Pelleschi 等,Plant Mol. Biol. 39 =373-380,1999);热诱导性启动子例如得自番茄的番茄热hsp80启 动子(美国专利第5,187,267号)。本发明一些实施方案的核酸构建体可另包括合适的选择标记和/或复制起点。 按照本发明的一些实施方案,所使用的核酸构建体是穿梭载体,该载体既可在大肠杆菌 (E. coli)(其中构建体包含合适的选择标记和复制起点)增殖,而且又可与在细胞中的增 殖相容。本发明的构建体可为例如质粒、杆粒(bacmid)、噬菌粒、黏粒、噬菌体、病毒或人工 染色体。可利用本发明一些实施方案的核酸构建体来稳定或瞬时转化植物细胞。在稳定转 化中,将外源多核苷酸整合到植物基因组中,因此它代表稳定的遗传性状。在瞬时转化中, 外源多核苷酸由转化的细胞进行表达,但是不整合到基因组中,因此它代表瞬时性状。有各种方法将外源基因导入单子叶植物和双子叶植物(Potrykus,I.,Annu. Rev. Plant. Physiol. , Plant. Mol. Biol. (1991)42 205-225 ;Shimamoto 等,Nature (1989) 338 274-276)。使外源DNA稳定整合入植物基因组DNA的主要方法包括两种主要方法(i) 土壤杆菌介导的基因转移Klee 等(1987) Annu. Rev. PlantPhysiol. 38 467-486 ;Klee 禾口 Rogers,载于 Cell Culture and Somatic CellGenetics of Plants, 第 6 卷,Molecular Biology of Plant Nuclear Genes,主编 Schell, J.禾口 Vasil, L. K., Academic Publishers, San Diego, Calif. (1989),第 2-25 页;Gatenby,载于 PlantBiotechnology,主编 Kung, S.禾口 Arntzen, C. J. , Butterworth Publishers, Boston, Mass.
(1989),第93-112 页。(ii)直接 DNA 摄取=Paszkowski 等,载于 Cell Culture and SomaticCell Genetics of Plants,第 6 卷;Molecular Biology of Plant NuclearGenes,主编 Schell, J.和 Vasil, L. K.,Academic Publishers, San Diego, Calif. (1989),第 52-68 页;包括 将 DNA 直接摄入原生质体的方法,Toriyama, K.等(1988) Bio/Technology 6:1072-1074。 通过对植物细胞进行短暂电击诱导DNA摄取Zhang等,Plant Cell Rep. (1988)7 379-384。Fromm等,Nature (1986) 319 :791-793。通过粒子轰击将DNA注入植物细胞或 组织,Klein 等,Bio/Technology (1988)6 :559_563 ;McCabe 等,Bio/Technology (1988)6 923-926 ;Sanford, Physiol. Plant, (1990)79 :206_209 ;通过使用微量移液系统:Neuhaus 等,Theor. Appl. Genet. (1987) 75 :30_36 ;Neuhaus 禾口 Spangenberg, Physiol. Plant.
(1990)79213-217 ;细胞培养物、胚或愈伤组织的玻璃纤维或碳化硅晶须转化,美国专利 第5,464,765号;或者通过使DNA与萌发的花粉直接孵育,Deffet等,载于Experimental Manipulation of Ovule Tissue, 主 编 Chapman, G. P., Mantel1, S. H.禾口 Daniels, W. Longman, London, (1985)第 197-209 页;以及 Ohta,Proc. Natl. Acad. Sci. USA (1986) 83 715-719。土壤杆菌系统包括使用含有整合到植物基因组DNA的规定DNA区段的质粒载体。 植物组织的接种方法随植物品种和土壤杆菌递送系统而变化。一种广泛使用的方法是叶 盘法,该法可用提供用于引发整株植物分化的良好来源的任何组织外植体进行。参见例如 Horsch 等,载于 Plant Molecular Biology Manual A5, Kluwer Academic Publishers, Dordrecht (1988),第1-9页。一种补充方法应用土壤杆菌递送系统与真空过滤结合。土壤 杆菌系统在转基因双子叶植物创建中尤为可行。存在将直接DNA转移至植物细胞的各种方法。在电穿孔中,将原生质体短暂暴露 于强电场。在显微注射中,用非常小的微量移液管以机械的方式将DNA直接注入细胞。在 微粒轰击中,使DNA吸附在硫酸镁晶体或钨粒子等微轰击粒子上,并且使微轰击粒子进行 物理加速进入细胞或植物组织中。接着进行稳定转化植物繁殖。植物繁殖最常见的方法是通过种子。然而,通过 种子繁殖的再生在作物中因缺乏一致性所引起的杂合性而存在缺陷,因为种子是根据由 孟德尔定律控制的遗传变异由植物产生的。每粒种子基本上在遗传上都不相同,各自将 以其自身的特定性状生长。因此,优选产生这样的转化植物,使得再生植物具有与亲本 转基因植物相同的性状和特征。因此,优选通过提供转化植物快速且一致繁殖的微繁殖 (micropropagation)微繁殖是从选定的亲本植物或栽培品种中切取一块组织生长出新一代植物的过 程。该过程允许具有表达融合蛋白的优选组织的植物进行大量繁殖。所产生的新一代植物 在遗传上与原始植物相同,并且具有原始植物的全部特征。微繁殖可供在短时间内大量生 产优质的植物材料,并在保存原始转基因植物或转化植物的特征方面提供快速倍增的精选 栽培品种。克隆植物的优势是植物倍增的速度和所产生植物的品质和一致性。微繁殖是在各阶段之间需要更换培养基或生长条件的多阶段过程。因此,微繁殖 过程包括4个基本阶段第一阶段,起始组织培养;第二阶段,组织培养物倍增;第三阶段,分化和植物形成;第四阶段,温室栽培和锻炼。在第一阶段,即起始组织培养,确立组织培养 物并确定不含污染物。在第二阶段,使起始组织培养物倍增直到产生足够数量的组织样品 以达到生产目标。在第三阶段,使在第二阶段生长的组织样品分化,并生长成为独立幼苗。 在第四阶段,将转化幼苗转移到温室中进行锻炼,在温室中逐步提高植物耐光性,使之可在 自然环境下生长。按照本发明的一些实施方案,转基因植物通过叶细胞、分生组织细胞或整株植物 的瞬时转化产生。可以通过上述直接DNA转移的任何方法或使用修饰的植物病毒通过病毒感染进 行瞬时转化。研究表明可用于植物宿主转化的病毒包括CaMV、烟草花叶病毒(TMV)、雀 麦花叶病毒(BMV)和菜豆普通花叶病毒(BV或BCMV)。使用植物病毒的植物转化参 见美国专利第4,855,237号(菜豆金色花叶病毒;BGV)、EP-A 67,553 (TMV)、日本 公布申请号 63-14693 (TMV)、EPA 194,809 (BV)、EPA 278,667 (BV);以 R Gluzman, Y.等,Communications in Molecular Biology :Viral Vectors, Cold SpringHarbor Laboratory, New York,第172-189页(1988)。在许多宿主(包括植物)中用于表达外源 DNA的假病毒颗粒参见WO 87/06261。按照本发明的一些实施方案,用于瞬时转化的病毒是无毒力的,因此不能引起严 重症状,例如生长率降低、花叶病、环斑病、卷叶病、变黄、起条纹、痘形成、瘤形成和锈斑。合 适的无毒病毒可以是天然存在的无毒病毒或人工减毒病毒。病毒减毒可通过用本领域众所 周知的方法进行,包括但不限于亚致死加热、化学处理或通过定向诱变技术,例如参见诸如 Kurihara 禾口 Watanabe(Molecular Plant Pathology4 :259_269,2003)、Gal—on 等(1992)、 Atreya 等(1992)和 Huet 等(1994)。合适的病毒毒株可从有效来源获得,例如美国典型培养物保藏中心(American Type culture Collection, ATCC)或通过从受感染植物中分离出来。可通过本领域众所 周知的技术从受感染植物组织中分离病毒,例如参见诸如Foster和Tatlor主编,“Plant Virology Protocols :FromVirus Isolation to Transgenic Resistance(植物病毒 学方案从病毒分离到转基因抗性)(Methods in Molecular Biology (Humana Pr))”, HumanaPress,19980简单地说,将据信含有高浓度的适当病毒的受感染植物的组织(优选 嫩叶和花瓣)在缓冲溶液(例如磷酸缓冲溶液)中研磨以产生可用于随后接种的病毒感染 液。用于在植物中导入和表达非病毒外源多核苷酸序列的植物RNA病毒的构建可 参见上述参考文献以及 Dawson,W. 0.等,Virology (1989) 172 :285_292 ;Takamatsu 等, EMBO J. (1987)6 :307_311 ;French 等,Science (1986) 231 1294-1297 ;Takamatsu 等,FEBS Letters (1990) 269 :73_76 ;以及美国专利第 5,316,931 号。当病毒是DNA病毒时,可对病毒本身进行适当修饰。或者,可先将病毒克隆至细菌 质粒中以易于构建所需要的具有外源DNA的病毒载体。然后可从质粒中切取病毒。如果该 病毒是DNA病毒,则可将细菌复制起点与此病毒DNA连接,然后通过细菌复制。该DNA的转 录和翻译将产生将用来包裹病毒DNA的外壳蛋白。如果该病毒是RNA病毒,则一般将病毒 作为cDNA克隆,并插入质粒。然后使用质粒进行全部的构建。然后通过质粒病毒序列的转
19录和病毒基因的翻译以产生包裹病毒RNA的外壳蛋白,来产生RNA病毒。在一个实施方案中,提供植物病毒多核苷酸,其中从病毒多核苷酸中剔除天然外 壳蛋白编码序列,通过重组植物病毒多核苷酸,插入能够在植物宿主中表达的非天然植物 病毒外壳蛋白编码序列和非天然启动子,优选非天然外壳蛋白编码序列的亚基因组启动 子,包装重组植物病毒多核苷酸,并确保宿主系统性感染。或者,可通过在外壳蛋白基因中 插入非天然多核苷酸序列使外壳蛋白基因失活,使得产生蛋白质。重组植物病毒多核苷酸 可含有一个或多个另外的非天然亚基因组启动子。每个非天然的亚基因组启动子能够在植 物宿主中转录或表达邻接基因或多核苷酸序列,并且不能彼此重组以及与天然亚基因组启 动子重组。如果包括不止一个多核苷酸序列,则可将非天然(外源)多核苷酸序列插入天 然植物病毒亚基因组启动子或天然和非天然植物病毒亚基因组启动子附近。在产生所需产 物的亚基因组启动子的控制下,非天然多核苷酸序列在宿主植物中转录或表达。在第二个实施方案中,提供与第一个实施方案一样的重组植物病毒多核苷酸,只 是将天然外壳蛋白编码序列置于非天然外壳蛋白亚基因组启动子之一的邻接位置而不是 非天然外壳蛋白编码序列的邻接位置。在第三个实施方案中,提供重组植物病毒多核苷酸,其中天然外壳蛋白基因邻接 其亚基因组启动子,一个或多个非天然亚基因组启动子被插入病毒多核苷酸。插入的非天 然亚基因组启动子能够在植物宿主中转录或表达邻接基因,并且不能彼此重组以及与天然 亚基因组启动子重组。可将非天然多核苷酸序列邻接插入非天然亚基因组植物病毒启动 子,使得该序列在产生所需产物的亚基因组启动子控制下在宿主植物中转录或表达。在第四个实施方案中,提供与第三个实施方案一样的重组植物病毒多核苷酸,只 是天然外壳蛋白编码序列被非天然外壳蛋白编码序列置换。病毒载体用由重组植物病毒多核苷酸编码的外壳蛋白包裹,以产生重组植物病 毒。使用重组植物病毒多核苷酸或重组植物病毒感染合适的宿主植物。重组植物病毒多核 苷酸能够在宿主中复制,在宿主中系统性扩散,并且在宿主中转录或表达外源基因(外源 多核苷酸)以产生所需要的蛋白质。用于将病毒接种到植物中的技术可参见Foster和Taylor主编,“Plant Virology Protocols :From Virus Isolation to Transgenic Resistance (植物病毒学方案从 病毒分离到转基因抗性)(Methods in MolecularBiology (Humana Pr),第 81 卷),,, Humana Press,1998 ;Maramorosh 禾口 Koprowski 主编,“Methods in Virology",第 7 卷, Academic Press, NewYork 1967-1984 ;Hill, S. A. "Methods in Plant Virology", Blackwell, Oxford,1984;Walkey, D.G. A. "Applied Plant Virology", Wiley, NewYork, 1985 ;以及 Kado 禾口 Agrawa,主编,"Principles and Techniques inPlant Virology", Van Nostrand-ReinhoId, New York。除上述方法外,还可将本发明的多核苷酸导入叶绿体基因组从而能够进行叶绿体 表达。用于将外源多核苷酸序列导入叶绿体基因组的技术是已知的。该技术包括下列步 骤。首先,用化学方式处理植物细胞,以便使每个细胞的叶绿体数目减少至大约一个。其次, 通过粒子轰击将外源多核苷酸导入细胞,其目的在于将至少一个外源多核苷酸分子导入叶 绿体中。选择外源多核苷酸,使之容易通过叶绿体固有的酶实现同源重组而整合到叶绿体基因组中。为此,除目标基因以外,外源多核苷酸还包括至少一个从叶绿体基因组得到的多 核苷酸序列段。另外,外源多核苷酸还包括选择标记,这用于顺序选择方法以确保在这类选 择后叶绿体基因组的全部拷贝或基本上全部拷贝都将包括该外源多核苷酸。有关该技术的 更多详情可参见美国专利第4,945,050和5,693,507号,所述专利通过引用结合到本文中。 因此,多肽可通过叶绿体的蛋白质表达系统产生,并可整合到叶绿体内膜上。由于在植物中非生物胁迫耐受性、水分利用效率、肥料利用效率、生长、生物量、产 量和/或生长势可涉及多个起累加作用或起增效作用的基因(参见例如Quesda等,Plant Physiol. 130 :951_063,2002),因此本发明还设想在单一宿主植物中表达大量外源多核苷 酸从而在非生物胁迫耐受性、水分利用效率、肥料利用效率、生长、生物量、产量和/或生长 势方面获得较好作用。在单一宿主植物中表达大量外源多核苷酸可通过将多个核酸构建体共导入单个 植物细胞来实现,每个构建体包括不同的外源多核苷酸。然后可采用在上文中描述的方法, 使转化细胞再生成为成熟植物。或者,可通过将包括大量不同外源多核苷酸的单个核酸构建体共导入单个植物细 胞来实现在单一宿主植物中表达大量的外源多核苷酸。这类构建体可设计成具有单一启动 子序列,所述启动子序列可转录包括所有不同外源多核苷酸序列在内的多顺反子信使RNA。 为了使由多顺反子信使RNA编码的不同多肽能够共翻译,可将多核苷酸序列通过促进位于 IRES序列下游的多核苷酸序列翻译的内部核糖体进入位点(IRES)序列相互连接。在这种 情况下,经转录的编码上述不同多肽的多顺反子RNA分子将从两个封端的5'末端和多顺 反子RNA分子的两个内部IRES序列起开始翻译,因此在细胞中产生所有不同的多肽。或者, 构建体可包括各与不同外源多核苷酸序列连接的若干启动子序列。可采用在上文中描述的方法,使包括大量不同外源多核苷酸的构建体转化的植物 细胞再生成为成熟植物。或者,可以通过将不同核酸构建体(包括不同的外源多核苷酸)导入大量植物来 实现在单一宿主植物中表达大量的外源多核苷酸。然后,可以采用常规植物育种技术,使再 生的转化植物进行杂交,从所得到的子代中选出较好的非生物胁迫耐受性、水分利用效率、 肥料利用效率、生长、生物量、产量和/或生长势性状。因此,本发明包括外源性表达(如上所述)本发明的多核苷酸和/或多肽的植物。 多肽在植物细胞或整株植物中一经表达,便可通过本领域众所周知的方法测定由外源多核 苷酸编码的多肽水平,例如活性测定法,使用能够特异性结合多肽的抗体进行的蛋白质印 迹法、酶联免疫吸附测定法(ELISA)、放射免疫测定法(RIA)、免疫组织化学法、免疫细胞化 学法、免疫荧光法等。植物中自外源多核苷酸转录的RNA水平的测定方法是本领域众所周知的,包括例 如RNA印迹分析、反转录聚合酶链式反应(RT-PCR)分析(包括定量、半定量或实时RT-PCR) 和RNA原位杂交。如上所述,本发明一些实施方案的多肽起水分通道的作用。因此,本发明的一些实 施方案包括该多肽的功能等同物(例如能够具有水分通道的生物活性的多肽),这可通过 使用例如细胞膨胀实验(cell-swelling assay)的功能测定法(例如能够在植物中运送水 分)来测定(Meng, Q. X.等,2008. Cell Physiol Biochem,21.第 123-128 页)。
21
在上文中描述的多核苷酸和多肽可以安全和成本效益的方式用于多种经济植物 中。转基因(编码所述多肽的外源多核苷酸)对非生物胁迫耐受性、水分利用效率、肥 料利用效率、生长、生物量、产量和/或生长势的作用可使用已知方法测定。非生物胁迫耐受性一使转化(即表达转基因)和非转化(野生型)的植物暴露 于非生物胁迫条件下,例如脱水、亚适温(低温、高温)、养分缺乏、养分过量、盐胁迫条件、 渗透胁迫、重金属毒性、无氧生活、大气污染和紫外幅射。耐盐性测定一预期具有高盐浓度耐受性的转基因植物在高盐情况下显示更好的 萌发、幼苗活力或生长。可以多种方式实现盐胁迫,例如通过用高渗溶液浇灌植物,通过在 高渗生长溶液(例如Hoagland溶液)中对植物进行溶液培养,或通过在高渗生长培养基 [例如50%Murashige-SkOOg培养基(MS培养基)]中培育植物。因为不同的植物在其耐盐 性方面极为不同,可根据具体植物栽培品种或变种的具体特征,调节浇灌水、生长溶液或生 长培养基中的盐浓度,以便使植物的生理和/或形态受到轻微或中等的作用(有关合适浓 度的指引参见 Bernstein 和 Kafkafi,Root Growth Under Salinity Stress(盐分胁迫下 的根部生长),载于Plant Roots, The Hidden Half 第 3 版,Waisel Y,EshelA 和 Kafkafi U.(主编)Marcel Dekker Inc.,New York, 2002 及其中的参考文献)。例如,通过在不同的发育阶段,用浓度递增的氯化钠(例如50mM、100mM、200mM、 400mM NaCl)浇灌植物,从底部及从上部浇灌以确保盐的均勻分布,来进行耐盐性试验。在 暴露在胁迫条件下之后,不时监测植物直到在野生型植物中出现可观的生理作用和/或形 态作用。因此,在对照植物和转基因植物之间,对外部表型外观、萎蔫程度及成功达到成熟 期的总数和子代产量进行比较。所测量的耐受性的定量参数包括但不限于平均湿重和干 重、所产生种子的重量、平均种子大小和每株植物所产生的种子数量。未显示实质生理作用 和/或形态作用,或者显示生物量比野生型植物的高的转化植物被鉴定为非生物胁迫耐受 性植物。渗透压耐受性试验一进行渗透胁迫实验(包括氯化钠和甘露醇实验)以确定渗 透胁迫表型是否是氯化钠特异性的或者是否是一般渗透胁迫相关性表型。耐受渗透胁迫的 植物可能对干旱和/或冷冻具有更大的耐受性。对于盐和渗透胁迫萌发实验,培养基用例 如50mM、100mM、200mM NaCl或100mM、200mM NaCl、400mM甘露醇补充。另参见随后实施例 部分的实施例5。干旱耐受性实验/渗压剂实验一进行耐旱性实验以鉴定在严重脱水后使植物较 好地存活的基因。为了分析转基因植物是否较耐受干旱,在培养基中进行了通过非离子渗 压剂山梨醇产生的渗透胁迫。使对照植物和转基因植物萌发,并在植物琼脂平板上生长4 天,之后将其转移到含有500mM山梨醇的平板中。该处理引起生长迟缓,然后,通过测量植 物重量(湿重和干重)、产量,并通过按开花时间测量的生长率,对对照植物和转基因植物 两者进行了比较。相反地,基于土壤的干旱筛选用过量表达上文中详述的多核苷酸的植物进行。使 对照拟南芥植物的种子或过量表达本发明多肽的其它转基因植物萌发,并移栽到盆中。在 浇灌停止并同时将盆放在吸水纸上以提高土壤干燥率来达到干旱胁迫。当大部分对照植物 出现严重萎蔫时,对转基因植物和对照植物彼此间进行了比较。在获得相当一部分显示严
22重萎蔫的对照植物后,给植物再次浇水。按下列两个标准中每一个,将植物与对照进行比较 分级干旱条件的耐受性和再浇水后的复原状况(存活)。冷胁迫耐受性一为了分析冷胁迫,将成熟(25天龄)植物转移到4°C、必要光照 (constitutive light)的室内达1周或2周。之后,将植物移回到温室。2周后,通过测量 植物重量(湿重和干重),并通过比较以开花时间、植物大小、产量等测量的生长率,在对照 植物和转基因植物之间对导致生长迟缓和其它表型的低温期冷害进行比较。热胁迫耐受性一通过将植物暴露于34°C以上温度达一定时期,达到热胁迫耐受 性。在将植物转移回到22°C以复原后,对植物耐受性进行分析,5天后,相对于内部对照(非 转基因植物)或既未暴露于冷胁迫也未暴露于热胁迫的植物进行评价。萌发试验一萌发试验对可完成萌发过程的转基因植物种子的百分比与以相同方 式处理的对照植物种子的百分比进行比较。例如在每日22小时光照2小时避光周期下于 22°C培育被视为正常条件。在种植后4天和14天之间,对萌发和幼苗活力进行评价。基础 培养基为 50% MS 培养基(Murashige 和 Skoog,1962,Plant Physiology 15,473-497)。同样在不利条件下,例如冷(在10°C以下的温度而不是22°C下培育)或含有高浓 度渗压剂例如山梨醇(以50mM、100mM、200mM、300mM、500mM和高达IOOOmM的浓度)的种子 抑制溶液或施加浓度递增的盐(50mM、100mM、200mM、300mM、500mM NaCl),检查萌发。水分利用效率一可以每单位蒸腾所产生的生物量来确定。为了分析WUE,可在对 照植物和转基因植物中测量叶片相对含水量。及时记录鲜重(FW);然后,在室温避光下,将 叶片在浸泡在蒸馏水中8小时,记录吸胀重量(TW)。在60°C下将叶片干燥至恒重后,记录 总干重(DW)。按照下列方程式I计算相对含水量(RWC)方程式I(Fff-DW/TW-DW) χ 100肥料利用效率一为了分析转基因植物是否对肥料的反应更灵敏,使植物在具有 有限量的肥料的琼脂平板或盆中生长,参见例如下文中的实施例6和Yanagisawa等(Proc Natl Acad Sci U S Α. 2004 ; 101 :7833_8)。对植物的整体大小、开花时间、产量、芽和/或 谷物的蛋白质含量进行分析。检查的参数为成熟植物的整体大小、其湿重和干重、所产生的 种子的重量、平均种子大小及每株植物所产生的种子的数目。可以测定的其它参数为叶片 的叶绿素含量(因为植物氮素状况与叶片青绿程度高度相关)、种子或其它植物组成部分 (例如叶或苗)的氨基酸含量和总蛋白含量、油含量等。同样,可以递增的浓度加入磷酸盐 或钾而不是提供有限量的氮。此外,测量了与上列参数一样的参数。同样,对氮素利用效率 (NUE)、磷酸盐利用效率(PUE)和钾利用效率(KUE)进行评价,检查转基因植物在氮素抑制 条件下健壮生长的能力。氮素测定一测定植物的结构部分中的N(氮)浓度的方法包括将器官N转化成 NO3-的过硫酸钾消化方法(Purcell和King 1996 Argon. J. 88 :111_113);改进的CcT介导 NOf 还原成 NOf (Vodovotz 1996Biotechniques 20:390-394)以及通过 Griess 试验测定亚 硝酸盐(Vodovotz 1996,同上)。针对NaNO2的标准曲线,在550nm下测定吸光度值。该方 法的详情参见 Samonte 等,2006 Agron. J. 98 168-176。谷物蛋白质浓度一谷物蛋白质含量(谷物蛋白质g/m2)用谷物的N质量(谷物N g/m2)乘以N/蛋白质转换率k-5. 13的乘积来估算(MoSSel990,同上)。谷物蛋白质浓度用每单位谷物质量的谷物蛋白质含量(谷物蛋白质g/kg谷物)来估算。含油量一可通过从种子或植物的营养部分中提取油来测定植物的含油 量。简单地说,在特定的溶剂(例如己烷或石油醚)存在下,可通过研磨植物组织,并 且在连续提取器中抽提油,从而从植物(例如种子)中提取脂质(油)。间接含油量 分析可采用各种已知方法进行,例如测量液体状态的样品中由氢原子吸收的共振能的 核磁共振(NMR)光谱法[参见例如 Conway TF.和 Earle FR.,1963,Journal of the AmericanOil Chemists ' Society ;Springer Berlin/Heidelberg, ISSN :0003_021X(印 刷)1558-9331 (在线)];利用样品吸收近红外能(1100-2500nm)的近红外(Ni)光谱法;以 及W0/2001/023884中所描述的方法,该方法以在溶剂中提取油为基础,在气体流中蒸发溶 剂形成油颗粒,并把光照向气体流和油粒子,这就形成了可检测的反射光。植物生长势可通过每段时间内生长参数的增加来计算,生长参数例如叶面积、纤 维长度、莲座(rosette)直径、植物鲜重等。可以应用生长植物的数字分析来测定生长率。例如,可以每3天拍摄温室中在 试验区(plot)基础上生长的植物的照片,通过数字分析计算莲座面积。莲座面积生长 (growth)用取样天数之间莲座面积的差异除以样品间天数的差异来计算。可通过同时从8-16株植物上采集总的种子,使用分析天平称量,将总重量除以植 物总数,来进行种子产量的测量。每生长面积的种子可以同样方式同时考虑给定某一单种 植物的生长面积来计算。增加每生长面积的种子产量可通过增加每株植物的种子产量,和 /或通过增加在指定面积上生长的植物数量来实现。可将通过测量从8-16株植物产生和收获的干种子的量(重量或大小)或数量(即 数目)除以植物数,来估算每株植物的种子产量。可通过测量每段时间所产生的植物生物量、莲座面积、叶大小或根长来估算生长 率(可按叶面积cm2/天进行测量)。纤维长度可以使用纤维照影机测量。使用纤维照影机系统计算长度,用“上半 部平均长度”表示。上半部平均长度(UHM)是纤维分布中较长一半的平均长度。纤维照 影机测量规定百分点的跨度距离内的长度(超文本传输协议/VVww. cottoninc. com/ ClassificationofCotton/ ? Pg = 4#Length)。因此,本发明具有较高农业价值,用于促进所需经济作物的产量(例如营养器官 (例如杨树木材)的生物量,或繁殖器官的生物量(例如种子数或种子生物量))。本文所使用的术语“约”是指士 10%。术语“包含”、“含有”、“包括”、“包括”、“具有”及其变化形式是指“包括但不限于”。术语“由......组成”是指“包括并限于”。术语“基本由......组成”是指组合物、方法或结构可包括额外的成分、步骤和/
或组成部分,但只有当额外成分、步骤和/或组成部分不实质性地改变要求保护的组合物、 方法或结构的基本和新的特征才可以。本文所使用的未给定数量词的单数形式包括复数形式,除非文中另有明确说明。 例如,术语“化合物”或“至少一种化合物”可包括大量化合物,包括其混合物。在整个申请书中,本发明的各种实施方案以范围格式提供。应当了解的是,范围 格式中的描述仅仅是出于方便和简明,不应解释为是对本发明范围的不可变更的限制。因此,范围的描述应视为特别公开的所有可能的子范围以及在该范围内的各个数值。例如诸 如1-6范围的描述应视为特别公开的例如1-3、1-4、1-5、2-4、2-6、3-6等的子范围,以及该 范围内的每个数,例如1、2、3、4、5和6。这不论范围宽度如何都适用。每当本文表明数字范围时,是指包括所引用的指定范围内的任何数字(分数或整 数)。术语“介于”第一规定数字和第二规定数字“之间”,以及“自,,第一规定数字“至”第 二规定数字的“范围”在本文可互换使用,是指包括第一规定数字和第二规定数字以及它们 之间的所有分数和整数。本文所使用的术语“方法”是指用于完成指定任务的方式、手段、技术和方法步骤, 包括但不限于化学、药理学、生物学、生物化学和医学从业人员已知的或者易由所述从业人 员从已知方式、手段、技术和方法步骤开发的方式、手段、技术和方法步骤。要了解的是,为了清楚起见在单独的实施方案内容中描述的本发明的某些特征, 也可结合起来在一个实施方案中提供。相反地,为了简明起见在一个实施方案中内容中描 述的本发明的各种特征,也可以单独提供或以任何合适的再组合或以适于任何其它描述的 本发明实施方案提供。各种实施方案内容中描述的某些特征不得视为是所述实施方案不可 缺少的特征,除非无这些要素实施方案无法实施。上文中描述的本发明的各种实施方案和方面,以及所附权利要求书部分所要求保 护的内容的实验支持参见在下面的实施例。
实施例下面列出下列实施例的参考文献,所述参考文献与上文中的说明书一起以非限制 性方式对本发明的一些实施方案予以说明。一般而言,本文所使用的术语和用于本发明的实验室方法包括分子、生物化学、 微生物和重组DNA技术。文献中对这类技术进行了全面的讲解。参见例如“Molecular Cloning :A laboratory Manual"Sambrook^, (1989) ;"Current Protocols in Molecular Biology”,第 I-III 卷,Ausubel, R. Μ·,主编(1994) ;Ausubel 等,“Current Protocols inMolecular Biology,,,John Wiley and Sons, Baltimore, Maryland(1989) ;Perbal, "A Practical Guide to Molecular Cloning,,,John Wiley & Sons, New York(1988) ;Watson 等,“Recombinant DNA,,,Scientific AmericanBooks, New York ;Birren 等(主编)“Genome Analysis :A LaboratoryManual Series,,,第 1-4 卷,Cold Spring Harbor Laboratory Press, NewYork(1998);美国专利第 4,666,828、4,683,202、4,801,531、5, 192,659 和 5,272,057 号中所述方法;“Cell Biology :A Laboratory Handbook”,第 I-III 卷,Cellis, J. E.主编(1994) ;"Current Protocols in Immunology” 第 I-III 卷,Coligan J. E.主 编(1994) ;Stites 等(主编),“Basic and Clinicallmmunology”(第 8 版),Appleton & Lange, Norwalk, CT (1994) ;Mishell 和 Shiigi (主编),“Selected Methods in Cellular Immunology", W. H. Freeman and Co. , New York(1980);专利和科技文献中大量记载的可 应用的免疫测定法,参见例如美国专利第3,791,932,3, 839,153,3, 850,752,3, 850,578、 3,853,987,3,867,517,3,879,262,3,901,654,3,935,074,3,984,533,3,996,345, 4,034,074、4,098,876、4,879,219、5,011,771 和 5,281,521 号;“Oligonucleotide Synthesis"Gait, Μ. J.主编(1984) ;"Nucleic Acid Hybridization”Hames,B. D.和Higgins S. J.主 编(1985) ;"Transcription and Translation,,Hames, B. D.禾口 Higgins S. J.主编(1984) ;‘‘Animal Cell Culture"Freshney, R. I.主编(1986); ‘‘ ImmobilizedCells and Enzymes,,IRL Press, (1986) ; "A Practical Guide to MolecularCloning"Perbal, B. , (1984)和"Methods in Enzymology"第 1-317 卷, Academic Press ;"PCR Protocols :A Guide To Methods AndApplications,,,Academic Press, San Diego, CA(1990) ;Marshak "Strategies for Protein Purification and Characterization-Α LaboratoryCourse Manual,,CSHL Press (1996),所有文献都通过引用 予以结合就如全部列举在本文中一样。其它一般参考文献贯穿在本文中提供。其中的方法 步骤被视为是本领域众所周知的,为了方便读者而提供。其中所包含的全部信息通过引用 结合到本文中。实施例1应用数字表达分析和跨种比较基因组鉴定AQP基因植物中存在大量的AQP,而且当AQP在植物中过量表达时所得到的相抵触的结果 表明,需要选择性地鉴定可以改进植物的水分利用效率(WUE)、在非生物胁迫下以及在不利 条件下导致产量和生物量提高的AQP基因。在不利的胁迫条件下,植物的一些生物活性终止或降低,而其它不是初期活性的 生长活性则启动。尽管如此,仍然维持对植物存活必不可少的一些活性。一种假设是,对于 植物在不利条件下维持生命活性的所需要的关键基因应当在大范围的生物胁迫和非生物 胁迫下具有活性。为了检验这个假设并且鉴定出具有在不同的生物胁迫和/或非生物胁迫条件(例 如盐或干旱胁迫)下改进植物性能潜力的关键AQP基因,综合进行了数字表达分析(亦称 电子RNA印迹法)和跨种比较基因组学分析。所利用的数据库可获自NCBI (超文本传输协 议://www. ncbi.nlm.nih. gov/dbEST/),并包括了源自15种不同品种的1,195个相关EST 文库的7. 2x IO6个表达序列标签(EST),同时包括单子叶植物和双子叶植物品种,即拟南 芥、大麦、芜菁(Brassica rapa)、棉花、葡萄、玉米、苜蓿、杨树、马铃薯、水稻、苜蓿、大豆、甘 蔗、番茄和小麦。根据可用于数据挖掘的得自若干番茄品种的高品质番茄数据库以及本发明的发 明人在使用番茄基因组作为模式植物中的经验,选择番茄植物作为模式植物。另外,各种番 茄品种具有相对高的耐盐性,使得番茄基因组成为用于鉴定新的胁迫耐受性机制的优良的 候选植物。而且,番茄不仅仅用作遗传学研究的模式植物,而且它还用作具有界限清晰的产 量参数的重要作物,所述参数可用来区分影响非生物胁迫耐受性的基因和防止在非生物胁 迫条件下产量受损失的基因。基因分析和数据挖掘一对于基因分析和数据挖掘,所使用的生物信息过滤方法 具有三个阶段1.聚簇和装配从 GenBank 157、160、161、162、164、165、166 版中提取 15 个品种 每一种的EST和mRNA序列,采用CompugenLEADS聚簇和装配平台(Compugen ’ s LEADS clustering and assemblyplatform, Compugen Ltd. , Tel Aviv, Israel ;Yelin 等 2003, NatureBiotechnology 21,379-85)进行聚簇和装配。自动摘录的EST文库注释用手工 校正并根据解剖学、发育阶段、非生物/生物胁迫处理和栽培品种进行分类。将结果录入Oracle数据库。然后预测的蛋白质使用InterPro (2)(超文本传输协议/VVww. ebi. ac. uk/ interpro/)注释。2.聚簇的选择一选择包含主要内在蛋白结构域(IPR000425)的全部聚簇用于进 一步分析(η = 1,114)。3.获取聚簇表达谱一通过数字表达方法,根据植物解剖学(即基因在哪些组织/ 器官中表达)、发育阶段(即在哪个发育阶段可存在某一基因)和处理特征(提供在哪种生 理条件下(例如干旱、冷、病菌感染等)基因进行表达),获得全部聚簇的表达谱。数字表达计算法如下计算以m/(n*M/N)计算过量表达倍数,其中“N”是具体生物 的EST总数;“M”是给定文库/组织/种类的EST数;“η”是给定重叠群的EST总数;“m” 是重叠群中文库/组织/种类的EST数;P值应用Fisher精确检验统计量计算。在根部和 非生物胁迫条件下过量表达的综合P值用l-(l-pl)X(l-p2)计算。在种间转录数据库鉴定 出1,114个不同的AQP基因。对于数据挖掘方法,本发明的发明人结合使用两种方法根 部与苗相比,或者在各种非生物胁迫(包括干旱、冷、盐分、热、化学处理等)下与非胁迫对 照相比,精选AQP聚簇显示显著过量表达(EST分布是正常的两倍以上;过量表达的统计显 著一性P值< 0. 05)。研究发现,约9%的AQP基因的EST显著过量存在于根中,在不同非 生物胁迫下诱导其中的3. 5%。选出高过量存在于根部的AQP基因,因为预期具有有效根系 的植物能从干燥土壤中夺取更多水分。另外,鉴于AQP基因可提供对各种胁迫的高耐受性, 因此选择过量存在于各种非生物胁迫(例如养分缺乏、热、盐分和重金属胁迫)及生物胁迫 (例如施用激位素(elicitor)和病原体)中的AQP基因。按照文献中已知的可接受的组别,对同一组的1,114个AQP进行了分类第一次分 成4个主要亚组PIP、TIP、NIP和SIP,第二次分类按照其在氨基酸序列中的同源性,将这4 个亚组分成11个亚组。然后,利用Fisher精确检验鉴定在根部和当暴露在不同非生物胁 迫下过量存在的大量EST的亚组。如下文中的表1所示,11个亚组中,仅TIP2亚组显示在 根部和当暴露于非生物胁迫时过量存在大量的EST (P值分别1. 7X10_5和1. 6X10_3)。表 1在根部以及在非生物胁迫时AQP类型分布和过量表达
2权利要求
一种提高植物的非生物胁迫耐受性的方法,所述方法包括在植物中表达编码包含与选自以下的氨基酸序列有至少80%同源性的氨基酸序列的多肽的外源多核苷酸SEQ ID NO33、34、30、27 29、31、32、35 52、1401 1403、1405 1435、1437 1494、1496 1542、1544 1553、1555 1559、1561 1827、1829 1866、1868 2450、2453 2458、2460 2463、2465 2481、2483、2485 2746、2765 2769、3052 3065和3067 3259,从而提高植物的非生物胁迫耐受性。
2.一种提高植物的水分利用效率(WUE)、肥料利用效率(FUE)、生物量、生长势和/ 或产量的方法,所述方法包括在植物中表达编码包含与选自以下的氨基酸序列有至少 80%同源性的氨基酸序列的多肽的外源多核苷酸:SEQ ID N0:33、34、30、27-29、31、32、 35-52、1401-1403、1405-1435、1437-1494、1496-1542、1544-1553、1555-1559、1561-1827、 1829-1866,1868-2450,2453-2458,2460-2463,2465-2481,2483,2485-2746,2765-2769, 3052-3065和3067-3259,从而提高植物的水分利用效率(WUE)、肥料利用效率(FUE)、生物 量、生长势和/或产量。
3.一种分离多核苷酸,所述多核苷酸包含与选自以下的核酸序列有至少80%同 一性的核酸序列:SEQ ID NO :7、8、4、1-3、5、6、9-26、53-55、57-87、89-147、149-195、 197-206、208-212、214-480、482-519、521-1103、1106-1111、1113-1116、1118-1134、1136、 1138-1400、2748-2764、2843-2857 和 2859-3051。
4.一种核酸构建体,所述核酸构建体包含权利要求3的分离多核苷酸和用于指导所述 核酸序列转录的启动子。
5.一种分离多肽,所述多肽包含与选自以下的氨基酸序列有至少80%同源性的氨基 酸序列SEQ ID NO :33、34、30、27-29、31、32、35-52、1401-1403、1405-1435、1437-1494、 1496-1542、1544-1553、1555-1559、1561-1827、1829-1866、1868-2450、2453-2458、 2460-2463、2465-2481、2483、2485-2746、2765-2769、3052-3065 和 3067-3259。
6.一种植物细胞,所述细胞包含具有与选自以下的氨基酸序列有至少80%同源 性的氨基酸序列的外源多肽:SEQ ID NO :33、34、30、27-29、31、32、35-52、1401-1403、 1405-1435、1437-1494、1496-1542、1544-1553、1555-1559、1561-1827、1829-1866、 1868-2450、2453-2458、2460-2463、2465-2481、2483、2485-2746、2765-2769、3052-3065 和 3067-3259。
7.一种植物细胞,所述植物细胞包含含有与选自以下的核酸序列有至少80%同 源性的核酸序列的外源多核苷酸SEQ ID NO :7、8、4、1-3、5、6、9-26、53-55、57-87、 89-147、149-195、197-206、208-212、214-480、482-519、521-1103、1106-1111、1113-1116、 1118-1134,1136,1138-1400,2748-2764,2843-2857 和 2859-3051。
8.权利要求1或2的方法、权利要求3的分离多核苷酸、权利要求4的核酸构建体或 权利要求7的植物细胞,其中所述多核苷酸选自SEQ ID NO :7、8、4、1-3、5、6、9-26、53-55、 57-87、89-147、149-195、197-206、208-212、214-480、482-519、52卜1103、1106-1111、 1113-1116、1118-1134、1136、1138-1400、2748-2764、2843-2857 和 2859-3051。
9.权利要求1或2的方法、权利要求5的分离多肽或权利要求6的植物细胞,其中 所述氨基酸序列选自 SEQ ID NO :33、34、30、27-29、31、32、35-52、1401-1403、1405-1435、 1437-1494、1496-1542、1544-1553、1555-1559、1561-1827、1829-1866、1868-2450、2453-2458、2460-2463、2465-2481、2483、2485-2746、2765-2769、3052-3065 和 3067-3259。
10.权利要求1或2的方法、权利要求5的分离多肽或权利要求6的植物细胞,其中所 述多月太选自 SEQ ID NO :33、34、30、27-29、31、32、35-52、1401-1403、1405-1435、1437-1494、 1496-1542、1544-1553、1555-1559、1561-1827、1829-1866、1868-2450、2453-2458、 2460-2463、2465-2481、2483、2485-2746、2765-2769、3052-3065 和 3067-3259。
11.一种提高植物的非生物胁迫耐受性的方法,所述方法包括在植物中表达编码 包含由 SEQ ID NO :33、34、30、27-29、31、32、35-52、1401-1403、1405-1435、1437-1494、 1496-1542、1544-1553、1555-1559、1561-1827、1829-1866、1868-2450、2453-2458、 2460-2463、2465-2481、2483、2485-2746、2765-2769、3052-3065、3067-3258 或 3259 所示的 氨基酸序列的多肽的外源多核苷酸,从而提高植物的非生物胁迫耐受性。
12.一种提高植物的水分利用效率(WUE)、肥料利用效率(FUE)、生物量、生长势和/或 产量的方法,所述方法包括在植物中表达编码包含由SEQ ID NO :33、34、30、27-29、31、32、 35-52、1401-1403、1405-1435、1437-1494、1496-1542、1544-1553、1555-1559、1561-1827、 1829-1866,1868-2450,2453-2458,2460-2463,2465-2481,2483,2485-2746,2765-2769, 3052-3065、3067-3258或3259所示的氨基酸序列的多肽的外源多核苷酸,从而提高植物的 水分利用效率(WUE)、肥料利用效率(FUE)、生物量、生长势和/或产量。
13.一种分离多核苷酸,所述多核苷酸包含由SEQ ID NO :7、8、4、1-3、5、6、9-26、53-55、 57-87、89-147、149-195、197-206、208-212、214-480、482-519、521-1103、1106-1111、 1113-1116,1118-1134,1136,1138-1400,2748-2764,2843-2857,2859-3050 或 3051 所示的 核酸序列。
14.一种核酸构建体,所述核酸构建体包含权利要求13的分离多核苷酸和用于指导所 述核酸序列转录的启动子。
15.一种分离多肽,所述多肽包含由 SEQ ID NO :33、34、30、27-29、31、32、35-52、 1401-1403、1405-1435、1437-1494、1496-1542、1544-1553、1555-1559、1561-1827、 1829-1866,1868-2450,2453-2458,2460-2463,2465-2481,2483,2485-2746,2765-2769, 3052-3065,3067-3258或3259所示的氨基酸序列。
16.一种植物细胞,所述细胞包含具有由SEQ ID NO :33、34、30、27-29、31、32、 35-52、1401-1403、1405-1435、1437-1494、1496-1542、1544-1553、1555-1559、1561-1827、 1829-1866、1868-2450、2453-2458、2460-2463、2465-2481、2483、2485-2746、2765-2769、 3052-3065,3067-3258或3259所示的氨基酸序列的外源多肽。
17.一种植物细胞,所述细胞包含含有由SEQ ID NO :7、8、4、1-3、5、6、9-26、53-55、 57-87,89-147,149-195,197-206,208-212,214-480,482-519,521-1103,1106-1111, 1113-1116,1118-1134,1136,1138-1400,2748-2764,2843-2857,2859-3050 或 3051 所示核 酸序列的外源多核苷酸。
18.权利要求1或11的方法,其中所述非生物胁迫选自盐分、脱水、低温、高温、重金属 毒性、无氧生活、养分缺乏、养分过量、大气污染和紫外幅射。
19.权利要求1或11的方法,所述方法还包括使表达所述外源多核苷酸的植物在非生 物胁迫下生长。
20.权利要求4或14的核酸构建体,其中所述启动子是组成型启动子。
21.权利要求6、7、16或17的植物细胞,其中所述植物细胞形成植物的组成部分。
全文摘要
本发明提供多核苷酸、多肽、表达相同多肽的植物细胞和使用相同核苷酸、多肽和植物细胞以提高植物的非生物胁迫耐受性、水分利用效率(WUE)、肥料利用效率(FUE)、生物量、生长势和/或产量的方法。所述方法通过在植物中表达编码包含与选自以下的氨基酸序列有至少80%同源性的氨基酸序列的多肽的外源多核苷酸来实现SEQ IDNO33、34、30、27-29、31、32、35-52、1401-1403、1405-1435、1437-1494、1496-1542、1544-1553、1555-1559、1561-1827、1829-1866、1868-2450、2453-2458、2460-2463、2465-2481、2483、2485-2746、2765-2769、3052-3065和3067-3259,从而提高植物的水分利用效率(WUE)、肥料利用效率(FUE)、生物量、生长势和/或产量。
文档编号C07K14/415GK101977928SQ200880127757
公开日2011年2月16日 申请日期2008年12月23日 优先权日2007年12月27日
发明者A·迪伯, B·J·维诺库尔, G·罗南, H·卡基, S·阿亚尔, Y·赫施科维茨 申请人:伊沃基因有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1