具有提高的产量相关性状的植物和用于制备该植物的方法

文档序号:335099阅读:614来源:国知局
专利名称:具有提高的产量相关性状的植物和用于制备该植物的方法
具有提高的产量相关性状的植物和用于制备该植物的方法本发明总体上涉及分子生物学领域并涉及用于通过增加植物中以下核酸序列的 表达而提高多种植物产量相关性状的方法(i)编码生长调节因子(GRF)多肽的核酸序列 和(ii)编码滑膜肉瘤易位(SYT)多肽的核酸序列,其中所述的产量相关性状相对于具有 ⑴编码GRF多肽的核酸序列或(ii)编码SYT多肽的核酸序列之一表达增加的植物提高。 本发明也涉及使(i)编码GRF多肽的核酸序列和(ii)编码SYT多肽的核酸序列表达增加 的植物,其中所述的植物相对于具有⑴编码GRF多肽的核酸序列或(ii)编码SYT多肽的 核酸序列之一表达增加的植物具有提高的产量相关性状。本发明也提供了在本发明方法中 有用的构建体。持续增长的世界人口和农业用可耕地供应萎缩刺激了有关提高农业效率的研究。 常规的作物及园艺学改良手段利用选择育种技术以鉴定具有受欢迎特征的植物。然而,此 类选择育种技术具有几个缺陷,即这些技术一般耗费很多劳动并且产生这样的植物,其经 常含有异源的遗传组分,其可能不总导致受欢迎性状从亲代植物传递下去。分子生物学进 展已经允许人类改良动物及植物的种质。植物的遗传工程使得可以分离和操作遗传物质 (一般处于DNA或RNA形式)并且随后导入该遗传物质至植物中。此类技术具有产生具备 多种经济学、农学或园艺学改良性状的作物或植物的能力。具有特殊经济意义的性状是提高的产量。产量通常定义为来自作物的经济价值的 可测量结果。该结果可以就数量和/或品质方面进行定义。产量直接取决于几个因素,例 如器官的数目和大小、植物构造(例如枝的数目)、种子产生、叶衰老等。根发育、养分摄入、 胁迫耐受性和早期生长势(earlyvigor)也可以是决定产量的重要因素。优化前述因素因 而可以有助于提高作物产量。种子产量是特别重要的性状,因为许多植物的种子对人和动物营养是重要的。作 物如谷物、稻、小麦、卡诺拉油菜和大豆占超过一半的人类总热量摄入,无论通过直接消费 种子本身或通过消费基于加工的种子而产生的肉产品。作物也是糖、油及工业加工中所用 许多类型代谢物的来源。种子含有胚(新苗和新根的起源)和胚乳(萌发期间和籽苗早期 生长期间用于胚生长的养分来源)。种子发育涉及多种基因并且需要代谢物从根、叶和茎转 移至正在生长的种子中。胚乳尤其同化糖类、油和蛋白质的代谢前体并且将它们合成为贮 藏大分子以灌满籽粒。植物生物量是饲料作物如苜蓿、饲用谷物和干草的产量。产量的许多代用物已经 用于谷物作物。它们当中主要是对植物尺寸的估计。植物尺寸可以根据物种和发育阶段以 多种方式测量,不过包括总植物干重、地上部分干重、地上部分鲜重、叶面积、茎体积、植物 高度、莲座丛直径、叶长度、根长度、根质量、分蘖数和叶数。许多物种维持在给定发育阶段 上植物不同部分的尺寸之间的保守比率。这些异速增长关系用来从这些尺寸量值之一外推 至另一种尺寸量值(例如 Tittonell 等人,2005 Agric Ecosys &Environ 105:213)。在发 育早期的植物尺寸一般与发育中稍后的植物尺寸相关。具有较大叶面积的较大植物通常可 以比较小的植物吸收更多光线和二氧化碳并且因而可能会在相同的时段期间获得更大重 量(Fasoula和Tollenaar 2005 Maydica 50:39)。此外,这也是植物应当初始实现较大尺寸的微环境优势或遗传优势的潜在延续。存在针对植物尺寸和生长速率的强遗传组分(例 如ter Steege等人,2005 Plant Physiology 139 1078),并且因而对于一系列各异遗传表 型,在一种环境条件下的植物尺寸很可能关联于另一种环境条件下的尺寸(Hittalmani等 人,2003 Theoretical AppliedGenetics 107:679)。以这种方式,使用标准环境作为作物 在田间于不同位置及时间所遭遇的多样且动态环境的代用物。对于许多作物的另一个重要性状是早期生长势。改进早期生长势是现代稻育种计 划在温带和热带稻品种方面的重要目标。长根对于水栽稻中正确土壤固定是重要的。在稻 直接播种至被淹没田地的情况下,以及在植物必须从水中迅速出苗的情况下,较长的苗与 生长势相关。在实施条播的情况下,较长的中胚轴和胚芽鞘对良好出苗是重要的。将早期 生长势人工改造到植物内的能力在农业中将是极重要的。例如,不良的早期生长势已经限 制了基于玉米带种质(Corn Belt germplasm)在欧洲大西洋地区引种玉米(Zea mayes L.) 杂种。收获指数即种子产量对地上部分干重的比率在许多环境条件下是相对稳定的并 且因而可以经常获得植物尺寸与谷物产量之间的强相关(例如Rebetzke等人,2002 Crop Science 42 :739)。这些过程是内在联系的,因为谷物生物量的主要部分取决于植物叶和茎 的现有和储备光合生产率(Gardener 等人,1985 Physiology of Crop Plants. Iowa State UniversityPress,第68-73页)。因此,选择植物尺寸(甚至在发育的早期)已经用作未来 潜在产能的指示物(例如 Tittonell 等人,2005 Agric Ecosys & Environ 105:213)。当 检验遗传差异对胁迫耐受性的影响时,使土壤属性、温度、水和养分有效性和光强度标准化 的能力是温室或植物生长室环境与田间相比的固有优势。然而,产量因不良授粉所致的人 为限制可能限制这些受控环境检验产量差异的用途,其中所述的不良授粉因缺少风和昆虫 或成熟根或根冠生长的足够空间引起。因此,在标准化条件下在生长室或温室测量发育早 期的植物尺寸是提供潜在遗传产量优势指示的标准操作。另一个重要性状是改良的非生物性胁迫耐受性。非生物性胁迫是世界范围作物 损失的主要原因,对于大多数主要作物植物而言平均产量降低超过50% (Wang等,(2003) Planta 218:1_14)。非生物性胁迫可以由干旱、盐度、极端温度、化学毒性养分、(大分子和 /或微量元素)过量或匮乏、辐射和氧化胁迫引起。提高植物的非生物性胁迫耐受性能力将 在世界范围对农民是巨大的经济优势并且将允许在不利条件期间及在本来不可能栽培作 物的陆地上栽培作物。因而可以通过优化前述因素之一提高作物产量。取决于最终用途,对某些产量性状的改良可能优先于其它产量性状。例如对于应 用如饲料或木材生产或生物燃料资源而言,增加植物营养体部分可能是希望的,而对于应 用如面粉、淀粉或油生产而言,种子参数提高可能是特别希望的。即便在种子参数当中,某 些参数可以更优先于其它参数,这取决于用途。多种机制可以有助于提高种子产量,无论其 形式为提高的种子尺寸或提高的种子数目。提高植物中产量相关性状(种子产量和/或生物量)的一种方法可以是通过调节 植物的内在生长机制如细胞周期或参与植物生长或参与防御机制的多种信号传导途径。现在已经发现可以通过增加植物中(i)编码生长调节因子(GRF)多肽的核酸序列 和(ii)编码滑膜肉瘤易位(SYT)多肽的核酸序列的表达而提高植物中多种产量相关性状,其中所述的产量相关性状相对于具有(i)编码GRF多肽的核酸序列或(ii)编码SYT多肽 的核酸序列之一表达增加的植物提高。提高的产量相关性状包含以下一项或多项提高的 早期生长势、提高的地上部分生物量、提高的每株植物总种子产量、提高的种子充实率、提 高的(充实)种子数、提高的收获指数和提高的千粒核重(TKW)。与生长调节因子(GRF)多肽相关的背景DNA结合蛋白是包含任一 DNA结合结构域并因而具有对DNA的特异或普遍亲和性 的蛋白质。DNA结合蛋白包括例如调节转录过程的转录因子、切割DNA分子的核酸酶和参与 细胞核中DNA包装的组蛋白。转录因子通常定义为显示序列特异性DNA结合亲和性并且能够激活和/或阻遏转 录的蛋白质。拟南芥(Arabidopsis thaliana)基因组编码至少1533种转录调节蛋白,占 其预计基因总数的约 5. 9% (Riechmann 等人,(2000) Science 290:2105-2109)。稻转录 因子数据库(DRTF)是籼稻(Oryzasativa L. ssp. indica)和粳稻(Oryza sativa L. ssp. japonica)的已知和预测转录因子的集合,并且目前含有籼稻中的2,025种推定转录因子 (TF)基因模型和粳稻中的2,384种推定转录因子基因模型,分布在63个家族中(Gao等人, (2006)Bioinformatics 2006,22 (10) 1286-7)。这些家族之一是对植物特异的生长调节因子(GRF)转录因子家族。已经在拟南 芥中鉴定了至少9个GRF多肽(Kim等人,(2003)Plant J 36 :94_104)和稻中的至少12 个 GRF 多肽(Choi 等人,(2004)Plant Cell Physiol45(7) :897_904)。GRF 多肽以其氨基 端半侧存在至少2个高度保守的结构域为特征,其中所述高度保守的结构域以每个结构 域内部最保守的氨基酸命名(i)QLQ结构域(InterPro登录号IPR014978,PFAM登录号 PF08880),其中该结构域的最保守氨基酸是Gln-Leu-Gln ;和(ii)WRC结构域(InterPro登 录号IPR014977,PFAM登录号PF08879),其中该结构域的最保守氨基酸是Trp-Arg-Cys。WRC 结构域还含有两个明显不同的结构特征,即WRC结构域富含碱性氨基酸Lys和Arg,并还在 保守间隔(CX9CX1(1CX2H)中包含3个Cys和1个His残基,其中所述保守间隔命名为转录效 应子(ET)结构域(Ellerstrom 等人,(2005)Plant Molec Biol 59:663-681)。ET 结构域 中半胱氨酸和组氨酸的保守间隔类似于锌指(锌结合)蛋白。此外,在GRF多肽序列中通 常包含核定位信号(NLS)。已经使用酵母双杂交相互作用测定法展示了一些GRF多肽与转录辅激活蛋白小 家族GRF-相互作用因子(GIF1至GIF3,又叫做滑膜肉瘤易位SYT1至SYT3)的相互作用 (Kim 和 Kende(2004)Proc Natl Acad Sci 101 :13374_13379)。名字GRF也已经赋予属于14-3-3多肽家族的另一个类型的多肽(deVetten和 Ferl (1994)Plant Physiol 106 :1593_1604),所述多肽与用于开展本发明方法的GRF多肽
完全无关。用35S CaMV病毒组成型启动子控制下的稻GRF(OsGRFl)多肽转化的转基因拟南 芥植物显示弯曲的叶、初生花序伸长严重降低和延迟抽苔(van der Knapp等人,(2000) Plant Physiol 122 :695_704)。与野生型植物相比,用2种拟南芥GRF多肽(AtGRFl和 AtGRF2)之一转化的转基因拟南芥植物产生更大的叶和子叶,抽苔延迟并且部分不育(原 因在于缺少有活力的花粉)(Kim等人,(2003) Plant J 36:94-104)。在美国专利申请US2006/0048240中,将一种拟南芥GRF多肽鉴定为SEQ ID NO:33421。在美国专利申请2007/0022495中,将一种拟南芥GRF多肽鉴定为SEQ ID NO: 1803 (在其中又称作G1438)。使用35S CaMV启动子过量表达G1438的转基因拟南芥属植 物展示深绿色的叶。与滑膜肉瘤易位(SYT)多肽相关的背景SYT是植物中与GRF(生长调节因子)蛋白质家族的转录激活蛋白形成功能复合 体的转录辅激活蛋白(Kim HJ, Kende H(2004)Proc Nat Acad SclOl 13374-9) SYT 在本 文中称为GRF相互作用因子的GIF,并且在Horiguchi等人,(2005)Plant J 43 :68_78中 称为狭叶3的AN3。GRF转录激活蛋白与酵母中染色质重建复合体的SWI/SNF蛋白共有结 构性结构域(在氨基端区内)(van der Knaap E 等人,(2000) Plant Phys 122 :695_704)。 提出了这些复合体的转录辅激活蛋白参与招募SWI/SNF复合体至增强子和启动子区以实 现局部染色质重建(综述NSSrAM等人,(2001)Annu RevBiochem 70:475-501)。局部染 色质结构中的改变调节转录激活。更精确地,提出了 SYT与植物SWI/SNF复合体相互作用 以影响 GRF 靴基因的转录激活(Kim HJ, Kende H(2004) Proc Nat Acad Sc 101 13374-9) SYT属于拟南芥中具有3个成员的基因家族。SYT多肽与人SYT共有同源性。已 显示人SYT多肽是转录辅激活蛋白(Thaete等人,(1999) HumMolec Genet 8 :585_591)。哺 乳动物SYT多肽以3个结构域为特征(i)在哺乳动物、植物、线虫和鱼中保守的氨基端SNH(SYT氨基端同源性)结构 域;(ii)主要由以可变间隔出现的甘氨酸、脯氨酸、谷氨酰胺和酪氨酸组成的羧基端 QPGY丰富结构域;(iii)位于前两个结构域之间的甲硫氨酸丰富(Met丰富)结构域。在植物SYT多肽中,SNH结构域是很保守的。羧基端结构域富含甘氨酸和谷氨酰 胺,但不富含脯氨酸或酪氨酸。因而与哺乳动物QPGY结构域相反,将它命名为QG丰富结构 域。如与哺乳动物SYT那样,可以鉴定QG结构域氨基端的Met丰富结构域。QG丰富结构域 可以视为(扣除SHN结构域的)多肽的基本上羧基端剩余物;Met丰富结构域通常包含于 QG丰富(从氨基端至羧基端)的前半部分内。第二个Met丰富结构域可以位于植物SYT多 肽中的SNH结构域之前(见


图1)。据报道丧失SYT功能的突变和SYT表达减少的转基因植物产生具有较少细胞的小 而窄的叶和花瓣(Kim HJ, Kende H(2004)Proc Nat Acad SclOl 13374-9) 拟南芥中AN3的过量表达产生这样的植物,其叶比野生型的叶大20-30 % (Horiguchi 等人,(2005) Plant J 43 :68_78)。在日本专利申请2004-350553中,描述了通过控制AN3基因表达在水平方向上控 制叶尺寸的方法。出人意料地,现在已经发现增加植物中(i)编码生长调节因子(GRF)多肽的核酸 序列和(ii)编码滑膜肉瘤易位(SYT)多肽的核酸序列的表达产生相对于具有⑴编码GRF 多肽的核酸序列或(ii)编码SYT多肽的核酸序列之一表达增加的植物具有提高的产量相 关性状的植物。根据一个实施方案,提供用于通过增加植物中以下核酸序列的表达而提高 多种植物产量相关性状的方法(i)编码生长调节因子(GRF)多肽的核酸序列和(ii)编码 滑膜肉瘤易位(SYT)多肽的核酸序列,其中所述的产量相关性状相对于具有⑴编码GRF多肽的核酸序列或(ii)编码SYT多肽的核酸序列之一表达增加的植物提高。提高的产量 相关性状包含以下一项或多项提高的早期生长势、提高的地上部分生物量、提高的每株植 物总种子产量、提高的种子充实率、提高的(充实)种子数、提高的收获指数或提高的千粒 核重(TKW)。定义多肽/蛋白质术语“多肽”和“蛋白质”在本文中可相互交换地使用并且指由肽键连接起来的任 意长度聚合物形式的氨基酸。多核苷酸/核酸/核酸序列/核苷酸序列术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”在本文中可相互交换地使用 并且指任意长度的聚合非分支形式的核苷酸,即核糖核苷酸或脱氧核糖核苷酸或这二者的 组合。对照植物选择合适的对照植物是实验设计的例行部分并且可以包括相应的野生型植物或 无目的基因的相应植物。对照植物一般是相同的植物物种或甚至是与待评估植物相同的品 种。对照植物也可以是待评估植物的失效合子。如本文中所用的“对照植物”不仅指完整 植物,也指植物部分,包括种子和种子部分。同源物蛋白质的“同源物”包括这样的肽、寡肽、多肽、蛋白质和酶,它们相对于非修饰的 所讨论蛋白质具有氨基酸替换、缺失和/或插入并且与衍生它们的非修饰蛋白质具有相似 的生物学活性和功能活性。缺失指从蛋白质中移除一个或多个氨基酸。插入指一个或多个氨基酸残基被导入蛋白质中的预定位点。插入可以包含氨基端 融合和/或羧基端融合以及序列内插入单个或多个氨基酸。通常,在氨基酸序列内部的插 入物比氨基端融合物或羧基端融合物小约1至10个残基级别。氨基端或羧基端融合蛋白 或融合肽的例子包括如酵母双杂交系统中所用的转录激活物的结合结构域或激活结构域、 噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶-标签、蛋白A、麦芽糖结合蛋白、 二氢叶酸还原酶、Tag 100表位、c-myc表位、FLAG "表位、lacZ, CMP (钙调蛋白结合 肽)、HA表位、蛋白C表位和VSV表位。替换指以具有相似特性(如相似的疏水性、亲水性、抗原性、形成或破坏a -螺旋 结构或折叠结构的倾向性)的其他氨基酸替代蛋白质的氨基酸。氨基酸替换一般是单 个残基的,但是根据给予多肽的功能性约束条件,可以是簇集的;插入通常是约1至10个 氨基酸残基级别。氨基酸替换优选地是保守性氨基酸替换。保守性替换表是本领域熟知的 (见例如 Creighton (1984) Proteins, ff. H. Freeman and Company (编著)禾口下表 1)。表1 保守性氨基酸替换的例子
10 氨基酸替换、缺失和/或插入可以使用本领域熟知的肽合成技术如固相肽合成法 等或通过重组DNA操作轻易地进行。用于操作DNA序列以产生蛋白质的替换、插入或缺 失变体的方法是本领域熟知的。例如,用于在DNA的预定位点处产生替换突变的技术是 本领域技术人员熟知的并且包括M13诱变法、T7-Gen体外诱变法(USB,Cleveland, OH)、 QuickChange位点定向诱变法(Stratagene,San Diego, CA)、PCR介导的位点定向诱变或其 他位点定向诱变法。衍生物“衍生物”包括这样的肽、寡肽、多肽,其中与天然存在形式蛋白质(如目的蛋白) 的氨基酸序列相比较,它们包含非天然存在氨基酸残基对氨基酸的替换或非天然存在氨基 酸残基的添加。蛋白质的“衍生物”也包括这样的肽、寡肽、多肽,其中与所述多肽的天然存 在形式的氨基酸序列相比,它们包含天然存在的改变(糖基化、酰化、异戊二烯化、磷酸化、 肉豆蔻酰化、硫酸化等)的氨基酸残基或非天然存在的改变的氨基酸残基。与衍生出衍生 物的氨基酸序列相比较,该衍生物可以也包含与所述氨基酸序列共价或非共价结合的一个 或多个非氨基酸取代基或添加物(例如报道分子或其他配体),如所结合旨在促进检测该 衍生物的报道分子,和相对于天然存在蛋白质的氨基酸序列而言,包含非天然存在的氨基 酸残基。直向同源物/旁系同源物直向同源物和旁系同源物包括用来描述基因祖先关系的进化概念。旁系同源物是 相同物种内因祖先基因复制而起源的基因;直向同源物是来自不同生物的因物种形成而起 源的基因,并且也衍生于共同的祖先基因。
结构域术语“结构域”指在进化相关性蛋白质的序列比对结果上的特定位置处保守的一 组氨基酸。尽管在其他位置处的氨基酸可以在同源物之间不同,然而在特定位置处高度保 守的氨基酸指示在蛋白质结构、稳定性或功能方面很可能是必需的氨基酸。结构域因其在 蛋白质同源物家族的比对序列中高程度保守而鉴定,故它们可以用作鉴定物来确定所讨论 的任意多肽是否属于先前已鉴定的多肽家族。基序/共有序列/标签术语“基序”或“共有序列,,或“标签”指在进化相关蛋白质的序列中的短保守区 域。基序往往是结构域的高度保守部分,但是也可以仅包括该结构域的部分,或可以位于保 守结构域之外(若该基序的全部氨基酸位于定义的结构域之外)。杂交如本文中所定义的术语“杂交”是其中基本上同源的互补核苷酸序列相互复性的 过程。杂交过程可以完全在溶液中进行,即两种互补性核酸分子均处在溶液中。杂交过程 也可以用固定至基质如磁珠、琼脂糖凝胶(S印harose)珠或任何其他树脂的互补性核酸分 子之一进行。杂交过程也可以用固定至固体支持物如硝酸纤维素膜或尼龙膜上或通过例如 照相平版印刷术固定至例如硅玻璃支持物(后者称作核酸序列阵列或微阵列或称作核酸 序列芯片)的互补性核酸分子之一进行。为使杂交发生,核酸分子通常被热变性或化学变 性,以将双链解链成两条单链和/或去除来自单链核酸分子的发夹或其他二级结构。术语“严格性”指杂交发生的条件。杂交的严格性受诸条件如温度、盐浓度、离子 强度和杂交缓冲液组成的影响。通常,将低严格条件选择成在定义的离子强度和PH处,低 于特定序列的热解链温度(TJ约30°C。中等严格条件是当所述温度在Tm以下20°C时,并 且高严格条件是当所述温度在Tm以下10°C时。高严格杂交条件一般用于分离与靶核酸序 列具有高序列相似性的杂交序列。然而,核酸序列可以在序列上偏离且依旧编码基本上相 同的多肽,原因是遗传密码的简并性。因而,有时候可能需要中等严格杂交条件以鉴定此类 核酸分子序列。1 是在定义的离子强度和pH处的下述温度,其中50%的靶序列在所述温度与完 全匹配的探针杂交。取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在更 高温度上特异性杂交。最大杂交速率从低于Tm约16°C直至32°C获得。杂交溶液中一价阳 离子的存在降低了两条核酸分子链之间的静电排斥作用,因而促进杂交体形成;这种作用 对于直到0. 4M的钠浓度是显而易见的(对于更高的浓度而言,可以忽略这种作用)。甲酰 胺降低DNA-DNA和DNA-RNA双链体的解链温度,每百分数的甲酰胺降低0. 6至0. 7°C,且添 加50%甲酰胺允许在30至45°C杂交,尽管杂交速率会降低。碱基对错配降低杂交速率和 双链体的热稳定性。平均且对于大的探针而言,Tm下降约rc/每^碱基错配。根据杂交 体的类型,1可以使用以下等式计算1)DNA-DNA 杂交体(Meinkoth 和 ffahl, Anal. Biochem.,138 :267_284,1984)Tm = 81. 5°C +16. 6Xlog10[Na+]a+0. 41X % [G/Cb]-500 X LT1-。. 61X % 甲酰胺2) DNA-RNA 杂交体或 RNA-RNA 杂交体Tm = 79. 8+18. 5 (log10 [Na+]a) +0. 58(% G/Cb)+ll. 8(% G/Cb) 2_820/Lc3)寡DNA杂交体或寡RNAd杂交体
对少于20个核苷酸而言Tm = 2 (ln)对20-35 个核苷酸而言Tm = 22+1. 46 (ln)a或者用于其他一价阳离子,但是仅在0. 01-0. 4M范围内是精确的。b仅对30 % -75 %范围内的% GC是精确的。CL =双链体的碱基对长度。d01igo,寡核苷酸;ln,=引物的有效长度=2X (G/C数)+ (A/T数)。可以使用许多已知技术中任意一种技术控制非特异性结合,例如将膜以含有蛋白 质的溶液封闭、添加异源RNA、异源DNA和SDS至杂交缓冲液,并且用RNA酶处理。对于非 同源性探针,可以通过变换以下条件之一 (i)渐进地降低复性温度(例如从68°C至42°C) 或(ii)渐进地降低甲酰胺浓度(例如从50%至0%)进行一系列杂交。技术人员了解可 以在杂交期间变更并且会维持或改变所述严格条件的多个参数。除了杂交条件之外,杂交特异性一般还取决于杂交后洗液的功能。为除去因非特 异性杂交引起的背景,用稀释的盐溶液洗涤样品。此类洗液的关键因素包括最终洗涤溶液 的离子强度和温度盐浓度越低且洗涤温度越高,则洗涤的严格性越高。洗涤条件一般在 杂交严格性上或低于所述杂交严格性进行。阳性杂交产生至少两倍于背景信号的信号。通 常,用于核酸序列杂交测定法或基因扩增检测方法的适宜严格条件如上所述。也可以选择 严格性更高或更低的条件。技术人员了解可以在洗涤期间变更并且会维持或改变所述严格 条件的多个参数。例如,用于长度大于50个核苷酸的DNA杂交体的典型高严格杂交条件包括在65°C 于1XSSC中或在42°C于1XSSC和50%甲酰胺中杂交,随后在65°C于0. 3XSSC中洗涤。 用于长度大于50个核苷酸的DNA杂交体的中等严格杂交条件的例子包括在50°C于4X SSC 或在40°C于6XSSC和50%甲酰胺中杂交,随后在50°C于2XSSC中洗涤。杂交体的长度是 杂交核酸的预期长度。当序列已知的核酸分子杂交时,可以通过比对序列并鉴定本文中所 述的保守区而确定杂交体长度。1\33(是0. 15M NaCl和15mM柠檬酸钠;杂交溶液和洗涤 溶液可以额外地包括5XDenhardt试剂、0. 5-1. 0% SDS、100 y g/ml变性的片段化鲑精DNA、 0.5%焦磷酸钠。出于定义严格性水平的目的,可以参考Sambrook等(2001)MolecularCloning :a laboratory manual,第三版 Co Id Spring Harbor LaboratoryPress, CSH, New York 或参考 Current Protocols in Molecular Biology, John Wiley & Sons,N. Y. (1989 禾口年度更新 版)。剪接变体如本文中所用的术语“剪接变体”包括其中已经切除、替换、置换或添加所选内含 子和/或外显子或其中已经缩短或加长内含子的核酸序列的变体。此类变体将是基本上保 留蛋白质的生物学活性的一类变体;这可以通过选择性保留蛋白质的功能片段实现。此类 剪接变体可以在自然界中找到或可以人工制备。用于预测和分离此类剪接变体的方法是本 领域熟知的(见例如 Foissac 和 Schiex(2005)BMC Bioinformatics. 6 25)。等位变体等位基因或等位变体是给定基因位于相同染色体位置处的备选形式。等位变体包 含单核苷酸多态性(SNP)和小的插入/缺失多态性(INDEL)。INDEL的大小通常小于100bp。SNP和INDEL形成大部分生物的天然存在多态性株系中的序列变体的最大集合。基因改组/定向进化基因改组或定向进化由反复DNA改组,随后适当筛选和/或选择以产生编码具 有改良生物学活性的蛋白质的核酸序列或其部分的变体而组成(Castle等人,(2004) Science 304(5674) :1151_4 ;美国专利 5,811,238 和 6,395,547)。调节元件/调控序列/启动子术语“调节元件”、“调控序列”和“启动子”均在本文中可相互交换地使用并且在广 泛含义上意指能够实现与它们相连接的序列表达的调节性核酸序列。术语“启动子” 一般 指位于基因转录起点上游并参与识别和结合RNA聚合酶和其他蛋白质,因而指导有效连接 的核酸转录的核酸序列调控序列。前述术语包括从经典真核基因组基因(包括对于精确转 录启动所需的TATA框,具有或没有CCAAT框序列)衍生的转录调节序列和应答发育性刺激 和/或外部刺激或以组织特异性方式而改变基因表达的其它调节元件(即上游激活序列、 增强子(increaser)和沉默子)。本术语还包括经典原核基因的转录调节序列,在此情况下 它可以包括一个-35框序列和/或一个-10框转录调节序列。术语“调节元件”也包含赋 予、激活或增加核酸分子序列在细胞、组织或器官中表达的人工融合分子或衍生物。“植物启动子”包含介导植物细胞中编码序列节段表达的调节元件。“植物启动子” 优选地源于植物细胞,例如来自用在本发明方法中待表达并在本文中描述的核酸序列转化 的植物。这也适用于其他“植物”调节信号,如“植物”终止子。在本发明方法中有用的核 苷酸序列上游的启动子可以通过一个或多个核苷酸替换、插入和/或缺失进行修饰,但不 影响启动子、可读框(0RF)或3’调节区如终止子或远离0RF存在的其他3’调节区的功能 性或活性。还有可能所述启动子的活性因修饰其序列或它们被更活跃的启动子、甚至来自 异源生物的启动子彻底替换而提高。为了在植物中表达,如上所述,核酸序列分子必须有效 地连接至或包含在正确的时间点并以所需空间表达模式表达基因的合适启动子。为鉴定功能性等同启动子,候选启动子的启动子强度和/或表达模式可以例如通 过将此启动子有效连接至报道基因并分析该报道基因在植物的多种组织中的表达水平和 模式进行分析。合适的熟知报道基因包括例如葡糖醛酸酶或半乳糖苷酶。启动子 活性通过测量葡糖醛酸酶或半乳糖苷酶的酶活性进行分析。启动子强度和/或表 达模式可以随后与参考启动子(如在本发明方法中使用的一种启动子)的启动子强度和/ 或表达模式比较。备选地,启动子强度可以使用本领域已知方法如RNA印迹法及放射自显 影图的密度计分析法、定量实时PCR或RT-PCR(Heid等,1996 GenomeMethods 6 :986_994), 通过量化mRNA水平或通过将本发明方法中所用核酸序列的mRNA水平与持家基因(如18S rRNA)的mRNA水平比较进行分析。通常“弱启动子”意指驱动编码序列在低水平表达的启动 子。“低水平”意指在每个细胞约1/10,000转录物至约1/100,000转录物、至约1/500,0000 转录物的水平上。相反,“强启动子”驱动编码序列在高水平、或以每个细胞约1/10转录物 至约1/100转录物、至约1/1000转录物表达。通常,“中等强度启动子”意指驱动编码序列 在一切情况下以低于受35S CaMV启动子控制时所获得水平的水平表达的启动子。有效地连接如本文中所用的术语“有效地连接”指启动子序列与目的基因之间的功能连接,从 而该启动子序列能够启动该目的基因转录。
组成型启动子“组成型启动子”指在生长和发育的大部分期间但不是必需在全部期间,以及在大 多数环境条件下,在至少一种细胞、组织或器官中有转录活性的启动子。下表2a给出组成 型启动子的例子。表2a 植物组成型启动子的例子 遍在启动子遍在启动子是在生物的全部组织或细胞中基本上有活性的。发育调节型启动子发育调节型启动子在某些发育阶段期间或在经历发育变化的植物的部分中有活 性。诱导型启动子诱导型启动子在应答化学刺激(综述见Gatz 1997,Annu. Rev. PlantPhysiol. Plant Mol.Biol. ,48 :89_108)、环境刺激或物理刺激时具有诱导或提高的转录启动作用, 或可以是“胁迫诱导的”,即当植物暴露于多种胁迫条件时其激活,或是“病原体诱导的”,即 当植物暴露于多种病原体时其激活。器官特异性/组织特异性启动子器官特异性或组织特异性启动子是能够偏好地启动某些器官或组织如叶、根、种 子组织等中转录的启动子。例如,“根特异性启动子”是这样的启动子,该启动子优势地在植 物根中具有转录活性,基本上在植物的任何其他部分中无活性,尽管在该植物的这些其他 部分中仍允许任意泄露表达。能够仅在某些细胞中启动转录的启动子在本文中称作“细胞 特异性的”。根特异性启动子的例子列于下表2b中。表2b 根特异性启动子的例子 种子特异性启动子是能够在种子组织中优势地具有转录活性的启动子,但无需排 他性地在种子组织中有转录活性(在泄露表达的情况下)。种子特异性启动子可以在种子 发育期间和/或萌发期间有活性。种子特异性启动子的例子示于下表2c中。种子特异性 启动子的其他例子在 Qing Qu和 Takaiwa(Plant Biotechnol. J. 2,113—125,2004)中给出, 所述文献的公开内容如完整所述那样通过引用方式并入本文。表2c 种子特异性启动子的例子如本文中所定义的绿色组织特异性启动子是优势地在绿色组织中具有转录活性 的启动子,在植物的任何其它部分内基本上无活性,尽管在该植物的这些其他部分中仍允 许任意泄露表达。可以用来实施本发明方法的绿色组织特异性启动子的例子示于下表2d中。表2d 绿色组织特异性启动子的例子 组织特异性启动子的另一个例子是分生组织特异性启动子,其优势地在分生组织 中具有转录活性,在植物的任何其它部分内基本上无活性,尽管在该植物的这些其他部分 中仍允许任意泄露表达。可以用来实施本发明方法的分生组织特异性启动子的例子示于下 表2e中。表2e 分生组织特异性启动子的例子 终止子术语“终止子”包括作为转录单元末端处DNA序列的调控序列,所述的DNA序列产 生初级转录物的3’加工和多腺苷酸化及转录终止的信号。终止子可以从天然基因、从多种 其他植物基因或从T-DNA衍生。待添加的终止子可以从例如胭脂碱合酶或章鱼碱合酶基因 或备选地从另一种植物基因或较次优选地从任何其他真核基因衍生。调节就表达或基因表达而言,术语“调节”意指这样的过程,其中与对照植物相比,表达 水平因该基因表达而改变,优选地所述表达水平提高。原始、未调节的表达可以是结构性 RNA(rRNA.tRNA)或mRNA的任何类型的表达,随后是翻译。术语“调节活性”应当意指本发 明核酸序列或所编码蛋白质的表达的任何改变,这引起植物产量提高和/或生长增加。
增加的表达/过量表达如本文中所用的术语“增加的表达”或“过量表达”意指相对于原有野生型表达水 平为额外的任何形式的表达。在本领域内充分报道了用于提高基因或基因产物表达的方法并且这些方法包括 例如由适宜启动子驱动的过量表达、使用转录增强子或翻译增强子。充当启动子或增强子 元件的分离核酸序列可以导入多核苷酸的非异源形式的适宜位置(一般在上游)中,从而 上调编码目的多肽的核酸序列表达。例如,内源性启动子可以在体内通过突变、缺失和/或 替换加以改变(见Kmiec,US 5,565,350 ;Zarling等,W09322443),或可以将分离的启动子 以相对于本发明基因的恰当方向及距离导入植物细胞,从而控制该基因的表达。若需要多肽表达,通常希望的是在多核苷酸编码区的3’末端处包括多腺苷化区 域。该多腺苷酸化区域可以从天然基因、从多种其他植物基因或从T-DNA衍生。待添加的 3’末端序列可以从例如胭脂碱合酶或章鱼碱合酶基因或备选地从另一种植物基因或较不 优选地从任何其他真核基因衍生。内含子序列也可以添加至5’非翻译区(UTR)或部分编码序列的编码序列以提 高细胞质中聚集的成熟信使的量。已经显示在植物和动物表达构建体的转录单位中包 含可剪接内含子提高了 mRNA水平及蛋白质水平上的基因表达高达1000倍(Buchman和 Berg(1988)Mol. Cell biol. 8 :4395_4405 ;Callis等(1987)Gens Dev 1 :1183_1200)。此种 内含子增强基因表达的作用一般在所述内含子置于转录单位的5’末端附近时最强烈。玉米 内含子Adhl-S内含子1、2和6、Bronze-1内含子的用途是本领域已知的。对于总体信息, 见《玉米手册》,第 116 章,编者 Freeling 和 Walbot,Springer,N.Y. (1994)。内源基因本文中对“内源”基因的称谓不仅仅指如植物中以其天然形式(即没有人类任何 干预)存在的所讨论基因,还指处于分离形式下的随后(再)导入植物(转基因)的相同 基因(或基本上同源的核酸/基因)。例如,含有这种转基因的转基因植物可以遭遇转基因 表达的相当大程度地降低和/或内源基因表达的实质降低。降低的表达本文中提及的“降低的表达”或“降低或基本消除表达”意指内源基因表达和/或 多肽水平和/或多肽活性相对于对照植物的下降。与对照植物相比较,所述降低或基本上 消除以增加的优选顺序是至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90% 或 95%、96%、97%、98%、99% 或更多降低。为了降低或基本消除植物中内源基因的表达,需要核酸序列的基本上连续的核苷 酸的足够长度。为进行基因沉默,该长度可以短至20、19、18、17、16、15、14、13、12、11、10个 或更少核苷酸,或者该长度可以长至整个基因(包括部分或完整的5’和/或3’ UTR)。基 本上连续的核苷酸片段可以从编码目的蛋白的核酸序列(靶基因)或从能够编码目的蛋白 的直向同源物、旁系同源物或同源物的任何核酸序列衍生。优选地,基本上连续的核苷酸的 片段能够与靶基因(有义链或反义链)形成氢键,更优选地,基本上连续的核苷酸片段以增 加的优选顺序与靶基因(有义链或反义链)具有50%、60%、70%、80%、85%、90%、95%、 96%、97%、98%、99%、100%的序列同一性。编码(功能性)多肽的核酸序列不是本文中 所讨论用于降低或基本消除内源基因表达的多种方法的前提。
可以使用常规工具和技术完成表达的这种降低或基本消除。用于降低或基本消除内源基因表达的方法是使用核酸序列或其部分(在此情况下,所述部分是从目的基因衍 生或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸序列中衍生的一 段基本上连续的核苷酸)的反向重复序列(其优选能够形成发夹结构)进行RNA介导的 沉默。RNA沉默方法的另一个例子包括将核酸序列或其部分(在此情况下是从目的基因 或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸序列中衍生的一 段基本上连续的核苷酸)以有义方向导入植物。RNA沉默方法的另一个例子包括使用反 义核酸序列。基因沉默也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过如 Angell 和 Baulcombe((1999)Plant J. 20(3) :357_62)、(AmpIicon VIGS WO 98/36083)或 Baulcombe (WO 99/15682)及其他人描述的策略实现。技术人员熟知其他方法,如使用针 对内源性多肽的抗体以抑制该多肽在植物中的功能,或干扰某多肽参与其中的信号传导途 径。人工和/或天然的微RNA(miRNA)可以用来敲除基因表达和/或mRNA翻译。内源性 miRNA是通常19-24个核苷酸长的单链小RNA。可以专门地遗传工程化一般长度21个核 苷酸的人工微RNA(amiRNA)以负向调节单个或多个目的基因的基因表达。选择植物的微 RNA靶的决定因素是本领域熟知的。已经定义了用于靶识别的经验参数并且可以使用它们 辅助特定amiRNA的设计(Schwab等人,(2005)Dev Cell 8(4) :517_27)。用于设计并产生 amiRNA及其前体的便利工具也是公众可获得的(Schwab等人,(2006)Plant Cel 18(5) 1121-33)。为了最佳性能,用于降低植物中内源基因表达的基因沉默技术需要使用来自单子 叶植物的核酸序列转化单子叶植物,并使用来自双子叶植物的核酸序列转化双子叶植物。 优选地,将源自任何给定植物物种的核酸序列导入相同的物种。例如,将源自稻的核酸序列 转化至稻植物中。然而,并非绝对要求待导入的核酸序列源自与待导入该核酸序列的植物 相同的植物物种。只要内源性靶基因与待导入的核酸序列之间存在实质同源性即可。上文描述用于降低或基本上消除植物中内源基因表达的多种方法的例子。例如, 本领域技术人员会轻易地能够调整用于沉默的前述方法,从而通过利用合适启动子实现在 完整植物中或其部分中降低内源基因的表达。选择标记(基因)/报道基因“选择标记”、“选择标记基因”或“报道基因”包括向细胞赋予表型的任意基因,其 中在所述细胞中表达所述“选择标记”、“选择标记基因”或“报道基因”以促进鉴定和/或选 择用本发明核酸序列构建体转染或转化的细胞。这些标记基因能够借助一系列不同原理而 鉴定核酸序列分子的成功转移。合适的标记可以选自赋予抗生素抗性或除草剂抗性、导入 新代谢性状或允许目视选择的标记。选择标记基因的例子包括赋予抗生素抗性的基因(如 使新霉素和卡那霉素磷酸化的nptll或使潮霉素磷酸化的hpt或赋予针对例如博来霉素、 链霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(Geneticin) (G418)、壮观霉素或 杀稻瘟菌素的抗性的基因)、赋予除草剂抗性的基因(例如提供Basta 抗性的bar ;提供 草甘膦抗性的aroA或gox或赋予针对例如咪唑啉酮、膦丝菌素或磺脲类的抗性的基因)或 提供代谢性状的基因(如允许植物使用甘露糖作为唯一碳源的manA,或利用木糖的木糖异 构酶,或抗营养性标记如2-脱氧葡萄糖抗性)。目视标记基因的表达导致颜色(例如葡 糖醛酸酶、GUS或β -半乳糖苷酶与其有色底物例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧光(绿色荧光蛋白GFP和其衍生物)的形成。这个名单仅代表少数的可能标记。 技术人员熟悉此类标记。取决于生物和选择方法,优选不同的标记。已知当核酸序列稳定或瞬时地整合至植物细胞时,仅少数细胞摄取外来DNA,并且 根据需要,将外来DNA整合至细胞基因组中,这取决于所用的表达载体和所用的转染技术。 为鉴定并选择这些整合体,通常将编码选择标记的基因(如上文所述的基因)连同目的基 因一起导入宿主细胞。这些标记可以在这些基因例如通过常规方法缺失而无功能的突变体 中使用。此外,编码选择标记的核酸序列分子可以在包含编码本发明多肽或在本发明方法 中所用多肽的序列的相同载体上,或在独立的载体上导入宿主细胞。已经用所导入核酸序 列稳定转染的细胞可以例如通过选择作用鉴定(例如具有整合的选择标记的细胞存活而 其他细胞死亡)。因为一旦已经成功地导入所述标记基因、尤其抗生素抗性基因和除草剂抗性基 因,则这些核酸序列是转基因宿主细胞中不再需要或不想要的,因此用于导入核酸序列的 本发明方法有利地使用能够移除或切除这些标记基因的技术。一种这样的方法是所谓共转 化法。共转化法同时使用两种载体以转化,一种载体携带本发明的核酸序列而第二种载体 携带标记基因。大比例的转化体接受或在植物情况下包含(多达40%或更多的转化体) 这两种载体。在用农杆菌(Agrobacterium)转化的情况下,转化体通常仅接受载体的一部 分,即侧翼存在T-DNA的序列,该序列通常代表表达盒。标记基因随后可以通过开展杂交从 转化植物中移除。在另一种方法中,整合至转座子的标记基因与想要的核酸序列一起用于 转化(称作Ac/Ds技术)。转化体可以与转座酶来源物杂交,或转化体用引起转座酶表达 的核酸序列构建体瞬时或稳定转化。在一些情况下(大约10% ),一旦转化已经成功发生, 则转座子从宿主细胞的基因组跳出并丢失。在其他许多情况下,转座子跳到一个不同位置。 在这些情况下,标记基因必须通过开展杂交予以消除。在微生物学中,开发了有可能或促进 检测这类事件的技术。又一种有利方法依赖于所谓重组系统;所述方法的优势在于杂交消 除作用可以用该重组系统实行。最知名的该类型系统称作Cre/lox系统。Crel是移除位 于loxP序列之间序列的重组酶。若所述标记基因整合于loxP序列之间,一旦转化已经成 功发生,则它因重组酶表达而被移除。其他重组系统是HIN/HIX、FLP/FRT和REP/STB系统 (Tribble 等,J. Biol. Chem.,275,2000 :22255_22267 ;Velmurugan 等,J. Cell Biol.,149, 2000:553-566)。位点特异性地整合本发明核酸序列至植物基因组是可能的。自然,这些方 法也可以应用于微生物如酵母、真菌或细菌。转基因的/转基因/重组为本发明的目的,“转基因的”、“转基因”或“重组”例如就核酸序列而言,意指包含 所述核酸序列的表达盒、基因构建体或载体,或用本发明核酸序列、表达盒或载体转化的生 物,这些构建体均通过重组方法产生,其中(a)编码在本发明方法中有用的蛋白质的核酸序列,或(b)与本发明核酸序列有效连接的基因调控序列,例如启动子,或(c)a)和 b)并不位于它们的天然遗传环境中或已经通过重组方法被修饰,所述的修饰有可能 采取例如替换、添加、倒位或插入一个或多个核苷酸残基的形式。天然遗传环境理解为意指 原初植物中的天然基因组位点或染色体位点或存在于基因组文库中。在基因组文库的情况下,优选地保留,至少部分地保留核酸序列的天然遗传环境。该环境分布在所述核酸序列的 至少一侧并且具有至少50bp、优选至少500bp、特别优选至少lOOObp、最优选至少5000bp序 列长度。当通过非天然、合成性(“人工”)方法(例如诱变处理)修饰天然存在表达盒时,该 表达盒-例如所述核酸序列的天然启动子与编码如上文所定义在本发明方法中有用的多 肽的相应核酸序列的天然存在组合-变成转基因表达盒。合适的方法例如在US 5,565,350 或TO 00/15815中描述。为本发明目的,如上所述,将转基因植物因此理解为意指本发明方法中所用诸核 酸序列不处于它们在所述植物基因组中的天然基因座处,从而有可能同源或异源地表达所 述核酸序列。然而,如所提及,转基因还意指尽管本发明的或本发明方法中所用的诸核酸序 列处于它们在植物基因组中的天然位置处,然而相对于天然序列,它们的序列已经被修饰, 和/或所述天然序列的调节序列已经被修饰。转基因优选地理解为意指本发明核酸序列在 基因组中的非天然基因座处表达,即所述核酸序列的同源表达或优选异源表达发生。优选 的转基因植物在本文中提及。转化如本文中提及的术语“导入”或“转化”包括转移外源多核苷酸至宿主细胞中,无论 转化所用的方法是什么。能够后续克隆性增殖(无论通过器官发生或胚发生)的植物组织 可以用本发明的基因构建体转化并且可完整植物以从中再生。所选的具体组织根据可用于 并且最好适于正在进行转化的具体物种的克隆性增殖系统变化。示例性靶组织包括叶盘、 花粉、胚、子叶、下胚轴、大配子体、愈伤组织、现存的分生组织(例如顶端分生组织、腋芽和 根分生组织)和诱导的分生组织(例如子叶分生组织和下胚轴分生组织)。多核苷酸可以 瞬时或稳定地导入宿主细胞并且可以非整合地维持,例如作为质粒。备选地,它可以整合至 宿主基因组中。所得的转化植物细胞随后可以用来以本领域技术人员已知的方式再生出转 化植物。外来基因转移至植物基因组的过程称作转化。植物物种的转化现在是相当常规 的技术。有利地,可以使用几种转化方法中的任何一种方法将目的基因导入合适的祖先细 胞。描述用于转化并从植物组织或植物细胞再生出植物的方法可以用于瞬时转化或稳定 转化。转化方法包括使用脂质体、电穿孔法、增加游离DNA摄入的化学品、DNA直接注射至 植物、粒子枪轰击法、使用病毒或花粉的转化法和微量投射法(microprojection)。转化方 法可以选自用于原生质体的钙/聚乙二醇法(KrenS,F.A.等人,(1982)Nature296,72-74 ; Negrutiu I 等人,(1987)Plant Mol Biol 8:363-373);原生质体的电穿孔法(Shillito R.D.等人,(1985) Bio/Techno 1 3,1099-1102);对植物材料的微量注射法(Crossway A 等 人,(1986)Mol. Gen Genet 202 179-185) ;DNA 或 RNA 包被粒子轰击法(Klein TM 等人, (1987)NatUre327:70)、用(非整合性)病毒感染等。包括转基因作物植物在内的转基因 植物优选通过农杆菌介导的转化法产生。有利的转化方法是植物原位(inplanta)转化法。 为此目的,例如有可能使农杆菌作用于植物种子或有可能用农杆菌接种植物分生组织。根 据本发明,已经证明将转化的农杆菌悬液作用于完整植物或至少作用于花原基是特别有 利的。随后培育该植物直至获得已处理植物的种子(Clough和Bent,Plant J. (1998) 16, 735-743)。用于农杆菌介导稻转化的方法包括用于稻转化的熟知方法,如在以下任意文 献中描述的那些方法欧洲专利申请EP 1198985 Al,Aldemita和Hodges (Planta 199 612-617,1996) ;Chan 等人,(Plant Mol Biol 22(3) :491_506,1993),Hiei 等人,(Plant J 6(2) :271-282,1994),其公开内容如充分所述那样通过引用的方式并入本文。在玉米 转化的情况下,优选的方法如Ishida等人,(Nat. Biotechnol 14(6) =745-50,1996)或 Frame等人,(Plant Physiol 129 (1) :13_22,2002)描述,其公开内容如充分所述那样 通过引用的方式并入本文。所述方法还例如由B.Jenes等,Techniques forGene,在 Transgenic Plants,第 1 卷,Engineering and Utilization,编者 S. D. Kung 禾口 R. Wu, Academic Press (1993) 128-143 Potrykus Annu. Rev. Plant Physiol. Plant Molee. Biol. 42 (1991) 205-225)中描述。待表达的核酸序列或构建体优选地克隆至适于转化根 癌农杆菌(Agrobacteriumtumefaciens)的载体,例如 pBinl9 (Bevan 等人,Nucl. Acids Res. 12(1984)8711)。被这种载体转化的农杆菌随后可以按照已知方式用于转化植物,例 如作为模型使用的植物如拟南芥属植物(拟南芥在本发明范围不视为作物植物),或作物 植物,例如烟草植物,所述方式例如是通过在农杆菌溶液中浸泡擦伤的叶或切碎的叶并随 后在合适培养基中培育它们。借助根癌农杆菌转化植物例如由H6fgen和Willmitzer在 Nucl. Acid Res. (1988) 16,9877中描述或尤其从F. F. White,用于高等植物中基因转移的 载体(Vectors forGene Transfer in Higher Plants);在 Transgenic Plants,第 1 卷, Engineering and Utilization, S. D. Kung 禾口 R. Wu 编著,Academic Press, 1993,第 15-38 页中获知。 除了转化随后必需再生成完整植物的体细胞之外,也可以转化植物分生组织的 细胞,并且尤其那些发育成配子的细胞。在这种情况下,转化的配子遵循天然的植物发育 过程,从而产生转基因植物。因此,例如用农杆菌处理拟南芥属植物的种子并且从正在发 育的植物获得种子,其中一定比例的所述植物被转化并且因此是转基因的[Feldman,KA 和 MarksMD(1987)Mol Gen Genet 208 274-289 ;Feldmann K (1992),在编者 CKoncz,N_H Chua 禾口 J Shell, Methods in Arabidopsis Research. WordScientific, Singapore,第 274-289页]。备选方法基于反复移除花序并将莲座丛中心内的切除部位与转化的农杆菌 温育,因而同样可以在较晚的时间点获得转化的种子(Chang(1994)Plant J. 5 :551_558 ; Katavic(1994)MolGen Genet, 245 =363-370) 然而,特别有效的方法是改良真空渗入法, 如“浸花”法。在拟南芥属植物真空浸润法的情况下,用农杆菌悬液处理在降低压力下 的完整植物[Bechthold,N(1993). C R Acad Sci Paris Life Sci,316 :1194_1199],而 在“浸花法”的情况下,将正在发育的花组织与表面活性剂处理过的农杆菌悬液短暂温育 [Clough,SJ 和 Bent,AF (1998) The Plant J. 16,735-743]。在这两种情况下均收获某个 比例的转基因种子,并且这些种子可以通过在如上所述的选择条件下培育与非转基因种子 区分。此外,质体的稳定转化是有利的,因为质体在大部分作物中以母系方式遗传,这降低 或消除了借助花粉的转基因流动风险。叶绿体基因组的转化一般通过已经在Klaus等人, 2004[Nature Biotechnology 22 (2),225-229]中示意性展示的方法实现。简而言之,将待 转化的序列连同选择标记基因一起克隆至同源于叶绿体基因组的侧翼序列之间。这些同源 侧翼序列指导向原质体的位点特异性整合。已经对许多不同的植物物种描述质体转化过 程并且在Bock (2001)基础研究和植物生物技术中的转基因质体(Transgenic plastidsin basic research and plant biotechnology). J Mol Biol. 2001 年月 21 日;312 (3) :425_38 或 Maliga, P(2003)质体转化技术商业化进展(Progresstowards commercialization ofplastid transformation technology), TrendsBiotechnol. 21, 20-28 中给出综述。其他 的生物技术进展最近已经以无标记质体转化体的形式报道,其中可以通过瞬时共整合的 标记基因产生所述无标记质体转化体(Klaus等人,2004,Nature Biotechnology 22(2), 225-229)。T-DNA 活化标签技术(T-DNA activation tagging)T-DNA活化标签技术(Hayashi等人,Science (1992) 1350-1353)涉及以如此方式在目的基因的基因组区域内或基因编码区的上游或下游IOkb处插入通常含有启动子(也 可以是翻译增强子或内含子)的T-DNA,从而该启动子指导目标基因的表达。一般,目标基 因的天然启动子对该基因表达的调节作用被破坏,并且该基因受新导入的启动子控制。该 启动子一般嵌入T-DNA中。这种T-DNA随机地插入植物基因组,例如借助农杆菌感染,并且 引起所插入T-DNA附近的基因受调节的表达。所得的转基因植物表现显性表型,原因在于 所导入启动子附近的基因受修饰的表达。TILLING术语“TILLING”是“基因组中定向诱导局部损伤法”的缩写并且指用于产生和/ 或鉴定核酸序列的诱变技术,其中所述核酸序列编码具有改良表达和/或活性的蛋白质。 TILLING还允许选择携带此类突变变体的植物。这些突变变体可以表现在强度或在位置 或在时间方面改良的表达(例如,如果所述突变影响启动子)。这些突变变体可以显示比 其天然形式基因所表现活性更高的活性。TILLING联合了高密度诱变法与高通量筛选法。 TILLING 中一般所遵循的步骤是(a) EMS 诱变(Redei GP 和 Koncz C (1992)在 Methods in Arabidopsis Research, Koncz C, Chua NH, Schell J, Singapore 编辑,World Scientific Publishing Co,第 16-82 页;Feldmann 等,(1994)在 Meyerowitz EM, Somerville CR编辑, Arabidopsis. ColdSpring Harbor Laboratory Press,Cold Spring Harbor,NY,% 137-172
;Lightner 禾口 Caspar T(1998) ^ J Martinez-Zapater, J Salinas ^m^, Methods on Molecular Biology 第 82 卷· Humana Press, Totowa, NJ,第 91-104 页);(b)制备和汇集 个体DNA ; (c)PCR扩增目的区域;(d)变性和复性以导致异双链体形成;(e)DHPLC,其中汇 集物中异双链体的存在被检测为色谱图中的一个额外峰;(f)鉴定突变个体;和(g)将突变 PCR产物测序。用于TILLING的方法是本领域熟知的(McCallum等,(2000) NatBiotechnol 18 :455-457 ;综述见 Stemple (2004) Nat Rev Genet 5(2) 145-50)。同源重组同源重组允许在基因组中限定的所选位置处导入所选核酸序列。同源重组是生物 科学中常规用于低等生物如酵母或小立碗藓属(Physcomitrella)苔藓的标准技术。已经 对模式植物(Offringa等人,(1990)EMBO J 9(10) :3077_84)和作物植物例如稻(Terada等 A, (2002)Nat Biotech 20(10) :1030_4 ;Iida和Terada(2004)Curr Opin Biotech 15(2) 132-8)描述了用于植物中开展同源重组的方法。产量术语“产量”通常意指经济价值的可测量结果,一般与指定作物、与面积并且与时 间间隔有关。单个植物部分基于它们的数目、大小和/或重量而直接有助于产量,或实际产 量是相对于某作物和年份的每英亩产量,这通过总产量(包括收获的和评估的产量)除以 播种的英亩数确定。术语植物的“产量”可以涉及该植物的营养生物量和/或涉及繁殖器官和/或涉及繁殖体(如种子)。早期生长势“早期生长势”指活跃、健康、充分平衡的生长,尤其是植物生长早期期间,并且可 以因提高的植物适应性所致,其中所述提高的植物适的原因是例如该植物更好地适应环境 (即优化能量源的用途和在苗与根之间的分配)。具有早期生长势的植物也显示提高的籽 苗存活和更佳的作物建立,这往往产生高度均一的田块(作物以均一方式生长,即大多数 植物在基本上相同的时间达到各个发育期)和往往形成更好且更高的产量。因而,早期生 长势可以通过测量多种因素如千粒核重(Thousand Kernel Weight)、萌发百分数、出苗百 分数、籽苗生长、籽苗高度、根长度、根和苗生物量和许多其他因素等确定。提高/改善/增强术语“提高”、“改善”或“增强”是相互可交换的并且在应用含义上应当意指与如 本文中定义的对照植物相比较,至少5%、6%、7%、8%、9%或10%、优选至少15%或20%、 更优选地25 %、30 %、35 %或40 %更多的产量和/或生长。种子产量提高的种子产量自身可以表现为以下一个或多个指标a)种子生物量(种子总重 量)增加,这可以基于单粒种子基础和/或每株植物和/或每公顷或每英亩;b)提高的每 穗和/或每株植物花数目;c)提高的(充实)种子数;d)提高的种子充实率(其表述为充 实种子数与种子总数之间的比率);e)提高的收获指数,其表述为可收获部分(如种子)产 量与总生物量的比率;f)提高的初生穗数;(g)提高的千粒核重(TKW),这从计数的充实种 子数及它们的总重量外推出来。提高的TKW可以因增加的种子尺寸和/或种子重量引起, 并且也可以因胚尺寸和/或胚乳尺寸增加引起。种子产量的提高也可以表现为种子尺寸和/或种子体积的增加。此外,产量提高 也可以本身表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的提高。提高 的种子产量也可以产生改良的构造,或可以因改良的构造而出现。绿度指数从植物的数字图像计算如本文中所用的“绿度指数”。对属于图像上植物目标的每 个像素计算绿色值与红色值的比率(在编码颜色的RGB模式中)。绿度指数表述为绿色/ 红色比超过给定阈值的像素百分数。在正常生长条件下,在盐胁迫生长条件下和在养分有 效性降低的生长条件下,植物的绿度指数在开花前的最后成像中测量。相反,在干旱胁迫生 长条件下,植物的绿度指数在干旱后的首次成像中测量。植物本文中所用的术语“植物”包括完整植物、植物的祖先及子代和包括种子、苗、茎、 叶、根(包括块茎)、花和组织、器官在内的植物部分,其中每种前述对象包含目的基因/核 酸序列。术语“植物”也包括植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢 子体、花粉和小孢子,同样其中每种前述对象包含目的基因/核酸序列。在本发明方法中特别有用的植物包括属于植物界(Viridiplantae)超家族、尤其 单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌 木,其中所述植物选自包含以下物种的名单槭树属某些物种(Acer spp.)、猕猴桃属某些 物种(Actinidia spp.)、秋葵属某些物种(Abelmoschus spp.)、剑麻(Agave sisalana)、冰草属某些物种(Agropyron spp.)、匍匐剪股颖(Agrostis stolonifera)、葱属某些物 禾中(Alliumspp.)(Amaranthus spp.)(Ammophila arenaria) >
凤梨(Ananas comosus)、番荡枝属某些物禾中(Annona spp.)、旱序(Apiumgraveolens)、 蜘蛛兰属某些物种(Arachis spp.)、木波罗属某些物种(Artocarpus spp.)、石刁柏 (Asparagus officinalis)、燕麦属某些物种(Avenaspp.)(例如燕麦(Avena sativa)、 野燕麦(Avena fatua)、比赞燕麦(Avenabyzantina)、野燕麦原变禾中(Avena fatua var. sativa)、杂禾中燕麦(Avenahybrida)、阳桃(Averrhoa carambola)、箣竹属(Bambusa sp.)、 冬瓜(Benincasahispida)、巴西栗(Bertholletia excelsea)、甜菜(Beta vulgaris) > 芸苔属某些物种(Brassica spp.)(例如欧洲油菜(Brassica napus)、芜青某些物种 (Brassicarapa ssp.) [若 油胃、油胃禾子油胃(oilseed rape)(turnip rape)])、
Cadaba farinosa> ^ (Camellia sinensis)> ^ A ^ (Canna indica)>(Cannabis
sativa) ^MI^MS ^^ (Capsicum spp. ) > Carex elata>#7K/R (Carica papaya) > 果 fi 虎朿 lj (Carissa macrocarpa)、山核举兆属某些物种(Carya spp.)、红花(Carthamus tinctorius)、栗属某些物种(Castanea spp.)、美洲木棉(Ceiba pentandra)、苦苣 (Cichorium endivia)、t章属某些物禾中(Cinnamomum spp.)、西瓜(Citrullus lanatus) 桔属某些物种(Citrus spp.)、椰子属某些物种(Cocos spp.)、咖啡属某些物种(Coffea spp.)、芋头(Colocasiaesculenta)、非洲梧桐属某些物种(Cola spp.)、黄麻属(Corchorus sp.)、芫荽(Coriandrum sativum)、榛属某些物种(Corylus spp.)、山楂属某些物种 (Crataegus spp.)、番红花(Crocus sativus)、南瓜属某些物种(Cucurbita spp.)、香瓜属 某些物种(Cucumis spp.)、菜蓟属某些物种(Cynara spp.)、胡萝卜(Daucus carota)、山马 蝗属某些物种(Desmodium spp.)、龙眼(Dimocarpuslongan)、薯蓣属某些物种(Dioscorea spp.)、柿树属某些物种(Diospyrosspp.)、稗属某些物种(Echinochloa spp.)、油棕属 (Elaeis)(例如油棕(Elaeisguineensis)、美洲油棕(Elaeis oleifera)、糝子(Eleusine coracana)、蔗茅属某些物种(Erianthus sp.)、枇杷(Eriobotrya japonica)、桉属某些物 禾中(Eucalyptus sp.)、红仔果(Eugenia uniflora)、# 麦属某些物禾中(Fagopyrumspp.) > 水青冈属某些物种(Fagus spp.)、苇状羊茅(Festuca arundinacea)、无花果(Ficus carica)、金桔属某些物种(Fortunella spp.)、草莓属某些物种(Fragaria spp.)、银 杏(Ginkgo biloba)、大豆属某些物种(Glycine spp.)(例如大豆(Glycine max)、大豆 (Soja hispida)或大豆(Soja max)、陆地棉(Gossypiumhirstum)、向日葵属某些物种 (Helianthus spp.)(例如向日葵(Helianthusannuus)、长管萱草(Hemerocallis fulva) > 木槿属某些物禾中(Hibiscus spp.)、大麦属(Hordeum spp.)(例如大麦(Hordeum vulgare)、 甘薯(Ipomoeabatatas)、核桃属某些物种(Juglans spp.)、莴苣(Lactuca sativa)、山黧豆 属某些物禾中(Lathyrus spp.)、兵豆(Lens culinaris)、亚麻(Linum usitatissimum)、H 枝(Litchi chinensis)、百脉根属某些物种(Lotus spp.)、棱角丝瓜(Luffaacutangula)、 羽扇豆属某些物种(Lupinus spp.)、Luzula sylvatica、番茄属某些物种(Lycopersicon spp.)(例如番爺(Lycopersicon esculentum>Lycopersicon lycopersicum>Lycopersicon pyriforme)、硬皮豆属某些物种(Macrotyloma spp.)、苹果属某些物种(Malus spp.)、凹缘 金虎尾(Malpighiaemarginata)、牛油果(Mammea americana)、芒果(Mangifera indica)、 TKWM^^IJft (Manihot spp. ) > A^^ (Manilkara zapota)(Medicagosativa) >草木樨属某些物种(Melilotus spp.)、薄荷属某些物种(Mentha spp.)、芒(Miscanthus sinensis)、苦瓜属某些物种(Momordica spp.)、黑桑(Morusnigra)、芭蕉属某些物种(Musa spp.)、烟草属某些物种(Nicotiana spp.)、木犀榄属某些物种(Olea spp.)、仙人掌属某些 物种(Opuntia spp.)、鸟足豆属某些物种(Ornithopus spp.)、稻属些物种(Oryza spp.) (例如稻(Oryza sativa)、阔叶稻(Oryza latifolia)、稷(Panicum miliaceum)、柳枝稷 (Panicumvirgatum)、_胃胃(Passiflora edulis)(Pastinaca sativa)、各良■胃M
物种(Pennisetum sp.)、鳄梨属某些物种(Persea spp.)、欧序(Petroselinumcrispum)、 薦草(Phalaris arundinacea)、菜豆属某些物种(Phaseolus spp.)、猫尾草(Phleum pratense)、朿lj奏属某些物禾中(Phoenix spp.)、南方声華(Phragmites australis)、酸菜 属某些物种(Physalis spp.)、松属某些物种(Pinusspp.)、阿月浑子(Pistacia vera)、 豌豆属某些物种(Pisum spp.)、早熟禾属某些物种(Poa spp.)、杨属某些物种(Populus spp.)、牧豆草属某些物种(Prosopis spp.)、李属某些物种(Primus spp.)、番石榴属某 些物种(Psidiumspp.)、石榴(Punica granatum)、西洋梨(Pyrus communis)、栎属某些 物禾中(Quercus spp.)、萝卜(Raphanus sativus)、波叶大黄(Rheum rhabarbarum)、茶 薦子属某些物种(Ribes spp.)、蓖麻(Ricinus communis)、悬钩子属某些物种(Rubus spp.)、甘蔗属某些物种(Saccharum spp.)、柳属物种(Salix sp.)、接骨木属某些物种 (Sambucus spp.)、黑麦(Secale cereale)、胡麻属某些物种(Sesamum spp.)、白芥属物种 (Sinapis sp.)、茄属某些物种(Solanum spp.)(例如马铃薯(Solanum tuberosum)、红茄 (Solanum integrifolium)或番(Solanum tuberosum)、两色蜀泰(Sorghum bicolor)、 菠菜属某些物种(Spinacia spp.)、蒲桃属某些物种(Syzygium spp.)、万寿菊属某些物 禾中(Tagetes spp. )(Tamarindus indica) > bTbTW (Theobroma cacao) ^^p^JfiM^
些物种(Trifolium spp.)、小黑麦属物种(Triticale sp.)、Triticosecalerimpaui、小麦 属某些物种(Triticum spp.)(例如普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、圆柱zj、麦(Triticum turgidum) >Triticumhybernum>5)^'/JN'^ (Triticum macha)、 普通小麦(Triticum sativum)或普通小麦(Triticum vulgare)、小金莲花(Tropaeolum minus)、金莲花(Tropaeolummajus)、越桔属某些物种(Vaccinium spp.)、野碗豆属某些物 种(Vicia spp.)、豇豆属某些物种(Vigna spp.)、香堇(Viola odorata)、葡萄属某些物种 (Vitisspp.)、玉米(Zea mays)、Zizania palustris、麥属某些物禾中(Ziziphus spp.)及其 他。发明详述出人意料地,现在已经发现增加植物中编码GRF多肽的核酸序列的表达产生了 相对于对照植物具有提高的产量相关性状的植物。根据第一实施方案,本发明提供用于相 对于对照植物而言提高植物中产量相关性状的方法,包括增加植物中编码GRF多肽的核酸 序列的表达。出人意料地,现在已经发现增加植物中(i)编码生长调节因子(GRF)多肽的核酸 序列和(ii)编码滑膜肉瘤易位(SYT)多肽的核酸序列的表达产生相对于具有⑴编码GRF 多肽的核酸序列或(ii)编码SYT多肽的核酸序列之一表达增加的植物具有提高的产量相 关性状的植物。根据第一实施方案,提供用于通过增加植物中以下核酸序列的表达而提高 多种植物产量相关性状的方法(i)编码生长调节因子(GRF)多肽的核酸序列和(ii)编码
30滑膜肉瘤易位(SYT)多肽的核酸序列,其中所述的产量相关性状相对于具有⑴编码GRF 多肽的核酸序列或(ii)编码SYT多肽的核酸序列之一表达增加的植物提高。提高的产量 相关性状包含以下一项或多项提高的早期生长势、提高的地上部分生物量、提高的每株植 物总种子产量、提高的种子充实率、提高的(充实)种子数、提高的收获指数或提高的千粒 核重(TKW)。与生长调节因子(GRF)多肽相关的详细描述用于增加编码GRF多肽的核酸序列表达的优选方法是在植物中导入并表达编码 GRF多肽的核酸序列。下文任何对“在本发明方法中有用的GRF蛋白质”的谈及意指如本文中定义的GRF 多肽。下文任何对“在本发明方法中有用的GRF核酸序列”的谈及意指能够编码这种GRF多 肽的核酸序列。待导入植物(并且因而在实施本发明方法中有用)的核酸序列是编码现在 将描述的多肽类型的任意核酸序列,下文也称作“GRF核酸序列”或“GRF基因”。如本文定义的“GRF多肽”指这样的任意多肽,其包含i)与如(SEQ IDN0 2中包含 的)SEQ ID NO :115所代表的QLQ结构域具有至少50%、55%、60%、65%、70%、75%、80%、 85%、90%、95%、98%、99%或更多氨基酸序列同一性的结构域;和(ii)与如(SEQ ID NO: 2中包含的)SEQ ID N0:116所代表的WRC结构域具有至少50%、55%、60%、65%、70%、 75%、80%、85%、90%、95%、98%、99%或更多氨基酸序列同一性的结构域。备选地或额外地,如本文定义的“GRF多肽”指任一这样的多肽,其包含(i)具有 InterPro 登录号 IPR014978 (PFAM 登录号 PF08880)的 QLQ 结构域;(ii)具有 InterPro 登 录号IPR014977(PFAM登录号PF08879)的WRC结构域;和(iii)以保守间隔(CX9CX1QCX2H) 包含3个Cys和1个His残基的转录效应子(ET)结构域。备选地或额外地,如本文中定义的“GRF多肽”指任一这样的多肽,其以增加的优选 顺序与如SEQ ID NO 2所代表的GRF多肽或与本文表A1中给出的任意全长多肽序列具有 至少 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99% 或更多的氨基酸 序列同一性。备选地或额外地,“GRF多肽”在酵母双杂交相互作用测定法中相互作用于GRF-相 互作用因子(GIF;GIF1至GIF3,又叫做滑膜肉瘤易位SYT1至SYT3)多肽,如表A. 2中呈现 的那些多肽。术语“结构域”和“基序”在本文的“定义”部分中定义。存在用于鉴定结构 域的专业数据库,例如,SMART (Schultz 等人,(1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864 ;Letunic 等人,(2002)Nucleic Acids Res 30,242-244)、InterPro (Mulder 等人,(2003) Nucl. Acids. Res. 31, 315-318), Prosite (Bucher ^P Bairoch (1994),用于 生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation).(在)ISMB-94 ;第二届分子生物学智能系统国际会议文 集.Altman R. ,Brutlag D. ,Karp P. ,Lathrop R. ,Searls D.编辑,第53-61 页,MAIPress, Menlo Park ;Hulo 等人,Nucl. Acids. Res. 32 :D134-D137,(2004))或 Pfam(Bateman 等人, Nucleic Acids Research 30(1) =276-280 (2002)) 一组用于计算机方式分析蛋白质序 列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等人,ExPASy 用于深入认识和分析蛋白质的蛋白质组服务器(The proteomics server for in-depth proteinknowledge and analysis),Nucleic Acids Res. 31 :3784_3788(2003))。下文在本文实施例2和4中呈现对SEQ ID NO 2的多肽序列的分析。例如,如 SEQ ID N0:2所代表的GRF多肽包含InterPro结构域数据库中具有InterPro登录号 IPR014978 (PFAM 登录号 PF08880)的 QLQ 结构域和具有 InterPro 登录号 IPR014977 (PFAM 登录号PF08879)的WRC结构域。也可以使用常规技术如通过序列比对法鉴定结构域。本 文表A. 1的多肽的QLQ结构域的比对结果在图2中显示并且本文表A. 1的多肽的WRC结构 域的比对结果在图3中显示。此类比对结果用于鉴定GRF多肽之间最保守的氨基酸,如QLQ 和WRC氨基酸残基。用于比对序列以做比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、 BLAST、FASTA 禾口 TFASTA。GAP 使用 Needleman 和 Wunsch 算法((1970) J Mol Biol 48 443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列 的)比对结果。BLAST算法(Altschul等人,(1990) J Mol Biol 215:403-10)计算序列同 一性百分数并开展两个序列之间相似性的统计分析。用于开展BLAST分析的软件是通过国 家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对 算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性 的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,(2003) BMC Bioinformatics, 10 29. MatGAT 使用蛋白质序列或DNA序列产生相似性/同一性矩 P车的一禾中用(an application that generates similarity/identity matrices using proteinor DNA sequences))。如本领域技术人员显而易见,可以进行少许手工编辑以优化 保守基序之间的比对。此外,作为使用全长序列鉴定同源物的替代,也可以使用特定结构 域。利用上文提及的程序,使用默认参数,可以在完整核酸序列或氨基酸序列范围或保守基 序范围内确定序列同一性值。在QLQ结构域外部和在WRC结构域外部,GRF多肽据称具有低 的氨基酸序列同一性。本文的实施例3在表B. 1中描述如SEQ ID NO 2所代表的GRF多肽 与表A中所列出GRF多肽之间的同一性百分数,所述同一性百分数可以如15%氨基酸序列 同一性那样低。如果在SEQ ID NO 2的QLQ结构域(如由SEQ ID NO 2中包含的SEQ ID NO 115所代表;图2中代表的表A. 1的GRF多肽的QLQ结构域)和用于实施本发明的多肽 的QLQ结构域之间开展同一性计算,可能相当大地提高同一性百分数。类似地,如果在SEQ ID NO :2的WRC结构域(如由SEQ ID NO :2中包含的SEQID NO 116所代表;图3中代表的 表A. 1的GRF多肽的WRC结构域)和用于实施本发明的多肽的WRC结构域之间开展同一性 计算,可能相当大地提高同一性百分数。在用于实施本发明的多肽序列之间的QLQ结构域 范围内的同一性百分数范围是在25%和99%氨基酸同一性之间,并且在用于实施本发明 的多肽序列之间的WRC结构域范围内的同一性百分数范围是在60%和99%氨基酸同一性 之间。如图3中也可以观察到,不同GRF多肽之间的WRC结构域比如2图中所示的QLQ结 构域更保守。蛋白质亚细胞定位预测的任务是重要的并且得到充分研究。知晓蛋白质的定位 有助于阐明其功能。用于蛋白质定位的实验方法的范围从免疫定位至使用绿色荧光蛋白 (GFP)或葡糖醛酸酶(GUS)对蛋白质加标签。虽然与计算性方法相比此类方法繁琐费 累,然而它准确。最近在从序列数据计算性预测蛋白质定位方面取得长足进展。在瑞士生物信息研究所维护的ExPASy蛋白质组工具上可获得本领域技术人员熟知算法当中的例如 PSort、TargetP>ChloroP、LocTree、Predotar>LipoP、MIT0PR0T、PATS、PTSUSignalP 等。另外,在本发明方法中有用的GRF多肽(至少以它们的天然形式)一般,但并非必 需具有转录调节活性和与其他蛋白质相互作用的能力。因此,转录调节活性降低、无转录调 节活性、蛋白质-蛋白质相互作用能力降低或无蛋白质_蛋白质相互作用能力的GRF多肽 可以同等地用于本发明的方法中。可以使用本领域熟知的技术(例如在Current Protocols in MolecularBiology,第 1 和 2 卷,Ausubel 等人,(1994),Current Protocols 中)轻易 地在体外或体内测定DNA结合活性和蛋白质-蛋白质相互作用。GRF多肽能够在酵母细胞 中转录地激活报道基因(Kim 和 Kende(2004)Proc Natl AcadSci 101(36) 13374-13379)。 使用酵母双杂交蛋白质_蛋白质相互作用测定法,GRF多肽也能够在酵母细胞中与GRF相 互作用因子多肽(GIF1至GIF3 ;又叫做滑膜肉瘤易位(SYT))在体内相互作用(上文的Kim 和Kende)。也使用体外结合测定法来显示GRF多肽和SYT (或GIF)多肽是相互作用的配偶 物(上文的Kim和Kende)。本发明通过用SEQ ID NO 1所代表的核酸序列转化植物进行说明,其中所述核酸 序列编码SEQ ID NO :2的GRF多肽序列。然而,本发明的实施不限于这些序列;本发明的方 法可以有利地使用编码如本文中所定义GRF的任意核酸序列实施。编码GRF多肽的核酸序列的例子在本文实施例1的表A. 1中给出。此类核酸序列 用于实施本发明的方法。在实施例1的表A. 1中给出的多肽序列是由SEQ ID NO 2所代 表的GRF多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物” 如本文中定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易 地鉴定。通常,这包括第一 BLAST,其中所述的第一 BLAST包括将查询序列(例如使用实施 例1的表A. 1中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库进行 BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX (使用标准默认值),并且当从 蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结 果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST搜索(第 二 BLAST),其中查询序列从所述的生物中衍生(在查询序列是SEQ ID NO :1或SEQ ID NO 2的情况下,第二 BLAST因而将针对拟南芥序列进行)。随后比较第一 BLAST和第二 BLAST 的结果。若来自第一 blast的高阶位命中是源自与衍生查询序列的物种相同的物种,则鉴 定到旁系同源物,随后一个反向BLAST理想地在最高命中当中产生该查询序列;若在第一 BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物, 并且在反向BLAST时,优选地产生属于最高命中的该查询序列。高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶 然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了 E-值外,比较结果也由同 一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内 相同核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接 树法,以帮助观察相关基因的聚类并鉴定直向同源物和旁系同源物。核酸变体也可以用于实施本发明的方法中。此类变体的例子包括编码在实施例1 的表A. 1中所给出多肽序列任一者的同源物和衍生物的核酸序列,术语“同源物”和“衍生 物”如本文中定义。还在本发明方法中有用的是这样的核酸序列,其编码在实施例1的表A. 1中所给出任一多肽序列的直向同源物或旁系同源物的同源物和衍生物。在本发明方法 中有用的同源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功 能活性。在实施本发明方法中有用的其他核酸变体包括编码GRF多肽的核酸序列的部分、 与编码GRF多肽的核酸序列杂交的核酸序列、编码GRF多肽的核酸序列的剪接变体、编码 GRF多肽的核酸序列的等位变体和通过基因改组获得的编码GRF多肽的核酸序列的变体。 术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组”如本文中所述。编码GRF多肽的核酸序列不必须是全长核酸序列,因为本发明方法的实施不取决 于全长核酸序列的使用。根据本发明,提供了用于提高植物中产量相关性状的方法,包括在 植物中导入并表达实施例1的表A. 1中所给出任一核酸序列的一部分或编码实施例1表 A. 1中所给出任意多肽序列的直向同源物、旁系同源物或同源物的核酸序列的一部分。核酸序列的一部分可以例如通过对所述核酸序列产生一个或多个缺失而制备。所 述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产 生联合有几种活性的蛋白质。当融合于其他编码序列时,翻译后产生的所得多肽可以比对 该蛋白质部分所预测的多肽更大。在本发明方法中有用的部分编码如本文中定义的GRF多肽,并且基本上具有如实 施例1的表A. 1中所给出多肽序列相同的生物学活性。优选地,此部分是在实施例1的表 A. 1中给出的任一核酸序列的一部分,或是编码在实施例1的表A. 1中所给出任一多肽序列 的直向同源物或旁系同源物的核酸序列的一部分。优选地,该部分的长度以增加的优选顺 序是至少 400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、 1190个连续核苷酸,所述连续核苷酸属于实施例1的表A. 1中给出的任一核酸序列或属于 编码在实施例1的表A. 1中所给出任一多肽序列的直向同源物或旁系同源物的核酸序列。 优选地,该部分是编码多肽序列的核酸序列的一部分,其中所述的多肽序列包含i)与如 (SEQ IDN0 :2中包含的)SEQ ID NO :115所代表的QLQ结构域具有至少50%、55%、60%、 65%、70%、75%、80%、85%、90%、95%、98%、99%或更多氨基酸序列同一性的结构域;禾口 (ii)与如(SEQ ID NO :2中包含的)SEQ ID NO 116所代表的WRC结构域具有至少50%、 55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99% 或更多氨基酸序列同一性 的结构域。最优选地,该部分是SEQ ID N0:1的核酸序列的一部分。在本发明方法中有用的另一种核酸序列变体是能够在降低的严格条件下、优选地 在严格条件下与编码如本文中定义的GRF多肽的核酸序列或与如本文中定义的部分杂交 的核酸序列。根据本发明,提供了用于提高植物中产量相关性状的方法,包括在植物中导入并 表达能够与实施例1的表A. 1中给出的任一核酸杂交的核酸序列,或包括在植物中导入并 表达这样的核酸序列,其中所述核酸序列能够与编码在实施例1的表A. 1中给出的任意核 酸序列的直向同源物、旁系同源物或同源物的核酸序列杂交。在本发明方法中有用的杂交序列编码如本文中定义的GRF多肽,并且基本上具有 如实施例1的表A. 1中所给出多肽序列相同的生物学活性。优选地,该杂交序列能够与实 施例1的表A. 1中给出的任一核酸序列或与这些序列中任意序列的一部分杂交,所述的一 部分如上文定义,或其中所述杂交序列能够与编码在实施例1的表A. 1中给出的任一多
34肽序列的直向同源物或旁系同源物的核酸序列杂交。优选地,该杂交序列能够与编码多肽 序列的核酸序列杂交,其中所述的多肽序列包含i)与如(SEQ ID N0:2中包含的)SEQ ID NO :115所代表的队0结构域具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、 95%、98%、99%或更多氨基酸序列同一性的结构域;和(ii)与如(SEQ ID NO :2中包含 的)SEQ IDN0 116 所代表的 WRC 结构域具有至少 50% ,55% ,60% ,65% ,70% ,75% ,80%, 85%,90%、95%、98%、99%或更多氨基酸序列同一性的结构域。最优选地,该杂交序列能 够与如SEQ ID NO :1所代表的核酸序列或与其一部分杂交。在本发明方法中有用的另一种核酸序列变体是编码如上文所定义的GRF多肽的 剪接变体,剪接变体如本文中定义。根据本发明,提供了用于提高产量相关性状的方法,包括在植物中导入并表达实 施例1的表A. 1中所给出任一核酸序列的剪接变体或编码实施例1表A. 1中所给出任意多 肽序列的直向同源物、旁系同源物或同源物的核酸序列的剪接变体。优选的剪接变体是由SEQ ID NO :1所代表的核酸序列的剪接变体,或是编码SEQ ID NO :2的直向同源物或旁系同源物的核酸序列的剪接变体。优选地,该剪接变体是编码 多肽序列的核酸序列的剪接变体,其中所述的多肽序列包含i)与如(SEQ ID N0:2中包含 的)SEQ ID NO :115所代表的QLQ结构域具有至少50%、55%、60%、65%、70%、75%、80%、 85%、90%、95%、98%、99%或更多氨基酸序列同一性的结构域;和(ii)与如(SEQ ID NO: 2中包含的)SEQ ID NO :116所代表的WRC结构域具有至少50%、55%、60%、65%、70%、 75%、80%、85%、90%、95%、98%、99%或更多氨基酸序列同一性的结构域。在实施本发明方法中有用的另一种核酸序列变体是编码如上文所定义GRF多肽 的核酸序列的等位变体,等位变体如本文中定义。根据本发明,提供了用于提高产量相关性状的方法,包括在植物中导入并表达实 施例1的表A. 1中所给出任一核酸序列的等位变体,或包括在植物中导入并表达编码实施 例1表A. 1中所给出任意多肽序列的直向同源物、旁系同源物或同源物的核酸序列的等位 变体。在本发明方法中有用的等位变体基本上具有如SEQ ID NO 2的GRF多肽和实施例 1的表A. 1中所述任意多肽序列相同的生物学活性。等位变体存在于自然界中,并且在本 发明的方法中包括使用这些天然等位基因。优选地,所述等位变体是SEQ ID N0:1的等位 变体或编码SEQ ID NO :2的直向同源物或旁系同源物的核酸序列的等位变体。优选地,该 等位变体是多肽序列的等位变体,其中所述的多肽序列包含i)与如(SEQ ID N0:2中包含 的)SEQ ID NO :115所代表的QLQ结构域具有至少50%、55%、60%、65%、70%、75%、80%、 85%、90%、95%、98%、99%或更多氨基酸序列同一性的结构域;和(ii)与如(SEQ ID NO: 2中包含的)SEQ IDN0 116所代表的WRC结构域具有至少50 %、55 %、60 %、65 %、70 %、 75%、80%、85%、90%、95%、98%、99%或更多氨基酸序列同一性的结构域。基因改组或定向进化也可以用来产生编码如上文定义的GRF多肽的核酸序列的 变体;术语“基因改组”如本文中定义。根据本发明,提供了用于提高产量相关性状的方法,包括在植物中导入并表达在 实施例1的表A. 1中给出的任一核酸序列的变体,或包括在植物中导入并表达核酸序列的 变体,所述的核酸序列编码在实施例1的表A. 1中给出的任意多肽序列的直向同源物、旁系同源物或同源物,其中所述的变体核酸序列通过基因改组获得。优选地,通过基因改组获得的变体核酸序列编码多肽序列,其中所述多肽序列包 含i)与如(SEQ ID N0:2中包含的)SEQ ID NO 115所代表的QLQ结构域具有至少50%、 55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更多氨基酸序列同一性 的结构域;和(ii)与如(SEQID NO 2中包含的)SEQ ID NO 116所代表的WRC结构域具有 至少 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更多氨基酸序 列同一性的结构域。另外,核酸序列变体也可以通过位点定向诱变获得。几种方法可用于实现位点定 向诱变,最常见的是基于 PCR 的方法(Current Protocols inMolecular Biology. Wiley 编 辑)。编码GRF多肽的核酸序列可以衍生自任何天然来源或人工来源。该核酸序列可以 通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编 码GRF多肽的核酸序列来自植物,进一步优选地来自双子叶植物,更优选地来自十字花科 (Brassicaceae),该核酸序列最优选地来自拟南芥。与滑膜肉瘤易位(SYT)多肽相关的详细描述用于增加编码SYT多肽的核酸序列表达的优选方法是在植物中导入并表达编码 SYT多肽的核酸序列。下文任何对“在本发明方法中有用的SYT蛋白质”的谈及意指如本文中定义的SYT 多肽。下文任何对“在本发明方法中有用的SYT核酸序列”的谈及意指能够编码这种SYT多 肽的核酸序列。待导入植物(并且因而在实施本发明方法中有用)的核酸序列是编码现在 将描述的多肽类型的任意核酸序列,下文也称作“SYT核酸序列”或“SYT基因”。如本文定义的术语“SYT多肽”指这样的多肽,该多肽从氨基端至羧基端包含⑴ 以增加的优选顺序与SEQ ID而262的3朋结构域具有至少20%、25%、30%、35%、40%、 45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,91 %,92%,93%,94%,95%, 96%、97%、98%、99%序列同一性的SNH结构域;和(ii)Met丰富结构域;及(iii)QG丰富 结构域。优选地,SNH结构域包含如SEQ ID NO 263所描述并在图5中以黑色显示的最保 守残基。备选地或额外地,如本文中定义的“SYT多肽”指包含下述结构域的任意多 肽,其中所述的结构域以增加的优选顺序与具有SEQ ID N0:264的InterPro登录号 IPR007726(PFAM登录号PF05030,SSXT蛋白(氨基端区域))的SSXT结构域具有至少20%、 25%,30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,91 92%、93%、94%、95%、96%、97%、98%、99% 序列同一性。备选地或额外地,如本文中定义的“SYT多肽”指这样的任意多肽,其以增加的优选 顺序与如SEQ ID N0:121所代表的SYT多肽或与本文表A.2中给出的任意全长多肽序列具 有至少 20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、 90%、95%、98%、99%或更多的氨基酸序列同一性。备选地或额外地,“SYT多肽”在酵母双杂交相互作用测定法中相互作用于生长调 节因子(GRF)多肽,例如相互作用于如本文表A. 1中给出的GRF多肽序列。下文在本文实施例2和4中提供了对SEQ ID NO 121的SYT多肽序列的分析。例如,如SEQ ID NO 121所代表的SYT多肽包含InterPro结构域数据库中具有InterPro登 录号IPR007726 (PFAM登录号PF05030)的SSXT结构域。也可以使用常规技术如通过序列 比对法鉴定结构域。图5中显示本文表A. 2的多肽的SNH结构域的比对结果。此类比对结 果用于鉴定SYT多肽之间最保守的氨基酸,如SEQ ID NO :263中代表的最保守残基。用于比对序列以做比较的方法是本领域熟知的,如本文以上简述。利用上文提及 的程序,使用默认参数,可以在完整核酸序列或多肽序列范围或所选的结构域或保守基序 范围内确定序列同一性值。在SNH结构域外部和在SSXT结构域外部,SYT多肽据称具有低 的氨基酸序列同一性。本文的实施例3在表B. 2中描述如SEQ ID NO 121所代表的SYT多 肽与表A. 2中所列出SYT多肽之间的同一性百分数,所述同一性百分数可以如25%氨基酸 序列同一性那样低。如果在(SEQ ID NO 121中包含的)如SEQ IDN0 :262所代表的SNH结 构域和(图5中描述的)表A. 2的SYT多肽的SNH结构域之间开展同一性计算,能相当大 地提高氨基酸同一性百分数。类似地,如果在(SEQ ID NO 121中包含的)如SEQ ID NO 264所代表的SSXT结构域和用于实施本发明的SYT多肽的SSXT结构域之间开展同一性计 算,能相当大地提高同一性百分数。包含于SSXT结构域中的SNH结构域在不同的SYT多肽 之间比SSXT结构域更保守。另外,在本发明方法中有用的SYT多肽(至少以它们的天然形式)一般,但并非必 须具有转录调节活性和与其他蛋白质相互作用的能力。因此,转录调节活性降低、无转录调 节活性、蛋白质-蛋白质相互作用能力降低或无蛋白质_蛋白质相互作用能力的SYT多肽 可以同等地用于本发明的方法中。可以使用本领域熟知的技术(例如在Current Protocols in MolecularBiology,第 1 和 2 卷,Ausubel 等人,(1994),Current Protocols 中)轻易地 在体外或体内测定DNA结合活性和蛋白质-蛋白质相互作用。使用酵母双杂交蛋白质_蛋 白质相互作用测定法,SYT多肽能够在酵母细胞中与GRF多肽在体内相互作用(上文的Kim 和Kende)。也使用体外结合测定法来显示GRF多肽和SYT多肽是相互作用的配偶物(上文 的 Kim 和 Kende)。本发明通过用SEQ ID NO 120所代表的核酸序列转化植物进行说明,其中所述核 酸序列编码SEQ ID NO 121的SYT多肽序列。然而,本发明的实施不限于这些序列;本发明 的方法可以有利地使用编码如本文中所定义SYT的任意核酸序列实施。编码SYT多肽的核酸序列的例子在本文实施例1的表A. 2中给出。此类核酸序列 用于实施本发明的方法。在实施例1的表A. 2中给出的多肽序列是由SEQ ID N0:121所代 表的SYT多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物” 如本文以上定义。其他直向同源物和旁系同源物可以通过开展(如本文以上描述的)交互 性blast搜索轻易地鉴定。核酸变体也可以用于实施本发明的方法中。此类变体的例子包括编码在实施例1 的表A. 2中所给出多肽序列任一者的同源物和衍生物的核酸序列,术语“同源物”和“衍生 物”如本文中定义。还在本发明方法中有用的是这样的核酸序列,其编码在实施例1的表 A. 2中所给出任一多肽序列的直向同源物或旁系同源物的同源物和衍生物。在本发明方法 中有用的同源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功 能活性。在实施本发明方法中有用的其他核酸变体包括编码SYT多肽的核酸序列的部分、与编码SYT多肽的核酸序列杂交的核酸序列、编码SYT多肽的核酸序列的剪接变体、编码 SYT多肽的核酸序列的等位变体和通过基因改组获得的编码SYT多肽的核酸序列的变体。 术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组”如本文中所述。编码SYT多肽的核酸序列不必须是全长核酸序列,因为本发明方法的实施不取决 于全长核酸序列的使用。根据本发明,提供了用于提高植物中产量相关性状的方法,包括在 植物中导入并表达实施例1的表A. 2中所给出任一核酸序列的一部分或编码实施例1表 A. 2中所给出任意多肽序列的直向同源物、旁系同源物或同源物的核酸序列的一部分。核酸序列的一部分可以例如通过对所述核酸序列产生一个或多个缺失而制备。所 述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产 生联合有几种活性的蛋白质。当融合于其他编码序列时,翻译后产生的所得多肽可以比对 该蛋白质部分所预测的多肽更大。在本发明方法中有用的部分编码如本文中定义的SYT多肽,并且基本上具有如实 施例1的表A. 2中所给出多肽序列相同的生物学活性。优选地,此部分是在实施例1的表 A. 2中给出的任一核酸序列的一部分,或是编码在实施例1的表A. 2中所给出任一多肽序列 的直向同源物或旁系同源物的核酸序列的一部分。优选地,该部分以增加的优选顺序具有 至少100、125、150、175、200或225个连续核苷酸长度、优选地至少250、275、300、325、350、 375、400、425、450或475个连续核苷酸长度,还优选地至少500、525、550、575、600、625、 650,675,700或725个连续核苷酸长度或如全长SYT核酸序列那样长,所述连续核苷酸属于 实施例1的表A. 2中给出的任一核酸序列或属于编码在实施例1的表A. 2中所给出任一多 肽序列的直向同源物或旁系同源物的核酸序列。优选地,该部分是编码多肽序列的核酸序 列的一部分,其中所述的多肽序列从氨基端至羧基端包含(i)以增加的优选顺序与SEQ ID NO 262 的 SNH 结构域具有至少 20%,25%,30%,35%,40%,45%,50%,55%,60%,65%, 70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 序列同一 性的SNH结构域;和(ii)Met丰富结构域;及(iii)QG丰富结构域。优选地,SNH结构域包 含如SEQ ID NO :263所代表的并在图5中以黑色显示的最保守残基。最优选地,该部分是 SEQ ID NO 120的核酸序列的一部分。在本发明方法中有用的另一种核酸序列变体是能够在降低的严格条件下、优选在 严格条件下与编码如本文中定义的SYT多肽的核酸序列或与如本文中定义的部分杂交的 核酸序列。根据本发明,提供了用于提高植物中产量相关性状的方法,包括在植物中导入并 表达能够与实施例1的表A. 2中给出的任一核酸杂交的核酸序列,或包括在植物中导入并 表达这样的核酸序列,其中所述核酸序列能够与编码在实施例1的表A. 2中给出的任意核 酸序列的直向同源物、旁系同源物或同源物的核酸序列杂交。在本发明方法中有用的杂交序列编码如本文中定义的SYT多肽,并且基本上具有 如实施例1的表A. 2中所给出多肽序列相同的生物学活性。优选地,该杂交序列能够与实 施例1的表A. 2中给出的任一核酸序列或与这些序列中任意序列的一部分杂交,所述的一 部分如上文定义,或其中所述杂交序列能够与编码在实施例1的表A. 2中给出的任一多肽 序列的直向同源物或旁系同源物的核酸序列杂交。优选地,该杂交序列能够与编码多肽序 列的核酸序列杂交,其中所述的多肽序列从氨基端至羧基端包含(i)以增加的优选顺序与 SEQ ID NO :262 的 SNH 结构域具有至少 20%、25%、30%、35%、40%、45%、50%、55%、 60%,65%,70%,75%,80%,85%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%序列同一性的SNH结构域;和(ii)Met丰富结构域;及(iii)QG丰富结构域。优选地, SNH结构域包含如SEQ ID NO :263所代表的并在图5中以黑色显示的最保守残基。最优选 地,该杂交序列能够与如SEQ ID NO: 120所代表的核酸序列或与其一部分杂交。在本发明方法中有用的另一种核酸序列变体是编码如上文所定义的SYT多肽的 剪接变体,剪接变体如本文中定义。根据本发明,提供了用于提高产量相关性状的方法,包括在植物中导入并表达实 施例1的表A. 2中所给出任一核酸序列的剪接变体或编码实施例1表A. 2中所给出任意多 肽序列的直向同源物、旁系同源物或同源物的核酸序列的剪接变体。优选的剪接变体是由SEQ ID NO :120所代表的核酸序列的剪接变体,或是编码 SEQ ID NO :121的直向同源物或旁系同源物的核酸序列的剪接变体。优选地,该剪接变体 是编码多肽序列的核酸序列的剪接变体,其中所述的多肽序列从氨基端至羧基端包含(i) 以增加的优选顺序与SEQ IDN0 262的SNH结构域具有至少20%,25%,30%,35%,40%, 45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,91 %,92%,93%,94%,95%, 96%、97%、98%、99%序列同一性的SNH结构域;和(ii)Met丰富结构域;及(iii)QG丰富 结构域。优选地,SNH结构域包含如SEQ ID NO :263所代表的并在图5中以黑色显示的最 保守残基。在实施本发明方法中有用的另一种核酸序列变体是编码如上文所定义SYT多肽 的核酸序列的等位变体,等位变体如本文中定义。根据本发明,提供了用于提高产量相关性状的方法,包括在植物中导入并表达实 施例1的表A. 2中所给出任一核酸序列的等位变体,或包括在植物中导入并表达编码实施 例1表A. 2中所给出任意多肽序列的直向同源物、旁系同源物或同源物的核酸序列的等位 变体。在本发明方法中有用的等位变体基本上具有如SEQ ID NO 121的SYT多肽和实施 例1的表A. 2中所述任意多肽序列相同的生物学活性。等位变体存在于自然界中,并且在本 发明的方法中包括这些天然等位基因的用途。优选地,所述等位变体是SEQ ID N0:120的 等位变体或编码SEQ IDN0:121的直向同源物或旁系同源物的核酸序列的等位变体。优选 地,该等位变体是多肽序列的等位变体,其中所述的多肽序列从氨基端至羧基端包含(i) 以增加的优选顺序与SEQ ID NO :262的SNH结构域具有至少20%、25%、30%、35%、40%、 45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,91 %,92%,93%,94%,95%, 96%、97%、98%、99%序列同一性的SNH结构域;和(ii)Met丰富结构域;及(iii)QG丰富 结构域。优选地,SNH结构域包含如SEQ ID NO :263所代表的并在图5中以黑色显示的最 保守残基。基因改组或定向进化也可以用来产生编码如上文定义的SYT多肽的核酸序列的 变体;术语“基因改组”如本文中定义。根据本发明,提供了用于提高产量相关性状的方法,包括在植物中导入并表达在 实施例1的表A. 2中给出的任一核酸序列的变体,或包括在植物中导入并表达核酸序列的 变体,所述的核酸序列编码在实施例1的表A. 2中给出的任意多肽序列的直向同源物、旁系同源物或同源物,其中所述的变体核酸序列通过基因改组获得。优选地,通过基因改组获得的变体核酸序列编码多肽序列,其中所述的多肽序列 从氨基端至羧基端包含(i)以增加的优选顺序与SEQ ID N0:262的SNH结构域具有至 少 20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、 91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的 SNH 结构域;和(ii)Met 丰富结构域;及(iii)QG丰富结构域。优选地,SNH结构域包含如SEQ IDN0 :263所代表的 并在图5中以黑色显示的最保守残基。另外,核酸序列变体也可以通过位点定向诱变获得。几种方法可用于实现位点定 向诱变,最常见的是基于 PCR 的方法(Current Protocols inMolecular Biology. Wiley 编 辑)。编码SYT多肽的核酸序列可以衍生自任何天然来源或人工来源。该核酸序列可以 通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码 SYT多肽的核酸序列来自植物,进一步优选地来自双子叶植物,更优选地来自十字花科,该 核酸序列最优选地来自拟南芥。本发明方法的实施,即增加植物中⑴编码生长调节因子(GRF)多肽的核酸序列 和(ii)编码滑膜肉瘤易位(SYT)多肽的核酸序列的表达产生相对于具有(i)编码GRF多 肽的核酸序列或(ii)编码SYT多肽的核酸序列之一表达增加的植物具有提高的产量相关 性状的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。以谷物为例,产量提高可以表现为以下一个或多个指标每公顷或英亩建立的植 物的数目提高、每株植物穗数提高、行数、每行核粒数、核粒重、千粒核重、花序长度/直径 的提高、种子充实率(即充实种子数除以种子总数并乘以100)提高,及其他。以稻为例,产 量提高可以自身表现为下列一种或多种指标的提高每公顷或英亩植物数、每株植物的花 序数、每个花序的小穗数、每花序的花(小花)数目(其表述为充实种子数对原生花序数的 比率)、种子充实率(即充实种子数除以种子总数并乘以100)提高、千粒核重提高及其他。本发明方法的实施,即增加植物中⑴编码生长调节因子(GRF)多肽的核酸序列 和(ii)编码滑膜肉瘤易位(SYT)多肽的核酸序列的表达产生相对于具有(i)编码GRF多肽 的核酸序列或(ii)编码SYT多肽的核酸序列之一表达增加的植物具有提高的产量相关性 状的植物。优选地,所述提高的产量相关性状是以下一项或多项(i)提高的早期生长势; (ii)提高的地上部分生物量;(iii)提高的每株植物总种子产量;(iv)提高的种子充实率; (v)提高的(充实)种子数;(vi)提高的收获指数或(vii)提高的千粒核重(TKW)。由于本发明的转基因植物具有提高的产量相关性状,故这些植物有可能在其生活 周期的对应阶段(在其生活周期的至少部分期间)上相对于对照植物的生长速率表现出提 高的生长速率。如“定义”部分中详述,“对照植物”可以包括相应的野生型植物或无目的基因的相 应植物或使(i)编码GRF多肽的核酸序列或(ii)编码SYT多肽的核酸序列之一表达增加 的相应植物。如本文中所用的“对照植物”不仅指完整植物,也指植物部分,包括种子和种 子部分。提高的生长速率可以是植物的一个或多个部分(包括种子)特有的,或可以基本 上遍及整个植物。具有提高的生长速率的植物可以具备较短的生活周期。植物的生活周期
40可以意指从干燥成熟种子生长直至植物已经产生与起始材料相似的干燥成熟种子的阶段 所需要的时间。这个生活周期可以受诸因素如早期生长势、生长速率、绿度指数、开花时间 和种子成熟速度影响。生长速率的提高可以在植物生活周期的一个或多个阶段上或在基本 上整个植物生活周期期间发生。提高的生长速率在植物生活周期的早期期间可以反映增加 的(早期)生长势。生长速率的提高可以改变植物的收获周期,从而允许植物较晚播种和 /或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得;延迟的开花通 常不是作物中想要的性状)。若生长速率充分提高,则可以允许进一步播种相同植物物种 的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均处于一个常 规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种 子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适的 植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变 植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具 体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生 型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时期(早季)或 在收获时期(晚季)的不利环境条件决定。若缩短收获周期,则可以避开这类不利条件。生 长速率可以通过从生长曲线衍生多个参数而确定,此类参数可以是T_Mid(植物达到50% 最大植物大小所花费的时间)和T-90 (植物达到90%最大植物大小所花费的时间),以及 其他。根据本发明的优选特征,本发明方法的实施产生了相对于对照植物具有提高的生 长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包括增 加植物中(i)编码生长调节因子(GRF)多肽的核酸序列和(ii)编码滑膜肉瘤易位(SYT) 多肽的核酸序列的表达,其中相对于具有(i)编码GRF多肽的核酸序列或(ii)编码SYT多 肽的核酸序列之一表达增加的植物,所述植物具有提高的生长速率。与可比较条件下培育的对照植物相比较,无论该植物处于非胁迫条件下或无论该 植物暴露于多种胁迫,提高的产量相关性状均出现。植物一般通过生长得更慢而应答于胁 迫暴露。在严重胁迫条件下,植物甚至可能完全停止生长。另一方面,轻度胁迫在本文中定 义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,但同时不能 恢复生长。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明的意义下导致受胁迫植 物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、 13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,栽培作 物植物中并不经常遭遇严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受 欢迎的特征。轻度胁迫是植物所暴露的常见生物胁迫和/或非生物(环境)胁迫。非生物 性胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温 度所致。非生物性胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引 起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌、线虫和昆虫引起的那些胁迫。 如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人 员清楚对于给定地点的正常土壤条件和气候条件。相对于在可比较条件下培育的对照植物,本发明方法的实施产生在非胁迫条件下 或在轻度胁迫条件下培育的具有提高的产量相关性状的植物。因此,根据本发明,提供了用于提高非胁迫条件下或轻度胁迫条件下培育的植物中产量相关性状的方法,所述方法包括 增加植物中(i)编码生长调节因子(GRF)多肽的核酸序列和(ii)编码滑膜肉瘤易位(SYT) 多肽的核酸序列的表达,其中在可比较条件下培育时,相对于具有(i)编码GRF多肽的核酸 序列或(ii)编码SYT多肽的核酸序列之一表达增加的植物,所述植物具有提高的产量相关 性状。相对于可比较胁迫条件下培育的对照植物,本发明方法的实施产生在非生物性胁 迫条件下培育的具有提高的产量相关性状的植物。如Wang等人(Planta (2003) 218:1-14) 中报道,非生物性胁迫导致一系列不利地影响植物生长及生产力的形态学、生理学、生物化 学和分子变化。干旱、盐度、极端温度和氧化胁迫已知相互联系并可以通过相似机制诱导生 长损害及细胞损害。Rabbani等人(Plant Physiol (2003) 133 1755-1767)描述了干旱胁 迫与高盐度胁迫之间极高程度的“交互作用”。例如,干旱和/或盐化作用主要表现为渗透 胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧 化胁迫可以引起功能蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细 胞信号传导途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停 滞。由于多样的环境胁迫激活相似途径,故本发明采用干旱胁迫的示例不应当视为限于干 旱胁迫,而更应视为一种筛选法以相对于可比较胁迫条件下、通常在非生物性胁迫下培育 的对照植物,说明如上文定义的GRF多肽参与提高产量相关性状。如本文中定义的术语“非生物性胁迫”意指以下任意一项或多项水胁迫(因干 旱或过量的水所致)、缺氧胁迫、盐胁迫、温度胁迫(因热、寒冷或冰冻温度所致)、化学毒性 胁迫和氧化胁迫。根据本发明的一个方面,所述非生物性胁迫是渗透胁迫,其选自水胁迫、 盐胁迫、氧化胁迫和离子胁迫。优选地,水胁迫是干旱胁迫。术语“盐胁迫”不限于普通盐 (NaCl),不过可以是由以下一种或多种盐:NaCl、KC1、LiCl、MgCl2、CaCl2等引起的任意胁 迫。相对于可比较胁迫条件下培育的对照植物,本发明方法的实施产生在非生物性胁 迫条件下具有提高的产量相关性状的植物。因此,根据本发明,提供了用于提高非生物条 件下培育的植物中产量相关性状的方法,所述方法包括增加植物中(i)编码生长调节因子 (GRF)多肽的核酸序列和(ii)编码滑膜肉瘤易位(SYT)多肽的核酸序列的表达,其中在可 比较胁迫条件下培育时,相对于具有⑴编码GRF多肽的核酸序列或(ii)编码SYT多肽的 核酸序列之一表达增加的植物,所述植物具有提高的产量相关性状。非生物性环境胁迫的另一个例子是需要被所述植物同化用于生长和发育的一种 或多种养分的可利用性降低。因为养分利用效率强烈影响植物产量和产品品质,故向田地 倾注大量肥料以优化植物生长和产品品质。植物的生产量通常受3种主要养分磷、钾和氮 限制,这3种养分中,氮通常是是植物生长的限速性元素。因此,植物生长所需的主要营养 元素是氮(N)。氮是活细胞中存在的许多重要化合物的组成成分,所述的重要化合物包括氨 基酸、蛋白质(酶)、核酸和叶绿素。1.5%至2%的植物干物质是氮,且大约16%的植物总蛋 白是氮。因此,氮可利用性是作物植物生长和生产的主要限制性因素(Frink等人,(1999) Proc Natl Acad Sci USA 96(4) :1175_1180),并且也对蛋白质积累和氨基酸组成产生重大 影响。因此,在氮限制性条件下培育时具有提高的产量相关性状的植物是意义重大的。本发明方法的实施产生在养分可利用性降低、尤其氮可利用性降低的条件下培育的植物,该植物相对于可比较胁迫条件下培育的对照植物具有提高的产量相关性状。因此, 根据本发明,提供了用于提高在养分可利用性降低、尤其氮可利用性降低的条件下培育的 植物中产量相关性状的方法,所述方法包括增加植物中(i)编码生长调节因子(GRF)多肽 的核酸序列和(ii)编码滑膜肉瘤易位(SYT)多肽的核酸序列的表达,其中在可比较胁迫条 件下培育时,相对于具有(i)编码GRF多肽的核酸序列或(ii)编码SYT多肽的核酸序列之 一表达增加的植物,所述植物具有提高的产量相关性状。降低的养分可利用性可以因养分 如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等匮乏或过多所致。优选地,降低 的养分可利用性是降低的氮可利用性。本发明包括通过本发明方法可获得的植物或其部分(包括种子)或其细胞。植物 或其部分或细胞包含(i)编码生长调节因子(GRF)多肽的分离的核酸转基因;和(ii)编码 滑膜肉瘤易位(SYT)多肽的分离的核酸转基因。如上文所述,用于增加⑴编码GRF多肽的核酸序列和(ii)编码SYT多肽的核酸 序列表达的优选方法是在植物中导入并表达(i)编码GRF多肽的核酸序列和(ii)编码SYT 多肽的核酸序列。因而,根据本发明,提供了用于提高植物中产量相关性状的方法,所述方 法在植物中导入并表达(i)编码GRF多肽的核酸序列和(ii)编码SYT多肽的核酸序列,所 述植物相对于具有⑴编码GRF多肽的核酸序列或(ii)编码SYT多肽的核酸序列之一表 达增加的植物具有提高的产量相关性状。用于在转基因植物中导入并表达两种或多种转基因的方法(又叫做基因堆叠)是 本领域熟知的(见例如,Halpin (2005)Plant Biotech J(3) 141-155综述)。基因堆叠可 以通过反复步骤进行,其中两种或多种转基因可以通过含有一种转基因的植物与携带其他 转基因的个体杂交或备选地通过用新基因再转化(或超转化)含有一种转基因的植物依次 导入植物。根据本发明,提供了用于提高植物中产量相关性状的方法,所述方法依次地在植 物中导入并表达(i)编码GRF多肽的核酸序列和(ii)编码SYT多肽的核酸序列,所述植物 相对于具有(i)编码GRF多肽的核酸序列或(ii)编码SYT多肽的核酸序列之一表达增加 的植物具有提高的产量相关性状。优选地,通过杂交依次导入和表达⑴和(ii)的核酸序列。在包含已导入并表达 的编码GRF多肽的分离核酸序列的母本植物与包含已导入并表达的编码SYT多肽的分离核 酸序列的父本植物之间进行杂交或反之亦然,并在子代中选择这两种转基因的存在性和表 达。因而根据本发明,提供了用于通过以下方式提高植物中产量相关性状的方法,即,包含 已导入并表达的编码GRF多肽的分离核酸序列的母本植物与包含已导入并表达的编码SYT 多肽的分离核酸序列的父本植物之间进行杂交或反之亦然,并在子代中选择这两种转基因 的存在性和表达,其中所述的植物相对于亲本植物或相对于如本文定义的任何其他对照植 物具有提高的产量相关性状。备选地,通过再转化依次导入和表达(i)和(ii)的核酸序列。再转化通过如此方 式进行,即导入编码GRF多肽的分离核酸序列至包含已导入并表达的编码SYT多肽的分离 核酸序列的植物、植物部分或植物细胞并在其中表达或反之亦然,并在子代中选择这两种 转基因的存在性和表达。因而根据本发明,提供了用于通过再转化提高植物中产量相关性 状的方法,所述再转化通过如此方式进行,即导入编码GRF多肽的分离核酸序列至包含已导入并表达的编码SYT多肽的分离核酸序列的植物、植物部分或植物细胞并在其中表达或 反之亦然,并在子代中选择这两种转基因的存在性和表达,其中所述的植物相对于具有(i) 编码GRF多肽的核酸序列或(ii)编码SYT多肽的核酸序列之一表达增加的植物或相对于 如本文定义的任何其他对照植物具有提高的产量相关性状。备选地,基因堆叠可以借助如本文“定义”部分中所述的更快且可以用于转化技术 的所有范围中的同时转化法或共转化法发生。例如使用农杆菌转化法时,(至少两种)转基因可以以本领域熟知的许多形式 (conformation)存在,下文提到所述形式中的某些形式(i)将核酸编码序列融合以在翻译时形成单一多肽并且处于单一启动子的控制 下;(ii)将核酸编码序列依次地置于单一启动子下游,由影响mRNA合成(内部核糖体 进入位点IRES、2A打滑信号(2A stuttering signals)等)或多肽合成(由蛋白酶底物位 点等隔开的多聚蛋白等)的核酸信号隔开;(iii)核酸编码序列受分别的启动子独立驱动,并且所述启动子_核酸编码序列 组合位于一个T-DNA内部;(iv)核酸编码序列受分别的启动子独立驱动,并且所述启动子_核酸编码序列组 合位于一个质粒上的不同T-DNA中;(v)核酸编码序列受分别的启动子独立驱动,并且所述启动子_编码序列组合位 于一个或分别的农杆菌菌株内不同质粒上的不同T-DNA中。当考虑使用物理或化学递送系统(例如微抛射体轰击、PEG、电穿孔、脂质体、玻璃 针等)直接遗传转化时,(至少两种)转基因可以以许多形式(conformation)存在,不过 基本上不需要包含于能够在农杆菌或病毒(遗传转化中间体)中复制的载体内。这两种转 基因可以包含于一个或多个核酸分子中,不过同时用于遗传转化过程。根据本发明,提供了用于提高植物中产量相关性状的方法,所述方法同时地在植 物中导入并表达(i)编码GRF多肽的核酸序列和(ii)编码SYT多肽的核酸序列,所述植物 相对于具有(i)编码GRF多肽的核酸序列或(ii)编码SYT多肽的核酸序列之一表达增加 的植物具有提高的产量相关性状。被同时导入和表达的(i)及(ii)的核酸序列包含于一个或多个核酸分子中。因 而,根据本发明,提供了用于提高植物中产量相关性状的方法,所述方法包括同时在植物中 导入并表达包含于一个或多个核酸分子中的(i)编码GRF多肽的核酸序列和(ii)编码SYT 多肽的核酸序列,所述植物相对于具有⑴编码GRF多肽的核酸序列或(ii)编码SYT多肽 的核酸序列之一表达增加的植物具有提高的产量相关性状。本发明也提供了基因构建体和载体以促进植物中编码GRF多肽的核酸序列的导 入和/或增加表达。基因构建体可以插入适于转化到植物中并适于在转化细胞中表达目的 基因的载体中,所述载体可以是市售的。本发明也提供了如本文定义的基因构建体在本发 明方法中的用途。更具体地,本发明提供了构建体,其包含(a)编码如上定义的GRF多肽的核酸序列;(b)编码如上定义的SYT多肽的核酸序列;
(c)能够增加(a)和(b)的核酸序列表达的一个或多个调控序列;和任选地(d)转录终止序列。(a)和(b)的核酸序列可以包含于如SEQ ID NO :267或SEQ ID NO :268所代表的 一个核酸分子中,所述核酸分子编码如SEQ ID N0:269或SEQ ID NO :270所代表的多肽序 列。术语“调控序列,,和“终止序列,,如本文中的定义。优选地,构建体的所述调控序 列之一是组成型启动子。组成型启动子的例子是G0S2启动子,优选地是稻G0S2启动子,更 优选地是如SEQ ID N0:117所代表的G0S2启动子。在一个构建体中,单一调控序列用来驱动在如SEQ ID NO :267或SEQID NO 268所 代表的一个核酸分子中包含的两种核酸序列(a)和(b)的表达,所述核酸分子编码如SEQ ID NO 269或SEQ ID NO 270所代表的多肽序列。本发明也提供了构建体的混合物,所述混合物用于例如在植物中同时导入和表达 (a)编码如上文所定义GRF多肽的核酸序列和(b)编码如上文所定义SYT多肽的核酸序列, 其中至少一个构建体包含(a)编码如上定义的GRF多肽的核酸序列;(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地(c)转录终止序列,并且其中至少一个其他构建体包含(d)编码如上定义的SYT多肽的核酸序列;(e)能够驱动(d)的核酸序列表达的一个或多个调控序列;和任选地(f)转录终止序列。优选地,构建体的所述调控序列之一是组成型启动子。组成型启动子的例子是 G0S2启动子,优选地是稻G0S2启动子,更优选地是如SEQ IDN0 117所代表的G0S2启动子。本发明也提供了构建体或构建体混合物在用于产生植物的方法中的用途,所述构 建体包含(a)编码如上文所定义GRF多肽的核酸序列和(b)编码如上文所定义SYT多肽的 核酸序列,所述构建体混合物包含如上文定义的(a)和(b),所述植物相对于具有(a)编码 GRF多肽的核酸序列或(b)编码SYT多肽的核酸序列之一表达增加的植物具有提高的产量 相关性状,其中提高的产量相关性状是以下一项或多项(i)提高的早期生长势;(ii)提高 的地上部分生物量;(iii)提高的每株植物总种子产量;(iv)提高的种子充实率;(v)提高 的(充实)种子数;(vi)提高的收获指数或(vii)提高的千粒核重(TKW)。本发明也提供了用构建体或用构建体混合物转化的植物、植物部分或植物细胞, 其中所述构建体包含(a)编码如上文所定义GRF多肽的核酸序列和(b)编码如上文所定义 SYT多肽的核酸序列,所述构建体混合物包含如上文定义的(a)和(b)。植物用包含任意上述核酸序列的一种或多种载体转化。技术人员非常了解必须存 在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。此目的 序列有效地与一个或多个调控序列(至少与启动子)连接。有利地,任意类型的启动子,无论是天然的或合成的,可以用来增加所述核酸序列 的表达。组成型启动子在所述方法中是特别有用的。其他器官特异性启动子,例如用于叶、茎、块茎、分生组织、种子(胚和/或胚乳)中优先表达的器官特异性启动子,用于实施本发明的方法。对于多种启动子类型的定义,见 本文中的“定义”部分。应当明白本发明的应用不限于(i)由组成型启动子驱动其表达的编码如SEQ ID N0:1所代表的GRF多肽的核酸序列或(ii)由组成型启动子驱动其表达的编码如SEQ ID NO 120所代表的SYT多肽的核酸序列。任选地,可以在被导入植物的构建体中使用一个或多个终止子序列。额外的调节 元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可能适用于实施本发明 的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至5’非翻译区(UTR) 或编码序列中,以提高细胞质中积累的成熟信使的量。(除启动子、增强子、沉默子、内含子 序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质和/或RNA稳定元件。 此类序列将是已知的或可以由本领域技术人员轻易地获得。本发明的基因构建体可以还包括对于特定细胞类型中维持和/或复制所需要的 复制起点序列。一个例子是当需要基因构建体作为游离型遗传元件(例如质粒或粘粒分 子)在细菌细胞中维持时的复制起点。优选的复制起点包括但不限于fl-ori和colEl。为检测如在本发明方法中有用的核酸序列的成功转移和/或选择包含这些核酸 序列的转基因植物,使用标记基因(或报道基因)是有利的。因此,所述基因构建体可以任 选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。已知当核酸序列稳定或瞬时地整合至植物细胞时,仅少数细胞摄取外来DNA,并且 根据需要,将外来DNA整合至细胞基因组中,这取决于所用的表达载体和所用的转染技术。 为鉴定并选择这些整合体,通常将编码选择标记的基因(如上文所述的基因)连同目的基 因一起导入宿主细胞。这些标记可以在这些基因例如通过常规方法缺失而无功能的突变体 中使用。此外,编码选择标记的核酸序列分子可以在包含编码本发明多肽或本发明方法中 所用多肽的序列的相同载体上,或在独立的载体上导入宿主细胞。已经用所导入核酸序列 稳定转染的细胞可以例如通过选择作用鉴定(例如具有整合的选择标记的细胞存活而其 他细胞死亡)。一旦不再需要所述标记基因时,可以从转基因细胞中移除或切除它们。用于 移除标记基因的技术是本领域已知的,有用的技术在上文定义部分中描述。本发明也提供了用于产生具有提高的产量相关性状的转基因植物的方法,所述方 法包括在植物中导入并表达(i)编码如上文所定义GRF多肽的任意核酸序列;和(ii)编码 如上文所定义SYT多肽的任意核酸序列,所述植物相对于具有(i)编码如上文所定义GRF 多肽的任意核酸序列;或(ii)编码如上文所定义SYT多肽的任意核酸序列表达增加的植物 具有提高的产量相关性状。更具体地,本发明提供了用于产生转基因植物的方法,所述转基因植物相对于具 有⑴编码GRF多肽的核酸序列或(ii)编码SYT多肽的核酸序列之一表达增加的植物具 有提高的产量相关性状,该方法包括a.在植物、植物部分或植物细胞中导入并表达在组成型启动子控制下的编码如上 文所定义GRF多肽的核酸序列;和b.在植物、植物部分或植物细胞中导入并表达在组成型启动子控制下的编码如上 文所定义SYT多肽的核酸序列;和c.在促进植物生长和发育的条件下培育所述植物细胞、植物部分或植物。
46
(i)的核酸序列可以是能够编码如本文所定义GRF多肽的任意核酸序列,并且( )的核酸序列可以是能够编码如本文所定义SYT多肽的任意核酸序列。所述核酸序列可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植 物的任何其他部分)。根据本发明的优选特征,该核酸序列优选地通过转化作用导入植物。 术语“转化”在本文的“定义”部分中更详细地描述。基因修饰的植物细胞可以借助技术人员熟悉的全部方法再生。合适的方法可以在 上文提及的S. D. Kung和R. ffu, Potrykus或Hiifgen和Willmitzer的出版物中找到。通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述 标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植 物。为了选择转化的植物,一般使转化中获得的植物材料经历选择条件,从而转化植物可以 与非转化植物区分开。例如,以上述方式获得的种子可以播种,并且在初始培育时间后,通 过喷洒接受合适的选择。另一种可能性在于种子根据需要消毒后,在使用合适选择剂的琼 脂板上培育,从而仅转化的种子可以长成植物。备选地,筛选所述转化植物的选择标记(如 上文所述的选择标记)的存在性。在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因 的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平 可以使用RNA印迹分析和/或蛋白质印迹分析监测,这两项技术均是本领域普通技术人员 熟知的。产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例 如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并 且1~2植物随后可以通过经典育种技术进一步繁殖。产生的转化生物可以采取多种形式。例 如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达 盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转 化根状茎)。本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩 展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代 转化或转染细胞、组织、器官或完整植物的子代,唯一要求是子代表现与如本发明方法中的 亲本相同的基因型和/或表型特征。本发明也包括宿主细胞,其包含(i)与组成型启动子有效连接的编码如上文所定 义GRF多肽的分离的核酸序列和(ii)与组成型启动子有效连接的编码如上文所定义SYT 多肽的分离的核酸序列。本发明的优选宿主细胞是植物细胞。对于本发明方法中所用核酸 序列或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中 所使用的多肽的全部植物。本发明的方法有利地适用于任意植物。特别在本发明方法中有用的植物包括属于 植物界超家族、尤其属于单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏 植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物 植物的例子包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜籽、棉花、番茄、马铃薯和烟草。更优 选地,所述植物是单子叶植物。单子叶植物的例子包括甘蔗。更优选地,所述植物是禾谷植 物。禾谷植物的例子包括稻、玉米、小麦、大麦、谷子、黑麦、小黑麦属、高粱和燕麦。
本发明也扩展至植物的可收获部分,例如但不限于种子、叶、果实、花、茎、根、根状 茎、块茎和球茎,其中所述的植物包含⑴编码(如上文所定义的)GRF多肽的分离的核酸 序列和(ii)编码(如上文所定义的)SYT多肽的分离的核酸序列。本发明进一步涉及衍生 自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、 淀粉或蛋白质。用于增加核酸序列或基因或基因产物表达的方法是本领域中充分报道的并且在 定义部分中提供了例子。如上所述,用于增加(i)编码GRF多肽的核酸序列和(ii)编码SYT多肽的核酸序 列表达的优选方法是在植物中导入并表达(i)编码GRF多肽的核酸序列和(ii)编码SYT 多肽的核酸序列;然而,也可以使用包括但不限于T-DNA活化标签法、TILLING、同源重组在 内的其他熟知技术实现实施本方法的效果,即提高产量相关性状。在定义部分中提供了这 些技术的描述。本发明也包括⑴编码如文中所述GRF多肽的核酸序列和(ii)编码如文中所述 SYT多肽的核酸序列的用途,和这些GRF多肽和SYT多肽在正常生长条件下、在非生物胁迫 生长条件(优选地在渗透胁迫生长条件)下和在养分可利用性降低的条件下、优选在氮可 利用性降低的生长条件下提高植物中任一前述产量相关性状的用途。编码本文中所述GRF多肽和SYT多肽的核酸序列或所述多肽自身可以用于其中鉴 定到DNA标记的育种程序中,其中所述的DNA标记可以遗传地与编码多肽的基因连锁。所 述基因/核酸序列或GRF多肽和SYT多肽自身可以用来定义分子标记。这种DNA或蛋白质 标记随后可以在育种程序中用来在本发明的方法中选择具有提高的如上文所定义产量相 关性状的植物。编码GRF多肽和SYT多肽的基因/核酸序列的等位变体也可以用于标记辅助的育 种程序中。此类育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等 位变异;备选地,所述程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随 后进行等位变体的鉴定,例如通过PCR法。此后是步骤选择所讨论的和导致产量相关性状 提高的序列的优异等位变体。一般通过监测含有所讨论序列的不同等位变体的植物的生长 性能实施选择。可以在温室中或在田间监测生长性能。其他任选步骤包括将其中鉴定到优 异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征的组合。编码GRF多肽和SYT多肽的核酸序列也可以作为探针用于遗传地或物理地绘制所 述探针构成其一部分的基因并且用作与这些基因连锁的性状的标记。此类信息可以用于植 物育种中,以开发具有所希望表型的品系。编码GRF多肽和/或SYT多肽的核酸序列的这 种用途仅需要具有至少15个核苷酸长度的核酸序列。编码GRF多肽和/或SYT多肽的核 酸序列可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA 印迹物(Sambrook J, Fritsch EF 禾口 Maniatis T (1989)MolecularCloning, A Laboratory Manual)可以用编码GRF多肽的核酸序列探测。所得的结合图式随后可以使用计算机程 序如MapMaker (Lander等人,(1987)Genomics 1:174-181)开展遗传分析以构建遗传图。 此外,所述核酸序列可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的 DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲本和子代。DNA多态性的分 离是明显的并用来计算编码特定多肽的核酸序列在先前使用这个群体获得的遗传图中的位置(Botstein 等人,(1980) Am. J. Hum. Genet. 32 :314_331)。
在Bernatzky和 Tanksley (1986) Plant Mol. Biol. Reporter 4 :37_41 中描述了植 物基因来源的探针的产生及其在遗传作图中的用途。许多出版物描述了使用上文概述的方 法学或其变例对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯 合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。所述核酸序列探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel 等在Non-mammalian Genomic Analyasis :A Practical Guide,Academic press 1996,第 319-346页及其中引用的参考文献)。在另一个实施方案中,所述核酸序列探针可以在直接荧光原位杂交(FISH)作图 法(Trask(1991)Trends Genet. 7 149-154)中使用。尽管当前的FISH作图法支持使用大 的克隆(几个kb至几百个kb ;见Laan等人,(1995) Genome Res. 5 13-20),然而灵敏度的 改善可以允许使用更短探针进行FISH作图。用于遗传作图及物理作图的多种基于核酸序列扩增的方法可以使用所述核酸序 列而实施。方法例子包括等位基因特异性扩增法(Kazazian (1989) J. Lab. Clin. Med 11: 95-96)、PCR 扩增片段的多态性(CAPS ;Sheffield 等人,(1993)Genomics 16:325-332)、 等位基因特异性连接(Landegren等人,(1988) Science 241 1077-1080)、核苷酸延伸反 应(Sokolov(1990)NucleicAcid Res. 18 :3671)、放射杂交作图(Walter 等人,(1997)Nat. Genet. 7 22~28)和 Happy 作图法(Dear 和 Cook (1989) Nucleic Acid Res. 17 :6795_6807)。 对于这些方法,使用一种核酸序列的序列来设计并产生在扩增反应或在引物延伸反应中使 用的引物对。此类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法 中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲本之间的DNA序列差异。 然而,这对作图法而言通常不是必需的。如前文所述,本发明方法产生了具有提高的产量相关性状的植物。这些性状也可以 与经济上有利的其他性状组合,如其他的产量提高性状、非生物胁迫和生物胁迫耐受性、除草 齐U、杀虫剂耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。附图简述本发明现在将参考以下图进行描述,其中
图1代表如SEQ ID NO 2所代表的GRF多肽的卡通图,其中所述GRF多肽包含以 下特征⑴具有InterPro登录号IPR014978 (PFAM登录号PF08880)的QLQ结构域;(ii) 具有InterPro登录号IPR014977(PFAM登录号PF08879)的WRC结构域;和(iii)以保守间 隔(CX9CXltlCX2H)包含3个Cys和1个His残基并位于WRC结构域中的转录效应子(ET)结 构域。图2显示来自表A. 1的GRF多肽的(对于SEQ ID NO :2,如SEQ IDNO 115所代表 的)QLQ结构域的(来自Invitrogen公司Vector NTI 10. 3的)AlignX多重序列比对结果。 保守QLQ氨基酸残基位于多重比对的顶部。(用黑色框框定的)两个另外的非常保守残基 是 E (Glu)和 P (Pro)。图3显示来自表A. 1的GRF多肽的(对于SEQ ID NO :2,如SEQ IDNO 116所代表 的)WRC结构域的(来自Invitrogen公司Vector NTI 10. 3的)AlignX多重序列比对结果。 在共有序列中以粗体标出保守的WRC氨基酸残基。在整个比对范围内用方框垂直地标出并在比对的底部鉴定到称为转录效应子(ET)结构域的保守间隔(CX9CXltlCX2H)中的3个Cys 和1个His残基。用双下划线标出WRC结构域中所包含的推定的核定位信号(NLS)。 图4显示来自植物和哺乳动物的SYT多肽的一般结构域结构。保守的SNH结构域 位于所述多肽的氨基端。该多肽的剩余羧基端在植物SYT多肽中由QG丰富结构域构成,并 且在哺乳动物SYT多肽中由QPGY丰富结构域构成。Met丰富结构域通常包含于植物中QG 丰富(从氨基端至羧基端)或哺乳动物中QPGY丰富的前半部分内。第二个Met丰富结构 域可以位于植物SYT多肽中的SNH结构域之前。图5显示几种SYT多肽的氨基端的多重比对结果,以空位开口罚分10和空位延 伸 0. 05 的默认设置,使用基于改良 ClustalW 算法(InforMax, Bethesda, MD, http //www. informaxinc. com)的VNTI AlignX多重比对程序。在植物SYT多肽及人SYT多肽的范围内 加框标出SNH结构域。比对结果中的最后一行由衍生自所比对序列的共有序列组成。图6显示几种植物SYT多肽的多重比对结果,以空位开口罚分10和空位延伸 0.05 的默认设置,使用基于改良 ClustalW 算法(InforMax, Bethesda, MD, http //www. informaxinc. com)的VNTI AlignX多重比对程序。从氨基端至羧基端加框标出两个主要结 构域并将它们鉴定为SNH结构域和Met丰富/QG丰富结构域。另外,也将氨基端Met丰富 结构域加框标出,并以加粗下划线标出SEQ ID N0:90和SEQ ID NO 91的位置。图7在左边显示来自用对照载体所转化稻植物(粳稻栽培品种日本晴(Oryza sativa ssp. Japonica cv. Nipponbare))的谷穗并在右边显示来自用两种构建体所转化稻 植物(粳稻栽培品种日本晴)的谷穗,其中所述两种构建体是(1)在来自稻的G0S2启动 子(pG0S2)控制下的编码GRF多肽的核酸序列;和(2)在来自稻的G0S2启动子(pG0S2)控 制下的编码SYT多肽的核酸序列。图8在上面一行从左至右显示来自以下植物的30粒成熟稻种子(粳稻栽培品种 日本晴)a.用一种构建体转化的植物,所述构建体包含在来自稻的G0S2启动子(pG0S2)控 制下的编码SYT多肽的核酸序列;b.用以下两种构建体转化的植物(1)在来自稻的G0S2启动子(pG0S2)控制下的 编码GRF多肽的核酸序列;和(2)在来自稻的G0S2启动子(pG0S2)控制下的编码SYT多肽 的核酸序列;c.用一种构建体转化的植物,所述构建体包含在来自稻的G0S2启动子(pG0S2)控 制下的编码GRF多肽的核酸序列;d.来自a的失效合子植物(对照植物);e.来自c的失效合子植物(对照植物)。图9显示双元载体,该双元载体用于稻中增加在来自稻的G0S2启动子(pG0S2) 控制下的编码GRF多肽的核酸序列表达,或备选地用于稻中增加在来自稻的G0S2启动子 (PG0S2)控制下的编码SYT多肽的核酸序列表达。
图10详述了在实施本发明方法中有用的序列的例子。
实施例本发明现在参考如下实施例进行描述,所述实施例仅是示意性的。以下实施例不意图完全限定或限制本发明的范围。DNA操作除非另外说明,重组DNA技术根据(Sambrook(2001)Molecular Cloning :a laboratory manual,第 3 版 Cold Spring HarborLaboratory Press, CSH, New York)或 Ausubel 等人,(1994), CurrentProtocols in Molecular Biology, Current Protocols第1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料 和方法在BIOS科学出版有限责任公司(BIOS Scientific Publications Ltd(英国))和 Blackwell 科学出版社(Blackwell Scientific Publications (英国))出版的 R. D. D. Croy 的 Plant Molecular Biology Labfax (1993)中描述。实施例1 鉴定与本发明方法中所用核酸序列相关的序列用数据库搜索工具如基本局部比对工具(BLAST) (Altschul等人,(1990)J.Mol. Biol. 215 403-410 ;和 Altschul 等人,(1997) Nucleic Acids Res. 25 :3389_3402),在国家 生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列中鉴定到与本发明方 法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。使用该程序通过将核酸序列 或多肽序列与序列数据库比较并且计算匹配的统计显著性来找到序列之间的局部相似性 区域。由本发明核酸序列编码的多肽用于TBLASTN算法,采用默认设置和过滤程序以略去 低复杂性序列启动。该分析的输出结果通过逐对比较进行检验,并根据概率评分(E-值)进 行评级,其中所述的评分反映特定比对结果偶然发生的概率(E-值越低,命中的显著性越 高)。除E-值外,比较也可以通过同一性百分数评分。同一性百分数指两个所比较的核酸 (或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在一些情况下,可 以调整默认参数以调节搜索的严格性。例如,可以提高E-值以显示严格性更低的匹配。以 这种方式,可以鉴定到短的近乎完全的匹配。表A. 1提供了编码在实施本发明方法中有用的GRF多肽的相关核酸序列的名单。 表A. 2提供了编码在实施本发明方法中有用的SYT多肽的相关核酸序列的名单。表A. 1 :GRF多肽序列和编码GRF的核酸序列的例子 表A. 2 =SYT多肽序列和编码SYT的核酸序列的例子 在一些情况下,相关序列已经由研究机构如基因组研究机构(TIGR)初步地汇编 并且公开披露。可以使用真核生物基因直向同源物(EGO)数据库来鉴定此类相关序列,这可通过关键词搜索或通过使用BLAST算法以目的核酸序列或多肽序列进行。在其他情况 下,已经对特定生物创建了专用核酸序列数据库,如由联合基因组研究所(Joint Genome Institute)例如对杨(poplar)和Ostreococcus tauri创建的专用核酸序列数据库。实施例2 在实施本发明方法中有用的多肽序列的比对GRF多肽序列的比对使用(来自Invitrogen 公司 Vector NTI 10. 3 的)Alignment X 算法进行表 A. 1 中全部GRF多肽序列的多重序列比对。在本申请的图2中显示来自表A. 1的(如对SEQ ID NO 2的SEQ ID NO 115所代表的)GRF多肽的QLQ结构域的比对结果。保守的QLQ氨基酸 残基位于多重比对结果的顶部。(用黑色框框定的)两个另外的非常保守残基是E(Glu)和 P (Pro) ο在本申请的图3中显示来自表A. 1的(如对SEQ ID NO :2的SEQ ID Ν0:116所代 表的)GRF多肽的WRC结构域的比对结果。在共有序列中以粗体标出保守的WRC氨基酸残 基。在比对结果的底部鉴定了以保守间隔(CX9CXltlCX2H)包含3个Cys和1个His残基的转 录效应子(ET)结构域。SYT多肽序列的比对使用(来自Invitrogen 公司 Vector NTI 10. 3,基于改良 ClustalW 算法的) AlignX算法,以空位开口罚分10和空位延伸0. 05的默认设置进行表A. 2中全部SYT多肽 序列的多重序列比对,并且在图6中显示多重比对结果。从氨基端至羧基端加框标出两个 主要结构域并将它们鉴定为SNH结构域和Met丰富/QG丰富结构域。另外,也将氨基端Met 丰富结构域加框标出。在本申请的图5中显示来自表A. 2的(如对SEQ ID NO 2的SEQ IDNO 115所代 表的)SYT多肽的SNH结构域的比对结果。以黑色框标出如SEQ ID NO 263所代表的SNH 结构域内部的最保守氨基酸残基。实施例3 计算在实施本发明方法中有用的多肽序列之间的总体同一性百分数使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics. 2003 4 29. MatGAT 使用蛋白质序列或DNA序列产生相似性/同一性矩 P车的一 Ρ 用(an application that generatessimilarity/identity matrices using protein or DNA sequences), CampanelIaJJ, Bitincka L, Smalley J 亥软件由 Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一 性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需预先比对 数据。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2) 执行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后 将结果置于距离矩阵中。在分割线下半部分显示序列相似性,并且在对角分割线的上半部 分显示序列同一性。比较中使用的参数是评分矩阵Blosum62第一空位12
延伸空位2在表B. 1中显示GRF多肽序列全长(不包括部分多肽序列)范围内整体相似性和 同一性的软件分析结果,并在表B. 2中显示SYT多肽序列全长范围内整体相似性和同一性的软件分析结果。与SEQ ID NO 2相比较,在实施本发明方法中有用的全长GRF多肽序列之间的同 一性百分数可以低至15%氨基酸同一性。如果在SEQ ID NO 2的QLQ结构域(如由SEQ ID NO 2中包含的SEQ ID NO 115 所代表;图2中代表的表A. 1的GRF多肽的QLQ结构域)和用于实施本发明的多肽的QLQ 结构域之间开展同一性计算,能相当大程度地提高同一性百分数。类似地,如果在SEQ ID NO :2的WRC结构域(如由SEQ ID NO :2中包含的SEQ ID NO 116所代表;图3中代表的表 A. 1的GRF多肽的WRC结构域)和用于实施本发明的多肽的WRC结构域之间开展同一性计 算,能相当大程度地提高同一性百分数。在用于开展实施本发明的多肽序列之间的QLQ结 构域范围内的同一性百分数范围是在25%和99%氨基酸同一性之间,并且在在实施本发 明方法中有用的多肽序列之间的WRC结构域范围内的同一性百分数范围是在60%和99% 氨基酸同一性之间。如图3中也可以观察到,不同GRF多肽之间的WRC结构域比如图2中 所示的QLQ结构域更保守。QLQ结构域之间的氨基酸同一性百分数和WRC结构域之间的同一性百分数显著高 于全长GRF多肽序列之间所计算的氨基酸同一性百分数。
如果在(SEQ ID NO 121中包含的)如SEQ ID NO 262所代表的SNH结构域和用 于实施本发明的多肽的SNH结构域之间开展同一性计算,能相当大程度地提高同一性百分 数。在在实施本发明方法中有用的多肽序列之间的SNH结构域范围内的同一性百分数范围 是在30%和99%氨基酸同一性之间。表A. 2的多肽的SNH结构域之间的氨基酸同一性百分数显著高于全长SYT多肽序 列之间所计算的氨基酸同一性百分数。实施例4 鉴定在实施本发明方法中有用的多肽序列中所包含的结构域蛋白质家族、结构域和位点的集成资源(InterPro)数据库是针对基于文本及基 于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库, 所述数据库使用不同的方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得 蛋白质特征标识(proteinsignatures)。合作数据库包括 SWISS-PROT、PROS ITE, TrEMBL, PRINTS、ProDom和Pfam,Smart和TIGRFAM。Interpro由英国欧洲生物信息学研究所维护。在表C. 1中呈现如SEQ ID NO 2所代表的多肽序列的InterPro扫描结果。表C. 1 如SEQ ID NO 2所代表的多肽序列的InterPro扫描结果 在表C. 2中呈现如SEQ ID NO 121所代表的多肽序列的InterPro扫描结果。表C. 2 如SEQ ID NO 121所代表的多肽序列的InterPro扫描结果 另外,也可以轻易地鉴定SYT多肽序列中存在Met丰富结构域或QG丰富结构域。 如图6中所示,Met丰富结构域和QG丰富结构域在SNH结构域之后。QG丰富结构域可以 视为(扣除SHN结构域的)多肽的基本上羧基端剩余物;Met丰富结构域通常包含于QG丰 富(从氨基端至羧基端)结构域的前半部分内。使用来自ExPASy服务器(Gasteiger等(2003)ExPASy 用于深入认识和分析蛋白质的蛋白质组服务器(The proteomics server forin-depth protein knowledge and analysis),Nucleic Acids Res. 31 :3784_3788)的 软件程序、尤其ProtParam工具,可以计算确定多肽结构域是否富含特定氨基酸的一级氨 基酸组成(% )。目的多肽的组成随后可以与Swiss-Prot蛋白质序列数据库中的平均氨基 酸组成(% )(表C. 3)比较。在这个数据库中,平均Met (M)含量是2. 37 %,平均Gln (Q)含量 是3. 93%并且平均Gly (G)含量是6. 93% (表C. 3)。如本文定义,Met丰富结构域或QG丰 富结构域具有高于Swiss-Prot蛋白质序列数据库中平均氨基酸组成(%)的Met含量(%) 或Gln及Gly含量(% )。例如在SEQ ID NO 121中,在氨基端处SNH结构域之前的Met丰 富结构域(从第1至第24氨基酸位置)具有20. 8%的Met含量并且QG丰富结构域(从第 71至第200氨基酸位置)具有18. 6%的Gln(Q)含量和21. 4%的Gly (G)含量。优选地,如 本文定义的Met结构域具有这样的Met含量(%),其是Swiss-Prot蛋白质序列数据库中包 括的所述类型蛋白质序列的平均氨基酸组成(% )的至少1. 25、1. 5,1. 75,2. 0,2. 25,2. 5、 2. 75、3· 0、3· 25、3· 5、3· 75、4· 0、4· 25、4· 5、4· 75、5· 0、5· 25、5· 0、5· 75、6· 0、6· 25、6· 5、6· 75、 7. 0,7. 25,7. 5,7. 75,8. 0,8. 25,8. 5,8. 75,9. 0,9. 25,9. 5,9. 75,10 或更多。优选地,如本文 定义的QG丰富结构域具有这样的Gln (Q)含量和/或Gly (G)含量,其是Swiss-Prot蛋白质 序列数据库中包括的所述类型蛋白质序列的平均氨基酸组成(% )的至少1. 25,1. 5,1. 75、 2. 0、2· 25、2· 5、2· 75、3· 0、3· 25、3· 5、3· 75、4· 0、4· 25、4· 5、4· 75、5· 0、5· 25、5· 0、5· 75、6· O、 6. 25、6· 5、6· 75,7. 0、7· 25,7. 5、7· 75,8. 0、8· 25、8· 5、8· 75,9. 0、9· 25、9· 5、9· 75,10 或更多。表C. 3 =SffISS PROT蛋白质序列数据库(2004年7月)中蛋白质的平均氨基酸组 成(%) 实施例5 在实施本发明方法中有用的GRF多肽序列的亚细胞定位预测用于蛋白质定位的实验方法的范围从免疫定位至使用绿色荧光蛋白(GFP)或 β-葡糖醛酸酶(⑶S)对蛋白质加标签。例如,融合于GUS报道基因的GRF多肽用来瞬时转 化洋葱上皮细胞(van der Knapp等人,(2000) Plant Phys 122:695-704)。鉴定细胞核作 为GRF多肽的亚细胞区室。鉴定GRF多肽亚细胞区室化的此类方法是本领域熟知的。 通过多重序列比对、随后通过目视检查在表A的GRF多肽的WRC结构域 (CRRTDGKKWRC)中找到预测的核定位信号(NLS)。NLS是具有带正电荷的赖氨酸或精氨酸的 一个或多个短序列。从序列数据中计算机预测蛋白质定位。在瑞士生物信息研究所维护的ExPASy蛋 白质组工具上可获得本领域技术人员熟知的算法当中的例如PSort、TargetP, ChloroP, LocTree, Predotar, LipoP, MITOPROT, PATS、PTSU SignalP 等。LOCTree能预测非植物和植物真核生物以及原核生物中非膜蛋白的亚细胞定位和 DNA-结合倾向的算法。LOCTree将真核动物蛋白划分成5个亚细胞类别之一,而将植物蛋 白划分成6个亚细胞类别之一,并且原核蛋白质划分成3个亚细胞类别之一。下表D显示 使用SEQ ID NO :2的多肽序列信息的LOCTree输出结果。高置信度预测具有大于5的可靠 性指数值。表D使用SEQ ID NO 2的多肽序列信息的LOCTree输出结果。 使用LOCTree算法,如SEQ ID NO 2所代表的GRF多肽的预测亚细胞区室是细胞核。实施例6 与在实施本发明方法中有用的多肽序列相关的测定法用于本发明方法的GRF多肽和SYT多肽(至少以它们的天然形式)一般,但并 非必须具有转录调节活性和与其他蛋白质相互作用的能力。可以使用本领域熟知的技术 (例如在 Current Protocols in Molecular Biology,第 1 禾口 2 卷,Ausubel 等人,(1994), Current Protocols中)轻易地在体外或体内确定DNA结合活性和蛋白质-蛋白质相互作 用。GRF多肽能够在酵母细胞中转录地激活报道基因(Kim和Kende (2004)Proc Natl Acad ScilOl (36) 13374-13379)。使用酵母双杂交蛋白质-蛋白质相互作用测定法,GRF多肽也 能够在酵母细胞中与SYT多肽(又叫做GRF相互作用因子或GIF)在体内相互作用(上文 的Kim和Kende)。也使用体外结合测定法来显示GRF多肽和SYT多肽是相互作用的配偶物 (上文的Kim和Kende)。该出版物中所述的实验用于表征GRF多肽和SYT多肽,并且是本 领域熟知的。实施例7 在实施本发明方法中有用的核酸序列的克隆除非另外说明,重组DNA 技术根据(Sambrook(2001)MolecularCloning :a laboratory manual,第 3 版 Cold Spring Harbor LaboratoryPress, CSH, New York)或在Ausubel 等人(1994),Current Protocols inMolecular Biology, Current Protocols 第1 卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料和方法在BIOS科学 出版有限责任公司(BIOS Scientific Publications Ltd(英国))和Blackwell科学出版 社(Blackwell Scientific Publications (英国))出版的 R. D. D. Croy 的 PlantMolecular Biology Labfax(1993)中描述。克隆由SEQ ID NO 1代表的核酸序列使用从mRNA合成的拟南芥cDNA库作为模板,通过PCR扩增编码如SEQ ID N0:2所 代表的GRF多肽序列的拟南芥cDNA,其中所述mRNA从混合的植物组织提取。引物prm08136 SEQ ID NO 42 :5'-ggggaccactttgtacaagaaagctgggttaaaaaccattttaacgcacg) ^!! Μ Gateway重组的AttB位点的以下引物用于PCR扩增l)Prm 10010 (SEQ ID N0:118,有义)5’ -GGGGACAAGTTTGTACAAAAAAGCAGGCTTAAACAATGATGAGTCTAAGTGGAAGTAG-3’2) Prm 10011 (SEQ ID N0:119,反向互补)5’ -GGGGACCACTTTGTACAAGAAAGCTGGGTAGCTCTACTTAATTAGCTACCAG-3’。克隆由SEQ ID NO 120代表的核酸序列使用从mRNA合成的拟南芥cDNA库作为模板,通过PCR扩增编码如SEQ ID N0:121 所代表的SYT多肽序列的拟南芥cDNA,其中所述mRNA从混合的植物组织提取。包括用于 Gateway重组的AttB位点的以下引物用于PCR扩增l)Prm06681(SEQ ID NO:265,有义)5 ’ -GGGGACAAGTTTGTACAAAAAAGCAGGCTTAAACAATGCAACAGCACCTGATG-3’2) Prm 06682 (SEQ ID N0:266,反向互补)5’ -GGGGACCACTTTGTACAAGAAAGCTGGGTCATCATTAAGATTCCTTGTGC-3’。使用Hifi Taq DNA聚合酶在标准条件下对SEQ ID NO 1和SEQ IDNO 120独立地 进行PCR反应。使用标准方法扩增和纯化具有预期长度的PCR片段。随后进行Gateway方 法的第一步骤,即BP反应,在此期间,所述PCR片段与pD0NR201质粒在体内重组以产生根 据Gateway术语学的“进入克隆(entry clone)”。质粒pD0NR201作为Gateway 技术的 部分从Invitrogen购买。实施例8 使用如SEQ ID NO 1和SEQ ID NO 120所代表的核酸序列构建表达载 体独立地包含SEQ ID NO 1和SEQ ID NO 120的进入克隆随后独立地在LR反应中 连同用于稻转化法的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标 记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组 的Gateway盒作为功能性元件。用于组成型表达的稻G0S2启动子(SEQ ID N0 117)位于 该Gateway盒上游。在LR重组步骤后,所得表达载体PG0S2 GRF和pG0S2 SYT (图9)根据本领域熟 知方法独立地转化入农杆菌菌株LBA4044。实施例9:植物转化稻转化使用含有表达载体pG0S2: :SYT的农杆菌来转化稻植物。将粳稻栽培品种日本晴(Nipponbare)的成熟干燥种子脱壳。通过如下方式实施消毒在70%乙醇中孵育1分钟, 随后在0. 2% HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后 在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将胚发生 的盾片衍生性愈伤组织切下并在相同的培养基上增殖。2周后,将所述愈伤组织通过在同一 种培养基上传代培养另外2周进行繁殖或增殖。胚发生的愈伤组织片在新鲜培养基上传代 培养3日,随后共培育(以助长细胞分裂活性)。将含有每一单个表达载体的农杆菌菌株LBA4404独立地用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28°C培养3日。随后收集细菌并在液体共培育培养 基中悬浮至密度(OD6J约1。该混悬液随后转移至培养皿内并将所述愈伤组织浸入此混悬 液中15分钟。该愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并在25°C于黑 暗中孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28°C于黑暗中在存在选择剂时 培育4周。在此期间,迅速生长的抗性愈伤组织团发育。将这种材料转移至再生培养基并 在光照下孵育后,胚发生潜能释放并且苗在随后4至5周内发育。将苗从愈伤组织上切下 并且在含有植物生长素的培养基上孵育2至3周,将苗从所述培养基转移至土壤。硬化的 苗在温室中于高湿度和短日照下培育。对于每一个构建体,产生大约35个独立的TO稻转化体。将原代转化体从组织培 养箱转移至温室。在定量PCR分析验证T-DNA插入物的拷贝数后,仅保留显示所述选择剂 抗性的单拷贝转基因植物用于收获Tl种子。种子随后在移栽后3至5个月收获。该方法 以超过50%的比例产生单基因座转化体(Aldemita和Hodgesl996,Chan等1993,Hiei等 1994)。稻的再转化稻的再转化在本文中意指转化已经对另一种构建体为转基因的稻植物。特别地,用实施例7的表达载体再转化从转基因纯合植物收获的种子,其中所述 的转基因纯合植物表达编码SYT多肽的核酸序列。除了初始植物来源材料上的这点差异和 与初始转化的选择标记相比使用不同的再转化选择标记之外,该方法的其余部分如上文所 述。实施例10 表型评价方法10. 1评价建立产生大约35个独立的TO稻再转化体。这些植物进一步从组织培养室转移至温室 以培育和收获Tl种子。温室条件是短日照(12小时光照),在光照下28°C和在黑暗中22°C, 和70%相对湿度。进行PCR检验以检查⑴编码如SEQ ID NO 2所代表的GRF多肽的分离核酸转基 因和(ii)编码如SEQ ID NO :121所代表的SYT多肽的分离核酸转基因的存在性。也对启 动子、终止子和植物选择标记的存在和拷贝数进行PCR检验。进一步培育所选的转基因植 物直至对两个转基因性基因座为纯合。10. 2统计分析F-检验使用两因素ANOVA(变量分析)作为总体评价植物表型特征的统计模型。对于用 本发明基因转化的全部事件的全部植物测量的全部参数实施F检验。实施F检验以检查该 基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于所述F检验设置在5%概率水平上。显著性F检验值指出基因 作用,这意味不仅仅是基因的存在或位置才造成表型上的差异。10. 3测量的参数
种子相关的参数测量值使用定制装置测量各种种子参数(包括宽度、长度、面积),所述定制装置由两个 主要组件、偶联至图像分析软件的一个称重和成像装置组成。实施例11 来自从再转化稻植物收获的种子的种子尺寸测量的结果表达在组成型启动子控制下的编码如SEQ ID NO 121所代表的SYT多肽的核酸序 列的纯合转基因稻植物用上文实施例7的表达载体再转化,所述表达载体包含也在组成型 启动子控制下的编码SEQ ID NO :2的GRF多肽的核酸序列。进一步培育再转化的稻植物直 至对两个基因座均为纯合。图7在左边显示来自用对照载体所转化稻植物(粳稻栽培品种日本晴(Oryza sativa ssp. Japonica cv. Nipponbare))的谷穗并在右边显示来自用两种构建体所转化稻 植物(粳稻栽培品种日本晴)的谷穗,其中所述两种构建体是(1)在来自稻的G0S2启动 子(pG0S2)控制下的编码GRF多肽的核酸序列;和(2)在来自稻的G0S2启动子(pG0S2)控 制下的编码SYT多肽的核酸序列。用这两种构建体转化的稻植物对两个基因座均为纯合。 与用对照载体所转化稻中的相同参数相比,再转化稻中的植物生物量、穗数、穗尺寸、种子 数和种子尺寸明显提高。收获了从再转化稻植物所收获的并对两个基因座均为纯合的种子,并对30粒种 子的样品拍照。图8在上面一行从左至右显示来自以下植物的30粒成熟稻种子(粳稻栽 培品种日本晴)(a)用一种构建体转化的植物,所述构建体包含在来自稻的G0S2启动子(pG0S2) 控制下的编码如SEQ ID NO 120所代表的SYT多肽的核酸序列;(b)用以下两种构建体转化的植物(1)在来自稻的G0S2启动子(pG0S2)控制 下的编码如SEQ ID NO 2所代表的GRF多肽的核酸序列;和(2)在来自稻的G0S2启动子 (PG0S2)控制下的编码如SEQ ID NO 120所代表的SYT多肽的核酸序列;(c)用一种构建体转化的植物,所述构建体包含在来自稻的G0S2启动子(pG0S2) 控制下的编码如SEQ ID NO 2所代表的GRF多肽的核酸序列;(d)来自a的失效合子植物(对照植物);(e)来自c的失效合子植物(对照植物)。通过简单的目视检查可见到种子尺寸提高。使来自6个转基因事件的纯合种子成像以估计平均种子面积、平均种子长度和平 均种子宽度,并随后与在(i)来自用包含编码SYT多肽的核酸序列的一种构建体所转化植 物的纯合种子中和在(ii)来自(i)的对照植物(失效合子)的种子中测量的相同参数进 行比较。下表E中显示结果。表E 相对于合适的对照种子,从纯合的再转化稻植物所收获种子的种子面积、种 子长度和种子宽度测量的结果 实施例12 其他作物转化的例子玉米转化玉米(Zeamays)的转化用 Ishida 等人(1996) Nature Biotech 14(6) :745_50 描 述的改良方法进行。在谷物中,转化是基因型依赖的并且仅特定基因型适合于转化和再生。 近交系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材料的良好 来源,不过也可以成功地使用其他基因型。谷穗从授粉后大约11日(DAP)的谷物植物收 获,此时不成熟的胚的长度是大约1至1. 2mm。将不成熟的胚与含有所述表达载体的根癌 农杆菌共培育,并且通过器官发生过程回收转基因植物。切下的胚在愈伤组织诱导培养基 上、随后在玉米再生培养基上培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可 以使用不同的选择标记)。培养板在25°C于光照下孵育2-3周,或直至苗发育。将来自每 个胚的绿色苗转移至玉米生根培养基并在25°C孵育2-3周,直至根发育。将生根的苗移植 至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产 生Tl种子。小麦转化小麦的转化用Ishida 等人(1996)Nature Biotech 14(6) :745_50 描述的方法进 行。栽培品种Bobwhite (可从墨西哥CIMMYT获得)通常用于转化。将不成熟的胚与含有 所述表达载体的根癌农杆菌共培育,并且通过器官发生过程回收转基因植物。与农杆菌孵 育后,所述胚在愈伤组织诱导培养基上、随后于再生培养基上体外培育,其中所述的培养基 含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25°C于光照下孵 育2-3周,或直至苗发育。将来自每个胚的绿色苗转移至生根培养基并在25°C孵育2-3周, 直至根发育。将生根的苗移植至温室中的土壤内。从显示选择剂耐受性并且含有单拷贝 T-DNA插入物的植物产生Tl种子。大豆转化根据Texas A&M美国专利5,164,310中描述的改良方法转化大豆。几个商业大豆 品种适合于通过这种方法转化。栽培品种Jack (从Illinois种子基金会可获得)通常用于 转化。将大豆种子消毒以体外播种。从7日龄年幼籽苗切除下胚轴、胚根和一片子叶。进 一步培育上胚轴和剩余的子叶以发育腋生结节。将这些腋生结节切下并与含有表达载体的 根癌农杆菌孵育。在共培育处理之后,将外植体洗涤并转移至选择培养基。将再生的苗切 下并置于苗伸长培养基上。将长度不超过Icm的苗置于生根培养基上直至根发育。将生根 的苗移植至温室中的土壤内。从显示选择剂耐受性并且含有单拷贝T-DNA插入物的植物产生Tl种子。油菜籽/卡诺拉油菜转化使用5-6日龄年幼籽苗的子叶柄和下胚轴作为组织培养用外植体并且根据Babic等人,(1998,Plant Cell Rep 17 :183_188)进行转化。商业品种 Westar (Agriculture Canada)是用于转化的标准品种,不过也可以使用其他品种。对卡诺拉油菜种子进行表面 消毒以体外播种。从所述体外籽苗切下带有子叶的子叶柄外植体,并且用(含有表达载体 的)农杆菌通过该叶柄外植体的切口末端浸入细菌悬液而接种。所述外植体随后在23°C, 16小时光照下于含有3mg/l BAP、3%蔗糖、0. 7%植物琼脂的MSBAP-3培养基上培养2日。 与农杆菌共培育2日后,将叶柄外植体转移至含有3mg/l BAP、头孢噻肟、羧苄青霉素或特 美汀(300mg/l)的MSBAP-3培养基上培养7日,并且随后在含有头孢噻肟、羧苄青霉素或特 美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗长度是5-10mm时,将这些苗切 下并转移至苗伸长培养基(MSBAP-0. 5,含有0. 5mg/l BAP)。将长度大约2cm的苗转移至用 于根诱导的生根培养基(MSO)。将生根的苗移植至温室中的土壤内。从显示选择剂耐受性 并且含有单拷贝T-DNA插入物的植物产生Tl种子。苜蓿转化使用(McKersie等,1999 Plant Physiol 119:839-847)的方法转化苜蓿的再生 性克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得 再生性植物的方法。例如,这些再生性植物可以选自栽培品种Range lander (Agriculture Canada)或如Brown DCW禾口AAtanassov(1985. Plant Cell Tissue Culture 4:111—112)所 述的任何其他商业苜蓿品种。备选地,已经选择RA3品种(威斯康星大学)用于组织培养 (Walker等,1978 Am J Bot 65 :654_659)。叶柄外植体与含有表达载体的根癌农杆菌C58C1 pMP90 (McKersie 等,1999 Plant Physiol 119 :839_847)或 LBA4404 的过夜培养物共培育。 所述外植体在黑暗中于含有288mg/LPro、53mg/L硫代脯氨酸、4. 35g/L K2SO4和100 μ π!乙 酰丁香酮的SH诱导培养基上共培育3日。所述外植体在半浓度的Murashige-Skoog培养 基(Murashige和Skoog,1962)中洗涤并铺种在不含乙酰丁香酮而含有抑制农杆菌生长的 合适选择剂和合适抗生素的相同SH诱导培养基上。几周后,将体细胞胚转移至不含生长调 节剂、不含抗生素和含有50g/L蔗糖的B0i2Y发育培养基。随后在半浓度Murashige-Skoog 培养基上萌发体细胞胚。将生根的籽苗移植至花钵内并且在温室中培育。从显示选择剂耐 受性并且含有单拷贝T-DNA插入物的植物产生Tl种子。棉属植物转化使用根癌农杆菌,在下胚轴外植体上进行棉花(Gossypium hirsutum L.)转化。商 业品种如Coker 130或Coker 312(SeedCo,Lubbock, TX)是用于转化的标准品种,不过也 可以使用其他品种。将种子进行表面消毒并在黑暗中萌发。将下胚轴外植体从萌发的籽苗 切下呈约1-1. 5厘米长。将该下胚轴外植体浸入含有表达载体的根癌农杆菌接种物中5分 钟,随后在24°C于黑暗下在MS+1. 8mg/l KN03+2%葡萄糖上共培育约48小时。将所述外植 体转移至含有适宜的细菌选择标记和植物选择标记的相同培养基(更换数次),直至见到 胚发生的愈伤组织。将所述愈伤组织分开并传代培养直至体细胞胚出现。从体细胞胚衍生 的小植物在生根培养基上成熟直至根发育。将生根的苗移植至温室中的盆栽土壤内。从显 示选择剂耐受性并且含有单拷贝T-DNA插入物的植物产生Tl种子。
权利要求
用于提高植物产量相关性状的方法,包括增加植物中以下核酸序列的表达(i)编码生长调节因子(GRF)多肽的核酸序列和(ii)编码滑膜肉瘤易位(SYT)多肽的核酸序列,其中所述的产量相关性状相对于具有(i)编码GRF多肽的核酸序列或(ii)编码SYT多肽的核酸序列之一表达增加的植物提高。
2.根据权利要求1的方法,其中所述的GRF多肽包含⑴与如SEQIDNO :115所代表的 QLQ 结构域具有至少 50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,98%,99% 或更多氨基酸序列同一性的结构域;和(ii)与如SEQ ID NO 116所代表的WRC结构域具有 至少 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99% 或更多氨基酸序 列同一性的结构域。
3.根据权利要求1或2的方法,其中所述GRF多肽包含(i)具有InterPro登 录号II3RO14978 (PFAM登录号PF08880)的QLQ结构域;(ii)具有InterPro登录号 IPRO14977 (PFAM登录号PF08879)的WRC结构域;和(iii)以保守间隔(CX9CX10CX2H)包含 3个Cys和1个His残基的转录效应子(ET)结构域。
4.根据任一前述权利要求所述的方法,其中所述的GRF多肽以增加的优选顺序与如 SEQ ID NO 2所代表的GRF多肽或与本文表A. 1中给出的任一多肽序列具有至少50%、 55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99% 或更多氨基酸序列同一性。
5.根据任一前述权利要求所述的方法,其中所述的编码GRF多肽的核酸序列由表A.1 中给出的任一核酸序列SEQ ID NO或其部分或者由能够与表A. 1中给出的任一核酸序列 SEQ ID NO杂交的序列代表。
6.根据任一前述权利要求所述的方法,其中所述的核酸序列编码表A.1中给出的任一 GRF多肽序列SEQ ID NO的直向同源物或旁系同源物。
7.根据任一前述权利要求所述的方法,其中所述的编码GRF多肽的核酸序列有效连 接至组成型启动子、更优选地有效连接至G0S2启动子、最优选地有效连接至如SEQ ID NO 117所代表的来自稻的G0S2启动子。
8.根据任一前述权利要求所述的方法,其中所述的编码GRF多肽的核酸序列是植物来 源的,优选地来自双子叶植物,进一步优选地来自十字花科(Brassicaceae),最优选地来自 拟南芥(Arabidopsis thaliana)。
9.根据权利要求1的方法,其中所述的核酸序列编码SYT多肽,其中所述的SYT多肽 从氨基端至羧基端包含(i)以增加的优选顺序与SEQ IDNO :262的SNH结构域具有至少 20%,25%,30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的 SNH 结构域;和(ii)Met 丰富结构域;及(iii)QG丰富结构域。
10.根据权利要求1或9的方法,其中所述的SYT多肽还包含如SEQIDNO 263所代表 的并在图5中以黑色显示的SNH结构域的最保守残基。
11.根据权利要求1、9或10任一项的方法,其中所述的SYT多肽包含以增加的优选顺 序与具有SEQ ID NO :264的InterPro登录号IPR007726的SSXT结构域具有至少20%、 25%,30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,91 92%、93%、94%、95%、96%、97%、98%、99% 序列同一性的结构域。
12.根据权利要求1、9或10任一项的方法,其中所述的SYT多肽以增加的优选顺序与如SEQ ID NO 121所代表的SYT多肽或与本文表Α. 2中给出的任一全长多肽序列具有至 少 20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、 95%、98%、99%或更多氨基酸序列同一性。
13.根据权利要求1、9、10、11或12任一项的方法,其中所述的编码SYT多肽的核酸序 列由表Α. 2中给出的任一核酸序列SEQ ID NO或其部分或者由能够与表Α. 2中给出的任一 核酸序列SEQ ID NO杂交的序列代表。
14.根据权利要求1、9、10、11、12或13任一项的方法,其中所述的核酸序列编码表Α.2 中给出的任一 SYT多肽序列SEQ ID NO的直向同源物或旁系同源物。
15.根据权利要求1、9、10、11、12、13或14任一项的方法,其中所述的编码SYT多肽的 核酸序列有效连接至组成型启动子、更优选地有效连接至G0S2启动子、最优选地有效连接 至如SEQ ID NO :117所代表的来自稻的G0S2启动子。
16.根据权利要求1、9、10、11、12、13、14或15任一项的方法,其中所述的编码SYT多肽 的核酸序列是植物来源的,优选地来自双子叶植物,进一步优选地来自十字花科,最优选地 来自拟南芥。
17.根据权利要求1的方法,其中所述增加的表达是通过导入并在植物中表达⑴编码 GRF多肽的核酸序列和(ii)编码SYT多肽的核酸序列实现。
18.根据权利要求17的方法,其中所述的核酸序列⑴和(ii)依次地、优选通过杂交、 更优选通过再转化导入并在植物中表达。
19.根据权利要求18的方法,其中所述的杂交在包含已导入并表达的编码GRF多肽的 分离核酸序列的母本植物与包含已导入并表达的编码SYT多肽的分离核酸序列的父本植 物之间进行或反之亦然,并在子代中选择这两种转基因的存在和表达,其中所述的植物相 对于每种亲本植物具有提高的产量相关性状。
20.根据权利要求18的方法,其中通过将编码GRF多肽的核酸序列导入包含有已导入 并表达的编码SYT多肽的核酸序列的植物、植物部分或植物细胞中并表达进行所述的再转 化或反之亦然。
21.根据权利要求17的方法,其中所述的核酸序列⑴和(ii)同时导入并在植物中表达。
22.根据权利要求21的方法,其中所述的核酸序列(i)和(ii)包含于一个或多个核酸 分子中。
23.根据任一前述权利要求所述的方法,其中所述提高的产量相关性状是以下一项或 多项(i)提高的早期生长势;(ii)提高的地上部分生物量;(iii)提高的每株植物总种子 产量;(iv)提高的种子充实率;(V)提高的(充实)种子数;(Vi)提高的收获指数;或(Vii) 提高的千粒核重(TKW)。
24.根据任一前述权利要求所述的方法,其中所述的编码GRF多肽的核酸序列和所述 的编码SYT多肽的核酸序列有效连接至组成型启动子、优选地有效连接至植物组成型启动 子、更优选地有效连接至G0S2启动子、最优选地有效连接至如SEQ ID N0:117所代表的来 自稻的G0S2启动子。
25.根据任一前述权利要求所述的方法能获得的植物、其部分(包括种子)或植物细 胞,其中所述的植物、其部分或细胞包含(i)编码GRF多肽的分离的核酸转基因和(ii)编码SYT多肽的分离的核酸转基因。
26.构建体,其包含(a)编码权利要求2至6任一项中定义的GRF多肽的核酸序列;(b)编码权利要求9至13任一项中定义的SYT多肽的核酸序列;(c)能够驱动(a)和(b)的核酸序列表达的一个或多个调控序列;和任选地(d)转录终止序列。
27.根据权利要求26的构建体,其中所述的调控序列是至少一个组成型启动子,优选 地是G0S2启动子,更优选地是如SEQ ID NO 117所代表的G0S2启动子。
28.构建体的混合物,其中至少一个构建体包含(a)编码权利要求2至6任一项中定义的GRF多肽的核酸序列;(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地(c)转录终止序列,并且其中至少一个其他构建体包含(d)编码权利要求9至13任一项中定义的SYT多肽的核酸序列;(e)能够驱动(d)的核酸序列表达的一个或多个调控序列;和任选地(f)转录终止序列。
29.根据权利要求28的构建体,其中(b)和/或(e)的所述调控序列是至少一个组成 型启动子,优选地是G0S2启动子,更优选地是如SEQ ID NO :117所代表的G0S2启动子。
30.根据权利要求26或27的构建体或根据权利要求28的构建体混合物在用于制备 植物的方法中的用途,所述植物相对于具有(i)编码GRF多肽的核酸序列或(ii)编码SYT 多肽的核酸序列之一表达增加的植物具有提高的产量相关性状,其中所述提高的产量相关 性状是以下一项或多项(i)提高的早期生长势;( )提高的地上部分生物量;(iii)提高 的每株植物总种子产量;(iv)提高的种子充实率;(ν)提高的(充实)种子数;(Vi)提高的 收获指数;或(vii)提高的千粒核重(TKW)。
31.用根据权利要求26或27的构建体或根据权利要求28的构建体混合物转化的植 物、植物部分或植物细胞。
32.用于产生转基因植物的方法,所述转基因植物相对于具有(i)编码GRF多肽的核酸 序列或(ii)编码SYT多肽的核酸序列之一表达增加的植物具有提高的产量相关性状,该方 法包括a.在植物、植物部分或植物细胞中导入并表达在组成型启动子控制下的编码权利要求 2至6任一项中定义的GRF多肽的核酸序列;和b.在植物、植物部分或植物细胞中导入并表达在组成型启动子控制下的编码权利要求 9至13任一项中定义的SYT多肽的核酸序列;和c.在促进植物生长和发育的条件下培育所述植物细胞、植物部分或植物。
33.相对于具有(i)编码GRF多肽的核酸序列或(ii)编码SYT多肽的核酸序列之一 表达增加的植物,具有提高的产量相关性状的转基因植物,其中提高的产量相关性状因(i) 编码权利要求2至6任一项中所定义的GRF多肽的核酸序列和(ii)编码权利要求9至13 任一项中所定义的SYT多肽的核酸序列的表达增加而产生,或者从所述的转基因植物衍生 的转基因植物细胞或转基因植物部分。
34.根据权利要求25、31或33的转基因植物,其中所述的植物是作物植物或单子叶植 物或谷物植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱和燕麦,或从所述的转基因 植物衍生的转基因植物细胞。
35.根据权利要求34的植物的可收获部分,包含(i)编码GRF多肽的分离的核酸序列 和(ii)编码SYT多肽的分离的核酸序列,其中所述的可收获部分优选地是种子。
36.产物,其衍生自根据权利要求34的植物和/或根据权利要求35的植物的可收获部分。
37.相对于具有(i)编码GRF多肽的核酸序列或(ii)编码SYT多肽的核酸序列之一表 达增加的植物,(i)编码权利要求2至6任一项中所定义的GRF多肽的核酸序列和(ii)编 码权利要求9至13任一项中所定义的SYT多肽的核酸序列在提高植物中产量相关性状中 的用途,其中提高的产量相关性状是以下一项或多项(i)提高的早期生长势;(ii)提高的 地上部分生物量;(iii)提高的每株植物总种子产量;(iv)提高的种子充实率;(ν)提高的 (充实)种子数;(vi)提高的收获指数;或(vii)提高的千粒核重(TKW)。
全文摘要
本发明总体上涉及分子生物学领域并涉及用于通过增加植物中以下核酸序列的表达而提高多种植物产量相关性状的方法(i)编码生长调节因子(GRF)多肽的核酸序列和(ii)编码滑膜肉瘤易位(SYT)多肽的核酸序列,其中所述的产量相关性状相对于具有(i)编码GRF多肽的核酸序列或(ii)编码SYT多肽的核酸序列之一表达增加的植物提高。本发明也涉及具有(i)编码GRF多肽的核酸序列和(ii)编码SYT多肽的核酸序列表达增加的植物,其中所述的植物相对于具有(i)编码GRF多肽的核酸序列或(ii)编码SYT多肽的核酸序列之一表达增加的植物具有提高的产量相关性状。本发明也提供了在本发明方法中有用的构建体。
文档编号A01H5/00GK101868544SQ200880108094
公开日2010年10月20日 申请日期2008年9月19日 优先权日2007年9月21日
发明者C·勒佐, V·弗兰卡德 申请人:巴斯夫植物科学有限公司
网友询问留言 已有1条留言
  • 访客 来自[日本] 2017年12月17日 18:34
    good
    0
1