种子中氨基酸组成的改变的制作方法

文档序号:3550019阅读:258来源:国知局
专利名称:种子中氨基酸组成的改变的制作方法
背景技术
以农作物为基础的的制品典型地必须补充特定的氨基酸以便给动物提供对其生长具有关键性的必需营养成分。这种补充是必须的,因为一般来说,农作物含有低比例的对单胃动物来说是必需的且不能由其合成的一些氨基酸。
农作物的种子含有不同类别的种子蛋白质。这些种子的氨基酸组成反应了蛋白质中占优势的类别的组成。氨基酸局限通常是由于这些占优势的蛋白质类别的氨基酸缺陷引起。
在对动物营养必需的氨基酸中,在农作物中获取力有限的那些氨基酸包括甲硫氨酸,赖氨酸和半胱氨酸。例如,在大豆中,7S球蛋白占种子蛋白质的大约30%,但仅含0.3%的甲硫氨酸,而Bowman-Birk抑制剂(“BBI”)占种子蛋白质的大约1%,但含有大约20%的含硫氨基酸。经过育种,突变选择和/或改变在农作物种子中积累的贮存蛋白质组成来增加这些氨基酸的水平的尝试已取得了有限的成功,或伴随着减产。
例如,尽管含突变转录因子,(不透明的2),或突变α-玉米醇溶蛋白基因,(粉状2)的农作物种子表现出总的和结合的赖氨酸水平升高,但改变了种子的胚乳结构,对损害和害虫更敏感。也典型地显著减产。
增加农作物中游离氨基酸水平的另一种方法是修饰植物中的氨基酸生物合成。将编码催化赖氨酸生物合成途径独特的第一反应的反馈调节失敏性二氢吡啶二羧酸合成酶(“DHDPS”)基因导入植物中已引起这些植物的叶和种子中自由赖氨酸水平的增加。然而,这些增加对于明显增加种子中总氨基酸的含量是不够的,因为一般来说,种子中游离氨基酸水平仅是总氨基酸成分的一个小部分。
编码对赖氨酸和苏氨酸的反馈抑制脱敏的突变细菌天冬氨酸激酶的LysC基因从烟草植物中种子特异性启动子的表达已导致这些植物的种子中甲硫氨酸和苏氨酸生物合成的增加。见Karchi等,植物杂志;第3卷;p.721;(1993);本文引用其全文以供参考。然而,lysC基因的表达导致种子中总苏氨酸或甲硫氨酸的水平仅增加6-7%。因此,种子中lysC基因的表达对这些种子的营养价值只具有轻微的影响,因此仍需要对含lysC转基因种子的食品补充氨基酸,如甲硫氨酸和苏氨酸。
有其它的分子遗传学方法可用于提高植物蛋白质的氨基酸质量。分别涉及植物基因的分子操作和转基因植物的生产。
蛋白质序列修饰涉及鉴定编码主要蛋白质,优选贮存蛋白质的基因作为修饰靶以使其含有更多的必需氨基酸的密码子。本研究的关键任务是为了能选择可进行修饰而不影响该蛋白质的总体结构,稳定性,功能和其它细胞和功能特征的蛋白质区域。通过相关蛋白质种类的序列分析和比较鉴定的多肽的可变区为这类修饰提供了可能的靶位点。
这些研究表明经序列修饰增加种子蛋白质中的必需氨基酸残基是可行的,且选择合适的靶位点是重要的。
DNA合成技术的形成允许设计和合成编码具有所需必需氨基酸组成的新蛋白质的基因。例如,研究者已合成了编码由80%必需氨基酸组成的多肽的292个碱基对的DNA序列并将它与胭脂氨酸合成酶(NOS)启动子一起用于构建嵌合基因。该基因在转基因马铃薯块茎中的表达导致该蛋白质以0.02%至0.35%的总植物蛋白质水平进行积累。这种低水平的积累可能是由于NOS启动子较弱和/或该新蛋白质的不稳定性引起。
植物中微量蛋白质可含升高水平的必需氨基酸是有限的。经过增强编码该蛋白质的基因的表达,可增加该蛋白质的浓度,从而增加该特定必需氨基酸的含量。在这一点上,最近已将10.8-kD的推断的富含甲硫氨酸的蛋白质在大豆种子中当作用于改进大豆蛋白质质量的较好的候选者。
另外,重组DNA和植物转化技术允许在不同植物种类间接移基因。因此,可将从特定植物中分离的编码富含必需氨基酸的蛋白质的基因导入其它植物中以提高其蛋白质质量。已鉴定并分离了含异常高水平的必需含硫氨基酸的一些植物蛋白质及其基因。它们是用于蛋白质改进的首要候选物。
烟草已用作试验植物以经过将含菜豆蛋白启动子和富硫蛋白巴西坚果蛋白质(“BNP”)(18mol%甲硫氨酸和8mol%半胱氨酸)的cDNA的嵌合基因转移进烟草来证实该研究的可行性。氨基酸分析表明转基因种子中甲硫氨酸含量比未转化的种子提高30%。这种相同的嵌合基因也已转移进了经济作物canola中并实现了相似水平的提高。
然而,不利影响是赖氨酸含量减小。另外,BNP已鉴定为主要的食物过敏原。因此使用BNP来提高农作物的营养价值既不实用也不需要。
这些发现表明了一个需要进一步研究的领域。这里指出各研究的优缺点也是有用的。尽管蛋白质序列修饰和合成基因的方法对于改造和设计具有所需必需氨基酸组成的基因具有灵活性,但其隐患是具有产生未知结构和生物学特征的蛋白产品的可能性。异源和同源基因研究都具有利用天然存在的基因的优势。然而,鉴定编码富含特定的必需氨基酸的蛋白质的基因(如果确实存在的)将是一个艰难的任务。
因此需要改变蛋白质类别的比例而不产生有害的副作用。内源蛋白质非常适合于细胞内装配,靶向和加工。另外,该蛋白质组成的改变减小了产生对人或动物健康具有未知危险的可能性,因为所有的蛋白质化合物在修饰前已存在于植物中。然而,有些富含必需氨基酸的内源蛋白质,如BBI是非营养性蛋白质。
基于上文的描述,存在对鉴定在未修饰的种子中存在相当低的含量但具有必需氨基酸含量增加的内源性种子贮存蛋白质的需要,以便经遗传修饰种子以过度表达编码这些原生质的基因来提高种子的营养价值。该遗传修饰不应伴随有害的副作用,如过敏原性,非营养性品质或低产。
因此,本发明的一个目的是提供增加食物营养含量的方法。
本发明的另一个目的是提供遗传修饰种子的方法以便增加在未修饰的种子中以相当低量存在的必需氨基酸的量。
本发明的另一个目的是提供将内源蛋白质导入种子的方法。
本发明的另一个目的是提供增加种子中营养成分而无诸如过敏原性,低产或非营养性品质的有害副作用的方法。
发明概述本发明的方法包括经过导入包含编码种子贮存蛋白质的预选的DNA片段的表达盒来转化植物细胞。
本发明还提供了含有包含启动子和在该启动子控制下的编码包含预选氨基酸的种子贮存蛋白质的分离的预选DNA片段的能育转基因大豆植物。
本发明还提供了包含编码大豆种子贮存蛋白质的预选的DNA片段的分离和纯化的DNA分子。
本发明还提供了能特异性地结合大豆白蛋白的抗体。
本发明还提供了从种子中分离白蛋白的方法。
附图的简要描述

图1描述了以Edman降解从PVDF印迹分离的蛋白质测定的白蛋白1,白蛋白2和白蛋白3的氨基末端序列。
图2描述了从大豆种子cDNA文库分离的白蛋白1的cDNA序列(SEQ ID NO1)和白蛋白1的相应的预期氨基酸序列(SEQ ID NO2)。
图3描述了从大豆种子cDNA文库分离的白蛋白3的cDNA序列(SEQ ID NO3)和相应的白蛋白3的预期氨基酸序列(SEQ ID NO4)。
图4描述了包含来自白蛋白1和白蛋白3的序列的嵌合白蛋白的cDNA序列(SEQ ID NO5)和氨基酸序列(SEQ ID NO6)。
图5称为白蛋白1/3,描述了白蛋白1,白蛋白3和白蛋白1/3的氨基酸序列的比较。
图6描述了p4752的质粒图谱。
发明详述本发明提供了遗传修饰种子以提高种子中至少一种预选的氨基酸的水平从而增加种子营养价值的方法。该方法包含将表达盒导入可再生的植物细胞以产生转化的植物细胞。该表达盒包括有效连接到在植物细胞中有功能的启动子上的编码包含预选氨基酸的大豆种子贮存蛋白质的预选的DNA片段。
从转化的细胞再生能育的转基因植物,从该植物中分离种子。该种子包含由预选的DNA片段编码的蛋白质,且相对于相应未转化的植物种子(例如,未转化的再生对照植物的种子或从转化植物分离的相应的未转化种子)中预选的氨基酸量而言,以足以增加在转化的植物种子中预选氨基酸量的含量产生。
优选的是,预选的氨基酸是赖氨酸。更优选的是,有另一种预选的氨基酸。还有还更优选的是,另一种预选的氨基酸是半胱氨酸或甲硫氨酸。
本发明优选的实施方案是将表达盒导入可再生的大豆细胞中。还有优选的是导入包含编码内源性多肽序列的预选的DNA片段的表达盒。
本发明包含与下文公开的片段具有足够相似性的片段。一般来说,这种足够的相似性应包括在白蛋白1的碱基对10到474之间(SEQ IDNO1)白蛋白3的碱基对28到501之间(SEQ ID NO3)和白蛋白1/3的碱基对28和501之间(SEQ ID NO5)至少大约60%的相同性或60%的同源性。优选的是,该足够的相似性应包含至少大约70%的相同性或70%的同源性。更优选的是,该足够的相似性应包括至少大约80%的相同性或80%的同源性。甚至更优选的是,该足够的相似性应包含至少大约90%的相同性或90%的同源性。最优选的是,本发明的片段是具有分别在SEQ ID NO1,SEQ ID NO3和SEQ ID NO5中公开的序列。
本发明还包含在上述序列中的变异,其中该变异由于定点诱变或本领域中已知的其它机制引起,以增加或减少感兴趣的选定氨基酸的水平。例如,定点诱变以增加赖氨酸,甲硫氨酸和/或半胱氨酸的水平和/或减小天冬酰胺和/或谷氨酰胺的水平是优选的实施方案。
本发明还提供了能育的转基因植物。该能育的转基因植物含有包含一个启动子和位于该启动子控制下的编码包含预选氨基酸的种子贮存蛋白质的分离的预选DNA片段。该DNA片段表达为种子贮存蛋白质,使转基因植物种子中预选的种子贮存蛋白质氨基酸水平增加到与转基因植物种子区别仅在于该DNA片段或编码的种子蛋白质在不同启动子控制下的植物种子中的水平上。该DNA片段通过转基因植物的完全正常的有性循环传递给下一代。
还提供了一种包含编码大豆种子贮存蛋白质的预选的DNA片段的分离和纯化的DNA分子。本发明的最优选的实施方案是编码大豆白蛋白的预选的DNA片段。例如,见Shewry,等;植物细胞;第7卷,第7期;p945-956;(1995);本文引用其全文以供参考。
本发明还提供了一种表达盒,包含有效连接到在宿主细胞中有功能的启动子上的编码大豆种子贮存蛋白质的预选的DNA片段。在本发明的实践中有用的优选的启动子是允许在种子中选择性地表达预选的DNA片段以避免与非种子器官中选定DNA片段的表达相关的任何潜在有害效应的那些种子特异性启动子。
本发明的其它实施方案包括用编码种子贮存蛋白质的预选的DNA片段转化的植物,植物部分,种子和微生物。优选的是,种子贮存蛋白质是白蛋白。更优选的是,种子贮存蛋白质是大豆白蛋白。
本发明的其它实施方案还包括预选的氨基酸水平升高的嵌合体。
在本发明优选的实施方案中,提供了用于简单、快速并可靠地生产在所产生的种子中赖氨酸积累增加的转基因大豆植物的方法。在一个更优选的实施方案中,除了赖氨酸积累增加外,还出现甲硫氨酸和/或半胱氨酸积累的增加。该方法具有基因型不依赖性,且相对于以前使用的系统显示出巨大的,不可预料的进步。
本发明还提供了分离和纯化2S白蛋白的方法,包括经过白蛋白与碳水化合物树脂基质,优选葡聚糖树脂,甚至更优选Sephadex G25间的特异性相互作用从污染物中分离白蛋白。由于树脂的分子筛特性使上述分离和纯化的方法是意想不到的。白蛋白与基质间的特异性相互作用对于批量处理具有有用的应用。
本文使用的“预选的DNA片段”指编码大豆种子贮存蛋白质的外源性或重组DNA序列或片段,其中,该种子贮存蛋白质优选不是功能性蛋白酶抑制剂,不是功能性α淀粉酶抑制剂且不是凝集素。
本发明优选的种子贮存蛋白质是具有赖氨酸及含硫氨基酸,即甲硫氨酸和/或半胱氨酸含量增加的蛋白质。预选的DNA片段和氨基酸的选择以预选的DNA片段编码的蛋白质的氨基酸组成及该蛋白质在种子中积累的能力为基础。而且,蛋白质的氨基酸组成可用诸如编码该蛋白质的预选的DNA片段的定点诱变的方法来进行操作以便引起特定氨基酸的量,即含量增加的蛋白质表达。本发明的一个优选的实施方案是预选的DNA片段编码赖氨酸,和甲硫氨酸和/或半胱氨酸量升高的大豆种子贮存蛋白质,如编码大豆白蛋白的预选的DNA片段。由于利用了内源性蛋白质,产生对人和/或动物健康的未知危害的可能性减小。
本文使用的术语“高赖氨酸含量蛋白质”指该蛋白质具有至少大约7%的赖氨酸,更优选至少大约10%的赖氨酸,甚至更优选至少大约12%的赖氨酸,最优选至少大约13%的赖氨酸。在一个优选的实施方案中,高赖氨酸含量蛋白质也是高硫含量蛋白质。
本文使用的术语“高硫含量蛋白质”指该蛋白质除赖氨酸外还含有下文所示的水平的甲硫氨酸和/或半胱氨酸。高硫含量蛋白质具有至少大约6%的甲硫氨酸和/或半胱氨酸,优选至少大约9%的甲硫氨酸和/或半胱氨酸,且更优选至少大约11%的甲硫氨酸和/或半胱氨酸。
本文使用的“增加的”或“升高的”转化植物中预选氨基酸的水平或量是比相应的未转化植物的水平或量更大的水平。例如,大豆种子蛋白质中平均甲硫氨酸的含量是大约1.4%,大豆种子蛋白质中平均半胱氨酸含量是大约1.4%,大豆种子蛋白质中平均赖氨酸含量是大约6.0%(George等;农业食品化学杂志;Vol.34;p224;(1991);本文引用其全文以供参考)。因此,具有大约12%的甲硫氨酸和半胱氨酸之和及大约10%赖氨酸的具有SEQ ID NO2的大豆白蛋白1在种子中的表达导致这些种子中甲硫氨酸,半胱氨酸和赖氨酸的水平或量增加。而且,具有大约12%的甲硫氨酸和半胱氨酸之和及大约10%的赖氨酸的具有SEQ ID NO4的大豆白蛋白3在种子中的表达导致这些种子中甲硫氨酸,半胱氨酸和赖氨酸的水平或量增加。以本领域熟知的方法可测定蛋白质的氨基酸组成。
在转化的植物中增加量的非赖氨酸的预选的氨基酸比未转化的植物中预选的氨基酸的量优选大至少大约15至30%,优选至少大约30至50%,且最优选大约50至100%。在转化的植物中预选的赖氨酸增加的量比未转化的植物中赖氨酸的量优选大至少大约5-10%,更优选至少大约10-15%,甚至更优选至少大约15-20%,最优选至少大约25-50%。
本文使用的“遗传修饰的植物”指包括经转化导入植物基因组的预选的DNA片段的植物。术语“野生型”指未转化的植物,即未经导入预选的DNA片段改变基因组的植物。
本文使用的“植物”包括但不限于植物细胞,植物组织和植物种子。对于本发明,优选的植物包括大豆,canola,向日葵,高粱和玉米。更优选的植物包括大豆和玉米。最优选的植物是大豆。
本文对于编码蛋白质的预选的DNA片段使用的术语“表达”指预选的DNA片段插入该细胞的基因组,使由该预选的DNA片段编码的产品,例如,诸如白蛋白的富硫蛋白质在细胞内产生。例如,编码白蛋白的预选DNA片段的表达产生的新植物在种子中含可提取水平的白蛋白占总蛋白质的至少大约3%,优选至少大约5%,更优选至少大约10%,甚至更优选至少大约20%。
可用于本发明方法的植物类型一般是广泛地适用于转化技术的具有种子的高等植物类型,包括单子叶和双子叶植物。来自从转化的植物细胞,植物部分或植物组织再生的植物或从再生的转化植物产生的后代的种子可直接用作饲料或食品,或可进行进一步的加工。在本发明的实践中,最优选的植物种子选自大豆,canola,向日葵,高粱和玉米。更优选的是,植物种子是玉米或大豆的种子,最优选的是大豆Glycinemax的种子。根据本发明植物的转化可基本上以植物分子生物学领域的技术人员已知的各种方式中的任一种进行。这些方式包括但不限于微粒轰击,显微注射,包含部分细胞壁的原生质或细胞的电穿孔及土壤杆菌介导的DNA转移。
本文使用的“重组”DNA是从细胞分离,纯化或扩增的DNA序列或片段。
本文使用的“分离的”指从细胞物理上分离的或根据分离的DNA片段的序列在体外合成的。
本文使用的“白蛋白”指种子蛋白质,其基因编码在组成上相似于且同源于2S白蛋白种子蛋白质家族的肽前体。见Shewry,出处同上;本文引用其全文以供参考。
本文使用的“2S大豆白蛋白”指甘氨酸种子蛋白,其基因编码的肽前体是白蛋白的类似物。
本发明提供了以足以减小或避免饲料添加的水平在种子中表达预选氨基酸组成的蛋白质。由本发明的预选的DNA片段编码的优选蛋白质是种子贮存蛋白质。由于种子贮存蛋白质正常情况下在种子中积累,这些蛋白质在种子中的过度表达不必克服与细胞中装配,靶向和加工机制的不相容性。另外,与野生型种子相比诱导过敏反应增强的危险最小。本发明优选的实施方案包括富含赖氨酸及含硫氨基酸的种子贮存蛋白质。该蛋白质的一个实施例是白蛋白。为了以增加种子中预选氨基酸水平的水平增强预选氨基酸组成的蛋白质在种子中的表达,可采用具有种子特异性启动子的表达盒。
I.用于转化的DNA用于导入植物细胞的编码种子贮存蛋白质的DNA包括从任何来源产生或分离的DNA,可以随后对其结构,大小和/或功能进行鉴定,经化学改变并后来导入植物中。由一种来源“产生”的DNA的例子是鉴定为在给定的生物内有用的片段并然后以基本上纯的形式合成的DNA序列或片段。从一种来源“分离”的DNA的例子是用化学工具,例如经过使用限制性核酸内切酶从来源中切割或取出的有用的DNA片段,以便以遗传工程的方法进一步用于本发明的操作如扩增。
因此,有用的DNA包括完全合成的DNA,半合成的DNA,从生物学来源分离的DNA及从RNA产生的DNA。从生物学来源分离的DNA或从RNA产生的DNA包括但不限于从植物基因和诸如来自细菌,酵母,动物或病毒的非植物基因得到的DNA或RNA。该DNA或RNA可包括修饰的基因,基因部分或嵌合基因,包括来自相同或不同基因型的基因。术语“嵌合基因”或“嵌合DNA”定义为包含来自在自然条件下不进行DNA重组的种类的至少2个DNA序列或片段的基因或DNA序列或片段,或以在正常情况下在未转化植物的天然基因组中不出现的方法定位或连接的DNA序列或片段。因此,从给定大豆基因型中分离预选的DNA片段并随后将至少一个预选的DNA片段的拷贝导入相同基因型中是在本发明的范围内。
本发明预选的DNA片段可用标准方法鉴定,如富集方案,或针对特定核苷酸或氨基酸序列分离的探针。经过获得和/或筛选从来自特定细胞类型,细胞系,原代细胞或组织的核酸产生的DNA或cDNA文库可鉴定预选的DNA片段。对编码全部或部分预选DNA片段的DNA片段的筛选经过从基因组或cDNA文库筛选与来自其它生物的预选DNA片段的探针杂交的噬菌斑或经过从cDNA表达文库筛选与特异性识别预选DNA片段编码的蛋白质的抗体结合的噬菌斑来实现。与来自其它生物的预选DNA片段探针杂交的DNA片段和/或携带与抗预选DNA片段编码的蛋白质的抗体具有免疫反应性的DNA片段的噬斑可亚克隆进载体中并测序和/或用作鉴定编码全部或部分预选DNA片段的其它cDNA或基因组序列的探针。
基因组拷贝的部分或预选DNA片段的拷贝可部分测序和用包括与其它同源基因的DNA序列同源性或比较所编码的氨基酸序列与已知的蛋白质序列的标准方法来鉴定。一旦鉴定了预选DNA片段的部分,可用标准方法获得预选DNA片段的完全拷贝,包括克隆或使用与预选的DNA片段互补的寡核苷酸引物进行的聚合酶链式反应(PCR)。经过比较其推断的氨基酸序列与天然多肽序列的氨基酸序列可证实预选的DNA片段的原分离的全长拷贝的存在。
可用包括但不限于定点诱变的本领域熟知的方法修饰编码种子贮存蛋白质的预选DNA片段来增加该蛋白质中特定氨基酸残基的含量。因此,经过对编码该蛋白质的预选DNA片段的核苷酸取代以产生在相应于具有核苷酸取代的密码子的该蛋白质的该位置具有不同氨基酸的蛋白质来制备天然存在的蛋白质的衍生物。在蛋白质中导入多个氨基酸改变可产生明显富含预选氨基酸的蛋白质。
因此,本发明提供了包含编码种子贮存蛋白质的预选DNA片段的DNA分子。该预选的DNA片段可编码任意种子贮存蛋白质。包括但不限于2S,7S和11S种子贮存蛋白质,含有或不含对编码这些蛋白质的序列的修饰。技术人员将会认识到可根据该蛋白质的氨基酸组成和其在种子中积累的能力选择预选DNA片段所编码的蛋白质。可选择对其具有营养价值的氨基酸以产生对植物或植物部分增加了价值的特征。对增加价值的特征所需的氨基酸以及限制内源性蛋白质合成的来源包括但不限于甲硫氨酸,半胱氨酸和赖氨酸。
还提供了经过在种子表达编码蛋白质的预选DNA片段来增加种子中至少一种预选的氨基酸的水平的方法。优选的是,预选的氨基酸是赖.氨酸。更优选的是,本发明还包括第二种预选的氨基酸。甚至更优选的是,第二种预选的氨基酸是甲硫氨酸或半胱氨酸。预选的DNA片段或多拷贝的预选的DNA片段的表达可增加种子中由预选的DNA片段编码的蛋白质的水平,从而增加了掺入进由预选的DNA片段编码的蛋白质中的预选氨基酸的水平。提供了用于生产包含具有编码蛋白质的预选DNA片段的表达盒的植物培养物,植物组织,植物和种子的方法和组合物。本发明提供了遗传改造植物的方法,使植物产生具有至少一种预选的氨基酸的水平增加的种子。使植物和种子将该特征经生殖传递给其后代。
在优选的实施方案中,由预选的DNA片段编码的蛋白质是富含硫的2S种子贮存蛋白质,如白蛋白。在本发明更优选的实施方案中,预选的DNA片段编码内源性2S大豆白蛋白,以举例而不是限制的方式,本领域的技术人员将容易预见可用来自其它生物的2S白蛋白基因取代大豆2S白蛋白蛋白质。例如,见Coulter等,J.Exp.Bot.;Vol.41;p.1541;(1990);本文引用其全文以供参考。
在本发明范围内的富含硫的植物蛋白质的其它例子包括半胱氨酸而不是甲硫氨酸丰富的植物蛋白质,如小麦胚乳嘌呤硫素(Mak和Jones;加拿大生化杂志;Vol.22;p.83J;(1976);本文引用其全文以供参考),豌豆低分子量白蛋白(Higgins等,生物化学杂志;Vol.261;p.11124;(1986);本文引用其全文以供参考)。该蛋白质还包括富含甲硫氨酸的植物蛋白质,如来自向日葵种子(Lilley等,在关于植物蛋白质在人类食品和动物饲料中的利用的世界会议录;Applewhite.H(编辑);美国油类化学家协会;Champaign,IL;pp.497-502;(1989),本文引用其全文以供参考),玉米(Pedersen,等;生物化学杂志,p.261;p.6279;(1986);Kirihara等,基因,Vol;71;p.359;(1988);本文以其全文引用它们以供参考),和水稻(Musumura.等.;植物分子生物学;Vol.12;p.123;(1989);本文引用其全文以供参考)。
表达盒和表达载体根据本发明,编码诸如种子贮存蛋白质的蛋白质的预选的DNA片段经鉴定,分离并与至少一种在诸如植物细胞的宿主细胞中有功能的启动子组合以提供重组表达盒。可用于与本发明相联的该表达盒的构建根据本说明书的教导对本领域的技术人员而言是熟知的。例如,见Sambrook等;分子克隆实验手册;纽约冷泉港(1989);Gelvin等;植物分子生物学手册;(1990);植物生物技术 商用前景和问题,Prakash等,编辑,牛津和IBH出版公司;New Delhi.India;(1993);和Heslot等,酵母的分子生物学和遗传工程;CRC出版社,美国,(1992);本文以其全文引用每一篇作为参考。
启动子本发明优选的表达盒一般包括但不限于种子特异性启动子。种子特异性启动子的例子包括在种子中以高度调节的方式表达这些蛋白质的种子贮存蛋白质的启动子(Thompson等;BioEssays;Vol.10;p.108;(1989);本文引用其全文以供参考,如,对于双子叶植物,有菜豆β-菜豆蛋白启动子,napin启动子,β-conglycinin启动子和大豆凝集素启动子。对于单子叶植物,在本发明的实践中有用的启动子包括但不限于玉米15kD的玉米醇溶蛋白启动子,22kD玉米醇溶蛋白启动子,γ-玉米醇溶蛋白启动子,蜡质启动子,shrunken1启动子,球蛋白1启动子,和shrunken2启动子。然而,在本发明的实践中有用的其它启动子对本领域的技术人员来说是已知的。
II.将DNA传递给细胞用常规可得的方法可将表达盒或载体导入原核或真核细胞中。例如,经过包括但不限于土壤杆菌介导的转化,电穿孔,微粒轰击,显微注射,感染性病毒或类病毒,使用脂质体等的方法,均按熟知的程序可将表达盒或载体导入植物细胞。对转化有用的植物细胞包括在悬浮培养物中培养的细胞,愈伤组织,胚,分生组织,花粉等。使用在表达载体上编码的可选择的或可筛选的标记一般可选择转化的细胞。
使用根癌土壤杆菌的肿瘤诱导(Ti)质粒的T-DNA已显示出可在诸如大豆,烟草,土豆和苜蓿的双子叶植物中导入和表达外源基因。使用重组DNA技术和细菌遗传学,可将众多不同的外源DNA插入土壤杆菌的T-DNA中。经含重组Ti质粒的细菌感染后,将外源DNA插入植物染色体的宿主中,从而产生遗传改造的细胞并最终产生遗传改造的植物。第二种方案是导入根诱导(Ri)质粒作为基因载体。
尽管土壤杆菌似乎优先感染双子叶植物,但包括玉米,小麦,水稻,大麦,燕麦,高粱,黍,和黑麦的许多重要农作物是单子叶植物且已知不容易对土壤杆菌的转化敏感。然而将来可对Ti质粒进行操作以用作单子叶植物的载体。另外,使用Ti质粒作模型系统,可人工构建用于单子叶植物的转化载体。用人工方法也可将Ti质粒导入单子叶植物,如显微注射,或单子叶植物原生质体与含T-区域的细菌原生质球之间的融合,然后,它能整合进植物细胞核DNA中。其它的转化方法对于本领域的技术人员来说是易于获得的。
III.转化体的再生和分析转化后,再生涉及从转化的细胞获得完整植株并经试验检测再生植物中预选的DNA片段或“转基因”的存在。然后测定植物种子中预选氨基酸的水平。根据植物的类型和基因表达的水平,将预选的DNA片段导入植物能以对补充这些种子中的营养价值有用的量增加预选氨基酸的水平。
从诸如转化的原生质体或愈伤组织细胞系的组织培养物中再生植物的技术在本领域中是已知的。例如,见Phillips等;植物细胞组织器官培养物;Vol.1;p.123;(1981);Patterson等;植物科学;Vol.42;P.125;(1985);Wright等;植物细胞报道;Vol.6;p.83;(1987);和Barwale等;Planta;Vol.167;p.473;(1986);本文以其全文引用它们以供参考。合适方法的选择在本领域的技术范围内。
本文详细描述的本发明实践的实施例具体涉及大豆植物和在双子叶植物中可操作的表达载体。然而,本发明也能应用于其它植物。本文使用的表达载体可证实能在许多双子叶植物的组织培养物及整个植株中的细胞中操作。本文公开的本发明因此能在双子叶种类中操作以转化单个的植物细胞并获得能从转化的植物细胞再生的且表达预选的种子贮存蛋白质的双子叶植物种类的完整植物。
导入的预选DNA片段在转化的植物细胞中表达并稳定传递(经体细胞和生殖)给产生的细胞下一代。载体应能在植物细胞中导入,维持并表达预选的DNA片段。另外,可将载体导入众多不同的植物细胞中。预选的DNA片段经正常有性传递传给后代。
为了证实预选的DNA片段或“转基因”在再生植物或种子或由再生植物产生的后代中的存在,可进行各种试验。该试验包括,例如,对本领域的技术人员熟知的“分子生物学”试验,如Southern和Northern印迹和PCR;“生化”试验,如经免疫学方法(ELISA和Western印迹)或经酶功能检测蛋白质产品的存在;植物部分试验,如叶,种子或根试验;且也经过分析完整再生植物的基因型来进行试验。
鉴于使用从植物的任意部分分离的DNA可进行DNA分析技术,RNA仅能在特定细胞或组织类型中表达,因此,必须从这些组织中制备用于分析的RNA。PCR技术也可用于检测和定量从导入的预选DNA片段产生的RNA。在PCR的该应用中,首先必需使用诸如逆转录酶的酶类将RNA逆转录成DNA,然后通过使用常规PCR技术扩增该DNA。在大多数情况下,PCR技术尽管有用,但不能证实RNA产物的完整性。关于RNA产物的性质的进一步的信息可由Northern印迹获得。该技术证实了RNA种类的存在并给出了关于该RNA完整性的信息。使用斑点或狭线印迹Northern杂交也能测定RNA种类的存在与否。这些技术是Northern印迹的改良且仅证实了RNA种类的存在与否。
尽管Southern印迹和PCR可用于检测感兴趣的预选DNA片段,但它们不提供关于预选的DNA片段是否被表达的信息。经过特异性地鉴定导入的预选DNA片段的蛋白质产物或评价由其表达所带来的基因型改良可评价表达。
对于特定蛋白质的生产和鉴定的试验可利用该蛋白质的物理化学,结构,功能或其它特征。独特的物理化学或结构特征允许经诸如天然或变性凝胶电泳或等电聚焦的电泳程序或经诸如离子交换或凝胶排阻色谱的色谱技术分离和鉴定该蛋白质。不同蛋白质的独特结构提供了使用特异性抗体以诸如ELISA试验的方式检测其存在的机会。使用组合方案具有更大的特异性,如抗体用于定位已用电泳技术分离的单个基因产物的Western印迹。可采用其它的技术以绝对证实所感兴趣的产物的鉴定,如经纯化后氨基酸测序来评价。尽管这些是最常用的方法,但也可使用其它方法。
非常常见的是,基因产物的表达经评价其表达的基因型结果来测定。这些试验也可采取任何形式,包括但不限于分析植物化学成份,形态,或生理特征的改变。经过表达编码改变氨基酸组成的贮存蛋白质的预选DNA片段可改变化学成份并可经氨基酸分析来检测。
本发明中有用的育种技术是本领域中熟知的。
本发明已参考各种具体的和优选的实施方案进行了描述且将参考下面详细的实施例进行进一步的描述。然而,应理解除在实施例和描述中所显示的外可对本发明的基本主题进行许多延伸,变化和修饰,它们都在本发明的实质和范围内。
实施例1大豆2S白蛋白的分离和鉴定大豆植物(G.max Merr.)品种在温室或野外生长。除非另有说明,试剂和实验设备从Sigma化学公司(St.Louis,MO)或Baxter(McGawPark,IL)获得。用牛血清白蛋白(Pierce,Rockford,II)作标准根据Bradford(BioRad蛋白测定,BioRad,Hercules,CA)或改良的Lowry测定(DC蛋白测定,BioRad)估计蛋白质的浓度。
本发明包含下面的步骤a)从大豆粉提取蛋白质;b)对蛋白质提取物进行大小排阻层析;c)收集含白蛋白的级分;d)用白蛋白与树脂基质的特异性相互作用从其它蛋白污染物中分离白蛋白;e)用离子交换层析分离单个白蛋白。
使用Schagger和von Jagow建立的Tris-Tricine缓冲系统进行SDS聚丙烯酰胺凝胶电泳(“PAGE”)。见Schagger,H.和von Jagow,G.,生物化学年鉴,Vol.166,p.368(1987);本文引用其全文以供参考。对常规目的,多肽的分离在16.5%Mini-Protein II预制小凝胶(80×73mnReady Gels,BioRad,Richmond,CA)中进行,或当需要在2和25kDa之间的分子量范围内对多肽的高分辨时,使用Model V16电泳装置(Gibco BRL,Gaithersburg,MD)在170×150mm 8-22%聚丙烯酰胺递度凝胶中进行。经过用考马斯亮蓝R250染色检测蛋白质带。
当表明电泳分离该蛋白质后,使用半干燥的电印迹器(SemiPhorTE70,Hoefer,San Francisco,CA)将分离的多肽电转移到聚偏二氟乙烯(PVDF)膜(Immobilon PSQ,Millipore,Bedford,MA)上,如Matsudaira(生物化学杂志,Vol.262;p.10035;(1987);本文引用其全文以供参考)所述。在氨基酸测序前采取一些预防方法以防止N端氨基封闭并减小氨基酸侧链的修饰。包括积层凝胶的Tris/Tricine凝胶在蛋白质分离前3-7天灌制并4℃密封贮存。刚好在分离前,用0.1%SDS,0.75M Tris/HCl,pH8.45(阳极缓冲液)和0.1%SDS,1M Tris/HCl,pH8.45(阴极缓冲液)在2V/cm下对凝胶进行预电泳15小时。将多肽电转移到PVDF(见上)上并用考马斯蓝染色后,用水充分洗涤印迹并干燥。从膜上小心切下感兴趣的多肽带并4℃贮存于小离心管中备用。经过使用依阿华大学蛋白质分析实验室(依阿华市,IA)的应用生物系统477A蛋白质测序仪从Immobilon PSQ膜获得N端序列。
根据标准程序对Beckman 6300分析仪进行氨基酸分析。用过甲酸氧化后以甲硫氨酸砜和磺基丙氨酸来测定甲硫氨酸和半胱氨酸。根据厂家建议用Novex低范围IEF蛋白质标准品在预制板凝胶(pH效果范围3.5-6.5,Novex,San Diego CA)上进行蛋白质的等电聚焦。
为了测定分离的蛋白质是否含有N-连接的聚糖,以修改为用化学发光(ECL试剂盒,Amersham,Arlington Heights.IL)观察辣根过氧化物酶活性的Faye和Chrispeels(生化年鉴;Vol.149.p.218;(1985);本文引用其全文以供参考)所述的方法进行对蛋白质印迹的伴刀豆球蛋白A-辣根过氧化物酶染色(见上)。
为了用N-糖苷酶F(Boehringer Mannheim,Indianapolis,IN)处理(0.1U/10μl,37℃15小时),蛋白质样品(10μg/10μl)在0.1%SDS,200mM NaCl,20mM Tris/HCl,pH8.5中95℃变性2分钟,冷却到4℃,补充1%Triton X-100并在加入酶前室温培养15分钟。
富含赖氨酸和富含硫的大豆2S白蛋白的纯化和表征表达来自巴西坚果(Bertholletia excelsa)的富含甲硫氨酸的2S种子贮存蛋白质的转基因大豆种子显示出富含硫的内源性Bowman-Birk抑制剂水平下降(Kollipara,K.P.和Hymowitz,R.;农业食品杂志;Vol,40;pp.2356-2363;(1992);本文引用其全文以供参考)及未知的14kDa蛋白质水平下降。为了测定未知的14kDa蛋白质是否是富含甲硫氨酸的种子贮存蛋白质,电泳分离来自野生型种子和BNP转基因种子的种子蛋白质并电转移到PVDF膜上,然后根据de Lumen和Kho(农业食品化学杂志)Vol.35,p.688;(1987);本文引用其全文以供参考)的方法用碘[14C]乙酸(ICN Radiochemicals,Irvine,CA).pH2.0探测膜。该凝胶印迹的放射自显影显示14kDa蛋白质是富含甲硫氨酸的蛋白质。该蛋白质属于以前由Kho和de Lumen(植物食品人类营养;Vol,38;p.287;(1988)本文引用其全文以供参考)用相同技术获得的含甲硫氨酸肽的家族。
为了纯化该蛋白质,将大豆的成熟于种子(Glycme max)磨成细粉,用已烷(1∶1w/v)提取脱脂并真空干燥。将100g脱脂粉在Waring搅拌器中用400ml 10%DMSO,0.5%正丁醇,100mM KCl,83mM乙酸钠缓冲液,pH5.2(白蛋白提取缓冲液)4℃匀浆5分钟。在冰上或在4℃进行下面的步骤。
浆液通过Miracloth(Calbiochem,LaJoUa,CA)过滤并以6000xg离心15分钟。用0.5%正丁醇,100mMKCl,83mM乙酸钠缓冲液pH5.2充分透析回收的上清(Spectra/por7,MWCO3500,Baxter,McGaw Park,IL)并用干燥的聚乙二醇(PEG 8000)在透析袋中浓缩到大约100ml。经过在6000xg下离心15分钟并通过0.45μm的膜过滤去掉沉淀的污染球蛋白的蛋白质。所得的白蛋白提取物含大约20%的总种子蛋白质。用包含野生型种子中大约1-2%总大豆种子蛋白质(0.5-1%的种子重量)的14kDa多肽代表5-10%的白蛋白级分。在稀释的酸性缓冲液中的提取能力将14kDa蛋白质分类为白蛋白(Osborne,蔬菜蛋白质,Longman,G,(编辑),伦敦(1924);本文引用其全文以供参考)。14kDa蛋白质在还原条件下在SDS PAGE中解离成两种多肽,分别大约为10kDa和5kDa,表明在完整蛋白质中以二硫键连接。
使用以提取缓冲液洗脱的Supperdex 75 Hiload 26/60柱(Pharmacia,Uppsala,Sweden)进一步分离5ml浓缩的白蛋白提取物(浓度大约为20mg/ml)。流速维持在1ml/分,收集4ml级分并以PAGE分析。以大约50%的纯度且Kunitz胰蛋白酶抑制剂(KTI)(Kollipara,出处同上)作主要污染物获得的含推断的白蛋白的级分(级分33-35,18mg蛋白质)用Tris HCl(1M)调到pH8.5并用100ml Sephadex G 25 sf柱(Pharmacia,Uppsala,Sweden)以50mM乙酸钠pH5.2进行层析,缓冲液流速为1ml/分。
在这些条件下,14kDa蛋白质表现出与柱中葡聚糖基质的意想不到的相互作用并且以超过95%的纯度作为单一峰从其蛋白质污染中分离。用巴西坚果的2S白蛋白可观察到与葡聚糖基质相似的特异性相互作用并可用于在单个步骤中对其进行纯化。其它白蛋白也具有相似的行为方式。本领域的技术人员已知的其它碳水化合物基质同样可用于该方法。尽管上述色谱步骤已被具体描述,但可用涉及特异性相互作用的其它技术来代替,例如但不限于分批工艺。
上面获得的推断的白蛋白级分用20mM Tris/HCl pH8.5透析(Spectra/por7)15小时,并用干燥的PEG 8000在透析袋中浓缩到大约0.5mg/ml蛋白质。5mg脱盐的蛋白质通过0.2μm膜滤器过滤并使用在20mM Tris/HCl pH8.5缓冲液中的0-750mM NaCl的梯度建立的MonoQ HR 5/5(Pharmacia,Uppsala,Sweden)柱经离子交换色谱进一步分级分离。三个分离的峰以180mM NaCl(命名为白蛋白1),250mMNaCl(命名为白蛋白2)和360mM NaCl(命名为白蛋白3)洗脱。白蛋白3(Al3)似乎是主要的形式,即,在合并的所有3个级分中它含超过90%的蛋白质,而与Al3相比,发现白蛋白1(Al1)和白蛋白2(Al2)在大豆种子蛋白质中的丰度各少大约20倍。以基于SDS-PAGE的几乎匀质的形式获得所有3种白蛋白级分。用还原剂2-巯基乙醇处理后,三种白蛋白形式中每一种在SDS PAGE中解离成2个更小的不同长度的多肽,表明在天然蛋白质中存在二硫键。在各还原的白蛋白中较大的多肽的大小似乎相似(10kDa),而较短的肽似乎具有不同的大小。分别估计Al1小链的分子量为4.5kDa,Al2小链为4.8kDa,Al3小链为5.1kDa。
对电泳分离的Al2大链,Al2小链,Al3大链和Al3短链的PVDF印迹进行氨基酸分析(表1)。两种白蛋白含有预期高含量的甲硫氨酸,另外还含有惊人的高赖氨酸百分数。尽管似乎两个白蛋白的氨基酸组成基本相似,但观察到具有一些氨基酸的一些明显的区别。
表1氨基酸组成Al2 Al35kDa11kDa 5kDa11kDa肽摩尔%肽摩尔%肽摩尔%肽摩尔%Cys1.933.382.792.88Asx10.89 8.1717.96 9.47Met3.138.002.358.70Thr1.761.034.103.02Ser9.629.007.057.43Glx21.86 19.39 15.42 21.80Pro0.002.653.673.02Gly14.01 9.435.856.64Ala12.99 10.72 5.2911.10Val0.000.003.630.42Ile6.595.904.464.07Leu5.338.966.848.32Tyr0.380.642.450.00Phe0.760.541.900.31His2.931.113.091.24Lys4.248.116.438.85Arg3.582.966.801.85
用自动Edman降解法在应用生物系统测序仪中从各自电泳肽带的PVDF印迹测定了所有小链和大链肽的氨基末端序列。白蛋白1和2的氨基末端序列是相同的。白蛋白3的氨基末端序列与白蛋白1和2的不同。然而,白蛋白3的氨基末端序列与白蛋白1和2的氨基末端序列具有高度的同源性(大约80%)。这些氨基末端序列与在来自狭叶羽扇豆L.的富含硫的2S蛋白质羽扇豆球蛋白δ中发现的序列最密切相关(Gayler,等;植物分子生物学;Vol.15;p.879(1990),本文引用其全文以供参考)。
为了解释Al肽之间的区别,用等电聚焦进一步分析白蛋白级分。分别测定了Al1的等电点为pH6.05,Al2为pH5.45,Al3为pH4.95。
由于对Al1和Al3特异性的cDNA编码用于天冬酰胺连接的N-糖基化的共同序列(见下),分析了结合到含白蛋白部分的伴刀豆球蛋白A。Al1肽不结合伴刀豆球蛋白,N-糖苷酶F处理后在SDS PAGE中无明显的分子量大小差异。因此,大豆白蛋白的N-糖基化似乎是不可能的。
蛋白质测序资料和氨基酸组成结果表明在大豆种子中存在下面明显尚未描述的富含甲硫氨酸和赖氨酸的白蛋白基因产物,即Al1,Al2和Al3。经过假定相同基因产物的不同翻译后加工事件可解释N端Al1和Al2氨基酸序列的相似性。
实施例II从大豆种子cDNA文库分离白蛋白特异性cDNA克隆,RNA分离,cDNA合成和序列分析DNA分离,DNA操作,DNA的放射性标记和杂交基本上按Sambrook等(分子克隆实验手册,冷泉港(1989);本文引用其全文以供参考)所述进行。
大豆植物(Glycme max Merr)在温室或野外生长。收获发育,成熟中期的大豆种子并在-80℃冷冻贮存以用作cDNA文库构建的mRNA来源。
从收集的正在发育的大豆种子(1-15mm大)分离总RNA。在杵臼中将冷冻种子(1-2g鲜重)研成粉末,根据Shure等;细胞;Vol.35;p.225-233;(1983)(本文引用其全文以供参考)所述的方法分离RNA。根据厂家说明书(Pharmacia,Uppsala,Sweden)使用oligo-dTSepharose旋转柱从1mg总RNA分离mRNA。将5μg纯化的mRNA用作cDNA合成的模板并根据厂家说明书(Stratagene,La Jolla,CA)连接进StratageneλZap II载体臂。100ng选定大小的cDNA(>500bp)连接到载体臂上并包装(Stratagene Gigapack Gold)以产生平均cDNA插入大小为l.2kb的1.2×106pfu的一级文库。该文库在大肠杆菌Sure细胞(Stratagene)中扩增以产生2×1010pfu/ml的滴度。
分离200个随机噬斑并重悬于500μl SM。使用辅助噬菌体R408和大肠杆菌宿主菌株XLl Blue根据Stratagene推荐的方法从λZAP II载体切下噬菌粒(Bluescript S/K)。单个菌落在2ml含100μg/ml氨苄青霉素的2×YT培养基中生长过夜。以碱裂解和乙醇沉淀分离质粒(Sambrook等;出处同上;(1989);本文引用其全文以供参考)。
使用T3引物,经过在ABI催化剂8000分子工作站和ABI 1373A测序仪(应用生物系统)上进行Taq循环测序从200个单独的cDNA克隆中获得5′序列。人工编辑序列资料以去掉载体序列,产生使用该文库来自200个随机挑选的cDNA克隆的DNA序列信息数据以利于鉴定和分离编码充足表达的多肽序列(白蛋白多肽是一个例子)的cDNA克隆。
白蛋白特异性cDNA克隆的鉴定使用FASTA系统(遗传学计算机组,Wisconsin序列分析软件装,第8版)用相应于Al1/2和Al3小和大链的氨基末端序列的逆向翻译的DNA序列检索cDNA数据库。发现克隆EST3_38的推断的氨基酸序列的片段表现出与来自Al1小和大链的氨基末端序列精确匹配。发现克隆EST2_36,克隆EST3_13,克隆EST3_14和克隆EST3_62的推断的氨基酸序列与获得的Al3肽的氨基未端序列精确匹配。而且,使用TFASTA系统(遗传学计算机组)将克隆EST3_38和克隆3_62的推断的氨基酸序列与Genbank序列数据库进行计算机比较揭示出与来自羽扇豆种子(狭叶羽扇豆)的富含硫的2S蛋白质羽扇豆球蛋白δ具有同源性。(Gayler等;出处同上;(1990);本文引用其全文以供参考)。
使用Amersham的Ready引物试剂盒用[32P]dCTP(Amersham)标记来自克隆EST3_38的大约600bp的EcoRI片段和来自克隆EST3_62的大约400bp的EcoRI/SacI片段。标记的片段用于从在λZapII(Stratagene)中的来自发育中的大豆种子的cDNA文库筛选15,000的重组噬菌体。在该文库中的大约3%的克隆与两种白蛋白探针杂交。
随机选择45个白蛋白特异性噬菌体,根据厂家建议随后切下相应的噬菌粒并测序。在测序的克隆中,发现42个是白蛋白3特异性的(7个编码全长编码序列)且3个是白蛋白1特异性的(一个编码全长编码序列)。
最长的鉴定的Al1和Al3的特异性克隆pAl1_42和pA13-49的插入片段分别对其整体进行测序(图2和3)且随后分别以名称p9330和p9331进入Pioneer质粒保藏中心。序列分析清楚地鉴定了这些克隆含编码N-端信号肽和终止密码子的全长编码序列。
白蛋白1由包含于723个碱基对的cDNA(SEQ ID NO1)中的465个碱基对编码。该cDNA编码具有155个氨基酸的前体肽原(SEQID NO:2)。该前体肽原包含20个氨基酸的信号肽,大约55个氨基酸的小链,大约80个氨基酸的长链。成熟白蛋白蛋白质包含2个二硫键连接的链,4-5kDa的小链和10kDa的大链。至于推断的氨基酸的氨基酸组成,白蛋白1的序列包括11.8mol%的甲硫氨酸和半胱氨酸,9.6mol%的赖氨酸残基和12.6mol%的天冬酰胺和谷氨酰胺残基。
白蛋白3由包含于777个碱基对cDNA(SEQ ID NO3)中的474个碱基对编码。该cDNA编码具有158个氨基酸的前体肽原(SEQ IDNO4)。前体肽原包含21个氨基酸信号肽,大约60个氨基酸小链和77个氨基酸大链。成熟白蛋白3含2个二硫键连接的链。白蛋白3的推断的氨基酸组成包括11.6mol%的甲硫氨酸和半胱氨酸残基,10.2mol%的赖氨酸残基,和13.2mol%的天冬酰胺和谷氨酰胺残基。
实施例III为了进一步增加优选的氨基酸残基赖氨酸和甲硫氨酸且为了进一步减少非优选的氨基酸残基天冬酰胺和谷氨酰胺,根据Al1和Al3的氨基酸序列的GAP序列对比(遗传学计算机组)(图5)制备了编码称为白蛋1/3(Al1/3)的嵌合白蛋白(SEQ ID NO6)的cDNA。
使用BioRad(Hercules,CA)的Muta-Gene噬菌粒体外诱变试剂盒根据Kunkel方法(Kunkel,T.A.,美国国家科学院学报,Vol.82;p.488;(1985);本文引用其全文以供参考)按厂家建议以定向寡聚脱氧核糖核苷酸诱变修饰cDNA克隆p9331(pAl3.49)。用5个寡聚脱氧核糖核苷酸引物体外诱变5个连续的重复进行诱变。引物及其导致cDNA序列的改变在表2中小结。
表2诱变的寡聚脱氧核糖核苷酸引物SEO与编码的改变的ID Al3前体肽 氨基酸NO寡聚脱氧核糖核苷酸序列 原相关的诱 密码子变氨基位置7 5′GCTGCCGCAAGCAGCTTAAGGGGGTGAACCTC3′ 36 Gln到Lys8 5′GGAAGAATCAACTACATACGTAAGAAGGAAGGAAAAGACG3′ 80 Arg到Lys81 Asn到Lys9 5′GCTGCACAGAAATGAGCGAGCTTAAGA.GCCCCAAATGCCAGTGC3′105 Arg到Lys10 5′GGAGGAGAAGGAGAAGAAGAAAATGGAGAAGGAGTTCATGAACTTGGC3′ 129 Gln到Glu138 Ile到Met11 5′GCAGGTTTGGGCCCATGATCGGGTGCGACTTGTCCTC3′151 Gln到Gly
基本上仅将在编码Al3的cDNA的所示位置的氨基酸密码子改变成在Al1蛋白质序列的相同相关位置(GAP序列对比)发现的编码优选氨基酸的密码子。因此,所得的氨基酸序列Al1/3称为嵌合白蛋白。所有的氨基酸残基改变在认为对其它植物种类的种子相关2S白蛋白的蛋白质结构重要的且因此明显不适于改变的序列区域进行。然而,由于Al1/3中的氨基酸残基已存在于Al1或Al3中,当在种子中表达时,嵌合蛋白质的结构不可能表现出任何有害影响。白蛋白1/3具有158个氨基酸(图6)。白蛋白1/3的氨基酸组成包括12.4mol%的甲硫氨酸和半胱氨酸残基,13.14mol%的赖氨酸残基,及10.3mol%的天冬酰胺和谷氨酰胺残基。
实施例IV用高赖氨酸含量和高硫含量的贮存蛋白基因转化Glycine max大豆(Glycine max)种子经过暴露于在玻璃钟罩中形成的氯气中进行表面灭菌。经过向100ml次氯酸钠(5.25%w/w)中加入3.5ml盐酸(34-37%w/w)产生氯气。暴露在体积为大约1立方英寸的容器中16-20小时。表面灭菌的种子室温贮存于培养皿中。根据Gamborg等(细胞研究实验;Vol.50,pp.151-158;(1968);本文引用其全文以供参考)的方法经过铺板于1/10强度的琼脂固化培养基上使种子发芽。培养基(具有基础有机物的B5基础培养基,Sigma化学公司,目录号G5893;0.32g/L;蔗糖,0.2%w/v.和2-[N-吗啉代]乙磺酸(MES),3.0mM)不含植物生长调节剂,以16小时的白昼长度和大约20mEm2S1的冷白色荧光照射28℃培养。3或4天后,制备共同培养的种子。去掉种皮并将子叶下伸长的根去掉3-4mm。在一些培养皿中每个放置10个制备的种子。
植物基因表达盒的构建含在云扁豆蛋白调节序列控制下的一个拷贝的大豆白蛋白基因的表达盒是二元质粒p9127。p9127以定向寡聚脱氧核苷酸诱变的p9330(pAl1_42)开始在几个步骤中构建,p9330含有Bluescript SK(Stratagene)的质粒骨架中的Al1蛋白质全长的冷却序列。诱变按实施例III所述用寡聚脱氧核糖核苷酸1)5′GCACGAGTCATGACCAAGTCACAATTCTC3′(SEQ ID NO12);和2)5′TCCTCCGATGACTGAGTTAACAAAAAAAGTACTAC3′(SEQ ID NO13)进行以便放入RcaI位点且在翻译起点破坏HindIII位点并且刚好在终止密码子3′端加入HpaI位点。用限制性核酸内切酶RcaI/HpaI消化时,分离出相应于编码Al1序列全长的472碱基对DNA序列并克隆进p4752(NcoI/HpaI)。p4752(图6)含云扁豆蛋白5′调节序列(即启动子)的883个碱基对。接着是云扁豆蛋白5′非翻译区的84个碱基对。刚好在这些序列的3′端是NcoI位点和HpaI位点以利于以5′→3′方向克隆开架阅读框,导致由NcoI位点(-CCATGG)产生的密码子甲硫氨酸起始翻译成为翻译起始密码子。HpaI位点的下游是云扁豆蛋白3′调节序列的1230个碱基对。因此p4752含有云扁豆蛋白启动子云扁豆蛋白终止子。
然后用限制性核酸内切酶EcoRI/HindIII消化所得的质粒p9069并将云扁豆蛋白启动子Al1云扁豆蛋白终止子部分插入质粒p1830(=pARCl2)的EcoRI/HindIII位点(Prosen等,生物技术:Vol.5;p.966;(1987),本文引用其全文以供参考)。质粒p1830是29.5kb的质粒,它是土壤杆菌双重载体系统的一部分且含有嵌合基因胭脂氨酸合成酶/新霉素磷酸转移酶II作为植物细胞的可选择标记。
将p9069的2.89kb片段插入p1830后所得的质粒称为p9127。质粒p9127大约33kb大小且赋予细菌宿主四环素抗性。
然后以本领域已知的冻/融方法将该质粒转化进根癌土壤杆菌LBA4404。二元质粒在所得细菌中的存在以Southern印迹分析证实。
根癌土壤杆菌LBA4404/p9127的制备合并在含四环素1.0mg/ml的基础A培养基中生长至对数期的含二元质粒p9127的根癌土壤杆菌菌株LBA4404的过夜培养物并在550nm下测光密度。将足够体积的培养物放入15ml锥形离心管中以便在每管中收集1.0至2.0×1010个细胞的沉淀,其中Q.D.550的1.0=14×109个细胞/ml。沉淀经过在6000g下离心10分钟产生。离心后弃去上清且试管在室温静置直至需要接种,但不能超过1小时。
转化批量进行接种,以便用新悬浮的土壤杆菌沉淀处理各种子平板。每次沉淀重悬于20ml接种培养基中。接种培养基由B5盐(Sigma化学公司),3.2g/l;蔗糖,2.0%w/v6-苄基氨基嘌呤(BAP),44mM吲哚丁酸(IBA),0.5mM乙酸丁香酮(AS),100mM组成且用MES.10mM缓冲至pH5.5。经旋转进行重悬。然后将接种物注入含制备的种子的培养皿中,用手术刀片离析子叶节。这通过苗端以纵切将种子分成两半保护两个完整的子叶来实现。将苗端的两瓣经过用手术刀片将在挖出从其各自的子叶上去掉。然后经过沿对称轴重复划线用手术刀片离析子叶节。小心不要从外植体到近轴侧完全切下。在大约5分钟内制备了20个外植体,然后不搅拌在室温下培养30分钟。在此期间制备其它的平板。30分钟后将外植体转移进以Gelrite(Merek&Co.,Inc.),0.2%w/v固化的相同培养基的平板上。以近轴侧向上并与培养基表面齐平包埋外植体,在大约20mEm2S1的冰的白色荧光下22℃培养3天。
培养和选择3天后,将外植体移到液体反选择培养基中。反选择培养基由B5 Sales3.2g/l;蔗糖2.0%w/v;BAP,5.0mM;IBA 0.5mM,万古霉素2.00mg/ml;cefotaxime,500mg/ml组成,并用MES,3mM缓冲至pH5.7。在各平皿中以连续缓慢旋转搅拌在室温下洗涤10个外植体4小时。更换4次反选择培养基。
然后将外植体挑到琼脂糖固化的选择培养基上。选择培养基由B5 Sales,3.2g/l:蔗糖,2.0%w/v,BAP,5.0mM;IBA,0.5mM;硫酸卡那霉素50mg/ml组成并用MES3.0mM缓冲至pH5.7。选择培养基用Seakem琼脂糖0.3%w/v固化。外植体包埋于培养基中,近轴侧向下且用16小时的白昼长度和60-80mEm2S1的冷白荧光照射28℃培养。
2周后,在旋转摇床中用液体培养基再洗涤外植体。这次在含硫酸卡那霉素50mg/ml的反选择培养基中洗涤过夜。第二天将外植体挑到琼脂糖固化的选择培养基中。再次将它们包埋于培养基中,近轴侧向下;培养物按前面所述再培养2周。
再生在选择培养基上生长1个月后,转化的组织变得可见,相对于漂白的不太健康的组织背景,再生组织为绿色扇形面。弃去无绿色扇形面的外植体,将具有绿色扇形面的外植体转移进伸长培养基。伸长培养基由B5 Sales,3.2g/l;蔗糖,2.0%w/v,IBA,3.3mM;赤霉酸,1.7mM;万古霉素,100mg/ml;cefotaxlne,30mg/ml;和timentm 30mg/ml组成,用MES 3.0mM缓冲至pH5.7。用gelrite,0.2%w/v固化伸长培养基。近轴侧向上包埋它们并按前面所述培养。继续在该培养基上培养且每隔2周转移进新鲜平板中。当幼苗长成0.5cm长时,在基部切下它们并放入13×100mm试管的生根培养基中。生根培养基由B5 Sales,3.2g/l;蔗糖,15mg/L尼克酸20mM;焦谷氨酸(PGA),900mg/L和IBA,10mM组成。用MES,3.0mM将其缓冲至pH5.7并用Gelrite 0.2%w/v固化。10天后将幼苗转移到无IBA或PGA的相同培养基中。幼苗生根并在这些试管中在前面所述的相同环境条件下保持。
当根系统完全形成时,将小植物转移到植物cons的无菌土壤混合物中(ICN生物药品公司,Irvin,CA,目录号,26-720和1-02)。温度,光周期和光线强度保持与前面相同。在这些条件下,再生变成生长旺盛的几乎正常(尽管较小)的植物。当其根系统又变得充分建立时,切下植物圆锥的一角,使植物在环境室或温室中逐渐锻炼得耐寒。最后将它们栽在土壤混合物中并在温室中生长至成熟,结出种子。
转基因系统的生长,增加和收获来自相同品种的未转化的和转化的植物的种子在春天种植并在秋天收获。各不同的品系分开保持,以1个或多个10.5英尺的排进行生长以达到最大增长。
以本领域熟知的方法可测定特定蛋白质的测量水平,包括但不限于酶联免疫测定。免疫荧光测定,Western印迹分析和免疫沉淀分析。
以在《AOAC分析的方法》(Hilrich(编辑),国际AOAC;Vol.2;P.1096;(1990);引用其全文以供参考)中所述的方法分析来自转化的和未转化的植物的种子的氨基酸成分。
实施例IV白蛋白特异性抗体的制备对白蛋白多肽特异性的抗体经过用含100μg PAGE纯化的白蛋白的匀浆的聚丙烯酰胺凝胶片注射雌性新西兰白兔(Bethyl实验室,Montgomery,TX)6次来生产。然后动物以2周的间隔抽血。按Harlow等;抗体实验手册,冷泉港,NY;(1988);(本文引用其全文以供参考)所述用Affigel 15(BioRad)-固定化的抗原经过亲和色谱进一步纯化该抗体。基本上按BioRad的建议用纯化的白蛋白3制备亲和柱。按Meyer等;细胞生物学杂志;Vol.107;P.163;(1988)(本文引用其全文以供参考)的方法使用来自Amersham(Arlngton Heights,IL)的ECL试剂盒进行对PVDF印迹上的抗原的免疫检测。
本文以参考文献引用所有刊物和专利,尽管单独引用以供参考。本发明不限于所示和所述的具体细节,因为应明白可做出各种变化和修改而仍在权利要求书所限定的本发明的实质和范围内。
序列描述(1)一般信息(i)申请人(A)地址PIONEER HI-BRED INTERNATIONAL,INC(B)街道Darwin Bldg,7100N.W.62nd Ave.
(C)城市Johnston(D)州 依阿华(E)国家美国(F)邮编50131-1000(ii)本发明题目种子中氨基酸组成的改变(iii)序列数13(iv)计算机可读形式(A)媒体类型软盘(B)计算机IBM PC兼容(C)操作系统PC-DOS/MS-DOS(D)软件PatentIn Release#1.0,Version#1.30(v)目前申请资料(A)申请号PCT未指定(B)申请日与本文一致(vi)优先申请资料(A)申请号08/618,911(B)中请日20-MAR-1996(2)SEQ ID NO1的信息(i)序列特征(A)长度723碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型cDNA(ix)特征(A)名称/键CDS(B)位置10…474(xi)序列描述SEQ ID NO1GCACGAGAA ATG ACC AAG CTT ACA ATT CTC CTC ATC GCT CTT CTC TTC48Met Thr Lys Leu Thr Ile Leu Leu Tle Ala Leu Leu Phe1 5 10ATC GCC CAC ACC TGC TGC GCC TCC AAA TGG CAA CAG CAC CAG CAA GAG 96Ile Ala His Thr Cys Cys Ala Ser Lys Trp Gln Gln His Gln Gln Glu15 20 25AGC TGC CGC GAG CAG CTC AAG GGG ATC AAC CTC AAC CCC TGT GAG CAC 144Ser Cys Arg Glu Gln Leu Lys Gly Ile Asn Leu Asn Pro Cys Glu His30 35 40 45ATC ATG GAG AAG ATC CAA GCT GGC CGC CGC GGC GAG GAC GGC AGC GAC 192Ile Met Glu Lys Ile Gln Ala Gly Arg Arg Gly Glu Asp Gly Ser Asp50 55 60GAA GAT CAC ATT CTC ATC AGG ACC ATG CCG GGA AGA ATC AAC TAC ATC 240Glu Asp His Ile Leu Ile Arg Thr Met Pro Gly Arg Ile Asn Tyr Ila65 70 75AGG AAG AAG GAA GGA AAA GAA GAA GAA GAA GAA GGA CAC ATG CAG AAG 288Arg Lys Lys Glu Gly Lys Glu Glu Glu Glu Glu Gly His Met Gln Lys80 85 90TGC TGC AGC GAA ATG AGC GAG CTG AAA AGC CCC ATA TGC CAG TGC AAA 336Cys Cys Ser Glu Met Set Glu Leu Lys Ser Pro Ile Cys Gln Cys Lys95 100 105GCG CTA CAG AAG ATA ATG GAT AAC CAG AGC GAG CAA CTG GAG GGG AAG 384Ala Leu Gln Lys Ile Met Asp Asn Gln Ser Glu Gln Leu Glu Gly Lys110 l15 120 125GAG AAG AAG CAG ATG GAG AGA GAG CTC ATG AAC TTG GCT ATT AGG TGC 432Glu Lys Lys Gln Met Glu Arg Glu Leu Met Asn Leu Ala Ile Arg Cys130 135 140AGG TTG GGA CCC ATG ATA GGG TGC GAC TTG TCC TCC GAT GAC 474Arg Leu Gly Pro Met Ile Gly Cys Asp Leu Ser Ser Ser Asp145 150 155TGAAAAAAAA GTACTACTAA CACATATATG TGTTAGTTTA TGCTAGCTAG AAGAACGTAT534AAGCTATCTC CGTATGTTGT ATATTAATAA AAAGATCATC ACTGGTGAAT GGTGATCGTG594TATGTAACGT AGTGGGCAAT GGAAGCACTT AGAGrGTGCT TTGTGGCCTT GCCCTCTGTT554TTGATAACTG AGACTTTTGC GAATACCGTT CGTTTTTCCC TTCAAAAAAA AAAAAAAAAA714AAAAAAAAA723(2)SEQ ID NO2的信息(i)序列特征(A)长度155个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO2Met Thr Lys Leu Thr Ile Leu Leu Ile Ala Leu Leu Phe Ile Ala His1 5 10 15Thr Cys Cys Ala Ser Lys Trp Gln Gln His Gln Gln Glu Ser Cys Arg20 25 30Glu Gln Leu Lys Gly Ile Ash Leu Asn Pro Cys Glu His Ile Met Glu35 40 45Lys Ile Gln Ala Gly Arg Arg Gly Glu Asp Gly Ser Asp Glu Asp His50 55 60Ile Leu Ile Arg Thr Met Pro Gly Arg Ile Asn Tyr Ile Arg Lys Lys65 70 75 80Glu Gly Lys Glu Glu Glu Glu Glu Gly His Met Gln Lys Cys Cys Ser85 90 95Glu Met Ser Glu Leu Lys Ser Pro Ile Cys Gln Cys Lys Ala Leu Gln100 105 110Lys Ile Met Asp Asn Gln Ser Glu Gln Leu Glu Gly Lys Glu Lys Lys115 120 125Gln Met Glu Arg Glu Leu Met Asn Leu Ala Ile Arg Cys Arg Leu Gly130 135 140Pro Met Ile Gly Cys Asp Leu Ser Ser Asp Asp145 150 155(2)SEQ ID NO3的信息(i)序列特征(A)长度777碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型cDNA(ix)特征(A)名称/键CDS(B)位置28…501(xi)序列描述SEQ ID NO3:GAGCTCGTGC CGAATCGGCA CGAGAAA ATG ACC AAG TTC ACA ATC CTC CTC51Met Thr Lys Phe Thr Ile Leu Leu160ATC TCT CTT CTC TTC TGC ATC GCC CAC ACT TGC AGC GCC TCC AAA TGG 99Ile Ser Leu Leu Phe Cys Ile Ala His Thr Cys Ser Ald Ser Lys Trpl65 170 175CAG CAC CAG CAA GAT AGC TGC CGC AAG CAG CTC CAG GGG GTG AAC CTC 147Gln His Gln Gln Asp Ser Cys Arg Lys Gln Leu Gln Gly Vdl Asn Leu180 185 190 195ACG CCC TGC GAG AAG CAC ATC ATG GAG AAG ATC CAA GGC CGC GGC GAT 195Thr Pro Cys Glu Lys His Ile Met Glu Lys Ile Gln GLy Arg Gly Asp200 205 210GAC GAT GAT GAT GAT GAC GAC GAC AAT CAC ATT CTC AGG ACC ATG CGG 243Asp Asp Asp Asp Asp Asp Asp Asp Asn His Ile Leu Arg Thr Met Arg215 220 225GGA AGA ATC AAC TAC ATA AGG AGG AAC GAA GGA AAA GAC GAA GAC GAA 291Gly Arg Ile Asn Tyr Ile Arg Arg Asn Glu Gly Lys Asp Glu Asp Glu230 235 240GAA GAA GAA GGA CAC ATG CAG AAG TGC TGC ACA GAA ATG AGC GAG CTG 339Glu Glu Glu Gly His Met Gln Lys Cys Cys Thr Glu Met Ser Glu Leu245 250 255AGA AGC CCC AAA TGC CAG TGC AAA GCG CTG CAG AAG ATA ATG GAG AAC 387Arg Ser Pro Lys Cys Gln Cys Lys Ala Leu Gln Lys Ile Met Glu Asn260 265 270 275CAG AGC GAG GAA CTG GAG GAG AAG CAG AAG AAG AAA ATG GAG AAG GAG 435Gln Ser Glu Glu Leu Glu Glu Lys Gln Lys Lys Lys Met Glu Lys Glu280 285 290CTC ATT AAC TTG GCT ACT ATG TGC AGG TTT GGA CCC ATG ATC CAG TGC 483Leu Ile Asn Leu Ala Thr Met Cys Arg Phe Gly Pro Met Ile Gln Cys295 300 305GAC TTG TCC TCC GAT GAC TAAGAAGTTA AAAGCAATGT TGTCACTTGT 531Asp Leu Ser Ser Asp Asp310ACGTACTAAC ACATGATGTG ATAGTTTATG CTAGCTAGCT ATAACATAAG CTGTCTGTGA591GTGTGTTGTA TATTAATAAA GATCATCACT GGTGAATGGT GATCGTGTAC GTACCCTACT651TAGTAGGCAA TGGAAGCACT TAGAGTGTGC TTTGTGCATG GCCTTGCCTC TGTTTTGAGA711CTTTTGTAAT GTTTTCGAGT TTAAATCTTT GCCTTTGCGG AAAAAAAAAA AAAAAAAAAA771AAAAAA 777(2)SEQ ID NO4的信息(i)序列特征(A)长度158个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO4Met Thr Lys Phe Thr Ile Leu Leu Ile Ser Leu Leu Phe Cys Ile Ala1 5 10 15His Thr Cys Ser Ala Ser Lys Trp Gln His Gln Gln Asp Ser Cys Arg20 25 30Lys Gln Leu Gln Gly Val Asn Leu Thr Pro Cys Glu Lys His Ile Met35 40 45Glu Lys Ile Gln Gly Arg Gly Asp Asp Asp Asp Asp Asp Asp Asp Asp50 55 60Asn His Ile Leu Arg Thr Met Arg Gly Arg Ile Asn Tyr Ile Arg Arg65 70 75 80Asn Glu Gly Lys Asp Glu Asp Glu Glu Glu Glu Gly His Met Gln Lys85 90 95Cys Cys Thr Glu Met Ser Glu Leu Arg Ser Pro Lys Cys Gln Cys Lys100 105 110Ala Leu Gln Lys Ile Met Glu Asn Gln Ser Glu Glu Leu Glu Glu Lys115 120 125Gln Lys Lys Lys Met Glu Lys Glu Leu Ile Asn Leu Ala Thr Met Cys130 135 140Arg Phe Gly Pro Met Ile Gln Cys Asp Leu Ser Ser Asp Asp145 150 155(2)SEQ ID NO5的信息(i)序列特征(A)长度777碱基对
(B)类型 核酸(C)链型 单链(D)拓扑学线性(ii)分子类型cDNA(ix)特征(A)名称/键 CDS(B)位置28…501(xi)序列描述SEQ ID NO5GAGCTCGTGC CGATCGGCA CGAGAAA ATG ACC AAG TTC ACA ATC CTC CTC 51Met Thr Lys Phe Thr Ile Leu Leu160 165ATC TCT CTT CTC TTC TGC ATC GCC CAC ACT TGC AGC GCC TCC AAA TGG 99Ile Ser Leu Leu Phe Cys Ile Ala His Thr Cys Ser Ala Ser Lys Trp170 175 180CAG CAC CAG CAA GAT AGC TGC CGC AAG CAG CTT AAG GGG GTG AAC CTC 147Gln His Gln Gln Asp Ser Cys Arg Lys Gln Leu Lys Gly Val Asn Leu185 190 195ACG CCC TGC GAG AAG CAC ATC ATG GAG AAG ATC CAA GGC CGC GGC GAT 195Thr Pro Cys Glu Lys His Ile Met Glu Lys Ile Gln Gly Arg Gly Asp200 205 210GAC GAT GAT GAT GAT GAC GAC GAC AAT CAC ATT CTC AGG ACC ATG CGG 245Asp Asp Asp Asp Asp Asp Asp Asp Asn His Ile Leu Arg Thr Met Arg215 220 225 230GGA AGA ATC AAC TAC ATA CGT AAG AAG GAA GGA AAA GAC GAA GAC GAA 291Gly Arg Ile Asn Tyr Ile Arg Lys Lys Glu Gly Lys Asp Glu Asp Glu235 240 245GAA GAA GAA GGA CAG ATG CAG AAG TGC TGC ACA GAA ATG AGC GAG CTT 339Glu Glu Glu Gly Gln Met Gln Lys Cys Cys Thr Glu Met Ser Glu Leu250 255 260AAG AGC CCC AAA TGC CAG TGC AAA GCG CTG CAG AAG ATA ATG GAG AAC 387Lys Ser Pro Lys Cys Gln Cys Lys Ala Leu Gln Lys Ile Met Glu Asn265 270 275CAG AGC GAG GAA CTG GAG GAG AAG GAG AAC AAG AAA ATG GAG AAG GAG 435Gln Ser Glu Glu Leu Glu Glu Lys Glu Asn Lys Lys Met Glu Lys Glu280 285 290CTT ATG AAC TTG GCT ACT ATG TGC AGG TTT GGG CCC ATG ATC GGA TGC 483Leu Met Asn Leu Ala Thr Met Cys Arg Phe Gly Pro Met Ile Gly Cys295 300 305 310GAC TTG TCC TCC GAT GAC TAAGAAGTTA AAAGCAATGT TGTCACTTGT 531Asp Leu Ser Ser Asp Asp315ACGTACTAAC ACATGATGTG ATAGTTTATG CTAGCTAGCT ATAACATAAG CTGTCTCTGA591GTGTGTTGTA TATTAATAAA GATCATCACT GGTGAATGGT GATCGTGTAC GTACCCTACT651TAGTAGGCAA TGGAAGCACT TAGAGTGTGC TTTGTGCATG GCCTTGCCTC TGTTTTGAGA711CTTTTGTAAT GTTTTCGAGT TTAAATCTTT GCCTTTGCGG AAAAAAAAAA AAAAAAAAAA771(2)SEQ ID NO6的信息(i)序列特征(A)长度158个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO6Met Thr Lys Phe Thr Ile Leu Leu Ile Ser Leu Leu Phe Cys Ile Ala1 5 10 15His Thr Cys Ser Ala Ser Lys Trp Gln His Gln GIn Asp Ser Cys Arg20 25 30Lys Gln Leu Lys Gly Val Asn Leu Thr Pro Cys Glu Lys His Ile Met35 40 45Glu Lys Ile Gln Gly Arg Gly Asp Asp Asp Asp Asp Asp Asp Asp Asp50 55 60Asn His Ile Leu Arg Thr Met Arg Gly Arg Ile Asn Tyr Ile Arg Lys65 70 75 80Lys Glu Gly Lys Asp Glu Asp Glu Glu Glu Glu Gly Gln Met Gln Lys85 90 95Cys Cys Thr Glu Met Ser Glu Leu Lys Ser Pro Lys Cys Gln Cys Lys100 105 110Ala Leu Gln Lys Ile Met Glu Asn Gln Ser Glu Glu Leu Glu Glu Lys115 120 125Glu Asn Lys Lys Met Glu Lys Glu Leu Met Asn Leu Ala Thr Met Cys130 135 140Arg Phe Gly Pro Met Ile Gly Cys Asp Leu Ser Ser Asp Asp145 150 155(2)SEQ ID NO:7的信息(i)序列特征(A)长度32碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)序列描述SEQ ID NO7GCTGCCGCAA GCAGCTTAAG GGGGTGAACC TC 32(2)SEQ ID NO:8的信息(i)序列特征
(A)长度40碱基对(B)类型: 核酸(C)链型单链(D)拓扑学线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)序列描述SEQ ID NO8GGAAGAATCA ACTACATACG TAAGAAGGAA GGAAAAGACG40(2)SEQ ID NO9的信息(i)序列特征(A)长度44碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)序列描述SEQ ID NO9GCTGCACAGA AATGAGCGAG CTTAAGAGCC CCAAATGCCA GTGC 44(2)SEQ ID NO10的信息(i)序列特征(A)长度48碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)序列描述SEQ ID NO10GGAGGAGAAG GAGAAGAAGA AAATGGAGAA GGAGTTCATG AACTTGGC 48(2)SEQ ID NO11的信息(i)序列特征(A)长度37碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型其它核酸
(A)描述/desc=“引物”(xi)序列描述:SEQ ID NO11GCAGGTTTGG GCCCATGATC GGGTGCGACT TGTCCTC 37(2)SEQ ID NO12的信息(i)序列特征(A)长度29碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)序列描述SEQ ID NO12GCACGAGTCA TGACCAAGTC ACAATTCTC29(2)SEQ ID NO13的信息(i)序列特征(A)长度35碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)序列描述SEQ ID NO13TCCTCCGATG ACTGAGTTAA CAAAAAAAGT ACTAC 3权利要求
1. 一种分离的和纯化的DNA分子,包含编码种子贮存蛋白质的预选DNA片段。
2.权利要求1的DNA分子,其中种子贮存蛋白质是大豆种子贮存蛋白质。
3.权利要求1的DNA分子,其中大豆种子贮存蛋白质是白蛋白。
4.权利要求1的DNA分子,其中预选的DNA片段编码具有SEQID NO2的蛋白质。
5.权利要求1的DNA分子,其中预选的DNA片段与SEQ ID NO1碱基对10到474之间具有至少大约(60%)的相同性。
6.权利要求1的DNA分子,其中预选的DNA片段是经定点诱变修饰,使所编码的蛋白质的营养质量增加的SEQ ID NO1。
7.权利要求1的DNA分子,其中预选的DNA片段编码具有SEQED NO4的蛋白质。
8.利要求1的DNA分子,其中预选的DNA片段与SEQ ID NO3的碱基对28到501之间具有至少大约60%的相同性。
9.权利要求1的DNA分子,其中预选的DNA片段是经定点诱变修饰使所编码的蛋白质营养质量增加的SEQ ID NO3。
10.权利要求1的DNA分子,其中预选的DNA片段编码具有SEQID NO5的蛋白质。
11.一种表达盒,包含与在宿主植物细胞中有功能的启动子有效相连的编码大豆种子贮存蛋白质的预选的DNA片段。
12.权利要求11的表达盒,其中该启动子是种子特异性启动子。
13.在植物种子中增加预选氨基酸水平的方法,包括a)将包含有效连接到在植物细胞中有功能的启动子上的编码包含至少一个预选氨基酸的大豆种子贮存蛋白质的预选DNA片段的表达盒导入植物细胞以产生转化的植物细胞;b)从转化的细胞再生转化的植物;c)从再生的转化植物中分离种子,其中该种子包含相对于相应未转化的植物种子中的预选氨基酸量而言以足以增加了转化植物种子中预选氨基酸含量的量的种子贮存蛋白质。
14.根据权利要求13的方法,其中的植物是大豆。
15.根据权利要求14的方法,其中预选的氨基酸是赖氨酸。
16.根据权利要求15的方法,其中预选的氨基酸除赖氨酸外还有甲硫氨酸或半胱氨酸。
17.根据权利要求16的方法,其中种子中赖氨酸的量至少增加大约5-10%。
18.根据权利要求17的方法,其中种子中甲硫氨酸和半胱氨酸的量至少增加大约15-30%。
19.由权利要求13的方法产生的种子。
20.由权利要求19的种子产生的植物。
21.一种能育的转基因植物,它含有包含一个启动子且在该启动子控制下编码包含至少一种选自甲硫氨酸,半胱氨酸和赖氨酸的预选氨基酸的大豆种子贮存蛋白质的分离的预选DNA片段,其中该DNA片段以种子贮存蛋白质表达,使转基因植物种子中种子贮存蛋白质氨基酸的水平增加到与转基因植物种子的区别仅在于未人工导入DNA片段的大豆植物种子的水平上,且其中该DNA片段通过转基因植物的完全正常的有性循环传递给下一代。
22.能特异性地结合大豆白蛋白的抗体。
23.权利要求22的抗体,它能特异性地结合具有SEQ ID NO2或SEQ ID NO4的蛋白质。
24.由包含于根据权利要求4的分离的和纯化的DNA分子中的预选DNA片段编码的蛋白质。
25.权利要求24的蛋白质,其特征在于该蛋白质具有SEQ IDNO2,SEQ ID NO4或SEQ ID NO5。
26.用于分离和纯化2S白蛋白的方法,包含经过白蛋白与碳水化合物树脂基质的特异性相互作用从污染的蛋白质中分离该白蛋白的步骤。
27.权利要求26的方法,其中的碳水化合物是葡聚糖。
全文摘要
本发明提供了经遗传修饰增加植物种子中预选的氨基酸的水平,从而增加该种子的营养价值的方法。本发明在增加植物种子中甲硫氨酸,赖氨酸,和/或半胱氨酸含量中特别有用。另外还提供了编码大豆白蛋白的分离的内源性DNA分子。本发明还提供了能特异性地结合大豆白蛋白的抗体。本发明进一步提供了分离和纯化2S白蛋白的方法。
文档编号C07K14/415GK1193355SQ97190511
公开日1998年9月16日 申请日期1997年3月19日 优先权日1996年3月20日
发明者R·朱恩, C·哈斯丁斯, S·考兰, D·胡 申请人:先锋高级育种国际公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1