植物中提高的蛋白质产量和贮存的制作方法

文档序号:580915阅读:478来源:国知局
专利名称:植物中提高的蛋白质产量和贮存的制作方法
技术领域
本发明涉及植物遗传学领域。更具体地,本发明涉及基因构建体和使用所述构建 体改良植物种子以产生提高量的目的蛋白质的方法。
背景技术
种子为人和牲畜提供了膳食蛋白质的重要来源。某些种类的种子例如大豆能够积 累相对高水平的内源蛋白质,从而使大豆成为进行遗传修饰以产生引入的蛋白质的良好选 择。尽管许多分子工具是可获得的,然而种子的遗传修饰通常受到工程改造的蛋白积累不 足的限制。许多细胞内过程可影响总蛋白质积累,包括转录、翻译、蛋白质装配和折叠、甲基 化、磷酸化、转运和蛋白质水解。一个或多个此类过程的干扰可增加在基因工程改造的种子 中产生的蛋白质的量。基因的引入可对植物生长和发育造成有害作用。在这样的情况下,基因的表达可 能需要被限制于期望的靶组织。例如,可能必需以种子特异性方式表达氨基酸脱调控基因 以避免可影响产量或其他农艺性状的不期望的表型。大豆种子包含35%至43%的蛋白质(基于干重);该蛋白质大部分为贮藏蛋白 (storage protein) 0存在两种主要的大豆种子贮藏蛋白大豆球蛋白(也称为IlS球蛋 白)和β伴大豆球蛋白(也称为7S球蛋白)。它们总共占70至80%的种子总蛋白,或25 至35%的种子干重。大豆球蛋白是具有大约360kDa的分子量的大蛋白。其是由鉴定为Gl、G2、G3、G4 和G5的5个主要亚基的不同组合组成的六聚物。β伴大豆球蛋白是具有范围在150至MOkDa之间的分子量的异质糖蛋白。其由 鉴定为α、α ‘和β的3个高度带负电荷的亚基的不同组合组成。Kinney 和 Herman(〃 Cosuppression of the α Subunits ofbeta-conglycinin in Transgenic Soybean Seeds Induces theFormat i on of EndoplasmicReticulum-Derived Protein Bodies" PlantCell 13 1165-1178 UOOl))报导,使用包含 可转录成β伴大豆球蛋白5'非翻译前导序列的区域的构建体的转化导致β伴大豆球蛋 白的α和α ‘亚基的减少。Kirmey和Herman指出,‘‘β伴大豆球蛋白的减少可明显地 由大豆球蛋白和其他液泡蛋白在ER中的增加的积累补偿",这使得他们推测,“可能通过共 表达其他蛋白质,可能作为具有可切割间隔子的大豆球蛋白融合蛋白,可能能够改造大豆 以高水平表达和积累需要ER介导的折叠和加工事件的外源蛋白。Kirmey和Herman没有教 导在大豆种子中减少β伴大豆球蛋白的表达,同时在大豆球蛋白启动子的控制之下表达 融合至ER信号肽的外源蛋白。Oulmassov等(美国专利申请2005/0079494)描述了在启动子例如大豆球蛋白启 动子的控制下的突变的大豆球蛋白的表达。Oulmassov等还描述了反义介导的包含低含量 的必需氨基酸,但在特定的组织中仍然以相对高水平表达的序列(例如β伴大豆球蛋白和 大豆球蛋白)的抑制。Oulmassov等人没有教导减少β伴大豆球蛋白的表达对于在大豆球 蛋白启动子的控制之下表达的蛋白质的表达和积累的任何可能后果,也没有教导在大豆种 子中抑制β伴大豆球蛋白的表达,同时表达在大豆球蛋白启动子控制之下的融合至ER信 号肽的外源蛋白的任何可能后果。美国专利申请2007/0067871)描述了具有增加的种子β伴大豆球蛋白含量的 大豆,其包括提供至少两个大豆球蛋白亚基的无义突变表型(null phenotype)的非转基因 突变。mi没有教导减少β伴大豆球蛋白或大豆球蛋白的表达或表达外源蛋白。本领域中需要的是,使用大豆产生高水平的目的蛋白质(例如用于食品、燃料、饲 料、工业酶、生物加工酶、疫苗、治疗性蛋白、抗体等的蛋白质)的方法。发明概述本文中提供的是在种子中产生增加量的目的异源蛋白质的方法。在一个实施方案 中,遗传抑制种子蛋白的产生引起种子通过增加其他蛋白质的产量来重新平衡其蛋白质组 成以维持正常的种子蛋白含量。可将该效应与基因的“等位基因模拟物(allele mimic)” 的使用组合以驱动异源蛋白质的表达,所述基因被上调以重新平衡蛋白质含量。在一个实施方案中,本文中提供的是转基因双子叶植物,所述植物缺乏一种或多 种植物贮藏蛋白并且具有拥有可操作地连接至贮藏蛋白启动子和ER信号序列的开放阅 读框的异源多核苷酸。任选地,异源多核苷酸还包含5'翻译增强子结构域(TED)和/或 3' TED。任选地,异源多核苷酸还包含ER滞留序列以诱导异源多核苷酸在ER或ER衍生的 小泡的腔中积累。在另一个实施方案中,提供了转基因双子叶植物,所述植物缺乏一种或多种种子 贮藏蛋白并且具有异源多核苷酸,所述异源多核苷酸具有种子贮藏蛋白启动子、具有ER信 号序列、期望的蛋白质编码序列和ER滞留信号的开放阅读框,其中所述缺乏导致内源种子 贮藏蛋白相对于野生型植物的种子贮藏蛋白减少至少50%,其中所述开放阅读框可操作地 连接至种子贮藏蛋白启动子,并且其中转基因植物的种子能够以高于5%的种子总干重的 水平产生异源蛋白质。异源多核苷酸还可具有5'翻译增强子结构域和/或3'翻译增强 子结构域。ER滞留序列可诱导异源蛋白质在ER或ER衍生的小泡的腔中积累。双子叶植物 可以是例如豆科(Fabaceae),任选地豆目(Fabales),任选地大豆属(soya genus)的成员。 双子叶植物可以是大豆属(Glycine genus)的成员例如大豆。启动子可来源于例如Kunitz胰蛋白酶抑制剂、大豆凝集素、免疫显性大豆变应原PM或Gly m Bd 30k、葡萄糖结合蛋白、 种子成熟蛋白、大豆球蛋白或伴大豆球蛋白。翻译增强子结构域可来源于Kimitz胰蛋白酶 抑制剂、大豆凝集素、免疫显性大豆变应原P34或Gly m Bd 30k、葡萄糖结合蛋白、种子成熟 蛋白、大豆球蛋白或伴大豆球蛋白。缺乏的贮藏蛋白可以是例如Kimitz胰蛋白酶抑制剂、 大豆凝集素、免疫显性大豆变应原PM或Gly m Bd 30k、葡萄糖结合蛋白、种子成熟蛋白、大 豆球蛋白或伴大豆球蛋白中的一个或多个。在一个实施方案中,缺乏可以因例如编码种子 贮藏蛋白的核酸的RNAi、反义或有义片段的存在而引起。本文中提供的双子叶植物种子可具有例如种子内源贮藏蛋白的多于75%的缺乏。 异源蛋白质可在双子叶植物的种子中积累至大于大约2%或大于大约4%或大于大约5% 的种子总干重的水平。在另一个实施方案中,提供了转基因种子或获自所述种子的蛋白质。 可纯化异源蛋白质。在一个实施方案中,蛋白质编码序列编码酶或其片段。酶可以是纤维素分解酶例 如β -葡糖苷酶、外切葡聚糖酶1、外切葡聚糖酶II、内切葡聚糖酶、木聚糖酶、半纤维素酶、 木质酶、木质素过氧化物酶或锰过氧化物酶。在一个实施方案中,提供了商业上有用的酶组 合物。在一个实施方案中,本文中提供了转基因双子叶植物,所述植物缺乏一种或多种 内源植物贮藏蛋白而具有异源多核苷酸,其中所述缺乏导致内源植物贮藏蛋白的水平相对 于野生型植物减少至少50%,所述异源多核苷酸具有可操作地连接至开放阅读框的补偿蛋 白的基因调控区,所述阅读框编码具有ER信号序列、期望的蛋白质编码序列和ER滞留信号 的序列,其中转基因双子叶植物的种子能够以大于5%的种子总干重的水平产生异源蛋白 质。在另一个实施方案中,本文中提供了通过将酶贮藏在种子中而在使用之前稳定地 贮藏酶的方法,所述种子来自缺乏一种或多种植物贮藏蛋白但具有异源多核苷酸的转基因 双子叶植物,其中所述缺乏导致内源种子蛋白减少至少50%,所述异源多核苷酸具有种子 贮藏蛋白启动子、开放阅读框,所述开放阅读框具有编码ER信号序列、目的酶和ER滞留信 号的核酸,其中所述开放阅读框可操作地连接至种子贮藏蛋白启动子,并且其中转基因植 物的种子能够以大于5%的种子总干重的水平产生酶,并且将酶贮藏在转基因双子叶植物 的种子中。在另一个实施方案中,本文中提供了在双子叶植物中产生提高量的异源蛋白质的 方法,所述方法用多核苷酸(所述多核苷酸具有种子贮藏蛋白启动子、开放阅读框,所述开 放阅读框具有ER信号序列、期望的蛋白质编码序列和ER滞留信号,其中所述开放阅读框可 操作地连接至种子贮藏蛋白启动子)稳定地转化植物细胞,从稳定转化的植物细胞获得纯 合植物品系,将稳定转化的植物品系种质渗入(introgress)至缺乏内源种子贮藏蛋白的 植物,培养经种质渗入的转基因植物的种子,从种质渗入的转基因植物的种子获得异源蛋 白质,其中所述缺乏导致内源种子贮藏蛋白相对于野生型植物的内源种子贮藏蛋白减少至 少50%,其中种质渗入的转基因植物的种子能够以大于5%的种子总干重的水平产生异源 蛋白质。内源种子贮藏蛋白的缺乏可因例如编码种子贮藏蛋白的核酸的RNAi、反义或有义 片段的存在而引起。在另一个实施方案中,提供了在双子叶植物中产生增加量的异源蛋白质的方法,其包括用多核苷酸稳定转化植物细胞,所述多核苷酸具有种子贮藏蛋白启动子、开放阅读 框,所述开放阅读框包含ER信号序列、期望的蛋白质编码序列和ER滞留信号;其中所述开 放阅读框可操作地连接至种子贮藏蛋白启动子;其中所述核苷酸还包含能够下调内源种子 贮藏蛋白的RNAi序列;获得纯合植物品系,和培养植物的种子以获得异源蛋白质。附图概述

图1是从内质网(ER)至蛋白质贮藏液泡或蛋白质体(protein body) (PB)的亚细 胞定位的不同途径的模型。图2是显示经设计用于抑制大豆球蛋白的RNAi构建体的示意图。大豆球蛋白基 因和fad2(脂肪酸去饱和酶)基因的区段包括在RNAi构建体中。加入fad2区段作为构建 体的任选特征,从而提供了用于另外的筛选的标记。图3是电子显微照片,其显示来自种子蛋白缺乏品系"SP-"植物的细胞形成蛋 白质贮藏液泡(PSV)(图框A),所述蛋白质贮藏液泡在大小和外观上与在来自WT种子的细 胞中形成的PSV(图框B)明显相似。PSV 蛋白质贮藏液泡;OB 油体;AV :自噬泡;ER 内质 网;Nucl 细胞核;G 高尔基体。条棒相当于1 μ m。图4是野生型(WT)品种"Jack"与SP-种子的蛋白质组之间的双向等电聚焦/ 十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(IEF/SDS-PAGE)比较的照片。图5是使用Affymetrix DNA阵列平台测定进行的SP-与WT品种‘‘Jack"相比较 的大规模转录组测定的散布图。图6是显示WT(" Jack")对SP-大豆品系的种子中种子蛋白质组成的变化的饼 图。图7是显示GFP-kdel构建体的详细情况的示意图。标示了大豆球蛋白启动子、大 豆球蛋白5' UTR(" TED" )、ER信号序列、GFP编码序列、kdel ER滞留信号序列和大豆球 蛋白3' UTR(" TED")。标示了转录起始位点、翻译起始位点和翻译终止位点。图8是显示两个纯合亲本品系和杂交的纯合后代的大豆种子的白光(图框A)和 蓝光(图框B)图像的一组照片。显示的种子已被破裂,从而暴露子叶组织(图框A和B)。 图框C和D是WT背景(图框C)和GFP-kdel χ β CS (图框D)的种子中来自GFP-kdel (添 加了 C末端KDELER滞留标签的GFP蛋白)的贮藏薄壁组织细胞的伪彩色GFP图像。条棒 相当于10 μ m。图9是来自β CS种子(β伴大豆球蛋白被抑制的;图框A) ,GFP-kdel种子(图框 B)和GFP-kdel χ β CS种子(图框C)的蛋白质裂解物的2D IEF-PAGE分离以及针对GFP 进行探测的重复裂解物凝胶的免疫印迹(图框D)的一组照片。GFP-kdel (图框B和C)或 GFP对照蛋白质点包封在所标记的盒中。GFP-kdel性状至β CS品系内的种质渗入导致增 加的GFP-kdel的积累。使用商业单克隆抗体探针通过印迹上的免疫反应性来确定GFP点 的身份(identity)(图框D)。图10显示β CS,WT中的GFP-kdel或GFP-kdel χ β CS的荧光显微镜检查(图框 A)、1D PAGE(图框B)和β伴大豆球蛋白免疫印迹(图框C)。图11是从β CS、WT中的GFP-kdel或GFP-kdel χ β CS种子制备并且使用商业 GFP作为对照标准进行测定的种子裂解物中GFP-kdel丰度的荧光分析的条形图。图12是显示WT(〃 Jack" )、β CS和GFP-kdel χ β CS中大豆球蛋白的加工的分级分离的种子蛋白质的单向PAGE的照片。扫描所获得的染色的凝胶,并显示总计的前大豆 球蛋白(proglycinin)的前大豆球蛋白级分、大豆球蛋白A4、大豆球蛋白酸性亚基和大豆 球蛋白碱性亚基的相对分布。结果显示大豆球蛋白群体的前大豆球蛋白级分的大于3倍的 降低。标示了分子量标记和贮藏蛋白同种型。图13是SP-植物(图框A)、在WT背景中转化的GFP-kdel (图框B)和用GFP_kdel 种质渗入的SP-植物(图框C)中蛋白质产量的2-D凝胶分析的照片。图14是从SP-植物、用GFP-kdel转化的WT植物和GFP-kdel χ SP-杂种的种子 制备的种子裂解物中GFP-kdel丰度的荧光分析的条形图。商业GFP用作对照标准。图15是显示β CS χ GFP-kdel植物的晚熟种子细胞的细胞质中蛋白质体的丰度 的电子显微照片。图框A 蛋白质体包含分散的基质并且被ER膜包围。图框B:显示蛋白质 体的ER来源的图像。PSV;蛋白质贮藏液泡;OB=油体。条棒相当于1 μ m。发明详述本文中提供的是经遗传改良的双子叶植物,其具有产生大量的异源目的蛋白质的 种子。在某些实施方案中,种子缺乏至少一种内源种子贮藏蛋白,从而允许在其中产生增加 量的外源蛋白质。可将编码异源蛋白的核酸序列可操作地连接至来自种子蛋白质的调控 区。在一些实施方案中,该调控区来源于响应内源种子蛋白的缺乏而天然上调的种子蛋白。在一些实施方案中,可将双子叶植物中的遗传编程(geneticprogramming)成功 地用于产生目的蛋白质,例如在质量和数量上优良的蛋白质(例如,重组蛋白)。在一些实施方案中,修饰植物的遗传背景以便一种或多种贮藏蛋白的量(例如按 重量计)存在缺乏。通过使用一种或多种贮藏蛋白启动子来驱动靶蛋白质的转录,植物的 重新平衡机制可导致特别高水平的异源蛋白质产量。在该实施方案中,不希望受理论束缚,响应引起主要种子贮藏蛋白丧失的遗传缺 陷,种子通过增加其他种子贮藏蛋白的产量来“重新平衡”。通过将目的异源基因连接至被 上调以重新平衡种子中蛋白质的总量的内源种子蛋白的基因调控元件,可在种子中产生高 水平的异源蛋白质。由于外源蛋白质的该高水平的积累,该“等位基因模拟物”法可用于在 大豆或其他双子叶植物种子中产生蛋白质,特别是具有商业价值的蛋白质。此外,异源蛋白质至ER的任选靶向允许其稳定地以甚至更高的水平在种子中积 累。可在异源蛋白质上对信号进行工程改造,这可导致靶蛋白被扣留在ER衍生的小泡中, 无论植物是否天然产生生理学上的蛋白质体。此类ER衍生的小泡令人惊讶地不含其他蛋 白质例如蛋白酶、糖苷酶等,从而以较少被降解或较不可降解的形式积累更高水平的蛋白 质。如本文中所使用的,使用下列缩写和定义。术语"大豆球蛋白"意指也称为IlS球蛋白的主要种子贮藏蛋白,其存在于大豆 种子中。术语"β伴大豆球蛋白"意指也称为7S球蛋白的主要种子贮藏蛋白,其存在于 大豆种子中。术语“GBP”意指葡萄糖结合蛋白。术语〃 KTI 〃意指Kunitz胰蛋白酶抑制剂。术语〃 LE"意指大豆凝集素。术语〃 Ρ;34〃意指免疫显性大豆变应原Ρ;Μ或Gly m Bd 3。
9
缩写〃 fad2〃意指编码〃脂肪酸去饱和酶〃基因的一部分的序列。如本文中所使用的,术语“植物”包括植物细胞、植物原生质体、植物胼胝体、植物 块(plant clump)和在植物或植物部分例如花粉、花、胚、种子、荚果、叶、茎等中完整的植物 细胞。术语"PB"意指蛋白质体。此类单层膜小泡能够贮藏蛋白,并且直接来源于内质 网(与下面描述的PSV相反)。术语"PSV"意指蛋白质贮藏液泡。在种子中,这些小泡通常在种子的成熟和干燥 过程中通过液泡的分隔形成。因此,通常存在于液泡中的降解蛋白质的酶也可存在于PSV 中。在正常大豆种子中,大多数积累的蛋白质位于这些细胞器中。术语“SMP “意指种子成熟蛋白。术语"贮藏蛋白"意指特异性在植物例如种子中积累的蛋白质。缩写〃 BBI"意指〃包曼-毕尔克抑制剂(bowman birk inhibitor)“,其是丝氨 酸蛋白酶抑制剂。术语〃 β CS"意指只缺乏贮藏蛋白β伴大豆球蛋白的植物。术语"SP-"意指贮藏蛋白敲低,即,缺乏大豆球蛋白和β伴大豆球蛋白的植物。术语"种子"通常包括种子本身(proper)、种皮和/或种壳或其任何部分。“种子成熟“意指始于受精且终止于种子干燥的时期,在此期间中可代谢的贮藏 物例如淀粉、糖、寡糖、酚类化合物、氨基酸和蛋白质沉积至种子的不同组织,从而导致种子 增大、种子填充(seed filling)。术语"WT"意指野生型和意指植物的天然存在的背景,或,根据使用的上下文很 明显地,WT可以指具有天然存在的遗传背景但用于本发明的基因操作的植物。术语"0RF"意指开放阅读框;即编码肽(例如,“靶蛋白质”)的序列。一般地, 该序列不被编码氨基酸序列的起始密码子与终止密码子之间的内含子中断。术语"异源多核苷酸"通常意指除了作为转化事件的结果外不同等地存在于宿 主植物中的多核苷酸。术语〃异源DNA"、‘‘异源基因〃或〃外源DNA"意指DNA,通常意 指DNA编码序列(“异源编码序列”),其已被从另一个来源(即,非植物来源或来自另一个 植物物种,或被置于通常控制另一个编码序列的植物启动子的控制之下的相同物种的编码 序列)引入植物细胞。术语"内源"基因意指通常在其基因组的天然位置上发现的天然基因,并且不是 分离的。“外源"基因意指通常不在宿主生物中发现而是通过基因转移引入的基因。术语"编码序列"或"编码区"意指编码特定蛋白质的DNA序列。在本发明的说明书中,“嵌合基因"或"表达盒"意指可操作地连接至编码期望 的基因产物的DNA序列的启动子序列和优选地转录终止序列。在优选实施方案中,嵌合基 因还包含在启动子与基因产物编码序列之间与基因产物编码序列符合翻译框地可操作地 连接的信号肽编码区。该信号序列帮助将蛋白质定位至ER。所述序列还可包含转录调控元 件,例如上述转录终止信号以及翻译调控信号例如终止密码子。“可操作地连接"意指表达盒的组分被连接以用作表达异源蛋白质的单位。例 如,可操作地连接至编码蛋白质的异源DNA的启动子促进相应于异源DNA的功能性mRNA的产生。
“ RNA转录物“意指因RNA聚合酶催化的DNA序列的转录而产生的产物。术语〃信使RNA(mRNA)“通常意指可被细胞翻译成蛋白质的RNA。术语"有义"RNA通常意指包括mRNA的RNA转录物。术语"反义RNA"意指与靶 初级转录物或mRNA的全部或一部分互补并且可抑制靶基因的表达的RNA转录物。反义RNA 的互补性可针对特定基因转录物的任何部分,即5'非编码序列、3'非编码序列、内含子或 编码序列。术语"反义抑制"意指能够阻止靶蛋白质的表达的反义RNA转录物的产生。术语〃 RNAi"或〃 RNA干扰〃通常意指通过将RNA片段引入细胞来抑制蛋白质的 表达的方法。RNA可由整合入基因组的DNA片段编码。RNAi还可通过本领域已知的任何其 他方法来制备。RNAi片段可以是任何适当的长度,可以是单链或双链。通常,“调控序列"是在内源或异源(嵌合)基因中位于蛋白质编码区的上游 (5')、内部或下游(3')的核苷酸序列。此类调控序列或“调控区”可调控转录和/或翻 译。“转录调控区"或"启动子"意指影响和/或促进转录的起始的核酸序列。启动 子通常被认为包括调控区例如增强子或诱导子元件(inducerelement)。术语"上游调控区"通常意指在蛋白质翻译起始密码子上游的区域。因此,“上游 调控区”可包括例如启动子,或其可包括启动子和5' UTR0上游调控区还可意指远在经典 启动子序列上游的区域,例如“增强子元件”。术语〃 TED"意指翻译增强子结构域。5' TED(或5‘非翻译区(UTR))通常意指编码位于翻译起始位点5‘端(上游) 的mRNA的区域。因此,所述区域在转录起始位点与翻译起始位点之间。5' TED可以是“上 游调控区”的一部分。3' TED(或3'非翻译区(UTR))通常意指mRNA上的位于蛋白质编码序列的终止 密码子的下游的区域。该区域可包含例如多腺苷酸化信号和/或能够影响mRNA加工或基 因表达的任何其他调控信号。“起始密码子"和"终止密码子"意指编码序列中分别指定蛋白质序列的起始 和链终止的3个相邻核苷酸的单位。下面利用不同的实施例,任选的技术特征和一般教导来举例说明本发明的范围。贮藏蛋白许多植物物种的种子包含贮藏蛋白。已基于其大小和可溶性对此类蛋白进行了分 类(Higgins, T. J. (1984) Ann. Rev. Plant Physiol. 35 191-221)。虽然并非每一个种类都 发现于每一个物种中,但大多数植物物种的种子包含多于1个种类的蛋白质。特定可溶性 或大小种类中的蛋白质通常在结构上与其他物种中相同种类的成员比与相同物种中不同 种类的成员更相关。在许多物种中,给定种类的种子蛋白通常由多基因家族编码,有时所述 家族是这样复杂以至其可基于序列同源性分成亚类。大豆种子具有相对高的蛋白质含量,其主要由两种贮藏蛋白(β伴大豆球蛋白和 大豆球蛋白)组成。在野生型种子中,β伴大豆球蛋白占大约15-20%的总大豆蛋白质。 这两种蛋白质都由来源于基因家族的多个同种型组成。关键贮藏蛋白(Pivotal storage protein)在本文中已被鉴定为参与植物的程序 化发育。然而,本领域技术人员现可通过功能、结构或序列同源性容易地鉴定其他靶植物中的其他贮藏蛋白。在鉴定此类贮藏蛋白后,此处描述的敲低实验可鉴定参与蛋白质重新平 衡的其他贮藏蛋白。根据本发明,调控元件(例如,启动子、TED等)可用于产生高水平的 期望的蛋白质。因此,本文中显示的许多实例现可用于对商业或人类具有潜在重要性的其 他植物。遗传缺陷本发明的植物包含缺陷例如遗传缺陷,从而导致显著部分的植物内源种子贮藏蛋 白含量的减少。例如,在各种特定的实施方案中,植物的种子可包含小于大约75%、70%或 小于大约60%或小于大约50%或小于大约40%或小于大约25%或小于15%的量的种子中 总可溶性蛋白。在其他特定实施方案中,遗传缺陷导致这样的量的特定种子贮藏蛋白,其小于通 常存在于WT大豆种子中的内源种子贮藏蛋白的量的大约1<%、大约2%、大约5(%、大约 10%,大约25 %、大约50 %、大约75 %或大约85 %。例如,本发明的植物可缺乏大豆球蛋白、伴大豆球蛋白、KTI、LE、P34、GBP和SMP或 其他种子贮藏蛋白中的1种或2种或3种或4种或更多种。在一个实施方案中,可利用方法例如共抑制、反义、RNAi或其他方法实现产生种子 贮藏蛋白的缺乏的基因操作。美国专利5,190,931描述了使用反义构建体下调基因的示例 性方法。美国专利5,231,020描述了使用有义核酸构建体下调基因的示例性方法。通过使 用双链mRNA来遗传抑制基因产物的表达公开于美国专利6,506,559中。在其他实施方案中,聚集物中特定的一种或多种种子贮藏蛋白的缺乏可通过常规 育种方法,然后就低水平的一种或多种种子蛋白进行筛选而获得。种子贮藏蛋白的缺乏还 可通过天然突变或引入的突变,然后通过鉴定具有低水平的一种或多种种子贮藏蛋白的植 物的筛选方法来获得。在另一个实施方案中,缺乏种子贮藏蛋白的植物可以例如从公共可 获得的种子库或种子储库(i^pository)获得。种子中一种蛋白质的遗传缺陷导致通过其他种子蛋白来补偿(重新平衡)如本文中所描述的,一种种子蛋白的抑制可导致通过其他种子蛋白的产量的增加 来补偿,这称为“补偿”或“重新平衡”。本文中在缺乏大豆球蛋白和β伴大豆球蛋白的植 物品系("SP-";实施例1)中和在只缺乏β伴大豆球蛋白的植物(实施例11)中显示了 该重新平衡。由序列介导的基因沉默导致的种子蛋白β伴大豆球蛋白的抑制通过大豆球蛋白 的增加的丰度来补偿(实施例11)。也如实施例11中所述,β伴大豆球蛋白α/α ‘抑制 还可使用RNAi技术来实现。该方法导致a/a' β伴大豆球蛋白的完全沉默。部分增加产 生的大豆球蛋白以其前体前大豆球蛋白的形式保持并且被扣留在PB中。蛋白质在蛋白质 体而非PSV中的积累显示2个重要的点1)ER衍生的PB可在大豆种子中被诱导,并积累蛋 白质以及,2)内源贮藏蛋白的抑制导致增加的另一种贮藏蛋白的积累以补偿质量损失。该 现象维持大豆种子的总蛋白质含量至_40%,并且被称为‘重新平衡’。如实施例1中所示,制备缺乏β伴大豆球蛋白和大豆球蛋白的植物品系 (“SP-")。在β伴大豆球蛋白和大豆球蛋白中都具有遗传缺陷的这类种子中,蛋白质的 损失由其他蛋白质的产生来补偿。蛋白质产量的变化可见于图4,该图是WT(" Jack")的 种子蛋白质提取物与SP-品系的种子蛋白质提取物相比较的IEF-PAGE。图5显示两个品系之间的转录组的差异。图6是显示存在于WT(" Jack")对SP-品系的大豆种子中的几种 主要贮藏蛋白的百分比的饼图。SP-种系中种子蛋白β伴大豆球蛋白和大豆球蛋白的除去 明确地导致由其他蛋白质来补偿。重新平衡现象可用于在种子中产生大量外源蛋白质本文中提供的是具有内在生物学(intrinsic biology)的种子,其通过使外源蛋 白质参与重新平衡过程和通过将外源蛋白质积累在稳定的PB群体中而可被开发为蛋白质 生产平台的基础。总之,这是将双子叶植物种子开发为蛋白质生产平台的基础。因此,在一些实施方案中,如上所述减少一种(或多种)种子贮藏蛋白,并且在种 子中产生期望的异源蛋白质。在一个实施方案中,将任何适当的启动子可操作地连接至编 码异源蛋白的序列。在另一个实施方案中,编码异源蛋白的序列是种子特异性启动子。启 动子可以例如选自大豆球蛋白、伴大豆球蛋白、KTI、LE、P34、GBP或SMP的启动子。在优选实施方案中,当异源蛋白的基因序列可操作地连接至编码蛋白质(其在大 豆种子中响应上述遗传缺陷而被上调)的基因的启动子时,可发生增加的异源蛋白质表 达。对于从种子中除去的每一种特定蛋白质,另一种(或多种)蛋白质可代替其产生。通 过使用该“补偿”蛋白质的基因调控区(例如启动子、终止子和任选地其他区域)来驱动目 的异源基因的表达,可在种子中获得甚至更高水平的蛋白质产量。因此,在一个实施方案中,被抑制的种子蛋白质是β伴大豆球蛋白,同时异源蛋 白质的表达受到大豆球蛋白的调控区的至少一部分控制。在一个实施方案中,该调控区在 异源序列的上游。在另一个实施方案中,调控区在异源序列的下游或3'端。在一个实施 方案中,调控区包含大豆球蛋白启动子。在一个实施方案中,调控区是大豆球蛋白上游调控 区,其可包括例如启动子和/或5' UTR0在另一个实施方案中,大豆球蛋白调控区还包括 大豆球蛋白3'调控区。在另一个实施方案中,被抑制的种子蛋白质是β伴大豆球蛋白和大豆球蛋白两 者,同时异源蛋白质受到来自KTI、LE、P34、GBP或SMP之一的调控区的至少一部分(5'、 3'或两者)控制。通过构建具有报告蛋白GFP的转基因(其侧翼于ER转运信号序列和滞留信号序 列(KDEL),处于大豆球蛋白元件的调控下)来测试蛋白质重新平衡和蛋白质在PB中的扣留 的概念框架(实施例9)。通过将GFP-kdel构建体置于大豆球蛋白基因元件之下,GFP-kdel 转录物的表达将模拟大豆球蛋白基因转录物的表达和调控,从而可能参与牵涉大豆球蛋白 基因的上调的营养分配。表达该转基因的大豆在种子中积累了 1.6%的GFP-kdel。然而, 当将GFP-kdel植物在遗传上与β CS植物杂交时,GFP-kdel表达的水平在种子中增加几乎 4倍,达到大约7% (实施例12)。因此,β CS种子中GFP-kdel积累的增加显示,模拟参与 蛋白质重新平衡的基因的等位基因可导致目的异源蛋白的积累的大量增加。因此,在实施方案中,可在种子中产生大量目的蛋白质。例如,异源蛋白质的表 达在种子中可达到大约 1%、2%、5%、7%、10%、12%、15%、18%、20%、25%、30%、35%、 40%、45%、50%、55%、60%、70%或更多的总可溶性蛋白质。此外,在一个实施方案中,表达的异源蛋白质的干重可达到,大约0. 5 %、1 %、2 %、 4%、5%、7%、10%、12%、15%、18%、20%、25%、30%、35%、40%、45%、50% 或更多的种 子总干重。可以例如以大约50、100、150、200、250或更多毫克蛋白质/种子的量产生异源蛋白质。在一个实施方案中,可基于每颗植物测量产生的异源蛋白的量。可以例如以大约 3g、6g、8g、10g、15g或20g或更多的异源蛋白质/植物的量产生异源蛋白质。可以例如以每季每英亩大约25、50、100、200、300、400、500、600、700、850、1,000、 1,500、2,000或更多磅的量产生异源蛋白质。实际产量可取决于许多参数例如每英亩植物、 植物品种、土壤质量、栽培措施、植物胁迫以及待产生的异源蛋白质的纯度水平。启动子在一个实施方案中,本文中提供的异源多核苷酸包括获自或源自植物贮藏蛋白基 因的启动子。在多种实施方案中,启动子源自与用本发明的构建体转化的植物相同目、科、 属或种的植物。可使用任何适当的启动子。在一个实施方案中,启动子是种子特异性启动子。在 另一个实施方案中,启动子是早期种子特异性启动子。在另一个实施方案中,启动子是晚期 种子特异性启动子。在另一个实施方案中,启动子来自补偿种子蛋白遗传缺陷的基因。启动子序列可终止于起始密码子或其附近并且包括上游(5')的连续核苷酸。启 动子序列可以是至少大约500个核苷酸或至少大约1000个核苷酸或至少大约1500个核苷 酸。虽然确切长度对于本发明不是至关重要的,但本领域技术人员可容易地确定和优化启 动子长度(例如,通过测量和比较转录水平)。在一个实施方案中,上游调控序列或启动子序列可与SEQ ID NO=USEQ ID NO :2、 SEQ ID NO :3、SEQ ID NO :4、SEQ ID NO :5、SEQ IDNO :6、SEQ ID NO 7 或 SEQ ID NO 8 之 一的至少部分具有至少80%、85%、90%、95%、97%、99. 5%或更高的核酸同一性。在具体的实施方案中,如下所述包含启动子和5' UTR的上游调控区选自SEQ ID N0:1、SEQ ID N0:2、SEQ ID N0:3、SEQ ID N0:4、SEQ ID N0:5、SEQ ID N0:6、SEQ ID NO: 7。SEQ ID NO :1和2来源于大豆球蛋白,而SEQ ID NO :3_8分别代表伴大豆球蛋白、KTI、 LE、P34、GBP和SMP的上游调控区。UTR翻译增强子结构域本发明的异源多核苷酸任选地包含来自植物贮藏蛋白的翻译增强子结构域 (TED)。在一些实施方案中,这是mRNA转录物的非翻译区。此类非翻译区可以在基因的 5'(上游)或3'(下游)端。TED或UTR的序列还可来源于另一种生物或可以是完全合 成的序列。5' UTR(或“5' TED”)本发明的构建体可包含来自编码植物贮藏蛋白例如大豆 球蛋白、伴大豆球蛋白、KTI、LE、P;34、GBP或SMP的mRNA的5'区的5' TED。5' TED通常 可在植物贮藏蛋白的启动子与起始密码子之间被鉴定。5' TED可以是至少大约5、10、25、 30,35,40或更多个核苷酸或至少大约50个核苷酸、或至少大约100个核苷酸、或至少大约 150个核苷酸。虽然确切长度对于本发明不是至关重要的,但本领域技术人员可容易地确定 和优化终止子长度(例如,通过测量和比较翻译水平)。在具体的实施方案中,公开于SEQ ID NO :1(大豆球蛋白)、SEQ ID NO :2 (可选择的大豆球蛋白序列)、SEQ ID N0:3(伴大豆 球蛋白)、SEQ ID NO 4 (KTI)、SEQ ID NO 5 (LE)、SEQ ID NO :6(P34)、SEQ ID NO 7 (GBP) 和SEQ ID NO=S(SMP)中的上游调控序列的3'末端的部分分别包含5' UTR序列。3' UTR(或〃 3' TED〃或〃终止子〃)TED可源于例如编码植物贮藏蛋白例如大豆球蛋白、伴大豆球蛋白、01、1^、?;34、68 或5]\^的1111 離的3'区。这样的3' TED可 始于终止密码子或其附近并且包括下游(3‘)的连续核苷酸。3' TED可以是至少大约10、 25、40、50、75、100、150个核苷酸或至少大约250个核苷酸或至少大约500个核苷酸。虽然 确切长度对于本发明不是至关重要的,但本领域技术人员可容易地确定和优化终止子长度 (例如,通过测量和比较翻译水平)。在一个实施方案中,终止子序列选自SEQ ID NO :13、SEQ ID NO :14、SEQ ID NO 15、SEQ ID NO: 16、SEQ ID NO: 17、SEQ ID NO: 18、SEQID NO: 19、SEQ ID NO :20 禾口 SEQ ID N0:21。这些序列分别代表大豆球蛋白、可选择的大豆球蛋白终止子序列、β伴大豆球蛋 白、可选择的β伴大豆球蛋白终止子序列、KTI、LE、P 34、GBP和SMP的3' TED序列。在一个实施方案中,终止子序列可以与SEQ ID NO 13-21之一具有至少80 %、 85%,90%,95%,97%,99. 5%或更高的核酸同一性。在另外的实施方案中,嵌合构建体还可包含远在目的基因的上游或下游的基因调 控序列例如增强子序列。例如,转录“增强子”区域可远在目的基因的上游或下游。例如, 增强子区域可距序列的5'(上游)末端1,000-2, 000个核苷酸或甚至1个或更多个1Λ, 或也可存在于基因的转录区的下游1,000-2,000个核苷酸或甚至1个或更多个1Λ的位置。 因此,在一些实施方案中,植物贮藏蛋白例如大豆球蛋白、伴大豆球蛋白、KTI、LE、P34、GBP 和SMP的此类更远的增强子序列也存在于嵌合序列中。在某些实施方案中,此类增强子序 列的存在增加在种子中产生的异源蛋白质的量。内质网植物的内质网(ER)是内膜系统(真核生物中高度保守的系统)的一部分。将蛋 白质靶向ER是非常有益的,因为ER中产生的蛋白质被运输至其他细胞器并且也与ER本身 保持结合。ER衍生的区室具有不同的功能,例如贮藏蛋白、油以及用于响应病原体攻击的水 解酶。贮藏蛋白运输至ER的机制的日益增加的知识已导致植物用作蛋白质生物工厂的用 途的改进。除了其他内膜区室外,植物还可在ER中贮藏外源蛋白质。ER衍生的小泡-蛋白质体对蛋白质贮藏液泡图1显示导致蛋白质在大豆种子的蛋白质体或蛋白质贮藏液泡中的定位的不 同亚细胞蛋白质运输途径的示意图。在许多植物物种中,但非大豆中,ER衍生的PB允 许非糖基化蛋白质的稳定积累,因为所述蛋白质不遵循从ER至高尔基体,然后至前液泡 (prevacuole)的典型内膜途径。相比之下,在WT大豆植物中,大多数种子蛋白在蛋白质贮藏液泡(PSV)中积累。然 而,被靶向大豆种子的蛋白质贮藏液泡(PSV)或前液泡(其然后靶向PSV)的蛋白质很可能 被快速降解,因为液泡通常包含许多裂解酶。相反地,如本文中关于转基因大豆种子所公开的,使用C末端ER靶向序列(KDEL) 的蛋白质的ER滞留时间诱导大量外源蛋白质运输至从头产生的PB。因此,可将蛋白质扣 留在大豆种子的ER衍生的PB中。所获得的蛋白质体是保持通过种子成熟并且保留在干燥 成熟种子中的稳定的细胞器群体。在本文中这一点可利用27kDa报告蛋白绿色荧光蛋白 (GFP-kdel)来证明,如实施例9中显示的。在本发明的任选实施方案中,异源序列还包含诱导异源多肽在ER或ER衍生的小 泡的腔中积累的ER滞留序列。此类ER或ER衍生的小泡包括ER、PB、PSV、转运小泡等。此类小泡在结构上可被鉴定为包含膜(例如脂双层膜)、腔,其中靶蛋白是至少部分存在于腔 中的可溶性或不溶性成分。不期望受理论束缚,据信目的蛋白质的ER或ER衍生的小泡定 位是在根据本发明的植物中产生的高水平的异源蛋白质的部分原因。在一个实施方案中, 异源多肽在高尔基体或高尔基小泡中积累。ER信号序列在一些实施方案中,异源多核苷酸包含ER信号序列。ER信号序列是编码允许蛋白 质被内质网上的信号识别颗粒识别(从而导致蛋白质转位至ER腔内)的氨基酸序列的任 何多核苷酸序列。该序列通常存在于蛋白质的N末端区域。在一些实施方案中,可向天然不具有ER靶向序列的蛋白质添加ER信号序列。然 而,异源蛋白质可能已具有ER信号序列。需要时,该信号序列可用另一种ER信号序列例 如下面表1中所示的那些替代。可选择地,可使用蛋白质的原始信号序列。还可使用完 全合成的信号序列。指导新合成的蛋白质至植物细胞的内质网的信号序列的实例包括来 自大麦凝集素(Dombrowski等人,1993,Plant Cell 5 :587-596)、大麦液泡巯基蛋白酶 (aleurain) (Holwerda 等)κ, 1992, Plant Cell 4 :307-318) >W sporamin(Matsuoka 等 K, 1991, Proc. Natl. Acad. SciUSA 88 :834-838) > patatin (Sonnewald 等 K, 1991, Plant J. 1 :95-106)、大豆营养 C藏蛋白(Mason 等人,1988,Plant Mol. Biol. 11 :845-856)和 β -果糖苷酶(Faye 等人· 1989,Plant Physiol. 89 :845-851)的序列。虽然本领域技术人员可容易地确定有用的ER信号序列,但其他实例示于表1 :表 权利要求
1.一种转基因双子叶植物,其包含a.一种或多种种子贮藏蛋白的缺乏,其中所述缺乏导致内源种子贮藏蛋白相对于野生 型植物的所述贮藏蛋白减少至少50% ;和b.异源多核苷酸,其包含种子贮藏蛋白启动子、开放阅读框,所述开放阅读框包含ER 信号序列、期望的蛋白质编码序列和ER滞留信号;其中所述开放阅读框可操作地连接至所 述种子贮藏蛋白启动子;和其中所述转基因植物的种子能够以大于5%的种子总干重的水平产生异源蛋白质。
2.权利要求1的双子叶植物,其中所述异源多核苷酸还包含5'翻译增强子结构域和 /或3'翻译增强子结构域。
3.权利要求1的双子叶植物,其中所述ER滞留序列诱导异源蛋白质在ER或ER衍生的 小泡的腔中积累。
4.权利要求1的双子叶植物,其中所述双子叶植物是豆科,和任选地豆目,和任选地大 豆属(soya genus)的成员。
5.权利要求4的双子叶植物,其中所述双子叶植物是大豆属(Glycinegenus)的成员。
6.权利要求5的双子叶植物,其中所述双子叶植物是大豆。
7.权利要求1的双子叶植物,其中所述启动子源自Kimitz胰蛋白酶抑制剂、大豆凝集 素、免疫显性大豆变应原P34或Gly m Bd 30k、葡萄糖结合蛋白、种子成熟蛋白、大豆球蛋白 或伴大豆球蛋白。
8.权利要求2的双子叶植物,其中所述翻译增强子结构域源自Kimitz胰蛋白酶抑制 剂、大豆凝集素、免疫显性大豆变应原PM或Gly mBd 30k、葡萄糖结合蛋白、种子成熟蛋 白、大豆球蛋白或伴大豆球蛋白。
9.权利要求1的双子叶植物,其中缺乏的贮藏蛋白是Kimitz胰蛋白酶抑制剂、大豆凝 集素、免疫显性大豆变应原P34或Gly m Bd 30k、葡萄糖结合蛋白、种子成熟蛋白、大豆球蛋 白或伴大豆球蛋白中的一种或多种。
10.权利要求9的双子叶植物,其中所述双子叶植物种子具有种子内源贮藏蛋白的多 于75%的缺乏。
11.权利要求1的双子叶植物,其还包含5'翻译增强子结构域和3'翻译增强子结构 域,并且其中所述启动子以及所述3'和5'翻译增强子结构域源自相同的贮藏蛋白。
12.权利要求1的双子叶植物,其中所述异源蛋白质在双子叶植物的种子中积累至大 于大约2%或大于大约4%或大于大约5%的种子总干重的水平。
13.权利要求1的双子叶植物的种子。
14.获自权利要求13的种子的转基因蛋白质。
15.权利要求14的转基因蛋白质,其中所述异源蛋白质已被纯化。
16.权利要求1的双子叶植物,其中靶蛋白编码序列编码酶或其片段。
17.权利要求16的双子叶植物,其中所述酶是纤维素分解酶。
18.权利要求17的双子叶植物,其中所述纤维素分解酶源自真菌来源、细菌来源、动物 来源或植物来源。
19.权利要求17的双子叶植物,其中所述纤维素分解酶是β-葡糖苷酶、外切葡聚糖酶 1、外切葡聚糖酶II、内切葡聚糖酶、木聚糖酶、半纤维素酶、木质酶、木质素过氧化物酶或锰过氧化物酶。
20.包含权利要求14的蛋白质的产物。
21.包含权利要求14的蛋白质的商业上有用的酶组合物。
22.权利要求1的双子叶植物,其中所述一种或多种种子贮藏蛋白的缺乏由编码种子 贮藏蛋白的核酸的RNAi、反义或有义片段的存在而引起。
23.一种转基因双子叶植物,其包含a.一种或多种内源植物贮藏蛋白的缺乏,其中所述缺乏导致所述内源植物贮藏蛋白相 对于野生型植物减少至少50% ;和b.异源多核苷酸,其包含可操作地连接至开放阅读框的补偿蛋白的基因调控区,所述 开放阅读框编码包含ER信号序列、期望的蛋白质编码序列和ER滞留信号的序列;其中所述转基因双子叶植物的种子能够以大于5%的种子总干重的水平产生异源蛋白质。
24.在使用前稳定地贮存酶的方法,其通过将所述酶贮存在来自转基因双子叶植物的 种子中,所述转基因双子叶植物包括a.一种或多种植物贮藏蛋白的缺乏,其中所述缺乏导致内源种子蛋白减少至少50% ;和b.异源多核苷酸,其包含种子贮藏蛋白启动子、开放阅读框,所述开放阅读框包含编码 ER信号序列、目的酶和ER滞留信号的核酸;其中所述开放阅读框可操作地连接至种子贮藏 蛋白启动子;和其中所述转基因植物的种子能够以大于5%的种子总干重的水平产生所述酶;和 将所述酶贮存在所述转基因双子叶植物的种子中。
25.在双子叶植物中产生增加量的异源蛋白质的方法,其包括a.用多核苷酸稳定地转化植物细胞,所述多核苷酸包含种子贮藏蛋白启动子、开放阅 读框,所述开放阅读框包含ER信号序列、期望的蛋白质编码序列和ER滞留信号;其中所述 开放阅读框可操作地连接至种子贮藏蛋白启动子;b.从所述稳定转化的植物细胞获得纯合植物品系;c.将所述稳定转化的植物品系种质渗入至缺乏内源种子贮藏蛋白的植物,其中所述缺 乏导致所述内源种子贮藏蛋白相对于野生型植物的所述贮藏蛋白减少至少50% ;d.培养所述种质渗入的转基因植物的种子;和e.从所述种质渗入的转基因植物的种子获得异源蛋白质,其中所述种质渗入的转基因植物的种子能够以大于5%的种子总干重的水平产生异源 蛋白质。
26.权利要求25的方法,其中所述内源种子贮藏蛋白的缺乏因编码种子贮藏蛋白的核 酸的RNAi、反义或有义片段的存在而引起。
27.在双子叶植物中产生增加量的异源蛋白质的方法,其包括a.用多核苷酸稳定地转化植物细胞,所述多核苷酸包含种子贮藏蛋白启动子、开放阅 读框,所述开放阅读框包含ER信号序列、期望的蛋白质编码序列和ER滞留信号;其中所述 开放阅读框可操作地连接至种子贮藏蛋白启动子;其中所述多核苷酸还包含能够下调内源 种子贮藏蛋白的RNAi序列;b.从所述稳定转化的植物细胞获得纯合植物品系; C.培养所述纯合植物品系的种子;和 d.从所述纯合植物的种子获得异源蛋白质。
全文摘要
缺乏一种或多种植物种子贮藏蛋白的转基因双子叶植物,其还包含转基因多核苷酸构建体,所述构建体包含可操作地连接至贮藏蛋白启动子和ER信号序列的开放阅读框。多核苷酸构建体编码可以以高水平在种子中积累的蛋白质产物。还提供了在植物种子中产生异源蛋白质的方法。
文档编号C12N15/11GK102137932SQ200980133087
公开日2011年7月27日 申请日期2009年6月29日 优先权日2008年6月28日
发明者E·M·赫曼, M·A·施密特 申请人:(由农业部部长代表的)美利坚合众国, 唐纳德丹福斯种植科学中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1