植物调控元件及其用途

文档序号:510511阅读:506来源:国知局
植物调控元件及其用途
【专利摘要】本发明提供了可用于调节植物和植物细胞中的基因表达的新的DNA分子和构建体,包括它们的核苷酸序列。本发明还提供了包含可操作地与异源可转录多核苷酸连接的DNA分子的转基因植物、植物细胞、植物部分、种子和商品,以及它们的使用方法。
【专利说明】植物调控元件及其用途
[0001]相关申请参考
[0002]本申请要求2011年3月25日提交的美国临时申请N0.61/467,875的权益,通过引用将其全部并入本文中作为参考。
[0003]序列表的引入
[0004]通过电子提交在此一起提交了序列表,其包含在2012年3月21日生成的347kb (如在 Microsoft Windows? 中测量的)的文件名为 “M0NS282W0_seq.txt” 的文件中,并通过引用将其并入本文中。
发明领域
[0005]本发明涉及植物分子生物学和植物遗传工程的领域,并且涉及可用于调节植物中的基因表达的DNA分子。
【背景技术】
[0006]调控元件是通过调节可操作地连接的可转录多核苷酸分子的转录来调控基因活性的遗传元件。这样的元件包括启动子、前导序列、内含子和3’非翻译区域,并且可用于植物分子生物学和植物遗传工程领域中。
[0007]发明概述
[0008]本发明提供了用于植物中的新基因调控元件。本发明还提供了包含所述调控元件的DNA构建体。本发明还提供了包含所述调控元件的转基因植物细胞、植物和种子。可以提供可操作地与可转录多核苷酸分子连接的序列。在一个实施方案中,可转录多核苷酸分子相对于本文中提供的调控序列可以是异源的。因此,在特定的实施方案中,本发明提供的调控元件序列可以限定为可操作地与异源可转录多核苷酸分子连接。本发明还提供了制备和使用该调控元件、包含该调控元件的DNA构建体以及包含可操作地与可转录多核苷酸分子连接的调控元件的转基因植物细胞、植物和种子的方法。
[0009]因此,在一个方面中,本发明提供了一种包含DNA序列的DNA分子,所述DNA序列选自:a)与SEQ ID NO:1-158和180-183中任一个具有至少约85%序列同一性的序列;b)包含 SEQ ID NO:1-158 和 180-183 中任一个的序列;和 c) SEQ ID NO:1-158 和 180-183 中任一个的片段,其中该片段具有基因调控活性;其中该序列可操作地与异源可转录多核苷酸分子连接。在特定的实施方案中,DNA分子包括与SEQ ID NO:1-158和180-183中任一个的DNA序列至少约90%、至少约95%、至少约98%或至少约99%的同一性。在DNA分子的某些实施方案中,所述DNA序列包括调控元件。在一些实施方案中,所述调控元件包含启动子。在特定的实施方案中,所述异源可转录多核苷酸分子包含具有农艺学意义的基因,如能够在植物中提供除草剂抗性的基因, 或能够在植物中提供植物抗虫性的基因。
[0010]本发明还提供了包含本发明提供的异源DNA构建体的转基因植物细胞,所述DNA构建体包括SEQ ID NO:1-158和180-183中任一个的序列或其片段或变体,其中所述序列可操作地与异源可转录多核苷酸分子连接。在某些实施方案中,转基因植物细胞是单子叶植物细胞。在其他实施方案中,转基因植物细胞是双子叶植物细胞。
[0011]本发明进一步提供了包含本文中提供的DNA分子的转基因植物或其部分,所述DNA分子包括选自以下的DNA序列:a)与SEQ ID NO: 1-158和180-183中任一个具有至少85%序列同一性的序列;b)包含SEQ ID NO:1-158和180-183中任一个的序列;和c) SEQID NO:1-158和180-183中任一个的片段,其中该片段具有基因调控活性;其中所述序列可操作地与异源可转录多核苷酸分子连接。在特定的实施方案中,转基因植物可以是,相对于包含所述DNA分子的起始转基因植物,包含所述DNA分子的任一代的后代植物。再进一步提供了包含根据本发明的DNA分子的转基因种子。
[0012]在另一个方面中,本发明提供了生产商品的方法,其包括获得根据本发明的转基因植物或其部分并从其生产商品。在一个实施方案中,本发明的商品是蛋白质浓缩物、蛋白质分离物、籽粒、淀粉、种子、粗粉(meal)、面粉(flour)、生物质或种子油。在另一个方面中,本发明提供了使用上述方法生产的商品。例如,在一个实施方案中,本发明提供了包含本文中提供的DNA分子的商品,所述DNA分子包括选自以下的DNA序列:a)与SEQ ID NO:1-158和180-183中任一个具有至少85%序列同一性的序列;b)包含SEQ ID NO:1-158和180-183中任一个的序列;和c) SEQ ID NO: 1-158和180-183中任一个的片段,其中该片段具有基因调控活性;其中所述序列可操作地与异源可转录多核苷酸分子连接。
[0013]还是在另一个方面中,本发明提供了一种表达可转录多核苷酸分子的方法,其包括获得根据本发明的转基因植物,如包含本文中所述的DNA分子的植物,并且栽培植物,其中DNA分子中的可转录多核苷酸被表达。
[0014]在整个说明书和权利要求中,除非上下文另外要求,词语“包含(comprise)”及其变变型,如“包括(comprises) ”和“包含着(comprising) ”,将理解为意味着包括所陈述的组合物、步骤和/或值,或其组,但并不排除任何其他组合物、步骤和/或值,或其组。
[0015]附图简述
[0016]图1a-1h描绘了对应于分离自草类物种须芒草(Andropogon gerardii)的启动子元件的启动子大小变异体的比对。特别地,图1a-1h显示了在转录调控表达元件组EXP-ANDge.Ubpl:1:9(SEQ ID NO:1)中发现的 2603bp 启动子序列 P-ANDge.Ubpl-1:1:
11(SEQ ID NO:2)与通过P-ANDge.Ubpl-1:1:11的删除分析得到的启动子序列的比对。例如,P-ANDge.Ubpl-1:1:11 的 5,端删除产生了启动子 P-ANDge.Ubpl-1:1:9(SEQ ID NO:6),其是在EXP-ANDge.Ubpl:1:7 (SEQ ID NO:5)内发现的2114bp序列。图1中的其他启动子序列包括 P-ANDge.Ubpl-1:1: 10 (SEQ ID NO:9),包含在 EXP-ANDge.Ubpl:1:8 (SEQID NO:8)内的 1644bp 序列;P_ANDge.Ubpl-1:1: 12 (SEQ ID NO:11),包含在 EXP-ANDge.Ubpl: I:10 (SEQ ID NO:10)内的 1472bp 序列;P-ANDge.Ubpl-1:1:8 (SEQ ID N0:13),包含在 EXP-ANDge.Ubpl:1:6(SEQ ID NO:12)内的 1114bp 序列;P-ANDge.Ubpl-1:1: 13 (SEQID NO:15),包含在 EXP-ANDge.Ubpl:1: 11 (SEQ ID NO:14)内的 771bp 序列;和 P-ANDge.Ubpl-1:1:14(SEQ ID NO: 17),包含在 EXP-ANDge.Ubpl:1: 12 (SEQ ID NO:16)内的 482bp序列。
[0017]图2a_2g 描绘了分离自草类沙生鹿茅(Saccharum ravennae (Erianthusravennae))的启动子变体的比对。特别地,图2a_2g显示了 2536bp启动子序列P-ERIra.Ubql-1:1: 10 (SEQ ID NO:19)(例如,在转录调控表达元件组 EXP-ERIra.Ubql (SEQ ID NO:18)中发现的)与源自P-ERIra.Ubql-1:1:10的删除分析的启动子序列的比对:2014bp启动子序列 P-ERIra.Ubql-1:1:9(SEQ ID NO:23) ;1525bp 启动子序列 P-ERIra.Ubql-1:1:
11(SEQ ID NO:26) ; 1044bp 启动子序列 P-ERIra.Ubql-1:1:8 (SEQ ID NO:28) ;769bp 序列P-ERIra.Ubql-1:1: 12 (SEQ ID NO:30)和 51 Ibp 序列 P-ERIra.Ubql-1:1: 13 (SEQ ID NO:32)。
[0018] 图3a_3c描绘了对应于分离自草类物种狗尾草(Setaria viridis)的启动子元件的启动子大小变体的比对。特别地,图3a_3c显示了 1493bp启动子序列P_Sv.Ubql-1:1:I (SEQ ID NO:34)与源自P_Sv.Ubql-1:1:1的5’端的删除分析的启动子的比对:1035bp大小的启动子P-Sv.Ubql-1:1:2(SEQ ID NO:38)和 681bp 启动子序列 P_Sv.Ubql-1:1:3 (SEQID NO:40)。
[0019]图4a_4e描绘了源自草类墨西哥玉米(Zea mays subsp.mexicana)的转录调控表达元件组变体的比对。特别地,图4a-4e比较了称为EXP-Zm.UbqMl:1:2 (SEQ ID NO:49)的2005bp转录调控表达元件组与等位基因变体EXP-Zm.UbqMl:1:5(SEQ ID NO:53),以及与大小变体 EXP-Zm.UbqMl:1:1 (SEQ ID NO:41)(其是 1922bp 长)和 EXP-Zm.UbqMl:1:4 (SEQID NO:45)(其是 1971bp 长)。
[0020]图5a_5b描绘了分离自草类高粱(Sorghum bicolor)的启动子大小变体的比对。特别地,图5a_5b显示了包含在转录调控表达元件组EXP-Sb.Ubq6 (SEQ ID NO:59)内的791bp 大小的启动子元件 P-Sb.Ubq6-l:1:2 (SEQ ID NO:60)与包含在 EXP-Sb.UbqM6:1:I (SEQ ID NO:63)内的 855bp 启动子元件 P_Sb.Ubq6_l:1:1 (SEQ ID NO:64)的比对。
[0021]图6a_6c描绘了对应于分离自草类小米(Setaria italica)的启动子元件的启动子大小变体的比对。特别地,图6a_6c显示了 1492bp启动子变体P-SETit.Ubql-1:1:1(SEQID NO:70)与 1492bp 启动子变体 P-SETit.Ubql-1:1:4 (SEQ ID NO:74)、1034bp 启动子元件 P-SETit.Ubql-1:1:2 (SEQ ID NO:76)和 680bp 启动子元件 P-SETit.Ubql-1:1:3 (SEQID NO:78)的比对。
[0022]图7a_7b描绘了启动子大小变体和对应于分离自草类物种薏苡(Coixlachryma-jobi)的启动子元件的增强子元件的比对。特别地,图7a和7b显示了在转录调控表达元件组 EXP-Cl.Ubql:1:1(SEQ ID NO:79)内发现的 837bp 启动子变体 P-Cl.Ubql-1:1: I (SEQ ID NO:80)与 798bp 长的源自 P_C1.Ubql-1:1:1 的增强子片段(称为 E_C1.Ubql:I:1) ( SEQ ID NO:89)以及与P_C1.Ubql-1:1:1的三个5’端删除变体的比对,所述三个5’端删除变体为:742bp 元件P-Cl.Ubql-1:1:4(SEQ ID NO:84) ;401bp 元件P_C1.Ubql-1:
I:3 (SEQ ID NO:86)和 54bp 最小启动子元件 P_C1.Ubql-1:1:5 (SEQ ID NO:88)。
[0023]图8描绘了本发明的转基因盒构造。
[0024]序列简述
[0025]SEQ ID NO:1、5、8、10、12、14、16、18、22、25、27、29、31、33、37、39、41、45、49、53、
55、59、63、65、69、73、75、77、79、83、85、87、90、93、95、97、98、99、100、102、104、106、108、110、112、114、115、116、117、119、121、123、124、125、126、128、130、132、133、134、136、137、139、141、143、145、147、149、151、153、155、157、180、181 和 183 是转录调控表达元件组的序
列或包含可操作地5’连接于前导序列的启动子序列的EXP序列,所述前导序列可操作地5’连接于内含子序列。[0026]SEQ ID NO:2、6、9、11、13、15、17、19、23、26、28、30、32、34、38、40、42、46、50、56、
60、64、66、70、74、76、78、80、84、86、88、91、96 和 135 是启动子序列。
[0027]SEQ ID NO:3、20、35、43、47、51、57、61、67、71 和 81 是前导序列。
[0028]SEQ ID NO:4、7、21、24、36、44、48、52、54、58、62、68、72、82、92、94、101、103、105、107、109、111、113、118、120、122、127、129、131、138、140、142、144、146、148、150、152、154、156、158和182是内含子序列。
[0029]SEQ ID NO:89是增强子的序列。
[0030]发明详述
[0031]本文所公开的本发明提供了来自植物物种的具有有益基因调控活性的多核苷酸分子。本发明提供了这些多核苷酸分子的设计、构建和用途。在SEQ ID NO:1-158和180-183中提供了这些多核苷酸分子的核苷酸序列。这些多核苷酸分子例如能够影响植物组织中可操作连接的可转录多核苷酸分子的表达,并且因此选择性地调节转基因植物中的基因表达或所编码的基因产物的活性。本发明还提供了修饰、产生和使用这些多核苷酸分子的方法。本发明还提供了含有该启动子和/或其他公开的核苷酸序列的组合物、转化的宿主细胞、转基因植物和种子,以及用于制备和使用这些的方法。
[0032]提供了以下的定义和方法来更好地限定本发明以及在本发明的实施中指导本领域普通技术人员。除非另外指出,术语根据相关领域的普通技术人员的常规使用方式来理解。
[0033]DNA 分子
[0034]如本文中所用的,术语“DNA”或“DNA分子”指的是基因组或合成来源的双链DNA分子,即,脱氧核糖核苷酸碱基的聚合物或多核苷酸分子,从5’ (上游)端至3’ (下游)端阅读。如本文中所用的,术语“DNA序列“指的是DNA分子的核苷酸序列。本文中所用的命名法对应于 United States Code of Federal Regulations § 1.882 的标题 37,并且列于WIPO Standard ST.25(1998),附录2、表1和3的表格中的命名。
[0035]如本文中所用的,术语“分离的DNA分子”指的是至少部分地与在天然或自然状态中通常与其相关联的其他分子分离的DNA分子。在一个实施方案中,术语“分离的”指的是至少部分地与在其天然或自然状态中通常侧邻所述DNA分子的一些核酸分离的DNA分子。因此,例如,作为重组技术的结果而与通常不相关的调控或编码序列融合的DNA分子在本文中被认为是分离的。当整合至宿主细胞的染色体中或存在于含有其他DNA分子的核酸溶液中时,认为这样的分子是分离的,因为它们未处于其自然状态中。
[0036]本领域技术人员公知的多种方法可以用来分离和操纵本发明中公开的DNA分子或其片段。例如,PCR(聚合酶链式反应)技术可以用于扩增特定的起始DNA分子和/或用于产生原始分子的变体。DNA分子或其片段也可以通过其他技术获得,如通过化学方法直接合成该片段,如通常通过使用自动化寡核苷酸合成仪来实施的。
[0037]如本文中所用 的,术语“序列同一性”指的是两个最佳比对的多核苷酸序列或两个最佳比对的多肽序列相同的程度。通过人工比对两个序列(例如,参比序列和另一序列)来形成最佳序列比对以最大化带有合适的内部核苷酸插入、删除或空隙的序列比对中核苷酸匹配的数目。如本文中所用的,术语“参比序列”指的是SEQ ID NO:1-158和180-183的多核苷酸序列所提供的序列。[0038]如本文中所用的,术语“百分序列同一性”或“百分同一性”或“ %同一性”是同一性分数乘以100。对于与参比序列最佳比对的序列,“同一性分数”是最佳比对中核苷酸匹配的数目除以参比序列中的核苷酸总数,例如,整个参比序列的全长中的核苷酸总数。因此,本发明的一个实施方案是包含与参比序列(本文中以SEQ ID NO:1-158和180-183提供)最佳比对时具有与参比序列的至少约85%同一性、至少约90%同一性、至少约95%同一性、至少约96%同一性、至少约97%同一性、至少约98%同一性或至少约99%同一性的序列的DNA分子。在特定的实施方案中,这样的序列可以定义为具有基因调控活性。
[0039]调控元件
[0040]调控元件是具有基因调控活性的DNA分子,即,具有影响可操作地连接的可转录多核苷酸分子的转录和/或翻译的能力的DNA分子。因此,术语“基因调控活性”指的是通过影响可操作地连接的可转录多核苷酸分子的转录和/或翻译来影响该可操作地连接的可转录多核苷酸分子的表达模式的能力。如本文中所用的,转录调控表达元件组或“EXP”序列可以由可操作地连接的表达元件组成,如增强子、启动子、前导序列和内含子。因此,例如,转录调控表达元件组可以由可操作5’连接于前导序列(其随后可操作地5’连接于内含子序列)的启动子组成。内含子序列可以由在天然序列的第一内含子/外显子剪接接合点开始的序列组成,并且可以进一步由小的前导序列片段组成,所述片段包含第二内含子/外显子剪接接合以便提供正确的内含子/外显子加工,以促进所得到的转录产物的转录和正确加工。前导序列和内含子可能正向地影响可操作地连接的可转录多核苷酸分子的转录以及所得到的转录的RNA的翻译。加工前的RNA分子包含前导序列和内含子,其可以影响转录的RNA的转录后加工和/或转录的RNA分子从细胞核至细胞质中的输出。在转录的RNA分子的转录后加工后,前导序列可以保留作为最终信使RNA的部分,并且可以正向地影响信使RNA分子的翻译。
[0041]调控元件,如启动子、前导序列、内含子和转录终止区(或3’UTR)是具有基因调控活性的DNA分子并且是活细`胞的基因整体表达的有机部分。术语“调控元件”指的是具有基因调控活性的DNA分子,即具有影响可操作地连接的可转录多核苷酸分子的转录和/或翻译的能力的DNA分子。因此,在植物中起作用的分离的调控序列,如启动子和前导序列,可用于通过遗传工程的方法来改变植物表型。
[0042]可以通过其表达模式效应(定性地和/或定量地),例如,正或负效应和/或组成型的或其他的效应,如,通过其时间、空间、发育、组织、环境、生理、病理、细胞周期和/或化学响应表达模式及其任意组合,以及通过定量或定性指标,来表征调控元件。启动子可用作用于调控可操作地连接的可转录多核苷酸分子的表达的调控元件。
[0043]如本文中所用的,“基因表达模式”是可操作地连接的DNA分子转录成转录的RNA分子的任何模式。转录的RNA分子可以翻译以产生蛋白质分子或可以提供反义或其他调控RNA 分子,如 dsRNA、tRNA、rRNA、miRNA 等。
[0044]如本文中所用的,术语“蛋白质表达”是转录的RNA分子翻译成蛋白质分子的任何翻译模式。蛋白质表达可以通过其时间、空间、发育或形态学性质以及通过定量或定性指标来表征。
[0045]如本文中所用的,术语“启动子”通常指的是参与RNA聚合酶II和其他蛋白质(反式作用转录因子)的识别和结合以启动转录的DNA分子。启动子最初可以从基因的基因组拷贝的5’非翻译区(5’ UTR)分离。或者,启动子可以是合成地产生或操纵的DNA分子。启动子还可以是嵌合的,即通过两个或更多个异源DNA分子的融合产生的启动子。本发明实施中有用的启动子包括SEQ ID NO:2、6、9、11、13、15、17、19、23、26、28、30、32、34、38、40、42、46、50、56、60、64、66、70、74、76、78、80、84、86、88、91、96 和 135,或其片段或变体。在本
发明的特定实施方案中,本文中描述的这些分子及其任何变体或衍生物进一步定义为包含启动子活性,即,能够在宿主细胞(如,在转基因植物中)中作为启动子发挥作用。在更进一步的特定实施方案中,可以将片段定义为呈现出其所来源的起始启动子具有的启动子活性,或片段可以包含“最小启动子”(其提供基础转录水平,并且由TATA盒或用于RNA聚合酶II复合物的识别和结合以实现转录启动的等同序列组成)。
[0046]在一个实施方案中,提供了本文中公开的启动子序列的片段。启动子片段可以包含如上所述的启动子活性,并且可以单独地使用或结合其他启动子和启动子片段一起使用,如在构建的嵌合启动子中。在特定的实施方案中,提供了包含具有本文中公开的启动子活性的多核苷酸分子的至少约50、95、150、250、500、750或至少约1000个连续核苷酸或更长的启动子片段。
[0047]可以使用本领域已知的方法来生产源自如SEQ ID NO:2、6、9、11、13、15、17、19、23、26、28、30、32、34、38、40、42、46、50、56、60、64、66、70、74、76、78、80、84、86、88、91、96 和135中呈现的任一个启动子的组合物,如内部或5’删除,以提高或改变表达,包括通过去除对表达具有正或负效应的元件;使对表达具有正或负效应的元件重复;和/或使对表达具有组织或细胞特异性效应的元件重复或去除。可以使用源自SEQ ID N0:2、6、9、ll、13、15、
17、19、23、26、28、30、32、34、38、40、42、46、50、56、60、64、66、70、74、76、78、80、84、86、88、91、96和135中呈现的任一个启动子的包含3’删除的组合物以例如制备增强子元件,其中去除了 TATA盒元件或其等同序列及下游序列。可以进行进一步的删除以除去对表达具有正或负效应、组织特异性效应、细胞特异性效应或时间特异性效应(如,但不限于,昼夜节律)的任何元件。SEQ ID NO:2、6、9、11、13、15、17、19、23、26、28、30、32、34、38、40、42、46、50、56、60、64、66、70、74、76、78、80、84、86、88、91、96 和 135 中呈现的任一启动子以及源自其的片段或增强子可以用来制备嵌合转录调控元件组合物,其由可操作地与其他增强子和启动子连接的 SEQ ID NO:2、6、9、11、13、15、17、19、23、26、28、30、32、34、38、40、42、46、50、
56、60、64、66、70、74、76、78、80、84、86、88、91、96和135中呈现的任一启动子以及源自其的片段或增强组成。可以在稳定的和瞬时的植物分析中,如本文中的工作实施例中所述的那些,经验地测试本文中所述的修饰、重复或删除对特定转基因的所需表达方面的效力,以验证结果(其可能随所进行的改变和起始分子中改变的目标而不同)。
[0048]如本文中所用的,术语“前导序列”指的是从基因的基因组拷贝的5’非翻译区(5’UTR)分离的并且通常限定为转录起始位点(TSS)和蛋白编码序列起始位点之间的核苷酸片段的DNA分子。或者,前导序列可以是合成产生或操纵的DNA元件。前导序列可以用作5’调控元件,其用于调节可操作地连接的可转录多核苷酸分子的表达。前导序列分子可以与异源启动子或与其天然启动子一起使用。因此,本发明的启动子分子可以可操作地与其天然的前导序列连接或可以可操作地与异源前导序列连接。实施本发明中有用的前导序列包括SEQ ID N0:3、20、35、43、47、51、57、61、67、71和81或者其片段或变体。在特定的实施方案中,可以提供这样的序列,其限定为能够宿主细胞中作为前导序列发挥作用,所述宿主细胞包括,例如,转基因植物细胞。在一个实施方案中,将这样的序列译解为包含前导序列活性。
[0049]作为SEQ ID NO:3、20、35、43、47、51、57、61、67、71 和 81 呈现的前导序列(5,UTR)可以由调控元件组成或可以采取对转基因的转录或翻译具有作用的二级结构。根据本发明可以使用作为SEQ ID NO:3、20、35、43、47、51、57、61、67、71和81呈现的前导序列,以形成影响转基因的转录或翻译的嵌合 调控元件。此外,作为SEQ ID NO:3、20、35、43、47、51、57、
61、67、71和81呈现的前导序列可以用于形成影响转基因的转录或翻译的嵌合前导序列。
[0050]将外源基因引入新的植物宿主中不总是导致引入基因的高表达。此外,如果是处理复杂的性状,有时需要调节几个在空间或时间上具有不同表达模式的基因。内含子可以主要地提供这样的调节。然而,已经表明相同内含子在一个植物中的多重应用呈现出缺陷。在那些情况中,需要具有用于构建合适的重组DNA元件的基础控制元件的集合。由于本领域已知的具有表达增强特性的可用内含子集合是有限的,因此需要替换方案。
[0051]源自于以SEQ ID NO:4、7、21、24、36、44、48、52、54、58、62、68、72、82、92、94、101、103、105、107、109、111、113、118、120、122、127、129、131、138、140、142、144、146、148、150、152、154、156、158和182呈现的任一个内含子的组合物由顺式调控元件的内部缺失或重复构成;和/或当可操作地与启动子+前导序列或嵌合启动子+前导序列和编码序列连接时,包含内含子/外显子剪接点的5’和3’序列的改变可以用于提高表达或表达的特异性。还可以形成包含内含子/外显子剪接点的5’和3’区的改变以降低引入假起始和终止密码子的可能,所述假起始和终止密码子是在信使RNA的加工和剪接后所得到的转录产物中产生的。可以按照工作实施例中所述的,经验地测试内含子以确定内含子对转基因表达的作用。
[0052]根据本发明,可以分析启动子或启动子片段中已知启动子元件的存在,即DNA序列特征,如TATA-盒和其他已知转录因子结合位点基序。本领域技术人员可以利用这些已知启动子元件的确认以设计具有与原始启动子相似的表达模式的启动子变体。
[0053]如本文中所用的,术语“增强子”或“增强子元件”指的是顺式作用的转录调控元件,也称为顺式-元件,其赋予可操作连接的多核苷酸序列的整体表达模式的一个方面,但通常单独不足以启动转录。与启动子不同,增强子元件通常不包括转录起始位点(TSS)或TATA盒或等同序列。启动子可以天然地包含一个或多个影响可操作地连接的多核苷酸序列的转录的增强子元件。分离的增强子元件也可以与启动子融合以产生嵌合启动子顺式-元件,其赋予基因表达的整体调节的一个方面。启动子或启动子片段可以包含一个或多个影响可操作地连接的基因的转录的增强子元件。据认为许多启动子增强子元件结合DNA-结合蛋白和/或影响DNA拓扑结构,从而产生选择性地允许或限制RNA聚合酶访问DNA模板或促进双螺旋在转录启始位点选择性打开的局部构象。增强子元件可以起到结合调节转录的转录因子的作用。一些增强子元件结合超过一个转录因子,并且转录因子可以以不同的亲和性与超过一个的增强子结构域相互作用。可以通过多种技术鉴定增强子元件,所述技术包括删除分析,即从启动子的5’端或内部删除一个或多个核苷酸;使用DNase I足迹法、甲基化干涉、电泳迁移率-变动试验、通过连接介导的PCR的体内基因组足迹法和其他常规试验的DNA结合蛋白质分析;或通过使用常规DNA序列比较方法,如BLAST,利用已知的顺式-元件基序或增强子元件作为目标序列或目标基序的DNA序列相似性分析。可以通过一个或多个核苷酸的诱变(或取代)或通过其他常规方法来进一步研究增强子结构域的精细结构。可以通过化学合成或通过从包括这些元件的调控元件分离来获得增强子元件,并且可以用含有有用的限制酶位点的其他侧翼核苷酸来合成以利于后续操作。因此,本发明包括根据本文中公开的方法的增强子元件的设计、构建和使用,以用于调节可操作地连接的可转录多核苷酸分子的表达。[0054]在植物中,在基因构建体中包含一些内含子导致相对于缺少内含子的构建体提高的mRNA和蛋白积聚。
[0055]该效应已经被称为基因表达的“内含子介导的增强”(ME) (Mascarenhas等,(1990) PlantMol.Biol.15:913-920)。在玉米基因(例如,tubAl、Adhl、ShUUbil (Jeon 等(2000)Plant Physiol.123:1005-1014 ;Callis 等,(1987)Genes Dev.1:1183-1200 ;Vasil等(1989)Plant Physiol.91:1575-1579 ;Christiansen 等(1992)Plant Mol.Biol.18:675-689)和水稻基因(例如,盐,tp1:McElroy 等,Plant Cell2:163-171 (1990) ;Xu 等,Plant Physiol.106:459-467(1994))中已经鉴定已知在植物中刺激表达的内含子。相似地,已经发现来自双子叶植物基因的内含子,如来自矮牵牛(例如,rbcS)、马铃薯(例如,st-lsl)和来自拟南芥(Arabidopsis thaliana)(例如,ubq3和patl)的那些,其升高基因表达率(Dean 等,(1989)Plant Celll:201-208 ;Leon 等(1991)Plant Physiol.95:968-972 ;Norris 等(1993)Plant Mol Biol21:895-906 ;Rose 和 Last(1997)Plant J.11:455-464)。已经表明了内含子的剪接位点内的缺失或突变降低了基因表达,表明剪接对于 IME 可能是需要的(Mascarenhas 等(1990)Plant Mol Biol.15:913-920 ;Clancy和 Hannah(2002)Plant Physiol.130:918-929)。然而,通过来自拟南芥的 patl 基因的剪接位点内的点突变表明对于双子叶植物中的特定IME,剪接本身是不需要的(Rose和Beliakoff(2000)Plant Physiol.122:535-542)。
[0056]通过内含子增强基因表达不是普遍现象,因为一些内含子插入重组表达盒中不能增强表达(例如,来自双子叶植物基因的内含子(来自豌豆的rbcS基因、来自豆类的菜豆蛋白基因和来自马铃薯(Solanum tuberosum)的stls_l基因)和来自玉米基因的内含子(adhl基因第九个内含子,hsp81基因第一个内含子))(Chee等(1986)Gene41:47-57 ;Kuhlemeier 等(1988)Mol Gen Genet212:405-411 ;Mascarenhas 等(1990) Plant Mol.Biol.15:913-920 ;Sinibaldi 和 Mettler (1992) WE Cohn, K Moldave 编辑,Progress inNucleic Acid Research and Molecular Biology, Vol.42.Academic Press, New York,pp229-257 ;Vancanneyt 等,1990Mol.Gen.Genet.220:245-250)。因此,为了操纵转基因植物中非内源性基因或内源性基因的基因表达水平,不是每一种内含子都可以使用。为了增强给定基因的表达率哪个特征或特定的序列特征必须存在于内含子序列中是现有技术中未知的,并且因此从现有技术不可能预测给定的植物内含子在异源性地使用时是否将引起DNA水平或转录产物水平的表达增强(ME)。
[0057]如本文中所用的,术语“嵌合的”指的是通过将第一 DNA分子与第二 DNA分子融合产生的单一 DNA分子,其中第一或第二 DNA分子通常都不是以该构造存在,即与另一个融合。因此,嵌合DNA分子是通常在自然界未发现的新分子。如本文中所用的,术语“嵌合启动子”指的是通过这样的DNA分子操作产生的启动子。嵌合启动子可以组合两个或更多个DNA片段;一个实例是启动子与增强子元件的融合。因此,本发明包括根据本文中公开的方法的嵌合启动子的设计、构建和使用,以用于调节可操作地连接的可转录多核苷酸分子的表达。[0058]如本文中所用的,术语“变体”指的是在组成上与第一 DNA分子相似但不相同的第二 DNA分子,并且第二 DNA分子仍然保持第一 DNA分子的总体功能性,即相同或相似的表达模式。变体可以是第一 DNA分子的较短或截断的形式和/或第一 DNA分子的序列的改变形式,如具有不同限制酶位点和/或内部缺失、取代和/或插入的变体。“变体”还可以包括调控元件,所述调控元件的核苷酸序列包含参考序列的一个或多个核苷酸的取代、缺失和/或插入,其中衍生的调控元件与相应的亲本调控分子相比具有更多或更少或等同的转录或翻译活性。调控元件“变体”还包括从细菌和植物细胞转化中天然发生的突变产生的变体。在本发明中,作为SEQ ID NO:1-158和180-183提供的多核苷酸序列可以用于形成组成上与原始调控元件的多核苷酸序列相似但不相同的变体,其同时仍然保持原始调控元件的总体功能性,即相同或相似表达模式。根据本公开的内容,本发明的这些变体的产生在本领域普通技术人员的能力范围内,并且包括在本发明的范围内。嵌合调控元件“变体”包含与参考序列相同的组成元件,但包含嵌合调控元件的组成元件可以通过本领域已知的各种方法来可操作地连接,所述方法如限制酶消化和连接、连接无关性克隆、扩增过程中PCR产物的模块组装或调控元件的直接化学合成以及本领域已知的其他方法。所得到的嵌合调控元件“变体”可以由参考序列的相同组成元件或相同组成元件的变体组成,但在包含一个或多个连接序列的一个或多个序列方面不同,所述一个或多个连接序列使得组成部分可以可操作地连接。在本发明中,作为SEQ ID NO:1-158和180-183提供的多核苷酸序列提供了参考序列,其中包含参考序列的组成部分可以通过本领域已知的方法连结,并且可以包含一个或多个核苷酸的取代、缺失和/或插入或在细菌和植物细胞转化中天然发生的突变。
[0059]构建体
[0060]如本文中所用的,术语“构建体”意思是源自任何来源的能够基因组整合或自主复制的任何重组多核苷酸分子,如质粒、粘粒、病毒、自主复制的多核苷酸分子、噬菌体或者线状或环状单链或双链DNA或RNA多核苷酸分子,包括其中一个或多个多核苷酸分子已经以功能操作的方式连接(即,可操作地连接)的多核苷酸分子。如本文中所用的,术语“载体”意思是可以用于转化(即,将异源DNA引入宿主细胞中)目的的任何重组多核苷酸构建体。该术语包括从上述任何分子分离的表达盒。
[0061]如本文中所用的,术语“可操作地连接”指的是第一分子接合第二分子,其中分子排列以使得第一分子影响第二分子的功能。两个分子可以是或不是单一连续分子的部分,并且可以是或不是邻接的。例如,如果启动子在细胞中调节目标可转录多核苷酸分子的转录,则启动子可操作地连接该可转录多核苷酸分子。例如,当前导序列能够作为用于编码序列所编码的多肽的前导序列时,前导序列可操作地连接该编码序列。
[0062]在一个实施方案中,可以作为双Ti质粒边界DNA构建体提供本发明的构建体,所述构建体具有从根癌农杆菌(Agrobacterium tumefaciens)分离的Ti质粒的右边界(RB或AGRtu.RB)和左边界(LB或AGRtu.LB)区,连同根癌农杆菌细胞提供的转移分子,允许T-DNA整合至植物细胞的基因组中(参见,例如,US专利6,603,061)。构建体还可以含有质粒骨架DNA片段,其提供在细菌细胞中的复制功能和抗生素选择,例如,大肠杆菌复制起点(如ori322)、广宿主范围的复制起点(如oriV或oriRi)以及用于选择标记的编码区,如编码赋予对壮观霉素或链霉素抗性的Tn7氨基糖苷腺苷酰转移酶(aadA)的Spec/Strp,或庆大霉素(Gm,Gent)选择标记基因。对于植物转化,宿主细菌菌株常常是根癌农杆菌AB1、C58或LBA4404 ;然而,植物转化领域中的技术人员已知的其他菌株可以用于本发明中。
[0063]以使可转录多核苷酸分子转录成功能性mRNA分子的方式装配构建体并将其引入细胞中的方法是本领域已知的,所述mRNA分子翻译并表达为蛋白质产物。对于本发明的实施,用于制备和使用构建体和宿主细胞的常规组合物和方法是本领域技术人员公知的,参见,例如,Molecular Cloning..A Laboratory Manual (分子克隆:实验室手册),第 3 版,Vol.1、2 和 3 (2000) J.Sambrook, D.ff.Russell 和 N.1rwin, Cold Spring HarborLaboratory Press。用于制备特别适于植物转化的重组载体的方法包括但不限于U.S.专利N0.4,971,908 ;4,940,835 ;4,769,061和4,757,011全文中描述的那些。这些类型的载体在科学文献中已经有综述(参见,例如,Rodriguez等,Vectors..A Survey of MolecularCloning Vectors and Their Uses (载体:分子克隆载体及其使用概述),Butterworths,Boston(1988)和Glick等,Methods in Plant Molecular Biology and Biotechnology (植物分子生物学和生物技术中的方法),CRC Press, Boca Raton FL.(1993))。用于在高等植物中的核酸表达的典型载体是本领域公知的,并且包括源自根癌农杆菌的肿瘤诱导(Ti)质粒的载体(Rogers 等,Methods in Enzymologyl53:253-277 (1987))。可用于植物转化的其他重组载体,包括PCaMVCN转移控制载体,也已经在科学文献中有描述(参见,例如,Fromm 等,Proc.Natl.Acad.Sc1.USA82:5824-5828 (1985))。
[0064]可以在构建体中包括各种调控元件,包括本文中提供的那些中的任何一个。任何这样的调控元件可以结合其他调控元件来提供。可以设计或修改这样的组合以产生所需的调控特征。在一个实施方案中,本发明的构建体包含至少一个可操作地连接可转录多核苷酸分子的调控元件,所述可转录多核苷酸分子可操作地连接3’ UTR0
[0065]本发明的构建体可以包括本文中提供的或本领域已知的任何启动子或前导序列。例如,本发明的启动子可以可操作地连接异源非翻译5’前导序列,如源自热休克蛋白基因的前导序列(参见,例如,U.S.专利N0.5,659,122和5,362,865)。或者,本发明的前导序列可以可操作地连接异源启`动子,如花椰菜花叶病毒35S转录启动子(参见,U.S.专利N0.5,352,605)。
[0066]如本文中所用的,术语“内含子”指的是可以从基因的基因组拷贝中分离或鉴定的DNA分子,并且通常限定为在翻译之前的mRNA加工过程中剪接出来的区域。或者,内含子可以是合成产生的或操作的DNA元件。内含子可以含有影响可操作连接的基因的转录的增强子元件。内含子可以用作调控元件以用于调节可操作地连接的可转录多核苷酸分子的表达。DNA构建体可以包含内含子,并且内含子相对于可转录多核苷酸分子序列可以是或不是异源的。本领域中的内含子实例包括水稻肌动蛋白内含子(U.S.专利N0.5,641,876)和玉米HSP70内含子(U.S.专利N0.5,859,347)。本发明实施中有用的内含子包括SEQ IDNO:4、7、21、24、36、44、48、52、54、58、62、68、72、82、92、94、101、103、105、107、109、111、113、118、120、122、127、129、131、138、140、142、144、146、148、150、152、154、158 和 182。此外,当修饰内含子/外显子边界序列时,可能优选的是,避免紧接在剪接位点(GT)的5’端前使用核苷酸序列AT或核苷酸A,和分别避免紧接在剪接位点(AG)的3’端后使用核苷酸G或核苷酸序列TG,以消除在信使RNA加工成最终转录产物的过程中形成不需要的起始密码子的可能。因此可以以这种方式修饰内含子的5’或3’端剪接位点周围的序列。[0067]如本文中所用的,术语“3’转录终止分子”或“3’UTR”指的是在转录过程中为产生mRNA分子的3’非翻译区(3’UTR)使用的DNA分子。可以通过特定的切割和3’多腺苷酸化(也称为,多A尾)来产生mRNA分子的3’非翻译区。3’UTR可以可操作地连接可转录多核苷酸分子并且位于可转录多核苷酸分子的下游,并且可以包括提供多腺苷酸化信号的多核苷酸和能够影响转录、mRNA加工或基因表达的其他调控信号的多核苷酸。据认为多A尾在mRNA稳定性和翻译启动中起作用。本领域中3’转录终止分子的实例是胭脂碱合成酶3,区域(参见,Fraley 等,Proc.Natl.Acad.Sc1.USA, 80:4803-4807 (1983))、小麦 hspl73,区域、豌豆 rubisco 小亚基 3,区域、棉花 E63,区(U.S.专利 N0.6,096,950) ;W00011200A2中公开的 3,区域和 coixin3’ UTR(U.S.专利 N0.6,635,806)。
[0068]通常发现3’UTR对于特定基因的重组表达具有有益用途。在动物系统中,3’ UTR的机制已经非常明确(例如,Zhao 等,Microbiol Mol Biol Rev63:405-445 (1999);Proudfoot, Nature322:562-565 (1986) ;Kim 等,Biotechnology Progress 19:1620-1622(2003) ;Yonaha 和 Proudfoot,EMBO J.19:3770-3777 (2000) ;Cramer 等,FEBSLetters498:179-182 (2001) ;Kuerstem 和 Goodwin, Nature Reviews Genetics4:626-637(2003))。需要RNA转录的有效终止以防止不需要的性状不相关(下游)序列的转录,其可能干扰性状性能。与独立的插入相比,多个基因表达盒彼此位置接近的排列(例如,在一个T-DNA中)会引起所述构建体中一个或多个基因的基因表达的抑制(Padidam和Cao,BioTechniques31:328-334 (2001))。这可能干扰获得足够水平的表达,例如,在需要来自所有表达盒的强基因表达的情况中。
[0069]在植物中,清楚限定的多腺苷酸化信号序列是未知的。Hasegawa等,Plant J.33:1063-1072, (2003)未能在林烟草(Nicotiana sylvestris)的体外和体内系统中鉴定出保守的多腺苷酸化信号序列,也未能确定初始(非-多腺苷酸化的)转录产物的实际长度。弱的3’UTR具有产生连读(read-through)的可能,其可能影响位于邻近表达盒中的基因的表达(Padidam和Cao,BioTe chniques31:328-334 (2001))。转录终止的适当控制可以防止连读到位于下游的序列(例如,其他表达盒)中并且可以进一步允许RNA聚合酶有效再循环,以提高基因表达。转录的有效终止(从DNA释放RNA聚合酶II)是转录重新启动必需的,并且因此直接影响整体的转录产物水平。转录终止后,成熟的mRNA从合成位点和模板释放至细胞质中。真核mRNA作为多(A)形式在体内累积,使得难以通过常规方法来检测转录终止位点。然而,通过生物信息学方法预测功能性和有效的3’ UTR是困难的,因为不存在允许容易地预测有效3’ UTR的保守序列。
[0070]从实践观点看,在转基因盒中使用的3’UTR具有以下特征通常是有益的。3’UTR应当能够有效地和高效地终止转基因的转录并且防止转录产物连读到任何邻近的DNA序列(如在一个T-DNA中存在多个盒的情况中,所述的邻近DNA序列可以由另一个转基因盒组成)中或T-DNA已经插入的邻近染色体DNA中。3’UTR不应当引起由用于驱动转基因表达的启动子、前导序列和内含子导致的转录活性的降低。在植物生物技术中,3’UTR常常用于引发从转化的植物提取的反转录RNA的扩增反应,并且用于(I)评价一旦整合至植物染色体中的转基因盒的转录活性或表达;⑵评价植物DNA内插入的拷贝数;和(3)评价育种后得到的种子的接合性。3’ UTR还用于从转化的植物提取的DNA的扩增反应中,以表征插入盒的完整性。[0071]可以基于从种子、花和其他组织分离的信使RNA制得的cDNA文库中表达的序列标记(EST)的表达来鉴定用于提供转基因在植物中的表达的3’UTR,所述种子、花和其他组织源自大须芒草(Andropogon gerardii)、沙生鹿茅(Saccharum ravennae (Erianthusravennae))、狗尾草(Setaria viridis)、墨西哥玉米(Zea mays subsp.mexicana)、小米(Setaria italica)或薏该(Coix lacryma-jobi)。使用本领域技术人员已知的方法,从选定植物物种的花组织、种子、叶和根分离的组织制得cDNA文库。使用本领域已知的各种测序方法将所得到的cDNA测序。使用生物信息学软件,如clc_ref_assemble_complete版本
2.01.37139 (CLC bio USA, Cambridge,Massachusetts02142),将所得到的 EST 装配成簇。通过计数各个簇的cDNA读数的数目来确定各个簇的转录产物丰度。鉴定的3’ UTR可以由源自cDNA序列的序 列以及源自基因组DNA的序列组成。将cDNA序列用于设计引物,其然后用于按照制造商的方案构建的 GenomeWalker?(Clontech Laboratories, Inc, MountainView, CA)文库以克隆相应基因组DNA序列的3’区域,来提供较长的终止序列。通过对各个组织文库所观察到的序列读数的直接计数或标准化计数对相关转录产物丰度的分析可以用于推断关于表达模式的特性。例如,相对于叶子可以在根组织中以较高丰度看到的转录产物中发现一些3’ UTR0这表明了转录产物在根中是高度表达的,并且根表达的特性可以归因于启动子、前导序列、内含子或3’ UTR的转录调控。通过在特定器官、组织或细胞类型内的表达特性鉴定的3’ UTR的经验测试可以导致增强那些特定器官、组织或细胞类型内的表达的3’ UTR的鉴定。
[0072]构建体和载体也可以包括表达连接的肽的转运肽编码序列,所述连接肽用于靶向蛋白产物于特别是叶绿体、白色体或其他质体细胞器;线粒体;过氧化物酶体;液泡或细胞外位置。对于使用叶绿体转运肽的描述参见U.S.专利N0.5,188,642和U.S.专利N0.5,728,925。许多叶绿体定位的蛋白质作为前体由核基因表达,并且通过叶绿体转运肽(CTP)靶向于叶绿体。这样的分离的叶绿体蛋白质的实例包括,但不限于,与核酮糖-1,5-二磷酸羧化酶的小亚基(SSU)、铁氧还蛋白、铁氧还蛋白氧化还原酶、光捕获复合蛋白I和蛋白I1、硫氧还蛋白F、烯醇式丙酮酰莽草酸磷酸合成酶(EPSPS)以及U.S.专利N0.7,193,133中所描述的转运肽相关的那些。已经在体内和体外证明了非叶绿体蛋白质可以通过使用与异源CTP的蛋白质融合来靶向于叶绿体并且CTP足以将蛋白靶向于叶绿体。已经表明了整合合适的叶绿体转运肽,如拟南芥EPSPS CTP(CTP2)(参见,Klee等,Mol.Gen.Genet.210:437-442(1987))或矮牵牛 EPSPS CTP (CTP4)(参见,della-Cioppa 等,Proc.Natl.Acad.Sc1.USA83:6873-6877 (1986)),将异源 EPSPS 蛋白序列靶向于转基因植物中的叶绿体(参见,U.S.专利 N0.5,627,061 ;5,633,435 和 5,312,910 以及 EP0218571 ;EP189707 ;EP508909 和 EP924299)。
[0073]可转录多核苷酸分子
[0074]如本文中所用的,术语“可转录多核苷酸分子”指的是能够转录成RNA分子的任何DNA分子,包括,但不限于,具有蛋白质编码序列的那些和产生具有可用于基因抑制的序列的RNA分子的那些。“转基因”指的是至少相对于其在基因组中的位置对于宿主细胞异源的可转录多核苷酸分子和/或人工引入目前或任何之前代的细胞的宿主细胞基因组中的可转录多核苷酸分子。
[0075]本发明的启动子可以可操作地连接对于启动子分子是异源的可转录多核苷酸分子。如本文中所用的,术语“异源的”指的是两个或多个多核苷酸分子的组合正常情况下未在自然界中发现的这种组合。例如,两个分子可以源自不同的物种和/或两个分子可以源自不同的基因,例如,来自相同物种的不同基因或来自不同物种的相同基因。因此,如果这样的组合正常情况下未在自然界中发现,那么启动子对于可操作地连接的可转录多核苷酸分子是异源的,即,该可转录多核苷酸分子在组合中不是自然发生地可操作连接该启动子分子。
[0076]可转录多核苷酸分子通常可以是对于需要其RNA转录产物表达的任何DNA分子。这样的RNA转录产物的表达可以导致所得到的mRNA分子的翻译,并且因此导致蛋白质表达。或者,例如,可以将可转录多核苷酸分子设计成最终引起降低的特定基因和蛋白质的表达。在一个实施方案中,这可以通过使用以反义方向定向的可转录多核苷酸分子来实现。本领域普通技术人员熟知这样的反义技术的使用。简而言之,随着反义可转录多核苷酸分子被转录,RNA产物在细胞内与互补RNA分子杂交并将其隔离。这种双链RNA分子不能通过细胞的翻译机制翻译成蛋白质,并且在细胞中降解。可以以这种方式负调节任何基因。
[0077]因此,本发明的一个实施方案是可操作地连接可转录多核苷酸分子的本发明的调控元件,如SEQ ID NO:1-158和180-183中提供的那些,以使得当构建体整合至植物细胞的基因组中时,以所需水平或以所需模式调节可转录多核苷酸分子的转录。在一个实施方案中,可转录多核苷酸分子包含基因的蛋白质编码区,并且启动子影响翻译和表达为蛋白质产物的RNA分子的转录。在另一个实施方案中,可转录多核苷酸分子包含基因的反义区域,并且启动子影响反义RNA分子、双链RNA或其他类似抑制性RNA分子的转录,以抑制特定的目标RNA分子在目标宿主细胞中的表达。
[0078]具有农艺学意义的基因
[0079]可转录多核苷酸分子可以是具有农艺学意义的基因。如本文中所用的,术语“具有农艺学意义的基因”指的是当在特定的植物组织、细胞或细胞类型中表达时赋予所需特征的可转录多核苷酸分子,所述特征例如与植物形态学、生理学、生长、发育、产量、产物、营养特征、抗病性或抗虫性和`/或环境或化学耐受性相关。具有农艺学意义的基因包括,但不限于,编码产品蛋白质、抗应激蛋白、发育控制蛋白、组织分化蛋白、分生组织蛋白、环境反应性蛋白、衰老蛋白、激素反应性蛋白、脱落蛋白(abscission protein)、源蛋白、储器蛋白(sink protein)、花控制蛋白、种子蛋白、除草剂抗性蛋白、疾病抗性蛋白、脂肪酸生物合成酶、生育酚生物合成酶、氨基酸生物合成酶、杀虫蛋白或任何其他物质(如,靶向特定基因用于抑制的反义或RNAi分子)的那些。具有农艺学意义的基因的产物可以在植物内起作用以引起对植物生理学或代谢的效应,或可以作为施加于植物上的昆虫膳食中的杀虫剂。
[0080]在本发明的一个实施方案中,本发明的启动子结合至构建体中,以使得启动子可操作地连接作为具有农艺学意义基因的可转录多核苷酸分子。为了赋予农艺学上有益的性状,具有农艺学意义的基因的表达是合乎需要的。有益的农艺学性状可以是,例如,但不限于,除草剂耐受性、昆虫控制、改变的产量、真菌疾病抗性、病毒抗性、线虫抗性、细菌疾病抗性、植物生长和发育、淀粉生产、改变的油生产、高油产量、改变的脂肪含量、高蛋白质产量、果实成熟、增强的动物和人营养、生物聚合物、环境应激抗性、药物肽和可分泌肽、改善的加工性状、提高的可消化性、酶产生、风味、氮固定、杂种种子产生、纤维产生和生物燃料产生。本领域已知的具有农艺学意义的基因的实例包括用于除草剂抗性(U.S.专利 N0.6,803,501 ;6, 448,476 ;6, 248,876 ;6, 225,114 ;6, 107,549 ;5, 866,775 ;5,804,425 ;5, 633,435 和 5,463,175)、提高的产量(U.S.专利 N0.USRE38, 446 ;6, 716,474 ;6,663,906 ;6, 476,295 ;6, 441,277 ;6, 423,828 ;6, 399,330 ;6, 372,211 ;6, 235,971 ;6,222,098 和 5,716,837)、昆虫控制(U.S.专利 N0.6,809,078 ;6, 713,063 ;6, 686,452 ;6,657,046 ;6, 645,497 ;6, 642,030 ;6, 639,054 ;6, 620,988 ;6, 593,293 ;6, 555,655 ;6,538,109 ;6, 537,756 ;6, 521,442 ;6, 501,009 ;6, 468,523 ;6, 326,351 ;6, 313,378 ;6,284,949 ;6, 281,016 ;6, 248,536 ;6, 242,241 ;6, 221,649 ;6, 177,615 ;6, 156,573 ;6,153,814 ;6, 110,464 ;6, 093,695 ;6, 063,756 ;6, 063,597 ;6, 023,013 ;5, 959,091 ;5,942,664 ;5, 942,658,5,880,275 ;5, 763,245 和 5,763,241)、真菌疾病抗性(U.S.专利N0.6,653,280 ;6, 573,361 ;6, 506,962 ;6, 316,407 ;6, 215,048 ;5, 516,671 ;5, 773,696 ;6,121,436 ;6, 316,407 和 6,506,962)、病毒抗性(U.S.专利 N0.6,617,496 ;6, 608,241 ;6,015,940 ;6, 013,864 ;5, 850,023 和 5,304,730)、线虫抗性(U.S.专利 N0.6,228,992)、细菌疾病抗性(U.S.专利N0.5,516,671)、植物生长和发育(U.S.专利N0.6,723,897和6,518,488)、淀粉产量(U.S.专利 N0.6,538,181 ;6,538,179 ;6,538,178 ;5,750,876 ;6,476,295)、改变的油产生(U.S.专利 N0.6,444,876 ;6,426,447 和 6,380,462)、高油产量(U.S.专利 N0.6,495,739 ;5,608,149 ;6,483,008 和 6,476,295)、改变的脂肪酸含量(U.S.专利 N0.6,828,475 ;6,822,141 ;6,770,465 ;6,706,950 ;6,660,849 ;6,596,538 ;6,589,767 ;6,537,750 ;6,489,461 和 6,459,018)、高蛋白产生(U.S.专利 N0.6,380,466)、果实成熟(U.S.专利N0.5,512,466)、增强的动物和人营养(U.S.专利N0.6,723,837 ;6,653,530 ;6,5412,59 ;5,985,605 和 6,171,640)、生物聚合物(U.S.专利 N0.USRE37, 543 ;6,228,623 和 5,958,745 及 6,946,588)、环境应激抗性(U.S.专利 N0.6,072,103)、药物肽和可分泌肽(U.S.专利 N0.6,812,379 ;6,774,283 ;6,140,075 和 6,080,560)、改善的加工性状(U.S.专利N0.6,476,295)、提高的可消化性(U.S.专利N0.6,531,648)、低蜜三糖(U.S.专利N0.6,166,292)、工业酶产生(U.S.专利N0.5,543,114)、改善的风味(U.S.专利N0.6,011,199)、氮固定(U.S.专利N0.5,229,114)、杂种种子产生(U.S.专利N0.5,689,041)、纤维产生(U.S.专利 N0.6,576,818 ;6,271,443 ;5,981,834 和 5,869,720)和生物燃料产生(U.S.专利N0.5,998,700)的那些。
[0081] 或者,具有农艺学意义的基因可以通过编码引起内源基因基因表达的靶向调节的RNA分子来影响上述植物特征或表型,例如,通过反义(参见,例如,US专利5,107, 065)、抑制性RNA ( “RNAi”,包括通过miRNA-、siRNA-、反式作用siRNA-和定相sRNA-介导的机制来调苄基因表达,例如,如公开的申请US2006/0200878和US2008/0066206以及US专利申请11/974,469中所述的)或共抑制介导的机制。RNA还可以是经工程化来切割所需内源性mRNA产物的催化性RNA分子(例如,核酶或核糖开关;参见,例如US2006/0200878)。因此,编码影响农艺学上重要的目标表型或形态学变化的转录RNA分子的任何可转录多核苷酸分子可以用于本发明的实施中。以将可转录多核苷酸分子转录成能够引起基因抑制的分子的方式构建构建体并将其引入细胞中的方法是本领域已知的。例如,使用含有反义定向的可转录多核苷酸分子的构建体来调节植物细胞中的基因表达的转录后基因抑制公开于U.S.专利N0.5,107,065和5,759,829中,以及使用含有正义定向的可转录多核苷酸分子的构建体来调节植物中的基因表达的转录后基因抑制公开于U.S.专利N0.5,283,184和5,231,020中。可转录多核苷酸在植物细胞中的表达还可以用于抑制以植物细胞为食的植物害虫,例如,从鞘翅目害虫分离的组合物(U.S.专利公开N0.US20070124836)和从线虫害虫分离的组合物(U.S.专利公开N0.US20070250947)。植物害虫包括,但不限于,节足害虫、线虫害虫和真菌或微生物害虫。用于结合至本发明的构建体中的示例性可转录多核苷酸包括,例如,来自目标物种以外的物种的DNA分子或基因或源于或存在于相同物种中但通过传统繁殖或育种技术以外的遗传工程方法整合至受体细胞中的基因。多核苷酸分子的类型可以包括,但不限于,已经存在于植物细胞中的多核苷酸分子、来自另一植物的多核苷酸分子、来自不同生物体的多核苷酸分子或外部产生的多核苷酸分子,如含有基因的反义信息的多核苷酸分子,或编码人工的、合成的或转基因的其他修饰形式的多核苷酸分子。
[0082]选择标记
[0083]如本文中所用的,术语“标记”指的是可以以一定的方式筛选或评价其表达或缺失的任何可转录多核苷酸分子。用于本发明实施中的标记基因包括,但不限于,编码葡糖苷酸酶(U.S.专利N0.5,599,670中所述的⑶S)、绿色荧光蛋白及其变体(U.S.专利N0.5,491,084和6,146,826中所述的GFP)、赋予抗生素抗性的蛋白质或赋予除草剂耐受性的蛋白的可转录多核苷酸分子。有用的抗生素抗性标记,包括编码赋予卡那霉素(nptll)、潮霉素B(aph IV)、链霉素或壮观霉素(aad, spec/strep)和庆大霉素(aac3和aacC4)抗性的那些,是本领域已知的。对其已经证明了转基因植物耐受性并且可以对其使用本发明的方法的除草剂包括,但不限于:氨基-甲基-膦酸、草甘膦、草铵膦、磺脲、咪唑啉酮、溴苯腈、茅草枯、麦草畏、烯己二酮、原卟啉原氧化酶抑制剂和异噁氟草除草剂。编码涉及除草剂耐受性的蛋白质的可转录多核苷酸分子是本领域已知的,并且包括,但不限于,编码5-烯醇丙酮酰莽草酸-3-磷酸合成酶(U.S.专利N0.5,627,061 ;5,633,435 ;6,040,497和5,094,945中所述的草甘膦耐受性的EPSPS)的可转录多核苷酸分子;编码草甘膦氧化还原酶和草甘膦-N-乙酰转移酶(U.S.专利N0.5,463,175中所述的GOX ;U.S.专利公开N0.20030083480中所述的 GAT和U.S.专利公开N0.20030135879中的麦草畏单加氧酶)的可转录多核苷酸分子;编码溴苯腈腈水解酶(U.S.专利N0.4,810,648中所述的用于溴苯腈耐受性的Bxn)的可转录多核苷酸分子;编码Misawa等,Plant Journal4:833-840 (1993)和Misawa等,Plant Journal6:481-489 (1994)中所述的用于氟草敏耐受性的八氢番爺红素去饱和酶(crtl)的可转录多核苷酸分子;编码Sathasiivan等,Nucl.Acid.Res.18:2188-2193(1990)中所述的用于磺脲除草剂耐受性的乙酰羟酸合成酶(AHAS,也称为ALS)的可转录多核苷酸分子JPDeBlock等,EMBO Journal6:2513-2519(1987)中所述的用于草铵膦和双丙氨磷耐受性的bar基因。本发明的启动子分子可以表达连接的可转录多核苷酸分子,所述多核苷酸分子编码草丁膦乙酰转移酶、草甘膦抗性EPSPS、氨基糖苷磷酸转移酶、羟苯基丙酮酸脱氢酶、潮霉素磷酸转移酶、新霉素磷酸转移酶、茅草枯脱卤素酶、溴苯腈抗性腈水解酶、邻氨基苯甲酸合成酶、芳氧基链烷酸酯双加氧酶、乙酰CoA羧化酶、草甘膦氧化还原酶和草甘膦-N-乙酰转移酶。
[0084]包括在术语“选择标记”内的还有编码其分泌可以检测以作为鉴定或选择转化细胞的一种方式的选择标记的基因。实例包括编码可以通过抗体相互作用鉴定的可分泌抗原或甚至可以催化性地检测的可分泌酶的标记。可选择的分泌标记蛋白落入多种类别中,包括可检测的小的、扩散性蛋白(例如,通过ELISA)、在细胞外溶液中可检测的小的活性酶(例如,α-淀粉酶、β_内酰胺酶、草丁膦转移酶),或插入或封闭在细胞壁中的蛋白质(如,包括前导序列的蛋白,如在延伸的表达单元或烟草病理相关蛋白(也称为烟草PR-S)中发现的那些)。其他可能的选择标记基因是本领域技术人员清楚的并且包括在本发明中。
[0085]细胞转化
[0086]本发明还涉及生产包含可操作连接到可转录多核苷酸分子上的启动子的转化细胞和植物的方法。
[0087]术语“转化”指的是将核酸引入受体宿主中。如本文中所用的,术语“宿主”指的是细菌、真菌或植物,包括细菌、真菌或植物的任何细胞、组织、器官或后代。特别感兴趣的植物组织和细胞包括原生质体、愈伤组织、根、块茎、种子、茎、叶、幼苗、胚芽和花粉。
[0088]如本文中所用的,术语“转化的”指的是其中已经引入了外源多核苷酸分子(如,构建体)的细胞、组织、器官或生物体。引入的多核苷酸分子可以整合至受体细胞、组织、器官或生物体的基因组DNA中,以使得引入的多核苷酸分子被遗传到随后的世代。“转基因”或“转化的”细胞或生物体还包括细胞或生物体的后代以及从使用这样的转基因生物体作为杂交亲本的育种程序产生的并且由于外源多核苷酸分子的存在呈现出改变表型的后代。术语“转基因的”指的是含有一个或多个异源多核酸分子的细菌、真菌或植物。
[0089]存在许多方法将多核酸分子引入植物细胞中。该方法通常包括如下步骤:选择合适的宿主细胞、用重组载体转化宿主细胞和获得转化的宿主细胞。合适的方法包括细菌感染(例如,农杆菌)、二元细菌人工染色体载体、DNA的直接传递(例如,通过PEG介导的转化、干燥/抑制-介导的DNA摄取、电穿孔、用碳化硅纤维搅拌和DNA覆盖颗粒的加速等(综述于 Potrykus 等,Ann.Rev.Plant Physiol.Plant Mol.Biol.42:205 (1991))中)。
[0090]用于将DNA分子引入细胞中的技术是本领域技术人员公知的。在本发明的实施中通过将植物DNA构建体引入植物基因组中来转化植物细胞的方法和材料可以包括公知的和证明的方法中的任何一种。任何转化方法可以用于使用本发明的一个或多个启动子和/或构建体转化宿主细胞。宿主细胞可以是任何细胞或生物体,如植物细胞、藻类细胞、藻类、真菌细胞、真菌、细菌细胞或昆虫细胞。优选的宿主和转化的细胞包括来自以下的细胞:植物、曲霉属(Aspergillus)、酵母、昆虫、细菌和藻类。
[0091]再生的转基因植物可以自花授粉以提供纯合的转基因植物。或者,可以将获自再生的转基因植物的花粉与非转基因植物(优选是农艺学上重要物种的近交系)杂交。通常用于不同性状和作物的育种方法的描述可以在几本参考书之一中找到,参见,例如,Allard, Principles of Plant Breeding(育种原理),John ffiley&Sons, NY,U.0fCA, Davis, CA,50-98(1960) ;Simmonds !Principles of crop improvement (作物改进原理),Longman, Inc., NY, 369-399 (1979), Sneep 和 Hendriksen, Plant breedingperspectives (植物育种概览),Wageningen (编辑),Center for AgriculturalPublishing and Documentation(1979) ;Fehr, Soybeans..Improvement, Production andUses (大豆:提高、生产和使用),第 2 版,Monograph, 16:249 (1987) ;Fehr, Principles ofvariety development, Theory and Technique (品种发育原理,理论和技术),(Vol.1)和Crop Species Soybean(作物品种大豆)(Vol2), 1wa State Univ., Macmillan Pub.C0.,NY, 360-376(1987)。相反地,来自非转基因植物的花粉可以用于对再生的转基因植物授粉。
[0092]可以分析转化植物的目标基因的存在以及通过本发明的调控元件赋予的表达水平和/或特征。本领域技术人员知道可用于转化植物分析的多种方法。例如,用于植物分析的方法包括,但不限于,Southern印迹或northern印迹、基于PCR的方法、生物化学分析、表型筛选方法、田间评价和免疫诊断试验。可以使用TaqMan? (Applied Biosystems,Foster City,CA)试剂和方法如制造商描述的来测量可转录多核苷酸分子的表达,并且使用TaqMan? Testing Matrix确定PCR循环时间。或者,如制造商所述的Invader?(Third Wave Technologies, Madison, WI)试剂和方法可以用于转基因表达。
[0093]可以从可育的转基因植物收集本发明的植物的种子,并且用于生长本发明的转化植物的后代世代,包括包含本发明的构建体并表达具有农艺学意义基因的杂种植物系。
[0094]本发明还提供了本发明的植物的部分。植物部分,非限制地,包括叶、茎、根、块茎、种子、胚乳、胚珠和花粉。本发明还包括和提供了包含本发明核酸分子的转化植物细胞。
[0095]转基因植物可以将转基因多核苷酸分子传递给其后代。后代包括包含源自其祖先植物的转基因的任何可再生植物部分或种子。转基因植物优选对转化的多核苷酸分子是纯合的并且作为有性繁殖的结果将该序列传递给所有后代。可以从转基因植物产生的种子种植后代。然后将这些另外的植物自花授粉以产生植物的纯育种系。评价来自这些植物的后代,其中特别是评价基因表达。可以通过几种常用的方法,如western印迹、northern印迹、免疫沉淀和ELISA,来检测基因表达。
[0096]商品
[0097]本发明提供了包含根据本发明的DNA分子的商品。如本文中所用的,“商品”指的是由源自包含本发明DNA分子的植物、种子、植物细胞或植物部分的材料组成的任何组合物或产品。商品可以销售给消费者,并且可以是可生存的或不可生存的。不可生存的商品包括但不限于不可生存的种子和籽粒;加工过的种子、种子部分和植物部分;脱水的植物组织、冷冻的植物组织和加工过的植物组织;加工用于陆地和/或水生动物食用的动物饲料的种子和植物部分,油、粗粉、面粉、薄片、麸皮、纤维、奶、干酪、纸张、奶油、酒和用于人消耗的任何其他食品;以及生物质和燃料产品。可生存的商品包括但不限于种子和植物细胞。因此包含根据本发明的DNA分子的植物可以用于制造任何通常从植物或其部分获得的商品。
[0098]现在已经概括地描述了本发明,通过参考以下实施例将更容易理解本发明,所述实施例是以说明的方式提供的并且不是用来限制本发明,除非具体说明。本领域技术人员应当理解以下实施例中公开的技术代表了发明人发现很好地实施本发明的技术。然而,根据本发明的公开内容,本领域技术人员应当认识到在所公开的特定实施方案中可以进行许多变化并且仍然获得类似或相似的结果而没有脱离本发明的精神和范围,因此附图中所列或所示的所有事物解释为说明性的而不是限制意义的。
实施例
[0099]实施例1:调控元件的鉴定和克隆
[0100]从单子叶物种大须芒草(Andropogon gerardii)、沙生鹿茅(Saccharumravennae (Erianthus ravennae))、狗尾草(Setaria viridis)、墨西哥玉米(Zea mayssubsp.mexicana)、小米(Setaria italica)和薏该(Coix lacryma-jobi)的基因组 DNA 鉴别和分离出新的泛素转录调控元件或转录调控表达元件组(EXP)序列。
[0101]从以上的各个物种中确定泛素I转录产物序列。将各个泛素I转录产物的5’非翻译区(5’UTR)用于设计引物以扩增用于确认的泛素基因的相应转录调控元件,其包含启动子、前导序列(5’UTR)和可操作地连接的第一内含子。引物用于按照制造商的方案构建的 GenomeWalker?(Clontech Laboratories, Inc, Mountain View, CA)文库以克隆相应的基因组DNA序列的5’区。使用与玉米(Zea mays)的泛素4、6和7基因同源的公共序列,也从单子叶植物高粱(Sorghum bicolor)分离泛素转录调控元件。
[0102]使用鉴定的序列,进行了生物信息学分析来鉴定扩增的DNA中的调控元件。使用该分析的结果,在DNA序列内限定调控元件并且设计引物来扩增调控元件。使用标准聚合酶链式反应条件,用含有独特限制酶位点和从大须芒草(A.gerardii)、沙生蔗茅(S.ravennae)、狗尾草(S.viridis)、墨西哥玉米(Z.mays subsp.mexicana)、小米(S.1talica)、薏该(C.lacryma-jobi)和高粱(S.bicolor)分离的基因组DNA的引物来扩增用于各个调控元件的相应DNA分子。将所得到的DNA片段连接至基础植物表达载体中并且测序。然后使用转化的植物原生质体进行调控元件TSS和内含子/外显子剪接点的分析。简而言之,用包含可操作地连接异源可转录多核苷酸分子的克隆DNA片段的植物表达载体转化原生质体,并通过分析由此产生的mRNA转录产物的序列,将用于cDNA端快速扩增的5’ RACE 系统,版本 2.0 (Invitrogen, Carlsbad, California92008)用于证实调控兀件 TSS和内含子/外显子剪接点。
[0103]鉴定的转录调控表达元件组(“EXP”)的序列本文中作为SEQ ID NO =1,5,8,10,12,14,16,18,22,25,27,29,31,33,37,39,41,45,49,53,55,59,63,65,69,73,75,77,79,83,85,87,90,93,95,97,98,99,100,102,104,106,108,110,112,114,115,116,117,119,121,123,124,125,126,128,130,132,133,134,136,137,139,141,143,145,147,149,151,153,155,157,180,181和183提供,如以下表1中所示。启动子序列本文中作为SEQ ID NO:2,6,9,11,13,15,17,19,23,26,28,30,32,34,38,40,42,46,50,56,60,64,66,70,74,76,78,80,84,86,88,91,96 和 135 提供。前导序列本文中作为 SEQ ID NO:3,20,35,43,47,51,57,61,67,71 和 81 提供 。内含子序列本文中作为 SEQ ID NO:4,7,21,24,36,44,48,52,54,58,62,68,72,82,92,94,101,103,105,107,109,111,113,118,120,122,127,129,131,138,140,142,144,146,148,150,152,154,156,158 和 182 提供。增强子序列作为 SEQ ID NO:89提供。
【权利要求】
1.一种DNA分子,其包含选自以下的DNA序列:a)与SEQID NO:1-158和180-183中任一个具有至少85%序列同一性的序列; b)包含SEQID NO:1-158和180-183中任一个的序列;和c)SEQID NO:1-158和180-183中任一个的片段,其中该片段具有基因调控活性; 其中所述序列可操作地与异源可转录多核苷酸分子连接。
2.权利要求1的DNA分子,其中所述序列与SEQID NO:1-158和180-183中任一个的DNA序列具有至少90%序列同一性。
3.权利要求1的DNA分子,其中所述序列与SEQID NO:1-158和180-183中任一个DNA序列具有至少95%序列同一性。
4.权利要求1的DNA分子,其中所述DNA序列包含基因调控活性。
5.权利要求1的DNA分子,其中所述异源可转录多核苷酸分子包含具有农艺学意义的基因。
6.权利要求5的DNA分子,其中所述具有农艺学意义的基因赋予植物除草剂耐受性。
7.权利要求5的DNA分子,其中具有农艺学意义的基因赋予植物抗虫性。
8.一种包含异源DNA分子的转基因植物细胞,所述DNA分子包含选自以下的序列:a)与SEQID NO:1-158和1 80-183中任一个具有至少85%序列同一性的序列; b)包含SEQID NO:1-158和180-183中任一个的序列;和c)SEQID NO:1-158和180-183中任一个的片段,其中该片段具有基因调控活性; 其中所述序列可操作地与异源可转录多核苷酸分子连接。
9.权利要求8的转基因植物细胞,其中所述转基因植物细胞是单子叶植物细胞。
10.权利要求8的转基因植物细胞,其中所述转基因植物细胞是双子叶植物细胞。
11.一种转基因植物或其部分,包含权利要求1的DNA分子。
12.权利要求11的转基因植物的后代植物或其部分,其中所述后代植物或其部分包含所述DNA分子。
13.一种转基因种子,其中所述种子包含权利要求1的DNA分子。
14.一种生产商品的方法,包括获得根据权利要求11的转基因植物或其部分并从其生产所述商品。
15.权利要求14的方法,其中所述商品是蛋白质浓缩物、蛋白质分离物、籽粒、淀粉、种子、粗粉、面粉、生物质或种子油。
16.—种商品,其包含权利要求1的DNA分子。
17.权利要求16的商品,其中所述商品是蛋白质浓缩物、蛋白质分离物、籽粒、淀粉、种子、粗粉、面粉、生物质或种子油。
18.—种表达可转录多核苷酸分子的方法,包括获得根据权利要求11的转基因植物并栽培所述植物,其中所述可转录多核苷酸被表达。
【文档编号】C12N15/82GK103534267SQ201280023321
【公开日】2014年1月22日 申请日期:2012年3月21日 优先权日:2011年3月25日
【发明者】S·弗拉辛斯基 申请人:孟山都技术公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1