增加植物中多肽表达的翻译增强子元件堆叠的制作方法

文档序号:392806阅读:825来源:国知局
专利名称:增加植物中多肽表达的翻译增强子元件堆叠的制作方法
技术领域
本发明一般涉及植物分子生物学,特别是增加植物中转基因表达的组合物和方法。电子方式提交的序列表引用序列表正式文本通过EFS-Web电子方式提交,以ASCII格式序列表的文件名为“42473SEQ Listing_ST25. txt”,创建于2010年9月2日,文本大小17kb,并与说明书同时 提交。此ASCII格式的文件中所含的序列表是本说明书的一部分,它以其整体通过引用而构成本文的一部分。
背景技术
植物基因工程的进展已经能够生产出具有农艺学理想性状的植物,而且还拥有了充当有效的重组蛋白表达系统的能力。这些进展取决于编码一个或多个目标多肽的重组多核苷酸构建体在其所导入的转基因植物中的正确表达。以前的工作提供了许多调控元件,如启动子、内含子和翻译前导肽序列,它们益于影响这些重组多核苷酸构建体在转基因植物中的表达。然而,许多原先确定的调控元件无法提供完全实现转基因植物中选定基因导入表达的预期效益所需的重组蛋白表达的水平。因此,仍然迫切需求的是,能够拥有介导植物中所需多肽的高水平表达的新型调控元件和调控元件组合。小结本文提供了增加目标多肽在植物及其植物部分中表达的组合物和方法。本发明的组合物是多核苷酸构建体,其包括(a)至少一种源自病毒的翻译增强子元件,与至少一种源自细胞基因的翻译增强子元件串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸。本发明还提供了包含这些多核苷酸构建体的表达盒、载体以及转基因植物和植物部分。一种或多种翻译增强子元件可以是与目标多肽异源的。异源是指并非来自所表达目标多肽的前导肽序列(5’UTR)的序列。本发明的方法包括将有效连接至在植物细胞中是功能性的启动子的本发明多核苷酸构建体导入植物或其植物部分的方法。在适于本发明的多核苷酸构建体表达的培养条件下,串联堆叠的翻译增强子元件为所涉及的mRNA转录本的翻译提供了更高的效率。因此,本发明提供了目标多肽在植物及其植物部分中表达的增加。本发明包括下列实施例。I. 一种多核苷酸构建体,包括(a)至少一种源自病毒的翻译增强子元件,与至少一种源自细胞基因的翻译增强子元件串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸。2.实施例I的多核苷酸构建体,其中所述病毒是植物病毒。3.实施例2的多核苷酸构建体,其中所述病毒是RNA病毒。
4.实施例3的多核苷酸构建体,其中所述病毒为第IV组(+ ) ssRNA病毒的成员,并且其中源自所述病毒的所述翻译增强子元件包含所述病毒的前导肽序列(5’ UTR)。5.实施例4的多核苷酸构建体,其中所述病毒为烟草花叶病毒(Tobamovirus)属的成员,或选自马铃薯Y病毒科(Potyviridae)、雀麦花叶病毒科(Bromoviridae)和蕃爺丛矮病毒科(Tombusviridae)的科的成员。6.实施例5的多核苷酸构建体,其中所述病毒选自烟草花叶病毒(TMV)、烟草蚀纹病毒(TEV)、苜蓿花叶病毒(AMV)和玉米坏疽线条病毒(MNeSV)。7.实施例6的多核苷酸构建体,其中所述病毒为TMV,并且其中源自所述TMV的所述翻译增强子元件包含SEQ ID NO: I中所示的前导肽序列或者其功能性片段或变体,其中所述变体与SEQ ID NO: I中所示的序列具有至少95%的序列同一性。8.实施例6的多核苷酸构建体,其中所述病毒为TEV,并且其中源自所述TEV的所述翻译增强子元件包含SEQ ID NO:2或SEQ ID NO: 18中所示的前导肽序列或者其功能性·片段或变体,其中所述变体与SEQ ID N0:2或SEQ ID NO: 18中所示的序列具有至少95%的序列同一性。9.实施例6的多核苷酸构建体,其中所述病毒为AMV或丽eSV,并且其中源自所述AMV或所述丽eSV的所述翻译增强子元件包含SEQ ID NO: 3或SEQ ID NO: 19中所示的前导肽序列或者其功能性片段或变体,其中所述变体与SEQ ID NO: 3或SEQ ID NO: 19中所示的序列具有至少95%的序列同一性。10.任何实施例1-9的多核苷酸构建体,其中所述细胞基因为应激反应基因。11.实施例10的多核苷酸构建体,其中所述细胞应激反应基因是选自醇脱氢酶基因和热休克蛋白基因。12.实施例11的多核苷酸构建体,其中所述醇脱氢酶基因来自单子叶植物或双子叶植物。13.实施例12的多核苷酸构建体,其中所述醇脱氢酶基因是来自烟草、水稻、拟南芥(Arabidopsis )、大豆或玉米。14.实施例13的多核苷酸构建体,其中源自所述细胞基因的所述翻译增强子元件包含SEQ ID N0:4中所示的烟草醇脱氢酶的前导肽序列或者其功能性片段或变体,其中所述变体与SEQ ID NO:4中所示的序列具有至少95%的序列同一性。15.实施例13的多核苷酸构建体,其中源自所述细胞基因的所述翻译增强子元件包含SEQ ID NO:5中所示的水稻醇脱氢酶的前导肽序列或者其功能性片段或变体,其中所述变体与SEQ ID NO:5中所示的序列具有至少95%的序列同一性。16.实施例13的多核苷酸构建体,其中源自所述细胞基因的所述翻译增强子元件包含SEQ ID N0:6中所示的拟南芥醇脱氢酶的前导肽序列或者其功能性片段或变体,其中所述变体与SEQ ID NO:6中所示的序列具有至少95%的序列同一性。17.实施例13的多核苷酸构建体,其中源自所述细胞基因的所述翻译增强子元件包含SEQ ID NO:7中所示的玉米醇脱氢酶的前导肽序列或者其功能性片段或变体,其中所述变体与SEQ ID NO:7中所示的序列具有至少95%的序列同一性。18.实施例11的多核苷酸构建体,其中所述热休克蛋白基因来自单子叶植物或双子叶植物。
19.实施例18的多核苷酸构建体,其中所述热休克蛋白基因来自玉米、大豆或矮牵牛。20.实施例19的多核苷酸构建体,其中源自所述细胞基因的所述翻译增强子元件包含SEQ ID NO:5中所示的玉米热休克蛋白101的前导肽序列或者其功能性片段或变体,其中所述变体与SEQ ID NO:5中所示的序列具有至少95%的序列同一性。21.实施例1-20中任一项的多核苷酸构建体,其中所述有效连接的多核苷酸编码赋予表型的多肽,所述表型选自昆虫抗性、疾病抗性、除草剂抗性、非生物胁迫抗性、修饰的酶表达谱、改良的含油量及改良的营养含量。22.包含实施例1-21中任一项的多核苷酸构建体的表达盒。23.实施例22的表达盒,其中所述多核苷酸构建体有效连接至在植物细胞内是功能性的启动子,并且其中所述启动子选自组成型启动子、诱导型启动子和组织特异型启动 子。24.包含实施例I的多核苷酸构建体或实施例22的表达盒的植物。25.实施例24的植物,其中所述植物是单子叶植物或双子叶植物。26.实施例25的植物,其中所述植物选自水稻、大麦、马铃薯、甘薯、卡诺拉油菜、向日葵、黑麦、燕麦、小麦、玉米、大豆、甜菜、烟草、芒草、柳枝稷、红花、树、棉花、木薯、番爺、高粱、苜蓿和甘蔗。27.实施例24-26中任一项的植物,其中所述多核苷酸构建体或所述表达盒被稳定整合入植物基因组内,并且其中所述多核苷酸构建体有效连接至在植物细胞内是功能性的启动子。28.实施例24-27中任一项的植物细胞,其中所述细胞包括稳定整合入其基因组内的所述多核苷酸构建体或所述表达盒,并且其中所述多核苷酸构建体有效连接至在植物细胞内是功能性的启动子。29.实施例24-28中任一项的植物种子,其中所述种子包括稳定整合入其基因组内的所述多核苷酸构建体或所述表达盒,并且其中所述多核苷酸构建体有效连接至在植物细胞内是功能性的启动子。30. 一种增加目标多肽在植物或其植物部分中表达的方法,所述方法包括将多核苷酸构建体导入所述植物或所述植物部分中,所述多核苷酸构建体有效连接至在植物细胞内是功能性的启动子,其中所述多核苷酸构建体包括(a)至少一种源自病毒的翻译增强子元件,与至少一种源自细胞基因的翻译增强子元件串联堆叠,以及(b)编码所述目标多肽的有效连接的多核苷酸。31.实施例30的方法,其中所述病毒是植物病毒。32.实施例31的方法,其中所述病毒是RNA病毒。33.实施例32的方法,其中所述病毒为第IV组(+ ) ssRNA病毒的成员,并且其中源自所述病毒的所述翻译增强子元件包含所述病毒的前导肽序列(5’ UTR)。34.实施例33的方法,其中所述病毒为烟草花叶病毒(Tobamovirus)属的成员,或者选自马铃薯Y病毒科(Potyviridae)、雀麦花叶病毒科(Bromoviridae)和蕃爺丛矮病毒科(Tombusviridae)的科的成员。35.实施例34的方法,其中所述病毒选自烟草花叶病毒(TMV)、烟草蚀纹病毒(TEV)、苜蓿花叶病毒(AMV)和玉米坏疽线条病毒(MNeSV)。36.实施例35的方法,其中所述病毒为TMV,并且源自所述TMV的所述翻译增强子元件包含SEQ ID NO: I中所示的前导肽序列或者其功能性片段或变体,其中所述变体与SEQID NO: I中所示的序列具有至少95%的序列同一性。37.实施例35的方法,其中所述病毒为TEV,并且源自所述TEV的所述翻译增强子元件包含SEQ ID NO: 2或SEQ ID NO: 18中所示的前导肽序列或者其功能性片段或变体,其中所述变体与SEQ ID NO:2或SEQ ID NO: 18中所示的序列具有至少95%的序列同一性。38.实施例35的方法,其中所述病毒为AMV或^eSV,并且源自所述AMV或所述MNeSV的所述翻译增强子元件包含SEQ ID N0:3或SEQ ID NO: 19中所示的前导肽序列或者其功能性片段或变体,其中所述变体与SEQ ID N0:3或SEQ ID NO: 19中所示的序列具有至少95%的序列同一性。
39.任何实施例30-38的方法,其中所述细胞基因是应激反应基因。40.实施例39的方法,其中所述细胞应激反应基因选自醇脱氢酶基因和热休克蛋白基因组合物。41.实施例40的方法,其中所述醇脱氢酶基因来自单子叶植物或双子叶植物。42.实施例41的方法,其中所述醇脱氢酶基因来自烟草、水稻、拟南芥(Arabidopsis )、大豆或玉米。43.实施例42的方法,其中源自所述细胞基因的所述翻译增强子元件包含SEQ IDN0:4中所示的烟草醇脱氢酶的前导肽序列或者其功能性片段或变体,其中所述变体与SEQID NO:4中所示的序列具有至少95%的序列同一性。44.实施例42的方法,其中源自所述细胞基因的所述翻译增强子元件包含SEQ IDNO:5中所示的水稻醇脱氢酶的前导肽序列或者其功能性片段或变体,其中所述变体与SEQID NO:5中所示的序列具有至少95%的序列同一性。45.实施例42的方法,其中源自所述细胞基因的所述翻译增强子元件包含SEQ IDN0:6中所示的拟南芥(Arabidopsis)醇脱氢酶的前导肽序列或者其功能性片段或变体,其中所述变体与SEQ ID NO:6中所示的序列具有至少95%的序列同一性。46.实施例42的方法,其中源自所述细胞基因的所述翻译增强子元件包含SEQ IDNO:7中所示的玉米醇脱氢酶的前导肽序列或者其功能性片段或变体,其中所述变体与SEQID NO:7中所示的序列具有至少95%的序列同一性。47.实施例40的方法,其中所述热休克蛋白基因来自玉米、大豆或矮牵牛。48.实施例47的方法,其中源自所述细胞基因的所述翻译增强子元件包含SEQ IDNO:5中所示的玉米热休克蛋白101的前导肽序列或者其功能性片段或变体,其中所述变体与SEQ ID NO:5中所不的序列具有至少95%的序列同一性。49.实施例30-48中任一项的方法,其中所述有效连接的多核苷酸编码赋予表型的多肽,所述表型选自昆虫抗性、疾病抗性、除草剂抗性、非生物胁迫抗性、修饰的酶表达谱、改良的含油量及改良的营养含量。50.实施例30-49中任一项的方法,其中所述多核苷酸构建体有效连接至启动子,所述启动子选自组成型启动子、诱导型启动子和组织特异型启动子。51.实施例30-50中任一项的方法,其中所述植物是单子叶植物或双子叶植物。
52.实施例51的方法,其中所述植物选自水稻、大麦、马铃薯、甘薯、卡诺拉油菜、向日葵、黑麦、燕麦、小麦、玉米、大豆、甜菜、烟草、芒草、柳枝稷、红花、树、棉花、木薯、番爺、高粱、苜蓿和甘蔗。
53.实施例30-52中任一项的方法,其中所述多核苷酸构建体稳定整合至植物或其植物部分的基因组内。54.实施例30-53中任一项的方法,其中所述目标多肽在所述植物或其植物部分中的表达,与所述目标多肽在野生型植物或其植物部分中或者在对照植物或其植物部分中的表达相比较,增加到至少2倍。55.实施例54的方法,其中所述目标多肽在所述植物或其植物部分中的表达,与所述目标多肽在所述野生型植物或其植物部分中或者在所述对照植物或其植物部分中的表达相比较,增加到至少4倍。56. 一种多核苷酸构建体,包括(a)源自SEQ ID NO: I中所不的烟草花叶病毒(TMV) 5’ UTR的翻译增强子元件,与SEQ ID NO:4中所示的烟草醇脱氢酶5’ UTR串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸,其中所述多核苷酸构建体有效连接至在植物细胞内是功能性的启动子。57. 一种增加目标多肽在植物或其植物部分中表达的方法,所述方法包括导入一种多核苷酸构建体,其包括(a)源自SEQ ID NO: I中所示的烟草花叶病毒(TMV) 5’ UTR的翻译增强子元件,与SEQ IDNO:4中所示的烟草醇脱氢酶5’UTR串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸,其中所述多核苷酸构建体有效连接至在植物细胞内是功能性的启动子。59. 一种多核苷酸构建体,包括(a)源自SEQ ID NO:3中所述的苜蓿花叶病毒(AMV) 5’ UTR的翻译增强子元件,与SEQ ID NO:4中所示的烟草醇脱氢酶5’ UTR串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸,其中所述多核苷酸构建体有效连接至在植物细胞内是功能性的启动子。60. 一种增加目标多肽在植物或其植物部分中表达的方法,所述方法包括导入一种多核苷酸构建体,其包括(a)源自SEQ ID NO: 3中所述的苜蓿花叶病毒(AMV) 5’ UTR的翻译增强子元件,与SEQ ID N0:4中所示的烟草醇脱氢酶5’UTR串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸,其中所述多核苷酸构建体有效连接至在植物细胞内是功能性的启动子。61. 一种多核苷酸构建体,包括(a)源自SEQ ID NO: I中所不的烟草花叶病毒(TMV)5’UTR的翻译增强子元件,与SEQ ID NO: 7中所示的玉米须醇脱氢酶5’UTR串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸,其中所述多核苷酸构建体有效连接至在植物细胞内是功能性的启动子。62. 一种增加目标多肽在植物或其植物部分中表达的方法,所述方法包括导入一种多核苷酸构建体,其包括(a)源自SEQ ID NO: I中所示的烟草花叶病毒(TMV) 5’ UTR的翻译增强子元件,与SEQ IDNO: 7中所示的玉米须醇脱氢酶5’UTR串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸,其中所述多核苷酸构建体有效连接至在植物细胞内是功能性的启动子。63. 一种多核苷酸构建体,包括(a)源自SEQ ID NO: 18中所示的烟草蚀纹病毒(TEV) 5’ UTR的翻译增强子元件,与SEQ ID N0:4中所示的烟草醇脱氢酶5’ UTR串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸,其中所述多核苷酸构建体有效连接至在植物细胞内是功能性的启动子。64. 一种增加目标多肽在植物或其植物部分中表达的方法,所述方法包括导入一种多核苷酸构建体,其包括(a)源自SEQ ID NO: 18中所示的烟草蚀纹病毒(TEV)5’UTR的翻译增强子元件,与SEQ IDNO:4中所示的烟草醇脱氢酶5’UTR串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸,其中所述多核苷酸构建体有效连接至在植物细胞内是功能性的启动子。附图
简要说明图I显示了在表达盒内单独和串联堆叠的烟草花叶病毒(TMV) Q 5’前导肽和烟草醇脱氢酶(ADH) 5’前导肽对内切葡聚糖酶(EG)表达的影响。当将病毒5’前导肽(S卩Q) 置于细胞5’前导肽(即5’-ADH)上游时,可观察到表达的增强。检测了四种植物的各五种待测构建体(不包括对照载体在内),其中每个条形代表各植物的平均活性(X轴为EG活性(U mol/min/mg可溶性蛋白总量);y轴为各植物)。图2A-B也显示了在表达盒内单独和串联堆叠的烟草花叶病毒(TMV) Q 5’前导肽,也被称为“Q”及烟草醇脱氢酶(ADH)5’前导肽对内切葡聚糖酶(EG)表达的影响。图2A显示了以叶鲜重计的内切葡聚糖酶表达,而图2B则显示了以总可溶性蛋白计的内切葡聚糖酶表达。当将病毒5’前导肽序列(即Q )置于细胞5’前导肽序列(即5’ -ADH)的上游时,可观察到表达的增强。检测了三至四种植物的各五种受试构建体(X轴为EG活性(y mol/min/g或mg) ;y轴为各构建体)。序列表简要说明SEQ ID NO: I 为烟草花叶病毒(TMV) 5’ UTR。SEQ ID NO: 2 为烟草蚀纹病毒(TEV) 5’ UTR。SEQ ID NO: 3 为苜蓿花叶病毒(AMV) 5’UTR。SEQ ID NO:4 为烟草醇脱氢酶(ADH) 5’ UTR。SEQ ID NO:5 为水稻醇脱氢酶(ADH) 5’ UTR0SEQ ID NO:6 为拟南芥醇脱氢酶(ADH) 5’ UTR0SEQ ID NO:7 为玉米醇脱氢酶(ADH) 5’ UTR。SEQ ID N0:8 为玉米热休克蛋白 101 (HSP101) 5’UTR。SEQ ID NO:9 为玉米热休克蛋白 70 (HSP70) 5’ UTR0SEQ ID NO: 10 为矮牵牛热休克蛋白 101 (HSP101) 5’UTR。SEQ ID NO: 11 为大豆热休克蛋白 17. 9 (HSP17. 9) 5,UTR。SEQ ID NO: 12为洋丁香黄叶卷曲病毒启动子。SEQ ID NO: 13 为大豆 Kozak 序列。SEQ ID NO: 14为大豆球蛋白种子蛋白质CDS。SEQ ID NO: 15为大豆优化的内切葡聚糖酶CDS。SEQ ID NO: 16为大豆优化的ER滞留信号。SEQ ID NO: 17为花椰菜花叶病毒(CMV)终止子。SEQ ID NO: 18 为烟草蚀纹病毒(TEV) 5’ UTR。
SEQ ID NO: 19为玉米坏死线条病毒5’ UTR0SEQ ID NO: 20 为玉米 PEPC 启动子。SEQ ID N0:21为玉米Y -玉米醇溶蛋白信号序列。SEQ ID NO: 22 为玉米 Kozak 序列。SEQ ID N0:23为玉米优化的内切葡聚糖酶CDS。SEQ ID NO: 24为玉米优化的ER滞留信号。SEQ ID NO: 25 为玉米 PEPC 终止子。发明详细说明 本发明涉及增加目标多肽在植物或其植物部分中表达的组合物和方法。组合物包括多核苷酸构建体,其包含串联堆叠的病毒和细胞翻译增强子元件所组合物的,这些翻译增强子元件置于编码目标多肽的多核苷酸的上游(即5’端)且与之有效连接。与缺乏有效连接的、串联堆叠的病毒和细胞翻译增强子元件的多核苷酸构建体的多肽表达水平相比较,当整合入具有目标有效连接的启动子的表达盒时,串联堆叠的病毒和细胞翻译增强子元件提供相关mRNA转录体的翻译功效的增加,从而增加目标编码多肽的表达。因此,本文介绍了制造和使用具有目标多肽表达增加的转基因植物的组合物和方法,其中转基因植物包括包含多核苷酸构建体的组合物的表达盒,所述多核苷酸构建体具有至少两种串联堆叠的、与编码目标多肽的多核苷酸有效连接的翻译增强子元件,其中至少一种翻译增强子元件是病毒来源的,而至少一种翻译增强子元件为细胞来源的。本发明包括异源增强子的应用。本文所述的组合物和方法可用于植物或其植物部分中增加蛋白产量方面有保证的应用。这些应用包括但不限于改善植物农艺学性状的代谢途径基因操作,如增加的疾病抗性、除草剂抗性、营养利用和环境胁迫抗性;改变农艺性状的代谢途径基因操作,如改变能够提高动物和人体营养的淀粉、油、脂肪酸或蛋白质含量/组成的改良,提高消化率,和/或提高工艺品质;改变发育的代谢途径基因操作,如雄性不育症,衰老等;以及引入药物、工业酶等的转基因表达。多核苷酸构建体本发明涉及提供增加的目标多肽在植物或其植物部分中表达的多核苷酸构建体。本文所用术语“多核苷酸构建体”是指核苷酸的聚合物,如脱氧核糖核苷酸、核糖核苷酸,或其修饰形式,或其以个别片段形式,或以较大构建体的组分的形式,以单链或双链形式。如适用根据本发明所实践的方法目标,则多核苷酸应包括DNA或RNA的正义和反义多核苷酸序列。DNA或RNA分子可以是互补的DNA (cDNA)、基因组DNA、合成的DNA、或其杂交体,或RNA分子,如mRNA,其中包括非翻译和翻译区。本文所用术语“DNA构建体”、“基因构建体”、“多核苷酸”和“多核苷酸构建体”指的是DNA和RNA分子。本发明的多核苷酸构建体包括(a)至少一种病毒翻译增强子元件,与至少一种细胞翻译增强子元件串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸。本文所用术语“有效连接的”,当涉及与第二个核酸序列有效连接的第一个核酸序列时,是指第一个核酸序列被置于与第二个核酸序列的功能关系中的情况。例如,如果启动子影响了编码序列的转录,则该启动子与此编码序列有效连接。同样,如果信号肽影响了多肽的细胞外分泌,则该信号肽的编码序列与此多肽的编码序列有效连接。一般来说,有效连接的核酸序列是连续的,并在必要的情况下加入两个蛋白编码区,对开放阅读框架进行了序列比对。在本发明的多核苷酸构建体背景下,串联堆叠的翻译增强子元件与编码目标多肽的多核苷酸有效连接,因此功能上与其产生了相关性,其中串联堆叠的翻译增强子元件增加其相关的mRNA转录本的翻译,从而提高了所编码目标多肽的表达。虽然并不想被任何特定的理论束缚,然而,翻译的增加可以是由于串联堆叠的翻译增强子元件对mRNA初级转录本的加工、mRNA的稳定性、翻译效率,或其任何组合的影响。本文所用术语“翻译增强子元件”是指能够增强(即增加)编码目标多肽的多核苷酸翻译且置于编码目标多肽的多核苷酸上游(即相同核酸序列的5’方向)的多核苷酸。翻译增强子元件被转录成RNA作为完全加工好的mRNA转录体的一部分,但它不被翻译,并帮助(即促进)下游mRNA转录本的翻译,从而可增加所编码的目标多肽的表达。本发明的翻译增强子元件可以包括异源序列。异源序列是指非来源于所表达目标基因的前导肽序列的序列。
虽然不想要绑定到任何特定的理论,然而,据认为,翻译增强子元件能够补充反式 作用因子,例如RNA结合蛋白(如热休克蛋白)和其他诸如真核起始因子(eIF-1至4)在内的翻译起始因子、核糖体亚基,翻译延伸因子(例如,真核延伸因子(eEF-1或eEF-2))等,这些反式作用因子最终能够增强mRNA转录本的翻译。术语“翻译增强子元件”明确排除了顺式作用转录增强原件,如启动子、TATA盒、CAAT盒等。因此,在本发明的多核苷酸构建体内,串联堆叠的翻译增强子元件与本技术领域已知的串联堆叠的顺式作用转录元件相反,其中,后者能够用于多核苷酸构建体从而增加有效连接的、可转录目标多核苷酸的转录,例如,编码多肽或抑制性RNA分子(例如,诸如发夹结构RNAi样的干扰RNA)的多核苷酸。翻译增强子元件包括但不限于翻译前导肽序列(即5’UTR),和其中定位的元件或结构域,它们能够通过增强产生的mRNA转录本的翻译的能力而增加由有效连接的多核苷酸编码的多肽的表达。本文所用术语“翻译前导肽序列”、“5’UTR”、“前导肽序列”或“5’前导肽”是指来自或分离自基因组DNA (即基因)或mRNA上游调控区的多核苷酸,它开始于在编码序列的转录起始位点并恰好在编码序列的第一个翻译起始密码子(通常对于DNA序列为ATG,对于mRNA转录本则为AUG)之前终止。本领域技术人员也是指翻译前导肽序列,如“5’未翻译前导肽序列”或“5’非翻译前导肽序列”。出于本发明的目的,术语“翻译增强子元件”不应解释为仅指Kozak序列。本文所用术语“Kozak序列”、“Kozak共有序列”或“Kozak共有区”意指mRNA内围绕初始起始密码子(AUG)的短共有序列。根据699种脊椎动物的mRNA,Kozak建议在mRNA内功能性AUG密码子(加了下划线的共有序列)的情况下,(GCC) GCC (A/G) CCAUGG为共有序列(例如,参见Kozak 等(1987)核酸研究.(Nucleic Acids Res. ) 15(20):8125_8148)。Kozak 序列可由核糖体识别为翻译起始位点,从此位点蛋白质由其mRNA分子所编码,Kozak序列在翻译过程开始期间发挥着重要的作用(例如,参见De Angioletti等(2004),英国血液学杂志,(Br. J Haematol) 124(2) :224-231; Kozak (1984),自然(Nature) 308:241-246; Kozak (1986)细胞(Cell) 44 (2) :283-292))。对于病毒 mRNA,围绕着起始 AUG 的 Kozak 序列一般为 ACCAUGG,其中最一致的位置位于起始密码子(AUG)之前的三个核苷酸,且几乎总是在腺嘌呤(A)核苷酸。高等植物的mRNA含有一段富含AC的共有序列,即CAA(A/C)A_GCG。在被子植物的两个主要组之间,双子叶植物mRNA的AUG密码子上下游为AAA (A/C) AAUGGCU,这与高等植物的共有序列相似,而单子叶植物mRNA却以C (A/C) (A/G) (A/C) CAUGGCG作为共有序列,这显示了与Kozak提议的脊椎动物共有序列在总体上的相似性(例如,参见Joshi等(1997)植物分子生物学(Plant Mol.Biol)35:993-1001)o虽然核糖体需要Kozak序列(或该序列的变体)以起始翻译,然而,Kozak序列有别于核糖体结合位点(RBS)(即信使RNA或内核糖体进入位点(IRES)的5’帽)。因此,其中5’UTR的一部分或片段充当了本发明使用的翻译增强子元件的作用,该部分可以包括一段适当的Kozak序列,但不仅仅由Kozak序列组成。翻译增强子元件可从基因的基因组拷贝中分离。因此,例如,翻译前导肽序列,或其元件或结构域,可以从非编码的5’区(5’UTR)分离。备选地,翻译增强子元件,如增强翻译的翻译前导肽序列及其功能性元件或结构域,可以通过合成生产,或为操纵的非编码DNA元件。有益于实施本发明的翻译增强子元件是病毒或细胞来源的。任何给定的翻译增强子元件的长度会有所不同,但通常均低于约250个碱基对(bp)的长度,低于约225bp的长度,低于约200bp的长度,低于约175bp的长度,或低于约150bp,低于约125bp,低于约lOObp,低于约75bp,低于约50bp,或低于约25bp的长度,以及通常至少为约IObp的长度。在一些实施例中,任何给定翻译增强子元件的长度为约IObp至约250bp,包括例如约10bp、15bp、20bp、25bp、30bp、35bp、40bp、45bp、50bp、55bp、60bp、65bp、70bp、75bp、80bp、85bp、90bp、95bp、lOObp、105bp、I10bp、I15bp、120bp、125bp、130bp、135bp、140bp、145bp、150bp、155bp、160bp、165bp、170bp、175bp、180bp、185bp、190bp、195bp、200bp、205bp、210bp、215bp、220bp、225bp、230bp、235bp、240bp、245bp、250bp,或任何如介于约 IObp 和约 250bp 之间的长度。根据将被纳入本发明的多核苷酸构建体的天然翻译增强子元件或其片段的长度,与一个或多个其他翻译增强子元件串联堆叠的每个翻译增强子元件均应有相同的长度是不必要的,因为而事实上通常这些翻译增强子元件都具有不同的长度。本文所用术语“串联堆叠的”是指在本发明的多核苷酸构建体中,至少一种病毒翻译增强子元件和至少一种细胞翻译增强子元件是顺序或连续放置的(即按顺序一前一后)。 这与多核苷酸构建体内单独放置的病毒和细胞翻译增强子元件,或与多核苷酸构建体内彼此相互随机放置的病毒和细胞翻译增强子元件(例如,随机放置举例来说,其中病毒翻译增强子元件位于多肽编码序列的上游,而细胞翻译增强子元件则位于编码序列下游和/或编码序列内)相反。此外,至少一种病毒翻译增强子元件置于至少一种细胞增强子元件的上游(即5’端)。虽然病毒和翻译增强子元件优选直接彼此紧密相邻的(即无干扰性核苷酸位于病毒翻译增强子元件的3’端和细胞翻译增强子元件的5’端之间),但是公认的是,串联堆叠的翻译增强子元件可包括位于其各自多核苷酸构建体的3’和5’端之间的接头序列。当含有接头序列时,它可以高达多达30个核苷酸的单核苷酸,例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29 或 30 个核苷酸的长度。因此,在一些实施中,串联堆叠的翻译增强子元件可包含I至约30个核苷酸、I至约25个核苷酸、I至约20个核苷酸、I至约15个核苷酸、I至约10个核苷酸,或I至约5个核苷酸长度的接头序列。在其他实施例中,串联堆叠的翻译增强子元件可包含至少2个至高达约30个核苷酸,至少5个至高达约30个核苷酸,至少10个至高达约30个核苷酸,至少15个至高达约30个核苷酸,至少20个至高达约30个核苷酸,至少25个至高达约30个核苷酸,至少2个至高达约25个核苷酸,至少2个至高达约20个核苷酸,至少2个至高达约15个核苷酸,至少2个至高达约10个核苷酸,至少2个至高达约5个核苷酸,至少5个至高达约30个核苷酸,至少5个至高达约25个核苷酸,至少5个至高达约20个核苷酸,至少5个至高达约15个核苷酸,至少5个至高达约10个核苷酸,至少10个至高达约30个核苷酸,至少10个至高达约25个核苷酸,至少10个至高达约20个核苷酸,至少10个至高达约15个核苷酸,至少15个至高达约30个核苷酸,至少15个至高达约25个核苷酸,至少15个至高达约20个核苷酸,或至少20个至高达约25个核苷酸长度的接头序列。本发明特别关注的是病毒来源和细胞来源的翻译增强子元件。在一些实施例中,细胞翻译增强子元件是真核细胞来源的,包括例如动物或植物细胞来源。因此,本发明的多核苷酸构建体优选地包括(a)至少一种源自病毒的翻译增强子元件,与至少一种来源于细胞基因的翻译增强子元件串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸。本文所用术语“源自”是指翻译增强子序列是或者从天然产生的病毒或细胞基因的核酸序列获得(如分离得到),或者是从天然产生的病毒或细胞基因的核酸序列所设计(即“改造”)得到的。
任何已知病毒都可以作为在实施本发明的过程中所应用的翻译增强子元件来源而发挥作用。因此,例如,该病毒可以来自广泛范围的宿主,包括诸如细菌、真菌、植物、动物和昆虫。病毒可以是DNA病毒或RNA病毒。术语“DNA病毒”是指以DNA作为其遗传物质而采用依赖DNA的DNA聚合酶进行复制的病毒。DNA病毒的核酸可以是双链DNA (dsDNA),也可以是单链DNA (ssDNA)0术语“RNA病毒”是指以RNA作为其遗传物质的病毒。RNA病毒的核酸可以是单链RNA (ssRNA)或双链RNA (dsRNA)。RNA病毒可按照其RNA形成反义(negative-sense)(-)和正义(positive-sense) ( + )时的有义或极性,或双义RNA病毒而进一步分类。正义病毒RNA与病毒mRNA相同,因而可以由宿主细胞直接进行翻译。反义病毒RNA与mRNA互补,因而在翻译前应通过RNA聚合酶将其转换成正义RNA。双义(Ambisense)RNA病毒除了也翻译正链基因外,均相似于反义RNA病毒。因此,病毒翻译增强子元件可来源于任何病毒来源。在一些实施例中,病毒翻译增强子元件是来源于植物病毒的,即病毒的宿主生物是植物。在一些这样的实施例中,翻译增强子元件是来源于RNA植物病毒的。任何RNA植物病毒均可作为病毒翻译增强子元件的来源而发挥作用。目标RNA植物病毒包括但不限于根据巴尔的摩病毒分类系统而定义的第IV组病毒的成员。巴尔的摩分类系统根据病毒的核酸(DNA或RNA)、链型(单链或双链)、有义(即极性)以及复制方法而将病毒分为七个组。巴尔的摩第IV组病毒含有正义(+ )单链(ss)RNA基因组(简称为第IV组( + )ssRNA病毒)。第IV组(+ ) ssRNA植物病毒的实例包括但不限于雀麦花叶病毒科(Bromoviridae)、马铃薯Y病毒科(Potyviridae)和蕃爺丛矮病毒科(Tombusviridae)的科的植物病毒,以及烟草花叶病毒(Tobamovirus)属的植物病毒。雀麦花叶病毒科的示例性成员包括但不限于苜蓿花叶病毒(Alfamovirus)属、禽腮腺炎病毒(Anulavrius)属、等轴不稳环斑病毒(Ilarvirus)属、雀麦花叶病毒(Bromovirus)属、黄瓜花叶病毒(Cucumovirus)属和油橄榄潜隐病毒(Oleavirus)属的病毒。马铃薯Y病毒科的示例性成员包括但不限于马铃薯Y病毒(Potyvirus)属、黑麦草花叶病毒属(Rymovirus)属、大麦黄化花叶病毒(Bymovirus)属、橙桑花叶病毒(Macluravirus)属、甘薯病毒(Ipomovirus)属和小麦花叶病毒(Tritimovirus)属的病毒。蕃爺丛矮病毒科的示例性成员包括但不限于蕃爺丛矮病毒(Tombusvirus)属、磨香石竹斑驳病毒(Carmovirus)属、坏死病毒(Necrovirus)属、石竹病毒(Dianthovirus)属、玉米裡绿斑驳病毒(Machlomovirus)属、燕麦病毒(Avenavirus)属和帕尼科病毒(Panicovirus)属的病毒。然而,植物病毒分类正处于审查中,并且本病毒科和属成员列表的目的不是限制本发明实施过程中所使用的病毒翻译增强子元件 的植物病毒来源的范围,因为任何适当的来自RNA植物病毒的翻译增强子元件均可采用本文所述的方式用于本发明的实施。在一些实施例中,病毒翻译增强子元件来自第IV组(+ ) ssRNA病毒,所述病毒选自苜蓿花叶病毒(AMV ;雀麦花叶病毒科)、烟草线条病毒(TSV ;雀麦花叶病毒科)、雀麦花叶病毒(BMV ;雀麦花叶病毒科)、黄瓜花叶病毒(CMV ;雀麦花叶病毒科)、烟草蚀纹病毒(TEV ;马铃薯Y病毒科)、马铃薯Y病毒(PVY ;马铃薯Y病毒科)、黑麦草花叶病毒(马铃薯Y病毒科)、大麦黄花叶病毒(马铃薯Y病毒科)、橙桑花叶病毒(马铃薯Y病毒科)、甘薯轻型斑驳病毒(SPMMV ;马铃薯Y病毒科)、小麦条纹花叶病毒(WSMV ;马铃薯Y病毒科)、玉米坏死线条病毒(MNeSV ;蕃爺丛矮病毒科)、番爺丛矮病毒(TBSV ;蕃爺丛矮病毒科)、香石竹环斑病毒(CRSV;蕃茄丛矮病毒科)、红三叶草坏死花叶病毒(蕃茄丛矮病毒科)、甜三叶草坏死花叶病毒(蕃爺丛矮病毒科家庭)、烟草花叶病毒(TMV ;烟草花叶病毒属)、U2-烟草花叶病毒(T2MV ;烟草花叶病毒属)、番爺花叶病毒(ToMV ;烟草花叶病毒属)、黄瓜绿斑驳花叶病毒(CGMMV ;烟草花叶病毒属)、黄瓜病毒4 (CV4 ;烟草花叶病毒属)、鸡蛋花病毒(FV ;烟草花叶病毒属),蕃爺环斑病毒(0RSV ;烟草花叶病毒属)、长叶车前草花叶病毒(HRV ;烟草花叶病毒属)、太阳麻花叶病毒(SHMV ;烟草花叶病毒属)、甜菜坏死黄脉病毒(BNYVV ;暂时指定为烟草花叶病毒属)、绒毛烟草花叶病毒(NVMV;暂时指定为烟草花叶病毒属)、花生丛簇病毒(PCV ;暂时指定为烟草花叶病毒属)、马铃薯帚顶病毒(PMTV ;暂时指定为烟草花叶病毒属)和土传小麦花叶病毒(SBWMV ;暂时指定为烟草花叶病毒属)在内的组中筛选得到的。上述第IV组( + )ssRNA病毒的名单也仅仅是例证性地说明了本发明所采用的翻译增强子元件的病毒来源,而不是旨在限制本发明的范围。在本技术领域内,病毒来源的翻译增强子元件是众所周知的。例如,本发明的多核苷酸构建体可以包括与至少一种细胞翻译增强子元件串联堆叠的至少一种病毒翻译增强子元件,其中病毒翻译增强子元件可以包括微小核糖核酸病毒翻译前导肽序列,例如,脑心肌炎(EMCV) 5’前导肽(Elroy-Stein等(1989)美国科学院院刊(Proc. Natl.Acid. Sci. USA)86:6126-6130);马铃薯Y病毒翻译前导肽序列,如烟草蚀纹病毒(TEV)5’ 前导肽(Allison 等(1986)病毒学(Virology) 154:9-20 ;和 Gallie 等(1995)基因(Gene) 165:233-238);玉米矮花叶病毒(MDMV) 5’前导肽(Allison等(1986)病毒学(Virology) 154:9-20);马铃暮蚀刻病毒(PEV) 5’ 前导妝(Tomashevskaya 等(1993)遗传病毒学杂志(J. Gen. Virol) 74:2717-2724);马铃薯S病毒基因组RNA的翻译前导肽(Turner等(1999)病毒学文摘(Archives Virol) 144(7) : 1451-1461);苜蓿花叶病毒外壳蛋白mRNA的翻译前导肽序列(AMV RNA 45’ 前导肽)(Jobling 等(1987)自然(Nature) 325:622-625 ;美国专利号6,037,527);烟草花叶病毒(TMV) 5’前导肽(Gallie等(1987)核酸研究(Nucleic Acids Res. ) 15:3257-3273 ;Gallie 等(1988)核酸研究(Nucleic AcidsRes.) 16:883-893 ;Gallie 等(1992)核酸研究(Nucleic Acids Res.) 20:4631-4638 ;美国专利号5,489,527);玉米坏死线条病毒(MNeSv)5’前导肽(Louie等(2000)植物疾病(PlantDis. )84:1133-1139 ;SEQ ID NO: 19);和玉米褪绿斑驳病毒(MCMV) 5’ 前导肽(Lommel 等(1991)病毒(Virology)81:382-385)。人们认识到,RNA病毒来源的翻译增强子元件(例如,TMV 5’前导肽)可如这样使用,通过采用如T4RNA连接酶,将其连接至与包含细胞翻译增强子元件及有效连接的编码目标多肽的多核苷酸的多核苷酸所互补的适当mRNA转录本的上游而被用于制备本发明的多核苷酸构建体。优选地,本发明的多核苷酸构建体是专为在表达盒或表达载体中使用而设计的,在这种情况下,RNA病毒来源的翻译增强子元件以互补DNA的形式应用。可采用本技术领域内那些已知的传统方法获得RNA病毒翻译增强子元件的cDNA。在一些实施例中,RNA病毒翻译增强子元件的cDNA经化学合成而用于纳入表达盒或表达载体内。因此,就本发明的目的而言,包含病毒来源的翻译增强子元件的多核苷酸构建体包括RNA或翻译增强子元件的cDNA序列的存在。在本技术领域内,细胞基因的翻译增强子元件也是众所周知的,且可以从任何细 胞基因中获得。本文尤其令人感兴趣的是特定的宿主细胞内是高表达的细胞基因的翻译增强子元件。虽然不被任何理论或作用机制所束缚,来自高表达的基因的翻译增强子元件可以在较高的水平发挥功能。高表达的基因可定义为那些表达时可至少代表细胞的10%mRNA的基因。备选地,高表达的基因可以编码当表达时代表特定细胞或组织类型的超过1%总可溶性蛋白的蛋白质。在一些实施例中,高表达的基因可以用于编码当表达时代表特定细胞或组织类型的超过1%总可溶性蛋白,但同时无法代表细胞的至少10%mRNA的蛋白质。在一些实施例中,翻译增强子元件来源于细胞应激反应的基因,例如,包括动物或植物细胞应激反应基因。本文所用术语“应激反应基因”是指被对生物生长、发育或繁殖产生不良影响的外部条件所上调的基因。这些应激可以是生物的(由其他生物所实施的)或非生物的(因物理或化学环境过度或短缺而产生的,如过多或不足的太阳能、营养消耗、土壤含盐量、高(热和干旱)温和低(冷和冻)温、氧化应激,或污染(如重金属)。应激反应基因的实例包括但不限于醇脱氢酶基因、脱落酸(ABA)基因和热休克蛋白基因(参见美国专利号 7,109,033 ;Seki 等(2001)植物细胞(Pant Cell) 13:61-72 ;Seki 等(2002)功能和整合基因组学(Funct. Integr. Genomic.) 2:282-291 ;及 Seki 等(2002)植物杂志(PlantJ.) 31:279-292,其中各实例均通过引用而成为本文中的部分。因此,本发明的多核苷酸构建体可以包括与至少一种细胞翻译增强子元件串联堆叠的至少一种病毒翻译增强子元件,其中细胞翻译增强子元件可以包括来自醇脱氢酶(ADH)基因的翻译前导肽序列,例如,烟草ADH基因的翻译前导肽序列(NtADH 5’前导肽;Satoh 等(2004)生物科学和生物工程杂志(J. Bioscience Bioengineering) 98 (I) : 1-8),水稻ADH2基因的翻译前导肽序列(0sADH25’前导肽;Sugio等(2008)生物科学和生物工程杂志(J. Bioscience Bioengineering) 105 (3) :300-302),拟南芥 ADH 基因的翻译前导肽序列(AtADH5’前导肽;Sugio等(2008)生物科学和生物工程杂志(J. BioscienceBioengineering) 105 (3) :300_302),和玉米ADHl基因的翻译前导肽序列(ADH15’前导肽);和热休克蛋白(HSP)基因的翻译前导肽序列,例如玉米HSP101基因的翻译前导肽序列(HSP1015,前导肽;Nieto-Sotelo 等(1999)基因(Gene) 230:187-195),以及矮牵牛HSP70、大豆HSP17. 9和玉米HSP70基因的翻译前导肽序列,如美国专利号5,659,122和5,362,865所示,均以其整体通过引用而纳入为本文的部分)。其他合适的细胞转化增强子元件包括但不限于烟草光系统I基因PsaDb的翻译前导肽序列(psaDb 5’前导肽列;Yamamoto 等(1995)生物化学杂志(J. Biol. Chem.) 270 (21) : 12466-12470) ;Fed_15’ 前导肽(Dickey (1992)欧洲分子生物学学会杂志(EMB0J.) 11:2311-2317);和核酮糖二磷酸轻化酶小亚基(RbcS) 5’前导肽(SiIverthorne等(1990)植物分子生物学杂志(J. Plant.Mol. Biol.) 15:49-58)。因此,在本发明的一些实施例中,翻译增强子元件是翻译前导肽序列,包括但不限于上述翻译前导肽序列。虽然,在本发明的多核苷酸构建体中使用的翻译前导肽序列可以是全长、天然的(即自然发生的)5’ UTR序列,但是,人们认识到这些前导肽序列的功能片段和变体也可被用于实施所要求保护的本发明。因此,本文所述的天然翻译前导肽序列可以是不同的(例如,通过置换、插入或缺失而得到)或平截的(可在5’端和/或3’端),从而,只要不破坏其作为翻译增强子的功能,则这种功能就可以受到调控(即增加或减少),而其变体或平头(截)序列在与至少一种其他翻译增强子元件串联应用时,则保留了提高目标注多肽表达的能力。采用例如标准突变分析法,本领域技术人员可轻松确定易于改变(即置换、插入、缺失或平截)的天然翻译前导肽序列内那些区域或天然翻译前导肽那些代表功能片段的部分的识别。例如,参见Gallie等(1988),核酸研究(Nucleic Acids Res. ) 16
(3):883-893。因此,虽然下列讨论是指包括作为翻译增强子元件的全长、天然的翻译前导肽序列的多核苷酸构建体,但是所披露的各项实施例构想了这些翻译前导肽序列的功能性变体和片段的应用,其中这些变体和片段与本文其他处所述的定义相同。在本发明的一些实施例中,本发明的多核苷酸构建体包括(a)至少一个拷贝的烟草花叶病毒翻译前导肽序列(TMV 5’前导肽),与至少一种细胞翻译增强子元件串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸。TMV 5’前导肽,也称为Q,它是来自TMV基因组RNA的68个碱基对(bp)序列(例如,参见GalIie等(1987)核酸研究(NucIeic AcidsRes.) 15:8693-8711 ;Gallie 等(1987)核酸研究(Nucleic Acids Res.) 15:3257-3273)。Q的cDNA序列如SEQ ID NO: I中所不。该Q如导妝序列是闻度有序的8_喊基(5' -ACAAUUAC-3')同向重复的三个拷贝和27-碱基多聚(CAA)区(位于5’8-碱基同向重复和该重复序列的其他两个拷贝之间)的一个拷贝,含有72%的前导肽(Gallie (1996)转基因植物适用于工业和药用蛋白的生产系统(Transgenic Plants: A Production Systemfor Industrial and Pharmaceutical Proteins),第 1-3 节转基因设计的转录后控制”,Owen和Pen编辑(Wiley, Hoboken,新泽西州)。虽然四个不同的TMV株的5’未翻译前导肽序列在长度上有所不同,但是,它们均含有大约相当的重复和多聚(CAA)序列(Kukla等(1979)欧洲生物化学杂志(Eur. J. Biochem) 98:61-66 ;和Goelet等(1982)美国科学院院刊(Proc. Natl. Acad. Sci. USA) 79:5818-5822)。正如本文其他处所述的,TMV 5’前导肽的功能性变体和片段可用于本发明的多核苷酸构建体,且与至少一种细胞基因的翻译增强子元件串联堆叠时,仍能够目标多肽的表达增加。Q的功能分析已确定了多聚(CAA)区为增强有效连接的体内开放阅读框架的体内翻译的主要元件(Gallie 和 Walbot( 1992)核酸研究(Nucleic Acids Res.) 20:4631-4638 ;和 Gallie 等(1988)核酸研究(Nucleic Acids Res. ) 16:883-893)。在本技术领域内,Q前导肽序列的功能性变体和片段是众所周知的,且包括但不限于例如,缺失突变体QAl(缺乏SEQ ID NO: I的nt 2-9), Q A 2 (缺乏前8-碱基同向重复,对应于SEQID NO: I的nt12-19)、Q A3 (缺乏 27-bp 多聚(CAA)区的 nt 1-23,对应于 SEQ ID 顯1的扯 20-42)、Q A4 (缺乏第二个8-碱基同向重复,对应于SEQ ID NO: I的nt 47-54), Q A 5 (缺乏第三个8-碱基同向重复,对应于SEQ ID NO: I的nt 60-67),而变异序列指定为QA、C —U (将多聚(CAA)区替换成多聚(U)和QA —C (5’8-碱基同向重复的AUU序列的单碱基置换,以CUU替换AUU)。虽然Q A 3缺失突变体和变体Q A、C — U序列是功能性的,优选地,多聚(CAA)区保留在Q前导肽序列的片段或变体内,以最大限度地提高翻译增强子元件所提供的翻译功效。例如,参见Gallie等(1988),同上。在另一些实施例中,本发明的多核苷酸构建体包括(a)至少一个拷贝的烟草蚀纹病毒翻译前导肽序列(TEV 5’前导肽),与至少一种细胞翻译增强子元件串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸。烟草蚀纹病毒(TEV)是马铃薯Y病毒,它是感染植物的正链RNA病毒的小核糖核酸病毒超群的成员。TEV的基因组RNA是多聚腺苷酸mRNA,这种mRNA天然缺乏5’帽子结构,但仍然有效翻译。143个碱基对(bp)的TEV 5’前导肽(如SEQ ID NO: 2所示)足以赋予mRNA帽非依赖性的翻译能力(Carrington和 Freed (1990)病毒学杂志(J. Virology)64:1590 - 1597 ;Gallie (2001)病毒学杂志 (J. Virology) 75:12141-12152),并在功能上类似于“帽”,因为它能够与多聚(A)尾相互作用以促进翻译(Gallie等(1995)基因(Gene) 165:233-238)。两个143bp TEV 5’前导肽内的位于中心的帽独立调控元件(CIRE)都必须介导帽独立的翻译,而且,当用作单独的翻译前导肽时,两者都需要与多聚(A)尾进行功能上的相互作用以促进最有效的翻译(Ni印el和 Gallie (1999)病毒学杂志(J. Virology) 73:9080-9088)。这些 CIRE 置于 SEQ ID NO: 2的 nt 28-65 (CIRE-I)和 nt 66-118 (CRIE-2)内。据报道,这种功能性的TEV 5’前导肽有144-bp长(参见Carrington和Freed(1990)同上),其中该序列与SEQ ID N0:2所示的序列是相同的,但包括在SEQ ID N0:2的位置I前插入的胸腺嘧啶(T)核苷酸(参见如SEQ ID NO: 18所示的144_bp序列)。因此,144-bp的TEV 5’前导肽在其5’端有如下五个(5)核苷酸5’-taaat-3’,与SEQ ID NO: 2中所示的143-bp TEV 5’前导肽的起始五个核苷酸(即5’-aaata-3’)相反。上述CIRE的定位以及下列关于TEV前导肽变体和片段的讨论是关于如SEQ ID N0:2中所示的143-bp序列的。人们公认的是,如上述CIRE及下列变体和片段所述的143-bp序列内的核苷酸(nt)位置,可以在144-bp序列中鉴定,通过调整其位置以考虑在如SEQ ID NO:2中所示的143_bp序列的5’端进行单独的核苷酸插入。因此,例如,其中CIRE-I放置在SEQ ID NO:2的nt28-65之内,144bp TEV 5’前导肽内的相应位置位于SEQ ID勵18的社29-66处。可以理解的是,144bp的TEV 5’前导肽也可以被用作本发明的多核苷酸构建体内的病毒翻译增强子元件的来源。因此,TEV前导肽的变体和片段可用于本发明的多核苷酸构建体中,只要它们至少包含这些CIRE之一,优选的是这些CIRE中的两种。在本技术领域内,TEV前导肽的功能性片段是众所周知的,且包括但不限于缺失突变体TEV28_143 (缺乏SEQ ID N0:2的nt1-27)、TEVh18 (缺乏 SEQ ID NO:2 的 ntll9_143)、TEV28_118 (缺乏 SEQ ID N0:2 的 nt 1-27和 119-143)、TEV1-J55 (缺乏 SEQ ID NO:2 的 nt66_143)、TEV66_143 (缺乏 SEQ ID N0:2 的 nt1-65)、TEV28_65 (缺乏 SEQ ID NO:2 的 nt 1-27 和 66-143),以及 TEV66^118 (缺乏 SEQ ID NO:2的nt 1-65)。例如,参见Ni印el和Gallie (1999),同上。
然而,在其他实施例中,本发明的多核苷酸构建体包括(a)至少一个拷贝的苜蓿花叶病毒的外壳蛋白(CP)mRNA翻译前导肽序列(AMV RNA 45’前导肽),与至少一种细胞翻译增强子元件串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸。该36-碱基对的AMVRNA 45’前导肽如SEQ ID NO:3所示。至于其他翻译增强子元件,本发明的多核苷酸构建体可以包括AMV RNA 45’前导肽的功能性变体和片段,如其他处所定义的相同。在其他实施例中,本发明的多核苷酸构建体包括(a)至少一个拷贝的玉米坏死线条病毒的翻译前导肽序列(丽eSV 5’前导肽),与至少一种细胞翻译增强子元件串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸。该122-碱基对的丽eSV 5’前导肽如SEQ IDN0:19所示。至于其他翻译增强子元件,本发明的多核苷酸构建体可以包括MNeSV 5’前导肽的功能性变体和片段,如其他处所定义的相同。在其他实施例中,本发明的多核苷酸构建体包括(a)至少一种病毒翻译增强子元件,与至少一种醇脱氢酶基因的翻译增强子元件串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸。在本技术领域内,醇脱氢酶基因的翻译增强子元件是众所周知的,包括但不限于烟草ADH基因的84-bp翻译前导肽序列(NtADH 5’前导肽),如SEQ ID N0:4所述;水稻ADH2基因的翻译前导肽序列(0sADH25’前导肽,如SEQ ID NO: 5所示;拟南芥ADH基因的翻译前导肽序列(AtADH 5’翻译前导肽),如SEQ ID N0:6所示;玉米醇脱氢酶基因的翻译前导肽序列(ADH 5’前导肽)JBSEQ ID NO: 7所述,或其功能性变体或片段。在其他实施例中,本发明的多核苷酸构建体包括(a)至少一种病毒翻译增强子元件,与至少一种热休克蛋白(HSP)基因的翻译增强子元件串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸。在本技术领域内,热休克蛋白基因的翻译增强子元件是众所周知的,包括但不限于玉米HSPlOl基因的翻译前导肽序列(HSP1015’前导肽),如SEQ IDNO: 8所示;和玉米HSP70、矮牵牛HSP70和大豆HSP17. 9基因的翻译前导肽序列,分别如SEQID N0:9、10和11所示(例如,参见美国专利号5,659,122和5,362,865,以其整体通过引用而成为本文的一部分);或其功能性变体或片段。
因此,在一些实施例中,本发明提供的多核苷酸构建体包括选自分别如SEQ IDNO :1、2 (或18),3和19所示的TMV、TEV, AMV RNA4和MNeSV 5’前导肽的至少一种翻译增强子元件,与选自分别如SEQ ID NO :4、5、6和7所示的烟草、水稻、拟南芥和玉米ADH 5’前导肽的至少一种翻译增强子元件串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸。在一些这样的实施例中,本发明的多核苷酸构建体包括如SEQ ID NO: I所示的TMVQ 5’前导肽(或其功能性片段或变体,如下所述),与如SEQ ID N0:4所示的烟草ADH5’前导肽(或其功能性片段或变体,如下所述)串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸。在其他实施例中,本发明提供的多核苷酸构建体包括选自分别如SEQ ID NO 1,2(或18)、3和19所示的TMV、TEV、AMV和^eSV 5’前导肽的至少一种翻译增强子元件,与选自分别如SEQID NO :8、9、10和11所示的玉米HSPlOl基因、玉米HSP70基因、矮牵牛HSP70基因和大豆HSP17. 9基因的5’前导肽的至少一种翻译增强子元件串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸。在一些这样的实施例中,本发明的多核苷酸构建体包括如SEQ IDN0:1所示的TMV Q 5’前导肽(或其功能性片段或变体,如下所述),与如SEQ IDN0:8所示的玉米HSP1015’前导肽(或其功能性片段或变体,如下所述)串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸。
如上所述,病毒或细胞5’ UTR的功能性片段和变体可被用作本发明的多核苷酸构建体内的翻译增强子元件。本文所用术语“功能性”是指这样的片段或变异的核酸序列,其在本发明的多核苷酸构建体内,当与其他翻译增强子元件(这也可以是全长的5’UTR的片段或变体)串联堆叠时,能够提供目标多肽的表达增加。本文所用术语“片段”是指所关注5’UTR的任何部分。5’UTR的片段可以介于至少约10个连续核苷酸,至长达全长5’UTR所含有的核苷酸数之间。因此,在一些实施例中,5’^1 的片段是至少约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、240、245、250个连续核苷酸长,或介于约5个连续核苷酸至长达仅比5’UTR全长少一个核苷酸之间的任意值。因此,举例来说,其中病毒翻译增强子元件是TMV 5'UTR( Q ;参见SEQ ID N0:1)、TEV 5’UTR (SEQ ID NO: 2 或 SEQ ID NO: 18)、AMV 5’UTR (SEQ ID NO: 3)或 MNeSV 5’UTR,此序列的片段可以串联连接至任何细胞翻译增强子元件,只要它是功能性的,即在本发明的多核苷酸构建体内,当与至少一种细胞翻译增强子元件串联堆叠时,能够提供目标多肽 的表达增加。就Q而言,这样的片段可以包含至少约5、10、15、20、25、30、35、40、45、50、55、60、65个或至多比全长Q序列中含有的少一个核苷酸长度的核苷酸(即,至多长达如SEQID NO: I所述的68个核苷酸中的67个连续核苷酸)。就TEV 5’UTR而言,这样的片段可以包含至少约 5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140个或至多比全长TEV5’UTR序列少一个核苷酸长度的核苷酸(即,至多长达如SEQ ID NO:2所述的143个核苷酸中的142个连续核苷酸;或至多长达如SEQ ID NO: 18所示的144个核苷酸中的143个连续核苷酸)。就AMV 5’UTR而言,这样的片段可以包含至少约5、10、15、20、25、30个或至多比全长TEV 5’UTR序列少一个核苷酸长度的核苷酸(即,至多长达如SEQ ID N0:3所示的36个核苷酸中的35个连续核苷酸)。就MNeSV 5’UTR 而言,这样的片段可以包含至少约 5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120 个或至多比全长 MNeSV 5,UTR 序列少一个核苷酸长度的核苷酸(即,至多长达如SEQ ID NO: 19所示的122个核苷酸中的121个连续核苷酸)。同样,举例来说,其中细胞翻译增强子元件是烟草ADH 5’UTR(参见SEQ ID N0:4)、水稻 ADH25’UTR(参见 SEQ ID NO: 5)、拟南芥 ADH 5’UTR(参见 SEQ ID NO: 6)、玉米 ADH5’UTR(参见SEQ ID N0:7)、玉米热休克蛋白101 (HSPlOl) 5’UTR (参见SEQ ID N0:8)、玉米热休克蛋白70 (HSP70) 5'UTR (参见SEQ IDN0:9)、矮牵牛热休克蛋白70 (HSP70) 5'UTR (参见SEQ ID NO: 10)或大豆热休克蛋白17.9 (HSP17. 9)5’UTR (参见SEQ ID NO: 11),此序列的片段可以串联连接至病毒翻译增强子元件,只要它是功能性的,即在本发明的多核苷酸构建体内,当与至少一种病毒翻译增强子元件串联堆叠时,能够提供目标多肽的表达增加。就烟草ADH 5’UTR而言,这样的片段可以包含至少约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80个或至多比全长烟草ADH5’UTR序列少一个核苷酸长度的核苷酸(即,至多长达如SEQ ID N0:4所示的84个核苷酸中的83个连续核苷酸)。就水稻ADH25’UTR而言,这样的片段可以包含至少约 5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95个或至多比全长水稻ADH25’ UTR序列少一个核苷酸长度的核苷酸(即,至多长达如SEQIDN0:5所示的101个核苷酸中的100个连续核苷酸)。就拟南芥ADH 5’UTR而言,这样的片段可以包含至少约5、10、15、20、25、30、35、40、45、50、55个或至多比全长拟南芥ADH 5’UTR序列少一个核苷酸长度的核苷酸(即,至多长达如SEQ ID NO:6所不的58个核苷酸中的57个连续核苷酸)。就玉米ADH 5’^1 而言,这样的片段可以包含至少约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105 个或至多比全长玉米 ADH 5’UTR 序列少一个核苷酸长度的核苷酸(即,至多长达如SEQ ID NO:7所示的107个核苷酸中的106个连续核苷酸)。就玉米HSP1015’UTR而言,这样的片段可以包含至少约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200 个或至多比全长玉米 HSP1015’UTR 序列少一个核苷酸长度的核苷酸(即,至多长达如SEQ ID NO:8所示的206个核苷酸中的205个连续核苷酸)。就玉米HSP705’UTR而言,这样的片段可以包含至少约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105 个或至多比全长玉米 HSP705’UTR 序列少一个核苷酸长度的核苷酸(即,至多长达如SEQ ID NO:9所示的107个核苷酸中的106 个连续核苷酸)。就矮牵牛HSP705’UTR而言,这样的片段可以包含至少约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90 个或至多比全长矮牵牛 HSP705’UTR 序列少一个核苷酸长度的核苷酸(即,至多长达如SEQ ID NO: 10所示的96个核苷酸中的95个连续核苷酸)。就大豆HSP17. 95’UTR而言,这样的片段可以包含至少约5、10、15、20、25、30、35、40、45、50、55、60、65、70个或至多比全长大豆HSP17. 95’UTR序列少一个核苷酸长度的核苷酸(即,至多长达如SEQ ID NO: 11所示的72个核苷酸中的71个连续核苷酸)。本文所用,5’ UTR的“变体”是指拥有与所述5’ UTR核苷酸序列(如SEQ ID NO: 1、2、3、4、5、6、7、8、9、10、11、18或19中所示的5’^10或其片段的基本上相似性的序列。就5’^'1 而言,诸如此类天然发生的变体可以采用众所周知的分子生物学技术而进行鉴定,例如,采用PCR和杂交技术。变体核苷酸序列还包括应用合成法得到的核苷酸序列,例如,通过采用定点诱变所生成的,其中的技术也是本技术领域内众所周知的。例如,参见Sambrook等,分子克隆实验室手册(Molecular Cloning:A Laboratory Manual)(冷泉港实验室出版社,Plainview,纽约 2001)和分子生物学最新实验方案(Current Protocols in MolecularBiology) (Ausubel等编著,格林出版社和Wiley-Interscience,纽约1995);上述以其整体通过引用而纳入为本文的一部分。一般来说,包括SEQ ID NO: 1-11,18和19中任何的变体的特定5’ UTR的变体,通过如下所述的使用默认参数的序列比对方案所确定的,与特定核苷酸序列应有至少约40%、50%、60%、65%、70%,一般至少有约 75%、80%、85%,更优选地至少有约 90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。所关注的5’ UTR的变体应为功能性的,即在本发明的多核苷酸构建体内,当与其他翻译增强子元件(这也可以是全长的5’ UTR的片段或变体)串联堆叠时,能够提供目标多肽的表达增加的变体。生物活性的变体包括例如天然或天然生成的5’ UTR,其拥有一个或多个核苷酸置换、缺失或插入。在本文中两个核酸序列的上下文中所用的“序列同一性”或“同一性”是指当比较特定比对窗的最佳对应性时为相同的这两个序列中的核苷酸。本文所用“比对窗”是指多核苷酸序列的连续、指定片段,其中对两个序列的最佳比对而言,与参照序列(它不包括增加或缺失)相比较,在比对窗内的多核苷酸序列可包括增加或缺失(即空位)。一般来说,比对窗至少有20个连续核苷酸的长度,并人选地是30、40、50、100个还是更长的核苷酸。在本技术领域内,用于比较的序列比对的方法是众所周知的。因此,确定任何两段序列之间的百分序列同一性可以通过采用数学算法来完成。这样的数学算法的非限制性实例是Myers和Miller的算法(1988) CABIOS 4:11-17 ;Smith等的局部对比算法(1981)高级应用数学(Adv. Appl. Math. ) 2:482 ;Needleman和Wunsch的总体对比算法(1970)分子生物学杂志(J. Mol. Biol. )48:443-453 ;Pearson和Lipman的局部对比搜索法(1988)美国科学院院刊(Poc. Natl. Acad. Sci) 85:2444-2448 ;Karlin 和 Altschul 算法(1990)美国科学院院刊(Proc. Natl. Acad. Sci. USA) 87:2264,由 Karlin 和 Altschul 修正(1993)美国科学院院刊(Proc. Natl. Acad. Sci. USA) 90:5873-5877。这些数学算法的计算机实现可以被用于对比序列,以确定序列同一性。这些实现包括但不限于PC/基因程序的CLUSTAL (Intelligenetics提供,Mountain View,加利福尼亚州);ALIGN程序(第2. 0版)和第10版GCG威斯康星遗传学软件包的GAP、BESTFIT、BLAST、FASTA和TFASTA (Accelrys公司提供,圣地亚哥,加利福尼亚州)。采用这些程序的 比对都可以使用默认参数。本发明的多核苷酸构建体的装配及其在目标表达盒内的插入可以采用本技术领域内众所周知的基因工程技术来完成。例如,参见Sambrook等(2001)同上;和Ausubel等,同上。此外,用于制备适合将多核苷酸构建体导入植物的重组载体的方法也是本技术领域内众所周知的。本文所用术语“载体”、“构建体”、“载体构建体”是指任何重组多核苷酸构建体,它可以被用于植物转化的目的,即向宿主植物细胞导入异源多核苷酸。例如,参见美国专利号 4,971,908、4,940,835,4, 769,061 和 4,757,011 所述的载体;Rodriguez,载体分子克隆载体及其应用调查(Butterworths,波士顿1988) ;Glick等,植物分子生物学和生 物技术方法(Methods in Plant Molecular Biology and Biotechnology) (CRC 出版社1993);和Ausubel等(1995),同上;和Sambrook等(2001),同上)。有益于向植物导入核酸的典型构建体在本技术领域内是众所周知的,它包括来自根癌土壤杆菌肿瘤诱导(Ti)型质粒的载体(Rogers 等(1987)酶学方法(Meth. Enzymol). 153:253-277)。本发明的多核苷酸构建体可被用于瞬时测定,以评估串联堆叠的翻译增强子元件对目标多肽表达的影响。例如,可采用本技术领域内那些众所周知的标准方法,构建由有效连接至编码目标多肽的mRNA转录本上的串联堆叠的病毒和细胞翻译增强子元件的mRNA,例如,通过相应cDNA的体外转录,而可将产生的mRNA导入目标植物细胞,其中可对mRNA的翻译进行监测。例如,参见Gallie等的瞬时分析(1987)核酸研究(Nucleic AcidsRes. ) 15:8693-8711,以及 Jobling 和 Gehrke (1987)自然(Nature) 325:622-625。在其他实施例中,可将本发明的多核苷酸构建体纳入表达盒内,并导入目标植物,用于瞬时或稳定体内转录及编码的目标多肽的翻译。表达盒本发明的多核苷酸构建体可以有效连接至调控元件上,而该调控元件提供了编码目标多肽的有效连接的多核苷酸的表达。在这种方式下,本发明提供的表达盒和表达载体包含本发明的多核苷酸构建体,它包括(a)至少一种病毒翻译增强子元件,与至少一种源自细胞基因的翻译增强子元件串联堆叠,以及(b)编码目标多肽的有效连接的多核苷酸。本文所用术语“表达盒”是指能够介导目标核苷酸序列在适当宿主细胞内表达的核酸分子,从而包括有效连接至目标多核苷酸序列的5’和3’调控序列(即本发明的多核苷酸序列)。配置表达盒内有效连接的元件,以便在它们之间能够产生功能性连接,从而表达盒内的各元件能够完成其预期的功能。有效连接的元件可以是连续的,也可以是非连续的。本发明的表达盒包括本发明的多核苷酸构建体,因而是嵌合构建体,即它们的至少一种组分的核酸序列相对于它们的至少一种其他组分的核酸序列是异源的(即外源或非同时天然发生的)。因此,例如,串联堆叠的病毒和细胞翻译增强子是彼此异源的,因为它们来自于不同的来源(即病毒对比细胞)。在类似方法下,调控区,例如启动子,可以对目标多肽的编码来说是异源的。人们同时认识到,本发明的表达盒内,一个或多个个别组分对表达盒内的另一个组分可以是天然的。例如,该启动子对所编码的目标多肽而言可以是天然生成的启动子,虽然这两种组分均没有出现在其天然配置中。本发明的表达盒是与所导入的植物细胞呈异源性的,即表达盒的具体DNA序列不在宿主植物细胞内天然出现,而必须通过转化事件而被导入宿主植物细胞或宿主植物细胞 前身内。在任何情况下,表达盒内的任何一个或多个个别组分可以对植物宿主是天然的(即组分自身的核苷酸序列能够以植物宿主基因组内天然发生的序列形式出现)或可以对植物宿主是异源的(即组分自身的核苷酸序列对植物宿主是外源的,或者是以不同的生物体形式,或者是其原有形式的基因改造的形式,例如,通过核苷酸置换、插入、缺失和/或平截)。本发明的表达盒内使用的示例性调控序列包括但不限于启动子序列、多聚腺苷酸信号、转录终止序列、上游调控域、复制起始点、内部核糖体进入位点(“IRES”)、其他翻译增强子(例如,3’UTRs)等,这些共同提供了有效连接的目标多核苷酸的复制和转录,以及在目标受体植物细胞内其任何编码序列的翻译。只要目标多核苷酸能够被复制、转录,并在受体植物细胞内翻译,则并非所有这些控制序列都需要始终存在。因此,调控序列可以是DNA的调控区,它通常包括能够介导RNA聚合酶II的TATA盒,以在对于特定编码序列的适当转录起始位点起始RNA的合成。表达调控序列可以额外地包含一般放置在TATA盒上游或5’端的其他识别序列,它影响着(例如,增强)转录起始速率。此外,表达调控序列可以额外包含一般放置在TATA盒下游或3’端的其他序列,它影响着转录起始速率。本发明的表达盒通常包括5’-3’方向的、在植物内是功能性的转录启动子,本发明的有效连接的多核苷酸构建体,以及有效连接的、在植物内是功能性的翻译终止区。在一些实施例中,表达盒包含用于稳定转化子筛选的选择性标记基因。备选地,选择性标记可通过相同载体或不同载体上的额外表达盒而提供。只有当宿主细胞暴露在某些特定的外部刺激下时,表达盒中多核苷酸构建体的表达才可在起始转录的组成型启动子或诱导型启动子的控制下进行。此外,启动子还可以对特定的组织或器官或者发育阶段是特异性的。表达盒也可以包含至少一种额外目标多核苷酸(如,另外的目标多肽的编码序列),以将其共转化入目标植物体内。备选地,额外目标的多核苷酸可通过在相同载体或不同载体上的多重表达盒而提供。本发明的表达盒拥有多个用于插入处于调控区的转录调控下的本发明的多核苷酸构建体的限制酶切位点和/或重组位点。在植物细胞内是功能性的任何启动子(即能够驱动植物细胞内有效连接的可转录多核苷酸的表达)可以有效连接至本发明的多核苷酸构建体。启动子可以是对于多核苷酸构建体的编码区是天然的(即天然发生的)启动子,或可以是对于多核苷酸构建体的编码区是异源的(即外源的或非天然发生的)启动子。凡启动子不是对于多核苷酸构建体编码区是天然产生的启动子,则可以会由于天然发生的启动子序列和/或天然发生的编码序列的遗传操作而成为异源的(例如,通过在天然发生的启动子和/或编码序列内核苷酸的置换、插入、缺失和/或平截),或者也可以是由于其最初的遗传来源而是异源的(例如,来自另一个基因和/或其他生物体的启动子)。在一些实施例中,启动子对于多核苷酸构建体的编码区是天然的启动子,而两个序列对于导入表达盒的植物宿主而言均是天然的(即启动子和编码序列都源自同一个基因,该基因在植物宿主内是天然存在的)。备选地,启动子对于多核苷酸构建体的编码区是天然的启动子,但两种序列对于导入表达盒的植物宿主是异源的(即外源的或非天然发生的)(即启动子和多核苷酸构建体的编码序列对于植物宿主均是外源的,例如是按照其原始序列的遗传操作来说,或者按照来自另外的遗传来源而言)。然而,在其他实施例中,启动子对于编码序列是异源的,并且对于植物宿主是天然的(即,启动子源自于植物宿主的基因),或者对于植物 宿主是外源的(即,其原始序列已被操作,或者来自另一个遗传来源)。上述启动子、编码序列和导入本发明的表达盒的植物宿主之间的关系(即异源的对比天然的)并非旨在限制,但在本质上仅仅是示范的目的。纳入本发明的表达盒的启动子选择取决于多种因素,包括但不限于功效、选择性性、诱导性、目标多肽的所需表达水平以及多肽的细胞或组织优选表达。作为本技术领域一种常规的技能方式是通过适当选择和放置启动子和其他相对于其序列的调控区来调节有效连接的多核苷酸序列的表达。例如,鉴定和表征植物基因组DNA启动区的方法包括例如 Jordano 等(1989)植物细胞(Plant Cell) 1:855-866 ;Bustos 等(1989)植物细胞(Plant Cell) 1:839-854 ;Green 等(1988) EMBO 杂志(EMBO J), 7:4035-4044 ;Meier等(1991)植物细胞(Plant Cell) 3,309-316 ;以及 Zhang 等(1996)植物生理学(PlantPhysiology)110:1069-1079。用于本发明的多核苷酸构建体表达的启动子可以是包含下述元件的强的植物启动子、病毒启动子或嵌合启动子来自任何基因的TATA盒(或基于植物基因TATA盒的分析而合成的),任选地融合至植物启动子TATA盒的5'区(其涉及组织和时空适当的基因表达),任选地融合至I个或多个增强子(如花椰菜花叶病毒(CaMV) 35S增强子、FMV增强子、CMP增强子、RUBISC0小亚基增强子、质体蓝素增强子(例如,参见Chua等(2003)植物细胞(Plant Cell) 15 (6) : 1468-1479),以及来自根癌土壤杆菌章鱼碱合酶基因的激活元件(参见美国专利号5,955,646)。备选地,弱的植物启动子可以用来改变目标植物宿主细胞中的基因沉默的效应。因此,例如,其中宿主植物细胞内目标目标多肽的表达受到了诸如反义或发夹RNA干扰的基因抑制技术的抑制,本发明的多核苷酸构建体包含有效连接至目标多肽编码序列的串联堆叠的翻译增强子元件,它可以有效连接至弱启动子,并可通过任何本技术领域内已知的方法导入植物宿主细胞内,以提供目标多肽的低水平表达。在本发明的这些实施例中,“弱启动子”是能够提供目标多肽的有效连接的编码序列低水平表达的启动子。然而,人们已经认识到,弱启动子可以是在植物宿主内仅能够在少数细胞内提供有效连接的编码序列表达,而在其他细胞内仅能提供总体较低水平的目标多肽表达的那些启动子。弱植物启动子可以是天然发生或可以代表了天然发生的启动子序列的变体,其经过修饰能够降低目标多肽有效连接的编码序列的表达水平,或天然发生启动子序列的平截版本,能够提供降低表达的目标多肽。弱启动子的例子包括例如Rsyn7启动子的核心启动子(WO 99/43838和美国专利号6,072,050)、CaMV 35S核心启动子等。在一些实施例中,本发明的多核苷酸构建体的组成型表达是所希望的。组成型启动子提供有效连接的多核苷酸构建体的了无调控的,从而连续的表达。示例性组成型启动子包括例如Rsyn7启动子和WO 99/43838和美国专利号6,072, 050中披露的其他组成型启动子的核心启动子;CaMV 35S核心启动子(Odell等(1985)自然(Nature) 313:810-812);水稻肌动蛋白启动子(McElroy等(1990)植物细胞(Plant Cell) 2:163-171);泛素启动子(Christensen 等(1989)植物分子生物学(Plant Mol. Biol. ) 12:619-632 ;以及Christensen 等(1992)植物分子生物学(Plant Mol. Biol. ) 18:675-689) ;pEMU (Last等(1991)理论与应用遗传学(Theor. Appl. Genet. ) 81:581-588) ;MAS (Velten 等(1984)EMBO杂志(EMBO J) 3:2723-2730) ;ALS启动子(美国专利号5,659,026)等。其他组成型启动子包括,例如,美国专利号 5,608,149 ;5, 608, 144 ;5,604,121 ;5,569,597 ;5,466,785 ;5,399,680 ;5,268,463 ;5,608,142,以及 6,177,611 ;7,256,276 ;7,550,578 所披露的启动子,其中披露内容以其整体通过引用而成为本文的一部分。
适当的植物或嵌合型启动子有益于一些应用,例如本发明的多核苷酸构建体在某些组织中的表达,同时使在其他组织(如种子或生殖组织)中的表达最小化。示例性的细胞类型或组织优选的启动子能够驱动目标组织中的优先表达,但也导致其他细胞类型或组织中的一定表达。因此,可以选择产生组织特异性表达的启动子(例如,根、叶和花的特异性启动子)。例如,参见下述启动子Yamamoto等(1997)植物杂志(Plant J. )12 (2):255-265 ;Kawamata 等(1997)植物细胞生理学(Plant Cell Physiol. ) 38 (7) :792-803 ;Hansen等(1997)分子遗传学与基因组学(Mol. Gen Genet. ) 254 (3) : 337-343 ;Russell 等(1997)转基因研究(Transgenic Res. ) 6 (2) : 157-168 ;Rinehart 等(1996)植物生理学(Plant Physiol. ) 112(3) :1331-1341 ;Van Camp 等(1996)植物生理学(Plant Physiol.)112(2) :525-535 ; Canevascini 等(1996)植物生理学(Plant Physiol. ) 112(2) :513-524 ;Yamamoto 等(1994)植物细胞生理学(Plant Cell Physiol. ) 35(5) :773-778 ;Lam (1994)细胞分化的结果与问题(Results Probl. Cell Differ. ) 20:181-196 ;Orozco 等(1993)植物分子生物学(Plant Mol Biol. ) 23(6) :1129-1138 ;Matsuoka 等(1993)美国科学院院刊(Proc Natl. Acad. Sci. USA) 90 (20) :9586-9590 ;和 Guevara-Garcia 等(1993)植物杂志(Plant J. ) 4(3) :495-505。也参见下述披露的启动子美国专利号7,297,839和7,129,397,其提供了在质粒中的优先表达。为了驱动在绿色组织如叶和根中的转录,本发明也包括在光合成组织中有效的启动子。最适合的是仅或主要在这些组织中驱动表达的启动子。启动子可以赋予整个绿色组织内组成性的表达,或相对于绿色组织的差异表达,或相对于发生表达的绿色组织的发育阶段的差异表达,或响应外部刺激的表达。这些启动子的实例包括核酮糖-1,5- 二磷酸羧化酶(RbcS)启动子,如来自东部落叶松(Larix Iaricina)的RbcS启动子,松树cab6启动子(Yamamoto等(1994),植物细胞生理学(Plant Cell Physiol. ) 35:773-778),来自小麦的Cab-1基因启动子(Fejes等(1990),植物分子生物学(Plant Mol Biol. ) 15:921-932),来自菠菜的CAB-1启动子(Lubberstedt 等(1994),植物生理学(Plant Physiol. )104:997-1006),来自水稻的 cab IR启动子(Luan等(1992),植物细胞(Plant Cell) 4:971-981),来自玉米的丙酮酸正磷酸二激酶(PPDK)启动子(Matsuoka 等(1993) Proc. Natl. Acad. Sci. USA90:9586-9590),烟草Lhcbl*2 启动子(Cerdan 等(1997),植物分子生物学(Plant Mol Biol. ) 33:245-255),拟南芥SUC2蔗糖-H+共转运体启动子(Truernit等(1995),植物196:564-570)和来自菠菜的类囊体膜蛋白启动子(psaD、psaF、psaE、PC、FNR> atpC、atpD、cab、rbcS)。美国专利申请号2007/0006346中说明了驱动茎、叶和绿色组织中转录的其他启动子,此处以其整体引用的方式构成本文的部分。同样,本领域已经描述了已对编码磷酸烯醇羧化酶的玉米基因(PEPC) (Hudspeth 和 Grula (1989)植物分子生物学(Plant Mol Biol. 12 :579_589)。应用标准分子生物学技术,该基因的启动子可以用于在植物中以绿色组织的特异方式驱动本发明的多核苷酸构建体的表达。在本发明的其他实施例中,诱导型启动子是所希望的。诱导型启动子响应诸如化学物质或环境刺激的外部刺激而驱动转录。例如,诱导型启动子可以赋予响应环境刺激的转录(如热休克基因启动子、干旱可诱导基因启动子、病原可诱导基因启动子、创伤可诱导基因启动子以及光/暗可诱导基因启动子),或植物生长调节剂(例如,来自被脱落酸、 生长素、细胞分裂素和赤霉素诱导的基因启动子)。例如,参见美国专利号7,199,286和7,230,159。其他可以用来驱动本发明的多核苷酸构建体表达的启动子包括但并不限于花椰菜花叶病毒35S启动子、鸦片合成酶启动子(如,nos、mas、ocs等)、泛素启动子、肌动蛋白启动子、核酮糖二磷酸(RubP)羧化酶小亚基启动子、醇脱氢酶启动子、发育启动子(参见,例如,6,953,848和6,437,221)和如美国专利号6,987,179所述的嵌合启动子。本技术领域内,RubP羧化酶小亚基启动子是众所周知的(Silverthorne等(1990)植物分子生物学(Plant Mol Biol. )15:49-58)。来自感染植物的病毒的其他适合启动子包括但不限于从芋花叶病毒、绿藻病毒(如小球藻病毒腺嘌呤甲基转移酶启动子;Mitra和Higgins (1994)植物分子生物学(Plant Mol Biol. )26:85-93)、番茄斑萎病毒、烟草脆裂病毒、烟草坏死病毒、烟草环斑病毒、番茄环斑病毒、黄瓜花叶病毒、花生残端病毒、苜蓿花叶病毒、甘蔗杆状DNA病毒等分离得到的启动子。许多转录终止子可用于包含本发明多核苷酸构建体的表达盒。这些负责表达盒内多核苷酸构建体编码区外的转录终止和校正mRNA聚腺苷化。终止区对于启动子可以是天然的(即天然发生的),对于在多核酸构建体内有效连接的编码序列可以是天然的,对于导入表达盒的植物可以是天然的,或可以来自另外的来源(即对启动子、编码序列或植物是外源的或异源的),或其任何组合。适当的转录终止子是那些植物中已知功能的终止子,包括例如CAMV 35S终止子、tml终止子、胭脂碱合成酶终止子和豌豆rbcs E9终止子。在一些实施例中,表达盒应包括用于选择转化的细胞的选择标记基因。在其他实施例中,选择性标记基因可在相同载体或不同载体上的另一个表达盒内构建,而本发明的多核苷酸构建体及选择性标记可转化入目标植物或植物部分内。转化过程中常规使用的选择性标记物包括npt 11基因,它赋予了对卡那霉素和相关抗生素的抗性(Messing和Vierra(1982)基因(Gene)19 :259-268 ;Bevan 等(1983)自然(Nature)304:184_187);bar 基因,它赋予了对除草剂草丁膦的抗性(White等(1990)核酸研究(Nucleic Acids Res. ) 18:1062 ;Spencer 等(1990)理论与应用遗传学(Theor. Appl. Genet. ) 79 :625-631) ;hph 基因,它赋予了对抗生素潮霉素的耐药性(Blochinger和Diggelmann (1984)分子细胞生物学(Mol.Cell. Biol ).4 :2929-2931) ;dhfr 基因,它赋予了对甲氨蝶呤的抗性(Bourouis 等(1983)EMBO杂志(EMBO J. ). 2 :1099-1104) ;EPSPS基因,它赋予了对草甘膦的抗性(美国专利号4,940,935和5,188,642),以及磷酸甘露糖异构酶基因(PMI),它提供了代谢甘露糖的能力(美国专利号5,767,378和5,994,629)。其他适当的选择性标记在本技术领域内是众所周知的,而任何这样的标记均可以在本发明的实践中运用。此外,当需要时,表达盒可设计为将所表达的目标多肽靶向至在植物细胞的特定细胞器(例如,针对线粒体或质粒,如叶绿体),或将多肽靶向用于细胞外分泌。已知植物中存在着各种祀向基因产物的机制,而控制这些机制发挥功能的序列已在一些细节方面进行了表征。例如,将基因产物靶向叶绿体是由在各种蛋白质氨基末端发现的转运肽所控制的,它会在叶绿体转运的过程中经过剪切,以产生成熟蛋白(Comai等(1988)生物化学杂志(J. Biol. Chem. )263:15104-15109)。这些转运肽可以融合至异源多肽产物以影响这些产物转运至叶绿体内(van den Broeck等(1985)自然(Nature) 313:358-363)。编码适当转运 肽的DNA可以分离自编码RUBISC0蛋白、CAB蛋白、EPSP合成酶、GS2蛋白以及其他已知放置于叶绿体的蛋白质的cDNA 5’末端。参见,美国专利号5,639,949的实施例37中,标题为“叶绿体靶向表达”的章节,此处以其整体通过引用纳入为本文的一部分。上述细胞靶向的机制不仅可以用来与其天然启动子相结合,也可用来与异源启动子结合,从而实现在启动子的转录调控下的特异性细胞靶向的目标,该启动子的表达谱与来自靶向转运肽机构的启动子的有所不同。因此,若本发明的多核苷酸构建体编码靶向至叶绿体的多肽时,在构建体内的编码序列可以是包含编码适当叶绿体靶向转运肽的序列的融合多核苷酸,该叶绿体靶向转运肽融合入编码目标多肽的序列框架内。为了确保质粒内的定位,例如,可以设想应用质体铁氧还蛋白的转运肽序列菠菜的NADP+氧化还原酶(FNR),这是Jansen等(1988)当代遗传学(Current Genetics)13:517-522披露的。另一个例子是玉米糯蛋白的转运肽序列,包括成熟糯蛋白的开始34个氨基酸残基(Klosgen等(1989)分子遗传学与基因组学(Mol. Gen.Genet. )217:155-161)。应用不含成熟蛋白开始34个氨基酸的该转运肽也是可以的。此外,也可以应用核酮糖二磷酸羧化酶小亚基的转运肽序列(Wolter等(1988)美国科学院院刊(Proc. Natl. Acad. Sci. USA) 85:846-850 ;Nawrath 等(1994)美国科学院院刊(Proc. Natl.Acad. Sci. USA) 91:12760-12764),NADP 苹果酸脱氢酶的转运肽序列(Galiardo 等(1995)植物(Planta) 197:324-332),谷胱甘肽还原酶的转运肽序列(Creissen等(1995)植物杂志(Plant J. ) 8:167-175),或Rl蛋白的转运肽序列(Lorberth等(1998)自然生物技术(Nature Biotechnology)16:473-477)。当需要目标多肽分泌,例如进入细胞壁或培养基内,本发明的多核苷酸构建体则可设计为使得构建体内的编码序列是包含编码融合在在编码目标多肽的框架内的适当信号肽的序列的融合多核苷酸。本文所用的“信号肽”或“信号序列”是指编码与内质网(ER)膜上的受体蛋白相互作用的多肽的核酸序列,以转运生长中的多肽链跨越膜而进入ER用于从该细胞分泌。这种信号肽往往从前体多肽上切割下来,从而生成不含信号肽的“成熟”多肽。因此,表达盒内的多核苷酸构建体可以设计成所编码的多肽能够分泌到细胞壁内或从该植物分泌出来,例如分泌至培养基中。
本发明的多核苷酸构建体可以使用本技术领域内已知的任何适当信号序列(包括细菌、酵母菌、真菌、昆虫、哺乳动物和植物的信号序列)。例如,参见美国专利号6,020,169。信号肽可以对应目标多肽的信号肽。在本技术领域内,适当的信号肽是众所周知的。本文所述的表达盒可以包含其他已发现的调控序列,以增强表达盒的基因表达,从而增加其中所包含的多核苷酸构建体的表达。例如,已表明多种内含子序列能够增强表达,特别是在单子叶植物细胞中的表达。据证实,内含子I是特别有效的,并能够增强具有氯霉素乙酰转移酶基因的融合构建体中的表达(Callis等(1987)遗传与育种(GenesDevelop. )1:1183-1200)。参见例如,美国专利号6,342,660所述玉米醇脱氢酶内含子的应用。内含子序列已常规地整合入植物转化载体中,通常是在非翻译的前导肽内。因此,包含本发明多核苷酸构建体的表达盒可以进一步包括其中有效连接的内含子序列。在一些实施例中,内含子序列可插入一个或多个串联堆叠的病毒和细胞翻译增强子元件内。人们认识到,在不同生物体的翻译起始密码子的最佳翻译起始上下游核苷酸序列之间,存在着已知的差异,而这些翻译起始上下游核苷酸序列的组合可以影响翻译起始的功效。例如,参见 Lukaszewicz 等(2000)植物科学(Plant Science) 154:89-98 ;和 Joshi 等(1997)植物分子生物学(Plant Mol. Biol.) 35:993-1001。本文所用的“翻译起始密码子”是指起始从目标核酸分子转录的mRNA内的编码区翻译的密码子。该翻译起始密码子通常在DNA序列是ATG和在mRNA转录本内是AUG。本文所用的“翻译起始上下游核苷酸序列”是指翻译起始密码子5’端正好三个核苷酸的鉴定。因此,本发明的多核苷酸构建体内编码序列的翻译起始密码子的翻译起始上下游核苷酸序列可以通过选择植物优选的翻译起始上下游核苷酸序列来修饰以增强植物中的表达。因此,本发明的多核苷酸构建体可以采用本技术领域内已知的任何适合的翻译起始上下游核苷酸序列,特别是植物来源的。例如,本发明的多核苷酸构建体可以进行修饰,以便正好位于本发明多核苷酸构建体内编码序列的翻译起始密码子上游的三个核苷酸为“ACC”、“ACA”或“AAAAAA”。此外,任何在本文所述的表达盒内含有的编码序列均可就所要导入的植物内的表达进行优化。即,核苷酸序列可以采用用于改良表达的植物优选密码子进行合成,或者也可以采用植物优选密码子使用频率的密码子进行合成。一般来说,该基因的GC含量会有所提高。例如,参见 Campbell 和 Gowri (1990)植物生理学(Plant Physiol. )92:1-11 宿主优选密码子应用的讨论。在本技术领域内,可提供用于合成植物优选基因的方法。例如,参见美国专利号 5,380,831 和 5,436,391,以及 Murray 等(1989)核酸研究(Nucleic AcidsRes. ) 17:477-498,通过引用纳入成为本文的一部分。显示了基于GenBank 版本中列入序列的密码子使用频率的表格如日本千叶县Kazusa DNA研究所的网站所示。此数据库见Nakamura 等(2000)核酸研究(Nucleic Acids Res. ) 28:292 所述。在构建了本文所述的表达盒后,将其通过本技术领域内已知的任何适当转化方法导入目标植物内,包括本文下述方法。目标多肽在本发明的多核苷酸构建体内,串联堆叠的病毒和细胞翻译增强子元件可以用于增强任何目标多肽的表达。在这种方式下,本发明的多核苷酸构建体内的有效连接的编码序列可编码用于代谢途径的基因操作的多肽,以改善植物农艺学性状如增加疾病抗性、除草剂抗性、营养利用以及环境胁迫抗性;以改变农艺性状,如淀粉、油、脂肪酸或蛋白质含量/组成的改良以增强动物和人体的营养,提高消化率,和/或提高工艺品质;以及以发育改良,如雄性不育症,衰老等;以及以导入药物、工业酶等的转基因表达。因此,本发明的多核苷酸构建体可包含能够提供与植物形态学、生理学、生长和发育、产量、提高营养、疾病抗性昆虫抗性害、或环境或化学耐受性相关的预期性状的多肽编码序列。这种多肽的表达是可取的,以赋予重要的农艺学性状。为作物植物提供有益的农艺学性状的多肽实例可以是,例如赋予如下的多肽,昆虫控制(美国专利号 7,244,820 ;7,230,167 ;6,809,078 ;6,780,408 ;6,720,488 ;6,713,063 ;6,686,452 ;6,657,046 ;6,645,497 ;6,642,030 ;6,639,054 ;6,620,988 ;6,593,293 ;6,555,655 ;6,538,109 ;6,537,756 ;6,521,442 ;6,501,009 ;6,468,523 ;6,342,660 ;6,326,351 ;6,320,100 ;6,313,378 ;6,300,544 ;6,284,949 ;6,281,413 ;6,281,016 ;6,278,041 ;6,277,823 ;6,248,536 ;6,242,241 ;6,221,649 ;6,177,615 ;6,156,573 ;6,153,814 ;6,110,464 ;6,093,695 ;6,063,756 ;6,063,597 ;6,023,013 ;5,959,091 ;5,942,664 ;5,942,658,5,880,275 ;5,763,245 ;和 5,763,241);真菌疾病抗性(美国专利号 7,098,378 ;6,864,076 ;6,864,068 ;6,653,280 ;6,573,361 ;6,506,962 ;6,316,407 ;6,300,103 ; 6,215,048 ;5,516,671 ;5,773,696 ;6,121,436 ;6,316,407 ;和 6,291,647);病毒抗性(美国专利号 6,617,496 ;6,608,241 ;6,015,940 ;6,013,864 ;5,850,023 ;和 5,304,730);线虫抗性(美国专利号6,784,337和6,228,992 );细菌疾病抗性(美国专利号7,098,378 ;6,956, 115 ;6,528,702 ;和 5,516,671);除草剂抗性(美国专利号 7,312,379 ;7,056,715 ;6,803,501 ;6,448,476 ;6,307,129 ;6,294,345 ;6,248,876 ;6,225,114 ;6,107,549 ;5,866,775 ;5,804,425 ;5,633,435 ;和 5,463,175 ;和美国专利申请公布号 2003/0135879和 2003/0115626);植物生长和发育(美国专利号 6,723,897 ;6,603,064 ;和 6,518,488);淀粉生成(美国专利号 6,538,181 ;6,538,179 ;6,538,178 ;5,750,876 ;和 6,476,295);产率提高(美国专利 RE38, 446 ;美国专利号 6,716,474 ;6,663,906 ;6,476,295 ;6,441,277 ;6,423,828 ;6,399,330 ;6,372,211 ;6,235,971 ;6,222,098 ;和 5,716,837);改良的油生产(美国专利号6,444,876 ;6,426,447 ;和6,380,462);高油产量(美国专利号6,495,739 ;5,608,149 ;6,483,008 ;和6,476,295);改良的脂肪酸含量(美国专利号 6,828,475 ;6,822,141 ;6,770,465 ;6,706,950 ;6,660,849 ;6,596,538 ;6,589,767 ;6,537, 750 ;6,489,461 ;和6,459,018);高蛋白产量(美国专利号6,380,466);果实成熟(美国专利号5,512,466);增强的动物和人体营养(美国专利号6,723,837 ;6,653,530 ;6,5412,59 ;5,985,605 ;和6,171,640);生物聚合物(美国专利号RE37, 543 ;美国专利号6,228,623 ;5,958,745 ;和美国专利申请发布号2003/0028917);环境应激抗性(美国专利号6,072, 103);药用肽和可分泌肽(美国专利号6,812,379 ;6,774,283 ;和6,140,075 ;6,080,560);改进的加工性状(美国专利号6,476,295);改进的消化率(美国专利号6,531,648);低棉子糖(美国专利号6,166,292);工业酶生成(美国专利号5,543,576);改善的风味(美国专利号6,011,199);固氮作用(美国专利号5,229,114);杂交种子生产(美国专利号5,689,041);纤维生产(美国专利号6,576,818 ;6,271,443 ;5,981,834 ;和5,869,720);以及生物燃料生产(美国专利号5,998,700);这些专利和专利申请出版物的各项内容均以其整体通过引用纳入为本文的一部分。如上所述,且如适用,目标多肽可作为融合多肽的一部分来表达。
因此,包含串联堆叠的病毒和细胞翻译增强子元件的本发明的多核苷酸构建体可以包含编码任何目标多肽的多核苷酸。可将这些构建体导入任何目标植物,以改善农艺学性状、改变农艺学特征,并提供药物制剂、工业酶等的表达。目标植物因此,本发明提供包含本发明的多核苷酸构建体的转化(即转基因)植物及其植物部分,其中的构建体包括a)至少一种病毒翻译增强子元件,与至少一种细胞翻译增强子元件串联堆叠;以及b)编码目标多肽的多核苷酸。本文所用术语“植物部分”是指植物器官(如叶、茎、根等)、种子和植物细胞。植物部分还包括,但不限于植物或其后代产生的原生质体、组织、根瘤、愈伤组织、可再生植物的植物细胞组织培养物、胚胎和花、胚珠、花药、花粉、茎、枝、果实、核、穗、穗轴、外果壳、柄、叶、分蘖、根、根尖等。植物细胞还包括但不限于种子细胞、胚胎、分生组织区、愈伤组织、叶、根、芽、配子体、孢子、花粉和小孢子。本文所用术语“转化的”或“转基因的”是指已导入外源多核苷酸分子,如本发明的多核苷酸构建体的植物或其植物部分。导入的多核苷酸分子可以整合入受体植物或植物部分的基因组DNA内,以便导入的多核苷酸分子由随后的后代遗传。“转基因的”或“转化的”植物或植物部分,例如,细胞或组织,也包括植物或植物部分的后代,和从采用类似转基因植物或植物部分作为杂交亲本并因含有外源多核苷酸分子,如本发明的多核苷酸构建体而显示出改变的表型的育种程序而产生的后代。在优选实施方式中,本发明的多核苷酸构建体和在植物细胞内发挥功能的有效连接的启动子稳定整合入植物或其植物部分的基因组内,从而便于所需的由编码多肽提供的特性或性状可以由其后代遗传,更特别的是,由多重连续世代的后代遗传。在一些实施例中,本发明的多核苷酸构建体能够作为本发明的表达盒的一部分而稳定整合入植物或其植物部分的基因组内,从而植物或其植物部分可以通过将该表达盒导入一个或更多个植物细胞或其植物部分的方式而完成遗传修饰。根据本发明,植物包括出于生产植物材料的目的而栽培的、之后由人类或由动物用于口头消费或用于工业、医药或商业过程中利用的任何植物。本发明可应用于多种植物中的任意一种,包括但不仅限于玉米、小麦、水稻、大麦、大豆、棉花、高粱、一般豆类、卡诺拉油菜/芸苔、紫花苜蓿、亚麻、向日葵、红花、小米、黑麦、甘蔗、甜菜、可可、茶、甘蓝、棉花、烟草、咖啡、甘薯、亚麻、花生、三叶草;蔬菜类,如生菜、西红柿、葫芦、木薯、土豆、胡萝卜、萝
卜、豌豆、扁豆、甘蓝、花椰菜、绿花椰菜、包子甘蓝、辣椒和菠萝;乔木水果,如柑橘、苹果、梨、桃、杏、核桃、鳄梨、香蕉和椰子,以及鲜花,如兰花、康乃馨、玫瑰等。可用于本发明实施的其他植物包括多年生草类,如柳枝稷、草原草、印度草,大须芒草等。发明方法本发明的多核苷酸构建体可用于增加目标多肽在植物及其植物部分中表达的方法。本发明的方法包括将有效连接至在植物中是功能性的启动子的本发明多核苷酸构建体导入植物或其植物部分中。在适于本发明的多核苷酸构建体表达的培养条件下,串联堆叠的翻译增强子元件为所涉及的mRNA转录本的翻译提供了更高的功效。因此,本发明提供了目标多肽在植物及其植物部分中的表达增加。本文所用术语“表达”是指合成所编码的多肽,包括所编码的多肽的转录、翻译和装配。多肽表达的增加是在任何两种植物或植物部分之间的比较下进行的,如已经通过导入本发明的多核苷酸构建体的方式进行了遗传修饰的、植物或植物部分内的多肽表达,对比相应野生型植物或野生型植物部分内多肽的表达。在一些实施方式中,表达的增加是在植物或植物部分之间的比较下进行的,其已经通过导入本发明的多核苷酸构建体的方式进行了遗传修饰,对比相应对照植物或对照植物部分内多肽的表达。本文所用术语“对照植物”或“对照植物部分”是指已经进行了遗传修饰,从而表达来自多核苷酸构建体的相同多肽的植物或植物部分,而该多核苷酸构建体则仅在不含串联堆叠的病毒和细胞翻译增强子元件方面才有别于本发明的多核苷酸构建体。在这种方式下,对照植物或植物部分包括含有相同转录调控区(即相同启动子)、多肽的相同编码序列的多核苷酸构建体,或者以下内容没有有效连接的翻译增强子元件,或只有单独的有效连接的翻译增强子元件,该元件或者是本发明的多核苷酸构建体含有的同一个病毒翻译增强子元件,或者是本发明的多核苷酸构建体所含有的同一个细胞翻译增强子元件。在本发明的具体实施方式
中,本发明的转基因植物或植物部分中目标多肽表达水平得到提高,与野生型植物或植物部分,或与对照植物或植物部分相比较,至少提高了约10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、50%、65%、70%、75%、80%、85%、90%、 95%、100%、105%、110%、115%、120%、125%、130%、135%、140%、145%、150%、155%、160%、165%、170%、175%、180%、185%、190%、195%、200%、225%、250%、275%、300%、350%、400%、450% 或者至少提高了500%。在本发明的其他实施方式中,本发明的转基因植物或植物部分中目标多肽表达水平得到提高,与野生型植物或植物部分,或与对照植物或植物部分相比较,至少是约I倍、I. 5倍、2倍、2. 5倍、3倍、3. 5倍、4倍、4. 5倍或至少约5倍。目标多肽表达水平可直接测量,例如,通过检测植物或植物部分表达的多肽水平,例如,通过测量植物或植物部分的多肽活性。本发明的多核苷酸构建体和表达盒可以采用任何本技术领域内已知的植物转化技术导入目标植物或植物部分中,包括但不限于电穿孔(如美国专利号5,384,253所示);微粒轰击法(如美国专利号 6,403,865 ;5,015,580 ;5,550,318 ;5,538,880 ;6,160,208 ;6,399,861及6,403, 865所示);土壤杆菌介导的转化(如美国专利号7,029, 908 ;5,824,877 ;5,591,616 ;5,981,840及6,384,301所示)和原生质体转化(如美国专利号55,081,84所示);所有这些都通过引用而纳入为本文的一部分。这些构建体和表达盒也可以采用育种计划而导入目标植物或植物部分。下述植物转化技术仅为提供技术指导,不拟做任何限制。植物转化和育种。本发明的多核苷酸构建体和表达盒,单独或与一种或多种额外的目标核酸分子联合,被转化入所关注目标植物的细胞内。可以通过许多本技术领域认可的方式将这些构建体和表达盒导入植物细胞中。在多核苷酸的情况下,本文所用术语“导入”是指以多核苷酸得以进入植物细胞内部这样的方式将本发明的多核苷酸构建体或表达盒呈递至植物。凡导入一个以上核苷酸的情况下,这些多核苷酸可被装配成单核苷酸构建体的部分,或装配成单独的核苷酸构建体,且可位于相同或不同的转化载体上。相应地,这些多核苷酸可在植物内单一的转化事件中,单独的转化事件中,或者作为育种方案的一部分而被导入目标植物细胞。本发明的方法不依赖于将一个或多个多核苷酸导入植物的特定方法,而只取决于多核苷酸得以进入至少一个植物细胞内部。本技术领域中已知的将多核苷酸导入植物的方法,包括但不仅限于,瞬间转化法、稳定转化法,以及病毒介导法。在多核苷酸的情况下,本文所用术语“瞬时转化”或“瞬时表达”是指将多核苷酸导入植物,而并不会被整合入植物基因组中。瞬时转化和瞬时表达可通过采用本技术领域内任何适当的已知方法来实现。例如,瞬时表达可以采用植物细胞培养或采用重组土壤杆菌菌株的浸润植株叶来实施。瞬时表达不会被任何植物后代所遗传。在导入植物的多核苷酸情况下,本文所用术语“稳定导入”或“稳定导入(后)的”意指导入的多核苷酸是稳定包含在植物基因组中的,因而该植物被此多核苷酸稳定转化。“稳定转化”或“稳定转化(后)的”是指表示被导入植物中的多核苷酸(如本发明的多核苷酸构建体或表达盒)可整合至植物基因组内,并能够由其后代遗传,更具体地说,能够由多个连续后代遗传。在这些植物转化的技术领域中的普通技术人员已知许多可用于植物转化的转化载体,并且本发明的多核苷酸构建体和表达盒可与任何此类载体一起使用。载体的选择将取决于优选的转化技术和转化的目标植物物种。对于某些目标物种,优选不同的抗生素或 除草剂选择性标记。转化常规使用的选择性标记包括那些本文上述的选择性标记。在本技术领域中,用于转化的方法和载体也是众所周知的。例如,Ti质粒载体已被用于递送外源DNA,以及DNA直接摄取、脂质体、电穿孔、显微注射以及基因枪微弹。此外,土壤杆菌属(Agrobacterium)细菌可被用于转化植物细胞。以下是双子叶植物和单子叶植物转化的代表性技术以及代表性的质体转化技术的说明。许多载体都可采用根癌土壤杆菌(Agrobacterium tumefaciens)进行转化。这些典型载体通常至少携带一个T-DNA边界序列,并包括诸如pBIN19这类的载体(Bevan(1984)核酸研究12:8711-8721)。对于土壤杆菌转化有益的载体的构建,例如,参见美国专利申请公布号2006/0260011和美国专利号7,029,908,均通过引用而构成本文的一部分。未使用根癌土壤杆菌的转化规避了选定转化载体中对T-DNA序列的要求,因此除了诸如上述包含T-DNA序列的载体以外,还可利用缺乏这些序列的载体。不依赖土壤杆菌的转化技术包括通过粒子轰击、原生质体摄取(如PEG和电穿孔)以及显微注射而进行的转化。载体选择在很大程度上取决于需转化的植物物种的优先选择。对于这类载体的构建,例如,参见美国专利申请公布号2006/0260011,均通过弓I用而构成本文的一部分。凡希望向植物质体导入本发明的多核苷酸构建体或表达盒的情况,均采用了质体转化载体pPH143(W0 97/32011,参见例36)。从而,可将表达盒插入pPH143以取代PROTOX编码序列。然后,将该载体用于质体转化和就大观霉素筛选抗性转化子。备选地,将表达盒插入pPH143中,使其取代aadH基因。在这种情况下,就对PROTOX抑制剂的抗性筛选转化子。参见,美国专利号7,235,711披露的质体转化技术,以其整体通过引用构成本文的一部分。在本技术中,双子叶植物的转化技术是众所周知的,并且包括基于土壤杆菌的技术和不需土壤杆菌的技术。非土壤杆菌技术涉及直接由原生质体或细胞直接摄取外源遗传物质。这可以通过PEG或电穿孔介导的摄取、粒子轰击介导的递送,或显微注射而实现。这些技术的实例如下所述Paszkowski 等(1984)EMB0杂志(EMBO J) 3:2717-2722 ;Potrykus等(1985)分子遗传学和基因组学Mol. Gen. Genet. 199:169-177,Reich等(1986)生物技术(Biotechnology) 4 :1001 - 1004 ;以及 Klein 等(1987)自然(Nature) 327:70-73。在每种情况下,转化的细胞均采用本技术领域中已知的标准技术再生成完整植物。土壤杆菌介导的转化为双子叶植物转化的优选技术,这是由于其高效率的转化及在许多不同物种的广泛应用。土壤杆菌转化通常涉及携带目标外源DNA的二元载体(如PCIB200或pCIB2001)向适当土壤杆菌菌株的转移,这可以取决于宿主土壤杆菌菌株在共驻存的Ti质粒或染色体上所携带的vir基因的补充(如pCIB200和pCIB2001的CIB542菌株(Uknes等(1993)植物细胞(Plant Cel) 15:159-169)。重组二元载体向土壤杆菌的转移是采用携带着重组二元载体的大肠杆菌(一种携带着诸如PRK2013质粒且能够将重组二元载体移动至目标土壤杆菌菌株的辅助大肠杆菌)通过三亲株的交配程序而完成的。备选地,重组二元载体可通过DNA转化而被转移至土壤杆菌(Hofgen和Willmitzer (1988)核酸研究(NucI. Acids Res). 16:9877)。重组土壤杆菌介导的目标植物物种的转化通常涉及土壤杆菌与植物外植体的共培养,并遵循本技术中众所周知的规程而进行。转化的组织在携带着存在于二元质粒T-DNA 边界之间的抗生素或除草剂抗性标记的选择性培养基上再生。用目标多核苷酸转化植物细胞的另一种方法涉及植物组织和细胞的推动惰性或生物活性粒子。该技术披露于美国专利号4,945,050,5, 036,006和5,100,792,通过引用而构成本文的一部分。一般来说,这种方法涉及在有效渗透至细胞外表面并提供了其内部整合的条件下在细胞上推动惰性或生物活性粒子。当利用惰性粒子时,载体可以通过包被携带着含有所需基因载体的粒子的方式而被导入至植物细胞内。备选地,目标细胞可被载体包围,以致于载体能够通过粒子尾流而得以进入细胞。生物活性粒子(例如,干的酵母细胞、干的细菌或噬菌体,每种均含有试图导入的DNA )也可以被推入植物细胞组织中。大多数单子叶植物物种的转化目前也已成为常规程序。优选的技术包括采用PEG或电穿孔技术将基因直接转移入原生质体以及粒子轰击至愈伤组织内。转化可以采用单个DNA物种或多个DNA物种(即共转化)进行,且两种技术均适合用于本发明。共转化可以具有避免完全型载体构建及产生具有目标基因的非伴性基因座和选择性标记的转基因植株,能够在后代中去除选择性标记的优势,这应该被视为可取的。然而,共转化应用的缺点是单独DNA物种被整合至基因组的频率低于 100% (Schocher 等(1986)生物技术(Biotechnology) 4:1093-1096)。专利申请EP 0292435,EP 0392225和WO 93/07278描述了采用PEG或电穿孔法制备原种纯系玉米的愈伤组织和原生质体,转化原生质体,以及从转化的原生质体再生玉米植株的技术。Gordon-Kamm 等(植物细胞(Plant Cell) 2:603-618( 1990))和 Fromm 等(生物技术(Biotechnology) 8:833-839 (1990))已发表了米用粒子轰击法转化A188衍生的玉米株的技术。此外,WO 93/07278 和 Koziel 等(生物技术(Biotechnology) 11:194-200(1993))描述了采用粒子轰击法转化原种纯系玉米的技术。这种技术利用从玉米授粉后14-15天的玉米穗切断的I. 5-2. 5mm长的玉米幼胚和I3DS-IOOOHe的生物弹轰击设备。参见,美国专利号6,403,865披露的生物弹道学转化方法,以其整体通过引用构成本文的一部分。水稻转化也可以采用直接基因转移技术利用原生质体或粒子轰击法进行。已对粳型和籼型描述原生质体介导的转化(Zhang等(1988)植物细胞报告(Plant CellRep) 7:379-384 ;Shimamoto 等(1989)自然(Nature) 338:274-277 ;以及 Datta (1990)生物技术(Biotechnology)8:736-740)。这两种类型也可采用粒子轰击法(Christou等(1991)生物技术(Biotechnology)9 :957-962)进行常规转化。此外,WO 93/21335描述了通过电穿孔而转化水稻的技术。专利申请EP 0332581描述了早熟禾亚科原生质体产生、转化和再生的技术。这些技术允许鸭茅和小麦的转化。此外,Vasil等(生物技术(Biotechnology) 10:667-674(1992 已采用粒子轰击进入C型长期再生愈伤组织的细胞描述了小麦转化,而且Vasil等(生物技术(Biotechnology) 11:1553-1558 (1993))和 Weeks 等(植物生理学(PlantPhysiol. ) 102 :1077-1084 (1993))也已采用粒子轰击幼胚和幼胚来源的愈伤组织而对此进行了描述。然而,小麦转化的优选技术涉及通过粒子轰击小麦幼胚而进行的小麦转化,也包括基因递送之前的高蔗糖或高麦芽糖步骤。在轰击之前,将任何数目的胚胎(0. 75-1毫米长)涂布至含3%鹿糖和3mg/L 2,4 - D的MS培养基上(Murashige和Skoog (1962)Physiologia Plantaruml5:473_497)以诱导体细胞胚,这是允许在黑暗中进行的。在选定的轰击当天,从诱导培养基取胚胎,并置于渗压剂(即按照一般为15%的所需浓度添加的蔗糖或麦芽糖诱导培养基)上。允许这些胚胎胞质皱缩达2-3小时,然后对其进行轰击。虽然不是很关键,但每块目标平板的20个胚胎是典型的。可采用标准方法将合适的携带基因的质粒(PCIB3064或pS0G35)沉淀至微米大小的金颗粒上。每板胚胎均用 DuPont BIOUST丨设备以约IOOOpsi的爆破压力采用标准80目屏进行轰击。轰击后,这些胚胎被放置回黑暗处以恢复约24小时(仍置于渗压剂上)。24小时后,从渗压剂中取出这些胚胎,并放置回诱导培养基上,再生前在该处维持大约I个月。约一个月后,携带发育中胚胎形成愈伤组织的胚胎外植体被转移至再生培养基上(MS+lmg/L的NAA,5mg/LGA),进一步包含适当的选择性试剂(在pCIB3064的情况下10mg/L的basta,而在pS0G35的情况下2mg/L的甲氨蝶呤)。约一个月后,发育的芽被转移至称为“GA7s”的更大无菌容器中,其中含有半强度MS,2%蔗糖,以及相同浓度的选择性试剂。采用土壤杆菌对单子叶植物的转化也已经被描述。参见W094/00977及美国专利号5,591,616,两者均通过引用而构成本文的一部分;参见Negrotto等(2000)植物细胞报告(Plant Cell Reports) 19:798-803,通过引用构成本文的一部分。。例如,水稻(Oryza sativa)可用于产生转基因植物。也可使用多种水稻品种(Hiei等(1994)植物学报(Plant Journal) 6:271-282 ;Dong 等(1996)分子育种(MolecularBreeding) 2:267-276 ;Hiei 等(1997)植物分子生物学(Plant Molecular Biology), 35 205-218)。此外,下文所述的各种培养基组分可以是有不同的数量差异或各种取代的。通过在MS-CM培养基(MS基础盐,4. 3g/升;B5维生素(200X),5ml/L ;蔗糖,30g/L ;脯氨酸,500mg/L ;谷氨酰胺,500mg/L ;酪蛋白水解物,300mg/L ;2,4_D( lmg/mL),2mL/L,用 IN KOH将pH值调整至5. 8 ;植物凝胶,3g/L)上的培养而起始胚胎发生反应和/或从成熟胚建立培养物。无论是在培养物反应初始阶段的成熟胚还是已构建的培养物品系均给予接种,并与包含所需载体构建体的根癌土壤杆菌菌株LBA4404 (土壤杆菌)进行共培养。将土壤杆菌从甘油储备液到固体YPC培养基(100mg/L的壮观霉素和任何其他适当的抗生素)上于28°C培养2天。将土壤杆菌在液肽MS-CM培养基中重悬。将此土壤杆菌培养物稀释至在光密度(0D>600处为0. 2-0. 3的值,并且添加乙酰丁香酮至200 u M的终浓度。在将该溶液与水稻培养物混合之前,添加乙酰丁香酮以诱导土壤杆菌将DNA向植物细胞的转移。对接种而言,将植物培养物浸入菌悬液中。取液体菌悬液,将接种后的培养物置于共培养培养基上,并于22°C孵育两天。然后,将此培养物转移至含有替卡西林(400mg/L)的MS-CM培养基上,以抑制土壤杆菌的生长。对于利用PMI选择性标记基因的构建体(Reed等(2001)体外细胞与发育生物学-植物(In Vitro Cell. Dev. Biol. -Plant) 37:127-132),7天后将培养物转移至含有甘露糖作为碳水化合物来源的选择性培养基中(含有2%甘露糖,300mg/L替卡西林的MS),并在暗处培养3-4周。然后,将抗性菌落转移至再生诱导培养基(不含2,4-D,含0. 5mg/L IAA, lmg/L玉米素,200mg/L特美汀,2%甘露糖和3%山梨醇的MS)上,并于暗处生长14天。然后,将增殖菌落转移至新一轮的再生诱导培养基上,并移动至光源生长室内。将再生的芽转移至含有GA7-1培养基(不含激素和含2%山梨醇的MS)的GA7容器中达2周,然后当它们足够大且有足够根时,将其移至温室。将植物移植至温室内的土壤中(Ttl代)生长成熟,然后收获T1种子。 已采用本发明的多核苷酸构建体或表达盒转化的细胞可依据传统方式培养成植物。例如,参见 McCormick 等(1986)植物细胞报告(Plant Cell Reports)5:81-84。然后,可以使这些植物生长,并用相同的转化株或者以不同的转化株进行授粉,而由此产生的后代具有所需的表型鉴定特征的表达。可培养两代或更多代,以确保所需表型特征的表达能够维持稳定,并可遗传,然后采集种子,以确保所需表型特征的表达已经实现。在这种方式下,本发明提供了含有稳定导入其基因组内的本发明的多核苷酸构建体或表达盒的转化种子(也称为“转基因种子”)。通过用本发明的多核苷酸构建体或表达盒转化而获得的植物可以是任何种类繁多的植物物种之一,其中包括单子叶植物和双子叶植物中的物种;以及本文其他处所述的农艺学重要目标作物列表之一。本发明的多核苷酸构建体和表达盒可与其他生产和质量的重要特点相结合而得以通过育种被整合至植物株内。育种方法和技术在本技术领域内是众所周知的。例如,参见Welsh,植物遗传学与育种原理(Fundamentals of Plant Geneticsand Breeding), John Wiley 和 Sons,NY( 1981);作物育种(Crop Breeding)(Wood编著,美国麦迪逊农学院,威斯康星州(1983);Mayo,植物育种理论(The Theory of Plant Breeding)(第二版;Clarendon出版社,牛津城(1987)) ;Singh,疾病抗性虫害育种(Breeding forResistance to Diseases and Insect Pests)(施普林格出版社,纽约州(1986) ;Wricke和 Weber,数量遗传学与选择性植物育种(Quantitative Genetics and Selection PlantBreeding), Walter de Gruyter 和 Co,柏林(1986)。以上所述改造入转基因种子和植物的遗传特性是通过有性繁殖或营养生长来传代的,因此可在后代植物中维持和传播般情况下,维持很传播利用了已知建立好的农作方法,以适合特定用途,如耕作、播种或收割。目标多肽的稳定性整合和表达的检测上述情况导致具有光合能力的绿色植株和植物的再生。如上所述,用于确定目标核酸分子已稳定整合入目标植物、或其植物部分的基因组的测试,必须取决于赋予植物的特性。例如,当特性是除草剂抗性,应在对不经历转化过程的对照植物致命的条件下,以除草剂喷洒或涂布叶片对生长中的植物进行处理,从而完成确定。在转化植物或其植物部分中,目标多肽的表达可以采用免疫学方法进行检测。免疫学方法包括但不限于采用基于免疫技术的竞争和非竞争测定系统,如Western印迹法、放射性免疫测定法、ELISA (酶联免疫吸附测定法)、多重ELISA、“三明治”免疫测定法、免疫沉淀测定法、沉淀反应、凝胶扩散沉淀反应、免疫扩散测定法、凝集测定法、补体结合测定法、免疫放射测定法、荧光免疫测定法、蛋白A免疫测定法等。这些测定法在本技术领域内是众所周知的(参见,例如Ausubel等(1994)同上)。除了免疫测定法以外,可以通过评估编码目标多肽的多核苷酸或报告基因或两者的表达谱进行表达测量。例如,可以采用Northern分析法、PCR、RT-PCR、Taq Man分析、核糖核酸酶保护测定法、FRET检测、单分子或多分子信标监测、寡核苷酸阵列杂交、cDNA阵列杂交、多核苷酸阵列杂交、液态微阵列杂交、微电子阵列杂交、基因测序、克隆杂交、cDNA片段指纹等来评估表达谱。应根据诸如RNA恢复数、工作人员偏好、可用试剂和设备、检测器等因素而选定特定方法。以下实施例是通过例证的方式,而不是通过限制的方式提供的。实验实施例I :载体 构建了 20个载体,以测试双增强子的概念。针对烟草或小麦表达,产生了两套每套9个载体。在小麦和烟草中均进行了各增强子和增强子结合的测试。仅在烟草中进行了两个额外载体的测试。洋丁香启动子和35S终止子用于烟草表达,而PEPC启动子和PEPC终止子用于小麦表达。靶向ER的内切葡聚糖酶用作报告基因。该内切葡聚糖酶基因是针对表达宿主优化过的密码子针对玉米表达的玉米最优化和针对烟草表达的大豆最优化。注意保持启动子和增强子之间以及增强子与起始密码子(Kozak)之间的上下游针对玉米或烟草的所有构建体均是相同的。在采用了双增强子的情况下,序列是连续的,增强子之间不含任何干扰序列。烟草启动子-TGCGGATCC -增强子插入_ AAAAAA -报告基因玉米启动子-GGATCC-增强子插入-TAAACC -报告基因。载体构建更多详情如下所述。实施例2 :串联堆叠的翻译增强子元件增强烟草瞬时系统中的表达在烟草瞬时系统中产生的结果表明与对照构建体相比较,内切葡聚糖酶(EG)的表达能够在用多核苷酸构建体转化的烟草植物叶片中显著增加,其中两个翻译增强子元件(病毒+细胞5’ UTRs)位于彼此相对串联的位置。当病毒翻译增强子元件置于细胞增强子元件上游处(即5’端)时,可观察到表达的增强。方法植物材料采用TEV-B烟草转化子的瞬时表达测定法用于监测多个核苷酸构建体所提供的EG表达水平。多核苷酸构建体米用了 6种不同的多核苷酸构建体。这些构建体含有置于编码EG序列上游的病毒和细胞5’ UTR的各种组合。这些构建体用于烟草瞬时和稳定系统。I.串联构建体Q -NtADH构建体在这种构建体中,烟草花叶病毒(TMV)的病毒翻译增强子元件(5’UTR (5’前导肽),也称为“Q” (SEQ ID NO: I)与烟草醇脱氢酶(NtADH)基因的细胞翻译增强子元件5’UTR(SEQ ID N0:4)串联堆叠。这种构建体的元件以如下5’-3’顺序放置
(I)黄叶缩叶病毒的洋丁香启动子(SEQ ID NO: 12); (2) Q增强子(SEQ ID NO: I); (3)NtADH翻译增强子元件(SEQ ID N0:4);(4)6bp的大豆Kozak序列(SEQ ID NO: 13); (5)大豆种子大豆球蛋白的信号序列(SEQ ID NO: 14) ; (6)内切葡聚糖酶编码序列(SEQ ID NO: 15) ; (7)ER 滞留信号(SEQ ID NO:16);以及(8) t35s 转录终止子(SEQ ID NO: 17)。NtADH- Q构建体在这种构建体中,细胞翻译增强子元件(NtADH基因的5’UTR(SEQ ID N0:4)与病毒的译增强子元件(TMV的5’UTR(SEQ ID N0:1))串联堆叠。这种构建体的元件以如下5’-3’顺序放置(1)黄叶缩叶病毒的洋丁香启动子(SEQ ID NO: 12) ; (2)NtADH 翻译增强子元件(SEQ ID N0:4);(3) Q 增强子(SEQ ID NO: I); (4) 6bp 的大豆 Kozak序列(SEQ ID NO: 13); (5)大豆种子大豆球蛋白的信号序列(SEQ ID NO: 14); (6)内切葡聚糖酶编码序列(SEQ ID NO: 15); (7)ER滞留信号(SEQ ID NO: 16);以及(8)t35s转录终止子(SEQ ID NO:17)。2.单独的构建体
Q构建体这种构建体的元件以如下5’ -3’顺序放置(I)黄叶缩叶病毒的洋丁香启动子(SEQ ID NO: 12) ; (2) Q 增强子(SEQ ID NO: I) ; (3) 6bp 的大豆 Kozak 序列(SEQID NO: 13) ; (4)大豆种子大豆球蛋白的信号序列(SEQ ID NO: 14) ; (5)内切葡聚糖酶编码序列(SEQ ID NO: 15); (6)ER 滞留信号(SEQ ID NO: 16);以及(7) t35s 转录终止子(SEQ IDNO:17)。NtADH构建体这种构建体的元件以如下5’ _3’顺序放置(I)黄叶缩叶病毒的洋丁香启动子(SEQ ID NO: 12) ; (2)NtADH翻译增强子元件(SEQ ID NO:4) ; (3) 6bp的大豆Kozak序列(SEQ ID NO: 13) ; (4)大豆种子大豆球蛋白的信号序列(SEQ ID NO: 14) ; (5)内切葡聚糖酶编码序列(SEQ ID NO: 15); (6)ER滞留信号(SEQ ID NO: 16);以及(7)t35s转录终止子(SEQ ID NO: 17)。瞬时转化规程(Transient Transformation Protocol):将表达盒克隆至二元载体内。采用冻融法将二元载体转移入根癌土壤菌株LBA4404内(An等(1988) “二元载体”A31-19,植物分子生物学手册(Plant Molecular Biology Manual ), Gelvin 和Schilproot 编著(Kluwar 科学出版社,Dordrecht)。TEV-B幼株的叶片(4周龄)被用于酶的瞬时表达。含有来自抑制转录后基因沉默的TEV的突变Pl/HC-Pro基因的的转基因TEV-B烟草植物(在烟草栽培品种Xanthi中制备)用于烟草叶片中所选酶的瞬时表达(Mallory等(2002)自然-生物技术(Nat.Biotechnol) 20:622-625)。按照 Azhakanandam 等(2007)植物分子生物学(Plant Mol.Biol. ) 63:393-404所述的方法进行土壤杆菌培养物的制备和烟草的浸润。简单地说,将经过遗传修饰的土壤杆菌于含有100 U M乙酰丁香酮和10 ii M MES(pH 5. 6)的50ml LB培养基内培养过夜,随后以4000X g离心10分钟,使菌液沉淀。将该沉淀物于感染培养基内重新悬浮(含维生素、2%蔗糖、500 ii M MESCpH 5. 6)、IOy M MgSO4和100 u M乙酰丁香酮的Murashige和Skoog盐)至OD600=L 0,其后于28°C放置3小时。采用5ml注射器通过对着叶片背轴面按压注射器头(不带针)而进行大约4周龄的TEV-B烟草植株个别叶片的浸润。浸润植物均保持在22-25°C,其光照周期为16小时明和8小时暗。浸润后5天采集植物组织,用于后续分析。活性测定该方法根据40°C、pH 4. 75的CM-纤维素上产生的自由葡萄糖,以nmol/min/mg蛋白质的形式测量EG。葡萄糖氧化酶/过氧化物酶(G0P0D)化学被用于测量相对于标准曲线的葡萄糖。基于葡萄糖的测定法是比色法,其中G0P0D能够与葡萄糖在40°C反应生成浅至深粉红色生色团的光。该测定法包括4个基本步骤(I)研磨/磨转基因组织;(2)称出粗组织样本;(3)在Na-醋酸缓冲液中提取酶;和(4)测定酶活性/蛋白定量。I.材料钠-醋酸缓冲溶液每50ml缓冲液含IOOmM醋酸钠(pH 4. 75),0. 02%NaN3、0. 02%吐温和I片完整的蛋白酶抑制剂混合物片。制备该缓冲液,并将其储存于4°C长达3个月;添加混合物片剂后,该缓冲液于4°C有I周的有效期。在约800ml的水中,将50ml醋酸钠(lM)、50ml醋酸(1M)混合,pH值调整到4. 75,从而制备该溶液。然后,添加IOml叠氮钠(2%)和IOml吐温(2%),并加水稀释至1L。底物溶液称取5g CMC-4M,置入IOOOml的干燥容量瓶中,制备0. 5%的羧甲基纤维素(CMC-4M ;Megazyme批号#81101 ;fficklow,爱尔兰)溶液。将样品用25ml 95%的乙醇彻底湿润,并一边添加600ml的水一边搅拌。将该溶液加热至100°C,并搅拌10分钟,以确保底物能够溶解。然后,使该溶液冷却至25°C,随后添加50ml的醋酸钠(lM)、50ml的醋酸(1M),和IOml的叠氮钠(2%),并将其体积用水调节至1000ml。将该底物溶液储存于4° C。¢-葡萄糖苷酶溶液将每Iml底物与20iU的黑曲霉(Megazyme) P -葡萄糖苷酶混合,至终浓度为0. Sul/ml。该溶液应每日新鲜制备。葡萄糖标准液在无水葡萄糖(99. 5%纯度)的醋酸钠缓冲液中制备浓缩葡萄糖(IOOmM)0在醋酸钠缓冲液中制备稀释液,以产生0、1、2、3、4和5mM的葡萄糖。在GOPOD测定中,添加20 u I的各标准液,以生成0、1、20、40、60、80和IOOnmol的标准曲线。葡萄糖试剂缓冲液(浓缩液IM正磷酸二氢钾;200mM对羟基苯甲酸;和0. 4%的叠氮钠。葡萄糖测定试剂(每小瓶)>12,000U葡萄糖氧化酶;>650U过氧化物酶;和
0.4mmol 4-氨基安替比林。
葡萄糖标准液1. Omg/ml葡萄糖;和0. 2%w/v苯甲酸。显色试剂(GOPOD):将50. Oml的葡萄糖试剂缓冲液用水稀释至1L。将I小瓶葡萄糖测定试剂的内容物溶解于葡萄糖试剂缓冲液中。若储存在棕色试剂瓶中时,产生的GOPPOD试剂可在2-5°C稳定长达3个月,或若储存在冷冻状态中,则产生的GOPPOD试剂可稳定>12个月。若这种试剂是新鲜制备的,则它可以是浅黄色或浅粉色的颜色。4°C储存超过2-3个月后,它会形成很强的粉红色。当对蒸馏水读数时,该溶液的吸光度应小于0. 05。2.样品制备和提取绿叶样品/24孔板形式向保存在干冰上的24孔板的每孔内添加4个滚珠轴承。对于每个样品,将约0. 5g的绿叶转移至板的每孔中,将板用橡胶塞密封,并放置在_80°C至少3小时。在测定当天,将样品采用K丨eeOR'滴定板/微管研磨机(Kleco ;Visalia,CA)研磨2分钟,然后于3000rpm短暂离心30秒。从板上拿掉橡胶塞,并加入l_3ml的醋酸钠。然后,用板封口机将24孔板密封两次,每个方向一次,然后振荡。然后,在室温下采用台式旋转器提取样品20分钟。将24孔板于3000rpm离心5分钟。将上清液转移至存档板(即96孔平底计数板或96深孔板),留下底部标准液空行。3.测定在干冰上以复制方式制备96孔PCR板。对于120时间点(T120)的板,向板的每孔中加入50 iil的0 -葡糖苷酶和底物混合液。然后,加入20 u I的样品提取液。
将板密封、振荡,并短暂离心(于3000rpm离心15秒)。接着,将板置于40°C的PCR仪内达2小时。孵育2小时后,向96孔平底计数板的每孔中加入200 U I的G0P0D,并向其中加入20 ill的T120样品或葡萄糖标准液。将板密封、振荡,并短暂离心(于3000rpm离心15秒)。接着,将该板置于40°C的热板上达20分钟,然后,计数510nm处的吸光度(Icm光径)。对于0时间点(TO)的板,向板的每孔中加入50 ill的P -葡糖苷酶和底物混合液。然后,加入20 Ul的样品提取液。将板密封、振荡,并短暂离心。接着,将板置于90°C的PCR仪内达10分钟。孵育10分钟后,向96孔平底计数板的每孔中加入200 U I的G0P0D,并向其中加入20 Ul的TO样品或葡萄糖标准液。将板密封、振荡,并短暂离心。接着,将该板置于40°C达20分钟,然后,计数5 IOnm处的吸光度(Icm光径)。总蛋白根据生产商的指南,采用Thermo Scientific Pierce BCA蛋白检测试剂 盒(赛默飞世尔科技公司;RoCkford,IL)测量总蛋白。计算公式酶活性mol/min/mg蛋白=(nmol葡萄糖T120样品_ nmol葡萄糖TO 样品)X (1/120 分钟)X (1/0. 02ml 酶 rxn 加标)=(nmol/min/ml) / (mg/ml 总蛋白)=nmol/min/mg 蛋白。结果如图I所示,目前不含翻译增强子元件的构建体在基线处已拥有内切葡聚糖酶(EG)活性(8 ii mol/min/mg可溶性蛋白总量),而载体对照构建体则低于基线。对于单独的元件构建体,NtADH翻译增强子元件提高的活性是基线约I. 5倍。相比之下,Q翻译增强子元件已对活性产生了负面影响。关于串联堆叠的翻译增强子元件构建体,细胞和病毒翻译增强子元件的放置顺序显著影响EG表达,并最终影响了 EG活性。也就是说,当Q翻译增强子元件被置于NtADH翻译增强子元件上游时,增加的活性是基线的约2. 0倍。相反,当NtADH翻译增强子元件被置于Q翻译增强子元件上游时,活性则低于基线以下。因此,内切葡聚糖酶的表达是受到翻译增强子元件的串联安排影响的。通过将病毒增强子元件置于细胞翻译增强子元件的上游,EG表达比使用单独的细胞增强子元件观察到的增加了额外的约25%。由于病毒翻译增强子元件相对于细胞翻译增强子元件的顺序似乎能够影响表达,从而影响活性,因而采用上述5种构建体(不含翻译增强子元件的载体;Q构建体;NtADH构建体A-NtADH构建体和NtADH-Q构建体)完成了第二组实验。在第一个实验中,5种构建体的表达以叶鲜重计进行了比较(图2A);在第二个实验中,5种构建体的表达以可溶性蛋白总量计进行了比较(图2B)。如上所述,病毒和细胞翻译增强子元件的顺序显著影响了EG活性。因此,EG活性增加超过了用NtADH翻译增强子元件的基线,只有当病毒翻译增强子元件被置于细胞翻译增强子元件上游时,才会进一步增加。与目前不含增强子元件的载体构建体相比较,Q -NtADH增强了 EG活性的程度如表I所示。表I : Q -NtADH构建体的内切葡聚糖酶活性增强。
权利要求
1.多核苷酸构建体,其包含(a)至少一种源自病毒的翻译增强子元件,其与至少一种源自细胞基因的翻译增强子元件串联堆叠,以及(b)有效连接的编码目的多肽的多核苷酸。
2.权利要求I的多核苷酸构建体,其中所述病毒是植物病毒。
3.权利要求2的多核苷酸构建体,其中所述病毒是RNA病毒。
4.权利要求3的多核苷酸构建体,其中所述病毒为组IV(+) ssRNA病毒的成员,并且其中源自所述病毒的所述翻译增强子元件包含所述病毒的前导肽序列(5’ UTR)。
5.权利要求4的多核苷酸构建体,其中所述病毒为烟草花叶病毒(Tobamovirus)属的成员,或者选自马铃薯Y病毒科(Potyviridae)、雀麦花叶病毒科(Bromoviridae)和蕃爺丛 矮病毒科(Tombusviridae)的科的成员。
6.权利要求5的多核苷酸构建体,其中所述病毒选自烟草花叶病毒(TMV)、烟草蚀纹病毒(TEV)、苜蓿花叶病毒(AMV)和玉米坏死线条病毒(丽eSV)。
7.权利要求6的多核苷酸构建体,其中所述病毒为TMV,并且其中源自所述TMV的所述翻译增强子元件包含SEQ ID NO: I中所示的前导肽序列或者其功能性片段或变体,其中所述变体与SEQ ID NO: I中所示的序列具有至少95%的序列同一性。
8.权利要求6的多核苷酸构建体,其中所述病毒为TEV,并且其中源自所述TEV的所述翻译增强子元件包含SEQ ID NO:2或SEQ ID NO: 18中所示的前导肽序列或者其功能性片段或变体,其中所述变体与SEQ ID N0:2或SEQ ID NO: 18中所示的序列具有至少95%的序列同一,I"生。
9.权利要求6的多核苷酸构建体,其中所述病毒为AMV或丽eSV,并且其中源自所述AMV或所述丽eSV的所述翻译增强子元件包含SEQ ID NO: 3或SEQ ID NO: 19中所示的前导肽序列或者其功能性片段或变体,其中所述变体与SEQ ID NO: 3或SEQ ID NO: 19中所示的序列具有至少95%的序列同一性。
10.权利要求I的多核苷酸构建体,其中所述源自细胞基因的翻译增强子元件为醇脱氢酶基因。
11.权利要求10的多核苷酸构建体,其中所述醇脱氢酶基因来自单子叶植物或双子叶植物。
12.权利要求10的多核苷酸构建体,其中所述醇脱氢酶基因来自烟草、水稻、拟南芥、大豆或玉米。
13.权利要求10的多核苷酸构建体,其中源自所述细胞基因的所述翻译增强子元件包含SEQ ID N0:4中所示的烟草醇脱氢酶前导肽序列或者其功能性片段或变体,其中所述变体与SEQ ID N0:4中所示的序列具有至少95%的序列同一性。
14.权利要求10的多核苷酸构建体,其中源自所述细胞基因的所述翻译增强子元件包含SEQ ID NO:7中所示的玉米醇脱氢酶前导肽序列或者其功能性片段或变体,其中所述变体与SEQ ID N0:7中所示的序列具有至少95%的序列同一性。
15.包含权利要求13的多核苷酸构建体的表达盒。
16.包含权利要求14的多核苷酸构建体的表达盒。
17.权利要求15的表达盒,其中所述多核苷酸构建体有效连接至在植物细胞中具有功能的启动子,并且其中所述启动子选自组成型启动子、诱导型启动子和组织特异性启动子。
18.权利要求16的表达盒,其中所述多核苷酸构建体有效连接至在植物细胞中具有功能的启动子,并且其中所述启动子选自组成型启动子、诱导型启动子和组织特异性启动子。
19.包含权利要求I的多核苷酸构建体的植物。
20.包含权利要求17的多核苷酸构建体的植物。
21.包含权利要求18的多核苷酸构建体的植物。
22.权利要求19的植物,其中所述多核苷酸构建体或所述表达盒稳定地整合到该植物的基因组中,并且其中所述多核苷酸构建体有效连接至在植物细胞中具有功能的启动子。
23.权利要求20的植物,其中所述多核苷酸构建体或所述表达盒稳定地整合到该植物的基因组中,并且其中所述多核苷酸构建体有效连接至在植物细胞中具有功能的启动子。
24.权利要求21的植物,其中所述多核苷酸构建体或所述表达盒稳定地整合到该植物 的基因组中,并且其中所述多核苷酸构建体有效连接至在植物细胞中具有功能的启动子。
25.权利要求22的植物的细胞,其中所述细胞包含稳定地整合到其基因组中的所述多核苷酸构建体或所述表达盒,并且其中所述多核苷酸构建体有效连接至在植物细胞中具有功能的启动子。
26.权利要求23的植物的细胞,其中所述细胞包含稳定地整合到其基因组中的所述多核苷酸构建体或所述表达盒,并且其中所述多核苷酸构建体有效连接至在植物细胞中具有功能的启动子。
27.权利要求24的植物的细胞,其中所述细胞包含稳定地整合到其基因组中的所述多核苷酸构建体或所述表达盒,并且其中所述多核苷酸构建体有效连接至在植物细胞中具有功能的启动子。
28.权利要求22的植物的种子,其中所述种子包含稳定地整合到其基因组中的所述多核苷酸构建体或所述表达盒,并且其中所述多核苷酸构建体有效连接至在植物细胞中具有功能的启动子。
29.权利要求23的植物的种子,其中所述种子包含稳定地整合到其基因组中的所述多核苷酸构建体或所述表达盒,并且其中所述多核苷酸构建体有效连接至在植物细胞中具有功能的启动子。
30.权利要求24的植物的种子,其中所述种子包含稳定地整合到其基因组中的所述多核苷酸构建体或所述表达盒,并且其中所述多核苷酸构建体有效连接至在植物细胞中具有功能的启动子。
全文摘要
本文提供了增加目标多肽在植物及其植物部分中表达的组合物和方法。本发明的组合物是多核苷酸构建体,其包括(a)至少一种源自病毒的翻译增强子元件,其与至少一种源自细胞基因的翻译增强子元件串联堆叠,以及(b)一种编码目标多肽的有效连接的多核苷酸。本发明还提供了包含这些多核苷酸构建体的表达盒、载体以及转基因植物和植物部分。本文还提供了利用本发明的多核苷酸构建体和表达盒增加目标多肽在植物及其植物部分中表达的方法。
文档编号C12N15/64GK102753700SQ201080042872
公开日2012年10月24日 申请日期2010年9月2日 优先权日2009年9月4日
发明者A·德布里希特, K·阿扎卡南达姆 申请人:先正达参股股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1