用于转基因表达的植物启动子和3’UTR的制作方法

文档序号:17490551发布日期:2019-04-23 20:26阅读:819来源:国知局
用于转基因表达的植物启动子和3’UTR的制作方法

本申请要求2016年6月16日提交的美国临时专利申请序列号62/350898的权益

本发明整体涉及植物分子生物学领域,并且更具体地讲,涉及植物中转基因的表达。



背景技术:

许多植物物种能够通过转基因转化以引入农艺学上所需的性状或特征。所得的植物物种经开发和/或修饰以具有具体的所需性状。一般来讲,所需性状包括例如改善营养价值质量、增加产率、赋予害虫或疾病抗性、增加干旱和胁迫耐受性、改善园艺质量(例如,色素沉着和生长)、赋予除草剂耐受性、使得能够由植物产生工业上适用的化合物和/或材料、和/或使得能够产生药物。

包含多个转基因的转基因植物物种经由植物转化技术而产生,所述多个转基因叠堆在单个基因组基因座处。植物转化技术使得将转基因引入植物细胞中,回收植物基因组中含有稳定整合的转基因拷贝的可育转基因植物,并且经由植物基因组的转录和翻译的后续转基因表达产生具有所需性状和表型的转基因植物。然而,允许产生转基因植物物种以高表达经工程改造为性状叠堆的多个转基因的机制是所需的。

同样,允许转基因在植物的特定组织或器官内表达的机制也是所需的。例如,增加植物对土壤传播的病原体感染的抗性可通过用病原体抗性基因转化植物基因组,使得病原体抗性蛋白在植物根内稳健表达来实现。或者,可能需要在处于特定生长或发育阶段(诸如,细胞分裂或伸长)中的植物组织中表达转基因。此外,可能需要在植物的叶和茎组织中表达转基因以提供针对除草剂的耐受性,或针对地面上昆虫和害虫的抗性。

因此,需要可驱动转基因在特定植物组织中实现所需水平的表达的新的基因调控元件。



技术实现要素:

在本公开的实施方案中,本公开涉及一种核酸载体,其包含可操作地连接至多聚接头或短多核苷酸序列、非水稻(oryzasativa)泛素-3基因、或多聚接头/短多核苷酸序列和非水稻泛素-3基因的组合的3’utr,即zmexp18544.1。在该实施方案的这些方面,3’utr包含与seqidno:1具有至少90%序列同一性的多核苷酸序列。另外的实施方案包括包含长度为1001bp的多核苷酸的3’utr。还包括与seqidno:1的3’utr共享的80%、85%、90%、92.5%、95%、97.5%、99%、或99.9%序列同一性的多核苷酸。多个实施方案包括还包含编码选择性标记的序列的核酸载体。还考虑了核酸载体的实施方案,其中所述3’utr可操作地连接至转基因。这样的转基因的实例包括赋予杀昆虫抗性、除草剂耐受性、氮使用效率、水使用效率或营养品质的选择性标记或基因产物。还考虑了核酸载体的实施方案,其中所述3’utr可操作地连接至rnai表达多核苷酸。

在其他方面,本公开涉及一种核酸(或多核苷酸),其包含与seqidno:2具有至少80%、85%、90%、92.5%、95%、97.5%、99%、和99.9%序列同一性的启动子多核苷酸序列。因此,将这样的启动子结合到包含seqidno:1的3’utr的核酸载体中。在该实施方案的多个方面,启动子(例如seqidno:2)可操作地连接至多聚接头或转基因的5’末端,并且3’utr可操作地连接至多聚接头或转基因的3’末端。此实施方案中还包括核酸载体,其中启动子还包含内含子或5'–utr。随后,含有seqidno:2的启动子和seqidno:1的3’utr的核酸载体驱动以组成型组织特异性表达来表达转基因。

在其他方面,本公开涉及包含与seqidno:1具有至少90%序列同一性的可操作地连接至转基因的多核苷酸序列的植物。因此,植物是单子叶或双子叶植物。植物的具体实例包括玉蜀黍、小麦、稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、拟南芥属(arabidopsis)、烟草、向日葵和芥花。在多个实施方案中,可以转化此类植物,其中将转基因插入所述植物的基因组中。在另外的实施方案中,该植物包含含有与seqidno:2具有至少80%、85%、90%、92.5%、95%、97.5%、99%、或99.9%序列同一性的多核苷酸序列的启动子。在此类实施方案中,seqidno:1的长度为1001bp。在该实施方案的一个方面,3’utr可操作地连接至转基因。在其他实施方案中,该植物包含含有与seqidno:1具有至少80%、85%、90%、92.5%、95%、97.5%、99%、或99.9%序列同一性的多核苷酸序列的3’utr。在此类实施方案中,seqidno:1的长度为1001bp。在该实施方案的一个方面,seqidno:1的3'utr可操作地连接至转基因。此外,多个实施方案涉及包含seqidno:2的启动子或水稻泛素-3基因启动子的植物,其中转基因表达是组成型的。同样,多个实施方案涉及包含seqidno:1的3’utr的植物,其中转基因表达是组成型或组织特异性表达,如通过用于驱动转基因的启动子所确定的。

在其他方面,本公开涉及一种用于产生转基因植物细胞的方法。这样的方法利用基因表达盒来转化植物细胞,该基因表达盒包含可操作地连接至至少一个所关注的多核苷酸序列的水稻泛素-3基因3’utr。接下来,该方法公开了分离包含该基因表达盒的经转化的植物细胞。另外,该方法考虑了产生转基因植物细胞,该转基因植物细胞包含可操作地连接至至少一个所关注的多核苷酸序列的水稻泛素-3基因3’utr。同样,该方法包括使该转基因植物细胞再生成转基因植物。此外,该方法包括获得转基因植物,其中该转基因植物包含基因表达盒,该基因表达盒包含可操作地连接至至少一个所关注的多核苷酸序列的水稻泛素-3基因3’utr。在这样的实施方案中,转化植物细胞的方法用植物转化法进行。在其他实施方案中,转化植物细胞的方法导致稳定整合至转基因植物细胞的基因组中的所关注的多核苷酸序列。在此类实施方案的多个方面,水稻泛素-3基因3’utr包含seqidno:1的多核苷酸。

在其他方面,本公开涉及一种分离的多核苷酸,其包含与seqidno:1的多核苷酸具有至少80%、85%、90%、92.5%、95%、97.5%、99%、或99.9%序列同一性的核酸序列。在一个实施方案中,分离的多核苷酸还包含编码多肽的开放阅读框多核苷酸;以及启动子序列。在另一个实施方案中,seqidno:1的多核苷酸的长度为1001bp。

在本公开的实施方案中,本公开涉及一种核酸载体,其包含可操作地连接至以下部分的3’utr:多聚接头序列;非水稻泛素-3样基因;或多聚接头序列和非水稻泛素-3基因样基因的组合,其中所述3’utr包含与seqidno:1具有至少90%序列同一性的多核苷酸序列。在一些实施方案中,3’utr的长度为1001bp。在另外的实施方案中,3’utr由与seqidno:1具有至少90%序列同一性的多核苷酸序列组成。在其他实施方案中,3’utr终止编码选择性标记的多核苷酸的表达。在另外的实施方案中,3’utr可操作地连接至转基因。在该实施方案的方面,转基因编码赋予杀昆虫抗性、除草剂耐受性、氮使用效率、水使用效率或营养品质的选择性标记或基因产物。提供了与启动子一起使用的seqidno:1的3’utr,该启动子多核苷酸序列包含与seqidno:2具有至少90%序列同一性的序列,其中该启动子多核苷酸序列可操作地连接至所述多聚接头或所述转基因。在其他实施方案中,提供了与任何已知的植物启动子序列一起使用的seqidno:1的3’utr,该启动子序列包含与seqidno:2或与水稻泛素-3基因启动子序列具有至少90%序列同一性的序列。在另一个实施方案中,seqidno:1的3’utr用于组成型或组织特异性表达。

在又一个实施方案中,本公开提供包含与seqidno:1具有至少90%序列同一性的可操作地连接至转基因或接头序列的多核苷酸序列的植物。根据该实施方案,该植物选自:玉蜀黍、小麦、稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、拟南芥属(arabidopsis)、烟草、向日葵和芥花。随后,在一些实施方案中,包含与seqidno:1具有至少90%序列同一性的多核苷酸序列的植物可以是玉米植物。在其他实施方案中,将可操作地连接至与seqidno:1具有至少90%序列同一性的多核苷酸序列的转基因插入至植物基因组中。在一些实施方案中,与seqidno:1具有至少90%序列同一性的多核苷酸序列是3’utr并且所述3’utr可操作地连接至转基因。在其他实施方案中,植物包含具有seqidno:2的启动子序列或与seqidno:2具有至少90%序列同一性的启动子序列,其中该启动子序列可操作地连接至转基因。在另一个实施方案中,与seqidno:1具有至少90%序列同一性的多核苷酸序列用于以组成型或组织特异性表达来表达转基因。在另一个实施方案中,与seqidno:1具有至少90%序列同一性的多核苷酸序列的长度为1001bp。

在一个实施方案中,本公开提供了一种用于产生转基因植物细胞的方法,该方法包括以下步骤:用包含可操作地连接至至少一个所关注的多核苷酸序列的水稻泛素-3基因3’utr的基因表达盒转化植物细胞;分离包含该基因表达盒的经转化的植物细胞;以及产生包含可操作地连接至至少一个所关注的多核苷酸序列的水稻泛素-3基因3’utr的转基因植物细胞。在其他实施方案中,用植物转化方法进行转化植物细胞的步骤。该植物转化方法可选自:农杆菌属(agrobacterium)介导的转化方法、基因枪转化方法、碳化硅转化方法、原生质体转化方法和脂质体转化方法。在其他实施方案中,所关注的多核苷酸序列在整个转基因植物细胞中组成型表达。在一些实施方案中,所关注的多核苷酸序列稳定整合至转基因植物细胞的基因组中。因此,用于产生转基因植物细胞的方法还可以包括以下步骤:使转基因植物细胞再生成转基因植物;以及获得转基因植物,其中该转基因植物包含基因表达盒,该基因表达盒包含可操作地连接至至少一个所关注的多核苷酸序列的seqidno:1的水稻泛素-3基因3’utr。在一个实施方案中,转基因植物细胞为单子叶转基因植物细胞或双子叶转基因植物细胞。例如,双子叶转基因植物细胞可选自:拟南芥属植物细胞、烟草植物细胞、大豆植物细胞、芥花植物细胞和棉花植物细胞。另外,单子叶转基因植物细胞选自:玉蜀黍植物细胞、稻植物细胞和小麦植物细胞。用在该方法中的水稻泛素-3基因3’utr可包含seqidno:1的多核苷酸。在多个实施方案中,水稻泛素-3基因3’utr还可以包含可操作地连接至seqidno:1的3'末端的所关注的第一多核苷酸序列。

在一个实施方案中,本公开提供一种用于在植物细胞中表达所关注的多核苷酸序列的方法,该方法包括将可操作地连接至水稻泛素-3基因3’utr的所关注的多核苷酸序列引入植物细胞中。在一些实施方案中,可操作地连接至水稻泛素-3基因3’utr的所关注的多核苷酸序列通过植物转化法引入植物细胞中。因此,该植物转化方法可选自:农杆菌属介导的转化方法、基因枪转化方法、碳化硅转化方法、原生质体转化方法和脂质体转化方法。在实施方案中,所关注的多核苷酸序列在整个植物细胞中组成型表达。在一些实施方案中,所关注的多核苷酸序列稳定整合至植物细胞的基因组中。因此,转基因植物细胞为单子叶植物细胞或双子叶植物细胞。例如,双子叶植物细胞选自:拟南芥属植物细胞、烟草植物细胞、大豆植物细胞、芥花植物细胞和棉花植物细胞。另外,单子叶植物细胞选自:玉蜀黍植物细胞、稻植物细胞和小麦植物细胞。

在一个实施方案中,本公开提供了一种转基因植物细胞,其包含水稻泛素-3基因3’utr。在一些实施方案中,转基因植物细胞包含转基因事件。在该实施方案的一个方面,转基因事件包含农艺学性状。因此,农艺学性状选自:杀昆虫抗性性状、除草剂耐受性性状、氮使用效率性状、水使用效率性状、营养品质性状、dna结合性状、选择性标记性状、小rna性状或其任何组合。在其他实施方案中,农艺学性状包括除草剂耐受性性状。在该实施方案的一个方面,除草剂耐受性性状包括aad-1编码序列。在一些实施方案中,转基因植物细胞产生商品。该商品为经选择的蛋白浓缩物、蛋白分离物、谷物、食物、面粉、油或纤维。在一个实施方案中,转基因植物细胞选自由双子叶植物细胞或单子叶植物细胞。因此,单子叶植物细胞为玉蜀黍植物细胞。在其他实施方案中,水稻泛素-3基因3’utr包含与seqidno:1的多核苷酸具有至少90%序列同一性的多核苷酸。在又一个实施方案中,水稻泛素-3基因3’utr的长度为1001bp。在其他实施方案中,水稻泛素-3基因3’utr由seqidno:1组成。在其他实施方案中,水稻泛素-3基因3’utr用于以组成型或组织特异性方式表达农艺学性状。

本公开提供一种分离的多核苷酸,其包含与seqidno:1的多核苷酸具有至少90%序列同一性的核酸序列。在一些实施方案中,分离的多核苷酸驱动组成型或组织特异性表达。在其他实施方案中,分离的多核苷酸在植物细胞内具有表达活性。在多个实施方案中,分离的多核苷酸包含编码多肽的开放阅读框多核苷酸;以及启动子序列。另外的实施方案包括包含与seqidno:1的多核苷酸具有至少90%序列同一性的核酸序列的分离的多核苷酸,其中seqidno:1的多核苷酸的长度为1001bp。

参考下文结合附图进行的对若干实施方案的详细说明,前述特征和其他特征将变得更加明显。

附图说明

图1:该图是质粒pdab116099的示意图,该质粒包含seqidno:2的水稻(稻)启动子(标记为“osubi3启动子”)和seqidno:1的水稻泛素-3基因3’utr(标记为“zmexp18544.1”)。这些调控元件可操作地连接至cry34ab1基因。此质粒上还包含aad-1基因表达盒,该基因表达盒包含玉米泛素1启动子(标记为“zmubi1启动子”)和玉米脂肪酶3’-utr(标记为“zmlip33’utr”)。这些调控元件可操作地连接至aad-1基因。

图2:此图为质粒pdab113121的示意图,该质粒包含玉米泛素1启动子(标记为“zmubi1启动子”)和马铃薯(solanumtuberosum)蛋白酶抑制剂-ii基因3’-utr(标记为“stpinii3’utr”)。这些调控元件可操作地连接至来自杯水母(phialidium)物种的黄色荧光蛋白(标记为“phiyfp”)。此质粒上还包含aad-1基因表达盒,该基因表达盒包含玉米泛素1启动子(标记为“zmubi1启动子”)和玉米脂肪酶3’-utr(标记为“zmlip33’utr”)。这些调控元件可操作地连接至aad-1基因。

具体实施方式

i.若干实施方案的概述

转基因植物产品的开发正变得越来越复杂。商业上可行的转基因植物目前需要将多个转基因叠堆至单个基因座上。用于基础研究或生物技术应用的植物启动子和3‘utr一般为单向的,仅导向已融合在其启动子的3'末端(下游)或其3’utr的5’末端(上游)的一个基因。因此,每个转基因通常均需要启动子和3’utr以用于表达,其中表达一个基因叠堆内的多个转基因需要多个调控元件。随着基因叠堆中的转基因的数目增加,常规地使用相同的启动子和/或3’utr以获得不同转基因的最佳水平的表达模式。获得最佳水平的转基因表达是产生单个多基因性状必需的。令人遗憾的是,已知由相同的启动子和/或3’utr驱动的多基因构建体引起基因沉默,从而在本领域中产生不太有效的转基因产物。重复的启动子和/或3’utr元件可引起基于同源性的基因沉默。另外,转基因内的重复序列可引起基因在基因座内的同源重组,导致多核苷酸重排。转基因的沉默和重排将可能对所产生的转基因植物表达转基因的性能具有不期望的影响。另外,由于启动子重复而引起的转录因子(tf)结合位点过量可造成内源性tf耗尽,引起转录失活。考虑到需要将多个基因引入植物中以用于代谢工程改造和性状叠堆,需要多个启动子和/或3’utr以产生驱动多个基因表达的转基因作物。

启动子和/或3’utr鉴别中的具体问题是需要鉴别与植物中的具体细胞类型、发育阶段和/或功能相关的在其他植物组织中不表达的组织特异性启动子。组织特异性(即,组织优选的)或器官特异性启动子驱动诸如植物的果仁、根、叶或绒毡层的某些组织中的基因表达。组织和发育阶段特异性启动子和/或3’utr可最初从观察基因的表达来鉴别,该基因在特定组织中或在植物发育期间的特定时间段表达。这些组织特异性启动子和/或3’utr是转基因植物行业中的某些应用所需的,并且由于其允许异源基因以组织和/或发育阶段选择性方式特异性表达而是期望的,从而表明异源基因有差异地在各种器官、组织和/或时间表达,但不在其他组织中表达。例如,增加植物对土壤传播的病原体感染的抗性可通过用病原体抗性基因转化植物基因组,使得病原体抗性蛋白在植物根内稳健表达来实现。或者,可能需要在处于特定生长或发育阶段(诸如,细胞分裂或伸长)中的植物组织中表达转基因。另一个应用是期望使用组织特异性启动子和/或3’utr限制编码农艺学性状的转基因在如发育中的薄壁细胞的特定组织类型中表达。因此,启动子和/或3’utr鉴别中的具体问题是如何鉴别启动子以及如何将所鉴别的启动子与细胞的发育特性关联以用于特异性组织表达。

关于启动子鉴别的另一个问题是需要克隆所有相关顺式作用和反式活化转录控制元件以便所克隆的dna片段以期望的特定表达模式驱动转录。考虑到此类控制元件位于翻译启动或起始位点远侧,被选为包含启动子的多核苷酸的大小对于提供启动子多核苷酸序列的表达水平和表达模式至关重要。已知的是,启动子长度包括功能信息,并且不同的基因经证实具有比基因组中其他基因的启动子更长或更短的启动子。阐明启动子的转录起始位点和预测启动子区中的功能性基因元件具有挑战性。进一步增加挑战性的是调控基序以及顺式和反式调控元件的复杂性、多样性和固有简并性(blanchette、mathieu等人,"genome-widecomputationalpredictionoftranscriptionalregulatorymodulesrevealsnewinsightsintohumangeneexpression.”genomeresearch16.5(2006):656-668)。顺式和反式调控元件位于启动子的远侧部分,该启动子调节基因的空间和时间表达以仅在所需位点和特定时间存在(porto、milenasilva等人,"plantpromoters:anapproachofstructureandfunction."molecularbiotechnology56.1(2014):38-49)。现有启动子分析工具无法可靠地鉴别基因组序列中的此类顺式调控元件,从而预测太多假阳性,因为这些工具一般仅集中于序列含量(fickettjw,hatzigeorgiouag(1997)eukaryoticpromoterrecognition.genomeresearch7:861–878)。因此,鉴别启动子调控元件需要获得具有特定大小的适当序列,该序列将导致以所需方式驱动可操作地连接的转基因的表达。

本发明提供通过使用水稻泛素-3基因调控元件克服此类问题以在植物中表达转基因的方法和组合物。

ii.术语和缩写

在本专利申请通篇中,使用了许多术语。为了提供对本说明书和权利要求书(包括给出此类术语的范围)的清楚和一致的理解,提供以下定义。

如本文所用,术语“内含子”是指基因(或所关注的表达多核苷酸序列)中所包含的已转录但未翻译的任何核酸序列。内含子包括dna的表达序列以及由其转录的rna分子中的相应序列内的非翻译核酸序列。本文所述的构建体也可含有增强翻译和/或mrna稳定性的序列,诸如内含子。一个这样的内含子的实例是拟南芥(arabidopsisthaliana)的组蛋白h3变体的基因ii的第一内含子或任何其他通常已知的内含子序列。内含子可与启动子序列组合使用以增强翻译和/或mrna稳定性。

如本文所用,术语“分离的”意指已从其天然环境中移除,或当首先形成该化合物时从所存在的其他化合物中移除。术语“分离的”涵盖从天然来源分离的材料以及通过在宿主细胞中的重组表达而制备之后回收的材料(例如核酸和蛋白质),或化学合成的化合物(诸如核酸分子、蛋白质和肽)。

如本文所用,术语“纯化的”涉及以如下形式分离分子或化合物:基本上不含天然或自然环境中通常与该分子或化合物相关联的污染物,或当首先形成该化合物时,基本上增加相对于其他存在的化合物的浓度,并且意指由于与原始组合物的其他组分分离而增加纯度。术语“纯化的核酸”在本文中用于描述与包括(但不限于)多肽、脂质和碳水化合物的其他生物化合物分离、分离产生或分离纯化,同时实现组分的化学或功能改变的核酸序列(例如,核酸可通过移除染色体中的蛋白污染物以及断裂连接该核酸与其余dna的化学键而从染色体纯化)。

如本文所用,术语“合成”是指经由化学合成作为体外方法形成的多核苷酸(即,dna或rna)分子。例如,合成dna可在反应期间在eppendorftm管内形成,以便由天然dna或rna链酶促产生合成dna。可采用其他实验室方法合成多核苷酸序列。寡核苷酸可在寡核苷酸合成仪上使用胺基磷酸酯经由固相合成来化学合成。所合成的寡核苷酸可彼此退火连接为复合物,从而产生“合成”多核苷酸。用于化学合成多核苷酸的其他方法是本领域已知的,并且可易于实施以用于本公开。

如本文所用,术语“约”意指比所述值或值范围大或小10%,但不旨在将任何值或值范围指定为仅此宽泛定义。每个前面有术语“约”的值或值范围也旨在涵盖所述绝对值或值范围的实施方案。

出于本公开的目的,“基因”包括编码基因产物(参见下文)的dna区,以及调节基因产物的产生的所有dna区,无论此类调控序列是否邻近编码序列和/或转录序列。因此,基因包括(但不一定限于)启动子序列、终止子、翻译调控序列(诸如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、绝缘子、边界元件、复制起点、基质附接位点和基因座控制区。

如本文所用,术语“天然”或“自然”定义自然界中存在的条件。“天然dna序列”是自然界中存在的通过天然手段或传统育种技术产生而非通过遗传工程改造(例如,使用分子生物学/转化技术)产生的dna序列。

如本文所用,“转基因”定义为编码基因产物的核酸序列,包括例如(但不限于)mrna。在一个实施方案中,转基因是外源性核酸,其中该转基因序列已通过遗传工程改造引入通常未发现该转基因的宿主细胞中(或其子代)。在一个实例中,转基因编码工业上或医药学上有用的化合物,或为编码所需农业性状的基因(例如,除草剂抗性基因)。在又一实例中,转基因是反义核酸序列,其中该反义核酸序列的表达抑制靶标核酸序列的表达。在一个实施方案中,转基因是内源性核酸,其中该内源性核酸的另外基因组拷贝是所需的;或相对于宿主生物体中的靶标核酸序列呈反义方向的核酸。

如本文所用,术语“非水稻泛素-3转基因”或“非水稻泛素-3基因”是与水稻泛素-3基因编码序列(seqidno:5,genbankncbi登录号np_001053957.1)具有小于80%序列同一性的任何转基因。

本文定义的“基因产物”是通过该基因产生的任何产物。例如,基因产物可为基因的直接转录产物(例如mrna、trna、rrna、反义rna、干扰rna、核酶、结构rna或任何其他类型的rna)或通过mrna翻译产生的蛋白质。基因产物也包括通过诸如加帽、聚腺苷酸化、甲基化和编辑的方法修饰的rna以及通过例如甲基化、乙酰化、磷酸化、泛素化、adp核糖基化、豆蔻酰化和糖基化修饰的蛋白质。基因表达可受到外部信号的影响,例如细胞、组织或生物体暴露于增加或减少基因表达的药剂。基因表达也可以在从dna到rna再到蛋白质的途径中的任何位置受到调控。调控基因表达例如通过控制对转录、翻译、rna转运和加工、中间分子(诸如mrna)降解的作用,或通过在特异性蛋白分子已产生之后的活化、失活、区室化或降解,或这些的组合而发生。基因表达可通过本领域已知的任何方法,包括但不限于northern印迹法、rt-pcr、western印迹法,或者体外、原位或体内蛋白质活性测定法,在rna水平或蛋白质水平测量。

如本文所用,术语“基因表达”涉及使核酸转录单元(包括例如基因组dna)的编码信息转化成细胞的操作性、非操作性或结构部分的过程,其通常包括蛋白质合成。基因表达可能受到外部信号的影响,例如细胞、组织或生物体暴露于增加或减少基因表达的药剂。基因表达也可以在从dna到rna再到蛋白质的途径中的任何位置受到调控。调控基因表达例如通过控制对转录、翻译、rna转运和加工、中间分子(诸如mrna)降解的作用,或通过在特异性蛋白分子已产生之后的活化、失活、区室化或降解,或这些的组合而发生。基因表达可通过本领域已知的任何方法,包括但不限于northern印迹法、rt-pcr、western印迹法,或者体外、原位或体内蛋白质活性测定法,在rna水平或蛋白质水平测量。

如本文所用,“基于同源性的基因沉默”(hbgs)是包括转录基因沉默和转录后基因沉默二者的通用术语。靶标基因座通过非连锁沉默基因座的沉默可由于产生分别对应于启动子或转录序列的双链rna(dsrna)而由转录抑制(转录基因沉默;tgs)或mrna降解(转录后基因沉默;ptgs)引起。每个过程中不同细胞组分的参与表明dsrna诱导的tgs和ptgs可能由古老的常见机制的多样化引起。然而,tgs和ptgs的严格比较已难以实现,因为其通常依赖于对不同沉默基因座的分析。在一些情况下,单个转基因基因座可由于产生对应于不同靶标基因的启动子和转录序列的dsrna而触发tgs和ptgs二者。mourrain等人(2007)planta225:365-79。sirna可能为在同源序列上触发tgs和ptgs的实际分子:sirna将在此模型中通过将转基因序列的甲基化扩展至内源性启动子中而以顺式和反式触发同源序列的沉默和甲基化。

如本文所用,术语“核酸分子”(或“核酸”或“多核苷酸”)可以指核苷酸的聚合形式,可包括rna、cdna、基因组dna的有义链和反义链两者,以及上述各项的合成形式和混合聚合物。核苷酸可以指核糖核苷酸、脱氧核糖核苷酸,或这两种类型核苷酸中任一者的修饰形式。如本文所用的“核酸分子”与“核酸”和“多核苷酸”是同义词。除非另外指明,否则核酸分子的长度通常至少为10个碱基。该术语可指具有不确定长度的rna或dna分子。该术语包括单链和双链形式的dna。核酸分子可包括天然存在的核苷酸和经修饰的核苷酸中的任一者或它们二者,它们通过天然存在的核苷酸连接和/或非天然存在的核苷酸键合而连接在一起。

如本领域技术人员易于理解的那样,核酸分子可被化学修饰或生物化学修饰,或者可含有非天然的或衍生化的核苷酸碱基。此类修饰包括例如标记物、甲基化、用类似物置换天然存在的核苷酸中的一者或多者、核苷酸间修饰(例如,不带电键合:例如膦酸甲酯、磷酸三酯、氨基磷酸酯、氨基甲酸酯等;带电键合:例如硫代磷酸酯、二硫代磷酸酯等;悬垂部分:例如肽类;嵌入剂:例如吖啶、补骨脂素等;螯合剂;烷化剂;以及经修饰的键合:例如α异头核酸等)。术语“核酸分子”还包括任何拓扑构象,包括单链的、双链的、部分双链体的、三链体的、发夹形的、圆形的和挂锁形的(padlocked)构象。

转录以5′至3′方式沿着dna链前进。这意味着rna通过将核糖核苷酸-5'-三磷酸按顺序添加至生长链的3’末端(同时必需消去焦磷酸)来制备。在线性或环状核酸分子中,如果散在元件(例如,特定核苷酸序列)在另一个元件的5'方向结合或将结合相同的核酸,则可将其称为相对于该另一个元件“上游”或“5’”。类似地,如果散在元件在另一个元件的3’方向为或将结合相同的核酸,则可将其称为相对于该另一个元件“下游”或“3'”。

如本文所用,碱基“位置”是指指定核酸内给定碱基或核苷酸残基的位置。指定核酸可通过与参考核酸的比对(参见下文)来定义。

杂交涉及两股多核苷酸链通过氢键结合。寡核苷酸及其类似物通过互补碱基之间的氢键杂交,该氢键包括沃森-克里克(watson-crick)氢键、胡斯坦(hoogsteen)氢键或反向胡斯坦氢键。一般来讲,核酸分子由含氮碱基组成,该含氮碱基为嘧啶(胞嘧啶(c)、尿嘧啶(u)和胸腺嘧啶(t))或嘌呤(腺嘌呤(a)和鸟嘌呤(g))。这些含氮碱基在嘧啶和嘌呤之间形成氢键,并且嘧啶与嘌呤的键结称为“碱基配对”。更具体地讲,a将与t或u氢键结合,g将与c氢键结合。“互补”是指在两个不同核酸序列之间或在相同核酸序列的两个不同区之间存在碱基配对。

“可特异性杂交”和“特异性互补”是表示互补程度足以使得在寡核苷酸和dna或rna靶标之间发生稳定和特异性结合的术语。寡核苷酸无需与其可特异性杂交的靶标序列100%互补。当寡核苷酸与靶标dna或rna分子的结合干扰靶标dna或rna的正常功能时,该寡核苷酸为可特异性杂交的,并且在需要特异性结合的条件下,例如在体内分析或系统的情况下、在生理条件下,存在足够的互补程度以避免该寡核苷酸与非靶标序列的非特异性结合。此类结合称为特异性杂交。

导致特定严格性程度的杂交条件将根据选择的杂交方法的性质和杂交核酸序列的组成和长度而变化。一般来讲,杂交的温度和杂交缓冲液的离子强度(尤其是na+和/或mg2+浓度)将有助于杂交的严格性,但洗涤次数也影响严格性。关于获得特定严格性程度所需的杂交条件的计算在sambrook等人(编),molecularcloning:alaboratorymanual,第2版,第1-3卷,coldspringharborlaboratorypress,coldspringharbor,newyork,1989,第9和11章中有所讨论。

如本文所用,“严格条件”涵盖杂交将仅在杂交分子与dna靶标之间存在小于50%错配时才发生的条件。“严格条件”包括另外的特定严格性水平。因此,如本文所用,“中等严格性”条件是序列错配超过50%的分子不会杂交的条件;“高严格性”条件是错配超过20%的序列不会杂交的条件;而“极高严格性”条件是错配超过10%的序列不会杂交的条件。

在具体实施方案中,严格条件可包括在65℃下杂交,接着在65℃下用0.1×ssc/0.1%sds洗涤40分钟。

以下是代表性的非限制性杂交条件:

极高严格性:在5×ssc缓冲液中在65℃下杂交16小时;在2×ssc缓冲液中在室温下洗涤两次,每次15分钟;以及在0.5×ssc缓冲液中在65℃下洗涤两次,每次20分钟。

高严格性:在5×-6×ssc缓冲液中在65-70℃下杂交16-20小时;在2×ssc缓冲液中在室温下洗涤两次,每次5-20分钟;以及在1×ssc缓冲液中在55-70℃下洗涤两次,每次30分钟。

中等严格性:在6×ssc缓冲液中在室温至55℃下杂交16-20小时;在2×-3×ssc缓冲液中在室温至55℃下至少洗涤两次,每次20-30分钟。

在具体实施方案中,可特异性杂交的核酸分子可在极高严格性杂交条件下保持结合。在这些和其他实施方案中,可特异性杂交的核酸分子可在高严格性杂交条件下保持结合。在这些和其他实施方案中,可特异性杂交的核酸分子可在中等严格性杂交条件下保持结合。

寡核苷酸:寡核苷酸是短的核酸聚合物。寡核苷酸可通过切割较长的核酸区段、或通过使单独的核苷酸前体聚合而形成。自动合成仪允许合成长度多达几百个碱基的寡核苷酸。由于寡核苷酸可与互补的核苷酸序列结合,所以可用作检测dna或rna的探针。由小dna序列组成的寡核苷酸(寡脱氧核糖核苷酸)可在pcr(一种用于扩增dna的技术)中使用。在pcr中,寡核苷酸通常被称为“引物”,其允许dna聚合酶延伸寡核苷酸并复制互补链。

如本文所用,术语“序列同一性”或“同一性”在本文中在两个核酸或多肽序列的环境下使用时可指两个序列中的残基在指定比较窗口上比对最大对应性时为相同的。

如本文所用,术语“序列同一性百分比”可以指通过在比较窗口上比较两个最佳比对序列(例如,核酸序列和氨基酸序列)确定的值,其中为了实现这两个序列的最佳比对,该比较窗口中的序列部分相比于参考序列(其不含添加或缺失)可包含添加或缺失(即,空位)。通过确定在两个序列中出现相同的核苷酸或氨基酸残基的位置的数目而产生匹配位置数,用该匹配位置数除以比较窗口中位置的总数,将结果乘以100而产生序列同一性的百分比,从而计算出该百分比。

用于比较的序列比对方法是本领域熟知的。各种程序和比对算法描述于例如以下文献中:smith和waterman(1981)adv.appl.math.2:482;needleman和wunsch(1970)j.mol.biol.48:443;pearson和lipman(1988)proc.natl.acad.sci.u.s.a.85:2444;higgins和sharp(1988)gene73:237-44;higgins和sharp(1989)cabios5:151-3;corpet等人(1988)nucleicacidsres.16:10881-90;huang等人(1992)comp.appl.biosci.8:155-65;pearson等人(1994)methodsmol.biol.24:307-31;tatiana等人(1999)femsmicrobiol.lett.174:247-50。序列比对方法和同源性计算的详细考虑事项可见于例如altschul等人,(1990)j.mol.biol.215:403-10。

美国国家生物技术信息中心(ncbi)基本局部比对搜索工具(blasttm;altschul等人(1990))可从几个源头(包括美国国家生物技术信息中心(bethesda,md))获得并且可在互联网上获得,以便结合几种序列分析程序使用。怎样使用该程序确定序列同一性的描述可在互联网上blasttm的“帮助”部分获得。为了比较核酸序列,可以使用默认参数执行blasttm(blastn)程序的“blast2序列”功能。当通过此方法评估时,与参考序列具有甚至更大相似性的核酸序列将显示同一性百分比增加。

如本文所用,术语“可操作地连接”涉及当第一核酸序列与第二核酸序列成功能关系时,第一核酸序列与第二核酸序列可操作地连接。例如,当启动子影响编码序列的转录或表达时,启动子与编码序列可操作地连接。当以重组方式产生时,可操作地连接的核酸序列通常是邻接的,并且在必要时可将两个蛋白质编码区连接在同一个阅读框内。然而,核酸无需邻接以便可操作地连接。

如本文所用,术语“启动子”是指一般位于基因上游(朝向基因的5'区)并且为起始和驱动基因转录所需的dna区。启动子可使其控制的基因适当活化或抑制。启动子可含有由转录因子识别的特异性序列。这些因子可结合至启动子dna序列,其导致rna聚合酶(由基因编码区合成rna的酶)的募集。启动子通常是指位于基因上游的所有基因调控元件,包括上游启动子、5'-utr、内含子和前导序列。

如本文所用,术语“上游启动子”是指足以引导转录起始的邻接多核苷酸序列。如本文所用,上游启动子涵盖转录起始位点和多个序列基序,包括tata盒、起始序列、tfiib识别元件和其他启动子基序(jennifer,e.f.等人,(2002)genes&dev.,16:2583-2592)。上游启动子提供rna聚合酶ii与如tfiia、b、d、e、f和h的基本或通用转录因子的作用位点,rna聚合酶ii是多亚基酶。这些因子组装成转录前起始复合物,该复合物催化由dna模板合成rna。

上游启动子的活化通过另外序列的调节dna序列元件来进行,该调节dna序列元件被各种蛋白质结合并且随后与转录起始复合物相互作用以活化基因表达。这些基因调控元件序列与特异性dna结合因子相互作用。这些序列基序有时可称为顺式元件。组织特异性或发育特异性转录因子单独地或组合地结合的此类顺式元件可在转录水平下决定启动子的时空表达模式。这些顺式元件在其施加于可操作地连接的基因的控制类型方面变化广泛。一些元件用于响应于环境反应(例如,温度、湿度和受伤)而增加可操作地连接的基因的转录。其他顺式元件可对发育线索(例如,发芽、种子成熟以及开花)或对空间信息(例如,组织特异性)作出响应。参见例如langridge等人,(1989)proc.natl.acad.sci.usa86:3219-23。这些顺式元件位于距转录起始点的不同距离处,一些顺式元件(称为近端元件)邻近最小核心启动子区,而其他元件可位于启动子(增强子)上游或下游的几千个碱基处。

如本文所用,术语“5'非翻译区”或“5'-utr”定义为前mrna或成熟mrna的5'末端的非翻译区段。例如,在成熟mrna上,5'-utr通常在其5'末端含有7-甲基鸟苷帽并且参与很多过程,诸如剪接、聚腺苷酸化、mrna输出至细胞质、由翻译机器鉴别mrna的5'末端以及保护mrna免于降解。

如本文所用,术语“转录终止子”定义为前mrna或成熟mrna的3'末端的转录区段。例如,“聚腺苷酸化信号”位点之外的较长dna延伸转录为前mrna。此dna序列通常含有转录终止信号以便将前mrna适当加工为成熟mrna。

如本文所用,术语“3’非翻译区”或“3'-utr”定义为前mrna或成熟mrna的3'末端的非翻译区段。例如,在成熟mrna上,此区含有聚(a)尾部并且已知在mrna稳定性、翻译起始和mrna输出中具有许多作用。另外,3'-utr被视为包括聚腺苷酸化信号和转录终止子。

如本文所用,术语“聚腺苷酸化信号”指示mrna转录物中存在的核酸序列,当存在聚(a)聚合酶时,允许转录物在例如位于聚(a)信号下游10至30个碱基处的聚腺苷酸化位点上聚腺苷酸化。许多聚腺苷酸化信号是本领域已知的并且适用于本发明。示例性序列包括aauaaa及其变体,如lokej.等人,(2005)plantphysiology138(3);1457-1468所述。

“dna结合转基因”是编码dna结合蛋白的多核苷酸编码序列。dna结合蛋白随后能够结合至另一个分子。结合蛋白可结合至例如dna分子(dna结合蛋白)、rna分子(rna结合蛋白)和/或蛋白质分子(蛋白质结合蛋白)。就蛋白质结合蛋白而言,其可结合至其自身(以形成同源二聚体、同源三聚体等),和/或其可结合至一种或多种不同的蛋白质的一个或多个分子。结合蛋白可具有超过一种类型的结合活性。例如,锌指蛋白具有dna结合、rna结合和蛋白质结合活性。

dna结合蛋白的实例包括;可“经工程改造”为结合至预定核苷酸序列的大范围核酸酶、锌指、crispr和tale结合域。通常,经工程改造的dna结合蛋白(例如,锌指、crispr或tale)是非天然存在的蛋白质。用于工程改造dna结合蛋白的方法的非限制性实例是设计和选择。所设计的dna结合蛋白是自然界中不存在的蛋白质,其设计/组成大体上由合理准则产生。设计的合理准则包括取代法则和计算机化算法的应用,以处理现有zfp、crispr和/或tale设计和结合数据的数据库储存信息中的信息。参见例如美国专利6,140,081、6,453,242和6,534,261;也可参见wo98/53058;wo98/53059;wo98/53060;wo02/016536和wo03/016496以及美国专利公开号20110301073、20110239315和20119145940。

“锌指dna结合蛋白”(或结合域)是通过一个或多个锌指以序列特异性方式结合dna的蛋白质或较大蛋白质内的区域,该锌指是结合域内的氨基酸序列区,该结合域的结构通过锌离子的配位稳定。术语锌指dna结合蛋白通常缩写为锌指蛋白或zfp。锌指结合域可“经工程改造”为结合至预定核苷酸序列。用于工程改造锌指蛋白的方法的非限制性实例是设计和选择。所设计的锌指蛋白是自然界中不存在的蛋白质,其设计/组成大体上由合理准则产生。设计的合理准则包括取代法则和计算机化算法的应用,以处理现有zfp设计和结合数据的数据库储存信息中的信息。参见例如美国专利号6,140,081、6,453,242、6,534,261和6,794,136;也可参见wo98/53058、wo98/53059、wo98/53060、wo02/016536和wo03/016496。

在其他实例中,一种或多种核酸酶的dna结合域包含天然存在或经工程改造的(非天然存在的)tal效应子dna结合域。参见例如美国专利公开号20110301073,其全文以引用方式并入本文。已知黄单胞菌属(xanthomonas)的植物病原细菌在重要作物中引起许多疾病。黄单胞菌属的病原性取决于保守性iii型分泌(t3s)系统,该系统将更多不同的效应蛋白注入植物细胞中。转录活化因子样(talen)效应子在这些注入的蛋白质中,其模拟植物转录活化因子并且操控植物转录物组(参见kay等人,(2007)science318:648-651)。这些蛋白质含有dna结合域和转录活化域。一种最充分表征的tal效应子是来自野油菜黄单胞菌辣椒斑点病致病变种(xanthomonascampestgrispv.vesicatoria)的avrbs3(参见bonas等人,(1989)molgengenet218:127-136和wo2010079430)。tal效应子含有串联重复序列的集中域,每个重复序列含有大约34个氨基酸,它们是这些蛋白质的dna结合特异性的关键。另外,它们含有核定位序列和酸性转录活化域(评述参见schornacks等人,(2006)jplantphysiol163(3):256-272)。另外,在植物病原性细菌青枯雷尔氏菌(ralstoniasolanacearum)中,已发现青枯雷尔氏菌生物变种菌株gmi1000和生物变种4菌株rs1000中命名为brg11和hpx17的两种基因与黄单胞菌属的avrbs3家族同源(参见heuer等人,(2007)applandenviromicro73(13):4379-4384)。这些基因的核苷酸序列彼此具有98.9%的同一性,但不同之处在于hpx17的重复序列域中缺失1,575bp。然而,两种基因产物与黄单胞菌属avrbs3家族蛋白质具有小于40%序列同一性。参见例如美国专利公开号20110301073,其全文以引用方式并入。

这些tal效应子的特异性取决于串联重复序列中所发现的序列。重复序列包含大约102bp并且重复序列通常彼此91-100%同源(bonas等人,同上)。重复序列的多态性通常位于位置12和13处,并且在位置12和13处的高变双残基的标识与tal效应子的靶标序列的连续核苷酸标识之间似乎存在一对一的对应性(参见moscou和bogdanove,(2009)science326:1501和boch等人,(2009)science326:1509-1512)。已通过实验方式测定用于这些tal效应子的dna识别的天然编码,使得位置12和13处的hd序列结合至胞嘧啶(c),ng结合至t,ni结合至a、c、g或t,nn结合至a或g,并且ing结合至t。这些dna结合重复序列已与新的组合和数量的重复序列组装成蛋白质,以制造人工转录因子,该人工转录因子能够与新序列相互作用并且活化非内源性报告基因在植物细胞中的表达(boch等人,同上)。经工程改造的tal蛋白已连接至foki切割半域,以产生在酵母报告基因分析(基于质粒的靶标)中表现出活性的tal效应子域核酸酶融合物(talen)。

crispr(规律成簇的间隔短回文重复序列)/cas(crispr相关)核酸酶系统是最近经工程改造的核酸酶系统,其基于可用于基因组工程改造的细菌系统。其基于许多细菌和古菌的适应性免疫应答的一部分。当病毒或质粒侵入细菌时,侵入者dna的区段通过“免疫”应答转化成crisprrna(crrna)。然后此crrna通过部分互补区与称为tracrrna的另一种类型的rna关联,以将cas9核酸酶引导至与靶标dna中的crrna同源的称为“原型间隔子”的区。cas9在crrna转录物内含有的20个核苷酸的引导序列指定的位点处切割dna,以在双链断裂(dsb)处产生钝端。cas9需要crrna和tracrrna二者,用于位点特异性dna识别和切割。此系统现已经工程改造为使得crrna和tracrrna可组合为一个分子(“单个引导rna”),并且单个引导rna的crrna等同部分可经工程改造为引导cas9核酸酶靶向任何所需序列(参见jinek等人,(2012)science337,第816-821页,jinek等人,(2013),elife2:e00471,以及davidsegal,(2013)elife2:e00563)。因此,crispr/cas系统可经工程改造为在基因组中的所需靶标处形成dsb,并且dsb的修复可受修复抑制剂的使用影响,以使易错修复增加。

在其他实例中,dna结合转基因是包含经工程改造的(非天然存在的)大范围核酸酶(也称为归巢核酸内切酶)的位点特异性核酸酶。诸如i-scei、i-ceui、pi-pspi、pi-sce、i-sceiv、i-csmi、i-pani、i-sceii、i-ppoi、i-sceiii、i-crei、i-tevi、i-tevii和i-teviii的归巢核酸内切酶或大范围核酸酶的识别序列是已知的。还可参见美国专利号5,420,032;美国专利号6,833,252;belfort等人,(1997)nucleicacidsres.25:3379–303388;dujon等人,(1989)gene82:115–118;perler等人,(1994)nucleicacidsres.22,11127;jasin(1996)trendsgenet.12:224–228;gimble等人,(1996)j.mol.biol.263:163–180;argast等人,(1998)j.mol.biol.280:345–353和newenglandbiolabs产品目录。另外,归巢核酸内切酶和大范围核酸酶的dna结合特异性可经工程改造为结合非天然靶标位点。参见例如chevalier等人,(2002)molec.cell10:895-905;epinat等人,(2003)nucleicacidsres.531:2952-2962;ashworth等人,(2006)nature441:656-659;paques等人,(2007)currentgenetherapy7:49-66;美国专利公开号20070117128。归巢核酸内切酶和大范围核酸酶的dna结合域可在核酸酶作为整体的背景下改变(即,使得核酸酶包括同源切割域)或可融合至异源切割域。

如本文所用,术语“转化”涵盖可将核酸分子导入这种细胞中的所有技术。实例包括但不限于:用病毒载体转染;用质粒载体转化;电穿孔;脂质体转染;显微注射(mueller等人,(1978)cell15:579-85);农杆菌属介导的转移;直接dna摄入;whiskerstm介导的转化;以及微粒轰击。这些技术可用于植物细胞的稳定转化和瞬时转化二者。“稳定转化”是指核酸片段引入宿主生物体基因组中产生的基因稳定遗传。一旦稳定转化,核酸片段即稳定整合进宿主生物体和任何子代的基因组中。含有经转化核酸片段的宿主生物体称为“转基因”生物体。“瞬时转化”是指核酸片段引入宿主生物体的细胞核或含dna的细胞器中,在无基因稳定遗传的情况下产生的基因表达。

外源性核酸序列。在一个实例中,转基因是基因序列(例如,除草剂抗性基因)、编码工业或药学上有用的化合物的基因或编码所需农业性状的基因。在又一个实例中,转基因是反义核酸序列,其中该反义核酸序列的表达抑制靶标核酸序列的表达。转基因可含有可操作地连接至转基因的调控序列(例如,启动子)。在一些实施方案中,所关注的多核苷酸序列是转基因。然而,在其他实施方案中,所关注的多核苷酸序列是内源性核酸序列,其中该内源性核酸序列的另外基因组拷贝为所需的,或相对于宿主生物体的靶标核酸分子的序列呈反义方向的核酸序列。

如本文所用,术语转基因“事件”通过以下步骤产生:用异源性dna(即包括所关注的转基因的核酸构建体)转化植物细胞,从转基因插入至植物基因组引起植物群体的再生,以及选择通过插入至特定基因组位置而表征的特定植物。术语“事件”是指包括异源性dna的原始转化子以及转化子的子代。术语“事件”也指通过转化子与包括基因组/转基因dna的另一个品种之间的有性异型杂交产生的子代。即使在与回交亲本重复回交之后,来自转化亲本的插入转基因dna和侧接基因组dna(基因组/转基因dna)仍存在于杂交子代的相同染色体位置。术语“事件”也指来自原始转化子及其子代的dna,其包括插入dna和紧邻插入dna的侧接基因组序列,预期该dna转移至子代,该子代接受包括所关注的转基因的插入dna,包括所关注的转基因是一个包括插入dna(例如,原始转化子和自交产生的子代)的亲本系与不含插入dna的亲本系的有性杂交的结果。

如本文所用,术语“聚合酶链式反应”或“pcr”定义扩增微量核酸、rna和/或dna的程序或技术,如1987年7月28日授予的美国专利号4,683,195所述。一般来讲,来自所关注区域末端或以外的序列信息需要是可用的,以便可设计寡核苷酸引物;这些引物的序列将与待扩增的模板的相反链一致或类似。两个引物的5'末端核苷酸可与扩增物质的末端一致。pcr可用于扩增特异性rna序列、来自总基因组dna的特异性dna序列以及从总细胞rna转录的cdna、噬菌体或质粒序列等。通常参见mullis等人,coldspringharborsymp.quant.biol.,51:263(1987);erlich编,pcrtechnology,(stocktonpress,ny,1989)。

如本文所用,术语“引物”是指当条件适于合成引物延伸产物时,能够充当沿着互补链合成的起始点的寡核苷酸。合成条件包括存在四种不同的脱氧核糖核苷酸三磷酸和至少一种聚合诱导剂,诸如逆转录酶或dna聚合酶。它们存在于合适的缓冲液中,该缓冲液可包含在各种合适的温度下作为辅因子或影响诸如ph等条件的成分。引物优选地为单链序列,以使得扩增效率得以优化,但也可采用双链序列。

如本文所用,术语“探针”是指与靶标序列杂交的寡核苷酸。在型分析程序中,探针与定位于两个引物的退火位点之间的一部分靶标杂交。探针包括约八个核苷酸、约十个核苷酸、约十五个核苷酸、约二十个核苷酸、约三十个核苷酸、约四十个核苷酸或约五十个核苷酸。在一些实施方案中,探针包括约八个核苷酸至约十五个核苷酸。探针还可包括可检测标记,例如荧光团(texas-异硫氰酸荧光素等)。可检测标记可直接共价连接至探针寡核苷酸,例如位于探针的5'末端或探针的3'末端。包括荧光团的探针也可另外包括淬灭剂,例如blackholequenchertm、iowablacktm等。

如本文所用,术语“限制性核酸内切酶”和“限制性酶”是指细菌酶,它们中的每一者在特异性核苷酸序列处或附近切割双链dna。2型限制性酶在相同位点识别和切割dna,并且包括但不限于xbai、bamhi、hindiii、ecori、xhoi、sali、kpni、avai、psti和smai。

如本文所用,术语“载体”与术语“构建体”、“克隆载体”和“表达载体”可互换使用,并且意指可将dna或rna序列(例如,外源性基因)引入宿主细胞以便转化宿主和促进所引入的序列表达(例如,转录和翻译)的载体。“非病毒载体”旨在意指不含病毒或逆转录病毒的任何载体。在一些实施方案中,“载体”是包含至少一个dna复制起点和至少一个选择性标记基因的dna序列。实例包括但不限于质粒、粘粒、噬菌体、细菌人工染色体(bac)或将外源性dna携带到细胞中的病毒。载体也可包括一个或多个基因、反义分子和/或选择性标记基因以及本领域已知的其他遗传元件。载体可以转导、转化或感染细胞,从而引起细胞表达核酸分子和/或由该载体编码的蛋白质。术语“质粒”定义在原核或真核宿主细胞中能够常染色体复制的环形核酸链。该术语包括可为dna或rna并且可为单链或双链的核酸。具有该定义的质粒也可包括对应于细菌复制起点的序列。

如本文所用,本文所用的术语“选择性标记基因”定义基因或其他表达盒,其编码有助于鉴别插入选择性标记基因的细胞的蛋白质。例如,“选择性标记基因”涵盖报告基因以及用于植物转化以便例如保护植物细胞免受选择性药剂的影响或提供对选择性药剂的抗性/耐受性的基因。在一个实施方案中,只有接受功能选择性标记的那些细胞或植物才能够在具有选择性药剂的条件下分裂或生长。选择性药剂的实例可包括例如抗生素,包括大观霉素(spectinomycin)、新霉素(neomycin)、卡那霉素(kanamycin)、巴龙霉素(paromomycin)、庆大霉素(gentamicin)和潮霉素(hygromycin)。这些选择性标记包括新霉素磷酸转移酶(nptii),其表达赋予对抗生素卡那霉素抗性的酶;和相关抗生素新霉素、巴龙霉素、庆大霉素和g418的基因;或潮霉素磷酸转移酶(hpt)的基因,其表达赋予对潮霉素抗性的酶。其他选择性标记基因可包括编码包括bar或pat的除草剂抗性的基因(针对草铵膦(glufosinateammonium)或草丁膦(phosphinothricin)的抗性);乙酰乳酸合酶的基因(als,针对诸如磺酰脲(su)、咪唑啉酮(imi)、三唑并嘧啶(tp)、嘧啶基氧基苯甲酸酯(pob)以及磺酰基胺基羰基三唑啉酮(防止支链氨基酸合成第一步)的抑制剂的抗性)、编码草甘膦(glyphosate)、2,4-d和金属抗性或敏感性的基因。可用作选择性标记基因的“报告基因”的实例包括目测观察所表达的报告基因蛋白,诸如编码β-葡糖醛酸酶(gus)、荧光素酶、绿色荧光蛋白(gfp)、黄色荧光蛋白(yfp)、dsred、β-半乳糖苷酶、氯霉素乙酰转移酶(cat)、碱性磷酸酶等等的蛋白质。短语“标记阳性”是指植物已经转化为包括选择性标记基因。

如本文所用,术语“可检测标记”是指能够检测的标记,诸如放射性同位素、荧光化合物、生物发光化合物、化学发光化合物、金属螯合剂或酶。可检测标记的实例包括但不限于:荧光标记(例如fitc、若丹明(rhodamine)、镧系磷光体)、酶标记(例如辣根过氧化酶、β-半乳糖苷酶、荧光素酶、碱性磷酸酶)、化学发光标记、生物素基、被二级报告基因识别的预先确定的多肽表位(例如亮氨酸拉链对序列、二抗的结合位点、金属结合域、表位标签)。在一个实施方案中,可检测标记可通过各种长度的间隔臂连接以减小潜在的空间位阻。

如本文所用,术语“盒”、“表达盒”和“基因表达盒”是指可在特定限制性位点或通过同源重组插入核酸或多核苷酸中的dna区段。如本文所用,该dna区段包含编码所关注的多肽的多核苷酸,并且盒和限制性位点被设计为确保将盒插入适当的阅读框以便转录和翻译。在一个实施方案中,表达盒可包括编码所关注的多肽的多核苷酸,并且具有除有助于特定宿主细胞转化的多核苷酸以外的元件。在一个实施方案中,基因表达盒也可包括允许编码所关注的多肽的多核苷酸在宿主细胞中增强表达的元件。这些元件可包括但不限于:启动子、最小启动子、增强子、应答元件、终止子序列、聚腺苷酸化序列等等。

如本文所用,“接头”或“间隔子”是使两个分离实体彼此结合的键、分子或分子群。接头和间隔子可向两个实体提供最佳间距,或还可提供允许两个实体彼此分离的不稳定键合。不稳定键合包括可光裂解基团、酸不稳定部分、碱不稳定部分和可酶切基团。如本文所用,术语“多聚接头”或“多克隆位点”定义彼此位于核酸序列上的10个核苷酸内的三个或更多个2型限制酶位点簇。在其他情况下,本文所用的术语“多聚接头”是指通过任何已知无缝克隆方法(即,gibsonnebuilderhifidnagoldengateassembly、assembly等)经靶向以接合两个序列的一段核苷酸。包含多聚接头的构建体用于诸如基因编码区的核酸序列的插入和/或切除。

如本文所用,术语“对照”是指在用于比较目的的分析程序中所用的样品。对照可为“阳性”或“阴性”的。例如,在分析程序的目的为检测细胞或组织中差异表达的转录物或多肽的情况下,通常优先包括阳性对照,诸如已知表现所需表达的植物样品;以及阴性对照,诸如已知缺乏所需表达的植物样品。

如本文所用,术语“植物”包括完整植物和植物的任何后代、细胞、组织或部分。可用于本发明中的植物类别通常与受到诱变的高等和低等植物类别一样广泛,包括被子植物(单子叶和双子叶植物)、裸子植物、蕨类植物和多细胞藻类。因此,“植物”包括双子叶植物和单子叶植物。术语“植物部分”包括植物的任何部分,包括例如而不限于:种子(包括成熟种子和未成熟种子);植物插条;植物细胞;植物细胞培养物;植物器官(例如,花粉、胚芽、花、果实、芽、叶、根、茎和外植体)。植物组织或植物器官可以是种子、原生质体、愈伤组织或组织成结构或功能单元的任何其他植物细胞群。植物细胞或组织培养物能够再生具有由其获得细胞或组织的植物生理和形态特征的植物,并且能够再生具有与该植物基本上相同基因型的植物。相比之下,一些植物细胞不能够再生而产生植物。植物细胞或组织培养物中的可再生细胞可以是胚芽、原生质体、分生细胞、愈伤组织、花粉、叶、花药、根、根尖、穗丝、花、果仁、穗、穗轴、果壳或梗。

植物部分包括可收获部分以及适用于子代植物繁殖的部分。适用于繁殖的植物部分包括例如而不限于:种子、果实、插条、幼苗、块茎以及根茎。植物的可收获部分可以是植物的任何可用部分,包括例如而不限于:花、花粉、幼苗、块茎、叶、茎、果实、种子以及根。

植物细胞是植物的结构和生理单元,包括原生质体和细胞壁。植物细胞可以是分离的单细胞或细胞聚集物(例如,脆弱的愈伤组织和培养细胞)形式,并且可以是高等组织单元(例如,植物组织、植物器官和植物)的一部分。因此,植物细胞可以是原生质体、配子产生细胞或可再生成完整植物的细胞或细胞集合。因此,包含多个植物细胞并且能够再生成完整植物的种子在本文的实施方案中视为“植物细胞”。

如本文所用,术语“小rna”是指许多类别的非编码核糖核酸(ncrna)。术语小rna描述在细菌细胞、动物、植物和真菌中产生的短链ncrna。这些短链ncrna可在细胞内天然产生或可通过引入表达短链或ncrna的外源性序列而产生。小rna序列不直接编码蛋白质,并且在功能方面与其他rna不同,因为小rna序列只转录但不翻译。小rna序列参与其他细胞功能,包括基因表达和修饰。小rna分子通常由约20至30个核苷酸组成。小rna序列可来源于较长前体。前体形成在自身互补区彼此折回的结构;然后它们通过动物中的核酸酶dicer或植物中的核酸酶dcl1加工。

许多类型的小rna以天然或人工产生的形式存在,包括微rna(mirna)、短干扰rna(sirna)、反义rna、短发夹rna(shrna)和小核仁rna(snorna)。某些类型的小rna(诸如微rna和sirna)在基因沉默和rna干扰(rnai)中是重要的。基因沉默为遗传调控方法,其中通常应表达的基因由细胞内元件(在此情况下,小rna)“关闭”。通常应通过此遗传信息形成的蛋白质由于干扰而不形成,并且基因中的编码信息由表达阻断。

如本文所用,术语“小rna”涵盖文献中称为“微小rna”(storz,(2002)science296:1260-3;illangasekare等人,(1999)rna5:1482-1489)、原核“小rna”(srna)(wassarman等人,(1999)trendsmicrobiol.7:37-45)、真核“非编码rna(ncrna)”、“微rna(mirna)”、“小非mrna(snmrna)”、“功能性rna(frna)”、“转移rna(trna)”、“催化性rna”[例如,核酶,包括自身酰化核酶(illangaskare等人,(1999)rna5:1482-1489)]、“小核仁rna(snorna)”、“tmrna”(也称为“10srna”,muto等人,(1998)trendsbiochemsci.23:25-29;以及gillet等人,(2001)molmicrobiol.42:879-885)的rna分子;rnai分子包括但不限于“小干扰rna(sirna)”、“内切核糖核酸酶制备的sirna(e-sirna)”、“短发夹rna(shrna)”和“小时间调节rna(strna)”、“切割的sirna(d-sirna)”和适体;包含至少一个尿嘧啶碱基的寡核苷酸和其他合成核酸。

除非另外特别地解释,否则本文使用的全部技术术语和科学术语具有与本公开所属领域的普通技术人员通常所理解的相同的含义。分子生物学的常见术语的定义可见于例如:lewin,genesv,oxforduniversitypress,1994(isbn0-19-854287-9);kendrew等人(编),theencyclopediaofmolecularbiology,blackwellscienceltd.,1994(isbn0-632-02182-9);和meyers(编),molecularbiologyandbiotechnology:acomprehensivedeskreference,vchpublishers,inc.,1995(isbn1-56081-569-8)。

如本文所用,除非上下文清晰明确地相反指出,否则词语“一个/一种”和“该/所述”包括复数指代物。

iii.水稻泛素-3基因调控元件及包含其的核酸

提供了使用启动子或来自水稻泛素-3基因的3’utr在植物中表达非水稻泛素-3基因样转基因的方法和组合物。在一个实施方案中,3’utr可以是seqidno:1的水稻泛素-3基因3’utr。

转基因表达可通过位于基因编码序列下游的3'-非翻译基因区(即,3'-utr)来调控。启动子和3’utr均可调控转基因表达。虽然启动子为驱动转录所必需的,但是3’utr基因区可终止转录并且引发所得的mrna转录物的聚腺苷酸化,以用于翻译和蛋白质合成。3’utr基因区帮助转基因的稳定表达。在一个实施方案中,基因表达盒包含3'-utr。在一个实施方案中,3'-utr可以是水稻泛素-3基因3’-utr。在一个实施方案中,基因表达盒包含3'-utr,其中3’-utr与seqidno:1至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%相同。在一个实施方案中,基因表达盒包含可操作地连接至转基因的水稻泛素-3基因3’-utr。在一个示例性实施方案中,基因表达盒包含可操作地连接至转基因的3’-utr,其中该转基因可以是杀昆虫抗性转基因、除草剂耐受性转基因、氮使用效率转基因、水使用效率转基因、营养品质转基因、dna结合转基因、选择性标记转基因或它们的组合。

在一个实施方案中,基因表达盒包含来自水稻泛素-3基因的3’utr、和启动子,其中所述启动子与seqidno:2至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%相同。在一个实施方案中,基因表达盒包含来自水稻泛素-3基因的3’utr、和启动子,其中所述启动子来自水稻泛素-3基因。在一个实施方案中,基因表达盒包含来自水稻泛素-3基因的3’utr、和启动子,其中所述启动子源自植物(例如玉米叶绿素a/b结合基因启动子或玉米泛素1启动子)、病毒(例如木薯叶脉病毒启动子)或细菌(例如根癌农杆菌δmas)。在一个示例性实施方案中,基因表达盒包含可操作地连接至转基因的水稻泛素-3基因3’utr,其中该转基因可以是杀昆虫抗性转基因、除草剂耐受性转基因、氮使用效率转基因、水使用效率转基因、营养品质转基因、dna结合转基因、选择性标记转基因或它们的组合。

在一个实施方案中,核酸载体包含如本文所公开的基因表达盒。在一个实施方案中,载体可以是适用于直接转化或基因靶向诸如供体dna的质粒、粘粒、细菌人工染色体(bac)、噬菌体、病毒或剪切多核苷酸片段。

根据一个实施方案,提供包含重组基因表达盒的核酸载体,其中该重组基因表达盒包含:可操作地连接至多聚接头序列的水稻泛素-3基因3’utr、非水稻泛素-3基因、或其组合。在一个实施方案中,重组基因盒包含可操作地连接至非水稻泛素-3基因的水稻泛素-3基因3’utr。在一个实施方案中,重组基因盒包含可操作地连接至多聚接头序列的如本文所公开的水稻泛素-3基因3’utr。多聚接头以一定方式可操作地连接至水稻泛素-3基因3’utr,使得编码序列插入多聚接头的一个限制性位点将可操作地连接该编码序列,从而允许当载体转化或转染进宿主细胞中时表达该编码序列。

根据一个实施方案,提供了包含基因盒的核酸载体,该基因盒由基因启动子、非水稻泛素-3基因、和seqidno:1的水稻泛素-3基因3'-utr组成。在一个实施方案中,seqidno:1的水稻泛素-3基因3'-utr可操作地连接至非水稻泛素-3转基因的3’末端。在另一个实施方案中,3'非翻译序列包含seqidno:1或与seqidno:1具有80%、85%、90%、95%、99%或100%序列同一性的序列。根据一个实施方案,提供了包含基因盒的核酸载体,该基因盒由启动子、非水稻泛素-3基因和3'utr组成,其中该启动子可操作地连接至非水稻泛素-3基因的5'末端,并且seqidno:1的3'utr可操作地连接至非水稻泛素-3基因的3’末端。在另一个实施方案中,3'非翻译序列包含seqidno:1或与seqidno:1具有80%、85%、90%、95%、99%、或100%序列同一性的序列。在另一个实施方案中,3'非翻译序列由seqidno:1或与seqidno:1具有80%、85%、90%、95%、或99%序列同一性的1001bp序列组成。

在一个实施方案中,提供了核酸构建体,其包含启动子和非水稻泛素-3基因以及任选的以下元件中的一个或多个:

a)5'非翻译区;

b)内含子;以及

c)3'非翻译区,

其中,

所述启动子由seqidno:2或已知启动子序列如水稻泛素-3基因启动子组成;

该内含子区由已知内含子序列组成;以及

该3'非翻译区由seqidno:1或与seqidno:1具有98%序列同一性的序列组成;另外其中所述启动子可操作地连接至所述转基因,并且每个任选的元件(若存在)也可操作地连接至启动子和转基因二者。在另一个实施方案中,提供转基因细胞,其包含上文刚刚公开的核酸构建体。在一个实施方案中,转基因细胞是植物细胞,并且在另一个实施方案中,提供植物,其中该植物包含所述转基因细胞。

在一个实施方案中,提供了核酸构建体,其包含启动子和非水稻泛素-3转基因以及任选的以下元件中的一个或多个:

a)内含子;和

b)3'非翻译区,

其中,

所述启动子由seqidno:2或已知启动子序列如水稻泛素-3基因启动子组成;

该内含子区由已知内含子序列组成;

该3'非翻译区由seqidno:1或与seqidno:1具有98%序列同一性的序列组成;另外其中所述启动子可操作地连接至所述转基因,并且每个任选的元件(若存在)也可操作地连接至启动子和转基因二者。在另一个实施方案中,提供转基因细胞,其包含上文刚刚公开的核酸构建体。在一个实施方案中,转基因细胞是植物细胞,并且在另一个实施方案中,提供植物,其中该植物包含所述转基因细胞。

根据一个实施方案,核酸载体还包含编码选择性标记的序列。根据一个实施方案,重组基因盒可操作地连接至农杆菌属t-dna边界。根据一个实施方案,重组基因盒还包含第一和第二t-dna边界,其中该第一t-dna边界可操作地连接至基因构建体的一个末端,并且该第二t-dna边界可操作地连接至基因构建体的另一个末端。第一和第二农杆菌属t-dna边界可独立地选自来源于细菌菌株的t-dna边界序列,该t-dna边界序列选自:合成胭脂碱的农杆菌属t-dna边界、合成章鱼碱的农杆菌属t-dna边界、合成甘露碱的农杆菌属t-dna边界、合成琥珀碱的农杆菌属t-边界或它们的任何组合。在一个实施方案中,提供选自胭脂碱合成菌株、甘露碱合成菌株、琥珀碱合成菌株或章鱼碱合成菌株的农杆菌属菌株,其中所述菌株包含质粒,其中该质粒包含可操作地连接至选自seqidno:1的序列或与seqidno:1具有80、85、90、95或99%序列同一性的序列。

适用于本发明公开的构建体的所关注的转基因包括但不限于赋予(1)对害虫或疾病的抗性;(2)对除草剂的耐受性;(3)增加价值的农艺学性状,诸如产率改良、氮使用效率、水使用效率和营养品质;(4)蛋白质与dna以位点特异性方式结合;(5)表达小rna以及(6)选择性标记的编码序列。根据一个实施方案,转基因编码选择性标记或赋予杀昆虫抗性、除草剂耐受性、小rna表达、氮使用效率、水使用效率或营养品质的基因产物。

1.昆虫抗性

也称为报告基因的各种选择性标记可以可操作地连接至水稻泛素-3基因3’utr,该3’utr包含seqidno:1或与seqidno:1具有80%、85%、90%、95%或99%序列同一性的序列。然后可操作地连接的序列可并入所选载体中,以允许鉴别和选择转化的植物(“转化子”)。示例性昆虫抗性编码序列是本领域已知的。作为可以可操作地连接至本公开的调控元件的昆虫抗性编码序列的实施方案,提供以下性状。提供示例性鳞翅目(lepidopteran)昆虫抗性的编码序列包括:cry1a、cry1a.105、cry1ab、cry1ab(截短)、cry1ab-ac(融合蛋白)、cry1ac(以销售)、cry1c、cry1f(以销售)、cry1fa2、cry2ab2、cry2ae、cry9c、mocry1f、pinii(蛋白酶抑制蛋白)、vip3a(a)和vip3aa20。提供示例性鞘翅目(coleopteran)昆虫抗性的编码序列包括:cry34ab1(以销售)、cry35ab1(以销售)、cry3a、cry3bb1、dvsnf7和mcry3a。提供示例性多昆虫抗性的编码序列包括ecry31.ab。以上昆虫抗性基因的列表无意为限制性的。本公开涵盖任何昆虫抗性基因。

2.除草剂耐受性

也称为报告基因的各种选择性标记可以可操作地连接至水稻泛素-3基因3’utr,该3’utr包含seqidno:1或与seqidno:1具有80%、85%、90%、95%或99%序列同一性的序列。然后可操作地连接的序列可并入所选载体中,以允许鉴别和选择转化的植物(“转化子”)。示例性除草剂耐受性编码序列是本领域已知的。作为可以可操作地连接至本公开的调控元件的除草剂耐受性编码序列的实施方案,提供以下性状。草甘膦除草剂含有通过抑制epsps酶(5-烯醇丙酮酰莽草酸-3-磷酸合酶)的作用模式。该酶参与植物生长和发育必需的芳族氨基酸的生物合成。可用于抑制该酶的各种酶促机制是本领域已知的。编码此类酶的基因可以可操作地连接至本公开的基因调控元件。在一个实施方案中,选择性标记基因包括但不限于编码包括以下的草甘膦抗性基因的基因:突变epsps基因,诸如2mepsps基因、cp4epsps基因、mepsps基因、dgt-28基因、aroa基因;以及草甘膦降解基因,诸如草甘膦乙酰转移酶基因(gat)和草甘膦氧化酶基因(gox)。这些性状目前以gly-toltmgt和roundup销售。草铵膦和/或毕拉草(bialaphos)化合物的抗性基因包括dsm-2、bar和pat基因。bar和pat性状目前以liberty销售。还包括提供对2,4-d的抗性的耐受性基因,诸如aad-1基因(应注意aad-1基因具有对芳氧基苯氧基丙酸酯除草剂的其他活性)和aad-12基因(应注意aad-12基因具有对吡啶氧基乙酸酯合成植物生长素的其他活性)。这些性状作为作物保护技术销售。als抑制剂(磺酰脲、咪唑啉酮、三唑并嘧啶、嘧啶基硫代苯甲酸酯和磺酰基胺基-羰基-三唑啉酮)的抗性基因是本领域已知的。这些抗性基因最常由als编码基因序列的点突变引起。其他als抑制剂抗性基因包括hra基因、csr1-2基因、sr-hra基因和surb基因。一些性状以商标销售。抑制hppd的除草剂包括吡唑啉酮,诸如苄草唑(pyrazoxyfen)、吡草酮(benzofenap)和苯吡唑草酮(topramezone);三酮,诸如甲基磺草酮(mesotrione)、磺草酮(sulcotrione)、环磺酮(tembotrione)、苯并双环酮(benzobicyclon);以及二酮腈,诸如异噁唑草酮(isoxaflutole)。这些示例性hppd除草剂可被已知性状耐受。hppd抑制剂的实例包括hppdpf_w336基因(关于对异噁唑草酮的抗性)和avhppd-03基因(关于对甲基磺草酮的抗性)。苯腈除草剂耐受性状的实例包括bxn基因,其显示出赋予对除草剂/抗生素溴苯腈(bromoxynil)的抗性。汰克草(dicamba)的抗性基因包括如国际pct公开号wo2008/105890所公开的汰克草单加氧酶基因(dmo)。ppo或protox抑制剂类型除草剂(例如三氟羧草醚(acifluorfen)、氟丙嘧草酯(butafenacil)、氟丙草酯(flupropazil)、环戊恶草酮(pentoxazone)、唑草酮(carfentrazone)、异丙吡草酯(fluazolate)、吡草醚(pyraflufen)、苯草醚(aclonifen)、草芬定(azafenidin)、丙炔氟草胺(flumioxazin)、氟烯草酸(flumiclorac)、必芬诺(bifenox)、乙氧氟草醚(oxyfluorfen)、乳氟禾草灵(lactofen)、氟磺胺草醚(fomesafen)、乙羧氟草醚(fluoroglycofen)和甲磺草胺(sulfentrazone))的抗性基因为本领域已知的。赋予对ppo的抗性的示例性基因包括野生型拟南芥ppo酶的过表达(lermontovai和grimmb,(2000)overexpressionofplastidicprotoporphyrinogenixoxidaseleadstoresistancetothediphenyl-etherherbicideacifluorfen.plantphysiol122:75–83.)、枯草芽孢杆菌(b.subtilis))ppo基因(li,x.和nicholld.2005.developmentofppoinhibitor-resistantculturesandcrops.pestmanag.sci.61:277-285以及choikw,hano,leehj,yunyc,moonyh,kimmk,kukyi,hansu和guhjo,(1998)generationofresistancetothediphenyletherherbicide,oxyfluorfen,viaexpressionofthebacillussubtilisprotoporphyrinogenoxidasegeneintransgenictobaccoplants.bioscibiotechnolbiochem62:558–560.)。吡啶氧基或苯氧基丙酸和环己酮的抗性基因包括acc酶抑制剂编码基因(例如acc1-s1、acc1-s2和acc1-s3)。赋予对环己二酮和/或芳氧基苯氧基丙酸的抗性的示例性基因包括精吡氟氯禾灵(haloxyfop)、禾草灵(diclofop)、精噁唑禾草灵酸(fenoxyprop)、吡氟禾草灵(fluazifop)和喹禾灵(quizalofop)。最后,可抑制光合成的除草剂(包括三嗪或苯甲腈)通过psba基因(对三嗪的耐受性)、1s+基因(对三嗪的耐受性)和腈水解酶基因(对苯甲腈的耐受性)提供耐受性。以上除草剂耐受性基因的列表无意为限制性的。本公开涵盖任何除草剂耐受性基因。

3.农艺学性状

也称为报告基因的各种选择性标记可以可操作地连接至水稻泛素-3基因3’utr,该3’utr包含seqidno:1或与seqidno:1具有80%、85%、90%、95%或99%序列同一性的序列。然后可操作地连接的序列可并入所选载体中,以允许鉴别和选择转化的植物(“转化子”)。示例性农艺学性状编码序列是本领域已知的。作为可以可操作地连接至本公开的调控元件的农艺学性状编码序列的实施方案,提供以下性状。如pg基因所提供的延迟的果实软化抑制负责细胞壁中果胶分子断裂的聚半乳糖醛酸酶的产生,从而导致果实延迟软化。另外,acc基因的延迟果实熟化/老化用于抑制天然acc合酶基因的正常表达,从而导致乙烯产生减少和果实熟化延迟。然而,accd基因使果实熟化激素乙烯的前体代谢,从而导致果实熟化延迟。或者,sam-k基因通过减少产生乙烯的底物s-腺苷甲硫氨酸(sam)而造成熟化延迟。如cspb基因所提供的干旱胁迫耐受性表型通过保持rna稳定性和翻译而在水胁迫条件下维持正常细胞功能。另一个实例包括催化赋予水胁迫耐受性的渗透保护化合物甘氨酸甜菜碱的产生的ecbeta基因。另外,rmbeta基因催化赋予水胁迫耐受性的渗透保护化合物甘氨酸甜菜碱的产生。通过表达与一种或多种内源性转录因子相互作用以调节植物的日/夜生理过程的蛋白质的bbx32基因来提供光合成和产率提高。可通过表达编码热稳定α-淀粉酶的amy797e基因增加乙醇产量,该酶通过增加用于降解淀粉的淀粉酶的热稳定性而提高生物乙醇产量。最后,可通过表达编码二氢吡啶二羧酸酯合酶的cordapa基因产生经修饰的氨基酸组合物,该酶增加氨基酸赖氨酸的产量。以上农艺学性状编码序列的列表无意为限制性的。本公开涵盖任何农艺学性状编码序列。

4.dna结合蛋白

也称为报告基因的各种选择性标记可以可操作地连接至水稻泛素-3基因3’utr,该3’utr包含seqidno:1或与seqidno:1具有80%、85%、90%、95%或99%序列同一性的序列。然后可操作地连接的序列可并入所选载体中,以允许鉴别和选择转化的植物(“转化子”)。示例性dna结合蛋白编码序列是本领域已知的。作为可以可操作地连接至本公开的调控元件的dna结合蛋白编码序列的实施方案,可包括以下类型的dna结合蛋白:锌指、talen、crispr和大范围核酸酶。以上dna结合蛋白编码序列的列表无意为限制性的。本公开涵盖任何dna结合蛋白编码序列。

5.小rna

也称为报告基因的各种选择性标记可以可操作地连接至水稻泛素-3基因3’utr,该3’utr包含seqidno:1或与seqidno:1具有80%、85%、90%、95%或99%序列同一性的序列。然后可操作地连接的序列可并入所选载体中,以允许鉴别和选择转化的植物(“转化子”)。示例性小rna性状是本领域已知的。作为可以可操作地连接至本公开的调控元件的小rna编码序列的实施方案,提供以下性状。例如,延迟果实熟化/老化的抗efe小rna通过编码乙烯形成酶的aco基因沉默抑制乙烯产生来延迟熟化。改变木质素产量的ccomt小rna通过抑制内源性s-腺苷-l-甲硫氨酸:反式咖啡酰基coa3-o-甲基转移酶(ccomt基因)来减少愈创木基(g)木质素的含量。另外,solanumverrucosum中的黑斑伤痕耐受性可通过ppo5小rna触发ppo5转录物降解以阻断黑斑伤痕出现来减少。还包括与含有西方玉米根虫snf7基因的240bp片段的dsrna一起抑制西方玉米根虫的dvsnf7小rna。改性淀粉/碳水化合物可由诸如pphl小rna(降解phl转录物以限制通过淀粉降解形成还原糖)和pr1小rna(降解r1转录物以限制通过淀粉降解形成还原糖)的小rna产生。另外,由触发asn1降解以削弱天冬酰胺形成和减少聚丙烯酰胺的asn1小rna产生诸如丙烯酰胺减少的益处。最后,pgasppo抑制小rna的非褐变表型导致抑制ppo,从而产生具有非褐变表型的苹果。以上小rna的列表无意为限制性的。本公开涵盖任何小rna编码序列。

6.选择性标记

也称为报告基因的各种选择性标记可以可操作地连接至水稻泛素-3基因3’utr,该3’utr包含seqidno:1或与seqidno:1具有80%、85%、90%、95%或99%序列同一性的序列。然后可操作地连接的序列可并入所选载体中,以允许鉴别和选择转化的植物(“转化子”)。许多方法可用于确认选择性标记在转化植物中的表达,包括例如dna测序和pcr(聚合酶链式反应)、southern印迹法、rna印迹法、用于检测由载体表达的蛋白质的免疫方法。然而,通常通过目测观察表达时产生有色产物的蛋白质来观察报告基因。示例性报告基因是本领域已知的并且编码β-葡糖醛酸酶(gus)、荧光素酶、绿色荧光蛋白(gfp)、黄色荧光蛋白(yfp、phi-yfp)、红色荧光蛋白(dsrfp、rfp等)、β-半乳糖苷酶等等(参见sambrook等人,molecularcloning:alaboratorymanual,第三版,coldspringharborpress,n.y.,2001,其内容全文以引用方式并入本文中)。

采用选择性标记基因选择转化细胞或组织。选择性标记基因包括编码抗生素抗性的基因,诸如编码新霉素磷酸转移酶ii(neo)、大观霉素/链霉素抗性(aad)和潮霉素磷酸转移酶(hpt或hgr)的基因以及赋予对除草化合物的抗性的基因。除草剂抗性基因通常编码对除草剂不敏感的经修饰靶标蛋白或在除草剂可起作用之前使其在植物中降解或脱毒的酶。例如,已通过使用编码突变靶标酶5-烯醇丙酮酰莽草酸-3-磷酸合酶(epsps)的基因获得对草甘膦的抗性。epsps的基因和突变体是熟知的,并且在下文进一步描述。已通过使用编码pat或dsm-2、腈水解酶、aad-1或aad-12(其中每一者为使其相应除草剂脱毒的蛋白质的实例)的细菌基因获得对草铵膦、溴苯腈和2,4-二氯苯氧基乙酸酯(2,4-d)的抗性。

在一个实施方案中,除草剂可抑制生长点或分生组织,包括咪唑啉酮或磺酰脲,并且关于这些除草剂的乙酰羟基酸合酶(ahas)和乙酰乳酸合酶(als)抗性/耐受性基因是熟知的。草甘膦抗性基因分别包括突变5-烯醇丙酮酰莽草酸-3-磷酸合酶(epsp)和dgt-28基因(通过引入重组核酸和/或天然epsp基因的各种形式的活体诱变)、aroa基因和草甘膦乙酰基转移酶(gat)基因。其他膦酰基化合物的抗性基因包括来自包括吸水链霉菌(streptomyceshygroscopicus)和绿色产色链霉菌(streptomycesviridichromogenes)的链霉菌属物种的bar和pat基因,以及吡啶氧基或苯氧基丙酸和环己酮(acc酶抑制剂编码基因)。赋予对环己二酮和/或芳氧基苯氧基丙酸(包括精吡氟氯禾灵、禾草灵、精噁唑禾草灵酸、吡氟禾草灵、喹禾灵)的抗性的示例性基因包括乙酰辅酶a羧化酶(acc酶)的基因;acc1-s1、acc1-s2和acc1-s3。在一个实施方案中,除草剂可抑制光合成,包括三嗪(psba和1s+基因)或苯甲腈(腈水解酶基因)。此外,此类选择性标记可包括阳性选择标记,诸如磷酸甘露糖异构酶(pmi)。

在一个实施方案中,选择性标记基因包括但不限于编码以下的基因:2,4-d、新霉素磷酸转移酶ii、氰胺水合酶、天冬氨酸激酶、二氢吡啶二羧酸酯合酶、色氨酸脱羧酶、二氢吡啶二羧酸酯合酶和脱敏的天冬氨酸激酶、bar基因、色氨酸脱羧酶、新霉素磷酸转移酶(neo)、潮霉素磷酸转移酶(hpt或hyg)、二氢叶酸还原酶(dhfr)、草丁膦乙酰转移酶、2,2-二氯丙酸去卤酶、乙酰羟基酸合酶、5-烯醇丙酮酰莽草酸-磷酸合酶(aroa)、卤芳基腈水解酶、乙酰辅酶a羧化酶、二氢叶酸合酶(suli)和32kd光系统ii多肽(psba)。一个实施方案还包括编码对以下的抗性的选择性标记基因:氯霉素、甲胺喋呤、潮霉素、大观霉素、溴苯腈、草甘膦和草丁膦。以上选择性标记基因的列表无意为限制性的。本公开涵盖任何报告基因或选择性标记基因。

在一些实施方案中,合成在植物中最佳表达的编码序列。例如,在一个实施方案中,基因的编码序列已通过密码子优化而修饰以增强在植物中的表达。杀昆虫抗性转基因、除草剂耐受性转基因、氮使用效率转基因、水使用效率转基因、营养品质转基因、dna结合转基因或选择性标记转基因可经优化以在特定植物物种中表达,或者可经修饰以在双子叶或单子叶植物中最佳表达。植物优选的密码子可由所关注的特定植物物种中以最大量表达的蛋白质中的最高频率密码子来确定。在一个实施方案中,编码序列、基因或转基因设计为在植物中以较高水平表达,从而产生较高转化效率。用于基因的植物优化的方法是熟知的。关于合成dna序列的优化和产生的指导可见于例如以引用方式并入本文的wo2013016546、wo2011146524、wo1997013402、美国专利号6166302和美国专利号5380831。

转化

适用于植物转化的方法包括可将dna引入细胞的任何方法,例如而不限于:电穿孔(参见例如美国专利5,384,253);微粒轰击(参见例如美国专利5,015,580、5,550,318、5,538,880、6,160,208、6,399,861和6,403,865);农杆菌属介导的转化(参见例如美国专利5,635,055、5,824,877、5,591,616;5,981,840和6,384,301);以及原生质体转化(参见例如美国专利5,508,184)。

dna构建体可使用诸如与碳化硅纤维一起搅拌的技术而直接引入植物细胞的基因组dna(参见例如美国专利5,302,523和5,464,765),或dna构建体可使用诸如dna粒子轰击的基因枪方法而直接引入植物组织(参见例如klein等人(1987)nature327:70-73)。或者,dna构建体可通过纳米粒子转化而引入植物细胞(参见例如美国专利公开号20090104700,其全文以引用方式并入本文)。

另外,基因转移可使用非农杆菌属细菌或病毒来实现,诸如根瘤菌属(rhizobiumsp.)ngr234、苜蓿中华根瘤菌(sinorhizoboiummeliloti)、百脉根根瘤菌(mesorhizobiumloti)、马铃薯病毒x、花椰菜嵌纹病毒和木薯脉花叶病毒和/或烟草花叶病毒,参见例如chung等人(2006)trendsplantsci.11(1):1-4。

通过应用转化技术,几乎任何植物物种的细胞均可得到稳定转化,并且这些细胞可通过熟知的技术发育成转基因植物。例如,可在棉花转化的背景中特别适用的技术如美国专利5,846,797、5,159,135、5,004,863和6,624,344所描述;尤其用于转化芸苔属(brassica)植物的技术如例如美国专利5,750,871所描述;用于转化大豆的技术如例如美国专利6,384,301所描述;用于转化玉蜀黍的技术如例如美国专利7,060,876和5,591,616以及国际pct公开wo95/06722所描述。

在外源性核酸有效递送至受体细胞之后,通常要鉴别转化细胞以用于进一步培养和植物再生。为了提高鉴别转化子的能力,技术人员可能需要采用选择性标记基因以及用于生成转化子的转化载体。在一个示例性实施方案中,转化细胞群体可通过使细胞暴露于一种或多种选择性药剂而进行分析,或可针对所需标记基因性状筛选细胞。

可将暴露于选择剂后存活的细胞、或者在筛选测定中已被评分为阳性的细胞置于支持植物再生的培养基中培养。在一个实施方案中,任何合适的植物组织培养基可通过包括诸如生长调节剂的其他物质而修饰。可将组织维持在具有生长调节剂的基础培养基上,直到可得到足够的组织用于启动植物再生工作时为止,或者在重复多轮的手动选择之后,直到组织形态适合于再生时为止(例如,至少2周),然后转移到有益于芽形成的培养基中。定期转移培养物,直到已出现充分的芽形成时为止。一旦形成芽,就将其转移到有益于根形成的培养基中。一旦形成足够的根,就可将植物转移到土壤中,以便进一步生长和成熟。

分子确认

转化的植物细胞、愈伤组织、组织或植物可通过针对由转化dna上存在的标记基因编码的性状选择或筛选经工程改造的植物来鉴别和分离。例如,可通过使经工程改造的植物材料在含有抑制量的抗生素或除草剂的培养基上生长来进行选择,转化基因构建体赋予对该抗生素或除草剂的抗性。另外,转化植物和植物细胞也可通过筛选可存在于重组核酸构建体上的任何可见标记基因(例如,β-葡糖醛酸酶、荧光素酶或gfp基因)的活性来鉴别。此类选择和筛选方法是本领域的技术人员熟知的。可用于鉴别转基因植物的分子确认方法是本领域的技术人员已知的。许多示例性方法在下文进一步描述。

已描述在序列检测中使用的分子信标。简而言之,fret寡核苷酸探针被设计为与侧接基因组和插入dna接合点重叠。fret探针的独特结构使其含有保持荧光部分和淬灭部分紧密接近的二级结构。fret探针和pcr引物(一个引物在插入dna序列中,一个引物在侧接基因组序列中)在存在热稳定聚合酶和dntp的情况下进行循环。在成功pcr扩增之后,fret探针与靶标序列的杂交导致探针二级结构移除,并且荧光部分与淬灭部分空间分离。荧光信号指示由于成功扩增和杂交而存在侧接基因组/转基因插入序列。用于以扩增反应形式检测的此类分子信标分析是本公开的实施方案。

水解探针分析或称为(lifetechnologies,fostercity,calif.)是一种检测和定量dna序列的存在的方法。简而言之,fret寡核苷酸探针被设计成具有转基因内的一个寡核苷酸,以及用于事件特异性检测的侧接基因组序列中的一个寡核苷酸。fret探针和pcr引物(一个引物在插入dna序列中,一个引物在侧接基因组序列中)在存在热稳定聚合酶和dntp的情况下进行循环。fret探针的杂交导致fret探针上的荧光部分切割和释放远离淬灭部分。荧光信号指示由于成功扩增和杂交而存在侧接/转基因插入序列。用于以扩增反应形式检测的此类水解探针分析是本公开的实施方案。

分析是一种检测和定量dna序列的存在的方法。简而言之,使用称为分析系统的基于聚合酶链式反应(pcr)的分析筛选包含整合基因表达盒多核苷酸的基因组dna样品。用于本公开实践的分析可利用含有多个引物的pcr分析混合物。用于pcr分析混合物的引物可包含至少一个正向引物和至少一个反向引物。正向引物含有对应于dna多核苷酸的特定区的序列,并且反向引物含有对应于基因组序列的特定区的序列。另外,用于pcr分析混合物的引物可包含至少一个正向引物和至少一个反向引物。例如,pcr分析混合物可使用对应于两个不同等位基因的两个正向引物和一个反向引物。一个正向引物含有对应于内源性基因组序列的特定区的序列。第二正向引物含有对应于dna多核苷酸的特定区的序列。反向引物含有对应于基因组序列的特定区的序列。用于检测扩增反应的此类分析为本公开的一个实施方案。

在一些实施方案中,荧光信号或荧光染料选自:hex荧光染料、fam荧光染料、joe荧光染料、tet荧光染料、cy3荧光染料、cy3.5荧光染料、cy5荧光染料、cy5.5荧光染料、cy7荧光染料和rox荧光染料。

在其他实施方案中,使用能够在可通过流式细胞术检测的浓度范围使细胞dna染色并且具有可通过实时热循环仪检测的荧光发射光谱的合适第二荧光dna染料进行扩增反应。本领域的普通技术人员应理解,其他核酸染料是已知的并且不断地被鉴别出来。可采用具有适当激发和发射光谱的任何适合的核酸染料,诸如yo-sytoxsybrgreen在一个实施方案中,第二荧光dna染料是在小于10μm、小于4μm或小于2.7μm时使用的

在其他实施方案中,可使用下一代测序(ngs)进行检测。如brautigma等人,2010所述,dna序列分析可用于测定分离和扩增片段的核苷酸序列。扩增的片段可分离和亚克隆至载体,并且使用链终止子方法(也称为sanger测序)或染料终止子测序法来进行测序。另外,扩增子可使用下一代测序法来测序。ngs技术不需要亚克隆步骤,并且多个测序读取过程可在单个反应中完成。三个ngs平台可商购获得,即来自454lifesciences/roche的genomesequencerflxtm、来自solexa的illuminagenomeanalysertm和appliedbiosystems的solidtm(‘sequencingbyoligoligationanddetection’的前缀)。另外,存在两种目前正在开发的单分子测序方法。这些方法包括来自helicosbiosciencetm的truesinglemoleculesequencing(tsms)和来自pacificbiosciences的singlemoleculerealtimetm测序(smrt)。

454lifesciences/roche销售的genomesequencherflxtm是长阅读ngs,其使用乳液pcr和焦磷酸测序以产生测序读取。可使用300-800bp的dna片段或含有3-20kb片段的文库。反应每次运行可产生超过一百万次约250至400个碱基的读取,总共产生250至400兆碱基。此技术产生最长读取,但每次运行的总序列输出与其他ngs技术相比较低。

solexatm销售的illuminagenomeanalysertm是短读取ngs,其使用利用荧光染料标记的可逆终止子核苷酸的合成方法测序,并且基于固相桥式pcr。可使用含有最多10kb的dna片段的配对末端测序文库构建。反应产生超过1亿次短读取,读取长度为35-76个碱基。该数据每次运行可产生3-6千兆碱基。

appliedbiosystemstm销售的通过寡核苷酸接合和检测(solid)系统的测序是短读取技术。该ngs技术使用长度最多为10kb的片段化双链dna。该系统使用通过染料标记的寡核苷酸引物连接和乳液pcr产生十亿次短读取来测序,每次运行产生最多30千兆碱基的总序列输出。

helicosbiosciencetm的tsms和pacificbiosciencestm的smrt应用使用单个dna分子进行序列反应的不同方法。tsmshelicostm系统每次运行产生最多8亿次短读取,得到21千兆碱基。这些反应使用荧光染料标记的虚拟终止子核苷酸完成,其被称述为“合成测序”法。

pacificbiosciencestm销售的smrt下一代测序系统使用通过合成进行的实时测序。该技术由于不受可逆终止子限制,可产生长度为最多1,000bp的读取。使用该技术每天可产生相当于二倍体人类基因组的一倍覆盖度的原始读取通量。

在另一个实施方案中,可使用印迹分析完成检测,包括western印迹、northern印迹和southern印迹。此类印迹分析是生物学研究中用于生物样品的鉴别和定量的常用技术。这些分析包括首先通过电泳在凝胶中分离样品组分,接着将来自凝胶的电泳分离组分转移至转移膜,该转移膜由诸如硝化纤维素、聚偏二氟乙烯(pvdf)或尼龙(nylon)的材料制成。分析物也可直接点样在这些载体上或通过施加真空、毛细作用或压力引导至载体上的特定区域,而无需事先分离。然后通常使转移膜经受转移后处理,以增强在视觉上或通过自动化读取器彼此区分和检测分析物的能力。

在另一个实施方案中,可使用elisa分析完成检测,该分析使用固相酶免疫分析来检测液体样品或湿样品中的物质(通常是抗原)的存在。来自样品的抗原附着至平板表面。然后,将另一个特异性抗体施加到表面上以使其可与抗原结合。该抗体连接至酶,并且在最终步骤中添加含有酶底物的物质。后续反应产生可检测信号,最常见的是底物的颜色变化。

转基因植物

在一个实施方案中,植物、植物组织或植物细胞包含水稻泛素-3基因3’utr。在一个实施方案中,植物、植物组织或植物细胞包含具有选自seqidno:1的序列或与选自seqidno:1的序列具有80%、85%、90%、95%或99.5%序列同一性的序列的水稻泛素-3基因3’utr。在一个实施方案中,植物、植物组织或植物细胞包含基因表达盒,该基因表达盒包含选自seqidno:1的序列,或与选自可操作地连接至非水稻泛素-3基因的seqidno:1的序列具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个示例性实施方案中,植物、植物组织或植物细胞包含基因表达盒,该基因表达盒包含可操作地连接至转基因的水稻泛素-3基因3’utr,其中该转基因可以是杀昆虫抗性转基因、除草剂耐受性转基因、氮使用效率转基因、水使用效率转基因、营养品质转基因、dna结合转基因、选择性标记转基因或它们的组合。

根据一个实施方案,提供植物、植物组织或植物细胞,其中该植物、植物组织或植物细胞包含可操作地连接至转基因的来源于水稻泛素-3基因3’utr的序列,其中该来源于水稻泛素-3基因3’utr的序列包含序列seqidno:1的序列或与seqidno:1具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,提供植物、植物组织或植物细胞,其中该植物、植物组织或植物细胞包含可操作地连接至非水稻泛素-3基因的seqidno:1或与seqidno:1具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,植物、植物组织或植物细胞是双子叶或单子叶植物或来源于双子叶或单子叶植物的细胞或组织。在一个实施方案中,植物选自玉蜀黍、小麦、稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、向日葵和芥花。在一个实施方案中,植物是玉米。根据一个实施方案,植物、植物组织或植物细胞包含可操作地连接至非水稻泛素-3基因的seqidno:1或与seqidno:1具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,植物、植物组织或植物细胞包含可操作地连接至转基因的启动子,其中该启动子由seqidno:1或与seqidno:1具有80%、85%、90%、95%或99.5%序列同一性的序列组成。根据一个实施方案,将包含可操作地连接至转基因的水稻泛素-3基因3’utr序列的基因构建体并入植物、植物组织或植物细胞的基因组中。

在一个实施方案中,根据本文所公开的方法的植物、植物组织或植物细胞可以是双子叶植物。双子叶植物、植物组织或植物细胞可以是但不限于苜蓿、菜籽、芥花、印度芥菜、埃塞俄比亚芥菜、大豆、向日葵、棉花、菜豆、椰菜、甘蓝菜、花椰菜、芹菜、黄瓜、茄子、莴苣;甜瓜、豌豆、胡椒、花生、马铃薯、南瓜、萝卜、菠菜、甜菜、向日葵、烟草、西红柿和西瓜。

本领域的技术人员将认识到,在外源性序列稳定并入转基因植物并且确认可操作之后,即可通过有性杂交引入其他植物中。可根据待杂交的物种使用许多标准育种技术中的任一者。

本公开还涵盖上文所述的转基因植物的种子,其中该种子具有转基因或含有本公开的基因调控元件的基因构建体。本公开还涵盖上文所述的转基因植物的子代、无性系、细胞系或细胞,其中所述子代、无性系、细胞系或细胞具有转基因或含有本公开的基因调控元件的基因构建体。

本公开还涵盖上文所述的转基因植物的栽培,其中该转基因植物具有转基因或含有本公开的基因调控元件的基因构建体。因此,此类转基因植物可通过使用根据本公开的核酸分子转化而工程改造为尤其是具有一种或多种所需性状或含有本公开的基因调控元件的转基因事件,并且可通过本领域的技术人员已知的任何方法修剪或栽培。

表达转基因的方法

在一个实施方案中,在植物中表达至少一个转基因的方法包括使包含可操作地连接至至少一个转基因或多聚接头序列的水稻泛素-3基因3’-utr的植物生长。在一个实施方案中,水稻泛素-3基因3’utr由选自seqidno:1的序列或与选自seqidno:1的序列具有80%、85%、90%、95%或99.5%序列同一性的序列组成。在一个实施方案中,在植物中表达至少一个转基因的方法包括使包含水稻泛素-3基因启动子和可操作地连接至至少一个转基因的水稻泛素-3基因3’utr的植物生长。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含可操作地连接至至少一个转基因的水稻泛素-3基因3’utr的植物组织或植物细胞。

在一个实施方案中,在植物中表达至少一个转基因的方法包括使包含含有可操作地连接至至少一个转基因的水稻泛素-3基因3’utr的基因表达盒的植物生长。在一个实施方案中,水稻泛素-3基因3’utr由选自seqidno:1的序列或与选自seqidno:1的序列具有80%、85%、90%、95%或99.5%序列同一性的序列组成。在一个实施方案中,在植物中表达至少一个转基因的方法包括使包含基因表达盒的植物生长,该基因表达盒包含水稻泛素-3基因启动子和可操作地连接至至少一个转基因的水稻泛素-3基因3’utr。在一个实施方案中,在植物中表达至少一个转基因的方法包括使包含含有可操作地连接至至少一个转基因的水稻泛素-3基因3’utr的基因表达盒的植物生长。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含基因表达盒的植物组织或植物细胞,该植物组织或植物细胞包含可操作地连接至至少一个转基因的水稻泛素-3基因3’utr。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含基因表达盒、水稻泛素-3基因启动子和可操作地连接至至少一个转基因的水稻泛素-3基因3’utr的植物组织或植物细胞。

提供以下实施例以说明某些具体特征和/或实施方案。所述实施例不应被理解为将本公开局限于所例示的具体特征或实施方案。

实施例

实施例1:来自水稻泛素-3基因的优化调控元件的组合的新设计

称为3’非翻译区(3’utr)的基因特异性下游多核苷酸序列在体内通常是多功能的。rna加工和成熟已被认为是真核基因表达的转录后控制的关键控制点(szostak和gebauer,2012;wilusz和spector,2010;barrett等人,2012;和moore,2005)。这些多核苷酸序列可影响核输出率、亚细胞定位、转录物稳定性和翻译。另外,3’utr是用于由小的非编码rna控制的关键靶点。虽然这些机制中的许多机制下调基因表达,但此类调节也可用于将转录物有效地定位到特定细胞类型,以用于稳定积聚和后续基因表达(patel等人,2006)。根据对与水稻泛素-3启动子、或与其他已知启动子相关联的邻接染色体序列的评估,鉴定并分离用于异源性编码序列表达的1001bp3’utr多核苷酸序列(seqidno:1)。

seqidno:1;gcgtgtgctgtggtgcagcattggacttcattatacctatgccgctcgtctgtcatatcatcgtgtcatggttgtgttgtgttctggtttagagtccctaagttgtgttgatactattatccatactagtacaatttgcttcactgtgcatcggtaccaatcgatgatattatcattctacttctgttaatgtttctgagatgtttgatccgagatgagattctgtttgtgcattgctcacatggtcgtaaccggccactgttgcgcgtgcctgttgatcaatctgtttgcgcttgacggtttctgatgcttggaattggggtgtcgatgttggtttggttatctatcctggtatgtttgttgatttcatgcgcatttcagtctttacggcttctgatgcttggaattctaatggtgttggttgatttcacaattgggctggtgcggtttggtgcctaaaaaaaatgggagtacctatacatctttcgaaagattttgatgatcgtatcacacagattttgatgatcgtatcacacagatttttaatctttgaattaaaatccgatagatataataaaaagtaaaaagtaattaagaaacaccataatggacactaaattaccatatcctcgagaaaaagaccaaatccaataaaaaagaaaaagaccaaatccaatacaaaatttaaaatttacatgcgaagattcaaaaattacagtgtaacttacaaaagttacaatgtaagtttcataaattacactgtaacttacaagaaaatgcactgtaaatttaagtgagaaaatcgagtgagagataagaaaaaatctttcgagtgagatatagcaaaattgaaaaaaaattggtttgggcccaaaaatggttgagggcccattcggccattccccaatcccaaccatcgcgtcctactccagccgccgctgccacccacgtccgtcggcgccatggccgccgccaaggagctccttcgccggctccagcga

实施例2:载体构建(pdab116099)

构建pdab116099载体以将侧接转基因的调控多核苷酸序列的新组合并入。载体构建体pdab116099含有基因表达盒,其中cry34ab1转基因(来自苏云金芽孢杆菌的报告基因)由seqidno:2的水稻泛素-3基因启动子(水稻泛素-3启动子;sivamanie,qur,(2006),plantmolbiol60:225–239)驱动,并侧接seqidno:1的水稻泛素-3基因3’utr(zmexp18544.1)。该基因表达盒的图解如图1所示,并且以seqidno:3提供。该载体也含有选择性标记基因表达盒,该表达盒含有由玉米泛素1启动子(zmubi1启动子;christensen等人,(1992)plantmolecularbiology18;675-689)驱动并且由玉米脂肪酶3’utr(zmlip3’utr;美国专利号7,179,902)封端的aad-1转基因(aad-1;美国专利号7,838,733)。该基因表达盒的图解如图1所示,并且以seqidno:4提供。该构建体通过以下方式构建:合成来自水稻泛素-3基因的新设计的3’utr(zmexp18544.1)并将启动子克隆进geneartseamlesscloningtm(lifetechnologies)入门载体(wo2014018512)。所得的入门载体包含终止cry34ab1转基因的水稻泛素-3基因3’utr,并使用gatewaytm克隆系统(lifetechnologies)整合进目的载体,且电穿孔到根癌农杆菌菌株dat13192(国际专利公开号wo2012016222)中。获得所得二元质粒pdab116099的克隆,并分离质粒dna且通过限制性内切酶消化和测序进行确认。所得的构建体含有驱动转基因组成型表达的调控元件的组合。

组装阴性对照构建体pdab113121,其包含黄色荧光蛋白(phiyfp;shagin等人,(2004)molbiolevol21;841-50)报告基因而不是cry34ab1基因(图2)并包含玉米泛素1启动子(zmubi1启动子)和马铃薯蛋白酶抑制剂-ii3’utr(stpinii3’utr;an等人,(1989)plantcell1;115-22)调控元件。与pdab116099中存在相同的aad-1表达盒。使用与pdab116099相同的试剂和方案将该对照构建体转化到植物中。

实施例3:玉蜀黍转化

根癌农杆菌的转化

将二元表达载体转化至根癌农杆菌菌株dat13192(reca缺陷型三元菌株)(国际专利公开号wo2012016222)。选择细菌菌落,分离二元质粒dna并通过限制性酶消化来确认。

农杆菌培养启动

将来自甘油储备液的农杆菌属培养物划线于ab基本培养基(gelvin,s.,2006,agrobacteriumvirulencegeneinduction,载于wang,k.编,agrobacteriumprotocols,第二版,第1卷,humanapress,第79页;使用无蔗糖的5g/l葡萄糖和15g/lbactotm琼脂制备)上并且在20℃下暗处温育3天。然后将农杆菌属培养物划线于yep培养基平板(gelvin,s.,2006,agrobacteriumvirulencegeneinduction,载于wang,k.编,agrobacteriumprotocols,第二版,第1卷,humanapress,第79页)上并且在20℃下暗处温育1天。

在实验当天,制备体积适于实验规模的接种培养基(2.2g/lms盐、68.4g/l蔗糖、36g/l葡萄糖、115mg/ll-脯氨酸、2mg/l甘氨酸、100mg/l肌醇、0.05mg/l烟酸、0.5mg/l吡哆醇盐酸盐、0.5mg/l硫胺盐酸盐)和乙酰丁香酮的混合物。将溶于100%二甲亚砜的1m乙酰丁香酮储备溶液加入接种培养基,制成终浓度为200μm的乙酰丁香酮。

对于每个构建体,将1-2个接种环的来自yep平板的农杆菌属悬浮于50ml无菌一次性离心管内的15ml接种培养基/乙酰丁香酮混合物中,并且在分光亮度计中测定溶液在600nm下的光学密度(o.d.600)。然后使用另外的接种培养基/乙酰丁香酮混合物将悬浮液稀释至0.25-0.35o.d.600。然后在使用前将农杆菌属悬浮液管水平放置于设定为约75rpm、室温下的平台摇床上1至4小时。

玉蜀黍转化

通过从近交系玉米栽培品种b104分离的未成熟胚芽的农杆菌属介导的转化将实验构建体转化至玉蜀黍中。所用的方法类似于ishida等人,(1996)naturebiotechnol14:745-750和frame等人,(2006)plantcellrep25:1024–1034公开的那些方法,但具有许多修改和改进以使该方法能够进行高通量转化。用于在玉蜀黍中产生多个转基因事件的方法的实例在美国专利申请公开号us2013/0157369a1中给出,该方法从胚芽感染和共培养步骤开始。

实施例4:在t0时的拷贝数的分子确认

在v2-3叶阶段取样推定的转基因玉蜀黍植物,以使用cry34ab1和aad-1定量pcr测定来分析转基因的存在。根据制造商的说明使用dna提取试剂盒(qiagen)从4个叶片冲孔样品提取总dna。

为了检测所关注的基因,使用含有针对cry34ab1基因的fam标记的荧光探针和针对内源性转化酶参考基因对照的hex标记的荧光探针的引物/探针组来扩增基因特异性dna片段。以下引物用于cry34ab1和转化酶内源性参考基因扩增。

cry34ab1引物/探针:

正向引物:tq.8v6.1.f:gccataccctccagttg(seqidno:6)

反向引物:tq.8v6.1.r:gccgttgatggagtagtagatgg(seqidno:7)

探针:tq.8v6.1.mgb.p:5’-/56-fam/ccgaatccaacggcttca/mgb(seqidno:8)

转化酶引物:

正向引物:转化酶f:tggcggacgacgacttgt(seqidno:9)

反向引物:转化酶r:aaagtttggaggctgccgt(seqidno:10)

转化酶探针:5’-/5hex/cgagcagaccgccgtgtactt/3bhq_1/-3’(seqidno:11)

接下来,pcr反应在最终体积为10μl的反应体系中进行,所述反应体系包含5μl的roche480探针主混合物(rocheappliedsciences,indianapolis,in)、0.4μl来自10μm储备液的每种tq.8v6.1.f、tq.8v6.1.r、转化酶f和转化酶r引物至400nm的最终浓度、0.4μl来自5μm储备液的每种tq.8v6.1.mgb.p和转化酶探针至200nm的最终浓度、0.1μl10%的聚乙烯吡咯烷酮(pvp)至0.1%的最终浓度、2μl10ng/μl的基因组dna和0.5μl的水。dna在roche480系统中在以下条件下扩增:95℃10分钟的1个循环;以下3个步骤的40个循环:95℃10秒、58℃35秒和72℃1秒;以及4℃10秒的最终循环。cry34ab1拷贝数通过比较未知样品的目标(所关注的基因)/参考(转化酶基因)值(由480输出)与cry34ab1拷贝数对照的目标/参考值来确定。

如上针对cry34ab1基因所述,使用转化酶内源性参考基因进行aad-1基因的检测。aad-1引物序列如下;

aad1正向引物:tgttcggttccctctaccaa(seqidno:12)

aad1反向引物:caacatccatcaccttgactga(seqidno:13)

aad1探针:5’-fam/cacagaaccgtcgcttcagcaaca-mgb/bhq-3’(seqidno:14)

最后,在v4-5时采样含有所关注基因的t0植物以进行cry34ab1和aad-1叶elisa测定。采集四个叶冲孔样品。在v4-5时对另一组植物采样,用于蛋白elisa测定的整个根质量。叶及根cry34ab1(agdia,inc.,elkart,in)和aad1(acadiabioscience)elisa测定按照制造商的说明进行。cry34ab1elisa测定结果表示为份每百万份(或每mg总植物蛋白的蛋白ng数)。用bradford检测方法根据制造商的说明进行总根蛋白测定。

t0植物自交并与玉米栽培变种b104非转基因转化系杂交以获得t1种子。为了进行t1蛋白研究,将每个测试调控元件构建体的五至六个转基因系或事件推进。因此,播种每个事件的30-40粒t1种子;在v2-3发育阶段用喷洒幼苗以杀死非转基因分离子。

实施例5:蛋白质积聚的分子确认

接下来,如下在多个植物发育阶段对转基因植物采样以用于cry34ab1(agdia,inc.;目录号04500/4800)和aad-1(envirologix;目录号11638)elisa:叶(v4、v12和r3)和根(v4)。将所有组织分离并置于嵌入干冰中的管中;然后转移至-80℃。将除叶外的冷冻组织冻干,然后提取蛋白质用于elisa。

在v4、v12和r3对包含cry34ab1和aad-1转基因的推定的转基因t1植物采样以用于叶elisa测定。采集四个叶冲孔样品。将叶冲孔样品置于管中,将单颗1/8英寸不锈钢珠粒(hooverprecisionproducts,cumming,ga,usa)添加到每根1.2ml的含有300μl提取缓冲液(补充有0.5mmetda和1.0mmdtt的pbst)的管中。将样品在genogrindertm(spexsampleprep,metuchen,nj)中以1,500rpm处理4分钟。将样品在sorvalllegendxfrtm离心机中以4,000rpm离心2分钟。接着,添加额外300μl提取缓冲液,并将样品在genogrindertm中在1,500rpm下再处理2分钟。将样品以4,000rpm离心7分钟。最后,收集上清液,并使用市售cry34ab1(agdia,inc.)和aad-1(envirologiz,inc.)elisa测定试剂盒按照dowagrosciences开发的方案在不同稀释度下连同蛋白质标准品完成elisa测定。通过在存在八颗0.25英寸陶瓷珠粒(mpbiomedicals,usa,目录号6540-422)的情况下在油漆搅拌器中将冻干的组织研磨30秒来进行用于各种组织类型elisa的蛋白质提取。对于需要进一步研磨的组织,将研磨步骤再重复30秒。在2ml管中添加石榴石粉以覆盖管底部的弯曲部分。将粗研磨组织转移到2ml管中,并填充到0.5ml刻度线。将一个陶瓷球加到每根管中,同时添加0.6ml部分提取缓冲液pbst(补充有5mmedta、5mmdtt和1%植物蛋白酶抑制剂混合物)。将所有管保持在冰上10分钟。将冷的管转移到的2ml管架中。将样品研磨45秒。接着,将40μl10%-20和300μl提取缓冲液添加到样品中。将样品再研磨45秒,其间冷却5分钟。最后,将每个样品以13,000rpm离心7分钟,并将上清液小心转移到新的管以收集提取物。根据需要稀释提取物以用于叶组织的elisa测定。将类似的测定用于其他植物组织。

实施例6:可操作地连接至水稻泛素-3调控元件的基因在作物植物中的表达谱

如pdab116099中所提供的seqidno:1的水稻泛素-3基因3’utr调控元件导致了cry34ab1基因在玉蜀黍转基因事件中的组成型表达。表1总结了cry34ab1基因在各种组织类型中以及在不同的发育阶段的稳健表达。在用阴性对照构建体pdab113121转化的植物事件中几乎没有观察到或检出cry34ab1叶表达。此构建体pdab113121不含cry34ab1转基因。所有构建体在测定的组织中均表达了aad-1基因。

表1.描绘在各种类型的玉蜀黍组织中因转基因表达而产生的cry34ab1和aad-1蛋白质水平的elisa结果。从t1转基因植物的所述组织类型获得所指示的样品。

因此,鉴定并表征了新型水稻泛素-3基因3’utr基因调控元件(seqidno:1)。第一次公开了用于基因表达构建体的新型3’utr调控元件。

实施例7:可操作地连接至水稻泛素-3基因3’utr的基因的农杆菌属介导的转化

可利用之前在专利申请wo2007/053482的实施例#11或实施例#13中描述的相同技术,用可操作地连接至水稻泛素-3基因3’utr的基因转化大豆。

可利用之前在美国专利号7,838,733的实施例#14或专利申请wo2007/053482(wright等人)的实施例#12中描述的相同技术,用可操作地连接至水稻泛素-3基因3’utr的基因转化棉花。

可利用之前在美国专利号7,838,733的实施例#26或专利申请wo2007/053482(wright等人)的实施例#22中描述的相同技术,用可操作地连接至水稻泛素-3基因3’utr的基因转化芥花。

可利用之前在专利申请wo2013/116700a1(lira等人)的实施例#23中描述的相同技术,用可操作地连接至水稻泛素-3基因3’utr的基因转化小麦。

可利用之前在专利申请wo2013/116700a1(lira等人)的实施例#19中描述的相同技术,用可操作地连接至水稻泛素-3基因3’utr的基因转化稻。

实施例8:可操作地连接至水稻泛素-3基因调控元件的基因的农杆菌属介导的转化

根据本公开,另外的作物可根据本公开的实施方案使用本领域已知的技术来转化。关于农杆菌属介导的黑麦转化,参见例如popelkajc,xuj,altpeterf.,“generationofryewithlowtransgenecopynumberafterbiolisticgenetransferandproductionof(secalecerealel.)plantsinstantlymarker-freetransgenicrye,”transgenicres.2003年10月;12(5):587-96。关于农杆菌属介导的高粱转化,参见例如zhao等人,“agrobacterium-mediatedsorghumtransformation,”plantmolbiol.2000年12月;44(6):789-98。关于农杆菌属介导的大麦转化,参见例如tingay等人,“agrobacteriumtumefaciens-mediatedbarleytransformation,”theplantjournal,(1997)11:1369–1376。关于农杆菌属介导的小麦转化,参见例如cheng等人,“genetictransformationofwheatmediatedbyagrobacteriumtumefaciens,”plantphysiol.1997年11月;115(3):971-980。关于农杆菌属介导的稻转化,参见例如hiei等人,“transformationofricemediatedbyagrobacteriumtumefaciens,”plantmol.biol.1997年9月;35(1-2):205-18。

这些和其他植物的拉丁名在下文给出。应当明白,可使用其他(非农杆菌属)转化技术将例如可操作地连接至水稻泛素-3基因的3’utr的基因转化到这些和其他植物中。实例包括但不限于:玉蜀黍(玉米)、小麦(小麦属(triticumspp.))、稻(稻属(oryzaspp.)和菰属(zizaniaspp.))、大麦(大麦属(hordeumspp.))、棉花(水麻(abromaaugusta)和棉属(gossypiumspp.))、大豆(大豆(glycinemax))、糖和食用甜菜(甜菜属(betaspp.))、甘蔗(桄榔(arengapinnata))、西红柿(西红柿(lycopersiconesculentum)和其他种、粘果酸浆(physalisixocarpa)、黄水茄(solanumincanum)和其他种以及树番茄(cyphomandrabetacea))、马铃薯(马铃薯(solanumtuberosum))、甘薯(甘薯(ipomoeabatatas))、黑麦(黑麦属(secalespp.))、胡椒(甜椒(capsicumannuum)、中国辣椒(capsicumchinense)和小米椒(capsicumfrutescens))、莴苣(莴苣(lactucasativa)、野莴苣(lactucaperennis)和蓝莴苣(lactucapulchella))、甘蓝菜(芸苔属(brassicaspp.))、芹菜(芹菜(apiumgraveolens))、茄子(茄子(solanummelongena))、花生(落花生(arachishypogea))、高粱(高粱属(sorghumspp.))、苜蓿(紫花苜蓿(medicagosativa))、胡萝卜(野胡萝卜(daucuscarota))、菜豆(菜豆属(phaseolusspp.)和其他属)、燕麦(燕麦(avenasativa)和毛燕麦(avenastrigosa))、豌豆(豌豆属(pisum)、豇豆属(vigna)和翅荚豌豆属(tetragonolobusspp.))、向日葵(向日葵(helianthusannuus))、南瓜(南瓜属(cucurbitaspp.))、黄瓜(黄瓜(cucumissativa))、烟草(烟草属(nicotianaspp.))、拟南芥属(拟南芥)、草皮草(黑麦草属(lolium)、剪链颖属(agrostis)、早熟禾属(poa)、狗牙根属(cynodon)和其他属)、三叶草(车轴草属(trifolium))、野豌豆(野豌豆属(vicia))。例如,在本公开的实施方案中设想了用可操作地连接至水稻泛素-3基因的3’utr的基因转化此类植物。

使用水稻泛素-3基因的3’utr来终止可操作地连接的基因可用于许多落叶树和常青树物种。此类应用也在本公开实施方案的范围内。这些物种包括但不限于:桤木(赤杨属(alnusspp.))、白蜡木(白蜡树属(fraxinusspp.))、山杨和白杨物种(白杨属(populusspp.))、山毛榉(山毛榉属(fagusspp.))、桦树(桦属(betulaspp.))、樱桃木(李属(prunusspp.))、桉树(桉属(eucalyptusspp.))、山核桃木(山核桃属(caryaspp.))、枫树(槭属(acerspp.))、橡树(栎属(quercusspp.))和松树(松属(pinusspp.))。

使用水稻泛素-3基因的3’utr来终止可操作地连接的基因可用于观赏和挂果树种。此类应用也在本公开实施方案的范围内。实例包括但不限于:玫瑰(蔷薇属(rosaspp.))、紫卫矛(卫矛属(euonymusspp.))、矮牵牛(矮牵牛属(petuniaspp.))、秋海棠(秋海棠属(begoniaspp.))、杜鹃花(杜鹃花属(rhododendronspp.))、海棠果或苹果(苹果属(malusspp.))、梨(梨属(pyrusspp.))、桃(李属(prunusspp.))和金盏花(万寿菊属(tagetesspp.))。

尽管上文讨论了多个示例性方面和实施方案,但本领域的技术人员将认识到它们的某些修改、排列、添加和子组合。因此,预期以下所附权利要求书和之后介绍的权利要求应解释为包括其真正精神和范围内的所有此类修改、排列、添加和子组合。

序列表

<110>dowagrosciences,llc.

gupta,manju

beringer,jeff

marri,pradeep

sardesai,nagesh

<120>用于转基因表达的植物启动子和3’utr

<130>77898

<160>5

<170>patentin3.5版

<210>1

<211>1001

<212>dna

<213>水稻

<400>1

gcgtgtgctgtggtgcagcattggacttcattatacctatgccgctcgtctgtcatatca60

tcgtgtcatggttgtgttgtgttctggtttagagtccctaagttgtgttgatactattat120

ccatactagtacaatttgcttcactgtgcatcggtaccaatcgatgatattatcattcta180

cttctgttaatgtttctgagatgtttgatccgagatgagattctgtttgtgcattgctca240

catggtcgtaaccggccactgttgcgcgtgcctgttgatcaatctgtttgcgcttgacgg300

tttctgatgcttggaattggggtgtcgatgttggtttggttatctatcctggtatgtttg360

ttgatttcatgcgcatttcagtctttacggcttctgatgcttggaattctaatggtgttg420

gttgatttcacaattgggctggtgcggtttggtgcctaaaaaaaatgggagtacctatac480

atctttcgaaagattttgatgatcgtatcacacagattttgatgatcgtatcacacagat540

ttttaatctttgaattaaaatccgatagatataataaaaagtaaaaagtaattaagaaac600

accataatggacactaaattaccatatcctcgagaaaaagaccaaatccaataaaaaaga660

aaaagaccaaatccaatacaaaatttaaaatttacatgcgaagattcaaaaattacagtg720

taacttacaaaagttacaatgtaagtttcataaattacactgtaacttacaagaaaatgc780

actgtaaatttaagtgagaaaatcgagtgagagataagaaaaaatctttcgagtgagata840

tagcaaaattgaaaaaaaattggtttgggcccaaaaatggttgagggcccattcggccat900

tccccaatcccaaccatcgcgtcctactccagccgccgctgccacccacgtccgtcggcg960

ccatggccgccgccaaggagctccttcgccggctccagcga1001

<210>2

<211>1990

<212>dna

<213>水稻

<400>2

gatgtgaagaacaggtaaatcacgcagaagaacccatctctgatagcagctatcgattag60

aacaacgaatccatattgggtccgtgggaaatacttactgcacaggaagggggcgatctg120

acgaggccccgccaccggcctcgacccgaggccgaggccgacgaagcgccggcgagtacg180

gcgccgcggcggcctctgcccgtgccctctgcgcgtgggagggagaggccgcggtggtgg240

gggcgcgcgcgcgcgcgcgcgcagctggtgcggcggcgcgggggtcagccgccgagccgg300

cggcgacggaggagcagggcggcgtggacgcgaacttccgatcggttggtcagagtgcgc360

gagttgggcttagccaattaggtctcaacaatctattgggccgtaaaattcatgggccct420

ggtttgtctaggcccaatatcccgttcatttcagcccacaaatatttccccagaggatta480

ttaaggcccacacgcagcttatagcagatcaagtacgatgtttcctgatcgttggatcgg540

aaacgtacggtcttgatcaggcatgccgacttcgtcaaagagaggcggcatgacctgacg600

cggagttggttccgggcaccgtctggatggtcgtaccgggaccggacacgtgtcgcgcct660

ccaactacatggacacgtgtggtgctgccattgggccgtacgcgtggcggtgaccgcacc720

ggatgctgcctcgcaccgccttgcccacgctttatatagagaggttttctctccattaat780

cgcatagcgagtcgaatcgaccgaaggggagggggagcgaagctttgcgttctctaatcg840

cctcgtcaaggtaactaatcaatcacctcgtcctaatcctcgaatctctcgtggtgcccg900

tctaatctcgcgattttgatgctcgtggtggaaagcgtaggaggatcccgtgcgagttag960

tctcaatctctcagggtttcgtgcgattttagggtgatccacctcttaatcgagttacgg1020

tttcgtgcgattttagggtaatcctcttaatctctcattgatttagggtttcgtgagaat1080

cgaggtagggatctgtgttatttatatcgatctaatagatggattggttttgagattgtt1140

ctgtcagatggggattgtttcgatatattaccctaatgatgtgtcagatggggattgttt1200

cgatatattaccctaatgatgtgtcagatggggattgtttcgatatattaccctaatgat1260

ggataataagagtagttcacagttatgttttgatcctgccacatagtttgagttttgtga1320

tcagatttagtttcacttatttgtgcttagttcggatgggattgttctgatattgttcca1380

atagatgaatagctcgttaggttaaaatctttaggttgagttaggcgacacatagtttat1440

ttcctctggatttggattggaattgtgttcttagtttttttcccctggatttggattgga1500

attgtgtggagctgggttagagaattacatctgtatcgtgtacacctacttgaactgtag1560

agcttgggttctaaggtcaatttaatctgtattgtatctggctctttgcctagttgaact1620

gtagtgctgatgttgtactgtgtttttttacccgttttatttgctttactcgtgcaaatc1680

aaatctgtcagatgctagaactaggtggctttattctgtgttcttacatagatctgttgt1740

cctgtagttacttatgtcagttttgttattatctgaagatatttttggttgttgcttgtt1800

gatgtggtgtgagctgtgagcagcgctcttatgattaatgatgctgtccaattgtagtgt1860

aatatgatgtgattgatatgttcatctattttgagctgacagtaccgatatcgtaggatc1920

tggtgccaacttattctccagctgcttttttttacctatgttaattccaatcctttcttg1980

cctcttccag1990

<210>3

<211>3431

<212>dna

<213>人工序列

<220>

<223>基因表达盒(pdab116099)

<400>3

gatgtgaagaacaggtaaatcacgcagaagaacccatctctgatagcagctatcgattag60

aacaacgaatccatattgggtccgtgggaaatacttactgcacaggaagggggcgatctg120

acgaggccccgccaccggcctcgacccgaggccgaggccgacgaagcgccggcgagtacg180

gcgccgcggcggcctctgcccgtgccctctgcgcgtgggagggagaggccgcggtggtgg240

gggcgcgcgcgcgcgcgcgcgcagctggtgcggcggcgcgggggtcagccgccgagccgg300

cggcgacggaggagcagggcggcgtggacgcgaacttccgatcggttggtcagagtgcgc360

gagttgggcttagccaattaggtctcaacaatctattgggccgtaaaattcatgggccct420

ggtttgtctaggcccaatatcccgttcatttcagcccacaaatatttccccagaggatta480

ttaaggcccacacgcagcttatagcagatcaagtacgatgtttcctgatcgttggatcgg540

aaacgtacggtcttgatcaggcatgccgacttcgtcaaagagaggcggcatgacctgacg600

cggagttggttccgggcaccgtctggatggtcgtaccgggaccggacacgtgtcgcgcct660

ccaactacatggacacgtgtggtgctgccattgggccgtacgcgtggcggtgaccgcacc720

ggatgctgcctcgcaccgccttgcccacgctttatatagagaggttttctctccattaat780

cgcatagcgagtcgaatcgaccgaaggggagggggagcgaagctttgcgttctctaatcg840

cctcgtcaaggtaactaatcaatcacctcgtcctaatcctcgaatctctcgtggtgcccg900

tctaatctcgcgattttgatgctcgtggtggaaagcgtaggaggatcccgtgcgagttag960

tctcaatctctcagggtttcgtgcgattttagggtgatccacctcttaatcgagttacgg1020

tttcgtgcgattttagggtaatcctcttaatctctcattgatttagggtttcgtgagaat1080

cgaggtagggatctgtgttatttatatcgatctaatagatggattggttttgagattgtt1140

ctgtcagatggggattgtttcgatatattaccctaatgatgtgtcagatggggattgttt1200

cgatatattaccctaatgatgtgtcagatggggattgtttcgatatattaccctaatgat1260

ggataataagagtagttcacagttatgttttgatcctgccacatagtttgagttttgtga1320

tcagatttagtttcacttatttgtgcttagttcggatgggattgttctgatattgttcca1380

atagatgaatagctcgttaggttaaaatctttaggttgagttaggcgacacatagtttat1440

ttcctctggatttggattggaattgtgttcttagtttttttcccctggatttggattgga1500

attgtgtggagctgggttagagaattacatctgtatcgtgtacacctacttgaactgtag1560

agcttgggttctaaggtcaatttaatctgtattgtatctggctctttgcctagttgaact1620

gtagtgctgatgttgtactgtgtttttttacccgttttatttgctttactcgtgcaaatc1680

aaatctgtcagatgctagaactaggtggctttattctgtgttcttacatagatctgttgt1740

cctgtagttacttatgtcagttttgttattatctgaagatatttttggttgttgcttgtt1800

gatgtggtgtgagctgtgagcagcgctcttatgattaatgatgctgtccaattgtagtgt1860

aatatgatgtgattgatatgttcatctattttgagctgacagtaccgatatcgtaggatc1920

tggtgccaacttattctccagctgcttttttttacctatgttaattccaatcctttcttg1980

cctcttccagcaggtacagtagttagttgaggtaccggatccagaagacaccatgtccgc2040

ccgcgaggtgcacatcgacgtgaacaacaagaccggccacaccctccagctggaggacaa2100

gaccaagctcgacggcggcaggtggcgcacctccccgaccaacgtggccaacgaccagat2160

caagaccttcgtggccgaatccaacggcttcatgaccggcaccgagggcaccatctacta2220

ctccatcaacggcgaggccgagatcagcctctacttcgacaacccgttcgccggctccaa2280

caaatacgacggccactccaacaagtcccagtacgagatcatcacccagggcggctccgg2340

caaccagtcccacgtgacctacaccatccagaccacctcctcccgctacggccacaagtc2400

ctgagtagttagcttaatcacctagagctcgcgtgtgctgtggtgcagcattggacttca2460

ttatacctatgccgctcgtctgtcatatcatcgtgtcatggttgtgttgtgttctggttt2520

agagtccctaagttgtgttgatactattatccatactagtacaatttgcttcactgtgca2580

tcggtaccaatcgatgatattatcattctacttctgttaatgtttctgagatgtttgatc2640

cgagatgagattctgtttgtgcattgctcacatggtcgtaaccggccactgttgcgcgtg2700

cctgttgatcaatctgtttgcgcttgacggtttctgatgcttggaattggggtgtcgatg2760

ttggtttggttatctatcctggtatgtttgttgatttcatgcgcatttcagtctttacgg2820

cttctgatgcttggaattctaatggtgttggttgatttcacaattgggctggtgcggttt2880

ggtgcctaaaaaaaatgggagtacctatacatctttcgaaagattttgatgatcgtatca2940

cacagattttgatgatcgtatcacacagatttttaatctttgaattaaaatccgatagat3000

ataataaaaagtaaaaagtaattaagaaacaccataatggacactaaattaccatatcct3060

cgagaaaaagaccaaatccaataaaaaagaaaaagaccaaatccaatacaaaatttaaaa3120

tttacatgcgaagattcaaaaattacagtgtaacttacaaaagttacaatgtaagtttca3180

taaattacactgtaacttacaagaaaatgcactgtaaatttaagtgagaaaatcgagtga3240

gagataagaaaaaatctttcgagtgagatatagcaaaattgaaaaaaaattggtttgggc3300

ccaaaaatggttgagggcccattcggccattccccaatcccaaccatcgcgtcctactcc3360

agccgccgctgccacccacgtccgtcggcgccatggccgccgccaaggagctccttcgcc3420

ggctccagcga3431

<210>4

<211>3307

<212>dna

<213>人工序列

<220>

<223>基因表达盒

<400>4

gtgcagcgtgacccggtcgtgcccctctctagagataatgagcattgcatgtctaagtta60

taaaaaattaccacatattttttttgtcacacttgtttgaagtgcagtttatctatcttt120

atacatatatttaaactttactctacgaataatataatctatagtactacaataatatca180

gtgttttagagaatcatataaatgaacagttagacatggtctaaaggacaattgagtatt240

ttgacaacaggactctacagttttatctttttagtgtgcatgtgttctcctttttttttg300

caaatagcttcacctatataatacttcatccattttattagtacatccatttagggttta360

gggttaatggtttttatagactaatttttttagtacatctattttattctattttagcct420

ctaaattaagaaaactaaaactctattttagtttttttatttaatagtttagatataaaa480

tagaataaaataaagtgactaaaaattaaacaaataccctttaagaaattaaaaaaacta540

aggaaacatttttcttgtttcgagtagataatgccagcctgttaaacgccgtcgacgagt600

ctaacggacaccaaccagcgaaccagcagcgtcgcgtcgggccaagcgaagcagacggca660

cggcatctctgtcgctgcctctggacccctctcgagagttccgctccaccgttggacttg720

ctccgctgtcggcatccagaaattgcgtggcggagcggcagacgtgagccggcacggcag780

gcggcctcctcctcctctcacggcaccggcagctacgggggattcctttcccaccgctcc840

ttcgctttcccttcctcgcccgccgtaataaatagacaccccctccacaccctctttccc900

caacctcgtgttgttcggagcgcacacacacacaaccagatctcccccaaatccacccgt960

cggcacctccgcttcaaggtacgccgctcgtcctccccccccccccccctctctaccttc1020

tctagatcggcgttccggtccatgcatggttagggcccggtagttctacttctgttcatg1080

tttgtgttagatccgtgtttgtgttagatccgtgctgctagcgttcgtacacggatgcga1140

cctgtacgtcagacacgttctgattgctaacttgccagtgtttctctttggggaatcctg1200

ggatggctctagccgttccgcagacgggatcgatttcatgattttttttgtttcgttgca1260

tagggtttggtttgcccttttcctttatttcaatatatgccgtgcacttgtttgtcgggt1320

catcttttcatgcttttttttgtcttggttgtgatgatgtggtctggttgggcggtcgtt1380

ctagatcggagtagaattctgtttcaaactacctggtggatttattaattttggatctgt1440

atgtgtgtgccatacatattcatagttacgaattgaagatgatggatggaaatatcgatc1500

taggataggtatacatgttgatgcgggttttactgatgcatatacagagatgctttttgt1560

tcgcttggttgtgatgatgtggtgtggttgggcggtcgttcattcgttctagatcggagt1620

agaatactgtttcaaactacctggtgtatttattaattttggaactgtatgtgtgtgtca1680

tacatcttcatagttacgagtttaagatggatggaaatatcgatctaggataggtataca1740

tgttgatgtgggttttactgatgcatatacatgatggcatatgcagcatctattcatatg1800

ctctaaccttgagtacctatctattataataaacaagtatgttttataattatttcgatc1860

ttgatatacttggatgatggcatatgcagcagctatatgtggatttttttagccctgcct1920

tcatacgctatttatttgcttggtactgtttcttttgtcgatgctcaccctgttgtttgg1980

tgttacttctgcaggtacagtagttagttgaggtaccggatccacacgacaccatggctc2040

atgctgccctcagccctctctcccaacgctttgagagaatagctgtccagccactcactg2100

gtgtccttggtgctgagatcactggagtggacttgagggaaccacttgatgacagcacct2160

ggaatgagatattggatgccttccacacttaccaagtcatctactttcctggccaagcaa2220

tcaccaatgagcagcacattgcattctcaagaaggtttggaccagttgatccagtgcctc2280

ttctcaagagcattgaaggctatccagaggttcagatgatccgcagagaagccaatgagt2340

ctggaagggtgattggtgatgactggcacacagactccactttccttgatgcacctccag2400

ctgctgttgtgatgagggccatagatgttcctgagcatggcggagacactgggttccttt2460

caatgtacacagcttgggagaccttgtctccaaccatgcaagccaccatcgaagggctca2520

acgttgtgcactctgccacacgtgtgttcggttccctctaccaagcacagaaccgtcgct2580

tcagcaacacctcagtcaaggtgatggatgttgatgctggtgacagagagacagtccatc2640

ccttggttgtgactcatcctggctctggaaggaaaggcctttatgtgaatcaagtctact2700

gtcagagaattgagggcatgacagatgcagaatcaaagccattgcttcagttcctctatg2760

agcatgccaccagatttgacttcacttgccgtgtgaggtggaagaaagaccaagtccttg2820

tctgggacaacttgtgcaccatgcaccgtgctgttcctgactatgctggcaagttcagat2880

acttgactcgcaccacagttggtggagttaggcctgcccgctgagtagttagcttaatca2940

cctagagctcggtcgcagcgtgtgcgtgtccgtcgtacgttctggccggccgggccttgg3000

gcgcgcgatcagaagcgttgcgttggcgtgtgtgtgcttctggtttgctttaattttacc3060

aagtttgtttcaaggtggatcgcgtggtcaaggcccgtgtgctttaaagacccaccggca3120

ctggcagtgagtgttgctgcttgtgtaggctttggtacgtatgggctttatttgcttctg3180

gatgttgtgtactacttgggtttgttgaattattatgagcagttgcgtattgtaattcag3240

ctgggctacctggacattgttatgtattaataaatgctttgctttcttctaaagatcttt3300

aagtgct3307

<210>5

<211>1146

<212>dna

<213>水稻

<400>5

atgcagatattcgttaagaccctcactggcaagaccatcaccttggaggttgagttctcc60

gatacgattgacaatgtgaaggctaagattcaggacaaggagggcatccctccggaccag120

caacgccttatcttcgctggcaagcagcttgaggatgggcgtactctcgcggattataac180

atccagaaggagtccaccttgcaccttgtcctccgccttcgtggaggcatgcaaatattc240

gtgaagaccctcaccggcaagaccattaccctggaggtcgagtcctccgacacgatcgat300

aatgtgaaggccaagatccaggacaaggagggaatcccaccagaccagcagcgtctcatc360

tttgctgggaagcagctcgaggatggccgcacccttgcagactacaacatccaaaaggaa420

tccaccctgcaccttgtcctgcgcctccggggcggtatgcagatctttgtgaagaccctt480

actggcaagacgatcaccttggaggttgagtcctctgacacgatcgacaatgtgaaggcc540

aagatccaggacaaggagggtattccaccagaccagcagcggctcatcttcgctggcaag600

cagcttgaggacggccgcacccttgctgactataacatccagaaggagtccaccttgcac660

ttggtcctccgccttcgtggaggtatgcagatcttcgtgaagaccctcaccggcaagacc720

atcaccctggaggttgagtcgtctgacacgatcgacaatgtgaaggccaagatccaggac780

aaggagggtattccaccagaccagcagcgcctcatcttcgctggcaagcagcttgaggat840

ggtcgcacccttgcagattacaacatccagaaggagtccaccctgcaccttgtcctgcgc900

cttcgtggaggtatgcagatcttcgtgaagaccctcactggcaagaccatcactctggag960

gttgagtcctctgacaccatcgacaacgtgaaggccaagatccaggataaggagggcatc1020

cctccagaccagcagcgcctcatcttcgccggcaagcagctcgaggatggccgcaccctt1080

gccgactataacatccagaaggagtccaccctgcaccttgtcctgcgcctccgtggtggt1140

ctctga1146

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1