用于转基因表达的植物启动子的制作方法

文档序号:13534779阅读:381来源:国知局
用于转基因表达的植物启动子的制作方法

相关申请的交叉引用

本申请要求提交于2015年4月15日的美国临时专利申请序列号62/147,868的权益的优先权,该临时专利申请的公开内容全文据此以引用方式并入。

以电子方式提交的材料以引用方式并入

与本申请同时提交且如下标识的计算机可读核苷酸/氨基酸序列表全文以引用方式并入:一个创建于2016年3月22日的文件名为“77035-wo-pct-20160322-sequence-listing-st25.txt”的36.7kbacii(本文)文件。

本公开整体涉及用于促进核苷酸序列在植物或植物细胞中转录的组合物和方法。一些实施方案涉及来自二穗短柄草(panicumvirgatum)金属硫蛋白样基因(mtl)的启动子,该启动子在植物中发挥促进可操作地连接的核苷酸序列的转录的功能。具体实施方案涉及包括启动子(例如,以将核酸分子引入细胞中)的方法以及包含启动子的细胞、细胞培养物、组织、生物体和生物体部分以及由其产生的产物。



背景技术:

许多植物物种能够通过转基因转化以引入农艺学上所需的性状或特征。植物物种经开发和/或修饰以具有具体的所需性状。一般来讲,所需性状包括例如改善营养价值质量、增加产率、赋予害虫或疾病抗性、增加干旱和胁迫耐受性、改善园艺质量(例如,色素沉着和生长)、赋予除草剂耐受性、使得能够由植物产生工业上适用的化合物和/或材料、和/或使得能够产生药物。

包含多个转基因的转基因植物物种经由植物转化技术而产生,所述多个转基因叠堆在单个基因组基因座处。植物转化技术使得将转基因引入植物细胞中,回收植物基因组中含有稳定整合的转基因拷贝的可育转基因植物,并且经由植物基因组的转录和翻译的后续转基因表达产生具有所需性状和表型的转基因植物。然而,允许产生转基因植物物种以高表达经工程改造为性状叠堆的多个转基因的机制是所需的。

同样,允许转基因在植物的特定组织或器官内表达的机制也是所需的。例如,增加植物对土壤传播的病原体感染的抗性可通过用病原体抗性基因转化植物基因组,使得病原体抗性蛋白在植物根内稳健表达来实现。或者,可能需要在处于特定生长或发育阶段(诸如,细胞分裂或伸长)中的植物组织中表达转基因。此外,可能需要在植物的叶和茎组织中表达转基因以提供针对除草剂的耐受性,或针对地面上昆虫和害虫的抗性。

因此,需要可驱动转基因在特定植物组织中实现所需水平的表达的新的基因调控元件。



技术实现要素:

在本公开的实施方案中,本公开涉及一种核酸载体,其包含可操作地连接至以下部分的启动子:多接头序列;非金属硫蛋白样基因;或多接头序列与非金属硫蛋白样基因的组合,其中所述启动子包含与seqidno:1具有至少90%序列同一性的多核苷酸序列。在一些实施方案中,启动子的长度为2,000bp。在另外的实施方案中,启动子由与seqidno:1具有至少90%序列同一性的多核苷酸序列组成。在其他实施方案中,启动子驱动编码选择性标记的多核苷酸的表达。在另外的实施方案中,启动子可操作地连接至转基因。在该实施方案的方面,转基因编码赋予杀昆虫抗性、除草剂耐受性、氮使用效率、水使用效率或营养品质的选择性标记或基因产物。提供与3'非翻译多核苷酸序列(3’–utr)一起使用的seqidno:1的启动子,该3'非翻译多核苷酸序列包含与seqidno:3具有至少90%序列同一性的序列,其中该3'非翻译序列可操作地连接至所述多接头或所述转基因。在其他实施方案中,提供与5'非翻译多核苷酸序列一起使用的seqidno:1的启动子,该5'非翻译多核苷酸序列包含与seqidno:4具有至少90%序列同一性的序列,其中该5'非翻译序列可操作地连接至所述多接头或所述转基因。在其他实施方案中,seqidno:1的启动子还包含内含子序列。在另一个实施方案中,seqidno:1的启动子驱动地面下组织特异性表达。

在又一个实施方案中,本公开提供包含与seqidno:1具有至少90%序列同一性的可操作地连接至转基因的多核苷酸序列的非短柄草属植物。根据该实施方案,该植物选自:玉蜀黍、小麦、稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、拟南芥属(arabidopsis)、烟草、向日葵和芥花。随后,在一些实施方案中,包含与seqidno:1具有至少90%序列同一性的多核苷酸序列的非短柄草属植物可为玉米(zeamays)植物。在其他实施方案中,将可操作地连接至与seqidno:1具有至少90%序列同一性的多核苷酸序列的转基因插入至植物基因组中。在一些实施方案中,与seqidno:1具有至少90%序列同一性的多核苷酸序列是启动子并且所述启动子可操作地连接至转基因。在其他实施方案中,非短柄草属植物包含具有seqidno:3的3'非翻译序列或与seqidno:3具有至少90%序列同一性的3'非翻译序列,其中该3'非翻译序列可操作地连接至所述转基因。在另一个实施方案中,与seqidno:1具有至少90%序列同一性的多核苷酸序列驱动具有地面下组织特异性表达的转基因的表达。在另一个实施方案中,与seqidno:1具有至少90%序列同一性的多核苷酸序列的长度为2,000bp。

在一个实施方案中,本公开提供一种用于产生转基因植物细胞的方法,该方法包括以下步骤:用包含可操作地连接至至少一个所关注的多核苷酸序列的二穗短柄草金属硫蛋白样基因(mtl)启动子的基因表达盒转化植物细胞;分离包含该基因表达盒的经转化植物细胞;以及产生包含可操作地连接至至少一个所关注的多核苷酸序列的二穗短柄草金属硫蛋白样基因(mtl)启动子的转基因植物细胞。在其他实施方案中,用植物转化方法进行转化植物细胞的步骤。该植物转化方法可选自:农杆菌属(agrobacterium)介导的转化方法、基因枪转化方法、碳化硅转化方法、原生质体转化方法和脂质体转化方法。在其他实施方案中,所关注的多核苷酸序列在整个转基因植物细胞中组成型表达。在一些实施方案中,所关注的多核苷酸序列稳定整合至转基因植物细胞的基因组中。因此,用于产生转基因植物细胞的方法还可以包括以下步骤:使转基因植物细胞再生成转基因植物;以及获得转基因植物,其中该转基因植物包含基因表达盒,该基因表达盒包含可操作地连接至至少一个所关注的多核苷酸序列的二穗短柄草金属硫蛋白样基因(mtl)启动子。在一个实施方案中,转基因植物细胞为单子叶转基因植物细胞或双子叶转基因植物细胞。例如,双子叶转基因植物细胞可选自:拟南芥属植物细胞、烟草植物细胞、大豆植物细胞、芥花植物细胞和棉花植物细胞。另外,单子叶转基因植物细胞选自:玉蜀黍植物细胞、稻植物细胞和小麦植物细胞。该方法所用的二穗短柄草金属硫蛋白样基因(mtl)启动子可包含seqidno:1的多核苷酸。在实施方案中,二穗短柄草金属硫蛋白样基因(mtl)启动子还可以包含可操作地连接至seqidno:1的3'末端的所关注的第一多核苷酸序列。

在一个实施方案中,本公开提供一种用于在植物细胞中表达所关注的多核苷酸序列的方法,该方法包括将可操作地连接至二穗短柄草金属硫蛋白样基因(mtl)启动子的所关注的多核苷酸序列引入植物细胞中。在一些实施方案中,可操作地连接至二穗短柄草金属硫蛋白样基因(mtl)启动子的所关注的多核苷酸序列通过植物转化方法引入植物细胞中。因此,该植物转化方法可选自:农杆菌属介导的转化方法、基因枪转化方法、碳化硅转化方法、原生质体转化方法和脂质体转化方法。在实施方案中,所关注的多核苷酸序列在整个植物细胞中组成型表达。在一些实施方案中,所关注的多核苷酸序列稳定整合至植物细胞的基因组中。因此,转基因植物细胞为单子叶植物细胞或双子叶植物细胞。例如,双子叶植物细胞选自:拟南芥属植物细胞、烟草植物细胞、大豆植物细胞、芥花植物细胞和棉花植物细胞。另外,单子叶植物细胞选自:玉蜀黍植物细胞、稻植物细胞和小麦植物细胞。

在一个实施方案中,本公开提供一种包含二穗短柄草金属硫蛋白样基因(mtl)启动子的转基因植物细胞。在一些实施方案中,转基因植物细胞包含转基因事件。在该实施方案的一个方面,转基因事件包含农艺学性状。因此,农艺学性状选自:杀昆虫抗性性状、除草剂耐受性性状、氮使用效率性状、水使用效率性状、营养品质性状、dna结合性状、选择性标记性状、小rna性状或其任何组合。在其他实施方案中,农艺学性状包括除草剂耐受性性状。在该实施方案的一个方面,除草剂耐受性性状包括aad-1编码序列。在一些实施方案中,转基因植物细胞产生商品。该商品为经选择的蛋白浓缩物、蛋白分离物、谷物、食物、面粉、油或纤维。在一个实施方案中,转基因植物细胞选自由双子叶植物细胞或单子叶植物细胞。因此,单子叶植物细胞为玉蜀黍植物细胞。在其他实施方案中,二穗短柄草金属硫蛋白样基因(mtl)启动子包含与seqidno:1的多核苷酸具有至少90%序列同一性的多核苷酸。在又一个实施方案中,二穗短柄草金属硫蛋白样基因(mtl)启动子的长度为2,000bp。在另外的实施方案中,二穗短柄草金属硫蛋白样基因(mtl)启动子由seqidno:1组成。在另外的实施方案中,由seqidno:1组成的二穗短柄草金属硫蛋白样基因(mtl)启动子可操作地连接至seqidno:1的3′末端。在其他实施方案中,二穗短柄草金属硫蛋白样基因(mtl)启动子驱动地面下植物组织中农艺学性状的表达。

本公开提供一种分离的多核苷酸,其包含与seqidno:1的多核苷酸具有至少90%序列同一性的核酸序列。在一些实施方案中,分离的多核苷酸驱动地面下组织特异性表达。在其他实施方案中,分离的多核苷酸在植物细胞内具有表达活性。在实施方案中,分离的多核苷酸包含编码多肽的开放阅读框多核苷酸;以及终止序列。另外的实施方案包括包含与seqidno:1的多核苷酸具有至少90%序列同一性的核酸序列的分离的多核苷酸,其中seqidno:1的多核苷酸的长度为2,000bp。

参考下文结合附图进行的对若干实施方案的详细说明,前述特征和其他特征将变得更加明显。

附图说明

图1:此图是包含seqidno:1的二穗短柄草金属硫蛋白样基因(mtl)启动子(标记为二穗短柄草mtl启动子)和seqidno:3的二穗短柄草金属硫蛋白样基因(mtl)3’-utr(标记为二穗短柄草mtl3’utr)的pdab102419的示意图。

图2:此图提供seqidno:1(2,000bp)的二穗短柄草金属硫蛋白样基因(mtl)启动子与seqidno:7(1,730bp)、seqidno:8(1,530bp)、seqidno:9(1,330bp)、seqidno:10(1,130bp)和seqidno:11(1,001bp)的经截短二穗短柄草金属硫蛋白样基因(mtl)启动子的多核苷酸比对。

图3:此图提供seqidno:1的二穗短柄草金属硫蛋白样基因(mtl)启动子与seqidno:12的经修饰二穗短柄草金属硫蛋白样基因(mtl)启动子的多核苷酸比对。

图4:此图提供seqidno:3的二穗短柄草金属硫蛋白样基因(mtl)3’-utr与seqidno:13(264bp)、seqidno:14(332bp)、seqidno:15(630bp)和seqidno:16(727bp)的经截短二穗短柄草金属硫蛋白样基因(mtl)3’-utr的多核苷酸比对。

图5:此图提供seqidno:3的二穗短柄草金属硫蛋白样基因(mtl)3’-utr与seqidno:17和seqidno:18的经修饰二穗短柄草金属硫蛋白样基因(mtl)3’-utr的多核苷酸比对。

具体实施方式

i.若干实施方案的概述

转基因植物产品的开发正变得越来越复杂。商业上可行的转基因植物目前需要将多个转基因叠堆至单个基因座上。用于基础研究或生物技术应用的植物启动子一般为单向的,仅导向已融合在其3'末端(下游)的一个基因。因此,每个转基因通常均需要启动子以用于表达,其中多个启动子是表达一个基因叠堆内的多个转基因所需的。随着基因叠堆中的转基因的数目增加,常规地使用相同启动子以获得不同转基因的类似水平表达模式。获得类似水平的转基因表达是产生单个多基因性状必需的。令人遗憾的是,已知由相同启动子驱动的多基因构建体引起基因沉默,导致本领域中的有效转基因产物较少。重复的启动子元件可引起基于同源性的基因沉默。另外,转基因内的重复序列可引起基因在基因座内的同源重组,导致多核苷酸重排。转基因的沉默和重排将可能对所产生的转基因植物表达转基因的性能具有不期望的影响。另外,由于启动子重复而引起的转录因子(tf)结合位点过量可造成内源性tf耗尽,引起转录失活。考虑到需要将多个基因引入植物中以用于代谢工程改造和性状叠堆,需要多个启动子以产生驱动多个基因表达的转基因作物。

启动子鉴别中的具体问题是需要鉴别与植物中的具体细胞类型、发育阶段和/或功能相关的在其他植物组织中不表达的组织特异性启动子。组织特异性(即,组织优选的)或器官特异性启动子驱动诸如植物的果仁、根、叶或绒毡层的某些组织中的基因表达。组织和发育阶段特异性启动子可最初从观察基因的表达来鉴别,该基因在特定组织中或在植物发育期间的特定时间段表达。这些组织特异性启动子是转基因植物行业中的某些应用所需的,并且由于其允许异源基因以组织和/或发育阶段选择性方式特异性表达而是期望的,从而表明异源基因有差异地在各种器官、组织和/或时间表达,但不在其他组织表达。例如,增加植物对土壤传播的病原体感染的抗性可通过用病原体抗性基因转化植物基因组,使得病原体抗性蛋白在植物根内稳健表达来实现。或者,可能需要在处于特定生长或发育阶段(诸如,细胞分裂或伸长)中的植物组织中表达转基因。另一个应用是期望使用组织特异性启动子限制编码农艺学性状的转基因在如发育中的薄壁细胞的特定组织类型中表达。因此,启动子鉴别中的具体问题是如何鉴别启动子以及如何将所鉴别的启动子与细胞的发育特性关联以用于特异性组织表达。

关于启动子鉴别的另一个问题是需要克隆所有相关顺式作用和反式活化转录控制元件以便所克隆的dna片段以期望的特定表达模式驱动转录。考虑到此类控制元件位于翻译启动或起始位点远侧,被选为包含启动子的多核苷酸的大小对于提供启动子多核苷酸序列的表达水平和表达模式至关重要。已知的是,启动子长度包括功能信息,并且不同的基因经证实具有比基因组中其他基因的启动子更长或更短的启动子。阐明启动子的转录起始位点和预测启动子区中的功能性基因元件具有挑战性。进一步增加挑战性的是调控基序以及顺式和反式调控元件的复杂性、多样性和固有简并性(blanchette、mathieu等人,"genome-widecomputationalpredictionoftranscriptionalregulatorymodulesrevealsnewinsightsintohumangeneexpression.”genomeresearch16.5(2006):656-668)。顺式和反式调控元件位于启动子的远侧部分,该启动子调节基因的空间和时间表达以仅在所需位点和特定时间存在(porto、milenasilva等人,"plantpromoters:anapproachofstructureandfunction."molecularbiotechnology56.1(2014):38-49)。现有启动子分析工具无法可靠地鉴别基因组序列中的此类顺式调控元件,从而预测太多假阳性,因为这些工具一般仅集中于序列含量(fickettjw,hatzigeorgiouag(1997)eukaryoticpromoterrecognition.genomeresearch7:861–878)。因此,鉴别启动子调控元件需要获得具有特定大小的适当序列,该序列将导致以所需方式驱动可操作地连接的转基因的表达。

本发明提供通过使用二穗短柄草金属硫蛋白样基因(mtl)启动子调控元件克服此类问题以在植物中表达转基因的方法和组合物。

ii.术语和缩写

在本专利申请通篇中,使用了许多术语。为了提供对本说明书和权利要求书(包括给出此类术语的范围)的清楚和一致的理解,提供以下定义。

如本文所用,术语“内含子”是指基因(或所关注的表达多核苷酸序列)中所包含的已转录但未翻译的任何核酸序列。内含子包括dna的表达序列以及由其转录的rna分子中的相应序列内的非翻译核酸序列。本文所述的构建体也可含有增强翻译和/或mrna稳定性的序列,诸如内含子。一个这样的内含子的实例是拟南芥(arabidopsisthaliana)的组蛋白h3变体的基因ii的第一内含子或任何其他通常已知的内含子序列。内含子可与启动子序列组合使用以增强翻译和/或mrna稳定性。

如本文所用,术语“分离的”意指已从其天然环境中移除,或当首先形成该化合物时从所存在的其他化合物中移除。术语“分离的”涵盖从天然来源分离的材料以及通过在宿主细胞中的重组表达而制备之后回收的材料(例如核酸和蛋白质),或化学合成的化合物(诸如核酸分子、蛋白质和肽)。

如本文所用,术语“纯化的”涉及以如下形式分离分子或化合物:基本上不含天然或自然环境中通常与该分子或化合物相关联的污染物,或当首先形成该化合物时,基本上增加相对于其他存在的化合物的浓度,并且意指由于与原始组合物的其他组分分离而增加纯度。术语“纯化的核酸”在本文中用于描述与包括(但不限于)多肽、脂质和碳水化合物的其他生物化合物分离、分离产生或分离纯化,同时实现组分的化学或功能改变的核酸序列(例如,核酸可通过移除染色体中的蛋白污染物以及断裂连接该核酸与其余dna的化学键而从染色体纯化)。

如本文所用,术语“合成”是指经由化学合成作为体外方法形成的多核苷酸(即,dna或rna)分子。例如,合成dna可在反应期间在eppendorftm管内形成,以便由天然dna或rna链酶促产生合成dna。可采用其他实验室方法合成多核苷酸序列。寡核苷酸可在寡核苷酸合成仪上使用胺基磷酸酯经由固相合成来化学合成。所合成的寡核苷酸可彼此退火连接为复合物,从而产生“合成”多核苷酸。用于化学合成多核苷酸的其他方法是本领域已知的,并且可易于实施以用于本公开。

如本文所用,术语“约”意指比所述值或值范围大或小10%,但不旨在将任何值或值范围指定为仅此宽泛定义。每个前面有术语“约”的值或值范围也旨在涵盖所述绝对值或值范围的实施方案。

出于本公开的目的,“基因”包括编码基因产物(参见下文)的dna区,以及调节基因产物的产生的所有dna区,无论此类调控序列是否邻近编码序列和/或转录序列。因此,基因包括(但不一定限于)启动子序列、终止子、翻译调控序列(诸如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、绝缘子、边界元件、复制起点、基质附接位点和基因座控制区。

如本文所用,术语“天然”或“自然”定义自然界中存在的条件。“天然dna序列”是自然界中存在的通过天然手段或传统育种技术产生而非通过遗传工程改造(例如,使用分子生物学/转化技术)产生的dna序列。

如本文所用,“转基因”定义为编码基因产物的核酸序列,包括例如(但不限于)mrna。在一个实施方案中,转基因是外源性核酸,其中该转基因序列已通过遗传工程改造引入通常未发现该转基因的宿主细胞中(或其子代)。在一个实例中,转基因编码工业上或医药学上有用的化合物,或为编码所需农业性状的基因(例如,除草剂抗性基因)。在又一实例中,转基因是反义核酸序列,其中该反义核酸序列的表达抑制靶标核酸序列的表达。在一个实施方案中,转基因是内源性核酸,其中该内源性核酸的另外基因组拷贝是所需的;或相对于宿主生物体中的靶标核酸序列呈反义方向的核酸。

如本文所用,术语“非金属硫蛋白样转基因”或“非金属硫蛋白样基因”是与二穗短柄草金属硫蛋白样基因编码序列(seqidno:6)具有小于80%序列同一性的任何转基因。

本文定义的“基因产物”是通过该基因产生的任何产物。例如,基因产物可为基因的直接转录产物(例如mrna、trna、rrna、反义rna、干扰rna、核酶、结构rna或任何其他类型的rna)或通过mrna翻译产生的蛋白质。基因产物也包括通过诸如加帽、聚腺苷酸化、甲基化和编辑的方法修饰的rna以及通过例如甲基化、乙酰化、磷酸化、泛素化、adp核糖基化、豆蔻酰化和糖基化修饰的蛋白质。基因表达可受到外部信号的影响,例如细胞、组织或生物体暴露于增加或减少基因表达的药剂。基因表达也可以在从dna到rna再到蛋白质的途径中的任何位置受到调节。调节基因表达例如通过控制对转录、翻译、rna转运和加工、中间分子(诸如mrna)降解的作用,或通过在特异性蛋白分子已产生之后的活化、失活、区室化或降解,或这些的组合而发生。基因表达可通过本领域已知的任何方法,包括但不限于northern印迹法、rt-pcr、western印迹法,或者体外、原位或体内蛋白质活性测定法,在rna水平或蛋白质水平测量。

如本文所用,术语“基因表达”涉及使核酸转录单元(包括例如基因组dna)的编码信息转化成细胞的操作性、非操作性或结构部分的过程,其通常包括蛋白质合成。基因表达可能受到外部信号的影响,例如细胞、组织或生物体暴露于增加或减少基因表达的药剂。基因表达也可以在从dna到rna再到蛋白质的途径中的任何位置受到调节。调节基因表达例如通过控制对转录、翻译、rna转运和加工、中间分子(诸如mrna)降解的作用,或通过在特异性蛋白分子已产生之后的活化、失活、区室化或降解,或这些的组合而发生。基因表达可通过本领域已知的任何方法,包括但不限于northern印迹法、rt-pcr、western印迹法,或者体外、原位或体内蛋白质活性测定法,在rna水平或蛋白质水平测量。

如本文所用,“基于同源性的基因沉默”(hbgs)是包括转录基因沉默和转录后基因沉默二者的通用术语。靶标基因座通过非连锁沉默基因座的沉默可由于产生分别对应于启动子或转录序列的双链rna(dsrna)而由转录抑制(转录基因沉默;tgs)或mrna降解(转录后基因沉默;ptgs)引起。每个过程中不同细胞组分的参与表明dsrna诱导的tgs和ptgs可能由古老的常见机制的多样化引起。然而,tgs和ptgs的严格比较已难以实现,因为其通常依赖于对不同沉默基因座的分析。在一些情况下,单个转基因基因座可由于产生对应于不同靶标基因的启动子和转录序列的dsrna而触发tgs和ptgs二者。mourrain等人(2007)planta225:365-79。sirna可能为在同源序列上触发tgs和ptgs的实际分子:sirna将在此模型中通过将转基因序列的甲基化扩展至内源性启动子中而以顺式和反式触发同源序列的沉默和甲基化。

如本文所用,术语“核酸分子”(或“核酸”或“多核苷酸”)可以指核苷酸的聚合形式,可包括rna、cdna、基因组dna的有义链和反义链两者,以及上述各项的合成形式和混合聚合物。核苷酸可以指核糖核苷酸、脱氧核糖核苷酸,或这两种类型核苷酸中任一者的修饰形式。如本文所用的“核酸分子”与“核酸”和“多核苷酸”是同义词。除非另外指明,否则核酸分子的长度通常至少为10个碱基。该术语可指具有不确定长度的rna或dna分子。该术语包括单链和双链形式的dna。核酸分子可包括天然存在的核苷酸和经修饰的核苷酸中的任一者或它们二者,它们通过天然存在的核苷酸连接和/或非天然存在的核苷酸键合而连接在一起。

如本领域技术人员易于理解的那样,核酸分子可被化学修饰或生物化学修饰,或者可含有非天然的或衍生化的核苷酸碱基。此类修饰包括例如标记物、甲基化、用类似物置换天然存在的核苷酸中的一者或多者、核苷酸间修饰(例如,不带电键合:例如膦酸甲酯、磷酸三酯、氨基磷酸酯、氨基甲酸酯等;带电键合:例如硫代磷酸酯、二硫代磷酸酯等;悬垂部分:例如肽类;嵌入剂:例如吖啶、补骨脂素等;螯合剂;烷化剂;以及经修饰的键合:例如α异头核酸等)。术语“核酸分子”还包括任何拓扑构象,包括单链的、双链的、部分双链体的、三链体的、发夹形的、圆形的和挂锁形的(padlocked)构象。

转录以5′至3′方式沿着dna链前进。这意味着rna通过将核糖核苷酸-5'-三磷酸按顺序添加至生长链的3’末端(同时必需消去焦磷酸)来制备。在线性或环状核酸分子中,如果散在元件(例如,特定核苷酸序列)在另一个元件的5'方向结合或将结合相同的核酸,则可将其称为相对于该另一个元件“上游”或“5’”。类似地,如果散在元件在另一个元件的3’方向为或将结合相同的核酸,则可将其称为相对于该另一个元件“下游”或“3'”。

如本文所用,碱基“位置”是指指定核酸内给定碱基或核苷酸残基的位置。指定核酸可通过与参考核酸的比对(参见下文)来定义。

杂交涉及两股多核苷酸链通过氢键结合。寡核苷酸及其类似物通过互补碱基之间的氢键杂交,该氢键包括沃森-克里克(watson-crick)氢键、胡斯坦(hoogsteen)氢键或反向胡斯坦氢键。一般来讲,核酸分子由含氮碱基组成,该含氮碱基为嘧啶(胞嘧啶(c)、尿嘧啶(u)和胸腺嘧啶(t))或嘌呤(腺嘌呤(a)和鸟嘌呤(g))。这些含氮碱基在嘧啶和嘌呤之间形成氢键,并且嘧啶与嘌呤的键结称为“碱基配对”。更具体地讲,a将与t或u氢键结合,g将与c氢键结合。“互补”是指在两个不同核酸序列之间或在相同核酸序列的两个不同区之间存在碱基配对。

“可特异性杂交”和“特异性互补”是表示互补程度足以使得在寡核苷酸和dna或rna靶标之间发生稳定和特异性结合的术语。寡核苷酸无需与其可特异性杂交的靶标序列100%互补。当寡核苷酸与靶标dna或rna分子的结合干扰靶标dna或rna的正常功能时,该寡核苷酸为可特异性杂交的,并且在需要特异性结合的条件下,例如在体内分析或系统的情况下、在生理条件下,存在足够的互补程度以避免该寡核苷酸与非靶标序列的非特异性结合。此类结合称为特异性杂交。

导致特定严格性程度的杂交条件将根据选择的杂交方法的性质和杂交核酸序列的组成和长度而变化。一般来讲,杂交的温度和杂交缓冲液的离子强度(尤其是na+和/或mg2+浓度)将有助于杂交的严格性,但洗涤次数也影响严格性。关于获得特定严格性程度所需的杂交条件的计算在sambrook等人(编),molecularcloning:alaboratorymanual,第2版,第1-3卷,coldspringharborlaboratorypress,coldspringharbor,newyork,1989,第9和11章中有所讨论。

如本文所用,“严格条件”涵盖杂交将仅在杂交分子与dna靶标之间存在小于50%错配时才发生的条件。“严格条件”包括另外的特定严格性水平。因此,如本文所用,“中等严格性”条件是序列错配超过50%的分子不会杂交的条件;“高严格性”条件是错配超过20%的序列不会杂交的条件;而“极高严格性”条件是错配超过10%的序列不会杂交的条件。

在具体实施方案中,严格条件可包括在65℃下杂交,接着在65℃下用0.1×ssc/0.1%sds洗涤40分钟。

以下是代表性的非限制性杂交条件:

极高严格性:在5×ssc缓冲液中在65℃下杂交16小时;在2×ssc缓冲液中在室温下洗涤两次,每次15分钟;以及在0.5×ssc缓冲液中在65℃下洗涤两次,每次20分钟。

高严格性:在5×-6×ssc缓冲液中在65-70℃下杂交16-20小时;在2×ssc缓冲液中在室温下洗涤两次,每次5-20分钟;以及在1×ssc缓冲液中在55-70℃下洗涤两次,每次30分钟。

中等严格性:在6×ssc缓冲液中在室温至55℃下杂交16-20小时;在2×-3×ssc缓冲液中在室温至55℃下至少洗涤两次,每次20-30分钟。

在具体实施方案中,可特异性杂交的核酸分子可在极高严格性杂交条件下保持结合。在这些和其他实施方案中,可特异性杂交的核酸分子可在高严格性杂交条件下保持结合。在这些和其他实施方案中,可特异性杂交的核酸分子可在中等严格性杂交条件下保持结合。

寡核苷酸:寡核苷酸是短的核酸聚合物。寡核苷酸可通过切割较长的核酸区段、或通过使单独的核苷酸前体聚合而形成。自动合成仪允许合成长度多达几百个碱基的寡核苷酸。由于寡核苷酸可与互补的核苷酸序列结合,所以可用作检测dna或rna的探针。由小dna序列组成的寡核苷酸(寡脱氧核糖核苷酸)可在pcr(一种用于扩增dna的技术)中使用。在pcr中,寡核苷酸通常被称为“引物”,其允许dna聚合酶延伸寡核苷酸并复制互补链。

如本文所用,术语“序列同一性”或“同一性”在本文中在两个核酸或多肽序列的环境下使用时可指两个序列中的残基在指定比较窗口上比对最大对应性时为相同的。

如本文所用,术语“序列同一性百分比”可以指通过在比较窗口上比较两个最佳比对序列(例如,核酸序列和氨基酸序列)确定的值,其中为了实现这两个序列的最佳比对,该比较窗口中的序列部分相比于参考序列(其不含添加或缺失)可包含添加或缺失(即,空位)。通过确定在两个序列中出现相同的核苷酸或氨基酸残基的位置的数目而产生匹配位置数,用该匹配位置数除以比较窗口中位置的总数,将结果乘以100而产生序列同一性的百分比,从而计算出该百分比。

用于比较的序列比对方法是本领域熟知的。各种程序和比对算法描述于例如以下文献中:smith和waterman(1981)adv.appl.math.2:482;needleman和wunsch(1970)j.mol.biol.48:443;pearson和lipman(1988)proc.natl.acad.sci.u.s.a.85:2444;higgins和sharp(1988)gene73:237-44;higgins和sharp(1989)cabios5:151-3;corpet等人(1988)nucleicacidsres.16:10881-90;huang等人(1992)comp.appl.biosci.8:155-65;pearson等人(1994)methodsmol.biol.24:307-31;tatiana等人(1999)femsmicrobiol.lett.174:247-50。序列比对方法和同源性计算的详细考虑事项可见于例如altschul等人,(1990)j.mol.biol.215:403-10。

美国国家生物技术信息中心(ncbi)基本局部比对搜索工具(blasttm;altschul等人(1990))可从几个源头(包括美国国家生物技术信息中心(bethesda,md))获得并且可在互联网上获得,以便结合几种序列分析程序使用。怎样使用该程序确定序列同一性的描述可在互联网上blasttm的“帮助”部分获得。为了比较核酸序列,可以使用默认参数执行blasttm(blastn)程序的“blast2序列”功能。当通过此方法评估时,与参考序列具有甚至更大相似性的核酸序列将显示同一性百分比增加。

如本文所用,术语“可操作地连接”涉及当第一核酸序列与第二核酸序列成功能关系时,第一核酸序列与第二核酸序列可操作地连接。例如,当启动子影响编码序列的转录或表达时,启动子与编码序列可操作地连接。当以重组方式产生时,可操作地连接的核酸序列通常是邻接的,并且在必要时可将两个蛋白质编码区连接在同一个阅读框内。然而,核酸无需邻接以便可操作地连接。

如本文所用,术语“启动子”是指一般位于基因上游(朝向基因的5'区)并且为起始和驱动基因转录所需的dna区。启动子可使其控制的基因适当活化或抑制。启动子可含有由转录因子识别的特异性序列。这些因子可结合至启动子dna序列,其导致rna聚合酶(由基因编码区合成rna的酶)的募集。启动子通常是指位于基因上游的所有基因调控元件,包括上游启动子、5'-utr、内含子和前导序列。

如本文所用,术语“上游启动子”是指足以引导转录起始的邻接多核苷酸序列。如本文所用,上游启动子涵盖转录起始位点和多个序列基序,包括tata盒、起始序列、tfiib识别元件和其他启动子基序(jennifer,e.f.等人,(2002)genes&dev.,16:2583-2592)。上游启动子提供rna聚合酶ii与如tfiia、b、d、e、f和h的基本或通用转录因子的作用位点,rna聚合酶ii是多亚基酶。这些因子组装成转录前起始复合物,该复合物催化由dna模板合成rna。

上游启动子的活化通过另外序列的调节dna序列元件来进行,该调节dna序列元件被各种蛋白质结合并且随后与转录起始复合物相互作用以活化基因表达。这些基因调控元件序列与特异性dna结合因子相互作用。这些序列基序有时可称为顺式元件。组织特异性或发育特异性转录因子单独地或组合地结合的此类顺式元件可在转录水平下决定启动子的时空表达模式。这些顺式元件在其施加于可操作地连接的基因的控制类型方面变化广泛。一些元件用于响应于环境反应(例如,温度、湿度和受伤)而增加可操作地连接的基因的转录。其他顺式元件可对发育线索(例如,发芽、种子成熟以及开花)或对空间信息(例如,组织特异性)作出响应。参见例如langridge等人,(1989)proc.natl.acad.sci.usa86:3219-23。这些顺式元件位于距转录起始点的不同距离处,一些顺式元件(称为近端元件)邻近最小核心启动子区,而其他元件可位于启动子(增强子)上游或下游的几千个碱基处。

如本文所用,术语“5'非翻译区”或“5'-utr”定义为前mrna或成熟mrna的5'末端的非翻译区段。例如,在成熟mrna上,5'-utr通常在其5'末端含有7-甲基鸟苷帽并且参与很多过程,诸如剪接、聚腺苷酸化、mrna输出至细胞质、由翻译机器鉴别mrna的5'末端以及保护mrna免于降解。

如本文所用,术语“转录终止子”定义为前mrna或成熟mrna的3'末端的转录区段。例如,“聚腺苷酸化信号”位点之外的较长dna延伸转录为前mrna。此dna序列通常含有转录终止信号以便将前mrna适当加工为成熟mrna。

如本文所用,术语“3’非翻译区”或“3'-utr”定义为前mrna或成熟mrna的3'末端的非翻译区段。例如,在成熟mrna上,此区含有聚(a)尾部并且已知在mrna稳定性、翻译起始和mrna输出中具有许多作用。另外,3'-utr被视为包括聚腺苷酸化信号和转录终止子。

如本文所用,术语“聚腺苷酸化信号”指示mrna转录物中存在的核酸序列,当存在聚(a)聚合酶时,允许转录物在例如位于聚(a)信号下游10至30个碱基处的聚腺苷酸化位点上聚腺苷酸化。许多聚腺苷酸化信号是本领域已知的并且适用于本发明。示例性序列包括aauaaa及其变体,如lokej.等人,(2005)plantphysiology138(3);1457-1468所述。

“dna结合转基因”是编码dna结合蛋白的多核苷酸编码序列。dna结合蛋白随后能够结合至另一个分子。结合蛋白可结合至例如dna分子(dna结合蛋白)、rna分子(rna结合蛋白)和/或蛋白质分子(蛋白质结合蛋白)。就蛋白质结合蛋白而言,其可结合至其自身(以形成同源二聚体、同源三聚体等),和/或其可结合至一种或多种不同的蛋白质的一个或多个分子。结合蛋白可具有超过一种类型的结合活性。例如,锌指蛋白具有dna结合、rna结合和蛋白质结合活性。

dna结合蛋白的实例包括;可“经工程改造”为结合至预定核苷酸序列的大范围核酸酶、锌指、crispr和tale结合域。通常,经工程改造的dna结合蛋白(例如,锌指、crispr或tale)是非天然存在的蛋白质。用于工程改造dna结合蛋白的方法的非限制性实例是设计和选择。所设计的dna结合蛋白是自然界中不存在的蛋白质,其设计/组成大体上由合理准则产生。设计的合理准则包括取代法则和计算机化算法的应用,以处理现有zfp、crispr和/或tale设计和结合数据的数据库储存信息中的信息。参见例如美国专利6,140,081、6,453,242和6,534,261;也可参见wo98/53058;wo98/53059;wo98/53060;wo02/016536和wo03/016496以及美国专利公开no.20110301073、20110239315和20119145940。

“锌指dna结合蛋白”(或结合域)是通过一个或多个锌指以序列特异性方式结合dna的蛋白质或较大蛋白质内的区域,该锌指是结合域内的氨基酸序列区,该结合域的结构通过锌离子的配位稳定。术语锌指dna结合蛋白通常缩写为锌指蛋白或zfp。锌指结合域可“经工程改造”为结合至预定核苷酸序列。用于工程改造锌指蛋白的方法的非限制性实例是设计和选择。所设计的锌指蛋白是自然界中不存在的蛋白质,其设计/组成大体上由合理准则产生。设计的合理准则包括取代法则和计算机化算法的应用,以处理现有zfp设计和结合数据的数据库储存信息中的信息。参见例如美国专利no.6,140,081、6,453,242、6,534,261和6,794,136;也可参见wo98/53058、wo98/53059、wo98/53060、wo02/016536和wo03/016496。

在其他实例中,一种或多种核酸酶的dna结合域包含天然存在或经工程改造的(非天然存在的)tal效应子dna结合域。参见例如美国专利公开no.20110301073,其全文以引用方式并入本文。已知黄单胞菌属(xanthomonas)的植物病原细菌在重要作物中引起许多疾病。黄单胞菌属的病原性取决于保守性iii型分泌(t3s)系统,该系统将更多不同的效应蛋白注入植物细胞中。转录活化因子样(talen)效应子在这些注入的蛋白质中,其模拟植物转录活化因子并且操控植物转录物组(参见kay等人,(2007)science318:648-651)。这些蛋白质含有dna结合域和转录活化域。一种最充分表征的tal效应子是来自野油菜黄单胞菌辣椒斑点病致病变种(xanthomonascampestgrispv.vesicatoria)的avrbs3(参见bonas等人,(1989)molgengenet218:127-136和wo2010079430)。tal效应子含有串联重复序列的集中域,每个重复序列含有大约34个氨基酸,它们是这些蛋白质的dna结合特异性的关键。另外,它们含有核定位序列和酸性转录活化域(评述参见schornacks等人,(2006)jplantphysiol163(3):256-272)。另外,在植物病原性细菌青枯雷尔氏菌(ralstoniasolanacearum)中,已发现青枯雷尔氏菌生物变种菌株gmi1000和生物变种4菌株rs1000中命名为brg11和hpx17的两种基因与黄单胞菌属的avrbs3家族同源(参见heuer等人,(2007)applandenviromicro73(13):4379-4384)。这些基因的核苷酸序列彼此具有98.9%的同一性,但不同之处在于hpx17的重复序列域中缺失1,575bp。然而,两种基因产物与黄单胞菌属avrbs3家族蛋白质具有小于40%序列同一性。参见例如美国专利公开no.20110301073,其全文以引用方式并入。

这些tal效应子的特异性取决于串联重复序列中所发现的序列。重复序列包含大约102bp并且重复序列通常彼此91-100%同源(bonas等人,同上)。重复序列的多态性通常位于位置12和13处,并且在位置12和13处的高变双残基的标识与tal效应子的靶标序列的连续核苷酸标识之间似乎存在一对一的对应性(参见moscou和bogdanove,(2009)science326:1501和boch等人,(2009)science326:1509-1512)。已通过实验方式测定用于这些tal效应子的dna识别的天然编码,使得位置12和13处的hd序列结合至胞嘧啶(c),ng结合至t,ni结合至a、c、g或t,nn结合至a或g,并且ing结合至t。这些dna结合重复序列已与新的组合和数量的重复序列组装成蛋白质,以制造人工转录因子,该人工转录因子能够与新序列相互作用并且活化非内源性报告基因在植物细胞中的表达(boch等人,同上)。经工程改造的tal蛋白已连接至foki切割半域,以产生在酵母报告基因分析(基于质粒的靶标)中表现出活性的tal效应子域核酸酶融合物(talen)。

crispr(规律成簇的间隔短回文重复序列)/cas(crispr相关)核酸酶系统是最近经工程改造的核酸酶系统,其基于可用于基因组工程改造的细菌系统。其基于许多细菌和古菌的适应性免疫应答的一部分。当病毒或质粒侵入细菌时,侵入者dna的区段通过“免疫”应答转化成crisprrna(crrna)。然后此crrna通过部分互补区与称为tracrrna的另一种类型的rna关联,以将cas9核酸酶引导至与靶标dna中的crrna同源的称为“原型间隔子”的区。cas9在crrna转录物内含有的20个核苷酸的引导序列指定的位点处切割dna,以在双链断裂(dsb)处产生钝端。cas9需要crrna和tracrrna二者,用于位点特异性dna识别和切割。此系统现已经工程改造为使得crrna和tracrrna可组合为一个分子(“单个引导rna”),并且单个引导rna的crrna等同部分可经工程改造为引导cas9核酸酶靶向任何所需序列(参见jinek等人,(2012)science337,第816-821页,jinek等人,(2013),elife2:e00471,以及davidsegal,(2013)elife2:e00563)。因此,crispr/cas系统可经工程改造为在基因组中的所需靶标处形成dsb,并且dsb的修复可受修复抑制剂的使用影响,以使易错修复增加。

在其他实例中,dna结合转基因是包含经工程改造的(非天然存在的)大范围核酸酶(也称为归巢核酸内切酶)的位点特异性核酸酶。诸如i-scei、i-ceui、pi-pspi、pi-sce、i-sceiv、i-csmi、i-pani、i-sceii、i-ppoi、i-sceiii、i-crei、i-tevi、i-tevii和i-teviii的归巢核酸内切酶或大范围核酸酶的识别序列是已知的。还可参见美国专利no.5,420,032;美国专利no.6,833,252;belfort等人,(1997)nucleicacidsres.25:3379–303388;dujon等人,(1989)gene82:115–118;perler等人,(1994)nucleicacidsres.22,11127;jasin(1996)trendsgenet.12:224–228;gimble等人,(1996)j.mol.biol.263:163–180;argast等人,(1998)j.mol.biol.280:345–353和newenglandbiolabs产品目录。另外,归巢核酸内切酶和大范围核酸酶的dna结合特异性可经工程改造为结合非天然靶标位点。参见例如chevalier等人,(2002)molec.cell10:895-905;epinat等人,(2003)nucleicacidsres.531:2952-2962;ashworth等人,(2006)nature441:656-659;paques等人,(2007)currentgenetherapy7:49-66;美国专利公开no.20070117128。归巢核酸内切酶和大范围核酸酶的dna结合域可在核酸酶作为整体的背景下改变(即,使得核酸酶包括同源切割域)或可融合至异源切割域。

如本文所用,术语“转化”涵盖可将核酸分子导入这种细胞中的所有技术。实例包括但不限于:用病毒载体转染;用质粒载体转化;电穿孔;脂质体转染;显微注射(mueller等人,(1978)cell15:579-85);农杆菌属介导的转移;直接dna摄入;whiskerstm介导的转化;以及微粒轰击。这些技术可用于植物细胞的稳定转化和瞬时转化二者。“稳定转化”是指核酸片段引入宿主生物体基因组中产生的基因稳定遗传。一旦稳定转化,核酸片段即稳定整合进宿主生物体和任何子代的基因组中。含有经转化核酸片段的宿主生物体称为“转基因”生物体。“瞬时转化”是指核酸片段引入宿主生物体的细胞核或含dna的细胞器中,在无基因稳定遗传的情况下产生的基因表达。

外源性核酸序列。在一个实例中,转基因是基因序列(例如,除草剂抗性基因)、编码工业或药学上有用的化合物的基因或编码所需农业性状的基因。在又一个实例中,转基因是反义核酸序列,其中该反义核酸序列的表达抑制靶标核酸序列的表达。转基因可含有可操作地连接至转基因的调控序列(例如,启动子)。在一些实施方案中,所关注的多核苷酸序列是转基因。然而,在其他实施方案中,所关注的多核苷酸序列是内源性核酸序列,其中该内源性核酸序列的另外基因组拷贝为所需的,或相对于宿主生物体的靶标核酸分子的序列呈反义方向的核酸序列。

如本文所用,术语转基因“事件”通过以下步骤产生:用异源性dna(即包括所关注的转基因的核酸构建体)转化植物细胞,从转基因插入至植物基因组引起植物群体的再生,以及选择通过插入至特定基因组位置而表征的特定植物。术语“事件”是指包括异源性dna的原始转化子以及转化子的子代。术语“事件”也指通过转化子与包括基因组/转基因dna的另一个品种之间的有性异型杂交产生的子代。即使在与回交亲本重复回交之后,来自转化亲本的插入转基因dna和侧接基因组dna(基因组/转基因dna)仍存在于杂交子代的相同染色体位置。术语“事件”也指来自原始转化子及其子代的dna,其包括插入dna和紧邻插入dna的侧接基因组序列,预期该dna转移至子代,该子代接受包括所关注的转基因的插入dna,包括所关注的转基因是一个包括插入dna(例如,原始转化子和自交产生的子代)的亲本系与不含插入dna的亲本系的有性杂交的结果。

如本文所用,术语“聚合酶链式反应”或“pcr”定义扩增微量核酸、rna和/或dna的程序或技术,如1987年7月28日授予的美国专利no.4,683,195所述。一般来讲,来自所关注区域末端或以外的序列信息需要是可用的,以便可设计寡核苷酸引物;这些引物的序列将与待扩增的模板的相反链一致或类似。两个引物的5'末端核苷酸可与扩增物质的末端一致。pcr可用于扩增特异性rna序列、来自总基因组dna的特异性dna序列以及从总细胞rna转录的cdna、噬菌体或质粒序列等。通常参见mullis等人,coldspringharborsymp.quant.biol.,51:263(1987);erlich编,pcrtechnology,(stocktonpress,ny,1989)。

如本文所用,术语“引物”是指当条件适于合成引物延伸产物时,能够充当沿着互补链合成的起始点的寡核苷酸。合成条件包括存在四种不同的脱氧核糖核苷酸三磷酸和至少一种聚合诱导剂,诸如逆转录酶或dna聚合酶。它们存在于合适的缓冲液中,该缓冲液可包含在各种合适的温度下作为辅因子或影响诸如ph等条件的成分。引物优选地为单链序列,以使得扩增效率得以优化,但也可采用双链序列。

如本文所用,术语“探针”是指与靶标序列杂交的寡核苷酸。在型分析程序中,探针与定位于两个引物的退火位点之间的一部分靶标杂交。探针包括约八个核苷酸、约十个核苷酸、约十五个核苷酸、约二十个核苷酸、约三十个核苷酸、约四十个核苷酸或约五十个核苷酸。在一些实施方案中,探针包括约八个核苷酸至约十五个核苷酸。探针还可包括可检测标记,例如荧光团(异硫氰酸荧光素等)。可检测标记可直接共价连接至探针寡核苷酸,例如位于探针的5'末端或探针的3'末端。包括荧光团的探针也可另外包括淬灭剂,例如blackholequenchertm、iowablacktm等。

如本文所用,术语“限制性核酸内切酶”和“限制性酶”是指细菌酶,它们中的每一者在特异性核苷酸序列处或附近切割双链dna。2型限制性酶在相同位点识别和切割dna,并且包括但不限于xbai、bamhi、hindiii、ecori、xhoi、sali、kpni、avai、psti和smai。

如本文所用,术语“载体”与术语“构建体”、“克隆载体”和“表达载体”可互换使用,并且意指可将dna或rna序列(例如,外源性基因)引入宿主细胞以便转化宿主和促进所引入的序列表达(例如,转录和翻译)的载体。“非病毒载体”旨在意指不含病毒或逆转录病毒的任何载体。在一些实施方案中,“载体”是包含至少一个dna复制起点和至少一个选择性标记基因的dna序列。实例包括但不限于质粒、粘粒、噬菌体、细菌人工染色体(bac)或将外源性dna携带到细胞中的病毒。载体也可包括一个或多个基因、反义分子和/或选择性标记基因以及本领域已知的其他遗传元件。载体可以转导、转化或感染细胞,从而引起细胞表达核酸分子和/或由该载体编码的蛋白质。术语“质粒”定义在原核或真核宿主细胞中能够常染色体复制的环形核酸链。该术语包括可为dna或rna并且可为单链或双链的核酸。具有该定义的质粒也可包括对应于细菌复制起点的序列。

如本文所用,本文所用的术语“选择性标记基因”定义基因或其他表达盒,其编码有助于鉴别插入选择性标记基因的细胞的蛋白质。例如,“选择性标记基因”涵盖报告基因以及用于植物转化以便例如保护植物细胞免受选择性药剂的影响或提供对选择性药剂的抗性/耐受性的基因。在一个实施方案中,只有接受功能选择性标记的那些细胞或植物才能够在具有选择性药剂的条件下分裂或生长。选择性药剂的实例可包括例如抗生素,包括大观霉素(spectinomycin)、新霉素(neomycin)、卡那霉素(kanamycin)、巴龙霉素(paromomycin)、庆大霉素(gentamicin)和潮霉素(hygromycin)。这些选择性标记包括新霉素磷酸转移酶(nptii),其表达赋予对抗生素卡那霉素抗性的酶;和相关抗生素新霉素、巴龙霉素、庆大霉素和g418的基因;或潮霉素磷酸转移酶(hpt)的基因,其表达赋予对潮霉素抗性的酶。其他选择性标记基因可包括编码包括bar或pat的除草剂抗性的基因(针对草铵膦(glufosinateammonium)或草丁膦(phosphinothricin)的抗性);乙酰乳酸合酶的基因(als,针对诸如磺酰脲(su)、咪唑啉酮(imi)、三唑并嘧啶(tp)、嘧啶基氧基苯甲酸酯(pob)以及磺酰基胺基羰基三唑啉酮(防止支链氨基酸合成第一步)的抑制剂的抗性)、编码草甘膦(glyphosate)、2,4-d和金属抗性或敏感性的基因。可用作选择性标记基因的“报告基因”的实例包括目测观察所表达的报告基因蛋白,诸如编码β-葡糖醛酸酶(gus)、荧光素酶、绿色荧光蛋白(gfp)、黄色荧光蛋白(yfp)、dsred、β-半乳糖苷酶、氯霉素乙酰转移酶(cat)、碱性磷酸酶等等的蛋白质。短语“标记阳性”是指植物已经转化为包括选择性标记基因。

如本文所用,术语“可检测标记”是指能够检测的标记,诸如放射性同位素、荧光化合物、生物发光化合物、化学发光化合物、金属螯合剂或酶。可检测标记的实例包括但不限于:荧光标记(例如fitc、若丹明(rhodamine)、镧系磷光体)、酶标记(例如辣根过氧化酶、β-半乳糖苷酶、荧光素酶、碱性磷酸酶)、化学发光标记、生物素基、被二级报告基因识别的预先确定的多肽表位(例如亮氨酸拉链对序列、二抗的结合位点、金属结合域、表位标签)。在一个实施方案中,可检测标记可通过各种长度的间隔臂连接以减小潜在的空间位阻。

如本文所用,术语“盒”、“表达盒”和“基因表达盒”是指可在特定限制性位点或通过同源重组插入核酸或多核苷酸中的dna区段。如本文所用,该dna区段包含编码所关注的多肽的多核苷酸,并且盒和限制性位点被设计为确保将盒插入适当的阅读框以便转录和翻译。在一个实施方案中,表达盒可包括编码所关注的多肽的多核苷酸,并且具有除有助于特定宿主细胞转化的多核苷酸以外的元件。在一个实施方案中,基因表达盒也可包括允许编码所关注的多肽的多核苷酸在宿主细胞中增强表达的元件。这些元件可包括但不限于:启动子、最小启动子、增强子、应答元件、终止子序列、聚腺苷酸化序列等等。

如本文所用,“接头”或“间隔子”是使两个分离实体彼此结合的键、分子或分子群。接头和间隔子可向两个实体提供最佳间距,或还可提供允许两个实体彼此分离的不稳定键合。不稳定键合包括可光裂解基团、酸不稳定部分、碱不稳定部分和可酶切基团。如本文所用,术语“多接头”或“多克隆位点”定义彼此位于核酸序列上的10个核苷酸内的三个或更多个2型限制酶位点簇。包含多接头的构建体用于诸如基因编码区的核酸序列的插入和/或切除。在其他情况下,本文所用的术语“多接头”是指通过任何已知无缝克隆方法(即,gibsonnebuilderhifidnagoldengateassembly等)经靶向以接合两个序列的一段核苷酸。包含多接头的构建体用于诸如基因编码区的核酸序列的插入和/或切除。

如本文所用,术语“对照”是指在用于比较目的的分析程序中所用的样品。对照可为“阳性”或“阴性”的。例如,在分析程序的目的为检测细胞或组织中差异表达的转录物或多肽的情况下,通常优先包括阳性对照,诸如已知表现所需表达的植物样品;以及阴性对照,诸如已知缺乏所需表达的植物样品。

如本文所用,术语“植物”包括完整植物和植物的任何后代、细胞、组织或部分。可用于本发明中的植物类别通常与受到诱变的高等和低等植物类别一样广泛,包括被子植物(单子叶和双子叶植物)、裸子植物、蕨类植物和多细胞藻类。因此,“植物”包括双子叶植物和单子叶植物。术语“植物部分”包括植物的任何部分,包括例如而不限于:种子(包括成熟种子和未成熟种子);植物插条;植物细胞;植物细胞培养物;植物器官(例如,花粉、胚芽、花、果实、芽、叶、根、茎和外植体)。植物组织或植物器官可以是种子、原生质体、愈伤组织或组织成结构或功能单元的任何其他植物细胞群。植物细胞或组织培养物能够再生具有由其获得细胞或组织的植物生理和形态特征的植物,并且能够再生具有与该植物基本上相同基因型的植物。相比之下,一些植物细胞不能够再生而产生植物。植物细胞或组织培养物中的可再生细胞可以是胚芽、原生质体、分生细胞、愈伤组织、花粉、叶、花药、根、根尖、穗丝、花、果仁、穗、穗轴、果壳或梗。

植物部分包括可收获部分以及适用于子代植物繁殖的部分。适用于繁殖的植物部分包括例如而不限于:种子、果实、插条、幼苗、块茎以及根茎。植物的可收获部分可以是植物的任何可用部分,包括例如而不限于:花、花粉、幼苗、块茎、叶、茎、果实、种子以及根。

植物细胞是植物的结构和生理单元,包括原生质体和细胞壁。植物细胞可以是分离的单细胞或细胞聚集物(例如,脆弱的愈伤组织和培养细胞)形式,并且可以是高等组织单元(例如,植物组织、植物器官和植物)的一部分。因此,植物细胞可以是原生质体、配子产生细胞或可再生成完整植物的细胞或细胞集合。因此,包含多个植物细胞并且能够再生成完整植物的种子在本文的实施方案中视为“植物细胞”。

如本文所用,术语“小rna”是指许多类别的非编码核糖核酸(ncrna)。术语小rna描述在细菌细胞、动物、植物和真菌中产生的短链ncrna。这些短链ncrna可在细胞内天然产生或可通过引入表达短链或ncrna的外源性序列而产生。小rna序列不直接编码蛋白质,并且在功能方面与其他rna不同,因为小rna序列只转录但不翻译。小rna序列参与其他细胞功能,包括基因表达和修饰。小rna分子通常由约20至30个核苷酸组成。小rna序列可来源于较长前体。前体形成在自身互补区彼此折回的结构;然后它们通过动物中的核酸酶dicer或植物中的核酸酶dcl1加工。

许多类型的小rna以天然或人工产生的形式存在,包括微rna(mirna)、短干扰rna(sirna)、反义rna、短发夹rna(shrna)和小核仁rna(snorna)。某些类型的小rna(诸如微rna和sirna)在基因沉默和rna干扰(rnai)中是重要的。基因沉默为遗传调控方法,其中通常应表达的基因由细胞内元件(在此情况下,小rna)“关闭”。通常应通过此遗传信息形成的蛋白质由于干扰而不形成,并且基因中的编码信息由表达阻断。

如本文所用,术语“小rna”涵盖文献中称为“微小rna”(storz,(2002)science296:1260-3;illangasekare等人,(1999)rna5:1482-1489)、原核“小rna”(srna)(wassarman等人,(1999)trendsmicrobiol.7:37-45)、真核“非编码rna(ncrna)”、“微rna(mirna)”、“小非mrna(snmrna)”、“功能性rna(frna)”、“转移rna(trna)”、“催化性rna”[例如,核酶,包括自身酰化核酶(illangaskare等人,(1999)rna5:1482-1489)]、“小核仁rna(snorna)”、“tmrna”(也称为“10srna”,muto等人,(1998)trendsbiochemsci.23:25-29;以及gillet等人,(2001)molmicrobiol.42:879-885)的rna分子;rnai分子包括但不限于“小干扰rna(sirna)”、“内切核糖核酸酶制备的sirna(e-sirna)”、“短发夹rna(shrna)”和“小时间调节rna(strna)”、“切割的sirna(d-sirna)”和适体;包含至少一个尿嘧啶碱基的寡核苷酸和其他合成核酸。

除非另外特别地解释,否则本文使用的全部技术术语和科学术语具有与本公开所属领域的普通技术人员通常所理解的相同的含义。分子生物学的常见术语的定义可见于例如:lewin,genesv,oxforduniversitypress,1994(isbn0-19-854287-9);kendrew等人(编),theencyclopediaofmolecularbiology,blackwellscienceltd.,1994(isbn0-632-02182-9);和meyers(编),molecularbiologyandbiotechnology:acomprehensivedeskreference,vchpublishers,inc.,1995(isbn1-56081-569-8)。

如本文所用,除非上下文清晰明确地相反指出,否则词语“一个/一种”和“该/所述”包括复数指代物。

iii.二穗短柄草金属硫蛋白样基因(mtl)启动子和包含所述启动子的核酸

提供使用来自二穗短柄草金属硫蛋白样基因(mtl)的启动子在植物中表达非金属硫蛋白样转基因的方法和组合物。在一个实施方案中,启动子可以是seqidno:1的二穗短柄草金属硫蛋白样基因(mtl)启动子。

在一个实施方案中,提供包含启动子的多核苷酸,其中该启动子与seqidno:1具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%或100%同一性。在一个实施方案中,启动子是二穗短柄草金属硫蛋白样基因(mtl)启动子,其包含与seqidno:1的多核苷酸具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%或100%同一性的多核苷酸。在一个实施方案中,提供分离的多核苷酸,其包含与seqidno:1的多核苷酸至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%或100%同一性。在一个实施方案中,提供核酸载体,其包含seqidno:1的二穗短柄草金属硫蛋白样基因(mtl)启动子。在一个实施方案中,提供多核苷酸,其包含可操作地连接至多接头的二穗短柄草金属硫蛋白样基因(mtl)启动子。在一个实施方案中,提供基因表达盒,其包含可操作地连接至非金属硫蛋白样转基因的二穗短柄草金属硫蛋白样基因(mtl)启动子。在一个实施方案中,提供核酸载体,其包含可操作地连接至非金属硫蛋白样转基因的二穗短柄草金属硫蛋白样基因(mtl)启动子。在一个实施方案中,启动子由seqidno:1组成。在一个示例性实施方案中,核酸载体包含可操作地连接至转基因的二穗短柄草金属硫蛋白样基因(mtl)启动子,其中该转基因可以是杀昆虫抗性转基因、除草剂耐受性转基因、氮使用效率转基因、水使用效率转基因、营养品质转基因、dna结合转基因、小rna转基因、选择性标记转基因或它们的组合。

转基因表达也可通过位于基因编码序列下游的3'-非翻译基因区(即,3'-utr)来调控。启动子和3'-utr二者均可调控转基因表达。虽然启动子为驱动转录所必需的,但是3'-utr基因区可终止转录并且引发所得的mrna转录物的聚腺苷酸化,以用于翻译和蛋白质合成。3’-utr基因区帮助转基因的稳定表达。

在一个实施方案中,提供核酸载体,其包含如本文所述的二穗短柄草金属硫蛋白样基因(mtl)启动子和3'-utr。在一个实施方案中,核酸载体包含二穗短柄草金属硫蛋白样基因(mtl)3’-utr。在一个实施方案中,二穗短柄草金属硫蛋白样基因(mtl)3’-utr是seqidno:3。

在一个实施方案中,提供核酸载体,其包含如本文所述的二穗短柄草金属硫蛋白样基因(mtl)启动子和3'-utr,其中该3'-utr与seqidno:3的多核苷酸具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%或100%同一性。在一个实施方案中,提供核酸载体,其包含如本文所述的二穗短柄草金属硫蛋白样基因(mtl)启动子和3'-utr,其中该二穗短柄草金属硫蛋白样基因(mtl)启动子和3'-utr均可操作地连接至多接头的相对末端。在一个实施方案中,提供基因表达盒,其包含如本文所述的二穗短柄草金属硫蛋白样基因(mtl)启动子和3'-utr,其中该二穗短柄草金属硫蛋白样基因(mtl)启动子和3'-utr均可操作地连接至非金属硫蛋白样转基因的相对末端。在一个实施方案中,3'-utr由seqidno:3组成。在一个实施方案中,提供基因表达盒,其包含如本文所述的二穗短柄草金属硫蛋白样基因(mtl)启动子和3'-utr,其中该二穗短柄草金属硫蛋白样基因(mtl)启动子包含seqidno:1,并且该3'-utr包含seqidno:3,其中该启动子和3'-utr可操作地连接至非金属硫蛋白样转基因的相对末端。在该实施方案的一个方面,3'-utr由seqidno:3组成。在该实施方案的另一个方面,启动子由seqidno:1组成。在一个示例性实施方案中,基因表达盒包含可操作地连接至转基因的二穗短柄草金属硫蛋白样基因(mtl)3’-utr,其中该转基因可为杀昆虫抗性转基因、除草剂耐受性转基因、氮使用效率转基因、水使用效率转基因、营养品质转基因、dna结合转基因、小rna转基因、选择性标记转基因或它们的组合。在另一个实施方案中,转基因可操作地连接至来自相同的金属硫蛋白样基因的二穗短柄草金属硫蛋白样基因(mtl)启动子和3'-utr。

转基因表达也可通过位于启动子序列下游的内含子区来调控。启动子和内含子二者均可调控转基因表达。虽然启动子是驱动转录所必需的,但是内含子的存在可提高表达水平,产生mrna转录物以用于翻译和蛋白质合成。内含子基因区帮助转基因的稳定表达。在另一个实施方案中,内含子可操作地连接至二穗短柄草金属硫蛋白样基因(mtl)启动子。

转基因表达也可通过位于启动子序列下游的5'-utr区来调控。启动子和5'-utr二者均可调控转基因表达。虽然启动子是驱动转录所必需的,但是5'-utr的存在可提高表达水平,产生mrna转录物以用于翻译和蛋白质合成。5’-utr基因区帮助转基因的稳定表达。在另一个实施方案中,5'-utr可操作地连接至二穗短柄草金属硫蛋白样基因(mtl)启动子。

二穗短柄草金属硫蛋白样基因(mtl)启动子也可包含一个或多个另外的序列元件。在一些实施方案中,二穗短柄草金属硫蛋白样基因(mtl)启动子可包含外显子(例如,前导序列或信号肽,诸如叶绿体转运肽或er滞留信号)。例如而不限于,作为另一个实施方案,二穗短柄草金属硫蛋白样基因(mtl)启动子可编码并入二穗短柄草金属硫蛋白样基因(mtl)启动子中的外显子。

在一个实施方案中,核酸载体包含如本文所公开的基因表达盒。在一个实施方案中,载体可以是适用于直接转化或基因靶向诸如供体dna的质粒、粘粒、细菌人工染色体(bac)、噬菌体、病毒或剪切多核苷酸片段。

根据一个实施方案,提供包含重组基因表达盒的核酸载体,其中该重组基因表达盒包含可操作地连接至多接头序列、非金属硫蛋白样转基因或其组合的二穗短柄草金属硫蛋白样基因(mtl)启动子。在一个实施方案中,重组基因盒包含可操作地连接至非金属硫蛋白样转基因的二穗短柄草金属硫蛋白样基因(mtl)启动子。在一个实施方案中,重组基因盒包含可操作地连接至多接头序列的如本文所公开的二穗短柄草金属硫蛋白样基因(mtl)启动子。多接头以一定方式可操作地连接至二穗短柄草金属硫蛋白样基因(mtl)启动子,使得编码序列插入多接头的一个限制性位点将可操作地连接该编码序列,从而允许当载体转化或转染进宿主细胞中时表达该编码序列。

根据一个实施方案,二穗短柄草金属硫蛋白样基因(mtl)启动子包含seqidno:1或与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的序列。根据一个实施方案,二穗短柄草金属硫蛋白样基因(mtl)启动子包含seqidno:1或与seqidno:1具有80%、85%、90%、95%或99%序列同一性的序列。根据一个实施方案,启动子序列的总长度不超过1.5、2、2.5、3或4kb。根据一个实施方案,二穗短柄草金属硫蛋白样基因(mtl)启动子由seqidno:1或与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的2,000bp序列组成。根据一个实施方案,二穗短柄草金属硫蛋白样基因(mtl)启动子由seqidno:1或与seqidno:1具有80%、85%、90%、95%或99%序列同一性的2,000bp序列组成。

还提供seqidno:12作为二穗短柄草金属硫蛋白样基因(mtl)启动子的实施方案。这种经修饰的二穗短柄草金属硫蛋白样基因(mtl)启动子序列可在本文中用于驱动转基因的表达,并且提供在本文中可代替本公开提供的seqidno:1使用的替代启动子序列。seqidno:1和seqidno:12的启动子多核苷酸序列共有97.2%序列同一性。提供seqidno:12的启动子,作为二穗短柄草金属硫蛋白样基因(mtl)启动子的另一个实施方案。

还提供如图2所示的seqidno:7(1,730bp)、seqidno:8(1,530bp)、seqidno:9(1,330bp)、seqidno:10(1,130bp)和seqidno:11(1,001bp)作为二穗短柄草金属硫蛋白样基因(mtl)启动子的实施方案。这些经截短的二穗短柄草金属硫蛋白样基因(mtl)启动子序列可在本文中用于驱动转基因的表达,并且提供在本文中可代替本公开提供的seqidno:1使用的替代启动子序列。提供seqidno:7的1,730bp启动子,作为二穗短柄草金属硫蛋白样基因(mtl)启动子的另一个实施方案。此外,提供seqidno:8的1,530bp启动子,作为二穗短柄草金属硫蛋白样基因(mtl)启动子的另一个实施方案。提供seqidno:9的1,330bp启动子,作为二穗短柄草金属硫蛋白样基因(mtl)启动子的另一个实施方案。另外,提供seqidno:10的1,130bp启动子,作为二穗短柄草金属硫蛋白样基因(mtl)启动子的另一个实施方案。此外,提供seqidno:9的1,001bp启动子,作为二穗短柄草金属硫蛋白样基因(mtl)启动子的另一个实施方案。

根据一个实施方案,提供包含基因盒的核酸载体,该基因盒由二穗短柄草金属硫蛋白样基因(mtl)启动子、非金属硫蛋白样转基因和seqidno:3的二穗短柄草金属硫蛋白样基因(mtl)3’-utr组成。在一个实施方案中,seqidno:3的二穗短柄草金属硫蛋白样基因(mtl)3’-utr可操作地连接至非金属硫蛋白样转基因的3'末端。在另一个实施方案中,3'非翻译序列包含seqidno:3或与seqidno:3具有至少80%、85%、90%、95%、99%或100%序列同一性的序列。在另一个实施方案中,3'非翻译序列包含seqidno:3或与seqidno:3具有80%、85%、90%、95%、99%或100%序列同一性的序列。根据一个实施方案,提供包含基因盒的核酸载体,该基因盒由seqidno:3或与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的2,000bp序列、非金属硫蛋白样转基因和3'-utr组成,其中seqidno:1可操作地连接至该非金属硫蛋白样转基因的5'末端并且seqidno:3的3'-utr可操作地连接至该非金属硫蛋白样转基因的3'末端。根据一个实施方案,提供包含基因盒的核酸载体,该基因盒由seqidno:3或与seqidno:1具有80%、85%、90%、95%或99%序列同一性的2,000bp序列、非金属硫蛋白样转基因和3'-utr组成,其中seqidno:1可操作地连接至该非金属硫蛋白样转基因的5'末端并且seqidno:3的3'-utr可操作地连接至该非金属硫蛋白样转基因的3'末端。在另一个实施方案中,3'非翻译序列包含seqidno:3或与seqidno:3具有至少80%、85%、90%、95%、99%或100%序列同一性的序列。在另一个实施方案中,3'非翻译序列由seqidno:3或与seqidno:3具有至少80%、85%、90%、95%、99%或100%序列同一性的1,002bp序列组成。在另一个实施方案中,3'非翻译序列包含seqidno:3或与seqidno:3具有80%、85%、90%、95%、99%或100%序列同一性的序列。在另一个实施方案中,3'非翻译序列由seqidno:3或与seqidno:3具有80%、85%、90%、95%或99%序列同一性的1,002bp序列组成。

还提供seqidno:17和seqidno:18作为二穗短柄草金属硫蛋白样基因(mtl)3’-utr的实施方案。这些经修饰的二穗短柄草金属硫蛋白样基因(mtl)3'-utr序列可在本文中用于终止转基因的表达,并且提供在本文中可代替本公开提供的seqidno:3使用的替代3'-utr序列。seqidno:3和seqidno:17的3’-utr多核苷酸序列共有94.2%序列同一性。seqidno:3和seqidno:18的3’-utr多核苷酸序列共有97.5%序列同一性。最后,seqidno:18和seqidno:17的3’-utr多核苷酸序列共有92.7%序列同一性。提供seqidno:17的3'-utr,作为二穗短柄草金属硫蛋白样基因(mtl)3'-utr的另一个实施方案。提供seqidno:18的3'-utr,作为二穗短柄草金属硫蛋白样基因(mtl)3'-utr的另一个实施方案。

还提供如图4所示的seqidno:13(264bp)、seqidno:14(332bp)、seqidno:15(630bp)和seqidno:16(727bp)作为二穗短柄草金属硫蛋白样基因(mtl)3’-utr的实施方案。这些经截短的二穗短柄草金属硫蛋白样基因(mtl)3'-utr序列可在本文中用于终止转基因的表达,并且提供在本文中可代替本公开提供的seqidno:3使用的替代3'-utr序列。提供seqidno:13的264bp3'-utr,作为二穗短柄草金属硫蛋白样基因(mtl)3'-utr的另一个实施方案。此外,提供seqidno:14的332bp3'-utr,作为二穗短柄草金属硫蛋白样基因(mtl)3'-utr的另一个实施方案。提供seqidno:15的630bp3'-utr,作为二穗短柄草金属硫蛋白样基因(mtl)3'-utr的另一个实施方案。另外,提供seqidno:16的727bp3'-utr,作为二穗短柄草金属硫蛋白样基因(mtl)3'-utr的另一个实施方案。

在一个实施方案中,提供核酸构建体,其包含启动子和非金属硫蛋白样转基因以及任选地以下元件中的一者或多者:

a)5'非翻译区;

b)内含子;以及

c)3'非翻译区,

其中:

该启动子由seqidno:1或与seqidno:1具有98%序列同一性的序列组成;并且

该3'非翻译区由seqidno:3或与seqidno:3具有98%序列同一性的序列组成;另外其中所述启动子可操作地连接至所述转基因,并且每个任选的元件(若存在)也可操作地连接至启动子和转基因二者。在另一个实施方案中,提供转基因细胞,其包含上文刚刚公开的核酸构建体。在一个实施方案中,转基因细胞是植物细胞,并且在另一个实施方案中,提供植物,其中该植物包含所述转基因细胞。

在一个实施方案中,提供核酸构建体,其包含启动子和非金属硫蛋白样转基因以及任选地以下元件中的一者或多者:

a)3'非翻译区,

其中:

该启动子由seqidno:1或与seqidno:1具有98%序列同一性的序列组成;并且

该3'非翻译区由seqidno:3或与seqidno:3具有98%序列同一性的序列组成;另外其中所述启动子可操作地连接至所述转基因,并且每个任选的元件(若存在)也可操作地连接至启动子和转基因二者。在另一个实施方案中,提供转基因细胞,其包含上文刚刚公开的核酸构建体。在一个实施方案中,转基因细胞是植物细胞,并且在另一个实施方案中,提供植物,其中该植物包含所述转基因细胞。

在一个实施方案中,提供核酸构建体,其包含启动子和多接头以及任选地以下元件中的一者或多者:

a)5'非翻译区,

b)内含子,以及

c)3'非翻译区,

其中:

该启动子由seqidno:1或与seqidno:1具有98%序列同一性的序列组成;并且

该3'非翻译区由seqidno:3或与seqidno:3具有98%序列同一性的序列组成;另外其中所述启动子可操作地连接至所述多接头,并且每个任选的元件(若存在)也可操作地连接至启动子和多接头二者。

根据一个实施方案,核酸载体还包含编码选择性标记的序列。根据一个实施方案,重组基因盒可操作地连接至农杆菌属t-dna边界。根据一个实施方案,重组基因盒还包含第一和第二t-dna边界,其中该第一t-dna边界可操作地连接至基因构建体的一个末端,并且该第二t-dna边界可操作地连接至基因构建体的另一个末端。第一和第二农杆菌属t-dna边界可独立地选自来源于细菌菌株的t-dna边界序列,该t-dna边界序列选自:合成胭脂碱的农杆菌属t-dna边界、合成章鱼碱的农杆菌属t-dna边界、合成甘露碱的农杆菌属t-dna边界、合成琥珀碱的农杆菌属t-边界或它们的任何组合。在一个实施方案中,提供选自胭脂碱合成菌株、甘露碱合成菌株、琥珀碱合成菌株或章鱼碱合成菌株的农杆菌属菌株,其中所述菌株包含质粒,其中该质粒包含可操作地连接至选自seqidno:1或与seqidno:1具有80%、85%、90%、95%或99%序列同一性的序列的序列的转基因。

适用于本发明公开的构建体的所关注的转基因包括但不限于赋予(1)对害虫或疾病的抗性;(2)对除草剂的耐受性;(3)增加价值的农艺学性状,诸如产率改良、氮使用效率、水使用效率和营养品质;(4)蛋白质与dna以位点特异性方式结合;(5)表达小rna以及(6)选择性标记的编码序列。根据一个实施方案,转基因编码选择性标记或赋予杀昆虫抗性、除草剂耐受性、小rna表达、氮使用效率、水使用效率或营养品质的基因产物。

1.昆虫抗性

各种昆虫抗性编码序列可以可操作地连接至包含seqidno:1或与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的序列的二穗短柄草金属硫蛋白样基因(mtl)启动子。各种昆虫抗性编码序列可以可操作地连接至包含seqidno:1或与seqidno:1具有80%、85%、90%、95%或99%序列同一性的序列的二穗短柄草金属硫蛋白样基因(mtl)启动子。然后可操作地连接的序列可并入所选载体中,以允许鉴别和选择转化的植物(“转化子”)。示例性昆虫抗性编码序列是本领域已知的。作为可以可操作地连接至本公开的调控元件的昆虫抗性编码序列的实施方案,提供以下性状。提供示例性鳞翅目(lepidopteran)昆虫抗性的编码序列包括:cry1a、cry1a.105、cry1ab、cry1ab(截短)、cry1ab-ac(融合蛋白)、cry1ac(以销售)、cry1c、cry1f(以销售)、cry1fa2、cry2ab2、cry2ae、cry9c、mocry1f、pinii(蛋白酶抑制蛋白)、vip3a(a)和vip3aa20。提供示例性鞘翅目(coleopteran)昆虫抗性的编码序列包括:cry34ab1(以销售)、cry35ab1(以销售)、cry3a、cry3bb1、dvsnf7和mcry3a。提供示例性多昆虫抗性的编码序列包括ecry31.ab。以上昆虫抗性基因的列表无意为限制性的。本公开涵盖任何昆虫抗性基因。

2.除草剂耐受性

各种除草剂耐受性编码序列可以可操作地连接至包含seqidno:1或与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的序列的二穗短柄草金属硫蛋白样基因(mtl)启动子。各种除草剂耐受性编码序列可以可操作地连接至包含seqidno:1或与seqidno:1具有80%、85%、90%、95%或99%序列同一性的序列的二穗短柄草金属硫蛋白样基因(mtl)启动子。然后可操作地连接的序列可并入所选载体中,以允许鉴别和选择转化的植物(“转化子”)。示例性除草剂耐受性编码序列是本领域已知的。作为可以可操作地连接至本公开的调控元件的除草剂耐受性编码序列的实施方案,提供以下性状。草甘膦除草剂含有通过抑制epsps酶(5-烯醇丙酮酰莽草酸-3-磷酸合酶)的作用模式。该酶参与植物生长和发育必需的芳族氨基酸的生物合成。可用于抑制该酶的各种酶促机制是本领域已知的。编码此类酶的基因可以可操作地连接至本公开的基因调控元件。在一个实施方案中,选择性标记基因包括但不限于编码包括以下的草甘膦抗性基因的基因:突变epsps基因,诸如2mepsps基因、cp4epsps基因、mepsps基因、dgt-28基因、aroa基因;以及草甘膦降解基因,诸如草甘膦乙酰转移酶基因(gat)和草甘膦氧化酶基因(gox)。这些性状目前以gly-toltmgt和roundup销售。草铵膦和/或毕拉草(bialaphos)化合物的抗性基因包括dsm-2、bar和pat基因。bar和pat性状目前以销售。还包括提供对2,4-d的抗性的耐受性基因,诸如aad-1基因(应注意aad-1基因具有对芳氧基苯氧基丙酸酯除草剂的其他活性)和aad-12基因(应注意aad-12基因具有对吡啶氧基乙酸酯合成植物生长素的其他活性)。这些性状作为作物保护技术销售。als抑制剂(磺酰脲、咪唑啉酮、三唑并嘧啶、嘧啶基硫代苯甲酸酯和磺酰基胺基-羰基-三唑啉酮)的抗性基因是本领域已知的。这些抗性基因最常由als编码基因序列的点突变引起。其他als抑制剂抗性基因包括hra基因、csr1-2基因、sr-hra基因和surb基因。一些性状以商标销售。抑制hppd的除草剂包括吡唑啉酮,诸如苄草唑(pyrazoxyfen)、吡草酮(benzofenap)和苯吡唑草酮(topramezone);三酮,诸如甲基磺草酮(mesotrione)、磺草酮(sulcotrione)、环磺酮(tembotrione)、苯并双环酮(benzobicyclon);以及二酮腈,诸如异噁唑草酮(isoxaflutole)。这些示例性hppd除草剂可被已知性状耐受。hppd抑制剂的实例包括hppdpf_w336基因(关于对异噁唑草酮的抗性)和avhppd-03基因(关于对甲基磺草酮的抗性)。苯腈除草剂耐受性状的实例包括bxn基因,其显示出赋予对除草剂/抗生素溴苯腈(bromoxynil)的抗性。汰克草(dicamba)的抗性基因包括如国际pct公开no.wo2008/105890所公开的汰克草单加氧酶基因(dmo)。ppo或protox抑制剂类型除草剂(例如三氟羧草醚(acifluorfen)、氟丙嘧草酯(butafenacil)、氟丙草酯(flupropazil)、环戊恶草酮(pentoxazone)、唑草酮(carfentrazone)、异丙吡草酯(fluazolate)、吡草醚(pyraflufen)、苯草醚(aclonifen)、草芬定(azafenidin)、丙炔氟草胺(flumioxazin)、氟烯草酸(flumiclorac)、必芬诺(bifenox)、乙氧氟草醚(oxyfluorfen)、乳氟禾草灵(lactofen)、氟磺胺草醚(fomesafen)、乙羧氟草醚(fluoroglycofen)和甲磺草胺(sulfentrazone))的抗性基因为本领域已知的。赋予对ppo的抗性的示例性基因包括野生型拟南芥ppo酶的过表达(lermontovai和grimmb,(2000)overexpressionofplastidicprotoporphyrinogenixoxidaseleadstoresistancetothediphenyl-etherherbicideacifluorfen.plantphysiol122:75–83.)、枯草芽孢杆菌(b.subtilis))ppo基因(li,x.和nicholld.2005.developmentofppoinhibitor-resistantculturesandcrops.pestmanag.sci.61:277-285以及choikw,hano,leehj,yunyc,moonyh,kimmk,kukyi,hansu和guhjo,(1998)generationofresistancetothediphenyletherherbicide,oxyfluorfen,viaexpressionofthebacillussubtilisprotoporphyrinogenoxidasegeneintransgenictobaccoplants.bioscibiotechnolbiochem62:558–560.)。吡啶氧基或苯氧基丙酸和环己酮的抗性基因包括acc酶抑制剂编码基因(例如acc1-s1、acc1-s2和acc1-s3)。赋予对环己二酮和/或芳氧基苯氧基丙酸的抗性的示例性基因包括精吡氟氯禾灵(haloxyfop)、禾草灵(diclofop)、精噁唑禾草灵酸(fenoxyprop)、吡氟禾草灵(fluazifop)和喹禾灵(quizalofop)。最后,可抑制光合成的除草剂(包括三嗪或苯甲腈)通过psba基因(对三嗪的耐受性)、1s+基因(对三嗪的耐受性)和腈水解酶基因(对苯甲腈的耐受性)提供耐受性。以上除草剂耐受性基因的列表无意为限制性的。本公开涵盖任何除草剂耐受性基因。

3.农艺学性状

各种农艺学性状编码序列可以可操作地连接至包含seqidno:1或与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的序列的二穗短柄草金属硫蛋白样基因(mtl)启动子。各种农艺学性状编码序列可以可操作地连接至包含seqidno:1或与seqidno:1具有80%、85%、90%、95%或99%序列同一性的序列的二穗短柄草金属硫蛋白样基因(mtl)启动子。然后可操作地连接的序列可并入所选载体中,以允许鉴别和选择转化的植物(“转化子”)。示例性农艺学性状编码序列是本领域已知的。作为可以可操作地连接至本公开的调控元件的农艺学性状编码序列的实施方案,提供以下性状。如pg基因所提供的延迟的果实软化抑制负责细胞壁中果胶分子断裂的聚半乳糖醛酸酶的产生,从而导致果实延迟软化。另外,acc基因的延迟果实熟化/老化用于抑制天然acc合酶基因的正常表达,从而导致乙烯产生减少和果实熟化延迟。然而,accd基因使果实熟化激素乙烯的前体代谢,从而导致果实熟化延迟。或者,sam-k基因通过减少产生乙烯的底物s-腺苷甲硫氨酸(sam)而造成熟化延迟。如cspb基因所提供的干旱胁迫耐受性表型通过保持rna稳定性和翻译而在水胁迫条件下维持正常细胞功能。另一个实例包括催化赋予水胁迫耐受性的渗透保护化合物甘氨酸甜菜碱的产生的ecbeta基因。另外,rmbeta基因催化赋予水胁迫耐受性的渗透保护化合物甘氨酸甜菜碱的产生。通过表达与一种或多种内源性转录因子相互作用以调节植物的日/夜生理过程的蛋白质的bbx32基因来提供光合成和产率提高。可通过表达编码热稳定α-淀粉酶的amy797e基因增加乙醇产量,该酶通过增加用于降解淀粉的淀粉酶的热稳定性而提高生物乙醇产量。最后,可通过表达编码二氢吡啶二羧酸酯合酶的cordapa基因产生经修饰的氨基酸组合物,该酶增加氨基酸赖氨酸的产量。以上农艺学性状编码序列的列表无意为限制性的。本公开涵盖任何农艺学性状编码序列。

4.dna结合蛋白

各种dna结合蛋白编码序列可以可操作地连接至包含seqidno:1或与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的序列的二穗短柄草金属硫蛋白样基因(mtl)启动子。各种dna结合蛋白编码序列可以可操作地连接至包含seqidno:1或与seqidno:1具有80%、85%、90%、95%或99%序列同一性的序列的二穗短柄草金属硫蛋白样基因(mtl)启动子。然后可操作地连接的序列可并入所选载体中,以允许鉴别和选择转化的植物(“转化子”)。示例性dna结合蛋白编码序列是本领域已知的。作为可以可操作地连接至本公开的调控元件的dna结合蛋白编码序列的实施方案,可包括以下类型的dna结合蛋白:锌指、talen、crispr和大范围核酸酶。以上dna结合蛋白编码序列的列表无意为限制性的。本公开涵盖任何dna结合蛋白编码序列。

5.小rna

各种小rna可以可操作地连接至包含seqidno:1或与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的序列的二穗短柄草金属硫蛋白样基因(mtl)启动子。各种小rna可以可操作地连接至包含seqidno:1或与seqidno:1具有80%、85%、90%、95%或99%序列同一性的序列的二穗短柄草金属硫蛋白样基因(mtl)启动子。然后可操作地连接的序列可并入所选载体中,以允许鉴别和选择转化的植物(“转化子”)。示例性小rna性状是本领域已知的。作为可以可操作地连接至本公开的调控元件的小rna编码序列的实施方案,提供以下性状。例如,延迟果实熟化/老化的抗efe小rna通过编码乙烯形成酶的aco基因沉默抑制乙烯产生来延迟熟化。改变木质素产量的ccomt小rna通过抑制内源性s-腺苷-l-甲硫氨酸:反式咖啡酰基coa3-o-甲基转移酶(ccomt基因)来减少愈创木基(g)木质素的含量。另外,solanumverrucosum中的黑斑伤痕耐受性可通过ppo5小rna触发ppo5转录物降解以阻断黑斑伤痕出现来减少。还包括与含有西方玉米根虫snf7基因的240bp片段的dsrna一起抑制西方玉米根虫的dvsnf7小rna。改性淀粉/碳水化合物可由诸如pphl小rna(降解phl转录物以限制通过淀粉降解形成还原糖)和pr1小rna(降解r1转录物以限制通过淀粉降解形成还原糖)的小rna产生。另外,由触发asn1降解以削弱天冬酰胺形成和减少聚丙烯酰胺的asn1小rna产生诸如丙烯酰胺减少的益处。最后,pgasppo抑制小rna的非褐变表型导致抑制ppo,从而产生具有非褐变表型的苹果。以上小rna的列表无意为限制性的。本公开涵盖任何小rna编码序列。

6.选择性标记

也称为报告基因的各种选择性标记可以可操作地连接至包含seqidno:1或与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的序列的二穗短柄草金属硫蛋白样基因(mtl)启动子。也称为报告基因的各种选择性标记可以可操作地连接至包含seqidno:1或与seqidno:1具有80%、85%、90%、95%或99%序列同一性的序列的二穗短柄草金属硫蛋白样基因(mtl)启动子。然后可操作地连接的序列可并入所选载体中,以允许鉴别和选择转化的植物(“转化子”)。许多方法可用于确认选择性标记在转化植物中的表达,包括例如dna测序和pcr(聚合酶链式反应)、southern印迹法、rna印迹法、用于检测由载体表达的蛋白质的免疫方法。然而,通常通过目测观察表达时产生有色产物的蛋白质来观察报告基因。示例性报告基因是本领域已知的并且编码β-葡糖醛酸酶(gus)、荧光素酶、绿色荧光蛋白(gfp)、黄色荧光蛋白(yfp、phi-yfp)、红色荧光蛋白(dsrfp、rfp等)、β-半乳糖苷酶等等(参见sambrook等人,molecularcloning:alaboratorymanual,第三版,coldspringharborpress,n.y.,2001,其内容全文以引用方式并入本文中)。

采用选择性标记基因选择转化细胞或组织。选择性标记基因包括编码抗生素抗性的基因,诸如编码新霉素磷酸转移酶ii(neo)、大观霉素/链霉素抗性(aad)和潮霉素磷酸转移酶(hpt或hgr)的基因以及赋予对除草化合物的抗性的基因。除草剂抗性基因通常编码对除草剂不敏感的经修饰靶标蛋白或在除草剂可起作用之前使其在植物中降解或脱毒的酶。例如,已通过使用编码突变靶标酶5-烯醇丙酮酰莽草酸-3-磷酸合酶(epsps)的基因获得对草甘膦的抗性。epsps的基因和突变体是熟知的,并且在下文进一步描述。已通过使用编码pat或dsm-2、腈水解酶、aad-1或aad-12(其中每一者为使其相应除草剂脱毒的蛋白质的实例)的细菌基因获得对草铵膦、溴苯腈和2,4-二氯苯氧基乙酸酯(2,4-d)的抗性。

在一个实施方案中,除草剂可抑制生长点或分生组织,包括咪唑啉酮或磺酰脲,并且关于这些除草剂的乙酰羟基酸合酶(ahas)和乙酰乳酸合酶(als)抗性/耐受性基因是熟知的。草甘膦抗性基因分别包括突变5-烯醇丙酮酰莽草酸-3-磷酸合酶(epsp)和dgt-28基因(通过引入重组核酸和/或天然epsp基因的各种形式的活体诱变)、aroa基因和草甘膦乙酰基转移酶(gat)基因。其他膦酰基化合物的抗性基因包括来自包括吸水链霉菌(streptomyceshygroscopicus)和绿色产色链霉菌(streptomycesviridichromogenes)的链霉菌属物种的bar和pat基因,以及吡啶氧基或苯氧基丙酸和环己酮(acc酶抑制剂编码基因)。赋予对环己二酮和/或芳氧基苯氧基丙酸(包括精吡氟氯禾灵、禾草灵、精噁唑禾草灵酸、吡氟禾草灵、喹禾灵)的抗性的示例性基因包括乙酰辅酶a羧化酶(acc酶)的基因;acc1-s1、acc1-s2和acc1-s3。在一个实施方案中,除草剂可抑制光合成,包括三嗪(psba和1s+基因)或苯甲腈(腈水解酶基因)。此外,此类选择性标记可包括阳性选择标记,诸如磷酸甘露糖异构酶(pmi)。

在一个实施方案中,选择性标记基因包括但不限于编码以下的基因:2,4-d、新霉素磷酸转移酶ii、氰胺水合酶、天冬氨酸激酶、二氢吡啶二羧酸酯合酶、色氨酸脱羧酶、二氢吡啶二羧酸酯合酶和脱敏的天冬氨酸激酶、bar基因、色氨酸脱羧酶、新霉素磷酸转移酶(neo)、潮霉素磷酸转移酶(hpt或hyg)、二氢叶酸还原酶(dhfr)、草丁膦乙酰转移酶、2,2-二氯丙酸去卤酶、乙酰羟基酸合酶、5-烯醇丙酮酰莽草酸-磷酸合酶(aroa)、卤芳基腈水解酶、乙酰辅酶a羧化酶、二氢叶酸合酶(suli)和32kd光系统ii多肽(psba)。一个实施方案还包括编码对以下的抗性的选择性标记基因:氯霉素、甲胺喋呤、潮霉素、大观霉素、溴苯腈、草甘膦和草丁膦。以上选择性标记基因的列表无意为限制性的。本公开涵盖任何报告基因或选择性标记基因。

在一些实施方案中,合成在植物中最佳表达的编码序列。例如,在一个实施方案中,基因的编码序列已通过密码子优化而修饰以增强在植物中的表达。杀昆虫抗性转基因、除草剂耐受性转基因、氮使用效率转基因、水使用效率转基因、营养品质转基因、dna结合转基因或选择性标记转基因可经优化以在特定植物物种中表达,或者可经修饰以在双子叶或单子叶植物中最佳表达。植物优选的密码子可由所关注的特定植物物种中以最大量表达的蛋白质中的最高频率密码子来确定。在一个实施方案中,编码序列、基因或转基因设计为在植物中以较高水平表达,从而产生较高转化效率。用于基因的植物优化的方法是熟知的。关于合成dna序列的优化和产生的指导可见于例如以引用方式并入本文的wo2013016546、wo2011146524、wo1997013402、美国专利no.6166302和美国专利no.5380831。

转化

适用于植物转化的方法包括可将dna引入细胞的任何方法,例如而不限于:电穿孔(参见例如美国专利5,384,253);微粒轰击(参见例如美国专利5,015,580、5,550,318、5,538,880、6,160,208、6,399,861和6,403,865);农杆菌属介导的转化(参见例如美国专利5,635,055、5,824,877、5,591,616;5,981,840和6,384,301);以及原生质体转化(参见例如美国专利5,508,184)。

dna构建体可使用诸如与碳化硅纤维一起搅拌的技术而直接引入植物细胞的基因组dna(参见例如美国专利5,302,523和5,464,765),或dna构建体可使用诸如dna粒子轰击的基因枪方法而直接引入植物组织(参见例如klein等人(1987)nature327:70-73)。或者,dna构建体可通过纳米粒子转化而引入植物细胞(参见例如美国专利公开no.20090104700,其全文以引用方式并入本文)。

另外,基因转移可使用非农杆菌属细菌或病毒来实现,诸如根瘤菌属(rhizobiumsp.)ngr234、苜蓿中华根瘤菌(sinorhizoboiummeliloti)、百脉根根瘤菌(mesorhizobiumloti)、马铃薯病毒x、花椰菜嵌纹病毒和木薯脉花叶病毒和/或烟草花叶病毒,参见例如chung等人(2006)trendsplantsci.11(1):1-4。

通过应用转化技术,几乎任何植物物种的细胞均可得到稳定转化,并且这些细胞可通过熟知的技术发育成转基因植物。例如,可在棉花转化的背景中特别适用的技术如美国专利5,846,797、5,159,135、5,004,863和6,624,344所描述;尤其用于转化芸苔属(brassica)植物的技术如例如美国专利5,750,871所描述;用于转化大豆的技术如例如美国专利6,384,301所描述;用于转化玉蜀黍的技术如例如美国专利7,060,876和5,591,616以及国际pct公开wo95/06722所描述。

在外源性核酸有效递送至受体细胞之后,通常要鉴别转化细胞以用于进一步培养和植物再生。为了提高鉴别转化子的能力,技术人员可能需要采用选择性标记基因以及用于生成转化子的转化载体。在一个示例性实施方案中,转化细胞群体可通过使细胞暴露于一种或多种选择性药剂而进行分析,或可针对所需标记基因性状筛选细胞。

可将暴露于选择剂后存活的细胞、或者在筛选测定中已被评分为阳性的细胞置于支持植物再生的培养基中培养。在一个实施方案中,任何合适的植物组织培养基可通过包括诸如生长调节剂的其他物质而修饰。可将组织维持在具有生长调节剂的基础培养基上,直到可得到足够的组织用于启动植物再生工作时为止,或者在重复多轮的手动选择之后,直到组织形态适合于再生时为止(例如,至少2周),然后转移到有益于芽形成的培养基中。定期转移培养物,直到已出现充分的芽形成时为止。一旦形成芽,就将其转移到有益于根形成的培养基中。一旦形成足够的根,就可将植物转移到土壤中,以便进一步生长和成熟。

分子确认

转化的植物细胞、愈伤组织、组织或植物可通过针对由转化dna上存在的标记基因编码的性状选择或筛选经工程改造的植物来鉴别和分离。例如,可通过使经工程改造的植物材料在含有抑制量的抗生素或除草剂的培养基上生长来进行选择,转化基因构建体赋予对该抗生素或除草剂的抗性。另外,转化植物和植物细胞也可通过筛选可存在于重组核酸构建体上的任何可见标记基因(例如,β-葡糖醛酸酶、荧光素酶或gfp基因)的活性来鉴别。此类选择和筛选方法是本领域的技术人员熟知的。可用于鉴别转基因植物的分子确认方法是本领域的技术人员已知的。许多示例性方法在下文进一步描述。

已描述在序列检测中使用的分子信标。简而言之,fret寡核苷酸探针被设计为与侧接基因组和插入dna接合点重叠。fret探针的独特结构使其含有保持荧光部分和淬灭部分紧密接近的二级结构。fret探针和pcr引物(一个引物在插入dna序列中,一个引物在侧接基因组序列中)在存在热稳定聚合酶和dntp的情况下进行循环。在成功pcr扩增之后,fret探针与靶标序列的杂交导致探针二级结构移除,并且荧光部分与淬灭部分空间分离。荧光信号指示由于成功扩增和杂交而存在侧接基因组/转基因插入序列。用于以扩增反应形式检测的此类分子信标分析是本公开的实施方案。

水解探针分析或称为(lifetechnologies,fostercity,calif.)是一种检测和定量dna序列的存在的方法。简而言之,fret寡核苷酸探针被设计成具有转基因内的一个寡核苷酸,以及用于事件特异性检测的侧接基因组序列中的一个寡核苷酸。fret探针和pcr引物(一个引物在插入dna序列中,一个引物在侧接基因组序列中)在存在热稳定聚合酶和dntp的情况下进行循环。fret探针的杂交导致fret探针上的荧光部分切割和释放远离淬灭部分。荧光信号指示由于成功扩增和杂交而存在侧接/转基因插入序列。用于以扩增反应形式检测的此类水解探针分析是本公开的实施方案。

分析是一种检测和定量dna序列的存在的方法。简而言之,使用称为分析系统的基于聚合酶链式反应(pcr)的分析筛选包含整合基因表达盒多核苷酸的基因组dna样品。用于本公开实践的分析可利用含有多个引物的pcr分析混合物。用于pcr分析混合物的引物可包含至少一个正向引物和至少一个反向引物。正向引物含有对应于dna多核苷酸的特定区的序列,并且反向引物含有对应于基因组序列的特定区的序列。另外,用于pcr分析混合物的引物可包含至少一个正向引物和至少一个反向引物。例如,pcr分析混合物可使用对应于两个不同等位基因的两个正向引物和一个反向引物。一个正向引物含有对应于内源性基因组序列的特定区的序列。第二正向引物含有对应于dna多核苷酸的特定区的序列。反向引物含有对应于基因组序列的特定区的序列。用于检测扩增反应的此类分析为本公开的一个实施方案。

在一些实施方案中,荧光信号或荧光染料选自:hex荧光染料、fam荧光染料、joe荧光染料、tet荧光染料、cy3荧光染料、cy3.5荧光染料、cy5荧光染料、cy5.5荧光染料、cy7荧光染料和rox荧光染料。

在其他实施方案中,使用能够在可通过流式细胞术检测的浓度范围使细胞dna染色并且具有可通过实时热循环仪检测的荧光发射光谱的合适第二荧光dna染料进行扩增反应。本领域的普通技术人员应理解,其他核酸染料是已知的并且不断地被鉴别出来。可采用具有适当激发和发射光谱的任何适合的核酸染料,诸如sytoxsybrgreen在一个实施方案中,第二荧光dna染料是在小于10μm、小于4μm或小于2.7μm时使用的

在其他实施方案中,可使用下一代测序(ngs)进行检测。如brautigma等人,2010所述,dna序列分析可用于测定分离和扩增片段的核苷酸序列。扩增的片段可分离和亚克隆至载体,并且使用链终止子方法(也称为sanger测序)或染料终止子测序法来进行测序。另外,扩增子可使用下一代测序法来测序。ngs技术不需要亚克隆步骤,并且多个测序读取过程可在单个反应中完成。三个ngs平台可商购获得,即来自454lifesciences/roche的genomesequencerflxtm、来自solexa的illuminagenomeanalysertm和appliedbiosystems的solidtm(‘sequencingbyoligoligationanddetection’的前缀)。另外,存在两种目前正在开发的单分子测序方法。这些方法包括来自helicosbiosciencetm的truesinglemoleculesequencing(tsms)和来自pacificbiosciences的singlemoleculerealtimetm测序(smrt)。

454lifesciences/roche销售的genomesequencherflxtm是长阅读ngs,其使用乳液pcr和焦磷酸测序以产生测序读取。可使用300-800bp的dna片段或含有3-20kb片段的文库。反应每次运行可产生超过一百万次约250至400个碱基的读取,总共产生250至400兆碱基。此技术产生最长读取,但每次运行的总序列输出与其他ngs技术相比较低。

solexatm销售的illuminagenomeanalysertm是短读取ngs,其使用利用荧光染料标记的可逆终止子核苷酸的合成方法测序,并且基于固相桥式pcr。可使用含有最多10kb的dna片段的配对末端测序文库构建。反应产生超过1亿次短读取,读取长度为35-76个碱基。该数据每次运行可产生3-6千兆碱基。

appliedbiosystemstm销售的通过寡核苷酸接合和检测(solid)系统的测序是短读取技术。该ngs技术使用长度最多为10kb的片段化双链dna。该系统使用通过染料标记的寡核苷酸引物连接和乳液pcr产生十亿次短读取来测序,每次运行产生最多30千兆碱基的总序列输出。

helicosbiosciencetm的tsms和pacificbiosciencestm的smrt应用使用单个dna分子进行序列反应的不同方法。tsmshelicostm系统每次运行产生最多8亿次短读取,得到21千兆碱基。这些反应使用荧光染料标记的虚拟终止子核苷酸完成,其被称述为“合成测序”法。

pacificbiosciencestm销售的smrt下一代测序系统使用通过合成进行的实时测序。该技术由于不受可逆终止子限制,可产生长度为最多1,000bp的读取。使用该技术每天可产生相当于二倍体人类基因组的一倍覆盖度的原始读取通量。

在另一个实施方案中,可使用印迹分析完成检测,包括western印迹、northern印迹和southern印迹。此类印迹分析是生物学研究中用于生物样品的鉴别和定量的常用技术。这些分析包括首先通过电泳在凝胶中分离样品组分,接着将来自凝胶的电泳分离组分转移至转移膜,该转移膜由诸如硝化纤维素、聚偏二氟乙烯(pvdf)或尼龙(nylon)的材料制成。分析物也可直接点样在这些载体上或通过施加真空、毛细作用或压力引导至载体上的特定区域,而无需事先分离。然后通常使转移膜经受转移后处理,以增强在视觉上或通过自动化读取器彼此区分和检测分析物的能力。

在另一个实施方案中,可使用elisa分析完成检测,该分析使用固相酶免疫分析来检测液体样品或湿样品中的物质(通常是抗原)的存在。来自样品的抗原附着至平板表面。然后,将另一个特异性抗体施加到表面上以使其可与抗原结合。该抗体连接至酶,并且在最终步骤中添加含有酶底物的物质。后续反应产生可检测信号,最常见的是底物的颜色变化。

转基因植物

在一个实施方案中,植物、植物组织或植物细胞包含二穗短柄草金属硫蛋白样基因(mtl)启动子。在一个实施方案中,植物、植物组织或植物细胞包含具有选自seqidno:1的序列或与选自seqidno:1的序列具有至少80%、85%、90%、95%或99.5%序列同一性的序列的二穗短柄草金属硫蛋白样基因(mtl)启动子。在一个实施方案中,植物、植物组织或植物细胞包含具有选自seqidno:1的序列或与选自seqidno:1的序列具有80%、85%、90%、95%或99.5%序列同一性的序列的二穗短柄草金属硫蛋白样基因(mtl)启动子。在另一个实施方案中,植物、植物组织或植物细胞包含二穗短柄草金属硫蛋白样基因(mtl)3’-utr,其由选自seqidno:3的序列或与选自seqidno:3的序列具有至少80%、85%、90%、95%或99.5%序列同一性的序列组成。在另一个实施方案中,植物、植物组织或植物细胞包含二穗短柄草金属硫蛋白样基因(mtl)3’-utr,其由选自seqidno:3的序列或与选自seqidno:3的序列具有80%、85%、90%、95%或99.5%序列同一性的序列组成。在一个实施方案中,植物、植物组织或植物细胞包含基因表达盒,该基因表达盒包含选自seqidno:1的序列,或与选自可操作地连接至非二穗短柄草金属硫蛋白样转基因的seqidno:1的序列具有至少80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,植物、植物组织或植物细胞包含基因表达盒,该基因表达盒包含选自seqidno:1的序列,或与选自可操作地连接至非二穗短柄草金属硫蛋白样转基因的seqidno:1的序列具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个示例性实施方案中,植物、植物组织或植物细胞包含基因表达盒,该基因表达盒包含可操作地连接至转基因的二穗短柄草金属硫蛋白样启动子,其中该转基因可以是杀昆虫抗性转基因、除草剂耐受性转基因、氮使用效率转基因、水使用效率转基因、营养品质转基因、dna结合转基因、选择性标记转基因或它们的组合。

根据一个实施方案,提供植物、植物组织或植物细胞,其中该植物、植物组织或植物细胞包含可操作地连接至转基因的来源于非内源性二穗短柄草金属硫蛋白样基因(mtl)的启动子序列,其中该来源于二穗短柄草金属硫蛋白样基因(mtl)启动子的启动子序列包含序列seqidno:1或与seqidno:1具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,提供植物、植物组织或植物细胞,其中该植物、植物组织或植物细胞包含seqidno:1或与seqidno:1具有至少80%、85%、90%、95%或99.5%序列同一性的可操作地连接至非二穗短柄草金属硫蛋白样转基因的序列。在一个实施方案中,提供植物、植物组织或植物细胞,其中该植物、植物组织或植物细胞包含seqidno:1或与seqidno:1具有80%、85%、90%、95%或99.5%序列同一性的可操作地连接至非二穗短柄草金属硫蛋白样转基因的序列。在一个实施方案中,植物、植物组织或植物细胞是双子叶或单子叶植物或来源于双子叶或单子叶植物的细胞或组织。在一个实施方案中,植物选自玉蜀黍、小麦、稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、向日葵和芥花。在一个实施方案中,植物是玉米。根据一个实施方案,植物、植物组织或植物细胞包含seqidno:1或与seqidno:1具有80%、85%、90%、95%或99.5%序列同一性的可操作地连接至非二穗短柄草金属硫蛋白样转基因的序列。在一个实施方案中,植物是玉米。根据一个实施方案,植物、植物组织或植物细胞包含seqidno:1或与seqidno:1具有至少80%、85%、90%、95%或99.5%序列同一性的可操作地连接至非二穗短柄草金属硫蛋白样转基因的序列。在一个实施方案中,植物、植物组织或植物细胞包含可操作地连接至转基因的启动子,其中该启动子由seqidno:1或与seqidno:1具有80%、85%、90%、95%或99.5%序列同一性的序列组成。在一个实施方案中,植物、植物组织或植物细胞包含可操作地连接至转基因的启动子,其中该启动子由seqidno:1或与seqidno:1具有至少80%、85%、90%、95%或99.5%序列同一性的序列组成。根据一个实施方案,将包含可操作地连接至转基因的来源于二穗短柄草金属硫蛋白样的启动子序列的基因构建体并入植物、植物组织或植物细胞的基因组中。

在一个实施方案中,提供非短柄草属植物、植物组织或植物细胞,其包含seqidno:1或与seqidno:1具有至少80%、85%、90%、95%或99.5%序列同一性的可操作地连接至转基因的序列。在一个实施方案中,提供非短柄草属植物、植物组织或植物细胞,其包含seqidno:1或与seqidno:1具有80%、85%、90%、95%或99.5%序列同一性的可操作地连接至转基因的序列。根据一个实施方案,非短柄草属植物、植物组织或植物细胞是双子叶或单子叶植物或来源于双子叶或单子叶植物的植物细胞或组织。在一个实施方案中,植物选自玉蜀黍、小麦、稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、向日葵和芥花。在一个实施方案中,植物是玉米。根据一个实施方案,将可操作地连接至转基因的启动子序列并入植物、植物组织或植物细胞的基因组中。

在一个实施方案中,提供非短柄草属植物、植物组织或植物细胞,其包含seqidno:1或与seqidno:1具有至少80%、85%、90%、95%或99.5%序列同一性的可操作地连接至转基因的5'末端和3'非翻译序列的序列,该非翻译序列包含seqidno:3或与seqidno:3具有至少80%、85%、90%、95%或99.5%序列同一性的序列,其中该3'非翻译序列可操作地连接至所述转基因。根据一个实施方案,非短柄草属植物、植物组织或植物细胞是双子叶或单子叶植物,或是来源于双子叶或单子叶植物的植物组织或细胞。在一个实施方案中,植物选自玉蜀黍、小麦、稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、向日葵和芥花。在一个实施方案中,植物是玉米。根据一个实施方案,将可操作地连接至转基因的启动子序列并入植物、植物组织或植物细胞的基因组中。

在一个实施方案中,根据本文所公开的方法的植物、植物组织或植物细胞可以是单子叶植物。单子叶植物、植物组织或植物细胞可以是但不限于玉米、稻、小麦、甘蔗、大麦、黑麦、高粱、兰花、竹子、香蕉、香蒲、百合、燕麦、洋葱、粟、柳枝稷、草皮草和黑小麦。

在一个实施方案中,根据本文所公开的方法的植物、植物组织或植物细胞可以是双子叶植物。双子叶植物、植物组织或植物细胞可以是但不限于苜蓿、菜籽、芥花、印度芥菜、埃塞俄比亚芥菜、大豆、向日葵、棉花、菜豆、椰菜、甘蓝菜、花椰菜、芹菜、黄瓜、茄子、莴苣;甜瓜、豌豆、胡椒、花生、马铃薯、南瓜、萝卜、菠菜、甜菜、向日葵、烟草、西红柿和西瓜。

本领域的技术人员将认识到,在外源性序列稳定并入转基因植物并且确认可操作之后,即可通过有性杂交引入其他植物中。可根据待杂交的物种使用许多标准育种技术中的任一者。

本公开还涵盖上文所述的转基因植物的种子,其中该种子具有转基因或含有本公开的基因调控元件的基因构建体。本公开还涵盖上文所述的转基因植物的子代、无性系、细胞系或细胞,其中所述子代、无性系、细胞系或细胞具有转基因或含有本公开的基因调控元件的基因构建体。

本公开还涵盖上文所述的转基因植物的栽培,其中该转基因植物具有转基因或含有本公开的基因调控元件的基因构建体。因此,此类转基因植物可通过使用根据本公开的核酸分子转化而工程改造为尤其是具有一种或多种所需性状或含有本公开的基因调控元件的转基因事件,并且可通过本领域的技术人员已知的任何方法修剪或栽培。

表达转基因的方法

在一个实施方案中,在植物中表达至少一个转基因的方法包括使包含可操作地连接至至少一个转基因或多接头序列的二穗短柄草金属硫蛋白样基因(mtl)启动子的植物生长。在一个实施方案中,在植物中表达至少一个转基因的方法包括使包含可操作地连接至至少一个转基因或多接头序列的二穗短柄草金属硫蛋白样基因(mtl)启动子3’-utr的植物生长。在一个实施方案中,二穗短柄草金属硫蛋白样基因(mtl)启动子由选自seqidno:1的序列或与选自seqidno:1的序列具有至少80%、85%、90%、95%或99.5%序列同一性的序列组成。在另一个实施方案中,二穗短柄草金属硫蛋白样基因(mtl)3’-utr启动子由选自seqidno:3的序列或与选自seqidno:3的序列具有至少80%、85%、90%、95%或99.5%序列同一性的序列组成。在一个实施方案中,在植物中表达至少一个转基因的方法包括使包含可操作地连接至至少一个转基因的二穗短柄草金属硫蛋白样基因(mtl)启动子和二穗短柄草金属硫蛋白样基因(mtl)3’–utr的植物生长。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含可操作地连接至至少一个转基因的二穗短柄草金属硫蛋白样基因(mtl)启动子的植物组织或植物细胞。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含可操作地连接至至少一个转基因的二穗短柄草金属硫蛋白样基因(mtl)启动子3’-utr的植物组织或植物细胞。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含可操作地连接至至少一个转基因的二穗短柄草金属硫蛋白样基因(mtl)启动子和二穗短柄草金属硫蛋白样基因(mtl)3’–utr的植物组织或植物细胞。

在一个实施方案中,在植物中表达至少一个转基因的方法包括使包含具有可操作地连接至至少一个转基因的二穗短柄草金属硫蛋白样基因(mtl)启动子的基因表达盒的植物生长。在一个实施方案中,二穗短柄草金属硫蛋白样基因(mtl)启动子由选自seqidno:1的序列或与选自seqidno:1的序列具有至少80%、85%、90%、95%或99.5%序列同一性的序列组成。在一个实施方案中,二穗短柄草金属硫蛋白样基因(mtl)启动子由选自seqidno:1的序列或与选自seqidno:1的序列具有80%、85%、90%、95%或99.5%序列同一性的序列组成。在另一个实施方案中,二穗短柄草金属硫蛋白样基因(mtl)3’-utr启动子由选自seqidno:3的序列或与选自seqidno:3的序列具有至少80%、85%、90%、95%或99.5%序列同一性的序列组成。在另一个实施方案中,二穗短柄草金属硫蛋白样基因(mtl)3’-utr启动子由选自seqidno:3的序列或与选自seqidno:3的序列具有80%、85%、90%、95%或99.5%序列同一性的序列组成。在一个实施方案中,在植物中表达至少一个转基因的方法包括使包含具有可操作地连接至至少一个转基因的二穗短柄草金属硫蛋白样基因(mtl)启动子和二穗短柄草金属硫蛋白样基因(mtl)3’–utr的基因表达盒的植物生长。在一个实施方案中,在植物中表达至少一个转基因的方法包括使包含具有可操作地连接至至少一个转基因的二穗短柄草金属硫蛋白样基因(mtl)3’-utr启动子的基因表达盒的植物生长。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含含有可操作地连接至至少一个转基因的二穗短柄草金属硫蛋白样基因(mtl)启动子的基因表达盒的植物组织或植物细胞。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含含有可操作地连接至至少一个转基因的二穗短柄草金属硫蛋白样基因(mtl)3’-utr的基因表达盒的植物组织或植物细胞。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含可操作地连接至至少一个转基因的基因表达盒、二穗短柄草金属硫蛋白样基因(mtl)启动子和二穗短柄草金属硫蛋白样基因(mtl)3’-utr的植物组织或植物细胞。

提供以下实施例以说明某些具体特征和/或实施方案。所述实施例不应被理解为将本公开局限于所例示的具体特征或实施方案。

实施例

实施例1:来自二穗短柄草金属硫蛋白样基因(mtl)的启动子

来自二穗短柄草金属硫蛋白样基因(mtl)的启动子(seqidno:1)是从二穗短柄草基因组dna(gdna)序列鉴别的2,000bp多核苷酸序列。启动子序列通过使用玉米金属硫蛋白样基因(mtl)blast比对phytozome数据库(goodstein等人,2012)来鉴别。分析所得命中结果并且选择单个编码序列用于进一步分析。根据横跨数百万个碱基对的邻接染色体序列的评估,鉴别和分离适用于异源性编码序列表达的2,000bp多核苷酸序列。分析该新型多核苷酸序列,以用作驱动基因表达调控序列。如以下序列(seqidno:2)所示,提供seqidno:1的2,000bp二穗短柄草金属硫蛋白样基因(mtl)启动子作为碱基对1–2,000。提供seqidno:6的天然mtl基因编码序列作为碱基对2,001–2,345。提供seqidno:3的1,002bp二穗短柄草金属硫蛋白样基因(mtl)3’-utr作为碱基对2,346–3,347。因此,seqidno:2提供如下:

tttcgtgtgcttacttggggcttcctttgggcctgcggaagcagacggcgtgccagctgagaccgttggtggacaatgtggatggacgtctagcttcgtggaaggcccttctcctttccaagggaggatgactggtgctggtcaagtccaccctgacagcgatgccggtctactcgatgatgtcactcgacctttcggacaagatcatcaaaggggtggacaagatctgtcgtggtttcctttggcgtggtcagaaggacgctaaaggggggggggcattgtatggtggcttgggtcgtggtgtgttcgccgaagcctttcggtggactcggaattccaaatcttcgcatgctcaacgaggccttgagggtccgctagaggtggcttgagagggtggacgattccaaaccatgggtcggtttcaaggttgagacgcccagaggtctatgttatctttgaggcggccacttcctctttggtgggcgatggccggaagaccctcttctggaccgatcgttggctgcatggcgtctgttttcgagatgcgttcctgatcctcgtgggccatgtttgccacaagtttttgcgcacgcgcacagtgcgggaggctctgcatggagcgtggactggcgacatgggtccagacctaaagggaagctactcttgaggagttcctcactctctgggactggcttcgtggggtccaactggaagaagggagggccgactctcttcattggaactggtctcgtggtgatagttactcggcaaagactgcttatgcgaatctcttcactggccgcatggttgacccgttagcggctgagatctagggcttcggagaggtgtcgtttcttcgtctggctcgcagttcgaaatagatgctagacggcggatcgcttgcgaggcgtgggcttccccaccctgacaagtgtcaggagatggagaccatttcccatctactcttggggtgtgtcttggcgaggcaggtttgggagcgcttgtgggcggcttggggacacgtggagtgggctccgaatgcggatgctactctgcgggaatggtggtcttctcttcccttaccacggcgagcccggagggacttccggacggggatcatacttgttctttggaccatttggtgccattggaatgatgtggccttccttgcagcttgtcgtgcttcgcctccaggaggagtttggtcggtgggcgcacgccggcctctttaggggtagagtgtctattccagccttgatggtgagtggttggatagctagcacatagtctttttttctctttcttgccacttggtgatgttgtattgccgcttcggcgttgtactagccttctggctcttcttatttaatcgatgatgcacccgctgggtggcattcttgaaatttttttgagaaaatactcctacaaaggaagtacagtaatttgatacacaatgctttctctaaatacgaaaatacaaacatcctaatgttattccaactatgctactccctccgttcctaaactcttatctttgtttttgttcaaatttgtaccaaacaacgacaaaaatttagtaacggaggaagtatatatacgaagtgataccaaataaggtgtttctttacttgaaagctagttcctctgaggtaaaagaaatgatgaggatcaaggaaggcccatttcttgccggcacgcagttgccgaagtcagtagatttaaaatgacctcacatactgaagaaggaaagggaagttaaccacgccattgttgctttagcagaaagcaaccatatcctaattaacatcacagtacacgttgaaacggcagggcacgataattggtgaagactgattccagggagcatcgtggcacgcaaaaacgcccttgccttgttcccttataaatagtggtgcagaagatacatttgtgatcaccatctcaaagcgcctctttattcccctttcatcttgagcttaagtactagagaaaaattaaggatgtcttgcagctgtggatctggatgcagctgcggctcaaactgcacctgcgggtatgtatagatgcttaattctgtgttgcagattactacgtagctgctaataccatctaagtaatgacaatgctttctcatgatgatcaattttcatttgctgtgtggttcagcaagatgtaccctgacttggcagagaagagcggcggcacccagcaggccaccaccatgatcctcggcgttgcgcctgctaaggcccagtttgaggaggccgccgagtccggtgaggccggccatggctgcagctgcggcgccaactgcaagtgcgacccgtgcaactgctaagatgcacgcgacgcgctgctgcttgtggtgtgtgtttgtgtgatctcgactgaataaaagggacacggtacatccggggttggttggtgctcgagtcgagtgtgcaaggttgtgtggtttgccagctcttggtgtgtgtctccttgtgctcatgtgacttgtgaaaccattaatagtaaccactttgtgcttgtgtgtgtgtgggcacctgtgtttctgtaatggtctatctggagtgaatatatacaagacaggtttgcctaaccatgccttttccttccttgaggtcatcgcgccaacacgaatgacgagaaccaatgatcttaggactatcaaatagacaatataactcagcatggagcaatgtactgctaatgaacggtcctaatcaatacagttgggaagcagtaatcgatggaaaacacttcctcagttcagaagggaacatgtagatgggaaagtaaacaggatatatagacacatgcagttaggtctaccacaagaagacatgccacaggactaaaaacagaagctgggtttggaacaacttatgcagacgctagctatccagataaaccttagagaaacagctatgagaataagcgtctgaaatttgtagttgcctgtttggaatggcttatggacgacaagcttattttctggagtagcctacaagtacaagccaaggcacatgctgttccaaactggcccatattttgcacaaccaaaggaaaagagacagtgacataagagcatctccagtgattcagtgagataccccaaagtcatccaaatgtccgtttcggccgaaatggacatgctggccagaaaaacatctcccaatgggttaccccaaatagatattttgtatgttttgtccggcccaatccccaaacatctcctaaatttggggcaactttgcggtgtccagtgtccggtgtccgggcccacttctttttctcccaagcgagcatcttcctcccgaagcacgaagcccccgtc

实施例2:载体构建

构建以下载体以将来自二穗短柄草金属硫蛋白样基因(mtl)的启动子并入转基因上游。载体构建体pdab120419包含基因表达盒,其中phi-yfp转基因(phi-y黄色荧光蛋白;clontech,mountainview,ca)由来自seqidno:1的二穗短柄草金属硫蛋白样基因(mtl)的启动子驱动,且侧接seqidno:3的二穗短柄草金属硫蛋白样基因(mtl)3’–utr。该基因表达盒的图解如图1所示,并且以seqidno:4提供。载体也含有选择性标记基因表达盒,该表达盒含有由玉米泛素1启动子驱动(christensen等人,(1992)plantmolecularbiology18;675-689)并且由玉米脂肪酶3'-utr封端(美国专利no.7,179,902)的aad-1转基因(美国专利no.7,838,733)。该基因表达盒的图解如图1所示,并且以seqidno:5提供。该构建体通过以下步骤构建:由外部供应商(geneartvialifetechnologies,carlsbad,ca)合成新设计的来自二穗短柄草金属硫蛋白样基因的启动子,并且使用无缝拼接基因克隆试剂盒(lifetechnologies)和限制性酶将该启动子克隆至gatewaytm(lifetechnologies)供体载体。使用gatewaytm克隆系统(lifetechnologies)将所得的供体载体整合进最终二元目标载体。获得pdab120419的克隆并通过限制性酶消化和测序来确认。所得的构建体含有可稳健驱动转基因表达的启动子,该转基因可操作地连接至启动子的3'末端。

实施例3:经修饰的二穗短柄草金属硫蛋白样基因(mtl)调控元件

seqidno:1的2,000bp二穗短柄草金属硫蛋白样基因(mtl)启动子通过对启动子序列进行更改而修饰。设计新变体并且以seqidno:12提供。比较seqidno:1的经修饰的二穗短柄草金属硫蛋白样基因(mtl)启动子与seqidno:12的经修饰的二穗短柄草金属硫蛋白样基因(mtl)启动子的比对提供于图3中。如图3所示,seqidno:1和seqidno:12的启动子多核苷酸序列共有97.2%序列同一性。本文提供来源于seqidno:1的二穗短柄草金属硫蛋白样基因(mtl)启动子的新型启动子序列。在一个实施方案中,seqidno:12的新型启动子多核苷酸序列可用于基因表达盒以驱动转基因的表达。在该实施方案的另一个方面,seqidno:12的新型启动子多核苷酸序列可以可操作地连接至所关注的基因并且侧接3'-utr,例如seqidno:3的3'-utr,并且可用于基因表达盒以驱动转基因的表达。

seqidno:3的1,002bp二穗短柄草金属硫蛋白样基因(mtl)3’-utr通过对3'-utr序列进行更改而修饰。设计新的变体并且以seqidno:17和seqidno:18提供。比较seqidno:3的经修饰的二穗短柄草金属硫蛋白样基因(mtl)3’-utr与seqidno:17和seqidno:18的经修饰的二穗短柄草金属硫蛋白样基因(mtl)3’-utr的比对提供于图5中。如图5所示,seqidno:3和seqidno:17的3’-utr多核苷酸序列共有94.2%序列同一性。图5描绘共有97.5%序列同一性的seqidno:3和seqidno:18的3’-utr多核苷酸序列。最后,图5呈现共有92.7%序列同一性的seqidno:18和seqidno:17的3’-utr多核苷酸序列。本文提供来源于seqidno:3的二穗短柄草金属硫蛋白样基因(mtl)3’-utr的新型3'-utr序列。在一个实施方案中,seqidno:17的新型3'-utr多核苷酸序列可用于基因表达盒以终止转基因的表达。在该实施方案的另一个方面,seqidno:17的新型3'-utr多核苷酸序列可以可操作地连接至启动子(例如seqidno:1的启动子)驱动的转基因,并且可用于基因表达盒以驱动转基因的表达。在另一个实施方案中,seqidno:18的新型3'-utr多核苷酸序列可用于基因表达盒以终止转基因的表达。在该实施方案的另一个方面,seqidno:18的新型3'-utr多核苷酸序列可以可操作地连接至启动子(例如seqidno:1的启动子)驱动的转基因,并且可用于基因表达盒以驱动转基因的表达。

实施例4:玉蜀黍转化

根癌农杆菌的转化:

将二元表达载体转化至根癌农杆菌菌株dat13192(reca缺陷型三元菌株)(国际专利公开no.wo2012016222)。选择细菌菌落,分离二元质粒dna并通过限制性酶消化来确认。

农杆菌属培养启动:

将来自甘油储备液的农杆菌属培养物划线于ab基本培养基(gelvin,s.,2006,agrobacteriumvirulencegeneinduction,载于wang,k.编,agrobacteriumprotocols,第二版,第1卷,humanapress,第79页;使用无蔗糖的5g/l葡萄糖和15g/lbactotm琼脂制备)上并且在20℃下暗处温育3天。然后将农杆菌属培养物划线于yep培养基平板(gelvin,s.,2006,agrobacteriumvirulencegeneinduction,载于wang,k.编,agrobacteriumprotocols,第二版,第1卷,humanapress,第79页)上并且在20℃下暗处温育1天。

在实验当天,制备体积适于实验规模的接种培养基(2.2g/lms盐、68.4g/l蔗糖、36g/l葡萄糖、115mg/ll-脯氨酸、2mg/l甘氨酸、100mg/l肌醇、0.05mg/l烟酸、0.5mg/l吡哆醇盐酸盐、0.5mg/l硫胺盐酸盐)和乙酰丁香酮的混合物。将溶于100%二甲亚砜的1m乙酰丁香酮储备溶液加入接种培养基,制成终浓度为200μm的乙酰丁香酮。

对于每个构建体,将1-2个接种环的来自yep平板的农杆菌属悬浮于50ml无菌一次性离心管内的15ml接种培养基/乙酰丁香酮混合物中,并且在分光亮度计中测定溶液在600nm下的光学密度(o.d.600)。然后使用另外的接种培养基/乙酰丁香酮混合物将悬浮液稀释至0.25-0.35o.d.600。然后在使用前将农杆菌属悬浮液管水平放置于设定为约75rpm、室温下的平台摇床上1至4小时。

玉蜀黍转化:

通过从近交系玉米栽培品种b104分离的未成熟胚芽的农杆菌属介导的转化将实验构建体转化至玉蜀黍中。所用的方法类似于ishida等人,(1996)naturebiotechnol14:745-750和frame等人,(2006)plantcellrep25:1024–1034公开的那些方法,但具有许多修改和改进以使该方法能够进行高通量转化。用于在玉蜀黍中产生多个转基因事件的方法的实例在美国专利申请公开no.us2013/0157369a1中给出,该方法从胚芽感染和共培养步骤开始。

假定t0转基因小植株从phytatraystm(sigma-aldrich;st.louis,mo)移植至生长培养基(premixbx;premiertechhorticulture)填充的小3.5"塑料盆(t.o.plastics;clearwater,mn),用保湿顶(arcoplasticsltd.)覆盖,然后在生长室(28℃日/24℃夜,16小时光周期,50-70%rh,200μem-2秒-1光强度)中强化。当植物达到v3-v4发育阶段(3-4个叶枕可见)时,将其移植到sunshinecustomblend160土壤混合物中,并且在温室(曝光类型:光或同化;高光限制:1200par;16小时日长;27℃日/24℃夜)中生长至开花。使用设计为检测转基因相对拷贝数的引物通过qpcr测定分析植物的转基因拷贝数,并且将选择用于进展的假定单拷贝事件移植至5加仑盆中。

实施例5:拷贝数的分子确认

通过水解探针分析确认phi-yfp转基因稳定整合进转基因玉米植物的基因组内。获得和分析从愈伤组织发育的稳定转化的转基因玉米小植株,以鉴别含有低拷贝数(1-2个拷贝)的全长t链插入物的事件。将所鉴别的小植株推进至温室并生长。

使用rochelightcycler480tm系统测定转基因拷贝数。该方法采用biplex反应,该反应在单个分析中采用phi-yfp基因和内源性玉米参考基因转化酶(genbank登录号:u16123.1)特异性寡核苷酸。通过测定phi-yfp特异性荧光相对于转化酶特异性荧光的强度,从而与已知拷贝数标准物比较来测定拷贝数和接合子型式。

phi-yfp基因特异性dna片段使用含有famtm荧光染料标记的探针的一个引物/探针组来扩增,并且转化酶使用含有hextm荧光标记的探针的第二引物/探针组来扩增。通过测定报告基因phi-yfp特异性荧光相对于参考基因转化酶特异性荧光的相对强度,从而与已知拷贝数标准物比较来测定样品的拷贝数和接合子型式。

实施例6:蛋白质表达的分子确认

蛋白质提取:

使用96孔maxi-sorp平板(thermofisherscientificinc.,rockford,il)进行elisa。该平板涂覆有小鼠单株抗phi-yfp捕获抗体(origenetechnologiesinc.,rockville,md)。在pbs(1μg/ml)中稀释抗体,每孔加入150μl稀释的pbs。该平板在4℃下温育过夜。将该平板保持在室温下20-30分钟,然后用350μl洗涤缓冲液[补充有0.05%(sigma-aldrich,st.louis,mo)的1×pbs]洗涤4次。接着,该平板每孔使用200μl阻断缓冲液[补充有0.05%bsa(millipore)的1×pbs]在+37℃下阻断最少1小时,然后使用350μl洗涤缓冲液(tomtecquadrawashtm2,tomtec,inc.,hamden,ct)洗涤4次。

对于phi-yfpelisa,使用evrogen重组phi-yfp1mg/ml(axxorallc,farmingdale,ny)作为标准物。使用5参数拟合标准曲线(在1ng/ml和0.125ng/ml标准物之间)确保所有数据落在曲线的线性部分。接着,将100μl标准物或样品加入孔中。使用溶于分析缓冲液的最小1:4样品稀释液。在室温下平板摇床(250rpm;滴定平板摇床)上温育平板1小时,然后使用350μl洗涤缓冲液(tomtecquadrawashtm2)洗涤4次。将约100μl1μg/mlevrogen兔多克隆抗phi-yfp一抗(axxora)加入每个孔中。在室温下在平板摇床上以250rpm温育平板1小时,然后使用350μl洗涤缓冲液(tomtecquadrawashtm2)洗涤4次。接着,100μl抗兔igghrp二抗(thermoscientific)以1:5000稀释于阻断/分析缓冲液中,将其加入每个孔中。在室温下在平板摇床上以250rpm温育平板1小时,然后使用350μl洗涤缓冲液(tomtecquadrawashtm2)洗涤4次。然后,将100μlpierce1stepultratmbelisatm(thermoscientific)底物加入孔中,同时缓缓震荡10分钟。通过加入50μl0.4nh2so4停止反应。使用650nm参考滤光片在450nm下读取吸光度。

使用多个提取物稀释液并且使用供应商提供的试剂和说明书进行elisa。使用总可溶性蛋白质分析归一化蛋白质水平,该总可溶性蛋白质分析使用thermoscientific提供的660nm蛋白质分析试剂并且根据供应商的说明书来进行。

实施例7:可操作地连接至来自二穗短柄草金属硫蛋白样基因(mtl)的启动子的基因的表达

使用含有如上所述的来自二穗短柄草金属硫蛋白样基因(mtl)的启动子的基因表达构建体转化玉蜀黍植株。elisa分析确认新型启动子驱动转基因的稳健表达。从包含新型启动子构建体的转基因植物获得的phi-yfp蛋白的定量测定值如表1所示。数据显示,与叶组织相比,含有新型二穗短柄草金属硫蛋白样基因(mtl)启动子(即,pdab120419)的植物中的phi-yfp蛋白在根组织中的表达优先地更高。

表1:phi-yfp和aad1的二穗短柄草mtl启动子t0表达

nd-未确定

使含有稳定整合的pdab120419转基因事件的t0单转基因拷贝植株与野生型b104玉米植株回交以获得t1种子,该种子生长为成熟植株。使用来自这些成熟植株的半合子t1植株进行分析,以测定aad1和phi-yfp蛋白的表达。每个构建体五个事件、每个事件十个植株用于蛋白质表达分析。每个构建体三个事件、每个事件三至五个植株用于其他组织类型表达。对phi-yfp和aad1进行接合子型式分析。从包含新型启动子构建体的t1转基因植株的不同组织类型(包括叶、穗轴、果壳、花粉、根、穗丝和茎组织)获得的phi-yfp和aad1蛋白的定量elisa测定值如表2所示。数据证实了t0叶子表达结果,并且还显示主要在含有新型启动子(pdab120419)的植株的根组织类型中获得了phi-yfp蛋白的一致高表达。这些数据证明,这里示出的新型启动子驱动转基因优先在植物根中表达,并且该表达图谱可从第一代遗传至第二代。因此,来自二穗短柄草金属硫蛋白样基因(mtl)的启动子可用于生物技术应用。

表2:转基因玉米植株的不同组织类型中的蛋白质表达

phi-yfpelisa结果显示,二穗短柄草金属硫蛋白样基因(mtl)启动子调控元件(seqidno:1)驱动使用构建体pdab120419转化的t0事件中的phi-yfp在地面下优选的表达,特别是在根组织中。在这些事件的叶组织中观察到二穗短柄草金属硫蛋白样基因(mtl)启动子调控元件对phi-yfp可忽略的表达(表1和表2)。转化产生的事件也在叶和根组织中表达aad1蛋白。在这些事件内aad1的表达作为对照,以比较phi-yfp在不同组织中的表达水平。总体而言,二穗短柄草金属硫蛋白样基因(mtl)启动子被开发用于转基因在如玉米的植物物种的地面下组织内的稳健表达。

实施例8:可操作地连接至来自二穗短柄草金属硫蛋白样基因(mtl)的启动子的基因的作物转化

可通过利用专利申请wo2007/053482的实施例#11或实施例#13中已经描述的相同技术,用可操作地连接至来自二穗短柄草金属硫蛋白样基因(mtl)的启动子的基因转化大豆。

可通过利用美国专利no.7,838,733的实施例#14或专利申请wo2007/053482(wright等人)的实施例#12中已经描述的相同技术,用可操作地连接至来自二穗短柄草金属硫蛋白样基因(mtl)的启动子的基因转化棉花。

可通过利用美国专利no.7,838,733的实施例#26或专利申请wo2007/053482(wright等人)的实施例#22中已经描述的相同技术,用可操作地连接至来自二穗短柄草金属硫蛋白样基因(mtl)的启动子的基因转化芥花。

可通过利用专利申请wo2013/116700a1(lira等人)的实施例#23中已经描述的相同技术,用可操作地连接至来自二穗短柄草金属硫蛋白样基因(mtl)的启动子的基因转化小麦。

可通过利用专利申请wo2013/116700a1(lira等人)的实施例#19中已经描述的相同技术,用可操作地连接至来自二穗短柄草金属硫蛋白样基因(mtl)的启动子的基因转化稻。

实施例9:可操作地连接至来自二穗短柄草金属硫蛋白样基因(mtl)的启动子的基因的农杆菌属介导的转化

根据本公开,另外的作物可根据本公开的实施方案使用本领域已知的技术来转化。关于农杆菌属介导的黑麦转化,参见例如popelkajc,xuj,altpeterf.,“generationofryewithlowtransgenecopynumberafterbiolisticgenetransferandproductionof(secalecerealel.)plantsinstantlymarker-freetransgenicrye,”transgenicres.2003年10月;12(5):587-96。关于农杆菌属介导的高粱转化,参见例如zhao等人,“agrobacterium-mediatedsorghumtransformation,”plantmolbiol.2000年12月;44(6):789-98。关于农杆菌属介导的大麦转化,参见例如tingay等人,“agrobacteriumtumefaciens-mediatedbarleytransformation,”theplantjournal,(1997)11:1369–1376。关于农杆菌属介导的小麦转化,参见例如cheng等人,“genetictransformationofwheatmediatedbyagrobacteriumtumefaciens,”plantphysiol.1997年11月;115(3):971-980。关于农杆菌属介导的稻转化,参见例如hiei等人,“transformationofricemediatedbyagrobacteriumtumefaciens,”plantmol.biol.1997年9月;35(1-2):205-18。

这些和其他植物的拉丁名在下文给出。应当明白,可使用其他(非农杆菌属)转化技术将可操作地连接至来自二穗短柄草金属硫蛋白样基因(mtl)的启动子的基因例如转化至这些和其他植物中。实例包括但不限于:玉蜀黍(玉米)、小麦(小麦属(triticumspp.))、稻(稻属(oryzaspp.)和菰属(zizaniaspp.))、大麦(大麦属(hordeumspp.))、棉花(水麻(abromaaugusta)和棉属(gossypiumspp.))、大豆(大豆(glycinemax))、糖和食用甜菜(甜菜属(betaspp.))、甘蔗(桄榔(arengapinnata))、西红柿(西红柿(lycopersiconesculentum)和其他种、粘果酸浆(physalisixocarpa)、黄水茄(solanumincanum)和其他种以及树番茄(cyphomandrabetacea))、马铃薯(马铃薯(solanumtuberosum))、甘薯(甘薯(ipomoeabatatas))、黑麦(黑麦属(secalespp.))、胡椒(甜椒(capsicumannuum)、中国辣椒(capsicumchinense)和小米椒(capsicumfrutescens))、莴苣(莴苣(lactucasativa)、野莴苣(lactucaperennis)和蓝莴苣(lactucapulchella))、甘蓝菜(芸苔属(brassicaspp.))、芹菜(芹菜(apiumgraveolens))、茄子(茄子(solanummelongena))、花生(落花生(arachishypogea))、高粱(高粱属(sorghumspp.))、苜蓿(紫花苜蓿(medicagosativa))、胡萝卜(野胡萝卜(daucuscarota))、菜豆(菜豆属(phaseolusspp.)和其他属)、燕麦(燕麦(avenasativa)和毛燕麦(avenastrigosa))、豌豆(豌豆属(pisum)、豇豆属(vigna)和翅荚豌豆属(tetragonolobusspp.))、向日葵(向日葵(helianthusannuus))、南瓜(南瓜属(cucurbitaspp.))、黄瓜(黄瓜(cucumissativa))、烟草(烟草属(nicotianaspp.))、拟南芥属(拟南芥)、草皮草(黑麦草属(lolium)、剪链颖属(agrostis)、早熟禾属(poa)、狗牙根属(cynodon)和其他属)、三叶草(车轴草属(trifolium))、野豌豆(野豌豆属(vicia))。本公开的实施方案设想了例如使用可操作地连接至来自二穗短柄草金属硫蛋白样基因(mtl)的启动子的基因转化此类植物。

使用来自二穗短柄草金属硫蛋白样基因(mtl)的启动子驱动可操作地连接的基因可用于许多落叶树和常青树物种。此类应用也在本公开实施方案的范围内。这些物种包括但不限于:桤木(赤杨属(alnusspp.))、白蜡木(白蜡树属(fraxinusspp.))、山杨和白杨物种(白杨属(populusspp.))、山毛榉(山毛榉属(fagusspp.))、桦树(桦属(betulaspp.))、樱桃木(李属(prunusspp.))、桉树(桉属(eucalyptusspp.))、山核桃木(山核桃属(caryaspp.))、枫树(槭属(acerspp.))、橡树(栎属(quercusspp.))和松树(松属(pinusspp.))。

使用来自二穗短柄草金属硫蛋白样基因(mtl)的启动子驱动可操作地连接的基因可用于观赏植物和结实物种。此类应用也在本公开实施方案的范围内。实例包括但不限于:玫瑰(蔷薇属(rosaspp.))、紫卫矛(卫矛属(euonymusspp.))、矮牵牛(矮牵牛属(petuniaspp.))、秋海棠(秋海棠属(begoniaspp.))、杜鹃花(杜鹃花属(rhododendronspp.))、海棠果或苹果(苹果属(malusspp.))、梨(梨属(pyrusspp.))、桃(李属(prunusspp.))和金盏花(万寿菊属(tagetesspp.))。

尽管上文讨论了多个示例性方面和实施方案,但本领域的技术人员将认识到它们的某些修改、排列、添加和子组合。因此,预期以下所附权利要求书和之后介绍的权利要求应解释为包括其真正精神和范围内的所有此类修改、排列、添加和子组合。

序列表

<110>dowagrosciencesllc

kumar,sandeep

hemingway,daren

ausmus,carla

worden,andrew

ashberry,andrew

<120>用于转基因表达的植物启动子

<130>77035-wo-pct

<160>18

<170>patentin3.5版

<210>1

<211>2000

<212>dna

<213>二穗短柄草

<400>1

tttcgtgtgcttacttggggcttcctttgggcctgcggaagcagacggcgtgccagctga60

gaccgttggtggacaatgtggatggacgtctagcttcgtggaaggcccttctcctttcca120

agggaggatgactggtgctggtcaagtccaccctgacagcgatgccggtctactcgatga180

tgtcactcgacctttcggacaagatcatcaaaggggtggacaagatctgtcgtggtttcc240

tttggcgtggtcagaaggacgctaaaggggggggggcattgtatggtggcttgggtcgtg300

gtgtgttcgccgaagcctttcggtggactcggaattccaaatcttcgcatgctcaacgag360

gccttgagggtccgctagaggtggcttgagagggtggacgattccaaaccatgggtcggt420

ttcaaggttgagacgcccagaggtctatgttatctttgaggcggccacttcctctttggt480

gggcgatggccggaagaccctcttctggaccgatcgttggctgcatggcgtctgttttcg540

agatgcgttcctgatcctcgtgggccatgtttgccacaagtttttgcgcacgcgcacagt600

gcgggaggctctgcatggagcgtggactggcgacatgggtccagacctaaagggaagcta660

ctcttgaggagttcctcactctctgggactggcttcgtggggtccaactggaagaaggga720

gggccgactctcttcattggaactggtctcgtggtgatagttactcggcaaagactgctt780

atgcgaatctcttcactggccgcatggttgacccgttagcggctgagatctagggcttcg840

gagaggtgtcgtttcttcgtctggctcgcagttcgaaatagatgctagacggcggatcgc900

ttgcgaggcgtgggcttccccaccctgacaagtgtcaggagatggagaccatttcccatc960

tactcttggggtgtgtcttggcgaggcaggtttgggagcgcttgtgggcggcttggggac1020

acgtggagtgggctccgaatgcggatgctactctgcgggaatggtggtcttctcttccct1080

taccacggcgagcccggagggacttccggacggggatcatacttgttctttggaccattt1140

ggtgccattggaatgatgtggccttccttgcagcttgtcgtgcttcgcctccaggaggag1200

tttggtcggtgggcgcacgccggcctctttaggggtagagtgtctattccagccttgatg1260

gtgagtggttggatagctagcacatagtctttttttctctttcttgccacttggtgatgt1320

tgtattgccgcttcggcgttgtactagccttctggctcttcttatttaatcgatgatgca1380

cccgctgggtggcattcttgaaatttttttgagaaaatactcctacaaaggaagtacagt1440

aatttgatacacaatgctttctctaaatacgaaaatacaaacatcctaatgttattccaa1500

ctatgctactccctccgttcctaaactcttatctttgtttttgttcaaatttgtaccaaa1560

caacgacaaaaatttagtaacggaggaagtatatatacgaagtgataccaaataaggtgt1620

ttctttacttgaaagctagttcctctgaggtaaaagaaatgatgaggatcaaggaaggcc1680

catttcttgccggcacgcagttgccgaagtcagtagatttaaaatgacctcacatactga1740

agaaggaaagggaagttaaccacgccattgttgctttagcagaaagcaaccatatcctaa1800

ttaacatcacagtacacgttgaaacggcagggcacgataattggtgaagactgattccag1860

ggagcatcgtggcacgcaaaaacgcccttgccttgttcccttataaatagtggtgcagaa1920

gatacatttgtgatcaccatctcaaagcgcctctttattcccctttcatcttgagcttaa1980

gtactagagaaaaattaagg2000

<210>2

<211>3340

<212>dna

<213>二穗短柄草

<400>2

tttcgtgtgcttacttggggcttcctttgggcctgcggaagcagacggcgtgccagctga60

gaccgttggtggacaatgtggatggacgtctagcttcgtggaaggcccttctcctttcca120

agggaggatgactggtgctggtcaagtccaccctgacagcgatgccggtctactcgatga180

tgtcactcgacctttcggacaagatcatcaaaggggtggacaagatctgtcgtggtttcc240

tttggcgtggtcagaaggacgctaaaggggggggggcattgtatggtggcttgggtcgtg300

gtgtgttcgccgaagcctttcggtggactcggaattccaaatcttcgcatgctcaacgag360

gccttgagggtccgctagaggtggcttgagagggtggacgattccaaaccatgggtcggt420

ttcaaggttgagacgcccagaggtctatgttatctttgaggcggccacttcctctttggt480

gggcgatggccggaagaccctcttctggaccgatcgttggctgcatggcgtctgttttcg540

agatgcgttcctgatcctcgtgggccatgtttgccacaagtttttgcgcacgcgcacagt600

gcgggaggctctgcatggagcgtggactggcgacatgggtccagacctaaagggaagcta660

ctcttgaggagttcctcactctctgggactggcttcgtggggtccaactggaagaaggga720

gggccgactctcttcattggaactggtctcgtggtgatagttactcggcaaagactgctt780

atgcgaatctcttcactggccgcatggttgacccgttagcggctgagatctagggcttcg840

gagaggtgtcgtttcttcgtctggctcgcagttcgaaatagatgctagacggcggatcgc900

ttgcgaggcgtgggcttccccaccctgacaagtgtcaggagatggagaccatttcccatc960

tactcttggggtgtgtcttggcgaggcaggtttgggagcgcttgtgggcggcttggggac1020

acgtggagtgggctccgaatgcggatgctactctgcgggaatggtggtcttctcttccct1080

taccacggcgagcccggagggacttccggacggggatcatacttgttctttggaccattt1140

ggtgccattggaatgatgtggccttccttgcagcttgtcgtgcttcgcctccaggaggag1200

tttggtcggtgggcgcacgccggcctctttaggggtagagtgtctattccagccttgatg1260

gtgagtggttggatagctagcacatagtctttttttctctttcttgccacttggtgatgt1320

tgtattgccgcttcggcgttgtactagccttctggctcttcttatttaatcgatgatgca1380

cccgctgggtggcattcttgaaatttttttgagaaaatactcctacaaaggaagtacagt1440

aatttgatacacaatgctttctctaaatacgaaaatacaaacatcctaatgttattccaa1500

ctatgctactccctccgttcctaaactcttatctttgtttttgttcaaatttgtaccaaa1560

caacgacaaaaatttagtaacggaggaagtatatatacgaagtgataccaaataaggtgt1620

ttctttacttgaaagctagttcctctgaggtaaaagaaatgatgaggatcaaggaaggcc1680

catttcttgccggcacgcagttgccgaagtcagtagatttaaaatgacctcacatactga1740

agaaggaaagggaagttaaccacgccattgttgctttagcagaaagcaaccatatcctaa1800

ttaacatcacagtacacgttgaaacggcagggcacgataattggtgaagactgattccag1860

ggagcatcgtggcacgcaaaaacgcccttgccttgttcccttataaatagtggtgcagaa1920

gatacatttgtgatcaccatctcaaagcgcctctttattcccctttcatcttgagcttaa1980

gtactagagaaaaattaaggatgtcttgcagctgtggatctggatgcagctgcggctcaa2040

actgcacctgcgggtatgtatagatgcttaattctgtgttgcagattactacgtagctgc2100

taataccatctaagtaatgacaatgctttctcatgatgatcaattttcatttgctgtgtg2160

gttcagcaagatgtaccctgacttggcagagaagagcggcggcacccagcaggccaccac2220

catgatcctcggcgttgcgcctgctaaggcccagtttgaggaggccgccgagtccggtga2280

ggccggccatggctgcagctgcggcgccaactgcaagtgcgacccgtgcaactgctaaga2340

tgcacgcgacgcgctgctgcttgtggtgtgtgtttgtgtgatctcgactgaataaaaggg2400

acacggtacatccggggttggttggtgctcgagtcgagtgtgcaaggttgtgtggtttgc2460

cagctcttggtgtgtgtctccttgtgctcatgtgacttgtgaaaccattaatagtaacca2520

ctttgtgcttgtgtgtgtgtgggcacctgtgtttctgtaatggtctatctggagtgaata2580

tatacaagacaggtttgcctaaccatgccttttccttccttgaggtcatcgcgccaacac2640

gaatgacgagaaccaatgatcttaggactatcaaatagacaatataactcagcatggagc2700

aatgtactgctaatgaacggtcctaatcaatacagttgggaagcagtaatcgatggaaaa2760

cacttcctcagttcagaagggaacatgtagatgggaaagtaaacaggatatatagacaca2820

tgcagttaggtctaccacaagaagacatgccacaggactaaaaacagaagctgggtttgg2880

aacaacttatgcagacgctagctatccagataaaccttagagaaacagctatgagaataa2940

gcgtctgaaatttgtagttgcctgtttggaatggcttatggacgacaagcttattttctg3000

gagtagcctacaagtacaagccaaggcacatgctgttccaaactggcccatattttgcac3060

aaccaaaggaaaagagacagtgacataagagcatctccagtgattcagtgagatacccca3120

aagtcatccaaatgtccgtttcggccgaaatggacatgctggccagaaaaacatctccca3180

atgggttaccccaaatagatattttgtatgttttgtccggcccaatccccaaacatctcc3240

taaatttggggcaactttgcggtgtccagtgtccggtgtccgggcccacttctttttctc3300

ccaagcgagcatcttcctcccgaagcacgaagcccccgtc3340

<210>3

<211>1002

<212>dna

<213>二穗短柄草

<400>3

gatgcacgcgacgcgctgctgcttgtggtgtgtgtttgtgtgatctcgactgaataaaag60

ggacacggtacatccggggttggttggtgctcgagtcgagtgtgcaaggttgtgtggttt120

gccagctcttggtgtgtgtctccttgtgctcatgtgacttgtgaaaccattaatagtaac180

cactttgtgcttgtgtgtgtgtgggcacctgtgtttctgtaatggtctatctggagtgaa240

tatatacaagacaggtttgcctaaccatgccttttccttccttgaggtcatcgcgccaac300

acgaatgacgagaaccaatgatcttaggactatcaaatagacaatataactcagcatgga360

gcaatgtactgctaatgaacggtcctaatcaatacagttgggaagcagtaatcgatggaa420

aacacttcctcagttcagaagggaacatgtagatgggaaagtaaacaggatatatagaca480

catgcagttaggtctaccacaagaagacatgccacaggactaaaaacagaagctgggttt540

ggaacaacttatgcagacgctagctatccagataaaccttagagaaacagctatgagaat600

aagcgtctgaaatttgtagttgcctgtttggaatggcttatggacgacaagcttattttc660

tggagtagcctacaagtacaagccaaggcacatgctgttccaaactggcccatattttgc720

acaaccaaaggaaaagagacagtgacataagagcatctccagtgattcagtgagataccc780

caaagtcatccaaatgtccgtttcggccgaaatggacatgctggccagaaaaacatctcc840

caatgggttaccccaaatagatattttgtatgttttgtccggcccaatccccaaacatct900

cctaaatttggggcaactttgcggtgtccagtgtccggtgtccgggcccacttctttttc960

tcccaagcgagcatcttcctcccgaagcacgaagcccccgtc1002

<210>4

<211>3934

<212>dna

<213>人工序列

<220>

<223>phi-yfp基因表达盒;其中seqid

no:1的启动子和seqidno:3的3'utr驱动phi-yfp基因。

<400>4

tttcgtgtgcttacttggggcttcctttgggcctgcggaagcagacggcgtgccagctga60

gaccgttggtggacaatgtggatggacgtctagcttcgtggaaggcccttctcctttcca120

agggaggatgactggtgctggtcaagtccaccctgacagcgatgccggtctactcgatga180

tgtcactcgacctttcggacaagatcatcaaaggggtggacaagatctgtcgtggtttcc240

tttggcgtggtcagaaggacgctaaaggggggggggcattgtatggtggcttgggtcgtg300

gtgtgttcgccgaagcctttcggtggactcggaattccaaatcttcgcatgctcaacgag360

gccttgagggtccgctagaggtggcttgagagggtggacgattccaaaccatgggtcggt420

ttcaaggttgagacgcccagaggtctatgttatctttgaggcggccacttcctctttggt480

gggcgatggccggaagaccctcttctggaccgatcgttggctgcatggcgtctgttttcg540

agatgcgttcctgatcctcgtgggccatgtttgccacaagtttttgcgcacgcgcacagt600

gcgggaggctctgcatggagcgtggactggcgacatgggtccagacctaaagggaagcta660

ctcttgaggagttcctcactctctgggactggcttcgtggggtccaactggaagaaggga720

gggccgactctcttcattggaactggtctcgtggtgatagttactcggcaaagactgctt780

atgcgaatctcttcactggccgcatggttgacccgttagcggctgagatctagggcttcg840

gagaggtgtcgtttcttcgtctggctcgcagttcgaaatagatgctagacggcggatcgc900

ttgcgaggcgtgggcttccccaccctgacaagtgtcaggagatggagaccatttcccatc960

tactcttggggtgtgtcttggcgaggcaggtttgggagcgcttgtgggcggcttggggac1020

acgtggagtgggctccgaatgcggatgctactctgcgggaatggtggtcttctcttccct1080

taccacggcgagcccggagggacttccggacggggatcatacttgttctttggaccattt1140

ggtgccattggaatgatgtggccttccttgcagcttgtcgtgcttcgcctccaggaggag1200

tttggtcggtgggcgcacgccggcctctttaggggtagagtgtctattccagccttgatg1260

gtgagtggttggatagctagcacatagtctttttttctctttcttgccacttggtgatgt1320

tgtattgccgcttcggcgttgtactagccttctggctcttcttatttaatcgatgatgca1380

cccgctgggtggcattcttgaaatttttttgagaaaatactcctacaaaggaagtacagt1440

aatttgatacacaatgctttctctaaatacgaaaatacaaacatcctaatgttattccaa1500

ctatgctactccctccgttcctaaactcttatctttgtttttgttcaaatttgtaccaaa1560

caacgacaaaaatttagtaacggaggaagtatatatacgaagtgataccaaataaggtgt1620

ttctttacttgaaagctagttcctctgaggtaaaagaaatgatgaggatcaaggaaggcc1680

catttcttgccggcacgcagttgccgaagtcagtagatttaaaatgacctcacatactga1740

agaaggaaagggaagttaaccacgccattgttgctttagcagaaagcaaccatatcctaa1800

ttaacatcacagtacacgttgaaacggcagggcacgataattggtgaagactgattccag1860

ggagcatcgtggcacgcaaaaacgcccttgccttgttcccttataaatagtggtgcagaa1920

gatacatttgtgatcaccatctcaaagcgcctctttattcccctttcatcttgagcttaa1980

gtactagagaaaaattaaggccagaagacaccatgtcatctggagcacttctctttcatg2040

ggaagattccttacgttgtggagatggaagggaatgttgatggccacacctttagcatac2100

gtgggaaaggctacggagatgcctcagtgggaaaggtatgtttctgcttctacctttgat2160

atatatataataattatcactaattagtagtaatatagtatttcaagtatttttttcaaa2220

ataaaagaatgtagtatatagctattgcttttctgtagtttataagtgtgtatattttaa2280

tttataacttttctaatatatgaccaaaacatggtgatgtgcaggttgatgcacaattca2340

tctgtactaccggagatgttcctgtgccttggagcacacttgtcaccactctcacctatg2400

gagcacagtgctttgccaagtatggtccagagttgaaggacttctacaagtcctgtatgc2460

cagatggctatgtgcaagagcgcacaatcacctttgaaggagatggcaacttcaagacta2520

gggctgaagtcacctttgagaatgggtctgtctacaatagggtcaaactcaatggtcaag2580

gcttcaagaaagatggtcacgtgttgggaaagaacttggagttcaacttcactccccact2640

gcctctacatctggggagaccaagccaaccacggtctcaagtcagccttcaagatatgtc2700

atgagattactggcagcaaaggcgacttcatagtggctgaccacacccagatgaacactc2760

ccattggtggaggtccagttcatgttccagagtatcatcatatgtcttaccatgtgaaac2820

tttccaaagatgtgacagaccacagagacaacatgagcttgaaagaaactgtcagagctg2880

ttgactgtcgcaagacctacctttgagtagttagcttaatcacctagagctcgatgcacg2940

cgacgcgctgctgcttgtggtgtgtgtttgtgtgatctcgactgaataaaagggacacgg3000

tacatccggggttggttggtgctcgagtcgagtgtgcaaggttgtgtggtttgccagctc3060

ttggtgtgtgtctccttgtgctcatgtgacttgtgaaaccattaatagtaaccactttgt3120

gcttgtgtgtgtgtgggcacctgtgtttctgtaatggtctatctggagtgaatatataca3180

agacaggtttgcctaaccatgccttttccttccttgaggtcatcgcgccaacacgaatga3240

cgagaaccaatgatcttaggactatcaaatagacaatataactcagcatggagcaatgta3300

ctgctaatgaacggtcctaatcaatacagttgggaagcagtaatcgatggaaaacacttc3360

ctcagttcagaagggaacatgtagatgggaaagtaaacaggatatatagacacatgcagt3420

taggtctaccacaagaagacatgccacaggactaaaaacagaagctgggtttggaacaac3480

ttatgcagacgctagctatccagataaaccttagagaaacagctatgagaataagcgtct3540

gaaatttgtagttgcctgtttggaatggcttatggacgacaagcttattttctggagtag3600

cctacaagtacaagccaaggcacatgctgttccaaactggcccatattttgcacaaccaa3660

aggaaaagagacagtgacataagagcatctccagtgattcagtgagataccccaaagtca3720

tccaaatgtccgtttcggccgaaatggacatgctggccagaaaaacatctcccaatgggt3780

taccccaaatagatattttgtatgttttgtccggcccaatccccaaacatctcctaaatt3840

tggggcaactttgcggtgtccagtgtccggtgtccgggcccacttctttttctcccaagc3900

gagcatcttcctcccgaagcacgaagcccccgtc3934

<210>5

<211>3307

<212>dna

<213>人工序列

<220>

<223>包含玉米泛素1启动子和玉米脂肪酶3'utr的aad-1选择性标记基因表达盒

<400>5

gtgcagcgtgacccggtcgtgcccctctctagagataatgagcattgcatgtctaagtta60

taaaaaattaccacatattttttttgtcacacttgtttgaagtgcagtttatctatcttt120

atacatatatttaaactttactctacgaataatataatctatagtactacaataatatca180

gtgttttagagaatcatataaatgaacagttagacatggtctaaaggacaattgagtatt240

ttgacaacaggactctacagttttatctttttagtgtgcatgtgttctcctttttttttg300

caaatagcttcacctatataatacttcatccattttattagtacatccatttagggttta360

gggttaatggtttttatagactaatttttttagtacatctattttattctattttagcct420

ctaaattaagaaaactaaaactctattttagtttttttatttaatagtttagatataaaa480

tagaataaaataaagtgactaaaaattaaacaaataccctttaagaaattaaaaaaacta540

aggaaacatttttcttgtttcgagtagataatgccagcctgttaaacgccgtcgacgagt600

ctaacggacaccaaccagcgaaccagcagcgtcgcgtcgggccaagcgaagcagacggca660

cggcatctctgtcgctgcctctggacccctctcgagagttccgctccaccgttggacttg720

ctccgctgtcggcatccagaaattgcgtggcggagcggcagacgtgagccggcacggcag780

gcggcctcctcctcctctcacggcaccggcagctacgggggattcctttcccaccgctcc840

ttcgctttcccttcctcgcccgccgtaataaatagacaccccctccacaccctctttccc900

caacctcgtgttgttcggagcgcacacacacacaaccagatctcccccaaatccacccgt960

cggcacctccgcttcaaggtacgccgctcgtcctccccccccccccccctctctaccttc1020

tctagatcggcgttccggtccatgcatggttagggcccggtagttctacttctgttcatg1080

tttgtgttagatccgtgtttgtgttagatccgtgctgctagcgttcgtacacggatgcga1140

cctgtacgtcagacacgttctgattgctaacttgccagtgtttctctttggggaatcctg1200

ggatggctctagccgttccgcagacgggatcgatttcatgattttttttgtttcgttgca1260

tagggtttggtttgcccttttcctttatttcaatatatgccgtgcacttgtttgtcgggt1320

catcttttcatgcttttttttgtcttggttgtgatgatgtggtctggttgggcggtcgtt1380

ctagatcggagtagaattctgtttcaaactacctggtggatttattaattttggatctgt1440

atgtgtgtgccatacatattcatagttacgaattgaagatgatggatggaaatatcgatc1500

taggataggtatacatgttgatgcgggttttactgatgcatatacagagatgctttttgt1560

tcgcttggttgtgatgatgtggtgtggttgggcggtcgttcattcgttctagatcggagt1620

agaatactgtttcaaactacctggtgtatttattaattttggaactgtatgtgtgtgtca1680

tacatcttcatagttacgagtttaagatggatggaaatatcgatctaggataggtataca1740

tgttgatgtgggttttactgatgcatatacatgatggcatatgcagcatctattcatatg1800

ctctaaccttgagtacctatctattataataaacaagtatgttttataattatttcgatc1860

ttgatatacttggatgatggcatatgcagcagctatatgtggatttttttagccctgcct1920

tcatacgctatttatttgcttggtactgtttcttttgtcgatgctcaccctgttgtttgg1980

tgttacttctgcaggtacagtagttagttgaggtaccggatccacacgacaccatggctc2040

atgctgccctcagccctctctcccaacgctttgagagaatagctgtccagccactcactg2100

gtgtccttggtgctgagatcactggagtggacttgagggaaccacttgatgacagcacct2160

ggaatgagatattggatgccttccacacttaccaagtcatctactttcctggccaagcaa2220

tcaccaatgagcagcacattgcattctcaagaaggtttggaccagttgatccagtgcctc2280

ttctcaagagcattgaaggctatccagaggttcagatgatccgcagagaagccaatgagt2340

ctggaagggtgattggtgatgactggcacacagactccactttccttgatgcacctccag2400

ctgctgttgtgatgagggccatagatgttcctgagcatggcggagacactgggttccttt2460

caatgtacacagcttgggagaccttgtctccaaccatgcaagccaccatcgaagggctca2520

acgttgtgcactctgccacacgtgtgttcggttccctctaccaagcacagaaccgtcgct2580

tcagcaacacctcagtcaaggtgatggatgttgatgctggtgacagagagacagtccatc2640

ccttggttgtgactcatcctggctctggaaggaaaggcctttatgtgaatcaagtctact2700

gtcagagaattgagggcatgacagatgcagaatcaaagccattgcttcagttcctctatg2760

agcatgccaccagatttgacttcacttgccgtgtgaggtggaagaaagaccaagtccttg2820

tctgggacaacttgtgcaccatgcaccgtgctgttcctgactatgctggcaagttcagat2880

acttgactcgcaccacagttggtggagttaggcctgcccgctgagtagttagcttaatca2940

cctagagctcggtcgcagcgtgtgcgtgtccgtcgtacgttctggccggccgggccttgg3000

gcgcgcgatcagaagcgttgcgttggcgtgtgtgtgcttctggtttgctttaattttacc3060

aagtttgtttcaaggtggatcgcgtggtcaaggcccgtgtgctttaaagacccaccggca3120

ctggcagtgagtgttgctgcttgtgtaggctttggtacgtatgggctttatttgcttctg3180

gatgttgtgtactacttgggtttgttgaattattatgagcagttgcgtattgtaattcag3240

ctgggctacctggacattgttatgtattaataaatgctttgctttcttctaaagatcttt3300

aagtgct3307

<210>6

<211>338

<212>dna

<213>二穗短柄草

<400>6

atgtcttgcagctgtggatctggatgcagctgcggctcaaactgcacctgcgggtatgta60

tagatgcttaattctgtgttgcagattactacgtagctgctaataccatctaagtaatga120

caatgctttctcatgatgatcaattttcatttgctgtgtggttcagcaagatgtaccctg180

acttggcagagaagagcggcggcacccagcaggccaccaccatgatcctcggcgttgcgc240

ctgctaaggcccagtttgaggaggccgccgagtccggtgaggccggccatggctgcagct300

gcggcgccaactgcaagtgcgacccgtgcaactgctaa338

<210>7

<211>1730

<212>dna

<213>二穗短柄草

<400>7

ggggggcattgtatggtggcttgggtcgtggtgtgttcgccgaagcctttcggtggactc60

ggaattccaaatcttcgcatgctcaacgaggccttgagggtccgctagaggtggcttgag120

agggtggacgattccaaaccatgggtcggtttcaaggttgagacgcccagaggtctatgt180

tatctttgaggcggccacttcctctttggtgggcgatggccggaagaccctcttctggac240

cgatcgttggctgcatggcgtctgttttcgagatgcgttcctgatcctcgtgggccatgt300

ttgccacaagtttttgcgcacgcgcacagtgcgggaggctctgcatggagcgtggactgg360

cgacatgggtccagacctaaagggaagctactcttgaggagttcctcactctctgggact420

ggcttcgtggggtccaactggaagaagggagggccgactctcttcattggaactggtctc480

gtggtgatagttactcggcaaagactgcttatgcgaatctcttcactggccgcatggttg540

acccgttagcggctgagatctagggcttcggagaggtgtcgtttcttcgtctggctcgca600

gttcgaaatagatgctagacggcggatcgcttgcgaggcgtgggcttccccaccctgaca660

agtgtcaggagatggagaccatttcccatctactcttggggtgtgtcttggcgaggcagg720

tttgggagcgcttgtgggcggcttggggacacgtggagtgggctccgaatgcggatgcta780

ctctgcgggaatggtggtcttctcttcccttaccacggcgagcccggagggacttccgga840

cggggatcatacttgttctttggaccatttggtgccattggaatgatgtggccttccttg900

cagcttgtcgtgcttcgcctccaggaggagtttggtcggtgggcgcacgccggcctcttt960

aggggtagagtgtctattccagccttgatggtgagtggttggatagctagcacatagtct1020

ttttttctctttcttgccacttggtgatgttgtattgccgcttcggcgttgtactagcct1080

tctggctcttcttatttaatcgatgatgcacccgctgggtggcattcttgaaattttttt1140

gagaaaatactcctacaaaggaagtacagtaatttgatacacaatgctttctctaaatac1200

gaaaatacaaacatcctaatgttattccaactatgctactccctccgttcctaaactctt1260

atctttgtttttgttcaaatttgtaccaaacaacgacaaaaatttagtaacggaggaagt1320

atatatacgaagtgataccaaataaggtgtttctttacttgaaagctagttcctctgagg1380

taaaagaaatgatgaggatcaaggaaggcccatttcttgccggcacgcagttgccgaagt1440

cagtagatttaaaatgacctcacatactgaagaaggaaagggaagttaaccacgccattg1500

ttgctttagcagaaagcaaccatatcctaattaacatcacagtacacgttgaaacggcag1560

ggcacgataattggtgaagactgattccagggagcatcgtggcacgcaaaaacgcccttg1620

ccttgttcccttataaatagtggtgcagaagatacatttgtgatcaccatctcaaagcgc1680

ctctttattcccctttcatcttgagcttaagtactagagaaaaattaagg1730

<210>8

<211>1530

<212>dna

<213>二穗短柄草

<400>8

cctctttggtgggcgatggccggaagaccctcttctggaccgatcgttggctgcatggcg60

tctgttttcgagatgcgttcctgatcctcgtgggccatgtttgccacaagtttttgcgca120

cgcgcacagtgcgggaggctctgcatggagcgtggactggcgacatgggtccagacctaa180

agggaagctactcttgaggagttcctcactctctgggactggcttcgtggggtccaactg240

gaagaagggagggccgactctcttcattggaactggtctcgtggtgatagttactcggca300

aagactgcttatgcgaatctcttcactggccgcatggttgacccgttagcggctgagatc360

tagggcttcggagaggtgtcgtttcttcgtctggctcgcagttcgaaatagatgctagac420

ggcggatcgcttgcgaggcgtgggcttccccaccctgacaagtgtcaggagatggagacc480

atttcccatctactcttggggtgtgtcttggcgaggcaggtttgggagcgcttgtgggcg540

gcttggggacacgtggagtgggctccgaatgcggatgctactctgcgggaatggtggtct600

tctcttcccttaccacggcgagcccggagggacttccggacggggatcatacttgttctt660

tggaccatttggtgccattggaatgatgtggccttccttgcagcttgtcgtgcttcgcct720

ccaggaggagtttggtcggtgggcgcacgccggcctctttaggggtagagtgtctattcc780

agccttgatggtgagtggttggatagctagcacatagtctttttttctctttcttgccac840

ttggtgatgttgtattgccgcttcggcgttgtactagccttctggctcttcttatttaat900

cgatgatgcacccgctgggtggcattcttgaaatttttttgagaaaatactcctacaaag960

gaagtacagtaatttgatacacaatgctttctctaaatacgaaaatacaaacatcctaat1020

gttattccaactatgctactccctccgttcctaaactcttatctttgtttttgttcaaat1080

ttgtaccaaacaacgacaaaaatttagtaacggaggaagtatatatacgaagtgatacca1140

aataaggtgtttctttacttgaaagctagttcctctgaggtaaaagaaatgatgaggatc1200

aaggaaggcccatttcttgccggcacgcagttgccgaagtcagtagatttaaaatgacct1260

cacatactgaagaaggaaagggaagttaaccacgccattgttgctttagcagaaagcaac1320

catatcctaattaacatcacagtacacgttgaaacggcagggcacgataattggtgaaga1380

ctgattccagggagcatcgtggcacgcaaaaacgcccttgccttgttcccttataaatag1440

tggtgcagaagatacatttgtgatcaccatctcaaagcgcctctttattcccctttcatc1500

ttgagcttaagtactagagaaaaattaagg1530

<210>9

<211>1330

<212>dna

<213>二穗短柄草

<400>9

gttcctcactctctgggactggcttcgtggggtccaactggaagaagggagggccgactc60

tcttcattggaactggtctcgtggtgatagttactcggcaaagactgcttatgcgaatct120

cttcactggccgcatggttgacccgttagcggctgagatctagggcttcggagaggtgtc180

gtttcttcgtctggctcgcagttcgaaatagatgctagacggcggatcgcttgcgaggcg240

tgggcttccccaccctgacaagtgtcaggagatggagaccatttcccatctactcttggg300

gtgtgtcttggcgaggcaggtttgggagcgcttgtgggcggcttggggacacgtggagtg360

ggctccgaatgcggatgctactctgcgggaatggtggtcttctcttcccttaccacggcg420

agcccggagggacttccggacggggatcatacttgttctttggaccatttggtgccattg480

gaatgatgtggccttccttgcagcttgtcgtgcttcgcctccaggaggagtttggtcggt540

gggcgcacgccggcctctttaggggtagagtgtctattccagccttgatggtgagtggtt600

ggatagctagcacatagtctttttttctctttcttgccacttggtgatgttgtattgccg660

cttcggcgttgtactagccttctggctcttcttatttaatcgatgatgcacccgctgggt720

ggcattcttgaaatttttttgagaaaatactcctacaaaggaagtacagtaatttgatac780

acaatgctttctctaaatacgaaaatacaaacatcctaatgttattccaactatgctact840

ccctccgttcctaaactcttatctttgtttttgttcaaatttgtaccaaacaacgacaaa900

aatttagtaacggaggaagtatatatacgaagtgataccaaataaggtgtttctttactt960

gaaagctagttcctctgaggtaaaagaaatgatgaggatcaaggaaggcccatttcttgc1020

cggcacgcagttgccgaagtcagtagatttaaaatgacctcacatactgaagaaggaaag1080

ggaagttaaccacgccattgttgctttagcagaaagcaaccatatcctaattaacatcac1140

agtacacgttgaaacggcagggcacgataattggtgaagactgattccagggagcatcgt1200

ggcacgcaaaaacgcccttgccttgttcccttataaatagtggtgcagaagatacatttg1260

tgatcaccatctcaaagcgcctctttattcccctttcatcttgagcttaagtactagaga1320

aaaattaagg1330

<210>10

<211>1130

<212>dna

<213>二穗短柄草

<400>10

gttcgaaatagatgctagacggcggatcgcttgcgaggcgtgggcttccccaccctgaca60

agtgtcaggagatggagaccatttcccatctactcttggggtgtgtcttggcgaggcagg120

tttgggagcgcttgtgggcggcttggggacacgtggagtgggctccgaatgcggatgcta180

ctctgcgggaatggtggtcttctcttcccttaccacggcgagcccggagggacttccgga240

cggggatcatacttgttctttggaccatttggtgccattggaatgatgtggccttccttg300

cagcttgtcgtgcttcgcctccaggaggagtttggtcggtgggcgcacgccggcctcttt360

aggggtagagtgtctattccagccttgatggtgagtggttggatagctagcacatagtct420

ttttttctctttcttgccacttggtgatgttgtattgccgcttcggcgttgtactagcct480

tctggctcttcttatttaatcgatgatgcacccgctgggtggcattcttgaaattttttt540

gagaaaatactcctacaaaggaagtacagtaatttgatacacaatgctttctctaaatac600

gaaaatacaaacatcctaatgttattccaactatgctactccctccgttcctaaactctt660

atctttgtttttgttcaaatttgtaccaaacaacgacaaaaatttagtaacggaggaagt720

atatatacgaagtgataccaaataaggtgtttctttacttgaaagctagttcctctgagg780

taaaagaaatgatgaggatcaaggaaggcccatttcttgccggcacgcagttgccgaagt840

cagtagatttaaaatgacctcacatactgaagaaggaaagggaagttaaccacgccattg900

ttgctttagcagaaagcaaccatatcctaattaacatcacagtacacgttgaaacggcag960

ggcacgataattggtgaagactgattccagggagcatcgtggcacgcaaaaacgcccttg1020

ccttgttcccttataaatagtggtgcagaagatacatttgtgatcaccatctcaaagcgc1080

ctctttattcccctttcatcttgagcttaagtactagagaaaaattaagg1130

<210>11

<211>1001

<212>dna

<213>二穗短柄草

<400>11

gcttgtgggcggcttggggacacgtggagtgggctccgaatgcggatgctactctgcggg60

aatggtggtcttctcttcccttaccacggcgagcccggagggacttccggacggggatca120

tacttgttctttggaccatttggtgccattggaatgatgtggccttccttgcagcttgtc180

gtgcttcgcctccaggaggagtttggtcggtgggcgcacgccggcctctttaggggtaga240

gtgtctattccagccttgatggtgagtggttggatagctagcacatagtctttttttctc300

tttcttgccacttggtgatgttgtattgccgcttcggcgttgtactagccttctggctct360

tcttatttaatcgatgatgcacccgctgggtggcattcttgaaatttttttgagaaaata420

ctcctacaaaggaagtacagtaatttgatacacaatgctttctctaaatacgaaaataca480

aacatcctaatgttattccaactatgctactccctccgttcctaaactcttatctttgtt540

tttgttcaaatttgtaccaaacaacgacaaaaatttagtaacggaggaagtatatatacg600

aagtgataccaaataaggtgtttctttacttgaaagctagttcctctgaggtaaaagaaa660

tgatgaggatcaaggaaggcccatttcttgccggcacgcagttgccgaagtcagtagatt720

taaaatgacctcacatactgaagaaggaaagggaagttaaccacgccattgttgctttag780

cagaaagcaaccatatcctaattaacatcacagtacacgttgaaacggcagggcacgata840

attggtgaagactgattccagggagcatcgtggcacgcaaaaacgcccttgccttgttcc900

cttataaatagtggtgcagaagatacatttgtgatcaccatctcaaagcgcctctttatt960

cccctttcatcttgagcttaagtactagagaaaaattaagg1001

<210>12

<211>2000

<212>dna

<213>人工序列

<220>

<223>二穗短柄草金属硫蛋白样基因(mtl)启动子的修饰形式

<400>12

tttcgtgtgcttacttggggcttcctttgggcctgcggaagcagacggcgtgccaggtac60

gaggttgttggtggacaatgtggatggacgatttctagcttcgtggaaggcccttctcct120

taagggaggatgactggtgctggtcaagtccaccctgacagcgatgccggtctactcgat180

gatgtcactcgacctttcggacaagatcatcaaaggggtggacaaggtatgtcgtggttt240

cctttggcgtggtcagaaggacgctaaaggggggggggcattgtatggtggcttgggtcg300

tggtgtgttcgccgaccgctttcggtggactcggcgtttccaaatcttcgcatcctccca360

gccttgagggtccgctagaggtggcttgagagggtggacgattccaaacccgatggtcgg420

tttcaaggttgagacgcccagaggtctatgttatctttgaggcggccacttcctctttgg480

tgggcgatggccggacgtttccctcttctggaccgattgttggctgcatggcgtctgttt540

tcgagatgcgttcctgatcctcgtgggccatgtttgccacaagtttttgcttacgcgcac600

agtgcgggaggctctgcatggagcgtggactggcgacatgggtccagacctaaagggaag660

ctactcttgaggacttcactctctgggactggcttcgtggggtccaactggaagaaggga720

gggccgactctcttcattggaactggtgtggtggtgatagttactcggcaaagactgctt780

atgcgaatcttcactggccgcatggttgacccgttagcggctgagagttagggcttcgga840

gaggtgtcgtttcttcgtctggctcgcagttcttgaaatagatgctagacggcggatcgc900

ttgcgaggcgtgggcttccccaccctgacaagtgtcaggagatggagtcgatttcccatc960

tactcttggggtgtgtcttggcgaggcaggtttgggagcgcttgtgggcggcttggggac1020

acgtggagtgggctccgaatgcggatgctactctgcgggaatggtggtctttctcttccc1080

ttaccacggcgagcccggagggacttccggacggggatcatacttgttctttggaccatt1140

tggtgccattggaatgatgtggccttccttgcagcttgtcgtgcttcgcctggaggaatt1200

gtttggtcggtgggcgcacgccggcctctttaggggtagagtgtctattccagccttgat1260

ggtgagtggttggatagctagcacatagtctttttttctctttcttgccacttggtgatg1320

ttgtattgccgcttcggcgttgtactagccttctggctcttcttatttaatgatgatgca1380

cccgctgggtggcattcttgaaatttttttgagaaaatactcctacaaaggaagtacagt1440

aatttgatacacaatgctttctctaaatacgaaaatacaaacatcctaatgttattccaa1500

ctatgctactccctccgttcctaaactcttatctttgtttttgttcaaatttgtaccaaa1560

caacgacaaaaatttagtaacggaggaagtatatatacgaagtgataccaaataaggtgt1620

ttctttacttgaaagctagttcctctgaggtaaaagaaatgatgaggatcaaggaaggcc1680

catttcttgccggcacgcagttgccgaagtcagtagatttaaaatgacctcacatactga1740

agaaggaaagggaagttaaccacgccattgttgctttagcagaaagcaaccatatcctaa1800

ttaacatcacagtacacgttgaaacggcagggcacgataattggtgaagactgattccag1860

ggagcatcgtggcacgcaaaaacgcccttgccttgttcccttataaatagtggtgcagaa1920

gatacatttgtgatcaccatctcaaagcgcctctttattcccctttcatcttgagcttaa1980

gtactagagaaaaattaagg2000

<210>13

<211>264

<212>dna

<213>二穗短柄草

<400>13

gatgcacgcgacgcgctgctgcttgtggtgtgtgtttgtgtgatctcgactgaataaaag60

ggacacggtacatccggggttggttggtgctcgagtcgagtgtgcaaggttgtgtggttt120

gccagctcttggtgtgtgtctccttgtgctcatgtgacttgtgaaaccattaatagtaac180

cactttgtgcttgtgtgtgtgtgggcacctgtgtttctgtaatggtctatctggagtgaa240

tatatacaagacaggtttgcctaa264

<210>14

<211>332

<212>dna

<213>二穗短柄草

<400>14

gatgcacgcgacgcgctgctgcttgtggtgtgtgtttgtgtgatctcgactgaataaaag60

ggacacggtacatccggggttggttggtgctcgagtcgagtgtgcaaggttgtgtggttt120

gccagctcttggtgtgtgtctccttgtgctcatgtgacttgtgaaaccattaatagtaac180

cactttgtgcttgtgtgtgtgtgggcacctgtgtttctgtaatggtctatctggagtgaa240

tatatacaagacaggtttgcctaaccatgccttttccttccttgaggtcatcgcgccaac300

acgaatgacgagaaccaatgatcttaggacta332

<210>15

<211>630

<212>dna

<213>二穗短柄草

<400>15

gatgcacgcgacgcgctgctgcttgtggtgtgtgtttgtgtgatctcgactgaataaaag60

ggacacggtacatccggggttggttggtgctcgagtcgagtgtgcaaggttgtgtggttt120

gccagctcttggtgtgtgtctccttgtgctcatgtgacttgtgaaaccattaatagtaac180

cactttgtgcttgtgtgtgtgtgggcacctgtgtttctgtaatggtctatctggagtgaa240

tatatacaagacaggtttgcctaaccatgccttttccttccttgaggtcatcgcgccaac300

acgaatgacgagaaccaatgatcttaggactatcaaatagacaatataactcagcatgga360

gcaatgtactgctaatgaacggtcctaatcaatacagttgggaagcagtaatcgatggaa420

aacacttcctcagttcagaagggaacatgtagatgggaaagtaaacaggatatatagaca480

catgcagttaggtctaccacaagaagacatgccacaggactaaaaacagaagctgggttt540

ggaacaacttatgcagacgctagctatccagataaaccttagagaaacagctatgagaat600

aagcgtctgaaatttgtagttgcctgtttg630

<210>16

<211>727

<212>dna

<213>二穗短柄草

<400>16

gatgcacgcgacgcgctgctgcttgtggtgtgtgtttgtgtgatctcgactgaataaaag60

ggacacggtacatccggggttggttggtgctcgagtcgagtgtgcaaggttgtgtggttt120

gccagctcttggtgtgtgtctccttgtgctcatgtgacttgtgaaaccattaatagtaac180

cactttgtgcttgtgtgtgtgtgggcacctgtgtttctgtaatggtctatctggagtgaa240

tatatacaagacaggtttgcctaaccatgccttttccttccttgaggtcatcgcgccaac300

acgaatgacgagaaccaatgatcttaggactatcaaatagacaatataactcagcatgga360

gcaatgtactgctaatgaacggtcctaatcaatacagttgggaagcagtaatcgatggaa420

aacacttcctcagttcagaagggaacatgtagatgggaaagtaaacaggatatatagaca480

catgcagttaggtctaccacaagaagacatgccacaggactaaaaacagaagctgggttt540

ggaacaacttatgcagacgctagctatccagataaaccttagagaaacagctatgagaat600

aagcgtctgaaatttgtagttgcctgtttggaatggcttatggacgacaagcttattttc660

tggagtagcctacaagtacaagccaaggcacatgctgttccaaactggcccatattttgc720

acaacca727

<210>17

<211>1000

<212>dna

<213>人工序列

<220>

<223>二穗短柄草金属硫蛋白样基因(mtl)3'–utr的修饰形式

<400>17

gatgcacgcgacgcgctgctgcttgtggtgtgtgtttgtgtgatctcgactgaataaaag60

ggacacggtacatccggggttggttggtgctcgagtcgagtgtgcaaggttgtgtggttt120

gccagctcttggtgtgtgtctccttgtgctcatgtgacttgtgaaaccattaatagtaac180

cactttgtgcttgtgtgtgtgtgggcacctgtgtttctgtaatggtctatctggagtgaa240

tatatacaagacaggtttgcctaaccatgccttttccttccttgaggtcatcgcgccaac300

acgaatgacgagaaccaatgatcttaggactatcaaatagacaatataactcagcatgga360

gcaatgtactgctaatgaacggtcctaatcaatacagttgggaagcagtcagaagggaac420

atgtagatgggaaagtaaacaggatatatagacacatgcagttaggtctaccacaagata480

tatatacaagacaggtttgcctaatccatgccacaggactaaaaacagaagctgggtttg540

gaacaacttatgcagacgctagctatccagataaaccttagagaaacagctatgagaata600

agcgtctgaaatttgtagttgcctgtttggaatggcttatggacgacacgtaattttctg660

gagtagcctacaagtacaagccaaggcacatgctgttccaaactggcccatattttgcac720

aaccaaaggaaaagagacagtgacataagagcatctccagtgattcagtgagatacccca780

aagtcatccaaatgtccgtttcggccgaaatggacatgctggccagaaaaacatctccca840

atgggcgatcccaaatagatattttgtatgttttgtccggcccaatccccaaacatctcc900

taaatttggggcaactttgcggtgtccagtgtccggtgtccgggcccacttctttttctc960

ccaagcgagcatcttcctcccgaagcacgaagcccccgtc1000

<210>18

<211>1001

<212>dna

<213>人工序列

<220>

<223>二穗短柄草金属硫蛋白样基因(mtl)3'–utr的修饰形式

<400>18

gatgcacgcgacgcgctgctgcttgtggtgtgtgtttgtgtgatctcgactgaataaaag60

ggacacggtacatccggggttggttggtgctcgaagttggtgtgcaaggttgtgtggttt120

gccagctcttggtgtgtgtctccttgtgctcatgtgacttgtgaaaccattaatagtaac180

cactttgtgcttgtgtgtgtgtgggcacctgtgtttctgtaatggtctatctggagtgaa240

tatatacaagacaggtttgcctaaccatgccttttccttccttgaggtcatcgcgccaac300

acgaatgacgagaaccaatgatcttaggactatcaaatagacaatataactcagcatgga360

gcaatgtactgctaatgaacggtcctaatcaatacagttgggaagcagtaatgtggaaaa420

cacttcctcagttcagaagggaacatgtagatgggaaagtaaacaggatatatagacaca480

tgcagttaggtctaccacaagacatgccacaggactaaaaacagaagctgggtttggaac540

aacttatgcagactgctatccagataaaccttagagaaacagctatgagaataagcgtct600

gaaatttgtagttgcctgtttggaatggcttatggacgacaatgagtgtattttctggag660

tagcctacaagtacaagccaaggcacatgctgttccaaactggcccatattttgcacaac720

caaaggaaaagagacagtgacataagagcatctccagtgattcagtgagataccccaaag780

tcatccaaatgtccgtttcggccgaaatggacatgctggccagaaaaacatctcccaatg840

ggtctaacaccccaaatagatattttgtatgttttgtccggcccaatccccaaacatctc900

ctaaatttggggcaactttgcggtgtccagtgtccggtgtccgggcccacttctttttct960

cccaagcgagcatcttcctcccgaagcacgaagcccccgtc1001

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1