用于转基因表达的植物启动子和3’UTR的制作方法

文档序号:16995645发布日期:2019-03-02 01:20阅读:1263来源:国知局
用于转基因表达的植物启动子和3’UTR的制作方法

通过提述并入以电子方式提交的材料

通过提述将其完整并入的是与此同时提交的计算机可读核苷酸/氨基酸序列列表,其被标识如下:建立于2016年3月4日的名称为“78827-us-psp-20160126-sequence-listing-st25.txt”的一个21.8kb的acii(文本)文件”。

公开领域

本公开总体上涉及用于促进植物或植物细胞中核苷酸序列转录的组合物和方法。一些实施方案涉及新的玉米(zeamays)grmzm2g047720启动子和其他玉米grmzm2g047720调控元件,其在植物中起作用以促进和/或终止可操作连接的核苷酸序列的转录。特定的实施方案涉及包括启动子的方法(例如,将核酸分子引入细胞)和包含启动子的细胞、细胞培养物、组织、生物体及生物体部分,以及由此产生的产物。其他实施方案涉及包括3’utr的方法(例如,将核酸分子引入细胞)和包含启动子的细胞、细胞培养物、组织、生物体及生物体部分,以及由此产生的产物。

背景

许多植物物种能够以转基因进行转化,以导入农艺学上期望的性状或特征。植物物种经开发和/或修饰为具有特定的期望性状。通常,期望性状例如包括,提高营养价值质量,增加产量,赋予抗虫性或抗病性,增加干旱和胁迫耐受性,提高园艺质量(例如,着色和生长),赋予除草剂耐受性,使得能够从植物生产在工业上有用的化合物和/或材料,和/或使得能够生产药物。在一个实施方案中,通过插入转基因自身或通过表达dna结合蛋白/转录因子提供期望的性状,所述dna结合蛋白/转录因子进而与特异性dna序列结合。

通过植物转化技术来生产包含在单个基因组基因座处叠加的多个转基因的转基因植物物种。植物转化技术导致转基因引入植物细胞中、在植物基因组中含有转基因的稳定整合拷贝的能育转基因植物的恢复,并且通过植物基因组的转录和翻译的后续转基因表达产生具有期望性状和表型的转基因植物。然而,能够产生高表达多个转基因的转基因植物物种的机制是期望的,所述多个转基因以性状叠加的方式被工程化改造。

同样,能够在植物的特定组织或器官内表达转基因的机制是期望的。例如,可以借助于土-传病原体通过用病原体-抗性基因转化植物基因组使得病原体-抗性蛋白在植物的根内强表达而实现植物对感染的抵抗力增加。或者,可能希望在处于特定的生长或发育阶段(例如像细胞分裂或伸长)的植物组织中表达转基因。此外,可能希望在植物的叶和茎组织中表达转基因,以提供对除草剂的耐受性、或对地表昆虫和害虫的抗性。

因此,需要能够在特定植物组织中驱动期望的转基因表达水平的新的基因调控元件。

简述

在本主题公开的实施方案中,本主题公开涉及包含启动子的核酸载体,所述启动子与多接头序列、非grmzm2g047720基因或多接头序列和非grmzm2g047720基因的组合可操作连接,其中所述启动子包含与seqidno:1具有至少90%序列同一性的多核苷酸序列。在这个实施方案的方面,启动子的长度为2,065bp。进一步的实施方案包括由与seqidno:1具有至少90%序列同一性的多核苷酸序列组成的启动子。在其他方面,启动子与可选择标志物可操作连接。在另外的方面,启动子与转基因可操作连接。示例性转基因包括:可选择标志物或赋予杀虫抗性、除草剂耐受性、氮利用效率、小rna表达、位点特异性核酸酶、水分利用效率、营养品质或dna结合蛋白的基因产物。在进一步的方面,核酸载体包含与seqidno:5具有至少90%序列同一性的3'非翻译多核苷酸序列,其中3'非翻译序列与所述多接头或所述转基因可操作连接。在其他方面,核酸载体包含5'非翻译多核苷酸序列,其中5'非翻译序列与所述多接头或所述转基因可操作连接。在进一步的方面,核酸载体包含内含子序列。本公开的启动子进一步驱动叶组织中的转基因表达。

在本主题公开进一步的实施方案中,本公开涉及包含与转基因可操作连接的与seqidno:1具有至少90%序列同一性的多核苷酸序列的非玉米栽培种b73植物。在这个实施方案的一个方面,植物选自下组:小麦、水稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、拟南芥属、烟草、向日葵、和卡诺拉。在另一个方面,植物是玉米植物。在进一步的方面,将转基因插入植物的基因组中。在其他实施方案中,与seqidno:1具有至少90%序列同一性的多核苷酸序列是启动子。在另一个方面,植物包含含有seqidno:5的3'非翻译序列,其中3'非翻译序列与所述转基因可操作连接。在进一步的方面,启动子驱动叶组织的转基因表达。在这些实施方案的另外方面,启动子的长度为2,065bp。

在本主题公开的其他实施方案中,提供了用于产生转基因植物细胞的方法。所述方法包括下列步骤:用包含与至少一个感兴趣的多核苷酸序列可操作连接的玉米grmzm2g047720启动子的基因表达盒转化植物细胞;分离包含所述基因表达盒的转化植物细胞;以及,产生包含与至少一个感兴趣的多核苷酸序列可操作连接的玉米grmzm2g047720启动子的转基因植物细胞。在这个实施方案的一个方面,用植物转化方法进行植物细胞的转化。植物转化方法选自下列转化方法中的任一种:土壤杆菌介导的转化法、基因枪转化法、碳化硅转化法、原生质体转化法、和脂质体转化法。在进一步的方面,感兴趣的多核苷酸序列优先在地上组织中表达。在另外的方面,感兴趣的多核苷酸序列稳定整合到转基因植物细胞的基因组中。在另外的方面,所述方法进一步包括以下步骤:将转基因植物细胞再生成转基因植物,并获得转基因植物,其中所述转基因植物包括包含与至少一个感兴趣的多核苷酸序列可操作连接的权利要求1的玉米grmzm2g047720启动子的基因表达盒。在所述实施方案的另一个方面,所述转基因植物细胞是单子叶转基因植物细胞或双子叶转基因植物细胞。因此,双子叶转基因植物细胞可以是拟南芥植物细胞、烟草植物细胞、大豆植物细胞、卡诺拉植物细胞和棉花植物细胞。同样,单子叶植物转基因植物细胞可以是玉米植物细胞、水稻植物细胞和小麦植物细胞。在其他方面,玉米grmzm2g047720启动子包含多核苷酸seqidno:1。在一个方面,所述实施方案包括与seqidno:1的3'端可操作连接的第一感兴趣的多核苷酸序列。

本主题公开进一步涉及用于在植物细胞中表达感兴趣的多核苷酸序列的方法,所述方法包括将与玉米grmzm2g047720启动子可操作连接的感兴趣的多核苷酸序列引入植物细胞中。在这个实施方案的一个方面,通过植物转化方法将与玉米grmzm2g047720启动子可操作连接的感兴趣的多核苷酸序列引入植物细胞中。在一个另外的方面,植物转化方法选自土壤杆菌介导的转化法、基因枪转化法、碳化硅转化法、原生质体转化法、和脂质体转化法。在进一步的方面,感兴趣的多核苷酸序列在整个植物细胞中呈组成型表达。仍然在其他方面,感兴趣的多核苷酸序列稳定整合到植物细胞的基因组中。在一个实施方案中,转基因植物是单子叶植物细胞或双子叶植物细胞。因此,双子叶植物细胞包括拟南芥植物细胞、烟草植物细胞、大豆植物细胞、卡诺拉植物细胞和棉花植物细胞。同样,单子叶植物细胞包括玉米植物细胞、水稻植物细胞和小麦植物细胞。

本主题公开进一步涉及包含玉米grmzm2g047720启动子的转基因植物细胞。在这个实施方案的一个方面,转基因植物细胞包含转基因事件。在其他方面,转基因事件包括农艺性状。示例性转基因性状包括杀虫抗性性状、除草剂耐受性性状、氮利用效率性状、水分利用效率性状、营养品质性状、dna结合性状、可选择标志物性状、小rna性状或其任何组合。在一个实施方案中,除草剂耐受性性状包括aad-1编码序列。在其他方面,转基因植物细胞产生商品。例如,所述商品可以是蛋白质浓缩物、蛋白质分离物、籽粒、粗粉、面粉、油或纤维。在进一步的方面,转基因植物细胞选自双子叶植物细胞或单子叶植物细胞。例如,单子叶植物细胞可以是玉米植物细胞。在其他方面,玉米grmzm2g047720启动子包含与多核苷酸seqidno:1具有至少90%序列同一性的多核苷酸。在进一步的方面,玉米grmzm2g047720启动子的长度为2,065bp。在又另一个方面,玉米grmzm2g047720启动子包含与seqidno:1具有至少90%序列同一性的多核苷酸序列。进一步的方面包括与seqidno:1的3'端可操作连接的第一感兴趣的多核苷酸序列。在一个另外的方面,农艺性状优先在叶组织中表达。

本主题公开进一步涉及包含与多核苷酸seqidno:1具有至少90%序列同一性的核酸序列的分离的多核苷酸。在这个实施方案的一个方面,分离的多核苷酸在叶组织中具有优先表达。在其他方面,分离的多核苷酸在植物细胞内具有表达活性。在进一步的方面,分离的多核苷酸包含编码多肽的开放阅读框多核苷酸;和终止序列。在一个另外的方面,多核苷酸seqidno:1的长度为2,065bp。

根据下面参考附图展开的若干实施方案的详细说明,能够更清楚地了解前述特征和其他特征。

附图简述

图1:这个图是pdab108739的示意图,pdab108739含有在驱动cry3ab1转基因表达的基因表达盒中的具有seqidno:1的玉米grmzm2g047720启动子和具有seqidno:5的玉米grmzm2g0477203’utr。

发明详述

i.若干实施方案概述

转基因植物产品的开发变得日益复杂。现在,对于商业上可行的转基因植物,需要将多个转基因叠加到单基因座中。用于基础研究或生物技术应用的植物启动子通常是单向的,其仅仅指导融合在其3’端(下游)的一个基因。用于基础研究或生物技术应用的植物3’utr通常是单向的,其仅仅终止融合在其5’端(上游)的一个基因的表达。因此,每个转基因通常需要用于表达的启动子和用于终止表达的3'utr,其中需要多个启动子和3'utr来表达在一个基因叠加内的多个转基因。随着基因叠加中转基因数量的增加,常规使用相同的启动子和3'utr来获得不同转基因的表达模式的相似水平。获得转基因表达的相似水平对于产生单一多基因性状是必需的。不幸的是,已知由相同的启动子和3’utr驱动的多基因构建体引起基因沉默,从而产生在该领域中不十分有效的转基因产品。重复的启动子和3’utr元件可导致基于同源性的基因沉默。另外,在转基因内的重复序列可能导致基因基因座内同源重组,从而导致多核苷酸重排。转基因的沉默和重排将很可能对产生的转基因植物表达转基因的性能具有不良影响。此外,由于启动子重复导致的转录因子(tf)结合位点的过量可引起内源tf的消耗,从而导致转录失活。鉴于对于代谢工程和性状叠加而言需要将多个基因引入植物中,需要多个启动子和3'utr来开发驱动多个基因表达的转基因作物。

在启动子鉴定中的特殊问题是,需要鉴定与植物中的具体细胞类型、发育阶段和/或功能有关的在其他植物组织中不表达的组织-特异性启动子。组织特异性(即,组织优选的)或器官特异性启动子驱动某些组织中(如植物的籽粒、根、叶或绒毡层中)的基因表达。根据观察在特定组织中或在植物发育过程中的特定时期表达的基因的表达,可以初步鉴定出组织和发育阶段特异性启动子。这些组织特异性启动子在转基因植物行业中对于某些应用是需要的和期望的,因为它们允许异源基因以组织和/或发育阶段选择性方式特异性表达,表明异源基因在不同的器官、组织和/或时间有差别地表达,而不是在其他组织中表达。例如,可以借助于土-传病原体通过用病原体-抗性基因转化植物基因组使得病原体-抗性蛋白在植物的根内强表达而实现植物对感染的抵抗力增加。或者,可能希望在处于特定的生长或发育阶段(例如像细胞分裂或伸长)的植物组织中表达转基因。另一种应用是使用组织特异性启动子的需要,以将编码农艺性状的转基因的表达局限在特定的组织类型中,如发育的薄壁组织细胞中。正因为如此,在启动子鉴定中的特殊问题是如何鉴定启动子以及如何将鉴定的启动子与用于特异性组织表达的细胞的发育特性相关联。

关于鉴定启动子或3’utr的另一个问题是要求克隆所有相关的顺式-作用和反式激活转录控制元件,使得克隆的dna片段以想要的特异性表达模式驱动转录。鉴于这样的控制元件位于翻译起始或开始位点的远侧,将多核苷酸的大小选择为包含启动子对于提供启动子多核苷酸序列的表达水平和表达模式是重要的。鉴于用于终止3'utr的类似元件位于翻译终止或停止位点的远侧,将多核苷酸的大小选择为包含3'utr对于提供由多核苷酸序列编码的转基因的表达的终止是重要的。已知启动子和3'utr的长度包括功能信息,并且已显示不同的基因比基因组中其他基因的启动子具有更长或更短的启动子。阐明启动子的转录起始位点和预测启动子区中的功能基因元件是具有挑战性的。进一步增加挑战性的是调控基序及顺式和反式调控元件的复杂性、多样性和固有的简并性质(blanchette,mathieu等人,"genome-widecomputationalpredictionoftranscriptionalregulatorymodulesrevealsnewinsightsintohumangeneexpression."genomeresearch16.5(2006):656-668)。顺式和反式调控元件位于启动子的远端部分,其调节基因的空间和时间表达仅在所需位点和特定时间发生(porto,milenasilva等人,"plantpromoters:anapproachofstructureandfunction."molecularbiotechnology56.1(2014):38-49)。现有的启动子分析工具不能可靠地鉴定基因组序列中的这种顺式调控元件,因此预测太多的假阳性,因为这些工具通常只关注序列内容(fickettjw,hatzigeorgiouag(1997)eukaryoticpromoterrecognition.genomeresearch7:861–878)。因此,启动子调控元件的鉴定要求获得具有特定大小的适当序列,其将导致以期望的方式驱动可操作连接的转基因的表达。此外,3'utr调控元件的鉴定要求获得具有特定大小的适当序列,其将导致以期望的方式终止可操作连接的转基因的表达。

提供了通过使用玉米grmzm2g047720启动子元件和其他玉米grmzm2g047720调控元件来克服这样的问题以便在植物中表达转基因的方法和组合物。

ii.术语和缩写

在整个申请中,使用了许多术语。为了提供对说明书和权利要求书的清楚且一致的理解,包括要赋予此类术语的范围,提供了以下定义。

如本文中使用的,术语“内含子”是指包含在基因(或表达的感兴趣的多核苷酸序列)中的被转录但不被翻译的任何核酸序列。内含子包括表达的dna序列之内的非翻译核酸序列、以及从所述dna序列转录的rna分子中的相应序列。本文中描述的构建体还可以含有增强翻译和/或mrna稳定性的序列,如内含子。一个这样的内含子的实例是拟南芥组蛋白h3变体的基因ii的第一内含子或任何其他公知的内含子序列。内含子可与启动子序列联合用于增强翻译和/或mrna稳定性。

如本文中使用的术语“分离的”意指当化合物最初形成时已经从其自然环境中移除,或者已经从存在的其他化合物中移除。术语“分离的”包括从天然来源分离的物质以及通过在宿主细胞中重组表达制备之后回收的物质(例如,核酸和蛋白质),或化学合成的化合物,如核酸分子、蛋白质、和肽类。

如本文中使用的术语“纯化的”涉及分子或化合物的分离,所述分子或化合物处于基本上不含污染物(通常与天然或自然环境中的所述分子或化合物相关)的形式,或相对于在所述化合物最初形成时存在的其他化合物在浓度上高度富集,并且意指作为从原始组成的其他组分分离的结果在纯度上已经增加。术语“纯化的核酸”在本文中用来描述已经从其他生物化合物(包括但不限于,多肽、脂质和碳水化合物)分离、分开产生、或纯化出来,同时影响组分的化学或功能变化的核酸序列(例如,通过移除蛋白质污染物并使连接所述核酸与染色体中的其余dna的化学键断裂,可将核酸从染色体中纯化出来)。

如本文中使用的,术语“合成的”是指通过作为体外过程的化学合成产生的多核苷酸(即dna或rna)分子。例如,可以在eppendorftm管内的反应过程中产生合成dna,从而由dna或rna的天然链以酶促方式产生合成dna。可以使用其他实验室方法来合成多核苷酸序列。可以使用亚磷酰胺通过固相合成在寡核苷酸合成仪上化学合成寡核苷酸。合成的寡核苷酸可以退火到彼此之上成为复合物,从而产生“合成的”多核苷酸。用于化学合成多核苷酸的其他方法是本领域已知的,并且可以容易地实施以便用于本公开中。

如本文中使用的术语“大约”意指比陈述的值或值的范围大或小10%,但不意图针对仅仅这个更宽的定义指定任何值或值的范围。在每个值或值的范围之前的术语“大约”同样意图涵盖所陈述的绝对值或值的范围的实施方案。

就本公开的目的而言,“基因”包括编码基因产物(如上所述)的dna区域,也包括调节基因产物的产生的所有dna区域,无论这类调控序列是否位于编码和/或转录序列的附近。因此,基因包括而不必限于,启动子序列、终止子、翻译调节序列(如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、隔离子、边界元件、复制起点、核基质附着位点和基因座控制区。

如本文中使用的术语“天然的”或“自然的”定义了在自然界中发现的状况。“天然dna序列”是通过自然手段或传统育种技术产生的而不是通过基因工程(例如,使用分子生物学/转化技术)产生的存在于自然界中的dna序列。

如本文中使用的“转基因”定义为编码基因产物(包括,例如但不限于mrna)的核酸序列。在一个实施方案中,转基因为外源核酸,其中转基因序列已通过基因工程被引入通常在其中未发现所述转基因的宿主细胞(或其后代)中。在一个实例中,转基因编码在工业上或药学上有用的化合物、或编码期望的农艺性状的基因(例如,除草剂抗性基因)。在又另一个实例中,转基因为反义核酸序列,其中所述反义核酸序列的表达抑制靶核酸序列的表达。在一个实施方案中,转基因为内源核酸,其中所述内源核酸的额外基因组拷贝是期望的,或者为相对于宿主生物中的靶核酸序列处于反义取向的核酸。

如本文中使用的,术语“非grmzm2g047720转基因”或“非grmzm2g047720基因”是与grmzm2g047720基因编码序列(seqidno:4)具有小于80%序列同一性的任何转基因。

如本文中定义的“基因产物”是由基因产生的任何产物。例如,基因产物可以是基因直接转录的产物(例如,mrna、trna、rrna、反义rna、干扰rna、核酶、结构rna或任何其他类型的rna)或mrna翻译产生的蛋白质。基因产物还包括通过诸如加帽、多聚腺苷酸化、甲基化和编辑等过程修饰过的rna,以及通过例如,甲基化、乙酰化、磷酸化、泛素化、adp核糖基化、豆蔻酰化(myristilation)和糖基化修饰的蛋白质。基因表达可能受到外部信号的影响,例如细胞、组织、或生物暴露于增加或降低基因表达的物质。基因表达也可以在从dna到rna再到蛋白质的途径中的任何位置受到调节。例如,通过控制对转录、翻译、rna运输和加工、中间分子比如mrna的降解的作用,或通过在特异性蛋白分子已经产生之后的活化、失活、区室化、或降解,或它们的组合,由此发生基因表达的调节。通过本领域已知的任何方法,包括但不限于,northern印迹、rt-pcr、western印迹,或体外、原位或体内蛋白活性测定,可以在rna水平或蛋白质水平测量基因表达。

如本文中使用的,术语“基因表达”涉及这样的过程,通过该过程,核酸转录单元(包括,例如基因组dna)的编码信息被转化为细胞的操作部分、非操作部分、或结构部分(常常包括蛋白质的合成)。基因表达可能受到外部信号的影响,例如细胞、组织、或生物暴露于增加或降低基因表达的物质。基因表达也可以在从dna到rna再到蛋白质的途径中的任何位置受到调节。例如,通过控制对转录、翻译、rna运输和加工、中间分子比如mrna的降解的作用,或通过在特异性蛋白分子已经产生之后的活化、失活、区室化、或降解,或它们的组合,由此发生基因表达的调节。通过本领域已知的任何方法,包括但不限于,northern印迹、rt-pcr、western印迹,或体外、原位或体内蛋白活性测定,可以在rna水平或蛋白质水平测量基因表达。

如本文中使用的,术语“基于同源性的基因沉默”(hbgs)为通用术语,其包括转录基因沉默和转录后基因沉默两者。通过未连接的沉默基因座使靶基因座沉默可由于转录抑制(转录基因沉默;tgs)或mrna降解(转录后基因沉默;ptgs)所致,原因在于产生分别对应于启动子或转录序列的双链rna(dsrna)。在每个过程中涉及不同的细胞组分表明,dsrna诱导的tgs和ptgs很可能是由于古老的普遍机制的多样化所致。然而,由于通常依赖于分析不同的沉默基因座,已经难于实现tgs和ptgs的严格比较。在一些情况下,由于产生对应于启动子和不同靶基因的转录序列的dsrna,单个转基因基因座能够触发tgs和ptgs两者。mourrain等人,(2007)planta225:365-79。sirna很可能是在同源序列上触发tgs和ptgs的实际分子:sirna在这个模型中将通过转基因序列的甲基化扩散到内源启动子中来触发顺式和反式同源序列的沉默和甲基化。

如本文中使用的,术语“核酸分子”(或“核酸”、或“多核苷酸”)可以是指核苷酸的聚合形式,其可包括rna的正义和反义链、cdna、基因组dna、和合成形式,以及上述的混合聚合物。核苷酸可以是指核糖核苷酸、脱氧核糖核苷酸、或这两种类型核苷酸的任一者的修饰形式。如本文中使用的“核酸分子”与“核酸”和“多核苷酸”是同义词。除非另外指明,核酸分子的长度通常为至少10个碱基。该术语可以指具有不确定长度的rna或dna分子。该术语包括dna的单和双链形式。核酸分子可以包括天然存在的核苷酸和/或修饰核苷酸,它们通过天然存在和/或非天然存在的核苷酸连接而连接在一起。

本领域技术人员易于理解,核酸分子可被化学修饰或生物化学修饰,或者可以含有非天然的或衍生的核苷酸碱基。这样的修饰包括,例如,标记物、甲基化、用类似物取代一个或多个天然存在的核苷酸、核苷酸间修饰(例如,如不带电连接(unchargedlinkage)的修饰:例如甲基膦酸盐、磷酸三酯、亚磷酰胺、氨基甲酸酯等;带电连接(chargedlinkage)的修饰:例如,硫代磷酸酯、二硫代磷酸酯等;悬垂部分的修饰:例如肽类;嵌入剂修饰:例如吖啶、补骨脂素等;螯合剂修饰;烷化剂(alkylator)修饰;和修饰的连接:例如α异头核酸等)。术语“核酸分子”还包括任何拓扑结构,包括单链的、双链的、部分双链体的、三链体的、发夹形的(hairpinned)、圆形的、和挂锁形的结构。

转录以5′到3′的方式沿着dna链行进。这表明通过向生长链的3′端连续添加5′-核糖核苷三磷酸而产生rna(消除焦磷酸盐必不可少)。在线性或环状核酸分子中,如果离散元件以从另一个元件的5′方向结合到或将要结合到同一核酸上,则所述离散元件(例如,特定的核苷酸序列)可被称为相对于所述另一个元件的“上游”或“5′”。类似地,如果离散元件以从另一个元件的3′方向结合到或将要结合到同一核酸上,则所述离散元件可为相对于所述另一个元件的“下游”或“3′”。

如本文中使用的,碱基“位置”是指在指定核酸之内的给定碱基或核苷酸残基的位置。可通过与参考核酸的比对(参见下文)定义指定核酸。

杂交涉及两条多核苷酸链通过氢键结合。寡核苷酸及其类似物通过互补碱基之间的氢键杂交,所述氢键包括watson-crick、hoogsteen或反hoogsteen氢键。通常,核酸分子由含氮碱基组成,所述碱基为嘧啶(胞嘧啶(c)、尿嘧啶(u)和胸腺嘧啶(t))或嘌呤(腺嘌呤(a)和鸟嘌呤(g))。这些含氮碱基在嘧啶和嘌呤之间形成氢键,并且嘧啶对嘌呤的键合被称为“碱基配对”。更具体地说,a会与t或u键合,而g会与c键合。“互补”指在两条不同的核酸序列或同一核酸序列的两个不同区域之间发生的碱基配对。

“可特异性杂交”和“特异性互补”为表明互补性的足够程度的术语,该互补性使得在寡核苷酸与dna或rna靶之间发生稳定且特异的结合。寡核苷酸不必100%与其可特异性杂交的靶序列互补。当寡核苷酸与靶dna或rna分子的结合干扰了dna或rna的正常功能时,所述寡核苷酸是可特异性杂交的,并且存在足够的互补程度,以避免在期望特异性结合的条件下(例如在体内测定或系统情形的生理条件下)的寡核苷酸与非靶序列的非特异性结合。这样的结合被称为特异性杂交。

导致特定严格程度的杂交条件会根据选择的杂交方法的性质和杂交的核酸序列的组成和长度而变化。通常,杂交温度和杂交缓冲液的离子强度(尤其是na+和/或mg2+浓度)有助于杂交的严格性,尽管洗涤时间也影响严格性。关于得到特定严格程度所需要的杂交条件的计算论述于sambrook等人(编),molecularcloning:alaboratorymanual,第2版,1-3卷,coldspringharborlaboratorypress,coldspringharbor,newyork,1989,第9章和第11章中。

如本文中使用的,“严格条件”涵盖的条件为,在这样的条件下,只有当杂交分子与dna靶之间的错配小于50%时才发生杂交。“严格条件”包括进一步的特定严格性水平。因此,如本文中使用的,“中等严格性”条件为具有大于50%的序列错配的分子不会杂交的条件;“高严格性”条件为具有大于20%错配的分子不会杂交的条件;并且“极高严格性”条件为具有大于10%错配的序列不会杂交的条件。

在具体实施方案中,严格条件可包括:在65℃杂交,然后在65℃用0.1xssc/0.1%sds洗涤40分钟。

以下是代表性的非限制性杂交条件:

极高严格性:在5xssc缓冲液中在65℃杂交16小时;在2xssc缓冲液中在室温下洗涤两次,每次15分钟;并且在0.5xssc缓冲液中在65℃洗涤两次,每次20分钟。

高严格性:在5x-6xssc缓冲液中在65-70℃杂交16-20小时;在2xssc缓冲液中在室温下洗涤两次,每次5-20分钟;并且在1xssc缓冲液中在55-70℃洗涤两次,每次30分钟。

中等严格性:在6xssc缓冲液中在室温到55℃杂交16-20小时;在2x-3xssc缓冲液中在室温到55℃洗涤至少两次,每次20-30分钟。

在具体实施方案中,可特异性杂交的核酸分子可在极高严格性杂交条件下保持结合。在这些和进一步的实施方案中,可特异性杂交的核酸分子可在高严格性杂交条件下保持结合。在这些和进一步的实施方案中,可特异性杂交的核酸分子可在中等严格性杂交条件下保持结合。

寡核苷酸:寡核苷酸是一种短的核酸聚合物。寡核苷酸可通过切割较长核酸区段、或通过使单独的核苷酸前体聚合而形成。自动合成仪能够合成在长度上高达几百个碱基对的寡核苷酸。由于寡核苷酸可与互补的核苷酸序列结合,它们可用作检测dna或rna的探针。由dna组成的寡核苷酸(寡脱氧核糖核苷酸)可用于pcr中,pcr为用于扩增小dna序列的技术。在pcr中,寡核苷酸一般被称为“引物”,其允许dna聚合酶延伸寡核苷酸并复制互补链。

如本文中使用的,在两个核酸或多肽序列的情况下,如本文中使用的术语“序列同一性”或“同一性”可以是指在指定比较窗口上比对最大对应性时在这两个序列中相同的残基。

如本文中使用的,术语“序列同一性百分比”可以是指通过在比较窗口上比较两个最优比对序列(例如核酸序列和氨基酸序列)确定的值,其中在该比较窗口中的序列部分可以包含相比于参考序列(不包含添加或缺失)的添加或缺失(即,空位),用于这两个序列的最优比对。通过确定相同核苷酸或氨基酸残基出现在两个序列中的位置的数目而产生匹配位置的数目,用该匹配位置的数目除以比较窗口中的位置的总数,将结果乘以100而产生序列同一性的百分比,从而计算出该百分比。

用于比较的序列比对方法是本领域技术人员熟知的。各种程序和比对算法例如描述于smith和waterman(1981)adv.appl.math.2:482;needleman和wunsch(1970)j.mol.biol.48:443;pearson和lipman(1988)proc.natl.acad.sci.u.s.a.85:2444;higgins和sharp(1988)gene73:237-44;higgins和sharp(1989)cabios5:151-3;corpet等人(1988)nucleicacidsres.16:10881-90;huang等人(1992)comp.appl.biosci.8:155-65;pearson等人(1994)methodsmol.biol.24:307-31;tatiana等人(1999)femsmicrobiol.lett.174:247-50。序列比对方法和同源性计算的详细考虑事项可见于例如altschul等人(1990)j.mol.biol.215:403-10。

可在几个来源访问美国国家生物技术信息中心(ncbi)基本局部比对搜索工具(blasttm;altschul等人(1990)),包括美国国家生物技术信息中心(bethesda,md)、以及在互联网上,其与几种序列分析程序结合使用。怎样使用该程序确定序列同一性的描述可在互联网的blasttm的“帮助”部分获得。为了比较核酸序列,可以采用利用默认参数的blasttm(blastn)程序的“blast2序列”功能。在用这种方法评估时,与参考序列具有较大相似性的核酸序列将显示出同一性百分比的增加。

如本文中使用的,术语“可操作连接”涉及与第二核酸序列可操作连接的第一核酸序列,此时第一核酸序列处于与第二核酸序列的功能关系中。例如,当启动子影响编码序列的转录或表达时,则该启动子与该编码序列是可操作连接的。当以重组方式产生时,可操作连接的核酸序列通常是连续的,并且在这种情况下必需将两个蛋白质编码区连接在同一个阅读框内。然而,元件不必是连续地可操作连接的。

如本文中使用的,术语“启动子”是指通常位于基因上游(朝向基因的5’区)并且对于启动和驱动基因转录是需要的dna区域。启动子可容许它所控制的基因的正确激活或阻抑。启动子可含有被转录因子识别的特异性序列。这些因子可与启动子dna序列结合,导致rna聚合酶的募集,所述rna聚合酶为从基因的编码区合成rna的酶。启动子通常是指位于基因上游的所有基因调控元件,包括上游启动子、5’utr、内含子、和前导序列。

如本文中使用的,术语“上游-启动子”是指足以指导转录起始的连续多核苷酸序列。如本文中使用的,上游-启动子涵盖具有若干序列基序的转录起始位点,所述序列基序包括tata盒、起始序列、tfiib识别元件和其他启动子基序(jennifer,e.f.等人,(2002)genes&dev.,16:2583-2592)。该上游启动子对rna聚合酶ii提供作用位点,所述rna聚合酶ii为具有像tfiia、b、d、e、f和h的基础或通用转录因子的多-亚基酶。这些因子组装成转录前起始复合物,所述转录前起始复合物催化从dna模板到rna的合成。

上游-启动子的激活是通过另外的调控性dna序列元件的序列完成的,其中各种蛋白质结合到调控性dna序列元件上并且随后与转录起始复合物相互作用而激活基因表达。这些基因调控元件序列与特异性dna-结合因子相互作用。这些序列基序有时可称为顺式-元件。组织-特异性或发育-特异性转录因子与之结合的这样的顺式-元件可单独地或联合地在转录水平决定启动子的时空表达模式。这些顺式-元件在它们在可操作连接的基因上发挥作用的控制类型方面变化很大。一些元件响应于环境反应(例如,温度、湿度、和伤害)起作用而增加可操作-连接的基因的转录。其他的顺式-元件可响应于发育线索(例如,萌发、种子成熟、和开花)或响应于空间信息(例如,组织特异性)。参见,例如,langridge等人,(1989)proc.natl.acad.sci.usa86:3219-23。这些顺式-元件位于转录起始位点的不同距离,一些顺式-元件(称作近端元件)邻近最小核心启动子区,而其他元件可定位在启动子(增强子)的上游或下游几千个碱基处。

如本文中使用的,术语“5’非翻译区”或“5’utr”或“5’utr”定义为前mrna或成熟mrna的5’端中的非翻译区段。例如,在成熟mrna上,5’utr一般在其5’端上包含7-甲基鸟苷帽并涉及许多过程,如剪接、多腺苷酸化、mrna朝向细胞质输出、通过翻译机器的mrna的5’端的识别、以及保护mrna免于降解。

如本文中使用的,术语“转录终止子”定义为前mrna或成熟mrna的3’端中的转录区段。例如,超过“多腺苷酸化信号”位点的更长dna段被转录为前mrna。这个dna序列常常含有用于将前mrna正确加工为成熟mrna的转录终止信号。

如本文中使用的,术语“3’非翻译区”或“3’utr”或“3’utr”定义为前mrna或成熟mrna的3’端中的非翻译区段。例如,在成熟mrna上,这个区域包含多聚(a)尾并且已知其在mrna稳定性、翻译起始、和mrna输出中具有多种作用。另外,3’utr被认为包括多腺苷酸化信号和转录终止子。

如本文中使用的,术语“多腺苷酸化信号”指示存在于mrna转录物中的核酸序列,当存在多聚(a)聚合酶时,所述核酸序列允许在例如位于多聚(a)信号的下游的10到30个碱基的多腺苷酸化位点上进行转录物的多腺苷酸化。许多多腺苷酸化信号在本领域是已知的并可用于本发明。示例性序列包括aauaaa及其变体,正如描述于lokej.等人,(2005)plantphysiology138(3);1457-1468。

“dna结合转基因”是编码dna结合蛋白的多核苷酸编码序列。随后,dna结合蛋白能够与另一个分子结合。结合蛋白可与例如dna分子(dna-结合蛋白)、rna分子(rna-结合蛋白)和/或蛋白质分子(蛋白质-结合蛋白)结合。在蛋白质-结合蛋白的情况下,它可与自身结合(形成同二聚体、同三聚体,等)和/或它可与一个或多个不同的蛋白质分子结合。结合蛋白可具有超过一种类型的结合活性。例如,锌指蛋白具有dna-结合、rna-结合和蛋白质-结合的活性。

dna结合蛋白的实例包括:大范围核酸酶、锌指、crispr和tale结合结构域,其可被“工程改造”为与预定的核苷酸序列结合。工程改造的dna结合蛋白(例如,锌指、crispr、或tale)一般是非-天然存在的蛋白质。用于工程改造dna-结合蛋白的方法的非-限制性实例是设计和选择。设计的dna结合蛋白是非自然界产生的蛋白质,其设计/组成主要来自合理标准(rationalcriteria)。设计的合理标准包括应用替代规则和计算机化算法,加工储存现有zfp、crispr、和/或tale设计和结合数据信息的数据库中的信息。参见,例如,美国专利6,140,081;6,453,242;和6,534,261;还参见wo98/53058;wo98/53059;wo98/53060;wo02/016536和wo03/016496和美国公开文本no.20110301073、20110239315和20119145940。

“锌指dna结合蛋白”(或结合结构域)是一种蛋白质,或一种更大蛋白质内的结构域,其通过一个或多个锌指以序列-特异性的方式结合dna,所述锌指是结合结构域内的氨基酸序列区域,其结构通过与锌离子的配位而稳定化。术语锌指dna结合蛋白通常简称为锌指蛋白或zfp。锌指结合结构域可被“工程改造”为与预定的核苷酸序列结合。用于工程改造锌指蛋白的方法的非-限制性实例是设计和选择。设计的锌指蛋白是非自然界产生的蛋白质,其设计/组成主要来自合理标准(rationalcriteria)。设计的合理标准包括应用替代规则和计算机化算法,加工储存现有zfp设计和结合数据信息的数据库中的信息。参见,例如,美国专利no.6,140,081;6,453,242;6,534,261和6,794,136;还参见wo98/53058;wo98/53059;wo98/53060;wo02/016536和wo03/016496。

在其他实例中,一种或多种核酸酶的dna-结合结构域包含天然存在的或工程改造的(非-天然存在的)tal效应子dna结合结构域。参见,例如,美国专利公开文本no.20110301073,通过提述将其完整并入本文。已知黄单胞菌属的植物病原菌在重要作物中引起许多疾病。黄单胞菌属的致病性依赖于保守的iii型分泌(t3s)系统,其将多于25种不同的效应子蛋白注入植物细胞中。这些注入的蛋白质为转录激活子-样(talen)效应子,其模拟植物转录激活子并操纵植物转录组(参见kay等人,(2007)science318:648-651)。这些蛋白质含有dna结合结构域和转录活化结构域。最充分表征的tal-效应子之一是来自野油菜黄单胞菌疱病致病变种的avrbs3(参见bonas等人,(1989)molgengenet218:127-136和wo2010079430)。tal-效应子含有串联重复序列的集中域,每个重复序列大致含34个氨基酸,所述氨基酸对于这些蛋白质的dna结合特异性是关键的。另外,它们含有核定位序列和酸性转录活化域(对于评论参见schornacks等人,(2006)jplantphysiol163(3):256-272)。另外,在植物病原细菌青枯劳尔氏菌中,已经发现在青枯劳尔氏菌生物型菌株gmi1000和生物型4菌株rs1000中的命名为brg11和hpx17的两个基因与黄单胞菌属avrbs3家族同源(参见heuer等人,(2007)applandenviromicro73(13):4379-4384)。这些基因在核苷酸序列上彼此有98.9%相同,但是因在hpx17的重复结构域中的1,575bp的缺失而不同。然而,两种基因产物都具有与黄单胞菌属avrbs3家族蛋白小于40%的序列同一性。参见,例如,美国专利公开文本no.20110301073,通过提述将其完整并入。

这些tal效应子的特异性取决于在串联重复序列中发现的序列。重复序列大致包含102bp,并且重复序列彼此之间一般具有91-100%的同源性(bonas等人,同前)。重复序列的多态性常常位于位置12和13处,并且在位置12和13处的高变双残基的同一性与在tal-效应子的靶序列中的连续核苷酸的同一性之间,似乎存在着在一-对-一的对应关系(参见moscou和bogdanove,(2009)science326:1501和boch等人,(2009)science326:1509-1512)。在实验上,已经确定了这些tal-效应子的dna识别的天然密码,使得在位置12和13处的hd序列导致与胞嘧啶(c)结合,ng与t结合,ni与a、c、g或t结合,nn与a或g结合,并且ing与t结合。这些dna结合重复序列已组装成具有新的重复序列组合和数目的蛋白质,从而产生能够与新的序列相互作用并激活植物细胞中的非-内源报告基因表达的人工转录因子(boch等人,同前)。工程改造的tal蛋白已经与foki切割半结构域连接以产生在酵母报告基因测定(基于质粒的靶标)中表现出活性的tal效应子结构域核酸酶融合(talen)。

crispr(成簇的规律间隔的短回文重复序列)/cas(crispr相关的)核酸酶系统是基于可用于基因组工程改造的细菌系统的最近工程改造的核酸酶系统。其基于许多细菌和古细菌的适应性免疫应答的一部分。当病毒或质粒侵入细菌时,侵入物的dna区段通过‘免疫'应答转化为crisprrna(crrna)。然后,这种crrna通过部分互补区域与另一类称为tracrrna的rna结合,以将cas9核酸酶引导至与靶dna中的crrna同源的区域,称为“原型间隔序列”。cas9切割dna,以在由crrna转录物中所含的20-核苷酸的引导序列指定的位点处在双-链断裂(dsb)处产生平末端。对于位点特异性dna识别和切割,cas9需要crrna和tracrrna两者。这个系统现已被工程改造,使得crrna和tracrrna可结合成一个分子(“单个引导rna”),单个引导rna的crrna等效部分可经工程改造以引导cas9核酸酶靶向任何期望序列(参见jinek等人,(2012)science337,816-821页,jinek等人,(2013),elife2:e00471,和davidsegal,(2013)elife2:e00563)。因此,crispr/cas系统可经工程改造以在基因组中的期望靶标处产生dsb,并且可通过使用引起易错修复增加的修复抑制剂而影响dsb的修复。

在其他实例中,dna结合转基因为包含工程改造的(非-天然存在的)大范围核酸酶(也描述为归巢核酸内切酶)的位点特异性核酸酶。归巢核酸内切酶或大范围核酸酶(如i-scei、i-ceui、pi-pspi、pi-sce、i-sceiv、i-csmi、i-pani、i-sceii、i-ppoi、i-sceiii、i-crei、i-tevi、i-tevii和i-teviii)的识别序列是已知的。还参见美国专利no.5,420,032;美国专利no.6,833,252;belfort等人,(1997)nucleicacidsres.25:3379–303388;dujon等人,(1989)gene82:115–118;perler等人,(1994)nucleicacidsres.22,11127;jasin(1996)trendsgenet.12:224–228;gimble等人,(1996)j.mol.biol.263:163–180;argast等人,(1998)j.mol.biol.280:345–353和newenglandbiolabscatalogue。另外,归巢核酸内切酶和大范围核酸酶的dna-结合特异性可被工程改造为结合非-天然靶位点。参见,例如,chevalier等人,(2002)molec.cell10:895-905;epinat等人,(2003)nucleicacidsres.531:2952-2962;ashworth等人,(2006)nature441:656-659;paques等人,(2007)currentgenetherapy7:49-66;美国专利公开no.20070117128。归巢核酸内切酶和大范围核酸酶的dna-结合结构域总的来说在核酸酶的背景下可予以改变(即,使得核酸酶包括同源切割结构域)或可融合至异源切割结构域。

如本文中使用的,术语“转化”涵盖可将核酸分子引入这种细胞中的所有技术。实例包括但不限于:用病毒载体转染;用质粒载体转化;电穿孔;脂质体转染;显微注射(mueller等人,(1978)cell15:579-85);土壤杆菌-介导的转移;直接dna摄取;whiskerstm-介导的转化;和微粒轰击。这些技术可用于植物细胞的稳定转化和瞬时转化两者。术语“稳定转化”指将核酸片段引入宿主生物的基因组中,从而导致在遗传上稳定的遗传。一旦稳定转化,该核酸片段稳定整合到宿主生物和任何后续世代的基因组中。含有该转化的核酸片段的宿主生物被称为“转基因”生物。术语“瞬时转化”指将核酸片段引入宿主生物的细胞核、或含有dna-的细胞器中,从而导致不具备在遗传上稳定的遗传的基因表达。

外源核酸序列。在一个实例中,转基因是基因序列(例如,除草剂抗性基因)、编码工业或药学上有用的化合物的基因、或编码期望的农业性状的基因。在又另一个实例中,转基因为反义核酸序列,其中所述反义核酸序列的表达抑制靶核酸序列的表达。转基因可含有与该转基因可操作连接的调控序列(例如,启动子)。在一些实施方案中,感兴趣的多核苷酸序列为转基因。然而,在其他实施方案中,感兴趣的多核苷酸序列为内源核酸序列,其中所述内源核酸序列的额外基因组拷贝是期望的,或者为相对于宿主生物中的靶核酸分子的序列处于反义取向的核酸序列。

如本文中使用的,通过用异源dna(即,包含感兴趣的转基因的核酸构建体)转化植物细胞,再生由于将转基因插入植物的基因组中所产生的植物群体,并选择其特征为插入到特定基因组位置中的特定植物,产生了术语转基因“事件”。术语“事件”是指原始转化体和包含所述异源dna的所述转化体的子代。术语“事件”也指通过转化体与包含基因组dna/转基因dna的另一个品种之间的有性异型杂交所产生的子代。即使在与轮回亲本重复回交之后,来自转化亲本的插入转基因dna和侧翼基因组dna(基因组dna/转基因dna)也存在于杂交子代中的相同染色体位置。术语“事件”也指来自包含插入dna和紧邻插入dna的侧翼基因组序列的原始转化体及其子代的dna,由于包含插入dna的一个亲本品系(例如原始转化体和由自交产生的子代)与不含所述插入dna的亲本品系的有性杂交,预期所述插入dna将被转移到接受包括感兴趣的转基因在内的插入dna的子代中。

如本文中使用的,术语“聚合酶链反应”或“pcr”定义了其中微量核酸、rna和/或dna被扩增的程序或技术,正如1987年7月28日发布的美国专利no.4,683,195中所描述。通常,需要可用的来自感兴趣区域的末端的序列信息或其他信息,使得可以设计寡核苷酸引物;这些引物与有待扩增的模板的相对链在序列上相同或相似。两个引物的5’端核苷酸可与扩增材料的末端一致。pcr可用来扩增特异性rna序列、来自总的基因组dna的特异性dna序列、和从总的细胞rna、噬菌体或质粒序列等转录的cdna。总体上参见mullis等人,coldspringharborsymp.quant.biol.,51:263(1987);erlich编辑,pcrtechnology,(stocktonpress,ny,1989)。

如本文中使用的,术语“引物”是指当条件适合于合成引物延伸产物时能够用作沿着互补链的合成的起始点的寡核苷酸。合成条件包括四种不同的脱氧核糖核苷三磷酸和诸如逆转录酶或dna聚合酶的至少一种聚合诱导剂的存在。这些物质存在于适合的缓冲液中,所述缓冲液可包括作为辅因子或在不同的适当温度下影响诸如ph等条件的组分。引物优选地是单链序列,使得扩增效率得以最佳化,不过可以利用双链序列。

如本文中使用的,术语“探针”是指与靶序列杂交的寡核苷酸。在型测定程序中,探针与位于两个引物的退火位点之间的靶部分杂交。探针包含约八个核苷酸、约十个核苷酸、约十五个核苷酸、约二十个核苷酸、约三十个核苷酸、约四十个核苷酸、或约五十个核苷酸。在一些实施方案中,探针包含从约八个核苷酸到约十五个核苷酸。探针可进一步包含可检测标记,例如,荧光团(texas-异硫氰酸荧光素,等)。可检测标记可直接地共价附接到探针寡核苷酸上,例如位于探针的5’端或探针的3’端。包含荧光团的探针还可进一步包含猝灭剂,例如,blackholequenchertm、iowablacktm,等。

如本文中使用的,术语“限制性核酸内切酶”和“限制酶”是指细菌酶,它们每一者切割在特异性核苷酸序列处或附近的双链dna。2型限制酶在同一位点识别和切割dna,并且包括但不限于xbai、bamhi、hindiii、ecori、xhoi、sali、kpni、avai、psti和smai。

如本文中使用的,术语“载体”与术语“构建体”、“克隆载体”和“表达载体”可互换地使用,并且意指藉此可将dna或rna序列(例如,外来序列)引入宿主细胞中的媒介物,从而转化宿主并促进引入序列的表达(例如转录和翻译)。“非病毒载体”意图表示不包含病毒或反转录病毒的任何载体。在一些实施方案中,“载体”为包含至少一个dna复制起点和至少一个可选择标志物基因的dna序列。实例包括但不限于携带外源dna进入细胞的质粒、粘粒、噬菌体、细菌人工染色体(bac)或病毒。载体还可包括一个或多个基因、反义分子、和/或可选择标志物基因和本领域已知的其他遗传元件。载体可以转导、转化或感染细胞,由此引起细胞表达核酸分子和/或由该载体编码的蛋白质。术语“质粒”定义了能够在原核或真核宿主细胞中进行常染色体复制的环链核酸。该术语包括可为dna或rna并且可为单链或双链的核酸。质粒的定义还可包括相应于细菌复制起点的序列。

如本文中使用的,如本文中使用的术语“可选择标志物基因”定义了编码蛋白质的基因或其他表达盒,所述蛋白质便于鉴定所述可选择标志物基因插入其中的细胞。例如,“可选择标志物基因”涵盖报告基因以及在植物转化中使用的基因,以便例如保护植物细胞免受选择剂的影响或提供针对选择剂的抗性/耐受性。在一个实施方案中,只有那些接受功能性可选择标志物的细胞或植物才能在具有选择剂的条件下分裂或生长。选择剂的实例可以包括,例如包括大观霉素、新霉素、卡那霉素、巴龙霉素、庆大霉素、和潮霉素在内的抗生素。这些可选择标志物包括表达赋予抗生素卡那霉素抗性的酶的针对新霉素磷酸转移酶的基因(nptii),和针对有关抗生素新霉素、巴龙霉素、庆大霉素和g418的基因,或表达赋予潮霉素抗性的酶的针对潮霉素磷酸转移酶的基因(hpt)。其他可选择标志物基因可以包括编码除草剂抗性的基因,包括bar或pat(针对草胺磷或膦丝菌素的抗性)、乙酰乳酸合酶(als,针对抑制剂诸如磺酰脲类(su)、咪唑啉酮类(imi)、三唑并嘧啶类(tp)、嘧啶基氧基苯甲酸酯类(pob)、和阻止支链氨基酸合成第一步的磺酰基氨基羰基三唑啉酮类的抗性)、草甘膦、2,4-d、和金属抗性或敏感性。可用作可选择标志物基因的“报告基因”的实例包括表达的报告基因蛋白的视觉观察,所述报告基因蛋白例如编码的蛋白质:β-葡糖醛酸糖苷酶(gus)、萤光素酶、绿色荧光蛋白(gfp)、黄色荧光蛋白(yfp)、dsred、β-半乳糖苷酶、氯霉素乙酰转移酶(cat)、碱性磷酸酶等。短语“标志物阳性”是指已经被转化而包含可选择标志物基因的植物。

如本文中使用的,术语“可检测标志物”是指能够检测的标记物,例如像放射性同位素、荧光化合物、生物发光化合物、化学发光化合物、金属螫合剂、或酶。可检测标志物的实例包括但不限于下列各项:荧光标记(例如,fitc、罗丹明、镧系磷光体)、酶标记(例如,辣根过氧化物酶、β-半乳糖苷酶、萤光素酶、碱性磷酸酶)、化学发光标记、生物素基;由次级报道分子识别的预定多肽表位(例如,亮氨酸拉链对序列、二级抗体的结合位点、金属结合结构域、表位标签)。在一个实施方案中,可检测标志物可通过不同长度的间隔臂附接,以降低潜在的空间位阻。

如本文中使用的,术语“盒”、“表达盒”和“基因表达盒”是指可在特异的限制性位点或通过同源重组插入核酸或多核苷酸中的dna区段。如本文中使用的dna区段包括编码感兴趣多肽的多核苷酸,所述盒和限制性位点被设计为确保所述盒插入用于转录和翻译的正确阅读框中。在一个实施方案中,表达盒可包含编码感兴趣多肽的多核苷酸,并且具有除了所述多核苷酸之外的便于特定宿主细胞转化的元件。在一个实施方案中,基因表达盒还可包括允许编码感兴趣多肽的多核苷酸在宿主细胞中增强表达的元件。这些元件可包括但不限于:启动子、最小启动子、增强子、反应元件、终止子序列、多聚腺苷酸化序列,等。

如本文中使用的“接头”或“间隔区”是使两个分开的实体彼此结合的键、分子或分子基团。接头和间隔区可为两个实体提供最佳间距,或者可进一步提供允许两个实体彼此分开的不稳定连接。不稳定连接包括可光裂解的基团、酸不稳定性模块、碱不稳定性模块和酶可裂解的基团。如本文中使用的术语“多接头”或“多克隆位点”定义了彼此位于核酸序列上10个核苷酸之内的一簇三个或更多个2型限制酶位点。包含多接头的构建体用于插入和/或切除诸如基因的编码区的核酸序列。在其他情况下,如本文中使用的术语“多接头”是指靶向的经由任何已知的无缝克隆方法(即,gibsonnebuilderhifidnagoldengateassembly、assembly,等等。)连接两个序列的一段核苷酸。包含多接头的构建体用于插入和/或切除诸如基因的编码区的核酸序列。

如本文中使用的,术语“对照”是指在用于比较目的的分析程序中使用的样品。对照可为“阳性”或“阴性”。例如,在分析程序的目的为检测细胞或组织中的差异表达的转录物或多肽的情况下,通常优选包括阳性对照,例如来自展现出期望表达的已知植物的样品,以及阴性对照,例如来自缺乏期望表达的已知植物的样品。

如本文中使用的,术语“植物”包括整个植物及植物的任何后代、细胞、组织、或部分。可用于本发明中的植物类别通常宽泛地为适合于诱变的高等和低等植物类别,包括被子植物(单子叶和双子叶植物)、裸子植物、蕨类和多细胞藻类。因此,“植物”包括双子叶和单子叶植物。术语“植物部分”包括植物的任何部分,包括,例如但不限于:种子(包括成熟种子和未成熟种子);植物插条;植物细胞;植物细胞培养物;植物器官(如花粉、胚、花、果实、芽(shoot)、叶、根、茎、和外植体)。植物组织或植物器官可以是种子、原生质体、愈伤组织、或者任何其他被组织成一定结构或功能单位的植物细胞群。植物细胞或组织培养物可能能够再生出具有该细胞或组织所来源的植物的生理学和形态学特征的植物,并且可能能够再生出与该植物具有基本上相同的基因型的植物。与之相反,一些植物细胞不能够再生而产生植物。植物细胞或组织培养物中的可再生细胞可以是胚、原生质体、分生组织细胞、愈伤组织、花粉、叶、花药、根、根尖、须、花、果仁、穗、穗轴、壳、或茎。

植物部分包括可收获部分和可用于繁殖后代植物的部分。可用于繁殖的植物部分包括,例如但不限于:种子;果实;插条;苗;块茎;和根砧木。植物的可收获部分可以是植物的任何有用部分,包括,例如但不限于:花;花粉;苗;块茎;叶;茎;果实;种子;和根。

植物细胞是植物的结构和生理单位,包括原生质体和细胞壁。植物细胞可以是分离的单细胞或细胞聚集体的形式(例如,松散型(friable)愈伤组织和培养细胞),并且可以是更高级组织单位的一部分(例如,植物组织、植物器官、和植物)。因此,植物细胞可以是原生质体、配子产生细胞、或可以再生成完整植物的细胞或细胞集合。因此,包含多个植物细胞并能够再生为完整植物的种子,在本文的实施方案中被认为是“植物细胞”。

如本文中使用的,术语“小rna”是指几类非-编码核糖核酸(ncrna)。术语小rna描述了在细菌细胞、动物、植物、和真菌中产生的短链ncrna。这些短链ncrna可在细胞中天然产生或可以通过引入表达短链ncrna的外源序列而产生。小rna序列不直接编码蛋白质,并且与其他rna在功能上不同之处在于,小rna序列仅仅被转录而不被翻译。小rna序列涉及其他细胞功能,包括基因表达和修饰。小rna分子常常由约20个到30个核苷酸构成。小rna序列可衍生自较长的前体。所述前体形成在自身-互补区中彼此折回的结构;然后它们被动物体内的核酸酶切丁酶或植物中的dcl1加工。

许多类型的小rna天然存在或经人工产生,包括microrna(mirna)、短干扰rna(sirna)、反义rna、短发夹rna(shrna)、和小核仁rna(snorna)。某些类型的小rna,如microrna和sirna在基因沉默和rna干扰(rnai)中是重要的。基因沉默是其中通常表达的基因被细胞内元件(在这种情况下为小rna)“关闭”的遗传调节过程。通常经由此遗传信息形成的蛋白质由于干扰而未形成,并且在该基因中编码的信息被阻断表达。

如本文中使用的,术语“小rna”涵盖rna分子,其在文献中被描述为“极小rna”(storz,(2002)science296:1260-3;illangasekare等人,(1999)rna5:1482-1489);原核“小rna”(srna)(wassarman等人,(1999)trendsmicrobiol.7:37-45);真核“非编码rna(ncrna)”;“微-rna(mirna)”;“小非-mrna(snmrna)”;“功能性rna(frna)”;转运rna(trna)”;“催化性rna”[例如,核酶,包括自身-酰化核酶(illangaskare等人,(1999)rna5:1482-1489);“小核仁rna(snorna)”;“tmrna”(又名“10srna”,muto等人,(1998)trendsbiochemsci.23:25-29;和gillet等人,(2001)molmicrobiol.42:879-885);rnai分子,包括但不限于“小干扰rna(sirna)”、“核酸内切酶-制备的sirna(e-sirna)”、“短发夹rna(shrna)”、和“时序调节小rna(strna)”;“切丁酶酶切的sirna(d-sirna)”、以及包含至少一个尿嘧啶碱基的适体、寡核苷酸和其他合成核酸。

除非另外特别地解释,本文中使用的全部技术术语和科学术语具有与属于本公开的领域之内的普通技术人员通常所理解的相同的含义。可以在以下出版物中找到分子生物学中常见术语的定义:例如,lewin,genesv,oxforduniversitypress,1994(isbn0-19-854287-9);kendrew等(编),theencyclopediaofmolecularbiology,blackwellscienceltd.,1994(isbn0-632-02182-9);和meyers(编),molecularbiologyandbiotechnology:acomprehensivedeskreference,vchpublishers,inc.,1995(isbn1-56081-569-8)。

如本文中使用的,冠词“一个(a)”、“一种(an)”和“该(the)”包括复数引用,除非上下文另外清楚且毫不含糊地规定。

iii.玉米grmzm2g047720启动子及包含它的核酸

提供了使用来自玉米grmzm2g047720基因的启动子和其他调控元件在植物中表达非转基因的方法和组合物。在一个实施方案中,启动子可以是具有seqidno:1的玉米grmzm2g047720启动子。在进一步的实施方案中,3’utr可以是具有seqidno:5的玉米grmzm2g0477203’utr。

在一个实施方案中,提供了包含启动子的多核苷酸,其中所述启动子与seqidno:1至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%相同。在一个实施方案中,启动子是玉米grmzm2g047720启动子,其包含与多核苷酸seqidno:1具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%同一性的多核苷酸。在一个实施方案中,提供了分离的多核苷酸,其包含与多核苷酸seqidno:1至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%的同一性。在一个实施方案中,提供了包含具有seqidno:1的玉米grmzm2g047720启动子的核酸载体。在一个实施方案中,提供了包含与多接头可操作连接的玉米grmzm2g047720启动子的多核苷酸。在一个实施方案中,提供了包含与非grmzm2g047720转基因可操作连接的玉米grmzm2g047720启动子的基因表达盒。在一个实施方案中,提供了包含与非grmzm2g047720转基因可操作连接的玉米grmzm2g047720启动子的核酸载体。在一个实施方案中,启动子由seqidno:1组成。在说明性实施方案中,核酸载体包含与转基因可操作连接的玉米grmzm2g047720启动子,其中所述转基因可以是杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、dna结合转基因、小rna转基因、可选择标志物转基因、或它们的组合。

还可通过位于基因的编码序列下游的3’非翻译基因区(即,3’utr)来调节转基因表达。启动子和3’utr两者都能调节转基因表达。虽然启动子对于驱动转录是必要的,但3’utr基因区能终止转录并起始所得mrna转录物的多腺苷酸化以进行翻译和蛋白质合成。3’utr基因区有助于转基因的稳定表达。

在一个实施方案中,提供了包含如本文中所述的玉米grmzm2g047720启动子和3’utr的核酸载体。在一个实施方案中,核酸载体包含玉米grmzm2g0477203’utr。在一个实施方案中,玉米grmzm2g0477203’utr是seqidno:5。

在一个实施方案中,提供了包含如本文中所述的玉米grmzm2g047720启动子和3’utr的核酸载体,其中3’utr与多核苷酸seqidno:5至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%相同。在一个实施方案中,提供了包含如本文中所述的玉米grmzm2g047720启动子和玉米grmzm2g0477203’utr的核酸载体,其中玉米grmzm2g047720启动子和玉米grmzm2g0477203’utr两者与多接头的两端可操作连接。在一个实施方案中,提供了包含如本文中所述的玉米grmzm2g047720启动子和玉米grmzm2g0477203’utr的基因表达盒,其中玉米grmzm2g047720启动子和玉米grmzm2g0477203’utr两者与非grmzm2g047720转基因的两端可操作连接。在一个实施方案中,3’utr由seqidno:5组成。在一个实施方案中,提供了包含如本文中所述的玉米grmzm2g047720启动子和玉米grmzm2g0477203’utr的基因表达盒,其中玉米grmzm2g047720启动子包含seqidno:1,并且玉米grmzm2g0477203’utr包含seqidno:5,其中所述启动子和3’utr与非grmzm2g047720转基因的两端可操作连接。在这个实施方案的一个方面,3’utr由seqidno:5组成。在这个实施方案的另一方面,启动子由seqidno:1组成。在说明性实施方案中,基因表达盒包含与转基因可操作连接的玉米grmzm2g0477203’utr,其中所述转基因可以是杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、dna结合转基因或蛋白质、小rna转基因、可选择标志物转基因、或它们的组合。在进一步的实施方案中,转基因与来自相同grmzm2g047720样基因的玉米grmzm2g047720启动子和玉米grmzm2g0477203’utr可操作连接。

还可通过位于启动子序列下游的内含子区来调节转基因表达。启动子和内含子两者都能调节转基因表达。虽然启动子对于驱动转录是必要的,但内含子的存在能增加表达水平,从而产生用于翻译和蛋白质合成的mrna转录物。内含子基因区有助于转基因的稳定表达。在一个另外的实施方案中,内含子与玉米grmzm2g047720启动子可操作连接。

还可通过位于启动子序列下游的5’utr区来调节转基因表达。启动子和5’utr两者都能调节转基因表达。虽然启动子对于驱动转录是必要的,但5’utr的存在能增加表达水平,从而产生用于翻译和蛋白质合成的mrna转录物。5’utr基因区有助于转基因的稳定表达。在一个另外的实施方案中,5’utr与玉米grmzm2g047720启动子可操作连接。

玉米grmzm2g047720启动子还可包含一个或多个另外的序列元件。在一些实施方案中,玉米grmzm2g047720启动子可包含外显子(例如,前导序列或信号肽,比如叶绿体转运肽或er滞留信号)。例如,但不限于,作为一个另外的实施方案,玉米grmzm2g047720启动子可以编码组入玉米grmzm2g047720启动子中的外显子。

在一个实施方案中,核酸载体包含如本文中公开的基因表达盒。在一个实施方案中,载体可以是质粒、粘粒、细菌人工染色体(bac)、噬菌体、病毒、或在直接转化或基因打靶中使用的切割的多核苷酸片段,如供体dna。

根据一个实施方案,提供了包含重组基因表达盒的核酸载体,其中所述重组基因盒包含与多接头序列可操作连接的玉米grmzm2g047720启动子、非grmzm2g047720转基因或它们的组合。在一个实施方案中,所述重组基因盒包含与非grmzm2g047720转基因可操作连接的玉米grmzm2g047720启动子。在一个实施方案中,所述重组基因盒包含与多接头序列可操作连接的如本文中公开的玉米grmzm2g047720启动子。所述多接头以某种方式与玉米grmzm2g047720启动子可操作连接,所述方式使得编码序列到所述多接头的限制性位点之一中的插入将会可操作地连接所述编码序列,从而允许在载体转化或转染到宿主细胞中时表达所述编码序列。

根据一个实施方案,玉米grmzm2g047720启动子包含seqidno:1或与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的序列。根据一个实施方案,所述启动子序列具有不超过1.5、2、2.5、3或4kb的总长度。根据一个实施方案,玉米grmzm2g047720启动子由seqidno:1或与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的2,065bp序列组成。

根据一个实施方案,提供了包含基因盒的核酸载体,所述基因盒由玉米grmzm2g047720启动子、非grmzm2g047720转基因和具有seqidno:5的玉米grmzm2g0477203'utr组成。在一个实施方案中,具有seqidno:5的玉米grmzm2g0477203’utr与非grmzm2g047720转基因的3'端可操作连接。在一个另外的实施方案中,3'非翻译序列包含seqidno:5或与seqidno:5具有至少80%、85%、90%、95%、99%或100%序列同一性的序列。根据一个实施方案,提供了包含基因盒的核酸载体,所述基因盒的组成为seqidno:1或与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的2,065bp序列、非grmzm2g047720转基因和玉米grmzm2g0477203’utr,其中seqidno:1与非grmzm2g047720转基因的5'端可操作连接,并且具有seqidno:5的3’utr与非grmzm2g047720转基因的端3'可操作连接。在一个另外的实施方案中,3'非翻译序列包含seqidno:5或与seqidno:5具有至少80%、85%、90%、95%、99%或100%序列同一性的序列。在一个另外的实施方案中,玉米grmzm2g0477203'非翻译序列由seqidno:5或与seqidno:5具有至少80%、85%、90%、95%或99%序列同一性的1,023bp序列组成。

在一个实施方案中,提供了包含启动子和非grmzm2g047720转基因以及任选地一个或多个下列元件的核酸构建体,所述元件为:

a)5'非翻译区;

b)内含子;和

c)3'非翻译区,

其中,

所述启动子由seqidno:1或与seqidno:1具有至少98%序列同一性的序列组成;并且

所述3'非翻译区由seqidno:5或与seqidno:5具有至少98%序列同一性的序列组成;进一步地,其中所述启动子与所述转基因可操作连接,并且当存在时,每个任选的元件也与启动子和转基因两者可操作连接。在一个另外的实施方案中,提供了包含就在上文公开的核酸构建体的转基因细胞。在一个实施方案中,所述转基因细胞为植物细胞,并且在一个另外的实施方案中提供了植物,其中所述植物包含所述转基因细胞。

在一个实施方案中,提供了包含启动子和非grmzm2g047720转基因以及任选地一个或多个下列元件的核酸构建体,所述元件为:

a)5'非翻译区;和

c)3'非翻译区,

其中,

所述启动子由seqidno:1或与seqidno:1具有至少98%序列同一性的序列组成;并且

所述3'非翻译区由seqidno:5或与seqidno:5具有至少98%序列同一性的序列组成;进一步地,其中所述启动子与所述转基因可操作连接,并且当存在时,每个任选的元件也与启动子和转基因两者可操作连接。在一个另外的实施方案中,提供了包含就在上文公开的核酸构建体的转基因细胞。在一个实施方案中,所述转基因细胞为植物细胞,并且在一个另外的实施方案中提供了植物,其中所述植物包含所述转基因细胞。

在一个实施方案中,提供了包含启动子和多接头以及任选地一个或多个下列元件的核酸构建体,所述元件为:

a)5'非翻译区;

b)内含子;和

c)3'非翻译区,

其中,

所述启动子由seqidno:1或与seqidno:1具有至少98%序列同一性的序列组成;并且,

所述3'非翻译区由seqidno:5或与seqidno:5具有至少98%序列同一性的序列组成;进一步地,其中所述启动子与所述多接头可操作连接,并且当存在时,每个任选的元件也与启动子和多接头两者可操作连接。

根据一个实施方案,所述核酸载体进一步包含编码可选择标志物的序列。根据一个实施方案,所述重组基因盒与土壤杆菌t-dna边界可操作连接。根据一个实施方案,所述重组基因盒进一步包含第一和第二t-dna边界,其中第一t-dna边界与基因构建体的一端可操作连接,并且第二t-dna边界与基因构建体的另一端可操作连接。所述第一和第二土壤杆菌t-dna边界可独立地选自来源于细菌菌株的t-dna边界序列,所述t-dna边界序列选自下组:胭脂碱合成土壤杆菌t-dna边界、章鱼碱(ocotopine)合成土壤杆菌t-dna边界、甘露碱合成土壤杆菌t-dna边界、琥珀碱合成土壤杆菌t-dna边界、或它们的任何组合。在一个实施方案中,提供了选自下组的土壤杆菌菌株:胭脂碱合成菌株、甘露碱合成菌株、琥珀碱合成菌株、或章鱼碱合成菌株,其中所述菌株包含质粒,其中所述质粒包含与选自seqidno:1的序列或与seqidno:1具有至少80%、85%、90%、95%、或99%序列同一性的序列可操作连接的转基因。

适合于在本公开构建体中使用的感兴趣的转基因包括但不限于赋予下列各项的编码序列:(1)对害虫或疾病的抗性,(2)对除草剂的耐受性,(3)增值的农艺性状,比如产量提高、氮利用效率、水分利用效率和营养品质,(4)蛋白质以位点特异性方式与dna结合,(5)小rna的表达,和(6)可选择标志物。根据一个实施方案,所述转基因编码可选择标志物或赋予杀虫抗性、除草剂耐受性、小rna表达、氮利用效率、水分利用效率、或营养品质的基因产物。

1.昆虫抗性

各种昆虫抗性编码序列可以与具有seqidno:1的玉米grmzm2g047720启动子可操作连接。在一个实施方案中,启动子可以是具有seqidno:1的玉米grmzm2g047720启动子、包含seqidno:1、或与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的序列的启动子。在一些实施方案中,所述序列与包含seqidno:1的玉米grmzm2g047720启动子和5’utr,或与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的序列和5’utr可操作连接。然后可以将可操作连接的序列组入选择的载体中以允许鉴定和选择转化的植物(“转化体”)。示例性昆虫抗性编码序列是本领域已知的。作为可以与本主题公开的调控元件可操作连接的昆虫抗性编码序列的实施方案,提供了以下性状。提供示例性鳞翅目昆虫抗性的编码序列包括:cry1a;cry1a.105;cry1ab;cry1ab(截短);cry1ab-ac(融合蛋白);cry1ac(以销售);cry1c;cry1f(以销售);cry1fa2;cry2ab2;cry2ae;cry9c;mocry1f;pinii(蛋白酶抑制剂蛋白);vip3a(a);和vip3aa20。提供示例性鞘翅目昆虫抗性的编码序列包括:cry34ab1(以销售);cry35ab1(以销售);cry3a;cry3bb1;dvsnf7;和mcry3a。提供示例性多昆虫抗性的编码序列包括ecry31.ab。以上列出的昆虫抗性基因并非意味着是限制性的。本公开涵盖任何昆虫抗性基因。

2.除草剂耐受性

不同的除草剂耐受性编码序列可与包含seqidno:1的玉米grmzm2g047720启动子或与seqidno:1具有80%、85%、90%、95%或99%序列同一性的序列可操作连接。在一个实施方案中,启动子可以是具有seqidno:1的玉米grmzm2g047720启动子、包含seqidno:1、或与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的序列的启动子。在一些实施方案中,所述序列与包含seqidno:1的玉米grmzm2g047720启动子和5’utr、或与5’utr序列可操作连接的与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的序列可操作连接。然后可以将可操作连接的序列组入选择的载体中以允许鉴定和选择转化的植物(“转化体”)。示例性除草剂耐受性编码序列是本领域已知的。作为可以与本主题公开的调控元件可操作连接的除草剂耐受性编码序列的实施方案,提供了以下性状。草甘膦除草剂具有通过抑制epsps酶(5-烯醇丙酮酰莽草酸-3-磷酸合酶)起作用的模式。这种酶参与对植物的生长和发育至关重要的芳香族氨基酸的生物合成。可用于抑制这种酶的各种酶机制是本领域已知的。编码此类酶的基因可与本主题公开的基因调控元件可操作连接。在一个实施方案中,可选择标志物基因包括但不限于编码草甘膦抗性基因的基因,包括:突变型epsps基因,比如2mepsps基因、cp4epsps基因、mepsps基因、dgt-28基因;aroa基因;和草甘膦降解基因,比如草甘膦乙酰转移酶基因(gat)和草甘膦氧化酶基因(gox)。这些性状目前以gly-toltmgt和roundup销售。草铵膦和/或双丙氨磷化合物的抗性基因包括dsm-2、bar和pat基因。bar和pat性状目前以liberty销售。还包括提供对2,4-d抗性的耐受基因,比如aad-1基因(应该注意的是,aad-1基因对芳氧苯氧丙酸酯类(arloxyphenoxypropionate)除草剂具有进一步的活性)和aad-12基因(应该注意的是,aad-12基因对吡啶基氧基乙酸合成生长素具有进一步的活性)。这些性状以作物保护技术销售。als抑制剂(磺酰脲类、咪唑啉酮类、三唑并嘧啶类、嘧啶基硫代苯甲酸酯类和磺酰基氨基-羰基-三唑啉酮类)的抗性基因是本领域已知的。这些抗性基因最常由于als编码基因序列的点突变而产生。其他als抑制剂抗性基因包括hra基因、csr1-2基因、sr-hra基因和surb基因。一些性状以商品名销售。抑制hppd的除草剂包括吡唑啉酮类,比如苄草唑、吡草酮和苯唑草酮;三酮类,比如甲基磺草酮、磺草酮、环磺酮、苯并双环酮;和二酮腈类,比如异恶唑草酮。可以通过已知性状耐受这些示例性hppd除草剂。hppd抑制剂的实例包括hppdpf_w336基因(异恶唑草酮抗性)和avhppd-03基因(甲基磺草酮抗性)。耐苯腈除草剂的性状的一个例子包括bxn基因,该基因已经显示出赋予对除草剂/抗生素溴苯腈的抗性。麦草畏的抗性基因包括如国际pct公开号wo2008/105890中公开的麦草畏单加氧酶基因(dmo)。ppo或protox抑制剂类除草剂(例如,三氟羧草醚、氟丙嘧草酯、flupropazil、环戊噁草酮、唑草酮、异丙吡草酯、吡草醚、苯草醚、唑啶草酮、丙炔氟草胺、氟烯草酸、治草醚、乙氧氟草醚、乳氟禾草灵、氟磺胺草醚、乙羧氟草醚和甲磺草胺)的抗性基因是本领域已知的。赋予对ppo抗性的示例性基因包括野生型拟南芥ppo酶的过表达(lermontovai和grimmb,(2000)overexpressionofplastidicprotoporphyrinogenixoxidaseleadstoresistancetothediphenyl-etherherbicideacifluorfen.plantphysiol122:75–83.)、枯草芽孢杆菌ppo基因(li,x.和nicholld.2005.developmentofppoinhibitor-resistantculturesandcrops.pestmanag.sci.61:277-285以及choikw,hano,leehj,yunyc,moonyh,kimmk,kukyi,hansu和guhjo,(1998)generationofresistancetothediphenyletherherbicide,oxyfluorfen,viaexpressionofthebacillussubtilisprotoporphyrinogenoxidasegeneintransgenictobaccoplants.bioscibiotechnolbiochem62:558–560.)吡啶氧基或苯氧基丙酸和环己酮的抗性基因包括编码乙酰辅酶a羧化酶(accase)抑制剂的基因(例如,acc1-s1、acc1-s2和acc1-s3)。示例性基因赋予对包括氟吡甲禾灵、禾草灵、精恶唑禾草灵、吡氟禾草灵和喹禾灵在内的环己二酮和/或芳氧基苯氧基丙酸的抗性。最后,包括三嗪或苯甲腈在内的除草剂可以抑制光合作用,通过psba基因(对三嗪的耐受性)、1s+基因(对三嗪的耐受性)和腈水解酶基因(对苯甲腈的耐受性)提供对它们的耐受性。以上列出的除草剂耐受性基因并非意味着是限制性的。本公开涵盖任何除草剂耐受性基因。

3.农艺性状

不同的农艺性状编码序列可与包含seqidno:1的玉米grmzm2g047720启动子或与seqidno:1具有80%、85%、90%、95%或99%序列同一性的序列可操作连接。在一个实施方案中,启动子可以是具有seqidno:1的玉米grmzm2g047720启动子、包含seqidno:1、或与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的序列的启动子。在一些实施方案中,所述序列与包含seqidno:1的玉米grmzm2g047720启动子和5’utr、或与5’utr序列可操作连接的与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的序列可操作连接。然后可以将可操作连接的序列组入选择的载体中以允许鉴定和选择转化的植物(“转化体”)。示例性农艺性状编码序列是本领域已知的。作为可以与本主题公开的调控元件可操作连接的农艺性状编码序列的实施方案,提供了以下性状。由pg基因提供的延迟果实软化抑制了导致细胞壁中果胶分子分解的多聚半乳糖醛酸酶的产生,并因此引起果实的延迟软化。此外,acc基因的延迟果实成熟/衰老起到抑制天然acc合酶基因的正常表达的作用,导致乙烯产生减少和果实成熟延迟。然而,accd基因引起果实成熟激素乙烯的前体代谢,导致果实成熟延迟。或者,sam-k基因通过还原s-腺苷甲硫氨酸(sam)(产生乙烯的底物)引起成熟延迟。在水分胁迫条件下,由cspb基因提供的干旱胁迫耐受表型通过保持rna稳定性和翻译维持正常的细胞功能。另一个实例包括ecbeta基因,其催化渗透保护剂化合物甘氨酸甜菜碱的产生,从而赋予对水分胁迫的耐受性。另外,rmbeta基因催化渗透保护剂化合物甘氨酸甜菜碱的产生,从而赋予对水分胁迫的耐受性。bbx32基因提供光合作用和产量提高,其表达与一种或多种内源转录因子相互作用以调节植物日/夜生理过程的蛋白质。通过编码热稳定性α-淀粉酶的amy797e基因的表达可以增加乙醇产生,所述α-淀粉酶通过增加用于降解淀粉的淀粉酶的热稳定性而提高生物乙醇的产生。最后,可以通过表达编码二氢吡啶二羧酸合酶的cordapa基因而产生修饰的氨基酸组成,所述二氢吡啶二羧酸合酶增加氨基酸赖氨酸的产生。以上列出的农艺性状编码序列并非意味着是限制性的。本公开涵盖任何农艺性状编码序列。

4.dna结合蛋白

不同的dna结合蛋白编码序列可与包含seqidno:1的玉米grmzm2g047720启动子或与seqidno:1具有80%、85%、90%、95%或99%序列同一性的序列可操作连接。在一个实施方案中,启动子可以是具有seqidno:1的玉米grmzm2g047720启动子、包含seqidno:1、或与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的序列的启动子。在一些实施方案中,所述序列与包含seqidno:1的玉米grmzm2g047720启动子和5’utr序列、或与5’utr序列可操作连接的与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的序列可操作连接。然后可以将可操作连接的序列组入选择的载体中以允许鉴定和选择转化的植物(“转化体”)。示例性dna结合蛋白编码序列是本领域已知的。作为可与本主题公开的调控元件可操作连接的dna结合蛋白编码序列的实施方案,以下类型的dna结合蛋白可包括:锌指、转录激活子样效应因子核酸酶(talen)、crispr和大范围核酸酶。以上列出的dna结合蛋白编码序列并非意味着是限制性的。本公开涵盖任何dna结合蛋白编码序列。

5.小rna

不同的小rna可与包含seqidno:1的玉米grmzm2g047720启动子或与seqidno:1具有80%、85%、90%、95%或99%序列同一性的序列可操作连接。在一个实施方案中,启动子可以是具有seqidno:1的玉米grmzm2g047720启动子、包含seqidno:1、或与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的序列的启动子。在一些实施方案中,所述序列与包含seqidno:1的玉米grmzm2g047720启动子和5’utr序列、或与5’utr序列可操作连接的与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的序列可操作连接。然后可以将可操作连接的序列组入选择的载体中以允许鉴定和选择转化的植物(“转化体”)。示例性小rna性状是本领域已知的。作为可以与本主题公开的调控元件可操作连接的小rna编码序列的实施方案,提供了以下性状。例如,通过使编码乙烯形成酶的aco基因沉默来抑制乙烯的产生,抗efe小rna的延迟果实成熟/衰老作用延迟了成熟。通过抑制内源性s-腺苷-l-甲硫氨酸:反式咖啡酰coa3-o-甲基转移酶(ccomt基因),ccomt小rna改变木质素产生降低了愈创木基(guanacyl)(g)木质素的含量。此外,通过ppo5小rna可以降低野生马铃薯(solanumverrucosum)中的黑斑擦伤耐受性,ppo5小rna触发ppo5转录物的降解以阻止黑斑擦伤的产生。还包括dvsnf7小rna,其利用含有西方玉米根虫snf7基因的240bp片段的dsrna来抑制西方玉米根虫。改性淀粉/碳水化合物可来源于小rna,例如pphl小rna(降解phl转录物以限制通过淀粉降解形成还原糖)和pr1小rna(降解r1转录物以限制通过淀粉降解形成还原糖)。另外的益处比如为由asn1小rna所致的丙烯酰胺减少,asn1小rna触发asn1降解,从而损害天冬酰胺的形成并减少聚丙烯酰胺。最后,pgasppo抑制小rna的非褐变表型导致抑制ppo,从而产生具有非褐变表型的苹果。以上列出的小rna并非意味着是限制性的。本公开涵盖任何小rna编码序列。

6.可选择标志物

还被描述为报告基因的不同的可选择标志物可与包含seqidno:1的玉米grmzm2g047720启动子或与seqidno:1具有80%、85%、90%、95%或99%序列同一性的序列可操作连接。在一个实施方案中,启动子可以是具有seqidno:1的玉米grmzm2g047720启动子、包含seqidno:1、或与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的序列的启动子。在一些实施方案中,所述序列与包含seqidno:1的玉米grmzm2g047720启动子和5’utr序列、或与5’utr序列可操作连接的与seqidno:1具有至少80%、85%、90%、95%或99%序列同一性的序列可操作连接。然后可以将可操作连接的序列组入选择的载体中以允许鉴定和选择转化的植物(“转化体”)。许多方法可用于证实转化植物中可选择标志物的表达,包括例如dna测序和pcr(聚合酶链反应)、southern印迹、rna印迹和用于检测从载体表达的蛋白质的免疫学方法。但是,当蛋白质表达产生有色产物时,通常通过目视观察蛋白质来观察报告基因。示例性报告基因是本领域已知的并且编码β-葡糖醛酸糖苷酶(gus)、萤光素酶、绿色荧光蛋白(gfp)、黄色荧光蛋白(yfp、phi-yfp)、红色荧光蛋白(dsrfp、rfp等)、β-半乳糖苷酶等(参见sambrook等人,molecularcloning:alaboratorymanual,第三版,coldspringharborpress,n.y.,2001,其内容通过提述完整并入本文)。

利用可选择标志物基因来选择转化的细胞或组织。可选择标志物基因包括编码抗生素抗性的基因,比如编码新霉素磷酸转移酶ii(neo)、大观霉素/链霉素(streptinomycin)抗性(aad)和潮霉素磷酸转移酶(hpt或hgr)的那些基因,以及赋予对除草化合物的抗性的基因。除草剂抗性基因通常编码对该除草剂不敏感的修饰的靶蛋白或编码在植物中在该除草剂能够起作用之前降解该除草剂或将其脱毒的酶。例如,通过使用编码突变体靶酶5-烯醇丙酮莽草酸-3-磷酸合酶(epsps)的基因,已获得对草甘膦的抗性。针对epsps的基因和突变体是熟知的,并且在下文进一步描述。通过使用编码pat或dsm-2、腈水解酶、aad-1或aad-12的细菌基因,已经获得了对草铵膦、溴苯腈、以及2,4-二氯苯氧乙酸(2,4-d)的抗性,它们中的每一者都是使它们对应的除草剂脱毒的蛋白质的例子。

在一个实施方案中,除草剂可以抑制生长点或分生组织,所述除草剂包括包括咪唑啉酮或磺酰脲,并且针对这些除草剂的乙酰羟酸合酶(ahas)和乙酰乳酸合酶(als)的抗性/耐受性的基因是熟知的。草甘膦抗性基因分别包括突变体5-烯醇丙酮酰莽草酸-3-磷酸合酶(epsp)和dgt-28基因(经由引入重组核酸和/或天然epsp基因的各种形式的体内诱变)、aroa基因和草甘膦乙酰转移酶(gat)基因)。其他膦酰基化合物的抗性基因包括来自链霉菌属物种(包括吸水链霉菌和绿色产色链霉菌)的bar和pat基因、以及吡啶氧基或苯氧基丙酸和环己酮(acc酶抑制剂编码基因)。赋予对环己二酮和/或芳氧基苯氧基丙酸(包括氟吡甲禾灵、禾草灵、精恶唑禾草灵、吡氟禾草灵、喹禾灵)抗性的示例性基因包括乙酰辅酶a羧化酶(accase)基因;acc1-s1、acc1-s2和acc1-s3。在一个实施方案中,除草剂可以抑制光合作用,包括三嗪(psba和1s+基因)或苄腈(腈水解酶基因)。此外,这样的可选择标志物可包括阳性选择标志物,例如磷酸甘露糖异构酶(pmi)。

在一个实施方案中,可选择标志物基因包括但不限于,编码下列物质的基因:2,4-d;新霉素磷酸转移酶ii;氰酰胺水合酶;天冬氨酸激酶;二氢吡啶二羧酸合成酶;色氨酸脱羧酶;二氢吡啶二羧酸合成酶和脱敏型天冬氨酸激酶;bar基因;色氨酸脱羧酶;新霉素磷酸转移酶(neo);潮霉素磷酸转移酶(hpt或hyg);二氢叶酸还原酶(dhfr);膦丝菌素乙酰转移酶;2,2-二氯丙酸脱卤素酶;乙酰羟酸合酶;5-烯醇丙酮酰-莽草酸-磷酸合酶(aroa);卤代芳基腈水解酶;乙酰辅酶a羧化酶;二氢蝶酸合酶(suli);和32kd光系统ii多肽(psba)。一个实施方案还包括编码对下列物质的抗性的可选择标志物基因:氯霉素;甲氨蝶呤;潮霉素;大观霉素;溴苯腈;草甘膦;和膦丝菌素。以上列出的可选择标志物基因并非意味着是限制性的。本公开涵盖任何报告基因或可选择标志物基因。

在一些实施方案中,合成了编码序列,以便在植物中优化表达。例如,在一个实施方案中,基因的编码序列已通过密码子优化进行修饰,以增强在植物中的表达。可以优化杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、dna结合转基因或可选择标志物转基因,以便在特定植物物种中表达,或者可以修饰上述转基因,以便在双子叶或单子叶植物中优化表达。根据在感兴趣的特定植物物种中以最大量表达的蛋白质中最高频率的密码子,可以确定植物优选的密码子。在一个实施方案中,编码序列、基因或转基因被设计为以较高水平在植物中表达,从而产生更高的转化效率。用于基因的植物优化的方法是熟知的。关于合成的dna序列的优化和生产的指南可例如在wo2013016546、wo2011146524、wo1997013402、美国专利no.6166302、美国专利no.5380831中找到,将其通过提述并入本文。

转化

用于植物转化的适合方法包括藉此将dna引入细胞中的任何方法,例如但不限于:电穿孔(参见,例如,美国专利5,384,253);微粒轰击(参见,例如,美国专利5,015,580、5,550,318、5,538,880、6,160,208、6,399,861、和6,403,865);土壤杆菌介导的转化(参见,例如,美国专利5,635,055、5,824,877、5,591,616;5,981,840、和6,384,301);和原生质体转化(参见,例如,美国专利5,508,184)。

使用诸如利用碳化硅纤维搅动的技术(参见,例如,美国专利5,302,523和5,464,765)可以将dna构建体直接引入植物细胞的基因组dna中,或者可以使用生物射弹法如dna粒子轰击将dna构建体直接引入植物组织中(参见,例如,klein等人(1987)nature327:70-73)。或者,可通过纳米颗粒转化将dna构建体引入植物细胞中(参见,例如,美国专利公开no.20090104700,通过提述将其完整并入本文)。

另外,可以使用非土壤杆菌细菌或病毒,比如根瘤菌物种ngr234、苜蓿中华根瘤菌、百脉根根瘤菌、马铃薯病毒x、花椰菜花叶病毒和木薯叶脉花叶病毒和/或烟草花叶病毒实现基因转移,参见,例如chung等人(2006)trendsplantsci.11(1):1-4。

通过应用转化技术,事实上任何植物物种的细胞可被稳定转化,并且可通过熟知的技术将这些细胞开发为转基因植物。例如,在棉花转化背景下可以特别有用的技术描述于美国专利5,846,797、5,159,135、5,004,863、和6,624,344中;用于转化芸苔属植物的技术例如具体描述于美国专利5,750,871中;用于转化大豆的技术例如描述于美国专利6,384,301中;并且用于转化玉蜀黍的技术例如描述于美国专利7,060,876和5,591,616、以及国际pct公开wo95/06722中。

在完成外源核酸到受体细胞的递送之后,通常鉴定出转化的细胞用于进一步培养和植物再生。为了提高鉴定转化体的能力,人们可能期望采用可选择标志物基因,其中使用转化载体再生转化体。在说明性实施方案中,可通过使细胞暴露于一种或多种选择剂来测定转化的细胞群,或者可筛选所述细胞的期望标志物基因性状。

暴露于选择剂后存活的细胞、或者在筛选测定中已被评分为阳性的细胞,可以在支持植物再生的介质中加以培养。在一个实施方案中,可通过包含其他物质,如生长调节剂来改良任何适合的植物组织培养基。可将组织维持在具有生长调节剂的基本培养基上,直到可得到足够的组织开始植物再生的努力时为止,或者在重复轮的手动选择之后,直到组织形态适合于再生时为止(例如,至少2周),然后转移到有助于芽形成的介质中。定期转移培养物,直到已经出现充分的芽形成时为止。一旦芽形成,将它们转移到有助于根形成的介质中。一旦形成足够的根,可将植物转移到土壤中,以便进一步生长和成熟。

分子确认

通过利用转化dna上存在的标志物基因所编码的性状对工程改造的植物材料进行选择或筛选,可以鉴定和分离转化的植物细胞、愈伤组织、组织、或植物。例如,可以通过在含有抑制量的抗生素或除草剂(转化基因构建体提供对该抗生素或除草剂的抗性)的培养基上培育工程改造的植物材料来实施选择。此外,也可通过筛选可能存在于重组核酸构建体上的任何可见标志物基因(例如,β-葡糖醛酸糖苷酶、萤光素酶、或gfp基因)的活性来鉴定转化的植物和植物细胞。这样的选择和筛选方法对于本领域技术人员是熟知的。可用于鉴定转基因植物的分子确认方法是本领域技术人员已知的。下面进一步描述几种示例性方法。

已描述了分子信标用于序列检测。简要地说,设计与侧翼基因组和插入物dna接点重叠的fret寡核苷酸探针。fret探针的独特结构导致它含有使荧光模块和猝灭模块保持非常靠近的二级结构。在热稳定聚合酶和dntp的存在下,使fret探针和pcr引物(一个引物在插入dna序列内,一个引物在侧翼基因组序列内)循环。在成功的pcr扩增之后,fret探针与靶序列的杂交导致探针的二级结构消除以及荧光模块和淬灭模块的空间分离。荧光信号指示由于成功的扩增和杂交导致的侧翼基因组/转基因插入序列的存在。这样的用于检测扩增反应的分子信标测定是本主题公开的实施方案。

水解探针测定,或者也称作(lifetechnologies,fostercity,calif.),是一种检测和定量dna序列之存在的方法。简要地说,设计fret寡核苷酸探针,其具有一段在转基因内的寡聚体,一段在侧翼基因组序列内的寡聚体,用于事件特异性检测。在热稳定聚合酶和dntp的存在下,使fret探针和pcr引物(一个引物在插入dna序列内,一个引物在侧翼基因组序列内)循环。fret探针的杂交导致荧光模块从fret探针上的猝灭模块被切断并释放。荧光信号指示由于成功的扩增和杂交导致的侧翼/转基因插入序列的存在。这样的用于检测扩增反应的水解探针测定是本主题公开的实施方案。

测定是检测和定量dna序列之存在的方法。简言之,利用被称为测定系统的基于聚合酶链反应(pcr)的测定法,筛选了包含整合的基因表达盒多核苷酸的基因组dna样品。在主题公开的实践中使用的测定可利用含有多种引物的pcr测定混合物。在pcr测定混合物中使用的引物可包括至少一个正向引物和至少一个反向引物。正向引物含有相应于dna多核苷酸的特定区域的序列,并且反向引物含有相应于基因组序列的特定区域的序列。另外,在pcr测定混合物中使用的引物可包括至少一个正向引物和至少一个反向引物。例如,pcr测定混合物可利用相应于两个不同等位基因的两个正向引物和一个反向引物。正向引物之一含有相应于内源基因组序列的特定区域的序列。第二正向引物含有相应于dna多核苷酸的特定区域的序列。反向引物含有相应于基因组序列的特定区域的序列。这样的用于检测扩增反应的测定法是本主题公开的实施方案。

在一些实施方案中,荧光信号或荧光染料选自下组:hex荧光染料、fam荧光染料、joe荧光染料、tet荧光染料、cy3荧光染料、cy3.5荧光染料、cy5荧光染料、cy5.5荧光染料、cy7荧光染料、和rox荧光染料。

在其他实施方案中,使用适合的第二荧光dna染料进行扩增反应,所述第二荧光dna染料能够在流式细胞术可检测的浓度范围内使细胞dna染色,并且具有通过实时热循环仪可检测的荧光发射光谱。本领域普通技术人员应当理解的是,其他核酸染料是已知的并且正在被不断地鉴定。可以采用具有适当激发和发射光谱的任何适合的核酸染料,如yo-pro-sytoxsybrgreen在一个实施方案中,第二荧光dna染料是以少于10μm、少于4μm、或少于2.7μm使用的

在进一步的实施方案中,下一代测序(ngs)可用于检测。如由brautigma等人在2010年所述,可以使用dna序列分析来确定分离和扩增的片段的核苷酸序列。可以分离扩增的片段并亚克隆到载体中,并使用链终止子法(也称为sanger测序)或染料终止子测序进行测序。另外,可以用下一代测序将扩增子测序。ngs技术不需要亚克隆步骤,并且可以在单个反应中完成多个测序读取。有三种ngs平台可商购:来自454lifesciences/roche的genomesequencerflxtm,来自solexa的illuminagenomeanalysertm和appliedbiosystems的solidtm(首字母缩写词,代表:“寡聚物连接和检测测序”(“sequencingbyoligoligationanddetection”)。另外,目前正在开发两种单分子测序方法。这些包括来自helicosbiosciencetm的真实单分子测序(tsms)和来自pacificbiosciences的单分子realtimetm测序(smrt)。

由454lifesciences/roche推向市场的genomesequencerflxtm是长读段ngs,其使用乳液pcr和焦磷酸测序来生成测序读段。可以使用300-800bp的dna片段或含有3-20kb片段的文库。反应每次运行可以产生超过100万个约250至400个碱基的读段,总产量为250至400兆碱基。与其他ngs技术相比,这种技术产生的读段最长,但每次运行的总序列输出较低。

由solexatm推向市场的illuminagenomeanalysertm是一种短读段ngs,其利用荧光染料标记的可逆终止子核苷酸的边合成边测序法,并且以固相桥式pcr为基础。可以使用含有高达10kb的dna片段的配对末端测序文库的构建。反应产生长度为35-76个碱基的超过1亿个短读段。这些数据每次运行可以产生3-6千兆碱基。

由appliedbiosystemstm推向市场的寡聚物连接和检测测序(solid)系统是一种短读段技术。这种ngs技术使用长度最多可达10kb的片段化双链dna。该系统使用通过染料标记的寡核苷酸引物的边连接边测序和乳液pcr,以生成10亿个短读段,其导致每次运行高达30千兆碱基的总序列输出。

helicosbiosciencetm的tsms和pacificbiosciencestm的smrt应用了一种不同的方法,所述方法使用单个dna分子进行序列反应。tsmshelicostm系统产生高达8亿个短读段,每次运行生成21千兆碱基。使用荧光染料标记的虚拟终止子核苷酸完成这些反应,其被描述为“边合成边测序”方法。

由pacificbiosciencestm推向市场的smrt下一代测序系统使用实时的边合成边测序。由于不受可逆终止子的限制,这种技术可以产生长度高达1,000bp的读段。使用这种技术每天可以产生相当于二倍体人类基因组的一倍覆盖度的原始读取通量。

在另一个实施方案中,可以使用包括western印迹、northern印迹和southern印迹在内的印迹测定法完成检测。此类印迹测定法是在生物样品的鉴定和定量的生物研究中常用的技术。这些测定法包括首先通过电泳分离凝胶中的样品组分,接着将电泳分离的组分从凝胶转移到用诸如硝酸纤维素、聚偏二氟乙烯(pvdf)或尼龙的材料制成的转移膜上。也可以将分析物直接点样在这些支持物上,或通过施加真空、毛细管作用或压力而定向到支持物上的特定区域上,而不需要预先分离。然后通常对转移膜进行转移后处理,以增强分析物彼此区分和在视觉上或通过自动读取器被检出的能力。

在一个另外的实施方案中,可以使用elisa测定法来完成检测,所述elisa测定法使用固相酶免疫测定法检测液体样品或湿样品中物质(通常是抗原)的存在。将来自样品的抗原附着在平板的表面上。然后,将另一种特异性抗体施用在该表面上,使得它可以与所述抗原结合。这种抗体是与酶连接的,并且,在最后的步骤中,添加含有该酶的底物的物质。随后的反应产生可检测信号,最常见的是底物中的颜色变化。

转基因植物

在一个实施方案中,植物、植物组织、或植物细胞包含玉米grmzm2g047720启动子。在一个实施方案中,植物、植物组织或植物细胞包含玉米grmzm2g047720启动子,所述启动子具有选自seqidno:1的序列或与选自seqidno:1的序列具有至少80%、85%、90%、95%或99.5%序列同一性的序列。在另一个实施方案中,植物、植物组织或植物细胞包含玉米grmzm2g0477203’utr,所述3’utr具有选自seqidno:5的序列或与选自seqidno:5的序列具有至少80%、85%、90%、95%或99.5%序列同一性的序列。在另一个实施方案中,植物、植物组织或植物细胞包含与5'utr可操作连接的来自seqidno:1的玉米grmzm2g047720启动子。在一个实施方案中,植物、植物组织或植物细胞包含基因表达盒,所述基因表达盒包含选自seqidno:1的序列,或与非grmzm2g047720转基因可操作连接的与选自seqidno:1的序列具有至少至少80%、85%、90%、95%或99.5%序列同一性的序列。在说明性实施方案中,植物、植物组织、或植物细胞包含含有与转基因可操作连接的玉米grmzm2g047720启动子的基因表达盒,其中所述转基因可以是杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、dna结合转基因、可选择标志物转基因、或它们的组合。

根据一个实施方案,提供了植物、植物组织或植物细胞,其中植物、植物组织或植物细胞包含与转基因可操作连接的非内源grmzm2g047720基因衍生的启动子序列,其中玉米grmzm2g047720启动子衍生的启动子序列包含seqidno:1的序列或与seqidno:1具有至少80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,提供了植物、植物组织、或植物细胞,其中所述植物、植物组织、或植物细胞包含与非grmzm2g047720转基因可操作连接的seqidno:1或与seqidno:1具有至少80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,所述植物、植物组织、或植物细胞为双子叶或单子叶植物或来源于双子叶或单子叶植物的细胞或组织。在一个实施方案中,所述植物选自下组:玉蜀黍、小麦、水稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、向日葵、和卡诺拉。在一个实施方案中,所述植物为大豆。根据一个实施方案,所述植物、植物组织、或植物细胞包含与非grmzm2g047720转基因可操作连接的seqidno:1或与seqidno:1具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,所述植物、植物组织、或植物细胞包含与转基因可操作连接的启动子,其中所述启动子的组成为seqidno:1或与seqidno:1具有80%、85%、90%、95%或99.5%序列同一性的序列。根据一个实施方案,包含与转基因可操作连接的玉米grmzm2g047720启动子序列的基因构建体被组入植物、植物组织、或植物细胞的基因组中。

在一个实施方案中,提供了非玉米栽培种b73植物、植物组织、或植物细胞,其包含与转基因可操作连接的seqidno:1或与seqidno:1具有至少80%、85%、90%、95%或99.5%序列同一性的序列。根据一个实施方案,所述非玉米栽培种b73植物、植物组织、或植物细胞为双子叶或单子叶植物或来源于双子叶或单子叶植物的植物细胞或组织。在一个实施方案中,所述植物选自下组:玉蜀黍、小麦、水稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、向日葵、和卡诺拉。在一个实施方案中,所述植物为大豆。根据一个实施方案,与转基因可操作连接的启动子序列被组入植物、植物组织、或植物细胞的基因组中。

在一个实施方案中,提供了非玉米栽培种b73植物、植物组织、或植物细胞,其包含与转基因的5'端可操作连接的seqidno:1或与seqidno:1具有至少80%、85%、90%、95%或99.5%序列同一性的序列、以及包含seqidno:5或与seqidno:5具有至少80%、85%、90%、95%或99.5%序列同一性的序列的3'非翻译序列,其中3'非翻译序列与所述转基因可操作连接。在另一个实施方案中,提供了非玉米栽培种b73植物、植物组织、或植物细胞,其包含与5'非翻译序列的3'端可操作连接的seqidno:1或与seqidno:1具有至少80%、85%、90%、95%或99.5%序列同一性的序列,其中所述5'非翻译序列与所述转基因可操作连接。根据一个实施方案,所述非玉米栽培种b73植物、植物组织、或植物细胞为双子叶或单子叶植物或来源于双子叶或单子叶植物的植物组织或细胞。在一个实施方案中,所述植物选自下组:玉蜀黍、小麦、水稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、向日葵、和卡诺拉。在一个实施方案中,所述植物为大豆。根据一个实施方案,与转基因可操作连接的启动子序列被组入植物、植物组织、或植物细胞的基因组中。

在一个实施方案中,根据本文中公开的方法的植物、植物组织、或植物细胞可以是单子叶植物。所述单子叶植物、植物组织、或植物细胞可以是,但不限于玉米、水稻、甘蔗、大麦、黑麦、高粱、兰花、竹子、香蕉、香蒲、百合、燕麦、洋葱、小米、柳枝稷、草坪草和黑小麦。

在一个实施方案中,根据本文中公开的方法的植物、植物组织、或植物细胞可以是双子叶植物。双子叶植物、植物组织或植物细胞可以是,但不限于苜蓿、油菜、卡诺拉、芥菜、埃塞俄比亚芥、大豆、向日葵、棉花、豆类、西兰花、卷心菜、花椰菜、芹菜、黄瓜、茄子、莴苣;甜瓜、豌豆、胡椒、花生、马铃薯、南瓜、萝卜、菠菜、甜菜、向日葵、烟草、番茄和西瓜。

本领域技术人员将认识到,在外源序列稳定组入转基因植物中并经证实为可操作之后,可通过有性杂交将其引入其他植物中。可以使用许多标准育种技术中的任何一种,这取决于被杂交的物种。

本发明公开还包括上述转基因植物的种子,其中所述种子具有含有本主题公开的基因调控元件的转基因或基因构建体。本发明公开进一步包括上述转基因植物的后代、克隆、细胞系或细胞,其中所述后代、克隆、细胞系或细胞具有含有本主题公开的基因调控元件的转基因或基因构建体。

本发明公开还包括上述转基因植物的培育,其中所述转基因植物具有含有本主题公开的基因调控元件的转基因或基因构建体。因此,通过用根据本发明的核酸分子转化,这样的转基因植物可以被工程改造为特别地具有一个或多个期望的性状或含有本主题公开的基因调控元件的转基因事件,并且可以通过本领域技术人员已知的任何方法加以种植或培育。

表达转基因的方法

在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含与至少一个转基因或多接头序列可操作连接的玉米grmzm2g047720启动子的植物。在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含与至少一个转基因或多接头序列可操作连接的玉米grmzm2g047720启动子和5’utr的植物。在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含与至少一个转基因或多接头序列可操作连接的玉米grmzm2g0477203’utr的植物。在一个实施方案中,玉米grmzm2g047720启动子由选自seqidno:1的序列或与选自seqidno:1的序列具有至少80%、85%、90%、95%或99.5%序列同一性的序列组成。在另一个实施方案中,玉米grmzm2g0477203’utr由选自seqidno:5的序列或与选自seqidno:5的序列具有至少80%、85%、90%、95%或99.5%序列同一性的序列组成。在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含与至少一个转基因可操作连接的玉米grmzm2g047720启动子和玉米grmzm2g0477203’utr的植物。在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含与至少一个转基因可操作连接的玉米grmzm2g047720启动子和5’utr的植物。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含与至少一个转基因可操作连接的玉米grmzm2g047720启动子的植物组织或植物细胞。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含与至少一个转基因可操作连接的玉米grmzm2g047720启动子和玉米grmzm2g0477203’utr的植物组织或植物细胞。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含与至少一个转基因可操作连接的玉米grmzm2g047720启动子和5’utr的植物组织或植物细胞。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含与至少一个转基因可操作连接的玉米grmzm2g047720启动子和玉米grmzm2g0477203’utr的植物组织或植物细胞。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含与至少一个转基因可操作连接的玉米grmzm2g047720启动子和5’utr的植物组织或植物细胞。

在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含含有与至少一个转基因可操作连接的玉米grmzm2g047720启动子的基因表达盒的植物。在一个实施方案中,玉米grmzm2g047720启动子由选自seqidno:1的序列或与选自seqidno:1的序列具有至少80%、85%、90%、95%或99.5%序列同一性的序列组成。在另一个实施方案中,玉米grmzm2g0477203’utr由选自seqidno:5的序列或与选自seqidno:5的序列具有至少80%、85%、90%、95%或99.5%序列同一性的序列组成。在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含含有与至少一个转基因可操作连接的玉米grmzm2g047720启动子和玉米grmzm2g0477203’utr的基因表达盒的植物。在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含含有与至少一个转基因可操作连接的玉米grmzm2g047720启动子和5’utr的基因表达盒的植物。在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含含有与至少一个转基因可操作连接的玉米grmzm2g0477203’utr的基因表达盒的植物。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含含有与至少一个转基因可操作连接的玉米grmzm2g047720启动子的基因表达盒的植物组织或植物细胞。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含含有与至少一个转基因可操作连接的玉米grmzm2g0477203’utr的基因表达盒的植物组织或植物细胞。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含含有与至少一个转基因可操作连接的5’utr的基因表达盒的植物组织或植物细胞。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含与至少一个转基因可操作连接的基因表达盒、玉米grmzm2g047720启动子和玉米grmzm2g0477203’utr的植物组织或植物细胞。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含与至少一个转基因可操作连接的基因表达盒、玉米grmzm2g047720启动子和5’utr的植物组织或植物细胞。

提供以下实施例以展示某些具体特征和/或实施方案。不应将这些实施例解释为将本公开限制为所例示的具体特征或实施方案。

实施例

实施例1:新的启动子和其他调控元件的分离

通过分析公众可获得的玉米幼苗的转录组,鉴定了新的玉米grmzm2g047720基因调控元件。鉴定、分离并克隆这些调控元件,以表征在转基因植物中使用的所述调控元件的表达谱。产生了用分离自苏云金芽孢杆菌的cry3ab1基因和源自食除草剂鞘氨醇菌(sphingobiumherbicidovorans)的aad-1可选择标志物基因稳定转化的转基因玉米品系,并评估了转基因表达水平和组织特异性。如此,鉴定和表征了新的玉米grmzm2g047720基因调控元件。公开了在基因表达构建体中使用的启动子和3’utr调控元件。

三个数据来源被视为排出了在玉米幼苗的芽和根中的高表达玉米基因的优先顺序:1)截至2010年进行该研究时,在公共玉米数据库中存在35,000个玉米基因序列及其注释;2)v4芽和根的总玉米转录组的基因表达数据(wang等人,[2009],theplantcell;21:1053–1069);以及3)9,000个基因的全长cdna序列(alexandrov,n.等人,[2009]plantmolecularbiology;69:179–194)。在该研究中,将基因表达数据与9,000个全长cdna序列和35,000个玉米基因进行比对。基于每百万个映射的片段中每千碱基外显子的片段数(fpkm)值(基因表达的一种定量测量),对玉米芽和根组织各自鉴定了500个最佳表达基因。

因为转基因表达要求的是在玉米植物的整个生命周期中的转基因表达,所以从叶的3个不同阶段(v4、v12和r3)、2个不同的根发育阶段(v4和v12)和花粉的一个阶段(r1)分离总mrna用于转基因表达分析。将玉米栽培种b73玉米基因型用于所有分析。在排出优先顺序的500个基因中,对约150个最佳表达基因进行定量pcr,以确认基因表达。结果鉴定了这些基因的子集作为叶和根优选表达的最佳表达基因。

来自玉米grmzm2g047720基因调控元件(seqidno:1)的启动子是从玉米基因组dna(gdna)序列鉴定的2,065bp的多核苷酸序列。根据跨越数百万个碱基对的连续染色体序列的评估,鉴定并分离了一个2,065bp的多核苷酸序列,用于表达异源编码序列。分析这个新的多核苷酸序列,将其用作驱动基因的表达的调控序列。如在下文的序列(seqidno:2)中所示,具有seqidno:1的2,065bp玉米grmzm2g047720启动子被提供为碱基对1–2,065。具有seqidno:4的天然基因编码序列被提供为seqidno:2的碱基对2,066–3,027(atg起始密码子和taa终止密码子以大写字母显示)。具有seqidno:5的1,023bp玉米grmzm2g0477203’utr被提供为seqidno:2的碱基对3,028–4,050。

cgaccaaccataggatgtataaggcctttaggcccaaaaacaggcatcgctgatttttggcagattctggacgtcatcttgggacaatgattcccatcagctccgagcatatttttctgtgggaccaattgggttggaaagtttatctccttagctttcaacagtatctagaacgtccaaaacgaagtccgtatgtgatctgggcatccatttttgtgaggaacactcctagagtcctaacctgattcgtgaataaattggacttcaactctccttgagcttgggactctatgattgattgggccttgaccatatagttgacgtccatgtactcatcattctccccatcttagttttgagtcatactcgactgaaagtcgttggtgcctgcataaggtgttgatgtagtgcttgattgcttgatgttgtccaaacttgctccccttcttgaagttgatcctgttgttgtaaaatatacaaagaaggacaagtcgaactggacgtgatatggttagctttaaaacaaccctctaatttatcatattgttttatgacaaaagacgatttcatatttgaacaaatatatatatactcgatgtgtcatatattctcctttccaattatatcttccaataacatgatatatatatttagataaccatggaaaataaacactaaaagaaagtttctcctctaaattatttagattacatagaacatcaaattcaatataacccaaagtatttaaagaagtaacaatttcaactcatcatgcacactagttatgggattgaatattctatttcaacacaactaataggattggaagcaacaatatcaagtttgttctcaagttttggcatataattaatagaagaatcatcactcaactccttgttatcaaaagaatcaatagtacaatcatcgtgtaacaaaagtaacttagatctatttgaagtcatggcatgatgggaagaaacaaattgttctctcataagcactttcatatcagctcaagtgtgtggtttgtcatagtcatgcaatttgttccaccaaactaatgcatgattcgttaaagtactagccacaattttaatttttctcctatcatatatacgacatcgtgcaaaaatcttatccattgatactttccatttagtatactcatttccaatatttttatcaaaagaagagaaaaatggatatatagaacacgggaggacgaattagcattaatggtgtggctctcatattatattacaaccatgccctcaattcctatacatacgaactatgaaatctagtaggggcaacatcgtcgtttcattcgcaagccttgacgtgcacatcagtaaatcctctttttgtctccttgtcgtgtgtttcgaactccacaatgtgcttcgtctactcactcgaggttgagcttcgttcattccattttcgaccttcgttaaagagttaaataccttcggcatgcatagaatgattacctttggaacaaatctcaaggaagttaagattaggtcattttgttgaccttcggcaaaagacttttcccccaacaacatccaaataatcgtggtggtttttatggatgttaggttgtctccaacatattttctatcccacttcttatctcatccaatattttaaaattcactctgtaaacagtacaaatgacaacgaaaaaacggtgttttacacattcgtatacatggtctgccgaaaacagtcttattggagatactgtaagggtgttatgtttcagtacccgagtctgtgcagaagctaagaaacagtccctcggtgggcctggcgtacgttctacaatcagtctcgggaatgagaggccatacatggattttgaagatagggaggcagccaatcacaggcaagcatctggccacatgtgcactcacacgactcagggcgagaggacagcagggcacaataaccgttccactttggtccataggagcgcatagcacagcacaaggagaggccgagaagcgctttagccgtagccgtagcgataagagtgagctagctggtgcacaccggcatggcggccacggcgtactccgtggcgctcctcggcggcgcgcgcctccccgccgctccgcgctccgccctcctccctcggcgcagcgtctgccagcttcgcttccaaggtaataactagattgctcatctgaccgacgtcgttttagaggattattcacccgtgccctcgcggctttgcagatgcaccgaggctctccctgctccgtgcgaaggccgcttccgaggacacatcggcctccggcgacgagttgatcgaggacctcaaagcgaaggtacgtacctgccagttgccgtccgtcgcccgtccacaaataatggacggacatgcctactggccatatatatctcaggcaacaatgcgcatgccttgacctcaccccgttctgttctgtgcctttgacttctggcttgcagtgggacgccgttgaggacaagcccaccgtcctcttgtacggcggcggcgccgtcgtcgccctatggctgacgtccgtggtcgtgggcgccatcaacgccgtgccgctggtatgtagtgtcccgtgtccgtcagggaacaccgtacctggagtatatatcattccagtccaattctgctctaaattgcgctaaccggccgtggtgttcttgagcagctccccaagatcctggagctcgttgggctcggctacaccggctggttcgtgtaccgctaccttctctttaaggtaaatgataagcatccactacctgtaatatatacactactttgcaatatatatatatgctgagcccactgaatgttcaatttggaaattggaatgcaatataatttttttgcaattgtcttaattaatcctgttcatacaaagaagctctcttacataaatgtccttggttcttgttttactccggttacaggaaagcaggaaagagttggccgccgacattgagaccttgaagaaaaaaatagctggaacagaataaacgctcatggaaagttttagagcgtcctttcttctttggaaagagatctattcgatcggagaaccaatatgcaactacttgagtactattattgcccatgtattgtgtgctgtatatcttctgtatacaaaggaaggttcgtttgttatgtacgtagtagcattgtagtttaaatgtatcgtattacctatctgctaaattcttctttttgatttagcaattttattgtacgtaaacaaaaataagggtaaaacaaatagagtgtgtaatctataccaatattaagaacttattcgataacataaataatatacaattgtaacatgaataaattattcctttgattccaaattcgatctaggccaccttagttttgttgtaagtcaaaatcctttaatcactaccggaatccgggtctttgccgagtgctttttatcgggcactcggcaaaggttgctttgccgagagccgcactcggcaaagtcccgctctcggtaacgaggtagtttaccgagtgcaggatactcggcacaggaaaactctcggcaaagacaattttaccgagtggcaaacactcggcaaaggcggctctcggcaaagggccgtcagcggccgttctaaagctgacggccgtcagcctttgccgagggccgagggtcggcactcggcaaagaactctttaccgagtgtcttctgtggacactcggcaaaacatatttttattttttaaattttgtccaccaaacttttttgtggtatgttactatactatgtagacctacatgtatcatttgtggacaattataacagagttttcaatcgatagtagatttagtccgtttatttgaatttgttcggaaaattcagatttgaactgcaggtcactcgaaacttgaaaaaccgtgcttgcaaaaatgatatacatgctacttagcacaaagttacgaccgattccacgagcggactggaaacttcgagcaacatgctcactaaacatggccgtgaacttgtcatccacatgtt(seqidno:2)

实施例2:载体构建

构建以下载体以在转基因上游组入玉米grmzm2g047720启动子。载体构建体pdab108739含有基因表达盒,其中cry34ab1转基因(来自苏云金芽孢杆菌的报告基因)由具有seqidno:1的玉米grmzm2g047720启动子驱动,并且其侧翼为具有seqidno:5的玉米grmzm2g0477203'utr。这个基因表达盒的图解示于图1中,并被提供为seqidno:3。该载体还含有可选择标志物基因表达盒,所述表达盒含有由玉米泛素1启动子(christensen等人,(1992)plantmolecularbiology18;675-689)驱动的aad-1转基因(美国专利no.7,838,733),并且由玉米脂肪酶3'-utr(美国专利no.7,179,902)终止。这个基因表达盒的图解示于图1中,并被提供为seqidno:15。

通过外部供应商(geneartvialifetechnologies,carlsbad,ca)合成新设计的玉米grmzm2g047720启动子和玉米grmzm2g0477203'utr序列并且使用无缝克隆和组装试剂盒(lifetechnologies)和限制酶将所述启动子克隆到gatewaytm(lifetechnologies)供体载体中来构建这个构建体。使用gatewaytm克隆系统(lifetechnologies)将得到的供体载体整合到最终的二元目的载体中。获得pdab108739的克隆并通过限制酶消化和测序加以确认。得到的构建体含有可以稳健驱动转基因表达的启动子,所述转基因与所述启动子的3'端可操作连接。

组装含有phi-yfp报告基因转基因(shagin等人,2004,molbiolevol21;841-50)而不是cry34ab1基因的对照构建体pdab101556。cry34ab1转基因由玉米泛素-1启动子(christensen等人,(1992)plantmolecularbiology18;675-689)和玉米过氧化物酶53’utr调控元件驱动。这个对照构建体含有与pdab108739中存在的相同的aad-1表达盒。使用与pdab108739相同的试剂和方案将这个对照构建体转化到植物中。

实施例3:玉米转化

根癌土壤杆菌的转化:

将二元表达载体转化到根癌土壤杆菌菌株dat13192(reca缺陷型三重菌株)中(国际专利公开号wo2012016222)。选择细菌菌落,分离二元质粒dna并经由限制酶消化加以确认。

土壤杆菌培养启动:

将土壤杆菌培养物从甘油储液划线接种在ab基本培养基(gelvin,s.,2006,agrobacteriumvirulencegeneinduction,inwang,k.,ed.,agrobacteriumprotocolssecondeditionvol.1,humanapress,第79页;没有蔗糖,具有5g/l葡萄糖和15g/lbactotm琼脂)上并在20℃下在黑暗中温育3天。然后将土壤杆菌培养物划线接种在yep培养基(gelvin,s.,2006,agrobacteriumvirulencegeneinduction,inwang,k.,ed.,agrobacteriumprotocolssecondeditionvol.1,humanapress,第79页)的平板上并在20℃下在黑暗中温育1天。

在实验当天,以适合于实验大小的体积制备接种培养基(2.2g/lms盐、68.4g/l蔗糖、36g/l葡萄糖、115mg/ll-脯氨酸、2mg/l甘氨酸、100mg/l肌醇、0.05mg/l烟酸、0.5mg/l盐酸吡哆辛、0.5mg/l盐酸硫胺素)的混合物和乙酰丁香酮。将100%二甲亚砜中的1m乙酰丁香酮储备溶液添加到接种培养基中,以产生200μm的乙酰丁香酮终浓度。

对于每种构建体,从yep平板将1-2环土壤杆菌悬浮在一次性50ml无菌离心管内15ml的接种培养基/乙酰丁香酮混合物中,在分光光度计中在600nm(o.d.600)处测量溶液的光密度。然后使用另外的接种培养基/乙酰丁香酮混合物将悬液稀释降到0.25-0.35o.d.600。然后在使用之前将土壤杆菌悬液的管水平放置在设置为在室温下约75rpm的平台摇床上1到4小时。

玉米转化:

通过从近交系玉米栽培种b104分离的未成熟胚的土壤杆菌介导的转化将实验构建体转化到玉米中。使用的方法类似于ishida等人,(1996)naturebiotechnol14:745–750和frame等人,(2006)plantcellrep25:1024–1034所公开的方法,但是进行了若干修改和改进,以产生适合于高通量转化的方法。用于在玉米中产生许多转基因事件的方法的实例在美国专利申请公开号us2013/0157369a1中给出,从胚感染和共培养步骤开始。

将推定的t0转基因小植株从phytatraystm(sigma-aldrich;st.louis,mo)移栽到充填有生长培养基(premixbx;premiertechhorticulture)的小型3.5英寸塑料盆(t.o.plastics;clearwater,mn)中,用湿度控制圆顶(humidome)(arcoplasticsltd.)覆盖,然后在生长室中炼苗(白天28℃/夜晚24℃,16小时光周期,50-70%rh,200μem-2sec-1光强度)。当植物达到v3-v4发育阶段(可见3-4片叶圈)时,将它们移栽到sunshinecustomblend160tm土壤混合物中并在温室中(光曝露类型:光合或同化作用;高光限:1200par;16小时昼长;白天27℃/夜晚24℃)培养至开花。通过使用设计用于检测转基因的相对拷贝数的引物的qpcr测定法分析植物的转基因拷贝数,并将进一步选择的推定单拷贝事件移栽到5加仑盆中。

实施例4:基因拷贝数和蛋白质表达的分子确认

转基因存在和拷贝数的估计:

在v2-3叶期对玉米植物取样,并使用cry34ab1和aad-1定量pcr测定法筛选转基因的存在和它们的拷贝数。使用来自qiagentm的magattractdnaextractionkittm按照制造商的说明从叶样品中提取总dna。

然后用引物/探针组扩增dna片段,所述引物/探针组含有用于cry34ab1基因的fam标记的荧光探针和用于内源转化酶参考基因的hex标记的荧光探针。以下引物用于cry34ab1和转化酶基因扩增。

cry34ab1引物/探针:

seqidno:6(tq.8v6.1.f):gccataccctccagttg

seqidno:7(tq.8v6.1.r):gccgttgatggagtagtagatgg

探针:seqidno:8(tq.8v6.1.mgb.p):5’-/fam/ccgaatccaacggcttca/mgb/-3’

转化酶引物:

seqidno:9(转化酶f):tggcggacgacgacttgt

seqidno:10(转化酶r):aaagtttggaggctgccgt

seqidno:11(转化酶探针):5’-/hex/cgagcagaccgccgtgtactt/3bhq_1/-3’

pcr反应在终体积10μl中进行,其含有5μl的rochelightcycler480probesmastermixtm(rocheappliedsciences,indianapolis,in;目录号04887301001);来自10μm储液至终浓度400nm的tq.8v6.1.f、tq.8v6.1.r、转化酶f和转化酶r引物各0.4μl;来自5μm储液至终浓度200nm的各种探针、tq.8v6.1.mgb.p和invertaseprobe各0.4μl,终浓度为0.1%的0.1μl的10%聚乙烯吡咯烷酮(pvp);2μl的10ng/μl的基因组dna和0.5μl水。在rochelightcycler480systemtm中在下列条件下扩增dna:95℃10分钟1个循环;40个循环的下列3个步骤:95℃10秒;58℃35秒和72℃1秒,以及4℃10秒的最后一个循环。通过将未知样品的靶/参考值(由lightcycler480输出)与cry34ab1拷贝数对照的靶/参考值进行比较来确定cry34ab1拷贝数。

使用转化酶内源参考基因如上对cry34ab1基因所述进行aad-1基因检测。aad-1引物序列如下;pcr循环保持不变:

seqidno:12(aad1正向引物):tgttcggttccctctaccaa

seqidno:13(aad1反向引物):caacatccatcaccttgactga

seqidno:14(aad1探针):

5’fam/cacagaaccgtcgcttcagcaaca-mgb/bhq3’

筛选t0植物用于转基因表达:

将含有cry34ab1和aad-1转基因并在温室中生长的t0植物在v4-5发育阶段取样,用于叶elisa测定。对四个叶片(leafpunch)取样。通过将1/8”不锈钢珠(hooverprecisionproducts,cumming,ga,usa)添加到含有叶片和300μl补充有0.05%吐温20和0.5%bsa的提取缓冲液(1xpbst[[fischerscientific,st.louis,mo])的每个1.2ml管中来制备用于elisa测定的蛋白质提取物。将样品在genogrindertm(spexsampleprep,metuchen,nj)中以1,500rpm处理4分钟。将样品在sorvalllegendxfrtm离心机中以4,000rpm离心2分钟。在这个步骤之后,将另外300μl提取缓冲液添加到样品中,并且在genogrindertm中以1,500rpm将它们再次处理2分钟。将样品以4,000rpm离心7分钟。收集上清液,连同cry34ab1和aad-1蛋白质标准品完成在不同稀释度下的elisa。按照制造商的说明进行cry34ab1(agdia,inc.;目录号04500/4800)和aad-1(acadiabioscience,llc;目录号abs-041)elisa测定,elisa结果表示为ng/cm2叶表面积或百万分率(或每mg总植物蛋白的靶蛋白的ng数)。

将另一组植物在v4-5时对整个根质量取样。将样品立即冷冻并冻干一周,然后研磨。如上对叶样品所述进行elisa。按照制造商的说明(thermoscientific/pierce,usa),用bradford检测方法进行总根蛋白估计。根elisa结果表示为百万分率(或每mg总植物蛋白的靶蛋白的ng数)。

筛选t1植物用于转基因检测和基因表达:

使t0植物与玉米栽培种b104互交,获得t1种子。每个调控元件构建体的三至五个t1系(或事件)进一步用于蛋白质表达研究。播种每个事件的大约40粒t1种子,用ii喷洒v2-3发育阶段的幼苗以杀死无效植物。对所有存活的植物取样,如上所述进行转基因拷贝数测定。

为了转基因的基因表达分析,在如下多个生长和发育阶段对植物取样:叶(v4、v12和r3);根(v4);茎、花粉、穗丝(都在r1)以及籽粒和穗轴(都在r3)。所有组织均取样到嵌入干冰的管中;然后在取样完成后立即转移至-80℃。冻干冷冻组织,然后提取蛋白质用于elisa。

如对前面部分中所述的t0样品所述进行蛋白质提取用于叶elisa。例如,通过在8个0.25”陶瓷珠(mpbiomedicals,usa)存在下在油漆搅拌器中将冻干组织在50ml管中研磨30秒,进行用于各种组织类型的elisa的蛋白质提取。对于需要进一步研磨另外30秒的某些组织重复该步骤。然后在2ml聚丙烯管中提取蛋白质,所述聚丙烯管含有足够的覆盖管的弯曲底部的石榴石粉。将粗磨的组织转移到2ml管中以装填至0.3ml标记处。然后向每个管中加入一个0.25”的陶瓷球和0.6ml提取缓冲液(200μl蛋白酶抑制剂混合物[[researchproductsinternationalcorp.,solon,oh,usa]、200μl的500mmedta、15.5mgdtt粉和pbst至20ml)。将所有管在冰上保持10分钟,然后在genogrindertm中处理45秒。接下来,将40μl的10%tween-20和另外300μl提取缓冲液加入管中,将样品再研磨45秒。将管以13,000rpm离心7-14分钟。将上清液小心地转移到新的管中。对于elisa测定,在需要时将提取物在提取缓冲液中稀释。elisa结果表示为ng/cm2叶表面积或百万分率(或每mg总植物蛋白的蛋白质ng数)。

实施例5:与玉米grmzm2g047720启动子和3'utr调控元件可操作连接的基因的表达

用含有如上所述的玉米grmzm2g047720启动子和玉米grmzm2g0477203’utr的基因表达构建体转化玉米植物。elisa分析证实,该新的启动子驱动了转基因的显著表达,并且该新的3'utr有效终止了所述转基因的表达。从包含新的启动子构建体的转基因植物获得的cry34ab1蛋白的定量测量显示在表1中。数据显示,在含有新的玉米grmzm2g047720启动子和玉米grmzm2g0477203'utr(即pdab108739)的植物中,cry34ab1蛋白在诸如叶、茎、穗轴、籽粒和穗丝组织的大多数植物组织中表达。此外,数据显示,在含有新的玉米grmzm2g047720启动子和玉米grmzm2g0477203'utr(即pdab108739)的植物中,cry34ab1蛋白在根组织中不表达。

表1:cry34ab1和aad-1的玉米grmzm2g047720启动子t1表达叶elisa结果表示为每cm2的靶蛋白ng数,而其余组织类型结果表示为每mg总蛋白的靶蛋白ng数。

*o只完成了定性elisa。

nd=未确定。

cry34ab1elisa结果表明,在除了根之外的所测试的所有组织类型的t1事件中,存在于构建体pdab108739中的玉米grmzm2g047720启动子调控元件(seqidno:1)和玉米grmzm2g0477203'utr(seqidno:5)驱动了cry34ab1表达。例如,在用构建体pdab108739转化的t1事件中,在叶、茎、穗轴、籽粒和穗丝优选的cry34ab1表达方面,cry34ab1蛋白通过玉米grmzm2g047720启动子调控元件(seqidno:1)和玉米grmzm2g0477203'utr(seqidno:5)表达。转化产生的事件也在叶和根组织中稳健表达aad-1蛋白。总之,开发了在所有地上组织中显示出显著转基因表达的玉米grmzm2g047720启动子。

实施例6:与玉米grmzm2g047720启动子可操作连接的基因的作物转化

通过利用先前在专利申请wo2007/053482的实施例11或实施例13中描述的相同技术,可以用与玉米grmzm2g047720启动子可操作连接的基因转化大豆。

通过利用先前在美国专利no.7,838,733的实施例14或在专利申请wo2007/053482(wright等人)的实施例12中描述的相同技术,可以用与玉米grmzm2g047720启动子可操作连接的基因转化棉花。

通过利用先前在美国专利no.7,838,733的实施例26或在专利申请wo2007/053482(wright等人)的实施例22中描述的相同技术,可以用与玉米grmzm2g047720启动子可操作连接的基因转化卡诺拉。

通过利用先前在专利申请wo2013/116700a1(lira等人)的实施例23中描述的相同技术,可以用与玉米grmzm2g047720启动子可操作连接的基因转化小麦。

通过利用先前在专利申请wo2013/116700a1(lira等人)的实施例19中描述的相同技术,可以用与玉米grmzm2g047720启动子可操作连接的基因转化水稻。

实施例7:与玉米grmzm2g047720启动子可操作连接的基因的土壤杆菌介导的转化

根据本主题公开,可根据本主题公开的实施方案使用本领域已知的技术转化另外的作物。对于土壤杆菌介导的黑麦转化,参见,例如popelkajc,xuj,altpeterf.,“generationofryewithlowtransgenecopynumberafterbiolisticgenetransferandproductionof(secalecerealel.)plantsinstantlymarker-freetransgenicrye,”transgenicres.2003oct;12(5):587-96.)。对于土壤杆菌介导的高粱转化,参见,例如zhao等人,“agrobacterium-mediatedsorghumtransformation,”plantmolbiol.2000dec;44(6):789-98。对于土壤杆菌介导的大麦转化,参见,例如tingay等人,“agrobacteriumtumefaciens-mediatedbarleytransformation,”theplantjournal,(1997)11:1369–1376。对于土壤杆菌介导的小麦转化,参见,例如cheng等人,“genetictransformationofwheatmediatedbyagrobacteriumtumefaciens,”plantphysiol.1997nov;115(3):971-980。对于土壤杆菌介导的水稻转化,参见,例如hiei等人,“transformationofricemediatedbyagrobacteriumtumefaciens,”plantmol.biol.1997sep;35(1-2):205-18。

这些和其他植物的拉丁名称在下面给出。应当清楚的是,可使用其他(非土壤杆菌)转化技术将例如与玉米grmzm2g047720启动子可操作连接的基因转化到这些和其他植物中。例子包括但不限于;玉蜀黍(zeamays)、小麦(triticumspp.)、水稻(oryzaspp.和zizaniaspp.)、大麦(大麦属(hordeumspp.))、棉花(水麻(abromaaugusta)和棉属(gossypiumspp.))、大豆(glycinemax)、糖用甜菜和食用甜菜(betaspp.)、甘蔗(秀贵甘蔗(saccharumofficinarum)和其他物种)、羽叶棕榈(featherpalm)(桄榔(arengapinnata))、番茄(lycopersiconesculentum和其他种类、粘果酸浆(physalisixocarpa)、黄水茄(solanumincanum)和其他种类、以及树番茄(cyphomandrabetacea))、马铃薯(solanumtuberosum)、甘薯(ipomoeabatatas)、黑麦(secalespp.)、辣椒(capsicumannuum、中国辣椒(chinense)、以及小米椒(capsicumfrutescens))、莴苣(山莴苣(lactucasativa)、宿根莴苣(perennis)、以及野莴苣(pulchella))、卷心菜(brassicaspp.)、芹菜(apiumgraveolens)、茄子(solanummelongena)、花生(arachishypogea)、高粱(sorghumspp.)、苜蓿(medicagosativa)、胡萝卜(daucuscarota)、豆类(菜豆属(phaseolusspp.)和其他属)、燕麦(avenasativa和strigosa)、豌豆(豌豆属(pisum)、豇豆属(vigna)、和tetragonolobusspp.)、向日葵(helianthusannuus)、南瓜(cucurbitaspp.)、黄瓜(cucumissativa)、烟草(nicotianaspp.)、拟南芥(arabidopsisthaliana)、草坪草(黑麦草属(lolium)、剪股颖属(agrostis)、早熟禾属(poa)、狗牙根属(cynodon)、以及其他属)、三叶草(trifolium)、巢菜属(vicia)。例如,在本主题公开的实施方案中考虑了用与玉米grmzm2g047720启动子可操作连接的基因转化这样的植物。

使用玉米grmzm2g047720启动子来驱动可操作连接的基因可以在许多落叶和常绿木材物种中采用。这样的应用也在本公开的实施方案的范围内。这些种类包括,但不限于;桤木(桤木属(alnusspp.))、白蜡木(ash)(梣属(fraxinusspp.))、白杨和杨树种类(杨属(populusspp.))、山毛榉(山毛榉属(fagusspp.))、桦树(桦木属(betulaspp.))、樱桃(李属(prunusspp.))、桉树(桉树属(eucalyptusspp.))、山胡桃树(山核桃属(caryaspp.))、枫树(枫属(acerspp.))、橡树(栎属(quercusspp.))、以及松树(松属(pinusspp.))。

使用玉米grmzm2g047720启动子来驱动可操作连接的基因可以在许多观赏和结果物种中采用。这样的应用也在本公开的实施方案的范围内。例子包括但不限于:玫瑰(蔷薇属物种(rosaspp.))、地肤(burningbush)(卫矛属物种(euonymusspp.))、矮牵牛(矮牵牛属物种(petuniaspp.))、秋海裳(秋海棠属物种(begoniaspp.))、杜鹃(杜鹃属物种(rhododendronspp.))、海棠或苹果(苹果属物种(malusspp.))、梨(梨属物种(pyrusspp.))、桃(李属物种(prunusspp.))、和万寿菊(万寿菊属物种(tagetesspp.))。

虽然上面已经论述了许多示例性方面和实施方案,但是本领域技术人员将认识到它们的某些修改、置换、添加和子组合。因此,以下所附权利要求和此后引入的权利要求旨在被解释为包括在它们的真实精神和范围内的所有这些修改、置换、添加和子组合。

sequencelisting

<110>美国陶氏益农公司

gupta,manju

kumar,sandeep

gorman,shavell

chen,wei

<120>用于转基因表达的植物启动子和3’utr

<130>78827-us-psp-20160126-sequence-listing

<160>15

<170>patentinversion3.5

<210>1

<211>2065

<212>dna

<213>玉米

<400>1

cgaccaaccataggatgtataaggcctttaggcccaaaaacaggcatcgctgatttttgg60

cagattctggacgtcatcttgggacaatgattcccatcagctccgagcatatttttctgt120

gggaccaattgggttggaaagtttatctccttagctttcaacagtatctagaacgtccaa180

aacgaagtccgtatgtgatctgggcatccatttttgtgaggaacactcctagagtcctaa240

cctgattcgtgaataaattggacttcaactctccttgagcttgggactctatgattgatt300

gggccttgaccatatagttgacgtccatgtactcatcattctccccatcttagttttgag360

tcatactcgactgaaagtcgttggtgcctgcataaggtgttgatgtagtgcttgattgct420

tgatgttgtccaaacttgctccccttcttgaagttgatcctgttgttgtaaaatatacaa480

agaaggacaagtcgaactggacgtgatatggttagctttaaaacaaccctctaatttatc540

atattgttttatgacaaaagacgatttcatatttgaacaaatatatatatactcgatgtg600

tcatatattctcctttccaattatatcttccaataacatgatatatatatttagataacc660

atggaaaataaacactaaaagaaagtttctcctctaaattatttagattacatagaacat720

caaattcaatataacccaaagtatttaaagaagtaacaatttcaactcatcatgcacact780

agttatgggattgaatattctatttcaacacaactaataggattggaagcaacaatatca840

agtttgttctcaagttttggcatataattaatagaagaatcatcactcaactccttgtta900

tcaaaagaatcaatagtacaatcatcgtgtaacaaaagtaacttagatctatttgaagtc960

atggcatgatgggaagaaacaaattgttctctcataagcactttcatatcagctcaagtg1020

tgtggtttgtcatagtcatgcaatttgttccaccaaactaatgcatgattcgttaaagta1080

ctagccacaattttaatttttctcctatcatatatacgacatcgtgcaaaaatcttatcc1140

attgatactttccatttagtatactcatttccaatatttttatcaaaagaagagaaaaat1200

ggatatatagaacacgggaggacgaattagcattaatggtgtggctctcatattatatta1260

caaccatgccctcaattcctatacatacgaactatgaaatctagtaggggcaacatcgtc1320

gtttcattcgcaagccttgacgtgcacatcagtaaatcctctttttgtctccttgtcgtg1380

tgtttcgaactccacaatgtgcttcgtctactcactcgaggttgagcttcgttcattcca1440

ttttcgaccttcgttaaagagttaaataccttcggcatgcatagaatgattacctttgga1500

acaaatctcaaggaagttaagattaggtcattttgttgaccttcggcaaaagacttttcc1560

cccaacaacatccaaataatcgtggtggtttttatggatgttaggttgtctccaacatat1620

tttctatcccacttcttatctcatccaatattttaaaattcactctgtaaacagtacaaa1680

tgacaacgaaaaaacggtgttttacacattcgtatacatggtctgccgaaaacagtctta1740

ttggagatactgtaagggtgttatgtttcagtacccgagtctgtgcagaagctaagaaac1800

agtccctcggtgggcctggcgtacgttctacaatcagtctcgggaatgagaggccataca1860

tggattttgaagatagggaggcagccaatcacaggcaagcatctggccacatgtgcactc1920

acacgactcagggcgagaggacagcagggcacaataaccgttccactttggtccatagga1980

gcgcatagcacagcacaaggagaggccgagaagcgctttagccgtagccgtagcgataag2040

agtgagctagctggtgcacaccggc2065

<210>2

<211>4050

<212>dna

<213>玉米

<400>2

cgaccaaccataggatgtataaggcctttaggcccaaaaacaggcatcgctgatttttgg60

cagattctggacgtcatcttgggacaatgattcccatcagctccgagcatatttttctgt120

gggaccaattgggttggaaagtttatctccttagctttcaacagtatctagaacgtccaa180

aacgaagtccgtatgtgatctgggcatccatttttgtgaggaacactcctagagtcctaa240

cctgattcgtgaataaattggacttcaactctccttgagcttgggactctatgattgatt300

gggccttgaccatatagttgacgtccatgtactcatcattctccccatcttagttttgag360

tcatactcgactgaaagtcgttggtgcctgcataaggtgttgatgtagtgcttgattgct420

tgatgttgtccaaacttgctccccttcttgaagttgatcctgttgttgtaaaatatacaa480

agaaggacaagtcgaactggacgtgatatggttagctttaaaacaaccctctaatttatc540

atattgttttatgacaaaagacgatttcatatttgaacaaatatatatatactcgatgtg600

tcatatattctcctttccaattatatcttccaataacatgatatatatatttagataacc660

atggaaaataaacactaaaagaaagtttctcctctaaattatttagattacatagaacat720

caaattcaatataacccaaagtatttaaagaagtaacaatttcaactcatcatgcacact780

agttatgggattgaatattctatttcaacacaactaataggattggaagcaacaatatca840

agtttgttctcaagttttggcatataattaatagaagaatcatcactcaactccttgtta900

tcaaaagaatcaatagtacaatcatcgtgtaacaaaagtaacttagatctatttgaagtc960

atggcatgatgggaagaaacaaattgttctctcataagcactttcatatcagctcaagtg1020

tgtggtttgtcatagtcatgcaatttgttccaccaaactaatgcatgattcgttaaagta1080

ctagccacaattttaatttttctcctatcatatatacgacatcgtgcaaaaatcttatcc1140

attgatactttccatttagtatactcatttccaatatttttatcaaaagaagagaaaaat1200

ggatatatagaacacgggaggacgaattagcattaatggtgtggctctcatattatatta1260

caaccatgccctcaattcctatacatacgaactatgaaatctagtaggggcaacatcgtc1320

gtttcattcgcaagccttgacgtgcacatcagtaaatcctctttttgtctccttgtcgtg1380

tgtttcgaactccacaatgtgcttcgtctactcactcgaggttgagcttcgttcattcca1440

ttttcgaccttcgttaaagagttaaataccttcggcatgcatagaatgattacctttgga1500

acaaatctcaaggaagttaagattaggtcattttgttgaccttcggcaaaagacttttcc1560

cccaacaacatccaaataatcgtggtggtttttatggatgttaggttgtctccaacatat1620

tttctatcccacttcttatctcatccaatattttaaaattcactctgtaaacagtacaaa1680

tgacaacgaaaaaacggtgttttacacattcgtatacatggtctgccgaaaacagtctta1740

ttggagatactgtaagggtgttatgtttcagtacccgagtctgtgcagaagctaagaaac1800

agtccctcggtgggcctggcgtacgttctacaatcagtctcgggaatgagaggccataca1860

tggattttgaagatagggaggcagccaatcacaggcaagcatctggccacatgtgcactc1920

acacgactcagggcgagaggacagcagggcacaataaccgttccactttggtccatagga1980

gcgcatagcacagcacaaggagaggccgagaagcgctttagccgtagccgtagcgataag2040

agtgagctagctggtgcacaccggcatggcggccacggcgtactccgtggcgctcctcgg2100

cggcgcgcgcctccccgccgctccgcgctccgccctcctccctcggcgcagcgtctgcca2160

gcttcgcttccaaggtaataactagattgctcatctgaccgacgtcgttttagaggatta2220

ttcacccgtgccctcgcggctttgcagatgcaccgaggctctccctgctccgtgcgaagg2280

ccgcttccgaggacacatcggcctccggcgacgagttgatcgaggacctcaaagcgaagg2340

tacgtacctgccagttgccgtccgtcgcccgtccacaaataatggacggacatgcctact2400

ggccatatatatctcaggcaacaatgcgcatgccttgacctcaccccgttctgttctgtg2460

cctttgacttctggcttgcagtgggacgccgttgaggacaagcccaccgtcctcttgtac2520

ggcggcggcgccgtcgtcgccctatggctgacgtccgtggtcgtgggcgccatcaacgcc2580

gtgccgctggtatgtagtgtcccgtgtccgtcagggaacaccgtacctggagtatatatc2640

attccagtccaattctgctctaaattgcgctaaccggccgtggtgttcttgagcagctcc2700

ccaagatcctggagctcgttgggctcggctacaccggctggttcgtgtaccgctaccttc2760

tctttaaggtaaatgataagcatccactacctgtaatatatacactactttgcaatatat2820

atatatgctgagcccactgaatgttcaatttggaaattggaatgcaatataatttttttg2880

caattgtcttaattaatcctgttcatacaaagaagctctcttacataaatgtccttggtt2940

cttgttttactccggttacaggaaagcaggaaagagttggccgccgacattgagaccttg3000

aagaaaaaaatagctggaacagaataaacgctcatggaaagttttagagcgtcctttctt3060

ctttggaaagagatctattcgatcggagaaccaatatgcaactacttgagtactattatt3120

gcccatgtattgtgtgctgtatatcttctgtatacaaaggaaggttcgtttgttatgtac3180

gtagtagcattgtagtttaaatgtatcgtattacctatctgctaaattcttctttttgat3240

ttagcaattttattgtacgtaaacaaaaataagggtaaaacaaatagagtgtgtaatcta3300

taccaatattaagaacttattcgataacataaataatatacaattgtaacatgaataaat3360

tattcctttgattccaaattcgatctaggccaccttagttttgttgtaagtcaaaatcct3420

ttaatcactaccggaatccgggtctttgccgagtgctttttatcgggcactcggcaaagg3480

ttgctttgccgagagccgcactcggcaaagtcccgctctcggtaacgaggtagtttaccg3540

agtgcaggatactcggcacaggaaaactctcggcaaagacaattttaccgagtggcaaac3600

actcggcaaaggcggctctcggcaaagggccgtcagcggccgttctaaagctgacggccg3660

tcagcctttgccgagggccgagggtcggcactcggcaaagaactctttaccgagtgtctt3720

ctgtggacactcggcaaaacatatttttattttttaaattttgtccaccaaacttttttg3780

tggtatgttactatactatgtagacctacatgtatcatttgtggacaattataacagagt3840

tttcaatcgatagtagatttagtccgtttatttgaatttgttcggaaaattcagatttga3900

actgcaggtcactcgaaacttgaaaaaccgtgcttgcaaaaatgatatacatgctactta3960

gcacaaagttacgaccgattccacgagcggactggaaacttcgagcaacatgctcactaa4020

acatggccgtgaacttgtcatccacatgtt4050

<210>3

<211>3498

<212>dna

<213>人工序列

<220>

<223>基因表达盒,含有玉米grmzm2g047720

启动子::cry1abtransgene::玉米grmzm2g0477203'utr

<400>3

cgaccaaccataggatgtataaggcctttaggcccaaaaacaggcatcgctgatttttgg60

cagattctggacgtcatcttgggacaatgattcccatcagctccgagcatatttttctgt120

gggaccaattgggttggaaagtttatctccttagctttcaacagtatctagaacgtccaa180

aacgaagtccgtatgtgatctgggcatccatttttgtgaggaacactcctagagtcctaa240

cctgattcgtgaataaattggacttcaactctccttgagcttgggactctatgattgatt300

gggccttgaccatatagttgacgtccatgtactcatcattctccccatcttagttttgag360

tcatactcgactgaaagtcgttggtgcctgcataaggtgttgatgtagtgcttgattgct420

tgatgttgtccaaacttgctccccttcttgaagttgatcctgttgttgtaaaatatacaa480

agaaggacaagtcgaactggacgtgatatggttagctttaaaacaaccctctaatttatc540

atattgttttatgacaaaagacgatttcatatttgaacaaatatatatatactcgatgtg600

tcatatattctcctttccaattatatcttccaataacatgatatatatatttagataacc660

atggaaaataaacactaaaagaaagtttctcctctaaattatttagattacatagaacat720

caaattcaatataacccaaagtatttaaagaagtaacaatttcaactcatcatgcacact780

agttatgggattgaatattctatttcaacacaactaataggattggaagcaacaatatca840

agtttgttctcaagttttggcatataattaatagaagaatcatcactcaactccttgtta900

tcaaaagaatcaatagtacaatcatcgtgtaacaaaagtaacttagatctatttgaagtc960

atggcatgatgggaagaaacaaattgttctctcataagcactttcatatcagctcaagtg1020

tgtggtttgtcatagtcatgcaatttgttccaccaaactaatgcatgattcgttaaagta1080

ctagccacaattttaatttttctcctatcatatatacgacatcgtgcaaaaatcttatcc1140

attgatactttccatttagtatactcatttccaatatttttatcaaaagaagagaaaaat1200

ggatatatagaacacgggaggacgaattagcattaatggtgtggctctcatattatatta1260

caaccatgccctcaattcctatacatacgaactatgaaatctagtaggggcaacatcgtc1320

gtttcattcgcaagccttgacgtgcacatcagtaaatcctctttttgtctccttgtcgtg1380

tgtttcgaactccacaatgtgcttcgtctactcactcgaggttgagcttcgttcattcca1440

ttttcgaccttcgttaaagagttaaataccttcggcatgcatagaatgattacctttgga1500

acaaatctcaaggaagttaagattaggtcattttgttgaccttcggcaaaagacttttcc1560

cccaacaacatccaaataatcgtggtggtttttatggatgttaggttgtctccaacatat1620

tttctatcccacttcttatctcatccaatattttaaaattcactctgtaaacagtacaaa1680

tgacaacgaaaaaacggtgttttacacattcgtatacatggtctgccgaaaacagtctta1740

ttggagatactgtaagggtgttatgtttcagtacccgagtctgtgcagaagctaagaaac1800

agtccctcggtgggcctggcgtacgttctacaatcagtctcgggaatgagaggccataca1860

tggattttgaagatagggaggcagccaatcacaggcaagcatctggccacatgtgcactc1920

acacgactcagggcgagaggacagcagggcacaataaccgttccactttggtccatagga1980

gcgcatagcacagcacaaggagaggccgagaagcgctttagccgtagccgtagcgataag2040

agtgagctagctggtgcacaccggcccagaagacaccatgtccgcccgcgaggtgcacat2100

cgacgtgaacaacaagaccggccacaccctccagctggaggacaagaccaagctcgacgg2160

cggcaggtggcgcacctccccgaccaacgtggccaacgaccagatcaagaccttcgtggc2220

cgaatccaacggcttcatgaccggcaccgagggcaccatctactactccatcaacggcga2280

ggccgagatcagcctctacttcgacaacccgttcgccggctccaacaaatacgacggcca2340

ctccaacaagtcccagtacgagatcatcacccagggcggctccggcaaccagtcccacgt2400

gacctacaccatccagaccacctcctcccgctacggccacaagtcctgagtagttagctt2460

aatcacctagagctcacgctcatggaaagttttagagcgtcctttcttctttggaaagag2520

atctattcgatcggagaaccaatatgcaactacttgagtactattattgcccatgtattg2580

tgtgctgtatatcttctgtatacaaaggaaggttcgtttgttatgtacgtagtagcattg2640

tagtttaaatgtatcgtattacctatctgctaaattcttctttttgatttagcaatttta2700

ttgtacgtaaacaaaaataagggtaaaacaaatagagtgtgtaatctataccaatattaa2760

gaacttattcgataacataaataatatacaattgtaacatgaataaattattcctttgat2820

tccaaattcgatctaggccaccttagttttgttgtaagtcaaaatcctttaatcactacc2880

ggaatccgggtctttgccgagtgctttttatcgggcactcggcaaaggttgctttgccga2940

gagccgcactcggcaaagtcccgctctcggtaacgaggtagtttaccgagtgcaggatac3000

tcggcacaggaaaactctcggcaaagacaattttaccgagtggcaaacactcggcaaagg3060

cggctctcggcaaagggccgtcagcggccgttctaaagctgacggccgtcagcctttgcc3120

gagggccgagggtcggcactcggcaaagaactctttaccgagtgtcttctgtggacactc3180

ggcaaaacatatttttattttttaaattttgtccaccaaacttttttgtggtatgttact3240

atactatgtagacctacatgtatcatttgtggacaattataacagagttttcaatcgata3300

gtagatttagtccgtttatttgaatttgttcggaaaattcagatttgaactgcaggtcac3360

tcgaaacttgaaaaaccgtgcttgcaaaaatgatatacatgctacttagcacaaagttac3420

gaccgattccacgagcggactggaaacttcgagcaacatgctcactaaacatggccgtga3480

acttgtcatccacatgtt3498

<210>4

<211>962

<212>dna

<213>玉米

<400>4

atggcggccacggcgtactccgtggcgctcctcggcggcgcgcgcctccccgccgctccg60

cgctccgccctcctccctcggcgcagcgtctgccagcttcgcttccaaggtaataactag120

attgctcatctgaccgacgtcgttttagaggattattcacccgtgccctcgcggctttgc180

agatgcaccgaggctctccctgctccgtgcgaaggccgcttccgaggacacatcggcctc240

cggcgacgagttgatcgaggacctcaaagcgaaggtacgtacctgccagttgccgtccgt300

cgcccgtccacaaataatggacggacatgcctactggccatatatatctcaggcaacaat360

gcgcatgccttgacctcaccccgttctgttctgtgcctttgacttctggcttgcagtggg420

acgccgttgaggacaagcccaccgtcctcttgtacggcggcggcgccgtcgtcgccctat480

ggctgacgtccgtggtcgtgggcgccatcaacgccgtgccgctggtatgtagtgtcccgt540

gtccgtcagggaacaccgtacctggagtatatatcattccagtccaattctgctctaaat600

tgcgctaaccggccgtggtgttcttgagcagctccccaagatcctggagctcgttgggct660

cggctacaccggctggttcgtgtaccgctaccttctctttaaggtaaatgataagcatcc720

actacctgtaatatatacactactttgcaatatatatatatgctgagcccactgaatgtt780

caatttggaaattggaatgcaatataatttttttgcaattgtcttaattaatcctgttca840

tacaaagaagctctcttacataaatgtccttggttcttgttttactccggttacaggaaa900

gcaggaaagagttggccgccgacattgagaccttgaagaaaaaaatagctggaacagaat960

aa962

<210>5

<211>1023

<212>dna

<213>玉米

<400>5

acgctcatggaaagttttagagcgtcctttcttctttggaaagagatctattcgatcgga60

gaaccaatatgcaactacttgagtactattattgcccatgtattgtgtgctgtatatctt120

ctgtatacaaaggaaggttcgtttgttatgtacgtagtagcattgtagtttaaatgtatc180

gtattacctatctgctaaattcttctttttgatttagcaattttattgtacgtaaacaaa240

aataagggtaaaacaaatagagtgtgtaatctataccaatattaagaacttattcgataa300

cataaataatatacaattgtaacatgaataaattattcctttgattccaaattcgatcta360

ggccaccttagttttgttgtaagtcaaaatcctttaatcactaccggaatccgggtcttt420

gccgagtgctttttatcgggcactcggcaaaggttgctttgccgagagccgcactcggca480

aagtcccgctctcggtaacgaggtagtttaccgagtgcaggatactcggcacaggaaaac540

tctcggcaaagacaattttaccgagtggcaaacactcggcaaaggcggctctcggcaaag600

ggccgtcagcggccgttctaaagctgacggccgtcagcctttgccgagggccgagggtcg660

gcactcggcaaagaactctttaccgagtgtcttctgtggacactcggcaaaacatatttt720

tattttttaaattttgtccaccaaacttttttgtggtatgttactatactatgtagacct780

acatgtatcatttgtggacaattataacagagttttcaatcgatagtagatttagtccgt840

ttatttgaatttgttcggaaaattcagatttgaactgcaggtcactcgaaacttgaaaaa900

ccgtgcttgcaaaaatgatatacatgctacttagcacaaagttacgaccgattccacgag960

cggactggaaacttcgagcaacatgctcactaaacatggccgtgaacttgtcatccacat1020

gtt1023

<210>6

<211>17

<212>dna

<213>人工序列

<220>

<223>primetq.8v6.1.f

<400>6

gccataccctccagttg17

<210>7

<211>23

<212>dna

<213>人工序列

<220>

<223>引物tq.8v6.1.r

<400>7

gccgttgatggagtagtagatgg23

<210>8

<211>18

<212>dna

<213>人工序列

<220>

<223>probetq.8v6.1.mgb.p

<400>8

ccgaatccaacggcttca18

<210>9

<211>18

<212>dna

<213>人工序列

<220>

<223>引物invertasef

<400>9

tggcggacgacgacttgt18

<210>10

<211>19

<212>dna

<213>人工序列

<220>

<223>引物invertaser

<400>10

aaagtttggaggctgccgt19

<210>11

<211>21

<212>dna

<213>人工序列

<220>

<223>invertase探针

<400>11

cgagcagaccgccgtgtactt21

<210>12

<211>20

<212>dna

<213>人工序列

<220>

<223>aad1正向引物

<400>12

tgttcggttccctctaccaa20

<210>13

<211>22

<212>dna

<213>人工序列

<220>

<223>aad1反向引物

<400>13

caacatccatcaccttgactga22

<210>14

<211>24

<212>dna

<213>人工序列

<220>

<223>aad1探针

<400>14

cacagaaccgtcgcttcagcaaca24

<210>15

<211>3307

<212>dna

<213>人工序列

<220>

<223>用于aad-1表达的基因表达盒

<400>15

gtgcagcgtgacccggtcgtgcccctctctagagataatgagcattgcatgtctaagtta60

taaaaaattaccacatattttttttgtcacacttgtttgaagtgcagtttatctatcttt120

atacatatatttaaactttactctacgaataatataatctatagtactacaataatatca180

gtgttttagagaatcatataaatgaacagttagacatggtctaaaggacaattgagtatt240

ttgacaacaggactctacagttttatctttttagtgtgcatgtgttctcctttttttttg300

caaatagcttcacctatataatacttcatccattttattagtacatccatttagggttta360

gggttaatggtttttatagactaatttttttagtacatctattttattctattttagcct420

ctaaattaagaaaactaaaactctattttagtttttttatttaatagtttagatataaaa480

tagaataaaataaagtgactaaaaattaaacaaataccctttaagaaattaaaaaaacta540

aggaaacatttttcttgtttcgagtagataatgccagcctgttaaacgccgtcgacgagt600

ctaacggacaccaaccagcgaaccagcagcgtcgcgtcgggccaagcgaagcagacggca660

cggcatctctgtcgctgcctctggacccctctcgagagttccgctccaccgttggacttg720

ctccgctgtcggcatccagaaattgcgtggcggagcggcagacgtgagccggcacggcag780

gcggcctcctcctcctctcacggcaccggcagctacgggggattcctttcccaccgctcc840

ttcgctttcccttcctcgcccgccgtaataaatagacaccccctccacaccctctttccc900

caacctcgtgttgttcggagcgcacacacacacaaccagatctcccccaaatccacccgt960

cggcacctccgcttcaaggtacgccgctcgtcctccccccccccccccctctctaccttc1020

tctagatcggcgttccggtccatgcatggttagggcccggtagttctacttctgttcatg1080

tttgtgttagatccgtgtttgtgttagatccgtgctgctagcgttcgtacacggatgcga1140

cctgtacgtcagacacgttctgattgctaacttgccagtgtttctctttggggaatcctg1200

ggatggctctagccgttccgcagacgggatcgatttcatgattttttttgtttcgttgca1260

tagggtttggtttgcccttttcctttatttcaatatatgccgtgcacttgtttgtcgggt1320

catcttttcatgcttttttttgtcttggttgtgatgatgtggtctggttgggcggtcgtt1380

ctagatcggagtagaattctgtttcaaactacctggtggatttattaattttggatctgt1440

atgtgtgtgccatacatattcatagttacgaattgaagatgatggatggaaatatcgatc1500

taggataggtatacatgttgatgcgggttttactgatgcatatacagagatgctttttgt1560

tcgcttggttgtgatgatgtggtgtggttgggcggtcgttcattcgttctagatcggagt1620

agaatactgtttcaaactacctggtgtatttattaattttggaactgtatgtgtgtgtca1680

tacatcttcatagttacgagtttaagatggatggaaatatcgatctaggataggtataca1740

tgttgatgtgggttttactgatgcatatacatgatggcatatgcagcatctattcatatg1800

ctctaaccttgagtacctatctattataataaacaagtatgttttataattatttcgatc1860

ttgatatacttggatgatggcatatgcagcagctatatgtggatttttttagccctgcct1920

tcatacgctatttatttgcttggtactgtttcttttgtcgatgctcaccctgttgtttgg1980

tgttacttctgcaggtacagtagttagttgaggtaccggatccacacgacaccatggctc2040

atgctgccctcagccctctctcccaacgctttgagagaatagctgtccagccactcactg2100

gtgtccttggtgctgagatcactggagtggacttgagggaaccacttgatgacagcacct2160

ggaatgagatattggatgccttccacacttaccaagtcatctactttcctggccaagcaa2220

tcaccaatgagcagcacattgcattctcaagaaggtttggaccagttgatccagtgcctc2280

ttctcaagagcattgaaggctatccagaggttcagatgatccgcagagaagccaatgagt2340

ctggaagggtgattggtgatgactggcacacagactccactttccttgatgcacctccag2400

ctgctgttgtgatgagggccatagatgttcctgagcatggcggagacactgggttccttt2460

caatgtacacagcttgggagaccttgtctccaaccatgcaagccaccatcgaagggctca2520

acgttgtgcactctgccacacgtgtgttcggttccctctaccaagcacagaaccgtcgct2580

tcagcaacacctcagtcaaggtgatggatgttgatgctggtgacagagagacagtccatc2640

ccttggttgtgactcatcctggctctggaaggaaaggcctttatgtgaatcaagtctact2700

gtcagagaattgagggcatgacagatgcagaatcaaagccattgcttcagttcctctatg2760

agcatgccaccagatttgacttcacttgccgtgtgaggtggaagaaagaccaagtccttg2820

tctgggacaacttgtgcaccatgcaccgtgctgttcctgactatgctggcaagttcagat2880

acttgactcgcaccacagttggtggagttaggcctgcccgctgagtagttagcttaatca2940

cctagagctcggtcgcagcgtgtgcgtgtccgtcgtacgttctggccggccgggccttgg3000

gcgcgcgatcagaagcgttgcgttggcgtgtgtgtgcttctggtttgctttaattttacc3060

aagtttgtttcaaggtggatcgcgtggtcaaggcccgtgtgctttaaagacccaccggca3120

ctggcagtgagtgttgctgcttgtgtaggctttggtacgtatgggctttatttgcttctg3180

gatgttgtgtactacttgggtttgttgaattattatgagcagttgcgtattgtaattcag3240

ctgggctacctggacattgttatgtattaataaatgctttgctttcttctaaagatcttt3300

aagtgct3307

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1