草甘膦抗性植物和相关方法

文档序号:467134阅读:431来源:国知局
草甘膦抗性植物和相关方法
【专利摘要】本发明涉及一些从原核生物DGT酶衍生的多肽,和可用于编码它们的核酸。
【专利说明】草甘麟抗性植物和相关方法
[0001] 优先权声明
[0002] 本申请要求获得于2012年2月1日提交的美国临时专利申请系列号61/593, 555 的利益,还要求获得于2012年4月17日提交的美国临时专利申请系列号61/625, 222的利 益。
[0003] 根据37C. F. R. § 1. 821 (c)或(e)_作为ASCII文本文件提交的序列表的陈述
[0004] 根据37C. F. R. § 1. 821 (c)或(e),含有ASCII文本格式的序列列表的文件已经和 本专利申请一起提交。

【技术领域】
[0005] 本公开涉及植物生物技术。特定的实施方案涉及参与N-(膦酰基甲基)甘氨酸代 谢的新多肽,和编码这些多肽的核酸。特定的实施方案涉及包含前述多肽和/或核酸的植 物、植物部分、和植物细胞。
[0006] 背景
[0007] 各种杂草很长时间以来都是耕地面临的难题。尽管杂草控制可能是劳动力密集型 的操作,但是高效的杀杂草化学除草剂的获得已经使它变得更加容易。除草剂的广泛使用, 加上作物品种和肥料的改良,对农业的"绿色革命"做出了显著贡献。特别有用的除草剂是 具有广谱除草活性的除草剂。不幸的是,广谱除草剂通常会对暴露于该除草剂的作物植株 造成有害影响。克服这个问题的一个方法是产生能够耐受广谱除草剂的作物。
[0008] 广谱除草剂的一个实例是N-膦酰甲基甘氨酸,也称为草甘膦。草甘膦已经被全世 界的农民广泛应用于在作物种植之前,例如在免耕种植(no-till farming)中,控制杂草。 此外,草甘膦是一种用于在生长周期之间或作物轮作中控制杂草和自生植物(volunteer plant)的高效手段。草甘膦在使用后不会在土壤中遗留(carry-over),因此被认为是可用 于农业的环境安全性最高的、广泛有效的化学除草剂之一。
[0009] 草甘膦通过抑制莽草酸途径杀死植物。这个途径导向芳族化合物(包括氨基酸、 维生素和植物激素)的生物合成。草甘膦通过结合并抑制5-烯醇式丙酮酰莽草酸-3-磷 酸合成酶(通常被称作"EPSP合成酶"和"EPSPS")的活性,阻断磷酸烯醇式丙酮酸(PEP) 与3-磷代莽草酸缩合形成5-烯醇式丙酮酰-3-磷代莽草酸。
[0010] 不幸的是,已知没有作物可以天然耐受草甘膦,因此,这种除草剂在栽培作物中控 制杂草的用途受到了限制。一种产生耐草甘膦作物的方法是,使用基因工程技术将编码异 源草甘膦耐受形式的EPSPS的基因导入到作物中。利用化学诱变,已经在细菌中产生了草 甘膦耐受形式的EPSPS,并将该异源基因导入到了植物体内,产生了草甘膦耐受性植物。参 见,例如Comai et al. (1983) Science 221:370-71。可在作物中过表达异源EPSPS基因以 获得期望的耐受水平。
[0011] 前述关于相关技术及其相关局限性的实例只是说明性的,而不是排它性的。通过 阅读本说明书,本领域的技术人员容易想到相关技术的其它局限性。
[0012] 发明公开
[0013] 本文描述了与SEQ ID NO: 1具有至少90%同一性的分离多肽,和编码与SEQ ID N0:1具有至少90%同一性的多肽的核酸(例如SEQ ID N0s:2-4)。还描述了含有与SEQ ID NO: 1具有至少90%同一性的异源多肽的植物、植物部分、植物器官、植物种子和植物细胞。
[0014] -些实施方案包括植物、植物部分、植物器官、植物种子和/或植物细胞,其包含 编码与SEQ ID N0:1具有至少90%同一性的多肽异源核酸。在特定的实例中,该异源核酸 包含与SEQ ID N0:2或SEQ ID N0:3具有至少80%的序列同一性的核苷酸序列。一些实施 方案包括植物、植物部分、植物器官、植物种子和/或植物细胞,其包含在高严格条件下与 具有SEQ ID N0:2或SEQ ID N0:3的另一核酸杂交的异源核酸。在特定的实例中,包含在 高严格条件下与具有SEQ ID N0:2或SEQ ID N0:3的另一核酸杂交的异源核酸的植物、植 物部分、植物器官、植物种子和/或植物细胞包含由该异源核酸编码的多肽,该多肽赋予该 植物、植物部分、植物器官、植物种子和/或植物细胞草甘膦耐受性(或者增加草甘膦耐受 性)。
[0015] 在进一步的实施方案中,本公开涉及用于产生抗草甘膦的植物、植物部分、植物器 官、植物种子和/或植物细胞的的方法,包括:用编码与SEQ ID NO: 1具有至少90%同一性 的多肽的核酸转化植物、植物部分、植物器官、植物种子和/或植物细胞;和表达该核酸,从 而产生与SEQ ID NO: 1具有至少90%同一性的多肽。
[0016] 其他实施方案包括这样的载体,其包含编码与SEQ ID NO: 1具有至少90%同一性 的多肽的核酸。特定的实例包括这样的载体,其包括编码与SEQ ID NO: 1具有至少95%同 一性的多肽的核酸。例如,载体可包含与SEQ ID NO: 2或SEQ ID NO: 3具有至少90%同一 性的核酸序列。
[0017] 特定的实施方案包括草甘膦耐受性植物和植物细胞,其表达与SEQ ID NO: 1具有 至少90%同一性的异源多肽。
[0018] 其他实施方案包括用于在含有抗除草剂植物的田地或耕种区内控制杂草的方法, 其中该方法可以包括:在田地或耕种区内种植含有编码与SEQ ID NO: 1具有至少90%同一 性的异源多肽的核酸的植物或植物种子;和向该田地或耕种区施用足以控制田中的杂草、 而不会显著影响该植物的量的草甘膦。
[0019] 在一些实施方案中,本公开涉及可再生的细胞,用于抗草甘膦植物的组织培养。这 种组织培养物可以能够再生出具有前述的抗草甘膦植物的生理学和形态学特征的植物,还 能够再生出与抗草甘膦植物具有基本上相同的基因型的植物。这样组织培养物中的可再生 细胞可以是,例如,胚、原生质体、分生组织细胞、愈伤组织、花粉、叶、花药、根、根尖、花、种 子、荚果、和茎。特定的实施方案涉及从根据前述的组织培养物再生的植物。
[0020] 在一些实施方案中,本公开涉及不能再生产生植物的细胞,例如用于产生耐受草 甘膦的植物细胞系。在其它实施方案中,本公开涉及部分地包含这些细胞的植物。
[0021] 在某些实施方案中,本公开涉及向耕种区域内种植的作物施用多种除草剂。在多 种除草剂的基础上附加过顶施用(over the top application)草甘膦,可以对除草剂的不 同性质加以利用,从而提供将更好的灵活性与经济性相结合的杂草控制。例如,各种除草剂 可能在耕种区域内具有不同的耐久性;即某些除草剂在施用到该区域后可能持续存在并在 相对长的时间内有效,而其它除草剂可能会被快速降解成其它的和/或无活性的化合物。 根据特定的实施方案,改良的除草剂施用系统允许使用草甘膦和多种除草剂,从而种植者 能够根据具体的使用情况调整具体除草剂的选择。
[0022] 在其他实施方案中,本公开涉及用于制作和使用耐受多于一种除草剂或除草剂类 型或亚型的植物的方法和组合物,如下文所述。在特定的实施方案中,提供了同时耐受草甘 膦和至少一种其它除草剂(或除草剂类型或亚型)或化学品(或化学类型或亚型)(例如杀 真菌剂、杀虫剂、植物生长调节剂等)的植物。这类植物可以用于,例如,包括用多种除草剂 处理作物的方法。因此,本公开提供了除草剂抗性植物,其耐受用除草剂或除草剂组合(包 括各自通过不同的除草活性模式发挥作用的除草剂的组合)的处理,或者耐受用至少一种 除草剂和至少一种其它化学品的组合的处理。通过这种方式,本公开描述了用于种植作物 的改良方法,其中选择性地控制杂草。
[0023] 根据一些实施方案的除草剂抗性植物可以包括编码可赋予草甘膦耐受性的异源 多肽的核酸分子,和编码赋予2, 4-二氯苯氧乙酸(2, 4-D)耐受性的多肽的核酸分子。根据 前面的段落,提供至少包括第三核酸分子的植物,该第三核酸分子编码赋予植物从下组选 出的一种性状的多肽:除草剂耐受性性状;昆虫抗性性状;农艺学性状;疾病抗性性状;修 饰的脂肪酸性状;和植酸降低的性状。
[0024] 在一些实例中,除草剂抗性的植物包含编码赋予草甘膦耐受性的多肽的异源核酸 分子,和编码赋予草胺膦耐受性的多肽的核酸分子。一些实例包括这样的除草剂抗性植物, 它们包含编码赋予植物选自下组的性状的多肽的核酸分子:除草剂耐受性性状;昆虫抗性 性状;农艺性状;抗病性性状;修饰的脂肪酸性状;和植酸降低的性状。
[0025] 在特定的实例中,除草剂抗性植物包括编码赋予草甘膦耐受性的多肽的异源核酸 分子,和编码赋予对抑制乙酰乳酸合酶(ALS) ((Lee et al. (1988)EMBOJ. 7:1241),也称乙 酰轻酸合成酶(AHAS) (Miki et al. (1990)Theor. Appl. Genet. 80:449))的除草剂的耐受性 的多肽的核酸分子。一些实例包括这样的除草剂抗性植物,它们包含编码赋予植物选自下 组的性状的多肽的核酸分子:除草剂耐受性性状;昆虫抗性性状;农艺性状;抗病性性状; 修饰的脂肪酸性状;和植酸降低的性状。
[0026] 在一些实施方案中,一种核酸可以在植物中与任何其他的核酸分子组合(或"叠 加"),以便,例如但不限于,提供额外的对草甘膦或其它除草剂的抗性或耐受性,提供对选 定的昆虫或疾病的抗性,或提供营养强化,提供改良的农艺学性状,和提供可用于饲料、食 品、工业用途、医药用途、和/或其它用途的蛋白或其它有用产品。实例包括在植物基因组 内叠加两种或更多种感兴趣的核酸。这种"基因叠加"可以通过使用两个或多个事件的常 规植物育种、用含有感兴趣的序列的构建体转化植物、转基因植物的再转化、或通过同源重 组介导的靶向整合添加新的性状来加以实现。这种叠加的具体实例包括如下的任意组合: dgt-28 核酸;Cry34Abl 核酸;Cry35Abl 核酸;CrylF 核酸;CryIAc 核酸;aad-12 核酸;aad-1 核酸;pat核酸;和DSM-2核酸。
[0027] 除了上述示例性方面和实施方案之外,进一步的方面和实施方案通过研宄下面的 描述将易于想到。
[0028] 附图简述
[0029] 图1包括示例EPSP合酶(g卩,DGT-28、DGT-32、DGT-33及其它)的部分序列比对。 这3种示例DGT酶都在aroA EPSP合酶氨基酸位置96处具有一个保守的丙氨酸。该氨基 酸的位置用星号指示,且该氨基酸被下划线标出。
[0030] 图2包括示例DGT酶(即,DGT-l、DGT-3和DGT-7)的比对结果。第一个星号指示 了从甘氨酸变成丙氨酸的突变氨基酸残基的位置。第二个星号指示了从苏氨酸变成异亮氨 酸的第二个突变氨基酸残基的位置。第三个星号指示了从脯氨酸变成丝氨酸的第三个突变 氨基酸残基的位置。
[0031] 图3-30包括各种示例质粒的图谱:pDAB107527 (图3) ;pDAB105530 (图4); pDAB105531(图 5) ;pDAB105532(图 6) ;pDAB105533(图 7) ;pDAB105534(图 8); pDAB4104(图 9) ;pDAB102715(图 10) ;pDAB107532(图 11) ;pDAB107534(图 12); pDAB102785(图 13) ;pDAB100445(图 14) ;pDAB102946(图 15) ;pDAB100469(图 16); pDAB102028(图 17) ;pDAB102029(图 18) ;pDAB102032(图 19) ;pDAB102034(图 20); pDAB100429(图 21) ;pDAB100442(图 22) ;pDAB100430(图 23) ;pDAB102036(图 24); pDAB102038(图 25) ;pDAB102040(图 26) ;pDAB102042(图 27) ;pDAB107712(图 28); PDAB107713 (图 29);和 pDAB107714 (图 30)。
[0032] 图31包括在DGT-I (A)和DGT-7 (B)中导入不同突变后用ImM PEP获得的IC5。值。 对于图31㈧和图31⑶的IC5tl曲线,实心三角形代表野生型,实心圆形代表GA突变体,空 心方形代表GAPS突变体,实心方形代表TIPS突变体。
[0033] 图32-46包括各种示例质粒的图谱:pDAB102719(图32) ;pDAB102718(图33); pDAB107663(图 34) ;pDAB107664(图 35) ;pDAB107665(图 36) ;pDAB107666(图 37); pDAB109812(图 38) ;pDAB101556(图 39) ;pDAB107698(图 40) ;pDAB108384(图 41); pDAB108385(图 42) ;pDAB108386(图 43) ;pDAB108387(图 44) ;pDAB102716(图 45); pDAB102717(图 46) ;pDAB110828(图 47) ;pDAB110827(图 48) ;pDAB107545(图 49); pDAB107548(图 50) ;pDAB107553(图 51) ;pDAB102792(图 52) ;pDAB107602(图 53);和 pDAB107533(图 54)。
[0034] 实施本发明的模式
[0035] I.概览
[0036] 本文公开了参与N-(膦酰基甲基)甘氨酸代谢的新多肽,和编码这些多肽的核酸。 在一些实例中,在异源表达这些多肽的植物细胞中这些多肽赋予(或提高)对草甘膦的耐 受性,而例如不会对EPSP合酶与其天然底物磷酸烯醇式丙酮酸(PEP)的结合造成不良影 响。
[0037] IL 术语
[0038] 为了进一步阐明本公开的范围,提供了下列具体的定义、术语和缩写。
[0039] 除非特别定义,否则本文使用的所有技术和科学术语具有与本领域普通技术人员 所普遍理解的相同的含义。除非它出现的上下文中另有明确指示,否则单数术语应当包括 复数形式,复数术语应当理解为包括单数形式。因此,不定冠词"一个/种"和"该"当在要 素或组分的前面使用时对该元件或组分的实例(即出现)数目没有限定作用。当在本文中 提供数值的范围时(例如,"小于大约x","小于X"和"例如,XI...和X2"),该范围应当理 解为包括所提供范围内包含的所有数值和数值范围,就如同这些所包含的数值和范围被明 确地列举一样。
[0040] 如本文中所使用的,术语"包括","包含","具有"和"含有"及其变化形式,是开放 式的(即,非排他的)。例如,包含一系列要素的组合物或方法,不必仅限于那些要素。这 样的组合物或方法可以(或者可以不)包括其他未明确列出的或该组合物或方法固有的要 素。此外,除非明确相反地说明,否则"或"的使用表示包含的(不是排他的)意义。例如, 条件"A或B"可由下列的任一种满足:A真(或存在)且B假(或不存在);-A假(或不存 在)且B真(或存在);-A和B都真(或存在)。
[0041] 植物:如本文所使用的,术语"植物"包括整个植物及植物的任何后代、细胞、组织、 或部分。术语"植物部分"包括植物的任何部分,包括,例如但不限于:种子(包括成熟种子 和未成熟种子);植物插条;植物细胞;植物细胞培养物;植物器官(如花粉、胚、花、果实、 芽(shoot)、叶、根、茎、和外植体)。植物组织或植物器官可以是种子、原生质体、愈伤组织、 或者任何其他被组织成一定结构或功能单元的植物细胞群。植物细胞或组织培养物可能能 够再生出具有该细胞或组织所来源的植物的生理学和形态学特征的植物,并且可能能够再 生出与该植物具有基本上相同的基因型的植物。与之相反,一些植物细胞不能够再生产生 植物。植物细胞或组织培养物中的可再生细胞可以是胚、原生质体、分生组织细胞、愈伤组 织、花粉、叶、花药、根、根尖、须、花、果仁、穗、穗轴、壳、或莖。
[0042] 植物部分包括可收获的部分和可用于繁殖后代植物的部分。可用于繁殖的植物部 分包括,例如但不限于:种子;果实;插条;苗;块茎;和根砧木。植物的可收获部分可以是 植物的任何有用部分,包括,例如但不限于:花;花粉;苗;块茎;叶;茎;果实;种子;和根。
[0043] 植物细胞是植物的结构和生理的单位,包括原生质体和细胞壁。植物细胞可以是 分离的单细胞或细胞聚集体的形式(例如,松散型(friable)愈伤组织和培养细胞),并且 可以是更高级有组织单元的一部分(例如,植物组织、植物器官、和植物)。因此,植物细 胞可以是原生质体、配子产生细胞、或可以再生成完整植物的细胞或细胞集合。因此,包括 多个植物细胞并能够再生为完整植物的种子,在本文的实施方案中被认为是一个"植物细 胞"。
[0044] 除草剂抗性/耐受性:当指称抗草甘膦或耐受草甘膦的植物时,它意味着对该植 物施用一定量的草甘膦不会显著影响或杀死植物,而相同物种的野生型植物将由于该一定 量的草甘膦的施用而受到显著影响和/或被杀死。植物可能天然耐受特定的除草剂,或者 植物可能作为遗传工程的结果而被赋予除草剂耐受性,所述遗传工程例如选择性育种、遗 传转化、和/或在植物基因组中导入转基因。"草甘膦抗性植物"是指含有如下多肽或核酸 分子的植物,其中当将该多肽或核酸分子提供给表达它的异源植物或其他生物时,它赋予 除草剂耐受性(即,使植物或其它生物对除草剂耐受)。
[0045] 对草甘膦抗性或耐受性植物施用草甘膦,植物可能会显示受到施用的某些微小的 影响。例如,植物的正常生长和发育可能会发生改变,其中植物可会显示与胁迫或疾病相关 的征象或症状。对草甘膦抗性或耐受性植物施用草甘膦造成的这种微小影响,与对草甘膦 敏感植物施用草甘膦造成的有害影响形成对照。本领域技术人员可以区分出草甘膦抗性植 物和草甘膦敏感植物之间的差异。对含有赋予草甘膦耐受性的核酸的植物施用草甘膦造成 的影响显著小于对不含赋予草甘膦耐受性的核酸分子的相同物种植物施用相同量的草甘 膦。
[0046] 耐受除草剂或其它化学品的植物比合适的对照植物显示更好的耐受性。除草剂或 其它化学品处理所造成的损害可以通过评估植物生长或良好生存状态的任何参数进行评 价。这些参数是本领域技术人员已知的,它们的选择可由本领域技术人员自由裁量。植物 损害可以通过对植物个体或植物群的一个或多个合适的植物生长或良好生存状态参数进 行目测检查和/或统计分析进行评价。因此,可以通过评估包括例如但不限于下列的参数 来评价损害:植株尚度;植株重量;叶色;叶长;开花;育性;抽须(silking);产量;和种子 产生。还可以通过评估到特定发育阶段(例如抽须、开花和花粉脱落)为止所经过的时间, 或者到植物从特定化学品和/或除草剂处理恢复为止所经过的时间来评价损害。
[0047] 在进行损害评价时,可以给特定的损害程度赋值,以便进行统计学分析或定量比 较。使用值的范围描述特定程度的损害是本领域已知的,并且可以使用任何合适的范围或 量表。例如,可以指配除草剂损伤得分(也称作耐受性得分)。相应地,如果在该量表中其 他级别处,合适的对照植物(或对照植物群)响应于除草剂处理显示的得分统计学上显著 地低于主题群,则除草剂耐受性也可以用该量表中的其它级别表示。
[0048] 由除草剂或其它化学品导致的损害可以在用除草剂处理植物之后不同时间进行 评估。很多时候,损害评价大约在对照植物表现出最大损伤时进行。有时,待没有用除草剂 或其它化学品处理的对照植物经过一段时间,与给予处理之时的大小和发育阶段相比已经 发生了可测量的生长和/或发育之后,再评估损害。损害评估可以在任何合适的时间进行, 合适的时间有许多,例如在用除草剂处理主题植物后12小时;1,2, 3,4, 5,6, 7,8,9,10,11, 12,13,和/或14天;3和/或4周;或者更长的时间。任何评估时间,只要容许检测测试植 物与对照植物对处理的响应差异,就是合适的。
[0049] 当除草剂对植物无影响,当除草剂对植物有一些影响但植物随后从影响恢复,或 者当除草剂对植物产生一些有害的影响但是有害的影响被抵消,例如被该特定的除草剂对 杂草的影响所抵消时,则除草剂对植物没有"显著影响"。因此,例如,如果植物与合适的对 照植物(例如相同物种的未被处理的植物)相比,至少一个可以指示植物健康和/或生产 力的合适参数显示的降低小于约25 %,小于约20 %,小于约15 %,小于约10 %以下,大于约 9%,小于约8%,少于约7%,少于约6%,小于约5%,小于约4%,少于约3%,小于约2%, 或小于约1%,则作物可能不被除草剂或其它处理"显著影响"。在特定的实施方案中,如 果植物与合适的对照植物相比,其显示的损害相比于对照植物所显示的损害低至少40%, 45 %, 50 %, 55 %, 60 %, 65 %, 70 % , 75 %, 80 %, 90 %, 100 % ,150 %, 200 %, 250 %, 300 %, 400 %,500 %,600 %,700 %,800 %,900 %,或1000 %或者更多,则该植物对除草剂或其它化 学品耐受。不被除草剂或其它处理显著影响的作物可以在至少一个参数上显示降低,但是 该降低在性质上是暂时的,并且植物在例如约1周,约2周,约3周,约4周或约6周内完全 恢复。在特定的实施方案中,耐受除草剂或其它化学品的植物可以有这样的特征:即该植物 不被该除草剂或其它化学品的施用所显著影响。
[0050] 可指示植物健康和/或生产力的合适参数包括,例如但不限于:植物高度;植株重 量;叶长;到特定发育阶段为止所经过的时间;开花;产量;和种子产生。参数评估可以通过 目视检查和/或通过对参数的统计学分析来实施。当对主题植物和对照植物进行评价时, 可以进行比较以确定主题植物是否被除草剂或其它化学品显著影响。
[0051] 可用于确定对除草剂(或其它化学品)耐受性的合适对照植物包括属于相同物种 但不含有推定的异源除草剂耐受性核酸和/或多肽的植物,和确实含有推定的异源除草剂 耐受性核酸和/或多肽但没有用除草剂处理过的植物。
[0052] 除草剂:"除草剂"是可以对植物造成暂时或永久损伤的化学品。本文其它地方更 详细地列出并论述了除草剂的非限制性实例。除草剂可以被纳入到植物或其细胞内,或者 它可以在不被纳入的条件下对植物或细胞发挥作用。"活性成分"是除草剂制剂中负责该制 剂的植物毒性的化学物质。商业除草剂制剂中的活性成分通常在产品标签上被标识为活性 成分。产品标签信息可以从美国环境保护局获取,并在oaspub. epa. gov/pestlabl/ppls. own上有在线更新。产品标签信息还可以在www. cdms. net上在线获取。
[0053] 当关于除草剂使用时,术语"酸当量"是指以除草活性母体酸计的比例或量。
[0054] 分离的:"分离的"生物组分(例如,核酸或多肽)已经与该组分天然存在的生物 细胞中的其它生物组分(即,其它染色体或染色体外DNA和RNA,和蛋白)实质上分离、与 之分别产生、或从之纯化出来,在分离、产生和纯化的同时实现了该组分的化学或功能变化 (例如核酸可以通过断裂连接该核酸与染色体中其余DNA的化学键而从染色体分离)。已 经"分离的"核酸分子和蛋白包括通过标准纯化方法纯化的核酸分子和蛋白。该术语还包括 通过在宿主细胞内重组表达制备的核酸分子和蛋白,以及化学合成的核酸分子、蛋白和肽。
[0055] 核酸:术语"多核苷酸"、"核酸"和"核酸分子"在本文中可以互换使用,并包括单 个核酸、多个核酸、核酸片段、变体或其衍生物、和核酸构建体(例如信使RNA(mRNA)和质粒 DNA (pDNA))。多核苷酸或核酸可以含有全长cDNA序列、或其片段的核苷酸序列,包括非翻 译的5'和/或3'序列和编码序列。多核苷酸或核酸可以由任何多聚核糖核苷酸或多聚脱 氧核糖核苷酸构成,其可以包括未修饰的核糖核苷酸或脱氧核糖核苷酸或修饰的核糖核苷 酸或脱氧核糖核苷酸。例如,多核苷酸或核酸可以包括单链、双链DNA ;单链区和双链区混 合物DNA ;单链和双链RNA ;单链区和双链区混合物RNA。包含DNA和RNA的杂交分子可以 是单、双链、或单链区和双链区的混合物。前述术语还包括化学、酶学和代谢修饰形式的多 核苷酸或核酸。
[0056] 应当理解,具体的DNA还指其互补物,其序列根据脱氧核糖核苷酸碱基配对的规 则确定。
[0057] 如本文所使用的,术语"基因"是指编码功能产物(RNA或多肽/蛋白)的核酸。基 因可以包含位于编码功能产物的序列之前(5'非编码序列)和/或之后(3'非编码序列) 的调节序列。
[0058] 如本文所使用的,术语"编码序列"是指编码特定氨基酸序列的核酸序列。"调节 序列"是指位于编码序列上游(例如,5'非编码序列)、内部或下游(例如,3'非编码序列) 的核苷酸序列,其影响相关编码序列的转录、RNA加工或稳定性、或翻译。调节序列包括,例 如但不限于:启动子;翻译前导序列;内含子;多腺苷酸化识别序列;RNA加工位点;效应物 结合位点;和茎环结构。
[0059] 如本文所使用的,术语"密码子简并性"是指遗传密码的冗余性,其允许特定核苷 酸序列发生变异但不会影响所编码多肽的氨基酸序列。因为每个密码子由3个核苷酸构 成,并且构成DNA的核苷酸被限制于4种特定的碱基,所以有64种可能的核苷酸组合,其中 61种编码氨基酸(其余3个密码子编码终止翻译信号)。结果,许多氨基酸被多于一种密 码子指定。例如,氨基酸丙氨酸和脯氨酸由4种三联体编码,丝氨酸和精氨酸由6种三联体 编码,而色氨酸和甲硫氨酸只有1种三联体编码。显示哪些密码子编码哪些氨基酸的"遗传 密码"是本领域公知的。其中的简并性允许DNA碱基在一个宽广的范围内变化,而不会影响 由该DNA编码的蛋白质的氨基酸序列。
[0060] 在本文的一些实施方案中,当设计密码子序列用于在宿主细胞内获得改良的表达 时,设计基因使其中的密码子使用频率接近宿主细胞的优选密码子利用的频率。因此,术语 "密码子优化的"是指用于转化各种宿主的基因和核酸编码序列,其中该基因或编码序列的 密码子已被改变,以反映宿主生物的典型密码子利用率,但不改变由该核酸编码的多肽。在 实例中,这种优化包括用生物基因中更频繁使用的一个或多个密码子代替该基因或编码序 列中的至少一个、超过1个、显著数量的、和/或全部的密码子。
[0061] 许多生物显示偏好使用特定的密码子来编码伸长肽链中的特定氨基酸插入物。密 码子优先性或密码子偏好性(在生物之间密码子利用率的差异)是由遗传密码的简并性提 供的,并且在许多生物中有大量证据证明。密码子偏好性经常与信使RNA(mRNA)的翻译效 率相关,而该翻译效率则被认为依赖于(但不仅仅依赖于)接受翻译的密码子的性质和特 定的转运RNA(tRNA)分子的可得性。细胞内选定的tRNA的优势一般反映了最频繁用于肽 合成的密码子。因此,可以根据密码子优化对基因进行裁量或设计,以便在给定生物内实现 最佳的基因表达。
[0062] 由于有多种多样的动物、植物和微生物物种的大量的基因序列可用,所以有可能 计算密码子利用率的相对频率。密码子利用率表可以容易地获得,例如在互联网kazusa. or. jp/codon/上可访问的"Codon Usage Database"中,并且这些表可以通过不同的方式调 整适用。见Nakamura et al. (2000) Nucl. Acids Res. 28:292。利用密码子利用率表,本领 域技术人员能够将相应于给定物种的频率应用于任何给定多肽序列,来设计和产生密码子 优化的编码区的人造核酸片段,该编码区编码该多肽,但是使用对该物种而言最优的密码 子。
[0063] 密码子偏好在蛋白编码区的平均碱基组成上有反映。例如,基因组中G+C含量相 对较低的生物使用更多在同义密码子第三位中具有A或T的密码子,而G+C含量较高的生 物则使用更多在第三位是G或C的密码子。此外,人们认为在mRNA中存在的"稀有"密码 子可能会降低该mRNA的绝对翻译速度,特别是当相应于该稀有密码子的负载tRNA的相对 丰度较低时。这个推理的一个推论是,对于多个稀有密码子而言,单个稀有密码子对翻译速 度的减少可能至少是叠加性的。因此,具有高相对含量的稀有密码子的mRNA的翻译速度会 相应降低。该速度可能反映在所编码蛋白相对低水平上。
[0064] 密码子偏好可以作为单个密码子相对于所有氨基酸密码子的相对使用频率来计 算。或者,密码子偏好可以作为用于编码特定氨基酸的单个密码子相对于该氨基酸的所有 其它密码子(同义密码子)的相对使用频率来加以计算。
[0065] 术语"百分比同一性"(或" %同一性")是指两个或多个多肽序列(或多核苷酸序 列)通过序列比较确定的相互关系。百分比同一性可以表示多肽(或多核苷酸)序列之间 序列相关性的程度,并可以通过这些序列的串之间的匹配加以确定。一般而言,同一性分别 是指两个多核苷酸或多肽序列的精确核苷酸-核苷酸或氨基酸-氨基酸一致性。两个序列, 无论是核酸还是氨基酸序列,的百分比同一性是两个对齐的序列之间精确匹配的数目除以 较短序列的长度,再乘以 100。见 Russell and Barton(1994)J.Mol.Biol.244:33250。
[0066] 用于比对核酸和氨基酸序列并确定同一性的技术是本领域已知的,包括例如 但不限于,在下列文献中提供的 Computational Molecular Biology (1988) (Lesk, A. Μ. , Ed.) Oxford University, NY :Biocomputing:Informatics and Genome Projects (1993) (Smith, D. ff. , Ed. ) Academic, NY :Computer Analysis of Sequence Data,Part I(1994) (Griffin, A. M.,and Griffin, H. G.,编辑)Humania, NJ :Seguence Analysis in Molecular Biology(1987)(von Heinje,G.,Ed. ) Academic, NY ;和 Sequence Analysis Primer(1991) (Gribskov, M. and Devereux, J.,Eds.) Stockton, NY。用于确定两个序列之间百分比同一性 的技术可包括提供mRNA或基因的核苷酸序列和/或提供或推断由其编码的氨基酸序列,和 将该序列与第二个核苷酸和/或氨基酸序列进行比较。基因组序列也可以按照这种方式加 以确定和比较。
[0067] 此外,用于比对核酸和氨基酸序列和确定同一性的方法纳入在各种公众可得 的计算机软件程序中。序列比对和百分比同一性计算可以使用,例如,如下程序实施: Vector NTIu 软件包的 AlignX?程序(Invitrogen, Carlsbad, CA)或 LASERGENE ?生物 信息学计算软件包的MegAlign?程序(DNASTAR? Inc.,Madison,WI)。序列的多重比对 可以用Clustal?方法实施,其包括多种比对算法版本,包括Clustal TM V和Clustal? ff(Higgins and Sharp(1989)〇 CABIOS 5:1513 ;Higgins et al. (1992)Comput. Appl. Biosci. 8:18991)。对于Clustal? V中的多重比对,可使用的默认值包括空位罚分=10和 空位长度罚分=10。Clustal? W中多重比对的默认参数包括(空位罚分=10,空位长度罚 分=〇· 2,延迟发散序列(Delay Divergen Seqs) (%) =30, DNA转换权重(DNA Transition Weight) =0.5、蛋白质权重矩阵(Protein Weight Matrix) =Gonnet 系列、DNA 权重矩阵 (DNA Weight Matrix) = IUB)。可以在Clustal?方法中使用的用于在蛋白序列之间进行 逐对比对和百分比同一性计算的默认参数是:KTUPLE = 1、空位罚分=3、窗口(WINDOW)= 5和DIAGONALS SAVED = 5。对于核酸,这些默认参数为KTUPLE = 2,空位罚分=5,窗口 = 4和DIAGONALS SAVED = 4。在用Clustal?程序进行序列比对后,有可能通过观察相同程 序中的"序列距离"(sequence distances)表来获得"百分比同一性"。
[0068] 在一些实施方案中,核酸编码如下的多肽,该多肽(当与参考多肽比较时, 例如DGT多肽)具有例如但不限于:至少大约55 % ;至少大约60 % ;至少大约65 % ; 至少大约70 % ;至少大约75 % ;至少大约80 % ;至少大约85 % ;至少大约90 % ;和 至少大约95%的同一性,具有与参考多肽相同或相似的功能。因此,在本文中可以 使用从例如55 %至100 %同一性的任何整数百分比描述特定的核酸,例如但不限于: 55% , 56% , 57% , 58% , 59% , 60% , 61% , 62% , 63% , 64% , 65% , 66% , 67% , 68% , 69% , 70 %,71%, 72%,73%, 74%, 75%,76%, 77%,78%, 79%,80%,81%,S2%,83%,84%,85%,86%,87%,88%,89 %,90%,91%,92%,93%,94%,95%,96%,97%,98%,和 99%。某些核酸片段不仅具 有前述的序列同一性,而且可以编码如下的多肽,该多肽具有,例如但不限于:至少50个氨 基酸;至少100个氨基酸;至少150个氨基酸;至少200个氨基酸;和至少250个氨基酸。特 定的实施方案包括与SEQ ID NO: 1具有至少大约90%同一性的核酸(例如,至少89%同一 性;至少大约90%同一1性;至少大约91 %同一1性;至少大约92%同一1性;至少大约93%同 一,性;至少大约94%同一^性;至少大约95%同一^性;至少大约96%同一^性;至少大约97% 同一^性;至少大约98%同一 1性;至少大约99%同一1性;和至少大约99. 5%同一1性)。
[0069] 术语"序列分析软件"是指一种计算机算法或软件程序,其可用于分析核苷酸或氨 基酸序列。"序列分析软件"可以商业获得或独立开发。序列分析软件的非限制性实例包 括:GCG 程序软件包(Wisconsin Package Version 9.0,Genetics ComputerGroup (GCG), Madison,WI);BLASTP?,BLASTN?,*BLASTXTM(Altschuletal.(1990)J.Mol. Biol.215:403-10) ;DNASTAR?(DNASTAR?,Inc. Madison, WI) ;Sequencher?(Gene Codes Corporation, Ann Arbor, MI);和整合了 Smith Waterman 算法的 FASTA?程 序(Pearson(1994)Comput. Methods Genome Res.「Proc. Int. Symp. I, Meeting Date 1992(Suhai and Sandor,编辑),Plenum:New York, NY, pp. 111-20)。在本文中使用序列分 析软件分析核苷酸或氨基酸序列时,除非另外指明,否则所显示的分析结果是使用所参考 程序的默认值产生的。如本文所使用的,术语"默认值"是指在首次初始化软件时,序列分 析软件最初加载的一系列值或参数。
[0070] 杂交:包含全部或部分核苷酸序列的核酸可以用作探针,与克隆的基因组DNA片 段或cDNA片段(例如,来自所选生物的基因组或cDNA文库)群体中存在的、与探针序列具 有显著量的序列同一性的核苷酸序列选择性"杂交"。杂交探针可以是基因组DNA片段、质 粒DNA片段、cDNA片段、RNA片段、PCR扩增的DNA片段、寡核苷酸、或其他多聚核苷酸,并 且探针可以用可检测的基团(例如 32P)或任何其他可检测的标记标记。因此,例如但不限 于,用于杂交的探针可以通过标记可特异性杂交本文中的核酸(例如与SEQ ID N0:1具有 至少大约90%同一性的核酸)的人造寡核苷酸加以制备。用于制备杂交探针和用于构建 cDNA和基因组文库的方法是本领域已知的。Sambrook等人.(1989)Molecular CloningiA Laboratory Manual.Second Edition, Cold Spring Harbor Laboratory Press,Cold Spring Harbor, NY。关于核酸杂交的详尽指导可以参见Sambrook等人(1989),同上;和 Ausubel 等人(1997) Short Protocols in Molecular Biology, Third Edition, Wiley, NY, New York,pp.2-40〇
[0071] 在一些实施方案中,核酸杂交(例如,对扩增的DNA的杂交)可用于鉴定样品中转 基因事件的存在。核酸分子或其片段能够在某些条件下与另一个核酸分子"特异性杂交"。 在一些实例中,核酸在严格的条件下与靶核酸特异性杂交。如本文所使用的,如果两个核酸 分子能够在严格(例如高严格度)条件下形成反平行双链核酸结构,则称这两个核酸分子 能够彼此特异性杂交。
[0072] 如果一个核酸分子与另一个核酸分子显不完全的序列互补性,则称这两个核酸分 子"互补"。如本文所使用的,当一个分子的每一个核苷酸都与另一个的核苷酸互补时,则 说核酸显示"完全互补性"。显示完全互补性的分子一般可以彼此杂交,并具有足够的稳定 性,从而允许它们在常规的"高严格度"条件下仍保持彼此退火。常规的高严格条件如上文 Sambrook 等人(1989)所述。
[0073] 如果两个分子彼此杂交,并具有足够的稳定性,从而允许它们至少在常规的"低 严格度"条件下仍保持彼此退火,则称它们显示"最小互补性"。常规的低严格条件如上文 Sambrook等人(1989)所述。核酸分子要用作引物或探针,仅需要显示能够在所采用的特定 溶剂和盐浓度下形成稳定的双链结构的最小的序列互补性即可。
[0074] 影响杂交严格度的因素是本领域技术人员众所周知的,包括例如:温度;pH ;离子 强度;和有机溶剂(例如甲酰胺和二甲基亚砜)的浓度。如本领域技术人员已知的,杂交严 格度随着温度升高、离子强度降低、和溶剂浓度降低而增加。严格条件还可以通过添加去稳 定剂例如甲酰胺来实现。
[0075] 术语"严格条件"或"严格度条件"是考虑一个核酸与另一个靶核酸(即,与包含感 兴趣的特定核苷酸序列的核酸分子)根据Sambrook等人(1989),同上(在9. 52-9. 55)中讨 论的具体杂交程序的杂交而定义的。另见Sambrook等人(1989)-9. 47-9. 52和9. 56-9. 58。
[0076] 在许多应用中,特异性与杂交后洗涤条件有关,其中因素包括洗涤溶液的离子强 度和温度。对于DNA-DNA杂交,熔点温度(T m)可以近似地用如下的公式计算:
[0077] Im= 81. 5°C+16. 6(logM)+0. 41(% GC)-〇. 61(% 甲)-500/L, (I)
[0078] 其中M是单价阳离子的摩尔数,% GC是DNA中鸟嘌呤和胞嘧啶核苷酸的百分 比,%甲是杂交溶液中甲酰胺的百分比,L是碱基对的杂交长度。Meinkoth and Wahl (1984) Anal. Biochem. 138:267-84。
[0079] Tm是这样的温度(在特定的离子强度和pH下):在此温度,50%的互补靶序列与 完美匹配的探针杂交。每有1%的错配,T m下降大约1°C。因此,可以调整!^、杂交、和/或 洗涤条件,以便让具有期望的同一性的序列杂交。例如,如果寻找有90%同一性的杂交序 列,则可以将T m降低KTC (在特定的离子强度和pH下)。例如,严格条件可以选择比具体 序列与其互补物在特定离子强度和PH下的热熔点(Tm)低大约5°C的温度。然而,极严格条 件可以在比TJS 1、2、3或4°C的温度下进行杂交和/或洗涤;中等严格条件可以使用比T m 低6、7、8、9或10°C的温度进行杂交和/或洗涤;低严格条件可以使用比Tm低11-20°C的温 度进行杂交和/或洗涤。
[0080] 在一些实例中,严格条件是如下的条件,其中盐浓度小于大约I. 5M Na+(例如大 约0· Ol-L OM Na+),pH 7. 0-8. 3,温度为短核苷酸(例如长度为10-50个核苷酸)至少大 约30°C和长探针(例如长度大于50个核苷酸)至少大约60°C。低严格条件的实例包括在 37°C的30-35%甲酰胺缓冲液、LOM NaCl、0. 1%十二烷基硫酸钠(SDS)中杂交,在50-55°C 的1X-2X SSC(20X SSC = 3. OMNaCl/O. 3M柠檬酸三钠)中洗涤。中严格条件的实例包括在 37°〇的40-45%甲酰胺、1.011恥(:1、0.1%503中杂交,在55-60°〇的0.5父-1父35(:中洗涤。 高严格条件的实例包括在37°C的大约50%甲酰胺、大约I. OM钠盐、大约0. 1 % SDS中杂交, 在约60-65°C的约0. IX SSC中洗涤。
[0081] 如本文所使用的,术语"多肽"包括单个多肽、多个多肽、和其片段。该术语是指由 通过酰胺键(也称作肽键)线性连接的单体(氨基酸)构成的分子。术语"多肽"是指两个 或多个氨基酸构成的任何链,且不指示产物的具体长度和大小。因此,肽、二肽、三肽、寡肽、 蛋白质、氨基酸链、和任何其它用于指示有两个或多个氨基酸的链的术语均包含在"多肽" 的定义之内,并且前述术语在本文中可以和"多肽"互换使用。多肽可以是从天然生物源分 离的或者通过重组技术产生的,但是具体的多肽不一定是从特定的核酸翻译产生的。多肽 可以用任何合适的方式产生,包括例如但不限于,通过化学合成。
[0082] 内源的和异源的:如本文所使用的,术语"天然的"是指在自然界中发现的、并与其 自身的调节序列(如果存在的话)在一起的多核苷酸、基因或多肽形式。术语"内源的"是 指处于生物或生物基因组中的天然位置处的多核苷酸、基因或多肽的天然形式。
[0083] 相反,术语"异源的"是指在参考(宿主)生物的位置处通常不会发现的多核苷酸、 基因或多肽。例如,异源核酸可以是通常在参考生物的不同基因组位置处被发现的核酸。作 为进一步的实例,异源核酸可以是通常不会在参考生物中被发现的核酸。含有异源多核苷 酸、基因或多肽的宿主生物可以通过将异源多核苷酸、基因或多肽导入到宿主生物内而产 生。在特定的实例中,异源多核苷酸包括以不同于相应的天然多核苷酸的形式被重新导入 到来源生物内的天然编码序列、或其部分。在特定的实例中,异源基因包括以不同于相应的 天然基因的形式被重新导入到来源生物内的天然编码序列或其部分。例如,异源基因可以 包括天然编码序列,该天然编码序列是含有非天然调节区的嵌合基因的一部分,该嵌合基 因被重新导入到天然宿主内。在特定的实例中,异源多肽是以不同于相应的天然多肽的形 式被重新导入到来源生物内的天然多肽。
[0084] 异源基因或多肽可以是这样的基因或多肽,其包含功能性多肽或编码功能性多肽 的核酸序列,该功能性多肽或编码功能性多肽的核酸序列与其它基因或多肽融合从而产生 嵌合或融合的多肽或编码它的基因。基因和蛋白的特定实施方案包括具体例举的全长序列 和部分、区段、片段(包括与全长分子相比具有内部和/或末端缺失的连续片段)、变体、突 变体、嵌合体、以及这些序列的融合。
[0085] 修饰:如本文所使用的,术语"修饰"可以指特定参考多核苷酸内的改变,其导致 由该参考多核苷酸编码的多肽的活性降低、基本上消失、或消失。修饰还指参考多肽中的 改变,其导致参考多肽的活性减低、基本上消失、或消失。或者,术语"修饰"可以指参考多 核苷酸中的改变,其导致该参考多核苷酸编码的多肽的活性增加或提高,以及参考多肽中 的改变,其导致参考多肽的活性增加或提高。诸如前述的改变可以通过任何本领域众所周 知的方法实现,这样的方法有若干种,包括,例如但不限于:缺失参考分子的一部分;突变 参考分子(例如通过自发诱变;通过随机诱变;通过增变基因导致的诱变;和通过转座子诱 变);取代参考分子的一部分;在参考分子内插入元件;下调参考分子的表达;改变参考分 子的细胞定位;改变参考分子的状态(例如通过参考多核苷酸的甲基化,和通过参考多肽 的磷酸化或泛素化);除去参考分子的辅助因子;导入靶向参考分子的反义RNA/DNA ;导入 靶向参考分子的干扰RNA/DNA ;参考分子的化学修饰;参考分子的共价修饰;用UV辐射或 X射线辐照参考分子;改变参考分子的同源重组;改变参考分子的有丝分裂重组;代替参考 分子的启动子;和/或前述的任意组合。
[0086] 可以通过比较参考多核苷酸或多肽的序列与同源(例如同源酵母或细菌)多核苷 酸或多肽的序列,并使高度同源区(保守区)或共有序列中的修饰数目最大化,来找到确定 在具体实例中哪些核苷酸或氨基酸残基可以被修饰的指引。
[0087] 衍生物和变体:如本文所使用的,术语"衍生物"是指本文示例序列的修饰物。这 些修饰包括本文中的编码序列中的一个或多个碱基的取代、插入、和/或缺失,这些修饰可 保留、略微改变、或增加该编码序列在作物物种中的功能。这些衍生物可以由本领域技术人 员容易地确定,例如但不限于,通过使用用于预测和优化序列结构的计算机建模技术来确 定。因此,术语"衍生物"也包括这样的异源核酸,它们包含与本文中的示例序列具有相当 大的序列同一性的序列,从而使它们可具有相同、略微改变、或增加的用于在作物植物中表 达DGT-28的功能性。
[0088] 如本文所使用的,术语"变体"是指这样的多肽,其由于氨基酸的插入、缺失、突变、 和/或取代而与本文的示例多肽有差异,插入、缺失、突变、和/或取代可以使用,例如但不 限于,重组DNA技术加以导入。关于确定参考氨基酸序列中的哪些氨基酸残基可以取代、添 加或缺失的指引,可以通过比较特定参考多肽的序列与同源多肽的序列,并使高度同源区 (保守区)中被改变的氨基酸序列数目最小化,或通过用共有序列代替这些氨基酸来找到。 变体多肽可以具有被取代的氨基酸,但同时仍保留参照多肽的功能活性。"变体"基因包括 编码与参考基因相同的多肽,或者与参考多肽具有等价或相似活性的等价多肽的核苷酸序 列。
[0089] 在一些实施方案中,变体基因可用于产生变体蛋白,并且重组宿主可用于产生变 体蛋白。例如,可以构建成含有任何本文例证序列的连续残基(氨基酸或核苷酸)的变 体基因和蛋白。变体基因或蛋白可以具有,例如但不限于:3、4、5、6、7、8、9、10、11、12、13、 14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、 39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、 64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、 89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、 111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、 130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、 149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、 168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、 187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、 206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、 225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、 244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、 263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、 282、283、284、285、286、287、288、289、290、291、292、和293个连续残基(氨基酸或核苷酸), 其相应于示例序列中的一个(相同大小的)区段。类似大小的区段,特别是保守区的区段, 也可用作探针和/或引物。
[0090] 本领域的技术人员应当理解,许多水平的序列同一性均可用于鉴定与参考多肽具 有相同或相似功能或活性的多肽(例如,来自其它物种)。在一些实施方案中,具有例如,但 不限于:至少大约55% ;至少大约60% ;至少大约65% ;至少大约70% ;至少大约75% ;至 少大约80% ;至少大约85% ;至少大约90% ;和至少大约95%序列同一性(与参考多肽, 例如DGT 28多肽相比)的变体多肽具有与参考多肽相同或相似的功能。
[0091] 可以通过获取并检查感兴趣蛋白的结构(例如,从晶体结构和/或分子模型获得 原子3-D (三维)坐标),来确定包含特定分子的连续残基的变体基因和蛋白的设计和构建 策略。在一些实例中,策略可以指向蛋白质中对于修饰而言理想的某些区段,例如表面暴露 的区段,而不是涉及蛋白质折叠和至关重要的3-D结构完整性的内部区段。例如,美国专利 No. 5, 605, 793涉及通过在随机或聚焦(focused)断裂之后利用DNA再装配来生成额外的 分子多样性的方法。这可以称作基因"改组(shuffling)",其通常包括混合两种或多种不 同DNA分子的(期望大小的)片段,然后进行重复多轮复性。这种处理可以改进由主题基 因编码的蛋白质的活性。结果可能是一种嵌合蛋白质,其具有改进的活性、改变的底物特异 性、增加的酶稳定性、改变的立体特异性(stereospecificity)、或其他特征。
[0092] 氨基酸"取代"可以是用另一个具有相似结构和/或化学性质的氨基酸代替参考 序列中的一个氨基酸(即,保守的氨基酸取代),或者可用一个具有不同结构和/或化学性 质的氨基酸代替参考序列中的一个氨基酸(即,非保守的氨基酸取代)。氨基酸可以分成 如下的结构和/或化学类别:非极性、不带电荷的极性、碱性、和酸性。相应地,可以根据所 涉及的残基在极性、电荷、溶解性、疏水性、亲水性、或两亲性质上的相似性进行"保守"氨基 酸取代。例如,非极性(疏水)氨基酸包括甘氨酸、丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨 酸、苯丙氨酸、色氨酸和甲硫氨酸;不带电荷的(中性)极性氨基酸包括丝氨酸、苏氨酸、半 胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺;带正电荷的(碱性)氨基酸包括精氨酸、赖氨酸和组 氨酸;带负电荷的(酸性)氨基酸包括天冬氨酸和谷氨酸。或者,可以通过选择这些氨基酸 中的任何种类在极性、电荷、溶解性、疏水性、亲水性、或两亲性质上的差异性来进行"非保 守"氨基酸取代。"插入"或"缺失"可以在重组蛋白质在结构或功能上可以耐受的变化范围 内。
[0093] 在一些实施方案中,变体蛋白质相对于参考全长蛋白质是"截短的"。在一些实例 中,截短的蛋白质保留参考蛋白质的功能活性。"截短的"蛋白质意思是指蛋白质的一部分 可以被例如切掉,而剩下的截短的蛋白质在切割后仍保留并显示期望的活性。切割可以用 任何蛋白质酶实现,这样的蛋白酶有很多种。此外,有效切割的蛋白质可以用分子生物学 技术产生,其中通过限制性内切核酸酶消化或者通过本领域技术人员可用的其它技术,从 编码序列中去除编码蛋白质的一部分的DNA碱基。截短的蛋白质可以在异源系统中表达, 例如,大肠杆菌、杆状病毒、基于植物的病毒系统和酵母。赋予除草剂耐受性的截短蛋白质 可以通过使用异源系统在除草剂耐受性生物测定体系中表达蛋白质来加以确认,例如本文 中所述。本领域公知,可成功地产生截短蛋白质,并使它们保留全长参考蛋白质的功能活 性。例如,Bt蛋白质可以以一种截短的(核心蛋白质)形式使用。参见,例如,Hofte and Whiteley(1989)Microbiol. Rev. 53(2) :24255;和 Adang et al. (1985)Gene 36:289300。
[0094] 在一些情况下,特别是用于在植物中表达的情况下,使用表达截短蛋白质的截短 基因可能是有利的。截短基因可以编码由例如全长蛋白质的40、41、42、43、44、45、46、47、 48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、 73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、 98、或99%构成的多肽。
[0095] 本领域的技术人员可确定保留作为其设计来源的参考序列的功能的变体基因和 蛋白质,例如通过测定重组变体的活性加以确定。如果这种活性测定是已知的并且已经被 表征,那么功能变体的确定仅需要常规的实验。
[0096] 可以对酶"活性位点"进行特异性改变,以影响其在活性或立体结构特异性方面的 固有功能性。参见 Muller et.al.(2006)Protein Sci. 15(6):135668。例如,已知的 tauD 结构已被用作一种模式双加氧酶,用来在与其固有底物牛磺酸结合的情况下确定活性位 点残基。参见 Elkins et al.(2002)Biochemistry41 (16) :518592。关于酶活性位点的序 列优化和可设计性的信息可以参见Chakrabarti et al. (2005)Proc. Natl. Acad. Sci. USA 102(34):1203540。
[0097] 可以改变蛋白质的各种结构性质和三维结构特征,而不对蛋白质的活性/功能 性造成不良影响。可以进行不会对分子活性和/或三维构象造成不良影响的保守氨基酸 取代("耐受性(tolerated)"取代)。还可以设计与参考蛋白质在序列水平上不同、但 保留相同或相似的总体关键三维结构、表面电荷分布等的变体蛋白质。参见例如美国专 利 7,058,515 ;Larson et al. (2002)Protein Sci. 11:280413 ;Crameri et al. (1997) Nat.Biotechnol. 15:4368 ;Stemmer(1994)Proc. Natl. Acad. Sci. USA 91: 1074751 ; Stemmer(1994)Nature 370:38991 ;Stemmer(1995)Bio/Technology 13:54953 ;Crameri et al. (1996)Nat. Med. 2:1003;和 Crameri et al. (1996)Nat. Biotechnol. 14:3159。
[0098] 对适合于在表达构建体(例如,DGT-28表达构建体)中使用的5'或3'UTR(例 如,人造发夹)也可以实施计算机设计,这样的计算机设计可用于设计本文一些实施 方案的核酸内的元件。用于预测/评估5'或3'UTR衍生物的计算机建模和UTR和 计算机建模技术包括,例如但不限于:MFoLd?3. 1版(可以从Genetics Corporation Group,Madison, WI 获得;见 Zucker et al. "Algorithms and Thermodynamics for RNA Secondary Structure Prediction:A Practical Guide," 录自 RNA Biochemistry and Biotechnology,1143, T. Barciszewski&B. F. C. Clark 编辑,NATO ASI Series, Kluwer Academic Publishers, Dordrecht, NL, 1999 ;Zucker et al. (1999) J. Mol. Biol. 288:91140 ;Zucker et al. "RNA Secondary Structure Prediction," 录 自 Current Protocols in Nucleic Acid Chemistry, S. Beaucage, D. E. Bergstrom, G. D.Glick,and R.A.Jones 编辑,John Wiley&Sons,New York,11.2.111.2.10,2000);和 C0VE?(使用协方差模型分析RNA结构(随机上下文无关文法方法(stochastic context free grammar methods)))v. 2. 4. 2(Eddy and Durbin(1994)Nucl. Acids Res. 22:207988), 其以源代码免费发布,并可以通过登录网址genetics, wustl. edu/eddy/software/下载; 和FOLDALIGN?(见Gorodkin et al. (1997)Nucleic Acids Res. 25(18) :372432和Gorodkin et al. (1997)Proceedings International Conference on Intelligent Systems for Molecular Biology ISMB International Conference on Intelligent Systems for Molecular Biology 5:120123),其也是免费发布的,并可以在网址 foldalign.ku.dk/ software/index. html 上下载。
[0099] 启动子:术语"启动子"指一种能够控制核酸编码序列或功能RNA的表达的DNA序 列。在实例中,受控制的编码序列位于启动子序列的3'。可以从天然基因中整体获得启动 子,启动子可以包括来自天然出现的不同启动子的不同元件,或者启动子甚至可以包括人 造的DNA片段。本领域的技术人员理解,不同的启动子可以指导基因在不同组织或细胞类 型中,或者在不同的发育阶段,或者响应不同的环境或生理条件表达。所有上述启动子的实 例都是已知的,并且在本领域中用于控制异源核酸的表达。指导基因在大多数细胞类型中 在大部分时间里表达的启动子通常称为"组成型启动子"。此外,虽然本领域技术人员已经 尝试界定调节序列的确切边界(在许多情况下未成功),但是已经认识到,长度不同的DNA 片段可能具有相同的启动子活性。特定核酸的启动子活性可以使用本领域熟知的技术进行 测定。
[0100] 可操作连接:术语"可操作连接"是指单一核酸上的多个核酸序列的关联,其中一 个核酸序列的功能受到另一个的影响。例如,当启动子能够影响编码序列的表达时(例如, 编码序列在启动子的转录控制之下),启动子与编码序列就是可操作连接的。编码序列可以 沿着有义和反义方向与调节序列可操作连接。
[0101] 表达:如本文所使用的,术语"表达"可以指衍生自DNA的有义(mRNA)或反义RNA 的转录和稳定积累。表达还指mRNA翻译成多肽。如本文所使用的,术语"过表达"是指高 于相同基因或相关基因的内源表达的表达。因此,如果异源基因的表达高于可比较的内源 基因的表达,则该异源基因被"过表达"。
[0102] 转化:如本文所使用的,术语"转化"是指核酸或其片段被转移并整合到宿主生物 内,导致基因上稳定的遗传。含有转化核酸的宿主生物被称作"转基因"、"重组"或"转化"生 物。已知的转化方法包括,例如但不限于:根癌土壤杆菌(Agrobacterium tumefaciens)或 发根土壤杆菌(A. rhizogenes)介导的转化;磷酸妈转化;聚凝胺转化;原生质体融合;电 穿孔;超声波方法(例如,超声波穿孔(sonoporation));脂质体转化;显微注射;用裸DNA 转化;用质粒载体转化;用病毒载体转化;基因枪转化(微粒轰击);碳化硅WHISKERS (晶 须)介导的转化;气溶胶射线转化(aerosol-beaming);和PEG介导的转化。
[0103] 导入:如本文所使用的,术语"导入"(在将核酸导入细胞的上下文中)包括细胞 的转化,以及包含核酸的植物与第二种植物的杂交,从而使第二种植物含有该核酸,这可以 用常规植物育种技术实施。这些育种技术是本领域已知的。关于植物育种技术的讨论,见 Poehlman(1995)Breeding Field Crops,第 4 版,AVI Publication Co.,Westport CT〇
[0104] 回交方法可用于将核酸导入植物。这种技术用于将性状导入植物已有几十年的历 史。回交(以及其它的植物育种方法学)的描述实例可以参见,例如,P〇elman(1995),同 上:和.Tensen (1988)Plant Breeding Methodology, Wiley, New York, NY。在一个不例性回 交方案中,将感兴趣的原始植物(以下简称"轮回亲本")与携带要导入的核酸的第二个植 物("非轮回亲本")杂交。然后,将此杂交产生的子代再次与轮回亲本杂交,并重复该过程 直到获得转化植物,其中除了来自非轮回亲本的核酸之外,转化植物还复原了轮回亲本的 几乎全部的期望形态和生理特征。
[0105] 质粒/载体:如本文所使用的,术语"质粒"和"载体"是指一种染色体外元件,其 可携带一个或多个非细胞核心代谢部分的基因。质粒和载体通常是环状双链DNA分子。然 而,质粒和载体可以是线性或环状核酸,呈单链或双链DNA或RNA,并可以衍生自任何来源, 其中若干核苷酸序列被连接或重组成一个独特的构建体,其能够将启动子片段和编码DNA 序列与任何合适的3'非翻译区一起导入到细胞内。在实例中,质粒和载体可以包括自主复 制序列、基因组整合序列、和/或噬菌体或核苷酸序列。
[0106] III. DGT-28 和 DGT-28 编码序列
[0107] 本文的一些实施方案提供了分离的多肽,其与SEQ ID NO: 1具有至少大约90%同 一性(例如89%,至少90%,至少91 %,至少92%,至少93%,至少94%,至少95%, 至少96%,至少97%,至少98%,和至少99%同一性)。这种多肽在本文被称作DGT-28 多肽。本文的一些实施方案提供了编码与SEQ ID NO: 1具有至少大约90%同一性的多肽的 核酸。这类核酸的特定实例在本文被称作"dgt-28"核酸。在多种多样的应用中期望修饰 植物细胞中的草甘膦代谢(例如,导入草甘膦抗性),Dgt-28核酸可用于任何这样的应用。
[0108] 为举例目的提供的Dgt-28核酸的特定实例是SEQ ID NOs:2和3。因此,一些实施 方案提供了包含如下核苷酸序列的核酸,其与SEQ ID NO:2或SEQ ID NO:3具有至少大约 80%序列同一性(例如79%,至少80%,至少81%,至少82%,至少83%,至少84%,至少 85%,至少86%,至少87%,至少88%,至少89%的,至少90%,至少91%,至少92%,至少 93 %,至少94 %,至少95 %,至少96 %,至少97 %,至少98 %,和至少99 %同一性);其中该 核酸编码与SEQ ID NO: 1具有至少大约90%同一性的多肽。Dgt-28核酸的特定实例包括 在严格(例如高严格)条件下与具有SEQ ID NO: 2或SEQ ID NO: 3的核酸特异性杂交的核 酸。
[0109] 在一些实施方案中,提供了密码子优化的Dgt-28核酸。例如,为了在植物中获得 异源基因的高表达,可能期望设计基因并对基因进行重新工程化,从而使它在植物细胞内 更高效地表达。在期望在植物细胞内表达细菌基因的场合,这个策略是特别可取的。
[0110] 因此,本文的一些实例提供了编码DGT-28蛋白质的植物优化基因,和设计它的方 法,用来产生能够在双子叶或单子叶植物中最优表达的DNA序列,并且其中序列修饰不会 干扰翻译或转录。对于以在单子叶和双子叶植物中表达相同的DGT-28蛋白质为目的的优 化Dgt-28基因设计,在本文中用该优化表达基因的蛋白质编码区的再工程化进行了示例。 本文中植物优化的Dgt-28核酸的实例包括SEQ ID NO:2和SEQ ID NO:3。
[0111] 在对编码用于在双子叶植物或单子叶植物(例如,棉花、加拿大油菜、烟草、玉米、 大豆、小麦和水稻)中表达的DGT-28蛋白质的基因进行工程化时,可以确定预期的宿主植 物的密码子偏好,例如通过使用可公开获得的DNA序列数据库找到关于植物基因组或各种 植物基因蛋白质编码区的密码子分布信息来加以确定。
[0112] 在设计用于植物表达的核酸中的编码区时,当存在多种选择时,应当确定植物优 选的主要("第一选择")密码子,以及优选密码子的第二、第三、第四选项等。然后,可以设 计编码相同肽(例如,DGT-28蛋白质)的氨基酸序列的新DNA序列,但是新DNA序列与原始 DNA序列的区别在于用植物(第一优选的、第二优选的、第三优选的、或第四优选的,等等) 密码子进行了取代,以规定氨基酸序列中每个位置处的氨基酸。
[0113] 然后可以对新序列进行分析,寻找可能由这些修饰产生的限制酶位点。对于鉴定 出的位点,可以进一步通过用第一、第二、第三或第四选择的优选密码子替换这些密码子来 进行修饰。序列中其他可能影响感兴趣的基因转录或翻译的位点是茎-环结构、外显子: 内含子接点(5'或3')、多聚腺苷酸添加信号、和RNA聚合酶终止信号;这些位点可通过用 植物密码子取代予以去除。可以对序列进行进一步的分析和修饰,以减少TA或CG双联体 (doublet)的频率。除了双联体之外,具有超过大约6个相同残基的G或C双联体序列区 块(block)会影响序列的转录或翻译。因此,可以通过将密码子的第一或第二选择替换为 下一级优选的密码子等方式来对这些区块进行修饰。
[0114] SEQ ID N0:2 (Dgt-28 (v5))是针对双子叶植物中的表达优化的。SEQ ID NO: 3 (Dgt-28 (v6))是针对单子叶植物中的表达优化的。这些人造序列中的密码子利用率是 基于优选的密码子利用率而选择的;即每一个的表达产物都是由具有单子叶或双子叶植物 利用率偏好的密码子编码的,并且除去了有害的序列和多余的限制性位点,以增加 DGT-28 多肽的转录/翻译效率且便于进行DNA操作步骤。
[0115] 类似地,对SEQ ID NO: 4的核酸分子(Dgt-28 (vl))进行了优化,以提高在大肠杆 菌中的表达。SEQ ID N0:4中的密码子利用率是根据大肠杆菌优选的密码子利用率而选择 的;所表达的蛋白质由具有大肠杆菌利用率偏好的密码子所编码。在重新设计过程中,除去 了有害的序列和多余的限制性位点,以增加 DGT-28编码序列的转录/翻译效率并便于进行 DNA操作步骤。因此,在大肠杆菌中从包含SEQ ID NO:4的核酸表达DGT-28可导致强健的 蛋白质表达,例如,用于DGT-28的酶学表征。
[0116] -旦在纸上或计算机上设计出了优化的(例如,植物优化的)DNA序列,便可以在 实验室里人造出在序列上与设计的序列精确对应的实际DNA分子。可以对这些人造的核酸 分子进行克隆和进行其他操作,完全如同它们来自自然或天然的来源一样。
[0117] 本文中的核酸可以被克隆到载体中,用于转化到原核或真核细胞中进行复制和/ 或表达。载体可以是原核载体;例如,质粒、或穿梭载体、昆虫载体、或真核载体。本文的核 酸也可以被克隆到表达载体中,例如,用于施用到植物细胞中。在某些应用中,可能优选的 是具有在大肠杆菌中发挥功能的载体(例如,生产用于产生抗体的蛋白质,DNA序列分析, 插入物构建,获得大量核酸)。
[0118] 为了在细胞内表达DGT-28蛋白质,通常将编码蛋白质的核酸亚克隆到含有 指导转录的启动子的表达载体中。合适的细菌和真核启动子是本领域公知的,例如在 Sambrook 等,Molecular Cloning, A Laboratory Manual (第 2 版 1989 ;第 3 版,2001 年); Kriegler, Gene Transfer and Expression:A Laboratory Manual(1990);和 Current Protocols in Molecular Biology(Ausubel et al·,同上)中所述。本文中用于表达核 酸的细菌表达系统可以在,例如,大肠杆菌、芽孢杆菌属和沙门氏菌属中获得(Palva et al. ,Gene 22:229235(1983))。用于这些表达系统的试剂盒可以商购。用于哺乳动物细胞、 酵母和昆虫细胞的真核表达系统是本领域技术人员公知的,并且也可以商购。
[0119] 考虑DGT-28蛋白质的预期用途(例如,在植物、动物、细菌、真菌和原生动物中表 达)来选择用于将遗传信息转运到细胞内的具体表达载体。通用的细菌和动物表达载体 是本领域已知的,并在例如,美国专利公开20050064474A1和国际专利公开WO 05/084190, W005/014791和W003/080809中有详细说明。可以用通用的转染方法产生表达大量蛋白质 的细菌细胞系,随后可以使用通用技术加以纯化。
[0120] 用于指导本文核酸表达的启动子的选择取决于特定的应用。在本文的实施方案中 可以使用多种在植物中指导基因表达的启动子。这些启动子可以从组成型、化学调节型、诱 导型、组织特异型、和种子优选型启动子中选择。例如,适合于宿主细胞的强组成型启动子 可用于表达和纯化DGT-28蛋白质。植物启动子的非限制性实例包括来自如下来源的启动 子序列:拟南芥泛素-10 (ubi 10) (Callis, et al·,1990, J. Biol. Chem. ,265:1248612493); 根癌土壤杆菌甘露喊合酶(Amas) (Petolino et al.,U.S. Patent No. 6, 730, 824);和 / 或木薯叶脉花叶病毒(CsVMV) (Verdaguer et al·,1996, Plant Molecular Biology 31:11291139)。
[0121] 组成型启动子包括,例如,核心花椰菜花叶病毒35S启动子(Odell et al. (1985) Nature 313:810812);水稻肌动蛋白质启动子(McElroy et al. (1990)Plant Cell 2:163171);玉米泛素启动子(美国专利号 5, 510, 474 ;Christensen et al. (1989) Plant Mol. Biol. 12:619632 和 Christensen et al. (1992)Plant Mol. Biol. 18:675689); pEMU 启动子(Last et al. (1991) Theor.Appl. Genet. 81:581588) ;ALS 启动子(美 国专利号 5, 659, 026);玉米组蛋白启动子(Chabout6 et al. Plant Molecular Biology, 8:179191 (1987));等。
[0122] 可用的植物兼容性启动子的范围包括组织特异性和诱导型启动子。诱导型调控元 件是能够响应诱导剂而直接或间接激活一种或多种DNA序列或基因的转录的调控元件。在 没有诱导物时,上述DNA序列或基因将不被转录。通常,特异性结合诱导型调控元件从而 激活转录的蛋白质因子以无活性的形式存在,随后会被诱导剂直接或间接地转化为活性形 式。诱导物可以是化学剂,例如蛋白质、代谢物、生长调节剂、除草剂或酚类化合物,或由热、 冷、盐、或有毒元素所直接施用的生理胁迫,或通过病原体或致病剂如病毒而间接施用的生 理胁迫。典型地,特异性结合诱导型调控元件从而激活转录的蛋白质因子以无活性的形式 存在,随后会被诱导剂直接或间接地转化为活性形式。可以通过从外部将诱导物施用给细 胞或植物,例如通过喷雾、浇水、加热或类似的方法,而将含有诱导型调控元件的植物细胞 暴露于诱导物。
[0123] 在本文的实施方案中可以使用任何诱导型启动子。见Ward et al. Plant Mol. Biol. 22:361366(1993)。诱导型启动子包括,例如但不限于:蜕皮激素受体启动 子(美国专利号6, 504, 082);来自ACEl系统的响应铜的启动子(Mett et al. PNAS 90:45674571(1993));来自玉米的响应苯磺酰胺除草剂安全剂的In2-1和In2-2基因(美 国专利号 5,364,780;他『81^^6七&1.,]\1〇1.6611.66116衍。8227:229-237(1991)和6&七2 6七 al.,Mol.Gen.Genetics 243:32-38 (1994));来自 TnlO 的 Tet 阻遏物(6&七2 6七&1.,]?〇1· Gen. Genet. 227:229-237 (1991);来自类固醇激素基因的启动子,其转录活性受到糖皮质激 素的诱导(Schena et al·,Proc. Natl. Acad. Sci. U.S.A. 88:10421 (1991)和 McNellis et al.,(1998)Plant J. 14(2):247-257);玉米GST启动子,其被用作预应急除草剂的疏水亲 电子化合物激活(参见美国专利No. 5, 965, 387和国际专利申请公开No. WO 93/001294); 和烟草PR-Ia启动子,其被水杨酸激活(见Ono S, Kusama M, Ogura R, Hiratsuka K. , "Evaluation of the Use of the Tobacco PR-Ia Promoter to Monitor Defense Gene Expression by the Luciferase Bioluminescence Reporter System, "Biosci Biotechnol Biochem.2011S印23 ;75(9) :1796-800)。其他受化学调控的感兴趣的启动子 包括四环素诱导型和四环素抑制型的启动子(参见,例如,Gatz et al.,(1991)Mol.Gen. Genet. 227:229-237,和美国专利号 5, 814, 618 和 5, 789, 156)。
[0124] 其它可调节的感兴趣启动子包括冷应答调控元件或热激调控元件,其转录分别 受到冷或热暴露的影响(Takahashi et al. ,Plant Physiol. 99:383-390, 1992);可被厌 氧条件诱导的醇脱氢酶基因的启动子(Gerlach et al.,PNAS USA 79:2981-2985(1982); Walker et al·,PNAS 84(19) :6624-6628 (1987)),来自豌豆 rbcS 基因或豌豆 psaDb 基 因的光诱导型启动子(Yamamoto et al. (1997) Plant J. 12 (2) :255-265);光诱导型 调节元件(Feinbaum et al.,Mol. Gen. Genet. 226:449, 1991 ;Lam and Chua, Science 248:471, 1990 ;Matsuoka et al. (1993)Proc. Natl. Acad. Sci. USA 90(20):9586-9590; Orozco et ah (1993)Plant MohBio. 23(6):1129-1138);植物激素诱导型调节元件 (Yamaguchi Shinozaki et al. , Plant Mol. Biol. 15:905, 1990 ;Kares et al., Plant Mol. Biol. 15:225, 1990),等等。诱导型调控元件还可以是玉米In2-1或In2-2基因,它们响 应苯磺酰胺除草剂安全剂(Hershey et al.,Mol. Gen. Gene. 227:229-237, 1991 ;Gatz et al.,Mol. Gen. Genet. 243:32-38, 1994),和转座子TnlO 的四环素阻遏物(63七2 6七&1.,]?〇1· Gen. Genet. 227:229-237, 1991)。
[0125] 胁迫诱导型启动子包括盐/水胁迫诱导型启动子,如P5CS(Zang et al. (1997) Plant Sciences 129:81-89);冷诱导型启动子,如 corl5a (Hajela et al. (1990) Plant Physiol. 93:1246-1252), corl5b(ffilhelm et al. (1993)Plant Mol Biol 23:1073-1077), wscl20(0uellet et al. (1998)FEBS Lett. 423324-328), ci7 (Kirch et al.(1997)Plant Mol Biol. 33:897-909),和 ci21A(Schneider et al. (1997) Plant Physiol. 113:335-45);干旱诱导型启动子,如 Trg_31(Chaudhary et al. (1996) Plant Mol. Biol. 30:1247-57)和 rd29(Kasuga et al. (1999)Nature Biotechnology 18:287-291)。渗透压诱导型启动子,如 Rabl7(Vilardell et al.(1991)Plant Mol. Biol.17:985-93)和渗压素(osmotin)(Raghothama et al. (1993)Plant Mol Biol 23:1117-28)。热诱导型启动子,如热激蛋白(Barros et al. (1992)Plant Mol. 19:665-75 ; Marrs et al. (1993) Dev. Genet. 14:27-41) > smHSP (Waters et al. (1996) J. Experimental Botany 47:325-338);和来自欧芹泛素启动子的热激诱导型元件(WO 03/102198)。其它 胁迫诱导型启动子包括rip2 (美国专利号5, 332, 808和美国
【发明者】J·M·里拉, R·M·西奇洛, C·耶基斯, A·E·鲁宾逊 申请人:陶氏益农公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1