用于在单子叶植物中调节胚特异性表达的核酸序列的制作方法

文档序号:570017阅读:903来源:国知局
专利名称:用于在单子叶植物中调节胚特异性表达的核酸序列的制作方法
技术领域
本发明涉及农业生物技术领域。本文中公开了具有针对萌芽胚
(germinating embryo)的表达特异性的表达构建体、包含此类表达构建体的 转基因植物以及制备并使用此类DNA构建体和转基因植物的方法。
背景技术
在农学重要的谷类作物中,种子形成是植物发育的最终目标。将种子 收获用于食品、饲料及工业产品。这些种子的用途和价值由种子中所含有 的蛋白质、油和淀粉的数量和品质决定。于是,所产生的种子的品质和数 量可能在受精前至种子成熟的任何时点上受环境条件影响。尤其,在受精 时刻及其附近的胁迫可以明显地影响种子发育。包括谷类谷粒(cereal grain)在内的禾本科(Poaceae)成员产生干的单种子果实。严格地说,这种 类型的果实是颖果,但通常叫做核(kernel)或谷粒(grain)。颖果的果皮或嚢 果皮包围种子并且牢固地与种子外皮附着。种子由胚和胚乳组成,被珠心 表皮和种子外皮包裹。因此,谷粒包含种子和其外皮或嚢果皮。种子包含 胚和胚乳。
能育的谷物(corn)植物含有雄性繁殖组织和雌性繁殖组织,通常分别 称作雄穗(tassel)和雌穗(ear)。雄穗组织形成了单倍花粉粒,每个花粉粒中 具备两个核,其中在花开期被散播时,所述花粉粒与雌穗的穗丝接触。雌 穗可以位于散播花粉的同一株植物上,或位于不同的植物上。花粉细胞发 育为称作花粉管的结构,其中所述花粉管向下延伸穿过单个雌性穗丝抵达 胚珠。两个雄性核经花粉管移动以抵达位于穗丝基部的单倍体雌性卵。两 个雄性核之一与所述单倍体雌性卵核融合并且使其受精以形成合子,其中所述合子在染色体数上是二倍体并且会变成谷粒中的胚。剩余雄性核与第 二个雌性核融合并且使其受精以形成初生胚乳核,其中所述的初生胚乳核
在染色体数上是三倍体并且会变成谷物植物的谷粒或种子的胚乳。未受精 的胚珠不产生谷粒并且未受精的组织逐步退化。
谷粒由众多部分组成,其中一些部分从母体组织衍生而其他部分来自 受精过程。按照母系方式,所述谷粒继承了众多种组织,包括保护性包围 的嚢果皮和花梗。花梗是使谷粒连接于穗轴并且促使营养从母体组织转移 至谷粒的短柱样组织。谷粒含有因受精活动产生的组织,包括新胚和胚乳。 胚是下一个世代的缩微祖先,含有用于新生幼龄谷物植物的根和苗生长的 细胞。胚也是贮藏油和蛋白质于谷粒中的一种组织。胚乳更多地作为营养 组织发挥作用并且以贮藏淀粉、蛋白质和油形式提供胚萌发及初期生长所 需要的能量。
鉴于高等植物中胚及谷粒发育期间存在复杂的调节作用,并且鉴于谷 粒通常是动物及人类营养的主要来源,所需要旨在改良此类营养来源的重 要工具包括可以驱动营养增强性基因表达的遗传启动子。另一方面,胚对 胁迫高度敏感。针对植物的胁迫可以由生物介质和非生物介质引起。例如, 胁迫的生物原因包括病原体感染、昆虫采食及被另 一种植物(如槲寄生)寄 生以及反刍动物啃食。非生物性胁迫例如包括过量或不充分的可用水、不
充分的光照、极端温度、人工化学品(如除草剂)、大风、土壤极端pH、受 限的营养获得性和空气污染。然而,利用多种内部机制及外部机制以躲避 或耐受胁迫,植物存活下来并且经常枝繁叶茂,甚至在不利条件下也是如 此。植物对胁迫的生理应答反映在基因表达方面的改变。
尽管操作胁迫诱导型基因可能在改善植物的胁迫耐受性方面发挥重 要作用,然而已经证实当胁迫不存在时,胁迫诱导型基因的组成型表达严 重不利地影响植物生长和发育(Kasuga 1999)。因此,本领域需要驱动具有 时间和/或空间差异性地表达的启动子,旨在提供在重要时间处控制并指导 在特定细胞或组织中基因表达的工具,尤其旨在提供胁迫耐受性或躲避。 尤其,玉米的干旱胁迫和/或密度胁迫经常导致减产。为稳定在不利环境下的植物发育及谷粒产量,调节种子萌发期间对胚(胚轴和盾片)的激素和营 养供应是有意义的。因此,需要在非生物胁迫条件下驱动胚或盾片中基因 表达的转录调节序列。
植物生物技术领域中的另 一 个熟知的问题是标记缺失
(marker-deletion)。选择标记在转化过程期间用来选择并鉴定转化的生 物,然而一旦已经鉴定出转化的生物后,则选择标记一般不提供有用的功 能,并且主要构成消费者中不接受这些"基因食品"产品的原因(Kuiper 2001),并且几乎没有不基于这些机制的标记(Hare2002)。因此,人们反复 尝试开发这样的技术,其中借助所述技术可以从植物基因组切除标记 DNA(Ow 1995; Gleave 1999)。本领域4支术人员熟悉用于位点定向方式除 去重组导入的核酸序列的多种系统。这些系统主要基于4吏用序列特异性的 重组酶。描述了多种序列特异性重组系统,如噬菌体Pl的Cre/lox系统 (Dale 1991; Russell 1992; Osborne 1995)、酵母FLP/FRT系统(Kilby 1995; Lyznikl996)、 Mu噬菌体Gin重组酶、大肠杆菌(五.co/,)Pin重组酶、质粒 pSRl的R/RS系统(Onouchil995; Sugita2000)、 attP/噬菌体X系统(Zubko 2000)。现有技术领域已知的这些方法的一个已知缺点是切除在整个植物范 围内是不均一的,因此产生嵌合样的切除模式,这需要繁瑣的额外选择和 再生轮次。
描述了在种子或谷粒成熟期间赋予表达增强的启动子(如大麦(barley) 的大麦醇溶蛋白启动子;见美国专利申请20040088754)。在双子叶植物中 指导胚特异性或种子特异性表达的启动子(例如大豆(soybean)伴大豆球蛋 白启动子;Chen 1988;油菜籽蛋白启动子,Kridl 1991)通常不能在单子叶 植物中指导相似的表达。不幸地是,相当少的启动子被鉴定为特异性指导 此方面的生理学(见例如US20040163144)。
因而,所描述的种子特异性或谷粒特异性启动子包括与编码植物种子 贮藏蛋白的基因(如编码大麦的大麦醇溶蛋白、稻(rice)的稻谷蛋白、水稻 素、谷醇溶蛋白或球蛋白;小麦(wheat)的麦醇溶蛋白或麦谷蛋白;玉米 (maize)的玉米醇溶蛋白或谷蛋白;燕麦(oat)的谷蛋白;高粱(sorghum)的高粱醇溶蛋白;黍(millet)pennisetins或黑麦(rye)的棵麦醇溶蛋白的基因) 相关的那些启动子。然而,另一方面,这些启动子的表达往往是渗漏的, 或是低表达水平的。此外,已经指出用多个转基因("堆积")改良作物植物 的兴趣正在增长。例如,单个玉米杂交体可以包含不仅赋予昆虫抗性,也 赋予特定除草剂抗性的重组DNA构建体。重要的是需要适宜的调节序 列以驱动这些或其他目的转基因中的每一转基因按需要表达。此外,重要
的是调节元件应当彼此明显不同。伴随利用相似调节序列驱动多个基因表 达的顾虑包括但不限于(a)在整合前的质粒内或在整合后的植物基因组 内,沿同源区域配对、交换和间插区域丟失;(b)由相反方向彼此邻近的序 列的两个拷贝导致的发夹环,以及切除和丢失这些调节区域的可能性;(c)
性DNA结合蛋白的竟争。
因此,本领域迫切需要鉴定可以用于经济重要的植物、尤其单子叶植 物中表达所选择的转基因的新序列。另外,本领域还需要在早期萌发种子 期间允许在胚或盾片中表达的转录调节序列。因此,本发明的一个目的是 提供用于胚优先地或特异地表达的新颖和备选的表达盒。该目的由本发明 实现。
发明概述
本发明涉及包含植物转录调节序列的分离的核酸分子,其中所述的转 录调节序列包含
i) 第一核酸序列,其包含干旱、寒冷应答性和/或ABA调节型基因的 启动子序列,例如图4中定义的植物基因-干燥应答性rd29或低温诱导的 蛋白?S基因或其功能等同物或同源物(homolog)的启动子序歹'J(在下文中为 "cor78启动子"),
和与其有效连接的
ii) 第二核,列,其包含如图5中定义的编码金属硫蛋白l(在下文中 为"MET1")的植物基因或其功能等同物或同源物的第一内含子(在下文中为"MET1内含子")。
干旱、寒冷应答性和/或ABA调节型基因的启动子序列包含熟知的蛋 白质类型的启动子。优选地,它是干旱、寒冷应答性和ABA调节型基因 的启动子序列。干旱、寒冷应答性和/或ABA调节型基因的基因实例是 rd29A、 rd29B、 lti或cor78。
图4序列代表RD29A和低温诱导的蛋白78。cor78启动子又称作rd29 启动子序列。Genbank数据库的BLAST指例如Genbank登录号 AB019226,其包含其他基因。在这个基因组序列中,cor78启动子以5,-3, 方向位于bpll743-bp12328。位于该启动子区下游的基因是低温诱导的蛋 白78(例如bp 12650-12698、 12784-12966、 13063-13536和13621-15047)。
干燥应答性RD29植物基因例如在登录号NM一001036984下公开,具 有2131 bp mRNA,注册日期PLN 2006年6月9日,VERSION NM—001036984.1 GI:79330663,并且被描述为编码一种在应答水剥夺如寒 冷、高盐和干燥时诱导表达的蛋白质的基因。该应答似乎通过脱落酸进行。 所述启动子区含有对于rd29B脱水应答性表达所需要的两个ABA应答元 件(ABRE)作为顺式应答元件。所述蛋白质是具有植物、动物和真菌中存在 的其他成员的基因家族的成员。将其描述为类似于胁迫应答蛋白相关的[拟 南芥(v4m6,V/o/7^s ^"//""fl)(TAIR:At4g25580.1)。 RD29还作为cor78在登 录号GB:AAA32776.1下公开。
因此,在一个实施方案中,使用在植物中控制编码所述蛋白质之一的 mRNA转录的启动子,例如编码胁迫应答蛋白的基因的启动子,如拟南芥 (TAIR:At4g25580.1)的启动子,例如rd29A, rd29B, lti或 cor78(GB:AAA32776.1)的启动子。优选地,所述启动子具有图4中所示的 序列或其同源物,例如其直向同源物。
优选地,cor78启动子衍生自双子叶植物。
在一个实施方案中,所述同源物是作为直向同源物预测在植物界 (Viridiplantae)中存在;优选地在链形植物(Streptophyta),更优选在有胚植 物(Embryophyta);维管植物(Tracheophyta)、甚至更优选在种子植物门(Spermatophyta)中存在的同源物。所述同源物更优选地从被子植物门 (Magnoliophtya)鉴定到,该同源物更优选地来自真双子叶植物 (eudicotyledons),该同源物甚至更优选来自核心真双子叶植物(core eudicotyledons)。因此,该同源物优选地来自蔷薇分支(rosids);更优选来 自真蔷薇II (eurosids II);甚至更优选来自十字花目(Brassicales),该同源 物甚至更优选例如来自十字花科(Brassicaceae),优选地来自拟南芥属 (Arabbidopsis)。
在一个实施方案中,所述同源物来自拟南芥栽培品种,例如来自C24, 或来自生态型如"Columbia"。
除了具有基本上相同的功能外,两种多肽基本上彼此相似的一个进一 步迹象是与所述多肽之一特异性结合的物质(例如抗体)还特异性地结合至 另一个多肽。因此,在一个实施方案中,RD29的同源物是可以在蛋白质 印迹分析法中因与单克隆抗体结合而被鉴定的蛋白质,其中产生所述的单 克隆抗体以特异性结合至具有图4中所示的氨基酸的蛋白质。
在一个实施方案中,使用其启动子的基因是与图4中所示的氨基酸序 列或核酸序列具有至少60%、 61%、 62%、 63%、 64%、 65%、 66%、 67%、 68%、 69%、 70%,例如71%、 72%、 73%、 74%、 75%、 76%、 77%、 78%、 79%、 80%、 81%、 82%、 83%、 84%、 85%、 86%、 87%、 88%、 89%和甚至90%或更大,例如91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%、大到至少99%的氨基酸序列同一性或核酸同一性的核酸或蛋白质。
优选地,使用其启动子的基因是显示低温诱导的蛋白78的表达模式的 基因或RD29基因。优选地,与所述基因连接的启动子序列与如SEQ ID NO.: 1所描述的核酸序列60%、 61%、 62%、 63%、 64%、 65%、 66%、 67%、 68%、 69%、 70%,例如71%、 72%、 73%、 74%、 75%、 76%、 77%、 78%、 79%、 80%、 81%、 82%、 83%、 84%、 85%、 86%、 87%、 88%、 89%和甚至卯%或更大,例如91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%、大到至少99%同一。可以通过使用鉴定或克隆核酸序列的标 准技术(但不排除其他技术)、数据库搜索法、杂交或基于PCR的技术,利用SEQ ID NO.: 1、 5或6的或例如图4a-4c中所示的低温诱导的蛋白78 或RD29基因的至少10、 15、 20、 30或更多个连续核苷酸获得所述启动子。
Metl基因在Sasaki, T.等,Nature 420(6913), 312-316(2002)中并在登 录号AP002540下公开,是249 bp的线性DNA, PLN 19-OCT-2004, VERSIONAP002540.2 GI:13872872。该序列于2000年6月21日提交, 并且在2001年4月27日将该序列版本替换为gi:8698578。基因从以下数 据库GENSCAN、 FGENESH、 GeneMark.hmm、 GlimmerM、 RiceHMM、 SplicePredictor、 sim4、 gap2、 BLASTN和BLASTX的综合结果中预测。 将基因组序列针对NCBI非冗余蛋白质数据库、在RGP或DDBJ上的nr 和cDNA序列数据库搜索。将编码区的蛋白质同源性针对NCBI非冗余蛋 白质数据库用BLASTP搜索。EST代表使用BLASTN、以相应DDBJ登 录号和RGP克隆ID鉴定的cDNA序列。全长cDNA代表使用BLASTN, 以相应DDBJ登录号鉴定的cDNA序列。与某蛋白质具有同一性或显著同 源性的基因基于该蛋白质的名称进行分类,以指示同源性水平,如相同名 称、"推定的-"和"-样蛋白"。与任意蛋白质无显著同源性,但具有全长cDNA 或EST同源性(覆盖部分序列的几乎全部长度)的基因分类为"未知的"蛋 白。根据IRGSP标准,由两个或多个基因预测程序预测的基因分类为"假 定的"蛋白。由单个基因预测程序预测的基因也分类为可能的"假定"蛋白, 并且将该基因纳入作为序列的一个混杂特征。所述序列的方向是从PAC 克隆的T7至SP6。 P0434B04克隆的这个序列与P0416D03(DDBJ: AP002872)克隆在5'端处重叠并且与P0009G03(DDBJ: AP002522)克隆在 3'端处重叠。关于重叠和装配品质的详细信息以及该条目的注释可在 GenomeSeq获得。
优选地,使用图5中所示的MET1基因或其同源物的内含子,例如其 直向同源物的内含子。
优选地,所述第一内含子衍生自单子叶植物的MET1基因。所述同源 物优选地是例如来自植物界,例如来自链形植物,更优选来自有胚植物, 甚至更优选来自维管植物的直向同源物。该同源物例如来自种子植物门,优选地来自被子植物门,更优选来自百合纲(Lmopsida)、甚至更优选来自 禾本目(Poales),甚至更优选来自禾本科(Poaceae)。在一个实施方案中,该 同源物来自BEP进化枝,例如来自稻亚科(Ehrhartoideae),更优选来自稻 族(Oryzeae),例如来自稻属(Oryza)。
在一个实施方案中,使用衍生自稻(Oryzasativa),例如衍生自栽培品 种如粳型稻栽培品种组(japonica cultivar-group)的直向同源物。
优选地,所述同源物是直向同源物并且在耗尽测定法(depletion assay ) 中显示与野生型基本上相同的表型。
除了具有基本上相同的功能外,两种多肽基本上彼此相似的一个进一 步迹象是与所述多肽之一特异性结合的物质(例如抗体)还特异性地结合至 另一个多肽。因此,在一个实施方案中,MET1的同源物是可以在蛋白质 印迹分析法中因与单克隆抗体结合而被鉴定的蛋白质,其中产生所述的单 克隆抗体以特异性结合至具有图5中所示的氨基酸的蛋白质。
在一个实施方案中,使用其内含子例如所述第一内含子的基因的同源 物编码这样的蛋白质,所述蛋白质与图5中所示的氨基酸序列具有至少 60%、 61%、 62%、 63%、 64%、 65%、 66%、 67%、 68%、 69%、 70%, 例如71%、 72%、 73%、 74%、 75%、 76%、 77%、 78%、 79%、 80%、 81%、 82%、 83%、 84%、 85%、 86%、 87%、 88%、 89%和甚至卯%或 更高,例如91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%、大到至 少99%的氨基#列同一性或核酸同一性。
优选地,使用其内含子的基因的同源物编码显示MET1基因表M式 的蛋白质。优选地,所述基因的内含子的核^列与如SEQIDNO.:3所 描述的核酸序列60%、 61%、 62%、 63%、 64%、 65%、 66%、 67%、 68%、 69%、 70%,例如71%、 72%、 73%、 74%、 75%、 76%、 77%、 78%、 79%、 80%、 81%、 82%、 83%、 84%、 85%、 86%、 87%、 88%、 89% 和甚至90%或更高,例如91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%、大到至少99%同一。可以通过使用鉴定或克隆核酸序列的标准技术 (但不排除其他技术)、数据库搜索法、杂交或基于PCR的技术,利用SEQID NO.: 3、 7或8的或MET1基因的至少10、 15、 20、 30或更多个连续 核苷酸获得所述启动子。
可以使用Smith-Waterman序列比对算法(参见例如Waterman 1995) 实施序列比较,优选地使用具有以下参数的localS程序1.16版匹配1,错 配罚分0.33,开口缺口罚分2,延伸缺口罚分2。
cor78启动子与所述内含子(例如MET1的第一内含子)之间的距离优 选地是短的。在一个实施方案中,核酸分子包含例如接头序列,所述的接 头序列位于cor78启动子与所述内含子的第一核苷酸之间,例如长度是0 bp-100bp,例如10bp國卯bp或20國80bp,例如20、 30、 40、 50、 60、 70、 80或卯bp。
在本发明的另一个实施方案中,所述的内含子例如MET1的第一内含 子位于受转录调节性核苷酸序列控制所转录的核苷酸序列的另一个内含 子的序列中。
此外,在一个实施方案中,所述的核酸分子包含例如位于所述cor78 启动子序列与MET1内含子的第一核苷酸之间的5'UTR。
一种可能的排列由SEQ ID NO: 2的第8199 -第9656位碱基对代表, 其包含cor"启动子和METl基因的第一内含子,或由第8134-第9656 位碱基对代表,其包含cor79启动子、MET1基因的第一内含子和5,UTR。
受转录调节性核苷酸序列控制所转录的核苷酸序列的内含子例如位 于5'UTR中或位于靠近cor78启动子序列的另一个位置内,例如它位于编 码区5'端的头100 bp范围内或位于转录起始密码子后的第一个100 bp范 围内。
因此在一个实施方案中,本发明涉及分离的核酸分子,其包含编码植 物转录调节序列的多核香酸,其中所述植物转录调节序列包含 i)选自以下的第一核酸
a) 如SEQIDNO:l中定义的多核苷酸;
b) 与SEQ ID NO:l的多核苷酸具有至少50%序列同一性的多核苷
酸;
15c) SEQ ID NO:l的多核苷酸的至少50个连续碱基、优选至少100个 连续碱基、更优选200个连续碱基的片段;和
d) 在下述条件下与包含如SEQIDNO:l中所定义多核苷酸的至少50 个核苷酸的核酸杂交的多核苷酸,其中所述的条件等同于在5(TC于7。/。 十二烷基硫酸钠(SDS)、 0.5M NaP04、 lmM EDTA中杂交并在50°C于 2xSSC, 0.1。/。SDS中洗涤,和
ii)选自以下的第二核酸
a) 如SEQIDNO:3中定义的多核苷酸;
b) 与SEQ ID NO:3的多核苷酸具有至少50%序列同一性的多核苷
酸;
c) SEQ ID NO:3的多核苷酸的至少50个连续碱基、优选至少100个 连续碱基、更优选200个连续碱基的片段;和
d) 在下述条件下与包含如SEQ ID NO:3所描述序列的至少50个核苷 酸的核酸杂交的多核苷酸,其中所述的条件等同于在50。C于7。/。十二烷 基硫酸钠(SDS)、 0.5M NaP04、 lmM EDTA中杂交并在50°C于2xSSC, 0.1% SDS中洗涂,
其中所述的第 一和第二核酸序列是功能性连接的并且彼此是异源的。 优选地,包含编码转录调节序列的多核苷酸的核酸分子能够介导植物 或植物细胞中有效连接的核酸序列转录。更优选地,包含编码转录调节序 列的多核苷酸的核酸分子能够介导单子叶植物或单子叶植物细胞中有效 连接的核酸序列转录。优选包含编码转录调节序列的多核苷酸的核酸分子 具有组织特异性。更优选地,包含编码转录调节序列的多核苷酸的核酸分 子优先地在胚或盾片中表达。还优选包含编码转录调节序列的多核苷酸的 核酸分子优先地在非生物性或生物性胁迫条件下表达。所述生物性胁迫条 件选自真菌、线虫、昆虫、病毒和细菌和其组合。所述非生物胁迫条件选 自干旱、寒冷、热、盐、盐度、植物群体高密度、氮、紫外光和其组合。 最优选地,包含编码转录调节序列的多核苷酸的核酸分子优先地在干旱条 件下表达。本发明的另一个实施方案涉及包含编码如上所述的转录调节序列的 多核苷酸的核酸分子,其中所述核酸包含选自以下序列的至少两个,优选
地多个,例如3、 4、 5、 6、 7、 8、 9、 IO或更多个,例如多到所有核心启 动子基序,所述的序列如SEQIDNOs: 10、 12、 14、 17、 20、 22、 25、 27、 29、 31、 33、 35、 37、 39、 42、 44、 46、 48、 50、 53、 55、 57、 59、 63、 66、 68、 70、 72、 74、 77、 79、 82、 84、 86、 88、 90、 94、 96、 98、 102、
104、 108、 112、 114、 117、 121、 123、 125、 127、 129、 131、 137和138 中定义。优选地,所述启动子基序排列在如表8和9中所述的转录调节序 列的负链或正链上。甚至更优选地,所述的启动子基序位于与如表8和9 中所述的转录调节序列相同或相似的位置处。
本发明的又一个实施方案涉及了包含编码如上所述的转录调节序列 的多核苷酸的核酸分子,其中所述核酸包含选自以下序列的至少两个,优 选地多个,例如3、 4、 5、 6、 7、 8、 9、 IO或更多个,例如多到所有核心 启动子基序,所述的序列如SEQIDNOs: 9、 11、 13、 15、 16、 18、 19、 21、 23、 24、 26、 28、 30、 32、 34、 36、 38、 40、 41、 43、 45、 47、 49、 51、 52、 54、 56、 58、 60、 61、 62、 64、 65、 67、 69、 71、 73、 75、 76、 78、 80、 81、 83、 85、 87、 89、 91、 92、 93、 95、 97、 99、 100、 101、 103、
105、 106、 107、 109、 110、 111、 113、 115、 116、 118、 119、 120、 122、 124、 126、 128、 130、 132、 133、 134、 135和136中定义。优选地,所述 启动子基序排列在如表8和9中所述的转录调节序列的负链或正链上。甚 至更优选地,所述的启动子基序位于与如表8和9中所述的转录调节序列 相同或相似的位置处。
本发明的另一个实施方案涉及表达构建体,其中所述的表达构建体包 含与核酸序列功能性连接的这样的核酸分子,所述核酸分子包含编码转录 调节序列的多核苷酸。优选地,所述功能性连接的核酸序列赋予植物性状 或特性,其中所述的性状或特性选自提高的产量、胁迫条件下提高的抗性、 提高的种子或籽苗营养品质和/或油含量、和选择标记切除。所述提高的营 养品质和/或油含量可以包括至少一种化合物的含量提高,其中所述的化合物选自维生素、类胡萝卜素、抗氧化剂、不饱和脂防酸、多不饱和脂防酸 或其氨基酸含量改变的蛋白质。还优选的是所述表达构建体中功能性连接 的核酸序列的转录导致能够在目标植物中赋予至少一种基因功能的蛋白
质或功能性核糖核苷酸序列表达。功能性RNA包含选自反义RNA、有义 RNA、 dsRNA、孩丈RNA、 ta-siRNA、 snRNA、 RNAi或其组合的至少一种 RNA。
本发明的一个实施方案提供了由转基因植物产生的植物或种子,其中 所述的转基因植物用包含编码与核酸功能性连接的转录调节序列的多核 苷酸的核酸分子转化。在一个进一步优选的实施方案中,由所述转基因植 物产生的种子表达了能够在目标植物中赋予至少一种基因功能的蛋白质 或功能性核糖核苷酸序列,其中所述的种子或植物具有胁迫条件下提高的 抗性和/或提高的产量和/或提高的种子或籽苗营养品质和/或油含量。更优 选地,所述种子或植物是单子叶植物。优选地,所述种子或植物选自玉米、 小麦、稻、大麦、燕麦、黑麦、高粱、黑麦草或薏苡。更优选地,所述种 子或植物是禾谷类植物,选自玉米、小麦、大麦、稻、燕麦、黑麦和高粱,
甚至更优选地选自玉米、小麦和稻,最优选地,所述种子或^i物是玉米。 本发明的其他实施方案涉及本发明单子叶植物的种子、部分和细胞。优选 地,所述植物部分选自细胞、原生质体、细胞组织培养物、愈伤组织、细 胞团块、胚、花粉、胚珠、种子、花、谷粒、穗、穗轴、叶、外壳、柄、 根、根尖、花药和穗丝。
本发明的另 一个实施方案涉及用于植物提高产量和/或提高胁迫耐受 性的方法,其中所述的方法包括步骤
A)向植物导入表达构建体,所述表达构建体包含
i)选自以下的第一核酸序列
a) 如SEQIDNO:l中定义的多核苷酸;
b) 与SEQIDNO:l的多核苷酸具有至少50%序列同一性的多核苷
酸;
c) SEQ ID NO:l的多核苷酸的至少50个连续碱基、优选至少100个连续碱基、更优选200个连续碱基的片段;和
d)在下述条件下与包含如SEQIDNO:l中所定义多核苷酸的至少50 个核苷酸的核酸杂交的多核苷酸或其互补物,其中所述的条件是在50。C 于7。/。十二烷基硫酸钠(SDS)、 0.5M NaP04、 lmM EDTA中杂交并在50°C 于2xSSC, 0.1。/。SDS中洗涤,和与其有效连接的
ii)选自以下的第二核酸
a) 如SEQ ID NO:3中定义的多核苷酸;
b) 与SEQ ID NO:3的多核苷酸具有至少50%序列同一性的多核苷
酸;
c) SEQ ID NO:3的多核苷酸的至少50个连续碱基、优选至少100个 连续碱基、更优选200个连续碱基的片段;和
d) 在下述条件下与包含如SEQ ID NO:3所描述序列的至少50个核苷 酸的核酸杂交的多核苷酸或其互补物,其中所述的条件是在50。C于7。/。 十二烷基硫酸钠(SDS)、 0.5M NaP04、 lmM EDTA中杂交并在50°C于 2xSSC, 0.1。/oSDS中洗涤,
并且与至少一个核酸有效连接,其中所述的至少一个核酸相对于所述 第一或第二核酸序列是异源的并且能够向植物赋予提高的产量和/或提高 的胁迫耐受性,和
B)选择转基因植物,其中与野生型或无效分离子植物相比较,所述的 植物具有提高的产量和/或在胁迫条件下提高的胁迫耐受性。
本领域技术人员已知多种核酸以获得产量和/或胁迫抗性。所述核酸可 以包括但不限于编码参与植物激素生物合成、植物激素调节、细胞周期调 节或糖代谢的多肽。
本发明的另一个实施方案涉及用于赋予提高的种子或籽苗营养品质 和/或油含量的方法,其中所述的方法包括步骤
A)向植物导入表达构建体,所述表达构建体包含
i)选自以下的第一核酸
a)如SEQIDNO:l中定义的多核苷酸;同一性的多核苷
酸;
c) SEQ ID NO:l的多核苷酸的至少50个连续碱基、优选至少100个 连续碱基、更优选200个连续碱基的片段;和
d) 在下述条件下与包含如SEQIDNO:l中所定义多核苷酸的至少50 个核苷酸的核酸杂交的多核苷酸或其互补物,其中所述的条件是在50。C 于7。/。十二烷基硫酸钠(SDS)、 0.5MNaPO4、 lmMEDTA中杂交并在50。C 于2xSSC, 0.1。/。SDS中洗涤;和与其有效连接的
ii)选自以下的第二核酸
a) 如SEQIDNO:3中定义的多核苷酸;
b) 与SEQ ID NO:3的多核苷酸具有至少50%序列同一性的多核苷
酸;
c) SEQ ID NO:3的多核苷酸的至少50个连续碱基、优选至少100个 连续碱基、更优选200个连续碱基的片段;和
d) 在下述条件下与包含如SEQ ID NO:3所描述序列的至少50个核苷 酸的核酸杂交的多核苷酸或其互补物,其中所述的条件是在50。C于7。/。 十二烷基硫酸钠(SDS)、 0.5M NaP04、 lmM EDTA中杂交并在50°C于 2xSSC, 0.1% SDS中洗涤,
并且与至少一个核酸有效连接,其中所述的至少一个核酸相对于所述 第一或第二核酸序列是异源的并且适于向植物赋予提高的种子或籽苗营 养品质和/或油含量,并且
B)选择转基因植物,其中与野生型或无效分离子植物相比较,所述的 植物具有提高的营养品质和/或油含量。
营养品质和/或油含量如上文定义。更具体的实例在下文中给出。转录 调节序列在上文描述,更优选地,所述转录调节序列是胚特异的。
本发明的又一个实施方案涉及用于从植物中切除耙序列例如标记序 列的方法,所述的方法包括步骤
A)通过有效地连接转录调节性核苷酸序列而构建表达盒,所述转录调节性核苷酸序列包含
i) 选自以下的第一核酸
a) 如SEQIDNO:l中定义的多核苷酸;
b) 与SEQ ID NO:l的多核苷酸具有至少50%序列同一性的多核苷
酸;
c) SEQ ID NO:l的多核苷酸的至少50个连续碱基、优选至少100个 连续碱基、更优选200个连续碱基的片段;和
d) 在下述条件下与包含如SEQIDNO:l中所定义多核苷酸的至少50 个核苷酸的核酸杂交的多核苷酸或其互补物,其中所述的条件是在50。C 于7。/。十二烷基硫酸钠(SDS)、 0.5MNaPO4、 ImM EDTA中杂交并在50°C 于2xSSC, 0.1。/。SDS中洗涤;和与其有效连接的
ii) 选自以下的第二核酸
a) 如SEQ ID NO:3中定义的多核苷酸;b) 与SEQ ID NO:3的多核苷酸具有至少50%序列同一性的多核苷
酸;
c) SEQ ID NO:3的多核苷酸的至少50个连续碱基、优选至少100个 连续碱基、更优选200个连续碱基的片段;和
d) 在下述条件下与包含如SEQ ID NO:3所描述序列的至少50个核苷 酸的核酸杂交的多核苷酸或其互补物,其中所述的条件是在50。C于7。/。 十二烷基硫酸钠(SDS)、 0.5M NaP04、 ImM EDTA中杂交并在50°C于 2xSSC, 0.1% SDS中洗涤,
并且与至少一个核酸有效连接,其中所述的至少一个核酸相对于所述 的第 一或第二核酸序列异源性的并且适于诱导从植物中切除靶序列例如 标^己序列,和
B) 将所述的表达盒插入包含至少 一个靶序列例如标记序列的植物以 产生转基因植物,其中所述的植物表达所述的异源核酸序列,和
C) 选择转基因植物,其中所述转基因植物表现出切除所述靶序列例 如所述才示卡己序列。优选地,所述靼序列是标记序列,例如抗生素抗性基因或除草剂抗性 基因。
在本发明的一个优选实施方案中,从本发明的嵌合性转录调节序列表
达的核苷酸序列不编码P-葡糖醛酸糖苷酶(GUS)或不是用于表达GUS基因 以实现GUS介导染色的方法。
附图简述


图1.质粒pBPSMM368:At,Cor78::BPSl.l::GUS::NOS的图语
图2. At.Cor78启动子构建体的组织化学GUS染色。显示了所述构建 体的典型染色模式的代表性实例。A: At.Cor78::BPSl.l::GUS::NOS(pBPSMM368); B: At.Cor78::GUS::NOS (pBPSMM250); C: At.Cor78::Ubi-内含子l::GUS::NOS(pBPSMM346)
图3.玉米中受pBPSMM346启动子构建体控制的干旱胁迫诱导型表 达或稳定表达。5叶簇阶段的转基因植物因断水遭受干旱胁迫。在所示时 间点上从叶采集样品。RNA从叶样品分离并用定量RT-PCR分析。针对 每个样品中的内对照基因归一化GUS表达。与设置为1的0-时间点相比, 结果表示为表达水平提高的倍数。
图4a-4c: RD29A基因和低温诱导的蛋白78基因的核苷#列和氨基 酸序列。
图5: MET1基因的核苷紗列。
定义
除非另外说明,技术术语根据常规用法使用。分子生物学中常见术语 的定义可以在Lewin, Genes V, Oxford University Press出版,1994年 (ISBN 0-19-854187-9); Kendrew等(编者),The Encyclopedia of Molecular Biology, Blackwell Science Ltd.出版,1994年(ISBN 0-632画02182-9)以及 VCH Publishers,Inc.出版,Robert A. Meyers(编著),Molecular Biology and Biotechnology: a Comprehensive Desk Reference , 1995 年(ISBN1-56081-569-8)中找到。
应当理解本发明不限于所描述的具体方法学、方案、细胞系、植物物 种或属、构建体和试剂。还应当理解本文中所用术语的目的仅是描述具体 实施方案,并且不意图限制本发明的范围,其中所述的本发明范围仅受所 附的权利要求书限制。必须指出如本文中和在所附权利要求书中所用, 单数形式"一"和"该"包括复数指称,除非上下文另外清楚地声明。因此, 例如对"一个载体"的称谓是对一个或多个载体的称谓并包括本领域技术人 员已知的其等同物,以及其他等。
术语"约,,在本文中用来意指大约地、粗略地、左右或在......范围内。
当术语"约"与数字范围相连使用时,该术语通过延伸边界值高于和低于所 述值而修饰这个范围。通常,术语"约,,在本文中用来以高于和低于一个数 字值的20%变异、优选以10%以上或以下(之上或之下)的变异^务饰所述值。
如本文中所用,词语"或"意指特定列举的任一成员并且也包括所列举 成员的任意组合。
术语"基因"广义地用来指与生物学功能相关的核酸的任意节段。因此, 基因包括编码序列和/或其表达所需要的调节序列。例如,基因指表达 mRNA或功能性RNA或者编码特定蛋白质的核酸片段,并且其包括调节 序列。基因可以包括非编码性DNA序列和/或调节序列,其中所述的非编 码区可以转录成如微RNA。基因也包括例如形成其他蛋白质和/或RNA的 识别序列的非表达性节段。基因可以通过化学方法或分子生物学方法从多 种来源获得,包括从目的来源克隆或从已知或预测的序列信息合成,并且 可以包括设计旨在具有所需参数的序列。
术语"天然"或"野生型"基因指在未转化的细胞即没有已知突变的细胞 的基因组中存在的基因。
"标记基因"或"标记序列"编码可选择或可筛选性状。
术语"嵌合基因"指含有以下项的任一基因
l)包括在自然界中不在一起存在的调节序列和编码序列的DNA序列,
或2) 非天然连接的编码部分编码序列(例如编码蛋白质)的序列,或
3) 非天然连接的调节序列(例如启动子)的部分。
因此,嵌合基因可以包含衍生自不同来源的调节序列和编码序列,或 包含衍生自相同来源,但以不同于自然界中存在的方式排列的调节序列和 编码序列。
"转基因"指已经通过转化作用导入基因组并且得以稳定维持的基因。 转基因可以包括例如相对于待转化的特定植物的基因为异源的或同源的 基因。此外,转基因可以包含插入非原本生物的天然基因或包含嵌合基因。 术语"内源性基因"指位于生物基因组中其天然位置内的天然基因。"外源" 基因指通常在宿主细胞中找不到,但通过基因转移所导入的基因。
与本发明核苷酸序列相对应的例如用于探测或扩增反应中的"寡核苷 酸"可以是约30个或更少核苷酸长度(例如9、 12、 15、 18、 20、 21或24 个或在9和30个之间的任意数)。通常,特异性引物具有多于14个核苷酸 的长度。对于最佳特异性和成本效率而言,可以优选16至24个核苷酸长 度的引物。本领域技术人员完全能够针对使用方法如PCR法设计引物。 根据需要,探测可以用本文中公开的基因的完整限制性片段进行,其中所 述的完整限制性片可以是100个或甚至1000个核苷酸长度。
术语"多肽"、"肽"、"寡肽"、"多肽"、"基因产物"、"表达产物,,和"蛋 白质"在本文中可互换地用来指连续氨基酸残基的聚合物或寡聚物。如本文 中所用,术语"氨基酸序列"或"多肽序列"指一串代表氨基酸残基的缩写、 字母、字符或词。氨基酸可以在本文中通过它们共知的三字母符号或由 IUPAC-IUB生物化学命名委员会(IUPAC國IUB Biochemical Nomenclature Commission)推荐的单字母符号提到。本文中所用的缩写是氨基酸的常规 单字母代码A,丙氨酸;B,天冬酰胺或天冬氨酸;C,半胱氨酸;D天 冬氨酸;E,谷氨酸(glutamate),谷氨酸(glutamic acid); F,苯丙氨酸;G, 甘氨酸;H组氨酸;I异亮氨酸;K,赖氨酸;L,亮氨酸;M,甲硫氨 酸;N,天冬酰胺;P,脯氨酸;Q,谷氨酰胺;R,精氨酸;S,丝氨酸; T,苏氨酸;V,缬氨酸;W,色氨酸;Y,酪氨酸;Z,谷氨酰胺或谷氨酸(参见L. Stryer, Biochemistry, 1988, W. H. Freeman and Company, New York)。如本文在氨基酸序列中所用的字母"X,,可以代表任意氨基酸残 基。
"编码序列"指编码特定氨基酸序列并且排除非编码序列的DNA序列 或RNA序列。它可以构成"未间断的编码序列"(即无内含子),如在cDNA 中,或它可以包括由适宜的剪接接点(splice junction)界定的一个或多个内 含子。"内含子,,是这样的RNA序列,其包含在初级转录物中,但通过细 胞内的RNA切割和再连接作用被除去以产生可以翻译成蛋白质的成熟 mRNA。
术语"可读框"和"ORF"指在编码序列的翻译起始密码子与终止密码 子之间编码的氨基酸序列。术语"起始密码子"和"终止密码子"指编码序列 中分别指导蛋白质合成(mRNA翻译)起始和链终止的三个毗邻核苷酸的单 元("密码子")。
"功能性RNA"指不被翻译的反义RNA、核酶或其他RNA。 术语"RNA转录物"指因RNA聚合酶催化DNA序列转录而产生的产 物。当所述RNA转录物是此DNA序列的完美互补性拷贝时,此RNA转 录物称作初级转录物,或所述RNA转录物可以是从所述初级转录物的翻 译后加工过程衍生的RNA序列并且称作成熟RNA。"信使RNA,,(mRNA) 指无内含子并可由细胞翻译成蛋白质的RNA。"cDNA"指与mRNA互补并 且衍生自mRNA的单链或双链DNA。
"转录调节性核苷酸序列"、"调节序列"和"合适的调节序列,,分别指影 响已连接(或功能性连接)的待转录核苷酸序列的转录、RNA加工或稳定性 或者翻译的核苷酸序列。转录调节性核苷酸序列可以相对于待转录的核苷 酸序列具有多种定位。转录调节性核苷酸序列可以位于待转录序列(例如编 码序列)的上游(5,非编码序列)、位于其中或其下游(3,非编码序列)。转录调 节性核苷酸序列可以选自增强子、启动子、翻译前导序列、内含子、5,-非 翻译序列、3,-非翻译序列和聚腺苷酸化信号序列。它们包括天然序列和人 工序列,以及可以是人工序列与天然序列组合的序列。如上文指出,术语"转录调节性核苷酸序列"不限于启动子。然而优选地,本发明的转录调节 性核苷酸序列包含至少 一个启动子序列(例如位于能够诱导下游序列转录 的基因的转录起点上游的序列)。在一个优选实施方案中,本发明的转录调
天然5,非翻译区。此外,也可以使用该基因的3,非翻译区和/或聚腺苷酸化 区。
"启动子"指为RNA聚合酶和对于正确转录所需要的其他因子(例如反 式作用转录因子)提供识别作用而控制编码序列表达的核苷酸序列,其通常 位于编码序列的上游(5')。"启动子"包括最小启动子,其中所述的最小启动 子是由起指定转录起点作用的TATA盒和其他序列组成的短DNA序列, 其中向所述的短DNA序列添加调节元件(例如顺式元件)以控制表达。"启 动子"还指包含最小启动子和能够控制编码序列或功能性RNA表达的调节 元件的核苷酸序列。这种类型的启动子序列由近端和更远的上游元件组 成,更远的上游元件常称作增强子。因此,"增强子"是这样的DNA序列, 该DNA序列可以刺激启动子活性并且可以是该启动子的固有元件或所插 入旨在增强启动子的水平或组织特异性的异源性元件。增强子能够在两个 (正常或倒转)方向上起作用,并且甚至当被移到该启动子上游或下游时还 能够发挥功能。增强子和其他上游启动子元件均结合介导其效应的序列特 异性DNA结合蛋白。启动子可以完整地从天然基因衍生,或由从自然界 中存在的不同启动子衍生的不同元件组成,或甚至由人工DNA节段组成。 启动子也可以含有参与蛋白质因子结合的DNA序列,其中所述的蛋白质 因子控制应答生理条件或发育条件时的转录起始效率。如本文中所用,术 语"顺式元件"指赋予整体控制基因表达的一个方面的顺式作用转录调节元 件。顺式元件可以结合调节转录的转录因子、反式作用蛋白质因子而发挥 作用。 一些顺式元件结合不止一种转录因子,并且转录因子可以与不止一 种顺式元件以不同的亲和力相互作用。本发明的启动子受欢迎地含有可以 赋予基因表达或调节基因表达的顺式元件。顺式元件可以通过多种技术鉴 定,其中所述的技术包括缺失分析(即从启动子的5'端或内部缺失一个或多个核苷酸;使用DNA酶I足迹法的DNA结合蛋白分析法、甲基化干扰、 电泳迁移率移动分析、通过连接介导的PCR进行体内基因组足迹法和其 他常规分析;或通过常规DNA序列比较方法与已知顺式元件基序比较的 DNA序列相似性分析。顺式元件的精细结构可以通过诱变(或置换)一个或 多个核苷酸或通过其他常规方法进一步研究。顺式元件可以通过化学合成 或通过从包含如此元件的启动子分离获得,并且可以合成带有额外侧翼核 苷酸的所述顺式元件,其中所述的额外侧翼核苷酸含有旨在促进亚序列操 作的有用限制性酶位点。
"起始位点"是环绕在构成已转录序列的部分的第一核苷酸周围的位 置,该位置又定义为位置+1。相对于该位置,对基因及其控制区的全部其 他序列编号。下游序列(即3,方向上的其他蛋白质编码序歹'J)命名为正数, 而上游序列(大部分是5,方向上的控制区)命名为负数。
在缺少上游激活作用时无活性或启动子活性明显降低的启动子元件、 尤其TATA元件称作"最小或核心启动子"。在合适的转录因子存在下,所 述最小启动子发挥允许转录的作用。"最小或核心启动子"因此仅由对于转 录起始所需要的全部基础元件组成,例如TATA盒和/或起始子。
术语"内含子"指在基因中DNA的部分(间插序列),其中所述的部分不 编码由该基因产生蛋白质的部分并且在从该基因转录出的mRNA离开细 胞核被输出之前,从该mRNA中剪接出来。内含子序列指内含子的核^ 列。因此,内含子是DNA序列的这些区域,其中所述区域随编码序列(外 显子)一起转录出来,但是在成熟mRNA形成期间被除去。内含子可以位 于实际编码区内部或位于前mRNA(未剪接的mRNA)的5,或3'非翻译前导 序列中。初级转录物中的内含子被切除,并且同时且精确地连接所述编码 序列以形成成熟的mRNA。内含子与外显子的接界形成剪接位点。内含子 序列始于GU并且止于AG。此外,已经在植物中描述了两个AU-AC内含 子实例来自拟南芥(Jm6iVfo/w/s沩"/iVimi)的RecA样蛋白质基因的内含子 14和G5基因的内含子7是AT-AC内含子。含有内含子的前mRNA具有 三个短序列,其中除了其他序列之外,这三个短序列对于精确地剪接内含子是必需的。这些序列是5,剪接位点、3'剪接位点和分支点。mRNA剪接 是除去在初级mRNA转录物中存在的间插序列(内含子),以及接合或连接 外显子序列。这又称作顺式剪接,其中使相同RNA上的两个外显子接合, 同时除去间插序列(内含子)。内含子的功能性元件包含由剪接体的特定蛋 白质成分结合并识别的序列(例如在内含子末端的剪接共有序列)。所述功 能性元件与剪接体的相互作用导致内含子序列从不成熟mRNA中除去并 外显子序列再连接。内含子具有对于内含子精确剪接所必需(尽管不充分) 的三个短序列。这些序列是5,剪接位点、3,剪接位点和分支点。分支点序 列对于植物中剪接作用和剪接位点的选择是重要的。分支点序列通常位于 3'剪接位点上游10-60个核苷酸。植物序列在分支点中显示序列变异性, 所述的共有序列是CURAY或YURAY。
"组成型表达,,指使用組成型启动子或调节型启动子的表达。"条件性表 达"和"调节型表达"指由调节型启动子控制的表达。
"组成型启动子"指这样的启动子,其能够在;f直物的全部或几乎全部发 育阶段期间的全部或几乎全部植物组织中表达受该启动子控制的可读框 (ORF)。每种转录激活元件均不表现绝对的组织特异性,不过在绝大多数 植物部分中以转录最活跃的植物部分内所达到水平的至少1%水平介导转 录激活。
"调节型启动子"指这样的启动子,该启动子并不以组成型方式而以时 间和/或空间调节方式指导基因表达,并且包括组织特异性启动子和诱导型 启动子。这种启动子包含天然序列、人工序列以及可以是人工序列与天然 序列组合的序列。不同启动子可以指导基因在不同组织或细胞类型中或在 不同发育阶段或应答不同环境条件时表达。不断发现用于植物细胞的多种 类型的新启动子,众多实例可以在Okamuro等(1989)的编著内找到。植物 中有用的常见调节型启动子包括但不限于安全剂诱导型启动子、从四环素 诱导型系统衍生的启动子、从水杨酸诱导型系统衍生的启动子、从醇诱导 型系统衍生的启动子、从糖皮质激素诱导型系统衍生的启动子、从病原体 诱导型系统衍生的启动子和从蜕皮激素诱导型系统衍生的启动子。"组织特异性启动子,,指并不在全部植物细胞中表达而仅在特定器官 (如叶或种子)、特定组织(如胚或子叶)的一个或多个细胞类型中,或在特定 细胞类型(如叶薄壁组织细胞或种子贮藏细胞)中表达的调节型启动子。这 些启动子也包括以时间方式,例如在胚发生早期或晚期、在正在发育的种 子或果实中果实成熟期间、在充分分化的叶内或在衰老发作时受到调节的 启动子。
"诱导型启动子"指可以由外部刺激(如化学品、光、激素、胁迫或病原
体)在一个或多个细胞类型中开启(turn on)的那些调节型启动子。
"有效连接"或"功能性连接"优选地指多个核酸序列在单个核酸片段上 的连接,从而一个核酸序列的功能受另一个核酸序列影响。更具体地,它 指第一个序列的位置与第二序列充分接近,从而所述第一序列可以对第二 序列或对受所述第二序列控制的区域产生影响。例如,如果调节性DNA 序列和编码RNA或多肽的DNA序列如此安置,从而所述调节性DNA序 列影响编码性DNA序列的表达(即编码序列或功能性RNA处于所述启动 子的转录性控制下),则将调节性DNA序列称作与编码RNA或多肽的DNA 序列"有效连接"或"结合"。
大部分激活性序列(例如内含子)处于被增强的启动子的约300-400碱 基对范围内。
在一个实施方案中,内含子(例如INME内含子)的位置在受控基因的 5,UTR内(Rose等,RNA2002, 8:1444-1453; Callis等,1987, Genes & Dev 1:1183-1200; PF56400)。
在所述启动子区与内含子之间的接头例如小于400碱基对长度,例如 200、 100、 50或更少碱基对。优选地,核酸分子的第一序列通过长度约100 个核苷酸或更少核苷酸的接头与第二序列连接。
在本发明的又一个实施方案中,使用不止一个激活性序列并且所述激 活性序列相互之间间隔约16 -约80碱基对。所述编码序列可以有效地以 有义或反义方向连接于调节序列,例如转录成编码多肽或蛋白质片段的 mRNA或转录成调节性或酶型RNA分子,例如反义RNA、 RNAi、核酶、miRNA、 ta-siRNA、 dsRNA、 snRNA或本文中或相关文献描述的其他RNA 等,或者其组合。
"表达"指植物中内源性基因、ORF或其部分或转基因的转录和/或翻 译。例如,在反义构建体的情形下,表达可以仅指反义DNA的转录。此 外,表达指有义RNA(mRNA)或功能性RNA的转录和稳定累积。表达也 可以指蛋白质产生。
"特异性表达"是限于一种或一些种植物组织(空间限制)和/或限于一个 或一些植物发育阶段(时间限制)的基因产物表达。已知几乎不存在真正的 特异性启动子似乎优选地在某些组织中开启,而在其他组织中可能无活 性或仅有少量活性。这种现象称作渗漏表达。然而,特异性表达在本发明 中意指优先在一种或几种植物组织中表达。
(具有或没有增强子的)启动子的"表达模式"是显示转录由该启动子在 植物何处及在哪个发育阶段启动的表达水平模式。当一种启动子的表达模 式显示与其余启动子的表达模式很少重叠时,将一组启动子的表达模式称 为是互补的。启动子的表达水平可以通过测量已转录的标准报道mRNA 的'稳态,浓度来确定。这种测量是间接的,因为报道mRNA的浓度不仅仅 取决于其合成速率,还取决于该mRNA降解的速率。因此,稳态水平是合 成速率和降解速率的结果。然而当转录的序列相同时,可以认为降解速率 以固定速率进行,并且这个值因此可以起到测量合成速率的作用。当启动 子以这种方式比较时,本领域技术人员可用的技术是杂交、S1-RNA酶分 析法、RNA印迹法和竟争性RT-PCR。这些技术无论如何不代表可用的全 部技术,反而仅描述了分析mRNA转录活性和表达水平的常用方法。实际 上分析几乎全部启动子内的转录起点表明在转录起始的位点处通常不存 在单个碱基,反而存在或多或少簇集的成组起始位点,其中每组起始位点 构成mRNA的一些起点。由于这种分布在启动子与启动子之间不同,故在 每个群体内的报道mRNA序列彼此不同。由于每一 mRNA种类或多或少 地易于降解,因而不可能对不同的报道mRNA期望单一降解速率。已经对 多种真核生物启动子序列证实围绕起始位点("起始子")的序列在决定受所述具体启动子指导的RNA表达水平中发挥重要作用。这种序列也包括 已转录序列的部分。因此,启动子与报道序列的直接融合将导致次优水平 的转录。分析表ii^莫式和表达水平的常用方法是测定细胞内蛋白质累积的 '稳态,水平。本领域技术人员已知的常见使用的候选报道基因是P-葡糖醛 酸糖苷酶(GUS)、氯霉素乙酰基转移酶(CAT)和具有荧光特性的蛋白质,如 维多利亚水母(Aequora victoria)的绿色荧光蛋白(GFP)。然而原则上,
众多蛋白质适用于此目的,只要该蛋白质不干扰重要的植物功能即可。多 种工具适用于量化和确定位置。可以轻易地产生或获得检测系统,其中所
述的检测系统基于例如免疫化学、酶、荧光检测和定量。可以在植物组织 提取物或在完整组织中使用蛋白质表达的原位分析法测定蛋白质水平。通 常,用 一种嵌合启动子报道构建体转化的单个抹系在它们的报道基因表达 水平上不同。还经常观察到此类转化体不表达任何可检测产物(RNA或蛋 白质)的现象。通常这种表达变异性归咎于'位置效应,,虽然决定这种无活 性的分子机制通常不明了。
"过量表达"指转基因细胞或转基因生物中这样的表达水平,其超过正 常或未转化(非转基因)的细胞或生物中的表达水平。
"5,非编码序列"或"5,-非翻译序列"或"-区域"指位于编码序列5,(上游) 的核苷酸序列。这种核苷酸序列存在于充分加工的mRNA的起始密码子上 游并且可以影响初级转录物至mRNA的加工过程、mRNA稳定性或翻译 效率(Turner 1995)。
"3,非编码序列"或"3,-非翻译序列"或"-区域"指位于编码序列3,(下游) 的核苷酸序列并且包括聚腺苷酸化信号序列和其他序列,其中所述的其他 序列编码能够影响mRNA加工过程或基因表达的调节信号。聚腺苷酸化信 号通常以影响聚腺苷酸添加至mRNA前体的3,末端。不同3'非编码序列 的用途由Ingelbrecht等,1989例举。
术语"翻译前导序列"指基因在启动子和编码序列之间的DNA序列部
分,其中所述的DNA序列部分转录成RNA并且存在于充分加工的mRNA 的翻译起始密码子上游(5')。翻译前导序列可以影响初级转录物至mRNA的加工过程、mRNA稳定性或翻译效率。
"信号肽,,指一种多肽的氨基端延伸物,这种氨基端延伸物同所述多肽 一起被翻译,形成前体肽,并且是该前体肽进入分泌途径所需要的。术语 "信号序列,,指编码所述信号肽的核苷酸序列。如本文中所用的术语"转运 肽"指已表达多肽的一部分(优选地指多肽的氨基端延伸物),这个部分与所 述多肽一起被翻译,形成前体肽,并且是该前体肽进入细胞器(如质体(例 如叶绿体)或线粒体)所需要的。术语"转运序列"指编码所述转运肽的核苷
酸序列。
"反义抑制"指产生能够抑制蛋白质从内源性基因或转基因表达的反义 RNA转录物。
"基因沉默"指病毒基因、转基因或内源核基因的同源性依赖抑制作用。 当所述抑制作用因受影响基因的转录降低引起时,基因沉默可以是转录水 平的,或当所述抑制作用因与受影响基因同源的RNA种类周转(降解)增加 引起时(English 1996),基因沉默可以是转录后的。基因沉默包括病毒诱导 的基因沉默(Ruiz等1998)。
如本文中所用,术语"异源DNA序列"、"外源DNA节段"或"异源核 酸"分别指这样的序列,其源自相对于特定宿主细胞为外来的来源,或若来 自相同来源,则相对于其原初形式是经修饰的。因此,宿主细胞中的异源 性基因包括相对于特定宿主细胞是内源性的,但已经例如通过利用DNA 改组法被 修饰的基因。该术语也包括天然存在的DNA序列的多重非天然 存在的拷贝。因此,本术语指这样的DNA节段,其相对于所述细胞是外 来或异源性的,或虽然相对于所迷细胞是同源的,但是处于宿主细胞核酸 内该元件通常不存在的位置中。表达外源DNA节段以产生外源性多肽。"同 源"DNA序列是这样的DNA序列,其与导入该DNA序列的宿主细胞天然 地相关。
在核苷酸序列同一性的上下文中,"同源于,,指两种核酸分子的核苷酸 序列之间或两种蛋白质分子的氨基酸序列之间的相似性。通过如本领域技 术人员充分理解的严格条件下(如在Haines和Higgins(编者),Nucleic AcidHybridization, IRL Press, Oxford, U.K.中描述)DNA國DNA杂交或 DNA-RNA杂交或通过两种核酸或两种蛋白质之间的序列相似性比较,提 供对此类同源性的评估。
术语"基本上相似"指代表本文中所公开序列、尤其稻、拟南芥或欧洲 油菜(5mw/cfl mipi/》序列的功能性和/或结构性等同物或直向同源物的核 苷酸和氨基酸序列。
在最广泛的意义上,当在本文中就核苷酸序列使用"基本上相似"时, 术语"基本上相似"意指该核苷酸序列是编码多肽的基因的部分,其中所述
和功能,例如,该核苷酸序列包含来自基因(其中该基因是与参考核苷,
启动子序列相关的启动子序列,即基本上相似的启动子序列与本文中所例 举启动子序列的互补序列在高严格条件或极高严格条件下杂交。例如,仅 反映遗传密码子简并性但仍编码与特定氨基酸序列相同的氨基酸序列的 变异核苷酸序列与特定核苷酸序列基本上相似。术语"基本上相似"也包括 这样的核苷酸序列,其中所述序列已经被修饰例如旨在优化于特定细胞中 的表达,也包括编码变异多肽的核苷酸序列,其中所述的变异多肽相对于 所述参考序列编码的(未修饰)多肽具有一个或多个氨基酸置换,所述的置 换不改变该变异多肽相对于所述未修饰多肽的活性。
在最广泛的意义上,当在本文中就多肽使用"基本上相似"时,术语"基 本上相似"意指该多肽具有与参考多肽基本上相同的结构和功能。优选地, 所述同源物是直向同源物。可以在一种简单测定法中检验具有基本上相似 序列的基因是否是基因(例如cor78或Metl基因)的直向同源物首先缺失 内源性基因例如cor78或Met并随后将所述潜在直向同源物导入缺失的细 胞或植物。直向同源物应当重建与野生型相似或基本上相似的表型,优选 地,该表型与野生型相同。在一个实施方案中,该术语可以意指与特定序 列基本上相似的氨基酸序列是这样一些氨基酸序列,其中整体氨基酸同一 性相对于本发明序列是至少60%或更高。产生等效核苷酸或氨基酸序列的修饰完全属于本领域常规技术的范围内。在一个实施方案中,基本上相似
的多肽与参考多肽之间的氨基酸序列同一性百分数是至少60%、 61%、 62%、 63%、 64%、 65%、 66%、 67%、 68%、 69%、 70%,例如71%、 72%、 73%、 74%、 75%、 76%、 77%、 78%、 79%、 80%、 81%、 82%、 83%、 84%、 85%、 86%、 87%、 88%、 89%和甚至卯%或更高,例如91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%、大到至少99%。除了具有 基本上相同的功能以外,两种多肽彼此基本上相似的又一个迹象是与所述 多肽之一特异性结合的一种物质(例如抗体)也特异性地与另 一种多肽结 合。
序列比较可以使用Smith-Waterman序列比对算法(参见例如 Waterman(1995))实施。优选地使用具有如下参数的1.16版localS程序匹 配l、错配罚分0.33,缺口开口罚分2,缺口延伸罚分2。
此外,与参考核苷酸序列"基本上相似,,的核苷酸序列称作与该参考核 苷酸序列"等效,,。技术人员认识到由本发明包含的等效核苷酸序列也可以 由它们在低严格条件、中等严格条件和/或严格条件(例如O.lxSSC、 0.1% SDS、 65。C)下与本权利要求书字面意思范围内的核苷,列杂交的能力进 行定义。
当谈及多核苷酸片段或多肽片段使用"基本上相同活性"时,"基本上相 同活性"的含义是所述片段具有全长多核苷酸活性或全长多肽活性的至少 60%、 61%、 62%、 63%、 64%、 65%、 66%、 67%、 68%、 69%、 70%, 例如71%、 72%、 73%、 74%、 75%、 76%、 77%、 78%、 79%、 80%、 81%、 82%、 83%、 84%、 85%、 86%、 87%、 88%、 89%和甚至90%或 更高,例如91%、 92%、 93%、 94%、 95%、 96%、 97。/。、 98%、大到至 少99%。
"靶基因"指表达所需要的目的编码序列、功能性RNA或蛋白质的基 因,如指复制子中的基因。在一个实施方案中,耙基因不是复制子复制必 需的。此外,靶基因可以包含插入非本源生物的天然非病毒基因或包含嵌 合基因,并且将处于适宜的调节序列控制下。因此,在所述靶基因中的调节序列可以来自任何来源,包括病毒。靶基因可以包括相对于待转化的具 体植物的基因为异源性或同源的编码序列。然而,在一个实施方案中,靶 基因可以是不包含天然病毒基因的基因。常见靶基因包括但不限于编码结 构蛋白、种子贮藏蛋白、赋予除草剂抗性的蛋白质和赋予昆虫抗性的蛋白 质的基因。由靶基因编码的蛋白质称作"外源蛋白"。植物中耙基因的表达 通常将导致改变的植物性状。
术语"改变的植物性状"意指转基因植物中相对于野生型或非转基因植 物宿主的任意表型变化或基因型变化。
术语"转化"指转移核酸片段至宿主细胞的基因组,产生遗传稳定的遗 传。含有转化核酸片段的宿主细胞称作"转基因"细胞,并且包含转基因细 胞的生物称作"转基因生物"。转化植物和植物细胞的方法实例包括农杆菌
介导的转化法(De Blaere 1987)和粒子轰击技术(US 4,945,050)。完整才直物可 以从转基因细胞通过技术人员熟知的方法再生(参见例如,Fromm 1990)。
"转化的"、"转基因的"和"重组的"指其中已经导入异源性核酸分子的 宿主生物,如细菌或植物。所述核酸分子可以稳定地整合至基因组中。例 如,"转化的"、"转化体"和"转基因"植物或愈伤组织已经经历转化过程并 且含有整合至其染色体中的外来基因。术语"未转化的"指未经历转化过程 的正常植物。
"瞬时转化的"指其中转基因和外来DNA(例如通过此类方法,如农杆 菌介导的转化法或生物射弹轰击法)已经导入,但是没有针对稳定维持进行 选择的细胞。
"稳定转化"指转化后已经在选择性培养基上选择和再生的细胞。 "染色体整合的"指外来基因或DNA构建体通过共价键整合至宿主 DNA。在基因未发生"染色体整合"的情形下,它们可以被"瞬时地表达"。 基因瞬时表达指如此基因的表达,其中所述基因未整合至宿主染色体,但 例如作为自主复制性质粒或表达盒的部分或作为另一种生物系统(如病毒) 的部分而独立发挥作用。
"瞬时表达"指在如此细胞中的表达,在所述细胞中病毒或转基因借助病毒感染或借助此类方法如农杆菌介导的转化法、电穿孔法或生物射弹轰 击法导入,但是没有针对其稳定维持进行选择。
"遗传稳定的,,和"可遗传的,,指在植物中稳定维持并经过连续世代由子 代稳定遗传的染色体性整合性遗传元件。
"原代转化体"和"TO世代"指具有与最初所转化组织(即自转化以来没 有经历减数分裂和受精)相同的遗传世代的转基因植物。
"次代转化体"和"T1、 T2、 T3等世代"指经一个或多个减数分裂循环 和受精循环从原代转化体衍生的转基因植物。它们可以通过原代转化体或 次代转化体的自我受精或原代转化体或次代转化体与其他转化或未转化 的植物杂交而衍生。
"野生型"指无任何已知突变的自然界中存在的病毒或生物。
无效分离子是因孟德尔分离作用而不含转基因的转基因植物后代(或 从该后代衍生的才朱系)。
术语"基因組"或"基因组DNA"指宿主生物的可遗传性遗传信息。所述 基因组DNA包含核DNA(又称作染色体DNA),也包括质体(例如叶绿体) 和其他细胞器(例如线粒体)的DNA。优选地,术语"基因组"或"基因组 DNA"指核的染色体DNA。
术语"染色体DNA"或"染色体DNA序列,,应当理解为独立于细胞周期 状态的细胞核基因组DNA。染色体DNA因此可以在染色体或染色单体中 组织,它们可能是压缩的或+>散的。对染色体DNA的插入可以通过本领 域已知的多种方法例如聚合酶链反应(PCR)分析法、DNA印迹分析、荧光 原位杂交(FISH)和原位PCR证实并分析。
术语"核酸"指脱氧核糖核苷酸或核糖核苷酸及由含有糖、磷酸酯和碱 基(其为嘌呤或嘧咬)的单体(核苷酸)组成的单链或双链形式的聚合物。除非 专门限定,否则该术语包括含有天然核苷酸的已知类似物的核酸,其中所
似的方式进行代谢。除非另外说明,特定核酸序列也内在地包括其保守修 饰变体(例如简并密码子置换)和互补性序列,以及明确指出的序列。具体地,简并密码子置换可以通过产生这样的序列实现,在所述序列中一个或 多个所选(或全部)密码子的第三位置置换为混合碱基和/或脱氧次黄苷残基
(Batzerl991; Ohtsuka 1985; Rossolini 1994)。"核酸片段"是给定核酸分 子的部分。在高等植物中,脱氧核糖核酸(DNA)是遗传物质,而核糖核酸 (RNA)参与将DNA中所含的信息转移至蛋白质。术语"核苷酸序列"指可以 作为单链或双链的DNA或RNA聚合物,其中所述聚合物任选含有能够并 入DNA或RNA聚合物的人工、非天然性或改变的核苷酸碱基。术语"核 酸,,或"核酸序列"也可以与基因、cDNA、 DNA和由基因编码的RNA相互 交换使用。
本发明包括分离的或基本上纯化的核酸或蛋白质组合物。在本发明的 上下文中,"分离的"或"纯化的"DNA分子或"分离的,,或"纯化的"多肽是这 样的DNA分子或多肽,其因人为作用而脱离于其天然环境存在并且因此 不是自然产物。分离的DNA分子或多肽可以以纯化形式存在或可以存在 于非本源环境(例如转基因宿主细胞)内。例如"分离的"或"纯化的"核酸分 子或蛋白质或其生物活性部分通过重组技术产生时,基本上没有其他细胞 材料或培养基,或通过化学合成时,基本上没有化学前体或其他化学品。 优选地,"分离的"核酸(优选地,蛋白质编码序列)不含在衍生该核酸的生 物的基因组DNA中天然分布于该核酸侧翼的序列(即位于该核酸的5'和3, 末端的序列)。例如,在不同的实施方案中,分离的核酸分子可以含有少于 约5kb、 4kb、 3 kb、 2 kb、 1 kb、 0.5 kb或0.1 kb的核苷酸序列,其中所 述的核苷酸序列是在衍生所述核酸分子的细胞的基因组DNA中天然分布 于该核酸分子侧翼的核苷酸序列。基本上没有细胞材料的蛋白质包括具有 少于约30%、 20%、 10%、 5%(千重)杂质蛋白质的蛋白质或多肽制品。当 重组地产生本发明的蛋白质或其生物活性部分时,培养基优选地占少于约 30%、 20%、 10%、或5%(干重)的化学前体或非目的蛋白质的化学品。本 发明的核苷酸序列包括天然存在的序列以及突变(变异)形式。此类变体仍 将具有想要的活性,即启动子活性或由非变异核苷酸序列的可读框编码的 产物的活性。就序列(例如多肽序列或核酸序列,例如本发明的转录调节性核苷* 列)而言,术语"变体"意指基本上相似的序列。对于包含可读框的核苷# 列,变体包括这样的序列,其中所述序列因遗传密码子简并性而编码天然 蛋白质的相同氨基酸序列。诸如此类的天然存在的等位变体可以使用熟知
的分子生物学技术(例如聚合酶链反应(PCR)和杂交技术)鉴定。变异核苷酸 序列也包括以合成方式衍生的核苷酸序列,例如通过使用位点定向诱变法 产生并(对于可读框而言)编码天然蛋白质的那些核苷酸序列,以及编码相 对于天然蛋白质具有氨基酸置换的多肽的那些核苷酸序列。通常,本发明
40%、 50%、 60%,至70%,例如优选71%、 72%、 73%、 74%、 75%、 76%、 77%、 78%、至79%,通常至少80%,例如81%-84%、至少85%, 例如86%、 87%、 88%、 89%、卯%、 91%、 92%、 93%、 94%、 95%、 96%、 97%,至98%和99%核苷酸序列同一性。
特定核酸序列的"保守修饰性变异"指编码相同或基本上相同的氨基酸 序列的那些核酸序列,或当该核酸序列不编码氨基酸序列时,指基本上相 同的序列。因为遗传密码的简并性,大量功能相同的核酸编码任意给定的 多肽。例如,密码子CGT、 CGC、 CGA、 CGG、 AGA和AGG均编码 氨基酸精氨酸。因此,在精氨酸由密码子指定的每个位置上,该密码子可 以变更成任意的所述相应密码子,而不改动编码的蛋白质。此类核酸变异 是作为"保守修饰性变异"类型之一的"沉默变异"。本文所述编码多肽的每 种核酸序列还描述了每种可能的沉默变异,除非另外指出。技术人员将认 识到可以通过标准技术修饰核酸中的每个密码子(ATG例外,该密码子通 常是仅用于甲石克氨酸的密码子)以产生功能性相同的分子,因此,编码多肽 的核酸的每种"沉默变异"包含在所描述的每种序列中。
本发明的核酸分子可以进行"优化,,以在目的植物中增强表达(参见例 如,WO 91/16432; Perlak 1991; Murray 1989)。以这种方式,基因或基 因片段中的可读框可以利用植物优选性密码子合成(参见例如,Campbell 和Gowri, 19卯年对宿主优选性密码子选择的讨论)。因此,可以优化核苷^列以在任何植物中表达。已经认识到基因序列的全部或^f壬何部分可 以是优化的或人工的,也即也可以使用人工序列或部分优化序列。变异核
苷酸序列和蛋白质也包括从"i秀变方法和重组方法(如DNA改《且法)^t生的 序列和蛋白质。使用这种方法,可以操作一种或多种不同的编码序列以产 生具有想要特性的新多肽。以这种方式,从相关多核苷酸序列群体产生重 组多核苷酸文库,其中所述的多核苷酸序列群体包含具有相当大的序列同 一性并可以在体外或体内同源重组的序列区域。本领域中已知用于这种 DNA改组法的策略(参见例如,Stemmer 1994; Stemmer 1994; Crameri 1997; Moore 1997; Zhang 1997; Crameri 1998和US 5,605,797、 9、 11、 13、 15和17,837,458)。
"变异"多肽意指通过如此方式从天然蛋白质衍生的多肽即对所述天 然蛋白质的氨基末端和/或羧基末端缺失(所谓截短)或添加一个或多个氨基 酸;在所述天然蛋白质的一个或多个位点处缺失或添加一个或多个氨基酸 或在所述天然蛋白质的一个或多个位点处置换一个或多个氨基酸。此类变 体可以例如因遗传多态性或因人类操作产生。用于此类操作的方法通常是 本领域已知的。
因此,多肽可以通过多种方法(包括氨基酸置换、缺失、截短和插入) 改变。用于此类操作的方法通常是本领域已知的。例如,所述多肽的氨基 酸序列变体可以通过在DNA中突变而制备。用于诱变和改变核苷酸序列 的方法是本领域熟知的(参见例如,Kunkd 1985; Kunkel 1987; US 4,873,192; Walker和Gaastra, 1983及其中引用的参考文献)。不影响目的 蛋白生物学活性的适宜氨基酸置换指南可以在Dayhoff等(1978)的模型中 找到。优选保守性置换,如一种氨基酸与具相似特性的其他氨基酸交换。 变更、添加或缺失编码序列中单个氨基酸或小百分比例氨基酸(一般少于 5%,更一般少于1%)的个别置换、缺失或添加是"保守修饰性变异",其中 所述的变更导致氨基酸置换为化学上相似的氨基酸。提供功能相似的氨基 酸的保守性置换表是本技术领域熟知的。以下五个组分别含有可以相互进 行保守性置换的氨基酸脂族氨基酸甘氨酸(G)、丙氨酸(A)、缬氨酸(V)、亮氨酸(L)、异亮氨酸(I);芳族氨基酸苯丙氨酸(F)、酪氨酸(Y)、色氨酸
(W);含硫氨基酸甲硫氨酸(M)、半胱氨酸(C);碱性氨基酸精氨酸(R)、
赖氨酸(K)、组氨酸(H);酸性氨基酸天冬氨酸(D)、谷氨酸(E)、天冬酰
胺(N)、谷氨酰胺(Q)。还见Crdghton, 1984。此外,变更、添加或缺失编 码序列中单个氨基酸或小百分比例氨基酸的个别置换、缺失或添加也是"保
守修饰性变异"。
"表达盒"或"表达构建体"如本文中所用意指能够指导特定核苷紗列 在适宜宿主细胞中表达的DNA序列,其中所述DNA序列包含与目的核普 酸序列有效连接的启动子,所述目的核苷酸序列任选地与终止信号和/或其 他调节元件有效连接。表达盒也可以包含对该核苷酸序列正确翻译所需的 序列。编码区域通常编码目的蛋白,然而也可以编码有义方向或反义方向 上的功能性目的RNA,例如反义RNA或非翻译性RNA。包含目的核苷酸 序列的表达盒可以是嵌合的,意指至少一个该表达盒的成分相对于该表达 盒其他成分的至少之一是异源的。所述表达盒也可以是这样一种表达盒, 其中此表达盒天然地存在,但是已经以重组形式获得用于异源性表达。表 达盒可以完全在细胞外装配(例如通过重组克隆技术)。然而,表达盒也可 以部分地^f吏用内源性成分进行装配。例如,表达盒可以通过将启动子序列 置于(或插入)内源性序列上游获得,其中所述的内源性序列因此功能性地 与所述启动子序列连接并受其控制。类似地,待表达的核酸序列可以置于 (或插入)内源性启动子序列下游,因而形成表达盒。通常,表达盒中核苷 酸序列的表达可以受组成型启动子或受诱导型启动子控制,其中所述的诱 导型启动子仅在宿主细胞暴露于某些特定外部刺激时才启动转录。本发明 的表达盒、转录调节序列或启动子也可以针对特定组织或器官或发育阶 段,尤其针对胚或盾片是特异性的。在一个优选实施方案中,此类表达盒 将包含与目的核苷酸序列连接的本发明转录起始区。这样的表达盒优选地 配备有多个限制性位点用于插入受所述调节区域转录调节的目的基因。该 表达盒可以额外地含有选择标记基因。这种表达盒在转录的5'-3'方向包括 转录和翻译起始区、目的DNA序列以及植物中有功能的转录和翻译终止区。所述终止区可以与转录起始区是天然关系,可以与目的DNA序列是 天然关系或可以从另一来源衍生。便利的终止区可以从根癌农杆菌(A. tumefaciens)的Ti-质粒荻得,如章鱼碱合酶终止区和胭脂碱合酶终止区和 下文描述的其他终止区(还参见Guerineau 1991; Proudfoot 1991; Sanfacon 1991; Mogenl9卯;Munroe 19卯;Ballas 1989; Joshi 1987)。
"载体"定义为尤其包括双链或单链的直链或环状形式的任意质粒、粘 粒、噬菌体或农杆菌双元载体,它们可以或不可以自我传播或运动,和可 以通过整合至细胞基因组而转化原核或真核宿主,或者以染色体外方式存 在(例如具有复制起点的自主复制质粒)。
具体地包括穿梭载体,所迷的穿梭载体意指能够天然地或通过设计在 两种不同宿主生物中复制的DNA运载体,其中所述的宿主生物可以选自 例如》文线菌(actinomycete)和相关物种,如酉良酒酵母(5VicAa/Y 附^c" cwev/wV^)、细菌和真核生物(例如高等植物、哺乳动物、酵母或真菌细胞)。
优选地,所述载体中的核酸处于适宜启动子或其他调节元件控制下并 与其有效连接以在宿主细胞如微生物(例如细菌)细胞或植物细胞中转录。 该载体可以是在多种宿主中有功能的双功能表达载体。在基因组DNA的 情况下,所述核酸可以含有自身启动子或其他调节元件,并且在cDNA的 情况下,所述核酸可以处在适宜启动子或其他调节元件控制下以在宿主细 胞中表达。
"克隆载体"通常含有一个或少数限制性核酸内切酶识别位点和在鉴定 并选择以所述克隆载体转化的细胞中适用的标记基因,其中外来DNA序 列可以按照确定方式插入所述限制性核酸内切酶识别位点,同时该载体的 基本生物学功能不丧失。标记基因一般包括提供四环素抗性、潮霉素抗性 或氨千青霉素抗性的基因。
"转基因植物"是具有一个或多个含有表达载体或重组表达盒(如本发 明表达盒)的植物细胞的植物。
"植物组织"包括分化和未分化的组织或植物,包括但不限于根、茎、 苗、叶、花粉、种子、瘤组织和多种形式的细胞和培养物,如单个细胞、原生质体、胚和愈伤组织。所述植物组织可以处于植物中或位于器官、组 织或细胞培养物中。
如下术语用于描述两个或多个核酸或多核苷酸之间的序列关系:(a)"参 考序列"、(b)"比较窗口"、 (c)"序列同一性"、(d)"序列同一性百分数"和 (e)"相当大的同一性"。
(a) 如本文中所用,"参考序列"是作为序列比较基础使用的定义序列。 参考序列可以是指定序列的子集或全体;例如,作为全长cDNA或基因序 列的节段或完整cDNA或基因序列。
(b) 如本文中所用,"比较窗口"指多核苷酸序列中连续且指定的节段, 其中与所述参考序列(不包含添加或缺失)相比,在比较窗口中的多核苷酸 序列可以包含添加或缺失(即缺口)以便这两个序列的最佳比对。通常,所 述比较窗口是至少20个连续核苷酸长度并且任选地可以是30、 40、 50、 100个连续核苷酸长度或更长。本领域技术人员理解为避免因多核苷^ 列中包含缺口而与参考序列高度相似, 一般? 1入并从匹配数中扣减缺口罚 分。
用于比较的序列比对方法是本领域熟知的。因此,使用数学算法可以 实现任意两个序列之间同一性百分数的确定。此类数学算法的优选非限制 性实例是Myers和Miller(1988年)算法;Smith等(1981年)局部同源性算 法;Needleman和Wunsch(1970年)同源性比对算法;Pearson和 Lipman(l卵S年)相似性搜索法;Karlin和Altschu1(1990年)算法,该算法 在Karlin和Altschu1(1993年)中改良。
这些数学算法的计算机执行可以用于序列比较以确定序列同 一性。这 类执行包括但不限于在PC/Gene程序(可从Intdligenetics, Mountain View, Calif.获得)的CLUSTAL; ALIGN程序(版本2.0)和(从Genetics Computer Group(GCG), 575 Science Drive, Madison, Wis" USA可获得 的)Wisconsin Genetics Software Package,版本8中的GAP、 BESTFIT、 BLAST、 FASTA和TFASTA。可以使用默认执行参数,使用这些程序开 展比对。已充分描述了 CLUSTAL程序(Higgins 1988年,1989年;Corpet1988年;Huang 1992; Pearson 1994年)。ALIGN程序以上述Myers和 Miller的算法为基础。Altschul等1990年的BLAST程序以上述Karlin和 Altschul的算法为基础。优选地使用Clustal W算法(Thompson 1994年; 例如在软件Vector NTI ,版本9; Invitrogen Inc.),评分矩阵 BLOSUM62MT2,默认设置(缺口开口罚分15/19,缺口延伸罚分 6.66/0.05;缺口分离罚分范围8;比对延误的%同一性40;使用残基特异 性缺口和亲水性残基缺口)开展多重比对(即多于2种序列)。
可 从 National Center for Biotechnology Information (http:〃www.ncbi.nlm.nih.gov/)公开地获得开展BLAST分析的软件。这种 算法包括首先通过确定提交序列中长度为W的短字而确定高评分序列对 (HSP),其中与数据库序列中长度相同的字比对时,所述的短字匹配或满 足某些正值阈评分T。 T称作邻近字评分阈值(Altschull9卯)。这些初始性 邻近字命中充当种子用于启动搜索以发现含有这些种子的更长HSP。所述 的字命中随后在两个方向上沿每个序列尽可能远地延伸,只要可以提高累 积性比对评分。对于核苷酸序列,使用参数M(—对匹配残基的回馈评分; 总是X))和N(错配残基的惩罚评分;总是<0)计算所述累积性评分。对于氨 基,列,使用评分矩阵计算所述累积性评分。当该累积性比对评分以量 X从其最大实现值上降低时,则停止每一方向上的字命中延伸,所述累积 性评分变成零或以下,原因在于累积了 一个或多个负评分性残基比对结果 或抵达两种序列之一的末尾。
除了计算序列同一性百分数之外,BLAST算法还开展两个序列之间 相似性的统计分析(参见例如Karlin和Altschu1(1993).由BLAST算法提 供的一种相似性测量是最小总和概率(P(N)),这种统计分析提供了两个核 苷酸序列或氨基酸序列之间的匹配会因偶然发生匹配的概率的指示。例 如,若最小总和概率在一个试验核酸序列与参考核酸序列的比较结果中小 于约O.l,更优选地小于约0.01和最优选地小于约0.001,则认为该试验核 酸序列与此参考序列相似。
为出于比较目的获得缺口比对结果,可以利用(BLAST 2.0中的)Gapped BLAST,如Altschul等1997年所述。或者,可以使用(BLAST 2.0中的)PSI-BLAST开展可检测分子之间远缘关系的多重搜索。见上文 Altschul等。利用BLAST 、 Gapped BLAST 、 PSI-BLAST时,可以使用 各自程序的默认执行参数(例如BLASTN用于核苷酸序列、BLASTX用于 蛋白质)。BLASTN程序(用于核苷酸序列)默认使用字长度(W)ll、期望 (E)IO、界限值100、 M=5、 N=-4并比较两条链。对于氨基酸序列,BLASTP 程序默认使用字长度(W)3、期望(E)IO和BLOSUM62评分矩阵(参见 Henikoff和Henikoff, 1989)。见http:〃www.ncbi.nlm.nih.gov。也可以人 工地通过观察进行比对。
为了本发明的目的,优选地使用具有其默认执行参数的BlastN程序 (版本1.4.7或更新的版本)或任何等效程序开展核苷酸序列比较,以确定与 本文中公开的启动子序列的序列同一性百分数。"等效程序"意指任意的序 列比较程序,即针对所讨论的任意两个序列,与通过优选程序生成的对应 比对结果相比,所述的序列比较程序产生具有相同核苷酸匹配或相同氨基 酸残基匹配和相同序列同一性百分数的比对结果。
(c)如本文中所用,"序列同一性,,或"同一性"在两个核酸序列或多肽 序列的情况中意指在指定比较窗口范围内为最大对应进行比对时,这两个 序列中相同的残基。当序列同一性百分数用于蛋白质时,认识到不相同的 残基位置经常因保守性氨基酸置换而不同,其中氨基酸残基被替换为具有 相似化学特性(例如电荷或疏7K性)的其他氨基酸残基并且因而并不改变该 分子的功能特性。当序列因保守性置换而不同时,序列同一性百分数可以 上调以校正置换的保守性本质。因此类保守性置换而不同的序列称作具有 "序列相似性"或"相似性"。本领域技术人员熟知开展这种调整的方法。通 常,这种方法包括将一个保守性置换评定为部分错配而非完全错配,因而 提高序列同一性百分数。因此,例如,当给予相同氨基酸评分l并且给予 非保守性置换评分0时,则给予保守性置换0-l之间的评分。保守性置换 的评分例如如在程序PC/GENE(Intelligenetics, Mountain View, Calif.)中 执行那样计算。(d) 如本文中所用,"序列同一性百分数"意指通过比较一个比较窗口 范围内两个最佳比对序列所确定的值,其中与参考序列(其不包含添加或缺 失)相比时,所述多核苷酸序列在比较窗口中的部分可以包含添加或缺失 (即缺口)以最佳比对这两种序列。通过这种方式计算该百分数,即通过确
以产生匹配位置数,将匹配位置数除以比较窗口中的位置总数,并且结果 乘以100以产生所述序列同一性百分数。
(e) (i)术语多核苷酸序列的"相当大的同 一性,,意指包含如此序列的多 核苷酸,其中使用所述的比对程序之一,利用标准参数与参考序列相比时, 所述序列具有至少60。/。、 61%、 62%、 63%、 64%、 65%、 66%、 67%、 68%、 69%、 70%、 71%、 72%、 73%、 74%、 75%、 76%、 77%、 78% 或79%、优选至少80%、 81%、 82%、 83%、 84%、 85%、 86%、 87%、 88%或89%、更优选至少90%、 91%、 92%、 93%或94%和最优选至少 95%、 96%、 97%、 98%或99。/。序列同一性。考虑到密码子简并性、氨基 酸相似性、读码框位置等,本领域技术人员将认识到这些值可以适度地调 整以确定由两个核苷酸序列编码的蛋白质的相应同一性。出于这些目的, 氨基酸序列的相当大的同一性通常意指至少60%或70%、更优选至少 80%、卯%,和最优选至少95%序列同一性。
核苷酸序列是基本上相同的另一个指标是两种分子是否在严格条件 下(参见下文)相互杂交。通常,选择的严格条件是在定义的离子强度和pH 处低于具体序列的热解链温度(T"约5°C。然而,严格条件包括范围在约 1。C -约20。C范围的温度,这取决于如本文中另外定义的所需严格性程度。 若核酸编码的多肽是基本上相同的,则在严格条件下相互不杂交的核酸仍 是基本上相同的。例如当使用遗传密码子所允许的最大密码子简并性产生 核酸拷贝时,这种情况可以出现。当第一个核酸编码的多肽与第二个核酸 编码的多肽出现免疫交叉反应时,则表明这两个核酸序列基本上相同。
(ii)术语"相当大的同一性"在肽的情况下指肽包含这样的序列,其中 所述序列相对于指定比较窗口中的参考序列具有至少60%、 61%、 62%、63%、 64%、 65%、 66%、 67%、 68%、 69%、 70%、 71%、 72%、 73%、
74%、 75%、 76%、 77%、 78%或79%、优选80%、 81%、 82%、 83%、
84%、 85%、 86%、 87%、 88%或89%、更优选至少90%、 91%、 92%、
93%或94%或甚至更优选地95%、 96%、 97%、 98%或99%序列同一性。
优选地,使用Needleman和Wunsch(1970)同源性比对算法实施最佳比对。
当一种肽与针对第二种肽的抗体发生免疫交叉反应时,则表明这两种肽序
列是基本上相同的。因此,例如在两种肽仅因保守性置换而不同时,这种 肽与第二种肽是基本上相同的。
对于序列比较,通常一种序列充当参考序列,将试验序列与之比较。 当使用序列比较算法时,将试验序列和参考序列输入计算机,根据需要指 定亚序列坐标,并指定序列算法程序参数。基于指定的程序参数,该序列 比较算法随后计算试验序列相对于参考序列的序列同一性百分数。
如上所述,两个核苷酸序列基本上相同的另 一个指标是两个分子在严 格条件下相互杂交。短语"特异性杂交至,,指一种分子仅与一个特定核苷酸 序列在严格条件下结合、配对或杂交,此时所述序列存在于复杂混合物(例 如总细胞)DNA或RNA中。"基本上结合,,指探针核酸与靶核酸之间的互补 性杂交并且包括可通过降低杂交介质的严格性而容忍的少量错配,以实现 所需要的靶核酸序列检测。
"严格杂交条件"和"严格杂交洗涤条件"在核酸杂交实验如Southern 和Northern杂交的上下文中是序列依赖性的并且在不同环境参数下是不 同的。Tm是(在定义的离子强度和pH下)50%靶序列与完全匹配性探针杂 交的温度。特异性通常是杂交后洗涤的函数,关键因素是终末洗液的离子 强度和温度。对DNA-DNA杂交体,Tm可以从Mdnkoth和Wahl, 1984 的等式近似计算
Tm = 81.5。C + 16.6(log10 M)+0.41(。/。GC)画0.61(%甲酰胺)—500/L
其中M是单价阳离子的体积摩尔浓度,。/。GC是DNA中鸟嘌呤和胞 嘧啶的百分含量。%曱酰胺是杂交溶液中甲酰胺的百分含量并且L是杂交 体的碱基对长度。对于每1%的错配,Tm降低约1°C;因此,可以调节Tm、杂交条件和/或洗涤条件以便与具有目的同一性的序列杂交。例如,若 寻求具有>90%同一性的序列,贝']Tm可以减少10。C。通常,选择的严格 条件是在定义的离子强度和pH处低于具体序列和其互补序列的热解链温 度I约5。C。然而,极严格条件可以使用在比热解链温度I低1、 2、 3或4。C 的杂交和/或洗涤;中等严格的条件可以使用在比热解链温度I低6、 7、 8、 9或10°C的杂交和/或洗涤;低严格条件可以使用在比热解链温度I低ll、 12、 13、 14、 15或20。C的杂交和/或洗涤。4吏用该等式、杂交和洗涤组合 物以及想要的T,技术人员将理解杂交溶液和/或洗涤溶液严格性的变化是 内在描述的。若所需的错配程度导致小于45。C(水溶液)或32。C(甲酰胺溶 液)的T,优选提高SSC浓度,从而可以使用较高温度。关于核酸杂交的 深入指南可在Tijssen, 1993中找到。通常,选择高度严格杂交条件和洗 涤条件是在定义的离子强度和pH处低于具体序列的热解链温度Tm约 5。C。
高度严格洗涤条件的实例是0.15 M NaCl,在72。C持续约15分钟。 严格洗涤条件的实例是0.2xSSC,在65。C洗15分钟(对于SSC緩冲液的 描述,尤其参见Sambrook)。低严格洗涤往往先于高严格洗涤进行,以除 去背景探针信号。对双链体(例如超过100个核苷酸)的中等严格性洗涤的 实例是lxSSC,在45。C持续15分钟。对双链体(例如超过100个核苷酸) 的低严格洗涤的实例是4 x至6xSSC,在40。C持续15分钟。对于短探针(例 如约10个至50个核苷酸),严格条件通常包括在pH 7.0 - 8.3,低于约1.5 M的盐浓度,更优选约0.01-1.0 M的Na离子浓度(或其他盐),并且温度 一般是至少约30°C且对于长探针(例如>50个核苷酸)是至少约60。C。严格 条件也可以通过添加去稳定剂(如甲酰胺)实现。通常,信噪比2倍(或更高 倍)于特定杂交分析中对非相关性探针观察到的信噪比时,表明检测到特异 性杂交。在严格条件下相互不杂交的核酸,如果它们编码的多肽基本上相 同,则仍基本上是相同的。例如当使用遗传密码子所允许的最大密码子筒 并性产生核酸的拷贝时,这种情况可以出现。
选择非常严格条件等同于具体探针的Tm。对于DNA或RNA印迹中在滤纸上具有超过100个互补残基的互补核酸杂交的严格条件的实例是 50%甲酰胺,例如在50。/。曱酰胺、1MNaCl、 1% SDS中于37。C杂交并 在O.lxSSC于60°C-65°C洗涤。示例性低严格条件包括使用含30%-35% 甲酰胺、1MNaCl、 "/。SDS(十二烷基硫酸钠)的緩冲溶液在37。C杂交并 在lx至2xSSC(20xSSC=3.0 M NaCl/0.3 M柠檬酸三钠)中在50oC-55。C洗 涤。示例性的中等严格条件包括使用含40%-45%曱酰胺、l.OMNaCl、 1% SDS在37°C杂交并在0.5x至lxSSC中于55°C-60。C洗涤。
如下是可以用来克隆与本发明参考核苷酸序列基本上相同的直向同 源性核苷酸序列的杂交/洗涤组合条件的实例直向同源性核苷酸序列优选 地与参考核苷酸序列在50°C于7%十二烷基硫酸钠(SDS)、0.5 M NaP04、 lmMEDTA中杂交并在50。C于2xSSC、 0.1。/。SDS中洗涤,更希望是在 50。C于7。/。十二烷基硫酸钠(SDS)、 0.5 M NaP04、 1 mM EDTA中杂交并 在50°C在lxSSC、 0.1% SDS中洗涤,还更希望是在50°C于7%十二烷 基硫酸钠(SDS)、 0.5 M NaP04、 1 mM EDTA中杂交并在50。C于0.5xSSC、 0.1% SDS中洗涤,优选地在50°C于7。/o十二烷基硫酸钠(SDS)、 0.5 M NaP04、 1 mM EDTA中杂交并在50°C于O.lxSSC、 0.1%SDS中洗涤, 更优选在50。C于7。/。十二烷基硫酸钠(SDS)、 0.5MNaPO4、 1 mM EDTA 中杂交并在65。C于0.1xSSC、 0.1。/。SDS中洗涤。
"DNA改组法"是在DNA分子中导入、优选随机导入突变或重排的方 法或在两种或多种DNA分子之间产生、优选随机产生DNA序列交换的方 法。因DNA改组法而产生的DNA分子是改组的DNA分子,该DNA分 子是从至少一个才莫板DNA分子衍生的非天然存在的DNA分子。改组的 DNA优选地编码变异多肽,其中所述的变异多肽相对于由所述模板DNA 编码的多肽是小务饰的,并且相对于由所述模板DNA编码的多肽而言,可 以具有改变的生物学活性。
"重组DNA分子"是使用例如Sambrook等,1989中描述的用来将DNA 序列连接起来的重组DNA技术和方法连接在一起的DNA序列的组合。
本发明尤其在单子叶植物中应用。术语"单子叶植物"包括具有多个倍性水平的植物,所述的倍性水平包括非整倍体、多倍体、二倍体、单倍体 和半合子。还包括成熟的植物、种子、苗和籽苗,和部分、繁殖材料(例如 种子和果实)以及从中衍生的培养物,例如细胞培养物。 一年生和多年生单 子叶植物是旨在产生转基因植物的优选宿主生物。
此外,本发明包括成熟的植物、种子、苗和籽苗,和部分、繁殖材料 以及从中衍生的培养物,例如细胞培养物。成熟的植物指除籽苗发育阶段 之外处于任意发育阶段上的植物。术语"籽苗"指处于发育早期的年幼不成 熟植物,在所述的发育早期上籽苗仍依赖于贮藏在种子中(例如胚乳、外胚
乳或子叶中)的同化产物。本发明包括竹亚科(^w^附wVfc"》(例如bamboo 属)、爿wi/尸o/wgowo,We"e(例如甘蔗属(5Vicc/fWW附)、高粱属(iSo,g/rw附)或玉蜀 黍属(Zea))、,竹族(j/"wwflf/"efle)(例如芦苹属CPAmg附Zfe》)、稻亚科 (C^j^wV/e"e)(例:ft口稻属(Oryza))、黍亚科Cftm/cwVjfe"e)(例^口黍属(i^w/cw附)、 狼尾草属CPe"w^""附)和狗尾草属(^似W"))、早熟禾亚科(尸^,V/e"e)(羊茅亚 科(,eW"dfl^fle))(例如早熟禾属(i^")、羊茅属(FeW"c")、黑麦草属 (丄o/,"附)、三毛草属(7V&"m附)、剪股颖属(v4gr仍他)、梯牧草属CP似ww)、 鸭茅属(/> 0^/&)、看麦娘属(J/o/;ecw附)、燕麦属(Jvew")、小麦属(7Wft'c"附)、 黑麦属(&oifc)和大麦属(W0nfe"附))的全部属。优选的是燕麦W vewa 燕麦)、簕竹属物种(5"/w6"^r 和印度箣0Btf附6"^! Afl附A^fJ"附^。)、 甘蔗((SVarcc/f/w"附oj^dfifl,w附)(甘蔗)、栽培二粒小麦 (7W&'cw附d/coccw附X二丰立d、麦(Emmer wheat))、栽培一津立小麦(7Wricw附 附ofi( coccwM)( —沣立小麦(Einkorn wheat))、 斯卑尔脱小麦(7Wftcww s/;e/to)(斯卑尔脱小麦(spelta wheat))、硬粒小麦(7Wricw附dw"附)(小麦)、圆 锥小麦(7W,/c"w似/^V/m附)、普通小麦(7W"cw附"e幼V"附)(小麦)、玉蜀黍(玉 米(maize)/玉米(corn))、 稷(尸fl"Zcw附/m7/flce"附)(普通黍)、尸e""/sC"附 ^,je7/ro,V/e(Bulrush millet)、大麦(flV /Yfew附vw/g"re或^T. 5YiftVw/M)(大麦)、稻 (Oryza sativa)(稻)、水生菰(Zizania aquatica)(野生稻(wild rice))、黑麦 (Secale cereale)(黑麦)、高粱(Sorghum bicolor)(S. vulgare)(高粱)。更优选 小麦(Triticum spp.)、稻(Oryza spp.)、 大麦(Hordeum spp.)、燕麦(Avenaspp.)、黑麦(Secale spp.)、玉米(玉蜀黍)、高粱和黍(Pennisettum spp)。更 优选的是小麦(小麦属物种(7Wric"附spp.))、稻(稻属物种(6^z" spp.))、大 麦(大麦属物种(i^m/e"w spp.))、燕麦(燕麦属物种(Jve"fl spp.))、黑麦(黑 麦属物种C ""/espp.))、玉米(玉蜀黍)、高粱和谷子(黍属物种(尸erni/se"w附 spp))。优选的是小麦家族的全部小麦种(包括冬小麦和春小麦)、更具体是 普通小麦(Triticum spp.: common(T. aestivum))、石更丰立小麦(T. durum)、斯 卑尔脱小麦(T.spelta)、栽培二粒小麦、圆锥小麦和栽培一粒小麦,特别优 选普通小麦。本发明的方法可以用来从春小麦(例如Bobwhite、 Marshall、 PIVOTl、 UC702和Panewawa)和从冬小麦(例如HY368、 Neeley、 FL302、 RH91、 R332、 R1269和R585)产生的转基因植物。其他合适的小麦基因型 包括但不限于YecoraRojo、 Karl和Anza。然而,应当指出本发明不限于 某些品种,而是高度基因型非依赖的。
词语"植物"指任何植物,尤其指农学有用的植物(例如种子植物),并 且"植物细胞,,是植物的结构单元和生理单元,其包含细胞壁,然而还可以 指原生质体。植物细胞可以是分离的单个细胞或培养的细胞形式,或作为 更高级有机体单元的部分,其中更高级有机体单元例如是植物组织,或分 化成为植物任何发育阶段上均存在的结构的植物器官。此类结构包括一种 或多种植物器官,包括但不限于果实、苗、茎、叶、花瓣等。优选地、术 语"植物,,包括完整植物、苗营养器官/结构(例如叶、茎和块茎)、根、花和 花器官/结构(例如苞片、萼片、花瓣、雄蕊、心皮、花药和胚珠)、种子(包 括胚、胚乳和种皮)和果实(成熟子房)、植物组织(例如维管组织、基本组织 等)和细胞(例如保卫细胞、卵细胞、毛状体等),和前述对象的后代。
"显著增加"是大于测量技术中固有误差边界的增加,优选增加约2倍 或更多倍。
"显著少于"意指大于测量技术中固有误差边界的减少,优选减少约2 倍或更多倍。 发明详述
本发明的第一个实施方案涉及包含表达盒的植物或植物细胞,所述的表达盒包含
a) 选自以下的第一核酸分子
i) 如SEQIDNO:l中定义的多核苷酸;
ii) 与SEQ ID NO: 1的多核苷酸具有至少50%、优选至少60%、 70% 或80%、更优选至少85%或卯%、最优选至少95%、 98%或99%序列同 一性的多核苷酸;和
iii) 在下述条件下与包含如SEQIDNO:l中定义的多核苷酸中至少50 个核苷酸的核酸或其互补物杂交的多核苷酸,其中所述的条件等同于在 50°C于7。/。十二烷基硫酸钠(SDS)、 0.5MNaPO4、 lmM EDTA中杂交并在 50°C于2xSSC, 0.1% SDS中洗涤、更优选在50°C于7%十二烷基琉酸钠 (SDS)、 0,5MNaPO4、 lmMEDTA中杂交并在50°C于lxSSC, 0.1% SDS 中洗涤、更优选在50°C于7。/。十二烷基硫酸钠(SDS)、 0.5MNaPO4、 lmM EDTA中杂交并在50°C于0.5xSSC, 0.1% SDS中洗涤、更优选在50°C 于7。/。十二烷基石充酸钠(SDS)、 0.5MNaPO4、 lmM EDTA中杂交并在50°C 于O.lxSSC, 0.1% SDS中洗涤,并且最优选在50°C于7%十二烷基硫酸 钠(SDS)、 0.5MNaPO4、 lmM EDTA中杂交并在65°C于0.1 xSSC, 0.1% SDS中洗涤,
和与其有效连接的
b) 第二核酸分子,其选自以下多核苦酸
i) 如SEQ ID NO:3中定义的多核苷酸;
ii) 与SEQ ID NO: 3的多核苷酸具有至少50%、优选至少60%、 70% 或80%、更优选至少85%或90%、最优选至少95%、 98%或99%序列同 一性的多核苷酸;和
iii) 在下述条件下与包含如SEQ ID NO:3所描述序列的至少50个核 苷酸的核酸或其互补物杂交的多核苷酸,其中所述的条件等同于在50。C 于7。/。十二烷基硫酸钠(SDS)、 0.5MNaPO4、 lmM EDTA中杂交并在50°C 于2xSSC, 0.1% SDS中洗涤,更优选在50°C于7。/。十二烷基硫酸钠(SDS)、 0.5M NaP04、lmM EDTA中杂交并在50°C于lxSSC, 0.1% SDS中洗涤、更优选在50。C于7Y。十二烷基硫酸钠(SDS)、 0.5M NaP04、 lmM EDTA 中杂交并在50°C于0.5xSSC, 0.1% SDS中洗涤、更优选在50°C于7%十 二烷基硫酸钠(SDS)、 0.5M NaP04、 lmM EDTA中杂交并在50°C于 O.lxSSC, 0.1% SDS中洗涤,并且最优选在50°C于7%十二烷基硫酸钠 (SDS)、 0.5M NaP04、 lmM EDTA中杂交并在65°C于O.lxSSC, 0.1% SDS 中洗涤,
并且与至少一个核酸有效连接,其中所述的至少一个核酸相对于转录 调节序列的所述第一或第二核酸序列是异源的,并且能够适用于向植物赋 予提高的产量和/或提高的胁迫耐受性和/或提高的种子或籽苗营养品质和/ 或油含量。
优选地,所述嵌合性转录调节核苦酸序列引起所述异源性DNA优势 地在萌芽胚中表达。这种表达才莫式对如下应用特别有用
i) 增强胁迫因子抗性:现有技术中如上所述,胚对各种生物性和非生物 性胁迫因子(干旱、寒冷、疾病等)非常敏感。这些胁迫因子直接影响产量 和作物品质。本领域中已知的绝大多数启动子在胚期没有表达能力或具有 低表达能力。本文中公开的转录调节特异性尤其用来按需要表达胁迫抗性 基因,即在合适时间到达高水平。此外,由于淀粉胚乳中的特异性,有可 能寻求解决胁迫抗性的新途径。因为淀粉胚乳是滋养胚的组织,故可以通 过改善胚的养分补充而提高胁迫抗性。
ii) 提高的种子营养品质或籽苗营养品质:嵌合的转录调节核酸序列 (例如超级启动子)的表达模式允许转化种子(谷粒)成分或允许改变种子中 成分的分布。例如,可以将糖类(淀粉)转化成油或其它高价值成分(例如维 生素)或可以使成分从胚乳转移至胚,因而提供具有改善的营养价值的籽 苗。
iii) 提高产量提高的产量部分地与胁迫抗性(见以上i))相关。然而, 嵌合的转录调节核酸序列(例如超级启动子)的表达模式甚至允许在无胁迫 因子下通过优化胚生长而增加产量,其中胚的生长将直接影响幼苗生长。 还可以实现田间条件下更早的萌发以及会引起更高或更早产量的其它性状。
iv)靶向的序列切除。如上所述,均一地切除序列(尤其标记序列)是生 物技术领域内未解决的问题。绝大多数植物表现出嵌合样切除模式,既有 成功切除的区域,又有未切除的区域。当生物不是由众多植物组成时,为 实现均一或基本均一的切除,优选地需要在发育早期激活切除机制。此外 需要强烈的激活(即切除介导酶的表达)。这两种要求均由本文中公开的嵌 合的转录调节核酸序列(例如超级启动子)的表达模式满足。早期胚萌发中 的强烈转录活性允许在该时期有效地切除标记,由此产生无耙序列(例如无 标记)的植物。
"萌芽胚特异性转录,,在本发明上下文中意指核酸序列由转录调节元件 以如此方式转录,从而所述核酸序列在萌芽植物、优选在萌芽胚中的转录 作用提供了大于90%、优选大于95%、更优选大于99%的在所述发育阶 段期间从完整植物、种子或籽苗中转录的全部RNA量。
1.嵌合性转录调节核酸序列
在其最一般形式中,包含编码嵌合性转录调节核苷酸序列的多核苷酸 的核酸分子包含
i)选自以下的笫一核酸分子
a) 如SEQIDNO:l中定义的多核苷酸;
b) 与SEQ ID NO: 1的多核苷酸具有至少50%、优选至少60%、 70% 或80%、更优选至少85%或90%、最优选至少95%、 98%或99%序列同 一性的多核苷酸;和
c) 在下述条件下与包含如SEQIDNO:l中定义的多核苷酸中至少50 个核苷酸的核酸或其互补物杂交的多核苷酸,其中所述的条件等同于在 50°C于7。/。十二烷基硫酸钠(SDS)、 0.5MNaPO4、 lmMEDTA中杂交并在 50°C于2xSSC, 0.1% SDS中洗涤、更优选在50°C于7%十二烷基硫酸钠 (SDS)、 0.5M NaP04、 lmM EDTA中杂交并在50°C于lxSSC, 0.1% SDS 中洗涤、更优选在50°C于7。/。十二烷基石危酸钠(SDS)、 0.5MNaPO4、 lmM EDTA中杂交并在50°C于0.5xSSC, 0.1% SDS中洗涤、更优选在50°C于7。/o十二烷基硫酸钠(SDS)、 0.5M NaP04、 lmM EDTA中杂交并在50°C 于O.lxSSC, 0.1% SDS中洗涤,并且最优选在50°C于7%十二烷基硫酸 钠(SDS)、 0.5MNaPO4、 lmM EDTA中杂交并在65°C于O.lxSSC, 0.1% SDS中洗涤,和
ii)第二核酸分子,其选自以下多核苷酸
a) 如SEQ ID NO:3中定义的多核苷酸;
b) 与SEQIDNO:3的多核苷酸具有至少50%、优选至少60%、 70% 或80%、更优选至少85%或卯%、最优选至少95%、 98%或99%序列同 一性的多核苷酸;和
c) 在下述条件下与包含如SEQ ID NO:3所描述序列的至少50个核苷 酸的核酸或其互补物杂交的多核苷酸,其中所述的条件等同于在50°C 于7。/。十二烷基硫酸钠(SDS)、 0.5M NaP04、 lmM EDTA中杂交并在50°C 于2xSSC, 0.1% SDS中洗涤,更优选在50°C于7。/。十二烷基硫酸钠(SDS)、 0.5MNaPO4、 lmMEDTA中杂交并在50°C于lxSSC, 0.1。/。SDS中洗涤、 更优选在50°C于7。/。十二烷基硫酸钠(SDS)、 0.5M NaP04、 lmM EDTA 中杂交并在50°C于0.5xSSC, 0.1% SDS中洗涤、更优选在50°C于7%十 二烷基硫酸钠(SDS)、 0.5M NaP04、 lmM EDTA中杂交并在50。C于 O.lxSSC, 0.1% SDS中洗涤,并且最优选在50°C于7%十二烷基硫酸钠 (SDS)、 0.5M NaP04、 lmM EDTA中杂交并在65°C于O.lxSSC, 0.1% SDS 中洗涤,
其中所述的第 一和第二核酸序列是功能性连接的并且彼此是异源的。 当在DNA区域如启动子、转录调节性核酸序列或上游激活性序列的 上下中使用时,术语"衍生"指如此情形,其中衍生的DNA区域从天然存 在的DNA区域或其他来源的DNA区域获得或基于这些区域获得。衍生的 DNA区域可以与天然存在的DNA区域或其他来源的DNA区域不同,通 常是通过故意的突变而不同。
1.1本发明的嵌合性转录调节核苷酸序列和其功能性元件的衍生物和
变体在本文公开的本发明构思了 除了本文中公开的具体嵌合性转录调节 核苷酸序列和其特定元件之外,还可以使用所述序列的衍生物和变体。
所述具体嵌合性转录调节核苷酸序列和其特定元件的衍生物可以包 括但不限于序列缺失、单个或多个点突变、在特定限制性酶位点处改变、 添加功能性元件或分子修饰的其他方法。这种修饰可以或不可以增强,或 可以或不可以改变所述序列的转录调节活性。
例如,本领域技术人员可以限定所述序列中的功能性元件并且删除任 意非必需元件。可以修饰或组合功能性元件以增加本发明序列的用途或表 达用于任意具体应用。也可以通过除去或删除非必需序列而不删除必需序 列,获得本发明的转录调节性核苷酸序列的功能性等效片段。所述转录调
(trial-and-error )缺失突变或在计算机(/w w7/co)中使用启动子元件搜索常 用程序在体外实现。启动子活性必需的区域经常显示某些已知启动子元件 的簇集。此类分析可以使用可获得的计算机算法如PLACE("植物顺式作用 调节性DNA元件(Plant Cis画acting Regulatory DNA Elements)"; Higo 1999, BIOBASE数据库"Transfac,,(Biologische Datenbanken GmbH, Braunschweig; Wingender 2001)或数据库PlantCARE(Lescot 2002)进行。 尤其优选的是转录调节性核苷^f列的等效片段,其中所述的等效片段通 过删除编码mRNA的5,非翻译区的区域,因而仅提供(非转录的)启动子区 域而获得。所述5,非翻译区可以轻易地通过本领域已知的方法(如5,-RACE 分析)确定。因此,本发明的一些转录调节性核苷酸序列是其他序列的等效 片段。
如上所示,本发明启动子的缺失突变体可随机地制备并随后进行分 析。使用这种策略,制备了一系列构建体,每种构建体含有所述克隆的不 同部分(亚克隆),并且随后筛选这些构建体的活性。用于篩选活性的合适 方法是将含有缺失节段的缺失型启动子构建体连接至选择标记或篩选标 记,并且仅分离可表达所述标记基因的那些细胞。以这种方式,鉴定了众 多不同的缺失型启动子构建体,它们仍保留想要的或甚至增强的活性。因此,通过比较所选择的构建体鉴定到活性必需的最小节段。随后,该节段 可以用来构建表达外源基因的载体。
在编码任意启动子序列的DNA节段中诱变或产生缺失的方法是本领 域才支术人员熟知的并且^^开于例如US 6,583,338,其中所述文献通过引用 的方式完整地并入本文。本发明的某些变异核苷酸序列仍保留生物学活性 (即以如以上定义的模式调节转录)。调节性序列变体的一个实例是通过从 较长启动子中进^f亍一个或多个缺失所形成的启动子。启动子的5'部分直至 接近转录起点的TATA盒有时可以缺失,而不消除启动子活性,如Zhu 等,(1995)The Plant Cell 7:1681-1689描述。除去部分DNA序列的常规方 法是结合DNA扩增,使用外切核酸酶,以产生双链DNA克隆的单向巢式 缺失。用于此目的的商业试剂盒在商品名Exo-Size.TM.(New England Biolabs, Beverly, Mass.)下出售。生物学活性变体还包括例如具有一个或多 个核苷酸置换、缺失或插入的本发明天然启动子序列。
衍生物和变体也包括来自其他物种,如但不限于细菌、真菌和植物的 同源物、旁系同源物和直向同源物。"同源物,,是本领域用来指示与参考序 列具有高程度序列相关性的多核苷酸或多肽序列的类属性术语。这种相关 性可以通过确定两个序列之间如前文定义的同 一性和/或相似性程度加以 量化。术语"直向同源物"和"旁系同源物"属于这个类属性术语。"旁系同源 物"指相同物种中功能相似的多核苷酸或多肽。"直向同源物"指这样的多核 苷酸或多肽,其是另一个物种中所述多核苷酸或多肽的功能等同物。直向 同源基因优选地意指编码直向同源蛋白质的基因。更具体地,术语"直向同 源物,,指从一个物种获得的多肽或蛋白质,其中所迷的多肽或蛋白质是来自 不同物种的多肽或蛋白质的功能性对应物。直向同源物之间的序列差异是 物种形成的结果。
优选地,嵌合性转录调节核苷酸序列的变体或衍生物的转录调节活性
以如上所述的萌芽胚特异性方式调节表达)相同(或等效)。除此之外,衍生 物或变体的转录调节活性也可以与其亲本序列的活性不同,尤其在表达水平方面如此。所述表达水平可以高于或低于亲本序列的表达水平。这两种 偏离可能是有利的,这取决于待表达的目的核酸序列。优选这类功能性等 效序列,其中与亲本序列相比,所述的功能性等效序列偏离所述亲本序列
的表达水平不超过50%、优选25%、更优选10%(如优选地通过mRNA 表达或蛋白质(例如报道基因)表达进行判断)。更优选这样的等效序列,其 与它的亲本序列相比显示表达增加,优选增加达至少50%,更优选至少 100%,最优选至少500。/。。此类表达才莫式优选地使用与所述转录调节性核 苷酸序列有效连接的报道基因证实。在本上下文中的优选报道基因 (Schenbornl999)是绿色焚光蛋白(GFP)(Chuil996; Leffel 1997)、氯霉素 乙酰转移酶、萤光素酶(Millar1992)、 P-葡糖醛酸糖苷酶或p-半乳糖苷酶。 特别优选P-葡糖醛酸糖苷酶(Jefferson 1987)。分析转录性调节作用的其他 方法是本领域熟知的并且包括RNA印迹和RT-PCR(参见例如以上提到 的本文中引用作为参考的Sambrook等)。
在一个优选实施方案中,所述转录调节性核苷酸序列由包含多核苷酸 的分离的核酸分子描述,所述的多核苷酸编码选自以下的序列
i) 由SEQ ID NO:l描述的序列;
ii) 由SEQ ID NO:l描述的序列的至少50个连续碱基、优选至少100 个连续碱基、更优选200个连续碱基的片段
iii) 与由SEQ ID NO:l描述的序列具有至少50%、优选至少60%、 70%或80%、更优选至少85%或90%、最优选至少95%、 98%或99%序 列同一性的核苷酸序列,
W)能够与由SEQ ID NO:l描述的序列或其互补物杂交(所述杂交优 选地在如上文"定义"部分中定义的低严格条件下、更优选在中等严格条件 下、最优选在高严格条件下,例如在等效于如下的条件下进行在50°C 于7。/。十二烷基硫酸钠(SDS)、 0.5MNaPO4、 lmM EDTA中杂交并在50°C 于2xSSC,0.1% SDS中洗涤、更希望在50°C于7。/。十二烷基硫酸钠(SDS)、 0.5M NaP04、 lmM EDTA中杂交并在50°C于lxSSC, 0.1% SDS中洗涤、 仍更希望在50。C于7。/。十二烷基硫酸钠(SDS)、 0.5MNaPO4、 ImMEDTA
57中杂交并在50°C于0.5xSSC, 0.1% SDS中洗涤、优选地在50°C于7%十 二烷基硫酸钠(SDS)、 0.5M NaP04、 lmM EDTA中杂交并在50°C于 O.lxSSC, 0.1% SDS中洗涤,并且更优选在50°C于7%十二烷基疏酸钠 (SDS)、 0.5M NaP04、 lmM EDTA中杂交并在65°C于O.lxSSC, 0.1% SDS 中洗涤)的核苷酸序列;
v) 核苷酸序列,能够与包含由SEQ ID NO:l描述的序列的50-200个 或更多个连续核苷酸(如50或IOO个、优选150或200个、更优选250或 400个连续核苷酸、最优选全部序列)的核酸或其互补物杂交(所述杂交优选 地在如上文"定义"部分中定义的低严格条件下、更优选在中等严格条件下、 最优选在高严格条件下,例如在等效于如下的条件下进行在50。C于7。/。 十二烷基石克酸钠(SDS)、 0.5M NaP04、 lmM EDTA中杂交并在50°C于 2xSSC, 0.1。/。SDS中洗涤、更希望在50°C于7。/。十二烷基硫酸钠(SDS)、 0.5M NaP04、 lmMEDTA中杂交并在50°C于lxSSC, 0.1% SDS中洗涤、 仍更希望在50°C于7。/。十二烷基硫酸钠(SDS)、 0.5MNaPO4、 lmMEDTA 中杂交并在50°C于0.5xSSC, 0.1% SDS中洗涤、优选地在50°C于7%十 二烷基硫酸钠(SDS)、 0.5M NaP04、 lmM EDTA中杂交并在50°C于 O.lxSSC, 0.1% SDS中洗涤,更优选在50°C于7。/。十二烷基硫酸钠(SDS)、 0.5M NaP04、 lmM EDTA中杂交并在65°C于O.lxSSC, 0.1% SDS中洗
涤);
vi) 作为前述在i)-v)下提及的任一核苷酸序列的互补物或反向互补物
的核苷酸序列。
在另一个优选实施方案中,所述上游激活性序列由包含多核苷酸的核 酸分子描述,所述的多核苷酸编码选自以下的序列
i) 由SEQ ID NO:3描述的序列,
ii) 由SEQIDNO:3描述的序列的至少50个连续碱基、优选至少100 个连续碱基、更优选200个连续碱基的片段,
iii) 与由SEQ ID NO:3描述的序列具有至少50%、优选至少60%、 70%或80%、更优选至少85%或卯%、最优选至少95%、 98%或99%序列同一性的核苷*列,
iv) 能够与由SEQ ID NO:3描述的序列或其互补物杂交(所述杂交优 选地在如上文"定义"部分中定义的低严格条件下、更优选在中等严格条件 下、最优选在高严格条件下,例如在等效于如下的条件下进行在50°C 于7。/。十二烷基硫酸钠(SDS)、 0.5MNaPO4、 lmMEDTA中杂交并在50°C 于2xSSC,0.1% SDS中洗涤、更希望在50°C于7。/。十二烷基硫酸钠(SDS)、 0.5M NaP04、 lmM EDTA中杂交并在50°C于lxSSC, 0.1% SDS中洗涤、 仍更希望在50。C于7。/。十二烷基硫酸钠(SDS)、 0.5MNaPO4、 lmMEDTA 中杂交并在50°C于0.5xSSC, 0.1% SDS中洗涤、优选地在50°C于7%十 二烷基硫酸钠(SDS)、 0.5M NaP04、 lmM EDTA中杂交并在50°C于 O.lxSSC, 0.1% SDS中洗涤,更优选在50°C于7。/。十二烷基硫酸钠(SDS)、 0.5MNaPO4、 lmMEDTA中杂交并在65。C于O.lxSSC, 0.1% SDS中洗 涤)的核苷酸序列;
v) 核苷酸序列,能够与包含由SEQ ID NO:3描述的序列的50-200个 或更多个连续核苷酸(如50或100个、优选150或200个、更优选250或 400个连续核苷酸、最优选全部序列)的核酸或其互补物杂交(所述杂交优选 地在如上文"定义"部分中定义的低严格条件下、更优选在中等严格条件下、 最优选在高严格条件下,例如在等效于如下的条件下进行在50°(:于7% 十二烷基石克酸钠(SDS)、 0.5M NaP04、 lmM EDTA中杂交并在50°C于 2xSSC, 0.1。/。SDS中洗涤、更希望在50°C于7。/。十二烷基硫酸钠(SDS)、 0.5M NaP04、 lmM EDTA中杂交并在50°C于lxSSC, 0,1% SDS中洗涤、 仍更希望在50。C于7。/。十二烷基硫酸钠(SDS)、 0.5MNaPO4、 lmMEDTA 中杂交并在50°C于0.5xSSC, 0.1% SDS中洗涤、优选地在50°C于7%十 二烷基硫酸钠(SDS)、 0.5M NaP04、 lmM EDTA中杂交并在50°C于 O.lxSSC, 0.1% SDS中洗涤,更优选在50°C于7。/。十二烷基硫酸钠(SDS)、 0.5M NaP04、 lmM EDTA中杂交并在65°C于O.lxSSC, 0.1% SDS中洗
涤);
vi) 作为前述在i)-v)下提及的任一核苷酸序列的互补物或反向互补物的核苷#列。
上文定义的任意所迷嵌合性转录调节序列的在ii)、 iii)、 iv)、 v)和vi) 下详述的序列优选地能够调节单子叶植物细胞或生物中的转录,它们更优 选地能够诱导胚特异性表达。优选地,在iv)或v)下详述的序列在严格^ 下与所述粑序列杂交。
优选地,所述核苷酸序列同一性通过使用带其默认执行参数(字长度 (W)ll、期望(E)IO、截止值100、 M=5、 N=-4并比较两条链)的BlastN程 序(版本1.4.7或更新版本)或任何等效程序确定。
在杂交技术中,使用已知核苷酸序列的全部或部分作为选择性地与其 他相应核苷酸序列杂交的探针,其中所述的其他相应核苷酸序列存在于来 自所选生物的克隆基因组DNA片段或cDNA片段(即基因组文库或cDNA 文库)的群体中。所述杂交探针可以是基因组DNA片段、cDNA片段、RNA 片段或其他寡核苷酸,并且可以用可检测基团如32P或任何其他可检测标 记物标记。因此,例如,用于杂交的探针可以通过标记以本发明序列为基 础的合成寡核苷酸进行制造。用于制备杂交探针的方法和用于构建cDNA 文库和基因组文库的方法通常是本领域已知的并且在Sambrook等(1989) 中公开。通常,与本文公开的序列杂交的序列将与所述公开的序列具有至 少约60%-70%并且甚至约80%、 85%、 90%、 95%-98%或更多同一性。 即,序列的序列相似性可以变化,共有至少约60%-70%并且甚至约80%、 85%、 90%、 95%-98%的序列相似性。
的核苷酸,在所述启动子基序5'和3'端侧翼均分布有一串任意核苷酸。例 如,GAPB/GAP.01启动子基序包含如SEQ ID NO:26中定义的15个核苷 酸"aaaaATGAatagaaa",其中"nnnnATGAnnnnnnn"是如SEQ ID NO:27 中描述的核心GAPB/GAP.01启动子基序,其中n选自a、 c、 t和g。在 核心启动子基序的5'端或3'端处的数值n对应于分别在5'端或3'端处,在 相应启动子基序中的核心启动子基序侧翼分布的核苷酸数目。例如下文所 示,计算核心启动子基序相对于相应启动子基序的同一性百分数。当SEQID NO:26的核心GAPB/GAP.Ol启动子基序中的两个"n"与SEQ ID NO:27的GAPB/GAP.Ol启动子基序在相应位置处的核苷酸相同,例如 n(2)= a和n(4)= a时,所述同一性百分数通过相同核苷酸(包括所述四个核 心核苷酸)总数除以该启动子基序的全部长度而确定,即6/15 = 40%。当 SEQ ID NO:26的核心GAPB/GAP.Ol启动子基序中的5个"n"与SEQ ID NO:27的GAPB/GAP.Ol启动子基序在相应位置处的核苷酸相同,例n(l)= a, n(3)=a, n(10)=t, n(12)= g和n(14)= a时,所述同一性百分数是9/15 = 60%。
在Ar.cor78中鉴定出的启动子基序和核心启动子基序在表8和表9中 显示。更具体地,SEQIDNOs:lO、 12、 14、 17、 20、 22、 25、 27、 29、 31、 33、 35、 37、 39、 42、 44、 46、 48、 50、 53、 55、 57、 59、 63、 66、 68、 70、 72、 74、 77、 79、 82、 84、 86、 88、 90、 94、 96、 98、 102、 104、 108、 112、 114、 117、 121、 123、 125、 127、 129、 131、 137和138是Ar.cor78 启动子中鉴定出的核心启动子基序。SEQ ID NOs: 9、 11、 13、 15、 16、 18、 19、 21、 23、 24、 26、 28、 30、 32、 34、 36、 38、 40、 41、 43、 45、 47、 49、 51、 52、 54、 56、 58、 60、 61、 62、 64、 65、 67、 69、 71、 73、 75、 76、 78、 80、 81、 83、 85、 87、 89、 91、 92、 93、 95、 97、 99、 100、 101、 103、 105、 106、 107、 109、 110、 111、 113、 115、 116、 118、 119、 120、 122、 124、 126、 128、 130、 132、 133、 134、 135和136是Ar.cor78 启动子中鉴定出的启动子基序。拟南芥属植物cor78启动子(SEQ ID NO: 1) 例如在(Horvath 1993)和(Gilmour等,1991; Nordin等,1991)中描述。在 一些情况下,如表9中所示, 一种核心启动子基序与具有不同侧翼5'和3' 核苷酸的位于At.cor78不同位置的启动子基序相对应。
本发明还涉及包含多核苷酸的核酸分子,其中所述的多核苷酸编码包 含至少两个核心启动子基序的转录调节序列,所述的核心启动子基序选自 如SEQIDNOs: 10、 12、 14、 17、 20、 22、 25、 27、 29、 31、 33、 35、 37、 39、 42、 44、 46、 48、 50、 53、 55、 57、 59、 63、 66、 68、 70、 72、 74、 77、 79、 82、 84、 86、 88、 90、 94、 96、 98、 102、 104、 108、 112、 114、
61117、 121、 123、 125、 127、 129、 131、 137和138中定义的序列。优选地, SEQIDNOs:lO、 12、 14、 17、 20、 22、 25、 27、 29、 31、 33、 35、 37、 39、 42、 44、 46、 48、 50、 53、 55、 57、 59、 63、 66、 68、 70、 72、 74、 77、 79、 82、 84、 86、 88、卯、94、 96、 98、 102、 104、 108、 112、 114、 117、 121、 123、 125、 127、 129、 131、 137和138的核心启动子基序分别 与SEQIDNOs:9、 (11、 18)、 13、 (15、 16)、 19、 (21、 23、 61、 92)、 (24、 75)、 (26、 40)、 28、 30、 (32、 51、 80、 105、 109)、 34、 36、 38、 41、 (43、
64、 132)、 45、 47、 49、 52、 (54、 99)、 (56、 119)、 (58、 60)、 62、 65、 67、 69、 71、 73、 76、 78、 81、 83、 85、 (87、 100、 106、 110)、 (89、 91)、 93、 95、 97、 101、 103、 107、 111、 (113、 115)、 (116、 118)、 120、 122、 124、 126、 128、 (130、 134、 135)、 136和133是30-40%、优选40-50%或更优 选50-60%或更高地同一的。更优选地,SEQIDNOs:lO、 12、 14、 16、 19、 22、 24、 27、 29、 31、 33、 35、 37、 39、 41、 44、 46、 48、 50、 52、 55、 57、 59、 61、 65、 68、 70、 72、 74、 76、 79、 81、 84、 86、 88、 90、 92、 96、 98、 100、 104、 106、 110、 114、 116、 119、 123、 125、 127、 129、 131、 133、 139和140的核心启动子基序分别与SEQIDNOs:9、 (11、 18)、 13、 (15、 16)、 19、 (21、 23、 61、 92)、 (24、 75)、 (26、 40)、 28、 30、 (32、 51、 80、 105、 109)、 34、 36、 38、 41、 (43、 64、 132)、 45、 47、 49、 52、 (54、 99)、 (56、 119)、 (58、 60)、 62、 65、 67、 69、 71、 73、 76、 78、 81、 83、 85、 (87、 100、 106、 110)、 (89、 91)、 93、 95、 97、 101、 103、 107、 111、 (113、 115)、 (116、 118)、 120、 122、 124、 126、 128、 (130、 134、 135)、 136和133是60-70%、优选地70-80%或更优选地80-卯%或更高 地同一的。最优选地,SEQIDNOs:lO、 12、 14、 16、 19、 22、 24、 27、 29、 31、 33、 35、 37、 39、 41、 44、 46、 48、 50、 52、 55、 57、 59、 61、
65、 68、 70、 72、 74、 76、 79、 81、 84、 86、 88、卯、92、 96、 98、亂 104、 106、 110、 114、 116、 119、 123、 125、 127、 129、 131、 133、 139 和140的核心启动子基序分别与SEQIDNOs:9、 (11、 18)、 13、 (15、 16)、 19、 (21、 23、 61、 92)、 (24、 75)、 (26、 40)、 28、 30、 (32、 51、 80、 105、109)、 34、 36、 38、 41、 (43、 64、 132)、 45、 47、 49、 52、 (54、 99)、 (56、 119)、 (58、 60)、 62、 65、 67、 69、 71、 73、 76、 78、 81、 83、 85、 (87、 100、 106、 110)、 (89、 91)、 93、 95、 97、 101、 103、 107、 111、 (113、 115)、 (116、 118)、 120、 122、 124、 126、 128、 (130、 134、 135)、 136和133是 卯-95%或优选95-99%同一的。
1.2 用于本发明的表达盒和载体的额外调节元件和功能性元件
本发明的表达盒可以包含其他调节元件。该术语在本上下文中应当作 广义理解,包含可以影响表达盒的构建或功能的全部序列。调节元件可以 例如在原核或真核生物中调节转录和/或翻译。在一个优选的实施方案中, 本发明的表达盒包含转录调节序列和任选地额外的调节元件,每一所述转 录调节序列和任选地额外的调节元件与待表达的核酸序列(或转录调节性 核苷酸序列)有效连接。
多种5,和3,转录调节序列可用于本发明中。转录终止子负责终止转录 和使mRNA正确地聚腺苷酸化。3,非翻译调节性DNA序列优选地包含约 50-约1000个、更优选约100-约1000个核苷酸碱基对并且含有植物转录终 止序列和翻译终止序列。适宜的转录终止子和已知在植物中有功能的那些 转录终止子包括CaMV 35S终止子、tml终止子、胭脂碱合酶终止子、豌 豆(pea)rbcS E9终止子、来自根癌农杆菌章鱼碱合酶基因的用于T7转录物 的终止子和来自马铃薯或番茄的蛋白酶抑制物I或II基因的3,端,不过也 可以使用本领域技术人员已知的其他3,元件。备选地,还可以使用Y薏苡 醇溶蛋白终止子、油质蛋白3终止子或来自薏苡属(Coix)的其他终止子。
由于在转录起点与编码序列的起点之间的DNA序列(即非翻译的前导 序列)可以影响基因表达,也可以希望使用特定前导序列。优选的前导序列 构思包括这样的前导序列,它们包括据预测会指导所连接基因最佳表达的 序列,即构思包括优选的共有前导序列,其中所述的共有前导序列可以提 高或维持mRNA稳定性并防止不恰当的翻译启动。本领域技术人员因本 公开而知道选择此类序列。最优选衍生自植物中高表达基因的序列。
优选的调节元件还包括基因的5,非翻译区、内含子和3,非翻译区。已经发现在转基因植物中增强基因表达的此类序列包括内含子序列
(详见下文)和病毒前导序列(例如来自TMV、 MCMV和AMV; Gallie 1987)。例如,从病毒衍生的众多非翻译性前导序列已知增强表达。具体而 言,已经证实来自烟草花叶病毒(TMV)、玉米褪绿斑驳病毒(MCMV)和苜 蓿花叶病毒(AMV)的前导序列有效地增强表达(例如Gallie 1987; Skuzeski 19卯)。本领域已知的其他前导序列包括但不限于微小RNA病毒前导序 列,例如EMCV前导序列(脑心肌炎病毒5,非编码区)(Elroy-Stein 1989); 马铃薯Y病毒前导序列,例如TEV前导序列(烟草蚀紋病毒);MDMV前 导序列(玉米矮花叶病毒);人免疫球蛋白重链结合蛋白(BiP)前导序列 (Macejak 1991);来自苜蓿花叶病毒衣壳蛋白mRNA(AMV RNA 4)的非翻 译前导序列(Jobling 1987);烟草花叶病毒前导序列(TMV)(Gallie 1989)和玉 米褪绿斑驳病毒前导序歹'J(MCMV)(Lommel 1991)。还见Della-Cioppa 1987。根据需要,也可以包括调节元件如TMVft元件(Gallie 1989)。增强 子的额外实例包括来自CaMV 35S启动子、章鱼碱合酶基因(Ellis等, 1987)、稻肌动蛋白I基因、玉米醇脱氢酶基因(Callis 1987)、玉米皱缩I 基因(Vasil 1989)的元件、TMV li元件(Gallie 1989)和来自非植物的真核生 物(例如酵母;Mal988)的启动子。可以构建根据本发明用途的载体以包括 ocs增强子元件。这种元件首先被鉴定为来自鲟梨(umiane)章鱼碱合酶 (ocs)基因中的16 bp回文增强子(EUis 1987)并且存在于至少10种其他启 动子中(Bouchez1989)。当用于植物转化时,使用增强子元件(如ocs元件) 和尤其所述元件的多重拷贝将起到提高来自毗邻启动子的转录水平的作 用。
额外的优选调节元件是增强子序列或聚腺苷酸化序列。优选的聚腺苷 酸化序列是来自植物基因或农杆菌T-DNA基因的那些序列(例如OCS(章 鱼碱合酶)基因或NOS(胭脂碱合酶)基因的终止子序列)。
本发明的表达盒(或自其衍生的载体,即包含本发明表达盒的载体)可 以包含额外的功能性元件,其中所述的功能性元件应当广义地理解为影响 表达盒或载体或包含所述表达盒或载体的转基因生物的构建、增殖或功能的全部元件。此类功能性元件可以包括复制起点(以允许在细菌中复制; pBR322的ORI或P15A ori; Sambrook 1989),或对于农杆菌T-DNA转 移所需要的元件(例如所述T-DNA的左边界和/或右边界)。
此外,可以构建所述表达盒并用于转基因植物细胞内特定基因产物的 胞内靶向或用于引导蛋白质至胞外环境。通常,这通过将编码转运肽或信 号肽序列的DNA序列与具体基因的编码序列连接而实现。所得的转运肽
后方式被去除。转运肽或信号肽的作用是协助蛋白质转运穿过胞内膜(如液 泡、嚢泡、质体和线粒体膜),而信号肽指导蛋白质穿过胞外膜。通过协助 蛋白质转运至区室内部和细胞外,这些序列可以增加基因产物的积累,保 护基因产物免遭蛋白酶解降解。这些序列还允许来自高表达基因的其他 mRNA序列与基因的编码序列连接。由于经核糖体翻译的mRNA比棵 mRNA更稳定,可翻译性mRNA在基因前的存在可以提高该基因的mRNA 转录物的整体稳定性并且因而增加基因产物的合成。因为转运序列和信号 序列通常以翻译后方式从初始翻译产物中除去,故这些序列的使用允许添 加可能在最终多肽中不出现的额外翻译的序列。可能希望使某些蛋白质定 向分布,以增强蛋白质的稳定性(US 5,545,818)。
1.3本发明的嵌合性转录调节核酸序列、表达盒和载体的装配 就本发明任意的嵌合性转录调节核酸序列、表达盒或载体而言,有效 连接可以通过本领域已知的多种方法(包括体外方法和体内方法)实现。因 此,本发明任意的嵌合性转录调节核酸序列、表达盒或载体可以通过使用 本领域熟知的标准重组技术和克隆4支术实现(参见例如Maniatis 1989; Silhavy 1984; Ausubel 1987)。已经开发了众多方案或方法并用于基因克隆。 这些方法的实例是通过限制性酶消化并连接匹配性末端的克隆法、直接从 PCR产物进行的T-A克隆法、TOPO-连接的单向克隆法和基于重组的克 隆法。基于重组的克隆法是最通用的可用克隆方法之一,其原因是克隆效 率高和广泛用于克隆多种基因,无论是否存在可用的限制性酶位点。重组 克隆法使用k重组系统将基因克隆入载体,其中所述的载体含有用于k重组酶装置的重组序列。重组克隆法使用位点特异性重组酶,其中所述的位 点特异性重组酶(在某些情况下连同相关蛋白质)识别核酸分子中特定的碱 基序列并交换这些序列侧翼的核酸节段。重组酶和相关蛋白质统称为"重组 蛋白"。位点特异性重组酶是在众多生物(例如病毒和细菌)中存在并已经被 表征为具有核酸内切酶特性和连接酶特性这两者的蛋白质。已知的多种位
点特异性重组酶属于整合酶家族重组酶,包括来自噬菌体X的整合酶/att 系统。来自噬菌体入的整合酶/att系统的一个应用实例是如在US 5,888,732 和US 6,277,608和美国公开的专利申请2002/0007051 Al和国际申请WO 02/081711 Al中公开的LR克隆反应,其中所述文献通过引用的方式并入 本文作为参考。LR克隆反应可作为GATEWAY 克隆技术(可从 Invitrogen Corporation, Carlsbad, California获得)从商业途径获得。LR 克隆反应由LR克隆酶酶混合物催化,其中所述的LR克隆酶酶混合物包 含X重组蛋白Int、 Xis和大肠杆菌编码的蛋白IHF。
表达盒也可以通过将本发明的嵌合性转录调节核酸序列插入植物基 因组进行装配。这种插入将导致与已经存在于基因组中的目的核酸序列有 效连接。通过插入,目的核酸以萌芽胚特异性方式表达,原因在于所述嵌 合性转录调节核苷酸序列的转录调节特性。所述插入可以是定向的或随机 的。优选地,该插入是定向的并且通过例如同源重组实现。通过这种方法, 天然启动子可以替换为本发明的嵌合性转录调节核苷酸序列,从而调节内 源性基因的表达;f莫式。所述转录调节性核苷 列也可以通过内源性基因 的反义mRNA表达的方式插入,从而诱导基因沉默。
有效连接例如可以包含本发明嵌合性转录调节核苷酸序列连同待表 达的核酸序列和任选地额外调节元件,例如聚腺苷酸化元件或转录终止元 件、增强子、内含子等以如此方式依次排列,从而转录调节性核苷酸序列 可以在适宜条件下表达目的核酸序列的过程中实现其功能。术语"适宜条 件,,优选地意指植物细胞中所述表达盒的存在。优选这样的排列,其中待表 达的目的核酸序列以如此方式置于本发明的嵌合性转录调节核苷酸序列 下游(即在3,方向上),从而使这两种序列共价地连接。任选地,额外序列可以插入这两种序列之间。此类序列可以例如是接头或多克隆位点。此夕卜, 可以插入编码融合蛋白的部分的序列(在意图表达由目的核酸编码的蛋白 质的融合蛋白的情况下)。优选地,待表达的目的核酸序列与本发明转录调
节性核苷酸序列之间的距离不超过200碱基对,优选地不超过100碱基对, 更优选地不超过50碱基对。
实际上,任意DNA组合物可以用于递送至受体单子叶植物或细胞中, 以最终产生本发明的能育性转基因植物。例如,可以使用载体或质粒形式 的DNA节段或片段,或线性DNA节段或片段等,在一些情况下,所述的 DNA节段或片段仅含有待于植物中表达的DNA元件。在本公开内容的教 导下,构建可以与本发明联合使用的载体将为本领域技术人员所知(参见例 如Sambrook 1989; Gelvin 1990)。
本发明也提供含有本发明表达盒的适用于植物转化的重组载体或其 他DNA构建体(包括但不限于粘粒、YAC(酵母人工染色体)、BAC(细菌人 工染色体)和植物人工染色体),和包含所述表达盒或载体(例如包含质粒) 的单子叶植物宿主细胞。所述表达盒或载体可以(优选地)增多转化的单子 叶植物的基因组或可以以染色体外方式维持。本发明的表达盒或载体可以 存在于植物细胞的细胞核、叶绿体、线粒体和/或质体中。优选地,本发明 的表达盒或载体包含于植物细胞核的染色体DNA中。在某些实施方案中, 构思的是可能想要在单子叶植物转化中利用有复制能力的病毒载体。这些 载体包括例如小麦矮化病毒(WDV)"穿梭,,载体,如pWl-ll和 PWl-GUS(Ugaki 1991)。这些栽体能够在玉米细胞和大肠杆菌中自主性复 制,并且从而可以为检测递送至转基因细胞的DNA提供提高的灵敏度。 复制型载体也可以用于递送在侧翼具有来自转座元件(如Ac、 Ds或Mu) 的DNA序列的基因。
本发明的DNA构建体和从其衍生的任意载体可以包含其他功能性元 件。应当广义地理解术语"其他功能性元件"。该术语优选地指这样的全部 元件,它们影响所述DNA构建体或包含所述DNA构建体的载体或包含 所述DNA构建体或载体的细胞或生物的产生、繁殖、功能、用途或价值。所述的其他功能性元件可以包括,但是不应当限于
i) 确保本发明的表达盒或载体复制(例如在大肠杆菌中复制)的复制起 点。可以提到的实例是ORI(DNA复制起点、pBR322 ori或P15A ori(Sambrook等,1989)。
ii) 使得能够和使得便于插入一个或多个核酸序列的多克隆位点 (MCS)。
iii) 使同源重组或插入宿主生物基因组成为可能的序列。
iv) 使植物细胞中用于转移和整合至植物基因组的农杆菌介导的转移 成为可能的元件,例如边界序列,例如T-DNA的右边界或左边界或vir 区域。
用于本文中转化的所导入的重组DNA分子可以是环状或线性、双链 或单链的。通常,DNA是嵌合DNA形式,如质粒DNA,其中所述的嵌合 DNA也可以含有在侧翼具有调节序列的编码区,所述调节序列促进所得植 物中存在的重组DNA表达。通常,所导入的重组DNA分子相对较小,即 小于约30 kb,以最小化对任意的物理、化学或酶降解的易感性,其中所 述的降解易感性随核苷酸分子大小增加而增加。如上指出,优选地预先选 择并限定导入植物基因组的蛋白质、RNA转录物或其混合物的数量,例如, 可以形成导入的DNA的1个-约5-10个此类产物。
本发明也提供单子叶植物(优选转基因植物)、来自这种植物的种子和 部分、和来自这种植物的子代植物,包括杂交种和近交种。
本发明也提供植物育种方法,例如旨在制备能育性杂交转基因植物。 所述方法包括使包含本发明具体表达盒的能育性转基因植物与自身或与 第二种植物(例如缺少所述具体表达盒的一种植物)杂交,以制备包含所述 具体表达盒的能育性杂交转基因植物的种子。随后将种子播种以获得能育 性杂交转基因植物。所述植物可以优选地是单子叶植物(优选如以上定义)。 该能育性杂交转基因植物可以具有经雌性亲代或经雄性亲代遗传的所述 具体表达盒。第二种植物可以是近交植物。该能育性杂交转基因植物可以 是杂交种。本发明也包括这些能育性杂交转基因植物中任意植物的种子。
682.由本发明的表达盒表达的有利性状或特性
本发明的嵌合性转录调节核苷酸序列用于改变植物的表型。转基因植 物表型的多种改变是想要的并且可以使用本文公开的转录调节性核苷酸 序列的有利表达模式(即萌芽胚特异性表达)实现。这些结果可以通过提供 植物中异源性产物表达或内源性产物表达增加来实现。备选地,这些结果 可以通过提供植物中 一种或多种内源性产物、尤其酶或辅因子表达减少来 实现。通常,所述嵌合性转录调节核苷酸序列可以用来在植物中表达与所 述启动子有效连接的核酸节段(例如可读框)或其部分、反义序列、编码有 义RNA序列或双链RNA序列的序列、编码微RNA序列的序列、或转基 因。这些变化导致转化植物的表型变异。
将根据转化的目的选择用于在本发明单子叶植物宿主细胞中表达的 异源性DNA。作物植物转化的主要目的之一是向植物添加商业上希望的、 农学重要的性状或终产物性状。
虽然众多核酸序列适于由本发明的嵌合性转录调节核酸序列表达,最 优选地,所述核酸在表达后赋予单子叶植物选自如下的性状或特性
i) 针对至少一种胁迫因子的增强抗性,
ii) 提高的种子或籽苗营养品质,
iii) 提高的产量,和
iv) 切除輩巴序列,例如切除选择标记序列。 2.1基本原理
已知两类基本方法用于控制表达过量表达和不足表达。过量表达可 以通过插入所选择基因的一个或多于一个额外拷贝实现,然而,不清楚用 核苷酸序列的一个或多于一个的额外拷贝最初转化的植物或其子代是否 表现出对不足表达和过量表达的影响。对于不足表达,存在两种基本方法, 它们在本领域中通常称作"反义下调"和"有义下调,,(有义下调又称作"共抑
制")。这些方法通常称作"基因沉默"。这两类方法导致靶基因表达的抑制。 因此,所述核酸序列在嵌合性转录调节序列控制下的表达可以导致 mRNA转录和蛋白质表达,或反义RNA、有义RNA、 dsRNA、微RNA、ta-siRNA、 snRNA、 RNAi、或其任意组合的表达。
在本发明方法中表达/转录的mRNA或调节性RNA可以是例如
a) 如上所述的双链RNA核,歹'J(dsRNA);
b) 反义核酸序列,包括其中引导所述反义核酸序列针对基因(即基因 组DNA序列,包括启动子序列)或包括5'和3'非翻译区在内的基因转录物 (即RNA序歹'J)的那些方法。也包括a-异头核酸序列;
c) 与核酶组合的反义核酸序列;
d) 用于诱导共抑制的有义核酸序列;
e) 编码显性失活因子的核^列;
f) 针对基因、RNA或蛋白质的DNA结合因子、RNA结合因子或蛋 白质结合因子或者抗体;
g) 引起RNA降解的病毒核酸序列;
h) 微RNA或微小RNA(miRNA),它们已经被设计旨在靶向目的基因 以诱导该目的基因的mRNA降解或翻译性抑制并且因而使基因表达沉默;
i) ta-siRNA ,它们已经被设计旨在耙向目的基因以诱导该目的基因的 mRNA降解(或可能诱导翻译抑制)并且因而使基因表达沉默;和/或
下文是对各个优选方法的简短描述。通常,根据需要,术语"表达,,的 含义应当包括术语"转录"和/或"翻译"的含义。
a)在本发明方法中表达的调节性RNA可以例如是双链RNA核酸序 列(dsRNA),例如用于降低或消除在本发明方法中待降低其活性的核酸分 子或多肽的活性。
作为反义多核苷酸和有义多核苷酸的替代,双链RNA(dsRNA)可以用 来降低基因的表达。如本文中所用,术语"dsRNA"指包含两条RNA链的 RNA杂交体。所述dsRNA可以在结构上是线性或环状。杂交性RNA可 以是基本上或完全互补的。"基本上互补"意指当两条杂交性RNA使用如 上所述Needleman和Wunsch算法进行最佳比对时,杂交部分是至少95% 互补的。优选地,所述dsRNA具有至少100个碱基对长度。用于制备和 使用dsRNA的方法是本领域已知的。 一种方法包括在体内同时转录两条互补性DNA链(参见如美国专利号5,795,715)。
dsRNA可以通过标准转化方法直接导入植物或植物细胞。或者,可以 通过转录两条互补RNA在植物细胞中表达dsRNA。
已经对动物、酵母、真菌和植物生物,例如对脉孢霉(Neurospora)、 斑马鱼(Zebrafish)、果蝇、小鼠、人类、锥虫(Trypanosoma)、矮牵牛或拟 南芥属植物广泛描述了通过双链RNA("双链RNA干扰";dsRNAi)调节基 因的方法(例如Matzke MA等,(2000)Plant Mol. Biol. 43: 401-415; Fire A.等,(1998)Nature 391: 806-811; WO 99/32619; WO 99/53050; WO 00/68374 ;WO 00/44914 ;WO 00/44895 ;WO 00/49035 ; WO 00/63364)。此外,还报道RNAi作为抑制细菌(如大肠杆菌)基因的有 利工具,例如由Tchurikov等报道[J. Biol. Chem, 2000, 275(34): 26523-265291。 Fire等将RNAi现象命名为RNA干扰。明确地参考在以上 参考文献中描述的技术和方法。高效基因抑制也可以在例如瞬时表达的情 况下或在瞬时转化后观察到,例如,作为生物射弹转化法的结果(Schweizer P等(2000)PlantJ 2000 24: 895-903)。 dsRNAi方法基于这样的现象,即同 时导入基因转录物的互补链和反向链导致高效地抑制所讨论基因的表达。 所得的表型极相似于类似的敲除突变体的表型(Waterhouse PM等 (1998)Proc. Natl. Acad. Sci, USA 95: 13959-64)。
Tuschl等[Gens Dev., 1999, 13(24): 3191 - 3197能够证实RNAi方法的 效率与双链体长度、3'-末端突出物的长度和这些突出物中的序列相关。
基于Tuschl等的工作并且认为以下原则在不同物种间是保守的,可以 给予技术人员如下指导原则。因此,本发明或本发明方法中使用的dsRNA 分子优选地符合以下至少 一个原则
-为实现良好的结果,通常应当避开所用核酸序列的5'和3'非翻译区 和靠近起始密码子的区域,因为这些区域中的调节蛋白结合位点较丰富, 并且RNAi序列与此类调节蛋白之间的相互作用可能导致不希望的相互作
用;
-在植物中,所用核酸序列的5'和3'非翻译区和靠近起始密码子的区域,优选在起始密码子上游50至100 nt的区域产生良好结果并且不应当
避开;
-优选地,选择所用mRNA的这样一个区域,其在AUG起始密码子 下游50至100 nt(-核苷酸或碱基);
誦仅来自外显子的dsRNA(-双链RNA)序列用于本方法,因为来自内 含子的序列没有效果;
-该区域中的G/C含量应当大于30%并小于70%,理想地在50%左
右;
-耙mRNA的可能二级结构对RNAi方法的效果而言重要性较低。
所述dsRNAi方法可能特别有效和有利于减少在本发明方法中待降低 其活性的核酸分子表达。尤其如WO 99/32619中描述,dsRNAi方法明显 优于常规反义方法。
因此,本发明可以用于表达双链RNA分子(dsRNA分子),其中所述 的双链RNA分子导入生物,有利地导入植物(或细胞、组织、器官或由它 们衍生的种子)时,因本发明方法中待降低其活性的核酸分子的表达降低而 引起改变的代谢活性。
在双链RNA分子,例如用于减少由本发明方法中待降低其活性的核 酸分子编码的蛋白质表达的dsRNA,这两条RNA链之一与核酸序列的至 少部分基本上相同,并且相应的另一条RNA链与核酸序列的互补链的至 少部分基本上相同。
术语"基本上相同"指这样的事实,即与靶序列相比,所述dsRNA序 列也可以包括插入、缺失和单个点突变,而仍导致表达的有效降低。优选 地,所述抑制性dsRNA的"有义"链与本发明核酸序歹'K其中所述的本发明 核酸序列在本发明的优选实施方案中包括其内源性5,和3,非翻译区)的部 分节段之间或"反义"链与核酸序列的互补链之间如上定义的同源性分别等 于至少30%、优选至少40%、 50%、 60%、 70%或80%、非常特别优选 至少90%、最优选100%。所述的部分节段达至少10个碱基、优选至少 17、 18、 19、 20、 21、 22、 23、 24、 25、 26、 27、 28、 29或30个碱基、特别优选至少40、 50、 60、 70、 80或90个碱基、非常特别优选至少100、 200、 300或400个碱基、最优选至少500、 600、 700、 800、 900或更多个 碱基或至少1000或2000个碱基或更多个碱基长度。在本发明的另一个优 选实施方案中,所述的部分节段达17、 18、 19、 20、 21、 22、 23、 24、 25、 26或27个碱基、优选地达20、 21、 22、 23、 24或25个碱基。这些短序 列在动物和植物中是优选的。200-800个碱基之间的较长序列在非哺乳动 物中、优选在无脊椎动物中、在酵母、真菌或细菌中是优选的,但是它们 也可用于植物中。长的双链RNA在所述生物中例如由蛋白质Dicer加工成 众多siRNA(-小/短干扰性RNA),其中所述的蛋白质Dicer是双链特异性 RNA酶III。作为一种替代,"基本上相同的"dsRNA也可以定义为能够与 基因转录物的部分杂交(例如在50。C或70。C于400 mM NaCl, 40 mM PIPES pH 6.4, 1 mM EDTA中持续12-16小时)的核酸序列。
所述dsRNA可以由聚合的核糖核苷酸的一条或两条链组成。也可以 存在对糖-磷酸酯主链和对核苷的修饰。例如,天然RNA的磷酸二酯键可 以按照如此方式受到修饰,从而它们包含至少一个氮或硫杂原子。碱基可 以按照如此方式受到修饰,从而例如腺苷脱氨酶的活性受到限制。这些修 饰和其他修饰在下文用于稳定反义RNA的方法中描述。
所述dsRNA可以酶学地制备;它也可以完全地或部分地以化学方式 合成。有效介导RNA干扰的达30bp的短dsRNA可以例如通过使用大肠 杆菌核糖核酸酶III(RNase III)部分消化长dsRNA模板而有效地产生 (Yang, D.,等(2002)Proc. Natl. Acad. Sci. USA 99, 9942.)。
双链结构可以从一条自我互补的单链开始或从两条互补链开始而形 成。在一条自我互补的单链中,"有义"序列和"反义"序列可以通过接头序 列("接头")连接并形成例如发夹结构。优选地,所述接头序列可以采取内 含子的形式,其中所述的内含子在dsRNA合成后被剪切掉。编码dsRNA 的核酸序列可以含有其他元件,例如转录终止信号或聚腺苷酸化信号。如 果所述dsRNA的两条链将在细胞或生物中、有利地在植物中组合,则这 可以以多种方式引起
73a) 用包含两个表达盒的载体转化细胞或生物,有利地转化植物;
b) 用两种栽体共转化细胞或生物,有利地转化植物,其中所述的两种 载体之一 包含具有"有义"链的表达盒而另 一种载体包含具有"反义"链的表 达盒;
c) 在已经用包含具有"反义"链的表达盒的载体转化细胞或生物后,用 包含具有"有义"链的表达盒的载体超转化所述的细胞或生物,有利地超转 化植物,或反之操作;
d) 杂交,例如使两种生物、有利地使植物杂交,其中每种生物已经用 一种载体转化,其中 一种载体包含具有"有义"链的表达盒而另 一种载体包 含具有"反义"链的表达盒;
e) 导入包含两个启动子的构建体,其中所述的启动子导致所需序列从 两个方向上转录;
f) 用能够产生所需dsRNA分子的工程化病毒感染细胞或感染生物, 有利地感染植物。
RNA双链体的形成可以在细胞外部或在细胞内部启动。若所述 dsRNA在靶细胞或生物外部合成,则它可以通过注射法、微注射法、电穿 孔法、高速粒子法、通过激光束导入或通过化学化合物(DEAE葡聚糖、磷 酸钙、脂质体)介导而导入生物或所述生物的细胞。
因此在一个实施方案中,本发明涉及一种dsRNA,其中所述双链RNA 核酸分子的有义链与所述核酸序列具有至少30% 、 35%、 40% 、 45°/。 、 50% 、 55%或60%、优选地65%、 70%、 75%或80%、更优选地85%、 90%、 95%、 96%、 97%、 98%或99%的同源性。
本发明的另一个实施方案是一种dsRNA分子,其包含核酸分子中至 少10碱基对(=个碱基,nt,核苷酸)、优选至少17、 18、 19、 20、 21、 22、 23、 24、 25、 26、 27、 28、 29、 30、 35、 40、 45或50、特别优选至少55、 60、 70、 80或90碱基对、非常特别优选至少100、 200、 300或400碱基 对、最优选至少500、 600、 700、 800、 900或更多碱基对或至少1000或 2000碱基对的片段,所述的片段与核酸分子具有至少50%、 60%、 70%、80%或90%、优选地100%的同源性。
在本发明的另一个优选实施方案中,所述dsRNA分子的编码序列或 其部分节段达17、 18、 19、 20、 21、 22、 23、 24、 25、 26或27个碱基、 优选地达20、 21、 22、 23、 24或25个碱基,其中所述序列的同源性基本 上是95%、 96%、 97%、 98%或优选99%或100%。
在本发明的一个优选的实施方案中,所述双链RNA的有义和反义链 共价地结合或通过其他键,例如弱化学键如氢键相互结合,并且所述反义 链基本上是所述有义RNA链的互补物。
如WO 99/53050中所示,所述dsRNA也可以通过"接头"(例如内含子) 连接"有义"链和"反义"链而包含发夹结构。优选自我互补性dsRNA结构, 因为它们仅需要一个构建体的表达并且总是以等摩尔比率包含互补链。
使用本文如下所述的方法(如使用选择标记),优选地将编码dsRNA的 "反义"链或"有义"链或编码dsRNA的自我互补链的表达盒插入载体并稳 定地插入植物基因组,旨在确保所述dsRNA的持久表达。用细菌载体或 病毒载体的瞬时表达是类似有用的。
可以利用可能使每细胞具有至少一个拷贝的量导入所述dsRNA。更 大的量(例如每个细胞至少5、 10、 100、 500或IOOO个拷贝)可以引起效率 更高的减少作用。
如已经描述那样,为引起表达的有效降低,并不是必需要求所述 dsRNA与待减少的核酸分子的基因转录物之间具有100%序列同一性。因 此,有利的是本发明方法容忍序列偏差,因为所述的序列偏差可以作为遗 传性突变、多态性或进化趋异性的结果存在。因此,例如使用了从根据本 发明方法待减少的核酸分子开始所产生的dsRNA。
所述dsRNA可以在体内或在体外合成。为此目的,可以将编码dsRNA 的DNA序列导入处在至少一个遗传控制元件(例如,启动子、增强子、沉 默子、剪接供体或剪接受体或聚腺苷酸化信号)控制下的表达盒。合适的有 利构建体在下文中描述。聚腺苷酸化并非是必需的,用于启动翻译的元件 也不是必需存在的。dsRNA可以按照化学或酶方式合成。细胞RNA聚合酶或细菌噬菌体 RNA聚合酶(例如T3、 T7或SP6RNA聚合酶)可以用于此目的。描述了用 于体外表达RNA的合适方法(WO 97/32016; US 5,593,874; US 5,698,425、 US 5,712,135、 US 5,789,214、 US 5,804,693)。在导入细胞、组织或生物之 前,已在体外以化学或酶方式合成的dsRNA可以例如通过提取、沉淀、 电泳、层析或这些方法的组合较高或较低程度地从反应混合物中分离。所 述dsRNA可以直接导入细胞或在细胞外使用(例如进入胞间隙)。在本发明 的一个实施方案中,所述RNAi方法仅导致基因功能的部分丧失并且因而 能够使技术人员在希望的生物中研究基因剂量效应并且细致地调节本发 明的方法。在另一个优选实施方案中,此方法导致功能完全丧失并且因而 提高精细化学品的生产。此外,该方法还能够使本领域技术人员研究基因 的多个功能。
然而,优选用引起dsRNA表达的表达构建体稳定地转化植物。合适 的方法在下文描述。
b)在本发明方法中表达的调节性RNA可以是反义核酸序列,例如旨 在降低或消除在本发明方法中待降低其活性的核酸分子或多肽。
可以设计外源性DNA序列以下调特定核酸序列。例如通过与本发明 的嵌合性转录调节核酸序列、处于反义方向的外源性DNA或如此设计从 而转录后产生发夹型RNA分子的DNA有效连接而实现这一点。基因抑制 可以针对与性状相关的天然植物基因实现,例如旨在为植物提供降低水平 的由所述天然基因编码的蛋白质或提供增强或减弱水平的受影响的代谢 物。例如,本发明的嵌合性转录调节核酸序列可以与异源性DNA有效连 接,其中如此设计所述的异源性DNA,从而形成旨在抑制玉米胚中天然基 因的发夹形RNA。导致基因抑制的不同类型的外源性DNA排列是本领域 技术人员已知的,并且包括,但不限于以下内容。国际公开WO 94/01550 披露了 DNA构建体,其中反义RNA以自我互补性3'节段稳定。转录的 RNA中形成双链发夹的其他元件在WO 98/05770中披露,其中所述的反 义RNA由形成发夹的聚(CG)核苷酸重复序列稳定,并且专利申请
发明者C·达曼, H-S·宋 申请人:巴斯福植物科学有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1