用于增强植物中组成型基因表达的调节性核酸分子的制作方法

文档序号:510803阅读:352来源:国知局
用于增强植物中组成型基因表达的调节性核酸分子的制作方法
【专利摘要】本发明属于植物分子生物学领域并且提供了用于产生高表达的组成型启动子的方法和产生具有增强的核酸组成型表达的植物的方法,其中将增强核酸表达的核酸(NEENA)与所述启动子功能性连接和/或导入植物中。
【专利说明】用于增强植物中组成型基因表达的调节性核酸分子
[0001]发明描述
[0002]本发明属于植物分子生物学领域并且提供了用于产生高表达的组成型启动子和产生具有增强的核酸组成型表达的植物的方法,其中将增强核酸表达的核酸(NEENAs)与所述启动子功能性连接和/或导入植物中。
[0003]转基因在植物中的表达强烈地受多种外部和内部因素影响,从而导致变动和不可预测水平的转基因表达。经常不得不产生大量的转化体并进行分析,以鉴定具有合乎需要的表达强度的株系。由于转化并筛选表达强度合乎需要的株系是昂贵和耗费人力的,故需要一个或多个转基因在植物中高表达。当不得不在转基因植物中协调表达几个基因以实现特定效应时,鉴于必须鉴定其中每个基因均强烈表达的植物,这个问题尤其严重。
[0004]例如,取决于构建体设计和各个转化事件中T-DNA插入基因座的位置效应,转基因的表达可以显著地变动。强启动子可以部分地克服这些难题。然而,显示强烈表达同时特异性合乎需要的合适启动子的可获得性经常是有限的。为了确保可获得具有合乎需要的表达特异性的充足启动子,额外启动子的鉴定和表征可能有助于弥合这种缺口。然而,具有相应特异性和强度的启动子的天然可获得性和费时的候选启动子表征阻碍了合适的新启动子的鉴定。
[0005]为了克服这些难题,已经显示多样的遗传元件和/或基序积极地影响基因表达。在它们当中,已经认可一些内含子作为具有改善基因表达的强大潜能的遗传元件。虽然机制大多未知,但是已经显示一些内含子积极地影响成熟mRNA的稳态量,这可能通过增强转录活性、改善mRNA成熟、增强胞核mRNA输出和/或改善翻译起始来影响(例如Huang和Gorman, 1990 ;Le Hir等人,2003 ;Nott等人,2004)。由于显示仅所选的内含子增加表达,故剪接本身很可能解释不了观察到的效果。
[0006]将内含子与启动子功能性连接时观察到的基因表达增加称作内含子介导的基因表达增强aME)并且已经在多种单子叶植物(例如Callis等人,1987 ;Vasil等人,1989 ;Bruce等人,1990 ;Lu等人,2008)和双子叶植物(例如Chung等人,2006 ;Kim等人,2006 ;Rose等人,2008)中得到显示。在这个方面,显示内含子相对于翻译起始位点(ATG)的位置对于内舍子介导的基因表达增强至关重要(Rose等人,2004)。
[0007]继一些内含子增强基因表达的潜能之后,显示这些内含子还在植物中于其原有核苷酸环境下影响组织特异性。发现报道基因表达依赖于含有多达2个内含子的基因组区域的存在(Sieburth等人,1997 ;ffang等人,2004)。也已经报道5’ UTR内含子对启动子元件的恰当功能性是重要的,这可能归因于内含子中存在的组织特异性基因控制元件(Fu等人,1995a ;Fu等人,1995b ;Vitale等人,2003 ;Kim等人,2006)。然而,这些研究还显示内含子与异源启动子的组合可能对基因表达的强度和/或特异性产生强烈的不利影响(vitale等人,2003 ;Kim 等人,2006、W02006 / 003186、W02007 / 098042)。例如,通过与芝麻SeFAD25’ UTR内含子组合而不利地影响花椰菜花叶病毒CaMV35S组成型强启动子(Kim等人,2006)。与这些观察结果相反,一些文献显示通过IME增强核酸的表达而不影响相应启动子的组织特异性(Schiinmann等人,2004)。[0008]在WO / 2011 / 023537和WO / 2011 / 023539中,作者描述了一些核酸分子,当其功能性连接启动子时,增强这些启动子的表达而不影响相应启动子的特异性。
[0009]在本申请中,描述了与组成型启动子功能性连接时增强所述启动子的表达同时不影响其特异性的其他核酸分子。在本申请中将这些核酸分子描述为“增强核酸表达的核酸”(NEENA)。内含子具有从相应的前mRNA剪接下来的内在特征。与其相反,本申请中即将陈述的核酸不必要一定包含于mRNA中,或如果存在于mRNA中,没有必要一定从mRNA中剪接下来,以增强源自与NEENA功能性连接的启动子的表达。
[0010]发明详述
[0011]本发明的第一实施方案包括用于产生高表达的组成型启动子的方法,所述方法包括将启动子与一个或多个增强核酸表达的核酸(NEENA)分子功能性连接,所述NEENA分子包括
[0012]i)具有如SEQ ID NO:1至14937和14958至14960的任一者中所定义序列的核酸分子,或
[0013]ii)具有下述序列的核酸分子,所述序列与如SEQ ID NO:1至14937或14958至14960所定义的任一序列具有80 %或更大的同一性,优选地,该同一性是85 %或更大,更优选地,该同一性是90%或更大,甚至更优选地,该同一性是95%或更大、96%或更大、97%或更大、98%或更大或99%或更大,在最优选的实施方案中,该同一性相对于如SEQ ID NO:I至14937或14958至14960所定义的任一序列是100%,或
[0014]iii) i)或ii)的核酸分子的100个或更多连续碱基、优选地150个或更多连续碱基、更优选地200个或更多连续碱基、或甚至更优选地250个或更多连续碱基的片段,所述片段具有如具备SEQ ID NO:1至14937或14958至14960所定义任一序列的相应核酸分子那样的增强表达活性,例如65%或更大、优选地70%或更大、更优选地75%或更大,甚至更优选地80%或更大、85%或更大或90%或更大,在一个最优选的实施方案中,95%或更大的增强表达活性,或
[0015]iv)作为在前文i)至iii)下提及的核酸分子中任一者的互补物或反向互补物的核酸分子,或
[0016]V) 100个或更多核苷酸、150个或更多核苷酸、200个或更多核苷酸或250个或更多核苷酸的核酸分子,所述核酸分子在等同于在50°C于7%十二烷基硫酸钠(SDS)、0.5MNaPO4UmM EDTA杂交,以及在50°C或65°C、优选地65°C于2 X SSC、0.1% SDS中洗涤的条件下与包含由SEQ ID NO:1至14937或14958至14960描述的增强转录的核苷酸序列或其互补物的至少50个、优选地至少100、更优选地至少150、甚至更优选地至少200、最优选地至少250个连续核苷酸的核酸分子杂交。优选地,所述核酸分子在等同于在50°C于7%十二烷基硫酸钠(sDS)、0.5M NaPO4UmM EDTA杂交,以及在50°C或65°C、优选地65°C于I X SSC、0.1% SDS中洗涤的条件下与包含由SEQ ID NO:1至14937或14958至14960描述的增强转录的核苷酸序列或其互补物的至少50个、优选地至少100、更优选地至少150、甚至更优选地至少200、最优选地至少250个连续核苷酸的核酸分子杂交;更优选地,所述核酸分子在等同于在50°C于7%十二烷基硫酸钠(SDS)、0.5M NaPO4UmM EDTA杂交,以及在50°C或65°C、优选地65°C于0.1XSSC、0.1% SDS中洗涤的条件下与包含由SEQ ID NO:1至14937或14958至14960任一序列描述的增强转录的核苷酸序列或其互补物的至少50个、优选地至少100、更优选地至少150、甚至更优选地至少200、最优选地至少250个连续核苷酸的核
酸分子杂交。
[0017]在一个实施方案中,一个或多个NEENA相对于与NEENA功能性连接的启动子是异源的。
[0018]本领域技术人员知晓用于使单向启动子变成双向启动子的方法和使用启动子序列的互补物或反向互补物以产生与原始序列具有相同启动子特异性的启动子的方法。用于组成型及诱导型启动子的此类方法例如由Xie等人(2001) “Bidirectionalization ofpolar promoters in plants (植物中极性启动子的双向化)”nature biotechnologyl9 第677-679页描述。作者描述了添加最小启动子至任意给定启动子的5’端足以在两个方向获得启动子控制表达,同时具有相同的启动子特异性。因而,与如上文所述NEENA功能性连接的高表达启动子在互补或反向互补情况下是有功能的,并且因此所述NEENA在互补或反向互补情况下也是有功能的。
[0019]如本文中所用的组成型启动子意指在基本上全部植物组织中贯穿植物或其部分的基本上整个生活期限表达的启动子。在基本上全部植物组织中表达的启动子也可以包括``在主要植物组织(如叶、茎和/或根)的至少两者中表达并且可以在或可以不在一些或全部次要组织或细胞(如表皮、气孔、毛状体、花、种子或分生组织)中表达的启动子。在一个优选的实施方案中,如本文中所意指的组成型启动子至少在绿色组织如叶和茎中表达。
[0020]贯穿植物或其部分的基本上整个生活期限表达的启动子也可以包括在嫩的和已发育的组织中表达,但是可以在植物生活期限中的特定时间点或在特定条件下如在萌发和/或衰老期间或在生物性和/或非生物性胁迫条件如真菌性或细菌性感染、干旱、热或寒冷下缺少表达的启动子。在一个优选的实施方案中,贯穿植物的基本上整个生活期限表达的组成型启动子至少在充分扩大的组织中表达直至开始衰老。
[0021]原则上,NEENA可以与任意的启动子如组织特异性、诱导型、发育特异性或组成型启动子功能性连接。相应的NEENA将导致在与至少一种NEENA功能性连接的相应启动子控制下的异源核酸的增强表达。增强除组成型启动子之外的启动子例如组织特异性启动子的表达将给予这些启动子的特异性。核酸在相应启动子控制下的表达将是在无NEENA的情况下检测不到所述核酸的转录物的额外组织或发育阶段中可检测的。因此,组织特异性或发育特异性或任意其他启动子可以通过将至少一种如上文所述的NEENA分子与所述启动子功能性连接而变成组成型启动子。因此,本发明的另一个实施方案是提供用于将植物中有功能的任意给定启动子的特异性通过相应启动子与NEENA分子连接而成为组成型启动子的方法,其中所述NEENA分子包含如以上在i)至V)下所述的序列。
[0022]优选地,一个或多个NEENA与任意的组成型启动子功能性连接并且将增强在所述启动子控制下的核酸分子的表达。待用于本发明任意方法中的组成型启动子可以源自植物例如单子叶或双子叶植物、源自细菌和/或病毒或可以是合成性启动子。待使用的组成型启动子例如是来自欧芹(P.crispum)的PcUb1-启动子(W02003102198)、来自玉米的ZmUb1-启动子、来自编码腈水解酶I的拟南芥基因At3g44310的AtNit-启动子、来自玄参(figwort)花叶病毒的34S-启动子、来自烟草花叶病毒的35S-启动子、源自农杆菌的nos启动子和ocs启动子、ScBV-启动子(US5994123)、SUPER-启动子(Lee等人2007,Plant.Phys.)、来自编码铁氧还蛋白NADH还原酶的拟南芥基因At5g66190的AtFNR-启动子、来自豌豆(Pisum sativum)的DtxA启动子(W02005085450)、来自编码磷酸三糖易位蛋白的拟南芥基因At5g46110的AtTPT-启动子、来自拟南芥基因At4gl4880和At4gl4890的双向AtOASTL-启动子、来自编码甘油醛-3-磷酸脱氢酶的拟南芥基因Atlgl3440的PR00194启动子、来自编码二磷酸果糖醛缩酶的拟南芥基因At3g52930的PR00162启动子、AHAS-启动子(W02008124495)或咖啡酰辅酶A-MT启动子和来自稻的0sCP12 (W02006084868)。
[0023]与NEENA功能性连接的本发明高表达的组成型启动子可以用于任意植物中,所述植物包括例如苔藓、蕨类、裸子植物或被子植物,例如单子叶或双子叶植物。在一个优选的实施方案中,与NEENA功能性连接的本发明所述启动子可以用于单子叶或双子叶植物中,优选地是作物植物如谷物、大豆、卡诺拉油菜、棉属植物、马铃薯、甜菜、稻、小麦、高粱、大麦、芭蕉属植物、甘蔗、芒属植物等。在本发明的一个优选的实施方案中,与NEENA功能性连接的所述启动子可以用于单子叶作物植物如谷物、稻、小麦、高粱、芭蕉属植物、芒属植物、甘蔗或大麦中。在一个特别优选的实施方案中,与NEENA功能性连接的启动子可以用于双子叶作物植物如大豆、卡诺拉油菜、棉属植物、甜菜或马铃薯中。
[0024]如本申请中所用的高表达的组成型启动子意指例如与NEENA功能性连接的启动子,所述NEENA引起该启动子在植物或其部分中增强的组成型表达,其中源自功能性连接于NEENA的相应启动子控制下的核酸分子的RNA积累或RNA合成速率比由缺少本发明NEENA的相同启动子引起的表达高,优选地显著更高。优选地,与相同条件下培育的包含不与本发明NEENA功能性连接的相同组成型启动子的同龄对照植物相比,植物中相应核酸的RNA的量和/或RNA合成速率和/或RNA稳定性增加50%或更大,例如100%或更大、优选地200%或更大、更优选地5倍或更大、甚至更优选地10倍或更大、最优选地20倍或更大,例如50倍。[0025]在本文中使用时,显著更高指技术人员知晓如何确定的统计显著性,例如通过对相应的数据集合应用统计检验如t_检验。
[0026]用于检测由启动子赋予的表达的方法是本领域已经的。例如,该启动予可以与标记基因如GUS、GFP或萤光素酶基因功能性连接,并且可以在植物或其部分中测定由相应标记基因编码的相应蛋白质的活性。作为代表性实例,下文详细描述用于检测萤光素酶的方法。其他方法例如是通过本领域已知的方法,例如Northern印迹分析法、qPCR、连缀(run-on)测定法或本领域所述的其他方法测量受该启动子控制的核酸分子的RNA稳态水平或合成速率。
[0027]技术人员知晓多种用于功能性连接两个或多个核酸分子的方法。此类方法可以包括限制性切割/连接法、不依赖连接酶的克隆法、重组工程法、重组或合成法。其他方法可以用来功能性连接两个或多个核酸分子。
[0028]本发明的又一个实施方案是用于产生植物或其部分的方法,所述植物或其部分与相应的对照植物或其部分相比具有一种或多种核酸分子的增强的组成型表达,所述方法包括步骤:将包含如上文在i)至V)下所定义核酸分子的一个或多个NEENA导入所述植物或其部分,和将所述一个或多个NEENA与启动子(优选组成型启动子)并且与处在所述启动子(优选组成型启动子)控制下的核酸分子功能性连接,其中NEENA对所述核酸分子为异源。
[0029]相对于处在与NEENA功能性连接的所述启动子的控制下的核酸分子,NEENA可以是异源的,或NEENA可以相对于该启动子和处在该启动子控制下的核酸分子均为异源。
[0030]就核酸分子或DNA而言,术语“异源的”指这样的核酸分子,所述核酸分子有效连接于,或受到操作以变得有效连接于的第二种核酸分子,所述第二种核酸分子在自然界中不与该核酸分子有效连接或自然界中与该核酸分子在不同位置有效连接。例如,本发明的NEENA在其天然环境中与其天然启动子功能性连接,而在本发明中,它与可以源自相同生物、不同生物或合成性启动子如SUPER-启动子的另一个启动子连接。它也可以意指本发明的NEENA与其天然启动子连接,但是处于所述启动子控制下的核酸分子相对于包含其天然NEENA的启动子为异源。此外,应当理解,启动子和/或处在与本发明NEENA功能性连接的所述启动子控制下的核酸分子相对于所述NEENA为异源,原因是它们的序列已经受到例如突变如插入、缺失等操作,从而启动子和/或处在所述启动子控制下的核酸分子的天然序列被修饰并且因此已经变得相对于本发明的NEENA为异源。也可以理解,当NEENA与其天然启动子功能性连接,其中NEENA的位置相对于所述启动子改变,从而该启动子在这种操作后显示更高表达时,该NEENA相对于功能性连接至NEENA的核酸为异源。
[0031]如本文中所意指的显示增强的核酸分子组成型表达的植物意指与相同条件下培育的没有与相应核酸分子功能性连接的相应NEENA的对照植物相比,具有更高的、优选地统计学上显著更高的核酸分子组成型表达的植物。这种对照植物可以是野生型植物或是包含控制与本发明植物中相同的基因的相同启动子的转基因植物,其中所述启动子不与本发明的NEENA连接。
[0032]产生如本文中所用 的植物包括用于稳定转化的方法,如借助农杆菌介导的转化、原生质体转化、粒子轰击等将重组DNA构建体导入植物或其部分并且任选地随后再生出转基因植物。它还包括用于瞬时转化植物或其部分的方法,如病毒感染法或农杆菌浸润法。技术人员知晓用于稳定和/或瞬时转化植物或其部分的其他方法。方法如育种方法或原生质体融合法可以用于本发明植物的产生并且由本发明涵盖。
[0033]本发明的方法可以应用于任意植物,例如裸子植物或被子植物,优选地是被子植物,例如双子叶或单子叶植物,优选地是双子叶植物。优选的单子叶植物例如是谷物、小麦、稻、大麦、高粱、色蕉属植物、甘鹿、芒属植物和短柄草属植物(Brachypodium),特别优选的单子叶植物是谷物、小麦和稻。优选的双子叶植物是例如大豆、油菜籽、卡诺拉油菜、亚麻、棉属植物、马铃薯、甜菜、万寿菊和拟南芥属植物(Arabidopsis),特别优选的双子叶植物是大豆、油菜籽、卡诺拉油菜和马铃薯。
[0034]在本发明的一个实施方案中,如上文定义的方法包括以下步骤:
[0035]a)将包含如上文的i)至V)中所定义核酸分子的一个或多个NEENA导入植物或其部分,和
[0036]b)将所述一个或多个NEENA整合至所述植物或其部分的基因组中,从而所述一个或多个NEENA与相对所述一个或多个NEENA为异源的内源基因优选地组成型表达的核酸功能性连接,和任选地
[0037]c)从所述转化的细胞再生出包含所述一个或多个NEENA的植物或其部分。
[0038]NEENA可以相对于处在与NEENA功能性连接的所述启动子的控制下的核酸分子为异源,或它可以相对于该启动子和处在该启动子控制下的核酸分子均为异源。
[0039]可以将一个或多个NEENA分子借助粒子轰击法、原生质体电穿孔法、病毒感染法、农杆菌介导的转化法或本领域已知的任意其他方法导入植物或其部分。可以将NEENA分子导入整合例如至质粒或病毒DNA或病毒RNA中。NEENA分子也可以在导入植物或植物部分中之前包含于BAC、YAC或人工染色体上。也可以将作为包含NEENA序列的线性核酸分子导入,其中额外的序列可以紧邻该核酸分子上的NEENA序列存在。毗邻NEENA序列的这些序列可以长约20bp,例如20bp至数百碱基对,例如IOObp或更多,并且可以促进整合至基因组中,例如通过同源重组。可以使用用于基因组整合的任何其他方法,无论它是定向整合法,如同源重组,或随机整合法,如非常规(illegitimate)重组。
[0040]可以与NEENA分子功能性连接的优选地组成型表达的内源核酸可以是任意核酸,优选地是任意的组成型表达的核酸分子。该核酸分子可以是编码蛋白质的核酸分子或非编码性分子如反义 RNA、rRNA、tRNA, miRNA, ta-siRNA、siRNA、dsRNA、snRNA、snoRNA 或本领域已知的任何其他非编码性RNA。 [0041]技术人员知晓用于鉴定组成型表达的核酸分子的方法,例如通过微阵列芯片杂交、qPCR、Northern印迹分析、下一代测序法等,其中本发明的方法可以优选地应用于所述核酸分子。
[0042]实施本发明方法的又一种方式可以是
[0043]a)提供包含一个或多个NEENA的表达构建体,所述NEENA包含如上文i)至V)中所定义的核酸分子,所述NEENA与启动子、优选地如上所述的组成型启动子并且与相对于所述一个或多个NEENA为异源并处在所述启动子、优选地组成型启动子控制下的一种或多种核酸分子功能性连接,和
[0044]b)将包含所述一个或多个NEENA的所述表达构建体整合至所述植物或其部分的基因组中,和任选地
[0045]c)从所述转化的植物或其部分再生出包含所述一个或多个表达构建体的植物或其部分。
[0046]NEENA可以相对于处在与NEENA功能性连接的所述启动子的控制下的核酸分子为异源,或它可以相对于该启动子和处在该启动子控制下的核酸分子均为异源。
[0047]表达构建体可以借助本领域已知的任何方法整合至相应植物的基因组中。使用如粒子轰击法或农杆菌介导的转化法的方法时,整合可以是随机的。在一个优选的实施方案中,整合借助定向整合,例如通过同源重组进行。后一种方法将允许包含与NEENA功能性连接的高表达启动子的表达构建体整合至有利的基因组区域中。有利的基因组区域例如是已知包含例如在种子中高度表达的基因的基因组区域,并且因而与显示无转录活性的基因组区域相比,可以增加源自所述表达构建体的表达。
[0048]在另一个优选的实施方案中,所述一个或多个NEENA与靠近所述异源核酸分子的转录起始位点的启动子、优选地组成型启动子功能性连接。
[0049]如本文中所意指的靠近转录起始位点包含一个或多个NEENA与距离所述异源核酸分子的转录起始位点2500bp或更少、优选地2000bp或更少、更优选地1500bp或更少、甚至更优选地1000bp或更少并且最优选地500bp或更少的启动子、优选地组成型启动子功能性连接。应当理解,该NEENA可以在相应启动子的从转录起始位点的相应距离的上游或下游整合。因而,一个或多个NEENA不必一定包含于处在与所述一个或多个NEENA功能性连接的优选地组成型启动子控制下的相应异源核酸的转录物中。优选地,一个或多个NEENA整合在相应启动子、优选地组成型启动子的转录起始位点的下游。转录起始位点下游的整合位点可以位于5’ UTR、3’ UTR、外显子或内含子中,或它可以替换内含子或部分或完全地替换处于优选地组成型启动子控制下的异源核酸的5’ UTR或3’ UTR0优选地,一个或多个NEENA整合在5’UTR或内含子中,或所述NEENA替换内含子或部分或全部5’UTR,最优选地,它整合在相应异源核酸的5’ UTR中。
[0050]本发明的又一个实施方案包括含有一个或多个NEENA的重组表达构建体,其中所述的NEENA包含上文i)至V)中所定义的核酸分子。
[0051]重组表达构建体可以还包含与一个或多个NEENA功能性连接的一个或多个启动子,优选组成型启动子和任选地一个或多个表达的核酸分子,所述核酸分子相对于所述一个或多个NEENA为异源。
[0052]NEENA可以相对于处在与NEENA功能性连接的所述启动子的控制下的核酸分子为异源,或它可以相对于该启动子和处在该启动子控制下的核酸分子均为异源。
[0053]该表达构建体可以包含与NEENA功能性连接的启动子、优选组成型启动子和待表达核酸分子的I个或多个,例如2个或更多个,例如5个或更多个,如10个或更多个组合,所述待表达核酸分子相对于相应的NEENA为异源。该表达构建体也可以包含其他启动子,所述的其他启动子不包含与相对于相应的启动子为同源或异源的待表达核酸分子功能性连接的NEENA。
[0054]包含如上文定义的一个或多个重组表达构建体的重组表达载体是本发明的另一个实施方案。可以在本发明中使用的多种表达载体是技术人员已知的。用于将包含这种表达构建体的此种载体导入植物基因组中的方法和用于从转化的细胞再生转基因植物的方法也是本领域熟知的,其中所述的表达构建体包含例如与NEENA功能性连接的启动子和任选地其他元件如终止子。取决于用于转化植物或其部分的方法,完整载体可以整合至所述植物或其部分的基因组中,或者载体的某些组分可以整合至所述基因组中,例如T-DNA。
[0055]本发明中还包括转基因植物或其部分,其包含如上文i)至V)中所定义的一种或多种异源NEENA。如果NEENA是合成的、源自另一种生物或源自相同生物,但是其天然基因组位置与对照植物例如野生型植物相比被改变,则将NEENA理解为相对于该植物是异源的。应当理解,改变的基因组位置意指,NEENA位于另一条染色体上或位于同一条染色体上,但是脱离其天然基因组位置(例如在野生型植物中其天然基因组位置)IOkb或更远,例如IOkb,优选5kb或更远,例如5kb,更优选1000bp或更远,例如1000bp,甚至更优选500bp或更远,例如500bp,特别优选IOObp或更远,例如IOObp,最优选IObp或更远,例如10bp。
[0056]包含如上文定义的重组表达载体或如上文定义的重组表达构建体的转基因细胞或转基因植物或其部分是本发明的又一个实施方案。转基因细胞、转基因植物或其部分可以选自细菌、真菌、酵母或植物、昆虫细胞或哺乳动物细胞或植物。优选地,转基因细胞是细菌、真菌、酵母或植物细胞。
[0057]优选的细菌是肠杆菌属细菌如大肠杆菌(E.coli)和农杆菌属的细菌,例如根癌农杆菌(Agrobacterium tumefaciens)和发根农杆菌(Agrobacterium rhizogenes)。优选的植物是单子叶或双子叶植物,例如单子叶或双子叶作物植物,如谷物、大豆、卡诺拉油菜、棉属植物、马铃薯、甜菜、稻、小麦、高粱、大麦、芒属植物、色蕉属植物、甘鹿等。优选的作物植物是谷物、稻、小麦、大豆、卡诺拉油菜、棉属植物或马铃薯。尤其优选的双子叶作物植物是大豆、卡诺拉油菜、棉属植物或马铃薯。尤其优选的单子叶作物植物是谷物、小麦和稻。
[0058]源自如上文所定义的转基因细胞或植物或其部分中的转基因细胞培养物、转基因种子、部分或繁殖材料是本发明的其他实施方案,其中所述的转基因细胞或植物或其部分包含如上文在i)至V)中定义的所述异源NEENA或如上文定义的所述重组表达构建体或所述重组载体。
[0059]如本文中所意指的转基因部分或繁殖材料包含含有相应NEENA、重组表达构建体或重组载体的全部组织和器官,例如叶、茎和果实以及用于植物繁殖和/或再生的材料如插条、接穗、压条、枝条或苗。
[0060]本发明的又一个实施方案是如上文在i)至V)中定义的NEENA或如上文定义的重组构建体或重组载体用于增强植物或其部分中表达的用途。
[0061]在一个优选的实施方案中,如上文在i)至V)中定义的具有SEQ IDl至141、2200至4768、5173至14617和14936至14937以及14958至14960的NEENA和其功能同源物用于增强双子叶植物中组成型表达的方法中,如上文在i)至V)中定义的具有SEQ ID142至2199、4769至5172和14618至14829的NEENA和其功能同源物用于增强单子叶植物中组成型表达的方法中。在一个特别优选的实施方案中,NEENA用于植物家族或植物属中,其来源自:拟南芥:SEQ ID NOl 至 141 和 14936、14937 和 14958 至 14960,玉米(Zea mays):SEQ ID N0142-1255,稻(Oryza sativa):SEQ ID N01256 至 1877,短柄草(Brachypodiumdistachyon):SEQ ID N01878 至 2199,大豆(Glycine max):SEQ ID N02200 至 3908,蒺藜苜猜(Medicago truncatula):SEQ ID N03909 至 4768,高梁(Sorghum bicolor):SEQ IDN04769 至 5172,深山南芥(Arabidopsis lyrata):SEQ ID N05173 至 5530,木薯(Manihotesculentum):SEQ ID N05531 至 6278,蓖麻(Ricinus communis):SEQ ID N06279 至6720,毛果杨(Populus trichocarpa):SEQ ID N06721 至 7257,黄瓜(Cucumis sativus):SEQ ID N07258 至 8104,桃(Prunus persica):SEQ ID N08105 至 8377,番木瓜(Caricapapaya):SEQ ID N08378 至 8882,甜橙(Citrus sinensis):SEQ ID N08883 至 9243,克莱蒙澄(Citrus Clementina):SEQ ID N09244 至 9685,巨按(Eucalyptos grandes):SEQ ID N09686 至 10285,葡萄(Vitis vinifera):SEQ ID N010286 至 13785,玄参科猴面花(Mimulus guttatus):SEQ ID N013786 至 14056,蓝花楼斗菜(Aquilegia coerula):SEQ ID N014057 至 14617,粱(Setaria italica):SEQ ID N014618 至 14829,江南卷柏(Selaginella moellendorfii):SEQ ID N014830 至 14853,球蒴藓(Phvscomitrellapatens):SEQ ID N014854 至 14926 和团藻(Volvox carteri): 14927 至 14935。
[0062]因而,本申请即将提供增强组成型基因表达的核酸分子,其包含一个或多个与一个或多个NEENA功能性连接的启动子,优选地是组成型启动子。另外,提供了此类增强基因表达的核酸分子和包含此类增强基因表达的核酸分子的表达构建体、表达载体、转基因植物或其部分和转基因细胞的用途。
[0063]本发明中还包括源自如上文定义的转基因细胞或植物或其部分的转基因细胞培养物、转基因种子、部分或繁殖材料用于生产食物、动物饲料、种子、药物或精细化学品的用途。
[0064]定义
[0065]缩写:NEENA-增强核酸表达的核酸,GFP-绿色荧光蛋白,⑶S-β -葡糖苷酸酶,BAP-6-苄氨基嘌呤,2,4-D-2, 4— 二氯苯氧乙酸,MS-Murashige-Skoog 培养基,NAA-1-萘乙酸,MES,2-(N-吗啉代)-乙磺酸,IAA:吲哚乙酸,Kan:硫酸卡那霉素,GA3-赤霉酸,Timentin?:替卡西林二钠/克拉维酸钾,microl:微升。
[0066]应当理解,本发明不限于具体的方法或方案。还应当理解本文所用的术语目的仅在于描述具体实施方案,并且不意图限制本发明,本发明将仅受所附权利要求书限制。必须指出,如本文中和所附权利要求中所用,单数形式“一个”、“一种”和“该”包括复数指称,除非上下文另外明确地指明并非如此。因此,例如,对“一个载体”的提及是对一个或多个载体的提及并且包括本领域技术人员已知的其等同物等。术语“约”在本文中用来指大约、大
致、左右和在......范围内。当术语“约”与一个数字范围联合使用时,它通过使界限值扩
展高于和低于所述数值而修饰该范围。通常而言,术语“约”在本文中用来通过20%、优选10%之上或之下(更高或更低)变化而修饰高于和低于所述值的数值。如本文中所用,词汇“或”意指特定列出的任何一成员并且还包括该列出的成员的任意组合。在本说明书中及以下权利要求中使用时,词汇“包含”、“包含着”、“包括”、“包括着”和“包括了”意图指明一个或多个所述特征、整数、组分或步骤的存在,但是它们不排除一个或多个其他特征、整数、组分、步骤或其组的存在或添加。为清晰起见,将本说明书中使用的某些术语如下定义并使用。
[0067]反向平行:“反向平行”在本文中指经互补性碱基残基之间氢键配对的两个核苷酸序列,其中磷酸二酯键在一个核苷酸序列中以5’ -3’方向分布并且在另一个核苷酸序列中以3’ -5’方向分布。
[0068]反义:术语“反义”指相对于其转录或发挥作用的正常方向为反向并且从而表达下述RNA转录物的核苷酸序列,其中所述的RNA转录物与宿主细胞内部表达的靶基因mRNA分子互补(例如,它可以借助Watson-Crick碱基配对作用与祀基因mRNA分子或单链基因组DNA杂交)或与靶DNA分子(例如宿主细胞中存在的基因组DNA)互补。
[0069]编码区:如本文中所用,术语“编码区”在谈及结构基因使用时,指编码在作为mRNA分子翻译结果的新生多肽中存在的氨基酸的核苷酸序列。在真核生物中,编码区在5’侧以编码起始物甲硫氨酸的核苷酸三联体“ATG”为界并且在3’侧以特定终止密码子的3种三联体(即TAA、TAG、TGA)之一为界。除含有内含子之外,基因的基因组形式也可以包含位于RNA转录物中存在的序列的5’ -及3’ -端的序列。这些序列称作“侧翼”序列或区(这些侧翼序列位于mRNA转录物上存在的非翻译序列的5’或3’)。5’ -侧翼区可以含有控制或影响基因转录的调节序列如启动子和增强子。3’ -侧翼区可以含有指导转录终止、转录后剪切和聚腺苷酸化的序列。
[0070]互补的:“互补的”或“互补性”指包含反向平行核苷酸序列的两个核苷酸序列,其中一旦在反向平行核苷酸序列中的互补性碱基残基之间形成氢键,则所述反向平行核苷酸序列能够相互配对(通过碱基配对原则)。例如,序列5’ -AGT-3’与序列5’ -ACT-3’互补。互补性可以是“部分的”或“全部的”。“部分”互补性是其中一个或多个核酸碱基根据碱基配对规则未匹配的情况。核酸分子之间的“全部”或“完全”互补性是其中每个核酸碱基按照碱基配对规则与另一个碱基匹配的情况。核酸分子链之间互补性的程度对核酸分子链之间杂交的效率和强度具有明显影响。如本文中所用的核酸序列“互补物”指这样的核苷酸序列,其核酸分子显示与该核酸序列的核酸分子的全部互补性 。[0071]双链RNA 双链RNA”分子或“dsRNA”分子包含核苷酸序列的有义RNA片段和该核苷酸序列的反义RNA片段,二者均包含彼此互补的核苷酸序列,因而允许有义RNA片段和反义RNA片段配对并形成双链RNA分子。
[0072]内源的:“内源的”核苷酸序列指存在于未转化植物细胞的基因组中的核苷酸序列。
[0073]增强的表达:t “增强”或“增加”核酸分子在植物细胞中的表达在本文中同等地使用,并且意指该核酸分子在应用本发明方法之后在植物、植物部分或植物细胞中的表达水平比其在应用该方法之前在植物、植物部分或植物细胞中的表达更高,或与缺少本发明重组核酸分子的参照植物相比更高。例如,参照植物包含仅缺少相应NEENA的相同构建体。如本文中所用的术语“增强”或“增加”是同义的,并且在本文中意指待表达的核酸分子的更高、优选显著更高的表达。如本文中所用的,“增强”或“增加”某物质(如蛋白质、mRNA或RNA)的水平意指相对于基本上相同条件下培育的、缺少本发明重组核酸分子(例如缺少本发明的NEENA分子、重组构建体或重组载体)的基本上相同植物、植物部分或植物细胞,该水平增加。如本文中所用的,“增强”或“增加”某物质(例如由靶基因表达的前RNA、mRNA、rRNA、tRNA、snoRNA、snRNA和/或由其编码的蛋白质产物)的水平意指相对于缺少本发明重组核酸分子的细胞或生物,该水平增加50%或更多,例如100%或更多,优选200%或更多,更优选5倍或更多倍,甚至更优选10倍或更多倍,最优选20倍或更多倍,例如50倍。可以通过技术人员熟悉的方法测定所述增强或增加。因而,可以例如通过蛋白质的免疫学检测法确定核酸或蛋白质量的增强或增加。另外,可以使用技术如蛋白质测定法、荧光法、Northern杂交法、核酸酶保护测定法、逆转录法(定量RT-PCR)、ELISA(酶联免疫吸附测定法)、蛋白质印迹法、放射免疫测定法(RIA)或其他免疫测定法和荧光激活的细胞分析(FACS)来测量植物或植物细胞中的特定蛋白质或RNA。取决于所诱导蛋白质产物的类型,也可以确定其活性或对生物或细胞表型的影响。用于确定蛋白质数量的方法是技术人员已知的。可以提到的实例是:微量Biuret法(Goa J (1953) Scand J Clin Lab Invest5:218-222)、Folin-Ciocalteau 法(Lowry OH 等人(1951) J Biol Cheml93:265-275)或测量CBB G-250 的吸光度(Bradford MM(1976)Analyt Biochem72:248-254)。作为用于量化蛋白质的活性的一个实例,在下文实施例中描述萤光素酶活性检测法。
[0074] 表达:“表达”指基因产物的生物合成,优选地指细胞中核苷酸序列例如内源基因或异源基因的转录和/或翻译。例如,在结构基因的情况下,表达涉及结构基因转录成mRNA并且任选地随后mRNA翻译成一种或多种多肽。在其他情况下,表达可以仅指携带RNA分子的DNA的转录。
[0075]表达构建体:如本文中所用的“表达构建体”意指能够指导特定核苷酸序列在适宜植物部分或植物细胞中表达的DNA序列,该DNA序列包含在导入此DNA序列的所述植物部分或植物细胞中有功能的启动子,所述启动子与任选地有效连接至终止信号的目的核苷酸序列有效连接。如果需要翻译,该DNA序列一般还包含为正确翻译所述核苷酸序列所需的序列。编码区可以编码目的蛋白,但也可以以有义或反义方向编码功能性目的RNA,例如RNAa, siRNA, snoRNA、snRNA、microRNA、ta-siRNA或任何其他非编码的调节性RNA。包含目的核苷酸序列的表达构建体可以是嵌合的,这意指该表达构建体的组件中一者或多者相对于该表达构建体的其他组件中一者或多者是异源的。该表达构建体也可以是一种这样的表达构建体,它天然地存在,但已经以用于异源表达的重组形式获得。然而,一般而言,该表达构建体相对于宿主是异源,即,该表达构建体的特定DNA序列不天然存在于宿主细胞中并且必须已经通过转化事件导入宿主细胞或该宿主细胞的祖先中。该表达构建体中的核苷酸序列的表达可以处于组成型启动子或处于仅在宿主细胞暴露于一些特定外部刺激时才启动转录的诱导型启动子的控制下。在植物的情况下,该启动子也可以是针对特定组织或器官或发育阶段特异的。
[0076]外来:术语“外来”指任何核酸分子(例如,基因序列),所述核酸分子通过实验操作导入细胞的基因组中并且可以包括该细胞中存在的序列,只要导入的序列含有一些修饰(例如,点突变、存在可选择标记基因等)和因此相对于天然存在序列是不同的。
[0077]功能性连接:将术语“功能性连接”或“功能性连接的”理解为意指例如调节性元件(例如启动子)与待表达的核酸序列并且根据需要与其他调节性元件(例如,终止子或NEENA)以如此方式依次排列,从而每种调节性元件可以履行其目的功能以允许、修饰、促进或影响所述核酸序列的表达。作为同义词,可以使用“有效连接”或“有效连接的”。可以根据所述核酸序列相对于有义或反义RNA的排列,产生表达。为此目的,不是必需要求化学意义上的直接连接。遗传控制序列`例如增强子序列也能够从远离的位置或甚至从其它DNA分子对靶序列产生其作用。优选的排列是这样的排列,其中待表达的核酸序列重组地位于充当启动子的序列之后,从而这两个序列相互共价地连接。该启动子序列与待重组表达的核酸序列之间的距离优选地小于200碱基对、特别优选地小于100碱基对、非常特别优选地小于50碱基对。在一个优选的实施方案中,待转录的核酸序列以如此方式位于启动子之后,其中转录起点与本发明嵌合RNA的合乎需要的开端相同。功能性连接和表达构建体可以借助如(例如,在Maniatis T, Fritsch EF和Sambrook J(1989)Molecular Cloning:A LaboratoryManual,第二版,Cold Spring Harbor Laboratory, Cold Spring Harbor (NY) ;Silhavy等人(1984)Experiments with Gene Fusions, Cold Spring Harbor Laboratory, ColdSpring Harbor (NY) ;Ausubel 等人(1987) Current Protocols in Molecular Biology,Greene Publishing Assoc, and Wiley Interscience ;Gelvin 等人(编著)(1990)PlantMolecular Biology Manual ;Kluwer Academic Publisher,Dordrecht,The Netherlands)所述的惯用重组和克隆技术产生。然而,其他序列,例如充当带限制性酶特定切割位点的接头或充当信号肽的序列,也可以位于这两个序列之间。序列的插入也可以导致融合蛋白的表达。优选地,由调节性区域例如启动子和待表达核酸序列的连接组成的表达构建体可以以载体整合的形式存在并且被插入植物基因组,例如通过转化法。
[0078]基因:术语“基因”指与能够以某种方式调苄基因产物(例如,多肽或功能性RNA)表达的适宜调节序列有效连接的区域。基因包括DNA中位于编码区(可读框,0RF)之前(上游)和之后(下游)的不翻译的调节区(例如启动子、增强子、阻抑物等),以及在可用的情况下,在各个编码区(例如外显子)之间的间插序列(例如内含子)。如本文中所用的术语“结构基因”意图指转录成mRNA的DNA序列,其中所述的mRNA随后翻译成作为具体多肽的特征的氨基酸序列。
[0079]基因组和基因组DNA:术语“基因组”或“基因组DNA”指宿主生物的可遗传信息。所述基因组DNA包括细胞核的DNA(也称作染色体DNA),还包括质体(例如,叶绿体)和其他细胞器(例如,线粒体)的DNA。优选地,术语“基因组”或“基因组DNA”指细胞核的染色体DNA。
[0080]异源的:就核酸分子或DNA而言,术语“异源的”指这样的核酸分子,所述核酸分子有效连接于,或受到操作以变得有效连接于自然界中不与该核酸分子有效连接或自然界中与该核酸分子在不同位置有效连接的第二种核酸分子。包含核酸分子和与之连接的一个或多个调节性核酸分子(如启动子或转录终止信号)的异源表达构建体例如是源自实验操作的构建体,在所述构建体中,a)所述核酸分子或b)所述调节性核酸分子或c) 二者(即(a)和(b))不位于其天然(原有)遗传环境中或已经因实验操作受到修饰,修饰的实例是一个或多个核苷酸残基的置换、添加、缺失、倒位或插入。天然遗传环境指源生物中的天然染色体基因座或指存在于基因组文库中。在基因组文库的情况下,优选地保留,至少部分地保留该核酸分子的序列的天然遗传环境。该环境分布在所述核酸序列的至少一侧并且具有至少50bp,优选地至少500bp,特别优选地至少1,OOObp,非常特别优选地至少5,OOObp序列长度。天然存在的表达构建体例如启动子与相应基因的天然存在组合-在通过非天然的合成性“人工”方法例如诱变法修饰时变成转基因表达构建体。已经描述了此类方法(US5, 565, 350 ;W000 / 15815)。例如,与启动子有效连接的编码蛋白质的核酸分子相对于该启动子视为异源,其中所述的启动子不是该核酸分子的天然启动子。优选地,异源DNA相对于导入该异源DNA的细胞不是内源的或不天然与该细胞相关,但是已经从另一种细胞获得或已经合成。异源DNA还包括含有一些修饰的内源DNA序列、不天然存在的多拷贝内源DNA序列或这样的DNA序列,该DNA序列不与物理连接于所述DNA序列的另一个DNA序列天然接合。通常地但不是必需地,异源DNA在表达其的细胞中编码RNA或蛋白质,而所述RNA或蛋白质正常情况下不被所述细胞产生。
[0081]高表达组成型启动子:如本文中所用的“高表达组成型启动子”意指在植物或其部分中引起组成型表达的启动子,其中衍生自处于相应启动子控制下的核酸分子的RNA积累或合成速率或RNA稳定性 比缺少本发明NEENA的启动子所引起的表达更高,优选地显著更高。优选地,相对于缺少本发明NEENA的组成型启动子,RNA的量和/或RNA合成速率和/或RNA稳定性增加50 %或更大,例如100 %或更多,优选地200 %或更多,更优选地5倍或更多倍,甚至更优选地10倍或更多倍,最优选地20倍或更多倍,例如50倍。
[0082]杂交:如本文中所用,术语“杂交”包括“核酸分子的链通过碱基配对作用与互补链结合的任意过程”。(J.Coombs (1994) Dictionary of Biotechnology, Stockton Press, NewYork)。杂交和杂交的强度(即,核酸分子之间结合的强度)受此类因素影响,如核酸分子之间的互补性程度、所涉及条件的严格性、所形成杂合体的Tm和核酸分子内部的G:C比。如本文中所用,术语“Tm”用来指“解链温度”。解链温度是双链核酸分子群体一半解离成单链的温度。用于计算核酸分子的Tm的等式是本领域熟知的。如标准参考文献所示,当核酸分子处于IM NaCl的水溶液中时,可以通过等式:Tm=81.5+0.41 (% G+C)计算来进行Tm值的简单估计[见例如,Anderson 和 Young, Quantitative Filter Hybridization, in NucleicAcid Hybridization (1985)]。其他参考文献包括更复杂计算法,这些算法考虑了结构特征及序列特征以计算Tm。严格条件是本领域技术人员已知的并且可以在Current Protocolsin Molecular Biology, John ffiley&Sons, N.Y.(1989),6.3.1-6.3.6 中找到。
[0083]“同一性”:在比较两个或多个核酸或氨基酸分子使用时,“同一性”意指所述分子的序列共有某种程度的序列相似性,即所述序列是部分相同的。[0084]为确定两个氨基酸序列或两个核酸分子的同一性(同源性在本文可互换地使用)百分数,将所述序列以一个序列在另一个序列下的方式书写以最佳比较(例如,可以将空位插入蛋白质的序列或核酸的序列,旨在与另一种蛋白质或另一种核酸产生最佳比对)。
[0085]随后在对应氨基酸位置或核苷酸位置处比较氨基酸残基或核酸分子。当一个序列中的位置由另一个序列中对应位置处的相同氨基酸残基或相同核酸分子占据时,则所述分子在这个位置处是同源的(即,如本上下文中所用的氨基酸或核酸“同源性”对应于氨基酸或核酸“同一性”。这两个序列之间的同一性百分数是所述序列共有的相同位置的数值的函数(即同源性百分数=相同位置的数值/位置总数X100)。术语“同源性”和“同一性”因而视为同义词。
[0086]为确定两个或多个氨基酸序列或两个或多个核苷酸序列的同一性百分数,已经开发了几个计算机软件程序。两个或更多序列的同一性可以用例如软件fasta计算,其中软件 fasta 已经以 fasta3 版本使用(w.R.Pearson 和 D.J.Lipman, PNAS85, 2444 (1988);W.R.Pearson,Methods in Enzymologyl83,63 (1990) ;W.R.Pearson和D.J.Lipman, PNAS85,2444 (1988) ;w.R.Pearson, Enzymologyl83,63 (1990))。用于计算不同序列的同一性的另一种有用程序是标准blast程序,其中该程序包含于Biomaxpedant软件(联邦德国慕尼黑Biomax)中。不幸地,该程序有时产生次优结果,因为blast不总是包含主题和查询对象的完整序列。然而,由于该程序非常高效,因而它可以用于庞大数目序列的比较。以下设置通常用于这样的序列比较:
[0087]-p程序名称[字符串];-d数据库[字符串];默认=nr ;_i查询文件[File In];默认=stdin ;-e其月望值(E) [Real];默认=10.0 ;_m比对浏览选项:0=配对;1=查询-比上区域(query-anchored),显示同一性;2=查询-比上区域,不显示同一性;3=查询-比上区域的屏文形式,显示同一性;4=查询-比上区域的屏文形式,不显示同一性;5=查询-比上区域,不显示同一性和突然结束;6=查询-比上区域的屏文形式,不显示同一性和突然结束;7=XML Blast输出;8=TAB格式输出;9带注释行的TAB格式输出[整数];默认=0 ;-o BLAST报告输出文件[File Out]任选;默认=stdout ;_F过滤软件查询序列(DUST用blastn,SEG用其他方法)[字符串];默认=T ;_G空位开口成本(零激发默认行为)[整数];默认=0 ;_E开口延伸成本(零激发默认行为)[整数];默认=0 ;-X X空位比对的下降值匕特)(零激发默认行为);blastn30,megablast20,tblastx0,全部其他方法15[整数];默认=0 ;-1在定义行中显示Gr [T / F];默认=F ;-q核苷酸错配罚分(仅blastn)[整数];默认=_3 ;-r核苷酸匹配回报(仅blastn)[整数];默认=1 ;-V显示对(V)的单-线描述的数据库序列数[整数];默认=500 ;-b显示对(B)的比对结果的数据库序列数[整数];默认=250 ;-f 延伸命中的阈值,若为零,贝 U默认;blastpll,blastn0,blastxl2, tblastnl3 ;tblastxl3,megablast0 [整数];默认=0 ;_g 执行空位比对(对 tblastx 不可用)[T / F];默认=T ;_Q查询使用的遗传密码[整数];默认=1 ;-D DB遗传密码子(仅用于tblast[nx])[整数];默认=1 ;_a使用的处理器数目[整数];默认=1;-0 SeqAlign文件[File Out]任选;_J相信查询定义行[T / F];默认=F ;_M矩阵[字符串];默认=BL0SUM62 ;_W字大小,如果为零,则默认(blastnll,megablast28,全部其他方法3)[整数];默认=0 ;_z数据库的有效长度(对于真实大小,使用零)[Real];默认=0 ;_K来自保持区域的最佳命中数(默认关闭;若使用,则推荐值为100)[整数];默认=0 ;_P0用于多重命中;1用于单一命中[整数];默认=O ;-Y搜索空间的有效长度(对真实大小,使用零)[Real];默认=O ;_S针对数据库搜索的查询链(对于blast[nx]和tblastx) ;3用于两者,I是顶端,2是底部[整数];默认=3 ;-T产生HTML输出结果[T/F];默认=F ;-1限制数据库搜索至GI/ s列表[字符串]任选;-U使用FASTA序列的较低事件过滤作用[T / F]任选;默认=F ;-y无空位延伸的X下降值(比特)(0.0激发默认行为);blastn20,megablastl0,全部其他方法
7[Real];默认=0.0 ;-z最终空位比对的X下降值(比特)(0.0激发默认行为);blastn /megablast50, tblastxO,全部其他方法25 [整数];默认=0 ;-R PS1-TBLASTN检查点文件[File In]任选;_n MegaBlast搜索[T / F];默认=? ;_L查询序列上的位置[字符串]任选;-A多重命中窗口大小,如果为零,则默认(blastn / megablastO,全部其他方法40 [整数];默认=0;_w移码罚分(00F算法用于blastx)[整数];默认=0 ;_t允许tblastn中用于联系HSP的最大内含子的长度(O取消连接联系)[整数];默认=0。[0088]通过使用Needleman和Wunsch或者Smith和Waterman算法获得高质量的结果。因而,优选基于所述算法的程序。有利地,可以用程序PileUp(J.Mol.Evolution.,25,351 (1987),Higgins 等人,CAB10S5,151 (1989))或优选地用均基于 Needleman 和Wunsch 算法(J.Mol.Biol.48 ;443(1970))的程序“Gap” 与 “Needle” 和基于 Smith 和Waterman (AdV.App1.Math.2 ;482 (1981))算法白勺“BestFit” 进行序列的比较。“Gap”和 “BestFit,,是 GCG 软件包[Genetics Computer Group, 575Science Drive, Madison,Wisconsin, USA53711 (1991) ;Altschul 等人(Nucleic Acids Res.25,3389 (1997))的部分,“Needle”是欧洲分子生物学开放软件包(The European Molecular Biology OpenSoftware Suite (EMBOSS))的部分(Trends in Geneticsl6 (6),276 (2000))。因而,优选地,用程序“Gap”或“Needle”在所述序列的整个范围内进行确定序列同一性百分数的计算。用于比较核酸序列的以下标准调整用于“Needle”:矩阵:EDNAFULL,空位罚分:10.0,延伸罚分:0.5。用于比较核酸序列的以下标准调整用于“Gap”:空位权重:50,长度权重:3,平均匹配:10.000,平均错配:0.000。
[0089]例如,将声称在核酸水平与序列SEQ ID NO:1具有80 %同一性的序列理解为意指,通过上述程序“Needle”以设置的上述参数与序列SEQ ID NO:1所代表的序列比较时具有80%同一性的序列。优选地,在查询序列例如SEQ ID NO:1的完整长度上计算同一性。
[0090]内含子:指基因内部的DNA区段(间插序列),该DNA区段不编码该基因产生的蛋白质的部分,并且从该基因转录的mRNA中在该mRNA从细胞核输出之前剪切下来。内含子序列指内含子的核酸序列。因而,内含子是DNA序列的这些区域,它们随编码序列(外显子)一起转录但是在成熟mRNA形成期间被除去。内含子可以位于实际编码区内部或位于前mRNA(未剪接的mRNA)的5’或3’非翻译前导序列中。初级转录物中的内含子被切下并且编码序列同时且精确地连接以形成成熟的mRNA。内含子和外显子的交界形成剪接位点。内含子的序列始于⑶并止于AG。另外,在植物中,已经描述AU-AC内含子的两个实例:来自拟南芥(Arabidopsis thaliana)的RecA样蛋白基因第14内含子和G5基因第7内含子是AT-AC含子。含有内含子的前mRNA具有3种短序列,连同其他序列,这些短序列对于精确剪接内含子是必需的。这些序列是5’剪接位点、3’剪接位点和分支点。mRNA剪接是除去初级mRNA转录物中存在的间插序列(内含子)并接合或连接外显子序列。这又称作顺式剪接作用,所述顺式剪接作用将相同RNA上的两个外显子接合,同时除去间插序列(内含子)。内含子的功能性元件包含由剪接体(例如其剪接内含子末端处的共有序列)的特定蛋白质组分识别并结合的序列。功能性元件与剪接体的相互作用导致从不成熟mRNA除去内含子序列和外显子序列的再接合。内含子具有3种短序列,这些短序列对于精确剪接内含子是必需的,但是并非足够的。这些序列是5’剪接位点、3’剪接位点和分支点。分支点序列是在植物中剪接过程和剪接位点选择方面重要的。分支点序列通常位于3’剪接位点上游10-60个核苷酸处。
[0091]同基因的:除可以因存在或不存在异源DNA序列而不同之外,在遗传上相同的生物(例如植物)。 [0092]分离的:如本文中所用的术语“分离”意指材料已经通过人工取出并且离开其原来的天然环境存在并且因此不是自然界的产物。分离的材料或分子(如DNA分子或酶)可以以纯化的形式存在或可以存在于非天然环境中如例如存在于转基因宿主细胞中。例如,活植物中存在的天然存在多核苷酸或多肽不是分离的,然而与该天然系统中一些或全部共存物质分开的相同多核苷酸或多肽是分离的。此类多核苷酸可以是载体的一部分和/或此类多核苷酸或多肽可以是组合物的一部分,和是分离的,因为这种载体或组合物不是其最初环境的一部分。优选地,术语“分离的”相对于核酸分子使用时,如在“分离的核酸序列”中,指被鉴定并且与该核酸序列天然来源中通常与其接合的至少一种杂质性核酸分子分开的核酸序列。分离的核酸分子是这样的核酸分子,其在与自然界中找到该核酸分子的形式或环境不同的形式或环境下存在。相反,未分离的核酸分子是以其在自然界中存在的状态所找到的核酸分子如DNA和RNA。例如,在宿主细胞染色体上相邻基因附近找到给定的DNA序列(例如,基因);作为与编码多种蛋白质的众多其他mRNA的混合物,在细胞中找到的RNA序列,如编码特定蛋白质的特定mRNA序列。然而,包含例如SEQ ID NO:1的分离的核酸序列包括例如在细胞中通常含有SEQ ID NO:1的此类核酸序列,其中所述核酸序列位于不同于天然细胞中其染色体或染色体外位置的染色体或染色体外位置中,或侧翼分布有不同于自然界中存在的核酸序列。分离的核酸序列可以以单链或双链形式存在。当分离的核酸序列用来表达蛋白质时,该核酸序列将最少含有有义链或编码链的至少一部分(即,该核酸序列可以是单链的)。备选地,它可以含有有义链和反义链(即,该核酸序列可以是双链的)。
[0093]最小启动子:在缺少上游激活情况下无活性或启动子活性大大降低的启动子元件,尤其是TATA元件。在合适的转录因子存在下,最小启动子发挥作用以引起转录。
[0094]NEENA:参见“增强核酸表达的核酸”。
[0095]非编码:术语“非编码”指核酸分子中不编码所表达蛋白质的部分或全部的序列。非编码序列包括但不限于内含子、增强子、启动子区、3’非翻译区和5’非翻译区。
[0096]增强核酸表达的核酸(NEENA):术语“增强核酸表达的核酸”指这样的序列和/或核酸分子,其是具有增强与NEENA功能性连接的启动子的控制下之核酸表达的内在特性的特定序列。不同于启动子序列,NEENA本身不能驱动表达。为了履行增强与NEENA功能性连接的核酸分子表达的职能,NEENA本身应当与启动子功能性连接。与本领域已知的增强子序列的区别在于,NEENA以顺式方式而不以反式方式起作用,并且必需靠近待表达核酸的转录起始位点存在。
[0097]核酸和核苷酸:术语“核酸”和“核苷酸”指天然存在的或合成的或人工核酸或核苷酸。术语“核酸”和“核苷酸”包括处于单链或双链、有义或反义形式的脱氧核糖核苷酸或核糖核苷酸或其任何核苷酸类似物和聚合物或杂合体。除非另外说明,特定核酸序列也隐含地包括其保守方式修饰的变体(例如简并密码子置换)和互补序列,以及明确指出的序列。术语“核酸”在本文中与“基因”、“cDNA”、“mRNA”、“寡核苷酸”和“多核苷酸”互换地使用。核苷酸类似物包括在碱基、糖和/或磷酸酯的化学结构中具有修饰的核苷酸,所述修饰包括但不限于5-位置嘧啶修饰、8-位置嘌呤修饰、胞嘧啶环外胺处的修饰、5-溴-尿嘧啶置换等;和2'-位置糖修饰,包括但不限于糖修饰的核糖核苷酸,其中2' -OH由选自H、OR、R、卤素、SH、SR、NH2, NHR、NR2或CN的基团替换。短发夹RNA(shRNA)也可以包含非天然元件如非天然碱基,例如,肌苷和黄嘌呤,非天然糖,例如,2'-甲氧基核糖,或非天然磷酸二酯键,例如甲基磷酸酯、硫代磷酸酯和肽。
[0098]核酸序列:短语“核酸序列”指从5’ -端至3’ -端读取的脱氧核糖核苷酸或核糖核苷酸的单链或双链聚合物。它包括染色体DNA、自我复制型质粒、DNA或RNA的感染性聚合物、和主要发挥结构性作用的DNA或RNA。“核酸序列”也指代表核苷酸的缩写、字母、字符或字的连续串。在一个实施方案中,核酸可以是“探针”,所述探针是相对短的核酸,通常长度小于100个核苷酸。经常地,核酸探针具有约50个核苷酸长度至约10个核苷酸长度。核酸的“靶区域”是核酸中被鉴定为目标的部分。核酸的“编码区”是核酸的部分,其中置于适宜的调节性序列控制下时,所述部分以序列特异性方式转录和翻译以产生特定的多肽或蛋白质。称该编码区编码这种多肽或蛋白质。
[0099]寡核苷酸:术语“寡核苷酸”指核糖核酸(RNA)或脱氧核糖核酸(DNA)或其模拟物的低聚物或聚合物,以及具有类似发挥作用的非天然存在部分的寡核苷酸。此类修饰或取代的寡核苷酸因合乎需要的特性,例如增强的细胞摄取、增强的核酸靶亲和力和在核酸酶存在下增加的稳定性而经常优选地胜过其天然形式。寡核苷酸优选地包括通过键(例如,磷酸二酯键)或取代键(substitute linkage)相互共价偶联的两个或多个核苷酸单体(nucIeomonomer)。
[0100]突出端:“突出端”是双链寡核苷酸分子的5’ -或3’ -羟基端上相对短的单链核苷酸序列(也称作“延伸”、“伸出端”或“粘末端”)。
[0101]植物:通常理解为意指能够光合作用的任何真核单细胞或多细胞生物或其细胞、组织、器官、部分或繁殖材料(如种子或果实)。为本发明的目的,包括植物界(PlantKingdom)的全部属和物种的高等和低等植物。优选一年生、多年生、单子叶和双子叶植物。该术语包括成熟植物、种子、苗(shoots)和幼苗(seedling)及其衍生部分、繁殖材料(如种子或小孢子)、植物器官、组织、原生质体、愈伤组织和其他培养物(例如细胞培养物),和归并成产生功能单元或结构单元的任何其他类型的植物细胞。成熟植物指在除幼苗之外的任何目的发育阶段的植物。幼苗指在早期发育阶段的年幼不成熟植物。一年生、二年生、单子叶和双子叶植物是用于产生转基因植物的优选宿主生物。基因的表达在全部观赏植物、用材树或观赏树、花、切花、灌木或草坪草中是更进一步有利的。可以用举例方式、但非限制方式提到的植物是被子植物、苔藓植物例如獐耳细辛属(Hepaticae)(地钱类(liverwort))和藓纲(Musci)(藓类植物);蕨类植物如蕨类、木贼类和石松类;裸子植物如松柏类植物、苏铁植物、银杏(ginkgo)和买麻藤科(Gnetaeae)植物;藻类如绿藻纲(Chlorophyceae)、褐藻纲(Phaeophpyceae)、红藻纲(Rhodophyceae)、粘藻纲(Myxophyceae)、黄藻纲(Xanthophyceae)、娃藻纲(Bacillariophyceae)(娃藻类)和裸藻纲(Euglenophyceae)。优选地用于食物或饲料目的的植物,如豆科(Leguminosae)如豌豆、苜蓿和大豆;禾本科(Gramineae)如稻、玉米、小麦、大麦、高粱、粟、黑麦、黑小麦或燕麦;伞形科(Umbelliferae),具体地是胡萝卜属(Daucus)(非常特别地是物种胡萝卜(carota))和疗属(Apium),非常特别地是物种旱疗(Graveolensdulce (celery))及众多其它植物;爺科(Solanaceae),特别是番爺属(Lycopersicon),非常特别地是物种番爺(tomato),和爺属(Solanum),非常特别地是物种马铃薯(tuberosum) (tomato)和爺子(eggplant)和众多其它植物(如烟草(tobacco)),和辣椒属(Capsicum),非常特别地是物种辣椒(annum(pepper))及众多其它植物;豆科(Leguminosae),特别地是大豆属(Glycine),非常特别地是物种大豆(soybean)、苜蓿、豌豆、紫花苜蓿、菜豆或花生及众多其它植物;和十字花科(Brassicacae),特别地是芸苔属(Brassica),非常特别地是物种欧洲油菜(napus,(oilseed rape))、芸苔(campestris, (beet)、甘蓝(oleracea cv Tastie (卷心菜))、花椰菜(oleracea cv Snowball Y (花挪菜))和花莖甘蓝(oleracea cv Emperor (broccoli));和拟南芥属,非常特别地是物种拟南芥及众多其它植物;菊科(Compositae),具体地是莴苣属(Lactuca),非常特别地是物种莴苣(sativa, (lettuce)及众多其它植物;菊科(Asteraceae)如向日葵、万寿菊、莴苣或金盖花及众多其它植物;葫芦科(Cucurbitaceae)如甜瓜、西葫芦/南瓜或夏南瓜,和亚麻(linseed)。更优选地是棉属植物、甘蔗、大麻、亚麻、辣椒和多种树、坚果和藤本(wine)物种。
[0102]多肽:术语“多肽”、“肽”、“寡肽”、“多肽”、“基因产物”、“表达产物”和“蛋白质”在
文中互换地使用,用来指连续氨基酸残基的聚合物或低聚物。
[0103]前蛋白:正常情况下靶向细胞器如叶绿体并且仍包含其转运肽的蛋白质。
[0104]初级转录物:如本文中所用的术语“初级转录物”指基因的不成熟RNA转录物。“初级转录物”例如仍包含内含子和/或仍不包含聚腺苷酸尾或帽结构和/或是缺少对其作为转录物正常发挥作用必需的其他修饰,例如修剪或编辑。
[0105]启动子:术语“启动子”或“启动子序列”是等同物并且如本文中所用的,指与目的核苷酸序列连接时能够控制目的核苷酸序列转录成RNA的DNA序列。此类启动子可以例如在以下公共数据库中 httn: / / www.grassius.0rg / grasspromdb.html、http: / / mendel.cs.rhul.ac.uk / mendel.php?topic=pIantprom> http: / / ppdb.gene, nagoya-u.ac.j p / cg1-bin / index, cgi找到。其中所列的启动子可以用于本发明的方法并且在此引用而包括。启动子位于由该启动子控制转录成mRNA的目的核苷酸序列的5’ ( 即,上游),靠近其转录起始位点,并且为RNA聚合酶和用于转录起始的其他转录因子的特异性结合提供位点。所述启动子包含靠近转录起始位点例如至少IOkb,例如5kb或2kb。它也可以包含靠近转录起始位点至少1500bp,优选地至少1000bp,更优选地至少500bp,甚至更优选地至少400bp,至少300bp,至少200bp或至少lOObp。在又一个优选的实施方案中,启动子包含靠近转录起始位点至少50bp,例如至少25bp。启动子不包含外显子和/或内含子区或5’非翻译区。启动子可以例如相对于相应植物为异源或同源。如果多核苷酸序列源自外来物种,或如果来自相同物种,但从其原有形式中被修饰,则它相对于某生物或第二多核苷酸序列为“异源”。例如,与异源编码序列有效连接的启动子指编码序列来自不同于衍生该启动子的物种中,或,如果来自相同物种,编码序列与该启动子不天然接合(例如基因修饰的编码序列或来自不同生态型或品种的等位基因)。合适的启动子可以源自其中应当发生表达的宿主细胞的基因或源自该宿主细胞的病原体(例如,植物或植物病原体如植物病毒)。植物特异性启动子是适于调节植物中表达的启动子。这种启动子可以源自植物,也可以源自植物病原体,或它可以是由人设计的合成性启动子。如果启动子是诱导型启动子,则转录的速率应答于诱导剂而增加。另外,启动子可以以组织特异性或组织优先的方式受到调节,从而它仅仅或优势地在特定组织类型如叶、根或分生组织中在转录所接合的编码区方面有活性。用于启动子时,术语“组织特异性”指这样的启动子,该启动子能够指导目的核苷酸序列在特定类型的组织(例如,花瓣)中选择性表达,同时相同目的核苷酸序列在不同类型组织(例如,根)中相对缺少的表达。可以例如通过这样的方式评价启动子的组织特异性:将报道基因与该启动子序列有效连接以产生报道构建体,将报道构建体导入植物的基因组,从而该报道构建体整合至所产生的转基因植物的每种组织中,并且检测报道基因在转基因植物的不同组织中的表达(例如,检测mRNA、蛋白质或由报道基因编码的蛋白质的活性)。相对于报道基因在其他组织中的表达水平,检测到该报道基因在一种或多种组织中的更大表达水平表明该启动子对其中检测到更大表达水平的组织`是特异性的。用于启动子时,术语“细胞类型特异的”指这样的启动子,该启动子能够指导目的核苷酸序列在特定类型的细胞中选择性表达,同时相同目的核苷酸序列在相同组织内部的不同类型细胞中相对缺少的表达。用于启动子时,术语“细胞类型特异的”还意指能够促进目的核苷酸序列在单一组织内部的某区域中选择表达的启动子。使用本领域熟知的方法,例如GUS活性染色法、GFP蛋白法或免疫组织化学染色法,可以评估启动子的细胞类型特异性。谈及启动子或源自启动子的表达时,术语“组成型”意指能够指导有效连接的核酸分子在刺激物(例如,热休克、化学品、光等)不存在下在大部分植物组织和细胞中贯穿植物或植物部分的基本上整个生活期限转录的启动子。一般而言,组成型启动子能够指导转基因在基本上任何细胞和任何组织中的表达。
[0106]启动子特异性:谈及启动子时,术语“特异性”意指由相应启动子引起的表达的样式。特异性描述了植物或其部分的组织和/或发育状态,在其中该启动子引起处于相应启动子控制下的核酸分子表达。启动子的特异性也可以包含环境条件,在所述环境条件下可以激活或下调该启动子,如由生物胁迫或环境胁迫如寒冷、干旱、受伤或感染诱导或阻遏。
[0107]纯化:如本文中所用,术语“纯化的”指从其天然环境取出、分离或分开的分子,SP核酸序列或氨基酸序列。“基本上纯化的”分子至少60%没有、优选地至少75%没有和更优选地至少90%没有与它们天然结合在一起的其他组分。纯化的核酸序列可以是分离的核酸序列。
[0108]重组:就核酸分子而言,术语“重组”指通过重组DNA技术产生的核酸分子。重组核酸分子也可以包括本身不存在于自然界中但是被人修饰、改变、突变或操纵的分子。优选地,“重组核酸分子”是在序列方面与天然存在的核酸分子有至少一个核酸不同的非天然存在的核酸分子。“重组核酸分子”也可以包括“重组构建体”,其包含不天然地以这种顺序存在的一系列核酸分子,所述核酸分子优选地有效地连接。用于产生所述重组核酸分子的优选方法可以包括克隆技术、定向或非定向诱变法、合成或重组技术。
[0109]有义:术语“有义”理解为意指核酸分子,其具有与靶序列互补或相同的序列,例如与蛋白质转录因子结合和参与给定基因表达的序列。根据一个优选的实施方案,该核酸分子包含目的基因和允许表达该目的基因的元件。
[0110]显著的增加或减少:大于测量技术中固有误差幅度的增加或减少,例如在酶活性或在基因表达方面,优选地是对照酶的活性或对照细胞中的表达增加或减少约2倍或更多,更优选地增加或减少约5倍或更多,并且最优选地增加或减少约10倍或更多。
[0111]小核酸分子:“小、核酸分子”理解为由核酸或其衍生物如RNA或DNA组成的分子。它们可以是双链或单链的,并且其长度在约15和约30bp之间,例如在15和30bp之间,更优选地在约19和约26bp之间,例如在19和26bp之间,甚至更优选地在约20和约25bp之间,例如在20和25bp之间。在一个特别优选的实施方案中,寡核苷酸的长度在约21和约24bp之间,例如在21和24bp之间。在一个最优选的实施方案中,小核酸分子的长度是约2Ibp 和约 24bp,例如 2Ibp 和 24bp。
[0112]基本上互补的:在最广意义上,本文中就核苷酸序列相对于参比或靶核苷酸序列而言使用时,术语“基本上互补的”意指这样的核苷酸序列,其具有在基本上互补的核苷酸序列和所述参比或靶核苷酸序列的完全互补序列之间至少60%,更希望地至少70%,更希望地至少80%或85%,优选地至少90%,更优选地至少93%,仍更优选地至少95%或96%,仍旧更优选地至少97%或98%,依旧更优选地至少99%或最优选地100%的同一性百分数(后者等同于本上下文中的术语“同一的”)。优选地,在至少19个核苷酸长度、优选地至少50个核苷酸长度、更优选地核酸序列的全部长度范围内针对所述参比核苷酸序列评估同一性(如果不是,则另外在下文说明)。使用威斯康辛大学GCG的默认GAP分析,GAP 的 SEQWEB 应用,基于 Needleman 和 Wunsch 算法(Needleman 和 Wunsch(1970) J Mol.Biol.48:443-453 ;如上文定义)实施序列比较。与参比核苷酸序列“基本上互补的”核苷酸序列与该参比核苷酸序列在低严格性条件、优选地中等严格性条件、最优选地高严格性条件(如上文定义)下杂交。
[0113]转基因:如本文中所用的术语“转基因”指通过实验操作导入细胞的基因组中的任何核酸序列。转基因可以是“内源DNA序列”或“异源DNA序列”(即,“外来DNA”)。术语“内源DNA序列”指这样的核苷酸序列,其天然存在于导入核苷酸序列的细胞中,只要它相对于天然存在序列不含有一些修饰(例如,点突变、存在可选择标记基因等)。
[0114]转基因的:当提及生物时,术语“转基因的”意指用重组DNA分子转化生物,优选地稳定转化生物,其中所述重组DNA分子优选地包含与目的DNA序列有效连接的合适启动子。
[0115]载体:如本文中所用,术语“载体”指能够运输已经与之连接的另一个核酸分子的核酸分子。一种类型的载体是基因组整合的载体,或“整合的载体”,所述载体可以整合至宿主细胞的染色体DNA中。另一个类型的载体是游离型载体,即,能够进行染色体外复制的核酸分子。本文中将能够指导与它们有效连接的基因表达的载体称作“表达载体”。在本说明书中,“质粒”和“载体”互换地使用,除非从上下文显而易见并非如此。设计旨在体外或体内产生如本文所述RNA的表达载体可以含有被任何RNA聚合酶识别的序列,所述的RNA聚合酶包括线粒体RNA聚合酶、RNA pol 1、RNA pol II和RNA pol III。这些载体可以用来在根据本发明的细胞中转录想要的RNA分子。将植物转化载体理解为适用于植物转化过程中的载体。
[0116]野生型:就生物、 多肽或核酸序列而言,术语“野生型”、“天然”或“天然来源”意指所述生物是天然存在的或是在至少一种天然存在生物中可获得的,其没有被改变、突变或由人类操作。
实施例
[0117]化学品和常用方法
[0118]除非另外说明,如(SambiX)Ok等人,1989)所述为本发明的目的进行克隆过程,包括限制性消化、琼脂糖凝胶电泳、核酸的纯化、核酸的连接、细菌细胞的转化、选择和培养。使用Sanger技术(Sanger等人,1977),用激光突光DNA测序仪(Applied Biosystems,Foster City, CA, USA)进行重组DNA的序列分析。除非另外描述,从Sigma Aldrich (SigmaAldrich, St.Louis, USA)、Promega (Madison, WI, USA)、Duchefa (Haarlem, TheNetherlands)或Invitrogen (Carlsbad, CA,USA)获得化学品和试剂。限制性核酸内切酶来自New EnglandBiolabs (Ipswich, MA, USA)或 RocheDiagnostics GmbH (Penzberg, Germany)。寡核苷酸由Eurofins MWG Operon (Ebersberg, Germany)合成。
[0119]实施例1:从具有组成型表达的基因鉴定增强核酸表达的核酸(NEENA)
[0120]1.1从拟南芥(A.thaliana)基因鉴定NEENA分子
[0121]使用公开可获得的基因组DNA序列(例如http: / / www.ncb1.nlm.nih.gov / genomes / PLANTS / PlantList, html)和转录物表达数据(例如 http: / / www.weigelworld.0rg / resources / microarray / AtGenExpress / ),选择源自高度表达性组成型基因的拟南芥(Arabidopsis thaliana)转录物中的一组10个潜在NEENA候选物用于详细分析。候选物命名如下:
[0122]表1:组成型 NEENA 候选物(NEENAc).[0123]
【权利要求】
1.用于产生高表达组成型植物启动子的方法,包括将一个或多个增强核酸表达的核酸(NEENA)分子与启动子功能性连接,其中所述增强核酸表达的核酸(NEENA)分子相对于所述启动子是异源的,其包含 i)具有如SEQID NO:1至14937和14958至14960中所定义序列的核酸分子,或 ii)具有与SEQID NO:1至14937或14958至14960具备至少80%同一性的序列的核酸分子,或
或ii)的核酸分子的100个或更多连续碱基的片段,所述片段具有如具有序列SEQ ID NO:1至14937或14958至14960的相应核酸分子那样的增强表达的活性,或 iv)作为前述在i)或ii)下提及的任一核酸分子的互补物或反向互补物的核酸分子,或 V)核酸分子,其在等同于50°C于7%十二烷基硫酸钠(SDS)、0.5MNaP04、lmM EDTA杂交,以及50°〇于2父55(:、0.1%305中洗涤的条件下与包含由5£0 ID NO:1至14937或14958至14960描述的增强转录的核苷酸序列的至少50个连续核苷酸的核酸分子杂交。
2.用于产生植物或其部分的方法,所述植物或其部分与相应的对照植物或其部分相比具有一种或多种核酸分子的增强的组成型表达,所述方法包括步骤 a)将包含权利要求1的i)至V)中所定义核酸分子的一个或多个NEENA导入所述植物或其部分; 和 b)将所述一个或多个NEENA与组成型启动子和与处在所述组成型启动子控制下的核酸分子功能性连接,其中NEENA对所述核酸分子为异源。
3.根据权利要求1和2所述的方法,包括步骤 a)将包含权利要求1的i)至V)中所定义核酸分子的一个或多个NEENA导入植物或其部分,和 b)将所述一个或多个NEENA整合至所述植物或其部分的基因组中,从而所述一个或多个NEENA与相对所述一个或多个NEENA为异源的内源组成型表达的核酸功能性连接,和任选地 c)从所述转化的细胞再生出包含所述一个或多个NEENA的植物或其部分。
4.根据权利要求1至3所述的方法,包括步骤 a)提供包含一个或多个NEENA的表达构建体,所述NEENA包含权利要求1的i)至v)中所定义的、与组成型启动子和与相对于所述一个或多个NEENA为异源并处在所述组成型启动子控制下的一种或多种核酸分子功能性连接的核酸分子,和 b)将包含所述一个或多个NEENA的所述表达构建体整合至所述植物或其部分的基因组中,和任选地 c)从所述转化的植物或其部分再生出包含所述一个或多个表达构建体的植物或其部分。
5.根据权利要求1至4所述的方法,其中所述一个或多个NEENA与靠近所述异源核酸分子的转录起始位点的组成型启动子功能性连接。
6.根据权利要求5所述的方法,其中所述一个或多个NEENA与距离所述异源核酸分子的转录起始位点2500bp或更少、优选地2000bp或更少、更优选地1500bp或更少、甚至更优选地1000bp或更少并且最优选地500bp或更少的组成型启动子功能性连接。
7.根据权利要求1至6所述的方法,其中所述一个或多个NEENA与核酸分子的翻译起始位点上游的组成型启动子功能性连接,所述核酸分子的表达处在所述组成型启动子的控制下。
8.根据权利要求1至7所述的方法,其中所述一个或多个NEENA与核酸分子的5’UTR内部的组成型启动子功能性连接,所述核酸分子的表达处在所述组成型启动子的控制下。
9.包含一个或多个NEENA的重组表达构建体,所述的NEENA包含权利要求1的i)至v)中所定义的核酸分子。
10.根据权利要求9所述的包含一个或多个NEENA的重组表达构建体,所述NEENA包含权利要求1的i)至V)中所定义的核酸分子,与一个或多个组成型启动子和与相对于所述一个或多个NEENA为异源的一种或多种表达的核酸分子功能性连接。
11.重组表达载体,其包含根据权利要求9至10任一项所述的一个或多个重组表达构建体。
12.转基因植物或其部分,其包含权利要求1的i)至V)中所定义的一种或多种异源NEENA。
13.转基因细胞或转基因植物或其部分,其包含权利要求11中所述的重组表达载体或根据权利要求9至10任一项 所述的重组表达构建体。
14.根据权利要求13所述的转基因细胞、转基因植物或其部分,其选自或衍生自细菌、真菌、酵母或植物。
15.衍生自根据权利要求12至14所述的转基因细胞或植物或其部分的转基因细胞培养物、转基因种子、部分或繁殖材料,其包含权利要求1的i)至V)中所定义的所述异源NEENA、权利要求9或10的重组表达构建体或权利要求11的重组表达载体。
16.权利要求1的i)至V)中所定义的NEENA或权利要求9至11中任一项所定义的重组表达构建体或重组表达载体的用途,用于增强在植物或其部分中的表达。
17.衍生自权利要求16中所述的转基因细胞或植物的转基因细胞培养物、转基因种子、转基因植物、部分或繁殖材料的用途,用于食物、动物饲料、种子、药物或精细化学品的生产。
【文档编号】C12N15/82GK103649314SQ201280033362
【公开日】2014年3月19日 申请日期:2012年7月2日 优先权日:2011年7月5日
【发明者】J·V·哈廷格, M·H·斯图维勒, J·M·库恩, A·N·伯格梅尔 申请人:巴斯夫植物科学有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1