基因表达或活性增强性元件的制作方法_3

文档序号:9756469阅读:来源:国知局
,本发明的上述方法涵盖引入表达盒至第一植物细胞中并且从第一 细胞培育出进一步的细胞,其中所述进一步的细胞可W形成例如完整的植物或植物器官、 优选地种子。取决于表达盒的启动子,祀基因在一个或多个进一步的细胞中或在选择的生 长阶段期间(例如在种子形成期间)或在选择的环境条件(例如热或干旱胁迫或病原体感 染)下表达。
[0112] 还如上文所述,本发明的增强子或表达盒用于
[0113] -增加祀基因表达或活性,
[0114] -产生本发明的载体,和/或用于
[0115] -产生本发明的植物、植物器官或植物细胞。
[0116] 上文已经详细描述了由上述用途赋予的优点。
[0117] 除非另外指明,否则W下定义适用于本发明:
[0118] 术语"核酸"指单链或双链形式、包含含有糖、憐酸醋和作为嚷岭或喀晚的碱基的 单体(核巧酸)的脱氧核糖核巧酸或核糖核巧酸及其聚合物("多核巧酸")。除非特别限制, 否则该术语包括含有天然核巧酸的已知类似物的核酸,所述核酸具有与参考核酸相似的结 合特性并且按照与天然存在核巧酸相似的方式代谢。除非另外说明,特定核酸序列也内在 包括其保守修饰的变体(例如简并密码子置换)和互补序列,W及明确指出的序列。
[0119] "密码子"是编码特定氨基酸的Ξ个核巧酸的核巧酸序列。
[0120] 一个核巧酸序列可W与另一个序列"互补",运是指它们在每个位置上具有互补 (即A对T、C对G)并处于反向顺序的碱基。如果双链DNA的一条链视为"有义链",则视为"反 义"链的另一条链将对有义链具有互补序列。运种差异归因于编码蛋白质的"有义"序列和 本质上无功能的互补"反义"序列。
[0121] "核酸片段"是给定核酸分子的片段。
[0122] "遗传元件"是单一结构单元如基因、内含子、启动子等的核酸片段。
[0123] 在高等植物中,脱氧核糖核酸(DNA)是遗传物质,而核糖核酸(RNA)参与DNA内部所 含的信息转移至蛋白质中。术语"核巧酸序列"指DNA或RNA的聚合物,所述聚合物可W是单 链或双链,任选地含有合成性、非天然或改变的能够渗入DNA或RNA聚合物的核巧酸碱基。
[0124] 术语"核酸"或"核酸序列"或"多核巧酸序列"互换使用。
[0125] "简并性代码"反映 W其非含混性为特征的遗传密码的冗余性。例如,虽然密码子 GAA和GAG二者均规定谷氨酸(冗余性),但是它们均不规定任何其他氨基酸(非含混性)。简 并性因密码子比待编码的氨基酸更多所致。可W通过产生其中一个或多个选择的(或全部) 密码子的第Ξ位置用混合型碱基和/或脱氧肌巧残基置换的序列,实现简并密码子置换 (Batzer 1991;0htsuka 1985;Rossolini 1994)〇
[0126] 术语"基因"广泛地用来指与生物学功能相关的核酸的任何区段。因此,基因包括 编码序列和/或为表达它们所需要的调节序列。例如,基因指表达mRNA或功能性RNA或编码 特定蛋白质并包括调节序列的核酸片段。基因还包括不表达的DNA区段,所述不表达的DNA 区段例如形成其他蛋白质的识别序列。基因可W从多种来源获得,包括从目的来源克隆或 从已知或预测的序列信息合成,并且可W包括设计成具有所需参数的序列。
[0127] 术语"基因组"或"基因组DNA"指宿主生物的可遗传的遗传信息。所述基因组DNA包 含胞核的DNA(也称作染色体DNA ),还包括质体(例如,叶绿体)和其他细胞器(例如,线粒体) 的DNA。优选地,术语基因组或基因组DNA指胞核的染色体DNA。
[0128] 术语"染色体DNA"或"染色体DNA序列"将理解为独立于细胞周期状态的细胞核基 因组DNA。染色体DNA因而可能在染色体或染色单体中组织起来,它们可能是浓集或松散的。 向染色体DNA中的插入可W通过本领域已知的多种方法如例如聚合酶链反应(PCR)分析、 DNA印迹分析、巧光原位杂交(FISH)和原位PCR展示和分析。
[0129] "编码序列"指编码特定氨基酸分子并排除"非编码序列"的DNA或RNA分子。它可W 构成如在cDNA中的"不间断编码序列",即,缺少内含子,或它可W包括一个或多个由适宜剪 接交界来界定的内含子。"内含子"是RNA分子,所述的RNA分子含于初级转录物中,但是在细 胞内部通过RNA切割和再连接作用被移除W产生可W翻译成蛋白质的成熟mRNA。
[0130] 术语"调节序列"指影响待转录的结合(或功能性连接)的核巧酸序列转录、RNA加 工或稳定性或翻译的核巧酸分子。转录调节性核巧酸分子可W相对于待转录的核巧酸分子 具有不同的定位。转录调节性核巧酸分子可W位于待转录分子(例如,编码序列)的上游巧/ 非编码序列)、内部或下游(3/非编码序列)。转录调节性核巧酸分子可W选自包含增强子、 启动子、翻译前导分子、内含子、5/-非翻译序列、3/-非翻译序列和多聚腺巧化信号序列的 组。它们包括天然分子和合成分子W及可W作为合成分子和天然分子的组合的分子。术语 "转录调节性核巧酸分子"不限于启动子。然而,优选地,本发明的转录调节性核巧酸分子包 含至少一个启动子分子(例如,位于基因的转录起点上游的能够引起下游分子转录的分 子)。在一个优选的实施方案中,本发明的转录调节性核巧酸分子包含相应基因的启动子分 子并且-任选地和优选地-包含所述基因的天然5/非翻译区。另外,也可W使用所述基因的 3 '非翻译区和/或多聚腺巧化区。如本文所用,术语"顺式元件"或"启动子基序"指赋予总体 控制基因表达的一个方面的顺式作用转录调节元件。顺式元件可W发挥作用W结合转录因 子,即调节转录的反式作用蛋白质因子。一些顺式元件结合多于一种转录因子,并且转录因 子可W与多于一个顺式元件W不同亲和力相互作用。
[0131] "功能性RNA"指不翻译的反义RNA、微RNA、siRNA、核酶或其他RNA。
[0132] 当RNA聚合酶产生从DNA至mRNA的拷贝时,"转录"发生。"mRNA"将遗传信息从DNA传 输至核糖体,在那里,它们规定基因表达的蛋白质产物的氨基酸序列。实质上,非真核mRNA 在转录时成熟并且通常情况下不需要加工。真核前mRNA需要"加工",意指前mRNA转录后经 修饰。加工包括例如5 '加帽、剪接、多聚腺巧化。
[0133] 术语"RNA转录物"指因 RNA聚合酶催化的DNA分子转录而产生的产物。当RNA转录物 是所述DNA分子的完全互补拷贝时,将它称作初级转录物或它可W是源自初级转录物转录 后加工的RNA分子并且称作成熟RNA。
[0134] "信使RNA" (mRNA)指不含内含子并可W由细胞翻译成蛋白质的RNA。
[0135] "cDNA"指与mRNA互补并从其衍生的单链或双链DNA。
[0136] 术语"可读框"和"ORF"指在编码序列的翻译起始密码子和终止密码子之间编码的 氨基酸序列。"翻译"W四个阶段推进:起始、延伸、转位和终止。术语"起始密码子"和"终止 密码子"指在编码序列中分别规定蛋白质合成(mRNA翻译)的起始和链终止的Ξ个邮邻核巧 酸("密码子")单元。起始设及核糖体的小亚基借助起始因子(IF)与mRNA的5^末端结合。起 始密码子是由核糖体翻译的mRNA转录物的第一个密码子。起始密码子总是在真核生物中编 码甲硫氨酸并且在原核生物中编码修饰的Met(fMet)。最常见的起始密码子是AUG。当核糖 体A位点遇到终止密码子(UAA、UAG或UGA)时,发生多肤的终止。
[0137] "5/非编码序列"或"5/非翻译序列"或"5/非翻译区"指核巧酸分子的位于编码序 列5/(上游)的序列。它存在于起始密码子上游完全加工的mRNA中并且可W影响初级转录物 至mRNA的加工、mRNA稳定性或翻译效率。
[0138] "3/非编码序列"或"3/非翻译序列"或"3/非翻译区"指核巧酸分子的位于编码序 列y(下游)的序列并且包括多聚腺巧化信号序列和编码调节信号的其他序列,所述调节信 号能够影响mRNA加工或基因表达。多聚腺巧化信号通常W影响向mRNA前体的3'末端添加聚 腺巧酸序列为特征。不同y非编码序列的用途由Inge化recht等人,1989例举。
[0139] "启动子"指通过为正确转录要求的RNA聚合酶和其他因子提供识别作用来控制编 码序列表达的核巧酸分子,通常在其编码序列上游巧/)。"启动子"包括最小启动子,所述最 小启动子是包含TATA框和起到指定转录启动位点之作用的其他序列的短DNA序列,其中向 所述短DNA序列添加调节元件用于控制表达。"启动子"还指包含最小启动子外加能够控制 编码序列或功能性RNA表达的调节元件的核巧酸分子。运种类型的启动子分子由近端和更 远端的上游元件组成,后一类元件经常称作增强子。因此,运种"增强子"是运样的DNA分子, 所述DNA分子可W刺激启动子活性并且可W是该启动子的固有元件或经插入W增强启动子 的水平或组织特异性的异源元件。它能够W两种取向(通常的或反转的取向)工作,并且甚 至从启动子上游或下游被移动的情况下也能够发挥作用。增强子和其他上游启动子元件均 结合介导它们效果的序列特异性DNA结合蛋白。启动子可W完全源自天然基因,或由不同的 元件组成,源自自然界中存在的不同启动子,或甚至由合成性DNA区段组成。启动子也可W 含有参与结合蛋白质因子的DNA序列,所述蛋白质因子控制响应于生理或发育状况而启动 转录的有效性。本领域技术人员知晓用于使单向启动子变成双向启动子的方法和使用启动 子序列的互补物或反向互补物W产生与原始序列具有相同启动子特异性的启动子的方法。 用于组成型及诱导型启动子的此类方法例如由Xie等人(2001) "Bidirectional ization of polar promoters in plants"nature biotechnology 19,第677-679页描述。作者描述了 添加最小启动子至任何给定启动子的5/引发端足W在两个方向按相同启动子特异性获得 启动子控制的表达。本发明的启动子合乎需要地含有可W赋予或调苄基因表达的顺式元 件,也称作转录因子结合位点。可W通过许多技术来鉴定顺式元件,包括缺失分析法,即,从 启动子5/末端或内部缺失一个或多个核巧酸;使用DNA酶I足迹法、甲基化干扰法、电泳迁移 率变动测定法、借助连接作用介导PCR的体内基因组足迹法和其他常规测定法的DNA结合蛋 白分析法;或通过常规DNA序列比较方法与已知顺式元件基序进行DNA序列相似性分析J员 式元件的精细结构可W通过诱变(或置换)一个或多个核巧酸或通过其他常规方法进一步 研究。顺式元件可W通过化学合成或通过从包含运类元件的启动子分离而获得,并且它们 可W用额外的旁侧分布核巧酸合成,所述旁侧分布核巧酸含有可用限制性酶位点W促进后 续操作。
[0140] "起始位点"是围绕第一个核巧酸的位置,所述位置是已转录序列的部分,也定义 为位置+1。相对于运个位点,对基因的全部其他序列和其控制区域编号。下游序列(即,3/方 向的其他蛋白质编码序列)命名为正,而上游序列巧/方向的大部分控制区域)命名为负。
[0141] 将无活性或在缺少上游激活情况下启动子活性大大降低的启动子元件,尤其TATA 元件,称作"最小或核屯、启动子"。在合适的转录因子存在下,最小启动子发挥作用W引起转 录。"最小或核屯、启动子"因此仅由启动转录所需要的全部基础元件,例如TATA框和/或起始 子组成。
[0142] "组成型启动子"指能够在全部或几乎全部的植物发育阶段期间在全部或几乎全 部的植物组织中它控制的可读框(0RF)表达的启动子。每种转录(transcdankmachs gut, und巧hi dich ge化iicktription)激活元件不显示绝对组织特异性,但是W下述水平在大 部分植物部分中介导转录激活,所述水平是转录最活跃的植物部分中所达到的水平的至少 1%。
[0143] "调节型启动子"指不W组成型方式指导基因表达、而W时间调节和/或空间调节 方式指导基因表达的启动子,并且包括组织特异性启动子和诱导型启动子。它包括天然分 子和合成分子W及可W作为合成分子和天然分子组合的分子。不同启动子可W指导基因在 不同组织或细胞类型中或在不同发育阶段或响应于不同环境条件表达。正在持续发现可用 于植物细胞中的各种类型的新启动子,许多例子可W在Okamuro等人(1989)的编纂文集中 找到。可用于植物中的常见调节型启动子包括但不限于安全剂诱导型启动子、衍生自四环 素诱导型系统的启动子、衍生自水杨酸诱导型系统的启动子、衍生自醇诱导型系统的启动 子、衍生自糖皮质激素诱导型系统的启动子、衍生自病原体诱导型系统的启动子和衍生自 蚁皮素诱导型系统的启动子。
[0144] "组织特异性启动子"指不在全部植物细胞中表达、而仅在特定器官(如叶或种子) 的一个或多个细胞类型中、特定组织(如表皮、绿色组织、胚或子叶)或特定细胞类型(如叶 薄壁组织或种子胆藏细胞)中表达的调节型启动子。运些还包括按时间方式如在早期或晚 期胚发生中、叶扩展期间、正在发育的种子或果实中的果实成熟、在充分分化的叶中或在衰 老开始时受调节的启动子。
[0145] "组织特异性转录"在本发明的上下文中意指核酸分子借助转录调节性核酸分子 W如此方式转录,从而所述核酸分子在所述组织中的转录占整个植物中该植物的任意发育 阶段期间从所述核酸分子转录的RNA总量多于90%、优选地多于95%、更优选地多于99%。 本文具体公开的转录调节性核巧酸分子视为组织特异性转录调节性核巧酸分子。
[0146] "组织偏好地转录"在本发明的上下文中意指核酸分子借助转录调节性核酸分子 W如此方式转录,从而所述核酸序列在所述组织中的转录占整个植物中该植物的任意发育 阶段期间从所述核酸序列转录的RNA总量多于50%、优选地多于70%、更优选地多于80%。
[0147] "诱导型启动子"指可W在一个或多个细胞类型中开启或在外部刺激如化学物、 光、激素、胁迫或病原体时引起表达增加的那些受调节的启动子。
[0148] 终止子或转录终止子是一段在基因组DNA上标示基因或操纵子就转录而言结束的 遗传序列。
[0149] 术语"翻译前导序列"指基因在启动子和编码序列之间的那种DNA序列部分,所述 DM序列部分转录成RNA并且存在于完全加工的mRNA中,在翻译起始密码子上游巧/ )。翻译 前导序列可W影响初级转录物至mRNA的加工、mRNA稳定性或翻译效率。
[0150] 作为基因表达的部分,"翻译"是细胞核糖体藉此制造蛋白质的过程。在翻译中,通 过转录产生的信使RNA(mRNA)由核糖体解码W产生特定氨基酸链或多肤,所述氨基酸链或 多肤后来将折叠成活性蛋白质。在细菌中,翻译在细胞的胞质中发生,在胞质中,核糖体大 亚基和小亚基存在并且与mRNA结合。在真核生物中,翻译在称作向量合成的过程中跨内质 网膜发生。通过诱导转移RNA(tRNA)W具有互补反密码子序列与mRNA的互补反密码子序列 结合,核糖体促进解码。
[0151] mRNA分子上的Kozak序列由核糖体作为翻译起始位点识别,蛋白质从所述起始位 点由运种mRNA分子编码。核糖体需要运个序列或可能的变更W启动翻译。该序列通过下述 注释确定
[0152] (gcc)gccRccAUGG,
[0153] 所述总结了由Kozak从广泛多种来源分析的数据(总计约699种;Kozak M( 1987年 10月)."An analysis of 5'-noncoding sequences from 699 vertebrate messenger RNAs"Nucleic Acids Res. 15(20) :8125-8148.)如下:小写字母指在该位置处最常见的碱 基,但碱基可W不同;大写字母表示高度保守的碱基,即/ AUGG/序列是恒定的或几乎不变 化,表示嚷岭(腺嚷岭或鸟嚷岭)的/R/总是在运个位置观察到(其中腺嚷岭由Kozak要求是 更频繁的);并且括号内的序列((gcc))具有不确定的意义。优选地,Kozak共有序列是拟南 芥(Arabidopsis thaliana)的共有序列AAA-AUG-GC。
[0154] 转移RNA(tRNA)是由充当核酸(DNA和RNA)的核巧酸序列和蛋白质的氨基酸序列之 间物理联系的RNA组成的衔接子分子。如mRNA中的密码子所指导,通过携带氨基酸至细胞的 蛋白质合成装置(即核糖体),它发挥运种联系作用。
[0155] "表达"指内源基因、0RF或其部分或转基因在植物中的转录和/或翻译。例如,在反 义构建体的情况下,表达可W指仅反义DNA的转录。此外,表达指有义(mRNA)或功能性RNA的 转录和稳定积累。表达还可W指蛋白质的产生。
[0156] 启动子(具有或没有增强子时)的"表达模式"是显示转录在植物中何处和在哪个 发育阶段由所述启动子启动的表达水平模式。当一个启动子的表达模式显示很少与另一个 启动子的表达模式重叠时,则称一套启动子的表达模式互补。启动子的表达水平可W通过 测量转录的标准报道mRNA的"稳态"浓度确定。运种测量是间接的,因为报道mRNA的浓度不 仅依赖于其合成速率,还依赖于mRNA降解的速率。因此,稳态水平是合成速率和降解速率的 产物。然而当转录的分子相同时,降解速率可W考虑为W固定速率推进,并且因此运个值可 W充当合成速率的量度。当启动子W运种方式比较时,本领域技术人员可获得的技术是S1-RNA酶杂交分析、RNA印迹和竞争性RT-PCR。运一系列技术无论如何不代表全部可获得的技 术,反而描述了用来分析mRNA的转录活性和表达水平的常用方法。对实际上全部启动子中 转录起点的分析已经掲示,通常不存在转录开始于单个碱基,而是或多或少簇集的成组起 始位点,每个起始位点占据mRNA的某些起点。由于运种分布在启动子之间不同,所W每个群 体中报道mRNA的序列将彼此不同。由于每种mRNA种类或多或少易于降解,所W对不同的报 道mRNA不能预期单一降解速率。已经对各种真核启动子分子显示,围绕起始位点的序列 Γ起始子")在决定运种具体启动子指导的RNA表达的水平方面发挥重要作用。运个序列还 包括已转录序列的部分。启动子与报道分子的直接融合将因此导致次优水平的转录。分析 表达模式和水平的常用方法是确定细胞中蛋白质积累的"稳态水平。本领域技术人员已知 的常用报道基因候选物是β-葡糖醒酸糖巧酶(GUS)、氯霉素乙酷基转移酶(CAT)和具有巧光 特性的蛋白质,如来自维多利亚多管水母(Aequora victoria)的绿色巧光蛋白(GFP)。然 而,原则上,更多蛋白质适于此目的,前提是该蛋白质不干扰必需植物功能。许多工具适用 于定量和定位测定。例如基于免疫化学、酶促、巧光检测和定量的检测系统可W轻易地产生 或可得到。可W在植物组织提取物中或在完整组织中使用蛋白质表达原位分析确定蛋白质 水平。通常,具有一个嵌合启动子报道分子构建体的各个转化系在它们的报道基因的表达 水平方面是变动的。还经常观察到W下现象:运类转化体不表达任何可检测的产物(RNA或 蛋白质)。表达的变异性通常归因于"位置效应",虽然运种无活性的分子机制通常不清楚。
[0157] 优选地,本发明启动子的表达水平基于祀基因活性(转化效率)分析,其中所述祀 基因活性如通过祀基因产物(在下文实施例中:ARA和EPA)的总和除W祀基因底物和产物 (在下文实施例中:20:化-6、20: 4n-3、ARA和EPA)的总量来计算。
[0158] "组成型表达"指使用组成型或调节型启动子的表达。"条件性表达"和"调节型表 达"指受调节型启动子控制的表达。
[0159] "特异性表达"是限于例如植物的一种或一些组织(空间限制作用)和/或限于一个 或一些发育阶段(时间限制作用)的基因产物表达。公认真正特异性几乎不存在:启动子似 乎在一些组织中优选地开启,而在其他组织中可能不存在活性或仅存在少量活性。运种现 象称作泄露表达。然而,在本发明中特异性表达意指一种或一些植物组织中的优选表达。
[0160] 术语"多肤"、1太"、"寡肤"、"基因产物"、"表达产物"和"蛋白质"在文中可互换地 使用,用来指连续氨基酸残基的聚合物或寡聚物。如本文所用,术语"氨基酸序列"或"多肤 序列"指一串代表氨基酸残基的缩写、字母、字符或词。氨基酸可W在本文中通过其公知的 立字母符号或通过IUPAC-IUB生物化学命名委员会(IUPAC-IUB Biochemical Nomencla化re Commission)推荐的单字母符号提到。本文所用的缩写是氨基酸的常规单字 母代码:A,丙氨酸;B,天冬酷胺或天冬氨酸;C,半脫氨酸;D天冬氨酸;E,谷氨酸;F,苯丙氨 酸;G,甘氨酸;Η,组氨酸;I,异亮氨酸;K,赖氨酸;L,亮氨酸;Μ,甲硫氨酸;N,天冬酷胺;P,脯 氨酸;Q,谷氨酷胺;R,精氨酸;S,丝氨酸;Τ,苏氨酸;V,鄉氨酸;W,色氨酸;Υ,酪氨酸;Ζ,谷氨 酷胺或谷氨酸(参见L. Stiver,Biochemistry,1988,W. Η. Freeman and Company,New 化rk)。如本文在氨基酸序列内部所用的字母V'可W代表任何氨基酸残基。
[0161] 就生物、多肤或核酸序列而言,术语"野生型"、"天然"或"天然来源"意指所述生物 是天然存在的或是在至少一种天然存在生物中可获得的,其未被改变、突变或另外受到人 类操作。
[0162] "重组DNA分子"是使用如Sambrook等人,1989中所述的用来将DNA序列接合在一起 的重组DNA技术和方法接合在一起的DNA序列的组合。
[0163] "基因修饰"是重组DNA修饰的结果,意指生物经重组修饰,与尚未经基因修饰的野 生型生物相比,产生修饰的特征。
[0164] "转基因"指已经通过转化引入基因组中并且稳定维持的基因。转基因可W例如包 括相对于待转化的特定植物的基因为异源或同源的基因。另外,转基因可W包含插入非天 然生物中的天然基因,或嵌合基因。术语"内源基因"指在生物的基因组中处于其天然位置 的天然基因。"外来"基因指通常情况下不存在于宿主生物中、但通过基因转移引入的基因。
[0165] 如本文所用的术语"异源DNA分子"或"异源核酸"各自指运样的分子,所述分子源 自相对于特定宿主细胞为外来的来源或如果源自相同来源,则从原始形式修饰而来。因此, 宿主细胞中的异源基因包括相对于特定宿主细胞为内源、但已经通过例如使用DNA改组法 修饰的基因。运些术语还包含天然存在DNA
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1