用于修改基因转录的组合物和方法

文档序号:3586749阅读:422来源:国知局
专利名称:用于修改基因转录的组合物和方法
技术领域
本发明涉及从植物中分离的组合物以及它们在修改基因转录和/或表达中的用途。更具体地说,本发明涉及编码作为细胞转录装置的组件的转录因子的植物聚核苷酸序列以及所述聚核苷酸序列在修改基因表达中的用途。
背景技术
真核基因表达在某种程度上由参与转录的细胞过程调节。在转录期间,通过RNA 聚合酶的作用形成与待转录DNA序列互补的单股RNA。真核细胞中转录的起始由位于待转录基因上游的顺式作用DNA基元与反式作用蛋白因子之间的复杂相互作用调节。顺式作用调节区域中有称为启动子的DNA序列,所述启动子位于接近转录起始位点处并且RNA聚合酶首先直接或间接地结合于所述启动子。启动子通常由近端(例如TATA盒)和较远端元件(例如CCAAT盒)组成。增强子为顺式作用DNA基元,其可位于距离起始位点较远的上游和/或下游。
启动子和增强子一般都包含若干个分离的、往往多余的元件,这些元件各自可被一或多个称为转录因子的反式作用调节蛋白识别。在所有处于发育中的生物体中,在空间和时间上观测到的复杂基因表达模式的调节被认为是由与增强子和启动子结合的、一般的并且具有组织特异性的转录因子与DNA的相互作用所致(伊泽T(Izawa T)、福斯特 R(Foster R)和蔡 NH(Chua NH),分子生物学杂志(J. Mol. Biol.) 230 :1131-1144,1993 ;Π 肯斯AE(Menkens AE)、辛德勒U (Schindler U)和卡什莫尔AR (Cashmore AR),生物化学趋势 (Trends in Biochem. Sci.) 13 :506-510,1995)。如黑腹果妮(Drosophila melanogaster)、 酿酒酵母(Saccharomyces cerevisiae)、拟南芥(Arabidopsis thaliana)及福射松(Pinus radiata)的多种生物体中的发育决定都由转录因子调节。已显示这些结合DNA的调节分子控制负责以下作用的基因的表达不同细胞类型的分化,例如拟南芥中的叶毛状体和木质部组织的分化、爪蟾(Xenopus Iaevis)中由胚细胞形成内胚层;以及植物对环境和植物激素应力作出响应而起始基因表达(柳泽S(Yanagisawa S)和辛J(Sheen J),植物细胞(The PlantCell)10 :75-89,1998)。
转录因子一般以序列特异性方式结合DNA并且活化或抑制转录起始。这些相互作用的特定机制仍有待充分阐释。在转录因子内已鉴别至少3个独立的结构域。一个对序列特异性DNA识别必不可少,一个对转录起始的活化/抑制必不可少,还有一个对蛋白质-蛋白质相互作用(诸如二聚)的形成必不可少。迄今已鉴别参与DNA顺序识别和/或转录因子二聚的4个基元或结构域锌指;螺旋-转折-螺旋;亮氨酸拉链;和螺旋-环-螺旋。螺旋-环-螺旋和亮氨酸拉链蛋白基元都因其容易在活体内形成同型二聚体或异型二聚体的能力而牵涉到转录因子与DNA的结合中。“活化””结构域富含脯氨酸、谷氨酰胺或酸性氨基酸。已提出,转录因子的这个净负区域与结合TATA盒的转录因子TFIID、RNA聚合酶和/或与转录装置相关的另一蛋白质相互作用。
研究表明,许多植物转录因子可基于其保守的DNA结合结构域而分成不同类别 (片桐F (Katagiri F)和蔡NH(Chua NH),遗传学趋势(Trends Genet.) 8 :22-27,1992 ;门肯斯AE(Menkens AE)、辛德勒U (Schindler U)以及卡什莫尔AR (Cashmore AR),生物化学趋势 (Trends in Biochem. Sci.) 13 :506-510,1995 ;马丁C(Martin C)和帕斯阿雷斯 J (Paz-Ares J),遗传学趋势(Trends Genet.) 13 :67_73,1997)。这些家族的各成员与受不同调节信号控制的多个基因启动子中通常发现的不同DNA序列基元相互作用并且结合。以下描述迄今已鉴别的若干类转录因子。
碱性/亮氨酸拉链(bZIP)是由碱性/亮氨酸拉链(bZIP)基元定义的保守的转录因子家族(兰德斯舒尔茨(Landschultz)等人,科学(Science) 240 :1759-1764,1988 ;麦克奈特(McKnight),科学美国人(Sci. Am.) 264 =54-64,1991 ;福斯特(Foster)等人,美国实验生物学联合会会刊(FASEB J.)8[2] :192-200,1994)。基因表达的转录调节是由bZIP和其他家族的转录因子通 过与相应基因的启动子区域中存在的调节元件相互作用的序列特异性转录因子的协同作用所介导的。bZIP双向DNA结合结构由与亮氨酸拉链相邻的富含碱性氨基酸的区域(碱性区域)组成,所述区域的特征在于若干个亮氨酸残基以7个氨基酸的间隔有规律地隔开(文森(Vinson)等人,科学(Science) 246 =911-916,1989)。尽管碱性区域直接接触DNA,但亮氨酸拉链通过两个α -螺旋的疏水性二聚界面的平行相互作用而介导蛋白质单体的同型二聚和异型二聚,从而产生卷曲的螺旋结构(奥歇(O' Shea)等人, 科学(Science) 243 :538-542,1989 ;科学(Science) 254 :539-544,1991 ;胡(Hu)等人,科学 (Science) 250 :1400-1403,1990 ;拉斯马森(Rasmussen)等人,美国国家科学院院报(Proc. Natl. Acad. Sci. USA)88 :561-564,1991)。
Dof蛋白是相对较新的一类转录因子,并且被认为可介导对一些植物基因表达模式的调节,所述调节在某种程度上是通过bZIP蛋白与结合到紧密连接位点的其他类型的转录因子之间的组合相互作用来实现。已在bZIP与Dof转录因子之间观察到这种组合相互作用的此种实例(辛格(Singh),植物生理学(Plant Physiol.) 118 :1111-1120,1998)。 这些Dof蛋白具有在植物中高度保守的单锌指DNA结合结构域(柳泽(Yanagisawa),植物科学趋势(Trends Plant Sci.) I :213,1996)。已证明Dof蛋白与bZIP转录因子的特异性结合并且已提出,这种特异性相互作用刺激bZIP与植物启动子中的DNA目标序列的结合 (陈(Chen)等人,植物杂志(Plant J.) 10 =955-966,1996) 0在该文献中已经报告过此种 Dof/bZIP相互作用的实例,包括例如已显示含有若干个与ocs元件(已识别的bZIP结合位点)紧密连接的Dof结合位点的拟南芥谷胱甘肽S-转移酶-6基因(GST6)启动子(辛格 (Singh),植物生理学(Plant Physiol.) 118 :1111-1120,1998)。
来自芥菜属的bZIP家族的G盒结合因子(例如,包括GBF1、GBF2和GBF3)与回文 G盒基元(CCACGTGG)相互作用。然而,已证明这些转录因子(例如GBF1)的DNA结合特异性可能受侧接于ACGT核心的核苷酸的性质影响(辛德勒(Schindler)等人,欧洲分子生物学学会杂志(EMBO J.), 11 :1274-1289,1992a)。活体内暂时性转基因植物表达研究已显示,这些ACGT元件是最大转录活化所必需的,并且已在受各种环境、生理和环境提示调节的许多植物基因中得到鉴别。基于这些转录因子结合到ACGT核心基元的能力对它们进行的分类产生一组相对多样的蛋白质,包括例如CamV 35S启动子as_l_结合蛋白,所述蛋白质展现和与G盒相互作用的那些蛋白质不同的DNA结合位点需求(塔巴塔(Tabata)等人,欧洲分子生物学学会杂志(EMBO J. ) 10 =1459-1467,1991) ο因此,除了基于bZIP蛋白的DNA结合特异性来定义bZIP蛋白的个别类别以外,还可以根据它们的异型二聚特征将所述蛋白质分类(曹(Cao)等人,基因与发育(Genes Dev.), 5 :1538-1552,1991 ;辛德勒(Schindler) 等人,欧洲分子生物学学会杂志(EMBO J.) 11 :1261-1273,1992b)。
环境诱导型启动子需要存在两个对启动子活性非常重要的顺式作用元件,其中之一是中等保守的G盒(CCACGTGG)(德威顿(deVetten)等人,植物细胞(Plant Cell) 4 [10] 1295-1307,1992)。两个元件之一的突变消除或严重降低了启动子对环境变化作出响应的能力。位于G盒附近的第二顺式作用元件的序列在不同环境诱导型启动子之间不保守,但在由相同信号诱导的启动子之间可能相似。G盒与第二顺式作用元件之间的间距似乎非常重要,表明各别结合因子之间的直接相互作用(德威顿(deVetten)和福尔(Ferl),国际生物化学期刊(Int. J. Biochem.) 26 [9] 1055-1068,1994 ;拉玛钱德朗(Ramachandran)等人, 遗传学与发育新见(Curr. Opin. Genet. Dev. )4[5] :642-646,1994)。
碱性螺旋-环-螺旋拉链蛋白代表了文献中所述的另外一类bZEP转录因子,并且包括例如Myc蛋白。这些蛋白质含有转录因子的两个特征区域由若干个磷酸化位点组成的N末端转录活化域,以及已知通过3个不同结构域(亮氨酸拉链、螺旋-环-螺旋和碱性区域)介导二聚和序列特异性DNA结合的C末端碱性螺旋-环-螺旋(bHLH)亮氨酸拉链基兀。
Myb家族的转录因子是在植物和动物中发现的一组功能多样的转录活化子,其特征为含有2个(在植物物种中)或3个(在动物物种中)具有约50个氨基酸的不完美串联重复序列的保守氨基末端DNA结合结构域(罗辛斯基(Rosinski)和阿切利(Atchley), 分子进化杂志(J. Mol. Evol.) 46 (I) :74-83,1998 ;斯托伯-格拉瑟(Stober-Grasser)等人,致癌基因(Oncogene) 7[3] :589_596,1992)。代表性植物和哺乳动物MYB蛋白的氨基酸序列之间的比较表明,与在来自相同蛋白质的R2和R3重复序列之间相比,在来自不同蛋白质的相同重复序列之间存在更大的保守程度(马丁(Martin)和帕斯阿雷斯(Paz-Ares),遗传学趋势(Trends Genet.) 13 [2] :67_73,1997)。已报告来自拟南芥的超过100种MYB基因(罗梅罗(Romero)等人,植物杂志(Plant J. )14[3] :273_284,1998),代表植物中目前已知的最大的调节基因家族。DNA结合研究已显示,在植物MYB蛋白之间结合特异性存在差异以及频繁的重叠,与开始针对这些蛋白质所识别的不同但通常相关的功能一致。涉及 MYBDNA结合结构域中的8个假定碱基接触残基的研究已揭露,至少6个在迄今已鉴别的所有植物MYB蛋白中是完全保守的,而其余2个在至少80%的这些蛋白质中是保守的(马丁 (Martin)和帕斯阿雷斯(Paz-Ares),遗传学趋势(Trends Genet.) 13 [2] :67-73,1997)。涉及不接触碱基的残基的突变分析已指出,MYB的序列特异性结合能力受到影响并且由此可解释植物MYB蛋白质之间DNA结合特异性的一些差异(沙拉拿(Solano)等人,生物化学杂志(J. Biol. Chem.) 272 [5] :2889_2895,1997)。这个大型基因家族可能促成作为植物所呈现的发育和代谢可塑性的基础的调节灵活性。
同源转录因子在动物中已牵涉到许多发育过程中,包括例如控制昆虫和脊椎动物胚胎中的模式形成以及规定许多组织中的细胞分化(英厄姆(Ingham),自然(Nature) 335 25-34,1988 ;麦金尼斯(McGinnis)和克伦劳夫(Krumlauf),细胞(Cell)68 :283-302, 1992)。同源结构域二级结构的特征在于最初在细菌DNA结合结构域中鉴别的独特的螺旋-转折-螺旋基元。这种螺旋-转折-螺旋序列/结构基元跨越约20个氨基酸,并且特征为由急剧的90度弯曲或转折分开的两个短螺旋(哈里森(Harrison)和艾嘉(Aggarwal), 生物化学年鉴(Ann. Rev. Biochem.) 59 =933-969,1990)。已证明这种螺旋结合在DNA螺旋的大沟中。
已在许多植物物种中鉴别了植物同源盒基因,包括拟南芥、玉米、香芹和大豆。对玉米同源盒基因家族成员的表达模式分析表明,这些转录因子可参与定义营养顶端分生组织中的特定区域,所述营养顶端分生组织可能参与叶结构的起始(杰克逊(Jackson)等人, 发育(Development) 120 :405_413,1994)。所述观察暗示,与动物同源盒基因相同,植物同源盒基因可参与决定细胞命运。
同源结构域-拉链(HD-zip)代表了另外一个同源结构域蛋白家族。这些同源结构域-拉链蛋白(HD-zip)具有连接到另外的亮氨酸拉链二聚基元的特征同源结构域。这个家族包括例如Athb-I和Athb-2(赛莎(Sessa)等人,欧洲分子生物学学会杂志(ΕΜΒ0 J. ) 12 :3507-3517,1993)以及 Athb-4(卡拉贝利(Carabelli)等人,植物杂志(Plant J. )4 =469-479,1993)。
LIM结构域是在多种蛋白质中发现的一个特殊化双锌指基元,与具有别异功能的结构域(如同源结构域)相关联(参见向日葵花粉特异性SF3转录因子鲍尔兹(Baltz) 等人,植物杂志(Plant J.) 2 :713-721,1992 ;或形成主要包含UM结构域的蛋白质戴维 (Dawid)等人,遗传学趋势(Trends Genet.) 14[4] : 156-162,1998)。LIM 结构域特异性地与其他UM结构域并且与许多不同的蛋白质结构域相互作用。LIM结构域被认为充当蛋白质相互作用模块,介导功能性复合物成员之间的特异性接触并且调整一些组成蛋白质的活性。LIM结构域的核酸结合虽然已由结构因素表明,但仍是一种未被证明的可能性。然而,存在以下可能=LIM结构域可与同源结构域一起结合到发育受控制的基因的调节区域, 如已针对配对盒提出,所述配对盒是最先在来自果蝇的配对(PRD)和醋栗(GSB)同源结构域蛋白中鉴别的保守序列基元(特里斯曼(Triesman)等人,基因与发育(Genes Dev. )5 594-604,1991) o PRD盒还能够在不存在同源结构域的情况下结合DNA。UM结构域蛋白可为核蛋白、细胞质蛋白或可在隔室之间芽梭。在动物系统中,已显不若干种重要的LIM蛋白与细胞骨架相关联,从而在粘着斑和肌动蛋白-微丝组构中具有一定作用。在核LIM蛋白之间,LIM同源结构域蛋白形成在动物发育期间的细胞谱系决定和模式形成中具有重要功能的一个主要的子家族。
AP2 (APETALA2)和EREBP (乙烯响应性元件结合蛋白)是植物特有的转录因子家族的原型成员,其独特特征在于其含有所谓的AP2DNA结合结构域。AP2/EREBP基因形成一个大的多基因家族,并且它们在整个植物生命周期中起着多种作用从作为若干个发育过程的关键调节子,如花的器官身份决定或叶表皮细胞身份控制,到形成植物用于对各种类型的生物和环境应力作出响应的机制的一部分。在拟南芥中,已显示同源基因APETALA2 (AP2) 控制发育期间的3个突出过程(I)规定花器官身份和调节花的器官发生(徐福(Jofuku) 等人,植物细胞(Plant Cell)6 :1211-1225,1994) ; (2)确定花分生组织身份(艾里什 (Irish)和苏赛克斯(Sussex),植物细胞(Plant Cell) 2 [8] :741-753,1990);以及(3)花同源基因活性的时间和空间调节(德鲁斯(Drews)等人,细胞(Cell)65[6] =991-1002,1991)。DNA序列分析表明AP2编码具有432个aa的理论多肽,其中独特的68aa重复基元称为AP2结构域。已显示这个结构域对AP2功能必不可少,并且在68个aa内含有预计可形成两性Ct-螺旋的18个氨基酸核心区(徐福(Jofuku)等人,植物细胞(Plant Cell) 6 1211-1225,1994)。通过鉴别乙烯响应性元件结合蛋白(EREBP),在拟南芥(冈室(Okamuro) 等人,美国国家科学院院报(Proc. Natl. Acad. Sci. USA)94 :7076-7081,1997)和烟草中还鉴别出含有Ap2样结构域的转录因子(高木野(Ohme-Takagi)和新稀(Shinshi),植物细胞(Plant Cell)7[2] : 173-182,1995)。在芥菜属中,这些RAP2 (与AP2相关)基因编码两个独特的含有AP2结构域的蛋白质的子家族,称为AP2样和EREBP样(冈室(Okamuro)等人,美国国家科学院院报(Proc. Natl. Acad. Sci. USA) 94 =7076-7081,1997)。迄今使用 RAP2 蛋白质尚未显不体外DNA结合;然而,基于AP2结构域内存在两个闻度保守的基兀YRG和 RAYD,已提出结合DNA结合以类似于AP2蛋白的方式发生。
Cys2His2型锌指结构域似乎代表了真核转录因子中最丰富的DNA结合基元,迄今已鉴别出数千个(伯格(Be rg)和史(Shi),科学(Science) 271 [5252] : 1081-1085,1996)。 最初在1983年针对转录因子IIIA(TFIIIA)提出锌在转录因子中的结构作用(汉纳斯 (Hanas)等人,生物化学杂志(J Biol. Chem.) 258 [23] : 14120-14125,1983)。Cys2His2 锌指结构域的特征在于C-x (2,4) -C-X (3) -[LIVMFYWC] -χ⑶_Η_χ (3,5) -H的串联序列阵列(其中X表示可变氨基酸)。在结构上,锌指由两个反向平行的β股和之后的α螺旋组成(李 (Lee)等人,科学(Science) 245 [4918] :635_637,1989)。这种结构配置允许半胱氨酸和组氨酸侧链使锌与3个其他保守残基配位,从而形成与金属配位单元相邻的疏水性核心(伯格(Berg)和史(Shi),科学(Science) 271 [5252] : 1081-1085,1996)。已显示具有 Cys2His2 结构域的许多蛋白质以序列特异性方式与DNA相互作用。结合到特定DNA目标的小鼠转录因子Zif268的晶体结构分析表明蛋白质/DNA复合物中的锌指存在于双螺旋的大沟中,并且通过称为接触残基的氨基酸侧链与DNA碱基相互作用(帕夫里奇(Pavletich)和帕伯 (Pabo),科学(Science) 252 [5007] :809-817,1991)。锌指结构域相对于DNA的定向通常一致,其中各结构域接触连续的三碱基对亚位点,所述连续的三碱基对亚位点中大部分是针对一个股。存在极少的结构域间相互作用,并且各锌指的DNA识别似乎在很大程度上与其他结构域无关(伯格(Berg)和史(Shi),科学(Science) 271 [5252] : 1081-1085,1996)。
已显示杰利纳斯(Gelinas)等人(自然(Nature)313 [6000] :323-325,1985)所鉴别的CCAAT盒元件出现在从转录起始位点开始的第80个碱基对与第300个碱基对之间, 并且可以任一定向操作,可能与多个盒(塔萨宁(Tasanen)等人,生物化学杂志(J Biol. Chem.) 267 [16] :11513-11519,1992);或其他保守基元(穆罗(Muro)等人,生物化学杂志 (J. Biol. Chem.) 267 [18] : 12767-12774,1992 ;里耶平(Rieping)和斯科夫(Schoffl),分子遗传学与普通遣传学(Mol. Gen. Genet.) 231 [2] =226-232,1992)发生协同相互作用。已在包括以下的多种生物体中的许多启动子中鉴别出CCAAT盒相关基元酵母(哈林(Halin) 等人,科学(Science) 240[4850] :317_321,1988)、大鼠(麦蒂(Maity)等人,美国国家科学院院报(Proc. Natl. Acad. Sci. USA) 87 [14] :5378_5382,1990 ;沃里奥(Vuorio)等人,生物化学杂志(J. Biol. Chem.) 265 [36] =22480-22486,1990);以及植物(里耶平(Rieping) 和斯科夫(Schoffl),分子与普通遗传学(Mol. Gen. Genet.) 231 [2] :226_232,1992 ;基欧 (Kehoe)等人,植物细胞(Plant Cell)6[8] :1123-1134,1994) 在酵母和脊椎动物中,已显示蛋白质复合物结合CCAAT基元。在酵母中,所述复合物由被称为HAP2、HAP3以及HAP5 的3种蛋白质组成(平卡姆(Pinkham)和瓜伦特(Guarente),分子细胞生物学(Mol. Cell. Biol.)5[12] :3410-3416,1985)。
MADS盒转录因子与被称为MADS盒的DNA保守区域相互作用。所有MADS盒转录因子都含有被称为MADS结构域的保守DNA结合/ 二聚区域,所述结构域已在不同的自然界中鉴别出(里耶希曼(Riechmann)和迈耶罗维茨(Meyerowitz),生物化学(Biol. Chem. )378[10] :1079-1101,1997)。从植物中分离的许多MADS盒基因主要在花分生组织或花器官中表达,并且据信在规定花序和花分生组织身份或决定花器官身份方面起一定作用。负责花分生组织身份和分生组织发育模式的一类调节基因包括来自拟南芥的基因 APETALAI (API)、APETALA2 (AP2)、CAULIFLOWER (CAL)、LEAFY (LFY)以及 AGAM0US (AG)。已显示LFY和API都编码假定转录因子(威格尔(Weigel)等人,细胞(Cell) 69 :843-859,1992),而API和AG各自编码MADS盒结构域家族的假定转录因子(亚诺夫斯基(Yanofsky) 等人,自然(Nature) 346 :35_39,1990)。已显示Lfy基因的突变引起花部分转化成花序芽。 发明内容
简而言之,本发明提供从植物中分离的编码转录因子的聚核苷酸以及由所述聚核苷酸编码的多肽。本发明的分离的聚核苷酸和多肽可有效地用于修改植物中的基因表达, 因为已显示组织和时间特异性基因表达模式在植物的自然发育期间受转录因子支配。本发明的聚核苷酸和多肽因此可用于操纵植物表型。
在第一个方面,本发明提供从桉树和松树中分离的聚核苷酸,所述聚核苷酸编码转录因子,包括来自以下调节蛋白家族的转录因子bZIP ;bZIP家族的G盒结合因子;碱性螺旋-环-螺旋拉链(bHLH);同源/同源结构域/同源盒/MADS ;同源结构域拉链(ZIP); LIM结构域;AP2和EREB ;Cys2His2型锌指结构域;CCAAT盒元件;以及MYB。在特定实施例中,本发明的分离的聚核苷酸包含选自由以下所组成的群组的DNA序列(a)SEQ ID NO 1-591、1183-1912、1931-2106、2371、2374、2377、2385、2387、2389、2391、2393、2395、2397、 2399、2401、2403、2405、2407、2409、2411、2413、2415、2417、2419 和 2421 中所述的序列;(b)鉴别为 SEQ ID NO :1-591、1183-1912、1931-2106、2371、2374、2377、2385、2387、2389、2391、2393、2395、2397、2399、2401、2403、2405、2407、2409、2411、2413、2415、2417、2419 和 2421 的序列的互补序列;(c)鉴别为 SEQ ID NO :1-591、1183-1912、1931_2106、2371、2374、 2377、2385、2387、2389、2391、2393、2395、2397、2399、2401、2403、2405、2407、2409、2411、 2413、2415、2417、2419和2421的序列的反向互补序列;(d)鉴别为SEQ ID NO 1-591, I183-1912、1931-2106、2371、2374、2377、2385、2387、2389、2391、2393、2395、2397、2399、2401、2403、2405、2407、2409、2411、2413、2415、2417、2419和 2421 的序列的反向序列;以及 (e)与(a)到(d)的序列具有60%、75%、80%、90%或95%—致性(如本文所定义)的序列。
在另一个方面,提供由本发明的聚核苷酸编码的分离的多肽。在特定实施例中,所述多肽包含选自由以下所组成的群组的氨基酸序列(a) SEQ ID NO SEQ ID NO =592-1182, 1913-1930、2107-2278、2372、2375、2378、2386、2388、2390、2392、2394、2396、2398、2400、2402、2404、2406、2408、2410、2412、2414、2416、2418、2420和 2422 中所提供的序列;和(b) 与(a)的序列具有60%、75%、80%、90%或95%—致性(如本文所定义)的序列。
在另一个方面,本发明提供从桉树和松树中分离的多肽,所述多肽包含转录因子 DNA结合结构域。在特定实施例中,所述多肽包含选自由以下所组成的群组的氨基酸序列 (a) SEQ ID NO :2279-2293和2296-2368中所提供的序列;和(b)与(a)的序列具有60%、 75%、80%、90%或95%—致性(如本文所定义)的序列。
在另一个方面,本发明提供基因构建体,所述基因构建体包含单独、与一或多种本文所公开的其 他聚核苷酸组合或与一或多种已知DNA序列组合的本发明聚核苷酸;以及包含所述构建体的经转化细胞。
在特定实施例中,本发明基因构建体在5' -3'方向上包含基因启动子序列;编码由本发明聚核苷酸编码的多肽的至少一个功能部分的开放阅读框或其变异体;以及基因终止序列。开放阅读框可定向成有义或反义方向。还提供包含以下的基因构建体编码本发明转录因子多肽的聚核苷酸的未转译或非编码区域,或与未转译区域互补的核苷酸序列, 以及基因启动子序列和基因终止序列。优选地,基因启动子和终止序列是宿主植物中的功能序列。最优选地,基因启动子和终止序列是原始基因的序列,但本领域中一般使用的其他序列可有效地用于本发明,如花椰菜花叶病毒(Cauliflower Mosaic Virus, CMV)启动子, 存在或不存在增强子(如科扎克序列(Kozak sequence)或Ω增强子(Omegaenhancer)), 以及根癌土壤杆菌(Agrobacterium tumefaciens)胭脂碱合成酶终止子。可使用组织特异性启动子以便将表达靶向一或多个所要组织。基因构建体可更包括用于鉴别经转化细胞的标记物。
在又另一个方面,提供包含本发明的基因构建体的转基因细胞和包含所述转基因细胞的生物体,如植物。本发明还预期并且涵盖所述转基因植物的果实、种子、衍生物、子代、繁殖体和其他产品。如本文所用,术语“繁殖体”的意思是可用于再生或繁殖(有性或无性)的任何植物部分,包括插条。
在又另一个方面,提供用于修改目标生物体中的基因表达的方法,所述方法包括将本发明的基因构建体稳定地并入所述生物体的基因组中。在一个优选实施例中,目标生物体是植物,优选木本植物,更优选为选自由桉树和松树物种所组成的群组,并且最优选为选自由巨桉(Eucalyptus grandis)和福射松(Pinus radiata)组成的群组。在一个相关的方面,提供用于产生具有经修改的基因的目标生物体(如植物)的方法,所述方法包括用本发明的基因构建体转化植物细胞以提供转基因细胞并且在有助于再生和成熟植物生长的条件下培养转基因细胞。
本发明更提供用于修改目标生物体(如植物)中转录因子的活性的方法,所述方法包括将本发明的基因构建体稳定地并入植物的基因组中。在一个优选实施例中,目标植物是木本植物,优选为选自由桉树和松树物种所组成的群组,并且最优选为来自由巨桉和辐射松组成的群组。
通过参考以下更具体的实施方式,本发明的上述和另外特征以及获得所述特征的方式将显而易见,并且将最透彻地理解本发明。本文所公开的所有参考文献都以全文引用的方式并入本文中,就如同各参考文献被个别地并入一般。


图I描述所得质粒pWVK249的图,所述质粒是用于转化植物的二元载体并且对应于 SEQ ID 2373o
图2描述来自对照和经过PWVK249转化的三角叶杨的木材的基本比重的图表。水平线指示各组的平均值。对照和PWVK249线之间的差异在5%水平下显著。
具体实施方式
本发明提供编码植物转录因子的分离的聚核苷酸以及由所述聚核苷酸编码的分离的多肽。如上文所讨论,转录因子是细胞“转录装置”的组件并且参与基因表达的调节。 已知转录因子在植物生长发育和对外界刺激(如环境因素和疾病病原体)的细胞反应方面起重要作用。用编码参与细胞转录过程的蛋白质的聚核苷酸转化植物因此可用于修改多种性质,如木质素沉积、花发育以及雄性和雌性不育。
调节次生木质部或木材中的导管或纤维细胞形成的转录因子可用于改变木材的特征。如果转录因子上调参与木质素生物合成的基因,那么过度表达所述转录因子可以增加木材中木质素的量,而抑制或敲低所述转录因子可降低木材中木质素的量。某些转录因子抑制参与木质素形成的基因的表达,并且这些调节蛋白中的一者的过度表达将导致木质素减少。来自金鱼草的AmMYB308的过度表达导致转基因烟草中的木质素减少(塔玛格侬 (Tamagnone)等人,植物细胞(Plant Cell) 10 :135_154,1998)。高木质素含量的木材潜在地适用作燃料以供燃烧或转化成木炭,而低木质素含量的木材可用于制浆或转化成乙醇。 上调参与细胞壁生物合成的整组基因的转录因子可用于改变细胞壁的厚度和木材的密度。 转录因子过度表达可使细胞壁生物合成基因的产量增多或产生时间延长,从而产生更厚的细胞壁和更致密并且更强壮的木材。戈伊科切亚(Goicoechea)和合作者显示,桉树MYB基因在烟草中过度表达产生更厚的细胞壁以及改变的木质素组成(植物杂志(Plant J.)43 553-567,2005)。
使用本发明的方法和材料,可以通过将编码特定转录因子的聚核苷酸或所述聚核苷酸的片段的另外拷贝并入目标生物体(如植物)的基因组中来增加或减少所述转录因子的量。类似地,转录因子的量的增加或减少可通过用所述基因的反义拷贝来转化目标植物而获得。
在一个实施例中,本发明提供编码或部分编码参与基因表达调节的植物转录因子的分离的聚核苷酸。本发明的聚核苷酸是从林业植物来源,即从巨桉和辐射松中分离,但作为替代方案,其可使用常规合成技术合成。在特定实施例中,本发明的分离的聚核苷酸包含选自由以下所组成的群组的序列:鉴别为SEQ ID NO :1-591、1183-1912、1931-2106、 2371、2374、2377、2385、2387、2389、2391、2393、2395、2397、2399、2401、2403、2405、2407、 2409、2411、2413、2415、2417、2419 和 2421 的序列;鉴别为 SEQ ID NO :1-591、1183_1912、 1931-2106、2371、2374、2377、2385、2387、2389、2391、2393、2395、2397、2399、2401、2403、2405、2407、2409、2411、2413、2415、2417、2419 和 2421 的序列的互补序列;鉴别为 SEQ ID NO :卜591、1183-1912、1931-2106、2371、2374、2377、2385、2387、2389、2391、2393、2395、 2397、2399、2401、2403、2405、2407、2409、2411、2413、2415、2417、2419 和 2421 的序列的反向互补序列;鉴别为 SEQ ID NO :1-591、1183-1912、1931-2106、2371、2374、2377、2385、 2387、2389、2391、2393、2395、2397、2399、2401、2403、2405、2407、2409、2411、2413、2415、 2417、2419和2421的序列的反向序列;至少包含任何上述聚核苷酸的规定数目的连续残基 (χ聚体)的序列;对应于任何以上聚核苷酸的延伸序列;对应于任何以上聚核苷酸的反义序列;以及任何以上聚核苷酸的变异体,所述术语在本说明书中描述。
在另一个实施例中,本发明提供由SEQ ID NO :1-591、1183-1912、1931-2106、 2371、2374、2377、2385、2387、2389、2391、2393、2395、2397、2399、2401、2403、2405、2407、 2409、2411、2413、2415、2417、2419和2421的聚核苷酸所编码的分离的多肽。在某些特定实施例中,所述分离的多肽包含选自由以下所组成的群组的序列SEQ ID NO =592-1182, 1913-1930、2107-2278、2372、2375、2378、2386、2388、2390、2392、2394、2396、2398、2400、 2402、2404、2406、2408、2410、2412、2414、2416、2418、2420 和 2422。
本发明的聚核苷酸和多肽已证明与已知参与植物中转录和/或表达调节的转化因子的相似性,如以下表I中所示。
表I
权利要求
1.一种分离的聚核苷酸,其包含选自由以下组成的群组的序列SEQ ID NO :1-591, I183-1912、1931-2106、2371、2374、2377、2385、2387、2389、2391、2393、2395、2397、2399、2401、2403、2405、2407、2409、2411、2413、2415、2417、2419 和 2421。
2.一种分离的聚核苷酸,其包含选自由以下组成的群组的序列(a)序列SEQ ID NO :1_591、1183-1912、1931_2106、2371、2374、2377、2385、2387、2389、 2391、2393、2395、2397、2399、2401、2403、2405、2407、2409、2411、2413、2415、2417、2419 和 2421的互补序列;(b)序列SEQ ID NO :1-591、1183-1912、1931-2106、2371、2374、2377、2385、2387、2389、 2391、2393、2395、2397、2399、2401、2403、2405、2407、2409、2411、2413、2415、2417、2419 和 2421的反向互补序列;以及(c)序列SEQ ID NO :1-591、1183-1912、1931-2106、2371、2374、2377、2385、2387、2389、 2391、2393、2395、2397、2399、2401、2403、2405、2407、2409、2411、2413、2415、2417、2419 和 2421的反向序列。
3.一种分离的聚核苷酸,其包含选自由以下组成的群组的序列(a)与序列SEQ ID NO :1-591、1183-1912、1931-2106、2371、2374、2377、2385、2387、 2389、2391、2393、2395、2397、2399、2401、2403、2405、2407、2409、2411、2413、2415、2417、 2419和2421具有至少75%—致性的核苷酸序列;(b)与序列SEQ ID NO :1-591、1183-1912、1931-2106、2371、2374、2377、2385、2387、 2389、2391、2393、2395、2397、2399、2401、2403、2405、2407、2409、2411、2413、2415、2417、 2419和2421具有至少90%—致性的核苷酸序列;(c)与序列SEQ ID NO :1-591、1183-1912、1931-2106、2371、2374、2377、2385、2387、 2389、2391、2393、2395、2397、2399、2401、2403、2405、2407、2409、2411、2413、2415、2417、 2419和2421具有至少95%—致性的核苷酸序列;(d)在严格杂交条件下与序列SEQ ID NO :1-591、1183-1912、1931-2106、2371、2374、 2377、2385、2387、2389、2391、2393、2395、2397、2399、2401、2403、2405、2407、2409、2411、 2413、2415、2417、2419和2421杂交的核苷酸序列;(e)是序列SEQ ID NO :1-591、1183-1912、1931-2106、2371、2374、2377、2385、2387、 2389、2391、2393、2395、2397、2399、2401、2403、2405、2407、2409、2411、2413、2415、2417、 2419和2421的200聚体的核苷酸序列;(f)是序列SEQ ID NO :1-591、1183-1912、1931-2106、2371、2374、2377、2385、2387、 2389、2391、2393、2395、2397、2399、2401、2403、2405、2407、2409、2411、2413、2415、2417、 2419和2421的100聚体的核苷酸序列;(g)是序列SEQ ID NO :1-591、1183-1912、1931-2106、2371、2374、2377、2385、2387、 2389、2391、2393、2395、2397、2399、2401、2403、2405、2407、2409、2411、2413、2415、2417、 2419和2421的40聚体的核苷酸序列;以及(h)是序列SEQ ID NO :1-591、1183-1912、1931-2106、2371、2374、2377、2385、2387、 2389、2391、2393、2395、2397、2399、2401、2403、2405、2407、2409、2411、2413、2415、2417、 2419和2421的20聚体的核苷酸序列;以及(i)通过简并等于序列SEQ ID NO :1-591、1183-1912、1931-2106、2371、2374、2377、.2385、2387、2389、2391、2393、2395、2397、2399、2401、2403、2405、2407、2409、2411、2413、 2415、2417、2419和2421的核苷酸序列,其中所述分离的聚核苷酸编码转录因子。
4.一种寡核苷酸探针或引物,其包含至少10个与序列SEQ ID NO :1-591、1183-1912和 1931-2106的10个连续残基互补的连续残基。
5.一种分离的多肽,其由根据权利要求I到3中任一权利要求所述的聚核苷酸编码。
6.一种分离的多肽,其包含选自由以下组成的群组的胺基酸序列SEQ ID NO 592, 594-850、852-930、932-951、953-1046、1048-1182、1913-1930、2107-2293、2296-2368、 2372、2375、2378、2386、2388、2390、2392、2394、2396、2398、2400、2402、2404、2406、2408、2410、2412、2414、2416、2418、2420 和 2422。
7.一种分离的多肽,其包含选自由以下组成的群组的胺基酸序列(a)与序列SEQ ID NO :592、594-850、852-930、932-951、953-1046、1048-1182、 1913-1930、2107-2293、2296-2368、2372、2375、2378、2386、2388、2390、2392、2394、2396、 2398、2400、2402、2404、2406、2408、2410、2412、2414、2416、2418、2420 和 2422 具有至少 75%—致性的序列;(b)与序列SEQ ID NO :592、594-850、852-930、932-951、953-1046、1048-1182、 1913-1930、2107-2293、2296-2368、2372、2375、2378、2386、2388、2390、2392、2394、2396、 2398、2400、2402、2404、2406、2408、2410、2412、2414、2416、2418、2420 和 2422 具有至少 90%—致性的序列;以及(c)与序列SEQ ID NO :592、594-850、852-930、932-951、953-1046、1048-1182、 1913-1930、2107-2293、2296-2368、2372、2375、2378、2386、2388、2390、2392、2394、2396、 2398、2400、2402、2404、2406、2408、2410、2412、2414、2416、2418、2420 和 2422 具有至少 95% —致性的序列,其中所述分离的多肽充当转录因子。
8.一种分离的聚核苷酸,其编码根据权利要求6和7中任一权利要求所述的多肽。
9.一种基因构建体,其包含根据权利要求I到3中任一权利要求所述的聚核苷酸。
10.一种转基因细胞,其包含根据权利要求9所述的基因构建体。
11.一种基因构建体,其在5' -3'方向上包含(a)基因启动子序列;(b)包含以下至少一者的聚核苷酸序列(1)编码包含序列592、594-850、852-930、 932-951、953-1046、1048-1182、1913-1930、2107-2293、2296-2368、2372、2375、2378、2386、 2388、2390、2392、2394、2396、2398、2400、2402、2404、2406、2408、2410、2412、2414、2416、 2418,2420和2422的多肽的聚核苷酸;以及(2)包含根据权利要求I到3中任一权利要求所述的聚核苷酸或聚核苷酸非编码区的聚核苷酸;以及(C)基因终止序列。
12.根据权利要求11所述的基因构建体,其中开放阅读框是呈有义定向。
13.根据权利要求11所述的基因构建体,其中开放阅读框是呈反义定向。
14.一种转基因植物细胞,其包含根据权利要求9和11中任一权利要求所述的基因构建体。
15.一种植物,其包含根据权利要求14所述的转基因植物细胞;或其果实或种子或繁殖体。
16.根据权利要求15所述的植物,其中所述植物是木本植物。
17.根据权利要求16所述的植物,其中所述植物是选自由桉树、松树、刺槐、白杨、枫香、柚木和桃花心木物种组成的群组。
18.一种用于修改植物中的基因表达的方法,其包括在所述植物的基因组中稳定地并入根据权利要求9和11中任一权利要求所述的基因构建体。
19.根据权利要求18所述的方法,其中所述植物是木本植物。
20.根据权利要求18所述的方法,其中所述植物是选自由桉树、松树、刺槐、白杨、枫香、柚木和桃花心木物种组成的群组。
21.一种用于产生具有经修改的基因表达的植物的方法,其包括(a)用根据权利要求9和11中任一权利要求所述的基因构建体转化植物细胞,以获得转基因细胞;以及(b)在有助于再生和成熟植物生长的条件下培养所述转基因细胞。
22.根据权利要求21所述的方法,其中所述植物是木本植物。
23.根据权利要求22所述的方法,其中所述植物是选自由桉树、松树、刺槐、白杨、枫香、柚木和桃花心木物种组成的群组。
24.一种用于修改植物中的多肽活性的方法,其包括在所述植物的基因组中稳定地并入根据权利要求9和11中任一权利要求所述的基因构建体。
25.根据权利要求24所述的方法,其中所述植物是木本植物。
26.根据权利要求25所述的方法,其中所述植物是选自由桉树、松树、刺槐、白杨、枫香、柚木和桃花心木物种组成的群组。
27.一种分离的多肽,其包含DNA结合结构域,其中所述DNA结合结构域包含选自由SEQ ID NO =2279-2293和2296-2368组成的群组的胺基酸序列。
全文摘要
提供了新颖的分离的聚核苷酸,其编码植物转录因子;以及包含所述聚核苷酸的基因构建体。还公开了使用所述构建体调整内源性和/或异源性基因的表达的方法,以及包含所述构建体的转基因植物。
文档编号C07H21/02GK102985436SQ201180029914
公开日2013年3月20日 申请日期2011年4月19日 优先权日2010年4月19日
发明者玛丽昂·伍德, 迈克尔·A·申克, 安妮特·麦格拉斯, 马修·格伦, 威廉·H·罗特曼, 罗伯特·J·科德奇基 申请人:阿博根公司, 卢比肯森林控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1