编码c3hc4家族植物蛋白质的核酸分子和改变植物纤维素和木素含量的方法

文档序号:439336阅读:795来源:国知局
专利名称:编码c3hc4家族植物蛋白质的核酸分子和改变植物纤维素和木素含量的方法
技术领域
本发明涉及植物生物技术领域。更具体地,本发明涉及通过调 节编码C3HC4蛋白的基因的表达改变纤维素含量。
背景技术
在高等植物的木材形成过程中,大多数在碳水化合物代谢过程 中产生的葡萄糖被传递给纤维素用于次生壁沉积。Djerbi等, Ce〃w/ose 11: 301-12 (2004)。纤维素是由结晶形成微原纤维的直链 p-(l ,4)-连接的葡聚糖分子组成的纤维状聚合物。微原纤维提供纤维 素特有的柔性强度。纤维素在高等植物中是由大的多聚体质膜结合 复合物合成的,这些复合物在微原纤维的末端形成玫瑰花形结构。 Somerville,i ev. CeZ/Dev. 5z'o/. 22: 53-78 (2006)。
纤维素作为纸浆、纤维以及作为合成商业上重要的聚合物的起 点是有价值的。可增加纤维素沉积的改变很可能对木素沉积具有抑 制效应。Hu等,A^wre 5z'o^c/j. 17:808-19 (1999)。木本植物中木素 含量的减少是人们所希望的,因为纤维素的工业生产和木素的化学 去除是昂贵的,并且对环境是一个巨大的挑战。
纤维素的生物合成途径在分子水平上了解很少。来自纤维素合 酶(C^SJ)家族的基因和编码用于N-聚糖合成和加工的蛋白质的基因 已经在大量生物体中分离。Nicol等,五MSO /. 17:5562-76 (1998)。一个大量用于研究木材形成,特别是纤维素合成和沉积的实验
系统是弯曲树木,以使得在茎的拉紧侧形成应拉木(TW)。 Andersson-Gunneras等,P/a打f / 45: 144-65 (2006)。在桉属(五wca(yp,w力 和杨属CPopw/w力的种中,应拉木典型地发生在倾斜的茎的上侧,并
且使树重新定向其轴。应拉木的主要特征是在其腔中具有特别厚的
胶质次生层(G层)的木质部纤维。这种G层几乎只含有具有高结晶度 的纤维素孩£原纤维。D6jardin等,P/aW所o/. 6: 55-64 (2004)。由于应 拉木富含纤维素但是缺乏木素和半纤维素,它可以用来检测和分析 参与控制向木素、纤维素和半纤维素的碳流的基因。
Andersson-Gunneras等(2006)鉴定了在TW中高表达的与细胞壁 形成有关的基因,例如参与碳水化合物代谢和细胞骨架形成的基因, 以及管家基因和两种在欧洲山杨(L.)北美颤杨(Michx)杂交种中具有 未知功能的基因。C3HC4-型锌指(环指)蛋白在TW中显示差异表达, 但是在该研究或其它研究中没有数据暗示其在纤维素生物合成中的 作用。
锌指结构域是结合一个或多个锌原子的相对较小的蛋白质基 序。它们最初被鉴定为光滑爪蟾(Ze"o/ M /aev/力转录因子TFIIIA中 的DNA-结合基序,但是现在被认为结合DNA、 RNA、蛋白质和/或 脂类物质。环指是一种特殊类型的锌指,有40-60个残基,结合两个 锌原子,且可能参与介导蛋白质-蛋白质相互作用。存在两种不同的 变体C3HC4-型和C3H2C3-型。C3HC4-型环指基序在许多细胞和病 毒蛋白质中被发现,其中一些已证明在体内和体外都具有泛素E3连 接酶活性。Laity等,CWr. Opz>2, &o/. 11:39-46 (2001)。
鉴于传统林木育种的困难,例如由于较长的世代周期导致的缓 慢发展,和产生具有理想性状的植物的困难,基因技术的发展可以 明显缩短产生植物新品种所需的时间,并且允许在特定树种中更准 确地靶向被认为是林业和制浆工业所希望的性状。

发明内容
6一方面,本发明提供一种分离的核酸序列,其包含选自下组的
序列(a) SEQIDNO: 1所示的核酸序列或其互补链;(b)编码SEQ ID NO: 2所示的氨基酸序列的核酸序列;(c)在严格条件下能够与(a) 或(b)的核酸序列杂交的核酸序列,其中所述杂交序列编码C3HC4多 肽;(d)作为(a)或(b)的核酸序列的等位基因变体或选择性剪接变体 的核酸;和(e)与(a)或(b)的序列有至少50%、 60%、 70%、 75%、 80%、 85%、 90%或更高的序列同一性的核酸序列。
另一方面,本发明提供一种分离的C3HC4蛋白,其选自(a) SEQ IDNO:2所示的多肽;(b)具有与SEQ ID NO: 2所示的氨基酸序列 有至少85%或更高序列同一性的氨基酸序列的多肽;和(c)如(a)或(b)
中定义的多肽的变体。
另一方面,本发明提供一种核酸构建体,其包含与一个或多个 合适的启动子可操作地连接的分离的C3HC4多核苷酸序列,该启动 子驱动该C3HC4多核苷酸序列的表达。在一个实施方案中,植物细 胞包含该核酸构建体。在进一步的实施方案中,由该植物细胞产生 转基因植物,并且该植物与同种的非转基因植物相比,具有改变的 纤维素和/或木素含量。在再进一步的实施方案中,植物是双子叶植 物、单子叶植物、棵子植物或阔叶树。进一步的实施方案包括该转 基因植物的后代,包括杂种植物。
在另 一方面,本发明提供一种改变植物中的纤维素和/或木素含 量的方法,包括(a)向分离的植物细胞中引入核酸构建体,该核酸 构建体包含与一个或多个合适的启动子可操作地连接的分离的 C3HC4多核普酸序列,该启动子驱动该C3HC4多核苷酸序列的表 达;和(b)在促进植物生长的条件下培养所述植物细胞,其中所述植 物超表达C3HC4蛋白,并且与同种的非转基因植物相比,具有提高 的纤维素含量和/或降低的木素含量。


图1显示一組桉树组织中C3HC4 cDNA的表达概况。由从美洲黑杨CPo; w/^ ^/加We力木质部分离的mRNA克隆直向同源基因。
图2示意性地显示了本发明的植物表达质粒载体
pALELLYX-C3HC4,其包含驱动本发明的C3HC4核苦酸序列表达
的形成层/木质部优先的启动子。
图3显示几种用pALELLYX-C3HC4转化的转基因抹系和相应的
对照非转基因植物的纤维素含量。星号表示统计学显著较高的平均
纤维素含量值。
图4显示用pALELLYX-C3HC4转化的Tl转基因植物(6B林系) 的两种基因型的纤维素含量。星号表示统计学显著较高的平均纤维 素含量值(P0.05, t-才全-验)。
的Tl转基因植物(6B林系)的两种基因型的木素含量。星号表示统计 学显著较低的平均木素含量值(P0.05, t-检验)。
的T1、争基因植物(24B抹系)的三种、基因型的纤维素含量。星号表示 统计学显著较高的平均纤维素含量值(P0.05, t-检验)。
的Tl转基因植物(25B林系)的三种、基因型的纤维素含量。星号表示 统计学显著较高的平均纤维素含量值(PO.05,t-检验)。
发明详述
本发明涉及遗传操作的植物,其特征在于提高的C3HC4蛋白表 达。在这点上,本发明集中于遗传搡作的植物,该植物超表达包含 C3HC4基因的核酸分子,由此调节所述遗传操作的植物的纤维素含 量。提高基因的转录速率可以导致蛋白质产物增多,从而提高该基 因所参与的代谢过程的速率。
在这点上,本发明人已经确定,超表达C3HC4基因的遗传操作 的植物显示提高的纤维素含量。因此,本发明人确定C3HC4蛋白直 接或间接地控制与纤维素合成有关的基因和/或蛋白质。因此,本发明的申请包括但不限于通过提高木本树木中的纤维 素含量改进造纸过程中的纤维素纤维生产,以及通过提高棉花纤维 中的纤维素含量为纺织品生产改进纤维素纤维的提取。另外,增加 的纤维素沉积可能对木素沉积具有抑制效应。由木本树木工业生产 纤维素需要在制浆工艺中化学去除木素,这要使用大量的浓缩化学 试剂。为了生产高质量的纸张,需要通过额外的漂白步骤进一步除 去残余的木素,该漂白步骤涉及使用非常有害的物质。这整个过程
花费多,并且对环境是一个巨大的挑战。由于这个原因,预计减少 木本植物(典型地为树)中的木素含量可减少这些非常昂贵的提取过
程的化学试剂和能量的需要,也应当能够减少排出物的量,排出物 是一种主要的潜在环境污染物,不仅难以处理,而且处理的费用很
高。Campbell等,P/""/尸/ ;w'o/. 110: 3-13 (1996)。因此,纤维素生物 合成的基因工程可以提供提高转基因植物的纤维素质量和产量、同 时减少木素含量的策略。
本说明书中的技术术语符合生物化学、分子生物学和农学中通 常的用法。这种用法和这些技术术语在以下文献中有详细说明 Molecular Cloning: A Laboratory Manual (3rd ed.), vol. 1-3, Cold Spring Harbor Laboratory Press (2001); Current Protocols in Molecular Biology, Greene Publishing Associates and Wiley-Interscience (1988), 定期更新;Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology (5th ed.), vol. 1-2, John Wiley & Sons, Inc. (2002); Genome Analysis: A Laboratory Manual, vol. 1-2, Cold Spring Harbor Laboratory Press (1997)。如此处所述的合适的 植物生物学技术进一 步在诸如以下的方法学文献中详细说明 Methods in Plant Molecular Biology: A Laboratory Course Manual, Cold Spring Harbor Laboratory Press (1995)。例如,Innis等, PCR Protocols: A Guide to Methods and Applications, Academic Press (1990)以及 Dieffenbach 和 Dveksler, PCR PRIMER: ALaboratory Manual (2p ed.), Cold Spring Harbor Laboratory Press (2003)中描述了各种使用PCR的方法。PCR引物对可以通过已知的 技术,例如使用用于该目的的计算才几程序,如Primer, 0.5版,1991 (Whitehead Institute for Biomedical Research, Cambridge, MA),由已么口 的序歹W寻到。侈'H口, Beaucage和Caruthers, r"ra.22: 1859-62 (1981)以及Matteucci和Caruthers,j附.C7^附.6"oc. 103:3185(1981) 中描述了示例性的化学合成核酸的方法。
限制性酶消化、磷酸化、连接和转化如Sambrook等,Molecular Cloning: A Laboratory Manual (2nd ed.), Cold Spring Harbor Laboratory Press (1989)所述进行。除非另外说明,所有用于细菌细胞 生长和维持的试剂和材料都得自 Aldrich Chemicals (Milwaukee, Wis.)、 DIFCO Laboratories (Detroit, Mich.)、 Invitrogen (Gaithersburg, Md.)或Sigma Chemical Company (St. Louis, Mo.)。
术语"编码"是指一个基因通过转录和翻译机制给一个细胞提供 信息的过程,从该细胞中 一 系列氨基酸可以装配为特定的氨基酸序 列,从而产生活性酶。由于遗传密码的简并性,DNA序列中的某些 碱基变化不改变蛋白质的氨基酸序列。因此可以认为,可以预期涉 及基本上不影响蛋白质的功能特性的编码C3HC4蛋白的DNA序列 的{奮饰。
在本说明书中,"表达,,表示由基因编码的蛋白质产物或多肽的 产生。可选择地或者另外,"表达"表示为了产生多肽,编码DNA分 子(如结构基因)所经历的细胞内过程的组合,包括转录和翻译。"超 表达,,是指特定基因序列的表达,其中转基因生物体中mRNA或多肽 的产量超过了非转基因生物体中的产量水平。
术语"异源核酸"是指已通过人工努力导入细胞(或细胞的祖先) 中的核酸、DNA或RNA。这种外源核酸可以是在所导入的细胞中天 然发现的序列的拷贝,或其片段。
相反,术语"内源核酸"是指存在于将要基因工程化的植物或生 物体中的核酸、基因、多核香酸、DNA、 RNA、 mRNA或cDNA分子。内源序列对于将要基因工程化的植物或生物体来说是"天然的", 即,固有的。
术语"同源序列"是指由于共同的祖先和序列保守性而相似的多 核苷酸或多肽序列。
对于本发明,"旁系同源物(paralog)"是通过基因复制产生的同源 物。它们代表在生物体内复制然后趋异的来源于共同祖先基因的基 因。"直向同源物(ortholog)"是通过物种形成产生的同源物。它们代 表由于相关的生物体趋异而趋异的来源于共同祖先的基因。参见 Brinkman和Leipe, BIOINFORMATICS, A PRACTICAL GUIDE TO THE ANALYSIS OF GENES AND PROTEINS 323-58, Wiley-Interscience (2001)。
术语"功能同源物"是指由于共同的祖先和序列保守性而相似, 并且在催化、细胞或生物体水平上具有相同或相似功能的多核苷酸 或多肽序列。
C3HC4序列
生物体代谢和发育所需的许多生物学过程由基因家族控制。 C3HC4蛋白就是这样,它属于一个包括许多基因的基因家族。 C3HC4-结构域蛋白质属于所谓的"锌指"蛋白质家族,其特征在于"环 指"结构域,该结构域包括8个由共有基序C3HC4形成的金属配体。 环指结构域通常以独特的横拉条(cross brace)排列结合两个锌离子, 并且基本上可以被认为是一个蛋白质相互作用结构域。Jackson等, 3>6"& Ce〃历o/. 10: 429-39 (2000)。
环指蛋白与从转录和翻译调节到发育和定向蛋白质水解的许多 不同的生物学过程有关。因此,其它C3HC4家族成员也将提高纤维 素含量。SEQIDNO:l中显示的一个示例性的C3HC4基因是从白杨 中分离的。
预计来自任一编码环指基因的生物体的、编码具有类似于 C3HC4基因翻译产物的结构和生物学性质的蛋白质的任一基因,对
ii影响相同。这些基因可以通过序列对比进行鉴定和功能注释。有见 识的分子生物学家可以借助于常规方法,例如使用合适的杂交探针
筛查cDNA或基因组文库,或者检索公共数据库如NCBI的Genbank, 容易地鉴定与C3HC4序列有关的序列。也可以借助于简并寡核苷酸, 利用已知的基于PCR的技术分离同源序列。
也可以使用允许利用各种已知技术通过序列对比鉴定基因的计 算程序。例如,Innis等,PCR Protocols: A Guide to Methods and Applications, Academic Press (1990)和 Genome Analysis: A Laboratory Manual,第 1 巻和第 2 巻,Cold Spring Harbor Laboratory Press (1997)描述了这方面的技术的例子。
在与本发明相关的研究中,本发明人在种间杂种巨尾桉杂交种 (五.gra"&、 x^0/ /^//")植物中诱导了 TW。因此鉴定了大量在TW 和正常木中差异表达的基因。在应拉木中表达发生改变的基因中, 确定有许多编码在桉树TW中高表达的C3HC4-型锌指家族的成员。
由于C 3 H C 4蛋白家族的成员在T W (主要由高度结晶的纤维素组 成的组织)中高表达,且C3HC4成员似乎与维管分生组织和次生生长 的控制有关,因此可以预期用包含编码C3HC4家族成员的分子的核 酸构建体对木本树木进行基因转化将会改变维管模式及纤维素合成 和沉积。因此,当C3HC4基因超表达时将发生纤维素合成和沉积的 增加。相反,当C3HC4基因下调时,本发明人预期纤维素合成将减 少。由于纤维素合成和沉积的改变通常导致木素合成和沉积的改变, 参见Hu等,A^z^e Ao^c/j 17: 808-19 (1999),本发明人同样理解, 提高纤维素合成和沉积将降低木本树木的木素含量。如果纤维素合 成减少,则出现相反的情况。
在本发明的上下文中, 一个序列可以通过如上所述的方法鉴定, 并且由此功能注释为属于C3HC4家族。在本说明书中,短语"C3HC4 多核苷酸序列"和"C3HC4核酸序列"表示任何编码C3HC4多肽的核 酸、基因、多核苷酸、DNA、 RNA、 mRNA、 cDNA分子,当其超表
12达时导致植物的纤维素含量提高和/或木素含量降低。短语"C3HC4 多核苷酸序列"和"C3HC4核酸序列"也包括任何具有在严格条件下 能够与此处所述的任一序列杂交的核普酸序列并且编码C3HC4多肽 的核酸分子,当其超表达时导致植物的纤维素含量提高和/或木素含 量降低。该短语也表示与SEQ ID NO:l交叉杂交的序列,优选地具 有与SEQ ID NO: 1至少40%、更优选至少60%、甚至更优选至少 80%、最优选至少90%的同源性或同一性的序列。
本发明的核苷酸序列也可以编码与SEQ ID NO: 2所示的预测基 因产物同源的蛋白质。
短语"C3HC4多核香酸序列"和"C3HC4核酸序列"也表示那些由 SEQ ID NO: 1的片段或变体代表的序列,它们具有与SEQ ID NO: 1 至少50%、优选至少60%、更优选至少70%、甚至更优选至少80%、 最优选至少90%的同一性,并且编码C3HC4多肽,当其超表达时导 致植物的纤维素含量提高和/或木素含量降低。基于同样的理由,本 发明的核苷酸序列包括那些编码包含SEQ ID NO: 2的氨基酸序列或 与SEQ ID NO: 2至少50%、优选至少60%、更优选至少70%、甚至 更优选至少80%、最优选至少90%相同的氨基酸序列的多肽的序列, 其超表达导致植物的纤维素含量提高和/或木素含量降低。
短语"严格条件"在此表示本领域中熟悉的参数。当单链多核苷 酸基于多种良好表征的物理化学力如氢键、溶剂排斥和碱基堆积而 结合时,它们发生杂交。杂交的严格性反映了所涉及的核酸的序列 同一性的程度,因此严格性越高,两条多核苷酸链越相似。严格性 受多种因素的影响,包括杂交和洗涤溶液的温度、盐浓度和组成、 有机和无机添加剂、溶剂等以及孵育(和次数)。本领域普通技术人员 通过改变杂交反应和洗涤过程中的温度、杂交反应和洗涤过程中的 盐浓度等,能够容易地选择这些条件。
印迹中在滤膜上的杂交,"严格"杂交条件的例子是在限定的离子强 度和pH下,比特定序列的热解链温度(Tm)低大约5°C至20°C的温度。Tm是在限定的离乎强度和pH下,50%的靶序列与完全匹配的 探针杂交时的温度。在严格条件下杂交的核酸分子一般基于整个 cDNA或选择的部分与探针杂交。更优选地,此处的"严格条件"是指 本领域熟悉的参数,例如在3.5xSSC、 lxDenhardt's溶液、25mM磷 酸钠緩冲液(pH7.0)、0.50/。 SDS和2mMEDTA中65°C杂交18小时, 然后于65。C在2xSSC、 0.1%SDS中洗涤滤膜4次,各20分钟,且 为了获得更高的严格性,在0.5xSSC、 0.1% SDS或0.3xSSC和0.1% SDS中进行最多20分钟的最后一次洗涤,为了获得甚至更高的严格 性,在O.lxSSC、 0.P/。SDS中洗涤。可以用其它条件代替,只要严 格性程度基本上等同于此处使用0.5xSSC的最后洗涤提供的程度。
需要指出,本说明书中的短语"C3HC4核酸序列"是指具有在严 格条件下能够与此处公升的序列杂交的核苷酸序列的任何核酸分 子,其编码与具有此处SEQIDN0:2公开的氨基酸序列的蛋白质等 同的多肽。该短语也包括与SEQ ID NO:l交叉杂交的序列,优选地 具有与SEQ ID NO: 1至少55%、优选地至少65%、更优选地至少 75%、甚至更优选地至少85%、最优选地至少90%的同源性或同一 性。本发明的核苷酸序列可以编码与SEQIDNO: 2的预测基因产物 同源的蛋白质。
进一步的实施方案包括包含具有一个或多个缺失、置换、插入 或添加的碱基的上述任何碱基序列,并且编码与SEQ ID NO: 2编码 的蛋白质同源的多肽的任何核酸分子。这些核酸分子包括SEQ ID NO: 1的等位基因变体和选择性剪接变体。
相应地,术语"变体"是与特定基因或蛋白质的标准的或者给定 的核苷酸或氨基酸序列偏离的核苷酸或氨基酸序列。变体可以具有 "保守性"改变,其中置换的氨基酸具有相似的结构或化学性质,例 如,用异亮氨酸替换亮氨酸。变体可以具有"非保守性"改变,例如, 用色氨酸替换甘氨酸。类似的微小变化也可以包括氨基酸缺失或插 入,或缺失和插入。确定哪些氨基酸残基可以被置换、插入或删除 的指导可以使用本领域公知的计算机程序来获得,例如Vector NTISuite (InforMax,MD)软件。"变体"也可以指"改组的基因",例如,如 美国专利6,506,603、 6,132,970、 6,165,793和6,117,679所述。此处提到的"具有一个或多个缺失、置换、插入或添加的i咸基的 碱基序列,,是本领域普通技术人员公知的,甚至当通常具有生理活性 的蛋白质的氨基酸序列具有一个或多个置换、缺失、插入或添加的 氨基酸时,也保留其生理活性。具有这些修饰并且编码C3HC4蛋白 的核苷酸序列包括在本发明的范围内。例如,可以删除polyA尾或 5'-或3'-端非翻译区,并且可以删除碱基到删除氨基酸的程度。碱基 也可以被置换,只要不导致移码。也可以"添力p"碱基到添加氨基酸 的程度。但是,重要的是这些修饰不导致C3HC4蛋白功能的丧失。 这些修饰的核酸可以通过以下方法获得,例如,修饰本发明的碱基 序列,使得特定位点的氨基酸通过定点诱变被置换、删除、插入或 添加。参见Zoller和Smith, 7Vwc/dc乂c/di 仏10: 6487-500 (1982)。应当理解,氨基酸和核酸序列可以包括额外的残基,例如额外 的N-或C-末端氨基酸或5'或3'序列。只要得到的序列编码保持相同 或相当的生物蛋白质活性的多肽,这些添加就是合适的。本发明提供编码C3HC4蛋白的核苷酸序列。该序列可以来源于 cDNA,例如美洲黑杨cDNA,或者来源于基因组DNA。 一个示例性 的cDNA克隆如以上SEQ ID NO: 1所示,其编码C3HC4蛋白。根 据本发明的一个方面,通过控制C3HC4蛋白的表达,改变植物组织 (例如木质部或棉籽的纤维细胞)中的纤维素含量。因此,植物细胞或 整个植物(例如)用C3HC4蛋白编码序列基因工程化,该编码序列例 如来源于美洲黑杨,在纤维细胞中优先表达,并且导致纤维素合成 和沉积增力口。另外,本发明提供包含选自下组的核苷酸序列的核酸分子(a) SEQ ID No: 1或其部分或其互补序列;(b)在相当于0.1X SSC至l.OX SSC、 0.1 % SDS、 50-65。C的洗涤严格性下与所述(a)的核苷酸序列 杂交的核香酸序列;(c)编码具有与(a)的核苷酸序列编码的蛋白质相 同的氨基酸序列的蛋白质,但是根据遗传密码简并性而简并的核苷酸序列;和(d)编码与(b)的核苷酸序列所编码的相同的氨基酸序列, 但是根据遗传密码简并性而简并的核苷酸序列。本发明的 一个进一 步的特征是本发明的核酸分子编码的蛋白质 和多肽,其例子包括但不限于具有由SEQIDNO:2组成的氨基酸序 列的多肽。优选地,本发明的多肽具有含有与上述序列至少60%相 同的区域的氨基酸序列。相对于上述序列具有大于70%的同一性是 优选的,而大于80%、 90%或甚至95%的同一性是最优选的。本发明的核酸分子可以"干净地"使用,或者优选地在表达载体 构建体中使用,用于导入细胞,例如植物细胞中。可以采用熟练技 术人员公知的标准分子生物学技术。核酸构建体重组核酸构建体可以用标准:汰术制备。例如,用于转录的核苷 酸序列可以通过用限制性内切酶处理含有所述序列的载体以切下适 当的片段而获得。用于转录的核苦酸序列也可以通过退火和连接合 成寡核苷酸或者通过在聚合酶链反应(PCR)中使用合成寡核苷酸在 每 一 末端得到合适的限制酶切位点而产生。然后将核苷酸序列克隆 到含有诸如上游启动子和下游终止子序列的适当调节元件的载体 中。植物转化载体一般包括一个或多个处于5'和3'调节序列的转录 控制下的克隆的植物编码序列(基因组或cDNA)以及选择性标记。这 样的植物转化载体一般也含有启动子、转录起始位点、RNA加工信 号(如剪接信号序列)、转录终止位点和/或多腺苷酸化信号。也可以 存在增强子和靶向序列。可用于表达C3HC4蛋白序列的合适的组成型植物启动子包括但 不限于花椰菜花叶病毒(CaMV) 35S启动子、玉米和杨树聚泛素启动 子,它们在大多数植物组织中引起组成型的、高水平的表达(参见, 例如,WO 2007/00611,美国专利5,510,474; Odell等,7V^w", 1985, 313: 810-812);胭脂氨酸合酶启动子(An等,1988, P/aW P/o^'o/. 88: 547-552);来自玄参花叶病毒的FMV启动子(美国专利5,378,619);和章鱼氛酸合酶启动子(Fromm等,1989, P/a"f Ce〃 1: 977-984)。载体也可以含有终止序列,终止序列位于本发明的核酸分子的 下游,使得mRNA的转录终止,并且添加polyA序列。终止子的例 子有花椰菜花叶病毒(CaMV) 35S终止子和胭脂氨酸合酶基因(NOS) 终止子。表达载体也可以含有选择标记,通过该选择标记可以在培养中 鉴别出被转化的细胞。标记可以结合异源核酸分子,即与启动子可 操作地连接的基因。此处使用的"标记"是指编码一种性状或一种表 型的基因,该性状或表型允许选择或筛选含有该标记的植物或细胞。 在植物中,例如,标记基因可编码抗生素或除草剂抗性。这允许从 未被转化或转染的细胞中选择出转化细胞。合适的选择性标记的例子包括腺苦脱氨酶、二氢叶酸还原酶、 潮霉素B磷酸转移酶、胸苷激酶、黄嘌呤-鸟噤呤磷酸核糖基转移酶、 草甘膦和草丁膦抗性和氨基-糖苷3'-0-磷酸转移酶(卡那霉素、新霉 素和G418抗性)。这些标记可以包^l舌对G418、潮霉素、博来霉素、 卡那霉素和庆大霉素的抗性。该构建体也可以含有选择性标记基因 万ar, 赋予对除草剂膦丝菌素类似物如草丁膦铵的抗性。 Thompson等,五M50/. 6: 2519-23 (1987)。其它合适的选择标记也是 已知的。也可以使用可视标记,例如绿色荧光蛋白(GFP)。基于细胞分裂 的控制来鉴别或选择转化植物的方法也已描述。参见John和Van Mellaert, WO 2000/052168和Fabijansk等,WO 2001/059086。也可以包含细菌或病毒来源的复制序列,以允许载体在细菌或 噬菌体宿主中克隆。优选地,使用广宿主范围的原核生物复制起点。 可以包含用于细菌的选择性标记,以允许筛选带有所需构建体的细 菌细胞。合适的原核生物选择性标记也包括对抗生素如卡那霉素或 四环素的抗性。本领域中^^知,载体中也可以存在编码另外的功能的其它核酸 序列。例如,当土壤杆菌是宿主时,可以包含T-DNA序列,以利于17后续向植物染色体中的转移和整合。根据本发明的进一步的方面,提供了包含如上所述的处于在植物中工作的转录起始区的控制下的C3HC4 DNA序列的核酸构建体, 使得该构建体可以在植物细胞中产生RNA。优选地,该转录起始区 是器官或组织特异性的^i物启动子的一部分,如WO 2005/096805 7> 开申请中所述的任一种。更优选地,当组织特异性启动子与C3HC4 DNA序列可I喿作地连接时,该启动子确保在特定细胞类型、组织或 器官中转录,使得纤维素合成可以特异性地定向,而不影响其它植 物功能。本发明的转基因植物的特征可以是提高的纤维素含量和/或降低 的木素含量。基因工程植物中提高的纤维素含量优选地通过发生纤 维素沉积的植物组织中C3HC4表达的提高来实现。因此,在一个优 选实施方案中,本发明的转基因植物含有一种核酸构建体,该核酸 构建体包含与编码C3HC4蛋白的基因可操作地连接的形成层/木质 部优先的启动子,如以上引用的'805公开国际申请中所述的那些, 从而导致C3i/0/基因在植物维管系统中的表达提高,这又实现了这 些组织中纤维素合成和沉积的增加,而不影响其它植物功能。如上所述,植物部分的纤维素含量和相关特性可以通过用本发 明的核酸构建体进行基因工程来改变。本发明也提供了含有这些构 建体或用这些构建体基因工程化的植物细胞、由这些细胞产生的 C3HC4基因表达发生改变的植物,和这些植物的种子。本发明的核酸构建体可以包含最小长度的碱基序列,以产生 mRNA,并因此产生保留C3HC4功能的多肽。为了方便起见,通常 发现使用长度为大约100至大约1000个碱基的序列是适当的,但是 碱基序列的长度没有理论上限。这些构建体的制备在下面更详细地 描述。本发明的分离的核酸分子可以整合到核酸构建体内,使得它们 与启动子可操作地连接。优选地,启动子是已知在植物细胞中起作 用的启动子,更优选地在诸如根、苗、叶、木质部等特定植物器官或组织的细胞中起作用。本发明的核酸分子可以与组成型或诱导型 启动子可操作地连接。或者,本发明的核酸分子可以与将下游基因 的表达优选地或特异性地定向于植物器官或组织(如木质部和形成层) 的启动子可操作地连接。另外,维管系统特异性的、木质部特异性的或木质部优先的启 动子可以用于促进本发明的核酸分子特别在维管组织、特别是木质 部组织中的表达。使用组成型启动子通常影响在植物的所有部分中 的蛋白质水平和功能,而使用组织优先的启动子允许将改变的基因 表达定向于特定的植物部分,导致更易控制的表型。因此,在应用 本发明时,发现可以方便地使用将在木质部发育过程中引起表达的 启动子,由此本发明的蛋白质将只在此处公开的应用需要其作用的 器官或组织或细胞类型中过量产生。可以使用的维管组织特异性的、 木质部特异性的、维管组织优先的和木质部优先的启动子包括但不限于上述'805公布国际申请中描述的木质部优先的香豆酸-4-羟化酶 (C4H)基因启动子、木质部优先的微管蛋白(TUB)基因启动子和木质 部优先的脂质转移蛋白(LTP)基因启动子。所选择的特定启动子应当 能够引起足够的表达,以使本发明的蛋白质超表达,以改变木质部 的大小或改变物木质部的化学组成,或这些效应的组合。尽管基因表达速率主要由启动子调节,但是也可以通过鉴定和 使用增强子序列,例如基因的内含子部分,来实现表达的提高,增 强子序列以独立的方式定向提高位置靠近的基因的表达水平。对于 植物,在基因构建体中启动子和基因编码序列之间的位置处包含某 些内含子将导致mRNA和蛋白质积累增加。已知可提高植物中表达 的内含子在玉米基因中已经鉴定,例如,hsp70、 tubAl、 Adhl、 Shl、 UbH (Brown和Santino,美国专利5,424,412和5,859,347; Jeon等, 2000, P/a"《尸一》/. 123: 1005-1014; Callis等,1987, Ge廳Dev. 1: 1183-1200; Vasil等,1989, 尸一Wo/. 91: 1575-1579),并且在双子 叶植物基因中已经鉴定,例如来自矮牵牛的rbcS (Dean等,1989, P/""f CW/ 1: 201-208)、来自马铃薯的ST-LSl (Leon等,1991,尸一o/ 95: 968-972)和t/鄉(Norris等,1993,尸to Mo/.所o/. 21: 895-906)和来自拟南芥(Jra&Wojcw;s Aa"aw")的iMJ7 (Rose和Last, 1997,P/aW, 11: 455-464)。另外,重组表达载体包含在植物细胞中起作用的启动子、作为 上述核苷酸序列的同源物的核酸分子,该核酸分子编码其氨基酸序 列含有与上述SEQ ID NO: 2所示的序列至少60%相同的区域的多 肽。更优选地,该核酸分子编码一种多肽,该多肽的氨基酸序列含 有与上述序列至少70%、 80%或者甚至90%相同的区域。本发明的构建体可以用来利用任何合适的技术基因工程化任何 植物。单子叶和双子叶#皮子才直物或棵子植物细胞都可以用本领域/> 知的各种方法基因工程化。Klein等,所o化c/mo/ogy 4: 583-90 (1993); Bechtold等,C.兄^ca《i^r^ 316: 1194-99 (1993); Bent等,Mo/ GWz. 204: 383-96 (1986); Paszowski等,五MS(9/ 3: 2717-2722(1984); Sagi等,P/耐C"/~ 13: 262-66 (1994)。用于基因工程的植物本发明 一 般地涉及表达编码此处公开的新型多肽组成的基因或 基因区段的转基因植物。此处使用的术语"转基因植物"是指已经整 合有核酸序列的植物,该核酸序列包括但不限于正常情况下也许不 存在的基因、正常情况下不转录为RNA或翻译为蛋白质("表达")的 核酸序列,或者希望导入植物中的其它任何基因或核酸序列,例如 正常情况下可能存在于植物中但是希望基因工程化或改变其表达的 基因。可以设想,在某些情况下本发明的转基因植物的基因组将通 过稳定地导入转基因而增加。但是在另外一些情况下,导入的基因 或序列将代替内源序列。可以导入的优选基因包括但不限于来自美 洲黑杨的C3HC4核酸序列。可以按照本发明工程化的植物包括但不限于如下的树木桉属 的种(白桉CE. a/6a)、白花桉(五.a/^w力,杏仁桉(五.am少g^〃"a)、五.、 圆叶桉(五.6m7e;;awa)、 6a〃adom.ews/s、 双月永桉(五.206/coi^flfa)、 葡萄桉(五.Z o^yozWe力、乡豆iE桉(五.6n2c/^awdn2)、净曷桉(五. Z ra肌'fl"G)、 短柱按(五.6rev"(y/z》、布罗韦按(五.Z rocAw—)、 純盖赤 桉(五.cflima/dw/e"^s7、) 、 ceracea、 大花序按(jE1. c/oez/awa)、 聚果才姿(五. coccz/en3)、 异心叶桉(五.cordato)、 角蕾桉(E, conw^3)、 五.coW/cosa、 常才安(五.cre6nat)、五.croq/7wgo/ew^51、五.cwr^s7'z'、山斗务(五.c/a/rjv附i^eawa)、 剥桉(五.deg7wpto)、 大斗姿(五.c/e/ego^e/w^)、 五.t/e//ca^ 、 卡瑞桉(五. iizVerWco/orh五.(^vens7/0/ia、五.dz'ves、五.t/o/Zc/zoc<2rp 2、五.t/wwc/<xs7'z'、 邓恩才安dw"m7), 滨河白冲安(A e/Wa) 、 eo^/^ocoo^y 、 K er>^/in>/>/i/ofa 、五.ewt/e5moz'des、 /a/cafa、五.gamop/^〃a、五.g/awciwa、 蓝桉(五.g/o6w一、双脉蓝桉(五.g/o6w/ws Z /面加a)、蓝桉原种(五.g7o6w/ws sw65p. g/o6w/ws)、 go打gy/ocarpa、 巨桉(五.grcmcf^)、 巨 尾桉杂交种(五.graw6^51 x wn / /^〃a)、五.gwz.(foy/e" 西达才姿(五.gwww")、 Ziowseawa、五.j'acfcso打"、/awsc/o"vv打ea打a、 /a"w'打e打s^s、 五./ewcoj!7/j/m'a、 白藓叶桉(五./ewcox少/ow)、 五./oc^yen'、 /wcoy"、 直 片干蓝桉(五.wcnWe"")、边纟彖桉(五.margz'""^2)、五.megaca a、蜜p未4妾(五. me〃z'0(ion3)、 五.w/c/we/z'a"a 、'卜巾冒桉(五.mz'crc>cc>r>\y) 、 'J、套桉(五. wz'cro^eca)、纟f"孝力纟f皮桉(五.mwe〃en.awa)、亮果4耍(五.w"ews)、五.wZ"da、 在牛叶桉(五.oZ /Z《i^)、五.06^s7y ora、西方桉(五.occzWew^z/z'51)、五.op"ma、 卵叶桉(五.ovato)、五./ ac/j;;/7/^〃a、雪桉(£. /7aMcz/7ora)、粗皮桉(£. / e//"a)、 穿口十桉(五./ ern>zz'aw")、五.; edo/a/^s1、子单丸桉(五.; 〃w/an、)、 五./ ^ en'^;、 阔叶桉(五.p/a/^/ /y^/a)、 多花桉(五./ o(yaw^emas1)、 五. /popw/wea、 /7re^57'awa 、五./wewfifog7o6w/us1、 pw/c/ze〃<3 、五.n^(iz'a^3、 五.na^Za^3 sw65^. n2c/Za^a!、王桉(五.厂eg za/15)、五.n'5^/ow"、五.n 6eWi"ow"、 五.rodw""'、河红桉(五.n/6/c/a)、赤褐桉(五.n^^7'"ow)、柳叶桉(五. sa/Zgwa^ 纟工皮才姿(五.sa/m0"0;7a/0&)、五.sco; an'a、 4艮顶白蜡桉(五. 5z'eZ en〕、五.spo^Aw/a^3 、五.s^j;en'、五.^stoa化z'、五.^"M/pe51、五.&""7>0!附&、 纟田叶桉(五.^Wc&)、五.胁,亂达尔文纤皮桉(五.敏odo齒)、 五.&'w<ia/z-ae、五.for《wa,a 、 wmZ ra、尾p十才耍(五.w厂o/p/ 少〃a)、五.vemZccwa、 多冲支桉(五.W m'"a/&)、 五.wa"cZoo、 韦i荅桉(五.weto厂ews&)、五.w〃fo"、五."vW〃^s7'Z swZ 5^./a/cz/orm&、五.swZ 51/7. vW///^/、五.woodwani/0, 杨属的种(银白杨(尸.fl/Z fl)、银白杨大齿白杨杂交种CP. g/6a jc尸. gra"^flfew/a^z)、 4艮白才为欧洲山才为杂交种(尸.a/6axi3. ^emw/a)、 4艮白才为 欧洲山杨杂交种(变种)(尸.a/6" x尸.f謂w/a美洲山杨杂交种(i3. a/Z a义户."emw/ozWe力、香月旨才为CP. 6a/sa m/en2)、 毛果香月旨才为CP. 6aAs^mz/en3 swZ^;7. ^7'cAocfl/7 fl)、 毛果香月旨才为美洲黑牙勿 杂叉种CP. 6"/sa附ii/^厂a s"Z^/7. ^7'c/ ocarpa jc i3. de/Zoz'(is)、纟彖毛4为(i3. cz7/a&)、美洲黑杨(尸.胡杨(尸.ew; /zra"ca)、欧美黑杨(尸. ewn2wen'cawa)、杂交實贞冲为(尸.A:""A:am/eww、)、大p十片为(i3. /aw.ocar/ a)、 苦 杨(尸./awn/o//a)、马氏杨(尸.ma;a'mowz'czz'0、毛果马氏杨香脂杨杂交 种(尸.m"xz.movw'cz" x尸.Z a/samz/erfl swZwp, frz.c/zocflTpa)、,繁、才勿(尸. m'gra)、西氏才勿大齿白才为杂交种(尸.We6oW/Z x尸.gn3wAWewto^0 、甜才勿 (尸.swaveo/ew"、川szec/zwam'ca)、毛白fomewtos"")、区欠洲山 杨(尸.^"emw/a)、 欧洲山杨北美颤杨杂交种(尸./"mw/a x尸. ^emw/o/(iM)、北美颤杨CP. ^-eww/ozWe51)、才争杨(jP. wz7sow")、力口拿大杨 (P. Canadensis)、、真^/(i3. ;^mw""e is7、)), 木〉类3口火火巨木》(i^wws ^;ec/a)、 湿i也+〉(尸z'ww51 e〃z.o&7)、 美国黄(i^'打ws ; ow(ien^")、 小干+〉 (i^'wws co自他)和辐射松(/^wtw ra^z《a),花旗松(尸"W(io加g^ ,wz^"),美 国西部4失杉(加拿大4失杉(2^ga Oma^ww\s0), 北美云杉(尸&ea g7flwca), 红杉(5e《woZa wm/7wW"/w), 真杉(true fir)如4艮杉(JZ z'e51 ama&7&)和香脂;令杉04Z^M 6a/^mea),及雪爭》类:^大侧柏(北美乔柏 (77my'a / /Zca^))牙口黄扁^白(CAamaec少/ an、 woo汰(^ew^s7V)。本发明还涉及产纤维植物的修饰,如棉花(棉属的种(G^W^wm spp.))、 亚麻(Ziwwm wwYa/Z^s^z'mwm)、 d、荨麻(异才朱荨麻(C/r&ca c^oz'c"))、 蛇麻(/Zwmw/1^ /wpw/i )、椴树类(欧洲小叶椴(77"a conia&)、欧洲都殳(r.苎麻(5oe/zmen'a w&ea)、 才者(Srowssowe(ya papyn/era), #斤西兰麻 (jP/zomn'讓^wax)、 罗布麻(磁麻(J/ oc"wm ca朋"6/m/m》、秀尾属的 种(道氏秀尾(/. c/owg/osr'a打a)、 / macnwip/fOM禾口 /./7wni3^)、專'L草类(马利筋属的种(^c/e/ ^^ecz'M))、菠萝、香蕉和其它才直物。还包括饲冲+ 作物,如紫花苜蓿、黑麦草、羊茅和三叶草。在本说明书中,"植物"概括地表示任何可以被遗传操作的含有 纤维素的植物材料,包括但不限于分化的或未分化的植物细胞、原 生质体、完整的植物、植物组织和植物器官,以及才直物的任何部分, 例如叶、茎、根、芽、块茎、果实、根茎等。在本说明书中,"转基因植物"是指已整合有核酸序列的植物, 该核酸序列包括但不限于正常情况下不存在于'宿主植物基因组中的 基因,正常情况下不转录为RNA或翻译为蛋白质的核酸序列,或其 它任何希望导入野生型植物中的基因或核酸序列,例如正常情况下 可能存在于野生型植物中但是希望基因工程化或希望改变其表达的 基因。"转基因植物"类别包括原代转化体和例如,通过标准基因渐 渗或另外一种育种程序而在其谱系中包括转化体的植物。相反,没 有进行遗传操作的植物是对照植物,被称为"非转基因"植物。非转 基因植物可以是其基因组未通过导入包含本发明的多核苷酸序列或 其片段的构建体而修饰的植物。也可以是由培养的细胞或组织再生 的,而没有通过导入包含本发明的多核苷酸序列的构建体事先修饰 的植物,或者可以包括由转基因植物自花受精产生的纯合隐性后代 (即,不具有任何转基因拷贝)。此处使用的"杂种植物"是指由两个亲 本植物之间杂交获得的植物或其部分,其中一个亲本是本发明的基 因工程植物。这可以通过(例如)有性繁殖自然发生,或者可以通过(例 如)体外核融合人工发生。本发明的转基因植物含有如此处所述的在植物中有效启动子的 控制下表达的核酸序列,使得该植物的特征为,例如,降低的木素 含量和纤维素含量提高。植物基因工程方法可以使用合适的工程才支术将本发明的构建体导入任何植物细胞 中。单子叶和双子叶被子植物或棵子植物细胞都可以用本领域所知的各种方法基因工程化。例如,参见Klein等,1993, AWec/mo/ogy 4: 583-590; Bechtold等,1993, C.兄」ca乂 Pan、 316: 1194-1199; Koncz和Schell, 1986, Mo/, G匿A 204: 383-396; Paszkowski等, 1984,五MBO 3: 2717-2722; Sagi等,1994, P/aW CW/ 13: 262-266。例如,可以按照Nagel等,1990, MZcro&o/丄e〃 67: 325所述,使 用土壤杆菌属的种,如根癌土壤杆菌(A ^me/ac^"力和发根土壤杆菌r/^zogew^)。简言之,土i裏杆菌可以用植物表达载体转化,例如 通过电穿孔转化,之后通过例如公知的叶盘法(leaf-disk method)将土 壤杆菌引入植物细胞中。其它实现这一目的方法包括但不限于用根瘤菌属(i /^o&wm)、 中华根瘤菌属(5V"oW^'zoZ)^m)或中慢生根瘤菌属(M^oW^o^"m)转 化(Broothaerts等,2005, A^w厂e 433: 629-633)、电穿孔、粒子枪轰击、 磷酸钙沉淀和聚乙二醇融合、向萌芽的花粉粒中转移、直接转化(Lorz 等,1985,^1"/. G^zW. 199: 179-82),及其它已知的方法。如果使用选 择性标记,如卡那霉素抗性,则更易于确定哪些细胞被成功转化。已知以上所述的土壤杆菌转化方法可用于转化双子叶植物。另 外,de la Pena等,1987,淘訓325: 274-76; Rhodes等,1988, 5We匿 240: 204-207;和Shimamoto等,1989,淑匿328: 274-76公开了使用 土i裏杆菌转化谷类单子叶才直物。另外参见Bechtold和Pelletier, 1998, MeAoAMo/. 5"/. 82: 259-66,其证明了真空渗入在土壤杆菌介导的 转化中的应用。可以^r测特定细胞中蛋白质、多肽或核酸分子的存在,以确定, 例如,细胞是否已被成功地基因工程化。进行这种试验的能力是公 知的,在此不需赘述。定量纤维素/木素含量在此用来描述本发明植物的短语"提高的纤维素含量"是指与野 生型植物中的纤维素量相比,本发明植物中纤维素量的定量增加。纤维素的定量增加可以通过几种方法测定,例如在磨碎的茎木中多冲唐酸7jc解后基于总冲唐进;f亍定量。Chiang和Sarkanen,Tec/mo/, 17: 217-26 (1983); Davis,『ooc/ C/z亂rec/mo/ 18: 235-52(1988)。本发明的工程植物中的纤维素含量可以升高野生型植物纤维素 含量的大约30%至大约50%、优选大约25%至大约45%,甚至更优 选大约20%至大约40%的水平。本发明植物的最优选的实施方案具 有为野生型纤维素含量的大约10%至大约15%的纤维素含量。短语"减少的木素含量"和"降低的木素含量"在此用来描述本发 明的植物的 一个方面,分别是指植物中的木素量比野生型或非转化 植物中的木素量定量减少。木素的定量减少可以通过Klason木素测 定(Kirk等,Me&o^7z五nzj;mo/. 161: 87-101 (1988))和乙酰溴木素测定 (Iiyama等,『ood rec/mo/. 22: 271-80 (1988))说明的常规方法测 定。本发明的工程植物中的木素含量可以降至野生型植物的木素含 量的大约5%至大约卯%,优选地大约10%至大约75%,更优选地大 约15%至大约65%干重的水平。本发明的植物的最优选的实施方案 具有野生型木素含量的大约20%至大约60%的木素含量。以下提供了用于获得美洲黑杨C3HC4基因的方法的实施例,并 且下面给出了使用土壤杆菌导入靶基因从而产生植物转化体的技 术。这些只是实施例,而不是对本发明的限制。实施例1在应拉木、应力木和正常木中优先表达的基因的表达概况 如Huang和Madan, Gewomei 仏9: 868-77 (1999)(引入作为参考) 所述,利用CAP3程序,将来自巨尾桉杂交种(五wca/j;7a^ gram/^ x 五wca(y/7,w wrop/y;〃a)的表达序列标签(ESTs)聚类。从代表以下组织的 文库中获得一组53,522个EST:来自野外生长的高6.5m的桉树(巨 尾桉杂交种)的应拉木、应力木和正常木。在这样产生的簇组中搜索至少由90%的来自代表应拉木组织的文库的EST读数组成的簇。另 外,在簇组中搜索由至少3个来自应拉木组织的EST读数和优选地 少于两个来自其它文库的读数组成的簇。这样选择的一个簇,由14个来自应拉木cDNA文库的EST读数 和0个来自其它文库(应力木和正常木)的读数组成,代表C3HC4蛋 白家族的成员(图1)。然后使用Blast-X算法,采用<=le-5的截止e-值(参见Altschul 等,A^c/^c ^c^y Z5.' 3389-402 (1997)),将使用这些参数选择的 簇与来自专门杨树数据库的序列进行比对,该数据库由从JGI毛果杨 (Popw/tw WcAoca/7 a) vl.O 数 据 库(http:〃genome.jgi-psf.org/Poptrl/Poptrl.home.html)获得的序列组成。比 较结果存储在杨树序列本地数据库中。通过这一过程,取得编码与 选自桉树文库的序列直向同源的C3HC4蛋白的簇。该簇中最长读数 的序列如本文中SEQ ID NO: 1所示,其编码本文中SEQ ID NO: 2 所示的多肽。实施例2从美洲黑杨中分离C3HC4 DNA序列 (a)从美洲黑杨形成层/木质部制备RNA和合成cDNA 从一年的美洲黑杨树的枝插(stem cutting)上除去树皮。将包括形 成层、木质部和木髓的茎的内部切成小片,在液氮中冷冻,用溴化 十六烷基三甲基铵(CTAB)提取法(Aldrich和Cullis, Plant Mol. Biol. Report., 11:128-141 (1993))进行RNA提取。在RT-PCR实验中使用 cDNA库,其中使用分离的总RNA作为模板,且使用Superscript II 逆转录酶(Invitrogen)和oligo (dT)引物合成第一链cDNA。如下所述, 使用基因特异性引物,通过随后的聚合酶反应获得双链cDNA。 (b) PCR引物的设计和RT-PCR反应 合成基于SEQIDNO: 1的寡聚体作为PCR引物,包括编码该多 肽的主要ORF的第一个ATG密码子周围的区域或终止密码子周围的区域,以扩增该主要ORF的完整编码区。引物序列为 C3HC4NDE:长度30catatgaata cgcggtaccc ctttccaatg (SEQ ID NO: 3) C3HC4XBA:长度31tctagactat ctctccaatc cttgtttaca g (SEQ ID NO: 4)在PCR反应中,使用(a)中获得的cDNA库作为模板,使用SEQ IDNOs:5、 6、 7和8的引物。PCR包括94°C 1分钟、51°C 1分钟 和72°C 2分钟的40个循环,随后是72°C 7分钟的一个额外的延伸 步骤。PCR产物通过1.0%琼脂糖凝胶电泳分离,然后用溴化乙4走染 色电泳凝胶,并在UV透射仪上检测扩增的条带。验证检测到的扩 增条带,并用刀片从琼脂糖凝胶上切下。将凝胶片转移到1.5mL微 型管中,分离DNA片,殳,并用GFX PCR净化和凝月交条带纯化试剂 盒(Amersham)纯化。将回收的DNA片段亚克隆到可商购的克隆载体 中,转化大肠杆菌,然后用来制备质粒DNA,然后采用标准方法通 过二脱氧法(Messing, M"AoA &五"z戸o/ 101, 20-78 (1983))测序。得 到核苦酸序列SEQIDNO. 1,其编码此处公开的SEQIDNO:2的多 肽。实施例3转基因本氏烟草(Mco"awa 6e"&aw&加)植物的制备 将以上实施例2中获得的来自美洲黑杨的核酸分子导入植物宿 主中以产生转基因烟草植物。将实施例2中获得的从美洲黑杨中分离的核酸分子克隆到表达 载体中木质部优先的香豆酸-4-羟化酶基因(C4H)启动子的下游(图 2)。得到的表达构建体在大肠杆菌中扩增,然后通过化学转化法转化 到根癌土壤杆菌LBA4404林中。土壤杆菌介导的本氏烟草的转化利用Horsch等,6Wwce 227: 1229 (1985)的叶盘法实现。简言之,LBA4404 土壤杆菌抹生长过夜, 直到达到对数中期生长。用无菌水1:10稀释培养物,并与来自无菌27生长的幼小本氏烟草植物的叶盘共培养20分钟。这些叶盘在Murashige-Skoog培养基中在暗处培养。48小时后,将叶盘颠倒置于 添加有0.4 mg/L 。引哚乙酸(IAA)、 2 mg/L节基氨基。票呤(hOBAP)、 1 mg/L Finale和500 mg/L羧节西林的相同生长培养基的新鲜平板上。 当形成幼苗时,从叶盘上取下,置于只添加1 mg/L Finale的新鲜培 养基中。让转基因杂合的本氏烟草原代转化体的幼苗在Murashige 和Skoog培养基上生根,然后转移到土壤中,并在温室中生长。按 照此处提供的说明,条件(~50 pM/m2/sec光,27。C)足以鉴定那些显示 改变的木质部结构和/或木质部化学组成或这些效应的组合的转基因 植物。实施例4外源基因插入宿主植物基因组的PCR验证利用PCR验证基因构建体在转基因植物的基因组中的整合。合 成一对引物,用于从选择性标记基因Sar扩增400bpDNA序列。另 外,合成另一对引物,用于扩增内源本氏烟草查耳酮合酶(Ci^S)基因。 这些引物组在公开的国际申请WO 2006/096951中均有描述。Bar 35:长度20tctaccatga gcccagaacgBar 36:长度23aattcggggg atctggattt tagCHS 150:长度24gccagcccaa atccaagatt actcCHS 151:长度23aatgttagcc caacttcacg gag利用Sar引物PCR扩增含有本发明核酸分子的表达构建体的 T-DNA部分的 一部分,即从本氏烟草转化体的基因组DNA扩增。PCR反应混合物含有使用溴化十六烷基三曱基铵(CTAB)提取法 (Aldrich和Cullis,尸/福Mo/.肠/. 11: 128-41 (1993))制备的转化植物的100 ng基因组DNA、 0.2 ]uM用于万『基因的各引物、0.2 ]iiM 用于内源C/^控制基因的各引物、100pM各脱氧核糖核苷三磷酸、 lxPCR缓冲液和2.5单位AmpliTaq DNA聚合酶(Applied Biosystems),总体积为50 |uL。循环参数如下94°C 1分钟,57°C 1 分钟,72。Cl分钟,40个循环,加上72。C5分钟延伸。PCR产物在 1%琼脂糖凝胶上电泳。实施例5转基因植物中转基因表达水平的确定 利用半定量RT-PCR检测转基因植物的茎组织中美洲黑杨 C3HC4转录物的积累。利用CTAB法(Aldrich和Cullis,尸/a"f Mo/. 5io/. 鄉oW. 11:128-141 (1993))从4个月大的转基因烟草TO植物的茎切段 中分离总RNA。使用Superscript II RNase H-RT (Invitrogen, USA)由 500 ng总RNA合成cDNA。上述引物与用于编码查耳酮合酶(C/f5) 的组成型基因的引物一起使用,后者作为标准化每个样品中使用的 总RNA的量的内部控制。使用第一链cDNA的12.5倍稀释液在下 列条件下进行PCR: 94°C 3分钟,和94°C 1分钟、51°C 1分钟、72。C 1分30秒的27个循环。上述公开内容和实施例描述了本发明的各个特征,基本上需要 分离和克隆可用于产生基因工程植物的、编码C3HC4蛋白家族成员 的核酸分子。已经用这种分离的核酸分子转化或转染的重组植物可 显示纤维素和/或木素含量的定量改变。实施例6 转基因植物的组织化学分析 将转基因烟草和对照非转基因植物的茎切段,并在4%低聚甲醛 中固定24小时。然后在切片机(LeicaRM2255)上将固定的组织切片, 之后用星蓝/番红染色。组织学染色的切片在Leica DM1L倒置显微 镜下采用亮视野和暗视野照明进行观察。实施例7在维管组织中超表达C3HC4的转基因植物中纤维素含量的提高收集用包含在木质部优先的美洲黑杨C4H启动子控制下的美洲 黑杨C3HC4基因的构建体转化的烟草转基因事件(event)和非转基 因对照植物的主茎,风干两周。将干燥的茎切片,使用30目的筛在 切碎机上制成粉末。然后对茎粉末样品进行化学分析,以确定纤维 素和木素含量。简言之,在酸水解这些从茎中提取的多糖后基于总 糖确定纤维素和半纤维素含量。碾碎的茎于45°C真空干燥,并用 H2S04水解。高pH阴离子交换层析后,基于水解物的组成对葡聚糖 和其它多糖(半纤维素)进行定量。Chiang和Sarkanen (1983)和Davis (1988),同上。按照实施例5详述的程序得知表达转基因的三个 C3HC4转基因事件,显示统计学显著的纤维素含量升高(图3)。与对 照非转基因植物的50.00%相比,转基因事件6B显示54.09%的纤维 素,表明纤维素含量显著提高了 8.18。/。(P^).05,t-检验)。与对照植物 的50.00%相比,转基因事件24B显示53.90%的纤维素,表明纤维素 含量提高了 7.80% (图3; t-检验)。与对照非转基因植物的50.00%相比,转基因事件4B显示53.26%的纤维素含量,表明纤维 素含量提高了 6.52% (图3;PS0.05, t-检验)。生长成熟后,TO事件自花受精产生Tl株。这里显示了已分析 其Tl后代的三个事件的相关结果。对来自事件6B的Tl群体的分析表明,C3HC4基因的纯合显性 条件是致死性的,因为在分离群体中没有检测到纯合显性植物。植 物发育可能受到影响。尽管如此,与纯合隐性植物相比,C3HC4基 因半合植物显示纤维素含量显著提高8.4% (P<0,05, t-检验)(图4)。 与纯合隐性植物相比,它们也显示木素含量降低18% (P<0.05, t-检验) (图5)。在事件24B和25B的分离群体中,可以鉴别出纯合显性植物。 但是与纯合隐性植物相比,在半合植物组中观察到纤维素含量的较大提高。与纯合隐性植物相比,来自事件24B的半合植物显示纤维 素含量提高9.7%,纯合显性植物显示纤维素含量提高7.5% (图6;t-检验)。与纯合隐性植物组相比,来自事件25B的半合植物 显示提高10.4% (图7; PO.05, t-检验)。对于这两个事件,没有观察 到木素含量的显著改变。
权利要求
1.一种分离的核酸序列,其包含选自下组的序列(a)SEQ ID NO1所示的核酸序列,或其互补链;(b)编码SEQ ID NO2所示的氨基酸序列的核酸序列;(c)在严格条件下能够与(a)或(b)的核酸序列杂交的核酸序列,其中所述杂交序列编码C3HC4多肽;(d)作为(a)或(b)的核酸序列的等位基因变体或选择性剪接变体的核酸;和(e)与(a)或(b)的序列有至少50%、60%、70%、75%、80%、85%、90%或更高的序列同一性的核酸序列。
2. —种分离的C3HC4蛋白,其选自(a) SEQ ID NO: 2所示的多肽;(b) 具有与SEQ ID NO: 2所示的氨基酸序列有至少85%或更高 序列同一性的氨基酸序列的多肽;和(c) 如(a)或(b)中定义的多肽的变体。
3. —种核酸构建体,其包含与一个或多个合适的启动子可操作 地连接的分离的C3HC4多核苷酸序列,该启动子驱动该C3HC4多 核苷酸序列的表达。
4. 如权利要求3所述的核酸构建体,其中所述启动子是木质部 优先的启动子。
5. 如权利要求4所述的核酸构建体,其中所述木质部优先的启 动子选自TUB基因启动子、SuSy基因启动子、COMT基因启动子 和C4H基因启动子。
6. —种植物细胞,其包含如权利要求3所述的核酸构建体。
7. —种由权利要求6的植物细胞产生的转基因植物,其中所述 植物与同种的非转基因植物相比,具有改变的纤维素和/或木素含量。
8. 如权利要求6所述的植物细胞,其中所述启动子是木质部优 先的启动子。
9. 如^L利要求8所述的植物细^;,其中所述木质部优先的启动 子选自TUB基因启动子、SuSy基因启动子、COMT基因启动子和 C4H基因启动子。 '
10. 如权利要求7所述的转基因植物,其中所述植物是双子叶植物。
11. 如权利要求7所述的转基因植物,其中所述植物是单子叶植物。
12. 如权利要求7所述的转基因植物,其中所述植物是棵子植物。
13. 如权利要求7所述的转基因植物,其中所述植物是阔叶树。
14. 如权利要求13所述的转基因植物,其中所述阔叶树是桉属 植物。
15. 如权利要求13所述的转基因植物,其中所述阔叶树是杨属 植物。
16. 如权利要求11所述的转基因植物,其中所述针叶树是松属 植物。
17. 如权利要求7所述的转基因植物的一部分,其选自叶、茎、 花、子房、果实、种子和愈伤组织。
18. 如权利要求7所述的转基因植物的后代。
19. 如权利要求18所述的后代,其中所述后代是杂种植物。
20. —种改变植物中的纤维素和/或木素含量的方法,包括(a) 向分离的植物细胞中引入核酸构建体,该核酸构建体包含与 一个或多个合适的启动子可操作地连接的分离的C3HC4多核苷酸序 列,该启动子驱动该C3HC4多核苷酸序列的表达;和(b) 在促进植物生长的条件下培养所述植物细胞,其中所述植物 超表达C3HC4蛋白,并且与同种的非转基因植物相比,具有提高的 纤维素含量和/或减少的木素含量。
21. 如权利要求20所述的方法,其中所述启动子是木质部优先 的启动子。
22.如权利要求21所述的方法,其中所述木质部优先的启动子选自TUB基因启动子、SuSy基因启动子、COMT基因启动子和C4H 基因启动子。
全文摘要
本发明公开了用于改变植物组织中纤维素和/或木素含量的多核苷酸、核酸构建体和方法。植物用编码C3HC4蛋白的基因进行基因工程化,编码C3HC4蛋白的基因在植物维管系统中超表达时导致纤维素含量提高。带有C3HC4蛋白基因的植物转化体显示提高的纤维素含量和/或降低的木素含量,该性状被认为改善了阔叶树在制浆和造纸过程中的纤维素提取。
文档编号C12N15/29GK101578370SQ200780046706
公开日2009年11月11日 申请日期2007年12月20日 优先权日2006年12月20日
发明者I·R·格哈特, P·阿鲁达 申请人:阿莱利克斯有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1