一种来源于虎眼万年青的肉桂酸-4-羟化酶,其核苷酸序列及应用

文档序号:8246724阅读:1813来源:国知局
一种来源于虎眼万年青的肉桂酸-4-羟化酶,其核苷酸序列及应用
【技术领域】
[0001] 本发明涉及一种肉桂酸-4-羟化酶,其编码基因及其在催化底物肉桂酸为对香豆 酸中的应用,属于基因工程领域。特别涉及虎眼万年青肉桂酸-4-羟化酶,其编码基因及其 在催化底物反式肉桂酸形成产物对香豆酸反应中的应用。
[0002] 发明背景
[0003] 肉桂酸 _4_ 轻化酶(Cinnamate4-hydroxylase, C4H,ECL 14. 13. 11),又称反式肉 桂酸-4-单氧化酶,是细胞色素 P450家族成员。作为黄酮类天然产物生物合成途径中的 一个关键酶,C4H可以高效地催化反式肉桂酸生成对香豆酸,进而形成黄酮类化合物。因 此,克隆肉桂酸-4-羟化酶基因并对其进行功能鉴定可以为黄酮类化合物的合成生物学研 究提供必要的基因元器件。目前我国仅从羽衣甘蓝、亚洲棉,苦荞,膜夹黄芪,甘蓝型油菜, 大豆,丹参和花生等植物分离出C4H基因,且停留在基因分析克隆及转化的水平,并没有 更深入的研究报道。国外的研究包括从韩国黑树莓(Korean black raspberry),长春花 (Catharanthus roseus)和花叶地锦(Parthenocissus henryana)等植物中分离 C4H 的报 道,未见有从虎眼万年青(Ornithogalum saundersiae)分离C4H基因并进行功能鉴定方面 的相关报道。本发明通过对虎眼万年青进行转录组测序,获得了虎眼万年青肉桂酸-4-羟 化酶序列信息。通过提取虎眼万年青RNA,利用RT-PCR,从虎眼万年青无菌鳞茎中克隆得到 一个肉桂酸4-羟化酶基因,命名为0saC4H,并对其进行了功能鉴定,这是首次从虎眼万年 青植物中克隆得到这个基因。

【发明内容】

[0004] 本发明的首要目的是提供一种肉桂酸-4-羟化酶。
[0005] 本发明的第二目的是提供编码该酶的核苷酸序列。
[0006] 本发明的第三目的是提供含有该核苷酸序列的表达载体。
[0007] 本发明的第四目的是提供含有该表达载体的宿主细胞。
[0008] 本发明的第五目的是提供肉桂酸-4-羟化酶的应用。
[0009] 为了实现本发明之目的,采用的技术方案为:
[0010] 本发明提供一种来源于虎眼万年青的肉桂酸-4-羟化酶,其特征在于:
[0011] a) SEQ ID NO. 1所示的氨基酸序列;
[0012] b) SEQ ID NO. 1所示的氨基酸序列经替换,缺失或添加1-60个氨基酸形成的具有 同等功能的氨基酸序列。本发明还提供一种编码所述肉桂酸-4-羟化酶的基因序列,其核 苷酸序列如SEQ ID NO. 2所示。
[0013] 本发明还提供一种含有所述核苷酸序列的表达载体。
[0014] 本发明还提供一种所述表达载体的宿主细胞。其中所选宿主细胞优选酿酒酵母, 大肠杆菌,毕赤酵母,链霉菌和植物细胞,更优选的宿主细胞选自酿酒酵母。
[0015] 本发明还提供了肉桂酸-4-羟化酶或含有肉桂酸-4-羟化酶的细胞在催化底物反 式肉桂酸形成产物对香豆酸反应中的应用。其中肉桂酸-4-羟化酶的底物包括反式肉桂 酸,形成的产物为对香豆酸。
【附图说明】
[0016] 图I :0saC4H和其他物种的C4H的比对结果。
[0017] 图2 :0saC4H结构域预测结果。
[0018] 图3 :0saC4H三维结构预测结果。
[0019] 图4 :0saC4H基因扩增结果,其中M是DNA分子量标准;1是0saC4H基因 PCR结果。
[0020] 图5 :重组质粒pYeDP60_0saC4H示意图。
[0021] 图6 :WHT[pYeDP60-0saC4H]菌落PCR结果,其中M是DNA分子量标准;1-5是5个 WHT[pYeDP60-0saC4H]克隆的菌落 PCR 结果。
[0022] 图7 :酶促反应产物的HPLC色谱结果。其中1是反式肉桂酸标准品的HPLC分析 结果;2是WHT[pYeDP60]酶促反应产物的HPLC分析结果;3是WHT[pYeDP60-0saC4H]酶促 反应产物的HPLC分析结果;4是对香豆酸标准品的HPLC分析结果。
[0023] 图8 :酶促反应产物的HPLC-UV色谱结果。
[0024] 图9 :酶促反应产物的总离子色谱图。
[0025] 图10 :m/zl63的[Μ-ΗΓ离子的提取离子色谱图。
[0026] 图11 :保留时间9. 95min的[Μ-ΗΓ离子的MS谱图。
[0027] 图12 :m/zl47的[Μ-ΗΓ离子的提取离子色谱图。
[0028] 图13 :保留时间14. 44min的[Μ-ΗΓ离子的MS谱图。
[0029] 图14 :标准品对香豆酸的HPLC-UV谱图。
[0030] 图15 :标准品对香豆酸的全离子扫描结果。
[0031] 图16 :标准品对香豆酸([Μ-ΗΓ离子,m/zl63)的提取离子色谱图。
[0032] 图17 :标准品对香豆酸([M-H]_离子,m/zl63)的MS谱图。
[0033] 图18 :0saC4H催化反式肉桂酸形成的产物的1H NMR结果。
[0034] 图19 :0saC4H催化反式肉桂酸形成的产物的13C NMR结果。
[0035] 图20 :0saC4H催化反式肉桂酸形成的产物的HMQC结果。
[0036] 图21 :0saC4H催化反式肉桂酸形成的产物的HMBC结果。
[0037] 图22:底物反式肉桂酸。
[0038] 图23 :产物对香豆酸。
[0039] 图24 :0sC4H分子进化结果。
【具体实施方式】
[0040] 本发明通过如下实施例进行进一步的说明,这些实施例仅用于说明性的,而不是 以任何方式限制本发明权利要求的范围。
[0041] 实施例1虎眼万年青转录组测序及序列分析
[0042] 提取虎眼万年青无菌鳞茎总RNA后,以mRNA为模板,用六碱基随机引物(random hexamers)合成第一条cDNA链,然后加入缓冲液、dNTPs、RNase H和DNA polymerase I合 成第二条cDNA链,在经过QiaQuick PCR试剂盒纯化并加 EB缓冲液洗脱之后做末端修复、 加 poly (A)并连接测序接头,然后用琼脂糖凝胶电泳进行片段大小选择,最后进行PCR扩 增,建好的测序文库用Illumina HiSeqTM2000进行测序。
[0043] 测序得到的原始图像数据经base calling转化为序列数据,即raw data或raw reads。对raw reads进行数据过滤,去掉带接头的,重复的,测序质量很低的reads,得到 clean reads。使用短reads组装软件Trinity将具有一定长度overlap的clean reads连 成更长的片段,即Contig。然后,将clean reads比对回Contig,通过paired-end reads能 确定来自同一转录本的不同Contig以及这些Contig之间的距离,Trinity将这些Contig 连在一起,得到两端不能再延长的序列,这些序列称之为Unigene。通过blastx将Unigene 序列比对到蛋白数据库nr、Swiss_Prot、KEGG和COG (evalue〈0. 00001),并通过blastn将 Unigene比对到核酸数据库nt(evalue〈0. 00001),得到跟给定Unigene具有最高序列相似 性的蛋白,从而得到该Unigene的蛋白功能注释信息。
[0044] 通过功能注释,从虎眼万年青转录组序列中发现一个长为1608bp的,具有肉桂 酸-4-轻化酶保守序列的 Unigene,即 Unigene26946 (SEQ ID NO. 3)。
[0045] 实施例20saC4H生物信息学分析
[0046] 利 用 Blast X (http://blast.ncbi.nlm.nih.gov/Blast· cgi?PROGRAM=blastx&BLAST PR0GRAMS=blastx&PAGE TYPE=BlastSearch&SH0ff DEFAULTS=on&LINK L0C=blasthome)对所得的Unigene26946进行比对分析,结果表明该 Unigene中含有与肉桂酸-4-轻化酶(cinnamate4_hydroxylase)同源的编码序列。利 用 NCBI ORF Finder( http://www.ncbi.nlm.nih.gov/gorf/orfig.cgi)软件对得到的 Unigene26946序列进行ORF分析表明,该Unigene含有的最长ORF长度为1518bp,5'非 翻译区为55bp,3'非翻译区为35bp。对该ORF编码蛋白序列相似性分析表明,该蛋白与 洋葱(Allium cepa)的C4H(AAS48416. 1)的相似性最高为89%,其次为可可树(Theobroma cacao,E0Y20175. 1),撤揽(Canarium album,ACR10242. 1),树棉(Gossypium arboreum, MG10196. 1),陆地棉(Gossypium hirsutum,ACZ06240. 1 和 ACH56520. 1),葡萄柚(Citrus X paradisi,AAK57011. 1)和金银花(Lonicera japonica,AGE10592. 1)。0saC4H 与这些 C4H 的相似性都是88% (图1)。
[0047] 米用ExPASy Proteomics Sever提供的在线工具Protparam(http://www. expasy. ch/tools/protparam. html)对该ORF编码蛋白的理化性质进行预测分析。结果表明该蛋白 由505个氨基酸组成,分子式为C2624H 4161N727O715S15,总原子数为8242,分子量为57. 8142kD ; 理论等电点(pi)为9. 22,带正电残基(Asp+Glu)为61,带负电残基(Arg+Lys)为70。该蛋 白的不稳定系数为45. 70,表明该基因编码的蛋白不稳定。脂肪系数为100. 93,亲水性系数 为-0· 202。
[0048] 米用 SWISS-MODEL (http://www. swissmodel. expasy. org/)进行该基因编码蛋白 二级结构及结构域预测。其编码蛋
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1