编码杜仲的甲羟戊酸途径的酶的基因的制作方法

文档序号:531654阅读:318来源:国知局
专利名称:编码杜仲的甲羟戊酸途径的酶的基因的制作方法
技术领域
本发明涉及参与杜仲的类异戊二烯化合物的生物合成的基因群。
背景技术
作为类异戊二烯化合物之一的聚异戊二烯(橡胶)根据异戊二烯单元的聚合方式的不同而分为顺式和反式。生产长链顺式聚异戊二烯的植物已知有蒲公英、山莴苣等很多植物。巴西橡胶树(Hevea brasiliensis)所生产的顺式聚异戊二烯作为天然橡胶在商业上广泛应用。而关于长链反式聚异戊二烯,已知天然中有胶木等少数植物生产,但商业上并未利用。目前,反式聚异戊二烯是化学合成,应用于高尔夫球外皮、绷带、运动保护器具等中。 反式聚异戊二烯是显示低熔点和高弹性的热塑性弹性体,可用作绝缘体。类异戊二烯化合物通过与碳原子数为5的化合物-异戊烯焦磷酸(IPP)为单元的缩合反应生成。甲羟戊酸途径是类异戊二烯化合物的生物合成中的初期合成途径之一。在动物、植物、菌类中可通过甲羟戊酸途径生物合成IPP。作为IPP生物合成途径,除了甲羟戊酸途径之外还存在非甲羟戊酸途径。在植物中,在细胞质中是甲羟戊酸途径发挥作用,在色素体中是非甲羟戊酸途径发挥作用。通过甲羟戊酸途径发挥作用的酶的基因在各种植物中都是公知的。例如 Kutki (胡黄连)(Picrorhiza kurrooa)中(根较多含有环烯醚萜苷)登录了乙酰-CoA C-乙酰转移酶(碱基序列在GenBank的登录号为DQ347964,氨基酸序列的登录号为 ABC74567),巴西橡胶树(合成顺式聚异戊二烯)中登录了 HMG-CoA合成酶(碱基序列的登录号为AF^9389,氨基酸序列登录号为AAS46M5) ,HMT-CoA还原酶(碱基序列登录号为 XM659,氨基酸序列的登录号为P^057)、甲羟戊酸激酶(碱基序列登录号为AF429384,氨基酸序列登录号为AAL18925)、磷酸甲羟戊酸激酶(碱基序列登录号为AF429385,氨基酸序列登录号为AAL18i^6)、以及甲羟戊酸焦磷酸脱羧酶(碱基序列登录号AF429386,氨基酸序列的登录号为AAL18927)。中国原产的木本植物杜仲(Eucommia ulmoides Oliver)生产纤维状的长链反式聚异戊二烯。杜仲的叶、树皮和种皮中含有大量反式聚异戊二烯(非专利文献1)。杜仲的树皮作为滋养强壮和高血压的民间治疗药物,自古以来一直被使用。杜仲中含有类异戊二烯化合物的一种-环烯醚萜的苷(京尼平苷酸)(非专利文献2和幻,其具有降血压作用。如上所述,杜仲含有如反式聚异戊二烯和环烯醚萜苷等有用的类异戊二烯化合物。为了制备橡胶高含量的植物,人们希望获得参与杜仲中IPP生物合成途径的基因。以往,在从目标生物种中获得具有某种功能的同源基因时,是利用使用公知基因的DNA片段的杂交筛选、或者是利用公知基因的碱基序列的缩聚PCR与接下来的5’ -RACE、 3’ -RACE和RP-PCR组合的方法。但是,这些方法的准确性低,很麻烦。特别是目标基因的保守区域不明确时,则难于采用这些方法。对杜仲的基因序列进行了分析(非专利文献4和幻。非专利文献4中报道了参与甲羟戊酸途径的酶之一-HMG-CoA还原酶的基因及其序列。但是参与甲羟戊酸途径的除此之外的酶则未见报道。非专禾丨J文献 1 Bamba T, Fukusaki E, Nakazawa Y, and Kobatashi A, In-situ chemical analyses of tran-polyisoprene by histochemical staining and Fourier transform infrared microapectroscopy in a rubber-producing plant, Eucommia ulmoides Oliver. Planta 215:934-939(2002)非专利文献 2 :Kawasaki, Τ. , Uezono, K. , and Nakazawa, Y. , Antihypertensive mechanism of food for specified health use:"Eucommia leaf glycoside"and its clinical application, J. Health Sci.,22,29-36(2000)非专禾丨J文献 3 Nakmura, Τ. , Nakazawa, Y. , Onozuka, S. , Tanaka, C. , Yahara, S. and Nohara, Τ. , Studies on the constituents of Eucommia ulmoides iridoids from the leaves, Natural Medicines,51,275277(1997)非专利文献 4 Jiang J, Kai G, Gao X,and Chen F, Molecular cloning of a HMG-CoA reductase gene from Eucommia ulmoides Oliver.Biosci Rep 26: 171-181(2006)非专利文献4:Hou H-W,Zhou Y-T, Mwang K-N, Li ff-F, He X-Q,禾口 Cui K-M, ABPlexpression regulated by IAA and ABA is associated with the cambium periodicity in Eucommia ulmoides Oliv. J Exp Bot57 :3857-3867 (2006)

发明内容
本发明的目的在于提供参与杜仲的类异戊二烯化合物的生物合成的基因群。本发明提供参与由杜仲的甲羟戊酸合成异戊烯焦磷酸的基因。上述基因编码选自含有SEQ ID N0. 2的氨基酸序列1位-408位氨基酸的蛋白质、含有SEQ ID N0. 4的氨基酸序列1位-408位氨基酸的蛋白质、含有SEQ ID N0. 6的氨基酸序列1位-463位氨基酸的蛋白质、含有SEQ ID N0. 8的氨基酸序列1位-466位氨基酸的蛋白质、含有SEQ ID N0. 12 的氨基酸序列1位-6 位氨基酸的蛋白质、含有SEQ ID N0. 14的氨基酸序列1位-591位氨基酸的蛋白质、含有SEQ ID N0. 16的氨基酸序列1位-387位氨基酸的蛋白质、含有SEQ ID N0. 18的氨基酸序列1位-506位氨基酸的蛋白质、含有SEQ ID N0. 20的氨基酸序列1 位-418位氨基酸的蛋白质的蛋白质。在一个实施方案中,上述基因选自含有SEQ ID NO. 1的碱基序列101位-1327位核苷酸的基因、含有SEQ ID N0. 3的碱基序列1 位-13M位核苷酸的基因、含有SEQ ID N0. 5的碱基序列172位-1563位核苷酸的基因、含有SEQ ID N0. 7的碱基序列216位-1616 位核苷酸的基因、含有SEQ ID NO. 11的碱基序列32位-1921位核苷酸的基因、含有SEQ ID N0. 13的碱基序列60位-1835位核苷酸的基因、含有SEQ ID N0. 15的碱基序列61位-1224 位核苷酸的基因、含有SEQ ID N0. 17的碱基序列682位-2202位核苷酸的基因、含有SEQID NO. 19的碱基序列68位-13 位核苷酸的基因。在另外的实施方案中,上述基因选自含有SEQ ID NO. 1的碱基序列1位-1516位核苷酸的基因、含有SEQ ID NO. 3的碱基序列1位-1757位核苷酸的基因、含有SEQ ID NO. 5 的碱基序列1位-1892位核苷酸的基因、含有SEQ ID NO. 7的碱基序列1位-1833位核苷酸的基因、含有SEQ ID NO. 9的碱基序列1位-1825位核苷酸的基因、含有SEQ ID NO. 11 的碱基序列1位-2057位核苷酸的基因、含有SEQ ID N0. 13的碱基序列1位-2225位核苷酸的基因、含有SEQ ID N0. 15的碱基序列1位-1341位核苷酸的基因、含有SEQ ID N0. 17 的碱基序列1位4432位核苷酸的基因、含有SEQ ID N0. 19的碱基序列1位-1542位核苷酸的基因。本发明提供参与由杜仲的甲羟戊酸合成异戊烯焦磷酸的基因。
具体实施例方式本发明提供参与由杜仲的甲羟戊酸合成异戊烯焦磷酸(IPP)的基因。IPP的合成通过类异戊二烯化合物的生物合成的初期合成途径-甲羟戊酸途径进行。以下的酶参与甲羟戊酸途径⑴乙酰-CoA C-乙酰转移酶;⑵3-羟基-3-甲基戊二酰-CoA(HMG-CoA)合成酶;C3) HMG-CoA还原酶;(4)甲羟戊酸激酶;( 磷酸甲羟戊酸激酶;以及(6)甲羟戊酸焦磷酸脱羧酶(也称为“焦磷酸甲羟戊酸脱羧酶”)。甲羟戊酸途径中,通过(1)乙酰-CoA C-乙酰转移酶,由乙酰-CoA合成乙酰乙酰-CoA,通过(2)HMG-CoA合成酶,由乙酰乙酰-CoA 合成HMG-CoA,通过(3) HMG-CoA还原酶,将HMG-CoA转变为甲羟戊酸,通过甲羟戊酸激酶和( 磷酸甲羟戊酸激酶,将甲羟戊酸转变为甲羟戊酸5-焦磷酸,然后通过(6)甲羟戊酸焦磷酸脱羧酶生成异戊烯焦磷酸(IPP)。本发明的基因编码选自含有SEQ ID NO. 2的氨基酸序列1位_408位氨基酸的蛋白质(以下也称为“SEQ ID NO. 2的蛋白质”);含有SEQ ID NO. 4的氨基酸序列1位-408 位氨基酸的蛋白质(以下也称为“SEQ ID NO. 4的蛋白质”);含有SEQ ID NO. 6的氨基酸序列1位-463位氨基酸的蛋白质(以下也称为“SEQ ID NO. 6的蛋白质”);含有SEQ ID NO. 8的氨基酸序列1位-466位氨基酸的蛋白质(以下也称为“SEQ ID NO. 8的蛋白质”); 含有SEQ ID NO. 12的氨基酸序列1位-6 位氨基酸的蛋白质(以下也称为“SEQ ID NO. 12 的蛋白质”);含有SEQ ID NO. 14的氨基酸序列1位-591位氨基酸的蛋白质(以下也称为 "SEQ ID NO. 14的蛋白质”);含有SEQ ID NO. 16的氨基酸序列1位-387位氨基酸的蛋白质(以下也称为“SEQ ID NO. 16的蛋白质”);含有SEQ ID NO. 18的氨基酸序列1位-506 位氨基酸的蛋白质(以下也称为“SEQ ID NO. 18的蛋白质”);含有SEQ ID NO. 20的氨基酸序列1位-418位氨基酸的蛋白质(以下也称为“SEQ ID NO. 20的蛋白质”)的蛋白质。 含有SEQ ID NO. 10的1位-466位的氨基酸的蛋白质与SEQ ID NO. 8的蛋白质相同。SEQ ID N0. 2的蛋白质和SEQ ID N0. 4的蛋白质是(1)乙酰-CoA C-乙酰转移酶。 SEQ ID NO. 2的蛋白质由含有SEQ ID NO. 1的碱基序列101位-1327位的核苷酸的基因编码所得。该基因例如可含有SEQ ID NO. 1的全部碱基序列(1位-1516位)。SEQ ID NO. 4 的蛋白质可由含有SEQ ID NO. 3的碱基序列1 位-13M位的核苷酸的基因编码获得。该基因例如可含有SEQ ID NO. 3的全部碱基序列(1位-1757位)。SEQ ID N0. 6 的蛋白质和 SEQ ID N0. 8 的蛋白质是(2)HMG_CoA 合成酶。SEQ IDNO. 6的蛋白质由含有SEQ ID NO. 5的碱基序列172位-1563位的核苷酸的基因编码所得。 该基因例如可含有SEQ ID NO. 5的全部碱基序列(1位-1892位)。SEQ ID NO. 8的蛋白质可由含有SEQ ID NO. 7的碱基序列216位-1616位(或SEQ ID NO. 9的碱基序列216 位-1616位)的核苷酸的基因编码获得。该基因中包含例如含有SEQ ID NO. 7的碱基序列 1位-1833位的核苷酸的基因、以及含有SEQ ID NO. 9的碱基序列1位-1825位的核苷酸的基因。具有SEQ ID NO. 9所示碱基序列的基因在其1689位-1825位的区内,相对于具有 SEQ ID NO. 7所示的碱基序列的基因的1689位-1833位的区,具有6处(SEQ ID NO. 7的碱基序列1689位、1709位、1713位、1745位、1756位和1820位)的置换和1处(SEQ ID NO. 7 的碱基序列1777位)的缺失以及3’末端的聚腺苷部位的缩短。SEQ ID N0. 12 的蛋白质和 SEQ ID N0. 14 的蛋白质是(3) HMG-CoA 还原酶。SEQ ID N0. 12的蛋白质由含有SEQ ID W). 11的碱基序列32位-1921位的核苷酸的基因编码所得。 该基因例如可含有SEQ ID NO. 11的全部碱基序列(1位-2057位)。SEQ ID N0. 14的蛋白质可由含有SEQ ID N0. 13的碱基序列60位-1835位的核苷酸的基因编码获得。该基因例如可含有SEQ ID N0. 13的全部碱基序列(1位-2225位)。SEQ ID N0. 16的蛋白质是甲羟戊酸激酶。SEQ ID N0. 16的蛋白质由含有SEQ ID N0. 15的碱基序列61位-12M位的核苷酸的基因编码所得。该基因例如可含有SEQ ID N0. 15的全部碱基序列(1位-1341位)。SEQ ID N0. 18的蛋白质是(5)磷酸甲羟戊酸激酶。SEQ ID N0. 18的蛋白质由含有SEQ ID N0. 17的碱基序列682位-2202位的核苷酸的基因编码所得。该基因例如可含有SEQ ID N0. 17的全部碱基序列(1位4432位)。SEQ ID N0. 20的蛋白质是(6)甲羟戊酸焦磷酸脱羧酶。SEQ ID N0. 20的蛋白质由含有SEQ ID N0. 19的碱基序列68位-13 位的核苷酸的基因编码所得。该基因例如可含有SEQ ID N0. 19的全部碱基序列(1位-1542位)。本发明的基因只要可以表达与具有上述氨基酸序列的酶功能性同等的酶、或者是可与具有上述碱基序列的基因发挥同样功能即可,可以编码一个或多个氨基酸残基不同的蛋白质,或者可以有一个或多个碱基不同。上述序列的不同可以由于碱基的置换、缺失和/ 或插入获得,或者发生天然诱变或者是人工诱变(例如定点突变导入法的应用)的任意方式。基因的功能的确定例如可采用如以下实施例2所记载的基本方法的、本领域技术人员通常使用的方法进行。本发明的基因是本领域技术人员采用通常所使用的方法,按照本说明书记载的序列信息制备探针或引物,以杜仲的染色体DNA或cDNA为模板,通过PCR获得目标片段。当然也可以以RNA为模板,利用反转录PCR。本发明的基因除DNA、RNA等天然多核苷酸之外, 也可以是含有人工的核苷酸衍生物的人工分子。本发明的基因还可以是DNA-RNA的嵌合分子。本发明的基因可以使用本领域技术人员通常所采用的方法,导入到酵母等微生物或植物中。本发明的基因可在宿主中转化,以表达1个或多个、或者是全部。例如其构成可以是表达存在于甲羟戊酸途径中的一组酶(上述(1)至(6))中的至少一个。本发明的基因适合用于制备大量含有反式聚异戊二烯或环烯醚萜的基因重组植物(例如杜仲)。本发明的基因例如通过转化杜仲,可用于制备较多含有橡胶的植物。
实施例以下给出实施例,进一步具体说明本发明,但本发明并不限于此。(实施例1杜仲中的EST分析)(材料)作为杜仲植物体试样,使用在5月下旬、从爱媛县生名村生长的杜仲标准树采集的当年幼枝的韧皮部(树皮)和木质部。酵母的突变株文库使用市售的YKO Heterozygous Essential Strain Collection-Glycerol Stocks (Open Biosystems 公司)。(由杜仲中提取RNA)将约4g杜仲植物体试样(当年枝的韧皮部和木质部)边用液氮冷却,边用乳钵、 研磨棒破碎,悬浮于试样的10倍量(w/v)的2XCTAB溶液(w/v)十六烷基三甲基溴化铵(CTAB)、1% (w/v) 2-巯基乙醇、0. IM Tris-HCl(pH 9. 5)、1.4M NaCl、20mM EDTA。将其在65°C下温育10分钟,接着用氯仿/异戊醇处理(洗涤)(反复两次)。向回收的水层中加入1/4(ν/ν)量的IOM LiCl并混合,在_20°C下温育2小时,进行RNA的选择性沉淀。将其离心,将沉淀溶解于适量的Tris-EDTA(TE)缓冲液中,离心分离,回收上清,排除多糖类。 将回收的上清进行苯酚处理、苯酚/氯仿处理和氯仿/异戊醇处理,再次通过LiCl进行RNA 的选择性沉淀。将沉淀用70%乙醇洗涤,减压干燥,接着溶解于焦碳酸二乙酯(DEPC)处理水中。通过吸光度测定对所得RNA进行定量,通过电泳确认。由约4g木质部中获得0. S^ig RNA,由约4g韧皮部中获得2mgRNAQ60nm和^Onm下的吸收比分别为1. 956和1. 990)。(杜仲cDNA文库的制备)通过日立计测器服务株式会社的G- * 7 O 7方法,由来自杜仲韧皮部和木质部的RNA试样制备cDNA文库。来自韧皮部的cDNA文库的文库大小为3. 8 X 105,插入率为 88% ( 个样品/琼脂糖凝胶电泳),全长率86% (对于插入的克隆)。来自木质部的cDNA 的文库大小为2. 2 X 105,插入率为79% ( 个样品/琼脂糖凝胶电泳),全长率63% (相对于有插入的克隆)。(EST序列的序列分析)在北里大学北里生命科学研究所基因组情报学研究室中,对于来自杜仲韧皮部和木质部的cDNA文库的各约20000个克隆进行序列分析。根据由序列分析得到的序列信息, 除去未保有插入的克隆和无法阅读序列的克隆,获得精度高的序列信息。对于韧皮部和木质部的文库,分别得到了 16567和16113长度的精度高的EST序列(合计32680)。对于所得序列进行分组(聚类)(clustering)和注解(annotation)。“分组”是在EST序列中,将同一序列、类似序列分成一组。为了进行分组,使用NTT软件的VISUALBI0 clustering. “注解”是通过与已知基因比较,对EST序列进行注解。注解时使用采用NCBI BLAST的同源性检索。检索时所使用的数据库是nr(All non-redundant GenBank CDS trgmsliitions+PDB+SwissProt+PIR(月太·歹))。根据分组和注解所得的信息,发现了推定为编码乙酰-CoA C-乙酰转移酶、 HMG-CoA合成酶、HMG-CoA还原酶、甲羟戊酸激酶和甲羟戊酸焦磷酸脱羧酶的EST序列。这些酶均是参与杜仲的类异戊二烯化合物的生物合成中初期合成途径的酶。(实施例2编码乙酰-CoA C-乙酰转移酶的基因1)
(全长cDNA的获得)通过3,-RACE (cDNA末端的快速扩增,RACE),由通过实施例1的分析得到的序列确定3’末端一侧的序列,获得全长cDNA。3,-RACE使用3,-Full RACE Core Set (夕力,“λ才株式会社制备)。反转录反应中使用oligo-dT弓丨物。PCR扩增使用与oligo-dT的引物和与已知序列的一部分为相同的序列的有义引物。有义引物根据推定为实施例1所得的编码乙酰-CoA C-乙酰转移酶的 EST序列信息设计。以实施例1所得的RNA为模板,第1次是使用N192-82-tree_1968_3R_ S1(SEQ ID NO. 21)作为有义引物,第 2次是使用 m92-82-tree_1968_3R_s2(SEQ ID NO. 22) 作为有义引物,按照说明书进行PCR。将反转录反应和由PCR得到的扩增片段TA克隆到 pT7Blue载体中,进行序列分析。所得全长cDNA具有SEQ ID NO. 1的碱基序列。SEQ ID NO. 1所述的碱基序列146 位-1299位的核苷酸所示的区域的碱基序列与Kutki的乙酰-CoA C-乙酰转移酶(GenBank 登录号DQ347964)具有82%的同源性。开放阅读框是101位-1327位。由该cDNA编码的推定的氨基酸序列如SEQ ID N0. 2所示。SEQ ID N0. 2的全长氨基酸序列(1位-408位) 与Kutki的乙酰-CoA C-乙酰转移酶(登录号ABC74567)具有89%的同源性。(使用酵母突变株文库的互补性试验)使用用酵母突变株文库进行的互补性试验确认所得cDNA的功能。该互补性试验如下进行。使用附加有与PYES2载体(invitrogen制备)的多克隆位点的40bp为相同序列的有义引物和反义引物,进行PCR(95°C下将5分钟作为1个循环;然后95°C下将1分钟、54°C 下将1分钟和72°C下将1分钟作为30个循环;在72°C下将7分钟作为1个循环;以及4°C 下将⑴作为1个循环),扩增目标基因的翻译区序列。将该扩增片段和用限制酶处理成直链状的PYES2载体导入到Ursi的酵母株 Y22800 (EUR0SCARF制备)中。作为分析对象的乙酰-CoA C-乙酰转移酶基因对于酵母的生长来说是必须的,因此,作为互补试验的背景,该酵母使用只有一侧的对位基因缺失目标基因的杂合二倍体。基因导入时使用 Frozen-EZ Yeast Transformation II (ΖΥΜ0 RESEARCH 制备)。将转化后的酵母接种于极限完全培养基(无尿嘧啶),在30°C下培养。将生长的集落接种于新的极限完全培养基(无尿嘧啶)中,接着在30°C下培养。酵母突变株是尿嘧啶需求性,PYES2载体中含有URA3基因(编码乳清苷5’ -磷酸脱羧酶)的序列,因此只有转化的菌体可以生长。生长的菌体通过PCR检查其是否含有插入片段,接着,将该菌体转移至YPDA培养基中,在30°C下培养。将其转移至孢子形成培养基,在25°C下培养,将所得孢子进行四分体分析。插入到pYES2载体的多克隆位点上的目标基因上的上游存在GALl启动子,因此, 目标基因只在半乳糖存在下诱导表达。因此,判定是否在YPD培养基或YPG培养基(碳源 半乳糖)上进行生长。在YPD培养基中,来自突变株的二分体致死,只有来自野生型的二分体生长。而在YPG培养基(碳源半乳糖)上,具有GALl启动子的pYES2载体诱导插入基因的表达,因此,如果功能互补,则来自突变株的可以存活,三分体或四分体生长。这样,通过进行互补的确认,可以进行目标基因的功能确定。并且,将由四分体分析得到的来自八孢子囊的集落(可认为是单倍体)影印到(A)YPG培养基(碳源半乳糖)、⑶极限完全培养基(碳源半乳糖、不含有尿嘧啶)、(C)YPG 培养基(碳源半乳糖,含有抗生素G418)、或(D)YPG培养基(碳源葡萄糖)上。保有质粒的培养株在⑶的极限完全培养基(碳源半乳糖,不含尿嘧啶)中生长。突变株具有G418抗性基因,因此可认为在(C)YPG培养基(碳源半乳糖,含有抗生素 G418)中生长。由这些培养基中的生长结果可以判别出保有质粒的单倍体突变株。在(D) 的YPD培养基(碳源葡萄糖)中,保有质粒的突变株(单倍体)应无法生长,但实际上难以判定其生长的有无。因此通过筛选判别生长的有无。本实施例中,使用N219-36-tree_1968_S(SEQ ID NO. 23)作为有义引物,使用 N219-36-tree_1968_a(SEQ ID NO. 24)作为反义引物,以上述“完全cDNA的获得”中得到的 cDNA作为模板,进行PCR,扩增目标翻译区的序列。将该扩增片段供给上述互补性试验。在四分体分析中观察到在YPG培养基(碳源半乳糖)上的生长。并且通过使用来自八孢子囊的集落的生长观察,观察到在(B)极限完全培养基(碳源半乳糖,不含尿嘧啶)上的生长。结果,通过互补,确定了乙酰-CoA C-乙酰转移酶基因的功能。(实施例3编码乙酰-CoA C-乙酰转移酶的基因2)使用根据实施例1得到的推定为编码乙酰-CoA C-乙酰转移酶的EST序列的信息设计的 N192-84-tree_11012_3R_sl(SEQ ID NO. 25)(第 1 次)和 N192-84_tree_11012_3R_ s2(SEQ ID NO. 26)(第2次)作为3,-RACE用的有义引物,除此之外与实施例2同样,得到全长cDNA。所得全长cDNA具有SEQ ID NO. 3的碱基序列。SEQ ID N0. 3的碱基序列173 位-1305位的核苷酸所示的区域的碱基序列与Kutki的乙酰-CoAC-乙酰转移酶(登录号 DQ347964)具有83%的同源性。开放阅读框为1 位-13M位。由该cDNA编码的推定氨基酸序列如SEQ ID N0. 4所示。SEQ ID N0. 4的全长氨基酸序列(1位-408位)与Kutki 的乙酰-CoA C-乙酰转移酶(登录号ABC74567)具有87%的同源性。本实施例中,使用N219-36_tree_11012_s(SEQ ID NO. 27)作为有义引物,使用 N-219-36-tree_11012_a(SEQ ID NO. 28)作为反义引物,以上述所得cDNA为模板,除此之外与实施例2同样进行PCR,扩增目标翻译区的序列。将该扩增片段与实施例2同样供给互补性试验,得到了与实施例2同样的结果。在四分体分析中观察到在YPG培养基(碳源半乳糖)上的生长。并且,通过使用来自八孢子囊的集落的生长观察,观察到在(B)极限完全培养基(碳源半乳糖,不含尿嘧啶)上的生长。结果,通过互补确定了乙酰-CoA C-乙酰转移酶基因的功能。(实施例4编码HMG-CoA合成酶的基因1)。使用基于实施例1所得的推定为编码HMG-CoA合成酶的EST序列的信息设计的 N192-71-tree_6098_3R_sl (SEQ ID Ν0· 29)(第 1 次)和N192-71_tree_6098_3R_s2 (SEQ ID NO. 30)(第2次)作为3,-RACE的有义引物,除此之外与实施例2同样,得到全长cDNA。所得的全长cDNA具有SEQ ID N0. 5的碱基序列。SEQ ID N0. 5的碱基序列172 位-1187位的核苷酸所示的区域和1390位-1439位的核苷酸所示的区域的碱基序列,分别与巴西橡胶树的HMG-CoA合成酶(登录号AF429389)具有83%和86%的同源性。开放阅读框是172位-1563位。由该cDNA编码的推定氨基酸序列如SEQ ID N0. 6所示。SEQ ID N0. 6的全长氨基酸序列(1位-463位)与巴西橡胶树的HMG-CoA合成酶(登录号AAS46245)具有85%的同源性。本实施例中,有义引物使用N219-36_tree_6098_s(SEQ ID NO. 31),反义引物使用 N219-36-tree_6098_a (SEQ ID NO. 32),以上述所得cDNA为模板,除此之外与实施例2同样进行PCR,扩增目标翻译区的序列。与实施例2同样,将该扩增片段供给互补性试验。突变株使用Ura的HMG-CoA合成酶缺损株Y26527 (EUR0SCARF制备)。在四分体分析中观察到在YPG培养基(碳源半乳糖)上的生长。并且,在使用来自八孢子囊的集落的生长观察中,观察到在(B)极限完全培养基(碳源半乳糖,不含尿嘧啶)上的生长。结果,通过互补确定了 HMG-CoA合成酶基因的功能。(实施例5编码HMG-CoA合成酶的基因2)使用实施例1所得的推定编码HMG-CoA合成酶的EST序列的信息设计的 N192-36-tree_10370_3R_sl (SEQ ID NO. 33)(第 1 次)和 N192-36_tree_10370_3R_s2 (SEQ ID NO. 34)(第2次),作为3,-RACE用的有义引物,除此之外与实施例2同样得到全长cDNA。 得到了两个全长cDNA。所得的第一全长cDNA具有SEQ ID NO. 7的碱基序列。SEQ ID N0. 7的碱基序列 234位-1496位的核苷酸所示区域的碱基序列与巴西橡胶树的HMG-CoA合成酶(登录号 AF429389)具有81%的同源性。所得第二全长cDNA具有SEQ ID N0. 9的碱基序列。该第二 cDNA在其1689位-1825位的区域内,对应第一 cDNA的1689位-1833位的区域有6处(第一 cDNA 的 1689 位、1709 位、1713 位、1745 位、1756 位和 1820 位)置换和 1 处(第一 cDNA 的1777位)缺失、以及3,末端的聚腺苷部位的缩短。SEQ ID N0. 9的碱基序列也与SEQ ID N0. 7的碱基序列同样,与巴西橡胶树的HMG-CoA合成酶(登录号AF^9389)具有81% 的同源性。开放阅读框在两个碱基序列均为216位-1616位。由这些cDNA编码的推定氨基酸序列分别如SEQ ID N0.8和10所示,它们是相同的序列。该推定氨基酸序列在SEQ ID N0. 8的6位-452位的氨基酸区域中,与巴西橡胶树的HMG-CoA合成酶(登录号AAS46245) 具有84%的同源性。本实施例中,使用N219-36_tree_10370_s(SEQ ID NO. 35)作为有义引物,使用 N219-36-tree_10370_a(SEQ ID NO. 36)作为反义引物,以上述所得cDNA作为模板,除此之外与实施例2同样进行PCR,扩增目标翻译区的序列。与实施例2同样,将该扩增片段供给互补性试验。突变株使用tea—的HMG-CoA合成酶缺损株Y26527(EUR0SCARF制备)。在四分体分析中观察到YPG培养基(碳源半乳糖)上的生长。并且,在使用来自八孢子囊的集落的生长观察中,观察到在(B)极限完全培养基(碳源半乳糖,不含尿嘧啶)上的生长。 结果,通过互补,确定了 HMG-CoA合成酶基因的功能。(实施例6编码HMG-CoA还原酶的基因1)关于编码HMG-CoA还原酶的基因,为了获得全长cDNA,采用5,RACE、3,RACE和反转录反应组合的方法。该方法中,使用5,-Full RACE Core Set (TaKaRa制.备)和3,_Full RACE Core Set (TaKaRa制备)。根据实施例1所得的推定为编码HMG-CoA还原酶的EST序列设计m92-45-tree_8220_5R_al (SEQ ID NO. 37)(第一次)和 m92-45_tree_8220_5R_ a2 (SEQ ID NO. 38)(第二次)作为 5,RACE 用的反义引物,N192-45-tree_8220_5R_3R_ si (SEQ ID NO. 39)(第一次)和 m92-45_tree_8220_5R_3R_s2 (SEQ ID NO. 40)(第二次) 作为3,-RACE用的有义引物,N192-45-tree_8220_5R_p (SEQ ID NO. 41)作为反转录反应用。以实施例1所得的RNA为模板,与实施例2同样地,将它们反应所得的扩增片段TA克隆到pTCBlue载体上,进行序列分析。所得全长cDNA具有SEQ ID NO. 11的碱基序列。SEQ ID NO. 11的碱基序列沈0 位-303位的核苷酸所示区域、773位-936位的核苷酸所示区域、以及1148位-1845位的核苷酸所示的的区域的碱基序列分别与苹果(Malus χ domestica)的HMG-CoA还原酶(登录号AF315713)具有88%、82%和81 %的同源性。开放阅读框是32位-1921位。由该cDNA 编码的推定氨基酸序列如SEQ ID NO. 12所示。在SEQ ID NO. 12的33位-612位的氨基酸区域中,该推定氨基酸序列与喜树(Camptotheca acuminata)的HMG-CoA还原酶(登录号 P48021)具有78%的同源性。SEQ ID N0. 12的33位-612位的氨基酸区域与非专利文献4 的HMG-CoA还原酶(登录号AAVM051)具有73%的同源性。因此,可以认为序列号11的碱基序列是来自与非专利文献4的基因不同的基因座的HMG-CoA还原酶基因。(实施例7编码HMG-CoA还原酶的基因2)根据实施例1所得的推定为编码HMG-CoA还原酶的EST序列设计 N192-47-tree_13453_5R_al (SEQ ID NO. 42)(第一次)和 N192_47_tree_13453_5R_a2 (SEQ ID NO. 43)(第二次)作为 5,RACE 用的反义引物,N192-47-tree_13453_5R_3R_sl (SEQ ID NO. 44)(第一次)和 m92-47-tree_i;3453_5R_3R_s2(SEQ ID NO. 45)(第二次)作为 3,-RACE用的有义引物,N192-47-tree_13453_5R_p(SEQ ID NO. 46)作为反转录反应用,除此之外与实施例6同样,得到全长cDNA。所得全长cDNA具有SEQ ID NO. 13的碱基序列。SEQ ID NO. 13的碱基序列169 位-373位的核苷酸所示区域、751位-1600位的核苷酸所示区域、以及1637位-1720位的核苷酸所示的的区域的碱基序列,分别与喜树的HMG-CoA还原酶(登录号U72145)具有 79^^80%和89%的同源性。开放阅读框是60位-1835位。由该cDNA编码的推定氨基酸序列如SEQ ID N0. 14所示。在SEQ ID N0. 14的1位-588位的氨基酸区域中,该推定氨基酸序列与烟草(Nicotiana tabacum)的HMG-CoA还原酶(登录号AAB87727)具有78%的同源性。SEQ ID N0. 14的1位-589位的氨基酸区域与非专利文献4的HMG-CoA还原酶(登录号AAVM051)具有75%的同源性。因此,可以认为序列号13的碱基序列也是来自与非专利文献4的基因不同的基因座的HMG-CoA还原酶基因。(实施例8编码甲羟戊酸激酶的基因)3’ -RACE用的有义引物使用基于实施例1所得的推定为编码甲羟戊酸激酶的EST 序列的信息设计的tree 1729引物(SEQ ID Ν0· 47)(第一次)和tree 1729引物套(SEQ ID NO. 48)(第二次),除此之外与实施例2同样,得到全长cDNA。所得全长cDNA具有SEQ ID N0. 15的碱基序列。SEQ ID N0. 15的碱基序列 616位-1104位的核苷酸所示区域的碱基序列与巴西橡胶树的甲羟戊酸激酶(登录号 AF429384)具有83%的同源性。开放阅读框是61位-12M位。由该cDNA编码的推定氨基酸序列如SEQ ID N0. 16所示。SEQ ID N0. 16全长氨基酸序列(1位-387位)与巴西橡胶树的甲羟戊酸激酶(登录号AAL18925)具有77%的同源性。本实施例中,使用N219-36_tree_1729_s(SEQ ID NO. 49)作为有义引物,使用 N219-36-tree_1729_a(SEQ ID NO. 50)作为反义引物,以上述所得cDNA作为模板,除此之外与实施例2同样进行PCR,扩增目标翻译区的序列。将该扩增片段与实施例2同样地供给互补性试验。突变株使用Ura的甲羟戊酸激酶缺损株Y20794 (EUR0SCARF制备)。在四分体分析中观察到在YPG培养基(碳源半乳糖)上的生长。并且,在使用来自八孢子囊的集落的生长观察中,观察到在(B)极限完全培养基(碳源半乳糖,不含尿嘧啶)上的生长。结果,通过互补,确定了甲羟戊酸激酶基因的功能。(实施例9编码磷酸甲羟戊酸激酶的基因)以实施例1所得cDNA文库作为模板,使用以下引物进行PCR,获得部分序列。该简并PCR中使用的引物如下第一次使用S_No. 243_Ρ· 10_1 (SEQ ID NO. 51)作为有义引物和使用 AS_No. 243_P. 10_1 (SEQ ID NO. 52)作为反义引物;第一次使用 S_No. 243_P. 10_2 (SEQ ID NO. 53)作为有义引物和使用AS_No. 243_P. 10_2(SEQ ID NO. 54)作为反义引物,引物的设计基于 BAD93946(拟南芥,Arabidopsis thaliana)、AAL18926(巴西橡胶树,Hevea brasiliensis)、CAB52^4(粟酒裂殖酵母,Schizosaccharomyces pombe)、NP593421 (粟酒裂殖酵母,Schizosaccharomyces pombe)、P24521 (酉良酒酵母,Saccharomyces cerevisiae) 和XP329795(粗糙脉孢霉,Neurospora crassa)的六个氨基酸序列的保守区域进行。PCR 的条件如下(第一次PCR)95 0C 5分钟进行一个循环;将95 °C 1分钟、55°C 1分钟、72°C 1分30秒进行30个循环;72°C 7分钟进行一个循环;4°Cc 进行一个循环;(第二次PCR)95 0C 5分钟进行一个循环;将95 °C 1分钟、55°C 1分钟、72°C 1分30秒进行30个循环;72°C 7分钟进行一个循环;4°Cc 进行一个循环;上述部分序列中未得到3’末端和5’末端的碱基序列信息,因此,以实施例1所得的RNA作为模板,进行5’ -RACE,3' -RACE和反转录反应。该方法中使用5’ -Full RACE Core Set (Takara)和3’_Full RACE Core Set (Takara)。根据所得部分片段的信息设计第一次的 No. 243_P. 51_race_al (SEQ ID NO. 56)和第二次的 No. 243_P. 51_race_a2 (SEQ ID NO. 55)作为 5’-RACE 用的反义引物,第一次的 No. 243_P. 51_race_sl (SEQ ID NO. 57)和第二次的 No. 243_P. 51_race_s2(SEQ ID NO. 58)作为 3,-RACE 用的有义引物,No. 243_P. 51_ race_p (SEQ ID NO. 59)作为反转录反应用。由此得到3’末端和5’末端的碱基序列信息。根据3’末端和5’末端的碱基序列信息,设计cDNA文库筛选用探针,使用SEQ ID N0. 60的引物作为有义引物,使用SEQ ID N0. 61的引物作为反义引物,进行PCR。以所得片段作为探针,筛选实施例1所得的cDNA文库。将所得片段TA克隆到pT7Blue载体上,进行序列分析。所得cDNA片段的全部碱基序列如SEQ ID N0. 17所示。SEQ ID N0. 17的碱基序列681位-886位的核苷酸所示的区域、922位-1000位的核苷酸所示的区域、1042位_1观5 位的核苷酸所示的区域、1339位-1732位的核苷酸所示的区域、以及1807位-20M位的核苷酸所示区域的碱基序列分别与巴西橡胶树的磷酸甲羟戊酸激酶(登录号具有 83 %、84 %、81 %、81 %和78 %的同源性。开放阅读框为682位-2202位。由该cDNA编码的推定氨基酸序列如SEQ ID N0. 18所示。SEQ ID N0. 18的全长氨基酸序列(1位-506位) 与巴西橡胶树的磷酸甲羟戊酸激酶(登录号AAL18926)具有78%的同源性。本实施例中,使用SEQ ID N0. 62的引物作为有义引物,使用SEQ ID N0. 63的引物作为反义引物,以上述所得cDNA作为模板,除此之外与实施例2同样进行PCR,扩增目标翻译区的序列。将该扩增片段与实施例2同样供给互补性试验。突变株使用Ursi的磷酸甲羟戊酸激酶缺损株Y20806 (EUR0SCARF制备)。在四分体分析中观察到在YPG培养基(碳源 半乳糖)上的生长。并且,在使用来自八孢子囊的集落的生长观察中,观察到在(B)极限完全培养基(碳源半乳糖,不含尿嘧啶)上的生长。结果,通过互补,确定了磷酸甲羟戊酸激酶基因的功能。(实施例10编码甲羟戊酸焦磷酸脱羧酶的基因)使用基于实施例1所得的推定为甲羟戊酸焦磷酸脱羧酶的EST序列的信息设计的 Nl92-102_tree_l3103_3R_sl(SEQ ID NO. Μ)(第一次)和 Nl92-102_tree_l3103_3R_ s2(SEQ ID NO. 65)(第二次)作为3,-RACE用的有义引物,除此之外与实施例2同样,得到全长cDNA。所得全长cDNA具有SEQ ID NO. 19的碱基序列。SEQ ID NO. 1的碱基序列100 位-1325位的核苷酸所示区域的碱基序列与巴西橡胶树的甲羟戊酸焦磷酸脱羧酶(登录号 AF429386)具有80%的同源性。开放阅读框为68位-13M位。由该cDNA编码的推定氨基酸序列如SEQ ID NO. 20所示。在SEQ ID N0. 20的5位-418位的氨基酸区域中,该推定氨基酸序列与巴西橡胶树的甲羟戊酸焦磷酸脱羧酶(登录号AAL18927)具有84%的同源性。本实施例中,使用N219-36_tree_13103_s(SEQ ID NO. 66)作为有义引物,使用 N219-36-tree_13103_a(SEQ ID NO. 67)作为反义引物,以上述所得cDNA作为模板,除此之外与实施例2同样进行PCR,扩增目标翻译区的序列。将该扩增片段与实施例2同样供给互补性试验。突变株使用Ursi的甲羟戊酸焦磷酸脱羧酶缺损株Y2M18 (EUR0SCARF制备)。 在四分体分析中观察到在YPG培养基(碳源半乳糖)上的生长。并且,在使用来自八孢子囊的集落的生长观察中,观察到在(B)极限完全培养基(碳源半乳糖,不含尿嘧啶)上的生长。结果,通过互补,确定了甲羟戊酸焦磷酸脱羧酶基因的功能。产业实用性本发明提供编码杜仲的类异戊二烯化合物的生物合成中的初期合成途径-甲羟戊酸途径的各种酶的基因。本发明的基因适合用于制备大量含有反式异戊二烯或环烯醚萜的基因重组植物(例如杜仲)。
权利要求
1.基因,该基因是参与由杜仲的甲羟戊酸合成异戊烯焦磷酸的基因,该基因编码由SEQ ID NO. 20的氨基酸序列1位-418位氨基酸组成的甲羟戊酸焦磷酸脱羧酶的基因。
2.如权利要求1所述的基因,其中,上述基因选自含有SEQID NO. 19的碱基序列68 位-13M位核苷酸的基因。
3.如权利要求2所述的基因,其中,上述基因选自含有SEQID NO. 19的碱基序列1 位-1542位核苷酸的基因。
全文摘要
本发明提供参与杜仲的类异戊二烯化合物生物合成的基因群。本发明还提供参与由杜仲的甲羟戊酸合成异戊烯焦磷酸的基因。本发明的基因编码杜仲的乙酰-CoA C-乙酰转移酶、HMG-CoA合成酶、HMG-CoA还原酶、甲羟戊酸激酶、磷酸甲羟戊酸激酶或甲羟戊酸焦磷酸脱羧酶。
文档编号C12N15/60GK102453724SQ201110355190
公开日2012年5月16日 申请日期2008年6月20日 优先权日2007年6月21日
发明者中泽庆久, 小林昭雄, 福崎英一郎, 西河贵史, 马场健史 申请人:国立大学法人大阪大学, 日立造船株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1