水溶性大麻素在植物系统中高水平体内生物合成和分离的制作方法

文档序号:21366247发布日期:2020-07-04 04:41阅读:15583来源:国知局
水溶性大麻素在植物系统中高水平体内生物合成和分离的制作方法

本申请要求2017年3月24日提交的美国临时申请no.62/476,080、2017年11月20日提交的美国临时申请no.62/588,662和2018年1月21日提交的美国临时申请no.62/621,166的权益和优先权。上述申请的整个说明书和附图在此通过引用整体并入。

序列表

本申请包含序列表,该序列表已经以ascii格式电子提交,并且其全部内容通过引用并入本文。

本发明的领域一般涉及植物分子生物学和植物生物技术。更具体地,本发明涉及用于从植物系统(包括整株植物和/或植物细胞培养系统)体内产生、修饰和分离大麻素化合物的新系统、方法和组合物。在某些优选的实施方案中,本发明的技术包括遗传修饰植物或植物细胞悬浮培养物以在大麻和/或本生烟和/或烟草中产生、修饰和/或积累一种或多种目标大麻素的新系统。



背景技术:

大麻素是一类由大麻合成的专门化合物。它们通过萜烯和酚前体的缩合形成。它们包括这些更丰富的形式:δ-9-四氢大麻酚(thc)、大麻二酚(cbd)、大麻色烯(cbc)和大麻萜酚(cbg)。另一种大麻素-大麻酚(cbn)由thc作为降解产物形成,并且可以在一些植物株中检测到。通常,thc、cbd、cbc和cbg在各种植物株中以不同比例一起出现。

基于它们是否含有羧基,大麻素一般分为中性大麻素和大麻素酸两种。众所周知,在新鲜植物中,中性大麻素的浓度远低于大麻素酸的浓度。一株cannabissativa含有大约61种属于大麻素的一般类别的化合物。这些大麻素通常是亲脂性无氮的,主要是酚类化合物,并且是由单萜和酚生物遗传得到的,酸大麻素来自单萜和酚羧酸,并且具有c21至碱性物质。

大麻素也在植物产品中发现了相应的羧酸。通常,羧酸具有生物合成前体的功能。例如,这些化合物在体内由thc羧酸通过使四氢大麻酚δ9-和a8-thc和来自相关的大麻二酚的cbd脱羧而产生。如图28中一般所示,thc和cbd可以通过非酶促脱羧从其酸性前体四氢大麻酚酸(thca)和大麻二酚酸(cbda)人工衍生。

大麻素在世界各地以各种形式被广泛消费。大麻素丰富的大麻制剂,无论是草本植物(即大麻)还是树脂形式(即大麻油),被估计占世界人口的2.6-5.0%所使用(unodc,2012)。含有天然大麻提取物或合成大麻素屈大麻酚或大麻隆的含有大麻素的药品可在若干国家用于医疗用途。

如上所述,δ-9-四氢大麻酚(也称为thc)是大麻植物中的主要生物活性成分之一,已被食品和药物管理局(fda)批准用于控制与化疗有关的恶心和呕吐,并且最近用于患有消耗综合症的艾滋病患者的食欲刺激。然而,该药物显示出其他可用于治疗应用的生物活性,例如治疗青光眼、偏头痛、痉挛、焦虑和镇痛。

事实上,有充分证据表明,能激活体内大麻素受体的诸如大麻素和内源性大麻素之类的试剂调节食欲并缓解恶心、呕吐和疼痛(martinb.r.andwiley,j.l,mechanismofactionofcannabinoids:howitmayleadtotreatmentofcachexia,emesisandpain,journalofsupportiveoncology2:1-10,2004)、多发性硬化(pertwee,r.g.,cannabinoidsandmultiplesclerosis,pharmacol.ther.95,165-174,2002)和癫痫(wallace,m.j.,blair,r.e.,falenski,k.ww.,martin,b.r.,anddelorenzo,r.j.journalpharmacologyandexperimentaltherapeutics,307:129-137,2003)。此外,已显示cb2受体激动剂在动物模型中治疗疼痛方面是有效的(claytonn.,marshallf.h.,bountrac,o'shaughnessyc.t.,2002.cb1andcb2cannabinoidreceptorsareimplicatedininflammatorypain.96,253-260;malant.p.,ibrahimm.m.,vanderaht.w.,makriyannisa.,porrecaf.,2002.inhibitionofpainresponsesbyactivationofcb(2)cannabinoidreceptors.chemistryandphysicsoflipids121,191-200;malant.p.,jr.,ibrahimm.m.,dengh.,liuq.,matah.p.,vanderaht.,porrecaf.,makriyannisa.,2001.cb2cannabinoidreceptor-mediatedperipheralantinociception.93,239-245.;quartilhoa.,matah.p.,ibrahimm.m.,vanderaht.w.,porrecaf.,makriyannisa.,malant.p.,jr.,2003.inhibitionofinflammatoryhyperalgesiabyactivationofperipheralcb2cannabinoidreceptors.anesthesiology99,955-960)和治疗多发性硬化方面是有效的(pertwee,r.g.,cannabinoidsandmultiplesclerosis,pharmacol.ther.95,165-174,2002)。

最近,一些州批准使用大麻和大麻素注入的产品用于娱乐和医疗用途。随着这些新的医疗和商业市场的发展,人们越来越需要开发更有效的大麻素化合物的产生和分离。大麻素产生的传统方法通常集中在从原始收获的大麻中提取和纯化大麻素。然而,传统的大麻素提取和纯化方法存在许多限制其有用性的技术和实际问题。

传统大麻素产生和提取方法的局限性

例如,在uspat.no.6,403,126(websteretal.)中,从原始收获的大麻中分离出大麻素和其他相关化合物,并用有机溶剂(通常是石油衍生的烃)或低分子量的醇处理,以溶解大麻素以便以后分离。这种传统方法的局限性在于它依赖于可已经暴露于各种有毒农药、除草剂等的天然生长的植物物质。另外,这种传统的提取方法是不精确的,从而导致提取的thc的浓度不可靠和变化。此外,许多大麻株在水培环境中生长,这些环境也没有受到调节,并且可导致这些株被化学和其他不希望的化合物广泛污染。

在另外例子uspat.app.no.20160326130(lekhrametal.)中,大麻素和其他相关化合物从原始收获的大麻中分离出来,再次使用一系列有机溶剂将大麻素转化为盐,然后再回到其原始的羧酸形式。与webster类似,这种传统方法受到限制,因为它依赖于可已经暴露于各种有毒杀虫剂、除草剂等的天然生长的植物物质。此外,该传统方法中使用的多种有机溶剂必须回收并再循环和/或适当处理。

另一种传统的大麻素提取方法涉及利用超临界二氧化碳(sco2)生成大麻油。在这种传统方法下,将干燥的植物物质再次研磨并进行sco2提取环境。最初获得并进一步分离初级提取物。例如,如通常所ca2424356(mulleretal.)描述的那样。在超临界压力和温度条件下,通过添加辅助溶剂(改性剂)如醇,在sco2的帮助下提取大麻素。在这个过程中,这种超临界co2蒸发并溶解到大麻素中。然而,这种传统方法也具有某些限制性缺点。例如,由于在超临界sco2中的低溶解度,目标大麻素的回收是不一致的。此外,所使用的任何溶剂必须回收并泵送回提取器,以便最大限度地降低运营成本。

另一种方法利用丁烷从原始收获的大麻中提取大麻素,特别是高浓度的thc。因为丁烷是非极性的,所以该方法不能提取水溶性副产物,例如叶绿素和植物生物碱。也就是说,这个过程可能需要长达48小时,因此其扩大规模以实现最大商业可行性的能力有限。传统丁烷萃取方法的另一个主要缺点是使用易燃溶剂的潜在危险,以及需要确保从提取的大麻素中完全除去所有丁烷。

这些传统大麻素提取方法的可行性的另一个限制因素是不能维持大麻株的完整性。例如,用于医学和研究应用的大麻素或受到对照临床试验的大麻素,受到美国和其他地方的各种政府机构的严格监管。这些监管机构要求大麻株随着时间的推移保持化学一致性。不幸的是,大麻株的遗传/化学组成经历了几代的变化,使得它们不能满足大多数临床试验中存在的法规要求或经认证用于其他药物应用。

已经进行了几次尝试来解决这些问题。例如,已经努力在遗传工程生物中产生大麻素。例如,在uspat.app.14/795,816(poulos,etal.)中,此处申请人声称已经产生遗传修饰的酵母菌株,其能够通过插入产生适合其代谢产生的酶的基因来产生大麻素。然而,这种应用仅限于其仅产生单一或非常有限数量的大麻素化合物的能力。这种限制具有临床意义。最近的临床研究已经发现,使用单一分离的大麻素作为治疗剂不如使用与各种选择菌株相关的天然存在的初级和次级大麻素的“随从(entourage)”处理一样有效。

已经进行了另外的尝试来化学合成大麻素,例如thc。然而,与从天然植物中提取大麻素相比,各种大麻素的化学合成是一种昂贵的方法。大麻素的化学合成还涉及使用不环保的化学品,这可被视为其产生的额外成本。此外,各种大麻素的合成化学品产生已经被分类为和从诸如cannabissativa等植物中提取的那些一样药理学活性较低。

产生大规模大麻细胞培养物的努力也引起了许多技术问题。其中最主要的是大麻素具有细胞毒性。在自然条件下大麻素产生,然后在细胞外储存在称为毛状体的小腺体结构中。可以将毛状体可视化为来自大麻植物的表皮的小毛或其他生长物。结果,在大麻细胞培养物中,无法在细胞外储存大麻素意味着大麻素的任何积累都会对培养的细胞产生毒性。这些限制削弱了大麻细胞培养物按工业产生水平放大的能力。

大麻素生物合成毒性限制体内产生系统

产生或积累高水平大麻素的大麻株/细胞培养物的努力引起了许多技术问题。其中最主要的是大麻素合成产生有毒副产品。值得注意的是,cbda和thca合酶都需要分子氧,联合fad分子一起,氧化大麻萜酚酸(cbga)。具体地,如图29所示,来自底物的两个电子被酶结合的fad接受,然后转移到分子氧中以再氧化fad。cbda和thca由离子中间体通过酶的立体选择性环化合成。氢化物离子从还原的黄素转移到分子氧,从而导致过氧化氢的形成和黄素的再活化以用于下一循环。结果,除了分别产生cbda和thca之外,该反应还产生对宿主细胞天然有毒的过氧化氢(h2o2)。由于这种有毒的过氧化氢副产物的产生,大麻素合成产生自我限制的反馈回路,从而阻止大麻素在体内系统中的高水平产生和/或积累。大麻植物处理这些细胞毒性作用的一种方法是通过使用毛状体来产生和积累大麻素。

大麻植物通过隔离大麻素生物合成并在细胞外储存在称为毛状体的小腺体结构中处理这种毒性,如上所述。例如,thca合酶是负责产生thc的水溶性酶。例如,thc生物合成发生在腺毛状体中,并且开始于焦磷酸牻牛儿酯与橄榄油酸缩合以产生大麻萜酚酸(cbga);该反应由称为焦磷酸牻牛儿酯的酶橄榄油酸牻牛儿酯转移酶催化。然后cbga在thca合酶存在下经历氧化环化以产生四氢大麻酚酸(thca)。然后通过非酶促脱羧将thca转化为thc。使用rt-pcr和酶活性分析的亚细胞定位研究表明,thca合酶在腺毛状体的分泌细胞中表达,然后易位到其中最终产物thca积累的分泌腔中。存在于分泌腔中的thca合酶是功能性的,这表明储存腔是thca生物合成和储存的位点。通过这种方式,大麻能够在细胞外产生大麻素,从而避免这些化合物的细胞毒性作用。然而,结果,这种细胞区室化阻碍了体内接触和化学改变大麻素的能力。

为了解决这些问题,一些人提出化学修饰大麻素化合物以减少其细胞毒性作用。例如zipp等等已提出利用体外方法产生大麻素糖苷。然而,该应用仅限于体外系统。具体地,如上所述,大麻素合酶类酶,例如thca合酶,是水溶性蛋白,其从基底毛状体细胞输出到储存室中,在那里它是活性的并催化thca的合成。具体地,为了有效地介导这种大麻素合酶的细胞输出,该酶含有28个氨基酸的信号肽,其指导其输出细胞并进入发生大麻素合成的细胞外三色。由于这种信号依赖性细胞外区室化,在这种情况下是thca合酶,这意味着thca在细胞质外部产生并且不能被遗传工程化的糖基化酶接近。因此,如zipp等等所暗示的那样,在植物细胞中简单表达udp糖基转移酶将不会导致大麻素分子在大麻素合成发生的区室化和细胞外三色结构中的有效糖基化。zipp的方法也不能产生乙酰化大麻素以及o乙酰基糖苷大麻素分子。

关于大麻素的产生、解毒和分离的上述问题可能代表了对其有效和经济的解决方案的长期需求。尽管可能已经有了实施要素,但在某种程度上可能缺乏满足这种需求的实际尝试。这可能是由于本领域普通技术人员未能充分理解或理解所涉及的问题和挑战的性质。由于缺乏理解,满足这些长期需求的尝试可能未能有效地解决这里确定的一个或多个问题或挑战。这些尝试甚至可能已经偏离了本发明技术所采用的技术方向,并且甚至可能导致本发明技术的成就在某种程度上被认为是该领域中某些人采取的方法的意外结果。

如下面将更详细讨论的,本发明的技术克服了传统大麻素产生系统的限制,同时满足了真正有效和可扩展的大麻素产生、改良和分离系统的目标。

发明概述

本发明的技术可包括用于从大麻植物体内产生、改良和分离大麻素化合物的系统、方法和组合物。特别地,本发明提供用于水溶性大麻素的高水平体内生物合成的系统和方法。

本发明的技术包括用于增强大麻素的产生和/或积累的系统和方法。在一个实施方案中,本发明可包括用于在体内系统(例如植物或植物细胞培养物)中增强大麻素的产生和/或积累的系统和方法。

本发明的另一个目的可包括产生过表达某些内源/外源基因的遗传修饰的植物,所述基因导致高于野生型水平的大麻素的过量产生和/或积累。在一个优选实施方案中,这样的转基因植物可以表现出大麻素前体化合物的增强的产生和局部积累,例如thca(四氢大麻酚酸)、cbca(大麻色酸)和cbda(大麻二酚酸)。此类转基因植物可另外表现出大麻素的增强的产生和局部积累,例如thc、cbc和cbd。本发明的另一个目的可包括产生表达某些内源/外源的遗传修饰的植物,其导致大麻素的增强的改良。在一个优选实施方案中,这样的转基因植物可以表现出对大麻素的增强的修饰,包括羟基化和/或乙酰化和/或糖基化。在另外的优选实施方案中,此类转基因植物可表现出对大麻素的增强的修饰,包括乙酰化和糖基化,例如o乙酰基糖苷形式。例如,乙酰化将乙酰基(-ch3ooh)添加到大麻素中,使得羧酸酯基团是酸性的并且在中性ph下带电,从而使其高水溶性。

本发明技术的一个目的可以是产生遗传修饰的或转基因大麻植物,其过表达一种或多种转录因子,例如myb,其增强通过大麻素生物合成途径的代谢物通量。在一个优选实施方案中,这些转录因子可能包括各种类似物。在某些优选的实施方案中,这些转基因中的一种或多种可以与一种或多种启动子可操作地连接。

本发明技术的另一个目的可以是产生遗传修饰的或转基因大麻细胞培养物,其过表达增强通过大麻素生物合成途径的代谢物通量的一种或多种转录因子。在一个优选实施方案中,这些转基因可以与一个或多个启动子可操作地连接。

本发明技术的另一个目的可以是产生遗传修饰的或转基因大麻植物,其表达上调毛状体形成以增加大麻素积累的一种或多种外源/异源转录因子。在某些优选的实施方案中,这些外源转基因中的一种或多种可以与一种或多种启动子可操作地连接。

然而,本发明技术的另一个目的可以是产生遗传修饰的或转基因大麻植物,其表达能够降低在大麻素合成期间可产生的过氧化氢(h2o2)水平的酶。在一个优选实施方案中,本发明的技术可以产生表达嵌合蛋白的遗传修饰的或转基因大麻植物。在这个实施方案中,该嵌合体蛋白可以包括第一结构域,其可以降低在大麻素合成期间可产生的过氧化氢(h2o2)水平。该嵌合/融合蛋白可以进一步包括第二结构域,其可以包含可以允许嵌合蛋白靶向定位于活性大麻素合成的位置的毛状体靶向结构域。在一些实施方案中,第三结构域可以包括可以进一步将第一结构域与第二结构域分开的接头,使得所述第一结构域和所述第二结构域各自可以折叠成其适当的三维形状并保持其活性,并且所述接头长度在一定范围。

本发明技术的另一个目的可包括利用土壤杆菌ti-质粒介导的转化产生一种或多种上述遗传修饰的植物或植物细胞培养物。

本发明技术的另一个目的涉及用于大麻素生物合成和修饰的体内细胞定位的方法和系统。更具体地,本发明的技术涉及用于大麻素羟化、乙酰化和/或糖基化的体内细胞定位的方法和系统。本发明的技术可包括用于高效局部化学修饰和从悬浮培养物中分离大麻素化合物的系统和方法。在这个实施方案中,各种选择的大麻素化合物可以化学修饰成可溶和无毒的构造。

本发明技术的另外的实施方案可以包括大麻素化合物的瞬时修饰,以减少和/或消除它们在植物或植物细胞培养系统中的细胞毒性。在优选的实施方案中,这种瞬时修饰的大麻素可以在通常对细胞产生有害作用的水平上积累。另外的实施方案可包括分离这些瞬时修饰的大麻素,然后酶促转化或重构成其原始和/或部分修饰的结构。

本发明的另一个目的可以包括产生转基因植物和/或植物细胞培养物,其可以表达在植物中偶联大麻素合成和羟基化和/或糖基化的异源基因。具体而言,该技术的一个目的可包括使用本生烟来证明植物中的cbda合成和糖基化的偶联。并且,该实施方案的另外目的可包括cbda分子中的其他修饰,例如羟基化和乙酰化。在另一个目的中,该大麻素修饰可以特异性定位,例如在胞质溶胶和/或毛状体中。

本发明的另一个目的可以包括产生转基因植物和/或植物细胞培养物,其可以过表达可以配置为修饰大麻素的内源性基因。另外的目标可以包括异源转录因子的共表达,其可以增加大麻素的产生。本发明的另一个目的可包括异源基因的共表达,其解毒通过大麻素生物合成产生的过氧化氢副产物。这些基因的共表达可以与配置用于修饰和/或定位大麻素生物修饰的基因的共表达相加。

附图简述

图1.体外测定中发现的代表性cbga糖苷色谱洗脱图。色谱图a、b和c代表每种糖苷产物的相应提取离子色谱图。色谱图d代表总离子色谱图。峰强度显示为相对于每个色谱图中最丰富的峰的相对丰度。

图2.在体外测定中发现的功能化cbga和糖苷的代表性色谱洗脱图。色谱图a、b和c代表每种产品的相应提取物额定离子色谱图。色谱图d代表总离子色谱图。峰强度显示为相对于每个色谱图中最丰富的峰的相对丰度。

图3.在叶提取物中发现的代表性cbda糖苷色谱洗脱图。色谱图a、b、c和d代表每种糖苷产物的相应提取物额定离子色谱图。色谱图e代表总离子色谱图。峰强度显示为相对于每个色谱图中最丰富的峰的相对丰度。

图4.叶提取物中功能化cbda和功能性糖苷的色谱洗脱。色谱图a、b和c代表每种产品的相应提取物额定离子色谱图。色谱图d代表总离子色谱图。峰强度显示为相对于每个色谱图中最丰富的峰的相对丰度。

图5.表达细胞色素p450(cyp3a4)基因(seqidno.1)的基因构建体,其在植物中表达细胞色素p450(cyp3a4)蛋白(seqidno.2)并且p450氧化还原酶基因(oxred)(seqidno.3)表达p450氧化还原酶蛋白(seqidno.4)。这两个基因均由组成型35s启动子(35s)驱动,并以拟南芥醇脱氢酶(atadh)的5'非翻译区为翻译增强子。

图6.烟叶中cyp3a4和p450氧化还原酶表达的确认。cb1-cb5,被cyp3a4/p450氧化还原酶浸润的叶片的生物复制品;wt=没有渗透的野生型烟叶。l=1kb加上梯子(美国thermofisherscientific)。箭头显示预期的(500bp)条带,指示转基因的表达。

图7.在表达p450的本氏烟草植物中大麻素的增强糖基化作用。cb1-cb5是过表达cyp3a4+p450氧化还原酶的生物代表,p_control是p19沉默抑制子(“空载体”对照)。纵轴表示相对量,表示为每克鲜重的峰面积。

图8.细胞质和悬浮培养大麻素生产系统的基因构建体。35s,花椰菜马赛克35s启动子;hspt,hsp终止子;35ppdk,杂交启动子,由花椰菜花叶病毒35s增强子融合到玉米c4ppdk基础启动子上(yoo等人,2007);76g1,来自甜叶菊的udp糖基转移酶;abcg2,人多药转运蛋白。

图9.证明rt-pcr证实了烟草叶细胞中cbda合酶(a)、udp糖基转移酶(b)和abcg2(c)的表达。l是1kb加梯子(thermofisherscientific,美国)。泳道上的数字代表独立的转基因品系。箭头指向显示转基因表达的预期条带。

图10.过表达cbda合酶、udp糖基转移酶和abc转运蛋白的转基因烟草(sus,编号)中大麻素的羟化和糖基化。wts1和2是野生型,内含底物用于内源性反应。有一些内源性cbga糖基化,以及转基因糖基转移酶活性增强的证据(例如sus2、sus3和sus4)。数据已校正为每克鲜重的峰面积。

图11.与构建体共感染的转基因本氏烟草植物中大麻素的增强修饰,用于糖基化,p450介导的功能化(羟基化)和过氧化氢被过氧化氢酶解毒。sus=用于过表达cbda合酶、udp糖基转移酶和abc转运蛋白的构建体;m3s=用于与大麻myb12样和拟南芥过氧化氢酶一起过表达cbda合酶、udp糖基转移酶和abc转运蛋白的构建体。

图12.在14小时瞬时表达分析中,与野生型相比,过表达糖基转移酶的转基因本塞姆氏烟草植物(tsa、tsb、tsc、sus、sus/p450)中糖基化活性的增加。

图13.由细胞色素p450催化的示例性单加氧酶反应。

图14.毛状体大麻素生产系统的基因构建体1。花椰菜花叶35s启动子;atadh5'-utr,翻译增强子(matsui等人,2012);tscbda,大麻二酚酸合酶,具有其原始的毛状体靶向序列;hsp终止子;tsugt76g1,来自甜叶菊的udp糖基转移酶,带有cbdas毛状体靶向序列。

图15.毛状体大麻素生产系统的基因构建体2。花椰菜花叶35s启动子;atadh5’-utr,增强元件;pm-utr1,拟南芥udp-葡萄糖/半乳糖转运蛋白,靶向质膜;hsp终止子。

图16.毛状体靶向cbda合酶rt-pcr(上图),毛状体靶向udp糖基转移酶(76g1)ugtrt-pcr(下图)。a、b和c是2dpi后收集的生物学重复样本。

图17.pm-utr1rt-pcr。a、b和c是2dpi后收集的生物学重复样本。

图18.细胞溶质大麻素生产系统的基因构建体。花椰菜花叶35s启动子;atadh5’-utr,增强元件;cytcbda,大麻二酚酸合酶,去除了毛状体靶向序列;hsp终止子;cytugt76g1,来自甜叶菊的udp糖基转移酶。

图19.sus-a到sus-c是1dpi后细胞悬浮液(201-sus)转化的生物学复制品。

图20.cytugtrt-pcr(上图),cytcbdasrt-pcr(下图)。a、b和c是2dpi后细胞溶质构建体浸润的生物学复制品。

图21.在用毛状体或细胞悬液构建体浸润并饲以2.7mmcbga的叶片中检测大麻素。颜色代码指的是cbda和ugt76g1蛋白质堆积的靶区,可能是毛状体或细胞悬浮液细胞甾醇。y轴:cbga和cbda以百万分率(ppm)表示。一级、二级和酰化糖苷以峰面积表示。

图22.在浸有细胞溶质或细胞悬浮液构建物并饲以2.7mmcbga和4mmudp-葡萄糖的叶片中的大麻素检测。颜色代码是指cbda和ugt76g1蛋白质积累的目标区室。y轴:cbga,表示为百万分之一(ppm)。所有其他大麻素衍生物均以峰面积表示(无标准品)。

图23.r-oh功能化的1x糖基化cbda类似物的提取离子色谱图。(a)色谱痕量,离子m/z,计算出的元素组成,确认存在痕量cbda类似物(b)对照提取物中不存在cbda类似物(c)生物学重复对照提取物中不存在cbda类似物。

图24.大麻提取物的直接输注质谱。光谱插图代表具有单个糖基化(519.2546m/z)的cbda,以及具有r-oh和单个糖基化(535.2543m/z)功能的cbda。峰强度显示为相对于最强离子的相对丰度。

图25.用具有cbda合酶(cbda)和ugt质粒组合的土壤杆菌培养物渗入的各种大麻品种的提取物中cbda的相对丰度。归一化的相对丰度数据表示为每种化合物的离子强度除以内标7-羟基香豆素(20ppm)的离子强度。

图26.用具有cbda和ugt质粒组合的土壤杆菌培养物渗透的各种大麻苜蓿菌株的提取物中经修饰的cbda(糖基化和/或羟基化)的相对丰度。归一化的相对丰度数据表示为每种化合物的离子强度除以内标7-羟基香豆素(20ppm)的离子强度。

图27.用于增强大麻素生产和减轻毒性的基因构建体。csmyb12,预测的大麻myb转录因子,可增强黄酮生物合成;hspt,来自拟南芥热激蛋白18.2基因的有效转录终止子;35s,花椰菜花叶病毒的组成型启动子;过氧化氢酶,拟南芥过氧化氢酶基因。

图28.由普通的前体cbga合成thc和cbd。

图29.大麻素生物合成过程中过氧化氢的产生。

图30.羟基化,然后通过cyp2c9/氧化thc。

图31.通过ugt将葡糖醛酸成分转移至大麻素底物。

图32.合成橄榄油酸cbga的前体。

图33.示例性拟南芥过氧化氢酶蛋白质序列的氨基酸序列比较。

图34.在其一个实施方案中,增加的大麻素产生与减少的氧化损伤系统结合的示意图。

发明详述

本发明包括各种方面,这些方面可以以不同方式组合。提供以下描述以列出组分并描述本发明的一些实施例。这些组分与初始实施例一起列出,但是应该理解,它们可以以任何方式和任何数量组合以产生另外的实施例。不应将各种描述的示例和优选实施例解释为将本发明仅限于明确描述的系统、技术和应用。此外,该描述应被理解为支持和包含具有任何数量的所公开组分的所有各种实施例、系统、技术、方法、装置和应用的描述和权利要求,其中每个元素单独使用,以及该或任何后续申请中的所有元素的任何和所有各种排列和组合使用。

本发明的技术包括用于高水平产生大麻素化合物的系统和方法。如本文使用,在这种情况下,术语“高水平”可意味着高于植物或植物细胞中野生型生物合成或一种或多种大麻素的积累。在一个实施方案中,可以建立一种或多种植物株的悬浮液或毛状根或细胞悬浮培养物。在一个优选实施方案中,可以建立一种或多种大麻或烟草植物株的悬浮液或毛状根或细胞悬浮培养物。应当注意,术语株可以指植物株、以及细胞培养物、或来源于植物(例如大麻)的细胞系。

在一个优选实施方案中,可以在发酵罐或其他类似装置中建立大麻或烟草植物的悬浮或毛状根或细胞悬浮培养物。应该注意的是,在该实施方案中c.sativa的使用仅是示例性的。例如,在某些其他实施方案中,可以使用各种大麻株、株的混合物、不同株或克隆的杂种以及不同品种来产生悬浮或毛状根培养物。例如,诸如c.sativa、c.indica和c.ruderalis的株都可以用于本发明的技术。在其他实施方案中,可以使用其他大麻素或大麻素样产生物。例如,在某些实施方案中,可以建立细胞悬浮液或毛状根培养物用于以下一种或多种:紫锥菊;千日菊;helichrysumumbraculigerum;radulamarginata(liverwort)、可可树或烟草。

在某些实施方案中,这样的发酵罐可以包括大型工业规模的发酵罐,其允许培养大量的大麻素产生的c.sativa细胞。在这个实施方案中,可以从单株例如烟草或c.sativa中培养大量未掺杂的细胞,这可以建立细胞培养物,其在数量和类型上都具有大麻素化合物的一致的产生和/或修饰。使用向培养物中补充营养和其他生长因子,可以持续维持这种培养物的生长。这些特征可以是自动的或手动完成的。

本发明技术的另一个实施方案可包括用于高水平产生修饰的大麻素化合物的系统和方法。在一个实施方案中,可以建立一种或多种烟草植物株的悬浮或毛状根培养物。应当注意,术语株可以指植物株、以及细胞培养物或源自烟草植物的细胞系。在一个优选实施方案中,可以在发酵罐或其他类似装置中建立本生烟植物的悬浮或毛状根培养物。应该注意的是,在该实施方案中使用n.benthamiana仅是示例性的。例如,在某些其他实施方案中,各种烟草属株、株混合物、不同株或克隆的杂种以及不同变种可用于产生细胞悬浮液或毛状根培养物。

在某些情况下,这种发酵罐可包括允许培养大量的n.benthamiana细胞的大型工业规模的发酵罐。在这个实施方案中,可以将收获的大麻素引入该悬浮培养物中,并如本文一般描述的那样进行修饰。类似地,通过向培养物中添加营养素和其他生长因子的连续添加,可以持续维持烟草细胞的这种培养生长。这些特征可以是自动的或手动完成的。

本发明的另一个实施方案可包括产生遗传修饰的大麻和/或烟草细胞,以表达可修饰大麻素化合物的化学结构的不同外源和/或内源性基因。这些转基因株可以配置为通常产生和/或修饰大量的大麻素化合物,以及特定大麻素类(例如thc、大麻二酚(cbd)或大麻酚(cbn)等)的产生的目标增加。

本发明的另一个实施方案可以包括产生遗传修饰的大麻细胞培养物,其表达可以被优化用于治疗特定的医学病症的大麻素的混合物。例如,cbd是一种非精神活性的大麻素,可用于治疗癫痫患者的癫痫发作。然而,当与精神活性大麻素thc相比时,数十年的选择性育种导致大多数大麻菌株具有低浓度的cbd。因此,在某些实施方案中,可以开发疾病或综合征特异性细胞培养物,其表达用于下游处理这些病症的大麻素的校准混合物。

本发明技术的另外的实施方案可包括用于在植物系统中产生和体内修饰大麻素化合物的新系统、方法和组合物。在某些实施方案中,这些体内修饰可导致产生具有特殊性质的不同形式的大麻素,例如水溶性缓释大麻素或前药。在一个优选实施方案中,本发明的技术可包括用于羟基化、乙酰化和/或糖基化的新系统、方法和组合物。修饰的大麻素可以例如通过糖基化而是水溶性的。

如上所述,高水平大麻素的产生和/或积累对植物细胞宿主是有毒的。因此,本发明技术的一个实施方案可包括在体内瞬时修饰大麻素的系统和方法。本发明的一个目的可包括使用细胞色素p450(cyp)单加氧酶来瞬时修饰或官能化大麻素的化学结构。cyp构成能够催化许多药理活性化学化合物和其他亲脂性外源物的氧化生物转化的主要酶家族。例如,如图13所示,由细胞色素p450催化的最常见的反应是单加氧酶反应,例如,将一个氧原子插入有机底物(rh)的脂肪族位置,而另一个氧原子被还原为水。

几种大麻素,包括thc,已被证明可作为人cyp(cyp2c9和cyp3a4)的底物。同样,已经鉴定cyp代谢大麻二酚(cyp2c19,3a4)、大麻酚(cyp2c9,3a4)、jwh-018(cyp1a2,2c9)和am2201(cyp1a2,2c9)。例如,如图30中一般所示,在一个示例性系统中,cyp2c9可以“官能化”或羟基化thc分子,从而导致羟基形式的thc。cyp2c9对thc的羟基形式的进一步氧化可将其转化为失去精神活性能力的羧酸形式,从而使其成为无活性的代谢物。

因此,本发明的另一个实施方案可以包括产生可以用编码一种或多种外源cyp的人工产生的遗传构建体转化的大麻株或细胞培养物。在一个优选实施方案中,编码一种或多种非人同种型和/或类似物的基因以及可使大麻素官能化的其他cyp,可以在转基因cannabissativa或其他植物中表达。在另外优选的实施方案中,编码一种或多种非人同种型和/或类似物的基因以及可使大麻素官能化的其他cyp,可以在转基因cannabissativa或烟草株(在悬浮培养中生长)中表达。另外的实施方案可以包括遗传控制元件,例如启动子和/或增强子以及也可以在转基因大麻株中表达的转录后调控元件,使得存在于悬浮或毛状根培养物中的任何cyp的存在、数量和活性可以修改和/或校准。

本发明的另一个实施方案可以包括产生可以使用编码一种或多种外源cyp的人工产生的遗传构建体转化的烟草株或细胞培养物。在一个优选实施方案中,编码一种或多种非人同种型和/或类似物的基因、以及可使大麻素官能化的可能其他cyp引入转基因n.benthamiana植物或悬浮培养物。另外的实施方案可以包括遗传控制元件,例如启动子和/或增强子以及也可以在转基因n.benthamiana株中表达的转录后调控元件,使得存在于悬浮或毛状根培养物中的任何cyp的存在、数量和活性可以修改和/或校准。

本发明的另一个目的可以是在体内进一步修饰大麻素和/或已经官能化大麻素。在优选的实施方案中,大麻素和/或官能化大麻素的糖基化可以将它们转化为水溶性形式。在图31所示的示例性实施方案中,本发明的技术可利用一种或多种糖基转移酶,例如udp-糖基转移酶(ugt),以在体内催化大麻素的葡糖醛酸化或葡糖醛酸化,例如初级(cbd、cbn)和次级大麻素(thc、jwh-018、jwh-073)。在这个实施方案中,葡糖醛酸化可以由通过如本文所述的几种类型的糖基转移酶中的任何一种将尿苷二磷酸葡糖醛酸的葡糖醛酸组分转移至大麻素底物组成。葡糖醛酸是一种衍生自葡萄糖的糖酸,其第六个碳原子被氧化成羧酸。

本发明的另一个实施方案可以包括将官能化的大麻素(在该例子中为大麻素的羧酸形式)体内转化为可以是水溶性的并且对细胞宿主无毒的大麻素的糖基化形式。这些化学修饰可以允许更大水平的大麻素在植物细胞培养物中积累,而没有由于这种水溶性而在未修饰的大麻素中看到的有害细胞毒性作用。

本发明的另一个实施方案可包括产生大麻或其他植物如烟草的转基因或遗传修饰的株,其具有可表达一种或多种可增加大麻素溶解度和/或降低大麻素细胞毒性的基因的人工基因构建体。例如,本发明的技术可以包括产生具有人工遗传构建体的转基因植物株或细胞系,所述人工遗传构建体可以表达一种或多种内源/外源糖基转移酶或能够使大麻素化合物糖基化的其他酶。例如,在一个实施方案中,可以将来自n.benthamiana或其他非大麻植物的一种或多种糖基转移酶引入大麻植物或细胞培养物中,并配置成在体内糖基化大麻素。在其他实施方案中,来自n.benthamiana的内源性糖基转移酶可过表达以增加体内大麻素糖基化。

在另外的实施方案中,本发明技术可以包括产生具有编码一种或多种糖基转移酶的基因的人工遗传构建体,包括本文所述的那些以及其他同种型的非人类似物,还可以在可以进一步在悬浮培养物中生长的转基因cannabissativa、n.benthamiana或其他植物系统中表达。另外的实施方案可以包括遗传控制元件,例如启动子和/或增强子以及也可在转基因植物系统中表达的转录后调节控制元件,使得可以调节在悬浮液或毛状根培养物中存在的任何糖基转移酶的存在、数量和活性。

本发明的另一个实施方案可以包括具有一个或多个基因的人工遗传构建体,所述基因编码具有定位序列或结构域(可以帮助蛋白移动到细胞的某一部分,例如细胞位置是大麻素和/或官能化大麻素)的一种或多种udp-和/或adp-糖基转移酶,可以从细胞中修饰、产生、储存和/或排泄。

本发明的另一个实施方案可以包括具有一个或多个基因的人工遗传构建体,所述基因编码与一种或多种外源基因(可以帮助蛋白移动到细胞的某一部分,例如细胞位置是大麻素和/或官能化大麻素)共表达的一种或多种udp-和/或adp-糖基转移酶,可以从细胞中储存和/或排泄。

本发明技术的一个优选实施方案可包括水溶性糖基化大麻素(通常称为可从植物或细胞培养物中收获的瞬时修饰的大麻素)的高水平体内产生。在一个实施方案中,瞬时修饰的大麻素可能在作为悬浮培养物一部分的细胞内积累。在该例子中,可使细胞培养物生长至所需的细胞水平或光密度,或在其他情况下,直至所需水平的瞬时修饰的大麻素已在培养的大麻细胞中积累。这些外源基因可以定位于例如本文一般描述的细胞溶质或毛状体,并且可以进一步与其他外源基因(可以减少大麻素的生物合成毒性和/或促进大麻素通过细胞或转运出细胞外)共表达。

然后可以从培养物中收获含有累积的瞬时修饰的大麻素的全部或部分大麻细胞,在优选的实施方案中,培养物可以是工业规模的发酵罐或适于大规模培养植物细胞的其他装置。收获的大麻细胞可以被裂解,使得累积的瞬时修饰的大麻素可以释放到周围的裂解物中。其他步骤可包括处理该裂解物。这种处理的实例可包括过滤或筛选该裂解物以除去外来植物材料以及化学处理以改善后来的大麻素产量。

本发明技术的另一个实施方案可包括高水平体内产生水溶性糖基化大麻素,通常称为可从植物或细胞培养物中收获的瞬时修饰的大麻素。在一个实施方案中,可以将大麻素引入非大麻素产生细胞培养物,例如n.benthamiana。在这个优选实施方案中,非大麻素产生细胞培养物可以遗传修饰以表达可以例如通过羟基化、乙酰化和/或糖基化来修饰大麻素的一种或多种内源性或外源基因。这种内源性或外源基因可以定位于例如本文一般描述的胞质溶胶或毛状体,并且可以进一步与其他外源基因(可以减少大麻素的生物合成毒性和/或促进大麻素通过细胞或转运出细胞外)共表达。

该非大麻素产生细胞培养物可以被允许生长至所需水平的细胞或光密度,或在其他情况下,直至所需水平的瞬时修饰的大麻素已在培养的细胞中积累。然后可以从培养物中收获含有累积的大麻素的全部或部分n.benthamiana细胞,在优选的实施方案中,培养物可以是工业规模的发酵罐或适于大规模培养植物细胞的其他装置。可以裂解收获的n.benthamiana细胞,使得累积的瞬时修饰的大麻素可以释放到周围的裂解物中。其他步骤可包括处理该裂解物。这种处理的实例可包括过滤或筛选该裂解物以除去外来植物材料以及化学处理以改善后来的大麻素产量。

本发明技术的另一个目的可包括从植物或悬浮培养物中分离和纯化瞬时修饰的大麻素的方法。在一个优选实施方案中,可以使用亲和层析或其他纯化方法产生和处理大麻裂解物。在这个优选实施方案中,具有配体或蛋白受体的亲和柱被配置成与瞬时修饰的大麻素结合,例如通过与糖基或葡糖醛酸官能团等结合,可以固定或偶联到固体载体上。然后裂解物可以通过柱,使得对配体具有特异性结合亲和力的瞬时修饰的大麻素结合并固定化。在一些实施方案中,可以去除裂解物中可存在的非结合和非特异性结合蛋白。最后,瞬时修饰的大麻素可以通过例如可以取代或破坏大麻素-配体键的相应糖或其他化合物从亲和柱上洗脱或置换。可以收集洗脱的瞬时修饰的大麻素并进一步纯化或加工。

本发明的目的可包括一个实施方案,其中瞬时修饰的大麻素可被动地和/或主动地从细胞或细胞壁排泄。在一个示例性模型中,外源atp结合盒转运蛋白(abc转运蛋白)或其他类似的分子结构可识别瞬时修饰的大麻素上的糖基或葡糖醛酸官能团(缀合物)并主动地将其运输穿过细胞壁/膜并进入周围介质。在这个实施方案中,可以允许细胞培养物生长直至达到输出参数。在一个例子中,输出参数可包括允许细胞培养物生长直至达到所需细胞/光密度,或达到所需浓度的瞬时修饰的大麻素。在这个实施方案中,可以收获含有瞬时修饰的大麻素的培养物用于以后的大麻素提取。在一些实施方案中,可以以与上文一般描述的裂解物类似的方式处理该收获的培养物。另外,存在于原始和/或处理过的培养基中的瞬时修饰的大麻素可以例如通过亲和层析以与上述类似的方式分离和纯化。

在某些实施方案中,这种纯化的大麻素分离物可含有初级和次级糖基化大麻素的混合物。如上所述,这种纯化的糖基化大麻素可以是水溶性的并且比未修饰的大麻素更慢地代谢,从而提供在某些药物应用中可能需要的缓释能力,例如用于组织特定应用或者作为前药。因此,本发明的一个目的是将这种纯化的糖基化大麻素掺入各种药物和/或营养品应用中。

例如,纯化的糖基化大麻素可以掺入各种固体和/或液体递送载体中以用于药物应用。如上所述,这些瞬时修饰的大麻素可能不再具有其精神活性成分,使得它们在研究、治疗和药物应用中的应用特别有利。例如,儿童的治疗可以通过给予治疗剂量的分离和纯化的瞬时修饰的大麻素来实现,而没有不希望的精神活性作用。另外的治疗应用可包括收获和随后施用治疗剂量的“随从”分离和纯化的瞬时修饰的大麻素。

本发明的另一个实施方案可包括转化或重构瞬时修饰的大麻素的系统。在一个优选实施方案中,糖基化大麻素可通过一种或多种广义或特异性糖苷酶处理而转化为非糖基化大麻素。本领域技术人员将认识到糖苷酶的用途和可用性,而无需过多的实验。在这个实施方案中,这些糖苷酶可以去除糖部分。具体地,这些糖苷酶可以除去糖苷或葡糖醛酸部分,将大麻素化合物重构成具有精神活性活性的形式。这种重构过程可以产生高度纯化的“随从”的初级和次级大麻素。这些重构的大麻素化合物也可以掺入各种固体和/或液体递送载体中,用于各种药物和其它商业应用。

如上所述,在本发明的一个实施方案中,产生大麻素的大麻株以及其他植物可以用于本发明的技术。在某些优选的实施方案中,代替在细胞培养物中培养目标大麻素产生植物,可以收获原始植物材料并利用本文所述的一种或多种方法进行大麻素提取。这些传统上提取的大麻素可以通过体外应用一种或多种cyp从其天然形式进行修饰,所述cyp可分别产生这些大麻素的羟基和羧酸形式。这些官能化的大麻素可以通过体外应用如本文一般描述的一种或多种糖基转移酶进一步修饰。在这个实施方案中,新的瞬时修饰的大麻素可以通过亲和层析或其他提取方案的过程分离和纯化,然后应用于各种商业和其他治疗用途。在其他实施方案中,可以通过体外施用一种或多种糖苷酶来恢复和重建瞬时修饰的大麻素。这些恢复的大麻素也可用于各种商业和其他治疗用途。

本发明的另一个实施方案可包括使用其他非大麻素产生植物代替在细胞培养物中培养大麻素产生植物。这里,大麻素可以引入遗传修饰的植物或表达一种或多种cyp的植物细胞培养物,其可分别产生这些大麻素的羟基和羧酸形式。这些官能化的大麻素可以通过一种或多种糖苷酶的作用进一步修饰,所述糖苷酶也可以在非大麻素产生植物或细胞培养物中表达。在一个优选实施方案中,非大麻素产生细胞培养物可包括烟草植物或细胞培养物。

本发明的一个实施方案可包括靶向毛状体的大麻素积累和修饰的体内方法。该体内系统的一个优选实施方案可包括产生重组蛋白,该重组蛋白可允许cyp或糖基转移酶转移至整株植物中的细胞外大麻素合成位点。更具体地,在这个优选实施方案中,可以将一种或多种cyp或糖基转移酶工程化以表达大麻素合酶蛋白中存在的全部或部分n-末端细胞外靶向序列,例如thca合酶或cbda合酶。

本发明的另一个实施方案可包括高水平毛状体靶向大麻素生物合成、积累和/或修饰的体内方法。该体内系统的一个优选实施方案可包括产生重组蛋白,该重组蛋白可允许过氧化氢酶在整株植物中易位至细胞外大麻素合成位点。更具体地,在这个优选实施方案中,可以将一种或多种过氧化氢酶设计成表达大麻素合成酶蛋白中存在的全部或部分n-末端细胞外靶向序列,例如thca合酶或cbda合酶。在这个实施方案中,过氧化氢酶可以靶向大麻素生物合成的位点,使其更有效地中和过氧化氢副产物。

在这个优选实施方案中,该n-末端毛状体靶向序列或结构域通常可包括广义合酶的前28个氨基酸残基。用于thca合酶的示例性毛状体靶向序列被鉴定为seqidno.40,而用于cbda合酶的毛状体靶向序列被鉴定为seqidno.41。该细胞外靶向序列可被植物细胞识别并导致糖基转移酶从细胞质转运至植物的三色,特别是植物三色的储存室,其中可发生细胞外大麻素糖基化。更具体地,在这个优选实施方案中,可以将一种或多种糖基转移酶(例如udp糖基转移酶)工程化以表达如示例性合酶类酶中存在的全部或部分n-末端细胞外靶向序列。

本发明的另一个实施方案可以包括细胞溶质靶向大麻素的产生、积累和/或修饰的体内方法。该体内系统的一个优选实施方案可包括产生重组蛋白,其可允许大麻素合酶和/或糖基转移酶定位于胞质溶胶。

更具体地,在这个优选实施方案中,一种或多种大麻素合酶可以修饰以去除全部或部分n-末端细胞外靶向序列。用于thca合酶的示例性毛状体靶向序列被鉴定为seqidno.40,而用于cbda合酶的毛状体靶向序列被鉴定为seqidno.41。与细胞溶质靶向的cyp或糖基转移酶共表达这种细胞溶质靶向合酶,可以使大麻素的合成、积累和修饰定位于胞质溶胶。此类胞质靶酶可与过氧化氢酶、abc转运蛋白或可降低大麻素生物合成毒性和/或促进通过或离开细胞的其他基因共表达。

本发明的另一个实施方案可包括产生包含该多核苷酸的表达载体,即大麻素合成酶n-末端细胞外靶向序列和糖基转移酶基因,其可操作地连接于启动子。遗传改变的植物或其部分及其后代,其包含与启动子可操作地连接的该多核苷酸,其中所述植物或其部分及其后代产生所述嵌合蛋白是另一个实施方案。例如,种子和花粉含有该多核苷酸序列或其同源物,遗传改变的植物细胞包含与启动子可操作地连接的该多核苷酸,使得所述植物细胞产生所述嵌合蛋白。另一个实施方案包括组织培养物,其包含多种遗传改变的植物细胞。

本发明的另一个实施方案提供遗传改变的植物或细胞,其表达嵌合或融合蛋白,所述蛋白具有与udp糖基转移酶基因(与启动子可操作地连接)偶联的大麻素合酶n-末端细胞外靶向序列(即参见seqid:40-41;还参见用于thca合酶的完整氨基酸序列的seqidno.42)。另一个实施方案提供用于构建遗传改变的植物或其部分的方法,所述植物或其部分在植物三色的细胞外储存室中与非遗传改变的植物或其部分相比具有大麻素的糖基化,该方法包括以下步骤:将编码上述蛋白的多核苷酸引入植物或其部分中以提供遗传改变的植物或其部分,其中所述嵌合蛋白包含第一结构域、第二结构域,并且其中所述第一结构域包含大麻素合酶n-末端细胞外靶向序列,并且第二结构域包含糖基转移酶序列。这些结构域可以由第三结构域或接头分开。该接头可以是可以将第一结构域与第二结构域分开的任何核苷酸序列,使得第一结构域和第二结构域可以各自折叠成其合适的三维形状并保持其活性。

本发明的一个优选实施方案可包括遗传改变的植物或细胞,其表达靶向胞嘧啶的大麻素合酶蛋白,所述蛋白具有失活或去除的大麻素合成酶n-末端细胞外靶向序列(seqid.40-41)。在一个实施方案中,细胞溶质靶向thca合酶(ctthca)可以鉴定为seqidno.46,而在另一个实施方案中,细胞溶质靶向cbda合酶(cytcbda)被鉴定为seqidno.22-23)。这种细胞溶质靶向的大麻素合酶蛋白可以与启动子可操作地连接。另一个实施方案提供了构建遗传改变的植物或其部分的方法,所述植物或其部分与非遗传改变的植物或其部分相比在植物的胞质溶胶中具有大麻素的糖基化,该方法包括以下步骤:将编码上述蛋白的多核苷酸引入植物或其部分中以提供遗传改变的植物或其部分,其中所述大麻素合酶n末端细胞外靶向序列已被破坏或去除。

本发明的又一个实施方案可包括大麻细胞培养物中大麻素糖基化的体内方法。在一个优选实施方案中,为了促进大麻细胞培养物中大麻素的糖基化(缺乏细胞外三色结构),大麻素合酶基因可遗传修饰以例如通过定向突变去除或破坏细胞外n-末端靶向结构域,然后可以用于转化细胞培养物中的大麻植物细胞。在这个实施方案中,在没有这种靶向结构域的情况下,大麻素合酶,例如thca或cbda合酶,可以保留在植物细胞内,而不是主动转运出细胞,其中它可以用一种或多种糖基转移酶表达,例如在细胞质中的udp糖基转移酶。

本发明技术的另一个实施方案可包括用于在体内系统中增强大麻素化合物的产生和/或积累的系统和方法。在一个优选实施方案中,本发明可包括产生遗传修饰的或转基因大麻植物,其可以高于野生型水平产生和/或积累一种或多种大麻素。在一个实施方案中,可以产生转基因大麻植物以表达可以增强大麻素代谢途径的一种或多种cannabissativa转录因子。在一个优选实施方案中,可以产生编码一种或多种cannabissativamyb转录因子基因的多核苷酸,和/或增强通过大麻素生物合成途径的代谢物通量的一种或多种外源直向同源基因。

在这个优选实施方案中,可以产生编码一种或多种cannabissativamyb转录因子基因的多核苷酸,例如can833和/或can738。如图32所示,这些转录因子可以驱动olivetolicacid(cbga的前体,而cbga又是thc、cbd和cbc的生物合成途径的前体)的产生。在可替换的实施方案中,可以产生编码一种或多种cannabissativamyb转录因子基因直向同源物的多核苷酸,特别是大麻mybl2(seqid.11-12)、myb8(seqidno.43)、atmybl2(seqidno.44)和/或myb112(seqidno.45)也可以驱动olivetolicacid(cbga的前体,而cbga又是thc、cbd和cbc的生物合成途径中的前体)的产生。

在一个优选实施方案中,本发明可包括产生多核苷酸的方法,所述多核苷酸表达与本文鉴定的增强的大麻素产生相关的一种或多种seqid。在某些优选的实施方案中,可以使用许多系统中的任何一种来表达本发明的蛋白以获得所需量的蛋白。通常,将编码蛋白或其组分的多核苷酸置于在所需宿主细胞中有功能的启动子的控制下。可以获得极其多种类的启动子,并且可以根据具体应用用于本发明的表达载体中。通常,选择的启动子取决于启动子具有活性的细胞。还任选地包括其他表达控制序列,例如核糖体结合位点、转录终止位点等。包含一种或多种这些控制序列的构建体称为“表达盒”或“构建体”。因此,引入编码连接多肽的核酸以在所需宿主细胞中高水平表达。

本发明另外的实施方案可包括选择表达大麻素产生转录因子蛋白的遗传改变的植物或其部分,其中表达的蛋白增加大麻素的生物合成能力。在某些实施方案中,通过用包含与启动子可操作连接的所述多核苷酸的表达载体转化所述植物,引入编码大麻素产生转录因子蛋白的多核苷酸。大麻素产生转录因子蛋白可以包含选自seqidno:11-2或43-45的seqid,或其同源物的seqid。

如上所述,本发明的一个实施方案可包括用于体内系统中大麻素生物合成的一般和/或局部解毒的系统和方法。在一个优选实施方案中,本发明可以包括产生遗传修饰的或转基因的大麻或其他植物,其可以配置成能够解毒高于野生型水平的大麻素生物合成产生的过氧化氢副产物。此外,该解毒可以被配置为定位于大麻植物的胞质溶胶和/或毛状体结构,其中大麻素在整株植物系统中被积极合成。在本发明的该优选实施方案中,转基因植物,例如大麻或烟草植物或细胞,其表达可以上调过氧化氢解毒的一种或多种基因。

在一个优选实施方案中,可以产生编码一种或多种内源性和/或外源转录的多核苷酸,和/或催化过氧化氢还原的直向同源物:

因此,在一个实施方案中,本发明包括产生编码外源过氧化氢酶蛋白的多核苷酸,其可以在转化的植物和/或细胞培养物中表达。在优选的实施方案中,被配置为在大麻素合成期间产生的过氧化氢(h2o2)的过氧化氢酶可用于转化大麻或其他植物,例如烟草植物。虽然许多通用的过氧化氢酶可以包括在该第一结构域中,仅作为一个示例性模型,但是第一结构域可包括衍生自拟南芥的外源过氧化氢酶(seqidno.13-14;还参见图33)、或衍生自大肠杆菌的外源过氧化氢酶(seqidno.15-16)、或任何合适的过氧化氢酶同源物、蛋白片段、或具有如本文所定义的约70%至约100%的同源性的过氧化氢酶。

本发明的另一个实施方案可包括将过氧化氢酶定位于毛状体结构。如上文一般概述的,在该实施方案中,来自大麻素合酶的毛状体靶向序列可以与融合或嵌合体(这些术语在本申请中通常是可互换的)中的一种或多种过氧化氢酶偶联。该人工毛状体-靶过氧化氢酶基因可用于转化具有毛状体结构的植物,例如大麻或烟草。在优选的实施方案中,来自拟南芥的具有thca合酶毛状体靶向结构域的毛状体靶向过氧化氢酶被鉴定为seqidno.47,而具有cbda合酶毛状体靶向结构域的毛状体靶向过氧化氢酶拟南芥被鉴定为seqidno.48。在另外实施方案中,来自大肠杆菌的具有thca合酶毛状体靶向结构域的毛状体靶向过氧化氢酶被鉴定为seqidno.49,而具有cbda合酶毛状体靶向结构域的毛状体靶向过氧化氢酶大肠杆菌被鉴定为seqidno.50。

本发明的另一个实施方案包括产生编码嵌合/融合过氧化氢酶蛋白的核酸序列的多核苷酸。另一个实施方案包括含有与启动子可操作连接的该多核苷酸的表达载体。基因改变的植物或其部分及其后代,其包含与启动子可操作地连接的该多核苷酸,其中所述植物或其部分及其后代产生所述融合蛋白是另一个实施方案。例如,种子和花粉含有该多核苷酸序列或其同源物,遗传改变的植物细胞包含与启动子可操作地连接的该多核苷酸,使得所述植物细胞产生所述嵌合蛋白。另一个实施方案包括组织培养物,其包含多种遗传改变的植物细胞。

在优选的实施方案中,编码毛状体靶向融合蛋白的多核苷酸可以与适合于在大麻、烟草或其他植物中蛋白表达的启动子可操作地连接。示例性启动子可包括但不限于:非组成型启动子、诱导型启动子、组织优先启动子、组织特异性启动子、植物特异性启动子或组成型启动子。在优选的实施方案中,一种或多种选择的基因可以与叶特异性基因启动子可操作地连接,例如cabl。用于表达的其他启动子和可操作构型以及一种或多种所选基因的共表达在本领域中通常是已知的。

本发明的另一个实施方案可以提供一种构建遗传改变的植物或其部分的方法,与非遗传改变的植物或其部分相比,该植物或其部分具有增加的对大麻素合成期间产生的过氧化氢细胞毒性的抗性,该方法包括以下步骤:将编码融合蛋白的多核苷酸引入植物或其部分中以提供遗传改变的植物或其部分,其中所述融合蛋白包含过氧化氢酶和来自大麻素合酶的毛状体靶向序列。

在一个实施方案中,本发明可以包括一种增加整体大麻素在毛状体中的产生和积累,同时防止潜在的细胞毒性作用的系统。通常如图34所示,在优选的实施方案中,该系统可包括产生转基因大麻、烟草或其他植物或悬浮培养植物,其过表达至少一种myb转录因子以增加整体大麻素生物合成。在进一步优选的实施方案中,该转基因植物可以共表达过氧化氢酶,以减少与大麻素合成相关的过氧化氢产生导致的氧化损伤,从而降低细胞毒性。在某些优选的实施方案中,该过氧化氢酶可以与n-末端合酶毛状体靶向结构域融合,例如来自thca和/或cbda合酶,从而在整株植物系统的情况下帮助将过氧化氢酶定位到毛状体,并且潜在地减少由thca、cbca和/或cbda合成酶活性产生的过氧化氢的毒性水平。

本发明的另一个实施方案可包含编码以下组合的核酸序列的组合多核苷酸:1)大麻素产生转录因子蛋白,例如myb基因;和/或过氧化氢酶蛋白或其任何同源物,其可进一步包括毛状体靶向或定位信号。遗传改变的植物或其部分及其后代包含与启动子可操作地连接的该组合多核苷酸,其中所述植物或其部分及其后代产生所述蛋白质是另一个实施方案。例如,种子和花粉含有该多核苷酸序列或其同源物,遗传改变的植物细胞包含与启动子可操作地连接的该多核苷酸,使得所述植物细胞产生所述蛋白。另一个实施方案包括组织培养物,其包含多种遗传改变的植物细胞。

本发明的另一个实施方案可提供用于构建遗传改变的植物或其部分的方法,其具有:1)与非转基因植物或其部分相比,大麻素产量增加;和/或2)与非遗传改变的植物或其部分相比,在大麻素合成期间产生的对过氧化氢细胞毒性的抗性增加,该方法包括以下步骤:将组合多核苷酸引入植物或其部分中以提供遗传改变的植物或其部分。

本发明另外的实施方案可包括选择表达一种或多种蛋白的遗传改变的植物或其部分,其中表达的蛋白可具有:1)增加大麻素的产生能力,例如通过内源性myb基因的过表达;2)具有/或没有毛状体定位能力的过氧化氢酶、或其任何组合。在某些实施方案中,通过用包含与启动子可操作连接的所述组合多核苷酸的表达载体转化所述植物,引入编码蛋白质的组合多核苷酸。大麻素产生转录因子蛋白可包含选自本文鉴定的序列的seqid或其同源物。自然地,这样的组合和表达组合策略,例如在下面和其他地方的表7-8,10中鉴定,是示例性的,本文所述的元素的多种组合包括在本发明中。

在一个优选实施方案中,本发明的技术可包括高水平的体内大麻素羟化、乙酰化和/或糖基化和/或所有三者的组合的系统、方法和组合物。在优选的实施方案中,体内大麻素羟化、乙酰化和/或糖基化和/或三者的组合可以在大麻素产生植物或细胞培养系统中发生。而在替代实施方案中,可包括非大麻素产生植物或细胞培养系统,例如烟草植物,如n.benthamiana。

在一个实施方案中,本发明可包括大麻素的产生、积累和改良系统。在一个优选实施方案中,植物(例如大麻或烟草)可遗传修饰以表达一种或多种异源细胞色素p450基因。在这个优选实施方案中,异源人细胞色素p450(cyp3a4)seqidno.1可以在大麻素-产生植物或细胞培养系统中表达。虽然在替代实施方案中,异源人细胞色素p450(cyp3a4)可以表达非大麻素产生植物或细胞培养系统,例如烟草植物,如n.benthamiana,但是在这个实施方案中,鉴定为seqidno.2的异源人细胞色素p450蛋白的过表达可使内源性产生的大麻素官能化,使得它们可以在体内更有效地糖基化和/或乙酰化,从而使它们具有水溶性。

在可替换的实施方案中,本发明可包括大麻素的产生、积累和改良系统。在一个优选实施方案中,植物,如大麻或烟草,可以是遗传修饰的,以表达一种或多种异源细胞色素p450氧化还原酶基因。在这个优选实施方案中,鉴定为seqidno.3的异源细胞色素p450氧化还原酶(oxred)可以在大麻素产生植物或细胞培养系统中表达。虽然在替代实施方案中,异源人异源细胞色素p450氧化还原酶(oxred)可以表达非大麻素产生植物或细胞培养系统,例如烟草植物,如n.benthamiana,但是在这个实施方案中,鉴定为seqidno.4的异源细胞色素p450氧化还原酶(oxred)蛋白的过表达可使内源性产生的大麻素官能化,使得它们可以在体内更有效地糖基化和/或乙酰化,从而使它们具有水溶性。

在一个实施方案中,本发明可包括非大麻素产生植物中的大麻素产生、积累和改良系统。在一个优选实施方案中,植物(如烟草)可以遗传修饰以表达一种或多种异源细胞色素p450氧化还原酶基因。在这个优选实施方案中,鉴定为seqidno.3的异源细胞色素p450氧化还原酶(oxred)可以在大麻素-产生植物或细胞培养系统中表达。虽然在替代实施方案中,异源细胞色素p450氧化还原酶(oxred)可以表达非大麻素产生植物或细胞培养系统,例如烟草植物,如n.benthamiana,但是在这个实施方案中,鉴定为seqidno.4的异源细胞色素p450氧化还原酶(oxred)蛋白的过表达可有助于将大麻素的官能化引入遗传修饰的植物或植物细胞培养系统,使得它们可以在体内更有效地糖基化和/或乙酰化,从而使它们具有水溶性。

在一个优选实施方案中,细胞色素450和p450氧化还原酶共同表达。

在另外实施方案中,本发明可以包括在非大麻素产生植物或植物细胞培养系统中表达一种或多种外源或异源(这些术语通常是可互换的)大麻素合酶基因。在一个优选实施方案中,这种基因可包括cbg、thca、cbda或cbca合酶基因中的一种或多种。例如在一个实施方案中,来自cannabissativa的鉴定为seqidno.5(基因)或seqidno.6(蛋白)的大麻二酚酸(cbda)合酶可以使用在非大麻产生植物中表达,例如n.benthamiana的植物细胞悬浮培养物。在另外优选的实施方案中,来自cannabissativa的鉴定为seqidno.42(基因)的四氢大麻酚酸(thca)合酶可以使用在非大麻产生植物中表达,例如n.benthamiana的植物细胞悬浮培养物。

在另外优选的实施方案中,在大麻素和/或非大麻素植物或植物细胞悬浮培养物中表达的这种大麻素合酶基因可以靶向或定位于细胞的某些部分。例如在一个优选实施方案中,大麻素的产生可局限于细胞质,使大麻素在细胞质中积累。在一个示例性实施方案中,可以产生人工修饰的大麻素合酶蛋白。在这个示例性实施方案中,cbda合酶可以具有毛状体靶向序列,去除形成被鉴定为seqidno.22(基因)或23(蛋白)的细胞溶质cbda合酶(cytcbda)。替换的实施方案将包括产生其他人工细胞溶胶靶合酶基因,例如鉴定为seqidno.46(基因)的胞质thca合酶(cytthca)。

这些优选的实施方案可特别适用于大麻素细胞悬浮培养大麻素表达系统,因为这种培养系统缺乏整株植物中存在的毛状体。因此,在一个优选实施方案中,大麻素产生植物可以转化为一种或多种缺乏毛状体靶向信号的人工细胞溶质靶向大麻素合酶基因。在可替换的实施方案中,这种人工细胞溶质靶向大麻素合酶基因可以在大麻素产生植物悬浮培养物中表达,其中相应的内源性野生型合酶基因已经被抑制和/或敲除。

在一个实施方案中,本发明可包括可产生水溶性大麻素的大麻素产生、积累和改良系统。在一个优选实施方案中,植物,例如大麻或烟草,可以是表达一种或多种异源糖基转移酶基因,例如udp糖基转移酶。在这个优选实施方案中,来自甜叶菊的udp糖基转移酶(76g1)(seqidno.7)(基因)/seqidno.8(蛋白)可以用大麻素产生植物或细胞悬浮培养物表达。在优选的实施方案中,大麻素产生植物或细胞悬浮培养可以是大麻。在另外实施方案中,来自烟草的一种或多种糖基转移酶和/或来自本生烟的同源糖基转移酶可以在大麻素产生植物中表达,例如大麻,或者可以在内源性植物和/或植物细胞培养系统中过表达。在优选的实施方案中,糖基转移酶基因和/或蛋白可选自示例性植物,例如烟草。这种糖基转移酶基因和/或蛋白质可包括但不限于:糖基转移酶(ntgt5a)烟草(seqidno.26)(氨基酸);糖基转移酶(ntgt5a)烟草(seqidno.27)(dna);糖基转移酶(ntgt5b)烟草(seqidno.28)(氨基酸);糖基转移酶(ntgt5b)烟草(seqidno.29)(dna);udp-糖基转移酶73c3(ntgt4)烟草(seqidno.30)(氨基酸);udp-糖基转移酶73c3(ntgt4)烟草(seqidno.31)(dna);糖基转移酶(ntgtlb)烟草(seqidno.32)(氨基酸);糖基转移酶(ntgtlb)烟草(seqidno.33)(dna);糖基转移酶(ntgtla)烟草(seqidno.34)(氨基酸);糖基转移酶(ntgtla)烟草(seqidno.35)(dna);糖基转移酶(ntgt3)烟草(seqidno.36)(氨基酸);糖基转移酶(ntgt3)烟草(seqidno.37)(dna);糖基转移酶(ntgt2)烟草(seqidno.38)(氨基酸)和/或糖基转移酶(ntgt2)烟草(seqidno.39)(dna)。来自烟草的序列仅是示例性的,因为可以使用其他烟草糖基转移酶。

如上所述,这种糖基转移酶可以使植物或植物细胞悬浮培养物中的大麻素和/或官能化的大麻素糖糖化,如本文一般描述的。当然,来自替代来源的其他糖基转移酶基因可以包括在本发明中。

如上所述,在一个实施方案中,可以将一种或多种糖基转移酶靶向或定位于植物细胞的一部分。例如在这个优选实施方案中,大麻素糖基化可以定位于毛状体,以使大麻素在该结构中以更高的野生型水平积累。在一个示例性实施方案中,可以产生人工修饰的糖基转移酶。在该示例性实施方案中,udp糖基转移酶(76g1)可以在其n-末端尾部与毛状体靶向序列融合。该毛状体靶向序列可以被细胞识别并使其被运输到毛状体。该人工基因构建体被鉴定为seqidno.19(基因)或seqidno.20(蛋白)。在一个实施方案中,毛状体靶向序列或结构域可以衍生自任何数量的合酶。例如,在一个实施方案中,thca合酶毛状体结构域(seqidno.40)可以与糖基转移酶偶联,如上所述。此外,在另一个实例中,cbda合酶毛状体靶向结构域(seqidno.41)可以与如上所述的糖基转移酶偶联。

在另外实施方案中,本发明可以包括实施方案,其中瞬时修饰的大麻素可以被动地和/或主动地从细胞排泄到细胞壁中。在一个示例性模型中,外源atp结合盒转运蛋白(abc转运蛋白或abct)或其他类似的分子结构可识别瞬时修饰的大麻素上的糖基或葡糖醛酸或乙酰基官能团(缀合物)并主动转运穿过细胞壁/膜并进入周围介质。

在一个实施方案中,可以转化植物以表达异源abc转运蛋白。在这个实施方案中,abct可促进大麻素在悬浮培养物中的细胞外转运,例如大麻或烟草细胞悬浮培养。在这个优选实施方案中,人多药物转运(abcg2)可分别在其植物细胞悬浮培养物中表达。abcg2是质膜定向蛋白,并且可以进一步鉴定为seqidno.9(基因)或10(蛋白)。

通常,毛状体结构,例如在大麻或烟草中,将具有非常少或没有用于糖基转移酶的底物来用于实现糖基化。为了解决此问题,在一个实施方案中,本发明可包括增加糖基转移酶底物的系统、方法和组合物,即毛状体中的选择糖。在一个优选实施方案中,本发明可包括将糖转运到毛状体的靶向或定位。在这个优选实施方案中,外源或内源性udp-葡萄糖udp-半乳糖转运蛋白(utr1)可以在毛状体产生植物中表达,例如大麻或烟草等。在这个实施方案中,udp-葡萄糖/udp-半乳糖转运蛋白(utr1)可以修饰以包括质膜靶向序列和/或结构域。

利用该靶向结构域,udp-葡萄糖/udp-半乳糖转运蛋白(utr1)可以允许人工融合蛋白锚定至质膜。在这种构型中,来自胞质溶胶的糖底物可以通过质膜结合udp-葡萄糖udp-半乳糖转运蛋白(pm-utr1)进入毛状体。在这个实施方案中,糖基转移酶的底物可以定位于毛状体并允许进一步积累,从而允许毛状体中大麻素的糖基化增强。在一个实例中,seqidno.21被鉴定为来自拟南芥的异源udp-葡萄糖/半乳糖转运蛋白(utr1)的多核苷酸基因序列,其具有替代液泡膜靶向序列的质膜靶向序列。该示例性融合蛋白的质膜靶向序列可包括以下序列(参见seqidno21)tgctccataatgaacttaatgtgtgggtctacctgcgccgct、或与序列具有70-99%同源性的序列。

应当注意,本文所述的基因/蛋白的许多组合和排列可以共表达,从而实现本发明的一个或多个目标。这些组合仅是优选实施方案的示例,并不以任何方式进行限制。

在一个实施方案中,可以抑制、下调、破坏或甚至敲除基因,例如大麻素合酶,或与例如信号结构域相对应的基因片段。本领域普通技术人员将认识到可以在没有过度实验的情况下实现此目的的许多过程。在其他实施方案中,敲除可能意味着与野生型版本相比,修饰的内源或外源基因的过表达。

例如,在一个实施方案中,通过在n.benthamiana中共表达cyp3a4和cyp氧化还原酶(细胞色素p450与p450氧化还原酶)和至少一种内源性糖基转移酶,可以产生高水平的大麻素糖基化。在另外实施方案中,内源性或外源基因中的一种或多种可以在植物或植物细胞培养物中表达,同时表达myb和/或过氧化氢酶。在这种配置中,在cannabissativa的水溶性大麻素(糖基化和羟基化)的合成中存在过量表达myb转录因子和过氧化氢酶的累加效应,其中一种或多种可以被靶向或定位。

在某些实施方案中,内源性大麻素可以如本文一般描述的那样被官能化和/或乙酰化和/或糖基化。

本文描述的所有序列包括与所鉴定的序列具有70-99%同源性的序列。

本发明的修饰的大麻素化合物可用于多种治疗应用。例如,该化合物可用于治疗或缓解涉及cb1和cb2受体的疾病和病症的症状,包括食欲减退、恶心和呕吐、疼痛、多发性硬化和癫痫。例如,它们可用于治疗各种应用中的疼痛(即作为止痛剂),包括但不限于疼痛控制。在另外的实施方案中,这种修饰的大麻素化合物可用作食欲抑制剂。另外的实施方案可包括给予修饰的大麻素化合物。

通过“治疗”本发明人意味着施用化合物以减轻所治疗的疾病或病症的症状。本领域技术人员将认识到,可以完全消除所治疗的疾病或病症的症状,或者可以简单地减轻症状。此外,化合物可以与其他药物或治疗方式组合施用,例如与化学疗法或其他抗癌药物一起施用。

实施通常可涉及鉴定患有所述疾病的患者,并通过适当的途径以可接受的形式给予本发明的化合物。给药的确切剂量可以根据个体患者的年龄、性别、体重和总体健康状况以及疾病的确切病因而变化。然而,一般而言,对于哺乳动物(例如人)的给药,剂量范围为每24小时每kg体重约0.1至约30mg化合物,更优选每24小时每kg体重约0.1至约10mg化合物是有效的。

给药可以是口服或肠胃外给药,包括静脉内、肌肉内、皮下、皮内注射、腹膜内注射等,或通过其他途径(例如透皮、舌下、口服、直肠和口腔给药、吸入气溶胶等)。在本发明的一个优选实施方案中,口服或静脉内提供水溶性大麻素类似物。

特别地,本发明的酚酯(式1)优选全身给药,以通过酯的体内裂解提供代谢活化的机会。此外,在戊基侧链具有唑部分的水溶性化合物(式2,例如具有咪唑部分)不需要体内活化,并且可以适合于直接给药(例如位点特异性注射)。

所述化合物可以以纯的形式或以药学上可接受的制剂形式给药,包括合适的酏剂、粘合剂等(通常称为“载体”)或药学上可接受的盐(例如碱金属盐,例如钠、钾、钙、或锂盐、铵等)或其他配合物。应当理解,药学上可接受的制剂包括常规用于制备可注射剂型和固体剂型如片剂和胶囊以及雾化剂型的液体和固体材料。此外,化合物可以用水性或油性载体配制。水可以用作制备组合物(例如可注射组合物)的载体,其也可以包括常规缓冲剂和试剂以使组合物等渗。其他潜在的添加剂和其他材料(最好是那些通常被认为是安全的[gras])包括:着色剂、调味料、表面活性剂(吐温,油酸等)、溶剂、稳定剂、酏剂、粘合剂或包封剂(乳糖,脂质体等)。固体稀释剂和赋形剂包括乳糖、淀粉、常规的崩解剂、涂料等。也可以使用防腐剂如对羟基苯甲酸甲酯或苯扎氯铵。根据配方,预计活性组合物占组合物的约1%至约99%,并且载体“载体”占组合物的约1%至约99%。本发明的药物组合物可包括任何合适的药学上可接受的添加剂或辅助剂,只要它们不妨碍或干扰活性化合物的治疗效果。

本发明化合物的给药可以是间歇的、推注剂量、或者以逐渐或连续、恒定或受控的速率给予患者。另外,药物制剂施用的一天中的时间和每天的次数可以变化,并且由技术人员例如医生最好地确定。此外,有效剂量可以根据诸如递送模式、性别、年龄和患者的其他状况等因素以及疾病的程度或进展而变化。化合物可以单独提供、以含有两种或多种化合物的混合物提供、或与其他药物或治疗方式组合提供。也可以将化合物离体加入血液中,然后提供给患者。

可以使用开发用于产生转基因植物的几种类型的转化方法将通过组合多核苷酸和/或其同源物编码的基因引入植物和/或植物细胞中。标准转化技术,例如ti-质粒土壤杆菌介导的转化、粒子轰击、显微注射和电穿孔可用于构建稳定转化的转基因植物。

如本文使用,“大麻素”是存在于植物种属大麻中的化学化合物(如大麻酚、thc或大麻二酚),如紫锥菊、千日菊、helichrysumumbraculigerum、radulamarginata(liverwort)、和可可树、以及可具有或不具有精神活性特性的代谢物及其合成类似物。因此,大麻素包括(但不限于)对大麻素受体具有高亲和力(例如ki<250nm)的化合物(如thc)、以及对大麻素受体没有显着亲和力的化合物(如大麻二酚、cbd)。大麻素还包括具有特征性二苯并吡喃环结构(thc中所见类型)和不具有吡喃环的大麻素的化合物(例如大麻二酚)。因此,大麻素的部分列表包括thc、cbd、二甲基庚基戊基大麻二酚(dmhp-cbd)、6,12-二氢-6-羟基-大麻二酚(描述于u.s.pat.no.5,227,537,通过引用并入)、(3s,4r)-7-羟基-a6-四氢大麻酚同系物和衍生物(描述于u.s.pat.no.4,876,276,通过引用并入)、(+)-4-[4-dmh-2,6-二乙酰氧基-苯基]-2-羧基-6,6-二甲基二环[3.1.1]庚-2-烯、和其他4-苯基蒎烯衍生物(公开于u.s.pat.no.5,434,295,通过引用并入)、和大麻二酚(-)(cbd)类似物(例如(-)cbd-单甲醚、(-)cbd二甲醚、(-)cbd双醋酸酯、(-)3'-乙酰基-cbd单醋酸酯和±af11,都公开于consroeetal.,j.clin.phannacol.21:428s-436s,1981,通过引用并入)。许多其他大麻素的类似公开于agurelletal.,pharmacol.rev.38:31-43,1986,也通过引用并入。

如本文所要求的,术语“大麻素”还可包括大麻素的不同修饰形式,例如羟基化大麻素或大麻素羧酸。例如,如果糖基转移酶能够使大麻素糖基化,则它将包括如其他地方所定义的术语大麻素、以及上述修饰形式。它可以进一步包括多个糖基化部分。

大麻素的例子是四氢大麻酚、大麻二酚、大麻萜酚、大麻色烯、大麻环酚、次大麻酚、cannabielsoin、大麻二吡喃环烷、大麻萜酚酸、大麻萜酚酸单甲醚、大麻萜酚单甲醚、次大麻酚酸、cannabigerovarin、大麻色酸、次大麻色酚酸、cannabichromevarin、cannabidolicacid、大麻二酚单甲醚、大麻二酚-c4、麻二酚酸、cannabidiorcol、δ-9-四氢大麻酚酸a、δ-9-四氢大麻酚酸b、δ-9-四氢大麻酚酸-c4、δ-9-四氢次大麻酚酸、δ-9-四氢次大麻酚、δ-9-四氢cannabiorcolicacid、δ-9-四氢cannabiorcol、δ-7-顺-异-四氢次大麻酚、δ-8-四氢cannabiniolicacid、δ-8-四氢大麻酚、大麻环酚酸、cannabicylovarin、cannabielsoicacida、cannabielsoicacidb、大麻酚酸、大麻酚甲醚、大麻酚-c4、大麻酚-c2、cannabiorcol、10-乙氧基-9-羟基-δ-6a-四氢大麻酚、8,9-二羟基-δ-6a-四氢大麻酚、cannabitriolvarin、乙氧基-cannabitriolvarin、dehydrocannabifuran、cannabifuran、cannabichromanon、大麻二吡喃环烷、10-氧杂-δ-6a-四氢大麻酚、δ-9-顺-四氢大麻酚、3,4,5,6-四氢-7-羟基-α-α-2-三甲基-9-正丙基-2,6-甲-2h-醇-benzoxocin-5-甲醇-cannabiripsol、三羟基-δ-9-四氢大麻酚和大麻酚。在本公开的上下文中的大麻素的实例包括四氢大麻酚和大麻二酚。

术语“内源性大麻素”是指包括下列的化合物:花生四烯酰基乙醇酰胺(花生四烯酸乙醇胺,aea)、2-花生四烯酰基乙醇酰胺(2-ag)、1-花生四烯酰基乙醇酰胺(1-ag)、和二十二碳六烯酰基乙醇酰胺(dhea,synaptamide)、油酰基乙醇酰胺(oea)、eicsapentaenoyl乙醇酰胺、前列腺素乙醇酰胺、二十二碳六烯酰基乙醇酰胺、亚麻酰基乙醇酰胺、5(z),8(z),11(z)-二十碳三烯酸乙醇酰胺(蜂蜜酸乙醇酰胺)、十七碳酰基乙醇酰胺、硬脂酰基乙醇酰胺、二十二碳烯酰基乙醇酰胺、nervonoyl乙醇酰胺、二十三酰基乙醇酰胺、二十四烷酰乙醇酰胺、肉豆蔻酰基乙醇酰胺、十五烷酰基乙醇酰胺、棕榈油酰基乙醇酰胺、二十二碳六烯酸(dha)。特别优选的内源性大麻素是aea、2-ag、1-ag和dhea。

羟基化是将羟基(-oh)引入有机化合物的化学方法。乙酰化是一种添加乙酰基化学基团的化学反应。糖基化是糖基供体与形成糖苷的糖基受体的偶联。

术语“前药”是指生物活性药剂(药物)的前体。前体药物必须经历化学或代谢转化才能成为生物活性药剂。前药可以通过化学转化方法离体转化为生物活性药剂。在体内,通过代谢过程,酶促过程或降解过程的作用将前药转化为生物活性药剂,其去除前药部分以形成生物活性药剂。

如本文使用,涉及连续核酸序列的术语“同源的”是指在适当条件下与参考核酸序列杂交的连续核苷酸序列。例如,同源序列可具有约70%-100或更通常80%-100%的序列同源性,例如约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%约95%、约96%、约97%、约98%、约98.5%、约99%、约99.5%、大约100%。实质同源性与特异性杂交密切相关。例如,当存在足够程度的互补性时,核酸分子是特异性可杂交的,以避免在需要特异性结合的条件下,例如在严格杂交条件下,核酸与非靶序列的非特异性结合。

当用于提及调节序列和编码序列时,术语“可操作地连接”是指调节序列影响连接的编码序列的表达。“调节序列”或“控制元件”是指影响转录、rna加工或稳定性的时间和水平/量、或相关编码序列的翻译的核苷酸序列。调节序列可包括启动子、翻译领导者序列、内含子、增强子、茎环结构、阻遏蛋白结合序列、终止序列、多腺苷酸化识别序列等。特定的调节序列可以位于与其可操作地连接的编码序列的上游和/或下游。此外,与编码序列可操作连接的特定调节序列可位于双链核酸分子的相关互补链上。

如本文使用,术语“启动子”是指dna区域,其可以位于转录起点的上游,并且可以参与rna聚合酶和其他蛋白质的识别和结合以起始转录。启动子可以与编码序列可操作地连接以在细胞中表达,或启动子可以与编码信号序列的核苷酸序列可操作地连接,所述信号序列可以与编码序列可操作地连接以在细胞中表达。植物启动子”可以是能够在植物细胞中起始转录的启动子。在发育控制下的启动子的实例包括在某些组织中优先启动转录的启动子,例如叶、根、种子、纤维、木质部导管、管胞或厚壁组织。这种启动子被称为“组织优选的”。仅在某些组织中起始转录的启动子被称为“组织特异性的”。“细胞类型特异性”启动子主要驱动一种或多种器官中某些细胞类型的表达,例如根或叶中的血管细胞。“诱导型”启动子可以是可以在环境控制下的启动子。可通过诱导型启动子启动转录的环境条件的实例包括厌氧条件和光的存在。组织特异性、组织优选的、细胞类型特异性和诱导型启动子构成“非组成型”启动子的类别。“组成型”启动子是在大多数环境条件下或在大多数细胞或组织类型中可能具有活性的启动子。

任何诱导型启动子均可用于本发明的一些实施方案中。参见wardetal.(1993)plantmol.biol.22:361-366。对于诱导型启动子,转录速率响应于诱导剂而增加。示例性的诱导型启动子包括但不限于:来自响应铜的acei系统的启动子;来自响应苯磺酰胺除草剂安全剂的玉米的in2基因;来自tnlo的tet阻遏物;和来自类固醇激素基因的诱导型启动子,其转录活性可由糖皮质激素激素诱导,这些是一般的例子(schenaetal.(1991)proc.natl.acad.sci.usa88:0421)。

如本文使用,术语“转化”或“遗传修饰的”是指一个或多个核酸分子转移到细胞中。当核酸分子被植物稳定复制时,植物被转导到植物中的核酸分子“转化”或“遗传修饰”。如本文使用,术语“转化”或“遗传修饰”包括可以将核酸分子引入例如植物的所有技术。

术语“载体”是指可以将dna、rna、蛋白或多肽引入宿主的一些构件。待引入宿主的多核苷酸、蛋白和多肽本质上可以是治疗性的或预防性的;可编码或是抗原;可以是本质上调控性的等。有各种类型的载体,包括病毒、质粒、噬菌体、粘粒和细菌。

如本领域所知,不同的生物优先利用不同的密码子来产生多肽。这种“密码子使用”偏好可用于设计编码本发明蛋白和嵌合体的核酸分子,以优化特定宿主细胞系统中的表达。

“表达载体”是能够在选定的宿主细胞或生物体中复制的核酸。表达载体可以作为自主结构复制,或者可以整体或部分整合到宿主细胞染色体或细胞器的核酸中,或者它用作穿梭以将外来dna递送到细胞,因此与宿主细胞基因组一起复制。因此,表达载体是能够在选定的宿主细胞、细胞器或生物体中复制的多核苷酸,例如质粒、病毒、人工染色体、核酸片段、以及表达载体上的某些基因(包括目的基因)被转录并翻译成细胞、细胞器或生物体内的多肽或蛋白;或本领域已知的包含“表达盒”的任何合适的构建体。相反,如本文实施例中所述,“表达盒”是含有本发明表达载体部分的多核苷酸。表达盒的使用有助于表达载体的组装。表达载体是复制子,例如质粒、噬菌体、病毒、嵌合病毒或粘粒,并且含有与表达控制序列可操作连接的所需多核苷酸序列。

当表达控制序列控制和调节该多核苷酸序列的转录和/或翻译时,多核苷酸序列与表达控制序列(例如,启动子和任选的增强子)可操作地连接。

除非另有说明,否则特定核酸序列还隐含地包括其保守修饰的变体(例如简并密码子取代)、互补(或补体)序列和反向互补序列,以及明确指出的序列。具体地,简并密码子取代可以通过产生其中一个或多个选定(或所有)密码子的第三位置被混合碱基和/或脱氧肌苷残基取代的序列来实现(例如参见batzeretal.,nucleicacidres.19:5081(1991);ohtsukaetal.,j.biol.chem.260:2605-2608(1985)和rossolinietal.,mol.cell.probes8:91-98(1994))。由于核酸密码子的简并性,可以使用各种不同的多核苷酸来编码相同的多肽。下文表1a包含关于哪些核酸密码子编码哪种氨基酸的信息。

表4氨基酸核酸密码子

术语“植物”或“植物系统”包括整株植物、植物器官、整株植物或植物器官的后代、胚胎、体细胞胚、胚样结构、原球茎、原球茎样体(plb)和培养物、和/或植物细胞的悬浮液。植物器官包括例如芽营养器官/结构(例如叶、茎和块茎)、根、花和花器官/结构(例如苞片、萼片、花瓣、雄蕊、心皮、花药和胚珠)、种子(包括胚、胚乳和种皮)和果实(成熟卵巢)、植物组织(例如维管组织、地面组织等)和细胞(例如保卫细胞、卵细胞、毛状体等)。本发明还可以包括大麻科(cannabaceae)和其他大麻(cannabis)株,例如一般的c.sativa。

如本文使用,术语“表达”或“编码序列的表达”(例如,基因或转基因)是指核酸转录单元(包括例如基因组dna或cdna)的编码信息被转换成细胞的可操作的、非操作的或结构的部分的过程通常包括蛋白质的合成。基因表达可能受外部信号的影响;例如,将细胞、组织或生物体暴露于增加或减少基因表达的试剂。基因的表达也可以在从dna到rna到蛋白质的途径中的任何地方受到调节。基因表达的调节例如通过控制作用于转录、翻译、rna转运和加工、中间分子例如mrna的降解、或通过特定蛋白质分子的活化、失活、区室化或降解后发生、或其组合。可以通过本领域已知的任何方法在rna水平或蛋白质水平测量基因表达,包括但不限于northern印迹、rt-pcr、western印迹、或体外、原位或体内蛋白质活性测定。

术语“核酸”或“核酸分子”包括单链和双链形式的dna、单链形式的rna、和双链形式的rna(dsrna)。术语“核苷酸序列”或“核酸序列”是指核酸的有义链和反义链作为单个单链或在双链体中。术语“核糖核酸”(rna)包括irna(抑制性rna)、dsrna(双链rna)、sirna(小干扰rna)、mrna(信使rna)、mirna(micro-rna)、hprna(发夹rna)、trna(转移rna,无论是用相应的酰化氨基酸加成还是排出)、和crna(互补rna)。术语“脱氧核糖核酸”(dna)包括cdna、基因组dna和dna-rna杂合体。本领域技术人员将术语“核酸区段”和“核苷酸序列区段”或更一般地“区段”理解为功能性术语,包括基因组序列、核糖体rna序列、转移rna序列、信使rna序列、操纵子序列和编码或可适于编码肽、多肽或蛋白质的较小工程化核苷酸序列。

术语“基因”或“序列”是指可操作地连接到能够以某种方式调节基因产物(例如多肽或功能性rna)表达的适当调节序列的编码区。基因包括编码区(开放阅读框,orf)之前(上游)和之后(下游)的dna的非翻译调节区(例如,启动子、增强子、阻遏物等)、以及在适用的情况下各个编码区(即外显子)之间的间插序列(即内含子)。术语“结构基因”在本文中用于表示转录成mrna的dna序列,然后将其翻译成特定多肽特征的氨基酸序列。

核酸分子可包括通过天然存在的和/或非天然存在的核苷酸键连接在一起的天然存在的和修饰的核苷酸中的一种或两种。核酸分子可以化学或生物化学修饰,或者可以含有非天然或衍生的核苷酸碱基,这是本领域技术人员容易理解的。这些修饰包括例如标记、甲基化、一个或多个天然存在的核苷酸被类似的核苷酸间修饰取代(例如不带电荷的键:例如甲基膦酸酯、磷酸三酯、氨基磷酸酯、氨基甲酸酯等;带电键:例如硫代磷酸酯、二硫代磷酸酯等;侧链部分:例如肽;嵌入剂:例如吖啶、补骨脂素等;螯合剂;烷化剂;和修饰的连接:例如α端基异构核酸等)。术语“核酸分子”还包括任何拓扑构象,包括单链、双链、部分双链、三链、发夹、圆形和挂锁构象。

如本文关于dna所用,术语“编码序列”、“结构核苷酸序列”或“结构核酸分子”是指当置于合适的调节序列控制下时,通过转录和mrna最终翻译成多肽的核苷酸序列。关于rna,术语“编码序列”是指翻译成肽、多肽或蛋白质的核苷酸序列。编码序列的边界由5'-末端的翻译起始密码子和3'-末端的翻译终止密码子决定。编码序列包括但不限于基因组dna、cdna、est和重组核苷酸序列。

如本文在两个核酸或多肽序列的上下文中使用的术语“序列一致性”或“一致性”是指当在指定的比较窗口上对齐以获得最大对应性时两个序列中的残基相同。

术语“重组”当用于参考例如细胞、或核酸、蛋白或载体时,表明细胞、有机体、核酸、蛋白或载体已通过引入异源核酸或蛋白、或天然核酸或蛋白质的改变、或细胞来源于这样修饰的细胞而被修饰。因此,例如,重组细胞可以表达在细胞的天然(非重组或野生型)形式中未发现的基因、或表达异常表达过表达、低表达或根本不表达的天然基因。

术语“约”和“大约”是指数量、水平、值或量变化多达30%,或参考数量、水平、值或量在另一个实施方案中变化多达20%,并且在第三实施方案中多达10%。如本文使用,除非上下文另有明确规定,否则单数形式“一”、“一个”和“该”包括复数指代。

如本文使用,关于核酸的“异源”或“外源”是源自外来物种的核酸,或者是合成设计的,或者如果来自同一物种,则通过有意的人为干预从组合物和/或基因组基因座中的天然形式进行实质性修饰。异源蛋白质可以源自外来物种,或者如果来自相同物种,则通过有意的人为干预从其原始形式进行实质性修饰。“宿主细胞”是指含有导入的核酸构建体并支持构建体的复制和/或表达的细胞。宿主细胞可以是原核细胞(如大肠杆菌)、或真核细胞(如真菌)、酵母、昆虫、两栖动物、线虫或哺乳动物细胞。或者,宿主细胞是单子叶植物或双子叶植物细胞。单子叶植物宿主细胞的实例是玉米宿主细胞。

实施例

实施例1:细胞色素p450对大麻素的官能化

本发明人已经证明大麻素可以在体内植物系统中官能化。具体地,本发明人利用细胞色素p450单加氧酶(cyp)来修饰或官能化大麻素的化学结构。如下所示,cyp通过将氧原子插入疏水分子中以使它们更具反应性和亲水性来实现这一点。代表性反应可包括图13中的通常反应。

p450酶系统涉及多种细胞色素p450种和非特异性细胞色素p450氧化还原酶。如图5所示,本发明人在具有示例性人细胞色素p450氧化还原酶的双构建体中使用人细胞色素p450(cyp3a4),两者均在具有5'非翻译区的组成型camv35s启动子的控制下表达以加强翻译。用于大麻素官能化的蛋白和dna序列(cyp3a4和p450氧化还原酶)被鉴定为seqidno.1-4。使用下表3中鉴定的正向和反向引物,使用rt-pcr确认表达。如上所述,本发明人证明过表达p450产生官能化的大麻素,然后可将其糖基化,从而使其成为水溶性的。

实施例2:p450过表达增强植物系统中大麻素的体内羟基化和糖基化

本发明人已经证明,在示例性植物系统中过表达增强cbda的体内羟基化和糖基化。具体地,如图6中一般所示,本发明人证明,如本文所述,用携带cyp3a4和p450氧化还原酶的土壤杆菌浸润烟草叶。在浸润2-3天后使用rt-pcr进行表达的确认(图6)。

如图7中一般所示,本发明人证明cyp3a4+p450氧化还原酶构建体的过表达以及随后在确认表达后喂食至少一种大麻素(在这种情况下为cbda)导致烟草叶片中cbda的体内糖基化(图7)。与对照相比,转基因n.benthamiana植物的糖基化平均增加3倍,而羟基化增加至13倍。因此,在某些实施方案中,烟草糖基转移酶可用作本发明的大麻素糖基化技术的关键靶标。

实施例3:质谱鉴定改性水溶性大麻素

本发明人证明了在体外和体内植物系统中修饰的官能化以及水溶性大麻素的生物合成。具体地,本发明人在体外测定和瞬时叶表达中鉴定了与基因构建体相关的大麻素生物转化。通过使用精确的质谱测量,本发明人能够鉴定和确认修饰的水溶性大麻素的生物合成。

具体而言,如图1-4所示,本发明人能够在色谱分析中鉴定糖基化的水溶性大麻素,并且能够产生用于峰积分的提取离子色谱图。例如,图1的组b描述单个糖苷部分的多个构成大麻素异构体的鉴定,而在图2的组b中,描述细胞色素p450氧化的多个构成异构体的例子。每种鉴定分子的峰面积用于处理之间的相对定量。基于这些结果,我们证实了含有高达2g糖苷部分,o乙酰基糖苷以及羟基化(r-oh)生物转化的改性大麻素分子的生物合成。

下面提供表1和2,进一步证明了选择的改性大麻素分子的产生。通常参考下面的表1-2,本发明人证明了基于减少的水中保留时间:乙腈hplc梯度,比其未修饰形式更早洗脱的糖基化和羟基化大麻素被证明比其未修饰形式更具水溶性。

实施例4:产生用于在烟草叶和细胞悬浮液中表达的异源胞质合成和糖基化基因构建体

如图8所示,本发明人产生用于表达大麻二酚酸(cbda)合酶的三基因构建体,其中已经去除毛状体靶向序列,并且糖基转移酶76g1来自甜叶菊。在该构建体中,还包括多药物abc转运蛋白abcg2。

在本发明技术的一个实施方案中,基因构建体可用于转化植物细胞,所述植物细胞可进一步配置成在悬浮培养物中培养。在一个优选实施方案中大麻细胞可以用图8中概括的构建体转化。在这个优选实施方案中,由大麻细胞在细胞培养物中产生的大麻素可通过如上所述的cyp3a4+p450氧化还原酶的过表达而官能化,并通过来自上面涉及的甜叶菊的异源udp糖基转移酶(76g1)的表达和作用进一步糖基化。此外,如本文概括所述,大麻素可以被修饰以被官能化和/或糖基化,或通常是水溶性的,并且然后在整株植物或者在悬浮培养中的周围培养基的情况下,在abc转运蛋白的帮助下可以分泌到细胞壁区域中。在一个实施方案中,该构建体可用于在细胞悬浮培养物中合成和修饰大麻素,从而利用烟草亮黄色细胞或大麻细胞。

如图9中一般所示,证实cbda合酶、udp糖基转移酶76g1和abcg2的体内表达。用于rt-pcr反应的反向和正向引物在下表4中提供。

cbda合酶的基因和蛋白序列鉴定分别作为seqidno5和6提供。应当注意,各种大麻素合酶基因/蛋白可以用于本发明的技术,cbda合酶仅是示例性的。实际上,特别考虑的是与本文鉴定的任何大麻素相关的合酶类酶可以在不进行过度实验的情况下并入本发明中。在一个实施方案中,一种或多种这样的外源或内源性合酶可以进一步切除毛状体靶向序列,这一步骤可以再次在不进行过度实验的情况下容易地完成。例子可以是thca合酶、cbg合酶、thca合酶、cbda合酶或cbca合酶,在该实施方案中它们可以去除它们的毛状体靶向序列。

来自甜叶菊的糖基转移酶76g1的基因和蛋白序列鉴定分别作为seqidno7和8的形式提供。多药物abc转运蛋白abcg2的基因和蛋白序列鉴定分别作为seqidno9和10提供。

实施例5:在n.benthamiana叶和细胞悬浮液中大麻素的体内胞质合成和糖基化

如图10所示,本发明人证明,在植物中,在该实施方案中,表达上述细胞溶质构建体的n.benthamiana,发生cbga的糖基化以及形成修饰的或羟基化的cbda。cbga的糖基化通过在n.benthamiana植物中过表达糖基转移酶证明大麻素的体内糖基化。糖基化大麻素在野生型植物中的存在表明在烟草中存在强糖基转移酶。因此,在一个实施方案中,过表达异源或同源烟草糖基转移酶可表达或过表达,导致整株植物以及悬浮培养物中水溶性大麻素的体内生物合成增强。例如,在一个实施方案中,异源烟草糖基转移酶可以在大麻植物或细胞培养物中表达,导致大麻植物和/或大麻悬浮培养物中水溶性大麻素的体内生物合成。

实施例6:利用mtb转录因子和/或过氧化氢酶的水溶性大麻素产生系统

本发明人利用新的蛋白质靶向方法开发了多种基于细胞定位的大麻素的生物合成和修饰系统。如表10所示,本发明人设计了这样的新系统和方法,以增强大麻素的产生和修饰(糖基化、乙酰化和官能化)以及减轻大麻素积累产生的毒性。某些实施方案包括表达myb转录因子和过氧化氢酶(图27)以降解由cbda合酶活性产生的过氧化氢。在一个优选实施方案中,本发明人使用拟南芥或大肠杆菌过氧化氢酶基因和预测的大麻myb转录因子参与提高大麻素生物合成中涉及的基因。大麻的dna和蛋白序列预测myb转录因子(分别为seqidno.11-12,dna和氨基酸序列),arabidopsisthaliana过氧化氢酶分别为seqidno.13-14,dna和氨基酸序列)和/或大肠杆菌过氧化氢酶(seqidno.15-16,dna和氨基酸序列)。

实施例7:增强烟草叶和细胞悬浮液中大麻素的体内细胞溶质合成和糖基化。

本发明人已经证明了在使用糖基化、p450介导的官能化(羟基化)和由过氧化氢酶进行的过氧化氢解毒的构建体共感染的转基因植物中大麻素的体内修饰增强。如图11中进一步所示,在过表达cbda合酶、udp糖基转移酶和abc转运蛋白的转基因烟草植物中观察到主要为底物cbga的官能化和糖基化,但当该构建体的过表达与细胞色素p450、myb转录因子和过氧化氢酶偶联时增加。如前所述,细胞色素p450的过表达增强了大麻素的糖基化。因此,本发明人证明了在用前体cbga喂养的瞬时转化的烟草叶中体内cbda的形成和糖基化。

本发明人还比较了烟源中内源性活性和转基因糖基转移酶活性。具体地,如图12所示,本发明人进行udp糖基转移酶和cbda合酶的体外测定。在30℃下3小时的短测定未显示野生型和转基因n.benthamiana植物之间cbga的糖基化的任何差异,这表明内源性糖基化。在延长的测定(14小时)中,与野生型相比,转基因植物中糖基化cbga的检测存在显着差异,表明转基因植物中的糖基化活性增加。

在某些实施方案中,可以如本文所述使用来自烟草或其他植物的糖基转移酶。在一个实施方案中,一种或多种异源或同源糖基转移酶可以在植物中表达或过表达,例如烟草或大麻。示例性糖基转移酶的基因和蛋白序列在下表9中鉴定。

实施例8:毛状体靶向大麻素合成和大麻二酚酸(cbda)的糖基化构建体的产生

如图14-15所示,本发明人证明了大麻素化合物如cbda的毛状体靶向合成和合成以及糖基化的系统。通过靶向cbda合酶、靶向血浆的udp-葡萄糖/udp-半乳糖转运蛋白(pm-utr1)和针对毛状体的甜叶菊udp-糖基转移酶76g1(tsugt),在这种情况下这些基因可以产生和积累cbda及其糖基化衍生物(伯、仲糖苷)以及毛状体中的新型cbda衍生物。

seqidno.17被鉴定为具有毛状体靶向序列的cbda合酶的多核苷酸基因序列。seqidno.18被鉴定为具有毛状体靶向结构域的cbda合酶的相应蛋白序列。

seqidno.19被鉴定为针对毛状体靶向的udp-糖基转移酶(76g1)编码序列的多核苷酸基因序列,在这种情况下针对拟南芥表达进行了优化,尽管其他密码子优化的形式也属于本发明的范围。seqidno.20被鉴定为具有毛状体靶向结构域的udp-糖基转移酶(76g1)的相应蛋白序列。

seqidno.21被鉴定为具有质膜靶向序列的udp-葡萄糖/半乳糖转运蛋白(utr1)的多核苷酸基因序列。

实施例9:大麻二酚酸(cbda-)的毛状体靶向合成和糖基化

如图16-17所示,通过rt-pcr证实n.benthamiana浸润的叶子中cbda合酶、tsugt和pm-utr1的基因表达2dpi(土壤渗透后的细菌杆菌ti-质粒构建体)(图19和20)。如所预期的,在所有渗入的叶子和野生型对照中检测到cbga底物(无土壤杆菌渗入)。在所有浸润的叶子和野生型对照中也检测到cbga伯和仲糖苷,这进一步证明作用于cbga的内源性糖基转移酶活性。此外,在所有样品中检测到cbga乙酰化的伯糖苷,包括wt对照,这提供内源性乙酰化的证据。在用毛状体和细胞悬浮构建体渗入的样品中检测到cbda的边缘水平,但在野生型植物中没有检测到。

实施例10:大麻二酚酸(cbda)的细胞溶质合成和糖基化

本发明人已经证明了细胞溶质靶向大麻素合成和糖基化的系统。通过将cbda合酶(cbda)和udp-糖基转移酶76g1(ugt)靶向或定位于胞质溶胶,本发明人证明了表达这些异源基因的植物产生并积累,在这个实施方案中是cbda及其糖基化衍生物(伯、仲糖苷),并且在细胞质中是其他cbda衍生物。如图18所示,产生细胞溶质大麻素产生系统的基因表达载体。该构建体包括花椰菜嵌纹35s启动子、atadh5'-utr、增强子元件、cytcbda、去除毛状体靶序列的大麻二酚酸合酶、hsp终止子、cytugt76gl、来自甜叶菊的udp糖基转移酶。

seqidno.22被鉴定为去除毛状体靶序列(cytcbda)的大麻二酚酸合酶的多核苷酸基因序列。seqidno.23被鉴定为cytcbda的相应的蛋白序列。

seqidno.24被鉴定为细胞溶质靶向udp-糖基转移酶(ugt76g1)编码序列(针对拟南芥表达优化)(cytugt76g1或cytutg)的多核苷酸基因序列。seqidno.25被鉴定为cytugt76g1或cytutg的相应蛋白序列。

作为示例性植物模型,从种子生长n.benthamiana植物,并且在营养生长4周后,用携带以下构建体的土壤杆菌根瘤菌gv3101共渗入叶子:pri201-an或细胞悬浮构建体中的细胞溶质cbda+细胞溶质ugt、pri201-an中的myb/过氧化氢酶和pdgb3alpha2中的pi9沉默抑制子。使用分光光度计将土壤杆菌密度在600nm的吸光度下归一化至2,并以相同比例(1:1:1)共渗透培养物。在土壤杆菌杆菌浸润(dpi)后2和4天后,将溶解在0.1%吐温20(sigma-aldrich)或0.1%tritonx-100(sigma-aldrich)中的1mlcbga(2.7mm)渗透到每个叶子中。在使用胞质构建体的第二实施方案中,在进食前将4mmudp-葡萄糖加入cbga培养基中。使用三个生物学重复。rt-pcr引物概述于下表5中。

在图19-20中,在1和2天dpi后通过rt-pcr确认了cytcbda和cytugt的基因表达。在叶浸润细胞悬浮构建体中,在idpi后未观察到abc转运蛋白(abct)的表达。这不影响该实验,因为abct的作用是促进悬浮培养中细胞外的大麻素转运。如图21所示,除了仲糖苷外,检测到cbga及其糖基化和酰化衍生物的浓度高于毛状体构建体浸润叶中的浓度。此外,与毛状体构建体实验(高达2.6ppm)相比,在用细胞悬浮构建体渗入的叶中检测到更高浓度(高达34ppm)的cbda。如图22所示,当udp-葡萄糖4mm(ugt的底物)与cbga(cbda的底物)一起提供时,本发明人在用细胞溶质和细胞悬浮构建体渗入的叶中检测到低水平的糖基化和羟基化的cbda,但在wt对照中没有。该结果证明了替代植物n.benthamiana中cbda的植物合成、糖基化和羟基化的新颖性,如图23中所示的提取离子色谱图所示。

实施例11:cannabissativa中大麻素的羟基化和糖基化

本发明人证实大麻素在cannabissativa中的糖基化和羟基化。为了进一步证实我们使用n.benthamiana作为植物模型的发现,我们对各种cannabissativa株中的上述部分中描述的相同质粒构建体进行了土壤杆菌浸润(参见图24样品id)。如图24-26所示,如在n.benthamiana中,选择的遗传构建体在c.sativa中的表达证实在这种情况cbda下羟基化和/或糖基化大麻素的合成和积累。使用不同土壤杆菌遗传构建体的结果的比较在下表8中给出。

如本发明人已经证实的,在一个实施方案中,其中胞质构建体用myb/过氧化氢酶(mybcat)表达载体进行转化,产生最高的cbda和cbda糖苷检测,这证明这些基因在减轻由于过氧化氢积累(过氧化氢酶)和大麻素合成(myb转录因子)的总体增加而产生的毒性作用中的作用。

材料和方法

实施例12:使用烟草作为用于大麻素的体内官能化和糖基化的示例性植物系统

本发明人证明了模型植物系统中大麻素的体内官能化和糖基化。具体地,本发明人使用n.benthamiana(烟草)作为模型系统来证明大麻素的体内官能化和糖基化。在这个实施方案中,通过土壤进行瞬时转化杆菌浸润在n.benthamiana中进行。本发明人证明了使用许多异源基因表达载体在转化的n.benthamiana中表达的异源基因的表达(如下所述)。在该示例性实施方案中,在确认将使大麻素分子官能化和糖基化的异源基因的表达后,本发明人向植物中引入选择大麻素化合物。在这个实施方案中,本发明人介绍转基因n.benthamiana植物大麻萜酚酸(cbga)和/或大麻二酚酸(cbda)。本发明人还证明了大麻素在细胞悬浮培养中的体内官能化和糖基化。具体地,本发明人使用示例性烟草亮黄(by2)细胞作为细胞悬浮系统用于研究大麻素的产生、官能化和/或糖基化。

实施例13:示例性植物模型本生烟的瞬时转化

本发明人使用土壤杆菌根瘤菌ti-质粒介导的转化与植物表达载体pri201-an(takarabiousa)、用于在携带组成型35s启动子和拟南芥醇脱氢酶(atadh)作为翻译增强子的双子叶植物中高水平表达外源基因的双元载体(matsuietal.2012)。根据sparkesetal.2006描述的方法瞬时转化n.benthamiana。将土壤杆菌菌株gv3101的过夜培养物转移至含有50mllb培养基的250ml烧瓶中,所述lb培养基补充有50mg/l的卡那霉素、50mg/l的庆大霉素和m10g/l的利福平,并生长4-8小时直到600nm处的光密度(od600)达到约0.75和1之间。将细胞在室温下在离心机中制丸,并重悬于45ml含有5g/ld-葡萄糖、10mmmes、10mmmgcl2和100μm乙酰丁香酮的浸润培养基中。使用1ml注射器将1ml溶液用于渗透叶子。通过rt-pcr在浸润后2-4天确认转基因的表达对于rt-pcr分析,将100mg叶组织在液氮中冷冻并在tissuelyser(qiageninc,usa)中研磨。按照ezna植物rna提取试剂盒(omegabio-tekinc,usa)提取rna。使用上标iiicdna合成试剂盒(thermofisherscientific,usa),使用高达1微克的总rna来合成cdna。cdna用于通过rt-pcr检查转基因的表达。

实施例14:将选择大麻素底物引入转基因n.benthamiana菌株。

在土壤杆菌浸润后两天并且通过rt-pcr确认转基因表达时,将选择酶底物引入转基因或遗传修饰的n.benthamiana菌株。在该实施例中,将约277μm大麻萜酚酸(cbga)和/或大麻二酚酸(cbda)溶解于1ml含有10mmmes、10mmmgcl2和0.1%tritonxi00或0.1%tween20的缓冲液中,并通过渗透或用棉花涂抹器轻轻涂抹到转化的叶子上。在1-4天后收获植物,称重鲜重并在-80℃冷冻,然后进行lc-ms分析以确定修饰的大麻素的存在。

实施例15:cbda合酶和糖基转移酶活性的体外测定

cbda合酶通常在4-6的ph范围内有活性(tauraetal.1996),而糖基转移酶通常在5.0至7.0的ph范围内有活性(riniandesko,2017)。基于酶活性的最佳ph的这种差异,本发明人在体外测定中产生了用于在ph6和30℃下cbda合酶和udp糖基转移酶的组合测定的单一提取缓冲液(priestetal.,2006)。本发明人将转化的叶组织在液氮中研磨。加入研磨缓冲液,其中含有50mmmes、ph6,1mmedta、5mmβ-巯基乙醇和0.1%tritonx-100,使用研钵和研杵以5:1的比例将缓冲液加入植物的鲜重中。将提取物在冰上通过2层粗棉布过滤以除去碎片,并在4℃下以21000g离心5分钟。将上清液用于后续测定。使用牛血清白蛋白作为标准,通过bradford测定法定量上清液的蛋白质浓度。为了开始反应,使用100-200μg粗制总蛋白。在使用和不使用udp-葡萄糖的情况下进行测定以检查大麻素底物的糖基化是否阻止下游反应或cbga的转运。野生型植物用作对照以将内源性与过表达的udp糖基转移酶活性分开。通过添加100μg蛋白和8mm尿苷二磷酸葡萄糖(udpg)作为糖-核苷酸供体开始反应至由约277μμcbga、0.1%(w/v)tritonx-100、3mmmgcl2和50mmmes(ph6.0)组成的反应混合物。将反应在30℃下孵育3小时或过夜14小时。通过在液氮中冷冻终止反应,并在lc-ms分析之前将样品储存在-80℃。

实施例16:毛状体靶向合成和糖基化

作为示例性植物模型,从种子生长n.benihamiana植物,并且在营养生长4周后,将叶子与携带以下构建体的土壤杆菌根瘤菌gv3101共渗透:pri201-an(毛状体构建体)中的毛状体cbda+毛状体ugt、pri201-an中的pm-utr1、和pdgb3α2中的pi9沉默抑制子。在第二实验中,叶子也用表达具有myb/过氧化氢酶基因的ti质粒的土壤杆菌渗透。使用分光光度计将土壤杆菌密度在600nm的吸光度下归一化至1或2,并以相同比例(1:1:1)共渗透培养物。在土壤杆菌杆菌浸润(dpi)1和4天后,将溶解在0.1%tween20(sigma-aldrich)或3%dmso(sigma-aldrich)中的1mlcbga(277μμ)渗入每个叶子。使用三个生物学重复。该实验重复两次。初步结果后,在所有后续渗透实验中选择od600的土壤杆菌密度为2。此外,由于更好地溶解cbga底物,因此选择0.1%吐温20而不是dmso3%。

在这个实施方案中,在2dpi收集叶样品并立即在液氮中冷冻。如制造商(qiagen)所述,使用rnaplantmini-kit进行rna提取。如制造商(takara)所述,使用rna至cdnaecodrypremix合成cdna。将模板cdna标准化为每次反应50ng相应的总rna。退火温度为60℃。延长时间:15s,35个循环。q5dna聚合酶试剂盒如制造商(newenglandbiolabs)所述使用。rt-pcr引物概述于下表5中。

实施例17:cannabissativa的瞬态转化

本发明人进行了土壤杆菌根瘤菌介导的cannabissativa的瞬时转化。实验组由cbd品种的高幼叶(干花中的-10%)和thc品种的高毛状体叶(-20%干花)组成。

为了转化高cbd品种的叶子,本发明人发芽了100个种子三次;这样做是为了确保所有9个独立转化事件都有足够数量的植物。为了转化毛状体叶,本发明人使用已知为高thc品种的几种变种的小毛状体叶。实验装置由2种不同的土壤杆菌根瘤菌株组成。对于土壤杆菌菌株eha105的瞬时转化,本发明人在10mllb培养基中培养细胞,所述lb培养基补充有10mg/l的利福平和50mg/l的卡那霉素,并且土壤杆菌菌株gv3101::6000细胞在50mg/l卡那霉素、25mg/l庆大霉素和50mg/l利福平的情况下生长。使用单个土壤菌杆菌落进行接种并培养过夜。然后,将1ml该培养物接种到500ml上述补充有20μμ乙酰丁香酮的lb培养基中。土壤杆菌生长至od600约为1至1.5。将细胞在室温下在离心机中沉淀,并重悬于含有10mmmes、10mmmgcl2和200μm乙酰丁香酮的渗透培养基中至od600为0.5。

然后将细菌培养物用于三种不同类型的cannabissativa转化。在所有情况下,转化以共转化的形式进行,将所有相关菌株(质粒)以相等比例的细胞数混合。首先,对于本发明人,使用1ml注射器渗透嫩的(两周龄)、完全消耗的cannabissativa植物。在转化之前,将植物保持在塑料覆盖下,以确保叶子的最大柔软度。从背轴侧进行渗透,从而确保叶子的整个表面在22℃下12/h/12h天/晚渗透。

第二,本发明人真空渗透分离的嫩(两周龄)的完全消耗的cannabissativa叶。在转化之前,将植物保持在塑料覆盖下,以确保叶子的最大柔软度。然后将叶子置于补充有61.8mm硝酸铵的半强度murashige和skoog(1962)(1/2ms)琼脂上,并在22℃下12/h/12h天/晚温育5天。

第三,将毛状体叶分离,置于50mlfalcon管中,并用上述细菌溶液2x真空渗透各10分钟。然后将叶子置于补充有61.8mm硝酸铵的1/2ms琼脂上并温育5天。

所有实验一式三份进行,第四次重复用于收集dna/rna并染色x-gluc以测量与土壤茎杆菌-凝集素gus基因共渗入后β-葡糖醛酸糖苷酶(gus)的活性。在所有情况下,在转化5天后收获叶子,在液氮中冷冻并储存在-80℃。

实施例18:从n.benthamiana中提取水溶性大麻素

从15或50ml聚丙烯离心管中的温室实验中收获新鲜的转化植物材料,并在液氮中快速冷冻。通过将植物材料浸没在沸腾的甲醇中2分钟来酶解淬灭冷冻的植物材料。使用p-10-35均化器(kinematica,bohemiany)均化甲醇淬灭的材料。通过短暂搅拌提取匀浆,最终体积为10ml或30ml70%甲醇(v/v),分别对应于管尺寸。通过在beckmanj-6b地板离心机(beckmancoulter,indianapolisin)中以2,500rpm在4℃下离心15分钟来澄清所得提取物。将上清液转移到聚丙烯管中并在n2气流下在45℃下蒸发直至干燥。将提取物在含有20μg/ml内标7-羟基香豆素(sigma-aldrich,h24003)的甲醇中重构。将重构的提取物置于1.5ml微量离心管中,并在微量离心机中以10,000g澄清15分钟。将500μl上清液转移至2ml自动进样器小瓶中并保持在4℃直至分析。体外测定样品制备:将样品通过0.45μmpvdf膜注射过滤到2ml自动进样器小瓶中。

实施例19:从cannabissativa提取水溶性大麻素

从在1.5ml聚丙烯离心管中的室中生长的植物收获新鲜植物材料,并在液氮中快速冷冻。使用研杵和研钵将冷冻的植物材料均质化,并通过将植物材料浸没在沸腾的100%乙醇中2分钟进行酶促淬灭。将均化溶液稀释至70%乙醇。通过在eppendorf离心机(centrifuge5415r)中以2,500rpm在4℃下离心15分钟使得到的提取物澄清。将上清液转移到聚丙烯管中并使用真空离心机(speedvacsci10,savant)浓缩三次。将2μl的20μg/ml内标umbelliferone(sigma-aldrich,h24003)加入到98μl浓缩提取物中并用于分析。

实施例20:液相色谱质谱用于确认大麻素的功能化和糖基化。

本发明人使用液相色谱质谱法来确认本文所述的示例性植物系统中大麻素的功能化和糖基化。具体地,质谱法在四极杆飞行时间(qtof)质谱仪(qtofmicro,waters,manchester,uk)上进行,该质谱仪配备有与watersacquityuplc系统(waters,manchester,uk)连接的lockspraytm电喷雾离子源。以负电喷雾电离模式(esi-)收集质谱。雾化气体在350℃的温度下设定为400l/h,锥形气体设定为15l/h,源温度设定为110℃。毛细管电压和锥形电压分别设定为2500和35v。mcp检测器电压设置为2500v。q-tof微型ms采集速率设定为1.0秒,0.1秒内扫描延迟。扫描范围为100至1500m/z。数据以连续模式收集。在50:50水中的50ppm棉子糖(503.1612m/z)的锁质溶液:甲醇以20μl/min通过辅助泵输送,并在ms采集期间每10秒获取一次。使用watersacquityuplc系统在watershsst3c18柱(2.1×100mm,粒径1.8μm)上进行分离,所述系统配备有acquity二元溶剂管理器,acquity柱管理器和acquity样品管理器(10μl样品环,部分环路注入模式,5μl注射量,4℃)。洗脱剂a和b分别是水和乙腈,均含有0.1%甲酸。在10%洗脱液b下等度地进行洗脱0.5分钟,然后在14.5分钟内进行线性梯度100%洗脱液b,并在100%洗脱液b下等度洗脱3分钟。将柱重新平衡6分钟。流速设定为250μl/min,柱温保持在30℃。

实施例21:证实数据处理的材料和方法。

本发明人通过metabolynx(waterscorp.,milford,usa)的相应精确质量转移进行个体大麻素类似物的鉴定。数据处理的方法参数设定如下:保留时间范围0.1-18分钟,质量范围100-1500da,保留时间公差0.2分钟,质量公差0.05da,峰值强度阈值14。使用棉子糖锁定质量进行连续数据的精确质量测量。使用masslynx4.1(waterscorp.,milford,usa)另外处理原始色谱数据用于提取的离子色谱图砂峰面积积分。选择的大麻素、cbga和cbda使用经过认证的参考材料(cerilliant,roundrock,tx)进行鉴定和定量。使用chemdoodle版本8.1.0(ichemlabstm,chesterfield,va)产生所有化学结构和生理化学和组成性质。

表格

表1.cbga生物转化的产物

rrt亲本分子的相对保留时间

r-oh通过添加o原子官能化

表2.cbda生物转化的产物

rrt亲本分子的相对保留时间

r-oh通过添加o原子官能化’

表3.用于cyp3a4和p450氧化还原酶的rt-pcr的正向和反向引物

表4.用于cbda合酶、ugt76g1和abcg2的正向和反向引物

表5.毛状体靶向cbda合酶(cbda)、毛状体靶向ugt和pm-靶向utr1

表6.细胞溶质靶向cbda合酶(cytcbda)、细胞溶质靶向ugt(cytugt)

表7.n.benthamiana叶中糖基化和功能化实验结果的总结

*在不同的重复中测试有和没有构建体的共渗透

表8.cannabissativa叶中糖基化和功能化实验结果的总结

表9.示例性糖基转移酶序列鉴定

表10.大麻素生产细胞区室化模型。不同的阴影列和行对应于所使用的不同示例性表达构造。

参考文献

以下参考文献通过引用整体并入本文:

[1]ivonossowski,mrmulvey,paleco,aborysandpcloewen,j.bacteriol.1991,173(2):514.

[2]behera,a.,behera,a.,mishra,s.c.,swain,s.k.,&author,c.(2003).cannabinoidglycosides:invitroproductionofanewclassofcannabinoidswithimprovedphysicochemicalproperties.proc.intl.soc.mag.reson.med(vol.14).

[3]holland,m.l.,lau,d.t.t.,allen,j.d.,&arnold,j.c.(2009).themultidrugtransporterabcg2(bcrp)isinhibitedbyplant-derivedcannabinoids.britishjournalofpharmacology,152(5),815–824.https://doi.org/10.1038/sj.bip.0707467

[4]ivanchenco.m.,vejlupkova.z.,quatrano.r.s.,fowler.j.e.(2000)maizerop7gtpasecontainsaunique,caaxbox-independentplasmamembranetargetingsignal.theplantjournal,(24)1,79-90.

[5]jamesm.riniandjeffreyd.esko.glycosyltransferasesandglycan-processingenzymes.in:essentialsofglycobiology[internet].3rdedition.https://www.ncbi.nlm.nih.gov/books/nbk310274/?report=reader

[6]marks,m.d.,tian,l.,wenger,j.p.,omburo,s.n.,soto-fuentes,w.,he,j.,…dixon,r.a.(2009).identificationofcandidategenesaffectingδ9-tetrahydrocannabinolbiosynthesisincannabissativa.journalofexperimentalbotany,60(13),3715–3726.https://doi.org/10.1093/jxb/erp210

[7]nagaya,s.,kawamura,k.,shinmyo,a.,&kato,k.(2010).thehspterminatorofarabidopsisthalianaincreasesgeneexpressioninplantcells.plantandcellphysiology,51(2),328–332.https://doi.org/10.1093/pcp/pcp188

[8]norambuena,l.,marchant,l.,berninsone,p.,hirschberg,c.b.,silva,h.,&orellana,a.(2002).transportofudp-galactoseinplants.identificationandfunctionalcharacterizationofatutr1,anarabidopsisthalianaudp-galactose/udp-glucosetransporter.journalofbiologicalchemistry,277(36),32923–32929.https://doi.org/10.1074/jbc.m204081200

[9]onofri,c.,demeijer,e.p.m.,&mandolino,g.(2015).sequenceheterogeneityofcannabidiolic-andtetrahydrocannabinolicacid-synthaseincannabissatival.anditsrelationshipwithchemicalphenotype.phytochemistry,116(1),57–68.https://doi.org/10.1016/j.phytochem.2015.03.006

[9]priest,d.m.,ambrose,s.j.,vaistij,f.e.,elias,l.,higgins,g.s.,ross,a.r.s.,…bowles,d.j.(2006).useoftheglucosyltransferaseugt71b6todisturbabscisicacidhomeostasisinarabidopsisthaliana.plantjournal,46(3),492–502.https://doi.org/10.1111/j.1365-313x.2006.02701.x

[10]siritunga,d.,andsayre,r.t.(2003).generationofcyanogen-freetransgeniccassava.planta217,367–373.doi:10.1007/s00425-003-1005-8

[11]sparkes,i.a.,runions,j.,kearns,a.,&hawes,c.(2006).rapid,transientexpressionoffluorescentfusionproteinsintobaccoplantsandgenerationofstablytransformedplants.natureprotocols,1(4),2019–2025.https://doi.org/10.1038/nprot.2006.286

[13]taura,f.,morimoto,s.,&shoyama,y.(1996).purificationandcharacterizationofcannabidiolic-acidsynthasefromcannabissatival.biochemicalanalysisofanovelenzymethatcatalyzestheoxidocyclizationof.journalofbiologicalchemistry,271(29),17411–17416.https://doi.org/10.1074/jbc.271.29.17411

[14]taura,f.,sirikantaramas,s.,shoyamay,yoshikaik,shoyamay,morimotos.(2007)cannabidiolic-acidsynthase,thechemotype-determiningenzymeinthefiber-typecannabissativa.febbsletters,581(16),2929-34.doi:10.1016/j.febslet.2007.05.043

[15]yoo,s.d.,cho,y.h.,&sheen,j.(2007).arabidopsismesophyllprotoplasts:aversatilecellsystemfortransientgeneexpressionanalysis.natureprotocols,2(7),1565–1572.https://doi.org/10.1038/nprot.2007.199

[16]matsui,t.,matsuura,h.,sawada,k.,takita,e.,kinjo,s.,takenami,s.,…kato,k.(2012).highlevelexpressionoftransgenesbyuseof5′-untranslatedregionofthearabidopsisthalianaarabinogalactan-protein21geneindicotyledons.plantbiotechnology,29(3),319–322.https://doi.org/10.5511/plantbiotechnology.12.0322a

[17]murashige,t.,andskoog,f.(1962).arevisedmediumforrapidgrowthandbioassayswithtobaccotissueculture.physiol.plant.15,473–497.doi:10.1111/j.1399-3054.1962.tb08052.x

[18]zipp,etal.,cannabinoidglycosides:invitroproductionofanewclassofcannabinoidswithimprovedphysicochemicalproperties.biorxivpreprintdoi:http://dx.doi.org/10.1101/104349

[19]mohamed,e.a.,t.iwaki,i.munir,m.tamoi,s.shigeoka,anda.wadano.2003.overexpressionofbacterialcatalaseintomatoleafchloroplastsenhancesphoto-oxidativestresstolerance.plantcellenviron.26:2037–2046.

[20]akhtar,m.t.,2013,doctoralthesis,leidenuniversity.cannabinoidsandzebrafish.2013-05-22.http://hdl.handle.net/!887/20899

[21]sayedfarag.cannabinoidsproductionincannabissatival.:aninvitroapproach.thesis·january2014.doi:10.17877/de290r-16298

[21]k,watanabe,etal.,cytochromep450enzymesinvolvedinthemetabolismoftetrahydrocannabinolsandcannabinolbyhumanhepaticmicrosomes.lifesciences.volume80,issue15,20march2007,pages1415-1419

[22]flores-sanchezij.etal.,elicitationstudiesincellsuspensionculturesofcannabissatival.jbiotechnol.2009aug20;143(2):157-68.doi:10.1016/j.jbiotec.

[23]stephenm.stout&ninam.cimino(2013)exogenouscannabinoidsassubstrates,inhibitors,andinducersofhumandrugmetabolizingenzymes:asystematicreview,drugmetabolismreviews,46:1,86-95,doi:10.3109/03602532.2013.849268

[24]andrecm,hausmanj-f,guerrierog.cannabissativa:theplantofthethousandandonemolecules.frontiersinplantscience.2016;7:19.doi:10.3389/fpls.2016.00019.

[25]mahlbergpl.eta;.,accumulationofcannabinoidsinglandulartrichomesofcannabis(cannabaceae).journalofindustrialhemp9(1):15-36·june2004with273readsdoi:10.1300/j237v09n01_04.

[25]katalins.,etal.,minirevmedchem.2017;17(13):1223-1291.doi:10.2174/1389557516666161004162133.

[26]sirikantaramass.,etal.,tetrahydrocannabinolicacidsynthase,theenzymecontrollingmarijuanapsychoactivity,issecretedintothestoragecavityoftheglandulartrichomes.plantandcellphysiology,volume46,issue9,1september2005,pages1578–1582,https://doi.org/10.1093/pcp/pci166.

[26]schilmilleral,lastrl,picherskye(2008)harnessingplanttrichomebiochemistryfortheproductionofusefulcompounds.plantjournal54:702-711.

[27]matias-hernandez,l.etal.aamyb1anditsorthologueatmyb61affectterpenemetabolismandtrichomedevelopmentinartemisiaannuaandarabidopsisthaliana.plantj.2017;90:520–534

序列表

如上所述,本申请包含完整的序列表,其已经以ascii格式电子提交,并且其全部内容通过引用并入本文。以下序列进一步提供于此,并且其整体并入本说明书中:

seqidno.1

dna

细胞色素p450(cyp3a4)

atggctttgattcctgatttggctatggaaactagattgttgttggctgtttcattggttttgttgtatttgtatggaactcattcacatggattgtttaaaaaattgggaattcctggacctactcctttgccttttttgggaaatattttgtcatatcataaaggattttgcatgtttgatatggaatgccataaaaaatatggaaaagtttggggattttatgatggacaacaacctgttttggctattactgatcctgatatgattaaaactgttttggttaaagaatgctattcagtttttactaatagaagaccttttggacctgttggatttatgaaatcagctatttcaattgctgaagatgaagaatggaaaagattgagatcattgttgtcacctacttttacttcaggaaaattgaaagaaatggttcctattattgctcaatatggagatgttttggttagaaatttgagaagagaagctgaaactggaaaacctgttactttgaaagatgtttttggagcttattcaatggatgttattacttcaacttcatttggagttaatattgattcattgaataatcctcaagatccttttgttgaaaatactaaaaaattgttgagatttgattttttggatcctttttttttgtcaattactgtttttccttttttgattcctattttggaagttttgaatatttgcgtttttcctagagaagttactaattttttgagaaaatcagttaaaagaatgaaagaatcaagattggaagatactcaaaaacatagagttgattttttgcaattgatgattgattcacaaaattcaaaagaaactgaatcacataaagctttgtcagatttggaattggttgctcaatcaattatttttatttttgctggatgcgaaactacttcatcagttttgtcatttattatgtatgaattggctactcatcctgatgttcaacaaaaattgcaagaagaaattgatgctgttttgcctaataaagctcctcctacttatgatactgttttgcaaatggaatatttggatatggttgttaatgaaactttgagattgtttcctattgctatgagattggaaagagtttgcaaaaaagatgttgaaattaatggaatgtttattcctaaaggagttgttgttatgattccttcatatgctttgcatagagatcctaaatattggactgaacctgaaaaatttttgcctgaaagattttcaaaaaaaaataaagataatattgatccttatatttatactccttttggatcaggacctagaaattgcattggaatgagatttgctttgatgaatatgaaattggctttgattagagttttgcaaaatttttcatttaaaccttgcaaagaaactcaaattcctttgaaattgtcattgggaggattgttgcaacctgaaaaacctgttgttttgaaagttgaatcaagagatggaactgtttcaggagct

seqidno.2

氨基酸

细胞色素p450(cyp3a4)

malipdlametrlllavslvllylygthshglfkklgipgptplpflgnilsyhkgfcmfdmechkkygkvwgfydgqqpvlaitdpdmiktvlvkecysvftnrrpfgpvgfmksaisiaedeewkrlrsllsptftsgklkemvpiiaqygdvlvrnlrreaetgkpvtlkdvfgaysmdvitstsfgvnidslnnpqdpfventkkllrfdfldpfflsitvfpflipilevlnicvfprevtnflrksvkrmkesrledtqkhrvdflqlmidsqnsketeshkalsdlelvaqsiififagcettssvlsfimyelathpdvqqklqeeidavlpnkapptydtvlqmeyldmvvnetlrlfpiamrlervckkdveingmfipkgvvvmipsyalhrdpkywtepekflperfskknkdnidpyiytpfgsgprncigmrfalmnmklalirvlqnfsfkpcketqiplklslggllqpekpvvlkvesrdgtvsga

seqidno.3

dna

p450氧化还原酶基因(oxred)

atgattaatatgggagattcacatgttgatacttcatcaactgtttcagaagctgttgctgaagaagtttcattgttttcaatgactgatatgattttgttttcattgattgttggattgttgacttattggtttttgtttagaaaaaaaaaagaagaagttcctgaatttactaaaattcaaactttgacttcatcagttagagaatcatcatttgttgaaaaaatgaaaaaaactggaagaaatattattgttttttatggatcacaaactggaactgctgaagaatttgctaatagattgtcaaaagatgctcatagatatggaatgagaggaatgtcagctgatcctgaagaatatgatttggctgatttgtcatcattgcctgaaattgataatgctttggttgttttttgcatggctacttatggagaaggagatcctactgataatgctcaagatttttatgattggttgcaagaaactgatgttgatttgtcaggagttaaatttgctgtttttggattgggaaataaaacttatgaacattttaatgctatgggaaaatatgttgataaaagattggaacaattgggagctcaaagaatttttgaattgggattgggagatgatgatggaaatttggaagaagattttattacttggagagaacaattttggttggctgtttgcgaacattttggagttgaagctactggagaagaatcatcaattagacaatatgaattggttgttcatactgatattgatgctgctaaagtttatatgggagaaatgggaagattgaaatcatatgaaaatcaaaaacctccttttgatgctaaaaatccttttttggctgctgttactactaatagaaaattgaatcaaggaactgaaagacatttgatgcatttggaattggatatttcagattcaaaaattagatatgaatcaggagatcatgttgctgtttatcctgctaatgattcagctttggttaatcaattgggaaaaattttgggagctgatttggatgttgttatgtcattgaataatttggatgaagaatcaaataaaaaacatccttttccttgccctacttcatatagaactgctttgacttattatttggatattactaatcctcctagaactaatgttttgtatgaattggctcaatatgcttcagaaccttcagaacaagaattgttgagaaaaatggcttcatcatcaggagaaggaaaagaattgtatttgtcatgggttgttgaagctagaagacatattttggctattttgcaagattgcccttcattgagacctcctattgatcatttgtgcgaattgttgcctagattgcaagctagatattattcaattgcttcatcatcaaaagttcatcctaattcagttcatatttgcgctgttgttgttgaatatgaaactaaagctggaagaattaataaaggagttgctactaattggttgagagctaaagaacctgttggagaaaatggaggaagagctttggttcctatgtttgttagaaaatcacaatttagattgccttttaaagctactactcctgttattatggttggacctggaactggagttgctccttttattggatttattcaagaaagagcttggttgagacaacaaggaaaagaagttggagaaactttgttgtattatggatgcagaagatcagatgaagattatttgtatagagaagaattggctcaatttcatagagatggagctttgactcaattgaatgttgctttttcaagagaacaatcacataaagtttatgttcaacatttgttgaaacaagatagagaacatttgtggaaattgattgaaggaggagctcatatttatgtttgcggagatgctagaaatatggctagagatgttcaaaatactttttatgatattgttgctgaattgggagctatggaacatgctcaagctgttgattatattaaaaaattgatgactaaaggaagatattcattggatgtttggtca

seqidno.4

氨基酸

p450氧化还原酶

minmgdshvdtsstvseavaeevslfsmtdmilfslivglltywflfrkkkeevpeftkiqtltssvressfvekmkktgrniivfygsqtgtaeefanrlskdahrygmrgmsadpeeydladlsslpeidnalvvfcmatygegdptdnaqdfydwlqetdvdlsgvkfavfglgnktyehfnamgkyvdkrleqlgaqrifelglgdddgnleedfitwreqfwlavcehfgveatgeessirqyelvvhtdidaakvymgemgrlksyenqkppfdaknpflaavttnrklnqgterhlmhleldisdskiryesgdhvavypandsalvnqlgkilgadldvvmslnnldeesnkkhpfpcptsyrtaltyylditnpprtnvlyelaqyasepseqellrkmasssgegkelylswvvearrhilailqdcpslrppidhlcellprlqaryysiassskvhpnsvhicavvveyetkagrinkgvatnwlrakepvgenggralvpmfvrksqfrlpfkattpvimvgpgtgvapfigfiqerawlrqqgkevgetllyygcrrsdedylyreelaqfhrdgaltqlnvafsreqshkvyvqhllkqdrehlwklieggahiyvcgdarnmardvqntfydivaelgamehaqavdyikklmtkgrysldvws

seqidno.5

dna

大麻二酚酸(cbda)合酶

cannabissativa

atgaatcctcgagaaaacttccttaaatgcttctcgcaatatattcccaataatgcaacaaatctaaaactcgtatacactcaaaacaacccattgtatatgtctgtcctaaattcgacaatacacaatcttagattcacctctgacacaaccccaaaaccacttgttatcgtcactccttcacatgtctctcatatccaaggcactattctatgctccaagaaagttggcttgcagattcgaactcgaagtggtggtcatgattctgagggcatgtcctacatatctcaagtcccatttgttatagtagacttgagaaacatgcgttcaatcaaaatagatgttcatagccaaactgcatgggttgaagccggagctacccttggagaagtttattattgggttaatgagaaaaatgagaatcttagtttggcggctgggtattgccctactgtttgcgcaggtggacactttggtggaggaggctatggaccattgatgagaaactatggcctcgcggctgataatatcattgatgcacacttagtcaacgttcatggaaaagtgctagatcgaaaatctatgggggaagatctcttttgggctttacgtggtggtggagcagaaagcttcggaatcattgtagcatggaaaattagactggttgctgtcccaaagtctactatgtttagtgttaaaaagatcatggagatacatgagcttgtcaagttagttaacaaatggcaaaatattgcttacaagtatgacaaagatttattactcatgactcacttcataactaggaacattacagataatcaagggaagaataagacagcaatacacacttacttctcttcagttttccttggtggagtggatagtctagtcgacttgatgaacaagagttttcctgagttgggtattaaaaaaacggattgcagacaattgagctggattgatactatcatcttctatagtggtgttgtaaattacgacactgataattttaacaaggaaattttgcttgatagatccgctgggcagaacggtgctttcaagattaagttagactacgttaagaaaccaattccagaatctgtatttgtccaaattttggaaaaattatatgaagaagatataggagctgggatgtatgcgttgtacccttacggtggtataatggatgagatttcagaatcagcaattccattccctcatcgagctggaatcttgtatgagttatggtacatatgtagttgggagaagcaagaagataacgaaaagcatctaaactggattagaaatatttataacttcatgactccttatgtgtccaaaaattcaagattggcatatctcaattatagagaccttgatataggaataaatgatcccaagaatccaaataattacacacaagcacgtatttggggtgagaagtattttggtaaaaattttgacaggctagtaaaagtgaaaaccctggttgatcccaataacttttttagaaacgaacaaagcatcccacctcaaccacggcatcgtcattaa

seqidno.6

氨基酸

大麻二酚酸(cbda)合酶

cannabissativa

mnprenflkcfsqyipnnatnlklvytqnnplymsvlnstihnlrftsdttpkplvivtpshvshiqgtilcskkvglqirtrsgghdsegmsyisqvpfvivdlrnmrsikidvhsqtawveagatlgevyywvneknenlslaagycptvcagghfggggygplmrnyglaadniidahlvnvhgkvldrksmgedlfwalrgggaesfgiivawkirlvavpkstmfsvkkimeihelvklvnkwqniaykydkdlllmthfitrnitdnqgknktaihtyfssvflggvdslvdlmnksfpelgikktdcrqlswidtiifysgvvnydtdnfnkeilldrsagqngafkikldyvkkpipesvfvqileklyeedigagmyalypyggimdeisesaipfphragilyelwyicswekqednekhlnwirniynfmtpyvsknsrlaylnyrdldigindpknpnnytqariwgekyfgknfdrlvkvktlvdpnnffrneqsippqprhrh

seqidno.7

dna

udp糖基转移酶76g1

甜叶菊

atggaaaataaaactgaaactactgttagaagaagaagaagaattattttgtttcctgttccttttcaaggacatattaatcctattttgcaattggctaatgttttgtattcaaaaggattttcaattactatttttcatactaattttaataaacctaaaacttcaaattatcctcattttacttttagatttattttggataatgatcctcaagatgaaagaatttcaaatttgcctactcatggacctttggctggaatgagaattcctattattaatgaacatggagctgatgaattgagaagagaattggaattgttgatgttggcttcagaagaagatgaagaagtttcatgcttgattactgatgctttgtggtattttgctcaatcagttgctgattcattgaatttgagaagattggttttgatgacttcatcattgtttaattttcatgctcatgtttcattgcctcaatttgatgaattgggatatttggatcctgatgataaaactagattggaagaacaagcttcaggatttcctatgttgaaagttaaagatattaaatcagcttattcaaattggcaaattttgaaagaaattttgggaaaaatgattaaacaaactagagcttcatcaggagttatttggaattcatttaaagaattggaagaatcagaattggaaactgttattagagaaattcctgctccttcatttttgattcctttgcctaaacatttgactgcttcatcatcatcattgttggatcatgatagaactgtttttcaatggttggatcaacaacctccttcatcagttttgtatgtttcatttggatcaacttcagaagttgatgaaaaagattttttggaaattgctagaggattggttgattcaaaacaatcatttttgtgggttgttagacctggatttgttaaaggatcaacttgggttgaacctttgcctgatggatttttgggagaaagaggaagaattgttaaatgggttcctcaacaagaagttttggctcatggagctattggagctttttggactcattcaggatggaattcaactttggaatcagtttgcgaaggagttcctatgattttttcagattttggattggatcaacctttgaatgctagatatatgtcagatgttttgaaagttggagtttatttggaaaatggatgggaaagaggagaaattgctaatgctattagaagagttatggttgatgaagaaggagaatatattagacaaaatgctagagttttgaaacaaaaagctgatgtttcattgatgaaaggaggatcatcatatgaatcattggaatcattggtttcatatatttcatcattg

seqidno.8

氨基酸

upd糖基转移酶76g1

甜叶菊

menktettvrrrrriilfpvpfqghinpilqlanvlyskgfsitifhtnfnkpktsnyphftfrfildndpqderisnlpthgplagmripiinehgadelrrelellmlaseedeevsclitdalwyfaqsvadslnlrrlvlmtsslfnfhahvslpqfdelgyldpddktrleeqasgfpmlkvkdiksaysnwqilkeilgkmikqtrassgviwnsfkeleeseletvireipapsfliplpkhltasssslldhdrtvfqwldqqppssvlyvsfgstsevdekdfleiarglydskqsflwvvrpgfvkgstwveplpdgflgergrivkwvpqqevlahgaigafwthsgwnstlesvcegvpmifsdfgldqplnarymsdvlkvgvylengwergeianairrvmvdeegeyirqnarvlkqkadvslmkggssyesleslvsyissl

seqidno.9

dna

abc转运蛋白abcg2

atgtcatcatcaaatgttgaagtttttattcctgtttcacaaggaaatactaatggatttcctgctactgcttcaaatgatttgaaagcttttactgaaggagctgttttgtcatttcataatatttgctatagagttaaattgaaatcaggatttttgccttgcagaaaacctgttgaaaaagaaattttgtcaaatattaatggaattatgaaacctggattgaatgctattttgggacctactggaggaggaaaatcatcattgttggatgttttggctgctagaaaagatccttcaggattgtcaggagatgttttgattaatggagctcctagacctgctaattttaaatgcaattcaggatatgttgttcaagatgatgttgttatgggaactttgactgttagagaaaatttgcaattttcagctgctttgagattggctactactatgactaatcatgaaaaaaatgaaagaattaatagagttattcaagaattgggattggataaagttgctgattcaaaagttggaactcaatttattagaggagtttcaggaggagaaagaaaaagaacttcaattggaatggaattgattactgatccttcaattttgtttttggatgaacctactactggattggattcatcaactgctaatgctgttttgttgttgttgaaaagaatgtcaaaacaaggaagaactattattttttcaattcatcaacctagatattcaatttttaaattgtttgattcattgactttgttggcttcaggaagattgatgtttcatggacctgctcaagaagctttgggatattttgaatcagctggatatcattgcgaagcttataataatcctgctgatttttttttggatattattaatggagattcaactgctgttgctttgaatagagaagaagattttaaagctactgaaattattgaaccttcaaaacaagataaacctttgattgaaaaattggctgaaatttatgttaattcatcattttataaagaaactaaagctgaattgcatcaattgtcaggaggagaaaaaaaaaaaaaaattactgtttttaaagaaatttcatatactacttcattttgccatcaattgagatgggtttcaaaaagatcatttaaaaatttgttgggaaatcctcaagcttcaattgctcaaattattgttactgttgttttgggattggttattggagctatttattttggattgaaaaatgattcaactggaattcaaaatagagctggagttttgttttttttgactactaatcaatgcttttcatcagtttcagctgttgaattgtttgttgttgaaaaaaaattgtttattcatgaatatatttcaggatattatagagtttcatcatattttttgggaaaattgttgtcagatttgttgcctatgagaatgttgccttcaattatttttacttgcattgtttattttatgttgggattgaaagctaaagctgatgctttttttgttatgatgtttactttgatgatggttgcttattcagcttcatcaatggctttggctattgctgctggacaatcagttgtttcagttgctactttgttgatgactatttgctttgtttttatgatgattttttcaggattgttggttaatttgactactattgcttcatggttgtcatggttgcaatatttttcaattcctagatatggatttactgctttgcaacataatgaatttttgggacaaaatttttgccctggattgaatgctactggaaataatccttgcaattatgctacttgcactggagaagaatatttggttaaacaaggaattgatttgtcaccttggggattgtggaaaaatcatgttgctttggcttgcatgattgttatttttttgactattgcttatttgaaattgttgtttttgaaaaaatattca

seqidno.10

氨基酸

abc转运蛋白abcg2

msssnvevfipvsqgntngfpatasndlkaftegavlsfhnicyrvklksgflpcrkpvekeilsningimkpglnailgptgggksslldvlaarkdpsglsgdvlingaprpanfkcnsgyvvqddvvmgtltvrenlqfsaalrlattmtnheknerinrviqelgldkvadskvgtqfirgvsggerkrtsigmelitdpsilfldepttgldsstanavllllkrmskqgrtiifsihqprysifklfdsltllasgrlmfhgpaqealgyfesagyhceaynnpadffldiingdstavalnreedfkateiiepskqdkplieklaeiyvnssfyketkaelhqlsggekkkkitvfkeisyttsfchqlrwvskrsfknllgnpqasiaqiivtvvlglyigaiyfglkndstgiqnragvlfflttnqcfssvsavelfvvekklfiheyisgyyrvssyflgkllsdllpmrmlpsiiftcivyfmlglkakadaffvmmftlmmvaysassmalaiaagqsvvsvatllmticfvfmmifsgllvnlttiaswlswlqyfsiprygftalqhneflgqnfcpglnatgnnpcnyatctgeeylvkqgidlspwglwknhvalacmivifltiaylkllflkkys

seqidno.11

dna

myb12–样

大麻

atgaagaagaacaaatcaactagtaataataagaacaacaacagtaataatatcatcaaaaacgacatcgtatcatcatcatcatcaacaacaacaacatcatcaacaactacagcaacatcatcatttcataatgagaaagttactgtcagtactgatcatattattaatcttgatgataagcagaaacgacaattatgtcgttgtcgtttagaaaaagaagaagaagaagaaggaagtggtggttgtggtgagacagtagtaatgatgctagggtcagtatctcctgctgctgctactgctgctgcagctgggggctcatcaagttgtgatgaagacatgttgggtggtcatgatcaactgttgttgttgtgttgttctgagaaaaaaacgacagaaatttcatcagtggtgaactttaataataataataataataataaggaaaatggtgacgaagtttcaggaccgtacgattatcatcatcataaagaagaggaagaagaagaagaagaagatgaagcatctgcatcagtagcagctgttgatgaagggatgttgttgtgctttgatgacataatagatagccacttgctaaatccaaatgaggttttgactttaagagaagatagccataatgaaggtggggcagctgatcagattgacaagactacttgtaataatactactattactactaatgatgattataacaataacttgatgatgttgagctgcaataataacggagattatgttattagtgatgatcatgatgatcagtactggatagacgacgtcgttggagttgacttttggagttgggagagttcgactactactgttattacccaagaacaagaacaagaacaagatcaagttcaagaacagaagaatatgtgggataatgagaaagagaaactgttgtctttgctatgggataatagtgataacagcagcagttgggagttacaagataaaagcaataataataataataataatgttcctaacaaatgtcaagagattacctctgataaagaaaatgctatggttgcatggcttctctcctga

seqidno.12

氨基酸

myb12

大麻

mkknkstsnnknnnsnniikndivsssssttttsstttatssfhnekvtvstdhiinlddkqkrqlcrcrlekeeeeegsggcgetvvmmlgsvspaaataaaaggssscdedmlgghdqllllccsekktteissvvnfnnnnnnnkengdevsgpydyhhhkeeeeeeeedeasasvaavdegmllcfddiidshllnpnevltlredshneggaadqidkttcnnttittnddynnnlmmlscnnngdyvisddhddqywiddvvgvdfwswesstttvitqeqeqeqdqvqeqknmwdnekekllsllwdnsdnssswelqdksnnnnnnnvpnkcqeitsdkenamvawlls

seqidno.13

dna

过氧化氢酶

拟南芥

atggatccttataaatatagacctgcttcatcatataattcacctttttttactactaattcaggagctcctgtttggaataataattcatcaatgactgttggacctagaggattgattttgttggaagattatcatttggttgaaaaattggctaattttgatagagaaagaattcctgaaagagttgttcatgctagaggagcttcagctaaaggattttttgaagttactcatgatatttcaaatttgacttgcgctgattttttgagagctcctggagttcaaactcctgttattgttagattttcaactgttattcatgctagaggatcacctgaaactttgagagatcctagaggatttgctgttaaattttatactagagaaggaaattttgatttggttggaaataattttcctgttttttttattagagatggaatgaaatttcctgatattgttcatgctttgaaacctaatcctaaatcacatattcaagaaaattggagaattttggattttttttcacatcatcctgaatcattgaatatgtttacttttttgtttgatgatattggaattcctcaagattatagacatatggatggatcaggagttaatacttatatgttgattaataaagctggaaaagctcattatgttaaatttcattggaaacctacttgcggagttaaatcattgttggaagaagatgctattagattgggaggaactaatcattcacatgctactcaagatttgtatgattcaattgctgctggaaattatcctgaatggaaattgtttattcaaattattgatcctgctgatgaagataaatttgattttgatcctttggatgttactaaaacttggcctgaagatattttgcctttgcaacctgttggaagaatggttttgaataaaaatattgataatttttttgctgaaaatgaacaattggctttttgccctgctattattgttcctggaattcattattcagatgataaattgttgcaaactagagttttttcatatgctgatactcaaagacatagattgggacctaattatttgcaattgcctgttaatgctcctaaatgcgctcatcataataatcatcatgaaggatttatgaattttatgcatagagatgaagaagttaattattttccttcaagatatgatcaagttagacatgctgaaaaatatcctactcctcctgctgtttgctcaggaaaaagagaaagatgcattattgaaaaagaaaataattttaaagaacctggagaaagatatagaacttttactcctgaaagacaagaaagatttattcaaagatggattgatgctttgtcagatcctagaattactcatgaaattagatcaatttggatttcatattggtcacaagctgataaatcattgggacaaaaattggcttcaagattgaatgttagaccttcaatt

seqidno.14

氨基酸

过氧化氢酶

拟南芥

mdpykyrpassynspffttnsgapvwnnnssmtvgprglilledyhlveklanfdreripervvhargasakgffevthdisnltcadflrapgvqtpvivrfstvihargspetlrdprgfavkfytregnfdlvgnnfpvffirdgmkfpdivhalkpnpkshiqenwrildffshhpeslnmftflfddigipqdyrhmdgsgvntymlinkagkahyvkfhwkptcgvkslleedairlggtnhshatqdlydsiaagnypewklfiqiidpadedkfdfdpldvtktwpedilplqpvgrmvlnknidnffaeneqlafcpaiivpgihysddkllqtrvfsyadtqrhrlgpnylqlpvnapkcahhnnhhegfmnfmhrdeevnyfpsrydqvrhaekyptppavcsgkrerciiekennfkepgeryrtftperqerfiqrwidalsdpritheirsiwisywsqadkslgqklasrlnvrpsi

seqidno.15

dna

过氧化氢酶hpii(kate)

大肠杆菌

atgtcgcaacataacgaaaagaacccacatcagcaccagtcaccactacacgattccagcgaagcgaaaccggggatggactcactggcacctgaggacggctctcatcgtccagcggctgaaccaacaccgccaggtgcacaacctaccgccccagggagcctgaaagcccctgatacgcgtaacgaaaaacttaattctctggaagacgtacgcaaaggcagtgaaaattatgcgctgaccactaatcagggcgtgcgcatcgccgacgatcaaaactcactgcgtgccggtagccgtggtccaacgctgctggaagattttattctgcgcgagaaaatcacccactttgaccatgagcgcattccggaacgtattgttcatgcacgcggatcagccgctcacggttatttccagccatataaaagcttaagcgatattaccaaagcggatttcctctcagatccgaacaaaatcaccccagtatttgtacgtttctctaccgttcagggtggtgctggctctgctgataccgtgcgtgatatccgtggctttgccaccaagttctataccgaagagggtatttttgacctcgttggcaataacacgccaatcttctttatccaggatgcgcataaattccccgattttgttcatgcggtaaaaccagaaccgcactgggcaattccacaagggcaaagtgcccacgatactttctgggattatgtttctctgcaacctgaaactctgcacaacgtgatgtgggcgatgtcggatcgcggcatcccccgcagttaccgcaccatggaaggcttcggtattcacaccttccgcctgattaatgccgaagggaaggcaacgtttgtacgtttccactggaaaccactggcaggtaaagcctcactcgtttgggatgaagcacaaaaactcaccggacgtgacccggacttccaccgccgcgagttgtgggaagccattgaagcaggcgattttccggaatacgaactgggcttccagttgattcctgaagaagatgaattcaagttcgacttcgatcttctcgatccaaccaaacttatcccggaagaactggtgcccgttcagcgtgtcggcaaaatggtgctcaatcgcaacccggataacttctttgctgaaaacgaacaggcggctttccatcctgggcatatcgtgccgggactggacttcaccaacgatccgctgttgcagggacgtttgttctcctataccgatacacaaatcagtcgtcttggtgggccgaatttccatgagattccgattaaccgtccgacctgcccttaccataatttccagcgtgacggcatgcatcgcatggggatcgacactaacccggcgaattacgaaccgaactcgattaacgataactggccgcgcgaaacaccgccggggccgaaacgcggcggttttgaatcataccaggagcgcgtggaaggcaataaagttcgcgagcgcagcccatcgtttggcgaatattattcccatccgcgtctgttctggctaagtcagacgccatttgagcagcgccatattgtcgatggtttcagttttgagttaagcaaagtcgttcgtccgtatattcgtgagcgcgttgttgaccagctggcgcatattgatctcactctggcccaggcggtggcgaaaaatctcggtatcgaactgactgacgaccagctgaatatcaccccacctccggacgtcaacggtctgaaaaaggatccatccttaagtttgtacgccattcctgacggtgatgtgaaaggtcgcgtggtagcgattttacttaatgatgaagtgagatcggcagaccttctggccattctcaaggcgctgaaggccaaaggcgttcatgccaaactgctctactcccgaatgggtgaagtgactgcggatgacggtacggtgttgcctatagccgctacctttgccggtgcaccttcgctgacggtcgatgcggtcattgtcccttgcggcaatatcgcggatatcgctgacaacggcgatgccaactactacctgatggaagcctacaaacaccttaaaccgattgcgctggcgggtgacgcgcgcaagtttaaagcaacaatcaagatcgctgaccagggtgaagaagggattgtggaagctgacagcgctgacggtagttttatggatgaactgctaacgctgatggcagcacaccgcgtgtggtcacgcattcctaagattgacaaaattcctgcctga

seqidno.16

氨基酸

过氧化氢酶hpii(kate)

大肠杆菌

msqhneknphqhqsplhdsseakpgmdslapedgshrpaaeptppgaqptapgslkapdtrneklnsledvrkgsenyalttnqgvriaddqnslragsrgptlledfilrekithfdheriperivhargsaahgyfqpykslsditkadflsdpnkitpvfvrfstvqggagsadtvrdirgfatkfyteegifdlvgnntpiffiqdahkfpdfvhavkpephwaipqgqsahdtfwdyvslqpetlhnvmwamsdrgiprsyrtmegfgihtfrlinaegkatfvrfhwkplagkaslvwdeaqkltgrdpdfhrrelweaieagdfpeyelgfqlipeedefkfdfdlldptklipeelvpvqrvgkmvlnrnpdnffaeneqaafhpghivpgldftndpllqgrlfsytdtqisrlggpnfheipinrptcpyhnfqrdgmhrmgidtnpanyepnsindnwpretppgpkrggfesyqervegnkvrerspsfgeyyshprlfwlsqtpfeqrhivdgfsfelskvvrpyirervvdqlahidltlaqavaknlgieltddqlnitpppdvnglkkdpslslyaipdgdvkgrvvaillndevrsadllailkalkakgvhakllysrmgevtaddgtvlpiaatfagapsltvdavivpcgniadiadngdanyylmeaykhlkpialagdarkfkatikiadqgeegiveadsadgsfmdelltlmaahrvwsripkidkipa

seqidno.17

dna

毛状体靶向cbda合酶

大麻

atgaagtgctcaacattctccttttggtttgtttgcaagataatatttttctttttctcattcaatatccaaacttccattgctaatcctcgagaaaacttccttaaatgcttctcgcaatatattcccaataatgcaacaaatctaaaactcgtatacactcaaaacaacccattgtatatgtctgtcctaaattcgacaatacacaatcttagattcacctctgacacaaccccaaaaccacttgttatcgtcactccttcacatgtctctcatatccaaggcactattctatgctccaagaaagttggcttgcagattcgaactcgaagtggtggtcatgattctgagggcatgtcctacatatctcaagtcccatttgttatagtagacttgagaaacatgcgttcaatcaaaatagatgttcatagccaaactgcatgggttgaagccggagctacccttggagaagtttattattgggttaatgagaaaaatgagaatcttagtttggcggctgggtattgccctactgtttgcgcaggtggacactttggtggaggaggctatggaccattgatgagaaactatggcctcgcggctgataatatcattgatgcacacttagtcaacgttcatggaaaagtgctagatcgaaaatctatgggggaagatctcttttgggctttacgtggtggtggagcagaaagcttcggaatcattgtagcatggaaaattagactggttgctgtcccaaagtctactatgtttagtgttaaaaagatcatggagatacatgagcttgtcaagttagttaacaaatggcaaaatattgcttacaagtatgacaaagatttattactcatgactcacttcataactaggaacattacagataatcaagggaagaataagacagcaatacacacttacttctcttcagttttccttggtggagtggatagtctagtcgacttgatgaacaagagttttcctgagttgggtattaaaaaaacggattgcagacaattgagctggattgatactatcatcttctatagtggtgttgtaaattacgacactgataattttaacaaggaaattttgcttgatagatccgctgggcagaacggtgctttcaagattaagttagactacgttaagaaaccaattccagaatctgtatttgtccaaattttggaaaaattatatgaagaagatataggagctgggatgtatgcgttgtacccttacggtggtataatggatgagatttcagaatcagcaattccattccctcatcgagctggaatcttgtatgagttatggtacatatgtagttgggagaagcaagaagataacgaaaagcatctaaactggattagaaatatttataacttcatgactccttatgtgtccaaaaatccaagattggcatatctcaattatagagaccttgatataggaataaatgatcccaagaatccaaataattacacacaagcacgtatttggggtgagaagtattttggtaaaaattttgacaggctagtaaaagtgaaaaccctggttgatcccaataacttttttagaaacgaacaaagcatcccacctctaccacggcatcgtcattaa

seqidno.18

氨基酸

毛状体靶向cbda合酶

大麻

mkcstfsfwfvckiiffffsfniqtsianprenflkcfsqyipnnatnlklvytqnnplymsvlnstihnlrftsdttpkplvivtpshvshiqgtilcskkvglqirtrsgghdsegmsyisqvpfvivdlrnmrsikidvhsqtawveagatlgevyywvneknenlslaagycptvcagghfggggygplmrnyglaadniidahlvnvhgkvldrksmgedlfwalrgggaesfgiivawkirlvavpkstmfsvkkimeihelvklvnkwqniaykydkdlllmthfitrnitdnqgknktaihtyfssvflggvdslvdlmnksfpelgikktdcrqlswidtiifysgvvnydtdnfnkeilldrsagqngafkikldyvkkpipesvfvqileklyeedigagmyalypyggimdeisesaipfphragilyelwyicswekqednekhlnwirniynfmtpyvsknprlaylnyrdldigindpknpnnytqariwgekyfgknfdrlvkvktlvdpnnffrneqsipplprhrh

seqidno.19

dna

毛状体靶向udp糖基转移酶76g1

甜叶菊

atgaagtgctcaacattctccttttggtttgtttgcaagataatatttttctttttctcattcaatatccaaacttccattgctaatcctcgagaaaataaaactgaaactactgttagaagaagaagaagaattattttgtttcctgttccttttcaaggacatattaatcctattttgcaattggctaatgttttgtattcaaaaggattttcaattactatttttcatactaattttaataaacctaaaacttcaaattatcctcattttacttttagatttattttggataatgatcctcaagatgaaagaatttcaaatttgcctactcatggacctttggctggaatgagaattcctattattaatgaacatggagctgatgaattgagaagagaattggaattgttgatgttggcttcagaagaagatgaagaagtttcatgcttgattactgatgctttgtggtattttgctcaatcagttgctgattcattgaatttgagaagattggttttgatgacttcatcattgtttaattttcatgctcatgtttcattgcctcaatttgatgaattgggatatttggatcctgatgataaaactagattggaagaacaagcttcaggatttcctatgttgaaagttaaagatattaaatcagcttattcaaattggcaaattttgaaagaaattttgggaaaaatgattaaacaaactagagcttcatcaggagttatttggaattcatttaaagaattggaagaatcagaattggaaactgttattagagaaattcctgctccttcatttttgattcctttgcctaaacatttgactgcttcatcatcatcattgttggatcatgatagaactgtttttcaatggttggatcaacaacctccttcatcagttttgtatgtttcatttggatcaacttcagaagttgatgaaaaagattttttggaaattgctagaggattggttgattcaaaacaatcatttttgtgggttgttagacctggatttgttaaaggatcaacttgggttgaacctttgcctgatggatttttgggagaaagaggaagaattgttaaatgggttcctcaacaagaagttttggctcatggagctattggagctttttggactcattcaggatggaattcaactttggaatcagtttgcgaaggagttcctatgattttttcagattttggattggatcaacctttgaatgctagatatatgtcagatgttttgaaagttggagtttatttggaaaatggatgggaaagaggagaaattgctaatgctattagaagagttatggttgatgaagaaggagaatatattagacaaaatgctagagttttgaaacaaaaagctgatgtttcattgatgaaaggaggatcatcatatgaatcattggaatcattggtttcatatatttcatcattgtaa

seqidno.20

氨基酸

毛状体靶向udp糖基转移酶76g1

甜叶菊

mkcstfsfwfvckiiffffsfniqtsianprenktettvrrrrriilfpvpfqghinpilqlanvlyskgfsitifhtnfnkpktsnyphftfrfildndpqderisnlpthgplagmripiinehgadelrrelellmlaseedeevsclitdalwyfaqsvadslnlrrlvlmtsslfnfhahvslpqfdelgyldpddktrleeqasgfpmlkvkdiksaysnwqilkeilgkmikqtrassgviwnsfkeleeseletvireipapsfliplpkhltasssslldhdrtvfqwldqqppssvlyvsfgstsevdekdfleiarglydskqsflwvvrpgfvkgstwveplpdgflgergrivkwvpqqevlahgaigafwthsgwnstlesvcegvpmifsdfgldqplnarymsdvlkvgvylengwergeianairrvmvdeegeyirqnarvlkqkadvslmkggssyesleslvsyissl

seqidno.21

dna

pm-utr1

拟南芥

atggaggtccatggctccggattccgtcgaattctgttgttggcgttgtgtatctccgggatctggtccgcctacatctaccaaggcgttcttcaagagactctgtccacgaagagatttggtccagatgagaagaggttcgagcatcttgcattcttgaacttagctcaaagtgtagtctgcttgatctggtcttatataatgatcaagctctggtcaaatgctggtaacggtggagcaccatggtggacgtattggagtgcaggcattactaatacaattggtcctgccatgggaattgaagccttgaagtatatcagttatccagctcaggttttggcaaaatcgtcaaaaatgattccagttatgctaatgggaactttagtttacggaataagatacactttccctgaatacatgtgcacctttcttgtcgctggaggagtatccatctttgctcttcttaagacaagctctaagacaattagcaagctagcacatccaaatgctcccctcggttacgcactttgttccttaaacctcgcctttgacggattcacaaatgccacacaagactccattgcctcaaggtacccaaaaaccgaagcgtgggacataatgctgggaatgaacttatggggcacaatatacaacattatctacatgtttggcttgccacaagggatggattcgaagcaattcagttctgtaagctacacccggaagcggcatgggacattctaaagtattgtatatgcggtgccgtgggacaaaacttcatcttcatgacaataagtaacttcgggtcactagctaacacgaccataaccacgaccaggaagtttgttagcattgttgtatcatcagtaatgagcggaaatccattgtcgttgaagcaatggggatgtgtttcgatggtctttggtggtttggcatatcaaatttatcttaaatggaagaaattgcagagagtggagtgctccataatgaacttaatgtgtgggtctacctgcgccgcttga

seqidno.22

dna

细胞溶质cbda合酶(cytcbda)

cannabissativa

atgaatcctcgagaaaacttccttaaatgcttctcgcaatatattcccaataatgcaacaaatctaaaactcgtatacactcaaaacaacccattgtatatgtctgtcctaaattcgacaatacacaatcttagattcacctctgacacaaccccaaaaccacttgttatcgtcactccttcacatgtctctcatatccaaggcactattctatgctccaagaaagttggcttgcagattcgaactcgaagtggtggtcatgattctgagggcatgtcctacatatctcaagtcccatttgttatagtagacttgagaaacatgcgttcaatcaaaatagatgttcatagccaaactgcatgggttgaagccggagctacccttggagaagtttattattgggttaatgagaaaaatgagaatcttagtttggcggctgggtattgccctactgtttgcgcaggtggacactttggtggaggaggctatggaccattgatgagaaactatggcctcgcggctgataatatcattgatgcacacttagtcaacgttcatggaaaagtgctagatcgaaaatctatgggggaagatctcttttgggctttacgtggtggtggagcagaaagcttcggaatcattgtagcatggaaaattagactggttgctgtcccaaagtctactatgtttagtgttaaaaagatcatggagatacatgagcttgtcaagttagttaacaaatggcaaaatattgcttacaagtatgacaaagatttattactcatgactcacttcataactaggaacattacagataatcaagggaagaataagacagcaatacacacttacttctcttcagttttccttggtggagtggatagtctagtcgacttgatgaacaagagttttcctgagttgggtattaaaaaaacggattgcagacaattgagctggattgatactatcatcttctatagtggtgttgtaaattacgacactgataattttaacaaggaaattttgcttgatagatccgctgggcagaacggtgctttcaagattaagttagactacgttaagaaaccaattccagaatctgtatttgtccaaattttggaaaaattatatgaagaagatataggagctgggatgtatgcgttgtacccttacggtggtataatggatgagatttcagaatcagcaattccattccctcatcgagctggaatcttgtatgagttatggtacatatgtagttgggagaagcaagaagataacgaaaagcatctaaactggattagaaatatttataacttcatgactccttatgtgtccaaaaatccaagattggcatatctcaattatagagaccttgatataggaataaatgatcccaagaatccaaataattacacacaagcacgtatttggggtgagaagtattttggtaaaaattttgacaggctagtaaaagtgaaaaccctggttgatcccaataacttttttagaaacgaacaaagcatcccacctctaccacggcatcgtcattaa

seqidno.23

氨基酸

细胞溶质cbda合酶(cytcbda)

cannabissativa

mnprenflkcfsqyipnnatnlklvytqnnplymsvlnstihnlrftsdttpkplvivtpshvshiqgtilcskkvglqirtrsgghdsegmsyisqvpfvivdlrnmrsikidvhsqtawveagatlgevyywvneknenlslaagycptvcagghfggggygplmrnyglaadniidahlvnvhgkvldrksmgedlfwalrgggaesfgiivawkirlvavpkstmfsvkkimeihelvklvnkwqniaykydkdlllmthfitrnitdnqgknktaihtyfssvflggvdslvdlmnksfpelgikktdcrqlswidtiifysgvvnydtdnfnkeilldrsagqngafkikldyvkkpipesvfvqileklyeedigagmyalypyggimdeisesaipfphragilyelwyicswekqednekhlnwirniynfmtpyvsknprlaylnyrdldigindpknpnnytqariwgekyfgknfdrlvkvktlvdpnnffrneqsipplprhrh

seqidno.24

dna

细胞溶质靶向udp糖基转移酶76g1(cytutg)

甜叶菊

atggaaaataaaaccgaaaccaccgtccgccgtcgtcgccgtatcattctgttcccggtcccgttccagggccacatcaacccgattctgcaactggcgaacgtgctgtattcgaaaggtttcagcatcaccatcttccatacgaacttcaacaagccgaagaccagcaattacccgcactttacgttccgttttattctggataacgacccgcaggatgaacgcatctctaatctgccgacccacggcccgctggcgggtatgcgtattccgattatcaacgaacacggcgcagatgaactgcgtcgcgaactggaactgctgatgctggccagcgaagaagatgaagaagtttcttgcctgatcaccgacgcactgtggtattttgcccagtctgttgcagatagtctgaacctgcgtcgcctggtcctgatgaccagcagcctgttcaattttcatgcccacgttagtctgccgcagttcgatgaactgggttatctggacccggatgacaaaacccgcctggaagaacaggcgagcggctttccgatgctgaaagtcaaggatattaagtcagcgtactcgaactggcagattctgaaagaaatcctgggtaaaatgattaagcaaaccaaagcaagttccggcgtcatctggaatagtttcaaagaactggaagaatccgaactggaaacggtgattcgtgaaatcccggctccgagttttctgattccgctgccgaagcatctgaccgcgagcagcagcagcctgctggatcacgaccgcacggtgtttcagtggctggatcagcaaccgccgagttccgtgctgtatgttagcttcggtagtacctcggaagtggatgaaaaggactttctggaaatcgctcgtggcctggttgatagcaaacaatctttcctgtgggtggttcgcccgggttttgtgaagggctctacgtgggttgaaccgctgccggacggcttcctgggtgaacgtggccgcattgtcaaatgggtgccgcagcaagaagtgctggcgcatggcgcgattggcgcgttttggacccactccggttggaactcaacgctggaatcggtttgtgaaggtgtcccgatgattttctcagattttggcctggaccagccgctgaatgcacgttatatgtcggatgttctgaaagtcggtgtgtacctggaaaacggttgggaacgcggcgaaattgcgaatgccatccgtcgcgttatggtcgatgaagaaggcgaatacattcgtcagaatgctcgcgtcctgaaacaaaaggcggacgtgagcctgatgaaaggcggttcatcgtatgaaagtctggaatccctggtttcatacatcagctctctgtaa

seqidno.25

氨基酸

细胞溶质靶向udp糖基转移酶76g1(cytutg)

甜叶菊

menktettvrrrrriilfpvpfqghinpilqlanvlyskgfsitifhtnfnkpktsnyphftfrfildndpqderisnlpthgplagmripiinehgadelrrelellmlaseedeevsclitdalwyfaqsvadslnlrrlvlmtsslfnfhahvslpqfdelgyldpddktrleeqasgfpmlkvkdiksaysnwqilkeilgkmikqtkassgviwnsfkeleeseletvireipapsfliplpkhltasssslldhdrtvfqwldqqppssvlyvsfgstsevdekdfleiarglydskqsflwvvrpgfvkgstwveplpdgflgergrivkwvpqqevlahgaigafwthsgwnstlesvcegvpmifsdfgldqplnarymsdvlkvgvylengwergeianairrvmvdeegeyirqnarvlkqkadvslmkggssyesleslvsyissl

seqidno.26

氨基酸

糖基转移酶(ntgt5a)

烟草

mgsigaeltkphavcipypaqghinpmlklakilhhkgfhitfvntefnhrrllksrgpdslkglssfrfetipdglppceadatqdipslcesttntclapfrdllaklndtntsnvppvscivsdgvmsftlaaaqelgvpevlfwttsacgflgymhyckviekgyaplkdasdltngylettldfipgmkdvrlrdlpsflrttnpdefmikfvlqeterarkasaiilntfetleaevleslrnllppvypigplhflvkhvddenlkglrsslwkeepeciqwldtkepnsvvyvnfgsitvmtpnqliefawglansqqtflwiirpdivsgdasilppefveetknrgmlaswcsqeevlshpaivgflthsgwnstlesissgvpmicwpffaeqqtncwfsvtkwdvgmeidsdvkrdeveslvrelmvggkgkkmkkkamewkelaeasakehsgssyvnieklvndillsskh

seqidno.27

dna

糖基转移酶(ntgt5a)

烟草

atgggttccattggtgctgaattaacaaagccacatgcagtttgcataccatatcccgcccaaggccatattaaccccatgttaaagctagccaaaatccttcatcacaaaggctttcacatcacttttgtcaatactgaatttaaccaccgacgtctccttaaatctcgtggccctgattctctcaagggtctttcttctttccgttttgagaccattcctgatggacttccgccatgtgaggcagatgccacacaagatataccttctttgtgtgaatctacaaccaatacttgcttggctccttttagggatcttcttgcgaaactcaatgatactaacacatctaacgtgccacccgtttcgtgcatcgtctcggatggtgtcatgagcttcaccttagccgctgcacaagaattgggagtccctgaagttctgttttggaccactagtgcttgtggtttcttaggttacatgcattactgcaaggttattgaaaaaggatatgctccacttaaagatgcgagtgacttgacaaatggatacctagagacaacattggattttataccaggcatgaaagacgtacgtttaagggatcttccaagtttcttgagaactacaaatccagatgaattcatgatcaaatttgtcctccaagaaacagagagagcaagaaaggcttctgcaattatcctcaacacatttgaaacactagaggctgaagttcttgaatcgctccgaaatcttcttcctccagtctaccccatagggcccttgcattttctagtgaaacatgttgatgatgagaatttgaagggacttagatccagcctttggaaagaggaaccagagtgtatacaatggcttgataccaaagaaccaaattctgttgtttatgttaactttggaagcattactgttatgactcctaatcagcttattgagtttgcttggggacttgcaaacagccagcaaacattcttatggatcataagacctgatattgtttcaggtgatgcatcgattcttccacccgaattcgtggaagaaacgaagaacagaggtatgcttgctagttggtgttcacaagaagaagtacttagtcaccctgcaatagtaggattcttgactcacagtggatggaattcgacactcgaaagtataagcagtggggtgcctatgatttgctggccatttttcgctgaacagcaaacaaattgttggttttccgtcactaaatgggatgttggaatggagattgacagtgatgtgaagagagatgaagtggaaagccttgtaagggaattgatggttgggggaaaaggcaaaaagatgaagaaaaaggcaatggaatggaaggaattggctgaagcatctgctaaagaacattcagggtcatcttatgtgaacattgaaaagttggtcaatgatattcttctttcatccaaacattaa

seqidno.28

氨基酸

糖基转移酶(ntgt5b)

烟草

mgsigaeftkphavcipypaqghinpmlklakilhhkgfhitfvntefnhrrllksrgpdslkglssfrfetipdglppcdadatqdipslcesttntclgpfrdllaklndtntsnvppvsciisdgvmsftlaaaqelgvpevlfwttsacgflgymhyykviekgyaplkdasdltngylettldfipcmkdvrlrdlpsflrttnpdefmikfvlqeterarkasaiilntyetleaevleslrnllppvypigplhflvkhvddenlkglrsslwkeepeciqwldtkepnsvvyvnfgsitvmtpnqliefawglansqqsflwiirpdivsgdasilppefveetkkrgmlaswcsqeevlshpaiggflthsgwnstlesissgvpmicwpffaeqqtncwfsvtkwdvgmeidcdvkrdeveslvrelmvggkgkkmkkkamewkelaeasakehsgssyvniekvvndillsskh

seqidno.29

dna

糖基转移酶(ntgt5b)

烟草

atgggttccattggtgctgaatttacaaagccacatgcagtttgcataccatatcccgcccaaggccatattaaccccatgttaaagctagccaaaatccttcatcacaaaggctttcacatcacttttgtcaatactgaatttaaccacagacgtctgcttaaatctcgtggccctgattctctcaagggtctttcttctttccgttttgagacaattcctgatggacttccgccatgtgatgcagatgccacacaagatataccttctttgtgtgaatctacaaccaatacttgcttgggtccttttagggatcttcttgcgaaactcaatgatactaacacatctaacgtgccacccgtttcgtgcatcatctcagatggtgtcatgagcttcaccttagccgctgcacaagaattgggagtccctgaagttctgttttggaccactagtgcttgtggtttcttaggttacatgcattattacaaggttattgaaaaaggatacgctccacttaaagatgcgagtgacttgacaaatggatacctagagacaacattggattttataccatgcatgaaagacgtacgtttaagggatcttccaagtttcttgagaactacaaatccagatgaattcatgatcaaatttgtcctccaagaaacagagagagcaagaaaggcttctgcaattatcctcaacacatatgaaacactagaggctgaagttcttgaatcgctccgaaatcttcttcctccagtctaccccattgggcccttgcattttctagtgaaacatgttgatgatgagaatttgaagggacttagatccagcctttggaaagaggaaccagagtgtatacaatggcttgataccaaagaaccaaattctgttgtttatgttaactttggaagcattactgttatgactcctaatcaacttattgaatttgcttggggacttgcaaacagccaacaatcattcttatggatcataagacctgatattgtttcaggtgatgcatcgattcttccccccgaattcgtggaagaaacgaagaagagaggtatgcttgctagttggtgttcacaagaagaagtacttagtcaccctgcaataggaggattcttgactcacagtggatggaattcgacactcgaaagtataagcagtggggtgcctatgatttgctggccatttttcgctgaacagcaaacaaattgttggttttccgtcactaaatgggatgttggaatggagattgactgtgatgtgaagagggatgaagtggaaagccttgtaagggaattgatggttgggggaaaaggcaaaaagatgaagaaaaaggcaatggaatggaaggaattggctgaagcatctgctaaagaacattcagggtcatcttatgtgaacattgagaaggtggtcaatgatattcttctttcgtccaaacattaa

seqidno.30

氨基酸

udp-糖基转移酶73c3(ntgt4)

烟草

matqvhklhfilfplmapghmipmidiakllanrgvittiittpvnanrfsstitraiksglriqiltlkfpsvevglpegcenidmlpsldlaskffaaismlkqqvenlleginpspscvisdmgfpwttqiaqnfniprivfhgtccfsllcsykilssnilenitsdseyfvvpdlpdrveltkaqvsgstknttsvsssvlkevteqirlaeessygvivnsfeeleqvyekeyrkargkkvwcvgpvslcnkeiedlvtrgnktaidnqdclkwldnfetesvvyaslgslsrltllqmvelglgleesnrpfvwvlgggdklndlekwilengfeqrikergvlirgwapqvlilshpaiggvlthcgwnstlegisaglpmvtwplfaeqfcneklvvqvlkigvslgvkvpvkwgdeenvgvlvkkddvkkaldklmdegeegqvrrtkakelgelakkafgeggssyvnltsliediieqqnhkek

seqidno.31

dna

udp-糖基转移酶73c3(ntgt4)

烟草

atggcaactcaagtgcacaaacttcatttcatactattccctttaatggctccaggccacatgattcctatgatagacatagctaaacttctagcaaatcgcggtgtcattaccactatcatcaccactccagtaaacgccaatcgtttcagttcaacaattactcgtgccataaaatccggtctaagaatccaaattcttacactcaaatttccaagtgtagaagtaggattaccagaaggttgcgaaaatattgacatgcttccttctcttgacttggcttcaaagttttttgctgcaattagtatgctgaaacaacaagttgaaaatctcttagaaggaataaatccaagtccaagttgtgttatttcagatatgggatttccttggactactcaaattgcacaaaattttaatatcccaagaattgtttttcatggtacttgttgtttctcacttttatgttcctataaaatactttcctccaacattcttgaaaatataacctcagattcagagtattttgttgttcctgatttacccgatagagttgaactaacgaaagctcaggtttcaggatcgacgaaaaatactacttctgttagttcttctgtattgaaagaagttactgagcaaatcagattagccgaggaatcatcatatggtgtaattgttaatagttttgaggagttggagcaagtgtatgagaaagaatataggaaagctagagggaaaaaagtttggtgtgttggtcctgtttctttgtgtaataaggaaattgaagatttggttacaaggggtaataaaactgcaattgataatcaagattgcttgaaatggttagataattttgaaacagaatctgtggtttatgcaagtcttggaagtttatctcgtttgacattattgcaaatggtggaacttggtcttggtttagaagagtcaaataggccttttgtatgggtattaggaggaggtgataaattaaatgatttagagaaatggattcttgagaatggatttgagcaaagaattaaagaaagaggagttttgattagaggatgggctcctcaagtgcttatactttcacaccctgcaattggtggagtattgactcattgcggatggaattctacattggaaggtatttcagcaggattaccaatggtaacatggccactatttgctgagcaattttgcaatgagaagttagtagtccaagtgctaaaaattggagtgagcctaggtgtgaaggtgcctgtcaaatggggagatgaggaaaatgttggagttttggtaaaaaaggatgatgttaagaaagcattagacaaactaatggatgaaggagaagaaggacaagtaagaagaacaaaagcaaaagagttaggagaattggctaaaaaggcatttggagaaggtggttcttcttatgttaacttaacatctctgattgaagacatcattgagcaacaaaatcacaaggaaaaatag

seqidno.32

氨基酸

糖基转移酶(ntgt1b)

烟草

mktaelvfipapgmghlvptvevakqlvdrheqlsitvlimtipletnipsytkslssdyssritllplsqpetsvtmssfnainffeyissykgrvkdavsetsfsssnsvklagfvidmfctamidvanefgipsyvfytssaamlglqlhfqslsiecspkvhnyvepesevlistymnpvpvkclpgiilvndesstmfvnharrfretkgimvntfteleshalkalsddekippiypvgpilnlengnedhnqeydaimkwldekpnssvvflcfgskgsfeedqvkeianalessgyhflwslrrpppkdklqfpsefenpeevlpegffqrtkgrgkvigwapqlailshpsvggfvshcgwnstlesvrsgvpiatwplyaeqqsnafqlvkdlgmaveikmdyredfntrnpplvkaeeiedgirklmdsenkirakvtemkdksraalleggssyvalghfvetvmkn

seqidno.33

dna

糖基转移酶(ntgt1b)

烟草

atgaagacagcagagttagtattcattcctgctcctgggatgggtcaccttgtaccaactgtggaggtggcaaagcaactagtcgacagacacgagcagctttcgatcacagttctaatcatgacaattcctttggaaacaaatattccatcatatactaaatcactgtcctcagactacagttctcgtataacgctgcttccactctctcaacctgagacctctgttactatgagcagttttaatgccatcaatttttttgagtacatctccagctacaagggtcgtgtcaaagatgctgttagtgaaacctcctttagttcgtcaaattctgtgaaacttgcaggatttgtaatagacatgttctgcactgcgatgattgatgtagcgaacgagtttggaatcccaagttatgtgttctacacttctagtgcagctatgcttggactacaactgcattttcaaagtcttagcattgaatgcagtccgaaagttcataactacgttgaacctgaatcagaagttctgatctcaacttacatgaatccggttccagtcaaatgtttgcccggaattatactagtaaatgatgaaagtagcaccatgtttgtcaatcatgcacgaagattcagggagacgaaaggaattatggtgaacacgttcactgagcttgaatcacacgctttgaaagccctttccgatgatgaaaaaatcccaccaatctacccagttggacctatacttaaccttgaaaatgggaatgaagatcacaatcaagaatatgatgcgattatgaagtggcttgacgagaagcctaattcatcagtggtgttcttatgctttggaagcaaggggtctttcgaagaagatcaggtgaaggaaatagcaaatgctctagagagcagtggctaccacttcttgtggtcgctaaggcgaccgccaccaaaagacaagctacaattcccaagcgaattcgagaatccagaggaagtcttaccagagggattctttcaaaggactaaaggaagaggaaaggtgataggatgggcaccccagttggctattttgtctcatccttcagtaggaggattcgtgtcgcattgtgggtggaattcaactctggagagcgttcgaagtggagtgccgatagcaacatggccattgtatgcagagcaacagagcaatgcatttcaactggtgaaggatttgggtatggcagtagagattaagatggattacagggaagattttaatacgagaaatccaccactggttaaagctgaggagatagaagatggaattaggaagctgatggattcagagaataaaatcagggctaaggtgacggagatgaaggacaaaagtagagcagcactgctggagggcggatcatcatatgtagctcttgggcattttgttgagactgtcatgaaaaactag

seqidno.34

氨基酸

糖基转移酶(ntgt1a)

烟草

mkttelvfipapgmghlvptvevakqlvdrdeqlsitvlimtlpletnipsytkslssdyssritllqlsqpetsvsmssfnainffeyissykdrvkdavnetfsssssvklkgfvidmfctamidvanefgipsyvfytsnaamlglqlhfqslsieyspkvhnyldpesevaistyinpipvkclpgiildndksgtmfvnharrfretkgimvntfaeleshalkalsddekippiypvgpilnlgdgnedhnqeydmimkwldeqphssvvflcfgskgsfeedqvkeianalersgnrflwslrrpppkdtlqfpsefenpeevlpvgffqrtkgrgkvigwapqlailshpavggfvshcgwnstlesvrsgvpiatwplyaeqqsnafqlvkdlgmaveikmdyredfnktnpplvkaeeiedgirklmdsenkirakvmemkdksraalleggssyvalghfvetvmkn

seqidno.35

dna

糖基转移酶(ntgt1a)

烟草

atgaagacaacagagttagtattcattcctgctcctggcatgggtcaccttgtacccactgtggaggtggcaaagcaactagtcgacagagacgaacagctttcaatcacagttctcatcatgacgcttcctttggaaacaaatattccatcatatactaaatcactgtcctcagactacagttctcgtataacgctgcttcaactttctcaacctgagacctctgttagtatgagcagttttaatgccatcaatttttttgagtacatctccagctacaaggatcgtgtcaaagatgctgttaatgaaacctttagttcgtcaagttctgtgaaactcaaaggatttgtaatagacatgttctgcactgcgatgattgatgtggcgaacgagtttggaatcccaagttatgtcttctacacttctaatgcagctatgcttggactccaactccattttcaaagtcttagtattgaatacagtccgaaagttcataattacctagaccctgaatcagaagtagcgatctcaacttacattaatccgattccagtcaaatgtttgcccgggattatactagacaatgataaaagtggcaccatgttcgtcaatcatgcacgaagattcagggagacgaaaggaattatggtgaacacattcgctgagcttgaatcacacgctttgaaagccctttccgatgatgagaaaatcccaccaatctacccagttgggcctatacttaaccttggagatgggaatgaagatcacaatcaagaatatgatatgattatgaagtggctcgacgagcagcctcattcatcagtggtgttcctatgctttggaagcaagggatctttcgaagaagatcaagtgaaggaaatagcaaatgctctagagagaagtggtaaccggttcttgtggtcgctaagacgaccgccaccaaaagacacgctacaattcccaagcgaattcgagaatccagaggaagtcttgccggtgggattctttcaaaggactaaaggaagaggaaaggtgataggatgggcaccccagttggctattttgtctcatcctgcagtaggaggattcgtgtcgcattgtgggtggaattcaactttggagagtgttcgtagtggagtaccgatagcaacatggccattgtatgcagagcaacagagcaatgcatttcaactggtgaaggatttggggatggcagtggagattaagatggattacagggaagattttaataagacaaatccaccactggttaaagctgaggagatagaagatggaattaggaagctgatggattcagagaataaaatcagggctaaggtgatggagatgaaggacaaaagtagagcagcgttattagaaggcggatcatcatatgtagctctcgggcattttgttgagactgtcatgaaaaactaa

seqidno.36

氨基酸

糖基转移酶(ntgt3)

烟草

mketkkielvfipspgighlvstvemaklliareeqlsitvliiqwpndkkldsyiqsvanfssrlkfirlpqddsimqllksnifttfiashkpavrdavadilksesnntlagividlfctsmidvanefelptyvfytsgaatlglhyhiqnlrdefnkditkykdepeeklsiatylnpfpakclpsvaldkeggstmfldlakrfretkgimintflelesyalnslsrdknlppiypvgpvlnlnnvegdnlgssdqntmkwlddqpassvvflcfgsggsfekhqvkeiayalessgcrflwslrrpptedarfpsnyenleeilpegflertkgigkvigwapqlailshkstggfvshcgwnstlestyfgvpiatwpmyaeqqanafqlvkdlrmgveikmdyrkdmkvmgkevivkaeeiekaireimdseseirvkvkemkeksraaqmeggssytsiggfiqiimensq

seqidno.37

dna

糖基转移酶(ntgt3)

烟草

atgaaagaaaccaagaaaatagagttagtcttcattccttcaccaggaattggccatttagtatccacagttgaaatggcaaagcttcttatagctagagaagagcagctatctatcacagtcctcatcatccaatggcctaacgacaagaagctcgattcttatatccaatcagtcgccaatttcagctcgcgtttgaaattcattcgactccctcaggatgattccattatgcagctactcaaaagcaacattttcaccacgtttattgccagtcataagcctgcagttagagatgctgttgctgatattctcaagtcagaatcaaataatacgctagcaggtattgttatcgacttgttctgcacctcaatgatagacgtggccaatgagttcgagctaccaacctatgttttctacacgtctggtgcagcaacccttggtcttcattatcatatacagaatctcagggatgaatttaacaaagatattaccaagtacaaagacgaacctgaagaaaaactctctatagcaacatatctcaatccatttccagcaaaatgtttgccgtctgtagccttagacaaagaaggtggttcaacaatgtttcttgatctcgcaaaaaggtttcgagaaaccaaaggtattatgataaacacatttctagagctcgaatcctatgcattaaactcgctctcacgagacaagaatcttccacctatataccctgtcggaccagtattgaaccttaacaatgttgaaggtgacaacttaggttcatctgaccagaatactatgaaatggttagatgatcagcccgcttcatctgtagtgttcctttgttttggtagtggtggaagctttgaaaaacatcaagttaaggaaatagcctatgctctggagagcagtgggtgtcggtttttgtggtcgttaaggcgaccaccaaccgaagatgcaagatttccaagcaactatgaaaatcttgaagaaattttgccagaaggattcttggaaagaacaaaagggattggaaaagtgataggatgggcacctcagttggcgattttgtcacataaatcgacggggggatttgtgtcgcactgtggatggaattcgactttggaaagtacatattttggagtgccaatagcaacctggccaatgtacgcggagcaacaagcgaatgcatttcaattggttaaggatttgagaatgggagttgagattaagatggattataggaaggatatgaaagtgatgggcaaagaagttatagtgaaagctgaggagattgagaaagcaataagagaaattatggattccgagagtgaaattcgggtgaaggtgaaagagatgaaggagaagagcagagcagcacaaatggaaggtggctcttcttacacttctattggaggtttcatccaaattatcatggagaattctcaataa

seqidno.38

氨基酸

糖基转移酶(ntgt2)

烟草

mvqphvllvtfpaqghinpclqfakrlirmgievtfatsvfahrrmaktttstlskglnfaafsdgyddgfkadehdsqhymseiksrgsktlkdiilkssdegrpvtslvyslllpwaakvarefhipcallwiqpatvldiyyyyfngyedaikgstndpnwciqlprlpllksqdlpsfllsssneekysfalptfkeqldtldveenpkvlvntfdalepkelkaiekynligigplipstfldgkdpldssfggdlfqksndyiewlnskanssvvyisfgsllnlsknqkeeiakglieikkpflwvirdqengkgdekeeklscmmelekqgkivpwcsqlevlthpsigcfvshcgwnstleslssgvsvvafphwtdqgtnakliedvwktgvrlkknedgvveseeikrciemvmdggekgeemrrnaqkwkelareavkeggssemnlkafvqevgkgc

seqidno.39

dna

糖基转移酶(ntgt2)

烟草

atggtgcaaccccatgtcctcttggtgacttttccagcacaaggccatattaatccatgtctccaatttgccaagaggctaattagaatgggcattgaggtaacttttgccacgagcgttttcgcccatcgtcgtatggcaaaaactacgacttccactctatccaagggcttaaattttgcggcattctctgatgggtacgacgatggtttcaaggccgatgagcatgattctcaacattacatgtcggagataaaaagtcgcggttctaaaaccctaaaagatatcattttgaagagctcagacgagggacgtcctgtgacatccctcgtctattctcttttgcttccatgggctgcaaaggtagcgcgtgaatttcacataccgtgcgcgttactatggattcaaccagcaactgtgctagacatatattattattacttcaatggctatgaggatgccataaaaggtagcaccaatgatccaaattggtgtattcaattgcctaggcttccactactaaaaagccaagatcttccttcttttttactttcttctagtaatgaagaaaaatatagctttgctctaccaacatttaaagagcaacttgacacattagatgttgaagaaaatcctaaagtacttgtgaacacatttgatgcattagagccaaaggaactcaaagctattgaaaagtacaatttaattgggattggaccattgattccttcaacatttttggacggaaaagaccctttggattcttcctttggtggtgatctttttcaaaagtctaatgactatattgaatggttgaactcaaaggctaactcatctgtggtttatatctcatttgggagtctcttgaatttgtcaaaaaatcaaaaggaggagattgcaaaagggttgatagagattaaaaagccattcttgtgggtaataagagatcaagaaaatggtaagggagatgaaaaagaagagaaattaagttgtatgatggagttggaaaagcaagggaaaatagtaccatggtgttcacaacttgaagtcttaacacatccatctataggatgtttcgtgtcacattgtggatggaattcgactctggaaagtttatcgtcaggcgtgtcagtagtggcatttcctcattggacggatcaagggacaaatgctaaactaattgaagatgtttggaagacaggtgtaaggttgaaaaagaatgaagatggtgtggttgagagtgaagagataaaaaggtgcatagaaatggtaatggatggtggagagaaaggagaagaaatgagaagaaatgctcaaaaatggaaagaattggcaagggaagctgtaaaagaaggcggatcttcggaaatgaatctaaaagcttttgttcaagaagttggcaaaggttgctga

seqidno.40

氨基酸

thca合酶毛状体靶向结构域

大麻

mncsafsfwfvckiiffflsfhiqisia

seqidno.41

氨基酸

cbda合酶毛状体靶向结构域

大麻

mkcstfsfwfvckiiffffsfniqtsia

seqidno.42

氨基酸

thca合酶

大麻

mncsafsfwfvckiiffflsfhiqisianprenflkcfskhipnnvanpklvytqhdqlymsilnstiqnlrfisdttpkplvivtpsnnshiqatilcskkvglqirtrsgghdaegmsyisqvpfvvvdlrnmhsikidvhsqtawveagatlgevyywineknenlsfpggycptvgvgghfsgggygalmrnyglaadniidahlvnvdgkvldrksmgedlfwairggggenfgiiaawkiklvdvpskstifsvkknmeihglyklfnkwqniaykydkdlvlmthfitknitdnhgknkttvhgyfssifhggvdslvdlmnksfpelgikktdckefswidttifysgvvnfntanfkkeilldrsagkktafsikldyvkkpipetamvkileklyeedvgagmyvlypyggimeeisesaipfphragimyelwytaswekqednekhinwvrsvynfttpyvsqnprlaylnyrdldlgktnhaspnnytqariwgekyfgknfnrlvkvktkvdpnnffrneqsipplpphhh

seqidno.43

氨基酸

can738啤酒花的myb8同源物

mgrapccekvglkkgrwtseedeiltkyiqsngegcwrslpknagllrcgkscrlrwinylradlkrgnisseeediiiklhstlgnrwsliashlpgrtdneiknywnshlsrkihtfrrcnnttthhhhlpnlvtvtkvnlpipkrkggrtsrlamkknksstsnqnssvikndvgssssttttsvhqrtttttptmddqqkrqlsrcrleekedqdgastgtvvmmlgqaaavgsscdedmlghdqlsflccseekttensmtnlkengdhevsgpydydhryeketsvdegmllcfndiidsnllnpnevltlseeslnlggalmdtttstttnnnnyslsynnngdcvisddhdqywlddvvgvdfwswessttvtqeqeqeqeqeqeqeqeqeqeqehhhqqdqkkntwdnekekmlallwdsdnsnwelqdnnnyhkcqeitsdkenamvawlls

seqidno.44

氨基酸

can739拟南芥的myb12同源物

mgrapccekvgikrgrwtaeedqilsnyiqsngegswrslpknaglkrcgkscrlrwinylrsdlkrgnitpeeeelvvklhstlgnrwsliaghlpgrtdneiknywnshlsrklhnfirkpsisqdvsavimtnassappppqakrrlgrtsrsamkpkihrtktrktkktsappepnadvagadkealmvessgaeaelgrpcdyygddcnknlmsingdngvltfdddiidllldesdpghlytnttcggdgelhnirdsegargfsdtwnqgnldcllqscpsvesflnydhqvndastdefidwdcvwqegsdnnlwhekenpdsmvswlldgddeatignsncenfgepldhddesalvawlls

seqidno.45

氨基酸

can833拟南芥的myb112同源物

mnisrtefancktlinhkeeveevekkmeieirrgpwtveedmklvsyislhgegrwnslsrsaglnrtgkscrlrwlnylrpdirrgdislqeqfiilelhsrwgnrwskiaqhlpgrtdneiknywrtrvqkhakllkcdvnskqfkdtikhlwmprlieriaatqsvqftsnhyspenssvatatsstssseavrssfyggdqvefgtldhmtnggywfnggdtfetlcsfdelnkwliq

seqidno.46

氨基酸

细胞溶质靶向thca合酶(ctthcas)

大麻

nprenflkcfskhipnnvanpklvytqhdqlymsilnstiqnlrfisdttpkplvivtpsnnshiqatilcskkvglqirtrsgghdaegmsyisqvpfvvvdlrnmhsikidvhsqtawveagatlgevyywineknenlsfpggycptvgvgghfsgggygalmrnyglaadniidahlvnvdgkvldrksmgedlfwairggggenfgiiaawkiklvdvpskstifsvkknmeihglyklfnkwqniaykydkdlvlmthfitknitdnhgknkttvhgyfssifhggvdslvdlmnksfpelgikktdckefswidttifysgvvnfntanfkkeilldrsagkktafsikldyvkkpipetamvkileklyeedvgagmyvlypyggimeeisesaipfphragimyelwytaswekqednekhinwvrsvynfttpyvsqnprlaylnyrdldlgktnhaspnnytqariwgekyfgknfnrlvkvktkvdpnnffrneqsipplpphhh

seqidno.47

氨基酸

具有thca合酶毛状体靶向结构域的毛状体靶向过氧化氢酶

拟南芥

mncsafsfwfvckiiffflsfhiqisiamdpykyrpassynspffttnsgapvwnnnssmtvgprglilledyhlveklanfdreripervvhargasakgffevthdisnltcadflrapgvqtpvivrfstvihargspetlrdprgfavkfytregnfdlvgnnfpvffirdgmkfpdivhalkpnpkshiqenwrildffshhpeslnmftflfddigipqdyrhmdgsgvntymlinkagkahyvkfhwkptcgvkslleedairlggtnhshatqdlydsiaagnypewklfiqiidpadedkfdfdpldvtktwpedilplqpvgrmvlnknidnffaeneqlafcpaiivpgihysddkllqtrvfsyadtqrhrlgpnylqlpvnapkcahhnnhhegfmnfmhrdeevnyfpsrydqvrhaekyptppavcsgkrerciiekennfkepgeryrtftperqerfiqrwidalsdpritheirsiwisywsqadkslgqklasrlnvrpsi

seqidno.48

氨基酸

具有cbda合酶毛状体靶向结构域的毛状体靶向过氧化氢酶

拟南芥

mkcstfsfwfvckiiffffsfniqtsiamdpykyrpassynspffttnsgapvwnnnssmtvgprglilledyhlveklanfdreripervvhargasakgffevthdisnltcadflrapgvqtpvivrfstvihargspetlrdprgfavkfytregnfdlvgnnfpvffirdgmkfpdivhalkpnpkshiqenwrildffshhpeslnmftflfddigipqdyrhmdgsgvntymlinkagkahyvkfhwkptcgvkslleedairlggtnhshatqdlydsiaagnypewklfiqiidpadedkfdfdpldvtktwpedilplqpvgrmvlnknidnffaeneqlafcpaiivpgihysddkllqtrvfsyadtqrhrlgpnylqlpvnapkcahhnnhhegfmnfmhrdeevnyfpsrydqvrhaekyptppavcsgkrerciiekennfkepgeryrtftperqerfiqrwidalsdpritheirsiwisywsqadkslgqklasrlnvrpsi

seqidno.49

氨基酸

具有thca合酶毛状体靶向结构域的过氧化氢酶hpii(kate)

大肠杆菌

mncsafsfwfvckiiffflsfhiqisiamsqhneknphqhqsplhdsseakpgmdslapedgshrpaaeptppgaqptapgslkapdtrneklnsledvrkgsenyalttnqgvriaddqnslragsrgptlledfilrekithfdheriperivhargsaahgyfqpykslsditkadflsdpnkitpvfvrfstvqggagsadtvrdirgfatkfyteegifdlvgnntpiffiqdahkfpdfvhavkpephwaipqgqsahdtfwdyvslqpetlhnvmwamsdrgiprsyrtmegfgihtfrlinaegkatfvrfhwkplagkaslvwdeaqkltgrdpdfhrrelweaieagdfpeyelgfqlipeedefkfdfdlldptklipeelvpvqrvgkmvlnrnpdnffaeneqaafhpghivpgldftndpllqgrlfsytdtqisrlggpnfheipinrptcpyhnfqrdgmhrmgidtnpanyepnsindnwpretppgpkrggfesyqervegnkvrerspsfgeyyshprlfwlsqtpfeqrhivdgfsfelskvvrpyirervvdqlahidltlaqavaknlgieltddqlnitpppdvnglkkdpslslyaipdgdvkgrvvaillndevrsadllailkalkakgvhakllysrmgevtaddgtvlpiaatfagapsltvdavivpcgniadiadngdanyylmeaykhlkpialagdarkfkatikiadqgeegiveadsadgsfmdelltlmaahrvwsripkidkipa

seqidno.50

氨基酸

具有cbda合酶毛状体靶向结构域的过氧化氢酶hpii(kate)

大肠杆菌

mkcstfsfwfvckiiffffsfniqtsiamsqhneknphqhqsplhdsseakpgmdslapedgshrpaaeptppgaqptapgslkapdtrneklnsledvrkgsenyalttnqgvriaddqnslragsrgptlledfilrekithfdheriperivhargsaahgyfqpykslsditkadflsdpnkitpvfvrfstvqggagsadtvrdirgfatkfyteegifdlvgnntpiffiqdahkfpdfvhavkpephwaipqgqsahdtfwdyvslqpetlhnvmwamsdrgiprsyrtmegfgihtfrlinaegkatfvrfhwkplagkaslvwdeaqkltgrdpdfhrrelweaieagdfpeyelgfqlipeedefkfdfdlldptklipeelvpvqrvgkmvlnrnpdnffaeneqaafhpghivpgldftndpllqgrlfsytdtqisrlggpnfheipinrptcpyhnfqrdgmhrmgidtnpanyepnsindnwpretppgpkrggfesyqervegnkvrerspsfgeyyshprlfwlsqtpfeqrhivdgfsfelskvvrpyirervvdqlahidltlaqavaknlgieltddqlnitpppdvnglkkdpslslyaipdgdvkgrvvaillndevrsadllailkalkakgvhakllysrmgevtaddgtvlpiaatfagapsltvdavivpcgniadiadngdanyylmeaykhlkpialagdarkfkatikiadqgeegiveadsadgsfmdelltlmaahrvwsripkidkipa

序列表

<110>特征生物科学公司

<120>水溶性大麻素在植物系统中高水平体内生物合成和分离

<130>90425.00060

<150>us62/476,080

<151>2017-03-24

<150>us62/621,166

<151>2018-01-21

<150>us62/588,662

<151>2017-11-20

<160>50

<170>patentinversion3.5

<210>1

<211>1509

<212>dna

<213>c细胞色素p450(cyp3a4)人(cytochromep450(cyp3a4)human)

<400>1

atggctttgattcctgatttggctatggaaactagattgttgttggctgtttcattggtt60

ttgttgtatttgtatggaactcattcacatggattgtttaaaaaattgggaattcctgga120

cctactcctttgccttttttgggaaatattttgtcatatcataaaggattttgcatgttt180

gatatggaatgccataaaaaatatggaaaagtttggggattttatgatggacaacaacct240

gttttggctattactgatcctgatatgattaaaactgttttggttaaagaatgctattca300

gtttttactaatagaagaccttttggacctgttggatttatgaaatcagctatttcaatt360

gctgaagatgaagaatggaaaagattgagatcattgttgtcacctacttttacttcagga420

aaattgaaagaaatggttcctattattgctcaatatggagatgttttggttagaaatttg480

agaagagaagctgaaactggaaaacctgttactttgaaagatgtttttggagcttattca540

atggatgttattacttcaacttcatttggagttaatattgattcattgaataatcctcaa600

gatccttttgttgaaaatactaaaaaattgttgagatttgattttttggatccttttttt660

ttgtcaattactgtttttccttttttgattcctattttggaagttttgaatatttgcgtt720

tttcctagagaagttactaattttttgagaaaatcagttaaaagaatgaaagaatcaaga780

ttggaagatactcaaaaacatagagttgattttttgcaattgatgattgattcacaaaat840

tcaaaagaaactgaatcacataaagctttgtcagatttggaattggttgctcaatcaatt900

atttttatttttgctggatgcgaaactacttcatcagttttgtcatttattatgtatgaa960

ttggctactcatcctgatgttcaacaaaaattgcaagaagaaattgatgctgttttgcct1020

aataaagctcctcctacttatgatactgttttgcaaatggaatatttggatatggttgtt1080

aatgaaactttgagattgtttcctattgctatgagattggaaagagtttgcaaaaaagat1140

gttgaaattaatggaatgtttattcctaaaggagttgttgttatgattccttcatatgct1200

ttgcatagagatcctaaatattggactgaacctgaaaaatttttgcctgaaagattttca1260

aaaaaaaataaagataatattgatccttatatttatactccttttggatcaggacctaga1320

aattgcattggaatgagatttgctttgatgaatatgaaattggctttgattagagttttg1380

caaaatttttcatttaaaccttgcaaagaaactcaaattcctttgaaattgtcattggga1440

ggattgttgcaacctgaaaaacctgttgttttgaaagttgaatcaagagatggaactgtt1500

tcaggagct1509

<210>2

<211>503

<212>prt

<213>c细胞色素p450(cyp3a4)人(cytochromep450(cyp3a4)human)

<400>2

metalaleuileproaspleualametgluthrargleuleuleuala

151015

valserleuvalleuleutyrleutyrglythrhisserhisglyleu

202530

phelyslysleuglyileproglyprothrproleupropheleugly

354045

asnileleusertyrhislysglyphecysmetpheaspmetglucys

505560

hislyslystyrglylysvaltrpglyphetyraspglyglnglnpro

65707580

valleualailethraspproaspmetilelysthrvalleuvallys

859095

glucystyrservalphethrasnargargpropheglyprovalgly

100105110

phemetlysseralaileserilealagluaspgluglutrplysarg

115120125

leuargserleuleuserprothrphethrserglylysleulysglu

130135140

metvalproileilealaglntyrglyaspvalleuvalargasnleu

145150155160

argargglualagluthrglylysprovalthrleulysaspvalphe

165170175

glyalatyrsermetaspvalilethrserthrserpheglyvalasn

180185190

ileaspserleuasnasnproglnaspprophevalgluasnthrlys

195200205

lysleuleuargpheasppheleuaspprophepheleuserilethr

210215220

valphepropheleuileproileleugluvalleuasnilecysval

225230235240

pheproarggluvalthrasnpheleuarglysservallysargmet

245250255

lysgluserargleugluaspthrglnlyshisargvalasppheleu

260265270

glnleumetileaspserglnasnserlysgluthrgluserhislys

275280285

alaleuseraspleugluleuvalalaglnserileilepheilephe

290295300

alaglycysgluthrthrserservalleuserpheilemettyrglu

305310315320

leualathrhisproaspvalglnglnlysleuglnglugluileasp

325330335

alavalleuproasnlysalaproprothrtyraspthrvalleugln

340345350

metglutyrleuaspmetvalvalasngluthrleuargleuphepro

355360365

ilealametargleugluargvalcyslyslysaspvalgluileasn

370375380

glymetpheileprolysglyvalvalvalmetileprosertyrala

385390395400

leuhisargaspprolystyrtrpthrgluproglulyspheleupro

405410415

gluargpheserlyslysasnlysaspasnileaspprotyriletyr

420425430

thrpropheglyserglyproargasncysileglymetargpheala

435440445

leumetasnmetlysleualaleuileargvalleuglnasnpheser

450455460

phelysprocyslysgluthrglnileproleulysleuserleugly

465470475480

glyleuleuglnproglulysprovalvalleulysvalgluserarg

485490495

aspglythrvalserglyala

500

<210>3

<211>2040

<212>dna

<213>p450氧化还原酶基因(oxred)人(p450oxidoreductasegene(oxred)human)

<400>3

atgattaatatgggagattcacatgttgatacttcatcaactgtttcagaagctgttgct60

gaagaagtttcattgttttcaatgactgatatgattttgttttcattgattgttggattg120

ttgacttattggtttttgtttagaaaaaaaaaagaagaagttcctgaatttactaaaatt180

caaactttgacttcatcagttagagaatcatcatttgttgaaaaaatgaaaaaaactgga240

agaaatattattgttttttatggatcacaaactggaactgctgaagaatttgctaataga300

ttgtcaaaagatgctcatagatatggaatgagaggaatgtcagctgatcctgaagaatat360

gatttggctgatttgtcatcattgcctgaaattgataatgctttggttgttttttgcatg420

gctacttatggagaaggagatcctactgataatgctcaagatttttatgattggttgcaa480

gaaactgatgttgatttgtcaggagttaaatttgctgtttttggattgggaaataaaact540

tatgaacattttaatgctatgggaaaatatgttgataaaagattggaacaattgggagct600

caaagaatttttgaattgggattgggagatgatgatggaaatttggaagaagattttatt660

acttggagagaacaattttggttggctgtttgcgaacattttggagttgaagctactgga720

gaagaatcatcaattagacaatatgaattggttgttcatactgatattgatgctgctaaa780

gtttatatgggagaaatgggaagattgaaatcatatgaaaatcaaaaacctccttttgat840

gctaaaaatccttttttggctgctgttactactaatagaaaattgaatcaaggaactgaa900

agacatttgatgcatttggaattggatatttcagattcaaaaattagatatgaatcagga960

gatcatgttgctgtttatcctgctaatgattcagctttggttaatcaattgggaaaaatt1020

ttgggagctgatttggatgttgttatgtcattgaataatttggatgaagaatcaaataaa1080

aaacatccttttccttgccctacttcatatagaactgctttgacttattatttggatatt1140

actaatcctcctagaactaatgttttgtatgaattggctcaatatgcttcagaaccttca1200

gaacaagaattgttgagaaaaatggcttcatcatcaggagaaggaaaagaattgtatttg1260

tcatgggttgttgaagctagaagacatattttggctattttgcaagattgcccttcattg1320

agacctcctattgatcatttgtgcgaattgttgcctagattgcaagctagatattattca1380

attgcttcatcatcaaaagttcatcctaattcagttcatatttgcgctgttgttgttgaa1440

tatgaaactaaagctggaagaattaataaaggagttgctactaattggttgagagctaaa1500

gaacctgttggagaaaatggaggaagagctttggttcctatgtttgttagaaaatcacaa1560

tttagattgccttttaaagctactactcctgttattatggttggacctggaactggagtt1620

gctccttttattggatttattcaagaaagagcttggttgagacaacaaggaaaagaagtt1680

ggagaaactttgttgtattatggatgcagaagatcagatgaagattatttgtatagagaa1740

gaattggctcaatttcatagagatggagctttgactcaattgaatgttgctttttcaaga1800

gaacaatcacataaagtttatgttcaacatttgttgaaacaagatagagaacatttgtgg1860

aaattgattgaaggaggagctcatatttatgtttgcggagatgctagaaatatggctaga1920

gatgttcaaaatactttttatgatattgttgctgaattgggagctatggaacatgctcaa1980

gctgttgattatattaaaaaattgatgactaaaggaagatattcattggatgtttggtca2040

<210>4

<211>680

<212>prt

<213>p450氧化还原酶人(p450oxidoreductasehuman)

<400>4

metileasnmetglyaspserhisvalaspthrserserthrvalser

151015

glualavalalaglugluvalserleuphesermetthraspmetile

202530

leupheserleuilevalglyleuleuthrtyrtrppheleuphearg

354045

lyslyslysglugluvalprogluphethrlysileglnthrleuthr

505560

serservalarggluserserphevalglulysmetlyslysthrgly

65707580

argasnileilevalphetyrglyserglnthrglythralagluglu

859095

phealaasnargleuserlysaspalahisargtyrglymetarggly

100105110

metseralaaspprogluglutyraspleualaaspleuserserleu

115120125

progluileaspasnalaleuvalvalphecysmetalathrtyrgly

130135140

gluglyaspprothraspasnalaglnaspphetyrasptrpleugln

145150155160

gluthraspvalaspleuserglyvallysphealavalpheglyleu

165170175

glyasnlysthrtyrgluhispheasnalametglylystyrvalasp

180185190

lysargleugluglnleuglyalaglnargilephegluleuglyleu

195200205

glyaspaspaspglyasnleuglugluasppheilethrtrpargglu

210215220

glnphetrpleualavalcysgluhispheglyvalglualathrgly

225230235240

glugluserserileargglntyrgluleuvalvalhisthraspile

245250255

aspalaalalysvaltyrmetglyglumetglyargleulyssertyr

260265270

gluasnglnlyspropropheaspalalysasnpropheleualaala

275280285

valthrthrasnarglysleuasnglnglythrgluarghisleumet

290295300

hisleugluleuaspileseraspserlysileargtyrglusergly

305310315320

asphisvalalavaltyrproalaasnaspseralaleuvalasngln

325330335

leuglylysileleuglyalaaspleuaspvalvalmetserleuasn

340345350

asnleuaspglugluserasnlyslyshispropheprocysprothr

355360365

sertyrargthralaleuthrtyrtyrleuaspilethrasnpropro

370375380

argthrasnvalleutyrgluleualaglntyralasergluproser

385390395400

gluglngluleuleuarglysmetalaserserserglygluglylys

405410415

gluleutyrleusertrpvalvalglualaargarghisileleuala

420425430

ileleuglnaspcysproserleuargproproileasphisleucys

435440445

gluleuleuproargleuglnalaargtyrtyrserilealaserser

450455460

serlysvalhisproasnservalhisilecysalavalvalvalglu

465470475480

tyrgluthrlysalaglyargileasnlysglyvalalathrasntrp

485490495

leuargalalysgluprovalglygluasnglyglyargalaleuval

500505510

prometphevalarglysserglnpheargleuprophelysalathr

515520525

thrprovalilemetvalglyproglythrglyvalalapropheile

530535540

glypheileglngluargalatrpleuargglnglnglylysgluval

545550555560

glygluthrleuleutyrtyrglycysargargseraspgluasptyr

565570575

leutyrargglugluleualaglnphehisargaspglyalaleuthr

580585590

glnleuasnvalalapheserarggluglnserhislysvaltyrval

595600605

glnhisleuleulysglnasparggluhisleutrplysleuileglu

610615620

glyglyalahisiletyrvalcysglyaspalaargasnmetalaarg

625630635640

aspvalglnasnthrphetyraspilevalalagluleuglyalamet

645650655

gluhisalaglnalavalasptyrilelyslysleumetthrlysgly

660665670

argtyrserleuaspvaltrpser

675680

<210>5

<211>1554

<212>dna

<213>大麻二醇酸(cbda)合酶cannabissativa(cannabidiolicacid(cbda)synthasecannabissativa)

<400>5

atgaatcctcgagaaaacttccttaaatgcttctcgcaatatattcccaataatgcaaca60

aatctaaaactcgtatacactcaaaacaacccattgtatatgtctgtcctaaattcgaca120

atacacaatcttagattcacctctgacacaaccccaaaaccacttgttatcgtcactcct180

tcacatgtctctcatatccaaggcactattctatgctccaagaaagttggcttgcagatt240

cgaactcgaagtggtggtcatgattctgagggcatgtcctacatatctcaagtcccattt300

gttatagtagacttgagaaacatgcgttcaatcaaaatagatgttcatagccaaactgca360

tgggttgaagccggagctacccttggagaagtttattattgggttaatgagaaaaatgag420

aatcttagtttggcggctgggtattgccctactgtttgcgcaggtggacactttggtgga480

ggaggctatggaccattgatgagaaactatggcctcgcggctgataatatcattgatgca540

cacttagtcaacgttcatggaaaagtgctagatcgaaaatctatgggggaagatctcttt600

tgggctttacgtggtggtggagcagaaagcttcggaatcattgtagcatggaaaattaga660

ctggttgctgtcccaaagtctactatgtttagtgttaaaaagatcatggagatacatgag720

cttgtcaagttagttaacaaatggcaaaatattgcttacaagtatgacaaagatttatta780

ctcatgactcacttcataactaggaacattacagataatcaagggaagaataagacagca840

atacacacttacttctcttcagttttccttggtggagtggatagtctagtcgacttgatg900

aacaagagttttcctgagttgggtattaaaaaaacggattgcagacaattgagctggatt960

gatactatcatcttctatagtggtgttgtaaattacgacactgataattttaacaaggaa1020

attttgcttgatagatccgctgggcagaacggtgctttcaagattaagttagactacgtt1080

aagaaaccaattccagaatctgtatttgtccaaattttggaaaaattatatgaagaagat1140

ataggagctgggatgtatgcgttgtacccttacggtggtataatggatgagatttcagaa1200

tcagcaattccattccctcatcgagctggaatcttgtatgagttatggtacatatgtagt1260

tgggagaagcaagaagataacgaaaagcatctaaactggattagaaatatttataacttc1320

atgactccttatgtgtccaaaaattcaagattggcatatctcaattatagagaccttgat1380

ataggaataaatgatcccaagaatccaaataattacacacaagcacgtatttggggtgag1440

aagtattttggtaaaaattttgacaggctagtaaaagtgaaaaccctggttgatcccaat1500

aacttttttagaaacgaacaaagcatcccacctcaaccacggcatcgtcattaa1554

<210>6

<211>517

<212>prt

<213>大麻二醇酸(cbda)合酶cannabissativa(cannabidiolicacid(cbda)synthasecannabissativa)

<400>6

metasnproarggluasnpheleulyscyspheserglntyrilepro

151015

asnasnalathrasnleulysleuvaltyrthrglnasnasnproleu

202530

tyrmetservalleuasnserthrilehisasnleuargphethrser

354045

aspthrthrprolysproleuvalilevalthrproserhisvalser

505560

hisileglnglythrileleucysserlyslysvalglyleuglnile

65707580

argthrargserglyglyhisaspsergluglymetsertyrileser

859095

glnvalprophevalilevalaspleuargasnmetargserilelys

100105110

ileaspvalhisserglnthralatrpvalglualaglyalathrleu

115120125

glygluvaltyrtyrtrpvalasnglulysasngluasnleuserleu

130135140

alaalaglytyrcysprothrvalcysalaglyglyhispheglygly

145150155160

glyglytyrglyproleumetargasntyrglyleualaalaaspasn

165170175

ileileaspalahisleuvalasnvalhisglylysvalleuasparg

180185190

lyssermetglygluaspleuphetrpalaleuargglyglyglyala

195200205

gluserpheglyileilevalalatrplysileargleuvalalaval

210215220

prolysserthrmetpheservallyslysilemetgluilehisglu

225230235240

leuvallysleuvalasnlystrpglnasnilealatyrlystyrasp

245250255

lysaspleuleuleumetthrhispheilethrargasnilethrasp

260265270

asnglnglylysasnlysthralailehisthrtyrpheserserval

275280285

pheleuglyglyvalaspserleuvalaspleumetasnlysserphe

290295300

progluleuglyilelyslysthraspcysargglnleusertrpile

305310315320

aspthrileilephetyrserglyvalvalasntyraspthraspasn

325330335

pheasnlysgluileleuleuaspargseralaglyglnasnglyala

340345350

phelysilelysleuasptyrvallyslysproileprogluserval

355360365

phevalglnileleuglulysleutyrglugluaspileglyalagly

370375380

mettyralaleutyrprotyrglyglyilemetaspgluileserglu

385390395400

seralailepropheprohisargalaglyileleutyrgluleutrp

405410415

tyrilecyssertrpglulysglngluaspasnglulyshisleuasn

420425430

trpileargasniletyrasnphemetthrprotyrvalserlysasn

435440445

serargleualatyrleuasntyrargaspleuaspileglyileasn

450455460

aspprolysasnproasnasntyrthrglnalaargiletrpglyglu

465470475480

lystyrpheglylysasnpheaspargleuvallysvallysthrleu

485490495

valaspproasnasnphepheargasngluglnserileproprogln

500505510

proarghisarghis

515

<210>7

<211>1374

<212>dna

<213>udp糖基转移酶76g1甜叶菊(udpglycosyltransferase76g1steviarebaudiana)

<400>7

atggaaaataaaactgaaactactgttagaagaagaagaagaattattttgtttcctgtt60

ccttttcaaggacatattaatcctattttgcaattggctaatgttttgtattcaaaagga120

ttttcaattactatttttcatactaattttaataaacctaaaacttcaaattatcctcat180

tttacttttagatttattttggataatgatcctcaagatgaaagaatttcaaatttgcct240

actcatggacctttggctggaatgagaattcctattattaatgaacatggagctgatgaa300

ttgagaagagaattggaattgttgatgttggcttcagaagaagatgaagaagtttcatgc360

ttgattactgatgctttgtggtattttgctcaatcagttgctgattcattgaatttgaga420

agattggttttgatgacttcatcattgtttaattttcatgctcatgtttcattgcctcaa480

tttgatgaattgggatatttggatcctgatgataaaactagattggaagaacaagcttca540

ggatttcctatgttgaaagttaaagatattaaatcagcttattcaaattggcaaattttg600

aaagaaattttgggaaaaatgattaaacaaactagagcttcatcaggagttatttggaat660

tcatttaaagaattggaagaatcagaattggaaactgttattagagaaattcctgctcct720

tcatttttgattcctttgcctaaacatttgactgcttcatcatcatcattgttggatcat780

gatagaactgtttttcaatggttggatcaacaacctccttcatcagttttgtatgtttca840

tttggatcaacttcagaagttgatgaaaaagattttttggaaattgctagaggattggtt900

gattcaaaacaatcatttttgtgggttgttagacctggatttgttaaaggatcaacttgg960

gttgaacctttgcctgatggatttttgggagaaagaggaagaattgttaaatgggttcct1020

caacaagaagttttggctcatggagctattggagctttttggactcattcaggatggaat1080

tcaactttggaatcagtttgcgaaggagttcctatgattttttcagattttggattggat1140

caacctttgaatgctagatatatgtcagatgttttgaaagttggagtttatttggaaaat1200

ggatgggaaagaggagaaattgctaatgctattagaagagttatggttgatgaagaagga1260

gaatatattagacaaaatgctagagttttgaaacaaaaagctgatgtttcattgatgaaa1320

ggaggatcatcatatgaatcattggaatcattggtttcatatatttcatcattg1374

<210>8

<211>458

<212>prt

<213>udp糖基转移酶76g1甜叶菊(udpglycosyltransferase76g1steviarebaudiana)

<400>8

metgluasnlysthrgluthrthrvalargargargargargileile

151015

leupheprovalpropheglnglyhisileasnproileleuglnleu

202530

alaasnvalleutyrserlysglypheserilethrilephehisthr

354045

asnpheasnlysprolysthrserasntyrprohisphethrphearg

505560

pheileleuaspasnaspproglnaspgluargileserasnleupro

65707580

thrhisglyproleualaglymetargileproileileasngluhis

859095

glyalaaspgluleuargarggluleugluleuleumetleualaser

100105110

glugluaspglugluvalsercysleuilethraspalaleutrptyr

115120125

phealaglnservalalaaspserleuasnleuargargleuvalleu

130135140

metthrserserleupheasnphehisalahisvalserleuprogln

145150155160

pheaspgluleuglytyrleuaspproaspasplysthrargleuglu

165170175

gluglnalaserglypheprometleulysvallysaspilelysser

180185190

alatyrserasntrpglnileleulysgluileleuglylysmetile

195200205

lysglnthrargalaserserglyvaliletrpasnserphelysglu

210215220

leugluglusergluleugluthrvalilearggluileproalapro

225230235240

serpheleuileproleuprolyshisleuthralaserserserser

245250255

leuleuasphisaspargthrvalpheglntrpleuaspglnglnpro

260265270

proserservalleutyrvalserpheglyserthrsergluvalasp

275280285

glulysasppheleugluilealaargglyleuvalaspserlysgln

290295300

serpheleutrpvalvalargproglyphevallysglyserthrtrp

305310315320

valgluproleuproaspglypheleuglygluargglyargileval

325330335

lystrpvalproglnglngluvalleualahisglyalaileglyala

340345350

phetrpthrhisserglytrpasnserthrleugluservalcysglu

355360365

glyvalprometilepheserasppheglyleuaspglnproleuasn

370375380

alaargtyrmetseraspvalleulysvalglyvaltyrleugluasn

385390395400

glytrpgluargglygluilealaasnalaileargargvalmetval

405410415

aspglugluglyglutyrileargglnasnalaargvalleulysgln

420425430

lysalaaspvalserleumetlysglyglysersertyrgluserleu

435440445

gluserleuvalsertyrileserserleu

450455

<210>9

<211>1965

<212>dna

<213>abc转运蛋白abcg2人(abctransporterabcg2human)

<400>9

atgtcatcatcaaatgttgaagtttttattcctgtttcacaaggaaatactaatggattt60

cctgctactgcttcaaatgatttgaaagcttttactgaaggagctgttttgtcatttcat120

aatatttgctatagagttaaattgaaatcaggatttttgccttgcagaaaacctgttgaa180

aaagaaattttgtcaaatattaatggaattatgaaacctggattgaatgctattttggga240

cctactggaggaggaaaatcatcattgttggatgttttggctgctagaaaagatccttca300

ggattgtcaggagatgttttgattaatggagctcctagacctgctaattttaaatgcaat360

tcaggatatgttgttcaagatgatgttgttatgggaactttgactgttagagaaaatttg420

caattttcagctgctttgagattggctactactatgactaatcatgaaaaaaatgaaaga480

attaatagagttattcaagaattgggattggataaagttgctgattcaaaagttggaact540

caatttattagaggagtttcaggaggagaaagaaaaagaacttcaattggaatggaattg600

attactgatccttcaattttgtttttggatgaacctactactggattggattcatcaact660

gctaatgctgttttgttgttgttgaaaagaatgtcaaaacaaggaagaactattattttt720

tcaattcatcaacctagatattcaatttttaaattgtttgattcattgactttgttggct780

tcaggaagattgatgtttcatggacctgctcaagaagctttgggatattttgaatcagct840

ggatatcattgcgaagcttataataatcctgctgatttttttttggatattattaatgga900

gattcaactgctgttgctttgaatagagaagaagattttaaagctactgaaattattgaa960

ccttcaaaacaagataaacctttgattgaaaaattggctgaaatttatgttaattcatca1020

ttttataaagaaactaaagctgaattgcatcaattgtcaggaggagaaaaaaaaaaaaaa1080

attactgtttttaaagaaatttcatatactacttcattttgccatcaattgagatgggtt1140

tcaaaaagatcatttaaaaatttgttgggaaatcctcaagcttcaattgctcaaattatt1200

gttactgttgttttgggattggttattggagctatttattttggattgaaaaatgattca1260

actggaattcaaaatagagctggagttttgttttttttgactactaatcaatgcttttca1320

tcagtttcagctgttgaattgtttgttgttgaaaaaaaattgtttattcatgaatatatt1380

tcaggatattatagagtttcatcatattttttgggaaaattgttgtcagatttgttgcct1440

atgagaatgttgccttcaattatttttacttgcattgtttattttatgttgggattgaaa1500

gctaaagctgatgctttttttgttatgatgtttactttgatgatggttgcttattcagct1560

tcatcaatggctttggctattgctgctggacaatcagttgtttcagttgctactttgttg1620

atgactatttgctttgtttttatgatgattttttcaggattgttggttaatttgactact1680

attgcttcatggttgtcatggttgcaatatttttcaattcctagatatggatttactgct1740

ttgcaacataatgaatttttgggacaaaatttttgccctggattgaatgctactggaaat1800

aatccttgcaattatgctacttgcactggagaagaatatttggttaaacaaggaattgat1860

ttgtcaccttggggattgtggaaaaatcatgttgctttggcttgcatgattgttattttt1920

ttgactattgcttatttgaaattgttgtttttgaaaaaatattca1965

<210>10

<211>655

<212>prt

<213>abc转运蛋白abcg2人(abctransporterabcg2human)

<400>10

metserserserasnvalgluvalpheileprovalserglnglyasn

151015

thrasnglypheproalathralaserasnaspleulysalaphethr

202530

gluglyalavalleuserphehisasnilecystyrargvallysleu

354045

lysserglypheleuprocysarglysprovalglulysgluileleu

505560

serasnileasnglyilemetlysproglyleuasnalaileleugly

65707580

prothrglyglyglylysserserleuleuaspvalleualaalaarg

859095

lysaspproserglyleuserglyaspvalleuileasnglyalapro

100105110

argproalaasnphelyscysasnserglytyrvalvalglnaspasp

115120125

valvalmetglythrleuthrvalarggluasnleuglnpheserala

130135140

alaleuargleualathrthrmetthrasnhisglulysasngluarg

145150155160

ileasnargvalileglngluleuglyleuasplysvalalaaspser

165170175

lysvalglythrglnpheileargglyvalserglyglygluarglys

180185190

argthrserileglymetgluleuilethraspproserileleuphe

195200205

leuaspgluprothrthrglyleuaspserserthralaasnalaval

210215220

leuleuleuleulysargmetserlysglnglyargthrileilephe

225230235240

serilehisglnproargtyrserilephelysleupheaspserleu

245250255

thrleuleualaserglyargleumetphehisglyproalaglnglu

260265270

alaleuglytyrphegluseralaglytyrhiscysglualatyrasn

275280285

asnproalaaspphepheleuaspileileasnglyaspserthrala

290295300

valalaleuasnargglugluaspphelysalathrgluileileglu

305310315320

proserlysglnasplysproleuileglulysleualagluiletyr

325330335

valasnserserphetyrlysgluthrlysalagluleuhisglnleu

340345350

serglyglyglulyslyslyslysilethrvalphelysgluileser

355360365

tyrthrthrserphecyshisglnleuargtrpvalserlysargser

370375380

phelysasnleuleuglyasnproglnalaserilealaglnileile

385390395400

valthrvalvalleuglyleuvalileglyalailetyrpheglyleu

405410415

lysasnaspserthrglyileglnasnargalaglyvalleuphephe

420425430

leuthrthrasnglncyspheserservalseralavalgluleuphe

435440445

valvalglulyslysleupheilehisglutyrileserglytyrtyr

450455460

argvalsersertyrpheleuglylysleuleuseraspleuleupro

465470475480

metargmetleuproserileilephethrcysilevaltyrphemet

485490495

leuglyleulysalalysalaaspalaphephevalmetmetphethr

500505510

leumetmetvalalatyrseralasersermetalaleualaileala

515520525

alaglyglnservalvalservalalathrleuleumetthrilecys

530535540

phevalphemetmetilepheserglyleuleuvalasnleuthrthr

545550555560

ilealasertrpleusertrpleuglntyrpheserileproargtyr

565570575

glyphethralaleuglnhisasnglupheleuglyglnasnphecys

580585590

proglyleuasnalathrglyasnasnprocysasntyralathrcys

595600605

thrglygluglutyrleuvallysglnglyileaspleuserprotrp

610615620

glyleutrplysasnhisvalalaleualacysmetilevalilephe

625630635640

leuthrilealatyrleulysleuleupheleulyslystyrser

645650655

<210>11

<211>1074

<212>dna

<213>myb12大麻(myb12cannabis)

<400>11

atgaagaagaacaaatcaactagtaataataagaacaacaacagtaataatatcatcaaa60

aacgacatcgtatcatcatcatcatcaacaacaacaacatcatcaacaactacagcaaca120

tcatcatttcataatgagaaagttactgtcagtactgatcatattattaatcttgatgat180

aagcagaaacgacaattatgtcgttgtcgtttagaaaaagaagaagaagaagaaggaagt240

ggtggttgtggtgagacagtagtaatgatgctagggtcagtatctcctgctgctgctact300

gctgctgcagctgggggctcatcaagttgtgatgaagacatgttgggtggtcatgatcaa360

ctgttgttgttgtgttgttctgagaaaaaaacgacagaaatttcatcagtggtgaacttt420

aataataataataataataataaggaaaatggtgacgaagtttcaggaccgtacgattat480

catcatcataaagaagaggaagaagaagaagaagaagatgaagcatctgcatcagtagca540

gctgttgatgaagggatgttgttgtgctttgatgacataatagatagccacttgctaaat600

ccaaatgaggttttgactttaagagaagatagccataatgaaggtggggcagctgatcag660

attgacaagactacttgtaataatactactattactactaatgatgattataacaataac720

ttgatgatgttgagctgcaataataacggagattatgttattagtgatgatcatgatgat780

cagtactggatagacgacgtcgttggagttgacttttggagttgggagagttcgactact840

actgttattacccaagaacaagaacaagaacaagatcaagttcaagaacagaagaatatg900

tgggataatgagaaagagaaactgttgtctttgctatgggataatagtgataacagcagc960

agttgggagttacaagataaaagcaataataataataataataatgttcctaacaaatgt1020

caagagattacctctgataaagaaaatgctatggttgcatggcttctctcctga1074

<210>12

<211>357

<212>prt

<213>myb12大麻(myb12cannabis)

<400>12

metlyslysasnlysserthrserasnasnlysasnasnasnserasn

151015

asnileilelysasnaspilevalserserserserserthrthrthr

202530

thrserserthrthrthralathrserserphehisasnglulysval

354045

thrvalserthrasphisileileasnleuaspasplysglnlysarg

505560

glnleucysargcysargleuglulysgluglugluglugluglyser

65707580

glyglycysglygluthrvalvalmetmetleuglyservalserpro

859095

alaalaalathralaalaalaalaglyglysersersercysaspglu

100105110

aspmetleuglyglyhisaspglnleuleuleuleucyscysserglu

115120125

lyslysthrthrgluileserservalvalasnpheasnasnasnasn

130135140

asnasnasnlysgluasnglyaspgluvalserglyprotyrasptyr

145150155160

hishishislysglugluglugluglugluglugluaspglualaser

165170175

alaservalalaalavalaspgluglymetleuleucyspheaspasp

180185190

ileileaspserhisleuleuasnproasngluvalleuthrleuarg

195200205

gluaspserhisasngluglyglyalaalaaspglnileasplysthr

210215220

thrcysasnasnthrthrilethrthrasnaspasptyrasnasnasn

225230235240

leumetmetleusercysasnasnasnglyasptyrvalileserasp

245250255

asphisaspaspglntyrtrpileaspaspvalvalglyvalaspphe

260265270

trpsertrpgluserserthrthrthrvalilethrglngluglnglu

275280285

glngluglnaspglnvalglngluglnlysasnmettrpaspasnglu

290295300

lysglulysleuleuserleuleutrpaspasnseraspasnserser

305310315320

sertrpgluleuglnasplysserasnasnasnasnasnasnasnval

325330335

proasnlyscysglngluilethrserasplysgluasnalametval

340345350

alatrpleuleuser

355

<210>13

<211>1476

<212>dna

<213>过氧化氢酶拟南芥(catalasearabidopsisthaliana)

<400>13

atggatccttataaatatagacctgcttcatcatataattcacctttttttactactaat60

tcaggagctcctgtttggaataataattcatcaatgactgttggacctagaggattgatt120

ttgttggaagattatcatttggttgaaaaattggctaattttgatagagaaagaattcct180

gaaagagttgttcatgctagaggagcttcagctaaaggattttttgaagttactcatgat240

atttcaaatttgacttgcgctgattttttgagagctcctggagttcaaactcctgttatt300

gttagattttcaactgttattcatgctagaggatcacctgaaactttgagagatcctaga360

ggatttgctgttaaattttatactagagaaggaaattttgatttggttggaaataatttt420

cctgttttttttattagagatggaatgaaatttcctgatattgttcatgctttgaaacct480

aatcctaaatcacatattcaagaaaattggagaattttggattttttttcacatcatcct540

gaatcattgaatatgtttacttttttgtttgatgatattggaattcctcaagattataga600

catatggatggatcaggagttaatacttatatgttgattaataaagctggaaaagctcat660

tatgttaaatttcattggaaacctacttgcggagttaaatcattgttggaagaagatgct720

attagattgggaggaactaatcattcacatgctactcaagatttgtatgattcaattgct780

gctggaaattatcctgaatggaaattgtttattcaaattattgatcctgctgatgaagat840

aaatttgattttgatcctttggatgttactaaaacttggcctgaagatattttgcctttg900

caacctgttggaagaatggttttgaataaaaatattgataatttttttgctgaaaatgaa960

caattggctttttgccctgctattattgttcctggaattcattattcagatgataaattg1020

ttgcaaactagagttttttcatatgctgatactcaaagacatagattgggacctaattat1080

ttgcaattgcctgttaatgctcctaaatgcgctcatcataataatcatcatgaaggattt1140

atgaattttatgcatagagatgaagaagttaattattttccttcaagatatgatcaagtt1200

agacatgctgaaaaatatcctactcctcctgctgtttgctcaggaaaaagagaaagatgc1260

attattgaaaaagaaaataattttaaagaacctggagaaagatatagaacttttactcct1320

gaaagacaagaaagatttattcaaagatggattgatgctttgtcagatcctagaattact1380

catgaaattagatcaatttggatttcatattggtcacaagctgataaatcattgggacaa1440

aaattggcttcaagattgaatgttagaccttcaatt1476

<210>14

<211>492

<212>prt

<213>过氧化氢酶拟南芥(catalasearabidopsisthaliana)

<400>14

metaspprotyrlystyrargproalasersertyrasnserprophe

151015

phethrthrasnserglyalaprovaltrpasnasnasnsersermet

202530

thrvalglyproargglyleuileleuleugluasptyrhisleuval

354045

glulysleualaasnpheasparggluargileprogluargvalval

505560

hisalaargglyalaseralalysglyphephegluvalthrhisasp

65707580

ileserasnleuthrcysalaasppheleuargalaproglyvalgln

859095

thrprovalilevalargpheserthrvalilehisalaargglyser

100105110

progluthrleuargaspproargglyphealavallysphetyrthr

115120125

arggluglyasnpheaspleuvalglyasnasnpheprovalphephe

130135140

ileargaspglymetlyspheproaspilevalhisalaleulyspro

145150155160

asnprolysserhisileglngluasntrpargileleuaspphephe

165170175

serhishisprogluserleuasnmetphethrpheleupheaspasp

180185190

ileglyileproglnasptyrarghismetaspglyserglyvalasn

195200205

thrtyrmetleuileasnlysalaglylysalahistyrvallysphe

210215220

histrplysprothrcysglyvallysserleuleuglugluaspala

225230235240

ileargleuglyglythrasnhisserhisalathrglnaspleutyr

245250255

aspserilealaalaglyasntyrproglutrplysleupheilegln

260265270

ileileaspproalaaspgluasplyspheasppheaspproleuasp

275280285

valthrlysthrtrpprogluaspileleuproleuglnprovalgly

290295300

argmetvalleuasnlysasnileaspasnphephealagluasnglu

305310315320

glnleualaphecysproalaileilevalproglyilehistyrser

325330335

aspasplysleuleuglnthrargvalphesertyralaaspthrgln

340345350

arghisargleuglyproasntyrleuglnleuprovalasnalapro

355360365

lyscysalahishisasnasnhishisgluglyphemetasnphemet

370375380

hisargaspglugluvalasntyrpheproserargtyraspglnval

385390395400

arghisalaglulystyrprothrproproalavalcysserglylys

405410415

arggluargcysileileglulysgluasnasnphelysgluprogly

420425430

gluargtyrargthrphethrprogluargglngluargpheilegln

435440445

argtrpileaspalaleuseraspproargilethrhisgluilearg

450455460

seriletrpilesertyrtrpserglnalaasplysserleuglygln

465470475480

lysleualaserargleuasnvalargproserile

485490

<210>15

<211>2262

<212>dna

<213>过氧化氢酶hpii(kate)大肠杆菌(catalasehpii(kate)escherichiacoli)

<400>15

atgtcgcaacataacgaaaagaacccacatcagcaccagtcaccactacacgattccagc60

gaagcgaaaccggggatggactcactggcacctgaggacggctctcatcgtccagcggct120

gaaccaacaccgccaggtgcacaacctaccgccccagggagcctgaaagcccctgatacg180

cgtaacgaaaaacttaattctctggaagacgtacgcaaaggcagtgaaaattatgcgctg240

accactaatcagggcgtgcgcatcgccgacgatcaaaactcactgcgtgccggtagccgt300

ggtccaacgctgctggaagattttattctgcgcgagaaaatcacccactttgaccatgag360

cgcattccggaacgtattgttcatgcacgcggatcagccgctcacggttatttccagcca420

tataaaagcttaagcgatattaccaaagcggatttcctctcagatccgaacaaaatcacc480

ccagtatttgtacgtttctctaccgttcagggtggtgctggctctgctgataccgtgcgt540

gatatccgtggctttgccaccaagttctataccgaagagggtatttttgacctcgttggc600

aataacacgccaatcttctttatccaggatgcgcataaattccccgattttgttcatgcg660

gtaaaaccagaaccgcactgggcaattccacaagggcaaagtgcccacgatactttctgg720

gattatgtttctctgcaacctgaaactctgcacaacgtgatgtgggcgatgtcggatcgc780

ggcatcccccgcagttaccgcaccatggaaggcttcggtattcacaccttccgcctgatt840

aatgccgaagggaaggcaacgtttgtacgtttccactggaaaccactggcaggtaaagcc900

tcactcgtttgggatgaagcacaaaaactcaccggacgtgacccggacttccaccgccgc960

gagttgtgggaagccattgaagcaggcgattttccggaatacgaactgggcttccagttg1020

attcctgaagaagatgaattcaagttcgacttcgatcttctcgatccaaccaaacttatc1080

ccggaagaactggtgcccgttcagcgtgtcggcaaaatggtgctcaatcgcaacccggat1140

aacttctttgctgaaaacgaacaggcggctttccatcctgggcatatcgtgccgggactg1200

gacttcaccaacgatccgctgttgcagggacgtttgttctcctataccgatacacaaatc1260

agtcgtcttggtgggccgaatttccatgagattccgattaaccgtccgacctgcccttac1320

cataatttccagcgtgacggcatgcatcgcatggggatcgacactaacccggcgaattac1380

gaaccgaactcgattaacgataactggccgcgcgaaacaccgccggggccgaaacgcggc1440

ggttttgaatcataccaggagcgcgtggaaggcaataaagttcgcgagcgcagcccatcg1500

tttggcgaatattattcccatccgcgtctgttctggctaagtcagacgccatttgagcag1560

cgccatattgtcgatggtttcagttttgagttaagcaaagtcgttcgtccgtatattcgt1620

gagcgcgttgttgaccagctggcgcatattgatctcactctggcccaggcggtggcgaaa1680

aatctcggtatcgaactgactgacgaccagctgaatatcaccccacctccggacgtcaac1740

ggtctgaaaaaggatccatccttaagtttgtacgccattcctgacggtgatgtgaaaggt1800

cgcgtggtagcgattttacttaatgatgaagtgagatcggcagaccttctggccattctc1860

aaggcgctgaaggccaaaggcgttcatgccaaactgctctactcccgaatgggtgaagtg1920

actgcggatgacggtacggtgttgcctatagccgctacctttgccggtgcaccttcgctg1980

acggtcgatgcggtcattgtcccttgcggcaatatcgcggatatcgctgacaacggcgat2040

gccaactactacctgatggaagcctacaaacaccttaaaccgattgcgctggcgggtgac2100

gcgcgcaagtttaaagcaacaatcaagatcgctgaccagggtgaagaagggattgtggaa2160

gctgacagcgctgacggtagttttatggatgaactgctaacgctgatggcagcacaccgc2220

gtgtggtcacgcattcctaagattgacaaaattcctgcctga2262

<210>16

<211>753

<212>prt

<213>过氧化氢酶hpii(kate)大肠杆菌(catalasehpii(kate)escherichiacoli)

<400>16

metserglnhisasnglulysasnprohisglnhisglnserproleu

151015

hisaspserserglualalysproglymetaspserleualaproglu

202530

aspglyserhisargproalaalagluprothrproproglyalagln

354045

prothralaproglyserleulysalaproaspthrargasnglulys

505560

leuasnserleugluaspvalarglysglysergluasntyralaleu

65707580

thrthrasnglnglyvalargilealaaspaspglnasnserleuarg

859095

alaglyserargglyprothrleuleugluasppheileleuargglu

100105110

lysilethrhispheasphisgluargileprogluargilevalhis

115120125

alaargglyseralaalahisglytyrpheglnprotyrlysserleu

130135140

seraspilethrlysalaasppheleuseraspproasnlysilethr

145150155160

provalphevalargpheserthrvalglnglyglyalaglyserala

165170175

aspthrvalargaspileargglyphealathrlysphetyrthrglu

180185190

gluglyilepheaspleuvalglyasnasnthrproilephepheile

195200205

glnaspalahislyspheproaspphevalhisalavallysproglu

210215220

prohistrpalaileproglnglyglnseralahisaspthrphetrp

225230235240

asptyrvalserleuglnprogluthrleuhisasnvalmettrpala

245250255

metseraspargglyileproargsertyrargthrmetgluglyphe

260265270

glyilehisthrpheargleuileasnalagluglylysalathrphe

275280285

valargphehistrplysproleualaglylysalaserleuvaltrp

290295300

aspglualaglnlysleuthrglyargaspproaspphehisargarg

305310315320

gluleutrpglualaileglualaglyasppheproglutyrgluleu

325330335

glypheglnleuileproglugluaspgluphelyspheasppheasp

340345350

leuleuaspprothrlysleuileproglugluleuvalprovalgln

355360365

argvalglylysmetvalleuasnargasnproaspasnphepheala

370375380

gluasngluglnalaalaphehisproglyhisilevalproglyleu

385390395400

aspphethrasnaspproleuleuglnglyargleuphesertyrthr

405410415

aspthrglnileserargleuglyglyproasnphehisgluilepro

420425430

ileasnargprothrcysprotyrhisasnpheglnargaspglymet

435440445

hisargmetglyileaspthrasnproalaasntyrgluproasnser

450455460

ileasnaspasntrpproarggluthrproproglyprolysarggly

465470475480

glypheglusertyrglngluargvalgluglyasnlysvalargglu

485490495

argserproserpheglyglutyrtyrserhisproargleuphetrp

500505510

leuserglnthrprophegluglnarghisilevalaspglypheser

515520525

phegluleuserlysvalvalargprotyrilearggluargvalval

530535540

aspglnleualahisileaspleuthrleualaglnalavalalalys

545550555560

asnleuglyilegluleuthraspaspglnleuasnilethrpropro

565570575

proaspvalasnglyleulyslysaspproserleuserleutyrala

580585590

ileproaspglyaspvallysglyargvalvalalaileleuleuasn

595600605

aspgluvalargseralaaspleuleualaileleulysalaleulys

610615620

alalysglyvalhisalalysleuleutyrserargmetglygluval

625630635640

thralaaspaspglythrvalleuproilealaalathrphealagly

645650655

alaproserleuthrvalaspalavalilevalprocysglyasnile

660665670

alaaspilealaaspasnglyaspalaasntyrtyrleumetgluala

675680685

tyrlyshisleulysproilealaleualaglyaspalaarglysphe

690695700

lysalathrilelysilealaaspglnglyglugluglyilevalglu

705710715720

alaaspseralaaspglyserphemetaspgluleuleuthrleumet

725730735

alaalahisargvaltrpserargileprolysileasplysilepro

740745750

ala

<210>17

<211>1635

<212>dna

<213>毛状体靶向cbda合酶大麻(trichome-targetedcbdasynthasecannabis)

<400>17

atgaagtgctcaacattctccttttggtttgtttgcaagataatatttttctttttctca60

ttcaatatccaaacttccattgctaatcctcgagaaaacttccttaaatgcttctcgcaa120

tatattcccaataatgcaacaaatctaaaactcgtatacactcaaaacaacccattgtat180

atgtctgtcctaaattcgacaatacacaatcttagattcacctctgacacaaccccaaaa240

ccacttgttatcgtcactccttcacatgtctctcatatccaaggcactattctatgctcc300

aagaaagttggcttgcagattcgaactcgaagtggtggtcatgattctgagggcatgtcc360

tacatatctcaagtcccatttgttatagtagacttgagaaacatgcgttcaatcaaaata420

gatgttcatagccaaactgcatgggttgaagccggagctacccttggagaagtttattat480

tgggttaatgagaaaaatgagaatcttagtttggcggctgggtattgccctactgtttgc540

gcaggtggacactttggtggaggaggctatggaccattgatgagaaactatggcctcgcg600

gctgataatatcattgatgcacacttagtcaacgttcatggaaaagtgctagatcgaaaa660

tctatgggggaagatctcttttgggctttacgtggtggtggagcagaaagcttcggaatc720

attgtagcatggaaaattagactggttgctgtcccaaagtctactatgtttagtgttaaa780

aagatcatggagatacatgagcttgtcaagttagttaacaaatggcaaaatattgcttac840

aagtatgacaaagatttattactcatgactcacttcataactaggaacattacagataat900

caagggaagaataagacagcaatacacacttacttctcttcagttttccttggtggagtg960

gatagtctagtcgacttgatgaacaagagttttcctgagttgggtattaaaaaaacggat1020

tgcagacaattgagctggattgatactatcatcttctatagtggtgttgtaaattacgac1080

actgataattttaacaaggaaattttgcttgatagatccgctgggcagaacggtgctttc1140

aagattaagttagactacgttaagaaaccaattccagaatctgtatttgtccaaattttg1200

gaaaaattatatgaagaagatataggagctgggatgtatgcgttgtacccttacggtggt1260

ataatggatgagatttcagaatcagcaattccattccctcatcgagctggaatcttgtat1320

gagttatggtacatatgtagttgggagaagcaagaagataacgaaaagcatctaaactgg1380

attagaaatatttataacttcatgactccttatgtgtccaaaaatccaagattggcatat1440

ctcaattatagagaccttgatataggaataaatgatcccaagaatccaaataattacaca1500

caagcacgtatttggggtgagaagtattttggtaaaaattttgacaggctagtaaaagtg1560

aaaaccctggttgatcccaataacttttttagaaacgaacaaagcatcccacctctacca1620

cggcatcgtcattaa1635

<210>18

<211>544

<212>prt

<213>毛状体靶向cbda合酶大麻(trichome-targetedcbdasynthasecannabis)

<400>18

metlyscysserthrpheserphetrpphevalcyslysileilephe

151015

phephepheserpheasnileglnthrserilealaasnproargglu

202530

asnpheleulyscyspheserglntyrileproasnasnalathrasn

354045

leulysleuvaltyrthrglnasnasnproleutyrmetservalleu

505560

asnserthrilehisasnleuargphethrseraspthrthrprolys

65707580

proleuvalilevalthrproserhisvalserhisileglnglythr

859095

ileleucysserlyslysvalglyleuglnileargthrargsergly

100105110

glyhisaspsergluglymetsertyrileserglnvalpropheval

115120125

ilevalaspleuargasnmetargserilelysileaspvalhisser

130135140

glnthralatrpvalglualaglyalathrleuglygluvaltyrtyr

145150155160

trpvalasnglulysasngluasnleuserleualaalaglytyrcys

165170175

prothrvalcysalaglyglyhispheglyglyglyglytyrglypro

180185190

leumetargasntyrglyleualaalaaspasnileileaspalahis

195200205

leuvalasnvalhisglylysvalleuasparglyssermetglyglu

210215220

aspleuphetrpalaleuargglyglyglyalagluserpheglyile

225230235240

ilevalalatrplysileargleuvalalavalprolysserthrmet

245250255

pheservallyslysilemetgluilehisgluleuvallysleuval

260265270

asnlystrpglnasnilealatyrlystyrasplysaspleuleuleu

275280285

metthrhispheilethrargasnilethraspasnglnglylysasn

290295300

lysthralailehisthrtyrpheserservalpheleuglyglyval

305310315320

aspserleuvalaspleumetasnlysserpheprogluleuglyile

325330335

lyslysthraspcysargglnleusertrpileaspthrileilephe

340345350

tyrserglyvalvalasntyraspthraspasnpheasnlysgluile

355360365

leuleuaspargseralaglyglnasnglyalaphelysilelysleu

370375380

asptyrvallyslysproileprogluservalphevalglnileleu

385390395400

glulysleutyrglugluaspileglyalaglymettyralaleutyr

405410415

protyrglyglyilemetaspgluilesergluseralaileprophe

420425430

prohisargalaglyileleutyrgluleutrptyrilecyssertrp

435440445

glulysglngluaspasnglulyshisleuasntrpileargasnile

450455460

tyrasnphemetthrprotyrvalserlysasnproargleualatyr

465470475480

leuasntyrargaspleuaspileglyileasnaspprolysasnpro

485490495

asnasntyrthrglnalaargiletrpglyglulystyrpheglylys

500505510

asnpheaspargleuvallysvallysthrleuvalaspproasnasn

515520525

phepheargasngluglnserileproproleuproarghisarghis

530535540

<210>19

<211>1467

<212>dna

<213>毛状体靶向udp糖基转移酶76g1甜叶菊(trichome-targestedudpglycosyltransferase76g1steviarebaudiana)

<400>19

atgaagtgctcaacattctccttttggtttgtttgcaagataatatttttctttttctca60

ttcaatatccaaacttccattgctaatcctcgagaaaataaaactgaaactactgttaga120

agaagaagaagaattattttgtttcctgttccttttcaaggacatattaatcctattttg180

caattggctaatgttttgtattcaaaaggattttcaattactatttttcatactaatttt240

aataaacctaaaacttcaaattatcctcattttacttttagatttattttggataatgat300

cctcaagatgaaagaatttcaaatttgcctactcatggacctttggctggaatgagaatt360

cctattattaatgaacatggagctgatgaattgagaagagaattggaattgttgatgttg420

gcttcagaagaagatgaagaagtttcatgcttgattactgatgctttgtggtattttgct480

caatcagttgctgattcattgaatttgagaagattggttttgatgacttcatcattgttt540

aattttcatgctcatgtttcattgcctcaatttgatgaattgggatatttggatcctgat600

gataaaactagattggaagaacaagcttcaggatttcctatgttgaaagttaaagatatt660

aaatcagcttattcaaattggcaaattttgaaagaaattttgggaaaaatgattaaacaa720

actagagcttcatcaggagttatttggaattcatttaaagaattggaagaatcagaattg780

gaaactgttattagagaaattcctgctccttcatttttgattcctttgcctaaacatttg840

actgcttcatcatcatcattgttggatcatgatagaactgtttttcaatggttggatcaa900

caacctccttcatcagttttgtatgtttcatttggatcaacttcagaagttgatgaaaaa960

gattttttggaaattgctagaggattggttgattcaaaacaatcatttttgtgggttgtt1020

agacctggatttgttaaaggatcaacttgggttgaacctttgcctgatggatttttggga1080

gaaagaggaagaattgttaaatgggttcctcaacaagaagttttggctcatggagctatt1140

ggagctttttggactcattcaggatggaattcaactttggaatcagtttgcgaaggagtt1200

cctatgattttttcagattttggattggatcaacctttgaatgctagatatatgtcagat1260

gttttgaaagttggagtttatttggaaaatggatgggaaagaggagaaattgctaatgct1320

attagaagagttatggttgatgaagaaggagaatatattagacaaaatgctagagttttg1380

aaacaaaaagctgatgtttcattgatgaaaggaggatcatcatatgaatcattggaatca1440

ttggtttcatatatttcatcattgtaa1467

<210>20

<211>488

<212>prt

<213>毛状体靶向udp糖基转移酶76g1甜叶菊(trichome-targestedudpglycosyltransferase76g1steviarebaudiana)

<400>20

metlyscysserthrpheserphetrpphevalcyslysileilephe

151015

phephepheserpheasnileglnthrserilealaasnproargglu

202530

asnlysthrgluthrthrvalargargargargargileileleuphe

354045

provalpropheglnglyhisileasnproileleuglnleualaasn

505560

valleutyrserlysglypheserilethrilephehisthrasnphe

65707580

asnlysprolysthrserasntyrprohisphethrpheargpheile

859095

leuaspasnaspproglnaspgluargileserasnleuprothrhis

100105110

glyproleualaglymetargileproileileasngluhisglyala

115120125

aspgluleuargarggluleugluleuleumetleualasergluglu

130135140

aspglugluvalsercysleuilethraspalaleutrptyrpheala

145150155160

glnservalalaaspserleuasnleuargargleuvalleumetthr

165170175

serserleupheasnphehisalahisvalserleuproglnpheasp

180185190

gluleuglytyrleuaspproaspasplysthrargleugluglugln

195200205

alaserglypheprometleulysvallysaspilelysseralatyr

210215220

serasntrpglnileleulysgluileleuglylysmetilelysgln

225230235240

thrargalaserserglyvaliletrpasnserphelysgluleuglu

245250255

glusergluleugluthrvalilearggluileproalaproserphe

260265270

leuileproleuprolyshisleuthralaserserserserleuleu

275280285

asphisaspargthrvalpheglntrpleuaspglnglnproproser

290295300

servalleutyrvalserpheglyserthrsergluvalaspglulys

305310315320

asppheleugluilealaargglyleuvalaspserlysglnserphe

325330335

leutrpvalvalargproglyphevallysglyserthrtrpvalglu

340345350

proleuproaspglypheleuglygluargglyargilevallystrp

355360365

valproglnglngluvalleualahisglyalaileglyalaphetrp

370375380

thrhisserglytrpasnserthrleugluservalcysgluglyval

385390395400

prometilepheserasppheglyleuaspglnproleuasnalaarg

405410415

tyrmetseraspvalleulysvalglyvaltyrleugluasnglytrp

420425430

gluargglygluilealaasnalaileargargvalmetvalaspglu

435440445

gluglyglutyrileargglnasnalaargvalleulysglnlysala

450455460

aspvalserleumetlysglyglysersertyrgluserleugluser

465470475480

leuvalsertyrileserserleu

485

<210>21

<211>1022

<212>dna

<213>pm-utri拟南芥(pm-utriarabidopsisthaliana)

<400>21

atggaggtccatggctccggattccgtcgaattctgttgttggcgttgtgtatctccggg60

atctggtccgcctacatctaccaaggcgttcttcaagagactctgtccacgaagagattt120

ggtccagatgagaagaggttcgagcatcttgcattcttgaacttagctcaaagtgtagtc180

tgcttgatctggtcttatataatgatcaagctctggtcaaatgctggtaacggtggagca240

ccatggtggacgtattggagtgcaggcattactaatacaattggtcctgccatgggaatt300

gaagccttgaagtatatcagttatccagctcaggttttggcaaaatcgtcaaaaatgatt360

ccagttatgctaatgggaactttagtttacggaataagatacactttccctgaatacatg420

tgcacctttcttgtcgctggaggagtatccatctttgctcttcttaagacaagctctaag480

acaattagcaagctagcacatccaaatgctcccctcggttacgcactttgttccttaaac540

ctcgcctttgacggattcacaaatgccacacaagactccattgcctcaaggtacccaaaa600

accgaagcgtgggacataatgctgggaatgaacttatggggcacaatatacaacattatc660

tacatgtttggcttgccacaagggatggattcgaagcaattcagttctgtaagctacacc720

cggaagcggcatgggacattctaaagtattgtatatgcggtgccgtgggacaaaacttca780

tcttcatgacaataagtaacttcgggtcactagctaacacgaccataaccacgaccagga840

agtttgttagcattgttgtatcatcagtaatgagcggaaatccattgtcgttgaagcaat900

ggggatgtgtttcgatggtctttggtggtttggcatatcaaatttatcttaaatggaaga960

aattgcagagagtggagtgctccataatgaacttaatgtgtgggtctacctgcgccgctt1020

ga1022

<210>22

<211>1554

<212>dna

<213>细胞溶质cbda合酶(cytcbda)cannabissativa(cytostoliccbdasynthase(cytcbdas)cannabissativa)

<400>22

atgaatcctcgagaaaacttccttaaatgcttctcgcaatatattcccaataatgcaaca60

aatctaaaactcgtatacactcaaaacaacccattgtatatgtctgtcctaaattcgaca120

atacacaatcttagattcacctctgacacaaccccaaaaccacttgttatcgtcactcct180

tcacatgtctctcatatccaaggcactattctatgctccaagaaagttggcttgcagatt240

cgaactcgaagtggtggtcatgattctgagggcatgtcctacatatctcaagtcccattt300

gttatagtagacttgagaaacatgcgttcaatcaaaatagatgttcatagccaaactgca360

tgggttgaagccggagctacccttggagaagtttattattgggttaatgagaaaaatgag420

aatcttagtttggcggctgggtattgccctactgtttgcgcaggtggacactttggtgga480

ggaggctatggaccattgatgagaaactatggcctcgcggctgataatatcattgatgca540

cacttagtcaacgttcatggaaaagtgctagatcgaaaatctatgggggaagatctcttt600

tgggctttacgtggtggtggagcagaaagcttcggaatcattgtagcatggaaaattaga660

ctggttgctgtcccaaagtctactatgtttagtgttaaaaagatcatggagatacatgag720

cttgtcaagttagttaacaaatggcaaaatattgcttacaagtatgacaaagatttatta780

ctcatgactcacttcataactaggaacattacagataatcaagggaagaataagacagca840

atacacacttacttctcttcagttttccttggtggagtggatagtctagtcgacttgatg900

aacaagagttttcctgagttgggtattaaaaaaacggattgcagacaattgagctggatt960

gatactatcatcttctatagtggtgttgtaaattacgacactgataattttaacaaggaa1020

attttgcttgatagatccgctgggcagaacggtgctttcaagattaagttagactacgtt1080

aagaaaccaattccagaatctgtatttgtccaaattttggaaaaattatatgaagaagat1140

ataggagctgggatgtatgcgttgtacccttacggtggtataatggatgagatttcagaa1200

tcagcaattccattccctcatcgagctggaatcttgtatgagttatggtacatatgtagt1260

tgggagaagcaagaagataacgaaaagcatctaaactggattagaaatatttataacttc1320

atgactccttatgtgtccaaaaatccaagattggcatatctcaattatagagaccttgat1380

ataggaataaatgatcccaagaatccaaataattacacacaagcacgtatttggggtgag1440

aagtattttggtaaaaattttgacaggctagtaaaagtgaaaaccctggttgatcccaat1500

aacttttttagaaacgaacaaagcatcccacctctaccacggcatcgtcattaa1554

<210>23

<211>517

<212>prt

<213>细胞溶质cbda合酶(cytcbda)cannabissativa(cytostoliccbdasynthase(cytcbdas)cannabissativa)

<400>23

metasnproarggluasnpheleulyscyspheserglntyrilepro

151015

asnasnalathrasnleulysleuvaltyrthrglnasnasnproleu

202530

tyrmetservalleuasnserthrilehisasnleuargphethrser

354045

aspthrthrprolysproleuvalilevalthrproserhisvalser

505560

hisileglnglythrileleucysserlyslysvalglyleuglnile

65707580

argthrargserglyglyhisaspsergluglymetsertyrileser

859095

glnvalprophevalilevalaspleuargasnmetargserilelys

100105110

ileaspvalhisserglnthralatrpvalglualaglyalathrleu

115120125

glygluvaltyrtyrtrpvalasnglulysasngluasnleuserleu

130135140

alaalaglytyrcysprothrvalcysalaglyglyhispheglygly

145150155160

glyglytyrglyproleumetargasntyrglyleualaalaaspasn

165170175

ileileaspalahisleuvalasnvalhisglylysvalleuasparg

180185190

lyssermetglygluaspleuphetrpalaleuargglyglyglyala

195200205

gluserpheglyileilevalalatrplysileargleuvalalaval

210215220

prolysserthrmetpheservallyslysilemetgluilehisglu

225230235240

leuvallysleuvalasnlystrpglnasnilealatyrlystyrasp

245250255

lysaspleuleuleumetthrhispheilethrargasnilethrasp

260265270

asnglnglylysasnlysthralailehisthrtyrpheserserval

275280285

pheleuglyglyvalaspserleuvalaspleumetasnlysserphe

290295300

progluleuglyilelyslysthraspcysargglnleusertrpile

305310315320

aspthrileilephetyrserglyvalvalasntyraspthraspasn

325330335

pheasnlysgluileleuleuaspargseralaglyglnasnglyala

340345350

phelysilelysleuasptyrvallyslysproileprogluserval

355360365

phevalglnileleuglulysleutyrglugluaspileglyalagly

370375380

mettyralaleutyrprotyrglyglyilemetaspgluileserglu

385390395400

seralailepropheprohisargalaglyileleutyrgluleutrp

405410415

tyrilecyssertrpglulysglngluaspasnglulyshisleuasn

420425430

trpileargasniletyrasnphemetthrprotyrvalserlysasn

435440445

proargleualatyrleuasntyrargaspleuaspileglyileasn

450455460

aspprolysasnproasnasntyrthrglnalaargiletrpglyglu

465470475480

lystyrpheglylysasnpheaspargleuvallysvallysthrleu

485490495

valaspproasnasnphepheargasngluglnserileproproleu

500505510

proarghisarghis

515

<210>24

<211>1377

<212>dna

<213>细胞溶质靶向udp糖基转移酶76g1(cytutg)甜叶菊(cytostolic-targetedudpglycosyltransferase76g1(cytutg)steviarebaudiana)

<400>24

atggaaaataaaaccgaaaccaccgtccgccgtcgtcgccgtatcattctgttcccggtc60

ccgttccagggccacatcaacccgattctgcaactggcgaacgtgctgtattcgaaaggt120

ttcagcatcaccatcttccatacgaacttcaacaagccgaagaccagcaattacccgcac180

tttacgttccgttttattctggataacgacccgcaggatgaacgcatctctaatctgccg240

acccacggcccgctggcgggtatgcgtattccgattatcaacgaacacggcgcagatgaa300

ctgcgtcgcgaactggaactgctgatgctggccagcgaagaagatgaagaagtttcttgc360

ctgatcaccgacgcactgtggtattttgcccagtctgttgcagatagtctgaacctgcgt420

cgcctggtcctgatgaccagcagcctgttcaattttcatgcccacgttagtctgccgcag480

ttcgatgaactgggttatctggacccggatgacaaaacccgcctggaagaacaggcgagc540

ggctttccgatgctgaaagtcaaggatattaagtcagcgtactcgaactggcagattctg600

aaagaaatcctgggtaaaatgattaagcaaaccaaagcaagttccggcgtcatctggaat660

agtttcaaagaactggaagaatccgaactggaaacggtgattcgtgaaatcccggctccg720

agttttctgattccgctgccgaagcatctgaccgcgagcagcagcagcctgctggatcac780

gaccgcacggtgtttcagtggctggatcagcaaccgccgagttccgtgctgtatgttagc840

ttcggtagtacctcggaagtggatgaaaaggactttctggaaatcgctcgtggcctggtt900

gatagcaaacaatctttcctgtgggtggttcgcccgggttttgtgaagggctctacgtgg960

gttgaaccgctgccggacggcttcctgggtgaacgtggccgcattgtcaaatgggtgccg1020

cagcaagaagtgctggcgcatggcgcgattggcgcgttttggacccactccggttggaac1080

tcaacgctggaatcggtttgtgaaggtgtcccgatgattttctcagattttggcctggac1140

cagccgctgaatgcacgttatatgtcggatgttctgaaagtcggtgtgtacctggaaaac1200

ggttgggaacgcggcgaaattgcgaatgccatccgtcgcgttatggtcgatgaagaaggc1260

gaatacattcgtcagaatgctcgcgtcctgaaacaaaaggcggacgtgagcctgatgaaa1320

ggcggttcatcgtatgaaagtctggaatccctggtttcatacatcagctctctgtaa1377

<210>25

<211>458

<212>prt

<213>细胞溶质靶向udp糖基转移酶76g1(cytutg)甜叶菊(cytostolic-targetedudpglycosyltransferase76g1(cytutg)steviarebaudiana)

<400>25

metgluasnlysthrgluthrthrvalargargargargargileile

151015

leupheprovalpropheglnglyhisileasnproileleuglnleu

202530

alaasnvalleutyrserlysglypheserilethrilephehisthr

354045

asnpheasnlysprolysthrserasntyrprohisphethrphearg

505560

pheileleuaspasnaspproglnaspgluargileserasnleupro

65707580

thrhisglyproleualaglymetargileproileileasngluhis

859095

glyalaaspgluleuargarggluleugluleuleumetleualaser

100105110

glugluaspglugluvalsercysleuilethraspalaleutrptyr

115120125

phealaglnservalalaaspserleuasnleuargargleuvalleu

130135140

metthrserserleupheasnphehisalahisvalserleuprogln

145150155160

pheaspgluleuglytyrleuaspproaspasplysthrargleuglu

165170175

gluglnalaserglypheprometleulysvallysaspilelysser

180185190

alatyrserasntrpglnileleulysgluileleuglylysmetile

195200205

lysglnthrlysalaserserglyvaliletrpasnserphelysglu

210215220

leugluglusergluleugluthrvalilearggluileproalapro

225230235240

serpheleuileproleuprolyshisleuthralaserserserser

245250255

leuleuasphisaspargthrvalpheglntrpleuaspglnglnpro

260265270

proserservalleutyrvalserpheglyserthrsergluvalasp

275280285

glulysasppheleugluilealaargglyleuvalaspserlysgln

290295300

serpheleutrpvalvalargproglyphevallysglyserthrtrp

305310315320

valgluproleuproaspglypheleuglygluargglyargileval

325330335

lystrpvalproglnglngluvalleualahisglyalaileglyala

340345350

phetrpthrhisserglytrpasnserthrleugluservalcysglu

355360365

glyvalprometilepheserasppheglyleuaspglnproleuasn

370375380

alaargtyrmetseraspvalleulysvalglyvaltyrleugluasn

385390395400

glytrpgluargglygluilealaasnalaileargargvalmetval

405410415

aspglugluglyglutyrileargglnasnalaargvalleulysgln

420425430

lysalaaspvalserleumetlysglyglysersertyrgluserleu

435440445

gluserleuvalsertyrileserserleu

450455

<210>26

<211>485

<212>prt

<213>糖基转移酶(ntgt5a)烟草(glycosyltransferase(ntgt5a)nicotianatabacum)

<400>26

metglyserileglyalagluleuthrlysprohisalavalcysile

151015

protyrproalaglnglyhisileasnprometleulysleualalys

202530

ileleuhishislysglyphehisilethrphevalasnthrgluphe

354045

asnhisargargleuleulysserargglyproaspserleulysgly

505560

leuserserpheargphegluthrileproaspglyleuproprocys

65707580

glualaaspalathrglnaspileproserleucysgluserthrthr

859095

asnthrcysleualapropheargaspleuleualalysleuasnasp

100105110

thrasnthrserasnvalproprovalsercysilevalseraspgly

115120125

valmetserphethrleualaalaalaglngluleuglyvalproglu

130135140

valleuphetrpthrthrseralacysglypheleuglytyrmethis

145150155160

tyrcyslysvalileglulysglytyralaproleulysaspalaser

165170175

aspleuthrasnglytyrleugluthrthrleuasppheileprogly

180185190

metlysaspvalargleuargaspleuproserpheleuargthrthr

195200205

asnproaspgluphemetilelysphevalleuglngluthrgluarg

210215220

alaarglysalaseralaileileleuasnthrphegluthrleuglu

225230235240

alagluvalleugluserleuargasnleuleuproprovaltyrpro

245250255

ileglyproleuhispheleuvallyshisvalaspaspgluasnleu

260265270

lysglyleuargserserleutrplysglugluproglucysilegln

275280285

trpleuaspthrlysgluproasnservalvaltyrvalasnphegly

290295300

serilethrvalmetthrproasnglnleuilegluphealatrpgly

305310315320

leualaasnserglnglnthrpheleutrpileileargproaspile

325330335

valserglyaspalaserileleuproprogluphevalglugluthr

340345350

lysasnargglymetleualasertrpcysserglnglugluvalleu

355360365

serhisproalailevalglypheleuthrhisserglytrpasnser

370375380

thrleugluserileserserglyvalprometilecystrpprophe

385390395400

phealagluglnglnthrasncystrppheservalthrlystrpasp

405410415

valglymetgluileaspseraspvallysargaspgluvalgluser

420425430

leuvalarggluleumetvalglyglylysglylyslysmetlyslys

435440445

lysalametglutrplysgluleualaglualaseralalysgluhis

450455460

serglysersertyrvalasnileglulysleuvalasnaspileleu

465470475480

leuserserlyshis

485

<210>27

<211>1458

<212>dna

<213>糖基转移酶(ntgt5a)烟草(glycosyltransferase(ntgt5a)nicotianatabacum)

<400>27

atgggttccattggtgctgaattaacaaagccacatgcagtttgcataccatatcccgcc60

caaggccatattaaccccatgttaaagctagccaaaatccttcatcacaaaggctttcac120

atcacttttgtcaatactgaatttaaccaccgacgtctccttaaatctcgtggccctgat180

tctctcaagggtctttcttctttccgttttgagaccattcctgatggacttccgccatgt240

gaggcagatgccacacaagatataccttctttgtgtgaatctacaaccaatacttgcttg300

gctccttttagggatcttcttgcgaaactcaatgatactaacacatctaacgtgccaccc360

gtttcgtgcatcgtctcggatggtgtcatgagcttcaccttagccgctgcacaagaattg420

ggagtccctgaagttctgttttggaccactagtgcttgtggtttcttaggttacatgcat480

tactgcaaggttattgaaaaaggatatgctccacttaaagatgcgagtgacttgacaaat540

ggatacctagagacaacattggattttataccaggcatgaaagacgtacgtttaagggat600

cttccaagtttcttgagaactacaaatccagatgaattcatgatcaaatttgtcctccaa660

gaaacagagagagcaagaaaggcttctgcaattatcctcaacacatttgaaacactagag720

gctgaagttcttgaatcgctccgaaatcttcttcctccagtctaccccatagggcccttg780

cattttctagtgaaacatgttgatgatgagaatttgaagggacttagatccagcctttgg840

aaagaggaaccagagtgtatacaatggcttgataccaaagaaccaaattctgttgtttat900

gttaactttggaagcattactgttatgactcctaatcagcttattgagtttgcttgggga960

cttgcaaacagccagcaaacattcttatggatcataagacctgatattgtttcaggtgat1020

gcatcgattcttccacccgaattcgtggaagaaacgaagaacagaggtatgcttgctagt1080

tggtgttcacaagaagaagtacttagtcaccctgcaatagtaggattcttgactcacagt1140

ggatggaattcgacactcgaaagtataagcagtggggtgcctatgatttgctggccattt1200

ttcgctgaacagcaaacaaattgttggttttccgtcactaaatgggatgttggaatggag1260

attgacagtgatgtgaagagagatgaagtggaaagccttgtaagggaattgatggttggg1320

ggaaaaggcaaaaagatgaagaaaaaggcaatggaatggaaggaattggctgaagcatct1380

gctaaagaacattcagggtcatcttatgtgaacattgaaaagttggtcaatgatattctt1440

ctttcatccaaacattaa1458

<210>28

<211>485

<212>prt

<213>糖基转移酶(ntgt5a)烟草(glycosyltransferase(ntgt5a)nicotianatabacum)

<400>28

metglyserileglyalagluphethrlysprohisalavalcysile

151015

protyrproalaglnglyhisileasnprometleulysleualalys

202530

ileleuhishislysglyphehisilethrphevalasnthrgluphe

354045

asnhisargargleuleulysserargglyproaspserleulysgly

505560

leuserserpheargphegluthrileproaspglyleuproprocys

65707580

aspalaaspalathrglnaspileproserleucysgluserthrthr

859095

asnthrcysleuglypropheargaspleuleualalysleuasnasp

100105110

thrasnthrserasnvalproprovalsercysileileseraspgly

115120125

valmetserphethrleualaalaalaglngluleuglyvalproglu

130135140

valleuphetrpthrthrseralacysglypheleuglytyrmethis

145150155160

tyrtyrlysvalileglulysglytyralaproleulysaspalaser

165170175

aspleuthrasnglytyrleugluthrthrleuasppheileprocys

180185190

metlysaspvalargleuargaspleuproserpheleuargthrthr

195200205

asnproaspgluphemetilelysphevalleuglngluthrgluarg

210215220

alaarglysalaseralaileileleuasnthrtyrgluthrleuglu

225230235240

alagluvalleugluserleuargasnleuleuproprovaltyrpro

245250255

ileglyproleuhispheleuvallyshisvalaspaspgluasnleu

260265270

lysglyleuargserserleutrplysglugluproglucysilegln

275280285

trpleuaspthrlysgluproasnservalvaltyrvalasnphegly

290295300

serilethrvalmetthrproasnglnleuilegluphealatrpgly

305310315320

leualaasnserglnglnserpheleutrpileileargproaspile

325330335

valserglyaspalaserileleuproprogluphevalglugluthr

340345350

lyslysargglymetleualasertrpcysserglnglugluvalleu

355360365

serhisproalaileglyglypheleuthrhisserglytrpasnser

370375380

thrleugluserileserserglyvalprometilecystrpprophe

385390395400

phealagluglnglnthrasncystrppheservalthrlystrpasp

405410415

valglymetgluileaspcysaspvallysargaspgluvalgluser

420425430

leuvalarggluleumetvalglyglylysglylyslysmetlyslys

435440445

lysalametglutrplysgluleualaglualaseralalysgluhis

450455460

serglysersertyrvalasnileglulysvalvalasnaspileleu

465470475480

leuserserlyshis

485

<210>29

<211>1458

<212>dna

<213>糖基转移酶(ntgt5a)烟草(glycosyltransferase(ntgt5a)nicotianatabacum)

<400>29

atgggttccattggtgctgaatttacaaagccacatgcagtttgcataccatatcccgcc60

caaggccatattaaccccatgttaaagctagccaaaatccttcatcacaaaggctttcac120

atcacttttgtcaatactgaatttaaccacagacgtctgcttaaatctcgtggccctgat180

tctctcaagggtctttcttctttccgttttgagacaattcctgatggacttccgccatgt240

gatgcagatgccacacaagatataccttctttgtgtgaatctacaaccaatacttgcttg300

ggtccttttagggatcttcttgcgaaactcaatgatactaacacatctaacgtgccaccc360

gtttcgtgcatcatctcagatggtgtcatgagcttcaccttagccgctgcacaagaattg420

ggagtccctgaagttctgttttggaccactagtgcttgtggtttcttaggttacatgcat480

tattacaaggttattgaaaaaggatacgctccacttaaagatgcgagtgacttgacaaat540

ggatacctagagacaacattggattttataccatgcatgaaagacgtacgtttaagggat600

cttccaagtttcttgagaactacaaatccagatgaattcatgatcaaatttgtcctccaa660

gaaacagagagagcaagaaaggcttctgcaattatcctcaacacatatgaaacactagag720

gctgaagttcttgaatcgctccgaaatcttcttcctccagtctaccccattgggcccttg780

cattttctagtgaaacatgttgatgatgagaatttgaagggacttagatccagcctttgg840

aaagaggaaccagagtgtatacaatggcttgataccaaagaaccaaattctgttgtttat900

gttaactttggaagcattactgttatgactcctaatcaacttattgaatttgcttgggga960

cttgcaaacagccaacaatcattcttatggatcataagacctgatattgtttcaggtgat1020

gcatcgattcttccccccgaattcgtggaagaaacgaagaagagaggtatgcttgctagt1080

tggtgttcacaagaagaagtacttagtcaccctgcaataggaggattcttgactcacagt1140

ggatggaattcgacactcgaaagtataagcagtggggtgcctatgatttgctggccattt1200

ttcgctgaacagcaaacaaattgttggttttccgtcactaaatgggatgttggaatggag1260

attgactgtgatgtgaagagggatgaagtggaaagccttgtaagggaattgatggttggg1320

ggaaaaggcaaaaagatgaagaaaaaggcaatggaatggaaggaattggctgaagcatct1380

gctaaagaacattcagggtcatcttatgtgaacattgagaaggtggtcaatgatattctt1440

ctttcgtccaaacattaa1458

<210>30

<211>496

<212>prt

<213>udp-糖基转移酶73c3(ntgt4)烟草(udp-glycosyltransferase73c3(ntgt4)nicotianatabacum)

<400>30

metalathrglnvalhislysleuhispheileleupheproleumet

151015

alaproglyhismetileprometileaspilealalysleuleuala

202530

asnargglyvalilethrthrileilethrthrprovalasnalaasn

354045

argpheserserthrilethrargalailelysserglyleuargile

505560

glnileleuthrleulyspheproservalgluvalglyleuproglu

65707580

glycysgluasnileaspmetleuproserleuaspleualaserlys

859095

phephealaalailesermetleulysglnglnvalgluasnleuleu

100105110

gluglyileasnproserprosercysvalileseraspmetglyphe

115120125

protrpthrthrglnilealaglnasnpheasnileproargileval

130135140

phehisglythrcyscyspheserleuleucyssertyrlysileleu

145150155160

serserasnileleugluasnilethrseraspserglutyrpheval

165170175

valproaspleuproaspargvalgluleuthrlysalaglnvalser

180185190

glyserthrlysasnthrthrservalserserservalleulysglu

195200205

valthrgluglnileargleualagluglusersertyrglyvalile

210215220

valasnserpheglugluleugluglnvaltyrglulysglutyrarg

225230235240

lysalaargglylyslysvaltrpcysvalglyprovalserleucys

245250255

asnlysgluilegluaspleuvalthrargglyasnlysthralaile

260265270

aspasnglnaspcysleulystrpleuaspasnphegluthrgluser

275280285

valvaltyralaserleuglyserleuserargleuthrleuleugln

290295300

metvalgluleuglyleuglyleuglugluserasnargpropheval

305310315320

trpvalleuglyglyglyasplysleuasnaspleuglulystrpile

325330335

leugluasnglyphegluglnargilelysgluargglyvalleuile

340345350

argglytrpalaproglnvalleuileleuserhisproalailegly

355360365

glyvalleuthrhiscysglytrpasnserthrleugluglyileser

370375380

alaglyleuprometvalthrtrpproleuphealagluglnphecys

385390395400

asnglulysleuvalvalglnvalleulysileglyvalserleugly

405410415

vallysvalprovallystrpglyaspglugluasnvalglyvalleu

420425430

vallyslysaspaspvallyslysalaleuasplysleumetaspglu

435440445

glyglugluglyglnvalargargthrlysalalysgluleuglyglu

450455460

leualalyslysalapheglygluglyglysersertyrvalasnleu

465470475480

thrserleuilegluaspileilegluglnglnasnhislysglulys

485490495

<210>31

<211>1491

<212>dna

<213>udp-糖基转移酶73c3(ntgt4)烟草(udp-glycosyltransferase73c3(ntgt4)nicotianatabacum)

<400>31

atggcaactcaagtgcacaaacttcatttcatactattccctttaatggctccaggccac60

atgattcctatgatagacatagctaaacttctagcaaatcgcggtgtcattaccactatc120

atcaccactccagtaaacgccaatcgtttcagttcaacaattactcgtgccataaaatcc180

ggtctaagaatccaaattcttacactcaaatttccaagtgtagaagtaggattaccagaa240

ggttgcgaaaatattgacatgcttccttctcttgacttggcttcaaagttttttgctgca300

attagtatgctgaaacaacaagttgaaaatctcttagaaggaataaatccaagtccaagt360

tgtgttatttcagatatgggatttccttggactactcaaattgcacaaaattttaatatc420

ccaagaattgtttttcatggtacttgttgtttctcacttttatgttcctataaaatactt480

tcctccaacattcttgaaaatataacctcagattcagagtattttgttgttcctgattta540

cccgatagagttgaactaacgaaagctcaggtttcaggatcgacgaaaaatactacttct600

gttagttcttctgtattgaaagaagttactgagcaaatcagattagccgaggaatcatca660

tatggtgtaattgttaatagttttgaggagttggagcaagtgtatgagaaagaatatagg720

aaagctagagggaaaaaagtttggtgtgttggtcctgtttctttgtgtaataaggaaatt780

gaagatttggttacaaggggtaataaaactgcaattgataatcaagattgcttgaaatgg840

ttagataattttgaaacagaatctgtggtttatgcaagtcttggaagtttatctcgtttg900

acattattgcaaatggtggaacttggtcttggtttagaagagtcaaataggccttttgta960

tgggtattaggaggaggtgataaattaaatgatttagagaaatggattcttgagaatgga1020

tttgagcaaagaattaaagaaagaggagttttgattagaggatgggctcctcaagtgctt1080

atactttcacaccctgcaattggtggagtattgactcattgcggatggaattctacattg1140

gaaggtatttcagcaggattaccaatggtaacatggccactatttgctgagcaattttgc1200

aatgagaagttagtagtccaagtgctaaaaattggagtgagcctaggtgtgaaggtgcct1260

gtcaaatggggagatgaggaaaatgttggagttttggtaaaaaaggatgatgttaagaaa1320

gcattagacaaactaatggatgaaggagaagaaggacaagtaagaagaacaaaagcaaaa1380

gagttaggagaattggctaaaaaggcatttggagaaggtggttcttcttatgttaactta1440

acatctctgattgaagacatcattgagcaacaaaatcacaaggaaaaatag1491

<210>32

<211>479

<212>prt

<213>糖基转移酶(ntgt1b)烟草(glycosyltransferase(ntgt1b)nicotianatabacum)

<400>32

metlysthralagluleuvalpheileproalaproglymetglyhis

151015

leuvalprothrvalgluvalalalysglnleuvalasparghisglu

202530

glnleuserilethrvalleuilemetthrileproleugluthrasn

354045

ileprosertyrthrlysserleuserserasptyrserserargile

505560

thrleuleuproleuserglnprogluthrservalthrmetserser

65707580

pheasnalaileasnphepheglutyrilesersertyrlysglyarg

859095

vallysaspalavalsergluthrserpheserserserasnserval

100105110

lysleualaglyphevalileaspmetphecysthralametileasp

115120125

valalaasnglupheglyileprosertyrvalphetyrthrserser

130135140

alaalametleuglyleuglnleuhispheglnserleuserileglu

145150155160

cysserprolysvalhisasntyrvalgluproglusergluvalleu

165170175

ileserthrtyrmetasnprovalprovallyscysleuproglyile

180185190

ileleuvalasnaspgluserserthrmetphevalasnhisalaarg

195200205

argphearggluthrlysglyilemetvalasnthrphethrgluleu

210215220

gluserhisalaleulysalaleuseraspaspglulysilepropro

225230235240

iletyrprovalglyproileleuasnleugluasnglyasngluasp

245250255

hisasnglnglutyraspalailemetlystrpleuaspglulyspro

260265270

asnserservalvalpheleucyspheglyserlysglyserpheglu

275280285

gluaspglnvallysgluilealaasnalaleugluserserglytyr

290295300

hispheleutrpserleuargargproproprolysasplysleugln

305310315320

pheprosergluphegluasnproglugluvalleuprogluglyphe

325330335

pheglnargthrlysglyargglylysvalileglytrpalaprogln

340345350

leualaileleuserhisproservalglyglyphevalserhiscys

355360365

glytrpasnserthrleugluservalargserglyvalproileala

370375380

thrtrpproleutyralagluglnglnserasnalapheglnleuval

385390395400

lysaspleuglymetalavalgluilelysmetasptyrarggluasp

405410415

pheasnthrargasnproproleuvallysalaglugluilegluasp

420425430

glyilearglysleumetaspsergluasnlysileargalalysval

435440445

thrglumetlysasplysserargalaalaleuleugluglyglyser

450455460

sertyrvalalaleuglyhisphevalgluthrvalmetlysasn

465470475

<210>33

<211>1440

<212>dna

<213>糖基转移酶(ntgt1b)烟草(glycosyltransferase(ntgt1b)nicotianatabacum)

<400>33

atgaagacagcagagttagtattcattcctgctcctgggatgggtcaccttgtaccaact60

gtggaggtggcaaagcaactagtcgacagacacgagcagctttcgatcacagttctaatc120

atgacaattcctttggaaacaaatattccatcatatactaaatcactgtcctcagactac180

agttctcgtataacgctgcttccactctctcaacctgagacctctgttactatgagcagt240

tttaatgccatcaatttttttgagtacatctccagctacaagggtcgtgtcaaagatgct300

gttagtgaaacctcctttagttcgtcaaattctgtgaaacttgcaggatttgtaatagac360

atgttctgcactgcgatgattgatgtagcgaacgagtttggaatcccaagttatgtgttc420

tacacttctagtgcagctatgcttggactacaactgcattttcaaagtcttagcattgaa480

tgcagtccgaaagttcataactacgttgaacctgaatcagaagttctgatctcaacttac540

atgaatccggttccagtcaaatgtttgcccggaattatactagtaaatgatgaaagtagc600

accatgtttgtcaatcatgcacgaagattcagggagacgaaaggaattatggtgaacacg660

ttcactgagcttgaatcacacgctttgaaagccctttccgatgatgaaaaaatcccacca720

atctacccagttggacctatacttaaccttgaaaatgggaatgaagatcacaatcaagaa780

tatgatgcgattatgaagtggcttgacgagaagcctaattcatcagtggtgttcttatgc840

tttggaagcaaggggtctttcgaagaagatcaggtgaaggaaatagcaaatgctctagag900

agcagtggctaccacttcttgtggtcgctaaggcgaccgccaccaaaagacaagctacaa960

ttcccaagcgaattcgagaatccagaggaagtcttaccagagggattctttcaaaggact1020

aaaggaagaggaaaggtgataggatgggcaccccagttggctattttgtctcatccttca1080

gtaggaggattcgtgtcgcattgtgggtggaattcaactctggagagcgttcgaagtgga1140

gtgccgatagcaacatggccattgtatgcagagcaacagagcaatgcatttcaactggtg1200

aaggatttgggtatggcagtagagattaagatggattacagggaagattttaatacgaga1260

aatccaccactggttaaagctgaggagatagaagatggaattaggaagctgatggattca1320

gagaataaaatcagggctaaggtgacggagatgaaggacaaaagtagagcagcactgctg1380

gagggcggatcatcatatgtagctcttgggcattttgttgagactgtcatgaaaaactag1440

<210>34

<211>478

<212>prt

<213>糖基转移酶(ntgt1a)烟草(glycosyltransferase(ntgt1a)nicotianatabacum)

<400>34

metlysthrthrgluleuvalpheileproalaproglymetglyhis

151015

leuvalprothrvalgluvalalalysglnleuvalaspargaspglu

202530

glnleuserilethrvalleuilemetthrleuproleugluthrasn

354045

ileprosertyrthrlysserleuserserasptyrserserargile

505560

thrleuleuglnleuserglnprogluthrservalsermetserser

65707580

pheasnalaileasnphepheglutyrilesersertyrlysasparg

859095

vallysaspalavalasngluthrpheserserserserservallys

100105110

leulysglyphevalileaspmetphecysthralametileaspval

115120125

alaasnglupheglyileprosertyrvalphetyrthrserasnala

130135140

alametleuglyleuglnleuhispheglnserleuserileglutyr

145150155160

serprolysvalhisasntyrleuaspproglusergluvalalaile

165170175

serthrtyrileasnproileprovallyscysleuproglyileile

180185190

leuaspasnasplysserglythrmetphevalasnhisalaargarg

195200205

phearggluthrlysglyilemetvalasnthrphealagluleuglu

210215220

serhisalaleulysalaleuseraspaspglulysileproproile

225230235240

tyrprovalglyproileleuasnleuglyaspglyasngluasphis

245250255

asnglnglutyraspmetilemetlystrpleuaspgluglnprohis

260265270

serservalvalpheleucyspheglyserlysglyserphegluglu

275280285

aspglnvallysgluilealaasnalaleugluargserglyasnarg

290295300

pheleutrpserleuargargproproprolysaspthrleuglnphe

305310315320

prosergluphegluasnproglugluvalleuprovalglyphephe

325330335

glnargthrlysglyargglylysvalileglytrpalaproglnleu

340345350

alaileleuserhisproalavalglyglyphevalserhiscysgly

355360365

trpasnserthrleugluservalargserglyvalproilealathr

370375380

trpproleutyralagluglnglnserasnalapheglnleuvallys

385390395400

aspleuglymetalavalgluilelysmetasptyrarggluaspphe

405410415

asnlysthrasnproproleuvallysalaglugluilegluaspgly

420425430

ilearglysleumetaspsergluasnlysileargalalysvalmet

435440445

glumetlysasplysserargalaalaleuleugluglyglyserser

450455460

tyrvalalaleuglyhisphevalgluthrvalmetlysasn

465470475

<210>35

<211>1437

<212>dna

<213>糖基转移酶(ntgt1a)烟草(glycosyltransferase(ntgt1a)nicotianatabacum)

<400>35

atgaagacaacagagttagtattcattcctgctcctggcatgggtcaccttgtacccact60

gtggaggtggcaaagcaactagtcgacagagacgaacagctttcaatcacagttctcatc120

atgacgcttcctttggaaacaaatattccatcatatactaaatcactgtcctcagactac180

agttctcgtataacgctgcttcaactttctcaacctgagacctctgttagtatgagcagt240

tttaatgccatcaatttttttgagtacatctccagctacaaggatcgtgtcaaagatgct300

gttaatgaaacctttagttcgtcaagttctgtgaaactcaaaggatttgtaatagacatg360

ttctgcactgcgatgattgatgtggcgaacgagtttggaatcccaagttatgtcttctac420

acttctaatgcagctatgcttggactccaactccattttcaaagtcttagtattgaatac480

agtccgaaagttcataattacctagaccctgaatcagaagtagcgatctcaacttacatt540

aatccgattccagtcaaatgtttgcccgggattatactagacaatgataaaagtggcacc600

atgttcgtcaatcatgcacgaagattcagggagacgaaaggaattatggtgaacacattc660

gctgagcttgaatcacacgctttgaaagccctttccgatgatgagaaaatcccaccaatc720

tacccagttgggcctatacttaaccttggagatgggaatgaagatcacaatcaagaatat780

gatatgattatgaagtggctcgacgagcagcctcattcatcagtggtgttcctatgcttt840

ggaagcaagggatctttcgaagaagatcaagtgaaggaaatagcaaatgctctagagaga900

agtggtaaccggttcttgtggtcgctaagacgaccgccaccaaaagacacgctacaattc960

ccaagcgaattcgagaatccagaggaagtcttgccggtgggattctttcaaaggactaaa1020

ggaagaggaaaggtgataggatgggcaccccagttggctattttgtctcatcctgcagta1080

ggaggattcgtgtcgcattgtgggtggaattcaactttggagagtgttcgtagtggagta1140

ccgatagcaacatggccattgtatgcagagcaacagagcaatgcatttcaactggtgaag1200

gatttggggatggcagtggagattaagatggattacagggaagattttaataagacaaat1260

ccaccactggttaaagctgaggagatagaagatggaattaggaagctgatggattcagag1320

aataaaatcagggctaaggtgatggagatgaaggacaaaagtagagcagcgttattagaa1380

ggcggatcatcatatgtagctctcgggcattttgttgagactgtcatgaaaaactaa1437

<210>36

<211>482

<212>prt

<213>糖基转移酶(ntgt3)烟草(glycosyltransferase(ntgt3)nicotianatabacum)

<400>36

metlysgluthrlyslysilegluleuvalpheileproserprogly

151015

ileglyhisleuvalserthrvalglumetalalysleuleuileala

202530

argglugluglnleuserilethrvalleuileileglntrpproasn

354045

asplyslysleuaspsertyrileglnservalalaasnpheserser

505560

argleulyspheileargleuproglnaspaspserilemetglnleu

65707580

leulysserasnilephethrthrpheilealaserhislysproala

859095

valargaspalavalalaaspileleulyssergluserasnasnthr

100105110

leualaglyilevalileaspleuphecysthrsermetileaspval

115120125

alaasngluphegluleuprothrtyrvalphetyrthrserglyala

130135140

alathrleuglyleuhistyrhisileglnasnleuargaspgluphe

145150155160

asnlysaspilethrlystyrlysaspgluprogluglulysleuser

165170175

ilealathrtyrleuasnpropheproalalyscysleuproserval

180185190

alaleuasplysgluglyglyserthrmetpheleuaspleualalys

195200205

argphearggluthrlysglyilemetileasnthrpheleugluleu

210215220

glusertyralaleuasnserleuserargasplysasnleupropro

225230235240

iletyrprovalglyprovalleuasnleuasnasnvalgluglyasp

245250255

asnleuglyserseraspglnasnthrmetlystrpleuaspaspgln

260265270

proalaserservalvalpheleucyspheglyserglyglyserphe

275280285

glulyshisglnvallysgluilealatyralaleuglusersergly

290295300

cysargpheleutrpserleuargargproprothrgluaspalaarg

305310315320

pheproserasntyrgluasnleuglugluileleuprogluglyphe

325330335

leugluargthrlysglyileglylysvalileglytrpalaprogln

340345350

leualaileleuserhislysserthrglyglyphevalserhiscys

355360365

glytrpasnserthrleugluserthrtyrpheglyvalproileala

370375380

thrtrppromettyralagluglnglnalaasnalapheglnleuval

385390395400

lysaspleuargmetglyvalgluilelysmetasptyrarglysasp

405410415

metlysvalmetglylysgluvalilevallysalaglugluileglu

420425430

lysalailearggluilemetaspserglusergluileargvallys

435440445

vallysglumetlysglulysserargalaalaglnmetgluglygly

450455460

sersertyrthrserileglyglypheileglnileilemetgluasn

465470475480

sergln

<210>37

<211>1449

<212>dna

<213>糖基转移酶(ntgt3)烟草(glycosyltransferase(ntgt3)nicotianatabacum)

<400>37

atgaaagaaaccaagaaaatagagttagtcttcattccttcaccaggaattggccattta60

gtatccacagttgaaatggcaaagcttcttatagctagagaagagcagctatctatcaca120

gtcctcatcatccaatggcctaacgacaagaagctcgattcttatatccaatcagtcgcc180

aatttcagctcgcgtttgaaattcattcgactccctcaggatgattccattatgcagcta240

ctcaaaagcaacattttcaccacgtttattgccagtcataagcctgcagttagagatgct300

gttgctgatattctcaagtcagaatcaaataatacgctagcaggtattgttatcgacttg360

ttctgcacctcaatgatagacgtggccaatgagttcgagctaccaacctatgttttctac420

acgtctggtgcagcaacccttggtcttcattatcatatacagaatctcagggatgaattt480

aacaaagatattaccaagtacaaagacgaacctgaagaaaaactctctatagcaacatat540

ctcaatccatttccagcaaaatgtttgccgtctgtagccttagacaaagaaggtggttca600

acaatgtttcttgatctcgcaaaaaggtttcgagaaaccaaaggtattatgataaacaca660

tttctagagctcgaatcctatgcattaaactcgctctcacgagacaagaatcttccacct720

atataccctgtcggaccagtattgaaccttaacaatgttgaaggtgacaacttaggttca780

tctgaccagaatactatgaaatggttagatgatcagcccgcttcatctgtagtgttcctt840

tgttttggtagtggtggaagctttgaaaaacatcaagttaaggaaatagcctatgctctg900

gagagcagtgggtgtcggtttttgtggtcgttaaggcgaccaccaaccgaagatgcaaga960

tttccaagcaactatgaaaatcttgaagaaattttgccagaaggattcttggaaagaaca1020

aaagggattggaaaagtgataggatgggcacctcagttggcgattttgtcacataaatcg1080

acggggggatttgtgtcgcactgtggatggaattcgactttggaaagtacatattttgga1140

gtgccaatagcaacctggccaatgtacgcggagcaacaagcgaatgcatttcaattggtt1200

aaggatttgagaatgggagttgagattaagatggattataggaaggatatgaaagtgatg1260

ggcaaagaagttatagtgaaagctgaggagattgagaaagcaataagagaaattatggat1320

tccgagagtgaaattcgggtgaaggtgaaagagatgaaggagaagagcagagcagcacaa1380

atggaaggtggctcttcttacacttctattggaggtttcatccaaattatcatggagaat1440

tctcaataa1449

<210>38

<211>470

<212>prt

<213>糖基转移酶(ntgt2)烟草(glycosyltransferase(ntgt2)nicotianatabacum)

<400>38

metvalglnprohisvalleuleuvalthrpheproalaglnglyhis

151015

ileasnprocysleuglnphealalysargleuileargmetglyile

202530

gluvalthrphealathrservalphealahisargargmetalalys

354045

thrthrthrserthrleuserlysglyleuasnphealaalapheser

505560

aspglytyraspaspglyphelysalaaspgluhisaspserglnhis

65707580

tyrmetsergluilelysserargglyserlysthrleulysaspile

859095

ileleulysserseraspgluglyargprovalthrserleuvaltyr

100105110

serleuleuleuprotrpalaalalysvalalaarggluphehisile

115120125

procysalaleuleutrpileglnproalathrvalleuaspiletyr

130135140

tyrtyrtyrpheasnglytyrgluaspalailelysglyserthrasn

145150155160

aspproasntrpcysileglnleuproargleuproleuleulysser

165170175

glnaspleuproserpheleuleuserserserasngluglulystyr

180185190

serphealaleuprothrphelysgluglnleuaspthrleuaspval

195200205

glugluasnprolysvalleuvalasnthrpheaspalaleuglupro

210215220

lysgluleulysalaileglulystyrasnleuileglyileglypro

225230235240

leuileproserthrpheleuaspglylysaspproleuaspserser

245250255

pheglyglyaspleupheglnlysserasnasptyrileglutrpleu

260265270

asnserlysalaasnserservalvaltyrileserpheglyserleu

275280285

leuasnleuserlysasnglnlysglugluilealalysglyleuile

290295300

gluilelyslyspropheleutrpvalileargaspglngluasngly

305310315320

lysglyaspglulysgluglulysleusercysmetmetgluleuglu

325330335

lysglnglylysilevalprotrpcysserglnleugluvalleuthr

340345350

hisproserileglycysphevalserhiscysglytrpasnserthr

355360365

leugluserleuserserglyvalservalvalalapheprohistrp

370375380

thraspglnglythrasnalalysleuilegluaspvaltrplysthr

385390395400

glyvalargleulyslysasngluaspglyvalvalglusergluglu

405410415

ilelysargcysileglumetvalmetaspglyglyglulysglyglu

420425430

glumetargargasnalaglnlystrplysgluleualaarggluala

435440445

vallysgluglyglyserserglumetasnleulysalaphevalgln

450455460

gluvalglylysglycys

465470

<210>39

<211>1413

<212>dna

<213>糖基转移酶(ntgt2)烟草(glycosyltransferase(ntgt2)nicotianatabacum)

<400>39

atggtgcaaccccatgtcctcttggtgacttttccagcacaaggccatattaatccatgt60

ctccaatttgccaagaggctaattagaatgggcattgaggtaacttttgccacgagcgtt120

ttcgcccatcgtcgtatggcaaaaactacgacttccactctatccaagggcttaaatttt180

gcggcattctctgatgggtacgacgatggtttcaaggccgatgagcatgattctcaacat240

tacatgtcggagataaaaagtcgcggttctaaaaccctaaaagatatcattttgaagagc300

tcagacgagggacgtcctgtgacatccctcgtctattctcttttgcttccatgggctgca360

aaggtagcgcgtgaatttcacataccgtgcgcgttactatggattcaaccagcaactgtg420

ctagacatatattattattacttcaatggctatgaggatgccataaaaggtagcaccaat480

gatccaaattggtgtattcaattgcctaggcttccactactaaaaagccaagatcttcct540

tcttttttactttcttctagtaatgaagaaaaatatagctttgctctaccaacatttaaa600

gagcaacttgacacattagatgttgaagaaaatcctaaagtacttgtgaacacatttgat660

gcattagagccaaaggaactcaaagctattgaaaagtacaatttaattgggattggacca720

ttgattccttcaacatttttggacggaaaagaccctttggattcttcctttggtggtgat780

ctttttcaaaagtctaatgactatattgaatggttgaactcaaaggctaactcatctgtg840

gtttatatctcatttgggagtctcttgaatttgtcaaaaaatcaaaaggaggagattgca900

aaagggttgatagagattaaaaagccattcttgtgggtaataagagatcaagaaaatggt960

aagggagatgaaaaagaagagaaattaagttgtatgatggagttggaaaagcaagggaaa1020

atagtaccatggtgttcacaacttgaagtcttaacacatccatctataggatgtttcgtg1080

tcacattgtggatggaattcgactctggaaagtttatcgtcaggcgtgtcagtagtggca1140

tttcctcattggacggatcaagggacaaatgctaaactaattgaagatgtttggaagaca1200

ggtgtaaggttgaaaaagaatgaagatggtgtggttgagagtgaagagataaaaaggtgc1260

atagaaatggtaatggatggtggagagaaaggagaagaaatgagaagaaatgctcaaaaa1320

tggaaagaattggcaagggaagctgtaaaagaaggcggatcttcggaaatgaatctaaaa1380

gcttttgttcaagaagttggcaaaggttgctga1413

<210>40

<211>28

<212>prt

<213>thca合酶毛状体靶向结构域大麻(thcasynthasetrichometargetingdomaincannabis)

<400>40

metasncysseralapheserphetrpphevalcyslysileilephe

151015

phepheleuserphehisileglnileserileala

2025

<210>41

<211>28

<212>prt

<213>cbda合酶毛状体靶向结构域大麻(cbdasynthasetrichometargestingdomaincannabis)

<400>41

metlyscysserthrpheserphetrpphevalcyslysileilephe

151015

phephepheserpheasnileglnthrserileala

2025

<210>42

<211>545

<212>prt

<213>thca合酶大麻(thcasynthasecannabis)

<400>42

metasncysseralapheserphetrpphevalcyslysileilephe

151015

phepheleuserphehisileglnileserilealaasnproargglu

202530

asnpheleulyscyspheserlyshisileproasnasnvalalaasn

354045

prolysleuvaltyrthrglnhisaspglnleutyrmetserileleu

505560

asnserthrileglnasnleuargpheileseraspthrthrprolys

65707580

proleuvalilevalthrproserasnasnserhisileglnalathr

859095

ileleucysserlyslysvalglyleuglnileargthrargsergly

100105110

glyhisaspalagluglymetsertyrileserglnvalpropheval

115120125

valvalaspleuargasnmethisserilelysileaspvalhisser

130135140

glnthralatrpvalglualaglyalathrleuglygluvaltyrtyr

145150155160

trpileasnglulysasngluasnleuserpheproglyglytyrcys

165170175

prothrvalglyvalglyglyhispheserglyglyglytyrglyala

180185190

leumetargasntyrglyleualaalaaspasnileileaspalahis

195200205

leuvalasnvalaspglylysvalleuasparglyssermetglyglu

210215220

aspleuphetrpalaileargglyglyglyglygluasnpheglyile

225230235240

ilealaalatrplysilelysleuvalaspvalproserlysserthr

245250255

ilepheservallyslysasnmetgluilehisglyleuvallysleu

260265270

pheasnlystrpglnasnilealatyrlystyrasplysaspleuval

275280285

leumetthrhispheilethrlysasnilethraspasnhisglylys

290295300

asnlysthrthrvalhisglytyrpheserserilephehisglygly

305310315320

valaspserleuvalaspleumetasnlysserpheprogluleugly

325330335

ilelyslysthraspcyslysgluphesertrpileaspthrthrile

340345350

phetyrserglyvalvalasnpheasnthralaasnphelyslysglu

355360365

ileleuleuaspargseralaglylyslysthralapheserilelys

370375380

leuasptyrvallyslysproileprogluthralametvallysile

385390395400

leuglulysleutyrglugluaspvalglyalaglymettyrvalleu

405410415

tyrprotyrglyglyilemetglugluilesergluseralailepro

420425430

pheprohisargalaglyilemettyrgluleutrptyrthralaser

435440445

trpglulysglngluaspasnglulyshisileasntrpvalargser

450455460

valtyrasnphethrthrprotyrvalserglnasnproargleuala

465470475480

tyrleuasntyrargaspleuaspleuglylysthrasnhisalaser

485490495

proasnasntyrthrglnalaargiletrpglyglulystyrphegly

500505510

lysasnpheasnargleuvallysvallysthrlysvalaspproasn

515520525

asnphepheargasngluglnserileproproleuproprohishis

530535540

his

545

<210>43

<211>462

<212>prt

<213>can738啤酒花的myb8同源物(myb8-orthologueforcan738humuluslupulus)

<400>43

metglyargalaprocyscysglulysvalglyleulyslysglyarg

151015

trpthrserglugluaspgluileleuthrlystyrileglnserasn

202530

glygluglycystrpargserleuprolysasnalaglyleuleuarg

354045

cysglylyssercysargleuargtrpileasntyrleuargalaasp

505560

leulysargglyasnilesersergluglugluaspileileilelys

65707580

leuhisserthrleuglyasnargtrpserleuilealaserhisleu

859095

proglyargthraspasngluilelysasntyrtrpasnserhisleu

100105110

serarglysilehisthrpheargargcysasnasnthrthrthrhis

115120125

hishishisleuproasnleuvalthrvalthrlysvalasnleupro

130135140

ileprolysarglysglyglyargthrserargleualametlyslys

145150155160

asnlysserserthrserasnglnasnserservalilelysasnasp

165170175

valglyserserserserthrthrthrthrservalhisglnargthr

180185190

thrthrthrthrprothrmetaspaspglnglnlysargglnleuser

195200205

argcysargleugluglulysgluaspglnaspglyalaserthrgly

210215220

thrvalvalmetmetleuglyglnalaalaalavalglysersercys

225230235240

aspgluaspmetleuglyhisaspglnleuserpheleucyscysser

245250255

gluglulysthrthrgluasnsermetthrasnleulysgluasngly

260265270

asphisgluvalserglyprotyrasptyrasphisargtyrglulys

275280285

gluthrservalaspgluglymetleuleucyspheasnaspileile

290295300

aspserasnleuleuasnproasngluvalleuthrleusergluglu

305310315320

serleuasnleuglyglyalaleumetaspthrthrthrserthrthr

325330335

thrasnasnasnasntyrserleusertyrasnasnasnglyaspcys

340345350

valileseraspasphisaspglntyrtrpleuaspaspvalvalgly

355360365

valaspphetrpsertrpgluserserthrthrvalthrglnglugln

370375380

gluglngluglngluglngluglngluglngluglngluglnglugln

385390395400

gluglngluhishishisglnglnaspglnlyslysasnthrtrpasp

405410415

asnglulysglulysmetleualaleuleutrpaspseraspasnser

420425430

asntrpgluleuglnaspasnasnasntyrhislyscysglngluile

435440445

thrserasplysgluasnalametvalalatrpleuleuser

450455460

<210>44

<211>371

<212>prt

<213>can739拟南芥的myb12同源物(atmyb12-orthologueforcan739arabidopsisthaliana)

<400>44

metglyargalaprocyscysglulysvalglyilelysargglyarg

151015

trpthralaglugluaspglnileleuserasntyrileglnserasn

202530

glygluglysertrpargserleuprolysasnalaglyleulysarg

354045

cysglylyssercysargleuargtrpileasntyrleuargserasp

505560

leulysargglyasnilethrproglugluglugluleuvalvallys

65707580

leuhisserthrleuglyasnargtrpserleuilealaglyhisleu

859095

proglyargthraspasngluilelysasntyrtrpasnserhisleu

100105110

serarglysleuhisasnpheilearglysproserileserglnasp

115120125

valseralavalilemetthrasnalaserseralapropropropro

130135140

glnalalysargargleuglyargthrserargseralametlyspro

145150155160

lysilehisargthrlysthrarglysthrlyslysthrseralapro

165170175

progluproasnalaaspvalalaglyalaasplysglualaleumet

180185190

valgluserserglyalaglualagluleuglyargprocysasptyr

195200205

tyrglyaspaspcysasnlysasnleumetserileasnglyaspasn

210215220

glyvalleuthrpheaspaspaspileileaspleuleuleuaspglu

225230235240

seraspproglyhisleutyrthrasnthrthrcysglyglyaspgly

245250255

gluleuhisasnileargaspsergluglyalaargglypheserasp

260265270

thrtrpasnglnglyasnleuaspcysleuleuglnsercysproser

275280285

valgluserpheleuasntyrasphisglnvalasnaspalaserthr

290295300

aspglupheileasptrpaspcysvaltrpglngluglyseraspasn

305310315320

asnleutrphisglulysgluasnproaspsermetvalsertrpleu

325330335

leuaspglyaspaspglualathrileglyasnserasncysgluasn

340345350

pheglygluproleuasphisaspaspgluseralaleuvalalatrp

355360365

leuleuser

370

<210>45

<211>243

<212>prt

<213>can833拟南芥的myb112同源物(myb112-orthologueforcan833arabidopsisthaliana)

<400>45

metasnileserargthrgluphealaasncyslysthrleuileasn

151015

hislysglugluvalglugluvalglulyslysmetgluilegluile

202530

argargglyprotrpthrvalglugluaspmetlysleuvalsertyr

354045

ileserleuhisglygluglyargtrpasnserleuserargserala

505560

glyleuasnargthrglylyssercysargleuargtrpleuasntyr

65707580

leuargproaspileargargglyaspileserleuglngluglnphe

859095

ileileleugluleuhisserargtrpglyasnargtrpserlysile

100105110

alaglnhisleuproglyargthraspasngluilelysasntyrtrp

115120125

argthrargvalglnlyshisalalysleuleulyscysaspvalasn

130135140

serlysglnphelysaspthrilelyshisleutrpmetproargleu

145150155160

ilegluargilealaalathrglnservalglnphethrserasnhis

165170175

tyrserprogluasnserservalalathralathrserserthrser

180185190

serserglualavalargserserphetyrglyglyaspglnvalglu

195200205

pheglythrleuasphismetthrasnglyglytyrtrppheasngly

210215220

glyaspthrphegluthrleucysserpheaspgluleuasnlystrp

225230235240

leuilegln

<210>46

<211>517

<212>prt

<213>细胞溶质靶向thca合酶(ctthca)大麻(cytosolictargetedthcasynthase(ctthcas)cannabis)

<400>46

asnproarggluasnpheleulyscyspheserlyshisileproasn

151015

asnvalalaasnprolysleuvaltyrthrglnhisaspglnleutyr

202530

metserileleuasnserthrileglnasnleuargpheileserasp

354045

thrthrprolysproleuvalilevalthrproserasnasnserhis

505560

ileglnalathrileleucysserlyslysvalglyleuglnilearg

65707580

thrargserglyglyhisaspalagluglymetsertyrilesergln

859095

valprophevalvalvalaspleuargasnmethisserilelysile

100105110

aspvalhisserglnthralatrpvalglualaglyalathrleugly

115120125

gluvaltyrtyrtrpileasnglulysasngluasnleuserphepro

130135140

glyglytyrcysprothrvalglyvalglyglyhispheserglygly

145150155160

glytyrglyalaleumetargasntyrglyleualaalaaspasnile

165170175

ileaspalahisleuvalasnvalaspglylysvalleuasparglys

180185190

sermetglygluaspleuphetrpalaileargglyglyglyglyglu

195200205

asnpheglyileilealaalatrplysilelysleuvalaspvalpro

210215220

serlysserthrilepheservallyslysasnmetgluilehisgly

225230235240

leuvallysleupheasnlystrpglnasnilealatyrlystyrasp

245250255

lysaspleuvalleumetthrhispheilethrlysasnilethrasp

260265270

asnhisglylysasnlysthrthrvalhisglytyrpheserserile

275280285

phehisglyglyvalaspserleuvalaspleumetasnlysserphe

290295300

progluleuglyilelyslysthraspcyslysgluphesertrpile

305310315320

aspthrthrilephetyrserglyvalvalasnpheasnthralaasn

325330335

phelyslysgluileleuleuaspargseralaglylyslysthrala

340345350

pheserilelysleuasptyrvallyslysproileprogluthrala

355360365

metvallysileleuglulysleutyrglugluaspvalglyalagly

370375380

mettyrvalleutyrprotyrglyglyilemetglugluileserglu

385390395400

seralailepropheprohisargalaglyilemettyrgluleutrp

405410415

tyrthralasertrpglulysglngluaspasnglulyshisileasn

420425430

trpvalargservaltyrasnphethrthrprotyrvalserglnasn

435440445

proargleualatyrleuasntyrargaspleuaspleuglylysthr

450455460

asnhisalaserproasnasntyrthrglnalaargiletrpglyglu

465470475480

lystyrpheglylysasnpheasnargleuvallysvallysthrlys

485490495

valaspproasnasnphepheargasngluglnserileproproleu

500505510

proprohishishis

515

<210>47

<211>520

<212>prt

<213>具有thca合酶毛状体靶向结构域的毛状体靶向过氧化氢酶拟南芥(trichometargetedcatalasewiththcasynthasetrichometargetingdomainarabidopsisthaliana)

<400>47

metasncysseralapheserphetrpphevalcyslysileilephe

151015

phepheleuserphehisileglnileserilealametaspprotyr

202530

lystyrargproalasersertyrasnserprophephethrthrasn

354045

serglyalaprovaltrpasnasnasnsersermetthrvalglypro

505560

argglyleuileleuleugluasptyrhisleuvalglulysleuala

65707580

asnpheasparggluargileprogluargvalvalhisalaarggly

859095

alaseralalysglyphephegluvalthrhisaspileserasnleu

100105110

thrcysalaasppheleuargalaproglyvalglnthrprovalile

115120125

valargpheserthrvalilehisalaargglyserprogluthrleu

130135140

argaspproargglyphealavallysphetyrthrarggluglyasn

145150155160

pheaspleuvalglyasnasnpheprovalphepheileargaspgly

165170175

metlyspheproaspilevalhisalaleulysproasnprolysser

180185190

hisileglngluasntrpargileleuaspphepheserhishispro

195200205

gluserleuasnmetphethrpheleupheaspaspileglyilepro

210215220

glnasptyrarghismetaspglyserglyvalasnthrtyrmetleu

225230235240

ileasnlysalaglylysalahistyrvallysphehistrplyspro

245250255

thrcysglyvallysserleuleuglugluaspalaileargleugly

260265270

glythrasnhisserhisalathrglnaspleutyraspserileala

275280285

alaglyasntyrproglutrplysleupheileglnileileasppro

290295300

alaaspgluasplyspheasppheaspproleuaspvalthrlysthr

305310315320

trpprogluaspileleuproleuglnprovalglyargmetvalleu

325330335

asnlysasnileaspasnphephealagluasngluglnleualaphe

340345350

cysproalaileilevalproglyilehistyrseraspasplysleu

355360365

leuglnthrargvalphesertyralaaspthrglnarghisargleu

370375380

glyproasntyrleuglnleuprovalasnalaprolyscysalahis

385390395400

hisasnasnhishisgluglyphemetasnphemethisargaspglu

405410415

gluvalasntyrpheproserargtyraspglnvalarghisalaglu

420425430

lystyrprothrproproalavalcysserglylysarggluargcys

435440445

ileileglulysgluasnasnphelysgluproglygluargtyrarg

450455460

thrphethrprogluargglngluargpheileglnargtrpileasp

465470475480

alaleuseraspproargilethrhisgluileargseriletrpile

485490495

sertyrtrpserglnalaasplysserleuglyglnlysleualaser

500505510

argleuasnvalargproserile

515520

<210>48

<211>520

<212>prt

<213>具有cbda合酶毛状体靶向结构域的毛状体靶向过氧化氢酶拟南芥(trichometargetedcatalasewithcbdasynthasetrichometargetingdomainarabidopsisthaliana)

<400>48

metlyscysserthrpheserphetrpphevalcyslysileilephe

151015

phephepheserpheasnileglnthrserilealametaspprotyr

202530

lystyrargproalasersertyrasnserprophephethrthrasn

354045

serglyalaprovaltrpasnasnasnsersermetthrvalglypro

505560

argglyleuileleuleugluasptyrhisleuvalglulysleuala

65707580

asnpheasparggluargileprogluargvalvalhisalaarggly

859095

alaseralalysglyphephegluvalthrhisaspileserasnleu

100105110

thrcysalaasppheleuargalaproglyvalglnthrprovalile

115120125

valargpheserthrvalilehisalaargglyserprogluthrleu

130135140

argaspproargglyphealavallysphetyrthrarggluglyasn

145150155160

pheaspleuvalglyasnasnpheprovalphepheileargaspgly

165170175

metlyspheproaspilevalhisalaleulysproasnprolysser

180185190

hisileglngluasntrpargileleuaspphepheserhishispro

195200205

gluserleuasnmetphethrpheleupheaspaspileglyilepro

210215220

glnasptyrarghismetaspglyserglyvalasnthrtyrmetleu

225230235240

ileasnlysalaglylysalahistyrvallysphehistrplyspro

245250255

thrcysglyvallysserleuleuglugluaspalaileargleugly

260265270

glythrasnhisserhisalathrglnaspleutyraspserileala

275280285

alaglyasntyrproglutrplysleupheileglnileileasppro

290295300

alaaspgluasplyspheasppheaspproleuaspvalthrlysthr

305310315320

trpprogluaspileleuproleuglnprovalglyargmetvalleu

325330335

asnlysasnileaspasnphephealagluasngluglnleualaphe

340345350

cysproalaileilevalproglyilehistyrseraspasplysleu

355360365

leuglnthrargvalphesertyralaaspthrglnarghisargleu

370375380

glyproasntyrleuglnleuprovalasnalaprolyscysalahis

385390395400

hisasnasnhishisgluglyphemetasnphemethisargaspglu

405410415

gluvalasntyrpheproserargtyraspglnvalarghisalaglu

420425430

lystyrprothrproproalavalcysserglylysarggluargcys

435440445

ileileglulysgluasnasnphelysgluproglygluargtyrarg

450455460

thrphethrprogluargglngluargpheileglnargtrpileasp

465470475480

alaleuseraspproargilethrhisgluileargseriletrpile

485490495

sertyrtrpserglnalaasplysserleuglyglnlysleualaser

500505510

argleuasnvalargproserile

515520

<210>49

<211>781

<212>prt

<213>具有thca合酶毛状体靶向结构域的过氧化氢酶hpii(kate)大肠杆菌(catalasehpii(kate)withthcasynthasetrichometargetingdomainescherichiacoli)

<400>49

metasncysseralapheserphetrpphevalcyslysileilephe

151015

phepheleuserphehisileglnileserilealametserglnhis

202530

asnglulysasnprohisglnhisglnserproleuhisaspserser

354045

glualalysproglymetaspserleualaprogluaspglyserhis

505560

argproalaalagluprothrproproglyalaglnprothralapro

65707580

glyserleulysalaproaspthrargasnglulysleuasnserleu

859095

gluaspvalarglysglysergluasntyralaleuthrthrasngln

100105110

glyvalargilealaaspaspglnasnserleuargalaglyserarg

115120125

glyprothrleuleugluasppheileleuargglulysilethrhis

130135140

pheasphisgluargileprogluargilevalhisalaargglyser

145150155160

alaalahisglytyrpheglnprotyrlysserleuseraspilethr

165170175

lysalaasppheleuseraspproasnlysilethrprovalpheval

180185190

argpheserthrvalglnglyglyalaglyseralaaspthrvalarg

195200205

aspileargglyphealathrlysphetyrthrglugluglyilephe

210215220

aspleuvalglyasnasnthrproilephepheileglnaspalahis

225230235240

lyspheproaspphevalhisalavallysprogluprohistrpala

245250255

ileproglnglyglnseralahisaspthrphetrpasptyrvalser

260265270

leuglnprogluthrleuhisasnvalmettrpalametserasparg

275280285

glyileproargsertyrargthrmetgluglypheglyilehisthr

290295300

pheargleuileasnalagluglylysalathrphevalargphehis

305310315320

trplysproleualaglylysalaserleuvaltrpaspglualagln

325330335

lysleuthrglyargaspproaspphehisargarggluleutrpglu

340345350

alaileglualaglyasppheproglutyrgluleuglypheglnleu

355360365

ileproglugluaspgluphelyspheasppheaspleuleuasppro

370375380

thrlysleuileproglugluleuvalprovalglnargvalglylys

385390395400

metvalleuasnargasnproaspasnphephealagluasnglugln

405410415

alaalaphehisproglyhisilevalproglyleuaspphethrasn

420425430

aspproleuleuglnglyargleuphesertyrthraspthrglnile

435440445

serargleuglyglyproasnphehisgluileproileasnargpro

450455460

thrcysprotyrhisasnpheglnargaspglymethisargmetgly

465470475480

ileaspthrasnproalaasntyrgluproasnserileasnaspasn

485490495

trpproarggluthrproproglyprolysargglyglyphegluser

500505510

tyrglngluargvalgluglyasnlysvalarggluargserproser

515520525

pheglyglutyrtyrserhisproargleuphetrpleuserglnthr

530535540

prophegluglnarghisilevalaspglypheserphegluleuser

545550555560

lysvalvalargprotyrilearggluargvalvalaspglnleuala

565570575

hisileaspleuthrleualaglnalavalalalysasnleuglyile

580585590

gluleuthraspaspglnleuasnilethrproproproaspvalasn

595600605

glyleulyslysaspproserleuserleutyralaileproaspgly

610615620

aspvallysglyargvalvalalaileleuleuasnaspgluvalarg

625630635640

seralaaspleuleualaileleulysalaleulysalalysglyval

645650655

hisalalysleuleutyrserargmetglygluvalthralaaspasp

660665670

glythrvalleuproilealaalathrphealaglyalaproserleu

675680685

thrvalaspalavalilevalprocysglyasnilealaaspileala

690695700

aspasnglyaspalaasntyrtyrleumetglualatyrlyshisleu

705710715720

lysproilealaleualaglyaspalaarglysphelysalathrile

725730735

lysilealaaspglnglyglugluglyilevalglualaaspserala

740745750

aspglyserphemetaspgluleuleuthrleumetalaalahisarg

755760765

valtrpserargileprolysileasplysileproala

770775780

<210>50

<211>781

<212>prt

<213>具有cbda合酶毛状体靶向结构域的过氧化氢酶hpii(kate)大肠杆菌(catalasehpii(kate)withcbdasynthasetrichometargetingdomainescherichiacoli)

<400>50

metlyscysserthrpheserphetrpphevalcyslysileilephe

151015

phephepheserpheasnileglnthrserilealametserglnhis

202530

asnglulysasnprohisglnhisglnserproleuhisaspserser

354045

glualalysproglymetaspserleualaprogluaspglyserhis

505560

argproalaalagluprothrproproglyalaglnprothralapro

65707580

glyserleulysalaproaspthrargasnglulysleuasnserleu

859095

gluaspvalarglysglysergluasntyralaleuthrthrasngln

100105110

glyvalargilealaaspaspglnasnserleuargalaglyserarg

115120125

glyprothrleuleugluasppheileleuargglulysilethrhis

130135140

pheasphisgluargileprogluargilevalhisalaargglyser

145150155160

alaalahisglytyrpheglnprotyrlysserleuseraspilethr

165170175

lysalaasppheleuseraspproasnlysilethrprovalpheval

180185190

argpheserthrvalglnglyglyalaglyseralaaspthrvalarg

195200205

aspileargglyphealathrlysphetyrthrglugluglyilephe

210215220

aspleuvalglyasnasnthrproilephepheileglnaspalahis

225230235240

lyspheproaspphevalhisalavallysprogluprohistrpala

245250255

ileproglnglyglnseralahisaspthrphetrpasptyrvalser

260265270

leuglnprogluthrleuhisasnvalmettrpalametserasparg

275280285

glyileproargsertyrargthrmetgluglypheglyilehisthr

290295300

pheargleuileasnalagluglylysalathrphevalargphehis

305310315320

trplysproleualaglylysalaserleuvaltrpaspglualagln

325330335

lysleuthrglyargaspproaspphehisargarggluleutrpglu

340345350

alaileglualaglyasppheproglutyrgluleuglypheglnleu

355360365

ileproglugluaspgluphelyspheasppheaspleuleuasppro

370375380

thrlysleuileproglugluleuvalprovalglnargvalglylys

385390395400

metvalleuasnargasnproaspasnphephealagluasnglugln

405410415

alaalaphehisproglyhisilevalproglyleuaspphethrasn

420425430

aspproleuleuglnglyargleuphesertyrthraspthrglnile

435440445

serargleuglyglyproasnphehisgluileproileasnargpro

450455460

thrcysprotyrhisasnpheglnargaspglymethisargmetgly

465470475480

ileaspthrasnproalaasntyrgluproasnserileasnaspasn

485490495

trpproarggluthrproproglyprolysargglyglyphegluser

500505510

tyrglngluargvalgluglyasnlysvalarggluargserproser

515520525

pheglyglutyrtyrserhisproargleuphetrpleuserglnthr

530535540

prophegluglnarghisilevalaspglypheserphegluleuser

545550555560

lysvalvalargprotyrilearggluargvalvalaspglnleuala

565570575

hisileaspleuthrleualaglnalavalalalysasnleuglyile

580585590

gluleuthraspaspglnleuasnilethrproproproaspvalasn

595600605

glyleulyslysaspproserleuserleutyralaileproaspgly

610615620

aspvallysglyargvalvalalaileleuleuasnaspgluvalarg

625630635640

seralaaspleuleualaileleulysalaleulysalalysglyval

645650655

hisalalysleuleutyrserargmetglygluvalthralaaspasp

660665670

glythrvalleuproilealaalathrphealaglyalaproserleu

675680685

thrvalaspalavalilevalprocysglyasnilealaaspileala

690695700

aspasnglyaspalaasntyrtyrleumetglualatyrlyshisleu

705710715720

lysproilealaleualaglyaspalaarglysphelysalathrile

725730735

lysilealaaspglnglyglugluglyilevalglualaaspserala

740745750

aspglyserphemetaspgluleuleuthrleumetalaalahisarg

755760765

valtrpserargileprolysileasplysileproala

770775780

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1