本申请要求2017年3月24日提交的美国临时申请no.62/476,080、2017年11月20日提交的美国临时申请no.62/588,662和2018年1月21日提交的美国临时申请no.62/621,166的权益和优先权。上述申请的整个说明书和附图在此通过引用整体并入。
序列表
本申请包含序列表,该序列表已经以ascii格式电子提交,并且其全部内容通过引用并入本文。
本发明的领域一般涉及植物分子生物学和植物生物技术。更具体地,本发明涉及用于从植物系统(包括整株植物和/或植物细胞培养系统)体内产生、修饰和分离大麻素化合物的新系统、方法和组合物。在某些优选的实施方案中,本发明的技术包括遗传修饰植物或植物细胞悬浮培养物以在大麻和/或本生烟和/或烟草中产生、修饰和/或积累一种或多种目标大麻素的新系统。
背景技术:
大麻素是一类由大麻合成的专门化合物。它们通过萜烯和酚前体的缩合形成。它们包括这些更丰富的形式:δ-9-四氢大麻酚(thc)、大麻二酚(cbd)、大麻色烯(cbc)和大麻萜酚(cbg)。另一种大麻素-大麻酚(cbn)由thc作为降解产物形成,并且可以在一些植物株中检测到。通常,thc、cbd、cbc和cbg在各种植物株中以不同比例一起出现。
基于它们是否含有羧基,大麻素一般分为中性大麻素和大麻素酸两种。众所周知,在新鲜植物中,中性大麻素的浓度远低于大麻素酸的浓度。一株cannabissativa含有大约61种属于大麻素的一般类别的化合物。这些大麻素通常是亲脂性无氮的,主要是酚类化合物,并且是由单萜和酚生物遗传得到的,酸大麻素来自单萜和酚羧酸,并且具有c21至碱性物质。
大麻素也在植物产品中发现了相应的羧酸。通常,羧酸具有生物合成前体的功能。例如,这些化合物在体内由thc羧酸通过使四氢大麻酚δ9-和a8-thc和来自相关的大麻二酚的cbd脱羧而产生。如图28中一般所示,thc和cbd可以通过非酶促脱羧从其酸性前体四氢大麻酚酸(thca)和大麻二酚酸(cbda)人工衍生。
大麻素在世界各地以各种形式被广泛消费。大麻素丰富的大麻制剂,无论是草本植物(即大麻)还是树脂形式(即大麻油),被估计占世界人口的2.6-5.0%所使用(unodc,2012)。含有天然大麻提取物
如上所述,δ-9-四氢大麻酚(也称为thc)是大麻植物中的主要生物活性成分之一,已被食品和药物管理局(fda)批准用于控制与化疗有关的恶心和呕吐,并且最近用于患有消耗综合症的艾滋病患者的食欲刺激。然而,该药物显示出其他可用于治疗应用的生物活性,例如治疗青光眼、偏头痛、痉挛、焦虑和镇痛。
事实上,有充分证据表明,能激活体内大麻素受体的诸如大麻素和内源性大麻素之类的试剂调节食欲并缓解恶心、呕吐和疼痛(martinb.r.andwiley,j.l,mechanismofactionofcannabinoids:howitmayleadtotreatmentofcachexia,emesisandpain,journalofsupportiveoncology2:1-10,2004)、多发性硬化(pertwee,r.g.,cannabinoidsandmultiplesclerosis,pharmacol.ther.95,165-174,2002)和癫痫(wallace,m.j.,blair,r.e.,falenski,k.ww.,martin,b.r.,anddelorenzo,r.j.journalpharmacologyandexperimentaltherapeutics,307:129-137,2003)。此外,已显示cb2受体激动剂在动物模型中治疗疼痛方面是有效的(claytonn.,marshallf.h.,bountrac,o'shaughnessyc.t.,2002.cb1andcb2cannabinoidreceptorsareimplicatedininflammatorypain.96,253-260;malant.p.,ibrahimm.m.,vanderaht.w.,makriyannisa.,porrecaf.,2002.inhibitionofpainresponsesbyactivationofcb(2)cannabinoidreceptors.chemistryandphysicsoflipids121,191-200;malant.p.,jr.,ibrahimm.m.,dengh.,liuq.,matah.p.,vanderaht.,porrecaf.,makriyannisa.,2001.cb2cannabinoidreceptor-mediatedperipheralantinociception.93,239-245.;quartilhoa.,matah.p.,ibrahimm.m.,vanderaht.w.,porrecaf.,makriyannisa.,malant.p.,jr.,2003.inhibitionofinflammatoryhyperalgesiabyactivationofperipheralcb2cannabinoidreceptors.anesthesiology99,955-960)和治疗多发性硬化方面是有效的(pertwee,r.g.,cannabinoidsandmultiplesclerosis,pharmacol.ther.95,165-174,2002)。
最近,一些州批准使用大麻和大麻素注入的产品用于娱乐和医疗用途。随着这些新的医疗和商业市场的发展,人们越来越需要开发更有效的大麻素化合物的产生和分离。大麻素产生的传统方法通常集中在从原始收获的大麻中提取和纯化大麻素。然而,传统的大麻素提取和纯化方法存在许多限制其有用性的技术和实际问题。
传统大麻素产生和提取方法的局限性
例如,在uspat.no.6,403,126(websteretal.)中,从原始收获的大麻中分离出大麻素和其他相关化合物,并用有机溶剂(通常是石油衍生的烃)或低分子量的醇处理,以溶解大麻素以便以后分离。这种传统方法的局限性在于它依赖于可已经暴露于各种有毒农药、除草剂等的天然生长的植物物质。另外,这种传统的提取方法是不精确的,从而导致提取的thc的浓度不可靠和变化。此外,许多大麻株在水培环境中生长,这些环境也没有受到调节,并且可导致这些株被化学和其他不希望的化合物广泛污染。
在另外例子uspat.app.no.20160326130(lekhrametal.)中,大麻素和其他相关化合物从原始收获的大麻中分离出来,再次使用一系列有机溶剂将大麻素转化为盐,然后再回到其原始的羧酸形式。与webster类似,这种传统方法受到限制,因为它依赖于可已经暴露于各种有毒杀虫剂、除草剂等的天然生长的植物物质。此外,该传统方法中使用的多种有机溶剂必须回收并再循环和/或适当处理。
另一种传统的大麻素提取方法涉及利用超临界二氧化碳(sco2)生成大麻油。在这种传统方法下,将干燥的植物物质再次研磨并进行sco2提取环境。最初获得并进一步分离初级提取物。例如,如通常所ca2424356(mulleretal.)描述的那样。在超临界压力和温度条件下,通过添加辅助溶剂(改性剂)如醇,在sco2的帮助下提取大麻素。在这个过程中,这种超临界co2蒸发并溶解到大麻素中。然而,这种传统方法也具有某些限制性缺点。例如,由于在超临界sco2中的低溶解度,目标大麻素的回收是不一致的。此外,所使用的任何溶剂必须回收并泵送回提取器,以便最大限度地降低运营成本。
另一种方法利用丁烷从原始收获的大麻中提取大麻素,特别是高浓度的thc。因为丁烷是非极性的,所以该方法不能提取水溶性副产物,例如叶绿素和植物生物碱。也就是说,这个过程可能需要长达48小时,因此其扩大规模以实现最大商业可行性的能力有限。传统丁烷萃取方法的另一个主要缺点是使用易燃溶剂的潜在危险,以及需要确保从提取的大麻素中完全除去所有丁烷。
这些传统大麻素提取方法的可行性的另一个限制因素是不能维持大麻株的完整性。例如,用于医学和研究应用的大麻素或受到对照临床试验的大麻素,受到美国和其他地方的各种政府机构的严格监管。这些监管机构要求大麻株随着时间的推移保持化学一致性。不幸的是,大麻株的遗传/化学组成经历了几代的变化,使得它们不能满足大多数临床试验中存在的法规要求或经认证用于其他药物应用。
已经进行了几次尝试来解决这些问题。例如,已经努力在遗传工程生物中产生大麻素。例如,在uspat.app.14/795,816(poulos,etal.)中,此处申请人声称已经产生遗传修饰的酵母菌株,其能够通过插入产生适合其代谢产生的酶的基因来产生大麻素。然而,这种应用仅限于其仅产生单一或非常有限数量的大麻素化合物的能力。这种限制具有临床意义。最近的临床研究已经发现,使用单一分离的大麻素作为治疗剂不如使用与各种选择菌株相关的天然存在的初级和次级大麻素的“随从(entourage)”处理一样有效。
已经进行了另外的尝试来化学合成大麻素,例如thc。然而,与从天然植物中提取大麻素相比,各种大麻素的化学合成是一种昂贵的方法。大麻素的化学合成还涉及使用不环保的化学品,这可被视为其产生的额外成本。此外,各种大麻素的合成化学品产生已经被分类为和从诸如cannabissativa等植物中提取的那些一样药理学活性较低。
产生大规模大麻细胞培养物的努力也引起了许多技术问题。其中最主要的是大麻素具有细胞毒性。在自然条件下大麻素产生,然后在细胞外储存在称为毛状体的小腺体结构中。可以将毛状体可视化为来自大麻植物的表皮的小毛或其他生长物。结果,在大麻细胞培养物中,无法在细胞外储存大麻素意味着大麻素的任何积累都会对培养的细胞产生毒性。这些限制削弱了大麻细胞培养物按工业产生水平放大的能力。
大麻素生物合成毒性限制体内产生系统
产生或积累高水平大麻素的大麻株/细胞培养物的努力引起了许多技术问题。其中最主要的是大麻素合成产生有毒副产品。值得注意的是,cbda和thca合酶都需要分子氧,联合fad分子一起,氧化大麻萜酚酸(cbga)。具体地,如图29所示,来自底物的两个电子被酶结合的fad接受,然后转移到分子氧中以再氧化fad。cbda和thca由离子中间体通过酶的立体选择性环化合成。氢化物离子从还原的黄素转移到分子氧,从而导致过氧化氢的形成和黄素的再活化以用于下一循环。结果,除了分别产生cbda和thca之外,该反应还产生对宿主细胞天然有毒的过氧化氢(h2o2)。由于这种有毒的过氧化氢副产物的产生,大麻素合成产生自我限制的反馈回路,从而阻止大麻素在体内系统中的高水平产生和/或积累。大麻植物处理这些细胞毒性作用的一种方法是通过使用毛状体来产生和积累大麻素。
大麻植物通过隔离大麻素生物合成并在细胞外储存在称为毛状体的小腺体结构中处理这种毒性,如上所述。例如,thca合酶是负责产生thc的水溶性酶。例如,thc生物合成发生在腺毛状体中,并且开始于焦磷酸牻牛儿酯与橄榄油酸缩合以产生大麻萜酚酸(cbga);该反应由称为焦磷酸牻牛儿酯的酶橄榄油酸牻牛儿酯转移酶催化。然后cbga在thca合酶存在下经历氧化环化以产生四氢大麻酚酸(thca)。然后通过非酶促脱羧将thca转化为thc。使用rt-pcr和酶活性分析的亚细胞定位研究表明,thca合酶在腺毛状体的分泌细胞中表达,然后易位到其中最终产物thca积累的分泌腔中。存在于分泌腔中的thca合酶是功能性的,这表明储存腔是thca生物合成和储存的位点。通过这种方式,大麻能够在细胞外产生大麻素,从而避免这些化合物的细胞毒性作用。然而,结果,这种细胞区室化阻碍了体内接触和化学改变大麻素的能力。
为了解决这些问题,一些人提出化学修饰大麻素化合物以减少其细胞毒性作用。例如zipp等等已提出利用体外方法产生大麻素糖苷。然而,该应用仅限于体外系统。具体地,如上所述,大麻素合酶类酶,例如thca合酶,是水溶性蛋白,其从基底毛状体细胞输出到储存室中,在那里它是活性的并催化thca的合成。具体地,为了有效地介导这种大麻素合酶的细胞输出,该酶含有28个氨基酸的信号肽,其指导其输出细胞并进入发生大麻素合成的细胞外三色。由于这种信号依赖性细胞外区室化,在这种情况下是thca合酶,这意味着thca在细胞质外部产生并且不能被遗传工程化的糖基化酶接近。因此,如zipp等等所暗示的那样,在植物细胞中简单表达udp糖基转移酶将不会导致大麻素分子在大麻素合成发生的区室化和细胞外三色结构中的有效糖基化。zipp的方法也不能产生乙酰化大麻素以及o乙酰基糖苷大麻素分子。
关于大麻素的产生、解毒和分离的上述问题可能代表了对其有效和经济的解决方案的长期需求。尽管可能已经有了实施要素,但在某种程度上可能缺乏满足这种需求的实际尝试。这可能是由于本领域普通技术人员未能充分理解或理解所涉及的问题和挑战的性质。由于缺乏理解,满足这些长期需求的尝试可能未能有效地解决这里确定的一个或多个问题或挑战。这些尝试甚至可能已经偏离了本发明技术所采用的技术方向,并且甚至可能导致本发明技术的成就在某种程度上被认为是该领域中某些人采取的方法的意外结果。
如下面将更详细讨论的,本发明的技术克服了传统大麻素产生系统的限制,同时满足了真正有效和可扩展的大麻素产生、改良和分离系统的目标。
发明概述
本发明的技术可包括用于从大麻植物体内产生、改良和分离大麻素化合物的系统、方法和组合物。特别地,本发明提供用于水溶性大麻素的高水平体内生物合成的系统和方法。
本发明的技术包括用于增强大麻素的产生和/或积累的系统和方法。在一个实施方案中,本发明可包括用于在体内系统(例如植物或植物细胞培养物)中增强大麻素的产生和/或积累的系统和方法。
本发明的另一个目的可包括产生过表达某些内源/外源基因的遗传修饰的植物,所述基因导致高于野生型水平的大麻素的过量产生和/或积累。在一个优选实施方案中,这样的转基因植物可以表现出大麻素前体化合物的增强的产生和局部积累,例如thca(四氢大麻酚酸)、cbca(大麻色酸)和cbda(大麻二酚酸)。此类转基因植物可另外表现出大麻素的增强的产生和局部积累,例如thc、cbc和cbd。本发明的另一个目的可包括产生表达某些内源/外源的遗传修饰的植物,其导致大麻素的增强的改良。在一个优选实施方案中,这样的转基因植物可以表现出对大麻素的增强的修饰,包括羟基化和/或乙酰化和/或糖基化。在另外的优选实施方案中,此类转基因植物可表现出对大麻素的增强的修饰,包括乙酰化和糖基化,例如o乙酰基糖苷形式。例如,乙酰化将乙酰基(-ch3ooh)添加到大麻素中,使得羧酸酯基团是酸性的并且在中性ph下带电,从而使其高水溶性。
本发明技术的一个目的可以是产生遗传修饰的或转基因大麻植物,其过表达一种或多种转录因子,例如myb,其增强通过大麻素生物合成途径的代谢物通量。在一个优选实施方案中,这些转录因子可能包括各种类似物。在某些优选的实施方案中,这些转基因中的一种或多种可以与一种或多种启动子可操作地连接。
本发明技术的另一个目的可以是产生遗传修饰的或转基因大麻细胞培养物,其过表达增强通过大麻素生物合成途径的代谢物通量的一种或多种转录因子。在一个优选实施方案中,这些转基因可以与一个或多个启动子可操作地连接。
本发明技术的另一个目的可以是产生遗传修饰的或转基因大麻植物,其表达上调毛状体形成以增加大麻素积累的一种或多种外源/异源转录因子。在某些优选的实施方案中,这些外源转基因中的一种或多种可以与一种或多种启动子可操作地连接。
然而,本发明技术的另一个目的可以是产生遗传修饰的或转基因大麻植物,其表达能够降低在大麻素合成期间可产生的过氧化氢(h2o2)水平的酶。在一个优选实施方案中,本发明的技术可以产生表达嵌合蛋白的遗传修饰的或转基因大麻植物。在这个实施方案中,该嵌合体蛋白可以包括第一结构域,其可以降低在大麻素合成期间可产生的过氧化氢(h2o2)水平。该嵌合/融合蛋白可以进一步包括第二结构域,其可以包含可以允许嵌合蛋白靶向定位于活性大麻素合成的位置的毛状体靶向结构域。在一些实施方案中,第三结构域可以包括可以进一步将第一结构域与第二结构域分开的接头,使得所述第一结构域和所述第二结构域各自可以折叠成其适当的三维形状并保持其活性,并且所述接头长度在一定范围。
本发明技术的另一个目的可包括利用土壤杆菌ti-质粒介导的转化产生一种或多种上述遗传修饰的植物或植物细胞培养物。
本发明技术的另一个目的涉及用于大麻素生物合成和修饰的体内细胞定位的方法和系统。更具体地,本发明的技术涉及用于大麻素羟化、乙酰化和/或糖基化的体内细胞定位的方法和系统。本发明的技术可包括用于高效局部化学修饰和从悬浮培养物中分离大麻素化合物的系统和方法。在这个实施方案中,各种选择的大麻素化合物可以化学修饰成可溶和无毒的构造。
本发明技术的另外的实施方案可以包括大麻素化合物的瞬时修饰,以减少和/或消除它们在植物或植物细胞培养系统中的细胞毒性。在优选的实施方案中,这种瞬时修饰的大麻素可以在通常对细胞产生有害作用的水平上积累。另外的实施方案可包括分离这些瞬时修饰的大麻素,然后酶促转化或重构成其原始和/或部分修饰的结构。
本发明的另一个目的可以包括产生转基因植物和/或植物细胞培养物,其可以表达在植物中偶联大麻素合成和羟基化和/或糖基化的异源基因。具体而言,该技术的一个目的可包括使用本生烟来证明植物中的cbda合成和糖基化的偶联。并且,该实施方案的另外目的可包括cbda分子中的其他修饰,例如羟基化和乙酰化。在另一个目的中,该大麻素修饰可以特异性定位,例如在胞质溶胶和/或毛状体中。
本发明的另一个目的可以包括产生转基因植物和/或植物细胞培养物,其可以过表达可以配置为修饰大麻素的内源性基因。另外的目标可以包括异源转录因子的共表达,其可以增加大麻素的产生。本发明的另一个目的可包括异源基因的共表达,其解毒通过大麻素生物合成产生的过氧化氢副产物。这些基因的共表达可以与配置用于修饰和/或定位大麻素生物修饰的基因的共表达相加。
附图简述
图1.体外测定中发现的代表性cbga糖苷色谱洗脱图。色谱图a、b和c代表每种糖苷产物的相应提取离子色谱图。色谱图d代表总离子色谱图。峰强度显示为相对于每个色谱图中最丰富的峰的相对丰度。
图2.在体外测定中发现的功能化cbga和糖苷的代表性色谱洗脱图。色谱图a、b和c代表每种产品的相应提取物额定离子色谱图。色谱图d代表总离子色谱图。峰强度显示为相对于每个色谱图中最丰富的峰的相对丰度。
图3.在叶提取物中发现的代表性cbda糖苷色谱洗脱图。色谱图a、b、c和d代表每种糖苷产物的相应提取物额定离子色谱图。色谱图e代表总离子色谱图。峰强度显示为相对于每个色谱图中最丰富的峰的相对丰度。
图4.叶提取物中功能化cbda和功能性糖苷的色谱洗脱。色谱图a、b和c代表每种产品的相应提取物额定离子色谱图。色谱图d代表总离子色谱图。峰强度显示为相对于每个色谱图中最丰富的峰的相对丰度。
图5.表达细胞色素p450(cyp3a4)基因(seqidno.1)的基因构建体,其在植物中表达细胞色素p450(cyp3a4)蛋白(seqidno.2)并且p450氧化还原酶基因(oxred)(seqidno.3)表达p450氧化还原酶蛋白(seqidno.4)。这两个基因均由组成型35s启动子(35s)驱动,并以拟南芥醇脱氢酶(atadh)的5'非翻译区为翻译增强子。
图6.烟叶中cyp3a4和p450氧化还原酶表达的确认。cb1-cb5,被cyp3a4/p450氧化还原酶浸润的叶片的生物复制品;wt=没有渗透的野生型烟叶。l=1kb加上梯子(美国thermofisherscientific)。箭头显示预期的(500bp)条带,指示转基因的表达。
图7.在表达p450的本氏烟草植物中大麻素的增强糖基化作用。cb1-cb5是过表达cyp3a4+p450氧化还原酶的生物代表,p_control是p19沉默抑制子(“空载体”对照)。纵轴表示相对量,表示为每克鲜重的峰面积。
图8.细胞质和悬浮培养大麻素生产系统的基因构建体。35s,花椰菜马赛克35s启动子;hspt,hsp终止子;35ppdk,杂交启动子,由花椰菜花叶病毒35s增强子融合到玉米c4ppdk基础启动子上(yoo等人,2007);76g1,来自甜叶菊的udp糖基转移酶;abcg2,人多药转运蛋白。
图9.证明rt-pcr证实了烟草叶细胞中cbda合酶(a)、udp糖基转移酶(b)和abcg2(c)的表达。l是1kb加梯子(thermofisherscientific,美国)。泳道上的数字代表独立的转基因品系。箭头指向显示转基因表达的预期条带。
图10.过表达cbda合酶、udp糖基转移酶和abc转运蛋白的转基因烟草(sus,编号)中大麻素的羟化和糖基化。wts1和2是野生型,内含底物用于内源性反应。有一些内源性cbga糖基化,以及转基因糖基转移酶活性增强的证据(例如sus2、sus3和sus4)。数据已校正为每克鲜重的峰面积。
图11.与构建体共感染的转基因本氏烟草植物中大麻素的增强修饰,用于糖基化,p450介导的功能化(羟基化)和过氧化氢被过氧化氢酶解毒。sus=用于过表达cbda合酶、udp糖基转移酶和abc转运蛋白的构建体;m3s=用于与大麻myb12样和拟南芥过氧化氢酶一起过表达cbda合酶、udp糖基转移酶和abc转运蛋白的构建体。
图12.在14小时瞬时表达分析中,与野生型相比,过表达糖基转移酶的转基因本塞姆氏烟草植物(tsa、tsb、tsc、sus、sus/p450)中糖基化活性的增加。
图13.由细胞色素p450催化的示例性单加氧酶反应。
图14.毛状体大麻素生产系统的基因构建体1。花椰菜花叶35s启动子;atadh5'-utr,翻译增强子(matsui等人,2012);tscbda,大麻二酚酸合酶,具有其原始的毛状体靶向序列;hsp终止子;tsugt76g1,来自甜叶菊的udp糖基转移酶,带有cbdas毛状体靶向序列。
图15.毛状体大麻素生产系统的基因构建体2。花椰菜花叶35s启动子;atadh5’-utr,增强元件;pm-utr1,拟南芥udp-葡萄糖/半乳糖转运蛋白,靶向质膜;hsp终止子。
图16.毛状体靶向cbda合酶rt-pcr(上图),毛状体靶向udp糖基转移酶(76g1)ugtrt-pcr(下图)。a、b和c是2dpi后收集的生物学重复样本。
图17.pm-utr1rt-pcr。a、b和c是2dpi后收集的生物学重复样本。
图18.细胞溶质大麻素生产系统的基因构建体。花椰菜花叶35s启动子;atadh5’-utr,增强元件;cytcbda,大麻二酚酸合酶,去除了毛状体靶向序列;hsp终止子;cytugt76g1,来自甜叶菊的udp糖基转移酶。
图19.sus-a到sus-c是1dpi后细胞悬浮液(201-sus)转化的生物学复制品。
图20.cytugtrt-pcr(上图),cytcbdasrt-pcr(下图)。a、b和c是2dpi后细胞溶质构建体浸润的生物学复制品。
图21.在用毛状体或细胞悬液构建体浸润并饲以2.7mmcbga的叶片中检测大麻素。颜色代码指的是cbda和ugt76g1蛋白质堆积的靶区,可能是毛状体或细胞悬浮液细胞甾醇。y轴:cbga和cbda以百万分率(ppm)表示。一级、二级和酰化糖苷以峰面积表示。
图22.在浸有细胞溶质或细胞悬浮液构建物并饲以2.7mmcbga和4mmudp-葡萄糖的叶片中的大麻素检测。颜色代码是指cbda和ugt76g1蛋白质积累的目标区室。y轴:cbga,表示为百万分之一(ppm)。所有其他大麻素衍生物均以峰面积表示(无标准品)。
图23.r-oh功能化的1x糖基化cbda类似物的提取离子色谱图。(a)色谱痕量,离子m/z,计算出的元素组成,确认存在痕量cbda类似物(b)对照提取物中不存在cbda类似物(c)生物学重复对照提取物中不存在cbda类似物。
图24.大麻提取物的直接输注质谱。光谱插图代表具有单个糖基化(519.2546m/z)的cbda,以及具有r-oh和单个糖基化(535.2543m/z)功能的cbda。峰强度显示为相对于最强离子的相对丰度。
图25.用具有cbda合酶(cbda)和ugt质粒组合的土壤杆菌培养物渗入的各种大麻品种的提取物中cbda的相对丰度。归一化的相对丰度数据表示为每种化合物的离子强度除以内标7-羟基香豆素(20ppm)的离子强度。
图26.用具有cbda和ugt质粒组合的土壤杆菌培养物渗透的各种大麻苜蓿菌株的提取物中经修饰的cbda(糖基化和/或羟基化)的相对丰度。归一化的相对丰度数据表示为每种化合物的离子强度除以内标7-羟基香豆素(20ppm)的离子强度。
图27.用于增强大麻素生产和减轻毒性的基因构建体。csmyb12,预测的大麻myb转录因子,可增强黄酮生物合成;hspt,来自拟南芥热激蛋白18.2基因的有效转录终止子;35s,花椰菜花叶病毒的组成型启动子;过氧化氢酶,拟南芥过氧化氢酶基因。
图28.由普通的前体cbga合成thc和cbd。
图29.大麻素生物合成过程中过氧化氢的产生。
图30.羟基化,然后通过cyp2c9/氧化thc。
图31.通过ugt将葡糖醛酸成分转移至大麻素底物。
图32.合成橄榄油酸cbga的前体。
图33.示例性拟南芥过氧化氢酶蛋白质序列的氨基酸序列比较。
图34.在其一个实施方案中,增加的大麻素产生与减少的氧化损伤系统结合的示意图。
发明详述
本发明包括各种方面,这些方面可以以不同方式组合。提供以下描述以列出组分并描述本发明的一些实施例。这些组分与初始实施例一起列出,但是应该理解,它们可以以任何方式和任何数量组合以产生另外的实施例。不应将各种描述的示例和优选实施例解释为将本发明仅限于明确描述的系统、技术和应用。此外,该描述应被理解为支持和包含具有任何数量的所公开组分的所有各种实施例、系统、技术、方法、装置和应用的描述和权利要求,其中每个元素单独使用,以及该或任何后续申请中的所有元素的任何和所有各种排列和组合使用。
本发明的技术包括用于高水平产生大麻素化合物的系统和方法。如本文使用,在这种情况下,术语“高水平”可意味着高于植物或植物细胞中野生型生物合成或一种或多种大麻素的积累。在一个实施方案中,可以建立一种或多种植物株的悬浮液或毛状根或细胞悬浮培养物。在一个优选实施方案中,可以建立一种或多种大麻或烟草植物株的悬浮液或毛状根或细胞悬浮培养物。应当注意,术语株可以指植物株、以及细胞培养物、或来源于植物(例如大麻)的细胞系。
在一个优选实施方案中,可以在发酵罐或其他类似装置中建立大麻或烟草植物的悬浮或毛状根或细胞悬浮培养物。应该注意的是,在该实施方案中c.sativa的使用仅是示例性的。例如,在某些其他实施方案中,可以使用各种大麻株、株的混合物、不同株或克隆的杂种以及不同品种来产生悬浮或毛状根培养物。例如,诸如c.sativa、c.indica和c.ruderalis的株都可以用于本发明的技术。在其他实施方案中,可以使用其他大麻素或大麻素样产生物。例如,在某些实施方案中,可以建立细胞悬浮液或毛状根培养物用于以下一种或多种:紫锥菊;千日菊;helichrysumumbraculigerum;radulamarginata(liverwort)、可可树或烟草。
在某些实施方案中,这样的发酵罐可以包括大型工业规模的发酵罐,其允许培养大量的大麻素产生的c.sativa细胞。在这个实施方案中,可以从单株例如烟草或c.sativa中培养大量未掺杂的细胞,这可以建立细胞培养物,其在数量和类型上都具有大麻素化合物的一致的产生和/或修饰。使用向培养物中补充营养和其他生长因子,可以持续维持这种培养物的生长。这些特征可以是自动的或手动完成的。
本发明技术的另一个实施方案可包括用于高水平产生修饰的大麻素化合物的系统和方法。在一个实施方案中,可以建立一种或多种烟草植物株的悬浮或毛状根培养物。应当注意,术语株可以指植物株、以及细胞培养物或源自烟草植物的细胞系。在一个优选实施方案中,可以在发酵罐或其他类似装置中建立本生烟植物的悬浮或毛状根培养物。应该注意的是,在该实施方案中使用n.benthamiana仅是示例性的。例如,在某些其他实施方案中,各种烟草属株、株混合物、不同株或克隆的杂种以及不同变种可用于产生细胞悬浮液或毛状根培养物。
在某些情况下,这种发酵罐可包括允许培养大量的n.benthamiana细胞的大型工业规模的发酵罐。在这个实施方案中,可以将收获的大麻素引入该悬浮培养物中,并如本文一般描述的那样进行修饰。类似地,通过向培养物中添加营养素和其他生长因子的连续添加,可以持续维持烟草细胞的这种培养生长。这些特征可以是自动的或手动完成的。
本发明的另一个实施方案可包括产生遗传修饰的大麻和/或烟草细胞,以表达可修饰大麻素化合物的化学结构的不同外源和/或内源性基因。这些转基因株可以配置为通常产生和/或修饰大量的大麻素化合物,以及特定大麻素类(例如thc、大麻二酚(cbd)或大麻酚(cbn)等)的产生的目标增加。
本发明的另一个实施方案可以包括产生遗传修饰的大麻细胞培养物,其表达可以被优化用于治疗特定的医学病症的大麻素的混合物。例如,cbd是一种非精神活性的大麻素,可用于治疗癫痫患者的癫痫发作。然而,当与精神活性大麻素thc相比时,数十年的选择性育种导致大多数大麻菌株具有低浓度的cbd。因此,在某些实施方案中,可以开发疾病或综合征特异性细胞培养物,其表达用于下游处理这些病症的大麻素的校准混合物。
本发明技术的另外的实施方案可包括用于在植物系统中产生和体内修饰大麻素化合物的新系统、方法和组合物。在某些实施方案中,这些体内修饰可导致产生具有特殊性质的不同形式的大麻素,例如水溶性缓释大麻素或前药。在一个优选实施方案中,本发明的技术可包括用于羟基化、乙酰化和/或糖基化的新系统、方法和组合物。修饰的大麻素可以例如通过糖基化而是水溶性的。
如上所述,高水平大麻素的产生和/或积累对植物细胞宿主是有毒的。因此,本发明技术的一个实施方案可包括在体内瞬时修饰大麻素的系统和方法。本发明的一个目的可包括使用细胞色素p450(cyp)单加氧酶来瞬时修饰或官能化大麻素的化学结构。cyp构成能够催化许多药理活性化学化合物和其他亲脂性外源物的氧化生物转化的主要酶家族。例如,如图13所示,由细胞色素p450催化的最常见的反应是单加氧酶反应,例如,将一个氧原子插入有机底物(rh)的脂肪族位置,而另一个氧原子被还原为水。
几种大麻素,包括thc,已被证明可作为人cyp(cyp2c9和cyp3a4)的底物。同样,已经鉴定cyp代谢大麻二酚(cyp2c19,3a4)、大麻酚(cyp2c9,3a4)、jwh-018(cyp1a2,2c9)和am2201(cyp1a2,2c9)。例如,如图30中一般所示,在一个示例性系统中,cyp2c9可以“官能化”或羟基化thc分子,从而导致羟基形式的thc。cyp2c9对thc的羟基形式的进一步氧化可将其转化为失去精神活性能力的羧酸形式,从而使其成为无活性的代谢物。
因此,本发明的另一个实施方案可以包括产生可以用编码一种或多种外源cyp的人工产生的遗传构建体转化的大麻株或细胞培养物。在一个优选实施方案中,编码一种或多种非人同种型和/或类似物的基因以及可使大麻素官能化的其他cyp,可以在转基因cannabissativa或其他植物中表达。在另外优选的实施方案中,编码一种或多种非人同种型和/或类似物的基因以及可使大麻素官能化的其他cyp,可以在转基因cannabissativa或烟草株(在悬浮培养中生长)中表达。另外的实施方案可以包括遗传控制元件,例如启动子和/或增强子以及也可以在转基因大麻株中表达的转录后调控元件,使得存在于悬浮或毛状根培养物中的任何cyp的存在、数量和活性可以修改和/或校准。
本发明的另一个实施方案可以包括产生可以使用编码一种或多种外源cyp的人工产生的遗传构建体转化的烟草株或细胞培养物。在一个优选实施方案中,编码一种或多种非人同种型和/或类似物的基因、以及可使大麻素官能化的可能其他cyp引入转基因n.benthamiana植物或悬浮培养物。另外的实施方案可以包括遗传控制元件,例如启动子和/或增强子以及也可以在转基因n.benthamiana株中表达的转录后调控元件,使得存在于悬浮或毛状根培养物中的任何cyp的存在、数量和活性可以修改和/或校准。
本发明的另一个目的可以是在体内进一步修饰大麻素和/或已经官能化大麻素。在优选的实施方案中,大麻素和/或官能化大麻素的糖基化可以将它们转化为水溶性形式。在图31所示的示例性实施方案中,本发明的技术可利用一种或多种糖基转移酶,例如udp-糖基转移酶(ugt),以在体内催化大麻素的葡糖醛酸化或葡糖醛酸化,例如初级(cbd、cbn)和次级大麻素(thc、jwh-018、jwh-073)。在这个实施方案中,葡糖醛酸化可以由通过如本文所述的几种类型的糖基转移酶中的任何一种将尿苷二磷酸葡糖醛酸的葡糖醛酸组分转移至大麻素底物组成。葡糖醛酸是一种衍生自葡萄糖的糖酸,其第六个碳原子被氧化成羧酸。
本发明的另一个实施方案可以包括将官能化的大麻素(在该例子中为大麻素的羧酸形式)体内转化为可以是水溶性的并且对细胞宿主无毒的大麻素的糖基化形式。这些化学修饰可以允许更大水平的大麻素在植物细胞培养物中积累,而没有由于这种水溶性而在未修饰的大麻素中看到的有害细胞毒性作用。
本发明的另一个实施方案可包括产生大麻或其他植物如烟草的转基因或遗传修饰的株,其具有可表达一种或多种可增加大麻素溶解度和/或降低大麻素细胞毒性的基因的人工基因构建体。例如,本发明的技术可以包括产生具有人工遗传构建体的转基因植物株或细胞系,所述人工遗传构建体可以表达一种或多种内源/外源糖基转移酶或能够使大麻素化合物糖基化的其他酶。例如,在一个实施方案中,可以将来自n.benthamiana或其他非大麻植物的一种或多种糖基转移酶引入大麻植物或细胞培养物中,并配置成在体内糖基化大麻素。在其他实施方案中,来自n.benthamiana的内源性糖基转移酶可过表达以增加体内大麻素糖基化。
在另外的实施方案中,本发明技术可以包括产生具有编码一种或多种糖基转移酶的基因的人工遗传构建体,包括本文所述的那些以及其他同种型的非人类似物,还可以在可以进一步在悬浮培养物中生长的转基因cannabissativa、n.benthamiana或其他植物系统中表达。另外的实施方案可以包括遗传控制元件,例如启动子和/或增强子以及也可在转基因植物系统中表达的转录后调节控制元件,使得可以调节在悬浮液或毛状根培养物中存在的任何糖基转移酶的存在、数量和活性。
本发明的另一个实施方案可以包括具有一个或多个基因的人工遗传构建体,所述基因编码具有定位序列或结构域(可以帮助蛋白移动到细胞的某一部分,例如细胞位置是大麻素和/或官能化大麻素)的一种或多种udp-和/或adp-糖基转移酶,可以从细胞中修饰、产生、储存和/或排泄。
本发明的另一个实施方案可以包括具有一个或多个基因的人工遗传构建体,所述基因编码与一种或多种外源基因(可以帮助蛋白移动到细胞的某一部分,例如细胞位置是大麻素和/或官能化大麻素)共表达的一种或多种udp-和/或adp-糖基转移酶,可以从细胞中储存和/或排泄。
本发明技术的一个优选实施方案可包括水溶性糖基化大麻素(通常称为可从植物或细胞培养物中收获的瞬时修饰的大麻素)的高水平体内产生。在一个实施方案中,瞬时修饰的大麻素可能在作为悬浮培养物一部分的细胞内积累。在该例子中,可使细胞培养物生长至所需的细胞水平或光密度,或在其他情况下,直至所需水平的瞬时修饰的大麻素已在培养的大麻细胞中积累。这些外源基因可以定位于例如本文一般描述的细胞溶质或毛状体,并且可以进一步与其他外源基因(可以减少大麻素的生物合成毒性和/或促进大麻素通过细胞或转运出细胞外)共表达。
然后可以从培养物中收获含有累积的瞬时修饰的大麻素的全部或部分大麻细胞,在优选的实施方案中,培养物可以是工业规模的发酵罐或适于大规模培养植物细胞的其他装置。收获的大麻细胞可以被裂解,使得累积的瞬时修饰的大麻素可以释放到周围的裂解物中。其他步骤可包括处理该裂解物。这种处理的实例可包括过滤或筛选该裂解物以除去外来植物材料以及化学处理以改善后来的大麻素产量。
本发明技术的另一个实施方案可包括高水平体内产生水溶性糖基化大麻素,通常称为可从植物或细胞培养物中收获的瞬时修饰的大麻素。在一个实施方案中,可以将大麻素引入非大麻素产生细胞培养物,例如n.benthamiana。在这个优选实施方案中,非大麻素产生细胞培养物可以遗传修饰以表达可以例如通过羟基化、乙酰化和/或糖基化来修饰大麻素的一种或多种内源性或外源基因。这种内源性或外源基因可以定位于例如本文一般描述的胞质溶胶或毛状体,并且可以进一步与其他外源基因(可以减少大麻素的生物合成毒性和/或促进大麻素通过细胞或转运出细胞外)共表达。
该非大麻素产生细胞培养物可以被允许生长至所需水平的细胞或光密度,或在其他情况下,直至所需水平的瞬时修饰的大麻素已在培养的细胞中积累。然后可以从培养物中收获含有累积的大麻素的全部或部分n.benthamiana细胞,在优选的实施方案中,培养物可以是工业规模的发酵罐或适于大规模培养植物细胞的其他装置。可以裂解收获的n.benthamiana细胞,使得累积的瞬时修饰的大麻素可以释放到周围的裂解物中。其他步骤可包括处理该裂解物。这种处理的实例可包括过滤或筛选该裂解物以除去外来植物材料以及化学处理以改善后来的大麻素产量。
本发明技术的另一个目的可包括从植物或悬浮培养物中分离和纯化瞬时修饰的大麻素的方法。在一个优选实施方案中,可以使用亲和层析或其他纯化方法产生和处理大麻裂解物。在这个优选实施方案中,具有配体或蛋白受体的亲和柱被配置成与瞬时修饰的大麻素结合,例如通过与糖基或葡糖醛酸官能团等结合,可以固定或偶联到固体载体上。然后裂解物可以通过柱,使得对配体具有特异性结合亲和力的瞬时修饰的大麻素结合并固定化。在一些实施方案中,可以去除裂解物中可存在的非结合和非特异性结合蛋白。最后,瞬时修饰的大麻素可以通过例如可以取代或破坏大麻素-配体键的相应糖或其他化合物从亲和柱上洗脱或置换。可以收集洗脱的瞬时修饰的大麻素并进一步纯化或加工。
本发明的目的可包括一个实施方案,其中瞬时修饰的大麻素可被动地和/或主动地从细胞或细胞壁排泄。在一个示例性模型中,外源atp结合盒转运蛋白(abc转运蛋白)或其他类似的分子结构可识别瞬时修饰的大麻素上的糖基或葡糖醛酸官能团(缀合物)并主动地将其运输穿过细胞壁/膜并进入周围介质。在这个实施方案中,可以允许细胞培养物生长直至达到输出参数。在一个例子中,输出参数可包括允许细胞培养物生长直至达到所需细胞/光密度,或达到所需浓度的瞬时修饰的大麻素。在这个实施方案中,可以收获含有瞬时修饰的大麻素的培养物用于以后的大麻素提取。在一些实施方案中,可以以与上文一般描述的裂解物类似的方式处理该收获的培养物。另外,存在于原始和/或处理过的培养基中的瞬时修饰的大麻素可以例如通过亲和层析以与上述类似的方式分离和纯化。
在某些实施方案中,这种纯化的大麻素分离物可含有初级和次级糖基化大麻素的混合物。如上所述,这种纯化的糖基化大麻素可以是水溶性的并且比未修饰的大麻素更慢地代谢,从而提供在某些药物应用中可能需要的缓释能力,例如用于组织特定应用或者作为前药。因此,本发明的一个目的是将这种纯化的糖基化大麻素掺入各种药物和/或营养品应用中。
例如,纯化的糖基化大麻素可以掺入各种固体和/或液体递送载体中以用于药物应用。如上所述,这些瞬时修饰的大麻素可能不再具有其精神活性成分,使得它们在研究、治疗和药物应用中的应用特别有利。例如,儿童的治疗可以通过给予治疗剂量的分离和纯化的瞬时修饰的大麻素来实现,而没有不希望的精神活性作用。另外的治疗应用可包括收获和随后施用治疗剂量的“随从”分离和纯化的瞬时修饰的大麻素。
本发明的另一个实施方案可包括转化或重构瞬时修饰的大麻素的系统。在一个优选实施方案中,糖基化大麻素可通过一种或多种广义或特异性糖苷酶处理而转化为非糖基化大麻素。本领域技术人员将认识到糖苷酶的用途和可用性,而无需过多的实验。在这个实施方案中,这些糖苷酶可以去除糖部分。具体地,这些糖苷酶可以除去糖苷或葡糖醛酸部分,将大麻素化合物重构成具有精神活性活性的形式。这种重构过程可以产生高度纯化的“随从”的初级和次级大麻素。这些重构的大麻素化合物也可以掺入各种固体和/或液体递送载体中,用于各种药物和其它商业应用。
如上所述,在本发明的一个实施方案中,产生大麻素的大麻株以及其他植物可以用于本发明的技术。在某些优选的实施方案中,代替在细胞培养物中培养目标大麻素产生植物,可以收获原始植物材料并利用本文所述的一种或多种方法进行大麻素提取。这些传统上提取的大麻素可以通过体外应用一种或多种cyp从其天然形式进行修饰,所述cyp可分别产生这些大麻素的羟基和羧酸形式。这些官能化的大麻素可以通过体外应用如本文一般描述的一种或多种糖基转移酶进一步修饰。在这个实施方案中,新的瞬时修饰的大麻素可以通过亲和层析或其他提取方案的过程分离和纯化,然后应用于各种商业和其他治疗用途。在其他实施方案中,可以通过体外施用一种或多种糖苷酶来恢复和重建瞬时修饰的大麻素。这些恢复的大麻素也可用于各种商业和其他治疗用途。
本发明的另一个实施方案可包括使用其他非大麻素产生植物代替在细胞培养物中培养大麻素产生植物。这里,大麻素可以引入遗传修饰的植物或表达一种或多种cyp的植物细胞培养物,其可分别产生这些大麻素的羟基和羧酸形式。这些官能化的大麻素可以通过一种或多种糖苷酶的作用进一步修饰,所述糖苷酶也可以在非大麻素产生植物或细胞培养物中表达。在一个优选实施方案中,非大麻素产生细胞培养物可包括烟草植物或细胞培养物。
本发明的一个实施方案可包括靶向毛状体的大麻素积累和修饰的体内方法。该体内系统的一个优选实施方案可包括产生重组蛋白,该重组蛋白可允许cyp或糖基转移酶转移至整株植物中的细胞外大麻素合成位点。更具体地,在这个优选实施方案中,可以将一种或多种cyp或糖基转移酶工程化以表达大麻素合酶蛋白中存在的全部或部分n-末端细胞外靶向序列,例如thca合酶或cbda合酶。
本发明的另一个实施方案可包括高水平毛状体靶向大麻素生物合成、积累和/或修饰的体内方法。该体内系统的一个优选实施方案可包括产生重组蛋白,该重组蛋白可允许过氧化氢酶在整株植物中易位至细胞外大麻素合成位点。更具体地,在这个优选实施方案中,可以将一种或多种过氧化氢酶设计成表达大麻素合成酶蛋白中存在的全部或部分n-末端细胞外靶向序列,例如thca合酶或cbda合酶。在这个实施方案中,过氧化氢酶可以靶向大麻素生物合成的位点,使其更有效地中和过氧化氢副产物。
在这个优选实施方案中,该n-末端毛状体靶向序列或结构域通常可包括广义合酶的前28个氨基酸残基。用于thca合酶的示例性毛状体靶向序列被鉴定为seqidno.40,而用于cbda合酶的毛状体靶向序列被鉴定为seqidno.41。该细胞外靶向序列可被植物细胞识别并导致糖基转移酶从细胞质转运至植物的三色,特别是植物三色的储存室,其中可发生细胞外大麻素糖基化。更具体地,在这个优选实施方案中,可以将一种或多种糖基转移酶(例如udp糖基转移酶)工程化以表达如示例性合酶类酶中存在的全部或部分n-末端细胞外靶向序列。
本发明的另一个实施方案可以包括细胞溶质靶向大麻素的产生、积累和/或修饰的体内方法。该体内系统的一个优选实施方案可包括产生重组蛋白,其可允许大麻素合酶和/或糖基转移酶定位于胞质溶胶。
更具体地,在这个优选实施方案中,一种或多种大麻素合酶可以修饰以去除全部或部分n-末端细胞外靶向序列。用于thca合酶的示例性毛状体靶向序列被鉴定为seqidno.40,而用于cbda合酶的毛状体靶向序列被鉴定为seqidno.41。与细胞溶质靶向的cyp或糖基转移酶共表达这种细胞溶质靶向合酶,可以使大麻素的合成、积累和修饰定位于胞质溶胶。此类胞质靶酶可与过氧化氢酶、abc转运蛋白或可降低大麻素生物合成毒性和/或促进通过或离开细胞的其他基因共表达。
本发明的另一个实施方案可包括产生包含该多核苷酸的表达载体,即大麻素合成酶n-末端细胞外靶向序列和糖基转移酶基因,其可操作地连接于启动子。遗传改变的植物或其部分及其后代,其包含与启动子可操作地连接的该多核苷酸,其中所述植物或其部分及其后代产生所述嵌合蛋白是另一个实施方案。例如,种子和花粉含有该多核苷酸序列或其同源物,遗传改变的植物细胞包含与启动子可操作地连接的该多核苷酸,使得所述植物细胞产生所述嵌合蛋白。另一个实施方案包括组织培养物,其包含多种遗传改变的植物细胞。
本发明的另一个实施方案提供遗传改变的植物或细胞,其表达嵌合或融合蛋白,所述蛋白具有与udp糖基转移酶基因(与启动子可操作地连接)偶联的大麻素合酶n-末端细胞外靶向序列(即参见seqid:40-41;还参见用于thca合酶的完整氨基酸序列的seqidno.42)。另一个实施方案提供用于构建遗传改变的植物或其部分的方法,所述植物或其部分在植物三色的细胞外储存室中与非遗传改变的植物或其部分相比具有大麻素的糖基化,该方法包括以下步骤:将编码上述蛋白的多核苷酸引入植物或其部分中以提供遗传改变的植物或其部分,其中所述嵌合蛋白包含第一结构域、第二结构域,并且其中所述第一结构域包含大麻素合酶n-末端细胞外靶向序列,并且第二结构域包含糖基转移酶序列。这些结构域可以由第三结构域或接头分开。该接头可以是可以将第一结构域与第二结构域分开的任何核苷酸序列,使得第一结构域和第二结构域可以各自折叠成其合适的三维形状并保持其活性。
本发明的一个优选实施方案可包括遗传改变的植物或细胞,其表达靶向胞嘧啶的大麻素合酶蛋白,所述蛋白具有失活或去除的大麻素合成酶n-末端细胞外靶向序列(seqid.40-41)。在一个实施方案中,细胞溶质靶向thca合酶(ctthca)可以鉴定为seqidno.46,而在另一个实施方案中,细胞溶质靶向cbda合酶(cytcbda)被鉴定为seqidno.22-23)。这种细胞溶质靶向的大麻素合酶蛋白可以与启动子可操作地连接。另一个实施方案提供了构建遗传改变的植物或其部分的方法,所述植物或其部分与非遗传改变的植物或其部分相比在植物的胞质溶胶中具有大麻素的糖基化,该方法包括以下步骤:将编码上述蛋白的多核苷酸引入植物或其部分中以提供遗传改变的植物或其部分,其中所述大麻素合酶n末端细胞外靶向序列已被破坏或去除。
本发明的又一个实施方案可包括大麻细胞培养物中大麻素糖基化的体内方法。在一个优选实施方案中,为了促进大麻细胞培养物中大麻素的糖基化(缺乏细胞外三色结构),大麻素合酶基因可遗传修饰以例如通过定向突变去除或破坏细胞外n-末端靶向结构域,然后可以用于转化细胞培养物中的大麻植物细胞。在这个实施方案中,在没有这种靶向结构域的情况下,大麻素合酶,例如thca或cbda合酶,可以保留在植物细胞内,而不是主动转运出细胞,其中它可以用一种或多种糖基转移酶表达,例如在细胞质中的udp糖基转移酶。
本发明技术的另一个实施方案可包括用于在体内系统中增强大麻素化合物的产生和/或积累的系统和方法。在一个优选实施方案中,本发明可包括产生遗传修饰的或转基因大麻植物,其可以高于野生型水平产生和/或积累一种或多种大麻素。在一个实施方案中,可以产生转基因大麻植物以表达可以增强大麻素代谢途径的一种或多种cannabissativa转录因子。在一个优选实施方案中,可以产生编码一种或多种cannabissativamyb转录因子基因的多核苷酸,和/或增强通过大麻素生物合成途径的代谢物通量的一种或多种外源直向同源基因。
在这个优选实施方案中,可以产生编码一种或多种cannabissativamyb转录因子基因的多核苷酸,例如can833和/或can738。如图32所示,这些转录因子可以驱动olivetolicacid(cbga的前体,而cbga又是thc、cbd和cbc的生物合成途径的前体)的产生。在可替换的实施方案中,可以产生编码一种或多种cannabissativamyb转录因子基因直向同源物的多核苷酸,特别是大麻mybl2(seqid.11-12)、myb8(seqidno.43)、atmybl2(seqidno.44)和/或myb112(seqidno.45)也可以驱动olivetolicacid(cbga的前体,而cbga又是thc、cbd和cbc的生物合成途径中的前体)的产生。
在一个优选实施方案中,本发明可包括产生多核苷酸的方法,所述多核苷酸表达与本文鉴定的增强的大麻素产生相关的一种或多种seqid。在某些优选的实施方案中,可以使用许多系统中的任何一种来表达本发明的蛋白以获得所需量的蛋白。通常,将编码蛋白或其组分的多核苷酸置于在所需宿主细胞中有功能的启动子的控制下。可以获得极其多种类的启动子,并且可以根据具体应用用于本发明的表达载体中。通常,选择的启动子取决于启动子具有活性的细胞。还任选地包括其他表达控制序列,例如核糖体结合位点、转录终止位点等。包含一种或多种这些控制序列的构建体称为“表达盒”或“构建体”。因此,引入编码连接多肽的核酸以在所需宿主细胞中高水平表达。
本发明另外的实施方案可包括选择表达大麻素产生转录因子蛋白的遗传改变的植物或其部分,其中表达的蛋白增加大麻素的生物合成能力。在某些实施方案中,通过用包含与启动子可操作连接的所述多核苷酸的表达载体转化所述植物,引入编码大麻素产生转录因子蛋白的多核苷酸。大麻素产生转录因子蛋白可以包含选自seqidno:11-2或43-45的seqid,或其同源物的seqid。
如上所述,本发明的一个实施方案可包括用于体内系统中大麻素生物合成的一般和/或局部解毒的系统和方法。在一个优选实施方案中,本发明可以包括产生遗传修饰的或转基因的大麻或其他植物,其可以配置成能够解毒高于野生型水平的大麻素生物合成产生的过氧化氢副产物。此外,该解毒可以被配置为定位于大麻植物的胞质溶胶和/或毛状体结构,其中大麻素在整株植物系统中被积极合成。在本发明的该优选实施方案中,转基因植物,例如大麻或烟草植物或细胞,其表达可以上调过氧化氢解毒的一种或多种基因。
在一个优选实施方案中,可以产生编码一种或多种内源性和/或外源转录的多核苷酸,和/或催化过氧化氢还原的直向同源物:
因此,在一个实施方案中,本发明包括产生编码外源过氧化氢酶蛋白的多核苷酸,其可以在转化的植物和/或细胞培养物中表达。在优选的实施方案中,被配置为在大麻素合成期间产生的过氧化氢(h2o2)的过氧化氢酶可用于转化大麻或其他植物,例如烟草植物。虽然许多通用的过氧化氢酶可以包括在该第一结构域中,仅作为一个示例性模型,但是第一结构域可包括衍生自拟南芥的外源过氧化氢酶(seqidno.13-14;还参见图33)、或衍生自大肠杆菌的外源过氧化氢酶(seqidno.15-16)、或任何合适的过氧化氢酶同源物、蛋白片段、或具有如本文所定义的约70%至约100%的同源性的过氧化氢酶。
本发明的另一个实施方案可包括将过氧化氢酶定位于毛状体结构。如上文一般概述的,在该实施方案中,来自大麻素合酶的毛状体靶向序列可以与融合或嵌合体(这些术语在本申请中通常是可互换的)中的一种或多种过氧化氢酶偶联。该人工毛状体-靶过氧化氢酶基因可用于转化具有毛状体结构的植物,例如大麻或烟草。在优选的实施方案中,来自拟南芥的具有thca合酶毛状体靶向结构域的毛状体靶向过氧化氢酶被鉴定为seqidno.47,而具有cbda合酶毛状体靶向结构域的毛状体靶向过氧化氢酶拟南芥被鉴定为seqidno.48。在另外实施方案中,来自大肠杆菌的具有thca合酶毛状体靶向结构域的毛状体靶向过氧化氢酶被鉴定为seqidno.49,而具有cbda合酶毛状体靶向结构域的毛状体靶向过氧化氢酶大肠杆菌被鉴定为seqidno.50。
本发明的另一个实施方案包括产生编码嵌合/融合过氧化氢酶蛋白的核酸序列的多核苷酸。另一个实施方案包括含有与启动子可操作连接的该多核苷酸的表达载体。基因改变的植物或其部分及其后代,其包含与启动子可操作地连接的该多核苷酸,其中所述植物或其部分及其后代产生所述融合蛋白是另一个实施方案。例如,种子和花粉含有该多核苷酸序列或其同源物,遗传改变的植物细胞包含与启动子可操作地连接的该多核苷酸,使得所述植物细胞产生所述嵌合蛋白。另一个实施方案包括组织培养物,其包含多种遗传改变的植物细胞。
在优选的实施方案中,编码毛状体靶向融合蛋白的多核苷酸可以与适合于在大麻、烟草或其他植物中蛋白表达的启动子可操作地连接。示例性启动子可包括但不限于:非组成型启动子、诱导型启动子、组织优先启动子、组织特异性启动子、植物特异性启动子或组成型启动子。在优选的实施方案中,一种或多种选择的基因可以与叶特异性基因启动子可操作地连接,例如cabl。用于表达的其他启动子和可操作构型以及一种或多种所选基因的共表达在本领域中通常是已知的。
本发明的另一个实施方案可以提供一种构建遗传改变的植物或其部分的方法,与非遗传改变的植物或其部分相比,该植物或其部分具有增加的对大麻素合成期间产生的过氧化氢细胞毒性的抗性,该方法包括以下步骤:将编码融合蛋白的多核苷酸引入植物或其部分中以提供遗传改变的植物或其部分,其中所述融合蛋白包含过氧化氢酶和来自大麻素合酶的毛状体靶向序列。
在一个实施方案中,本发明可以包括一种增加整体大麻素在毛状体中的产生和积累,同时防止潜在的细胞毒性作用的系统。通常如图34所示,在优选的实施方案中,该系统可包括产生转基因大麻、烟草或其他植物或悬浮培养植物,其过表达至少一种myb转录因子以增加整体大麻素生物合成。在进一步优选的实施方案中,该转基因植物可以共表达过氧化氢酶,以减少与大麻素合成相关的过氧化氢产生导致的氧化损伤,从而降低细胞毒性。在某些优选的实施方案中,该过氧化氢酶可以与n-末端合酶毛状体靶向结构域融合,例如来自thca和/或cbda合酶,从而在整株植物系统的情况下帮助将过氧化氢酶定位到毛状体,并且潜在地减少由thca、cbca和/或cbda合成酶活性产生的过氧化氢的毒性水平。
本发明的另一个实施方案可包含编码以下组合的核酸序列的组合多核苷酸:1)大麻素产生转录因子蛋白,例如myb基因;和/或过氧化氢酶蛋白或其任何同源物,其可进一步包括毛状体靶向或定位信号。遗传改变的植物或其部分及其后代包含与启动子可操作地连接的该组合多核苷酸,其中所述植物或其部分及其后代产生所述蛋白质是另一个实施方案。例如,种子和花粉含有该多核苷酸序列或其同源物,遗传改变的植物细胞包含与启动子可操作地连接的该多核苷酸,使得所述植物细胞产生所述蛋白。另一个实施方案包括组织培养物,其包含多种遗传改变的植物细胞。
本发明的另一个实施方案可提供用于构建遗传改变的植物或其部分的方法,其具有:1)与非转基因植物或其部分相比,大麻素产量增加;和/或2)与非遗传改变的植物或其部分相比,在大麻素合成期间产生的对过氧化氢细胞毒性的抗性增加,该方法包括以下步骤:将组合多核苷酸引入植物或其部分中以提供遗传改变的植物或其部分。
本发明另外的实施方案可包括选择表达一种或多种蛋白的遗传改变的植物或其部分,其中表达的蛋白可具有:1)增加大麻素的产生能力,例如通过内源性myb基因的过表达;2)具有/或没有毛状体定位能力的过氧化氢酶、或其任何组合。在某些实施方案中,通过用包含与启动子可操作连接的所述组合多核苷酸的表达载体转化所述植物,引入编码蛋白质的组合多核苷酸。大麻素产生转录因子蛋白可包含选自本文鉴定的序列的seqid或其同源物。自然地,这样的组合和表达组合策略,例如在下面和其他地方的表7-8,10中鉴定,是示例性的,本文所述的元素的多种组合包括在本发明中。
在一个优选实施方案中,本发明的技术可包括高水平的体内大麻素羟化、乙酰化和/或糖基化和/或所有三者的组合的系统、方法和组合物。在优选的实施方案中,体内大麻素羟化、乙酰化和/或糖基化和/或三者的组合可以在大麻素产生植物或细胞培养系统中发生。而在替代实施方案中,可包括非大麻素产生植物或细胞培养系统,例如烟草植物,如n.benthamiana。
在一个实施方案中,本发明可包括大麻素的产生、积累和改良系统。在一个优选实施方案中,植物(例如大麻或烟草)可遗传修饰以表达一种或多种异源细胞色素p450基因。在这个优选实施方案中,异源人细胞色素p450(cyp3a4)seqidno.1可以在大麻素-产生植物或细胞培养系统中表达。虽然在替代实施方案中,异源人细胞色素p450(cyp3a4)可以表达非大麻素产生植物或细胞培养系统,例如烟草植物,如n.benthamiana,但是在这个实施方案中,鉴定为seqidno.2的异源人细胞色素p450蛋白的过表达可使内源性产生的大麻素官能化,使得它们可以在体内更有效地糖基化和/或乙酰化,从而使它们具有水溶性。
在可替换的实施方案中,本发明可包括大麻素的产生、积累和改良系统。在一个优选实施方案中,植物,如大麻或烟草,可以是遗传修饰的,以表达一种或多种异源细胞色素p450氧化还原酶基因。在这个优选实施方案中,鉴定为seqidno.3的异源细胞色素p450氧化还原酶(oxred)可以在大麻素产生植物或细胞培养系统中表达。虽然在替代实施方案中,异源人异源细胞色素p450氧化还原酶(oxred)可以表达非大麻素产生植物或细胞培养系统,例如烟草植物,如n.benthamiana,但是在这个实施方案中,鉴定为seqidno.4的异源细胞色素p450氧化还原酶(oxred)蛋白的过表达可使内源性产生的大麻素官能化,使得它们可以在体内更有效地糖基化和/或乙酰化,从而使它们具有水溶性。
在一个实施方案中,本发明可包括非大麻素产生植物中的大麻素产生、积累和改良系统。在一个优选实施方案中,植物(如烟草)可以遗传修饰以表达一种或多种异源细胞色素p450氧化还原酶基因。在这个优选实施方案中,鉴定为seqidno.3的异源细胞色素p450氧化还原酶(oxred)可以在大麻素-产生植物或细胞培养系统中表达。虽然在替代实施方案中,异源细胞色素p450氧化还原酶(oxred)可以表达非大麻素产生植物或细胞培养系统,例如烟草植物,如n.benthamiana,但是在这个实施方案中,鉴定为seqidno.4的异源细胞色素p450氧化还原酶(oxred)蛋白的过表达可有助于将大麻素的官能化引入遗传修饰的植物或植物细胞培养系统,使得它们可以在体内更有效地糖基化和/或乙酰化,从而使它们具有水溶性。
在一个优选实施方案中,细胞色素450和p450氧化还原酶共同表达。
在另外实施方案中,本发明可以包括在非大麻素产生植物或植物细胞培养系统中表达一种或多种外源或异源(这些术语通常是可互换的)大麻素合酶基因。在一个优选实施方案中,这种基因可包括cbg、thca、cbda或cbca合酶基因中的一种或多种。例如在一个实施方案中,来自cannabissativa的鉴定为seqidno.5(基因)或seqidno.6(蛋白)的大麻二酚酸(cbda)合酶可以使用在非大麻产生植物中表达,例如n.benthamiana的植物细胞悬浮培养物。在另外优选的实施方案中,来自cannabissativa的鉴定为seqidno.42(基因)的四氢大麻酚酸(thca)合酶可以使用在非大麻产生植物中表达,例如n.benthamiana的植物细胞悬浮培养物。
在另外优选的实施方案中,在大麻素和/或非大麻素植物或植物细胞悬浮培养物中表达的这种大麻素合酶基因可以靶向或定位于细胞的某些部分。例如在一个优选实施方案中,大麻素的产生可局限于细胞质,使大麻素在细胞质中积累。在一个示例性实施方案中,可以产生人工修饰的大麻素合酶蛋白。在这个示例性实施方案中,cbda合酶可以具有毛状体靶向序列,去除形成被鉴定为seqidno.22(基因)或23(蛋白)的细胞溶质cbda合酶(cytcbda)。替换的实施方案将包括产生其他人工细胞溶胶靶合酶基因,例如鉴定为seqidno.46(基因)的胞质thca合酶(cytthca)。
这些优选的实施方案可特别适用于大麻素细胞悬浮培养大麻素表达系统,因为这种培养系统缺乏整株植物中存在的毛状体。因此,在一个优选实施方案中,大麻素产生植物可以转化为一种或多种缺乏毛状体靶向信号的人工细胞溶质靶向大麻素合酶基因。在可替换的实施方案中,这种人工细胞溶质靶向大麻素合酶基因可以在大麻素产生植物悬浮培养物中表达,其中相应的内源性野生型合酶基因已经被抑制和/或敲除。
在一个实施方案中,本发明可包括可产生水溶性大麻素的大麻素产生、积累和改良系统。在一个优选实施方案中,植物,例如大麻或烟草,可以是表达一种或多种异源糖基转移酶基因,例如udp糖基转移酶。在这个优选实施方案中,来自甜叶菊的udp糖基转移酶(76g1)(seqidno.7)(基因)/seqidno.8(蛋白)可以用大麻素产生植物或细胞悬浮培养物表达。在优选的实施方案中,大麻素产生植物或细胞悬浮培养可以是大麻。在另外实施方案中,来自烟草的一种或多种糖基转移酶和/或来自本生烟的同源糖基转移酶可以在大麻素产生植物中表达,例如大麻,或者可以在内源性植物和/或植物细胞培养系统中过表达。在优选的实施方案中,糖基转移酶基因和/或蛋白可选自示例性植物,例如烟草。这种糖基转移酶基因和/或蛋白质可包括但不限于:糖基转移酶(ntgt5a)烟草(seqidno.26)(氨基酸);糖基转移酶(ntgt5a)烟草(seqidno.27)(dna);糖基转移酶(ntgt5b)烟草(seqidno.28)(氨基酸);糖基转移酶(ntgt5b)烟草(seqidno.29)(dna);udp-糖基转移酶73c3(ntgt4)烟草(seqidno.30)(氨基酸);udp-糖基转移酶73c3(ntgt4)烟草(seqidno.31)(dna);糖基转移酶(ntgtlb)烟草(seqidno.32)(氨基酸);糖基转移酶(ntgtlb)烟草(seqidno.33)(dna);糖基转移酶(ntgtla)烟草(seqidno.34)(氨基酸);糖基转移酶(ntgtla)烟草(seqidno.35)(dna);糖基转移酶(ntgt3)烟草(seqidno.36)(氨基酸);糖基转移酶(ntgt3)烟草(seqidno.37)(dna);糖基转移酶(ntgt2)烟草(seqidno.38)(氨基酸)和/或糖基转移酶(ntgt2)烟草(seqidno.39)(dna)。来自烟草的序列仅是示例性的,因为可以使用其他烟草糖基转移酶。
如上所述,这种糖基转移酶可以使植物或植物细胞悬浮培养物中的大麻素和/或官能化的大麻素糖糖化,如本文一般描述的。当然,来自替代来源的其他糖基转移酶基因可以包括在本发明中。
如上所述,在一个实施方案中,可以将一种或多种糖基转移酶靶向或定位于植物细胞的一部分。例如在这个优选实施方案中,大麻素糖基化可以定位于毛状体,以使大麻素在该结构中以更高的野生型水平积累。在一个示例性实施方案中,可以产生人工修饰的糖基转移酶。在该示例性实施方案中,udp糖基转移酶(76g1)可以在其n-末端尾部与毛状体靶向序列融合。该毛状体靶向序列可以被细胞识别并使其被运输到毛状体。该人工基因构建体被鉴定为seqidno.19(基因)或seqidno.20(蛋白)。在一个实施方案中,毛状体靶向序列或结构域可以衍生自任何数量的合酶。例如,在一个实施方案中,thca合酶毛状体结构域(seqidno.40)可以与糖基转移酶偶联,如上所述。此外,在另一个实例中,cbda合酶毛状体靶向结构域(seqidno.41)可以与如上所述的糖基转移酶偶联。
在另外实施方案中,本发明可以包括实施方案,其中瞬时修饰的大麻素可以被动地和/或主动地从细胞排泄到细胞壁中。在一个示例性模型中,外源atp结合盒转运蛋白(abc转运蛋白或abct)或其他类似的分子结构可识别瞬时修饰的大麻素上的糖基或葡糖醛酸或乙酰基官能团(缀合物)并主动转运穿过细胞壁/膜并进入周围介质。
在一个实施方案中,可以转化植物以表达异源abc转运蛋白。在这个实施方案中,abct可促进大麻素在悬浮培养物中的细胞外转运,例如大麻或烟草细胞悬浮培养。在这个优选实施方案中,人多药物转运(abcg2)可分别在其植物细胞悬浮培养物中表达。abcg2是质膜定向蛋白,并且可以进一步鉴定为seqidno.9(基因)或10(蛋白)。
通常,毛状体结构,例如在大麻或烟草中,将具有非常少或没有用于糖基转移酶的底物来用于实现糖基化。为了解决此问题,在一个实施方案中,本发明可包括增加糖基转移酶底物的系统、方法和组合物,即毛状体中的选择糖。在一个优选实施方案中,本发明可包括将糖转运到毛状体的靶向或定位。在这个优选实施方案中,外源或内源性udp-葡萄糖udp-半乳糖转运蛋白(utr1)可以在毛状体产生植物中表达,例如大麻或烟草等。在这个实施方案中,udp-葡萄糖/udp-半乳糖转运蛋白(utr1)可以修饰以包括质膜靶向序列和/或结构域。
利用该靶向结构域,udp-葡萄糖/udp-半乳糖转运蛋白(utr1)可以允许人工融合蛋白锚定至质膜。在这种构型中,来自胞质溶胶的糖底物可以通过质膜结合udp-葡萄糖udp-半乳糖转运蛋白(pm-utr1)进入毛状体。在这个实施方案中,糖基转移酶的底物可以定位于毛状体并允许进一步积累,从而允许毛状体中大麻素的糖基化增强。在一个实例中,seqidno.21被鉴定为来自拟南芥的异源udp-葡萄糖/半乳糖转运蛋白(utr1)的多核苷酸基因序列,其具有替代液泡膜靶向序列的质膜靶向序列。该示例性融合蛋白的质膜靶向序列可包括以下序列(参见seqidno21)tgctccataatgaacttaatgtgtgggtctacctgcgccgct、或与序列具有70-99%同源性的序列。
应当注意,本文所述的基因/蛋白的许多组合和排列可以共表达,从而实现本发明的一个或多个目标。这些组合仅是优选实施方案的示例,并不以任何方式进行限制。
在一个实施方案中,可以抑制、下调、破坏或甚至敲除基因,例如大麻素合酶,或与例如信号结构域相对应的基因片段。本领域普通技术人员将认识到可以在没有过度实验的情况下实现此目的的许多过程。在其他实施方案中,敲除可能意味着与野生型版本相比,修饰的内源或外源基因的过表达。
例如,在一个实施方案中,通过在n.benthamiana中共表达cyp3a4和cyp氧化还原酶(细胞色素p450与p450氧化还原酶)和至少一种内源性糖基转移酶,可以产生高水平的大麻素糖基化。在另外实施方案中,内源性或外源基因中的一种或多种可以在植物或植物细胞培养物中表达,同时表达myb和/或过氧化氢酶。在这种配置中,在cannabissativa的水溶性大麻素(糖基化和羟基化)的合成中存在过量表达myb转录因子和过氧化氢酶的累加效应,其中一种或多种可以被靶向或定位。
在某些实施方案中,内源性大麻素可以如本文一般描述的那样被官能化和/或乙酰化和/或糖基化。
本文描述的所有序列包括与所鉴定的序列具有70-99%同源性的序列。
本发明的修饰的大麻素化合物可用于多种治疗应用。例如,该化合物可用于治疗或缓解涉及cb1和cb2受体的疾病和病症的症状,包括食欲减退、恶心和呕吐、疼痛、多发性硬化和癫痫。例如,它们可用于治疗各种应用中的疼痛(即作为止痛剂),包括但不限于疼痛控制。在另外的实施方案中,这种修饰的大麻素化合物可用作食欲抑制剂。另外的实施方案可包括给予修饰的大麻素化合物。
通过“治疗”本发明人意味着施用化合物以减轻所治疗的疾病或病症的症状。本领域技术人员将认识到,可以完全消除所治疗的疾病或病症的症状,或者可以简单地减轻症状。此外,化合物可以与其他药物或治疗方式组合施用,例如与化学疗法或其他抗癌药物一起施用。
实施通常可涉及鉴定患有所述疾病的患者,并通过适当的途径以可接受的形式给予本发明的化合物。给药的确切剂量可以根据个体患者的年龄、性别、体重和总体健康状况以及疾病的确切病因而变化。然而,一般而言,对于哺乳动物(例如人)的给药,剂量范围为每24小时每kg体重约0.1至约30mg化合物,更优选每24小时每kg体重约0.1至约10mg化合物是有效的。
给药可以是口服或肠胃外给药,包括静脉内、肌肉内、皮下、皮内注射、腹膜内注射等,或通过其他途径(例如透皮、舌下、口服、直肠和口腔给药、吸入气溶胶等)。在本发明的一个优选实施方案中,口服或静脉内提供水溶性大麻素类似物。
特别地,本发明的酚酯(式1)优选全身给药,以通过酯的体内裂解提供代谢活化的机会。此外,在戊基侧链具有唑部分的水溶性化合物(式2,例如具有咪唑部分)不需要体内活化,并且可以适合于直接给药(例如位点特异性注射)。
所述化合物可以以纯的形式或以药学上可接受的制剂形式给药,包括合适的酏剂、粘合剂等(通常称为“载体”)或药学上可接受的盐(例如碱金属盐,例如钠、钾、钙、或锂盐、铵等)或其他配合物。应当理解,药学上可接受的制剂包括常规用于制备可注射剂型和固体剂型如片剂和胶囊以及雾化剂型的液体和固体材料。此外,化合物可以用水性或油性载体配制。水可以用作制备组合物(例如可注射组合物)的载体,其也可以包括常规缓冲剂和试剂以使组合物等渗。其他潜在的添加剂和其他材料(最好是那些通常被认为是安全的[gras])包括:着色剂、调味料、表面活性剂(吐温,油酸等)、溶剂、稳定剂、酏剂、粘合剂或包封剂(乳糖,脂质体等)。固体稀释剂和赋形剂包括乳糖、淀粉、常规的崩解剂、涂料等。也可以使用防腐剂如对羟基苯甲酸甲酯或苯扎氯铵。根据配方,预计活性组合物占组合物的约1%至约99%,并且载体“载体”占组合物的约1%至约99%。本发明的药物组合物可包括任何合适的药学上可接受的添加剂或辅助剂,只要它们不妨碍或干扰活性化合物的治疗效果。
本发明化合物的给药可以是间歇的、推注剂量、或者以逐渐或连续、恒定或受控的速率给予患者。另外,药物制剂施用的一天中的时间和每天的次数可以变化,并且由技术人员例如医生最好地确定。此外,有效剂量可以根据诸如递送模式、性别、年龄和患者的其他状况等因素以及疾病的程度或进展而变化。化合物可以单独提供、以含有两种或多种化合物的混合物提供、或与其他药物或治疗方式组合提供。也可以将化合物离体加入血液中,然后提供给患者。
可以使用开发用于产生转基因植物的几种类型的转化方法将通过组合多核苷酸和/或其同源物编码的基因引入植物和/或植物细胞中。标准转化技术,例如ti-质粒土壤杆菌介导的转化、粒子轰击、显微注射和电穿孔可用于构建稳定转化的转基因植物。
如本文使用,“大麻素”是存在于植物种属大麻中的化学化合物(如大麻酚、thc或大麻二酚),如紫锥菊、千日菊、helichrysumumbraculigerum、radulamarginata(liverwort)、和可可树、以及可具有或不具有精神活性特性的代谢物及其合成类似物。因此,大麻素包括(但不限于)对大麻素受体具有高亲和力(例如ki<250nm)的化合物(如thc)、以及对大麻素受体没有显着亲和力的化合物(如大麻二酚、cbd)。大麻素还包括具有特征性二苯并吡喃环结构(thc中所见类型)和不具有吡喃环的大麻素的化合物(例如大麻二酚)。因此,大麻素的部分列表包括thc、cbd、二甲基庚基戊基大麻二酚(dmhp-cbd)、6,12-二氢-6-羟基-大麻二酚(描述于u.s.pat.no.5,227,537,通过引用并入)、(3s,4r)-7-羟基-a6-四氢大麻酚同系物和衍生物(描述于u.s.pat.no.4,876,276,通过引用并入)、(+)-4-[4-dmh-2,6-二乙酰氧基-苯基]-2-羧基-6,6-二甲基二环[3.1.1]庚-2-烯、和其他4-苯基蒎烯衍生物(公开于u.s.pat.no.5,434,295,通过引用并入)、和大麻二酚(-)(cbd)类似物(例如(-)cbd-单甲醚、(-)cbd二甲醚、(-)cbd双醋酸酯、(-)3'-乙酰基-cbd单醋酸酯和±af11,都公开于consroeetal.,j.clin.phannacol.21:428s-436s,1981,通过引用并入)。许多其他大麻素的类似公开于agurelletal.,pharmacol.rev.38:31-43,1986,也通过引用并入。
如本文所要求的,术语“大麻素”还可包括大麻素的不同修饰形式,例如羟基化大麻素或大麻素羧酸。例如,如果糖基转移酶能够使大麻素糖基化,则它将包括如其他地方所定义的术语大麻素、以及上述修饰形式。它可以进一步包括多个糖基化部分。
大麻素的例子是四氢大麻酚、大麻二酚、大麻萜酚、大麻色烯、大麻环酚、次大麻酚、cannabielsoin、大麻二吡喃环烷、大麻萜酚酸、大麻萜酚酸单甲醚、大麻萜酚单甲醚、次大麻酚酸、cannabigerovarin、大麻色酸、次大麻色酚酸、cannabichromevarin、cannabidolicacid、大麻二酚单甲醚、大麻二酚-c4、麻二酚酸、cannabidiorcol、δ-9-四氢大麻酚酸a、δ-9-四氢大麻酚酸b、δ-9-四氢大麻酚酸-c4、δ-9-四氢次大麻酚酸、δ-9-四氢次大麻酚、δ-9-四氢cannabiorcolicacid、δ-9-四氢cannabiorcol、δ-7-顺-异-四氢次大麻酚、δ-8-四氢cannabiniolicacid、δ-8-四氢大麻酚、大麻环酚酸、cannabicylovarin、cannabielsoicacida、cannabielsoicacidb、大麻酚酸、大麻酚甲醚、大麻酚-c4、大麻酚-c2、cannabiorcol、10-乙氧基-9-羟基-δ-6a-四氢大麻酚、8,9-二羟基-δ-6a-四氢大麻酚、cannabitriolvarin、乙氧基-cannabitriolvarin、dehydrocannabifuran、cannabifuran、cannabichromanon、大麻二吡喃环烷、10-氧杂-δ-6a-四氢大麻酚、δ-9-顺-四氢大麻酚、3,4,5,6-四氢-7-羟基-α-α-2-三甲基-9-正丙基-2,6-甲-2h-醇-benzoxocin-5-甲醇-cannabiripsol、三羟基-δ-9-四氢大麻酚和大麻酚。在本公开的上下文中的大麻素的实例包括四氢大麻酚和大麻二酚。
术语“内源性大麻素”是指包括下列的化合物:花生四烯酰基乙醇酰胺(花生四烯酸乙醇胺,aea)、2-花生四烯酰基乙醇酰胺(2-ag)、1-花生四烯酰基乙醇酰胺(1-ag)、和二十二碳六烯酰基乙醇酰胺(dhea,synaptamide)、油酰基乙醇酰胺(oea)、eicsapentaenoyl乙醇酰胺、前列腺素乙醇酰胺、二十二碳六烯酰基乙醇酰胺、亚麻酰基乙醇酰胺、5(z),8(z),11(z)-二十碳三烯酸乙醇酰胺(蜂蜜酸乙醇酰胺)、十七碳酰基乙醇酰胺、硬脂酰基乙醇酰胺、二十二碳烯酰基乙醇酰胺、nervonoyl乙醇酰胺、二十三酰基乙醇酰胺、二十四烷酰乙醇酰胺、肉豆蔻酰基乙醇酰胺、十五烷酰基乙醇酰胺、棕榈油酰基乙醇酰胺、二十二碳六烯酸(dha)。特别优选的内源性大麻素是aea、2-ag、1-ag和dhea。
羟基化是将羟基(-oh)引入有机化合物的化学方法。乙酰化是一种添加乙酰基化学基团的化学反应。糖基化是糖基供体与形成糖苷的糖基受体的偶联。
术语“前药”是指生物活性药剂(药物)的前体。前体药物必须经历化学或代谢转化才能成为生物活性药剂。前药可以通过化学转化方法离体转化为生物活性药剂。在体内,通过代谢过程,酶促过程或降解过程的作用将前药转化为生物活性药剂,其去除前药部分以形成生物活性药剂。
如本文使用,涉及连续核酸序列的术语“同源的”是指在适当条件下与参考核酸序列杂交的连续核苷酸序列。例如,同源序列可具有约70%-100或更通常80%-100%的序列同源性,例如约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%约95%、约96%、约97%、约98%、约98.5%、约99%、约99.5%、大约100%。实质同源性与特异性杂交密切相关。例如,当存在足够程度的互补性时,核酸分子是特异性可杂交的,以避免在需要特异性结合的条件下,例如在严格杂交条件下,核酸与非靶序列的非特异性结合。
当用于提及调节序列和编码序列时,术语“可操作地连接”是指调节序列影响连接的编码序列的表达。“调节序列”或“控制元件”是指影响转录、rna加工或稳定性的时间和水平/量、或相关编码序列的翻译的核苷酸序列。调节序列可包括启动子、翻译领导者序列、内含子、增强子、茎环结构、阻遏蛋白结合序列、终止序列、多腺苷酸化识别序列等。特定的调节序列可以位于与其可操作地连接的编码序列的上游和/或下游。此外,与编码序列可操作连接的特定调节序列可位于双链核酸分子的相关互补链上。
如本文使用,术语“启动子”是指dna区域,其可以位于转录起点的上游,并且可以参与rna聚合酶和其他蛋白质的识别和结合以起始转录。启动子可以与编码序列可操作地连接以在细胞中表达,或启动子可以与编码信号序列的核苷酸序列可操作地连接,所述信号序列可以与编码序列可操作地连接以在细胞中表达。植物启动子”可以是能够在植物细胞中起始转录的启动子。在发育控制下的启动子的实例包括在某些组织中优先启动转录的启动子,例如叶、根、种子、纤维、木质部导管、管胞或厚壁组织。这种启动子被称为“组织优选的”。仅在某些组织中起始转录的启动子被称为“组织特异性的”。“细胞类型特异性”启动子主要驱动一种或多种器官中某些细胞类型的表达,例如根或叶中的血管细胞。“诱导型”启动子可以是可以在环境控制下的启动子。可通过诱导型启动子启动转录的环境条件的实例包括厌氧条件和光的存在。组织特异性、组织优选的、细胞类型特异性和诱导型启动子构成“非组成型”启动子的类别。“组成型”启动子是在大多数环境条件下或在大多数细胞或组织类型中可能具有活性的启动子。
任何诱导型启动子均可用于本发明的一些实施方案中。参见wardetal.(1993)plantmol.biol.22:361-366。对于诱导型启动子,转录速率响应于诱导剂而增加。示例性的诱导型启动子包括但不限于:来自响应铜的acei系统的启动子;来自响应苯磺酰胺除草剂安全剂的玉米的in2基因;来自tnlo的tet阻遏物;和来自类固醇激素基因的诱导型启动子,其转录活性可由糖皮质激素激素诱导,这些是一般的例子(schenaetal.(1991)proc.natl.acad.sci.usa88:0421)。
如本文使用,术语“转化”或“遗传修饰的”是指一个或多个核酸分子转移到细胞中。当核酸分子被植物稳定复制时,植物被转导到植物中的核酸分子“转化”或“遗传修饰”。如本文使用,术语“转化”或“遗传修饰”包括可以将核酸分子引入例如植物的所有技术。
术语“载体”是指可以将dna、rna、蛋白或多肽引入宿主的一些构件。待引入宿主的多核苷酸、蛋白和多肽本质上可以是治疗性的或预防性的;可编码或是抗原;可以是本质上调控性的等。有各种类型的载体,包括病毒、质粒、噬菌体、粘粒和细菌。
如本领域所知,不同的生物优先利用不同的密码子来产生多肽。这种“密码子使用”偏好可用于设计编码本发明蛋白和嵌合体的核酸分子,以优化特定宿主细胞系统中的表达。
“表达载体”是能够在选定的宿主细胞或生物体中复制的核酸。表达载体可以作为自主结构复制,或者可以整体或部分整合到宿主细胞染色体或细胞器的核酸中,或者它用作穿梭以将外来dna递送到细胞,因此与宿主细胞基因组一起复制。因此,表达载体是能够在选定的宿主细胞、细胞器或生物体中复制的多核苷酸,例如质粒、病毒、人工染色体、核酸片段、以及表达载体上的某些基因(包括目的基因)被转录并翻译成细胞、细胞器或生物体内的多肽或蛋白;或本领域已知的包含“表达盒”的任何合适的构建体。相反,如本文实施例中所述,“表达盒”是含有本发明表达载体部分的多核苷酸。表达盒的使用有助于表达载体的组装。表达载体是复制子,例如质粒、噬菌体、病毒、嵌合病毒或粘粒,并且含有与表达控制序列可操作连接的所需多核苷酸序列。
当表达控制序列控制和调节该多核苷酸序列的转录和/或翻译时,多核苷酸序列与表达控制序列(例如,启动子和任选的增强子)可操作地连接。
除非另有说明,否则特定核酸序列还隐含地包括其保守修饰的变体(例如简并密码子取代)、互补(或补体)序列和反向互补序列,以及明确指出的序列。具体地,简并密码子取代可以通过产生其中一个或多个选定(或所有)密码子的第三位置被混合碱基和/或脱氧肌苷残基取代的序列来实现(例如参见batzeretal.,nucleicacidres.19:5081(1991);ohtsukaetal.,j.biol.chem.260:2605-2608(1985)和rossolinietal.,mol.cell.probes8:91-98(1994))。由于核酸密码子的简并性,可以使用各种不同的多核苷酸来编码相同的多肽。下文表1a包含关于哪些核酸密码子编码哪种氨基酸的信息。
表4氨基酸核酸密码子
术语“植物”或“植物系统”包括整株植物、植物器官、整株植物或植物器官的后代、胚胎、体细胞胚、胚样结构、原球茎、原球茎样体(plb)和培养物、和/或植物细胞的悬浮液。植物器官包括例如芽营养器官/结构(例如叶、茎和块茎)、根、花和花器官/结构(例如苞片、萼片、花瓣、雄蕊、心皮、花药和胚珠)、种子(包括胚、胚乳和种皮)和果实(成熟卵巢)、植物组织(例如维管组织、地面组织等)和细胞(例如保卫细胞、卵细胞、毛状体等)。本发明还可以包括大麻科(cannabaceae)和其他大麻(cannabis)株,例如一般的c.sativa。
如本文使用,术语“表达”或“编码序列的表达”(例如,基因或转基因)是指核酸转录单元(包括例如基因组dna或cdna)的编码信息被转换成细胞的可操作的、非操作的或结构的部分的过程通常包括蛋白质的合成。基因表达可能受外部信号的影响;例如,将细胞、组织或生物体暴露于增加或减少基因表达的试剂。基因的表达也可以在从dna到rna到蛋白质的途径中的任何地方受到调节。基因表达的调节例如通过控制作用于转录、翻译、rna转运和加工、中间分子例如mrna的降解、或通过特定蛋白质分子的活化、失活、区室化或降解后发生、或其组合。可以通过本领域已知的任何方法在rna水平或蛋白质水平测量基因表达,包括但不限于northern印迹、rt-pcr、western印迹、或体外、原位或体内蛋白质活性测定。
术语“核酸”或“核酸分子”包括单链和双链形式的dna、单链形式的rna、和双链形式的rna(dsrna)。术语“核苷酸序列”或“核酸序列”是指核酸的有义链和反义链作为单个单链或在双链体中。术语“核糖核酸”(rna)包括irna(抑制性rna)、dsrna(双链rna)、sirna(小干扰rna)、mrna(信使rna)、mirna(micro-rna)、hprna(发夹rna)、trna(转移rna,无论是用相应的酰化氨基酸加成还是排出)、和crna(互补rna)。术语“脱氧核糖核酸”(dna)包括cdna、基因组dna和dna-rna杂合体。本领域技术人员将术语“核酸区段”和“核苷酸序列区段”或更一般地“区段”理解为功能性术语,包括基因组序列、核糖体rna序列、转移rna序列、信使rna序列、操纵子序列和编码或可适于编码肽、多肽或蛋白质的较小工程化核苷酸序列。
术语“基因”或“序列”是指可操作地连接到能够以某种方式调节基因产物(例如多肽或功能性rna)表达的适当调节序列的编码区。基因包括编码区(开放阅读框,orf)之前(上游)和之后(下游)的dna的非翻译调节区(例如,启动子、增强子、阻遏物等)、以及在适用的情况下各个编码区(即外显子)之间的间插序列(即内含子)。术语“结构基因”在本文中用于表示转录成mrna的dna序列,然后将其翻译成特定多肽特征的氨基酸序列。
核酸分子可包括通过天然存在的和/或非天然存在的核苷酸键连接在一起的天然存在的和修饰的核苷酸中的一种或两种。核酸分子可以化学或生物化学修饰,或者可以含有非天然或衍生的核苷酸碱基,这是本领域技术人员容易理解的。这些修饰包括例如标记、甲基化、一个或多个天然存在的核苷酸被类似的核苷酸间修饰取代(例如不带电荷的键:例如甲基膦酸酯、磷酸三酯、氨基磷酸酯、氨基甲酸酯等;带电键:例如硫代磷酸酯、二硫代磷酸酯等;侧链部分:例如肽;嵌入剂:例如吖啶、补骨脂素等;螯合剂;烷化剂;和修饰的连接:例如α端基异构核酸等)。术语“核酸分子”还包括任何拓扑构象,包括单链、双链、部分双链、三链、发夹、圆形和挂锁构象。
如本文关于dna所用,术语“编码序列”、“结构核苷酸序列”或“结构核酸分子”是指当置于合适的调节序列控制下时,通过转录和mrna最终翻译成多肽的核苷酸序列。关于rna,术语“编码序列”是指翻译成肽、多肽或蛋白质的核苷酸序列。编码序列的边界由5'-末端的翻译起始密码子和3'-末端的翻译终止密码子决定。编码序列包括但不限于基因组dna、cdna、est和重组核苷酸序列。
如本文在两个核酸或多肽序列的上下文中使用的术语“序列一致性”或“一致性”是指当在指定的比较窗口上对齐以获得最大对应性时两个序列中的残基相同。
术语“重组”当用于参考例如细胞、或核酸、蛋白或载体时,表明细胞、有机体、核酸、蛋白或载体已通过引入异源核酸或蛋白、或天然核酸或蛋白质的改变、或细胞来源于这样修饰的细胞而被修饰。因此,例如,重组细胞可以表达在细胞的天然(非重组或野生型)形式中未发现的基因、或表达异常表达过表达、低表达或根本不表达的天然基因。
术语“约”和“大约”是指数量、水平、值或量变化多达30%,或参考数量、水平、值或量在另一个实施方案中变化多达20%,并且在第三实施方案中多达10%。如本文使用,除非上下文另有明确规定,否则单数形式“一”、“一个”和“该”包括复数指代。
如本文使用,关于核酸的“异源”或“外源”是源自外来物种的核酸,或者是合成设计的,或者如果来自同一物种,则通过有意的人为干预从组合物和/或基因组基因座中的天然形式进行实质性修饰。异源蛋白质可以源自外来物种,或者如果来自相同物种,则通过有意的人为干预从其原始形式进行实质性修饰。“宿主细胞”是指含有导入的核酸构建体并支持构建体的复制和/或表达的细胞。宿主细胞可以是原核细胞(如大肠杆菌)、或真核细胞(如真菌)、酵母、昆虫、两栖动物、线虫或哺乳动物细胞。或者,宿主细胞是单子叶植物或双子叶植物细胞。单子叶植物宿主细胞的实例是玉米宿主细胞。
实施例
实施例1:细胞色素p450对大麻素的官能化
本发明人已经证明大麻素可以在体内植物系统中官能化。具体地,本发明人利用细胞色素p450单加氧酶(cyp)来修饰或官能化大麻素的化学结构。如下所示,cyp通过将氧原子插入疏水分子中以使它们更具反应性和亲水性来实现这一点。代表性反应可包括图13中的通常反应。
p450酶系统涉及多种细胞色素p450种和非特异性细胞色素p450氧化还原酶。如图5所示,本发明人在具有示例性人细胞色素p450氧化还原酶的双构建体中使用人细胞色素p450(cyp3a4),两者均在具有5'非翻译区的组成型camv35s启动子的控制下表达以加强翻译。用于大麻素官能化的蛋白和dna序列(cyp3a4和p450氧化还原酶)被鉴定为seqidno.1-4。使用下表3中鉴定的正向和反向引物,使用rt-pcr确认表达。如上所述,本发明人证明过表达p450产生官能化的大麻素,然后可将其糖基化,从而使其成为水溶性的。
实施例2:p450过表达增强植物系统中大麻素的体内羟基化和糖基化
本发明人已经证明,在示例性植物系统中过表达增强cbda的体内羟基化和糖基化。具体地,如图6中一般所示,本发明人证明,如本文所述,用携带cyp3a4和p450氧化还原酶的土壤杆菌浸润烟草叶。在浸润2-3天后使用rt-pcr进行表达的确认(图6)。
如图7中一般所示,本发明人证明cyp3a4+p450氧化还原酶构建体的过表达以及随后在确认表达后喂食至少一种大麻素(在这种情况下为cbda)导致烟草叶片中cbda的体内糖基化(图7)。与对照相比,转基因n.benthamiana植物的糖基化平均增加3倍,而羟基化增加至13倍。因此,在某些实施方案中,烟草糖基转移酶可用作本发明的大麻素糖基化技术的关键靶标。
实施例3:质谱鉴定改性水溶性大麻素
本发明人证明了在体外和体内植物系统中修饰的官能化以及水溶性大麻素的生物合成。具体地,本发明人在体外测定和瞬时叶表达中鉴定了与基因构建体相关的大麻素生物转化。通过使用精确的质谱测量,本发明人能够鉴定和确认修饰的水溶性大麻素的生物合成。
具体而言,如图1-4所示,本发明人能够在色谱分析中鉴定糖基化的水溶性大麻素,并且能够产生用于峰积分的提取离子色谱图。例如,图1的组b描述单个糖苷部分的多个构成大麻素异构体的鉴定,而在图2的组b中,描述细胞色素p450氧化的多个构成异构体的例子。每种鉴定分子的峰面积用于处理之间的相对定量。基于这些结果,我们证实了含有高达2g糖苷部分,o乙酰基糖苷以及羟基化(r-oh)生物转化的改性大麻素分子的生物合成。
下面提供表1和2,进一步证明了选择的改性大麻素分子的产生。通常参考下面的表1-2,本发明人证明了基于减少的水中保留时间:乙腈hplc梯度,比其未修饰形式更早洗脱的糖基化和羟基化大麻素被证明比其未修饰形式更具水溶性。
实施例4:产生用于在烟草叶和细胞悬浮液中表达的异源胞质合成和糖基化基因构建体
如图8所示,本发明人产生用于表达大麻二酚酸(cbda)合酶的三基因构建体,其中已经去除毛状体靶向序列,并且糖基转移酶76g1来自甜叶菊。在该构建体中,还包括多药物abc转运蛋白abcg2。
在本发明技术的一个实施方案中,基因构建体可用于转化植物细胞,所述植物细胞可进一步配置成在悬浮培养物中培养。在一个优选实施方案中大麻细胞可以用图8中概括的构建体转化。在这个优选实施方案中,由大麻细胞在细胞培养物中产生的大麻素可通过如上所述的cyp3a4+p450氧化还原酶的过表达而官能化,并通过来自上面涉及的甜叶菊的异源udp糖基转移酶(76g1)的表达和作用进一步糖基化。此外,如本文概括所述,大麻素可以被修饰以被官能化和/或糖基化,或通常是水溶性的,并且然后在整株植物或者在悬浮培养中的周围培养基的情况下,在abc转运蛋白的帮助下可以分泌到细胞壁区域中。在一个实施方案中,该构建体可用于在细胞悬浮培养物中合成和修饰大麻素,从而利用烟草亮黄色细胞或大麻细胞。
如图9中一般所示,证实cbda合酶、udp糖基转移酶76g1和abcg2的体内表达。用于rt-pcr反应的反向和正向引物在下表4中提供。
cbda合酶的基因和蛋白序列鉴定分别作为seqidno5和6提供。应当注意,各种大麻素合酶基因/蛋白可以用于本发明的技术,cbda合酶仅是示例性的。实际上,特别考虑的是与本文鉴定的任何大麻素相关的合酶类酶可以在不进行过度实验的情况下并入本发明中。在一个实施方案中,一种或多种这样的外源或内源性合酶可以进一步切除毛状体靶向序列,这一步骤可以再次在不进行过度实验的情况下容易地完成。例子可以是thca合酶、cbg合酶、thca合酶、cbda合酶或cbca合酶,在该实施方案中它们可以去除它们的毛状体靶向序列。
来自甜叶菊的糖基转移酶76g1的基因和蛋白序列鉴定分别作为seqidno7和8的形式提供。多药物abc转运蛋白abcg2的基因和蛋白序列鉴定分别作为seqidno9和10提供。
实施例5:在n.benthamiana叶和细胞悬浮液中大麻素的体内胞质合成和糖基化
如图10所示,本发明人证明,在植物中,在该实施方案中,表达上述细胞溶质构建体的n.benthamiana,发生cbga的糖基化以及形成修饰的或羟基化的cbda。cbga的糖基化通过在n.benthamiana植物中过表达糖基转移酶证明大麻素的体内糖基化。糖基化大麻素在野生型植物中的存在表明在烟草中存在强糖基转移酶。因此,在一个实施方案中,过表达异源或同源烟草糖基转移酶可表达或过表达,导致整株植物以及悬浮培养物中水溶性大麻素的体内生物合成增强。例如,在一个实施方案中,异源烟草糖基转移酶可以在大麻植物或细胞培养物中表达,导致大麻植物和/或大麻悬浮培养物中水溶性大麻素的体内生物合成。
实施例6:利用mtb转录因子和/或过氧化氢酶的水溶性大麻素产生系统
本发明人利用新的蛋白质靶向方法开发了多种基于细胞定位的大麻素的生物合成和修饰系统。如表10所示,本发明人设计了这样的新系统和方法,以增强大麻素的产生和修饰(糖基化、乙酰化和官能化)以及减轻大麻素积累产生的毒性。某些实施方案包括表达myb转录因子和过氧化氢酶(图27)以降解由cbda合酶活性产生的过氧化氢。在一个优选实施方案中,本发明人使用拟南芥或大肠杆菌过氧化氢酶基因和预测的大麻myb转录因子参与提高大麻素生物合成中涉及的基因。大麻的dna和蛋白序列预测myb转录因子(分别为seqidno.11-12,dna和氨基酸序列),arabidopsisthaliana过氧化氢酶分别为seqidno.13-14,dna和氨基酸序列)和/或大肠杆菌过氧化氢酶(seqidno.15-16,dna和氨基酸序列)。
实施例7:增强烟草叶和细胞悬浮液中大麻素的体内细胞溶质合成和糖基化。
本发明人已经证明了在使用糖基化、p450介导的官能化(羟基化)和由过氧化氢酶进行的过氧化氢解毒的构建体共感染的转基因植物中大麻素的体内修饰增强。如图11中进一步所示,在过表达cbda合酶、udp糖基转移酶和abc转运蛋白的转基因烟草植物中观察到主要为底物cbga的官能化和糖基化,但当该构建体的过表达与细胞色素p450、myb转录因子和过氧化氢酶偶联时增加。如前所述,细胞色素p450的过表达增强了大麻素的糖基化。因此,本发明人证明了在用前体cbga喂养的瞬时转化的烟草叶中体内cbda的形成和糖基化。
本发明人还比较了烟源中内源性活性和转基因糖基转移酶活性。具体地,如图12所示,本发明人进行udp糖基转移酶和cbda合酶的体外测定。在30℃下3小时的短测定未显示野生型和转基因n.benthamiana植物之间cbga的糖基化的任何差异,这表明内源性糖基化。在延长的测定(14小时)中,与野生型相比,转基因植物中糖基化cbga的检测存在显着差异,表明转基因植物中的糖基化活性增加。
在某些实施方案中,可以如本文所述使用来自烟草或其他植物的糖基转移酶。在一个实施方案中,一种或多种异源或同源糖基转移酶可以在植物中表达或过表达,例如烟草或大麻。示例性糖基转移酶的基因和蛋白序列在下表9中鉴定。
实施例8:毛状体靶向大麻素合成和大麻二酚酸(cbda)的糖基化构建体的产生
如图14-15所示,本发明人证明了大麻素化合物如cbda的毛状体靶向合成和合成以及糖基化的系统。通过靶向cbda合酶、靶向血浆的udp-葡萄糖/udp-半乳糖转运蛋白(pm-utr1)和针对毛状体的甜叶菊udp-糖基转移酶76g1(tsugt),在这种情况下这些基因可以产生和积累cbda及其糖基化衍生物(伯、仲糖苷)以及毛状体中的新型cbda衍生物。
seqidno.17被鉴定为具有毛状体靶向序列的cbda合酶的多核苷酸基因序列。seqidno.18被鉴定为具有毛状体靶向结构域的cbda合酶的相应蛋白序列。
seqidno.19被鉴定为针对毛状体靶向的udp-糖基转移酶(76g1)编码序列的多核苷酸基因序列,在这种情况下针对拟南芥表达进行了优化,尽管其他密码子优化的形式也属于本发明的范围。seqidno.20被鉴定为具有毛状体靶向结构域的udp-糖基转移酶(76g1)的相应蛋白序列。
seqidno.21被鉴定为具有质膜靶向序列的udp-葡萄糖/半乳糖转运蛋白(utr1)的多核苷酸基因序列。
实施例9:大麻二酚酸(cbda-)的毛状体靶向合成和糖基化
如图16-17所示,通过rt-pcr证实n.benthamiana浸润的叶子中cbda合酶、tsugt和pm-utr1的基因表达2dpi(土壤渗透后的细菌杆菌ti-质粒构建体)(图19和20)。如所预期的,在所有渗入的叶子和野生型对照中检测到cbga底物(无土壤杆菌渗入)。在所有浸润的叶子和野生型对照中也检测到cbga伯和仲糖苷,这进一步证明作用于cbga的内源性糖基转移酶活性。此外,在所有样品中检测到cbga乙酰化的伯糖苷,包括wt对照,这提供内源性乙酰化的证据。在用毛状体和细胞悬浮构建体渗入的样品中检测到cbda的边缘水平,但在野生型植物中没有检测到。
实施例10:大麻二酚酸(cbda)的细胞溶质合成和糖基化
本发明人已经证明了细胞溶质靶向大麻素合成和糖基化的系统。通过将cbda合酶(cbda)和udp-糖基转移酶76g1(ugt)靶向或定位于胞质溶胶,本发明人证明了表达这些异源基因的植物产生并积累,在这个实施方案中是cbda及其糖基化衍生物(伯、仲糖苷),并且在细胞质中是其他cbda衍生物。如图18所示,产生细胞溶质大麻素产生系统的基因表达载体。该构建体包括花椰菜嵌纹35s启动子、atadh5'-utr、增强子元件、cytcbda、去除毛状体靶序列的大麻二酚酸合酶、hsp终止子、cytugt76gl、来自甜叶菊的udp糖基转移酶。
seqidno.22被鉴定为去除毛状体靶序列(cytcbda)的大麻二酚酸合酶的多核苷酸基因序列。seqidno.23被鉴定为cytcbda的相应的蛋白序列。
seqidno.24被鉴定为细胞溶质靶向udp-糖基转移酶(ugt76g1)编码序列(针对拟南芥表达优化)(cytugt76g1或cytutg)的多核苷酸基因序列。seqidno.25被鉴定为cytugt76g1或cytutg的相应蛋白序列。
作为示例性植物模型,从种子生长n.benthamiana植物,并且在营养生长4周后,用携带以下构建体的土壤杆菌根瘤菌gv3101共渗入叶子:pri201-an或细胞悬浮构建体中的细胞溶质cbda+细胞溶质ugt、pri201-an中的myb/过氧化氢酶和pdgb3alpha2中的pi9沉默抑制子。使用分光光度计将土壤杆菌密度在600nm的吸光度下归一化至2,并以相同比例(1:1:1)共渗透培养物。在土壤杆菌杆菌浸润(dpi)后2和4天后,将溶解在0.1%吐温20(sigma-aldrich)或0.1%tritonx-100(sigma-aldrich)中的1mlcbga(2.7mm)渗透到每个叶子中。在使用胞质构建体的第二实施方案中,在进食前将4mmudp-葡萄糖加入cbga培养基中。使用三个生物学重复。rt-pcr引物概述于下表5中。
在图19-20中,在1和2天dpi后通过rt-pcr确认了cytcbda和cytugt的基因表达。在叶浸润细胞悬浮构建体中,在idpi后未观察到abc转运蛋白(abct)的表达。这不影响该实验,因为abct的作用是促进悬浮培养中细胞外的大麻素转运。如图21所示,除了仲糖苷外,检测到cbga及其糖基化和酰化衍生物的浓度高于毛状体构建体浸润叶中的浓度。此外,与毛状体构建体实验(高达2.6ppm)相比,在用细胞悬浮构建体渗入的叶中检测到更高浓度(高达34ppm)的cbda。如图22所示,当udp-葡萄糖4mm(ugt的底物)与cbga(cbda的底物)一起提供时,本发明人在用细胞溶质和细胞悬浮构建体渗入的叶中检测到低水平的糖基化和羟基化的cbda,但在wt对照中没有。该结果证明了替代植物n.benthamiana中cbda的植物合成、糖基化和羟基化的新颖性,如图23中所示的提取离子色谱图所示。
实施例11:cannabissativa中大麻素的羟基化和糖基化
本发明人证实大麻素在cannabissativa中的糖基化和羟基化。为了进一步证实我们使用n.benthamiana作为植物模型的发现,我们对各种cannabissativa株中的上述部分中描述的相同质粒构建体进行了土壤杆菌浸润(参见图24样品id)。如图24-26所示,如在n.benthamiana中,选择的遗传构建体在c.sativa中的表达证实在这种情况cbda下羟基化和/或糖基化大麻素的合成和积累。使用不同土壤杆菌遗传构建体的结果的比较在下表8中给出。
如本发明人已经证实的,在一个实施方案中,其中胞质构建体用myb/过氧化氢酶(mybcat)表达载体进行转化,产生最高的cbda和cbda糖苷检测,这证明这些基因在减轻由于过氧化氢积累(过氧化氢酶)和大麻素合成(myb转录因子)的总体增加而产生的毒性作用中的作用。
材料和方法
实施例12:使用烟草作为用于大麻素的体内官能化和糖基化的示例性植物系统
本发明人证明了模型植物系统中大麻素的体内官能化和糖基化。具体地,本发明人使用n.benthamiana(烟草)作为模型系统来证明大麻素的体内官能化和糖基化。在这个实施方案中,通过土壤进行瞬时转化杆菌浸润在n.benthamiana中进行。本发明人证明了使用许多异源基因表达载体在转化的n.benthamiana中表达的异源基因的表达(如下所述)。在该示例性实施方案中,在确认将使大麻素分子官能化和糖基化的异源基因的表达后,本发明人向植物中引入选择大麻素化合物。在这个实施方案中,本发明人介绍转基因n.benthamiana植物大麻萜酚酸(cbga)和/或大麻二酚酸(cbda)。本发明人还证明了大麻素在细胞悬浮培养中的体内官能化和糖基化。具体地,本发明人使用示例性烟草亮黄(by2)细胞作为细胞悬浮系统用于研究大麻素的产生、官能化和/或糖基化。
实施例13:示例性植物模型本生烟的瞬时转化
本发明人使用土壤杆菌根瘤菌ti-质粒介导的转化与植物表达载体pri201-an(takarabiousa)、用于在携带组成型35s启动子和拟南芥醇脱氢酶(atadh)作为翻译增强子的双子叶植物中高水平表达外源基因的双元载体(matsuietal.2012)。根据sparkesetal.2006描述的方法瞬时转化n.benthamiana。将土壤杆菌菌株gv3101的过夜培养物转移至含有50mllb培养基的250ml烧瓶中,所述lb培养基补充有50mg/l的卡那霉素、50mg/l的庆大霉素和m10g/l的利福平,并生长4-8小时直到600nm处的光密度(od600)达到约0.75和1之间。将细胞在室温下在离心机中制丸,并重悬于45ml含有5g/ld-葡萄糖、10mmmes、10mmmgcl2和100μm乙酰丁香酮的浸润培养基中。使用1ml注射器将1ml溶液用于渗透叶子。通过rt-pcr在浸润后2-4天确认转基因的表达对于rt-pcr分析,将100mg叶组织在液氮中冷冻并在tissuelyser(qiageninc,usa)中研磨。按照ezna植物rna提取试剂盒(omegabio-tekinc,usa)提取rna。使用上标iiicdna合成试剂盒(thermofisherscientific,usa),使用高达1微克的总rna来合成cdna。cdna用于通过rt-pcr检查转基因的表达。
实施例14:将选择大麻素底物引入转基因n.benthamiana菌株。
在土壤杆菌浸润后两天并且通过rt-pcr确认转基因表达时,将选择酶底物引入转基因或遗传修饰的n.benthamiana菌株。在该实施例中,将约277μm大麻萜酚酸(cbga)和/或大麻二酚酸(cbda)溶解于1ml含有10mmmes、10mmmgcl2和0.1%tritonxi00或0.1%tween20的缓冲液中,并通过渗透或用棉花涂抹器轻轻涂抹到转化的叶子上。在1-4天后收获植物,称重鲜重并在-80℃冷冻,然后进行lc-ms分析以确定修饰的大麻素的存在。
实施例15:cbda合酶和糖基转移酶活性的体外测定
cbda合酶通常在4-6的ph范围内有活性(tauraetal.1996),而糖基转移酶通常在5.0至7.0的ph范围内有活性(riniandesko,2017)。基于酶活性的最佳ph的这种差异,本发明人在体外测定中产生了用于在ph6和30℃下cbda合酶和udp糖基转移酶的组合测定的单一提取缓冲液(priestetal.,2006)。本发明人将转化的叶组织在液氮中研磨。加入研磨缓冲液,其中含有50mmmes、ph6,1mmedta、5mmβ-巯基乙醇和0.1%tritonx-100,使用研钵和研杵以5:1的比例将缓冲液加入植物的鲜重中。将提取物在冰上通过2层粗棉布过滤以除去碎片,并在4℃下以21000g离心5分钟。将上清液用于后续测定。使用牛血清白蛋白作为标准,通过bradford测定法定量上清液的蛋白质浓度。为了开始反应,使用100-200μg粗制总蛋白。在使用和不使用udp-葡萄糖的情况下进行测定以检查大麻素底物的糖基化是否阻止下游反应或cbga的转运。野生型植物用作对照以将内源性与过表达的udp糖基转移酶活性分开。通过添加100μg蛋白和8mm尿苷二磷酸葡萄糖(udpg)作为糖-核苷酸供体开始反应至由约277μμcbga、0.1%(w/v)tritonx-100、3mmmgcl2和50mmmes(ph6.0)组成的反应混合物。将反应在30℃下孵育3小时或过夜14小时。通过在液氮中冷冻终止反应,并在lc-ms分析之前将样品储存在-80℃。
实施例16:毛状体靶向合成和糖基化
作为示例性植物模型,从种子生长n.benihamiana植物,并且在营养生长4周后,将叶子与携带以下构建体的土壤杆菌根瘤菌gv3101共渗透:pri201-an(毛状体构建体)中的毛状体cbda+毛状体ugt、pri201-an中的pm-utr1、和pdgb3α2中的pi9沉默抑制子。在第二实验中,叶子也用表达具有myb/过氧化氢酶基因的ti质粒的土壤杆菌渗透。使用分光光度计将土壤杆菌密度在600nm的吸光度下归一化至1或2,并以相同比例(1:1:1)共渗透培养物。在土壤杆菌杆菌浸润(dpi)1和4天后,将溶解在0.1%tween20(sigma-aldrich)或3%dmso(sigma-aldrich)中的1mlcbga(277μμ)渗入每个叶子。使用三个生物学重复。该实验重复两次。初步结果后,在所有后续渗透实验中选择od600的土壤杆菌密度为2。此外,由于更好地溶解cbga底物,因此选择0.1%吐温20而不是dmso3%。
在这个实施方案中,在2dpi收集叶样品并立即在液氮中冷冻。如制造商(qiagen)所述,使用rnaplantmini-kit进行rna提取。如制造商(takara)所述,使用rna至cdnaecodrypremix合成cdna。将模板cdna标准化为每次反应50ng相应的总rna。退火温度为60℃。延长时间:15s,35个循环。q5dna聚合酶试剂盒如制造商(newenglandbiolabs)所述使用。rt-pcr引物概述于下表5中。
实施例17:cannabissativa的瞬态转化
本发明人进行了土壤杆菌根瘤菌介导的cannabissativa的瞬时转化。实验组由cbd品种的高幼叶(干花中的-10%)和thc品种的高毛状体叶(-20%干花)组成。
为了转化高cbd品种的叶子,本发明人发芽了100个种子三次;这样做是为了确保所有9个独立转化事件都有足够数量的植物。为了转化毛状体叶,本发明人使用已知为高thc品种的几种变种的小毛状体叶。实验装置由2种不同的土壤杆菌根瘤菌株组成。对于土壤杆菌菌株eha105的瞬时转化,本发明人在10mllb培养基中培养细胞,所述lb培养基补充有10mg/l的利福平和50mg/l的卡那霉素,并且土壤杆菌菌株gv3101::6000细胞在50mg/l卡那霉素、25mg/l庆大霉素和50mg/l利福平的情况下生长。使用单个土壤菌杆菌落进行接种并培养过夜。然后,将1ml该培养物接种到500ml上述补充有20μμ乙酰丁香酮的lb培养基中。土壤杆菌生长至od600约为1至1.5。将细胞在室温下在离心机中沉淀,并重悬于含有10mmmes、10mmmgcl2和200μm乙酰丁香酮的渗透培养基中至od600为0.5。
然后将细菌培养物用于三种不同类型的cannabissativa转化。在所有情况下,转化以共转化的形式进行,将所有相关菌株(质粒)以相等比例的细胞数混合。首先,对于本发明人,使用1ml注射器渗透嫩的(两周龄)、完全消耗的cannabissativa植物。在转化之前,将植物保持在塑料覆盖下,以确保叶子的最大柔软度。从背轴侧进行渗透,从而确保叶子的整个表面在22℃下12/h/12h天/晚渗透。
第二,本发明人真空渗透分离的嫩(两周龄)的完全消耗的cannabissativa叶。在转化之前,将植物保持在塑料覆盖下,以确保叶子的最大柔软度。然后将叶子置于补充有61.8mm硝酸铵的半强度murashige和skoog(1962)(1/2ms)琼脂上,并在22℃下12/h/12h天/晚温育5天。
第三,将毛状体叶分离,置于50mlfalcon管中,并用上述细菌溶液2x真空渗透各10分钟。然后将叶子置于补充有61.8mm硝酸铵的1/2ms琼脂上并温育5天。
所有实验一式三份进行,第四次重复用于收集dna/rna并染色x-gluc以测量与土壤茎杆菌-凝集素gus基因共渗入后β-葡糖醛酸糖苷酶(gus)的活性。在所有情况下,在转化5天后收获叶子,在液氮中冷冻并储存在-80℃。
实施例18:从n.benthamiana中提取水溶性大麻素
从15或50ml聚丙烯离心管中的温室实验中收获新鲜的转化植物材料,并在液氮中快速冷冻。通过将植物材料浸没在沸腾的甲醇中2分钟来酶解淬灭冷冻的植物材料。使用p-10-35均化器(kinematica,bohemiany)均化甲醇淬灭的材料。通过短暂搅拌提取匀浆,最终体积为10ml或30ml70%甲醇(v/v),分别对应于管尺寸。通过在beckmanj-6b地板离心机(beckmancoulter,indianapolisin)中以2,500rpm在4℃下离心15分钟来澄清所得提取物。将上清液转移到聚丙烯管中并在n2气流下在45℃下蒸发直至干燥。将提取物在含有20μg/ml内标7-羟基香豆素(sigma-aldrich,h24003)的甲醇中重构。将重构的提取物置于1.5ml微量离心管中,并在微量离心机中以10,000g澄清15分钟。将500μl上清液转移至2ml自动进样器小瓶中并保持在4℃直至分析。体外测定样品制备:将样品通过0.45μmpvdf膜注射过滤到2ml自动进样器小瓶中。
实施例19:从cannabissativa提取水溶性大麻素
从在1.5ml聚丙烯离心管中的室中生长的植物收获新鲜植物材料,并在液氮中快速冷冻。使用研杵和研钵将冷冻的植物材料均质化,并通过将植物材料浸没在沸腾的100%乙醇中2分钟进行酶促淬灭。将均化溶液稀释至70%乙醇。通过在eppendorf离心机(centrifuge5415r)中以2,500rpm在4℃下离心15分钟使得到的提取物澄清。将上清液转移到聚丙烯管中并使用真空离心机(speedvacsci10,savant)浓缩三次。将2μl的20μg/ml内标umbelliferone(sigma-aldrich,h24003)加入到98μl浓缩提取物中并用于分析。
实施例20:液相色谱质谱用于确认大麻素的功能化和糖基化。
本发明人使用液相色谱质谱法来确认本文所述的示例性植物系统中大麻素的功能化和糖基化。具体地,质谱法在四极杆飞行时间(qtof)质谱仪(qtofmicro,waters,manchester,uk)上进行,该质谱仪配备有与watersacquityuplc系统(waters,manchester,uk)连接的lockspraytm电喷雾离子源。以负电喷雾电离模式(esi-)收集质谱。雾化气体在350℃的温度下设定为400l/h,锥形气体设定为15l/h,源温度设定为110℃。毛细管电压和锥形电压分别设定为2500和35v。mcp检测器电压设置为2500v。q-tof微型ms采集速率设定为1.0秒,0.1秒内扫描延迟。扫描范围为100至1500m/z。数据以连续模式收集。在50:50水中的50ppm棉子糖(503.1612m/z)的锁质溶液:甲醇以20μl/min通过辅助泵输送,并在ms采集期间每10秒获取一次。使用watersacquityuplc系统在watershsst3c18柱(2.1×100mm,粒径1.8μm)上进行分离,所述系统配备有acquity二元溶剂管理器,acquity柱管理器和acquity样品管理器(10μl样品环,部分环路注入模式,5μl注射量,4℃)。洗脱剂a和b分别是水和乙腈,均含有0.1%甲酸。在10%洗脱液b下等度地进行洗脱0.5分钟,然后在14.5分钟内进行线性梯度100%洗脱液b,并在100%洗脱液b下等度洗脱3分钟。将柱重新平衡6分钟。流速设定为250μl/min,柱温保持在30℃。
实施例21:证实数据处理的材料和方法。
本发明人通过metabolynx(waterscorp.,milford,usa)的相应精确质量转移进行个体大麻素类似物的鉴定。数据处理的方法参数设定如下:保留时间范围0.1-18分钟,质量范围100-1500da,保留时间公差0.2分钟,质量公差0.05da,峰值强度阈值14。使用棉子糖锁定质量进行连续数据的精确质量测量。使用masslynx4.1(waterscorp.,milford,usa)另外处理原始色谱数据用于提取的离子色谱图砂峰面积积分。选择的大麻素、cbga和cbda使用经过认证的参考材料(cerilliant,roundrock,tx)进行鉴定和定量。使用chemdoodle版本8.1.0(ichemlabstm,chesterfield,va)产生所有化学结构和生理化学和组成性质。
表格
表1.cbga生物转化的产物
rrt亲本分子的相对保留时间
r-oh通过添加o原子官能化
表2.cbda生物转化的产物
rrt亲本分子的相对保留时间
r-oh通过添加o原子官能化’
表3.用于cyp3a4和p450氧化还原酶的rt-pcr的正向和反向引物
表4.用于cbda合酶、ugt76g1和abcg2的正向和反向引物
表5.毛状体靶向cbda合酶(cbda)、毛状体靶向ugt和pm-靶向utr1
表6.细胞溶质靶向cbda合酶(cytcbda)、细胞溶质靶向ugt(cytugt)
表7.n.benthamiana叶中糖基化和功能化实验结果的总结
*在不同的重复中测试有和没有构建体的共渗透
表8.cannabissativa叶中糖基化和功能化实验结果的总结
表9.示例性糖基转移酶序列鉴定
表10.大麻素生产细胞区室化模型。不同的阴影列和行对应于所使用的不同示例性表达构造。
参考文献
以下参考文献通过引用整体并入本文:
[1]ivonossowski,mrmulvey,paleco,aborysandpcloewen,j.bacteriol.1991,173(2):514.
[2]behera,a.,behera,a.,mishra,s.c.,swain,s.k.,&author,c.(2003).cannabinoidglycosides:invitroproductionofanewclassofcannabinoidswithimprovedphysicochemicalproperties.proc.intl.soc.mag.reson.med(vol.14).
[3]holland,m.l.,lau,d.t.t.,allen,j.d.,&arnold,j.c.(2009).themultidrugtransporterabcg2(bcrp)isinhibitedbyplant-derivedcannabinoids.britishjournalofpharmacology,152(5),815–824.https://doi.org/10.1038/sj.bip.0707467
[4]ivanchenco.m.,vejlupkova.z.,quatrano.r.s.,fowler.j.e.(2000)maizerop7gtpasecontainsaunique,caaxbox-independentplasmamembranetargetingsignal.theplantjournal,(24)1,79-90.
[5]jamesm.riniandjeffreyd.esko.glycosyltransferasesandglycan-processingenzymes.in:essentialsofglycobiology[internet].3rdedition.https://www.ncbi.nlm.nih.gov/books/nbk310274/?report=reader
[6]marks,m.d.,tian,l.,wenger,j.p.,omburo,s.n.,soto-fuentes,w.,he,j.,…dixon,r.a.(2009).identificationofcandidategenesaffectingδ9-tetrahydrocannabinolbiosynthesisincannabissativa.journalofexperimentalbotany,60(13),3715–3726.https://doi.org/10.1093/jxb/erp210
[7]nagaya,s.,kawamura,k.,shinmyo,a.,&kato,k.(2010).thehspterminatorofarabidopsisthalianaincreasesgeneexpressioninplantcells.plantandcellphysiology,51(2),328–332.https://doi.org/10.1093/pcp/pcp188
[8]norambuena,l.,marchant,l.,berninsone,p.,hirschberg,c.b.,silva,h.,&orellana,a.(2002).transportofudp-galactoseinplants.identificationandfunctionalcharacterizationofatutr1,anarabidopsisthalianaudp-galactose/udp-glucosetransporter.journalofbiologicalchemistry,277(36),32923–32929.https://doi.org/10.1074/jbc.m204081200
[9]onofri,c.,demeijer,e.p.m.,&mandolino,g.(2015).sequenceheterogeneityofcannabidiolic-andtetrahydrocannabinolicacid-synthaseincannabissatival.anditsrelationshipwithchemicalphenotype.phytochemistry,116(1),57–68.https://doi.org/10.1016/j.phytochem.2015.03.006
[9]priest,d.m.,ambrose,s.j.,vaistij,f.e.,elias,l.,higgins,g.s.,ross,a.r.s.,…bowles,d.j.(2006).useoftheglucosyltransferaseugt71b6todisturbabscisicacidhomeostasisinarabidopsisthaliana.plantjournal,46(3),492–502.https://doi.org/10.1111/j.1365-313x.2006.02701.x
[10]siritunga,d.,andsayre,r.t.(2003).generationofcyanogen-freetransgeniccassava.planta217,367–373.doi:10.1007/s00425-003-1005-8
[11]sparkes,i.a.,runions,j.,kearns,a.,&hawes,c.(2006).rapid,transientexpressionoffluorescentfusionproteinsintobaccoplantsandgenerationofstablytransformedplants.natureprotocols,1(4),2019–2025.https://doi.org/10.1038/nprot.2006.286
[13]taura,f.,morimoto,s.,&shoyama,y.(1996).purificationandcharacterizationofcannabidiolic-acidsynthasefromcannabissatival.biochemicalanalysisofanovelenzymethatcatalyzestheoxidocyclizationof.journalofbiologicalchemistry,271(29),17411–17416.https://doi.org/10.1074/jbc.271.29.17411
[14]taura,f.,sirikantaramas,s.,shoyamay,yoshikaik,shoyamay,morimotos.(2007)cannabidiolic-acidsynthase,thechemotype-determiningenzymeinthefiber-typecannabissativa.febbsletters,581(16),2929-34.doi:10.1016/j.febslet.2007.05.043
[15]yoo,s.d.,cho,y.h.,&sheen,j.(2007).arabidopsismesophyllprotoplasts:aversatilecellsystemfortransientgeneexpressionanalysis.natureprotocols,2(7),1565–1572.https://doi.org/10.1038/nprot.2007.199
[16]matsui,t.,matsuura,h.,sawada,k.,takita,e.,kinjo,s.,takenami,s.,…kato,k.(2012).highlevelexpressionoftransgenesbyuseof5′-untranslatedregionofthearabidopsisthalianaarabinogalactan-protein21geneindicotyledons.plantbiotechnology,29(3),319–322.https://doi.org/10.5511/plantbiotechnology.12.0322a
[17]murashige,t.,andskoog,f.(1962).arevisedmediumforrapidgrowthandbioassayswithtobaccotissueculture.physiol.plant.15,473–497.doi:10.1111/j.1399-3054.1962.tb08052.x
[18]zipp,etal.,cannabinoidglycosides:invitroproductionofanewclassofcannabinoidswithimprovedphysicochemicalproperties.biorxivpreprintdoi:http://dx.doi.org/10.1101/104349
[19]mohamed,e.a.,t.iwaki,i.munir,m.tamoi,s.shigeoka,anda.wadano.2003.overexpressionofbacterialcatalaseintomatoleafchloroplastsenhancesphoto-oxidativestresstolerance.plantcellenviron.26:2037–2046.
[20]akhtar,m.t.,2013,doctoralthesis,leidenuniversity.cannabinoidsandzebrafish.2013-05-22.http://hdl.handle.net/!887/20899
[21]sayedfarag.cannabinoidsproductionincannabissatival.:aninvitroapproach.thesis·january2014.doi:10.17877/de290r-16298
[21]k,watanabe,etal.,cytochromep450enzymesinvolvedinthemetabolismoftetrahydrocannabinolsandcannabinolbyhumanhepaticmicrosomes.lifesciences.volume80,issue15,20march2007,pages1415-1419
[22]flores-sanchezij.etal.,elicitationstudiesincellsuspensionculturesofcannabissatival.jbiotechnol.2009aug20;143(2):157-68.doi:10.1016/j.jbiotec.
[23]stephenm.stout&ninam.cimino(2013)exogenouscannabinoidsassubstrates,inhibitors,andinducersofhumandrugmetabolizingenzymes:asystematicreview,drugmetabolismreviews,46:1,86-95,doi:10.3109/03602532.2013.849268
[24]andrecm,hausmanj-f,guerrierog.cannabissativa:theplantofthethousandandonemolecules.frontiersinplantscience.2016;7:19.doi:10.3389/fpls.2016.00019.
[25]mahlbergpl.eta;.,accumulationofcannabinoidsinglandulartrichomesofcannabis(cannabaceae).journalofindustrialhemp9(1):15-36·june2004with273readsdoi:10.1300/j237v09n01_04.
[25]katalins.,etal.,minirevmedchem.2017;17(13):1223-1291.doi:10.2174/1389557516666161004162133.
[26]sirikantaramass.,etal.,tetrahydrocannabinolicacidsynthase,theenzymecontrollingmarijuanapsychoactivity,issecretedintothestoragecavityoftheglandulartrichomes.plantandcellphysiology,volume46,issue9,1september2005,pages1578–1582,https://doi.org/10.1093/pcp/pci166.
[26]schilmilleral,lastrl,picherskye(2008)harnessingplanttrichomebiochemistryfortheproductionofusefulcompounds.plantjournal54:702-711.
[27]matias-hernandez,l.etal.aamyb1anditsorthologueatmyb61affectterpenemetabolismandtrichomedevelopmentinartemisiaannuaandarabidopsisthaliana.plantj.2017;90:520–534
序列表
如上所述,本申请包含完整的序列表,其已经以ascii格式电子提交,并且其全部内容通过引用并入本文。以下序列进一步提供于此,并且其整体并入本说明书中:
seqidno.1
dna
细胞色素p450(cyp3a4)
人
atggctttgattcctgatttggctatggaaactagattgttgttggctgtttcattggttttgttgtatttgtatggaactcattcacatggattgtttaaaaaattgggaattcctggacctactcctttgccttttttgggaaatattttgtcatatcataaaggattttgcatgtttgatatggaatgccataaaaaatatggaaaagtttggggattttatgatggacaacaacctgttttggctattactgatcctgatatgattaaaactgttttggttaaagaatgctattcagtttttactaatagaagaccttttggacctgttggatttatgaaatcagctatttcaattgctgaagatgaagaatggaaaagattgagatcattgttgtcacctacttttacttcaggaaaattgaaagaaatggttcctattattgctcaatatggagatgttttggttagaaatttgagaagagaagctgaaactggaaaacctgttactttgaaagatgtttttggagcttattcaatggatgttattacttcaacttcatttggagttaatattgattcattgaataatcctcaagatccttttgttgaaaatactaaaaaattgttgagatttgattttttggatcctttttttttgtcaattactgtttttccttttttgattcctattttggaagttttgaatatttgcgtttttcctagagaagttactaattttttgagaaaatcagttaaaagaatgaaagaatcaagattggaagatactcaaaaacatagagttgattttttgcaattgatgattgattcacaaaattcaaaagaaactgaatcacataaagctttgtcagatttggaattggttgctcaatcaattatttttatttttgctggatgcgaaactacttcatcagttttgtcatttattatgtatgaattggctactcatcctgatgttcaacaaaaattgcaagaagaaattgatgctgttttgcctaataaagctcctcctacttatgatactgttttgcaaatggaatatttggatatggttgttaatgaaactttgagattgtttcctattgctatgagattggaaagagtttgcaaaaaagatgttgaaattaatggaatgtttattcctaaaggagttgttgttatgattccttcatatgctttgcatagagatcctaaatattggactgaacctgaaaaatttttgcctgaaagattttcaaaaaaaaataaagataatattgatccttatatttatactccttttggatcaggacctagaaattgcattggaatgagatttgctttgatgaatatgaaattggctttgattagagttttgcaaaatttttcatttaaaccttgcaaagaaactcaaattcctttgaaattgtcattgggaggattgttgcaacctgaaaaacctgttgttttgaaagttgaatcaagagatggaactgtttcaggagct
seqidno.2
氨基酸
细胞色素p450(cyp3a4)
人
malipdlametrlllavslvllylygthshglfkklgipgptplpflgnilsyhkgfcmfdmechkkygkvwgfydgqqpvlaitdpdmiktvlvkecysvftnrrpfgpvgfmksaisiaedeewkrlrsllsptftsgklkemvpiiaqygdvlvrnlrreaetgkpvtlkdvfgaysmdvitstsfgvnidslnnpqdpfventkkllrfdfldpfflsitvfpflipilevlnicvfprevtnflrksvkrmkesrledtqkhrvdflqlmidsqnsketeshkalsdlelvaqsiififagcettssvlsfimyelathpdvqqklqeeidavlpnkapptydtvlqmeyldmvvnetlrlfpiamrlervckkdveingmfipkgvvvmipsyalhrdpkywtepekflperfskknkdnidpyiytpfgsgprncigmrfalmnmklalirvlqnfsfkpcketqiplklslggllqpekpvvlkvesrdgtvsga
seqidno.3
dna
p450氧化还原酶基因(oxred)
人
atgattaatatgggagattcacatgttgatacttcatcaactgtttcagaagctgttgctgaagaagtttcattgttttcaatgactgatatgattttgttttcattgattgttggattgttgacttattggtttttgtttagaaaaaaaaaagaagaagttcctgaatttactaaaattcaaactttgacttcatcagttagagaatcatcatttgttgaaaaaatgaaaaaaactggaagaaatattattgttttttatggatcacaaactggaactgctgaagaatttgctaatagattgtcaaaagatgctcatagatatggaatgagaggaatgtcagctgatcctgaagaatatgatttggctgatttgtcatcattgcctgaaattgataatgctttggttgttttttgcatggctacttatggagaaggagatcctactgataatgctcaagatttttatgattggttgcaagaaactgatgttgatttgtcaggagttaaatttgctgtttttggattgggaaataaaacttatgaacattttaatgctatgggaaaatatgttgataaaagattggaacaattgggagctcaaagaatttttgaattgggattgggagatgatgatggaaatttggaagaagattttattacttggagagaacaattttggttggctgtttgcgaacattttggagttgaagctactggagaagaatcatcaattagacaatatgaattggttgttcatactgatattgatgctgctaaagtttatatgggagaaatgggaagattgaaatcatatgaaaatcaaaaacctccttttgatgctaaaaatccttttttggctgctgttactactaatagaaaattgaatcaaggaactgaaagacatttgatgcatttggaattggatatttcagattcaaaaattagatatgaatcaggagatcatgttgctgtttatcctgctaatgattcagctttggttaatcaattgggaaaaattttgggagctgatttggatgttgttatgtcattgaataatttggatgaagaatcaaataaaaaacatccttttccttgccctacttcatatagaactgctttgacttattatttggatattactaatcctcctagaactaatgttttgtatgaattggctcaatatgcttcagaaccttcagaacaagaattgttgagaaaaatggcttcatcatcaggagaaggaaaagaattgtatttgtcatgggttgttgaagctagaagacatattttggctattttgcaagattgcccttcattgagacctcctattgatcatttgtgcgaattgttgcctagattgcaagctagatattattcaattgcttcatcatcaaaagttcatcctaattcagttcatatttgcgctgttgttgttgaatatgaaactaaagctggaagaattaataaaggagttgctactaattggttgagagctaaagaacctgttggagaaaatggaggaagagctttggttcctatgtttgttagaaaatcacaatttagattgccttttaaagctactactcctgttattatggttggacctggaactggagttgctccttttattggatttattcaagaaagagcttggttgagacaacaaggaaaagaagttggagaaactttgttgtattatggatgcagaagatcagatgaagattatttgtatagagaagaattggctcaatttcatagagatggagctttgactcaattgaatgttgctttttcaagagaacaatcacataaagtttatgttcaacatttgttgaaacaagatagagaacatttgtggaaattgattgaaggaggagctcatatttatgtttgcggagatgctagaaatatggctagagatgttcaaaatactttttatgatattgttgctgaattgggagctatggaacatgctcaagctgttgattatattaaaaaattgatgactaaaggaagatattcattggatgtttggtca
seqidno.4
氨基酸
p450氧化还原酶
人
minmgdshvdtsstvseavaeevslfsmtdmilfslivglltywflfrkkkeevpeftkiqtltssvressfvekmkktgrniivfygsqtgtaeefanrlskdahrygmrgmsadpeeydladlsslpeidnalvvfcmatygegdptdnaqdfydwlqetdvdlsgvkfavfglgnktyehfnamgkyvdkrleqlgaqrifelglgdddgnleedfitwreqfwlavcehfgveatgeessirqyelvvhtdidaakvymgemgrlksyenqkppfdaknpflaavttnrklnqgterhlmhleldisdskiryesgdhvavypandsalvnqlgkilgadldvvmslnnldeesnkkhpfpcptsyrtaltyylditnpprtnvlyelaqyasepseqellrkmasssgegkelylswvvearrhilailqdcpslrppidhlcellprlqaryysiassskvhpnsvhicavvveyetkagrinkgvatnwlrakepvgenggralvpmfvrksqfrlpfkattpvimvgpgtgvapfigfiqerawlrqqgkevgetllyygcrrsdedylyreelaqfhrdgaltqlnvafsreqshkvyvqhllkqdrehlwklieggahiyvcgdarnmardvqntfydivaelgamehaqavdyikklmtkgrysldvws
seqidno.5
dna
大麻二酚酸(cbda)合酶
cannabissativa
atgaatcctcgagaaaacttccttaaatgcttctcgcaatatattcccaataatgcaacaaatctaaaactcgtatacactcaaaacaacccattgtatatgtctgtcctaaattcgacaatacacaatcttagattcacctctgacacaaccccaaaaccacttgttatcgtcactccttcacatgtctctcatatccaaggcactattctatgctccaagaaagttggcttgcagattcgaactcgaagtggtggtcatgattctgagggcatgtcctacatatctcaagtcccatttgttatagtagacttgagaaacatgcgttcaatcaaaatagatgttcatagccaaactgcatgggttgaagccggagctacccttggagaagtttattattgggttaatgagaaaaatgagaatcttagtttggcggctgggtattgccctactgtttgcgcaggtggacactttggtggaggaggctatggaccattgatgagaaactatggcctcgcggctgataatatcattgatgcacacttagtcaacgttcatggaaaagtgctagatcgaaaatctatgggggaagatctcttttgggctttacgtggtggtggagcagaaagcttcggaatcattgtagcatggaaaattagactggttgctgtcccaaagtctactatgtttagtgttaaaaagatcatggagatacatgagcttgtcaagttagttaacaaatggcaaaatattgcttacaagtatgacaaagatttattactcatgactcacttcataactaggaacattacagataatcaagggaagaataagacagcaatacacacttacttctcttcagttttccttggtggagtggatagtctagtcgacttgatgaacaagagttttcctgagttgggtattaaaaaaacggattgcagacaattgagctggattgatactatcatcttctatagtggtgttgtaaattacgacactgataattttaacaaggaaattttgcttgatagatccgctgggcagaacggtgctttcaagattaagttagactacgttaagaaaccaattccagaatctgtatttgtccaaattttggaaaaattatatgaagaagatataggagctgggatgtatgcgttgtacccttacggtggtataatggatgagatttcagaatcagcaattccattccctcatcgagctggaatcttgtatgagttatggtacatatgtagttgggagaagcaagaagataacgaaaagcatctaaactggattagaaatatttataacttcatgactccttatgtgtccaaaaattcaagattggcatatctcaattatagagaccttgatataggaataaatgatcccaagaatccaaataattacacacaagcacgtatttggggtgagaagtattttggtaaaaattttgacaggctagtaaaagtgaaaaccctggttgatcccaataacttttttagaaacgaacaaagcatcccacctcaaccacggcatcgtcattaa
seqidno.6
氨基酸
大麻二酚酸(cbda)合酶
cannabissativa
mnprenflkcfsqyipnnatnlklvytqnnplymsvlnstihnlrftsdttpkplvivtpshvshiqgtilcskkvglqirtrsgghdsegmsyisqvpfvivdlrnmrsikidvhsqtawveagatlgevyywvneknenlslaagycptvcagghfggggygplmrnyglaadniidahlvnvhgkvldrksmgedlfwalrgggaesfgiivawkirlvavpkstmfsvkkimeihelvklvnkwqniaykydkdlllmthfitrnitdnqgknktaihtyfssvflggvdslvdlmnksfpelgikktdcrqlswidtiifysgvvnydtdnfnkeilldrsagqngafkikldyvkkpipesvfvqileklyeedigagmyalypyggimdeisesaipfphragilyelwyicswekqednekhlnwirniynfmtpyvsknsrlaylnyrdldigindpknpnnytqariwgekyfgknfdrlvkvktlvdpnnffrneqsippqprhrh
seqidno.7
dna
udp糖基转移酶76g1
甜叶菊
atggaaaataaaactgaaactactgttagaagaagaagaagaattattttgtttcctgttccttttcaaggacatattaatcctattttgcaattggctaatgttttgtattcaaaaggattttcaattactatttttcatactaattttaataaacctaaaacttcaaattatcctcattttacttttagatttattttggataatgatcctcaagatgaaagaatttcaaatttgcctactcatggacctttggctggaatgagaattcctattattaatgaacatggagctgatgaattgagaagagaattggaattgttgatgttggcttcagaagaagatgaagaagtttcatgcttgattactgatgctttgtggtattttgctcaatcagttgctgattcattgaatttgagaagattggttttgatgacttcatcattgtttaattttcatgctcatgtttcattgcctcaatttgatgaattgggatatttggatcctgatgataaaactagattggaagaacaagcttcaggatttcctatgttgaaagttaaagatattaaatcagcttattcaaattggcaaattttgaaagaaattttgggaaaaatgattaaacaaactagagcttcatcaggagttatttggaattcatttaaagaattggaagaatcagaattggaaactgttattagagaaattcctgctccttcatttttgattcctttgcctaaacatttgactgcttcatcatcatcattgttggatcatgatagaactgtttttcaatggttggatcaacaacctccttcatcagttttgtatgtttcatttggatcaacttcagaagttgatgaaaaagattttttggaaattgctagaggattggttgattcaaaacaatcatttttgtgggttgttagacctggatttgttaaaggatcaacttgggttgaacctttgcctgatggatttttgggagaaagaggaagaattgttaaatgggttcctcaacaagaagttttggctcatggagctattggagctttttggactcattcaggatggaattcaactttggaatcagtttgcgaaggagttcctatgattttttcagattttggattggatcaacctttgaatgctagatatatgtcagatgttttgaaagttggagtttatttggaaaatggatgggaaagaggagaaattgctaatgctattagaagagttatggttgatgaagaaggagaatatattagacaaaatgctagagttttgaaacaaaaagctgatgtttcattgatgaaaggaggatcatcatatgaatcattggaatcattggtttcatatatttcatcattg
seqidno.8
氨基酸
upd糖基转移酶76g1
甜叶菊
menktettvrrrrriilfpvpfqghinpilqlanvlyskgfsitifhtnfnkpktsnyphftfrfildndpqderisnlpthgplagmripiinehgadelrrelellmlaseedeevsclitdalwyfaqsvadslnlrrlvlmtsslfnfhahvslpqfdelgyldpddktrleeqasgfpmlkvkdiksaysnwqilkeilgkmikqtrassgviwnsfkeleeseletvireipapsfliplpkhltasssslldhdrtvfqwldqqppssvlyvsfgstsevdekdfleiarglydskqsflwvvrpgfvkgstwveplpdgflgergrivkwvpqqevlahgaigafwthsgwnstlesvcegvpmifsdfgldqplnarymsdvlkvgvylengwergeianairrvmvdeegeyirqnarvlkqkadvslmkggssyesleslvsyissl
seqidno.9
dna
abc转运蛋白abcg2
人
atgtcatcatcaaatgttgaagtttttattcctgtttcacaaggaaatactaatggatttcctgctactgcttcaaatgatttgaaagcttttactgaaggagctgttttgtcatttcataatatttgctatagagttaaattgaaatcaggatttttgccttgcagaaaacctgttgaaaaagaaattttgtcaaatattaatggaattatgaaacctggattgaatgctattttgggacctactggaggaggaaaatcatcattgttggatgttttggctgctagaaaagatccttcaggattgtcaggagatgttttgattaatggagctcctagacctgctaattttaaatgcaattcaggatatgttgttcaagatgatgttgttatgggaactttgactgttagagaaaatttgcaattttcagctgctttgagattggctactactatgactaatcatgaaaaaaatgaaagaattaatagagttattcaagaattgggattggataaagttgctgattcaaaagttggaactcaatttattagaggagtttcaggaggagaaagaaaaagaacttcaattggaatggaattgattactgatccttcaattttgtttttggatgaacctactactggattggattcatcaactgctaatgctgttttgttgttgttgaaaagaatgtcaaaacaaggaagaactattattttttcaattcatcaacctagatattcaatttttaaattgtttgattcattgactttgttggcttcaggaagattgatgtttcatggacctgctcaagaagctttgggatattttgaatcagctggatatcattgcgaagcttataataatcctgctgatttttttttggatattattaatggagattcaactgctgttgctttgaatagagaagaagattttaaagctactgaaattattgaaccttcaaaacaagataaacctttgattgaaaaattggctgaaatttatgttaattcatcattttataaagaaactaaagctgaattgcatcaattgtcaggaggagaaaaaaaaaaaaaaattactgtttttaaagaaatttcatatactacttcattttgccatcaattgagatgggtttcaaaaagatcatttaaaaatttgttgggaaatcctcaagcttcaattgctcaaattattgttactgttgttttgggattggttattggagctatttattttggattgaaaaatgattcaactggaattcaaaatagagctggagttttgttttttttgactactaatcaatgcttttcatcagtttcagctgttgaattgtttgttgttgaaaaaaaattgtttattcatgaatatatttcaggatattatagagtttcatcatattttttgggaaaattgttgtcagatttgttgcctatgagaatgttgccttcaattatttttacttgcattgtttattttatgttgggattgaaagctaaagctgatgctttttttgttatgatgtttactttgatgatggttgcttattcagcttcatcaatggctttggctattgctgctggacaatcagttgtttcagttgctactttgttgatgactatttgctttgtttttatgatgattttttcaggattgttggttaatttgactactattgcttcatggttgtcatggttgcaatatttttcaattcctagatatggatttactgctttgcaacataatgaatttttgggacaaaatttttgccctggattgaatgctactggaaataatccttgcaattatgctacttgcactggagaagaatatttggttaaacaaggaattgatttgtcaccttggggattgtggaaaaatcatgttgctttggcttgcatgattgttatttttttgactattgcttatttgaaattgttgtttttgaaaaaatattca
seqidno.10
氨基酸
abc转运蛋白abcg2
人
msssnvevfipvsqgntngfpatasndlkaftegavlsfhnicyrvklksgflpcrkpvekeilsningimkpglnailgptgggksslldvlaarkdpsglsgdvlingaprpanfkcnsgyvvqddvvmgtltvrenlqfsaalrlattmtnheknerinrviqelgldkvadskvgtqfirgvsggerkrtsigmelitdpsilfldepttgldsstanavllllkrmskqgrtiifsihqprysifklfdsltllasgrlmfhgpaqealgyfesagyhceaynnpadffldiingdstavalnreedfkateiiepskqdkplieklaeiyvnssfyketkaelhqlsggekkkkitvfkeisyttsfchqlrwvskrsfknllgnpqasiaqiivtvvlglyigaiyfglkndstgiqnragvlfflttnqcfssvsavelfvvekklfiheyisgyyrvssyflgkllsdllpmrmlpsiiftcivyfmlglkakadaffvmmftlmmvaysassmalaiaagqsvvsvatllmticfvfmmifsgllvnlttiaswlswlqyfsiprygftalqhneflgqnfcpglnatgnnpcnyatctgeeylvkqgidlspwglwknhvalacmivifltiaylkllflkkys
seqidno.11
dna
myb12–样
大麻
atgaagaagaacaaatcaactagtaataataagaacaacaacagtaataatatcatcaaaaacgacatcgtatcatcatcatcatcaacaacaacaacatcatcaacaactacagcaacatcatcatttcataatgagaaagttactgtcagtactgatcatattattaatcttgatgataagcagaaacgacaattatgtcgttgtcgtttagaaaaagaagaagaagaagaaggaagtggtggttgtggtgagacagtagtaatgatgctagggtcagtatctcctgctgctgctactgctgctgcagctgggggctcatcaagttgtgatgaagacatgttgggtggtcatgatcaactgttgttgttgtgttgttctgagaaaaaaacgacagaaatttcatcagtggtgaactttaataataataataataataataaggaaaatggtgacgaagtttcaggaccgtacgattatcatcatcataaagaagaggaagaagaagaagaagaagatgaagcatctgcatcagtagcagctgttgatgaagggatgttgttgtgctttgatgacataatagatagccacttgctaaatccaaatgaggttttgactttaagagaagatagccataatgaaggtggggcagctgatcagattgacaagactacttgtaataatactactattactactaatgatgattataacaataacttgatgatgttgagctgcaataataacggagattatgttattagtgatgatcatgatgatcagtactggatagacgacgtcgttggagttgacttttggagttgggagagttcgactactactgttattacccaagaacaagaacaagaacaagatcaagttcaagaacagaagaatatgtgggataatgagaaagagaaactgttgtctttgctatgggataatagtgataacagcagcagttgggagttacaagataaaagcaataataataataataataatgttcctaacaaatgtcaagagattacctctgataaagaaaatgctatggttgcatggcttctctcctga
seqidno.12
氨基酸
myb12
大麻
mkknkstsnnknnnsnniikndivsssssttttsstttatssfhnekvtvstdhiinlddkqkrqlcrcrlekeeeeegsggcgetvvmmlgsvspaaataaaaggssscdedmlgghdqllllccsekktteissvvnfnnnnnnnkengdevsgpydyhhhkeeeeeeeedeasasvaavdegmllcfddiidshllnpnevltlredshneggaadqidkttcnnttittnddynnnlmmlscnnngdyvisddhddqywiddvvgvdfwswesstttvitqeqeqeqdqvqeqknmwdnekekllsllwdnsdnssswelqdksnnnnnnnvpnkcqeitsdkenamvawlls
seqidno.13
dna
过氧化氢酶
拟南芥
atggatccttataaatatagacctgcttcatcatataattcacctttttttactactaattcaggagctcctgtttggaataataattcatcaatgactgttggacctagaggattgattttgttggaagattatcatttggttgaaaaattggctaattttgatagagaaagaattcctgaaagagttgttcatgctagaggagcttcagctaaaggattttttgaagttactcatgatatttcaaatttgacttgcgctgattttttgagagctcctggagttcaaactcctgttattgttagattttcaactgttattcatgctagaggatcacctgaaactttgagagatcctagaggatttgctgttaaattttatactagagaaggaaattttgatttggttggaaataattttcctgttttttttattagagatggaatgaaatttcctgatattgttcatgctttgaaacctaatcctaaatcacatattcaagaaaattggagaattttggattttttttcacatcatcctgaatcattgaatatgtttacttttttgtttgatgatattggaattcctcaagattatagacatatggatggatcaggagttaatacttatatgttgattaataaagctggaaaagctcattatgttaaatttcattggaaacctacttgcggagttaaatcattgttggaagaagatgctattagattgggaggaactaatcattcacatgctactcaagatttgtatgattcaattgctgctggaaattatcctgaatggaaattgtttattcaaattattgatcctgctgatgaagataaatttgattttgatcctttggatgttactaaaacttggcctgaagatattttgcctttgcaacctgttggaagaatggttttgaataaaaatattgataatttttttgctgaaaatgaacaattggctttttgccctgctattattgttcctggaattcattattcagatgataaattgttgcaaactagagttttttcatatgctgatactcaaagacatagattgggacctaattatttgcaattgcctgttaatgctcctaaatgcgctcatcataataatcatcatgaaggatttatgaattttatgcatagagatgaagaagttaattattttccttcaagatatgatcaagttagacatgctgaaaaatatcctactcctcctgctgtttgctcaggaaaaagagaaagatgcattattgaaaaagaaaataattttaaagaacctggagaaagatatagaacttttactcctgaaagacaagaaagatttattcaaagatggattgatgctttgtcagatcctagaattactcatgaaattagatcaatttggatttcatattggtcacaagctgataaatcattgggacaaaaattggcttcaagattgaatgttagaccttcaatt
seqidno.14
氨基酸
过氧化氢酶
拟南芥
mdpykyrpassynspffttnsgapvwnnnssmtvgprglilledyhlveklanfdreripervvhargasakgffevthdisnltcadflrapgvqtpvivrfstvihargspetlrdprgfavkfytregnfdlvgnnfpvffirdgmkfpdivhalkpnpkshiqenwrildffshhpeslnmftflfddigipqdyrhmdgsgvntymlinkagkahyvkfhwkptcgvkslleedairlggtnhshatqdlydsiaagnypewklfiqiidpadedkfdfdpldvtktwpedilplqpvgrmvlnknidnffaeneqlafcpaiivpgihysddkllqtrvfsyadtqrhrlgpnylqlpvnapkcahhnnhhegfmnfmhrdeevnyfpsrydqvrhaekyptppavcsgkrerciiekennfkepgeryrtftperqerfiqrwidalsdpritheirsiwisywsqadkslgqklasrlnvrpsi
seqidno.15
dna
过氧化氢酶hpii(kate)
大肠杆菌
atgtcgcaacataacgaaaagaacccacatcagcaccagtcaccactacacgattccagcgaagcgaaaccggggatggactcactggcacctgaggacggctctcatcgtccagcggctgaaccaacaccgccaggtgcacaacctaccgccccagggagcctgaaagcccctgatacgcgtaacgaaaaacttaattctctggaagacgtacgcaaaggcagtgaaaattatgcgctgaccactaatcagggcgtgcgcatcgccgacgatcaaaactcactgcgtgccggtagccgtggtccaacgctgctggaagattttattctgcgcgagaaaatcacccactttgaccatgagcgcattccggaacgtattgttcatgcacgcggatcagccgctcacggttatttccagccatataaaagcttaagcgatattaccaaagcggatttcctctcagatccgaacaaaatcaccccagtatttgtacgtttctctaccgttcagggtggtgctggctctgctgataccgtgcgtgatatccgtggctttgccaccaagttctataccgaagagggtatttttgacctcgttggcaataacacgccaatcttctttatccaggatgcgcataaattccccgattttgttcatgcggtaaaaccagaaccgcactgggcaattccacaagggcaaagtgcccacgatactttctgggattatgtttctctgcaacctgaaactctgcacaacgtgatgtgggcgatgtcggatcgcggcatcccccgcagttaccgcaccatggaaggcttcggtattcacaccttccgcctgattaatgccgaagggaaggcaacgtttgtacgtttccactggaaaccactggcaggtaaagcctcactcgtttgggatgaagcacaaaaactcaccggacgtgacccggacttccaccgccgcgagttgtgggaagccattgaagcaggcgattttccggaatacgaactgggcttccagttgattcctgaagaagatgaattcaagttcgacttcgatcttctcgatccaaccaaacttatcccggaagaactggtgcccgttcagcgtgtcggcaaaatggtgctcaatcgcaacccggataacttctttgctgaaaacgaacaggcggctttccatcctgggcatatcgtgccgggactggacttcaccaacgatccgctgttgcagggacgtttgttctcctataccgatacacaaatcagtcgtcttggtgggccgaatttccatgagattccgattaaccgtccgacctgcccttaccataatttccagcgtgacggcatgcatcgcatggggatcgacactaacccggcgaattacgaaccgaactcgattaacgataactggccgcgcgaaacaccgccggggccgaaacgcggcggttttgaatcataccaggagcgcgtggaaggcaataaagttcgcgagcgcagcccatcgtttggcgaatattattcccatccgcgtctgttctggctaagtcagacgccatttgagcagcgccatattgtcgatggtttcagttttgagttaagcaaagtcgttcgtccgtatattcgtgagcgcgttgttgaccagctggcgcatattgatctcactctggcccaggcggtggcgaaaaatctcggtatcgaactgactgacgaccagctgaatatcaccccacctccggacgtcaacggtctgaaaaaggatccatccttaagtttgtacgccattcctgacggtgatgtgaaaggtcgcgtggtagcgattttacttaatgatgaagtgagatcggcagaccttctggccattctcaaggcgctgaaggccaaaggcgttcatgccaaactgctctactcccgaatgggtgaagtgactgcggatgacggtacggtgttgcctatagccgctacctttgccggtgcaccttcgctgacggtcgatgcggtcattgtcccttgcggcaatatcgcggatatcgctgacaacggcgatgccaactactacctgatggaagcctacaaacaccttaaaccgattgcgctggcgggtgacgcgcgcaagtttaaagcaacaatcaagatcgctgaccagggtgaagaagggattgtggaagctgacagcgctgacggtagttttatggatgaactgctaacgctgatggcagcacaccgcgtgtggtcacgcattcctaagattgacaaaattcctgcctga
seqidno.16
氨基酸
过氧化氢酶hpii(kate)
大肠杆菌
msqhneknphqhqsplhdsseakpgmdslapedgshrpaaeptppgaqptapgslkapdtrneklnsledvrkgsenyalttnqgvriaddqnslragsrgptlledfilrekithfdheriperivhargsaahgyfqpykslsditkadflsdpnkitpvfvrfstvqggagsadtvrdirgfatkfyteegifdlvgnntpiffiqdahkfpdfvhavkpephwaipqgqsahdtfwdyvslqpetlhnvmwamsdrgiprsyrtmegfgihtfrlinaegkatfvrfhwkplagkaslvwdeaqkltgrdpdfhrrelweaieagdfpeyelgfqlipeedefkfdfdlldptklipeelvpvqrvgkmvlnrnpdnffaeneqaafhpghivpgldftndpllqgrlfsytdtqisrlggpnfheipinrptcpyhnfqrdgmhrmgidtnpanyepnsindnwpretppgpkrggfesyqervegnkvrerspsfgeyyshprlfwlsqtpfeqrhivdgfsfelskvvrpyirervvdqlahidltlaqavaknlgieltddqlnitpppdvnglkkdpslslyaipdgdvkgrvvaillndevrsadllailkalkakgvhakllysrmgevtaddgtvlpiaatfagapsltvdavivpcgniadiadngdanyylmeaykhlkpialagdarkfkatikiadqgeegiveadsadgsfmdelltlmaahrvwsripkidkipa
seqidno.17
dna
毛状体靶向cbda合酶
大麻
atgaagtgctcaacattctccttttggtttgtttgcaagataatatttttctttttctcattcaatatccaaacttccattgctaatcctcgagaaaacttccttaaatgcttctcgcaatatattcccaataatgcaacaaatctaaaactcgtatacactcaaaacaacccattgtatatgtctgtcctaaattcgacaatacacaatcttagattcacctctgacacaaccccaaaaccacttgttatcgtcactccttcacatgtctctcatatccaaggcactattctatgctccaagaaagttggcttgcagattcgaactcgaagtggtggtcatgattctgagggcatgtcctacatatctcaagtcccatttgttatagtagacttgagaaacatgcgttcaatcaaaatagatgttcatagccaaactgcatgggttgaagccggagctacccttggagaagtttattattgggttaatgagaaaaatgagaatcttagtttggcggctgggtattgccctactgtttgcgcaggtggacactttggtggaggaggctatggaccattgatgagaaactatggcctcgcggctgataatatcattgatgcacacttagtcaacgttcatggaaaagtgctagatcgaaaatctatgggggaagatctcttttgggctttacgtggtggtggagcagaaagcttcggaatcattgtagcatggaaaattagactggttgctgtcccaaagtctactatgtttagtgttaaaaagatcatggagatacatgagcttgtcaagttagttaacaaatggcaaaatattgcttacaagtatgacaaagatttattactcatgactcacttcataactaggaacattacagataatcaagggaagaataagacagcaatacacacttacttctcttcagttttccttggtggagtggatagtctagtcgacttgatgaacaagagttttcctgagttgggtattaaaaaaacggattgcagacaattgagctggattgatactatcatcttctatagtggtgttgtaaattacgacactgataattttaacaaggaaattttgcttgatagatccgctgggcagaacggtgctttcaagattaagttagactacgttaagaaaccaattccagaatctgtatttgtccaaattttggaaaaattatatgaagaagatataggagctgggatgtatgcgttgtacccttacggtggtataatggatgagatttcagaatcagcaattccattccctcatcgagctggaatcttgtatgagttatggtacatatgtagttgggagaagcaagaagataacgaaaagcatctaaactggattagaaatatttataacttcatgactccttatgtgtccaaaaatccaagattggcatatctcaattatagagaccttgatataggaataaatgatcccaagaatccaaataattacacacaagcacgtatttggggtgagaagtattttggtaaaaattttgacaggctagtaaaagtgaaaaccctggttgatcccaataacttttttagaaacgaacaaagcatcccacctctaccacggcatcgtcattaa
seqidno.18
氨基酸
毛状体靶向cbda合酶
大麻
mkcstfsfwfvckiiffffsfniqtsianprenflkcfsqyipnnatnlklvytqnnplymsvlnstihnlrftsdttpkplvivtpshvshiqgtilcskkvglqirtrsgghdsegmsyisqvpfvivdlrnmrsikidvhsqtawveagatlgevyywvneknenlslaagycptvcagghfggggygplmrnyglaadniidahlvnvhgkvldrksmgedlfwalrgggaesfgiivawkirlvavpkstmfsvkkimeihelvklvnkwqniaykydkdlllmthfitrnitdnqgknktaihtyfssvflggvdslvdlmnksfpelgikktdcrqlswidtiifysgvvnydtdnfnkeilldrsagqngafkikldyvkkpipesvfvqileklyeedigagmyalypyggimdeisesaipfphragilyelwyicswekqednekhlnwirniynfmtpyvsknprlaylnyrdldigindpknpnnytqariwgekyfgknfdrlvkvktlvdpnnffrneqsipplprhrh
seqidno.19
dna
毛状体靶向udp糖基转移酶76g1
甜叶菊
atgaagtgctcaacattctccttttggtttgtttgcaagataatatttttctttttctcattcaatatccaaacttccattgctaatcctcgagaaaataaaactgaaactactgttagaagaagaagaagaattattttgtttcctgttccttttcaaggacatattaatcctattttgcaattggctaatgttttgtattcaaaaggattttcaattactatttttcatactaattttaataaacctaaaacttcaaattatcctcattttacttttagatttattttggataatgatcctcaagatgaaagaatttcaaatttgcctactcatggacctttggctggaatgagaattcctattattaatgaacatggagctgatgaattgagaagagaattggaattgttgatgttggcttcagaagaagatgaagaagtttcatgcttgattactgatgctttgtggtattttgctcaatcagttgctgattcattgaatttgagaagattggttttgatgacttcatcattgtttaattttcatgctcatgtttcattgcctcaatttgatgaattgggatatttggatcctgatgataaaactagattggaagaacaagcttcaggatttcctatgttgaaagttaaagatattaaatcagcttattcaaattggcaaattttgaaagaaattttgggaaaaatgattaaacaaactagagcttcatcaggagttatttggaattcatttaaagaattggaagaatcagaattggaaactgttattagagaaattcctgctccttcatttttgattcctttgcctaaacatttgactgcttcatcatcatcattgttggatcatgatagaactgtttttcaatggttggatcaacaacctccttcatcagttttgtatgtttcatttggatcaacttcagaagttgatgaaaaagattttttggaaattgctagaggattggttgattcaaaacaatcatttttgtgggttgttagacctggatttgttaaaggatcaacttgggttgaacctttgcctgatggatttttgggagaaagaggaagaattgttaaatgggttcctcaacaagaagttttggctcatggagctattggagctttttggactcattcaggatggaattcaactttggaatcagtttgcgaaggagttcctatgattttttcagattttggattggatcaacctttgaatgctagatatatgtcagatgttttgaaagttggagtttatttggaaaatggatgggaaagaggagaaattgctaatgctattagaagagttatggttgatgaagaaggagaatatattagacaaaatgctagagttttgaaacaaaaagctgatgtttcattgatgaaaggaggatcatcatatgaatcattggaatcattggtttcatatatttcatcattgtaa
seqidno.20
氨基酸
毛状体靶向udp糖基转移酶76g1
甜叶菊
mkcstfsfwfvckiiffffsfniqtsianprenktettvrrrrriilfpvpfqghinpilqlanvlyskgfsitifhtnfnkpktsnyphftfrfildndpqderisnlpthgplagmripiinehgadelrrelellmlaseedeevsclitdalwyfaqsvadslnlrrlvlmtsslfnfhahvslpqfdelgyldpddktrleeqasgfpmlkvkdiksaysnwqilkeilgkmikqtrassgviwnsfkeleeseletvireipapsfliplpkhltasssslldhdrtvfqwldqqppssvlyvsfgstsevdekdfleiarglydskqsflwvvrpgfvkgstwveplpdgflgergrivkwvpqqevlahgaigafwthsgwnstlesvcegvpmifsdfgldqplnarymsdvlkvgvylengwergeianairrvmvdeegeyirqnarvlkqkadvslmkggssyesleslvsyissl
seqidno.21
dna
pm-utr1
拟南芥
atggaggtccatggctccggattccgtcgaattctgttgttggcgttgtgtatctccgggatctggtccgcctacatctaccaaggcgttcttcaagagactctgtccacgaagagatttggtccagatgagaagaggttcgagcatcttgcattcttgaacttagctcaaagtgtagtctgcttgatctggtcttatataatgatcaagctctggtcaaatgctggtaacggtggagcaccatggtggacgtattggagtgcaggcattactaatacaattggtcctgccatgggaattgaagccttgaagtatatcagttatccagctcaggttttggcaaaatcgtcaaaaatgattccagttatgctaatgggaactttagtttacggaataagatacactttccctgaatacatgtgcacctttcttgtcgctggaggagtatccatctttgctcttcttaagacaagctctaagacaattagcaagctagcacatccaaatgctcccctcggttacgcactttgttccttaaacctcgcctttgacggattcacaaatgccacacaagactccattgcctcaaggtacccaaaaaccgaagcgtgggacataatgctgggaatgaacttatggggcacaatatacaacattatctacatgtttggcttgccacaagggatggattcgaagcaattcagttctgtaagctacacccggaagcggcatgggacattctaaagtattgtatatgcggtgccgtgggacaaaacttcatcttcatgacaataagtaacttcgggtcactagctaacacgaccataaccacgaccaggaagtttgttagcattgttgtatcatcagtaatgagcggaaatccattgtcgttgaagcaatggggatgtgtttcgatggtctttggtggtttggcatatcaaatttatcttaaatggaagaaattgcagagagtggagtgctccataatgaacttaatgtgtgggtctacctgcgccgcttga
seqidno.22
dna
细胞溶质cbda合酶(cytcbda)
cannabissativa
atgaatcctcgagaaaacttccttaaatgcttctcgcaatatattcccaataatgcaacaaatctaaaactcgtatacactcaaaacaacccattgtatatgtctgtcctaaattcgacaatacacaatcttagattcacctctgacacaaccccaaaaccacttgttatcgtcactccttcacatgtctctcatatccaaggcactattctatgctccaagaaagttggcttgcagattcgaactcgaagtggtggtcatgattctgagggcatgtcctacatatctcaagtcccatttgttatagtagacttgagaaacatgcgttcaatcaaaatagatgttcatagccaaactgcatgggttgaagccggagctacccttggagaagtttattattgggttaatgagaaaaatgagaatcttagtttggcggctgggtattgccctactgtttgcgcaggtggacactttggtggaggaggctatggaccattgatgagaaactatggcctcgcggctgataatatcattgatgcacacttagtcaacgttcatggaaaagtgctagatcgaaaatctatgggggaagatctcttttgggctttacgtggtggtggagcagaaagcttcggaatcattgtagcatggaaaattagactggttgctgtcccaaagtctactatgtttagtgttaaaaagatcatggagatacatgagcttgtcaagttagttaacaaatggcaaaatattgcttacaagtatgacaaagatttattactcatgactcacttcataactaggaacattacagataatcaagggaagaataagacagcaatacacacttacttctcttcagttttccttggtggagtggatagtctagtcgacttgatgaacaagagttttcctgagttgggtattaaaaaaacggattgcagacaattgagctggattgatactatcatcttctatagtggtgttgtaaattacgacactgataattttaacaaggaaattttgcttgatagatccgctgggcagaacggtgctttcaagattaagttagactacgttaagaaaccaattccagaatctgtatttgtccaaattttggaaaaattatatgaagaagatataggagctgggatgtatgcgttgtacccttacggtggtataatggatgagatttcagaatcagcaattccattccctcatcgagctggaatcttgtatgagttatggtacatatgtagttgggagaagcaagaagataacgaaaagcatctaaactggattagaaatatttataacttcatgactccttatgtgtccaaaaatccaagattggcatatctcaattatagagaccttgatataggaataaatgatcccaagaatccaaataattacacacaagcacgtatttggggtgagaagtattttggtaaaaattttgacaggctagtaaaagtgaaaaccctggttgatcccaataacttttttagaaacgaacaaagcatcccacctctaccacggcatcgtcattaa
seqidno.23
氨基酸
细胞溶质cbda合酶(cytcbda)
cannabissativa
mnprenflkcfsqyipnnatnlklvytqnnplymsvlnstihnlrftsdttpkplvivtpshvshiqgtilcskkvglqirtrsgghdsegmsyisqvpfvivdlrnmrsikidvhsqtawveagatlgevyywvneknenlslaagycptvcagghfggggygplmrnyglaadniidahlvnvhgkvldrksmgedlfwalrgggaesfgiivawkirlvavpkstmfsvkkimeihelvklvnkwqniaykydkdlllmthfitrnitdnqgknktaihtyfssvflggvdslvdlmnksfpelgikktdcrqlswidtiifysgvvnydtdnfnkeilldrsagqngafkikldyvkkpipesvfvqileklyeedigagmyalypyggimdeisesaipfphragilyelwyicswekqednekhlnwirniynfmtpyvsknprlaylnyrdldigindpknpnnytqariwgekyfgknfdrlvkvktlvdpnnffrneqsipplprhrh
seqidno.24
dna
细胞溶质靶向udp糖基转移酶76g1(cytutg)
甜叶菊
atggaaaataaaaccgaaaccaccgtccgccgtcgtcgccgtatcattctgttcccggtcccgttccagggccacatcaacccgattctgcaactggcgaacgtgctgtattcgaaaggtttcagcatcaccatcttccatacgaacttcaacaagccgaagaccagcaattacccgcactttacgttccgttttattctggataacgacccgcaggatgaacgcatctctaatctgccgacccacggcccgctggcgggtatgcgtattccgattatcaacgaacacggcgcagatgaactgcgtcgcgaactggaactgctgatgctggccagcgaagaagatgaagaagtttcttgcctgatcaccgacgcactgtggtattttgcccagtctgttgcagatagtctgaacctgcgtcgcctggtcctgatgaccagcagcctgttcaattttcatgcccacgttagtctgccgcagttcgatgaactgggttatctggacccggatgacaaaacccgcctggaagaacaggcgagcggctttccgatgctgaaagtcaaggatattaagtcagcgtactcgaactggcagattctgaaagaaatcctgggtaaaatgattaagcaaaccaaagcaagttccggcgtcatctggaatagtttcaaagaactggaagaatccgaactggaaacggtgattcgtgaaatcccggctccgagttttctgattccgctgccgaagcatctgaccgcgagcagcagcagcctgctggatcacgaccgcacggtgtttcagtggctggatcagcaaccgccgagttccgtgctgtatgttagcttcggtagtacctcggaagtggatgaaaaggactttctggaaatcgctcgtggcctggttgatagcaaacaatctttcctgtgggtggttcgcccgggttttgtgaagggctctacgtgggttgaaccgctgccggacggcttcctgggtgaacgtggccgcattgtcaaatgggtgccgcagcaagaagtgctggcgcatggcgcgattggcgcgttttggacccactccggttggaactcaacgctggaatcggtttgtgaaggtgtcccgatgattttctcagattttggcctggaccagccgctgaatgcacgttatatgtcggatgttctgaaagtcggtgtgtacctggaaaacggttgggaacgcggcgaaattgcgaatgccatccgtcgcgttatggtcgatgaagaaggcgaatacattcgtcagaatgctcgcgtcctgaaacaaaaggcggacgtgagcctgatgaaaggcggttcatcgtatgaaagtctggaatccctggtttcatacatcagctctctgtaa
seqidno.25
氨基酸
细胞溶质靶向udp糖基转移酶76g1(cytutg)
甜叶菊
menktettvrrrrriilfpvpfqghinpilqlanvlyskgfsitifhtnfnkpktsnyphftfrfildndpqderisnlpthgplagmripiinehgadelrrelellmlaseedeevsclitdalwyfaqsvadslnlrrlvlmtsslfnfhahvslpqfdelgyldpddktrleeqasgfpmlkvkdiksaysnwqilkeilgkmikqtkassgviwnsfkeleeseletvireipapsfliplpkhltasssslldhdrtvfqwldqqppssvlyvsfgstsevdekdfleiarglydskqsflwvvrpgfvkgstwveplpdgflgergrivkwvpqqevlahgaigafwthsgwnstlesvcegvpmifsdfgldqplnarymsdvlkvgvylengwergeianairrvmvdeegeyirqnarvlkqkadvslmkggssyesleslvsyissl
seqidno.26
氨基酸
糖基转移酶(ntgt5a)
烟草
mgsigaeltkphavcipypaqghinpmlklakilhhkgfhitfvntefnhrrllksrgpdslkglssfrfetipdglppceadatqdipslcesttntclapfrdllaklndtntsnvppvscivsdgvmsftlaaaqelgvpevlfwttsacgflgymhyckviekgyaplkdasdltngylettldfipgmkdvrlrdlpsflrttnpdefmikfvlqeterarkasaiilntfetleaevleslrnllppvypigplhflvkhvddenlkglrsslwkeepeciqwldtkepnsvvyvnfgsitvmtpnqliefawglansqqtflwiirpdivsgdasilppefveetknrgmlaswcsqeevlshpaivgflthsgwnstlesissgvpmicwpffaeqqtncwfsvtkwdvgmeidsdvkrdeveslvrelmvggkgkkmkkkamewkelaeasakehsgssyvnieklvndillsskh
seqidno.27
dna
糖基转移酶(ntgt5a)
烟草
atgggttccattggtgctgaattaacaaagccacatgcagtttgcataccatatcccgcccaaggccatattaaccccatgttaaagctagccaaaatccttcatcacaaaggctttcacatcacttttgtcaatactgaatttaaccaccgacgtctccttaaatctcgtggccctgattctctcaagggtctttcttctttccgttttgagaccattcctgatggacttccgccatgtgaggcagatgccacacaagatataccttctttgtgtgaatctacaaccaatacttgcttggctccttttagggatcttcttgcgaaactcaatgatactaacacatctaacgtgccacccgtttcgtgcatcgtctcggatggtgtcatgagcttcaccttagccgctgcacaagaattgggagtccctgaagttctgttttggaccactagtgcttgtggtttcttaggttacatgcattactgcaaggttattgaaaaaggatatgctccacttaaagatgcgagtgacttgacaaatggatacctagagacaacattggattttataccaggcatgaaagacgtacgtttaagggatcttccaagtttcttgagaactacaaatccagatgaattcatgatcaaatttgtcctccaagaaacagagagagcaagaaaggcttctgcaattatcctcaacacatttgaaacactagaggctgaagttcttgaatcgctccgaaatcttcttcctccagtctaccccatagggcccttgcattttctagtgaaacatgttgatgatgagaatttgaagggacttagatccagcctttggaaagaggaaccagagtgtatacaatggcttgataccaaagaaccaaattctgttgtttatgttaactttggaagcattactgttatgactcctaatcagcttattgagtttgcttggggacttgcaaacagccagcaaacattcttatggatcataagacctgatattgtttcaggtgatgcatcgattcttccacccgaattcgtggaagaaacgaagaacagaggtatgcttgctagttggtgttcacaagaagaagtacttagtcaccctgcaatagtaggattcttgactcacagtggatggaattcgacactcgaaagtataagcagtggggtgcctatgatttgctggccatttttcgctgaacagcaaacaaattgttggttttccgtcactaaatgggatgttggaatggagattgacagtgatgtgaagagagatgaagtggaaagccttgtaagggaattgatggttgggggaaaaggcaaaaagatgaagaaaaaggcaatggaatggaaggaattggctgaagcatctgctaaagaacattcagggtcatcttatgtgaacattgaaaagttggtcaatgatattcttctttcatccaaacattaa
seqidno.28
氨基酸
糖基转移酶(ntgt5b)
烟草
mgsigaeftkphavcipypaqghinpmlklakilhhkgfhitfvntefnhrrllksrgpdslkglssfrfetipdglppcdadatqdipslcesttntclgpfrdllaklndtntsnvppvsciisdgvmsftlaaaqelgvpevlfwttsacgflgymhyykviekgyaplkdasdltngylettldfipcmkdvrlrdlpsflrttnpdefmikfvlqeterarkasaiilntyetleaevleslrnllppvypigplhflvkhvddenlkglrsslwkeepeciqwldtkepnsvvyvnfgsitvmtpnqliefawglansqqsflwiirpdivsgdasilppefveetkkrgmlaswcsqeevlshpaiggflthsgwnstlesissgvpmicwpffaeqqtncwfsvtkwdvgmeidcdvkrdeveslvrelmvggkgkkmkkkamewkelaeasakehsgssyvniekvvndillsskh
seqidno.29
dna
糖基转移酶(ntgt5b)
烟草
atgggttccattggtgctgaatttacaaagccacatgcagtttgcataccatatcccgcccaaggccatattaaccccatgttaaagctagccaaaatccttcatcacaaaggctttcacatcacttttgtcaatactgaatttaaccacagacgtctgcttaaatctcgtggccctgattctctcaagggtctttcttctttccgttttgagacaattcctgatggacttccgccatgtgatgcagatgccacacaagatataccttctttgtgtgaatctacaaccaatacttgcttgggtccttttagggatcttcttgcgaaactcaatgatactaacacatctaacgtgccacccgtttcgtgcatcatctcagatggtgtcatgagcttcaccttagccgctgcacaagaattgggagtccctgaagttctgttttggaccactagtgcttgtggtttcttaggttacatgcattattacaaggttattgaaaaaggatacgctccacttaaagatgcgagtgacttgacaaatggatacctagagacaacattggattttataccatgcatgaaagacgtacgtttaagggatcttccaagtttcttgagaactacaaatccagatgaattcatgatcaaatttgtcctccaagaaacagagagagcaagaaaggcttctgcaattatcctcaacacatatgaaacactagaggctgaagttcttgaatcgctccgaaatcttcttcctccagtctaccccattgggcccttgcattttctagtgaaacatgttgatgatgagaatttgaagggacttagatccagcctttggaaagaggaaccagagtgtatacaatggcttgataccaaagaaccaaattctgttgtttatgttaactttggaagcattactgttatgactcctaatcaacttattgaatttgcttggggacttgcaaacagccaacaatcattcttatggatcataagacctgatattgtttcaggtgatgcatcgattcttccccccgaattcgtggaagaaacgaagaagagaggtatgcttgctagttggtgttcacaagaagaagtacttagtcaccctgcaataggaggattcttgactcacagtggatggaattcgacactcgaaagtataagcagtggggtgcctatgatttgctggccatttttcgctgaacagcaaacaaattgttggttttccgtcactaaatgggatgttggaatggagattgactgtgatgtgaagagggatgaagtggaaagccttgtaagggaattgatggttgggggaaaaggcaaaaagatgaagaaaaaggcaatggaatggaaggaattggctgaagcatctgctaaagaacattcagggtcatcttatgtgaacattgagaaggtggtcaatgatattcttctttcgtccaaacattaa
seqidno.30
氨基酸
udp-糖基转移酶73c3(ntgt4)
烟草
matqvhklhfilfplmapghmipmidiakllanrgvittiittpvnanrfsstitraiksglriqiltlkfpsvevglpegcenidmlpsldlaskffaaismlkqqvenlleginpspscvisdmgfpwttqiaqnfniprivfhgtccfsllcsykilssnilenitsdseyfvvpdlpdrveltkaqvsgstknttsvsssvlkevteqirlaeessygvivnsfeeleqvyekeyrkargkkvwcvgpvslcnkeiedlvtrgnktaidnqdclkwldnfetesvvyaslgslsrltllqmvelglgleesnrpfvwvlgggdklndlekwilengfeqrikergvlirgwapqvlilshpaiggvlthcgwnstlegisaglpmvtwplfaeqfcneklvvqvlkigvslgvkvpvkwgdeenvgvlvkkddvkkaldklmdegeegqvrrtkakelgelakkafgeggssyvnltsliediieqqnhkek
seqidno.31
dna
udp-糖基转移酶73c3(ntgt4)
烟草
atggcaactcaagtgcacaaacttcatttcatactattccctttaatggctccaggccacatgattcctatgatagacatagctaaacttctagcaaatcgcggtgtcattaccactatcatcaccactccagtaaacgccaatcgtttcagttcaacaattactcgtgccataaaatccggtctaagaatccaaattcttacactcaaatttccaagtgtagaagtaggattaccagaaggttgcgaaaatattgacatgcttccttctcttgacttggcttcaaagttttttgctgcaattagtatgctgaaacaacaagttgaaaatctcttagaaggaataaatccaagtccaagttgtgttatttcagatatgggatttccttggactactcaaattgcacaaaattttaatatcccaagaattgtttttcatggtacttgttgtttctcacttttatgttcctataaaatactttcctccaacattcttgaaaatataacctcagattcagagtattttgttgttcctgatttacccgatagagttgaactaacgaaagctcaggtttcaggatcgacgaaaaatactacttctgttagttcttctgtattgaaagaagttactgagcaaatcagattagccgaggaatcatcatatggtgtaattgttaatagttttgaggagttggagcaagtgtatgagaaagaatataggaaagctagagggaaaaaagtttggtgtgttggtcctgtttctttgtgtaataaggaaattgaagatttggttacaaggggtaataaaactgcaattgataatcaagattgcttgaaatggttagataattttgaaacagaatctgtggtttatgcaagtcttggaagtttatctcgtttgacattattgcaaatggtggaacttggtcttggtttagaagagtcaaataggccttttgtatgggtattaggaggaggtgataaattaaatgatttagagaaatggattcttgagaatggatttgagcaaagaattaaagaaagaggagttttgattagaggatgggctcctcaagtgcttatactttcacaccctgcaattggtggagtattgactcattgcggatggaattctacattggaaggtatttcagcaggattaccaatggtaacatggccactatttgctgagcaattttgcaatgagaagttagtagtccaagtgctaaaaattggagtgagcctaggtgtgaaggtgcctgtcaaatggggagatgaggaaaatgttggagttttggtaaaaaaggatgatgttaagaaagcattagacaaactaatggatgaaggagaagaaggacaagtaagaagaacaaaagcaaaagagttaggagaattggctaaaaaggcatttggagaaggtggttcttcttatgttaacttaacatctctgattgaagacatcattgagcaacaaaatcacaaggaaaaatag
seqidno.32
氨基酸
糖基转移酶(ntgt1b)
烟草
mktaelvfipapgmghlvptvevakqlvdrheqlsitvlimtipletnipsytkslssdyssritllplsqpetsvtmssfnainffeyissykgrvkdavsetsfsssnsvklagfvidmfctamidvanefgipsyvfytssaamlglqlhfqslsiecspkvhnyvepesevlistymnpvpvkclpgiilvndesstmfvnharrfretkgimvntfteleshalkalsddekippiypvgpilnlengnedhnqeydaimkwldekpnssvvflcfgskgsfeedqvkeianalessgyhflwslrrpppkdklqfpsefenpeevlpegffqrtkgrgkvigwapqlailshpsvggfvshcgwnstlesvrsgvpiatwplyaeqqsnafqlvkdlgmaveikmdyredfntrnpplvkaeeiedgirklmdsenkirakvtemkdksraalleggssyvalghfvetvmkn
seqidno.33
dna
糖基转移酶(ntgt1b)
烟草
atgaagacagcagagttagtattcattcctgctcctgggatgggtcaccttgtaccaactgtggaggtggcaaagcaactagtcgacagacacgagcagctttcgatcacagttctaatcatgacaattcctttggaaacaaatattccatcatatactaaatcactgtcctcagactacagttctcgtataacgctgcttccactctctcaacctgagacctctgttactatgagcagttttaatgccatcaatttttttgagtacatctccagctacaagggtcgtgtcaaagatgctgttagtgaaacctcctttagttcgtcaaattctgtgaaacttgcaggatttgtaatagacatgttctgcactgcgatgattgatgtagcgaacgagtttggaatcccaagttatgtgttctacacttctagtgcagctatgcttggactacaactgcattttcaaagtcttagcattgaatgcagtccgaaagttcataactacgttgaacctgaatcagaagttctgatctcaacttacatgaatccggttccagtcaaatgtttgcccggaattatactagtaaatgatgaaagtagcaccatgtttgtcaatcatgcacgaagattcagggagacgaaaggaattatggtgaacacgttcactgagcttgaatcacacgctttgaaagccctttccgatgatgaaaaaatcccaccaatctacccagttggacctatacttaaccttgaaaatgggaatgaagatcacaatcaagaatatgatgcgattatgaagtggcttgacgagaagcctaattcatcagtggtgttcttatgctttggaagcaaggggtctttcgaagaagatcaggtgaaggaaatagcaaatgctctagagagcagtggctaccacttcttgtggtcgctaaggcgaccgccaccaaaagacaagctacaattcccaagcgaattcgagaatccagaggaagtcttaccagagggattctttcaaaggactaaaggaagaggaaaggtgataggatgggcaccccagttggctattttgtctcatccttcagtaggaggattcgtgtcgcattgtgggtggaattcaactctggagagcgttcgaagtggagtgccgatagcaacatggccattgtatgcagagcaacagagcaatgcatttcaactggtgaaggatttgggtatggcagtagagattaagatggattacagggaagattttaatacgagaaatccaccactggttaaagctgaggagatagaagatggaattaggaagctgatggattcagagaataaaatcagggctaaggtgacggagatgaaggacaaaagtagagcagcactgctggagggcggatcatcatatgtagctcttgggcattttgttgagactgtcatgaaaaactag
seqidno.34
氨基酸
糖基转移酶(ntgt1a)
烟草
mkttelvfipapgmghlvptvevakqlvdrdeqlsitvlimtlpletnipsytkslssdyssritllqlsqpetsvsmssfnainffeyissykdrvkdavnetfsssssvklkgfvidmfctamidvanefgipsyvfytsnaamlglqlhfqslsieyspkvhnyldpesevaistyinpipvkclpgiildndksgtmfvnharrfretkgimvntfaeleshalkalsddekippiypvgpilnlgdgnedhnqeydmimkwldeqphssvvflcfgskgsfeedqvkeianalersgnrflwslrrpppkdtlqfpsefenpeevlpvgffqrtkgrgkvigwapqlailshpavggfvshcgwnstlesvrsgvpiatwplyaeqqsnafqlvkdlgmaveikmdyredfnktnpplvkaeeiedgirklmdsenkirakvmemkdksraalleggssyvalghfvetvmkn
seqidno.35
dna
糖基转移酶(ntgt1a)
烟草
atgaagacaacagagttagtattcattcctgctcctggcatgggtcaccttgtacccactgtggaggtggcaaagcaactagtcgacagagacgaacagctttcaatcacagttctcatcatgacgcttcctttggaaacaaatattccatcatatactaaatcactgtcctcagactacagttctcgtataacgctgcttcaactttctcaacctgagacctctgttagtatgagcagttttaatgccatcaatttttttgagtacatctccagctacaaggatcgtgtcaaagatgctgttaatgaaacctttagttcgtcaagttctgtgaaactcaaaggatttgtaatagacatgttctgcactgcgatgattgatgtggcgaacgagtttggaatcccaagttatgtcttctacacttctaatgcagctatgcttggactccaactccattttcaaagtcttagtattgaatacagtccgaaagttcataattacctagaccctgaatcagaagtagcgatctcaacttacattaatccgattccagtcaaatgtttgcccgggattatactagacaatgataaaagtggcaccatgttcgtcaatcatgcacgaagattcagggagacgaaaggaattatggtgaacacattcgctgagcttgaatcacacgctttgaaagccctttccgatgatgagaaaatcccaccaatctacccagttgggcctatacttaaccttggagatgggaatgaagatcacaatcaagaatatgatatgattatgaagtggctcgacgagcagcctcattcatcagtggtgttcctatgctttggaagcaagggatctttcgaagaagatcaagtgaaggaaatagcaaatgctctagagagaagtggtaaccggttcttgtggtcgctaagacgaccgccaccaaaagacacgctacaattcccaagcgaattcgagaatccagaggaagtcttgccggtgggattctttcaaaggactaaaggaagaggaaaggtgataggatgggcaccccagttggctattttgtctcatcctgcagtaggaggattcgtgtcgcattgtgggtggaattcaactttggagagtgttcgtagtggagtaccgatagcaacatggccattgtatgcagagcaacagagcaatgcatttcaactggtgaaggatttggggatggcagtggagattaagatggattacagggaagattttaataagacaaatccaccactggttaaagctgaggagatagaagatggaattaggaagctgatggattcagagaataaaatcagggctaaggtgatggagatgaaggacaaaagtagagcagcgttattagaaggcggatcatcatatgtagctctcgggcattttgttgagactgtcatgaaaaactaa
seqidno.36
氨基酸
糖基转移酶(ntgt3)
烟草
mketkkielvfipspgighlvstvemaklliareeqlsitvliiqwpndkkldsyiqsvanfssrlkfirlpqddsimqllksnifttfiashkpavrdavadilksesnntlagividlfctsmidvanefelptyvfytsgaatlglhyhiqnlrdefnkditkykdepeeklsiatylnpfpakclpsvaldkeggstmfldlakrfretkgimintflelesyalnslsrdknlppiypvgpvlnlnnvegdnlgssdqntmkwlddqpassvvflcfgsggsfekhqvkeiayalessgcrflwslrrpptedarfpsnyenleeilpegflertkgigkvigwapqlailshkstggfvshcgwnstlestyfgvpiatwpmyaeqqanafqlvkdlrmgveikmdyrkdmkvmgkevivkaeeiekaireimdseseirvkvkemkeksraaqmeggssytsiggfiqiimensq
seqidno.37
dna
糖基转移酶(ntgt3)
烟草
atgaaagaaaccaagaaaatagagttagtcttcattccttcaccaggaattggccatttagtatccacagttgaaatggcaaagcttcttatagctagagaagagcagctatctatcacagtcctcatcatccaatggcctaacgacaagaagctcgattcttatatccaatcagtcgccaatttcagctcgcgtttgaaattcattcgactccctcaggatgattccattatgcagctactcaaaagcaacattttcaccacgtttattgccagtcataagcctgcagttagagatgctgttgctgatattctcaagtcagaatcaaataatacgctagcaggtattgttatcgacttgttctgcacctcaatgatagacgtggccaatgagttcgagctaccaacctatgttttctacacgtctggtgcagcaacccttggtcttcattatcatatacagaatctcagggatgaatttaacaaagatattaccaagtacaaagacgaacctgaagaaaaactctctatagcaacatatctcaatccatttccagcaaaatgtttgccgtctgtagccttagacaaagaaggtggttcaacaatgtttcttgatctcgcaaaaaggtttcgagaaaccaaaggtattatgataaacacatttctagagctcgaatcctatgcattaaactcgctctcacgagacaagaatcttccacctatataccctgtcggaccagtattgaaccttaacaatgttgaaggtgacaacttaggttcatctgaccagaatactatgaaatggttagatgatcagcccgcttcatctgtagtgttcctttgttttggtagtggtggaagctttgaaaaacatcaagttaaggaaatagcctatgctctggagagcagtgggtgtcggtttttgtggtcgttaaggcgaccaccaaccgaagatgcaagatttccaagcaactatgaaaatcttgaagaaattttgccagaaggattcttggaaagaacaaaagggattggaaaagtgataggatgggcacctcagttggcgattttgtcacataaatcgacggggggatttgtgtcgcactgtggatggaattcgactttggaaagtacatattttggagtgccaatagcaacctggccaatgtacgcggagcaacaagcgaatgcatttcaattggttaaggatttgagaatgggagttgagattaagatggattataggaaggatatgaaagtgatgggcaaagaagttatagtgaaagctgaggagattgagaaagcaataagagaaattatggattccgagagtgaaattcgggtgaaggtgaaagagatgaaggagaagagcagagcagcacaaatggaaggtggctcttcttacacttctattggaggtttcatccaaattatcatggagaattctcaataa
seqidno.38
氨基酸
糖基转移酶(ntgt2)
烟草
mvqphvllvtfpaqghinpclqfakrlirmgievtfatsvfahrrmaktttstlskglnfaafsdgyddgfkadehdsqhymseiksrgsktlkdiilkssdegrpvtslvyslllpwaakvarefhipcallwiqpatvldiyyyyfngyedaikgstndpnwciqlprlpllksqdlpsfllsssneekysfalptfkeqldtldveenpkvlvntfdalepkelkaiekynligigplipstfldgkdpldssfggdlfqksndyiewlnskanssvvyisfgsllnlsknqkeeiakglieikkpflwvirdqengkgdekeeklscmmelekqgkivpwcsqlevlthpsigcfvshcgwnstleslssgvsvvafphwtdqgtnakliedvwktgvrlkknedgvveseeikrciemvmdggekgeemrrnaqkwkelareavkeggssemnlkafvqevgkgc
seqidno.39
dna
糖基转移酶(ntgt2)
烟草
atggtgcaaccccatgtcctcttggtgacttttccagcacaaggccatattaatccatgtctccaatttgccaagaggctaattagaatgggcattgaggtaacttttgccacgagcgttttcgcccatcgtcgtatggcaaaaactacgacttccactctatccaagggcttaaattttgcggcattctctgatgggtacgacgatggtttcaaggccgatgagcatgattctcaacattacatgtcggagataaaaagtcgcggttctaaaaccctaaaagatatcattttgaagagctcagacgagggacgtcctgtgacatccctcgtctattctcttttgcttccatgggctgcaaaggtagcgcgtgaatttcacataccgtgcgcgttactatggattcaaccagcaactgtgctagacatatattattattacttcaatggctatgaggatgccataaaaggtagcaccaatgatccaaattggtgtattcaattgcctaggcttccactactaaaaagccaagatcttccttcttttttactttcttctagtaatgaagaaaaatatagctttgctctaccaacatttaaagagcaacttgacacattagatgttgaagaaaatcctaaagtacttgtgaacacatttgatgcattagagccaaaggaactcaaagctattgaaaagtacaatttaattgggattggaccattgattccttcaacatttttggacggaaaagaccctttggattcttcctttggtggtgatctttttcaaaagtctaatgactatattgaatggttgaactcaaaggctaactcatctgtggtttatatctcatttgggagtctcttgaatttgtcaaaaaatcaaaaggaggagattgcaaaagggttgatagagattaaaaagccattcttgtgggtaataagagatcaagaaaatggtaagggagatgaaaaagaagagaaattaagttgtatgatggagttggaaaagcaagggaaaatagtaccatggtgttcacaacttgaagtcttaacacatccatctataggatgtttcgtgtcacattgtggatggaattcgactctggaaagtttatcgtcaggcgtgtcagtagtggcatttcctcattggacggatcaagggacaaatgctaaactaattgaagatgtttggaagacaggtgtaaggttgaaaaagaatgaagatggtgtggttgagagtgaagagataaaaaggtgcatagaaatggtaatggatggtggagagaaaggagaagaaatgagaagaaatgctcaaaaatggaaagaattggcaagggaagctgtaaaagaaggcggatcttcggaaatgaatctaaaagcttttgttcaagaagttggcaaaggttgctga
seqidno.40
氨基酸
thca合酶毛状体靶向结构域
大麻
mncsafsfwfvckiiffflsfhiqisia
seqidno.41
氨基酸
cbda合酶毛状体靶向结构域
大麻
mkcstfsfwfvckiiffffsfniqtsia
seqidno.42
氨基酸
thca合酶
大麻
mncsafsfwfvckiiffflsfhiqisianprenflkcfskhipnnvanpklvytqhdqlymsilnstiqnlrfisdttpkplvivtpsnnshiqatilcskkvglqirtrsgghdaegmsyisqvpfvvvdlrnmhsikidvhsqtawveagatlgevyywineknenlsfpggycptvgvgghfsgggygalmrnyglaadniidahlvnvdgkvldrksmgedlfwairggggenfgiiaawkiklvdvpskstifsvkknmeihglyklfnkwqniaykydkdlvlmthfitknitdnhgknkttvhgyfssifhggvdslvdlmnksfpelgikktdckefswidttifysgvvnfntanfkkeilldrsagkktafsikldyvkkpipetamvkileklyeedvgagmyvlypyggimeeisesaipfphragimyelwytaswekqednekhinwvrsvynfttpyvsqnprlaylnyrdldlgktnhaspnnytqariwgekyfgknfnrlvkvktkvdpnnffrneqsipplpphhh
seqidno.43
氨基酸
can738啤酒花的myb8同源物
mgrapccekvglkkgrwtseedeiltkyiqsngegcwrslpknagllrcgkscrlrwinylradlkrgnisseeediiiklhstlgnrwsliashlpgrtdneiknywnshlsrkihtfrrcnnttthhhhlpnlvtvtkvnlpipkrkggrtsrlamkknksstsnqnssvikndvgssssttttsvhqrtttttptmddqqkrqlsrcrleekedqdgastgtvvmmlgqaaavgsscdedmlghdqlsflccseekttensmtnlkengdhevsgpydydhryeketsvdegmllcfndiidsnllnpnevltlseeslnlggalmdtttstttnnnnyslsynnngdcvisddhdqywlddvvgvdfwswessttvtqeqeqeqeqeqeqeqeqeqeqehhhqqdqkkntwdnekekmlallwdsdnsnwelqdnnnyhkcqeitsdkenamvawlls
seqidno.44
氨基酸
can739拟南芥的myb12同源物
mgrapccekvgikrgrwtaeedqilsnyiqsngegswrslpknaglkrcgkscrlrwinylrsdlkrgnitpeeeelvvklhstlgnrwsliaghlpgrtdneiknywnshlsrklhnfirkpsisqdvsavimtnassappppqakrrlgrtsrsamkpkihrtktrktkktsappepnadvagadkealmvessgaeaelgrpcdyygddcnknlmsingdngvltfdddiidllldesdpghlytnttcggdgelhnirdsegargfsdtwnqgnldcllqscpsvesflnydhqvndastdefidwdcvwqegsdnnlwhekenpdsmvswlldgddeatignsncenfgepldhddesalvawlls
seqidno.45
氨基酸
can833拟南芥的myb112同源物
mnisrtefancktlinhkeeveevekkmeieirrgpwtveedmklvsyislhgegrwnslsrsaglnrtgkscrlrwlnylrpdirrgdislqeqfiilelhsrwgnrwskiaqhlpgrtdneiknywrtrvqkhakllkcdvnskqfkdtikhlwmprlieriaatqsvqftsnhyspenssvatatsstssseavrssfyggdqvefgtldhmtnggywfnggdtfetlcsfdelnkwliq
seqidno.46
氨基酸
细胞溶质靶向thca合酶(ctthcas)
大麻
nprenflkcfskhipnnvanpklvytqhdqlymsilnstiqnlrfisdttpkplvivtpsnnshiqatilcskkvglqirtrsgghdaegmsyisqvpfvvvdlrnmhsikidvhsqtawveagatlgevyywineknenlsfpggycptvgvgghfsgggygalmrnyglaadniidahlvnvdgkvldrksmgedlfwairggggenfgiiaawkiklvdvpskstifsvkknmeihglyklfnkwqniaykydkdlvlmthfitknitdnhgknkttvhgyfssifhggvdslvdlmnksfpelgikktdckefswidttifysgvvnfntanfkkeilldrsagkktafsikldyvkkpipetamvkileklyeedvgagmyvlypyggimeeisesaipfphragimyelwytaswekqednekhinwvrsvynfttpyvsqnprlaylnyrdldlgktnhaspnnytqariwgekyfgknfnrlvkvktkvdpnnffrneqsipplpphhh
seqidno.47
氨基酸
具有thca合酶毛状体靶向结构域的毛状体靶向过氧化氢酶
拟南芥
mncsafsfwfvckiiffflsfhiqisiamdpykyrpassynspffttnsgapvwnnnssmtvgprglilledyhlveklanfdreripervvhargasakgffevthdisnltcadflrapgvqtpvivrfstvihargspetlrdprgfavkfytregnfdlvgnnfpvffirdgmkfpdivhalkpnpkshiqenwrildffshhpeslnmftflfddigipqdyrhmdgsgvntymlinkagkahyvkfhwkptcgvkslleedairlggtnhshatqdlydsiaagnypewklfiqiidpadedkfdfdpldvtktwpedilplqpvgrmvlnknidnffaeneqlafcpaiivpgihysddkllqtrvfsyadtqrhrlgpnylqlpvnapkcahhnnhhegfmnfmhrdeevnyfpsrydqvrhaekyptppavcsgkrerciiekennfkepgeryrtftperqerfiqrwidalsdpritheirsiwisywsqadkslgqklasrlnvrpsi
seqidno.48
氨基酸
具有cbda合酶毛状体靶向结构域的毛状体靶向过氧化氢酶
拟南芥
mkcstfsfwfvckiiffffsfniqtsiamdpykyrpassynspffttnsgapvwnnnssmtvgprglilledyhlveklanfdreripervvhargasakgffevthdisnltcadflrapgvqtpvivrfstvihargspetlrdprgfavkfytregnfdlvgnnfpvffirdgmkfpdivhalkpnpkshiqenwrildffshhpeslnmftflfddigipqdyrhmdgsgvntymlinkagkahyvkfhwkptcgvkslleedairlggtnhshatqdlydsiaagnypewklfiqiidpadedkfdfdpldvtktwpedilplqpvgrmvlnknidnffaeneqlafcpaiivpgihysddkllqtrvfsyadtqrhrlgpnylqlpvnapkcahhnnhhegfmnfmhrdeevnyfpsrydqvrhaekyptppavcsgkrerciiekennfkepgeryrtftperqerfiqrwidalsdpritheirsiwisywsqadkslgqklasrlnvrpsi
seqidno.49
氨基酸
具有thca合酶毛状体靶向结构域的过氧化氢酶hpii(kate)
大肠杆菌
mncsafsfwfvckiiffflsfhiqisiamsqhneknphqhqsplhdsseakpgmdslapedgshrpaaeptppgaqptapgslkapdtrneklnsledvrkgsenyalttnqgvriaddqnslragsrgptlledfilrekithfdheriperivhargsaahgyfqpykslsditkadflsdpnkitpvfvrfstvqggagsadtvrdirgfatkfyteegifdlvgnntpiffiqdahkfpdfvhavkpephwaipqgqsahdtfwdyvslqpetlhnvmwamsdrgiprsyrtmegfgihtfrlinaegkatfvrfhwkplagkaslvwdeaqkltgrdpdfhrrelweaieagdfpeyelgfqlipeedefkfdfdlldptklipeelvpvqrvgkmvlnrnpdnffaeneqaafhpghivpgldftndpllqgrlfsytdtqisrlggpnfheipinrptcpyhnfqrdgmhrmgidtnpanyepnsindnwpretppgpkrggfesyqervegnkvrerspsfgeyyshprlfwlsqtpfeqrhivdgfsfelskvvrpyirervvdqlahidltlaqavaknlgieltddqlnitpppdvnglkkdpslslyaipdgdvkgrvvaillndevrsadllailkalkakgvhakllysrmgevtaddgtvlpiaatfagapsltvdavivpcgniadiadngdanyylmeaykhlkpialagdarkfkatikiadqgeegiveadsadgsfmdelltlmaahrvwsripkidkipa
seqidno.50
氨基酸
具有cbda合酶毛状体靶向结构域的过氧化氢酶hpii(kate)
大肠杆菌
mkcstfsfwfvckiiffffsfniqtsiamsqhneknphqhqsplhdsseakpgmdslapedgshrpaaeptppgaqptapgslkapdtrneklnsledvrkgsenyalttnqgvriaddqnslragsrgptlledfilrekithfdheriperivhargsaahgyfqpykslsditkadflsdpnkitpvfvrfstvqggagsadtvrdirgfatkfyteegifdlvgnntpiffiqdahkfpdfvhavkpephwaipqgqsahdtfwdyvslqpetlhnvmwamsdrgiprsyrtmegfgihtfrlinaegkatfvrfhwkplagkaslvwdeaqkltgrdpdfhrrelweaieagdfpeyelgfqlipeedefkfdfdlldptklipeelvpvqrvgkmvlnrnpdnffaeneqaafhpghivpgldftndpllqgrlfsytdtqisrlggpnfheipinrptcpyhnfqrdgmhrmgidtnpanyepnsindnwpretppgpkrggfesyqervegnkvrerspsfgeyyshprlfwlsqtpfeqrhivdgfsfelskvvrpyirervvdqlahidltlaqavaknlgieltddqlnitpppdvnglkkdpslslyaipdgdvkgrvvaillndevrsadllailkalkakgvhakllysrmgevtaddgtvlpiaatfagapsltvdavivpcgniadiadngdanyylmeaykhlkpialagdarkfkatikiadqgeegiveadsadgsfmdelltlmaahrvwsripkidkipa
序列表
<110>特征生物科学公司
<120>水溶性大麻素在植物系统中高水平体内生物合成和分离
<130>90425.00060
<150>us62/476,080
<151>2017-03-24
<150>us62/621,166
<151>2018-01-21
<150>us62/588,662
<151>2017-11-20
<160>50
<170>patentinversion3.5
<210>1
<211>1509
<212>dna
<213>c细胞色素p450(cyp3a4)人(cytochromep450(cyp3a4)human)
<400>1
atggctttgattcctgatttggctatggaaactagattgttgttggctgtttcattggtt60
ttgttgtatttgtatggaactcattcacatggattgtttaaaaaattgggaattcctgga120
cctactcctttgccttttttgggaaatattttgtcatatcataaaggattttgcatgttt180
gatatggaatgccataaaaaatatggaaaagtttggggattttatgatggacaacaacct240
gttttggctattactgatcctgatatgattaaaactgttttggttaaagaatgctattca300
gtttttactaatagaagaccttttggacctgttggatttatgaaatcagctatttcaatt360
gctgaagatgaagaatggaaaagattgagatcattgttgtcacctacttttacttcagga420
aaattgaaagaaatggttcctattattgctcaatatggagatgttttggttagaaatttg480
agaagagaagctgaaactggaaaacctgttactttgaaagatgtttttggagcttattca540
atggatgttattacttcaacttcatttggagttaatattgattcattgaataatcctcaa600
gatccttttgttgaaaatactaaaaaattgttgagatttgattttttggatccttttttt660
ttgtcaattactgtttttccttttttgattcctattttggaagttttgaatatttgcgtt720
tttcctagagaagttactaattttttgagaaaatcagttaaaagaatgaaagaatcaaga780
ttggaagatactcaaaaacatagagttgattttttgcaattgatgattgattcacaaaat840
tcaaaagaaactgaatcacataaagctttgtcagatttggaattggttgctcaatcaatt900
atttttatttttgctggatgcgaaactacttcatcagttttgtcatttattatgtatgaa960
ttggctactcatcctgatgttcaacaaaaattgcaagaagaaattgatgctgttttgcct1020
aataaagctcctcctacttatgatactgttttgcaaatggaatatttggatatggttgtt1080
aatgaaactttgagattgtttcctattgctatgagattggaaagagtttgcaaaaaagat1140
gttgaaattaatggaatgtttattcctaaaggagttgttgttatgattccttcatatgct1200
ttgcatagagatcctaaatattggactgaacctgaaaaatttttgcctgaaagattttca1260
aaaaaaaataaagataatattgatccttatatttatactccttttggatcaggacctaga1320
aattgcattggaatgagatttgctttgatgaatatgaaattggctttgattagagttttg1380
caaaatttttcatttaaaccttgcaaagaaactcaaattcctttgaaattgtcattggga1440
ggattgttgcaacctgaaaaacctgttgttttgaaagttgaatcaagagatggaactgtt1500
tcaggagct1509
<210>2
<211>503
<212>prt
<213>c细胞色素p450(cyp3a4)人(cytochromep450(cyp3a4)human)
<400>2
metalaleuileproaspleualametgluthrargleuleuleuala
151015
valserleuvalleuleutyrleutyrglythrhisserhisglyleu
202530
phelyslysleuglyileproglyprothrproleupropheleugly
354045
asnileleusertyrhislysglyphecysmetpheaspmetglucys
505560
hislyslystyrglylysvaltrpglyphetyraspglyglnglnpro
65707580
valleualailethraspproaspmetilelysthrvalleuvallys
859095
glucystyrservalphethrasnargargpropheglyprovalgly
100105110
phemetlysseralaileserilealagluaspgluglutrplysarg
115120125
leuargserleuleuserprothrphethrserglylysleulysglu
130135140
metvalproileilealaglntyrglyaspvalleuvalargasnleu
145150155160
argargglualagluthrglylysprovalthrleulysaspvalphe
165170175
glyalatyrsermetaspvalilethrserthrserpheglyvalasn
180185190
ileaspserleuasnasnproglnaspprophevalgluasnthrlys
195200205
lysleuleuargpheasppheleuaspprophepheleuserilethr
210215220
valphepropheleuileproileleugluvalleuasnilecysval
225230235240
pheproarggluvalthrasnpheleuarglysservallysargmet
245250255
lysgluserargleugluaspthrglnlyshisargvalasppheleu
260265270
glnleumetileaspserglnasnserlysgluthrgluserhislys
275280285
alaleuseraspleugluleuvalalaglnserileilepheilephe
290295300
alaglycysgluthrthrserservalleuserpheilemettyrglu
305310315320
leualathrhisproaspvalglnglnlysleuglnglugluileasp
325330335
alavalleuproasnlysalaproprothrtyraspthrvalleugln
340345350
metglutyrleuaspmetvalvalasngluthrleuargleuphepro
355360365
ilealametargleugluargvalcyslyslysaspvalgluileasn
370375380
glymetpheileprolysglyvalvalvalmetileprosertyrala
385390395400
leuhisargaspprolystyrtrpthrgluproglulyspheleupro
405410415
gluargpheserlyslysasnlysaspasnileaspprotyriletyr
420425430
thrpropheglyserglyproargasncysileglymetargpheala
435440445
leumetasnmetlysleualaleuileargvalleuglnasnpheser
450455460
phelysprocyslysgluthrglnileproleulysleuserleugly
465470475480
glyleuleuglnproglulysprovalvalleulysvalgluserarg
485490495
aspglythrvalserglyala
500
<210>3
<211>2040
<212>dna
<213>p450氧化还原酶基因(oxred)人(p450oxidoreductasegene(oxred)human)
<400>3
atgattaatatgggagattcacatgttgatacttcatcaactgtttcagaagctgttgct60
gaagaagtttcattgttttcaatgactgatatgattttgttttcattgattgttggattg120
ttgacttattggtttttgtttagaaaaaaaaaagaagaagttcctgaatttactaaaatt180
caaactttgacttcatcagttagagaatcatcatttgttgaaaaaatgaaaaaaactgga240
agaaatattattgttttttatggatcacaaactggaactgctgaagaatttgctaataga300
ttgtcaaaagatgctcatagatatggaatgagaggaatgtcagctgatcctgaagaatat360
gatttggctgatttgtcatcattgcctgaaattgataatgctttggttgttttttgcatg420
gctacttatggagaaggagatcctactgataatgctcaagatttttatgattggttgcaa480
gaaactgatgttgatttgtcaggagttaaatttgctgtttttggattgggaaataaaact540
tatgaacattttaatgctatgggaaaatatgttgataaaagattggaacaattgggagct600
caaagaatttttgaattgggattgggagatgatgatggaaatttggaagaagattttatt660
acttggagagaacaattttggttggctgtttgcgaacattttggagttgaagctactgga720
gaagaatcatcaattagacaatatgaattggttgttcatactgatattgatgctgctaaa780
gtttatatgggagaaatgggaagattgaaatcatatgaaaatcaaaaacctccttttgat840
gctaaaaatccttttttggctgctgttactactaatagaaaattgaatcaaggaactgaa900
agacatttgatgcatttggaattggatatttcagattcaaaaattagatatgaatcagga960
gatcatgttgctgtttatcctgctaatgattcagctttggttaatcaattgggaaaaatt1020
ttgggagctgatttggatgttgttatgtcattgaataatttggatgaagaatcaaataaa1080
aaacatccttttccttgccctacttcatatagaactgctttgacttattatttggatatt1140
actaatcctcctagaactaatgttttgtatgaattggctcaatatgcttcagaaccttca1200
gaacaagaattgttgagaaaaatggcttcatcatcaggagaaggaaaagaattgtatttg1260
tcatgggttgttgaagctagaagacatattttggctattttgcaagattgcccttcattg1320
agacctcctattgatcatttgtgcgaattgttgcctagattgcaagctagatattattca1380
attgcttcatcatcaaaagttcatcctaattcagttcatatttgcgctgttgttgttgaa1440
tatgaaactaaagctggaagaattaataaaggagttgctactaattggttgagagctaaa1500
gaacctgttggagaaaatggaggaagagctttggttcctatgtttgttagaaaatcacaa1560
tttagattgccttttaaagctactactcctgttattatggttggacctggaactggagtt1620
gctccttttattggatttattcaagaaagagcttggttgagacaacaaggaaaagaagtt1680
ggagaaactttgttgtattatggatgcagaagatcagatgaagattatttgtatagagaa1740
gaattggctcaatttcatagagatggagctttgactcaattgaatgttgctttttcaaga1800
gaacaatcacataaagtttatgttcaacatttgttgaaacaagatagagaacatttgtgg1860
aaattgattgaaggaggagctcatatttatgtttgcggagatgctagaaatatggctaga1920
gatgttcaaaatactttttatgatattgttgctgaattgggagctatggaacatgctcaa1980
gctgttgattatattaaaaaattgatgactaaaggaagatattcattggatgtttggtca2040
<210>4
<211>680
<212>prt
<213>p450氧化还原酶人(p450oxidoreductasehuman)
<400>4
metileasnmetglyaspserhisvalaspthrserserthrvalser
151015
glualavalalaglugluvalserleuphesermetthraspmetile
202530
leupheserleuilevalglyleuleuthrtyrtrppheleuphearg
354045
lyslyslysglugluvalprogluphethrlysileglnthrleuthr
505560
serservalarggluserserphevalglulysmetlyslysthrgly
65707580
argasnileilevalphetyrglyserglnthrglythralagluglu
859095
phealaasnargleuserlysaspalahisargtyrglymetarggly
100105110
metseralaaspprogluglutyraspleualaaspleuserserleu
115120125
progluileaspasnalaleuvalvalphecysmetalathrtyrgly
130135140
gluglyaspprothraspasnalaglnaspphetyrasptrpleugln
145150155160
gluthraspvalaspleuserglyvallysphealavalpheglyleu
165170175
glyasnlysthrtyrgluhispheasnalametglylystyrvalasp
180185190
lysargleugluglnleuglyalaglnargilephegluleuglyleu
195200205
glyaspaspaspglyasnleuglugluasppheilethrtrpargglu
210215220
glnphetrpleualavalcysgluhispheglyvalglualathrgly
225230235240
glugluserserileargglntyrgluleuvalvalhisthraspile
245250255
aspalaalalysvaltyrmetglyglumetglyargleulyssertyr
260265270
gluasnglnlyspropropheaspalalysasnpropheleualaala
275280285
valthrthrasnarglysleuasnglnglythrgluarghisleumet
290295300
hisleugluleuaspileseraspserlysileargtyrglusergly
305310315320
asphisvalalavaltyrproalaasnaspseralaleuvalasngln
325330335
leuglylysileleuglyalaaspleuaspvalvalmetserleuasn
340345350
asnleuaspglugluserasnlyslyshispropheprocysprothr
355360365
sertyrargthralaleuthrtyrtyrleuaspilethrasnpropro
370375380
argthrasnvalleutyrgluleualaglntyralasergluproser
385390395400
gluglngluleuleuarglysmetalaserserserglygluglylys
405410415
gluleutyrleusertrpvalvalglualaargarghisileleuala
420425430
ileleuglnaspcysproserleuargproproileasphisleucys
435440445
gluleuleuproargleuglnalaargtyrtyrserilealaserser
450455460
serlysvalhisproasnservalhisilecysalavalvalvalglu
465470475480
tyrgluthrlysalaglyargileasnlysglyvalalathrasntrp
485490495
leuargalalysgluprovalglygluasnglyglyargalaleuval
500505510
prometphevalarglysserglnpheargleuprophelysalathr
515520525
thrprovalilemetvalglyproglythrglyvalalapropheile
530535540
glypheileglngluargalatrpleuargglnglnglylysgluval
545550555560
glygluthrleuleutyrtyrglycysargargseraspgluasptyr
565570575
leutyrargglugluleualaglnphehisargaspglyalaleuthr
580585590
glnleuasnvalalapheserarggluglnserhislysvaltyrval
595600605
glnhisleuleulysglnasparggluhisleutrplysleuileglu
610615620
glyglyalahisiletyrvalcysglyaspalaargasnmetalaarg
625630635640
aspvalglnasnthrphetyraspilevalalagluleuglyalamet
645650655
gluhisalaglnalavalasptyrilelyslysleumetthrlysgly
660665670
argtyrserleuaspvaltrpser
675680
<210>5
<211>1554
<212>dna
<213>大麻二醇酸(cbda)合酶cannabissativa(cannabidiolicacid(cbda)synthasecannabissativa)
<400>5
atgaatcctcgagaaaacttccttaaatgcttctcgcaatatattcccaataatgcaaca60
aatctaaaactcgtatacactcaaaacaacccattgtatatgtctgtcctaaattcgaca120
atacacaatcttagattcacctctgacacaaccccaaaaccacttgttatcgtcactcct180
tcacatgtctctcatatccaaggcactattctatgctccaagaaagttggcttgcagatt240
cgaactcgaagtggtggtcatgattctgagggcatgtcctacatatctcaagtcccattt300
gttatagtagacttgagaaacatgcgttcaatcaaaatagatgttcatagccaaactgca360
tgggttgaagccggagctacccttggagaagtttattattgggttaatgagaaaaatgag420
aatcttagtttggcggctgggtattgccctactgtttgcgcaggtggacactttggtgga480
ggaggctatggaccattgatgagaaactatggcctcgcggctgataatatcattgatgca540
cacttagtcaacgttcatggaaaagtgctagatcgaaaatctatgggggaagatctcttt600
tgggctttacgtggtggtggagcagaaagcttcggaatcattgtagcatggaaaattaga660
ctggttgctgtcccaaagtctactatgtttagtgttaaaaagatcatggagatacatgag720
cttgtcaagttagttaacaaatggcaaaatattgcttacaagtatgacaaagatttatta780
ctcatgactcacttcataactaggaacattacagataatcaagggaagaataagacagca840
atacacacttacttctcttcagttttccttggtggagtggatagtctagtcgacttgatg900
aacaagagttttcctgagttgggtattaaaaaaacggattgcagacaattgagctggatt960
gatactatcatcttctatagtggtgttgtaaattacgacactgataattttaacaaggaa1020
attttgcttgatagatccgctgggcagaacggtgctttcaagattaagttagactacgtt1080
aagaaaccaattccagaatctgtatttgtccaaattttggaaaaattatatgaagaagat1140
ataggagctgggatgtatgcgttgtacccttacggtggtataatggatgagatttcagaa1200
tcagcaattccattccctcatcgagctggaatcttgtatgagttatggtacatatgtagt1260
tgggagaagcaagaagataacgaaaagcatctaaactggattagaaatatttataacttc1320
atgactccttatgtgtccaaaaattcaagattggcatatctcaattatagagaccttgat1380
ataggaataaatgatcccaagaatccaaataattacacacaagcacgtatttggggtgag1440
aagtattttggtaaaaattttgacaggctagtaaaagtgaaaaccctggttgatcccaat1500
aacttttttagaaacgaacaaagcatcccacctcaaccacggcatcgtcattaa1554
<210>6
<211>517
<212>prt
<213>大麻二醇酸(cbda)合酶cannabissativa(cannabidiolicacid(cbda)synthasecannabissativa)
<400>6
metasnproarggluasnpheleulyscyspheserglntyrilepro
151015
asnasnalathrasnleulysleuvaltyrthrglnasnasnproleu
202530
tyrmetservalleuasnserthrilehisasnleuargphethrser
354045
aspthrthrprolysproleuvalilevalthrproserhisvalser
505560
hisileglnglythrileleucysserlyslysvalglyleuglnile
65707580
argthrargserglyglyhisaspsergluglymetsertyrileser
859095
glnvalprophevalilevalaspleuargasnmetargserilelys
100105110
ileaspvalhisserglnthralatrpvalglualaglyalathrleu
115120125
glygluvaltyrtyrtrpvalasnglulysasngluasnleuserleu
130135140
alaalaglytyrcysprothrvalcysalaglyglyhispheglygly
145150155160
glyglytyrglyproleumetargasntyrglyleualaalaaspasn
165170175
ileileaspalahisleuvalasnvalhisglylysvalleuasparg
180185190
lyssermetglygluaspleuphetrpalaleuargglyglyglyala
195200205
gluserpheglyileilevalalatrplysileargleuvalalaval
210215220
prolysserthrmetpheservallyslysilemetgluilehisglu
225230235240
leuvallysleuvalasnlystrpglnasnilealatyrlystyrasp
245250255
lysaspleuleuleumetthrhispheilethrargasnilethrasp
260265270
asnglnglylysasnlysthralailehisthrtyrpheserserval
275280285
pheleuglyglyvalaspserleuvalaspleumetasnlysserphe
290295300
progluleuglyilelyslysthraspcysargglnleusertrpile
305310315320
aspthrileilephetyrserglyvalvalasntyraspthraspasn
325330335
pheasnlysgluileleuleuaspargseralaglyglnasnglyala
340345350
phelysilelysleuasptyrvallyslysproileprogluserval
355360365
phevalglnileleuglulysleutyrglugluaspileglyalagly
370375380
mettyralaleutyrprotyrglyglyilemetaspgluileserglu
385390395400
seralailepropheprohisargalaglyileleutyrgluleutrp
405410415
tyrilecyssertrpglulysglngluaspasnglulyshisleuasn
420425430
trpileargasniletyrasnphemetthrprotyrvalserlysasn
435440445
serargleualatyrleuasntyrargaspleuaspileglyileasn
450455460
aspprolysasnproasnasntyrthrglnalaargiletrpglyglu
465470475480
lystyrpheglylysasnpheaspargleuvallysvallysthrleu
485490495
valaspproasnasnphepheargasngluglnserileproprogln
500505510
proarghisarghis
515
<210>7
<211>1374
<212>dna
<213>udp糖基转移酶76g1甜叶菊(udpglycosyltransferase76g1steviarebaudiana)
<400>7
atggaaaataaaactgaaactactgttagaagaagaagaagaattattttgtttcctgtt60
ccttttcaaggacatattaatcctattttgcaattggctaatgttttgtattcaaaagga120
ttttcaattactatttttcatactaattttaataaacctaaaacttcaaattatcctcat180
tttacttttagatttattttggataatgatcctcaagatgaaagaatttcaaatttgcct240
actcatggacctttggctggaatgagaattcctattattaatgaacatggagctgatgaa300
ttgagaagagaattggaattgttgatgttggcttcagaagaagatgaagaagtttcatgc360
ttgattactgatgctttgtggtattttgctcaatcagttgctgattcattgaatttgaga420
agattggttttgatgacttcatcattgtttaattttcatgctcatgtttcattgcctcaa480
tttgatgaattgggatatttggatcctgatgataaaactagattggaagaacaagcttca540
ggatttcctatgttgaaagttaaagatattaaatcagcttattcaaattggcaaattttg600
aaagaaattttgggaaaaatgattaaacaaactagagcttcatcaggagttatttggaat660
tcatttaaagaattggaagaatcagaattggaaactgttattagagaaattcctgctcct720
tcatttttgattcctttgcctaaacatttgactgcttcatcatcatcattgttggatcat780
gatagaactgtttttcaatggttggatcaacaacctccttcatcagttttgtatgtttca840
tttggatcaacttcagaagttgatgaaaaagattttttggaaattgctagaggattggtt900
gattcaaaacaatcatttttgtgggttgttagacctggatttgttaaaggatcaacttgg960
gttgaacctttgcctgatggatttttgggagaaagaggaagaattgttaaatgggttcct1020
caacaagaagttttggctcatggagctattggagctttttggactcattcaggatggaat1080
tcaactttggaatcagtttgcgaaggagttcctatgattttttcagattttggattggat1140
caacctttgaatgctagatatatgtcagatgttttgaaagttggagtttatttggaaaat1200
ggatgggaaagaggagaaattgctaatgctattagaagagttatggttgatgaagaagga1260
gaatatattagacaaaatgctagagttttgaaacaaaaagctgatgtttcattgatgaaa1320
ggaggatcatcatatgaatcattggaatcattggtttcatatatttcatcattg1374
<210>8
<211>458
<212>prt
<213>udp糖基转移酶76g1甜叶菊(udpglycosyltransferase76g1steviarebaudiana)
<400>8
metgluasnlysthrgluthrthrvalargargargargargileile
151015
leupheprovalpropheglnglyhisileasnproileleuglnleu
202530
alaasnvalleutyrserlysglypheserilethrilephehisthr
354045
asnpheasnlysprolysthrserasntyrprohisphethrphearg
505560
pheileleuaspasnaspproglnaspgluargileserasnleupro
65707580
thrhisglyproleualaglymetargileproileileasngluhis
859095
glyalaaspgluleuargarggluleugluleuleumetleualaser
100105110
glugluaspglugluvalsercysleuilethraspalaleutrptyr
115120125
phealaglnservalalaaspserleuasnleuargargleuvalleu
130135140
metthrserserleupheasnphehisalahisvalserleuprogln
145150155160
pheaspgluleuglytyrleuaspproaspasplysthrargleuglu
165170175
gluglnalaserglypheprometleulysvallysaspilelysser
180185190
alatyrserasntrpglnileleulysgluileleuglylysmetile
195200205
lysglnthrargalaserserglyvaliletrpasnserphelysglu
210215220
leugluglusergluleugluthrvalilearggluileproalapro
225230235240
serpheleuileproleuprolyshisleuthralaserserserser
245250255
leuleuasphisaspargthrvalpheglntrpleuaspglnglnpro
260265270
proserservalleutyrvalserpheglyserthrsergluvalasp
275280285
glulysasppheleugluilealaargglyleuvalaspserlysgln
290295300
serpheleutrpvalvalargproglyphevallysglyserthrtrp
305310315320
valgluproleuproaspglypheleuglygluargglyargileval
325330335
lystrpvalproglnglngluvalleualahisglyalaileglyala
340345350
phetrpthrhisserglytrpasnserthrleugluservalcysglu
355360365
glyvalprometilepheserasppheglyleuaspglnproleuasn
370375380
alaargtyrmetseraspvalleulysvalglyvaltyrleugluasn
385390395400
glytrpgluargglygluilealaasnalaileargargvalmetval
405410415
aspglugluglyglutyrileargglnasnalaargvalleulysgln
420425430
lysalaaspvalserleumetlysglyglysersertyrgluserleu
435440445
gluserleuvalsertyrileserserleu
450455
<210>9
<211>1965
<212>dna
<213>abc转运蛋白abcg2人(abctransporterabcg2human)
<400>9
atgtcatcatcaaatgttgaagtttttattcctgtttcacaaggaaatactaatggattt60
cctgctactgcttcaaatgatttgaaagcttttactgaaggagctgttttgtcatttcat120
aatatttgctatagagttaaattgaaatcaggatttttgccttgcagaaaacctgttgaa180
aaagaaattttgtcaaatattaatggaattatgaaacctggattgaatgctattttggga240
cctactggaggaggaaaatcatcattgttggatgttttggctgctagaaaagatccttca300
ggattgtcaggagatgttttgattaatggagctcctagacctgctaattttaaatgcaat360
tcaggatatgttgttcaagatgatgttgttatgggaactttgactgttagagaaaatttg420
caattttcagctgctttgagattggctactactatgactaatcatgaaaaaaatgaaaga480
attaatagagttattcaagaattgggattggataaagttgctgattcaaaagttggaact540
caatttattagaggagtttcaggaggagaaagaaaaagaacttcaattggaatggaattg600
attactgatccttcaattttgtttttggatgaacctactactggattggattcatcaact660
gctaatgctgttttgttgttgttgaaaagaatgtcaaaacaaggaagaactattattttt720
tcaattcatcaacctagatattcaatttttaaattgtttgattcattgactttgttggct780
tcaggaagattgatgtttcatggacctgctcaagaagctttgggatattttgaatcagct840
ggatatcattgcgaagcttataataatcctgctgatttttttttggatattattaatgga900
gattcaactgctgttgctttgaatagagaagaagattttaaagctactgaaattattgaa960
ccttcaaaacaagataaacctttgattgaaaaattggctgaaatttatgttaattcatca1020
ttttataaagaaactaaagctgaattgcatcaattgtcaggaggagaaaaaaaaaaaaaa1080
attactgtttttaaagaaatttcatatactacttcattttgccatcaattgagatgggtt1140
tcaaaaagatcatttaaaaatttgttgggaaatcctcaagcttcaattgctcaaattatt1200
gttactgttgttttgggattggttattggagctatttattttggattgaaaaatgattca1260
actggaattcaaaatagagctggagttttgttttttttgactactaatcaatgcttttca1320
tcagtttcagctgttgaattgtttgttgttgaaaaaaaattgtttattcatgaatatatt1380
tcaggatattatagagtttcatcatattttttgggaaaattgttgtcagatttgttgcct1440
atgagaatgttgccttcaattatttttacttgcattgtttattttatgttgggattgaaa1500
gctaaagctgatgctttttttgttatgatgtttactttgatgatggttgcttattcagct1560
tcatcaatggctttggctattgctgctggacaatcagttgtttcagttgctactttgttg1620
atgactatttgctttgtttttatgatgattttttcaggattgttggttaatttgactact1680
attgcttcatggttgtcatggttgcaatatttttcaattcctagatatggatttactgct1740
ttgcaacataatgaatttttgggacaaaatttttgccctggattgaatgctactggaaat1800
aatccttgcaattatgctacttgcactggagaagaatatttggttaaacaaggaattgat1860
ttgtcaccttggggattgtggaaaaatcatgttgctttggcttgcatgattgttattttt1920
ttgactattgcttatttgaaattgttgtttttgaaaaaatattca1965
<210>10
<211>655
<212>prt
<213>abc转运蛋白abcg2人(abctransporterabcg2human)
<400>10
metserserserasnvalgluvalpheileprovalserglnglyasn
151015
thrasnglypheproalathralaserasnaspleulysalaphethr
202530
gluglyalavalleuserphehisasnilecystyrargvallysleu
354045
lysserglypheleuprocysarglysprovalglulysgluileleu
505560
serasnileasnglyilemetlysproglyleuasnalaileleugly
65707580
prothrglyglyglylysserserleuleuaspvalleualaalaarg
859095
lysaspproserglyleuserglyaspvalleuileasnglyalapro
100105110
argproalaasnphelyscysasnserglytyrvalvalglnaspasp
115120125
valvalmetglythrleuthrvalarggluasnleuglnpheserala
130135140
alaleuargleualathrthrmetthrasnhisglulysasngluarg
145150155160
ileasnargvalileglngluleuglyleuasplysvalalaaspser
165170175
lysvalglythrglnpheileargglyvalserglyglygluarglys
180185190
argthrserileglymetgluleuilethraspproserileleuphe
195200205
leuaspgluprothrthrglyleuaspserserthralaasnalaval
210215220
leuleuleuleulysargmetserlysglnglyargthrileilephe
225230235240
serilehisglnproargtyrserilephelysleupheaspserleu
245250255
thrleuleualaserglyargleumetphehisglyproalaglnglu
260265270
alaleuglytyrphegluseralaglytyrhiscysglualatyrasn
275280285
asnproalaaspphepheleuaspileileasnglyaspserthrala
290295300
valalaleuasnargglugluaspphelysalathrgluileileglu
305310315320
proserlysglnasplysproleuileglulysleualagluiletyr
325330335
valasnserserphetyrlysgluthrlysalagluleuhisglnleu
340345350
serglyglyglulyslyslyslysilethrvalphelysgluileser
355360365
tyrthrthrserphecyshisglnleuargtrpvalserlysargser
370375380
phelysasnleuleuglyasnproglnalaserilealaglnileile
385390395400
valthrvalvalleuglyleuvalileglyalailetyrpheglyleu
405410415
lysasnaspserthrglyileglnasnargalaglyvalleuphephe
420425430
leuthrthrasnglncyspheserservalseralavalgluleuphe
435440445
valvalglulyslysleupheilehisglutyrileserglytyrtyr
450455460
argvalsersertyrpheleuglylysleuleuseraspleuleupro
465470475480
metargmetleuproserileilephethrcysilevaltyrphemet
485490495
leuglyleulysalalysalaaspalaphephevalmetmetphethr
500505510
leumetmetvalalatyrseralasersermetalaleualaileala
515520525
alaglyglnservalvalservalalathrleuleumetthrilecys
530535540
phevalphemetmetilepheserglyleuleuvalasnleuthrthr
545550555560
ilealasertrpleusertrpleuglntyrpheserileproargtyr
565570575
glyphethralaleuglnhisasnglupheleuglyglnasnphecys
580585590
proglyleuasnalathrglyasnasnprocysasntyralathrcys
595600605
thrglygluglutyrleuvallysglnglyileaspleuserprotrp
610615620
glyleutrplysasnhisvalalaleualacysmetilevalilephe
625630635640
leuthrilealatyrleulysleuleupheleulyslystyrser
645650655
<210>11
<211>1074
<212>dna
<213>myb12大麻(myb12cannabis)
<400>11
atgaagaagaacaaatcaactagtaataataagaacaacaacagtaataatatcatcaaa60
aacgacatcgtatcatcatcatcatcaacaacaacaacatcatcaacaactacagcaaca120
tcatcatttcataatgagaaagttactgtcagtactgatcatattattaatcttgatgat180
aagcagaaacgacaattatgtcgttgtcgtttagaaaaagaagaagaagaagaaggaagt240
ggtggttgtggtgagacagtagtaatgatgctagggtcagtatctcctgctgctgctact300
gctgctgcagctgggggctcatcaagttgtgatgaagacatgttgggtggtcatgatcaa360
ctgttgttgttgtgttgttctgagaaaaaaacgacagaaatttcatcagtggtgaacttt420
aataataataataataataataaggaaaatggtgacgaagtttcaggaccgtacgattat480
catcatcataaagaagaggaagaagaagaagaagaagatgaagcatctgcatcagtagca540
gctgttgatgaagggatgttgttgtgctttgatgacataatagatagccacttgctaaat600
ccaaatgaggttttgactttaagagaagatagccataatgaaggtggggcagctgatcag660
attgacaagactacttgtaataatactactattactactaatgatgattataacaataac720
ttgatgatgttgagctgcaataataacggagattatgttattagtgatgatcatgatgat780
cagtactggatagacgacgtcgttggagttgacttttggagttgggagagttcgactact840
actgttattacccaagaacaagaacaagaacaagatcaagttcaagaacagaagaatatg900
tgggataatgagaaagagaaactgttgtctttgctatgggataatagtgataacagcagc960
agttgggagttacaagataaaagcaataataataataataataatgttcctaacaaatgt1020
caagagattacctctgataaagaaaatgctatggttgcatggcttctctcctga1074
<210>12
<211>357
<212>prt
<213>myb12大麻(myb12cannabis)
<400>12
metlyslysasnlysserthrserasnasnlysasnasnasnserasn
151015
asnileilelysasnaspilevalserserserserserthrthrthr
202530
thrserserthrthrthralathrserserphehisasnglulysval
354045
thrvalserthrasphisileileasnleuaspasplysglnlysarg
505560
glnleucysargcysargleuglulysgluglugluglugluglyser
65707580
glyglycysglygluthrvalvalmetmetleuglyservalserpro
859095
alaalaalathralaalaalaalaglyglysersersercysaspglu
100105110
aspmetleuglyglyhisaspglnleuleuleuleucyscysserglu
115120125
lyslysthrthrgluileserservalvalasnpheasnasnasnasn
130135140
asnasnasnlysgluasnglyaspgluvalserglyprotyrasptyr
145150155160
hishishislysglugluglugluglugluglugluaspglualaser
165170175
alaservalalaalavalaspgluglymetleuleucyspheaspasp
180185190
ileileaspserhisleuleuasnproasngluvalleuthrleuarg
195200205
gluaspserhisasngluglyglyalaalaaspglnileasplysthr
210215220
thrcysasnasnthrthrilethrthrasnaspasptyrasnasnasn
225230235240
leumetmetleusercysasnasnasnglyasptyrvalileserasp
245250255
asphisaspaspglntyrtrpileaspaspvalvalglyvalaspphe
260265270
trpsertrpgluserserthrthrthrvalilethrglngluglnglu
275280285
glngluglnaspglnvalglngluglnlysasnmettrpaspasnglu
290295300
lysglulysleuleuserleuleutrpaspasnseraspasnserser
305310315320
sertrpgluleuglnasplysserasnasnasnasnasnasnasnval
325330335
proasnlyscysglngluilethrserasplysgluasnalametval
340345350
alatrpleuleuser
355
<210>13
<211>1476
<212>dna
<213>过氧化氢酶拟南芥(catalasearabidopsisthaliana)
<400>13
atggatccttataaatatagacctgcttcatcatataattcacctttttttactactaat60
tcaggagctcctgtttggaataataattcatcaatgactgttggacctagaggattgatt120
ttgttggaagattatcatttggttgaaaaattggctaattttgatagagaaagaattcct180
gaaagagttgttcatgctagaggagcttcagctaaaggattttttgaagttactcatgat240
atttcaaatttgacttgcgctgattttttgagagctcctggagttcaaactcctgttatt300
gttagattttcaactgttattcatgctagaggatcacctgaaactttgagagatcctaga360
ggatttgctgttaaattttatactagagaaggaaattttgatttggttggaaataatttt420
cctgttttttttattagagatggaatgaaatttcctgatattgttcatgctttgaaacct480
aatcctaaatcacatattcaagaaaattggagaattttggattttttttcacatcatcct540
gaatcattgaatatgtttacttttttgtttgatgatattggaattcctcaagattataga600
catatggatggatcaggagttaatacttatatgttgattaataaagctggaaaagctcat660
tatgttaaatttcattggaaacctacttgcggagttaaatcattgttggaagaagatgct720
attagattgggaggaactaatcattcacatgctactcaagatttgtatgattcaattgct780
gctggaaattatcctgaatggaaattgtttattcaaattattgatcctgctgatgaagat840
aaatttgattttgatcctttggatgttactaaaacttggcctgaagatattttgcctttg900
caacctgttggaagaatggttttgaataaaaatattgataatttttttgctgaaaatgaa960
caattggctttttgccctgctattattgttcctggaattcattattcagatgataaattg1020
ttgcaaactagagttttttcatatgctgatactcaaagacatagattgggacctaattat1080
ttgcaattgcctgttaatgctcctaaatgcgctcatcataataatcatcatgaaggattt1140
atgaattttatgcatagagatgaagaagttaattattttccttcaagatatgatcaagtt1200
agacatgctgaaaaatatcctactcctcctgctgtttgctcaggaaaaagagaaagatgc1260
attattgaaaaagaaaataattttaaagaacctggagaaagatatagaacttttactcct1320
gaaagacaagaaagatttattcaaagatggattgatgctttgtcagatcctagaattact1380
catgaaattagatcaatttggatttcatattggtcacaagctgataaatcattgggacaa1440
aaattggcttcaagattgaatgttagaccttcaatt1476
<210>14
<211>492
<212>prt
<213>过氧化氢酶拟南芥(catalasearabidopsisthaliana)
<400>14
metaspprotyrlystyrargproalasersertyrasnserprophe
151015
phethrthrasnserglyalaprovaltrpasnasnasnsersermet
202530
thrvalglyproargglyleuileleuleugluasptyrhisleuval
354045
glulysleualaasnpheasparggluargileprogluargvalval
505560
hisalaargglyalaseralalysglyphephegluvalthrhisasp
65707580
ileserasnleuthrcysalaasppheleuargalaproglyvalgln
859095
thrprovalilevalargpheserthrvalilehisalaargglyser
100105110
progluthrleuargaspproargglyphealavallysphetyrthr
115120125
arggluglyasnpheaspleuvalglyasnasnpheprovalphephe
130135140
ileargaspglymetlyspheproaspilevalhisalaleulyspro
145150155160
asnprolysserhisileglngluasntrpargileleuaspphephe
165170175
serhishisprogluserleuasnmetphethrpheleupheaspasp
180185190
ileglyileproglnasptyrarghismetaspglyserglyvalasn
195200205
thrtyrmetleuileasnlysalaglylysalahistyrvallysphe
210215220
histrplysprothrcysglyvallysserleuleuglugluaspala
225230235240
ileargleuglyglythrasnhisserhisalathrglnaspleutyr
245250255
aspserilealaalaglyasntyrproglutrplysleupheilegln
260265270
ileileaspproalaaspgluasplyspheasppheaspproleuasp
275280285
valthrlysthrtrpprogluaspileleuproleuglnprovalgly
290295300
argmetvalleuasnlysasnileaspasnphephealagluasnglu
305310315320
glnleualaphecysproalaileilevalproglyilehistyrser
325330335
aspasplysleuleuglnthrargvalphesertyralaaspthrgln
340345350
arghisargleuglyproasntyrleuglnleuprovalasnalapro
355360365
lyscysalahishisasnasnhishisgluglyphemetasnphemet
370375380
hisargaspglugluvalasntyrpheproserargtyraspglnval
385390395400
arghisalaglulystyrprothrproproalavalcysserglylys
405410415
arggluargcysileileglulysgluasnasnphelysgluprogly
420425430
gluargtyrargthrphethrprogluargglngluargpheilegln
435440445
argtrpileaspalaleuseraspproargilethrhisgluilearg
450455460
seriletrpilesertyrtrpserglnalaasplysserleuglygln
465470475480
lysleualaserargleuasnvalargproserile
485490
<210>15
<211>2262
<212>dna
<213>过氧化氢酶hpii(kate)大肠杆菌(catalasehpii(kate)escherichiacoli)
<400>15
atgtcgcaacataacgaaaagaacccacatcagcaccagtcaccactacacgattccagc60
gaagcgaaaccggggatggactcactggcacctgaggacggctctcatcgtccagcggct120
gaaccaacaccgccaggtgcacaacctaccgccccagggagcctgaaagcccctgatacg180
cgtaacgaaaaacttaattctctggaagacgtacgcaaaggcagtgaaaattatgcgctg240
accactaatcagggcgtgcgcatcgccgacgatcaaaactcactgcgtgccggtagccgt300
ggtccaacgctgctggaagattttattctgcgcgagaaaatcacccactttgaccatgag360
cgcattccggaacgtattgttcatgcacgcggatcagccgctcacggttatttccagcca420
tataaaagcttaagcgatattaccaaagcggatttcctctcagatccgaacaaaatcacc480
ccagtatttgtacgtttctctaccgttcagggtggtgctggctctgctgataccgtgcgt540
gatatccgtggctttgccaccaagttctataccgaagagggtatttttgacctcgttggc600
aataacacgccaatcttctttatccaggatgcgcataaattccccgattttgttcatgcg660
gtaaaaccagaaccgcactgggcaattccacaagggcaaagtgcccacgatactttctgg720
gattatgtttctctgcaacctgaaactctgcacaacgtgatgtgggcgatgtcggatcgc780
ggcatcccccgcagttaccgcaccatggaaggcttcggtattcacaccttccgcctgatt840
aatgccgaagggaaggcaacgtttgtacgtttccactggaaaccactggcaggtaaagcc900
tcactcgtttgggatgaagcacaaaaactcaccggacgtgacccggacttccaccgccgc960
gagttgtgggaagccattgaagcaggcgattttccggaatacgaactgggcttccagttg1020
attcctgaagaagatgaattcaagttcgacttcgatcttctcgatccaaccaaacttatc1080
ccggaagaactggtgcccgttcagcgtgtcggcaaaatggtgctcaatcgcaacccggat1140
aacttctttgctgaaaacgaacaggcggctttccatcctgggcatatcgtgccgggactg1200
gacttcaccaacgatccgctgttgcagggacgtttgttctcctataccgatacacaaatc1260
agtcgtcttggtgggccgaatttccatgagattccgattaaccgtccgacctgcccttac1320
cataatttccagcgtgacggcatgcatcgcatggggatcgacactaacccggcgaattac1380
gaaccgaactcgattaacgataactggccgcgcgaaacaccgccggggccgaaacgcggc1440
ggttttgaatcataccaggagcgcgtggaaggcaataaagttcgcgagcgcagcccatcg1500
tttggcgaatattattcccatccgcgtctgttctggctaagtcagacgccatttgagcag1560
cgccatattgtcgatggtttcagttttgagttaagcaaagtcgttcgtccgtatattcgt1620
gagcgcgttgttgaccagctggcgcatattgatctcactctggcccaggcggtggcgaaa1680
aatctcggtatcgaactgactgacgaccagctgaatatcaccccacctccggacgtcaac1740
ggtctgaaaaaggatccatccttaagtttgtacgccattcctgacggtgatgtgaaaggt1800
cgcgtggtagcgattttacttaatgatgaagtgagatcggcagaccttctggccattctc1860
aaggcgctgaaggccaaaggcgttcatgccaaactgctctactcccgaatgggtgaagtg1920
actgcggatgacggtacggtgttgcctatagccgctacctttgccggtgcaccttcgctg1980
acggtcgatgcggtcattgtcccttgcggcaatatcgcggatatcgctgacaacggcgat2040
gccaactactacctgatggaagcctacaaacaccttaaaccgattgcgctggcgggtgac2100
gcgcgcaagtttaaagcaacaatcaagatcgctgaccagggtgaagaagggattgtggaa2160
gctgacagcgctgacggtagttttatggatgaactgctaacgctgatggcagcacaccgc2220
gtgtggtcacgcattcctaagattgacaaaattcctgcctga2262
<210>16
<211>753
<212>prt
<213>过氧化氢酶hpii(kate)大肠杆菌(catalasehpii(kate)escherichiacoli)
<400>16
metserglnhisasnglulysasnprohisglnhisglnserproleu
151015
hisaspserserglualalysproglymetaspserleualaproglu
202530
aspglyserhisargproalaalagluprothrproproglyalagln
354045
prothralaproglyserleulysalaproaspthrargasnglulys
505560
leuasnserleugluaspvalarglysglysergluasntyralaleu
65707580
thrthrasnglnglyvalargilealaaspaspglnasnserleuarg
859095
alaglyserargglyprothrleuleugluasppheileleuargglu
100105110
lysilethrhispheasphisgluargileprogluargilevalhis
115120125
alaargglyseralaalahisglytyrpheglnprotyrlysserleu
130135140
seraspilethrlysalaasppheleuseraspproasnlysilethr
145150155160
provalphevalargpheserthrvalglnglyglyalaglyserala
165170175
aspthrvalargaspileargglyphealathrlysphetyrthrglu
180185190
gluglyilepheaspleuvalglyasnasnthrproilephepheile
195200205
glnaspalahislyspheproaspphevalhisalavallysproglu
210215220
prohistrpalaileproglnglyglnseralahisaspthrphetrp
225230235240
asptyrvalserleuglnprogluthrleuhisasnvalmettrpala
245250255
metseraspargglyileproargsertyrargthrmetgluglyphe
260265270
glyilehisthrpheargleuileasnalagluglylysalathrphe
275280285
valargphehistrplysproleualaglylysalaserleuvaltrp
290295300
aspglualaglnlysleuthrglyargaspproaspphehisargarg
305310315320
gluleutrpglualaileglualaglyasppheproglutyrgluleu
325330335
glypheglnleuileproglugluaspgluphelyspheasppheasp
340345350
leuleuaspprothrlysleuileproglugluleuvalprovalgln
355360365
argvalglylysmetvalleuasnargasnproaspasnphepheala
370375380
gluasngluglnalaalaphehisproglyhisilevalproglyleu
385390395400
aspphethrasnaspproleuleuglnglyargleuphesertyrthr
405410415
aspthrglnileserargleuglyglyproasnphehisgluilepro
420425430
ileasnargprothrcysprotyrhisasnpheglnargaspglymet
435440445
hisargmetglyileaspthrasnproalaasntyrgluproasnser
450455460
ileasnaspasntrpproarggluthrproproglyprolysarggly
465470475480
glypheglusertyrglngluargvalgluglyasnlysvalargglu
485490495
argserproserpheglyglutyrtyrserhisproargleuphetrp
500505510
leuserglnthrprophegluglnarghisilevalaspglypheser
515520525
phegluleuserlysvalvalargprotyrilearggluargvalval
530535540
aspglnleualahisileaspleuthrleualaglnalavalalalys
545550555560
asnleuglyilegluleuthraspaspglnleuasnilethrpropro
565570575
proaspvalasnglyleulyslysaspproserleuserleutyrala
580585590
ileproaspglyaspvallysglyargvalvalalaileleuleuasn
595600605
aspgluvalargseralaaspleuleualaileleulysalaleulys
610615620
alalysglyvalhisalalysleuleutyrserargmetglygluval
625630635640
thralaaspaspglythrvalleuproilealaalathrphealagly
645650655
alaproserleuthrvalaspalavalilevalprocysglyasnile
660665670
alaaspilealaaspasnglyaspalaasntyrtyrleumetgluala
675680685
tyrlyshisleulysproilealaleualaglyaspalaarglysphe
690695700
lysalathrilelysilealaaspglnglyglugluglyilevalglu
705710715720
alaaspseralaaspglyserphemetaspgluleuleuthrleumet
725730735
alaalahisargvaltrpserargileprolysileasplysilepro
740745750
ala
<210>17
<211>1635
<212>dna
<213>毛状体靶向cbda合酶大麻(trichome-targetedcbdasynthasecannabis)
<400>17
atgaagtgctcaacattctccttttggtttgtttgcaagataatatttttctttttctca60
ttcaatatccaaacttccattgctaatcctcgagaaaacttccttaaatgcttctcgcaa120
tatattcccaataatgcaacaaatctaaaactcgtatacactcaaaacaacccattgtat180
atgtctgtcctaaattcgacaatacacaatcttagattcacctctgacacaaccccaaaa240
ccacttgttatcgtcactccttcacatgtctctcatatccaaggcactattctatgctcc300
aagaaagttggcttgcagattcgaactcgaagtggtggtcatgattctgagggcatgtcc360
tacatatctcaagtcccatttgttatagtagacttgagaaacatgcgttcaatcaaaata420
gatgttcatagccaaactgcatgggttgaagccggagctacccttggagaagtttattat480
tgggttaatgagaaaaatgagaatcttagtttggcggctgggtattgccctactgtttgc540
gcaggtggacactttggtggaggaggctatggaccattgatgagaaactatggcctcgcg600
gctgataatatcattgatgcacacttagtcaacgttcatggaaaagtgctagatcgaaaa660
tctatgggggaagatctcttttgggctttacgtggtggtggagcagaaagcttcggaatc720
attgtagcatggaaaattagactggttgctgtcccaaagtctactatgtttagtgttaaa780
aagatcatggagatacatgagcttgtcaagttagttaacaaatggcaaaatattgcttac840
aagtatgacaaagatttattactcatgactcacttcataactaggaacattacagataat900
caagggaagaataagacagcaatacacacttacttctcttcagttttccttggtggagtg960
gatagtctagtcgacttgatgaacaagagttttcctgagttgggtattaaaaaaacggat1020
tgcagacaattgagctggattgatactatcatcttctatagtggtgttgtaaattacgac1080
actgataattttaacaaggaaattttgcttgatagatccgctgggcagaacggtgctttc1140
aagattaagttagactacgttaagaaaccaattccagaatctgtatttgtccaaattttg1200
gaaaaattatatgaagaagatataggagctgggatgtatgcgttgtacccttacggtggt1260
ataatggatgagatttcagaatcagcaattccattccctcatcgagctggaatcttgtat1320
gagttatggtacatatgtagttgggagaagcaagaagataacgaaaagcatctaaactgg1380
attagaaatatttataacttcatgactccttatgtgtccaaaaatccaagattggcatat1440
ctcaattatagagaccttgatataggaataaatgatcccaagaatccaaataattacaca1500
caagcacgtatttggggtgagaagtattttggtaaaaattttgacaggctagtaaaagtg1560
aaaaccctggttgatcccaataacttttttagaaacgaacaaagcatcccacctctacca1620
cggcatcgtcattaa1635
<210>18
<211>544
<212>prt
<213>毛状体靶向cbda合酶大麻(trichome-targetedcbdasynthasecannabis)
<400>18
metlyscysserthrpheserphetrpphevalcyslysileilephe
151015
phephepheserpheasnileglnthrserilealaasnproargglu
202530
asnpheleulyscyspheserglntyrileproasnasnalathrasn
354045
leulysleuvaltyrthrglnasnasnproleutyrmetservalleu
505560
asnserthrilehisasnleuargphethrseraspthrthrprolys
65707580
proleuvalilevalthrproserhisvalserhisileglnglythr
859095
ileleucysserlyslysvalglyleuglnileargthrargsergly
100105110
glyhisaspsergluglymetsertyrileserglnvalpropheval
115120125
ilevalaspleuargasnmetargserilelysileaspvalhisser
130135140
glnthralatrpvalglualaglyalathrleuglygluvaltyrtyr
145150155160
trpvalasnglulysasngluasnleuserleualaalaglytyrcys
165170175
prothrvalcysalaglyglyhispheglyglyglyglytyrglypro
180185190
leumetargasntyrglyleualaalaaspasnileileaspalahis
195200205
leuvalasnvalhisglylysvalleuasparglyssermetglyglu
210215220
aspleuphetrpalaleuargglyglyglyalagluserpheglyile
225230235240
ilevalalatrplysileargleuvalalavalprolysserthrmet
245250255
pheservallyslysilemetgluilehisgluleuvallysleuval
260265270
asnlystrpglnasnilealatyrlystyrasplysaspleuleuleu
275280285
metthrhispheilethrargasnilethraspasnglnglylysasn
290295300
lysthralailehisthrtyrpheserservalpheleuglyglyval
305310315320
aspserleuvalaspleumetasnlysserpheprogluleuglyile
325330335
lyslysthraspcysargglnleusertrpileaspthrileilephe
340345350
tyrserglyvalvalasntyraspthraspasnpheasnlysgluile
355360365
leuleuaspargseralaglyglnasnglyalaphelysilelysleu
370375380
asptyrvallyslysproileprogluservalphevalglnileleu
385390395400
glulysleutyrglugluaspileglyalaglymettyralaleutyr
405410415
protyrglyglyilemetaspgluilesergluseralaileprophe
420425430
prohisargalaglyileleutyrgluleutrptyrilecyssertrp
435440445
glulysglngluaspasnglulyshisleuasntrpileargasnile
450455460
tyrasnphemetthrprotyrvalserlysasnproargleualatyr
465470475480
leuasntyrargaspleuaspileglyileasnaspprolysasnpro
485490495
asnasntyrthrglnalaargiletrpglyglulystyrpheglylys
500505510
asnpheaspargleuvallysvallysthrleuvalaspproasnasn
515520525
phepheargasngluglnserileproproleuproarghisarghis
530535540
<210>19
<211>1467
<212>dna
<213>毛状体靶向udp糖基转移酶76g1甜叶菊(trichome-targestedudpglycosyltransferase76g1steviarebaudiana)
<400>19
atgaagtgctcaacattctccttttggtttgtttgcaagataatatttttctttttctca60
ttcaatatccaaacttccattgctaatcctcgagaaaataaaactgaaactactgttaga120
agaagaagaagaattattttgtttcctgttccttttcaaggacatattaatcctattttg180
caattggctaatgttttgtattcaaaaggattttcaattactatttttcatactaatttt240
aataaacctaaaacttcaaattatcctcattttacttttagatttattttggataatgat300
cctcaagatgaaagaatttcaaatttgcctactcatggacctttggctggaatgagaatt360
cctattattaatgaacatggagctgatgaattgagaagagaattggaattgttgatgttg420
gcttcagaagaagatgaagaagtttcatgcttgattactgatgctttgtggtattttgct480
caatcagttgctgattcattgaatttgagaagattggttttgatgacttcatcattgttt540
aattttcatgctcatgtttcattgcctcaatttgatgaattgggatatttggatcctgat600
gataaaactagattggaagaacaagcttcaggatttcctatgttgaaagttaaagatatt660
aaatcagcttattcaaattggcaaattttgaaagaaattttgggaaaaatgattaaacaa720
actagagcttcatcaggagttatttggaattcatttaaagaattggaagaatcagaattg780
gaaactgttattagagaaattcctgctccttcatttttgattcctttgcctaaacatttg840
actgcttcatcatcatcattgttggatcatgatagaactgtttttcaatggttggatcaa900
caacctccttcatcagttttgtatgtttcatttggatcaacttcagaagttgatgaaaaa960
gattttttggaaattgctagaggattggttgattcaaaacaatcatttttgtgggttgtt1020
agacctggatttgttaaaggatcaacttgggttgaacctttgcctgatggatttttggga1080
gaaagaggaagaattgttaaatgggttcctcaacaagaagttttggctcatggagctatt1140
ggagctttttggactcattcaggatggaattcaactttggaatcagtttgcgaaggagtt1200
cctatgattttttcagattttggattggatcaacctttgaatgctagatatatgtcagat1260
gttttgaaagttggagtttatttggaaaatggatgggaaagaggagaaattgctaatgct1320
attagaagagttatggttgatgaagaaggagaatatattagacaaaatgctagagttttg1380
aaacaaaaagctgatgtttcattgatgaaaggaggatcatcatatgaatcattggaatca1440
ttggtttcatatatttcatcattgtaa1467
<210>20
<211>488
<212>prt
<213>毛状体靶向udp糖基转移酶76g1甜叶菊(trichome-targestedudpglycosyltransferase76g1steviarebaudiana)
<400>20
metlyscysserthrpheserphetrpphevalcyslysileilephe
151015
phephepheserpheasnileglnthrserilealaasnproargglu
202530
asnlysthrgluthrthrvalargargargargargileileleuphe
354045
provalpropheglnglyhisileasnproileleuglnleualaasn
505560
valleutyrserlysglypheserilethrilephehisthrasnphe
65707580
asnlysprolysthrserasntyrprohisphethrpheargpheile
859095
leuaspasnaspproglnaspgluargileserasnleuprothrhis
100105110
glyproleualaglymetargileproileileasngluhisglyala
115120125
aspgluleuargarggluleugluleuleumetleualasergluglu
130135140
aspglugluvalsercysleuilethraspalaleutrptyrpheala
145150155160
glnservalalaaspserleuasnleuargargleuvalleumetthr
165170175
serserleupheasnphehisalahisvalserleuproglnpheasp
180185190
gluleuglytyrleuaspproaspasplysthrargleugluglugln
195200205
alaserglypheprometleulysvallysaspilelysseralatyr
210215220
serasntrpglnileleulysgluileleuglylysmetilelysgln
225230235240
thrargalaserserglyvaliletrpasnserphelysgluleuglu
245250255
glusergluleugluthrvalilearggluileproalaproserphe
260265270
leuileproleuprolyshisleuthralaserserserserleuleu
275280285
asphisaspargthrvalpheglntrpleuaspglnglnproproser
290295300
servalleutyrvalserpheglyserthrsergluvalaspglulys
305310315320
asppheleugluilealaargglyleuvalaspserlysglnserphe
325330335
leutrpvalvalargproglyphevallysglyserthrtrpvalglu
340345350
proleuproaspglypheleuglygluargglyargilevallystrp
355360365
valproglnglngluvalleualahisglyalaileglyalaphetrp
370375380
thrhisserglytrpasnserthrleugluservalcysgluglyval
385390395400
prometilepheserasppheglyleuaspglnproleuasnalaarg
405410415
tyrmetseraspvalleulysvalglyvaltyrleugluasnglytrp
420425430
gluargglygluilealaasnalaileargargvalmetvalaspglu
435440445
gluglyglutyrileargglnasnalaargvalleulysglnlysala
450455460
aspvalserleumetlysglyglysersertyrgluserleugluser
465470475480
leuvalsertyrileserserleu
485
<210>21
<211>1022
<212>dna
<213>pm-utri拟南芥(pm-utriarabidopsisthaliana)
<400>21
atggaggtccatggctccggattccgtcgaattctgttgttggcgttgtgtatctccggg60
atctggtccgcctacatctaccaaggcgttcttcaagagactctgtccacgaagagattt120
ggtccagatgagaagaggttcgagcatcttgcattcttgaacttagctcaaagtgtagtc180
tgcttgatctggtcttatataatgatcaagctctggtcaaatgctggtaacggtggagca240
ccatggtggacgtattggagtgcaggcattactaatacaattggtcctgccatgggaatt300
gaagccttgaagtatatcagttatccagctcaggttttggcaaaatcgtcaaaaatgatt360
ccagttatgctaatgggaactttagtttacggaataagatacactttccctgaatacatg420
tgcacctttcttgtcgctggaggagtatccatctttgctcttcttaagacaagctctaag480
acaattagcaagctagcacatccaaatgctcccctcggttacgcactttgttccttaaac540
ctcgcctttgacggattcacaaatgccacacaagactccattgcctcaaggtacccaaaa600
accgaagcgtgggacataatgctgggaatgaacttatggggcacaatatacaacattatc660
tacatgtttggcttgccacaagggatggattcgaagcaattcagttctgtaagctacacc720
cggaagcggcatgggacattctaaagtattgtatatgcggtgccgtgggacaaaacttca780
tcttcatgacaataagtaacttcgggtcactagctaacacgaccataaccacgaccagga840
agtttgttagcattgttgtatcatcagtaatgagcggaaatccattgtcgttgaagcaat900
ggggatgtgtttcgatggtctttggtggtttggcatatcaaatttatcttaaatggaaga960
aattgcagagagtggagtgctccataatgaacttaatgtgtgggtctacctgcgccgctt1020
ga1022
<210>22
<211>1554
<212>dna
<213>细胞溶质cbda合酶(cytcbda)cannabissativa(cytostoliccbdasynthase(cytcbdas)cannabissativa)
<400>22
atgaatcctcgagaaaacttccttaaatgcttctcgcaatatattcccaataatgcaaca60
aatctaaaactcgtatacactcaaaacaacccattgtatatgtctgtcctaaattcgaca120
atacacaatcttagattcacctctgacacaaccccaaaaccacttgttatcgtcactcct180
tcacatgtctctcatatccaaggcactattctatgctccaagaaagttggcttgcagatt240
cgaactcgaagtggtggtcatgattctgagggcatgtcctacatatctcaagtcccattt300
gttatagtagacttgagaaacatgcgttcaatcaaaatagatgttcatagccaaactgca360
tgggttgaagccggagctacccttggagaagtttattattgggttaatgagaaaaatgag420
aatcttagtttggcggctgggtattgccctactgtttgcgcaggtggacactttggtgga480
ggaggctatggaccattgatgagaaactatggcctcgcggctgataatatcattgatgca540
cacttagtcaacgttcatggaaaagtgctagatcgaaaatctatgggggaagatctcttt600
tgggctttacgtggtggtggagcagaaagcttcggaatcattgtagcatggaaaattaga660
ctggttgctgtcccaaagtctactatgtttagtgttaaaaagatcatggagatacatgag720
cttgtcaagttagttaacaaatggcaaaatattgcttacaagtatgacaaagatttatta780
ctcatgactcacttcataactaggaacattacagataatcaagggaagaataagacagca840
atacacacttacttctcttcagttttccttggtggagtggatagtctagtcgacttgatg900
aacaagagttttcctgagttgggtattaaaaaaacggattgcagacaattgagctggatt960
gatactatcatcttctatagtggtgttgtaaattacgacactgataattttaacaaggaa1020
attttgcttgatagatccgctgggcagaacggtgctttcaagattaagttagactacgtt1080
aagaaaccaattccagaatctgtatttgtccaaattttggaaaaattatatgaagaagat1140
ataggagctgggatgtatgcgttgtacccttacggtggtataatggatgagatttcagaa1200
tcagcaattccattccctcatcgagctggaatcttgtatgagttatggtacatatgtagt1260
tgggagaagcaagaagataacgaaaagcatctaaactggattagaaatatttataacttc1320
atgactccttatgtgtccaaaaatccaagattggcatatctcaattatagagaccttgat1380
ataggaataaatgatcccaagaatccaaataattacacacaagcacgtatttggggtgag1440
aagtattttggtaaaaattttgacaggctagtaaaagtgaaaaccctggttgatcccaat1500
aacttttttagaaacgaacaaagcatcccacctctaccacggcatcgtcattaa1554
<210>23
<211>517
<212>prt
<213>细胞溶质cbda合酶(cytcbda)cannabissativa(cytostoliccbdasynthase(cytcbdas)cannabissativa)
<400>23
metasnproarggluasnpheleulyscyspheserglntyrilepro
151015
asnasnalathrasnleulysleuvaltyrthrglnasnasnproleu
202530
tyrmetservalleuasnserthrilehisasnleuargphethrser
354045
aspthrthrprolysproleuvalilevalthrproserhisvalser
505560
hisileglnglythrileleucysserlyslysvalglyleuglnile
65707580
argthrargserglyglyhisaspsergluglymetsertyrileser
859095
glnvalprophevalilevalaspleuargasnmetargserilelys
100105110
ileaspvalhisserglnthralatrpvalglualaglyalathrleu
115120125
glygluvaltyrtyrtrpvalasnglulysasngluasnleuserleu
130135140
alaalaglytyrcysprothrvalcysalaglyglyhispheglygly
145150155160
glyglytyrglyproleumetargasntyrglyleualaalaaspasn
165170175
ileileaspalahisleuvalasnvalhisglylysvalleuasparg
180185190
lyssermetglygluaspleuphetrpalaleuargglyglyglyala
195200205
gluserpheglyileilevalalatrplysileargleuvalalaval
210215220
prolysserthrmetpheservallyslysilemetgluilehisglu
225230235240
leuvallysleuvalasnlystrpglnasnilealatyrlystyrasp
245250255
lysaspleuleuleumetthrhispheilethrargasnilethrasp
260265270
asnglnglylysasnlysthralailehisthrtyrpheserserval
275280285
pheleuglyglyvalaspserleuvalaspleumetasnlysserphe
290295300
progluleuglyilelyslysthraspcysargglnleusertrpile
305310315320
aspthrileilephetyrserglyvalvalasntyraspthraspasn
325330335
pheasnlysgluileleuleuaspargseralaglyglnasnglyala
340345350
phelysilelysleuasptyrvallyslysproileprogluserval
355360365
phevalglnileleuglulysleutyrglugluaspileglyalagly
370375380
mettyralaleutyrprotyrglyglyilemetaspgluileserglu
385390395400
seralailepropheprohisargalaglyileleutyrgluleutrp
405410415
tyrilecyssertrpglulysglngluaspasnglulyshisleuasn
420425430
trpileargasniletyrasnphemetthrprotyrvalserlysasn
435440445
proargleualatyrleuasntyrargaspleuaspileglyileasn
450455460
aspprolysasnproasnasntyrthrglnalaargiletrpglyglu
465470475480
lystyrpheglylysasnpheaspargleuvallysvallysthrleu
485490495
valaspproasnasnphepheargasngluglnserileproproleu
500505510
proarghisarghis
515
<210>24
<211>1377
<212>dna
<213>细胞溶质靶向udp糖基转移酶76g1(cytutg)甜叶菊(cytostolic-targetedudpglycosyltransferase76g1(cytutg)steviarebaudiana)
<400>24
atggaaaataaaaccgaaaccaccgtccgccgtcgtcgccgtatcattctgttcccggtc60
ccgttccagggccacatcaacccgattctgcaactggcgaacgtgctgtattcgaaaggt120
ttcagcatcaccatcttccatacgaacttcaacaagccgaagaccagcaattacccgcac180
tttacgttccgttttattctggataacgacccgcaggatgaacgcatctctaatctgccg240
acccacggcccgctggcgggtatgcgtattccgattatcaacgaacacggcgcagatgaa300
ctgcgtcgcgaactggaactgctgatgctggccagcgaagaagatgaagaagtttcttgc360
ctgatcaccgacgcactgtggtattttgcccagtctgttgcagatagtctgaacctgcgt420
cgcctggtcctgatgaccagcagcctgttcaattttcatgcccacgttagtctgccgcag480
ttcgatgaactgggttatctggacccggatgacaaaacccgcctggaagaacaggcgagc540
ggctttccgatgctgaaagtcaaggatattaagtcagcgtactcgaactggcagattctg600
aaagaaatcctgggtaaaatgattaagcaaaccaaagcaagttccggcgtcatctggaat660
agtttcaaagaactggaagaatccgaactggaaacggtgattcgtgaaatcccggctccg720
agttttctgattccgctgccgaagcatctgaccgcgagcagcagcagcctgctggatcac780
gaccgcacggtgtttcagtggctggatcagcaaccgccgagttccgtgctgtatgttagc840
ttcggtagtacctcggaagtggatgaaaaggactttctggaaatcgctcgtggcctggtt900
gatagcaaacaatctttcctgtgggtggttcgcccgggttttgtgaagggctctacgtgg960
gttgaaccgctgccggacggcttcctgggtgaacgtggccgcattgtcaaatgggtgccg1020
cagcaagaagtgctggcgcatggcgcgattggcgcgttttggacccactccggttggaac1080
tcaacgctggaatcggtttgtgaaggtgtcccgatgattttctcagattttggcctggac1140
cagccgctgaatgcacgttatatgtcggatgttctgaaagtcggtgtgtacctggaaaac1200
ggttgggaacgcggcgaaattgcgaatgccatccgtcgcgttatggtcgatgaagaaggc1260
gaatacattcgtcagaatgctcgcgtcctgaaacaaaaggcggacgtgagcctgatgaaa1320
ggcggttcatcgtatgaaagtctggaatccctggtttcatacatcagctctctgtaa1377
<210>25
<211>458
<212>prt
<213>细胞溶质靶向udp糖基转移酶76g1(cytutg)甜叶菊(cytostolic-targetedudpglycosyltransferase76g1(cytutg)steviarebaudiana)
<400>25
metgluasnlysthrgluthrthrvalargargargargargileile
151015
leupheprovalpropheglnglyhisileasnproileleuglnleu
202530
alaasnvalleutyrserlysglypheserilethrilephehisthr
354045
asnpheasnlysprolysthrserasntyrprohisphethrphearg
505560
pheileleuaspasnaspproglnaspgluargileserasnleupro
65707580
thrhisglyproleualaglymetargileproileileasngluhis
859095
glyalaaspgluleuargarggluleugluleuleumetleualaser
100105110
glugluaspglugluvalsercysleuilethraspalaleutrptyr
115120125
phealaglnservalalaaspserleuasnleuargargleuvalleu
130135140
metthrserserleupheasnphehisalahisvalserleuprogln
145150155160
pheaspgluleuglytyrleuaspproaspasplysthrargleuglu
165170175
gluglnalaserglypheprometleulysvallysaspilelysser
180185190
alatyrserasntrpglnileleulysgluileleuglylysmetile
195200205
lysglnthrlysalaserserglyvaliletrpasnserphelysglu
210215220
leugluglusergluleugluthrvalilearggluileproalapro
225230235240
serpheleuileproleuprolyshisleuthralaserserserser
245250255
leuleuasphisaspargthrvalpheglntrpleuaspglnglnpro
260265270
proserservalleutyrvalserpheglyserthrsergluvalasp
275280285
glulysasppheleugluilealaargglyleuvalaspserlysgln
290295300
serpheleutrpvalvalargproglyphevallysglyserthrtrp
305310315320
valgluproleuproaspglypheleuglygluargglyargileval
325330335
lystrpvalproglnglngluvalleualahisglyalaileglyala
340345350
phetrpthrhisserglytrpasnserthrleugluservalcysglu
355360365
glyvalprometilepheserasppheglyleuaspglnproleuasn
370375380
alaargtyrmetseraspvalleulysvalglyvaltyrleugluasn
385390395400
glytrpgluargglygluilealaasnalaileargargvalmetval
405410415
aspglugluglyglutyrileargglnasnalaargvalleulysgln
420425430
lysalaaspvalserleumetlysglyglysersertyrgluserleu
435440445
gluserleuvalsertyrileserserleu
450455
<210>26
<211>485
<212>prt
<213>糖基转移酶(ntgt5a)烟草(glycosyltransferase(ntgt5a)nicotianatabacum)
<400>26
metglyserileglyalagluleuthrlysprohisalavalcysile
151015
protyrproalaglnglyhisileasnprometleulysleualalys
202530
ileleuhishislysglyphehisilethrphevalasnthrgluphe
354045
asnhisargargleuleulysserargglyproaspserleulysgly
505560
leuserserpheargphegluthrileproaspglyleuproprocys
65707580
glualaaspalathrglnaspileproserleucysgluserthrthr
859095
asnthrcysleualapropheargaspleuleualalysleuasnasp
100105110
thrasnthrserasnvalproprovalsercysilevalseraspgly
115120125
valmetserphethrleualaalaalaglngluleuglyvalproglu
130135140
valleuphetrpthrthrseralacysglypheleuglytyrmethis
145150155160
tyrcyslysvalileglulysglytyralaproleulysaspalaser
165170175
aspleuthrasnglytyrleugluthrthrleuasppheileprogly
180185190
metlysaspvalargleuargaspleuproserpheleuargthrthr
195200205
asnproaspgluphemetilelysphevalleuglngluthrgluarg
210215220
alaarglysalaseralaileileleuasnthrphegluthrleuglu
225230235240
alagluvalleugluserleuargasnleuleuproprovaltyrpro
245250255
ileglyproleuhispheleuvallyshisvalaspaspgluasnleu
260265270
lysglyleuargserserleutrplysglugluproglucysilegln
275280285
trpleuaspthrlysgluproasnservalvaltyrvalasnphegly
290295300
serilethrvalmetthrproasnglnleuilegluphealatrpgly
305310315320
leualaasnserglnglnthrpheleutrpileileargproaspile
325330335
valserglyaspalaserileleuproprogluphevalglugluthr
340345350
lysasnargglymetleualasertrpcysserglnglugluvalleu
355360365
serhisproalailevalglypheleuthrhisserglytrpasnser
370375380
thrleugluserileserserglyvalprometilecystrpprophe
385390395400
phealagluglnglnthrasncystrppheservalthrlystrpasp
405410415
valglymetgluileaspseraspvallysargaspgluvalgluser
420425430
leuvalarggluleumetvalglyglylysglylyslysmetlyslys
435440445
lysalametglutrplysgluleualaglualaseralalysgluhis
450455460
serglysersertyrvalasnileglulysleuvalasnaspileleu
465470475480
leuserserlyshis
485
<210>27
<211>1458
<212>dna
<213>糖基转移酶(ntgt5a)烟草(glycosyltransferase(ntgt5a)nicotianatabacum)
<400>27
atgggttccattggtgctgaattaacaaagccacatgcagtttgcataccatatcccgcc60
caaggccatattaaccccatgttaaagctagccaaaatccttcatcacaaaggctttcac120
atcacttttgtcaatactgaatttaaccaccgacgtctccttaaatctcgtggccctgat180
tctctcaagggtctttcttctttccgttttgagaccattcctgatggacttccgccatgt240
gaggcagatgccacacaagatataccttctttgtgtgaatctacaaccaatacttgcttg300
gctccttttagggatcttcttgcgaaactcaatgatactaacacatctaacgtgccaccc360
gtttcgtgcatcgtctcggatggtgtcatgagcttcaccttagccgctgcacaagaattg420
ggagtccctgaagttctgttttggaccactagtgcttgtggtttcttaggttacatgcat480
tactgcaaggttattgaaaaaggatatgctccacttaaagatgcgagtgacttgacaaat540
ggatacctagagacaacattggattttataccaggcatgaaagacgtacgtttaagggat600
cttccaagtttcttgagaactacaaatccagatgaattcatgatcaaatttgtcctccaa660
gaaacagagagagcaagaaaggcttctgcaattatcctcaacacatttgaaacactagag720
gctgaagttcttgaatcgctccgaaatcttcttcctccagtctaccccatagggcccttg780
cattttctagtgaaacatgttgatgatgagaatttgaagggacttagatccagcctttgg840
aaagaggaaccagagtgtatacaatggcttgataccaaagaaccaaattctgttgtttat900
gttaactttggaagcattactgttatgactcctaatcagcttattgagtttgcttgggga960
cttgcaaacagccagcaaacattcttatggatcataagacctgatattgtttcaggtgat1020
gcatcgattcttccacccgaattcgtggaagaaacgaagaacagaggtatgcttgctagt1080
tggtgttcacaagaagaagtacttagtcaccctgcaatagtaggattcttgactcacagt1140
ggatggaattcgacactcgaaagtataagcagtggggtgcctatgatttgctggccattt1200
ttcgctgaacagcaaacaaattgttggttttccgtcactaaatgggatgttggaatggag1260
attgacagtgatgtgaagagagatgaagtggaaagccttgtaagggaattgatggttggg1320
ggaaaaggcaaaaagatgaagaaaaaggcaatggaatggaaggaattggctgaagcatct1380
gctaaagaacattcagggtcatcttatgtgaacattgaaaagttggtcaatgatattctt1440
ctttcatccaaacattaa1458
<210>28
<211>485
<212>prt
<213>糖基转移酶(ntgt5a)烟草(glycosyltransferase(ntgt5a)nicotianatabacum)
<400>28
metglyserileglyalagluphethrlysprohisalavalcysile
151015
protyrproalaglnglyhisileasnprometleulysleualalys
202530
ileleuhishislysglyphehisilethrphevalasnthrgluphe
354045
asnhisargargleuleulysserargglyproaspserleulysgly
505560
leuserserpheargphegluthrileproaspglyleuproprocys
65707580
aspalaaspalathrglnaspileproserleucysgluserthrthr
859095
asnthrcysleuglypropheargaspleuleualalysleuasnasp
100105110
thrasnthrserasnvalproprovalsercysileileseraspgly
115120125
valmetserphethrleualaalaalaglngluleuglyvalproglu
130135140
valleuphetrpthrthrseralacysglypheleuglytyrmethis
145150155160
tyrtyrlysvalileglulysglytyralaproleulysaspalaser
165170175
aspleuthrasnglytyrleugluthrthrleuasppheileprocys
180185190
metlysaspvalargleuargaspleuproserpheleuargthrthr
195200205
asnproaspgluphemetilelysphevalleuglngluthrgluarg
210215220
alaarglysalaseralaileileleuasnthrtyrgluthrleuglu
225230235240
alagluvalleugluserleuargasnleuleuproprovaltyrpro
245250255
ileglyproleuhispheleuvallyshisvalaspaspgluasnleu
260265270
lysglyleuargserserleutrplysglugluproglucysilegln
275280285
trpleuaspthrlysgluproasnservalvaltyrvalasnphegly
290295300
serilethrvalmetthrproasnglnleuilegluphealatrpgly
305310315320
leualaasnserglnglnserpheleutrpileileargproaspile
325330335
valserglyaspalaserileleuproprogluphevalglugluthr
340345350
lyslysargglymetleualasertrpcysserglnglugluvalleu
355360365
serhisproalaileglyglypheleuthrhisserglytrpasnser
370375380
thrleugluserileserserglyvalprometilecystrpprophe
385390395400
phealagluglnglnthrasncystrppheservalthrlystrpasp
405410415
valglymetgluileaspcysaspvallysargaspgluvalgluser
420425430
leuvalarggluleumetvalglyglylysglylyslysmetlyslys
435440445
lysalametglutrplysgluleualaglualaseralalysgluhis
450455460
serglysersertyrvalasnileglulysvalvalasnaspileleu
465470475480
leuserserlyshis
485
<210>29
<211>1458
<212>dna
<213>糖基转移酶(ntgt5a)烟草(glycosyltransferase(ntgt5a)nicotianatabacum)
<400>29
atgggttccattggtgctgaatttacaaagccacatgcagtttgcataccatatcccgcc60
caaggccatattaaccccatgttaaagctagccaaaatccttcatcacaaaggctttcac120
atcacttttgtcaatactgaatttaaccacagacgtctgcttaaatctcgtggccctgat180
tctctcaagggtctttcttctttccgttttgagacaattcctgatggacttccgccatgt240
gatgcagatgccacacaagatataccttctttgtgtgaatctacaaccaatacttgcttg300
ggtccttttagggatcttcttgcgaaactcaatgatactaacacatctaacgtgccaccc360
gtttcgtgcatcatctcagatggtgtcatgagcttcaccttagccgctgcacaagaattg420
ggagtccctgaagttctgttttggaccactagtgcttgtggtttcttaggttacatgcat480
tattacaaggttattgaaaaaggatacgctccacttaaagatgcgagtgacttgacaaat540
ggatacctagagacaacattggattttataccatgcatgaaagacgtacgtttaagggat600
cttccaagtttcttgagaactacaaatccagatgaattcatgatcaaatttgtcctccaa660
gaaacagagagagcaagaaaggcttctgcaattatcctcaacacatatgaaacactagag720
gctgaagttcttgaatcgctccgaaatcttcttcctccagtctaccccattgggcccttg780
cattttctagtgaaacatgttgatgatgagaatttgaagggacttagatccagcctttgg840
aaagaggaaccagagtgtatacaatggcttgataccaaagaaccaaattctgttgtttat900
gttaactttggaagcattactgttatgactcctaatcaacttattgaatttgcttgggga960
cttgcaaacagccaacaatcattcttatggatcataagacctgatattgtttcaggtgat1020
gcatcgattcttccccccgaattcgtggaagaaacgaagaagagaggtatgcttgctagt1080
tggtgttcacaagaagaagtacttagtcaccctgcaataggaggattcttgactcacagt1140
ggatggaattcgacactcgaaagtataagcagtggggtgcctatgatttgctggccattt1200
ttcgctgaacagcaaacaaattgttggttttccgtcactaaatgggatgttggaatggag1260
attgactgtgatgtgaagagggatgaagtggaaagccttgtaagggaattgatggttggg1320
ggaaaaggcaaaaagatgaagaaaaaggcaatggaatggaaggaattggctgaagcatct1380
gctaaagaacattcagggtcatcttatgtgaacattgagaaggtggtcaatgatattctt1440
ctttcgtccaaacattaa1458
<210>30
<211>496
<212>prt
<213>udp-糖基转移酶73c3(ntgt4)烟草(udp-glycosyltransferase73c3(ntgt4)nicotianatabacum)
<400>30
metalathrglnvalhislysleuhispheileleupheproleumet
151015
alaproglyhismetileprometileaspilealalysleuleuala
202530
asnargglyvalilethrthrileilethrthrprovalasnalaasn
354045
argpheserserthrilethrargalailelysserglyleuargile
505560
glnileleuthrleulyspheproservalgluvalglyleuproglu
65707580
glycysgluasnileaspmetleuproserleuaspleualaserlys
859095
phephealaalailesermetleulysglnglnvalgluasnleuleu
100105110
gluglyileasnproserprosercysvalileseraspmetglyphe
115120125
protrpthrthrglnilealaglnasnpheasnileproargileval
130135140
phehisglythrcyscyspheserleuleucyssertyrlysileleu
145150155160
serserasnileleugluasnilethrseraspserglutyrpheval
165170175
valproaspleuproaspargvalgluleuthrlysalaglnvalser
180185190
glyserthrlysasnthrthrservalserserservalleulysglu
195200205
valthrgluglnileargleualagluglusersertyrglyvalile
210215220
valasnserpheglugluleugluglnvaltyrglulysglutyrarg
225230235240
lysalaargglylyslysvaltrpcysvalglyprovalserleucys
245250255
asnlysgluilegluaspleuvalthrargglyasnlysthralaile
260265270
aspasnglnaspcysleulystrpleuaspasnphegluthrgluser
275280285
valvaltyralaserleuglyserleuserargleuthrleuleugln
290295300
metvalgluleuglyleuglyleuglugluserasnargpropheval
305310315320
trpvalleuglyglyglyasplysleuasnaspleuglulystrpile
325330335
leugluasnglyphegluglnargilelysgluargglyvalleuile
340345350
argglytrpalaproglnvalleuileleuserhisproalailegly
355360365
glyvalleuthrhiscysglytrpasnserthrleugluglyileser
370375380
alaglyleuprometvalthrtrpproleuphealagluglnphecys
385390395400
asnglulysleuvalvalglnvalleulysileglyvalserleugly
405410415
vallysvalprovallystrpglyaspglugluasnvalglyvalleu
420425430
vallyslysaspaspvallyslysalaleuasplysleumetaspglu
435440445
glyglugluglyglnvalargargthrlysalalysgluleuglyglu
450455460
leualalyslysalapheglygluglyglysersertyrvalasnleu
465470475480
thrserleuilegluaspileilegluglnglnasnhislysglulys
485490495
<210>31
<211>1491
<212>dna
<213>udp-糖基转移酶73c3(ntgt4)烟草(udp-glycosyltransferase73c3(ntgt4)nicotianatabacum)
<400>31
atggcaactcaagtgcacaaacttcatttcatactattccctttaatggctccaggccac60
atgattcctatgatagacatagctaaacttctagcaaatcgcggtgtcattaccactatc120
atcaccactccagtaaacgccaatcgtttcagttcaacaattactcgtgccataaaatcc180
ggtctaagaatccaaattcttacactcaaatttccaagtgtagaagtaggattaccagaa240
ggttgcgaaaatattgacatgcttccttctcttgacttggcttcaaagttttttgctgca300
attagtatgctgaaacaacaagttgaaaatctcttagaaggaataaatccaagtccaagt360
tgtgttatttcagatatgggatttccttggactactcaaattgcacaaaattttaatatc420
ccaagaattgtttttcatggtacttgttgtttctcacttttatgttcctataaaatactt480
tcctccaacattcttgaaaatataacctcagattcagagtattttgttgttcctgattta540
cccgatagagttgaactaacgaaagctcaggtttcaggatcgacgaaaaatactacttct600
gttagttcttctgtattgaaagaagttactgagcaaatcagattagccgaggaatcatca660
tatggtgtaattgttaatagttttgaggagttggagcaagtgtatgagaaagaatatagg720
aaagctagagggaaaaaagtttggtgtgttggtcctgtttctttgtgtaataaggaaatt780
gaagatttggttacaaggggtaataaaactgcaattgataatcaagattgcttgaaatgg840
ttagataattttgaaacagaatctgtggtttatgcaagtcttggaagtttatctcgtttg900
acattattgcaaatggtggaacttggtcttggtttagaagagtcaaataggccttttgta960
tgggtattaggaggaggtgataaattaaatgatttagagaaatggattcttgagaatgga1020
tttgagcaaagaattaaagaaagaggagttttgattagaggatgggctcctcaagtgctt1080
atactttcacaccctgcaattggtggagtattgactcattgcggatggaattctacattg1140
gaaggtatttcagcaggattaccaatggtaacatggccactatttgctgagcaattttgc1200
aatgagaagttagtagtccaagtgctaaaaattggagtgagcctaggtgtgaaggtgcct1260
gtcaaatggggagatgaggaaaatgttggagttttggtaaaaaaggatgatgttaagaaa1320
gcattagacaaactaatggatgaaggagaagaaggacaagtaagaagaacaaaagcaaaa1380
gagttaggagaattggctaaaaaggcatttggagaaggtggttcttcttatgttaactta1440
acatctctgattgaagacatcattgagcaacaaaatcacaaggaaaaatag1491
<210>32
<211>479
<212>prt
<213>糖基转移酶(ntgt1b)烟草(glycosyltransferase(ntgt1b)nicotianatabacum)
<400>32
metlysthralagluleuvalpheileproalaproglymetglyhis
151015
leuvalprothrvalgluvalalalysglnleuvalasparghisglu
202530
glnleuserilethrvalleuilemetthrileproleugluthrasn
354045
ileprosertyrthrlysserleuserserasptyrserserargile
505560
thrleuleuproleuserglnprogluthrservalthrmetserser
65707580
pheasnalaileasnphepheglutyrilesersertyrlysglyarg
859095
vallysaspalavalsergluthrserpheserserserasnserval
100105110
lysleualaglyphevalileaspmetphecysthralametileasp
115120125
valalaasnglupheglyileprosertyrvalphetyrthrserser
130135140
alaalametleuglyleuglnleuhispheglnserleuserileglu
145150155160
cysserprolysvalhisasntyrvalgluproglusergluvalleu
165170175
ileserthrtyrmetasnprovalprovallyscysleuproglyile
180185190
ileleuvalasnaspgluserserthrmetphevalasnhisalaarg
195200205
argphearggluthrlysglyilemetvalasnthrphethrgluleu
210215220
gluserhisalaleulysalaleuseraspaspglulysilepropro
225230235240
iletyrprovalglyproileleuasnleugluasnglyasngluasp
245250255
hisasnglnglutyraspalailemetlystrpleuaspglulyspro
260265270
asnserservalvalpheleucyspheglyserlysglyserpheglu
275280285
gluaspglnvallysgluilealaasnalaleugluserserglytyr
290295300
hispheleutrpserleuargargproproprolysasplysleugln
305310315320
pheprosergluphegluasnproglugluvalleuprogluglyphe
325330335
pheglnargthrlysglyargglylysvalileglytrpalaprogln
340345350
leualaileleuserhisproservalglyglyphevalserhiscys
355360365
glytrpasnserthrleugluservalargserglyvalproileala
370375380
thrtrpproleutyralagluglnglnserasnalapheglnleuval
385390395400
lysaspleuglymetalavalgluilelysmetasptyrarggluasp
405410415
pheasnthrargasnproproleuvallysalaglugluilegluasp
420425430
glyilearglysleumetaspsergluasnlysileargalalysval
435440445
thrglumetlysasplysserargalaalaleuleugluglyglyser
450455460
sertyrvalalaleuglyhisphevalgluthrvalmetlysasn
465470475
<210>33
<211>1440
<212>dna
<213>糖基转移酶(ntgt1b)烟草(glycosyltransferase(ntgt1b)nicotianatabacum)
<400>33
atgaagacagcagagttagtattcattcctgctcctgggatgggtcaccttgtaccaact60
gtggaggtggcaaagcaactagtcgacagacacgagcagctttcgatcacagttctaatc120
atgacaattcctttggaaacaaatattccatcatatactaaatcactgtcctcagactac180
agttctcgtataacgctgcttccactctctcaacctgagacctctgttactatgagcagt240
tttaatgccatcaatttttttgagtacatctccagctacaagggtcgtgtcaaagatgct300
gttagtgaaacctcctttagttcgtcaaattctgtgaaacttgcaggatttgtaatagac360
atgttctgcactgcgatgattgatgtagcgaacgagtttggaatcccaagttatgtgttc420
tacacttctagtgcagctatgcttggactacaactgcattttcaaagtcttagcattgaa480
tgcagtccgaaagttcataactacgttgaacctgaatcagaagttctgatctcaacttac540
atgaatccggttccagtcaaatgtttgcccggaattatactagtaaatgatgaaagtagc600
accatgtttgtcaatcatgcacgaagattcagggagacgaaaggaattatggtgaacacg660
ttcactgagcttgaatcacacgctttgaaagccctttccgatgatgaaaaaatcccacca720
atctacccagttggacctatacttaaccttgaaaatgggaatgaagatcacaatcaagaa780
tatgatgcgattatgaagtggcttgacgagaagcctaattcatcagtggtgttcttatgc840
tttggaagcaaggggtctttcgaagaagatcaggtgaaggaaatagcaaatgctctagag900
agcagtggctaccacttcttgtggtcgctaaggcgaccgccaccaaaagacaagctacaa960
ttcccaagcgaattcgagaatccagaggaagtcttaccagagggattctttcaaaggact1020
aaaggaagaggaaaggtgataggatgggcaccccagttggctattttgtctcatccttca1080
gtaggaggattcgtgtcgcattgtgggtggaattcaactctggagagcgttcgaagtgga1140
gtgccgatagcaacatggccattgtatgcagagcaacagagcaatgcatttcaactggtg1200
aaggatttgggtatggcagtagagattaagatggattacagggaagattttaatacgaga1260
aatccaccactggttaaagctgaggagatagaagatggaattaggaagctgatggattca1320
gagaataaaatcagggctaaggtgacggagatgaaggacaaaagtagagcagcactgctg1380
gagggcggatcatcatatgtagctcttgggcattttgttgagactgtcatgaaaaactag1440
<210>34
<211>478
<212>prt
<213>糖基转移酶(ntgt1a)烟草(glycosyltransferase(ntgt1a)nicotianatabacum)
<400>34
metlysthrthrgluleuvalpheileproalaproglymetglyhis
151015
leuvalprothrvalgluvalalalysglnleuvalaspargaspglu
202530
glnleuserilethrvalleuilemetthrleuproleugluthrasn
354045
ileprosertyrthrlysserleuserserasptyrserserargile
505560
thrleuleuglnleuserglnprogluthrservalsermetserser
65707580
pheasnalaileasnphepheglutyrilesersertyrlysasparg
859095
vallysaspalavalasngluthrpheserserserserservallys
100105110
leulysglyphevalileaspmetphecysthralametileaspval
115120125
alaasnglupheglyileprosertyrvalphetyrthrserasnala
130135140
alametleuglyleuglnleuhispheglnserleuserileglutyr
145150155160
serprolysvalhisasntyrleuaspproglusergluvalalaile
165170175
serthrtyrileasnproileprovallyscysleuproglyileile
180185190
leuaspasnasplysserglythrmetphevalasnhisalaargarg
195200205
phearggluthrlysglyilemetvalasnthrphealagluleuglu
210215220
serhisalaleulysalaleuseraspaspglulysileproproile
225230235240
tyrprovalglyproileleuasnleuglyaspglyasngluasphis
245250255
asnglnglutyraspmetilemetlystrpleuaspgluglnprohis
260265270
serservalvalpheleucyspheglyserlysglyserphegluglu
275280285
aspglnvallysgluilealaasnalaleugluargserglyasnarg
290295300
pheleutrpserleuargargproproprolysaspthrleuglnphe
305310315320
prosergluphegluasnproglugluvalleuprovalglyphephe
325330335
glnargthrlysglyargglylysvalileglytrpalaproglnleu
340345350
alaileleuserhisproalavalglyglyphevalserhiscysgly
355360365
trpasnserthrleugluservalargserglyvalproilealathr
370375380
trpproleutyralagluglnglnserasnalapheglnleuvallys
385390395400
aspleuglymetalavalgluilelysmetasptyrarggluaspphe
405410415
asnlysthrasnproproleuvallysalaglugluilegluaspgly
420425430
ilearglysleumetaspsergluasnlysileargalalysvalmet
435440445
glumetlysasplysserargalaalaleuleugluglyglyserser
450455460
tyrvalalaleuglyhisphevalgluthrvalmetlysasn
465470475
<210>35
<211>1437
<212>dna
<213>糖基转移酶(ntgt1a)烟草(glycosyltransferase(ntgt1a)nicotianatabacum)
<400>35
atgaagacaacagagttagtattcattcctgctcctggcatgggtcaccttgtacccact60
gtggaggtggcaaagcaactagtcgacagagacgaacagctttcaatcacagttctcatc120
atgacgcttcctttggaaacaaatattccatcatatactaaatcactgtcctcagactac180
agttctcgtataacgctgcttcaactttctcaacctgagacctctgttagtatgagcagt240
tttaatgccatcaatttttttgagtacatctccagctacaaggatcgtgtcaaagatgct300
gttaatgaaacctttagttcgtcaagttctgtgaaactcaaaggatttgtaatagacatg360
ttctgcactgcgatgattgatgtggcgaacgagtttggaatcccaagttatgtcttctac420
acttctaatgcagctatgcttggactccaactccattttcaaagtcttagtattgaatac480
agtccgaaagttcataattacctagaccctgaatcagaagtagcgatctcaacttacatt540
aatccgattccagtcaaatgtttgcccgggattatactagacaatgataaaagtggcacc600
atgttcgtcaatcatgcacgaagattcagggagacgaaaggaattatggtgaacacattc660
gctgagcttgaatcacacgctttgaaagccctttccgatgatgagaaaatcccaccaatc720
tacccagttgggcctatacttaaccttggagatgggaatgaagatcacaatcaagaatat780
gatatgattatgaagtggctcgacgagcagcctcattcatcagtggtgttcctatgcttt840
ggaagcaagggatctttcgaagaagatcaagtgaaggaaatagcaaatgctctagagaga900
agtggtaaccggttcttgtggtcgctaagacgaccgccaccaaaagacacgctacaattc960
ccaagcgaattcgagaatccagaggaagtcttgccggtgggattctttcaaaggactaaa1020
ggaagaggaaaggtgataggatgggcaccccagttggctattttgtctcatcctgcagta1080
ggaggattcgtgtcgcattgtgggtggaattcaactttggagagtgttcgtagtggagta1140
ccgatagcaacatggccattgtatgcagagcaacagagcaatgcatttcaactggtgaag1200
gatttggggatggcagtggagattaagatggattacagggaagattttaataagacaaat1260
ccaccactggttaaagctgaggagatagaagatggaattaggaagctgatggattcagag1320
aataaaatcagggctaaggtgatggagatgaaggacaaaagtagagcagcgttattagaa1380
ggcggatcatcatatgtagctctcgggcattttgttgagactgtcatgaaaaactaa1437
<210>36
<211>482
<212>prt
<213>糖基转移酶(ntgt3)烟草(glycosyltransferase(ntgt3)nicotianatabacum)
<400>36
metlysgluthrlyslysilegluleuvalpheileproserprogly
151015
ileglyhisleuvalserthrvalglumetalalysleuleuileala
202530
argglugluglnleuserilethrvalleuileileglntrpproasn
354045
asplyslysleuaspsertyrileglnservalalaasnpheserser
505560
argleulyspheileargleuproglnaspaspserilemetglnleu
65707580
leulysserasnilephethrthrpheilealaserhislysproala
859095
valargaspalavalalaaspileleulyssergluserasnasnthr
100105110
leualaglyilevalileaspleuphecysthrsermetileaspval
115120125
alaasngluphegluleuprothrtyrvalphetyrthrserglyala
130135140
alathrleuglyleuhistyrhisileglnasnleuargaspgluphe
145150155160
asnlysaspilethrlystyrlysaspgluprogluglulysleuser
165170175
ilealathrtyrleuasnpropheproalalyscysleuproserval
180185190
alaleuasplysgluglyglyserthrmetpheleuaspleualalys
195200205
argphearggluthrlysglyilemetileasnthrpheleugluleu
210215220
glusertyralaleuasnserleuserargasplysasnleupropro
225230235240
iletyrprovalglyprovalleuasnleuasnasnvalgluglyasp
245250255
asnleuglyserseraspglnasnthrmetlystrpleuaspaspgln
260265270
proalaserservalvalpheleucyspheglyserglyglyserphe
275280285
glulyshisglnvallysgluilealatyralaleuglusersergly
290295300
cysargpheleutrpserleuargargproprothrgluaspalaarg
305310315320
pheproserasntyrgluasnleuglugluileleuprogluglyphe
325330335
leugluargthrlysglyileglylysvalileglytrpalaprogln
340345350
leualaileleuserhislysserthrglyglyphevalserhiscys
355360365
glytrpasnserthrleugluserthrtyrpheglyvalproileala
370375380
thrtrppromettyralagluglnglnalaasnalapheglnleuval
385390395400
lysaspleuargmetglyvalgluilelysmetasptyrarglysasp
405410415
metlysvalmetglylysgluvalilevallysalaglugluileglu
420425430
lysalailearggluilemetaspserglusergluileargvallys
435440445
vallysglumetlysglulysserargalaalaglnmetgluglygly
450455460
sersertyrthrserileglyglypheileglnileilemetgluasn
465470475480
sergln
<210>37
<211>1449
<212>dna
<213>糖基转移酶(ntgt3)烟草(glycosyltransferase(ntgt3)nicotianatabacum)
<400>37
atgaaagaaaccaagaaaatagagttagtcttcattccttcaccaggaattggccattta60
gtatccacagttgaaatggcaaagcttcttatagctagagaagagcagctatctatcaca120
gtcctcatcatccaatggcctaacgacaagaagctcgattcttatatccaatcagtcgcc180
aatttcagctcgcgtttgaaattcattcgactccctcaggatgattccattatgcagcta240
ctcaaaagcaacattttcaccacgtttattgccagtcataagcctgcagttagagatgct300
gttgctgatattctcaagtcagaatcaaataatacgctagcaggtattgttatcgacttg360
ttctgcacctcaatgatagacgtggccaatgagttcgagctaccaacctatgttttctac420
acgtctggtgcagcaacccttggtcttcattatcatatacagaatctcagggatgaattt480
aacaaagatattaccaagtacaaagacgaacctgaagaaaaactctctatagcaacatat540
ctcaatccatttccagcaaaatgtttgccgtctgtagccttagacaaagaaggtggttca600
acaatgtttcttgatctcgcaaaaaggtttcgagaaaccaaaggtattatgataaacaca660
tttctagagctcgaatcctatgcattaaactcgctctcacgagacaagaatcttccacct720
atataccctgtcggaccagtattgaaccttaacaatgttgaaggtgacaacttaggttca780
tctgaccagaatactatgaaatggttagatgatcagcccgcttcatctgtagtgttcctt840
tgttttggtagtggtggaagctttgaaaaacatcaagttaaggaaatagcctatgctctg900
gagagcagtgggtgtcggtttttgtggtcgttaaggcgaccaccaaccgaagatgcaaga960
tttccaagcaactatgaaaatcttgaagaaattttgccagaaggattcttggaaagaaca1020
aaagggattggaaaagtgataggatgggcacctcagttggcgattttgtcacataaatcg1080
acggggggatttgtgtcgcactgtggatggaattcgactttggaaagtacatattttgga1140
gtgccaatagcaacctggccaatgtacgcggagcaacaagcgaatgcatttcaattggtt1200
aaggatttgagaatgggagttgagattaagatggattataggaaggatatgaaagtgatg1260
ggcaaagaagttatagtgaaagctgaggagattgagaaagcaataagagaaattatggat1320
tccgagagtgaaattcgggtgaaggtgaaagagatgaaggagaagagcagagcagcacaa1380
atggaaggtggctcttcttacacttctattggaggtttcatccaaattatcatggagaat1440
tctcaataa1449
<210>38
<211>470
<212>prt
<213>糖基转移酶(ntgt2)烟草(glycosyltransferase(ntgt2)nicotianatabacum)
<400>38
metvalglnprohisvalleuleuvalthrpheproalaglnglyhis
151015
ileasnprocysleuglnphealalysargleuileargmetglyile
202530
gluvalthrphealathrservalphealahisargargmetalalys
354045
thrthrthrserthrleuserlysglyleuasnphealaalapheser
505560
aspglytyraspaspglyphelysalaaspgluhisaspserglnhis
65707580
tyrmetsergluilelysserargglyserlysthrleulysaspile
859095
ileleulysserseraspgluglyargprovalthrserleuvaltyr
100105110
serleuleuleuprotrpalaalalysvalalaarggluphehisile
115120125
procysalaleuleutrpileglnproalathrvalleuaspiletyr
130135140
tyrtyrtyrpheasnglytyrgluaspalailelysglyserthrasn
145150155160
aspproasntrpcysileglnleuproargleuproleuleulysser
165170175
glnaspleuproserpheleuleuserserserasngluglulystyr
180185190
serphealaleuprothrphelysgluglnleuaspthrleuaspval
195200205
glugluasnprolysvalleuvalasnthrpheaspalaleuglupro
210215220
lysgluleulysalaileglulystyrasnleuileglyileglypro
225230235240
leuileproserthrpheleuaspglylysaspproleuaspserser
245250255
pheglyglyaspleupheglnlysserasnasptyrileglutrpleu
260265270
asnserlysalaasnserservalvaltyrileserpheglyserleu
275280285
leuasnleuserlysasnglnlysglugluilealalysglyleuile
290295300
gluilelyslyspropheleutrpvalileargaspglngluasngly
305310315320
lysglyaspglulysgluglulysleusercysmetmetgluleuglu
325330335
lysglnglylysilevalprotrpcysserglnleugluvalleuthr
340345350
hisproserileglycysphevalserhiscysglytrpasnserthr
355360365
leugluserleuserserglyvalservalvalalapheprohistrp
370375380
thraspglnglythrasnalalysleuilegluaspvaltrplysthr
385390395400
glyvalargleulyslysasngluaspglyvalvalglusergluglu
405410415
ilelysargcysileglumetvalmetaspglyglyglulysglyglu
420425430
glumetargargasnalaglnlystrplysgluleualaarggluala
435440445
vallysgluglyglyserserglumetasnleulysalaphevalgln
450455460
gluvalglylysglycys
465470
<210>39
<211>1413
<212>dna
<213>糖基转移酶(ntgt2)烟草(glycosyltransferase(ntgt2)nicotianatabacum)
<400>39
atggtgcaaccccatgtcctcttggtgacttttccagcacaaggccatattaatccatgt60
ctccaatttgccaagaggctaattagaatgggcattgaggtaacttttgccacgagcgtt120
ttcgcccatcgtcgtatggcaaaaactacgacttccactctatccaagggcttaaatttt180
gcggcattctctgatgggtacgacgatggtttcaaggccgatgagcatgattctcaacat240
tacatgtcggagataaaaagtcgcggttctaaaaccctaaaagatatcattttgaagagc300
tcagacgagggacgtcctgtgacatccctcgtctattctcttttgcttccatgggctgca360
aaggtagcgcgtgaatttcacataccgtgcgcgttactatggattcaaccagcaactgtg420
ctagacatatattattattacttcaatggctatgaggatgccataaaaggtagcaccaat480
gatccaaattggtgtattcaattgcctaggcttccactactaaaaagccaagatcttcct540
tcttttttactttcttctagtaatgaagaaaaatatagctttgctctaccaacatttaaa600
gagcaacttgacacattagatgttgaagaaaatcctaaagtacttgtgaacacatttgat660
gcattagagccaaaggaactcaaagctattgaaaagtacaatttaattgggattggacca720
ttgattccttcaacatttttggacggaaaagaccctttggattcttcctttggtggtgat780
ctttttcaaaagtctaatgactatattgaatggttgaactcaaaggctaactcatctgtg840
gtttatatctcatttgggagtctcttgaatttgtcaaaaaatcaaaaggaggagattgca900
aaagggttgatagagattaaaaagccattcttgtgggtaataagagatcaagaaaatggt960
aagggagatgaaaaagaagagaaattaagttgtatgatggagttggaaaagcaagggaaa1020
atagtaccatggtgttcacaacttgaagtcttaacacatccatctataggatgtttcgtg1080
tcacattgtggatggaattcgactctggaaagtttatcgtcaggcgtgtcagtagtggca1140
tttcctcattggacggatcaagggacaaatgctaaactaattgaagatgtttggaagaca1200
ggtgtaaggttgaaaaagaatgaagatggtgtggttgagagtgaagagataaaaaggtgc1260
atagaaatggtaatggatggtggagagaaaggagaagaaatgagaagaaatgctcaaaaa1320
tggaaagaattggcaagggaagctgtaaaagaaggcggatcttcggaaatgaatctaaaa1380
gcttttgttcaagaagttggcaaaggttgctga1413
<210>40
<211>28
<212>prt
<213>thca合酶毛状体靶向结构域大麻(thcasynthasetrichometargetingdomaincannabis)
<400>40
metasncysseralapheserphetrpphevalcyslysileilephe
151015
phepheleuserphehisileglnileserileala
2025
<210>41
<211>28
<212>prt
<213>cbda合酶毛状体靶向结构域大麻(cbdasynthasetrichometargestingdomaincannabis)
<400>41
metlyscysserthrpheserphetrpphevalcyslysileilephe
151015
phephepheserpheasnileglnthrserileala
2025
<210>42
<211>545
<212>prt
<213>thca合酶大麻(thcasynthasecannabis)
<400>42
metasncysseralapheserphetrpphevalcyslysileilephe
151015
phepheleuserphehisileglnileserilealaasnproargglu
202530
asnpheleulyscyspheserlyshisileproasnasnvalalaasn
354045
prolysleuvaltyrthrglnhisaspglnleutyrmetserileleu
505560
asnserthrileglnasnleuargpheileseraspthrthrprolys
65707580
proleuvalilevalthrproserasnasnserhisileglnalathr
859095
ileleucysserlyslysvalglyleuglnileargthrargsergly
100105110
glyhisaspalagluglymetsertyrileserglnvalpropheval
115120125
valvalaspleuargasnmethisserilelysileaspvalhisser
130135140
glnthralatrpvalglualaglyalathrleuglygluvaltyrtyr
145150155160
trpileasnglulysasngluasnleuserpheproglyglytyrcys
165170175
prothrvalglyvalglyglyhispheserglyglyglytyrglyala
180185190
leumetargasntyrglyleualaalaaspasnileileaspalahis
195200205
leuvalasnvalaspglylysvalleuasparglyssermetglyglu
210215220
aspleuphetrpalaileargglyglyglyglygluasnpheglyile
225230235240
ilealaalatrplysilelysleuvalaspvalproserlysserthr
245250255
ilepheservallyslysasnmetgluilehisglyleuvallysleu
260265270
pheasnlystrpglnasnilealatyrlystyrasplysaspleuval
275280285
leumetthrhispheilethrlysasnilethraspasnhisglylys
290295300
asnlysthrthrvalhisglytyrpheserserilephehisglygly
305310315320
valaspserleuvalaspleumetasnlysserpheprogluleugly
325330335
ilelyslysthraspcyslysgluphesertrpileaspthrthrile
340345350
phetyrserglyvalvalasnpheasnthralaasnphelyslysglu
355360365
ileleuleuaspargseralaglylyslysthralapheserilelys
370375380
leuasptyrvallyslysproileprogluthralametvallysile
385390395400
leuglulysleutyrglugluaspvalglyalaglymettyrvalleu
405410415
tyrprotyrglyglyilemetglugluilesergluseralailepro
420425430
pheprohisargalaglyilemettyrgluleutrptyrthralaser
435440445
trpglulysglngluaspasnglulyshisileasntrpvalargser
450455460
valtyrasnphethrthrprotyrvalserglnasnproargleuala
465470475480
tyrleuasntyrargaspleuaspleuglylysthrasnhisalaser
485490495
proasnasntyrthrglnalaargiletrpglyglulystyrphegly
500505510
lysasnpheasnargleuvallysvallysthrlysvalaspproasn
515520525
asnphepheargasngluglnserileproproleuproprohishis
530535540
his
545
<210>43
<211>462
<212>prt
<213>can738啤酒花的myb8同源物(myb8-orthologueforcan738humuluslupulus)
<400>43
metglyargalaprocyscysglulysvalglyleulyslysglyarg
151015
trpthrserglugluaspgluileleuthrlystyrileglnserasn
202530
glygluglycystrpargserleuprolysasnalaglyleuleuarg
354045
cysglylyssercysargleuargtrpileasntyrleuargalaasp
505560
leulysargglyasnilesersergluglugluaspileileilelys
65707580
leuhisserthrleuglyasnargtrpserleuilealaserhisleu
859095
proglyargthraspasngluilelysasntyrtrpasnserhisleu
100105110
serarglysilehisthrpheargargcysasnasnthrthrthrhis
115120125
hishishisleuproasnleuvalthrvalthrlysvalasnleupro
130135140
ileprolysarglysglyglyargthrserargleualametlyslys
145150155160
asnlysserserthrserasnglnasnserservalilelysasnasp
165170175
valglyserserserserthrthrthrthrservalhisglnargthr
180185190
thrthrthrthrprothrmetaspaspglnglnlysargglnleuser
195200205
argcysargleugluglulysgluaspglnaspglyalaserthrgly
210215220
thrvalvalmetmetleuglyglnalaalaalavalglysersercys
225230235240
aspgluaspmetleuglyhisaspglnleuserpheleucyscysser
245250255
gluglulysthrthrgluasnsermetthrasnleulysgluasngly
260265270
asphisgluvalserglyprotyrasptyrasphisargtyrglulys
275280285
gluthrservalaspgluglymetleuleucyspheasnaspileile
290295300
aspserasnleuleuasnproasngluvalleuthrleusergluglu
305310315320
serleuasnleuglyglyalaleumetaspthrthrthrserthrthr
325330335
thrasnasnasnasntyrserleusertyrasnasnasnglyaspcys
340345350
valileseraspasphisaspglntyrtrpleuaspaspvalvalgly
355360365
valaspphetrpsertrpgluserserthrthrvalthrglnglugln
370375380
gluglngluglngluglngluglngluglngluglngluglnglugln
385390395400
gluglngluhishishisglnglnaspglnlyslysasnthrtrpasp
405410415
asnglulysglulysmetleualaleuleutrpaspseraspasnser
420425430
asntrpgluleuglnaspasnasnasntyrhislyscysglngluile
435440445
thrserasplysgluasnalametvalalatrpleuleuser
450455460
<210>44
<211>371
<212>prt
<213>can739拟南芥的myb12同源物(atmyb12-orthologueforcan739arabidopsisthaliana)
<400>44
metglyargalaprocyscysglulysvalglyilelysargglyarg
151015
trpthralaglugluaspglnileleuserasntyrileglnserasn
202530
glygluglysertrpargserleuprolysasnalaglyleulysarg
354045
cysglylyssercysargleuargtrpileasntyrleuargserasp
505560
leulysargglyasnilethrproglugluglugluleuvalvallys
65707580
leuhisserthrleuglyasnargtrpserleuilealaglyhisleu
859095
proglyargthraspasngluilelysasntyrtrpasnserhisleu
100105110
serarglysleuhisasnpheilearglysproserileserglnasp
115120125
valseralavalilemetthrasnalaserseralapropropropro
130135140
glnalalysargargleuglyargthrserargseralametlyspro
145150155160
lysilehisargthrlysthrarglysthrlyslysthrseralapro
165170175
progluproasnalaaspvalalaglyalaasplysglualaleumet
180185190
valgluserserglyalaglualagluleuglyargprocysasptyr
195200205
tyrglyaspaspcysasnlysasnleumetserileasnglyaspasn
210215220
glyvalleuthrpheaspaspaspileileaspleuleuleuaspglu
225230235240
seraspproglyhisleutyrthrasnthrthrcysglyglyaspgly
245250255
gluleuhisasnileargaspsergluglyalaargglypheserasp
260265270
thrtrpasnglnglyasnleuaspcysleuleuglnsercysproser
275280285
valgluserpheleuasntyrasphisglnvalasnaspalaserthr
290295300
aspglupheileasptrpaspcysvaltrpglngluglyseraspasn
305310315320
asnleutrphisglulysgluasnproaspsermetvalsertrpleu
325330335
leuaspglyaspaspglualathrileglyasnserasncysgluasn
340345350
pheglygluproleuasphisaspaspgluseralaleuvalalatrp
355360365
leuleuser
370
<210>45
<211>243
<212>prt
<213>can833拟南芥的myb112同源物(myb112-orthologueforcan833arabidopsisthaliana)
<400>45
metasnileserargthrgluphealaasncyslysthrleuileasn
151015
hislysglugluvalglugluvalglulyslysmetgluilegluile
202530
argargglyprotrpthrvalglugluaspmetlysleuvalsertyr
354045
ileserleuhisglygluglyargtrpasnserleuserargserala
505560
glyleuasnargthrglylyssercysargleuargtrpleuasntyr
65707580
leuargproaspileargargglyaspileserleuglngluglnphe
859095
ileileleugluleuhisserargtrpglyasnargtrpserlysile
100105110
alaglnhisleuproglyargthraspasngluilelysasntyrtrp
115120125
argthrargvalglnlyshisalalysleuleulyscysaspvalasn
130135140
serlysglnphelysaspthrilelyshisleutrpmetproargleu
145150155160
ilegluargilealaalathrglnservalglnphethrserasnhis
165170175
tyrserprogluasnserservalalathralathrserserthrser
180185190
serserglualavalargserserphetyrglyglyaspglnvalglu
195200205
pheglythrleuasphismetthrasnglyglytyrtrppheasngly
210215220
glyaspthrphegluthrleucysserpheaspgluleuasnlystrp
225230235240
leuilegln
<210>46
<211>517
<212>prt
<213>细胞溶质靶向thca合酶(ctthca)大麻(cytosolictargetedthcasynthase(ctthcas)cannabis)
<400>46
asnproarggluasnpheleulyscyspheserlyshisileproasn
151015
asnvalalaasnprolysleuvaltyrthrglnhisaspglnleutyr
202530
metserileleuasnserthrileglnasnleuargpheileserasp
354045
thrthrprolysproleuvalilevalthrproserasnasnserhis
505560
ileglnalathrileleucysserlyslysvalglyleuglnilearg
65707580
thrargserglyglyhisaspalagluglymetsertyrilesergln
859095
valprophevalvalvalaspleuargasnmethisserilelysile
100105110
aspvalhisserglnthralatrpvalglualaglyalathrleugly
115120125
gluvaltyrtyrtrpileasnglulysasngluasnleuserphepro
130135140
glyglytyrcysprothrvalglyvalglyglyhispheserglygly
145150155160
glytyrglyalaleumetargasntyrglyleualaalaaspasnile
165170175
ileaspalahisleuvalasnvalaspglylysvalleuasparglys
180185190
sermetglygluaspleuphetrpalaileargglyglyglyglyglu
195200205
asnpheglyileilealaalatrplysilelysleuvalaspvalpro
210215220
serlysserthrilepheservallyslysasnmetgluilehisgly
225230235240
leuvallysleupheasnlystrpglnasnilealatyrlystyrasp
245250255
lysaspleuvalleumetthrhispheilethrlysasnilethrasp
260265270
asnhisglylysasnlysthrthrvalhisglytyrpheserserile
275280285
phehisglyglyvalaspserleuvalaspleumetasnlysserphe
290295300
progluleuglyilelyslysthraspcyslysgluphesertrpile
305310315320
aspthrthrilephetyrserglyvalvalasnpheasnthralaasn
325330335
phelyslysgluileleuleuaspargseralaglylyslysthrala
340345350
pheserilelysleuasptyrvallyslysproileprogluthrala
355360365
metvallysileleuglulysleutyrglugluaspvalglyalagly
370375380
mettyrvalleutyrprotyrglyglyilemetglugluileserglu
385390395400
seralailepropheprohisargalaglyilemettyrgluleutrp
405410415
tyrthralasertrpglulysglngluaspasnglulyshisileasn
420425430
trpvalargservaltyrasnphethrthrprotyrvalserglnasn
435440445
proargleualatyrleuasntyrargaspleuaspleuglylysthr
450455460
asnhisalaserproasnasntyrthrglnalaargiletrpglyglu
465470475480
lystyrpheglylysasnpheasnargleuvallysvallysthrlys
485490495
valaspproasnasnphepheargasngluglnserileproproleu
500505510
proprohishishis
515
<210>47
<211>520
<212>prt
<213>具有thca合酶毛状体靶向结构域的毛状体靶向过氧化氢酶拟南芥(trichometargetedcatalasewiththcasynthasetrichometargetingdomainarabidopsisthaliana)
<400>47
metasncysseralapheserphetrpphevalcyslysileilephe
151015
phepheleuserphehisileglnileserilealametaspprotyr
202530
lystyrargproalasersertyrasnserprophephethrthrasn
354045
serglyalaprovaltrpasnasnasnsersermetthrvalglypro
505560
argglyleuileleuleugluasptyrhisleuvalglulysleuala
65707580
asnpheasparggluargileprogluargvalvalhisalaarggly
859095
alaseralalysglyphephegluvalthrhisaspileserasnleu
100105110
thrcysalaasppheleuargalaproglyvalglnthrprovalile
115120125
valargpheserthrvalilehisalaargglyserprogluthrleu
130135140
argaspproargglyphealavallysphetyrthrarggluglyasn
145150155160
pheaspleuvalglyasnasnpheprovalphepheileargaspgly
165170175
metlyspheproaspilevalhisalaleulysproasnprolysser
180185190
hisileglngluasntrpargileleuaspphepheserhishispro
195200205
gluserleuasnmetphethrpheleupheaspaspileglyilepro
210215220
glnasptyrarghismetaspglyserglyvalasnthrtyrmetleu
225230235240
ileasnlysalaglylysalahistyrvallysphehistrplyspro
245250255
thrcysglyvallysserleuleuglugluaspalaileargleugly
260265270
glythrasnhisserhisalathrglnaspleutyraspserileala
275280285
alaglyasntyrproglutrplysleupheileglnileileasppro
290295300
alaaspgluasplyspheasppheaspproleuaspvalthrlysthr
305310315320
trpprogluaspileleuproleuglnprovalglyargmetvalleu
325330335
asnlysasnileaspasnphephealagluasngluglnleualaphe
340345350
cysproalaileilevalproglyilehistyrseraspasplysleu
355360365
leuglnthrargvalphesertyralaaspthrglnarghisargleu
370375380
glyproasntyrleuglnleuprovalasnalaprolyscysalahis
385390395400
hisasnasnhishisgluglyphemetasnphemethisargaspglu
405410415
gluvalasntyrpheproserargtyraspglnvalarghisalaglu
420425430
lystyrprothrproproalavalcysserglylysarggluargcys
435440445
ileileglulysgluasnasnphelysgluproglygluargtyrarg
450455460
thrphethrprogluargglngluargpheileglnargtrpileasp
465470475480
alaleuseraspproargilethrhisgluileargseriletrpile
485490495
sertyrtrpserglnalaasplysserleuglyglnlysleualaser
500505510
argleuasnvalargproserile
515520
<210>48
<211>520
<212>prt
<213>具有cbda合酶毛状体靶向结构域的毛状体靶向过氧化氢酶拟南芥(trichometargetedcatalasewithcbdasynthasetrichometargetingdomainarabidopsisthaliana)
<400>48
metlyscysserthrpheserphetrpphevalcyslysileilephe
151015
phephepheserpheasnileglnthrserilealametaspprotyr
202530
lystyrargproalasersertyrasnserprophephethrthrasn
354045
serglyalaprovaltrpasnasnasnsersermetthrvalglypro
505560
argglyleuileleuleugluasptyrhisleuvalglulysleuala
65707580
asnpheasparggluargileprogluargvalvalhisalaarggly
859095
alaseralalysglyphephegluvalthrhisaspileserasnleu
100105110
thrcysalaasppheleuargalaproglyvalglnthrprovalile
115120125
valargpheserthrvalilehisalaargglyserprogluthrleu
130135140
argaspproargglyphealavallysphetyrthrarggluglyasn
145150155160
pheaspleuvalglyasnasnpheprovalphepheileargaspgly
165170175
metlyspheproaspilevalhisalaleulysproasnprolysser
180185190
hisileglngluasntrpargileleuaspphepheserhishispro
195200205
gluserleuasnmetphethrpheleupheaspaspileglyilepro
210215220
glnasptyrarghismetaspglyserglyvalasnthrtyrmetleu
225230235240
ileasnlysalaglylysalahistyrvallysphehistrplyspro
245250255
thrcysglyvallysserleuleuglugluaspalaileargleugly
260265270
glythrasnhisserhisalathrglnaspleutyraspserileala
275280285
alaglyasntyrproglutrplysleupheileglnileileasppro
290295300
alaaspgluasplyspheasppheaspproleuaspvalthrlysthr
305310315320
trpprogluaspileleuproleuglnprovalglyargmetvalleu
325330335
asnlysasnileaspasnphephealagluasngluglnleualaphe
340345350
cysproalaileilevalproglyilehistyrseraspasplysleu
355360365
leuglnthrargvalphesertyralaaspthrglnarghisargleu
370375380
glyproasntyrleuglnleuprovalasnalaprolyscysalahis
385390395400
hisasnasnhishisgluglyphemetasnphemethisargaspglu
405410415
gluvalasntyrpheproserargtyraspglnvalarghisalaglu
420425430
lystyrprothrproproalavalcysserglylysarggluargcys
435440445
ileileglulysgluasnasnphelysgluproglygluargtyrarg
450455460
thrphethrprogluargglngluargpheileglnargtrpileasp
465470475480
alaleuseraspproargilethrhisgluileargseriletrpile
485490495
sertyrtrpserglnalaasplysserleuglyglnlysleualaser
500505510
argleuasnvalargproserile
515520
<210>49
<211>781
<212>prt
<213>具有thca合酶毛状体靶向结构域的过氧化氢酶hpii(kate)大肠杆菌(catalasehpii(kate)withthcasynthasetrichometargetingdomainescherichiacoli)
<400>49
metasncysseralapheserphetrpphevalcyslysileilephe
151015
phepheleuserphehisileglnileserilealametserglnhis
202530
asnglulysasnprohisglnhisglnserproleuhisaspserser
354045
glualalysproglymetaspserleualaprogluaspglyserhis
505560
argproalaalagluprothrproproglyalaglnprothralapro
65707580
glyserleulysalaproaspthrargasnglulysleuasnserleu
859095
gluaspvalarglysglysergluasntyralaleuthrthrasngln
100105110
glyvalargilealaaspaspglnasnserleuargalaglyserarg
115120125
glyprothrleuleugluasppheileleuargglulysilethrhis
130135140
pheasphisgluargileprogluargilevalhisalaargglyser
145150155160
alaalahisglytyrpheglnprotyrlysserleuseraspilethr
165170175
lysalaasppheleuseraspproasnlysilethrprovalpheval
180185190
argpheserthrvalglnglyglyalaglyseralaaspthrvalarg
195200205
aspileargglyphealathrlysphetyrthrglugluglyilephe
210215220
aspleuvalglyasnasnthrproilephepheileglnaspalahis
225230235240
lyspheproaspphevalhisalavallysprogluprohistrpala
245250255
ileproglnglyglnseralahisaspthrphetrpasptyrvalser
260265270
leuglnprogluthrleuhisasnvalmettrpalametserasparg
275280285
glyileproargsertyrargthrmetgluglypheglyilehisthr
290295300
pheargleuileasnalagluglylysalathrphevalargphehis
305310315320
trplysproleualaglylysalaserleuvaltrpaspglualagln
325330335
lysleuthrglyargaspproaspphehisargarggluleutrpglu
340345350
alaileglualaglyasppheproglutyrgluleuglypheglnleu
355360365
ileproglugluaspgluphelyspheasppheaspleuleuasppro
370375380
thrlysleuileproglugluleuvalprovalglnargvalglylys
385390395400
metvalleuasnargasnproaspasnphephealagluasnglugln
405410415
alaalaphehisproglyhisilevalproglyleuaspphethrasn
420425430
aspproleuleuglnglyargleuphesertyrthraspthrglnile
435440445
serargleuglyglyproasnphehisgluileproileasnargpro
450455460
thrcysprotyrhisasnpheglnargaspglymethisargmetgly
465470475480
ileaspthrasnproalaasntyrgluproasnserileasnaspasn
485490495
trpproarggluthrproproglyprolysargglyglyphegluser
500505510
tyrglngluargvalgluglyasnlysvalarggluargserproser
515520525
pheglyglutyrtyrserhisproargleuphetrpleuserglnthr
530535540
prophegluglnarghisilevalaspglypheserphegluleuser
545550555560
lysvalvalargprotyrilearggluargvalvalaspglnleuala
565570575
hisileaspleuthrleualaglnalavalalalysasnleuglyile
580585590
gluleuthraspaspglnleuasnilethrproproproaspvalasn
595600605
glyleulyslysaspproserleuserleutyralaileproaspgly
610615620
aspvallysglyargvalvalalaileleuleuasnaspgluvalarg
625630635640
seralaaspleuleualaileleulysalaleulysalalysglyval
645650655
hisalalysleuleutyrserargmetglygluvalthralaaspasp
660665670
glythrvalleuproilealaalathrphealaglyalaproserleu
675680685
thrvalaspalavalilevalprocysglyasnilealaaspileala
690695700
aspasnglyaspalaasntyrtyrleumetglualatyrlyshisleu
705710715720
lysproilealaleualaglyaspalaarglysphelysalathrile
725730735
lysilealaaspglnglyglugluglyilevalglualaaspserala
740745750
aspglyserphemetaspgluleuleuthrleumetalaalahisarg
755760765
valtrpserargileprolysileasplysileproala
770775780
<210>50
<211>781
<212>prt
<213>具有cbda合酶毛状体靶向结构域的过氧化氢酶hpii(kate)大肠杆菌(catalasehpii(kate)withcbdasynthasetrichometargetingdomainescherichiacoli)
<400>50
metlyscysserthrpheserphetrpphevalcyslysileilephe
151015
phephepheserpheasnileglnthrserilealametserglnhis
202530
asnglulysasnprohisglnhisglnserproleuhisaspserser
354045
glualalysproglymetaspserleualaprogluaspglyserhis
505560
argproalaalagluprothrproproglyalaglnprothralapro
65707580
glyserleulysalaproaspthrargasnglulysleuasnserleu
859095
gluaspvalarglysglysergluasntyralaleuthrthrasngln
100105110
glyvalargilealaaspaspglnasnserleuargalaglyserarg
115120125
glyprothrleuleugluasppheileleuargglulysilethrhis
130135140
pheasphisgluargileprogluargilevalhisalaargglyser
145150155160
alaalahisglytyrpheglnprotyrlysserleuseraspilethr
165170175
lysalaasppheleuseraspproasnlysilethrprovalpheval
180185190
argpheserthrvalglnglyglyalaglyseralaaspthrvalarg
195200205
aspileargglyphealathrlysphetyrthrglugluglyilephe
210215220
aspleuvalglyasnasnthrproilephepheileglnaspalahis
225230235240
lyspheproaspphevalhisalavallysprogluprohistrpala
245250255
ileproglnglyglnseralahisaspthrphetrpasptyrvalser
260265270
leuglnprogluthrleuhisasnvalmettrpalametserasparg
275280285
glyileproargsertyrargthrmetgluglypheglyilehisthr
290295300
pheargleuileasnalagluglylysalathrphevalargphehis
305310315320
trplysproleualaglylysalaserleuvaltrpaspglualagln
325330335
lysleuthrglyargaspproaspphehisargarggluleutrpglu
340345350
alaileglualaglyasppheproglutyrgluleuglypheglnleu
355360365
ileproglugluaspgluphelyspheasppheaspleuleuasppro
370375380
thrlysleuileproglugluleuvalprovalglnargvalglylys
385390395400
metvalleuasnargasnproaspasnphephealagluasnglugln
405410415
alaalaphehisproglyhisilevalproglyleuaspphethrasn
420425430
aspproleuleuglnglyargleuphesertyrthraspthrglnile
435440445
serargleuglyglyproasnphehisgluileproileasnargpro
450455460
thrcysprotyrhisasnpheglnargaspglymethisargmetgly
465470475480
ileaspthrasnproalaasntyrgluproasnserileasnaspasn
485490495
trpproarggluthrproproglyprolysargglyglyphegluser
500505510
tyrglngluargvalgluglyasnlysvalarggluargserproser
515520525
pheglyglutyrtyrserhisproargleuphetrpleuserglnthr
530535540
prophegluglnarghisilevalaspglypheserphegluleuser
545550555560
lysvalvalargprotyrilearggluargvalvalaspglnleuala
565570575
hisileaspleuthrleualaglnalavalalalysasnleuglyile
580585590
gluleuthraspaspglnleuasnilethrproproproaspvalasn
595600605
glyleulyslysaspproserleuserleutyralaileproaspgly
610615620
aspvallysglyargvalvalalaileleuleuasnaspgluvalarg
625630635640
seralaaspleuleualaileleulysalaleulysalalysglyval
645650655
hisalalysleuleutyrserargmetglygluvalthralaaspasp
660665670
glythrvalleuproilealaalathrphealaglyalaproserleu
675680685
thrvalaspalavalilevalprocysglyasnilealaaspileala
690695700
aspasnglyaspalaasntyrtyrleumetglualatyrlyshisleu
705710715720
lysproilealaleualaglyaspalaarglysphelysalathrile
725730735
lysilealaaspglnglyglugluglyilevalglualaaspserala
740745750
aspglyserphemetaspgluleuleuthrleumetalaalahisarg
755760765
valtrpserargileprolysileasplysileproala
770775780