THCA合成酶表达改变的大麻植物的制作方法

文档序号:14023822阅读:695来源:国知局
THCA合成酶表达改变的大麻植物的制作方法

相关申请的交叉引用

本申请要求于2015年5月28日提交的美国临时专利申请号62/167,462的权益,所述申请通过引用以其整体并入本文。

序列表的并入

计算机可读形式的序列表通过电子呈递与本申请一起提交。序列表通过引用以其整体并入,包含于2016年5月23日创建的文件名为“twed002wo_st25.txt”的文件中,所述文件的大小为112kb(在mswindows操作系统中测量)。

本发明涉及遗传改造的大麻植物和大麻植物衍生产品以及用于制备其的表达盒、载体、组合物、和材料和方法。具体地,本发明涉及四氢大麻酚酸(thca)合成酶表达改变的大麻植物,和通过改变thca合成酶表达来改变大麻中δ-9-四氢大麻酚(thc)和大麻二酚(cbd)的量的方法。



背景技术:

历史上,大麻(也称为大麻(marihuana)或大麻(marijuana))已用于医用目的。已经表明,大麻作为食欲刺激剂、止吐剂、镇痛剂在管理各种病症例如青光眼、帕金森病、阿尔茨海默病、多发性硬化和慢性炎症中提供治疗益处。

大麻含有许多化学上不同的成分,其中很多具有治疗性质。医用大麻中的主要治疗成分是δ-9-四氢大麻酚(thc)和大麻二酚(cbd)。thc是大麻作用于精神的主要成分,且已经证明作为止吐剂、镇痛剂在青光眼的管理中提供治疗益处。相反,具有高比例thc的医用大麻品系可能造成焦虑感和/或方向障碍。cbd是大麻中非作用于精神的主要成分。cbd是5-羟色胺受体激动剂,且已经证明在神经病理性疼痛和神经炎症的治疗中具有治疗益处。高剂量cbd的副作用包括可变的嗜睡和镇静。

大麻中特定组分的量可能影响治疗的功效和潜在的副作用。因此,具有改变的治疗组分谱的大麻植物可用于生产医用大麻和/或用于生产特定组分。

发明简述

描述了用于改变大麻植物中一种或多种大麻素含量的方法,该方法包括下调大麻植物中四氢大麻酚酸(thca)合成酶的活性。在具体的实施方案中,方法包括在大麻植物中降低δ-9-四氢大麻酚(thc)含量,升高大麻二酚(cbd)含量,或降低thc且升高cbd含量,方法包括下调大麻植物中四氢大麻酚酸(thca)合成酶的活性。在一些实施方案中,下调thca合成酶的活性包括在植物中引入表达盒,所述表达盒包含有效抑制thca合成酶表达的编码反义rna或sirna的选择dna,所述选择dna与异源启动子可操作连接。在具体的实施方案中,方法可以进一步包括选择相对于不包含表达盒的类似基因型的大麻植物具有降低水平的thca合成酶mrna的大麻植物,或选择相对于不包含表达盒的类似基因型的大麻植物具有降低的thc含量、升高的cbd含量或降低的thc含量和升高的cbd含量的大麻植物。在具体的实施方案中,引入表达盒包括遗传转化。在一些实施方案中,异源启动子可以选自叶特异性启动子、花特异性启动子、thca合成酶启动子、camv35s启动子、fmv35s启动子和tcup启动子。在某些方面,sirna由以下多核苷酸序列编码:与选自seqidno:61、63、64、69、71、72、68的序列和其补体具有至少85%序列一致性的多核苷酸序列;或包含选自seqidno:61、63、64、69、71、72、68的序列和其补体的至少21个连续核苷酸的多核苷酸序列;或包含thca合成酶的至少21个连续核苷酸的多核苷酸序列或其补体,thca与选自seqidno:1-47的序列具有至少85%序列一致性。在其他方面,反义rna由以下多核苷酸序列编码:能够降低thca合成酶表达的包含seqidno:81或其片段的多核苷酸序列;或与seqidno:81的至少200个连续核苷酸具有至少85%一致性的多核苷酸,其中选择dna的转录抑制thca合成酶的表达。

在其他实施方案中,下调thca合成酶的活性包括:向大麻植物或其细胞中引入(i)包含至少一个核定位信号的至少一种rna导向的核酸内切酶,或编码包含至少一个核定位信号的至少一种rna导向的核酸内切酶的核酸,(ii)至少一种向导rna或编码至少一种向导rna的dna,和任选的(iii)至少一种供体多核苷酸,和培养大麻植物或其细胞从而每个向导rna将rna导向的核酸内切酶引导至染色体序列中的靶标位点,其中所述rna导向的核酸内切酶将双链断裂引入靶标位点,且所述双链断裂通过dna修复过程修复,从而改造染色体序列,其中所述靶标位点位于thca合成酶基因中,且所述染色体改造阻断或干扰thca合成酶基因的转录和/或翻译。

在进一步的实施方案中,下调thca合成酶的活性包括:在大麻植物或其细胞中鉴定dna序列内的至少一个thca合成酶基因座,鉴定所述至少一个thca合成酶基因座内的至少一个定制核酸内切酶识别序列,向至少一种大麻植物或其细胞中引入至少第一定制核酸内切酶,其中所述大麻植物或其细胞包含在thca合成酶基因座内或附近的定制核酸内切酶的识别序列,且所述定制核酸内切酶瞬时或稳定表达,分析大麻植物或其细胞中组成thca合成酶基因座的dna或thca合成酶基因座侧翼的dna中定制核酸内切酶介导的改造,和将大麻植物、其细胞或其后代细胞鉴定为包含thca合成酶基因座的改造。

在各种实施方案中,还包括由该方法产生的转基因大麻植物,和转基因植物的种子,其中所述种子包含表达盒。

其他实施方案包含δ-9-四氢大麻酚(thc)含量降低、大麻二酚(cbd)含量升高,或thc降低且cbd含量升高的大麻植物,其包含降低的四氢大麻酚酸(thca)合成酶表达。在某些方面,大麻植物包含编码有效抑制thca合成酶表达的反义rna或sirna的选择dna,所述选择dna与异源启动子可操作连接,其中相对于不包含选择dna的类似基因型的大麻植物,所述大麻植物包含降低的thc含量、升高的cbd含量,或降低的thc和升高的cbd含量。

在具体的实施方案中,大麻植物衍生产品包含按重量计合并浓度为约18%至约60%的大麻二酚酸和大麻二酚,和/或按重量计合并浓度为约0%至约3%的δ-9-四氢大麻酚和四氢大麻酚酸。在各种实施方案中,大麻植物衍生产品包含大麻油、大麻酊、干大麻花、和/或干大麻叶,和/或也可调整用于吸入、口服、舌下服用或局部服用。

在一个具体的实施方案中,包括用于生产医用大麻组合物的方法,所述方法包括获得大麻植物,在植物生长条件下种植大麻植物以从大麻植物生产植物组织,和从植物组织制备医用大麻组合物。

还描述了包含与异源启动子可操作连接的选择dna的重组表达盒,所述选择dna编码有效抑制四氢大麻酚酸(thca)合成酶基因的反义rna、rnai或sirna。在具体的实施方案中,thca合成酶基因包含与选自seqidno:1-47的序列具有至少83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的多核苷酸序列。在某些实施方案中,异源启动子是叶特异性启动子或花特异性启动子;在植物中功能性的启动子;和/或选自camv35s启动子、fmv35s启动子和tcup启动子的启动子。在各种实施方案中,选择dna编码包含与thca合成酶基因的至少21个连续核苷酸互补的序列的sirna;编码能够降低thca合成酶基因表达的包含seqidno:81或其片段的反义rna;包含与选自seqidno:61、63、64、69、71、72、68的序列和其补体具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的多核苷酸序列;和/或编码包含选自seqidno:61、63、64、69、71、72、68的序列和其补体的至少21个连续核苷酸的sirna;其中所述sirna能够降低thca合成酶基因的表达。

在进一步的实施方案中,选择dna以反义方向与启动子可操作连接。在具体的实施方案中,选择dna诱导thca合成酶基因的基因沉默、mrna切割或mrna翻译抑制;和/或选择dna与seqidno:81或其补体的至少200个连续核苷酸至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同;或包含seqidno:61、63、64、69、71、72、68或其补体的至少18、19、20、21或22个连续核苷酸,其中选择dna的转录抑制thca合成酶基因的表达。还描述了包含表达盒的载体;包含表达盒的转基因植物。在具体的实施方案中,转基因植物定义为大麻植物,其中相对于不包含表达盒的相同基因型的大麻植物,所述大麻植物包含降低的δ-9-四氢大麻酚(thc)和升高的大麻二酚(cbd)。在具体的实施方案中,转基因植物进一步定义为r0转基因植物;和/或定义为r0转基因植物任何代的后代植物,其中所述转基因植物从r0转基因植物继承选择dna。在某些实施方案中,还描述了转基因植物的种子,其中所述种子包含表达盒;转基因植物的转基因细胞,其中所述细胞包含表达盒。

在另一个方面,提供植物或其后代的加工产品,其中相对于不包含表达盒的相同基因型的大麻植物的加工产品,所述加工产品包含降低的δ-9-四氢大麻酚(thc)和升高的大麻二酚(cbd)。在各种实施方案中,加工产品包含大麻油、酊、干大麻花和/或干大麻叶;调整用于吸入、口服、舌下服用或局部服用。

在另一个方面,描述了用于向植物或其部分局部施用的组合物,包含一定量的有效抑制thca合成酶基因表达的四氢大麻酚酸(thca)合成酶抑制化合物,其中所述thca合成酶抑制化合物包含有效抑制thca合成酶基因表达的反义寡核苷酸、dsrna或编码反义寡核苷酸的核酸。在某些实施方案中,thca合成酶抑制化合物包含长度为至少18至约24、约25至约50、约51至约100、约101至约300、约301至约500、或至少约500或更多个核苷酸的多核苷酸分子,其中所述植物是大麻,且所述thca合成酶基因包含与选自seqidno:1-47的序列具有至少约83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的多核苷酸序列。

其他实施方案提供下调大麻植物中thca合成酶基因活性的方法,该方法包括:向所述植物中引入权利要求1所述的表达盒;和选择相对于其中没有引入所述表达盒的植物具有降低的thca合成酶mrna丰度的植物;或选择相对于不包含所述表达盒的类似基因型的大麻植物具有降低的δ-9-四氢大麻酚(thc)和/或升高的大麻二酚(cbd)含量的植物。在某些方面,所述thca合成酶基因包含与选自seqidno:1-47的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的多核苷酸序列。在具体的实施方案中,引入表达盒包括遗传转化。

在其他方面,描述了生产医用大麻组合物的方法,所述方法包括获得植物,在植物生长条件下种植植物以从植物生产植物组织,和从植物组织制备人或动物服用的医用大麻组合物。

其他实施方案描述了鉴定thca合成酶基因表达降低或表达缺失的植物的方法,包括获得多株大麻植物,筛选多株大麻植物的thca合成酶基因表达,和选择相对于不包含表达盒的等基因大麻植物的thca合成酶基因表达,包含降低的thca合成酶基因表达的一株或多株筛选的大麻植物。在具体的实施方案中,方法进一步包括测试相对于不包含表达盒的等基因大麻植物,选择的一株或多株大麻植物的降低的δ-9-四氢大麻酚(thc)和/或升高的大麻二酚(cbd)含量;所述多株大麻植物通过随机突变或定点突变获得;所述多株植物是转基因植物;和/或所述多株植物包括10、100或1000或更多株植物。在具体的实施方案中,方法进一步包括将thca合成酶基因表达降低的一株或多株大麻植物与不同植物杂交。

在其他方面,描述了用于鉴定与thca合成酶基因遗传连接的多态性的方法,包括:获得其中群体成员的thca合成酶表达不同的植物群体的dna,和鉴定相对于不包含所述多态性的群体成员,所述群体中与降低的thca合成酶表达相关的至少第一多态性。

在一个不同的方面,描述了用于生产在thca合成酶基因中具有改造的染色体序列的大麻植物细胞的方法,该方法包括:向大麻植物细胞中引入(i)包含至少一个核定位信号的至少一种rna导向的核酸内切酶,或编码包含至少一个核定位信号的至少一种rna导向的核酸内切酶的核酸,(ii)至少一种向导rna或编码至少一种向导rna的dna,和任选的(iii)至少一种供体多核苷酸,和培养大麻植物细胞从而每个向导rna将rna导向的核酸内切酶引导至染色体序列中的靶标位点,其中所述rna导向的核酸内切酶将双链断裂引入靶标位点,且所述双链断裂通过dna修复过程修复,从而改造染色体序列,其中所述靶标位点位于thca合成酶基因中,且所述染色体改造阻断或干扰thca合成酶基因的转录和/或翻译。在具体的实施方案中,rna导向的核酸内切酶源自cas9蛋白;编码rna导向的核酸内切酶的核酸是mrna或dna;和/或改造是插入或缺失。在具体的实施方案中,dna是进一步包含编码向导rna的序列的载体的一部分,通过所述方法获得大麻植物细胞。在具体的方面,大麻植物包含所述细胞,其中相对于其中thca合成酶基因的染色体序列没有被改造的等基因大麻植物,所述植物包含降低的δ-9-四氢大麻酚(thc)和/或升高的大麻二酚(cbd)含量。

其他方面包括用于改造植物细胞中thca合成酶基因座的方法,包括:在植物细胞中鉴定dna序列内的至少一个thca合成酶基因座,鉴定所述至少一个thca合成酶基因座内的至少一个定制核酸内切酶识别序列,向至少一个植物细胞中引入至少第一定制核酸内切酶,其中所述细胞包含在thca合成酶基因座中或附近的定制核酸内切酶的识别序列,且所述定制核酸内切酶瞬时或稳定表达,分析所述细胞中组成thca合成酶基因座的dna或thca合成酶基因座侧翼的dna中定制核酸内切酶介导的改造,和将细胞或其后代细胞鉴定为包含thca合成酶基因座的改造。在具体的实施方案中,定制核酸内切酶包含“laglidadg”、“giy-yig”、“his-cysbox”、“zfn”或“hnh”序列基序;和/或所述核酸内切酶识别序列仅在所述植物细胞的基因组中存在一次。在某些实施方案中,方法进一步包括鉴定目标基因座内的至少第二定制核酸内切酶识别序列;或进一步包括向植物细胞中引入至少第二定制核酸内切酶,其中所述细胞包含所述第二定制核酸内切酶的第二识别序列。在具体实施方案中,使用基因分型反应、pcr反应、高通量测序、其他分子遗传学检测、生化检测、视觉检测、免疫检测或其他表型标志物检测来检测核酸内切酶介导的改造。在某些方面,描述了通过所述方法产生的植物。

附图说明

图1描绘了栽培大麻(cannabissativa)四氢大麻酚酸(thca)合成酶序列的编码区的比对。用全世界可获得的web.ebi.ac.uk/tools/msa/clustalw2的clustalo(1.2.1)多序列比对进行比对。对以下序列进行比对:jq437488.1(seqidno:1);jq437487.1(seqidno:2);jq437486.1(seqidno:3);jq437485.1(seqidno:4);jq437484.1(seqidno:5);jq437483.1(seqidno:6);jq437482.1(seqidno:7);jq437481.1(seqidno:8);jq437492.1(seqidno:12);jq437491.1(seqidno:13);jq437490.1(seqidno:14);jq437489.1(seqidno:15);ab212841.1(seqidno:16);ab212840.1(seqidno:17);ab212839.1(seqidno:18);ab212838.1(seqidno:19);ab212837.1(seqidno:20);ab212836.1(seqidno:21);ab212835.1(seqidno:22);ab212834.1(seqidno:23);ab212833.1(seqidno:24);ab212832.1(seqidno:25);ab212831.1(seqidno:26);ab212830.1(seqidno:27);ab212829.1(seqidno:28);ab731220.1(seqidno:39);ab057805.1(seqidno:40);ab292683.1(seqidno:41);ab292682.1(seqidno:42);和ab292684.1(seqidno:43)。

图2描绘了来自具有ncbithca合成酶序列的dk-1和sh-4品系的四氢大麻酚酸(thca)合成酶编码序列的比对。对以下序列进行比对:ab057805.1(seqidno:40);ab212829.1(seqidno:28);ab212833.1(seqidno:24);ab292683.1(seqidno:41);jq437487.1(seqidno:2);jq437491.1(seqidno:13);dk-1_full(seqidno:46);和sh-4_full(seqidno:47)。还示出了具有相同序列的区域(共有的)(seqidno:86)。

图3描绘了rnai的可及性分析,其示出了thca基因中位于thca基因n末端区域(对应于5’-端)的用于rnai靶向的良好候选区域(良好的rna可及性)。该基因区域不编码任何保守的蛋白结构域,因此适用于rnai靶向,其中仅有脱靶效应的最小风险。该区域用于设计小发夹rna干扰构建体。用可从rna.tbi.univie.ac.at/cgi-bin/rnaxs获得的rnaxswebserver进行分析。

图4描绘了rnai可及性分析,其示出了thca基因中用于rnai靶向的候选区域(rna可及性)。描绘的是c-末端bbe保守结构域。由于该结构域可能存在于其他次级代谢酶中,由于在其他次级代谢物-酶编码基因中诱导沉默的风险而避免该区域。用可从rna.tbi.univie.ac.at/cgi-bin/rnaxs获得的rnaxswebserver进行分析。

图5描绘了用nationalcenterforbiotechnologyinformation(ncbi)数据库分析的thca合成酶中的保守蛋白结构域。发现了以下保守的蛋白结构域:小檗碱和小檗碱样(氨基酸区间480-538)、fad结合结构域(氨基酸区间81-218)、包含fad/fmn的脱氢酶(氨基酸区间81-540)和d-乳酸脱氢酶(glcd,氨基酸区间81-540)。还描绘了相对于保守蛋白结构域的示意图的完整反义rna、小发夹rna和大发夹rna。

图6描绘了在克隆反义和rnai构建体中使用的pcam1391-35s载体t-dna的图解。示出了花椰菜花叶病毒启动子(35s,在图6的右侧和中间,以带箭头的方框示出)、潮霉素抗性基因(hptii);35s终止子(35s,在图6的左侧);胭脂碱合成酶终止子(nos)。还描绘了35s和nos之间用于克隆目标基因的mcs限制性位点。该载体可用于农杆菌介导的转化、生物溶解颗粒轰击和植物的原生质体转化。

序列简述

seqidno:1-38是大麻thca合成酶基因,或其部分编码序列(cds)。

seqidno:39是假想蛋白的大麻基因,完整的cds。

seqidno:40是thca合成酶前体的大麻mrna,完整的cds。

seqidno:41是大麻二酚酸合成酶同源物(cbdas2)的mrna,完整的cds。

seqidno:42是大麻二酚酸合成酶的大麻cbdasmrna,完整的cds。

seqidno:43是大麻二酚酸合成酶同源物(cbdas3)的mrna,完整的cds。

seqidno:44是大麻thca合成酶基因。

seqidno:45是大麻thca合成酶基因。

seqidno:46是dk-1大麻品系的大麻thca合成酶基因序列。

seqidno:47是sh-4大麻品系的大麻thca合成酶基因序列。

seqidno:48是kojoma等的正向引物(tgaagaaaaaaaatgaattgctcagcattttcc)。

seqidno:49是kojoma等(2006)的反向引物的补体(ccaccgcatcatcattaattatctttaaataga)。

seqidno:50是kojoma等的实际反向引物(tctatttaaagataattaatgatgatgcggtgg)。

seqidno:51是thca-hprna1-sn-f1(有义正向)rnai构建体引物。

seqidno:52是thca-hprna1-sn-r1(有义反向)rnai构建体引物。

seqidno:53是thca-hprna1-as-f1rnai(反义正向)构建体引物。

seqidno:54是thca-hprna1-as-r1(反义反向)rnai构建体引物。

seqidno:55是thca-hprna2-sn-f2rnai构建体引物。

seqidno:56是thca-hprna2-sn-r2rnai构建体引物。

seqidno:57是thca-hprna2-as-f2rnai构建体引物。

seqidno:58是thca-hprna2-as-r2rnai构建体引物。

seqidno:59是thca-fullas-f构建体引物。

seqidno:60是thca-fullas-r构建体引物。

seqidno:61是小发夹构建体的有义序列。

seqidno:62是小发夹构建体的环序列。

seqidno:63是小发夹构建体的反义序列。

seqidno:64是小发夹构建体的完整插入序列。

seqidno:65是不含限制性位点的thca-hprna1-sn-f1(有义正向)引物。

seqidno:66是不含限制性位点的thca-hprna1-sn-r1(有义反向)引物。

seqidno:67是不含限制性位点的thca-hprna1-as-f1rnai(反义反向)引物。

seqidno:68是不含限制性位点的thca-hprna1-an-r1(反义反向)rnai引物。

seqidno:69是大发夹构建体的有义链。

seqidno:70是大发夹构建体的环链。

seqidno:71是大发夹构建体的反义链。

seqidno:72是大发夹构建体的完整插入序列。

seqidno:73是具有saci-mlui的thca-hprna2-sn-f2(有义正向)引物。

seqidno:74是不含限制性位点的thca-hprna2-sn-f2(有义正向)引物。

seqidno:75是thca-hprna2-sn-r2引物。

seqidno:76是不含限制性位点的thca-hprna2-sn-r2引物。

seqidno:77是thca-hprna2-as-f2引物。

seqidno:78是不含限制性位点的thca-hprna2-as-f2引物。

seqidno:79是thca-hprna2-as-r2引物。

seqidno:80是不含限制性位点的thca-hprna2-as-r2引物。

seqidno:81是完整的反义thca合成酶。

seqidno:82是thca-fullas-f(反义正向)引物。

seqidno:83是不含限制性位点的thca-fullas-f(反义正向)引物。

seqidno:84是thca-fullas-r(反义反向)引物。

seqidno:85是不含限制性位点的thca-fullas-r(反义反向)引物。

seqidno:86是不含限制性位点的共有thca-fullas-r(反义反向)引物。

发明详述

描述了遗传改造的大麻植物和大麻植物衍生产品以及用于生产其的表达盒、载体、组合物、和材料和方法。具体地,本发涉及四氢大麻酚酸(thca)合成酶表达改变的大麻植物,和通过改变thca合成酶表达来改变大麻中δ-9-四氢大麻酚(thc)和大麻二酚(cbd)的量的方法。

大麻(cannabissativa)是已知的,且广泛用于生产医用大麻。除了重要的大麻化合物四氢大麻酚(thc),大麻还产生具有作为药物具有已被证明和潜在价值的大量其他次级代谢物。然而,植物内仅产生很低的水平,因此高产量和纯化成本是这些药物商业可行性的主要障碍。大麻次级代谢物生物合成途径的代谢工程化可以将生化反应、中间体和能量从thc的生物合成重新引导至替代化合物。这种方法可以开发具有新药物的增值生产的新型大麻品系。

植物的次级代谢物产生来自严格调控的生物合成途径,其导致在植物组织中以不同浓度积累的一种或多种生物活性的代谢物的产生。这些途径的代谢工程化可以用于制备特定的目标代谢物产量增加的植物株系。可以应用植物遗传工程化技术,通过下调参与thc生物合成的关键酶来选择性改造大麻的次级代谢。如在各种真核生物的多个研究中所示,下调代谢途径中的关键步骤将中间体和能量重新引导至其他代谢途径,并导致其他终产物的产量增加和积累。由于thc和大麻产生的其他有价值的药物化合物在次级代谢生物合成途径中共享特定步骤和中间体,预期thc产量降低会增加其他目标化合物的产量。

在某些实施方案中,四氢大麻酚酸(thca)合成酶的改造可以通过反义rna(asrna)和小干扰rna(sirna)经由rna干扰(rnai)技术诱导靶基因沉默来实现。两种rna介导的基因调控机制均已经在自然界在所有真核生物中发现,且如今已成功地作为基因沉默工具在许多生物体中应用。这种遗传改造策略的优势是造成基因沉默的构建体转化不需要通过靶向特定的基因组基因座的全基因敲除。此外,产生的遗传改造的植物株系可以具有不同水平的靶基因下调,并可以筛选用于最理想的一组药物化合物的生产。

可以由分离自各种大麻品系的基因组dna克隆thca合成酶基因。从特定品系克隆并测序该基因是必要步骤,因为已经表明不同大麻株系中该基因序列的变异影响大麻化合物的生产。thca合成酶基因的共有序列可用于设计和制备反义rna和rna干扰构建体。可以将合成的rna沉默构建体引入设计用于植物转化的载体。可以使用不同启动子来驱动rna沉默构建体的表达,例如不同强度和来源的组成型启动子。此外,也可以使用thca合成酶基因调控区(启动子)作为天然基因来引导在相同组织内内和相同植物发育阶段期间的沉默构建体的表达。该方法将有助于避免非靶标植物组织中的转基因表达,并将其他可能的不期望的遗传转化作用的风险最小化。

在某些实施方案中,载体可以具有新型多接头,使得可以在定向克隆中使用限制性酶切位点(res)对。通过选择相对稀少的res,它们不可能在待克隆的dna中存在。即使它们确实存在,可以使用不同的res对,在小片段的靶标dna中存在所有四种酶则非常不可能。

在某些实施方案中,可以基于序列相似性克隆thca合成酶基因。

在某些实施方案中,可以在载体中使用用于从该载体转录asdna的强启动子来合成asrna。可以使用几种方法:在一个方法中,将以反义方向克隆整个thca合成酶基因。因此,基因的任何区域均可能与不能被翻译以产生功能性的thca合成酶的植物的有义mrna形成反义复合物。

在不同的方法中,可以以以下方向表达对应于基因部分的各种asdna:来自基因或其补体的约30个碱基对-环结构域-与补体方向的基因相同的基因。这将产生已经成功用于各种生物体的sirna。

对于asdna和载体构建,可以使用pcr+res的混合或dna合成方法。

描述了用于改造大麻植物和/或大麻植物细胞的代谢物生物合成途径的多核苷酸和方法,显示改变的代谢物生物合成途径的大麻植物和/或植物细胞。具体地,描述了通过调控thca合成酶的表达和/或活性来改造大麻植物中的thc和/或cbd生产的方法,和具有改变的thca合成酶的表达和/或活性的大麻植物。

因此,在某些实施方案中,本发明提供下调thc生产的方法。在具体的实施方案中,提供下调thca合成酶的表达和/或活性的方法。还提供具有改变的thc生产产量的植物和/或植物细胞。在某些实施方案中,提供具有下调的thca合成酶的表达和/或活性的大麻植物和/或细胞。

下调代谢途径中的关键步骤将中间体和能量重新引导至其他代谢途径,并导致其他终产物的生产增加和积累。thc和其他大麻代谢物共享生物合成途径;大麻萜酚酸是thc、cbd和大麻色烯的前体。具体地,thca合成酶催化大麻萜酚酸产生δ-9-四氢大麻酚酸;δ-9-四氢大麻酚酸经历热转化形成thc。cbda合成酶催化大麻萜酚酸产生大麻二酚酸;大麻二酚酸经历热转化为cbd。cbca合成酶催化大麻萜酚酸产生大麻色酸;大麻色酸经历热转化为大麻色烯。

thc、cbd或大麻色烯的生产降低将提高该共同途径中其他代谢物的生产。例如,通过抑制thc生产,cbd和/或大麻色烯生产提高。可以通过抑制四氢大麻酚酸(thca)合成酶的表达和/或活性来抑制thc的生产。

描述了通过下调具有共同生物合成途径的一种或多种代谢物的生产来提高一种或多种次级代谢物的生产的某些实施方案。某些实施方案提供通过下调thc生产来提高在thc生物合成途径中共享步骤和中间体的一种或多种次级代谢物的生产的方法。在具体的实施方案中,提供通过抑制thc生产来提高cbd和/或大麻色烯的生产的方法。

某些实施方案提供通过下调thca合成酶的表达和/或活性来提高在thc生物合成途径中共享步骤和中间体的一种或多种次级代谢物的生产的方法。在具体的实施方案中,提供通过下调thca合成酶的表达和/或活性来提高cbd和/或大麻色烯的生产的方法。

还提供具有共同生物合成途径的一种或多种代谢物的生产改变的植物和植物细胞。在某些实施方案中,提供一种或多种次级代谢物生产提高,且具有共同生物合成途径的一种或多种其他代谢物下调的大麻植物和细胞。在某些实施方案中,提供一种或多种次级代谢物生产提高,且thc生物合成途径中一种或多种其他代谢物下调的大麻植物和细胞。在某些实施方案中,提供thc生物合成途径中一种或多种次级代谢物生产提高,且thc生产下调的大麻植物和细胞。在具体的实施方案中,提供cbd和/或大麻色烯的生产提高,且thc生产下调的大麻植物和细胞。

某些实施方案提供在thc生物合成途径中共享步骤和中间体的一种或多种次级代谢物生产提高,且thca合成酶的表达和/或活性下调的大麻植物和/或细胞。在具体的实施方案中,提供cbd和/或大麻色烯的生产提高,且thca合成酶的表达和/或活性下调的大麻植物和细胞。

定义

在本文的说明书和表格中,使用了大量术语。为了提供对说明书和权利要求的清楚且一致的理解,提供以下定义。除非另有说明,术语根据相关领域的普通技术人员的常规用法来理解。

当术语以单数表示时,发明人也考虑由该术语的复数所描述的本发明方面。

如本文所用,术语“四氢大麻酚酸(thca)合成酶抑制化合物”是指抑制或降低thca合成酶活性或thca合成酶表达的化合物,例如编码thca合成酶的mrna的合成(转录)和/或从thca合成酶mrna合成thca合成酶多肽(翻译)。在一些实施方案中,选择性的thca合成酶抑制化合物特异性抑制降低δ-9-四氢大麻酚(thc)形成和/或增加大麻二酚(cbd)的thca合成酶。

如本文所用,术语“表达盒”是指包含待转录的选择dna的dna分子。此外,表达盒包含至少表达所需的所有dna元件。成功转化后,表达盒引导细胞机制将选择dna转录为rna。在一些实施方案中,表达盒表达抑制thca合成酶表达的反义rna、irna或sirna。

只要使用正确的调控序列,可以将不同的表达盒转化至不同的生物体(包括细菌、酵母、植物和哺乳动物细胞)中。

如本文所用,术语“表达”是指细胞内过程的组合,包括通过编码dna分子(例如结构基因)经历的转录和翻译以产生多肽。反义rna、irna或sirna的表达是指dna转录为rna的过程。

如本文所用,术语“蛋白质的丰度”是指特定蛋白质相对于蛋白总量或相对于测试的细胞、组织、植物或植物部分的重量或体积的量。

如本文所用,术语“mrna的丰度”是指特定mrna相对于蛋白总量或相对于测试的细胞、组织、植物或植物部分的重量或体积的量。

如本文所用,术语“遗传转化”是指将dna序列或构建体(例如,载体或表达盒)引入细胞或原生质体的过程,在所述细胞或原生质体中,外源dna整合入染色体或能够自主复制。

如本文所用,术语“异源的”是指在目前发现该序列的遗传背景中,通常不存在于给定宿主基因组中的序列。在该方面,序列可以是宿主基因组天然的,但相对于宿主序列内的其他基因序列重新排列。例如,调控序列可以是异源的,在于相对于天然调控序列,它与不同的编码序列连接。

如本文所用,当与转基因植物细胞或转基因植物一起使用时,术语“获得”是指转化非转基因植物细胞或植物以产生转基因植物细胞或植物,或种植转基因植物种子以产生转基因植物细胞或植物。这种转基因植物种子可以来自r0转基因植物,或来自从起始转基因亲本植物继承给定转基因序列的任何代的后代。此外,“获得”包括通过育种获得植物。

如本文所用,术语“r0转基因植物”是指已经遗传转化或已经从遗传转化的一个或多个植物细胞再生的植物。

如本文所用,术语“转化构建体”是指设计用于通过遗传转化引入宿主基因组的嵌合dna分子。优选的转化构建体将包含引导一个或多个外源基因表达所需的所有遗传元件。在本发明的具体实施方案中,期望以表达盒的形式将转化构建体引入宿主细胞。

如本文所用,术语“转基因”是指已经整合入宿主基因组,或能够在宿主细胞中自主复制且能够造成一个或多个编码序列表达的dna片段。示例性转基因将为宿主细胞或从其再生的植物提供相对于对应的非转化细胞或植物而言新的基因型。转基因可以通过遗传转化直接引入植物,或从用dna片段转化的之前任何代的植物继承。

如本文所用,术语“转基因植物”是指植物或从其衍生的任何随后代的后代植物,其中植物或其后代的dna包含在相同品系的非转基因植物中不是天然存在的引入的外源dna。转基因植物可以额外包含对于转化植物而言天然的序列,但其中“外源”基因已经被改变以改变该基因的表达水平或模式,例如,通过使用一个或多个异源调控或其他元件。

如本文所用,术语“载体”是指设计用于转化入宿主细胞的dna分子。一些载体能够在宿主细胞中复制。作为从其分离的表达盒,质粒是一种示例性载体。

如本文所用,术语“dna”、“dna分子”和“dna多核苷酸分子”是指基因组或合成来源的单链dna或双链dna分子,例如脱氧核糖核苷酸碱基的聚合物或dna多核苷酸分子。

如本文所用,术语“dna序列”、“核苷酸序列”和“多核苷酸序列”是指dna分子的核苷酸序列。ssdna是指单链dna;dsdna是指双链dna。

如本文所用,术语“rna”或“rna分子”是指基因组或合成来源的单链rna或双链rna分子,例如包含单链或双链区域的核糖核苷酸碱基的聚合物。“ssrna”具体是指单链rna;“dsrna”是指双链rna。

除非另有说明,当从左至右阅读时,本说明书上下文给出核苷酸序列是5’至3’方向。本文使用的命名法是unitedstatescodeoffederalregulations第37条第1.822款所要求的,且如wipostandardst.25(1998)附件2的表1和表3的表格所示。

如本文所用,多核苷酸可以是ssdna的形式,包括dsdna等同物、dsrna等同物、ssrna等同物、ssrna补体、ssdna和ssdna补体。

如本文所用,当第一核酸序列与第二核酸序列位于功能性关系时,第一核酸序列、选择dna或多核苷酸与第二核酸序列“可操作”相连或“连接”。例如,如果启动子为rna或编码序列提供转录或表达,该启动子与rna和/或蛋白编码序列、或编码irna的序列、sirna或编码反义寡核苷酸的核酸可操作连接。通常,可操作连接的dna序列是连续的,且当需要连接两个蛋白编码区时,在同一阅读框中。

在一些实施方案中,选择dna编码反义rna或rnai构建体。在另一个实施方案中,选择dna编码核酶或锌指蛋白。

如本文所用,短语“其中所述植物不包含转基因”是指缺少包含与多核苷酸可操作连接的启动子的dna分子或重组病毒载体的植物。

如本文所用,术语“转录物”是指通过转录过程从基因产生的任何rna。因此,基因的转录物可以包含初级转录产物,其可以包含内含子或可以包含缺少内含子的成熟rna。

如本文所用,“核酸酶”是指具有核酸酶活性的天然和工程化的(即,改造的)多肽,例如具有“laglidadg”、“giy-yig”、“his-cysbox”和hnh家族(例如,chevalier和stoddard,2001)的序列基序和催化活性的核酸内切酶,以及天然存在的或为给定靶标特异性工程化(例如,durai等,2005;美国专利号7,220,719)的锌指核酸酶(zfn)。另一种考虑的核酸内切酶是酿酒酵母(saccharomycescerevisiae)ho核酸酶(例如,nickoloff等,1986)或其变体。

如本文所用,“定制核酸内切酶”是指已经进化或合理设计(例如,wo06097853、wo06097784、wo04067736或us20070117128)以在一个或多个识别序列内或附近切割的核酸内切酶。这种定制核酸内切酶的性质使其适于遗传改造,从而可以操作其识别、结合和/或核酸酶活性。

如本文所用,“等位基因”是指特定基因座的另一个序列;等位基因的长度可以少至1个核苷酸碱基,但通常更大。等位基因序列可以注释为核酸序列或由核酸序列编码的氨基酸序列。或者,等位基因可以是基因的一种形式,且可以显示简单的显性或隐性性质或更复杂的遗传关系,例如不完全显性、共显性、条件显性、异位显性或其相对于一个或多个其他等位基因的一种或多种组合。

“基因座”是通常通过参考点发现的基因组序列的位置,例如基因、基因的一部分或基因间区域的短dna序列。本发明的基因座包括群体中的一个或多个多态性;即在一些个体中存在的替代等位基因。

核酸

本发明提供包含编码thca合成酶及其片段的核苷酸序列或与该核苷酸序列互补的序列的核酸。核酸包括但不限于基因组dna、cdna、rna、其片段和改造的版本。

如本文所用,“多核苷酸”可以是指包含多个核苷酸的dna或rna分子,且通常是指“寡核苷酸”(长度为18-25个核苷酸的多核苷酸分子)和26或更多个核苷酸的较长多核苷酸两者。本发明的实施方案包括含有以下的组合物:长度为18-25个核苷酸(18-聚体、19-聚体、20-聚体、21-聚体、22-聚体、23-聚体、24-聚体或25-聚体)的寡核苷酸,长度为26或更多个核苷酸的较长或中等长度的多核苷酸(26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、约65、约70、约75、约80、约85、约90、约95、约100、约110、约120、约130、约140、约150、约160、约170、约180、约190、约200、约210、约220、约230、约240、约250、约260、约270、约280、约290或约300个核苷酸的多核苷酸),或长度大于约300个核苷酸的长核苷酸(例如,长度为约300至约400个核苷酸、约400至约500个核苷酸、约500至约600个核苷酸、约600至约700个核苷酸、约700至约800个核苷酸、约800至约900个核苷酸、约900至约1000个核苷酸、约300至约500个核苷酸、约300至约600个核苷酸、约300至约700个核苷酸、约300至约800个核苷酸、约300至约900个核苷酸或约1000个核苷酸,或甚至长度大于1000个核苷酸的多核苷酸,例如多至靶标thca合成酶基因的整个长度,包括thca合成酶基因的编码或非编码或编码和非编码部分两者)。当多核苷酸是双链时,其长度可以类似地用碱基对来描述。

本发明各种实施方案所用的多核苷酸组合物包括含有寡核苷酸、多核苷酸或两者混合物的组合物,包括:rna或dna或rna/dna杂合体或化学修饰的寡核苷酸或多核苷酸或其混合物。在某些实施方案中,多核苷酸可以是核糖核苷酸和脱氧核糖核苷酸的组合,例如主要由核糖核苷酸组成但具有一个或多个末端脱氧核糖核苷酸的合成多核苷酸,或主要由脱氧核糖核苷酸组成但具有一个或多个末端双脱氧核糖核苷酸的合成多核苷酸。在一些实施方案中,多核苷酸包括非标准核苷酸,如肌苷、硫尿核苷或假尿苷。在一些实施方案中,多核苷酸包括化学修饰的核苷酸。化学修饰的寡核苷酸或多核苷酸的实例是本领域已知的;参见例如通过引用并入本文的美国专利申请2011/0171287、美国专利申请2011/0171176、美国专利申请2011/0152353、美国专利申请2011/0152346和美国专利申请2011/0160082。说明性实例包括但不限于:可以用以下来部分或完全修饰的天然存在的寡核苷酸或多核苷酸的磷酸二酯骨架:硫代磷酸酯、二硫代磷酸酯、或甲基膦酸酯核苷酸间连接修饰;修饰的核苷碱基或修饰的糖可用于寡核苷酸或多核苷酸的合成,且可以用荧光部分(例如荧光素或罗丹明)或其他标记(例如生物素)来标记寡核苷酸或多核苷酸。

多核苷酸可以是单链或双链rna、单链或双链dna、双链dna/rna杂合体,及其修饰的类似物。在本发明的某些实施方案中,在植物细胞中提供单链rna的多核苷酸可以是:(a)单链rna分子(ssrna),(b)自杂交以形成双链rna分子的单链rna分子,(c)双链rna分子(dsrna),(d)单链dna分子(ssdna),(e)自杂交以形成双链dna分子的单链dna分子,(f)转录为rna分子的单链dna分子,(g)双链dna分子(dsdna),(h)转录为rna分子的双链dna分子,和(i)双链杂交的rna/dna分子,或其组合。在某些实施方案中,这些多核苷酸可以包含核糖核酸残基和脱氧核糖核酸残基两者。在某些实施方案中,这些多核苷酸包括化学修饰的核苷酸或非标准核苷酸。在方法的某些实施方案中,多核苷酸包括通过分子内杂交形成的双链dna、通过分子间杂交形成的双链dna、通过分子内杂交形成的双链rna,或通过分子间杂交形成的双链rna。在其中多核苷酸是dsrna的某些实施方案中,反义链可以包含与靶标thca合成酶基因基本上互补的至少18个核苷酸。在某些实施方案中,多核苷酸包括自杂交以形成具有至少部分双链结构的发夹结构的单链dna或单链rna,其包括将与从靶向抑制的基因转录的rna杂交的至少一个片段。不希望受限于任何机制,据信这种多核苷酸会或将会产生具有至少一个片段的单链rna,其将与从靶向抑制的基因转录的rna杂交。

设计本发明的多核苷酸分子以在大麻植物中通过诱导内源thca合成酶基因的调控或抑制来调控表达、降低thc含量和/或升高cdb含量,且设计具有与植物的内源thca合成酶基因的核苷酸序列或从植物的内源thca合成酶基因转录的rna序列基本上相同或基本上互补的核苷酸序列,其可以是编码序列或非编码序列。这些调控表达的有效多核苷酸分子在本文中称为“一种或多种触发剂”。

“基本上相同”或“基本上互补”是指触发多核苷酸(或双链多核苷酸的至少一条链)与内源基因或与从内源thca合成酶基因转录的rna(例如,转录物)具有足够的一致性或互补性,以抑制内源thca合成酶基因的表达(例如,引起基因转录物和/或编码蛋白的水平或活性降低)。本文提供的方法和组合物的多核苷酸不需要与内源thca合成酶基因或与从内源thca合成酶基因转录的rna(即,转录物)具有100%一致性或互补性,以抑制内源thca合成酶基因的表达(即,引起基因转录物或编码蛋白的水平或活性降低)。因此,在某些实施方案中,设计多核苷酸或其部分以与靶基因或从靶基因转录的信使rna(例如转录物)中至少18个或19个连续核苷酸的序列基本上相同或基本上互补。在一些实施方案中,当与内源靶基因或与从该靶基因转录的rna(例如,转录物)中的18个或更多个连续核苷酸的序列相比时,“基本上相同”的多核苷酸具有100%序列一致性,或至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性。在一些实施方案中,当与靶基因或与从该靶基因转录的rna中的18个或更多个连续核苷酸的序列相比时,“基本上互补”的多核苷酸具有100%序列互补性,或至少约83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列互补性。多核苷酸的补体包括参考序列的完全互补和完全反向互补序列。

在一些实施方案中,本文提供的方法和组合物中所用的多核苷酸可以与任何以下基本上相同或基本上互补:i)thca合成酶基因的保守区域、thca合成酶基因的非保守区域。与这种区域基本上相同或基本上互补的这种多核苷酸可用于降低δ-9-四氢大麻酚(thc)和/或升高大麻二酚(cbd)。

因此,包含与靶基因或转录物的错配的多核苷酸可用于本文提供的组合物和方法的某些实施方案中。在某些实施方案中,多核苷酸可以包含与所述基因或所述转录物基本上相同或基本上互补的至少19个连续核苷酸,或包含与靶基因或靶基因转录物基本上相同或基本上互补的至少19个连续核苷酸。在某些实施方案中,与内源靶基因或与从该靶基因转录的rna(例如,转录物)基本上相同或基本上互补的19个连续核苷酸的多核苷酸可以与靶基因或转录物具有1个或2个错配。在某些实施方案中,20个或更多个核苷酸的多核苷酸包含与内源靶基因或与从靶基因转录的rna具有一致性或互补性的连续19个核苷酸跨度,其可以与靶基因或转录物具有1个或2个错配。在某些实施方案中,与内源靶基因或与从该靶基因转录的rna(例如,转录物)基本上相同或基本上互补的21个连续核苷酸的多核苷酸可以与靶基因或转录物具有1个、2个或3个错配。在一些实施方案中,22个或更多个核苷酸的多核苷酸包含与内源靶基因或与从靶基因转录的rna具有一致性或互补性的连续21个核苷酸跨度,其可以与靶基因或转录物具有1个、2个或3个错配。在设计与内源靶基因或与从靶基因转录的rna具有错配的多核苷酸时,可以使用更可能耐受的某些类型和某些位置的错配。在某些示例性实施方案中,如du等,nucleicacidsresearch,2005,vol.33,no.51671–1677所述,使用腺嘌呤和胞嘧啶或鸟苷和尿嘧啶残基之间的错配。在某些示例性实施方案中,如du等,nucleicacidsresearch,2005,vol.33,no.51671–1677所述,19个碱基对重叠区中的错配可以是在具有良好耐受的核苷酸错配残基的低耐受性位置5、7、8或11(从19个核苷酸靶标的5’端),在中等耐受性的位置3、4和12-17,和/或在互补区域任一端的高耐受性核苷酸位置(即,位置1、2、18和19)。进一步预期耐受性错配可以在实验中凭经验确定,其中通过本文提供的方法向植物施用多核苷酸,分析经处理植物的thca合成酶基因表达的抑制,或出现改善的保质期和降低的采后损失。

在某些实施方案中,设计的多核苷酸分子与给定thca合成酶基因编码或非编码序列的一个等位基因或一个家族成员具有100%序列一致性或互补性。靶标thca合成酶基因包括seqidno:1-47的thca合成酶基因。在其他实施方案中,设计的多核苷酸分子与给定靶基因的多个等位基因或家族成员具有100%序列一致性或互补性。

在某些实施方案中,本文提供的多核苷酸组合物和方法通常在经处理植物生命中至少1周或更长的一段时间以系统性的方式影响基因表达的条件或调控(例如,抑制)。例如,在用本发明的多核苷酸组合物处理植物叶的数天内,可以在处理叶侧面和上方的其他叶中以及在顶端组织中检测到初级和传递sirna。在某些实施方案中,在植物中系统性抑制基因表达的方法,该方法包括用包含至少一个多核苷酸和转移剂的组合物处理所述植物,其中所述多核苷酸包含与编码所提供植物的thca合成酶基因的基因或转录物基本上相同或基本上互补的至少18个或至少19个连续核苷酸,从而与未经组合物处理的对照植物相比,所述植物或其后代中的基因表达被系统性抑制。

用于抑制靶基因的组合物可以包含与多个基因或与一个或多个基因的多个片段基本上相同或基本上互补的一个或多个多核苷酸。在某些实施方案中,用于抑制靶基因的组合物可以包含与以下基本上相同或基本上互补的一个或多个多核苷酸:靶基因的多个连续片段、靶基因的多个非连续片段、靶基因的多个等位基因,或来自一个或多个物种的多个靶基因。

在某些实施方案中,多核苷酸包括核苷酸序列(18个或更多个核苷酸)的两个或多个拷贝,其中所述拷贝以串联方式排列。在另一个实施方案中,多核苷酸包括核苷酸序列(18个或更多个核苷酸)的两个或多个拷贝,其中所述拷贝以逆向重复方式排列(形成至少部分自补的链)。多核苷酸可以包括串联和逆向重复的拷贝两者。无论以串联或逆向重复方式排列,每个拷贝可以与下一个直接相连,或可以通过一个或多个核苷酸的任选间隔子将拷贝对分开。任选间隔子可以是不相关序列(即,不是与拷贝基本上相同或基本上互补,也不是与内源靶基因或从内源靶基因转录的rna的18个或更多个连续核苷酸的序列基本上相同或基本上互补)。或者,任选间隔子可以包括与位于拷贝靶向片段附近的内源靶基因的片段互补的序列。在某些实施方案中,多核苷酸包括约20至约30个核苷酸的核苷酸序列的两个拷贝,其中所述两个拷贝通过不长于所述核苷酸序列长度的间隔子分开。

在某些实施方案中,核酸分子包含如下genbank登录号所示的序列或该序列的补体:jq437488.1(seqidno:1);jq437487.1(seqidno:2);jq437486.1(seqidno:3);jq437485.1seqidno:4);jq437484.1(seqidno:5);jq437483.1(seqidno:6);jq437482.1(seqidno:7);jq437481.1(seqidno:8);jq437496.1(seqidno:9);jq437495.1(seqidno:10),jq437494.1(seqidno:11);jq437493.1(seqidno:38);jq437492.1(seqidno:12);jq437491.1(seqidno:13);jq437490.1(seqidno:14);jq437489.1(seqidno:15);ab212841.1(seqidno:16),ab212840.1(seqidno:17);ab212839.1(seqidno:18);ab212838.1(seqidno:19);ab212837.1(seqidno:20);ab212836.1(seqidno:21);ab212835.1(seqidno:22);ab212834.1(seqidno:23);ab212833.1(seqidno:24);ab212832.1(seqidno:25);ab212831.1(seqidno:26);ab212830.1(seqidno:27);ab212829.1(seqidno:28);ab183705.1(seqidno:29)ab183704.1(seqidno:30);ab183703.1(seqidno:31);ab183702.1(seqidno:32);ab183701.1(seqidno:33);ab183700.1(seqidno:34);ab183699.1(seqidno:35);ab183698.1(seqidno:36),eu839988.1(seqidno:37);ab057805.1(seqidno:40);e33090.1(seqidno:44),e33091.1(seqidno:45),ab731220.1(seqidno:39);其变体或片段,或与核酸分子具有至少约83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性或100%序列一致性的多核苷酸序列。在某些实施方案中,片段具有至少18、19、20、21、22、24、25、80、100、150或200个连续核苷酸。

在某些实施方案中,核酸分子包含如下genbank登录号所示的序列或该序列的补体:ab731220.1(seqidno:39);ab292682.1(seqidno:42);ab292683.1(seqidno:41);ab292684.1(seqidno:43);ab212829.1(seqidno:28);ab212838.1(seqidno:19);ab212837.1(seqidno:20);ab212835.1(seqidno:22);ab212834.1(seqidno:23);ab212832.1(seqidno:25);ab057805.1(seqidno:40)ab731220.1(seqidno:39);ab212833.1(seqidno:24);ab212836.1(seqidno:21);ab212841.1(seqidno:16);ab212831.1(seqidno:26);ab212839.1(seqidno:18);ab212830.1(seqidno:27);ab212840.1(seqidno:17);jq437490.1(seqidno:14);jq437485.1seqidno:4);jq437487.1(seqidno:2);jq437486.1(seqidno:3);jq437481.1(seqidno:8);jq437482.1(seqidno:7);jq437483.1(seqidno:6);jq437484.1(seqidno:5);jq437488.1(seqidno:1);jq437492.1(seqidno:12);jq437489.1(seqidno:15);jq437491.1(seqidno:13);其变体或片段,或与核酸分子具有至少约83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性或100%序列一致性的多核苷酸序列。在某些实施方案中,片段具有至少18、19、20、21、22、24、25、80、100、150或200个连续核苷酸。

在其他实施方案中,提供包含与编码thca合成酶的序列及其片段或其补体具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%一致性的序列的核酸。

在本发明的一些实施方案中,核苷酸序列包含一个或多个替换、插入和/或缺失。对于某些实施方案,核苷酸序列包括一个或多个t-dna插入。在其他实施方案中,核酸包含选择标记盒。在其他实施方案中,核苷酸序列包括一个或多个点突变。在某些实施方案中,核苷酸序列包括缺失。在某些实施方案中,核苷酸序列包括重排。在某些实施方案中,核苷酸序列包括移码。

还提供与本发明的核酸或其补体杂交的核酸。在某些实施方案中,提供在低严格、中等严格或高严格条件下与任一序列杂交的核酸。本领域技术人员容易理解,以下因素影响杂交和杂交强度(即,核酸之间关联的强度):如核酸之间互补程度、涉及的条件严格度、所形成杂合体的tm,和核酸内的g:c比例。此类人员容易确定合适的严格条件(参见,例如sambrook等,molecularcloning:alaboratorymanual,2nded.,coldspringharborlaboratorypress,newyork(1989)pp.9.50-51,11.48-49和11.2-11.3)。

通常,在高严格条件下,仅高度相似的序列会杂交(通常>95%一致性)。在中等严格条件下,通常具有超过80%一致性的那些序列会杂交,在低严格条件下,具有超过50%一致性的那些序列会杂交。

当用于指核酸杂交时,“高严格条件”的非限制性实例包括与以下等同的条件:当使用长度为约500个核苷酸的探针时,在由5xsspe(43.8g/lnacl、6.9g/lnah2po4h2o和1.85g/ledta,用naoh将ph调节为7.4)、0.5%sds、5xdenhardt试剂和100μg/ml变性鲑鱼精子dna组成的溶液中于42℃结合或杂交,随后在包含0.1xsspe、1.0%sds的溶液中于42℃洗涤。当用于指核酸杂交时,“中等严格条件”的非限制性实例包括与以下等同的条件:当使用长度为约500个核苷酸的探针时,在由5xsspe(43.8g/lnacl、6.9g/lnah2po4h2o和1.85g/ledta,用naoh将ph调节为7.4)、0.5%sds、5xdenhardt试剂和100μg/ml变性鲑鱼精子dna组成的溶液中于42℃结合或杂交,随后在包含1.0xsspe、1.0%sds的溶液中于42℃洗涤。当用于指核酸杂交时,“低严格条件”的非限制性实例包括与以下等同的条件:当使用长度为约500个核苷酸的探针时,在由5xsspe(43.8g/lnacl、6.9g/lnah2po4h2o和1.85g/ledta,用naoh将ph调节为7.4)、0.5%sds、5xdenhardt试剂和100μg/ml变性鲑鱼精子dna组成的溶液中于42℃结合或杂交,随后在包含5xsspe、0.1%sds的溶液中于42℃洗涤。核酸可以包括其他序列。例如,核酸可以包括多个限制性位点、其他编码序列(例如,纯化标签、定位信号、作为融合蛋白、作为前蛋白等)和/或非编码序列(例如,内含子或内含肽、调控元件如启动子(包括组成型启动子如camv35s启动子、诱导型启动子、组织特异性启动子(例如根特异性、花特异性启动子、果实特异性启动子、种子特异性启动子或叶特异性启动子))、增强子、终止子等),和/或在载体或宿主环境中,其中编码转录因子或转录因子同源多肽的多核苷酸是内源或外源基因。用于植物/植物细胞的合适的其他编码序列(例如,纯化标签、定位信号、作为融合蛋白、作为前蛋白等)、非编码序列(例如,内含子、调控元件如启动子(包括组成型启动子、诱导型启动子、组织特异性启动子)、增强子、终止子等)和载体是本领域已知的。

调控元件

用于表达核酸序列的示例性启动子包括植物启动子如camv35s启动子(odell等,1985)、或其他如camv19s(lawton等,1987、nos(ebert等,1987)、adh(walker等,1987)、蔗糖合成酶(yang和russell,1990)、微管蛋白、肌动蛋白(wang等,1992)、cab(sullivan等,1989)、pepcase(hudspeth和grula,1989)或与r基因复合物相关的那些(chandler等,1989)。组织特异性启动子如根细胞启动子(conkling等,1990)和组织特异性增强子(fromm等,1986),以及诱导型启动子如aba-和膨压诱导型启动子也认为是有用的。pal2启动子在本发明特别有用(美国专利申请公开2004/0049802,其全部公开通过引用并入本文)。

转录起始位点和编码序列开始之间的dna序列,即非翻译前导序列也可以影响基因表达。因此,可以期望使用本发明的转化构建体的特定前导序列。预期的优选前导序列包括含有预测引导连接基因的最佳表达的序列的那些,即,包括优选的可以提高或维持mrna稳定性且防止不适当的翻译启动的共有前导序列。这种序列的选择是本领域技术人员基于本公开将知晓的。通常优选源自植物中高表达的基因的序列。

预期构建的用于根据本发明的载体包括ocs增强子元件。该元件开始被鉴定为来自农杆菌的章鱼碱合成酶(ocs)基因的16bp回文增强子(ellis等,1987),且存在于至少10个其他启动子中(bouchez等,1989)。当应用于植物转化时,使用增强子元件例如ocs元件,尤其是元件的多个拷贝,可以发挥作用以提高从邻近启动子的转录水平。

可以预期,可以将多核苷酸序列或选择的dna序列引入到新型启动子或增强子等或同源或组织特异性启动子或控制元件的控制下。用于转基因植物中组织特异性靶向基因的载体将通常包括组织特异性启动子,且可以包括其他组织特异性控制元件,例如增强子序列。引导在某些植物组织中的特异性或增强的表达的启动子是本领域技术人员基于本公开将知晓的。这些包括例如,绿色组织特异性的rbcs启动子;在根或受伤的叶组织中具有较高活性的ocs、nos和mas启动子。在某些实施方案中,可以使用引起选择dna低表达的启动子。可以通过以下获得低表达启动子:突变和/或重组引起高表达的启动子的dna元件,或选择引起低丰度mrna或蛋白质表达的基因的上游调控元件。

现有技术已经描述了启动子;因此,本发明在某些实施方案中提供启动子和选择dna的新型组合。在一个实施方案中,将组成型启动子克隆至选择dna的5’,从而在转化细胞中组成型表达选择dna。

在另一个实施方案中,可以使用诱导型启动子来打开选择dna在某些情况下的表达。例如,可以使用克隆至选择dna上游的冷休克启动子以在低温下诱导选择dna。已经描述了其他环境诱导型启动子,且可以用于与选择dna的新型组合。另一种诱导型启动子是化学诱导型启动子。这种启动子可以通过施用化学诱导剂精确激活。化学诱导型启动子的实例包括类固醇诱导型启动子和群体感应启动子(参见例如,you等,2006;美国专利申请公开号2005/0227285)。最近表明,包含配体特异性适体和核糖开关的修饰rna分子可用于化学调节靶基因的表达(tucker等,2005;国际公开号wo2006073727)。这种核糖调节剂(riboregulator)可通过添加或消除化学配体来控制taler编码基因的表达。

构建体可以包含与宿主细胞中功能性的启动子序列可操作连接的本发明的核苷酸序列。这种启动子可以是组织特异性的,且可以是例如害虫攻击对象的组织类型特异性的。例如,在根虫的情况下,可能期望使用提供叶优先表达的启动子。

在不同植物种类中功能性的启动子也是本领域熟知的。用于在植物中表达多肽的启动子包括如odell等(1985)所述的诱导型、病毒、合成的或组成型的那些,和/或时间调控的、空间调控的和时空调控的启动子。优选启动子包括增强的camv35s启动子和fmv35s启动子。为本发明的目的,例如为了最佳地控制以根为食的物种,优选在植物的根中实现这些基因的最高表达水平。已经鉴定了大量根增强启动子,其是本领域已知的(lu等,2000;美国专利号5,837,848和6,489,542)。

叶特异性启动子的实例描述于美国专利6,229,067,其全文通过引用并入本文,和花特异性启动子是本领域已知的,描述于dul.等,plantmolecularbiologyreporter,february2014,volume32,issue1,pp234-245。

终止子

根据本发明制备的转化构建体通常包括3'端dna序列,其作为信号来终止转录,且允许与启动子可操作连接的编码序列产生的mrna的多腺苷酸化。可用于本上下文的终止子的实例包括来自于根癌土壤杆菌(agrobacteriumtumefaciens)的胭脂碱合成酶基因(nos3'端)的那些(bevan等,1983),来自根癌土壤杆菌的胭脂碱合成酶基因的t7转录物的终止子,和来自马铃薯或西红柿的蛋白酶抑制剂i或ii基因的3'端。需要时,可以进一步包括调控元件诸如adh内含子(callis等,1987)、蔗糖合成酶内含子(vasil等,1989)或tmvω元件(gallie等,1989)。

标志物基因

通过使用可选择或可筛选的标志物蛋白,可以提供或增强鉴定转化体的能力。“标志物基因”是赋予表达标志物蛋白的细胞不同表型,从而使这种转化细胞与不具有标志物的细胞区分开来的基因。这种基因可以编码可选择或可筛选的标志物,取决于标志物是否赋予可以通过化学手段,即通过使用选择剂(例如,除草剂、抗生素等)“选择”的性状,或它是否是可以通过观察或测试,即通过“筛选”(例如,绿色荧光蛋白)鉴定的简单性状。当然,很多合适的标志物蛋白的实例是本领域已知的,且可以用于实施本发明。

术语可选择或可筛选的标志物还包括编码“可选择标志物”的基因,可以检测它的分泌作为鉴定或选择转化细胞的手段。实例包括可以通过抗体相互作用鉴定的分泌型抗原标志物,或甚至可以通过其催化活性检测的分泌型酶。分泌型蛋白分为若干类,包括例如通过elisa可检测的小扩散性蛋白;在胞外溶液中可检测的小活性酶(例如α-淀粉酶、β-内酰胺酶、草丁膦乙酰转移酶);和插入或捕获于细胞壁中的蛋白质(例如,包括如在伸展蛋白的表达单元或烟草prs中发现的前导序列的蛋白质)。

很多可选择标志物编码区是已知的,且可以用于本发明,包括但不限于:neo(potrykus等,1985),其提供卡那霉素抗性且可以使用卡那霉素、g418、巴龙霉素等选择;bar,其赋予双丙氨磷或草丁膦抗性;赋予草甘膦抗性的突变epsp合成酶蛋白(hinchee等,1988);赋予对溴苯腈的抗性的腈水解酶,如来自臭鼻克雷伯菌(klebsiellaozaenae)的bxn(stalker等,1988);赋予对咪唑啉酮类、磺酰脲类或其他als抑制化学物的抗性的突变乙酰乳酸合成酶(als)(欧洲专利申请154,204,1985);甲氨蝶呤抗性的dhfr(thillet等,1988);赋予对除草剂茅草枯的抗性的茅草枯脱卤酶;或赋予对5-甲基色氨酸的抗性的突变甲酸酯合成酶。

能够在系统中使用以选择转化体的可选择标志物的说明性实施方案是编码草丁膦乙酰转移酶的那些,例如来自吸湿链霉菌(streptomyceshygroscopicus)的bar基因或来自产绿色链霉菌(streptomycesviridochromogenes)的pat基因。草丁膦乙酰转移酶(pat)使除草剂双丙氨磷、草丁膦(ppt)的活性成分失活。ppt抑制谷氨酰胺合成酶(murakami等,1986;twell等,1989),造成氨的快速积累和细胞死亡。

可以使用的可筛选标志物包括β-葡萄糖醛酸酶(gus)或uida基因,其编码各种显色底物已知的酶;r-基因座基因,其编码在植物组织中调控生产花色苷色素(红色)的产物(dellaporta等,1988);β-内酰胺酶基因(sutcliffe,1978),其编码各种显色底物已知的酶(例如,产色头孢菌素padac);xyle基因(zukowsky等,1983),其编码可以转化显色儿茶酚的儿茶酚双加氧酶;α-淀粉酶基因(ikuta等,1990);酪氨酸酶基因(katz等,1983),其编码能够将酪氨酸氧化为然后缩合形成易于检测的化合物黑色素的dopa和多巴醌的酶;β-半乳糖苷酶基因,其编码存在显色底物的酶;荧光素酶(lux)基因(ow等,1986),其允许生物发光检测;发光蛋白基因(prasher等,1985),其可用于钙敏感的生物发光检测;或编码绿色荧光蛋白的基因(sheen等,1995;haseloff等,1997;reichel等,1996;tian等,1997;wo97/41228)。预期编码绿色荧光蛋白(gfp)的基因也是特别有用的报告基因(sheen等,1995;haseloff等,1997;reichel等,1996;tian等,1997;wo97/41228)。用特定波长的光照射后,绿色荧光蛋白的表达可以在细胞或植物中显示为荧光。

thca合成酶的表达和/或活性改变的植物/植物细胞

描述了与野生型植物(例如,初始品种)相比,thc生产改变的大麻植物和/或植物细胞。在某些实施方案中,提供与野生型植物(例如,初始品种)相比,thca合成酶的表达和/或活性下调的大麻植物/细胞。在某些实施方案中,大麻植物/细胞产生降低量的thc或不产生thc。在大麻植物/细胞具有降低量的thc或不具有thc的某些实施方案中,thc生物合成途径上的其他代谢物的生产增加。

在某些实施方案中,提供thc生物合成途径中的一种或多种次级代谢物的生产提高且thc生产下调的大麻植物和细胞。在具体的实施方案中,提供cbd和/或大麻色烯生产提高且thc生产下调的大麻植物和细胞。

在某些实施方案中,提供与thc生物合成途径共享步骤和中间体的一种或多种次级代谢物的生产提高且thca合成酶的表达和/或活性下调的大麻植物和/或细胞。在具体的实施方案中,提供cbd和/或大麻色烯生产提高且thca合成酶的表达和/或活性下调的大麻植物和/或细胞。

可以将大麻植物工程化以改变除thca合成酶之外的其他蛋白质的表达和/或活性。例如,大麻植物还可以包括改变的与thca合成酶共享中间体的其他酶(例如cbda合成酶、cbca合成酶)的表达和/或活性。同样,本发明的大麻植物可以与具有特定表型的植物杂交。

次级代谢物生产改变的大麻植物可以是非诱变的、诱变的、或转基因的,及其后代。

在某些实施方案中,显示改变的次级代谢物的大麻植物是自发突变的结果。

在某些实施方案中,显示改变的次级代谢物的大麻植物已经通过化学或物理手段诱变。例如,可以使用甲基磺酸乙酯(ems)作为诱变剂或辐射,例如x射线、γ射线,可以使用快中子辐射作为诱变剂。

在某些其他实施方案中,显示改变的次级代谢物的大麻植物是遗传改造的。

反义、sirna和rnai

反义或rna干扰方法也可用于下调本发明的核酸表达,例如作为调控植物表型的进一步机制。即,本发明的核酸的反义序列或其子序列可用于阻断天然存在的同源核酸的表达。可以使用各种有义和反义技术,如在lichtenstein和nellen(antisensetechnology:apracticalapproachirlpressatoxforduniversity,oxford,england,1997)中所示。

在某些实施方案中,将有义或反义序列引入其中它们被转录的细胞。这种序列可以包括简单的寡核苷酸序列和催化序列,例如核酶。

在某些实施方案中,通过引入表达反义thca合成酶编码链或其片段的构建体来产生转基因植物中thca合成酶表达的降低或消除(即,“敲除”或“敲低”)。对于反义抑制,thca合成酶cdna或其片段相对于表达载体中的启动子序列反向排列(相对于编码序列)。在某些实施方案中,引入的序列不需要与全长cdna或基因对应,也不需要与待转化植物中发现的cdna或基因相同。

在某些实施方案中,反义序列需要仅能够与靶基因或目标rna杂交。因此,当引入序列长度较短时,有效的反义抑制将需要与内源转录因子序列具有较高程度的同源性。尽管可以使用各种长度的反义序列,在一些实施方案中,载体中引入的反义序列的长度在某些实施方案中为至少30个核苷酸。在某些实施方案中,反义序列的长度增加,观察到反义抑制增强。在一些实施方案中,载体中反义序列的长度大于100个核苷酸。所述反义构建体的转录导致产生的rna分子包含与从待抑制的内源基因转录的mrna分子反向互补的序列。反义核酸还可以包括其他序列。

在某些实施方案中,通过引入表达靶向thca合成酶的sirna来完成转基因植物中thca合成酶表达的降低或消除(即,“敲除”或“敲低”)。在某些实施方案中,sirna是具有磷酸化5'端和羟基化3'端(具有两个悬垂核苷酸)的短(20至24bp)双链rna(dsrna)。

反义和rnai处理代表根据本发明改变thca合成酶活性的一种方式。具体地,以反义方向,或有义和反义方向的组合包含thca合成酶编码序列(包括其片段)的构建体可用于降低或有效消除植物中thca合成酶的表达,并获得改善的保质期,如本文所述。因此,这可用于“敲除”thca合成酶或其同源序列。

rnai技术是本领域熟知的,例如描述于lehner等,(2004)和downward(2004)。该技术基于以下事实:双链rna能够引导与一条链或另一条链具有序列互补性的信使rna的降解(fire等,1998)。因此,通过表达有义和反义方向的特定编码序列(作为对应编码序列的片段或更长部分),可以下调该编码序列的表达。

反义(在一些方面,rnai)方法利用核酸倾向于与“互补”序列配对这一事实。互补是指多核苷酸能够根据标准的watron-crick互补规则进行碱基配对。即,较大的嘌呤将与较小的嘧啶碱基配对以形成鸟嘌呤与胞嘧啶配对(g:c)和腺嘌呤与dna情况下的胸腺嘧啶配对(a:t),或腺嘌呤与rna情况下的尿嘧啶配对(a:u)的组合。在杂交序列中包括较不常见的碱基例如肌苷、5-甲基胞嘧啶,6-甲基腺嘌呤、次黄嘌呤和其他不影响配对。

用多核苷酸靶向双链(ds)dna导致形成三螺旋;靶向rna将导致形成双螺旋。当引入靶细胞时,反义寡核苷酸特异性结合其靶标多核苷酸,并干扰转录、rna加工、转运、翻译和/或稳定性。可以在体外或体内使用反义和rnai构建体,或编码这种rna的dna以抑制宿主细胞内(例如宿主植物细胞内)的基因转录或翻译或两者。在本发明的某些实施方案中,这种寡核苷酸可以包含本文提供的核酸序列的任何独特部分。在本发明的某些实施方案中,这种寡核苷酸可以包含可处于有义和/或反义方向的thca合成酶的核酸序列的至少18、19、20、21、22、23、24、25、26、27、28、29或30或更多个连续核苷酸和/或其补体。通过包括有义和反义两个方向的序列,可以实现对应编码序列的抑制增强。

可以设计与全部或部分的启动子和其他控制区、外显子、内含子或甚至基因的外显子-内含子边界互补的构建体。预期最有效的构建体将包括与内含子/外显子剪接点互补的区域。因此,一个实施方案包括与内含子-外显子剪接点的50-200个碱基内的区域互补的构建体。已经观察到,某些外显子序列可以包括于构建体中而不严重影响其靶标选择性。包括的外显子物质的量将根据所用的具体外显子和内含子序列而变化。通过体外测试构建体容易简单地测试是否包括过多的外显子dna,从而测定是否影响正常的细胞功能或是否影响具有互补序列的相关基因的表达。

如上所述,“互补”或“反义”是指其全长基本上互补且具有非常少的碱基错配的多核苷酸序列。术语“补体”还包括与参考序列反向互补的序列。例如,当长度为15个碱基的序列具有13或14个位置的互补核苷酸时,其可以称为互补。自然,完全互补的序列将是其在整个长度上完全互补且没有碱基错配的序列。也预期具有较低程度同源性的其他序列。例如,可以设计具有有限的高同源区,但也包含非同源区的rnai或反义构建体(例如核酶;参见以上)。尽管同源性小于50%,这些分子在合适条件下会结合靶标序列。

将一部分基因组dna与cdna或合成序列组合以制备特定构建体是有利的。例如,当最终构建体中希望有内含子时,将需要使用基因组克隆。cdna或合成多核苷酸为构建体的剩余部分提供更方便的限制性位点,从而可用于其他序列。

铺盖(tiling)

可以通过“铺盖”具有部分重叠区(例如,在靶基因的长度上约25个核苷酸的重叠区)的随机长度的片段(例如,长度为200-300个多核苷酸)来鉴定多核苷酸触发分子。可以比对多个基因靶标序列,并将具有共同同源性的多核苷酸序列区鉴定为多个靶标的潜在触发分子。可以比对多个靶标序列,并将同源性差的序列区域鉴定为用于选择性区分靶标的潜在的触发分子。为选择性抑制单个基因,可以从靶基因独特的区域(从转录区或非编码区,例如启动子区、3’非翻译区、内含子等)选择触发序列。

在一些实施方案中,选择在基因沉默中有效的多核苷酸序列中使用多核苷酸序列的随机设计或经验选择。在一些实施方案中,针对预期植物的基因组dna筛选多核苷酸序列,以使其他基因的无意沉默最小化。

插入突变

在一个实施方案中,可以通过插入突变来获得转基因植物中thca合成酶的表达降低或消除(即,“敲除”),所述插入突变使用根癌土壤杆菌的t-dna或选择标记盒或任何其他无义dna片段。产生插入突变体后,可以筛选突变体以鉴定在thca合成酶基因中含有插入的那些。可以将在期望基因中包含一个或多个转基因插入事件的植物杂交以制备该突变的纯合体植物,如在koncz等(methodsinarabidopsisresearch;worldscientific,1992)中所述。

核酶

还可以使用核酶实现基因表达的抑制。核酶是具有高特异性内切核酸酶活性的rna分子。核酶的生产和使用公开于其全文通过引用并入的美国专利号4,987,071和美国专利号5,543,508。可以使用包括反义rna的合成核酶序列为反义rna赋予rna切割活性,从而切割与反义rna杂交的内源mrna分子,进而导致内源基因表达的反义抑制增强。

显性负转录因子

也可以使用表达突变形式的转录因子mrna的载体(例如包含一个或多个终止密码子或无义突变的序列)来抑制基因(例如thca合成酶)的表达,从而降低或消除其活性并改变一个或多个性状。用于制备这种构建体的方法描述于其全文通过引用并入的美国专利号5,583,021。在某些实施方案中,通过在转录因子基因中引入未成熟终止密码子来制备这种构建体。或者,可以使用双链rna通过基因沉默来改变植物性状,如sharp(genesanddevelopment13:139-141,1999)所述。

同源重组或定点突变

还可以通过消除内源基因,例如通过同源重组来改变植物表型(kempin等(1997)nature389:802)。

靶向基因组改造是遗传操作植物细胞的有利工具。例如,可以在靶向基因组位点整合外源序列,和/或使特定内源染色体序列缺失、失活或改变。在某些实施方案中,使用工程化的核酸酶,例如锌指核酸酶(zfn)或转录活化剂样效应子核酸酶(talen)。

在一些实施方案中,可以使用用分子生物学方法定制设计的基因组改造的酶。可以获得包含至少一个定制内切核酸酶的识别序列的至少一个植物细胞,其中所述定制内切核酸酶是融合蛋白,且所述融合蛋白包含锌指dna结合结构域或vir蛋白结构域。进一步,定制内切核酸酶可以包含多肽、催化活性的rna、rna引导的内切核酸酶或合成适体。例如,定制内切核酸酶可以是大范围核酸酶,其中所述大范围核酸酶选自i-crei、pi-scei和i-ceui。例如,定制内切核酸酶可以包含“laglidadg”、“giy-yig”、“his-cysbox”、“zfn”或“hnh”序列基序。

在一些实施方案中,定制内切核酸酶作为蛋白质或作为核酸分子递送。核酸分子可以与在植物细胞中具有活性的启动子可操作连接,其中所述启动子是组成型启动子、诱导型启动子、组织特异性启动子、细胞周期调节启动子或发育调节启动子。核酸构建体可以包含至少一个侧翼是一个或多个t-dna边界的核酸分子,所述核酸分子编码至少一个定制内切核酸酶。构建体可以包含可选择或可筛选标志物基因。

植物细胞可以进一步包含第二外源定制内切核酸酶,其中第一和第二外源定制内切核酸酶各自包含植物细胞基因组内的不同识别序列,且能够产生接近所述识别序列的切割。植物细胞可以进一步包含选择dna、其中选择dna包含启动子、内含子、编码序列或3’utr。

通过向植物细胞中引入至少第一定制内切核酸酶改变植物细胞中的目标基因座,其中所述细胞在目标基因座中或附近包含定制内切核酸酶的识别序列;允许定制内切核酸酶在组成目标基因座的dna或目标基因座侧翼dna中产生双链断裂;和将细胞或其后代细胞鉴定为在所述目标基因座包含改造。

在某些情况下,向植物细胞基因组中仅引入一个定制内切核酸酶识别序列;或者,可以向植物细胞引入至少第二定制内切核酸酶,其中所述细胞包含所述第二定制内切核酸酶的第二识别序列,且所述至少第二内切核酸酶与第一内切核酸酶同时引入或在连续转化下引入。引入植物细胞的任何内切酶可以瞬时或稳定表达。

用编码至少一个定制内切核酸酶和可选择或可筛选标志物基因的表达构建体瞬时或稳定转化植物细胞后,可以根据可选择或可筛选标志物基因的存在来选择或筛选植物或植物细胞。

转化后,定制内切核酸酶可以在邻近识别序列的植物细胞基因组中产生双链断裂,其中所述双链断裂是在编码目标基因产物的序列中。进一步,目标基因座的改造包括基因转化、基因替换、同源重组、异源重组、缺失或部分同源重组,其中所述改造是在调控目标基因表达的序列中。

使用本领域已知的测定细胞或其后代细胞中改造证据的方法,包括基因型分析、表型分析或将植物基因型和植物表型相关联。基因型分析包括pcr或核酸测序。表型分析可以包括:视觉测定、农艺参数的测量、生化测定或免疫测定。

因此,本发明提供用于改变植物基因组中目标基因座处的等位基因的方法,包括:在植物细胞中表达第一和第二定制内切核酸酶,其中所述第一和第二定制内切核酸酶引入目标基因座侧翼的双链断裂;和允许在目标基因座处发生遗传重组。该方法可以进一步包括向植物细胞中引入靶标dna,其中所述遗传重组导致靶标dna替换所述等位基因。

也可以使用cre-lox系统改变植物性状(例如,如美国专利号5,658,772所述)。可以改变植物基因组,以包括第一和第二lox位点,其然后与cre重组酶接触。如果lox位点方向相同,两个位点之间的插入dna序列被切除。如果lox位点方向相反,插入序列被倒置。

此外,也可以使用采用短发夹rna(shrna)系统、crispr/cas系统的互补成熟crisprrna(crrna)、病毒诱导的基因沉默(vigs)系统来制备thca合成酶下调或敲除的突变体。也可以使用显性负性方法来制备thca合成酶下调或敲除的突变体。

定点突变的其他实例包括但不限于大范围核酸酶和talen,也理解可以使用翻译后基因沉默来下调基因表达。

在某些实施方案中,通过各种如上所述的或本领域已知的技术来生产转基因植物(或植物细胞、或植物外植体、或植物组织)。构建载体后,将载体或多核苷酸引入目标植物、植物细胞、植物外植体或植物组织。在某些实施方案中,植物细胞、外植体或组织可以再生以产生转基因植物。

rna导向的内切核酸酶

在某些实施方案中,可以使用rna导向的内切核酸酶作为包含向导rna的蛋白质-rna复合物的一部分来沉默靶标序列。向导rna与rna导向的内切核酸酶相互作用,将内切核酸酶引导至特定靶标位点,其中向导rna的5'端与特定的原型间隔序列碱基配对。

rna导向的内切核酸酶可以源自规律成簇的间隔短回文重复序列(crispr)/crispr-相关(cas)系统。crispr/cas系统可以是i型、ii型或iii型系统。合适的crispr/cas蛋白的非限制性实例包括cas3、cas4、cas5、cas5e(或casd)、cas6、cas6e、cas6f、cas7、cas8a1、cas8a2、cas8b、cas8c、cas9、cas10、cas10d、casf、casg、cash、csy1、csy2、csy3、cse1(或casa)、cse2(或casb)、cse3(或case)、cse4(或casc)、csc1、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csz1、csx15、csf1、csf2、csf3、csf4和cu1966。

通常,crispr/cas蛋白包含至少一个rna识别和/或rna结合结构域。rna识别和/或rna结合结构域与向导rna相互作用。crispr/cas蛋白还可以包含核酸酶结构域(即dnase或rnase结构域)、dna结合结构域、解旋酶域、rnase结构域、蛋白质-蛋白质相互作用结构域、二聚化结构域和其他结构域。

crispr/cas样蛋白可以是野生型crispr/cas蛋白、修饰的crispr/cas蛋白,或野生型或修饰的crispr/cas蛋白的片段。可以修饰crispr/cas样蛋白以增加核酸结合亲和性和/或特异性,改变酶活性,和/或改变蛋白质的另一种性质。例如,crispr/cas样蛋白的核酸酶(即,dnase、rnase)结构域可以被修饰、缺失或失活。或者,可以截短crispr/cas样蛋白以去除对于融合蛋白的功能不需要的结构域。也可以截短或修饰crispr/cas样蛋白以优化融合蛋白效应子结构域的活性。

转化

合适的转化技术可以包括但不限于:植物原生质体的电穿孔;脂质体介导的转化;聚乙二醇(peg)介导的转化;使用病毒的转化;微注射植物细胞;基因枪轰击植物细胞;真空渗透;和根癌土壤杆菌介导的转化。转化手段以引起序列稳定或瞬时表达的方式将核苷酸序列引入植物。

通过克隆序列转化改变植物特征的实例包括:美国专利号5,571,706;5,677,175;5,510,471;5,750,386;5,597,945;5,589,615;5,750,871;5,268,526;5,780,708;5,538,880;5,773,269;5,736,369;和5,610,042,其说明本技术领域的现有知识且通过引用并入本文。

转化后,用整合入转化载体的显性可选择标志物选择植物。在某些实施方案中,这种标志物赋予转化植物对抗生素或除草剂的抗性,可以通过将植物暴露于合适浓度的抗生素或除草剂来选择转化体。选择转化植物并将其种植至成熟后,鉴定显示改变性状的那些植物。改变的性状可以是如上所述的任何那些性状。此外,可以通过使用northern印迹、rt-pcr、rnaseq或微阵列分析mrna表达,或用免疫印迹或western印迹或凝胶迁移试验分析蛋白质表达来测定根据本发明的多肽或多核苷酸的表达水平或活性。

据信用于本发明的转化植物或其他细胞的合适的方法实际上包括可以将dna引入细胞的任何方法,例如直接递送dna如通过peg介导的原生质体转化(omirulleh等,1993)、干燥/抑制-介导的dna摄入(potrykus等,1985)、电穿孔(其全文通过引用具体并入本文的美国专利号5,384,253)、用碳化硅纤维搅拌(kaeppler等,1990;其全文通过引用具体并入本文的美国专利号5,302,523;和其全文通过引用具体并入本文的美国专利号5,464,765)、农杆菌介导的转化(其全文通过引用具体并入本文的美国专利号5,591,616和美国专利号5,563,055)和dna包被颗粒的加速(美国专利号5,550,318;美国专利号5,538,877;和美国专利号5,538,880;其全文通过引用具体并入本文)等。通过应用此类技术,实际上可以稳定转化任何植物类型的细胞,且这些细胞发育成转基因植物。

农杆菌介导的转化

农杆菌介导的转移是用于将基因引入植物细胞的广泛应用的系统,因为可以将dna引入整个植物组织,从而绕过从原生质体再生完整植物的需要。使用农杆菌介导的植物整合载体将dna引入植物细胞是本领域熟知的。参见例如,其全文通过引用具体并入本文的fraley等,(1985)、rogers等,(1987)和美国专利号5,563,055所述的方法。

农杆菌介导的转化在双子叶植物中最有效,是用于转化双子叶植物包括拟南芥、烟草、西红柿、苜蓿和马铃薯的优选方法。实际上,尽管农杆菌介导的转化已经常规用于双子叶植物许多年,它今年才开始应用于单子叶植物。农杆菌介导的转化技术的进步已经使该技术适用于几乎所有的单子叶植物。例如,已经将农杆菌介导的转化技术应用于水稻(hiei等,1997;其全文通过引用具体并入本文的美国专利号5,591,616)、小麦(mccormac等,1998)、大麦(tingay等,1997;mccormac等,1998)、苜蓿(thomas等,1990)和玉米(ishidia等,1996)。

近代的农杆菌转化载体能够在大肠杆菌和农杆菌中复制,从而允许如描述的方便操作(klee等,1985)。此外,最近在用于农杆菌介导的基因转移的载体上的技术进步已经改进了载体中基因和限制性位点的排列以加快构建能够表达各种多肽编码基因的载体。所述载体(rogers等,1987)具有方便的多接头区域,其侧翼是用于直接表达插入的多肽编码基因的启动子和多腺苷酸位点,适于本发明的目的。此外,包含致毒和解毒的ti基因两者的农杆菌可用于转化。在其中农杆菌介导的转化是有效的那些植物品系中,选择这种方法是因为基因转移容易且性质确定。

电穿孔

为通过电穿孔进行转化,可以使用易碎组织,例如细胞悬浮培养物或胚性愈伤组织,或者可以直接转化未成熟的胚或其他组织化的组织。在这种技术中,可以通过将选择的细胞暴露于果胶降解酶(果胶酶)或以受控的方式机械破坏以部分降解它们的细胞壁。已经通过完整细胞的电穿孔转化的一些物种的实例包括玉米(美国专利号5,384,253;rhodes等,1995;d’halluin等,1992)、小麦(zhou等,1993)、西红柿(hou和lin,1996)、大豆(christou等,1987)和马铃薯(lee等,1989)。

也可以使用原生质体进行植物的电穿孔转化(bates,1994;lazzeri,1995)。例如,通过电穿孔源自子叶的原生质体制备转基因大豆植物描述于dhir和widholm的国际专利申请公开号wo9217598(通过引用具体并入本文)。已经描述了原生质体转化的物种的其他实例包括大麦(lazerri,1995)、高粱(battraw等,1991)、玉米(bhattacharjee等,1997)、小麦(he等,1994)和西红柿(tsukada,1989)。

基因枪轰击

根据本发明向植物细胞递送转化dna片段的另一种方法是基因枪轰击(美国专利号5,550,318;美国专利号5,538,880;美国专利号5,610,042;和pct申请wo94/09699;各自的全文通过引用具体并入本文)。在该方法中,用核酸包被颗粒,并通过推进力将其递送入细胞。示例性颗粒包括由钨、铂、优选金组成的那些。在一些情况下,预期金属颗粒上的dna沉淀对于用基因枪轰击将dna递送至受体细胞而言不是必需的。然而,预期颗粒可以包含dna,而不是被dna包被。因此,提出dna包被的颗粒可以通过颗粒轰击来增加dna递送的水平,但本身不是必需的。

为了轰击,将悬浮液中的细胞浓缩至过滤器或固体培养基上。或者,可以将未成熟胚或其他靶细胞排列在固体培养基上。将待轰击的细胞置于基因枪停止板下面的适当距离。

通过加速将dna递送入植物细胞的方法的一个说明性实施方案是biolistics颗粒递送系统,其可用于将dna包被的颗粒或细胞通过筛网(例如不锈钢或nytex筛网)推进到覆盖有悬浮培养的单子叶植物细胞的过滤器表面上。筛网分散颗粒,使得它们不以大的聚集体递送到受体细胞。基因枪轰击技术广泛适用,且可以用于转化基本上任何植物种类。已经通过基因枪轰击转化的物种的实例包括单子叶物种,如玉米(pct申请wo95/06128)、大麦(ritala等,1994;hensgens等,1993)、小麦(美国专利号5,563,055,其全文通过引用具体并入本文)、水稻(hensgens等,1993)、燕麦(torbet等,1995;torbet等,1998)、黑麦(hensgens等,1993)、甘蔗(bower等,1992)和高粱(casa等,1993;hagio等,1991);以及很多双子叶植物,包括烟草(tomes等,1990;buising和benbow,1994)、大豆(美国专利号5,322,783,其全文通过引用具体并入本文)、向日葵(knittel等,1994)、花生(singsit等,1997)、棉花(mccabe和martinell,1993)、西红柿(vaneck等,1995)和一般豆科植物(美国专利号5,563,055,其全文通过引用具体并入本文)。

其他转化方法

可以使用基于以下的方法转化原生质体:磷酸钙沉淀、聚乙二醇处理、电穿孔和这些处理的组合(参见例如,potrykus等,1985;lorz等,1985;omirulleh等,1993;fromm等,1986;uchimiya等,1986;callis等,1987;marcotte等,1988)。

向不同植物品系应用这些系统取决于从原生质体再生具体的植物品系的能力。已经描述了从原生质体再生谷物的说明性方法(toriyama等,1986;yamada等,1986;abdullah等,1986;omirulleh等,1993和美国专利号5,508,184;其每个的全文通过引用具体并入本文)。使用谷物原生质体的直接摄取转化的实例包括以下的转化:水稻(ghosh-biswas等,1994)、高粱(battraw和hall,1991)、大麦(lazerri,1995)、燕麦(zheng和edwards,1990)和玉米(omirulleh等,1993)。

为了转化不能从原生质体成功再生的植物品系,可以使用其他方法将dna引入完整的细胞或组织。例如,可以如所述的从未成熟胚或外植体再生谷物(vasil,1989)。或者,可以在有或没有原生质体的情况下使用碳化硅纤维介导的转化(kaeppler,1990;kaeppler等,1992;美国专利号5,563,055,其全文通过引用具体并入本文)。使用这种技术的转化通过在dna溶液中将碳化硅纤维与细胞一起搅拌来完成。当细胞被刺破时,dna被动进入。这种技术已经成功应用于例如单子叶谷物玉米(pct申请wo95/06128,其全文通过引用具体并入本文;thompson,1995)和水稻(nagatani,1997)。

组织培养

在某些转化技术中可以使用组织培养来制备用于转化的细胞并用于从其再生植物。维持组织培养需要培养基或受控的环境。“培养基”是指用于体外(即,在完整的活的生物体之外)生长细胞的各种营养物混合物。培养基通常是大多数细胞类型生长所需的各类成分(盐、氨基酸、生长调节剂、糖、缓冲液)的悬浮液。然而,每个特定的细胞类型需要特定范围的成分比例用于生长,甚至更特定范围的配方用于最佳生产。细胞生长的速率也会随着允许这种细胞类型生长的该系列培养基引发的不同培养物而变化。

营养培养基制备为液体,但可以通过向液体加入能够提供固体支持的材料将其固化。琼脂最常用于此目的。bacto琼脂、hazelton琼脂、gelrite和gelgro是适于在组织培养中生长植物细胞的固体支持物的具体类型。

一些细胞类型在液体悬浮液中或在固体培养基上生长和分裂。如本文所公开,植物细胞将在悬浮液中或在固体培养基上生长,但从悬浮液培养物再生植物通常需要在发育中的某个点从液体转移至固体培养基。培养物中细胞分化的类型和程度不仅受所用培养基的类型和环境(例如ph)影响,还受培养基是固体或液体的影响。

可以在培养物中生长的组织包括分生组织细胞、i型、ii型和iii型愈伤组织、未成熟胚和配子细胞如小孢子、花粉、精子和卵细胞。i型、ii型和iii型愈伤组织可以来自包括但不限于以下的组织来源:未成熟胚、幼芽顶端分生组织、根、叶、小孢子等。能够像愈伤组织一样增殖的那些细胞也是遗传转化的受体细胞。

体细胞是各种类型。胚性细胞是体细胞的一个实例,可通过胚胎形成诱导其再生植物。非胚性细胞通常是不以这种方式应答的那些。可以使用某些技术富集细胞群内的受体细胞。例如,发育ii型愈伤组织,随后人工选择并培养易碎的胚性组织通常造成细胞富集。可用于选择靶细胞的人工选择技术包括例如分析细胞形态和分化,或可以使用各种物理或生物手段。冷冻保存也是一种选择受体细胞的可能方法。

人工选择受体细胞(例如通过从ii型愈伤组织表面选择胚性细胞)是一种可用于在培养之前试图富集特定细胞(无论在固体培养基上或是在悬浮液中培养)的手段。

当使用时,培养细胞可以在固体支持物上或以液体悬浮液的形式生长。在任一种情况下,可以以培养基形式向细胞提供营养物,并控制环境条件。存在各种类型的组织培养基,其由各种氨基酸、盐、糖、生长调节剂和维生素组成。实施本发明所用的多数培养基将具有一些相似的组分,但根据预期的具体应用,可能在组成和其成分比例上不同。例如,各种细胞类型通常在超过一种的培养基中生长,但取决于生长培养基,将呈现不同的生长率和不同形态。在一些培养基中,细胞存活但不分裂。之前已经描述了适于培养植物细胞的各种类型的培养基。这些培养基的实例包括但不限于chu等(1975)所述的n6培养基和ms培养基(murashige和skoog,1962)。

产生并表征稳定转化的植物

向受体细胞有效递送外源dna之后,下一步通常涉及鉴定转化细胞用于进一步的培养和植物再生。为了提高鉴定转化体的能力,期望与根据本发明制备的转化载体一起使用可选择或可筛选标志物基因。这种情况下,然后通常将细胞暴露于一种或多种选择剂来分析潜在的转化细胞群,或筛选细胞以获得期望的标志物基因性状。

选择

据信在任何一项研究中,dna仅被引入小百分比的靶细胞中。为了提供一种有效的系统来鉴定那些接受dna并将其整合到基因组中的细胞,可以采用选择那些稳定转化的细胞的方法。这种方法的一个示例性实施方案是向宿主细胞引入标志物基因,其赋予对一些普通抑制剂(例如抗生素或除草剂)的抗性。可以使用的抗生素的实例包括:氨基糖苷类抗生素新霉素、卡那霉素和巴龙霉素,或抗生素潮霉素。氨基糖苷类磷酸转移酶如新霉素磷酸转移酶ii(nptii)或npti赋予对氨基糖苷类抗生素的抗性,而潮霉素磷酸转移酶赋予对潮霉素的抗性。

然后将潜在的转化细胞暴露于选择剂。在存活的细胞群中的通常是其中已经整合抗性赋予基因并以足够的水平表达以允许细胞存活的那些细胞。可以进一步检测细胞以证实外源dna的稳定整合。

构成期望的选择剂的一种除草剂是广谱除草剂双丙氨磷。双丙氨磷是由吸湿链霉菌产生的三肽抗生素,且由草丁膦(ppt)、l-谷氨酸的类似物和两个l-丙氨酸残基组成。当通过细胞内肽酶除去l-丙氨酸残基时,ppt被释放,其是谷氨酰胺合成酶(gs)的有效抑制剂,且是参与氨同化和氮代谢的关键酶(ogawa等,1973)。合成ppt(除草剂liberty中的活性成分)也是有效的选择剂。通过ppt抑制植物中的gs导致氨的快速积累和植物细胞的死亡。

产生双丙氨磷的生物和链霉菌属的其他物种也合成由吸湿链霉菌中的bar基因和产绿色链霉菌中的pat基因编码的草丁膦乙酰转移酶(pat)。编码草丁膦乙酰转移酶(pat)的除草剂抗性基因的使用在de3642829a中提到,其中该基因是从产绿色链霉菌分离的。在细菌源生物体中,这种酶将ppt的游离氨基乙酰化以防止自身毒性(thompson等,1987)。bar基因已被克隆(murakami等,1986;thompson等,1987),并在转基因烟草、西红柿、马铃薯(deblock等,1987)、芸苔属(deblock等,1989)和玉米(美国专利号5,550,318)中表达。在以前的报道中,一些表达抗性基因的转基因植物在温室中完全抗ppt和双丙氨膦的商业制剂。

在实施本发明时可用于选择转化细胞系的除草剂的另一个实例是广谱除草剂草甘膦。草甘膦抑制在芳族氨基酸生物合成途径中有活性的酶epsps的作用。该酶的抑制导致氨基酸苯丙氨酸、酪氨酸和色氨酸及其衍生的次级代谢物的饥饿。美国专利号4,535,060描述了epsps突变的分离,所述突变赋予鼠伤寒沙门氏菌(salmonellatyphimurium)的epsps基因aroa草甘膦抗性。从玉米中克隆了epsps基因,并在体外引入了与在抗草甘膦aroa基因中发现的相似的突变。编码抗草甘膦的epsps酶的突变基因描述于例如国际专利wo97/4103中。赋予草甘膦抗性的表征最好的突变体epsps基因包含残基102和106处的氨基酸改变,但预计其他突变也将是有用的(pct/wo97/4103)。

为了使用bar-双丙氨磷或epsps-草甘膦选择性系统,将转化组织在非选择性培养基上培养0-28天,随后转移到适当含有1-3mg/l双丙氨膦或1-3mm草甘膦的培养基中。尽管通常优选1-3mg/l双丙氨膦或1-3mm草甘膦的范围,但是建议0.1-50mg/l双丙氨膦或0.1-50mm草甘膦的范围将是可用的。

可筛选标志物性状的一个实例是萤光素酶。在底物荧光素存在的情况下,表达萤光素酶的细胞发出光,所述光可以通过增强夜视的装置或高度敏感的摄影机如光子计数相机的设备在摄影胶片或x射线胶片上在照度计(或液体闪烁计数器)中检测到。这些测定是非破坏性的,鉴定后可以进一步培养转化细胞。光子计数相机尤其有价值,因为它可以识别表达萤光素酶的特定的细胞或细胞群体,并实时操纵它们。另一种可以类似方式使用的可筛选标记是编码绿色荧光蛋白的基因。

再生和种子产生

在暴露于选择性试剂的情况下存活的细胞或在筛选试验中得分为阳性的细胞可以在支持植物再生的培养基中培养。在一个示例性实施方案中,可以通过包含其他物质如生长调节剂来改变ms和n6培养基。一种这样的生长调节剂是麦草畏或2,4-d。然而,也可以使用其他生长调节剂,包括naa、naa+2,4-d或毒莠定。已经发现这些和类似方式的培养基改进促进了细胞在特定发育阶段的生长。可以用生长调节剂将组织保持在基本培养基上,直到有足够的组织可用于开始植物再生,或之后进行反复轮的人工选择,直到组织的形态适于再生,至少2周,然后转移到有利于胚状体成熟的培养基。每两周在该培养基上转移培养物。幼苗的发育将标记转移到缺乏生长调节剂的培养基中的时间。

然后,将允许通过选择或筛选鉴定并在支持再生的适当培养基中培养的转化细胞成熟为植物。将发育中的小苗转移到无土植物生长混合物中,并例如在环境可控的室中,例如在约85%的相对湿度,600ppm的co2和25-250微爱因斯坦m2s-1的光下硬化。植物可以在生长室或温室中成熟。根据最初的组织,鉴定转化体后约6周到10个月植物可以再生。再生期间,细胞在组织培养容器中的固体培养基上生长。这种容器的说明性实施方式是培养皿和plantcons。再生植物可以在约19至28℃下生长。再生植物到达芽和根发育阶段后,可将其转移到温室进行进一步生长和测试。

由于种子发育停止和植物过早衰老,转化植物上的种子偶尔需要胚拯救。为了拯救发育中的胚,将它们在授粉后10-20天从表面消毒的种子切下并培养。在此阶段用于培养的培养基的实施方案包含ms盐、2%蔗糖和5.5g/l琼脂糖。在胚拯救中,大的胚(定义为长度大于3mm)直接在适当的培养基上萌发。比这更小的胚可以在含有上述成分和10-5m脱落酸的培养基上培养1周,然后转移到无生长调节剂的培养基中进行萌发。

表征

为了证实再生植物中存在外源dna或“转基因”,可以进行多种分析。这样的分析包括例如“分子生物学”分析,如southern和northern印迹和pcrtm;“生物化学”分析,例如通过免疫学手段(elisa和western印迹)或通过酶功能检测蛋白质产物的存在;植物部分分析,如叶或根分析;和分析整个再生植物的表型。

dna整合、rna表达和继承

可以从细胞系或任何植物部分分离基因组dna以通过使用本领域技术人员熟知的技术来确定外源基因的存在。请注意,完整序列并不总是存在,大概是由于细胞中序列的重排或缺失。通过本发明的方法引入的dna元件的存在可以例如通过聚合酶链式反应(pcrtm)来确定。使用这种技术,扩增dna的离散片段并通过凝胶电泳检测。这种类型的分析允许确定基因是否存在于稳定的转化体中,但不能证明引入的基因整合到宿主细胞的基因组中。然而,典型的情况是通过pcrtm分析,dna已经整合到所有转化体的基因组中,这证明了该基因的存在。另外,使用pcrtm技术通常不可能确定转化体是否具有引入基因组中不同位点的外源基因,即转化体是否具有独立来源。预期使用pcrtm技术可以克隆与引入基因相邻的宿主基因组dna的片段。

可以使用southern杂交技术确定dna整合到宿主基因组中的阳性证据和转化体的独立身份。使用这种技术可以鉴定引入宿主基因组的特定dna序列和侧翼的宿主dna序列。因此,给定转化体的southern杂交模式作为该转化体的鉴定特征。另外,可以通过southern杂交证明在高分子量dna中存在引入的基因,即证实引入基因已经整合到宿主细胞的基因组中。southern杂交技术提供了使用pcrtm获得的信息,例如基因的存在,但也证明了整合到基因组中并表征每个单独的转化体。

预期使用作为改良的southern杂交技术的斑点技术或狭缝印迹杂交,可以获得源自pcrtm的相同信息,例如基因的存在。

pcrtm和southern杂交技术都可用于证明转基因向后代的传递。大多数情况下,给定转化体的特征性southern杂交模式将作为一个或多个表明转基因稳定遗传的孟德尔基因(spencer等,1992)在后代分离。

尽管可以使用从植物的任何部分分离的dna进行dna分析技术,但rna将仅在特定的细胞或组织类型中表达,因此有必要从这些组织中制备用于分析的rna。pcrtm技术也可以用于检测和定量从引入基因产生的rna。在这种pcrtm应用中,首先需要使用诸如逆转录酶的酶将rna逆转录成dna,然后通过使用常规pcrtm技术扩增dna。大多数情况下,pcrtm技术虽然有用,但不能证明rna产物的完整性。有关rna产物性质的进一步信息可以通过northern印迹获得。该技术将证明rna种类的存在,并提供有关该rna完整性的信息。rna种类的存在或不存在也可以使用斑点或狭缝印迹northern杂交来确定。这些技术是northern印迹的改良,并且将仅证明存在或不存在rna种类。

基因表达

虽然southern印迹和pcrtm可以用于检测所讨论的基因,但是它们不提供有关相应的蛋白质是否被表达的信息。可通过以下来评估表达:特异性鉴定导入基因的蛋白质产物或rna产物,或评估其表达带来的表型变化。

用于生产和鉴定特定蛋白质的分析可以利用蛋白质的物理-化学、结构、功能或其他性质。独特的物理化学或结构性质允许通过电泳程序如天然或变性凝胶电泳或等电聚焦,或通过色谱技术如离子交换或凝胶排阻色谱来分离和鉴定蛋白质。单个蛋白质的独特结构为使用特异性抗体以诸如elisa测定等形式来检测其存在提供机会。可以采用与甚至更高特异性的方法的组合,例如蛋白质印迹法,其中使用抗体来定位通过电泳技术分离的单个基因产物。可采用其它技术来绝对证实目标产物的身份,例如纯化后通过氨基酸测序进行评估。尽管这些是最常用的,但是也可以使用其他程序。

还可以使用分析程序通过其功能性(特别是酶催化涉及特定底物和产物的特定化学反应的能力)来鉴定蛋白质的表达。这些反应之后,可以通过物理或化学程序提供和量化底物的损失或反应产物的产生。实例与待分析的酶一样多样化,且可以包括:根据从草丁膦和14c-乙酰辅酶a产生的放射性标记的乙酰化草丁膦来测定pat酶的活性,或根据邻氨基苯甲酸的荧光损失来测定邻氨基苯甲酸合成酶的活性。

通常,基因产物的表达通过评估其表达的表型结果来确定。这些测定也可以采取许多形式,包括但不限于分析植物的化学组成、形态或生理性质的变化。化学组成可以通过表达编码改变氨基酸组成的酶或存储蛋白质的基因来改变,并且可以通过氨基酸分析或通过改变淀粉量的酶(可以通过近红外反射光谱法分析)来检测。形态变化可能包括更大的身材或更粗的秆。在小心控制的条件下(称为生物测定)评估植物或植物部分对施加处理的响应的最常见的变化。

本发明植物的育种

除了用根据本发明制备的构建体直接转化特定的植物基因型之外,可以通过将具有本发明选择的dna的植物与缺乏该构建体的第二植物杂交来制备转基因植物。例如,可以通过杂交将选择的木质素生物合成编码序列引入特定的植物品种,而不需要直接转化该给定品种的植物。因此,本发明不仅涵盖根据本发明直接转化的植物或从转化细胞再生的植物,而且包括这种植物的后代。

如本文所用,术语“后代”表示根据本发明制备的任何一代亲本植物的后代,其中后代包含选择的dna构建体。如本文所公开的,“杂交”植物以提供相对于起始植物株系具有一种或多种添加的转基因的植物株系被定义为导致以下的技术:通过将起始株系与包含本发明的转基因的供体植物株系杂交将本发明的转基因引入植物株系。为了达到这个目的,例如可以进行以下步骤:

(a)种植第一(起始株系)和第二(包含本发明转基因的供体植物株系)亲本植物的种子;

(b)将第一和第二亲本植物的种子种植成携带花朵的植物;

(c)用来自第二亲本植物的花粉给来自第一亲本植物的花授粉;和

(d)收获携带受精花的亲本植物上产生的种子。

回交在本文中定义为包括以下步骤的过程:

(a)将含有所需的基因、dna序列或元件的第一基因型植物与缺乏所需的基因、dna序列或元件的第二基因型植物杂交;

(b)选择含有所需的基因、dna序列或元件的一个或多个后代植物;

(c)将后代植物与第二基因型植物杂交;和

(d)重复步骤(b)和(c)以将所需的dna序列从第一基因型植物转移到第二基因型植物。

将dna元件渗入到植物基因型定义为回交转化过程的结果。其中可以将已经渗入dna序列的植物基因型称为回交转化的基因型、株系、近交系或杂种。类似地,缺乏所需dna序列的植物基因型可称为未转化的基因型、株系、近交系或杂种。

大麻的医学益处、大麻素含量及其分析

归因于从大麻分离的一种或多种大麻素的一些医学益处包括治疗疼痛、恶心、aids相关体重减轻和消瘦、多发性硬化症、过敏、感染、抑郁症、偏头痛、双相型障碍、高血压、中风后神经保护、癫痫和纤维肌痛,以及抑制肿瘤生长、血管生成和转移。研究表明,大麻素也可用于治疗诸如以下的病症:青光眼、帕金森病、亨廷顿病、偏头痛、炎症、克罗恩病、肌张力障碍、类风湿性关节炎、化疗引起的呕吐、炎症性肠病、动脉粥样硬化、创伤后应激障碍、心脏病再灌注损伤、前列腺癌和阿尔茨海默氏病。例如,美国专利号6,630,507公开了大麻素用作抗氧化剂和神经保护剂;美国专利号7,105,685公开了大麻素用于治疗与免疫功能障碍有关的疾病,特别是hiv疾病和肿瘤疾病;美国专利号7,109,245公开了大麻素可用作血管收缩剂;美国专利公开us2011/0257256公开了thc-cbd组合物用于治疗或预防认知障碍和痴呆;pct公开wo/2009/147439公开了大麻素在制备用于治疗癌症,特别是神经胶质瘤肿瘤的药物中的用途;pct公开wo/2007/148094公开了大麻素组合物用于治疗神经性疼痛的用途;和美国专利公开us2010/0286098公开了一种施用大麻素治疗患有结肠炎的患者的组织损伤的方法。

尽管已经鉴定了广泛的医疗用途,但大麻素对于特定疾病或病症所实现的益处被认为是归因于大麻素亚组或单个大麻素。换言之,不同亚组或单一的大麻素对某些病症有益,而其他亚组或单个的大麻素对其他病症有益。例如,thc是大麻产生的主要的作用于精神的大麻素,其生物活性和在广泛疾病中的潜在治疗应用已经被很好地表征。cbd是大麻的另一种主要大麻素成分,作为cb1和cb2大麻素受体的反向激动剂起作用。与thc不同,cbd不会对人类产生精神作用。据报道,cbd具有镇痛、抗氧化、抗炎和免疫调节作用。

包括类萜在内的萜烯是另一类由大麻产生的化合物。据报道,大麻植物可以生产多达200或更多种的萜烯,尽管大麻品系产生的萜烯的种类和比例取决于遗传和生长条件(例如光照、施肥、土壤、浇水频率/数量、湿度、二氧化碳浓度等)以及年龄、成熟度和一天中的时间。萜烯已被证明具有药用性质,并且可能造成至少一部分的大麻药用价值。

归因于从大麻中分离的一种或多种萜烯的某些医学益处包括治疗睡眠障碍、精神病、焦虑症、癫痫和癫痫发作、疼痛、微生物感染(真菌、细菌等)、癌症、炎症、痉挛、胃反流、抑郁症和哮喘。一些萜烯已被证明:降低跨越血脑屏障的阻力,作用于大麻素受体和其他神经元受体,刺激免疫系统和/或抑制食欲。

然而,迄今为止,药用大麻被用作通用产品,由此患者利用不同大麻素的整体来获得医学结果。已经努力使大麻对具有特定病症的患者的医学益处最大化,但是这样的努力总是复杂的。例如,由于thc具有精神活性,一些患者和监管机构将高cbd(和低thc)的大麻视为传统大麻的替代品,这在法律上、医学上和/或文化上都是可接受的。另外,患者目前使用的大麻可能缺乏一致的大麻素成分和浓度,因此不能为患者提供最大的益处。

大麻表达大量可用于治疗各种疾病的大麻素。然而,大麻品种对于特定疾病的有效性取决于所述品种产生的一种或多种特定大麻素的浓度,和/或大麻素的量之间的比例。

具有治疗作用的大麻的其它成分包括大麻萜酚(抗微生物性质以及抑制角质形成细胞和癌细胞的增殖)、δ-8-四氢大麻酚(食欲兴奋剂)。大麻的其他成分包括大麻艾尔松、二羟基大麻酚(cannabitriol)、大麻色烯、大麻酚、大麻环酚(cannabicycol)和萜类(包括α-蒎烯、芳樟醇、月桂烯、β-石竹烯、石竹烯氧化物、蛇麻烯-蛇麻烯、柠檬烯和异松油烯)。

大麻素生物合成主要发生在以高密度覆盖雌花的腺毛上。大麻萜酚酸是thc、cbd和大麻色烯的前体。特别地,thca合成酶催化大麻萜酚酸产生δ-9-四氢大麻酚酸;δ-9-四氢大麻酚酸经历热转化形成thc。cbda合成酶催化大麻萜酚酸产生大麻二酚酸;大麻二酚酸经历热转化为cbd。cbca合成酶催化大麻萜酚酸产生大麻色酸;大麻色酸经历热转化成大麻色烯。美国专利2013/0067619描述了导致大麻中主要大麻素类型的途径,并且其全文通过引用并入本文。

“大麻”、“大麻物种”、“大麻植物”或“大麻(marijuana)”是指开花植物,其包括以下种(或亚种):栽培大麻、莠草大麻(cannabisruderalis)和印度大麻(cannabisindica)。

“大麻素”是指作用于大麻素受体的一类化学化合物。“内源性大麻素”在动物(包括人)中天然产生。“植物大麻素”是植物中产生的天然存在的大麻素。“合成大麻素”是人工制造的大麻素。

大麻物种表达至少85种不同的植物大麻素,其集中于腺毛产生的树脂中。根据结构将植物大麻素分为亚类,包括大麻萜酚、大麻色烯、大麻二酚、四氢大麻酚、大麻酚和脱氢大麻二酚,以及其他大麻素。

在大麻中发现的大麻素包括但不限于:大麻萜酚(cbg)、大麻色烯(cbc)、大麻二酚(cbd)、四氢大麻酚(thc)、大麻酚(cbn)和脱氢大麻二酚(cbdl)、大麻环酚(cbl)、次大麻酚(cbv)、四氢次大麻酚(thcv)、次大麻二酚(cbdv)、次大麻色烯(cbcv)、次大麻萜酚(cbgv)、大麻萜酚单甲醚(cbgm)、大麻橙花酸、大麻二酚酸(cbda)、大麻酚丙基变体(cbnv)、二羟基大麻酚(cbo)、四氢大麻酚酸(thca)和四氢次大麻酚酸(thcva)。其全文通过引用并入本文的美国专利申请公开号2013/0059018更详细地讨论了植物大麻素及其结构。

植物大麻素可以作为戊基(5个碳原子)或丙基(3个碳原子)变体存在。丙基和戊基变体可以具有彼此不同的性质。例如,thc是cb1受体激动剂,而丙基变体thcv是cb1受体拮抗剂,这意味着它具有与thc几乎相反的作用。

“萜烯”或“类萜”是指由植物(包括大麻)产生的一类化学物质。术语“类萜”通常是指化学改性的萜烯(例如通过氧化)。如本文所用,萜烯包括类萜。萜烯和类萜通常是芳烃,并且可能具有与其相关的强烈气味。

已知由大麻产生的萜烯包括但不限于:香橙烯、佛手柑素、香柠檬醇、红没药烯、冰片、4-3-蒈烯、石竹烯、桉叶素/桉油精、对伞花烃、二氢茉莉酮、榄香烯、法尼烯、葑醇、乙酸香叶酯、愈创木醇、蛇麻烯、异胡薄荷醇、柠檬烯、芳樟醇、薄荷酮、薄荷醇、薄荷呋喃、月桂烯、橙花醇乙酸酯、新薄荷基乙酸酯、罗勒烯、紫苏子醇、水芹烯、蒎烯、胡薄荷酮、香桧烯、萜烯、萜品醇、萜品醇-4-醇、异松油烯,以及它们各自的衍生物、异构体、对映异构体等。

大麻植物和产品也可以包含其他药学上相关的化合物,包括黄酮类化合物和植物甾醇(例如芹菜素、槲皮素、大麻黄素a(cannflavina)、β-谷甾醇等)。

本文所用的术语“大麻产品”、“源自植物的产品”、“大麻植物衍生产品”、“源自大麻的产品”或“加工产品”是指源自大麻植物的任何产品,包括但不限于花、树脂(哈希什)和油(大麻油),以及它们的任何制品。制品的非限制性实例包括干花、麻醉品(kief)、哈希什(hashish)、酊剂、哈希油、浸剂、管树脂、食物等。

如本文所用,术语“花”、“芽”或“干花”是指干燥的大麻花以及与之相连的叶(例如苞叶)和茎。这是大麻使用最广泛的形式。

术语“酊剂”是指用高含量酒精制备的大麻提取物。

术语“大麻油”是指从大麻花和叶提取的油。

术语“浸剂”是指在各种产品中的大麻浸剂。非限制性实例包括茶、可可脂、奶油、食用油、甘油和其它油(例如皮肤保湿剂)。浸剂包括诸如啤酒、苏打水、花生酱等的食物。

“可食用”大麻产品是指可作为食物消费的任何大麻产品。在一些情况下,食物是通过将大麻浸入食品中制成的。在某些情况下,食物是通过将大麻产品(例如干花、麻醉品、哈希什、酊剂、哈希油或浸剂)与其他成分结合制成食物(例如曲奇、巧克力、棒棒糖、啤酒、爆米花等)。

植物经历生长的营养阶段,接着是开花周期。发芽或扦插生根与开花之间的生长期被称为植物发育的营养期。营养体是大麻植物的孢子体状态。植物在营养阶段不产生花,并且生长(bulk)到期望的开花产量。在营养生长阶段,植物忙于进行光合作用,积累开花和繁殖所需的资源。

“开花周期”或“开花期”(也称为“芽周期”)是指植物产生芽和花的时期。这是植物生长的繁殖阶段,大麻是雌雄异体,在不同的植物上有雌雄繁殖部分。开花是大麻的配子体或繁殖状态。为了生产,仅选择雌株用于栽培。对于一些品种而言,从营养阶段到开花阶段的转换是光依赖的。一些品种是自动开花的,意味着它们自动切换到开花期(例如,随着年龄)。

“大麻品种”是指因为一种或多种所需特征已被选择并繁殖的大麻植物。当使用术语品种时,应当理解,品种可以是育种和/或遗传操作的结果。本文所述的大麻品种不是天然存在的。可以以任何方式进行繁殖,包括但不限于有性繁殖(例如种子)、克隆(例如扦插、无性繁殖)、自花授粉等。

如本文所用,“多种”是指超过一种。例如,多种大麻素可以是2种、3种、4种、5种或更多种大麻素。

如本文所用,术语“活性大麻素”是指大麻素的非酸形式,加上估计在酸形式脱羧时形成的非酸形式的量。

可以通过脱羧将酸形式的大麻素(例如cbda或thca)转化为它们的非酸形式(例如thc或cbd)。当加热大麻素时发生脱羧。此外,大麻素酸形式已被证明具有治疗活性。当从酸转化为非酸(“活性”)形式时,大麻素失去质量。为了确定脱羧后将存在的活性大麻素的估计量,可以将酸形式的量乘以87.7%。这是一个粗略的估计,并且将产生的活性大麻素的实际量可能取决于大麻素、脱羧方法、在脱羧过程(例如由于加热)期间大麻素的进一步分解等。

在一个实施方案中,“治疗有效量”是指所述量的化合物导致患者症状的预防或改善或期望的生物学结果,例如改善的临床体征、疾病的延迟发作等。有效量可由本领域普通技术人员确定。所选择的剂量水平取决于包括但不限于以下的因素:所治疗的病症的严重程度,以及所治疗的患者的病症和既往病史。然而,本领域技术人员可以以低于实现所需治疗效果所需的水平开始化合物的剂量,并逐渐增加剂量直至达到所需效果。

术语“调节”是指在受试者(例如哺乳动物)中对疾病或病症的任何治疗,包括:预防或防止疾病或病症,即使异常生物学反应或症状不发生;抑制疾病或病症,即阻止或抑制异常生物反应和/或临床症状的发展;和/或缓解疾病或病症,即引起异常生物反应和/或临床症状消退。

如本文所用,术语“预防”是指对有需要的患者的预防性治疗。预防性治疗可以通过以下来实现:向具有患病风险的受试者提供合适剂量的治疗剂,由此基本上避免疾病的发作。

如本文所用,术语“病症”是指正在使用本文提供的化合物、组合物和方法的疾病状态。

如本文所用,术语“患者”或“受试者”是指哺乳动物,包括人和非人哺乳动物。在本文具体的实施方案中,患者或受试者是人。

在一个方面,本文描述的大麻植物是产生高水平cbd(和/或cbda)和低水平thc(和/或thca)的大麻品种。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约18%至约60%的大麻二酚酸和大麻二酚。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约20%至约40%的大麻二酚酸和大麻二酚。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约20%至约30%的大麻二酚酸和大麻二酚。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约25%至约35%的大麻二酚酸和大麻二酚。应当理解,来自上述值内的任何子值或子范围都可用于本文所述的实施方案。

在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为至少约18%的大麻二酚酸和大麻二酚。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为至少约19%的大麻二酚酸和大麻二酚。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为至少约20%的大麻二酚酸和大麻二酚。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为至少约21%的大麻二酚酸和大麻二酚。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为至少约22%的大麻二酚酸和大麻二酚。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为至少约23%的大麻二酚酸和大麻二酚。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为至少约24%的大麻二酚酸和大麻二酚。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为至少约25%的大麻二酚酸和大麻二酚。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为至少约26%的大麻二酚酸和大麻二酚。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为至少约27%的大麻二酚酸和大麻二酚。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为至少约28%的大麻二酚酸和大麻二酚。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为至少约29%的大麻二酚酸和大麻二酚。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为至少约30%的大麻二酚酸和大麻二酚。

在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约0%至约3%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约0%至约2%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约0%至约1%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约0%至约0.3%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约0%至约0.1%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约0%至约0.09%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约0%至约0.08%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约0%至约0.07%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约0%至约0.06%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约0%至约0.05%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约0%至约0.04%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约0%至约0.03%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约0%至约0.02%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约0%至约0.01%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约0.02%至约3%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个优选的实施方案中,大麻品种产生按重量计可测定的合并浓度为约0.02%至约2%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约0.03%至约2%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约0.05%至约2%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约0.07%至约2%的δ-9-四氢大麻酚和四氢大麻酚酸。应当理解,来自上述值内的任何子值或子范围都可用于本文所述的实施方案。

在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约3%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约2%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约1.9%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约1.8%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约1.7%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约1.6%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约1.5%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约1.4%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约1.3%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约1.2%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约1%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约0.5%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约0.3%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约0.2%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约0.1%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约0.09%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约0.08%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约0.07%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约0.06%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约0.05%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约0.04%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约0.03%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约0.02%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为小于约0.01%的δ-9-四氢大麻酚和四氢大麻酚酸。在一个实施方案中,大麻品种产生按重量计可测定的合并浓度为约0.07%的δ-9-四氢大麻酚和四氢大麻酚酸。

在一个实施方案中,估计的活性大麻二酚浓度按重量计为约18%至约60%。在一个实施方案中,估计的活性大麻二酚浓度按重量计为约20%至约60%。在一个实施方案中,估计的活性大麻二酚浓度按重量计为约20%至约50%。在一个实施方案中,估计的活性大麻二酚浓度按重量计为约20%至约40%。在一个实施方案中,估计的活性大麻二酚浓度按重量计为约20%至约30%。在一个实施方案中,估计的活性大麻二酚浓度按重量计为约20%至约25%。在一个实施方案中,估计的活性大麻二酚浓度按重量计为约25%至约40%。在一个实施方案中,估计的活性大麻二酚浓度按重量计为约25%至约30%。应当理解,来自上述值内的任何子值或子范围都可用于本文所述的实施方案。

在一个实施方案中,估计的活性大麻二酚浓度按重量计为至少约18%。在一个实施方案中,估计的活性大麻二酚浓度按重量计为至少约19%。在一个实施方案中,估计的活性大麻二酚浓度按重量计为至少约20%。在一个实施方案中,估计的活性大麻二酚浓度按重量计为至少约21%。在一个实施方案中,估计的活性大麻二酚浓度按重量计为至少约22%。在一个实施方案中,估计的活性大麻二酚浓度按重量计为至少约23%。在一个实施方案中,估计的活性大麻二酚浓度按重量计为至少约24%。在一个实施方案中,估计的活性大麻二酚浓度按重量计为至少约25%。在一个实施方案中,估计的活性大麻二酚浓度按重量计为至少约26%。在一个实施方案中,估计的活性大麻二酚浓度按重量计为至少约27%。在一个实施方案中,估计的活性大麻二酚浓度按重量计为至少约28%。在一个实施方案中,估计的活性大麻二酚浓度按重量计为至少约29%。在一个实施方案中,估计的活性大麻二酚浓度按重量计为至少约30%。

在一个方面,本发明涉及大麻品系或其产品,其中估计的活性大麻二酚与估计的活性thc的比例为约400:1至约15:1。在一个实施方案中,活性大麻二酚与活性thc的比例为约300:1至约20:1。在一个实施方案中,活性大麻二酚与活性thc的比例为约300:1至约25:1。在一个实施方案中,活性大麻二酚与活性thc的比例为约300:1至约30:1。在一个实施方案中,活性大麻二酚与活性thc的比例为约300:1至约50:1。在一个实施方案中,活性大麻二酚与活性thc的比例为约300:1至约70:1。在一个实施方案中,活性大麻二酚与活性thc的比例为约300:1至约80:1。在一个实施方案中,活性大麻二酚与活性thc的比例为约300:1至约100:1。在一个实施方案中,活性大麻二酚与活性thc的比例为约300:1至约200:1。

大麻素的浓度可以基于从大麻植物的任何部分采集的样品来测定。大麻素的浓度可以基于在植物生命周期的任何点采集的样品来测定。在一个优选的实施方案中,从大麻植物的花(或花序)采集样品。在一个实施方案中,从以下的一种或多种采集样品:花、叶、茎,或它们的组合。在一个实施方案中,在大麻生命周期的营养生长阶段采集样品。在一个实施方案中,在大麻生命周期的开花阶段采集样品。

在一个方面,大麻品系的大麻素和/或萜烯组成在批次之间是一致的。在一个实施方案中,特定品系的大麻素和/或萜烯组成在不同时间生长和收获的批次之间是一致的。在一个实施方案中,特定品系的大麻素和/或萜烯组成在不同地点(例如不同的栽培设施)生长和收获的批次之间是一致的。术语“一致”是指特定品系中存在的给定大麻素和/或萜烯的浓度变化不超过20%,优选15%、10%或5%。在一个实施方案中,大麻素是植物大麻素。在一个实施方案中,大麻素是cbd。在一个实施方案中,大麻素是thc。在一个实施方案中,大麻素是cbn。在一个实施方案中,大麻素是至少一种大麻萜酚(cbg)、大麻色烯(cbc)、大麻二酚(cbd)、四氢大麻酚(thc)、大麻酚(cbn)和脱氢大麻二酚(cbdl)、大麻环酚(cbl)、次大麻酚(cbv)、四氢次大麻酚(thcv)、次大麻二酚(cbdv)、次大麻色烯(cbcv)、次大麻萜酚(cbgv)、大麻萜酚单甲醚(cbgm)、大麻橙花酸、大麻二酚酸(cbda)、大麻酚丙基变体(cbnv)、二羟基大麻酚(cbo)、四氢大麻酚酸(thca)或四氢次大麻酚酸(thcva)。

在一个方面,品系的大麻素和/或萜烯组成通过分析收获产品的子集(例如,样品)中至少一种大麻素的浓度来分析。在一个实施方案中,分析thc浓度。在一个实施方案中,分析cbd浓度。在一个实施方案中,大麻素是cbn。在一个实施方案中,大麻素是至少一种大麻萜酚(cbg)、大麻色烯(cbc)、大麻二酚(cbd)、四氢大麻酚(thc)、大麻酚(cbn)和脱氢大麻二酚(cbdl)、大麻环酚(cbl)、次大麻酚(cbv)、四氢次大麻酚(thcv)、次大麻二酚(cbdv)、次大麻色烯(cbcv)、次大麻萜酚(cbgv)、大麻萜酚单甲醚(cbgm)、大麻橙花酸、大麻二酚酸(cbda)、大麻酚丙基变体(cbnv)、二羟基大麻酚(cbo)、四氢大麻酚酸(thca)或四氢次大麻酚酸(thcva)。在一个实施方案中,分析一种或多种萜烯的浓度。

迄今为止,用于确定大麻素浓度的分析显示了相同植物的显着偏差。这种偏差是整个大麻工业,特别是需要重复性的医用大麻工业的一个问题。在仔细检查之后,预期分析的组合物的水分含量是分析的浓度变异性的关键参数。令人惊讶的是,通过使分析之间的水分含量彼此一致,可以将这种可变性最小化。在一个方面,本发明涉及分析大麻样品的大麻素浓度的方法,使得该分析在不同的样品(例如批次和/或品系)之间提供可重复的结果。

在一个实施方案中,在进行分析之前,将待检测样品的水分含量(例如,对于大麻素含量)调节为一致的水平。在一个实施方案中,将待检测样品调节为40%水分或更少。在一个实施方案中,将待检测样品调节为约40%水分。在一个实施方案中,将待检测样品调节为约30%水分。在一个实施方案中,将待检测样品调节为约20%水分。在一个实施方案中,将待检测样品调节为约15%水分。在一个实施方案中,将待检测样品调节为约14%水分。在一个实施方案中,将待检测样品调节为约13%水分。在一个实施方案中,将待检测样品调节为约12%水分。在一个实施方案中,将待检测样品调节为约11%水分。在一个实施方案中,将待检测样品调节为约10%水分。在一个实施方案中,将待检测样品调节为约9%水分。在一个实施方案中,将待检测样品调节为约8%水分。在一个实施方案中,将待检测样品调节为约7%水分。在一个实施方案中,将待检测样品调节为约6%水分。在一个实施方案中,将待检测样品调节为约5%水分。还在另一个方法中,在分析前,将组合物冻干。用于测定水分含量的方法是本领域熟知的。

可以使用调节水分含量的任何方法来调节待检测样品的水分含量。在一个实施方案中,通过将样品放置在水合器或湿度室中在期望的湿度水平下一段时间来调节水分含量,然后测定。在一个实施方案中,通过将样品脱水至期望的水分含量来调节水分含量。可以使用任何脱水方法将样品脱水。在一个实施方案中,通过冻干样品来调节水分含量。在一个实施方案中,同时调节超过一个样品的水分含量。在一个实施方案中,在调节步骤之前测定样品的水分含量。在一个实施方案中,在调节步骤之前不测定样品的水分含量。

在一个实施方案中,大麻素浓度的测定与水分含量无关。例如,可以测定样品的干重,并且相对于干重测定大麻素含量。

在达到期望的水分含量之后,可以使用任何方法测定大麻素含量。方法包括但不限于放射免疫测定法、气相色谱/质谱法、气相色谱法、液相色谱法、液相色谱/质谱法和酶免疫测定法。

具体实施方案

鉴于前述内容,本领域技术人员应该理解,可以在公开的特定方面进行改变,并且仍然获得相似或类似的结果,而不背离本发明的精神和范围。因此,本文公开的具体结构和功能细节不被解释为限制。应该理解,本文引用的每篇参考文献的全部公开内容并入本申请的公开内容中。

实施例1

thca合成酶的克隆和测序

将若干栽培大麻的thca合成酶序列进行比对。图1示出了用万维网web.ebi.ac.uk/tools/msa/clustalw2的clustalo(1.2.1)多序列比对程序获得的比对。

genbank的30个thca合成酶基因登录号的比对鉴定了高度保守的序列区域(21-42bp的13个区域),从其中可以制备用于dna扩增并随后克隆入中间载体的pcr引物。为减少pcr引入的错误,可以使用编辑酶,多个独立扩增可以提供dna用于测序,从而去除可能由扩增过程引起的罕见突变。在某些实施方案中,可以使用所用的大麻品系的thca合成酶基因序列来确保反义rna(asrna)的功能性。

通过聚合酶链式反应(pcr)使用来自thermo的校阅聚合酶(以避免pcr错误)扩增来自3个栽培大麻品系(dk-1、nd-1和sh-4)的thca合成酶编码基因,并将pcr产物克隆入pgem载体中进行测序。对来自每个pcr反应的两个或三个独立克隆(在pgem载体中)进行测序以验证序列。图2中用于比对的dk-1和sh-4是克隆的代表性序列,并且dna序列经至少2个测序反应证实,所述测序反应产生相同的序列并且能够装配完整的基因序列。

如图2所示,将从dk-1和sh-4获得的克隆的thca合成酶序列与以下ncbi序列进行比对:ab057805.1(seqidno:40);ab212829.1(seqidno:28);ab212833.1(seqidno:24);ab292683.1(seqidno:41);jq437487.1(seqidno:2);和jq437491.1(seqidno:13)。来自dk-1_full(seqidno:46)和sh-4_full(seqidno:47),以及来自nd品系的thca合成酶的序列显示与ab057805.1(seqidno:40)的一致性。此外,图2还示出了共有序列(seqidno:80)。序列比对用进行。

实施例2

设计rna干扰构建体

为了避免沉默不相关的基因/蛋白质的脱靶效应,当设计rna干扰构建体时,避免了保守结构域。通过在美国国家生物技术信息中心(ncbi)数据库中检索保守结构域,在thca合成酶中鉴定出保守的蛋白质结构域。图5描绘了分别位于thca合成酶的氨基酸区间480-538和氨基酸区间81-218的区域中的蛋白质结构域小檗碱和小檗碱样(bbe)结构域和fad结合结构域。fad结合结构域存在于结合fad作为辅因子的各种酶中。bbe结构域存在于参与各种异喹啉生物碱生物合成的多种酶中。如图5所示,还鉴定了位于氨基酸区间81-540的区域中glcd结构域。该结构域是一种乙醇酸氧化酶亚基glcd结构域,它是原核生物酶的特征,因此几乎不受关注。然而,设计rna干扰构建体时避免了fad结合和bbe结构域。

实施例3

设计反义构建体

为了产生编码rnai构建体的表达盒以通过形成双链rna诱导rna沉默,通过pcr扩增编码完整反义rna的dna(seqidno:81)。用于pcr的引物是thca-fullas-f(seqidno:59)和thca-fullas-r(seqidno:60)。将pcr片段克隆入pgem载体中并验证序列。

为了产生适用于反义rna或干扰rna的转基因表达的基础载体,将启动子和合适的多克隆位点插入载体pcambia1391中以产生pcambia1391-35s载体,如图6所示。35s启动子(camv35s)是花椰菜花叶病毒启动子,可用作栽培大麻中组成型反义表达的通用启动子,也可用于rna干扰构建体。或者,tcup启动子(番茄隐蔽启动子)也可以用于栽培大麻中的高组成型表达。

从中间pgem载体切下完整的反义rna编码dna,并将其克隆入基础的植物转化载体pcambia1391-35s中的35s启动子和nos终止子之间的位点(如图6所示的mlui-bsteii位点),并通过限制性分析来验证或可以通过测序来验证插入的存在。

实施例4

设计小发夹构建体

为了产生通过rna干扰诱导rna沉默的载体,将小发夹rna构建体设计为编码对应于thca合成酶基因编码序列的5'-端的dna的有义-环-反义rna。构建体的有义部分对应于约200个碱基对(seqidno:61),并且避免了栽培大麻中其他酶编码基因的所有保守结构域和潜在的沉默。有义部分也位于被鉴定为最易接近的rna区域中(参见图3和4)。使用引物thca-hprna1-sn-f1(seqidno:51)和thca-hprna1-sn-r1(seqidno:52)扩增有义部分,接着是环部分(seqidno:62)。在环部分之后是反义部分(seqidno:63),其使用thca-hprna1-as-f1(seqidno:53)和thca-hprna1-an-r1(seqidno:54)扩增。完整的有义-环-反义rna编码dna的序列如seqidno:64所示。为了产生适用于干扰rna的转基因表达的基础载体,将启动子和合适的多克隆位点插入载体pcambia1391中以产生pcambia1391-35s载体,如图6所示。

从中间pgem载体切下编码小发夹rna的dna,并将其克隆入基础的植物转化载体pcambia1391-35s中的35s启动子和nos终止子之间的位点(如图6所示的mlui-bsteii位点),并通过限制性分析来验证或可以通过测序来验证插入的存在。

实施例5

设计大发夹构建体

为了产生通过rna干扰诱导rna沉默的载体,将大发夹rna构建体设计为编码对应于thca合成酶基因编码序列的中间部分的dna的有义-环-反义rna。构建体的有义部分对应于约550个碱基对(seqidno:69),并且避免了最可能的共有结构域(fad结合和bbe结构域),从而避免了栽培大麻中其他酶编码基因的潜在沉默。使用引物thca-hprna2-sn-f2(seqidno:55)和thca-hprna2-sn-r2(seqidno:56)扩增有义部分,接着是环部分(seqidno:70)。在环部分之后是反义部分(seqidno:71),其使用thca-hprna2-as-f2(seqidno:57)和thca-hprna2-as-r2(seqidno:58)扩增。完整的有义-环-反义rna编码dna的序列如seqidno:72所提供。

从中间pgem载体切下编码小发夹rna的dna,并将其克隆到基础的植物转化载体pcambia1391-35s中的35s启动子和nos终止子之间的位点(如图6所示的mlui-bsteii位点),并通过限制性分析来验证或可以通过测序来验证插入的存在。

实施例6

用多核苷酸转化大麻

可以形成大麻组织培养物(愈伤组织、芽和根诱导)。根据需要,在基因枪转化后进行大麻的瞬时转化和gus染色。然后,可以将本发明的多核苷酸转入大麻植物。特别地,农杆菌介导的繁殖大麻细胞的转化也可以使用花浸法/真空浸润法进行,接着进行种子收集和分析。此外,可以进行农杆菌介导的体细胞转化(叶盘和愈伤组织转化,随后在组织培养物中再生)。在具体的实施方案中,也可以转化叶柄或花器官。可以使用选自瞬时转化实验的方法进行基因枪转化程序,并且可以从组织培养物再生植物。另外,可以进行peg介导的原生质体转化。在某些实施方案中,可以在转化之前将gus报道基因插入载体中。

将转化体(通过例如农杆菌、基因枪或peg-介导的转化制备)进行dna分析(pcr)和gus染色。

实施例7

制备稳定转化体,分析thca合成酶沉默,并选择最合适的品系用于代谢物分析和工业应用

在多株转化的大麻植物再生之后,可进行多核苷酸分析以确认基因整合并确定rna表达水平。另外,可以确定thca合成酶的mrna和蛋白质水平。还可以确定植物组织中的一种或多种生物活性代谢物(如萜烯或大麻素)的含量。例如,可以用公认的程序,例如其全文通过引用并入本文的美国专利公开20160139055中所述的方法来测定thc、cbd和/或大麻色烯中的一种或多种的含量。选择其中thca合成酶活性降低且thc含量降低和/或cbd含量升高的植物。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1