修饰类异戊二烯含量、组成和代谢的材料与方法

文档序号:5117026阅读:255来源:国知局

专利名称::修饰类异戊二烯含量、组成和代谢的材料与方法
技术领域
:本发明涉及修饰植物和其他生物中类异戊二烯含量、组成和代谢的材料和方法。尤其特别地,本发明涉及类异戊二烯化合物例如萜类化合物和类固醇化合物的合成中涉及的多肽,编码这些多肽的多核苷酸,这些多肽的表达,以及调节这些多肽的组成和/或表达水平并由此调节类异戊二烯含量、组成和代谢的方法。
背景技术
:类异戊二烯组成了一个天然存在的化合物的大家族,已被描述的不同化合物超过20,000种。类异戊二烯包括维生素A,D,E和K,这些当初是作为对动物的正常生长至关重要的脂肪材料以及作为多种生物色素而被认识的。在植物中,包括萜类化合物和类固醇化合物在内的类异戊二烯化合物,包括激素如赤霉酸和脱落酸,色素,电子载体,膜成分(植物甾醇类),植物毒素,抗生素,香料如薄荷醇,维生素,大分子化合物如橡胶和杜仲胶,及其他。异戊二烯化合物,或含异戊(间)二烯基的脂质,是由一或多个基本的异戊二烯骨架(C5)组成,后者经甲羟戊酸-5-焦磷酸脱羧作用形成。由异戊烯焦磷酸(“活性异戊二烯”或“IPP”)和同分异构的二甲基烯丙基焦磷酸经“头-尾”缩合作用可以形成香叶基焦磷酸(C10)。再键连上一个C5单位,则形成焦磷酸法呢酯(C15)。通过“头-尾”或“尾-尾”缩合进一步延伸产生C20,C30和C40化合物,以及更高分子量的萜类化合物。图1显示了异戊二烯化合物基本生物合成途径的概图。对一系列生物学上的重要分子而言,IPP是其分支点。这些分子包括类异戊二烯,类胡萝卜素,以及不同的真核生物中的各种甾醇(真菌甾醇,植物甾醇和动物甾醇)。在动物中,胆固醇是多种激素和胆酸的前体。真菌麦角甾醇和哺乳动物胆固醇由IPP经角鲨烯氧化物及羊毛甾醇形成,而高等植物甾醇,如菜油甾醇和谷甾醇,是由角鲨烯氧化物经环化作用形成环阿屯醇并进而经植物特异性的酶作用而形成。类异戊二烯的一个亚类谓之萜类化合物,在植物细胞中具有让人惊奇的多样性,该类化合物之大多数是环状的,有一或多个环。植物中的萜烯分为数类,包括倍半萜烯,单、二、三萜烯等(Bohlmann等,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)954126-4133,1998)。萜类化合物是由乙酸酯合成的异戊二烯单位(C5H8)连接而成。萜类化合物包括异戊二烯(C5H8)化合物,后者包括异戊烯焦磷酸和活性异戊二烯;单萜(C10H16)化合物,包括香叶醇,以及由之衍生出薄荷醇、樟脑、蒎烯和香茅醛;倍半萜烯(C5H24)化合物,包括法呢醇,由之衍生出姜烯、泛醌、塑体醌、脱落酸和rishitine;双萜(C20H32)化合物,例如香叶基香叶醇,由之衍生出叶绿醇,贝壳杉烯,赤霉酸和壳核孢(菌)素;三萜烯(C30H48)化合物,包括角鲨烯,由之衍生出甾类化合物和皂草苷;四萜烯(C40H64)化合物,包括八氢番茄红素和胡萝卜素;以及多萜烯(C5H8)n化合物,包括橡胶和杜仲胶。生产萜烯的合成酶被认为具有共同的进化起点,缺乏和其他酶类(不包括异戊烯基转移酶)的密切相似性。大部分合成酶具有从单一底物生产一系列终产物的能力。这可以部分解释在植物中发现的萜类化合物的巨大多样性(Mitchell-Olds等,植物科学动向(TrendsinPlantScience)3(9)362-365,1998)。复合萜烯混合物被认为是重要的植物防护性混合物,它们的多样性和协同作用延迟了食草生物和病原体中抗性的发展(LangenheimJ,J,Chem.Ecol.201223-1280,1994)。植物萜类化合物还有许多已知的药学效应,有些植物类异戊二烯化合物被当作药物给服。例如,紫杉酚,被证明在癌症治疗中有效,它是从萜类化合物衍生出来的。食物质的类异戊二烯已被建议来抑制甲羟戊酸路径,由此来影响肿瘤和心血管疾病(ElsonCE,J.Nutr.125(6增刊)1666S-1672S,1995)。甲羟戊酸途径所有支路的最后一个共同前体,法呢醇,已被证实抑制肌肉细胞中的钙通道(RoulletteJ-B,生物化学杂志(J.Biol.Chem),5132240-32246,1997)。泛醌和塑体醌,也是类异戊二烯衍生物,在线粒体和叶绿体的ATP生产中充当电子转运体。在大多数哺乳动物组织中,泛醌(也称为辅酶Q)含有10个异戊二烯单位。塑体醌是泛醌在植物中的等价物。在它们充当电子传递体的过程中,泛醌和塑体醌都能接受一或二个电子,一或二个质子被还原。异戊二烯基中间物的一个突出作用最近在研究一个蛋白质的过程中被发现,该蛋白质和人类肿瘤有关,已知其通过一个共价结合的异戊二烯基脂质和膜相连。这个蛋白质,即RAS蛋白,是基因产品,一个正常蛋白质的突变版本和一系列相关的GTP-结合蛋白。业内人士知道该正常蛋白质和该系列相关的GTP-结合蛋白在由神经递质、激素、生长因子及其他细胞外信号触发的信号转导中的作用。已知植物中萜类化合物含量的定性和定量修饰由外界因素如食草动物的攻击和侵害诱发(BohlmannJ等,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)956756-6761,1998)。细胞萜类化合物的合成也可以由病原体的感染诱导。甚至农业瘟疫性昆虫也可以被松油萜烯化合物所驱逐单萜,蒈烯,苎烯和甲基·异丙基苯威慑洋葱蝇(NtiamoahYa,Entom.Exp.etAppl.79219-226,1996)。虽则类异戊二烯的化学多样性已广为人知,且其中的许多代谢途径已得到试验的确定,但很少有编码负责类异戊二烯化合物合成的酶的基因已得到确定。因此本发明即是针对提供编码类异戊二烯生物合成过程中涉及的多肽的新的多核苷酸,以及提供方法以修饰这些多肽的表达及组成,由此调节类异戊二烯的含量、组成和代谢。许多生物学材料基因组的测序或部分基因组的序列分析,已经或正在大规模地进行,包括人的,动物的,微生物的以及许多植物品种的。用序列分析技术测定多核苷酸可以针对部分或全长的基因,可以包含编码多肽的开放阅读框架或部分开放阅读框。推定的多肽可基于多核苷酸序列而确定。因此有关多核苷酸的测序数据就代表了有价值和有用的信息。通过将确定的序列与各种公开的功能域数据库例如EMBL中发表的序列进行对比,可以分析多核苷酸的新颖性。新确定的多核苷酸和推导出的多肽也可以与数据库中的多核苷酸和多肽相比较,以确定与已知多核苷酸和多肽的同源性。如此这般,就可以确定未知功能的多核苷酸和多肽与已知功能的多核苷酸和多肽的相似性或同一性或同源性的程度。美国专利号5,589,619公开了通过修饰编码有HMG-CoA还原酶活性多肽基因的拷贝数以增加角鲨烯和甾醇在高等植物中的积累的材料和方法。已公开的有有关HMG-CoA还原酶活性的遗传学材料,包括多核苷酸,多肽,DNA分子,诸如此类,还有转化植物细胞和生产转基因植物的方法亦被公开。美国专利号5,689,047公开了葡萄藤中衍生的芪合成酶基因,以及这些基因在载体及转化的微生物中的应用,还有转化的植物细胞和植物。美国专利号5,753,507公开了编码香叶醇10-羟化酶(G10H)的植物多核苷酸,以及用全部或部分多核苷酸作为探针的方法,还有表达G10H及提高植物生产萜类化合物吲哚生物碱和ividoid昆虫信息素水平的方法。如下美国专利公布了类异戊二烯化合物或相关的化合物,或者应用这些化合物的方法美国专利号5,429,939;美国专利号5,444,166;美国专利号5,460,949;美国专利号5,470,832;美国专利号5,474,925;美国专利号5,495,070;美国专利号5,521,078;美国专利号5,545,816;美国专利号5,547,856;美国专利号5,569,832;美国专利号5,580,963;美国专利号5,597,718;美国专利号5,670,349;美国专利号5,674,485;美国专利号5,684,238;美国专利号5,689,056;美国专利号5,691,147;美国专利号5,693,476;及美国专利号5,443,978。以上提及的美国专利此处全部作为参考文献包括在内。发明概述简而言之,本发明提供了分离的多核苷酸,其编码类异戊二烯的生产和修饰过程中涉及的多肽。包括这些序列的基因工程构建物和应用这些基因工程构建物的方法也被提供,还有整合了这些遗传构建物并展示出经过修饰的类异戊二烯的含量、组成和代谢的转基因细胞和植物。第一方面,本发明提供了附件序列表中如SEQIDNOS1-53和78-164确定的分离的多核苷酸序列,那些序列的变体,包括了SEQIDNOS1-53,78-164所确定序列的扩展序列和它们的变体,对应于SEQIDNOS1-53,78-164所确定序列的以及其变体的探针和引物,包含了SEQIDNOS1-53和78-164所确定的任何多核苷酸的至少一特定数目的相邻残基(X-链节)的多核苷酸,以及包括了SEQIDNOS1-53和78-164所确定的序列之部分的延伸序列,此处所指的全部,总体称为“本发明的多核苷酸”。本发明也提供了附件序列表中如SEQIDNOS165-304所确定的分离的多肽序列,那些序列的多肽变体,及包括了该分离的多肽序列和那些序列变体的多肽,以及包括了SEQIDNOS165-304所确定的任一多肽中至少一特定数目的相邻残基的多肽,以及包括了SEQIDNOS165-304所确定序列之部分的多肽。确定为SEQIDNOS1-53和78-164的多核苷酸序列来源于植物,也就是来源于巨桉(Eucalyptusgrandis)和辐射松(Pimusradiata)。本发明的多核苷酸主要是“部分”序列,因为它们不代表编码全长多肽的全长基因。这种部分序列可以延伸,通过应用引物和/或探针和广为人知的杂交和/或PCR技术分析和测序不同的DNA文库来进行延伸。SEQIDNOS1-53和78-164所确定的序列由此就可以被延伸,直至编码一个多肽的一个开放阅读框被确定,一个全长的多核苷酸和/或能编码一个多肽的基因,或基因组中另一有用部分被确定时。当延伸的多核苷酸包括了SEQIDNOS1-53和78-164的任一序列特定的序列或其变体,或者包括了其中特定的相邻部分(X-残基)或其变体时,这种延伸的序列,包括全长的多核苷酸和基因,被描述成“对应于”一个序列,该序列被认定为SEQIDNOS1-53和78-164或其变体序列之一种,或为SEQIDNOS1-53和78-164或其变体的任一序列之一部分。同样地,RNA序列,反向序列,互补序列,反义序列,诸如此类,各种对应于本发明的多核苷酸,均可通过应用SEQIDNOS1-53和78-164确定的cDNA序列用常规方法确定和获得。SEQIDNOS1-53和78-164所确定的多核苷酸可以包括编码多肽的开放阅读框(“ORFs”)或部分开放阅读框。另外,可以在对应于SEQIDNOS1-53和78-164所示序列的全长或延伸序列中确定编码多肽的开放阅读框。开放阅读框的确定可以用本领域内广为人知的技术。这些技术包括,例如,分析已知启始和终止密码子的位置,基于密码子频率的最可能阅读框的确定,等等。ORF分析的合适工具和软件可以获得,例如,从网上,http//www.ncbi/nlm.nih.gov/gorf/gorf.html。本发明多核苷酸的开放阅读框或其部分可以被确定。一旦一部分开放阅读框被确定,用本领域内广为人知的技术,就可以在该部分开放阅读框的区域将多核苷酸延伸,直至全长的开放阅读框的多核苷酸被确定。这样,应用本发明的多核苷酸,就可以确定编码多肽的多核苷酸和开放阅读框架。当本发明多核苷酸的开放阅读框架一旦确定,该开放阅读框就可以被分离和/或合成。可表达的DNA构建物由此可以构建,它包括开放阅读框和合适的启动子,起始子,终止子,等等,这在专业内广为人知。这些DNA构建物可以导入宿主细胞以表达该开放阅读框所编码的多肽。合适的宿主细胞可以包括各种各样的原核和真核细胞,包括植物细胞。本发明的多核苷酸编码的多肽可以在各种不同的试验中表达和应用以确定它们的生物学活性。这些多肽可用于产生抗体,来分离相应的相互作用蛋白或其他化合物,以及对相互作用蛋白或其他化合物的水平进行定量。本发明也涉及调节一种生物中多核苷酸和/或多肽含量和组成的方法,根据一个实施方案,这些方法包括将包含有本发明的一或多个多核苷酸的基因工程构建物稳定地整合进该生物的基因组。在一个具体例子中,靶生物是一种植物,优选地是一种木本植物(woodyplant),更优选地是属于松树或桉树品种的一种木本植物,最优选的是巨桉(Eucalyptusgrandis)或辐射松(Pinusradiata)。在一个有关的方面,提供了一种方法以生产基因型或表现型得以改变的生物,该方法包括将本发明的基因工程构建物转化进宿主细胞,以提供一种转基因细胞,并在有利于生长和繁殖的条件下培养该转基因细胞。本发明还涉及和包括这种生物与野生型生物相比,作为调制本发明的多核苷酸或多肽的水平或含量的结果,该生物具有改变了的基因型或表现型;也涉及和包括这些生物的各部分(例如,种子)以及这些生物的后代。本发明分离的多核苷酸在基因组的制图中,在物理制图中及在基因的定位克隆中有用。另外,SEQIDNOS1-53,78-164所确定的多核苷酸序列,及其变体,可用于设计寡核苷酸探针和引物。寡核苷酸探针和引物具有与多核苷酸上某一特定部分的感兴趣的多核苷酸基本互补的序列。以本发明多核苷酸设计的寡核苷酸探针可用本领域内广为人知的技术,例如狭线DNA杂交技术,测定任何生物的细胞中是否存在有足够相似性DNA和RNA序列,以及检测其基因的表达模式。用本发明多核苷酸设计的寡核苷酸引物可以用于PCR扩增。用本发明的多核苷酸设计的寡核苷酸探针和引物的应用可以和不同的微排列技术相联系,包括Synteni所用的微排列技术(PaloAlto,CA)。本发明的多核苷酸也可以用于标记或鉴定一种生物或由之而来的再生性(reproductive)材料。这种标记可以如此完成,例如,向一种生物中稳定地导入一种无破坏性无功能的异源多核苷酸标识物,该多核苷酸包括本发明的一种多核苷酸。本发明的多核苷酸编码在类异戊二烯生物合成途径中有活性的多肽。类异戊二烯代谢相关性多核苷酸从松树和桉树中分离出来,并通过DNA和蛋白质相似性研究推导确认。许多种类异戊二烯化合物已得到很好的特征描述,且具有有用的性质。本发明的方法,涉及到调节一种生物中多核苷酸和/或多肽的含量和组成,由此调节生物的类异戊二烯含量、组成和代谢,这些方法适用于很宽范围内的活性。本发明的新材料和新方法有多种潜在用途在林业和农业中控制类异戊二烯代谢;在药物方面控制其治疗效果,包括直接应用于患病生物或通过转基因生物非直接应用;在涉及类异戊二烯的发酵和化学合成工业中;以及在其他许多应用中,其中有些在上述参考文献中有述。在植物应用中,控制类异戊二烯途径或类异戊二烯组分可以,例如,影响植物发育,昆虫抗性,及抽提物(蒎烯,月桂烯等)的价值。在粮食中,不同类异戊二烯影响摄入材料的营养品质和药学性质,例如影响人或动物消耗的动物来源的和植物来源食物的胆甾醇或植物甾醇的组成。另外,类异戊二烯途径控制维生素A,E和K的生产;植物色素例如胡萝卜素和叶绿素的叶绿醇链;天然橡胶;许多精油,例如柠檬油,桉和麝香的香料成分;控制变态的昆虫幼激素;多萜醇,在复合多糖类合成中充当油脂可溶性载体;以及泛醌和塑体醌,线粒体和叶绿体中的电子载体。类异戊二烯普遍而多样的用途使得这些化合物和编码它们的多核苷酸成为许多领域中生物技术应用的有吸引力的目标。简而言之,本发明提供了编码类异戊二烯的合成中涉及的多肽的分离多核苷酸。本发明的多核苷酸和多肽已被证实类似于如下表1所示的已知在类并戊二烯合成中涉及的多肽。表1在一个实施方案中,分离的多核苷酸包括一个选自下组的序列(a)SEQIDNOS1-53和78-164描述的序列;(b)SEQIDNOS1-53和78-164所述序列的互补物;(c)SEQIDNOS1-53和78-164所述序列的反向互补物;(d)SEQIDNOS1-53和78-164所述序列的反向序列;及(e)具有和此处所述(a)-(d)的某一序列具有40%,60%,75%或90%同一性的序列或含有(a)-(d)中某一序列中某一特定区域的序列。另一方面,提供了本发明的多核苷酸编码的分离多肽。在一个实施方案中,这些多肽包括本发明的多核苷酸编码的氨基酸序列,包括包含由SEQIDNOS1-53和78-164组成的群中某一序列的多核苷酸编码的多肽,还有包括了SEQIDNOS165-304中提及的氨基酸序列的多肽。再一方面,本发明提供了基因工程构建物,它包括单独的本发明的多核苷酸,或与本发明中一或多个另外的多核苷酸相连,或与一或多个已知的多核苷酸相连,还提供包括了这些构建物的转基因细胞。有关方面,本发明提供的基因工程构建物包括,按5′-3′方向的一个基因启动子序列;编码一个酶的至少一个功能区域一个开放阅读框,该酶由本发明的多核苷酸或其变体编码;以及一个基因终止序列。开放阅读框可置于有义或反义方向。包括编码酶的基因的非编码区域的基因工程构建物,以及一个基因启动子序列和一个基因终止序列,也被提供,该酶由上述多核苷酸或互补于非编码区域核苷酸序列编码。还涉及基因工程构建物,它按5′-3′方向包括一个启动子序列;包含了至少下述一种的多核苷酸序列(1)包括了本发明多核苷酸的一种多核苷酸;或(2)一种多核苷酸,包括了本发明的多核苷酸,还包括编码在类异戊二烯生物合成途径中有活性的多肽的基因的非编码区域。该基因工程构建物可以另外包括一个鉴定转化细胞的标记物。另一方面,提供了转基因宿主细胞,例如转基因植物细胞,包括本发明的基因工程构建物的,一同提供的植物包括这样的转基因细胞,果实,种子和这些植物的子裔。其他有用的宿主细胞包括细菌细胞,昆虫细胞,酵母细胞和哺乳动物细胞。再一方面,提供了调节一种生物类异戊二烯含量、组成和代谢的方法,这些方法包括将本发明的基因工程构建物稳定整合进该生物的基因组。在一个优选的实施方案中,靶生物是一种植物,且植物是一种木本植物,优选地选自桉树,松树,金合欢(acacia),白杨,胶皮枫香树(sweetgum),柚木和桃花心木,更加优选地选自松树和桉树物种,最优选选自巨桉(Eucalyptusgrandis)和辐射松(Pinusradiata)。在一个相关的方面,提供了一种方法以产生一种类异戊二烯含量得到了改变的生物,该方法包括用本发明的基因工程构建物转化一种宿主细胞以提供一种转基因细胞,并在进行生长和繁殖的条件下培养该转基因细胞。又一个方面,本发明提供了在靶生物例如一种植物中修饰多肽活性的方法,包括将本发明的基因工程构建物稳定整合进该生物的基因组。在一个优选的实施方案中,靶生物是一种植物,且是一种木本植物,优选地选自桉树,松树,金合欢,白场,胶皮枫香树(smeetgum),柚木和桃花心木,更加优选地选自由松树和桉树物种,最优选选自巨桉(Eucalyptusgrandis)和辐射松(Pinusradiata)。再一个方面,本发明提供了通过将本发明的分离多肽施用给该生物而调节一种生物中一种类异戊二烯化合物的含量、组成和代谢的一项或多项的方法。在应用中如该生物是一种植物,多肽就可以局部给予,例如喷撒或类似的局部应用。在应用中如该生物是哺乳动物,多肽的给予就可以是全身的,例如通过注射,真皮内输送,口服,通过鼻腔或呼吸道输送,或类似办法。在参照下述更加详尽的描述之后,本发明上述及另外的特征,以及获得它们的方法将会更加明了,本发明将会得到最好的理解。附图简述图1给出示意图,表明异戊二烯化合物的基本生物合成途径。图2表明烟草植物中来的基因组DNA样品,烟草植株来自于一个标记试验用源自松树(左侧小组)的单一序列鉴别子和源自桉树(右侧小组)的单一序列鉴别子。在两组当中,A道和B道含有源自空载体转化的对照植物的DNA样品,C-E道含有源自用单一序列鉴别子转化的植株的DNA样品。图3表明对转化烟草植侏中松树单一序列标识物的检测。A和B道显示来自SEQIDNO76的探针和缺乏松树单一序列标识物的烟草植株(空白载体转化的对照植株)基因组DNA杂交。C-E道显示探针和含松树单一序列标识物1到3拷贝的烟草植株基因组DNA杂交。图4表明对转化烟草植株中桉树单一序列标识物的检测。A和B道显示来自SEQIDNO77的探针和缺乏桉树单一序列标识物的烟草植株(空白载体转化的对照植株)基因组DNA杂交。C-E道显示探针和含桉树单一序列标识物1-2拷贝的烟草植株基团组DNA杂交。发明详述如上所述,在一系列真核生物功能中类异戊二烯是重要组分。在该路径的较早期部分对类异戊二烯含量,组分和代谢进行修饰,尤其是在异戊二烯二磷酸(IPP),香叶基二磷酸(GPP),法呢酯二磷酸(FPP)和角鲨烯的合成步骤中,对衍生自这两种母体的类异戊二烯化合物的合成可以有一个深的影响。阻断一或多个由类异戊二烯二磷酸和角鲨烯分枝的下游步骤对可用于萜烯和甾类化合物合成的类异戊二烯二磷酸和角鲨烯库也有重大影响。因此,对类异戊二烯生物合成途径中的任何单个酶在合成、含量、组成和代谢上的修饰,尤其发生在类异戊二烯合成途径早期部分者(IPP→GPP→FPP→角鲨烯),就可以影响到萜类和甾类化合物的含量,组分和代谢。用本发明的方法和材料,可以通过将编码在类异戊二烯合成中涉及的多肽的多核苷酸之有义或反义拷贝整合进靶生物的基因组而修饰一种植物的类异戊二烯含量。另外,在类异戊二烯生物合成途径中编码不同酶的多核苷酸,其拷贝数和组合也可以被操纵以修饰合成的类异戊二烯的相对数量,由此产生具有改变了组成和/或类异戊二烯代谢的生物学材料。类似地,类异戊二烯组分的改变,为靶生物的直接应用,或为了生产用于分离的多肽,对一系列的应用而言都是有利的,正如上述文献和此处包括的文献所证实的那样。根据一个实施方案,本发明提供了分离的多核苷酸,编码或部分编码与已知在类异戊二烯合成或修饰过程中涉及的多肽具有相似性的多肽。本发明的多核苷酸是从桉树和松树物种中分离出来,但也可以取而代之从其他植物来源分离及用传统的合成技术合成。特别地,本发明的分离多核苷酸包括SEQIDNOS1-53和78-164确定的多核苷酸;SEQIDNOS1-53和78-164确定序列的互补物;SEQIDNOS1-53和78-164确定序列的反向序列;SEQIDNOS1-53和78-164确定序列的反向互补物;上述任一多核苷酸的至少一特定数目的相邻残基(X-链节);互补于上述任一多核苷酸的多核苷酸;对应于上述任一多核苷酸的反义序列;上述任一多核苷酸的变体,该术语正如此处所述。SEQIDNOS1-53和78-164所述的分离多核苷酸编码或部分编码显示出与如上表1所示,已知在类异戊二烯生物合成途径中涉及的多肽具有序列相似性的多肽。更特别地,表1第一栏中列出的分离多核苷酸编码或部分编码平行列于上述表1第二栏中的多肽。对应于SEQIDNOS1-53,78-164的多核苷酸,基于提交此申请时所能获得信息的基础上而推测出来的氨基酸序列,提供于SEQIDNOS165-304,如表1所示。此处所用的术语“多核苷酸”,指单链或双链脱氧核糖核苷酸或核糖核苷酸碱基的多聚体,包括DNA和相应的RNA分子,包括HnRNA和mRNA分子,包括有义及反义链,互补cDNA,基因组DNA和重组DNA,还包括全部或部分合成的多核苷酸。一个HnRNA分子包含内含子,总体上按一对一的方式对应于DNA分子。一个mRNA分子对应于一个HnRNA和DNA分子,内含子已从这后两者中消除。一个多核苷酸可以由一整个基因或其任一部分组成。一个基因是指一个编码一个功能多肽或RNA分子的多核苷酸。可操作的反义多核苷酸可以包括相应多核苷酸的一个片段,因此“多核苷酸”的定义包括所有这些可操作的反义片段。反义多核苷酸及包括反义多核苷酸的技术在专业内广为人知,且在例如RobinsonBenion等酶学方法(MethodsinEnzgmol)254(23)363-375,1995;及Kawasaki等ArtifieOrgaue20(8)836-848,1996中均有描述。本发明的多核苷酸也包括这样的多核苷酸序列与已公布的序列有区别,但由于密码子的简并性,编码与本发明多核苷酸编码的多肽相同的多肽。此处应用的术语“互补”,“反向互补”及“反向序列”的定义,用下述例子最好说明。对序列5’AGGACC3’,其互补,反向互补,及反向序列如下互补3’TCCTGG5’反向互补3’GGTCCT5’反向序列5’CCAGGA3’基因组DNA和异源种类DNAs的鉴定可通过标准的DNA/DNA杂交技术完成,在适当严格的条件下,用全部或部分cDNA序列作为探针来筛选一个合适的文库。另一种方案,PCR技术,用基于已知基因组DNA,cDNA和蛋白质序列设计的寡核苷酸引物,可用以扩增和鉴定基因组及cDNA序列。对应于已鉴定序列和变体的合成DNAs可用传统的合成方法生产。此处所述的所有多核苷酸,均按本领域惯常所用的术语所述的方法,予以分离和纯化。另一方面,本发明提供了上述多核苷酸编码或部分编码的分离的多肽。此处所用的术语“多肽”包括任意长度的氨基酸链,包括全长蛋白质,其中的氨基酸残基通过共价肽键相连。此处所用的术语“多核苷酸编码的多肽”,包括由多核苷酸编码的多肽,包括此处提供的分离多肽或其变体。在一个实施方案中,本发明的多肽包括选自由SEQIDNOS165-304提供序列及这些序列的变体的氨基酸序列。根据另一个实施方案,本发明之多肽包括SEQIDNOS165-304任一序列中至少一特定数目的相邻残基(X-链节)。本发明的多肽可以重组生产,通过将编码该多肽的多核苷酸插入一个表达载体并在一个合适的宿主中表达该多肽。本领域中普通技术人员所知道的一系列表达载体中的任一种都可以应用。已被包含有编码重组多肽的多核苷酸的一个表达载体转化或转染的任一合适的宿主细胞均可实现表达。合适的宿主细胞包括原核生物,酵母和高级真核细胞。优选地,应用的宿主细胞是大肠杆菌,昆虫,酵母或一个哺乳动物细胞系例如COS或CHO。此种方式表达的多核苷酸可以编码自然存在的多肽,自然存在多肽的部分,或其其他变体。在一个相关的方面,提供的多肽包括一个多肽的至少一个功能部分,该多肽具有的氨基酸序列选自SEQIDNOS165-304及其变体提供的序列。正如此处所用的,多肽的“功能部分”是包括了对影响多肽功能至关重要的活性位点的那部分,例如,分子中能结合一或多个反应物的那部分。活性位点可以由一或多个多肽链提供的不同部分组成,一般将显示高的结合亲和力。多肽功能部分的鉴定首先要通过对多肽进行化学或酶消化来制备多肽片段,或者通过对编码多肽的多核苷酸进行突变分析,并随后表达得到的突变多肽。多肽片段或突变多肽随后被检测,例如用下面提供的代表性分析来确定哪部分保留有生物学活性。包括一个活性位点的功能部分可以由一或多个多肽链提供的分离部分组成,通常显示出高的底物特异性。此处所用的术语“被一个多核苷酸编码的多肽”,包括被多核苷酸编码的多肽,该多核苷酸包括本发明的部分的分离的多核苷酸。新发明多肽的部分或其它变体也可以用合成或重组方法产生。含有少于约100个氨基酸,通常少于约50个氨基酸的合成多肽,可以用本领域普通技术人员公知的技术获得。例如,这些多肽的合成可以用任一种商业上可获得的固相技术,例如Merrifield固相合成技术,其中氨基酸是被序列性地加到增长着的氨基酸链。见Merrifield,J.Am.Chem.Soc.85;2149-2154,1963。自动合成多肽的设备可通过商业途径从提供商如PerkinElmer/AppliedBiosystems,Inc.(FosberCity,CA)等处获得,可以按制造商的介绍操作。天然多肽的变体可以用标准的诱变技术制备,例如寡核苷酸定向的位点特异性诱变(KunkelT,美国国家科学院院刊(Proc,Natl.Acad.Sci.USA)82488-492,1985)。用标准技术也可以将DNA序列的部分移去,以允许截短多肽的制备。总而言之,此处分开的多肽是制备成一种分离的,基本上纯化的形式。优选地,多肽的纯度至少约80%;更加优选地至少约90%纯度;最优选地,至少约99%纯度。在特定优选的实施方案中,下面有详尽描述,分离多肽被掺入药物组合物或疫苗中用于治疗皮肤疾病。此处所用的术语“变体”包括与具体确定的序列有区别的多核苷酸或多肽序列,其中一或多个核苷酸或氨基酸残基被删除、替代或增加。变体可以是自然发生的等位基因变体,或非自然发生的变体。变体多核苷酸序列优选地和本发明的序列至少显示出40%的同一性;更加优选地至少60%;进一步优选地至少75%;最优选地至少90%的同一性。变体多肽序列与本发明序列的同一性,优选地显示至少50%,更加优选地至少75%;进一步优选地至少90%;最优选地至少95%。同一性的百分比是这样确定的将两个要比较的序列如下所述平行排列,确定匹配部分相同残基的数目,将此数目除以新发明(被询问的)序列的残基总数,将结果乘以100。运用可公开获得的计算机程序,多核苷酸和多肽序列可进行匹配,与另一多核苷酸或多肽在某一特定区域残基同一性的百分比也可以确定。用以匹配和确定多核苷酸序列相似性的两个举例程序是BLASTN和FASTA程序。多核苷酸也可以用BLASTX程序分析,它将一个核苷酸查询序列(双链)的六个阅读框架概念翻译产物与一个蛋白质序列数据库做对比。多肽序列同一性百分比可以用BLASTP程序检测。BLASTN,BLASTX和BLASTP程序可以从NCBI上/blast/executables/下的无名FTP服务器(ftp//ncbi.nlm.nih.gov)得到。BLASTN程序2.0.4(1998年2月24日)版本和2.0.6版本(1998年9月16日),按照下述的参数设定,优选用于本发明多核苷酸变体的测定。BLASTP程序,按照下述的参数设定,优选用于本发明多肽变体的测定。BLAST程序家族的应用,包括BLASTN,BLASTP和BLASTX,在NCBI的网站的URLhttp//www.ncbi.nlm.nih.gov/BLAST/newblast.html及A1tschul等在核酸研究(NucleicAeidsRes.)253389-3402,1997的发表作品中有述。计算机程序FASTA在Internet的ftp站点ftp//ftp.virginia.edu/pub/fasta/可以获得。2.0u4版本(l996年2月),按照文件中描述的及随着程序面扩散的有默认的参数设置,也可以用来对依据本发明的变体进行测定。对FASTA程序应用的描述见于Pearson和Lipman,Proc.Natl.Acad.Sci.USA852444-2448,1998;及PearsonWR酶学方法(MethodsinEnzymol.)18363-98,1990。应用对E值和同一性百分比起作用的BLASTN来对多核苷酸序列的匹配和相似性进行测定,下述运行参数是优选的Unix运行需要blastall-Pblastn-demblbd-e10-Go-Eo-r1-v30-b30-iqueryseq-o结果;参数是-P程序名[列];-d数据库[列];-e期望值(E)[实数];-G打开一个间隔的贡献(零引起无效行为)[整数];-E延伸一个间隔的贡献(零引起无效行为)[整数];-r一个核苷酸配对的获得值(仅用于BLASTN)[整数];-v单线描述的数字(V)[整数];-b显示的匹配数目(B)[整数];-i询问文件[文件输入];及-0BLAST报告输出文件[文件输出]选择。应用对E值和同一性百分比起作用的BLASTP来对多肽序列的匹配和相似性进行测定,下述运行参数是优选的blastall-pblastp-dswissprotdb-e10-G0-E0-v30-b30-iqueryseq-0结果;参数是-p程序名[列];-d数据库[列];-e期望值(E)[实数];-G打开一个间隔的贡献(零引起无效行为)[整数];-E延伸一个间隔的贡献(零引起无效行为)[整数];-v单线描述的数字(v)[整数];-b显示的匹配数目(b)[整数];-I询问文件[文件输入];-0BLAST报告输出文件[文件输出]选择。通过BLASTN,FASTA,BLASTP或一个相似的程序产生的询问序列对一或多个数据库序列“点击”,进行匹配并确定序列的相同部分。命中序列按照相似性的程度及序列重叠的长度进行排列。一个数据库序列的命中序列通常代表的是只和询问序列的序列长度的一部分相重叠。BLASTN,FASTA和BLASTP程序也产生匹配的“期望”值。期望值(E)是指当搜索一特定大小的数据库随机察看一特定数目的连续序列时可以“期望”的命中物的数目。在测定一个数据库,例如优选的EMBL数据库的命中者是否显示真正的相似性时,期望值是被用作一个重要的阈值。例如,给一个多核苷酸命中者赋予0.1的E值可解释成这样的意思有一个大小类似于EMBL数据库的数据库中,仅仅通过随机观察可以得到一个类似的分值,即可望在序列的匹配部分看到0.1的配对。按照这条标准,多核苷酸序列匹配和配对的部分由此可以有90%可能性是相同的。对于匹配和配对的部分E值为0.01或更小的序列,则在EMBL数据库中用BLASTN或FASTA程序随机找到一个配对的可能性是1%或更小。根据一个实施方案。关于本发明的每一个多核苷酸和多肽,“变体”多核苷酸和多肽,优选地包括这种序列当与本发明的多核苷酸或多肽对比时产生的E值为0.01或更小。也即,变体多核苷酸或多肽是指任何与本发明多核苷酸或多肽序列相同的可能性至少在99%的序列,在用BLASTN,FASTA或BLASTP程序按上述设定的参数测定时具有0.01或更小的E值。根据优选的实施方案,变体多核苷酸是具有和本发明多核苷酸相同数目核酸或较少数目核酸的序列,但与本发明多核苷酸相比是根据使用参数如上述设定的BLASTN或PASTA程序测定的具有0.01或更小的E值所测定的与本发明的多核苷酸相同的可能性至少99%的序列。类似地,根据一个优选的实施方案,一个变体多肽是拥有与本发明多肽相同数目或较少氨基酸但与本发明多肽相比具有至少99%的相同可能性的序列,在用BLASTP程序按上述设定参数测定时,具有0.01或更小的E值。抑或者,本发明的变体多肽苷酸或多肽包括的序列和本发明的多核苷酸或多肽显示出至少40%的同一性;更加优选地至少60%;更进一步优选地至少75%;最优选地至少90%,测定方法如下所述。同一性百分比的测定通过使用BLASTN,FASTA,或BLASTP程序之一,按上述设定的运行参数来比较序列,并确定比较部分相同核苷酸或氨基酸的数目;将相同核苷酸或氨基酸的数目除以本发明的多核苷酸或多肽的核苷酸或氨基酸的总数目;然后再乘以100以确定同一性的百分比。例如,在用BLASTN程序按上述参数进行匹配时,本发明中有220个核苷酸的一个多核苷酸与EMBL数据库中有520个核苷酸的一个多核苷酸,有连续23个核苷酸相匹配。命中的23个核苷酸包括21个相同核苷酸,一个间隔和一个不同核苷酸。本发明多核苷酸与EMBL文库中的命中者的同一性百分比就是21/220×100,或9.5%。EMBL数据库中的多核苷酸序列由此就不是本发明多核苷酸的一个变体。或者,本发明的变体多核苷酸在严格条件下与下述多核苷酸杂交SEQIDNOS1-53和78-164述及的多核苷酸序列,或那些序列的互补物,反向序列,或反向互补物。正如此处所用的,“严格的条件”指的是6×SSC,0.2%SDS的溶液中预清洗;在65℃,6×SSC,0.2%SDS条件下杂交过夜;接着是两次清洗,每次30分钟,条件1×SSC,0.1%SDS,65℃,再两次清洗,0.2×SSC,0.1%×SDS,65℃各30分钟。本发明也包括这样的多核苷酸与已公开的序列有区别,但是,作为遗传密码简并性的结果,编码与本发明多核苷酸编码的多肽有相似的酶活性的多肽。这样,包括如下序列的多核苷酸被涉及和包括在本发明之内由于保守替换而与SEQIDNOS1-53或78-164所述的多核苷酸序列,或那些序列的互补物,反向序列,或反向互补物有区别的序列。另外,亦被涉及和包括在本发明之内的多核苷酸包括下面序列由于缺失和/或插入与SEQIDNOS1-53和78-164所述的多核苷酸序列,或互补物,反向互补,或反向序列有区别的序列,其缺失和/或插入的总体小于总序列长度的10%。同样地,被涉及和包括在本发明之内的多肽包括下面序列由于氨基酸替换,插入,和/或缺失但总长度小于序列总长度的10%而与SEPIDNOS165-304所述的多肽序列有差异的序列,前提是变体多肽在类异戊二烯生物合成途径中有活性。本发明的多核苷酸可以从不同的文库中分离,或用本领域内熟知的技术合成。多核苷酸可以合成,例如,用自动的寡核苷酸合成仪(例如,BeckmanDligo1000MDNA合成仪)以获得50或更多核苷酸的多核苷酸片段。许多这样的多核苷酸片段而后就可以用分子生物学领域中广为人知的标准DNA操作技术连接起来。一个传统的和示范性的多核苷酸合成技术包括合成单链的多核苷酸片段,它有,比方说,80个核苷酸,将此片段与一个合成的互补性的85个核苷酸的片段杂交,以产生5个核苷酸的突出端。下一个片段可以用相似的方式合成,在相对链上产生5个核苷酸的突出端。当两部分杂交的时候该“粘性”末端保证了正确的连接。用这种方式,本发明的完整多核苷酸可以完全在体外合成。确认为SEQIDNOS1-53和78-164的一些多核苷酸称之为“部分”序列,因为它们并不代表编码一个自然存在的多肽的基因的全长编码部分。此处公开的部分多核苷酸序列可用来获得不同物种或生物的相应全长基因,办法是,例如,用基于本发明多核苷酸的杂交探针筛选DNA表达文库,或者用基于本发明多核苷酸的引物做PCR扩增。通过这种途径,运用本领域内公知的方法,可以将本发明中多核苷酸对应的mRNA向上游和下游延伸,还可以鉴定完整基因对应的基因组DNA,包括其启动子和增强子区域。这样,本发明包括的分离多核苷酸就包括SEQIDNOS1-53和78-164确定的序列,或者任一个编码功能多肽的特定序列,包括全长基因,的变体。这些延伸的多核苷酸的长度从约50变化到约4000核苷酸或碱基对,优选地长度小于约4000核苷酸或碱基对,更加优选地长度小于约4000核苷酸或碱基对,更加优选地长度小于约3000核苷酸或碱基对,更进一步优选地长度小于2000核苷酸或碱基对。在某些条件下,本发明的延伸多核苷酸的长度小于约1800核苷酸或碱基对,优选地小于约1600核苷酸或碱基对,更加优选地小于约1400核苷酸或碱基对,更进一步优选地小于约1200核苷酸或碱基对,最优选地小于约1000核苷酸或碱基对。本发明的多核苷酸也包括下述多核苷酸包含了鉴定为SEQIDNOS1-53和78-164的任何多核苷酸,这些序列的互补物,反向序列,和反向互补物,及它们的变体的任一种序列当中,至少一特定数目的相邻残基(X-链节)。类似地,本发明的多肽包括的多肽包含了鉴定为SEQIDNOS165-304任一种多肽及它们的变体中至少一特定数目的相邻残基(X-链节)。此处所用的术语“X-链节”,关于“X”的特定值,指的是包含了鉴定为SEQIDNOS1-53和78-164的多核苷酸,或鉴定为SEQIDNOS165-304的多肽的任一种当中至少一特定数目(“X”)相邻残基的序列。根据优选的实施方案,X的值优选地至少为20;更加优选地,至少40;进一步优选地,至少60;最优选地,至少80。这样,本发明的多核苷酸或多肽包括了鉴定为SEQIDNOS1-53和78-304的多核苷酸或多肽或其变体的20-链节,40-链节,60-链节,80-链节,100-链节,120-链节,150-链节,180-链节,220-链节,250-链节,或300-链节,400-链节,500-链节,或600-链节。互补于和/或对应于SEQIDNOS1-53和78-164以及那些序列的变体的多肽苷酸探针和引物,也包括在本发明之中。这种寡核苷酸探针和引物主要是互补于感兴趣的多核苷酸。此处所用的术语“寡核苷酸”指的是一个多核苷酸序列的一个相对短的片段,通常包括6到60个核苷酸,包括杂交分析中应用的探针以及通过PCR扩增DNA当中应用的引物。当某一寡核苷酸探针或引物,或其互补物,被包含在SEQIDNOS1-53和78-164,或一种特定序列的一种变体所表明的一种序列之中时,该寡核苷酸探针和引物被描述成“对应于”本发明的多核苷酸,包括SEQIDNOS1-53和78-164表明的序列之一,或其变体。下述情形下两条单链序列就被说成是基本上互补的带有适当的核苷酸插入和/或缺失的一条链核苷酸任选地和另一链的核苷酸匹配和比较,至少有80%的配对,优选地至少90%到95%,更加优选地至少98%到100%配对。抑或者,在严格的杂交条件下,当第一DNA链选择性地和第二DNA链杂交时存在基本互补性。测定互补性的严格杂交条件包括的盐浓度小于约1M,更经常地是小于约500mM,优选地小于200mM。杂交温度可以低至5℃,但通常要高于约22℃,更加优选地要高于约30℃,最优选地要高于约37℃。更长的DNA片段可能需要更高的杂交温度以进行专一性杂交。由于杂交的严格性可以受其他因素所影响,诸如探针的组成,有机溶剂的存在和碱基错配的因素,各种参数的结合较之任一种单一因素的绝对数值要更为重要。来自植物的或含有植物材料的样品或产品的DNA,可以是基因组DNA或通过存在于样品中的RNA制备cPNA再衍生出的DNA。除DNA-DNA杂交之外,DNA-RNA或RNA-RNA杂交分析也是可能的。在第一种情况下,来自被表达基因的mRNA可取代基因组DNA或衍自样品mRNA的cDNA而被检测。在第二种情况,RNA探针可以被利用。另外,与靶序列特异性杂交的DNA的人工类似物也可以被应用。在一个特定的实施方案中,寡核苷酸探针和/或引物包括至少约6个相邻残基,更加优选地至少约10个相邻残基,最优选地至少约20个相邻残基互补于本发明的多核苷酸序列。本发明的探针和引物的长度可以是约8到100个碱基对,或者,优选地,长度约10到50个碱基对,或者,更加优选地,长度从约15到40个碱基对。用本领域公知的方法,容易筛选探针,这些方法考虑到了DNA-DNA杂交的严格性,退火和解链温度,形成环的可能性及领域内公知的其他因素。适合设计探针的工具和软件,尤其是适合设计PCR引物的,从Internet上可以获得,例如,在URLhttp//www.horizonpress.com/pcr/。设计PCR引物的优选技术在DieffenbachCW和DykslerGS的著作中也有公开,见PCR引物实验手册(PCRPrimeia1aboratorymanual),CSHL出版社冷泉港,纽约,1995。对应于本发明多核苷酸的许多寡核苷酸探针或引物可以用试剂盒的形式提供。这些试剂盒通常包括多种DNA或寡核苷酸探针,每一种探针特异性地针对一种多核苷酸序列。本发明的试剂盒可以包括一或多种对应于本发明多核苷酸的探针或引物,本发明的多核苷酸包括SEQIDNOS1-53和78-164确定的多核苷酸序列。在一个对高通量分析有用的实施方案中,本发明的寡核苷酸探针试剂盒在一种阵列形式中包括了多种探针,其中的每一种探针被固定在一种固体底物表面的一个预先规定的、空间上可居留的位置。本发明中可以有效应用的阵列形式公开于,例如,美国专利号5,412,087和5,545,531;和PCT公开号WO95/00530,其分开的内容此处作为参考被包括。引物,优选地阵列形式的引物,用本领域公知的高通量筛选技术,可用来对生物中或含有遗传材料的样品或产品中的差异进行筛选。在以下的实际应用中,于高通量筛选系统中应用探针的重要性是明显的例如植物育种和质量控制操作,其中需要鉴定大数量的种子地和植物幼苗,测定样品或产品以寻找不需要的植物材料,为了检疫的目的鉴定植物或含有植物材料的样品或产品,等等,或者为了确定植物或含有植物材料的样品或产品的真正来源。本发明的多核苷酸用作标记植物的标识物对其存在与否的筛选在下述情况下是有价值的对植物育种中基因漂流数量,通过花粉散播的基因渗入等等进行的后期检测。用这种方式,本发明的寡核苷酸探针试剂盒可用来检测含有不同材料的不同样品或产品中多核苷酸的存在/不存在(或者在混合物情况下的相对数量),以一种快速且低耗高效的方式。可用本发明测定的植物种类的例子,包括林业物种,例如松树和桉树种类,其他树种,以及农业和园艺植物。本发明的另外一方面包括本发明中许多多核苷酸的集合。本发明中许多多核苷酸的集合,尤其是SEQIDNOS1-53和78-164确定的多核苷酸及其变体,可以记录和/或贮存在一个保存介质上,随后用于分析,比较等目的。合适的保存介质包括磁性介质诸如磁盘,磁带,CD-ROM保存介质,光学保存介质,诸如此类。记录和贮存信息的合适保存介质和方法,以及从这些介质之上获得记录的信息例如多核苷酸序列,在本领域是公知的。保存于保存介质上的多核苷酸信息优选的是计算机可读的,可以用于多核苷酸信息的对比和分析。根据一个实施方案,保存介质包括至少4种本发明多核苷酸的一个集合,优选地至少10种,更加优选地至少15种,最优选地至少20种,此处本发明多核苷酸优选的是确定为SEQIDNOS1-53和78-164的多核苷酸,及那些多核苷酸的变体。在有关应用中如果需要对在类异戊二烯生物合成和/或类异戊二烯代谢过程中涉及的多肽进行调节,就可以将一个开放阅读框架按有义或反义方向插进一个基因工程构建物中,以至用该基因工程构建物转化靶植物导致该多肽表达水平相对于野生生物表达水平的一个改变。用包括了有义方向开放阅读框的基因工程构建物去转化通常将导致对被选择基因表达的调节,而用包含了反义方向开放阅读框的基因工程构建物去转化通常将导致被选择基因表达的下降。用包括了本发明按有义或反义方向插入开放阅读框的基因工程构建物转化的一大批植物,用该领域技术人员公知的技术,被研究基因增高或降低的表达物可以被筛检出来,具有理想表现型的植物于是可以分离出来。抑或者,在基因工程构建物中,按有义或反义方向,插入本发明开放阅读框的一部分,则类异二烯生物合成中涉及的基因的表达可以被抑制。这些个部分不必要是全长的,但优选地包括本发明多核苷酸的至少25个残基,更加优选地,至少50个残基。一个更长的部分,甚者对应于完整开放阅读框的全长多核苷酸,也可以被应用。只要有足够的序列相似性以实现对靶基因的抑制,开放阅读框的该部分没有必要和内源序列精确相同。这样,从一个物种得到的序列可用以抑制不同物种中基因的表达。依据另一个实施方案,本发明的基因工程构建物包括的多核苷酸包含了一个基因的一个非编码区域,该基因编码本发明多核苷酸编码的多肽,或者包含与这样的非编码区域互补的多核苷酸。在这些构建物中能够被有效利用的非编码区的例子包括内含子和5’端非编码引导序列。用这样一个基因工程构建物去转化靶植物可导致类异戊二烯化合物数量的减少,而该化合物是植物通过共抑制过程合成的,此方式类似于,例如,Napoli等在植物细胞(P1antCell)2279-290,1990和CarvalhoNiebel等在植物细胞(PlantCell)7347-358,1995中讨论的。抑或者,在核酶构建物中插入适当的序列或亚序列(例如DNA或RNA)可以实现调节(McIntyreCL和MannersJM,TransgenicRes.5(4)257-262,1996)。核酶是合成的RNA分子,它包括的一个杂交区域互补于两个区域,两个区域中的任一个都包括一个本发明的多核苷酸编码的mRNA分子中至少5个相邻的核苷酸。核酶拥有高度特异性的内切核酸酶活性,它自我催化剪切mRNA。本发明的基因工程构建物还包括一个基因启动子序列和一个基因终止序列,可操纵地连接到待转录的多核苷酸,此二者控制着多肽的表达。基因启动子序列通常安置在待转录多核苷酸的5’末端,被用于启动多核苷酸的转录。基因的启动子序列通常发现于基因的5’非编码区域,但它们可存在于开放阅读框的下游,或在内含子之内(LuehrsenKR,Mol.Gen.Genet,22581-93,1991);或者存在编码区内,例如存在于植物防护基因内(Douglas等,EMBOJ.101767-1775,1991)。如果构建物包括了一个有义方向的开放阅读框,则基因启动子序列也起始该开放阅读框的翻译。对于包括了反义方向开放阅读框或非编码区的基因工程构建物,基因启动子序列仅仅由具有一个RNA聚分酶结合位点的转录起始位点构成。本领域公知本发明的基因工程构建物中可以有效应用的多种基因启动子序列。基因启动子序列,以及基因终止序列,对靶植物宿主来说可以是内源的或外源的,只要该启动子在靶宿主内有功能。例如,启动子和终止序列可以来源于其他植物种类,植物病毒,细菌质粒之类。优选地,对被引入的那些多核苷酸来说,其基因启动子和终止序列是共同的。影响启动子选择的因素包括构建物所期望的组织特异性,以及转录和翻译的时间的选择。例如,组成型启动子,例如35S的花椰菜花叶病毒(CaMV35S)启动子,带或不带增强子如KozaK序列或W增强子,以及根癌土壤杆菌(Agrobacteriumtumefaciens)胭脂碱合酶终止子,在本发明中可以有效应用。应用组织特异性启动子将导致仅仅在感兴趣的组织中产生期望的有义或反义RNA。应用携有可诱导基因启动子序列的基因工程构建物,RNA聚合酶的结合和起始效率可通过外源刺激予以调节,例如光、热,缺氧应激,以及营养条件的改变之类。时间调控的启动子可以用来在被转化细胞发育的某一特定时间影响对RNA聚合酶结合和起始效率的调节。优选地,应用来源于被研究酶基因原有的启动子,或用来源于待转化生物特定组织靶向基因的启动子,待转化生物如桉树或松树。本发明中可有效应用的基因启动子的其他例子包括甘露氨酸合酶(mas),章鱼氨酸合酶(ocs)及那些由Chua等在Science244174-181,1989中综述的。基因终止序列,位于待录多核苷酸的3’端,可以和基因启动子序列来源于同一基因,也可来自不同的基因。本领域公知的许多基因终止序列可以在本发明中有效应用,例如根癌土壤杆菌胭脂碱合酶基因。然则,优选的基因终止序列是那些来自原初的酶基因或者来自待转化的靶向物种。本发明的基因工程构建物也可以包括在靶细胞中有效的选择标记,例如,它可以在植物细胞中容许对含有本发明构建物的被转化细胞的检测。这些标记物,在本领域是公知的,典型地对一或多种毒素带有抗性。这种标记物的一个例子是NPTII基因,其表达导致对卡那霉素或潮霉素的抗性,这些抗生素在中等浓度下通常对植物细胞有毒(Rogers等,见WeissbachA和WeissbachH编,植物分子生物学方法(MethodsforPlantMolecularBiology),AcademicPressInc.SanDiego,CA,1988)。被转化的细胞由此可以通过它们在含有该种研究的抗生素的培养基中生长的能力而被鉴定出来。另一种可能,转化细胞中期望构建物的存在可以通过本领域公知的其他技术而被测定,例如Southern和Western印迹。当待转录的序列缺乏转录起始位点时,这样一个位点也可以附加以包括在该基因工程构建物中。操作连接本发明的基因工程构建物各组成的方法在本领域是公知的,包括使用含有所述一或多个限制性内切酶位点的合成的连接物,例如,据Sambrook等所述的,见《分子克隆实验室手册》,CSHLPressColdSpringHarbor,NY,1989。本发明的DNA构建物可以连接到一个拥有至少一套复制系统的载体中,例如大肠杆菌,而在每一个操作之后,产生的构建物可以被克隆,测序,而操作的正确性也可以被测定。本发明的基因工程构建物可用以转化一系列靶生物,例如植物,包括单子叶的(如草类,玉米,谷类,燕麦,小麦和大麦);双子叶的(如拟南芥属,烟草,豆科植物,苜蓿,橡树,桉树,枫树);裸子植物(如,欧洲赤松(Aronen,FinnishForestRes.Papers,Vol.595,1996);白云杉(Ellis等,生物技术(Biotechnology)1184-89,1993);及落叶松(Huang等,InVitroCell27201-207,1991)在一个优选的实施方案中,本发明的DNA构建物被用以转化木本植物,此处定义为树或灌木,且其茎存活多年,由于木组织的增加茎的直径每年也有增加。优选地,靶植物选自桉树和松树种类,最优选地是选自巨桉和辐射松。可用本发明DNA构建物有效转化的其他物种包括,但不局限于松树,如美国短叶松(Pinusbanksiana),土耳其松(Pinusbrutia),加勒比松(Pinuscaribaea),沙松(Pinusclausa),小干松(Pinuscontorta),大果松(Pinuscoulteri),短叶松(Pinusechinata),Pinuseldarica,湿地松(Pinusellioti),约弗松(Pinusjeffreyi),糖松(Pinuslambertiana),小白松(Pinusmonticola),欧洲黑松(Pinusnigra),长叶松(Pinuspalustrus),海岸松(Pinuspinaster),西黄松(Pinusponderosa),美加红松(Pinusresinosa),刚松(Pinusrigida),晚松(Pinusserotina),北美乔松(Pinusstrobus),欧洲赤松(Pinussylvestris),火炬松(Pinustaeda),北美二针松(Pinusvirginiana);其他裸子植物,例如太平洋银枞(Abiesamabilis),胶枞(Abiesbalsamea),白云杉(Abiesconcolor),巨冷杉(Abiesgrandis),洛杉矶冷杉(Abieslasiocarpa),红果冷杉(Abiesmagnifica),壮丽冷杉(Abiesprocera),美国扁柏(Chamaecyparislawsonina),黄扁柏(Chamaecyparisnootkatensis),美国尖叶扁柏(Chamaecyparisthyoides),Huniperusvirginiana,欧洲落叶松(Larixdecidua),美洲落叶松(Larixlaricina),日本落叶松(Larixleptolepis),西方落叶松(Larixoccidentalis),新疆落叶松(Larixsiberica),下延香松(Libocedrusdecurrens),欧洲云杉(Piceaabies),恩格曼氏云杉(Piceaengelmanni),白云杉(Piceaglauca),黑云杉(Piceamariana),锐尖北美云杉(Piceapungens),红云杉(Picearubens),北美云杉(Piceasitchensis),花旗松(Pseudotsugamenziesii),Sequoiagigantea,北美红杉(Sequoiasempervirens),落羽杉(Taxodiumdistichum),加拿大铁松(Tsugacanadensis),异叶铁杉(Tsugaheterophylla),西美山铁杉(Tsugamertensiana),北美香柏(Thujaoccidentalis),北美乔柏(Thujaplicata);及桉树,如Eucalyptusalba,Eucalyptusbancroftii,Eucalyptusbotyroides,Eucalyptusbridgesiana,Eucalyptuscalophylla,赤桉(Eucalyptuscamaldulensis),柠檬桉(Eucalyptuscitriodora),Eucalyptuscladocalyx,Eucalyptuscoccifera,Eucalyptuscurtisii,Eucalyptusdalrympleane,Eucalyptusdeglupta,Eucalyptusdelagatensis,Eucalyptusdiversicolor,Eucalyptusdunnii,美丽花桉(Eucalyptusficifolia),蓝桉(Eucalyptusglobulus),Eucalyptusgomphocephala,Eucalyptusgunnii,Eucalyptushenryi,Eucalyptuslaevopinea,Eucalyptusmacarthurii,Eucalyptusmacrorhycha,花皮桉(Eucalyptusmaculata),Eucalyptusmarginata,Eucalyptusmegacarpa,Eucalyptusmelliodora,Eucalyptusnicholii,Eucalyptusnitens,Eucalyptusnova-anglica,Eucalyptusobliqua,Eucalyptusobtusiflora,Eucalyptusoreades,Eucalyptuspauciflora,Eucalyptuspolybractea,Eucalyptusregnans,Eucalyptusresinifera,大叶桉(Eucalyptusrobusta),野桉(Eucalyptusrudis),Eucalyptussaligna,Eucalyptussideroxylon,Eucalyptusstuartiana,细叶桉(Eucalyptustereticornis),Eucalyptustorelliana,Eucalyptusurnigera,Eucalyptusurophylla,Eucalyptusviminalis,Eucalyptusviridis,Eucalyptuswandoo,Eucalyptusyoumanni。将基因工程构建物稳定地整合进靶植物基因组的技术在本领域是公知的,包括根瘤土壤杆菌介导的导入,电穿孔,原生质融合,注射进生殖器官,注射进未成熟胚胎,高速发射物导入,诸如此类。技术的选择取决于将要转化的靶植物。例如,双子叶植物和特定的单子叶植物及裸子植物可用土壤杆菌属Ti质粒技术按所述技术进行转化,例如Bevan在核酸研究(NucleicAcidRes.)128711-8721,1984中所述。本发明基因工程构建物导入的靶标包括组织,例如叶组织,弥漫性细胞,原生质,种子,胚胎,分生组织区域;子叶,下胚轴,诸如此类。转化桉树和松树的优选方法是应用花粉的(见,如,Aronen,FinnishForestRes.Papers59553,1996)或易于再生的胚胎组织的biolistic方法。一旦细胞被转化,其基因组中整合了本发明基因工程构建物的细胞通过标记进行筛选,如上边讨论过的卡那霉素抗性标记。转基因细胞而后就可以在适宜的培养基中培养以生长完整植株,应用本领域内公知的技术。对原生质而言,在适宜的渗透条件下其细胞壁可以重新形成。对种子或胚胎来说,则应用适宜的发芽或愈伤组织形成培养基。对外植体,则应用适宜的再生培养基。对多种植物来说再生的方法已经成熟。林业树林再生的综述,见Punstan等,ThorpeTA编植物的体外胚胎发育(TnVitroembryogenesisofplants),当代植物科学和农业生物技术(CurrentPlantScienceandBiotechnologyinAgriculture),20(12)471-540,1995。云杉的特定再生办法Roberts有讨论,“云杉的体细胞胚胎发生”,见RedenbaughK编Synseedapplicationsofsyntheticseedtocropimprovement,CRC出版社Ch.23,pp.427-449,1993。产生的转化植物可经有性或无性繁殖,用本领域公知的方法,以产生转基因植物的子代。如上所述,靶植物细胞中RNA的生产可通过启动子序列的选择,或通过对功能性拷贝数的筛选或多核苷酸整合进靶植物宿主基因组的整合位点来控制。一种靶植物可用本发明的超过一种的基因工程构建物进行转化,由此调节超过一种的类异戊二烯代谢酶的活性,影响超过一种的组织的酶活性,或者影响超过一种的表达时间的酶活性。类似地,组装的基因工程构建物可以包括编码本发明多核苷酸编码的酶的超过一个的开放阅读框架,或编码该酶的基因的超过一个的非编码区域。本发明的多核苷酸也可以和编码类异戊二烯合成中涉及的酶的其他已知序列联合应用。另外,本发明的多核苷酸有一个特殊应用,即用作标记生物尤其是植物的非破坏性标记物。包括本发明多核苷酸的基因工程构建物可以作为异源的,非功能性的,无破坏性的标记物稳定地导入一种生物。其后就可以通过测定材料样品中标记物的存在与否来鉴定该生物的起源或来源。植物以外的生物也可以用本发明多核苷酸进行标记,包括商业上有价值的动物,鱼,细菌和酵母。对标记物的检测可通过应用一系列传统技术而完成,通常要包括核酸探针的应用。应用分枝的寡核苷酸可以有效增加分析探针存在的敏感性,如Horn等在核酸研究(NucleicAcidsRes.)25(23)4842-4849,1997中所述,使得能够进行对样品中少至50DNA分子的检测。下述实施例是以说明的形式而不是以限制的形式提供的。实施例1从辐射松(Pinusradiata)和巨桉(Eucalyptusgrandis)中分离和表征cDNA克隆辐射松(Pinusradiata)和巨桉(Eucalyptusgrandis)cDNA表达文库按如下方法构建和筛选。从植物组织中抽提mRNA用的是Chang等在植物分子生物子报道基因(PlantMolecularBiologyReporter)11113-116,1993中提供的方案,作了一些小的调整。特别地,样品溶解在CPC-RNAXB中(100mMTris-Cl,pH8.0;25mMEDTA;2.0MNaCl;2%CTAB;2%PVP和0.05%亚精胺·3HCl),用氯仿∶异戊醇(按24∶1的比例)抽提。用乙醇沉淀mRNA,总的RNA制备物用Poly(A)QuikmRNA分离试剂盒(Stratagene,LaJolla,CA)进行纯化。用逆转录酶合成的方法从纯化的mRNA构建了一个cDNA表达文库,随后用ZAP表达cDNA合成试剂盒(Stratagene),根据制造商提供的方案,将得到的cDNA克隆插入LambdaZAP。产生的cDNAs用GigapackIIPackagingExtract(Stratagene)包装,从5μl连接混合物中取1μlDNA样品。文库的大量切除用的是XL1-BlueMRF’细胞和XLOLR细胞(Stratagene),以ExAssist辅助噬菌体进行(Stratagene)。切除的噬菌粒用NZY液体培养基(GibcoBRL,Baithersburg,MD)稀释并涂布于含有X-gal和异丙基硫代-β-半乳糖苷(IPTG)的LB-卡那霉素琼脂平板。涂板和挑选用的DNA微量制备的克隆中,大部分含有适于测序的插入。阳性克隆在含有卡那霉素的NZY液体培养基中培养,并用REALDNA微量制备方法纯化cDNA(Qiagen,Venlo,荷兰)。用1%的琼脂糖凝胶对测序模板筛选染色体的污染。染料终止序列的制备用的是Biomek2000机器人(BeckmanCoulterInc.FullertonCA)进行液体处理,DNA的扩增用9700PCR机器(PerkinElmer/AppliedBrosystems,FosterCity,CA)按照制造商的方案进行。应用一种PerkinElmer/AppliedBiosystemsDivisionPrism377测序仪获得阳性克隆的多核苷酸。cDNA克隆开始是从5’端进行测序,有些情况下也可以从3’端进行。对某些克隆,用亚克隆片段获得其内部序列。亚克隆的进行用的是限制性作图的标准程序,亚克隆到pBluescriptIISK+载体及其他标准的测序载体。测定的cDNA序列,包括本发明的多核苷酸,与EMBL数据库中的已知序列进行对比和匹配。特别地,SEQIDNOS1-53确定的多核苷酸用BLASTN程序2.0.4版本〔1998年2月24日〕按下述运行参数与EMBL数据库EMBL截止1998年8月底的多核苷酸进行对比;Unix运行要求blastall-pblastn-dembldb-e10-G0-E0-r1-v30-b30-iqueryseq-0结果。SEQIDNOS78-164确定的多核苷酸用BLASTN程序2.0.6版本〔1998年9月16日〕按下述运行参数与截止1999年5月底的EMBL数据库中的多核苷酸进行对比Unix运行要求blastall-pblastn-dembldb-e10-G0-E0-r1-v30-b30iqueryseq-0结果。冗余序列的多重匹配被用以建立起可靠的同一性序列。基于其他植物种类已知序列的相似性,本发明鉴定为SEQIDNOS1-53和78-164的分离的多核苷酸被鉴定为编码与上述表1中所示的多肽具有相似性的多肽。分离的cDNA序列用计算机程序BLASTN与EMBLDNA数据库中的序列进行了对比。相应的推定多肽序列被确定并用计算机程序BLASTP与SwissProt数据库中的序列进行了对比。SEQIDNOS78-164提供的DNA序列和EMBLDNA数据库中的序列进行了对比(用BLASTN),SEQIDNOS165-304提供的氨基酸序列和SwissProt数据库截止1999年5月的序列进行了对比(用BLASTP)。SEQIDNOS78-164多核苷酸的六读框翻译,也用TBLASTX程序与EMBL数据库中多核苷酸的六读框翻译进行了对比和匹配。BLASTN多核苷酸分析下述SEQIDNOS的cDNA序列1,2,4-6,8-12,15,19,21-23,27-33,35,37-42,44,46-52,78-80,82,83,86,89-92,96-100,104-113,115,117,120,122-130,132-136,138-158,160,163和164,用计算机程序BLASTN按上述方法与EMBL数据库中的序列进行对比,按上述测定方法,与EMBL数据库中的序列的同一性小于40%。SEQIDNOS3,7,14,18,20,25,34,36,53,84,85,87,88,101,114,116,118,119,131,137,159,161和162的cDNA序列,用BLASTN按上述办法测定,与EMBL数据库的序列的同一性小于60%。SEQIDNOS16,17,26,43,45,93,94和121的cDNA序列,用BLASTN按上述办法测定,与EMBL数据库的序列同一性小于75%,SEQIDNOS13,24,95,102和103的cDNA序列,用BLASTN按上述办法测定,与EMBL数据库的序列同一性小于90%。BLASTP氨基酸分析SEQIDNOS194-200,202,216,223,230,235,239,240,243,250,255,259,260,263,270,272,274,278,291,292,293,296,303和304预测的氨基酸序列,用上述的BLASTP计算机程序测定,按上述方法测得与SwissProt数据库中序列的同一性小于50%。SEQIDNOS166,168-177,179,183-188,192,203-205,207,209-213,218,219,221,224,225,227-229,231,232,234,237,242,244,245,251,253,262,267,268,269,273,276,277,279,281,282,284,286,289,290,294,295,297,298,299,300,301和302预测的氨基酸序列,用上述的BLASTP计算机程序测定,按上述方法测得与SwissProt数据库中序列的同一性、于75%。SEQIDNOS165,167,178,182,189-191,193,201,206,208,214,215,217,220,222,226,233,238,241,246-250,254,256,257,258,261,264,265,266,275,280,283,285和288预测的氨基酸序列,用上述的BLASTP计算机程序测定,按上述方法测得与SwissProt数据库中序列的同一性小于90%。SEQIDNOS180,181和271预测的氨基酸序列,用上述的BLASTP计算机程序测定,按上述方法测得与SwissProt数据库中序列的同一性小于95%。TBLASTX分析SEQIDNOS78-164多核苷酸序列的六读框翻译用TBLASTX程序2.0.6版本〔1998年9月16日〕按下述设定的运行参数与EMBL数据库中多核苷酸序列的六读框翻译进行了对比和匹配;Unis运行要求Blastall-pblastn-dembldb-e10-G0-E0-v30-b30-iquerysep-0结果。SEQIDNOS82,83,90,107-113,115,120,122,124-126,129,134-136,142-144,146,149,152,153,155-158和164多核苷酸的翻译物与EMBL数据库中多核苷酸序列的翻译物用计算机程序TBLASTX按上述方法测定,测得的同一性小于50%。SEQIDNOS79,81,84-89,91,92,96-101,103,105,114,116-118,123,131,132,137-141,145,150,154和160-162的多核苷酸翻译物,按上述方法用计算机程序TBLASTX测得与EMBL数据库中多核苷酸翻译物的同一性小于75%。SEQIDNOS78,80,93,95,102,104,106,119,121,127,128,130,133,151,159和163的多核苷酸序列翻译物,按上述方法用计算机程序TBLASTX测得与EMBL数据库中多核苷酸翻译物的同一性小于90%。SEQIDNO94的多核苷酸序列的翻译物,按上述方法用计算机程序TBLASTX测得与EMBL数据库中多核苷酸序列翻译物的同一性小于95%。实施例2用O-甲基转移酶(OMT)基因修饰木质素生物合成用辐射松(Pinusradiata)OMT基因转化烟草植物构建了这样的基因工程构建物包括的有义和反义的多核苷酸含有来自Pinusradiata的O-甲基转移酶(OMT)(SEQIDNO54)的编码区域,用已发表的直接转化法(An等,“双载体”(Binaryvectors),见GelyinSB和SchilperoortRA编,PlantMolecularBiologyManual(植物分子生物学手册),KlumerAcademicPublishersDerdrecht,1988)插入根瘤土壤杆菌。植物转化一般方法的描述见Horsch等,Science2271229-1231,1985。有义DNA构建物的构建首先是将PBK-CMVcDNA插入物克隆进pART7载体。而后将pART7载体用限制性内切酶NatI切开以移除35S-插入物-OCS3’UTR构建物并克隆进植物表达载体pART27(GleaveA,PlantMol.Biol.(植物分子生物学),201203-1207,1992)。转基因构建物存在与否及其完整性用限制性内切酶消化及DNA序列测定来证实。烟草(Nicotianatabacumcv.Samsan)叶切片用有义和反义OMT构建物转化,用的方法来自Horsch等,Science2271229-1231,1985。OMT有义构建物已有5个独立的被转化植物品系被建立,反义构建物已有8个独立的被转化植物品系被建立。含有合适基因构建物的被转化植物用Southern印迹试验进行验证。下述表2中标记以“RNA印迹”栏中的“+”号指示被转化的植物系被证实为独立的转化株系。松(Pinus)OMT在被转化植物中的表达用OMT有义和反义构建物生产的每一种独立的被转化植物品系的总RNA都被分离出来。RNA样品用Northern印迹试验分析以测定转基因在每一种被转化株系中的表达水平。表1标记为“DNA印迹”栏中显示的资料显示含有OMT有义和反义构建物的被转化植物株系相对于Northern印迹的背景物显示出高的表达水平。序号为2的有义植物株系的OMT表达未测,因为RNA样品显示降解的迹象。与来自空载体转化对照植株的RNA样品没有可检测到的杂交。转化植物中OMT酶活性的调节用OMT有义和反义构建物生产的每一种被转化植物品系,由松(Pinus)OMT基因和内源烟草OMT基因编码的OMT酶的总活性均进行了分析。每一种被转化植物的蛋白质粗提物均被制备,用Zhang等在《植物生理》(PlantPhysiol)11365-74,1997中发表的方法进行了分析。表2中标记了“酶”的栏目包含的资料显示含有OMT有义构建物的被转化植物株系通常具有升高了的OMT酶活性,最高达到199%,然则含有OMT反义构建物的被转化植物株系通常具有下降了的OMT酶活性,最低至35%,相对于空载体转化的对照植物。序号为3的有义植物株系的OMT酶活性未被估计。转化植物中PinusOMT对木质素浓度的影响OMT是在木质素生物合成中涉及的一个酶。被转化烟草植物中木质素的浓度用已经很好建立的巯基乙酸抽提的程序来测定(Freudenberg等,木质素的组成和生物合成ConstitutionandBiosynthesisofLignin,Springer-VerlagBerlin,1968)。简言之,整株烟草植物,平均年龄38天,在液氮当中速冻,在研体和研杆中研成细粉。分别从一株空载体转化的对照植物株系,含有OMT有义构建物的5株相互独立的转化植物株系,含有OMT反义构建物的8株相互独立的转化植物株系中均制备100mg冻粉,分别用甲醇抽提,接着用10%的巯基乙酸处理,最终溶解在1MNaOH中。最终抽提物进行280nm处吸光度的分析。表2中标记“TGA”栏中的数据显示,含有有义和反义OMT基因构建物的转化植物株系均显示木质素水平的明显下降,相对于空载体转化的对照植物株系而言。表2植物株系转基因方向DNA印迹RNA印迹酶TGA1对照无+空白1001041OMT有义+2.9E+686552OMT有+无162583OMT有义+4.1E+6无634OMT有义+2.3E+6142665OMT有义+3.6E+5199751OMT反义+1.6E+4189662OMT反义+5.7E+335703OMT反义+8.0E+3105734OMT反义+1.4E+4109745OMT反义+2.5E+487786OMT反义+2.5E+458847OMT反义+2.5E+497928OMT反义+1.1E+415194这些数据明确显示实施例1中获得的分离cDNA和编码多肽确定的多核苷酸,可以装配于DNA构建物并用以转化植物。数据进一步显示含有基因工程构建物的转化植物显示了这些酶的不同表达水平和活性水平,另外,由于受到编码该酶的基因如OMT的有义或反义表达的控制,对酶的代谢的调节,将影响终产物的浓度,如转化植物中木质素的浓度。实施例3应用4-香豆酸(Coumarate)CoA连接酶(4CL)基因修饰木质素的生物合成用辐射松(Pinusradiata)4CL基因转化烟草植物含有来自辐射松(Pinusradiata)4CL(SEQIDNO55)编码区域DNA序列的有义和反义构建物被插入根瘤土壤杆菌LBA4301,用上述实施例2描述的直接转化。转基因构建物存在与否及其整合性用限制酶消化及DNA测序以证实。烟草(Nicotianatabacumcv.Samsun)叶切片按上述方法被转化。4CL的有义构建物有5株相互独立的被转化植物株系被建成,其反义构建物有8株相互独立的被转化植物株系被建成。含有适宜的木质素基因构建物的被转化植物用Southern印迹试验予以验证。表3的“RNA印迹”标记栏中的“+”指示列出的被转化植物株系已证实为相互独立的被转化系。Pinus4CL在被转化植物中的表达用4CL有义和反义构建物生产的每一株被独立转化植物株系的总RNA被分离。RNA样品用Northern印迹试验进行分析以测定每一种被转化植物株系中转基因的表达水平。下面表3中“DNA印迹”标记栏中的资料显示含有4CL有义和反义构建物的被转化植物株系,相对于Northern印迹的背景,均显示高水平的表达。序号为1的反义植物株系中4CL的表达没有测定,因为在试验的时候其RNA尚无法得到。从空载体转化的对照株物中获得的RNA样品,没有可检测的杂交。转化植物中4CL酶活性的调节转化烟草植株中由Pinus4CL基因及由内源烟草4CL基因编码的4CL酶的总活性,包括用4CL有义和反义构建物生产的每一株被转化植物株系,均进行了分析。每一株被转化植株的蛋白质粗提物均被制备和分析,用Zhang等在植物生理学(PlantPhysiol)11365-74,1997中发表的方法。表2“酶”标记的栏中包含的数据显示含有4CL有义构建物的被转化植物株系有提高了的4CL酶活性,最高达258%,含有4CL反义构建物的被转化植物株系有下降了的4CL酶活性,最低至59%,相对于空载体转化的对照植物而言。Pinus4CL对被转化植物中木质素浓度的影响被转化植物材料样品中木质素浓度按实施例2所述进行测定。下述表3中“TGA”标记栏中包含的数据显示,含有有义和反义4CL基因构建物的被转化植物株系,相对于空载体转化的对照植物株系,均显示出木质素水平明显的下降。这些数据证实,从实施例1中获得的分离cDNA鉴定的多核苷酸可装配进DNA构建物中并用以转化植物。包括如此基因工程构建物的被转化植物显示酶表达和活性水平的调节。包括该酶的生物合成途径的代谢也受到影响。表3植物株系转基因方向DNA印迹RNA印迹酶TGA1对照无+空白100922对照无+空白10010414CL有义+2.3E+41696424CL有义+4.5E+42587334CL有义+3.1E+41747744CL有义+1.7E+41648054CL有义+1.6E+41849214CL反义+无597524CL反义+1.0E+4707534CL反义+9.6E+3818044CL反义+1.2E+4908354CL反义+4.7E+31018864CL反义+3.9E+31168974CL反义+1.8E+31259484CL反义+1.7E+410697实施例4用木质素生物合成基因转化烟草含有来自下述编码区域DNA序列的有义或反义构建物香豆酸-3-羟化酶(C3H)(SEQIDNO56),阿魏-5-羟化酶(F5H)(SEQIDNO57),桂皮烯醛基-CoA还原酶(CCR)(SEQIDNO58)和松柏基糖基转移酶(CGT)(SEQIDNO59),这些来自于Eucalyptusgrandis,及苯丙氨酸氨裂解酶(PAL)(SEQIDNOS60和61),肉桂酸酯-4-羟化酶(C4H)(SEQIDNOS62和63),酚氧化酶(PNL)(SEQIDNO64)和虫漆酶(LAC)(SEQIDNO65),这些来自于辐射松(Pinusradiata),按上述的直接转化法插入根瘤土壤杆菌LBA4301。转基因构建物的存在与否与完整性用酶消化和DNA测序来证实。烟草(Nicotianatabacumcv.Samsun)叶切片按实施例2所述的方法被转化。对前述段落中所列的每一种有义构建物和每一种反义构建物,有多至12种相互独立的被转化植物株系被建立。含有适宜木质素基因构建物的被转化植物用Southern印迹试验进行证实。所有被分析的被转化植物株系经证实都是相互独立的被转化株系。这表明携有一个被表达新基因的转基因植物可以被制造出来,整个过程从实施例1中获得的分离cDNA开始。实施例5被转化植物中木质素含量的操纵用Northern印迹试验测定转基因表达实施例4中所述的每一种相互独立的被转化植物株系的总RNA被分离。RNA样品在Northern印迹试验中被分析以测定转基因在每一种被转化株系中的表达水平。表4“DNA印迹”标记的栏显示了所有被分析植物株系转基因的表达水平,相对于Northern印迹的背景。对来自空载体转化的对照植株的RNA样品没有可检测的杂交。转化植物中木质素浓度的测定空载体转化的对照植物株系的木质素浓度,及实施例5中所述的每一种有义构建物和每一种反义构建物的多至12种相互独立的被转化株系的木质素浓度,按实施例3中所述的方法被测定。表4中“TGA”标记栏显示了所有被分析植物株系的巯基乙酸可抽提木质素,作为被转化植物与对照植物相比较TGA可抽提木质素以平均百分比的方式表达出来。变化的范围显示出括号中。表4转基因方向株系序号DNA印迹TGA对照无3空白100(92-104)C3H有义53.7E+474(67-85)F5H有义105.8E+470(63-79)F5H反义95.8E+473(35-93)CCR有义1无74CCR反义2无74(62-86)转基因方向株系序号DNA印迹TGAPAL有义51.9E+577(71-86)PAL反义41.5E+462(37-77)C4H反义105.8E+486(52-113)PNL反义61.2E+488(70-114)LAC有义51.7E+5无LAC反义121.7E+588(73-114)含有有义或反义木质素生物合成基因构建物的被转化植物系均显示出木质素水平相对于空载体转化的对照植物株系的明显的下降。对木质素浓度最大的影响见于F5H反义植株,相对于对照植物其木质素的量只有35%,在PLA反义植株中相对于对照株物其木质素的量只有37%。这些数据明确指示多核苷酸的浓度,例如木质素,按TGA分析测定的,用传统的反义方法学可以直接操纵,也可以应用本发明的木质素生物合成基因通过有义过表达来直接操纵,整个过程从实施例1获得分离的cDNA开始。实施例6被转化植物中木质素酶活性的调节被选择的木质素生物合成酶的活性和底物特异性用粗提物进行了分析,粗提物来自含有下述有义和反义构建物的转化烟草植物来自辐射松(Pinusradiata)的PAL(SEQIDNO60),PNL(SEQIDNO64)和LAC(SEQIDNO65),及来自巨桉的CGT(SEQIDNO59)。酶分析的进行按已发表的方法PAL(SouthertonSG和DeverallBJ,PlantPath.39223-230,1990);CGT(Vellekoop等,FEBSLett,33036-40,1993);PNL(Espin等,Phytochemistry4417-22,1997);及LAC(Bao等,Seience260672-674,1993)。表5中“酶”标记栏的数据显示来自对所有被分析植物株系重复测量所获得的平均酶活性,以空载体转化对照植物酶活性百分比的形式表达出来。括号中显示变化的幅度。表5转基因方向株系序号酶对无3100PAL有义587(60-124)PAL反义353(38-80)CGT反义189PNL反义6144(41-279)LAC有义578(16-240)LAC反义1164(14-106)所有被转化植物株系,不包括PNL反义的植物株系,显示的平均酶活性与空载体转化的对照植物中观察到的酶活性相比明显下降。对木质素酶活性最大的影响见于PAL反义转化植物株系,其中所有株系显示下降了的PAL活性,在LAC反义转化的植物株系中,显示出相对于空白载体转化对照植物系14%这样低的LAC活性。这些结果表明,可以通过以编码感兴趣的酶的多核苷酸转化植物来调节酶活性,整个过程自如实施例1所述从cDNA分离编码感兴趣酶的多核苷酸开始。实施例7木质素生物合成基因的功能鉴定含有下列编码区域DNA序列的有义构建物被插入商业上可获得的蛋白质表达载体pProEX-HT(GibcoBRL)中PAL(SEQIDNO61),OMT(SEQIDNO54),4CL(SEQIDNOS55和66)及POX(SEQIDNO67),以上来自Pinusradiata,及OMT(SEQIDNOS68和69),CCR(SEQIDNOS70-72),CGT(SEQIDNOS59和73)和POX(SEQIDNOS74和75),以上来自巨桉。产生的构建物被转化进大肠杆菌XL1-Blue(Stratagene),而后通过添加IPTG诱导以产生重组蛋白。用Ni柱层析(Janknecht等,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)888972-8976,1991)获得PinusOMT和4CL构建物及EucalyptusOMT和POX构建物的纯化蛋白质。对每一种纯化蛋白质的酶分析确定性地证明了被检测基因预期的底物特异性和酶活性。两个代表性酶分析试验的数据,表明对辐射松(Pinusradiata)4CL基因(SEQIDNO55)和辐射松(Pinusradiata)OMT基因(SEQIDNO54)酶活性的证实,显示在下列表6中。对4CL酶而言,一个单位等于每分钟按0.1吸收单位的速率将底物转化成产物所需要的蛋白质的数量。对OMT酶而言,一个单位等于每分钟将1pmole底物转化成产物所需要的蛋白质的数量。表6转基因纯化抽提物蛋白质活性总活性产量纯化倍步骤总ml数总mg数单位数%数4CL粗制的10ml51mg42001001Ni柱4ml0.84mg36808853OMT粗制的10ml74mg46001001Ni柱4ml1.2mg44879860表6中数据表明纯化的4CL酶和纯化的OMT酶在酶分析试验中均显示高的活性,证实了对4CL和OMT基因的鉴定。空载体转化的大肠杆菌的蛋白质粗提物在4CL或OMT酶分析中均不显示活性。这表明仅有一种假定功能的分离的新cDNA的功能可以被证实,整个过程从如实施例1所述获得分离的cDNA开始。实施例8植物中单一序列标识物存在与否的证明转基因烟草植物用烟草中没有的单一标识物序列生产出来。插入的单一标识物序列是从辐射松(Pinusradiata),SEQIDNO76,和巨桉,SEQIDNO77中分离出来。单一标识物序列用直接转化法插入根瘤土壤杆菌LBA4301(C.Kado博士,加利福尼亚大学,Davis,CA,作为礼物提供的),用的是已发表的方法(An等,“双载体”,见GelvinSB和SchilperootrRA编,植物分子生物学手册(PlantMolecularBiologyManual),KluwerAcademicPublshersDordrecht,1988)。土壤杆菌属转基因构建物中单一标识序列的存在和完整性经限制酶消化和DNA测序来证实。烟草(Nicotianatabacumcv.Samsun)叶切片被转化,所用方法见Horsch等,Science2271229-1231,1985。对所用的每一种单一序列标识物,均建立起三株相互独立的被转化植物株系。用一种缺少单一序列标识物的空的基因转移载体建立起两株空载体对照植物株系。序列标识物独特性的分析用的是Southern印迹分析以检测序列标识物在植物基因组中的存在。如果序列标识物是单一的因此可用作标记物,那么该序列标识物在未经标记的植物中应该明确地缺失,而在经过标记的植物中应该确切地存在。在本实施例中,在空载体转化的对照植物中可期望单一标识物的缺失。而在用单一序列标识物转化的转基因植物中可期望单一标识物的存在。基因组DNA从空载体转化的对照植物和用单一序列标识物转化的植物中被制备,所用的十六烷基三甲基溴化铵(CTAB)抽提法见MurrayMG和ThompsonWF,核酸研究(NucleicAcidsRes.)84321-4325,1980。DNA样品的消化,在松(Pinus)单一序列标识物(SEQIDNO76)转化的植物情况下用的是限制性内切酶EcoRI,在桉(Eucalyptus)单一序列标识物(SEQIDNO77)转化的植物情况下用的是限制性内切酶XbaI。限制酶消化产生的DNA片段用1%琼脂糖凝胶进行拆分;图2的左侧一组和右侧一组照片分别显示来自松(Pinus)和桉(Eucalyptus)试验的DNA样品的DNA片段模式。琼脂糖凝胶电泳步骤之后,DNA样品被转移到Hybond-N+尼龙膜上(AmershamLifeScience,Littlechalfont,Buckinghamshire,England),用的方法为Southern所建立,见分子生物学杂志(J.Mol.Biol.)98503-517,1975。尼龙膜用检测上述鉴定的单一序列标识物的放射活性标记的探针进行检测,并在严格性很高的条件下进行洗涤(最终洗涤条件0.5×柠檬酸钠盐缓冲液(SSC)加0.1%十二烷[基]硫酸钠(SDS),65℃15分钟)。探针与基因组DNA样品中互补序列的杂交用放射自显影进行了检测。结果显示于图3和4。图3(对应于图2的左侧一组照片)显示用来源于Pinus序列标识物(SEQIDNO76)的探针在Southern印迹分析中检测到的杂交模式。A-B道含有来自空载体转化的对照植物的DNA样品,C-E道含有来自SEQIDNO76转化植物的DNA。A-B道中没有杂交表明SEQIDNO76在空载体转化的烟草植物中不存在;也即,SEQIDNO76是适合对烟草植物进行明确标记的单一标记物。C-E道中有强烈的杂交,显示通过转化接受SEQIDNO76的植物被SEQIDNO76中含有的单一序列清楚明确地进行了标记。图4(对应于图2的右侧一组照片)显示用来源于Eucalyptus的序列标识物(SEQIDNO77)的探针在Southern印迹分析中检测到的杂交模式。A-B道含有来自空载体转化的对照植物的DNA样品,C-E道含有来自SEQIDNO77转化植物的DNA。A-B道中没有杂交表明SEQIDNO77在空载体转化的烟草植物中不存在;也即,SEQIDNO77是适合对烟草植物进行明确标化的单一标记物。C-E道中有强烈的杂交,显示通过转化接受SEQIDNO77的植物被SEQIDNO77中含有的单一序列清楚明确地进行了标记。数据清楚地表明了此说明书中公开的用作明确标记转基因材料之目的的序列的用途。从数目巨大的可能标记物中选出一个单一序列,并证明在待标记生物的基因组中缺失。标记物被插入待标记生物的基因组,已经很好建立的DNA检测方法被用来明确地检测用作标记物的单一序列标识物。由于实施例中应用了序列特异性检测方法,本说明书所公开的发明的使用者,既有很高的可能性以从已公开的序列表中找到一个序列标识物,其将在标记任何给定生物中有用,又将得到一种并非摸棱两可的方法,以表明一个被标记生物仅能通过向待标记生物的基因组精确地加入该单一序列才能获得给定的标记物。如果本发明的使用者将给定生物中使用的标记物的精确序列作为秘密予以保持,那么应用本实施例中表明的标记物检测技术,可以清楚明确地解决有关该生物起源和历史的任何争论。SEQIDNO1-304在所附的序列表中给出。所附的序列表中所用的核苷酸序列的代码,包括符号“n”,与WIPO标准ST.25(1998),附录2,表1相一致。此处所引述的所有文献,包括专利文献和非专利出版物,此处将它们整体作为参考文献包括在内。尽管在前述的说明书中,针对一些优选实施方案描述了本发明,许多细节为了说明的目的也已经阐明,对本领域内技术人员显而易见的是,从本发明容易获得其他的实施方案,此外描述的特定细节可进行相当大的变动却不脱离本发明的基本原则。权利要求1.一种分离的多核苷酸,包括选自如下组的多核苷酸序列(1)SEQIDNOS1-53和78-164描述的序列;(2)SEQIDNOS1-53和78-164描述的序列的互补物;(3)SEQIDNOS1-53和78-164描述的序列的反向互补物;(4)SEQIDNOS1-53和78-164描述的序列的反向序列;(5)序列,包括的多核苷酸序列与对比序列有至少40%的同一性,对比序列选自SEQIDNOS1,2,4-6,8-12,19,21-23,28-33,35,37-42,44,46-52,78-80,82,83,86,89-92,96-100,104-113,115,117,120,122-130,132-136,138-158,160,163和164列举的多核苷酸序列,同一性百分比的测定通过应用BLASTN程序2.04版本按此处所述的参数值进行设定,将该序列与对比序列进行匹配,确定该序列与对比序列在匹配部分相同核苷酸的数目,将相同核苷酸的数目除以对比序列核苷酸的总数,再乘以100以测定同一性百分比;(6)序列,包括的多核苷酸序列与对比序列有至少60%的同一性,对比序列选自SEQIDNOS3,7,14,18,20,25,34,36,53,84,85,87,88,101,114,116,118,119,131,137,159,161和162列举的多核苷酸序列,同一性百分比按以上(5)中所述进行测定;(7)序列,包括的多核苷酸序列与对比序列有至少75%的同一性,对比序列选自SEQIDNOS16,17,26,43,45,93,94和121列举的多核苷酸序列,同一性百分比按以上(5)中所述进行测定;(8)序列,包括的多核苷酸序列与对比序列有至少90%的同一性,对比序列选自SEQIDNOS13,24,95,102和103描述的核苷酸序列,同一性百分比按以上(5)中所述进行测定;(9)序列,包括的多核苷酸序列在严格的杂交条件下和包括了上面(1)-(8)描述的序列的多核苷酸杂交;(10)序列,包括的多核苷酸序列是上面(1)-(8)描述的序列的100-链节;(11)序列,包括的多核苷酸序列是上面(1)-(8)描述的序列的40-链节;及(12)序列,包括的多核苷酸序列是上面(1)-(8)描述的序列的20-链节;和(13)序列,包括的多核苷酸序列与上面(1)-(12)描述的序列的差异仅在1或多个保守替换。2.一种分离的寡核苷酸探针或引物,包括与权利要求1中核苷酸序列的10个连续残基互补的至少10个连续的残基。3.一种基因工程构建物,包括权利要求1所述的多核苷酸。4.一种转基因细胞,包括权利要求3的基因工程构建物。5.根据权利要求4的转基因细胞,其中的细胞选自一种细菌细胞;一种昆虫细胞;一种酵母细胞;一种哺乳动物细胞;和一种植物细胞。6.一种基因工程构建物,按5’-3’方向包括(a)一种基因启动子序列;(b)一种多核苷酸序列,包括下述中至少一种(1)一种多核苷酸,包括权利要求1的一种核苷酸序列,编码至少一个在类异戊二烯生物合成途径中有活性酶的有功能的部分;及(2)一种多核苷酸,包括权利要求1的一种核苷酸序列,包含编码在类异戊二烯生物合成途经中有活性酶的多核苷酸的一个非编码区域;及(c)一个基因终止序列。7.权利要求6中的构建物,其中的多核苷酸为有义方向。8.权利要求6中的构建物,其中的多核苷酸为反义方向。9.权利要求6的构建物,其中的基因启动子序列和基因终止序列在植物宿主中有功能。10.包括权利要求6中一种构建物的一种转基因细胞。11.权利要求10的转基因细胞,其中的多核苷酸是有义方向。12.权利要求10的转基因植物细胞,其中的多核苷酸是反义方向。13.根据权利要求10的转基因细胞,其中的细胞选自一种细菌细胞;一种昆虫细胞;一种酵母细胞;一种哺乳动物细胞;及一种植物细胞。14.一种植物,包括根据权利要求9的一种转基因细胞,或其果实或其种子或其后代。15.权利要求14的植物,其中的植物是木本植物。16.权利要求15的植物,其中的植物选自桉树或松树物种。17.一种用以对在一种生物类异戊二烯生物合成途径中涉及的一种酶的含量,组成和代谢的一或多项进行调节的方法,该方法包括将权利要求3的一种构建物稳定插入该生物的基因组中。18.权利要求17的方法,其中的生物是一种植物。19.一种用以对生物中类异戊二烯化合物的含量、组成和代谢的一或多项进行调节的方法,包括将权利要求6的构建物稳定地整合进该生物的基因组。20.根据权利要求19的方法,其中的生物是一种植物。21.一种用于产生具有改变了的类异戊二烯含量,改变了的类异戊二烯组成和改变了的类异代谢二烯代谢的其中一项或多项的一种生物的方法,包括(a)用权利要求3的一种构建物转化一种宿主细胞以提供一种转基因宿主细胞;和(b)在有助于生长和繁殖的条件下培养该转基因宿主细胞。22.根据权利要求21的方法,其中的生物是一种植物,并且宿主细胞是一种植物细胞。23.一种分离的由权利要求1的一种多核苷酸编码的多肽。24.权利要求23的多肽,在植物的类异戊二烯生物合成途径中具有酶活性。25.一种分离的多肽,包括的氨基酸序列由一种多核苷酸表达,该多核苷酸在严格的杂交条件下与SEQIDNOS1-53和78-164提出一种核苷酸序列杂交。26.一种分离的多肽,包括选自如下的多肽序列(1)SEQIDNOS165-286和288-304列出的序列;(2)序列,包括的多肽序列与对比序列至少有50%的同一性,对比序列选自SEQIDNOS194-200,202,216,223,230,235,239,240,243,250,255,259,260,263,270,272,274,278,291,292,293,296,303和304列举的多肽序列;(3)序列,包括的多肽序列与对比序列至少有75%的同一性,对比序列选自SEQIDNOS166,168-177,179,183-188,192,203-205,207,209-213,218,219,221,224,225,227-229,231,232,234,237,242,244,245,251,253,262,267,268,269,273,276,277,279,281,282,284,286,289,290,294,295和297-302所列举的多肽序列;(4)序列,包括的多肽序列与对比序列至少有90%的同一性,对比序列选自SEQIDNOS165,167,178,182,189-191,193,201,206,208,214,215,217,220,222,226,233,238,241,246-250,254,256-258,261,264,265,266,275,280,283,285和288所列举的多肽序列;(5)序列,包括的多肽序列与对比序列至少有95%的同一性,对比序列选自SEQIDNOS180,181和271所列举的多肽序列;(6)序列,包括的多肽序列为上述(1)-(5)所描述的序列的至少有100个残基的100-链节;(7)序列,包括的多肽序列为上述(1)-(5)所描述的序列的至少有40个残基的40-链节;及(8)序列,包括的多肽序列为上述(1)-(5)所描述的序列的20-链节。27.一种用于调节一种生物中类异戊二烯化合物的含量,组成和代谢的一项或多项的方法,包括将权利要求26的一种分离多肽施予该生物。28.根据权利要求27的方法,其中的生物是一种植物,且分离多肽的施予是局部的。29.根据权利要求27的方法,其中的生物是一种哺乳动物,且分离多肽的施予是全身的。全文摘要提供了新的分离的与植物类异戊二烯生物合成途径有关的多核苷酸,以及包含此序列的基因工程构建物。调节靶生物类异戊二烯生物合成途径中涉及的多肽的含量、结构和代谢的方法亦予公开,该方法包括将本发明的一或多种多核苷酸或基因工程构建物整合进靶生物的基因组。对这些多核苷酸的含量、结构和代谢的调节导致靶生物中类异戊二烯含量、结构和代谢的改变。文档编号C12N9/00GK1334866SQ99816247公开日2002年2月6日申请日期1999年12月16日优先权日1998年12月17日发明者I·J·哈武卡拉申请人:吉尼西斯研究及发展有限公司,弗莱彻·查仁茨·福雷斯特斯有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1