植物环丙烷脂肪酸合酶基因、蛋白质及其用途的制作方法

文档序号:412758阅读:1004来源:国知局
专利名称:植物环丙烷脂肪酸合酶基因、蛋白质及其用途的制作方法
技术领域
本发明涉及分离的环丙烷脂肪酸合酶基因和多肽。本发明也提供使用环丙烷脂肪酸合酶基因、多肽和合酶产物的方法。
背景技术
植物油不仅用于食品工业,而且越来越多地用于化学工业。任何具体的油的应用均依赖于该油的化学和物理化学性质,这取决于成分脂肪酸的组成。为了满足工业要求,通常修饰植物油。植物油的这种修饰一般通过化学方法实现(分级分离、酯交换、氢化或其它化学衍化),但是越来越多地使用遗传方法产生新型的油类原料。
特别重要的一类是含有三碳碳环的脂肪酸类别,包括环丙烷脂肪酸(CPA-FAs)和环丙烯脂肪酸(CPE-FAs)。环丙烯环使得这些脂肪酸和油具有两个独特的性质。首先,氢化作用产生大量的甲基分支的脂肪酸。这将导致相当于不饱和脂肪酸及其酯的低温特性,没有双键的易氧化性,因此可以用于润滑及相关领域(Kai,Y.(1982)J.Am.Oil Chem.Soc.59300-305)。另外,甲基分支的脂肪酸也可以被视为产生二聚酸中形成的异硬脂酸的替代物,异硬脂酸是油化学工业的一种商品,用作化妆品和润滑剂添加剂。其次,环丙烯环高度拉紧,在与亲电子试剂的放热反应中该环容易打开。含有高水平环丙烯脂肪酸的油,如臭苹婆(Sterculia foetida)油,在升高的温度下自聚合。这种特性特别适用于包衣和聚合物的生产。在臭苹婆油中,苹婆酸与乙酸反应,产生多种乙酰酯,以及与短链或中链饱和脂肪酸反应,产生单不饱和交酯(estolide)产物(Kircher(1964)J.Org Chem.291979-1982);所有这些产物都能被进一步氢化、皂化或水解,形成羟基脂肪酸。油与二价羧酸反应产生聚合物。另外,苹婆酸也可以在脂肪酸皂性制剂中用作杀生物剂。
另一方面,CPE-FAs被认为是食用油中的一种抗营养因子。含有CPE-FAs的许多种子脂类被人类大量消费,特别是在热带地区(Ralaimanarivo等人(1982)Lipids 17(1)1-10)。已经证实,饮食中的CPE-FAs在动物中导致硬脂的积累和其它生理紊乱(Phelps等人(1965)Poultry Science 44358-394;Page等人(1997)ComparativeBiochemistry And Physiology B-Biochemistry & Molecular Biology118(1)79-84)。CPE-FAs是动物中多种去饱和酶的强抑制剂(Cao等人(1993)Biochimica et Biophysica Acta 1210(1)27-34;Fabrias等人(1996)Journal of Lipid Research 37(7)1503-1509;Fogerty等人(1972)Lipids 7(5)335-338),可能是至少某些疾病的病因。由于这些健康上的担心,含有CPE-FAs的植物油在消费前必须高温处理或者氢化。这些处理增加了油料加工的成本,也导致存在一定比例的氢化产生的反式脂肪酸;这些反式脂肪酸的存在也是不希望的。因此,希望获得CPE-FAs水平大大降低的植物油,因为这些油的可用性将显著降低加工成本,减少不希望的氢化脂肪酸的存在,提高油在食品消费中的价值。除去CPE-FAs也将提高未加工的种子或种子粉(如棉籽)作为动物饲料的价值。
当前,富含CPE-FAs的油还没有商业来源。可以认为,植物CPE-FAs由CPA-FAs通过去饱和作用合成。大肠杆菌和其它细菌能够合成含有环丙烷环的脂肪酸。该反应由环丙烷脂肪酸合酶(也被称为环丙烷合酶或不饱和磷脂甲基转移酶;E.C.2.1.1.16)催化,包括对磷脂十六烷酰基或十八烷酰基双键的来自S-腺苷甲硫氨酸的亚甲基的加成。CPA-FAs(CFAs),如二氢苹婆酸(DHS)的特征在于一个饱和的三碳环,如下列结构所示,其中对于游离脂肪酸而言X=OH,或者对于酯是一个醇基。
环丙烷脂肪酸合酶基因已经在大肠杆菌中克隆并测序(Grogan等人(1997)J.Bacteriol.158286-295,Wang等人(1992)Biochemistry3111020-11028)。细菌中未报告有CPE-FAs。
CPA-FAs(CPA-FA)和CPE-FAs(CPE-FA)在高等植物中并非广泛分布,但是发现它们存在于有限的科的种子油中,包括锦葵科(Malvaceae)、梧桐科(Sterculiaceae)、木棉科(Bombaceae)、Tilaceae、含羞草科(Mimosaceae)和无患子科(Sapindaceae)(Smith(1970)《脂肪和其它脂类化学的进展》(Progress in the Chemistry of Fats and OtherLipids)(Pergamon PressNew York)第11卷,139-177页;Christie(1970)《脂类化学主题》(Topics in Lipid Chemistry)(GunstoneFD编著;Logos PressLondon)第一卷,1-49页;Badami和Patil(1981)Prog.Lipid Res.19119-153)。CPA-FAs和CPE-FAs不限于种子中。Kuiper和Stuiver((1972)Plant Physiol.49307-309)描述了初春植物叶子的不同极性脂类中的长链CPA-FAs。Yano等人((1972)Lipids 730-34)和Schmid和Patterson((1988)Phytochem.272831-2834)报告,CPA-FAs和CPE-FAs在锦葵科植物的根、叶、茎和愈伤组织中发现。
在少数植物种中,CPA-FAs能够达到高水平,换句话说,在荔枝(Litchi chinensis)中可达40%(Vickery等人(1980)J.Am.Oil Chem.Soc.5787-91;和Gaydou等人(1993)J.Ag.Food Chem.41886-890)。然而,尤其是在锦葵目(Maivales)中,发现CPE-FAs是很普通的(例如,Bohannon和Kleiman(1978)Lipids 13270-273报告),Yano等人((1972)Lipids 735-45)假定了一种CPE-FAs通过CPA-FAs的生物合成途径。因此,在植物中,CPE-FAs主要以苹婆酸和锦葵酸的形式存在,锦葵酸是苹婆酸的一碳同系物,是通过-氧化在羧基端缩短链获得的。CPE-FAs通常伴随有少量的相应的CPA-FAs、二氢苹婆酸和二氢锦葵酸。然而,还没有证实鉴定和分离的编码能够合成CPA-FAs的蛋白质的植物基因。而且,含有高水平环丙烯的植物还没有商业培育。
因此,希望能够生产含有高含量环丙烷和CPE-FAs的植物油。一种方法是鉴定和分离能够合成CPA-FAs的植物基因。然后用这种基因转化油料作物。这种基因的鉴定也能够用来通过基因沉默技术降低CPE-FAs的水平。
发明概述本发明涉及含有环丙烷脂肪酸合酶(″CPA-FAS″)基因和多肽的组合物。本发明不限于任何具体的核酸或氨基酸序列。本发明也提供使用CPA-FAS基因和多肽的方法。
因此,在一些实施方案中,本发明提供含有一种分离的核酸序列的组合物,该序列编码一种植物CPA-FAS或其部分。在有些实施方案中,该植物来自锦葵目;在其它一些实施方案中,该植物是一种苹婆属植物或棉花植物。在有些具体实施方案中,该核酸序列编码苹婆CPA-FAS或其部分;在其它一些具体实施方案中,该苹婆是臭苹婆,在另外一些具体实施方案中,分离的核酸序列含有SEQ ID NO1。在其它具体实施方案中,该核酸序列编码棉花CPA-FAS或其部分;在其它具体实施方案中,该棉花是树棉(Gossypium arboreum),在其它具体实施方案中,分离的核酸序列至少含有SEQ ID NOs3、4、5或6之一。在其它实施方案中,本发明提供一种分离的核酸序列,其含有一种植物环丙烷脂肪酸合酶基因。在其它实施方案中,本发明提供含有一种分离的核酸序列的组合物,该序列含有编码一种植物环丙烷脂肪酸合酶的氨基端的核酸序列;在有些具体实施方案中,一种植物环丙烷脂肪酸合酶的氨基端含有一种植物环丙烷脂肪酸合酶的约前420-470个氨基酸;在其它具体实施方案中,一种植物环丙烷脂肪酸合酶的氨基端含有SEQ ID NO2的大约前440个氨基酸或SEQ IDNO7的氨基酸序列;在其它具体实施方案中,该编码序列含有SEQ IDNO1的大约前1410个核苷酸或者含有SEQ ID NO3。在其它实施方案中,本发明提供含有一种分离的核酸序列的组合物,该序列含有编码与一种植物环丙烷脂肪酸合酶氨基端同源的氨基酸序列的核酸序列;在有些具体实施方案中,一种植物环丙烷脂肪酸合酶的氨基端含有一种植物环丙烷脂肪酸合酶的前面约420-约470个氨基酸;在其它具体实施方案中,一种植物环丙烷脂肪酸合酶的氨基端含有SEQ IDNO2的大约前440个氨基酸或SEQ ID NO7的氨基酸序列。
本发明不限于编码植物CPA-FAS的核酸序列;实际上,预期本发明包括编码一种植物CPA-FAS的同源物、变体和部分或片段的分离的核酸序列。因此,在有些实施方案中,本发明提供含有一种分离的核酸序列的组合物,该序列在低到高严格条件下可与含有SEQ IDNOs1、3、4、5或6的核酸序列杂交。在一些具体实施方案中,分离的核酸在高严格条件下可与含有SEQ ID NOs1、3、4、5或6的核酸序列杂交。在其它实施方案中,杂交的序列编码一种多肽,该多肽催化对不饱和脂肪酸不饱和中心的亚甲基加成。在其它实施方案中,分离的核酸序列在低到高严格条件下可与含有SEQ ID NO1的大约前1410个核苷酸或含有SEQ ID NO3的核酸序列杂交。在一些具体实施方案中,分离的核酸在高严格条件下可与含有SEQ ID NO1的大约前1410个核苷酸或含有SEQ ID NO3的核酸序列杂交。在其它实施方案中,杂交的序列编码一种多肽,该多肽催化对不饱和脂肪酸不饱和中心的亚甲基加成。
在其它实施方案中,本发明提供含有一种分离的核酸序列的组合物,该序列编码一种植物CPA-FAS,其中该合酶与含有SEQ ID NOs1或至少SEQ ID NOs3、4、5或6之一的核酸序列编码的蛋白质竞争结合不饱和脂肪酸底物;在其它实施方案中,本发明提供含有一种分离的核酸序列的组合物,该序列编码一种植物CPA-FAS,其中该合酶与含有氨基酸序列SEQ ID NOs2或至少SEQ ID NOs7、8、9或10之一的蛋白质竞争结合不饱和脂肪酸底物。
在其它实施方案中,本发明提供含有一种反义序列的组合物,该序列对应于如上所述编码一种植物CPA-FAS的任何核酸序列。在其它实施方案中,本发明提供含有靶向于上述任何一种植物CPA-FAS编码序列的核酶和发夹环的组合物;在其它实施方案中,本发明提供含有一种核酸序列的组合物,该序列编码靶向于上述任何一种植物CPA-FAS编码序列的核酶和发夹环。在其它实施方案中,本发明提供含有siRNAs的组合物,该siRNA靶向于由编码如上所述植物环丙烷脂肪酸合酶的任何一种核酸序列转录的mRNA的序列;在其它实施方案中,本发明提供含有编码一种siRNA的核酸序列的组合物,该siRNA靶向于由编码如上所述植物环丙烷脂肪酸合酶的任何一种核酸序列转录的mRNA的序列。
在本发明的一些实施方案中,上述核酸序列与一个异源启动子有效连接。在其它实施方案中,与异源启动子有效连接的上述序列包含于一种载体内。
在其它实施方案中,本发明提供含有一种纯化多肽的组合物,该多肽由上述任何一种核酸序列编码,当该序列转录并翻译时,导致一种多肽的表达;在有些实施方案中,该多肽从一种重组生物中纯化,这种生物用上述任何一种核酸序列转化,当该序列转录并翻译时,导致一种多肽的表达。在其它实施方案中,本发明提供含有纯化的植物CPA-FAS或其部分的组合物。在有些实施方案中,植物CPA-FAS从锦葵目的植物中纯化;在其它实施方案中,植物CPA-FAS从苹婆中纯化;在其它实施方案中,CPA-FAS从臭苹婆中纯化;在其它实施方案中,植物CPA-FAS含有氨基酸序列SEQ ID NO2。在其它实施方案中,植物CPA-FAS从棉花中纯化;在其它实施方案中,植物CPA-FAS至少含有氨基酸SEQ ID NOs7、8、9或10之一。
在另外的实施方案中,本发明提供用上述任何一种核酸序列转化的生物。在其它实施方案中,本发明提供用编码植物CPA-FAS或其部分的异源基因转化的生物;在有些实施方案中,该基因来自一种锦葵目植物;在其它实施方案中,该基因是一种苹婆基因;在其它实施方案中,该基因是一种臭苹婆基因;在其它实施方案中,该基因编码SEQ ID NO2。在其它实施方案中,该基因是一种棉花基因;在其它具体实施方案中,该基因编码至少含有氨基酸SEQ ID NOs7、8、9或10之一的CPA-FAS。
在其它实施方案中,本发明提供用编码植物CPA-FAS的第一种异源基因和编码脂肪酸去饱和酶的第二种异源基因共转化的生物。在其它实施方案中,本发明提供用一种异源基因共转化的生物,该基因编码含有植物CPA-FAS和脂肪酸去饱和酶的融合蛋白。
在本发明的其它实施方案中,如上所述的转化生物是一种植物或微生物。在一个优选实施方案中,该生物是一种植物。在其它实施方案中,植物细胞用上述任何一种核酸序列转化。在其它实施方案中,植物种子用上述任何一种核酸序列转化。在其它实施方案中,本发明提供来自如上所述转化的植物的油。在其它实施方案中,如上所述转化的生物是一种细菌;在其它实施方案中,本发明提供来自这样转化的细菌的油。
在其它实施方案中,本发明提供在植物中表达植物环丙烷脂肪酸合酶的方法,包括提供一种载体和植物组织,其中该载体含有编码植物CPA-FAS或其部分的上述任何一种核酸序列;在使得合酶表达的条件下,用该载体转染该植物组织。在其它实施方案中,本发明提供减少植物中CPA-FAS表达的方法,包括提供一种载体和植物组织,其中该载体含有编码一种反义序列的核酸序列,该反义序列对应于编码植物CPA-FAS或其部分的上述任何一种核酸序列;在使得该反义序列表达且CPA-FAS表达减少的条件下,用该载体转染该植物组织。在其它实施方案中,本发明提供减少植物中CPA-FAS表达的方法,包括提供一种载体和植物组织,其中该载体编码靶向于编码植物CPA-FAS或其部分的上述任何一种核酸序列的siRNA;在使得该siRNA表达且CPA-FAS表达减少的条件下,用该载体转染该植物组织。
在其它实施方案中,本发明提供生产植物CPA-FAS的一种变体的方法,包括提供编码植物CPA-FAS的核酸序列,诱变该核酸序列,以产生一种变体;在其它实施方案中,该方法还包括根据活性筛选变体。在有些实施方案中,该变体是具有CPA-FAS活性的CPA-FAS的片段。在其它实施方案中,该变体是一种突变的CPA-FAS,与未突变的CPA-FAS相比,它具有改变的CPA-FAS活性。
在其它实施方案中,本发明提供在体外生产含有三碳碳环的脂肪酸(如脂肪环丙烷脂肪酸)的方法,包括提供一种纯化的植物CPA-FAS和该酶的至少一种脂肪酸底物,在致使产生含三碳碳环的脂肪酸(如环丙烷脂肪酸)的条件下,该合酶与该底物温育。在具体实施方案中,植物CPA-FAS的底物是一种不饱和脂肪酸,具有可变的链长,不含或者含有一个或多个另外的功能基团,包括乙炔键、共轭乙炔键和乙烯键、丙二烯基、环戊烯和呋喃环,或环氧基、羟基和酮基,其中该底物是游离脂肪酸或掺入较大分子中的脂肪酸;在其它具体实施方案中,该底物是油酸或棕榈油酸。
在其它实施方案中,本发明提供在体外生产含有三碳碳环的脂肪酸(如环丙烷脂肪酸)的方法,包括提供一种编码植物CPA-FAS的分离的核酸序列和该酶的至少一种脂肪酸底物;在导致该序列表达且产生环丙烷脂肪酸的条件下,该序列与该底物在一种转录/翻译系统中温育。在具体实施方案中,植物CPA-FAS的底物选自如上所述。
在其它实施方案中,本发明提供在体外生产含有三碳碳环的脂肪酸(如环丙烷脂肪酸)的方法,包括提供一种纯化的植物CPA-FAS、一种纯化的脂肪酸去饱和酶和该去饱和酶的至少一种脂肪酸底物;在致使产生含三碳碳环的脂肪酸(如环丙烷脂肪酸)的条件下,CPA-FAS和去饱和酶与该底物温育。在优选实施方案中,去饱和酶的脂肪酸底物是能够添加另外一个双键的任何一种脂肪酸,该双键可以是CPA-FAS加成亚甲基的位点。
在另外的实施方案中,本发明提供通过发酵生产含有三碳碳环的脂肪酸(如环丙烷脂肪酸)的方法,包括提供用编码植物CPA-FAS的异源基因转化的一种微生物和植物CPA-FAS的至少一种底物;在致使产生含三碳碳环的脂肪酸(如环丙烷脂肪酸)的条件下,该微生物与该底物温育。在具体实施方案中,CPA-FAS的脂肪酸底物选自如上所述。
在其它实施方案中,本发明提供通过发酵生产含有三碳碳环的脂肪酸(如环丙烷脂肪酸)的方法,包括提供一种微生物和去饱和酶的至少一种底物,该微生物用编码植物CPA-FAS的第一种异源基因和编码脂肪酸去饱和酶的第二种异源基因共转化;在致使产生含三碳碳环的脂肪酸(如环丙烷脂肪酸)的条件下,该微生物与该底物温育。在优选实施方案中,去饱和酶的脂肪酸底物选自如上所述。
在另外的实施方案中,本发明提供通过发酵生产含有三碳碳环的脂肪酸(如环丙烷脂肪酸)的方法,包括提供一种微生物和去饱和酶的至少一种底物,该微生物用编码含有植物CPA-FAS和脂肪酸去饱和酶的融合多肽的异源基因转化;在致使产生含三碳碳环的脂肪酸(如环丙烷脂肪酸)的条件下,该微生物与该底物温育。在具体实施方案中,去饱和酶的脂肪酸底物选自如上所述。
在其它实施方案中,本发明提供在植物中产生含有三碳碳环的脂肪酸(如环丙烷脂肪酸)的方法,包括提供一种植物和编码植物CPA-FAS的一种异源基因;用该异源基因转化该植物,以产生含有三碳碳环的脂肪酸,如环丙烷脂肪酸。在其它实施方案中,本发明提供在植物中产生含有三碳碳环的脂肪酸(如环丙烷脂肪酸)的方法,包括在致使产生含有三碳碳环的脂肪酸(如环丙烷脂肪酸)的条件下,种植用编码植物CPA-FAS的异源基因转化的植物。在其它实施方案中,本发明提供在植物中产生含有三碳碳环的脂肪酸(如环丙烷脂肪酸)的方法,包括提供一种植物,编码植物CPA-FAS的第一种异源基因,和编码去饱和酶的第二种异源基因;用第一种异源基因和第二种异源基因共转化该植物,以产生含有三碳碳环的脂肪酸,如环丙烷脂肪酸。在其它实施方案中,本发明提供在植物中产生含有三碳碳环的脂肪酸(如环丙烷脂肪酸)的方法,包括在致使产生含有三碳碳环的脂肪酸(如环丙烷脂肪酸)的条件下,种植用编码植物CPA-FAS的第一种异源基因和编码去饱和酶的第二种异源基因转化的一种植物。在其它实施方案中,本发明提供在植物中产生含有三碳碳环的脂肪酸(如环丙烷脂肪酸)的方法,包括提供一种植物,和编码含有植物CPA-FAS和脂肪酸去饱和酶的融合多肽的异源基因;用该异源基因转化植物,以产生含有三碳碳环的脂肪酸,如环丙烷脂肪酸。在其它实施方案中,本发明提供在植物中产生含有三碳碳环的脂肪酸(如环丙烷脂肪酸)的方法,包括在致使产生含有三碳碳环的脂肪酸(如环丙烷脂肪酸)的条件下,种植用一种异源基因转化的植物,该基因编码含有植物CPA-FAS和脂肪酸去饱和酶的融合多肽。
在其它具体实施方案中,本发明提供含有本发明的上述任何一种核酸序列的转基因植物,其中该核酸序列处于控制该核酸序列在植物靶组织中表达或在植物靶发育阶段表达的启动子的控制之下,或者处于诱导型启动子控制之下。预期这些转基因植物可以用于上述任何方法,用于在植物中生产环丙烷脂肪酸。
在其它实施方案中,本发明提供筛选植物CPA-FAS的方法,包括提供候选植物CPA-FAS,分析候选CPA-FAS中氨基酸序列是否存在S-腺苷甲硫氨酸结合基序和催化半胱氨酸;优选地,该基序和催化半胱氨酸存在于植物CPA-FAS的羧基端。
附图描述

图1显示提出的苹婆酸生物合成途径。
图2显示苹婆种子发育过程中脂肪酸积累的概况。
图3显示沿来自克隆R50D5和R15C3的推断的苹婆环丙烷合酶cDNA,苹婆种子ESTs的分布。起始密码子位于98bp处,终止密码子位于2690bp处。在所有盒中,第一个数字是EST的编号,第二个数字是EST开始的位点。箭头表示给定EST的方向和覆盖的区域。
图4显示苹婆环丙烷脂肪酸合酶(SCPA-FAS)的核酸序列(SEQ IDNO1)。
图5显示图4所示的苹婆环丙烷脂肪酸合酶(SCPA-FAS)的推断的氨基酸序列(SEQ ID NO2)。
图6显示FAMEs的GC/MS分析,该FAMEs来源于在补充200mg/L油酸的培养基中培养48小时的酵母。图(A)显示来自对照转基因酵母的FAMEs的总离子层析谱,酵母中含有构建体pYES2/CT-LaeZ。图(B)显示来自含有构建体pYES2/CT-SCPAS的酵母的FAMEs的总离子层析谱,该构建体含有苹婆环丙烷合酶的编码序列。在该层析谱中能够看到保留时间为34.44min的另一个峰。图(C)显示在来自图(B)的FAMES的层析谱中观察到的另一个独特峰的质谱。该质谱与二氢苹婆酸标准相同(见图8(A))。插图是含有另一个峰的放大图像。
图7显示来自转基因烟草细胞的FAMEs的总离子层析谱。图(A)显示来自用空构建体pE1776转化的对照转基因烟草细胞的饱和FAMEs。图(B)显示来自用含有苹婆环丙烷合酶编码序列的构建体pE1776-SCPAS转化的转基因烟草细胞的饱和FAMEs。在该样品中能够看到保留时间为35.69min的另一个主要峰。图(C)显示保留时间为35.69min的二氢苹婆酸甲酯标准。
图8显示二氢苹婆酸标准的质谱和用苹婆环丙烷合酶编码序列转化的转基因细胞中发现的另一个峰的比较。图(A)显示二氢苹婆酸甲酯标准的总离子层析谱。图(B)显示二氢苹婆酸甲酯标准的质谱。有几个离子是二氢苹婆酸甲酯所特有的,包括分子离子m/z=310,M-32为278,M-74为236。图(C)显示来自转基因烟草细胞的饱和FAMEs的总离子层析谱,该细胞用含有苹婆环丙烷合酶编码序列的构建体pE1776-SCPAS转化。图(D)显示图(C)中所见的保留时间为35.69min的峰的质谱。该峰的质谱与二氢苹婆酸甲酯标准几乎相同,分子离子特征(signature)为310,M-32为278,M-74为236。
图9显示用苹婆环丙烷合酶编码序列转化的15个独立转基因烟草系的二氢苹婆酸含量。
图10图(A)显示苹婆环丙烷合酶与其它环丙烷合酶和环丙烷合酶样酶的羧基端部分的氨基酸比对。---线表示S-腺苷甲硫氨酸结合位点,*是重要的催化半胱氨酸。图(B)显示这些酶之间的系统发生关系。
图11显示苹婆与细菌环丙烷脂肪酸合酶之间的氨基酸比对。使用约氨基酸470-氨基酸864的部分(保守羧基端)制备抗苹婆酶抗体。
图12显示引物相对于苹婆环丙烷脂肪酸合酶编码序列的位置(引物在编码序列之上显示),其中该引物用于保守羧基端编码序列的PCR扩增。
图13显示在BL21中表达的蛋白质(SEQ ID NO11)。突出的部分来源于载体,其含有6-组氨酸尾以便于纯化。
图14显示通过用苹婆环丙烷脂肪酸合酶的氨基酸序列blastingNCBI数据库,在棉花(树棉)中发现的三个EST的核酸序列。图A显示EST1(SEQ ID NO3),图B显示EST2(SEQ ID NO4),图C显示EST3(SEQ ID NO5)。
图15显示图14所示的三个棉花EST的重叠群分析的结果,证实EST2和3是重叠的EST。图A用图示显示结果;图B显示EST2、EST3和重叠群1的核酸序列排比,图C显示重叠群1的核酸序列(SEQID NO6)。
图16显示苹婆环丙烷脂肪酸合酶(图A,SEQ ID NO2)、棉花EST1(图B,SEQ ID NO7)、棉花EST2(图C,SEQ ID NO8)、棉花EST3(图D,SEQ ID NO9)和棉花重叠群1(EST2_3,图E,SEQ IDNO10)的预测的氨基酸序列。
图17显示苹婆环丙烷脂肪酸合酶的氨基酸序列(SEQ ID NO2)与两种棉花EST序列——EST1(SEQ ID NO7)和重叠群1(EST2_3,SEQ ID NO10)的预测的氨基酸序列的比对。
图18显示使用抗苹婆环丙烷脂肪酸合酶(CPSA-FAS)抗体,来自棉花的不同组织(胚、叶、茎和根)和来自苹婆的胚组织的Western印迹分析。
发明概述本发明涉及含有植物环丙烷脂肪酸(CPA-FAS)基因和多肽的组合物。本发明包括含有该酶的天然和重组形式以及突变体和变体形式的组合物,其中有些具有不同于野生型的特征。本发明也提供使用植物CPA-FAS基因、多肽和合酶产物的方法。
在有些实施方案中,本发明提供分离的编码植物环丙烷脂肪酸合酶的新型核酸序列。在其它实施方案中,本发明提供分离的编码植物环丙烷脂肪酸合酶的突变体、变体、同源物、嵌合体和融合体的核酸序列。在其它实施方案中,本发明提供产生这些序列的方法。在其它实施方案中,本发明提供克隆和表达这些序列的方法,以及纯化和测定这些序列的表达产物的方法。
在另外的实施方案中,本发明提供纯化的植物CPA-FAS多肽。在其它实施方案中,本发明提供植物CPA-FAS的突变体、变体、同源物、嵌合体和融合蛋白。在有些实施方案中,本发明提供纯化并测定环丙烷脂肪酸合酶多肽野生型以及突变体、变体、同源物、嵌合体和融合体的生物化学活性的方法,以及产生针对这些蛋白质的抗体的方法。
在有些实施方案中,本发明提供使用分离的编码植物环丙烷脂肪酸合酶的新型核酸序列产生具有合酶活性的产物的方法。在有些实施方案中,该方法包括将该序列添加到含有合酶底物的体外转录和翻译系统中,使得合酶产物可以回收。在其它实施方案中,该方法包括用该序列转化生物,使得该序列表达,产生合酶的产物。在具体实施方案中,回收产物。在其它实施方案中,产物保留在原位。
在有些实施方案中,本发明提供使用重组植物CPA-FAS多肽产生具有合酶活性的产物的方法。在有些实施方案中,该方法包括将该多肽添加到含有合酶底物的体外系统中,使得合酶产物可以回收。
在其它实施方案中,该方法包括用分离的编码植物环丙烷脂肪酸合酶的新型核酸序列转化一种植物,致使产生合酶的产物。
在有些实施方案中,本发明提供用编码植物环丙烷脂肪酸合酶的异源基因转化的一种生物。在有些实施方案中,该生物是一种微生物。在其它实施方案中,该生物是一种植物。
在有些实施方案中,本发明也提供用编码植物环丙烷脂肪酸合酶的异源基因转化的一种细胞。在有些实施方案中,该细胞是一种微生物。在其它实施方案中,该细胞是一种植物细胞。
在其它实施方案中,本发明提供用编码植物环丙烷脂肪酸合酶的核酸序列转化的一种植物种子。在其它实施方案中,本发明提供来自用植物环丙烷脂肪酸合酶转化的植物的油。
定义为了便于理解本发明,下面定义了此处使用的大量术语和短语。
术语“植物”最广义地使用。包括但不限于木本、装饰、作物或谷类、水果或蔬菜植物和光合绿藻(例如莱因哈德衣藻(Chlamydomonasreinhardtii))的任何种。也指大多分化为在植物发育任一阶段存在的结构的多种植物细胞。这些结构包括但不限于果实、芽、茎、叶、花瓣等。术语“植物组织”包括分化的和未分化的植物组织,包括根、芽、叶、花粉、种子和肿瘤中存在的组织,以及培养的细胞(例如单细胞、原生质体、胚、愈伤组织等)。植物组织可以在植物中,在器官培养物、组织培养物或细胞培养物中。如此处所用的术语“植物部分”是指一种植物结构或植物组织。
术语“作物”或“作物植物”最广义地使用。该术语包括但不限于人类食用或用作动物饲料或人类使用或消费的任何植物或藻类种,或工业或商业上使用的任何植物或藻类。
术语“产油种”是指在特定器官(主要在种子)中产生并贮存三酰基甘油的植物种。这些种包括但不限于大豆(Glycine max)、油菜籽和芸苔(包括芸苔(Brassica napus)和野油菜(B.campestris)),向日葵(Helianthus annus),棉花(陆地棉(Gossypiurn hirsutum))、玉米(玉蜀黍(Zea mays)),可可(Theobroma cacao),红花(Carthamus tinctorius),油椰(Elaeis guineensis),椰子(Cocos nucifera),亚麻(linumusitatissimum),蓖麻(Ricinus communis)和落花生(Arachis hypogaea)。也包括可用于研发适当表达载体的非农业种,如烟草、快循环芸苔属的种,和拟南芥(Arabidopsis thaliana),和可以作为独特脂肪酸来源的野生种。
术语“苹婆”是指来自锦葵目梧桐科苹婆属的植物。苹婆的非限制性例子包括来自臭苹婆、西非黄苹婆(S.oblongata)、象鼻黄苹婆(S.Rhinopetala)、刺激苹婆(S.urens)、绒毛苹婆(S.vi1losa)种的植物。该术语也指从中分离核酸序列SEQ ID NO1的臭苹婆植物。
术语“棉花”是指来自锦葵目锦葵科棉属的棉花植物,至少包括39个种。棉花的非限制性例子包括来自树棉、陆地棉、草棉(G.herbaceum)和海岛棉(G.barbadense)种的植物。该术语也指产生核酸序列SEQ IDNOs3、4和6的树棉植物。
术语植物细胞的“区室或细胞器”最广义地使用。该术语包括但不限于内质网、高尔基体、跨高尔基网络、质体、肌质网、乙醛酸循环体、线粒体、叶绿体和核膜等。
术语“宿主细胞”是指能够复制和/或转录和/或翻译异源基因的任何细胞。
术语“加成亚甲基的脂肪酸”是指向烃链加成一个亚甲基,产生甲基或亚甲基分支的或三碳碳环结构的脂肪酸。
术语“三碳碳环脂肪酸”是指含有环丙烷或环丙烯环的脂肪酸。
术语“环丙烷脂肪酸”(CPA-FA)是指特征在于一个饱和三碳环的脂肪酸。术语“环丙烯脂肪酸”(CPE-FA)是指特征在于一个不饱和三碳环的脂肪酸。
术语“环丙烷脂肪酸合酶”(CPA-FAS)或“环丙烷合酶”是指能够合成含有环丙烷环的脂肪酸的多肽。当含有顺式单不饱和脂肪酸之外的底物时,或者在只有几个氨基酸的修饰后,该多肽预计作为三碳碳环脂肪酸合酶或作为加成亚甲基的脂肪酸合酶更广泛地起作用。这种基本反应包括对双键加成亚甲基。因此,该多肽催化对不饱和脂肪酸的不饱和中心加成亚甲基,包括对酰基的双键加成亚甲基。甲硫氨酸能够从S-腺苷甲硫氨酸获得。酰基一般是十六烷酰基或十八烷酰基,但是预计不同链长和不饱和程度的其它脂肪酰基也可以作为底物。据认为脂肪酰基被酯化为磷脂;这些磷脂底物包括磷脂酰胆碱、磷脂酰乙醇胺和磷脂酰甘油。术语“重组环丙烷脂肪酸合酶”(重组CPA-FAS)是指编码CPA-FAS的重组核酸分子或异源基因的表达产物。具有“CPA-FAS活性”是指具有CPA-FAS的功能性,或者能够合成含有环丙烷环的脂肪酸,或者催化上述反应。“植物CPA-FAS”是最初从植物来源获得的一种酶;该酶可以被修饰,这种修饰包括但不限于截短、氨基酸缺失、添加和置换,以及糖基化,其中产生的修饰酶具有CPA-FAS活性。
术语“竞争结合”用于具有酶活性的第一种多肽,它结合与具有酶活性的第二种多肽相同的底物,其中第二种多肽是第一种多肽的变体或相关的或不同的多肽。第一种多肽的结合效率(例如动力学或热力学)可能等于或高于或低于第二种多肽的底物结合效率。例如,对于两种多肽,与底物结合的平衡结合常数(KD)可能不同。
术语“嵌合体”当用于多肽时是指从不同基因获得的两种或多种编码序列的表达产物,这些序列克隆在一起,翻译后作为一种多肽序列。嵌合多肽也被称为“杂种”多肽。编码序列包括从相同或不同生物种获得的序列。
术语“融合”当用于多肽时是指一种嵌合蛋白,它含有与外源蛋白质片段(融合配偶体)连接的目的蛋白质。融合配偶体可以行使多种功能,包括提高目的多肽的溶解度,以及提供“亲和标签”,以允许从宿主细胞或上清液或这两者中纯化重组融合多肽。如希望,可以在纯化之后或过程中从目的蛋白质中除去融合配偶体。
术语“同源物”或“同源的”当用于多肽时是指两种多肽之间的高度序列同一性,或者三维结构之间的高度相似性,或者活性部位与作用机制之间的高度相似性。在一个优选实施方案中,同源物与参照序列有高于60%的序列同一性,更优选地高于75%的序列同一性,再更优选地高于90%的序列同一性。
术语“变体”或“突变体”当用于多肽时是指与另一种通常相关的多肽有一个或多个氨基酸不同的氨基酸序列。变体可能含有“保守”改变,其中置换的氨基酸具有类似的结构或化学性质(例如亮氨酸置换为异亮氨酸)。更少见的是,变体可能含有“非保守”改变(例如甘氨酸置换为色氨酸)。类似的微小变异也可包括氨基酸缺失或插入(即添加)或这两种。确定哪种和多少氨基酸残基可以被置换、插入或删除而不消除生物活性的指南,可以用本领域公知的计算机程序发现,例如DNAStar软件。变体能够用功能测定法检测。优选的变体含有不到10%、优选地不到5%、更优选地不到2%的改变(置换、缺失等)。
术语“基因”是指一种核酸(例如DNA或RNA)序列,其包含产生RNA或多肽或其前体(例如胰岛素原)所必需的编码序列。一种功能多肽能够由全长编码序列编码,或者由该编码序列的任一部分编码,只要该多肽保留希望的活性或功能性质(例如酶活性、配体结合、信号转导等)。术语“部分”当用于基因时是指该基因的片段。这些片段的大小范围是从几个核苷酸到完整基因序列减一个核苷酸。因此,“至少含有基因的一部分的核苷酸”可以包含该基因的片段或整个基因。
术语“基因”也包括结构基因的编码区,包括5”端和3’端上与编码区相邻的序列,在每一端上距离约为1kb,使得该基因对应于全长mRNA的长度。位于编码区5’且存在于mRNA上的序列被称为5’非翻译序列。位于编码区3’或下游且存在于mRNA上的序列被称为3’非翻译序列。术语“基因”包括一种基因的cDNA和基因组形式。基因的基因组形式或克隆含有被称为“内含子”或“间插区”或“间插序列”的非编码序列中断的编码区。内含子是转录为核RNA(hnRNA)的基因片段;内含子可能含有调节元件如增强子。内含子从核或一级转录物上去除或“剪接下来”;因此信使RNA(mRNA)转录物中不含内含子。mRNA在翻译过程中用来指定新生多肽中氨基酸的序列或顺序。
除了含有内含子外,基因的基因组形式也可含有位于RNA转录物上存在的序列的5’和3’端的序列。这些序列被称为“侧翼”序列或区(这些侧翼序列位于mRNA转录物上存在的非翻译序列的5’或3’)。5’侧翼区可含有控制或影响基因转录的调节序列,如启动子和增强子。3’侧翼区可含有指导转录终止、转录后切割和聚腺苷酸化的序列。
术语“异源基因”是指编码在自然环境中不存在(即人工改变)的因子的基因。例如,异源基因包括导入另一个种的来自一个种的基因。异源基因也包括用某些方法改变的(例如突变的、以多个拷贝添加的、与非天然启动子或增强序列连接的,等等)对于一种生物而言是天然的基因。异源基因可含有植物基因序列,包括植物基因的cDNA形式;cDNA序列可以以有义(产生mRNA)或反义方向(产生与mRNA转录物互补的反义RNA转录物)表达。异源基因与内源植物基因的不同在于异源基因序列一般与含有调节元件(如启动子)的核苷酸序列连接,发现这些核苷酸序列不与异源基因编码的蛋白质的基因自然结合,或者不与染色体中的植物基因序列结合,或者与未在自然中发现的染色体部分结合(例如在通常不表达该基因的基因座中表达的基因)。
术语“寡核苷酸”是指由两个或两个以上、优选地3个以上、通常10个以上的脱氧核糖核苷酸或核糖核苷酸组成的分子。准确大小取决于许多因素,并取决于寡核苷酸的最终功能或用途。寡核苷酸可以用任何方法产生,包括化学合成、DNA复制、反转录或其组合。
术语“含有编码一种基因的核苷酸序列的寡核苷酸”或“编码一种具体多肽的核酸序列”是指含有一种基因的编码区的核酸序列,或者换句话说,是指编码一种基因产物的核酸序列。编码区可以是cDNA、基因组DNA或RNA形式。当以DNA存在时,寡核苷酸可以是单链(即有义链)或双链的。如果需要适当启动一级RNA转录物的转录和/或正确加工,合适的控制元件,如增强子/启动子、剪接点、聚腺苷酸化信号等,可以紧密靠近基因的编码区。此外,在本发明的表达载体中使用的编码区也可含有内源增强子/启动子、剪接点、间插序列、聚腺苷酸化信号等,或内源和外源控制元件的组合。
术语“互补的”和“互补”是指根据碱基配对原则关联的多核苷酸(即核苷酸的序列)。例如,序列“A-G-T”与序列“T-C-A”互补。互补可能是“部分的”,其中只有一些核酸碱基根据碱基配对原则匹配。或者,可能是核酸之间“完全”或“总体”互补。核酸链之间的互补程度对核酸链之间杂交的效率和强度有显著影响。这在扩增反应以及以核酸结合为基础的检测方法中特别重要。
术语“同源性”当用于核酸时是指互补程度。可能是部分同源性或完全同源性(即同一性)。“序列同一性”是指两种或多种核酸之间相关性的量度,表示为相对于总对比长度的百分比。同一性计算考虑在各自的较大序列中相同的和位于相同相对位置的核苷酸残基。同一性的计算可以用计算机程序如“GAP”(Genetics Computer Group,Madison,Wis.)和“ALIGN”(DNAStar,Madison,Wis.)中所含的算法进行。部分互补的序列至少部分抑制(或竞争)完全互补的序列与靶核酸杂交,使用功能术语“基本同源”。完全互补的序列与靶序列杂交的抑制可以用杂交试验(Southern或Northern印迹法、溶液杂交等)在低严格条件下检测。基本同源的序列或探针在低严格条件下将竞争并抑制与靶标完全同源的序列的结合(即杂交)。这并不是说低严格条件允许非特异性结合;低严格条件需要两种序列彼此之间的结合是一种特异的(即选择性)相互作用。利用甚至缺乏部分互补性的第二种靶标可以检测非特异性结合的缺乏(例如不到约30%);在没有非特异结合时,探针将不与第二种非互补靶标杂交。
当用于双链核酸序列,如cDNA或基因组克隆时,术语“基本同源的”是指在如下文所述的低严格条件下能够与双链核酸序列的一条链或两条链杂交的任何探针。
当用于核酸杂交时,低严格条件包括相当于下列的条件当使用长度约为500个核苷酸的探针时,在含有5×SSPE(43.8g/l NaCl,6.9g/lNaH2PO4×H2O和1.85g/l EDTA,pH用NaOH调节为7.4),0.1% SDS,5×Denhardt′s试剂[50×Denhardt′s,每500ml含有5g Ficoll(Type400,Pharmacia),5g BSA(组分V;Sigma)]和100μg/ml变性鲑精DNA的溶液中,在42℃下结合或杂交,随后用含有5×SSPE,0.1% SDS的溶液在42℃下洗涤。
当用于核酸杂交时,高严格条件包括相当于下列的条件当使用长度约为500个核苷酸的探针时,在含有5×SSPE(43.8g/l NaCl,6.9g/lNaH2PO4×H2O和1.85g/l EDTA,pH用NaOH调节为7.4),0.5%SDS,5×Denhardt′s试剂和100μg/mi变性鲑精DNA的溶液中,在42℃下结合或杂交,随后用含有0.1×SSPE,1.0%SDS的溶液在42℃下洗涤。
众所周知,可以使用大量相当的条件,包括低严格条件;要考虑许多因素,如探针的长度和性质(DNA、RNA、碱基组成),和靶标的性质(DNA、RNA、碱基组成、存在于溶液中或固定,等等),以及盐和其它成分的浓度(例如甲酰胺、硫酸葡聚糖、聚乙二醇的存在与否),杂交溶液可以不同,产生不同于但是相当于上述条件的低严格杂交条件。另外,本领域知道在高严格条件下促进杂交的条件(例如,提高杂交温度和/或增加洗涤步骤,在杂交溶液中使用甲酰胺等)。
当用于双链核酸序列,如cDNA或基因组克隆时,术语“基本同源的”是指在如上所述的低到高严格条件下能够与双链核酸序列的任一条链或两条链杂交的任何探针。
当用于单链核酸序列时,术语“基本同源的”是指在如上所述的低到高严格条件下能够与单链核酸序列杂交(即互补)的任何探针。
术语“杂交”是指互补核酸的配对。杂交和杂交强度(即核酸之间结合的强度)受如下因素影响核酸之间的互补程度,有关条件的严格性,形成的杂种的Tm,核酸内的G∶C比。在结构内含有互补核酸配对的单个分子被称为是“自杂交的”。
术语“Tm”是指核酸的“解链温度”。解链温度是一群双链核酸分子有一半解离为单链时的温度。计算核酸Tm的公式在本领域公知。如标准参照所示,当一种核酸在1M NaCl的水溶液中时,对Tm值的简单估计可以用下列公式计算Tm=81.5+0.41(%G+C)(参见,例如Anderson和Young,“定量过滤杂交”(1985)《核酸杂交》(Nucleic AcidHybridization)。计算Tm的其它参考包括考虑结构以及序列特征的更复杂的计算。
如此处所用的术语“严格性”是指温度、离子强度和其它化合物(如有机溶剂)的存在等条件,在此条件下进行核酸杂交。在“高严格”条件下,核酸碱基配对将只在含有高频率互补碱基序列的核酸片段之间发生。因此,来源于遗传多样性生物的核酸通常需要“低”严格条件,因为互补序列的频率通常较低。
“扩增”是与模板特异性有关的核酸复制的一种特殊情况。它与非特异性模板复制(即,依赖于模板但是不依赖于特异模板的复制)完全不同。模板特异性在此不同于复制的保真度(即,适当多核苷酸序列的合成)和核苷酸(核糖或脱氧核糖)的特异性。模板特异性常常用“靶”特异性描述。靶序列是设法从其它核酸中选出的“靶标”。扩增技术主要用于这种分选。
模板特异性在大多数扩增技术中通过酶的选择实现。扩增酶是在使用条件下只处理异源核酸混合物中的特定核酸序列的酶。例如,对于 复制酶,MDV-1 RNA是该复制酶的特异模板(Kacian等人(1972)Proc.Natl.Acad.Sci.USA,693038)。其它核酸不被这种扩增酶复制。类似地,对于T7 RNA聚合酶,这种扩增酶具有对其自身启动子的严格特异性(chamberlin等人(1970)Nature,228227)。对于T4 DNA连接酶,该酶不连接两个寡核苷酸或多核苷酸,在连接点处在寡核苷酸或多核苷酸底物与模板之间有一个错配(Wu和Wallace(1989)Genomics,4560)。最后,发现Taq和Pfu聚合酶由于在高温下起作用的能力,显示对引物结合的因而限定的序列有高特异性;高温导致有利于引物与靶序列杂交而不与非靶序列杂交的热力学条件(H.A.Erlich(编著)(1989)《PCR技术》Stockton Press)。
术语“可扩增的核酸”是指可以用任何扩增方法扩增的核酸。预期“可扩增的核酸”通常包括“样品模板”。
术语“样品模板”是指来自于一种样品的核酸,分析其中是否存在“靶标”(下文定义)。相反,“背景模板”是指样品模板之外的核酸,在样品中可能存在或者不存在。背景模板大多是由疏忽引起的。可能是转移(carryover)的结果,或者可能是由于存在试图从样品中纯化掉的核酸污染物。例如,来自生物的不可检测的核酸可能作为背景存在于待测样品中。
术语“引物”是指一种寡核苷酸,无论它在纯化的限制酶消化物中自然存在还是合成产生,当置于可诱导与核酸链互补的引物延伸产物合成的条件下时(即,在核苷酸和诱导剂如DNA聚合酶存在下,在适当的温度和pH时),都能够作为合成的起点。为达到最高扩增效率,引物优选的是单链,但是也可以是双链。如果是双链,在用来制备延伸产物之前,首先处理引物,分开双链。优选地,引物是一种寡脱氧核苷酸。引物必须足够长才能在诱导剂的存在下引发延伸产物的合成。引物的确切长度取决于许多因素,包括温度、引物来源和方法的使用。
术语“聚合酶链反应”(“PCR”)是指K.B.Mullis的美国专利号4,683,195、4,683,202和4,965,188的方法,其中描述了不需克隆或纯化,提高基因组DNA混合物中靶序列片段浓度的一种方法。这种扩增靶序列的方法包括向含有希望的靶序列的DNA混合物中加入大大过量的两种寡核苷酸引物,随后在DNA聚合酶存在下进行顺序精确的热循环。两种引物与双链靶序列的对应链互补。为了实现扩增,变性混合物,然后引物与靶分子内的互补序列退火。退火后,用聚合酶延伸引物,形成新的一对互补链。变性、引物退火和聚合酶延伸的步骤能够重复多次(即,变性、退火和延伸组成一个“循环”;可以是多个“循环”),以获得希望的靶序列的高浓度扩增片段。希望的靶序列的扩增片段的长度取决于引物彼此的相对位置,因此,该长度是一个可控参数。由于该方法是重复的,该方法被称为“聚合酶链反应”(下文称“PCR”)。由于希望的靶序列的扩增片段成为混合物中的优势序列(在浓度方面),它们被称为“PCR扩增的”。
通过PCR能够将基因组DNA中一个拷贝的特异靶序列扩增到用几种不同的方法都能检测的水平(例如与标记探针杂交;掺入生物素化引物,随后进行亲和素-酶偶联物检测;向扩增的片段中掺入32P-标记的脱氧核苷酸三磷酸如dCTP或dATP)。除了基因组DNA之外,用适当的引物分子组能够扩增任何寡核苷酸或多核苷酸序列。具体而言,PCR方法产生的扩增片段本身就是随后的PCR扩增的有效模板。
术语“PCR产物”、“PCR片段”和“扩增产物”是指在完成两个或多个循环的变性、退火和延伸的PCR步骤后获得的化合物的混合物。这些术语包括扩增一个或多个靶序列的一个或多个片段的情况。
术语“扩增试剂”是指除了引物、核酸模板和扩增酶之外,扩增所需的那些试剂(脱氧核糖核苷酸三磷酸、缓冲液等)。扩增试剂以及其它反应成分一般都置于或包含于一个反应容器中(试管、微孔等)。
术语“反转录酶”或“RT-PCR”是指初始材料是mRNA的PCR类型。使用一种反转录酶,将初始mRNA酶促转化为互补DNA或“cDNA”。然后该cDNA作为“PCR”反应的“模板”。
术语“基因表达”是指一种基因内编码的遗传信息通过基因“转录”(即通过RNA聚合酶的酶促作用)转化为RNA(例如mRNA、rRNA、tRNA或snRNA)和通过mRNA“翻译”转化为蛋白质的过程。基因表达能够在该过程的多个阶段调节。“正调节”或“激活”是指提高基因表达产物(例如RNA或蛋白质)产量的调节,而“负调节”或“抑制”是指降低产量的调节。参与正调节或负调节的分子(例如转录因子)通常分别被称为“激活剂”和“抑制剂”。
术语“有效组合”、“有效顺序”和“有效连接”是指核酸序列以一种方式连接,致使产生能够指导特定基因转录和/或希望的蛋白质分子合成的核酸分子。该术语也指氨基酸序列以这种方式连接,致使产生一种功能蛋白质。
术语“调节元件”是指控制核酸序列表达的某些方面的遗传元件。例如,启动子是促进有效连接的编码区转录起始的调节元件。其它调节元件包括剪接信号、聚腺苷酸化信号、终止信号等。
真核生物中的转录控制信号包括“启动子”和“增强子”元件。启动子和增强子由可与参与转录的细胞蛋白质特异相互作用的DNA序列短阵列组成(Maniatis等人,Science 2361237,1987)。启动子和增强子元件已经从多种真核生物来源中分离,包括酵母、昆虫、哺乳动物和植物细胞的基因。启动子和增强子元件也已经从病毒中分离,类似的控制元件,如启动子,也在原核生物中发现。具体的启动子和增强子的选择取决于用来表达目的蛋白的细胞型。一些真核启动子和增强子有宽宿主范围,而其它的在有限的细胞型亚类中有功能(综述参见Voss等人,Trends Biochem.Sci.,11287,1986;Maniatis等人,同上1987)。
如此处所用的术语“启动子元件”、“启动子”或“启动子序列”是指位于DNA聚合物的蛋白质编码区5’端(即之前)的DNA序列。自然界已知的大多数启动子的位置在转录区之前。启动子作为一个开关,激活基因的表达。如果基因被激活,即说是被转录或参与转录。转录包括由基因合成mRNA。因此,启动子作为一种转录调节元件,也提供基因转录为mRNA的起始位点。
启动子可以是组织特异的或是细胞特异的。术语“组织特异的”在用于启动子时是指一种启动子,它能够在目的核苷酸序列在不同组织类型(例如叶)中相对不表达的的下,使同一目的核苷酸序列的选择性表达定向于一种特定组织类型(例如种子)中。启动子的组织特异性可以如下评价,例如一种报道基因与启动子序列有效连接,产生报道构建体,将该报道构建体导入一种植物的基因组中,使得该报道构建体整合到获得的转基因植物的每种组织中,检测该报道基因在该转基因植物的不同组织中的表达(例如检测mRNA、蛋白质或该报道基因编码的蛋白质的活性)。检测到该报道基因在一种或多种组织中的表达水平高于该报道基因在其它组织中的表达水平,表明该启动子对于检测到表达水平较高的组织是特异的。术语“细胞型特异的”当用于启动子时是指一种启动子,它能够在目的核苷酸序列在同一组织内不同细胞型中相对不表达的情况下,使同一目的核苷酸序列的选择性表达定向于一种特定细胞型。术语“细胞型特异的”当用于启动子时也指能够促进目的核苷酸序列在一种组织内的一个区域中选择性表达的一种启动子。启动子的细胞型特异性可以用本领域公知的方法评价,例如免疫组化染色。简言之,将组织切片包埋于石蜡中,石蜡切片与第一抗体反应,该抗体对于该启动子控制表达的目的核苷酸序列编码的多肽产物是特异的。使标记的(例如过氧化物酶偶联的)第一抗体特异的第二抗体结合切片的组织,用显微镜检查特异性结合(例如使用亲和素/生物素)。
启动子可以是组成型或是调节型的。术语“组成型”当用于启动子时是指该启动子在没有刺激(例如热休克、化学物质、光线等)的情况下能够引导有效连接的核酸序列的转录。组成型启动子一般能够引导转基因基本上在所有细胞和所有组织中表达。典型的组成型植物启动子包括但不限于SD花椰菜花叶病毒(CaMV SD;参见,例如美国专利号5,352,605,在此引用作为参考),甘露氨酸合酶,章鱼氨酸合酶(ocs),超启动子(参见,例如WO95/14098)和ubi3(参见,例如Garbarino和Beiknap(1994)Plant Mol.Bioi.24119-127)启动子。这些启动子已经成功地用于引导异源核酸序列在转化的植物组织中表达。
相反,“调节型”启动子能够在刺激(例如热休克、化学物质、光线等)存在下引导有效连接的核酸序列的一定水平的转录,这不同于有效连接的核酸序列在没有刺激的情况下的转录水平。
增强子和/或启动子可以是“内源的”或“外源的”或“异源的”。“内源的”增强子或启动子与基因组中的一种特定基因自然连接。“外源的”或“异源的”增强子或启动子通过遗传操作(即分子生物学技术)与一种基因并列,使得该基因的转录由连接的增强子或启动子指导。例如,与第一种基因有效组合的一种内源启动子能够分离、提取,并与第二种基因有效组合,从而使得“异源启动子”与第二种基因有效组合。预期有多种这样的组合(例如,第一种和第二种基因能够来自同一个种,或者来自不同的种)。
表达载体上“剪接信号”的存在常常导致重组转录物在真核宿主细胞中的较高水平的表达。剪接信号介导从一级RNA转录物上去除内含子,由一个剪接供体和接受位点组成(Sambrook等人(1989)《分子克隆实验室手册》,第二版,Cold Spring Harbor Laboratory Press,New York,pp.16.7-16.8)。常用的剪接供体和接受位点是来自SV40的16S RNA的剪接点。
重组DNA序列在真核细胞中的高效表达需要表达引导转录物有效终止和聚腺苷酸化的信号。转录终止信号通常在聚腺苷酸化信号下游发现,长度为几百个核苷酸。如此处所用的术语“poly(A)位点”或“poly(A)序列”是指引导新生RNA转录物终止和聚腺苷酸化的DNA序列。重组转录物的有效聚腺苷酸化是希望的,因为缺乏poly(A)尾的转录物不稳定,且快速降解。表达载体使用的poly(A)信号可以是“异源的”或“内源的”。内源poly(A)信号在基因组中特定基因编码区的3’端自然发现。异源poly(A)信号分离自一种基因,位于另一种基因的3’。常用的异源poly(A)信号是SV40 poly(A)信号。SV40 poly(A)信号包含于237bp的BamHI/BclI限制酶切片段上,引导终止和聚腺苷酸化(Sambrook,同上,16.6-16.7)。
术语“选择性标记”是指一种基因,它编码一种酶,该酶具有使表达该选择性标记的细胞具有抗生素或药物抗性或者使得能够检测的性状(例如发光或荧光)表达的活性。选择性标记可以是“正”或“负”的。正选择性标记的例子包括新霉素磷酸转移酶(NPTII)基因,它提供G418和卡那霉素抗性,和细菌潮霉素磷酸转移酶基因(hyg),它提供抗生素潮霉素抗性。负选择性标记编码一种酶活性,当在适当的选择性培养基中培养时,其表达对细胞具有细胞毒性。例如,HSV-tk基因常常用作负选择性标记。在更昔洛韦或阿昔洛韦存在下,HSV-tk基因在培养的细胞中的表达具有细胞毒性,因此,细胞在含有更昔洛韦或阿昔洛韦的选择性培养基中生长可选择能够表达功能HSV TK酶的细胞。
术语“载体”是指从一个细胞向另一个细胞转移DNA片段的核酸分子。术语“载体(vehicle)”有时与“载体(vector)”互换使用。
术语“表达载体”或“表达盒”是指一种重组DNA分子,其含有希望的编码序列,和有效连接的编码序列在特定宿主生物中表达所需的适当核酸序列。在原核生物中表达所必需的核酸序列通常包括启动子、操纵基因(任选的)和核糖体结合位点,常常还有其它序列。已知真核细胞使用启动子、增强子和终止及聚腺苷酸化信号。
术语“转染”是指外源DNA向细胞内的导入。转染可以用本领域公知的多种方法实现,包括磷酸钙-DNA共沉淀、DEAE-葡聚糖介导的转染、多聚季胺(polybrene)介导的转染、玻璃珠、电穿孔、显微注射、脂质体融合、脂转染、原生质体融合、病毒感染、biolistics(例如颗粒轰击)等。
术语“感染的”和“感染”在用于细菌时是指靶生物样品(例如细胞、组织等)与该细菌在一定条件下共温育,使得细菌所含的核酸序列导入靶生物样品的一个或多个细胞中。
术语“农杆菌”是指一种土壤携带的革兰氏阴性杆状植物致病菌,其导致冠瘿病。术语“农杆菌”包括但不限于下列菌株根瘤农杆菌(Agrobacterium tumefaciens)(一般在感染的植物中引起冠瘿病),和毛根农杆菌(Agrobacterium rhizogens)(在感染的宿主植物中引起毛根病)。植物细胞感染农杆菌通常导致感染的细胞产生冠瘿氨基酸(例如胭脂氨酸、农杆氨酸、章鱼氨酸等)。因此,导致产生胭脂氨酸的农杆菌株(例如LBA4301、C58、A208、GV3101株)被称为“胭脂氨酸型”农杆菌;导致产生章鱼氨酸的农杆菌株(例如LBA4404、Ach5、B6株)被称为“章鱼氨酸型”农杆菌;导致产生农杆氨酸的农杆菌株(例如EHA105、EHA101、A281株)被称为“农杆氨酸型”农杆菌。
术语“轰击”和“biolistic轰击”是指为了实现靶生物样品中细胞细胞膜的创伤,和/或使颗粒进入靶生物样品内,向靶生物样品(例如细胞、组织等)加速颗粒的方法。biolistic轰击方法在本领域公知(例如美国专利号5,584,807,其内容在此引用作为参考),可以商品获得(例如,氦气驱动的微粒加速器(PDS-1000/He,BioRad)。
术语“显微创伤”当用于植物组织时是指向组织中引入显微镜下可见的创伤。例如,显微创伤可以用此处所述的颗粒轰击实现。
术语“转基因的”当用于植物或果实或种子时(即“转基因植物”或“转基因果实”或“转基因种子”),是指在其一种或多种细胞中至少含有一种异源基因的植物或果实或种子。术语“转基因植物材料”泛指在一种或多种细胞中至少含有一种异源基因的植物、植物结构、植物组织、植物种子或植物细胞。
术语“转化子”或“转化的细胞”包括转化的初级细胞和来自这些细胞的培养物,而不考虑转移的数量。由于有意的或无意的突变,所有后代在DNA含量上可能不会完全相同。转化子的定义中包括与在最初的转化细胞中筛选的具有相同功能性的突变后代。
术语“野生型”当用于基因时是指一种基因,其具有从天然存在的来源中分离的基因的特征。术语“野生型”当用于基因产物时是指一种基因产物,其具有从天然存在的来源中分离的基因产物的特征。野生型基因是在群体中最常发现的基因,因而随意命名为基因的“正常”或“野生型”形式。相反,术语“修饰的”或“突变的”当用于基因或基因产物时分别是指一种基因或基因产物,与野生型基因或基因产物相比,其显示序列和/或功能性质的修饰(即改变的特征)。应当指出,能够分离天然存在的突变体;它们根据以下事实鉴定与野生型基因或基因产物相比,它们具有改变的特征。
术语“反义”是指一种脱氧核糖核苷酸序列,与DNA双链体有义链的脱氧核糖核苷酸残基序列相比,其脱氧核糖核苷酸残基序列为相反的5’-3’方向。DNA双链体的“有义链”是指DNA双链体中的一条链,它被自然状态的细胞转录为“有义mRNA”。因此“反义”序列是与DNA双链体的非编码链具有相同序列的序列。术语“反义RNA”是指一种RNA转录物,它与靶初级转录物或mRNA的全部或一部分互补,通过干扰初级转录物或mRNA的加工、转运和/或翻译阻断靶基因的表达。反义RNA可以与具体的基因转录物的任一部分互补,即,5’非编码序列、3’非编码序列、内含子或编码序列。另外,如此处所用的,反义RNA可能含有提高反义RNA阻断基因表达的效能的核酶序列区。“核酶”是指一种催化性的RNA,包括序列特异的内切核糖核酸酶。“反义抑制”是指能够阻止靶蛋白质表达的反义RNA转录物的产生。
术语“siRNAs”是指短干扰RNAs。在有些实施方案中,siRNAs含有长约18-25个核苷酸的双链体或双链区;siRNAs在每条链的3’端通常含有约2个到约4个未配对的核苷酸。siRNA的双链体或双链区的至少一条链与靶RNA分子基本上同源或基本上互补。与靶RNA分子互补的链是“反义链”;与靶RNA分子同源的链是“有义链”,也与siRNA反义链互补。siRNAs也可含有其它序列;这些序列的非限制性例子包括连接双链的两条链的连接序列或环,以及可能存在于连接序列内的茎和其它折叠结构。siRNAs似乎作为在无脊椎动物和脊椎动物中引发RNA干扰以及在植物的转录后基因沉默过程中引发序列特异的RNA降解的关键中间物。
术语“靶RNA分子”是指一种RNA分子,siRNA的短双链区的至少一条链与它同源或互补。一般而言,当这种同源性或互补性约为100%时,siRNA能够沉默或抑制靶RNA分子的表达。尽管可以认为加工的mRNA是siRNA的靶标,但是本发明不限于任何具体的假说,这些假说不是实施本发明所必需的。因此,预期其它RNA分子也可能是siRNA的靶标。这些靶标包括未加工的mRNA、核糖体RNA和病毒RNA基因组。
术语“RNA干涉”或“RNAi”是指siRNAs引起的基因表达沉默或降低。它是动物和植物中序列特异的转录后基因沉默的过程,由双链区中与沉默的基因序列同源的siRNA启动。该基因对于该生物而言可以是内源或外源的,整合到染色体内或存在于未整合到基因组内的转染载体中。该基因的表达被完全或部分抑制。也可以认为RNAi抑制靶RNA的功能;靶RNA的功能可以是完全的或部分的。
术语“转录后基因沉默”或“PTGS”是指转录后植物中基因表达的沉默,似乎包括由基因重复片段合成的mRNA的特异降解。
术语“过量表达”是指转基因生物中一种基因产物的产量超过了正常的或未转化的生物的产量水平。术语“共抑制”是指与一种内源基因基本同源的一种外源基因的表达,导致该外源基因和内源基因的表达均受到抑制。术语“改变的水平”是指转基因生物中基因产物的产量或比例不同于正常的或未转化的生物。
术语“重组的”当用于核酸分子时是指由通过分子生物学技术连接在一起的核酸片段组成的核酸分子。术语“重组的”当用于蛋白质或多肽时是指使用重组核酸分子表达的蛋白质分子。
术语“Southern印迹分析”和“Southern印迹法”和“Southern”是指在琼脂糖或丙烯酰胺凝胶上对DNA的分析,其中DNA根据大小分离或破碎,随后将DNA从凝胶转移到一种固体载体上,如硝酸纤维素或尼龙膜上。固定的DNA然后暴露于标记探针,检测与所用探针互补的DNA种。DNA在电泳之前可以用限制性内切酶酶切。电泳后,在转移到固体载体之前或过程中,DNA可以部分去嘌呤和变性。Southern印迹法是分子生物学家的一种标准方法(J.Sambrook等人(1989)《分子克隆实验室手册》,Cold Spring Harbor Press,NY,pp9.31-9.58)。
如此处所用的术语“Northern印迹分析”和“Northern印迹法”和“Northern”是指通过RNA在琼脂糖凝胶上电泳对RNA的分析,以根据大小分级分离RNA,随后将RNA从凝胶转移到一种固体载体上,如硝酸纤维素或尼龙膜上。固定的RNA然后用一种标记探针杂交,检测与所用探针互补的RNA种。Northern印迹法是分子生物学家的一种标准方法(J.Sambrook,等人(1989)同上,pp 7.39-7.52)。
术语“Western印迹分析”和“Western印迹法“和“Western”是指对固定于载体(如硝酸纤维素或膜)上的蛋白质(或多肽)的分析。至少含有一种蛋白质的混合物首先在丙烯酰胺凝胶上分离,然后将分离的蛋白质从凝胶转移到一种固体载体上,如硝酸纤维素或尼龙膜上。固定的蛋白质暴露于与至少一种目的抗原有反应性的至少一种抗体。结合的抗体可以用多种方法检测,包括使用放射性标记的抗体。
术语“蛋白质”和“多肽”是指含有通过肽键连接的氨基酸的化合物,可以互换使用。
如此处使用的,当“氨基酸序列”在此是指一种蛋白质分子的氨基酸序列时,“氨基酸序列”等,如“多肽”或“蛋白质”,不是将氨基酸序列限于与所述蛋白质分子有关的完整的原始氨基酸序列;而且,“氨基酸序列”也能够由编码蛋白质的核酸序列推断而来。
术语“部分”当用于蛋白质时(“特定蛋白质的一部分”)是指该蛋白质的片段。片段的大小可以是4个氨基酸残基到完整的氨基酸序列减一个氨基酸。
术语“同源性”当用于氨基酸时是指相似性或同一性的程度。可以是部分同源性或完全同源性(即同一性)。“序列同一性”是指两种或多种蛋白质之间的相关性的一个量度,表示为相对于总对比长度的百分比。同一性的计算考虑在相应的较大序列中相同和位于相同相对位置的氨基酸残基。同一性的计算可以用计算机程序所含的算法进行。
术语“分离的”当用于核酸时,如“分离的寡核苷酸”,是指一种核酸序列,它从通常在自然来源中与之结合的至少一种污染核酸序列中鉴定并分离。分离的核酸以不同于自然中的形式或状态存在。相反,未分离的核酸,如DNA和RNA,发现是自然中存在的状态。例如,发现一种具体DNA序列(例如基因)在宿主细胞染色体上靠近邻近的基因;RNA序列,如编码一种具体蛋白质的具体mRNA序列,发现在细胞中是含有编码多种蛋白质的大量其它mRNA的混合物。然而,分离的编码植物CPA-FAS的核酸包括,例如,在细胞中通常表达DES的核酸,其中核酸的染色体位置不同于自然细胞,或者其侧翼为与自然形式不同的核酸序列。分离的核酸或寡核苷酸可以以单链或双链形式存在。当利用分离的核酸或寡核苷酸表达蛋白质时,寡核苷酸最少将含有有义链或编码链(即可能是单链的寡核苷酸),但是也可含有有义链和反义链两者(即可以是双链的寡核苷酸)。
术语“纯化的”是指从自然环境中分离或分开的核酸或氨基酸序列分子。“分离的核苷酸序列”因此是纯化的核酸序列。“基本纯化的”分子至少60%不含、优选地至少70%不含、更优选地至少90%不含自然结合的其它成分。术语“纯化的”或“纯化”也指从样品中除去污染物。污染蛋白质的去除导致样品中目的多肽的百分比提高。在另一个实施例中,重组多肽在植物、细菌、酵母或哺乳动物宿主细胞中表达,通过了除去宿主细胞蛋白质纯化该多肽;样品中重组多肽的百分比因而提高。
术语“样品”最广义地使用。一层意思是指一种植物细胞或组织。另一层意思包括从任何来源获得的标本或培养物,以及生物和环境样品。生物样品可以从植物或动物(包括人)中获得,包括液体、固体、组织和气体。环境样品包括环境材料,如表面物质、土壤、水和工业样品。这些例子不能被视为限制适用于本发明的样品类型。
发明详述本发明提供含有分离的植物CPA-FAS基因和多肽的组合物,具体而言,提供含有分离的苹婆和棉花CPA-FAS基因和多肽的组合物。本发明也提供使用植物CPA-FAS基因、多肽和合酶产物的方法;这些方法包括但不限于环丙烷脂肪酸生产中的植物CPA-FAS基因和多肽。下面的描述提供了本发明实施方案的具体但非限制性的说明性实施例。
I.植物环丙烷脂肪酸合酶基因和多肽细菌中CPA-FAs的合成途径已经很好地表征(Grogan和Cronan(1997)Microbiol Molecular Biol Rev 61(4)429-441)。第一种环丙烷合酶基因根据它与CPA-FA缺陷突变体互补的能力从大肠杆菌中克隆(Grogan和Cronan(1984)J Bacteriol 158(1)286-295)。清楚地证实,细菌CPA-FAs通过对双键加成一个来自S-腺苷甲硫氨酸的亚甲基由单不饱和脂肪酸直接合成。然而,该酶的底物似乎是酯化为磷脂的单不饱和脂肪酸,最可能是磷脂酰乙醇胺(Grogan和Cronan(1997)Microbiol Molecular Biol Rev 61(4)429-441)。在鉴定细菌环丙烷合酶后,发现来自结核分枝杆菌(M.tuberculosis)的三种基因具有向分枝菌酸上加上一个环丙烷环的能力(Yuan和Barry(1996)Proc Nat’l AcadSci USA 93(23)12828-12833;Yuan等人(1995)Proc Nat’l Acad SciUSA 92(14)6630-6634)。
尽管知道植物中存在CPE-FAs至少已经几十年了,但是迄今为止这种具体种类的脂肪酸的生物合成只受到极少的关注。为了理解CPE-FAs的生物合成,Yano等人((1972)Lipids 735-45)用锦葵科的几个种进行了体内标记实验。作者推断,CPE-FA合成途径包括最初由油酸形成二氢苹婆酸,随后二氢苹婆酸去饱和为苹婆酸,他们假定亚甲基通过S-腺苷甲硫氨酸来源于甲硫氨酸(见图1)。他们也表示,不可能对苹婆酸的9,10-三键加成亚甲基直接产生苹婆酸,因为从标记实验中未观察到[1-14C]硬脂炔酸转化为苹婆酸。后来,基本上没有对植物环丙烷脂肪酸合酶的进一步的研究。
已经报告,在臭苹婆种子中,总CPE-FA水平超过总脂肪酸的68%,也存在少量的二氢苹婆酸(Badami和Patil(1981)Prog.Lipid Res.19119-153;Christie(1970)《脂类化学主题》(Topics in LipidChemistry)(Gunstone FD编著;Logos PressLondon)第一卷,1-49页;Sebedio和Gradgirard(1989)Prog.Lipid Res.28303)。油含量约为其干重的55%,发育的苹婆种子似乎是研究CPE-FAs生物合成的理想组织。而且,根据几个假设,推断苹婆种子是植物环丙烷脂肪酸合酶(CPA-FAS)的良好来源。可以推断苹婆酸的生物合成通过一个两步反应发生,它们由两种不同的酶催化,即环丙烷合酶和环丙烷去饱和酶;这一推断是根据体内标记实验(Yano等人(1972)Lipids 735-45)和对细菌中环丙烷合成的了解。也可以推断,来自苹婆的环丙烷合酶与细菌环丙烷合酶有一定程度的相似性。而且,因为苹婆种子含有高水平的油,而且该油含有高水平的高CPE-FAs,可以推断负责CPE-FAs合成的酶的转录水平在发育的种子组织中也适当升高。
苹婆种子含有CPA-FA和CPE-FA合成所需的高水平酶的第一手证据是根据发育的苹婆种子匀浆的体内标记研究(参见实施例2)。当这些匀浆的样品与标记的S-腺苷甲硫氨酸(SAM)温育且脂类产物皂化时,标记的游离脂肪酸是皂化产物中的主要成分(大于90%)。当用醚重氮甲烷衍化并通过C18反向TLC分离后进行分析时,一个放射性斑点与二氢苹婆酸甲酯标准被同时洗脱。因此,表明来自发育的臭苹婆种子的无细胞提取物能够向油酸酯上添加一个来自S-腺苷甲硫氨酸的标记的亚甲基,产生二氢苹婆酸酯。在植物提取物中的这一反应以前未曾报告。其它实验表明,合成CFA-FA的酶是一种膜结合的或是一种整合的膜蛋白,油酰磷脂酰胆碱是该酶的底物。因此,这些结果表明,合成CPA-FA的酶是具有类似于大肠杆菌CPA-FAS的某些特征的CPA-FAS。
根据这一证据,发展了鉴定植物CPA-FAS的策略。该策略开始于观察植物组织中CPA-FAs或CPE-FAs的存在。下一步是组织匀浆的标记研究,以证实组织中实际存在合成CPA-FAs和/或CPE-FAs的能力。下一步是利用由优选地相对高水平地合成环丙烷脂肪酸的组织(对于苹婆而言是发育的种子)制备的cDNA文库,获得大量种子特异的EST。对于苹婆,分析发育的种子的脂肪酸谱,确定CPE-FAs以最高速度积累时的发育阶段;然后用此发育阶段获得的种子制备cDNA文库。对最早一组克隆的第一个小亚组(约10%)测序,由此获得平均阅读长度约为500bp的更小亚组(约7%)。BLAST搜索这一更小亚组,发现并选择丰富的序列(对于苹婆cDNA文库,代表约30%的克隆),然后从剩余的克隆中扣除。然后对扣除后的克隆测序,选择平均阅读长度为500bp的第二亚组。它们也进行BLAST搜索,产生更小的一组EST,它们显示与细菌环丙烷合酶有一定程度的相似性。然后编译这些EST序列,鉴定至少一种推断的植物CPA-FAS。
然后,由重叠的克隆编译至少一种编码推断的植物CPA-FAS的完整cDNA克隆,用来证实编码的序列是一种植物CPA-FAS。证实的方法是该克隆在体外或体内系统中表达,使得CPA-FAs只在克隆表达后产生,或者只在克隆表达后产生含量提高的CPA-FAs。优选地,该系统是体内系统,该克隆转染一种宿主生物并在其中表达。更优选地,该系统通常不产生CPA-FAs,如当宿主生物是酵母株时。再更优选地,该系统具有合适的底物,如油酸,能够耐受异常脂肪酸的存在,如当宿主生物是培养的烟草细胞时。
该策略用于发育苹婆种子,如实施例所述,并且鉴定来自同一基因的23种EST,发现它们与细菌环丙烷合酶有一定的相似性;这些EST沿基因的分布如图3所示。该基因的相对转录物丰度为0.36%,这与苹婆种子中68%的CPE-FA含量一致。一种全长克隆由含有SEQID NO1的EST装配而成(如图4所示)。预测的蛋白质长度为864个氨基酸(SEQ 1D NO2,如图5所示)。因此,该蛋白质比大肠杆菌CPA-FAS大约长470个氨基酸。苹婆CPA-FAS与大肠杆菌序列在重叠区(即羧基端)有49%相似或32%相同。因此苹婆CPA-FAS在氨基端还含有约470个氨基酸。
植物CPA-FAS在酵母和烟草悬浮细胞中的表达导致在这两个系统中合成二氢苹婆酸,特别是在烟草细胞中,其中CPA-FA的含量高达总脂肪酸的6.3%。[1-14C]油酸和L-[甲基-14C]甲硫氨酸产生的放射性有效掺入转基因烟草细胞中的二氢苹婆酸内(见实施例3)。这些标记结果表明,二氢苹婆酸的生物合成是向油酸双键上加成一个亚甲基。该亚甲基来源于甲硫氨酸,最可能的是S-腺苷甲硫氨酸。总之,这些数据清楚地证实,鉴定的苹婆基因编码一种起环丙烷合酶作用的蛋白质。
尽管了解机制对于实施本发明不是必需的,本发明也并非限于任何具体机制,下列关于CPA-FAS及其蛋白质结构和提出的及假定的功能的讨论可进一步了解新发现的蛋白质的生物学。到目前为止,来自大肠杆菌的一种环丙烷合酶(Wang等人(1992)Biochem 31(45)11020-11028)和来自分枝杆菌的三种(cmal、cma2和mma2)密切相关的酶(George等人(1995)J Biol Chem 270(45)27292-27298;Yuan和Barry(1995)Proc Nat′l Acad Sci USA 92(14)6630-6634)已经在功能上证实催化亚甲基从S-腺苷-L-甲硫氨酸向某些脂肪酸的双键的转移。此处报告的苹婆CPA-FAS是从植物中分离的这一类的第一种酶。分枝杆菌的另一组基因(mma1、mma3和mma4)也与大肠杆菌CFA合酶高度同源。但是这些酶将双键转化为几种结构之一(Yuan等人(1997)J.Biol.Chem.27210041-10049),即α-甲基-分支的反式-烯烃-CH(CH3)CHCH-(mmas-1)或α-羟基-甲基(mmas-4)-CH(OH)CH(CH3)-。通过向羟基氧原子而不是向不饱和碳原子上加成另一个亚甲基,α-羟甲基结构能够被转化为α-甲氧基甲基——CH(OCH3)CH(CH3)-。此外,10-甲基硬脂酸或结核硬脂酸是分枝杆菌的一种众所周知的脂肪酸,是由10-亚甲基硬脂酸中间物产生的。Grogan和Cronan(1997,Microbiol.Mol.Biol.Rev.61429-441)描述了这些反应的机制相似性。这在化学水平上易于理解,因为添加来自S-腺苷甲硫氨酸的甲基形成的中间物碳正离子能够容易地再排列,使得活性部位构型的微小改变能够导致产物的不同结构。
苹婆CPA-FAS与其它CPA-FAS和有关甲氧基分枝菌酸合酶的氨基酸序列的对比在图10(A)中显示。所有细菌氨基酸序列都大约是苹婆环丙烷合酶大小的一半,与苹婆基因的羧基端有显著的相似性。提出的S-腺苷甲硫氨酸结合基序(氨基酸残基171-179,使用大肠杆菌编号,苹婆酶中的氨基酸残基627-635)和在催化上重要的半胱氨酸354(苹婆酶中的氨基酸残基822)在所有蛋白质中绝对保守。图10(B)显示这些酶之间的系统发生关系。苹婆和大肠杆菌酶彼此之间比来自分枝杆菌的酶更加密切相关,可能反映这两种酶都作用于酯化为磷脂的单不饱和脂肪酸这一事实(Ohlrogge等人(1976)Biochim.Biophys.Acta 431257-267)。然而,高度相关的一组微生物基因编码添加亚甲基的一系列不同脂肪酸合酶的事实提示,植物CPA-FAS基因能够被修饰,产生相同的产物多样性,从而提高其效用。
苹婆CPA-FAS多肽的氨基端部分(氨基酸1-438)是苹婆环丙烷合酶特有的,因为没有其它已知的环丙烷合酶具有这一部分。与任何已知的蛋白质也没有显著的相似性。然而,苹婆环丙烷合酶的N端一半与拟南芥基因At3g23500有显著的同源性,低于与At3g23520的同源性。这些推断的基因编码暂时被鉴定为色氨酸2-单加氧酶的产物。色氨酸2-单加氧酶属于含黄素的氧化酶类别。色氨酸2-单加氧酶(IaaM)基因产物本身产生吲哚乙酰胺,它们通过水解能够转化为生长素吲哚乙酸。大多数含黄素的蛋白质在蛋白质的N端都有一个高度保守的基序,与FAD的ADP部分的结合有关(Eggink等人,1990;Eberhardt等人,1996;Haigler等人,1996)。提出的基序(G-X-G-X-X-G-X-X-X-A)之前为3或4个疏水残基(Russel,M和Model,P(1988)J.Biol.Chem.2639015-9019)。保守的FAD结合基序存在于苹婆环丙烷合酶的前15个氨基酸中(MGVAVIGGGIQGLVSAYVLAKAGVNVVVYE)。由于认为环丙烷环的形成机制由通过添加来自S-腺苷甲硫氨酸的甲基形成的所述中间物(-CHCH3-CH+-)通过碳正离子机制进行,因此氧化还原系统(如含FAD的蛋白质)不可能参与加成亚甲基的催化反应。因此,苹婆CPA-FAS的氨基端部分不可能参与环丙烷环的形成。CPA-FA合酶多肽在其氨基端似乎含有一种融合的氧化还原蛋白(大约氨基酸1-438),它或许是一种氧化酶。预期该氧化还原蛋白域在二氢苹婆酸去饱和为苹婆酸或者更可能地在伴随苹婆酸形成的-氧化中起作用。
可以认为,二氢苹婆酸通过去饱和转化为苹婆酸(图1)。在使用发育的苹婆种子组织的标记研究中,添加的[14C]硬脂酸,油酸的9,10-乙炔类似物,不被转化为[14C]苹婆酸。另一方面,二氢苹婆酸显然被去饱和为苹婆酸,但是转化率较慢。但是,综上所述,这些数据支持提出的苹婆酸通过二氢苹婆酸去饱和合成的途径。然而,与种子和其它植物组织中苹婆酸生物合成有关的一个异常特征是基本上-氧化。锦葵酸通常是主要的CPE-FA。尽管其它非碳环脂肪酸显示少量的-氧化产物,但是CPE-FA的链通常极大比例的缩短。这种广泛的-氧化似乎是CPE-FA生物合成所特有的。然而,在用苹婆CPA-FAS编码序列转化的烟草细胞系中,在筛选的所有独立转基因烟草细胞系中没有发现17碳或18碳CPA-FAs。17碳CPA-FAs的缺乏被认为是由于16∶1底物的缺乏。18碳CPA-FAs的缺乏表明苹婆CPA-FAS不诱导-氧化,尽管存在明显的氧化还原融合蛋白,预期该蛋白将参与-氧化。然而,预期-氧化的底物是不饱和CPE-FA,而不是饱和CPA-FA。这得到了以下发现的支持在荔枝中,已知种子只有CPA-FAs积累而不含CPE-FA,没有二氢苹婆酸的-氧化产物,尽管可见痕量17碳和15碳 氧化产物(Gaydou等人(1993)J.Agric.FoodChem.41886-890)。
因此,预期苹婆CPA-FAS含有一种具有两种催化活性的天然融合产物一种催化环丙烷脂肪酸的合成(羧基端,大约位于氨基酸439-864),另一种催化具有环碳功能基、最可能的是不饱和环碳环或环丙烯环的脂肪酸的-氧化缩短(氨基端,大约位于氨基酸1-438)。已知融合蛋白,特别是与脂类合成有关的融合蛋白的例子(例如,报告在珊瑚中自然存在一种具有两种酶活性的多肽,其中融合蛋白含有脂加氧酶和氧化丙二烯合酶)(Koljak等人(1997)Science 2771994-1996;Boutand和Brash(1999)J.Biol.Chem.27433764-33770)。
苹婆CPA-FAS是第一个被证实的植物CPA-FAS,尽管最近报告了据说编码环丙烷合成酶(或CFA合酶)的植物核酸序列的推断鉴定(WO99/43827)。该申请描述了据称至少编码几种环丙烷合成酶的一部分的核酸片段;分离这些片段,使用BLAST算法比较随机植物cDNA序列与含有核苷酸和蛋白质序列的公开数据库,进行鉴定。根据与来自结核分枝杆菌(Mycobacterium tuberculosis)或来自大肠杆菌的环丙烷合成酶的相似性,发现编码的蛋白质。这些结果是一组5个核苷酸序列,其中之一是来自玉米的重叠群(由三个克隆装配而成),另外三个是来自菜豆属(Phaseolus)、水稻和大豆的克隆,最后一个是来自小麦的重叠群(由两个克隆装配而成);只有前两个序列似乎编码约386个氨基酸的“完整”蛋白质。第一个“完整”蛋白质被描述为含有氨基酸1-28的信号序列(尽管如何鉴定该信号序列还没有描述)和氨基酸29-386的成熟蛋白质。大肠杆菌CFA合酶氨基酸序列也被描述为与两种“完整”蛋白质分别19.95%和19.2%相似。除了显示与细菌酶有氨基酸序列同源性(从核酸序列预测),该申请不提供证实这些序列实际上编码植物CPA-FAS的任何证据。
然而,似乎WO99/43827描述了实际上不编码植物CFA合酶的核酸序列。这是根据几条推论。首先,预测的苹婆CFA合酶的氨基酸序列长864个氨基酸,或者长度是WO 99/43827所述的“完整”蛋白质的两倍以上。苹婆酶的氨基酸序列与大肠杆菌序列在重叠区的同源性程度似乎高于WO 99/43827所述的“完整”序列。本发明者在实施例3中提供证据表明,苹婆核酸序列转化酵母和植物细胞导致在通常不含这些脂肪酸的组织中产生CPA-FAs;这与WO 99/43827不同,后者根本不提供关于这些序列的表达能导致CPA-FAs出现的任何证据。预测从中分离苹婆核酸序列的来源是该酶的丰富来源,这是根据苹婆种子油中存在高达60%的CPE-FAs,并且根据CPE-FAs来源于CPA-FAs的假设。这不同于WO 99/43827中制备cDNA文库的来源,它们是玉米、菜豆属、水稻、大豆和小麦,已知不含CPA-FAs。最后,有许多依赖S-腺苷甲硫氨酸的甲基转移酶,它们具有类似的DNA和蛋白质序列(如Wang等人(1992)Biochemistry 3111020-11028所述)。因此仅仅序列相似性不足以证明蛋白质的功能和身份。
然而,能够利用苹婆CPA-FAS氨基酸序列发现其它植物CPA-FAS,如下文进一步描述;在一个实施方案中,用下文所述的和实施例5详述的方法发现棉花CPA-FAS的编码序列。
A.植物环丙烷脂肪酸合酶基因本发明提供含有分离的编码植物CPA-FAS的核酸序列的组合物。在有些实施方案中,该序列编码一种锦葵科CPA-FAS;在其它实施方案中,该序列编码一种苹婆CPA-FAS;在其它实施方案中,该序列编码棉花CPA-FAS。在有些实施方案中,该序列含有图4所示的序列(SEQ ID NO1);在其它实施方案中,该序列编码图5所示的氨基酸序列(SEQ ID NO2)。在其它实施方案中,该序列至少含有图14和15所示序列之一(SEQ ID NOs3、4、5、6);在其它实施方案中,该序列至少编码图16所示氨基酸序列之一(SEQ ID NOs7、8、9、10)。在优选实施方案中,本发明的核酸序列编码的CPA-FAS是功能性的,或者具有CPA-FAS活性。
在其它实施方案中,本发明提供含有分离的核酸序列的组合物,该序列编码保留CPA-FAS某些功能特征的植物CPA-FAS的一部分。这些功能特征的例子包括作为免疫原产生识别CPA-FAS的抗体的能力(参见,例如实施例4);在具体实施方案中,该核酸序列编码图13所示的氨基酸序列(SEQ ID NO11)。其它例子包括编码植物CPA-FAS的氨基端或羧基端的核酸序列,假定它们具有分离的和不同的酶促能力;在这些实施方案中,该核酸序列编码植物CPA-FAS的氨基端(在苹婆中约为氨基酸1-438)或植物CPA-FAS的羧基端(在苹婆中约为氨基酸439-864);在具体实施方案中,这些蛋白质片段保留与天然或完整CPA-FAS蛋白结合的酶活性。在其它具体实施方案中,该核酸片段编码SEQ ID NOs7、8、9或10。
在其它实施方案中,本发明提供含有分离的编码植物CPA-FAS的核酸序列的组合物,其中编码的CPA-FAS至少含有SEQ ID NOs2、7、8、9或10中的一个片段,其中编码的CPA-FAS与抗苹婆CPA-FAS抗体有交叉反应性,与苹婆CPA-FAS大小大致相同(长约864个氨基酸)。实施例4描述了一种典型的抗CPA-FAS抗体。苹婆CPA-FAS的大小范围是约800-900个氨基酸。一个氨基酸序列片段含有该氨基酸序列内任何位置存在的至少10个、更优选地20个、再优选地30个、最优选地40个或更多氨基酸残基。此外,一个片段含有该氨基酸序列内任何位置存在的至少20个、更优选地约30个、更优选地约40个、最优选地约50个或更多氨基酸残基,其中该片段还含有至少一个氨基酸缺失或添加或置换,任一片段内氨基酸添加、缺失或置换的总数高达该片段内氨基酸总数的约10%。如果存在一个以上的氨基酸缺失、添加或置换,它们可能是相邻的或不相邻的。优选地,氨基酸置换是保守的。
B.植物环丙烷脂肪酸合酶多肽本发明提供含有纯化的植物CPA-FAS多肽的组合物,以及含有变体(包括其同源物、突变体或片段或融合蛋白)的组合物。在有些实施方案中,该多肽含有一种锦葵科CPA-FAS;在其它实施方案中,该多肽含有一种苹婆CPA-FAS;在其它实施方案中,该多肽含有一种棉花CPA-FAS。在一个实施方案中,该多肽由图4所示的序列(SEQ IDNO1)编码;在其它实施方案中,该多肽含有图5所示的氨基酸序列(SEQ ID NO2)。在其它实施方案中,该多肽由至少含有图14和15所示序列之一(SEQ ID NOs3、4、6)的序列编码;在其它实施方案中,该多肽至少含有图16所示氨基酸序列之一(SEQ ID NOs7和8)。
该多肽催化对不饱和脂肪酸的不饱和中心加成一个亚甲基,包括对酰基的双键加成亚甲基。因此,本发明的植物CPA-FAS是一种能够合成含有环丙烷环的脂肪酸的多肽。
因此,植物CPA-FAS催化下列反应
其中X优选地是甘油脂,最可能的是磷脂,如磷脂酰胆碱。该酶最可能原位作用于脂肪酸,如酯化为脂质的油酸或棕榈油酸,并使用S-腺苷甲硫氨酸(SAM)作为甲基供体。而且,该酶在不同条件下可以利用不同底物,活性程度不同,并且也可以产生其它底物。因此,其它底物可以接受亚甲基,产生的脂肪酰基可能含有一个不饱和碳环。
在本发明的某些实施方案中,该多肽是一种由天然基因在细胞中表达获得的纯化产物,而在其它实施方案中,可能是化学合成方法的一种产物,在其它实施方案中,可能使用原核或真核宿主通过重组技术产生(例如由培养的细菌、酵母、高等植物、昆虫和哺乳动物细胞产生)。在有些实施方案中,根据重组生产方法中使用的宿主,本发明的多肽可能被糖基化或者可能不被糖基化。在其它实施方案中,本发明的多肽也可含有一个起始甲硫氨酸氨基酸残基。
植物环丙烷脂肪酸合酶的测定植物CPA-FAS的活性可以用多种方法测定。一方面,活性测定方法包括在转基因生物中表达编码该合酶的核酸序列,然后分析总脂肪酸的组成。因此,活性在测定为一种转基因生物中内源环丙烷脂肪酸的存在或含量的提高,该生物含有一种外源核酸序列,该序列含有SEQ ID NO1或编码含有SEQ ID NO2所示氨基酸序列的多肽;这些转基因生物如别处所述获得。转基因生物中环丙烷脂肪酸的含量与非转基因生物中的含量相比较。一般分析从转基因生物样品提取的脂质中的脂肪酸;样品在甲醇/氯仿(2∶1,v/v)中匀浆,如Bligh和Dyer(1959)所述提取脂质。
另一方面,测定从一种生物(可能是或者可能不是转基因的)中获得的组织样品中的酶活性。例如,在植物中,组织样品包括但不限于叶样品(如叶盘)、茎和根样品,发育的和成熟的种子胚或胚乳组织。组织样品一般与脂肪酸合成的前体(如14C-乙酸)或与脂肪酸底物(如14C-脂肪酸的铵盐,它们能被吸收并掺入组织脂质中)一起温育,或者与标记的底物(如14C-甲硫氨酸)一起温育。必要时,在温育过程中包括脂类合成的其它辅因子;这些辅因子包括但不限于ATP、CoA、MgCl2和SAM。此外,组织样品也可与标记的SAM温育。温育通常在室温下在缓冲溶液(如pH7.2的0.1M磷酸钾)中进行适当的一段时间。然后用缓冲液洗涤样品,组织样品在甲醇/氯仿(2∶1,v/v)中匀浆,如Bligh和Dyer(1959)所述提取脂质。
另一方面,测定从一种生物获得的亚细胞级分的酶活性,该生物可能是或者可能不是转基因的(转基因生物如别处所述),其中组织被破坏产生无细胞级分。例如,在植物中,亚细胞级分可以从上述任何一类组织中获得,包括整个细胞和微粒体膜、质体和质体膜级分。这些级分的制备在本领域公知。亚细胞级分然后与脂肪酸(如14C-脂肪酸的铵盐,它们能被吸收并掺入组织脂质中)温育。此外,亚细胞级分也与标记的SAM温育。需要时,在温育过程中包括脂类合成的其它辅因子;这些辅因子包括但不限于ATP、CoA、MgCl2、溶血磷脂,如lysoPC,和SAM。也可添加可增强脂类合成的其它试剂;这些试剂包括磷脂脂质体(例如,含有磷脂酰胆碱)和脂转移蛋白。温育样品,如上所述提取脂质。
另一方面,测定体外核酸表达系统的酶活性,其中加入含有SEQID NO1或编码含SEQ ID NO2所示氨基酸序列的多肽的核酸序列,并表达编码的酶。这些表达系统在本领域周知,例如网织红细胞裂解物或麦胚。因为该酶可能是一种不稳定的蛋白质,甘油脂的存在能够使其稳定,所以在混合物中包含微团或膜结构,在蛋白质合成期间或之后可以向混合物中掺入该酶。而且,因为该酶可能原位作用于酯化为脂质的脂肪酸,这些微团结构优选地从具有有关脂类合成能力的来源获得,如来自植物组织的微粒体,其中该植物不含内源环丙烷脂肪酸合酶,但是具有向甘油脂内掺入标记的脂肪酸底物的能力。直接和定量测定需要向微团或膜结构内掺入标记的脂质,并保证脂肪酸底物的掺入不是限定性的。然后如上对于亚细胞级分所述分析新表达的酶。
提取的植物CPA-FAS的脂质产物用本领域公知的方法分析。例如,脂肪酸甲酯由一等份提取的脂质级分制备,方法包括在N2下蒸发该等份中的溶剂,将脂质重悬浮于等体积的1%甲醇钠的甲醇溶液(w/w)和庚烷溶液中。用酸性条件破坏脂肪酸中的环丙烷和环丙烯基,含有这些酸的脂质样品最好与碱性试剂酯交换;游离脂肪酸能够用重氮甲烷安全地甲基化(Christie(1982)《脂质分析》(Lipid Analysis),第二版,55页)。然后将脂肪酸甲酯抽提到己烷中,分离,对于放射性样品,通过TLC、GC或GC/MS测定每个不同级分中的放射性(参见,如实施例1所述)。
植物环丙烷脂肪酸合酶的纯化在本发明的某些实施方案中,提供从生物中纯化的植物CPA-FAS多肽;这些生物可以是转基因生物,含有异源植物CPA-FAS基因。本发明提供一种纯化的植物CPA-FAS多肽,及其变体、同源物、突变体或融合蛋白,如别处所述。
本发明也提供从一种生物中回收和纯化植物CPA-FAS的方法;这些生物包括单细胞和多细胞生物。一般而言,首先破坏细胞,在随后的酶纯化前分级分离;破坏和分级分离方法众所周知。纯化方法也是众所周知的,包括但不限于硫酸铵或乙醇沉淀,酸抽提,阴离子或阳离子交换层析,磷酸纤维素层析,疏水相互作用层析,亲和层析,羟磷灰石层析和凝集素层析。
可以预期,根据大肠杆菌环丙烷脂肪酸合酶(CFA合酶)推断,植物CPA-FAS是不稳定的(Grogan,DW和Cronan,JW Jr.(1997)Microbiol Molec Biol Reviews 61(4)429-441)。大肠杆菌酶极其不稳定,因此当通过超速离心除去大肠杆菌粗提物的内源脂质时,在30℃温育30分钟后只有最初CFA合酶活性的不到1%得以保留,其不稳定性严重阻碍了该酶的纯化和深入研究。应当指出,该酶与膜片段和磷脂囊泡可逆地结合,这种结合是参考文献发表时确定的稳定CFA合酶的普遍有效的唯一方法。因此,预期在一个实施方案中,本发明的植物CPA-FAS如对于细菌CFA合酶所述纯化(Grogan,DW和Cronan,JW Jr.(1997)Microbiol Molec Biol Reviews 61(4)429-441)。该方案包括细胞的破坏(例如通过弗氏压碎器或匀浆),高速离心除去细胞碎片(如150,000g约2h),从获得的上清液中沉淀蛋白质,例如加入硫酸铵至约40%饱和,离心收集沉淀的蛋白质(例如10,000g约15min),从重悬浮的蛋白质沉淀中除去残余的硫酸铵(例如通过凝胶过滤),酶的脂质体浮选(flotation),以及随后通过蔗糖梯度离心纯化脂层。
本发明还提供含有与一种标记序列框内融合的本发明的编码序列(例如SEQ ID NO1)的核酸序列,该标记序列允许本发明的多肽的表达或表达和纯化。标记序列的一个非限制性例子是六组氨酸尾,它可由一种载体提供,例如pQE-30载体,它向植物CPA-FAS的N端添加一个六组氨酸尾,在细菌宿主中导致多肽表达,更优选的是载体PT-23B,它向植物CPA-FAS的C端添加一个六组氨酸尾,在细菌宿主中导致更容易地纯化与该标记融合的多肽,或者例如,当使用哺乳动物宿主时,标记序列可以是血凝素(HA)标签。HA标签对应于来自流感血凝素蛋白的一个表位(Wilson等人(1984)Cell,37767)。
植物环丙烷脂肪酸合酶的化学合成在本发明的一个备选实施方案中,使用本领域公知的化学方法,全部或部分地合成植物CPA-FAS的编码序列(参见,例如Caruthers等人(1980)Nucl.Acids Res.Symp.Ser.,7215-233;Crea和Horn(1980)Nucl.Acids Res.,92331;Matteucci和Caruthers(1980)Tetrahedron Lett.,21719;Chow和Kempe(1981)Nucl.Acids Res.,92807-2817)。在本发明的其它实施方案中,利用化学方法合成完整的植物CPA-FAS氨基酸序列或其部分,产生蛋白质本身。例如,利用固相技术合成肽,从树脂上切下,通过高效液相层析纯化(参见,例如Creighton(1983)《蛋白质结构与分子原理》(Proteins Structures AndMolecular Principles),W H Freeman and Co,New York N.Y.)。在本发明的其它实施方案中,合成肽的组成通过氨基酸分析或测序证实(参见,例如Creighton,同上)。
直接肽合成能够用不同固相技术进行(Roberge等人(1995)Science,269202-204),例如使用ABI 431A肽合成仪,根据厂商提供的说明书,可以完成自动合成。另外,植物CPA-FAS的氨基酸序列或其任何部分在直接合成过程中可以改变,和/或利用化学方法与其它序列组合,产生一种变异的多肽。
植物环丙烷脂肪酸合酶抗体的产生在本发明的一些实施方案中,产生抗体,用于植物CPA-FAS蛋白的检测和表征。抗体可以用不同免疫原制备。在一个实施方案中,免疫原是一种苹婆CPA-FAS肽(例如,如SEQ ID NO2所示的氨基酸序列,或其片段),产生可识别苹婆CPA-FAS的抗体。这些抗体包括但不限于多克隆、单克隆、嵌合、单链、Fab片段和Fab表达文库。
可以利用本领域公知的多种方法生产抗植物CPA-FAS的多克隆抗体。为了生产抗体,能够通过注射对应于植物CPA-FAS表位的肽,免疫不同的宿主动物,包括但不限于兔、小鼠、大鼠、绵羊、山羊等。在一个优选实施方案中,肽与一种免疫原性载体(例如白喉类毒素、牛血清白蛋白(BSA)或匙孔戚血蓝蛋白(KLH))偶联。可以用多种佐剂增强免疫应答,这取决于宿主种,包括但不限于弗氏(完全和不完全)、矿物凝胶(例如氢氧化铝)、表面活性物质(例如溶血卵磷脂、pluronic多元醇、聚阴离子、肽、油乳剂、匙孔戚血蓝蛋白、二硝基苯酚和可能有用的人用佐剂,如BCG(卡介苗)和小棒状杆菌(Corynebacteriumparvum)。
为了制备抗植物CPA-FAS的单克隆抗体,预期本发明可以使用由培养的连续细胞系产生抗体分子的任何技术(参见,例如Harlow和Lane,《抗体实验室手册》(AntibodiesA Laboratory Manual),Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY)。包括但不限于最早由Kohler和Milstein(Kohler和Milstein(1975)Nature,256495-497)发展的杂交瘤技术,以及trioma技术,人B细胞杂交瘤技术(参见,例如Kozbor等人(1983)Immunol.Tod.,472),以及产生人单克隆抗体的EBV-杂交瘤技术(Cole等人(1985)《单克隆抗体与癌症治疗》(Monoclonal Antibodies and Cancer Therapy),Alan R.Liss,Inc.,pp.77-96)。
另外,可以预期,描述的生产单链抗体的技术(美国专利4,946,778)可以用于生产植物CPA-FAS特异的单链抗体。本发明的另一个实施方案使用描述的构建Fab表达文库的技术(Huse等人(1989)Science,2461275-1281),以允许快速且容易地鉴定具有希望的植物CPA-FAS特异性的单克隆Fab片段。
可以预期,适于生产抗体片段的任何技术都可以用来生产含有抗体分子的独特型(抗原结合区)的抗体片段。例如,这些片段包括但不限于通过胃蛋白酶消化抗体分子能够产生的F(ab′)2片段;通过还原F(ab′)2片段的二硫键能够产生的Fab′片段;和用木瓜蛋白酶和还原剂处理抗体分子能够产生的Fab片段。
在抗体的生产中,预期希望的抗体的筛选通过本领域公知的技术完成(例如放射免疫测定、ELISA(酶联免疫吸附测定)、“夹心”免疫测定、免疫放射测定、凝胶扩散沉淀反应、免疫扩散测定、原位免疫测定(例如使用胶体金、酶或放射性同位素标记)、Western印迹法、沉淀反应、凝集测定(例如凝胶凝集测定、血细胞凝集测定等、补体结合测定、免疫荧光测定、蛋白A测定和免疫电泳测定等。
在一个实施方案中,通过检测第一抗体上的标记物检测抗体的结合。在另一个实施方案中,通过检测第二抗体或试剂与第一抗体的结合检测第一抗体。在另一个实施方案中,第二抗体被标记。通过免疫测定检测结合的多种方法在本领域公知,在本发明的范围内。如本领域公知,免疫原性肽应当不含许多免疫方案中使用的载体分子。例如,如果该肽与KLH偶联,在筛选测定中它可以与BSA偶联或者直接使用。
在本发明的某些实施方案中,在本领域公知的与植物CPA-FAS表达有关的方法(例如Western印迹分析)中使用上述抗体,测定它在适当生物样品中的水平等。能够利用这些抗体检测植物生物样品中的植物CPA-FAS。生物样品可以是组织提取物,或为了镜检而固定的样品。
然后利用适当的策略(例如ELISA或放射免疫测定)和形式(例如微孔、dipstick(如国际专利公开文本WO 93/03367所述)等直接检测生物样品中植物CPA-FAS的存在。此外,样品中的蛋白质也能够在存在或不存在十二烷基硫酸钠(SDS)的条件下大小分离(例如通过聚丙烯酰胺凝胶电泳(PAGE)),植物CPA-FAS的存在通过免疫印迹法(Western印迹法)检测。使用针对对应于蛋白质表位的肽的抗体的免疫印迹技术通常更加有效,因此特别适于本发明。
II.鉴定植物CPA-FAS基因和有关植物基因的方法本发明的一些实施方案涉及分离编码植物CPA-FAS的核酸序列的方法,这是根据植物组织、优选地种子组织中存在CPA-FAs和/或CPE-FAs即表明存在CPA-FAS的假说。这些方法包括,首先由产生相对高水平的CPA-FAs或CPE-FAs的组织制备cDNA文库。这些方法然后包括从文库中扣除高丰度的序列,对其余的文库克隆测序,比较编码的氨基酸序列与大肠杆菌CPA-FAS或苹婆CPA-FAS的氨基酸序列,选择推断的CPA-FAS候选ESTs。这些方法然后包括,装配编码推断的完整植物CPA-FAS的克隆,表征这样发现的这些序列的表达产物。
此外,这些方法也包括,首先检查植物表达序列标签(EST)数据库,以发现新的可能的CPA-FAS编码序列。优选地,EST数据库的植物来源包括植物组织、如种子组织中的CPA-FAs和/或CPE-FAs。在有些实施方案中,植物EST数据库的检查包括用苹婆CPA-FAS的氨基酸序列(例如SEQ ID NO2)blast搜索该数据库,以发现编码与苹婆CPA-FAS蛋白同源的氨基酸序列的EST。在其它一些实施方案中,这些方法包括,然后装配成编码推断的完整植物CPA-FAS的克隆,表征这样发现的这些序列的表达产物。在其它实施方案中,这些方法然后包括,对可能的候选序列测序,表征这样发现的这些序列的表达产物。
使用这些方法导致苹婆CPA-FAS的发现,如说明性实施例所述。分离的新编码序列被证实编码植物环丙烷脂肪酸合酶,如说明性实施例所述。可以预期,这些方法也能够用来从已知含有CPA-FAs和CPE-FAs的植物中发现其它CPA-FAS。典型植物包括来自锦葵科、梧桐科、木棉科、Tilaceae、含羞草科和无患子科的植物。具体而言,预期通过这些方法可鉴定并分离来自棉花的CPA-FAS。因此,使用这些方法导致棉花CPA-FAS编码序列的发现,如说明性实施例所述。棉花组织证实含有环丙烷和环丙烯脂肪酸(CPA-FAs和CPE-FAs),其中有些组织(如根和茎)含有相对高水平的这些脂肪酸(分别可达约30%、约35%)。而且,棉花组织证实含有可与抗苹婆CPA-FAS抗体交叉反应的蛋白质,其中该蛋白质的大小与苹婆CPA-FAS大致相同,该蛋白质的组织分布通常与组织中的CPA-FAs和CPE-FAs的含量相符。
编码苹婆CPA-FAS的核苷酸序列和苹婆CPA-FAS的推断的氨基酸序列在图4中显示(分别为SEQ ID NOs 1和2)。通过本领域公知的方法利用苹婆CPA-FAS编码序列定位和分离苹婆CPA-FAS基因;因此,通过本发明的方法发现的植物CPA-FAS编码序列也能够用来通过相同的方法定位和分离其它植物基因。为了分离该基因,利用32P-放射性标记的CPA-FAS编码序列(或cDNA)通过DNA-DNA杂交筛查由苹婆基因组DNA构建的基因组或cDNA文库。检测为杂交阳性的分离的单克隆预计含有部分或全部CPA-FAS基因,并且测序。这些阳性克隆的苹婆基因组DNA的序列用来证实该基因是一种植物CPA-FAS。如果一个具体克隆只编码基因的一部分,则分离并测序检测为与CPA-FAS编码序列(或cDNA)杂交阳性的其它克隆。利用CPA-FAS基因全长序列与cDNA的比较确定内含子的位置(如果它们存在的话)。
也能够利用苹婆CPA-FAS鉴定和分离有关的植物基因。一个例子是,可以认为CPE-FA通过CPA-FA的去饱和而合成。尽管用CPA-FAS转化的苹婆烟草细胞系产生CPA-FA(二氢苹婆酸),但是它们似乎不产生CPE-FA(苹婆酸)。因此,似乎鉴定的苹婆CPA-FAS不会使CPA-FA去饱和为CPE-FA,而另一种苹婆多肽负责去饱和CPA-FA。负责该活性的核酸序列根据上述关于鉴定CPA-FAS编码序列的方法鉴定并分离,不同之处在于使用去饱和酶氨基酸序列作为同源性比较的基础。预期该去饱和酶与一种FAD2或P450酶同源。然后如实施例所述,用候选序列共转化已经用苹婆CPA-FAS转化的烟草细胞系,如实施例所述分析脂肪酸产物。转基因细胞系中CPE-FA的存在证实候选序列是一种CPA-FA去饱和酶。
III.其它植物环丙烷脂肪酸合酶基因本发明提供分离的编码植物CPA-FAS的核酸序列。例如,本发明的一些实施方案提供分离的多核苷酸序列,这些序列在低到高严格条件下能够与SEQ ID NOs1、3和/或6杂交,只要能够杂交的多核苷酸序列编码保留植物CPA-FAS的希望的生物活性的蛋白质。在优选实施方案中,杂交条件以核酸结合复合物的解链温度(Tm)为基础,并具有如上所述定义的“严格性”(参见,例如Wahl等人(1987)Meth.Enzymol.,152399-407,在此引用作为参考)。
在其它实施方案中,提供了一种分离的编码植物CPA-FAS的核酸序列,它与苹婆CPA-FAS同源;在有些实施方案中,该序列从锦葵科、梧桐科、木棉科、Tilaceae、含羞草科和无患子科的植物中获得。在具体实施方案中,这些序列从棉花中获得;这些序列至少含有SEQID NOs3、4、6之一。
在本发明的其它实施方案中,提供植物CPA-FAS的等位基因。在优选实施方案中,等位基因是由于突变(即核酸序列的改变)产生的,通常产生改变的mRNA或结构或功能可能改变或不改变的多肽。任何特定基因可能没有、有一个或多个等位基因形式。产生等位基因的常见突变通常是由于核酸的缺失、添加或置换。所有这些改变类型均可在特定序列中以一倍或几倍的速度单独发生,或者与其它类型组合发生。
在本发明的其它实施方案中,通过本领域公知的多种方法,使用核苷酸序列(例如SEQ ID NO1)延伸编码植物CPA-FAS的多核苷酸序列,以检测上游序列,如启动子和调节元件。例如,预期本发明可使用聚合酶链反应(PCR)。这是一种直接法,它使用通用引物获得(retrieve)与已知基因座相邻的未知序列(Gobinda等人(1993)PCRMethods Applic.,2318-322)。首先,在接头序列的引物和已知区域特异的引物存在下扩增基因组DNA。扩增的序列然后进行第二轮PCR,其中使用相同的接头引物和在第一种引物内部的另一种特异引物。每一轮PCR的产物都用适当的RNA聚合酶转录,并用反转录酶测序。
在另一个实施方案中,使用基于已知区域的趋异(divergent)引物,利用反向PCR扩增或延伸序列(Triglia等人(1988)Nucleic Acids Res.,168186)。引物可以用Oligo 4.0(National Biosciences Inc,PlymouthMinn.)或另一种适当的程序设计为例如长22-30个核苷酸,GC含量为50%或更高,在约68-72℃时与靶序列退火。该方法使用几种限制性内切酶产生位于基因已知区域内的适当片段。该片段然后通过分子内连接环化,并用作PCR模板。在本发明的另一个实施方案中使用捕获PCR(Lagerstrom等人(1991)PCR Methods Applic.,1111-119)。这是PCR扩增与人和酵母人工染色体(YAC)DNA内已知序列相邻的DNA片段的一种方法。捕获PCR也需要多次限制性内切酶消化和连接,以在PCR前将构建的双链序列置于DNA分子的未知部分内。在其它实施方案中使用步移PCR。步移PCR是一种定向基因步移的方法,可以获得未知序列(Parker等人(1991)Nucleic Acids Res.,193055-60)。PROMOTERFINDER试剂盒(Clontech)利用PCR、巢式引物和具体文库在基因组DNA中“步移”。该方法不需要筛查文库,可用于发现内含子/外显子连接。在本发明的其它实施方案中,加尾(add TAIL)PCR作为获得侧翼基因组区(包括调节区)的一种优选方法(Lui和Whittier,(1995);Lui等人(1995))。
用于筛选全长cDNA的优选文库包括经过大小选择以包含较大cDNA的文库。随机引物文库也是优选的,因为它们含有更多的包含5’和上游基因区的序列。如果oligo d(T)文库不产生全长cDNA,随机引物文库是特别有用的。基因组文库可用于获得内含子及延长5′序列。
IV.变异的植物环丙烷脂肪酸合酶在有些实施方案中,本发明提供公开的编码植物CPA-FAS的核酸序列的分离的变体,和由其编码的多肽;这些变体包括植物CPA-FAS的突变体、片段、融合蛋白或功能相当物。因此,为了因多种原因改变植物CPA-FAS编码序列,构建本发明的核苷酸序列,包括但不限于改变基因产物的克隆、加工和/或表达的改变(这些改变包括插入新的限制酶切位点,改变糖基化模式,改变密码子偏好性(preference),以及改变酶活性(这些改变包括但不限于底物亲和力不同,底物偏好和利用不同,抑制剂亲和力或有效性不同,反应动力学不同,亚细胞定位不同,蛋白质加工和/或稳定性不同)。例如,引入可改变底物特异性的突变,使得优选的底物改变。
在其它实施方案中,本发明提供分离的编码植物CPA-FAS的核酸序列,其中编码的合酶与含有SEQ ID NO2的氨基酸序列的蛋白质竞争结合不饱和脂肪酸底物。
植物环丙烷合酶的突变体本发明的一些实施方案提供植物CPA-FAS的突变形式(即突变蛋白)。在优选实施方案中,变体由于突变(即核酸序列的改变)产生,通常产生改变的mRNA或结构或功能可能改变或者可能不变的多肽。任何特定基因都可能没有、有一个或多个突变形式。产生变体的常见突变通常是由于核酸的缺失、添加或置换。所有这些改变类型都可在特定序列中以一倍或几倍的速度单独发生,或者与其它类型组合发生。
预期能够修饰具有活性(例如植物CPA-FAS活性)的肽的结构,目的在于提高合成活性,或者改变植物CPA-FAS对特定脂肪酸底物的亲和力。这些修饰的肽被认为是具有如此处定义的植物CPA-FAS活性的肽的功能相当物。能够产生一种修饰的肽,其中编码该多肽的核苷酸序列已经改变,如置换、缺失或添加。在本发明的一些优选实施方案中,这种改变提高了合成活性,或者改变了植物CPA-FAS对特定脂肪酸底物亲和力。在特别优选的实施方案中,这些修饰不会显著降低修饰的酶的合成活性。换句话说,能够评价构建体“X”,以确定它是否是如功能上而不是结构上定义的本发明的修饰或变异植物CPA-FAS种类的一员。在优选实施方案中,变异植物CPA-FAS的活性用实施例3所述的方法评价。因此,在有些实施方案中,本发明提供编码植物CPA-FAS的核酸,它与SEQ ID NO1的编码区互补。在其它实施方案中,本发明提供编码植物CPA-FAS的核酸,它与SEQ IDNO1编码的蛋白质竞争结合脂肪酸底物。
在一个实施方案中,进行位点特异性诱变来修饰植物CPA-FAS的催化活性,从对双键的亚甲基加成到位点10的亚甲基加成,如已知tubercuolic acid的合成所发生的。修饰的酶将产生含有侧(pendant)乙烯基的脂肪酸,它是工业衍生的一个有价值的平台。而且,脂肪酸产物的氢化将定量转化为甲基分支的饱和物。
如上所述,植物CPA-FAS的突变形式也被视为与此处详述的肽和DNA分子相当。例如,分别用异亮氨酸或缬氨酸替换亮氨酸,用谷氨酸替换天冬氨酸,用丝氨酸替换苏氨酸,或者用结构相关的氨基酸类似地替换氨基酸(即保守突变),预期对产生的分子的生物活性没有重要影响。因此,本发明的一些实施方案提供此处公开的含有保守置换的植物CPA-FAS的变体。保守置换在侧链相关的氨基酸家族内发生。遗传编码的氨基酸可分为4个家族(1)酸性(天冬氨酸,谷氨酸);(2)碱性(赖氨酸,精氨酸,组氨酸);(3)非极性(丙氨酸,缬氨酸,亮氨酸,异亮氨酸,脯氨酸,苯丙氨酸,甲硫氨酸,色氨酸);和(4)不带电荷的极性(甘氨酸,天冬酰胺,谷氨酰胺,半胱氨酸,丝氨酸,苏氨酸,酪氨酸)。苯丙氨酸、色氨酸和酪氨酸有时一起被分类为芳族氨基酸。以类似的方式,氨基酸的所有成分(repertoire)能够被分组为(1)酸性(天冬氨酸,谷氨酸);(2)碱性(赖氨酸,精氨酸,组氨酸);(3)脂肪族(甘氨酸,丙氨酸,缬氨酸,亮氨酸,异亮氨酸,丝氨酸,苏氨酸),丝氨酸和苏氨酸任选地被单独分类为脂肪族羟基;(4)芳族(苯丙氨酸,酪氨酸,色氨酸);(5)酰胺(天冬酰胺,谷氨酰胺);和(6)含硫(半胱氨酸和甲硫氨酸)(例如,Stryer编著(1981)《生物化学》(Biochemistry),17-21页,第二版,WH Freeman and Co.)。通过评价变异肽以类似于野生型蛋白质的方式起作用的能力,能够容易地确定肽氨基酸序列的改变是否产生功能同源物。含有一个以上置换的肽能够用相同的方法检测。
更少见的是,一种变体包含“非保守”改变(例如,用色氨酸置换甘氨酸)。类似的较小变异也可包括氨基酸缺失或插入或这两者。确定哪一种氨基酸残基能够被置换、插入或删除而不消除生物活性的指导能够用计算机程序发现(例如LASERGENE软件,DNASTAR Inc.,Madison,Wis.)。
植物CPA-FAS的突变体能够用本领域公知的任何合适的方法产生,包括但不限于定点诱变、随机“点”诱变和结构域交换(domain-swap)诱变,其中苹婆CPA-FAS cDNA的部分与其它植物或细菌CPA-FAS编码cDNA的类似部分“交换”(Back和Chappell(1996)PNAS936841-6845)。
变体的产生可以使用如定向进化等方法或产生变体组合文库的其它技术。因此,本发明进一步涉及产生植物CPA-FAS蛋白的几组组合突变体以及截短突变体的方法,尤其可用于鉴定具有CPA-FAS生物活性(例如CPA-FAs的合成)的可能的变体序列(即同源物)。另外,通过筛查这些组合文库,例如产生同时具有新型底物特异性或其它生物活性的新的植物CPA-FAS同源物;下面描述了底物特异性的例子。
可以预期,植物CPA-FAS核酸(例如SEQ ID NO1及其片段和变体)能够用作定向进化的起始核酸。这些技术能够用来发展具有希望的特性(如提高的合成活性或改变的对特定脂肪酸底物的亲和力)的植物CPA-FAS变体。
在有些实施方案中,通过随机诱变进行人工进化(例如使用易错PCR向特定编码序列内引入随机突变)。该方法需要微调突变频率。一般说来,有益的突变极少,而有害的突变常见。这是因为有害突变和有益突变的组合通常产生一种无活性的酶。靶基因的碱基置换的理想数量是1.5-5(Moore和Arnold(1996)Nat.Biotech.,14,458-67;Leung等人(1989)Technique,111-15;Eckert和Kunkel(1991)PCRMethods Appl.,117-24;Caldwell和Joyce(1992)PCR Methods Appl.,228-33;Zhao和Arnold(1997)Nuc.Acids.Res.,251307-08)。诱变后根据希望的活性筛选获得的克隆(例如,如下所述根据CPA-FAS活性筛选)。为了研制具有希望的特性的酶,连续几轮诱变和筛选通常是必需的。应当指出,只有有用的突变才进行下一轮诱变。
在本发明的其它实施方案中,本发明的多核苷酸用于基因改组或有性PCR方法(例如Smith(1994)Nature,370324-25;美国专利号5,837,458;5,830,721;5,811,238;5,733,731)。基因改组包括随机破碎几个突变DNA,随后PCR重装配为全长分子。不同基因改组方法的例子包括但不限于DNase处理后装配,交错延伸法(STEP)和随机引发体外重组。在DNase介导的方法中,从一组阳性突变体中分离的DNA片段用DNaseI酶切为随机片段,不加引物进行多轮PCR。随机片段的长度接近PCR循环继续进行时未酶切的片段,使得不同克隆中存在的突变在获得的一些序列中混合并积累。多个循环的筛选和改组使几种酶的功能增强(Stemmer(1994)Nature,370398-91;Stemmer(1994)Proc.Natl.Acad.Sci.USA,91,10747-10751;Crameri等人(1996)Nat.Biotech.,14315-319;Zhang等人(1997)Proc.Natl.Acad.Sci.USA,944504-09;和Crameri等人(1997)Nat.Biotech.,15436-38)。定向进化产生的变体能够用下面所述的方法(参见实施例3)根据CPA-FAS活性筛选。
同源物本发明的其它实施方案提供分离的编码植物CPA-FAS同源物的核酸序列,和它们编码的多肽。植物CPA-FAS的一些同源物的细胞内半衰期显著不同于相应的野生型蛋白质。例如,改变的蛋白质对蛋白质分解降解或导致植物CPA-FAS破坏或灭活植物CPA-FAS的其它细胞方法更加稳定或者更不稳定。能够利用这些同源物和编码它们的基因,通过调节蛋白质的半衰期,改变植物CPA-FAS的活性。例如,短的半衰期能够产生更短暂的植物CPA-FAS生物效应。其它同源物具有类似于野生型植物CPA-FAS或者在一个或多个方面不同于野生型植物CPA-FAS的特征。
由cDNA推断的苹婆CPA-FAS的氨基酸序列与cDNA推断的其它已知细菌CPA-FAS或CPA-FAS-样蛋白质的氨基酸序列相比较,如图10所示。提出的S-腺苷甲硫氨酸结合基序(氨基酸残基171-179,使用大肠杆菌编号,苹婆酶中的氨基酸残基627-635)和催化上重要的半胱氨酸(氨基酸残基354,使用大肠杆菌编号,苹婆酶中的氨基酸残基822)在所有蛋白质中都保守。因此,在有些实施方案中,本发明提供一种植物CPA-FAS,其至少含有氨基酸基序V-L-D-I-G-C-G-W-G(S-腺苷甲硫氨酸结合基序,对应于苹婆酶中的氨基酸残基627-635)或与之对应的核酸序列。在本发明的其它实施方案中,设想通过比较基序筛选可能编码植物CPA-FAS同源物的核酸序列。在有些实施方案中,能够分析推断的氨基酸序列中氨基酸基序V-L-D-I-G-C-G-W-G(S-腺苷甲硫氨酸结合基序,对应于苹婆酶中的氨基酸残基627-635)的存在。
在本发明的组合诱变方法的一些实施方案中,排比一群植物CPA-FAS同源物的氨基酸序列,优选地使最高同源性成为可能。变体群体可包括,例如来自一个或多个种的植物CPA-FAS同源物,或者来自同一个种但是由于突变而不同的植物CPA-FAS同源物。选择在排比的序列的每个位点处出现的氨基酸,产生一组简并的组合序列。
在本发明的一个优选实施方案中,组合植物CPA-FAS文库通过编码多肽库的基因的简并文库产生,它们均至少包含候选植物CPA-FAS-蛋白序列的一部分。例如,合成寡核苷酸的混合物酶促连接到基因序列内,使得这组简并的候选植物CPA-FAS序列可表达为单个多肽,或者表达为含有该组植物CPA-FAS序列的一组较大的融合蛋白(例如噬菌体文库)。
有许多方法,通过它们能够由简并寡核苷酸序列产生可能的植物CPA-FAS同源物的文库。在一些实施方案中,简并基因序列的化学合成用自动DNA合成仪进行,合成的基因连接到适当的基因中进行表达。一组简并基因的目的在于在一种混合物中提供编码希望的一组可能的植物CPA-FAS序列的所有序列。简并寡核苷酸的合成在本领域众所周知(参见,例如Narang(1983)Tetrahedron Lett.,393-9;Itakura等人(1981)“重组DNA”,Walton(编著),《第三届克利夫兰大分子论坛论文集》(Proceedings of the 3rd Cleveland Symposium onMacromolecules),Elsevier,Amsterdam,pp 273-289;Itakura等人(1984)Annu.Rev.Biochem.,53323;Itakura等人(1984)Science1981056;Ike等人(1983)Nucl.Acid Res.,11477)。这些技术已经用于其它蛋白质的定向进化(参见,例如Scott等人(1980)Science,249386-390;Roberts等人(1992)Proc.Natl.Acad.Sci.USA,892429-2433;Devlin等人(1990)Science,249404-406;Cwirla等人(1990)Proc.Natl.Acad.Sci.USA,876378-6382;以及美国专利号5,223,409、5,198,346和5,096,815)。
植物环丙烷脂肪酸合酶的截短突变体另外,本发明还提供分离的编码植物CPA-FAS片段(例如截短突变体)的核酸序列,和这些核酸序列编码的多肽。在优选实施方案中,植物CPA-FAS片段具有生物活性。如上所述,苹婆CPA-FAS预期是具有不同催化活性的两个多肽片段的自然融合体;这两个片段催化CPA-FA的形成(羧基端,或约氨基酸397或约20氨基酸到末端的片段)或-氧化或类似的反应(氨基端,或从开始到约氨基酸397约20氨基酸的片段)。因此,预期苹婆CPA-FAS能够通过众所周知的方法截短为羧基端片段和氨基端片段(尽管每种截短片段可能彼此有大量氨基酸重叠)。预计两个结构域之间的截短位点位于氨基酸393-401区内。进一步预计这些不同的片段将具有赋予的催化活性。
在本发明的一些实施方案中,当希望表达植物CPA-FAS蛋白的一部分时,向含有欲表达的序列的寡核苷酸片段中添加一个起始密码子(ATG)可能是必要的。本领域周知,N端位点的甲硫氨酸能够用甲硫氨酸氨肽酶(MAP)酶切下来。MAP已经从大肠杆菌(Ben-Bassat等人(1987)J.Bacterioi.,169751-757)和鼠伤寒沙门氏菌(Salmonellatyphimurium)中克隆,其体外活性已经在重组蛋白上证实(Miller等人(1990)Proc.Natl.Acad.Sci.USA,842718-1722)。因此,希望时,通过在产生MAP的宿主(例如大肠杆菌或CM89或酿酒酵母)中表达这些重组多肽能够在体内实现N端甲硫氨酸的去除,或者通过使用纯化的MAP在体外实现。
含有植物环丙烷脂肪酸合酶的融合蛋白本发明也提供编码掺有全部或部分植物CPA-FAS的融合蛋白的核酸序列,和这些核酸序列编码的多肽。在一些实施方案中,该融合蛋白含有一个植物CPA-FAS功能域,以及一个融合配偶体。因此,在本发明的某些实施方案中,多肽的编码序列(例如植物CPA-FAS功能域)作为融合基因的一部分掺入,包含编码不同多肽的核苷酸序列。在一个实施方案中,一种融合产物多肽将不饱和脂肪酸转化为CPA-FA(具有合成CPA-FA能力的一种融合配偶体)。在另一个实施方案中,一种融合产物多肽将不饱和脂肪酸转化为偶碳数量的CPA-FA(具有合成CPA-FA能力的一种融合配偶体,和能够从CPA-FA上除去一个碳的第二种融合配偶体)。在另一个实施方案中,一种融合产物多肽将不饱和脂肪酸转化为CPE-FA(具有合成CPA-FA能力的一种融合配偶体,和具有去饱和CPA-FA能力的第二种融合配偶体)。在另一个实施方案中,一种融合产物多肽将不饱和脂肪酸转化为偶碳数量的CPE-FA(具有合成CPA-FA能力的融合配偶体,具有去饱和CPA-FA能力的第二种融合配偶体,和能够从CPA-FA上除去一个碳的第三种配偶体)。
在本发明的某些实施方案中,嵌合构建体编码含有植物CPA-FAS的一部分和另一种基因的一部分的融合蛋白。在有些实施方案中,该融合蛋白具有类似于野生型植物CPA-FAS的生物活性(例如至少具有植物CPA-FAS的一种希望的生物活性)。在其它实施方案中,该融合蛋白具有改变的生物活性。
在本发明的其它实施方案中,嵌合构建体编码含有植物CPA-FAS基因或其部分和引导蛋白质到靶亚细胞位置的前导序列或其它信号序列的融合蛋白。这些序列在本领域公知,引导蛋白质到如叶绿体、线粒体、内质网、液泡形成体、高尔基网络和质膜等的位置。
除了利用融合蛋白改变生物活性外,广泛地认为,融合蛋白也能够利于蛋白质的表达和/或纯化,如本发明的植物CPA-FAS蛋白。因此,在本发明的某些实施方案中,植物CPA-FAS作为一种谷胱甘肽-S-转移酶产生(即GST融合蛋白)。预期这些GST融合蛋白使得能够容易地纯化植物CPA-FAS,如通过利用谷胱甘肽衍化的基质(参见,例如Ausabel等人(编著)(1991)《现代分子生物学方法》(CurrentProtocols in Molecular Biology),John Wiley & Sons,NY)。
在本发明的另一个实施方案中,一种融合基因编码一种纯化前导序列,如位于植物CPA-FAS希望部分的N端的poly-(His)/肠激酶酶切位点序列,该序列允许利用Ni2+金属树脂通过亲和层析纯化表达的植物CPA-FAS融合蛋白。在本发明的另一个实施方案中,随后通过肠激酶处理除去纯化前导序列(参见,例如Hochuli等人(1987)J.Chromatogr.,411177;Janknecht等人Proc.Natl.Acad.Sci.USA,888972)。在本发明的其它实施方案中,编码添加到N(氨基)或C(羧基)端的纯化序列的融合基因允许亲和纯化;一个例子是向植物CPA-FAS的羧基端添加一个六组氨酸标签,它最适于亲和纯化。
制备融合基因的技术众所周知。编码不同多肽序列的不同核酸片段的连接基本上按照常规技术进行,使用平端或交错端进行连接,限制酶消化提供适当的末端,必要时补平粘端,碱性磷酸酶处理以避免不希望的连接,以及酶促连接。在本发明的另一个实施方案中,融合基因能够用常规技术合成,包括自动DNA合成仪。此外,在本发明的其它实施方案中,基因片段的PCR扩增用锚定引物进行,在两个连续基因片段之间产生互补的突出端,它们随后能够退火,产生嵌合基因序列(参见,例如《现代分子生物学方法》,同上)。
筛选基因产物有大量技术在本领域公知,用来筛选通过点突变制备的组合文库的基因产物,筛查cDNA文库中具有某种性质的基因产物。这些技术通常适于快速筛查通过植物CPA-FAS同源物的组合诱变产生的基因文库。最广泛使用的筛查大基因文库的技术一般包括将基因文库克隆到复制型表达载体中,用获得的载体文库转化适当的细胞,在一定条件下表达组合基因,其中检测希望的活性有利于相对容易地分离编码检测其产物的基因的载体。以下描述的每种说明性测定法在必要时均进行高通量分析,以筛选通过组合诱变技术产生的大量简并序列。
因此,在本发明的一个实施方案中,候选植物CPA-FAS基因产物在细胞或病毒颗粒表面展示,具体细胞或病毒颗粒合成CPA-FAs的能力利用实施例中描述的技术测定。在本发明的其它实施方案中,将基因文库克隆到细菌细胞表面膜蛋白的基因中,通过淘选检测产生的融合蛋白(WO88/06630;Fuchs等人(1991)BioTechnol.,91370-1371;Goward等人(1992)TIBS 18136-140)。在本发明的其它实施方案中,能够利用荧光标记的可与植物CPA-FAS结合的分子对可能具有功能的植物CPA-FAS同源物进行评分。目视检查细胞,在荧光显微镜下分离,或者在细胞形态学允许时,利用荧光激活的细胞分选仪分离。
在本发明的一个备选实施方案中,基因文库在病毒颗粒表面表达为一种融合蛋白。例如,外源肽序列在丝状噬菌体系统中的传染性噬菌体表面表达,从而具有两个明显的好处。第一,由于这些噬菌体能够以极高浓度加到亲和基质上,所以一次能够筛选大量噬菌体。第二,由于每种传染性噬菌体在其表面展示组合基因产物,如果从亲和基质上低产量地回收一种特定噬菌体,该噬菌体能够通过另一轮感染扩增。几乎相同的一组大肠杆菌丝状噬菌体M13、fd和fl最常在噬菌体展示文库中使用,因为噬菌体gIII或gVIII外壳蛋白都能用来产生融合蛋白,而不破坏病毒颗粒的最后包装(参见,例如WO 90/02909;WO92/09690;Marks等人(1992)J.Biol.Chem.,26716007-16010;Griffths等人(1993)EMBO J.,12725-734;Clackson等人(1991)Nature,352624-628;和Barbas等人(1992)Proc.Natl.Acad.Sci.,894457-4461)。
在本发明的另一个实施方案中,修饰重组噬菌体抗体系统(例如RPAS,Pharmacia目录号27-9400-01),用于植物CPA-FAS组合文库的表达和筛查。RPAS试剂盒的pCANTAB 5噬菌粒含有编码噬菌体gIII外壳蛋白的基因。在本发明的一些实施方案中,将植物CPA-FAS组合基因文库克隆到噬菌粒中与gIII信号序列相邻,使其表达为gIII融合蛋白。在本发明的其它实施方案中,在连接后用噬菌粒转化感受态大肠杆菌TG1细胞。在本发明的其它实施方案中,随后用M13KO7辅助噬菌体感染转化的细胞,拯救噬菌粒及其候选植物CPA-FAS基因插入片段。产生的重组噬菌体含有编码特定候选植物CPA-FAS蛋白的噬菌粒DNA,展示一个或多个拷贝的相应融合外壳蛋白。在本发明的某些实施方案中,通过淘选选择或富集例如能够代谢过氧化氢的噬菌体展示的候选蛋白质。然后分离结合的噬菌体,如果重组噬菌体至少表达一个拷贝的野生型gIII外壳蛋白,它们将保留感染大肠杆菌的能力。因此,连续几轮大肠杆菌再感染和淘选将大大富集植物CPA-FAS同源物,然后能够根据其它生物活性筛选,以区分激动剂和拮抗剂。
根据本公开内容,除了以保守与非保守残基为基础的上述合理诱变之外,本领域技术人员明白通常适用的其它诱变形式。例如,植物CPA-FAS同源物的产生及筛选能够利用丙氨酸扫描诱变等(Ruf等人(1994)Biochem.,331565-1572;Wang等人(1994)J.Biol.Chem.,2693095-3099;Balint(1993)Gene 137109-118;Grodberg等人(1993)Eur.J.Biochem.,218597-601;Nagashima等人(1993)J.Biol.Chem.,2682888-2892;Lowman等人(1991)Biochem.,3010832-10838;和Cunningham等人(1989)Science,2441081-1085);通过接头扫描诱变(Gustin等人(1993)Viroi.,193653-660;Brown等人(1992)Mol.Cell.Biol.,122644-2652;McKnight等人Science,232316);或者通过饱和诱变(Meyers等人(1986)Science,232613)。
IV.克隆的植物环丙烷脂肪酸合酶的表达在本发明的其它实施方案中,可以利用对应于如上所述的植物CPA-FAS基因、同源物和突变体的核酸序列产生引导编码蛋白质产物在适当宿主细胞中表达的重组DNA分子。
本领域技术人员应当理解,产生含有非天然存在的密码子的植物CPA-FAS编码核苷酸序列可能是有利的。因此,在一些优选实施方案中,能够选择特定原核或真核宿主优选的密码子(Murray等人(1989)Nucl.Acids Res.,17),例如提高植物CPA-FAS的表达率,或产生具有希望的特性(例如比天然存在的序列产生的转录物半衰期更长)的重组RNA转录物。
A.用于产生植物环丙烷脂肪酸合酶的载体本发明的核酸序列可以用来通过重组技术产生多肽。因此,例如,为了表达一种多肽,可以在多种表达载体的任何一种中包含该核酸序列。在本发明的某些实施方案中,载体包括但不限于染色体、非染色体和合成DNA序列(例如SV40衍生物,细菌质粒,噬菌体DNA;杆状病毒,酵母质粒,质粒和噬菌体DNA组合产生的载体,和病毒DNA,如痘苗、腺病毒、禽痘病毒和假狂犬病)。预期可以使用任何载体,只要它在宿主中可复制且存活。
具体而言,本发明的某些实施方案提供含有一种或多种如上所述核酸序列(例如SEQ ID NO1)的重组构建体。在本发明的某些实施方案中,该构建体含有一种载体,如质粒或病毒载体,其中以正向或反向插入了本发明的核酸序列。在本发明优选的实施方案中,使用多种方法之一将适当的核酸序列插入载体中。通常利用本领域公知的方法将核酸序列插入适当的限制性内切核酸酶位点中。
本领域技术人员知道大量合适的载体,它们可以商品获得。这些载体包括但不限于下列载体1)细菌——pQE70、pQE60、pQE-9(Qiagen)、pBS、pDlO、phagescript、psiX174、pbluescript SK、pBSKS、pNH8A、pNH16a、pNH18A、pNH46A(Stratagene);ptrc99a、pKK223-3、pKK233-3、pDR540、pRIT5(Pharmacia);2)真核——pWLNEO、pSV2CAT、pOG44、PXT1、pSG(Stratagene)、pSVK3、pBPV、pMSG和pSVL(Pharmacia)。也可以使用其它任何质粒或载体,只要它们在宿主中可复制且存活。在本发明的一些优选实施方案中,植物表达载体含有一个复制起点、一个适当的启动子和增强子以及任何必要的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、转录终止序列和5’侧翼非转录序列。在其它实施方案中,可以利用SV40剪接产生的DNA序列和聚腺苷酸化位点提供需要的非转录遗传因子。
在本发明的某些实施方案中,一种表达载体内的本发明的核酸序列与引导mRNA合成的适当表达控制序列(启动子)有效连接。在本发明中有用的启动子包括但不限于LTR或SV40启动子,大肠杆菌lac或trp,噬菌体lambda PL和PR,T3和T7启动子,和巨细胞病毒(CMV)直接早期,单纯疱疹病毒(HSV)胸苷激酶,和小鼠金属硫蛋白-I启动子,和已知控制原核或真核细胞或其病毒中基因表达的其它启动子。在本发明的其它实施方案中,重组表达载体包括复制起点和允许宿主细胞转化的选择性标记(例如用于真核细胞培养的二氢叶酸还原酶或新霉素抗性,或用于大肠杆菌的四环素或氨苄青霉素抗性)。
在本发明的一些实施方案中,通过向载体内插入一个增强子序列提高高等真核生物转录编码本发明的多肽的DNA。增强子是DNA的顺式作用元件,通常约10-300bp,作用于启动子提高其转录。在本发明中有用的增强子包括但不限于复制起点bp 100-270远侧的SV40增强子,巨细胞病毒早期启动子增强子,复制起点远侧的多瘤增强子,和腺病毒增强子。
在其它实施方案中,表达载体也含有一个用于翻译起始的核糖体结合位点和一个转录终止子。在本发明的其它实施方案中,该载体也可包含适于扩增表达的序列。
B.用于生产植物环丙烷脂肪酸合酶的宿主细胞在另一个实施方案中,本发明提供含有上述任何构建体的宿主细胞。在本发明的某些实施方案中,宿主细胞是高等真核细胞(例如植物细胞)。在本发明的其它实施方案中,宿主细胞是低等真核细胞(例如酵母细胞)。在本发明的其它实施方案中,宿主细胞是原核细胞(例如细菌细胞)。宿主细胞的具体例子包括但不限于大肠杆菌(Escherichiacoli),鼠伤寒沙门氏菌(Salmonella typhimurium),枯草芽孢杆菌(Bacillus subtilis),假单胞菌属(Pseudomonas)、链霉菌属(Streptomyces)和葡萄球菌属(Staphylococcus)的多个种,以及酿酒酵母(Saccharonaycees cerivisiae)、粟酒裂殖酵母(Schizosaccharomyceespombe),果蝇(Drosophila)S2细胞,夜蛾(Spodoptera)Sf9细胞,中国仓鼠卵巢(CHO)细胞,猴肾成纤维细胞COS-7系(Gluzman(1981)Cell23175),293T,C127,3T3,HeLa和BHK细胞系,NT-1(烟草细胞培养系),根细胞和在rhizosecretion中培养的根(Gleba等人(1999)Proc Natl Acad Sci USA 965973-5977)。其它例子包括小孢子衍生的油籽油菜(oilseed rape)培养物(Weselake RJ和Taylor DC(1999)Prog.Lipid Res.38401),和花粉和小孢子培养系统的转化。其它例子在实施例中描述。
宿主细胞中的构建体能够以常规方法使用,产生由上述本发明的任何重组序列编码的基因产物。在有些实施方案中,向宿主细胞内导入构建体能够通过磷酸钙转染、DEAE-葡聚糖介导的转染或电穿孔实现(参见,例如Davis等人(1986)《基础分子生物学方法》(BasicMethods in Molecular Biology))。此外,在本发明的某些实施方案中,本发明的多肽也能够用常规肽合成仪合成产生。
蛋白质能够在适当启动子的控制下在真核细胞、酵母、细菌或其它细胞中表达。也能够利用无细胞翻译系统,使用本发明的DNA构建体衍生的RNA,产生这些蛋白质。Sambrook等人(1989)《分子克隆实验室手册》,第二版,Cold Spring Harbor,N.Y.描述了适用于原核和真核宿主的克隆和表达载体。
在本发明的某些实施方案中,在合适的宿主株转化且宿主株生长到适当的细胞密度后,用适当的方法诱导选择的启动子(例如温度变换或化学诱导),细胞再培养一段时间。在本发明的其它实施方案中,细胞一般通过离心收获,用物理或化学方法破坏,保留获得的粗提物进一步纯化。在本发明的其它实施方案中,在蛋白质表达中使用的微生物细胞能够用任何常规方法破坏,包括冻融循环、超声处理、机械破坏或使用细胞裂解剂。
VI.大量环丙烷脂肪酸的产生在本发明的一个方面,提供了生产大量CPA-FAs的方法。在一些实施方案中,CPA-FAs在生物体内产生,该生物用编码显示植物环丙烷脂肪酸合酶活性的多肽的异源基因转化,并且在足以实现CPA-FAs产生的条件下生长。在其它实施方案中,CPA-FAs在体外产生,来自编码植物CPA-FAS的核酸序列,或来自显示植物环丙烷脂肪酸合酶活性的多肽。
A.在转基因生物体内在本发明的某些实施方案中,CPA-FAs在体内产生,方法是提供用编码植物CPA-FAS活性的异源基因转化的生物,并且在足以实现CPA-FAs产生的条件下生长该转基因生物。在本发明的其它实施方案中,CPA-FAs在体内产生,方法是用编码植物CPA-FAS的异源基因转化一种生物,并在足以实现CPA-FAs产生的条件下生长该转基因生物。实施例中提供了转基因生物的说明性例子。
用编码植物CPA-FAS的异源基因转化的生物优选地包括以某种方式自然合成并贮存脂肪酸的生物,和商业上可以生长并且适于收获大量脂肪酸产物的生物。这些生物包括但不限于细菌、含油酵母和藻类和植物。细菌的例子包括能够在商业规模发酵罐中生长的大肠杆菌和有关细菌。植物的例子优选地包括产油植物,如大豆、油菜籽和芸苔、向日葵、棉花、玉米、可可、红花、油椰、椰子、亚麻、蓖麻和花生。许多商品栽培种都能够用异源基因转化。如果不可能,则能转化非商品植物栽培种,并且通过本领域公知的培育技术将表达植物CPA-FAS的性状转移给商品栽培种。
编码植物CPA-FAS的异源基因,包括植物CPA-FAS的突变体或变体,包括如上所述的本发明的所有合适的序列。优选地,异源基因存在于一种表达载体中,使得用载体转化导致多肽的表达;合适的载体如上文及下文所述。
转基因生物在足以实现CPA-FAs产生的条件下生长。在本发明的某些实施方案中,转基因生物提供植物CPA-FAS的外源底物(如在发酵罐中)。这些底物包括不饱和脂肪酸;双键数量为1个到1个以上,这些不饱和脂肪酸的链长是可变的,但是优选地长度为约14-22碳。脂肪酸底物也可含有其它功能基团,包括但不限于乙炔键、偶联的乙炔键和乙烯键、丙二烯基、呋喃环和环氧基和酮基;在一种脂肪酸中能够发现这些功能基团中的两种或两种以上。底物是游离脂肪酸或其盐。底物可以是本领域公知的多种形式;这些形式包括通过超声处理制备的水悬液、用去污剂和其它表面活性剂制备的水悬液、底物溶解于溶剂中和干燥的底物粉末。可以向生物或在发酵罐中培养的细胞或组织中加入这些形式。
在本发明的其它实施方案中,一种转基因生物包含与诱导型启动子有效连接的编码植物CPA-FAS的异源基因,在一种诱导剂存在下生长,或者在生长后暴露于一种诱导剂。在本发明的其它实施方案中,一种转基因生物含有一种异源基因,该基因编码与组织特异的或发育特异的启动子有效连接的植物CPA-FAS,该生物生长到组织发育的时间点或发育特异的启动子被激活的发育阶段。这些启动子包括种子特异性启动子。
在备选实施方案中,构建如上所述的转基因生物,产生更大量的不饱和底物。在一个实施方案中,用编码一种去饱和脂肪酸的蛋白质的异源基因共转化一种转基因生物,使得脂肪酸去饱和酶表达。更优选地,植物CPA-FAS和异源脂肪酸去饱和酶靶向同一细胞内位置;最优选地,该位置用来合成油,如植物中的微粒体。这些共转化子然后在足以实现CPA-FAS产生的条件下生长。在本发明的某些实施方案中,共转化子提供脂肪酸去饱和酶的外源底物;这些底物包括饱和的和不饱和脂肪酸。这些不饱和脂肪酸的链长是可变的,但是优选地长度为约14-22碳。脂肪酸底物也可含有其它功能基团,包括但不限于乙炔键、偶联的乙炔键和乙烯键、丙二烯基、环氧基和酮基;在一种脂肪酸中能够发现这些功能基团中的两种或两种以上。底物是游离脂肪酸,或者是掺入较大分子内的脂肪酸,如甘油脂类。最优选地,脂肪酸底物被酯化成一种磷脂。底物可以如上所述提供、添加或应用。
在其它实施方案中,异源基因在诱导型、组织特异的或发育特异的启动子控制之下,生物如上所述生长,使得编码具有脂肪酸去饱和酶和植物CPA-FAS活性的多肽的异源基因表达。
在本发明的其它实施方案中,如上所述,用编码含有脂肪酸去饱和酶和植物CPA-FAS的融合蛋白的核苷酸序列转化一种生物,使得这两种酶活性都表达。这些转基因生物如上所述生长。
在本发明的其它实施方案中,宿主生物是产生大量底物的生物。例如,预期油酸盐是苹婆CPA-FA的一种优选底物;因此,一种特别合适的宿主是产生高比例油酸的宿主。这些宿主包括培育的产生高油酸油的植物系,如向日葵或玉米;这些系由个别的植物产生,其中选择自然低水平的FAD2,以及进行诱变随后根据降低的FAD2活性选择的植物,和经历敲除技术的植物,其中通过反义或共抑制沉默FAD2。在其它系中,通过上述任何方法,短链脂肪酸的合成也减少,导致油酸表达提高。也可以组合任何这些修饰,产生具有更高油酸含量的植物系。
在本发明的其它实施方案中,产生大量CPA-FAs的方法还包括收集产生的CPA-FAs。这些方法在本领域公知,包括收获转基因生物及提取CPA-FAs(参见,例如Christie,W.W(1982)《脂类分析》(LipidAnalysis),第二版(Pergamon Press,Oxford);和Kates,M(1986)《脂学技术》(Techniques of Lipidoiogy)(Elsevier,Amsterdam))。提取方法优选地包括溶剂抽提,一般包括在溶剂抽提之前如通过剁碎(chopping)、切碎、研磨和/或超声处理破坏细胞。在一个实施方案中,按照Bligh和Dyer(1959)(Can J Biochem Physiol 37911-917)的方法从组织中提取脂类;酯化为甘油脂类的脂肪酸在酸或碱性条件下能够水解,并通过溶剂抽提收集。在本发明的其它实施方案中,例如通过薄层液相层析、气-液相层析或高压液相层析进一步纯化CPA-FAs。
1.转基因植物、种子和植物部分按照本领域公知的方法,植物用编码植物CPA-FAS的异源基因转化,或者用编码植物CPA-FAS的第一种异源基因和编码脂肪酸去饱和酶的第二种异源基因共转化,或者用一种融合基因转化,该融合基因编码一种表达植物CPA-FAS和脂肪酸去饱和酶活性的融合多肽。可以预期,该异源基因用来提高该异源基因编码的酶活性水平。
a.植物本发明的方法不限于任何具体植物。实际上,设想使用多种植物,包括但不限于西红柿、马铃薯、烟草、胡椒、水稻、玉米、大麦、小麦、芸苔、拟南芥、向日葵、大豆、白杨和松树。优选的植物包括产油种,它们是在特定器官(主要是种子)中产生并贮存三酰基甘油的植物种。这些种包括但不限于大豆(Glycine max)、油菜籽和芸苔(包括芸苔(Brassica napus)和野油菜(B.campestris)),向日葵(Helianthusannus),棉花(陆地棉(Gossypiurn hirsutum))、玉米(玉蜀黍(Zea mays)),可可(Theobroma cacao),红花(Carthamus tinctorius),油椰(Elaeisguineensis),椰子(Cocos nucifera),亚麻(linum usitatissimum),蓖麻(Ricinus communis)和落花生(Arachis hypogaea)。该组也包括在发展适当表达载体中有用的非农业种,如烟草、快循环芸苔属的种,和拟南芥,和可以作为独特脂肪酸来源的野生种。优选的植物系包括如上所述的高单不饱和化合物的、特别是高油酸的植物。特别优选的植物系是具有高油酸背景的油籽作物系。高油酸背景能够如下产生使用通过培育和/或诱变产生的现有的植物系(例如高油酸向日葵系和高油酸油菜籽系),或者使用遗传工程系,如通过fad2共抑制产生的高油酸大豆,或使用OLE1基因降低饱和度。
b.载体本发明的方法预期使用如上所述编码植物CPA-FAS的异源基因。本发明的方法还涉及使用编码一种脂肪酸去饱和酶的第二种异源基因;这些多肽已知(参见,例如,Polashock JJ,Chin C-K,Martin CE(1992)Plant Physiol.100894-901,描述了酵母delta-9脂肪酸去饱和酶在烟草中的表达。酵母delta-9脂肪酸去饱和酶是OLE1基因,它能够提高植物组织中16:1和18:1的水平)。编码脂肪酸去饱和酶突变体和变体的异源基因如上关于植物CPA-FAS所述制备。编码融合CPA-FAS/脂肪酸去饱和酶的异源基因如上所述制备。
准备在植物中表达的异源基因首先在含有一个启动子的表达盒中装配。可以利用本领域技术人员公知的方法构建含有异源基因和适当的转录和翻译控制元件的表达载体。这些方法包括体外重组DNA技术、合成技术和体内基因重组。这些技术在本领域广泛描述(参见,例如Sambrook.等人(1989)《分子克隆实验室手册》,Cold SpringHarbor Press,Plainview,N.Y.,和Ausubel,F.M.等人(1989)《现代分子生物学方法》,John Wiley & Sons,New York,N.Y)。
这些载体通常含有编码植物CPA-FAS的本发明的核酸序列(如上所述),该序列与在植物中表达所需的启动子和其它调节序列(例如增强子、聚腺苷酸化信号等)有效连接。
启动子包括但不限于组成型启动子,组织、器官和发育特异的启动子,和诱导型启动子。启动子的例子包括但不限于花椰菜花叶病毒的组成型启动子35S;来自西红柿的创伤诱导型启动子,亮氨酸氨基肽酶(“LAP”,Chao等人(1999)Plant Physiol 120979-992);来自烟草的化学诱导型启动子,发病机理相关1(PR1)(由水杨酸和BTH(苯并噻二唑-7-硫代羟酸S-甲酯)诱导);一种西红柿蛋白酶抑制剂II启动子(PIN2)或LAP启动子(均可用茉莉酮酸甲酯诱导);热休克启动子(美国专利5,187,267);四环素诱导型启动子(美国专利5,057,422);种子特异性启动子,如种子贮存蛋白质特异的启动子(例如,菜豆球蛋白、napin,oleosin和大豆beta conglycin的启动子(Beachy等人(1985)EMBO J.43047-3053))。此处引用的所有参考文献均全文引用。
该表达盒还可含有mRNA表达所需的任何序列。这些序列包括但不限于转录终止子,增强子,如内含子,病毒序列,和旨在将基因产物靶向特定细胞器和细胞区室的序列。
多种转录终止子可以在使用本发明的启动子的序列表达中使用。转录终止子引起超出转录物的转录终止及其正确的聚腺苷酸化。合适的转录终止子和已知在植物中起作用的终止子包括但不限于CaMV35S终止子、tml终止子、豌豆rbcS E9终止子和胭脂氨酸和章鱼氨酸合酶终止子(参见,例如Odell等人(1985)Nature 313810;Rosenberg等人(1987)Gene,56125;Guerineau等人(1991)Mol.Gen.Genet.,262141;Proudfoot(1991)Cell,64671;Sanfacon等人Genes Dev.,5141;Mogen等人(1990)Plant Cell,21261;Munroe等人(1990)Gene,91151;Ballad等人(1989)Nucleic Acids Res.177891;Joshi等人(1987)Nucleic Acid Res.,159627)。
另外,在一些实施方案中,用于表达目的基因的构建体包含一种或多种序列,发现这些序列可以提高转录单位内的基因表达。这些序列能够与目的核酸序列联合使用,以提高植物中的表达。已经显示有多种内含子序列可以提高尤其在单子叶植物中的表达。例如,已经发现玉米Adh1基因的内含子在导入玉米细胞中后可显著提高野生型基因在其同源启动子下的表达(Calais等人(1987)Genes Develop.11183)。内含子序列常规掺入植物转化载体内,一般在非翻译前导序列内。
在本发明的一些实施方案中,用于表达目的核酸序列的构建体也包含调节子,如核定位信号(Calderone等人(1984)Cell 39499;Lassoer等人(1991)Plant Molecular Biology 17229)、植物翻译共有序列(Joshi(1987)Nucleic Acids Research 156643)、内含子(Luehrsen和Walbot(1991)Mol.Gen.Genet.22581)等,它们与编码植物CPA-FAS的核酸序列有效连接。
在制备含有编码植物CPA-FAS的核酸序列的构建体时,能够操作不同的DNA片段,以便以希望的方向(例如有义或反义)、必要时在希望的阅读框中提供DNA序列。例如,能够使用连接体(adapter)或接头连接DNA片段,或者能够利用其它操作提供合适的限制酶切位点,除去多余的DNA,除去限制酶切位点等。为此,优选地使用体外诱变、引物修复、限制酶切、退火、切除、连接等,其中包括插入、缺失或置换(例如转换和颠换)。
有大量转化载体可用于植物转化。所用载体的选择取决于优选的转化技术和转化的靶种。对于某些靶种,优选不同的抗生素或除草剂选择性标记。在转化中常规使用的选择性标记包括提供卡那霉素及有关抗生素抗性的nptII基因(Messing和Vierra(1982)Gene 19259;Bevan等人(1983)Nature 304184),提供除草剂膦丝菌素抗性的bar基因(White等人(1990)Nucl Acids Res.181062;Spencer等人(1990)Theor.Appl.Genet.79625),提供抗生素潮霉素抗性的hph基因(Blochlinger和Diggeimann(1984)Mol.Cell.Biol.42929),和提供氨甲喋呤抗性的dhfr基因(Bourouis等人(1983)EMBO J.,21099)。
在一些优选实施方案中,改造载体使其适用于农杆菌介导的转染法(参见,例如美国专利号5,981,839;6,051,757;5,981,840;5,824,877;和4,940,838;均在此引用作为参考)。重组Ti和Ri质粒的构建通常按照一般用于多种细菌载体如pBR322的方法。另外可以使用有时在天然质粒中发现的、有时由外源序列构建的辅助遗传元件。可包括但不限于抗生素抗性结构基因,如选择基因。
现在有两个系统正在使用重组Ti和Ri质粒载体系统。第一个系统被称为“共整合”系统。在该系统中,含有目的基因的穿梭载体通过基因重组插入非致癌Ti质粒中,该质粒含有植物转化所需的顺式作用和反式作用元件,如pMLJl穿梭载体和非致癌Ti质粒pGV3850。第二个系统被称为“二元”系统,其中使用两种质粒;目的基因插入含有植物转化所需顺式作用元件的穿梭载体内。其它辅助功能由非致癌Ti质粒顺式提供,如pBIN19穿梭载体和非致癌Ti质粒PAL4404。这些载体中的一些可以商品获得。
在本发明的其它实施方案中,目的核酸序列被靶向植物基因组上的特定基因座。目的核酸序列向植物细胞基因组内的定向整合例如可以使用农杆菌衍生序列通过同源重组实现。植物细胞通常与一种农杆菌菌株温育,该菌株含有一种靶向载体,其中与靶基因座内的DNA序列同源的序列侧翼为农杆菌转移DNA(T-DNA)序列,如前所述(美国专利号5,501,967)。本领域技术人员知道,同源重组可以利用靶向载体实现,该载体内含有与靶向的植物基因的任一部分同源的序列,无论它是属于基因的调节元件,还是基因的编码区。同源重组可以在植物基因的任一区域实现,只要靶向位点侧翼区域的核酸序列已知。
在其它实施方案中,利用本发明的核酸构建来源于植物(+)RNA病毒的载体(例如雀麦花叶病毒、烟草花叶病毒、紫花苜蓿花叶病毒、黄瓜花叶病毒、西红柿花叶病毒及其组合和杂种)。通常,插入的本发明的植物CPA-FAS多核苷酸能够从这些载体表达为融合蛋白(例如外壳蛋白融合蛋白)或者从其自身的亚基因组启动子或其它启动子表达。这些病毒的构建及使用方法在美国专利号5,846,795;5,500,360;5,173,410;5,965,794;5,977,438;和5,866,785中描述,均在此引用作为参考。
在本发明的某些实施方案中,目的核酸序列直接导入一种植物中。一种可用于直接基因转移技术的载体与通过除草剂Basta(或磷丝菌素)选择联合使用,是质粒pCIB246的一种修饰形式,其含有一个CaMV 35S启动子,与大肠杆菌GUS基因和CaMV 35S转录终止子有效融合(WO 93/07278)。
c.转化技术一旦编码植物CPA-FAS的核酸序列与一种合适的启动子有效连接,并插入适用于具体转化技术的载体中(例如上述载体之一),即可利用本领域公知的多种方法将上述重组DNA导入植物细胞内。本领域技术人员应当理解,方法的选择取决于为转化而靶向的植物类型。在有些实施方案中,载体保持在附加体上。在其它实施方案中,载体整合到基因组内。
在一些实施方案中,利用质体基因组内的直接转化将载体导入植物细胞中(参见,例如美国专利号5,451,513;5,545,817;5,545,818;PCT申请WO 95/16783)。叶绿体转化的基本技术包括向合适的靶组织中导入位于选择性标记侧翼的克隆的质体DNA区以及编码目的RNA序列的核酸(例如利用biolistics或原生质体转化,使用氯化钙或PEG)。1-1.5kb侧翼区,被称为靶向序列,有利于与质体基因组同源重组,从而允许质体基因组(plastome)特定区域的置换或修饰。最初,使用提供大观霉素和/或链霉素抗性的叶绿体16S rRNA和rps12基因的点突变作为转化的选择性标记(Svab等人(1990)PNAS,878526;Staub和Maliga,(1992)Plant Cell,439)。这些标记之间克隆位点的存在允许产生一种导入外源DNA分子的质体靶向载体(Staub和Maliga(1993)EMBO J.,12601)。将隐性rRNA或r-蛋白抗生素抗性基因替换为一种显性选择性标记,编码大观霉素解毒酶氨基糖苷-3′-腺苷转移酶的细菌aadA基因,转化频率大大提高(Svab和Maliga(1993)PNAS,90913)。可用于质体转化的其它选择性标记在本领域公知,包括在本发明的范围内。获得质体基因组同质的植物,其中含有被本发明的启动子隔开的两个核酸序列,能够优先高表达DNA分子编码的RNA。
在其它实施方案中,使用机械转移重组DNA的微量移液器,将用于实施本发明的载体直接显微注射到植物细胞内(Crossway(1985)Mol.Gen.Genet,202179)。在其它实施方案中,将载体转移到植物细胞内的方法包括使用聚乙二醇(Krens等人(1982)Nature,29672;Crossway等人(1986)BioTechniques,4320);原生质体与其它实体(小细胞、细胞、溶酶体或其它可融合的脂表面体)融合(Fraley等人(1982)Proc.Natl.Acad.Sci.,USA,791859);原生质体转化(EP 0 292 435);直接基因转移(Paszkowski等人(1984)EMBO J.,32717;Hayashimoto等人(1990)Plant Physiol.93857)。
在其它实施方案中,也可以通过电穿孔将载体导入植物细胞中(Fromm等人(1985)Pro.Natl Acad.Sci.USA 825824;Riggs等人(1986)Proc.Natl.Acad.Sci.USA 835602)。利用这种技术,在含有该基因构建体的质粒存在下电穿孔植物原生质体。高场强的电脉冲可逆地透化生物膜,允许质粒的导入。电穿孔的植物原生质体改变了细胞壁,分裂,并形成植物愈伤组织。
在其它实施方案中,利用装置(例如,可获自Agracetus,Inc.,Madison,Wis.and Dupont,Inc.,Wilmington,Del)通过ballistic粒子加速导入载体(参见,例如美国专利号4,945,050;和McCabe等人(1988)Biotechnology 6923)。参见Weissinger等人(1988)Annual Rev.Genet.22421;Sanford等人(1987)Particulate Science andTechnology,527(洋葱);Svab等人(1990)Proc.Natl.Acad.Sci.USA,878526(烟草叶绿体);Christou等人(1988)Plant Physiol.,87671(大豆);McCabe等人(1988)Bio/Technology 6923(大豆);Klein等人(1988)Proc.Natl.Acad.Sci.USA,854305(玉米);Klein等人(1988)Bio/Technology,6559(玉米);Klein等人(1988)Plant Physiol.,914404(玉米);Fromm等人(1990)Bio/Technology,8833;和Gordon-Kamm等人(1990)Plant Cell,2603(玉米);Koziel等人(1993)Biotechnology,11194(玉米);Hill等人(1995)Euphytica,85119和Koziel等人(1996)Annals of the New York Academy ofSciences 792164;Shimamoto等人(1989)Nature 338274(水稻);Christou等人(1991)Biotechnology,9957(水稻);Datta等人(1990)Bio/Technology 8736(水稻);欧洲专利申请EP 0 332 581(鸭茅和其它Pooideae科);Vasil等人(1993)Biotechnology,111553(小麦);Weeks等人(1993)Plant Physiol.,1021077(小麦);Wan等人(1994)PlantPhysiol.10437(大麦);Jahne等人(1994)Theor.Appl.Genet.89525(大麦);Knudsen和Muller(1991)Planta,185330(大麦);Umbeck等人(1987)Bio/Technology 5263(棉花);Casas等人(1993)Proc.Natl.Acad.Sci.USA 9011212(高粱);Somers等人(1992)Bio/Technology101589(燕麦);Torbert等人(1995)Plant Cell Reports,14635(燕麦);Weeks等人(1993)Plant Physiol.,1021077(小麦);Chang等人,WO 94/13822(小麦);和Nehra等人(1994)The Plant Journal,5285(小麦)。
除了直接转化之外,在一些实施方案中,利用农杆菌介导的转化转移含有编码本发明的植物CPA-FAS的核酸序列的载体(Hinchee等人(1988)Biotechnology,6915;Ishida等人(1996)NatureBiotechnology 14745)。农杆菌属是革兰氏阴性Rhizomaceae科的一个代表性属。它的种引起植物肿瘤,如冠瘿病和毛根病。在肿瘤特有的去分化组织中,被称为冠瘿氨基酸的氨基酸衍生物产生并分解代谢。引起冠瘿氨基酸表达的细菌基因是嵌合表达盒的控制元件的一个方便的来源。利用根瘤农杆菌的Ti质粒,能够将异源基因序列(例如与本发明的启动子有效连接的核酸序列)导入合适的植物细胞内。在根瘤农杆菌感染后,Ti质粒被转移到植物细胞中,并且稳定整合于植物基因组内(Schell(1987)Science,2371176)。易被农杆菌感染的种可以在体外转化。此外,植物也可以在体内转化,如利用农杆菌侵入成年植物转化整个植物,如“花浸(floral dip)”法(Bechtold N,Ellis J,Pelletier G(1993)Cr.Acad.Sci.Ill-Vie 3161194-1199)。
d.再生在筛选能够表达编码植物CPA-FAS的异源基因的转化植物材料后,再生为整个植物。Evans等人(1983)《植物细胞培养手册》(Handbook of Plant Cell Cultures),第一卷(MacMillan Publishing Co.NewYork);和VasilI.R.(编著),《植物细胞培养和体细胞遗传学》(CellCulture and Somatic Cell Genetics of Plants),Acad.Press,Orlando,第一卷(1984)和第三卷(1986)描述了由培养的原生质体再生为植物。众所周知,许多植物能够由培养的细胞或组织再生,包括但不限于甘蔗、甜菜、棉花、水果和其它树木、荚果和蔬菜和单子叶植物(例如上述植物)的所有主要种。再生方法随植物的种而不同,但是通常首先提供含有异源基因拷贝的转化原生质体的悬液。形成愈伤组织,可从愈伤组织中发芽,随后生根。
此外,胚的形成能够由原生质体悬液诱发。这些胚萌芽并形成成熟的植物。培养基通常含有不同的氨基酸和激素,如生长素和细胞分裂素。芽和根通常同时发育。有效的再生取决于培养基、基因型和培养史。再生的可重复性取决于这些变量的控制。
e.转基因系的产生通过组织培养繁殖由转基因植物建立转基因系。通过传统植物培育技术,可以使编码本发明的外源植物CPA-FAS(包括突变体和变体)的核酸序列的存在转移到有关的变种中。
然后用这些转基因系评价油的产生和其它农学性状。
B.体外系统在本发明的其它实施方案中,CPA-FAs由编码植物CPA-FAS的核酸序列或显示植物环丙烷脂肪酸合酶活性的多肽在体外产生。
1.使用编码植物环丙烷脂肪酸合酶的核酸序列在本发明的一些实施方案中,产生大量CPA-FAs的方法包括在足以导致产生CPA-FAs的条件下向体外表达系统中加入分离的编码植物CPA-FAS的核酸序列。分离的编码植物环丙烷的核酸序列是如上所述的任何合适的本发明的序列,优选地在一种表达载体内提供,以致向一种体外转录/翻译系统中加入该载体导致该多肽的表达。该系统还包括植物CPA-FAS的底物,如上所述。此外,该系统还包括产生植物CPA-FAS的底物的手段。这些手段包括但不限于提供至少一种显示脂肪酸去饱和酶活性的蛋白质,和脂肪酸去饱和酶的底物,如上所述。
在本发明的其它实施方案中,产生大量CPA-FAs的方法还包括收集产生的CPA-FAs。这些方法在本领域公知。在本发明的其它实施方案中,CPA-FAs进一步纯化,例如利用薄层层析、气-液相层析或高压液相层析纯化。
2.使用植物环丙烷合酶多肽在本发明的一些实施方案中,产生大量CPA-FAs的方法包括在足以导致CPA-FAs合成的条件下温育植物CPA-FAS;这种温育通常在含有植物CPA-FAS的混合物中进行。
如上所述的植物CPA-FAS如下获得如上所述,从编码植物CPA-FAS的异源基因转化的生物中纯化自然存在的植物CPA-FAS或重组植物CPA-FAS。自然存在的植物CPA-FAS的来源预计包括但不限于植物,如锦葵科、梧桐科、木棉科、Tilaceae、含羞草科和无患子科。重组植物CPA-FAS的来源是如上所述用编码植物CPA-FAS的异源基因转化的植物、细菌或其它转基因生物。重组植物CPA-FAS可能包括改善纯化的方法,例如如上所述向蛋白质C端添加一个六组氨酸尾。此外,植物CPA-FAS也可化学合成。
温育混合物还包含如上所述的植物CPA-FAS的底物。此外,该混合物还包括产生植物CPA-FAS的底物的手段。这些手段包括但不限于提供至少一种显示脂肪酸去饱和酶活性的蛋白质,和脂肪酸去饱和酶的合适底物,如上所述。其它底物包括但不限于磷脂合成的底物,如溶血磷脂和磷脂酰基转移酶,以及含有脂转移蛋白的磷脂脂质体;特别优选的磷脂是磷脂酰胆碱。
在本发明的其它实施方案中,产生大量CPA-FAs的方法还包括收集产生的CPA-FAs;这些方法如上所述。
VII.通常不存在的环丙烷脂肪酸的产生在本发明的另一个方面,提供在通常不含或含有极低水平的CPA-FAs的生物和/或组织中产生CPA-FAs的方法。在此方面,在如下生物中产生CPA-FAs,该生物用编码显示植物环丙烷脂肪酸合酶活性的多肽的异源基因转化,并且在足以实现CPA-FAs产生的条件下生长。在有些实施方案中,该方法包括在特定组织或器官(如植物根)中产生CPA-FAs。在其它实施方案中,该方法包括在特定发育阶段产生CPA-FAs。在其它实施方案中,该方法包括在特定发育阶段在特定组织或器官中产生CPA-FAs。
在此方面,预计CPA-FAs起生理作用。例如,预计CPA-FAs使植物的根具有真菌抗性。因此,在通常不含CPA-FAs或含有极低水平的CPA-FAs的植物根中表达CPA-FAS使真菌抗性提高。
在本发明的一些实施方案中,这些方法包括提供一种转基因生物,该生物包含与一个诱导型启动子有效连接的编码植物CPA-FAS的异源基因,以及在一种诱导剂存在下生长该转基因生物,或者在该生物生长后暴露于一种诱导剂,从而表达CPA-FAS,导致CPA-FAs的产生。在本发明的其它实施方案中,这些方法包括提供一种转基因生物,该生物含有与一个组织特异性或发育特异性启动子有效连接的编码植物CPA-FAS的异源基因,使该转基因生物生长到组织发育的时间点或发育特异性启动子被激活时的发育阶段,从而表达CPA-FAS,导致CPA-FAs的产生。代表性启动子包括但不限于种子特异性启动子。
编码植物CPA-FAS,包括植物CPA-FAS的突变体或变体的异源基因,包括如上所述的本发明的任何合适的序列。优选地,该异源基因在表达载体内提供,使得用载体转化导致多肽的表达;合适的载体如上文及下文所述。
产生转基因生物,特别是转基因植物的方法如上所述。
VIII.植物中植物环丙烷脂肪酸合酶活性的操作如上所述,CPE-FAs被认为是食用油中的一种抗营养因子,而含有CPE-FAs的许多种子脂类被人类(特别是在热带地区)以及动物大量消费(例如棉籽粉是一种典型的动物饲料产品,是为了获得油加工棉籽的副产品)。由于这些健康方面的担心,含有CPE-FAs的植物油在消费前必须高温处理或氢化。这些处理增加了油加工的成本,也导致了由于氢化产生的一定百分比的反式脂肪酸;这些反式脂肪酸的存在也是不希望的。因此,本发明提供从种子油中去除CPE-FAs的方法,以及产生CPE-FAs水平降低的油的植物,和CPE-FAs水平降低的油,它们没有为了降低CPE-FAs水平进行高温处理或氢化,含有低水平的反式脂肪酸。本发明的这些方面在显著降低油加工成本,减少不希望的氢化脂肪酸的含量,以及提高未加工的种子和加工的食用种子粉的种子油的价值方面,具有极大的用途。本发明的某些实施方案提供通过环丙烷合酶基因沉默技术降低植物种子油中CPE-FAs含量的方法。其它实施方案提供通过环丙烷合酶基因沉默技术降低棉籽油中CPE-FAs含量的方法。
进一步预期,编码本发明的植物CPA-FAS的核酸可以用来提高或降低(与野生型细胞中的水平相比)转染细胞中植物CPA-FASmRNA和/或蛋白质的水平。这些转基因细胞具有极大用途,包括但不限于关于植物CPA-FAS过量表达的作用以及关于植物CPA-FAS表达不足或缺乏的作用的进一步研究。
因此,在有些实施方案中,通过上述方法在植物中表达导致转基因植物、植物组织或植物细胞中植物CPA-FAS过量表达。
在本发明的其它实施方案中,植物CPA-FAS多核苷酸用来降低(与野生型植物、植物组织或植物细胞相比)转基因植物、植物组织或植物细胞中植物CPA-FAS蛋白或mRNA的水平。一种减少植物CPA-FAS表达的方法利用反义转录物的表达。反义RNA用来以组织特异的方式抑制植物靶基因(例如,van der Krol等人(1988)Biotechniques 6958-976)。反义抑制显示使用整个cDNA序列以及部分cDNA序列(例如,Sheehy等人(1988)Proc.Natl.Acad.Sci.USA858805-8809;Cannon等人(1990)Plant Mol.Biol.1539-47)。也有证据表明,含有1.87kb cDNA的少至41个碱基对的3′非编码序列片段和5′编码序列片段,在反义抑制中可能起重要作用(Ch′ng等人(1989)Proc.Natl.Acad.Sci.USA 8610006-10010)。
因此,在一些实施方案中,本发明的编码植物CPA-FAS的核酸(例如SEQ ID NO1及其片段和变体)定向于载体中并且表达,产生反义转录物。为了实现这一点,克隆来自希望的基因的核酸片段,并与一个启动子有效连接,使得RNA的反义链转录。然后用表达盒转化植物,产生RNA的反义链。将要导入的核酸片段与将要抑制的内源基因的至少一部分通常基本相同。然而,该序列不是必须完全相同才能抑制表达。能够设计本发明的载体,使得抑制作用施加于显示与靶基因有同源性或基本同源性的一个基因家族内的其它蛋白质。
此外,对于反义抑制,导入的序列相对于初始转录产物或完全加工的mRNA也不必是全长的。通常能够用较高的同源性补偿较短序列的使用。此外,导入的序列不必含有相同的内含子或外显子模式,非编码片段的同源性可能同样有效。通常应当使用约30或40个核苷酸的或大约全长核苷酸的序列,但是至少约100个核苷酸的序列是优选的,至少约200个核苷酸的序列是更优选的,至少约500个核苷酸的序列是特别优选的。
催化RNA分子或核酶也能够用来抑制靶基因的表达。能够设计与实际上所有靶RNA均特异配对,并且在特定位点切割磷酸二酯主链,从而在功能上灭活靶RNA的核酶。在进行这种切割后,核酶本身不改变,因而能够再环化并切割其它分子,使其成为一种真正的酶。反义RNA内含有核酶序列使得它们具有RNA切割活性,从而提高了构建体的活性。
已经鉴定了大量类别的核酶。一类核酶来源于大量能够自切割并在植物中复制的小环形RNA。这些RNA单独复制(类病毒RNA)或与辅助病毒一起复制(卫星RNA)。例子包括来自鳄梨白斑病类病毒的RNA,和来自烟草环斑病毒、紫花苜蓿短暂条纹病毒、绒样烟草斑点病毒、茄斑点病毒和地三叶斑点病毒的卫星RNA。Haseloff等人(1988)Nature 334585-591描述了靶RNA特异的核酶的设计和用途。也描述了靶向脂类生物合成基因的mRNA的核酶,导致靶酶底物可遗传地增加(Merlo AO等人(1998)Plant Cell 101603-1621)。
减少CPA-FAS表达的另一种方法是利用共抑制或基因沉默现象(参见,例如美国专利号6,063,947,在此引用作为参考)。共抑制现象也已用来以组织特异的方式抑制植物靶基因。已知使用全长cDNA序列以及部分cDNA序列(1770bp cDNA的730bp)共抑制内源基因(例如,Napoli等人(1990)Plant Cell 2279-289;van der Krol等人(1990)Plant Cell 2291-299;Smith等人(1990)Mol.Gen.Genetics224477-481)。因此,在有些实施方案中,编码本发明的植物CPA-FAS的核酸序列(例如包含SEQ ID NOs1,及其片段和变体)在另一个植物种中表达,以实现同源基因的共抑制。
在希望表达受到抑制时,导入的序列通常有一些转录。当导入的序列本身不含编码序列,而只含有与内源基因初级转录物中存在的序列同源的内含子或非翻译序列时,可能发生这种作用。导入的序列与将要抑制的内源序列通常基本相同。这种最小同一性一般高于约65%,但是更高的同一性可能更有效地抑制内源序列。超过约80%的大大提高的同一性是优选的,而大约95%到绝对同一性是最优选的。至于反义调节,这种作用应当施加于显示同源性或基本同源性的类似基因家族内的其它蛋白质。
为了共抑制,导入表达盒内的序列,需要低于绝对同一性,相对于初级转录产物或完全加工的mRNA,也不必是全长的。为了避免同时产生过量表达的某些植物,这可能是优选的。短于全长序列的更高同一性补偿较长的同一性较低的序列。此外,导入的序列也不需要含有相同的内含子或外显子模式,非编码片段的同一性同样有效。反义调节通常使用上述大小范围的序列。
一种有效的负调节基因的方法是使用发夹RNA构建体。为有效、高通量基因沉默设计这种构建体的指南已经描述(Wesley SV等人(2001)Plant J.27581-590)。减少基因(内源或外源的)表达的另一种方法是通过siRNA。siRNA能够应用于植物并被植物细胞吸收;此外,siRNA也能够由一种表达盒在体内表达。
实验提供下列实施例是为了证明并进一步说明本发明的某些优选实施方案和方面,不能视为限制其范围。
在下列实验公开内容中使用下列缩写N(正常);M(体积摩尔);mM(毫体积摩尔);μM(微体积摩尔);mol(摩尔);mmol(毫摩尔);μmol(微摩尔);nmol(纳摩尔);pmol(皮摩尔);g(克);mg(毫克);μg(微克);ng(纳克);l或L(升);ml(毫升);μl(微升);cm(厘米);mm(毫米);μm(微米);am(纳米);℃(摄氏度);PCR(聚合酶链反应);RT-PCR(反转录酶-PCR);TAIL-PCR(热不对称交错-PCR);EST,表达序列标签;BLAST;FAME,脂肪酸甲酯;GC/MS,气相色谱/质谱;TLC,薄层层析;SC介质;NT介质;MES;2,4-D;CPA-FA,环丙烷脂肪酸;CPE-FA,环丙烯脂肪酸;DHSA,二氢苹婆酸;SCPA-FAS,苹婆环丙烷脂肪酸合酶;MSU,密歇根州立大学。
实施例1实验方法材料发育种子从1998年7月20日到10月15日在迈阿密Montgomery植物学中心(Florida USA 33156-4242)采集发育的臭苹婆种子。在收到新鲜的种子后,除去种子的外壳,立即用新鲜的子叶和胚进行标记实验,或者冻存于-80℃,随后进行RNA提取和脂类分析。
烟草悬浮细胞烟草悬浮细胞(烟草亮黄2栽培种)保存于含有Murashige和Skoog碱盐(Gibco,Grand island,NY)、3%蔗糖、2.5mM MES/KOH pH5.7、1mg/ml硫胺素、1mg/ml肌醇和1μM 2,4-D的液体培养基中。培养物每周用来自7天培养物的5%(v/v)接种物传代培养,在200ml摇瓶中28℃振摇。
化学物质放射性同位素,L-[甲基-14C]甲硫氨酸(55mCi/mmol),[1-14C]乙酸(55mCi/mmol)和[1-14C]油酸(50mCi/mmol)购自AmericanRadiolabeled Chemicals,Inc.。
脂类分析为了测定苹婆种子发育过程中的脂肪酸积累,在脂类抽提前向200mg种子组织(鲜重)中加入2mg三酰基甘油(13:0-1.89mg)作为内部标准。在每个发育阶段,按照Bligh和Dyer(1959)Can J BiochemPhysiol 37,911-917)的方法抽提脂类。脂肪酸甲酯(FAMES)如下制备将一等份脂类提取物转移到一个新试管中,在氮气下干燥该提取物。向每个试管中加入2.5ml 1%甲醇钠甲醇溶液和2.5ml庚烷,混合物在室温下涡旋2-3分钟。向每个试管中加入2.5ml水,短暂涡旋混合物。如下抽提FAMES用2.5ml己烷洗涤混合物三次,然后用3.0ml水洗涤合并的有机相两次,并在氮气下干燥。然后使用配备自动加样器和HP MSD 5972质量分析仪的Hewlett Packard 5890气相色谱仪,通过GC-MS分析FAMES(重复四次,以电子碰撞模式操作)。FAMEs的分离在长30m直径0.25mm的DB 23柱上进行。
对酵母和烟草悬浮细胞的脂类抽提、脂肪酸甲酯的制备和GC/MS分析按照与以上对于苹婆种子所述相同的方法进行,不同之处在于不加内部脂肪酸标准。为了精确地测定转基因烟草悬浮细胞中二氢苹婆酸(DHSA)的身份,通过银化TLC分离饱和及不饱和脂肪酸甲酯(Morris等人(1967)J Chromatography 3169-76)。银化板(15%硝酸银)在甲苯中在-20℃下顺序显色至高度为8、13、19cm。通过喷射0.2%(w/v)2′,7′-二氯荧光素甲醇溶液定位板上的脂肪酸甲酯。将银化板顶部的饱和脂肪酸甲酯带刮到试管中,用6ml己烷∶乙醚(2∶1,v/v)洗脱回收,通过GC/MS分析。
环丙烷脂肪酸合成的测定在含有0.1ml无细胞匀浆、0.02-0.05mM油酰-CoA和0.02mM[14C-甲基]S-腺苷甲硫氨酸底物的总体积为0.2ml的反应混合物中,测定组织匀浆中的环丙烷脂肪酸合酶。油酰-CoA的存在使活性比不存在时提高约两倍,但是更高浓度的油酰-CoA是抑制性的。粗提物中S-腺苷甲硫氨酸的Km为0.02mM。该测定混合物在30℃下温育1小时。加入0.5ml KOH水溶液和1.0ml乙醇终止试验,静置过夜,使脂质完全皂化。酸化后,将标记的游离脂肪酸抽提到己烷中,然后用水洗涤己烷相,蒸发干燥。测定一等份有机相的放射性。其余的产物通过TLC分析。一部分脂肪酸产物也可以用醚重氮甲烷衍化。
放射性标记发育的苹婆种子和转基因烟草细胞用8月25日采集的发育的种子进行标记实验。将一个子叶切成8片,在室温和恒定振摇下在0.5ml标记缓冲液(50mM磷酸缓冲液pH7.0,含5μCi放射性同位素)中温育。在30、60、120分钟时通过直接脂质抽提终止标记。来自这些样品的脂肪酸甲酯用C18反相TLC在乙腈∶甲醇∶水(75∶25∶0.5,v/v)溶剂系统中分离。放射性用快速成像仪显示。
将独立的转基因愈伤组织转移回液体培养基中,细胞如上所述传代培养。传代培养3天后,向培养基中加入5μCi L-[甲基-14C]甲硫氨酸或[1-14C]油酸,细胞再温育24小时。然后短暂离心收集细胞,随后进行脂质抽提和脂肪酸甲酯的制备。通过银化TLC使饱和脂肪酸与不饱和脂肪酸分离,各种饱和脂肪酸通过C18反相TLC彼此分离,回收放射性斑点进行GC/MS分析。
文库构建与测序将来自8月5日、8月25日、9月10日和9月30日采集的种子的等量发育种子合并在一起。在这段时间内,显示油沉积线性升高(参见实施例2)。将10克合并的发育种子在液氮中研磨成细粉。如Schultz等人(1994)所述提取RNA。分离的总RNA的质量通过1%甲醛琼脂糖凝胶分离分析。按照Stratagene(11011 North Torrey Pines Road,LaJolla,CA 92037)的方法,由发育的苹婆种子的分离的总RNA制备cDNA文库。将cDNA定向克隆到Uni-ZAP的EcoRI和XhoI位点处。根据Stratagene提供的方案进行大量酶切。挑取总共21,120个克隆,在220块96孔板上培养。220块板中的28个在MSU测序设施内直接测序。其余192块板(18432个克隆)用Genome System点样到滤纸上进行文库扣除。根据未扣除文库前1500个序列获得的信息,选择三个最丰富的序列从文库中扣除到滤纸上。重新放置(re-rack)并测序总共70块96孔板。
用于烟草和酵母表达的构建体根据与细菌环丙烷合酶的序列同源性鉴定一种推断的苹婆环丙烷合酶(SCPA-FAS)基因。推断的(SCPA-FAS)的整个cDNA长2977bp,由两个重叠的克隆R50-D5(1-1732bp)和C15-C3(933-2977bp)编译。这两个克隆都从两条链测序。为了将完整的推断SCPA-FAS放置在一起,用引物JO886(TCCTCTAGACTCGAGCCCGGGATGGGAGTGGCTGTGATCGGTGGTGGGATC)和JO883(GTTGTAAGACGTCGTGTAACTCGGTC ATACAATTCG)从克隆R50-D5中扩增编码氨基酸1-335的序列,用引物JO884(CAATGTGCTGCAGAATGTTGGGAAAACAAGTCAGCC)和JO885(GGGAGATCTCGAGCCTATTTACTTTTGATAAAGTTAATAGGC)从克隆C15-C3中扩增编码氨基酸336-864且含有终止密码子的序列。为便于克隆,在氨基酸335赖氨酸的密码子的第三个位点处进行无效突变,将赖氨酸密码子由CTA变为CTG,使得能够产生PstI位点。将上游片段插入pBluescript KS的XhoI和PstI位点处,下游片段插入PstI和XbaI处。获得的构建体被命名为pBluescript KS-SCPAS;该构建体从两条链重新测序,发现没有错误。完整的SCPA-FAS从pBluescript KS的SmaI和XbaI位点处释放,插入二元载体pE1776的SmaI和XbaI位点之间。pE1776携带组成型启动子“超级启动子”和一个ags终止子。获得的构建体被命名为pE1776-SCPAS,转移到农杆菌LBA4404株内,以进行烟草悬浮细胞转化。
对于酵母构建体,为了产生EcoRI位点上游,使用引物JO968(GCCCTCGAGAATTCTAAAATGTCTGTGGCTGTGATCGGTGGTGGGATCCAAGGGCTGG)和JO883R(GTTGTAAGACGTCGTGTAACTCGGTCATACAATTCG)从克隆R50-D5中扩增氨基酸1-335。PCR片段用XhoI和PstI消化,用来替换构建体pBluescriptKS-SCPAS中的相应部分。用EcoRI和XbaI释放SCPA-FAS,插入酵母载体pYES2/CT(Invitrogen)中。获得的构建体被命名为pYES2/CT-SCPAS。
SCPA-FAS在酵母和烟草悬浮细胞中的表达使用S.c.EasyCompTM转化试剂盒(Invitrogen目录号K5050-01),用构建体pYES2/CT-SCPAS转化酵母株InvSc1。为了表达SCPA-FAS,含有pYES2/CT-SCPAS的酵母菌落接种50ml含有2%半乳糖和200mg/L油酸的SC培养基。培养物在28℃和150转/分振摇下培养。生长48小时后,短暂离心收集酵母细胞;从沉淀中提取酵母脂质,由提取的脂质制备脂肪酸甲酯,通过GC/MS分析。
农杆菌介导的烟草转化如Rempel和Nelson(1991)所述进行。农杆菌培养物生长过夜,向3天烟草悬浮细胞的4ml样品中加入100μl含有适当构建体的培养液。细胞然后在28℃下培养3天,通过短暂离心沉淀,用含有100μg/ml卡那霉素和500μg/ml羧苄青霉素的NT培养基洗涤三次。洗涤的细胞扩散到选择平板上(添加0.7% phytagar、100mg/L卡那霉素和500mg/ml羧苄青霉素的NT培养基)。3-4周后,将独立的转化子转移到新平板上。一旦收集到足够的组织,即提取脂质,并通过GC/MS分析脂肪酸组成。
实施例2来自发育的臭苹婆种子的环丙烷合酶的鉴定环丙烷脂肪酸合酶的测定从发育的臭苹婆种子中收获并在-70℃下冻存的冷冻胚乳组织在液氮中研磨为细粉。一份重量的粉末在两倍体积的缓冲液中融化,该缓冲液含有0.1M Na tricine,pH7.0、1% w/v脱脂BSA、1% w/vPVP-40、15% v/v甘油和1mM β-巯基乙醇。浆液短暂匀浆,通过微孔布(miracloth)过滤。滤液贮存于冰上。剩余的糊在两倍体积的上述缓冲液中重新匀浆,再次过滤,滤液与第一次的滤液合并。合并的滤液被称为“无细胞匀浆”,能够进行酶测定或者随后进行分级分离。使用Tricine缓冲液(对比tris或磷酸缓冲液)、使用pH7.0(对比pH6.4或7.8)和添加BSA和PVP-40(对比不添加)均使无细胞匀浆中恢复的活性提高约2倍。
环丙烷脂肪酸合酶的活性如上所述测定。当不加衍化即进行分析时,标记的游离脂肪酸是皂化产物中的主要成分(>90%)。当用醚重氮甲烷衍化后分析时,标记的脂肪酸甲酯是主要产物(>90%)。当通过C18反相TLC分析标记的脂肪酸甲酯时,一个放射性斑点与二氢苹婆酸甲酯标准同时洗脱下来。因此皂化后在己烷中回收的放射性是[14C-甲基]二氢苹婆酸中总标记物的一个良好量度。
测定最大环丙烷脂肪酸合酶活性的数量级为0.5-1nmole/min/g种子组织鲜重。该活性易被多种去污剂((CHAPS,Triton-X100,辛基葡糖苷,去氧胆酸钠,氯化十六烷基吡啶和溶血磷脂胆碱)抑制。在分级分离研究中,在10,000×g离心5分钟后,大多数活性保留在上清液加脂肪层级分中。随后以100,000×g离心1小时产生微粒体沉淀,其中含有在无细胞匀浆中发现的总环丙烷脂肪酸合酶活性的72%,但是仅仅占总蛋白质的1.5%,使比活性提高48倍。离心过程中去污剂的作用和活性行为与作为膜结合或整合膜蛋白的环丙烷脂肪酸合酶一致。当通过脂质抽提终止与无细胞匀浆的反应时,发现大多数标记的二氢苹婆酸在磷脂酰胆碱级分中。这提示油酰磷脂酰胆碱是该酶的一种底物。
因此,最初对环丙烷脂肪酸合酶的测定和对活性的表征表明,发育的臭苹婆种子能够合成CPA-FA。而且,该酶似乎是一种膜结合或整合膜蛋白,底物似乎是油酰磷脂酰胆碱。
种子发育过程中的脂质沉积从1998年7月20日到10月15日,在100天内的7个时间点,在迈阿密Montgomery植物学中心采集发育的臭苹婆种子。每个荚含有10-20个种子。在7月份,这些荚呈暗绿色,种子呈白色;当种子发育后,荚的颜色逐渐变红,而种子变成褐色。7月20日第一次采集的子叶仍然含有很多水份,10月28日最后一次采集的种子几乎完全干燥。除了最后一次采集(种子十分干燥)之外,所有采集的种子的脂肪酸都如上所述分析。
发育的种子的脂肪酸积累情况如图2所示。结果表明,从8月5日到10月14日,总脂肪酸和CPE-FAs以线性速度积累。在同一时间内,CPE-FAs的百分比从总脂肪酸的40%上升到60%。90天时的脂肪酸组成与报告的成熟种子的数据非常类似(Bohannon和Kleiman(1978)Lipids 13(4)270-273)。
这些结果也提示,如果最初的假说是正确的,CPE-FAs来源于CPA-FAs,则发育的臭苹婆种子具有高环丙烷脂肪酸合酶活性,应当是编码该酶的mRNA的良好来源。
编码环丙烷合酶的cDNA的鉴定和分离为了使cDNA文库中环丙烷合酶和去饱和酶的含量最大,应当使用处于CPE-FAs以最高速度积累阶段的发育的臭苹婆种子制备cDNA文库。如图2所示,从8月5日到10月14日CPE-FAs基本以线性速度积累。因此,将8月5日、8月25日、9月10日、9月30日和10月14日采集的等量的发育种子合并在一起,进行RNA提取。
将RNA运至Stratagene进行cDNA文库构建。主要的噬斑为2.6×107pfu,平均插入片段大小为1.7kb。如上所述进行大量酶切后,挑取总共21,120个克隆,在220块96孔板中生长。28块板在密西根州立大学测序设施直接测序。获得约1500个平均阅读长度为500bp的序列。在NCBI对这1500个未扣除的序列进行Blast搜索(翻译BLAST搜索核苷酸查询-蛋白质db[blastx]),鉴定出豆球蛋白A、豆球蛋白B和一种非特异的脂转移蛋白是3种最丰富的序列;选择这些序列进行随后的文库扣除。其余192块(18,432个克隆)板用GenomeSystem点样到滤纸上,进行文库扣除。选择的三个序列代表滤纸上约30%的克隆。总共70个96孔板(除去或扣除阳性克隆)重新放置;对所有这70块板测序。获得约3800个500bp的序列。也对这些序列进行Blast搜索。
根据blast结果,23个EST显示与细菌环丙烷合酶有一定水平的相似性。编译这些EST序列后,非常清楚地显示所有23个EST均来自同一基因。图3显示了EST沿该基因的分布。装配一个全长克隆,图4显示了该基因的核酸序列。预测的推断环丙烷合酶长864个氨基酸,如图5所示。细菌环丙烷合酶长382个氨基酸,不到苹婆环丙烷合酶大小的一半。苹婆酶与大肠杆菌酶的对比显示,苹婆序列与大肠杆菌序列在重叠区(羧基端)上有49%相似(188/376)且32%相同(122/376)(参见图6)。苹婆酶在氨基端还有约470个氨基酸。
实施例3来自苹婆的环丙烷脂肪酸合酶的表征在酵母中对推断的SCPA-FAS的功能分析酵母细胞具有几个特征,使其成为一种特别有用的检测生物,用于评价从发育的苹婆种子分离的推断的SCPA-FAS基因实际上是否编码SCPA-FAS。这些特征包括以下事实酵母是真核生物,其脂肪酸组成非常简单,仅由16:0、16:1、18:0和18:1组成。因此,如果在用编码SCPA-FAS的基因转染的酵母中能够检测到二氢苹婆酸,则可证实SCPA-FAS作为一种环丙烷合酶起作用。
使用酵母表达载体pYES2/CT,如上所述将SCPA-FAS编码序列置于半乳糖诱导型启动子控制下。同样如上所述,用该表达载体转染酵母并培养。根据油酸(18:1)9)最可能是该酶的前体这一假设,向培养基中加入油酸至终浓度为200mg/L。分析15个含有pYES2/CT-SCPAS的酵母菌落和5个含有pYES2/CT-LacZ的对照菌落的脂肪酸,结果在图6中显示。
如图6(A)所示,油酸高效地掺入酵母脂质中。饲养实验中使用的油酸污染一定的亚麻酸(18:2)也是明显的,因为GC谱在32.78分钟时出现亚麻酸。如图6(B)所示,用SCPA-FAS基因转染的所有15个细胞集落中均有保留时间为34.44分钟的一个独特的小峰,但是在所有对照样品中都没有。根据以下两条证据,该峰被确定为二氢苹婆酸脂肪酸甲酯。第一,该峰的保留时间与二氢苹婆酸甲酯标准相同。第二,该峰的质谱与二氢苹婆酸甲酯标准相同,如图6(C)所示。因此,来自苹婆的推断的SCPA-FAS酶作为环丙烷合酶起作用。
推断的SCPA-FAS烟草悬浮细胞的功能分析尽管SCPA-FAS的功能在酵母系统中得到证实,但是评价其在植物组织中的功能是重要的。烟草悬浮细胞(亮黄2)有几个特征,尤其可作为一种检测植物系统,用于评价从发育的苹婆种子中分离的SCPA-FAS基因在转基因植物细胞中的功能。该细胞系是充分表征的细胞系,非常容易转化。悬浮细胞不含任何CPA-FAs,在转化后的40天内可为脂质分析提供足够的组织。甚至更为重要的是,已经充分证实烟草愈伤组织更耐受异常脂肪酸。
在组成型启动子的控制下,编码SCPA-FAS的核酸转化烟草悬浮细胞;同时,也用一种空载体转化烟草细胞作为对照。转化后,将独立的转化子转移到新平板上,以20天的间隔传代培养。从含有pE1776-SCAPS的15个转化子和含有空载体pE1776的12个对照转化子中提取脂质。提取脂质,如上所述从这些样品中制备脂肪酸甲酯。用银化TLC将饱和FAMEs与其它FAMEs分离;然后通过GC/MS分析饱和FAMEs,以及DHSA甲酯标准。这些结果在图7中显示。用空载体pE1776转化的对照烟草愈伤组织中的主要饱和脂肪酸是16:0、18:0和一些20:0,如图7(A)所示。在用推断的苹婆环丙烷合酶(SCPA-FAS)转化的待测烟草愈伤组织中,存在与对照样品中相同的脂肪酸,有保留时间为35.69分钟的另一个凸峰,如图7(B)所示。通过与二氢苹婆酸标准对比,它与另一个峰有相同的保留时间——35.69分钟,如图7(C)所示,从而确定该凸峰为二氢苹婆酸。为了证实它的身份,该凸峰用质谱法进一步分析;结果在图8中显示。对照二氢苹婆酸的质谱的特征在于310的分子离子,以及其它独特离子,如278(M-32)和236(M-74),如图8(B)所示。保留时间为35.69分钟的另一个峰的质谱,如图8(D)所示,与二氢苹婆酸标准几乎相同。因此,根据保留时间和质谱对比,在用编码苹婆CPA-FAS的核酸转化的烟草愈伤组织中发现的另一种脂肪酸被确定为二氢苹婆酸。分析了用编码苹婆CPA-FAS的核酸转化的15个独立转化子的脂肪酸组成,这些转化子中的二氢苹婆酸含量为3%-6%,如图9所示。二氢苹婆酸的平均含量约为4%。
环丙烷环形成的阐明Yano等人((1972)Lipids 735-45)根据放射性同位素标记实验提出的苹婆酸合成途径是,首先由油酸形成二氢苹婆酸,随后二氢苹婆酸去饱和为苹婆酸。Yano等人进一步提出,该环的亚甲基来源于甲硫氨酸的甲基。使用发育的苹婆种子进行的预标记研究证实了这一提议。当发育的种子用14C-甲硫氨酸标记时,大多数放射性首先在DHSA中发现,少量存在于苹婆酸中;通过较长时间的温育,苹婆酸中积累更多的放射性。
使用以编码SCPA-FAS的核酸(SCPAS-2和SPAS-11,用pE1776-SCPAS转化的两个独立转基因系)或一种空载体转化的烟草悬浮细胞进行其它标记实验。悬浮细胞与[1-14C]油酸或L-[甲基-14C]甲硫氨酸温育24小时。然后用银化TLC从标记的细胞中分离FAMEs,用快速成像仪显示放射性的分布。当与[1-14C]油酸温育时,携带编码SCPA-FAS的核酸的待测转化子在仅含饱和脂肪酸的最上一条带中产生总放射性的约3.5%,而携带空载体pE1776的对照转化子不产生与饱和脂肪酸结合的放射性。这些结果证实,SCPA-FAS的存在导致油酸(18:1)转化为饱和脂肪酸,最可能的是二氢苹婆酸。而且,吸收的大多数[1-14C]油酸进一步去饱和为亚油酸(18:2)。当细胞与L-[甲基-14C]甲硫氨酸一起温育时,仅在编码SCPA-FAS的核酸转化的细胞的饱和脂肪酸带中发现放射性,而对照细胞中未发现。根据以前对待测和对照转化子的饱和脂肪酸的分析,这两者之间的不同仅在于只在含有编码SCPA-FAS的核酸的转化子中发现DHSA。因此,与饱和脂肪酸结合的放射性最可能是DHSA。
为了证实放射性脂肪酸实际上是DHSA,由pE1776-SCPAS-2获得的饱和FAME在与[1-14C]油酸或L-[甲基-14C]甲硫氨酸温育后从银化板上洗脱下来,通过C18反相TLC分离各种饱和FAMEs。来自[1-14C]油酸或L-[甲基-14C]甲硫氨酸的标记放射性FAMEs与DHSA标准位于相同的位置。然后从C18板上洗脱放射性斑点,通过GC/MS分析。根据保留时间和质谱,鉴定放射性FAMEs为DHSA。
综合起来,这些结果证实,SCPA-FAS通过将来自S-腺苷甲硫氨酸的亚甲基转移给油酸合成二氢苹婆酸。
实施例4抗苹婆环丙烷合酶抗体的制备针对在细菌表达系统中表达的苹婆环丙烷脂肪酸合酶(CPA-FAS)制备抗体。为了抗体生产,选择该蛋白质的保守羧基端区(约390个氨基酸),PCR扩增,并在大肠杆菌中表达,其含有一个HIS尾。苹婆与细菌CPA-FAS之间的排比在图11中显示;苹婆CPA-FAS从大约氨基酸470到氨基酸864的部分用来制备抗体。
使用的载体是pET28a(+)(Novagen,Inc.,601 Science Drive,Madison,WI 53711),其中插入位点是EcoRI和SacI。
用来扩增部分苹婆环丙烷合酶的PCR引物如下JO873CCGGAATTCTGTTCTCTTAAAACAGCTCTGAAAGTGCJO885CCCTCTAGAGCTCGGATAAATGAAAACTATTTCAATTATCCG引物在苹婆环丙烷合酶中的位置如图12所示。PCR反应在下列条件下进行模板[R15-C3]5.0μl缓冲液[10×]10.0μldNTP[10mM] 2.0μlJO873[4.1pM/μl]9.0μlJO885[7.3pM/μl]5.0ul水 68.5μl
PWO 0.5μl94℃ 5min94℃ 30s55℃ 30s72℃ 30s30个循环72℃ 7min三种不同的样品进行PCR,被称为EA-I、EA-II和EA-III。反应后,PCR片段用Qiagen PCR纯化试剂盒纯化。PCR片段和载体然后用限制性内切酶EcoRI和SacI消化。通过使用T4 DNA连接酶在4℃下连接过夜,将PCR片段插入载体内,插入片段∶载体比例为4∶1。获得的构建体被命名为pET28a-EA-I、pET28a-EA-II和pET28a-EA-III,转化DH5α。筛选菌落,鉴定正确的构建体;由pET28a-EA-II-4和pET28a-EA-III-5制备自旋剂(spin-preps)。为了蛋白质表达,用这两种构建体转化BL21。表达的蛋白质如图13所示,突出的氨基酸序列的部分来源于该载体,其中含有一个六组氨酸尾便于纯化。
然后如下诱导部分苹婆CPA-FAS的表达用含有pET28a-EA-II-4或pET28a-EA-III-5的BL21接种2ml含50μg/ml卡那霉素的LB,在振摇下37℃培养过夜。次日早晨,用1.5ml过夜培养物接种500ml含50μg/ml卡那霉素的LB;细胞生长2.5小时。然后加入IPTG至终浓度为0.5mM。细胞再生长5小时,以5,000g离心10分钟收集。收集的细胞贮存于-20℃,或者直接用于蛋白质提取。
如下从收集的细胞中提取蛋白质来自500ml培养物的细胞重悬浮于60ml细胞裂解缓冲液中(20mM Tris-HCl,pH7.4;0.2mM NaCl;10mM β-巯基乙醇;1mM苄脒;1%(v/v)Triton X-100;和1mMPMSF)。在50瓦下利用三次20秒的脉冲,在冰上通过超声处理破坏细胞,悬液以10,000g离心20分钟。可溶性级分是上清液,不可溶级分含有包涵体。
如下从不可溶级分中纯化包涵体将不可溶级分重悬浮于8ml缓冲液中(50mM Tris-HCl,pH8.0;1mM EDTA;25%(w/v)蔗糖;和25mg溶菌酶)。然后加入MgCl2、MnCl2和DNase I至终浓度分别为10mM、1mM和10μg/ml。混合物在室温下温育30分钟,加入20ml下列缓冲液(0.2M NaCl;1%脱氧胆酸;1.6%(v/v)TritonX-100;20mM Tris-HCl,pH7.5;和2mM EDTA)。混合物以5000×g离心10分钟,将沉淀重悬浮于0.5%triton X-100/1 mM EDTA中,再次离心。重复这一过程,直到获得压紧的沉淀。
包涵体然后进行10% SDS PAGE,切下部分苹婆CPA-FAS的优势带,贮存于-20℃。将冷冻的凝胶片送到Cocalico Biologicals,Inc.(Reamstown,PA),在兔中制备抗体。
实施例5来自棉花的环丙烷脂肪酸合酶的鉴定和表征编码棉花CPA-FAS的序列的鉴定利用苹婆CPA-FAS的氨基酸序列blast搜索NCBI EST数据库。发现有三个ESTs来自于棉花。所有这三个均来自同一文库(从7-10天后收获的棉铃中分离的纤维),在Clemson大学遗传学研究所测序。这些EST如下命名和描述,在图14中显示。
EST1gi|13351381|gb|BG441729.1|BG441729GA_Ea0014H01f7-10dpa纤维文库树棉cDNA克隆GA_Ea0014H01f.
EST2gi|21094588|gb|BQ406901.1|BQ406901GA_Ed0100C02f树棉7-10dpa纤维文库树棉cDNA克隆GA_Ed0100C02f.
EST3互补gi|18099677|gb|BM358931.1|BM358931GA_Ea0014H01r树棉7-10dpa纤维文库树棉cDNA克隆GA_Ea0014H01r.
根据重叠群分析,确定EST2和EST3是重叠的ESTs,命名为EST2-3,如图15所示。两个重叠群——EST1和EST2-3以及EST2和EST3的预测的氨基酸序列在图16中显示。两个重叠群——EST2和EST2_3的预测的氨基酸序列与苹婆CPA-FAS的序列的排比在图17中显示。
EST序列中测序错误的普遍存在常常需要对EST编码的预测的氨基酸序列进行另外的分析。在有些情况下,这是由于测序错误导致移码的情况,导致不连续的氨基酸序列;换句话说,EST中编码序列的直接翻译可能不产生全长多肽片段。因此,预测的氨基酸序列能够与一种已知序列排比,以便能够发现错误;更正这些错误,重新构建连续的氨基酸序列。对三个棉花EST的分析显示,EST3含有几个明显的测序错误。通过比较编码序列与苹婆CPA-FAS氨基酸序列的类似区,发现两个明显的阅读框,阅读框+2和阅读框+3,如下阅读框+2 阅读框+3 组合这两个阅读框,产生下列氨基酸序列;该序列(SEQ ID NO9)包含上述阅读框+2和+3的突出部分,如图16所示。
组合的阅读框 棉花CPA-FAS的表征使用抗苹婆CPA-FAS抗体的Western印迹分析如实施例4所述制备的抗苹婆CPA-FAS抗体用来染色通过下列方法从棉花和苹婆蛋白质提取物中获得的蛋白质提取物。苹婆如前所述栽培,提取胚组织。棉花植物(陆地棉)在生长室中在14小时光线、10小时黑暗循环下生长。发芽2周后从这些植物上采集根、茎、叶组织。开花约10天后,从温室中在自然光线和温度条件下生长的棉花植物上采集胚组织。Western印迹和脂肪酸分析使用相同类型的组织。
从棉花胚、叶、茎、根和苹婆胚中获得组织样品。通过在2ml冰冷的缓冲液(20mM Tris-HCl,pH7.5,0.2M NaCl,10mM β-巯基乙醇)中匀浆0.5gm组织,获得蛋白质提取物。测定匀浆中的蛋白质浓度,然后将150μg棉花组织蛋白质和20μg来自苹婆胚的蛋白质加到8% SDS聚丙烯酰胺凝胶上。电泳后,将分离的蛋白质转移到硝酸纤维素膜上进行Western印迹分析,其中使用抗苹婆CPA-FAS抗体。
Western印迹分析的结果在图18中显示,其中棉花组织提取物中的蛋白质与苹婆抗体结合;根据这种抗体结合,和棉花组织中EST序列的存在,该蛋白质被鉴定为一种棉花CPA-FAS。结果证实,抗苹婆CPA-FAS抗体与棉花CPA-FAS极好地交叉反应,表明这两种蛋白质非常类似。而且,棉花CPA-FAS的大小与它在苹婆中的对应物几乎相同。在棉花中,CPA-FAS在幼小的胚、茎、根组织中高表达,但是在叶组织中不表达。这些发现与这些组织中碳环脂肪酸的产生通常一致,如下所述。
脂肪酸分析分析来自棉花胚、叶、茎、根组织的脂肪酸,结果如下所示。
总环丙烯脂肪酸,包括18:1c+19:1c根 34%茎 27.5%叶 0.00%胚 0.3%总环丙烷脂肪酸,包括19:0c
根 0.88%茎 0.48%叶 0.00%胚 0.23%表1.棉花组织的脂肪酸分析脂肪酸 根 茎 叶 胚16:0 25.922.121.028.416:1 0 0 0 0.518:1c 25.118.30 0.318:0 0.5 0.5 2.9 1.618:1 2.9 7.0 14.712.218:2 21.527.539.556.719:1c 8.9 9.2 0 019:0c 0.9 0.5 0 0.218:3 14.315.021.92 0.1这些结果证实,在棉花根和茎组织中,环丙烷和环丙烯脂肪酸分别包含总脂肪酸的约30%和约35%。但是在更成熟的胚组织中,这些脂肪酸仅含有总脂肪酸的约2%,叶组织中不含。在根和茎组织的这些脂肪酸中,锦葵酸是最丰富的,在根和茎组织中分别占总脂肪酸的约25%和约20%。
因此,通过如上所述的Western印迹分析证实,在棉花组织中,不同组织中CPA-FAS的丰度与环脂肪酸的百分比通常一致。应当指出,在发现环脂肪酸的植物中,环丙烷和环丙烯脂肪酸在种子发育的极早期合成,它们最初能够代表相对高比例的总脂肪酸;然而,随着种子成熟,这些脂肪酸的合成减少,以致成熟种子组织中这些脂肪酸的比例降到相当低的水平。
在不背离本发明的范围和精神的情况下,本领域技术人员理解本发明描述的方法和系统的多种修饰和变化。尽管已经通过具体优选实施方案对本发明进行了描述,但是应当理解,本发明不只限于这些具体实施方案。实际上,材料学、化学和分子生物学或相关领域技术人员所知的用来实施本发明的方式的不同修改都属于下列权利要求书的范围之内。
权利要求
1.一种组合物,其含有编码植物环丙烷脂肪酸合酶的分离的核酸序列。
2.权利要求1的组合物,其中所述植物来自锦葵目。
3.权利要求2的组合物,其中所述植物是一种苹婆属植物或棉花植物。
4.权利要求3的组合物,其中所述苹婆属植物是臭苹婆植物,或者所述棉花植物是树棉植物。
5.权利要求4的组合物,其中所述核酸序列包含SEQ ID NO1,或者至少SEQ ID NOs3-6之一,或者在高严格条件下与SEQ ID NO1或至少SEQ ID NOs3-6之一杂交的核酸序列。
6.一种组合物,其含有权利要求1、2、3、4或5中任一项的核酸序列,该序列与一个异源启动子有效连接。
7.一种组合物,其含有一种载体,该载体包含权利要求1、2、3、4或5中任一项的核酸序列。
8.一种组合物,其含有一种纯化的多肽,该多肽由权利要求1、2、3、4或5中任一项的核酸序列编码。
9.一种组合物,其含有纯化的植物环丙烷脂肪酸合酶。
10.权利要求9的组合物,其中所述植物来自锦葵目。
11.权利要求10的组合物,其中所述植物是一种苹婆属植物或棉花植物。
12.权利要求11的组合物,其中所述苹婆属植物是臭苹婆,或者所述棉花植物是树棉植物。
13.权利要求12的组合物,其中纯化的环丙烷脂肪酸合酶含有氨基酸序列SEQ ID NO2,或者含有至少氨基酸序列SEQ ID NOs7-10之一,或者含有SEQ ID NO11。
14.一种组合物,其含有一种分离的核酸序列,该序列编码权利要求9、10、11、12或13中任一项的环丙烷脂肪酸合酶。
15.用编码植物环丙烷脂肪酸合酶的异源基因转化的一种生物,其中该基因含有权利要求1、2、3、4或5中任一项的核酸序列,或编码权利要求9、10、11、12或13中任一项的植物环丙烷脂肪酸合酶的核酸序列。
16.用编码植物环丙烷脂肪酸合酶的异源基因转化的一种植物,其中该基因含有权利要求1、2、3、4或5中任一项的核酸序列,或编码权利要求9、10、11、12或13中任一项的植物环丙烷脂肪酸合酶的核酸序列。
17.用编码植物环丙烷脂肪酸合酶的异源基因转化的一种植物细胞,其中该基因含有权利要求1、2、3、4或5中任一项的核酸序列,或编码权利要求9、10、11、12或13中任一项的植物环丙烷脂肪酸合酶的核酸序列。
18.用编码植物环丙烷脂肪酸合酶的异源基因转化的一种植物种子,其中该基因含有权利要求1、2、3、4或5中任一项的核酸序列,或编码权利要求9、10、11、12或13中任一项的植物环丙烷脂肪酸合酶的核酸序列。
19.来自权利要求18的转基因植物的油。
20.用编码植物环丙烷脂肪酸合酶的异源基因转化的一种细菌,其中该基因含有权利要求1、2、3、4或5中任一项的核酸序列,或编码权利要求9、10、11、12或13中任一项的植物环丙烷脂肪酸合酶的核酸序列。
21.来自权利要求20的转基因细菌的油。
22.一种组合物,其含有一种分离的核酸序列,该序列编码含有与植物环丙烷脂肪酸合酶氨基端同源的氨基酸序列的蛋白质。
23.一种组合物,其含有一种纯化的蛋白质,该蛋白质含有与植物环丙烷脂肪酸合酶氨基端同源的氨基酸序列。
24.权利要求23的组合物,其中所述氨基端含有植物环丙烷脂肪酸合酶的约前420个到约470个氨基酸。
25.权利要求24的组合物,其中所述氨基端含有SEQ ID NO2的氨基端的大约前420-470个氨基酸,或者含有氨基酸SEQ ID NO7。
26.一种在植物中表达植物环丙烷脂肪酸合酶的方法,包括a)提供i)一种载体,其含有编码植物CPA-FAS或其部分的核酸序列,和ii)植物组织;以及b)在允许合酶表达的条件下,用该载体转染该植物组织。
27.一种减少植物中CPA-FAS表达的方法,包括a)提供i)一种载体,其含有编码一种反义序列的核酸序列,该反义序列对应于编码植物CPA-FAS或其部分的核酸序列,和ii)植物组织;以及b)在允许反义序列表达且CPA-FAS表达减少的条件下,用该载体转染该植物组织。
28.一种减少植物中CPA-FAS表达的方法,包括a)提供i)编码一种siRNA的载体,该siRNA靶向于编码植物CPA-FAS或其部分的核酸序列,和ii)植物组织;以及b)在允许siRNA表达且CPA-FAS表达减少的条件下,用该载体转染该植物组织。
全文摘要
本发明提供环丙烷脂肪酸合酶基因和蛋白质,及其使用方法。本发明包括该合酶的天然和重组野生型形式,以及突变体和变体形式,其中一些具有相对于野生型合酶发生改变的特征。本发明也提供使用环丙烷脂肪酸合酶基因和蛋白质的方法,包括在转基因生物中的表达,以及在植物油,特别是在种子油中,环丙烷脂肪酸的产生。
文档编号C12N15/82GK1617880SQ02827741
公开日2005年5月18日 申请日期2002年12月20日 优先权日2001年12月21日
发明者X·鲍, J·B·欧赫罗格, M·R·泊拉德 申请人:密执安州立大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1