新型脂肪酸脱羧酶及其用途的制作方法

文档序号:17119320发布日期:2019-03-15 23:38阅读:4973来源:国知局
新型脂肪酸脱羧酶及其用途的制作方法

本发明涉及酶学领域,特别涉及脂肪酸脱羧酶。

发明背景

烷烃和烯烃是化石燃料的主要组分,但它们也天然存在于植物、昆虫、蓝细菌和一些细菌中。还已知硅藻和集落绿藻纲(chlorophyceae)布朗葡萄藻(botryococcusbraunii)产生具有超过21个碳的烷(烯)烃。

大多数烷(烯)烃生物合成途径涉及活化的脂肪酸(酰基-acp或酰基-coa)转化为醛中间体并最终脱羰基为烷(烯)烃。这些反应由多种酶催化。在植物中,通过两种同源推定的氧化还原酶eceriferum1(cer1)和eceriferum3(cer3)的作用,由脂肪酸产生27至33个碳的非常长链烷烃(bernard等,2012,theplantcell,24(7)),3106-18;bourdenx等,2011,plantphysiology,156(1),29-45)。在昆虫中,21至37个碳的角质层烷(烯)烃的合成涉及酰基-酯还原酶和细胞色素p450(qiu等,2012,pnas,109,14858-14863)。在蓝细菌中,该途径由酰基-acp还原酶和醛去甲酰化加氧酶组成(li等,2012,biochemistry,51(40),7908-16;rude等,2011,appliedandenvironmentalmicrobiology,77(5),1718-27)。只有细菌中半乳糖球菌属(jeotgalicoccusspp)和假单胞菌属(pseudomonassp)能够通过游离脂肪酸的直接脱羧产生烃(grant等2015,journaloftheamericanchemicalsociety,137(15),4940-3;rui等,2014,pnas,111,18237-18242;rude等,2011,appliedandenvironmentalmicrobiology,77(5),1718-27)。然而,这些细菌脂肪酸脱羧酶能产生烯烃(带有末端不饱和度)但不能产生烷烃。在微藻中,已知没有催化烃合成的酶。已有尝试去纯化微藻布朗葡萄藻的烷烃合成系统,并且已经表明通过钴-卟啉酶(cobalt-porphyrinenzyme)使脂肪醛中间体脱羰进行该合成(dennis和kolattukudy,1992,pnas,89(12),5306-10)。然而,这种蛋白质从未被鉴定。

因此,对于适合于由脂肪酸产生烷烃/烯烃的酶任仍然有强烈的需求。

发明简述

本发明涉及用于合成烷烃和烯烃的酶的新类别的鉴定,其在微藻中鉴定。这是首次在这些微生物中鉴定出烷烃合成酶。所述酶通过脱羧催化游离脂肪酸转化为烷烃和/或烯烃。所述酶属于存在于原核生物和真核生物中的fad依赖性蛋白质的超家族(gmc(glucose-methanol-choline,葡萄糖-甲醇-胆碱)氧化还原酶),并且其包括多种酶(主要是醇氧化酶)。到目前为止,从生物化学观点来看,没有从微藻中鉴定出gmc氧化还原酶,并且没有其他gmc氧化还原酶超家族成员被鉴定为烷烃合成酶。因此,这是一种应用于生物燃料、绿色化学、诊断和营养的用于合成烷烃和烯烃的新酶。

因此,本发明涉及将多肽或表达所述多肽的细胞在由脂肪酸产生烷烃和/烯烃中的用途,其中所述多肽具有脂肪酸脱羧酶活性并且包含与seqidno1具有至少40%相同性的序列。

优选地,所述多肽包含共有序列g-x-l-(x)4-c-[d/e]-x-g-[a/g]-f-x-[k/r](seqidno4),x是任何氨基酸。可选地或另外地,seqidno1中的c372、r391、y406、q426、h512和n515位中的一个、两个、三个、四个、五个或六个氨基酸是保守的。可选地或另外地,位置388-428之间的至少40%的氨基酸残基是疏水性残基,所述疏水性残基选自由v、i、l、m、f、w、ca和y组成的组。

在更具体的实施方案中,所述多肽包含或基本上由选自以下的氨基酸序列组成:seqidno1-3和5-14以及与它们中的一个具有至少80%相同性的氨基酸序列。

优选地,所述多肽来自藻类,优选微藻或蓝细菌。

优选地,所述脂肪酸和相应的脱羧烷烃和/烯烃包含8至24个碳原子,优选12至22个碳原子。

任选地,所述脂肪酸和相应的脱羧烷烃和/烯烃被一个或几个官能团取代和/或中断。优选地,所述脂肪酸和相应的脱羧烷烃和/烯烃被一个或多个基团取代,所述基团例如羟基、c1-c3醇、c1-c3酰基、c1-c3酯、c1-c3胺、氨基酸基团、c1-c3酰胺、羧基、醛、环氧基、卤素、c1-c3烷氧基、c1-c3硫代烷基、c1-c3亚胺、腈、含硫基团(如c1-c3硫基砜或c1-c3亚砜)、硫醇、硝基、氰基、c1-c3卤代烷基,或可被杂原子如o、n或s、炔基基团、醚(如二乙烯基醚基团)、或者是氧代基团中断。

本发明还涉及由脂肪酸产生烷烃和/烯烃的方法,其中如上定义的多肽与脂肪酸接触并在多肽的fad辅因子存在下进行光照。优选地,所述光的波长在300-540nm之间,更优选在400-520nm之间。例如,所述光是白光或包含蓝色或uv光子的任何光(例如从400到520nm)。

本发明进一步涉及重组宿主细胞,其包含编码如上定义的异源多肽的核酸序列。优选地,所述宿主细胞是细菌、微藻、丝状真菌或酵母。

在第一个实施方案中,所述异源多肽与硫酯酶共表达,优选在微藻、蓝细菌或大肠杆菌中。在另一个实施方案中,所述异源多肽与脂肪酶共表达,优选在细菌或微藻中。

本发明涉及由脂肪酸产生烷烃和/烯烃的方法,其中培养根据本发明的重组宿主细胞并回收所述烷烃和/烯烃。

此外,本发明涉及将如上定义的多肽用于样品中游离脂肪酸的定量(dosage)的用途。更具体地,用于在样品中定量(dosing)游离脂肪酸的方法包括(a)在适于将脂肪酸转化为烷烃/烯烃的条件下,使样品与本发明的脂肪酸脱羧酶接触,(b)回收烷烃/烯烃和/或二氧化碳;和(c)量化烷烃/烯烃和/或co2。可选地,用于在样品中定量游离脂肪酸的方法包括(a)在适于将脂肪酸转化为烷(烯)烃的条件下,使样品与本发明的脂肪酸脱羧酶接触,和(b)测量由所述脂肪酸脱羧酶发出的荧光。任选地,所述方法包括使样品与脂肪酶接触的前置步骤,特别是在适于将脂肪酸转化为游离脂肪酸的条件下。

本发明还涉及将如上定义的多肽用于脂肪酸的脱羧的用途。

发明详述

本发明人鉴定新的一类酶,其能够通过脂肪酸脱羧活性将游离脂肪酸转化为烷烃和烯烃。

定义

约:当在本文中使用时,“约”表示多于或少于10%,优选多于或少于5%。例如,约100意味着在90和110之间,优选地在95和105之间。

编码序列:术语“编码序列”是指多核苷酸,其直接指定多肽的氨基酸序列。编码序列的边界通常由开放阅读框确定,其以起始密码子(如atg,gtg或ttg)开始,并以终止密码子(如taa,tag或tga)结束。编码序列可以是基因组dna,cdna,合成dna或其组合。遗传密码子能针对宿主细胞进行优化。

控制序列:术语“控制序列”是指表达编码本发明酶的多核苷酸所必需的核酸序列。控制序列相对于编码此酶的多核苷酸可以是天然的(即来自相同的基因)或异源的(即来自不同的基因和/或不同的物种)。优选地,控制序列是异源的。众所周知的控制序列并且本领域技术人员目前使用的将是优选的。此类控制序列包括但不限于前导序列,多腺苷酸化序列,前肽序列,启动子,信号肽序列和转录终止子。控制序列至少包括启动子和转录及翻译终止信号。可以向控制序列提供接头,从而达到引入特定的限制性位点,以促进控制序列与编码该酶的多核苷酸的编码区的连接的目的。控制序列和编码序列的功能性组合能称为表达盒。

表达:术语“表达”包括涉及多肽的产生的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。

表达载体:术语“表达载体”是指线性或环状dna分子,其包含编码本发明酶的多核苷酸,并且与为其表达而提供的控制序列可操作地连接。此外,表达载体包含适于表达本发明酶的表达盒。

分离的:术语“分离的”是指在以自然界中不存在的形式或自然界中不存在的环境中的物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质,(2)任何物质,包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子,其至少部分地从与其天然相关的一种或多种或所有天然存在的成分中除去;(3)任何相对于在自然界中发现物质的人工修饰的物质;或(4)通过增加相对于与其天然相关的其他组分的物质的量来修饰的任何物质(例如,编码该物质的基因的多个拷贝;使用比编码该物质基因天然相关的启动子的更强启动子)。

重组体:重组体是指通过基因工程产生的核酸构建体、载体和蛋白质。

异源的:在宿主细胞、载体或核酸构建体的上下文中,其指的是通过基因工程引入宿主细胞、载体或核酸构建体的酶的编码序列。在宿主细胞的上下文中,其意味着酶的编码序列源自与其所引入的细胞不同的来源,或者酶的编码序列来自与其所引入的细胞相同但由于其环境不是天然存在的而被认为是异源的物种,例如因为它在不是其天然启动子的启动子的控制下,或者在不同于其天然位置的位置引入。

核酸构建体:术语“核酸构建体”是指单链或双链的核酸分子,其被修饰或合成为以天然本来不存在的方式包含核酸区段,所述核酸分子包含一个或多个控制序列。

可操作地连接:术语“可操作地连接”是指这样的结构,其中以控制序列指导编码序列的表达的方式,将控制序列置于相对于编码序列的适当位置。

过表送:术语过表达是指在细胞中表达或导致将表达核酸或多肽,其浓度比通常在相应的野生型细胞中表达的更高。

序列相同性:两个氨基酸序列之间的序列相同性由参数“序列相同性”描述。出于本发明的目的,两个氨基酸序列(a)和(b)之间的“百分比相同性”是通过比较窗口,比较以最佳方式比对的两个序列来确定。所述序列的比对能通过众所周知的方法进行,例如使用针对needleman-wunsch的全局比对的算法。蛋白质分析软件使用分配给多种取代、缺失和其它修饰(包括保守氨基酸取代)的相似性测量,来匹配相似的序列。一旦获得总比对,通过将序列(a)和(b)之间比对的相同氨基酸残基的总数除以两者间最长序列中包含的残基总数,能够获得相同性百分比。

通常使用序列分析软件确定序列相同性。为了比较两个氨基酸序列,能够使用例如用于蛋白质成对序列比对的工具“embossneedle”,其通过embl-ebi提供并在以下可获得:www.ebi.ac.uk/tools/services/web/toolform.ebi?tool=emboss_needle&context=protein,使用默认设置:(i)matrix:blosum62,(ii)gapopen:10,(iii)gapextend:0.5,(iv)outputformat:pair,(v)endgappenalty:false,(vi)endgapopen:10,(vii)endgapextend:0.5。

可选地,序列相同性通常也能使用序列分析软件clustalomega运用hhalign算法及其默认设置作为其核心比对引擎来确定。该算法在j.(2005)“proteinhomologydetectionbyhmm-hmmcomparison”,bioinformatics21,951-960以默认设置描述。(www.ebi.ac.uk/tools/msa/clustalo/)

氨基酸:本文定义的氨基酸序列由单字母符号表示,如下所示:a,ala,(丙氨酸);r,arg,(精氨酸);n,asn,(天冬酰胺);d,asp,(天冬氨酸);c,cys,(半胱氨酸);q,gln,(谷氨酰胺);e,glu,(谷氨酸);g,gly,(甘氨酸);h,his,(组氨酸);i,ile,(异亮氨酸);l,leu,(亮氨酸);k,lys,(赖氨酸);m,met,(蛋氨酸);f,phe,(苯丙氨酸);p,pro,(脯氨酸);s,ser,(丝氨酸);t,thr,(苏氨酸);w,trp,(色氨酸);y,tyr,(酪氨酸);和v,val,(缬氨酸)。

通过“基本组成”是指多肽具有指示的seqidno,并且能进一步包含不超过20个氨基酸,优选不超过10个氨基酸的改变(即取代、插入和/或缺失)。特别地,多肽可以具有不超过11、10、9、8、7、6、5、4、3、2或1个氨基酸的改变,例如,可以具有1、2、3、4、5、6、7、8、9或10个氨基酸的取代、插入和/或缺失。取代是指用不同的氨基酸替换占据位置的氨基酸;缺失意味着去除占据位置的氨基酸;并且插入是指在占据位置的氨基酸的附近和紧随其后添加氨基酸。取代能是保守取代。保守取代的实例在以下的组内:碱性氨基酸(精氨酸,赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬氨酸)、疏水性氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳香族氨基酸(苯丙氨酸,色氨酸和酪氨酸)和小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸和蛋氨酸)。通常不改变比活性的氨基酸取代是本领域已知的并被例如由h.neurath和r.l.hill(1979,in,theproteins,academicpress,newyork)所描述。常见的取代如下:ala/ser、val/lle、asp/glu、thr/ser、ala/gly、ala/thr、ser/asn、ala/val、ser/gly、tyr/phe、ala/pro、lys/arg、asp/asn、leu/lle、leuaal,ala/glu和asp/gly。

可选地,氨基酸变化具有改变多肽理化性质的特性。例如,氨基酸改变可以改善多肽的热稳定性、改变底物特异性、改变最适ph等。多肽中的必需氨基酸能根据本领域已知的方法鉴定,例如定点诱变或丙氨酸扫描诱变(cunningham和wells,1989,science244:1081-1085)。在后一种技术中,在分子中的每个残基处引入单个丙氨酸突变,并且测试所得突变分子从l-酪氨酸产生4-hba的能力,以鉴定对分子活性起决定性的氨基酸残基。还参见,hilton等,1996,j.biol.chem.271:4699-4708。酶的活性位点或其它生物相互作用也能通过结构的物理分析来确定,例如通过诸如核磁共振、结晶学、电子衍射或光亲和标记技术,结合所推定的接触位点氨基酸的突变来确定。参见,例如,devos等,1992,science255:306-312;smith等,1992,j.mol.biol.224:899-904;wlodaver等,1992,febslett.309:59-64。必需氨基酸的身份也能从与相关多肽的比对中推断。

使用已知诱变、重组和/或改组(shuffling)的方法能制备和测试单个或多个氨基酸取代、缺失和/或插入,后续进行有关的筛选步骤,例如由以下所公开的那些,reidhaar-olson和sauer,1988,science241:53-57;bowieandsauer,1989,proc.natl.acad.sci.usa86:2152-2156;wo95/17413;或wo95/22625。能使用的其它方法包括易错pcr、噬菌体展示(例如,lowman等,1991,biochemistry30:10832-10837;美国专利号5,223,409;wo92/06204)和区域定向诱变(derbyshire等,1986,gene46:145;ner等,1988,dna7:127)。诱变/改组方法能与高通量、自动化筛选方法组合以检测由宿主细胞表达的克隆的、突变的多肽的活性(ness等,1999,naturebiotechnology17:893-896)。能从宿主细胞中回收编码活性多肽的突变dna分子,并使用本领域的标准方法快速测序。这些方法允许快速确定多肽中单个氨基酸残基的重要性。

保守:通过保守氨基酸意指将定义的序列与参考序列比对,并且对应于参考序列中所示位置的定义序列中的残基与参考序列中存在的残基相同。能通过任何可用的方法进行比对,并且特别是通过上面所公开的用于相同性鉴定的方法,更优选通过clustalomega进行。残基位置在参考序列中指示。

纯化或纯化的:如本文所用,术语“纯化”、“纯化的”或“提纯”是指通过例如隔离或分离从其环境中去除或分离分子。“充分纯化的”分子至少约60%不含,优选至少约75%不含,和更优选至少约90%不含与它们相关的其它组分。如本文所用,这些术语还指从样品中去除污染物。例如,污染物的去除能导致样品中烷烃/烯烃的百分比增加。例如,当在宿主细胞中产生烷烃/烯烃时,能通过去除宿主细胞蛋白来纯化烷烃/烯烃。纯化后,样品中烷烃/烯烃的百分比增加。术语“纯化”,“纯化的”和“提纯”不需要绝对纯度。它们是相对的术语。因此,例如,当在宿主细胞中产生链烯时,纯化的烷烃/烯烃是充分与其它细胞组分(例如,核酸,多肽,脂质,碳水化合物或其他烃)分离的烷烃/烯烃。在另一个实例中,纯化的烷烃/烯烃制剂是其中烷烃/烯烃充分不含污染物(例如在发酵后可能存在的污染物)的制剂。在一些实施方案中,当样品的重量至少约50%由烷烃/烯烃组成时,烷烃/烯烃是纯化的。在其它实施方案中,当样品的重量至少约60%、70%、80%、85%、90%、92%、95%、98%或99%或更多由烷烃/烯烃组成时,链烯是纯化的。

脂肪酸脱羧酶活性:

“脂肪酸脱羧酶活性”是指从脂肪酸中去除羧酸基团,特别是在没有醛中间体且不引入末端不饱和度而直接去除。脂肪酸脱羧酶活性能通过本领域技术人员可用的任何方法测量。更优选地,活性能通过以下方法测量。

在体外酶促测定中,反应在密封的小瓶中进行,小瓶中含有溶解在适当溶剂(乙醇或二甲基亚砜)中的100nmol的底物(通常为c16:0游离脂肪酸),作为内参标准的2nmolc16烷烃,和具有500μl活性缓冲液(50mmtris-hclph8.2,含100mmnacl)的5至10μg纯化的酶(含有其fad辅因子),或总蛋白质提取物。将小瓶在25℃下在白光(或任何含有蓝光子的光)存在下,在2000μmole.photon.m-2.s-1下在旋转搅拌器上以250rpm孵育。然后将浓缩的氢氧化钠(10μl,10m)注入小瓶中以停止反应,并将样品在冰上冷却。用己烷提取烃并通过与火焰离子化检测器和质谱联用的气相色谱法(gc-fid-ms)进行量化。

脂肪酸脱羧酶多肽:

本发明涉及具有脂肪酸脱羧酶活性的多肽,在本文中称为“脂肪酸脱羧酶”,并且包含,基本上由或由与seqidno1,seqidno5或seqidno7,优选seqidno1,具有至少40%相同性的序列所组成。

例如,所述脂肪酸脱羧酶包含,基本上由或由与seqidno1,seqidno5或seqidno7,优选seqidno1,具有至少42%、45%、50%或55%相同性的序列所组成。

在另一方面,所述脂肪酸脱羧酶包含,基本上由或由与seqidno1-3和5-14任一个序列具有至少55、55、60、65、70、75、80、85、90、95或99%相同性的序列组成。

在另一方面,所述脂肪酸脱羧酶包含,基本上由或由seqidno1-3和5-14任一个的序列组成。在一个优选的实施方案中,所述脂肪酸脱羧酶包含,基本上由或由seqidno1、5、7-14任一个的序列所组成,更优选的为seqidno为1、5和7的任一个。

在一个实施方案中,所述脂肪酸脱羧酶包含共有序列g-x1-l-(x)4-c-[d/e]-x2-g-[a/g]-f-x3-[k/r/s/e](seqidno4),x是任意氨基酸(seqidno26)。在优选的实施方案中,所述脂肪酸脱羧酶包含共有序列g-x1-l-(x)4-c-[d/e]-x2-g-[a/g]-f-x3-[k/r](seqidno4),x是任意氨基酸。

优选地,x1能选自由p、l和g组成的组中。优选地,(x)4可以更具体地为[t/a]-[t/s/c]-[p/t/a]-[g/a]。优选地,x2可以选自由h、n和r组成的组中。优选地,x3可以是疏水性氨基酸,尤其选自由l、va和f组成的组中。

在一个具体实施方案中,所述脂肪酸脱羧酶包含共有序列g-x1-l-(x)4-c-[d/e]-x2-g-[a/g]-f-x3-[k/r/s/e](seqidno26),其中

-x1可以选自由p、l和g组成的组中;

-(x)4可以更具体地为[t/a]-[t/s/c]-[p/t/a]-[g/a];

-x2可以选自由h、n和r组成的组中;以及

x3可以是疏水性氨基酸,尤其选自由l、va和f组成的组中。

在一个非常具体的实施方案中,所述脂肪酸脱羧酶包含共有序列g-x1-l-(x)4-c-[d/e]-x2-g-[a/g]-f-x3-[k/r](seqidno4),其中

-x1可以选自由p、l和g组成的组中;

-(x)4可以更具体地为[t/a]-[t/s/c]-[p/t/a]-[g/a];

-x2可以选自由h、n和r组成的组中;以及

-x3可以是疏水性氨基酸,尤其选自由l、va和f组成的组中。

在另一个或另外的优选实施方案中,所述脂肪酸脱羧酶包含参考seqidno1相关的保守氨基酸。基于seqidno1的参考序列,seqidno1中残基c372、sr391、y406、q426、h512和n515中的一个、两个、三个、四个、五个或所有是保守的。在另一种脂肪酸脱羧酶中对应于seqidno1中的这些位置的位置上的相应残基也是如此。

在另一个或另外的优选实施方案中,所述脂肪酸脱羧酶包含形成疏水通道的区域,其中底物、游离脂肪酸能够进入。该区域位于seqidno1的第391至426位残基之间。因此,位置388-428之间的氨基酸残基的至少40%是疏水残基,优选选自由v、i、l、m、f、w、c、a和y组成的组。

所述脂肪酸脱羧酶有任何来源,例如来自细菌或藻类。

优选地,所述脂肪酸脱羧酶来自藻类,优选微藻或蓝细菌。例如,所述脂肪酸脱羧酶是具有脂肪酸脱羧酶活性的gmc氧化还原酶,其来自小球藻(chlorella)、衣藻(chlamydomonas)、褐指藻(phaeodactylum)、胶球藻(coccomyxa)、团藻(volvox)、褐藻(ectocarpus)、圆石藻(emiliania)、褐潮藻(aureococcus)、爱尔兰海藻(chondrus)、红藻(galdieria)或微拟球藻(nannochloropsis)。许多微藻的物种是已知的,并且能在例如数据库algaebase(www.algaebase.org/)上找到。

在一个具体实施方案中,所述脂肪酸脱羧酶来自变异小球藻(chlorellavariabilis),特指变异小球藻nc64a。在另一个具体实施方案中,所述脂肪酸脱羧酶来自莱茵衣藻(chlamydomonasreinhardtii)。在另一个具体实施方案中,所述脂肪酸脱羧酶来自三角褐指藻(phaeodactylumtricornutum)。在另一个具体的实施方案中,所述脂肪酸脱羧酶来自胶球藻(coccomyxasubellipsoidea),特别是胶球藻c-169。在另一个具体实施方案中,所述脂肪酸脱羧酶来自强壮团藻(volvoxcarteri)。在另一个具体实施方案中,所述脂肪酸脱羧酶来自长囊水云(ectocarpussiliculosus)。在另一个具体的实施方案中,所述脂肪酸脱羧酶来自赫氏圆石藻(emilianiahuxleyi)。在另一个具体实施方案中,所述脂肪酸脱羧酶来自抑食金球藻(aureococcusaophagefferens)。在另一个具体的实施方案中,所述脂肪酸脱羧酶来自海洋富油微拟球藻。

优选地,所述脂肪酸脱羧酶的长度不超过约750、700、650或600个氨基酸残基。

本发明还涉及杂合多肽或融合多肽,其中如上定义的脂肪酸脱羧酶的氨基酸序列与另一多肽的区域的n末端或c末端融合。脂肪酸脱羧酶活性在杂合多肽或融合多肽中保留。优选地,另一多肽的区域在所述脂肪酸脱羧酶的n末端融合。可选地,另一多肽的区域在所述脂肪酸脱羧酶的c末端融合。用于产生融合多肽的技术是本领域已知的,并且包括连接编码酶的编码序列和另一多肽的添加区域,使得它们在表达框内并且融合多肽的表达在相同启动子和终止子的控制下。融合多肽也可以使用内含肽技术构建,其中融合多肽在翻译后产生(cooper等,1993,emboj.12:2575-2583;dawson等,1994,science266:776-779)。

可以选择融合多肽的添加区域以增强根据本发明的酶的稳定性,以促进来自细胞(例如细菌细胞或酵母细胞)的所述融合蛋白的分泌(例如n-末端疏水信号肽),或协助所述融合蛋白的纯化。更具体地,所述添加区域可以是用于所述酶的纯化或固定的标签。这种标签是本领域技术人员公知的,例如his标签(his6)、flag标签、ha标签(源自流感蛋白血细胞凝集素的表位)、麦芽糖结合蛋白(mpb)、myc标签(源自人原癌蛋白myc的表位)、strep标签或gst标签(小谷胱甘肽-s-转移酶)。所述添加区域可以是硫氧还蛋白。

融合多肽可以进一步包含酶和添加区域之间的切割位点。在分泌或纯化所述融合蛋白时,所述位点被切割而释放两种多肽。切割位点的实例包括但不限于公开在martin等,2003,j.ind.microbiol.biotechnol.3:568-576;svetina等,2000,j.biotechnol.76:245-251;rasmussen-wilson等,1997,appl.environ.microbiol.63:3488-3493;ward等,1995,biotechnology13:498-50;和contreras等,1991,biotechnology9:378-381;eaton等,1986,biochemistry25:505-512;collins-racie等,1995,biotechnology13:982-987;carter等,1989,proteins:structure,function,andgenetics6:240-24;和stevens,2003,drugdiscoveryworld4:35-48。例如,所述切割位点能是tev(烟草蚀纹病毒,tobaccoetchvirus)切割位点。其他切割位点是本领域技术人员所公知的。

在一个具体实施方案中,本发明涉及包含如上定义的组氨酸标签、硫氧还蛋白、切割位点和所述脂肪酸脱羧酶的多肽(例如参见seqidno3,此构建体具有小球藻脂肪酸脱羧酶)。

本发明进一步涉及重组核酸构建体或载体,其包含编码如上定义的脂肪酸脱羧酶的核酸序列。更具体地,所述核酸构建体或载体适合于表达所述脂肪酸脱羧酶。另外地,提供了包含含有编码如上定义的脂肪酸脱羧酶的核酸序列的核酸、重组核酸构建体或重组载体的重组宿主细胞。

编码脂肪酸脱羧酶的核酸和核酸构建体

本发明涉及编码本发明脂肪酸脱羧酶的多核苷酸。核酸可以是dna(cdna或gdna)、rna或两者的混合物。它可以是单链形式或双链形式或两者的混合物。它可以包含修饰的核苷酸,包括例如修饰的键、修饰的嘌呤或嘧啶碱基、或修饰的糖。它可以通过本领域技术人员已知的任何方法制备,包括化学合成、重组和诱变。

任选地,为了宿主细胞表达能优化编码序列。特别地,由于本发明的脂肪酸脱羧酶来自藻类,特别是微藻,编码酶的核酸序列可以针对细菌宿主(例如大肠杆菌,酵母宿主或甚至是与酶来源不同的微藻)进行优化。

本发明还涉及核酸构建体,其包含与一个或多个控制序列可操作地连接的编码根据本发明公开的脂肪酸脱羧酶的多核苷酸,所述控制序列在与控制序列相容的条件下在合适的宿主细胞中指导编码序列的表达。可以用多种方式操控多核苷酸以提供脂肪酸脱羧酶的表达。根据表达载体,在将多核苷酸插入载体之前对其进行操控可以是预期的或必需的。利用重组dna方法修饰多核苷酸的技术是本领域熟知的。

控制序列可包括被宿主细胞或体外表达系统识别的启动子,用于表达编码本发明的脂肪酸脱羧酶的多核苷酸。所述启动子含有介导脂肪酸脱羧酶表达的转录控制序列。所述启动子可以是在宿主细胞中显示转录活性的任何多核苷酸,包括突变的、截短的和杂合启动子,并且可以从编码与宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。任选地,所述启动子能是诱导型的。任选地,所述启动子是强启动子,允许脂肪酸脱羧酶的过表达。任选地,所述启动子是强诱导型启动子。

细菌宿主细胞中合适启动子的实例是从以下获得的启动子:解淀粉芽孢杆菌(bacillusamyloliquefaciens)α-淀粉酶基因(amyq)、地衣芽孢杆菌α-淀粉酶基因(amyl)、地衣芽孢杆菌青霉素酶基因(penp)、嗜热脂肪芽孢杆菌(bacillusstearothermophilus)产麦芽糖淀粉酶基因(amym)、枯草芽孢杆菌左聚糖蔗糖酶基因(sacb)、枯草芽孢杆菌xyla和xylb基因、苏云金芽孢杆菌(bacillusthuringiensis)cryllla基因(agaisse和lereclus,1994,molecularmicrobiology13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(egonetal.,1988,gene69:301-315)、天蓝色链霉菌(streptomycescoelicolor)琼脂水解酶基因(daga)和原核β-内酰胺酶基因(villa-kamaroff等,1978,proc.natl.acad.sci.usa75:3727-3731),以及tac启动子(deboer等,1983,proc.natl.acad.sci.usa80:21-25)。其它启动子描述于“usefulproteinsfromrecombinantbacteria”gilbert等,1980,scientificamerican242:74-94;和sambrook等,1989。串联启动子的实例公开在wo99/43835中。

丝状真菌宿主细胞中合适启动子的实例是从以下基因获得的启动子:构巢曲霉乙酰胺酶、黑曲霉(aspergillusniger)中性α-淀粉酶、黑曲霉酸稳定的α-淀粉酶、黑曲霉或泡盛曲霉(aspergillusawamori)葡糖淀粉酶(glaa)、米曲霉(aspergillusoryzae)taka淀粉酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、尖孢镰刀菌(fusariumoxysporum)胰蛋白酶样蛋白酶(wo96/00787)、镰孢霉(fusariumvenenatum)淀粉转葡糖苷酶(wo00/56900)、镰孢霉daria(wo00/56900)、镰孢霉quinn(wo00/56900)、米赫根毛霉(rhizomucormiehei)脂肪酶、米赫根毛霉天冬氨酸蛋白酶、里氏木霉(trichodermareesei)β-葡萄糖苷酶、里氏木霉纤维二糖水解酶i、里氏木霉纤维二糖水解酶ii、里氏木霉内切葡聚糖酶i、里氏木霉内切葡聚糖酶ii、里氏木霉内切葡聚糖酶iii、里氏木霉内切葡聚糖酶iv、里氏木霉内切葡聚糖酶v、里氏木霉木聚糖酶i、里氏木霉木聚糖酶ii、里氏木霉β-木糖苷酶,以及na2-tpi启动子(来自曲霉(aspergillus)中性α-淀粉酶基因的修饰启动子,其中非翻译前导序列已被来自曲霉磷酸异构酶基因的非翻译前导序列替换);非限制性实例包括来自黑曲霉中性α-淀粉酶基因的修饰启动子,其中非翻译前导序列已被来自构巢曲霉或米曲霉磷酸丙糖异构酶基因的非翻译前导序列替换;以及以上的突变的、截短的和杂合的启动子。

在酵母宿主中,有用的启动子获自以下基因:酿酒酵母(saccharomycescerevisiae)烯醇酶(eno-1)、酿酒酵母半乳糖激酶(gal1)、酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(adh1、adh2/gap)、酿酒酵母磷酸丙糖异构酶(tpi)、酿酒酵母金属硫蛋白(cup1)和酿酒酵母3-磷酸甘油酸激酶。酵母宿主细胞中其它有用的启动子在romanos等,1992,yeast8:423-488中有所描述。

诱导型启动子能响应于例如光强度或温度高低,和/或能响应于特定化合物。诱导型启动子可以是,例如,激素响应性启动子(例如,蜕皮激素响应性启动子,如us6,379,945中所述)、金属硫蛋白启动子(us6,410,828),能响应于化学物质例如水杨酸、乙烯、硫胺素和/或bth(us5,689,044)等发病机理相关(pr)启动子或其某些组合。诱导型启动子也能响应于光或暗(us8,318,482;us5,750,385;us5,639,952)、金属(eukaryoticcell2:995-1002(2003))或温度(us5,447,858;abe等,plantcellphysiol.49:625-632(2008);shroda等,plantj.21:121-131(2000))。前述实施例不是限制可以使用的启动子或特异性启动子的类型。启动子序列能来自任何生物体,只要它在宿主生物体中有功能。在某些实施方案中,通过将已知的诱导型启动子的一个或多个部分或结构域,与能在宿主细胞中起作用(例如赋予在宿主物种中起作用的启动子的诱导能力)的不同启动子的至少一部分融合,形成诱导型启动子。

本领域技术人员将容易理解,能有效地将多种已知的启动子序列用于微藻物种。例如,通常用于驱动微藻中转基因表达的启动子包括花椰菜花叶病毒启动子35s(camv35s)的各种形式,其已用于甲藻(dinoflagellates)和绿藻(chlorophyta)(chow等,plantcellrep.,18:778-780,1999;jarvis和brown,curr.genet.,317-321,1991;lohuis和miller,plantj.,13:427-435,1998)。来自猿猴病毒的sv40启动子也已报道在几种藻类中具有活性(gan等,j.appl.phycol.,151345-349,2003;qin等,hydrobiologia398-399,469-472,1999)。来自衣藻的rbcs2(核酮糖二磷酸羧化酶,小亚基)的启动子(fuhrmann等,plantj.,19:353-361,1999)和psad(光系统i复合物的丰富蛋白;fischer和rochaix,febslett.581:5555-5560,2001)启动子也能是有用的。hsp70a/rbcs2和hsp70a/p2tub(微管蛋白)的融合启动子(schroda等,plantj.,21:121-131,2000)也可用于改善转基因的表达,其中hsp70a启动子当置于其它启动子的上游可用作转录激活因子。感兴趣的基因的高水平表达也能在例如硅藻物种中,在编码硅藻岩黄素-叶绿素a/b结合蛋白的fcp基因的启动子(falciatore等,mar.biotechnol,1:239-251,1999;zaslavskaia等,j.phycol.36:379-386,2000)或编码eustigmatophyteviolaxanthin-叶绿素a/b结合蛋白的vcp基因的启动子(参见美国专利号8,318,482)的控制下实现。如果需要,诱导型启动子能在转基因微藻中提供基因的快速且严格控制的表达。例如,编码硝酸还原酶的nr基因的启动子区域能用作这种诱导型启动子。nr启动子活性通常被铵抑制并且当铵被硝酸盐取代时被诱导(poulsen和kroger,febslett272:3413-3423,2005),因此当微藻细胞在铵/硝酸盐存在下生长时能关闭或开启基因表达。多种藻类启动子是已知的并且能够使用,包括在us2013/0023035;us2013-0323780,us2014-0154806;和us2014-0363892中公开的那些。

控制序列也可以是转录终止子,其被宿主细胞识别以终止转录。终止子可操作地连接到编码多肽的多核苷酸的3′-端。任何在宿主细胞中有功能的终止子可以用于本发明。

用于细菌宿主细胞的优选终止子获自以下基因:克劳氏芽孢杆菌(bacillusclausii)碱性蛋白酶(aprh)、地衣芽孢杆菌α-淀粉酶(amyl)、和大肠杆菌核糖体rna(rrnb)。

用于丝状真菌宿主细胞的优选终止子获自以下基因:构巢曲霉邻氨基苯甲酸合成酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉taka淀粉酶、和尖孢镰刀菌胰蛋白酶样蛋白酶。

用于酵母宿主细胞的优选终止子获自以下基因:酿酒酵母烯醇酶、酿酒酵母细胞色素c(cyc1)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子在上述romanos等,1992中描述了。

控制序列还可以是启动子下游和基因编码序列上游的mrna稳定子(stabilizer)区域,其增加基因的表达。

合适的mrna稳定子区域的实例获自苏云金芽孢杆菌cryllla基因(wo94/25612),和枯草芽孢杆菌sp82基因(hue等,1995,journalofbacteriology177:3465-3471)。

控制序列也可以是前导序列,是对宿主细胞的翻译重要的mrna的非翻译区。前导序列与编码脂肪酸脱羧酶的多核苷酸的5′-端可操作地连接。可以使用在宿主细胞中有功能的任何前导序列。

丝状真菌宿主细胞的优选前导序列获自以下基因:米曲霉taka淀粉酶和构巢曲霉丙糖磷酸异构酶。

酵母宿主细胞的合适前导序列获自以下基因:酿酒酵母烯醇酶(eno-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子、和酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(adh2/gap)。

控制序列还可以是多聚腺苷酸化序列,可操作地连接到编码脂肪酸脱羧酶的多核苷酸的3′-端的序列,并且当转录时,被宿主细胞识别为将多聚腺苷残基添加到转录的mrna的信号。可以使用在宿主细胞中有功能的任何多聚腺苷酸化序列。

用于丝状真菌宿主细胞的优选多聚腺苷酸化序列获自以下基因:构巢曲霉邻氨基苯甲酸合成酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉taka淀粉酶、和尖孢镰刀菌胰蛋白酶样蛋白酶。

用于酵母宿主细胞的有用的多聚腺苷酸化序列在guo和sherman,1995,mol.cellularbiol.15:5983-5990中有所描述。

控制序列还可以是信号肽编码区,其编码与脂肪酸脱羧酶n-末端相连接的信号肽,并指导脂肪酸脱羧酶进入细胞的分泌途径。多核苷酸编码序列的5′-端可以固有地含有信号肽编码序列,所述信号肽编码序列在翻译阅读框中与编码脂肪酸脱羧酶的编码序列的区段天然连接。可选地,编码序列的5′-端可含有外源于编码序列的信号肽编码序列。当编码序列不天然含有信号肽编码序列时,可需要外源信号肽编码序列。可选地,外源信号肽编码序列可以简单地取代天然信号肽编码序列,以增强多肽的分泌。然而,可以使用任何指导表达的多肽进入宿主细胞分泌途径的信号肽编码序列。信号肽也能是叶绿体转运肽、脂肪酸脱羧酶的叶绿体转运肽或任何其他叶绿体转运肽。

细菌宿主细胞的有效信号肽编码序列是从芽孢杆菌(bacillusncib11837)产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌(bacillusstearothermophilus)α-淀粉酶、嗜热脂肪芽孢杆菌(bacillusstearothermophilus)中性蛋白酶(nprt、nprs、nprm)、和枯草芽孢杆菌prsa的基因获得的信号肽编码序列。其它信号肽在simonen和palva,1993,microbiologicalreviews57:109-137中有所描述。

丝状真菌宿主细胞的有效信号肽编码序列是获自以下基因的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉taka淀粉酶、特异腐质霉(humicolainsolens)纤维素酶、特异腐质霉内切葡聚糖酶v、柔毛腐质霉(humicolalanuginosa)脂肪酶、和米赫根毛霉天冬氨酸蛋白酶。

用于酵母宿主细胞的有用信号肽获自以下基因:酿酒酵母α-因子和酿酒酵母转化酶。其它有用的信号肽编码序列在上述romanos等,1992中有所描述。

还可以期望添加调节序列,其调节多肽相对于宿主细胞生长的表达。调节系统的实例是那些导致基因表达响应化学或物理刺激而开启或关闭的系统,包括调节化合物的存在。原核系统中的调节系统包括lac、tac和trp操纵子系统。在酵母中,可以使用adh2系统或gal1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉takaα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子。调节序列的其它实例是允许基因扩增的那些。在真核系统中,这些调节序列包括在甲氨蝶呤存在下扩增的二氢叶酸还原酶基因,以及在重金属存在下扩增的金属硫蛋白基因。在这些情况下,编码多肽的多核苷酸将与调节序列可操作地连接。

表达载体

本发明还涉及重组表达载体,其包含如上公开的核酸构建体、或编码本发明的脂肪酸脱羧酶的多核苷酸、启动子、和转录及翻译终止信号。多种核苷酸和控制序列可以连接在一起以产生重组表达载体,所述重组表达载体可以包括一个或多个方便的限制性位点,以允许在这些位点插入或取代编码脂肪酸脱羧酶的多核苷酸。可选地,可以通过将多核苷酸或包含所述多核苷酸的核酸构建体插入合适的表达载体中来表达多核苷酸。

在构建表达载体时,编码序列位于载体中,使得编码序列与适当的控制序列可操作地连接以进行表达。

重组表达载体可以是任何载体(例如质粒或病毒),其能方便地进行重组dna步骤并能引起多核苷酸的表达。载体的选择通常取决于载体与将被引入载体的宿主细胞的相容性。载体可以是线性或闭合的环状质粒。

载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒、染色体外元件、微型染色体、或人工染色体。载体可以包含用于确保自我复制的任何元件。可选地,载体可以是当其被引入宿主细胞时整合到基因组中并与其整合进入的染色体一起复制的载体。此外,可以使用单个载体或质粒、或一起含有待引入宿主细胞基因组的总dna的两个或多个载体或质粒、或转座子。

载体优选含有一个或多个选择性标记,其允许对被转化的、被转染的、被转导的或类似的细胞的简单选择。选择性标记是一种基因,其产物提供杀菌性或病毒抗性、对重金属的抗性、对营养缺陷型的原养型等。

细菌选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌基因或标记,其赋予抗生素抗性(例如氨苄青霉素、氯霉素、卡那霉素、新霉素、壮观霉素或四环素抗性)。用于酵母宿主细胞的合适标记包括但不限于ade2、his3、leu2、lys2、met3、trp1和ura3。用于丝状真菌宿主细胞的选择标记包括但不限于amds(乙酰胺酶)、argb(鸟氨酸氨基甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niad(硝酸盐还原酶)、pyrg(orotidine)-5′-磷酸脱羧酶)、sc(硫酸盐腺苷转移酶)和trpc(邻氨基苯甲酸合成酶),以及它们的等价物。优选用于曲霉属(aspergillus)细胞的是构巢曲霉或米曲霉amds和pyrg基因以及吸水链霉菌(streptomyceshygroscopicus)基因。

载体优选含有允许载体整合到宿主细胞基因组中或载体在细胞中独立于基因组而自主复制的元件。

当整合于宿主细胞基因组中发生时,序列整合到基因组中可能依赖于同源或非同源重组。可选地,载体可以含有额外的多核苷酸,用于通过同源重组引导在精确位置整合入宿主细胞基因组染色体。为了增加在精确位置整合的可能性,整合元件应包含足够数量的核酸,例如100至10000个碱基对,400至10000个碱基对,以及800至10000个碱基对,其具有与相应的靶序列高度的序列相同性,以增强同源重组的可能性。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码或编码多核苷酸。另一方面,载体可以通过非同源重组整合到宿主细胞的基因组中。

对于自主复制,载体可以进一步包含复制起点,所述复制起点使载体能够在所讨论的宿主细胞中自主复制。复制起点可以是介导在细胞中起作用的自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”是指使质粒或载体能够在体内复制的多核苷酸。细菌复制起点的实例是以下的复制起点:允许在大肠杆菌中复制的质粒pbr322、puc19、pacyc177、和pacyc184,以及允许在芽孢杆菌中复制的pub110、pe194、pta1060,和pamβ1。用于酵母宿主细胞的复制起点的实例是2微米复制起点、ars1、ars4、ars1和cen3的组合、以及ars4和cen6的组合。用于丝状真菌细胞的复制起点的实例是ama1和ansi(gems等,1991,gene98:61-67;cullen等,1987,nucleicacidsres.15:9163-9175;wo00/24883)。能根据wo00/24883中公开的方法完成ama1基因的分离和包含该基因的质粒或载体的构建。

可以将多于一个拷贝的本发明多核苷酸插入宿主细胞中以增加多肽的产生。通过将至少一个额外的序列拷贝整合到宿主细胞基因组中,或通过和多核苷酸一起包含可扩增的选择性标记基因使细胞含有该选择性标记基因的扩增拷贝,能获得多核苷酸的拷贝数的增加,且因此能通过在合适的选择剂存在下培养细胞来选择多核苷酸的额外拷贝。

用于连接上述元件以构建本发明的重组表达载体的步骤是本领域技术人员熟知的(参见例如,上述的sambrook等,1989)。

宿主细胞

本发明涉及表达本发明中脂肪酸脱羧酶的重组宿主细胞,更具体地涉及工程化以产生烷烃/烯烃的重组宿主细胞。重组宿主细胞可表达内源性脂肪酸脱羧酶但具有它的过表达(例如通过强异源启动子控制表达和/或通过增加细胞中编码脂肪酸脱羧酶的基因数)。可选地,重组宿主细胞可以表达本发明中的异源脂肪酸脱羧酶。另外地或在另一个可选方案中,重组宿主细胞已经过基因工程改造以增加脂肪酸的产生或促进优选脂肪酸的产生。例如,宿主细胞可以是与产生脂肪酸脱羧酶的物种不同的细菌(包括光合细菌)、丝状真菌、酵母或微藻物种。

因此,本发明涉及重组宿主细胞,其包含编码根据本发明公开的脂肪酸脱羧酶的多核苷酸,其可操作地连接于一个或多个控制序列,所述控制序列指导本发明的脂肪酸脱羧酶的产生。编码根据本发明的脂肪酸脱羧酶的多核苷酸的构建体或载体引入宿主细胞中,使得构建体或载体维持为染色体整合体或如前所述的自我复制的染色体外载体。

术语“宿主细胞”包括由于在复制过程中发生突变而与亲本细胞不同的亲本细胞的任何后代。宿主细胞的选择在很大程度上取决于编码多肽的基因及其来源。

宿主细胞可以是用于重组产生本发明的脂肪酸脱羧酶的任何细胞,例如原核生物或真核生物。

原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于芽孢杆菌(bacillus)、梭菌(clostridium)、肠球菌(enterococcus)、地芽孢杆菌(geobacillus)、乳杆菌(lactobacillus)、乳球菌(lactococcus)、海洋杆菌(oceanobacillus)、葡萄球菌(staphylococcus)、链球菌(streptococcus)和链霉菌(streptomyces)。革兰氏阴性细菌包括但不限于弯曲杆菌(campylobacter)、大肠杆菌、黄杆菌(flavobacterium)、梭杆菌(fusobacterium)、螺杆菌(helicobacter)、泥杆菌(ilyobacter)、奈瑟球菌(neisseria)、假单胞菌(pseudomonas)、沙门氏菌(salmonella)和脲原体(ureaplasma)。细菌宿主细胞可以是任何芽孢杆菌(bacillus)细胞,包括但不限于嗜碱芽孢杆菌(bacillusalkalophilus)、解淀粉芽孢杆菌(bacillusamyloliquefaciens)、短杆菌(bacillusbrevis)、环状芽胞杆菌(bacilluscirculans)、克劳氏芽孢杆菌、凝结芽孢杆菌(bacilluscoagulans)、坚强芽孢杆菌(bacillusfirmus)、灿烂芽胞杆菌(bacilluslautu)、迟缓芽孢杆菌(bacilluslentus)、地衣芽孢杆菌、巨大芽胞杆菌(bacillusmegateriu)、短小芽胞杆菌(bacilluspumilus)、嗜热脂肪芽孢杆菌(bacillusstearothermophilus)、枯草芽孢杆菌和苏云金芽孢杆菌细胞。细菌宿主细胞也可以是任何链球菌(streptococcus)细胞,包括但不限于似马链球菌(streptococcusequisimilis)、酿脓链球菌(streptococcuspyogenes)、乳房链球菌(streptococcusuberis)、马链球菌(streptococcusequi)和兽疫链球菌(streptococcuszooepidemicus)细胞。细菌宿主细胞还可以是任何链霉菌(streptomyces)细胞,包括但不限于不产色链霉菌(streptomycesachromogenes)、除虫链霉菌(streptomycesavermitilis)、天蓝色链霉菌(streptomycescoelicolor)、灰色链霉菌(streptomycesgriseus)和浅青紫链霉菌(streptomyceslividans)细胞。在一个具体实施方案中,宿主细胞是蓝细菌。蓝细菌包括但不限于聚球藻属(synechococcus)、集胞藻属(synechocystis)、鱼腥藻(anabaena)、螺旋藻属(spirulina)的物种。

将dna引入芽孢杆菌细胞可以通过原生质体转化(参见例如chang和cohen,1979,mol.gen.genet.168:111-115)、感受态细胞转化(参见例如young和spizizen,1961,j.bacteriol.81:823-829,或dubnau和davidoff-abelson,1971,j.mol.biol.56:209-221)、电穿孔(参见例如,shigekawa和dower,1988,biotechniques6:742-751)或接合(参见例如,koehler和thorne,1987,j.bacteriol.169:5271-5278)来实现。将dna引入大肠杆菌细胞可以通过原生质体转化(参见例如,hanahan,1983,j.mol.biol.166:557-580)或电穿孔(参见例如dower等,1988,nucleicacidsres.16:6127-6145)来实现。将dna引入链霉菌细胞可以通过原生质体转化、电穿孔(参见例如,gong等,2004,foliamicrobiol.(praha)49:399-405)、接合(参见例如,mazodier等,1989,j.bacteriol.171:3583-3585)、或转导(参见例如,burke等,2001,proc.natl.acad.sci.usa98:6289-6294)来实现。将dna导入假单胞菌细胞可以通过电穿孔(参见例如,choi等,2006,j.microbiol.methods64:391-397)或缀合(参见例如,pinedo和smets,2005,appl.environ.microbiol.71:51-57)来实现。将dna引入链球菌细胞可以通过自然感受态(参见例如,perry和kuramitsu,1981,infect.immun.32:1295-1297)、原生质体转化(参见例如,catt和jollick,1991,microbios68:189-207)、电穿孔(参见例如,buckley等,1999,appl.environ.microbiol.65:3800-3804)、或接合(参见例如,clewell,1981,microbiol.rev.45:409-436)来实现。然而,本领域已知的用于将dna导入宿主细胞的任何方法皆能使用。

宿主细胞也可以是真核细胞,例如哺乳动物、昆虫、植物或真菌细胞。宿主细胞可以是真菌细胞。如本文所用的“真菌”包括子囊菌(ascomycota)门、担子菌(basidiomycota)门、壶菌(chytridiomycota)门、和接合菌(zygomycota)门以及卵菌(oomycota)门和所有有丝分裂真菌(如hawksworth等人,in,ainsworthandaisby′sdictionaryofthefungi,第8版,1995,cabinternational,universitypress,cambridge,uk中所定义的)。真菌宿主细胞可以是酵母细胞。如本文所用的“酵母”包括子囊孢子(ascosporogenous)酵母(内孢霉目(endomycetales))、产担子(basidiosporogenous)酵母和属于不完全菌纲(fungiimperfecti)(芽孢纲(blastomycetes))的酵母。由于酵母的分类可能在将来发生变化,为了本发明的目的,酵母可如biologyandactivitiesofyeast(skinner、passmore、和davenport,editors,soc.app.bacteriol.symposiumseriesno.9,1980)所定义。酵母宿主细胞可以是假丝酵母属(candida)、汉逊酵母属(hansenula)、克鲁维酵母属(kluyveromyces)、毕赤酵母属(pichia)、酵母菌属(saccharomyces)、裂殖酵母属(schizosaccharomyces)或耶氏酵母属(yarrowia)细胞,例如乳酸克鲁维酵母(kluyveromyceslactis)、卡尔酵母(saccharomycescarlsbergensis)、酿酒酵母、糖化酵母(saccharomycesdiastaticus)、道格拉氏酵母(saccharomycesdouglasii)、克鲁氏酵母(saccharomyceskluyveri)、诺氏酵母(saccharomycesnorbensis)、卵形酵母(saccharomycesoviformis)或解脂耶氏酵母(yarrowialipolytica)细胞。真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括亚门真菌门(eumycota)和卵菌门(oomycota)的所有丝状形式(如上述hawksworth等,1995所定义)。丝状真菌的特征通常在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其他复合多糖组成的菌丝体壁。丝状真菌宿主细胞可以是支顶孢属(acremonium)、曲霉属(aspergillus)、金担子菌属(aureobasidium)、烟管菌属(bjerkandera)、拟蜡孔菌属(ceriporiopsis)、金孢子菌属(chrysosporium)、鬼伞属(coprinus)、革盖菌属(coriolus)、隐球菌属(cryptococcus)、线黑粉菌科(filibasidium)、镰刀菌属(fusarium)、腐质霉属(humicola)、稻瘟菌属(magnaporthe)、毛霉属(mucor)、毁丝霉属(myceliophthora)、新美鞭菌属(neocallimastix)、脉孢菌属(neurospora)、拟青霉属(paecilomyces)、青霉菌属(penicillium)、平革菌属(phanerochaete)、射脉菌属(phlebia)、梨囊鞭菌属(piromyces)、侧耳属(pleurotus)、裂褶菌属(schizophyllum)、踝节菌属(talaromyces)、热子囊菌属(thermoascus)、梭孢壳属(thielavia)、弯颈霉属(tolypocladium)、栓菌属(trametes)或木霉属(trichoderma)细胞。例如,丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉(aspergillusfoetidus)、烟曲霉(aspergillusfumigatus)、日本曲霉(aspergillusjaponicus)、构巢曲霉、黑曲霉(aspergillusniger)、米曲霉、烟管菌(bjerkanderaadusta)、干拟蜡菌(ceriporiopsisaneirina)、卡内基拟蜡菌(ceriporiopsiscaregiea)、浅黄拟蜡孔菌(ceriporiopsisgilvescens)、潘诺希塔拟蜡菌(ceriporiopsispannocinta)、环带拟蜡菌(ceriporiopsisrivulosa)、微红拟蜡菌(ceriporiopsissubrufa)、虫拟蜡菌(ceriporiopsissubvermispora)、黄孢霉(chrysosporiuminops)、嗜角质金孢子菌(chrysosporiumkeratinophilum)、拉克淖金孢子菌(chrysosporiumlucknowense)、粪状金孢子菌(chrysosporiummerdarium)、毡金孢子菌(chrysosporiumpannicola)、昆士兰金孢子菌(chrysosporiumqueenslandicum)、热带金孢子菌(chrysosporiumtropicum)、带纹金孢子菌(chrysosporiumzonatum)、灰盖鬼伞(coprinuscinereus)、毛云芝菌(coriolushirsutus)、孢状镰孢(fusariumbactridioides)、禾谷镰孢(fusariumcerealis)、克地镰刀菌(fusariumcrookwellense)、黄色镰刀菌(fusariumculmorum)、禾谷镰刀菌(fusariumgraminearum)、禾赤镰孢(fusariumgraminum)、异孢镰孢(fusariumheterosporum)、合欢木镰孢(fusariumnegundi)、尖孢镰刀菌、多枝镰孢(fusariumreticulatum)、粉红镰孢菌(fusariumroseum)、接骨木镰孢(fusariumsambucinum)、肤色镰孢(fusariumsarcochroum)、拟枝孢镰刀菌(fusariumsporotrichioides)、硫色镰刀菌(fusariumsulphureum)、圆镰孢(fusariumtorulosum)、拟丝孢镰刀菌(fusariumtrichothecioides)、镶片镰孢菌(fusariumvenenatum)、特异腐质霉、柔毛腐质霉、米黑毛霉(mucormiehei)、嗜热毁丝霉(myceliophthorathermophila)、粗糙脉孢菌(neurosporacrassa)、产紫青霉(penicilliumpurpurogenum)、黄孢原毛平革菌(phanerochaetechrysosporium)、射脉侧菌(phlebiaradiata)、杏鲍菇(pleurotuseryngii)、土生梭孢壳(thielaviaterrestris)、长绒毛栓菌(trametesvillosa)、变色栓菌(trametesversicolor)、哈茨木霉(trichodermaharzianum)、康宁木霉(trichodermakoningii)、长枝木霉(trichodermalongibrachiatum)、里氏木霉或绿色木霉(trichodermaviride)细胞。

真菌细胞可以通过本身已知的涉及原生质体形成、原生质体转化和细胞壁再生的方法转化。用于转化曲霉属和木霉属宿主细胞的合适方法描述于ep238023,yelton等,1984,proc.natl.acad.sci.usa81:1470-1474和christensen等,1988,bio/technology6:1419-1422。转化镰孢属物种的合适方法描述于malardier等,1989,gene78:147-156和wo96/00787。可以使用文中所描述的方法转化酵母(becker和guarente、inabelson,j.n.和simon.m.i.,editors,yeastgeneticsandmolecularbiology,methodsinenzymology,volume194,pp182-187,academicpress,inc.,newyork;ito等,1983,j.bacteriol.153:163;和hinnen等,1978,proc.natl.acad.sci.usa75:1920)。

细胞也可以是哺乳动物细胞,例如cos、cho(us4889803;us5047335)。在一个具体实施方案中,细胞是非人的和非胚胎的。另外地,本发明的脂肪酸脱羧酶能通过非人转基因动物产生,例如通过动物产生的乳汁。

适用于本发明方法的藻类物种包括微藻类如,例如以下属的物种:曲壳藻属(achnanthes)、茧形藻属(amphiprora)、双眉藻属(amphora)、纤维藻属(ankistrodesmus)、星胞藻属(asteromonas)、破囊壶菌(aurantiochytrium)、黄金色藻属(boekelovia)、扭鞘藻属(bolidomonas)、包特氏菌属(borodinella)、气球藻属(botrydium)、葡萄藻属(botryococcus)、荀球藻属(bracteococcus)、角毛藻属(chaetoceros)、四鞭藻属(carteria)、衣藻属(chlamydomonas)、绿球藻属(chlorococcum)、绿梭藻属(chlorogonium)、小球藻属(chlorella)、蓝隐藻属(chroomonas)、金球藻属(chrysosphaera)、球丐板藻属(cricosphaera)、隐甲藻属(crypthecodinium)、隐藻属(cryptomonas)、小环藻属(cyclotella)、链带藻属(desmodesmus)、杜氏藻属(dunaliella)、后棘藻属(elipsoidon)、圆石藻属(emiliania)、空球藻属(eudorina)、独球藻属(eremosphaera)、衣迪斯藻属(ernodesmius)、眼虫属(euglena)、真眼点藻属(eustigmatos)、伏氏藻属(franceia)、脆杆藻属(fragilaria)、拟脆杆藻属(fragilaropsis)、丝藻属(gloeothamnion)、盘藻属(gonium)、红球藻属(haematococcus)、菱板藻属(hantzschia)、异弯藻属(heterosigma)、膜胞藻属(hymenomonas)、等鞭金藻(isochrysis)、鳞孔藻属(lepocinclis)、缺刻叶球藻属(lobosphaera)、微芒藻属(micractinium)、微星鼓藻属(micrasterias)、蒜头藻属(monodus)、单针藻属(monoraphidium)、微球藻属(nannochloris)、微拟球藻属(nannochloropsis)、舟形藻属(navicula)、新绿藻属(neochloris)、异鞭藻(nephrochloris)、肾藻属(nephroselmis)、菱形藻属(nitzschia)、棕鞭藻属(ochromonas)、鞘藻属(oedogonium)、卵囊藻(oocystis)、鸵球藻属(ostreococcus)、实球藻属(pandorina)、拟小球藻属(parachlorella)、缘绿藻属(parietochloris)、parietichytrium、盐藻属(pascheria)、巴夫藻属(pavlova)、pelagomonas、褐指藻属(phaiodactylum)、噬菌体属(phagus)、混营性微藻属(picochlorum)、扁藻属(platymonas)、颗石藻属(pleurochrysis)、球藻属(pleurococcus)、原壁藻属(prototheca)、拟绿球藻属(pseudochlorella)、微细绿藻属(pseudochoricystis)、拟新绿藻属(pseudoneochloris)、假十字趾藻属(pseudostaurastrum)、塔胞藻属(pyramimonas)、桑葚藻(pyrobotrys)、栅藻属(scenedesmus)、schizochlamydella、裂壶藻属(schizochytrium)、骨条藻属(skeletonema)、水绵藻属(spyrogyra)、裂丝藻属(stichococcus)、四球藻属(tetrachlorella)、四爿藻属(tetraselmis)、海链藻属(thalassiosira)、破囊壶菌属(thrautochytrium)、黄丝藻属(tribonema)、石莼属(ulva)、无隔藻属(vaucheria)、鲜绿球藻属(viridiella)、紲夏藻属(vischeria)、和团藻属。特别合适的物种的非限制性实例包括,例如硅藻如,例如,以下任何属的物种:双眉藻属、角毛藻属、小环藻属、细柱藻属(cylindrotheca)、管状藻属、脆杆藻属、拟脆杆藻属、舟形藻属、菱形藻属、褐指藻、pseudo-nitzia、或海链藻属、或真眼点藻纲(eustigmatophytes)(例如真眼点藻属、蒜头藻属、微拟球藻属或紲夏藻属)。

更具体地,可以使用的微藻包括但不限于东方曲壳藻(achnanthesorientalis)、阿格门氏藻属(agmenellum)、透明苗形藻属(amphiprorahyaline)、咖啡形双眉藻(amphoracojfeiformis)、咖啡形双眉藻线形(amphoracojfeiformislinea)、咖啡形双眉藻斑点(amphoracoffeijbrmispunctata)、咖啡形双眉藻泰勒氏(amphoracojfeiformistaylori)。咖啡形双眉藻细薄(amphoracojfeiformistenuis)、优美双眉藻(amphoradelicatissima)、优美双眉藻头状(amphoradelicatissimacapitaia)、双眉藻某种(amphorasp.)、鱼腥藻属(anahaena)、变异鱼腥藻(anabaenavariabilis)、纤维藻属(ankistrodesrnus)、镰形纤维藻(ankistrodesrnusjalcatus)、黄金色藻(boekeloviahooglandii)、包特氏菌属某种(borodinellasp.)、布朗尼葡萄藻(botryococciisbraunii)、苏台德克斯葡萄藻(botryococcussudeiicus)、小型片球藻(bracteococcusminor)、中核片球藻(bracteococcusmedionucleatus)、四鞭藻(carteria)、纤细角毛藻(chaetocerosgracilis)、牟勒氏角毛藻(chaetocerosmuelleri)、牟勒氏角毛藻亚盐(chaetocerosmuellerisuhsalsum)、角毛藻某种(chaetocerossp.)、莱茵衣藻、(chlamydomonasemoewusi)、雪衣藻(chlamydomonasnivalis)、尾状衣藻(chlamydomonascaudate)。无硝小球藻(chlorellaanitrata)、南极洲小球藻(chlorellaantarctica)、黄绿小球藻(chlorellaaureoviridis)、念珠菌小球藻(chlorellacandida)、囊状小球藻(chlorellacapsulate)、干燥小球藻(chlorelladesiccate)、捕圆小球藻(chlorellaellipsoidea)、浮水小球藻(chlorellaemersonii)、淡揭小球藻(chlorellafusca)、淡褐小球藻空泡变种(chlorellafuscavar.vacuolata)、谷小球藻(chlorellaglucotropha)、水溪小球藻(chlorellainfusionum)、融合小球藻海岸螺变种(chlorellainfusionumvar.actophila)、融合小球藻异物变种(chlorellainfusionurnvar.auxenophila)、凯氏小球藻(chlorellakessleri)、路氏小球藻(chlorellalobophora)(sag37.88株)、路特小球藻(chlorellaluteoviriais)、路特小球藻维斯变种(chlorellaluteoviridisvar.aureoviridis)。路特小球藻路斯变种(chlorellaluteoviridisvar.lutescens)、微小小球藻(chlorellaminiata)、极微小球藻(chlorellaminutissima)、突变小球藻(chlorellamutabilis)、夜间小球藻(chlorellanocturna)、卵圆形小球藻(chlorellaovalis)、小形小球藻(chlorellaparva)、嗜光小球藻(chlorellaphotophila)、毛球小球藻(chlorellapringsheimii)、原始小球藻酸居变种(chlorellaprotothecoidesvar.acidicola)、规则小球藻(chlorellaregularis)、规则小球藻小型变种(chlorellaregularisvar.minima)、瓦状寻常小球藻变种(chlorellaregularisvar.umhricata)、瑞小球藻(chloreilareisiglii)、嗜糖小球藻(chlorellasaccharophila)、海洋小球藻捕圆变种(chlorellasaccharophilavar.ellipsoidea)。海水小球藻(chlorellasalina)、单纯小球藻(chlorellasimplex)。耐热性小球藻(chlorellasorokiniana)、小球藻某种(chlorellasp.)、球抱小球藻(chlorellasphaerica)。红皮小球藻(chlorellastigmaiophora)、变异小球藻、万尼氏小球藻(chlorellavanniellii)、普通小球藻(chlorellavulgaris)、普通小球藻粗皮型(chlorellavulgarisf.tenia)、普通小球藻自养变种(chlorellavulgarisvar.autotrophica)、普通小球藻绿色变种(chlorellavulgarisvar.viridis)、普通小球藻普通变种(chlorellavulgarisvar.vulgaris)、普通小球藻普通变种粗皮型(chlorellavulgarisvar.vulgarisftertia)、普通小球藻普通变种翠绿型(chlorellavulgarisvar.vulgarisf.viridis)、仙氏小球藻(chlorellaxanthella)、佐氏小球藻(chlorellazojingiensis)、梯氏小球藻(chlorellatrehouxioides)、普通小球藻(chlorellavulgaris)、水溪绿球藻(chlorococcuminfusionum)、绿球藻某种(chlorococcumsp.)、绿梭藻属(chlorogonium)、蓝隐藻属某种(chroomonassp.)、金球藻属某种(chrysosphaerasp.)、coccomyxasuhellipsoideac-169、球钙板藻属某种(cricosphaerasp.)、隐甲藻(crypihecodiniumcohnii)。隐藻属某种(cryptomonassp.)、隐秘小环藻(cyclotellacryptica)、梅尼小环藻(cyclotellameneghiniana)、小环藻属某种(cyclotellasp.)、杜氏藻某种(dunaiiellasp.)、拜尔代维勒杜氏藻(dimaliellabardawil)、桕氏杜氏藻(dunaiiellahioculata)、颗粒状杜氏藻(dunaiiellagranulate)、海生杜氏藻(dunaiiellamaritime)、微小杜氏藻(dunaiiellaminuta)、巴夫杜氏藻(dunaiiellaparva)、皮氏杜氏藻(dunaiiellapeircei)、普氏杜氏藻(dunaliellaprimolecta)、盐生杜氏藻(dunaliellasaiina)、陆生杜氏藻(dimaliellaterricola)、杜氏盐藻(dunaliellatertiolecta)、绿色杜氏藻(dimaliellaviridis)、杜氏盐藻(dunaliellatertiolecta)、绿色独球藻(eremosphaeraviridis)、独球藻属某种(eremosphaerasp.)、后棘藻属某种(ellipsoidonsp.)。裸藻属某些种(euglena)。披剌藻某种(franceiasp.)、克罗脆杆藻(fragilariacrotonensis)、脆杆藻属(fragilariasp.)、蓝鼓藻属某种(gleocapsasp.)、丝藻属某种(gloeothamnionsp.)、雨生红球藻(haematococcusplwialis)、膜胞藻属某种(hymenomonassp.)、球等大鞭金藻(isochrysisaffgalhana)、球等鞭金藻(isochrysisgalbana)、鳞孔藻属(lepocinclis)、微星藻属(micractinium)、微星藻藻(micractinium)、微胞藻(micromonas)、细小微胞藻(micromonaspusilla)、微小单针藻(monoraphidiumminuium)、单针藻属某种(monoraphiaiumsp.)、侏囊菌属某种(nannochlorissp.)、盐生微拟球藻(nannochloropsissaiina)、微拟球藻某种(nannochloropsissp.)、截形舟形藻(naviculaacceptata)、拜氏舟形藻(naviculahiskanterae)、假舟形藻(naviculapseudotenelloides)、具膜舟形藻(naviculapelliculosa)、腐生舟形藻(naviculasaprophila)、舟形藻某种(naviculasp.)、肾鞭藻某种(nephrochlorissp.)、肾藻属某种(nephroselmissp.)、普通菱形藻(nitschiacommunis)、亚历山大菱形藻(nitzschiaalexandfjna)、普通菱形藻(nitzschiacommunis)、细端菱形藻(nitzschiadissipata)、碎片菱形藻(nitzschiafrustulum)、汉氏菱形藻(nitzschiahantzschiana)。平庸菱形藻(nitzschiainconspicua)、中型菱形藻(nitzschiaintermedia)、小头菱形藻(nitzschiamicrocephalia)、微小菱形藻(nitzschiapusilla)、微小菱形捕圆藻(nitzschiapusillaelliptica)、微小菱形单藻(nitzschiapusillamonoensis)、四角形菱形藻(nitzschiaquadrangular)、菱形藻属某种(nitzschiasp.)、念珠藻属某种(nostocsp.)、点型念珠藻(nostocpimctiforme)、掠鞭藻属某种(ochromonassp)、微细卵囊藻(oocystisparva)、卵泡藻(oocystispusilla)、卵囊藻属某种(oocystissp.)、沼泽颤藻(oscllatorialimnetica)、颤藻属某种(oscillatoriasp)、拟短形颤藻(oscillatoriasuborevis)、鞭毛藻(osterococcus)、绿色鞭毛藻(osterococcuslucimariniis)、微小鞭毛藻(osterococcustauri)、凯氏拟小球藻(parachlorellakessleri)、酸性杜氏亚属盐藻(pascheriaacidophila)、巴夫藻属某种(pavlovasp.)、噬菌体属(phagus)、三角褐指藻(phaeodactylumtricomutum)、席藻属(phormidium)、扁藻属某种(piaiymonassp.)、颗石藻(pleurochrysiscarterae)、紫石藻(pleurochrysisdentate)、颗石藻属某种(pleurochrysissp.)、原绿球藻(prochlorococcusmarinus)、威克海姆原壁藻(protothecawickerhamii)、大型原壁藻(protothecastagnant)、波多黎各原壁藻(protothecaportoricensis)、无色微小藻(protothecamoirforrms)、饶氏原藻(protothecazopfii)、水生假小球藻(pseudochlorellaaquatica)、塔胞藻属某种(pyramirnoriassp.)、桑堪藻属(pyroboirys)、不透明红球菌(rhodococcusopacus)。克瑞类斯菌(sarcinoidchrysophyte)、被甲栅藻(scenedesmusarmatus)、集胞藻属某种(scynechocystissp.)、聚球藻属(scynechococcus)、裂殖壶菌(schizochytrim)、水绵属(spirogyra)、钝顶螺旋藻(spirulinaplatensis)、裂丝藻属某种(stichococcussp.)、聚球藻属某种(synechococcussp.)、四角藻属(tetraedron)、假微型海链藻(thalassiosirapseudonana)、四月藻某种(tetraselmissp.)、瑞典四爿藻(tetraselmissuecica)、威氏海链藻(thalassiosiraweissflogii)、弗德小藻(viridiellafridericiana)和强壮团藻。在一些实施方案中,微拟球藻属(nannochloropsis)的成员选自(n.gaditana)、颗粒状微拟球藻(n.granulate)、沼泽微拟球藻(n.limnetica)、海洋微拟球藻(n.oceanica)、(n.oculata)、和海水微拟球藻(n.salina)。

适用于本发明方法的藻类物种还包括但不限于以下门的藻类物种:红藻门(rhodophyta),如原始红藻属(cyanidioschyzon)、江蓠属(gracilaria)、珊瑚藻属(kappaphycus)、紫球藻属(porphyridium)和紫菜属(porphyra);轮藻门(charophyta),如新月藻属(closterium)和柱形鼓藻属(penium);绿藻门(chlorophyta),如空球藻属(eudorina)、盘藻属、红球藻属、缺刻叶球藻属、微星鼓藻属、鸵球藻属、实球藻属、拟小球藻属、扁藻属、微细绿藻、栅藻属、石莼属和团藻属;褐藻门(phaeophyta),如昆布属(laminaria)。

宿主细胞还能选自甲藻门(dinophyta)的物种,例如前沟藻属(amphidinium)和虫黄藻属(symbiodinium);绿角藻门(chlorarachniophyta)的物种,例如lotharella;眼虫门(euglenozoa)的物种,例如眼虫属(euglena)。

根据本发明,具有特定支化模式、饱和水平和碳链长度的烷烃/烯烃,能由具有那些特定特征的脂肪酸底物和本发明的脂肪酸脱羧酶制备。因此,能修饰脂肪酸生物合成途径中的每个步骤以产生或过量产生感兴趣的脂肪酸底物。例如,参与脂肪酸生物合成途径的已知基因能在宿主细胞中表达、过表达或减弱,以产生期望的脂肪酸底物(参见例如wo08/119082、us8183028)。示例性基因在wo08/119082的图1或us8183028的表1和第25-30栏中(该公开内容通过引用并入本文)提供。

然后,能修饰宿主细胞以增加或指导脂质产生和/或脂肪酸产生。修饰的宿主细胞能依据产生游离脂肪酸或游离脂肪酸的特定性质的能力被选择(例如在随机诱变后),或者能通过基因工程引入新基因或增加某些基因(参与游离脂肪酸分解代谢的基因)的表达,和/或通过缺失其他基因或减少其表达(参与游离脂肪酸合成代谢的基因)来制备。另外地,能修饰宿主细胞以增加优选脂肪酸的产生并减少不需要的脂肪酸的产生。

例如,为了产生脂质,宿主细胞(例如但不限于藻类或异形鞭毛类宿主细胞)能任选地包括一种或多种编码多肽的非天然基因,所述多肽在脂质生物合成中起作用,包括但不限于编码用于产生脂肪酸、脂肪酸衍生物和/或甘油脂(包括但不限于二酰基甘油酰基转移酶(dgat)基因、甘油磷酸酰基转移酶(gpat)基因、溶血磷脂酸酰基转移酶(脱氢酶)(lpaat)基因、磷脂酸磷酸酶(pap)基因、和/或单酰基甘油酰基转移酶(mgat)基因)的酶的多肽。

在优选的实施方案中,所述宿主细胞已被修饰用于表达或过表达脂肪酶。脂肪酶水解酰基脂质(例如甘油三酯或甘油磷脂或甘油半乳糖脂)以产生游离脂肪酸和甘油。优选地,脂肪酶是具有广泛的三酰基甘油、磷脂酶和半乳糖脂酶活性的脂肪分解酶。实例包括豚鼠胰脂肪酶相关蛋白2型、镰刀菌角质酶或猪葡萄球菌脂肪酶(liu等,2011,pnas108:6905)。在一个优选的实施方案中,所述宿主细胞是细菌并且表达(优选过表达)脂肪酶。因此,本发明的一个目的是表达(优选过表达)本发明的脂肪酸脱羧酶和脂肪酶(其中一种或两种对宿主细胞是异源的)的重组宿主细胞。在优选的实施方案中,所述宿主细胞是细菌。

在一个优选的实施方案中,所述宿主细胞已工程化以表达、过表达或减弱表达硫酯酶,以增加脂肪酸的产生或有利于优选脂肪酸的产生。优选地,所述宿主细胞已被修饰用于表达或过表达硫酯酶。因此,本发明的一个目的是表达(优选过表达)本发明的脂肪酸脱羧酶和硫酯酶(其中一种或两种对宿主细胞是异源的)的重组宿主细胞。在优选的实施方案中,所述宿主细胞是微藻或蓝细菌。

通过终止脂肪酸生物合成,酰基-酰基载体蛋白(acp)硫酯酶在功能上决定脂肪酸终产物的长度和身份(salas等,(2002)archivesofbiochemistryandbiophysics403:25-34)。基于氨基酸序列比对,植物硫酯酶已显示聚集成两个家族,fatas,其显示出对18:1-acp的显著偏好,对18:0-和16:0-acp具有较小活性;和fatbs,其水解链长在8-16个碳之间变化的初级饱和的酰基-acp(voelker,ingeneticengineeringvolume18.editedby:setlowjk.newyork,plenumpress;1996:111-133;ginalski等,nucl.acids.res.(2003)31:3291-3292;和jones等,(1995)plantcell7:359-371)。

所述硫酯酶属于来自ec3.1.2的酶,更具体地来自ec3.1.2.2(棕榈酰-coa水解酶)、ec3.1.2.14(油酰-[酰基-载体-蛋白]水解酶)、ec3.1.2.18(adp-依赖性短链酰基辅酶a水解酶)、ec3.1.2.19(adp依赖性中链酰基辅酶a水解酶)、ec3.1.2.20、ec3.1.2.21(十二烷酰基-[酰基-载体-蛋白质]水解酶)、ec3.1.2.22(棕榈酰-蛋白水解酶)的酶。

硫酯酶的实例已在wo14120829和wo16044779中公开。它们还包括由tesb编码的大肠杆菌(escherichiacoli)硫酯酶(参见genbank登录号aaa24665.1)、短乳杆菌(lactobacillusbrevis)硫酯酶(genbank登录号abj63754.1)和植物乳杆菌(lactobacillusplantarum)酯酶(genbank登录号ccc78182.1)。在radakovits等,2011,metabolicengineering13(1):89-95中公开了适于制备中链脂肪酸的来自植物的源硫酯酶的另一个实例。

在一个优选的实施方案中,为了利于短链和中链脂肪酸而选择硫酯酶。

在本发明的一个具体方面,还提供了一种产生根据本发明的脂肪酸脱羧酶的方法,包括在有助于产生所述脂肪酸脱羧酶的条件下培养如上定义的宿主细胞,并回收和/或纯化所述脂肪酸脱羧酶。可选地,还提供了产生根据本发明的脂肪酸脱羧酶的方法,包括用编码如上定义的脂肪酸脱羧酶的核酸在体外表达所述脂肪酸脱羧酶。任选地,所述方法进一步包括将脂肪酸脱羧酶固定在固体支持物上的步骤。

可以使用本领域已知的方法回收所述酶。例如,可以通过常规方法(包括但不限于收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀)从营养培养基中回收所述酶。

所述酶可以通过本领域已知的多种方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和尺寸排阻)、电泳过程(例如,制备等电聚焦)、差异溶解度(例如,硫酸铵沉淀)、sds-page或提取(参见例如,proteinpurification,janson和ryden,editors,vchpublishers,newyork,1989)纯化,以获得基本上纯的多肽。在可选的一方面,不回收所述酶而是将表达所述酶的本发明宿主细胞用作酶的来源。

用于产生烷烃/烯烃的用途

本发明还涉及如上定义的脂肪酸脱羧酶、或包含所述脂肪酸脱羧酶的固体支持物、或包含含有编码如上定义的脂肪酸脱羧酶的核酸序列的核酸、重组核酸构建体或重组载体的重组宿主细胞,用于从脂肪酸产生烷烃/烯烃的用途。

脂肪酸底物:

烷烃/烯烃由根据本发明的酶从脂肪酸产生。特别地,所述脂肪酸是包含脂肪链或支链和羧酸基团的游离脂肪酸。它们能是饱和的或不饱和的。它们能是单不饱和的或多不饱和的。它们可包含2-36个碳原子。通常,基于脂肪链的长度将所述脂肪酸分为四组:(1)短链脂肪酸(scfa)是脂肪族尾部少于六个碳的脂肪酸(例如丁酸);(2)中链脂肪酸(mcfa)是脂肪族尾部6-12个碳的脂肪酸,其能在中链甘油三酯中发现;(3)长链脂肪酸(lcfa)是脂肪族尾部13至21个碳的脂肪酸;(4)特长链脂肪酸(vlcfa)是脂肪尾部长于22个碳的脂肪酸。本发明与mcfa和lcfa高度相关,更具体地与lcfa高度相关。在优选的实施方案中,所述脂肪酸包含从8或10至24个碳原子,优选从12至22个碳原子。在一些实施方案中,所述脂肪酸底物是c4、c5、c6、c7、c8、c9、c10、c11、c12、c13、c14、c15、c16、c17、c18、c19、c20、c21或c22脂肪酸,优选c10、c11、c12、c13、c14、c15、c16、c17、c18、c19、c20、c21或c22脂肪酸,还更优选c12、c13、c14、c15、c16、c17、c18、c19、c20、c21或c22脂肪酸。更优选地,所述脂肪酸包含8至20个碳原子,优选12至18个碳原子,还更优选14至18个碳原子,并且甚至更优选16或17个碳原子。在一个具体方面,所述脂肪酸底物是c12、c13、c14、c15、c16、c17、c18、c19、c20或c21脂肪酸,优选c12、c13、c14、c15、c16、c17、c18,或c19脂肪酸,还更优选c12、c14、c16、c17或c18脂肪酸。脂肪链能是直链、支链或甚至包括环状部分。

在一个具体实施方案中,所述脂肪酸包含支链。所述支链可包括具有c1-c3烷基取代的主链,优选甲基取代。特别地,所述脂肪酸可以是萜类脂肪酸,例如植烷酸和降植烷酸。

另外地,所述脂肪酸的所述脂肪链可以被一个或几个基团(例如羟基、c1-c3醇、c1-c3酰基、c1-c3酯、c1-c3胺、氨基、c1-c3酰胺、羧基、醛、环氧基、卤素、c1-c3烷氧基、c1-c3硫代烷基、c1-c3亚胺、腈、c1-c3砜等硫基或c1-c3亚砜、硫醇、硝基、氰基、c1-c3卤代烷基)取代,或可以被杂原子(如o、n或s、炔基、醚如二乙醚或氧代基团)中断。优选地,所述脂肪酸的所述脂肪链可以被一个或几个基团(例如羟基、羧基、环氧基、卤素、硫醇或腈)取代,或者可以被s原子、炔或醚如二乙醚中断。优选地,所述脂肪链被一个基团取代,特别是在所述脂肪链的末端。在一个非常具体的实施方案中,所述脂肪酸的所述脂肪链被羟基取代,特别是在脂肪链的末端。

在另一个实施方案中,所述脂肪酸的所述脂肪链是未被取代的。

所述脂肪酸底物能是分离的或纯化的脂肪酸或如上所述的脂肪酸的混合物。

通过“游离脂肪酸”是意在指其中脂肪酸为其带有羧基形式的形式,即不是酯化形式或脂肪酸的其它衍生物。

烷烃/烯烃:

本发明的烷烃/烯烃是通过相应脂肪酸的脱羧获得的。因此,烷烃由饱和脂肪酸和烯烃由不饱和脂肪酸获得。本发明的酶不引入末端不饱和度。因此,在优选的实施方案中,所获得的烯烃不存在末端不饱和度。

通过本发明的用途和方法获得的烷烃/烯烃包含8或10至24个碳原子,优选12至22个碳原子。在一些实施方案中,所述烷烃/烯烃是c4、c5、c6、c7、c8、c9、c10、c11、c12、c13、c14、c15、c16、c17、c18、c19、c20、c21或c22的烷烃/烯烃,优选c10、c11、c12、c13、c14、c15、c16、c17、c18、c19、c20、c21或c22的烷烃/烯烃,还更优选c12、c13、c14、c15、c16、c17、c18、c19、c20、c21或c22的烷烃/烯烃。更优选地,所述烷烃/烯烃包含8至20个碳原子,优选12至18个碳原子,还更优选14至18个碳原子,并且甚至更优选16至17个碳原子。在一个具体方面,所述烷烃/烯烃是c12、c13、c14、c15、c16、c17、c18、c19、c20或c21的烷烃/烯烃,优选c12、c13、c14、c15、c16、c17、c18或c19的烷烃/烯烃,还更优选c12、c14、c16、c17或c18的烷烃/烯烃。脂肪/烃链能是直链、支链或甚至包括环状部分。

在一个具体实施方案中,所述烷烃/烯烃包含支链。所述支链可包括具有c1-c3烷基取代的主链,优选甲基取代。特别地,所述脂肪酸可以是萜类烷烃,例如植烷和降植烷。

另外地,由于脂肪酸的脂肪链可以被如上详述的一个或几个基团取代或中断,脱羧后相应的烷烃/烯烃也能被一个或几个基团取代或中断。因此,烷烃/烯烃能被一个或几个基团(例如羟基、c1-c3醇、c1-c3酰基、c1-c3酯、c1-c3胺、氨基、c1-c3酰胺、羧基、醛、环氧基、卤素、c1-c3烷氧基、c1-c3硫代烷基、c1-c3亚胺、腈、硫基如c1-c3砜或c1-c3亚砜硫醇、硝基、氰基、c1-c3卤代烷基)取代,或可以被杂原子(如o、n或s、炔基、醚如二乙醚、或氧代基)中断。优选地,所述烷烃/烯烃可以被一个或几个基团(例如羟基、羧基、环氧基、卤素、硫醇或腈)取代,或者可以被s原子、炔基或醚如二乙醚基团中断。优选地,所述烷烃/烯烃被一个基团取代,特别是在脂肪链的末端。在一个非常具体的实施方案中,所述烷烃/烯烃被羟基取代,特别是在脂肪链的末端,并且是醇。

所述烷烃/烯烃能是分离的或纯化的烷烃/烯烃或如上所述的烷烃/烯烃的混合物。在一个非常具体的实施方案中,所述酶能产生c13-c17烷烃和烯烃,特别是当在细菌(如大肠杆菌)中表达时。

在无细胞系统中产生烷烃/烯烃

在第一方面,本发明涉及如上定义的脂肪酸脱羧酶用于从脂肪酸,尤其是游离脂肪酸产生烷烃/烯烃的用途。因此,本发明涉及一种制备烷烃/烯烃的方法,其中将如上定义的脂肪酸脱羧酶与脂肪酸或脂肪酸的混合物接触并暴露于光下,从而转化所述脂肪酸或脂肪酸的混合物为相应的烷烃/烯烃。所述脂肪酸或脂肪酸混合物能是纯化的形式或能存在于未加工组合物/产物中。所述脂肪酸脱羧酶能被纯化、分离或存在于蛋白质提取物中,特别是总蛋白质提取物中。通常,fad辅因子已经与脂肪酸脱羧酶一起作为复合物存在。任选地,所述fad辅因子能与所述脂肪酸脱羧酶一起添加。

所述酶为了其活性需要暴露于含蓝光子的光中。在优选的实施方案中,蓝光具有波长为400-520nm,优选450nm-495nm,特别是约450nm。所提供的光量能是例如10至3000μmole.photon.m-2.s-1,优选约2000μmole.photon.m-2.s-1

然而,所述光可以具有在300至540nm之间的更宽波长范围。实际上,本发明人观察到所述酶的辅因子fad能够吸收波长范围为300-540nm的光,并且所述酶应该能够在该范围内使脂肪酸脱羧。实际上,所述fad吸收光谱包含在300-540nm的波长范围内。

所述酶还需要fad(黄素腺嘌呤二核苷酸)作为辅因子,其通常结合至从微藻提取物或从异源表达物中纯化的酶。

所述方法可包括回收烷烃/烯烃的额外步骤。所述烷烃/烯烃能通过技术人员可用的任何方法提取或纯化。所述烷烃/烯烃能在有机相中回收。例如,它们能以有机溶剂(例如以己烷)萃取。但是烷烃/烯烃也可以通过冷凝从培养物的气相中回收。

在重组宿主细胞系统中产生烷烃/烯烃

本发明涉及如上所述的重组宿主细胞用于由脂肪酸(尤其是游离脂肪酸)产生烷烃/烯烃的用途。它还涉及由脂肪酸产生烷烃/烯烃的方法,其中在有效表达本发明的脂肪酸脱羧酶的条件下培养如上所述的重组宿主细胞。

因此,本发明涉及细胞培养物,其包含在有效表达本发明的脂肪酸脱羧酶的条件下培养的如上所述的重组宿主细胞。

任选地,所述重组宿主细胞能在包含脂肪酸的培养基中培养。可选地或另外地,所述重组宿主细胞产生或包含脂肪酸。

在所述方法中,所述重组宿主细胞优选在获得生物质的条件下培养,优选富含脂质(尤其是脂肪酸)的生物质。然后,在第二步中,开始将所述脂肪酸转化为烷烃/烯烃。例如,如果脂肪酸脱羧酶已经在重组宿主细胞中表达,则能通过向重组宿主细胞施加含蓝光子的光以允许所述脂肪酸脱羧酶的活性来启动第二步骤。实际上,发明人表明所述烷烃的产生能通过光(尤其是其波长)来控制。蓝光(>400nm和<530nm)允许产生烷烃,而红光(>600nm和<700nm)则不能。然后,在本发明的方法中,能通过光在体内调节烷烃的产生。可选地,如果所述脂肪酸脱羧酶的表达受诱导型启动子控制,则能通过诱导脂肪酸脱羧酶的表达并使细胞接收光子(300-540nm)来启动第二步。此外,光强度(光子通量)调节酶活性。高光子通量增加酶活性,而低光子通量降低酶活性。

可选地,所述方法能包括在共同促进生物质(优选富含脂质(尤其是脂肪酸))的产生的条件下培养重组宿主细胞,以及将所述脂肪酸转化为烷烃/烯烃。

通过“富含”意指生物质的干重包含至少20、30、40、50、60或70%的脂质(尤其是脂肪酸)重量。

所述方法可包括从重组宿主细胞或从培养基中分离或回收烷烃/烯烃的附加步骤。

所述烷烃/烯烃能通过本领域技术人员可用的任何方法提取或纯化。例如,它们能以有机溶剂(例如以己烷)萃取。所述烷烃/烯烃能在有机相中回收。

一个示例性分离方法是两相(双相)分离方法。该方法包括在足以产生烷烃/烯烃的条件下发酵基因工程宿主细胞,使烷烃/烯烃收集在有机相中,并将有机相与含水发酵液分离。该方法能在分批和连续发酵设置中实施。

根据本发明的用于产生烷烃/烯烃的方法和用途能用于制备生物燃料、有用于化学的材料,特别是化妆品和其它领域(例如塑料、树脂、纤维、弹性体、药物、润滑剂或凝胶)。

本文描述的烯烃能用作或转化为燃料。本领域普通技术人员将理解,根据燃料的预期目的,能产生和使用不同的烯烃。例如,对于旨在用于寒冷气候的汽车燃料,可能期望是支链烯烃。此外,当本文所述的烯烃用作燃料产生的原料时,本领域普通技术人员将理解,链烯原料的特性将影响所产生的燃料的特性。因此,能通过产生用作原料的特定烯烃来选择燃料产品的特性。

使用本文所述的方法,能由烯烃产生具有期望的燃料品质的生物燃料。生物产生的烯烃代表生物燃料的新来源,其能用作喷气燃料、柴油或汽油。使用烯烃制造的一些生物燃料不是由可再生资源产生的,而是新的物质组合物。

脂肪酸定量

本发明的脂肪酸脱羧酶也有用于量化游离脂肪酸,并且能包括在用于量化游离脂肪酸的试剂盒中。特别地,本发明涉及一种用于量化样品中脂肪酸的方法,包括在适于将脂肪酸转化为烷烃/烯烃、回收烷烃/烯烃和量化烷烃/烯烃的条件下,使样品与本发明的脂肪酸脱羧酶接触。所述样品能是食物样品或生物样品,特别是生物流体样品(例如血液、血清、血浆、尿液等)。生成的烷烃/烯烃能以有机溶剂萃取并量化,特别是通过与火焰离子化检测器和质谱法偶联的气相色谱法(gc-fid-ms)量化。

在一个具体实施方案中,本发明的脂肪酸脱羧酶也有用于量化总脂肪酸,并且能包括在用于量化总脂肪酸的试剂盒中。特别地,本发明涉及一种用于量化样品中脂肪酸的方法,包括在适于将脂肪酸转化为游离脂肪酸和量化如上详述的游离脂肪酸的条件下,使样品与脂肪酶接触。因此,所述方法可包括在适于将脂肪酸转化为游离脂肪酸的条件下使样品与脂肪酶接触,在适于将脂肪酸转化为烷烃/烯烃、回收烷烃/烯烃并量化烷烃/烯烃的条件下使样品与本发明的脂肪酸脱羧酶接触。产生的烷烃/烯烃能以有机溶剂萃取并量化。

当脂肪酸脱羧酶将脂肪酸转化为烷烃/烯烃时,它产生co2作为副产物。然后,在一种可选方法中,本发明涉及一种定量样品中脂肪酸的方法,包括在适于将脂肪酸转化为烷烃/烯烃、回收co2和定量co2的条件下,使样品与本发明的脂肪酸脱羧酶接触。能通过本领域技术人员已知的任何方法(例如气相色谱-质谱(gc-mc))测量co2的量。

另一方面,本发明人观察到脂肪酸脱羧酶的荧光随底物浓度的变化而变化。因此,荧光变化提供了用于量化样品中脂肪酸的额外手段。然后,在另一可选方法中,本发明涉及一种用于量化样品中脂肪酸的方法,包括在适于将脂肪酸转化为烷烃/烯烃的条件下使样品与本发明的脂肪酸脱羧酶接触,并测量由脂肪酸脱羧酶发出的荧光。优选地,所述荧光在500至700的波长下测量,动力学优选在约540nm处进行。

当然,用于量化样品中脂肪酸的方法能组合如上详述的几种方法,例如,量化烷烃/烯烃和co2、量化烷烃/烯烃并测量酶荧光、量化co2和测量酶荧光、或三个参数的组合。

脂肪酸定量能用于诊断疾病,例如肝脏疾病(wo15089102)、糖尿病和先兆子痫(wo13170369)。

去除脂肪酸

本发明的脂肪酸脱羧酶还能用于从组合物(例如从营养油,特别是精制的营养油)中去除游离脂肪酸。实际上,本发明的脂肪酸脱羧酶的用途能允许在没有任何化学过程的情况下使脂肪酸脱羧。因此,本发明涉及用如上定义的多肽用于脂肪酸脱羧从而去除脂肪酸的用途;或涉及从组合物中去除游离脂肪酸的方法,包括在适于使游离脂肪酸脱羧的条件下,使本发明的脂肪酸脱羧酶与组合物接触。

在以下实验部分中公开了本发明的其它方面和优势,该实验部分应被视为说明性的而非限制本申请的范围。

附图简述

图1.小球藻匀浆中烷烃合成酶活性的检测。将变异小球藻nc64a的细胞匀浆在密封小瓶中与全氘化(d31)棕榈酸一起孵育过夜。通过固相微萃取(spme)萃取气相的烃,并通过气相色谱与质谱联用(gc-ms)分析。提取对应于m/z=243,5±0.5的离子。

上图:对应于标记的十五烷产物的层析图的一部分;对照:将匀浆在95℃下预热30分钟。下图:标记的十五烷的质谱。

图2.烷烃合成酶的部分纯化步骤和纯化中多个步骤的蛋白谱分析的总结。图1所示的细胞匀浆的细胞级分和洗脱级分进行烷烃合成酶活性测定。蛋白质电泳是在变性条件下在10%凝胶丙烯酰胺上进行。1:凝胶滤过后;2:fastflowq后;3和4:monoq后(用于蛋白质组学分析的级分)。

图3.在3次纯化中的每次后通过蛋白质组学分析检测的蛋白质的数量和10种常见蛋白质的列表。进行三次独立的纯化(a、b、c)。

图4.小球藻烷烃合成酶是预测的叶绿体gmc氧化还原酶。从pfam和protparam检索数据。氨基酸:654;分子量:69070da;理论等电点:9.075。用predalgo预测位于叶绿体中。

图5.表达小球藻gmc氧化还原酶的大肠杆菌细胞中蛋白质的分析。小球藻酶表达为c末端his标签的蛋白质。左:通过sds聚丙烯酰胺凝胶电泳观察到的总蛋白谱。右:使用抗his抗体的蛋白质印迹。c:具有空载体的对照菌株;gmc:表达小球藻gmc氧化还原酶的菌株。

图6.表达小球藻gmc氧化还原酶的大肠杆菌细胞中烃含量的分析。将细胞皂化并通过spme和gcms分析烃含量。应该强调的是,没有添加脂肪酸底物。上图:对应于烃的层析图的区域。下图:检测到的烷烃的质谱。对照:具有空载体的菌株;gmc:表达小球藻gmc氧化还原酶的菌株。量化数据显示平均值±s.d.(n=3)。

图7.表达gmc氧化还原酶的转基因微藻中的烃的分析。通过gc-ms在微藻莱茵衣藻的菌株中分析烃,其中用编码gmc氧化还原酶的基因转化叶绿体基因组。上图:gc层析图的一部分,显示烃峰。下图:烃的定量。wt:野生型菌株。gmcoe:表达小球藻gmc氧化还原酶的菌株。

图8.gmc氧化还原酶家族的多重比对(a)和系统发育树(b)。使用来自小球藻(seqidno1)、衣藻(seqidno5)、胶球藻(seqidno9)、团藻(seqidno10)、褐藻(seqidno11)、圆石藻(seqidno12)、褐潮藻(seqidno13)、褐指藻(seqidno7)、微拟球藻(seqidno14)的序列,用clustalo(1.2.1)构建多重比对。使用多个来源的56个gmc氧化还原酶蛋白质序列的组来构建无根系统发育树(邻接法)。方框指示小球藻gmc氧化还原酶。

图9.重组小球藻gmc氧化还原酶的纯化的级分。该酶在大肠杆菌中表达为n-末端具有his-标签的蛋白质并在镍柱上纯化。f1至f4是洗脱级分。l:分子量梯。

图10.小球藻gmc氧化还原酶对多种脂肪酸的相对活性。在白光下将纯化的重组酶与多种链长的脂肪酸一起孵育,并通过gc-ms分析产物。量化数据显示平均值±s.d.(n=3)

图11.co2作为烷烃合成酶催化的脱羧副产物。1-13c-棕榈酸酯与纯化的重组酶孵育后释放的13co2的相对定量。量化数据显示平均值±s.d.(n=3)。

图12.小球藻gmc氧化还原酶将萜烯酸转化为甲基烷(烯)烃。将纯化的重组酶在白光下与植烷酸一起孵育,并通过gc-ms分析产物。

图13.小球藻gmc氧化还原酶将羟基脂肪酸转化为烷醇。将纯化的重组酶在白光下与羟基棕榈酸酯一起孵育,并通过gc-ms分析产物。

图14.使用gmc氧化还原酶与脂肪酶组合由脂肪酸体外产生烷烃。将纯化的小球藻gmc还原酶和根霉属菌(rhizopus)脂肪酶与三十五烷酸甘油酯一起孵育,并通过gc-ms分析产物。量化数据显示平均值±s.d.(n=3)。

图15.小球藻gmc氧化还原酶的吸收光谱。

图16.藻类gmc氧化还原酶的光依赖性。a,小球藻gmc氧化还原酶的吸收光谱和作用光谱。b,在1-13c-棕榈酸酯与小球藻酶孵育后,通过膜入口质谱法监测13co2释放。将反应混合物暴露于850μmolesphotonsm-2s-1的连续光(蓝色或红色)条件下。c,小球藻gmc氧化还原酶活性与光照强度的相关性。d,在蓝光然后在红光(30μmolesphotonsm-2s-1)培养的过程中,衣藻细胞中总烃的变化。量化数据显示平均值±s.d.(n=3)。

图17.表达小球藻烷烃合成酶的大肠杆菌细胞中的烃的量化,并在黑暗或光照下培养(1000μmolphotonsm-2s-1的白光,含有400-800nm的光子)。量化数据显示平均值±s.d.(n=3)。nd,未检测到。

图18.在底物存在下gmc氧化还原酶荧光的动力学。激发在450nm±5且发射在540nm。使用多种浓度的棕榈酸。

图19.表达衣藻或褐指藻gmc氧化还原酶的大肠杆菌细胞中的烃的量化。将细胞转甲基化并通过溶剂提取和gcms分析烃含量。应该强调的是,没有添加脂肪酸底物。在用空载体转化的大肠杆菌细胞中未检测到烷烃。tr,痕迹。量化数据显示平均值±s.d.(n=3)。

图20.共表达藻类gmc氧化还原酶和脂肪酶的大肠杆菌细胞中的烃的量化。将细胞转甲基化并通过溶剂提取和gcms分析烃含量。应该强调的是,没有添加脂肪酸底物。阴性对照:用空载体转化的大肠杆菌细胞。nd,未检测到。cr:莱茵衣藻;cv:变异小球藻。脂肪酶来自细菌猪葡萄球菌(uniprotp04635)。量化数据显示平均值±s.d.(n=3)。

序列表简述

实施例

在此,发明人在模式微藻变异小球藻nc64a中鉴定了催化烷(烯)烃合成的酶。使用氘标记的棕榈酸作为底物和固相微萃取以捕获十五烷产物来部分纯化酶。通过三次独立部分纯化的蛋白质组学分析鉴定属于葡萄糖-甲醇-胆碱氧化还原酶家族的候选蛋白质。该小球藻候选基因在大肠杆菌中的异源表达导致13至17个碳的线性烃的产生,表明单一酶足以产生类似燃料的烷(烯)烃。使用fad作为辅因子,小球藻烷烃合成酶是69kda预测的叶绿体蛋白质。体外试验表明它能使用c12至c22脂肪酸生成烷(烯)烃。发现该酶的活性严格依赖于400至540nm的光子的存在,但其也可以在300至400nm的范围内起作用。因此,这些结果扩展了关于葡萄糖-甲醇-胆碱氧化还原酶家族的催化库的现有知识,并为可再生和光驱动的烷(烯)烃在微生物中的产生开辟了新的途径。

结果

从变异小球藻nc64a中部分纯化烷烃合成酶活性

发明人已经表明,包括变异小球藻nc64a在内的多种微藻具有合成c15-c17烷烃和烯烃的能力。在同样的工作中,他们还表明,外源添加到小球藻培养物中的氘代棕榈酸能转化为烷烃和烯烃。为了鉴定微藻中烷烃合成的酶促途径,他们选择了基于使用氘标记的棕榈酸作为底物的传统纯化方法。

第一步是确认能在小球藻细胞匀浆中测量酶活性。将氘代棕榈酸加入细胞匀浆中并在密封小瓶中孵育过夜。通过固相微萃取(spme)提取预期的十五烷产物,并用气相色谱与质谱联用(gc-ms)分析。能在完整细胞上检测到对应于标记的十五烷的12.03分钟的峰,但是在预热的对照匀浆上不存在(图1)。

因此,该实验表明小球藻匀浆具有烷烃合成酶活性。因为在大多数生物中鉴定的烷烃合成途径具有醛中间体,本发明人使用标记的c16醛进行相同的实验,但是未检测到标记的十五烷。

因此,标记的棕榈酸用于测定所有纯化过程中的活性(图2)。当细胞以50000g离心时,在上清液级分中发现大多数活性。但在105000g第二次离心后,活性主要在沉淀物中发现(微粒体级分)。测试了不同的洗涤剂以溶解该活性,并且发现效率最高的是tritonx100。

然后在进一步纯化活性之前进行一些初步测试。在溶解的微粒体级分上以不同的组合添加几种辅因子如铁氧还蛋白、铁氧还蛋白还原酶、nadp、nadph和atp。没有发现它们增加活性,并且它们没有被添加到纯化级分的测定中。本发明人还观察到,在3天内,在4℃下储存的溶解的微粒体级分活性降低了90%,表明整个纯化过程必须在几天内进行。

溶解活性的部分纯化包括用制备柱superdex200凝胶过滤的第一步,然后是两个阴离子交换柱、fastflowq和最终更具溶解性的monoq。使用先前描述过的测定法测定大多数级分的烷烃合成酶活性。通过在变性条件下在丙烯酰胺凝胶上电泳来分析大部分活性级分的蛋白质含量(图2)。

进行三次独立的部分纯化。将最终纯化步骤后具有最高活性的级分送去进行蛋白质组学分析。通过至少2个肽计数的截断,在三种纯化之间仅共有10种蛋白质(图3)。这些蛋白中的9种是与充分表征的酶的明确同源物。属于具有多种活性的酶的一组的唯一候选物是来自葡萄糖-甲醇-胆碱(gmc)氧化还原酶家族的推定酶。该候选物也是具有最高肽计数的候选物。因此选择它用于异源表达。

小球藻烷烃合成酶是gmc氧化还原酶家族的成员

编码小球藻gmc氧化还原酶的基因未被公众可获得的est完全覆盖。使用来自小球藻的总rna提取物克隆约2kb的cdna。它编码69kda蛋白质(图4),并且通过微藻序列适应软件predalgo预测其定位于叶绿体。预测n-末端的叶绿体靶向信号长50个残基。tmhmm软件预测没有跨膜结构域。该cdna在大肠杆菌中表达为具有c末端his-标签的蛋白质(图5)。通过蛋白质印迹检查重组蛋白的存在。通过spme和gc-ms分析表达gmc氧化还原酶的大肠杆菌细胞的挥发性产物,显示存在13至17个碳的长链烷烃,其在用空载体转化的大肠杆菌细胞中不存在(图6)。因此,这些结果证明小球藻gmc氧化还原酶的表达足以在大肠杆菌中产生烷烃和烯烃。此外,在用编码小球藻酶的cdna转化其叶绿体基因组的衣藻属株系中,注意到十七烯含量增加,并且还出现十七烷(图7)。因此,该结果表明小球藻酶在叶绿体中是有功能的。

使用小球藻gmc氧化还原酶或来自其他物种的其他生化表征的gmc氧化还原酶的blastp搜索在公共数据库中进行以检索多种gmc氧化还原酶蛋白质序列。藻类序列的多重比对表明一些小球藻残基如c372、r391、y406、q426、h512和n515在其它藻类中高度保守(图8a),并且进行了无根系统发育树(图8b)。blast搜索表明,在大多数生物中,gmc氧化还原酶是单基因家族。在变异小球藻nc64a中,小球藻烷烃合成酶是唯一的gmc氧化还原酶。系统发育树显示gmc氧化还原酶家族由至少7组组成,其中一组仍然没有生化表征的成员。有趣的是,棕色大型藻类(ectocarpus)、红色大型藻类(chondrus)和来自不同来源的微藻(共球藻纲(trebouxiophyceae)小球藻、绿藻纲(chlorophyceae)的衣藻和团藻、胶球藻科(coccomyxaceae)胶球藻、真眼点藻纲微拟球藻、颗石藻纲(coccolithophyceae)圆石藻、硅藻门(diatom)褐指藻)的序列分组在一起。小球藻酶是第一个在该gmc氧化还原酶的藻类分组中具有功能表征的。

小球藻烷合成酶是一种作用于各种脂肪酸的光驱动的光酶

为了进一步表征其活性,小球藻gmc氧化还原酶在大肠杆菌中表达为his-标签的蛋白质并在镍柱上纯化(图9)。发现纯化的重组体对范围在c12至c22个碳的多种饱和游离脂肪酸具有活性(图10),这解释了大肠杆菌中形成的脂肪酸的广泛特征(图6)。

为了确定反应的副产物,本发明人使用在羧基上用13c标记的棕榈酸。他们观察到13co2的产生,证明酶释放co2作为副产物,即其是脂肪酸脱羧酶。(图11)

为了表征进一步的烷烃合成酶活性,使用取代的脂肪酸作为底物。发现花生酸(3,7,11,15-四甲基十六烷酸)转化为支链烷烃,表明烷烃合成酶对萜烯酸具有活性(图12)。使用16-oh棕榈酸作为底物导致十五烷醇的产生,表明小球藻gmc氧化还原酶能用于产生脂肪醇(图13)。

在体外,烷烃合成酶不能直接使用tag(三酰基甘油)作为底物(图14)。然而,在存在释放脂肪酸的tag(三酰基甘油)脂肪酶的情况下,观察到烃的产生。该观察显示,gmc氧化还原酶能用于从富含脂质的油和废物中产生烃。

图15显示fad能吸收320至540nm的光子。这与酶的作用光谱一致(图16a)。

为了确定烷烃合成酶是光驱动酶(光酶)还是光活化酶,在反应过程中监测co2的产生。酶的活性由光子的存在驱动,并在光关闭时立即停止。(图16b)。十五烷的产生随光强度线性增加,证实了小球藻gmc氧化还原酶是光酶的事实(图16c)。藻类烷烃合成酶的光依赖性能用于使用在莱茵衣藻上观察到的光质(蓝色或红色)调节藻类细胞的烃产生(图16d)。微藻在蓝色光子存在下产生烃,而在红色中产生停止并且烷烃含量减少。在表达烷烃光合成酶的大肠杆菌细胞中,光也能用作诱导剂以选择最佳产生烷烃和烯烃的时间(图17)。

底物浓度改变酶荧光

基于酶的光依赖性,我们怀疑在具有或不具有底物的酶活性期间酶荧光能发生变化。为此,我们制作了荧光光谱和动力学(图18)。发明人观察到荧光和动力学随着底物浓度而急剧变化。使用荧光参数来确定脂肪酸浓度能是有用的。

来自衣藻属和褐指藻属的gmc氧化还原酶也是烷烃合成酶

为了研究其他藻类gmc氧化还原酶也具有脂肪酸脱羧酶活性并因此是烷烃合成酶的可能性,另一种衣藻(莱茵衣藻)和硅藻(三角褐指藻)的gmc氧化还原酶在大肠杆菌中表达并通过gc-ms-fid分析细菌细胞的总脂肪酸和烃。衣藻(酶引起在大肠杆菌细胞的十五烷和十七烷以及它们的单不饱和类似物中的形成(图19)。尽管含量较低,褐指藻酶形成相同的化合物。

共表达具有gmc氧化还原酶的脂肪酶在大肠杆菌中促进烷烃合成

游离脂肪酸库通常在活细胞中很小,因为游离脂肪酸对膜结构是有害的。为了通过增加可用的游离脂肪酸的量来观察在大肠杆菌中是否能增加烷烃和烯烃的产生,将细菌脂肪酶(uniprotp04635)与小球藻或衣藻的烷烃合成酶共表达(图20)。与仅表达gmc氧化还原酶的大肠杆菌菌株相比,这导致大大部分烃增加2至3倍。

讨论

烷烃和烯烃是生物燃料产生的感兴趣的化合物,并且烯烃对化学工业特别有意义。在该工作中,使用部分纯化和蛋白质组学分析,发明人能够鉴定来自小球藻的微藻烷基合成酶。它是gmc氧化还原酶家族的成员。当在大肠杆菌中表达时,该蛋白质单独能够产生烷烃和烯烃。该酶的主要意义在于其催化游离脂肪酸的正式脱羧形成饱和烃的明显的能力以及它是光酶的事实。预期机制和可能的辅因子需求不同于细菌细胞色素p450烷烃合成酶。因此,小球藻gmc氧化还原酶扩展烷烃合成酶的库,并为生物技术应用提供了新的可能性。

gmc氧化还原酶的藻类分组

gmc氧化还原酶家族于1992年首次被描述。来自多种生物(分别为:黑腹果蝇(drosophilamelanogaster)、大肠杆菌、黑曲霉和多形汉逊酵母(hansenulapolymorpha))的葡萄糖脱氢酶、胆碱脱氢酶、葡萄糖氧化酶和甲醇氧化酶的蛋白质序列的比较显示较低的相似性但有保守的基序。这些酶含有黄素酶位点和靠近其氨基末端的典型adp结合βαβ折叠。结构研究证实这些蛋白质由n-末端fad结合结构域和c-末端底物结合结构域组成。fad结合结构域形成二核苷酸结合蛋白典型的α-b折叠,而底物结合结构域由α螺旋包围的b折叠组成。尽管插入的结构元件存在于胆碱脱氢酶和醇脱氢酶中,但这些蛋白质的一般拓扑结构是保守的。

gmc氧化还原酶家族的成员催化多种反应,主要是将醇氧化成醛。该家族包括葡萄糖和甲醇氧化酶、脂肪醇氧化酶、胆碱脱氢酶。但该家族还包括来自扁桃的裂解酶,其作用于羟基甘露腈,表明该家族具有非常多样化的催化机制。活性对光的严格依赖性可能是由发现与重组酶相关的fad辅因子介导的。fad的存在与小球藻酶具有像所有gmc氧化还原酶一样的fad结合结构域的事实是一致的(图15)。

有趣的是,所有已经显示产生长链或非常长链烷(烯)烃的微藻物种都与小球藻gmc氧化还原酶具有同源性,但是没有可检测到的烷(烯)烃的唯一物种鸵球藻没有gmc同系物。因此,gmc氧化还原酶的藻类分组的成员很可能都是烷烃合成酶。该想法被来自莱茵衣藻和三角褐指藻的gmc氧化酶具有脂肪酸脱羧酶活性的证据所支持(图19)。

微藻烷烃合成酶的可能的生物技术应用

用于烷烃合成的微藻途径的发现具有生物技术意义,因为微藻是用于脂质产生而非得到生物质的有希望的平台,油的提取和转化为生物柴油是非常昂贵的。在微藻中产生类似燃料的挥发性烷烃,其能被容易的从培养基中回收而因此规避这些问题。

在体外,小球藻酶能够作用于多种脂肪酸,包括中链脂肪酸(图10)。与作用于脂肪醛的植物、蓝细菌或昆虫酶相比,酶作用于游离脂肪酸的事实是明显的优势,因为这些中间体能被许多内源性还原酶降解(rodriguez&atsumi,2014,metabolicengineering,25,227-37)。此外,游离脂肪酸能通过多种类型的脂肪酶产生,其中一些脂肪酶具有高活性并且能使用多种脂质底物(andersson,1996,biochimbiophysacta,1302,236-240)。通过共表达脂肪酶增加游离脂肪酸的可用性来促进烷烃的产生(图20)。在大肠杆菌中,当表达小球藻gmc氧化还原酶时产生一些十三烷(图6)。该烷烃比在藻类中观察到的那些更短,并且是由于在大肠杆菌中存在用于酶的新底物(肉豆蔻酸)。因此,微藻gmc氧化还原酶能用于产生大量的中至短链烷烃,特别是当与积聚短链至中链脂肪酸的微生物中的脂肪酶一起使用时。

由于烷烃合成酶是光酶,光能用于在体外和体内精细调节烷烃的产生。首先,320-540的光子的存在或不存在能用于选择烷烃产生的时刻。其次,光强度能用于增加或降低烷烃合成的速率。这里的实验是在连续光照下进行的,但其他条件如闪光能够对烃类合成是有意义的。

最后,产物(烷烃和烯烃)、副产物(co2)和酶荧光能用于估计样品中游离脂肪酸(或与脂肪酶组合使用时的总脂肪酸)的浓度。

材料与方法

菌株和培养条件

使用莱茵衣藻野生型菌株cc124(nit1nit2;mt-)和cc125(nit1nit2;415mt+)。变异小球藻nc64a来自j.l.vanetten(内布拉斯加大学)的实验室。在富含2%(v/v)co2的空气中,在140rpm下的摇动并且在120μmolphotonsm-2s-1(衣藻)和70μmolphotonsm-2s-1(小球藻)的光强下。在25℃的孵育摇床(inforsht)中将所有株系常规地在锥形瓶中生长,。衣藻和小球藻在tris-醋酸盐-磷酸盐(tap)培养基和基本培养基中培养。使用multisizertm3(coulter)常规计数细胞。

天然烷烃合成酶的纯化

使用fastproteinliquidchromatography系统(aktapurifier900,gehealthcare)。烷烃合成酶活性测定在下一部分中描述。将小球藻细胞(200.109)以6000g离心1小时,并将细胞沉淀在液氮中冷冻并在负80℃下储存1小时。将细胞重悬于含有20mmtris(ph8.0)、100mmnacl和1mmedta(缓冲液a)的裂解缓冲液中,并使用celldisruption(恒定的)在2kbar压力下破碎。将匀浆物以50000g离心两次,每次40分钟。收集上清液并以105000g离心90分钟。将得到的微粒体沉淀在4℃下在缓冲液a中摇动重悬过夜,缓冲液a中加入2.7mmtritonx100。超速离心在105000g下进行90分钟,并将上清液上样到凝胶过滤柱上。合并大多数活性级分,使用30kda超速离心过滤器浓缩,缓冲液替换为稀释的20mmtris(ph8.0)、50mmnacl、1mmedta、0.05%(w/v)tritonx100缓冲液(缓冲液b)。第二纯化步骤涉及阴离子交换柱(hitrapqff,gehealthcare)。使用缓冲液20mmtris(ph8.0)、1mnacl、1mmedta和0.05%(w/v)tritonx100(缓冲液c)的梯度(0-100%)洗脱蛋白质。合并大多数活性级分,使用30kda超速离心过滤器浓缩,并且通过稀释至缓冲液b改变缓冲液。第三纯化步骤涉及强阴离子交换柱(monoqg1,gehealthcare)。使用缓冲液c的梯度洗脱蛋白质。保留大多数活性级分用于蛋白质组学分析。

蛋白质纯化的活性测定

在使用具有隔膜的帽密封的透明玻璃小瓶中进行酶测定。反应混合物含有500μl的每个纯化级分、200μm的全氘化棕榈酸(在乙醇中的10mm储备溶液)和45nmol十六烷作为内标(在氯仿中的4.5mm储备溶液)。将小瓶在25℃下在白光下(强度120μmolphotonsm-2s-1)在120rpm摇动过夜。通过使用注射器通过隔膜添加10μlnaoh10m来终止反应。通过在小瓶的顶部空间中孵育固定在支架上的固相微萃取(spme)纤维(dvbpdms熔融石英,65μm双极,supelco)来分析产生的烃。在室温下孵育15分钟后,立即将spme纤维插入gc-ms的注射器中并在250℃下解吸。如下所述进行gc-ms分析。

蛋白质组学分析

如前所述进行蛋白质制备、凝胶内消化和nanolc-ms/ms分析。简而言之,将溶解在laemmli缓冲液中的蛋白质堆叠在4-12%(w/v)nupage凝胶(invitrogen)的顶部,并用r-250考马斯蓝(biorad)染色。然后切下凝胶条带并使用胰蛋白酶(promega)在凝胶中消化蛋白质。通过使用120分钟梯度的偶联至串联质谱(ultimate3000偶联至ltq-orbitrapvelospro,thermoscientific)的纳米液相色谱分析所得到的肽。通过使用mascot(版本2.5.1)对uniprot(chlorellavariabilistaxonomy,2016年9月版)、典型污染物(自制)和相应的反向数据库进行同时搜索来鉴定肽和蛋白质。在进行汇编、分组和比较来自不同样品的蛋白质组之前,使用proline软件过滤结果(1级肽的保守性,通过采用反向数据库策略,肽长度≥7,每个鉴定的蛋白质分组最少1个特定肽,肽评分计算的肽鉴定fdr<1%)。仅考虑鉴定的具有最小特异性光谱计数为2的蛋白质进行进一步比较。

蛋白质分析和蛋白质印迹

向蛋白质提取物中加入ldsnupage上样染料至1×终浓度,在95℃下煮沸10分钟,用mops跑样缓冲液以还原性10%(w/v)sds-page分离并用硝酸银染色。为了检测带his标签的蛋白质,使用半干印迹系统将通过sds-page分离的多肽转移到硝酸纤维素膜上,并使用兔抗his抗体、辣根过氧化物酶缀合的抗兔抗体和ecl底物(amershambiosciences)以显示his-标签。

烷烃合成酶cdna的克隆及重组烷烃合成酶的纯化

通过酚-氯仿法从小球藻细胞中提取总rna,并使用iii逆转录酶合成cdna。使用在推测的5′和3′utr中设计的引物(正向引物:atggcgtcaattacatcgcg(seqidno24);反向引物:tcatgctgccactgtcgc(seqidno25)),扩增编码gmc氧化还原酶的cdna,克隆到topoxl质粒中并测序。使用正向引物5′-ctgtacttccaatcagccagcgcagttgaagatattc-3′(seqidno27),和反向引物:5′-tatccacctttactgttatcatgctgcaacggttgccggtg-3′(seqidno28),从用于大肠杆菌表达的密码子优化的合成基因,扩增对应于烷烃合成酶残基62-654的序列,并克隆到plic07载体中,该载体在atg起始密码子的下游引入编码6his-标签的硫氧还蛋白和烟草蚀刻病毒(tev)蛋白酶切割位点的盒。重组烷烃合酶在bl2l-codonplus(de3)-ril大肠杆菌细胞中产生,所述大肠杆菌细胞在tb培养基中于37℃培养至od0.9。在此阶段,将温度降至17℃并使细胞生长额外的18小时。通过离心(4000g,10分钟)收获细胞,并将沉淀冷冻。将细胞沉淀在4℃下30分钟重悬于裂解缓冲液中(10ml裂解缓冲液对应于od=1的1升细胞)。裂解缓冲液含有300mmnacl、50mmtrisph8.0、10mm咪唑、5%(w/v)甘油、0.25mgml-1溶菌酶、20mmmgso4、10μgml-1dna酶和抗蛋白酶。重悬后,通过超声裂解细胞并以8000g离心30分钟。收集上清液并通过fplc来纯化酶。在镍柱上进行首次纯化,并使用50%(v/v)含有300mmnacl、50mmtrisph8.0、500mm咪唑、5%(w/v)甘油的第二缓冲液通过分步梯度洗脱蛋白质。使用烟草蚀刻病毒蛋白酶(1mg每10mg总蛋白质)切断his标签和硫氧还蛋白。在tev存在下进行透析过夜,以将缓冲液更换为含有300mmnacl、50mmtrisph8.0、10mm咪唑、5%(w/v)甘油的缓冲液。使用镍柱进行第二次fplc色谱法以将蛋白质与his-标签的硫氧还蛋白分离。最后的纯化步骤是凝胶过滤柱(superdex20026/600mmgehealthcare)。用于该步骤的缓冲液含有150mmnacl、10mmtrisph8.0、5%(w/v)甘油。使用超速离心过滤器50kda来浓缩蛋白质,并在加入20%(w/v)甘油后在-80℃下储存。

变异小球藻(、莱茵衣藻和三角褐指藻gmc氧化还原酶在大肠杆菌中的表达

莱茵衣藻和三角褐指藻的烷烃合成酶,使用莱茵衣藻的正向引物5′-tacttccaatcaatgatgctgggtccgaaaacc-3′(seqidno29),和反向引物5′-tatccacctttactgttctactaaactgcaaccggctgacg-3′(seqidno30),从针对大肠杆菌密码子优化的合成基因扩增。。对于三角褐指藻,正向引物为5′-tacttccaatcaatgaaaaaaagcctgcgtagc-3′(seqidno31),反向引物为5′-tatccacctttactgttctactatgcgcttgcggtg-3′(seqidno32)。将基因克隆到plic07载体中,该载体在atg起始密码子的下游引入编码6his-标签的硫氧还蛋白和烟草蚀刻病毒(tev)蛋白酶切割位点的盒。表达来自变异小球藻nc64a、莱茵衣藻或三角褐指藻的gmc氧化酶的大肠杆菌菌株在37℃下生长,同时以180rpm的速度并且在100μmole.photon.m-2.s-1的光下摇动。当od达到0.6时,加入500μm异丙基β-d-1-硫代半乳糖吡喃糖苷。然后将细胞在37℃下生长24小时,收获,用添加有5%硫酸的甲醇进行转甲基化,并用己烷萃取烃,并如前所述通过gc-ms分析。

在大肠杆菌中共表达gmc氧化还原酶和脂肪酶

用表达来自变异小球藻nc64a(或莱茵衣藻)的gmc氧化酶的载体,和/或表达来自细菌猪葡萄球菌的脂肪酶的载体,转化大肠杆菌菌株并在37℃下在tb培养基中生长。用1mm异丙基β-d-1-硫代半乳糖吡喃糖苷(加入0.2%阿拉伯糖以共表达)诱导表达。然后将细胞在25℃,100μmole.photon.m-2.s-1下培养过夜和6小时,2000μmole.photon.m-2.s-1下培养。收获细胞(4ml,od=5),用添加有5%硫酸的甲醇进行转甲基化,并如前所述通过spme和gc-ms分析烃。

用纯化的酶进行酶促测定

所有测定均在使用具有隔膜的帽所密封的透明玻璃小瓶中进行。使用teorellstenhagen通用缓冲液(33mm柠檬酸一水合物、33mm磷酸、100mmnaoh、16.7mm硼酸,用1nhcl调节到ph8.5)确定最佳ph。其它测定在100mmtrishclph8.5、100mmnacl中进行。反应混合物(500μl)通常含有160nm纯化的酶(储备溶液2.5mgml-1)和400μm底物(在乙醇中的储备溶液10mm)。在一些测定中,脂肪酶与烷烃合成酶一起使用。在这种情况下,底物是三酰基甘油。通常,在led制造的2000μmolphotonsm-2s-1的白光下,样品在200rpm下摇动15分钟。孵育后,将样品在95℃加热15分钟以停止酶促反应。冷却样品并加入内标(十六烷)(45nm,来自在氯仿中的4.5mm储备溶液)。然后将naoh加入到反应混合物中(10μl取自10m的储备溶液中),并将样品涡旋5分钟。然后加入250μl己烷并将样品涡旋5分钟以萃取烷烃和烯烃。通过离心收集己烷相并通过gc-ms-fid分析。通过将100μl的顶部空间直接注入gc-ms进行分析。在图11中,通过使用膜入口质谱法释放13co2来监测1-13c-棕榈酸酯的活性。照明是由cbt-120led(luminous,billerica)提供,强度为850μmolphotonsm-2s-1的蓝色(峰值在460nm,25nmfwhm)或红色(峰值在635nm,15nmfwhm)均是。

烷烃合成酶的荧光

通过uv-vis光谱法(来自secomam的uvikonxs分光光度计)分析酶。在含有100mmtrisph8.5和100mmnacl的缓冲液中,在纯化的酶上测量吸收光谱。使用450nm的激发通量和10nm狭缝在variancaryeclipse上测量荧光光谱(500至700nm)。对于动力学,使用450nm的激发通量和10nm狭缝在540nm处测量荧光。

膜进样质谱(mims)

使用质谱法(型号primab,thermoscientific)监测12co2(m/z=44)和13co2(m/z=45)的在线测量。膜入口系统由热调节氧电极室(hansatech)组成,其通过透气性薄teflon膜(0.001英寸厚度,ysiinc.)(其密封室的底部)连接到质谱仪的真空管线。对于分析,将20μl纯化的酶(2.5mgml-1)和30μl底物(10mm,在二甲基亚砜(13c-棕榈酸)中)加入到1.45ml含有100mmnacl的100mm,ph6.5的tris/acetate/borate缓冲液中,放入测量室,在25℃下进行热调节,并连续搅拌。溶解在介质中的气体通过teflon膜扩散到质谱仪的离子源。

光生物反应器中的培养物

莱茵衣藻cc124(nit1nit2;mt-)和过表达烷烃合成酶基因的莱茵衣藻在基本培养基(harris,1989)中,在作为恒浊器使用的1升光生物反应器(biostataplus,sartoriusstedimbiotech)中培养。使用生物质探针(excellprobe,exner)连续测量a880,并通过注射新鲜培养基将培养物维持在恒定的a880。通过注入koh(0.2n)或hcl(0.2n)将ph维持在恒定值7。使用金属螺旋桨(250rpm)搅拌培养物。将气体流速调节至0.5lmin-1。使用质量流量计(elflow,bronkhorst)产生富含2%(v/v)co2的空气。通过放射状放置在光生物反应器周围的八个荧光管(osramduluxl18w)提供白光。我们使用蓝色滤光片(363specialmedium,leefilters,usa)和红色滤光片(113magenta,leefilters,usa)分别提供蓝光和红光。两种光都具有相同的强度(35μmolphotonsm-2s-1)。

转甲基化

为了将烃与脂肪酸一起量化,使用全细胞的转甲基化。简而言之,向细胞沉淀(1亿个衣藻细胞,2亿个小球藻nc64a细胞,20mlod-1单位的大肠杆菌)中加入2ml含有5%(v/v)硫酸和25μg三十五烷酸酯(来自在氯仿中的2.5mg/ml储备溶液)的甲醇的溶液,以及包括5μg16:0-烷烃(在氯仿中的1mg/ml储备溶液)作为内标。将样品在密封的玻璃管中于85℃孵育90分钟。冷却后,通过加入250μl己烷和500μl0.9%nacl(w/v)来萃取fame和烃。将样品涡旋10分钟,并通过在3000g下离心2分钟将有机相与水相分离。回收己烷相,并在gc-ms/fid中注入1μl。

gc-ms分析

使用以下设置进行在固相微萃取(spme)之后进行的气相色谱-质谱联用(gc-ms)分析。将thermo-fischer气相色谱仪focus系列与thermo-fischerdsqii质谱仪(简单四极杆)偶联并与db-5ht(agilent)非极性毛细管柱(长30m,内径0.25mm,膜厚0.1μm)一起使用。氦载气为1mlmin-1。将烘箱温度设定为在50℃下最初2分钟的保持时间,然后在10℃min-1下从50℃升温至300℃,并在300℃最终3分钟的保持时间。在250℃下以不分流模式(2分钟)注入样品。ms在40-500amu(电子碰撞电离,70ev)下进行全扫描,并使用内标基于总离子电流量化峰值。对于共底物确定,使用柱hp-plotq(直径0.32mm×30m),并在40℃的烘箱温度和单离子监测(m/z40、44、45)下分析co2、13co2和氩气。

gc-ms/fid分析

通过与质谱和火焰离子化检测(gc-ms/fid)联用气相色谱仅在转甲基化反应后进行分析,以便一起定量脂肪酸和烃。在agilent7890a气相色谱仪上进行分析,该仪器与agilent5975c质谱仪(简单四极杆)偶联。使用zebron7hg-g007-11(phenomenex)极性毛细管柱(长30m,内径0.25mm,膜厚0.25μm)。氢载气为1mlmin-1。烘箱温度设定为以60℃最初2分钟的保持时间为,第一个斜坡以20℃min-1从60℃到150℃,在150℃时5分钟的保持时间,然后是第二个斜坡以6℃min-1从150℃至240℃,在240℃下最后3分钟的保持时间。在250℃下以不分流模式(1分钟)注入样品。在40-350amu(70ev的电子碰撞电离)下进行ms全扫描,并使用内标基于fid信号量化峰值。

系统发育

为了构建系统发育树,从cyanobase(http://genome.kazusa.or.jp/cyanobase/)、ncbi(http://www.ncbi.nlm.nih.gov/)、phytozome(https://phytozome.jgi.doe.gov)或cyanidioschyzonmerolae(http://merolae.biol.s.u-tokyo.ac.jp/)中检提取了来自原核生物和真核生物的gmc氧化还原酶的56个氨基酸序列。序列与mafft第7版程序比对。将所得的比对用seaview第4版手动精制,并且从进一步分析中去除同源性令人怀疑的区域。保留了总共266个氨基酸位置用于系统发育分析。该树是使用neighbor-joining(nj)获得的,用到phylogeneticinferencepackagephylip版本3.69中的方法。protdist程序用于创建距离矩阵。neighbor程序用于nj分析,序列输入顺序随机化(20个jumbles)。seqboot和consense程序分别用于100次重复和一致树重建的自举值计算。使用dendroscope第3版绘制系统发育树。

序列表

<110>cea

cnrs

<120>新型脂肪酸脱羧酶及其用途

<130>b2241pc

<160>32

<170>patentinversion3.5

<210>1

<211>594

<212>prt

<213>变异小球藻

<400>1

argalaseralavalgluaspilearglysvalleuseraspserser

151015

serprovalalaglyglnlystyrasptyrileleuvalglyglygly

202530

thralaalacysvalleualaasnargleuseralaaspglyserlys

354045

argvalleuvalleuglualaglyproaspasnthrserargaspval

505560

lysileproalaalailethrargleupheargserproleuasptrp

65707580

asnleuphesergluleuglngluglnleualagluargglniletyr

859095

metalaargglyargleuleuglyglyserseralathrasnalathr

100105110

leutyrhisargglyalaalaglyasptyraspalatrpglyvalglu

115120125

glytrpsersergluaspvalleusertrpphevalglnalagluthr

130135140

asnalaasppheglyproglyalatyrhisglyserglyglypromet

145150155160

argvalgluasnproargtyrthrasnlysglnleuhisthralaphe

165170175

phelysalaalaglugluvalglyleuthrproasnserasppheasn

180185190

asptrpserhisasphisalaglytyrglythrpheglnvalmetgln

195200205

asplysglythrargalaaspmettyrargglntyrleulysproval

210215220

leuglyargargasnleuglnvalleuthrglyalaalavalthrlys

225230235240

valasnileaspglnalaalaglylysalaglnalaleuglyvalglu

245250255

pheserthraspglyprothrglygluargleuseralagluleuala

260265270

proglyglygluvalilemetcysalaglyalavalhisthrprophe

275280285

leuleulyshisserglyvalglyproseralagluleulysgluphe

290295300

glyileprovalvalserasnleualaglyvalglyglnasnleugln

305310315320

aspglnproalacysleuthralaalaprovallysglulystyrasp

325330335

glyilealaileserasphisiletyrasnglulysglyglnilearg

340345350

lysargalailealasertyrleuleuglyglyargglyglyleuthr

355360365

serthrglycysaspargglyalaphevalargthralaglyglnala

370375380

leuproaspleuglnvalargphevalproglymetalaleuasppro

385390395400

aspglyvalserthrtyrvalargphealalyspheglnserglngly

405410415

leulystrpproserglyilethrmetglnleuilealacysargpro

420425430

glnserthrglyservalglyleulysseralaaspprophealapro

435440445

prolysleuserproglytyrleuthrasplysaspglyalaaspleu

450455460

alathrleuarglysglyilehistrpalaargaspvalalaargser

465470475480

seralaleuserglutyrleuaspglygluleupheproglysergly

485490495

valvalseraspaspglnileaspglutyrileargargserilehis

500505510

serserasnalailethrglythrcyslysmetglyasnalaglyasp

515520525

serserservalvalaspasnglnleuargvalhisglyvalglugly

530535540

leuargvalvalaspalaservalvalprolysileproglyglygln

545550555560

thrglyalaprovalvalmetilealagluargalaalaalaleuleu

565570575

thrglylysalathrileglyalaseralaalaalaproalathrval

580585590

alaala

<210>2

<211>654

<212>prt

<213>变异小球藻

<400>2

metalaserilethrserargalaseralaargalasercyssergln

151015

alaasnthrargalaglyargvalalaleuserglyglyalaleuleu

202530

argproalaargproalaargserphevalproalaarglysglngln

354045

glnglyalavalargargglyglyalaleuseralaargalaserala

505560

valgluaspilearglysvalleuseraspserserserprovalala

65707580

glyglnlystyrasptyrileleuvalglyglyglythralaalacys

859095

valleualaasnargleuseralaaspglyserlysargvalleuval

100105110

leuglualaglyproaspasnthrserargaspvallysileproala

115120125

alailethrargleupheargserproleuasptrpasnleupheser

130135140

gluleuglngluglnleualagluargglniletyrmetalaarggly

145150155160

argleuleuglyglyserseralathrasnalathrleutyrhisarg

165170175

glyalaalaglyasptyraspalatrpglyvalgluglytrpserser

180185190

gluaspvalleusertrpphevalglnalagluthrasnalaaspphe

195200205

glyproglyalatyrhisglyserglyglyprometargvalgluasn

210215220

proargtyrthrasnlysglnleuhisthralaphephelysalaala

225230235240

glugluvalglyleuthrproasnserasppheasnasptrpserhis

245250255

asphisalaglytyrglythrpheglnvalmetglnasplysglythr

260265270

argalaaspmettyrargglntyrleulysprovalleuglyargarg

275280285

asnleuglnvalleuthrglyalaalavalthrlysvalasnileasp

290295300

glnalaalaglylysalaglnalaleuglyvalglupheserthrasp

305310315320

glyprothrglygluargleuseralagluleualaproglyglyglu

325330335

valilemetcysalaglyalavalhisthrpropheleuleulyshis

340345350

serglyvalglyproseralagluleulysglupheglyileproval

355360365

valserasnleualaglyvalglyglnasnleuglnaspglnproala

370375380

cysleuthralaalaprovallysglulystyraspglyilealaile

385390395400

serasphisiletyrasnglulysglyglnilearglysargalaile

405410415

alasertyrleuleuglyglyargglyglyleuthrserthrglycys

420425430

aspargglyalaphevalargthralaglyglnalaleuproaspleu

435440445

glnvalargphevalproglymetalaleuaspproaspglyvalser

450455460

thrtyrvalargphealalyspheglnserglnglyleulystrppro

465470475480

serglyilethrmetglnleuilealacysargproglnserthrgly

485490495

servalglyleulysseralaaspprophealaproprolysleuser

500505510

proglytyrleuthrasplysaspglyalaaspleualathrleuarg

515520525

lysglyilehistrpalaargaspvalalaargserseralaleuser

530535540

glutyrleuaspglygluleupheproglyserglyvalvalserasp

545550555560

aspglnileaspglutyrileargargserilehisserserasnala

565570575

ilethrglythrcyslysmetglyasnalaglyaspserserserval

580585590

valaspasnglnleuargvalhisglyvalgluglyleuargvalval

595600605

aspalaservalvalprolysileproglyglyglnthrglyalapro

610615620

valvalmetilealagluargalaalaalaleuleuthrglylysala

625630635640

thrileglyalaseralaalaalaproalathrvalalaala

645650

<210>3

<211>729

<212>prt

<213>人工序列

<220>

<223>shgmc

<400>3

metglyhishishishishishisserasplysileilehisleuthr

151015

aspaspserpheaspthraspvalleulysalaaspglyalaileleu

202530

valaspphetrpalaglutrpcysglyprocyslysmetilealapro

354045

ileleuaspgluilealaaspglutyrglnglylysleuthrvalala

505560

lysleuasnileaspglnasnproglythralaprolystyrglyile

65707580

argglyileprothrleuleuleuphelysasnglygluvalalaala

859095

thrlysvalglyalaleuserlysglyglnleulysglupheleuasp

100105110

alaasnleualaglyserglyserglyvalserglyvalaspleugly

115120125

thrgluasnleutyrpheglnseralaseralavalgluaspilearg

130135140

lysvalleuseraspserserserprovalalaglyglnlystyrasp

145150155160

tyrileleuvalglyglyglythralaalacysvalleualaasnarg

165170175

leuseralaaspglyserlysargvalleuvalleuglualaglypro

180185190

aspasnthrserargaspvallysileproalaalailethrargleu

195200205

pheargserproleuasptrpasnleuphesergluleuglnglugln

210215220

leualagluargglniletyrmetalaargglyargleuleuglygly

225230235240

serseralathrasnalathrleutyrhisargglyalaalaglyasp

245250255

tyraspalatrpglyvalgluglytrpsersergluaspvalleuser

260265270

trpphevalglnalagluthrasnalaasppheglyproglyalatyr

275280285

hisglyserglyglyprometargvalgluasnproargtyrthrasn

290295300

lysglnleuhisthralaphephelysalaalaglugluvalglyleu

305310315320

thrproasnserasppheasnasptrpserhisasphisalaglytyr

325330335

glythrpheglnvalmetglnasplysglythrargalaaspmettyr

340345350

argglntyrleulysprovalleuglyargargasnleuglnvalleu

355360365

thrglyalaalavalthrlysvalasnileaspglnalaalaglylys

370375380

alaglnalaleuglyvalglupheserthraspglyprothrglyglu

385390395400

argleuseralagluleualaproglyglygluvalilemetcysala

405410415

glyalavalhisthrpropheleuleulyshisserglyvalglypro

420425430

seralagluleulysglupheglyileprovalvalserasnleuala

435440445

glyvalglyglnasnleuglnaspglnproalacysleuthralaala

450455460

provallysglulystyraspglyilealaileserasphisiletyr

465470475480

asnglulysglyglnilearglysargalailealasertyrleuleu

485490495

glyglyargglyglyleuthrserthrglycysaspargglyalaphe

500505510

valargthralaglyglnalaleuproaspleuglnvalargpheval

515520525

proglymetalaleuaspproaspglyvalserthrtyrvalargphe

530535540

alalyspheglnserglnglyleulystrpproserglyilethrmet

545550555560

glnleuilealacysargproglnserthrglyservalglyleulys

565570575

seralaaspprophealaproprolysleuserproglytyrleuthr

580585590

asplysaspglyalaaspleualathrleuarglysglyilehistrp

595600605

alaargaspvalalaargserseralaleuserglutyrleuaspgly

610615620

gluleupheproglyserglyvalvalseraspaspglnileaspglu

625630635640

tyrileargargserilehisserserasnalailethrglythrcys

645650655

lysmetglyasnalaglyaspserserservalvalaspasnglnleu

660665670

argvalhisglyvalgluglyleuargvalvalaspalaservalval

675680685

prolysileproglyglyglnthrglyalaprovalvalmetileala

690695700

gluargalaalaalaleuleuthrglylysalathrileglyalaser

705710715720

alaalaalaproalathrvalalaala

725

<210>4

<211>15

<212>prt

<213>人工序列

<220>

<223>共有序列

<220>

<221>misc_feature

<222>(2)..(2)

<223>x是任意氨基酸

<220>

<221>misc_feature

<222>(4)..(7)

<223>x是任意氨基酸

<220>

<221>misc_feature

<222>(9)..(9)

<223>x是d或e

<220>

<221>misc_feature

<222>(10)..(10)

<223>x是任意氨基酸

<220>

<221>misc_feature

<222>(12)..(12)

<223>xisaorg

<220>

<221>misc_feature

<222>(14)..(14)

<223>x是任意氨基酸

<220>

<221>misc_feature

<222>(15)..(15)

<223>x是k或r

<400>4

glyxaaleuxaaxaaxaaxaacysxaaxaaglyxaaphexaaxaa

151015

<210>5

<211>580

<212>prt

<213>莱茵衣藻

<400>5

leuservalargalaalaalaglyproalaglyserglulyspheasp

151015

tyrvalleuvalglyglyglythralasercysvalleualaasnlys

202530

leuseralaaspglyasnlyslysvalleuvalleuglualaglypro

354045

thrglyaspalametgluvalalavalproalaglyilethrargleu

505560

phealahisprovalmetasptrpglymetserserleuthrglnlys

65707580

glnleuvalalaarggluiletyrleualaargglyargmetleugly

859095

glyserserglyserasnalathrleutyrhisargglyseralaala

100105110

asptyraspalatrpglyleugluglytrpserserlysaspvalleu

115120125

asptrpphevallysalaglucystyralaaspglyprolysprotyr

130135140

hisglythrglyglysermetasnthrgluglnproargtyrgluasn

145150155160

valleuhisaspgluphephelysalaalaalaalathrglyleupro

165170175

alaasnproasppheasnasptrpserhisproglnaspglyphegly

180185190

glupheglnvalserglnlyslysglyglnargalaaspthrtyrarg

195200205

thrtyrleulysproalametalaargglyasnleulysvalvalile

210215220

glyalaargalathrlysvalasnileglulysglyserserglyala

225230235240

argthrthrglyvalglutyralametglnglnpheglyaspargphe

245250255

thralagluleualaproglyglygluvalleumetcysserglyala

260265270

valhisthrprohisleuleumetleuserglyvalglyproalaala

275280285

thrleulysgluhisglyileaspvalvalseraspleuserglyval

290295300

glyglnasnleuglnasphisproalaalavalleualaalaargala

305310315320

lysproglupheglulysleuservalthrsergluvaltyraspasp

325330335

lyscysasnilelysleuglyalavalalaglntyrleupheglnarg

340345350

argglyproleualathrthrglycysasphisglyalaphevalarg

355360365

thrserserserleuserglnproaspleuglnmetargphevalpro

370375380

glycysalaleuaspproaspglyvallyssertyrilevalphegly

385390395400

gluleulyslysglnglyargalatrpproglyglyilethrleugln

405410415

leuleualaileargalalysserlysglyserileglyleulysala

420425430

alaasppropheileasnproalaileasnileasntyrpheserasp

435440445

proalaaspleualathrleuvalasnalavallysmetalaarglys

450455460

ilealaalaglngluproleulyslystyrleuglnglugluthrphe

465470475480

proglygluargalaserserasplysaspleugluglutyrilearg

485490495

argthrvalhisserglyasnalaleuvalglythralaalametgly

500505510

alaserproalaalaglyalavalvalserseralaaspleulysval

515520525

pheglyvalgluglyleuargvalvalaspalaservalleuproarg

530535540

ileproglyglyglnthrglyalaalathrvalmetvalalagluarg

545550555560

alaalaalaleuleuargglyglnalathrilealaproserarggln

565570575

provalalaval

580

<210>6

<211>611

<212>prt

<213>莱茵衣藻

<400>6

metmetleuglyprolysthrvalthrargglyalathrlysglyala

151015

alaproargsermetalaalaargargvalglyglyalaargargleu

202530

servalargalaalaalaglyproalaglyserglulyspheasptyr

354045

valleuvalglyglyglythralasercysvalleualaasnlysleu

505560

seralaaspglyasnlyslysvalleuvalleuglualaglyprothr

65707580

glyaspalametgluvalalavalproalaglyilethrargleuphe

859095

alahisprovalmetasptrpglymetserserleuthrglnlysgln

100105110

leuvalalaarggluiletyrleualaargglyargmetleuglygly

115120125

serserglyserasnalathrleutyrhisargglyseralaalaasp

130135140

tyraspalatrpglyleugluglytrpserserlysaspvalleuasp

145150155160

trpphevallysalaglucystyralaaspglyprolysprotyrhis

165170175

glythrglyglysermetasnthrgluglnproargtyrgluasnval

180185190

leuhisaspgluphephelysalaalaalaalathrglyleuproala

195200205

asnproasppheasnasptrpserhisproglnaspglypheglyglu

210215220

pheglnvalserglnlyslysglyglnargalaaspthrtyrargthr

225230235240

tyrleulysproalametalaargglyasnleulysvalvalilegly

245250255

alaargalathrlysvalasnileglulysglyserserglyalaarg

260265270

thrthrglyvalglutyralametglnglnpheglyaspargphethr

275280285

alagluleualaproglyglygluvalleumetcysserglyalaval

290295300

histhrprohisleuleumetleuserglyvalglyproalaalathr

305310315320

leulysgluhisglyileaspvalvalseraspleuserglyvalgly

325330335

glnasnleuglnasphisproalaalavalleualaalaargalalys

340345350

proglupheglulysleuservalthrsergluvaltyraspasplys

355360365

cysasnilelysleuglyalavalalaglntyrleupheglnargarg

370375380

glyproleualathrthrglycysasphisglyalaphevalargthr

385390395400

serserserleuserglnproaspleuglnmetargphevalprogly

405410415

cysalaleuaspproaspglyvallyssertyrilevalpheglyglu

420425430

leulyslysglnglyargalatrpproglyglyilethrleuglnleu

435440445

leualaileargalalysserlysglyserileglyleulysalaala

450455460

asppropheileasnproalaileasnileasntyrpheserasppro

465470475480

alaaspleualathrleuvalasnalavallysmetalaarglysile

485490495

alaalaglngluproleulyslystyrleuglnglugluthrphepro

500505510

glygluargalaserserasplysaspleugluglutyrileargarg

515520525

thrvalhisserglyasnalaleuvalglythralaalametglyala

530535540

serproalaalaglyalavalvalserseralaaspleulysvalphe

545550555560

glyvalgluglyleuargvalvalaspalaservalleuproargile

565570575

proglyglyglnthrglyalaalathrvalmetvalalagluargala

580585590

alaalaleuleuargglyglnalathrilealaproserargglnpro

595600605

valalaval

610

<210>7

<211>568

<212>prt

<213>三角褐指藻

<400>7

tyrasptyrileilecysglyglyglyleualaglycysvalleuala

151015

gluargleuserglnaspgluserlysargvalleuvalleugluala

202530

glyglyserasptyrlysserleupheileargileproalaglyval

354045

leuargleupheargserlystyrasptrpglnhisgluthrglygly

505560

glulysglycysasnglyargasnvalpheleuglnargglylysile

65707580

leuglyglysersercysthrasnvalcysleuhishisargglyser

859095

alagluasptyrasnsertrpasnileproglytrpthralathrasp

100105110

valleuprophephelysglnserglnlysaspgluthrglyargasp

115120125

alathrphehisglyalaaspglyglutrpvalmetaspgluvalarg

130135140

tyrglnasnproleuserlysleupheleugluvalglyglualaala

145150155160

glyleuglythrasnaspasppheasnasntrpserhisproglnasp

165170175

glyvalglyargpheglnvalsergluvalasnglygluargcysser

180185190

glyalathralapheleuserlysalaalalysargserasnvalile

195200205

valargthrglythrmetvalargargileasppheaspgluthrlys

210215220

thralalysglyilethrtyraspleumetglyaspaspthrcysthr

225230235240

thrpheglnalacysleulysgluglyglygluvalleuvalthrgly

245250255

glyalailealaserproglnleuleumetcysserglyileglypro

260265270

glylyshisleuargserleuglyileprovalvalhisaspasnser

275280285

alavalglygluasnleuglnasphisproalaalavalvalserphe

290295300

lysthrproglnlysglyvalservalthrserlysleuargleuphe

305310315320

glylysthrasnproileprovalpheglntrpleuphephelysser

325330335

glyleuleuthrserthrglycysasphisglyalaphevalargthr

340345350

seraspserleugluglnproaspleuglnileargpheleualaala

355360365

argalaleuglyproaspglymetthrthrtyrthrlyspheargthr

370375380

metlysthrvalgluaspglytyrserpheglnservalalacysarg

385390395400

alalysserlysglyargileargleuserserserasnserhisval

405410415

lysprometileaspglyglytyrleuserasnglnaspaspleuala

420425430

thrleuargalaglyilelysleuglyargmetleuglyasnargpro

435440445

glutrpglyglutyrleuglyglngluvaltyrproglyproaspval

450455460

glnthraspglugluileaspglutyrileargasnserleuhisthr

465470475480

alaasnalaleuthrglythrcyslysmetglythrglyargglyala

485490495

valvalglyproaspleuargvalileglyvalasnglyvalargval

500505510

glyaspserservalpheprocysileproglyglyglnthralathr

515520525

prothrvalmetileglyaspargalaalavalphevalargglnpro

530535540

valserglnleuasnilegluilepheargglulysglyglythrhis

545550555560

proglyalathrthralaserala

565

<210>8

<211>614

<212>prt

<213>三角褐指藻

<400>8

metlyslysserleuargserleuleuvaltrpthrleuservalser

151015

seralaseralathrthrmetalaglyalalysproleuglyasnval

202530

proargalaglngluaspgluarglysvalvalalagluprotyrasp

354045

tyrileilecysglyglyglyleualaglycysvalleualagluarg

505560

leuserglnaspgluserlysargvalleuvalleuglualaglygly

65707580

serasptyrlysserleupheileargileproalaglyvalleuarg

859095

leupheargserlystyrasptrpglnhisgluthrglyglyglulys

100105110

glycysasnglyargasnvalpheleuglnargglylysileleugly

115120125

glysersercysthrasnvalcysleuhishisargglyseralaglu

130135140

asptyrasnsertrpasnileproglytrpthralathraspvalleu

145150155160

prophephelysglnserglnlysaspgluthrglyargaspalathr

165170175

phehisglyalaaspglyglutrpvalmetaspgluvalargtyrgln

180185190

asnproleuserlysleupheleugluvalglyglualaalaglyleu

195200205

glythrasnaspasppheasnasntrpserhisproglnaspglyval

210215220

glyargpheglnvalsergluvalasnglygluargcysserglyala

225230235240

thralapheleuserlysalaalalysargserasnvalilevalarg

245250255

thrglythrmetvalargargileasppheaspgluthrlysthrala

260265270

lysglyilethrtyraspleumetglyaspaspthrcysthrthrphe

275280285

glnalacysleulysgluglyglygluvalleuvalthrglyglyala

290295300

ilealaserproglnleuleumetcysserglyileglyproglylys

305310315320

hisleuargserleuglyileprovalvalhisaspasnseralaval

325330335

glygluasnleuglnasphisproalaalavalvalserphelysthr

340345350

proglnlysglyvalservalthrserlysleuargleupheglylys

355360365

thrasnproileprovalpheglntrpleuphephelysserglyleu

370375380

leuthrserthrglycysasphisglyalaphevalargthrserasp

385390395400

serleugluglnproaspleuglnileargpheleualaalaargala

405410415

leuglyproaspglymetthrthrtyrthrlyspheargthrmetlys

420425430

thrvalgluaspglytyrserpheglnservalalacysargalalys

435440445

serlysglyargileargleuserserserasnserhisvallyspro

450455460

metileaspglyglytyrleuserasnglnaspaspleualathrleu

465470475480

argalaglyilelysleuglyargmetleuglyasnargproglutrp

485490495

glyglutyrleuglyglngluvaltyrproglyproaspvalglnthr

500505510

aspglugluileaspglutyrileargasnserleuhisthralaasn

515520525

alaleuthrglythrcyslysmetglythrglyargglyalavalval

530535540

glyproaspleuargvalileglyvalasnglyvalargvalglyasp

545550555560

serservalpheprocysileproglyglyglnthralathrprothr

565570575

valmetileglyaspargalaalavalphevalargglnprovalser

580585590

glnleuasnilegluilepheargglulysglyglythrhisprogly

595600605

alathrthralaserala

610

<210>9

<211>585

<212>prt

<213>胶球藻

<400>9

alaleuargvalargalaileilelysseraspasnproalaalaasp

151015

lystyrasppheileleuvalglyglyglythralaglycysvalleu

202530

alaasnargleuthralaaspglyserlyslysvalleuleuleuglu

354045

alaglyglyalaasnlysalaarggluvalargthrproalaglyleu

505560

proargleuphelysseralaleuasptrpasnleutyrserserleu

65707580

glnglnalaalaseraspargseriletyrleualaargglylysleu

859095

leuglyglyserseralathrasnalathrleutyrhisargglythr

100105110

alaalaasptyraspalatrpglyvalproglytrpthrserglnasp

115120125

alaleuargtrppheileglnalagluasnasncysargglyileglu

130135140

aspglyvalhisglythrglyglyleumetargvalgluasnproarg

145150155160

tyrasnasnproleuhisgluvalphepheglnalaalalysglnala

165170175

glyleuprogluasnaspasnpheasnasntrpglyargserglnala

180185190

glytyrglyglupheglnvalthrhisserlysglygluargalaasp

195200205

cyspheargmettyrleugluprovalmetglyargserasnleuthr

210215220

valleuthrglyalalysthrleulysilegluthrglulyssergly

225230235240

glyalathrvalserargglyvalthrpheglnvalasnglyglnasp

245250255

glyserlyshisseralagluleualaalaglyglygluvalvalleu

260265270

cysalaglyserilehisserproglnileleuglnleuserglyile

275280285

glyproglnalagluleuargserlysaspileprovalvalalaasp

290295300

leuproglyvalglyglnasnmetglnasphisproalacysleuser

305310315320

alaphetyrleulysgluseralaglyproileservalthraspglu

325330335

leuleuhisthrasnglyargileargalaargalaileleulystyr

340345350

leuleuphelyslysglyproleualathrthrglycysasphisgly

355360365

alaphevallysthralaglyglnsergluproaspleuglnilearg

370375380

phevalproglyleualaleuaspproaspglyileglysertyrthr

385390395400

alapheglylysmetlysaspglnlystrpproserglyilethrphe

405410415

glnleuleuglyvalargprolysserargglyservalglyleuarg

420425430

seraspaspprotrpaspalaprolysleuaspileglypheleuthr

435440445

asplysgluglyalaaspleualathrleuargserglyilelysleu

450455460

serarggluilealaalagluproalapheglyalatyrvalglyasn

465470475480

gluleuhisproglyalaalaalaserseraspseralaileaspser

485490495

pheileargaspthrvalhisserglyasnalaasnvalglythrcys

500505510

sermetglyvalasnglyasnalavalvalaspproserleuargval

515520525

pheglyileargglyleuargvalalaaspalaservalileproval

530535540

ileproglyglyglnthrglyalaalathrvalmetvalalagluarg

545550555560

alaalagluileleuleuglyserasnglnlysglnproalaalaala

565570575

valproalaalaglnproalaleuala

580585

<210>10

<211>580

<212>prt

<213>强壮团藻

<400>10

provalalavallysalaalaalaservalglyserglulyspheasp

151015

tyrileleuvalglyglyglythralaglycysvalleualaasnlys

202530

leuseralaasnglyserlyslysvalleuvalleuglualaglypro

354045

thrglyaspalametgluvalalavalproalaglyilealaargleu

505560

phealahisprovalpheasptrpglymetserserleuthrglngln

65707580

glnleuvalalaarggluiletyrleualaargglyargleuleugly

859095

glyserserglythrasnalathrleutyrhisargglythrproala

100105110

asptyraspsertrpglyleugluglytrpthrserlysaspleuleu

115120125

asptrpphevallysalaglucystyrglyaspglyproargalaphe

130135140

hisglyglnserglysermetasnvalgluglnproargtyrglnasn

145150155160

valleuhisaspgluphepheargalaalaalaalaalaglyleupro

165170175

alaasngluasppheasnasptrpserargproglngluglytyrgly

180185190

glupheglnvalalaglnlysasnglygluargalaaspthrtyrarg

195200205

thrtyrleulysproalametglyargaspasnleulysvalmetthr

210215220

glyalaargthrthrlysvalhisileglulysserserthrglypro

225230235240

argalaargglyvalglutyralathrglnglnpheglygluargtyr

245250255

thralagluleuthrproglyglygluvalleumetcysthrglyala

260265270

valhisthrprohisleuleumetleuserglyileglyproalapro

275280285

thrleuleugluhisglyleuaspvalileserserleuproglyval

290295300

glyalaasnleuglnasphisproalaalavalleualavalargala

305310315320

lysprogluphegluglyleuservalthrsergluiletyraspser

325330335

lyscysasnileargleuglyalavalmetlystyrleupheglyarg

340345350

argglyproleualathrthrglycysasphisglyalaphevalarg

355360365

thrseralaserhisserglnproaspleuglnmetargphevalpro

370375380

glycysalaleuaspproaspglyvallyssertyrilevalphegly

385390395400

gluleulyslysglnglyargalatrpproglyglyilethrleugln

405410415

leuleuglyileargalalysserargglyserileglyleulysala

420425430

alaasppropheileasnproalaileasnileasntyrpheserasp

435440445

progluaspleualathrleulysasnglyvalargilealaargglu

450455460

ilevalalaglngluproleuarglystyrleuleuglugluthrphe

465470475480

proglygluargalaasnthrasplysaspilegluglutyrvalarg

485490495

argthrvalhisserglyasnalaleuvalglythrcysalametgly

500505510

thrthrproalaserglyalavalvalserseralaaspleulysval

515520525

pheglyvalaspglyleuargvalvalaspalaservalleuproarg

530535540

ileproglyglyglnthrglyalaalathrvalmetvalalagluarg

545550555560

alaalaalametleuleuglyglnalathrilethrserargargglu

565570575

proalaalaval

580

<210>11

<211>557

<212>prt

<213>长囊水云

<400>11

valproalaalaargtyralathrserservalsermetservalala

151015

glugluglyhislyspheileileileglyglyglythralaglycys

202530

valleualaasnargleuseralaasplysaspasnservalleuval

354045

leuglualaglyserglulyspheasnaspargasnilelysmetpro

505560

ilealaileleuargleuphelysservalpheasptrpglyphegln

65707580

sergluasnglulysphealathrglyaspglyiletyrleucysarg

859095

glylysvalleuglyglysersercysthrasnvalmetleutyrhis

100105110

argglygluglualaasptyraspalatrpglyvalaspglytrplys

115120125

glylysaspvalleuprotyrphelyslysalagluasnasnargser

130135140

lyslyslysglygluphehisglylysglyglyleumetglnvalglu

145150155160

asnalaargtyrmetasnproleuthrlysleuphephelysalacys

165170175

gluglnalaglyleusergluasngluasppheasnasptrpserhis

180185190

serglngluglypheglyargpheglnvalalaglnlysargglylys

195200205

argcysseralaalasersertyrleulysglualametglyarglys

210215220

asnleuaspvalglnthrseralaglnilethrlysvalleuileglu

225230235240

asnglyglyalaileglyvalglutyrvalargaspglyglulyslys

245250255

ilealalysleualavalglyglygluileleuleualaglyglyala

260265270

ileserserproglnvalleumetleuserglyvalglyproalaglu

275280285

hisleuargserlysglyilegluvallysserasnvalproglyval

290295300

glylysasnleuargasphisproalavalthrvalmetalaaspile

305310315320

asnlysproileserilethrasplysvalleulysgluglysergly

325330335

aspvalasnlysilethralaleuglntrpleuleuthrglythrgly

340345350

proleuthrserproglycysgluasnglyalaphephelysthrthr

355360365

proasplysalaalaalaaspleuglnleuargphevalproglyarg

370375380

serthrthrproaspglyvallysalatyrasnthrileglythrlys

385390395400

glyargproproserglyvalthrvalglnvalvalglyileargpro

405410415

glnsergluglyhisvalgluleuargserserasppropheasplys

420425430

prohisilevalthrasntyrleugluserglygluaspmetalaser

435440445

leuthrasnglyileglumetalaarglysleupheaspglngluala

450455460

pheglyglumetvalasplysgluvalpheproglyargaspasnlys

465470475480

gluileserglutyrilelysserthrvalhisseralaasnalaleu

485490495

valglythrcyslysmetglyglugluseraspasnmetservalval

500505510

asnseralaleulysvallysglyvalalaglyleuargvalileasp

515520525

serservalmetproserileproglyglyglnthralaalaprothr

530535540

ilemetilealaglulysalaalaaspmetleumetala

545550555

<210>12

<211>601

<212>prt

<213>赫氏圆石藻

<400>12

leuargglyglyserglyvalthrglyglyserleuglyargglygly

151015

glyserproalaileaspglyglupheasptyrileilevalglygly

202530

glyalaalaglycysvalleualaasnargleuseralaaspproala

354045

hisargvalleuleuileglualaglyglyaspalaserargasplys

505560

argalaglnvalprotrpalaphethrlysleuleuargserglutyr

65707580

asptrpaspphehisvalglualaglualaalavalasnglnglnglu

859095

valtyrleucysargglylysalaleuglyglyserservalthrasn

100105110

valmetleutyrhisargglyserproalaasptyraspalatrpglu

115120125

glualaglyalaargglytrpglyalalysaspvalleuprotyrtyr

130135140

leuargvalgluasptyrglyaspglyalaserglntyrhisalaval

145150155160

glyglyhisvalservalglngluvalprotyrglnasnglnleuser

165170175

alathrpheleuargalametglyglnleuglypheargproasngly

180185190

asppheasnasptrpserserproglngluglytyrglyargtyrlys

195200205

valthrglnargalaglyargargcysthralaalaaspglytyrleu

210215220

alaalaalaarggluargalaasnleuvalvalvalthrglyalagln

225230235240

alathrargleualaleuaspseralatyraspglyalaglyargleu

245250255

glnvalserglyvalgluphealaargglyaspgluarggluprocys

260265270

servalargleualaargglyglyglualavalleucysalaglyala

275280285

valglnthrprohisleuleuleuleuserglyileglyproalaglu

290295300

hisleuarggluvalglyvalprovalargalaaspleuproglyval

305310315320

glyserglyleuglnasphisproalavalvalvalsertyrgluser

325330335

lyslysalavalalaalathraspaspalaleuleulysglytyrala

340345350

serleuvalasnproleualametleuargtrpleuleupheglyarg

355360365

glyproleualacysalaalacysasphisglyglyphevalargser

370375380

serproaspleuaspglnproaspvalglnileargphevalproala

385390395400

argalaserseralaserglymetasnthrleuilegluleuglyarg

405410415

argalaargpheleuproglypheserthrglnvalvalalacysarg

420425430

proargsergluglyargvalargleuargseralaasppropheala

435440445

lysproileilegluglyilehisleuglyalaalagluaspvalala

450455460

serleuarghisglyileargleuglyargglnvalcysalaalaala

465470475480

alapheaspglutyrargglyglugluvalpheproglyalaalaval

485490495

glnseraspgluglnileaspglutyrileargserservalhisser

500505510

alaasnalaleuthrsersercysargmetglyaspproserasppro

515520525

alaalavalleuaspserhisleuargvalargglyvalglyglyleu

530535540

argvalalaaspalaseralametproargileileglyglyglnthr

545550555560

glnalaprothrtyrmetleualagluargalaalaaspileleuleu

565570575

hisalaargleuglnalahisgluproalathrgluservalsergln

580585590

argleugluvalalaalaalaalaleu

595600

<210>13

<211>533

<212>prt

<213>抑食金球藻

<400>13

leusergluaspproserlyslysvalleuvalleuglualaglyasp

151015

argglyproasnserproleuvallysileprovalalaileleulys

202530

leuphelysseralatyrasptrpasnphealathrargproserglu

354045

alavalalaaspargserleutyrvalcysargglylysglyleugly

505560

glyserserleuthrasnvalmetleutyrasnargglyseralaasn

65707580

asptyraspalatrpalaalaalacysglyaspaspsertrpglyala

859095

gluglumetleuglytyrphelyslysalagluaspcysleuvalpro

100105110

alahisargalaasnhistyrhisglyvalglyglyprotyralaser

115120125

serhisvalprotyrthrasnglumetserthralaphevalgluala

130135140

alavalgluaspglyglyvalargasnglyasppheasnasptrpser

145150155160

thrserglnvalglypheglyargphealavalserglnarglysgly

165170175

alaargvalaspalaalathralatyrleuproarglysvalargarg

180185190

argalaasnleuaspvalvalargglyalaalaleuserglyvalthr

195200205

trpasnalaasnlysalathrglyvalgluphealapheglyglyval

210215220

serglyilealacysglyglygluvalileleuserglyglyalaval

225230235240

hisserproglnmetleumetleuserglyvalglyalalysalagln

245250255

leugluglupheglyileprovalvalalaaspargproglyvalgly

260265270

lysasnleuglnasphisproalacysleuvalsertrpargglyser

275280285

alalysalaglnglylysserhisserthrglnleuargileprogly

290295300

thrthrlysthrserprolysalaleuleuglntrpleupheleugly

305310315320

argglyproleualaserproglycysasphisglyglyphealalys

325330335

valglyalaglyaspglyaspcysaspvalglnpheargpheleuala

340345350

thrlysserilethrproaspglymetserthrileseraspsertyr

355360365

glualaalavalasphisproaspglyleuthrileglnthrileval

370375380

alaargprolysserargalaglygluvallysleualaserargasp

385390395400

proalaalalysprovalilegluasnalatyrleuseraspgluala

405410415

aspvalmetthrmetvallysalaleuglnlysalaargserileala

420425430

serargalaproleuseralatyralaglyhisgluglupheprogly

435440445

gluaspvalalaaspgluargglnleualaalatyrvalargasnthr

450455460

alahisthralaasnalavalvalglythrcyslysmetglygluser

465470475480

seraspalaleualavalvalaspasnhisleulysvalileglyval

485490495

serasnleuargvalvalaspalaservalmetprothrleuprogly

500505510

glyglnthralaalaserthrvalalaleualaglulysalaalaasp

515520525

leuilelysglygly

530

<210>14

<211>1236

<212>prt

<213>海洋富油微拟球藻

<400>14

leuserlysthrthrileglyleuglnserphevalthralaasntyr

151015

glyvalargargalaileserleuargglyglyleuglnservalser

202530

metlysalaproalaalavalalaserserthrtyrasptyrileile

354045

valglyglyglyileglyglycysvalleualaasnargleuthrglu

505560

serglyargphelysvalleuleuleuglualaglylysseralaglu

65707580

argasnprotyrvalasnileproalaglyvalvalargleuphelys

859095

seralaleuasptrpglnphegluseralaprogluarghisleuasp

100105110

glylysgluvaltyrleuvalargglylysalametglyglyserser

115120125

alavalasnvalmetleuvalhisargglyseralaserasptyrala

130135140

lystrpglualagluglyalaglnglytrpglyprogluglualaleu

145150155160

argtyrphelyslysmetgluaspasnleuvalglyglygluglyarg

165170175

trphisglyglnglyglymettyrprovalaspaspvallystyrgln

180185190

asnproleuserlysargpheleuglnalacysgluglutyrglytrp

195200205

argalaasnproasppheasnasptrpserhisproglnaspglytyr

210215220

glyserphelysvalalaglnlyshisglylysargvalthralaala

225230235240

serglytyrleuasnlysalavalargargargproasnleuaspile

245250255

leuserglualaleuvalthrargvalleuleugluglygluglyasp

260265270

vallysalavalglyvalgluphethrglylysaspglylysthrhis

275280285

glnvalargthrthrglylysalaglygluvalleuleualaglygly

290295300

alavalasnserproglnleuleumetleuserglyileglyproglu

305310315320

alaaspleuglnalavalglyilealathrlysvalasnargprogly

325330335

valglygluasnleuglnasphisproalavalthrilealahisasn

340345350

ilethrargproileserleucysaspaspleupheleuphehisthr

355360365

provalprolysprohisglnvalleuargtrpthrleuthrglyser

370375380

glyproleuthrthrproglycysasphisglyalapheleulysthr

385390395400

arggluaspleuglngluproasnvalglnpheargpheilealagly

405410415

argglyseraspproaspglyvalargsertyrilemetglyglyser

420425430

alaargproleuserglyleuthrleuglnvalvalasnileargpro

435440445

lysserlysglylysleuthrleualaserlysaspproleulyslys

450455460

proargilegluvalargtyrleuseralaalagluaspleuglnala

465470475480

leuargthrglymetargileglyargaspleuilelysglnargala

485490495

phealaaspileleuaspglugluvalpheproglyproalaalagln

500505510

thraspglugluleuaspalatyrileargaspserleuhisthrala

515520525

asnalaleuvalglythrcyslysmetglyservalgluaspargasn

530535540

alavalvalaspproglucysargvalileglyvalglyglyleuarg

545550555560

valvalaspalaservalmetprovalileproglyglyglnthrgly

565570575

serglythrthrmetleualaglulysalaalaaspleuvalargala

580585590

hisalaglyaspleuvalglumetglyvalglnaspglugluarglys

595600605

glyglytrppheasnglyleuleuglyarglysglnlysvalalathr

610615620

glulysgluargglygluargglylyssergluargphevalserglu

625630635640

valilearghismetglyargvalphevalglnvalserargalaarg

645650655

argalaglnthrcysmetargvalglylysglyleuasparggluarg

660665670

glnleuglucysalametarglysgluleuthrilealaleuphetyr

675680685

alametleuphethrmetarghisserglypheleuserthrthrgly

690695700

argalasertyrlysaspleuglytyrleuthrglysercysargala

705710715720

hisprocysthrserproserserleucysleupheproglulyspro

725730735

phemetlysleuserproalaleualavalvalglyphecyspheasn

740745750

serileasnvalglnglypheleuleuserasnleualaglyargser

755760765

leulyshisprovalproglnlysglyleutyrserargileglutyr

770775780

aspalaarggluproargleuaspglupheglyleuproleuasppro

785790795800

alaaspleumetglulysproargvalproleulysaspargvaltyr

805810815

hisileileaspmetthrasnasptrpvalaspalavalserarggly

820825830

argarggluglugluthrargargileileglnargargargalaala

835840845

alalysalametalailelysasplysvalleuileserleuasptyr

850855860

valphehisprovallysalatrpargthrphevalalaaspproleu

865870875880

glualaarghisglnargglnleuargglnglnalaglulysargala

885890895

argleugluargtyrleuglnargtyrasnthrvallysasnargphe

900905910

hisaspthrleuaspleuleugluserthrthrargthrservallys

915920925

valalalysservalserseralavalvalglyalaproglythrval

930935940

thrargthrvallysgluvallysserglnalaglnglythralaglu

945950955960

alavalalalysvalserserservalserservalvalserlysile

965970975

thrservalilearglysgluaspglyalaleualaglyalalysgly

980985990

lyslysaspproargsergluaspgluglylysalaaspprovallys

99510001005

valarggluiletrpgluthrlysgluglnthralaileargthr

101010151020

iletrpglualaaspgluleuvalthrprovalthrproproala

102510301035

thralametalaserthrvalservalsergluproglnaspglu

104010451050

asnglualaserileserglnglyalaalaproserproserthr

105510601065

serserproserserprogluprovalthrargleuserphearg

107010751080

alaargvalglualaaspglulysgluargpheglyserargarg

108510901095

leulysileserglyasnvalproprothralaserprothrarg

110011051110

glyalaserserleuproleuaspthrleuserserseralathr

111511201125

glnthrphegluargserlysvalglyproproileargthrser

113011351140

lysalaargcysileglylyscysvalhisasnglytrplysgly

114511501155

ilecysgluglutrpphevalhisileserpheprothrtyrala

116011651170

valserilevalargpropromethisvalhisasnphelysval

117511801185

ilecyscysvalleualavalarghisalaargarglyslysglu

119011951200

metserthralaleuserthrhisleuiletyrleuleuleulys

120512101215

thrvallysmetleuglnaspleuproglnleuargarglysgly

122012251230

lysthrasn

1235

<210>15

<211>1785

<212>dna

<213>变异小球藻

<400>15

cgcgcctctgcggtggaggacatccgcaaggtgctgtctgacagcagcagcccggtggcg60

gggcagaagtacgactacattctggtcggcggcggcaccgcggcctgcgtgctggccaat120

cgcctgtccgccgacggctccaagcgtgtgctggtgctggaagccggccccgacaacacc180

tcgcgcgacgtcaagatccccgccgccatcacccgcctcttccgcagccccctcgactgg240

aacctcttctccgagctgcaggagcagctggcggagcgccagatctacatggcgcgcggc300

cggctgctgggcggcagcagcgccaccaatgccacgctgtaccaccgcggcgcggcgggc360

gactatgatgcctggggcgtggagggctggagctcggaggacgtgctcagctggtttgtg420

caggcggagaccaacgccgactttggccctggcgcgtaccacggcagcggcggccctatg480

cgtgtcgagaacccacgctacaccaacaagcagctgcacaccgccttcttcaaggccgca540

gaggaggtggggcttaccccaaacagcgatttcaacgactggagccacgatcatgctggg600

tacggtaccttccaggtcatgcaggacaagggcacacgtgccgacatgtaccggcagtac660

ctcaagcccgtgctgggccgcagaaacctgcaggtgctgaccggcgcggccgtgaccaag720

gtcaacattgaccaggctgcaggcaaggcgcaggctctgggtgtggagttctcaaccgac780

gggcccacaggtgagcggctgagcgctgagctggcgccaggcggcgaggtgatcatgtgt840

gccggcgccgtgcacacgcccttcctgctcaagcacagcggcgtggggccctcggcggag900

ctcaaggagtttggcatcccggtggtttccaacctggcaggtgtgggtcagaacctgcag960

gaccagcccgcctgcctgaccgcggcgccggtcaaggaaaagtatgatggcatcgccatc1020

agcgaccacatctacaacgagaagggccagatccgcaagcgcgccattgccagctacctg1080

ctgggcggccgcggcggcctcacatccaccggatgcgaccgcggcgcctttgtgcgcacg1140

gcaggccaggcgctgccagatctgcaggtgcgctttgtgccgggcatggcgctggacccg1200

gatggcgtgtccacgtatgtgcgctttgccaagttccagtcccaggggctcaagtggccc1260

agcggcatcaccatgcagctgatcgcctgccgcccgcaaagcacgggcagcgtgggcctc1320

aagagtgccgacccctttgcgccgcccaagctgagccccggctatctgacggacaaggac1380

ggcgctgacctggccacgctccgcaagggcatccactgggcgcgcgacgtggcgcgcagc1440

agcgcgctcagcgagtacctggatggcgagctgttccccggcagcggagtggtgagcgat1500

gatcagattgatgagtacatccgccgcagcatccatagctccaacgccatcacaggcaca1560

tgcaagatgggcaatgccggcgacagcagcagcgtggtggacaaccagctgcgggtgcac1620

ggtgtggagggcctgcgggtggtggatgcctcggtggtgcccaagatcccaggtggccag1680

acgggcgcgccagtggtgatgattgcggagcgcgccgccgcgctgttgactggcaaggcg1740

acgatcggggcgagcgctgcggccccggcgacagtggcagcatga1785

<210>16

<211>1743

<212>dna

<213>莱茵衣藻

<400>16

ctgtcggtgcgtgctgctgcgggcccagctggctcggagaagttcgactacgtgcttgtc60

gggggtggcactgcctcgtgcgtgcttgctaacaagctgtcggctgatggaaacaagaag120

gttctggttctggaggctggccctaccggtgacgccatggaggtggctgtgcccgccggc180

atcacccgcttgttcgcgcacccagtgatggactggggcatgtcgtcgctgacacagaag240

cagctggtggcccgcgagatctacctggcccgcggccgcatgctgggcggctcctccggc300

tctaacgccacgctgtaccaccgcggcagcgccgccgactacgacgcttggggcctggag360

ggctggagcagtaaggacgtgctggactggttcgtcaaggcggagtgctacgccgacggc420

cccaagccctaccacggcactgggggcagcatgaacacggagcagccgcgctacgagaac480

gtgctgcacgatgagttcttcaaggccgccgccgccaccggcctgcccgccaaccccgat540

ttcaacgactggagccacccgcaggacggcttcggtgagttccaggtgtctcagaagaag600

ggccagcgcgccgacacctaccgcacctacctcaagcccgccatggcgcgcggcaacctc660

aaggtggtgattggtgcccgggccaccaaggtcaacattgagaagggctcgtcgggcgca720

cgcacgaccggcgtggagtacgccatgcagcagttcggcgaccgcttcaccgccgagctg780

gcccctggcggcgaggtgctgatgtgctcgggcgcggtgcacacgccgcacctgctcatg840

ctgtcgggcgtgggccccgccgccacgctgaaggagcacggcatcgatgtggtgtcggac900

ctgtcgggtgtggggcagaacctgcaggaccaccccgcggcggtgctggcggcgcgcgcc960

aagccagagtttgagaagctgtcggtgaccagcgaggtgtatgacgacaagtgcaacatc1020

aagctgggcgccgtggcgcagtacctgttccagcgccgcggcccgctggccaccaccggc1080

tgcgaccacggagccttcgtgcgcacctcctcctcgctctcgcagcccgacctgcagatg1140

cgcttcgtgccgggctgcgccctggaccccgatggcgtcaagtcctacatcgtgtttggc1200

gagctcaagaagcagggccgcgcatggcccggcggcatcacgctgcagctgctggccatc1260

cgcgccaagagcaagggcagcatcggcctgaaggcggctgacccgttcatcaaccccgcc1320

atcaacatcaactacttctccgaccccgccgacctggccacgctggtcaacgccgtcaag1380

atggcgcgcaagatcgcggcgcaggagccgctcaagaagtacctgcaggaggagacgttc1440

cccggcgagcgcgcctccagcgacaaggacctggaggagtacatccgccgcaccgtgcac1500

tcgggcaacgcgttggtgggcaccgcggccatgggcgcctcgcccgcggccggcgccgtg1560

gtgtcctccgccgacctcaaggtcttcggcgtggagggcctgcgtgtggtggacgcctcg1620

gtgctgccgcgcatccccggcggccagaccggcgccgccactgtcatggtggcggagcgc1680

gcggcggcgctgctgcgcggccaggccaccatcgcgcccagccgccagcccgtggccgtg1740

taa1743

<210>17

<211>1707

<212>dna

<213>三角褐指藻

<400>17

tacgactacattatctgcgggggagggttggctgggtgcgttttggctgaacgcctttcg60

caggacgagtccaagcgtgtgctcgtactagaggctggcggctcggactacaaaagtctt120

ttcatcaggattccggctggagtcttacggctctttcgcagtaaatacgattggcaacat180

gaaacgggcggtgaaaagggttgcaacggacggaatgtgtttttgcaacgcggcaagatt240

ctcggcggatcttcgtgcaccaatgtatgtctgcatcaccgtgggtcagcggaagattac300

aacagctggaacattcccgggtggacggctactgatgtgcttcctttcttcaagcaatcg360

caaaaggatgagacgggccgggatgccacgttccacggtgcggatggggagtgggtcatg420

gatgaggtgcgataccaaaatccattgagcaagttattcctggaggtaggggaggcagct480

ggcctcggaaccaatgatgatttcaacaactggtcgcatccgcaggatggcgttgggcgc540

ttccaggtttcagaagtaaacggagaacgatgttcgggagccacagcatttctaagtaaa600

gcggccaagcgctcaaatgtcatagttcgaactggcactatggtgagaaggatcgacttt660

gatgagacaaaaacagcgaaagggattacctacgatttgatgggcgatgacacatgtacg720

acatttcaagcttgtttgaaagagggtggcgaagtgctggtgacaggtggagcaattgca780

tcccctcagcttctcatgtgctccggaattggacctggcaagcacttacggtcgctgggc840

attccagtagtccacgacaactcggcagttggtgagaacctgcaggatcacccagctgct900

gtcgtttcctttaaaacccctcaaaagggagtttctgttacttctaaattgcggctcttc960

ggtaagacaaaccccattccagtcttccagtggctattttttaaaagtggtcttttgacc1020

tccactggatgcgatcatggcgctttcgttcggacatcggattcactcgaacaaccggac1080

ttgcagattagattcttggcagctcgcgctcttggacccgacggaatgaccacgtatacc1140

aaattccgtacgatgaaaacagttgaagatggttattcgttccagagtgttgcatgtcga1200

gcaaaaagcaagggaaggattcggttatcttcgtccaactcgcacgtaaagcctatgatt1260

gatggcggatacctctctaaccaggatgatcttgccacactacgtgctggtatcaagctt1320

ggacgtatgctcggtaaccgaccggaatggggcgagtaccttggtcaagaggtgtatcca1380

gggccagatgtgcaaacggatgaagagattgacgaatacattcgtaactcgctccatacc1440

gccaatgctttaacggggacatgcaaaatgggaacgggtcgtggggctgttgttgggccc1500

gatttacgtgtaattggggtcaatggtgtacgtgtgggggattcatctgttttcccctgc1560

attccagggggacaaacggcaacaccgaccgtcatgataggggatcgggccgctgttttt1620

gttcggcaacccgtatcccagctgaacattgaaattttcagagaaaaagggggcacacat1680

cctggggcaacgaccgcctcagcctag1707

<210>18

<211>1758

<212>dna

<213>胶球藻

<400>18

gcactgcgggtcagggcgataatcaaaagcgacaatccagctgcagataagtatgacttc60

atcctggtcggcggcggcacagcaggctgcgtgctggccaacaggctgacagcagatgga120

tccaagaaggtcctgctgctcgaggcgggaggcgccaacaaggcgcgggaggtacgcaca180

ccggccgggctgccgcgcctgttcaagagcgccctcgactggaacctctactcctccctg240

cagcaggcagccagcgacagatcgatctacctggcacggggaaagcttctgggtggcagc300

tccgcaactaatgccacgctgtaccaccgggggactgcggcagactacgacgcgtggggt360

gtgccggggtggacctcccaggacgccctgcgctggtttattcaggcagagaacaactgc420

agagggattgaggacggggtgcatgggaccgggggattgatgcgcgtggagaaccctcgc480

tacaacaaccccctgcacgaggtctttttccaggcggccaagcaggccggcctcccagag540

aacgacaactttaacaactggggcagatcacaggcggggtacggggagttccaggtgact600

cacagcaagggtgagcgcgccgactgcttccggatgtacctggagccagtcatggggcgt660

tccaacctcacagtgctcaccggagccaaaacgctcaaaatcgaaactgaaaagtccggc720

ggcgccacggtctcgcgcggcgtcaccttccaggtcaacggccaggacggcagcaagcac780

tcagctgagctggcggctggcggcgaggtggtgctgtgcgcggggtcaatccactcgccc840

cagatcctgcagctctccggcatcggcccccaggcggagctgcgctccaaggacatccct900

gtcgtcgcagacctgcccggcgtcggccagaatatgcaggaccacccggcgtgcctgtca960

gccttctacctcaaagagagcgcgggtcccatcagtgtgactgatgagttgctgcacacc1020

aatggccgaatccgcgcgcgcgcaatcctaaagtacctgctcttcaaaaaggggcccctc1080

gccaccacaggatgcgaccacggcgcctttgtgaagactgcaggtcagagtgagccggac1140

ctgcagatccgctttgtgccgggtctggcgcttgaccctgacggcatcggatcctacacg1200

gcctttggcaagatgaaggaccagaagtggccctccggaatcaccttccagctgctcgga1260

gtgcggcccaagagccgcgggtcggtgggtcttcgcagcgacgacccctgggacgcgcca1320

aaactggacatcggcttcctgactgacaaggagggcgctgacctggccacgctgaggagc1380

ggcatcaagctctcgcgcgagatcgcagcggagccggcattcggagcatatgtaggcaac1440

gaacttcacccgggcgcagccgcctcgtccgattctgcgatcgactcattcatccgtgac1500

acggtgcactcgggcaatgccaacgtgggcacatgctcgatgggggtgaatgggaacgcc1560

gtcgtggacccgtcactcagagtgttcggcatccgcggcctgcgagtggccgacgcatca1620

gtcatccccgtcatcccaggaggccagaccggcgctgcaacggtgatggtggcagagagg1680

gccgcggagattctcctcggctcgaaccagaagcagccggccgccgccgtccccgccgcg1740

cagccggccctggcttga1758

<210>19

<211>1744

<212>dna

<213>强壮团藻

<400>19

tccagttgcagtcaaagctgcggcaagcgtggggtcggagaagttcgactacatccttgt60

gggaggagggacggcaggttgcgttctggcaaacaaattgtccgctaatggcagcaagaa120

ggttcttgttcttgaggctggtccaaccggcgatgctatggaagtggccgtaccggccgg180

tattgcccgtctctttgcacatccagtttttgactggggtatgtccagtttgacgcagca240

gcagctggttgcacgcgagatctaccttgctcgcggtcgccttctgggcggttcctctgg300

gaccaacgcaacgctgtatcatcgcggcacccccgctgactacgacagttggggcttgga360

gggctggacgagcaaggatctacttgattggttcgttaaggccgaatgctatggagacgg420

tccccgggccttccatggccagtccggttctatgaatgtggagcaaccgcgttaccagaa480

cgtcctgcacgacgagtttttcagggctgctgcggcagctggattacctgccaacgagga540

tttcaatgactggagccggccgcaggagggctatggggagttccaggtggcccagaagaa600

cggtgagcgcgcggacacgtatcggacctacctcaagccggctatgggccgcgacaacct660

gaaggtgatgaccggcgcgcgtacgaccaaagtgcatatcgagaagagctcgacgggtcc720

acgtgcccgcggtgtcgagtatgctacccagcaatttggggagcgctacaccgccgagct780

gactcctggtggcgaggttctcatgtgcaccggtgccgtgcacacaccgcacctactgat840

gctttcgggcattgggccggcgccgaccctccttgagcacggactcgacgtgatatcaag900

cctgcctggcgtgggtgccaacctgcaggatcacccagccgcggtgcttgctgtccgggc960

taagcccgagttcgagggactgtcggtcacttcggaaatctatgacagcaagtgcaacat1020

ccggttgggcgccgttatgaagtacctgttcggacgccgcgggccacttgcaaccacagg1080

ctgtgatcatggcgcttttgtgcgcacttcggcctcgcattcgcagccggacctgcagat1140

gcgattcgtgcccggttgcgcgctggaccccgacggcgtgaagtcgtacattgtgttcgg1200

cgagctgaagaagcagggccgtgcttggcccggcggtatcacgttgcagctgctgggcat1260

ccgcgccaagagcaggggcagcatcggtctcaaggccgcggatcccttcatcaaccccgc1320

cattaacataaactatttctccgatcctgaggaccttgccacgcttaagaacggtgtgcg1380

cattgcgcgcgaaatcgttgcccaggagccattgcgcaaataccttctggaggagacctt1440

ccccggggagcgggcgaacactgacaaggacattgaggagtatgtccggcgcacggtcca1500

cagcggcaacgcgcttgtgggcacctgcgcgatgggtaccacgccagccagtggcgccgt1560

ggtgtcttctgctgacctcaaggtgttcggtgttgacgggctgcgtgtcgtggatgcgtc1620

tgtgctgccacgcattccaggcgggcaaacaggagcggccactgtcatggttgcagagcg1680

ggcggcggccatgctgcttggacaggcgacgattacttctcgtcgcgagcctgcggctgt1740

ttag1744

<210>20

<211>1674

<212>dna

<213>长囊水云

<400>20

gtgcctgcagcacgttatgcgacgtcttcggtgagcatgtcggtggcggaagaaggccac60

aagttcatcatcatcggcgggggtacggctgggtgtgttctggcgaaccgcctctctgcc120

gacaaggacaattcagtgctggtgttggaggccggctcggaaaaattcaatgacaggaat180

atcaagatgcccatcgcaatcctaaggttgttcaagtctgtcttcgactggggcttccag240

tcggaaaacgagaagtttgccaccggcgacggcatctacctctgccgtggcaaggtcctc300

ggcgggtctagctgcaccaacgtcatgctttaccatcgcggagaggaggctgactatgac360

gcgtggggggtggatggatggaaaggcaaggacgtgctcccctacttcaagaaggcggag420

aacaaccgatccaagaaaaagggggagttccacggcaagggaggcctgatgcaggtggaa480

aacgcgcgttacatgaaccctttgacgaagttgttcttcaaggcgtgcgagcaggcaggc540

ctgtcggagaacgaggacttcaacgattggtcccactcgcaggagggcttcggtcgcttc600

caggttgcacagaagagaggcaagcgctgttcggcagcctcctcctacctcaaggaagcc660

atggggcgcaaaaacctggacgtgcagaccagcgcccagatcaccaaggtcttgatcgag720

aacggcggtgccataggcgttgagtacgtgcgggatggcgaaaagaagatcgccaagctt780

gccgtgggcggagagatcctgctagcaggaggtgccatcagctcaccgcaggtgctgatg840

ctcagtggggtgggtccggccgagcacttgaggtccaagggcatcgaggtgaagagcaat900

gtgcctggggtcggaaagaacctccgcgaccatcccgctgtcaccgtgatggccgacatc960

aacaagcctatctccatcaccgacaaggttctcaaggagggctctggggacgtgaacaaa1020

attacggcccttcagtggctgttgacgggaactgggccgctgacctcgccagggtgcgag1080

aacggcgcgttcttcaagaccacgcctgacaaagcggcggcagatctgcagttgcgattt1140

gtccctggaagatccactaccccagacggggtgaaggcgtacaacactattggcaccaag1200

gggaggcctccttcgggtgtcaccgtgcaggtggtggggatccggccgcagagtgaaggc1260

cacgtcgagctgcgttcttcggacccgttcgacaagccacacatcgtcactaactacctt1320

gagagtggggaggacatggcgtctttgacgaacggaatcgaaatggcacgaaagctgttc1380

gaccaggaggccttcggagaaatggtggacaaagaagtcttccccggcagagacaacaag1440

gagatctcggagtacatcaagtctaccgtgcactccgccaacgccttggttggcacttgc1500

aagatgggcgaagaatcagacaacatgtctgttgtgaactcggcactcaaggtaaagggt1560

gttgccgggctgagggtgatcgattcttcggtgatgccttcaatccccggcggtcaaaca1620

gcggcaccgacgatcatgatcgcagagaaagcggcggacatgctcatggcttag1674

<210>21

<211>1808

<212>dna

<213>赫氏圆石藻

<400>21

gccttcgcggcggcagcggcgtcactggcggcagcctcggccgcggcggcggctcgccgg60

cgatcgacggcgagtttgactacatcatcgttggaggcggcgccgcgggctgcgtgctcg120

ccaatcggctgagcgccgacccggcgcaccgggtgctgctgatcgaggccggaggcgacg180

cgtcgcgcgacaagcgtgcgcaggtgccgtgggccttcaccaagctgctgcgttccgagt240

acgactgggactttcacgtggaggcggaggcggcggtgaaccagcaggaggtgtacctct300

gccgcggcaaggcgctgggcggctcttcggtcacaaacgtgatgctctaccaccggggca360

gccccgcggactacgacgcttgggaggaggctggcgcgcgagggtggggcgcgaaggacg420

tgctcccgtattacctccgcgtcgaggactacggcgacggcgcctcgcagtaccacgccg480

tcggcgggcacgtctcggtgcaggaggtgccgtaccagaaccaactctcggcaaccttcc540

tgcgggcgatggggcagctgggcttccggccgaacggagacttcaacgactggtccagcc600

cgcaggaggggtacggccgctacaaggtgacccagcgggccggccgccgctgcaccgctg660

ccgacggctacctggcggcggcgagagagcgcgcgaacctggtggtggtgaccggcgcgc720

aggcgacccgcctcgccctcgacagtgcgtacgacggcgcgggccggctgcaggtctccg780

gcgtcgagtttgcacgcggcgacgagcgcgagccgtgctccgtccggctcgcgcgcggcg840

gagaggccgtcctctgcgccggcgcggtccagacgccgcacttgctgctcctctccggga900

tcggcccggcggagcacctgcgcgaggttggcgtgccggtgcgggcggacctgcctgggg960

tggggtccggcctgcaggaccaccccgcggtggtcgtctcgtacgagagcaagaaagcgg1020

tcgccgcgacggacgacgcgctcctcaagggctacgcgtcgctggtcaacccgctcgcga1080

tgctgcgctggctcctgtttgggcgcgggccgctggcgtgcgccgcgtgcgaccacggcg1140

gcttcgtccgctcctcgcccgacctcgaccagcccgacgtccagatccgcttcgtgcctg1200

cgcgcgcctcgtccgcctccgggatgaacacgctgatcgagctgggcaggagagcgcgct1260

tcctgccgggcttctcgacgcaggtcgtcgcttgccgcccgcggagcgaggggcgcgtgc1320

ggctgcggtcggccgacccgttcgccaagccgatcatcgagggcatccacttgggcgcag1380

cggaggacgtcgcgtcgctgcgccacggcatccggctcggccggcaggtttgcgccgcgg1440

cagccttcgacgagtaccgcggagaggaggtcttccccggcgcggcggtgcagtccgacg1500

agcagatcgacgagtacatccgctcgtcggtgcactctgcgaacgcgctcacctcgtcct1560

gccgcatgggcgacccgtccgacccggccgcagtcctcgactcccacttgcgcgtgcgcg1620

gcgtcggcggcttgcgcgtggccgacgcctccgccatgcctcgcatcatcggagggcaga1680

cgcaggcgcccacgtacatgctcgccgaacgtgccgccgacatcctgctgcacgcgcgcc1740

tgcaggcgcacgagccagccaccgagagcgtctcgcagcggctcgaggttgcggcggccg1800

cactctag1808

<210>22

<211>1605

<212>dna

<213>抑食金球藻

<400>22

cgcctcagcgaggacccgagcaagaaggtgctcgtgctcgaggccggcgaccggggcccg60

aactcgccgctcgtgaagatccccgtggccatcctcaagctcttcaagtccgcgtacgat120

tggaacttcgcgacgaggccgtccgaggccgtcgcggaccggagcctctacgtctgccgg180

ggcaagggcctgggcggcagctccctgacgaacgtcatgctctacaaccggggctcggcc240

aacgactacgacgcgtgggcggccgcgtgcggcgacgactcgtggggggcggaagagatg300

ctcggctacttcaagaaggccgaggactgcctcgtgccggcgcaccgagcgaaccactac360

cacggcgtcggcgggccctacgcgtcgagccacgtgccctacacgaacgagatgtcgacg420

gcgttcgtcgaggccgccgtcgaggacggcggcgtgcgcaacggcgacttcaacgactgg480

tccacgtcccaggtcggcttcggccgcttcgccgtgagccagcgcaagggggcaagggtg540

gacgcggcgacggcctacctcccgcggaaggtccggcggcgcgcgaacttggacgtggtc600

cgcggcgcggcgctctccggcgtcacgtggaacgcgaacaaggccacgggcgtcgagttc660

gccttcggcggcgtctcgggcatcgcctgcggcggcgaggtgatcctctccggcggcgcg720

gtccactcgccgcagatgctcatgctctccggcgtcggcgcgaaagcgcagctcgaggag780

ttcggcatccccgtcgtcgcggaccggccgggcgtgggcaagaatttgcaggaccacccg840

gcctgcctcgtgtcctggcgcgggtcggccaaggcccagggcaagagccactcgacgcag900

ctccggatccccgggacgacgaagacctcgcccaaggcgctcctccagtggctcttcctc960

ggccggggccccttggcctcgccgggctgcgaccacggcggcttcgccaaggtcggcgcc1020

ggcgacggcgactgcgacgtccagttccggttcctcgcgacgaagtcgatcacgcccgac1080

ggcatgtctaccatctccgactcctacgaggccgccgtggaccaccccgacggcttgacg1140

atccagaccatcgtcgcccggcccaagagccgcgcgggcgaggtgaaactcgcgtcccgg1200

gacccggcggcgaagcccgtcatcgagaacgcgtacctctccgacgaggccgacgtcatg1260

accatggtcaaggcgctccagaaggcgcggtccatcgcgagccgggcgccgttgagcgcc1320

tacgcgggacacgaggagttcccgggggaggacgtcgcggacgagcgccaactggcggcc1380

tacgtgcggaacaccgctcataccgcgaacgcggtcgtcgggacctgcaagatgggcgag1440

tccagcgacgccctcgccgtcgtcgacaaccacctcaaggtcatcggcgtctcgaacctg1500

cgggtggtggacgcgtcggtgatgccgacgctgccgggcggccagacggccgcgtcgacc1560

gtcgcgctcgcggagaaggccgcggacctcatcaaggggggctga1605

<210>23

<211>3711

<212>dna

<213>海洋富油微拟球藻

<400>23

ctctccaagaccaccatcggcctccaatccttcgtgacagcaaattatggagtgaggaga60

gcaatctctctccgaggggggctacaatctgtttcgatgaaggcaccggctgccgttgct120

tcgtccacctacgactacatcatagtcggtggcggcatcggcggttgtgttctcgccaac180

cgactgacagaaagcgggcgtttcaaggtccttctcctggaggccggaaaatcagcagag240

cgaaacccgtacgtgaacatccccgcgggcgtggtccgcctctttaaatcggccttggat300

tggcagtttgagagcgcccccgaaagacacctggacgggaaggaggtgtacttggtcagg360

gggaaggccatgggaggctccagtgcggtgaatgtgatgctcgtacaccgcggctcggcc420

tccgactacgcgaagtgggaggcggagggagctcagggatggggcccggaggaagcctta480

cgctacttcaagaaaatggaagacaacttggtgggcggggaagggcggtggcacggccag540

gggggcatgtacccggtggacgacgtcaagtaccaaaaccctttgtccaagcgcttttta600

caggcgtgcgaggagtacgggtggcgggcgaacccggattttaacgactggtcccatccc660

caggacggatacgggagcttcaaagtggcgcagaagcacggcaaacgggtgacggccgcc720

tccgggtacttgaacaaggccgttcgacgtcgaccaaacctagacattctgtcagaggcc780

cttgtgacccgggttttgcttgagggagagggggatgtgaaggcggtcggggtggagttc840

acgggcaaagatgggaagacgcaccaggttcggaccacggggaaggcgggagaagttctc900

ttggcgggcggcgcggtcaacagcccccaactcctgatgctgagtgggatcggacccgag960

gcagacctccaggcagtaggcatcgcgaccaaagtaaaccgtccgggcgtgggggagaac1020

ttgcaagaccatcccgccgtcactattgcgcacaacatcacgcgccctatctcgctctgc1080

gacgacctcttccttttccacacacctgtccctaagccccaccaggtgctccggtggacc1140

ttgaccggatcgggcccgctgaccaccccaggctgcgaccacggcgcgttcctgaagacc1200

cgagaagacctccaggaacccaacgtacagtttcgtttcatagccgggcggggttcggac1260

cctgacggcgtgcgctcctacatcatgggaggctcagcacgccccctgtcgggattgacg1320

cttcaagtcgtcaacatccgccccaaaagcaaagggaagctgaccttggcgagcaaggac1380

ccgttgaagaagccccggatcgaagtccggtacttgtccgcggccgaagacttgcaggcc1440

cttcgcacgggcatgaggattggccgggatctgatcaagcaacgggcttttgcggatatc1500

ttggacgaggaagtgttcccggggcccgccgctcagacggacgaggaactggacgcctac1560

atccgggatagcttgcacacggccaacgccctggtaggcacctgcaagatggggagtgtg1620

gaggatcggaacgcagtggtggacccggagtgccgggtcatcggcgtgggaggcctgcgg1680

gtggtggatgcaagcgtgatgcccgttatccccggagggcaaacgggaagtggcacgacc1740

atgctggccgaaaaagcggccgacctggtcagggcccacgctggggatttggtggagatg1800

ggagtgcaagatgaggagaggaagggaggatggtttaacggcctgttagggcgcaaacag1860

aaggtggcgacagaaaaggagcgaggcgaacgtggtaaaagcgaacgatttgtttctgag1920

gtgattaggcatatgggtcgggttttcgtacaagtttcgagggcaaggcgtgcgcaaacg1980

tgcatgagggtagggaagggtctcgatagggaacggcagttggagtgtgccatgcgcaag2040

gaattgacgattgcgcttttttacgcaatgctttttacaatgagacatagtggatttctt2100

tcgacgactggtcgcgcctcatataaggaccttggatacttgacagggtcctgtcgcgcc2160

cacccttgtacatctccatcctccttgtgcctgtttccagaaaaacctttcatgaagcta2220

agccctgctttggcggtcgttggcttttgctttaattctatcaatgtccaaggtttccta2280

ctcagcaaccttgccggtcggagcctgaagcatccggtcccacaaaagggcttgtatagt2340

cgcattgagtacgatgcacgggagccacgtctcgatgaattcggcctccctcttgatccg2400

gcggatttgatggaaaaaccccgagtgcccctgaaggaccgagtttatcacatcattgac2460

atgacaaacgactgggtcgatgctgtgagccgcggacggcgagaggaggagacgcgtcgc2520

atcatccaacgacgtcgtgccgctgccaaggccatggcaatcaaggacaaggtcttgatt2580

tctcttgactacgtcttccatccagtcaaggcctggaggaccttcgtggcggaccccttg2640

gaagcacggcatcagcgccagctgcgtcagcaggcagaaaagcgagcgagactagaacgg2700

tatctgcaacgctataacacggtcaagaatcgcttccatgatactctggatcttttggag2760

tcgacgacccggacatcggtgaaagtggccaagtccgtgagttccgcagtggtgggggcg2820

cctgggacggtgacgcggaccgtgaaggaggtgaaaagccaggcacagggcacagcggag2880

gcagtggcgaaggtgtcttcctccgtctcctcggtggtgtccaagatcacgtcggtgatc2940

aggaaggaagacggggctctggcgggggccaaggggaaaaaggacccgagatcagaagac3000

gaaggaaaagccgatccagtcaaggtccgggagatctgggaaacgaaagagcagaccgcg3060

attcgcaccatctgggaagcggatgagcttgtcacgccggtaacaccgccagccacggct3120

atggcgtcgacggtttcggtgtcagagcctcaggacgagaacgaagcttccatctctcag3180

ggagcggcgccttcccccagcacctcatcaccatcctcccccgagcccgtcacacgcctc3240

tctttccgggcacgtgtggaggcggacgagaaggaacgctttgggtcccgaagattgaag3300

atatcggggaatgtcccgccgaccgcttctcccactcggggggcttcttctctccctttg3360

gacacgctttcctcctccgccacccaaacctttgagcgttccaaagtggggccgcccata3420

cgaacaagtaaggcgagatgcattggaaaatgtgtacataacgggtggaaagggatatgt3480

gaggaatggtttgtgcacattagttttccaacgtatgcggtctctatcgtccgtccaccc3540

atgcacgtgcataattttaaagtgatttgttgtgttctagcggtccgacatgcaagaagg3600

aagaaggagatgagcacggctttatctacacatttaatttatttactgctgaaaacggta3660

aaaatgttgcaagatcttccccagctacggagaaagggcaaaacaaactag3711

<210>24

<211>20

<212>dna

<213>人工序列

<220>

<223>引物

<400>24

atggcgtcaattacatcgcg20

<210>25

<211>18

<212>dna

<213>人工序列

<220>

<223>引物

<400>25

tcatgctgccactgtcgc18

<210>26

<211>15

<212>prt

<213>人工序列

<220>

<223>共有序列

<220>

<221>misc_feature

<222>(2)..(2)

<223>x是任意氨基酸

<220>

<221>misc_feature

<222>(4)..(7)

<223>x是任意氨基酸

<220>

<221>misc_feature

<222>(9)..(9)

<223>x是d或e

<220>

<221>misc_feature

<222>(10)..(10)

<223>x是任意氨基酸

<220>

<221>misc_feature

<222>(12)..(12)

<223>x是a或g

<220>

<221>misc_feature

<222>(14)..(14)

<223>x是任意氨基酸

<220>

<221>misc_feature

<222>(15)..(15)

<223>x是k,r,s或e

<400>26

glyxaaleuxaaxaaxaaxaacysxaaxaaglyxaaphexaaxaa

151015

<210>27

<211>37

<212>dna

<213>人工序列

<220>

<223>引物

<400>27

ctgtacttccaatcagccagcgcagttgaagatattc37

<210>28

<211>41

<212>dna

<213>人工序列

<220>

<223>引物

<400>28

tatccacctttactgttatcatgctgcaacggttgccggtg41

<210>29

<211>33

<212>dna

<213>人工序列

<220>

<223>引物

<400>29

tacttccaatcaatgatgctgggtccgaaaacc33

<210>30

<211>41

<212>dna

<213>人工序列

<220>

<223>引物

<400>30

tatccacctttactgttctactaaactgcaaccggctgacg41

<210>31

<211>33

<212>dna

<213>人工序列

<220>

<223>引物

<400>31

tacttccaatcaatgaaaaaaagcctgcgtagc33

<210>32

<211>36

<212>dna

<213>人工序列

<220>

<223>引物

<400>32

tatccacctttactgttctactatgcgcttgcggtg36

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1