微藻中异源多肽的生产,微藻胞外体、组合物及其制备方法和用途与流程

文档序号:13841616阅读:546来源:国知局
微藻中异源多肽的生产,微藻胞外体、组合物及其制备方法和用途与流程

本发明申请是基于申请日为2010年12月28日,申请号为201080064882.8(国际申请号为pct/us2010/062276)、名称为“微藻中异源多肽的生产,微藻胞外体、组合物及其制备方法和用途”的发明专利申请的分案申请。

发明背景

本发明涉及重组微藻细胞及其在异源多肽生产中的用途,在微藻胞外体中生产异源多肽的方法,包含异源多肽的微藻胞外体,以及包含它们的组合物。



背景技术:

生物技术和分子生物学的进步使在微生物、植物和动物细胞中生产蛋白成为可能,其中许多蛋白以前只能通过从人类和其它动物的组织、血液或尿液中提取。如今市售的生物制剂通常在哺乳动物细胞,例如中国仓鼠卵巢(cho)细胞,或在微生物细胞,例如酵母或大肠杆菌细胞系中制备。

通过微生物发酵生产蛋白相对于现有的系统,例如植物和动物细胞培养呈现几项优势。例如,基于微生物发酵的方法可以提供:(i)高浓度蛋白的快速生产;(ii)使用无菌、充分受控的生产条件(例如良好生产规范(gmp)的条件)的能力;(iii)使用简单、化学上确定成分的生长培养基以允许更简单的发酵和更少杂质的能力;(iv)人或动物病原体污染的规避;(v)易于回收蛋白(例如通过从发酵培养基中分离)。此外,发酵设施通常比细胞培养设施建设的成本更低。

微藻,例如网粘菌门(labyrinthulomycota)的破囊壶菌(thraustochytrids),能够以标准的发酵设备,非常短的培养周期(例如,1-5天),低廉的确定成分培养基和最低限度的纯化(如果有的话)进行培养。此外,某些微藻,例如裂殖壶菌属(schizochytrium),其生物质及自其衍生的脂质具有已经证明的用于食品应用的安全历史。例如,来自此类微生物的富含dha的甘油三酯油已获得美国食品和药物管理局的gras(一般认为安全)状态。

微藻已被证明能够表达重组蛋白。例如,美国专利第7,001,772号公开了第一个适于转化破囊壶菌,包括裂殖壶菌属成员的重组构建体。此出版物公开了乙酰乳酸合酶、乙酰乳酸合酶启动子和终止子区、α-微管蛋白启动子、来自聚酮合酶(pks)系统的启动子、和脂肪酸去饱和酶启动子的裂殖壶菌属核酸和氨基酸序列等。美国申请公开号2006/0275904和2006/0286650随后公开了肌动蛋白、延伸因子1α(ef1α)和甘油醛-3-磷酸脱氢酶(gapdh)启动子和终止子的裂殖壶菌序列。

对于鉴定在微藻中表达异源多肽的方法以及治疗应用的替代组合物的需求一直存在。

发明概述

本发明涉及一种生产病毒蛋白的方法,所述病毒蛋白选自下组:血凝素(ha)蛋白、神经氨酸酶(na)蛋白、融合(f)蛋白、糖蛋白(g)蛋白、包膜(e)蛋白、120kda的糖蛋白(gp120)、41kda的糖蛋白(gp41)、基质蛋白及其组合,该方法包括在培养基中培养重组微藻细胞以产生病毒蛋白,其中所述重组微藻细胞包含含有编码病毒蛋白的多核苷酸序列的核酸分子。在一些实施方案中,病毒蛋白被分泌。在一些实施方案中,从培养集中回收病毒蛋白。在一些实施方案中,病毒蛋白在微藻细胞中积累。在一些实施方案中,病毒蛋白在微藻细胞的膜中积累。在一些实施方案中,病毒蛋白是ha蛋白。在一些实施方案中,ha蛋白与seqidno:77是至少90%相同的。在一些实施方案中,微藻细胞能够在不存在外源蛋白酶的情况下,翻译后加工ha蛋白以产生ha1和ha2多肽。在一些实施方案中,病毒蛋白是na蛋白。在一些实施方案中,na蛋白与seqidno:100是至少90%相同的。在一些实施方案中,病毒蛋白是f蛋白。在一些实施方案中,f蛋白与seqidno:102是至少90%相同的。在一些实施方案中,病毒蛋白是g蛋白。在一些实施方案中,g蛋白与seqidno:103是至少90%相同的。在一些实施方案中,微藻细胞是破囊壶菌目(thraustochytriales)成员。在一些实施方案中,微藻细胞是裂殖壶菌属(schizochytrium)或破囊壶菌属(thraustochytrium)的。在一些实施方案中,编码病毒蛋白的多核苷酸序列进一步包含ha膜结构域。在一些实施方案中,核酸分子进一步包含选自下组的多核苷酸序列:seqidno:2、seqidno:3、seqidno:4、seqidno:38、seqidno:42、seqidno:43、seqidno:44、seqidno:45、seqidno:46及其组合。

本发明涉及由上述方法中的任一种产生的分离的病毒蛋白。

本发明涉及一种重组微藻细胞,其包含含有编码病毒蛋白的多核苷酸序列的核酸分子,所述病毒蛋白选自下组:血凝素(ha)蛋白、神经氨酸酶(na)蛋白、融合(f)蛋白、糖蛋白(g)蛋白、包膜(e)蛋白、120kda的糖蛋白(gp120)、41kda的糖蛋白(gp41)、基质蛋白及其组合。在一些实施方案中,病毒蛋白是ha蛋白。在一些实施方案中,ha蛋白与seqidno:77是至少90%相同的。在一些实施方案中,微藻细胞能够在不存在外源蛋白酶的情况下,翻译后加工ha蛋白以产生ha1和ha2多肽。在一些实施方案中,病毒蛋白是na蛋白。在一些实施方案中,na蛋白与seqidno:100是至少90%相同的。在一些实施方案中,病毒蛋白是f蛋白。在一些实施方案中,f蛋白与seqidno:102是至少90%相同的。在一些实施方案中,病毒蛋白是g蛋白。在一些实施方案中,g蛋白与seqidno:103是至少90%相同的。在一些实施方案中,微藻细胞是破囊壶菌目成员。在一些实施方案中,微藻细胞是裂殖壶菌属(schizochytrium)或破囊壶菌属(thraustochytrium)的。在一些实施方案中,编码病毒蛋白的多核苷酸序列进一步包含ha膜结构域。在一些实施方案中,核酸分子进一步包含选自下组的多核苷酸序列:seqidno:2、seqidno:3、seqidno:4、seqidno:38、seqidno:42、seqidno:43、seqidno:44、seqidno:45、seqidno:46及其组合。

本发明涉及一种生产包含异源多肽的微藻胞外体的方法,该方法包括:(a)在微藻宿主细胞中表达异源多肽,其中所述异源多肽包含膜结构域,和(b)将微藻宿主细胞在足以产生包含异源多肽的胞外体的条件下培养,其中所述胞外体与宿主细胞质膜是不连续的。

本发明涉及一种生产包含微藻胞外体和异源多肽的组合物的方法,该方法包括:(a)在微藻宿主细胞中表达异源多肽,其中所述异源多肽包含膜结构域,和(b)将微藻宿主细胞在足以产生包含异源多肽的胞外体的条件下培养,其中所述胞外体与宿主细胞质膜是不连续的,其中所述组合物作为包含所述胞外体的培养上清产生。在一些实施方案中,该方法进一步包括从组合物去除培养上清和在含水液体载体中重悬胞外体。本发明涉及由该方法产生的组合物。

在一些实施方案中,生产微藻胞外体和异源多肽的方法,或者生产包含微藻胞外体和异源多肽的组合物的方法,包括宿主细胞,其是网粘菌门(labyrinthulomycota)宿主细胞。在一些实施方案中,宿主细胞是裂殖壶菌属或破囊壶菌属宿主细胞。

本发明涉及一种包含异源多肽的微藻胞外体,其中所述胞外体与微藻细胞的质膜是不连续的。在一些实施方案中,胞外体是囊泡、胶束、膜片段、膜聚集体、或其混合物。在一些实施方案中,胞外体是囊泡和膜片段的混合物。在一些实施方案中,胞外体是囊泡。在一些实施方案中,异源多肽包含膜结构域。在一些实施方案中,异源多肽是糖蛋白。在一些实施方案中,糖蛋白包含高甘露寡糖。在一些实施方案中,糖蛋白基本上不含唾液酸。

本发明涉及一种包含上述权利要求中任一项所述的胞外体和含水液体载体的组合物。在一些实施方案中,含水液体载体是培养上清。

具体地,本发明涉及如下各项:

1.一种生产病毒蛋白的方法,所述病毒蛋白选自下组:血凝素(ha)蛋白、神经氨酸酶(na)蛋白、融合(f)蛋白、糖蛋白(g)蛋白、包膜(e)蛋白、120kda的糖蛋白(gp120)、41kda的糖蛋白(gp41)、基质蛋白及其组合,所述方法包括在培养基中培养重组微藻细胞以产生病毒蛋白,其中所述重组微藻细胞含有包含编码病毒蛋白的多核苷酸序列的核酸分子。

2.依照项1所述的方法,其中所述病毒蛋白被分泌。

3.依照项1或2所述的方法,其进一步包括从培养基回收病毒蛋白。

4.依照项1所述的方法,其中所述病毒蛋白在微藻细胞中积累。

5.依照项1-4中任一项所述的方法,其中所述病毒蛋白在微藻细胞的膜中积累。

6.依照项1-5中任一项所述的方法,其中所述病毒蛋白是ha蛋白。

7.依照项6所述的方法,其中ha蛋白与seqidno:77是至少90%相同的。

8.依照项6或项7所述的方法,其中所述微藻细胞能够在不存在外源蛋白酶的情况下,将ha蛋白翻译后加工以生产ha1和ha2片段。

9.依照项1-5中任一项所述的方法,其中所述病毒蛋白是na蛋白。

10.依照项9所述的方法,其中所述na蛋白与seqidno:100是至少90%相同的。

11.依照项1-5中任一项所述的方法,其中所述病毒蛋白是f蛋白。

12.依照项11所述的方法,其中所述f蛋白与seqidno:102是至少90%相同的。

13.依照项1-5中任一项所述的方法,其中所述病毒蛋白是g蛋白。

14.依照项13所述的方法,其中所述g蛋白与seqidno:103是至少90%相同的。

15.依照项1-14中任一项所述的方法,其中所述微藻细胞是破囊壶菌目(thraustochytriales)成员。

16.依照项1-15中任一项所述的方法,其中所述微藻细胞是裂殖壶菌属(schizochytrium)或破囊壶菌属(thraustochytrium)的。

17.依照项1-16中任一项所述的方法,其中编码病毒蛋白的多核苷酸序列进一步包含ha膜结构域。

18.依照项1-17中任一项所述的方法,其中所述核酸分子进一步包含选自下组的多核苷酸序列:seqidno:2、seqidno:3、seqidno:4、seqidno:38、seqidno:42、seqidno:43、seqidno:44、seqidno:45、seqidno:46及其组合。

19.依照项1-18中任一项所述的方法产生的分离的病毒蛋白。

20.一种重组微藻细胞,其包含含有编码病毒蛋白的多核苷酸序列的核酸分子,所述病毒蛋白选自下组:血凝素(ha)蛋白、神经氨酸酶(na)蛋白、融合(f)蛋白、糖蛋白(g)蛋白、包膜(e)蛋白、120kda的糖蛋白(gp120)、41kda的糖蛋白(gp41)、基质蛋白及其组合。

21.一种产生包含异源多肽的微藻胞外体的方法,所述方法包括:

在微藻宿主细胞中表达异源多肽,其中所述异源多肽包含膜结构域,和

将所述微藻宿主细胞在足以产生包含异源多肽的胞外体的条件下培养,其中所述胞外体与宿主细胞质膜是不连续的。

22.一种产生包含微藻胞外体和异源多肽的组合物的方法,所述方法包括:

在微藻宿主细胞中表达异源多肽,其中所述异源多肽包含膜结构域,和

将所述微藻宿主细胞在足以产生包含异源多肽的微藻胞外体的条件下培养,其中所述胞外体与宿主细胞质膜是不连续的,

其中所述组合物是作为包含所述胞外体的培养上清产生的。

23.依照项22所述的方法,其进一步包括从组合物去除培养上清和在含水液体载体中重悬所述胞外体。

24.依照项21-23中任一项所述的方法,其中所述宿主细胞是网粘菌门(labyrinthulomycota)宿主细胞。

25.依照项21-24中任一项所述的方法,其中所述宿主细胞是裂殖壶菌属或破囊壶菌属宿主细胞。

26.依照项21所述的方法产生的胞外体。

27.依照项22所述的方法产生的组合物。

28.一种包含异源多肽的微藻胞外体,其中所述胞外体与微藻细胞的质膜是不连续的。

29.依照项28所述的胞外体,其中所述胞外体是囊泡、胶束、膜片段、膜聚集体、或其混合物。

30.依照项28或项29所述的胞外体,其中所述胞外体是囊泡和膜片段的混合物。

31.依照项28或项29所述的胞外体,其中所述胞外体是囊泡。

32.依照项28-31中任一项所述的胞外体,其中异源多肽包含膜结构域。

33.依照项28-32中任一项所述的胞外体,其中异源多肽是糖蛋白。

34.依照项33所述的胞外体,其中所述糖蛋白包含高甘露糖寡糖。

35.依照项33或项34所述的胞外体,其中所述糖蛋白基本上不含唾液酸。

36.包含项28-35中任一项所述的胞外体和含水液体载体的组合物。

37.依照项36所述的组合物,其中所述含水液体载体是培养上清。

附图简述

图1显示了编码甲型流感病毒(a/puertorico/8/34/mountsinai(h1n1))血凝素(ha)蛋白的多核苷酸序列(seqidno:76),其经密码子优化以供在裂殖壶菌属菌种atcc20888中表达。

图2显示了pcl0143的质粒图谱。

图3显示了用于分析cl0143-9克隆的流程。

图4显示了转基因裂殖壶菌属cl0143-9(“e”)进行的ha蛋白的分泌。图4a显示了在抗h1n1免疫印迹中从不同温度(25℃、27℃、29℃)和ph(5.5、6.0、6.5、7.0)的培养物的低速上清(即无细胞上清(“cfs”))回收的重组ha蛋白(如箭头所示)。图4b显示了在非还原或还原条件下从60%蔗糖级分的抗-h1n1免疫印迹(“ib:抗-h1n1”)和考马斯染色凝胶(“考马斯”)回收的重组ha蛋白。

图5显示了来自转基因裂殖壶菌属cl0143-9(“e”)的重组ha蛋白的血凝素活性。图5a显示了无细胞上清(“cfs”)中的血凝素活性。图5b显示了在可溶(“us”)和不溶性(“up”)级分中的血凝素活性。“[蛋白质]”指蛋白质的浓度,随样品稀释增加而从左至右降低。“-”指缺乏ha的阴性对照。“+”指流感血凝素阳性对照。“c”指阴性对照裂殖壶菌属菌种atcc20888野生型菌株。“hau”指基于从左至右的样品倍数稀释的血凝素活性单位。“2”指第一孔中的2倍稀释的样品;从左至右的随后的孔代表在前一孔之上的加倍稀释,从而使从左至右从第一孔到最后的孔的倍数稀释是2、4、8、16、32、64、128、256、512、1024、2048和4096。

图6显示了存在于转基因裂殖壶菌属cl0143-9(“e”)60%蔗糖级分中的ha蛋白的表达和血凝素活性。图6a显示了考马斯染色凝胶(“考马斯”)和抗-h1n1免疫印迹(“ib:抗-h1n1”)中所示的来自60%蔗糖级分的回收的重组ha蛋白(如箭头所示)。图6b显示了相应的血凝素活性。“-”指缺乏ha的阴性对照。“+”指流感ha蛋白阳性对照。“c”指阴性对照裂殖壶菌属菌种atcc20888野生型菌株。“hau”指基于样品倍数稀释的血凝素活性单位。

图7显示了回收的重组ha蛋白的肽序列分析,这是通过覆盖完整ha蛋白序列(seqidno:77)超过42%的共27条肽(与肽相关的氨基酸以粗体突出显示)确定的。ha1多肽由总共17条肽确定,而ha2多肽由总共9条肽确定。

图8显示了例示裂殖壶菌属中ha蛋白糖基化的考马斯染色凝胶(“考马斯”)和抗-h1n1免疫印迹(“ib:抗-h1n1”)。“endoh”和“pngasef”指转基因裂殖壶菌属cl0143-9的60%蔗糖级分使用各种酶的酶处理。“nt”指不用酶温育但在与endoh和pgnasef处理相同条件下的转基因裂殖壶菌属cl0143-9。

图9显示了对应于时间(小时)的全部裂殖壶菌属菌种atcc20888培养上清蛋白(g/l)。

图10在11-15泳道显示了全部裂殖壶菌属菌种atcc20888培养上清蛋白的sds-page,其中在如图9所示第37-68小时中的6个时间点中的五个,除了第52小时,收集了上清。鉴定为肌动蛋白或凝溶胶蛋白的条带(通过质谱肽测序)以箭头标记。泳道11以2.4μg总蛋白上样,其余孔以5μg总蛋白上样。

图11显示了来自裂殖壶菌属菌种atcc20888("c:20888")和转基因裂殖壶菌属cl0143-9("e:cl0143-9")负染色的囊泡。

图12显示了来自裂殖壶菌属菌种atcc20888("c:20888")和转基因裂殖壶菌属cl0143-9("e:cl0143-9")的抗-h1n1免疫金标记的囊泡。

图13显示了基于使用signalp算法预测的裂殖壶菌属天然的信号锚序列。参见,例如,bendsten等,j,mol.biol.340:783-795(2004);nielsen,h.和krogh,a.proc.int.conf.intell.syst.mol.biol.6:122-130(1998);nielsen,h.等,proteinengineering12:3-9(1999);emanuelsson,o.等,natureprotocols2:953-971(2007)。

图14显示了预测的裂殖壶菌属中的i型膜蛋白,其是基于针对与来自其它生物的已知i型膜蛋白具有同源性并在蛋白的极c-端区具有跨膜区的基因,对裂殖壶菌属基因组和estdna数据库进行blast检索。

图15显示了pcl0120的质粒图谱。

图16显示了裂殖壶菌属的密码子选择表。

图17显示了pcl0130的质粒图谱。

图18显示了pcl0131的质粒图谱。

图19显示了pcl0121的质粒图谱。

图20显示了pcl0122的质粒图谱。

图21显示了为在裂殖壶菌属菌种atcc20888中表达优化的编码瘤胃真菌属菌种(piromycessp.)e2木糖异构酶蛋白“xyla”的多核苷酸序列(seqidno:92),对应于genbank登录号cab76571。

图22显示了为在裂殖壶菌属菌种atcc20888中表达优化的编码瘤胃真菌属菌种e2木酮糖激酶蛋白“xylb”的多核苷酸序列(seqidno:93),对应于genbank登录号aj249910。

图23显示了pcl0132的质粒图谱。

图24显示了pcl0136的质粒图谱。

图25a显示了pcl0140的质粒图谱而图25b显示了pcl0149的质粒图谱。

图26上图面显示了为在裂殖壶菌属菌种atcc20888中表达优化的编码甲型流感病毒(a/puertorico/8/34/mountsinai(h1n1))的神经氨酸酶(na)蛋白的多核苷酸序列(seqidno:100)。图26下图面显示了为在裂殖壶菌属菌种atcc20888中表达优化的编码甲型流感病毒(a/puertorico/8/34/mountsinai(h1n1))的na蛋白,接有v5标签和多聚组氨酸标签的多核苷酸序列(seqidno:101)。

图27显示了用于分析cl0140和cl0149克隆的流程表。

图28显示了来自转基因裂殖壶菌属菌株cl0140-16,-17,-20,-21,-22,-23,-24,-26,-28的重组na的神经氨酸酶活性。通过测量4-甲基伞形酮的荧光来测定活性,所述荧光在唾液酸酶水解(4-甲基伞形酮)-α-d-n-乙酰神经氨酸(4-methylumbelliferyl)-α-d-n-acetylneuraminate;4-munana)之后产生(激发(exc):365nm,发射(em):450nm)。以浓缩的无细胞上清(ccfs,每个克隆最左边的柱)和无细胞提取物(cfe,每个克隆最右边的柱)中每μg蛋白的相对荧光单位(rfu)来表示活性。与转基因菌株以相同方式培养和制备的裂殖壶菌属菌种atcc20888野生型菌株(“-”)和用pcl0140转化的裂殖壶菌属的pcr阴性菌株(“27”)用作阴性对照。

图29显示了来自转基因裂殖壶菌属菌株cl0140-26的重组na蛋白的部分纯化。各级分的神经氨酸酶活性如图29a所示。“ccfs”指浓缩的无细胞上清。“d”指以洗涤缓冲液稀释的ccfs,“ft”指流过物(flow-through),“w”指洗液,“e”指洗脱液和“ce”指浓缩的洗脱级分。每级分12.5μl的考马斯染色凝胶(“考马斯”)如图29b所示。箭头指向鉴定为na蛋白的条带。以mopssds运行缓冲液在12%的bis-tris凝胶上使用sds-page分离蛋白。

图30显示了回收的重组na蛋白的肽序列分析,na蛋白是通过覆盖蛋白序列(seqidno:10)25%的共9条肽(以粗红突出显示)确定的。

图31显示了转基因裂殖壶菌属菌株cl0149-10,-11,-12的神经氨酸酶活性和对应的考马斯染色凝胶(“考马斯”)和抗-v5免疫印迹(“免疫印迹:抗-v5”)。图31a显示了神经氨酸酶活性,如通过测量4-甲基伞形酮的荧光来测定的,荧光在唾液酸酶水解4-munana之后产生(激发(exc):365nm,发射(em):450nm)。以无细胞上清(cfs)中每μg蛋白的相对荧光单位(rfu)来表示活性。将与转基因菌株以相同方式培养和制备的裂殖壶菌属菌种atcc20888野生型菌株(“-”)用作阴性对照。图31b显示了3株转基因裂殖壶菌属cl0149菌株(“10”、“11”、和“12”)的12.5μlcfs的考马斯染色凝胶和对应的抗-v5免疫印迹。将positopetm抗体对照蛋白用作阳性对照(“+”)。将与转基因菌株以相同方式培养和制备的裂殖壶菌属菌种atcc20888野生型菌株(“-”)用作阴性对照。

图32显示了用cl0140和cl0143共转化的转基因裂殖壶菌属的无细胞上清中的流感ha和na的酶活性。显示了克隆cl0140-143-1、-3、-7、-13、-14、-15、-16、-17、-18、-19、-20的数据。图32a显示了神经氨酸酶活性,如通过测量4-甲基伞形酮的荧光来测定的,所述荧光由唾液酸酶水解4-munana之后产生(激发(exc):365nm,发射(em):450nm)。以25μlcfs中的相对荧光单位(rfu)来表示活性。将与转基因菌株以相同方式培养和制备的裂殖壶菌属菌种atcc20888野生型菌株(“-”)用作阴性对照。图32b显示了血凝素活性。“-”指缺少ha的阴性对照。“+”指流感ha阳性对照。“hau”指基于样品倍数稀释的血凝素活性单位。

发明详述

本发明涉及在微藻宿主细胞中生产异源多肽的方法。本发明也涉及所述方法产生的异源多肽、包含所述异源多肽的微藻细胞、和包含所述异源多肽的组合物。本发明也涉及在微藻宿主细胞中异源多肽的产生,其中所述异源多肽与微藻胞外体相关,所述微藻胞外体与宿主细胞质膜是不连续的。本发明也涉及包含异源多肽的微藻胞外体的产生,以及包含它们的组合物的产生。本发明进一步涉及包含异源多肽的微藻胞外体、组合物及其用途。

微藻宿主细胞

微藻,又称微小藻类(microscopicalgae),经常发现于淡水和海洋系统。微藻是单细胞的但也可以生长成链和组。单个细胞的大小从几微米到几百微米。因为细胞能够生长在含水悬液中,它们能有效地获得营养和进入液体环境。

在一些实施方案中,微藻宿主细胞是不等鞭毛体(heterokont)或原生藻菌(stramenopile)。

在一些实施方案中,微藻宿主细胞是网粘菌门(labyrinthulomycota)成员。在一些实施方案中,网粘菌门宿主细胞是破囊壶菌目(thraustochytriales)或网粘菌目(labyrinthulales)成员。根据本发明,术语“破囊壶菌(thraustochytrid)”是指破囊壶菌目(thraustochytriales)的任何成员,包括破囊壶菌科(thraustochytriaceae),而术语“网粘菌(labyrinthulid)”是指网粘菌目(labyrinthulales)的任何成员,包括网粘菌科(labyrinthulaceae)。网粘菌科的成员从前曾被认为是破囊壶菌目的成员,但是在最近此类生物体的分类学归类的修订版中,网粘菌科现在被认为是网粘菌目的成员。网粘菌目和破囊壶菌目均被认为是网粘菌门的成员。分类学理论现在通常将这两个群的微生物与原生藻菌世系中的藻或藻样原生生物放在一起。破囊壶菌和网粘菌当前的分类学地位可以归纳如下:

界:藻菌界(stramenopila)(管毛生物界(chromista))

门:网粘菌门(labyrinthulomycota)(不等毛门(heterokonta))

纲:网粘菌纲(labyrinthulomycetes)(labyrinthulae)

目:网粘菌目(labyrinthulales)

科:网粘菌科(labyrinthulaceae)

目:破囊壶菌目(thraustochytriales)

科:破囊壶菌科(thraustochytriaceae)

对于本发明的目的而言,作为破囊壶菌描述的菌株包括如下生物体:目:破囊壶菌目;科:破囊壶菌科;属:破囊壶菌属(种:菌种,arudimentale,aureum,benthicola,globosum,kinnei,motivum,multirudimentale,pachydermum,proliferum,roseum,striatum)、吾肯氏壶菌属(ulkenia)(种:菌种,amoeboidea,kerguelensis,minuta,profunda,radiata,sailens,sarkariana,schizochytrops,visurgensis,yorkensis)、裂殖壶菌属(种:菌种,aggregatum,limnaceum,mangrovei,minutum,octosporum),japonochytrium属(种:菌种,marinum)、aplanochytrium属(种:菌种,haliotidis,kerguelensis,profunda,stocchinoi)、althornia属(种:菌种,crouchii)、或elina属(种:菌种,marisalba,sinorifica)。出于本发明的目的,吾肯氏壶菌属中描述的物种将被看作是破囊壶菌属的成员。aurantiochytrium、oblongichytrium、botryochytrium、parietichytrium、和sicyoidochytrium是本发明网粘菌门包括的额外的属。

本发明作为网粘菌描述的菌株包括如下生物体:目:网粘菌目,科:网粘菌科,属:网粘菌属(种:菌种,algeriensis,coenocystis,chattonii,macrocystis,macrocystisatlantica,macrocystismacrocystis,marina,minuta,roscoffensis,valkanovii,vitellina,vitellinapacifica,vitellinavitellina,zopfii),labyrinthuloides属(种:菌种,haliotidis,yorkensis),labyrinthomyxa属(种:菌种,marina),diplophrys属(种:菌种,archeri),pyrrhosorus属(种:菌种,marinus),sorodiplophrys属(种:菌种,stercorea)或chlamydomyxa属(种:菌种,labyrinthuloides,montana)(尽管关于pyrrhosorus、sorodiplophrys或chlamydomyxa的精确分类学地位目前尚没有达成一致)。

网粘菌门的微藻细胞包括但不限于保藏菌株pta-10212、pta-10213、pta-10214、pta-10215、pta-9695、pta-9696、pta-9697、pta-9698、pta-10208、pta-10209、pta-10210、pta-10211、以sam2179保藏的微生物(保藏者命名为“吾肯氏壶菌sam2179”)、任何破囊壶菌属菌种(包括前述的吾肯氏壶菌属菌种,例如u.visurgensis,u.amoeboida,u.sarkariana,u.profunda,uradiata,u.minuta和吾肯氏壶菌菌种bp-5601),并且包括thraustochytriumstriatum,thraustochytriumaureum,thraustochytriumroseum;和任何japonochytrium属菌种。破囊壶菌目菌株包括但不限于破囊壶菌属菌种(23b)(atcc20891);thraustochytriumstriatum(schneider)(atcc24473);thraustochytriumaureum(goldstein)(atcc34304);thraustochytriumroseum(goldstein)(atcc28210);和japonochytrium属菌种(l1)(atcc28207)。裂殖壶菌属包括但不限于schizochytriumaggregatum,schizochytriumlimacinum,裂殖壶菌属菌种(s31)(atcc20888),裂殖壶菌属菌种(s8)(atcc20889),裂殖壶菌属菌种(lc-rm)(atcc18915),裂殖壶菌属菌种(sr21),保藏菌株atcc28209,和保藏的schizochytriumlimacinum菌株ifo32693。在一些实施方案中,细胞是裂殖壶菌属(schizochytrium)或破囊壶菌属(thraustochytrium)的。裂殖壶菌属能够通过连续二等分裂和通过形成孢子囊两种方式复制,最终释放游动孢子。但是,破囊壶菌属仅通过形成孢子囊复制,然后释放游动孢子。

在一些实施方案中,微藻宿主细胞是网粘菌纲(也称作labyrinthulomycetes)。网粘菌纲产生特有的结构称为“质外网”(ectoplasmicnets)。这些结构是质膜分叉的、管状的延伸物,极大地有助于增加质膜的表面积。参见,例如,perkins,arch.mikrobiol.84:95-118(1972);perkins,can.j.bot.51:485-491(1973)。质外网是从称为sagenosome或生网体(bothrosome)的独特的细胞结构形成的。质外网将网粘菌纲细胞附着于表面并能够穿过表面。分别参见,例如,coleman和vestal,can.j.microbiol.33:841-843(1987),和porter,mycologia84:298-299(1992)。例如,已经观察到裂殖壶菌属菌种atcc20888当在固体培养基上培养时,产生延伸到琼脂中的质外网(数据未显示)。在此情况下质外网看起来充当类伪根(pseudorhizoid)。此外,在某些质外网膜延伸中发现丰富的肌动蛋白纤丝。参见,例如,preston,j.eukaryot.microbiol.52:461-475(2005)。基于肌动蛋白纤丝在其他生物的细胞骨架结构中的重要性,预计例如肌动蛋白的细胞骨架元件在质外网膜延伸的形成和/或完整性中发挥作用。

产生类伪根延伸的其他生物包括称为壶菌(chytrids)的生物,分类学上将这些生物分类在包括壶菌门(chytridiomycota)或须霉属(phycomyces)的各组中。属的例子包括chytrdium、chytrimyces、cladochytium、lacustromyces、根生壶菌属(rhizophydium)、rhisophyctidaceae、rozella、olpidium和lobulomyces。

在一些实施方案中,微藻宿主细胞包含膜延伸物。在一些实施方案中,微藻宿主细胞包含类伪根。在一些实施方案中,微藻宿主细胞包含质外网。在一些实施方案中,微藻宿主细胞包含sagenosome或生网体。

在一些实施方案中,微藻宿主细胞是破囊壶菌。在一些实施方案中,微藻宿主细胞是裂殖壶菌属或破囊壶菌属细胞。

在一些实施方案中,微藻宿主细胞是网粘菌。

在一些实施方案中,微藻宿主细胞是能够通过常规分泌途径加工多肽的真核细胞,例如网粘菌门成员,包括裂殖壶菌属、破囊壶菌属和其他破囊壶菌。例如,已经认识到网粘菌门成员比cho细胞产生更少的丰富分泌的蛋白,导致使用裂殖壶菌比例如cho细胞具有优势。此外,不像大肠杆菌,网粘菌门成员,例如裂殖壶菌属,进行某些蛋白的生物活性所必需的蛋白糖基化,例如n-联糖基化。已经确定破囊壶菌,例如裂殖壶菌属,展示的n-联糖基化比酵母糖基化更紧密类似于哺乳动物的糖基化模式。

用于本发明宿主细胞的有效培养条件包括但不限于允许蛋白产生和/或重组的有效的培养基、生物反应器、温度、ph和氧条件。有效的培养基指任何通常培养微藻细胞,如破囊壶菌目细胞,例如裂殖壶菌属宿主细胞的培养基。这种培养基通常包含具有可同化的碳、氮、和磷酸盐源、以及适当的盐、无机物、金属和其他营养物质,如维生素的含水培养基。合适的培养基和培养条件的非限制性实例公开在实施例部分。适合破囊壶菌目微生物的非限制性培养条件也描述于,例如,美国专利第5,340,742号,将其通过提述整体并入本文。本发明的细胞可培养于常规的发酵生物反应器、摇瓶、试管、微滴定板和培养皿中。可在适于重组细胞的温度、ph和氧含量下进行培养。

在一些实施方案中,本发明的微藻宿主细胞含有包含编码选择标记的核酸序列的重组载体。在一些实施方案中,选择标记允许选择经转化的微生物。显性选择标记的例子包括降解具有抗生素或杀真菌活性的化合物的酶,如,例如来自steptoalloteichushindustanus的编码seqidno:5所示的“博莱霉素结合蛋白”的shble基因。显性选择标记的另一个例子包括破囊壶菌乙酰乳酸合酶序列,例如seqidno:6的多核苷酸序列的突变形式。可以修饰、突变或以其他方式选择乙酰乳酸合酶以使其对磺脲类化合物、咪唑啉酮类抑制剂和/或嘧啶基氧代苯甲酸酯(pyrimidinyloxybenzoates)的抑制有抗性。破囊壶菌乙酰乳酸合酶序列的代表性例子包括但不限于如seqidno:7、seqidno:8、seqidno:9、seqidno:10的氨基酸序列,或通过在一个或多个以下位置的氨基酸缺失、插入或取代而不同于seqidno:7的氨基酸序列:116g、117a、192p、200a、251k、358m、383d、592v、595w、或599f,和例如seqidno:11、seqidno:12、或seqidno:13的多核苷酸序列,以及与任一代表性序列具有至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%同一性的序列。可以包含于用于转化微藻细胞的重组载体的选择标记进一步的例子包括zeocintm、巴龙霉素、潮霉素、杀稻瘟素或任何其他合适的抗性标记。

术语“转化”用于指任何一种方法,通过这种方法外源核酸分子(即,重组核酸分子)可被插入微生物细胞。在微生物系统中,术语“转化”用于描述由于微生物获得外源核酸所致的一种遗传性改变而且可基本上与术语“转染”同义。用于将外源核酸分子引入微藻宿主细胞的合适的转化技术包括但不限于,粒子轰击、电穿孔、显微注射、脂转染、吸附、感染和原生质体融合。例如,可以在指数生长期或当微藻细胞在600nm的光密度达到1.5-2时,将外源核酸分子,包括重组载体,引入处于的静息期的微藻细胞。也可以在通过电穿孔将核酸分子导入宿主细胞前,用具有蛋白酶活性的酶预处理微藻宿主细胞。

在一些实施方案中,遗传修饰宿主细胞以引入或缺失涉及与转运和/或合成碳水化合物相关的生物合成途径的基因,包括涉及糖基化的那些。例如,可以通过缺失内源糖基化基因和/或插入人或动物的糖基化基因以允许更紧密类似于人的糖基化模式来修饰宿主细胞。酵母中的糖基化修饰可参见,例如,美国专利第7,029,872号和美国申请公开号2004/0171826,2004/0230042,2006/0257399,2006/0029604和2006/0040353。本发明的宿主细胞包括其中使用rna病毒元件来增加或调节基因表达的细胞。

表达系统

用于在微藻宿主细胞中表达异源多肽的表达系统包含在微藻细胞中有活性的调节性调控元件。在一些实施方案中,表达系统包含在网粘菌门细胞中有活性的调节性调控元件。在一些实施方案中,表达系统包含在破囊壶菌中有活性的调节性调控元件。在一些实施方案中,表达系统包含在裂殖壶菌属或破囊壶菌属中有活性的调节性调控元件。许多调节性调控元件,包括各种启动子,在许多不同物种中具有活性。因此,调节序列可以在与分离出所述调节序列的细胞相同的细胞类型中应用,或者也可以在与分离出所述调节序列的细胞不同的细胞类型中应用。这种表达盒的设计和构建使用本领域熟练技术人员已知的标准分子生物学技术。参见,例如,sambrook等,2001,molecularcloning:alaboratorymanual,第三版。

在一些实施方案中,用于在微藻细胞中的异源多肽产生的表达系统包含衍生自网粘菌门序列的调节元件。在一些实施方案中,在微藻细胞中用于产生异源多肽的表达系统包含衍生自非网粘菌门序列的调节元件,包括衍生自非网粘菌门藻类序列的序列。在一些实施方案中,表达系统包含编码异源多肽的多核苷酸序列,其中所述多核苷酸序列与在微藻宿主细胞中有功能的任何启动子序列、任何终止子序列、和/或任何其他调节序列相关。可以使用诱导性或组成型活性的序列。合适的调节性调控元件也包括与本文描述的核酸分子相关的任何调节性调控元件。

本发明也涉及在微藻宿主细胞中用于表达异源多肽的表达盒。本发明也涉及包含在宿主细胞中表达异源多肽的表达盒的任何一种上述宿主细胞。在一些实施方案中,表达系统包含含有遗传元件,例如至少是启动子、编码序列和终止子区的表达盒,它们以在宿主细胞中有功能的方式可操作地连接。在一些实施方案中,表达盒包含至少一种分离的如本发明所述的核酸分子。在一些实施方案中,表达盒的所有遗传元件是与分离的核酸分子关联的序列。在一些实施方案中,调控序列是可诱导的序列。在一些实施方案中,编码异源多肽的核酸序列整合到宿主细胞的基因组中。在一些实施方案中,编码异源多肽的核酸序列稳定整合到宿主细胞的基因组中。

在一些实施方案中,编码要表达的异源多肽的分离的核酸序列可操作地连接启动子序列和/或终止子序列,在宿主细胞中两者均是有功能的。编码要表达的异源多肽的分离的核酸序列可操作地连接的启动子和/或终止子序列可以包括任何启动子和/或终止子序列,包括但不限于本文公开的核酸序列、美国专利第7,001,772号公开的调节序列、美国申请公开号2006/0275904和2006/0286650公开的调节序列、美国申请公开号2010/0233760号和wo2010/107709公开的调节序列、或其他与编码异源多肽的分离的多核苷酸序列可操作地连接、在其转化的宿主细胞中有功能的调节序列。在一些实施方案中,编码异源多肽的核酸序列是为特定的微藻宿主细胞密码子优化的,以最大化翻译效率。

本发明也涉及包含本发明的表达盒的重组载体。重组载体包括但不限于质粒、噬菌体和病毒。在一些实施方案中,重组载体是线性化载体。在一些实施方案中,重组载体是表达载体。本文所用的短语“表达载体”指适于生产编码产物(如感兴趣的蛋白)的载体。在一些实施方案中,将编码要生产的产物的核酸序列插入重组载体以产生重组核酸分子。将编码要产生的异源多肽的核酸序列以将该核酸序列与载体中的调节序列(如破囊壶菌目启动子)可操作地连接的方式插入载体,其使得所述核酸序列在重组微生物中能够转录和翻译。在一些实施方案中,选择标记,包括任何本文所述的选择标记,使得能够选择已将本发明的重组核酸分子成功引入的重组微生物。

在一些实施方案中,本发明的宿主细胞产生的异源多肽以商业规模生产。商业规模包括从在规格≥100l、≥1,000l、≥10,000l或≥100,000l的通气发酵罐中生长的微生物来产生异源多肽。在一些实施方案中,在带有搅拌的通气发酵罐中进行商业规模生产。

在一些实施方案中,本发明的宿主细胞产生的异源多肽可以积累在细胞内或可以从细胞分泌,例如作为可溶性异源多肽分泌到培养基中。

在一些实施方案中,本发明生产的异源多肽从细胞、从培养基、或细胞生长的发酵培养基中回收。在一些实施方案中,异源多肽是作为可溶性异源多肽回收自培养基的分泌的异源多肽。在一些实施方案中,异源多肽是包含信号肽的分泌的蛋白。

在一些实施方案中,本发明生产的异源多肽包含指导其在内质网中滞留、指导其胞外分泌、或指导其到其他细胞器或细胞区室的定位信号。在一些实施方案中,异源多肽包含信号肽。在一些实施方案中,异源多肽包含na/pi-iib2转运蛋白信号肽或sec1转运蛋白。在一些实施方案中,信号肽包含seqidno:1或seqidno:37的氨基酸序列。在一些实施方案中,包含具有seqidno:1或seqidno:37的氨基酸序列的信号肽的异源多肽分泌到培养基中。在一些实施方案中,在分泌过程中从蛋白切除信号肽,产生蛋白的成熟形式。

在一些实施方案中,本发明的宿主细胞产生的异源多肽是糖基化的。在一些实施方案中,本发明产生的异源多肽的糖基化模式比酵母或大肠杆菌中产生的蛋白更紧密类似于哺乳动物的糖基化模式。在一些实施方案中,本发明的微藻宿主细胞产生的异源多肽包含n-联糖基化模式。当糖基化模式与主题生物中发现的糖基化模式相似时,用于治疗目的的糖基化蛋白不太可能促进抗糖型的免疫应答。相反地,具有不符合主题生物特征的连接或糖的糖基化蛋白更可能是有抗原性的。也可以通过特定的糖型调节效应功能。例如,igg可以调节促-或抗-炎反应,这与其在fc区糖型上分别不存在或存在末端唾液酸相关(kaneko等,science313:670-3(2006))。

本发明进一步涉及一种生产重组异源多肽的方法,该方法包括在足够表达编码异源多肽的多核苷酸序列的条件下培养本发明的重组微藻宿主细胞。在一些实施方案中,重组异源多肽是从宿主细胞分泌的并从培养基中回收。在一些实施方案中,从细胞分泌的异源多肽包含分泌信号肽。根据用于生产的载体和宿主系统,本发明的重组异源多肽可以保留在重组细胞中,可以分泌到发酵培养基中,可分泌到两层细胞膜之间的空间,或者可以保留在细胞膜的外表面。本文使用的短语“回收蛋白”指收集包含蛋白的发酵培养基而不需暗指额外的分离或纯化步骤。本发明的方法产生的异源多肽可使用各种标准的蛋白纯化技术,例如但不限于,亲和层析、离子交换层析、过滤、电泳、疏水相互作用层析、凝胶过滤层析、反相层析、刀豆蛋白a层析、层析聚焦和差相溶解。在一些实施方案中,本发明的方法产生的异源多肽以“基本上纯”的形式分离。如本文使用的“基本上纯”指允许有效使用异源多肽作为商业产品的纯度。在一些实施方案中,重组异源多肽在细胞内积累并从细胞回收。在一些实施方案中,本方法的宿主细胞是破囊壶菌。在一些实施方案中,本方法的宿主细胞是裂殖壶菌属或破囊壶菌属的。在一些实施方案中,重组异源多肽是治疗性蛋白、食品酶或工业酶。在一些实施方案中,重组微藻宿主细胞是裂殖壶菌属的且重组异源多肽是包含分泌信号序列的治疗性蛋白。

在一些实施方案中,本发明的重组载体是靶向载体。本文使用的短语“靶向载体”指用于将特定核酸分子递送到重组细胞内的载体,其中该核酸分子被用来缺失或失活宿主细胞内的内源基因(即用于靶向基因破坏或敲除技术)。这种载体还被称作“敲除”载体。在一些实施方案中,靶向载体的一部分具有与宿主细胞中靶基因(即,靶向以缺失或失活的基因)的核酸序列同源的核酸序列。在一些实施方案中,插入载体的核酸分子(即插入序列)与靶基因是同源的。在一些实施方案中,载体插入序列的核酸序列被设计成与靶基因结合,使得靶基因和插入序列进行同源重组,藉此使内源靶基因缺失、失活或削弱(即,通过突变或缺失内源靶基因的至少一部分)。

分离的核酸分子

根据本发明,分离的核酸分子是已自其天然环境移出的核酸分子(即,已经过人为操作),其天然环境是该核酸分子在自然界中存在于其中的基因组或染色体。如此,“分离的”并不必然反映核酸分子已被纯化的程度,而是表示该分子不包括该核酸分子在自然界中存在于其中的整个基因组或整个染色体。分离的核酸分子可以包括dna、rna(例如mrna),或dna或rna的衍生物(例如cdna)。虽然短语“核酸分子”主要指物理的核酸分子而短语“核酸序列”或“多核苷酸序列”主要指核酸分子中的核苷酸序列,但所述短语可以互换使用,尤其是涉及能够编码异源多肽的核酸分子、多核苷酸序列、或者核酸序列。在一些实施方案中,利用重组dna技术(例如,聚合酶链式反应(pcr)扩增,克隆)或化学合成产生本发明的分离的核酸分子。分离的核酸分子包括天然的核酸分子及其同源物,包括但不限于,天然的等位基因变体和修饰的核酸分子,其中已经将核苷酸以如下方式插入、缺失、取代和/或倒置,该方式使得这样的修饰在所编码的异源多肽的序列、功能和/或生物活性上提供期望的效果。

启动子序列、终止子序列、信号肽序列、或任何其他序列的核酸序列互补物指与具有启动子序列、终止子序列、信号指肽序列、或任何其他序列的链互补的核酸链的核酸序列。双链dna最好包含单链dna和其具有作为所述单链dna互补物的序列的互补链。由此,核酸分子可以是双链或单链的,并包括那些与本发明的序列和/或本发明的序列的互补物,在“严紧”杂交条件下形成稳定杂交体的核酸分子。推断互补序列的方法是本领域熟练技术人员已知的。

术语“多肽”包括单链多肽分子以及其中单独的组分多肽通过共价或非共价手段连接形成的多重多肽复合物。根据本发明,分离的多肽是已自其自然的环境移出的多肽(即,已经过人为操作),并可以包括例如纯化的蛋白、纯化的肽、部分纯化的蛋白、部分纯化的肽、重组生产的蛋白或肽,和合成产生的蛋白或肽。

如本文使用的,重组微生物具有使用重组技术由其正常(即野生型或天然发生的)形式修饰(即突变或改变)的基因组。根据本发明的重组微生物可以包括这样的微生物,其中以使一种或多种修饰在该微生物中提供所需效果的方式,在其中插入、缺失、或修饰了(即突变,例如,通过核苷酸的插入、缺失、取代和/或倒置)核酸分子。如本文使用的,导致基因表达、基因功能、或基因产物(即由基因编码的蛋白)的功能降低的遗传修饰,可称作基因的失活(全部或部分)、缺失、间断、阻断或下调。例如导致基因编码蛋白的功能降低的基因遗传修饰可以是下列造成的:基因的完全缺失(即在重组微生物中不存在该基因,并因此重组微生物中不存在该蛋白),基因突变导致蛋白翻译不完全或者不翻译(例如蛋白不表达),基因突变降低或完全消除蛋白的天然功能(例如,表达的蛋白具有降低的活性或无活性(例如酶活或作用)。导致基因表达或功能增加的遗传修饰可称作基因的扩增、过生产、过表达,活化、增强、添加或上调。

启动子

启动子是指导关联的编码区的转录的dna区。

在一些实施方案中,启动子来自网粘菌门的微生物。在一些实施方案中,启动子来自破囊壶菌,包括但不限于:以sam2179保藏的微生物(保藏者命名为“吾肯氏壶菌属sam2179”)、吾肯氏壶菌属(ulkenia)或破囊壶菌属或裂殖壶菌属的微生物。裂殖壶菌属包括但不限于schizochytriumaggregatum、schizochytriumlimacinum、裂殖壶菌属菌种(s31)(atcc20888)、裂殖壶菌属菌种(s8)(atcc20889)、裂殖壶菌属菌种(lc-rm)(atcc18915)、裂殖壶菌属菌种(sr21)、保藏的裂殖壶菌菌株atcc28209、和保藏的裂殖壶菌菌株ifo32693。

启动子可以至少在破囊壶菌中具有启动子活性,并包括全长启动子序列及其功能片段、融合序列,和自然发生的启动子的同源物。启动子的同源物与自然发生的启动子区别在于至少一个、两个、三个或几个核苷酸已被缺失、插入、倒置、取代和/或衍生化。虽然活性可增加、减少、或使其依赖于某些刺激,启动子的同源物至少在破囊壶菌中能够保留作为启动子的活性。启动子可包含一个或多个赋予发育和组织特异性调节性调控或表达的序列元件。

在一些实施方案中,本文所述的分离的核酸分子包含pufapksorfc启动子(“pksorfc启动子”,也称作pfa3启动子),例如,seqidno:3代表的多核苷酸序列。pksorfc启动子包括与自然发生的pksorfc启动子序列足够相似的pksorfc启动子同源物,同源物的核酸序列能够在适中、高或非常高的严紧条件下与自然发生的pksorfc启动子,例如seqidno:3,或以atcc登录号pta-9615保藏的pcl0001的orfc启动子的核酸序列的互补序列杂交。

在一些实施方案中,本发明分离的核酸分子包含ef1短启动子(“ef1短”或“ef1-s”启动子)或ef1长(“ef1长”或“ef1-l”启动子),例如,seqidno:42代表的ef1短启动子,或seqidno:43代表的ef1长启动子。ef1短启动子或ef1长启动子包括分别与自然发生的ef1短和/或长启动子序列足够相似的ef1短或长启动子的同源物,同源物的核酸序列能够在适中、高或非常高的严紧条件下与自然发生的ef1短和/或长启动子,例如分别是seqidno:42和/或seqidno:43,或以atcc登录号pta-9616保藏的pab0018的ef1长启动子的核酸序列的互补序列杂交。

在一些实施方案中,本发明分离的核酸分子包含60s短启动子(“60s短”或“60s-s”启动子)或60s长启动(“60s长”或“60s-l”启动子)例如,seqidno:44代表的60s短启动子,或具有seqidno:45代表的多核苷酸序列的60s长启动子。在一些实施方案中,60s短或60s长启动子包括分别与自然发生的60s短或60s长启动子序列足够相似的60s短或60s长启动子的同源物,同源物的核酸序列能够在适中、高或非常高的严紧条件下与自然发生的60s短和/或60s长启动子,例如分别是seqidno:44和/或seqidno:45,或以atcc登录号pta-9614保藏的pab0011的60s长启动子的核酸序列的互补序列杂交。

在一些实施方案中,分离的核酸分子包含sec1启动子(“sec1启动子”),例如,seqidno:46代表的多核苷酸序列。在一些实施方案中,sec1启动子包括与自然发生的sec1启动子序列足够相似的sec1启动子同源物,同源物的核酸序列能够在适中、高或非常高的严紧条件下与自然发生的sec1启动子,例如seqidno:46,或以atcc登录号pta-9613保藏的pab0022的sec1启动子的核酸序列的互补序列杂交。

终止子

终止子区是遗传序列的一部分,其标志基因组dna中的基因序列转录的结束。

在一些实施方案中,终止子区来自网粘菌门的的微生物。在一些实施方案中,终止子区来自破囊壶菌。在一些实施方案中,终止子区来自裂殖壶菌属或破囊壶菌属。裂殖壶菌属包括但不限于schizochytriumaggregatum,schizochytriumlimacinum,裂殖壶菌属菌种(s31)(atcc20888),裂殖壶菌属菌种(s8)(atcc20889),裂殖壶菌属菌种(lc-rm)(atcc18915),裂殖壶菌属菌种(sr21),保藏菌株atcc28209,和保藏菌株ifo32693。在一些实施方案中,终止子区是异源终止子区,例如,异源sv40的终止子区。

终止子区至少在破囊壶菌中具有终止活性并包括全长终止子序列及其功能片段、融合序列,和自然发生的终止子区的同源物。终止子的同源物与自然发生的终止子区别在于至少一个或几个,但不限于一个或几个核苷酸已被缺失、插入、倒置、取代和/或衍生化。在一些实施方案中,虽然活性可以增加、减少、或使其依赖于某些刺激,终止子的同源物至少在破囊壶菌中保留作为终止子区的活性。

在一些实施方案中,分离的核酸分子可以包含pufapksorfc基因的终止子区(“pksorfc终止子区”,也称作pfa3终止子),例如,seqidno:4代表的多核苷酸序列。seqidno:4公开的终止子区是来自破囊壶菌微生物的自然发生的(野生型)终止子序列,并特别是裂殖壶菌属pksorfc终止子区并被称为“orfc终止子元件1”。在一些实施方案中,pksorfc终止子区包括与自然发生的pufapksorfc终止子区足够相似的pksorfc终止子区同源物,所述同源物的核酸序列能够在适中、高或非常高的严紧条件下与自然发生的pksorfc终止子区,例如seqidno:4,或以atcc登录号pta-9614保藏的pab0011的orfc终止子区的核酸序列的互补序列杂交。

信号肽

在一些实施方案中,分离的核酸分子可以包含编码来自网粘菌门微生物的分泌蛋白的信号肽的多核苷酸序列。在一些实施方案中,微生物是破囊壶菌。在一些实施方案中,微生物是裂殖壶菌属或破囊壶菌属的。

信号肽可以在破囊壶菌中具有分泌信号活性,并包括全长肽及其功能片段、融合肽和自然发生的信号肽的同源物。信号肽的同源物与自然发生的信号肽区别在于至少一个或少数几个,但不限于一个或少数几个氨基酸已被缺失(例如蛋白的截短版本,如肽或片段)、插入、倒置、取代和/或衍生化(例如,通过糖基化、磷酸化、乙酰化、豆蔻酰化、异戊烯化、棕榈酰化、酰胺化、和/或加入糖基磷脂酰肌醇)。在一些实施方案中,虽然活性可以是提高的、降低的、或使其依赖于某些刺激,信号肽的同源物至少在破囊壶菌中保留作为信号肽的活性。

在一些实施方案中,分离的核酸分子包含编码na/pi-ii2转运蛋白信号肽的多核苷酸序列。na/pi-ii2转运蛋白信号肽至少在破囊壶菌中至少对na/pi-ii2转运蛋白具有信号靶向活性,并包括全长肽及其功能片段、融合肽和自然发生的na/pi-ii2转运蛋白信号肽的同源物。在一些实施方案中,na/pi-ii2转运蛋白信号肽具有seqidno:1代表的氨基酸序列。在一些实施方案中,na/pi-ii2转运蛋白信号肽具有seqidno:15代表的氨基酸序列。在一些实施方案中,分离的核酸分子包含编码分离的包含seqidno:1或seqidno:15功能性片段的氨基酸序列的多核苷酸序列,所述功能性片段至少在破囊壶菌中,至少对于na/pi-ii2转运蛋白是作为信号肽发挥功能。在一些实施方案中,分离的核酸分子包含seqidno:2。

本发明也涉及包含na/pi-ii2转运蛋白信号肽氨基酸序列的分离的多肽。

在一些实施方案中,分离的核酸分子包含编码α-1,6-甘露糖基转移酶(alg12)信号肽的多核苷酸序列。alg12信号肽至少在破囊壶菌中,至少对alg12蛋白能够具有信号靶向活性,并包括全长肽及其功能片段、融合肽和自然发生的alg12信号肽的同源物。在一些实施方案中,alg12信号肽具有seqidno:59代表的氨基酸序列。在一些实施方案中,分离的核酸分子包含编码分离的含有seqidno:59功能性片段的氨基酸序列的多核苷酸序列,所述功能性片段至少在破囊壶菌中,至少对于alg12蛋白是作为信号肽发挥功能。在一些实施方案中,分离的核酸分子包含seqidno:60。

本发明也涉及包含alg12信号肽氨基酸序列的分离的多肽。

在一些实施方案中,分离的核酸分子包含编码免疫球蛋白结合蛋白(bip)信号肽的多核苷酸序列。bip信号肽至少在破囊壶菌中,至少对bip蛋白能够具有信号靶向活性,并包括全长肽及其功能片段、融合肽和自然发生的bip信号肽的同源物。在一些实施方案中,bip信号肽具有seqidno:61代表的氨基酸序列。在一些实施方案中,分离的核酸分子包含编码含有seqidno:61功能性片段的分离的氨基酸序列的多核苷酸序列,所述功能性片段至少在破囊壶菌中,至少对于bip蛋白是作为信号肽发挥功能。在一些实施方案中,分离的核酸分子包含seqidno:62。

本发明也涉及包含bip信号肽氨基酸序列的分离的多肽。

在一些实施方案中,分离的核酸分子包含编码α-1,3-葡糖苷酶(gls2)信号肽的多核苷酸序列。gls2信号肽至少在破囊壶菌中,至少对gls2蛋白能够具有信号靶向活性,并包括全长肽及其功能片段、融合肽和自然发生的gls2信号肽的同源物。在一些实施方案中,gls2信号肽具有seqidno:63代表的氨基酸序列。在一些实施方案中,分离的核酸分子包含编码含有seqidno:63功能性片段的分离的氨基酸序列的多核苷酸序列,所述功能性片段至少在破囊壶菌中,至少对于gls2蛋白是作为信号肽发挥功能。在一些实施方案中,分离的核酸分子包含seqidno:64。

本发明也涉及包含gls2信号肽氨基酸序列的分离的多肽。

在一些实施方案中,分离的核酸分子包含编码α-1,3-1,6-甘露糖苷酶样信号肽的多核苷酸序列。α-1,3-1,6-甘露糖苷酶样信号肽至少在破囊壶菌中,至少对α-1,3-1,6-甘露糖苷酶样蛋白能够具有信号靶向活性,并包括全长肽及其功能片段、融合肽和自然发生的α-1,3-1,6-甘露糖苷酶样信号肽的同源物。在一些实施方案中,α-1,3-1,6-甘露糖苷酶样信号肽具有seqidno:65代表的氨基酸序列。在一些实施方案中,分离的核酸分子包含编码含有seqidno:65功能性片段的分离的氨基酸序列的多核苷酸序列,所述功能性片段至少在破囊壶菌中,至少对于α-1,3-1,6-甘露糖苷酶样蛋白是作为信号肽发挥功能。在一些实施方案中,分离的核酸分子包含seqidno:66。

本发明也涉及包含α-1,3-1,6-甘露糖苷酶样信号肽氨基酸序列的分离的多肽。

在一些实施方案中,分离的核酸分子包含编码α-1,3-1,6-甘露糖苷酶样#1信号肽的多核苷酸序列。α-1,3-1,6-甘露糖苷酶样#1信号肽至少在破囊壶菌中,至少对α-1,3-1,6-甘露糖苷酶样#1蛋白能够具有信号靶向活性,并包括全长肽及其功能片段、融合肽和自然发生的α-1,3-1,6-甘露糖苷酶样#1信号肽的同源物。在一些实施方案中,α-1,3-1,6-甘露糖苷酶样#1信号肽具有seqidno:67代表的氨基酸序列。在一些实施方案中,分离的核酸分子包含编码含有seqidno:67功能性片段的分离的氨基酸序列的多核苷酸序列,所述功能性片段至少在破囊壶菌中,至少对于α-1,3-1,6-甘露糖苷酶样#1蛋白是作为信号肽发挥功能。在一些实施方案中,分离的核酸分子包含seqidno:68。

本发明也涉及包含α-1,3-1,6-甘露糖苷酶样#1信号肽氨基酸序列的分离的多肽。

在一些实施方案中,分离的核酸分子包含编码α-1,2-甘露糖苷酶样信号肽的多核苷酸序列。α-1,2-甘露糖苷酶样信号肽至少在破囊壶菌中,至少对α-1,2-甘露糖苷酶样蛋白能够具有信号靶向活性,并包括全长肽及其功能片段、融合肽和自然发生的α-1,2-甘露糖苷酶样信号肽的同源物。在一些实施方案中,α-1,2-甘露糖苷酶样信号肽具有seqidno:69代表的氨基酸序列。在一些实施方案中,分离的核酸分子包含编码含有seqidno:69功能性片段的分离的氨基酸序列的多核苷酸序列,所述功能性片段至少在破囊壶菌中,至少对于α-1,2-甘露糖苷酶样蛋白是作为信号肽发挥功能。在一些实施方案中,分离的核酸分子包含seqidno:70。

本发明也涉及包含α-1,2-甘露糖苷酶样信号肽氨基酸序列的分离的多肽。

在一些实施方案中,分离的核酸分子包含编码β-木糖苷酶样信号肽的多核苷酸序列。β-木糖苷酶样信号肽至少在破囊壶菌中,至少对β-木糖苷酶样蛋白能够具有信号靶向活性,并包括全长肽及其功能片段、融合肽和自然发生的β-木糖苷酶样信号肽的同源物。在一些实施方案中,β-木糖苷酶样信号肽具有seqidno:71代表的氨基酸序列。在一些实施方案中,分离的核酸分子包含编码含有seqidno:71功能性片段的分离的氨基酸序列的多核苷酸序列,所述功能性片段至少在破囊壶菌中,至少对于β-木糖苷酶样蛋白是作为信号肽发挥功能。在一些实施方案中,分离的核酸分子包含seqidno:72。

本发明也涉及包含β-木糖苷酶样信号肽氨基酸序列的分离的多肽。

在一些实施方案中,分离的核酸分子包含编码胡萝卜素合酶信号肽的多核苷酸序列。胡萝卜素合酶信号肽至少在破囊壶菌中,至少对胡萝卜素合酶蛋白能够具有信号靶向活性,并包括全长肽及其功能片段、融合肽和自然发生的胡萝卜素合酶信号肽的同源物。在一些实施方案中,胡萝卜素合酶信号肽具有seqidno:73代表的氨基酸序列。在一些实施方案中,分离的核酸分子包含编码含有seqidno:73功能性片段的分离的氨基酸序列的多核苷酸序列,所述功能性片段至少在破囊壶菌中,至少对于胡萝卜素合酶蛋白是作为信号肽发挥功能。在一些实施方案中,分离的核酸分子包含seqidno:74。

本发明也涉及包含胡萝卜素合酶信号肽氨基酸序列的分离的多肽。

在一些实施方案中,分离的核酸分子包含编码sec1蛋白(“sec1”)信号肽的多核苷酸序列。sec1信号肽至少在破囊壶菌中,至少对sec1蛋白能够具有信号靶向活性,并包括全长肽及其功能片段、融合肽和自然发生的sec1信号肽的同源物。在一些实施方案中,sec1信号肽由seqidno:37代表。在一些实施方案中,分离的核酸分子包含编码含有seqidno:37功能性片段的分离的氨基酸序列的多核苷酸序列,所述功能性片段至少在破囊壶菌中,至少对于sec1蛋白是作为信号肽发挥功能。在一些实施方案中,分离的核酸分子包含seqidno:38。

本发明也涉及包含sec1信号肽氨基酸序列的分离的多肽。

在一些实施方案中,分离的核酸分子可以包含与本文描述的任何启动子、终止子和/或信号肽序列是至少90%、95%、96%、97%、98%、或99%相同的启动子序列、终止子序列、和/或信号肽序列。

在一些实施方案中,分离的核酸分子包含orfc启动子、ef1短启动子、ef1长启动子、60s短启动子、60s长启动子、sec1启动子、pksorfc终止子区、编码na/pi-iib2转运蛋白信号肽的序列、或编码sec1转运蛋白信号肽的序列,上述序列与编码异源多肽的核酸序列的5’端可操作地连接。重组载体(包括但不限于表达载体)、表达盒、和宿主细胞也可以包含orfc启动子、ef1短启动子、ef1长启动子、60s短启动子、60s长启动子、sec1启动子、pksorfc终止子区、编码na/pi-iib2转运蛋白信号肽的序列、或编码sec1转运蛋白信号肽的序列,上述序列与编码异源多肽的核酸序列的5’端可操作地连接。

如本文所使用的,除非另有说明,百分比(%)同一性(和%同一性)涉及一种同源性评估,其是如下进行的:(1)blast2.0basicblast同源性搜索,其中使用blastp进行氨基酸搜索和使用blastn进行核酸搜索,均使用标准缺省参数,其中缺省对查询序列进行低复杂性区(lowcomplexityregions)过滤(参见,例如altschul,s.等,nucleicacidsres.25:3389-3402(1997),本文引入其全部内容作为参考);(2)使用下文所述的参数进行blast2比对;(3)和/或psi-blast(position-specificiteratedblast),使用标准缺省参数。需要注意,由于blast2.0basicblast和blast2之间标准参数有一些差异,所以两个具体的序列可能在使用blast2程序时被识别为具有显著同源性,而用其中一个序列作为查询序列在blast2.0basicblast中进行搜索时,第二个序列可能不会被确定为最匹配的结果之一。此外,psi-blast提供了一种自动、易用的“谱”(“profile”)搜索形式,这是一种灵敏的寻找序列同源物的方法。程序首先执行有缺口的(gapped)blast数据库搜索。psi-blast程序使用来源于任何返回的显著性匹配(significantalignments)的信息构建位置特异性评分矩阵(position-specificscorematrix),其取代查询序列用于下一轮数据库搜索。因此,可以理解,百分比同一性可使用这些程序中的任何一种来确定。

两个具体的序列可以使用blast2序列相互比对,如例如tatusova和madden,femsmicrobiollett.174:247-250(1999)所述的那样,本文引入其全部内容作为参考。在blastp或blastn中进行blast2序列比对,使用blast2.0算法在两个序列之间进行有缺口的blast搜索(gappedblast)(blast2.0),允许在所得比对中引入缺口(缺失和插入)。在一些实施方案中,blast2序列比对使用如下的标准缺省参数进行。

对于blastn,使用0blosum62矩阵:

匹配加分(rewardformatch)=1

错配罚分(penaltyformismatch)=-2

开放缺口(opengap)(5)和延伸缺口(extensiongap)(2)罚分

缺口(gap)x_脱落(dropoff)(50)期望(expect)(10)

字长(wordsize)(11)过滤(filter)(on)

对于blastp使用0blosum62矩阵:

开放缺口(11)和延伸缺口(1)罚分

缺口x_脱落(50)期望(10)字长(3)过滤(on)。

如本文使用的,杂交条件是指使用核酸分子鉴定相似的核酸分子的标准杂交条件。参见,例如sambrookj和russelld,molecularcloning:alaboratorymanual,第3版.coldspringharborlaboratorypress,coldspringharbor,newyork,本文其全部内容作为参考。此外,在例如meinkoth等,anal.biochem.138,267-284(1984)中公开了计算的合适杂交和洗涤条件,以实现允许不同程度的核苷酸错配的杂交的公式,本文其全部内容作为参考。本领域技术人员可以使用meinkoth等中的公式,例如,计算合适的杂交和洗涤条件,以实现特定的核苷酸错配水平。这些条件会根据所形成的是dna∶rna还是dna∶dna杂交体而变化。dna∶dna杂交体算得的解链温度比dna∶rna杂交体低10℃。在具体的实施方案中,对于dna∶dna杂交体的严紧杂交条件包括在20℃到35℃之间(低严紧度),在28℃到40℃之间(更严紧的),在35℃到45℃之间(更严紧的)的温度下,在6xssc(0.9mna+)的离子强度下进行杂交,以及合适的洗涤条件。在具体的实施方案中,对于dna∶rna杂交体的严紧杂交条件包括在30℃到45℃之间,在38℃到50℃之间,在45℃到55℃之间的温度下,在6xssc(0.9mna+)的离子强度下进行杂交,以及相似的严紧洗涤条件。这些值是基于大于约100个核苷酸的分子、0%甲酰胺、以及大约40%的g+c含量的解链温度的计算结果。或者,tm可以根据sambrook等提出的那样凭经验计算。一般地,洗涤条件应尽可能严紧,并应适合于所选的杂交条件。例如,杂交条件可包括盐和温度条件的组合,其中温度条件比特定杂交体的计算tm低大约20-25℃,而洗涤条件通常包括盐和温度条件的组合,其中温度条件比特定杂交体的计算tm低大约12-20℃。适合于dna:dna杂交体使用的杂交条件的一个例子包括在42℃在6xssc(50%甲酰胺)中杂交2-24小时,随后进行洗涤步骤,其包括在室温下在2xssc中洗涤1次或多次,随后在更高温度和更低离子强度下进行进一步的洗涤(例如,在37℃和0.1x-0.5xssc中进行至少一次洗涤,随后在68℃和0.1x-0.5xssc中进行至少一次洗涤)。

异源多肽

本文使用的术语“异源”指非天然存在于微藻宿主细胞中的序列。在一些实施方案中,本发明的重组宿主细胞产生的异源多肽包括但不限于治疗性蛋白。本文使用的术语“治疗性蛋白”包括在动物或人中用于治疗或预防疾病、状况或失调的蛋白。

在某些实施方案中,治疗性蛋白包括但不限于生物活性蛋白,例如酶、抗体、或抗原蛋白。

在一些实施方案中,本发明的重组宿主细胞产生的异源多肽包括但不限于工业酶。工业酶包括但不限于用于产品,包括食品、医疗、化学、机械和其他工业产品的生产、配制、保存、营养动员、或加工的酶。

在一些实施方案中,本发明的重组宿主细胞产生的异源多肽包括营养缺陷标记、显性选择标记(例如,降解抗生素活性的酶),或另一种参与转化选择的蛋白、作为报道子发挥功能的蛋白、参与蛋白糖基化的酶、和参与细胞代谢的酶。

在一些实施方案中,本发明的重组宿主细胞产生的异源多肽包括选自下组的病毒蛋白:h或ha(血凝素)蛋白、n或na(神经氨酸酶)蛋白、f(融合)蛋白、g(糖蛋白)蛋白、e或env(包膜)蛋白、gp120(120kda糖蛋白)、和gp41蛋白(41kda糖蛋白)。在一些实施方案中,本发明的重组宿主细胞产生的异源多肽是病毒基质蛋白。在一些实施方案中,本发明的重组宿主细胞产生的异源多肽是选下组的病毒基质蛋白:m1、m2(膜通道蛋白)、gag及其组合。在一些实施方案中,ha、na、f、g、e、gp120、gp41或基质蛋白来自病毒来源,如流感病毒或麻疹病毒。

流感是由于呼吸道病毒导致人类死亡的首要原因。常见的症状包括发烧、喉咙痛、呼吸急促、和肌肉酸痛等。流感病毒是从被感染的哺乳动物和鸟类细胞的质膜出芽的包膜病毒。根据核蛋白和基质蛋白抗原的存在,将它们分为甲、乙或丙型。甲型流感病毒根据存在的ha和na表面糖蛋白的组合可以进一步划分为亚型。ha是抗原性糖蛋白,并在病毒与其感染的细胞的结合中发挥功能。na从宿主细胞上的聚糖链和病毒表面蛋白去除末端的唾液酸残基,从而防止病毒聚集并利于病毒的运动。

流感病毒ha蛋白是同源三聚体,在每个单体的球状头部上具有受体结合口袋,而流感病毒na蛋白是四聚体,在每个单体的头部具有酶活位点。目前,认可了16个ha(hl-h16)和9个na(n1-n9)亚型。每种甲型流感病毒呈现一种类型的ha和一种类型的na糖蛋白。一般来说,每个亚型具有物种特异性,例如,已知所有的ha和na亚型感染鸟类,而只有h1、h2、h3、h5、h7、h9、h10、n1、n2、n3和n7亚型已被证明感染人类。流感病毒是由其携带的ha和na的类型表征的,如h1n1、h5n1、h1n2、h1n3、h2n2、h3n2、h4n6、h5n2、h5n3、h5n8、h6n1、h7n7、h8n4、h9n2、h10n3、h11n2、h11n9、h12n5、h13n8、h15n8、h16n3等。亚型进一步分为株;每个遗传上不同的病毒分离株通常被认为是一个单独的株系,例如,甲型流感/puertorico/8/34/mountsinai(h1n1)和甲型流感/vietnam/1203/2004(h5n1)。在本发明的某些实施方案中,ha来自流感病毒,例如ha来自甲型流感、乙型流感、或者甲型流感的亚型,其选自下组:h1、h2、h3、h4、h5、h6、h7、h8、h9、h10、h11、h12、h13、h14、h15、和h16。在另一个实施方案中,ha来自甲型流感病毒,其选自下组:h1、h2、h3、h5、h6、h7和h9。在一个实施方案中,ha来自流感h1n1亚型。

流感病毒ha蛋白在细胞中作为单一的蛋白翻译,其切除信号肽后是约62kda的蛋白(通过概念翻译),称为ha0(即血凝素前体蛋白)。为了病毒活化,血凝素前体蛋白(ha0)必须由胰蛋白酶样丝氨酸内切蛋白酶在特定位点切割,通常是由蛋白的ha1和ha2多肽间的一个单一的碱性氨基酸(通常是精氨酸)编码。在a/puertorico/8/34株的特定实例中,这种切割发生于氨基酸343位的精氨酸和氨基酸344位的甘氨酸之间。切割后,两个二硫键-键合的蛋白多肽产生蛋白亚基的成熟形式,作为融合及进而病毒感染所必需的构象变化的先决条件。

在一些实施方案中,本发明的ha蛋白是经切割的,例如,将本发明的ha0蛋白切割成ha1和ha2。在一些实施方案中,在微藻宿主细胞,如裂殖壶菌属中表达ha蛋白,结果ha0蛋白适当的切割为功能性ha1和ha2多肽,而无需添加外源蛋白酶。非脊椎动物表达系统中的这种不添加外源蛋白酶的血凝素切割之前一直没有被证实过。

病毒f蛋白可以在c-端附近包括单次跨膜结构域。可以将f蛋白在furin切割位点(氨基酸109)处分为两个肽。称为f2的蛋白第一部分包含完整f蛋白的n-端部分。含有f蛋白c-端部分的病毒f蛋白的其余部分称为f1。f1和/或f2区可以单独融合至异源序列,例如编码异源信号肽的序列。包含病毒f蛋白的f1和f2部分的载体可以单独表达或联合表达。表达完整f蛋白的载体可以与会在furin切割位点切割蛋白的furin酶共表达。或者,可以用编码不同蛋白酶识别并切割的其他蛋白酶切割位点的序列替换编码f蛋白furin切割位点的序列。包含替代的蛋白酶切割位点的f蛋白可以与相应的识别和切割替代蛋白酶切割位点的蛋白酶共表达。

在一些实施方案中,ha、na、f、g、e、gp120、gp41或基质蛋白是其全长蛋白、片段、变体,衍生物、或类似物。在一些实施方案中,ha、na、f、g、e、gp120、gp41或基质蛋白是包含与代表性病毒蛋白的已知序列是至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%相同或100%相同的氨基酸序列的多肽,或其多核苷酸编码上述多肽,其中所述多肽是通过特异性结合已知序列的抗体可识别的。例如ha序列可以是全长ha蛋白,其基本上由胞外(ecd)结构域、跨膜(tm)结构域和胞质(cyt)结构域组成;或是完整ha蛋白的片段,其基本上由ha1多肽和ha2多肽(例如由切割全长ha产生)组成;或是完整ha蛋白的片段,其基本上由ha1多肽、ha2多肽和tm结构域组成;或是完整ha蛋白的片段,其基本上由cyt结构域组成;或是完整ha蛋白的片段,其基本上由tm结构域组成;或是完整ha蛋白的片段,其基本上由ha1多肽组成;或是完整ha蛋白的片段,其基本上由ha2多肽组成。ha序列也可以包括ha1/ha2切割位点。ha1/ha2切割位点可以位于ha1和ha2多肽之间,也可以相对于其他多核苷酸或多肽构建体序列按任何顺序安排。病毒蛋白可以来自病原性病毒株。

在一些实施方案中,本发明的异源多肽是包含全长ha、na、f、g、e、gp120、gp41或基质蛋白,或其片段、变体、衍生物、或类似物的融合多肽。

在一些实施方案中,异源多肽是包含ha0多肽、ha1多肽、ha2多肽、tm结构域、其片段和其组合的融合多肽。在一些实施方案中,异源多肽包含来自不同亚型或不同病毒株,例如流感病毒的不同亚型或病毒株的两个或两个以上的ha1多肽、ha2多肽、tm结构域、或其片段的组合。在一些实施方案中,异源多肽包含来自不同病毒,例如流感病毒和麻疹病毒的两个或两个以上的ha1多肽、ha2多肽、tm结构域、或其片段的组合。

可以通过测量红细胞的凝集确定血凝活性。血凝和红细胞随后的沉淀是血凝素被吸附到红细胞表面的结果。红细胞的集群,裸眼分辨为堆、肿块、和/或团块,在血凝过程中形成。血凝是由红细胞中存在的凝集原与含有凝集素的血浆相互作用导致的。每种凝集原具有相应的凝集素。血凝反应用于,例如,确定病毒的抗血清活性或类型。由红血细胞上的因子的直接作用导致的主动血凝和由针对红血细胞先前吸附的抗原的特异性的抗血清引起的被动血凝之间具有区别。可以测量样品中血凝活性的量,例如,以血凝活性单位(hau)。血凝可能由例如,结核、鼠疫和兔热病的致病细菌的多糖,大肠杆菌的多糖,和流感病毒、流行性腮腺炎病毒、白鼠肺炎病毒、猪和马流感病毒、天花病毒疫苗、黄热病病毒、和其他血凝诱导性疾病病毒引起。

微藻胞外体

本发明也涉及微藻胞外体,其中所述胞外体与质膜是不连续的。“与质膜是不连续的”是指微藻胞外体没有与宿主细胞的质膜相连接。在一些实施方案中,胞外体是膜。在一些实施方案中,胞外体是囊泡、胶束、膜片段、膜聚集体、或其混合物。本文使用的术语“囊泡”指包含脂双层(单位膜)的封闭结构,例如细胞膜形成的泡状结构。本文使用的术语“膜聚集体”指作为单一物质形成关联的任何膜结构的集合。膜聚集体可以是单一类型膜结构的集合,例如但不限于膜囊泡的集合,或者也可以是多于一种类型膜结构的集合,例如但不限于,至少囊泡、胶束或膜片段中两种的集合。本文使用的术语“膜片段”指能够包含本文所述的异源多肽的膜的任何部分。在一些实施方案中,膜片段是膜片层。在一些实施方案中,胞外体是囊泡和膜片段的混合物。在一些实施方案中,胞外体是囊泡。在一些实施方案中,囊泡是崩解的囊泡。在一些实施方案中,囊泡是病毒样颗粒。在一些实施方案中,胞外体是包含宿主细胞所产生的天然和异源多肽的生物材料的聚集体。在一些实施方案中,胞外体是天然和异源多肽的聚集体。在一些实施方案中,胞外体是异源多肽的聚集体。

在一些实施方案中,微藻宿主细胞的质外网在微藻宿主细胞培养过程中变为片段化,导致微藻胞外体的形成。在一些实施方案中,通过微藻宿主细胞质外网的片段化形成微藻胞外体,片段化是在搅拌的培养基中流体动力物理剪切质外网膜延伸物的结果。

在一些实施方案中,微藻胞外体是通过挤压微藻膜形成的,例如但不限于挤压质膜、质外网、类伪根、或其组合,其中挤出膜使其变得与质膜分离。

在一些实施方案中,微藻胞外体是具有不同直径的囊泡或胶束、具有不同长度的膜片段,或其组合。

在一些实施方案中,胞外体是具有10nm-2500nm,10nm-2000nm,10nm-1500nm,10nm-1000nm,10nm-500nm,10nm-300nm,10nm-200nm,10nm-100nm,10nm-50nm,20nm-2500nm,20nm-2000nm,20nm-1500nm,20nm-1000nm,20nm-500nm,20nm-300nm,20nm-200nm,20nm-100nm,50nm-2500nm,50nm-2000nm,50nm-1500nm,50nm-1000nm,50nm-500nm,50nm-300nm,50nm-200nm,50nm-100nm,100nm-2500nm,100nm-2000nm,100nm-1500nm,100nm-1000nm,100nm-500nm,100nm-300nm,100nm-200nm,500nm-2500nm,500nm-2000nm,500nm-1500nm,500nm-1000nm,2000nm或更小,1500nm或更小,1000nm或更小,500nm或更小,400nm或更小,300nm或更小,200nm或更小,100nm或更小,或50nm或更小的直径的囊泡。

破囊壶菌宿主细胞产生微藻胞外体的非限制性发酵条件如下表1所示。

表1:容器培养基

高压灭菌后(金属)

高压灭菌后(维生素)

**过滤灭菌并在高压灭菌后加入

高压灭菌后(碳)

葡萄糖g/l20.05-150,10-100,或20-50

氮给料:

成分浓度

nh4ohml/l23.65-150,10-100,15-50

生产微藻胞外体的常用培养条件包括下列:

ph:5.5-9.5,6.5-8.0,或6.3-7.3

温度:15℃-45℃,18℃-35℃或20℃-30℃

溶解氧:0.1%-100%饱和,5%-50%饱和,或10%-30%饱和

受控的葡萄糖:5g/l-100g/l,10g/l-40g/l,或15g/l-35g/l。

在一些实施方案中,微藻胞外体产自网粘菌门宿主细胞。在一些实施方案中,微藻胞外体产自网粘菌目宿主细胞。在一些实施方案中,微藻胞外体产自破囊壶菌宿主细胞。在一些实施方案中,微藻胞外体产自裂殖壶菌属或破囊壶菌属。

本发明也涉及包含异源多肽的微藻胞外体,其中所述胞外体与微藻宿主细胞的质膜是不连续的。

在一些实施方案中,本发明的微藻胞外体包含的多肽也与微藻宿主细胞的质膜相关联。在一些实施方案中,关联微藻宿主细胞质膜的多肽包括天然膜多肽、异源多肽及其组合。

在一些实施方案中,异源多肽包含于微藻胞外体中。

在一些实施方案中,异源多肽包含膜结构域。本文所述的术语“膜结构域”是指使多肽靶向膜和/或允许多肽保持与膜相关联的多肽内的任何结构域,而且包括但不限于,跨膜结构域(例如单次或多次跨膜区)、完整单境域(integralmonotopicdomain)、信号锚序列、er信号序列、n-端或内部或c-端终止转移信号、糖基磷脂酰肌醇锚,及其组合。膜结构域可以位于多肽的任何位置,包括多肽的n-端、c-端或中间。膜结构域可以与永久或暂时将多肽附着于膜相关。在一些实施方案中,膜结构域可以从膜蛋白上裂解。在一些实施方案中,膜结构域是信号锚序列。在一些实施方案中,膜结构域是如图13所示的任何信号锚序列或其衍生的锚序列。在一些实施方案中,膜结构域是病毒信号锚序列。

在一些实施方案中,异源多肽是天然包含膜结构域的蛋白。在一些实施方案中,异源多肽不是天然包含膜结构域而是已通过重组与膜结构域融合。在一些实施方案中,异源多肽是融合膜结构域的其他(otherwise)可溶的蛋白。

在一些实施方案中,膜结构域是微藻膜结构域。在一些实施方案中,膜结构域是网粘菌门膜结构域。在一些实施方案中,膜结构域是破囊壶菌膜结构域。在一些实施方案中,膜结构域是裂殖壶菌属或破囊壶菌属膜结构域。在一些实施方案中,膜结构域包括来自裂殖壶菌属α-1,3-甘露糖基-β-1,2-glcnac-转移酶-i-样蛋白#1(seqidno:78),裂殖壶菌属β-1,2-木糖基转移酶样蛋白#1(seqidno:80),裂殖壶菌属β-1,4-木糖苷酶样蛋白(seqidno:82),或裂殖壶菌属半乳糖基转移酶样蛋白#5(seqidno:84)的信号锚序列。

在一些实施方案中,异源多肽是膜蛋白。本文使用的术语“膜蛋白”指与细胞膜相关或相结合的任何蛋白。例如,如chou和elrod,proteins:structure,functionandgenetics34:137-153(1999)描述的,膜蛋白可分为几种基本类型:

1)1型膜蛋白:这些蛋白在成熟蛋白中具有单跨膜结构域。n-末端在胞外,而c-末端在胞质内。蛋白n-末端特征性地具有典型的信号肽序列以引导蛋白进入内质网。这些蛋白细分为ia型(含可切割信号序列)和ib型(无可切割信号序列)。i型膜蛋白的例子包括但不限于:流感ha、胰岛素受体、血型糖蛋白、ldl受体、和病毒g蛋白。

2)ii型膜蛋白:对于这些单膜结构域蛋白,c-末端在胞外,而n-末端在胞质内。n-末端可以具有信号锚序列。这种蛋白类型的例子包括但不限于:流感神经氨酸酶、高尔基体半乳糖基转移酶、高尔基体唾液酸转移酶、蔗糖酶-异麦芽糖酶前体、去唾液酸糖蛋白受体和转铁蛋白受体。

3)多次跨膜蛋白(multipasstransmembraneprotein):在i型和ii型膜蛋白中,多肽跨越脂双层1次,而在多次跨膜蛋白中多肽穿过膜多次。多次跨膜蛋白也细分为iiia型和iiib型。iiia型蛋白具有可切割的信号序列。iiib型蛋白将其氨基末端暴露在膜的外表面,但不具有可切割的信号序列。iiia型蛋白包括但不限于光反应中心的m和l肽。iiib型蛋白包括但不限于大肠杆菌细胞色素p450和前导肽酶。多次跨膜蛋白的其他例子是膜转运蛋白,如糖转运蛋白(葡萄糖、木糖),和离子转运蛋白。

4)脂质链锚定的膜蛋白:这些蛋白借由一个或更多共价连接的脂肪酸链或其他类型的称为异戊二烯基的脂质链与膜双层相连。

5)gpi锚定的膜蛋白:这些蛋白通过糖基磷脂酰肌醇(gpi)锚与膜结合。

6)外周膜蛋白:这些蛋白通过与其他膜蛋白的非共价相互作用间接与膜结合。

在一些实施方案中,膜结构域是ha蛋白的膜结构域。

在一些实施方案中,异源多肽包含来自对应于异源多肽的野生型多肽的天然信号锚序列或天然膜结构域。在一些实施方案中,异源多肽与同天然信号锚序列或天然膜结构域不同的异源信号锚序列或异源膜结构域融合。在一些实施方案中,异源多肽包含异源信号锚序列或异源膜结构域,然而对应于异源多肽的野生型多肽不包含任何信号锚序列或膜结构域。在一些实施方案中,异源多肽包含裂殖壶菌属信号锚序列。在一些实施方案中,异源多肽包含ha膜结构域。在一些实施方案中,异源多肽是治疗性多肽。

在一些实施方案中,膜结构域是来自图14所示的任何i型膜蛋白的膜结构域,或由其衍生的膜结构域。在一些实施方案中,本发明的异源多肽是图14所示的任何膜蛋白c-末端内跨膜区的融合多肽。在一些实施方案中,通过以来自病毒蛋白的相似区取代进一步修饰跨膜区的c-末端侧。

在一些实施方案中,异源多肽是糖蛋白。在一些实施方案中,异源多肽具有特征为在网粘菌门细胞中表达的糖基化模式。在一些实施方案中,异源多肽具有特征为在破囊壶菌细胞中表达的糖基化模式。在一些实施方案中,在微藻宿主细胞中表达的异源多肽是具有比酵母或大肠杆菌中产生的蛋白更紧密类似于哺乳动物糖基化模式的糖基化模式的糖蛋白。在一些实施方案中,糖基化模式包括n-联糖基化模式。在一些实施方案中,糖蛋白包含高甘露寡糖。在一些实施方案中,糖蛋白基本上不含唾液酸。本文使用的术语“基本上不含唾液酸”是指低于10%、低于9%、低于8%、低于7%、低于6%、低于5%、低于4%、低于3%、低于2%、或低于1%的唾液酸。在一些实施方案中,糖蛋白中不存在唾液酸。

在一些实施方案中,包含异源多肽的本发明的微藻胞外体以商业或工业规模生产。

本发明还涉及包含如本文所述的本发明的任何微藻胞外体和含水液体载体的组合物。

在一些实施方案中,从生长微藻宿主细胞的培养基或发酵培养基中回收包含异源多肽的本发明的微藻胞外体。在一些实施方案中,本发明的微藻胞外体可以“基本上纯”的形式分离。如本文所使用,“基本上纯”指允许有效使用微藻胞外体作为商业或工业产品的纯度。

本发明也涉及一种生产包含异多肽的微藻胞外体的方法,该方法包括:(a)在微藻宿主细胞中表达异源多肽,其中所述异源多肽包含膜结构域,和(b)在足以产生包含所述异源多肽的微藻胞外体的培养条件下培养宿主细胞,其中所述胞外体与宿主细胞质膜是不连续的。

本发明也涉及一种生产包含微藻胞外体和异源多肽的组合物的方法,该方法包括:(a)在微藻宿主细胞中表达异源多肽,其中所述异源多肽包含膜结构域,和(b)在足以产生包含所述异源多肽的微藻胞外体的培养条件下培养宿主细胞,其中所述胞外体与宿主细胞质膜是不连续的,其中所述组合物是作为包含所述胞外体的培养上清生成的。在一些实施方案中,该方法进一步包括去除培养上清并在含水液体载体中重悬胞外体。在一些实施方案中,组合物用作疫苗。

包含病毒多肽的微藻胞外体

病毒包膜蛋白是形成病毒颗粒外层的膜蛋白。这些蛋白的合成利用膜结构域,例如细胞靶向信号,以指导蛋白到质膜上。包膜外壳蛋白分为几个主要的组,其包括但不限于:h或ha(血凝素)蛋白、n或na(神经氨酸酶)蛋白、f(融合)蛋白、g(糖蛋白)蛋白、e或env(包膜)蛋白、gp120(120kda糖蛋白)和gp41(41kda糖蛋白)。结构蛋白通常称作“基质”蛋白,发挥功能以帮助稳定病毒。基质蛋白包括但不限于,m1、m2(膜通道蛋白)和gag。包膜和基质蛋白均可以参与病毒的装配和功能。例如,单独或与病毒基质蛋白结合表达病毒包膜外壳蛋白可以导致病毒样颗粒(vlps)的形成。

病毒疫苗通常是从与为了预防的疾病对应的病毒培养物的灭活或减毒制备物制备的,而且通常留有病毒物质,例如病毒遗传物质。一般说来,病毒是从与野生病毒可能感染的细胞类型相同或相似的细胞培养而来。这种细胞培养价格昂贵而且往往难以形成规模。为了解决此问题,某些特定的病毒蛋白抗原取而代之通过转基因宿主表达,这可以使培养成本更低并且更适于形成规模。然而,病毒蛋白通常是存在于病毒包膜的完整的膜蛋白。由于膜蛋白的大量产生是非常困难的,通常修饰这些病毒蛋白以产生蛋白的可溶形式。这些病毒包膜蛋白是建立宿主免疫的关键,但是在异源系统中全部或部分地表达病毒包膜蛋白的大量尝试仅能获得有限的成功,可能是因为为了有足够的免疫原性,在病毒包膜范围内的蛋白必须呈递给免疫系统。因此,需要新的异源表达系统,例如本发明的表达系统,其能够规模化并能够呈递病毒抗原,而除了所需的病毒抗原外,不含或基本上不含有关联的病毒物质,例如病毒遗传物质。本文使用的术语“基本上不含有关联的病毒物质”指关联的病毒物质低于10%、低于9%、低于8%、低于7%、低于5%、低于4%、低于3%、低于2%、或低于1%。

在一些实施方案中,微藻胞外体包含异源多肽,异源多肽是选自下组的病毒糖蛋白:h或ha(血凝素)蛋白、n或na(神经氨酸酶)蛋白、f(融合)蛋白、g(糖蛋白)蛋白、e或env(包膜)蛋白、gp120(120kda糖蛋白)和gp41(41kda糖蛋白),及其组合。在一些实施方案中,微藻胞外体包含是病毒基质蛋白的异源多肽。在一些实施方案中,微藻胞外体包含选自下组的病毒基质蛋白:m1、m2(膜通道蛋白)、gag、及其组合。在一些实施方案中,微藻胞外体包含选自下组的两种或多种病毒蛋白的组合:h或ha(血凝素)蛋白、n或na(神经氨酸酶)蛋白、f(融合)蛋白、g(糖蛋白)蛋白、e或env(包膜)蛋白、gp120(120kda糖蛋白)、gp41(41kda糖蛋白),以及病毒基质蛋白。

在一些实施方案中,本发明的微藻胞外体包含缺乏唾液酸的病毒糖蛋白,否则唾液酸可能会干扰蛋白的积累或功能。

在一些实施方案中,微藻胞外体是vlp。

本文使用的术语“vlp”是指形态与感染性病毒相似,当病毒蛋白过表达时,能够通过病毒蛋白自发的自组装形成的颗粒。vlp已经在酵母、昆虫和哺乳动物细胞中产生,并表现为亚单位疫苗的有效和更安全的类型,因为它们模拟病毒颗粒的整体结构却不含有传染性的遗传物质。这种类型的疫苗递送系统已经在刺激细胞和体液应答中取得成功。

对副粘病毒的研究表明,当多种病毒蛋白共表达时,产生的vlp在大小和密度上与真正的病毒体是非常相似的。对于vlp的形成,仅仅表达基质蛋白(m)是必要且足够的。在副粘病毒中,仅仅表达hn导致vlp的形成效率非常低。其他蛋白单独不足以使ndv出芽。hn是ii型膜糖蛋白,作为穗状四聚体存在于病毒体和受感染的细胞表面。参见,例如,collinspl和mottetg,j.virol.65:2362-2371(1991);mirzaam等,j.biol.chem.268:21425-21431(1993);和ngd等,j.cell.biol.109:3273-3289(1989)。hn和np蛋白并入vlp是由与m蛋白的相互作用引起的。参见,例如,pantua等,j.virology80:11062-11073(2006)。

乙型肝炎病毒(hbv)或人类乳头状瘤病毒(hpv)的vlp是简单的vlp,无包膜,并且是通过表达一种或两种衣壳蛋白产生的。更复杂的非包膜vlp包括例如为蓝舌病开发的vlp等颗粒。在此情况下,在昆虫细胞中同时表达4种来自蓝舌病毒(btv,呼肠孤病毒科(reoviridae))的主要结构蛋白。来自具有脂质包膜的病毒的vlp也已产生(例如丙型肝炎和甲型流感)。也有vlp样结构,例如可以重复展示抗原表位的自组装多肽纳米颗粒(sapn)。这些已被用来设计潜在的疟疾疫苗。参见,例如,kabasa等,j.immunol.183(11):7268-7277(2009)。

因为具有与活减毒或灭活病毒相媲美的产生免疫的潜能,vlp具有显著的优势,并被认为具有高度的免疫原性,因为它们的颗粒性质,也因为它们以密集的重复阵列展示表面表位。例如,已经假设b细胞特异性地将具有间距的表位的抗原识别为外源的。参见bachman等,science262:1448(1993)。vlp也具有被认为大大促进树突状细胞和巨噬细胞摄取的颗粒大小。此外,20nm至200nm的颗粒自由扩散到淋巴结,而500至2000nm的颗粒则不能。至少有两个已批准的用于人类的vlp疫苗,乙型肝炎疫苗(hbv)和人类乳头状瘤病毒(hpv)。然而,基于病毒的vlp,例如基于杆状病毒的vlp,往往包含大量的病毒物质,其需要从vlp进一步的纯化。

在一些实施方案中,微藻胞外体是包含病毒糖蛋白的vlp,糖蛋白选自下组:h或ha(血凝素)蛋白、n或na(神经氨酸酶)蛋白、f(融合)蛋白、g(糖蛋白)蛋白、e或env(包膜)蛋白、gp120(120kda糖蛋白)和gp41(41kda糖蛋白),及其组合。在一些实施方案中,微藻胞外体是包含病毒基质蛋白的vlp。在一些实施方案中,微藻胞外体是包含选自下组的病毒基质蛋白的vlp:m1、m2(膜通道蛋白)、gag、及其组合。在一些实施方案中,微藻胞外体是包含选自下组的两种或多种病毒蛋白的组合的vlp:h或ha(血凝素)蛋白、n或na(神经氨酸酶)蛋白、f(融合)蛋白、g(糖蛋白)蛋白、e或env(包膜)蛋白、gp120(120kda糖蛋白)、gp41(41kda糖蛋白),和病毒基质蛋白。

利用微藻胞外体的方法

在一些实施方案中,本发明的微藻胞外体可用作蛋白活性或功能的运载体。在一些实施方案中,蛋白活性或功能与存在于胞外体内部或胞外体上的异源多肽相关。在一些实施方案中,异源多肽是膜蛋白。在一些实施方案中,蛋白活性或功能与连接于存在于胞外体中的膜蛋白的多肽相关。在一些实施方案中,蛋白质是可溶的时没有功能,但是本发明的胞外体的一部分时有功能。在一些实施方案中,通过将糖捕获在囊泡内,包含糖转运蛋白(例如木糖、蔗糖、或葡萄糖转运蛋白)的微藻胞外体可用于消耗包含糖或其他低分子量溶质、痕量的糖的混合物的培养基,然后所述囊泡可以通过包括过滤或离心的各种方法分离。

本发明也包括本发明包含异源多肽的任何微藻胞外体及其组合物用于在动物或人类中从预防性治疗到对疾病的治疗应用。

术语“处理”和“治疗”指治疗性治疗和预防或防止性措施,其中目标是防止或缓解(减轻)不希望的生理状况、疾病或失调,或是获得有益或需要的临床结果。对于本发明目的,有益或需要的临床结果包括但不限于缓解或消除与某一病症、疾病或失调相关的症状或征兆;减轻某一病症、疾病或失调的程度;稳定某一病症、疾病或失调(即其中所述病症、疾病或失调不恶化);延迟所述病症、疾病或失调的发生或进展;改善所述病症、疾病或失调;缓和(无论部分或全部且无论可检测或不可检测)所述病症、疾病或失调;或者改良或者改进某一病症、疾病或失调。治疗包括引出临床上显著的反应而没有过多的副作用。治疗也包括与若不接受治疗的预期存活期相比,延长存活。

在一些实施方案中,从培养上清中回收本发明包含异源多肽的任何微藻胞外体以直接用作动物或人类疫苗。

在一些实施方案中,根据感兴趣的用途的要求,例如作为疫苗施用,纯化包含异源多肽的微藻胞外体。对于典型的人类疫苗应用,低速上清通过浓缩(例如切向流过滤接超滤)、层析分离(例如阴离子交换层析)、大小排阻层析、和灭菌(例如0.2μm过滤)进行初始纯化。在一些实施方案中,本发明的疫苗没有潜在致敏的遗留蛋白,例如,鸡蛋中的蛋白。在一些实施方案中,与胞外体相关的病毒多肽不同,包含本发明的胞外体的疫苗没有任何病毒物质。

根据公开的方法,施用包含异源多肽的微藻胞外体或其组合物可以,例如,通过肌肉内(i.m.)、静脉内(i.v.)、皮下(s.c.)、或肺内途径。施用的其他合适途径包括但不限于气管内、透皮、眼内、鼻内、吸入、腔内、导管内(例如到胰腺内)、和实质内(例如到任何组织)施用。透皮递送包括但不限于皮内(例如进入真皮或表皮)、透皮(例如,经皮)、和经粘膜施用(例如进入或通过皮肤或粘膜组织)。腔内施用包括但不限于施用到口腔、阴道、直肠、鼻、腹膜、和肠腔、以及鞘内(例如进入椎管)、室内(例如到脑室或心室)、房内(例如进入心房)和蛛网膜下(例如脑蛛网膜下腔)施用。

在一些实施方案中,本发明包括包含微藻胞外体的组合物,所述胞外体包含异源多肽。在一些实施方案中,组合物包括含水液体载体。在进一步的实施方案中,含水液体载体是培养上清。在一些实施方案中,本发明的组合物包括本领域已知的常规的药学上可接受的赋形剂,例如但不限于,人血清白蛋白、离子交换剂、氧化铝、卵磷脂、缓冲物质如磷酸盐、甘氨酸、山梨酸、山梨酸钾、和盐或电解质,例如硫酸鱼精蛋白,以及例如,remington:thescienceandpracticeofpharmacy,第21版.(2005)所列的赋形剂。

或者,本文所述的涉及微藻胞外体的任一实施方案可涉及壶菌胞外体。

本发明的组合物最有效的施用模式和剂量方案依赖于疾病的严重程度和进程、个体的健康和对治疗的反应和主治医生的判断。因此,组合物的剂量应对个体受试者边增加边观察(titrate)。然而,本发明的组合物的有效剂量可以从1mg/kg-2000mg/kg,1mg/kg-1500mg/kg,1mg/kg-1000mg/kg,1mg/kg-500mg/kg,1mg/kg-250mg/kg,1mg/kg-100mg/kg,1mg/kg-50mg/kg,1mg/kg-25mg/kg,1mg/kg-10mg/kg,500mg/kg-2000mg/kg,500mg/kg-1500mg/kg,500mg/kg-1000mg/kg,100mg/kg-2000mg/kg,100mg/kg-1500mg/kg,100mg/kg-1000mg/kg,或100mg/kg-500mg/kg。

已经一般描述了本发明,参考本文提供的例子可获得进一步的理解。这些例子仅出于说明目的而不是为了限制本发明。

实施例1

pcl0143表达载体的构建

合成了pcl0143表达载体并由dna2.0(menlopark,ca)通过sanger测序验证了序列。pcl0143载体包括驱动ha转基因的表达的来自裂殖壶菌属延伸因子-1基因(ef1)的启动子、接着ha转基因的orfc终止子(又称为pfa3终止子),和赋予对抗生素巴龙霉素抗性的选择标记盒。

seqidno:76(图1)编码甲型流感病毒(a/puertorico/8/34/mountsinai(h1n1))的ha蛋白。蛋白序列与genbank登录号aam75158匹配。在图16所示的裂殖壶菌属密码子选择表的指导下,对特定核酸序列seqidno:76进行密码子优化并由dna2.0合成以在裂殖壶菌属中表达。使用替代的信号肽也产生了一个构建体,其中去除了seqidno:76的信号肽(前51个核苷酸)并以编码裂殖壶菌属sec1信号肽的多核苷酸序列取代(seqidno:38)。

实施例2

裂殖壶菌属中产生的ha蛋白的表达和表征

使用裂殖壶菌属菌种atcc20888作为以biolistictm粒子轰击器(particlebombarder)(biorad,hercules,ca)转化pcl043载体的宿主细胞。简言之,裂殖壶菌属菌种atcc号20888的培养物生长于m2b培养基,m2b培养基由10g/l葡萄糖,0.8g/l(nh4)2so4,5g/lna2so4,2g/lmgso4·7h2o,0.5g/lkh2po4,0.5g/lkcl,0.1g/lcacl2·2h2o,0.1mmes(ph6.0),0.1%pb26金属,和0.1%pb26维生素(v/v)组成。pb26维生素由50mg/ml维生素b12,100μg/ml硫胺素和100μg/ml泛酸钙组成。pb26金属调整到ph4.5并由3g/lfeso4·7h2o,1g/lmncl2·4h2o,800mg/mlznso4·7h2o,20mg/mlcocl2·6h2o,10mg/mlna2moo4·2h2o,600mg/mlcuso4·5h2o,和800mg/mlniso4·6h2o组成。pb26贮液分别过滤灭菌后加入到高压灭菌后的培养液。在混合前,将葡萄糖、kh2po4和cacl2·2h2o与剩余的培养液成分分开各自高压灭菌,以防止盐析出和糖焦化。所有培养基成分均购自sigmachemical(st.louis,mo)。裂殖壶菌属培养物生长到对数期并以biolistictm粒子轰击器(biorad,hercules,ca)转化。biolistictm转化步骤与先前描述的基本相同(参见apt等,j.cell.sci.115(pt21):4061-9(1996)和美国专利第7,001,772号)。原代转化体在27℃温育2-6天后在含20g/l琼脂(vwr,westchester,pa),10μg/ml甲嘧磺隆(smm)(chemservice,westchester,pa)的固体m2b培养基上选择。

提取pcl0143原代转化体的gdna并纯化并用作pcr模板以检测转基因的存在。

用于裂殖壶菌属的基因组dna提取方案–裂殖壶菌属转化体在50ml培养基中生长。将25ml培养物无菌吸到50ml锥形瓶中并在3000xg离心4分钟形成沉淀。去除上清并将沉淀储存在-80℃直到使用。在50ml锥形瓶中将沉淀重悬于约4-5倍体积的含20mmtrisph8,10mmedta,50mmnacl,0.5%sds和100μg/ml蛋白酶k的溶液中。沉淀在50℃温和振荡温育1小时。溶解后,加入100μg/ml的核糖核酸酶a并将溶液在37℃振荡温育10分钟。接着,加入2体积的苯酚:氯仿:异戊醇并将溶液在室温下振荡1小时,然后在8000xg离心15分钟。将上清转移到一个干净的管中。再次,加入2体积的苯酚:氯仿:异戊醇并将溶液在室温下振荡1小时,然后在8000xg离心15分钟,并将上清转移到一个干净的管中。生成的上清中加入等体积的氯仿并将溶液在室温下振荡30分钟。溶液以8000xg离心15分钟并将上清转移到一个干净的管中。生成的上清中加入等体积的氯仿并将溶液在室温下振荡30分钟。溶液以8000xg离心15分钟并将上清转移到一个干净的管中。上清中加入0.3体积的3mnaoac和2倍体积100%etoh,轻轻摇晃几分钟。用无菌玻璃棒卷出dna并浸入70%etoh中1-2分钟。dna转入1.7ml离心管并允许其风干10分钟。dna中加入多至0.5ml预热的eb并将其在4℃放置过夜。

转基因裂殖壶菌属(用pcl043转化的)的冷冻贮存物在m50-20中生长到汇合,然后在50ml带挡板的摇瓶中在培养基中在27℃,200rpm增殖48小时(h),除非另有说明,所述培养基包含下列(每l):

用去离子水将体积调整到900ml并将ph调整到6.5(除非另有说明),然后在高温灭菌35分钟。然后加入过滤灭菌的葡萄糖(50g/l)、维生素(2ml/l)和痕量金属(2ml/l)到培养基中并将体积调整到1l。维生素溶液含有0.16g/l维生素b12,9.75g/ml硫胺素和3.33g/l泛酸钙。痕量金属溶液(ph2.5)含有1.00g/l柠檬酸,5.15g/lfeso4·7h2o,1.55g/lmncl2·4h2o,1.55g/lznso4·7h2o,0.02g/lcocl2·6h2o,0.02g/lna2moo4·2h2o,1.035g/lcuso4·5h2o,和1.035g/lniso4·6h2o。

将裂殖壶菌属培养物转移到50ml锥形管中并以3000×g或4500×g离心15分钟。参见图3。离心产生的上清,称为“无细胞上清”(cfs),用于免疫印迹分析和血凝素活性分析。

无细胞上清进一步以100,000×g超速离心1小时。参见图3。生成的包含ha蛋白的沉淀(不溶级分或“up”)重悬于pbs,ph7.4。将这种悬液在含15-60%蔗糖溶液的不连续蔗糖密度梯度上离心(120,000×g,18h,4℃)。见图3。包含ha蛋白的60%蔗糖级分用于肽序列分析、糖基化分析以及电子显微镜分析。

免疫印迹分析

通过免疫分析接标准免疫印迹程序验证了转基因裂殖壶菌属cl0143-9(“e”)的重组ha蛋白的表达。除非另有说明,以mopssds电泳缓冲液在还原条件下在12%的bis-tris凝胶(invitrogen,carlsbad,ca)上通过十二烷基硫酸钠聚丙烯酰胺凝胶电泳(sds–page)分离来自无细胞上清(cfs)的蛋白。然后用考马斯亮蓝(simplybluesafestain,invitrogen,carlsbad,ca)进行蛋白染色或转移到聚偏氟乙烯膜并用来自兔的抗-甲型流感/puertorico/8/34(h1n1)病毒的抗血清(1:1000稀释,惠赠自dr.albertd.m.e.osterhaus;fouchierr.a.m.等,j.virol.79:2814-2822(2005)),接着用偶联碱性磷酸酶的抗-兔igg(fc)二抗(1:2000稀释,#s3731,promegacorporation,madison,wi),探针检测ha蛋白的存在。然后使用制造商的方案(kpl,gaithersburg,md)用5-溴-4-氯-3-吲哚-磷酸盐/四氮唑蓝溶液(bcip/nbt)处理膜。生长于不同ph(5.5,6.0,6.5和7.0)和不同温度(25℃,27℃,29℃)的转基因裂殖壶菌属cl0143-9(“e”)的抗-h1n1免疫印迹如图4a所示。阴性对照(“c”)是裂殖壶菌属菌种atcc20888野生型菌株。在ph6.5在无细胞上清中检测重组ha蛋白(图4a)并最高在ph6.5,27℃(图4a)检测血凝素活性。在非还原和还原条件下生长于ph6.5,27℃的pcl0143-9(“e”)的考马斯亮蓝-染色凝胶(“考马斯”)和相应的抗-h1n1免疫印迹(“ib:抗-h1n1”)如图4b所示。阴性对照(“c”)是裂殖壶菌属菌种atcc20888野生型菌株。

ha活性

通过血凝活性测定评价裂殖壶菌属中产生的ha蛋白的活性。功能性ha蛋白显示出血凝活性,其易于通过标准血凝活性分析测定。简言之,在96孔微滴定板中制备了50μl低速上清在pbs中的2倍稀释物。然后每孔中加入等体积的在pbs,ph7.4中的约1%的鸡红细胞溶液(fitzgeraldindustries,acton,ma),接着在室温下温育30分钟。然后视觉分析凝集程度。血凝活性单位(hau)定义为导致孔中可见血凝的最高稀释度。

在转基因裂殖壶菌属cl0143-9(“e”)无细胞上清的512hau量级发现了典型的活性(图5a)。pbs(“-”)或与转基因株系以相同方式生长和制备的野生型裂殖壶菌属菌种atcc20888菌株(“c”)用来作为阴性对照并没有表现出任何血凝活性。来自甲型流感/vietnam/1203/2004(h5n1)(proteinsciencescorporation,meriden,ct,在pbs中1:1000稀释)的重组ha蛋白用来作为阳性对照(“+”)。

转基因裂殖壶菌属cl0143-9菌株无细胞上清的可溶和不溶级分通过血凝测定的分析表明ha蛋白主要在不溶级分中存在(图5b)。在可溶级分(“us”)的16hau量级中和不可溶级分(“up”)的256hau量级中发现了典型的活性。

2l培养物中ha蛋白的活性水平展示了与培养于恒定ph6.5的相同培养基中的摇瓶培养物相似的活性。

在另一项独立实验中,去除ha的天然信号肽并由裂殖壶菌属sec1信号肽(seqidno:37,由seqidno:38编码)替换。用此替代构建体获得的转基因裂殖壶菌属显示出与含有pcl0143构建体的转基因裂殖壶菌属相似的血凝素活性和重组蛋白分布(数据未显示)。

肽序列分析

来自无细胞上清的100,000xg离心生成的不溶级分(“up”)进一步在蔗糖密度梯度上分级,并且通过sds-page分离通过血凝活性分析(图6b)表明的包含ha蛋白的级分并用考马斯亮蓝染色或转移到pvdf并用兔的抗-h1n1抗血清进行免疫印迹(图6a),如上所述。从考马斯亮蓝染色的凝胶切下对应免疫印迹中交叉反应的条带(ha1和ha2)并进行肽序列分析。简言之,在50%乙醇,5%醋酸中清洗/脱色感兴趣的条带。然后在乙腈中脱水凝胶块,在(thermofisherscientific,inc.,waltham,ma)中干燥,并通过在50mm的碳酸氢铵中加入5μl10ng/μl的胰蛋白酶用胰蛋白酶消化并于室温温育过夜。用两等份30μl含5%甲酸的50%乙腈从聚丙烯酰胺提取形成的肽。合并这些提取物并在中蒸发到<10μl,然后在1%醋酸中重悬以调整到约30μl的终体积以供lc-ms分析。lc-ms系统是finnigantmltqtm线性离子阱质谱仪(thermoelectroncorporation,waltham,ma)。hplc柱是自包装的9cm×75μmphenomenexjupitertmc18反相毛细管层析柱(phenomenex,torrance,ca)。然后,注射μl体积的提取物并通过乙腈/0.1%甲酸梯度以0.25μl/分钟的流速从柱洗脱肽并引入到线上质谱仪的源中。在2.5kv操作微电喷雾离子源。使用选择性反应(srm)实验分析消化物,其中在lc实验整个过程中质谱片段化一系列m/z比。然后将感兴趣的肽的片段化模式用于产生色谱图。确定每个肽的峰面积并以内标均一化。在此分析中使用的内标是在研究的样本之间具有不变的丰度的蛋白。通过比较每个蛋白均一化的峰比值确定两个系统之间的最终比较。然后对ncbi数据库搜索碰撞-诱导的解离谱。通过覆盖蛋白质序列超过42%的共27个肽确定了ha蛋白。测序的特定的肽在图7中以粗体突出显示。更具体地,通过总共17个肽确定ha1和通过总共9个肽确定ha2。这与在位置397之前截短的han-端多肽符合。在整个ha蛋白氨基酸序列中显示了对于ha1和ha2而言确定的肽的布置。ha中推定的切割位点位于氨基酸343和344之间(以r^g表示)。在氨基酸402开始的斜体肽序列与ha2多肽相关但出现于在ha1中鉴定的肽中,可能是由于在ha1切下的带中痕量携带ha2肽。参见,例如,wright等,bmcgenomics10:61(2009)的图3。

糖基化分析

通过酶处理评估ha蛋白上聚糖的存在。转基因裂殖壶菌属“cl0143-9”的60%蔗糖级分使用制造商的方案(newenglandbiolabs,ipswich,ma)用endoh或pngasef消化。然后通过在用mopssds电泳缓冲液的12%bis-tris凝胶(invitrogen,carlsbad,ca)上的sds-page分离蛋白,接着用考马斯亮蓝(“考马斯”)染色或通过用抗-h1n1抗血清(“ib:抗-h1n1”)(图8)的免疫印迹时,预期的流动性偏移来确定聚糖的去除。酶处理的阴性对照为未用酶温育的转基因裂殖壶菌属“cl0143-9”(“nt”=未处理)。在ha1水平的免疫印迹中能够鉴定至少5种不同的种类而在ha2水平的免疫印迹中能够鉴定2种不同的种类。这与如文献报道的ha1具有多个糖基化位点,ha2只有单一的糖基化位点相一致。

实施例3

裂殖壶菌属培养上清中的蛋白的表征

如上所述在典型发酵条件下培养裂殖壶菌属菌种atcc20888。从培养的20h到52h以4h间隔收集培养上清样品,最后在68h收集。

通过标准bradford分析确定基于每份样品的培养上清中的总蛋白。见图9。

使用图3的方法从37h、40h、44h、48h和68h的培养上清样品中分离蛋白。蛋白的sds-page胶如图10所示。泳道11以2.4μg总蛋白上样,其余泳道以5μg总蛋白上样。鉴定为肌动蛋白或凝溶胶蛋白的大量条带(通过质谱肽测序)在图10中以箭头标记。

实施例4

培养上清物质的负染色和电子显微镜

在如上所述典型的摇瓶条件下培养裂殖壶菌属菌种atcc20888(对照)和转基因裂殖壶菌属cl0143-9(实验)。将培养物转移到50ml锥形管中并以3000×g或4500×g离心15分钟。这种无细胞上清进一步以100,000×g超速离心1小时并将获得的沉淀重悬于pbs,ph7.4。将这种悬液在不连续的15%到60%蔗糖梯度上离心(120,000×g,18h,4℃)并将60%蔗糖级分用于负染色和电子显微镜检测。

对照物质负染色物质的电子显微镜观察包含膜片段、膜聚集体和直径从几百纳米到<50nm的囊泡的混合物(统称为“胞外体”)。见图11。囊泡的形状从圆形到拉长(管状)不等,并且囊泡的边缘是光滑或不规则的。囊泡内部出现轻微染色,表明存在有机物质。较大的囊泡具有增厚的膜,表明在制备过程中囊泡的边缘重叠。膜聚集体和碎片在形状和大小上是非常不规则的。如在通过超速离心纯化的膜中与肌动蛋白具有很强的相关性表明的,膜物质可能源自质外网。

类似地,来自表达异源蛋白的转基因裂殖壶菌属cl0143-9培养物的无细胞上清的负染物质的电子显微镜观察表明该物质是膜片段、膜聚集体、和直径从几百纳米到<50nm的囊泡的混合物。见图11。

使用实施例22的免疫印迹分析描述的h1n1抗血清和12nm金颗粒,如在perkins等,j.virol.82:7201-7211(2008)描述的也对这种物质进行了免疫定位。分离自转基因裂殖壶菌属cl0143-9的细胞外膜体是通过附接于抗血清的金颗粒高度修饰的(图12),表明在胞外体中存在抗体识别的ha蛋白。在没有膜物质的区域观察到最小的背景。很少或根本没有金颗粒结合分离自对照物质的胞外体(图12)。

实施例5

木糖转运蛋白、木糖异构酶和木酮糖激酶表达载体的构建

以hindiii消化载体pab0018(atcc登录号pta-9616)、用绿豆核酸酶处理、纯化,然后再进一步以kpni消化,产生四种不同大小的片段。通过标准电泳技术在琼脂凝胶中分离了2552bp的片段并使用商用dna纯化试剂盒纯化。然后使用pmei和kpn对pab0018进行二次消化。从该消化物中分离并纯化了6732bp的片段并与2552bp的片段连接。然后使用制造商的方案将所述连接产物用于转化商业提供的感受态dh5-α大肠杆菌细胞菌株(invitrogen)。将来自氨苄青霉素抗性克隆的质粒增殖、纯化,然后通过限制性消化或pcr筛选确认连接产生了预期的质粒结构。将一个经验证的质粒命名为pcl0120。参见图15。

按照图16所示的裂殖壶菌属密码子选择表的指导,对编码中间假丝酵母(candidaintermedia)木糖转运蛋白gxs1(genbank登录号aj875406)和拟南芥木糖转运蛋白at5g17010(genbank登录号bt015128)的序列进行密码子优化和合成(blueheronbiotechnology,bothell,wa)。seqidno:94是gsx1的密码子优化的核酸序列,而seqidno:95是at5g17010的密码子优化的核酸序列。

按照标准技术使用5'和3'限制位点bamhi和ndei进行插入和连接将seqidno:94和seqidno:95分别克隆到pcl0120。产生的载体pcl0130和pcl0131的图谱分别如图17和图18所示。

通过连接通过用hindiii和kpni消化从pcl0120释放的5095bp片段与设计赋予博莱霉素(zeocin)或巴龙霉素抗性的合成选择标记盒构建载体pcl0121和pcl0122。这些盒包含驱动shble基因(博莱霉素)或npt基因(巴龙霉素)表达的α-微管蛋白启动子。两种选择标记基因的转录物均由sv40终止子终止。载体pcl0121和pcl0122的全序列分别如seqidno:90和seqidno:91所示。载体pcl0121和pcl0122的图谱分别如图19和图20所示。

按照图16所示的裂殖壶菌属密码子选择表的指导,对编码瘤胃真菌属菌种e2木糖异构酶(cab76571)和瘤胃真菌属菌种e2木酮糖激酶(aj249910)的序列进行密码子优化和合成(blueheronbiotechnology,bothell,wa)。“xyla”(seqidno:92)是cab76571密码子优化的核酸序列,而“xylb”(seqidno:93)是aj249910密码子优化的核酸序列(图22)。

通过插入bamhi和ndei位点,将seqidno:92克隆到载体pcl0121产生命名为pcl0132的载体(图23)并将seqidno:21克隆到载体pcl0122产生命名为pcl0136的载体(图24)。

实施例6

裂殖壶菌属中产生的木糖转运蛋白、木糖异构酶和木酮糖激酶蛋白的表达和表征

使用裂殖壶菌属菌种atcc20888作为分别用pcl030、pcl0131、pcl0132和pcl0136载体转化的宿主细胞。

伴有酶预处理的电穿孔–将细胞在50mlm50-20培养基中(见美国申请公开号2008/0022422)在30℃以200rpm在摇床上培养2天。将细胞按1:100稀释到m2b培养基(见下文段落)并培养过夜(16-24h),以期达到中-对数期生长(od6001.5-2.5)。将细胞在50ml锥形管中以3000×g离心5分钟。移去上清并将细胞重悬于合适体积的1m甘露醇、ph5.5中,以达到2od600单位的终浓度。将5ml细胞分装到25ml摇瓶并以10mmcacl2(1.0m贮液,过滤灭菌)和0.25mg/ml蛋白酶xiv(10mg/ml贮液,过滤灭菌;sigma-aldrich,st.louis,mo)修正。将摇瓶在30℃和100rpm的摇床上温育4小时。在显微镜下监测细胞以确定原生质体程度(degreeofprotoplasting),理想的是单个的细胞。将细胞在圆底管(即14mlfalcontm管,bdbiosciences,sanjose,ca)中以2500xg离心5分钟。除去上清液,轻轻地用5ml冰冷的10%甘油悬浮细胞。将细胞在圆底管中以约2500xg重新离心5分钟。除去上清并使用大口径枪头以500μl冰冷的10%甘油轻轻地悬浮细胞。将90μl的细胞分装入预冷的电穿孔小杯(electro-cuvette)(gene小杯-0.2cm间隙,bio-rad,hercules,ca)。向小杯中添加1μg-5μg的dna(以小于或等于10μl体积),用枪头轻轻混合,并置于冰上5分钟。将细胞在200ohms(电阻),25μf(电容)和500v下电穿孔。将0.5mlm50-20培养基立即加入小杯。然后将细胞转移到25ml摇瓶中的4.5mlm50-20培养基中并在30℃和100rpm的摇床上温育2-3小时。将细胞在圆底管中以2500xg离心5分钟。移除上清并将细胞沉淀重悬于0.5mlm50-20培养基中。将细胞铺板到适当数量(2-5个)的含有适当选择(如需要)的m2b平板上并于30℃温育。

m2b培养基由10g/l葡萄糖,0.8g/l(nh4)2so4,5g/lna2so4,2g/lmgso4·7h2o,0.5g/lkh2po4,0.5g/lkcl,0.1g/lcacl2·2h2o,0.1mmes(ph6.0),0.1%pb26金属,和0.1%pb26维生素(v/v)组成。pb26维生素由50mg/ml维生素b12、100μg/ml硫胺素和100μg/ml泛酸钙组成。pb26金属调整到ph4.5并由3g/lfeso4·7h2o,1g/lmncl2·4h2o,800mg/mlznso4·7h2o,20mg/mlcocl2·6h2o,10mg/mlna2moo4·2h2o,600mg/mlcuso4·5h2o,和800mg/mlniso4·6h2o组成。pb26贮液分别过滤灭菌后加入到高压灭菌后的培养液。在混合前,将葡萄糖、kh2po4和cacl2·2h2o与剩余的培养液成分分开各自高压灭菌,以防止盐析出和糖焦化。所有培养基成分均购自sigmachemical(st.louis,mo)。

在含有合适抗生素的固体培养基上选择转化体的生长。将每种载体的20-100个原代转化体重铺到“木糖-ssfm”固体培养基上,其与ssfm(下面描述的)相同除了它包含木糖代替葡萄糖作为唯一碳源并且不加入抗生素。在这些条件下未观察到任何克隆生长。

ssfm培养基:50g/l葡萄糖,13.6g/lna2so4,0.7g/lk2so4,0.36g/lkcl,2.3g/lmgso4·7h2o,0.1mmes(ph6.0),1.2g/l(nh4)2so4,0.13g/l谷氨酸钠,0.056g/lkh2po4,和0.2g/lcacl2·2h2o。维生素从由0.16g/l维生素b12,9.7g/l硫胺素和3.3g/l泛酸钙组成的贮液,以1ml/l加入。痕量金属从由1g/l柠檬酸,5.2g/lfeso4·7h2o,1.5g/lmncl2·4h2o,1.5g/lznso4·7h2o,0.02g/lcocl2·6h2o,0.02g/lna2moo4·2h2o,1.0g/lcuso4·5h2o,和1.0g/lniso4·6h2o组成的贮液,以2ml/l加入,调整到ph2.5。

提取pcl0130和pcl0131原代转化体的gdna、纯化并用作pcr模板以检测转基因的存在。

按照实施例2描述的方法进行基因组dna提取。

另外,在核糖核酸酶a温育后,按照制造商的方案使用qiagengenomictip500/g柱(qiagen,incusa,valencia,ca)进一步纯化dna。

pcr–用于检测gxs1转基因的引物是5’cl0130(cctcgggcggcgtcctctt)(seqidno:96)和3’cl0130(ggcggccttctcctggttgc)(seqidno:97)。用于检测at5g17010转基因的引物是5’cl0131(ctactccgttgttgccgccatcct)(seqidno:98)和3’cl0131(ccgccgaccataccgagaacga)(seqidno:99)。

使用pcl0130、pcl0132和pcl0136一起的组合(“pcl01310”系列)或pcl0131、pcl0132和pcl0136一起的组合(“pcl0131”系列),共转化裂殖壶菌属野生型菌株(atcc20888)。转化子直接铺于固体木糖培养基上,3-5周后,挑取菌落并在液体木糖-ssfm中进一步增殖。在含木糖的液体培养基中的几轮连续转移提高了转化体的生长速率。pcl0130系列或pcl0131系列的共转化体也铺入含有smm、博莱霉素或巴龙霉素的固体ssfm培养基。铺入这些培养基的所有转化体对每一种测试的抗生素有抗性,表明转化体包含所有三种它们各自的载体。以木糖转运蛋白、木糖异构酶和木酮糖激酶转化的裂殖壶菌属能够在包含木糖作为唯一碳源的培养基中生长。

在进一步的实验中,对选择的smm-抗性转化克隆(单独的pcl0130或pcl0131转化体,或pcl0130系列共转化体,或pcl0131系列共转化体)的摇瓶培养物的无细胞提取物和无细胞上清进行western印迹并显示两种转运蛋白均得到表达并且在两个级分中均存在,表明这些膜结合蛋白以与本文描述的其它膜蛋白观察到的相似的方式与胞外囊泡相连。此外,进行western印迹,其显示在希望它们存在的所有克隆的无细胞提取物中表达了木糖异构酶和木酮糖激酶。通过捕捉糖到囊泡内,胞外体例如含有木糖转运蛋白的囊泡,可用于消耗包含糖或其他低分子量溶质、痕量木糖的混合物的培养基,然后所述囊泡可以通过包括过滤或离心的各种方法分离。

实施例7

pcl0140和pcl0149表达载体的构建

以bamhi和ndei消化载体pcl0120产生长837碱基对(bp)和8454bp的两条片段。通过标准电泳技术在琼脂凝胶中分级8454bp的片段,使用商用dna纯化试剂盒纯化,并连接到也已经用bamhi和ndei消化的合成的序列(seqidno:100或seqidno:101;见图26)。seqidno:100(图26)编码甲型流感病毒(a/puertorico/8/34/mountsinai(h1n1))的na蛋白。蛋白序列与genbank登录号np_040981匹配。按照图16所示的裂殖壶菌属密码子选择表的指导,对特定核酸序列seqidno:100进行密码子优化和通过dna2.0合成以在裂殖壶菌属中表达。seqidno:101(图26)编码与seqidno:100相同的na蛋白,但是包括在编码区c-端的v5标签序列和多聚组氨酸序列。

然后使用制造商的方案将连接产物用于转化商业提供的感受态dh5-α大肠杆菌细胞菌株(invitrogen,carlsbad,ca)。然后通过限制消化或pcr筛选这些质粒以确认连接产生了预期的质粒结构。此方法产生的质粒载体由dna2.0(menlopark,ca)使用sanger测序进行了验证并命名为pcl0140(图25a),其包含seqidno:100,和pcl0149(图25b),其包含seqidno:101。pcl0140和pcl0149载体包括驱动na转基因表达的来自裂殖壶菌属延伸因子-1基因(ef1)的启动子、接着ha转基因的orfc终止子(又称为pfa3终止子),和赋予对甲嘧磺隆的抗性的选择标记盒。

实施例8

裂殖壶菌属中产生的na蛋白的表达和表征

如实施例2所述,使用裂殖壶菌属菌种atcc20888作为以biolistictm粒子轰击器(particlebombarder)(biorad,hercules,ca)转化pcl0140和pcl0149载体的宿主细胞。在含有合适抗生素的固体培养基上选择转化体生长。如之前所述(实施例2),提取原代转化体的gdna并纯化并用作pcr模板以检测转基因的存在。

如实施例2所述,转基因裂殖壶菌属(用pcl0140和pcl0149转化的)的冷冻贮存物在m50-20中生长到汇合,然后在50ml带挡板的摇瓶中扩增。

将裂殖壶菌属培养物转移到50ml锥形管中并以3000×g离心15分钟。参见图27。离心产生的上清,称为“无细胞上清”(cfs)。使用centripreptm重力浓缩器(millipore,billerica,ma)将cfs级分浓缩50-100倍并称为“浓缩的无细胞上清”(ccfs)。用水洗涤离心产生自离心的细胞沉淀并在重悬于2倍沉淀重量的裂解缓冲液(由50mm磷酸钠(ph7.4),1mmedta,5%甘油和1mm新鲜苯甲基磺酰氟组成)和2倍沉淀重量的0.5mm玻璃珠(sigma,st.louis,mo)之前冻存于液氮中。然后通过在多管涡旋器(vwr,westchester,pa)上以最高速4℃涡旋3小时裂解细胞沉淀混合物。然后将产生的细胞裂解物在4℃以5500xg离心10分钟。产生的上清保留并在4℃以5500xg重新离心10分钟。产生的上清本文定义为“无细胞提取物”(cfe)。ccfs和cfe中的蛋白浓度通过标准的bradford测定法(bio-rad,hercules,ca)确定。这些级分用于神经氨酸酶活性测定以及免疫印迹分析。

功能性流感na蛋白显示神经氨酸酶的活性,可以通过标准的荧光na活性分析进行检测,该分析基于唾液酸酶水解(4-甲基伞形酮)-α-d-n-乙酰神经氨酸钠(4-munana)底物(sigma-aldrich,st.louis,mo)释放游离4-甲基伞形酮,其在365nm激发之后在450nm处有荧光发射。简言之,按照potier等,anal.biochem.94:287-296(1979)描述的方法,使用25μlcfs和75μl40μm4-munana或75μlddh2o作对照,分析转基因裂殖壶菌属菌株的cfs、ccfs或cfe。反应在37℃温育30分钟并以fluostaromega多模式酶标仪(bmglabtech,offenburg,germany)测量荧光。

在来自9株用cl0140转化的转基因裂殖壶菌属菌株的浓缩的无细胞上清(ccfs)和无细胞提取物(cfe)中观察到的典型活性如图28所示。与转基因菌株以相同方式生长和制备的裂殖壶菌属菌种atcc20888野生型菌株(“-”)和用pcl0140转化的裂殖壶菌属的pcr阴性菌株(“27”)用作阴性对照。在浓缩的无细胞上清中发现了大部分活性,表明功能性流感神经氨酸酶成功的由裂殖壶菌属表达和分泌到外部环境。

肽序列分析

转基因裂殖壶菌属菌株cl0140-26用于流感na蛋白的部分纯化以通过肽序列分析确认其成功的表达和分泌。纯化过程改编自tarigan等,jitv14(1):75-82(2008),并接着如上所述测量na活性(图29a)。简言之,转基因菌株cl0140-26的无细胞上清进一步以100,000xg4℃离心1小时。使用centripreptm重力浓缩器(millipore,billerica,ma)将产生的上清液浓缩100倍(图29a中“ccfs”级分)并用含0.1%tritonx-100的0.1m碳酸氢钠缓冲液(ph9.1)稀释到原来的体积(图29a中“d”级分)。稀释后的样品用于通过亲和层析纯化。n-(对-氨基苯基)草氨酸琼脂糖(sigma-aldrich,st.louis,mo)装填入pd-10柱(biorad,hercules,ca),通过用6个柱体积(cv)的含0.1%tritonx-100的0.1m碳酸氢钠缓冲液(ph9.1)洗涤后,接着用5cv含0.1%tritonx-100的0.05m醋酸钠缓冲液ph5.5洗后活化。稀释后的样品(级分“d”)上样到柱上,通过用10cv含0.1%tritonx-100的0.15m醋酸钠缓冲液洗柱去除未结合物质(图29a中的级分“w”)。用5cv含0.1%tritonx-100和2mmcacl2的0.1m碳酸氢钠缓冲液从柱洗脱结合的na(图29a中的级分“e”)。使用10-kda-分子截留旋转浓缩器将级分e的富含na的溶液浓缩至原体积的约10%以产生级分ce。

以mopssds电泳缓冲液在还原条件下在12%的bis-tris凝胶(invitrogen,carlsbad,ca)上的十二烷基硫酸钠聚丙烯酰胺凝胶电泳(sds–page)从每个级分分离蛋白。然后用考马斯亮蓝(simplybluesafestain,invitrogen,carlsbad,ca)进行蛋白染色。从考马斯亮蓝染色凝胶中切出泳道“ce”(图29b)中可见的蛋白条带并如实施例2所述进行肽序列分析。通过覆盖蛋白序列25%的共9条肽(113个氨基酸)确定了含na蛋白的蛋白条带(“ce”泳道中箭头所示)。测序的特定的肽在图30中以粗体突出显示。

免疫印迹分析

通过按照标准的免疫印迹程序的免疫印迹分析测试了来自转基因裂殖壶菌属cl0149(克隆10、11、12)的重组na蛋白的表达(图31b)。以mopssds电泳缓冲液在还原条件下在12%的bis-tris凝胶(invitrogen,carlsbad,ca)上的十二烷基硫酸钠聚丙烯酰胺凝胶电泳(sds–page)分离得自无细胞上清(cfs)的蛋白。然后用考马斯亮蓝(simplybluesafestain,invitrogen,carlsbad,ca)进行蛋白染色或转移到聚偏氟乙烯膜并用抗-v5-ap缀合的小鼠单克隆抗体(1:1000稀释,#962-25,invitrogen,carlsbad,ca)探查na蛋白的存在。然后根据制造商的说明(kpl,gaithersburg,md)用5-溴-4-氯-3-吲哚-磷酸盐/四氮唑蓝溶液(bcip/nbt)处理膜。在克隆11的物细胞上清中检测到重组na蛋白(图31b)。阴性对照(“-”)是裂殖壶菌属菌种atcc20888野生型菌株。阳性对照(“+”)是positopetm抗体对照蛋白(#r900-50,invitrogen,carlsbad,ca)。相应的神经氨酸酶活性如图31a所示。

实施例9

裂殖壶菌属中流感ha和na的同时表达

如实施例2所述,使用裂殖壶菌属菌种atcc20888作为宿主细胞以biolistictm粒子轰击器(particlebombarder)(biorad,hercules,ca)同时用pcl0140(图25a)和pcl0143(图2)载体转化。

如实施例2所述培养和处理转基因裂殖壶菌属(用pcl0140和pcl0143转化的)的冷冻贮存物。分别如实施例2和7所述测量血凝和神经氨酸酶活性,并示于图32。用pcl0140和pcl0143转化的转基因裂殖壶菌属证明了与ha和na相关的活性。

实施例10

裂殖壶菌属中产生的包含副流感f蛋白的胞外体的表达和表征

使用裂殖壶菌属菌种atcc20888作为宿主细胞用包含编码人副流感3病毒nih47885株(genbank登录号p06828)的f蛋白的序列的载体转化。副f蛋白的代表序列如seqidno:102所提供。以包含编码f蛋白相关的天然信号肽序列的序列的载体转化某些细胞。以包含编码不同的信号肽序列(例如裂殖壶菌属信号锚序列)的载体转化其他细胞,信号肽序列融合于编码f蛋白的序列,以使得f蛋白与异源信号肽序列一起表达。以包含编码不同膜结构域的序列(例如ha膜结构域)的载体转化其他细胞,膜结构域序列融合于编码f蛋白的序列,以使得f蛋白与异源膜结构域一起表达。f蛋白在c-末端附近包括单次跨膜结构域。f蛋白可以在furin切割位点(氨基酸109)处分为两个肽。称为f2的蛋白第一部分包含完整f蛋白的n-端部分。f2区可以单独融合于编码异源信号肽的序列。病毒f蛋白含有f蛋白c-端部分的其余部分被称为f1。f1区可以单独融合于编码异源信号肽的序列。包含病毒f蛋白的f1和f2部分的载体可以单独表达或联合表达。表达完整f蛋白的载体可以与在furin切割位点切割蛋白的furin酶共表达。另外,可以用编码由不同蛋白酶识别或切割的其他蛋白酶切割位点的序列替换编码f蛋白furin切割位点的序列。包含替代的蛋白酶切割位点的f蛋白可以与相应的识别和切割替代蛋白酶切割位点的蛋白酶共表达。

进行转化,并按照本文所述的任何方法培养和增殖冷冻贮存物。将裂殖壶菌属培养物转移到50ml锥形管中并以3000×g或4500×g离心15分钟以产生低速上清。进一步将低速上清以100,000×g超速离心1h。参见图3。生成的包含f蛋白的不溶级分的沉淀重悬于磷酸盐缓冲盐水(pbs)并如实施例2所述用于肽序列分析和糖基化分析。

如实施例2所述根据标准免疫印迹程序通过免疫分析,使用抗-f抗血清和适当稀释的二抗验证了f蛋白自转基因裂殖壶菌属的表达。在低速上清和不溶级分检测到了重组f蛋白。此外,来在自表达f蛋白的转基因裂殖壶菌属的无细胞提取物中检测到了重组f蛋白。

通过f活性分析评估裂殖壶菌属中产生的f蛋白的活性。通过标准f活性分析,功能性f蛋白显示出易于检测的f活性。

使用根据实施例4产生的负染色物质进行电子显微镜观察以确认胞外体的存在。进行免疫金标记以确认蛋白与胞外体的关联。

实施例11

裂殖壶菌属中产生的包含g水泡性口炎病毒g蛋白的胞外体的表达和表征

使用裂殖壶菌属菌种atcc20888作为宿主细胞用包含水泡性口炎病毒g(vsv-g)蛋白编码序列的载体转化。vsv-g蛋白的代表序列如seqidno:103(来自genbank登录号m35214)所提供。以包含编码与vsv-g蛋白相关的天然信号肽序列的载体转化某些细胞。以包含不同的信号肽序列(例如裂殖壶菌属信号锚序列)的载体转化其他细胞,信号肽序列融合于vsv-g蛋白的编码序列,以使得vsv-g蛋白与异源信号肽序列一起表达。以包含编码不同膜结构域(例如ha膜结构域)的序列的载体转化其他细胞,膜结构域序列融合于vsv-g蛋白的编码序列,以使得vsv-g蛋白与异源膜结构域一起表达。进行转化,并且按照本文所述的任何方法培养和增殖冷冻贮存物。将裂殖壶菌属培养物转移到50ml锥形管中并以3000×g或4500×g离心15分钟以产生低速上清。进一步将低速上清以100,000×g超速离心1h。参见图3。生成的包含vsv-g蛋白的不溶级分的沉淀重悬于磷酸盐缓冲盐水(pbs)并如实施例2所述用于肽序列分析和糖基化分析。

如实施例2所述根据标准免疫印迹程序通过免疫分析,使用抗-vsv-g抗血清和适当稀释的二抗验证了vsv-g蛋白自转基因裂殖壶菌属的表达。在低速上清和不溶级分检测到重组vsv-g蛋白。此外,来自表达vsv-g蛋白的转基因裂殖壶菌属的无细胞提取物中检测到重组vsv-g蛋白。

通过vsv-g活性分析评估裂殖壶菌属中产生的vsv-g蛋白的活性。通过标准vsv-g活性分析,功能性vsv-g蛋白显示出易于检测的vsv-g活性。

使用根据实施例4产生的负染色物质进行电子显微镜观察以确认胞外体的存在。进行免疫金标记以确认蛋白与胞外体的关联。

实施例12

裂殖壶菌属中产生的包含egfp融合蛋白的胞外体的表达和表征

已经描述了使用包含编码egfp的多核苷酸序列的载体转化裂殖壶菌属菌种atcc20888和在转化的裂殖壶菌属中egfp的表达。参见美国公开第2010/0233760号和wo2010/107709,以整体引用的方式并入本文作为参考。

在进一步的实验中,使用裂殖壶菌属菌种atcc20888作为宿主细胞用包含egfp和膜结构域,例如裂殖壶菌属膜结构域或如ha膜结构域的病毒膜结构域之间的融合蛋白编码序列的载体转化。代表性裂殖壶菌属膜结构域如图13和图14所提供。进行转化,并且按照本文所述的任何方法培养并增殖冷冻贮存物。将裂殖壶菌属培养物转移到50ml锥形管中并以3000×g或4500×g离心15分钟以产生低速上清。进一步将低速上清以100,000×g超速离心1h。参见图3。生成的包含来自转基因裂殖壶菌属的egfp融合蛋白的不溶级分的沉淀重悬于磷酸盐缓冲盐水(pbs)并如实施例2所述用于肽序列分析和糖基化分析。

如实施例2所述根据标准免疫印迹程序通过免疫分析,使用抗-egfp融合蛋白抗血清和适当稀释的二抗验证了转基因裂殖壶菌属的egfp融合蛋白的表达。在低速上清和不溶级分中检测到重组egfp融合蛋白。此外,在来自表达egfp融合蛋白的转基因裂殖壶菌属的无细胞提取物中检测到重组egfp融合蛋白。

通过egfp融合蛋白活性分析评估裂殖壶菌属中产生的egfp融合蛋白的活性。通过标准egfp融合蛋白活性分析,功能性egfp融合蛋白显示出易于检测的egfp融合蛋白活性。

使用根据实施例4产生的负染色物质进行电子显微镜观察以确认胞外体的存在。进行免疫金标记以确认蛋白与胞外体的关联。

实施例13

破囊壶菌属培养物中产生的异源多肽的检测

在适当发酵条件下,在发酵罐中制备包含至少一种异源多肽的破囊壶菌宿主细胞的培养物。发酵罐以含有例如,碳(葡萄糖)、氮、磷、盐、痕量金属和维生素的培养基成批生产(batchwithamedia)。发酵罐接种典型种子培养物,然后培养72-120小时,并补料碳(例如葡萄糖)补料。碳补料在整个发酵过程中被补入和消耗。72-120小时后,收获发酵罐并离心培养液以从上清中分离生物质。

通过标准分析,例如bradford或bca测定生物质和无细胞上清的蛋白含量。通过标准sds-page和western印迹进一步分析蛋白以确定在代表性生物质和无细胞上清级分中异源多肽的表达。通过常规染色程序(例如负染色和免疫金标记)和随后的电子显微镜观察来显示包含膜结构域的异源多肽与微藻包外体的关联。

实施例14

从微藻培养物制备病毒样颗粒

在上述条件下在微藻宿主细胞中异源表达一种或多种病毒包膜多肽,使得病毒多肽定位于培养条件下产生的微藻胞外体。当使用适当的培养条件和调节性调控元件过表达时,在微藻胞外体中的病毒包膜多肽自发自组装成与传染性病毒形态相似的颗粒。

同样,在上述条件下在微藻宿主细胞中异源表达一种或多种病毒包膜多肽和一种或多种病毒基质多肽,使得病毒多肽定位于培养条件下产生的微藻胞外体。当使用适当的培养条件和调节性调控元件过表达时,在微藻胞外体中的病毒多肽自发自组装成与传染性病毒形态相似的颗粒。

本文所述的各个方面、实施例和选项均可以与任何和所有的变化相结合。

只要个人出版物、专利或专利申请是专门单独表示将纳入本文作为参考的,在本文中提到的所有出版物、专利和专利申请,以相同的程度纳入本文作为参考。

生物材料保藏

如下生物材料已按照布达佩斯条约的规定保藏于美国典型培养物保藏中心(americantypeculturecollection,manassas,virginia20110-2209,美国),并获得如下保藏号:

序列表

<110>赛诺菲疫苗技术公司(sanofivaccinetechnologiess.a.s.)

<120>微藻中异源多肽的生产,微藻胞外体、组合物及其制备方法和用途

<130>1010.002-cn1div.1

<140>待指定

<141>同此

<150>61/413,353

<151>2010-11-12

<150>61/290,469

<151>2009-12-28

<150>61/290,441

<151>2009-12-28

<160>103

<170>patentinversion3.5

<210>1

<211>35

<212>prt

<213>裂殖壶菌属(schizochytrium)

<400>1

metalaasnilemetalaasnvalthrproglnglyvalalalysgly

151015

pheglyleuphevalglyvalleuphepheleutyrtrppheleuval

202530

glyleuala

35

<210>2

<211>105

<212>dna

<213>裂殖壶菌属(schizochytrium)

<400>2

atggccaacatcatggccaacgtcacgccccagggcgtcgccaagggctttggcctcttt60

gtcggcgtgctcttctttctctactggttccttgtcggcctcgcc105

<210>3

<211>1999

<212>dna

<213>裂殖壶菌属(schizochytrium)

<400>3

ccgcgaatcaagaaggtaggcgcgctgcgaggcgcggcggcggagcggagcgagggagag60

ggagagggagagagagggagggagacgtcgccgcggcggggcctggcctggcctggtttg120

gcttggtcagcgcggccttgtccgagcgtgcagctggagttgggtggattcatttggatt180

ttcttttgtttttgtttttctctctttcccggaaagtgttggccggtcggtgttctttgt240

tttgatttcttcaaaagttttggtggttggttctctctcttggctctctgtcaggcggtc300

cggtccacgccccggcctctcctctcctctcctctcctctcctctccgtgcgtatacgta360

cgtacgtttgtatacgtacatacatcccgcccgccgtgccggcgagggtttgctcagcct420

ggagcaatgcgatgcgatgcgatgcgatgcgacgcgacgcgacgcgagtcactggttcgc480

gctgtggctgtggcttgcttgcttacttgctttcgagctctcccgctttcttctttcctt540

ctcacgccaccaccaacgaaagaagatcggccccggcacgccgctgagaagggctggcgg600

cgatgacggcacgcgcgcccgctgccacgttggcgctcgctgctgctgctgctgctgctg660

ctgctgctgctgctgctgctgctgctgcttctgcgcgcaggctttgccacgaggccggcg720

tgctggccgctgccgcttccagtccgcgtggagagatcgaatgagagataaactggatgg780

attcatcgagggatgaatgaacgatggttggatgcctttttcctttttcaggtccacagc840

gggaagcaggagcgcgtgaatctgccgccatccgcatacgtctgcatcgcatcgcatcgc900

atgcacgcatcgctcgccgggagccacagacgggcgacagggcggccagccagccaggca960

gccagccaggcaggcaccagagggccagagagcgcgcctcacgcacgcgccgcagtgcgc1020

gcatcgctcgcagtgcagaccttgattccccgcgcggatctccgcgagcccgaaacgaag1080

agcgccgtacgggcccatcctagcgtcgcctcgcaccgcatcgcatcgcatcgcgttccc1140

tagagagtagtactcgacgaaggcaccatttccgcgctcctcttcggcgcgatcgaggcc1200

cccggcgccgcgacgatcgcggcggccgcggcgctggcggcggccctggcgctcgcgctg1260

gcggccgccgcgggcgtctggccctggcgcgcgcgggcgccgcaggaggagcggcagcgg1320

ctgctcgccgccagagaaggagcgcgccgggcccggggagggacggggaggagaaggaga1380

aggcgcgcaaggcggccccgaaagagaagaccctggacttgaacgcgaagaagaagaaga1440

aggagaagaagttgaagaagaagaagaagaaggagaggaagttgaagaagacgaggagca1500

ggcgcgttccaaggcgcgttctcttccggaggcgcgttccagctgcggcggcggggcggg1560

ctgcggggcgggcgcgggcgcgggtgcgggcagaggggacgcgcgcgcggaggcggaggg1620

ggccgagcgggagcccctgctgctgcggggcgcccgggccgcaggtgtggcgcgcgcgac1680

gacggaggcgacgacgccagcggccgcgacgacaaggccggcggcgtcggcgggcggaag1740

gccccgcgcggagcaggggcgggagcaggacaaggcgcaggagcaggagcagggccggga1800

gcgggagcgggagcgggcggcggagcccgaggcagaacccaatcgagatccagagcgagc1860

agaggccggccgcgagcccgagcccgcgccgcagatcactagtaccgctgcggaatcaca1920

gcagcagcagcagcagcagcagcagcagcagcagcagcagcagccacgagagggagataa1980

agaaaaagcggcagagacg1999

<210>4

<211>325

<212>dna

<213>裂殖壶菌属(schizochytrium)

<400>4

gatccgaaagtgaaccttgtcctaacccgacagcgaatggcgggagggggcgggctaaaa60

gatcgtattacatagtatttttcccctactctttgtgtttgtctttttttttttttgaac120

gcattcaagccacttgtcttggtttacttgtttgtttgcttgcttgcttgcttgcttgcc180

tgcttcttggtcagacggcccaaaaaagggaaaaaattcattcatggcacagataagaaa240

aagaaaaagtttgtcgaccaccgtcatcagaaagcaagagaagagaaacactcgcgctca300

cattctcgctcgcgtaagaatctta325

<210>5

<211>372

<212>dna

<213>streptoalloteichushindustanus

<400>5

atggccaagttgaccagtgccgttccggtgctcaccgcgcgcgacgtcgccggagcggtc60

gagttctggaccgaccggctcgggttctcccgggacttcgtggaggacgacttcgccggt120

gtggtccgggacgacgtgaccctgttcatcagcgcggtccaggaccaggtggtgccggac180

aacaccctggcctgggtgtgggtgcgcggcctggacgagctgtacgccgagtggtcggag240

gtcgtgtccacgaacttccgggacgcctccgggccggccatgaccgagatcggcgagcag300

ccgtgggggcgggagttcgccctgcgcgacccggccggcaactgcgtgcacttcgtggcc360

gaggagcaggac372

<210>6

<211>2055

<212>dna

<213>裂殖壶菌属(schizochytrium)

<400>6

atgagcgcgacccgcgcggcgacgaggacagcggcggcgctgtcctcggcgctgacgacg60

cctgtaaagcagcagcagcagcagcagctgcgcgtaggcgcggcgtcggcacggctggcg120

gccgcggcgttctcgtccggcacgggcggagacgcggccaagaaggcggccgcggcgagg180

gcgttctccacgggacgcggccccaacgcgacacgcgagaagagctcgctggccacggtc240

caggcggcgacggacgatgcgcgcttcgtcggcctgaccggcgcccaaatctttcatgag300

ctcatgcgcgagcaccaggtggacaccatctttggctaccctggcggcgccattctgccc360

gtttttgatgccatttttgagagtgacgccttcaagttcattctcgctcgccacgagcag420

ggcgccggccacatggccgagggctacgcgcgcgccacgggcaagcccggcgttgtcctc480

gtcacctcgggccctggagccaccaacaccatcaccccgatcatggatgcttacatggac540

ggtacgccgctgctcgtgttcaccggccaggtgcccacctctgctgtcggcacggacgct600

ttccaggagtgtgacattgttggcatcagccgcgcgtgcaccaagtggaacgtcatggtc660

aaggacgtgaaggagctcccgcgccgcatcaatgaggcctttgagattgccatgagcggc720

cgcccgggtcccgtgctcgtcgatcttcctaaggatgtgaccgccgttgagctcaaggaa780

atgcccgacagctccccccaggttgctgtgcgccagaagcaaaaggtcgagcttttccac840

aaggagcgcattggcgctcctggcacggccgacttcaagctcattgccgagatgatcaac900

cgtgcggagcgacccgtcatctatgctggccagggtgtcatgcagagcccgttgaatggc960

ccggctgtgctcaaggagttcgcggagaaggccaacattcccgtgaccaccaccatgcag1020

ggtctcggcggctttgacgagcgtagtcccctctccctcaagatgctcggcatgcacggc1080

tctgcctacgccaactactcgatgcagaacgccgatcttatcctggcgctcggtgcccgc1140

tttgatgatcgtgtgacgggccgcgttgacgcctttgctccggaggctcgccgtgccgag1200

cgcgagggccgcggtggcatcgttcactttgagatttcccccaagaacctccacaaggtc1260

gtccagcccaccgtcgcggtcctcggcgacgtggtcgagaacctcgccaacgtcacgccc1320

cacgtgcagcgccaggagcgcgagccgtggtttgcgcagatcgccgattggaaggagaag1380

cacccttttctgctcgagtctgttgattcggacgacaaggttctcaagccgcagcaggtc1440

ctcacggagcttaacaagcagattctcgagattcaggagaaggacgccgaccaggaggtc1500

tacatcaccacgggcgtcggaagccaccagatgcaggcagcgcagttccttacctggacc1560

aagccgcgccagtggatctcctcgggtggcgccggcactatgggctacggccttccctcg1620

gccattggcgccaagattgccaagcccgatgctattgttattgacatcgatggtgatgct1680

tcttattcgatgaccggtatggaattgatcacagcagccgaattcaaggttggcgtgaag1740

attcttcttttgcagaacaactttcagggcatggtcaagaactggcaggatctcttttac1800

gacaagcgctactcgggcaccgccatgttcaacccgcgcttcgacaaggtcgccgatgcg1860

atgcgtgccaagggtctctactgcgcgaaacagtcggagctcaaggacaagatcaaggag1920

tttctcgagtacgatgagggtcccgtcctcctcgaggttttcgtggacaaggacacgctc1980

gtcttgcccatggtccccgctggctttccgctccacgagatggtcctcgagcctcctaag2040

cccaaggacgcctaa2055

<210>7

<211>684

<212>prt

<213>裂殖壶菌属(schizochytrium)

<400>7

metseralathrargalaalathrargthralaalaalaleuserser

151015

alaleuthrthrprovallysglnglnglnglnglnglnleuargval

202530

glyalaalaseralaargleualaalaalaalapheserserglythr

354045

glyglyaspalaalalyslysalaalaalaalaargalapheserthr

505560

glyargglyproasnalathrargglulysserserleualathrval

65707580

glnalaalathraspaspalaargphevalglyleuthrglyalagln

859095

ilephehisgluleumetarggluhisglnvalaspthrilephegly

100105110

tyrproglyglyalaileleuprovalpheaspalailephegluser

115120125

aspalaphelyspheileleualaarghisgluglnglyalaglyhis

130135140

metalagluglytyralaargalathrglylysproglyvalvalleu

145150155160

valthrserglyproglyalathrasnthrilethrproilemetasp

165170175

alatyrmetaspglythrproleuleuvalphethrglyglnvalpro

180185190

thrseralavalglythraspalapheglnglucysaspilevalgly

195200205

ileserargalacysthrlystrpasnvalmetvallysaspvallys

210215220

gluleuproargargileasnglualaphegluilealametsergly

225230235240

argproglyprovalleuvalaspleuprolysaspvalthralaval

245250255

gluleulysglumetproaspserserproglnvalalavalarggln

260265270

lysglnlysvalgluleuphehislysgluargileglyalaprogly

275280285

thralaaspphelysleuilealaglumetileasnargalagluarg

290295300

provaliletyralaglyglnglyvalmetglnserproleuasngly

305310315320

proalavalleulysgluphealaglulysalaasnileprovalthr

325330335

thrthrmetglnglyleuglyglypheaspgluargserproleuser

340345350

leulysmetleuglymethisglyseralatyralaasntyrsermet

355360365

glnasnalaaspleuileleualaleuglyalaargpheaspasparg

370375380

valthrglyargvalaspalaphealaproglualaargargalaglu

385390395400

arggluglyargglyglyilevalhisphegluileserprolysasn

405410415

leuhislysvalvalglnprothrvalalavalleuglyaspvalval

420425430

gluasnleualaasnvalthrprohisvalglnargglngluargglu

435440445

protrpphealaglnilealaasptrplysglulyshispropheleu

450455460

leugluservalaspseraspasplysvalleulysproglnglnval

465470475480

leuthrgluleuasnlysglnileleugluileglnglulysaspala

485490495

aspglngluvaltyrilethrthrglyvalglyserhisglnmetgln

500505510

alaalaglnpheleuthrtrpthrlysproargglntrpileserser

515520525

glyglyalaglythrmetglytyrglyleuproseralaileglyala

530535540

lysilealalysproaspalailevalileaspileaspglyaspala

545550555560

sertyrsermetthrglymetgluleuilethralaalagluphelys

565570575

valglyvallysileleuleuleuglnasnasnpheglnglymetval

580585590

lysasntrpglnaspleuphetyrasplysargtyrserglythrala

595600605

metpheasnproargpheasplysvalalaaspalametargalalys

610615620

glyleutyrcysalalysglnsergluleulysasplysilelysglu

625630635640

pheleuglutyraspgluglyprovalleuleugluvalphevalasp

645650655

lysaspthrleuvalleuprometvalproalaglypheproleuhis

660665670

glumetvalleugluproprolysprolysaspala

675680

<210>8

<211>684

<212>prt

<213>人工序列

<220>

<223>突变的als1

<400>8

metseralathrargalaalathrargthralaalaalaleuserser

151015

alaleuthrthrprovallysglnglnglnglnglnglnleuargval

202530

glyalaalaseralaargleualaalaalaalapheserserglythr

354045

glyglyaspalaalalyslysalaalaalaalaargalapheserthr

505560

glyargglyproasnalathrargglulysserserleualathrval

65707580

glnalaalathraspaspalaargphevalglyleuthrglyalagln

859095

ilephehisgluleumetarggluhisglnvalaspthrilephegly

100105110

tyrproglyglyalaileleuprovalpheaspalailephegluser

115120125

aspalaphelyspheileleualaarghisgluglnglyalaglyhis

130135140

metalagluglytyralaargalathrglylysproglyvalvalleu

145150155160

valthrserglyproglyalathrasnthrilethrproilemetasp

165170175

alatyrmetaspglythrproleuleuvalphethrglyglnvalpro

180185190

thrseralavalglythraspalapheglnglucysaspilevalgly

195200205

ileserargalacysthrlystrpasnvalmetvallysaspvallys

210215220

gluleuproargargileasnglualaphegluilealametsergly

225230235240

argproglyprovalleuvalaspleuprolysaspvalthralaval

245250255

gluleulysglumetproaspserserproglnvalalavalarggln

260265270

lysglnlysvalgluleuphehislysgluargileglyalaprogly

275280285

thralaaspphelysleuilealaglumetileasnargalagluarg

290295300

provaliletyralaglyglnglyvalmetglnserproleuasngly

305310315320

proalavalleulysgluphealaglulysalaasnileprovalthr

325330335

thrthrmetglnglyleuglyglypheaspgluargserproleuser

340345350

leulysmetleuglymethisglyseralatyralaasntyrsermet

355360365

glnasnalaaspleuileleualaleuglyalaargpheaspasparg

370375380

valthrglyargvalaspalaphealaproglualaargargalaglu

385390395400

arggluglyargglyglyilevalhisphegluileserprolysasn

405410415

leuhislysvalvalglnprothrvalalavalleuglyaspvalval

420425430

gluasnleualaasnvalthrprohisvalglnargglngluargglu

435440445

protrpphealaglnilealaasptrplysglulyshispropheleu

450455460

leugluservalaspseraspasplysvalleulysproglnglnval

465470475480

leuthrgluleuasnlysglnileleugluileglnglulysaspala

485490495

aspglngluvaltyrilethrthrglyvalglyserhisglnmetgln

500505510

alaalaglnpheleuthrtrpthrlysproargglntrpileserser

515520525

glyglyalaglythrmetglytyrglyleuproseralaileglyala

530535540

lysilealalysproaspalailevalileaspileaspglyaspala

545550555560

sertyrsermetthrglymetgluleuilethralaalagluphelys

565570575

valglyvallysileleuleuleuglnasnasnpheglnglymetval

580585590

lysasnvalglnaspleuphetyrasplysargtyrserglythrala

595600605

metpheasnproargpheasplysvalalaaspalametargalalys

610615620

glyleutyrcysalalysglnsergluleulysasplysilelysglu

625630635640

pheleuglutyraspgluglyprovalleuleugluvalphevalasp

645650655

lysaspthrleuvalleuprometvalproalaglypheproleuhis

660665670

glumetvalleugluproprolysprolysaspala

675680

<210>9

<211>684

<212>prt

<213>人工序列

<220>

<223>突变的als2

<400>9

metseralathrargalaalathrargthralaalaalaleuserser

151015

alaleuthrthrprovallysglnglnglnglnglnglnleuargval

202530

glyalaalaseralaargleualaalaalaalapheserserglythr

354045

glyglyaspalaalalyslysalaalaalaalaargalapheserthr

505560

glyargglyproasnalathrargglulysserserleualathrval

65707580

glnalaalathraspaspalaargphevalglyleuthrglyalagln

859095

ilephehisgluleumetarggluhisglnvalaspthrilephegly

100105110

tyrproglyglyalaileleuprovalpheaspalailephegluser

115120125

aspalaphelyspheileleualaarghisgluglnglyalaglyhis

130135140

metalagluglytyralaargalathrglylysproglyvalvalleu

145150155160

valthrserglyproglyalathrasnthrilethrproilemetasp

165170175

alatyrmetaspglythrproleuleuvalphethrglyglnvalgln

180185190

thrseralavalglythraspalapheglnglucysaspilevalgly

195200205

ileserargalacysthrlystrpasnvalmetvallysaspvallys

210215220

gluleuproargargileasnglualaphegluilealametsergly

225230235240

argproglyprovalleuvalaspleuprolysaspvalthralaval

245250255

gluleulysglumetproaspserserproglnvalalavalarggln

260265270

lysglnlysvalgluleuphehislysgluargileglyalaprogly

275280285

thralaaspphelysleuilealaglumetileasnargalagluarg

290295300

provaliletyralaglyglnglyvalmetglnserproleuasngly

305310315320

proalavalleulysgluphealaglulysalaasnileprovalthr

325330335

thrthrmetglnglyleuglyglypheaspgluargserproleuser

340345350

leulysmetleuglymethisglyseralatyralaasntyrsermet

355360365

glnasnalaaspleuileleualaleuglyalaargpheaspasparg

370375380

valthrglyargvalaspalaphealaproglualaargargalaglu

385390395400

arggluglyargglyglyilevalhisphegluileserprolysasn

405410415

leuhislysvalvalglnprothrvalalavalleuglyaspvalval

420425430

gluasnleualaasnvalthrprohisvalglnargglngluargglu

435440445

protrpphealaglnilealaasptrplysglulyshispropheleu

450455460

leugluservalaspseraspasplysvalleulysproglnglnval

465470475480

leuthrgluleuasnlysglnileleugluileglnglulysaspala

485490495

aspglngluvaltyrilethrthrglyvalglyserhisglnmetgln

500505510

alaalaglnpheleuthrtrpthrlysproargglntrpileserser

515520525

glyglyalaglythrmetglytyrglyleuproseralaileglyala

530535540

lysilealalysproaspalailevalileaspileaspglyaspala

545550555560

sertyrsermetthrglymetgluleuilethralaalagluphelys

565570575

valglyvallysileleuleuleuglnasnasnpheglnglymetval

580585590

lysasntrpglnaspleuphetyrasplysargtyrserglythrala

595600605

metpheasnproargpheasplysvalalaaspalametargalalys

610615620

glyleutyrcysalalysglnsergluleulysasplysilelysglu

625630635640

pheleuglutyraspgluglyprovalleuleugluvalphevalasp

645650655

lysaspthrleuvalleuprometvalproalaglypheproleuhis

660665670

glumetvalleugluproprolysprolysaspala

675680

<210>10

<211>684

<212>prt

<213>人工序列

<220>

<223>突变的als3

<400>10

metseralathrargalaalathrargthralaalaalaleuserser

151015

alaleuthrthrprovallysglnglnglnglnglnglnleuargval

202530

glyalaalaseralaargleualaalaalaalapheserserglythr

354045

glyglyaspalaalalyslysalaalaalaalaargalapheserthr

505560

glyargglyproasnalathrargglulysserserleualathrval

65707580

glnalaalathraspaspalaargphevalglyleuthrglyalagln

859095

ilephehisgluleumetarggluhisglnvalaspthrilephegly

100105110

tyrproglyglyalaileleuprovalpheaspalailephegluser

115120125

aspalaphelyspheileleualaarghisgluglnglyalaglyhis

130135140

metalagluglytyralaargalathrglylysproglyvalvalleu

145150155160

valthrserglyproglyalathrasnthrilethrproilemetasp

165170175

alatyrmetaspglythrproleuleuvalphethrglyglnvalgln

180185190

thrseralavalglythraspalapheglnglucysaspilevalgly

195200205

ileserargalacysthrlystrpasnvalmetvallysaspvallys

210215220

gluleuproargargileasnglualaphegluilealametsergly

225230235240

argproglyprovalleuvalaspleuprolysaspvalthralaval

245250255

gluleulysglumetproaspserserproglnvalalavalarggln

260265270

lysglnlysvalgluleuphehislysgluargileglyalaprogly

275280285

thralaaspphelysleuilealaglumetileasnargalagluarg

290295300

provaliletyralaglyglnglyvalmetglnserproleuasngly

305310315320

proalavalleulysgluphealaglulysalaasnileprovalthr

325330335

thrthrmetglnglyleuglyglypheaspgluargserproleuser

340345350

leulysmetleuglymethisglyseralatyralaasntyrsermet

355360365

glnasnalaaspleuileleualaleuglyalaargpheaspasparg

370375380

valthrglyargvalaspalaphealaproglualaargargalaglu

385390395400

arggluglyargglyglyilevalhisphegluileserprolysasn

405410415

leuhislysvalvalglnprothrvalalavalleuglyaspvalval

420425430

gluasnleualaasnvalthrprohisvalglnargglngluargglu

435440445

protrpphealaglnilealaasptrplysglulyshispropheleu

450455460

leugluservalaspseraspasplysvalleulysproglnglnval

465470475480

leuthrgluleuasnlysglnileleugluileglnglulysaspala

485490495

aspglngluvaltyrilethrthrglyvalglyserhisglnmetgln

500505510

alaalaglnpheleuthrtrpthrlysproargglntrpileserser

515520525

glyglyalaglythrmetglytyrglyleuproseralaileglyala

530535540

lysilealalysproaspalailevalileaspileaspglyaspala

545550555560

sertyrsermetthrglymetgluleuilethralaalagluphelys

565570575

valglyvallysileleuleuleuglnasnasnpheglnglymetval

580585590

lysasnvalglnaspleuphetyrasplysargtyrserglythrala

595600605

metpheasnproargpheasplysvalalaaspalametargalalys

610615620

glyleutyrcysalalysglnsergluleulysasplysilelysglu

625630635640

pheleuglutyraspgluglyprovalleuleugluvalphevalasp

645650655

lysaspthrleuvalleuprometvalproalaglypheproleuhis

660665670

glumetvalleugluproprolysprolysaspala

675680

<210>11

<211>2052

<212>dna

<213>人工序列

<220>

<223>突变的als1

<400>11

atgagcgcgacccgcgcggcgacgaggacagcggcggcgctgtcctcggcgctgacgacg60

cctgtaaagcagcagcagcagcagcagctgcgcgtaggcgcggcgtcggcacggctggcg120

gccgcggcgttctcgtccggcacgggcggagacgcggccaagaaggcggccgcggcgagg180

gcgttctccacgggacgcggccccaacgcgacacgcgagaagagctcgctggccacggtc240

caggcggcgacggacgatgcgcgcttcgtcggcctgaccggcgcccaaatctttcatgag300

ctcatgcgcgagcaccaggtggacaccatctttggctaccctggcggcgccattctgccc360

gtttttgatgccatttttgagagtgacgccttcaagttcattctcgctcgccacgagcag420

ggcgccggccacatggccgagggctacgcgcgcgccacgggcaagcccggcgttgtcctc480

gtcacctcgggccctggagccaccaacaccatcaccccgatcatggatgcttacatggac540

ggtacgccgctgctcgtgttcaccggccaggtgcccacctctgctgtcggcacggacgct600

ttccaggagtgtgacattgttggcatcagccgcgcgtgcaccaagtggaacgtcatggtc660

aaggacgtgaaggagctcccgcgccgcatcaatgaggcctttgagattgccatgagcggc720

cgcccgggtcccgtgctcgtcgatcttcctaaggatgtgaccgccgttgagctcaaggaa780

atgcccgacagctccccccaggttgctgtgcgccagaagcaaaaggtcgagcttttccac840

aaggagcgcattggcgctcctggcacggccgacttcaagctcattgccgagatgatcaac900

cgtgcggagcgacccgtcatctatgctggccagggtgtcatgcagagcccgttgaatggc960

ccggctgtgctcaaggagttcgcggagaaggccaacattcccgtgaccaccaccatgcag1020

ggtctcggcggctttgacgagcgtagtcccctctccctcaagatgctcggcatgcacggc1080

tctgcctacgccaactactcgatgcagaacgccgatcttatcctggcgctcggtgcccgc1140

tttgatgatcgtgtgacgggccgcgttgacgcctttgctccggaggctcgccgtgccgag1200

cgcgagggccgcggtggcatcgttcactttgagatttcccccaagaacctccacaaggtc1260

gtccagcccaccgtcgcggtcctcggcgacgtggtcgagaacctcgccaacgtcacgccc1320

cacgtgcagcgccaggagcgcgagccgtggtttgcgcagatcgccgattggaaggagaag1380

cacccttttctgctcgagtctgttgattcggacgacaaggttctcaagccgcagcaggtc1440

ctcacggagcttaacaagcagattctcgagattcaggagaaggacgccgaccaggaggtc1500

tacatcaccacgggcgtcggaagccaccagatgcaggcagcgcagttccttacctggacc1560

aagccgcgccagtggatctcctcgggtggcgccggcactatgggctacggccttccctcg1620

gccattggcgccaagattgccaagcccgatgctattgttattgacatcgatggtgatgct1680

tcttattcgatgaccggtatggaattgatcacagcagccgaattcaaggttggcgtgaag1740

attcttcttttgcagaacaactttcagggcatggtcaagaacgttcaggatctcttttac1800

gacaagcgctactcgggcaccgccatgttcaacccgcgcttcgacaaggtcgccgatgcg1860

atgcgtgccaagggtctctactgcgcgaaacagtcggagctcaaggacaagatcaaggag1920

tttctcgagtacgatgagggtcccgtcctcctcgaggttttcgtggacaaggacacgctc1980

gtcttgcccatggtccccgctggctttccgctccacgagatggtcctcgagcctcctaag2040

cccaaggacgcc2052

<210>12

<211>2052

<212>dna

<213>人工序列

<220>

<223>突变的als2

<400>12

atgagcgcgacccgcgcggcgacgaggacagcggcggcgctgtcctcggcgctgacgacg60

cctgtaaagcagcagcagcagcagcagctgcgcgtaggcgcggcgtcggcacggctggcg120

gccgcggcgttctcgtccggcacgggcggagacgcggccaagaaggcggccgcggcgagg180

gcgttctccacgggacgcggccccaacgcgacacgcgagaagagctcgctggccacggtc240

caggcggcgacggacgatgcgcgcttcgtcggcctgaccggcgcccaaatctttcatgag300

ctcatgcgcgagcaccaggtggacaccatctttggctaccctggcggcgccattctgccc360

gtttttgatgccatttttgagagtgacgccttcaagttcattctcgctcgccacgagcag420

ggcgccggccacatggccgagggctacgcgcgcgccacgggcaagcccggcgttgtcctc480

gtcacctcgggccctggagccaccaacaccatcaccccgatcatggatgcttacatggac540

ggtacgccgctgctcgtgttcaccggccaggtgcagacctctgctgtcggcacggacgct600

ttccaggagtgtgacattgttggcatcagccgcgcgtgcaccaagtggaacgtcatggtc660

aaggacgtgaaggagctcccgcgccgcatcaatgaggcctttgagattgccatgagcggc720

cgcccgggtcccgtgctcgtcgatcttcctaaggatgtgaccgccgttgagctcaaggaa780

atgcccgacagctccccccaggttgctgtgcgccagaagcaaaaggtcgagcttttccac840

aaggagcgcattggcgctcctggcacggccgacttcaagctcattgccgagatgatcaac900

cgtgcggagcgacccgtcatctatgctggccagggtgtcatgcagagcccgttgaatggc960

ccggctgtgctcaaggagttcgcggagaaggccaacattcccgtgaccaccaccatgcag1020

ggtctcggcggctttgacgagcgtagtcccctctccctcaagatgctcggcatgcacggc1080

tctgcctacgccaactactcgatgcagaacgccgatcttatcctggcgctcggtgcccgc1140

tttgatgatcgtgtgacgggccgcgttgacgcctttgctccggaggctcgccgtgccgag1200

cgcgagggccgcggtggcatcgttcactttgagatttcccccaagaacctccacaaggtc1260

gtccagcccaccgtcgcggtcctcggcgacgtggtcgagaacctcgccaacgtcacgccc1320

cacgtgcagcgccaggagcgcgagccgtggtttgcgcagatcgccgattggaaggagaag1380

cacccttttctgctcgagtctgttgattcggacgacaaggttctcaagccgcagcaggtc1440

ctcacggagcttaacaagcagattctcgagattcaggagaaggacgccgaccaggaggtc1500

tacatcaccacgggcgtcggaagccaccagatgcaggcagcgcagttccttacctggacc1560

aagccgcgccagtggatctcctcgggtggcgccggcactatgggctacggccttccctcg1620

gccattggcgccaagattgccaagcccgatgctattgttattgacatcgatggtgatgct1680

tcttattcgatgaccggtatggaattgatcacagcagccgaattcaaggttggcgtgaag1740

attcttcttttgcagaacaactttcagggcatggtcaagaactggcaggatctcttttac1800

gacaagcgctactcgggcaccgccatgttcaacccgcgcttcgacaaggtcgccgatgcg1860

atgcgtgccaagggtctctactgcgcgaaacagtcggagctcaaggacaagatcaaggag1920

tttctcgagtacgatgagggtcccgtcctcctcgaggttttcgtggacaaggacacgctc1980

gtcttgcccatggtccccgctggctttccgctccacgagatggtcctcgagcctcctaag2040

cccaaggacgcc2052

<210>13

<211>2055

<212>dna

<213>人工序列

<220>

<223>突变的als3

<400>13

atgagcgcgacccgcgcggcgacgaggacagcggcggcgctgtcctcggcgctgacgacg60

cctgtaaagcagcagcagcagcagcagctgcgcgtaggcgcggcgtcggcacggctggcg120

gccgcggcgttctcgtccggcacgggcggagacgcggccaagaaggcggccgcggcgagg180

gcgttctccacgggacgcggccccaacgcgacacgcgagaagagctcgctggccacggtc240

caggcggcgacggacgatgcgcgcttcgtcggcctgaccggcgcccaaatctttcatgag300

ctcatgcgcgagcaccaggtggacaccatctttggctaccctggcggcgccattctgccc360

gtttttgatgccatttttgagagtgacgccttcaagttcattctcgctcgccacgagcag420

ggcgccggccacatggccgagggctacgcgcgcgccacgggcaagcccggcgttgtcctc480

gtcacctcgggccctggagccaccaacaccatcaccccgatcatggatgcttacatggac540

ggtacgccgctgctcgtgttcaccggccaggtgcagacctctgctgtcggcacggacgct600

ttccaggagtgtgacattgttggcatcagccgcgcgtgcaccaagtggaacgtcatggtc660

aaggacgtgaaggagctcccgcgccgcatcaatgaggcctttgagattgccatgagcggc720

cgcccgggtcccgtgctcgtcgatcttcctaaggatgtgaccgccgttgagctcaaggaa780

atgcccgacagctccccccaggttgctgtgcgccagaagcaaaaggtcgagcttttccac840

aaggagcgcattggcgctcctggcacggccgacttcaagctcattgccgagatgatcaac900

cgtgcggagcgacccgtcatctatgctggccagggtgtcatgcagagcccgttgaatggc960

ccggctgtgctcaaggagttcgcggagaaggccaacattcccgtgaccaccaccatgcag1020

ggtctcggcggctttgacgagcgtagtcccctctccctcaagatgctcggcatgcacggc1080

tctgcctacgccaactactcgatgcagaacgccgatcttatcctggcgctcggtgcccgc1140

tttgatgatcgtgtgacgggccgcgttgacgcctttgctccggaggctcgccgtgccgag1200

cgcgagggccgcggtggcatcgttcactttgagatttcccccaagaacctccacaaggtc1260

gtccagcccaccgtcgcggtcctcggcgacgtggtcgagaacctcgccaacgtcacgccc1320

cacgtgcagcgccaggagcgcgagccgtggtttgcgcagatcgccgattggaaggagaag1380

cacccttttctgctcgagtctgttgattcggacgacaaggttctcaagccgcagcaggtc1440

ctcacggagcttaacaagcagattctcgagattcaggagaaggacgccgaccaggaggtc1500

tacatcaccacgggcgtcggaagccaccagatgcaggcagcgcagttccttacctggacc1560

aagccgcgccagtggatctcctcgggtggcgccggcactatgggctacggccttccctcg1620

gccattggcgccaagattgccaagcccgatgctattgttattgacatcgatggtgatgct1680

tcttattcgatgaccggtatggaattgatcacagcagccgaattcaaggttggcgtgaag1740

attcttcttttgcagaacaactttcagggcatggtcaagaacgttcaggatctcttttac1800

gacaagcgctactcgggcaccgccatgttcaacccgcgcttcgacaaggtcgccgatgcg1860

atgcgtgccaagggtctctactgcgcgaaacagtcggagctcaaggacaagatcaaggag1920

tttctcgagtacgatgagggtcccgtcctcctcgaggttttcgtggacaaggacacgctc1980

gtcttgcccatggtccccgctggctttccgctccacgagatggtcctcgagcctcctaag2040

cccaaggacgcctaa2055

<210>14

<211>12

<212>dna

<213>裂殖壶菌属(schizochytrium)

<400>14

cacgacgagttg12

<210>15

<211>53

<212>prt

<213>裂殖壶菌属(schizochytrium)

<400>15

metalaasnilemetalaasnvalthrproglnglyvalalalysgly

151015

pheglyleuphevalglyvalleuphepheleutyrtrppheleuval

202530

glyleualaleuleuglyaspglyphelysvalilealaglyaspser

354045

alaglythrleuphe

50

<210>16

<211>21

<212>dna

<213>人工序列

<220>

<223>合成引物s4termf

<400>16

gatcccatggcacgtgctacg21

<210>17

<211>22

<212>dna

<213>人工序列

<220>

<223>合成引物s4termr

<400>17

ggcaacatgtatgataagatac22

<210>18

<211>21

<212>dna

<213>人工序列

<220>

<223>合成引物c2mcssmaf

<400>18

gatccccgggttaagcttggt21

<210>19

<211>20

<212>dna

<213>人工序列

<220>

<223>合成引物c2mcssmar

<400>19

actggggcccgtttaaactc20

<210>20

<211>34

<212>dna

<213>人工序列

<220>

<223>合成引物5'tubmcs_bgli

<400>20

gactagatctcaattttaggccccccactgaccg34

<210>21

<211>34

<212>dna

<213>人工序列

<220>

<223>合成引物3'sv40mcs_sal

<400>21

gactgtcgaccatgtatgataagatacattgatg34

<210>22

<211>28

<212>dna

<213>人工序列

<220>

<223>合成引物5'alspronde3

<400>22

gactcatatggcccaggcctactttcac28

<210>23

<211>34

<212>dna

<213>人工序列

<220>

<223>合成引物3'alstermbglii

<400>23

gactagatctgggtcaaggcagaagaattccgcc34

<210>24

<211>97

<212>dna

<213>人工序列

<220>

<223>合成引物sec.gfp5'1b

<400>24

tactggttccttgtcggcctcgcccttctcggcgatggcttcaaggtcatcgccggtgac60

tccgccggtacgctcttcatggtgagcaagggcgagg97

<210>25

<211>32

<212>dna

<213>人工序列

<220>

<223>合成引物sec.gfp3'spe

<400>25

gatcggtaccggtgttctttgttttgatttct32

<210>26

<211>105

<212>dna

<213>人工序列

<220>

<223>合成引物sec.gfp5'bam

<400>26

taatggatccatggccaacatcatggccaacgtcacgccccagggcgtcgccaagggctt60

tggcctctttgtcggcgtgctcttctttctctactggttccttgt105

<210>27

<211>40

<212>dna

<213>人工序列

<220>

<223>合成引物ss.egfpheld3'rv

<400>27

cctgatatcttacaactcgtcgtggttgtacagctcgtcc40

<210>28

<211>105

<212>dna

<213>人工序列

<220>

<223>合成引物sec.gfp5'bam2

<400>28

taatggatccatggccaacatcatggccaacgtcacgccccagggcgtcgccaagggctt60

tggcctctttgtcggcgtgctcttctttctctactggttccttgt105

<210>29

<211>27

<212>dna

<213>人工序列

<220>

<223>合成引物prrez15

<400>29

cggtacccgcgaatcaagaaggtaggc27

<210>30

<211>27

<212>dna

<213>人工序列

<220>

<223>合成引物prrez16

<400>30

cggatcccgtctctgccgctttttctt27

<210>31

<211>30

<212>dna

<213>人工序列

<220>

<223>合成引物prrez17

<400>31

cggatccgaaagtgaaccttgtcctaaccc30

<210>32

<211>27

<212>dna

<213>人工序列

<220>

<223>合成引物prrez18

<400>32

ctctagacagatccgcaccatcggccg27

<210>33

<211>32

<212>dna

<213>人工序列

<220>

<223>合成引物5'egfp_kpn

<400>33

gactggtaccatggtgaagcaagggcgaggag32

<210>34

<211>34

<212>dna

<213>人工序列

<220>

<223>合成引物3'egfp_xba

<400>34

gacttctagattacttgtacagctcgtccatgcc34

<210>35

<211>32

<212>dna

<213>人工序列

<220>

<223>合成引物5'orfcprokpn-2

<400>35

gatcggtaccggtgttctttgttttgatttct32

<210>36

<211>31

<212>dna

<213>人工序列

<220>

<223>合成引物3'orfcprokpn-2

<400>36

gatcggtaccgtctctgccgctttttcttta31

<210>37

<211>20

<212>prt

<213>裂殖壶菌属(schizochytrium)

<400>37

metlysphealathrservalalaileleuleuvalalaasnileala

151015

thralaleuala

20

<210>38

<211>60

<212>dna

<213>裂殖壶菌属(schizochytrium)

<400>38

atgaagttcgcgacctcggtcgcaattttgcttgtggccaacatagccaccgccctcgcg60

<210>39

<211>28

<212>dna

<213>人工序列

<220>

<223>合成引物5'ss-xbgllong

<400>39

gactagatctatgaagttcgcgacctcg28

<210>40

<211>33

<212>dna

<213>人工序列

<220>

<223>合成引物3'ritx_kap_bh_bgl

<400>40

gactagatcttcagcactcaccgcggttaaagg33

<210>41

<211>702

<212>dna

<213>人工序列

<220>

<223>优化的sec1

<400>41

atgaagttcgcgacctcggtcgcaattttgcttgtggccaacatagccaccgccctcgcg60

cagatcgtcctcagccagtcccccgccatcctttccgcttcccccggtgagaaggtgacc120

atgacctgccgcgctagctcctccgtctcgtacatccactggttccagcagaagcccggc180

tcgtcccccaagccctggatctacgccacctccaacctcgcctccggtgttcccgttcgt240

ttttccggttccggttccggcacctcctactccctcaccatctcccgcgtcgaggccgag300

gatgccgccacctactactgccagcagtggaccagcaacccccccaccttcggcggtggt360

acgaagctcgagattaagcgcaccgtcgccgccccctccgtcttcatttttcccccctcc420

gatgagcagctcaagtccggtaccgcctccgtcgtttgcctcctcaacaacttctacccc480

cgtgaggccaaggtccagtggaaggtcgacaacgcgcttcagtccggtaactcccaggag540

tccgtcaccgagcaggattcgaaggacagcacctactccctctcctccaccctcaccctc600

tccaaggccgactacgagaagcacaaggtctacgcctgcgaggtcacgcaccagggtctt660

tcctcccccgtcacgaagtcctttaaccgcggtgagtgctga702

<210>42

<211>853

<212>dna

<213>裂殖壶菌属(schizochytrium)

<400>42

ctccatcgatcgtgcggtcaaaaagaaaggaagaagaaaggaaaaagaaaggcgtgcgca60

cccgagtgcgcgctgagcgcccgctcgcggccccgcggagcctccgcgttagtccccgcc120

ccgcgccgcgcagtcccccgggaggcatcgcgcacctctcgccgccccctcgcgcctcgc180

cgattccccgcctccccttttccgcttcttcgccgcctccgctcgcggccgcgtcgcccg240

cgccccgctccctatctgctccccaggggggcactccgcaccttttgcgcccgctgccgc300

cgccgcggccgccccgccgccctggtttcccccgcgagcgcggccgcgtcgccgcgcaaa360

gactcgccgcgtgccgccccgagcaacgggtggcggcggcgcggcggcgggcggggcgcg420

gcggcgcgtaggcggggctaggcgccggctaggcgaaacgccgcccccgggcgccgccgc480

cgcccgctccagagcagtcgccgcgccagaccgccaacgcagagaccgagaccgaggtac540

gtcgcgcccgagcacgccgcgacgcgcggcagggacgaggagcacgacgccgcgccgcgc600

cgcgcggggggggggagggagaggcaggacgcgggagcgagcgtgcatgtttccgcgcga660

gacgacgccgcgcgcgctggagaggagataaggcgcttggatcgcgagagggccagccag720

gctggaggcgaaaatgggtggagaggatagtatcttgcgtgcttggacgaggagactgac780

gaggaggacggatacgtcgatgatgatgtgcacagagaagaagcagttcgaaagcgacta840

ctagcaagcaagg853

<210>43

<211>1064

<212>dna

<213>裂殖壶菌属(schizochytrium)

<400>43

ctcttatctgcctcgcgccgttgaccgccgcttgactcttggcgcttgccgctcgcatcc60

tgcctcgctcgcgcaggcgggcgggcgagtgggtgggtccgcagccttccgcgctcgccc120

gctagctcgctcgcgccgtgctgcagccagcagggcagcaccgcacggcaggcaggtccc180

ggcgcggatcgatcgatccatcgatccatcgatccatcgatcgtgcggtcaaaaagaaag240

gaagaagaaaggaaaaagaaaggcgtgcgcacccgagtgcgcgctgagcgcccgctcgcg300

gtcccgcggagcctccgcgttagtccccgccccgcgccgcgcagtcccccgggaggcatc360

gcgcacctctcgccgccccctcgcgcctcgccgattccccgcctccccttttccgcttct420

tcgccgcctccgctcgcggccgcgtcgcccgcgccccgctccctatctgctccccagggg480

ggcactccgcaccttttgcgcccgctgccgccgccgcggccgccccgccgccctggtttc540

ccccgcgagcgcggccgcgtcgccgcgcaaagactcgccgcgtgccgccccgagcaacgg600

gtggcggcggcgcggcggcgggcggggcgcggcggcgcgtaggcggggctaggcgccggc660

taggcgaaacgccgcccccgggcgccgccgccgcccgctccagagcagtcgccgcgccag720

accgccaacgcagagaccgagaccgaggtacgtcgcgcccgagcacgccgcgacgcgcgg780

cagggacgaggagcacgacgccgcgccgcgccgcgcggggggggggagggagaggcagga840

cgcgggagcgagcgtgcatgtttccgcgcgagacgacgccgcgcgcgctggagaggagat900

aaggcgcttggatcgcgagagggccagccaggctggaggcgaaaatgggtggagaggata960

gtatcttgcgtgcttggacgaggagactgacgaggaggacggatacgtcgatgatgatgt1020

gcacagagaagaagcagttcgaaagcgactactagcaagcaagg1064

<210>44

<211>837

<212>dna

<213>裂殖壶菌属(schizochytrium)

<400>44

cttcgctttctcaacctatctggacagcaatccgccacttgccttgatccccttccgcgc60

ctcaatcactcgctccacgtccctcttccccctcctcatctccgtgctttctctgccccc120

cccccccccgccgcggcgtgcgcgcgcgtggcgccgcggccgcgacaccttccatactat180

cctcgctcccaaaatgggttgcgctatagggcccggctaggcgaaagtctagcaggcact240

tgcttggcgcagagccgccgcggccgctcgttgccgcggatggagagggagagagagccc300

gcctcgataagcagagacagacagtgcgactgacagacagacagagagactggcagaccg360

gaatacctcgaggtgagtgcggcgcgggcgagcgggcgggagcgggagcgcaagagggac420

ggcgcggcgcggcggccctgcgcgacgccgcggcgtattctcgtgcgcagcgccgagcag480

cgggacgggcggctggctgatggttgaagcggggcggggtgaaatgttagatgagatgat540

catcgacgacggtccgtgcgtcttggctggcttggctggcttggctggcgggcctgccgt600

gtttgcgagaaagaggatgaggagagcgacgaggaaggacgagaagactgacgtgtaggg660

cgcgcgatggatgatcgattgattgattgattgattggttgattggctgtgtggtcgatg720

aacgtgtagactcagggagcgtggttaaattgttcttgcgccagacgcgaggactccacc780

cccttctttcgcctttacacagcctttttgtgaagcaacaagaaagaaaaagccaag837

<210>45

<211>1020

<212>dna

<213>裂殖壶菌属(schizochytrium)

<400>45

ctttttccgctctgcataatcctaaaagaaagactataccctagtcactgtacaaatggg60

acatttctctcccgagcgatagctaaggatttttgcttcgtgtgcactgtgtgctctggc120

cgcgcatcgaaagtccaggatcttactgtttctctttcctttcctttatttcctgttctc180

ttcttcgctttctcaacctatctggacagcaatccgccacttgccttgatccccttccgc240

gcctcaatcactcgctccacgtccctcttccccctcctcatctccgtgctttctctcgcc300

ccccccccccccgccgcggcgtgcgcgcgcgtggcgccgcggccgcgacaccttccatac360

tatcctcgctcccaaaatgggttgcgctatagggcccggctaggcgaaagtctagcaggc420

acttgcttggcgcagagccgccgcggccgctcgttgccgcggatggagagggagagagag480

cccgcctcgataagcagagacagacagtgcgactgacagacagacagagagactggcaga540

ccggaatacctcgaggtgagtgcggcgcgggcgagcgggcgggagcgggagcgcaagagg600

gacggcgcggcgcggcggccctgcgcgacgccgcggcgtattctcgtgcgcagcgccgag660

cagcgggacgggcggctggctgatggttgaagcggggcggggtgaaatgttagatgagat720

gatcatcgacgacggtccgtgcgtcttggctggcttggctggcttggctggcgggcctgc780

cgtgtttgcgagaaagaggatgaggagagcgacgaggaaggacgagaagactgacgtgta840

gggcgcgcgatggatgatcgattgattgattgattgattggttgattggctgtgtggtcg900

atgaacgtgtagactcagggagcgtggttaaattgttcttgcgccagacgcgaggactcc960

acccccttctttcgcctttacacagcctttttgtgaagcaacaagaaagaaaaagccaag1020

<210>46

<211>1416

<212>dna

<213>裂殖壶菌属(schizochytrium)

<400>46

cccgtccttgacgccttcgcttccggcgcggccatcgattcaattcacccatccgatacg60

ttccgccccctcacgtccgtctgcgcacgacccctgcacgaccacgccaaggccaacgcg120

ccgctcagctcagcttgtcgacgagtcgcacgtcacatatctcagatgcattgcctgcct180

gcctgcctgcctgcctgcctgcctgcctgcctgcctgcctcagcctctctttgctctctc240

tgcggcggccgctgcgacgcgctgtacaggagaatgactccaggaagtgcggctgggata300

cgcgctggcgtcggccgtgatgcgcgtgacgggcggcgggcacggccggcacgggttgag360

cagaggacgaagcgaggcgagacgagacaggccaggcgcggggagcgctcgctgccgtga420

gcagcagaccagggcgcaggaatgtacttttcttgcgggagcggagacgaggctgccggc480

tgctggctgccggttgctctgcacgcgccgcccgacttggcgtagcgtggacgcgcggcg540

gcggccgccgtctcgtcgcggtcggctttgccgtgtatcgacgctgcgggcttgacacgg600

gatggcggaagttcagcatcgctgcgatccctcgcgccgcagaacgaggagagcgcaggc660

cggcttcaagtttgaaaggagaggaaggcaggcaaggagctggaagcttgccgcggaagg720

cgcaggcatgcgtcacgtgaaaaaaagggatttcaagagtagtaagtaggtatggtctac780

aagtcccctattcttacttcgcggaacgtgggctgctcgtgcgggcgtccatcttgtttt840

tgtttttttttccgctaggcgcgtgcattgcttgatgagtctcagcgttcgtctgcagcg900

agggcaggaaaataagcggcccgtgccgtcgagcgcacaggacgtgcaagcgccttgcga960

gcgcagcatccttgcacggcgagcatagagaccgcggccgatggactccagcgaggaatt1020

ttcgaccctctctatcaagctgcgcttgacagccgggaatggcagcctgaggagagaggg1080

gcgaaggaagggacttggagaaaagaggtaaggcaccctcaatcacggcgcgtgaaagcc1140

agtcatccctcgcaaagaaaagacaaaagcgggttttttgtttcgatgggaaagaatttc1200

ttagaggaagaagcggcacacagactcgcgccatgcagatttctgcgcagctcgcgatca1260

aaccaggaacgtggtcgctgcgcgccactatcaggggtagcgcacgaataccaaacgcat1320

tactagctacgcgcctgtgacccgaggatcgggccacagacgttgtctcttgccatccca1380

cgacctggcagcgagaagatcgtccattactcatcg1416

<210>47

<211>24

<212>dna

<213>人工序列

<220>

<223>合成引物5'60s-807

<400>47

tcgatttgcggatacttgctcaca24

<210>48

<211>21

<212>dna

<213>人工序列

<220>

<223>合成引物3'60s-2821

<400>48

gacgacctcgcccttggacac21

<210>49

<211>34

<212>dna

<213>人工序列

<220>

<223>合成引物5'60sp-1302-kpn

<400>49

gactggtacctttttccgctctgcataatcctaa34

<210>50

<211>32

<212>dna

<213>人工序列

<220>

<223>合成引物3'60sp-bam

<400>50

gactggatccttggctttttctttcttgttgc32

<210>51

<211>24

<212>dna

<213>人工序列

<220>

<223>合成引物5'ef1-68

<400>51

cgccgttgaccgccgcttgactct24

<210>52

<211>24

<212>dna

<213>人工序列

<220>

<223>合成引物3'ef1-2312

<400>52

cgggggtagcctcggggatggact24

<210>53

<211>34

<212>dna

<213>人工序列

<220>

<223>合成引物5'ef1-54-kpn

<400>53

gactggtacctcttatctgcctcgcgccgttgac34

<210>54

<211>37

<212>dna

<213>人工序列

<220>

<223>合成引物5'ef1-1114-bam

<400>54

gactggatcccttgcttgctagtagtcgctttcgaac37

<210>55

<211>29

<212>dna

<213>人工序列

<220>

<223>合成引物5'sec1p-kpn

<400>55

gactggtaccccgtccttgacgccttcgc29

<210>56

<211>31

<212>dna

<213>人工序列

<220>

<223>合成引物3'sec1p-ba

<400>56

gactggatccgatgagtaatggacgatcttc31

<210>57

<211>1614

<212>dna

<213>人工序列

<220>

<223>分泌信号

<400>57

ggatccatgaagttcgcgacctcggtcgcaattttgcttgtggccaacatagccaccgcc60

ctcgcgtcgatgaccaacgagacctcggaccgccctctcgtgcactttacccccaacaag120

ggttggatgaacgatcccaacggcctctggtacgacgagaaggatgctaagtggcacctt180

tactttcagtacaaccctaacgacaccgtctggggcaccccgctcttctggggccacgcc240

acctccgacgacctcaccaactgggaggaccagcccattgctatcgcccccaagcgcaac300

gactcgggagctttttccggttccatggttgtggactacaacaacacctccggttttttt360

aacgacaccattgacccccgccagcgctgcgtcgccatctggacctacaacacgcccgag420

agcgaggagcagtacatcagctacagccttgatggaggctacacctttaccgagtaccag480

aagaaccctgtcctcgccgccaactccacccagttccgcgaccctaaggttttttggtac540

gagccttcccagaagtggattatgaccgccgctaagtcgcaggattacaagatcgagatc600

tacagcagcgacgacctcaagtcctggaagcttgagtccgcctttgccaacgagggtttt660

ctcggataccagtacgagtgccccggtctcatcgaggtccccaccgagcaggacccgtcc720

aagtcctactgggtcatgtttatttccatcaaccctggcgcccctgccggcggcagcttc780

aaccagtacttcgtcggctcctttaacggcacgcattttgaggccttcgacaaccagtcc840

cgcgtcgtcgacttcggcaaggactactacgccctccagaccttctttaacaccgacccc900

acctacggcagcgccctcggtattgcttgggcctccaactgggagtactccgctttcgtc960

cccactaacccctggcgcagctcgatgtccctcgtccgcaagttttcgcttaacaccgag1020

taccaggccaaccccgagaccgagcttattaacctgaaggccgagcctattctcaacatc1080

tccaacgctggcccctggtcccgctttgctactaacactaccctcaccaaggccaactcc1140

tacaacgtcgatctctccaactccaccggtactcttgagtttgagctcgtctacgccgtc1200

aacaccacccagaccatctccaagtccgtcttcgccgacctctccctctggttcaagggc1260

cttgaggaccccgaggagtacctgcgcatgggttttgaggtctccgcctcctccttcttc1320

ctcgatcgcggtaactccaaggttaagtttgtcaaggagaacccctactttactaaccgt1380

atgagcgtcaacaaccagccctttaagtccgagaacgatcttagctactacaaggtttac1440

ggcctcctcgaccagaacattctcgagctctactttaacgacggagatgtcgtcagcacc1500

aacacctactttatgaccactggaaacgccctcggcagcgtgaacatgaccaccggagtc1560

gacaacctcttttacattgacaagtttcaggttcgcgaggttaagtaacatatg1614

<210>58

<211>11495

<212>dna

<213>人工序列

<220>

<223>pcl0076

<400>58

ctcttatctgcctcgcgccgttgaccgccgcttgactcttggcgcttgccgctcgcatcc60

tgcctcgctcgcgcaggcgggcgggcgagtgggtgggtccgcagccttccgcgctcgccc120

gctagctcgctcgcgccgtgctgcagccagcagggcagcaccgcacggcaggcaggtccc180

ggcgcggatcgatcgatccatcgatccatcgatccatcgatcgtgcggtcaaaaagaaag240

gaagaagaaaggaaaaagaaaggcgtgcgcacccgagtgcgcgctgagcgcccgctcgcg300

gtcccgcggagcctccgcgttagtccccgccccgcgccgcgcagtcccccgggaggcatc360

gcgcacctctcgccgccccctcgcgcctcgccgattccccgcctccccttttccgcttct420

tcgccgcctccgctcgcggccgcgtcgcccgcgccccgctccctatctgctccccagggg480

ggcactccgcaccttttgcgcccgctgccgccgccgcggccgccccgccgccctggtttc540

ccccgcgagcgcggccgcgtcgccgcgcaaagactcgccgcgtgccgccccgagcaacgg600

gtggcggcggcgcggcggcgggcggggcgcggcggcgcgtaggcggggctaggcgccggc660

taggcgaaacgccgcccccgggcgccgccgccgcccgctccagagcagtcgccgcgccag720

accgccaacgcagagaccgagaccgaggtacgtcgcgcccgagcacgccgcgacgcgcgg780

cagggacgaggagcacgacgccgcgccgcgccgcgcggggggggggagggagaggcagga840

cgcgggagcgagcgtgcatgtttccgcgcgagacgacgccgcgcgcgctggagaggagat900

aaggcgcttggatcgcgagagggccagccaggctggaggcgaaaatgggtggagaggata960

gtatcttgcgtgcttggacgaggagactgacgaggaggacggatacgtcgatgatgatgt1020

gcacagagaagaagcagttcgaaagcgactactagcaagcaagggatccatgaagttcgc1080

gacctcggtcgcaattttgcttgtggccaacatagccaccgccctcgcgtcgatgaccaa1140

cgagacctcggaccgccctctcgtgcactttacccccaacaagggttggatgaacgatcc1200

caacggcctctggtacgacgagaaggatgctaagtggcacctttactttcagtacaaccc1260

taacgacaccgtctggggcaccccgctcttctggggccacgccacctccgacgacctcac1320

caactgggaggaccagcccattgctatcgcccccaagcgcaacgactcgggagctttttc1380

cggttccatggttgtggactacaacaacacctccggtttttttaacgacaccattgaccc1440

ccgccagcgctgcgtcgccatctggacctacaacacgcccgagagcgaggagcagtacat1500

cagctacagccttgatggaggctacacctttaccgagtaccagaagaaccctgtcctcgc1560

cgccaactccacccagttccgcgaccctaaggttttttggtacgagccttcccagaagtg1620

gattatgaccgccgctaagtcgcaggattacaagatcgagatctacagcagcgacgacct1680

caagtcctggaagcttgagtccgcctttgccaacgagggttttctcggataccagtacga1740

gtgccccggtctcatcgaggtccccaccgagcaggacccgtccaagtcctactgggtcat1800

gtttatttccatcaaccctggcgcccctgccggcggcagcttcaaccagtacttcgtcgg1860

ctcctttaacggcacgcattttgaggccttcgacaaccagtcccgcgtcgtcgacttcgg1920

caaggactactacgccctccagaccttctttaacaccgaccccacctacggcagcgccct1980

cggtattgcttgggcctccaactgggagtactccgctttcgtccccactaacccctggcg2040

cagctcgatgtccctcgtccgcaagttttcgcttaacaccgagtaccaggccaaccccga2100

gaccgagcttattaacctgaaggccgagcctattctcaacatctccaacgctggcccctg2160

gtcccgctttgctactaacactaccctcaccaaggccaactcctacaacgtcgatctctc2220

caactccaccggtactcttgagtttgagctcgtctacgccgtcaacaccacccagaccat2280

ctccaagtccgtcttcgccgacctctccctctggttcaagggccttgaggaccccgagga2340

gtacctgcgcatgggttttgaggtctccgcctcctccttcttcctcgatcgcggtaactc2400

caaggttaagtttgtcaaggagaacccctactttactaaccgtatgagcgtcaacaacca2460

gccctttaagtccgagaacgatcttagctactacaaggtttacggcctcctcgaccagaa2520

cattctcgagctctactttaacgacggagatgtcgtcagcaccaacacctactttatgac2580

cactggaaacgccctcggcagcgtgaacatgaccaccggagtcgacaacctcttttacat2640

tgacaagtttcaggttcgcgaggttaagtaacatatgttatgagagatccgaaagtgaac2700

cttgtcctaacccgacagcgaatggcgggagggggcgggctaaaagatcgtattacatag2760

tatttttcccctactctttgtgtttgtcttttttttttttttgaacgcattcaagccact2820

tgtctgggtttacttgtttgtttgcttgcttgcttgcttgcttgcctgcttcttggtcag2880

acggcccaaaaaagggaaaaaattcattcatggcacagataagaaaaagaaaaagtttgt2940

cgaccaccgtcatcagaaagcaagagaagagaaacactcgcgctcacattctcgctcgcg3000

taagaatcttagccacgcatacgaagtaatttgtccatctggcgaatctttacatgagcg3060

ttttcaagctggagcgtgagatcatacctttcttgatcgtaatgttccaaccttgcatag3120

gcctcgttgcgatccgctagcaatgcgtcgtactcccgttgcaactgcgccatcgcctca3180

ttgtgacgtgagttcagattcttctcgagaccttcgagcgctgctaatttcgcctgacgc3240

tccttcttttgtgcttccatgacacgccgcttcaccgtgcgttccacttcttcctcagac3300

atgcccttggctgcctcgacctgctcggtaagcttcgtcgtaatctcctcgatctcggaa3360

ttcttcttgccctccatccactcggcaccatacttggcagcctgttcaacacgctcattg3420

aaaaacttttcattctcttccagctccgcaacccgcgctcgaagctcattcacttccgcc3480

accacggcttcggcatcgagcgccgaatcagtcgccgaactttccgaaagatacaccacg3540

gcccctccgctgctgctgcgcagcgtcatcatcagtcgcgtgttatcttcgcgcagattc3600

tccacctgctccgtaagcagcttcacggtggcctcttgattctgagggctcacgtcgtgg3660

attagcgcttgcagctcttgcagctccgtcagcttggaagagctcgtaatcatggctttg3720

cacttgtccagacgtcgcagagcgttcgagagccgcttcgcgttatctgccatggacgct3780

tctgcgctcgcggcctccctgacgacagtctcttgcagtttcactagatcatgtccaatc3840

agcttgcggtgcagctctccaatcacgttctgcatcttgtttgtgtgtccgggccgcgcc3900

tcgtcttgcgatttgcgaatttcctcctcgagctcgcgttcgagctccagggcgccttta3960

agtagctcgaagtcagccgccgttagccccagctccgtcgccgcgttcagacagtcggtt4020

agcttgattcgattccgcttttccatggcaagtttaagatcctggcccagctgcacctcc4080

tgcgccttgcgcatcatgcgcggttccgcctggcgcaaaagcttcgagtcgtatcctgcc4140

tgccatgccagcgcaatggcacgcacgagcgacttgagttgccaactattcatcgccgag4200

atgagcagcattttgatctgcatgaacacctcgtcagagtcgtcatcctctgcctcctcc4260

agctctgcgggcgagcgacgctctccttgcagatgaagcgagggccgcaggcctccgaag4320

agcacctcttgcgcgagatcctcctccgtcgtcgccctccgcaggattgcggtcgtgtcc4380

gccatcttgccgccacagcagcttttgctcgctctgcaccttcaatttctggtgccgctg4440

gtgccgctggtgccgcttgtgctggtgctggtgctggtgctggtgctggtgccttgtgct4500

ggtgctgccacagacaccgccgctcctgctgctgctcttccggccccctcgccgccgccg4560

cgagcccccgccgcgcgccgtgcctgggctctccgcgctctccgcgggctcctcggcctc4620

ggcctcgccgtccgcgacgacgtctgcgcggccgatggtgcggatctgctctagagggcc4680

cttcgaaggtaagcctatccctaaccctctcctcggtctcgattctacgcgtaccggtca4740

tcatcaccatcaccattgagtttaaacgggccccagcacgtgctacgagatttcgattcc4800

accgccgccttctatgaaaggttgggcttcggaatcgttttccgggacgccggctggatg4860

atcctccagcgcggggatctcatgctggagttcttcgcccaccccaacttgtttattgca4920

gcttataatggttacaaataaagcaatagcatcacaaatttcacaaataaagcatttttt4980

tcactgcattctagttgtggtttgtccaaactcatcaatgtatcttatcatacatggtcg5040

acctgcaggaacctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtatt5100

gggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcga5160

gcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgca5220

ggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttg5280

ctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagt5340

cagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctcc5400

ctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctccct5460

tcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtc5520

gttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgcctta5580

tccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagca5640

gccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaag5700

tggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaag5760

ccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggt5820

agcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaa5880

gatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaaggg5940

attttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatga6000

agttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgctta6060

atcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactc6120

cccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatg6180

ataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccgga6240

agggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgt6300

tgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccatt6360

gctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcc6420

caacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttc6480

ggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggca6540

gcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgag6600

tactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcg6660

tcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaa6720

cgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaa6780

cccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtga6840

gcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttga6900

atactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatg6960

agcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacattt7020

ccccgaaaagtgccacctgacgtctaagaaaccattattatcatgacattaacctataaa7080

aataggcgtatcacgaggccctttcgtctcgcgcgtttcggtgatgacggtgaaaacctc7140

tgacacatgcagctcccggagacggtcacagcttgtctgtaagcggatgccgggagcaga7200

caagcccgtcagggcgcgtcagcgggtgttggcgggtgtcggggctggcttaactatgcg7260

gcatcagagcagattgtactgagagtgcaccaagctttgcctcaacgcaactaggcccag7320

gcctactttcactgtgtcttgtcttgcctttcacaccgaccgagtgtgcacaaccgtgtt7380

ttgcacaaagcgcaagatgctcactcgactgtgaagcaaaggttgcgcgcaagcgactgc7440

gactgcgaggatgaggatgactggcagcctgttcaaaaactgaaaatccgcgatgggtca7500

gctgccattcgcgcatgacgcctgcgagagacaagttaactcgtgtcactggcatgtcct7560

agcatctttacgcgagcaaaattcaatcgctttattttttcagtttcgtaaccttctcgc7620

aaccgcgaatcgccgtttcagcctgactaatctgcagctgcgtggcactgtcagtcagtc7680

agtcagtcgtgcgcgctgttccagcaccgaggtcgcgcgtcgccgcgcctggaccgctgc7740

tgctactgctagtggcacggcaggtaggagcttgttgccggaacaccagcagccgccagt7800

cgacgccagccaggggaaagtccggcgtcgaagggagaggaaggcggcgtgtgcaaacta7860

acgttgaccactggcgcccgccgacacgagcaggaagcaggcagctgcagagcgcagcgc7920

gcaagtgcagaatgcgcgaaagatccacttgcgcgcggcgggcgcgcacttgcgggcgcg7980

gcgcggaacagtgcggaaaggagcggtgcagacggcgcgcagtgacagtgggcgcaaagc8040

cgcgcagtaagcagcggcggggaacggtatacgcagtgccgcgggccgccgcacacagaa8100

gtatacgcgggccgaagtggggcgtcgcgcgcgggaagtgcggaatggcgggcaaggaaa8160

ggaggagacggaaagagggcgggaaagagagagagagagagtgaaaaaagaaagaaagaa8220

agaaagaaagaaagaaagctcggagccacgccgcggggagagagagaaatgaaagcacgg8280

cacggcaaagcaaagcaaagcagacccagccagacccagccgagggaggagcgcgcgcag8340

gacccgcgcggcgagcgagcgagcacggcgcgcgagcgagcgagcgagcgagcgcgcgag8400

cgagcaaggcttgctgcgagcgatcgagcgagcgagcgggaaggatgagcgcgacccgcg8460

cggcgacgaggacagcggcggcgctgtcctcggcgctgacgacgcctgtaaagcagcagc8520

agcagcagcagctgcgcgtaggcgcggcgtcggcacggctggcggccgcggcgttctcgt8580

ccggcacgggcggagacgcggccaagaaggcggccgcggcgagggcgttctccacgggac8640

gcggccccaacgcgacacgcgagaagagctcgctggccacggtccaggcggcgacggacg8700

atgcgcgcttcgtcggcctgaccggcgcccaaatctttcatgagctcatgcgcgagcacc8760

aggtggacaccatctttggctaccctggcggcgccattctgcccgtttttgatgccattt8820

ttgagagtgacgcgcttcaagttcattctcgctcgccacgagcagggcgccggccacatg8880

gccgagggctacgcgcgcgccacgggcaagcccggcgttgtcctcgtcacctcgggccct8940

ggagccaccaacaccatcaccccgatcatggatgcttacatggacggtacgccgctgctc9000

gtgttcaccggccaggtgcagacctctgctgtcggcacggacgctttccaggagtgtgac9060

attgttggcatcagccgcgcgtgcaccaagtggaacgtcatggtcaaggacgtgaaggag9120

ctcccgcgccgcatcaatgaggcctttgagattgccatgagcggccgcccgggtcccgtg9180

ctcgtcgatcttcctaaggatgtgaccgccgttgagctcaaggaaatgcccgacagctcc9240

ccccaggttgctgtgcgccagaagcaaaaggtcgagcttttccacaaggagcgcattggc9300

gctcctggcacggccgacttcaagctcattgccgagatgatcaaccgtgcggagcgaccc9360

gtcatctatgctggccagggtgtcatgcagagcccgttgaatggcccggctgtgctcaag9420

gagttcgcggagaaggccaacattcccgtgaccaccaccatgcagggtctcggcggcttt9480

gacgagcgtagtcccctctccctcaagatgctcggcatgcacggctctgcctacgccaac9540

tactcgatgcagaacgccgatcttatcctggcgctcggtgcccgctttgatgatcgtgtg9600

acgggccgcgttgacgcctttgctccggaggctcgccgtgccgagcgcgagggccgcggt9660

ggcatcgttcactttgagatttcccccaagaacctccacaaggtcgtccagcccaccgtc9720

gcggtcctcggcgacgtggtcgagaacctcgccaacgtcacgccccacgtgcagcgccag9780

gagcgcgagccgtggtttgcgcagatcgccgattggaaggagaagcacccttttctgctc9840

gagtctgttgattcggacgacaaggttctcaagccgcagcaggtcctcacggagcttaac9900

aagcagattctcgagattcaggagaaggacgccgaccaggaggtctacatcaccacgggc9960

gtcggaagccaccagatgcaggcagcgcagttccttacctggaccaagccgcgccagtgg10020

atctcctcgggtggcgccggcactatgggctacggccttccctcggccattggcgccaag10080

attgccaagcccgatgctattgttattgacatcgatggtgatgcttcttattcgatgacc10140

ggtatggaattgatcacagcagccgaattcaaggttggcgtgaagattcttcttttgcag10200

aacaactttcagggcatggtcaagaacgttcaggatctcttttacgacaagcgctactcg10260

ggccaccgccatgttcaacccgcgcttcgacaaggtcgccgatgcgatgcgtgccaaggg10320

tctctactgcgcgaaacagtcggagctcaaggacaagatcaaggagtttctcgagtacga10380

tgagggtcccgtcctcctcgaggttttcgtggacaaggacacgctcgtcttgcccatggt10440

ccccgctggctttccgctccacgagatggtcctcgagcctcctaagcccaaggacgccta10500

agttcttttttccatggcgggcgagcgagcgagcgcgcgagcgcgcaagtgcgcaagcgc10560

cttgccttgctttgcttcgcttcgctttgctttgcttcacacaacctaagtatgaattca10620

agttttcttgcttgtcggcgatgcctgcctgccaaccagccagccatccggccggccgtc10680

cttgacgccttcgcttccggcgcggccatcgattcaattcacccatccgatacgttccgc10740

cccctcacgtccgtctgcgcacgacccctgcacgaccacgccaaggccaacgcgccgctc10800

agctcagcttgtcgacgagtcgcacgtcacatatctcagatgcatttggactgtgagtgt10860

tattatgccactagcacgcaacgatcttcggggtcctcgctcattgcatccgttcgggcc10920

ctgcaggcgtggacgcgagtcgccgccgagacgctgcagcaggccgctccgacgcgaggg10980

ctcgagctcgccgcgcccgcgcgatgtctgcctggcgccgactgatctctggagcgcaag11040

gaagacacggcgacgcgaggaggaccgaagagagacgctggggtatgcaggatatacccg11100

gggcgggacattcgttccgcatacactcccccattcgagcttgctcgtccttggcagagc11160

cgagcgcgaacggttccgaacgcggcaaggattttggctctggtgggtggactccgatcg11220

aggcgcaggttctccgcaggttctcgcaggccggcagtggtcgttagaaatagggagtgc11280

cggagtcttgacgcgccttagctcactctccgcccacgcgcgcatcgccgccatgccgcc11340

gtcccgtctgtcgctgcgctggccgcgaccggctgcgccagagtacgacagtgggacaga11400

gctcgaggcgacgcgaatcgctcgggttgtaagggtttcaagggtcgggcgtcgtcgcgt11460

gccaaagtgaaaatagtaggggggggggggggtac11495

<210>59

<211>32

<212>prt

<213>裂殖壶菌属(schizochytrium)

<400>59

metargthrvalargglyproglnthralaalaleualaalaleuleu

151015

alaleualaalathrhisvalalavalserprophethrlysvalglu

202530

<210>60

<211>96

<212>dna

<213>裂殖壶菌属(schizochytrium)

<400>60

atgcgcacggtgagggggccgcaaacggcggcactcgccgcccttctggcacttgccgcg60

acgcacgtggctgtgagcccgttcaccaaggtggag96

<210>61

<211>30

<212>prt

<213>裂殖壶菌属(schizochytrium)

<400>61

metglyargleualalysserleuvalleuleuthralavalleuala

151015

valileglyglyvalargalaglugluasplyssergluala

202530

<210>62

<211>90

<212>dna

<213>裂殖壶菌属(schizochytrium)

<400>62

atgggccgcctcgcgaagtcgcttgtgctgctgacggccgtgctggccgtgatcggaggc60

gtccgcgccgaagaggacaagtccgaggcc90

<210>63

<211>38

<212>prt

<213>裂殖壶菌属(schizochytrium)

<400>63

metthrserthralaargalaleualaleuvalargalaleuvalleu

151015

alaleualavalleualaleuleualaserglnservalalavalasp

202530

arglyslyspheargthr

35

<210>64

<211>114

<212>dna

<213>裂殖壶菌属(schizochytrium)

<400>64

atgacgtcaacggcgcgcgcgctcgcgctcgtgcgtgctttggtgctcgctctggctgtc60

ttggcgctgctagcgagccaaagcgtggccgtggaccgcaaaaagttcaggacc114

<210>65

<211>34

<212>prt

<213>裂殖壶菌属(schizochytrium)

<400>65

metleuargleulysproleuleuleuleupheleucysserleuile

151015

alaserprovalvalalatrpalaargglyglygluglyproserthr

202530

serglu

<210>66

<211>102

<212>dna

<213>裂殖壶菌属(schizochytrium)

<400>66

atgttgcggctcaagccacttttactcctcttcctctgctcgttgattgcttcgcctgtg60

gttgcctgggcaagaggaggagaagggccgtccacgagcgaa102

<210>67

<211>29

<212>prt

<213>裂殖壶菌属(schizochytrium)

<400>67

metalalysileleuargserleuleuleualaalavalleuvalval

151015

thrproglnserleuargalahisserthrargaspala

2025

<210>68

<211>87

<212>dna

<213>裂殖壶菌属(schizochytrium)

<400>68

atggccaagatcttgcgcagtttgctcctggcggccgtgctcgtggtgactcctcaatca60

ctgcgtgctcattcgacgcgggacgca87

<210>69

<211>36

<212>prt

<213>裂殖壶菌属(schizochytrium)

<400>69

metvalpheargargvalprotrphisglyalaalathrleualaala

151015

leuvalvalalacysalathrcysleuglyleuglyleuaspserglu

202530

glualathrtyr

35

<210>70

<211>108

<212>dna

<213>裂殖壶菌属(schizochytrium)

<400>70

atggtgtttcggcgcgtgccatggcacggcgcggcgacgctggcggccttggtcgtggcc60

tgcgcgacgtgtttaggcctgggactggactcggaggaggccacgtac108

<210>71

<211>30

<212>prt

<213>裂殖壶菌属(schizochytrium)

<400>71

metthralaasnservallysileserilevalalavalleuvalala

151015

alaleualatrpgluthrcysalalysalaasntyrglntrp

202530

<210>72

<211>90

<212>dna

<213>裂殖壶菌属(schizochytrium)

<400>72

atgacagctaactcggtgaaaataagcatcgtggctgtgctggtcgcggcactggcttgg60

gaaacatgcgcaaaagctaactatcagtgg90

<210>73

<211>35

<212>prt

<213>裂殖壶菌属(schizochytrium)

<400>73

metalaargargalaserargleuglyalaalavalvalvalvalleu

151015

valvalvalalaseralacyscystrpglnalaalaalaaspvalval

202530

aspalagln

35

<210>74

<211>105

<212>dna

<213>裂殖壶菌属(schizochytrium)

<400>74

atggcgcgcagggcgtcgcgcctcggcgccgccgtcgtcgtcgtcctcgtcgtcgtcgcc60

tccgcctgctgctggcaagccgctgcggacgtcgtggacgcgcag105

<210>75

<211>1785

<212>dna

<213>人工序列

<220>

<223>密码子优化的核酸序列

<400>75

atgaagttcgcgacctcggtcgcaattttgcttgtggccaacatagccaccgccctcgcg60

gcctccccctcgatgcagacccgtgcctccgtcgtcattgattacaacgtcgctcctcct120

aacctctccaccctcccgaacggcagcctctttgagacctggcgtcctcgcgcccacgtt180

cttccccctaacggtcagattggcgatccctgcctccactacaccgatccctcgactggc240

ctctttcacgtcggctttctccacgatggctccggcatttcctccgccactactgacgac300

ctcgctacctacaaggatctcaaccagggcaaccaggtcatcgtccccggcggtatcaac360

gaccctgtcgctgttttcgacggctccgtcattccttccggcattaacggcctccctacc420

ctcctctacacctccgtcagctacctccccattcactggtccatcccctacacccgcggt480

tccgagacgcagagcctggctgtctccagcgatggtggctccaactttactaagctcgac540

cagggccccgttattcctggccccccctttgcctacaacgtcaccgccttccgcgacccc600

tacgtctttcagaaccccaccctcgactccctcctccactccaagaacaacacctggtac660

accgtcatttcgggtggcctccacggcaagggccccgcccagtttctttaccgtcagtac720

gaccccgactttcagtactgggagttcctcggccagtggtggcacgagcctaccaactcc780

acctggggcaacggcacctgggccggccgctgggccttcaacttcgagaccggcaacgtc840

ttttcgcttgacgagtacggctacaacccccacggccagatcttctccaccattggcacc900

gagggctccgaccagcccgttgtcccccagctcacctccatccacgatatgctttgggtc960

tccggtaacgtttcgcgcaacggatcggtttccttcactcccaacatggccggcttcctc1020

gactggggtttctcgtcctacgccgccgcgggtaaggttcttccttccacgtcgctcccc1080

tccaccaagtccggtgcccccgatcgcttcatttcgtacgtttggctctccggcgacctc1140

tttgagcaggctgagggctttcctaccaaccagcagaactggaccggcaccctcctcctc1200

ccccgtgagctccgcgtcctttacatccccaacgtggttgataacgcccttgcgcgcgag1260

tccggcgcttcctggcaggtcgtctcctccgatagctcggccggtactgtggagctccag1320

accctcggcatttccatcgcccgcgagaccaaggccgccctcctgtccggcacctcgttc1380

actgagtccgaccgcactcttaactcctccggcgtcgttccctttaagcgttccccctcc1440

gagaagtttttcgtcctctccgcccagctctccttccccgcctccgcccgcggctcgggc1500

ctcaagtccggcttccagattctttcctccgagctcgagtccaccacggtctactaccag1560

tttagcaacgagtccatcatcgtcgaccgcagcaacaccagcgccgccgcccgtactacc1620

gacggtatcgactcctccgccgaggccggcaagctccgcctctttgacgtcctcaacggc1680

ggcgagcaggctattgagaccctcgaccttaccctcgtcgttgataactccgtgctcgag1740

atttacgccaacggtcgtttcgcgctttccacctgggttcgctaa1785

<210>76

<211>1682

<212>dna

<213>人工序列

<220>

<223>密码子优化的ha

<400>76

atgaaggctaacctcctcgttcttctttccgctctcgctgctgcggatgccgacaccatc60

tgcattggctaccacgctaacaacagcacggacaccgtcgatactgtcctggagaagaac120

gttaccgcacccattcggtcaacctcctggaggacagccacaacggcaagctctgccgtc180

ttaagggcatcgcccccctccagctcggcaagtgcaacatcgccggctggctcctcggca240

acccggagtgcgatccctcctccccgttcgctcctggtcgtacattgtggagactccgaa300

cagcgagaacggtatctgctaccccggcgattttatcgactacgaggagctccgcgagca360

gctctcctccgtgtccagcttgagcgtttcgagatttttccgaaggagtcctcgtggccc420

aaccacaacaccaacggcgtcaccgccgcctgctcccacgagggcaagtcgagcttttac480

cgcaacctgctttggctcaccgagaagggggttcgtaccctaagctcaagaactcgtacg540

tcaacaagaagggcaaggaggtcctcgtcctctggggcatccaccatcccccgaacagca600

aggagcagcagaacatctaccagaacgagaacgccacgtttcggtggtcacgtcgaacta660

caaccgccgcttcactcctgagatcgccgagcgccccaaggtgcgcgaccaggctggccg720

catgaactactactggaccctccttaagcccggtgacacgatatctttgaggccaacggc780

aaccttatcgcgcccatgtacgcgttcgccctctcccgcggctttggtagcggcatcatt840

accagcaacgccagcatgcacgagtgcaacacgaagtgccagaccccgccggtgccatca900

acagcagcctgccttaccagaacatccaccccgtcaccatcggtgagtgcccgaagtacg960

tgcgctcggccaagctccgcatggtcacgggcctccgcaacactccttcgatccagcccg1020

cggcctcttcggcgccattgccggtttcatcgagggcggctggacgggcatgatcgacgg1080

ctggtacggctaccaccaccagaacgagcagggctccggttacgccgcggaccagaagtc1140

caccagaacgccatcaacggcattactaacaaggtcaacacggtcatcgagaagatgaac1200

attcagtttaccgctgtcggcaaggagttcaacaagctggagaagcgcatggagaacctc1260

aacaagaaggggacgatggtttcctggacatttggacctacaacgccgagctcctcgtgc1320

tccttgagaacgagcgtaccctcgacttccacgactccaacgtcaagaacctctacgaga1380

aggtcaagtcgcagctcagaacaacgccaaggagattggcaacggttgcttcgagtttta1440

ccacaagtgcgacaacgagtgcatggagtccgtccgcaacggcacctacgactacccgaa1500

gtactccgaggagtcgaagctgaacgcgagaaggtggacggcgtgaagctggagtccatg1560

ggcatctaccagatcctcgccatttactcgacggttgcctcgtcgctcgtcctccttgtc1620

tccctcggtgcgatttcgttctggatgtgctgaacggcagccttcagtgccgcatctgca1680

tc1682

<210>77

<211>565

<212>prt

<213>甲型流感病毒

<400>77

metlysalaasnleuleuvalleuleuseralaleualaalaalaasp

151015

alaaspthrilecysileglytyrhisalaasnasnserthraspthr

202530

valaspthrvalleuglulysasnvalthrvalthrhisservalasn

354045

leuleugluaspserhisasnglylysleucysargleulysglyile

505560

alaproleuglnleuglylyscysasnilealaglytrpleuleugly

65707580

asnproglucysaspproleuleuprovalargsertrpsertyrile

859095

valgluthrproasnsergluasnglyilecystyrproglyaspphe

100105110

ileasptyrglugluleuarggluglnleuserservalserserphe

115120125

gluargphegluilepheprolysglusersertrpproasnhisasn

130135140

thrasnglyvalthralaalacysserhisgluglylysserserphe

145150155160

tyrargasnleuleutrpleuthrglulysgluglysertyrprolys

165170175

leulysasnsertyrvalasnlyslysglylysgluvalleuvalleu

180185190

trpglyilehishisproproasnserlysgluglnglnasniletyr

195200205

glnasngluasnalatyrvalservalvalthrserasntyrasnarg

210215220

argphethrprogluilealagluargprolysvalargaspglnala

225230235240

glyargmetasntyrtyrtrpthrleuleulysproglyaspthrile

245250255

ilepheglualaasnglyasnleuilealapromettyralapheala

260265270

leuserargglypheglyserglyileilethrserasnalasermet

275280285

hisglucysasnthrlyscysglnthrproleuglyalaileasnser

290295300

serleuprotyrglnasnilehisprovalthrileglyglucyspro

305310315320

lystyrvalargseralalysleuargmetvalthrglyleuargasn

325330335

thrproserileglnserargglyleupheglyalailealaglyphe

340345350

ilegluglyglytrpthrglymetileaspglytrptyrglytyrhis

355360365

hisglnasngluglnglyserglytyralaalaaspglnlysserthr

370375380

glnasnalaileasnglyilethrasnlysvalasnthrvalileglu

385390395400

lysmetasnileglnphethralavalglylysglupheasnlysleu

405410415

glulysargmetgluasnleuasnlyslysvalaspaspglypheleu

420425430

aspiletrpthrtyrasnalagluleuleuvalleuleugluasnglu

435440445

argthrleuaspphehisaspserasnvallysasnleutyrglulys

450455460

vallysserglnleulysasnasnalalysgluileglyasnglycys

465470475480

phegluphetyrhislyscysaspasnglucysmetgluservalarg

485490495

asnglythrtyrasptyrprolystyrserglugluserlysleuasn

500505510

argglulysvalaspglyvallysleuglusermetglyiletyrgln

515520525

ileleualailetyrserthrvalalaserserleuvalleuleuval

530535540

serleuglyalaileserphetrpmetcysserasnglyserleugln

545550555560

cysargilecysile

565

<210>78

<211>51

<212>prt

<213>裂殖壶菌属(schizochytrium)

<220>

<223>glcnac-转移酶-i样蛋白

<400>78

metargglyproglymetvalglyleuserargvalasparggluhis

151015

leuargargargglnglnglnalaalaserglutrpargargtrpgly

202530

phephevalalathralavalvalleuleuvalpheleuthrvaltyr

354045

proasnval

50

<210>79

<211>153

<212>dna

<213>裂殖壶菌属(schizochytrium)

<220>

<223>信号锚序列

<400>79

atgcgcggcccgggcatggtcggcctcagccgcgtggaccgcgagcacctgcggcggcgg60

cagcagcaggcggcgagcgaatggcggcgctgggggttcttcgtcgcgacggccgtcgtc120

ctgctcgtctttctcaccgtatacccgaacgta153

<210>80

<211>66

<212>prt

<213>裂殖壶菌属(schizochytrium)

<220>

<223>β-1,2-木糖基转移酶样蛋白

<400>80

metargthrargglyalaalatyrvalargproglyglnhisgluala

151015

lysalaleuserserargserseraspgluglytyrthrthrvalasn

202530

valvalargthrlysarglysargthrthrvalalaalaleuvalala

354045

alaalaleuleuvalthrglypheilevalvalvalvalphevalval

505560

valval

65

<210>81

<211>198

<212>dna

<213>裂殖壶菌属(schizochytrium)

<220>

<223>信号锚序列

<400>81

atgcgcacgcggggcgcggcgtacgtgcggccgggacagcacgaggcgaaggcgctctcg60

tcaaggagcagcgacgagggatatacgacggtcaacgttgtcaggaccaagcgaaagagg120

accactgtagccgcgcttgtagccgcggcgctgctggtgacgggctttatcgtcgtcgtc180

gtcttcgtcgtcgttgtt198

<210>82

<211>64

<212>prt

<213>裂殖壶菌属(schizochytrium)

<220>

<223>β-1,4-木糖苷样蛋白

<400>82

metglualaleuarggluproleualaalaproprothrseralaarg

151015

serservalproalaproleualalysglugluglygluglugluasp

202530

glyglulysglythrpheglyalaglyvalleuglyvalvalalaval

354045

leuvalilevalvalphealailevalalaglyglyglyglyaspile

505560

<210>83

<211>192

<212>dna

<213>裂殖壶菌属(schizochytrium)

<220>

<223>信号锚序列

<400>83

atggaggccctgcgcgagcccttggctgcgccgccaacgtcggcgcgatcgtcggtgcca60

gcgccgctcgcgaaggaggagggggaggaggaggacggggaaaaagggacgtttggggcg120

ggggtcctcggtgtcgtggcggtgctcgtcatcgtggtgtttgcgatcgtggcgggaggc180

ggaggcgatatt192

<210>84

<211>73

<212>prt

<213>裂殖壶菌属(schizochytrium)

<220>

<223>半乳糖基转移酶样蛋白

<400>84

metleuservalalaglnvalalaglyseralahisserargproarg

151015

argglyglygluargmetglnaspvalleualaleuglugluserser

202530

argasparglysargalathralaargproglyleutyrargalaleu

354045

alaileleuglyleuproleuilevalpheilevaltrpglnmetthr

505560

serserleuthrthralaproserala

6570

<210>85

<211>219

<212>dna

<213>裂殖壶菌属(schizochytrium)

<220>

<223>信号锚序列

<400>85

atgttgagcgtagcacaagtcgcggggtcggcccactcgcggccgagacgaggtggtgag60

cggatgcaagacgtgctggccctggaggaaagcagcagagatcgaaaacgagcaacagca120

aggcccgggctatatcgcgcacttgcgattctggggctgccgctcatcgtattcatcgta180

tggcaaatgactagctccctcacgactgccccgagcgcc219

<210>86

<211>997

<212>prt

<213>裂殖壶菌属(schizochytrium)

<220>

<223>emc1

<400>86

metglythrthrthralaargmetalavalalavalleualaalaala

151015

valservalalahisglyleuhisgluaspglnalaglyvalasnasp

202530

trpthrvalargasnleuglyalatyralahisglyvalpheleuasp

354045

aspaspleualaleuvalalathrthrglnalathrvalglyalaval

505560

argmetthraspglygluvalvaltrparggluthrleuprothrala

65707580

argseralaproleualaserglnvallyshisgluleuphealathr

859095

alaseralaaspalacysvalilegluleutrpalathrprosergly

100105110

aspvalmetthrseraspserargglnalaglyleuglutrpaspala

115120125

lysilecysaspasnthraspalaaspalathrglyvalleugluleu

130135140

leuaspasnasppheasnasnaspglythrproaspvalalaalaleu

145150155160

thrpropheglnphevalileleuaspglyvalserglyargvalleu

165170175

hisgluvalaspleuasplysthrilealatrpglnglyleuvalglu

180185190

alaalaglyseralathrglyglylysarglysargproserilemet

195200205

alatyrglyvalaspilelysthrglylysleugluvalarglysleu

210215220

alaasnserglyalathrleuaspprovalserglyleugluglyval

225230235240

seralaaspgluilethrvalleulysserglyvalalalysvalgly

245250255

seralaleuleuphevalarglysgluserglyalaleuvalalaphe

260265270

aspcysvalalaasnglnleuglngluleuthrasnalaproserile

275280285

lysglyservalglnserleuglyseralaargphephealathrasp

290295300

alaglyvaliletyralavalaspglygluleulysilealagluthr

305310315320

leulysglyvalglualaalaalaileglyvalserglyalaserval

325330335

ilealaalavalglnserserthralaserglythrglyaspgluala

340345350

glncysglyproileserargvalleuvalglnseralaserglyval

355360365

thrgluilealapheprogluglnglnglyglnserglyalaarggly

370375380

leuvalglulysileilevalglyaspserserthrglythrargala

385390395400

ilephevalphegluaspalaseralavalglyilegluilegluser

405410415

glyalaserglualaserthrleuphevalarggluglualaleuala

420425430

asnvalvalglualavalalavalaspleuproprothraspgluval

435440445

glyserleuglyaspglualaalahisvalphealahisglyserhis

450455460

alaserilephemetpheargleulysaspglnvalargthrvalgln

465470475480

argphevalglnserleupheglyalaalathrglnhisleuserglu

485490495

phevalalaserglnglylysthrleuvalglnalaileargglyglu

500505510

leuproargalagluserleuserglnserglumetpheserphegly

515520525

pheargargvalleuvalleuargseralaserglylysvalphegly

530535540

leuasnseralaaspglyserleuleutrpalaalaglnserprogly

545550555560

serargleuphevalthrargalaargglualaglyleuasphispro

565570575

alagluvalalailevalaspglualahisglyargvalthrtrparg

580585590

asnalailethrglyalavalthrargvalgluaspileaspthrpro

595600605

leualaglnilealavalleuproglyaspilepheproserthrala

610615620

serserglugluaspvalserproalaalavalleuilealaleuasp

625630635640

hisalaglnargvalhisileleuproserserargthrgluserval

645650655

leuglnleugluaspleuleuargalaleuhisphevalvaltyrser

660665670

asngluthrglyalaleuthrglytyralavalaspproserglnarg

675680685

alaglyvalgluleutrpsermetilevalproalaserglnthrleu

690695700

leualavalgluglyglnserglyglyalaleuasnasnproglyile

705710715720

lysargglyaspglyalavalleuvallysphevalaspprohisleu

725730735

leumetvalalathrglnserglyprohisleuglnvalserileleu

740745750

asnglyileserglyargvalileserargphethrhislyslysser

755760765

thrglyprovalhisalavalleualaaspasnthrvalthrtyrser

770775780

phetrpasnglnvallysserargglngluvalservalvalglyleu

785790795800

phegluglygluileglyproarggluleuasnmettrpserserarg

805810815

proasnmetglyserglylysalametseralapheaspaspsermet

820825830

metproasnvalglnglnlysthrphetyrthrgluargalaileala

835840845

alaleuglyvalthrlysthrargpheglyilealaaspargargval

850855860

leuileglythralaasnglyalavalasnmetglnvalproglnile

865870875880

leuserproargargprovalglylysleuseraspmetglulysglu

885890895

gluglyleumetleutyralaprogluleuproleuileprothrgln

900905910

thrilethrtyrtyrgluserileproglnleuargleuileargser

915920925

phealathrargleugluserthrserleuvalleualaalaglyleu

930935940

aspilephetyrthrargvalmetproserargglypheaspvalleu

945950955960

aspgluaspphealaserglyleuleuleualaleuilealaalaleu

965970975

leualaleuthriletyrleuserlysalavalglylysserthrleu

980985990

aspgluthrtrplys

995

<210>87

<211>731

<212>prt

<213>裂殖壶菌属(schizochytrium)

<220>

<223>nicastrin样

<400>87

metglyalaalaargargsermetglyalaalaarglysalaleuala

151015

alaseralathrleualaalaleualaleualaglyleuglnproala

202530

argalagluvalasnglyvalasnalametthrglualametleuthr

354045

glutyralaserleuprocysvalargserilealaargaspglyala

505560

valglycysglyserproseraspargservalalagluglyglyala

65707580

leupheleuvalgluservalgluaspvalthrglyleuilegluasn

859095

alaglnglyleuaspalavalalaleuvalvalaspaspalaleuleu

100105110

hisglyaspserleuargalametglnaspleualalyslysilearg

115120125

valthralavalilevalthrvalglugluaspglyserproglnglu

130135140

proproargserseralaalaprothrthrtrpileproserglyasp

145150155160

glyleuleuasngluthrvalserphevalvalthrargleuargasn

165170175

alathrglnserglugluileargalaleualaalaserasnargasp

180185190

argglytyrvalaspalavalpheglnhisseralaargtyrglnphe

195200205

tyrleuglylysgluthralathrserleusercysleualasergly

210215220

argcysaspproleuglyglyleuservaltrpalaseralaglypro

225230235240

valprovalasnseralalysgluthrvalleuleuthralaasnleu

245250255

aspalaalaserphephehisaspvalvalproalaargaspthrthr

260265270

alaserglyvalalaalavalleuleualaalalysalaleualaser

275280285

valaspgluservalleuglualaleuserlysglnilealavalala

290295300

leupheasnglygluvaltrpserargalaglyserargargpheval

305310315320

hisaspvalalaleuglyglucysleuserproglnthralaserpro

325330335

tyrasngluserthrcysalaasnproprovaltyralaleualatrp

340345350

thrserleuglyleuaspasnilethraspvalvalservalasnasn

355360365

valalaglysergluserglyalaphetyrvalhisthralaalagly

370375380

thralaseralaasnalaalaalaalaleuglnservalalaserser

385390395400

serthraspvalaspvalserilethrglyalathrthrserglyval

405410415

valproproserproleuaspserpheleualaalaglumetgluthr

420425430

aspvalserpheserglyalaglyleuvalvalserglypheaspala

435440445

alailethraspalaasnproargtyrserserargtyraspargarg

450455460

asplysglyproglualaaspaspalaglualaleuthralaalaarg

465470475480

ilealaaspvalalathrleuleualaarghisalaphevalglnala

485490495

glyglyserileseraspalavalasnphevalleuvalaspglythr

500505510

hisalaalagluleutrpaspcysleuthrlysaspphealacysthr

515520525

leuvalalaaspvalileglyalagluaspthrthralavalalaasp

530535540

phemetglyserthrleuleualaalasergluglyvalalaglygly

545550555560

alaproasnphepheserglyiletyrserpropheprovalgluasn

565570575

asnvalmetargprovalproleuphevalargasptyrleualagln

580585590

tyrglyargasnalaserleuileglulysvalthrgluseralalys

595600605

tyralacysalaglnaspleuaspcysmetvalmetthrglupropro

610615620

alacysgluleuglyargseralaleualacysleuargglyglycys

625630635640

valcysserasnalatyrphehisaspalavalserproalaleuval

645650655

tyrgluaspglyalapheservalaspalaglnlysleuthraspasp

660665670

aspglyleutrpthrgluproargtrpseraspglythrleuthrleu

675680685

tyrthrseralaasnseralaserthrthrilealaleuleuvalcys

690695700

glyileleuleuthrileglycysvalphealaleuarglysalagln

705710715720

glymetleuaspasnthrlystyrlysleuasn

725730

<210>88

<211>232

<212>prt

<213>裂殖壶菌属(schizochytrium)

<220>

<223>emp24

<400>88

metalathrthrgluasnglualaargleuproproglylysglnarg

151015

leuglyargargargargglyargvalserlysalaserglytrpgly

202530

thrthrleualaleualaalaalavalleuvalpheservalasparg

354045

alaserglyvalargphegluvalalaserthrglugluargcysile

505560

pheaspvalleuarglysaspglnleuvalthrglygluphegluval

65707580

hisalaaspglyaspaspvalasnmetaspilehisvalthrglypro

859095

leuglyglugluvalpheserlysglnasnserlysmetalalysphe

100105110

glyphethralaglualaalaglygluhisvalleucysleuargasn

115120125

asnaspmetilemetarggluvalglnvallysleuargserglyval

130135140

glualalysaspleuthrgluvalvalglnarghishisleulyspro

145150155160

leuseralagluvalileargileglngluthrileargaspvalarg

165170175

hisgluleuthralaleulysglnargglualaglumetargaspmet

180185190

asngluserileasnthrargvalserleupheserphepheserile

195200205

alavalvalglyserleuglyalatrpglnilemettyrleulysser

210215220

tyrpheglnarglyslysleuile

225230

<210>89

<211>550

<212>prt

<213>裂殖壶菌属(schizochytrium)

<220>

<223>calnexin样

<400>89

metargthrthrphevalalaalatyralaalavalalaalaleuala

151015

leuglyglncysglualaileasnphearggluserphegluglyala

202530

asnvalglulysglutrpvallysseralaseraspargtyralagly

354045

serglutrpalapheaspthrserlysaspthrglyaspvalglyleu

505560

glnthrvallysprohislysphetyrglyileserarglyspheglu

65707580

asnproileprovalglyaspglyglulysprophevalalaglntyr

859095

gluvallysphethrgluglyvalsercysserglyalatyrleulys

100105110

leuleugluglnaspaspalaphethrprolysaspleuvalgluser

115120125

serprotyrserilemetpheglyproaspasncysglyalaasnasn

130135140

lysvalhisleuilepheargglngluasnprovalthrlysglutyr

145150155160

gluglulyshismetthrlyslysvalthrservalargaspargthr

165170175

serhisvaltyrthrleugluvalhisproaspasnthrphelysval

180185190

lysvalaspglylysvalglualagluglyserleuthraspaspglu

195200205

alapheserpropropheglnglnprolysgluileaspaspproasn

210215220

aspglulysproaspasptrpvalaspglnalalysileproasppro

225230235240

glualaserlysproaspasptrpaspgluaspalaprolysargile

245250255

alaaspproaspalavallysprogluglytrpleuaspaspglupro

260265270

aspglnvalproaspproalaalasergluprogluasptrpaspglu

275280285

gluaspaspglyiletrpglualaproleuvalalaasnprolyscys

290295300

thralaglyproglycysglyglutrpasnalaprometilegluasn

305310315320

proasntyrlysglylystrpseralaprometileaspasnproglu

325330335

tyrlysglyvaltrplysproargargilegluasnproalatyrphe

340345350

glugluserserprovalthrthrilelysproileglyalavalala

355360365

ilegluileleualaasnasplysglyileargpheaspasnileile

370375380

ileglyasnaspvallysglualaalaglupheileasplysgluphe

385390395400

leualalysglnalaaspglulysalalysvallysgluglualaala

405410415

glnalaalaglnasnserargtrpgluglutyrlyslysglyserile

420425430

glnglytyrvalmettrptyralaglyasptyrileasptyrvalmet

435440445

gluleutyrglualaserproilealavalglyvalglyalaalaala

450455460

alaglyleualavalleuvalalaleumetvalmetcysmetsergly

465470475480

alaprogluglutyraspaspaspvalalaleuhislyslysaspasp

485490495

aspalaalaalaglyaspaspaspglualaglualaglualagluasn

500505510

aspalaalaaspgluaspgluaspglugluaspaspaspaspgluglu

515520525

aspgluaspgluglugluaspgluaspglualathrglyproargarg

530535540

argvalasnargalaasn

545550

<210>90

<211>6175

<212>dna

<213>人工的

<220>

<223>pcl0121

<400>90

ctcttatctgcctcgcgccgttgaccgccgcttgactcttggcgcttgccgctcgcatcc60

tgcctcgctcgcgcaggcgggcgggcgagtgggtgggtccgcagccttccgcgctcgccc120

gctagctcgctcgcgccgtgctgcagccagcagggcagcaccgcacggcaggcaggtccc180

ggcgcggatcgatcgatccatcgatccatcgatccatcgatcgtgcggtcaaaaagaaag240

gaagaagaaaggaaaaagaaaggcgtgcgcacccgagtgcgcgctgagcgcccgctcgcg300

gtcccgcggagcctccgcgttagtccccgccccgcgccgcgcagtcccccgggaggcatc360

gcgcacctctcgccgccccctcgcgcctcgccgattccccgcctccccttttccgcttct420

tcgccgcctccgctcgcggccgcgtcgcccgcgccccgctccctatctgctccccagggg480

ggcactccgcaccttttgcgcccgctgccgccgccgcggccgccccgccgccctggtttc540

ccccgcgagcgcggccgcgtcgccgcgcaaagactcgccgcgtgccgccccgagcaacgg600

gtggcggcggcgcggcggcgggcggggcgcggcggcgcgtaggcggggctaggcgccggc660

taggcgaaacgccgcccccgggcgccgccgccgcccgctccagagcagtcgccgcgccag720

accgccaacgcagagaccgagaccgaggtacgtcgcgcccgagcacgccgcgacgcgcgg780

cagggacgaggagcacgacgccgcgccgcgccgcgcggggggggggagggagaggcagga840

cgcgggagcgagcgtgcatgtttccgcgcgagacgacgccgcgcgcgctggagaggagat900

aaggcgcttggatcgcgagagggccagccaggctggaggcgaaaatgggtggagaggata960

gtatcttgcgtgcttggacgaggagactgacgaggaggacggatacgtcgatgatgatgt1020

gcacagagaagaagcagttcgaaagcgactactagcaagcaagggatccatgaagttcgc1080

gacctcggtcgcaattttgcttgtggccaacatagccaccgccctcgcgcagagcgatgg1140

ctgcacccccaccgaccagacgatggtgagcaagggcgaggagctgttcaccggggtggt1200

gcccatcctggtcgagctggacggcgacgtaaacggccacaagttcagcgtgtccggcga1260

gggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaa1320

gctgcccgtgccctggcccaccctcgtgaccaccctgacctacggcgtgcagtgcttcag1380

ccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggcta1440

cgtccaggagcgcaccatcttcttcaaggacgacggcaactacaagacccgcgccgaggt1500

gaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaagga1560

ggacggcaacatcctgggacacaagctggagtacaactacaacagccacaacgtctatat1620

catggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatcga1680

ggacggcagcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggccc1740

cgtgctgctgcccgacaaccactacctgagcacccagtccgccctgagcaaagaccccaa1800

cgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcgg1860

catggacgagctgtacaagcaccaccatcaccaccactaacatatgagttatgagatccg1920

aaagtgaaccttgtcctaacccgacagcgaatggcgggagggggcgggctaaaagatcgt1980

attacatagtatttttcccctactctttgtgtttgtcttttttttttttttgaacgcatt2040

caagccacttgtctgggtttacttgtttgtttgcttgcttgcttgcttgcttgcctgctt2100

cttggtcagacggcccaaaaaagggaaaaaattcattcatggcacagataagaaaaagaa2160

aaagtttgtcgaccaccgtcatcagaaagcaagagaagagaaacactcgcgctcacattc2220

tcgctcgcgtaagaatcttagccacgcatacgaagtaatttgtccatctggcgaatcttt2280

acatgagcgttttcaagctggagcgtgagatcatacctttcttgatcgtaatgttccaac2340

cttgcataggcctcgttgcgatccgctagcaatgcgtcgtactcccgttgcaactgcgcc2400

atcgcctcattgtgacgtgagttcagattcttctcgagaccttcgagcgctgctaatttc2460

gcctgacgctccttcttttgtgcttccatgacacgccgcttcaccgtgcgttccacttct2520

tcctcagacatgcccttggctgcctcgacctgctcggtaaaacgggccccagcacgtgct2580

acgagatttcgattccaccgccgccttctatgaaaggttgggcttcggaatcgttttccg2640

ggacgccggctggatgatcctccagcgcggggatctcatgctggagttcttcgcccaccc2700

caacttgtttattgcagcttataatggttacaaataaagcaatagcatcacaaatttcac2760

aaataaagcatttttttcactgcattctagttgtggtttgtccaaactcatcaatgtatc2820

ttatcatacatggtcgacctgcaggaacctgcattaatgaatcggccaacgcgcggggag2880

aggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggt2940

cgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacaga3000

atcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccg3060

taaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaa3120

aaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtt3180

tccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacct3240

gtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatct3300

cagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcc3360

cgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgactt3420

atcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgc3480

tacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtat3540

ctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaa3600

acaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaa3660

aaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacga3720

aaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatcct3780

tttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctga3840

cagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatc3900

catagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctgg3960

ccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaat4020

aaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccat4080

ccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcg4140

caacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttc4200

attcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaa4260

agcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatc4320

actcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgctt4380

ttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgag4440

ttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagt4500

gctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgag4560

atccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcac4620

cagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggc4680

gacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatca4740

gggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaatagg4800

ggttccgcgcacatttccccgaaaagtgccacctgacgtctaagaaaccattattatcat4860

gacattaacctataaaaataggcgtatcacgaggccctttcgtctcgcgcgtttcggtga4920

tgacggtgaaaacctctgacacatgcagctcccggagacggtcacagcttgtctgtaagc4980

ggatgccgggagcagacaagcccgtcagggcgcgtcagcgggtgttggcgggtgtcgggg5040

ctggcttaactatgcggcatcagagcagattgtactgagagtgcaccaagcttccaattt5100

taggccccccactgaccgaggtctgtcgataatccacttttccattgattttccaggttt5160

cgttaactcatgccactgagcaaaacttcggtctttcctaacaaaagctctcctcacaaa5220

gcatggcgcggcaacggacgtgtcctcatactccactgccacacaaggtcgataaactaa5280

gctcctcacaaatagaggagaattccactgacaactgaaaacaatgtatgagagacgatc5340

accactggagcggcgcggcggttgggcgcggaggtcggcagcaaaaacaagcgactcgcc5400

gagcaaacccgaatcagccttcagacggtcgtgcctaacaacacgccgttctaccccgcc5460

ttcttcgcgccccttcgcgtccaagcatccttcaagtttatctctctagttcaacttcaa5520

gaagaacaacaccaccaacaccatggccaagttgaccagtgccgttccggtgctcaccgc5580

gcgcgacgtcgccggagcggtcgagttctggaccgaccggctcgggttctcccgggactt5640

cgtggaggacgacttcgccggtgtggtccgggacgacgtgaccctgttcatcagcgcggt5700

ccaggaccaggtggtgccggacaacaccctggcctgggtgtgggtgcgcggcctggacga5760

gctgtacgccgagtggtcggaggtcgtgtccacgaacttccgggacgcctccgggccggc5820

catgaccgagatcggcgagcagccgtgggggcgggagttcgccctgcgcgacccggccgg5880

caactgcgtgcacttcgtggccgaggagcaggactgacacgtgctacgagatttcgattc5940

caccgccgccttctatgaaaggttgggcttcggaatcgttttccgggacgccggctggat6000

gatcctccagcgcggggatctcatgctggagttcttcgcccaccccaacttgtttattgc6060

agcttataatggttacaaataaagcaatagcatcacaaatttcacaaataaagcattttt6120

ttcactgcattctagttgtggtttgtccaaactcatcaatgtatcttatcggtac6175

<210>91

<211>6611

<212>dna

<213>人工的

<220>

<223>pcl0122

<400>91

ctcttatctgcctcgcgccgttgaccgccgcttgactcttggcgcttgccgctcgcatcc60

tgcctcgctcgcgcaggcgggcgggcgagtgggtgggtccgcagccttccgcgctcgccc120

gctagctcgctcgcgccgtgctgcagccagcagggcagcaccgcacggcaggcaggtccc180

ggcgcggatcgatcgatccatcgatccatcgatccatcgatcgtgcggtcaaaaagaaag240

gaagaagaaaggaaaaagaaaggcgtgcgcacccgagtgcgcgctgagcgcccgctcgcg300

gtcccgcggagcctccgcgttagtccccgccccgcgccgcgcagtcccccgggaggcatc360

gcgcacctctcgccgccccctcgcgcctcgccgattccccgcctccccttttccgcttct420

tcgccgcctccgctcgcggccgcgtcgcccgcgccccgctccctatctgctccccagggg480

ggcactccgcaccttttgcgcccgctgccgccgccgcggccgccccgccgccctggtttc540

ccccgcgagcgcggccgcgtcgccgcgcaaagactcgccgcgtgccgccccgagcaacgg600

gtggcggcggcgcggcggcgggcggggcgcggcggcgcgtaggcggggctaggcgccggc660

taggcgaaacgccgcccccgggcgccgccgccgcccgctccagagcagtcgccgcgccag720

accgccaacgcagagaccgagaccgaggtacgtcgcgcccgagcacgccgcgacgcgcgg780

cagggacgaggagcacgacgccgcgccgcgccgcgcggggggggggagggagaggcagga840

cgcgggagcgagcgtgcatgtttccgcgcgagacgacgccgcgcgcgctggagaggagat900

aaggcgcttggatcgcgagagggccagccaggctggaggcgaaaatgggtggagaggata960

gtatcttgcgtgcttggacgaggagactgacgaggaggacggatacgtcgatgatgatgt1020

gcacagagaagaagcagttcgaaagcgactactagcaagcaagggatccatgaagttcgc1080

gacctcggtcgcaattttgcttgtggccaacatagccaccgccctcgcgcagagcgatgg1140

ctgcacccccaccgaccagacgatggtgagcaagggcgaggagctgttcaccggggtggt1200

gcccatcctggtcgagctggacggcgacgtaaacggccacaagttcagcgtgtccggcga1260

gggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaa1320

gctgcccgtgccctggcccaccctcgtgaccaccctgacctacggcgtgcagtgcttcag1380

ccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggcta1440

cgtccaggagcgcaccatcttcttcaaggacgacggcaactacaagacccgcgccgaggt1500

gaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaagga1560

ggacggcaacatcctgggacacaagctggagtacaactacaacagccacaacgtctatat1620

catggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatcga1680

ggacggcagcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggccc1740

cgtgctgctgcccgacaaccactacctgagcacccagtccgccctgagcaaagaccccaa1800

cgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcgg1860

catggacgagctgtacaagcaccaccatcaccaccactaacatatgagttatgagatccg1920

aaagtgaaccttgtcctaacccgacagcgaatggcgggagggggcgggctaaaagatcgt1980

attacatagtatttttcccctactctttgtgtttgtcttttttttttttttgaacgcatt2040

caagccacttgtctgggtttacttgtttgtttgcttgcttgcttgcttgcttgcctgctt2100

cttggtcagacggcccaaaaaagggaaaaaattcattcatggcacagataagaaaaagaa2160

aaagtttgtcgaccaccgtcatcagaaagcaagagaagagaaacactcgcgctcacattc2220

tcgctcgcgtaagaatcttagccacgcatacgaagtaatttgtccatctggcgaatcttt2280

acatgagcgttttcaagctggagcgtgagatcatacctttcttgatcgtaatgttccaac2340

cttgcataggcctcgttgcgatccgctagcaatgcgtcgtactcccgttgcaactgcgcc2400

atcgcctcattgtgacgtgagttcagattcttctcgagaccttcgagcgctgctaatttc2460

gcctgacgctccttcttttgtgcttccatgacacgccgcttcaccgtgcgttccacttct2520

tcctcagacatgcccttggctgcctcgacctgctcggtaaaacgggccccagcacgtgct2580

acgagatttcgattccaccgccgccttctatgaaaggttgggcttcggaatcgttttccg2640

ggacgccggctggatgatcctccagcgcggggatctcatgctggagttcttcgcccaccc2700

caacttgtttattgcagcttataatggttacaaataaagcaatagcatcacaaatttcac2760

aaataaagcatttttttcactgcattctagttgtggtttgtccaaactcatcaatgtatc2820

ttatcatacatggtcgacctgcaggaacctgcattaatgaatcggccaacgcgcggggag2880

aggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggt2940

cgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacaga3000

atcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccg3060

taaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaa3120

aaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtt3180

tccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacct3240

gtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatct3300

cagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcc3360

cgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgactt3420

atcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgc3480

tacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtat3540

ctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaa3600

acaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaa3660

aaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacga3720

aaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatcct3780

tttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctga3840

cagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatc3900

catagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctgg3960

ccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaat4020

aaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccat4080

ccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcg4140

caacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttc4200

attcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaa4260

agcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatc4320

actcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgctt4380

ttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgag4440

ttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagt4500

gctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgag4560

atccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcac4620

cagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggc4680

gacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatca4740

gggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaatagg4800

ggttccgcgcacatttccccgaaaagtgccacctgacgtctaagaaaccattattatcat4860

gacattaacctataaaaataggcgtatcacgaggccctttcgtctcgcgcgtttcggtga4920

tgacggtgaaaacctctgacacatgcagctcccggagacggtcacagcttgtctgtaagc4980

ggatgccgggagcagacaagcccgtcagggcgcgtcagcgggtgttggcgggtgtcgggg5040

ctggcttaactatgcggcatcagagcagattgtactgagagtgcaccaagcttccaattt5100

taggccccccactgaccgaggtctgtcgataatccacttttccattgattttccaggttt5160

cgttaactcatgccactgagcaaaacttcggtctttcctaacaaaagctctcctcacaaa5220

gcatggcgcggcaacggacgtgtcctcatactccactgccacacaaggtcgataaactaa5280

gctcctcacaaatagaggagaattccactgacaactgaaaacaatgtatgagagacgatc5340

accactggagcggcgcggcggttgggcgcggaggtcggcagcaaaaacaagcgactcgcc5400

gagcaaacccgaatcagccttcagacggtcgtgcctaacaacacgccgttctaccccgcc5460

ttcttcgcgccccttcgcgtccaagcatccttcaagtttatctctctagttcaacttcaa5520

gaagaacaacaccaccaacaccatgattgaacaagatggattgcacgcaggttctccggc5580

cgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctga5640

tgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacct5700

gtccggtgccctgaatgaactgcaggacgaggcagcgcggctatcgtggctggccacgac5760

gggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgct5820

attgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagt5880

atccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccatt5940

cgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgt6000

cgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccag6060

gctcaaggcgcgcatgcccgacggcgatgatctcgtcgtgacccatggcgatgcctgctt6120

gccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctggg6180

tgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttgg6240

cggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcg6300

catcgccttctatcgccttcttgacgagttcttctgacacgtgctacgagatttcgattc6360

caccgccgccttctatgaaaggttgggcttcggaatcgttttccgggacgccggctggat6420

gatcctccagcgcggggatctcatgctggagttcttcgcccaccccaacttgtttattgc6480

agcttataatggttacaaataaagcaatagcatcacaaatttcacaaataaagcattttt6540

ttcactgcattctagttgtggtttgtccaaactcatcaatgtatcttatcatgtctgaat6600

tcccggggtac6611

<210>92

<211>1314

<212>dna

<213>人工的

<220>

<223>密码子优化的异构酶

<400>92

atggctaaggagtacttcccccagatccagaagattaagttcgagggtaaggacagcaag60

aacccgctcgcctttcattactacgacgccgagaaggaggtgatgggcaagaagatgaag120

gactggcttcgctttgctatggcttggtggcacactctctgcgctgagggcgcggaccag180

tttggcggcggtacgaagagctttccgtggaacgagggcactgacgctattgagattgct240

aagcagaaggttgacgctggtttcgagattatgcagaagctcggtattccgtactactgc300

tttcacgatgtcgacctcgtttccgagggcaactcgatcgaggagtacgagtcgaacctc360

aaggctgtggttgcctacctcaaggagaagcagaaggagaccggaatcaagctcctctgg420

agcaccgccaacgttttcggccacaagcgctacatgaacggcgcctccaccaaccctgac480

ttcgatgttgttgcccgcgctattgtccagattaagaacgccatcgacgctggtatcgag540

ctcggagccgagaactacgttttttggggcggacgcgagggttacatgtccctcctcaac600

accgaccagaagcgtgagaaggagcacatggccactatgcttaccatggcccgcgactac660

gcccgcagcaagggttttaagggtacttttctcattgagccgaagcccatggagccgacc720

aagcaccagtacgacgtcgacaccgagaccgccattggcttccttaaggcccacaacctt780

gacaaggattttaaggtgaacatcgaggttaaccacgctacgcttgccggccacaccttt840

gagcatgagctcgcctgcgctgttgacgccggaatgcttggttccattgacgccaaccgc900

ggcgactaccagaacggctgggacaccgaccagtttccgattgaccagtacgagctcgtc960

caggcctggatggagatcatccgtggtggaggctttgttaccggtggtacgaacttcgac1020

gccaagacgcgccgtaacagcacggacctcgaggacatcatcattgctcatgtgtcgggc1080

atggacgccatggctcgcgcccttgagaacgctgctaagctcctccaggagagcccctac1140

acgaagatgaagaaggagcgctacgcgtcgtttgacagcggaatcggtaaggacttcgag1200

gatggcaagctcaccctggagcaggtgtacgagtacggtaagaagaacggcgagccgaag1260

cagaccagcggcaagcaggagctctacgaggccattgtcgccatgtaccagtag1314

<210>93

<211>1485

<212>dna

<213>人工的

<220>

<223>密码子优化的激酶

<400>93

atgaagaccgtcgccggcatcgatcttggaacccagtccatgaaggttgtcatttacgac60

tacgagaagaaggagatcatcgagtccgcctcgtgccctatggagctcattagcgagtcg120

gacggaacccgcgagcagacgactgagtggtttgacaagggtctcgaggtgtgctttgga180

aagctctccgctgataacaagaagaccattgaggcgattggcatctccggccagctccac240

ggcttcgtccctctcgatgcgaacggaaaggcgctctacaacatcaagctctggtgcgac300

accgccactgtggaggagtgcaagatcattactgacgccgccggcggcgacaaggctgtc360

atcgacgcgctcggcaacctcatgctcaccggattcaccgccccgaagattctctggctc420

aagcgcaacaagcccgaggcctttgctaacctcaagtacattatgctgccccacgattac480

ctcaactggaagctgactggagactacgtcatggagtacggcgacgcctccggcaccgcc540

ctttttgattcgaagaaccgctgctggtcgaagaagatttgcgacattattgatcctaag600

ctgctcgaccttctccctaagctcattgagccctcggcccccgccggtaaggtcaacgac660

gaggccgccaaggcgtacggcattcccgccggaatccccgtttccgctggcggcggtgat720

aacatgatgggtgcggtcggtactggcaccgtcgctgacggattcctcacgatgagcatg780

ggcacctccggaactctttacggctactcggacaagcctatttccgacccggctaacggc840

ctcagcggcttctgcagctccacgggcggctggcttcccctcctttgcaccatgaactgc900

accgtcgccaccgagttcgtccgcaacctttttcagatggatatcaaggagctgaacgtc960

gaggctgctaagtccccctgcggcagcgagggcgttcttgtcattcctttcttcaacggc1020

gagcgcaccccgaacctccccaacggccgcgcctcgattaccggcctcacctccgcgaac1080

acgtcccgcgccaacatcgctcgcgcctcctttgagtcggccgtctttgccatgcgcggt1140

ggcctcgatgcgtttcgtaagctcggattccagcccaaggagattcgcctcatcggcggt1200

ggttcgaagtccgacctctggcgccagatcgctgctgacattatgaaccttcccatccgt1260

gtcccccttctcgaggaggccgccgccctcggcggagctgtccaggccctttggtgcctt1320

aagaaccagtccggtaagtgcgacatcgtcgagctttgcaaggagcatatcaagattgac1380

gagtccaagaacgccaacccgattgccgagaacgtcgccgtgtacgataaggcctacgat1440

gagtactgcaaggtcgttaacacgctcagccctctgtacgcctaa1485

<210>94

<211>1569

<212>dna

<213>人工的

<220>

<223>密码子优化的转运蛋白

<400>94

atgggcctcgaggataaccgcatggttaagcgctttgtcaacgtgggcgagaagaaggcc60

ggtagcaccgccatggccatcattgttggcctcttcgcggcctcgggcggcgtcctcttc120

ggctacgacaccggcactatctcgggcgtcatgactatggactacgttctcgcccgctac180

ccctccaacaagcactccttcaccgctgacgagtcgtcgctcatcgtttccattctttcg240

gtcggcaccttcttcggcgccctctgcgccccgttcctcaacgataccctcggccgccgc300

tggtgcctcatcctcagcgccctcattgtctttaacatcggcgccatcctccaggtcatt360

tccaccgccatccccctgctctgcgcgggccgcgttatcgccggtttcggtgtcggcctc420

atttccgccaccatcccgctctaccagtccgagactgctccgaagtggattcgcggcgcc480

atcgtttcctgctaccagtgggccatcactatcggacttttcctcgcttcctgcgtcaac540

aagggcaccgagcacatgaccaactccggttcgtaccgtattcctctggccatccagtgc600

ctctggggcctcatccttggtattggcatgattttcctccctgagaccccccgcttctgg660

atttcgaagggcaaccaggagaaggccgccgagtccctcgcccgtctccgcaagctcccc720

atcgaccatcctgatagccttgaggagcttcgcgatattactgccgcctacgagttcgag780

accgtctacggtaagtccagctggtcccaggtcttttcccacaagaaccatcagctcaag840

cgcctctttaccggcgttgccattcaggcctttcagcagctcaccggagttaactttatc900

ttttactacggcaccaccttttttaagcgcgccggagtcaacggattcaccatcagcctt960

gccaccaacatcgttaacgtcggcagcactattcccggcattcttctcatggaggtcctc1020

ggccgccgcaacatgctcatgggcggtgccaccggcatgtcgctgtcgcagcttatcgtc1080

gccattgtcggagttgccacgtcggagaacaacaagtcgagccagtcggtcctcgtcgct1140

ttctcgtgcatctttatcgctttttttgccgccacctggggtccctgcgcctgggtcgtc1200

gtcggcgagctctttccccttcgcactcgcgctaagtccgtttccctctgcaccgcgtcc1260

aactggctctggaactggggcattgcttacgccaccccctacatggtcgacgaggataag1320

ggtaacctcggcagcaacgttttttttatttggggaggcttcaacctcgcttgcgtcttt1380

ttcgcgtggtacttcatttacgagaccaagggcctttccctcgagcaggttgatgagctc1440

tacgagcatgtttcgaaggcgtggaagtccaagggttttgtcccgtccaagcactccttt1500

cgcgagcaggtcgaccagcagatggactccaagaccgaggccattatgagcgaggaggcg1560

tcggtttaa1569

<210>95

<211>1512

<212>dna

<213>人工的

<220>

<223>密码子优化的转运蛋白

<400>95

atggccctcgaccctgagcagcagcagcccatttcctccgtgtcgcgcgagtttggtaag60

tcgtccggtgagatctcccccgagcgtgagcctctcattaaggagaaccacgtccccgag120

aactactccgttgttgccgccatcctccccttcctcttcccggccctgggtggcctcctt180

tacggttacgagattggcgctacgtcgtgcgctacgatttcccttcagtccccctccctc240

tccggcatctcctggtacaacctctcctccgtcgatgttggcctcgtcacttccggttcc300

ctctacggtgctctgtttggctccattgttgccttcaccattgccgacgttattggccgt360

cgcaaggagcttatcctcgctgctctcctctacctcgtcggtgccctcgttaccgctctc420

gcccctacgtactccgttctcatcatcggccgtgtcatttacggtgtttccgtcggtctt480

gccatgcatgctgcccctatgtacatcgcggagaccgccccgtcccccatccgcggccag540

ctcgtttccctcaaggagtttttcatcgttctcggtatggtcggcggatacggcattggt600

tccctcaccgtcaacgtccactccggttggcgctacatgtacgctacctccgttcccctc660

gctgtgatcatgggcattggcatgtggtggcttcctgcctccccccgttggctcctcctc720

cgcgtcattcagggtaagggtaacgttgagaaccagcgcgaggctgccattaagtccctc780

tgctgcctccgtggtcctgccttcgtcgactcggccgccgagcaggtcaacgagattctc840

gccgagcttaccttcgttggcgaggataaggaggtcaccttcggcgagctcttccaggga900

aagtgcctcaaggccctcattatcggcggcggccttgttctctttcagcagatcaccggt960

cagccttcggtcctctactacgccccctcgatcctccagactgcgggcttctccgccgcc1020

ggcgatgctacccgcgtttccattcttctcggcctcctcaagctcattatgaccggtgtc1080

gccgtcgtcgttatcgatcgtctcggccgtcgccctctcctcctcggcggagtcggtggt1140

atggttgtttcgctctttctccttggctcgtactaccttttcttcagcgcttcccccgtc1200

gtcgccgttgtcgccctccttctctacgtgggttgctaccagctctcctttggccccatt1260

ggctggcttatgatttccgagatttttcccctcaagctccgtggtcgcggactctccctt1320

gccgtgcttgtcaactttggtgccaacgccctcgtcacctttgccttttcccctctcaag1380

gagctcctcggcgccggcatcctgttttgcggctttggcgttatctgcgttctctccctt1440

gtttttatcttttttatcgtcccggagactaagggcctcacgctcgaggagatcgaggcg1500

aagtgcctctaa1512

<210>96

<211>19

<212>dna

<213>人工的

<220>

<223>引物5'cl0130

<400>96

cctcgggcggcgtcctctt19

<210>97

<211>20

<212>dna

<213>人工的

<220>

<223>引物3'cl0130

<400>97

ggcggccttctcctggttgc20

<210>98

<211>24

<212>dna

<213>人工的

<220>

<223>引物5'cl0131

<400>98

ctactccgttgttgccgccatcct24

<210>99

<211>22

<212>dna

<213>人工的

<220>

<223>引物3'cl0131

<400>99

ccgccgaccataccgagaacga22

<210>100

<211>1362

<212>dna

<213>人工的

<220>

<223>密码子优化的na

<400>100

atgaaccccaaccagaagattactactatcggtagcatttgcctcgtcgttggacttatc60

tcccttattcttcagattggtaacattatctccatttggatctcgcatagcattcagacc120

ggctcccagaaccacaccggcatttgcaaccagaacattattacttacaagaactccact180

tgggtcaaggacactactagcgttattcttaccggtaactcgtcgctttgccctattcgc240

ggctgggctatttacagcaaggacaactcgatccgcatcggtagcaagggcgacgttttt300

gtcatccgtgagccttttatttcctgcagccacctcgagtgccgtactttttttctgact360

cagggcgctctcctcaacgataagcattccaacggcactgtcaaggatcgcagcccctac420

cgcgcccttatgtcctgccctgtcggcgaggctcccagcccctacaactcccgttttgag480

tccgttgcctggtccgccagcgcctgccacgacggaatgggatggctcactattggtatt540

tccggccctgataacggcgctgtcgccgtccttaagtacaacggcattatcaccgagacc600

atcaagtcctggcgtaagaagatcctccgcacccaggagtccgagtgcgcctgcgtcaac660

ggcagctgcttcacgattatgaccgacggcccctccgacggcctcgcttcctacaagatt720

tttaagattgagaagggtaaggtcacgaagtccatcgagcttaacgccccgaactcccac780

tacgaggagtgctcctgctaccctgacactggcaaggtgatgtgcgtctgccgcgataac840

tggcatggctccaaccgcccctgggttagcttcgatcagaaccttgactaccagattgga900

tacatttgctccggtgtttttggcgacaacccgcgccccgaggatggaactggttcgtgc960

ggtcctgtttacgttgacggcgccaacggcgttaagggtttttcctaccgttacggtaac1020

ggagtctggatcggccgcaccaagtcgcacagctcgcgccacggatttgagatgatctgg1080

gaccccaacggatggactgagaccgattccaagtttagcgttcgccaggatgtcgttgct1140

atgaccgattggtcgggatactccggttcctttgtgcagcaccctgagctcaccggcctt1200

gactgcatgcgcccttgcttttgggtcgagctcattcgcggtcgccctaaggagaagact1260

atttggacctccgccagcagcatttccttttgcggcgttaactccgacaccgtcgactgg1320

tcgtggcccgatggcgccgagcttcccttttccattgataag1362

<210>101

<211>1431

<212>dna

<213>人工的

<220>

<223>密码子优化的na,具有v5标签和多组氨酸标签

<400>101

atgaaccccaaccagaagattactactatcggtagcatttgcctcgtcgttggacttatc60

tcccttattcttcagattggtaacattatctccatttggatctcgcatagcattcagacc120

ggctcccagaaccacaccggcatttgcaaccagaacattattacttacaagaactccact180

tgggtcaaggacactactagcgttattcttaccggtaactcgtcgctttgccctattcgc240

ggctgggctatttacagcaaggacaactcgatccgcatcggtagcaagggcgacgttttt300

gtcatccgtgagccttttatttcctgcagccacctcgagtgccgtactttttttctgact360

cagggcgctctcctcaacgataagcattccaacggcactgtcaaggatcgcagcccctac420

cgcgcccttatgtcctgccctgtcggcgaggctcccagcccctacaactcccgttttgag480

tccgttgcctggtccgccagcgcctgccacgacggaatgggatggctcactattggtatt540

tccggccctgataacggcgctgtcgccgtccttaagtacaacggcattatcaccgagacc600

atcaagtcctggcgtaagaagatcctccgcacccaggagtccgagtgcgcctgcgtcaac660

ggcagctgcttcacgattatgaccgacggcccctccgacggcctcgcttcctacaagatt720

tttaagattgagaagggtaaggtcacgaagtccatcgagcttaacgccccgaactcccac780

tacgaggagtgctcctgctaccctgacactggcaaggtgatgtgcgtctgccgcgataac840

tggcatggctccaaccgcccctgggttagcttcgatcagaaccttgactaccagattgga900

tacatttgctccggtgtttttggcgacaacccgcgccccgaggatggaactggttcgtgc960

ggtcctgtttacgttgacggcgccaacggcgttaagggtttttcctaccgttacggtaac1020

ggagtctggatcggccgcaccaagtcgcacagctcgcgccacggatttgagatgatctgg1080

gaccccaacggatggactgagaccgattccaagtttagcgttcgccaggatgtcgttgct1140

atgaccgattggtcgggatactccggttcctttgtgcagcaccctgagctcaccggcctt1200

gactgcatgcgcccttgcttttgggtcgagctcattcgcggtcgccctaaggagaagact1260

atttggacctccgccagcagcatttccttttgcggcgttaactccgacaccgtcgactgg1320

tcgtggcccgatggcgccgagcttcccttttccattgataagggtaagcctatccctaac1380

cctctcctcggtctcgattctacgcgtaccggtcatcatcaccatcaccat1431

<210>102

<211>539

<212>prt

<213>人副流感3病毒

<400>102

metprothrserileleuleuileilethrthrmetilemetalaser

151015

phecysglnileaspilethrlysleuglnhisvalglyvalleuval

202530

asnserprolysglymetlysileserglnasnphegluthrargtyr

354045

leuileleuserleuileprolysilegluaspserasnsercysgly

505560

aspglnglnilelysglntyrlysargleuleuaspargleuileile

65707580

proleutyraspglyleuargleuglnlysaspvalilevalserasn

859095

glngluserasngluasnthraspproargthrlysargphephegly

100105110

glyvalileglythrilealaleuglyvalalathrseralaglnile

115120125

thralaalavalalaleuvalglualalysglnalaargseraspile

130135140

glulysleulysglualaileargaspthrasnlysalavalglnser

145150155160

valglnserserileglyasnleuilevalalailelysservalgln

165170175

asptyrvalasnlysgluilevalproserilealaargleuglycys

180185190

glualaalaglyleuglnleuglyilealaleuthrglnhistyrser

195200205

gluleuthrasnilepheglyaspasnileglyserleuglnglulys

210215220

glyilelysleuglnglyilealaserleutyrargthrasnilethr

225230235240

gluilephethrthrserthrvalasplystyraspiletyraspleu

245250255

leuphethrgluserilelysvalargvalileaspvalaspleuasn

260265270

asptyrserilethrleuglnvalargleuproleuleuthrargleu

275280285

leuasnthrglniletyrargvalaspserilesertyrasnilegln

290295300

asnargglutrptyrileproleuproserhisilemetthrlysgly

305310315320

alapheleuglyglyalaaspvallysglucysileglualapheser

325330335

sertyrilecysproseraspproglyphevalleuasnhisglumet

340345350

glusercysleuserglyasnileserglncysproargthrvalval

355360365

lysseraspilevalproargtyralaphevalasnglyglyvalval

370375380

alaasncysilethrthrthrcysthrcysasnglyileglyasnarg

385390395400

ileasnglnproproaspglnglyvallysileilethrhislysglu

405410415

cysasnthrileglyileasnglymetleupheasnthrasnlysglu

420425430

glythrleualaphetyrthrproasnaspilethrleuasnasnser

435440445

valalaleuaspproileaspileserilegluleuasnlysalalys

450455460

seraspleuglugluserlysglutrpileargargserasnglnlys

465470475480

leuaspserileglyasntrphisglnserserthrthrileileile

485490495

valleuilemetileileileleupheileileasnvalthrileile

500505510

ileilealavallystyrtyrargileglnlysargasnargvalasp

515520525

glnasnasplysprotyrvalleuthrasnlys

530535

<210>103

<211>511

<212>prt

<213>水泡性口炎病毒indiana

<400>103

metlyscysleuleutyrleualapheleupheileglyvalasncys

151015

lysphethrilevalpheprohisasnglnlysglyasntrplysasn

202530

valproserasntyrhistyrcysproserserseraspleuasntrp

354045

hisasnaspleuvalglythralaleuglnvallysmetprolysser

505560

hislysalaileglnalaaspglytrpmetcyshisalaserlystrp

65707580

valthrthrcysasppheargtrptyrglyprolystyrilethrhis

859095

serileargserphethrproservalgluglncyslysgluserile

100105110

gluglnthrlysglnglythrtrpleuasnproglypheproprogln

115120125

sercysglytyralathrvalthraspalaglualaalailevalgln

130135140

valthrprohishisvalleuvalaspglutyrthrglyglutrpval

145150155160

aspserglnpheileasnglylyscysserasnaspilecysprothr

165170175

valhisasnserthrthrtrphisserasptyrlysvallysglyleu

180185190

cysaspserasnleuilesermetaspilethrphephesergluasp

195200205

glygluleuserserleuglylyslysglythrglypheargserasn

210215220

tyrphealatyrgluthrglyasplysalacyslysmetglntyrcys

225230235240

lyshistrpglyvalargleuproserglyvaltrppheglumetala

245250255

asplysaspleuphealaalaalaargpheproglucysproglugly

260265270

serserileseralaproserglnthrservalaspvalserleuile

275280285

glnaspvalgluargileleuasptyrserleucysglngluthrtrp

290295300

serlysileargalaglyleuproileserprovalaspleusertyr

305310315320

leualaprolysasnproglythrglyprovalphethrileileasn

325330335

glythrleulystyrphegluthrargtyrileargvalaspileala

340345350

alaproileleuserargmetvalglymetileserglythrthrthr

355360365

gluargvalleutrpaspasptrpalaprotyrgluaspvalglyile

370375380

glyproasnglyvalleuargthrserserglytyrlyspheproleu

385390395400

tyrmetileglyhisglymetleuaspseraspleuhisleuserser

405410415

lysalaglnvalphegluhisprohisileglnaspalaalasergln

420425430

leuproaspglygluthrleuphepheglyaspthrglyleuserlys

435440445

asnproilegluphevalgluglytrpphesersertrplysserser

450455460

ilealaserphephephethrileglyleuileileglyleupheleu

465470475480

valleuargvalglyiletyrleucysilelysleulyshisthrlys

485490495

lysargglniletyrthraspileglumetasnargleuglythr

500505510

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1