用于在纤毛虫宿主细胞中异源表达病毒蛋白的系统的制作方法

文档序号:11470334阅读:371来源:国知局
用于在纤毛虫宿主细胞中异源表达病毒蛋白的系统的制造方法与工艺

本申请是申请日为2010年6月15日,申请号为201080036736.4,标题为“用于在纤毛虫宿主细胞中异源表达病毒蛋白的系统”的专利申请的分案申请。

本发明涉及用于在纤毛虫宿主细胞中异源表达病毒蛋白的系统。



背景技术:

由于许多病毒在很大程度上充当了人或动物病原,现已关注于病毒蛋白在作为针对病毒病原的疫苗中的应用。病毒(特别是rna病毒)是高度可变的,且很多病毒感染是由于具有多种血清型的病毒(如流感病毒,fmd病毒)。因此,许多现存的病毒疫苗通常无法应对野生的流行株,且从野生株中会产生新株并开始新的爆发。

尽管事实如此,但受益于现代生物技术,可获得能够异源表达几乎各种已知蛋白的方法。如今,病毒蛋白的表达并不普遍,因为在大多数情况中病毒蛋白是结构蛋白(既不是酶,也不是蛋白激素,更不是抗体),因此在制药或工业上对其不那么感兴趣。

然而,由于许多病毒在很大程度上充当了人或动物病原,现已关注于病毒蛋白在作为针对病毒病原的疫苗中的应用。

目前,产生针对病毒病原的疫苗的标准步骤是在给定的系统中培养各自的病毒,收集并灭活由此获得的病毒颗粒,且制备包含所述灭活颗粒的药物组合物以作为疫苗。

例如,所述原理应用在流感疫苗的生产中,所述流感疫苗在已受精的鸡蛋中产生。在受精后11天,将流感病毒株注射入单个鸡蛋的白蛋白中,并随后感染发育中的胚胎的肺。在孵育若干天后,将病毒收集并纯化,化学灭活并用于产生疫苗。平均上,需要约1和2个蛋来产生1剂量的疫苗。整个产生过程持续至少6个月。

这种疫苗产生方式已很完备且很经济,但缺点是需要获取数百万个蛋、时间很长、蛋的处理很乏味且在需求快速增加或新病毒株突然出现时灵活性受限。而且,已受精的鸡蛋无法用于产生针对多种病原性病毒的疫苗,所述病原性病毒之一是禽流感a病毒(h5n1)。

总之,已受精的鸡蛋能够至少主要用于产生与作为宿主的鸡胚胎相容的全部病毒,或用于产生包括前者组分的疫苗。

产生病毒或包括前者组分的疫苗的另一种方法是基于细胞或组织培养。在一个方法中,将病毒注射入哺乳动物肾细胞中。在病毒增殖后,细胞裂解,且随后将病毒颗粒收集、纯化并灭活。然而,这些系统需要使用复杂的生长培养基,且它们的操作费力且耗时。而且,所述感染方法难以进行且无法完全重复。

在wo03048348公开的另一种方法中,公开了在人细胞系上产生灭活病毒疫苗的方法。由于在其表面上存在sia2-6gal和含sia2-3gal的受体,所以此细胞系是可被诸如流感病毒、副流感病毒、腺病毒相关病毒或多瘤病毒类等不同病毒高度感染的。这可能引起与生产过程相关的安全性问题。

一方面,与上述基于蛋的系统相反,基于哺乳动物细胞培养物的系统可在紧急时快速扩大并按比例增加。另一方面,此类生产设备(连同其巨大的生物反应器)在作业待命时的预付成本远高于基于蛋的系统的成本,且获利可能略慢。再者,这些系统需要使用复杂的生长培养基,且它们的操作费力且耗时。

因此,开发用于产生可用作疫苗的病毒蛋白的另一种方法具有很高的优先性。

一种方法是使用重组dna技术产生那些蛋白。与使用蛋的疫苗产生相反,由于有机会纯化重组表达的病毒蛋白,所以一个显著的优点是极大改善了疫苗的安全性。而且,对适应不同季节性病毒亚型的灵活性高度增加。

然而,由于大多数情况下病毒蛋白是结构蛋白,所以用于制药和工业目的的生产复杂且费力。在开始时,尝试在大肠杆菌(escherichiacoli)中表达对应于病毒蛋白如血凝素的多肽。然而,值得注意的是,在原核生物中异源表达待用作疫苗的蛋白行不通,因为后者不具有转录后修饰系统。因此,在诸如大肠杆菌等原核生物中表达的蛋白缺乏诸如糖基化模式等转录后修饰,这似乎影响稳定性并在很大程度上影响抗原的免疫原性潜能。(nayaketal.1984)。

在真核生物体酿酒酵母(saccharomycescerevisiae)(us4752473,对于血凝素)中表达病毒蛋白则因重组蛋白的高糖基化和大量添加高分子量外链甘露聚糖而引起问题(jabbarandnayak1987,jabbaretal.1985),且未证实能令人满意。

us5858368公开了在重组杆状病毒感染的昆虫细胞系中表达流感a病毒血凝素(ha)的方法。蛋白在使用非变性、非离子去污剂从感染细胞的外周膜提取后,经色谱纯化。然而,此纯化方法非常耗时。而且,由于它们的糖基化模式,所以尚不知道是否在杆状病毒/昆虫细胞表达系统中产生的蛋白适用于在哺乳动物中的治疗应用(kulakoskyetal.1998)。有进一步提示,在昆虫细胞所表达蛋白的n-多糖中的某些残基代表潜在的致敏表位(tomiyaetal.2004)。

定义

本文所用的术语“异源表达”是指对表达发生的生物体是外源的基因、核酸或cdna的蛋白表达。

本文所用的术语“纤毛虫”是指纤毛亚门(ciliophora),它们是单细胞真核生物(“原生动物”(“protozoa”或“protists”)),表征为它们相对大的尺寸(一些物种具有多至2mm的长度)、它们有纤毛的细胞表面和两个不同类型的细胞核,即小的二倍体小核和大的多倍体大核(转录活性)。多倍体大核由通过基因组复制和大量编辑从小核产生。

本文所用的术语“cdna”是指这样的dna分子,其编码待表达的蛋白且不含任何非编码部分如内含子。在许多情况中,cdna使用逆转录酶和寡脱氧胸腺嘧啶引物直接从rna模板合成。然而,此术语也包括合成的基因和由此获得的编码dna。

本文所用的术语“启动子”是指通常位于基因或cdna上游(朝向有义链的5’区域)的调节区域,其包含允许或甚至增强基因或cdna转录的基本遗传元件。

本文所用的术语“片段”是指蛋白的一部分,其缺少天然或野生型蛋白的一些部分或结构域,但在酶促活性、免疫原性、靶结合等方面上仍保持一些活性。

本文所用的术语“信号序列”是指这样的核酸序列,其编码引导蛋白向诸如细胞核、线粒体基质、内质网、叶绿体、质外体和过氧物酶体等细胞器运输的寡肽(“信号肽”或“转送肽(transitpeptide)”)。几乎所有被运输至内质网的蛋白在n端具有由5-10个疏水氨基酸组成的序列。在蛋白质共翻译插入内质网腔后,那些信号肽通过信号肽酶被从蛋白质上切下。随后,大多数蛋白经由分泌途径下游的高尔基体进行运输。

本文所用的术语“可操作的连接”是指可编码基因产物的核苷酸序列与启动子链接,使得此启动子在适合的条件下调节基因产物的表达。

本文所用的术语“疏水结构域”与术语“亲脂性结构域”和/或“非极性结构域”意思相同。如本文所用,此术语是指这样的蛋白结构域,其至少在其边缘具有主要由大量疏水/非极性氨基酸残基控制的疏水性质(也称为“亲水性”),因此与诸如发现于细胞膜中的磷脂双层等脂质部分具有一些亲和力。

所述疏水结构域可例如作为所谓的“跨膜结构域”,即在膜中热力学稳定的三维蛋白结构。此类跨膜结构域可包括单个α螺旋、若干跨膜α螺旋的稳定复合物、跨膜β筒、β螺旋、可能围绕亲水氨基酸残基的疏水氨基酸的外环等。

本发明人已认识到疏水结构域会阻碍蛋白分泌到环境中。疏水氨基酸的实例列在下表中:

表1

术语“氨基酸分子”是指任何单链或双链核酸分子,包括dna(cdna和/或基因组dna)、rna(优选mrna)、pna、lna和/或吗啉代。

术语“严格性条件”是指相比于其它序列,探针将优选与其靶序列杂交的条件。严格性条件是序列依赖性的且在不同环境中不同。较长序列在较高温度下特异性地杂交。通常,所选的严格性条件为比在给定离子强度和ph下特异序列的热熔点(tm)低约5℃。tm为这样的温度(在给定离子强度、ph和核酸浓度),在此温度下与靶序列互补的探针的50%在平衡状态下与靶序列杂交。(因为靶序列通常过量存在,所以在tm下,探针的50%在平衡状态下被占据)。通常,严格性条件也指在在ph7.0-8.3下盐浓度小于约1.0mna离子,通常约0.01-1.0mna离子(或其它盐),且温度为至少约30℃(对于短探针,即10-50个核苷酸)和为至少约60℃(对于较长探针)。严格性条件也通过加入诸如甲酰胺等去稳定化剂来实现。

术语“pdb编码”是指独特的四字母编码,其用作可从蛋白数据库(proteindatabank)中获得条目的主要的标记物,此蛋白数据库是世界范围的生物大分子结构数据库。

术语“核酸分子的片段”是指包括根据要求保护的序列之一的核酸分子的子集的核酸。这同样可适用于术语“核酸分子的部分”。

本文所用术语“核酸分子的变体”是指这样的核酸分子,其在结构和生物活性上与根据要求保护的序列之一的核酸分子基本相似。

术语“核酸分子的同源物”是指这样的核酸分子,相比于根据要求保护的序列之一的核酸分子,其序列具有经添加、删除、取代或其它化学修饰的一个或多个核苷酸,前提是同源物与后者具有基本上相同的性质。

本文所用的术语“密码子优化”是指这样的过程,在此过程中,使编码待表达异源蛋白的cdna适合于源自通用遗传编码表的宿主特异性密码子使用。纤毛虫具有富含at的基因组,四膜虫(tetrahymena)dna由约75%的at组成(参见图7)。其密码子使用不同于其他生物,特别地用于编码给定氨基酸的密码子的使用频率(“密码子偏好”)不同。如果编码异源蛋白的非优化cdna使用在纤毛虫中很少使用的密码子,这会十分影响蛋白表达效率。这意味着当所研究基因的密码子频率与纤毛虫表达系统的密码子频率相匹配时,异源蛋白表达可显著改进。而且,许多纤毛虫,特别是四膜虫利用具有编码谷氨酰胺的uaa和uag三联体的非规范核苷酸编码,而在大多数其它生物体中,这些密码子被用作终止翻译的终止密码子。这可能导致以下事实,即携带uaa和uag三联体作为终止密码子的外源(非纤毛虫)基因不被正确地表达。为此,在转化纤毛虫宿主细胞前,编码异源蛋白的cdna应为这样的编码,此编码以uaa和uag三联体被修改为uaa的方式被优化。密码子优化可通过如定点诱变或cdna重新合成的方式来完成。

本文所用的术语“衍生物”是指相关的核酸分子,其具有与靶核酸序列类似的性质,所述靶核酸序列为根据要求保护的序列之一的核酸分子。

本文所用的术语“至少x%的序列相同性”是指在用blast类算法(特别是megablast、不连续megablast、blastn、blastp、psi-blast、phi-blast、blastx、tblastn和tblastx)进行序列比对后确定的序列相同性,其可在ncbi提供的各个互联网域上获得。

本文所用的术语“宿主细胞”具有两个不同含义,其可根据各自的上下文理解。在异源蛋白表达的上下文中,术语“宿主细胞”是指可用作表达宿主的转基因细胞。所述细胞或其前体由此被包含待表达蛋白的cdna的适合载体所转染。在病毒生命周期的上下文中,术语“宿主细胞”是指被利用细胞进行复制的病毒所感染的细胞。

本文所用的术语“载体”是指用于将外源遗传材料导入另一个细胞的分子载体。载体本身通常是dna序列,其由插入物(目标序列)和起载体“骨架”作用的较长序列组成。将遗传信息转入另一个细胞的载体的目的通常是在靶细胞中分离、繁殖或表达插入物。

本文所用的术语“质粒”是指这样的质粒载体,即由于有复制起点(“ori”)而能够在适合的宿主内自我复制的环状dna序列。而且,质粒可包括选择性标记,以表明转化或表示将外源dna引入细胞和多克隆位点的其它步骤的成功,所述多克隆位点包括能够实现插入物插入的多个限制性酶共有位点。使用被称为克隆或供体载体的质粒载体来促进目标序列的克隆和扩增。被称为表达或受体载体的质粒载体专门用于目标基因在所定义的靶细胞中的表达。这些质粒载体通常显示出由启动子、转基因和终止子序列组成的表达盒。表达质粒可为穿梭质粒,其包含能够在不同宿主细胞中增殖和选择的元件。

本文所用术语“病毒蛋白”是指由病毒产生的蛋白。所述蛋白可形成病毒包膜和/或衣壳,或可形成非结构性、调节性和附属蛋白。

本文所用术语“表面蛋白”是指形成病毒外层部分的病毒蛋白。例如,所述蛋白为:(i)锚定在包膜病毒脂双层外壳(coating)中的蛋白、(ii)在包膜和非包膜病毒中的衣壳蛋白、和/或(iii)在诸如感染人(包括哺乳动物,包括鸟)的噬菌体和病毒等许多病毒中发现的刺突蛋白。在大多数情况中,包膜病毒的所述脂双层外壳是病毒在其复制循环期间(称为胞吐或细胞裂解)获得的,所述脂双层外壳来自宿主细胞中的细胞内膜(如核内膜或高尔基膜),或来自宿主细胞外膜。

本文所用的术语“病毒融合蛋白”是指包膜病毒的糖蛋白,其有助于宿主细胞的感染(将病毒遗传材料插入宿主细胞)。具有脂双层作为其结构组成部分的包膜病毒通过融合病毒和宿主细胞膜进入它们所感染的细胞。所述病毒融合蛋白具有两个主要特征:它们具有受体结合功能,此功能将病毒与宿主细胞连接;且它们具有融合功能,此功能可被激活以介导病毒和宿主细胞膜的融合。一些重要的病毒融合蛋白为i类病毒融合蛋白(参见下文)。

本文所用的术语“融合肽”是指在病毒融合蛋白内部的独特保守疏水区域,其在融合过程中插入宿主细胞膜。融合肽倾向于是非极性区域,此区域相对富含甘氨酸和丙氨酸残基,且包含若干大体积疏水残基。对于i类病毒融合蛋白,此融合肽位于蛋白跨膜区域的n端。

发明目的

本发明的目的是提供一种克服上述缺点的方法和/或实施方式。所述目的通过在独立权利要求中所述的实施方式来解决。

描述

本发明提供了一种用于病毒蛋白异源表达的系统,所述系统包括纤毛虫宿主细胞、编码病毒蛋白的至少一种核酸或其片段、和与所述核酸可操作连接的启动子。

在优选实施方式中,所述核酸为cdna。

基本上,病毒蛋白的异源表达在当今并不普遍,因为在大多数情况中病毒蛋白是结构蛋白,其既不是酶,也不是蛋白激素,更不是抗体,因此在制药或工业上对其不那么感兴趣。

而且,上述文献中也未涉及病毒蛋白在纤毛虫中的表达。本发明人已认识到对于纤毛虫,其与细菌或后生动物不同,至今尚不知道其专有的病毒。这可能是由于纤毛虫中常见的细胞核二态性。对此的另一个原因可能是纤毛虫中不寻常的密码子使用和富含at的基因组。因此,发明人假定高等生物的致病病毒在大多数纤毛虫如四膜虫中无法复制。

以上观点解释了以下事实,即为何至今没有尝试在纤毛虫中产生病毒蛋白。

目前所知纤毛虫不易受病毒感染的事实带来了惊人的优点。这意味着,在基于纤毛虫的生产过程中,不发生外来病毒(adventitiousviruse)的增殖和生长。进一步地,这意味着在出于治疗用途而产生蛋白的情况中,可省去在使用人和动物细胞培养物的工业过程所必须的昂贵的病毒去除步骤。

而且,适用于在纤毛虫中表达病毒蛋白的启动子为诸如wo2007006812a1(也登记在本发明申请人名下)中所公开的那些,其内容援引加入本文。所附序列表的seqidno12和13给出了在本

技术实现要素:
中特别优选的两个纤毛虫特异性启动子,即热诱导型启动子和金属硫蛋白启动子。

值得提及的是gaertig等(1999)(也参见ep1151118)已经说明了原生动物嗜热四膜虫(tetrahymenathermophila)在作为另一种原生动物(即多毛鱼虱(ichthyophthiriusmultifiliis),其为鱼寄生虫)表面抗原蛋白的蛋白表达系统中的应用。他们报道了由此制备的蛋白在所转化四膜虫细胞的表面上展示,此蛋白可在所述表面上被收集并被用于制备抗多毛鱼虱的疫苗。另一种思路是直接使用在它们表面上展示抗原的所转化的四膜虫细胞作为活疫苗。

然而,作者提示四膜虫仅可用作从含富有at基因组的生物体克隆和表达基因的宿主,所述生物体为诸如疟原虫、支原体或利什曼原虫等原生动物,它们也为人病原体。由于在诸如大肠杆菌等常规系统中at序列段的固有不稳定性,从这些生物体克隆基因被证明很困难。四膜虫dna由例如约75%at组成。

而且,报导称在四膜虫中表达外源基因受密码子使用问题的困扰。四膜虫利用uaa和uag三联体作为谷氨酰胺,而在大多数其它生物体中,这些密码子被用作终止翻译的终止密码子。这可能导致以下事实,即携带uaa和uag三联体作为终止密码子的外源基因不被正确地表达。

在本发明的优选实施方式中,此系统进一步包括可操作连接所述核酸的信号序列,此信号序列导致由所述核酸或其片段编码的病毒蛋白分泌进入细胞外基质中。

当病毒蛋白天然表达时(即被噬菌体感染的细菌宿主细胞所表达,或被病毒感染的后生动物宿主细胞所表达),病毒蛋白不被分泌,这是因为病毒利用其宿主的机制和代谢而仅产生其自己的蛋白,所述蛋白随后在宿主细胞裂解前被组装为第二代病毒。这也说明病毒蛋白从未经历进化压力以最佳化分泌的稳定性。

这是以下事实的一个原因,此事实为可溶性病毒蛋白的重组产生和这些可溶性病毒蛋白的随后分泌是复杂的事情。例如,适合的信号序列为诸如wo03078566a1(也登记在本发明申请人名下)中所公开的那些,其内容援引加入本文。

所附序列表的seqidno8和10给出了在本发明内容中特别优选的两种信号肽的核酸序列,即是ha基因的内源信号肽和纤毛虫磷脂酶a1信号肽。

在本发明的另一优选实施方式中,如上所述,所述病毒蛋白为病毒表面蛋白。

通过感染宿主,所述病毒表面蛋白接触宿主,且在一些情况下,如果所述宿主允许此应答(如在免疫系统已很好发展的哺乳动物中),则所述病毒表面蛋白激发免疫应答。因此,这些蛋白具有以分离形式或通过与佐剂(灭活病毒,或其片段)联合而用作疫苗。

在本发明的另一优选实施方式中,所述转基因纤毛虫为四膜科(tetrahymenidae)的成员。

在特别优选的实施方式中,所述转基因纤毛虫为四膜虫(特别为嗜热四膜虫)。四膜虫为非致病性单细胞真核微生物,其已在一些实验室被用作表达宿主。其具有使其适用于异源蛋白表达的大量优点。四膜虫是广泛研究的模式生物,在50年的基础研究中,未观察到病毒或体内寄生物。通过指示细胞系进行的研究未发现诸如病毒或支原体等可感染高等动物的内源性感染因子。

首先,与在纤毛虫中密码子使用有关的上述考虑也适用于四膜虫。而且,可获得用于四膜虫的高拷贝数质粒,其包含来自小染色体rdna的复制起点(ori)。这些小染色体rdna以至多9,000拷贝/细胞的量存在。除此之外,稳定的整合可在大核dna中发生,其中全部基因以45倍拷贝数的量存在。此高基因剂量是有效蛋白生物合成和由此高产率的理想先决条件。与真菌和细菌相反,四膜虫属的纤毛虫非常有效地将生物蛋白分泌至发酵上清液。

四膜虫能够对蛋白进行诸如二硫键、gpi锚定、磷酸化、乙酰化和糖基化等转录后修饰,相比于在真菌或其它真核表达系统中发现的那些修饰,这些修饰更类似于在哺乳动物细胞中的那些修饰。

与哺乳动物细胞不同,四膜虫同时具有易于生长(1.5-3h的短代时间)和成本降低的优点,这是因为可使用化学限定的培养基,且无须肽或血清组分如生长因子存在。

建立了细胞密度为多至2x107细胞/ml且干重量为多至80g/l的四膜虫的分批、补料分批和连续发酵,且表明多至1000l的生产扩大(放大)没有任何问题。在使用报告蛋白的可行性研究中,已实现了50-90pg/细胞/天的时空产率。第一个异源表达实验获得大于200mg/l/天的分泌蛋白产率。四膜虫可在用于微生物表达系统(细菌或真菌)的常规生产装置中发酵。这意味着无须对现有生产工厂或新建生产装置进行昂贵的改建。

尽管有所述优点,纤毛虫表达系统,特别是四膜虫仍是相对未知的,且当被问到可能的异源蛋白表达系统时,本领域技术人员仍会想到大肠杆菌、酵母、基于杆状病毒的系统和永生的哺乳动物细胞系。

然而,纤毛虫表达系统,特别是四膜虫的使用具有本领域中不曾预见到的另一个显著优点。由于哺乳动物免疫系统的自我/非自我识别是基于糖蛋白的碳水化合物组成而实现,抗原的糖基化模式对其免疫原性潜力作出很大程度上的贡献。

reading等(2000)已报道,在哺乳动物细胞中,甘露糖受体在流感病毒和可能的其它包膜病毒感染性进入巨噬细胞中起到主要内吞受体的作用。

甘露糖受体可作为膜结合的凝集素蛋白(也称为“甘露糖结合的凝集素”,“mbl”),其介导在甘露糖、岩藻糖或n-乙酰葡糖胺中终止的糖蛋白和含保守碳水化合物识别结构域(crd)的c类凝集素的吸收。

甘露糖结合的凝集素(mbl)的crd结合诸如甘露糖和n-乙酰葡糖胺等在吡喃糖c3和c4位具有赤道(equatorial)羟基的己糖。因此,它们对通常在哺乳动物糖蛋白上发现的寡糖没有亲和力。

巨噬细胞在哺乳动物免疫系统中起重要作用,因为它们通过内吞作用吸收病原,且在将病原消化后,将病原相关的抗原提呈至对应的t辅助细胞。抗原提呈可通过以下来完成,即将抗原整合到细胞膜,并将与mhcii类分子相连的此抗原展示于对应的t辅助细胞,以向其它白细胞表明尽管在此巨噬细胞的表面上具有抗原,但此巨噬细胞不是病原。

从reading等(2000)的研究中,发明人已经推断出为了提高疫苗的免疫原性,增加疫苗中所含蛋白的糖基化模式中甘露糖含量(即增加甘露糖化)将很有帮助。然而,蛋白糖基化在转录后修饰装置中进行,其是真核生物独有的,因此难以通过设计来对其进行修改。

然而,真核细胞分类单位在它们的糖基化方案,特别是n-糖基化方案中显示出差异。所述糖基化主要存在于真核细胞和古细菌(archea)中,而不存在于细菌中。通常,术语n-糖基化是指天冬酰胺氨基酸残基的糖基化(n)。文中,寡糖链通过酶(寡糖基转移酶)与存在于三肽序列asn-x-ser或asn-x-thr中的那些天冬酰胺残基相连,其中x可为任何氨基酸,尽管pro和asp不常见。

本发明的发明人已令人惊奇地意识到纤毛虫具有独特的n-糖基化模式,携带大量甘露糖残基(参见图1)。而且,本发明的发明人的价值在于,他们发现了用于哺乳动物中接种疫苗的蛋白会受益于末端的甘露糖残基,这是由于增加这些蛋白在巨噬细胞中通过甘露糖受体的捕获,可导致免疫应答的增加。

本发明人由此推断出在纤毛虫,特别是在四膜虫中表达的蛋白由于具有大量甘露糖残基而具有较高的免疫原性潜能,且因此转基因纤毛虫是制备哺乳动物中使用的疫苗,特别是病毒疫苗的潜在候选者。

而且,本发明人已经认识到巨噬细胞表现出增加的病原吞噬作用,所述病原具有富含甘露糖的糖基化模式。为此,有证据说明由于富含甘露糖的糖基化模式,一旦将由此制备的疫苗施用于哺乳动物对象,纤毛虫中疫苗的表达将导致更高的免疫反应。

gaertig等(1999,如上)的工作并未预期到这一发现,因为后者仅描述了将在转基因四膜虫中制备纤毛虫蛋白用作鱼中的疫苗。然而,根据目前的知识,巨噬细胞中甘露糖受体的上述效应仅适用于哺乳动物,而非鱼。因此,鱼疫苗不可能也类似地受益于疫苗糖基化模式中甘露糖量的增加。

在特别优选的实施方式中,所述病毒表面蛋白为病毒融合蛋白(参见上述定义)。

在另一优选实施方式中,所述病毒表面蛋白为选自由i类、ii类和/或iii类病毒融合蛋白组成的组中的至少一种病毒融合蛋白。

所述病毒融合蛋白在结构上差异很大,但它们的融合亚基最终向后折叠为发夹三聚体,其中三个c末端区域包裹在中央n末端三聚体核的外侧上。

如上所述,病毒融合蛋白细分为i类、ii类和iii类病毒融合蛋白。表2概述了来自满足上述定义的包膜病毒的一些病毒融合蛋白。

其中,“-s-s-”表示二硫桥,而“/”表示所指亚基彼此相连,但不通过二硫键相连。“gpx”或“gpx”代表“糖蛋白x”,而“fx”代表“融合蛋白x”。

表2

通常,i类病毒融合蛋白的两个或多个亚基通过二硫桥或其它方式连接。此二聚体的实例为ha1-s-s-ha2、su-s-s-tm、ha1-s-s-ha2、su-s-s-tm、su/tm、f2-s-s-f1、s1/s2、gp1-s-s-gp2、gp1/gp2/ssp。其中,至少一个亚基主要是疏水性结构域,如ha1-s-s-ha2构建体中的ha2亚基。

在优选实施方式中,所述蛋白为i类病毒融合蛋白。参见示意i类病毒融合蛋白的图4。

特别优选的病毒蛋白为血凝素。血凝素(ha)为由两种i类膜融合蛋白亚基(即ha2和ha1)组成的抗原性糖蛋白,其发现于流感病毒正粘病毒科(orthomyxoviridae)以及许多其它细菌和病毒的表面。

血凝素负责将病毒结合至正在受感染的细胞。目前,已知至少16种ha亚类,称为h1-h16。最初的三种血凝素h1、h2和h3发现于人流感病毒中,而禽流感病毒具有如h5血凝素。

ha的主要功能是通过靶细胞膜上各个含唾液酸的受体完成靶脊椎动物细胞的识别,和通过将靶细胞膜与病毒膜融合来使病毒基因组进入靶细胞。在本文中,值得提及的是,正粘病毒科具有包封核衣壳的磷脂膜,所述膜通过从核衣壳释放而获得自宿主细胞。

ha为同型三聚体整合膜糖蛋白。其形状似圆柱且长度约组成ha的三种相同的单体构建为中央α螺旋卷曲;三个球形头包含唾液酸结合位点。ha单体作为前体合成,所述前体随后被糖基化并切割为两个更小的多肽,即ha1和ha2亚基。每个ha单体由通过ha2锚定在膜中并通过大ha1球盖过的长螺旋链组成(参见图3)。

结合机制如下:ha结合存在于其靶细胞表面上的单糖唾液酸。这导致病毒颗粒与细胞表面相粘合。细胞膜随后吞入病毒并夹断以在细胞内形成新的膜结合的区室(compartment),此区室被称为内涵体,其包含被吞入的病毒。细胞随后通过酸化内涵体的内部并将其转化为溶酶体来消化内涵体的内容物。然而,低ph(<6.0)引起ha分子的构象变化,其中ha1与ha2分离并随后再折叠为完全不同的形状。在此过程的最后,所谓的“融合肽”通过将自身插入内涵体膜并锁定而起到类似分子钩的作用。当剩余ha分子再折叠为新的结构时(其在较低ph下更稳定),其收缩“钩锚”并将内涵体膜拉至靠近病毒颗粒自身的膜,引起两者彼此融合。一旦融合发生,包括病毒rna基因组在内的病毒的内容物将自由地注入靶细胞的细胞质内。

本发明人发现四膜虫中全血凝素很难以可溶性蛋白表达(细胞内表达)和分泌(细胞外表达)。尽管在初步实验中,在细胞膜内的此类蛋白表达获得了成功,但可溶性蛋白的表达和其分泌引起以下问题,即血凝素分子成功地在四膜虫中表达,并配有信号肽,但似乎仍保持与细胞内膜结构以及与宿主细胞的细胞膜连接。

此发现不利于信号肽的应用,虽然已证实信号肽可用于其它蛋白表达和分泌,如wo03078566所示,其通过援引加入并入本文。

本发明人已将此现象归因于特别是ha2的高度疏水结构域,其负责保持蛋白成功地在细胞膜中表达。

此现象被认为与受感染宿主细胞中病毒颗粒的天然复制过程类似,其中受感染宿主表达的大多数病毒蛋白被用于组装细胞质内的病毒粒子,而血凝素经由内质网和高尔基体被转移至细胞表面,在细胞表面处的血凝素保持锚定在细胞膜中,直到成熟病毒在球形宿主磷脂膜(前体宿主细胞膜)中出芽离开细胞,由此获得其血凝素包膜。

在本发明的另一优选实施方式中,由所述核酸编码的病毒融合蛋白或其片段缺少至少一个疏水结构域或其部分。

在本发明中,发明人已令人惊奇地发现至少缺少疏水融合肽结构域的病毒蛋白或其部分有助于蛋白分泌。

在异源蛋白表达中,蛋白分泌由信号序列所支持(见上文)。当涉及到蛋白分泌时,大疏水结构域会引起问题,因为其会发挥与表达宿主细胞膜或细胞内膜的一些亲和力。基本上,很容易在诸如四膜虫等转基因纤毛虫中实现蛋白分泌,因为后者分泌大量水解酶以用于食物的细胞外消化。然而,证实纤毛虫中病毒表面蛋白的完全分泌可能变得复杂。

本发明人现已发现在这种情况下去除疏水性结构域会有助于促进蛋白分泌并获得高的分泌蛋白产率,而不影响此修饰蛋白的免疫原潜力。

在病毒蛋白中,抗原结构域通常是亲水性的,因为它们从病毒表面延伸进入周围介质,所述介质通常为水性介质(唾液、血液、粘液和其它体液、废水等)。这意味着在这些情况下去除疏水结构域不影响蛋白的免疫原性。

在病毒蛋白中去除疏水结构域以在细胞裂解后促进蛋白分泌或促进蛋白纯化并且同时保持蛋白免疫原性的所述原理将在以下通过血凝素(ha)证实:

在所述ha蛋白表达中,ha0是前体蛋白,其由各自cdna编码的两个亚基ha1和ha2组成。ha0被蛋白酶(如在许多脊椎动物肺组织中发现的类胰蛋白酶)裂解为其亚基,所述亚基通过二硫桥保持彼此连接(ha1-ha2-蛋白,参见图3和4)。

虽然ha1负责受体识别并包括具有最高免疫原性潜力的结构域,特别是包括位于宿主细胞膜多糖包被(glycokalyx)中用于唾液酸的结合位点的球形结构域(“头部”),但ha2(其也锚定病毒膜中完全的ha1-ha2复合体)负责膜融合。ha2包括由相对疏水序列组成的n端融合肽(fp)(参见表1)。

此融合肽由约24个n端高度保守的残基组成,其中至少6个残基为甘氨酸(参见图4,其中融合肽包括8个甘氨酸)。三个α螺旋(α-h1、α-h2和α-h3)如下。高疏水跨膜结构域(tmd)如下,其锚定病毒包膜脂质双层中的蛋白(参见图3)。

下表概括了本发明的缺少至少一个疏水结构域的可能的修饰血红素,其中“tmd”代表“跨膜结构域”且“fp”代表“融合肽”。从上文可清楚的得出所述原理也适用于其它i类、ii类和/或iii类病毒融合蛋白。

表3

值得提及的是,作为蛋白分泌的替代,本发明人发现病毒蛋白的细胞内表达是一种可能的选择,所述病毒蛋白在细胞质中是可溶的形式。本发明人已经发现细胞内表达的全部特征的i类病毒融合蛋白将倾向于连接纤毛虫宿主的细胞内膜以及细胞膜,其中所述细胞内膜有很多,如内质网、高尔基体、核膜、线粒体等,且在此情况下可在宿主细胞裂解后不被分离。本发明人已进一步发现如果病毒融合蛋白缺少至少一个疏水结构域,其将显示出降低的与细胞内膜连接的倾向性。因此,以此方式修饰的蛋白(如表3所示)更易于从整个细胞裂解物中分离。

而且,本发明提供了至少一种核酸分子,所述核酸分子选自:

a)包含seqidno:2、4和/或6所示核苷酸序列的核酸分子,

b)编码包含seqidno:3、5和/或7所示氨基酸序列的多肽的核酸分子,其中所述多肽为病毒蛋白或其片段,

c)编码缺少至少一个疏水结构域的截短形式的病毒蛋白的核酸分子,所述病毒蛋白优选病毒融合蛋白,且更优选i类、ii类和/或iii类病毒融合蛋白,

d)编码缺少跨膜结构域(tmd)、融合肽(fp)和/或ha2亚基的截短形式的i类病毒融合蛋白的核酸分子,

e)核酸分子,其为a)–d)中的任一核酸分子的部分、变体、同源物或衍生物,

f)核酸分子,其与a)–e)中的任一核酸分子互补,

g)核酸分子,其能够在严格性条件下与a)–f)中的任一核酸分子杂交,

h)核酸分子,其与a)–g)中的任一核酸分子相比包含至少一个沉默的单核苷酸取代,

i)根据a)和c)–h)的核酸分子,其针对原生动物表达宿主优化编码,和/或

j)核酸分子,其与a)–i)中的任一核酸分子具有至少70%,优选95%的序列相同性。

对于所述核酸分子的特别优选的选择(fallbackposition)与a)–i)中的任一核酸分子具有70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列相同性。

而且,提供了用于纤毛虫宿主细胞转染的载体,所述载体包括:

a)编码病毒蛋白的核酸或其片段,和

b)与所述核酸可操作连接的启动子。

所述核酸优选为cdna。

本发明进一步提供了用本发明载体转染的纤毛虫宿主细胞。所述纤毛虫优选为四膜虫科(tetrahymenidae)的成员。

而且,本发明提供了用于在纤毛虫宿主细胞中产生至少一种病毒蛋白或其片段的方法,所述方法包括以下步骤:

a)用本发明的载体转染纤毛虫宿主细胞,

b)在使得蛋白表达的条件下培养所述宿主细胞。

在优选实施方式中,所述方法进一步包括以下步骤:

c)在使得蛋白的所表达的蛋白分泌的条件下培养所述宿主细胞。

而且,本发明提供了选自以下的蛋白:

a)由本发明的核酸编码的蛋白,

b)包含本发明的氨基酸序列的蛋白,

c)包含至少一个保守的氨基酸取代的a)或b)的蛋白,和/或

d)可通过本发明方法获得的蛋白。

而且,本发明提供了制备药物组合物的方法,所述方法包括以下步骤:

a)在本发明的纤毛虫表达系统中表达本发明的蛋白,和

b)分离和/或纯化由此获得的蛋白。

在另一实施方式中,本发明提供了制备药物组合物的方法,所述方法包括本发明的方法。

而且,本发明提供了包括本发明的蛋白或由本发明方法制备的药物组合物。在优选实施方式中,所述组合物为疫苗。

免责声明

为了提供全面的公开而不过度地延长说明书,申请人在此将上文参考的每篇专利和专利申请通过援引加入本文。

上文详述的实施方式中元素和特征的具体组合仅作为实例,同样可清楚地预期到使用本文和通过援引加入本文的专利/申请中的其他教导交换和取代这些教导。本领域技术人员可认识到,本领域普通技术人员可想到本文描述的变式、改变和其他实现方式而不脱离本发明要求保护的精神和范围。因此,上文的描述仅为举例的方式而非限制的目的。本发明的范围如后附权利要求书及其等同物限定。此外,本说明书和权利要求书中使用的参考标记不限制本发明要求保护的范围。

具体实施方式

以举例的方式公开于从属权利要求和关于各附图和实施例的以下说明中的本发明目标的其他细节、特征、特性和优点显示了本发明的优选实施方式。然而,不应以任何方式将这些附图理解为对本发明的限制。

实施例和附图

1.表达载体的构建

将不同血凝素片段的合成基因(参见seqidno.2、4和6)克隆入供体载体(参见图2a)。将来自全部供体载体的表达盒使用cre依赖性重组酶系统转移入受体载体(参见图2b)。

2.野生型四膜虫的培养和表达质粒的转化

将野生型嗜热四膜虫株系(如b1868/4、b1868/7和b2068/1)在脱脂牛奶培养基、添加的朊蛋白胨(spp)或化学限定培养基(cdm)中培养。按照之前cassidy-hanley等1997中的描述进行嗜热四膜虫细胞的转化。

3.重组血凝素的检测

将转化的四膜虫细胞在30℃选择压力下在摇床以80rpm培养于spp培养基中。靶基因表达通过在41℃(hsp-p)下热激对数生长培养物或通过加入20nmcd2+(mtt1-p)来诱导。

在靶基因表达诱导24小时后收集转化细胞和不含细胞的spp上清液的等分试样。将收集的细胞溶解在冰冷的ripa缓冲液(5000细胞/μl,150mmnacl、10mmtrishcl、5mmedta、0.1%sds、0.1%doc、1%tritonx100、e642,5μg/ml)中并在超声波机中破碎15分钟。sds-page和蛋白印迹分析根据现有技术进行。简言之,将破碎细胞的等分试样(即1000个细胞)或不含细胞的上清液重悬于laemmli样品缓冲液(125mmtrishclph6.8、10%甘油、4%sds)中并在12%sds-page上分离。将凝胶印迹在硝酸纤维素膜上,并用含0.05%吐温20和5%脱脂奶或3%牛血清白蛋白的pbs封闭。使用病毒株特异性一抗检测重组血凝素在所转化纤毛虫中的表达。在用pbs/t清洗且施加hrp缀合的二抗后,使用supersignalwestpico化学发光底物(perbio,fischerscientific)并结合常规x射线膜显影来使印迹显影。图8和图9a-c显示出在诱导靶基因表达后,所转化四膜虫细胞的细胞裂解物和上清液的代表性蛋白印迹。野生型对照(图9b,泳道3为细胞颗粒,泳道4为上清液)为全部空白。在图8中,已知在发酵过程中ha抗原分泌入上清液。图9显示了在所转化纤毛虫的上清液中检测截短的血凝素,其中图9a为去除细胞内结构域的截短的血凝素(“ha_长”),图9b为去除跨膜域的截短的血凝素(“ha_短”),且图9c为去除整个ha2亚基的截短的血凝素(“ha_1”)。

4.血凝素的制备

对于发酵,使用安装有标准rushton叶轮的braunud50(50升)和inforssixfors(0.5升)。分别将搅拌机速度限制为300和400rpm,将po2设定为20%,且将ph设定为7.0。发酵在标准培养基中进行。

5.重组血凝素的纯化

使用中空纤维模块(0.3m2,3l/min,管直径11mm)从50l发酵工艺中收集细胞,以将细胞与发酵肉汤分离。将细胞颗粒用冰冷的磷酸钠缓冲液(ph7.410mm,pb)清洗3至4次,并通过在10℃和2400xg下持续8分钟的离心步骤来沉淀(pelleted),以去除菌胞(mycocyst)内容物。将所得细胞颗粒重悬于添加有半胱氨酸蛋白酶抑制剂e-64(70μm)和3%20的pb中。使用ultraturrax(ikautt25+s25n-25g)以10,000rpm将细胞在冰上破碎5分钟。将裂解物使用pb(ph7.4)补足至1.8l并通过在4℃下搅拌17小时来溶解。细胞裂解物的过滤使用中空纤维模块(0.45μm,850cm2表面积)进行,所述中空纤维模块使用2.3lpb(ph7.4)清洗3次。

色谱纯化使用三步色谱纯化工艺进行,得到不变性的且适合用作疫苗组分的高度纯化的重组ha抗原。

全部色谱在4℃下进行。将如上制备的包含ha的滤出物以15ml/min首先上样至铵阴离子交换柱(captotmq柱,具有强季铵的琼脂糖颗粒柱),所述铵阴离子交换柱用含5%甘油和3%20的pb(ph7.4)平衡。将柱首先用含3%20的上样缓冲液清洗,随后用不含20的上样缓冲液清洗,以去除去污剂。部分纯化的ha的洗脱在第一步中使用包含5%甘油和150mmnacl的pb进行,在第二步中使用包含1mnacl的pb(ph7.4)进行。所有收集的部分的样品使用sds-page、蛋白印迹和bradford试验进行分析,并将ha阳性部分收集以用于随后的色谱步骤。

由于重组ha无法结合此柱,所以使用陶瓷羟基磷灰石柱(cht)来去除污染蛋白。将从captotmq柱中获得的收集的部分浓缩,且使用实验室级的tff模块(30kda)以及含5%甘油的pb来进行缓冲剂交换以去除nacl。在上样至cht柱前,将样品的ph调节至7.5。上样流速为7ml/min,且将柱随后用含5%甘油的pb清洗。通过使用含5%甘油的150mmpb(ph7.5)来进行洗脱。洗出液和流出物(flowthrough)通过sds-page、蛋白印迹分析和bradford试验来测定,并将含ha的200ml流出物送至第三柱。

对于第三纯化步骤,使用cona琼脂糖4b柱(具有通过溴化氰方法将琼脂糖4b与伴刀豆球蛋白a偶联的亲和介质)。向羟基磷灰石柱的流出物补加150mmnacl,并以5ml/min的流速加入柱中。将柱用磷酸盐缓冲液(pbs,ph7.4)清洗,并将纯化的重组ha用含0.5m甲基-α-d-吡喃甘露糖苷(ph7.4)的pbs洗脱。洗脱部分的样品通过sds-page、蛋白印迹分析和bradford试验来分析。

附图

图1a概述了不同分类单位的n-糖基化模式。通常,术语“n-糖基化”是指天冬酰胺氨基酸残基的糖基化(n)。文中,寡糖链通过寡糖基转移酶与存在于三肽序列asn-x-ser或asn-x-thr中的那些天冬酰胺残基相连,其中x可为除pro外的任何氨基酸。

可以确定,尽管原核生物完全没有n-糖基化,但纤毛虫特征为富含甘露糖的n-糖基化模式,因此增强了蛋白的免疫原性潜力(参见本文)。图1b显示了在一些纤毛虫物种中,所述模式中可能的变化。

图2a显示了编码合成ha基因的供体载体。此供体载体由以下组成:用于在大肠杆菌中扩增的细菌骨架(puc_ori)、用于大肠杆菌中选择的卡那霉素(kanr)、氯霉素(cmr)选择盒和蔗糖酶基因(sacb)、以及在诱导型启动子和控制下的靶基因(ha基因)的开放阅读框和随后的嗜热四膜虫[β]-微管蛋白2终止子序列(btu2)。

图2b显示了用于纤毛虫嗜热四膜虫的表达载体。此载体包含:用于大肠杆菌中选择的氨苄青霉素(ampr)和氯霉素(cmr)抗性基因、用于嗜热四膜虫中质粒增殖的嗜热四膜虫特异性起点(rdnaori)、用于鉴定所转化纤毛虫的基于新霉素的选择盒(neor)、以及在诱导型启动子控制下的靶基因(ha基因)的开放阅读框和随后的嗜热四膜虫[β]-微管蛋白2终止子序列(btu2)。

图3a显示了具有其亚基ha1(黑色)和ha2(灰色)的血凝素。标明α螺旋和β折叠。

图3b显示了具有亚基ha1(黑色)和ha2的血凝素的示意图。显示了融合肽(fp,如上)以及锚定病毒包膜中蛋白的跨膜结构域(tmd)。ha1和ha2通过二硫键(dsb)连接。连接两个α螺旋(α-h1和α-h2)的ha2的区段被称为“环结构域”(ld)。未显示ha2的c末端细胞质尾。

ha1包括由二硫键(未显示)稳定的球形结构域(“头部”)。所述头部包括位于宿主细胞膜多糖包被中用于唾液酸的结合位点。类似地,头部具有高免疫原性潜力,因此是免疫后所产生的大多数抗ha抗体的靶。

为了激发病毒包膜双层与宿主细胞膜的融合,通过降低ph来促进ha1和ha2的彼此分开,这导致ha同型三聚体中的ha1亚基带正电荷。

这产生了排斥力,ha1亚基彼此相背移动,因此与随后被激活的ha2亚基分离。激活的ha2导致膜的融合。ha2仅可被激活一次,随后其保持无活性。因此,重要的是ha1不能过早分离,否则病毒会丧失其感染潜力。

ha2具有很长的伸展的α螺旋结构并包含大环区域。此外,ha2包含跨膜结构域和融合肽。融合肽通过ha1亚基的分开来自由设定。

为了降低融合,ha1的球形结构域(“头部”)必须与ha2分离。因此,ha2可改变其构象,使得其展开且融合肽可以穿过宿主膜。因此,病毒变为直接与宿主膜连接。

由于展开过程,ha2在一侧伸展。其它区域内卷,使得蛋白没有净增大。随后,ha改变其构象并使病毒靠近宿主膜,使得膜融合发生。

图4a显示了文中所述i类病毒融合蛋白的一般结构,以血凝素为例。ha1和ha2为流感ha0i类蛋白的亚基。标记指明了普通i类病毒融合蛋白亚基的信号肽(sp)、融合蛋白(fp)、加工位点(箭头)、跨膜结构域(tmd)的位置。

在图4b中(参见seqid3),示例性说明了流感a病毒a株/newcaledonia/20/1999h1n1(genbank登录号:aap34324.1)的血凝素的亚基。下划线表示信号肽(sp)、ha2融合肽(fp)和ha2跨膜结构域(tmd)。

所示蛋白由565个氨基酸残基(“aa”)组成。具体的序列特征在表4中说明。需指出,ha2融合肽和ha2跨膜结构域具有高的疏水氨基酸份额(基于表1的亲水性数据计算的数据),其中例如融合肽包括8个甘氨酸残基。本发明人已显示为了在纤毛虫中异源表达的目的,本发明提供的这些结构域的截短会促进蛋白分泌和/或细胞裂解后的蛋白纯化。

表4

表4清楚地表明ha2跨膜结构域和ha2融合肽具有最高的疏水氨基酸份额。本发明人已从此发现中推断出从这两个结构域中截短至少一个结构域将促进蛋白分泌进入培养基。

值得注意,图4中蛋白所示的特征适用于其它血凝素以及表2中所示的大多数i类病毒融合蛋白。

图5显示了嗜热四膜虫和人(homosapiens)之间密码子利用的比较。后者适用于在人宿主中表达的病毒蛋白,如从人宿主细胞中表达的血凝素。详见本文。

图6显示了在纤毛虫,特别是在四膜虫中使用的遗传密码子。编码谷氨酰胺的非规范核苷酸密码uaa和uag以粗体标出。然而,根据通用遗传密码子,这些三联体为终止密码子(参见删除的三联体)。“1lc”代表“一个字母的密码”,而“3lc”代表“三个字母的密码”。

图7示例性显示了病毒血凝素序列(参见seqidno.1)之间密码子利用的比较,以及用于在嗜热四膜虫中表达的血凝素的密码子优化序列(参见seqidno.2)。密码子利用的差异使用灰色框标出。

在图8中,显示了在补料分批发酵工艺中(0.5l)培养的表达重组ha的转化的纤毛虫的免疫印迹。在非还原性条件下对来自不同收集时间点(sn1-47.5h、sn2-66h、sn3-70h、sn4-90h)的上清液样品进行sds-page,随后进行免疫印迹。使用特异性流感抗b/florida/4/2006血清进行染色。所用nibsc-ha抗原(阳性对照)显示出对应于约90kda(a,nibsc,45ng)的信号。在培养47.5h后,约72kda和90kda的ha特异性带出现在上清液中。所述蛋白对应于seqidno9。

在图9中,显示了在四膜虫中重组表达的不同长度的血凝素蛋白片段(根据本发明的教导截短)的免疫印迹。使用特异性豚鼠抗h1n1抗体进行染色。p为四膜虫细胞颗粒,且sn为细胞培养物上清液。泳道1和2是指四膜虫克隆,而泳道3和4为野生型对照。

图9a显示了被称作“ha_长”的蛋白,其是不含ha2细胞内结构域(ct,参见图4a)的完成ha1-ha2-二聚体(分子量预计为61.4kda)。所述蛋白对应于seqidno3。

图9b显示了被称作“ha_短”的蛋白,其是不含ha2细胞内结构域(ct)和疏水跨膜结构域(tmd)的ha1-ha2-二聚体(分子量预计为57.6kda)。所述蛋白对应于seqidno5。

图9c仅显示了ha1(被称作“ha_1”,分子量预计为34.2kda),即包含其至少两个疏水结构域(融合肽和跨膜结构域)的ha2已被截短。所述蛋白对应于seqidno7。

从免疫印迹可清楚确定,上清液中不含至少一个疏水结构域的ha_短和ha_1多于ha_长,这支持了以下结论,即通过去除至少一个疏水结构域可促进纤毛虫中病毒融合蛋白的蛋白分泌,这是因为与细胞膜连接的倾向性降低。而且,由于病毒融合蛋白,特别是血凝素的免疫原性结构域位于ha1亚基中,预期仅包含ha1亚基或ha1亚基+截短的ha2亚基的疫苗将仍能激发免疫应答,因此可用于制备疫苗。

图10a显示了根据本发明seqidno3(即“ha_长”)蛋白的疏水性图,此图根据kyte-doolittle比例绘制。可很容易确定,融合肽(aa344–368)和跨膜结构域(aa530-550)是蛋白的主要疏水区域之一(见箭头),因此不妨碍蛋白有效分泌进入培养基。

图10b显示了纤毛虫主要分泌蛋白的疏水性图(本发明人的wo03078566的seqidno2),此蛋白被四膜虫大量分泌到其天然环境中。显然,此蛋白不具有高疏水结构域,且疏水性平均低于ha_长。相比于ha_长,本发明人将这一现象用于促进此蛋白的分泌。

序列表

在附录中加入全部序列表,此序列表是指以下序列(na:核酸;aa:氨基酸)。

表5

参考文献:

cassidy-hanley,d.;bowen,j.;lee,j.;cole,e.;verplank,l.;gaertig,j.;gorovsky,m.&bruns,p.germlineandsomatictransformationofmatingtetrahymenathermophilabyparticlebombardment.genetics,1997,146,135-47.

gaertig,j.;gao,y.;tishgarten,t.;clark,t.&dickerson,h.surfacedisplayofaparasiteantigenintheciliatetetrahymenathermophila.natbiotechnol,1999,17,462-5.

kulakosky,p.;hughes,p.&wood,h.n-linkedglycosylationofabaculovirus-expressedrecombinantglycoproteinininsectlarvaeandtissueculturecells.glycobiology,1998,8,741-5.

reading,p.;miller,j.&anders,e.involvementofthemannosereceptorininfectionofmacrophagesbyinfluenzavirus.jvirol,2000,74,5190-7.

tomiya,n.;narang,s.;lee,y.c.&betenbaugh,m.j.comparingn-glycanprocessinginmammaliancelllinestonativeandengineeredlepidopteraninsectcelllines.glycoconjj,2004,21,343-60.

kyte,j.;doolittlerf.asimplemethodfordisplayingthehydropathiccharacterofaprotein.jmolbiol157,105,1982.

序列表

<110>基利安股份公司

<120>用于在纤毛虫宿主细胞中异源表达病毒蛋白的系统

<130>cd40333

<150>ep0910357.3

<151>2009-06-17

<160>15

<170>patentinversion3.5

<210>1

<211>1697

<212>dna

<213>influenzavirus

<400>1

atgaaagcaaaactactggtcctgttatgtacatttacagctacatatgcagacacaata60

tgtataggctaccatgccaacaactcaaccgacactgttgacacagtacttgagaagaat120

gtgacagtgacacactctgtcaacctacttgaggacagtcacaatggaaaactatgtcta180

ctaaaaggaatagccccactacaattgggtaattgcagcgttgccggatggatcttagga240

aacccagaatgcgaattactgatttccaaggaatcatggtcctacattgtagaaacacca300

aatcctgagaatggaacatgttacccagggtatttcgccgactatgaggaactgagggag360

caattgagttcagtatcttcatttgagagattcgaaatattccccaaagaaagctcatgg420

cccaaccacaccgtaaccggagtatcagcatcatgctcccataatgggaaaagcagtttt480

tacagaaatttgctatggctgacggggaagaatggtttgtacccaaacctgagcaagtcc540

tatgtaaacaacaaagagaaagaagtccttgtactatggggtgttcatcacccgcctaac600

atagggaaccaaagggccctctatcatacagaaaatgcttatgtctctgtagtgtcttca660

cattatagcagaagattcaccccagaaatagccaaaagacccaaagtaagagatcaggaa720

ggaagaatcaactactactggactctgctggaacctggggatacaataatatttgaggca780

aatggaaatctaatagcgccatggtatgcttttgcactgagtagaggctttggatcagga840

atcatcacctcaaatgcaccaatggatgaatgtgatgcgaagtgtcaaacacctcaggga900

gctataaacagcagtcttcctttccagaatgtacacccagtcacaataggagagtgtcca960

aagtatgtcaggagtgcaaaattaaggatggttacaggactaaggaacatcccatccatt1020

caatccagaggtttgtttggagccattgccggtttcattgaaggggggtggactggaatg1080

gtagatgggtggtatggttatcatcatcagaatgagcaaggatctggctatgctgcagat1140

caaaaaagtacacaaaatgccattaacgggattacaaacaaggtgaattctgtaattgag1200

aaaatgaacactcaattcacagctgtgggcaaagaattcaacaaattggaaagaaggatg1260

gaaaacttaaataaaaaagttgatgatgggtttctagacatttggacaataatgcagaat1320

tgttggttctactggaaaatgaaaggactttggatttccatgactccaatgtgaagaatc1380

tgtatgagaaagtaaaaagccaattaaagaataatgccaaagaaataggaaacgggtgtt1440

ttgaattctatcacaagtgtaacaatgaatgcatggagagtgtgaaaaatggaacttatg1500

actatccaaaatattccgaagaatcaaagttaaacagggagaaaattgatggagtgaaat1560

tggaatcaatgggagtctatcagattctggcgatctactcaactgtcgccagttccctgg1620

ttcttttggtctccctgggggcaatcagcttctggatgtgttccaatgggtctttgcagt1680

gtagaatatgcatctga1697

<210>2

<211>1698

<212>dna

<213>influenzavirus

<400>2

atgaaagctaagttattagttttactttgtactttcactgctacttatgctgatactatt60

tgtattggttatcacgctaataattctactgatactgttgatactgttttagaaaaaaat120

gttactgttactcactctgttaatcttttagaagattctcacaatggtaaattatgttta180

cttaaaggtattgctcctttataacttggtaattgttctgttgctggttggattcttggt240

aatcctgaatgtgaattacttatttctaaagaatcttggtcttatattgttgaaactcct300

aatcctgaaaatggtacttgttatcctggttatttcgctgattatgaagaattaagagaa360

taactttcttctgtttcttcatttgaaagattcgaaattttccctaaagaatcttcttgg420

cctaatcacactgttactggtgtttctgcttcttgttctcataatggtaaatcttcattc480

tatagaaatcttttatggttaactggtaaaaatggtttatatcctaatctttctaaatct540

tatgttaataataaggaaaaagaagttttagttctttggggtgttcaccaccctcctaat600

attggtaattaaagagctttatatcacactgaaaatgcttatgtttctgttgtttcttct660

cactattctagaagattcactcctgaaattgctaaaagacctaaagttagagattaagaa720

ggtagaattaactattattggactttattagaacctggtgatactattattttcgaagct780

aatggtaatcttattgctccttggtacgctttcgctttatctagaggtttcggttctggt840

attattacttctaatgctcctatggatgaatgtgatgctaaatgttaaactccttaaggt900

gctattaattcttctttacctttctaaaacgttcaccctgttactattggtgaatgtcct960

aaatatgttagatcagctaaattaagaatggttactggtttaagaaatattccttctatc1020

taatctagaggacttttcggtgctattgctggtttcattgagggaggatggacaggtatg1080

gttgatggttggtacggttatcaccaccaaaatgaataaggttctggttatgctgctgat1140

taaaagtctactcaaaacgctattaatggtattactaacaaagttaattctgttattgaa1200

aaaatgaatacttaattcactgctgttggtaaagaattcaataagttagaaagaagaatg1260

gaaaatcttaataagaaagttgatgatggtttcttagatatttggacttataatgctgaa1320

ttattagttcttttagaaaatgaaagaactttagatttccacgattctaatgttaaaaat1380

ctttatgaaaaagttaaatcttaacttaagaataatgctaaagaaattggtaatggttgt1440

ttcgaattctatcacaaatgtaataatgaatgtatggaatctgttaagaatggtacttat1500

gattatcctaaatattctgaagaatctaagttaaatagagaaaaaattgatggtgttaaa1560

ttagaatctatgggagtttactaaattcttgctatctattctactgttgcttcttcttta1620

gttttattagtttctttaggtgctatttctttctggatgtgttctaatggttctttataa1680

tgtagaatttgtatttga1698

<210>3

<211>550

<212>prt

<213>influenzavirus

<400>3

metlysalalysleuleuvalleuleucysthrphethralathrtyr

151015

alaaspthrilecysileglytyrhisalaasnasnserthraspthr

202530

valaspthrvalleuglulysasnvalthrvalthrhisservalasn

354045

leuleugluaspserhisasnglylysleucysleuleulysglyile

505560

alaproleuglnleuglyasncysservalalaglytrpileleugly

65707580

asnproglucysgluleuleuileserlysglusertrpsertyrile

859095

valgluthrproasnprogluasnglythrcystyrproglytyrphe

100105110

alaasptyrglugluleuarggluglnleuserservalserserphe

115120125

gluargphegluilepheprolysglusersertrpprothrhisthr

130135140

valthrglyvalseralasercysserhisasnglylysserserphe

145150155160

tyrargasnleuleutrpleuthrglylysasnglyleutyrproasn

165170175

leuserlyssertyrvalasnasnlysglulysgluvalleuvalleu

180185190

trpglyvalhishisproproasnileglyaspglnargalaleutyr

195200205

histhrgluasnalatyrvalservalvalserserhistyrserarg

210215220

argphethrprogluilealalysargprolysvalargaspglnglu

225230235240

glyargileasntyrtyrtrpthrleuleugluproglyaspthrile

245250255

ilepheglualaasnglyasnleuilealaprotrptyralapheala

260265270

leuserargglypheglyserglyileilethrserasnalapromet

275280285

aspglucysaspalalyscysglnthrproglnglyalaileasnser

290295300

serleupropheglnasnvalhisprovalthrileglyglucyspro

305310315320

lystyrvalargseralalysleuargmetvalthrglyleuargasn

325330335

ileproserileglnserargglyleupheglyalailealaglyphe

340345350

ilegluglyglytrpthrglymetvalaspglytrptyrglytyrhis

355360365

hisglnasngluglnglyserglytyralaalaaspglnlysserthr

370375380

glnasnalaileasnglyilethrasnlysvalasnservalileglu

385390395400

lysmetasnthrglnphethralavalglylysglupheasnlysleu

405410415

gluargargmetgluasnleuasnlyslysvalaspaspglypheleu

420425430

aspiletrpthrtyrasnalagluleuleuvalleuleugluasnglu

435440445

argthrleuaspphehisaspserasnvallysasnleutyrglulys

450455460

vallysserglnleulysasnasnalalysgluileglyasnglycys

465470475480

phegluphetyrhislyscysasnasnglucysmetgluservallys

485490495

asnglythrtyrasptyrprolystyrserglugluserlysleuasn

500505510

argglulysileaspglyvallysleuglusermetglyvaltyrgln

515520525

ileleualailetyrserthrvalalaserserleuvalleuleuval

530535540

serleuglyalaileser

545550

<210>4

<211>1604

<212>dna

<213>influenzavirus

<400>4

ggcgcgccatggatatcaaagctaagttattagttttactttgtactttcactgctactt60

atgctgatactatttgtattggttatcacgctaataattctactgatactgttgatactg120

ttttagaaaaaaatgttactgttactcactctgttaatcttttagaagattctcacaatg180

gtaaattatgtttacttaaaggtattgctcctttataacttggtaattgttctgttgctg240

gttggattcttggtaatcctgaatgtgaattacttatttctaaagaatcttggtcttata300

ttgttgaaactcctaatcctgaaaatggtacttgttatcctggttatttcgctgattatg360

aagaattaagagaataactttcttctgtttcttcatttgaaagattcgaaattttcccta420

aagaatcttcttggcctaatcacactgttactggtgtttctgcttcttgttctcataatg480

gtaaatcttcattctatagaaatcttttatggttaactggtaaaaatggtttatatccta540

atctttctaaatcttatgttaataataaggaaaaagaagttttagttctttggggtgttc600

accaccctcctaatattggtaattaaagagctttatatcacactgaaaatgcttatgttt660

ctgttgtttcttctcactattctagaagattcactcctgaaattgctaaaagacctaaag720

ttagagattaagaaggtagaattaactattattggactttattagaacctggtgatacta780

ttattttcgaagctaatggtaatcttattgctccttggtacgctttcgctttatctagag840

gtttcggttctggtattattacttctaatgctcctatggatgaatgtgatgctaaatgtt900

aaactccttaaggtgctattaattcttctttacctttctaaaacgttcaccctgttacta960

ttggtgaatgtcctaaatatgttagatcagctaaattaagaatggttactggtttaagaa1020

atattccttctatctaatctagaggacttttcggtgctattgctggtttcattgagggag1080

gatggacaggtatggttgatggttggtacggttatcaccaccaaaatgaataaggttctg1140

gttatgctgctgattaaaagtctactcaaaacgctattaatggtattactaacaaagtta1200

attctgttattgaaaaaatgaatacttaattcactgctgttggtaaagaattcaataagt1260

tagaaagaagaatggaaaatcttaataagaaagttgatgatggtttcttagatatttgga1320

cttataatgctgaattattagttcttttagaaaatgaaagaactttagatttccacgatt1380

ctaatgttaaaaatctttatgaaaaagttaaatcttaacttaagaataatgctaaagaaa1440

ttggtaatggttgtttcgaattctatcacaaatgtaataatgaatgtatggaatctgtta1500

agaatggtacttatgattatcctaaatattctgaagaatctaagttaaatagagaaaaaa1560

ttgatggtgttaaattagaatctatgggagtttactaaatttga1604

<210>5

<211>538

<212>prt

<213>influenzavirus

<400>5

metlysalalysleuleuvalleuleucysthrphethralathrtyr

151015

alaaspthrilecysileglytyrhisalaasnasnserthraspthr

202530

valaspthrvalleuglulysasnvalthrvalthrhisservalasn

354045

leuleugluaspserhisasnglylysleucysleuleulysglyile

505560

alaproleuglnleuglyasncysservalalaglytrpileleugly

65707580

asnproglucysgluleuleuileserlysglusertrpsertyrile

859095

valgluthrproasnprogluasnglythrcystyrproglytyrphe

100105110

alaasptyrglugluleuarggluglnleuserservalserserphe

115120125

gluargphegluilepheprolysglusersertrpprothrhisthr

130135140

valthrglyvalseralasercysserhisasnglylysserserphe

145150155160

tyrargasnleuleutrpleuthrglylysasnglyleutyrproasn

165170175

leuserlyssertyrvalasnasnlysglulysgluvalleuvalleu

180185190

trpglyvalhishisproproasnileglyaspglnargalaleutyr

195200205

histhrgluasnalatyrvalservalvalserserhistyrserarg

210215220

argphethrprogluilealalysargprolysvalargaspglnglu

225230235240

glyargileasntyrtyrtrpthrleuleugluproglyaspthrile

245250255

ilepheglualaasnglyasnleuilealaprotrptyralapheala

260265270

leuserargglypheglyserglyileilethrserasnalapromet

275280285

aspglucysaspalalyscysglnthrproglnglyalaileasnser

290295300

serleupropheglnasnvalhisprovalthrileglyglucyspro

305310315320

lystyrvalargseralalysleuargmetvalthrglyleuargasn

325330335

ileproserileglnserargglyleupheglyalailealaglyphe

340345350

ilegluglyglytrpthrglymetvalaspglytrptyrglytyrhis

355360365

hisglnasngluglnglyserglytyralaalaaspglnlysserthr

370375380

glnasnalaileasnglyilethrasnlysvalasnservalileglu

385390395400

lysmetasnthrglnphethralavalglylysglupheasnlysleu

405410415

gluargargmetgluasnleuasnlyslysvalaspaspglypheleu

420425430

aspiletrpthrtyrasnalagluleuleuvalleuleugluasnglu

435440445

argthrleuaspphehisaspserasnvallysasnleutyrglulys

450455460

vallysserglnleulysasnasnalalysgluileglyasnglycys

465470475480

phegluphetyrhislyscysasnasnglucysmetgluservallys

485490495

asnglythrtyrasptyrprolystyrserglugluserlysleuasn

500505510

argglulysileaspglyvallysleuglusermetglyvaltyrgln

515520525

ileleualailetyrserthrvalalaser

530535

<210>6

<211>1032

<212>dna

<213>influenzavirus

<400>6

atcaaagctaagttattagttttactttgtactttcactgctacttatgctgatactatt60

tgtattggttatcacgctaataattctactgatactgttgatactgttttagaaaaaaat120

gttactgttactcactctgttaatcttttagaagattctcacaatggtaaattatgttta180

cttaaaggtattgctcctttataacttggtaattgttctgttgctggttggattcttggt240

aatcctgaatgtgaattacttatttctaaagaatcttggtcttatattgttgaaactcct300

aatcctgaaaatggtacttgttatcctggttatttcgctgattatgaagaattaagagaa360

taactttcttctgtttcttcatttgaaagattcgaaattttccctaaagaatcttcttgg420

cctaatcacactgttactggtgtttctgcttcttgttctcataatggtaaatcttcattc480

tatagaaatcttttatggttaactggtaaaaatggtttatatcctaatctttctaaatct540

tatgttaataataaggaaaaagaagttttagttctttggggtgttcaccaccctcctaat600

attggtaattaaagagctttatatcacactgaaaatgcttatgtttctgttgtttcttct660

cactattctagaagattcactcctgaaattgctaaaagacctaaagttagagattaagaa720

ggtagaattaactattattggactttattagaacctggtgatactattattttcgaagct780

aatggtaatcttattgctccttggtacgctttcgctttatctagaggtttcggttctggt840

attattacttctaatgctcctatggatgaatgtgatgctaaatgttaaactccttaaggt900

gctattaattcttctttacctttctaaaacgttcaccctgttactattggtgaatgtcct960

aaatatgttagatcagctaaattaagaatggttactggtttaagaaatattccttctatc1020

taatctagatga1032

<210>7

<211>343

<212>prt

<213>influenzavirus

<400>7

metlysalalysleuleuvalleuleucysthrphethralathrtyr

151015

alaaspthrilecysileglytyrhisalaasnasnserthraspthr

202530

valaspthrvalleuglulysasnvalthrvalthrhisservalasn

354045

leuleugluaspserhisasnglylysleucysleuleulysglyile

505560

alaproleuglnleuglyasncysservalalaglytrpileleugly

65707580

asnproglucysgluleuleuileserlysglusertrpsertyrile

859095

valgluthrproasnprogluasnglythrcystyrproglytyrphe

100105110

alaasptyrglugluleuarggluglnleuserservalserserphe

115120125

gluargphegluilepheprolysglusersertrpprothrhisthr

130135140

valthrglyvalseralasercysserhisasnglylysserserphe

145150155160

tyrargasnleuleutrpleuthrglylysasnglyleutyrproasn

165170175

leuserlyssertyrvalasnasnlysglulysgluvalleuvalleu

180185190

trpglyvalhishisproproasnileglyaspglnargalaleutyr

195200205

histhrgluasnalatyrvalservalvalserserhistyrserarg

210215220

argphethrprogluilealalysargprolysvalargaspglnglu

225230235240

glyargileasntyrtyrtrpthrleuleugluproglyaspthrile

245250255

ilepheglualaasnglyasnleuilealaprotrptyralapheala

260265270

leuserargglypheglyserglyileilethrserasnalapromet

275280285

aspglucysaspalalyscysglnthrproglnglyalaileasnser

290295300

serleupropheglnasnvalhisprovalthrileglyglucyspro

305310315320

lystyrvalargseralalysleuargmetvalthrglyleuargasn

325330335

ileproserileglnserarg

340

<210>8

<211>328

<212>dna

<213>tetrahymenathermophila

<400>8

atgaacaagactctcatcttagctttagttggtgttttggctttaactgccaccaccttg60

gttgctttccacaaccactctcacaacatcagagttgactaagaccccgccactctcttc120

aagcaattcaagcaaacttacaataagaagtatgctgatcctactttcgaaacctacaga180

ttcggtgtcttcacccaaaacttagaaatcgtcaagactgactctactttcggtgtcacc240

taattcatggacttaactcctgctgaattcgctcaacaattcctcactttacacgaaaag300

gttaacagcaccgaagtttacagagctc328

<210>9

<211>113

<212>prt

<213>tetrahymenathermophila

<400>9

metasnlysthrleuileleualaleuvalvalvalleualaleuthr

151015

alathrthrleuvalalaphehisasnhisserhisasnileargval

202530

aspglnaspproalathrleuphelysglnphelysglnthrtyrasn

354045

lyslystyralaaspalathrphegluthrtyrargpheglyvalphe

505560

thrglnasnleugluilevallysthraspserthrpheglyvalthr

65707580

glnphemetaspleuthrproalagluphealaglnglnpheleuthr

859095

leuhisglulysvalasnserthrgluvaltyrargalaglnglyglu

100105110

ala

<210>10

<211>65

<212>dna

<213>influenzavirus

<400>10

ggcgcgccatggatatcaaagctaagttattagttttactttgtactttcactgctactt60

atgct65

<210>11

<211>17

<212>prt

<213>influenzavirus

<400>11

metlysalalysleuleuvalleuleucysthrphethralathrtyr

151015

ala

<210>12

<211>980

<212>dna

<213>tetrahymenathermophila

<400>12

agcatgctttttcatgtactattcctaactatagcttaatgctttatacatcaaagtatg60

aagaagacaggttttaaaaaaccaaaaaatatgttttttatttgaaaagtattatatagg120

aataataaatgctgcataaatactctaagtagttgataaaaaatctatttatgcaaagaa180

aaatttagaaaaatttagaaaaacaaagaaaataattgttattataaagcattttgttta240

ctaagcaaaagatataaaatttgagatagaaatatacatacaagattaacgttttgtttg300

tgctttgaaaattgaaatatttaattattaaatctgctaacttttttagatatttatttg360

ctttattttattttttaaatttttgcaaagtggagaaaaatgaaacaatcaatctttttt420

ttataaataatataaatggtattaagcctaatttttattgctggagagtgttattcaaat480

atattgctgaatgtggctagatggaattcgctttggaaggaaagtgtttataaaataagt540

gatgtattatagcacattgctaattattataaagaatgtattggatatttaaaaattaga600

aaataaaatttagctgaaaagtaagaaagcaagcaaagatatatatatatatatggagat660

gataaaaagataaattcgaaaaaagaaaatttctaaagtgaaaagaattatggatttgat720

taaataaaaatatttttagaatgggctgattaaagagggatcttcgagaatgaaatgatt780

tagaaaaaaagaaagaaagattataacatctacaaagagttgaagattctagaagaggag840

gaataattagctatcagtcttattaaaagatatcgcaaaacaagaaatatttttgaaatt900

aattaaaaaatttaaaaaacaaaagataaaaattttgcacaaaaaagcaattaattaaaa960

aaaaagatatatcataagaa980

<210>13

<211>998

<212>dna

<213>tetrahymenathermophila

<400>13

tcgaggataagtaatatatttagtgcacaatgtttgaatgtttttttgataaatttgtaa60

attaaatctatttaagtcagtagaattttagatattttcatagattttttaataagtaga120

caatttatttctaaaaaatatttaaaaataaaaaataataagggttttgaataactcctt180

taatttaaatacacatttttaaattttttttagctctttaaatattcataaaaataaaaa240

ataactaactaaaaataaataaaaagataataatgattaaaggtataatactgaataaga300

aaaaacataatagagtacttattttttatatcactatttttaatatcttgaaagcaaaac360

ttttttatatatcttaaaatatattgtatcgtttattcaattattttctttaaatttcaa420

atatattgataaaaaagatgacatgttttttaaagaaaacatgaaatataaaatagataa480

atatcaattattttatttattaaatatataagctgctcaaaacatagctcattcatcaat540

tataatatgtgaatcattaattttcaaaatattactcattatttaggctatcatttattt600

tttattttcaattatccgtttctattatattttaatattaagttgtgattcttgaatttt660

gtgtcatgaattatttgtaaatctttttatttctgataaaaaatataaattgattgactc720

atgatttaaatcatgagtcaacctaactaattttcaaaattcttctattctaaaatatag780

atgtgattcttgaatctctcttgaatataaagtaattttttatatttctgatataattct840

tagctacgtgattcacgatttatgcaatgatccatataaaataatgtaaatagtgtatat900

atatatattcgtcttttttattctttatataatttaaaaaaattaaaaaaatttaataaa960

gctctaataaaataaataataatactaaacttaaaata998

<210>14

<211>1722

<212>dna

<213>influenzavirus

<400>14

atgaaggcaataattgtactactcatggtagtaacatccaatgcagatcgaatctgcact60

ggaataacatcttcaaactcacctcatgtggtcaaaacagccactcaaggggaggtcaat120

gtgactggtgtgataccactaacaacaacaccaacaaaatcttattttgcaaatctcaaa180

ggaacaaggaccagagggaaactatgcccagactgtctcaactgcacagatctggatgtg240

gctttgggcagaccaatgtgtgtggggaccacaccttcggcgaaagcttcaatactccac300

gaagtcaaacctgttacatccgggtgctttcctataatgcacgacagaacaaaaatcagg360

caactacccaatcttctcagaggatatgaaaatatcaggctatcaacccaaaacgtcatc420

gatgcggaaaaggcaccaggaggaccctacagacttggaacctcaggatcttgccctaac480

gctaccagtaagagcggatttttcgcaacaatggcttgggctgtcccaaaggacaacaac540

aaaaatgcaacgaacccactaacagtagaagtaccatacatttgtacagaaggggaagac600

caaatcactgtttgggggttccattcagatgacaaaacccaaatgaagaacctctatgga660

gactcaaatcctcaaaagttcacctcatctgctaatggagtaaccacacactatgtttct720

cagattggcagcttcccagatcaaacagaagacggaggactaccacaaagcggcaggatt780

gttgttgattacatgatgcaaaaacctgggaaaacaggaacaattgtctaccaaagaggt840

gttttgttgcctcaaaaggtgtggtgcgcgagtggcaggagcaaagtaataaaagggtcc900

ttgcctttaattggtgaagcagattgccttcatgaaaaatacggtggattaaacaaaagc960

aagccttactacacaggagaacatgcaaaagccataggaaattgcccaatatgggtgaaa1020

acacctttgaagcttgccaatggaaccaaatatagacctcctgcaaaactattaaaggaa1080

aggggtttcttcggagctattgctggtttcctagaaggaggatgggaaggaatgattgca1140

ggctggcacggatacacatctcacggagcacatggagtggcagtggcggcggaccttaag1200

agtacgcaagaagctataaacaagataacaaaaaatctcaattctttgagtgagctagaa1260

gtaaagaatcttcaaagactaagtggtgccatggatgaactccacaacgaaatactcgag1320

ctggatgagaaagtggatgatctcagagctgacactataagctcgcaaatagaacttgca1380

gtcttgctttccaacgaaggaataataaacagtgaagatgagcatctattggcacttgag1440

agaaaactaaagaaaatgctgggtccctctgctgtagagataggaaatggatgcttcgaa1500

accaaacacaagtgcaaccagacctgcttagacaggatagctgctggcacctttaatgca1560

ggagaattttctctccccacttttgattcactgaacattactgctgcatctttaaatgat1620

gatggattggataaccatactatactgctctattactcaactgctgcttctagtttggct1680

gtaacattgatgctagctatttttattgtttatatggtctcc1722

<210>15

<211>574

<212>prt

<213>influenzavirus

<400>15

metlysalaileilevalleuleumetvalvalthrserasnalaasp

151015

argilecysthrglyilethrserserasnserprohisvalvallys

202530

thralathrglnglygluvalasnvalthrglyvalileproleuthr

354045

thrthrprothrlyssertyrphealaasnleulysglythrargthr

505560

argglylysleucysproaspcysleuasncysthraspleuaspval

65707580

alaleuglyargprometcysvalglythrthrproseralalysala

859095

serileleuhisgluvallysprovalthrserglycyspheproile

100105110

methisaspargthrlysileargglnleuproasnleuleuarggly

115120125

tyrgluasnileargleuserthrglnasnvalileaspalaglulys

130135140

alaproglyglyprotyrargleuglythrserglysercysproasn

145150155160

alathrserlysserglyphephealathrmetalatrpalavalpro

165170175

lysaspasnasnlysasnalathrasnproleuthrvalgluvalpro

180185190

tyrilecysthrgluglygluaspglnilethrvaltrpglyphehis

195200205

seraspasplysthrglnmetlysasnleutyrglyaspserasnpro

210215220

glnlysphethrserseralaasnglyvalthrthrhistyrvalser

225230235240

glnileglyserpheproaspglnthrgluaspglyglyleuprogln

245250255

serglyargilevalvalasptyrmetmetglnlysproglylysthr

260265270

glythrilevaltyrglnargglyvalleuleuproglnlysvaltrp

275280285

cysalaserglyargserlysvalilelysglyserleuproleuile

290295300

glyglualaaspcysleuhisglulystyrglyglyleuasnlysser

305310315320

lysprotyrtyrthrglygluhisalalysalaileglyasncyspro

325330335

iletrpvallysthrproleulysleualaasnglythrlystyrarg

340345350

proproalalysleuleulysgluargglyphepheglyalaileala

355360365

glypheleugluglyglytrpgluglymetilealaglytrphisgly

370375380

tyrthrserhisglyalahisglyvalalavalalaalaaspleulys

385390395400

serthrglnglualaileasnlysilethrlysasnleuasnserleu

405410415

sergluleugluvallysasnleuglnargleuserglyalametasp

420425430

gluleuhisasngluileleugluleuaspglulysvalaspaspleu

435440445

argalaaspthrileserserglnilegluleualavalleuleuser

450455460

asngluglyileileasnsergluaspgluhisleuleualaleuglu

465470475480

arglysleulyslysmetleuglyproseralavalgluileglyasn

485490495

glycysphegluthrlyshislyscysasnglnthrcysleuasparg

500505510

ilealaalaglythrpheasnalaglyglupheserleuprothrphe

515520525

aspserleuasnilethralaalaserleuasnaspaspglyleuasp

530535540

asnhisthrileleuleutyrtyrserthralaalaserserleuala

545550555560

valthrleumetleualailepheilevaltyrmetvalser

565570

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1