优化编码工程改造的流感蛋白的核苷酸序列的方法与流程

文档序号：14956547发布日期：2018-07-17 23:40阅读：577来源：国知局

本申请要求2015年6月9日提交的美国临时专利申请号62/172,949的权益，并依赖于其提交日，其整个公开内容通过引用结合到本文中。

序列表

本申请包含序列表，其已经以ascii格式电子提交和通过引用以其整体结合到本文中。所述ascii副本，创建于2016年6月9日，名称为0171.0008-pct_sl.txt，和大小为351,204字节。

背景

流感具有大流行、流行、再现和爆发的长的持续历史。疫苗已经是对流感最有效的防御。然而，年复一年设计和制造诱导毒株-特异性免疫的疫苗的工作已经是困难的，因为流感持续引起跨越全球的重大健康问题。认为年度流感流行在整个世界上每年产生3-5百万个严重疾病病例，和250,000-500,000例死亡。此外，当前上市的流感疫苗必须根据在即将来临的季节中在人群中将出现的预测毒株每年更新。

流感病毒是正粘病毒科的成员。流感病毒存在三个亚型，称为流感a、流感b和流感c。流感病毒体包含分段的反义rna基因组。在流感a病毒的情况下，rna基因组编码以下蛋白：血凝素(ha)、神经氨酸酶(na)、基质(ml)、质子离子通道蛋白(m2)、核蛋白(np)、聚合酶碱性蛋白1(pbl)、聚合酶碱性蛋白2(pb2)、聚合酶酸性蛋白(pa)和非结构蛋白2(ns2)。ha、na、ml和m2是膜相关蛋白，而np、pbl、pb2、pa和ns2是核衣壳相关蛋白。ml蛋白是在流感颗粒中最丰富的蛋白。ha和na蛋白是被膜糖蛋白，负责病毒附着和病毒颗粒侵入细胞。特别地，ha将流感病毒结合至在它们的膜的表面结构上包含唾液酸的细胞。

ha和na蛋白二者是对于病毒中和以及保护性免疫的主要免疫显性表位的来源，使得它们是预防性流感疫苗的重要组分。流感病毒的产生和回收是在功能性流感疫苗候选物的评价中的重要步骤。

负链rna病毒例如流感病毒的反求遗传学，已经允许遗传操纵病毒基因组以产生新的病毒，其可用作活的减毒疫苗或表达异源蛋白的载体。反求遗传学技术允许产生完全来自克隆的病毒cdna的传染性流感病毒(fodor等,1999jvirol,73(11):9679-9682)。

根据能够诱导表达8种vrna和转录所需的至少聚合酶蛋白复合物和核蛋白(np)的一组质粒，开发不同的系统。聚合酶蛋白复合物和np也可通过4种另外的质粒的转染或通过使用含允许vrna和mrna二者分别通过rna聚合酶i(pol1)和ii(pol2)合成的双向启动子的质粒(jackson等,2011,jgenvirol,92(pt1):1-17)表达。转染的质粒的总数量可从16(neuman等,1999,procnatlacadsciusa,96(16):9345-9350)或12(fodor等,1999,jvirol,73(11):9679-9682)至8(hoffmann等,2002,vaccine,20(25-26):3165-3170)而改变，取决于策略是单向或双向，和从3(neumann等,2005,procnatlacadsciusa,102(46):16825-16829)至1(zhang等,2009,jvirol,83(18):9296-9303)而变化，如果质粒编码数个vrna。

最广泛使用的流感疫苗包含已被化学或物理灭活的病毒，或已被减毒的活病毒。这样的疫苗的实例是裂解的流感灭活疫苗(iiv)或活的减毒疫苗(laiv)。制造这些疫苗通常需要在含胚鸡蛋中回收和繁殖疫苗病毒。然而，人流感的分离株在蛋中非常无效地生长，和分离的病毒经常需要通过一个过程进行适应，所述过程通常包括它们在蛋中的盲目传代和它们以高产量的实验室病毒的重配，以增加病毒/抗原产量。两种不同的技术可用于产生重配株流感病毒：经典重配和反求遗传学。流感a病毒的经典重配包括用疫苗病毒和高产量供体病毒(在大多数情况下为pr8)共-感染蛋。得到的重配株子代必须经过一个选择过程以鉴定具有合适的抗原组合和高产量生长表型的重配株病毒。该选择过程是麻烦的，不能保证将获得这样的重配株。与经典重配相反，反求遗传学得到具有预定义组合的基因或基因群的重配株病毒，不需要进一步选择。此外，反求遗传学可在缺少病毒分离株的情况下使用，和其是允许在疫苗病毒中引入靶基因修饰的唯一技术。事实上，反求遗传学在流感h5n1疫苗病毒的开发中已经是关键的，其中多-碱基切割位点必须从ha基因中除去。

简述

本发明的实施方案基于以下发现：包含天然不存在的工程改造的流感蛋白的流感疫苗病毒的产生，可仅通过反求遗传学实现。尽管大多数反求遗传学应用依赖于pcr或rt-pcr扩增来自预存在的病毒的模板，但dna合成的最新进展允许在天然病毒模板不存在的情况下生产病毒。wimmer等(2009)naturebiotech.27(12):1163-1172;wimmer等(2011)annu.rev.microbiol.65:583-609。在流感病毒的情况下，使用合成的dna和反求遗传学技术能够重建1918流感病毒(tumpey等(2005)science310:77-80.)和显示有希望加速响应于流感大流行的候选疫苗病毒的生产(dormitzer等(2013)scitrmed5(185):1-12;verity等(2011)influenzaj.101-109)。此外，候选疫苗病毒可包含经设计为比天然抗原更好的免疫原的合理工程改造的流感蛋白，例如公开于pct/us2016/035594、wo2013/122827和美国公开号2015/0044247、2015/0017196、2014/0147459、2014/0127248和2013/0183342和美国临时申请62/345,502或62/344,862的工程改造的流感蛋白，其全部通过引用结合到本文中。

使用反求遗传学和合成的dna技术以生产表达工程改造的蛋白的流感病毒的一个重要的限制是需要编码这样的工程改造的蛋白的核苷酸序列。类似地，不能回收或拯救表达工程改造的蛋白的传染性流感病毒，可能部分地归因于缺少用于有效病毒包装的最佳序列的核苷酸序列。流感结构蛋白(例如，ha和na)根据其特定的密码子使用，也可产生较高的病毒效价。增加的效价对于使病毒拯救的成功率最大化和在疫苗制造期间提高病毒产量，可能是重要的。

本发明特别提供了产生编码工程改造的流感结构蛋白的优化的核苷酸序列的方法。还提供了使用优化的核苷酸序列以生产传染性流感病毒的方法，例如在反求遗传学系统中。

在一些实施方案中，产生编码工程改造的流感结构蛋白的优化的核苷酸序列的方法包括：

a)提供工程改造的流感结构蛋白的氨基酸序列；

b)反向翻译氨基酸序列以产生第一核苷酸序列；

c)鉴定第二核苷酸序列，其编码与工程改造的流感结构蛋白共有高度的序列同一性的流感结构蛋白；

d)在第一和第二核苷酸序列中的密码子编码相同的氨基酸的每个位置处，改变第一核苷酸序列中的密码子以匹配来自第二核苷酸序列的密码子；和

e)在第一和第二核苷酸序列中的密码子编码不同的氨基酸的每个位置处，改变第一核苷酸序列中的密码子以匹配基于结构蛋白-特异性流感密码子使用偏好的密码子，从而产生优化的核苷酸序列。

在一些实施方案中，与工程改造的流感结构蛋白共有高度的序列同一性的流感结构蛋白是野生型流感结构蛋白。在一些实施方案中，流感结构蛋白与工程改造的流感结构蛋白共有最高度的序列同一性(即，最近匹配)。在一些实施方案中，第二核苷酸序列编码野生型形式的流感结构蛋白和从包含流感核苷酸序列的公开可得的数据库鉴定。

在一些实施方案中，工程改造的流感结构蛋白包含选自seqidno:4、seqidno:5、seqidno:6和seqidno:7、seqidno:8、seqidno:9、seqidno:10、seqidno:11、seqidno:12、seqidno:13、seqidno:14、seqidno:15、seqidno:16、seqidno:17、seqidno:18、seqidno:75、seqidno:76、seqidno:77、seqidno:78、seqidno:79、seqidno:80、seqidno:81、seqidno:82、seqidno:83、seqidno:84、seqidno:85、seqidno:86、seqidno:87、seqidno:88、seqidno:89、seqidno:90、seqidno:91、seqidno:92、seqidno:93、seqidno:94、seqidno:95、seqidno:96、seqidno:97、seqidno:98、seqidno:99、seqidno:100、seqidno:101和seqidno:102的氨基酸序列。

在一些实施方案中，所述方法进一步包括添加来自高效价拯救毒株(例如，a/puertorico/8/34;“pr8”)的5’和3’非编码序列至优化的核苷酸序列。在一些实施方案中，5’非编码序列包含seqidno:23的核苷酸序列和/或3’非编码序列包含seqidno:24的核苷酸序列，或其中5’非编码序列包含seqidno:103的核苷酸序列和/或3’非编码序列包含seqidno:104的核苷酸序列。

在一些实施方案中，所述方法进一步包括将在优化的核苷酸序列中编码信号肽的核苷酸序列交换为编码来自高效价拯救毒株(例如，pr8)的信号肽的核苷酸序列。在一些实施方案中，所述方法进一步包括将编码跨膜结构域的核苷酸序列交换为编码来自高效价拯救毒株(例如，pr8)的跨膜结构域的核苷酸序列。在一些实施方案中，所述方法进一步包括将编码胞质结构域的核苷酸序列交换为编码来自高效价拯救毒株(例如，pr8)的胞质结构域的核苷酸序列。

在一些实施方案中，由优化的核苷酸序列编码的工程改造的流感结构蛋白的氨基酸序列与由第一核苷酸序列编码的氨基酸序列相同。

在一些实施方案中，优化的核苷酸序列进一步包含编码信号肽的核苷酸序列、编码跨膜结构域的核苷酸序列和/或编码胞质结构域的核苷酸序列。

在一些实施方案中，工程改造的流感结构蛋白是流感a型血凝素蛋白。在一些实施方案中，血凝素蛋白是选自h1、h2、h3、h4、h5、h6、h7、h8、h9、h10、h11、h12、h13、h14、h15、h16和h17的亚型。

在一些实施方案中，结构蛋白-特异性流感密码子使用偏好描述于表1-10。

在一些实施方案中，反向翻译氨基酸序列以产生第一核苷酸序列包括使用对流感病毒特异性的密码子使用表。

还提供了表达通过本文描述的方法产生的优化的核苷酸序列的方法，所述方法包括：

将优化的核苷酸序列插入表达质粒；和

表达优化的核苷酸序列以产生工程改造的流感结构蛋白。

还提供了用于生产传染性流感病毒的反求遗传学方法，所述方法包括：

用一种或多种表达载体转染哺乳动物细胞，其中所述一种或多种表达载体包含通过本文描述的方法产生的编码工程改造的流感结构蛋白的优化的核苷酸序列和b)编码来自一种或多种供体病毒的流感蛋白的核苷酸序列；

生产传染性流感病毒。

在一些实施方案中，所述一种或多种供体病毒选自a/puertorico/8/34(h1n1)(pr8)、b/lee/40和b/panama/45/90。

在一些实施方案中，传染性流感病毒是传染性重配株流感病毒，其包含一种或多种供体病毒的遗传物质。在一些实施方案中，传染性重配株流感病毒是嵌合的。

在一些实施方案中，所述方法进一步包括：

收获传染性流感病毒；和

用收获的流感病毒感染蛋或哺乳动物细胞。

还提供了制备流感疫苗组合物的方法，所述方法包括：

通过用一组表达载体转染哺乳动物细胞产生种子病毒，所述表达载体中的一种或多种包含通过本文描述的方法产生的编码工程改造的流感结构蛋白的优化的核苷酸序列；

收获种子病毒；和

通过用种子病毒感染蛋或哺乳动物细胞生产传染性流感病毒；

在蛋或哺乳动物细胞中繁殖后收获传染性流感病毒；

纯化收获的传染性流感病毒；

任选地灭活纯化的病毒；和

混合纯化的病毒与药学上可接受的载体。

还提供了在受试者中诱导对一种或多种流感多肽的免疫反应的方法，所述方法包括给予本文所述的流感疫苗组合物。

还提供了编码工程改造的流感结构蛋白的优化的核苷酸序列，其中优化的核苷酸序列通过本文所述的方法获得。根据以下参考附图进行的详细描述，本发明的前述和其它目标、特征和优点将变得更加显而易见。

附图简述

本文包括的附图，其包含以下各图，仅为举例说明的目的，而非限制。

图1显示了根据本发明的某些实施方案，产生编码工程改造的流感蛋白的优化核苷酸序列的方法流程图(以出现的顺序，分别为seqidnos33-37)。

图2显示了数种流感a亚型h1n1毒株的ha蛋白序列的带注释的比对(以出现的顺序，分别为seqidnos38-42)。图2中例举的毒株的ha蛋白的全长序列提供在序列表中，如下：a/texas/36/1991(seqidno:65);a/new_caledonia/20/1999(seqidno:66);a/solomon_islands/3/2006(seqidno:67);a/brisbane/59/2007(seqidno:68);和a/california/07/2009(seqidno:69)。

图3显示了数种流感a亚型h3n2毒株的ha蛋白序列的带注释的比对(以出现的顺序，分别为seqidnos43-47)。图3中例举的毒株的ha蛋白的全长序列提供在序列表中，如下：a/wisconsin/67/2005(seqidno:70);a/victoria/361/2011(seqidno:71);a/texas/50/2012(seqidno:72);a/perth/16/2009(seqidno:73);和a/hong_kong/1/1968(seqidno:74)。

图4显示了a型流感血凝素的14个亚型和另外的亚型h3序列的代表的跨膜区(氨基酸残基183-212)的比对的氨基酸序列(以出现的顺序，分别为seqidnos48-57和57-64)。使用常用的单字母氨基酸代码。引入虚线以使序列比对最大化。粗体的字母是指在所有不同的亚型的50%或更多的序列中保守的残基，包括几个保守置换，如正文中所述。残基使用x:31ha2编号系统进行编号。

定义

为了更加容易地理解本发明，下文首先定义了某些术语。对于以下术语和其它术语的另外的定义在说明书全文中阐述。

佐剂：如本文所用的，术语“佐剂”是指非特异性地提高对抗原的免疫反应的物质或媒介。佐剂可包括其上吸附抗原的矿物(明矾、铝盐、氢氧化铝或磷酸盐)的悬浮液；或油包水乳液，其中抗原溶液在矿物油中乳化(例如，弗氏不完全佐剂)，有时其中包括杀死的分支杆菌(弗氏完全佐剂)以进一步提高抗原性。免疫刺激性寡核苷酸(例如包括cpg基序的那些)也可用作佐剂(例如，参见美国专利号6,194,388;6,207,646;6,214,806;6,218,371;6,239,116;6,339,068;6,406,705;和6,429,199)。佐剂还包括生物学分子，例如脂质和共刺激分子。实例性的生物学佐剂包括as04(didierlaurent,a.m.等,j.immunol.,2009,183:6186-6197)、il-2、rantes、gm-csf、tnf-α、ifn-γ、g-csf、lfa-3、cd72、b7-1、b7-2、ox-40l和41bbl。

给予：如本文所用的，“给予”受试者组合物意指给予、施用或使组合物接触受试者。给予可通过许多途径的任一种实现，例如局部、口服、皮下、肌内、腹膜内、静脉内、鞘内和皮内。

抗体：如本文所用的，术语“抗体”是指包括足以赋予与特定的靶抗原的特异性结合的标准免疫球蛋白序列元件的多肽。在一些实施方案中，如本文所用的，术语“抗体”还指一种或多种“抗体片段”，其包括完整抗体的一部分，例如抗体的抗原结合区或可变区。“抗体片段”的实例包括fab、fab’、f(ab’)2和fv片段；三抗体；四抗体；线性抗体；单链抗体分子；和在从抗体片段形成的多特异性抗体中包括的包含cdr的部分。本领域技术人员将认识到，术语“抗体片段”不意指和不限于任何具体的产生方式。抗体片段可通过使用任何合适的方法生产，包括但不限于切割完整抗体、化学合成、重组生产等。如本领域已知的，天然产生的完整抗体为大约150kd四聚体试剂，其包含两个相同的重链多肽(各自约50kd)和两个相同的轻链多肽(各自约25kd)，它们彼此缔合成通常所谓的“y-形”结构。每个重链包含至少四个结构域(各自约110个氨基酸长)–氨基端可变(vh)结构域(位于y结构的尖端)，接着三个恒定结构域：ch1、ch2和羧基端ch3(位于y茎的基部)。短区域，称为“开关”，连接重链可变区和恒定区。“铰链”连接ch2和ch3结构域与抗体的剩余部分。该铰链区中的两个二硫键将完整抗体中的两个重链多肽彼此连接。每个轻链包含两个结构域–氨基端可变(vl)结构域，接着羧基端恒定(cl)结构域，彼此通过另一个“开关”隔开。完整抗体四聚体包含两个重链-轻链二聚体，其中重链和轻链通过单个二硫键彼此连接；两个另外的二硫键将重链铰链区彼此连接，使得二聚体彼此连接和形成四聚体。天然产生的抗体还被糖基化，通常在ch2结构域上。天然抗体的每个结构域具有特征为呈扁平的反向平行β桶的“免疫球蛋白折叠”的结构，其自彼此相对组装的两个β折叠片(例如，3-、4-或5-链折叠片)形成。每个可变结构域包含三个超变环，称为“互补决定区”(cdr1、cdr2和cdr3)和四个稍微不变的“框架”区(fr1、fr2、fr3和fr4)。当天然抗体折叠时，fr区形成β片，其提供结构域的结构框架，和来自重链和轻链二者的cdr环区在三维空间中位于一起，使得它们产生位于y结构尖端的单个超变抗原结合位点。在抗体多肽链中的氨基酸序列比较定义了两个轻链(κ和λ)类型、数个重链(例如，μ,γ,α,ε,δ)类型和某些重链亚类(α1,α2,γ1,γ2,γ3,和γ4)。抗体类型(iga[包括iga1,iga2],igd,ige,igg[包括igg1,igg2,igg3,igg4],igm)根据所用的重链序列的类型来定义。为本发明的目的，在某些实施方案中，包括足够的天然抗体中存在的免疫球蛋白结构域序列的任何多肽或多肽复合物可被称为和/或用作“抗体”，无论这样的多肽是天然生产的(例如，通过生物体与抗原反应产生)，还是通过重组改造、化学合成或其它人造系统或方法生产的。在一些实施方案中，抗体是单克隆的；在一些实施方案中，抗体是多克隆的。在一些实施方案中，抗体具有小鼠、兔、灵长类或人抗体特有的恒定区序列。在一些实施方案中，抗体序列元件是人源化的、灵长类化的、嵌合的等，如本领域已知的。此外，将理解本文所用的术语“抗体”包括(除非另外指明或从上下文清楚)可以在合适的实施方案中指用于以可选方式呈现捕获抗体结构和功能特征的任何本领域已知的或开发的构建体或形式。例如，在一些实施方案中，该术语可指双特异性或其它多特异性(例如，zybodies等)抗体、smallmodularimmunopharmaceuticals(“smips™”)、单链抗体、骆驼抗体和/或抗体片段。在一些实施方案中，抗体可缺少天然生产时将具有的共价修饰(例如，连接聚糖)。在一些实施方案中，抗体可包含共价修饰(例如，连接聚糖、有效负载[例如，可检测部分、治疗部分、催化部分等]或其它附属基团[例如，聚乙二醇等])。

抗原：如本文所用的，术语“抗原”是指引起免疫反应的试剂；和/或(ii)当暴露于或给予生物体时，被t细胞受体结合(例如，通过mhc分子呈递时)或结合至抗体(例如，通过b细胞产生)的试剂。在一些实施方案中，抗原在生物体中引起体液应答(例如，包括产生抗原特异性抗体)；或者，或另外，在一些实施方案中，抗原在生物体中引起细胞应答(例如，包括t-细胞，其受体与抗原特异性相互作用)。本领域技术人员将理解，具体的抗原可在目标生物(例如，小鼠、兔、灵长类、人)的一个或数个成员中引起免疫反应，但不在目标生物物种的所有成员中如此。在一些实施方案中，抗原在目标生物物种的至少约25%,30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%的成员中引起免疫反应。在一些实施方案中，抗原结合抗体和/或t细胞受体，和在生物体中可能诱导或可能不诱导特定的生理学反应。在一些实施方案中，例如，抗原可体外结合抗体和/或t细胞受体，无论这样的相互作用是否体内发生。在一些实施方案中，抗原与特异性体液或细胞免疫的产物(包括通过异源免疫原诱导的那些)反应。在所公开的组合物和方法的一些实施方案中，流感hah5n1蛋白是抗原。

大约：如本文所用的，术语“大约”或“约”，在应用于一个或多个目标值时，是指类似于陈述的参考值的值。在某些实施方案中，术语“大约”或“约”是指在任一方向(大于或小于)上落入陈述的参考值的25%,20%,19%,18%,17%,16%,15%,14%,13%,12%,11%,10%,9%,8%,7%,6%,5%,4%,3%,2%,1%或更少内的值的范围，除非另外指明或从上下文另外显而易见(除了这样的数值会超过可能值的100%之外)。

结合：将理解，如本文所用的术语“结合”通常是指在两个或更多个实体之间的非共价缔合。“直接”结合包括在实体或部分之间物理接触；间接结合包括通过与一个或多个中间实体物理接触的物理相互作用。在两个或更多个实体之间的结合可在各种情况的任一种下评价，包括分离的情况下或在更复杂的系统的情况下(例如，共价或以其它方式与载体实体缔合，和/或在生物系统或细胞中)研究相互作用实体或部分。

广泛反应性：如本文所用的，“广泛反应性”是指蛋白序列在受试者中引起免疫反应，其足以抑制、中和或预防各种流感病毒(例如在特定亚型，例如，h1n1,h5n1,h3n2内的大多数或所有流感病毒)的感染。

载体：如本文所用的，术语“载体”是指组合物与其一起给予的稀释剂、佐剂、赋形剂或媒介。在一些实例性的实施方案中，载体可包括无菌液体，例如水和油，包括石油、动物、植物或合成来源的油，例如花生油、大豆油、矿物油、芝麻油等。在一些实施方案中，载体是或包括一个或多个固体组分。

cobra：如本文所用的，“cobra”是指计算优化的广泛反应性抗原，如描述于wo2013/122827和美国公开号2015/0044247,2015/0017196,2014/0147459,2014/0127248和2013/0183342，其全部通过引用以其整体结合到本文中。cobra是工程改造的ha蛋白，其引起对流感病毒的广泛反应性免疫反应。cobra的氨基酸序列根据选择的流感分离株，通过一系列ha蛋白比对和随后产生共有序列设计，和这些ha氨基酸序列不存在于天然流感毒株中。

密码子-优化的：如本文所用的，“密码子-优化的”核酸序列是指已被改变使得核酸序列的翻译和得到的蛋白的表达对于特定的表达系统得到改进或优化的核酸序列。“密码子-优化的”核酸序列优选编码与“密码子-优化的”核酸序列所基于的未-优化的母体序列相同的蛋白。例如，核酸序列可以对于在哺乳动物细胞(例如，cho细胞、人细胞、小鼠细胞等)、细菌细胞(例如，大肠杆菌)、昆虫细胞、酵母细胞或植物细胞中表达是“密码子-优化的”。核酸也可以经密码子-优化以允许或提高在反求遗传学系统中传染性流感病毒的表达。

可比较的：术语“可比较的”，如本文所用，是指两种或更多种试剂、实体、情况、条件设置等，其可能彼此不相同，但足够类似以允许之间比较，以致根据观察到的差异或类似性可合理地得出结论。本领域普通技术人员在上下文中将理解，在任何给定的环境下对于被视为可比较的两种或更多种这样的试剂、实体、情况、条件设置等需要的相同程度。

测定：本文描述的许多方法包括“测定”的步骤。本领域普通技术人员在阅读本说明书时将理解，这样的“测定”可利用本领域技术人员可获得的各种技术的任一种，包括例如本文明确提及的特定技术。在一些实施方案中，测定包括操作物理样品。在一些实施方案中，测定包括考虑和/或处理数据或信息，例如利用计算机或适合进行相关分析的其它处理装置。在一些实施方案中，测定包括从来源接收相关信息和/或材料。在一些实施方案中，测定包括比较样品或实体的一个或多个特征与可比较的参比。

工程改造的:如本文所用的术语“工程改造的”描述了这样的多肽，其氨基酸序列通过人为设计和/或其存在和生产需要人工的活动。例如，工程改造的ha多肽具有不同于天然流感分离株中存在的ha多肽的氨基酸序列的氨基酸序列。在一些实施方案中，工程改造的ha多肽具有不同于ncbi数据库中包括的ha多肽的氨基酸序列的氨基酸序列。

表位:如本文所用的，术语“表位”包括免疫球蛋白(例如，抗体或受体)结合组分整体或部分地特异性识别的任何部分。在一些实施方案中，表位包含抗原上的多个化学原子或基团。在一些实施方案中，当抗原呈现相关的三维构象时，这样的化学原子或基团是表面暴露的。在一些实施方案中，当抗原呈现这样的构象时，这样的化学原子或基团物理上彼此空间接近。在一些实施方案中，当抗原呈现可选构象(例如，线性化)时，至少一些这样的化学原子或基团是物理上彼此分开的。

赋形剂:如本文所用的，术语“赋形剂”是指可包括在药物组合物中例如以提供或促进所需一致性或稳定效果的非治疗剂。合适的药物赋形剂包括例如，淀粉、葡萄糖、乳糖、蔗糖、明胶、麦芽、稻米、面粉、白垩、硅胶、硬质酸钠、甘油单硬脂酸酯、滑石粉、氯化钠、脱脂奶粉、甘油、丙二醇、水、乙醇等。

表达:术语“表达”当本文提及核酸使用时是指一个或多个以下事件：(1)产生dna模板的rna转录物(例如，通过转录)；(2)加工rna转录物(例如，通过剪接、编辑、5’帽形成和/或3’端形成)；(3)翻译rna为多肽；和/或(4)翻译后修饰多肽。

融合蛋白:如本文所用的，术语“融合蛋白”是指由自编码两种不同的(例如，异源)蛋白的至少一部分的核酸序列工程改造的核酸序列编码的蛋白。技术人员毫无疑问地知道，为了产生融合蛋白，核酸序经连接，使得得到的读出不包含内部终止密码子。在一些实施方案中，本文所述的融合蛋白包括流感ha多肽或其片段。

血凝素(ha)多肽：如本文所用的，术语“血凝素多肽”(或“ha多肽’)是指氨基酸序列包括ha的至少一个特征性序列的多肽。来自流感分离株的各种ha序列是本领域已知的；事实上，国家生物技术信息中心(ncbi)维护了数据库(通过网站ncbi.nlm.nih.gov/genomes/flu/获得)，其在提交本申请时包括至少9796个ha序列。本领域普通技术人员，参考该数据库，可容易地鉴定ha多肽一般特有的序列，和/或具体ha多肽(例如，h1,h2,h3,h4,h5,h6,h7,h8,h9,h10,h11,h12,h13,h14,h15,h16或h17多肽；或介导特定宿主例如，禽、骆驼、犬、猫、灵猫、环境、马、人、豹、貂、小鼠、海豹、stonemartin、猪、虎、鲸等的感染的ha)特有的序列。例如，在一些实施方案中，ha多肽包括流感病毒的天然分离株中存在的ha蛋白的约残基97和约185、约324和约340、约96和约100和/或约130和约230之间存在的一个或多个特征性序列元件。

h1n1ha多肽：“h1n1ha多肽”，在本文中使用时，是指氨基酸序列包括h1n1特有并区分h1n1与其它ha亚型的至少一个序列元件的ha多肽。代表性的序列元件可通过比对确定，如本领域技术人员将理解的。

h5n1ha多肽：“h5n1ha多肽”，在本文中使用时，是指氨基酸序列包括h5n1特有并区分h5n1与其它ha亚型的至少一个序列元件的ha多肽。代表性的序列元件可通过比对确定，如本领域技术人员将理解的。

高效价拯救毒株：“高效价拯救毒株”是指可使用反求遗传学方法以高效价(至少1x10⁶pfu/ml)生产的任何流感毒株。高效价拯救毒株是本领域已知的，和包括但不限于a/puertorico/8/34(pr8)。

宿主：术语“宿主”本文用于指其中存在目的多肽的系统(例如，细胞、生物体等)。在一些实施方案中，宿主是对用特定的传染剂感染易感的系统。在一些实施方案中，宿主是表达特定的目的多肽的系统。

宿主细胞：如本文所用的，词语“宿主细胞”是指外源dna(重组或其它方式)所引入的细胞。例如，宿主细胞可用于通过标准重组技术生产本文描述的优化的流感血凝素多肽。技术人员在阅读本公开内容时将理解，这样的术语不仅是指具体的主题细胞，而且指这样的细胞的子代。因为在随后产生中由于突变或环境影响，某些修饰可存在，这样的子代实际上可能与亲本细胞不相同，但仍包括在本文使用的术语"宿主细胞"的范围内。在一些实施方案中，宿主细胞包括合适于表达外源dna(例如，重组核酸序列)的任何原核和真核细胞。实例性的细胞包括原核细胞和真核细胞(单细胞或多细胞)、细菌细胞(例如，大肠杆菌、芽胞杆菌、链霉菌等的菌株)、分枝杆菌细胞、真菌细胞、酵母细胞(例如，酿酒酵母、稷酒酵母、巴斯德毕赤酵母、产甲醇毕赤酵母等)、植物细胞、昆虫细胞(例如，sf-9、sf-21、杆状病毒感染的昆虫细胞、粉纹夜蛾等)、非-人动物细胞、人细胞或融合细胞例如杂交瘤或四源杂交瘤的那些。在一些实施方案中，细胞是人、猴、猿、仓鼠、大鼠或小鼠细胞。在一些实施方案中，细胞是真核的，和选自以下细胞：cho(例如，chok1,dxb-11cho,veggie-cho)、cos(例如，cos-7)、视网膜细胞、vero、cv1、肾(例如，hek293,293ebna,msr293,mdck,hak,bhk)、hela、hepg2、wi38、mrc5、colo205、hb8065、hl-60(例如，bhk21)、jurkat、daudi、a431(上皮)、cv-1、u937、3t3、l细胞、c127细胞、sp2/0、ns-0、mmt060562、sertoli细胞、brl3a细胞、ht1080细胞、骨髓瘤细胞、肿瘤细胞和源自前述细胞的细胞系。在一些实施方案中，细胞包含一个或多个病毒基因，例如，表达病毒基因的视网膜细胞(例如，per.c6™细胞)。

免疫反应：如本文所用的，术语“免疫反应”是指免疫系统的细胞，例如b细胞、t细胞、树突细胞、巨噬细胞或多形核细胞对刺激物例如抗原或疫苗的反应。免疫反应可包括参与宿主防御反应的任何身体细胞，包括例如分泌干扰素或细胞因子的上皮细胞。免疫反应包括但不限于先天性和/或适应性免疫反应。如本文所用的，保护性免疫反应是指保护受试者免于感染(防止感染或防止发生与感染有关的疾病)的免疫反应。测量免疫反应的方法是本领域已知的，和包括例如，测量淋巴细胞(例如b或t细胞；例如通过血细胞凝集抑制测定)的增殖和/或活性、细胞因子或趋化因子的分泌、炎症、抗体生产等。

免疫原：如本文所用的，术语“免疫原”是指在合适的条件下能够刺激免疫反应，例如在动物中产生抗体或t细胞反应的化合物、组合物或物质，包括注射至动物或被动物吸收的组合物。如本文所用的，“免疫原性组合物”是可给予的组合物，其包含免疫原(例如ha多肽)。“免疫原性组合物”包括例如，疫苗。如本文所用的，“免疫”意指使受试者受到保护免于传染性疾病，例如通过接种。

传染性流感病毒：所谓“传染性流感病毒”是指能够复制进入可容许的细胞的流感病毒。确定病毒是否具有传染性的方法是本领域技术人员众所周知的。例如，确定病毒是否具有传染性可使用tcid50测定法进行。tcid5o是通过在可容许的细胞(例如mdck或vero细胞)上引入递增稀释度的样品和使用spearman-karber统计学方法确定诱导50%的可容许细胞的感染的终点稀释度，评价传染性病毒在样品(例如，感染的细胞培养上清液或感染的尿囊液)中的量的方法。

体外：如本文所用的，术语“体外”是指在人工环境中，例如在试管或反应容器中、在细胞培养物中等，而不是在多细胞生物体内发生的事件。

体内：如本文所用的，术语“体内”是指在多细胞生物体内，例如在人和非-人动物中发生的事件。在基于细胞的系统的情况下，该术语可用于指在活细胞内发生的事件(与例如体外系统相反)。

流感病毒蛋白："流感病毒蛋白"，如本文所用的，表示对于a型流感的pb1、pb2、pa、ha、np、na、m1、m2、ns1和ns2/nep蛋白，对于b型流感的pb1、pb2、pa、ha、np、na、nb、m1、bm2、ns1和ns2/nep蛋白，或对于c型流感的pb1、pb2、pa、hef、np、m1、m1\cm2、ns1和ns2/nep。

流感结构蛋白：如本文所用的，术语“流感结构蛋白”是指与流感核衣壳、基质和被膜有关的任何蛋白，包括表面糖蛋白、血凝素(ha)和神经氨酸酶(na)，和基质(ml)蛋白和质子离子通道蛋白(m2)，和其功能或抗原片段。相反地，流感病毒的非-结构蛋白包括形成核糖核蛋白复合物所需要的流感病毒蛋白。"形成核糖核蛋白复合物所需要的流感病毒蛋白"是指对于a、b或c型流感病毒的蛋白pa、pb1、pb2和np。非-结构蛋白还包括ns1和ns2。

流感疫苗：如本文所用的，术语“流感疫苗”是指能够刺激免疫反应的免疫原性组合物，其经给予用于预防、阻止、改善或治疗流感病毒感染。流感疫苗可包括例如，减毒或杀灭流感病毒、其亚单位制剂(即，裂解-灭活的疫苗)、病毒-样颗粒(vlp)和/或抗原多肽(例如，本文所述的计算优化的血凝素)或源自它们的dna，或这样的免疫原性材料的任何重组形式。本文所述的流感疫苗可任选地包含一种或多种佐剂。

分离的：如本文所用的，术语“分离的”是指以下的物质和/或实体：(1)已与当初始产生(无论是天然和/或实验环境下)时其伴随的至少一些组分分离，和/或(2)通过人工设计、产生、制备和/或制造。分离的物质和/或实体可与它们初始伴随的约10%,约20%,约30%,约40%,约50%,约60%,约70%,约80%,约90%,约91%,约92%,约93%,约94%,约95%,约96%,约97%,约98%,约99%或超过约99%的其它组分分离。在一些实施方案中，分离的试剂是约80%,约85%,约90%,约91%,约92%,约93%,约94%,约95%,约96%,约97%,约98%,约99%或超过约99%纯的。如本文所用的，如果物质基本上不含其它组分，则是“纯的”。在一些实施方案中，如本领域技术人员将理解的，物质在已与某些其它组分，例如一种或多种载体或赋形剂(例如，缓冲液、溶剂、水等)组合后，可仍被视为“分离的”或甚至“纯的”；在这样的实施方案中，在不包括这样的载体或赋形剂的情况下计算物质的百分比分离或纯度。仅给出一个实例，在一些实施方案中，天然存在的生物聚合物例如多肽或多核苷酸被视为是“分离的”，当a)根据其起源或来源，与在自然中在天然状态下伴随其的一些或所有组分不关联；b)基本上不含与在自然中产生其的物种相同的物种的其它多肽或核酸；c)通过不属于在自然中产生其的物种的细胞或其它表达系统表达，或以其它方式与来自不属于在自然中产生其的物种的细胞或其它表达系统的组分关联。因此，例如，在一些实施方案中，化学合成的或在不同于自然中产生其的细胞系统的细胞系统中合成的多肽被视为"分离的"多肽。备选地或另外地，在一些实施方案中，在已与a)天然与其关联；和/或b)当初始产生时与其关联的其它组分分离的方面来说，已经受一种或多种纯化技术的多肽可被视为“分离的”多肽。

核酸：如本文所用的，词语“核酸”在其最广泛的意义上是指被掺入或可被掺入寡核苷酸链的任何化合物和/或物质。在一些实施方案中，核酸是通过磷酸二酯键被掺入或可被掺入寡核苷酸链的化合物和/或物质。从上下文清楚的是，在一些实施方案中，“核酸”是指单个核酸残基(例如，核苷酸和/或核苷)；在一些实施方案中，“核酸”是指包含单个核酸残基的寡核苷酸链。在一些实施方案中，“核酸”是或包含rna；在一些实施方案中，“核酸”是或包含dna。在一些实施方案中，核酸是一个或多个天然核酸残基，包含一个或多个天然核酸残基或由其组成。在一些实施方案中，核酸是一个或多个核酸类似物，包含一个或多个核酸类似物或由其组成。在一些实施方案中，核酸类似物不同于核酸之处在于其不利用磷酸二酯骨架。例如，在一些实施方案中，核酸是一个或多个“肽核酸”，包含一个或多个“肽核酸”或由其组成，所述“肽核酸”是本领域已知的，和在骨架中具有肽键而非磷酸二酯键，被认为在本发明的范围内。备选地或另外，在一些实施方案中，核酸具有一个或多个硫代磷酸酯和/或5’-n-亚氨基磷酸酯键，而非磷酸二酯键。在一些实施方案中，核酸是一个或多个天然核苷(例如，腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷)，包含一个或多个天然核苷或由其组成。在一些实施方案中，核酸是一个或多个核苷类似物(例如，2-氨基腺苷、2-硫代胸苷、肌苷、吡咯并-嘧啶、3-甲基腺苷、5-甲基胞苷、c-5丙炔基-胞苷、c-5丙炔基-尿苷、2-氨基腺苷、c5-溴尿苷、c5-氟尿苷、c5-碘尿苷、c5-丙炔基-尿苷、c5-丙炔基-胞苷、c5-甲基胞苷、2-氨基腺苷、7-脱氮腺苷、7-脱氮鸟苷、8-氧代腺苷、8-氧代鸟苷、o(6)-甲基鸟嘌呤、2-硫代胞苷、甲基化碱基、嵌入碱基和其组合)，包含一个或多个核苷类似物或由其组成。在一些实施方案中，与天然核酸中的那些相比，核酸包含一个或多个修饰的糖(例如，2’-氟核糖、核糖、2’-脱氧核糖、阿拉伯糖和己糖)。在一些实施方案中，核酸具有编码功能性基因产物例如rna或蛋白的核苷酸序列。在一些实施方案中，核酸包括一个或多个内含子。在一些实施方案中，核酸通过自天然来源分离、根据互补模板(体内或体外)通过聚合的酶促合成、在重组细胞或系统中复制和化学合成中的一种或多种制备。在一些实施方案中，核酸长度是至少3,4,5,6,7,8,9,10,15,20,25,30,35,40,45,50,55,60,65,70,75,80,85,90,95,100,110,120,130,140,150,160,170,180,190,20,225,250,275,300,325,350,375,400,425,450,475,500,600,700,800,900,1000,1500,2000,2500,3000,3500,4000,4500,5000或更多个残基。在一些实施方案中，核酸是单链的；在一些实施方案中，核酸是双链的。在一些实施方案中，核酸具有包含编码多肽或与编码多肽的序列互补的至少一个元件的核苷酸序列。在一些实施方案中，核酸具有酶促活性。

可操作连接：如本文所用的，词语“可操作连接”是指其中描述的组分处于允许它们以它们预期的方式发挥功能的关系中的并置。控制序列"可操作连接"至编码序列，以这样的方式连接，使得编码序列的表达在与控制序列相容的条件下实现。"可操作连接"的序列包括与目的基因邻近的表达控制序列和反向或隔开一段距离起作用以控制目的基因的表达控制序列二者。如本文所用的术语"表达控制序列"是指实现它们所连接的编码序列的表达和加工所必需的多核苷酸序列。表达控制序列包括合适的转录起始、终止、启动子和增强子序列；有效的rna加工信号，例如剪接和多腺苷酸化信号；稳定细胞质mrna的序列；增强翻译效率的序列(即，kozak共有序列)；增强蛋白稳定性的序列；和需要时，增强蛋白分泌的序列。这样的控制序列的性质根据宿主生物体而不同。例如，在原核生物中，这样的控制序列通常包括启动子、核糖体结合位点和转录终止序列，而在真核生物中，通常这样的控制序列包括启动子和转录终止序列。术语"控制序列"意欲包括其存在是表达和加工所必需的组分，和也可包括其存在是有利的另外组分，例如前导序列和融合配偶体序列。

爆发：如本文所用的，流感病毒“爆发”是指在给定年份来自单一国家内的病毒分离株的合集。

大流行毒株：“大流行”流感毒株是已经引起或由能力引起人群的大流行感染的流感毒株。在一些实施方案中，大流行毒株已引起大流行感染。在一些实施方案中，这样的大流行感染包括跨越多个地域的流行感染；在一些实施方案中，大流行感染包括跨越彼此分开(例如，通过山脉、水体、作为不同大陆的一部分等)使得感染通常不在它们之间通过的地域的感染。

可容许的细胞：所谓的“可容许的细胞”是指允许流感病毒侵入所述细胞和实现其完全复制周期直至新的传染性病毒产生的细胞。高度可容许的细胞是流感病毒主动复制和生产大量的传染性病毒的细胞。

药学上可接受的媒介：如本文所用的，术语“药学上可接受的载体”是指任何溶剂、分散介质、填料等，通常用于药物和疫苗制剂以提高活性剂的稳定性、无菌性和可递送性，其在人中不产生任何副反应，例如过敏反应。赋形剂根据选择的药物形式、给药方法和途径进行选择。合适的赋形剂和与药物制剂有关的要求描述于remington'spharmaceuticalsciences(19thedition,a.r.gennaro,ed.,mackpublishingco.,easton,pa(1995))，其代表了本领域的参考著作。药学上可接受的赋形剂的实例是水、磷酸盐缓冲盐水溶液、0.3%甘氨酸溶液。

多肽：一般而言，“多肽”是一串通过肽键彼此连接的至少两个氨基酸。在一些实施方案中，多肽可包括至少3-5个氨基酸，其各自通过至少一个肽键彼此连接。本领域普通技术人员将理解，任选地，多肽有时包括“非天然”的氨基酸或其它实体，其仍能够整合至多肽链中。在一些实施方案中，术语“多肽”用于指特定功能类型的多肽，例如ha多肽等。在一些实施方案中，有用的多肽可包含亲本多肽的片段(例如，表位)或由其组成。在一些实施方案中，有用的多肽可包含多个(例如，两个、三个、四个等)片段(例如表位)或由其组成，其每一个相对于彼此以与目的多肽中存在的不同的空间排列存在于相同的亲本多肽中(例如，在亲本多肽中直接连接的片段可在目的多肽中在空间上分开，或反之亦然；和/或片段可以与亲本多肽不同的顺序存在于目的多肽中)，使得目的多肽是其亲本多肽的衍生物。或者，在一些实施方案中，有用的多肽可包含多个(例如，两个、三个、四个等)片段(例如表位)或由其组成，其每一个存在于与目的多肽不同的亲本多肽中(例如，源于不同的亲本多肽的片段，和/或片段可以与亲本多肽不同的顺序存在于目的多肽中)，使得目的多肽是其亲本多肽的衍生物。

预防：术语“预防”，如本文所用的，是指预防、避免疾病表现、延迟发作和/或降低特定疾病、病症或病况(例如，感染，例如流感病毒感染)的一个或多个症状的频率和/或严重性。在一些实施方案中，预防基于群体进行评价，以致如果在对疾病、病症或病况易感的群体中在疾病、病症或病况的一个或多个症状的发生、频率和/或强度方面观察到统计学显著降低，则试剂被认为“预防”特定疾病、病症或病况。

纯的：如本文所用的，如果试剂或实体基本上不含其它组分，则其是“纯的”。例如，包含超过约90%的特定试剂或实体的制剂通常被认为是纯的制剂。在一些实施方案中，试剂或实体是至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%纯的。

重配株病毒：术语“重配株病毒”表示包含来自于至少两种供体病毒的遗传物质的组合的遗传物质的病毒。如本文所用的，该术语可描述包含来自超过一种亲本毒株的部分的任何流感病毒，不管病毒通过经典重配株重组还是反求遗传学制成。当重配株病毒用于制备流感疫苗时，其遗传物质通常至少包含来自季节性或大流行病毒(或其工程改造的形式)的ha和na基因，而其它基因(骨架基因)来自一种或几种其它供体病毒，该其它供体病毒针对其在用于制造流感疫苗的生产基质(例如含胚鸡蛋的尿囊腔或可容许的细胞系)上容易生长和/或对人具有较少或无病原性的能力而选择。作为骨架基因的“提供者”的供体病毒的实例包括a/puertorico/8/34(h1n1)(a/pr/8/34)、b/lee/40和/或b/panama/45/90病毒。

受体-结合位点(rbs)：如本文所用的，术语“受体-结合位点”或“rbs”包含流感ha多肽的头部区的连续或非连续的氨基酸残基，其包括参与直接结合靶细胞受体蛋白上的唾液酸的氨基酸。构成流感ha多肽的“受体-结合位点”或“rbs”的氨基酸残基可根据与唾液酸类似物复合的ha多肽的晶体结构，和鉴定与类似物一定接近度内的氨基酸残基来描述，或可参考来自特定病毒株(例如，a/newcaledonia/20/99或a/california/07/2009)的ha多肽序列进行描述。因此，在一些实施方案中，本文所述的工程改造的ha多肽的“受体-结合位点”或“rbs”可使用参考ha多肽序列确定。在一些实施方案中，本文所述的工程改造的ha多肽的“受体-结合位点”或“rbs”可使用与人和禽受体类似物(例如lsta,lstc)复合的ha多肽序列的晶体结构确定。与lstc复合的ha多肽序列的实例性的参考晶体结构包括a/puertorico/8/1934(h1n1)pdb|1rvz。

重组：如本文所用的，术语“重组”意欲指通过重组方式设计、工程改造、制备、表达、产生或分离的多肽(例如，本文所述的ha多肽)，例如使用转染至宿主细胞的重组表达载体表达的多肽、自重组的组合多肽文库分离的多肽，或通过任何其它方式(包括剪接多个选择的序列元件)制备、表达、产生或分离的多肽。在一些实施方案中，一个或多个这样的选择序列元件天然存在。在一些实施方案中，一个或多个这样的选择序列元件用计算机设计。在一些实施方案中，一个或多个这样的选择序列元件自已知序列元件的诱变(例如，体内或体外)产生，例如来自天然或合成来源。在一些实施方案中，一个或多个这样的选择序列元件自并非天然存在于相同多肽的多个(例如，2或更多个)已知序列元件的组合产生(例如，来自两个单独的h5ha多肽的2个表位)。

参考：术语“参考”在本文通常用于描述标准或对照试剂、个体、群体、样品、序列或值，目的试剂、个体、群体、样品、序列或值与其进行比较。在一些实施方案中，参考试剂、个体、群体、样品、序列或值与目的试剂、个体、群体、样品、序列或值的测试或确定基本上同时进行测试和/或确定。在一些实施方案中，参考试剂、个体、群体、样品、序列或值是历史参考，任选地包含在有形介质中。通常，如本领域技术人员所理解的，参考试剂、个体、群体、样品、序列或值在与用于确定或表征目的试剂、个体、群体、样品、序列或值的那些可比较的条件下确定或表征。

反求遗传学：术语“反求遗传学”表示自它们的互补dna(cdna)生产传染性重配株病毒或来减毒病毒的分子方法。这些方法对于通过在不同的流感病毒之间重配vrna来生产重配株流感病毒是非常有利的。反求遗传学方法是本领域技术人员众所周知的(参见例如，neumann,g.和kawaoka,y.,virology,2001,287,243-250)。

序列同一性：氨基酸或核酸序列之间的相似性根据序列之间的相似性表示，另外称为序列同一性。序列同一性通常按照百分比同一性(或相似性或同源性)测量；百分比越高，两个序列的相似性越大。当使用标准方法比对时，给定的基因或蛋白的同源物或变体将具有相对高程度的序列同一性。用于比较的序列比对方法是本领域众所周知的。各种程序和比对算法描述于：smith和waterman,adv.appl.math.2:482,1981;needleman和wunsch,j.mol.biol.48:443,1970;pearson和lipman,proc.natl.acad.sci.u.s.a.85:2444,1988;higgins和sharp,gene73:237-244,1988;higgins和sharp,cabios5:151-153,1989;corpetetal.,nucleicacidsresearch16:10881-10890,1988;和pearson和lipman,proc.natl.acad.sci.u.s.a.85:2444,1988.altschuletal.,naturegenet.6:119-129,1994。ncbibasiclocalalignmentsearchtool(blast^®)(altschuletal.,j.mol.biol.215:403-410,1990)可获自数个来源，包括nationalcenterforbiotechnologyinformation(ncbi,bethesda,md.)和互联网，与序列分析程序blastp,blastn,blastx,tblastn和tblastx结合使用。

受试者：如本文所用的，术语“受试者”意指任何哺乳动物，包括小鼠、雪貂和人。在本发明的某些实施方案中，受试者是成年、青年或幼年。在一些实施方案中，使用术语“个体”或“患者”，其意欲与“受试者”可互换。本发明还预期共同给予优化的h5n1流感ha蛋白至鸟，包括鸡和鸭和/或对鸟，包括鸡和鸭进行所述方法。

基本上：如本文所用的，术语“基本上”是指显示目的特征或性质的全部或接近全部的范围或程度的定性情况。生物学领域的普通技术人员将理解，生物学和化学现象很少(如果发生的话)达到完全和/或进行完全，或实现或避免绝对结果。因此术语“基本上”在本文用于捕获在许多生物学和化学现象中固有的完全性的潜在缺少。

转化：如本文所用的，是指外源dna引入宿主细胞的任何过程。转化可在天然或人工条件下使用本领域众所周知的各种方法发生。转化可依赖于任何已知的方法以将外源核酸序列插入原核或真核宿主细胞。在一些实施方案中，具体的转化方法根据转化的宿主细胞进行选择和可包括但不限于，病毒感染、电穿孔、交配、脂质转染。在一些实施方案中，"转化的"细胞被稳定地转化，是因为插入的dna能够作为自主复制质粒或作为宿主染色体的一部分复制。在一些实施方案中，转化的细胞在有限的时间内瞬时表达引入的核酸。

接种疫苗：如本文所用的，术语“接种疫苗”是指给予组合物(特别是共同给予本文所述的三种计算优化的h5n1ha多肽的两种或更多种)意图产生例如对引起疾病的试剂，例如流感的免疫反应。接种疫苗可在暴露于引起疾病的试剂和/或一个或多个症状发生之前、期间和/或之后给予，和在一些实施方案中，在暴露于试剂之前、期间和/或紧接之后给予。疫苗可引发预防性(阻止性)和治疗性反应二者。给予方法根据疫苗而变，但可包括接种、摄取、吸入或其它给予形式。接种可通过多种途径的任何一种递送，包括胃肠外，例如静脉内、皮下或肌内。疫苗可与佐剂一起给予以加强免疫反应。在一些实施方案中，接种疫苗包括接种组合物的在时间上合适分开的多次给予。

载体：如本文所用的，术语“载体”是指能够运输它已连接的另一种核酸的核酸分子。一种类型的载体是"质粒"，其指环状双链dna环，其中可连接另外的dna区段。另一类型的载体是病毒载体，其中另外的dna区段可连接至病毒基因组。某些载体能够在它们引入的宿主细胞中自主复制(例如，具有细菌复制起点的细菌载体和游离型哺乳动物载体)。其它载体(例如，非游离型哺乳动物载体)可在引入宿主细胞时整合至宿主细胞的基因组，和从而与宿主基因组一起复制。此外，某些载体能够指导它们有效连接的基因的表达。这样的载体在文本中被称为"表达载体"。

病毒样颗粒(vlp)：如本文所用的，词语“病毒样颗粒”或“vlp”是指类似于病毒但缺少任何病毒遗传物质，因此无传染性的颗粒。“病毒样颗粒”或“vlp”可通过在各种细胞培养系统中异源表达产生，所述系统包括哺乳动物细胞系、昆虫细胞系、酵母和植物细胞。此外，vlp可通过本领域已知的方法纯化。在一些实施方案中，本文所述的流感vlp包含血凝素(ha)多肽和神经氨酸酶(na)多肽。在一些实施方案中，本文所述的流感vlp包含ha多肽、na多肽和/或病毒结构多肽(例如，流感结构蛋白，例如流感m1)。在某些实施方案中，本文所述的流感vlp包含ha多肽、na多肽和/或m1多肽。在一些实施方案中，本文所述的流感vlp包含ha多肽、na多肽和/或hivgag多肽。技术人员知道，其它病毒结构蛋白可用作本文所例举的那些的备选方案。流感vlp可通过用编码ha和na蛋白，和任选hivgag蛋白的质粒转染宿主细胞(例如，哺乳动物细胞)产生。在孵育转染的细胞合适的时间以允许蛋白表达(例如大约72小时)后，vlp可自细胞培养上清液分离。在一些实施方案中，本文所述的流感vlp通过在哺乳动物细胞(例如，人细胞)中瞬时转染产生。在一些实施方案中，流感vlp通过使用一种或多种测定法进行分析。仅给出几个实例，流感vlp可针对血凝素活性、动态光散射和通过蛋白染色的血凝素含量定量进行分析。在阅读本公开内容时，其它测定法对技术人员而言是显而易见的。

vrna：所谓“vrna”是指流感病毒的反义病毒rna，其包封在核糖核蛋白复合物中。当流感病毒具有a或b型时，所述vrna是pb2、pb1、pa、ha、np、na、m和nsvrna。当流感病毒具有c型时，所述vrna是pb1、pb2、pa、hef、np、m和nsvrna。

crna：所述“crna”意指与vrna互补的正义rna中间体。一旦在核中，引入的反义病毒rna(vrna)通过引物依赖性机制被转录成信使rna(mrna)。这些mrna产物是vrna模板的不完全拷贝，并被加帽和聚腺苷酸化，不像vrna。复制通过2步过程发生。首先制备vrna的全长正义拷贝，其称为互补rna(crna)，进而用作模板来生产更多的vrna。

野生型：如本领域所理解的，词语“野生型”通常是指自然中存在的正常形式的蛋白或核酸。例如，野生型ha多肽在流感病毒的天然分离株中存在。各种不同的野生型ha序列可见于ncbi流感病毒序列数据库，通过万维网ncbi.nlm.nih.gov/genomes/flu/flu可获得。

某些实施方案的详细描述

本发明不限于所述的具体方法和实验条件，因为这样的方法和条件可改变。还应理解，本文使用的术语仅为描述特定实施方案的目的，和不意图限制，除非另外指明，因为本发明的范围仅由随附的权利要求限定。

除非另外说明，本文使用的所有技术和科学术语和短语具有本领域普通技术人员通常理解的相同含义。尽管类似于或等同于本文描述的那些的任何方法和材料可用于本发明的实践或试验，但现在描述优选的方法和材料。本文提及的所有出版物通过引用结合到本文中。

标准技术可用于重组dna、寡核苷酸合成和组织培养和转化(例如，电穿孔、脂质转染(lipofection))。酶促反应和纯化技术可根据制造商的说明书或按本领域通常实行的或按本文所述的进行。前述技术和程序可通常根据本领域熟知的常规方法，和按照本说明书全文引用和论述的各种一般性和更具体的参考资料所述进行。参见例如，sambrook等molecularcloning:alaboratorymanual(2ded.,coldspringharborlaboratorypress,coldspringharbor,n.y.(1989))，其通过引用结合到本文中用于任何目的。

编码工程改造的流感蛋白的优化的核苷酸序列的产生

最新进展允许生产经设计为比天然流感蛋白更好的免疫原的合理工程改造的流感蛋白。用工程改造的流感蛋白开始，可能反向翻译工程改造的蛋白的氨基酸序列以产生编码工程改造的蛋白的核苷酸序列。核苷酸序列可在反求遗传学系统中用于促进包含修饰形式的流感结构蛋白(例如，血凝素或神经氨酸酶)的传染性流感病毒的拯救。然而，已发现，当在反求遗传学系统中使用某些工程改造的流感蛋白时，很少至没有传染性流感病毒可被拯救。不受特定理论的束缚，该现象可部分地归因于编码工程改造的流感蛋白的核苷酸序列缺少用于有效病毒包装和/或有效基因表达的最佳序列。

本文公开了产生编码工程改造的流感结构蛋白的优化的核苷酸序列的方法。优化编码工程改造的流感蛋白的核苷酸序列改进拯救或回收传染性流感病毒的可能性。还可优化病毒生长和蛋白产量。核苷酸序列可特别通过修饰序列进行优化，其通过以下进行：i)使用流感-特异性密码子使用表(特别对于流感结构蛋白例如血凝素和神经氨酸酶而导出)；和/或ii)使用其它流感序列(例如，来自野生型或之前拯救的毒株)作为反向翻译的模板。

图1提供了这些方法的某些实施方案的流程图。在这些方法中，工程改造的结构蛋白的氨基酸被反向翻译为核苷酸序列，如图1的步骤1所示。序列可使用标准密码子使用表或对流感病毒特异性的密码子使用表反向翻译。这些密码子使用表是本领域已知的，或可通过比较流感序列制备。

如图1的步骤2所示，第一核苷酸序列或第一核苷酸序列的翻译用于鉴定第二核苷酸序列，其编码来自野生型病毒或之前拯救的病毒的相应的流感结构蛋白。即是说，发现第二序列的初始一轮比较使用第一核苷酸序列或其翻译的氨基酸序列(例如，针对翻译的核苷酸数据库)进行。匹配的核苷酸序列然后用于下游步骤。例如，第一核苷酸序列或第一核苷酸序列的翻译可用于检索包括流感蛋白序列或核苷酸序列的数据库，和鉴定共有高度序列同一性的核苷酸序列(例如，鉴定在野生型毒株中最近匹配的相应的结构蛋白)。序列相似性检索可使用检索工具进行，例如ncbibasiclocalalignmentsearchtool(blast®)(altschul等,j.mol.biol.215:403-410,1990)，其可获自数个来源，包括nationalcenterforbiotechnologyinformation(ncbi,bethesda,md.)和fasta，其可获自数个来源，包括embl-ebi网站。

第一和第二核苷酸序列和/或其翻译共有高度的序列同一性。在某些实施方案中，第二核苷酸序列与第一核苷酸序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%或99%同一性。在某些实施方案中，由第二核苷酸序列编码的氨基酸序列与由第一核苷酸序列编码的氨基酸序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%或99%同一性。在一个实施方案中，第二核苷酸序列和/或其翻译与来自数据库的核酸或蛋白的第一核苷酸序列和/或其翻译共有最高度的序列同一性(例如，在序列同一性方面第二核苷酸序列的翻译与第一核苷酸序列的翻译最近匹配)。在某些实施方案中，第二核苷酸序列和其翻译是野生型形式的流感结构蛋白。在其它实施方案中，第二核苷酸序列和其翻译是来自能够在反求遗传学系统中拯救的流感病毒的流感结构蛋白的形式。

一旦第二核苷酸序列被鉴定，比较密码子。如图1的步骤3所示，在第一和第二核苷酸序列中的密码子编码相同的氨基酸的每个位置处，第一核苷酸序列中的密码子被改变以匹配来自第二核苷酸序列的密码子。如步骤3b所示，在第一和第二核苷酸序列中的密码子编码不同的氨基酸的每个位置处，第一核苷酸序列中的密码子被改变以匹配基于流感蛋白-特异性流感密码子使用偏好的密码子，以产生优化的核苷酸序列。

在某些实施方案中，产生编码工程改造的流感结构蛋白的优化的核苷酸序列的方法包括：

a)提供工程改造的流感结构蛋白的氨基酸序列；

b)反向翻译氨基酸序列以产生第一核苷酸序列；

c)鉴定第二核苷酸序列，其编码与第一核苷酸序列共有高度同一性的流感结构蛋白的形式(例如，来自野生型流感病毒或能够在反求遗传学系统中被拯救的流感病毒的序列)；

d)在第一和第二核苷酸序列中的密码子编码相同的氨基酸的每个位置处，改变第一核苷酸序列中的密码子以匹配来自第二核苷酸序列的密码子；和

一般而言，由优化的核苷酸序列编码的工程改造的流感结构蛋白的氨基酸序列与由第一非优化的核苷酸序列编码的氨基酸序列相同。然而，相对于由第一核苷酸序列编码的氨基酸序列，在由优化的核苷酸序列编码的工程改造的流感结构蛋白的氨基酸序列中引入较小变化，同时保留在反求遗传学系统中生产传染性流感病毒的能力，在本领域技术人员的范围内。因此，在某些实施方案中，相对于由第一核苷酸序列编码的氨基酸序列，由优化的核苷酸序列编码的工程改造的流感结构蛋白的氨基酸序列具有不超过10、9、8、7、6、5、4、3、2或1个氨基酸差异。

蛋白-特异性流感密码子使用偏好可通过比较流感蛋白序列产生。可对特定的流感结构蛋白(例如，ha或na)确定密码子使用偏好。例如，已通过比较流感ha蛋白和核苷酸序列产生的实例性的蛋白-特异性流感密码子使用偏好在下文表1-5中描述，1)流感b(人)，2)流感ah1n1(人)，3)流感ah1n1(多)，4)流感ah3n2(人)，和5)流感ah3n2(多)，其中“多”表示分析了来自多个动物来源(例如，人、猪和禽)的流感序列。

表1：ha流感b(人)密码子使用偏好

编码gc43.56%

第一字母gc49.80%

第二字母gc43.52%

第三字母gc37.36%

密码子aa分数频率数量

gcaa0.46231.69995258

gcca0.15710.81232492

gcga0.0594.04112143

gcta0.32222.13266508

tgcc0.78920.56661803

tgtc0.2115.51316566

gacd0.40219.19057667

gatd0.59828.55185798

gaae0.79744.055132391

gage0.20311.21633705

ttcf0.54714.28842938

tttf0.45311.84935606

ggag0.52651.266154060

ggcg0.1009.72529226

gggg0.19819.28257943

ggtg0.17617.10851411

cach0.39011.35334118

cath0.61017.73553295

atai0.55333.601100975

atci0.1167.08121278

atti0.33120.10560417

aaak0.64846.166138734

aagk0.35225.10075429

ctal0.15514.54243699

ctcl0.23121.68865174

ctgl0.15114.17942610

cttl0.15214.21542717

ttal0.14113.25739839

ttgl0.16915.81247517

atgm1.00014.68444126

aacn0.52030.63892069

aatn0.48028.30185048

ccap0.38719.70359210

cccp0.20310.33531057

ccgp0.0130.6782037

cctp0.39620.14760544

caaq0.79823.12569494

cagq0.2025.85017579

agar0.64221.92165875

aggr0.2819.59628837

cgar0.0732.4787448

cgcr0.0000.0013

cggr0.0010.02679

cgtr0.0040.123371

agcs0.1459.35728118

agts0.1449.28727907

tcas0.29518.98657056

tccs0.0815.18615585

tcgs0.0352.2686815

tcts0.30019.32558073

acat0.49841.030123299

acct0.29524.27472945

acgt0.0262.1486456

actt0.18114.95444939

gtav0.23112.20336671

gtcv0.21211.19233633

gtgv0.29515.54946725

gttv0.26213.81041500

tggw1.00011.18533613

tacy0.64116.34149106

taty0.3599.17027557

taa*0.6000.0013

tag*0.2000.0001

tga*0.2000.0001

表2：ha流感ah1n1(人)密码子使用偏好

编码gc40.67%

第一字母gc44.58%

第二字母gc38.14%

第三字母gc39.28%

密码子aa分数频率数量

gcaa0.46724.169226427

gcca0.29715.363143929

gcga0.0432.21320733

gcta0.19410.03293982

tgcc0.4159.72091067

tgtc0.58513.721128543

gacd0.50024.453229087

gatd0.50024.407228658

gaae0.68947.154441772

gage0.31121.288199442

ttcf0.59819.970187088

tttf0.40213.442125937

ggag0.35626.630249488

ggcg0.1158.60480604

gggg0.30722.980215289

ggtg0.22316.664156119

cach0.47113.772129023

cath0.52915.471144944

atai0.34420.137188659

atci0.1418.25177298

atti0.51430.077281779

aaak0.65252.096488070

aagk0.34827.746259946

ctal0.27520.519192231

ctcl0.1219.02384533

ctgl0.19614.616136931

cttl0.0352.60924441

ttal0.15211.315106003

ttgl0.22116.520154767

atgm1.00010.25596071

aacn0.37329.309274589

aatn0.62749.326462121

ccap0.48918.348171892

cccp0.2097.85873618

ccgp0.2378.88383222

cctp0.0652.42622732

caaq0.47713.241124048

cagq0.52314.528136105

agar0.74024.677231194

aggr0.2578.56180204

cgar0.0010.040372

cgcr0.0000.00770

cggr0.0010.019176

cgtr0.0020.055516

agcs0.21016.154151339

agts0.1289.83692146

tcas0.37528.788269704

tccs0.0886.76363362

tcgs0.0251.89517751

tcts0.17513.434125862

acat0.63341.718390845

acct0.0412.72425519

acgt0.0845.51951702

actt0.24215.976149669

gtav0.43726.411247437

gtcv0.1317.92574242

gtgv0.23514.199133023

gttv0.19711.905111531

tggw1.00017.600164889

tacy0.53626.101244527

taty0.46422.561211362

taa*0.6000.0016

tag*0.0000.0000

tga*0.4000.0004

表3：ha流感ah1n1(多)密码子使用偏好

编码gc40.65%

第一字母gc44.56%

第二字母gc38.20%

第三字母gc39.20%

密码子aa分数频率数量

gcaa0.46724.211252401

gcca0.29715.398160530

gcga0.0412.14722382

gcta0.19410.055104821

tgcc0.4079.53199365

tgtc0.59313.910145017

gacd0.49624.145251716

gatd0.50424.530255736

gaae0.68646.936489316

gage0.31421.435223463

ttcf0.58919.707205449

tttf0.41113.765143505

ggag0.36127.066282172

ggcg0.1158.63790040

gggg0.30222.607235689

ggtg0.22216.603173089

cach0.46913.712142953

cath0.53115.534161951

atai0.34620.196210553

atci0.1458.46588247

atti0.50929.734309981

aaak0.64951.201533784

aagk0.35127.679288564

ctal0.27620.593214690

ctcl0.1219.00393862

ctgl0.19314.432150461

cttl0.0372.78128992

ttal0.15211.343118255

ttgl0.22016.445171442

atgm1.00010.402108443

aacn0.37329.529307844

aatn0.62749.569516765

ccap0.48918.306190849

cccp0.2117.88282167

ccgp0.2268.44788060

cctp0.0742.77928971

caaq0.49013.670142513

cagq0.51014.226148315

agar0.74025.010260740

aggr0.2548.59689617

cgar0.0030.086898

cgcr0.0010.018191

cggr0.0020.052540

cgtr0.0020.054564

agcs0.21116.195168837

agts0.1269.685100965

tcas0.37628.927301572

tccs0.0876.72670119

tcgs0.0241.87019494

tcts0.17513.490140633

acat0.62641.367431265

acct0.0473.13832717

acgt0.0855.61858572

actt0.24216.004166842

gtav0.43226.042271499

gtcv0.1327.95582929

gtgv0.23814.333149425

gttv0.19811.921124277

tggw1.00017.632183817

tacy0.53526.031271385

taty0.46522.638236004

taa*0.5380.0017

tag*0.0000.0000

tga*0.4620.0016

表4：ha流感ah3n2(人)密码子使用偏好

编码gc42.15%

第一字母gc45.23%

第二字母gc39.73%

第三字母gc41.49%

密码子aa分数频率数量

gcaa0.44222.845155244

gcca0.22311.56378573

gcga0.0703.61624574

gcta0.26513.71593200

tgcc0.58313.61492511

tgtc0.4179.73666157

gacd0.49928.959196792

gatd0.50129.038197325

gaae0.57130.883209866

gage0.42923.205157687

ttcf0.65023.734161285

tttf0.35012.75486666

ggag0.42633.349226620

ggcg0.15111.79880172

gggg0.22517.639119865

ggtg0.19915.577105853

cach0.54912.08182094

cath0.4519.92567448

atai0.39730.782209179

atci0.36928.669194821

atti0.23418.160123406

aaak0.75249.034333206

aagk0.24816.196110057

ctal0.1439.98967881

ctcl0.0584.01927314

ctgl0.27919.411131909

cttl0.24417.009115585

ttal0.0704.86933088

ttgl0.20614.32897365

atgm1.00012.01381634

aacn0.40533.707229053

aatn0.59549.531336587

ccap0.31312.11082290

cccp0.2057.93853939

ccgp0.1907.34549912

cctp0.29311.34477090

caaq0.74533.793229641

cagq0.25511.58778739

agar0.51826.434179630

aggr0.29214.905101285

cgar0.1437.29949598

cgcr0.0080.3972701

cggr0.0391.98513486

cgtr0.0000.01176

agcs0.31523.589160295

agts0.14711.00974808

tcas0.29922.426152395

tccs0.0805.98340654

tcgs0.0020.121823

tcts0.15711.79580152

acat0.37823.252158007

acct0.1026.28042678

acgt0.1549.50064560

actt0.36622.543153192

gtav0.32914.41897977

gtcv0.0803.49923779

gtgv0.1948.52757947

gttv0.39717.436118482

tggw1.00017.597119580

tacy0.60021.091143320

taty0.40014.03695379

taa*0.0000.0000

tag*0.0000.0000

tga*1.0000.0001

表5：ha流感ah3n2(多)密码子使用偏好

编码gc42.18%

第一字母gc45.27%

第二字母gc39.71%

第三字母gc41.57%

密码子aa分数频率数量

gcaa0.44422.883169211

gcca0.22711.69486472

gcga0.0683.50625925

gcta0.26113.42099235

tgcc0.58813.734101558

tgtc0.4129.61671109

gacd0.50829.541218446

gatd0.49228.632211725

gaae0.57631.066229724

gage0.42422.871169124

ttcf0.65323.655174920

tttf0.34712.56992946

ggag0.42032.846242891

ggcg0.15011.72486694

gggg0.22817.797131602

ggtg0.20315.840117134

cach0.54111.98588629

cath0.45910.15375078

atai0.39630.534225794

atci0.36728.277209105

atti0.23718.259135020

aaak0.75549.021362502

aagk0.24515.906117620

ctal0.14710.25075799

ctcl0.0563.90328861

ctgl0.27819.345143055

cttl0.24216.827124435

ttal0.0724.99536940

ttgl0.20514.238105284

atgm1.00012.16389944

aacn0.41033.995251387

aatn0.59048.945361939

ccap0.31312.03288973

cccp0.2067.94158722

ccgp0.1907.29353933

cctp0.29211.22182974

caaq0.74734.087252064

cagq0.25311.52385207

agar0.52026.436195491

aggr0.28914.695108663

cgar0.1366.93351271

cgcr0.0080.3922901

cggr0.0472.37017528

cgtr0.0000.019139

agcs0.31523.616174636

agts0.14811.08081932

tcas0.29722.291164840

tccs0.0816.09045033

tcgs0.0020.1511117

tcts0.15711.80087255

acat0.37623.267172056

acct0.1096.71949687

acgt0.1539.46669997

actt0.36322.451166017

gtav0.33014.731108929

gtcv0.0843.74327682

gtgv0.1918.52463031

gttv0.39417.579129989

tggw1.00017.744131210

tacy0.59121.055155695

taty0.40914.561107675

taa*0.0000.0000

tag*0.5000.0001

tga*0.5000.0001

进一步例如，已通过比较流感na蛋白和核苷酸序列产生的实例性的蛋白-特异性流感密码子使用偏好在下文表6-10中描述，1)流感b(人)，2)流感ah1n1(人)，3)流感ah1n1(多)，4)流感ah3n2(人)，和5)流感ah3n2(多)，其中“多”表示分析了来自多个动物来源(例如，人、猪、禽)的流感序列。

表6：na流感b(人)密码子使用偏好

编码gc42.70%

第一字母gc45.65%

第二字母gc47.02%

第三字母gc35.44%

密码子aa分数频率数量

gcaa0.49732.951122710

gcca0.17311.47542731

gcga0.0291.9287180

gcta0.30119.93674241

tgcc0.54921.15178765

tgtc0.45117.38464737

gacd0.37618.45868736

gatd0.62430.661114180

gaae0.78542.521158346

gage0.21511.61243242

ttcf0.2728.57731939

tttf0.72822.95885494

ggag0.47345.162168182

ggcg0.19018.10567424

gggg0.23422.38183348

ggtg0.1039.87236762

cach0.3107.40227565

cath0.69016.45961293

atai0.52431.908118826

atci0.18010.98540909

atti0.29517.98366967

aaak0.74544.692166434

aagk0.25515.26056827

ctal0.24720.23375349

ctcl0.1048.55131842

ctgl0.12610.33938501

cttl0.1189.71236169

ttal0.20516.77662473

ttgl0.20016.37160964

atgm1.00029.902111356

aacn0.49217.20564070

aatn0.50817.76066137

ccap0.43521.41579750

cccp0.1939.50635401

ccgp0.1115.49020446

cctp0.26112.83147781

caaq0.6339.71536178

cagq0.3675.63921000

agar0.54924.48891194

aggr0.2059.11633948

cgar0.1416.28123389

cgcr0.0000.01659

cggr0.0060.256952

cgtr0.0994.41916455

agcs0.1098.54431818

agts0.16512.95748250

tcas0.42533.319124081

tccs0.13010.20838016

tcgs0.0272.1508008

tcts0.14311.20941741

acat0.47738.419143071

acct0.16012.85247861

acgt0.0766.13522848

actt0.28723.08385959

gtav0.26611.49242796

gtcv0.23310.04937421

gtgv0.2239.63335872

gttv0.27812.00544706

tggw1.00017.13063791

tacy0.41917.93566791

taty0.58124.90392738

taa*0.9962.1307931

tag*0.0010.0027

tga*0.0030.00624

表7：na流感ah1n1(人)密码子使用偏好

编码gc41.92%

第一字母gc39.38%

第二字母gc46.09%

第三字母gc40.30%

密码子aa分数频率数量

gcaa0.2809.89269837

gcca0.1896.69347255

gcga0.0511.79812694

gcta0.48016.973119833

tgcc0.46418.609131382

tgtc0.53621.482151669

gacd0.50522.002155343

gatd0.49521.599152493

gaae0.64027.050190980

gage0.36015.225107495

ttcf0.49818.890133367

tttf0.50219.063134587

ggag0.39037.344263659

ggcg0.16215.484109319

gggg0.23522.500158857

ggtg0.21320.363143765

cach0.3464.63132694

cath0.6548.75661817

atai0.46645.047318045

atci0.22021.316150496

atti0.31430.363214368

aaak0.51021.821154064

aagk0.49020.966148022

ctal0.26010.19671989

ctcl0.0461.80312728

ctgl0.1114.33230587

cttl0.0592.30116248

ttal0.2369.25265320

ttgl0.28811.28079642

atgm1.00015.251107674

aacn0.43136.768259591

aatn0.56948.628343324

ccap0.48122.287157349

cccp0.1336.17643607

ccgp0.0964.45031415

cctp0.28913.39394558

caaq0.58417.988126997

cagq0.41612.81790492

agar0.59621.424151262

aggr0.1846.60546635

cgar0.1595.72140389

cgcr0.0501.78112574

cggr0.0020.061431

cgtr0.0100.3582529

agcs0.18020.580145299

agts0.23827.187191950

tcas0.24928.412200598

tccs0.11613.31193981

tcgs0.0515.85041302

tcts0.16618.930133651

acat0.39023.049162735

acct0.28616.895119286

acgt0.0020.140990

actt0.32219.078134698

gtav0.23714.197100232

gtcv0.20312.15385801

gtgv0.28016.743118207

gttv0.27916.700117907

tggw1.00034.038240319

tacy0.45313.58295894

taty0.54716.405115827

taa*0.8651.74012285

tag*0.1350.2711914

tga*0.0000.0017

表8：na流感ah1n1(多)密码子使用偏好

编码gc41.87%

第一字母gc39.36%

第二字母gc46.11%

第三字母gc40.14%

密码子aa分数频率数量

gcaa0.28710.20082144

gcca0.1926.81554887

gcga0.0481.70713750

gcta0.47316.826135503

tgcc0.47218.934152483

tgtc0.52821.198170719

gacd0.49421.688174664

gatd0.50622.259179260

gaae0.64226.931216883

gage0.35815.028121026

ttcf0.49818.791151330

tttf0.50218.971152780

ggag0.39137.319300546

ggcg0.16215.424124218

gggg0.23622.496181171

ggtg0.21220.222162854

cach0.3444.67937683

cath0.6568.94372018

atai0.46845.150363616

atci0.21720.912168414

atti0.31630.497245602

aaak0.52322.378180218

aagk0.47720.421164455

ctal0.2479.79378870

ctcl0.0431.69113619

ctgl0.1234.87539264

cttl0.0652.57720753

ttal0.2449.68978026

ttgl0.27911.09589352

atgm1.00015.535125108

aacn0.42235.632286963

aatn0.57848.871393575

ccap0.48422.228179014

cccp0.1356.21350035

ccgp0.0974.45035835

cctp0.28413.021104867

caaq0.58417.964144671

cagq0.41612.773102866

agar0.59521.567173685

aggr0.1906.86755305

cgar0.1515.46744025

cgcr0.0461.66013371

cggr0.0050.1851490

cgtr0.0130.4833890

agcs0.18220.844167865

agts0.23927.294219808

tcas0.24628.085226184

tccs0.11212.846103451

tcgs0.0536.00248337

tcts0.16819.213154727

acat0.38923.099186022

acct0.28316.831135545

acgt0.0040.2271826

actt0.32419.268155171

gtav0.24014.313115270

gtcv0.20412.16597967

gtgv0.27516.414132191

gttv0.28116.772135069

tggw1.00034.123274810

tacy0.45613.719110483

taty0.54416.354131703

taa*0.8021.61112977

tag*0.1970.3963188

tga*0.0010.00220

表9：na流感ah3n2(人)密码子使用偏好

编码gc42.92%

第一字母gc42.43%

第二字母gc44.50%

第三字母gc41.84%

密码子aa分数频率数量

gcaa0.35810.74359488

gcca0.2136.39235394

gcga0.0732.19012126

gcta0.35610.67859132

tgcc0.48121.541119287

tgtc0.51923.276128892

gacd0.40020.514113598

gatd0.60030.802170566

gaae0.58431.840176315

gage0.41622.692125658

ttcf0.56117.90899167

tttf0.43914.03377711

ggag0.37630.885171025

ggcg0.19215.75587245

gggg0.19716.16189493

ggtg0.23619.382107328

cach0.1022.18212083

cath0.89819.201106324

atai0.47238.110211036

atci0.19916.06888976

atti0.32926.514146820

aaak0.62831.235172964

aagk0.37218.494102411

ctal0.1347.15239602

ctcl0.1497.99344263

ctgl0.1518.07544717

cttl0.1608.57347473

ttal0.0743.96221938

ttgl0.33217.74998286

atgm1.00015.05483364

aacn0.47730.816170643

aatn0.52333.794187134

ccap0.1877.74642892

cccp0.2078.60347638

ccgp0.0532.18812118

cctp0.55322.967127181

caaq0.66417.01594219

cagq0.3368.60447646

agar0.41019.188106256

aggr0.34916.31690351

cgar0.0482.23412373

cgcr0.0391.82410101

cggr0.1074.99727671

cgtr0.0482.24012406

agcs0.17817.46596714

agts0.15014.73781609

tcas0.28127.573152686

tccs0.24123.651130971

tcgs0.0232.30412759

tcts0.12612.38168560

acat0.39530.801170562

acct0.28522.251123218

acgt0.0856.66136883

actt0.23518.320101450

gtav0.18413.71375935

gtcv0.17613.14972814

gtgv0.30522.789126193

gttv0.33525.050138713

tggw1.00023.518130230

tacy0.1494.43724571

taty0.85125.405140679

taa*0.9942.10011629

tag*0.0050.01159

tga*0.0010.0018

表10：na流感ah3n2(多)密码子使用偏好

编码gc42.89%

第一字母gc42.41%

第二字母gc44.53%

第三字母gc41.73%

密码子aa分数频率数量

gcaa0.35710.83265702

gcca0.2156.52939601

gcga0.0742.24213597

gcta0.35310.71564988

tgcc0.48621.827132388

tgtc0.51423.125140264

gacd0.39820.438123962

gatd0.60230.881187307

gaae0.58131.406190490

gage0.41922.614137160

ttcf0.55417.602106760

tttf0.44614.16485908

ggag0.37430.846187090

ggcg0.18915.60194624

gggg0.19716.27298697

ggtg0.23919.697119472

cach0.1032.22113469

cath0.89719.242116710

atai0.46637.598228047

atci0.20216.29698842

atti0.33226.761162317

aaak0.63231.583191559

aagk0.36818.366111394

ctal0.1387.37544732

ctcl0.1467.80447337

ctgl0.1508.01548615

cttl0.1638.71652867

ttal0.0794.21625573

ttgl0.32317.258104675

atgm1.00015.11391668

aacn0.47330.661185967

aatn0.52734.140207068

ccap0.1927.93548128

cccp0.2088.59952156

ccgp0.0512.09912732

cctp0.54922.718137793

caaq0.65916.917102607

cagq0.3418.75553103

agar0.41019.203116470

aggr0.35316.527100239

cgar0.0512.41414643

cgcr0.0391.84911216

cggr0.1034.83829345

cgtr0.0442.05012433

agcs0.17817.426105693

agts0.15214.88390273

tcas0.27827.261165347

tccs0.24123.553142859

tcgs0.0252.46614956

tcts0.12612.34174850

acat0.39530.737186433

acct0.28322.045133712

acgt0.0846.50139428

actt0.23818.495112178

gtav0.19114.19686104

gtcv0.17613.09679434

gtgv0.30022.375135712

gttv0.33324.837150648

tggw1.00023.690143689

tacy0.1544.62028023

taty0.84625.306153489

taa*0.9942.09912729

tag*0.0050.01165

tga*0.0010.00211

因此，在本文描述的方法的某些实施方案中，编码工程改造的ha流感蛋白的优化的核苷酸序列使用表1-5之一所述的ha-特异性流感密码子使用偏好产生。在本文所述的方法的一些实施方案中，编码工程改造的na流感蛋白的优化的核苷酸序列使用表6-10之一所述的na-特异性流感密码子使用偏好产生。

通过修饰流感结构蛋白的其它区域进一步优化

除了改变密码子之外，编码工程改造的流感结构蛋白的优化的核苷酸序列可任选地通过修饰序列进一步优化，其通过以下进行：i)使用来自野生型或其它回收的病毒例如高效价回收的病毒的结构蛋白的5’-和/或3’非编码序列；和/或ii)使用来自野生型或其它回收的病毒例如高效价回收的病毒的5’和3’末端编码序列，其编码信号肽、跨膜结构域和/或胞质尾。参见例如，harvey等(2011),j.virol.85(12):6086-6090;gomila等(2013),vaccine(31():4736-4743。例如，这些另外的修饰描述于图1的步骤4和5。每个修饰可独立地或组合应用于优化的核苷酸序列，并且不修饰蛋白的外结构域(细胞外)编码部分。

鉴定蛋白例如流感结构蛋白的5’和/或3’非编码区、信号肽、跨膜结构域、胞质结构域和/或外结构域，是本领域常规的，并且可使用已知的方法和技术进行。

例如，流感结构蛋白例如ha的信号肽和外结构域序列的位置可基于序列比对和参考可通过网站rcsb.org获得的rcsbpdb中的流感a亚型h1n1和h3n2结构模型确定。信号肽也可通过使用预测信号肽的软件，例如signalp(thomasnordahlpetersen等,naturemethods,8:785-86,2011)确定。

流感a亚型h1n1的信号肽包括h1n1多肽的残基1-17。外结构域以位置18的残基d开始。h1n1ha蛋白序列的带注释的比对显示于图2。通常，外结构域序列以季节样序列的dtic(seqidno:19)或大流行样序列的dtlc(seqidno:20)开始。h.m.berman等,theproteindatabank.nucleicacidsresearch,28:235-242,2000。流感a亚型h3n2的信号肽包括h3n2多肽的残基1-16。外结构域以位置17的残基q开始。h3n2ha蛋白序列的带注释的比对显示于图3。通常，外结构域序列以qklp(seqidno:21)或qdlp(seqidno:22)开始。h.m.berman等,theproteindatabank.nucleicacidsresearch,28:235-242,2000。

类似地，流感结构蛋白例如ha的跨膜和胞质结构域序列的位置结构,可基于序列比对确定。各种代表性的流感a毒株的ha跨膜结构域的序列比对显示于图4。亦参见secondarystructure,orientation,oligomerization,andlipidinteractionsofthetransmembranedomainofinfluenzahemagglutinin.surena.tatulian和lukask.tamm.biochemistry,2000,39(3),pp496–507。技术人员也可使用软件鉴定跨膜和胞质结构域，包括例如tmpred(k.hofmann&w.stoffel,1993,tmbase-adatabaseofmembranespanningproteinssegments.biol.chem.hoppe-seyler374,166);interproscan(zdobnove.m.和apweilerr.,2001,bioinformatics,17(9):847-48);和tmhmm(krogh,b.等,journalofmolecularbiology,2001,305(3):567-580)。

因此，在某些实施方案中，产生编码工程改造的流感结构蛋白的优化的核苷酸序列的方法进一步包括一个或多个以下步骤：

a)添加来自另一流感毒株例如高效价拯救毒株的5’和3’非编码序列；

b)将优化的核苷酸序列中的编码信号肽的序列交换为编码来自另一流感毒株例如高效价拯救毒株的信号肽的核苷酸序列；

c)将优化的核苷酸序列的编码跨膜结构域的序列交换为编码来自另一流感毒株例如高效价拯救毒株的跨膜结构域的核苷酸序列；和/或

d)将优化的核苷酸序列的编码胞质结构域的序列交换为编码来自另一流感毒株例如高效价拯救毒株的胞质结构域的核苷酸序列。

在某些实施方案中，本文所述的方法进一步包括步骤a)；步骤b)；步骤c)；步骤d)；步骤a)和b)；步骤a)和c)；步骤a)和d)；步骤a)、b)和c)；步骤a)、b)和d)；步骤a)、c)和d)；步骤a)、b)、c)和d)；步骤b)和c)；步骤b)和d)；步骤b)、c)和d)；或步骤c)和d)。

来自另一流感毒株的5’和3’非编码序列可进一步包括编码序列而不破坏氨基酸序列。因此，5’和3’末端核苷酸序列可包括非编码和编码序列。在一些实施方案中，5’和3’末端序列主要是编码序列，包括信号肽和延伸至5’端的茎区；和包括茎、跨膜区和3’端的胞质尾。

编码工程改造的流感结构蛋白的优化的核苷酸序列

另一方面涉及编码工程改造的流感结构蛋白的优化的核苷酸序列，其通过本文所述的方法获得，其中在反向翻译的核苷酸序列(即，第一核苷酸序列)和第二核苷酸序列(其编码来自野生型病毒或之前拯救的病毒的相应的流感结构蛋白)中的密码子编码相同的氨基酸的每个位置处，优化的核苷酸序列中的密码子已被改变以匹配来自第二核苷酸序列的密码子；和其中在第一和第二核苷酸序列中的密码子编码不同的氨基酸的每个位置处，优化的核苷酸序列中的密码子已被改变以匹配基于流感蛋白-特异性流感密码子使用偏好的密码子。

在某些实施方案中，优化的核苷酸序列进一步包括一种或多种以下修饰：

a)来自另一流感毒株例如高效价拯救毒株的5’和3’非编码核苷酸序列(例如，非编码序列)；

b)编码来自另一流感毒株例如高效价拯救毒株的信号肽的核苷酸序列；

c)编码来自另一流感毒株例如高效价拯救毒株的跨膜结构域的核苷酸序列；和/或

d)编码来自另一流感毒株例如高效价拯救毒株的胞质结构域的核苷酸序列。

在某些实施方案中，优化的核苷酸序列进一步包括修饰a)；修饰b)；修饰c)；修饰d)；修饰a)和b)；修饰a)和c)；修饰a)和d)；步骤a)、b)和c)；修饰a)、b)和d)；修饰a)、c)和d)；修饰a)、b)、c)和d)；修饰b)和c)；修饰b)和d)；修饰b)、c)和d)；或修饰c)和d)。

工程改造的流感蛋白

本文所述的用于优化核苷酸序列的方法优选地在工程改造的流感结构蛋白上进行，包括但不限于ha和na。本文所述的方法可在任何工程改造的流感结构蛋白上进行。

例如，为了诱导更加广泛反应性的免疫反应，基于选择的h5n1和h1n1流感病毒分离株，通过一系列ha蛋白比对和随后的共有序列，对流感ha蛋白已经开发了计算优化的广泛反应性抗原(cobra)，如描述于wo2013/122827和美国公开号2015/0044247,2015/0017196,2014/0147459,2014/0127248和2013/0183342，其全部通过引用以其整体结合到本文中。

这些重组工程改造的cobra具有独特设计的氨基酸序列以引发针对各种流感分离株，例如特定亚型例如h1n1或h5n1内的大多数或所有流感病毒的广泛反应性免疫反应。cobra的氨基酸序列天然不存在。除了描述于wo2013/122827和美国公开号2015/0044247,2015/0017196,2014/0147459,2014/0127248和2013/0183342的特定的cobra之外，还有可能使用这些公布的申请中公开的方法产生其它重组工程改造的cobra。

某些实例性的h5n1cobra的氨基酸序列在表11中描述。

表11：实例性的h5n1cobra氨基酸序列

某些实例性的h1n1cobra的氨基酸序列在表12中描述。

表12：实例性的h1n1cobra氨基酸序列

在一些实施方案中，工程改造的cobra具有与表11或12中出现的序列至少约90%(例如，至少约91%,92%,93%,94%,95%,96%,97%,98%或99%)同一性的序列。在一些实施方案中，工程改造的hacobra具有与表11或12中出现的序列基本上相同的序列。在一些实施方案中，工程改造的hacobra具有与表11或12中出现的序列相同的序列。

进一步例如，使用合理设计方法已开发了工程改造的ha序列，在多价疫苗中包括来自多个病毒分离株的表位，如描述于pct/us2016/035594(要求美国临时申请号62/169,814的优先权)，其通过引用以其整体结合到本文中。在某些实施方案中，设计基于将多个b细胞表位和来自不同的ha序列(亚型h1)的抗原区组合成嵌合抗原。这些嵌合表位抗原，在一些实施方案中，通过使对至少一个中和表位的序列同源性最大化，被预测赋予对多个亚型h1毒株的交叉保护。通过地理区域、病毒分离株年份、序列簇或其它评分方法，评价总体比对覆盖度对最佳嵌合序列模板进行选择。一组选择的嵌合模板序列与靶骨架序列组合，以产生一组全长嵌合蛋白序列。这些嵌合序列的结构精修得到一组最终的接种蛋白。这些工程改造的ha蛋白的氨基酸序列不匹配任何天然存在的毒株的氨基酸序列。某些实例性的工程改造的ha蛋白的氨基酸序列在表13中描述。

表13：实例性的h1n1嵌合ha蛋白

进一步例如，已使用合理设计方法开发了来自流感b的工程改造的ha序列，如描述于美国临时申请号62/344,862，其通过引用以其整体结合到本文中。这些工程改造的ha蛋白的氨基酸序列不匹配任何天然存在的毒株的氨基酸序列。某些实例性的工程改造的流感bha蛋白的氨基酸序列在表14中描述。

表14：实例性的流感bsmartha蛋白

进一步例如，已经开发了工程改造的ha序列以延伸季节性反应概况，以覆盖大流行毒株，或反之亦然，如描述于美国临时申请号62/354,502，其通过引用以其整体结合到本文中。这些策略延伸了在抗原性不同的毒株的序列簇(或进化枝)之间的免疫概况；它们可随时间应用于工程改造的重组ha分子，使得其继续引发针对抗原性漂移的循环季节性毒株的免疫反应。该策略经设计，以总体上保存宿主ha多肽的受体结合位点(rbs)的特定残基，具有在接近rbs的区域中工程改造的修饰。类似的策略可用于延伸大流行反应概况以覆盖季节性毒株。美国临时申请号62/354,502中描述的修饰可用于进一步定制或优化免疫原性特征，使得工程改造的ha多肽经再次工程改造以引发针对更多或更少的季节性毒株的抗体(或证实改进或更多的抗-季节性抗体反应)或引发针对更多或更少的大流行毒株的抗体(或证实改进或更多的抗-大流行抗体反应)。这些修饰的工程改造的ha蛋白的氨基酸序列不匹配任何天然存在的毒株的氨基酸序列。某些实例性的修饰的工程改造的ha蛋白的氨基酸序列在表15中描述。

表15：实例性的修饰的流感ha蛋白

在各种实施方案中，本文所述的工程改造的ha嵌合多肽包含在特定的病毒骨架序列上的表位模式的组合。按需要，多个表位可被装配在任何病毒骨架上。实例性的病毒骨架序列包括a/newcaledonia/20/1999、a/california/07/2009和共有(例如，1918-2011)序列。在一些实施方案中，本文所述的工程改造的ha嵌合多肽包含newcaledonia99或california09骨架序列。

在一些实施方案中，工程改造的ha多肽具有与表13、14或15中出现的序列至少约90%(例如，至少约91%,92%,93%,94%,95%,96%,97%,98%或99%)同一性的序列。在一些实施方案中，工程改造的ha多肽具有与表13、14或15中出现的序列基本上相同的序列。在一些实施方案中，工程改造的ha多肽具有与表13、14或15中出现的序列相同的序列。

工程改造的流感结构蛋白的表达

通过本文所述的方法得到的优化的核苷酸序列可在无细胞系统中或在宿主细胞中使用已知的方法表达。本发明的优化的核苷酸序列的表达可通过第二个核酸序列调节，使得该分子在用重组dna分子转化的宿主中表达。例如，本发明的优化的核苷酸序列的表达可通过启动子和/或增强子元件控制，它们是本领域已知的。

通过本领域已知的方法将本发明的核酸构建体插入表达载体或病毒载体，和核酸分子与表达控制序列可操作连接。

将包含核酸分子的表达载体转化至合适的宿主细胞，以允许生产由核酸构建体编码的蛋白。实例性的宿主细胞包括原核细胞(例如，大肠杆菌)和真核细胞(例如，cos、293或cho细胞)。用表达载体转化的宿主细胞在允许生产工程改造的流感结构蛋白的条件下生长，接着回收工程改造的蛋白。

还提供了包含编码重组流感结构蛋白的核酸分子的载体。载体可以是用于表达工程改造的流感结构蛋白的任何合适的载体，例如哺乳动物表达载体。在具体的实例中，载体是ptr600表达载体(美国专利申请公开号2002/0106798，通过引用结合到本文中；ross等,natimmunol.1(2):102-103,2000；green等,vaccine20:242-248,2001)。在一些实例中，载体包括与编码工程改造的流感结构蛋白的优化的核苷酸序列可操作连接的启动子。在具体的实例中，启动子是cmv启动子。

工程改造的流感结构多肽可通过本领域已知的任何技术纯化。例如，不希望受理论的束缚，工程改造的流感结构多肽可作为可溶性多肽或作为包涵体从细胞回收，从所述包涵体，它们可通过8m盐酸胍和透析定量提取。为了进一步纯化工程改造的流感结构多肽，可使用常规的离子交换色谱、疏水相互作用色谱、反相色谱或凝胶过滤。本发明的工程改造的流感结构多肽还可在从真核或原核细胞中分泌后，从条件培养基中回收。

反求遗传学方法

通过本文所述的方法获得的优化的核苷酸序列可与一种或多种供体病毒组合，和在反求遗传学系统中用于生产传染性重配株流感病毒。如上所论述的，反求遗传学系统可用于从它们的cdnas生产传染性重配株病毒，或减毒病毒。反求遗传学方法是本领域技术人员众所周知的，和包括但不限于使用neuman等,1999,procnatlacadsciusa,96(16):9345-9350；neumann等,2005,procnatlacadsciusa,102(46):16825-16829；zhang等,2009,jvirol,83(18):9296-9303；massin等,2005,jvirol,79(21):13811-13816；murakami等,2008,82(3):1605-1609中描述的质粒；和/或neuman等,1999,procnatlacadsciusa,96(16):9345-9350；neumann等,2005,procnatlacadsciusa,102(46):16825-16829；zhang等,2009,jvirol,83(18):9296-9303；massin等,2005,jvirol,79(21):13811-13816；murakami等,2008,82(3):1605-1609；koudstaal等,2009,vaccine,27(19):2588-2593；schickli等,2001,philostransrsoclondbiolsci,356(1416):1965-1973；nicolson等,2005,vaccine,23(22):2943-2952；legastelois等,2007,influenzaotherrespiviruses,1(3):95-104；whiteley等,2007,influenzaotherrespiviruses,1(4):157-166中描述的细胞的方法。

在某些实施方案中，反求遗传学方法可以是：

(i)16种质粒方法，例如neuman等,1999,procnatlacadsciusa,96(16):9345-9350和us2009/0246830或us2011/0143424(其各自通过引用以其整体结合到本文中)中描述的方法，其中流感病毒通过使用聚胺衍生物(transit-lt1)，用各自包含在rna聚合酶i启动子和rna聚合酶i终止子的控制下的与一种流感vrna互补的cdna的8种质粒，和各自包含在rna聚合酶ii启动子的控制下与pa、pb1、pb2、np、ha、na、m和nsmrna之一互补的cdna的8种质粒，转染细胞生产。特别地，细胞是人肾胚粘附细胞(293t细胞系)；

(ii)12种质粒方法，例如fodor等,1999,jvirol,73(11):9679-9682和us2004/0142003、us2012/0058538(其各自通过引用以其整体结合到本文中)中描述的方法，其中流感病毒通过用各自包含在rna聚合酶i启动子和rna聚合酶i终止子(肝炎δ核酶)的控制下与一种流感vrna互补的cdna的8种质粒，和各自包含在rna聚合酶ii启动子的控制下与np、pa、pb1和pb2mrna之一互补的cdna的4种质粒转染第一细胞类型，和通过在第二细胞类型中进一步扩增病毒生产。特别地，所述第一细胞类型是vero细胞和所述第二细胞类型是mdbk；

(iii)13种质粒方法，例如dewit等,2007,journalofgeneralvirology,88:1281-1287(其通过引用以其整体结合到本文中)中描述的方法，其中流感病毒通过用各自包含在t7rna聚合酶启动子和t7rna聚合酶终止子的控制下与一种流感vrna互补的cdna的8种质粒，各自包含在rna聚合酶ii的控制下与np、pa、pb1和pb2mrna之一互补的cdna的4种质粒和包含在rna聚合酶ii的控制下与编码t7rna聚合酶和核定位信号的mrna互补的cdna的1种质粒，转染细胞生产。特别地，转染的细胞是vero、293t或qt6(来自japanesequail的纤维肉瘤细胞系)细胞。

(iv)8种质粒方法，例如hoffmann等,2000,pnas,97(11):6108-6113和wo01/83794(其各自通过引用以其整体结合到本文中)中描述的方法，其中每种质粒能够表达mrna和vrna二者。因此，每种质粒包含与一种流感vrna互补的cdna和两个转录盒，而不是如前述的情况下的一个。与8种流感病毒vrna的每一种互补的cdna在聚合酶i终止子和聚合酶i启动子之间插入。该聚合酶i转录单元侧翼是聚合酶ii启动子和多腺苷酸化信号。第一转录盒允许转录vrna形式的cdna。第二转录盒允许转录mrna形式的cdna，其然后使用细胞机器翻译成病毒蛋白。在这种用于转录的双盒系统(亦称为poll-polii系统)的帮助下，同一质粒的cdna被转录为vrna和mrna形式二者。这在转染细胞的水平上通过vrna和一种或多种病毒蛋白的表达证明。特别地，使用粘附mdck细胞和293t细胞的共培养，以及聚胺衍生物(transit-lt1)作为转染试剂。

(v)3种质粒方法，例如neumann等,2005,pnas,102(46):16825-16829(其通过引用以其整体结合到本文中)中描述的方法，其中流感病毒通过用包含各自在rna聚合酶i启动子和聚合酶i终止子的控制下与pb2、pb1、pa、ha、np、na、m和nsvrna互补的8种cdna的1种质粒和2种质粒(在rna聚合酶ii启动子的控制下，第一种包含与pb2、pb1和pamrna之一互补的3种cdna和第二种包含与npmrna互补的cdna)，转染细胞生产。特别地，转染的细胞是293t或vero。

(vi)1种质粒方法，例如zhang等,j.virol.,83(18):9296-9303(其通过引用以其整体结合到本文中)中描述的方法，其中流感病毒通过用包含在鼠聚合酶i终止子和鸡rna聚合酶i启动子的控制下与pb2、pb1、pa、ha、np、na、m和nsvrna互补的8种cdna和在pb2、pb1、pa和npcdna之间具有聚合酶ii启动子和多腺苷酸化信号的1种质粒，转染细胞生产。特别地，转染的细胞是cef细胞。

(vii)wo2005/062820(其通过引用以其整体结合到本文中)中描述的方法，使用两种不同的细胞系统：在第一步骤中，细胞用poll-polll系统(pol/poll)的8种双向质粒转染，然后在第二步骤中，转染的细胞与来自非常容许流感病毒的另一细胞系的细胞一起培养，以扩大流感病毒的生产。特别地，在第一步骤中所述转染的细胞是vero细胞，和在第二步骤中所述另一细胞系是cek或cef细胞系，其是源自鸡胚细胞的细胞系。

因此，某些实施方案涉及生产传染性重配株流感病毒的方法(“反求遗传学”方法)，所述方法包括用包含编码流感结构蛋白的优化的核苷酸序列的表达载体和一种或多种供体载体转染细胞，和生产传染性重配株流感病毒(或种子病毒)。在某些实施方案中，细胞是哺乳动物细胞，包括但不限于vero细胞、hek-293细胞、mdck细胞或中国仓鼠卵巢(cho)细胞和其组合。在一些实施方案中，本文所述的方法和其优化的核苷酸序列与载体、重组盒和整体系统一起使用，其描述于wo2014/019990和美国申请号14/419,235(美国公开号2015-0191703a1)，其通过引用以其整体结合到本文中。

转染的细胞的上清液包含传染性重配株流感病毒，其可经收获和/或分离，用作传染性种子病毒以感染单独的一群细胞或蛋。或者，在转染步骤后，细胞或蛋可原位加入感染的细胞以允许扩增传染性流感病毒。在某些实施方案中，细胞是哺乳动物细胞，包括但不限于vero细胞或中国仓鼠卵巢(cho)细胞。

充分理解的是，用种子病毒感染细胞在本领域技术人员众所周知的允许扩增传染性流感病毒的培养条件下进行。传染性流感病毒的扩增可通过连续感染细胞群或任何其它高容许细胞群，或通过感染含胚鸡蛋的尿囊腔，进一步扩大。

转染的哺乳动物细胞优选适合于在无血清培养基中和/或在无动物组分条件下培养。本领域技术人员通过在包含递减血清量的培养基中逐渐传代细胞，直到细胞可在无血清培养基中成功存活和增殖，使细胞适合于在无血清培养基中培养可容易地实现。

细胞可通过本领域技术人员已知的任何方法转染。例如，转染可通过膜电穿孔、核电穿孔进行。在某些实施方案中，转染通过核电穿孔进行。表述“核电穿孔”理解为通过一次或多次电击来转染核酸的方法，电击的强度足以增加核孔的数量和/或其渗透性。

在某些实施方案中，重组病毒包含由本文所述的优化的核苷酸序列编码的ha流感多肽、来自流感毒株的野生型na多肽和来自供体病毒(例如，流感a/puertorico/8/34(pr8))的内部蛋白基因的骨架，其赋予在蛋中的高产量。例如，编码高生长流感a/puertorico/8/34(pr8)供体病毒的内部蛋白的6种质粒可与编码本文描述的工程改造的流感结构多肽和野生型神经氨酸酶(na)糖蛋白的质粒共转染至合格的哺乳动物细胞(例如，vero细胞)，接着分离重组病毒。包含来自pr8病毒的内部蛋白基因的重组病毒可用于制备灭活的流感病毒疫苗(参见例如，fodor,e.等rescueofinfluenzaavirusfromrecombinantdna.j.virol.,1999,73,9679-9682；通过引用并入本文)。

流感病毒-样颗粒(vlp)

在一些实施方案中，本发明提供了包含一种或多种由本文所述的优化的核苷酸序列编码的工程改造的流感结构蛋白的流感病毒-样颗粒(vlp)和其组合。在一些实施方案中，流感vlp通常由ha、na和病毒结构(例如，hivgag)蛋白构成。流感vlp的生产是本领域已知的，本领域技术人员在阅读本公开内容后，这将是显而易见的。例如，流感vlp可通过用编码ha、na和hivgag蛋白的质粒转染宿主细胞生产。仅给出一个实例，合适的宿主细胞包括人细胞(例如，hek293t)。在转染的细胞孵育允许蛋白表达的合适时间(例如大约72小时)后，vlp可自细胞培养上清液分离。在一些实施方案中，本文公开的流感vlp可用作流感疫苗以引起针对流感病毒的广泛中和性免疫反应。

全流感病毒

还提供了包含本文描述的一种或多种工程改造的流感结构蛋白的全重组流感病毒。重组流感病毒可通过如本文所述的基于质粒的反求遗传学，和基于细胞或基于蛋的技术生产。包含来自供体病毒的内部蛋白基因的重组病毒可用于制备灭活的流感病毒疫苗(参见例如，fodor,e.等rescueofinfluenzaavirusfromrecombinantdna.j.virol.,1999,73,9679-9682；通过引用并入本文)。不同的重组流感病毒，各自包含不同的重组流感结构多肽，也可单独生产，然后合并成组合/混合物。重组流感病毒组合/混合物可用作流感疫苗以引发针对流感病毒的保护性免疫反应；例如，它们可作为活减毒或裂解灭活疫苗的组分给予。

因此，在一些实施方案中，本发明提供了包含由优化的核苷酸序列编码的流感结构多肽的灭活的流感疫苗(或其组合或混合物)，其中疫苗包含三种类型的抗原制备物之一：灭活的全病毒、其中纯化的病毒颗粒被去垢剂或其它试剂破坏以溶解脂质被膜的亚-病毒体(“裂解”疫苗)或纯化的流感结构多肽(“亚单位”疫苗)。在一些实施方案中，病毒可通过用甲醛、β-丙内酯、醚、含去垢剂的醚(例如tween-80^®)、十六烷基三甲基溴化铵(ctab)和tritonn101、脱氧胆酸钠和三(正丁基)磷酸酯处理灭活。灭活可在澄清尿囊液(来自蛋中生产的病毒)之后或之前发生；病毒体通过离心分离和纯化(nicholson等编辑,1998,textbookofinfluenza,blackwellscience,malden,ma；通过引用并入本文)。为了评价疫苗的效能，可使用单向辐射免疫扩散(srd)试验(schild等,1975,bull.worldhealthorgan.,52:43-50&223-31；mostow等,1975,j.clin.microbiol.,2:531；其二者通过引用并入本文)。

在一些实施方案中，用于疫苗的流感病毒在蛋中，例如在含胚鸡蛋中生长，在该情况下收获的材料是尿囊液。或者，或另外，流感病毒或由优化的核苷酸序列编码的流感结构多肽可自使用组织培养以生长病毒的任何方法生产。用于生长病毒或另外重组生产工程改造的流感结构多肽的合适的细胞基底包括例如cho细胞、犬肾细胞例如mdck或来自mdck的克隆的细胞、mdck-样细胞、猴肾细胞例如agmk细胞，包括vero细胞，培养的上皮细胞作为连续细胞系，293t细胞、bk-21细胞、cv-1细胞或为疫苗目的合适于生产流感病毒的任何其它哺乳动物细胞类型(包括上呼吸道上皮细胞)，其容易获自商业来源(例如，atcc,rockville,md.)。合适的细胞基底还包括人细胞，例如mrc-5细胞。合适的细胞基底不限于细胞系；还包括例如原代细胞例如鸡胚成纤维细胞。

制备药物组合物的方法

本文还提供了制备流感疫苗组合物的方法，所述方法包括：

a)通过用一组表达载体转染哺乳动物细胞产生种子病毒，所述表达载体中的一种或多种包含编码工程改造的流感结构蛋白的优化的核苷酸序列；

b)收获种子病毒；

c)用种子病毒感染蛋或哺乳动物细胞以生产传染性流感病毒；

d)在蛋或哺乳动物细胞中繁殖后收获传染性流感病毒；

e)纯化收获的传染性流感病毒；

d)任选地灭活纯化的病毒；和

e)混合纯化的病毒与药学上可接受的载体。

在一些实施方案中，表达载体是wo2014/019990和美国申请号14/419,235(美国公开号2015-0191703a1)中描述的那些，其通过引用以其整体结合到本文中；在一些实施方案中，载体包含wo2014/019990中描述的重组盒。

在一些实施方案中，所述一组表达载体包含：允许表达至少编码流感pb1、pb2、pa和np蛋白的mrna的表达载体，和允许表达至少流感pb1、pb2、pa、np、m、ns、ha和navrna或相应的crna的表达载体。所述一组表达载体的表达允许(i)形成包含流感vrna的核糖核蛋白复合物(rnp)，和(ii)在所述转染的细胞中产生传染性流感病毒。在特定的实施方案中允许表达编码流感pb1、pb2、pa和np蛋白的mrna的表达载体包含四种不同的单向质粒，每种质粒包含在结合rna聚合酶ii的启动子的控制下与编码选自pb1、pb2、pa和np流感蛋白的四种不同的蛋白之一的mrna互补的cdna，和允许表达流感pb1、pb2、pa、np、m、ns、ha和navrna或相应的crna的表达载体包含八种不同的单向质粒，每种质粒包含在结合rna聚合酶i的启动子的控制下与选自所述pb1、pb2、pa、np、m、ns、ha和na流感vrna的八种不同的vrna之一或与相应的crna互补的cdna。在一些实施方案中，包含在结合rna聚合酶i的启动子的控制下与所述流感pb1、pb2、pa、np、m、ns、ha和navrna之一(例如，包含本文所述的优化的核苷酸序列的cdna)或相应的crna互补的cdna的每种质粒，通过克隆所述cdna序列至载体获得，所述载体在5'至3'方向上包含：a)结合rna聚合酶i或t7rna聚合酶的启动子；b)重组盒，其在5'至3'方向上包含：

-第一限制性酶的反向互补识别序列，所述限制性酶的切割位点在其识别序列外和产生粘性末端；

-第二限制性酶的限制性位点，所述限制性酶的切割位点在其识别序列内；

-第三限制性酶的限制性位点，所述限制性酶的切割位点在其识别序列内；和

-所述第一限制性酶的识别序列，所述限制性酶的切割位点在其识别序列外和产生粘性末端；其中所述第二和第三限制性酶是不同的；和

c)终止子序列。在特定的实施方案中，当启动子结合rna聚合酶i时，所述终止子序列是肝炎δ核酶序列，和当启动子结合t7rna聚合酶时，所述终止子序列是t7聚合酶终止子序列。

纯化可以是简短的，可限于在总体上澄清收获的传染性病毒后，通过离心来浓缩病毒的步骤。纯化可以补充有例如通过蔗糖密度梯度(ep07760362)进行的离心步骤。也可进行色谱方法以纯化病毒。因此获得纯化的全病毒的悬浮液，其可进一步处理以得到最终的疫苗组合物。纯化的病毒悬浮液还可经历后续的处理。因此获得流感病毒来源的产物。病毒悬浮液可根据本领域技术人员众所周知的方法，使用去垢剂或液体溶剂进行片段化，以制造例如，基于片段化或裂解的病毒、的疫苗、病毒颗粒(virosome)或包含工程改造的流感病毒结构蛋白的亚单位疫苗。从纯化的病毒获得的片段化或裂解的病毒、包含工程改造的流感结构蛋白的病毒颗粒和包含工程改造的流感结构蛋白的亚单位疫苗被认为是流感病毒来源的产物。

最终的疫苗组合物可由全灭活的流感病毒或减毒流感病毒构成。病毒悬浮液的灭活通过常规方式，使用β-丙内酯(e.budowsky等1991,vaccine,9:319-325；1991,vaccine,9:398-402；1993,vaccine,11:343-348)、乙烯亚胺或衍生物(d.king1991,aviandis.35:505-514)或甲醛溶液(ep07760362)进行。病毒的灭活可在纯化步骤之前或之后进行。

最终的疫苗组合物通常与药学上可接受的载体一起配制。疫苗组合物还可包含一种或多种佐剂。例如，明矾、铝盐(baylor等,2002,vaccine,20:s18；通过引用并入本文)和单磷酰基脂质a(mpl；ribi等,1986,immunologyandimmunopharmacologyofbacterialendotoxins,plenumpubl.corp.,ny,p.407；通过引用并入本文)可用作人疫苗中的佐剂。或者，或另外，新的化合物当前正作为人疫苗中的佐剂进行试验，例如mf59(参见例如，ott等,“mf59—designandevaluationofasafeandpotentadjuvantforhumanvaccines”，vaccinedesign:thesubunitandadjuvantapproach(powell,m.f.和newman,m.j编辑)plenumpress,newyork,1995,pp.277-296；通过引用并入本文)；cpg寡脱氧核苷酸(odn)佐剂例如cpg7909(cooper等,2004,vaccine,22:3136；通过引用并入本文)；单磷酰基脂质a(mpl)佐剂和脂质a模拟物，包括as04(didierlaurent,a.m.等,j.immunol.,2009,183:6186-6197；通过引用并入本文)，单磷酰基脂质a(mpl,gsk)和吡喃葡糖基脂质agla(immunedesigncorporation,idc)；af03(klucker,m.f.等,j.pharmsci.,2012,101:4490-4500；通过引用并入本文)；tlr-3配体聚肌苷酸:聚胞苷酸[poly(i:c)]；tlr9佐剂例如ic31(riedl,k.等,vaccine,2008,26:3461-3468；通过引用并入本文)；咪唑并喹啉(用作tlr-7/8激动剂的双环有机分子)例如咪喹莫特(r837)或瑞喹莫德(r848)；皂苷例如qs21(ghochikyan等,2006,vaccine,24:2275；通过引用并入本文)，iscomatrix佐剂(duewell,p.,等,j.immunol,2011,187:55-63；通过引用并入本文)和matrix-m™(novavax)。

另外，本领域已知一些佐剂提高流感疫苗的免疫原性，例如聚[二(羧酸合苯氧基)膦腈](pccp；payne等,1998,vaccine,16:92；通过引用并入本文)、干扰素-γ(cao等,1992,vaccine,10:238；通过引用并入本文)、嵌段共聚物p1205(crl1005；katz等,2000,vaccine,.18:2177；通过引用并入本文)、白介素-2(il-2；mbwuike等,1990,vaccine,8:347；通过引用并入本文)和聚甲基丙烯酸甲酯(pmma；kreuter等,1981,j.pharm.sci.,70:367；通过引用并入本文)。

参考以下实施例将更全面地理解本发明。所有文献引文通过引用结合到本文中。

实施例

实施例1–p1、x6和x1cobra的核苷酸序列优化

产生编码工程改造的流感结构蛋白的优化的核苷酸序列的方法使用p1(seqidno:4)、x6(seqidno:5)和x1(seqidno:7)cobra实施。在未优化编码cobra的核苷酸序列的情况下，在反求遗传学系统中很少至没有病毒拯救是可能的。对于各cobra，产生两个优化的核苷酸序列：一个按照图1的步骤1-4获得，和一个按照图1的步骤1-5获得。

更具体地，对于p1、x6和x1cobra的每一个，通过反向翻译cobra氨基酸序列，比较反向翻译的核苷酸序列与流感序列的数据库，和根据图1的步骤3a和3b所示的规则优化反向翻译的核苷酸序列，获得优化的核苷酸序列。优化的核苷酸序列还通过添加来自高-效价拯救毒株a/puertorico/8/34(“pr8”)的5’和3’非编码区进行修饰。这些优化的核苷酸序列在图5中被称为“密码子偏好”。

在pr8的情况下，使用以下5’-和3’-末端核苷酸序列：

pr85’末端序列

agcaaaagcaggggaaaataaaaacaaccaaaatgaaggcaaacctactggtcctgttatgtgcacttgcagctgcagatgca(seqidno:23)

pr83’末端序列

cagattctggcgatctactcaactgtcgccagttcactggtgcttttggtctccctgggggcaatcagtttctggatgtgttctaatggatctttgcagtgcagaatatgcatctgagattagaatttcagagatatgaggaaaaacacccttgtttct(seqidno:24)

“密码子偏好”优化的序列还通过将某些编码区交换为其它流感ha蛋白进一步修饰。优化的x6cobra序列通过将5’末端的信号肽交换为来自cobrax3序列(参见表12)或野生型流感病毒(a/wellington/24/2000)的信号肽进一步修饰。更具体地，编码x6cobra的信号肽的序列交换为编码来自a/wellington/24/2000毒株(seqidno:25)或x3cobra(seqidno:26)的信号肽的以下核苷酸序列。编码序列用斜体表示。

5’a/wellington/24/2000末端序列：

atgaaagtaaaactactggtcctgttatgtacatttacagctacatatgc(seqidno:25)

5’x3cobra末端序列：

atggaagcaagactactagtcctgttatgtgcatttgcagctacaaatgcagacacaatatgtataggctaccatgcg(seqidno:26)

优化的x1cobra序列通过交换5’和3’末端与cobraa1或pr8的5’和3’末端进一步修饰。更具体地，编码信号肽和在外结构域的初始部分中的5’核苷酸序列与相应的cobraa1序列交换。这种交换在信号肽中，而非在外结构域区中引入变化(即，在外结构域中仅进行密码子变化)。3’末端区，其编码跨膜结构域和胞质尾，也与来自cobraa1的相应序列交换。交换的5’和3’cobraa1末端序列分别对应于seqidno:27和seqidno:28。编码序列用斜体表示。

5’cobraa1末端序列：

atgaaagcaaaactactagttctgttatgtgcatttacagctacatatgcagacacaatatgtataggctaccatgcgaacaactcaaccgacactgttgacacagtacttgaaaagaacgtgacagtgacacactctgtcaacctacttgaggacagtcacaacggaaaactatgtcgactaaaaggaatagccccactacaattgggt(seqidno:27)

3’cobraa1末端序列：

aagaacaatgccaaagaaataggaaacgggtgttttgaattctaccacaagtgtaacaatgaatgcatggaaagtgtgaaaaatggaacttatgactatccaaaatattccgaggaatcaaagttaaacagggaaaaaattgatggagtgaaattggaatcaatgggagtctatcagattctggcgatctactcaactgtcgccagttcactggtgcttttggtctccctgggggcaatcagcttctggatgtgttctaatgggtctttgcagtgtagaatatgcatctgagattagaatttcagagatatgaggaaaaacacccttgtttct(seqidno:28)

编码cobrax1的信号肽(但不包括外结构域的任何部分)的5’核苷酸序列也与相应的pr8序列交换。这种交换不引入氨基酸序列中的任何变化。pr8的3’末端区，其编码跨膜结构域和胞质尾，也与来自cobrax1的相应3’序列交换。交换的5’和3’pr8末端序列分别对应于seqidno:29和seqidno:30。编码序列用斜体表示。

5’pr8末端序列：

agcaaaagcaggggaaaataaaaacaaccaaaatgaaggcaaacctactggtcctgttatgtgcacttgcagctgcagatgc(seqidno:29)

3’pr8末端序列：

acagattctggcgatctactcaactgtcgccagttcactggtgcttttggtctccctgggggcaatcagtttctggatgtgttctaatggatctttgcagtgcagaatatgcatctgagattagaatttcagagatatgaggaaaaacacccttgtttct(seqidno:30)

优化的p1cobra序列通过交换5’和3’末端与cobraa1序列(见表12)进一步修饰。更具体地，编码cobrap1的信号肽的5’核苷酸序列与相应的cobraa1序列交换，导致信号肽中的氨基酸改变。来自cobrap1的3’核苷酸序列也与来自cobraa1的相应序列(包括编码跨膜区的序列)交换。然而，这种交换不在3’末端引入任何氨基酸改变。交换的5’和3’cobraa1末端序列分别对应于seqidno:31和seqidno:32。编码序列用斜体表示。

5’cobraa1末端序列：

atgaaagcaaaactactagttctgttatgtgcatttacagctacatatgcagacacaatatgtataggctaccatgcgaacaactcaaccgacactgttgacacagtacttgaaaagaacgtgacagtgacacactctgtcaacctacttgaggacagtcacaacggaaaacta(seqidno:31)

3’cobraa1末端序列：

gtgaaaaatggaacttatgactatccaaaatattccgaggaatcaaagttaaacagggaaaaaattgatggagtgaaattggaatcaatgggagtctatcagattctggcgatctactcaactgtcgccagttcactggtgcttttggtctccctgggggcaatcagcttctggatgtgttctaatgggtctttgcagtgtagaatatgcatctgagattagaatttcagagatatgaggaaaaacacccttgtttct(seqidno:32)

这些另外优化的x6、x1和p1序列在下表16中鉴定为“密码子偏好+交换(末端或信号肽)”。所有优化的核苷酸序列通过同源重组至反求遗传学质粒(“优化的ha质粒”)中进行克隆。由于在大肠杆菌中的不稳定性，x6密码子偏好序列不能克隆至反求遗传学质粒。病毒拯救或回收通过用优化的ha质粒与na质粒(编码各种na蛋白，如下表16所示)和pr8骨架质粒共-转染至混合的293ft/mdck细胞培养物，在反求遗传学系统中测试。通过测量细胞培养上清液中的ha活性，监测病毒回收至多10天。ha效价使用火鸡红细胞测定和计算为具有ha活性的最高病毒悬浮液稀释度的倒数。回收的病毒自细胞培养物收获，和用于接种10日龄含胚鸡蛋，接种后72小时测定病毒生长。

所有疫苗候选物作为含至少一种用这种新方法产生的优化的核苷酸序列的病毒成功地回收，如下表16中概述的。在大多数情况下，自细胞培养物回收的病毒也能够在蛋中以高效价(>1x10⁶pfu/ml)生长，从而显示有前景作为在蛋中制造疫苗的种子。cobrap1密码子偏好序列(没有另外的5’或3’末端交换)能够支持在细胞培养物和蛋中的病毒拯救，其中测试了一些而非所有na。因此，在某些情况下，密码子偏好序列足以支持病毒拯救。对于测试的所有na，交换优化的p1序列的末端导致病毒拯救。对于x1和x6优化的序列，仅密码子偏好不足以支持病毒拯救。然而，交换密码子偏好序列的5’和3’编码序列(例如，信号肽、跨膜和/或胞质结构域)，允许在细胞培养物和蛋二者中的病毒回收。

表16

实施例2–流感bsmartha的核苷酸序列优化

产生编码工程改造的流感结构蛋白的优化的核苷酸序列的方法使用以下流感bsmartha多肽实施：br08_co1(seqidno:75)、br08_do2(seqidno:76)、br08_do3(seqidno:77)、pan90_do2(seqidno:78)和ma12_ra82(seqidno:79)。对于各smartha，产生两个优化的核苷酸序列：一个按照图1的步骤1-3b获得，和一个按照图1的步骤1-5获得。

更具体地，对于br08_co1、br08_do2、br08_do3、pan90_do2和ma12_ra82smartha的每一个，通过反向翻译smartha氨基酸序列，比较反向翻译的核苷酸序列与流感序列的数据库，和根据图1的步骤3a和3b所示的规则优化反向翻译的核苷酸序列，获得优化的核苷酸序列。优化的核苷酸序列还通过添加来自成功拯救毒株b/memphis/12/1997的5’和3’非编码区进行修饰。

在b/memphis/12/1997的情况下，使用以下5’-和3’-末端核苷酸序列：

5’b/memphis/12/1997末端序列

agcagaagcagagcattttctaatatccacaaaatg(seqidno:103)

3’b/memphis/12/1997末端序列

taaggaaaattaagccctgtattttcctttattgtagtgcttgtttgcttgttatcattacaaagaaacgttattgaaaaatgctcttgttactact(seqidno:104)

优化的br08_co1smartha序列通过交换5’和3’末端与b/brisbane/60/2008的5’和3’末端进一步修饰。更具体地，编码信号肽和在外结构域的初始部分中的5’核苷酸序列与相应的b/brisbane/60/2008序列交换。这种交换不引入信号肽或外结构域区中的变化(即，仅进行密码子改变)。3’末端区，其编码外结构域的一部分、跨膜结构域和胞质尾，也与来自b/brisbane/60/2008的相应序列交换，而不引入蛋白编码序列的变化。在冲突的情况下，使用原始密码子。交换的5’和3’b/brisbane/60/2008末端序列分别对应于seqidno:105和seqidno:106：

5’b/brisbane/60/2008末端序列：

atgaaggcaataattgtactactcatggtagtaacatccaatgcagatcgaatctgcactgggataacatcgtca(seqidno:105)

3’b/brisbane/60/2008末端序列：

gcaggagaattttctctccccacctttgattcactgaatattactgctgcatctttaaatgacgatggattggataatcatactatactgctttactactcaactgctgcctccagtttggctgtaacactgatgatagctatctttgttgtttatatggtctccagagacaatgtttcttgctccatctgtctataa(seqidno:106)

优化的br08_d02smartha序列通过交换5’和3’末端与b/brisbane/60/2008的5’和3’末端进一步修饰。更具体地，编码信号肽和在外结构域的初始部分中的5’核苷酸序列与相应的b/brisbane/60/2008序列交换。这种交换不引入信号肽或外结构域区中的变化(即，仅进行密码子改变)。3’末端区，其编码外结构域的一部分、跨膜结构域和胞质尾，也与来自b/brisbane/60/2008的相应序列交换，而不引入蛋白编码序列中的变化。在冲突的情况下，使用原始密码子。交换的5’和3’b/brisbane/60/2008末端序列分别对应于seqidno:105和seqidno:106。

优化的br08_do3smartha序列通过交换5’和3’末端与b/brisbane/60/2008的5’和3’末端进一步修饰。更具体地，编码信号肽和在外结构域的初始部分中的5’核苷酸序列与相应b/brisbane/60/2008序列交换。这种交换不引入信号肽或外结构域区中的变化(即，仅进行密码子改变)。3’末端区，其编码外结构域的一部分、跨膜结构域和胞质尾，也与来自b/brisbane/60/2008的相应序列交换，而不引入蛋白编码序列中的变化。在冲突的情况下，使用原始密码子。交换的5’和3’b/brisbane/60/2008末端序列分别对应于seqidno:105和seqidno:106。

优化的pan90_do2smartha序列通过交换5’和3’末端与b/brisbane/60/2008的5’和3’末端进一步修饰。更具体地，编码信号肽和在外结构域的初始部分中的5’核苷酸序列与相应的b/brisbane/60/2008序列交换。这种交换不引入信号肽或外结构域区中的变化(即，仅进行密码子变化)。3’末端区，其编码外结构域的一部分、跨膜结构域和胞质尾，也与来自b/brisbane/60/2008的相应序列交换，而不引入蛋白编码序列中的变化。在冲突的情况下，使用原始密码子。交换的5’和3’b/brisbane/60/2008末端序列分别对应于seqidno:105和seqidno:106。

优化的ma12_ra82smartha序列通过交换5’和3’末端与b/brisbane/60/2008的5’和3’末端进一步修饰。更具体地，编码信号肽和在外结构域的初始部分中的5’核苷酸序列与相应的b/brisbane/60/2008序列交换。这种交换不引入信号肽或外结构域区中的变化(即，仅进行密码子改变)。3’末端区，其编码外结构域的一部分、跨膜结构域和胞质尾，也与来自b/brisbane/60/2008的相应序列交换，而不引入蛋白编码序列中的变化。在冲突的情况下，使用原始密码子。交换的5’和3’b/brisbane/60/2008末端序列分别对应于seqidno:105和seqidno:106。

尚未测试用源自流感bsmartha的优化的核酸的病毒回收实验。

实施例3–h3cobra的核苷酸序列优化

产生编码工程改造的流感结构蛋白的优化的核苷酸序列的方法使用6种不同的h3cobra实施。对于各h3cobraha多肽，按照图1的步骤1-3b，获得优化的核苷酸序列。对于这些多肽，不进行任选步骤4和5。

更具体地，对于各h3cobra，通过反向翻译h3cobra氨基酸序列，比较反向翻译的核苷酸序列与流感序列的数据库，和根据图1的步骤3a和3b所示的规则优化反向翻译的核苷酸序列，获得优化的核苷酸序列。

优化的h3cobra核苷酸序列通过同源重组至反求遗传学质粒(“优化的ha质粒”)进行克隆。病毒拯救或回收在反求遗传学系统中通过用优化的ha质粒以及na质粒和pr8骨架质粒共-转染混合的293ft/mdck细胞培养物进行测试。通过测量细胞培养上清液的ha活性，监测病毒回收至多10天。ha效价使用火鸡红细胞测定，和计算为具有ha活性的最高病毒悬浮液稀释度的倒数。自细胞培养物收获回收的病毒，和用于接种10日龄含胚鸡蛋，接种后72小时测定病毒生长。

源自h3cobra多肽的所有优化的核苷酸序列作为含至少一种用这种新方法产生的优化的核苷酸序列的病毒成功地回收。

等同方案

在权利要求中使用序数术语，例如“第一”、“第二”、“第三”等修饰要求保护的要素，本身不意味着一个要求保护的要素的超过另一个的任何优先度、先后次序或顺序，或进行方法行为的时间顺序，而是仅用作区分具有某一名称的一个要求保护的要素与具有相同名称(如果不使用序数术语)的另一个要素的标记，以区分要求保护的要素。

在说明书和权利要求书中，本文使用的冠词“一个”和“一种”，除非有相反的清楚指示，应理解为包括复数指代物。如果一个、超过一个或所有组成员存在于、用于或以其它方式相关于给定的产物或过程，在一组的一个或多个成员之间包括“或”的权利要求或描述被视为得到满足，除非有相反的指示或以其它方式从上下文显而易见。本发明包括其中准确的一个组成员存在于、用于或以其它方式相关于给定的产物或过程的实施方案。本发明还包括其中超过一个或全部组成员存在于、用于或以其它方式相关于给定的产物或过程的实施方案。此外，应理解，本发明包括其中来自一个或多个所列权利要求的一个或多个限制、要素、条款、描述性术语等被引入从属于同一基本权利要求(或者，相关的任何其它权利要求)的另一个权利要求的所有变化、组合和排列，除非另外指明或除非对本领域普通技术人员而言产生矛盾或不一致是显而易见的。当要素作为列表存在时，(例如，马库什组或类似形式)，应理解也公开了该要素的每个亚组，和任何要素可从该组中除去。应理解，一般而言，在本发明或本发明的各方面涉及包含具体的要素、特征等时，本发明或本发明的各方面的某些实施方案由这样的要素、特征等组成，或基本上由其组成。为简明的目的，这些实施方案在每种情况下在本文中未以如此多的词语明确阐明。还应理解，本发明的任何实施方案或方面可明确地从权利要求中排除，不管说明书中是否叙述了明确排除。本文提及的描述发明背景和提供关于其实施的另外细节的出版物、网站和其它参考资料通过引用并入本文。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：T.D.斯特鲁格内尔;G.科特斯-加西亚;T.阿勒范蒂斯
技术所有人：圣诺菲·帕斯图尔公司
我是此专利的发明人

上一篇：汽车轮毂配重块的制作方法
上一篇：一种汽车轮毂涂装用螺栓孔防护塞的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
2、张老师：1.探索新型氧化还原酶结构-功能关系，电催化反应机制 2.酶电催化导向的酶分子改造 3.纳米材料、生物功能多肽对酶-电极体系的影响4. 生物电化学传感和生物电合成体系的设计与应用。
3、豆老师：1.环境纳米材料及挥发性有机化合物（VOCs） 2.CO污染物的催化氧化 3.低温等离子体 4.吸脱附等控制技术
4、赵老师：1.高分子材料改性及加工技术 2.微孔及过滤材料 3.环境友好高分子材料
5、邬老师：1.高分子材料的共混与复合 2.涉及材料功能化及结构与性能的研究；高分子热稳定剂的研发
如您是高校老师，可以点此联系我们加入专家库。