本申请要求2015年6月9日提交的美国临时专利申请号62/172,949的权益,并依赖于其提交日,其整个公开内容通过引用结合到本文中。
序列表
本申请包含序列表,其已经以ascii格式电子提交和通过引用以其整体结合到本文中。所述ascii副本,创建于2016年6月9日,名称为0171.0008-pct_sl.txt,和大小为351,204字节。
背景
流感具有大流行、流行、再现和爆发的长的持续历史。疫苗已经是对流感最有效的防御。然而,年复一年设计和制造诱导毒株-特异性免疫的疫苗的工作已经是困难的,因为流感持续引起跨越全球的重大健康问题。认为年度流感流行在整个世界上每年产生3-5百万个严重疾病病例,和250,000-500,000例死亡。此外,当前上市的流感疫苗必须根据在即将来临的季节中在人群中将出现的预测毒株每年更新。
流感病毒是正粘病毒科的成员。流感病毒存在三个亚型,称为流感a、流感b和流感c。流感病毒体包含分段的反义rna基因组。在流感a病毒的情况下,rna基因组编码以下蛋白:血凝素(ha)、神经氨酸酶(na)、基质(ml)、质子离子通道蛋白(m2)、核蛋白(np)、聚合酶碱性蛋白1(pbl)、聚合酶碱性蛋白2(pb2)、聚合酶酸性蛋白(pa)和非结构蛋白2(ns2)。ha、na、ml和m2是膜相关蛋白,而np、pbl、pb2、pa和ns2是核衣壳相关蛋白。ml蛋白是在流感颗粒中最丰富的蛋白。ha和na蛋白是被膜糖蛋白,负责病毒附着和病毒颗粒侵入细胞。特别地,ha将流感病毒结合至在它们的膜的表面结构上包含唾液酸的细胞。
ha和na蛋白二者是对于病毒中和以及保护性免疫的主要免疫显性表位的来源,使得它们是预防性流感疫苗的重要组分。流感病毒的产生和回收是在功能性流感疫苗候选物的评价中的重要步骤。
负链rna病毒例如流感病毒的反求遗传学,已经允许遗传操纵病毒基因组以产生新的病毒,其可用作活的减毒疫苗或表达异源蛋白的载体。反求遗传学技术允许产生完全来自克隆的病毒cdna的传染性流感病毒(fodor等,1999jvirol,73(11):9679-9682)。
根据能够诱导表达8种vrna和转录所需的至少聚合酶蛋白复合物和核蛋白(np)的一组质粒,开发不同的系统。聚合酶蛋白复合物和np也可通过4种另外的质粒的转染或通过使用含允许vrna和mrna二者分别通过rna聚合酶i(pol1)和ii(pol2)合成的双向启动子的质粒(jackson等,2011,jgenvirol,92(pt1):1-17)表达。转染的质粒的总数量可从16(neuman等,1999,procnatlacadsciusa,96(16):9345-9350)或12(fodor等,1999,jvirol,73(11):9679-9682)至8(hoffmann等,2002,vaccine,20(25-26):3165-3170)而改变,取决于策略是单向或双向,和从3(neumann等,2005,procnatlacadsciusa,102(46):16825-16829)至1(zhang等,2009,jvirol,83(18):9296-9303)而变化,如果质粒编码数个vrna。
最广泛使用的流感疫苗包含已被化学或物理灭活的病毒,或已被减毒的活病毒。这样的疫苗的实例是裂解的流感灭活疫苗(iiv)或活的减毒疫苗(laiv)。制造这些疫苗通常需要在含胚鸡蛋中回收和繁殖疫苗病毒。然而,人流感的分离株在蛋中非常无效地生长,和分离的病毒经常需要通过一个过程进行适应,所述过程通常包括它们在蛋中的盲目传代和它们以高产量的实验室病毒的重配,以增加病毒/抗原产量。两种不同的技术可用于产生重配株流感病毒:经典重配和反求遗传学。流感a病毒的经典重配包括用疫苗病毒和高产量供体病毒(在大多数情况下为pr8)共-感染蛋。得到的重配株子代必须经过一个选择过程以鉴定具有合适的抗原组合和高产量生长表型的重配株病毒。该选择过程是麻烦的,不能保证将获得这样的重配株。与经典重配相反,反求遗传学得到具有预定义组合的基因或基因群的重配株病毒,不需要进一步选择。此外,反求遗传学可在缺少病毒分离株的情况下使用,和其是允许在疫苗病毒中引入靶基因修饰的唯一技术。事实上,反求遗传学在流感h5n1疫苗病毒的开发中已经是关键的,其中多-碱基切割位点必须从ha基因中除去。
简述
本发明的实施方案基于以下发现:包含天然不存在的工程改造的流感蛋白的流感疫苗病毒的产生,可仅通过反求遗传学实现。尽管大多数反求遗传学应用依赖于pcr或rt-pcr扩增来自预存在的病毒的模板,但dna合成的最新进展允许在天然病毒模板不存在的情况下生产病毒。wimmer等(2009)naturebiotech.27(12):1163-1172;wimmer等(2011)annu.rev.microbiol.65:583-609。在流感病毒的情况下,使用合成的dna和反求遗传学技术能够重建1918流感病毒(tumpey等(2005)science310:77-80.)和显示有希望加速响应于流感大流行的候选疫苗病毒的生产(dormitzer等(2013)scitrmed5(185):1-12;verity等(2011)influenzaj.101-109)。此外,候选疫苗病毒可包含经设计为比天然抗原更好的免疫原的合理工程改造的流感蛋白,例如公开于pct/us2016/035594、wo2013/122827和美国公开号2015/0044247、2015/0017196、2014/0147459、2014/0127248和2013/0183342和美国临时申请62/345,502或62/344,862的工程改造的流感蛋白,其全部通过引用结合到本文中。
使用反求遗传学和合成的dna技术以生产表达工程改造的蛋白的流感病毒的一个重要的限制是需要编码这样的工程改造的蛋白的核苷酸序列。类似地,不能回收或拯救表达工程改造的蛋白的传染性流感病毒,可能部分地归因于缺少用于有效病毒包装的最佳序列的核苷酸序列。流感结构蛋白(例如,ha和na)根据其特定的密码子使用,也可产生较高的病毒效价。增加的效价对于使病毒拯救的成功率最大化和在疫苗制造期间提高病毒产量,可能是重要的。
本发明特别提供了产生编码工程改造的流感结构蛋白的优化的核苷酸序列的方法。还提供了使用优化的核苷酸序列以生产传染性流感病毒的方法,例如在反求遗传学系统中。
在一些实施方案中,产生编码工程改造的流感结构蛋白的优化的核苷酸序列的方法包括:
a)提供工程改造的流感结构蛋白的氨基酸序列;
b)反向翻译氨基酸序列以产生第一核苷酸序列;
c)鉴定第二核苷酸序列,其编码与工程改造的流感结构蛋白共有高度的序列同一性的流感结构蛋白;
d)在第一和第二核苷酸序列中的密码子编码相同的氨基酸的每个位置处,改变第一核苷酸序列中的密码子以匹配来自第二核苷酸序列的密码子;和
e)在第一和第二核苷酸序列中的密码子编码不同的氨基酸的每个位置处,改变第一核苷酸序列中的密码子以匹配基于结构蛋白-特异性流感密码子使用偏好的密码子,从而产生优化的核苷酸序列。
在一些实施方案中,与工程改造的流感结构蛋白共有高度的序列同一性的流感结构蛋白是野生型流感结构蛋白。在一些实施方案中,流感结构蛋白与工程改造的流感结构蛋白共有最高度的序列同一性(即,最近匹配)。在一些实施方案中,第二核苷酸序列编码野生型形式的流感结构蛋白和从包含流感核苷酸序列的公开可得的数据库鉴定。
在一些实施方案中,工程改造的流感结构蛋白包含选自seqidno:4、seqidno:5、seqidno:6和seqidno:7、seqidno:8、seqidno:9、seqidno:10、seqidno:11、seqidno:12、seqidno:13、seqidno:14、seqidno:15、seqidno:16、seqidno:17、seqidno:18、seqidno:75、seqidno:76、seqidno:77、seqidno:78、seqidno:79、seqidno:80、seqidno:81、seqidno:82、seqidno:83、seqidno:84、seqidno:85、seqidno:86、seqidno:87、seqidno:88、seqidno:89、seqidno:90、seqidno:91、seqidno:92、seqidno:93、seqidno:94、seqidno:95、seqidno:96、seqidno:97、seqidno:98、seqidno:99、seqidno:100、seqidno:101和seqidno:102的氨基酸序列。
在一些实施方案中,所述方法进一步包括添加来自高效价拯救毒株(例如,a/puertorico/8/34;“pr8”)的5’和3’非编码序列至优化的核苷酸序列。在一些实施方案中,5’非编码序列包含seqidno:23的核苷酸序列和/或3’非编码序列包含seqidno:24的核苷酸序列,或其中5’非编码序列包含seqidno:103的核苷酸序列和/或3’非编码序列包含seqidno:104的核苷酸序列。
在一些实施方案中,所述方法进一步包括将在优化的核苷酸序列中编码信号肽的核苷酸序列交换为编码来自高效价拯救毒株(例如,pr8)的信号肽的核苷酸序列。在一些实施方案中,所述方法进一步包括将编码跨膜结构域的核苷酸序列交换为编码来自高效价拯救毒株(例如,pr8)的跨膜结构域的核苷酸序列。在一些实施方案中,所述方法进一步包括将编码胞质结构域的核苷酸序列交换为编码来自高效价拯救毒株(例如,pr8)的胞质结构域的核苷酸序列。
在一些实施方案中,由优化的核苷酸序列编码的工程改造的流感结构蛋白的氨基酸序列与由第一核苷酸序列编码的氨基酸序列相同。
在一些实施方案中,优化的核苷酸序列进一步包含编码信号肽的核苷酸序列、编码跨膜结构域的核苷酸序列和/或编码胞质结构域的核苷酸序列。
在一些实施方案中,工程改造的流感结构蛋白是流感a型血凝素蛋白。在一些实施方案中,血凝素蛋白是选自h1、h2、h3、h4、h5、h6、h7、h8、h9、h10、h11、h12、h13、h14、h15、h16和h17的亚型。
在一些实施方案中,结构蛋白-特异性流感密码子使用偏好描述于表1-10。
在一些实施方案中,反向翻译氨基酸序列以产生第一核苷酸序列包括使用对流感病毒特异性的密码子使用表。
还提供了表达通过本文描述的方法产生的优化的核苷酸序列的方法,所述方法包括:
将优化的核苷酸序列插入表达质粒;和
表达优化的核苷酸序列以产生工程改造的流感结构蛋白。
还提供了用于生产传染性流感病毒的反求遗传学方法,所述方法包括:
用一种或多种表达载体转染哺乳动物细胞,其中所述一种或多种表达载体包含通过本文描述的方法产生的编码工程改造的流感结构蛋白的优化的核苷酸序列和b)编码来自一种或多种供体病毒的流感蛋白的核苷酸序列;
生产传染性流感病毒。
在一些实施方案中,所述一种或多种供体病毒选自a/puertorico/8/34(h1n1)(pr8)、b/lee/40和b/panama/45/90。
在一些实施方案中,传染性流感病毒是传染性重配株流感病毒,其包含一种或多种供体病毒的遗传物质。在一些实施方案中,传染性重配株流感病毒是嵌合的。
在一些实施方案中,所述方法进一步包括:
收获传染性流感病毒;和
用收获的流感病毒感染蛋或哺乳动物细胞。
还提供了制备流感疫苗组合物的方法,所述方法包括:
通过用一组表达载体转染哺乳动物细胞产生种子病毒,所述表达载体中的一种或多种包含通过本文描述的方法产生的编码工程改造的流感结构蛋白的优化的核苷酸序列;
收获种子病毒;和
通过用种子病毒感染蛋或哺乳动物细胞生产传染性流感病毒;
在蛋或哺乳动物细胞中繁殖后收获传染性流感病毒;
纯化收获的传染性流感病毒;
任选地灭活纯化的病毒;和
混合纯化的病毒与药学上可接受的载体。
还提供了在受试者中诱导对一种或多种流感多肽的免疫反应的方法,所述方法包括给予本文所述的流感疫苗组合物。
还提供了编码工程改造的流感结构蛋白的优化的核苷酸序列,其中优化的核苷酸序列通过本文所述的方法获得。根据以下参考附图进行的详细描述,本发明的前述和其它目标、特征和优点将变得更加显而易见。
附图简述
本文包括的附图,其包含以下各图,仅为举例说明的目的,而非限制。
图1显示了根据本发明的某些实施方案,产生编码工程改造的流感蛋白的优化核苷酸序列的方法流程图(以出现的顺序,分别为seqidnos33-37)。
图2显示了数种流感a亚型h1n1毒株的ha蛋白序列的带注释的比对(以出现的顺序,分别为seqidnos38-42)。图2中例举的毒株的ha蛋白的全长序列提供在序列表中,如下:a/texas/36/1991(seqidno:65);a/new_caledonia/20/1999(seqidno:66);a/solomon_islands/3/2006(seqidno:67);a/brisbane/59/2007(seqidno:68);和a/california/07/2009(seqidno:69)。
图3显示了数种流感a亚型h3n2毒株的ha蛋白序列的带注释的比对(以出现的顺序,分别为seqidnos43-47)。图3中例举的毒株的ha蛋白的全长序列提供在序列表中,如下:a/wisconsin/67/2005(seqidno:70);a/victoria/361/2011(seqidno:71);a/texas/50/2012(seqidno:72);a/perth/16/2009(seqidno:73);和a/hong_kong/1/1968(seqidno:74)。
图4显示了a型流感血凝素的14个亚型和另外的亚型h3序列的代表的跨膜区(氨基酸残基183-212)的比对的氨基酸序列(以出现的顺序,分别为seqidnos48-57和57-64)。使用常用的单字母氨基酸代码。引入虚线以使序列比对最大化。粗体的字母是指在所有不同的亚型的50%或更多的序列中保守的残基,包括几个保守置换,如正文中所述。残基使用x:31ha2编号系统进行编号。
定义
为了更加容易地理解本发明,下文首先定义了某些术语。对于以下术语和其它术语的另外的定义在说明书全文中阐述。
佐剂:如本文所用的,术语“佐剂”是指非特异性地提高对抗原的免疫反应的物质或媒介。佐剂可包括其上吸附抗原的矿物(明矾、铝盐、氢氧化铝或磷酸盐)的悬浮液;或油包水乳液,其中抗原溶液在矿物油中乳化(例如,弗氏不完全佐剂),有时其中包括杀死的分支杆菌(弗氏完全佐剂)以进一步提高抗原性。免疫刺激性寡核苷酸(例如包括cpg基序的那些)也可用作佐剂(例如,参见美国专利号6,194,388;6,207,646;6,214,806;6,218,371;6,239,116;6,339,068;6,406,705;和6,429,199)。佐剂还包括生物学分子,例如脂质和共刺激分子。实例性的生物学佐剂包括as04(didierlaurent,a.m.等,j.immunol.,2009,183:6186-6197)、il-2、rantes、gm-csf、tnf-α、ifn-γ、g-csf、lfa-3、cd72、b7-1、b7-2、ox-40l和41bbl。
给予:如本文所用的,“给予”受试者组合物意指给予、施用或使组合物接触受试者。给予可通过许多途径的任一种实现,例如局部、口服、皮下、肌内、腹膜内、静脉内、鞘内和皮内。
抗体:如本文所用的,术语“抗体”是指包括足以赋予与特定的靶抗原的特异性结合的标准免疫球蛋白序列元件的多肽。在一些实施方案中,如本文所用的,术语“抗体”还指一种或多种“抗体片段”,其包括完整抗体的一部分,例如抗体的抗原结合区或可变区。“抗体片段”的实例包括fab、fab’、f(ab’)2和fv片段;三抗体;四抗体;线性抗体;单链抗体分子;和在从抗体片段形成的多特异性抗体中包括的包含cdr的部分。本领域技术人员将认识到,术语“抗体片段”不意指和不限于任何具体的产生方式。抗体片段可通过使用任何合适的方法生产,包括但不限于切割完整抗体、化学合成、重组生产等。如本领域已知的,天然产生的完整抗体为大约150kd四聚体试剂,其包含两个相同的重链多肽(各自约50kd)和两个相同的轻链多肽(各自约25kd),它们彼此缔合成通常所谓的“y-形”结构。每个重链包含至少四个结构域(各自约110个氨基酸长)–氨基端可变(vh)结构域(位于y结构的尖端),接着三个恒定结构域:ch1、ch2和羧基端ch3(位于y茎的基部)。短区域,称为“开关”,连接重链可变区和恒定区。“铰链”连接ch2和ch3结构域与抗体的剩余部分。该铰链区中的两个二硫键将完整抗体中的两个重链多肽彼此连接。每个轻链包含两个结构域–氨基端可变(vl)结构域,接着羧基端恒定(cl)结构域,彼此通过另一个“开关”隔开。完整抗体四聚体包含两个重链-轻链二聚体,其中重链和轻链通过单个二硫键彼此连接;两个另外的二硫键将重链铰链区彼此连接,使得二聚体彼此连接和形成四聚体。天然产生的抗体还被糖基化,通常在ch2结构域上。天然抗体的每个结构域具有特征为呈扁平的反向平行β桶的“免疫球蛋白折叠”的结构,其自彼此相对组装的两个β折叠片(例如,3-、4-或5-链折叠片)形成。每个可变结构域包含三个超变环,称为“互补决定区”(cdr1、cdr2和cdr3)和四个稍微不变的“框架”区(fr1、fr2、fr3和fr4)。当天然抗体折叠时,fr区形成β片,其提供结构域的结构框架,和来自重链和轻链二者的cdr环区在三维空间中位于一起,使得它们产生位于y结构尖端的单个超变抗原结合位点。在抗体多肽链中的氨基酸序列比较定义了两个轻链(κ和λ)类型、数个重链(例如,μ,γ,α,ε,δ)类型和某些重链亚类(α1,α2,γ1,γ2,γ3,和γ4)。抗体类型(iga[包括iga1,iga2],igd,ige,igg[包括igg1,igg2,igg3,igg4],igm)根据所用的重链序列的类型来定义。为本发明的目的,在某些实施方案中,包括足够的天然抗体中存在的免疫球蛋白结构域序列的任何多肽或多肽复合物可被称为和/或用作“抗体”,无论这样的多肽是天然生产的(例如,通过生物体与抗原反应产生),还是通过重组改造、化学合成或其它人造系统或方法生产的。在一些实施方案中,抗体是单克隆的;在一些实施方案中,抗体是多克隆的。在一些实施方案中,抗体具有小鼠、兔、灵长类或人抗体特有的恒定区序列。在一些实施方案中,抗体序列元件是人源化的、灵长类化的、嵌合的等,如本领域已知的。此外,将理解本文所用的术语“抗体”包括(除非另外指明或从上下文清楚)可以在合适的实施方案中指用于以可选方式呈现捕获抗体结构和功能特征的任何本领域已知的或开发的构建体或形式。例如,在一些实施方案中,该术语可指双特异性或其它多特异性(例如,zybodies等)抗体、smallmodularimmunopharmaceuticals(“smips™”)、单链抗体、骆驼抗体和/或抗体片段。在一些实施方案中,抗体可缺少天然生产时将具有的共价修饰(例如,连接聚糖)。在一些实施方案中,抗体可包含共价修饰(例如,连接聚糖、有效负载[例如,可检测部分、治疗部分、催化部分等]或其它附属基团[例如,聚乙二醇等])。
抗原:如本文所用的,术语“抗原”是指引起免疫反应的试剂;和/或(ii)当暴露于或给予生物体时,被t细胞受体结合(例如,通过mhc分子呈递时)或结合至抗体(例如,通过b细胞产生)的试剂。在一些实施方案中,抗原在生物体中引起体液应答(例如,包括产生抗原特异性抗体);或者,或另外,在一些实施方案中,抗原在生物体中引起细胞应答(例如,包括t-细胞,其受体与抗原特异性相互作用)。本领域技术人员将理解,具体的抗原可在目标生物(例如,小鼠、兔、灵长类、人)的一个或数个成员中引起免疫反应,但不在目标生物物种的所有成员中如此。在一些实施方案中,抗原在目标生物物种的至少约25%,30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%的成员中引起免疫反应。在一些实施方案中,抗原结合抗体和/或t细胞受体,和在生物体中可能诱导或可能不诱导特定的生理学反应。在一些实施方案中,例如,抗原可体外结合抗体和/或t细胞受体,无论这样的相互作用是否体内发生。在一些实施方案中,抗原与特异性体液或细胞免疫的产物(包括通过异源免疫原诱导的那些)反应。在所公开的组合物和方法的一些实施方案中,流感hah5n1蛋白是抗原。
大约:如本文所用的,术语“大约”或“约”,在应用于一个或多个目标值时,是指类似于陈述的参考值的值。在某些实施方案中,术语“大约”或“约”是指在任一方向(大于或小于)上落入陈述的参考值的25%,20%,19%,18%,17%,16%,15%,14%,13%,12%,11%,10%,9%,8%,7%,6%,5%,4%,3%,2%,1%或更少内的值的范围,除非另外指明或从上下文另外显而易见(除了这样的数值会超过可能值的100%之外)。
结合:将理解,如本文所用的术语“结合”通常是指在两个或更多个实体之间的非共价缔合。“直接”结合包括在实体或部分之间物理接触;间接结合包括通过与一个或多个中间实体物理接触的物理相互作用。在两个或更多个实体之间的结合可在各种情况的任一种下评价,包括分离的情况下或在更复杂的系统的情况下(例如,共价或以其它方式与载体实体缔合,和/或在生物系统或细胞中)研究相互作用实体或部分。
广泛反应性:如本文所用的,“广泛反应性”是指蛋白序列在受试者中引起免疫反应,其足以抑制、中和或预防各种流感病毒(例如在特定亚型,例如,h1n1,h5n1,h3n2内的大多数或所有流感病毒)的感染。
载体:如本文所用的,术语“载体”是指组合物与其一起给予的稀释剂、佐剂、赋形剂或媒介。在一些实例性的实施方案中,载体可包括无菌液体,例如水和油,包括石油、动物、植物或合成来源的油,例如花生油、大豆油、矿物油、芝麻油等。在一些实施方案中,载体是或包括一个或多个固体组分。
cobra:如本文所用的,“cobra”是指计算优化的广泛反应性抗原,如描述于wo2013/122827和美国公开号2015/0044247,2015/0017196,2014/0147459,2014/0127248和2013/0183342,其全部通过引用以其整体结合到本文中。cobra是工程改造的ha蛋白,其引起对流感病毒的广泛反应性免疫反应。cobra的氨基酸序列根据选择的流感分离株,通过一系列ha蛋白比对和随后产生共有序列设计,和这些ha氨基酸序列不存在于天然流感毒株中。
密码子-优化的:如本文所用的,“密码子-优化的”核酸序列是指已被改变使得核酸序列的翻译和得到的蛋白的表达对于特定的表达系统得到改进或优化的核酸序列。“密码子-优化的”核酸序列优选编码与“密码子-优化的”核酸序列所基于的未-优化的母体序列相同的蛋白。例如,核酸序列可以对于在哺乳动物细胞(例如,cho细胞、人细胞、小鼠细胞等)、细菌细胞(例如,大肠杆菌)、昆虫细胞、酵母细胞或植物细胞中表达是“密码子-优化的”。核酸也可以经密码子-优化以允许或提高在反求遗传学系统中传染性流感病毒的表达。
可比较的:术语“可比较的”,如本文所用,是指两种或更多种试剂、实体、情况、条件设置等,其可能彼此不相同,但足够类似以允许之间比较,以致根据观察到的差异或类似性可合理地得出结论。本领域普通技术人员在上下文中将理解,在任何给定的环境下对于被视为可比较的两种或更多种这样的试剂、实体、情况、条件设置等需要的相同程度。
测定:本文描述的许多方法包括“测定”的步骤。本领域普通技术人员在阅读本说明书时将理解,这样的“测定”可利用本领域技术人员可获得的各种技术的任一种,包括例如本文明确提及的特定技术。在一些实施方案中,测定包括操作物理样品。在一些实施方案中,测定包括考虑和/或处理数据或信息,例如利用计算机或适合进行相关分析的其它处理装置。在一些实施方案中,测定包括从来源接收相关信息和/或材料。在一些实施方案中,测定包括比较样品或实体的一个或多个特征与可比较的参比。
工程改造的:如本文所用的术语“工程改造的”描述了这样的多肽,其氨基酸序列通过人为设计和/或其存在和生产需要人工的活动。例如,工程改造的ha多肽具有不同于天然流感分离株中存在的ha多肽的氨基酸序列的氨基酸序列。在一些实施方案中,工程改造的ha多肽具有不同于ncbi数据库中包括的ha多肽的氨基酸序列的氨基酸序列。
表位:如本文所用的,术语“表位”包括免疫球蛋白(例如,抗体或受体)结合组分整体或部分地特异性识别的任何部分。在一些实施方案中,表位包含抗原上的多个化学原子或基团。在一些实施方案中,当抗原呈现相关的三维构象时,这样的化学原子或基团是表面暴露的。在一些实施方案中,当抗原呈现这样的构象时,这样的化学原子或基团物理上彼此空间接近。在一些实施方案中,当抗原呈现可选构象(例如,线性化)时,至少一些这样的化学原子或基团是物理上彼此分开的。
赋形剂:如本文所用的,术语“赋形剂”是指可包括在药物组合物中例如以提供或促进所需一致性或稳定效果的非治疗剂。合适的药物赋形剂包括例如,淀粉、葡萄糖、乳糖、蔗糖、明胶、麦芽、稻米、面粉、白垩、硅胶、硬质酸钠、甘油单硬脂酸酯、滑石粉、氯化钠、脱脂奶粉、甘油、丙二醇、水、乙醇等。
表达:术语“表达”当本文提及核酸使用时是指一个或多个以下事件:(1)产生dna模板的rna转录物(例如,通过转录);(2)加工rna转录物(例如,通过剪接、编辑、5’帽形成和/或3’端形成);(3)翻译rna为多肽;和/或(4)翻译后修饰多肽。
融合蛋白:如本文所用的,术语“融合蛋白”是指由自编码两种不同的(例如,异源)蛋白的至少一部分的核酸序列工程改造的核酸序列编码的蛋白。技术人员毫无疑问地知道,为了产生融合蛋白,核酸序经连接,使得得到的读出不包含内部终止密码子。在一些实施方案中,本文所述的融合蛋白包括流感ha多肽或其片段。
血凝素(ha)多肽:如本文所用的,术语“血凝素多肽”(或“ha多肽’)是指氨基酸序列包括ha的至少一个特征性序列的多肽。来自流感分离株的各种ha序列是本领域已知的;事实上,国家生物技术信息中心(ncbi)维护了数据库(通过网站ncbi.nlm.nih.gov/genomes/flu/获得),其在提交本申请时包括至少9796个ha序列。本领域普通技术人员,参考该数据库,可容易地鉴定ha多肽一般特有的序列,和/或具体ha多肽(例如,h1,h2,h3,h4,h5,h6,h7,h8,h9,h10,h11,h12,h13,h14,h15,h16或h17多肽;或介导特定宿主例如,禽、骆驼、犬、猫、灵猫、环境、马、人、豹、貂、小鼠、海豹、stonemartin、猪、虎、鲸等的感染的ha)特有的序列。例如,在一些实施方案中,ha多肽包括流感病毒的天然分离株中存在的ha蛋白的约残基97和约185、约324和约340、约96和约100和/或约130和约230之间存在的一个或多个特征性序列元件。
h1n1ha多肽:“h1n1ha多肽”,在本文中使用时,是指氨基酸序列包括h1n1特有并区分h1n1与其它ha亚型的至少一个序列元件的ha多肽。代表性的序列元件可通过比对确定,如本领域技术人员将理解的。
h5n1ha多肽:“h5n1ha多肽”,在本文中使用时,是指氨基酸序列包括h5n1特有并区分h5n1与其它ha亚型的至少一个序列元件的ha多肽。代表性的序列元件可通过比对确定,如本领域技术人员将理解的。
高效价拯救毒株:“高效价拯救毒株”是指可使用反求遗传学方法以高效价(至少1x106pfu/ml)生产的任何流感毒株。高效价拯救毒株是本领域已知的,和包括但不限于a/puertorico/8/34(pr8)。
宿主:术语“宿主”本文用于指其中存在目的多肽的系统(例如,细胞、生物体等)。在一些实施方案中,宿主是对用特定的传染剂感染易感的系统。在一些实施方案中,宿主是表达特定的目的多肽的系统。
宿主细胞:如本文所用的,词语“宿主细胞”是指外源dna(重组或其它方式)所引入的细胞。例如,宿主细胞可用于通过标准重组技术生产本文描述的优化的流感血凝素多肽。技术人员在阅读本公开内容时将理解,这样的术语不仅是指具体的主题细胞,而且指这样的细胞的子代。因为在随后产生中由于突变或环境影响,某些修饰可存在,这样的子代实际上可能与亲本细胞不相同,但仍包括在本文使用的术语"宿主细胞"的范围内。在一些实施方案中,宿主细胞包括合适于表达外源dna(例如,重组核酸序列)的任何原核和真核细胞。实例性的细胞包括原核细胞和真核细胞(单细胞或多细胞)、细菌细胞(例如,大肠杆菌、芽胞杆菌、链霉菌等的菌株)、分枝杆菌细胞、真菌细胞、酵母细胞(例如,酿酒酵母、稷酒酵母、巴斯德毕赤酵母、产甲醇毕赤酵母等)、植物细胞、昆虫细胞(例如,sf-9、sf-21、杆状病毒感染的昆虫细胞、粉纹夜蛾等)、非-人动物细胞、人细胞或融合细胞例如杂交瘤或四源杂交瘤的那些。在一些实施方案中,细胞是人、猴、猿、仓鼠、大鼠或小鼠细胞。在一些实施方案中,细胞是真核的,和选自以下细胞:cho(例如,chok1,dxb-11cho,veggie-cho)、cos(例如,cos-7)、视网膜细胞、vero、cv1、肾(例如,hek293,293ebna,msr293,mdck,hak,bhk)、hela、hepg2、wi38、mrc5、colo205、hb8065、hl-60(例如,bhk21)、jurkat、daudi、a431(上皮)、cv-1、u937、3t3、l细胞、c127细胞、sp2/0、ns-0、mmt060562、sertoli细胞、brl3a细胞、ht1080细胞、骨髓瘤细胞、肿瘤细胞和源自前述细胞的细胞系。在一些实施方案中,细胞包含一个或多个病毒基因,例如,表达病毒基因的视网膜细胞(例如,per.c6™细胞)。
免疫反应:如本文所用的,术语“免疫反应”是指免疫系统的细胞,例如b细胞、t细胞、树突细胞、巨噬细胞或多形核细胞对刺激物例如抗原或疫苗的反应。免疫反应可包括参与宿主防御反应的任何身体细胞,包括例如分泌干扰素或细胞因子的上皮细胞。免疫反应包括但不限于先天性和/或适应性免疫反应。如本文所用的,保护性免疫反应是指保护受试者免于感染(防止感染或防止发生与感染有关的疾病)的免疫反应。测量免疫反应的方法是本领域已知的,和包括例如,测量淋巴细胞(例如b或t细胞;例如通过血细胞凝集抑制测定)的增殖和/或活性、细胞因子或趋化因子的分泌、炎症、抗体生产等。
免疫原:如本文所用的,术语“免疫原”是指在合适的条件下能够刺激免疫反应,例如在动物中产生抗体或t细胞反应的化合物、组合物或物质,包括注射至动物或被动物吸收的组合物。如本文所用的,“免疫原性组合物”是可给予的组合物,其包含免疫原(例如ha多肽)。“免疫原性组合物”包括例如,疫苗。如本文所用的,“免疫”意指使受试者受到保护免于传染性疾病,例如通过接种。
传染性流感病毒:所谓“传染性流感病毒”是指能够复制进入可容许的细胞的流感病毒。确定病毒是否具有传染性的方法是本领域技术人员众所周知的。例如,确定病毒是否具有传染性可使用tcid50测定法进行。tcid5o是通过在可容许的细胞(例如mdck或vero细胞)上引入递增稀释度的样品和使用spearman-karber统计学方法确定诱导50%的可容许细胞的感染的终点稀释度,评价传染性病毒在样品(例如,感染的细胞培养上清液或感染的尿囊液)中的量的方法。
体外:如本文所用的,术语“体外”是指在人工环境中,例如在试管或反应容器中、在细胞培养物中等,而不是在多细胞生物体内发生的事件。
体内:如本文所用的,术语“体内”是指在多细胞生物体内,例如在人和非-人动物中发生的事件。在基于细胞的系统的情况下,该术语可用于指在活细胞内发生的事件(与例如体外系统相反)。
流感病毒蛋白:"流感病毒蛋白",如本文所用的,表示对于a型流感的pb1、pb2、pa、ha、np、na、m1、m2、ns1和ns2/nep蛋白,对于b型流感的pb1、pb2、pa、ha、np、na、nb、m1、bm2、ns1和ns2/nep蛋白,或对于c型流感的pb1、pb2、pa、hef、np、m1、m1\cm2、ns1和ns2/nep。
流感结构蛋白:如本文所用的,术语“流感结构蛋白”是指与流感核衣壳、基质和被膜有关的任何蛋白,包括表面糖蛋白、血凝素(ha)和神经氨酸酶(na),和基质(ml)蛋白和质子离子通道蛋白(m2),和其功能或抗原片段。相反地,流感病毒的非-结构蛋白包括形成核糖核蛋白复合物所需要的流感病毒蛋白。"形成核糖核蛋白复合物所需要的流感病毒蛋白"是指对于a、b或c型流感病毒的蛋白pa、pb1、pb2和np。非-结构蛋白还包括ns1和ns2。
流感疫苗:如本文所用的,术语“流感疫苗”是指能够刺激免疫反应的免疫原性组合物,其经给予用于预防、阻止、改善或治疗流感病毒感染。流感疫苗可包括例如,减毒或杀灭流感病毒、其亚单位制剂(即,裂解-灭活的疫苗)、病毒-样颗粒(vlp)和/或抗原多肽(例如,本文所述的计算优化的血凝素)或源自它们的dna,或这样的免疫原性材料的任何重组形式。本文所述的流感疫苗可任选地包含一种或多种佐剂。
分离的:如本文所用的,术语“分离的”是指以下的物质和/或实体:(1)已与当初始产生(无论是天然和/或实验环境下)时其伴随的至少一些组分分离,和/或(2)通过人工设计、产生、制备和/或制造。分离的物质和/或实体可与它们初始伴随的约10%,约20%,约30%,约40%,约50%,约60%,约70%,约80%,约90%,约91%,约92%,约93%,约94%,约95%,约96%,约97%,约98%,约99%或超过约99%的其它组分分离。在一些实施方案中,分离的试剂是约80%,约85%,约90%,约91%,约92%,约93%,约94%,约95%,约96%,约97%,约98%,约99%或超过约99%纯的。如本文所用的,如果物质基本上不含其它组分,则是“纯的”。在一些实施方案中,如本领域技术人员将理解的,物质在已与某些其它组分,例如一种或多种载体或赋形剂(例如,缓冲液、溶剂、水等)组合后,可仍被视为“分离的”或甚至“纯的”;在这样的实施方案中,在不包括这样的载体或赋形剂的情况下计算物质的百分比分离或纯度。仅给出一个实例,在一些实施方案中,天然存在的生物聚合物例如多肽或多核苷酸被视为是“分离的”,当a)根据其起源或来源,与在自然中在天然状态下伴随其的一些或所有组分不关联;b)基本上不含与在自然中产生其的物种相同的物种的其它多肽或核酸;c)通过不属于在自然中产生其的物种的细胞或其它表达系统表达,或以其它方式与来自不属于在自然中产生其的物种的细胞或其它表达系统的组分关联。因此,例如,在一些实施方案中,化学合成的或在不同于自然中产生其的细胞系统的细胞系统中合成的多肽被视为"分离的"多肽。备选地或另外地,在一些实施方案中,在已与a)天然与其关联;和/或b)当初始产生时与其关联的其它组分分离的方面来说,已经受一种或多种纯化技术的多肽可被视为“分离的”多肽。
核酸:如本文所用的,词语“核酸”在其最广泛的意义上是指被掺入或可被掺入寡核苷酸链的任何化合物和/或物质。在一些实施方案中,核酸是通过磷酸二酯键被掺入或可被掺入寡核苷酸链的化合物和/或物质。从上下文清楚的是,在一些实施方案中,“核酸”是指单个核酸残基(例如,核苷酸和/或核苷);在一些实施方案中,“核酸”是指包含单个核酸残基的寡核苷酸链。在一些实施方案中,“核酸”是或包含rna;在一些实施方案中,“核酸”是或包含dna。在一些实施方案中,核酸是一个或多个天然核酸残基,包含一个或多个天然核酸残基或由其组成。在一些实施方案中,核酸是一个或多个核酸类似物,包含一个或多个核酸类似物或由其组成。在一些实施方案中,核酸类似物不同于核酸之处在于其不利用磷酸二酯骨架。例如,在一些实施方案中,核酸是一个或多个“肽核酸”,包含一个或多个“肽核酸”或由其组成,所述“肽核酸”是本领域已知的,和在骨架中具有肽键而非磷酸二酯键,被认为在本发明的范围内。备选地或另外,在一些实施方案中,核酸具有一个或多个硫代磷酸酯和/或5’-n-亚氨基磷酸酯键,而非磷酸二酯键。在一些实施方案中,核酸是一个或多个天然核苷(例如,腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷),包含一个或多个天然核苷或由其组成。在一些实施方案中,核酸是一个或多个核苷类似物(例如,2-氨基腺苷、2-硫代胸苷、肌苷、吡咯并-嘧啶、3-甲基腺苷、5-甲基胞苷、c-5丙炔基-胞苷、c-5丙炔基-尿苷、2-氨基腺苷、c5-溴尿苷、c5-氟尿苷、c5-碘尿苷、c5-丙炔基-尿苷、c5-丙炔基-胞苷、c5-甲基胞苷、2-氨基腺苷、7-脱氮腺苷、7-脱氮鸟苷、8-氧代腺苷、8-氧代鸟苷、o(6)-甲基鸟嘌呤、2-硫代胞苷、甲基化碱基、嵌入碱基和其组合),包含一个或多个核苷类似物或由其组成。在一些实施方案中,与天然核酸中的那些相比,核酸包含一个或多个修饰的糖(例如,2’-氟核糖、核糖、2’-脱氧核糖、阿拉伯糖和己糖)。在一些实施方案中,核酸具有编码功能性基因产物例如rna或蛋白的核苷酸序列。在一些实施方案中,核酸包括一个或多个内含子。在一些实施方案中,核酸通过自天然来源分离、根据互补模板(体内或体外)通过聚合的酶促合成、在重组细胞或系统中复制和化学合成中的一种或多种制备。在一些实施方案中,核酸长度是至少3,4,5,6,7,8,9,10,15,20,25,30,35,40,45,50,55,60,65,70,75,80,85,90,95,100,110,120,130,140,150,160,170,180,190,20,225,250,275,300,325,350,375,400,425,450,475,500,600,700,800,900,1000,1500,2000,2500,3000,3500,4000,4500,5000或更多个残基。在一些实施方案中,核酸是单链的;在一些实施方案中,核酸是双链的。在一些实施方案中,核酸具有包含编码多肽或与编码多肽的序列互补的至少一个元件的核苷酸序列。在一些实施方案中,核酸具有酶促活性。
可操作连接:如本文所用的,词语“可操作连接”是指其中描述的组分处于允许它们以它们预期的方式发挥功能的关系中的并置。控制序列"可操作连接"至编码序列,以这样的方式连接,使得编码序列的表达在与控制序列相容的条件下实现。"可操作连接"的序列包括与目的基因邻近的表达控制序列和反向或隔开一段距离起作用以控制目的基因的表达控制序列二者。如本文所用的术语"表达控制序列"是指实现它们所连接的编码序列的表达和加工所必需的多核苷酸序列。表达控制序列包括合适的转录起始、终止、启动子和增强子序列;有效的rna加工信号,例如剪接和多腺苷酸化信号;稳定细胞质mrna的序列;增强翻译效率的序列(即,kozak共有序列);增强蛋白稳定性的序列;和需要时,增强蛋白分泌的序列。这样的控制序列的性质根据宿主生物体而不同。例如,在原核生物中,这样的控制序列通常包括启动子、核糖体结合位点和转录终止序列,而在真核生物中,通常这样的控制序列包括启动子和转录终止序列。术语"控制序列"意欲包括其存在是表达和加工所必需的组分,和也可包括其存在是有利的另外组分,例如前导序列和融合配偶体序列。
爆发:如本文所用的,流感病毒“爆发”是指在给定年份来自单一国家内的病毒分离株的合集。
大流行毒株:“大流行”流感毒株是已经引起或由能力引起人群的大流行感染的流感毒株。在一些实施方案中,大流行毒株已引起大流行感染。在一些实施方案中,这样的大流行感染包括跨越多个地域的流行感染;在一些实施方案中,大流行感染包括跨越彼此分开(例如,通过山脉、水体、作为不同大陆的一部分等)使得感染通常不在它们之间通过的地域的感染。
可容许的细胞:所谓的“可容许的细胞”是指允许流感病毒侵入所述细胞和实现其完全复制周期直至新的传染性病毒产生的细胞。高度可容许的细胞是流感病毒主动复制和生产大量的传染性病毒的细胞。
药学上可接受的媒介:如本文所用的,术语“药学上可接受的载体”是指任何溶剂、分散介质、填料等,通常用于药物和疫苗制剂以提高活性剂的稳定性、无菌性和可递送性,其在人中不产生任何副反应,例如过敏反应。赋形剂根据选择的药物形式、给药方法和途径进行选择。合适的赋形剂和与药物制剂有关的要求描述于remington'spharmaceuticalsciences(19thedition,a.r.gennaro,ed.,mackpublishingco.,easton,pa(1995)),其代表了本领域的参考著作。药学上可接受的赋形剂的实例是水、磷酸盐缓冲盐水溶液、0.3%甘氨酸溶液。
多肽:一般而言,“多肽”是一串通过肽键彼此连接的至少两个氨基酸。在一些实施方案中,多肽可包括至少3-5个氨基酸,其各自通过至少一个肽键彼此连接。本领域普通技术人员将理解,任选地,多肽有时包括“非天然”的氨基酸或其它实体,其仍能够整合至多肽链中。在一些实施方案中,术语“多肽”用于指特定功能类型的多肽,例如ha多肽等。在一些实施方案中,有用的多肽可包含亲本多肽的片段(例如,表位)或由其组成。在一些实施方案中,有用的多肽可包含多个(例如,两个、三个、四个等)片段(例如表位)或由其组成,其每一个相对于彼此以与目的多肽中存在的不同的空间排列存在于相同的亲本多肽中(例如,在亲本多肽中直接连接的片段可在目的多肽中在空间上分开,或反之亦然;和/或片段可以与亲本多肽不同的顺序存在于目的多肽中),使得目的多肽是其亲本多肽的衍生物。或者,在一些实施方案中,有用的多肽可包含多个(例如,两个、三个、四个等)片段(例如表位)或由其组成,其每一个存在于与目的多肽不同的亲本多肽中(例如,源于不同的亲本多肽的片段,和/或片段可以与亲本多肽不同的顺序存在于目的多肽中),使得目的多肽是其亲本多肽的衍生物。
预防:术语“预防”,如本文所用的,是指预防、避免疾病表现、延迟发作和/或降低特定疾病、病症或病况(例如,感染,例如流感病毒感染)的一个或多个症状的频率和/或严重性。在一些实施方案中,预防基于群体进行评价,以致如果在对疾病、病症或病况易感的群体中在疾病、病症或病况的一个或多个症状的发生、频率和/或强度方面观察到统计学显著降低,则试剂被认为“预防”特定疾病、病症或病况。
纯的:如本文所用的,如果试剂或实体基本上不含其它组分,则其是“纯的”。例如,包含超过约90%的特定试剂或实体的制剂通常被认为是纯的制剂。在一些实施方案中,试剂或实体是至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%纯的。
重配株病毒:术语“重配株病毒”表示包含来自于至少两种供体病毒的遗传物质的组合的遗传物质的病毒。如本文所用的,该术语可描述包含来自超过一种亲本毒株的部分的任何流感病毒,不管病毒通过经典重配株重组还是反求遗传学制成。当重配株病毒用于制备流感疫苗时,其遗传物质通常至少包含来自季节性或大流行病毒(或其工程改造的形式)的ha和na基因,而其它基因(骨架基因)来自一种或几种其它供体病毒,该其它供体病毒针对其在用于制造流感疫苗的生产基质(例如含胚鸡蛋的尿囊腔或可容许的细胞系)上容易生长和/或对人具有较少或无病原性的能力而选择。作为骨架基因的“提供者”的供体病毒的实例包括a/puertorico/8/34(h1n1)(a/pr/8/34)、b/lee/40和/或b/panama/45/90病毒。
受体-结合位点(rbs):如本文所用的,术语“受体-结合位点”或“rbs”包含流感ha多肽的头部区的连续或非连续的氨基酸残基,其包括参与直接结合靶细胞受体蛋白上的唾液酸的氨基酸。构成流感ha多肽的“受体-结合位点”或“rbs”的氨基酸残基可根据与唾液酸类似物复合的ha多肽的晶体结构,和鉴定与类似物一定接近度内的氨基酸残基来描述,或可参考来自特定病毒株(例如,a/newcaledonia/20/99或a/california/07/2009)的ha多肽序列进行描述。因此,在一些实施方案中,本文所述的工程改造的ha多肽的“受体-结合位点”或“rbs”可使用参考ha多肽序列确定。在一些实施方案中,本文所述的工程改造的ha多肽的“受体-结合位点”或“rbs”可使用与人和禽受体类似物(例如lsta,lstc)复合的ha多肽序列的晶体结构确定。与lstc复合的ha多肽序列的实例性的参考晶体结构包括a/puertorico/8/1934(h1n1)pdb|1rvz。
重组:如本文所用的,术语“重组”意欲指通过重组方式设计、工程改造、制备、表达、产生或分离的多肽(例如,本文所述的ha多肽),例如使用转染至宿主细胞的重组表达载体表达的多肽、自重组的组合多肽文库分离的多肽,或通过任何其它方式(包括剪接多个选择的序列元件)制备、表达、产生或分离的多肽。在一些实施方案中,一个或多个这样的选择序列元件天然存在。在一些实施方案中,一个或多个这样的选择序列元件用计算机设计。在一些实施方案中,一个或多个这样的选择序列元件自已知序列元件的诱变(例如,体内或体外)产生,例如来自天然或合成来源。在一些实施方案中,一个或多个这样的选择序列元件自并非天然存在于相同多肽的多个(例如,2或更多个)已知序列元件的组合产生(例如,来自两个单独的h5ha多肽的2个表位)。
参考:术语“参考”在本文通常用于描述标准或对照试剂、个体、群体、样品、序列或值,目的试剂、个体、群体、样品、序列或值与其进行比较。在一些实施方案中,参考试剂、个体、群体、样品、序列或值与目的试剂、个体、群体、样品、序列或值的测试或确定基本上同时进行测试和/或确定。在一些实施方案中,参考试剂、个体、群体、样品、序列或值是历史参考,任选地包含在有形介质中。通常,如本领域技术人员所理解的,参考试剂、个体、群体、样品、序列或值在与用于确定或表征目的试剂、个体、群体、样品、序列或值的那些可比较的条件下确定或表征。
反求遗传学:术语“反求遗传学”表示自它们的互补dna(cdna)生产传染性重配株病毒或来减毒病毒的分子方法。这些方法对于通过在不同的流感病毒之间重配vrna来生产重配株流感病毒是非常有利的。反求遗传学方法是本领域技术人员众所周知的(参见例如,neumann,g.和kawaoka,y.,virology,2001,287,243-250)。
序列同一性:氨基酸或核酸序列之间的相似性根据序列之间的相似性表示,另外称为序列同一性。序列同一性通常按照百分比同一性(或相似性或同源性)测量;百分比越高,两个序列的相似性越大。当使用标准方法比对时,给定的基因或蛋白的同源物或变体将具有相对高程度的序列同一性。用于比较的序列比对方法是本领域众所周知的。各种程序和比对算法描述于:smith和waterman,adv.appl.math.2:482,1981;needleman和wunsch,j.mol.biol.48:443,1970;pearson和lipman,proc.natl.acad.sci.u.s.a.85:2444,1988;higgins和sharp,gene73:237-244,1988;higgins和sharp,cabios5:151-153,1989;corpetetal.,nucleicacidsresearch16:10881-10890,1988;和pearson和lipman,proc.natl.acad.sci.u.s.a.85:2444,1988.altschuletal.,naturegenet.6:119-129,1994。ncbibasiclocalalignmentsearchtool(blast®)(altschuletal.,j.mol.biol.215:403-410,1990)可获自数个来源,包括nationalcenterforbiotechnologyinformation(ncbi,bethesda,md.)和互联网,与序列分析程序blastp,blastn,blastx,tblastn和tblastx结合使用。
受试者:如本文所用的,术语“受试者”意指任何哺乳动物,包括小鼠、雪貂和人。在本发明的某些实施方案中,受试者是成年、青年或幼年。在一些实施方案中,使用术语“个体”或“患者”,其意欲与“受试者”可互换。本发明还预期共同给予优化的h5n1流感ha蛋白至鸟,包括鸡和鸭和/或对鸟,包括鸡和鸭进行所述方法。
基本上:如本文所用的,术语“基本上”是指显示目的特征或性质的全部或接近全部的范围或程度的定性情况。生物学领域的普通技术人员将理解,生物学和化学现象很少(如果发生的话)达到完全和/或进行完全,或实现或避免绝对结果。因此术语“基本上”在本文用于捕获在许多生物学和化学现象中固有的完全性的潜在缺少。
转化:如本文所用的,是指外源dna引入宿主细胞的任何过程。转化可在天然或人工条件下使用本领域众所周知的各种方法发生。转化可依赖于任何已知的方法以将外源核酸序列插入原核或真核宿主细胞。在一些实施方案中,具体的转化方法根据转化的宿主细胞进行选择和可包括但不限于,病毒感染、电穿孔、交配、脂质转染。在一些实施方案中,"转化的"细胞被稳定地转化,是因为插入的dna能够作为自主复制质粒或作为宿主染色体的一部分复制。在一些实施方案中,转化的细胞在有限的时间内瞬时表达引入的核酸。
接种疫苗:如本文所用的,术语“接种疫苗”是指给予组合物(特别是共同给予本文所述的三种计算优化的h5n1ha多肽的两种或更多种)意图产生例如对引起疾病的试剂,例如流感的免疫反应。接种疫苗可在暴露于引起疾病的试剂和/或一个或多个症状发生之前、期间和/或之后给予,和在一些实施方案中,在暴露于试剂之前、期间和/或紧接之后给予。疫苗可引发预防性(阻止性)和治疗性反应二者。给予方法根据疫苗而变,但可包括接种、摄取、吸入或其它给予形式。接种可通过多种途径的任何一种递送,包括胃肠外,例如静脉内、皮下或肌内。疫苗可与佐剂一起给予以加强免疫反应。在一些实施方案中,接种疫苗包括接种组合物的在时间上合适分开的多次给予。
载体:如本文所用的,术语“载体”是指能够运输它已连接的另一种核酸的核酸分子。一种类型的载体是"质粒",其指环状双链dna环,其中可连接另外的dna区段。另一类型的载体是病毒载体,其中另外的dna区段可连接至病毒基因组。某些载体能够在它们引入的宿主细胞中自主复制(例如,具有细菌复制起点的细菌载体和游离型哺乳动物载体)。其它载体(例如,非游离型哺乳动物载体)可在引入宿主细胞时整合至宿主细胞的基因组,和从而与宿主基因组一起复制。此外,某些载体能够指导它们有效连接的基因的表达。这样的载体在文本中被称为"表达载体"。
病毒样颗粒(vlp):如本文所用的,词语“病毒样颗粒”或“vlp”是指类似于病毒但缺少任何病毒遗传物质,因此无传染性的颗粒。“病毒样颗粒”或“vlp”可通过在各种细胞培养系统中异源表达产生,所述系统包括哺乳动物细胞系、昆虫细胞系、酵母和植物细胞。此外,vlp可通过本领域已知的方法纯化。在一些实施方案中,本文所述的流感vlp包含血凝素(ha)多肽和神经氨酸酶(na)多肽。在一些实施方案中,本文所述的流感vlp包含ha多肽、na多肽和/或病毒结构多肽(例如,流感结构蛋白,例如流感m1)。在某些实施方案中,本文所述的流感vlp包含ha多肽、na多肽和/或m1多肽。在一些实施方案中,本文所述的流感vlp包含ha多肽、na多肽和/或hivgag多肽。技术人员知道,其它病毒结构蛋白可用作本文所例举的那些的备选方案。流感vlp可通过用编码ha和na蛋白,和任选hivgag蛋白的质粒转染宿主细胞(例如,哺乳动物细胞)产生。在孵育转染的细胞合适的时间以允许蛋白表达(例如大约72小时)后,vlp可自细胞培养上清液分离。在一些实施方案中,本文所述的流感vlp通过在哺乳动物细胞(例如,人细胞)中瞬时转染产生。在一些实施方案中,流感vlp通过使用一种或多种测定法进行分析。仅给出几个实例,流感vlp可针对血凝素活性、动态光散射和通过蛋白染色的血凝素含量定量进行分析。在阅读本公开内容时,其它测定法对技术人员而言是显而易见的。
vrna:所谓“vrna”是指流感病毒的反义病毒rna,其包封在核糖核蛋白复合物中。当流感病毒具有a或b型时,所述vrna是pb2、pb1、pa、ha、np、na、m和nsvrna。当流感病毒具有c型时,所述vrna是pb1、pb2、pa、hef、np、m和nsvrna。
crna:所述“crna”意指与vrna互补的正义rna中间体。一旦在核中,引入的反义病毒rna(vrna)通过引物依赖性机制被转录成信使rna(mrna)。这些mrna产物是vrna模板的不完全拷贝,并被加帽和聚腺苷酸化,不像vrna。复制通过2步过程发生。首先制备vrna的全长正义拷贝,其称为互补rna(crna),进而用作模板来生产更多的vrna。
野生型:如本领域所理解的,词语“野生型”通常是指自然中存在的正常形式的蛋白或核酸。例如,野生型ha多肽在流感病毒的天然分离株中存在。各种不同的野生型ha序列可见于ncbi流感病毒序列数据库,通过万维网ncbi.nlm.nih.gov/genomes/flu/flu可获得。
某些实施方案的详细描述
本发明不限于所述的具体方法和实验条件,因为这样的方法和条件可改变。还应理解,本文使用的术语仅为描述特定实施方案的目的,和不意图限制,除非另外指明,因为本发明的范围仅由随附的权利要求限定。
除非另外说明,本文使用的所有技术和科学术语和短语具有本领域普通技术人员通常理解的相同含义。尽管类似于或等同于本文描述的那些的任何方法和材料可用于本发明的实践或试验,但现在描述优选的方法和材料。本文提及的所有出版物通过引用结合到本文中。
标准技术可用于重组dna、寡核苷酸合成和组织培养和转化(例如,电穿孔、脂质转染(lipofection))。酶促反应和纯化技术可根据制造商的说明书或按本领域通常实行的或按本文所述的进行。前述技术和程序可通常根据本领域熟知的常规方法,和按照本说明书全文引用和论述的各种一般性和更具体的参考资料所述进行。参见例如,sambrook等molecularcloning:alaboratorymanual(2ded.,coldspringharborlaboratorypress,coldspringharbor,n.y.(1989)),其通过引用结合到本文中用于任何目的。
编码工程改造的流感蛋白的优化的核苷酸序列的产生
最新进展允许生产经设计为比天然流感蛋白更好的免疫原的合理工程改造的流感蛋白。用工程改造的流感蛋白开始,可能反向翻译工程改造的蛋白的氨基酸序列以产生编码工程改造的蛋白的核苷酸序列。核苷酸序列可在反求遗传学系统中用于促进包含修饰形式的流感结构蛋白(例如,血凝素或神经氨酸酶)的传染性流感病毒的拯救。然而,已发现,当在反求遗传学系统中使用某些工程改造的流感蛋白时,很少至没有传染性流感病毒可被拯救。不受特定理论的束缚,该现象可部分地归因于编码工程改造的流感蛋白的核苷酸序列缺少用于有效病毒包装和/或有效基因表达的最佳序列。
本文公开了产生编码工程改造的流感结构蛋白的优化的核苷酸序列的方法。优化编码工程改造的流感蛋白的核苷酸序列改进拯救或回收传染性流感病毒的可能性。还可优化病毒生长和蛋白产量。核苷酸序列可特别通过修饰序列进行优化,其通过以下进行:i)使用流感-特异性密码子使用表(特别对于流感结构蛋白例如血凝素和神经氨酸酶而导出);和/或ii)使用其它流感序列(例如,来自野生型或之前拯救的毒株)作为反向翻译的模板。
图1提供了这些方法的某些实施方案的流程图。在这些方法中,工程改造的结构蛋白的氨基酸被反向翻译为核苷酸序列,如图1的步骤1所示。序列可使用标准密码子使用表或对流感病毒特异性的密码子使用表反向翻译。这些密码子使用表是本领域已知的,或可通过比较流感序列制备。
如图1的步骤2所示,第一核苷酸序列或第一核苷酸序列的翻译用于鉴定第二核苷酸序列,其编码来自野生型病毒或之前拯救的病毒的相应的流感结构蛋白。即是说,发现第二序列的初始一轮比较使用第一核苷酸序列或其翻译的氨基酸序列(例如,针对翻译的核苷酸数据库)进行。匹配的核苷酸序列然后用于下游步骤。例如,第一核苷酸序列或第一核苷酸序列的翻译可用于检索包括流感蛋白序列或核苷酸序列的数据库,和鉴定共有高度序列同一性的核苷酸序列(例如,鉴定在野生型毒株中最近匹配的相应的结构蛋白)。序列相似性检索可使用检索工具进行,例如ncbibasiclocalalignmentsearchtool(blast®)(altschul等,j.mol.biol.215:403-410,1990),其可获自数个来源,包括nationalcenterforbiotechnologyinformation(ncbi,bethesda,md.)和fasta,其可获自数个来源,包括embl-ebi网站。
第一和第二核苷酸序列和/或其翻译共有高度的序列同一性。在某些实施方案中,第二核苷酸序列与第一核苷酸序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%或99%同一性。在某些实施方案中,由第二核苷酸序列编码的氨基酸序列与由第一核苷酸序列编码的氨基酸序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%或99%同一性。在一个实施方案中,第二核苷酸序列和/或其翻译与来自数据库的核酸或蛋白的第一核苷酸序列和/或其翻译共有最高度的序列同一性(例如,在序列同一性方面第二核苷酸序列的翻译与第一核苷酸序列的翻译最近匹配)。在某些实施方案中,第二核苷酸序列和其翻译是野生型形式的流感结构蛋白。在其它实施方案中,第二核苷酸序列和其翻译是来自能够在反求遗传学系统中拯救的流感病毒的流感结构蛋白的形式。
一旦第二核苷酸序列被鉴定,比较密码子。如图1的步骤3所示,在第一和第二核苷酸序列中的密码子编码相同的氨基酸的每个位置处,第一核苷酸序列中的密码子被改变以匹配来自第二核苷酸序列的密码子。如步骤3b所示,在第一和第二核苷酸序列中的密码子编码不同的氨基酸的每个位置处,第一核苷酸序列中的密码子被改变以匹配基于流感蛋白-特异性流感密码子使用偏好的密码子,以产生优化的核苷酸序列。
在某些实施方案中,产生编码工程改造的流感结构蛋白的优化的核苷酸序列的方法包括:
a)提供工程改造的流感结构蛋白的氨基酸序列;
b)反向翻译氨基酸序列以产生第一核苷酸序列;
c)鉴定第二核苷酸序列,其编码与第一核苷酸序列共有高度同一性的流感结构蛋白的形式(例如,来自野生型流感病毒或能够在反求遗传学系统中被拯救的流感病毒的序列);
d)在第一和第二核苷酸序列中的密码子编码相同的氨基酸的每个位置处,改变第一核苷酸序列中的密码子以匹配来自第二核苷酸序列的密码子;和
e)在第一和第二核苷酸序列中的密码子编码不同的氨基酸的每个位置处,改变第一核苷酸序列中的密码子以匹配基于结构蛋白-特异性流感密码子使用偏好的密码子,从而产生优化的核苷酸序列。
一般而言,由优化的核苷酸序列编码的工程改造的流感结构蛋白的氨基酸序列与由第一非优化的核苷酸序列编码的氨基酸序列相同。然而,相对于由第一核苷酸序列编码的氨基酸序列,在由优化的核苷酸序列编码的工程改造的流感结构蛋白的氨基酸序列中引入较小变化,同时保留在反求遗传学系统中生产传染性流感病毒的能力,在本领域技术人员的范围内。因此,在某些实施方案中,相对于由第一核苷酸序列编码的氨基酸序列,由优化的核苷酸序列编码的工程改造的流感结构蛋白的氨基酸序列具有不超过10、9、8、7、6、5、4、3、2或1个氨基酸差异。
蛋白-特异性流感密码子使用偏好可通过比较流感蛋白序列产生。可对特定的流感结构蛋白(例如,ha或na)确定密码子使用偏好。例如,已通过比较流感ha蛋白和核苷酸序列产生的实例性的蛋白-特异性流感密码子使用偏好在下文表1-5中描述,1)流感b(人),2)流感ah1n1(人),3)流感ah1n1(多),4)流感ah3n2(人),和5)流感ah3n2(多),其中“多”表示分析了来自多个动物来源(例如,人、猪和禽)的流感序列。
表1:ha流感b(人)密码子使用偏好
编码gc43.56%
第一字母gc49.80%
第二字母gc43.52%
第三字母gc37.36%
密码子aa分数频率数量
gcaa0.46231.69995258
gcca0.15710.81232492
gcga0.0594.04112143
gcta0.32222.13266508
tgcc0.78920.56661803
tgtc0.2115.51316566
gacd0.40219.19057667
gatd0.59828.55185798
gaae0.79744.055132391
gage0.20311.21633705
ttcf0.54714.28842938
tttf0.45311.84935606
ggag0.52651.266154060
ggcg0.1009.72529226
gggg0.19819.28257943
ggtg0.17617.10851411
cach0.39011.35334118
cath0.61017.73553295
atai0.55333.601100975
atci0.1167.08121278
atti0.33120.10560417
aaak0.64846.166138734
aagk0.35225.10075429
ctal0.15514.54243699
ctcl0.23121.68865174
ctgl0.15114.17942610
cttl0.15214.21542717
ttal0.14113.25739839
ttgl0.16915.81247517
atgm1.00014.68444126
aacn0.52030.63892069
aatn0.48028.30185048
ccap0.38719.70359210
cccp0.20310.33531057
ccgp0.0130.6782037
cctp0.39620.14760544
caaq0.79823.12569494
cagq0.2025.85017579
agar0.64221.92165875
aggr0.2819.59628837
cgar0.0732.4787448
cgcr0.0000.0013
cggr0.0010.02679
cgtr0.0040.123371
agcs0.1459.35728118
agts0.1449.28727907
tcas0.29518.98657056
tccs0.0815.18615585
tcgs0.0352.2686815
tcts0.30019.32558073
acat0.49841.030123299
acct0.29524.27472945
acgt0.0262.1486456
actt0.18114.95444939
gtav0.23112.20336671
gtcv0.21211.19233633
gtgv0.29515.54946725
gttv0.26213.81041500
tggw1.00011.18533613
tacy0.64116.34149106
taty0.3599.17027557
taa*0.6000.0013
tag*0.2000.0001
tga*0.2000.0001
表2:ha流感ah1n1(人)密码子使用偏好
编码gc40.67%
第一字母gc44.58%
第二字母gc38.14%
第三字母gc39.28%
密码子aa分数频率数量
gcaa0.46724.169226427
gcca0.29715.363143929
gcga0.0432.21320733
gcta0.19410.03293982
tgcc0.4159.72091067
tgtc0.58513.721128543
gacd0.50024.453229087
gatd0.50024.407228658
gaae0.68947.154441772
gage0.31121.288199442
ttcf0.59819.970187088
tttf0.40213.442125937
ggag0.35626.630249488
ggcg0.1158.60480604
gggg0.30722.980215289
ggtg0.22316.664156119
cach0.47113.772129023
cath0.52915.471144944
atai0.34420.137188659
atci0.1418.25177298
atti0.51430.077281779
aaak0.65252.096488070
aagk0.34827.746259946
ctal0.27520.519192231
ctcl0.1219.02384533
ctgl0.19614.616136931
cttl0.0352.60924441
ttal0.15211.315106003
ttgl0.22116.520154767
atgm1.00010.25596071
aacn0.37329.309274589
aatn0.62749.326462121
ccap0.48918.348171892
cccp0.2097.85873618
ccgp0.2378.88383222
cctp0.0652.42622732
caaq0.47713.241124048
cagq0.52314.528136105
agar0.74024.677231194
aggr0.2578.56180204
cgar0.0010.040372
cgcr0.0000.00770
cggr0.0010.019176
cgtr0.0020.055516
agcs0.21016.154151339
agts0.1289.83692146
tcas0.37528.788269704
tccs0.0886.76363362
tcgs0.0251.89517751
tcts0.17513.434125862
acat0.63341.718390845
acct0.0412.72425519
acgt0.0845.51951702
actt0.24215.976149669
gtav0.43726.411247437
gtcv0.1317.92574242
gtgv0.23514.199133023
gttv0.19711.905111531
tggw1.00017.600164889
tacy0.53626.101244527
taty0.46422.561211362
taa*0.6000.0016
tag*0.0000.0000
tga*0.4000.0004
表3:ha流感ah1n1(多)密码子使用偏好
编码gc40.65%
第一字母gc44.56%
第二字母gc38.20%
第三字母gc39.20%
密码子aa分数频率数量
gcaa0.46724.211252401
gcca0.29715.398160530
gcga0.0412.14722382
gcta0.19410.055104821
tgcc0.4079.53199365
tgtc0.59313.910145017
gacd0.49624.145251716
gatd0.50424.530255736
gaae0.68646.936489316
gage0.31421.435223463
ttcf0.58919.707205449
tttf0.41113.765143505
ggag0.36127.066282172
ggcg0.1158.63790040
gggg0.30222.607235689
ggtg0.22216.603173089
cach0.46913.712142953
cath0.53115.534161951
atai0.34620.196210553
atci0.1458.46588247
atti0.50929.734309981
aaak0.64951.201533784
aagk0.35127.679288564
ctal0.27620.593214690
ctcl0.1219.00393862
ctgl0.19314.432150461
cttl0.0372.78128992
ttal0.15211.343118255
ttgl0.22016.445171442
atgm1.00010.402108443
aacn0.37329.529307844
aatn0.62749.569516765
ccap0.48918.306190849
cccp0.2117.88282167
ccgp0.2268.44788060
cctp0.0742.77928971
caaq0.49013.670142513
cagq0.51014.226148315
agar0.74025.010260740
aggr0.2548.59689617
cgar0.0030.086898
cgcr0.0010.018191
cggr0.0020.052540
cgtr0.0020.054564
agcs0.21116.195168837
agts0.1269.685100965
tcas0.37628.927301572
tccs0.0876.72670119
tcgs0.0241.87019494
tcts0.17513.490140633
acat0.62641.367431265
acct0.0473.13832717
acgt0.0855.61858572
actt0.24216.004166842
gtav0.43226.042271499
gtcv0.1327.95582929
gtgv0.23814.333149425
gttv0.19811.921124277
tggw1.00017.632183817
tacy0.53526.031271385
taty0.46522.638236004
taa*0.5380.0017
tag*0.0000.0000
tga*0.4620.0016
表4:ha流感ah3n2(人)密码子使用偏好
编码gc42.15%
第一字母gc45.23%
第二字母gc39.73%
第三字母gc41.49%
密码子aa分数频率数量
gcaa0.44222.845155244
gcca0.22311.56378573
gcga0.0703.61624574
gcta0.26513.71593200
tgcc0.58313.61492511
tgtc0.4179.73666157
gacd0.49928.959196792
gatd0.50129.038197325
gaae0.57130.883209866
gage0.42923.205157687
ttcf0.65023.734161285
tttf0.35012.75486666
ggag0.42633.349226620
ggcg0.15111.79880172
gggg0.22517.639119865
ggtg0.19915.577105853
cach0.54912.08182094
cath0.4519.92567448
atai0.39730.782209179
atci0.36928.669194821
atti0.23418.160123406
aaak0.75249.034333206
aagk0.24816.196110057
ctal0.1439.98967881
ctcl0.0584.01927314
ctgl0.27919.411131909
cttl0.24417.009115585
ttal0.0704.86933088
ttgl0.20614.32897365
atgm1.00012.01381634
aacn0.40533.707229053
aatn0.59549.531336587
ccap0.31312.11082290
cccp0.2057.93853939
ccgp0.1907.34549912
cctp0.29311.34477090
caaq0.74533.793229641
cagq0.25511.58778739
agar0.51826.434179630
aggr0.29214.905101285
cgar0.1437.29949598
cgcr0.0080.3972701
cggr0.0391.98513486
cgtr0.0000.01176
agcs0.31523.589160295
agts0.14711.00974808
tcas0.29922.426152395
tccs0.0805.98340654
tcgs0.0020.121823
tcts0.15711.79580152
acat0.37823.252158007
acct0.1026.28042678
acgt0.1549.50064560
actt0.36622.543153192
gtav0.32914.41897977
gtcv0.0803.49923779
gtgv0.1948.52757947
gttv0.39717.436118482
tggw1.00017.597119580
tacy0.60021.091143320
taty0.40014.03695379
taa*0.0000.0000
tag*0.0000.0000
tga*1.0000.0001
表5:ha流感ah3n2(多)密码子使用偏好
编码gc42.18%
第一字母gc45.27%
第二字母gc39.71%
第三字母gc41.57%
密码子aa分数频率数量
gcaa0.44422.883169211
gcca0.22711.69486472
gcga0.0683.50625925
gcta0.26113.42099235
tgcc0.58813.734101558
tgtc0.4129.61671109
gacd0.50829.541218446
gatd0.49228.632211725
gaae0.57631.066229724
gage0.42422.871169124
ttcf0.65323.655174920
tttf0.34712.56992946
ggag0.42032.846242891
ggcg0.15011.72486694
gggg0.22817.797131602
ggtg0.20315.840117134
cach0.54111.98588629
cath0.45910.15375078
atai0.39630.534225794
atci0.36728.277209105
atti0.23718.259135020
aaak0.75549.021362502
aagk0.24515.906117620
ctal0.14710.25075799
ctcl0.0563.90328861
ctgl0.27819.345143055
cttl0.24216.827124435
ttal0.0724.99536940
ttgl0.20514.238105284
atgm1.00012.16389944
aacn0.41033.995251387
aatn0.59048.945361939
ccap0.31312.03288973
cccp0.2067.94158722
ccgp0.1907.29353933
cctp0.29211.22182974
caaq0.74734.087252064
cagq0.25311.52385207
agar0.52026.436195491
aggr0.28914.695108663
cgar0.1366.93351271
cgcr0.0080.3922901
cggr0.0472.37017528
cgtr0.0000.019139
agcs0.31523.616174636
agts0.14811.08081932
tcas0.29722.291164840
tccs0.0816.09045033
tcgs0.0020.1511117
tcts0.15711.80087255
acat0.37623.267172056
acct0.1096.71949687
acgt0.1539.46669997
actt0.36322.451166017
gtav0.33014.731108929
gtcv0.0843.74327682
gtgv0.1918.52463031
gttv0.39417.579129989
tggw1.00017.744131210
tacy0.59121.055155695
taty0.40914.561107675
taa*0.0000.0000
tag*0.5000.0001
tga*0.5000.0001
进一步例如,已通过比较流感na蛋白和核苷酸序列产生的实例性的蛋白-特异性流感密码子使用偏好在下文表6-10中描述,1)流感b(人),2)流感ah1n1(人),3)流感ah1n1(多),4)流感ah3n2(人),和5)流感ah3n2(多),其中“多”表示分析了来自多个动物来源(例如,人、猪、禽)的流感序列。
表6:na流感b(人)密码子使用偏好
编码gc42.70%
第一字母gc45.65%
第二字母gc47.02%
第三字母gc35.44%
密码子aa分数频率数量
gcaa0.49732.951122710
gcca0.17311.47542731
gcga0.0291.9287180
gcta0.30119.93674241
tgcc0.54921.15178765
tgtc0.45117.38464737
gacd0.37618.45868736
gatd0.62430.661114180
gaae0.78542.521158346
gage0.21511.61243242
ttcf0.2728.57731939
tttf0.72822.95885494
ggag0.47345.162168182
ggcg0.19018.10567424
gggg0.23422.38183348
ggtg0.1039.87236762
cach0.3107.40227565
cath0.69016.45961293
atai0.52431.908118826
atci0.18010.98540909
atti0.29517.98366967
aaak0.74544.692166434
aagk0.25515.26056827
ctal0.24720.23375349
ctcl0.1048.55131842
ctgl0.12610.33938501
cttl0.1189.71236169
ttal0.20516.77662473
ttgl0.20016.37160964
atgm1.00029.902111356
aacn0.49217.20564070
aatn0.50817.76066137
ccap0.43521.41579750
cccp0.1939.50635401
ccgp0.1115.49020446
cctp0.26112.83147781
caaq0.6339.71536178
cagq0.3675.63921000
agar0.54924.48891194
aggr0.2059.11633948
cgar0.1416.28123389
cgcr0.0000.01659
cggr0.0060.256952
cgtr0.0994.41916455
agcs0.1098.54431818
agts0.16512.95748250
tcas0.42533.319124081
tccs0.13010.20838016
tcgs0.0272.1508008
tcts0.14311.20941741
acat0.47738.419143071
acct0.16012.85247861
acgt0.0766.13522848
actt0.28723.08385959
gtav0.26611.49242796
gtcv0.23310.04937421
gtgv0.2239.63335872
gttv0.27812.00544706
tggw1.00017.13063791
tacy0.41917.93566791
taty0.58124.90392738
taa*0.9962.1307931
tag*0.0010.0027
tga*0.0030.00624
表7:na流感ah1n1(人)密码子使用偏好
编码gc41.92%
第一字母gc39.38%
第二字母gc46.09%
第三字母gc40.30%
密码子aa分数频率数量
gcaa0.2809.89269837
gcca0.1896.69347255
gcga0.0511.79812694
gcta0.48016.973119833
tgcc0.46418.609131382
tgtc0.53621.482151669
gacd0.50522.002155343
gatd0.49521.599152493
gaae0.64027.050190980
gage0.36015.225107495
ttcf0.49818.890133367
tttf0.50219.063134587
ggag0.39037.344263659
ggcg0.16215.484109319
gggg0.23522.500158857
ggtg0.21320.363143765
cach0.3464.63132694
cath0.6548.75661817
atai0.46645.047318045
atci0.22021.316150496
atti0.31430.363214368
aaak0.51021.821154064
aagk0.49020.966148022
ctal0.26010.19671989
ctcl0.0461.80312728
ctgl0.1114.33230587
cttl0.0592.30116248
ttal0.2369.25265320
ttgl0.28811.28079642
atgm1.00015.251107674
aacn0.43136.768259591
aatn0.56948.628343324
ccap0.48122.287157349
cccp0.1336.17643607
ccgp0.0964.45031415
cctp0.28913.39394558
caaq0.58417.988126997
cagq0.41612.81790492
agar0.59621.424151262
aggr0.1846.60546635
cgar0.1595.72140389
cgcr0.0501.78112574
cggr0.0020.061431
cgtr0.0100.3582529
agcs0.18020.580145299
agts0.23827.187191950
tcas0.24928.412200598
tccs0.11613.31193981
tcgs0.0515.85041302
tcts0.16618.930133651
acat0.39023.049162735
acct0.28616.895119286
acgt0.0020.140990
actt0.32219.078134698
gtav0.23714.197100232
gtcv0.20312.15385801
gtgv0.28016.743118207
gttv0.27916.700117907
tggw1.00034.038240319
tacy0.45313.58295894
taty0.54716.405115827
taa*0.8651.74012285
tag*0.1350.2711914
tga*0.0000.0017
表8:na流感ah1n1(多)密码子使用偏好
编码gc41.87%
第一字母gc39.36%
第二字母gc46.11%
第三字母gc40.14%
密码子aa分数频率数量
gcaa0.28710.20082144
gcca0.1926.81554887
gcga0.0481.70713750
gcta0.47316.826135503
tgcc0.47218.934152483
tgtc0.52821.198170719
gacd0.49421.688174664
gatd0.50622.259179260
gaae0.64226.931216883
gage0.35815.028121026
ttcf0.49818.791151330
tttf0.50218.971152780
ggag0.39137.319300546
ggcg0.16215.424124218
gggg0.23622.496181171
ggtg0.21220.222162854
cach0.3444.67937683
cath0.6568.94372018
atai0.46845.150363616
atci0.21720.912168414
atti0.31630.497245602
aaak0.52322.378180218
aagk0.47720.421164455
ctal0.2479.79378870
ctcl0.0431.69113619
ctgl0.1234.87539264
cttl0.0652.57720753
ttal0.2449.68978026
ttgl0.27911.09589352
atgm1.00015.535125108
aacn0.42235.632286963
aatn0.57848.871393575
ccap0.48422.228179014
cccp0.1356.21350035
ccgp0.0974.45035835
cctp0.28413.021104867
caaq0.58417.964144671
cagq0.41612.773102866
agar0.59521.567173685
aggr0.1906.86755305
cgar0.1515.46744025
cgcr0.0461.66013371
cggr0.0050.1851490
cgtr0.0130.4833890
agcs0.18220.844167865
agts0.23927.294219808
tcas0.24628.085226184
tccs0.11212.846103451
tcgs0.0536.00248337
tcts0.16819.213154727
acat0.38923.099186022
acct0.28316.831135545
acgt0.0040.2271826
actt0.32419.268155171
gtav0.24014.313115270
gtcv0.20412.16597967
gtgv0.27516.414132191
gttv0.28116.772135069
tggw1.00034.123274810
tacy0.45613.719110483
taty0.54416.354131703
taa*0.8021.61112977
tag*0.1970.3963188
tga*0.0010.00220
表9:na流感ah3n2(人)密码子使用偏好
编码gc42.92%
第一字母gc42.43%
第二字母gc44.50%
第三字母gc41.84%
密码子aa分数频率数量
gcaa0.35810.74359488
gcca0.2136.39235394
gcga0.0732.19012126
gcta0.35610.67859132
tgcc0.48121.541119287
tgtc0.51923.276128892
gacd0.40020.514113598
gatd0.60030.802170566
gaae0.58431.840176315
gage0.41622.692125658
ttcf0.56117.90899167
tttf0.43914.03377711
ggag0.37630.885171025
ggcg0.19215.75587245
gggg0.19716.16189493
ggtg0.23619.382107328
cach0.1022.18212083
cath0.89819.201106324
atai0.47238.110211036
atci0.19916.06888976
atti0.32926.514146820
aaak0.62831.235172964
aagk0.37218.494102411
ctal0.1347.15239602
ctcl0.1497.99344263
ctgl0.1518.07544717
cttl0.1608.57347473
ttal0.0743.96221938
ttgl0.33217.74998286
atgm1.00015.05483364
aacn0.47730.816170643
aatn0.52333.794187134
ccap0.1877.74642892
cccp0.2078.60347638
ccgp0.0532.18812118
cctp0.55322.967127181
caaq0.66417.01594219
cagq0.3368.60447646
agar0.41019.188106256
aggr0.34916.31690351
cgar0.0482.23412373
cgcr0.0391.82410101
cggr0.1074.99727671
cgtr0.0482.24012406
agcs0.17817.46596714
agts0.15014.73781609
tcas0.28127.573152686
tccs0.24123.651130971
tcgs0.0232.30412759
tcts0.12612.38168560
acat0.39530.801170562
acct0.28522.251123218
acgt0.0856.66136883
actt0.23518.320101450
gtav0.18413.71375935
gtcv0.17613.14972814
gtgv0.30522.789126193
gttv0.33525.050138713
tggw1.00023.518130230
tacy0.1494.43724571
taty0.85125.405140679
taa*0.9942.10011629
tag*0.0050.01159
tga*0.0010.0018
表10:na流感ah3n2(多)密码子使用偏好
编码gc42.89%
第一字母gc42.41%
第二字母gc44.53%
第三字母gc41.73%
密码子aa分数频率数量
gcaa0.35710.83265702
gcca0.2156.52939601
gcga0.0742.24213597
gcta0.35310.71564988
tgcc0.48621.827132388
tgtc0.51423.125140264
gacd0.39820.438123962
gatd0.60230.881187307
gaae0.58131.406190490
gage0.41922.614137160
ttcf0.55417.602106760
tttf0.44614.16485908
ggag0.37430.846187090
ggcg0.18915.60194624
gggg0.19716.27298697
ggtg0.23919.697119472
cach0.1032.22113469
cath0.89719.242116710
atai0.46637.598228047
atci0.20216.29698842
atti0.33226.761162317
aaak0.63231.583191559
aagk0.36818.366111394
ctal0.1387.37544732
ctcl0.1467.80447337
ctgl0.1508.01548615
cttl0.1638.71652867
ttal0.0794.21625573
ttgl0.32317.258104675
atgm1.00015.11391668
aacn0.47330.661185967
aatn0.52734.140207068
ccap0.1927.93548128
cccp0.2088.59952156
ccgp0.0512.09912732
cctp0.54922.718137793
caaq0.65916.917102607
cagq0.3418.75553103
agar0.41019.203116470
aggr0.35316.527100239
cgar0.0512.41414643
cgcr0.0391.84911216
cggr0.1034.83829345
cgtr0.0442.05012433
agcs0.17817.426105693
agts0.15214.88390273
tcas0.27827.261165347
tccs0.24123.553142859
tcgs0.0252.46614956
tcts0.12612.34174850
acat0.39530.737186433
acct0.28322.045133712
acgt0.0846.50139428
actt0.23818.495112178
gtav0.19114.19686104
gtcv0.17613.09679434
gtgv0.30022.375135712
gttv0.33324.837150648
tggw1.00023.690143689
tacy0.1544.62028023
taty0.84625.306153489
taa*0.9942.09912729
tag*0.0050.01165
tga*0.0010.00211
因此,在本文描述的方法的某些实施方案中,编码工程改造的ha流感蛋白的优化的核苷酸序列使用表1-5之一所述的ha-特异性流感密码子使用偏好产生。在本文所述的方法的一些实施方案中,编码工程改造的na流感蛋白的优化的核苷酸序列使用表6-10之一所述的na-特异性流感密码子使用偏好产生。
通过修饰流感结构蛋白的其它区域进一步优化
除了改变密码子之外,编码工程改造的流感结构蛋白的优化的核苷酸序列可任选地通过修饰序列进一步优化,其通过以下进行:i)使用来自野生型或其它回收的病毒例如高效价回收的病毒的结构蛋白的5’-和/或3’非编码序列;和/或ii)使用来自野生型或其它回收的病毒例如高效价回收的病毒的5’和3’末端编码序列,其编码信号肽、跨膜结构域和/或胞质尾。参见例如,harvey等(2011),j.virol.85(12):6086-6090;gomila等(2013),vaccine(31():4736-4743。例如,这些另外的修饰描述于图1的步骤4和5。每个修饰可独立地或组合应用于优化的核苷酸序列,并且不修饰蛋白的外结构域(细胞外)编码部分。
鉴定蛋白例如流感结构蛋白的5’和/或3’非编码区、信号肽、跨膜结构域、胞质结构域和/或外结构域,是本领域常规的,并且可使用已知的方法和技术进行。
例如,流感结构蛋白例如ha的信号肽和外结构域序列的位置可基于序列比对和参考可通过网站rcsb.org获得的rcsbpdb中的流感a亚型h1n1和h3n2结构模型确定。信号肽也可通过使用预测信号肽的软件,例如signalp(thomasnordahlpetersen等,naturemethods,8:785-86,2011)确定。
流感a亚型h1n1的信号肽包括h1n1多肽的残基1-17。外结构域以位置18的残基d开始。h1n1ha蛋白序列的带注释的比对显示于图2。通常,外结构域序列以季节样序列的dtic(seqidno:19)或大流行样序列的dtlc(seqidno:20)开始。h.m.berman等,theproteindatabank.nucleicacidsresearch,28:235-242,2000。流感a亚型h3n2的信号肽包括h3n2多肽的残基1-16。外结构域以位置17的残基q开始。h3n2ha蛋白序列的带注释的比对显示于图3。通常,外结构域序列以qklp(seqidno:21)或qdlp(seqidno:22)开始。h.m.berman等,theproteindatabank.nucleicacidsresearch,28:235-242,2000。
类似地,流感结构蛋白例如ha的跨膜和胞质结构域序列的位置结构,可基于序列比对确定。各种代表性的流感a毒株的ha跨膜结构域的序列比对显示于图4。亦参见secondarystructure,orientation,oligomerization,andlipidinteractionsofthetransmembranedomainofinfluenzahemagglutinin.surena.tatulian和lukask.tamm.biochemistry,2000,39(3),pp496–507。技术人员也可使用软件鉴定跨膜和胞质结构域,包括例如tmpred(k.hofmann&w.stoffel,1993,tmbase-adatabaseofmembranespanningproteinssegments.biol.chem.hoppe-seyler374,166);interproscan(zdobnove.m.和apweilerr.,2001,bioinformatics,17(9):847-48);和tmhmm(krogh,b.等,journalofmolecularbiology,2001,305(3):567-580)。
因此,在某些实施方案中,产生编码工程改造的流感结构蛋白的优化的核苷酸序列的方法进一步包括一个或多个以下步骤:
a)添加来自另一流感毒株例如高效价拯救毒株的5’和3’非编码序列;
b)将优化的核苷酸序列中的编码信号肽的序列交换为编码来自另一流感毒株例如高效价拯救毒株的信号肽的核苷酸序列;
c)将优化的核苷酸序列的编码跨膜结构域的序列交换为编码来自另一流感毒株例如高效价拯救毒株的跨膜结构域的核苷酸序列;和/或
d)将优化的核苷酸序列的编码胞质结构域的序列交换为编码来自另一流感毒株例如高效价拯救毒株的胞质结构域的核苷酸序列。
在某些实施方案中,本文所述的方法进一步包括步骤a);步骤b);步骤c);步骤d);步骤a)和b);步骤a)和c);步骤a)和d);步骤a)、b)和c);步骤a)、b)和d);步骤a)、c)和d);步骤a)、b)、c)和d);步骤b)和c);步骤b)和d);步骤b)、c)和d);或步骤c)和d)。
来自另一流感毒株的5’和3’非编码序列可进一步包括编码序列而不破坏氨基酸序列。因此,5’和3’末端核苷酸序列可包括非编码和编码序列。在一些实施方案中,5’和3’末端序列主要是编码序列,包括信号肽和延伸至5’端的茎区;和包括茎、跨膜区和3’端的胞质尾。
编码工程改造的流感结构蛋白的优化的核苷酸序列
另一方面涉及编码工程改造的流感结构蛋白的优化的核苷酸序列,其通过本文所述的方法获得,其中在反向翻译的核苷酸序列(即,第一核苷酸序列)和第二核苷酸序列(其编码来自野生型病毒或之前拯救的病毒的相应的流感结构蛋白)中的密码子编码相同的氨基酸的每个位置处,优化的核苷酸序列中的密码子已被改变以匹配来自第二核苷酸序列的密码子;和其中在第一和第二核苷酸序列中的密码子编码不同的氨基酸的每个位置处,优化的核苷酸序列中的密码子已被改变以匹配基于流感蛋白-特异性流感密码子使用偏好的密码子。
在某些实施方案中,优化的核苷酸序列进一步包括一种或多种以下修饰:
a)来自另一流感毒株例如高效价拯救毒株的5’和3’非编码核苷酸序列(例如,非编码序列);
b)编码来自另一流感毒株例如高效价拯救毒株的信号肽的核苷酸序列;
c)编码来自另一流感毒株例如高效价拯救毒株的跨膜结构域的核苷酸序列;和/或
d)编码来自另一流感毒株例如高效价拯救毒株的胞质结构域的核苷酸序列。
在某些实施方案中,优化的核苷酸序列进一步包括修饰a);修饰b);修饰c);修饰d);修饰a)和b);修饰a)和c);修饰a)和d);步骤a)、b)和c);修饰a)、b)和d);修饰a)、c)和d);修饰a)、b)、c)和d);修饰b)和c);修饰b)和d);修饰b)、c)和d);或修饰c)和d)。
工程改造的流感蛋白
本文所述的用于优化核苷酸序列的方法优选地在工程改造的流感结构蛋白上进行,包括但不限于ha和na。本文所述的方法可在任何工程改造的流感结构蛋白上进行。
例如,为了诱导更加广泛反应性的免疫反应,基于选择的h5n1和h1n1流感病毒分离株,通过一系列ha蛋白比对和随后的共有序列,对流感ha蛋白已经开发了计算优化的广泛反应性抗原(cobra),如描述于wo2013/122827和美国公开号2015/0044247,2015/0017196,2014/0147459,2014/0127248和2013/0183342,其全部通过引用以其整体结合到本文中。
这些重组工程改造的cobra具有独特设计的氨基酸序列以引发针对各种流感分离株,例如特定亚型例如h1n1或h5n1内的大多数或所有流感病毒的广泛反应性免疫反应。cobra的氨基酸序列天然不存在。除了描述于wo2013/122827和美国公开号2015/0044247,2015/0017196,2014/0147459,2014/0127248和2013/0183342的特定的cobra之外,还有可能使用这些公布的申请中公开的方法产生其它重组工程改造的cobra。
某些实例性的h5n1cobra的氨基酸序列在表11中描述。
表11:实例性的h5n1cobra氨基酸序列
某些实例性的h1n1cobra的氨基酸序列在表12中描述。
表12:实例性的h1n1cobra氨基酸序列
在一些实施方案中,工程改造的cobra具有与表11或12中出现的序列至少约90%(例如,至少约91%,92%,93%,94%,95%,96%,97%,98%或99%)同一性的序列。在一些实施方案中,工程改造的hacobra具有与表11或12中出现的序列基本上相同的序列。在一些实施方案中,工程改造的hacobra具有与表11或12中出现的序列相同的序列。
进一步例如,使用合理设计方法已开发了工程改造的ha序列,在多价疫苗中包括来自多个病毒分离株的表位,如描述于pct/us2016/035594(要求美国临时申请号62/169,814的优先权),其通过引用以其整体结合到本文中。在某些实施方案中,设计基于将多个b细胞表位和来自不同的ha序列(亚型h1)的抗原区组合成嵌合抗原。这些嵌合表位抗原,在一些实施方案中,通过使对至少一个中和表位的序列同源性最大化,被预测赋予对多个亚型h1毒株的交叉保护。通过地理区域、病毒分离株年份、序列簇或其它评分方法,评价总体比对覆盖度对最佳嵌合序列模板进行选择。一组选择的嵌合模板序列与靶骨架序列组合,以产生一组全长嵌合蛋白序列。这些嵌合序列的结构精修得到一组最终的接种蛋白。这些工程改造的ha蛋白的氨基酸序列不匹配任何天然存在的毒株的氨基酸序列。某些实例性的工程改造的ha蛋白的氨基酸序列在表13中描述。
表13:实例性的h1n1嵌合ha蛋白
进一步例如,已使用合理设计方法开发了来自流感b的工程改造的ha序列,如描述于美国临时申请号62/344,862,其通过引用以其整体结合到本文中。这些工程改造的ha蛋白的氨基酸序列不匹配任何天然存在的毒株的氨基酸序列。某些实例性的工程改造的流感bha蛋白的氨基酸序列在表14中描述。
表14:实例性的流感bsmartha蛋白
进一步例如,已经开发了工程改造的ha序列以延伸季节性反应概况,以覆盖大流行毒株,或反之亦然,如描述于美国临时申请号62/354,502,其通过引用以其整体结合到本文中。这些策略延伸了在抗原性不同的毒株的序列簇(或进化枝)之间的免疫概况;它们可随时间应用于工程改造的重组ha分子,使得其继续引发针对抗原性漂移的循环季节性毒株的免疫反应。该策略经设计,以总体上保存宿主ha多肽的受体结合位点(rbs)的特定残基,具有在接近rbs的区域中工程改造的修饰。类似的策略可用于延伸大流行反应概况以覆盖季节性毒株。美国临时申请号62/354,502中描述的修饰可用于进一步定制或优化免疫原性特征,使得工程改造的ha多肽经再次工程改造以引发针对更多或更少的季节性毒株的抗体(或证实改进或更多的抗-季节性抗体反应)或引发针对更多或更少的大流行毒株的抗体(或证实改进或更多的抗-大流行抗体反应)。这些修饰的工程改造的ha蛋白的氨基酸序列不匹配任何天然存在的毒株的氨基酸序列。某些实例性的修饰的工程改造的ha蛋白的氨基酸序列在表15中描述。
表15:实例性的修饰的流感ha蛋白
在各种实施方案中,本文所述的工程改造的ha嵌合多肽包含在特定的病毒骨架序列上的表位模式的组合。按需要,多个表位可被装配在任何病毒骨架上。实例性的病毒骨架序列包括a/newcaledonia/20/1999、a/california/07/2009和共有(例如,1918-2011)序列。在一些实施方案中,本文所述的工程改造的ha嵌合多肽包含newcaledonia99或california09骨架序列。
在一些实施方案中,工程改造的ha多肽具有与表13、14或15中出现的序列至少约90%(例如,至少约91%,92%,93%,94%,95%,96%,97%,98%或99%)同一性的序列。在一些实施方案中,工程改造的ha多肽具有与表13、14或15中出现的序列基本上相同的序列。在一些实施方案中,工程改造的ha多肽具有与表13、14或15中出现的序列相同的序列。
工程改造的流感结构蛋白的表达
通过本文所述的方法得到的优化的核苷酸序列可在无细胞系统中或在宿主细胞中使用已知的方法表达。本发明的优化的核苷酸序列的表达可通过第二个核酸序列调节,使得该分子在用重组dna分子转化的宿主中表达。例如,本发明的优化的核苷酸序列的表达可通过启动子和/或增强子元件控制,它们是本领域已知的。
通过本领域已知的方法将本发明的核酸构建体插入表达载体或病毒载体,和核酸分子与表达控制序列可操作连接。
将包含核酸分子的表达载体转化至合适的宿主细胞,以允许生产由核酸构建体编码的蛋白。实例性的宿主细胞包括原核细胞(例如,大肠杆菌)和真核细胞(例如,cos、293或cho细胞)。用表达载体转化的宿主细胞在允许生产工程改造的流感结构蛋白的条件下生长,接着回收工程改造的蛋白。
还提供了包含编码重组流感结构蛋白的核酸分子的载体。载体可以是用于表达工程改造的流感结构蛋白的任何合适的载体,例如哺乳动物表达载体。在具体的实例中,载体是ptr600表达载体(美国专利申请公开号2002/0106798,通过引用结合到本文中;ross等,natimmunol.1(2):102-103,2000;green等,vaccine20:242-248,2001)。在一些实例中,载体包括与编码工程改造的流感结构蛋白的优化的核苷酸序列可操作连接的启动子。在具体的实例中,启动子是cmv启动子。
工程改造的流感结构多肽可通过本领域已知的任何技术纯化。例如,不希望受理论的束缚,工程改造的流感结构多肽可作为可溶性多肽或作为包涵体从细胞回收,从所述包涵体,它们可通过8m盐酸胍和透析定量提取。为了进一步纯化工程改造的流感结构多肽,可使用常规的离子交换色谱、疏水相互作用色谱、反相色谱或凝胶过滤。本发明的工程改造的流感结构多肽还可在从真核或原核细胞中分泌后,从条件培养基中回收。
反求遗传学方法
通过本文所述的方法获得的优化的核苷酸序列可与一种或多种供体病毒组合,和在反求遗传学系统中用于生产传染性重配株流感病毒。如上所论述的,反求遗传学系统可用于从它们的cdnas生产传染性重配株病毒,或减毒病毒。反求遗传学方法是本领域技术人员众所周知的,和包括但不限于使用neuman等,1999,procnatlacadsciusa,96(16):9345-9350;neumann等,2005,procnatlacadsciusa,102(46):16825-16829;zhang等,2009,jvirol,83(18):9296-9303;massin等,2005,jvirol,79(21):13811-13816;murakami等,2008,82(3):1605-1609中描述的质粒;和/或neuman等,1999,procnatlacadsciusa,96(16):9345-9350;neumann等,2005,procnatlacadsciusa,102(46):16825-16829;zhang等,2009,jvirol,83(18):9296-9303;massin等,2005,jvirol,79(21):13811-13816;murakami等,2008,82(3):1605-1609;koudstaal等,2009,vaccine,27(19):2588-2593;schickli等,2001,philostransrsoclondbiolsci,356(1416):1965-1973;nicolson等,2005,vaccine,23(22):2943-2952;legastelois等,2007,influenzaotherrespiviruses,1(3):95-104;whiteley等,2007,influenzaotherrespiviruses,1(4):157-166中描述的细胞的方法。
在某些实施方案中,反求遗传学方法可以是:
(i)16种质粒方法,例如neuman等,1999,procnatlacadsciusa,96(16):9345-9350和us2009/0246830或us2011/0143424(其各自通过引用以其整体结合到本文中)中描述的方法,其中流感病毒通过使用聚胺衍生物(transit-lt1),用各自包含在rna聚合酶i启动子和rna聚合酶i终止子的控制下的与一种流感vrna互补的cdna的8种质粒,和各自包含在rna聚合酶ii启动子的控制下与pa、pb1、pb2、np、ha、na、m和nsmrna之一互补的cdna的8种质粒,转染细胞生产。特别地,细胞是人肾胚粘附细胞(293t细胞系);
(ii)12种质粒方法,例如fodor等,1999,jvirol,73(11):9679-9682和us2004/0142003、us2012/0058538(其各自通过引用以其整体结合到本文中)中描述的方法,其中流感病毒通过用各自包含在rna聚合酶i启动子和rna聚合酶i终止子(肝炎δ核酶)的控制下与一种流感vrna互补的cdna的8种质粒,和各自包含在rna聚合酶ii启动子的控制下与np、pa、pb1和pb2mrna之一互补的cdna的4种质粒转染第一细胞类型,和通过在第二细胞类型中进一步扩增病毒生产。特别地,所述第一细胞类型是vero细胞和所述第二细胞类型是mdbk;
(iii)13种质粒方法,例如dewit等,2007,journalofgeneralvirology,88:1281-1287(其通过引用以其整体结合到本文中)中描述的方法,其中流感病毒通过用各自包含在t7rna聚合酶启动子和t7rna聚合酶终止子的控制下与一种流感vrna互补的cdna的8种质粒,各自包含在rna聚合酶ii的控制下与np、pa、pb1和pb2mrna之一互补的cdna的4种质粒和包含在rna聚合酶ii的控制下与编码t7rna聚合酶和核定位信号的mrna互补的cdna的1种质粒,转染细胞生产。特别地,转染的细胞是vero、293t或qt6(来自japanesequail的纤维肉瘤细胞系)细胞。
(iv)8种质粒方法,例如hoffmann等,2000,pnas,97(11):6108-6113和wo01/83794(其各自通过引用以其整体结合到本文中)中描述的方法,其中每种质粒能够表达mrna和vrna二者。因此,每种质粒包含与一种流感vrna互补的cdna和两个转录盒,而不是如前述的情况下的一个。与8种流感病毒vrna的每一种互补的cdna在聚合酶i终止子和聚合酶i启动子之间插入。该聚合酶i转录单元侧翼是聚合酶ii启动子和多腺苷酸化信号。第一转录盒允许转录vrna形式的cdna。第二转录盒允许转录mrna形式的cdna,其然后使用细胞机器翻译成病毒蛋白。在这种用于转录的双盒系统(亦称为poll-polii系统)的帮助下,同一质粒的cdna被转录为vrna和mrna形式二者。这在转染细胞的水平上通过vrna和一种或多种病毒蛋白的表达证明。特别地,使用粘附mdck细胞和293t细胞的共培养,以及聚胺衍生物(transit-lt1)作为转染试剂。
(v)3种质粒方法,例如neumann等,2005,pnas,102(46):16825-16829(其通过引用以其整体结合到本文中)中描述的方法,其中流感病毒通过用包含各自在rna聚合酶i启动子和聚合酶i终止子的控制下与pb2、pb1、pa、ha、np、na、m和nsvrna互补的8种cdna的1种质粒和2种质粒(在rna聚合酶ii启动子的控制下,第一种包含与pb2、pb1和pamrna之一互补的3种cdna和第二种包含与npmrna互补的cdna),转染细胞生产。特别地,转染的细胞是293t或vero。
(vi)1种质粒方法,例如zhang等,j.virol.,83(18):9296-9303(其通过引用以其整体结合到本文中)中描述的方法,其中流感病毒通过用包含在鼠聚合酶i终止子和鸡rna聚合酶i启动子的控制下与pb2、pb1、pa、ha、np、na、m和nsvrna互补的8种cdna和在pb2、pb1、pa和npcdna之间具有聚合酶ii启动子和多腺苷酸化信号的1种质粒,转染细胞生产。特别地,转染的细胞是cef细胞。
(vii)wo2005/062820(其通过引用以其整体结合到本文中)中描述的方法,使用两种不同的细胞系统:在第一步骤中,细胞用poll-polll系统(pol/poll)的8种双向质粒转染,然后在第二步骤中,转染的细胞与来自非常容许流感病毒的另一细胞系的细胞一起培养,以扩大流感病毒的生产。特别地,在第一步骤中所述转染的细胞是vero细胞,和在第二步骤中所述另一细胞系是cek或cef细胞系,其是源自鸡胚细胞的细胞系。
因此,某些实施方案涉及生产传染性重配株流感病毒的方法(“反求遗传学”方法),所述方法包括用包含编码流感结构蛋白的优化的核苷酸序列的表达载体和一种或多种供体载体转染细胞,和生产传染性重配株流感病毒(或种子病毒)。在某些实施方案中,细胞是哺乳动物细胞,包括但不限于vero细胞、hek-293细胞、mdck细胞或中国仓鼠卵巢(cho)细胞和其组合。在一些实施方案中,本文所述的方法和其优化的核苷酸序列与载体、重组盒和整体系统一起使用,其描述于wo2014/019990和美国申请号14/419,235(美国公开号2015-0191703a1),其通过引用以其整体结合到本文中。
转染的细胞的上清液包含传染性重配株流感病毒,其可经收获和/或分离,用作传染性种子病毒以感染单独的一群细胞或蛋。或者,在转染步骤后,细胞或蛋可原位加入感染的细胞以允许扩增传染性流感病毒。在某些实施方案中,细胞是哺乳动物细胞,包括但不限于vero细胞或中国仓鼠卵巢(cho)细胞。
充分理解的是,用种子病毒感染细胞在本领域技术人员众所周知的允许扩增传染性流感病毒的培养条件下进行。传染性流感病毒的扩增可通过连续感染细胞群或任何其它高容许细胞群,或通过感染含胚鸡蛋的尿囊腔,进一步扩大。
转染的哺乳动物细胞优选适合于在无血清培养基中和/或在无动物组分条件下培养。本领域技术人员通过在包含递减血清量的培养基中逐渐传代细胞,直到细胞可在无血清培养基中成功存活和增殖,使细胞适合于在无血清培养基中培养可容易地实现。
细胞可通过本领域技术人员已知的任何方法转染。例如,转染可通过膜电穿孔、核电穿孔进行。在某些实施方案中,转染通过核电穿孔进行。表述“核电穿孔”理解为通过一次或多次电击来转染核酸的方法,电击的强度足以增加核孔的数量和/或其渗透性。
在某些实施方案中,重组病毒包含由本文所述的优化的核苷酸序列编码的ha流感多肽、来自流感毒株的野生型na多肽和来自供体病毒(例如,流感a/puertorico/8/34(pr8))的内部蛋白基因的骨架,其赋予在蛋中的高产量。例如,编码高生长流感a/puertorico/8/34(pr8)供体病毒的内部蛋白的6种质粒可与编码本文描述的工程改造的流感结构多肽和野生型神经氨酸酶(na)糖蛋白的质粒共转染至合格的哺乳动物细胞(例如,vero细胞),接着分离重组病毒。包含来自pr8病毒的内部蛋白基因的重组病毒可用于制备灭活的流感病毒疫苗(参见例如,fodor,e.等rescueofinfluenzaavirusfromrecombinantdna.j.virol.,1999,73,9679-9682;通过引用并入本文)。
流感病毒-样颗粒(vlp)
在一些实施方案中,本发明提供了包含一种或多种由本文所述的优化的核苷酸序列编码的工程改造的流感结构蛋白的流感病毒-样颗粒(vlp)和其组合。在一些实施方案中,流感vlp通常由ha、na和病毒结构(例如,hivgag)蛋白构成。流感vlp的生产是本领域已知的,本领域技术人员在阅读本公开内容后,这将是显而易见的。例如,流感vlp可通过用编码ha、na和hivgag蛋白的质粒转染宿主细胞生产。仅给出一个实例,合适的宿主细胞包括人细胞(例如,hek293t)。在转染的细胞孵育允许蛋白表达的合适时间(例如大约72小时)后,vlp可自细胞培养上清液分离。在一些实施方案中,本文公开的流感vlp可用作流感疫苗以引起针对流感病毒的广泛中和性免疫反应。
全流感病毒
还提供了包含本文描述的一种或多种工程改造的流感结构蛋白的全重组流感病毒。重组流感病毒可通过如本文所述的基于质粒的反求遗传学,和基于细胞或基于蛋的技术生产。包含来自供体病毒的内部蛋白基因的重组病毒可用于制备灭活的流感病毒疫苗(参见例如,fodor,e.等rescueofinfluenzaavirusfromrecombinantdna.j.virol.,1999,73,9679-9682;通过引用并入本文)。不同的重组流感病毒,各自包含不同的重组流感结构多肽,也可单独生产,然后合并成组合/混合物。重组流感病毒组合/混合物可用作流感疫苗以引发针对流感病毒的保护性免疫反应;例如,它们可作为活减毒或裂解灭活疫苗的组分给予。
因此,在一些实施方案中,本发明提供了包含由优化的核苷酸序列编码的流感结构多肽的灭活的流感疫苗(或其组合或混合物),其中疫苗包含三种类型的抗原制备物之一:灭活的全病毒、其中纯化的病毒颗粒被去垢剂或其它试剂破坏以溶解脂质被膜的亚-病毒体(“裂解”疫苗)或纯化的流感结构多肽(“亚单位”疫苗)。在一些实施方案中,病毒可通过用甲醛、β-丙内酯、醚、含去垢剂的醚(例如tween-80®)、十六烷基三甲基溴化铵(ctab)和tritonn101、脱氧胆酸钠和三(正丁基)磷酸酯处理灭活。灭活可在澄清尿囊液(来自蛋中生产的病毒)之后或之前发生;病毒体通过离心分离和纯化(nicholson等编辑,1998,textbookofinfluenza,blackwellscience,malden,ma;通过引用并入本文)。为了评价疫苗的效能,可使用单向辐射免疫扩散(srd)试验(schild等,1975,bull.worldhealthorgan.,52:43-50&223-31;mostow等,1975,j.clin.microbiol.,2:531;其二者通过引用并入本文)。
在一些实施方案中,用于疫苗的流感病毒在蛋中,例如在含胚鸡蛋中生长,在该情况下收获的材料是尿囊液。或者,或另外,流感病毒或由优化的核苷酸序列编码的流感结构多肽可自使用组织培养以生长病毒的任何方法生产。用于生长病毒或另外重组生产工程改造的流感结构多肽的合适的细胞基底包括例如cho细胞、犬肾细胞例如mdck或来自mdck的克隆的细胞、mdck-样细胞、猴肾细胞例如agmk细胞,包括vero细胞,培养的上皮细胞作为连续细胞系,293t细胞、bk-21细胞、cv-1细胞或为疫苗目的合适于生产流感病毒的任何其它哺乳动物细胞类型(包括上呼吸道上皮细胞),其容易获自商业来源(例如,atcc,rockville,md.)。合适的细胞基底还包括人细胞,例如mrc-5细胞。合适的细胞基底不限于细胞系;还包括例如原代细胞例如鸡胚成纤维细胞。
制备药物组合物的方法
本文还提供了制备流感疫苗组合物的方法,所述方法包括:
a)通过用一组表达载体转染哺乳动物细胞产生种子病毒,所述表达载体中的一种或多种包含编码工程改造的流感结构蛋白的优化的核苷酸序列;
b)收获种子病毒;
c)用种子病毒感染蛋或哺乳动物细胞以生产传染性流感病毒;
d)在蛋或哺乳动物细胞中繁殖后收获传染性流感病毒;
e)纯化收获的传染性流感病毒;
d)任选地灭活纯化的病毒;和
e)混合纯化的病毒与药学上可接受的载体。
在一些实施方案中,表达载体是wo2014/019990和美国申请号14/419,235(美国公开号2015-0191703a1)中描述的那些,其通过引用以其整体结合到本文中;在一些实施方案中,载体包含wo2014/019990中描述的重组盒。
在一些实施方案中,所述一组表达载体包含:允许表达至少编码流感pb1、pb2、pa和np蛋白的mrna的表达载体,和允许表达至少流感pb1、pb2、pa、np、m、ns、ha和navrna或相应的crna的表达载体。所述一组表达载体的表达允许(i)形成包含流感vrna的核糖核蛋白复合物(rnp),和(ii)在所述转染的细胞中产生传染性流感病毒。在特定的实施方案中允许表达编码流感pb1、pb2、pa和np蛋白的mrna的表达载体包含四种不同的单向质粒,每种质粒包含在结合rna聚合酶ii的启动子的控制下与编码选自pb1、pb2、pa和np流感蛋白的四种不同的蛋白之一的mrna互补的cdna,和允许表达流感pb1、pb2、pa、np、m、ns、ha和navrna或相应的crna的表达载体包含八种不同的单向质粒,每种质粒包含在结合rna聚合酶i的启动子的控制下与选自所述pb1、pb2、pa、np、m、ns、ha和na流感vrna的八种不同的vrna之一或与相应的crna互补的cdna。在一些实施方案中,包含在结合rna聚合酶i的启动子的控制下与所述流感pb1、pb2、pa、np、m、ns、ha和navrna之一(例如,包含本文所述的优化的核苷酸序列的cdna)或相应的crna互补的cdna的每种质粒,通过克隆所述cdna序列至载体获得,所述载体在5'至3'方向上包含:a)结合rna聚合酶i或t7rna聚合酶的启动子;b)重组盒,其在5'至3'方向上包含:
-第一限制性酶的反向互补识别序列,所述限制性酶的切割位点在其识别序列外和产生粘性末端;
-第二限制性酶的限制性位点,所述限制性酶的切割位点在其识别序列内;
-第三限制性酶的限制性位点,所述限制性酶的切割位点在其识别序列内;和
-所述第一限制性酶的识别序列,所述限制性酶的切割位点在其识别序列外和产生粘性末端;其中所述第二和第三限制性酶是不同的;和
c)终止子序列。在特定的实施方案中,当启动子结合rna聚合酶i时,所述终止子序列是肝炎δ核酶序列,和当启动子结合t7rna聚合酶时,所述终止子序列是t7聚合酶终止子序列。
纯化可以是简短的,可限于在总体上澄清收获的传染性病毒后,通过离心来浓缩病毒的步骤。纯化可以补充有例如通过蔗糖密度梯度(ep07760362)进行的离心步骤。也可进行色谱方法以纯化病毒。因此获得纯化的全病毒的悬浮液,其可进一步处理以得到最终的疫苗组合物。纯化的病毒悬浮液还可经历后续的处理。因此获得流感病毒来源的产物。病毒悬浮液可根据本领域技术人员众所周知的方法,使用去垢剂或液体溶剂进行片段化,以制造例如,基于片段化或裂解的病毒、的疫苗、病毒颗粒(virosome)或包含工程改造的流感病毒结构蛋白的亚单位疫苗。从纯化的病毒获得的片段化或裂解的病毒、包含工程改造的流感结构蛋白的病毒颗粒和包含工程改造的流感结构蛋白的亚单位疫苗被认为是流感病毒来源的产物。
最终的疫苗组合物可由全灭活的流感病毒或减毒流感病毒构成。病毒悬浮液的灭活通过常规方式,使用β-丙内酯(e.budowsky等1991,vaccine,9:319-325;1991,vaccine,9:398-402;1993,vaccine,11:343-348)、乙烯亚胺或衍生物(d.king1991,aviandis.35:505-514)或甲醛溶液(ep07760362)进行。病毒的灭活可在纯化步骤之前或之后进行。
最终的疫苗组合物通常与药学上可接受的载体一起配制。疫苗组合物还可包含一种或多种佐剂。例如,明矾、铝盐(baylor等,2002,vaccine,20:s18;通过引用并入本文)和单磷酰基脂质a(mpl;ribi等,1986,immunologyandimmunopharmacologyofbacterialendotoxins,plenumpubl.corp.,ny,p.407;通过引用并入本文)可用作人疫苗中的佐剂。或者,或另外,新的化合物当前正作为人疫苗中的佐剂进行试验,例如mf59(参见例如,ott等,“mf59—designandevaluationofasafeandpotentadjuvantforhumanvaccines”,vaccinedesign:thesubunitandadjuvantapproach(powell,m.f.和newman,m.j编辑)plenumpress,newyork,1995,pp.277-296;通过引用并入本文);cpg寡脱氧核苷酸(odn)佐剂例如cpg7909(cooper等,2004,vaccine,22:3136;通过引用并入本文);单磷酰基脂质a(mpl)佐剂和脂质a模拟物,包括as04(didierlaurent,a.m.等,j.immunol.,2009,183:6186-6197;通过引用并入本文),单磷酰基脂质a(mpl,gsk)和吡喃葡糖基脂质agla(immunedesigncorporation,idc);af03(klucker,m.f.等,j.pharmsci.,2012,101:4490-4500;通过引用并入本文);tlr-3配体聚肌苷酸:聚胞苷酸[poly(i:c)];tlr9佐剂例如ic31(riedl,k.等,vaccine,2008,26:3461-3468;通过引用并入本文);咪唑并喹啉(用作tlr-7/8激动剂的双环有机分子)例如咪喹莫特(r837)或瑞喹莫德(r848);皂苷例如qs21(ghochikyan等,2006,vaccine,24:2275;通过引用并入本文),iscomatrix佐剂(duewell,p.,等,j.immunol,2011,187:55-63;通过引用并入本文)和matrix-m™(novavax)。
另外,本领域已知一些佐剂提高流感疫苗的免疫原性,例如聚[二(羧酸合苯氧基)膦腈](pccp;payne等,1998,vaccine,16:92;通过引用并入本文)、干扰素-γ(cao等,1992,vaccine,10:238;通过引用并入本文)、嵌段共聚物p1205(crl1005;katz等,2000,vaccine,.18:2177;通过引用并入本文)、白介素-2(il-2;mbwuike等,1990,vaccine,8:347;通过引用并入本文)和聚甲基丙烯酸甲酯(pmma;kreuter等,1981,j.pharm.sci.,70:367;通过引用并入本文)。
参考以下实施例将更全面地理解本发明。所有文献引文通过引用结合到本文中。
实施例
实施例1–p1、x6和x1cobra的核苷酸序列优化
产生编码工程改造的流感结构蛋白的优化的核苷酸序列的方法使用p1(seqidno:4)、x6(seqidno:5)和x1(seqidno:7)cobra实施。在未优化编码cobra的核苷酸序列的情况下,在反求遗传学系统中很少至没有病毒拯救是可能的。对于各cobra,产生两个优化的核苷酸序列:一个按照图1的步骤1-4获得,和一个按照图1的步骤1-5获得。
更具体地,对于p1、x6和x1cobra的每一个,通过反向翻译cobra氨基酸序列,比较反向翻译的核苷酸序列与流感序列的数据库,和根据图1的步骤3a和3b所示的规则优化反向翻译的核苷酸序列,获得优化的核苷酸序列。优化的核苷酸序列还通过添加来自高-效价拯救毒株a/puertorico/8/34(“pr8”)的5’和3’非编码区进行修饰。这些优化的核苷酸序列在图5中被称为“密码子偏好”。
在pr8的情况下,使用以下5’-和3’-末端核苷酸序列:
pr85’末端序列
agcaaaagcaggggaaaataaaaacaaccaaaatgaaggcaaacctactggtcctgttatgtgcacttgcagctgcagatgca(seqidno:23)
pr83’末端序列
cagattctggcgatctactcaactgtcgccagttcactggtgcttttggtctccctgggggcaatcagtttctggatgtgttctaatggatctttgcagtgcagaatatgcatctgagattagaatttcagagatatgaggaaaaacacccttgtttct(seqidno:24)
“密码子偏好”优化的序列还通过将某些编码区交换为其它流感ha蛋白进一步修饰。优化的x6cobra序列通过将5’末端的信号肽交换为来自cobrax3序列(参见表12)或野生型流感病毒(a/wellington/24/2000)的信号肽进一步修饰。更具体地,编码x6cobra的信号肽的序列交换为编码来自a/wellington/24/2000毒株(seqidno:25)或x3cobra(seqidno:26)的信号肽的以下核苷酸序列。编码序列用斜体表示。
5’a/wellington/24/2000末端序列:
atgaaagtaaaactactggtcctgttatgtacatttacagctacatatgc(seqidno:25)
5’x3cobra末端序列:
atggaagcaagactactagtcctgttatgtgcatttgcagctacaaatgcagacacaatatgtataggctaccatgcg(seqidno:26)
优化的x1cobra序列通过交换5’和3’末端与cobraa1或pr8的5’和3’末端进一步修饰。更具体地,编码信号肽和在外结构域的初始部分中的5’核苷酸序列与相应的cobraa1序列交换。这种交换在信号肽中,而非在外结构域区中引入变化(即,在外结构域中仅进行密码子变化)。3’末端区,其编码跨膜结构域和胞质尾,也与来自cobraa1的相应序列交换。交换的5’和3’cobraa1末端序列分别对应于seqidno:27和seqidno:28。编码序列用斜体表示。
5’cobraa1末端序列:
atgaaagcaaaactactagttctgttatgtgcatttacagctacatatgcagacacaatatgtataggctaccatgcgaacaactcaaccgacactgttgacacagtacttgaaaagaacgtgacagtgacacactctgtcaacctacttgaggacagtcacaacggaaaactatgtcgactaaaaggaatagccccactacaattgggt(seqidno:27)
3’cobraa1末端序列:
aagaacaatgccaaagaaataggaaacgggtgttttgaattctaccacaagtgtaacaatgaatgcatggaaagtgtgaaaaatggaacttatgactatccaaaatattccgaggaatcaaagttaaacagggaaaaaattgatggagtgaaattggaatcaatgggagtctatcagattctggcgatctactcaactgtcgccagttcactggtgcttttggtctccctgggggcaatcagcttctggatgtgttctaatgggtctttgcagtgtagaatatgcatctgagattagaatttcagagatatgaggaaaaacacccttgtttct(seqidno:28)
编码cobrax1的信号肽(但不包括外结构域的任何部分)的5’核苷酸序列也与相应的pr8序列交换。这种交换不引入氨基酸序列中的任何变化。pr8的3’末端区,其编码跨膜结构域和胞质尾,也与来自cobrax1的相应3’序列交换。交换的5’和3’pr8末端序列分别对应于seqidno:29和seqidno:30。编码序列用斜体表示。
5’pr8末端序列:
agcaaaagcaggggaaaataaaaacaaccaaaatgaaggcaaacctactggtcctgttatgtgcacttgcagctgcagatgc(seqidno:29)
3’pr8末端序列:
acagattctggcgatctactcaactgtcgccagttcactggtgcttttggtctccctgggggcaatcagtttctggatgtgttctaatggatctttgcagtgcagaatatgcatctgagattagaatttcagagatatgaggaaaaacacccttgtttct(seqidno:30)
优化的p1cobra序列通过交换5’和3’末端与cobraa1序列(见表12)进一步修饰。更具体地,编码cobrap1的信号肽的5’核苷酸序列与相应的cobraa1序列交换,导致信号肽中的氨基酸改变。来自cobrap1的3’核苷酸序列也与来自cobraa1的相应序列(包括编码跨膜区的序列)交换。然而,这种交换不在3’末端引入任何氨基酸改变。交换的5’和3’cobraa1末端序列分别对应于seqidno:31和seqidno:32。编码序列用斜体表示。
5’cobraa1末端序列:
atgaaagcaaaactactagttctgttatgtgcatttacagctacatatgcagacacaatatgtataggctaccatgcgaacaactcaaccgacactgttgacacagtacttgaaaagaacgtgacagtgacacactctgtcaacctacttgaggacagtcacaacggaaaacta(seqidno:31)
3’cobraa1末端序列:
gtgaaaaatggaacttatgactatccaaaatattccgaggaatcaaagttaaacagggaaaaaattgatggagtgaaattggaatcaatgggagtctatcagattctggcgatctactcaactgtcgccagttcactggtgcttttggtctccctgggggcaatcagcttctggatgtgttctaatgggtctttgcagtgtagaatatgcatctgagattagaatttcagagatatgaggaaaaacacccttgtttct(seqidno:32)
这些另外优化的x6、x1和p1序列在下表16中鉴定为“密码子偏好+交换(末端或信号肽)”。所有优化的核苷酸序列通过同源重组至反求遗传学质粒(“优化的ha质粒”)中进行克隆。由于在大肠杆菌中的不稳定性,x6密码子偏好序列不能克隆至反求遗传学质粒。病毒拯救或回收通过用优化的ha质粒与na质粒(编码各种na蛋白,如下表16所示)和pr8骨架质粒共-转染至混合的293ft/mdck细胞培养物,在反求遗传学系统中测试。通过测量细胞培养上清液中的ha活性,监测病毒回收至多10天。ha效价使用火鸡红细胞测定和计算为具有ha活性的最高病毒悬浮液稀释度的倒数。回收的病毒自细胞培养物收获,和用于接种10日龄含胚鸡蛋,接种后72小时测定病毒生长。
所有疫苗候选物作为含至少一种用这种新方法产生的优化的核苷酸序列的病毒成功地回收,如下表16中概述的。在大多数情况下,自细胞培养物回收的病毒也能够在蛋中以高效价(>1x106pfu/ml)生长,从而显示有前景作为在蛋中制造疫苗的种子。cobrap1密码子偏好序列(没有另外的5’或3’末端交换)能够支持在细胞培养物和蛋中的病毒拯救,其中测试了一些而非所有na。因此,在某些情况下,密码子偏好序列足以支持病毒拯救。对于测试的所有na,交换优化的p1序列的末端导致病毒拯救。对于x1和x6优化的序列,仅密码子偏好不足以支持病毒拯救。然而,交换密码子偏好序列的5’和3’编码序列(例如,信号肽、跨膜和/或胞质结构域),允许在细胞培养物和蛋二者中的病毒回收。
表16
实施例2–流感bsmartha的核苷酸序列优化
产生编码工程改造的流感结构蛋白的优化的核苷酸序列的方法使用以下流感bsmartha多肽实施:br08_co1(seqidno:75)、br08_do2(seqidno:76)、br08_do3(seqidno:77)、pan90_do2(seqidno:78)和ma12_ra82(seqidno:79)。对于各smartha,产生两个优化的核苷酸序列:一个按照图1的步骤1-3b获得,和一个按照图1的步骤1-5获得。
更具体地,对于br08_co1、br08_do2、br08_do3、pan90_do2和ma12_ra82smartha的每一个,通过反向翻译smartha氨基酸序列,比较反向翻译的核苷酸序列与流感序列的数据库,和根据图1的步骤3a和3b所示的规则优化反向翻译的核苷酸序列,获得优化的核苷酸序列。优化的核苷酸序列还通过添加来自成功拯救毒株b/memphis/12/1997的5’和3’非编码区进行修饰。
在b/memphis/12/1997的情况下,使用以下5’-和3’-末端核苷酸序列:
5’b/memphis/12/1997末端序列
agcagaagcagagcattttctaatatccacaaaatg(seqidno:103)
3’b/memphis/12/1997末端序列
taaggaaaattaagccctgtattttcctttattgtagtgcttgtttgcttgttatcattacaaagaaacgttattgaaaaatgctcttgttactact(seqidno:104)
优化的br08_co1smartha序列通过交换5’和3’末端与b/brisbane/60/2008的5’和3’末端进一步修饰。更具体地,编码信号肽和在外结构域的初始部分中的5’核苷酸序列与相应的b/brisbane/60/2008序列交换。这种交换不引入信号肽或外结构域区中的变化(即,仅进行密码子改变)。3’末端区,其编码外结构域的一部分、跨膜结构域和胞质尾,也与来自b/brisbane/60/2008的相应序列交换,而不引入蛋白编码序列的变化。在冲突的情况下,使用原始密码子。交换的5’和3’b/brisbane/60/2008末端序列分别对应于seqidno:105和seqidno:106:
5’b/brisbane/60/2008末端序列:
atgaaggcaataattgtactactcatggtagtaacatccaatgcagatcgaatctgcactgggataacatcgtca(seqidno:105)
3’b/brisbane/60/2008末端序列:
gcaggagaattttctctccccacctttgattcactgaatattactgctgcatctttaaatgacgatggattggataatcatactatactgctttactactcaactgctgcctccagtttggctgtaacactgatgatagctatctttgttgtttatatggtctccagagacaatgtttcttgctccatctgtctataa(seqidno:106)
优化的br08_d02smartha序列通过交换5’和3’末端与b/brisbane/60/2008的5’和3’末端进一步修饰。更具体地,编码信号肽和在外结构域的初始部分中的5’核苷酸序列与相应的b/brisbane/60/2008序列交换。这种交换不引入信号肽或外结构域区中的变化(即,仅进行密码子改变)。3’末端区,其编码外结构域的一部分、跨膜结构域和胞质尾,也与来自b/brisbane/60/2008的相应序列交换,而不引入蛋白编码序列中的变化。在冲突的情况下,使用原始密码子。交换的5’和3’b/brisbane/60/2008末端序列分别对应于seqidno:105和seqidno:106。
优化的br08_do3smartha序列通过交换5’和3’末端与b/brisbane/60/2008的5’和3’末端进一步修饰。更具体地,编码信号肽和在外结构域的初始部分中的5’核苷酸序列与相应b/brisbane/60/2008序列交换。这种交换不引入信号肽或外结构域区中的变化(即,仅进行密码子改变)。3’末端区,其编码外结构域的一部分、跨膜结构域和胞质尾,也与来自b/brisbane/60/2008的相应序列交换,而不引入蛋白编码序列中的变化。在冲突的情况下,使用原始密码子。交换的5’和3’b/brisbane/60/2008末端序列分别对应于seqidno:105和seqidno:106。
优化的pan90_do2smartha序列通过交换5’和3’末端与b/brisbane/60/2008的5’和3’末端进一步修饰。更具体地,编码信号肽和在外结构域的初始部分中的5’核苷酸序列与相应的b/brisbane/60/2008序列交换。这种交换不引入信号肽或外结构域区中的变化(即,仅进行密码子变化)。3’末端区,其编码外结构域的一部分、跨膜结构域和胞质尾,也与来自b/brisbane/60/2008的相应序列交换,而不引入蛋白编码序列中的变化。在冲突的情况下,使用原始密码子。交换的5’和3’b/brisbane/60/2008末端序列分别对应于seqidno:105和seqidno:106。
优化的ma12_ra82smartha序列通过交换5’和3’末端与b/brisbane/60/2008的5’和3’末端进一步修饰。更具体地,编码信号肽和在外结构域的初始部分中的5’核苷酸序列与相应的b/brisbane/60/2008序列交换。这种交换不引入信号肽或外结构域区中的变化(即,仅进行密码子改变)。3’末端区,其编码外结构域的一部分、跨膜结构域和胞质尾,也与来自b/brisbane/60/2008的相应序列交换,而不引入蛋白编码序列中的变化。在冲突的情况下,使用原始密码子。交换的5’和3’b/brisbane/60/2008末端序列分别对应于seqidno:105和seqidno:106。
尚未测试用源自流感bsmartha的优化的核酸的病毒回收实验。
实施例3–h3cobra的核苷酸序列优化
产生编码工程改造的流感结构蛋白的优化的核苷酸序列的方法使用6种不同的h3cobra实施。对于各h3cobraha多肽,按照图1的步骤1-3b,获得优化的核苷酸序列。对于这些多肽,不进行任选步骤4和5。
更具体地,对于各h3cobra,通过反向翻译h3cobra氨基酸序列,比较反向翻译的核苷酸序列与流感序列的数据库,和根据图1的步骤3a和3b所示的规则优化反向翻译的核苷酸序列,获得优化的核苷酸序列。
优化的h3cobra核苷酸序列通过同源重组至反求遗传学质粒(“优化的ha质粒”)进行克隆。病毒拯救或回收在反求遗传学系统中通过用优化的ha质粒以及na质粒和pr8骨架质粒共-转染混合的293ft/mdck细胞培养物进行测试。通过测量细胞培养上清液的ha活性,监测病毒回收至多10天。ha效价使用火鸡红细胞测定,和计算为具有ha活性的最高病毒悬浮液稀释度的倒数。自细胞培养物收获回收的病毒,和用于接种10日龄含胚鸡蛋,接种后72小时测定病毒生长。
源自h3cobra多肽的所有优化的核苷酸序列作为含至少一种用这种新方法产生的优化的核苷酸序列的病毒成功地回收。
等同方案
在权利要求中使用序数术语,例如“第一”、“第二”、“第三”等修饰要求保护的要素,本身不意味着一个要求保护的要素的超过另一个的任何优先度、先后次序或顺序,或进行方法行为的时间顺序,而是仅用作区分具有某一名称的一个要求保护的要素与具有相同名称(如果不使用序数术语)的另一个要素的标记,以区分要求保护的要素。
在说明书和权利要求书中,本文使用的冠词“一个”和“一种”,除非有相反的清楚指示,应理解为包括复数指代物。如果一个、超过一个或所有组成员存在于、用于或以其它方式相关于给定的产物或过程,在一组的一个或多个成员之间包括“或”的权利要求或描述被视为得到满足,除非有相反的指示或以其它方式从上下文显而易见。本发明包括其中准确的一个组成员存在于、用于或以其它方式相关于给定的产物或过程的实施方案。本发明还包括其中超过一个或全部组成员存在于、用于或以其它方式相关于给定的产物或过程的实施方案。此外,应理解,本发明包括其中来自一个或多个所列权利要求的一个或多个限制、要素、条款、描述性术语等被引入从属于同一基本权利要求(或者,相关的任何其它权利要求)的另一个权利要求的所有变化、组合和排列,除非另外指明或除非对本领域普通技术人员而言产生矛盾或不一致是显而易见的。当要素作为列表存在时,(例如,马库什组或类似形式),应理解也公开了该要素的每个亚组,和任何要素可从该组中除去。应理解,一般而言,在本发明或本发明的各方面涉及包含具体的要素、特征等时,本发明或本发明的各方面的某些实施方案由这样的要素、特征等组成,或基本上由其组成。为简明的目的,这些实施方案在每种情况下在本文中未以如此多的词语明确阐明。还应理解,本发明的任何实施方案或方面可明确地从权利要求中排除,不管说明书中是否叙述了明确排除。本文提及的描述发明背景和提供关于其实施的另外细节的出版物、网站和其它参考资料通过引用并入本文。