包含多个同源核苷酸序列的载体的制作方法

文档序号:581231阅读:221来源:国知局
专利名称:包含多个同源核苷酸序列的载体的制作方法
包含多个同源核苷酸序列的载体
背景技术
核酸的同源重组现象涉及同源序列内核酸链的物理断裂和交叉再连接。许多研究组研究了哺乳动物细胞内的重组和基因转换,这些研究组监测了用适当构建的病毒或质粒物质感染后的选择性基因的重建(Chakrabarti et al.,Mol. Cell. Biol. 6 =2520-2526, 1986)。这些实验的结果表明,细胞有效地支持分子内和分子间重组和基因转换。(同上)。 分子间重组是指在两个不同核酸分子上存在的同源序列之间的重组,而分子内重组是指在单个核酸分子上存在的同源序列之间的重组。分子间重组可以在质粒或病毒中的基因与细胞内的同源序列之间发生。(Miller et al.,Mol. Cell. Biol. 6 =2895-2902,1986)。这种类型的重组可以导致从减毒病毒产生传染性病毒。Fuller等人对HIV-I gag和HIV-I pol基因的分离序列进行了密码子优化,以提高其在哺乳动物细胞内的表达。这些优化还降低了存在于HIV的gag-pol基因内约200 个碱基对的重叠区中核苷酸的同一性,这还引起了在置于两个独立质粒上的gag和pol开放阅读框与在重组逆转录病毒载体内包含的截短gag基因之间的分子间重组水平的降低。 (Fuller et al.,Hum. Gene Ther. 12 :2081_2093,2001)。分子内重组可以利用载体发生,在所述载体中存在基因或基因片段的重复化区域,该区域作为被插入序列隔开的直接重复。这种类型的重组通常导致插入序列的缺失和一个拷贝的重复序列。分子内重组的频率通常远高于分子间重组。已经在哺乳动物细胞内对质粒载体内的分子内重组水平进行了量化。(Rubnitz and Subrami,Mol. Cell. Biol. 4 =2253-2258,1984)。与同源区域的大小有关,所转染的质粒 DNA内的分子内重组频率为0.306%-0.002%。(同上)。利用小至14个碱基的同源性观察到低重组效率。(同上)。同源序列之间的分子内重组还在包括细小核糖核酸病毒、流感病毒、腺病毒和痘病毒的多个动物病毒中有记载。(Gritz et al.,J.Virol. 64 :5948-5957,1990)。已经证明,在牛痘病毒中随机重复序列在遗传上不稳定。(同上)。在病毒中,已经发现分子内重组的水平远高于在质粒载体中的观察结果。例如,在逆转录病毒中,发现同一 RNA分子中两个相同序列之间的重组频率为约 62%。(Zhang et al. ,J.Virol. 75 =6348-6358,2001) 相对于分子间重组(两个 RNA 分子之间),这些重组的99%为分子内重组(一个RNA分子上的两个序列之间)。(同上)。利用腺相关病毒,也发现分子内重组的效率远高于分子间重组。(Choi et al. , J. Virol. 79 6801-6807,2005)。1型单纯疱疹病毒也显示高水平的重组。(Dutch et al. ,J. Virol. 66 277-285)。在痘病毒中已经发现了高频率的同源重组。使用实验性系统通过在两个1.5kb 的DNA直接重复之间放置胸苷激酶(tk)基因测定牛痘病毒中的重组。(Ball,J. Virol. 61 1788-1795,1987)。在非选择条件下前八次传代的每一个传代过程中,40%的tk+牛痘病毒丧失了其tk+表型。(同上)。在非选择条件下,tk-病毒的丰度提高至总病毒群的99. 73%。 (同上)。甚至在选择条件下,重组以如此高的频率发生以致从单个斑分离的大多数传染性病毒颗粒都含有已经发生重组并因此丧失了 tk基因的DNA。(同上)。利用经设计以表达三个异源基因(全部由VV p7. 5-启动子表达)的重组牛痘病毒,Howley等人,Gene 172 :233-237,1996证明了在重复启动子序列之间的重组。经设计包含来自化脓性链球菌 (Streptococcus pyogenes)的M蛋白的C-重复区(CRP)的牛痘病毒重组体包含含有1至高于 20 个 CRP 拷贝的变体的复杂混合体。(Hruby et al.,P. N. A. S. 88 :3190_3194,1991)。虽然已经证明插入至MVA的不同插入位点并具有约60-75%同源性的多个基因都产生稳定的多重组病毒(W0 03/097846),然而本领域需要以下组合物和方法其降低载体 (例如病毒载体)内的分子内重组水平,从而能够产生包含具有较长的同一性序列段的多个同源核苷酸序列的稳定载体。

发明内容
本发明涉及重组载体及其制备和使用方法。特别地,本发明包括含两个核苷酸序列长度为300个核苷酸的核苷酸序列的载体,各核苷酸序列编码100个氨基酸,其中由所述两个核苷酸序列中的各核苷酸序列编码的100个氨基酸具有至少75%的氨基酸同一性,其中所述两个核苷酸序列中的一个具有至少75个核苷酸不同于另一个核苷酸序列,其中该不同的核苷酸不改变由所述两个核苷酸序列编码的相同氨基酸。意外地,本发明证明,通过系统取代一个核酸分子(例如载体)内的至少两个类似或相同核苷酸序列内的同义密码子,不仅显著降低甚至消除了分子内重组的风险,由此引起含有至少两个或更多个类似或相同核苷酸序列的稳定载体的产生。意外地,本发明中采取的策略还适用于含有三个或更多个类似核苷酸序列的载体。本发明所得的结果证明,可能取代核苷酸序列中的大量核苷酸以降低载体内的分子内重组,同时令人惊奇地,仍维持所编码的蛋白的表达。当根据本发明向核苷酸序列的长序列段中引入大量核苷酸变体时,本领域技术人员预期所述序列或基因的表达可能不再正确地发挥作用,即预期经改变的核苷酸序列不再适于有效表达。本文所采用的策略不仅适用于300个核苷酸的短核苷酸序列段,还适用于长得多的序列段,例如,全长基因,当然,其包含所要求保护的300个核苷酸的序列段。所述结果适用于多个不同的基因、载体和病毒, 并且对疫苗的开发(例如多价疫苗的开发)非常有利,还可能对其它技术(例如蛋白表达或重组细胞系的产生)都是有利的。在其它实施方式中,本发明还包括产生病毒和载体的方法以及降低分子内重组的方法。本发明包括产生上述载体的方法,所述方法包括以下步骤a)提供第一核苷酸序列,其大小为300个核苷酸,编码100个氨基酸,和b)提供第二核苷酸序列,其大小为300个核苷酸,编码100个氨基酸,其中由所述两个核苷酸序列中的各核苷酸序列编码的100个氨基酸具有至少75%的氨基酸同一性,且其中所述两个核苷酸序列中的一个具有至少75个核苷酸不同于另一个核苷酸序列,其中该不同核苷酸不改变由所述两个核苷酸序列编码的相同氨基酸;和c)将所述两个差异核苷酸序列插入载体中。在尤其优选的实施方式中,本发明包括降低载体内的分子内重组的方法,所述载体含有两个大小为300个核苷酸的核苷酸序列,各核苷酸序列编码100个氨基酸,其中由所述两个核苷酸序列中的各核苷酸序列编码的100个氨基酸具有至少75%的氨基酸同一性,所述方法包括取代在一个或两个核苷酸序列中的核苷酸,以产生显示至少75个核苷酸不同的两个差异序列,其中所述不同核苷酸不改变由所述两个核苷酸序列编码的相同氨基酸。当使用病毒载体时,所述方法降低了每代病毒繁殖过程中分子内重组的水平。优选地,每代在小于 20%、15%、10%、5%、3%、2%、1%、0. 5%、0. 1%、0. 05%或 0. 01% 的子
代病毒中发生同源核苷酸序列重组。在另一个优选的实施方式中,本发明包括产生含有两个同源核苷酸序列的病毒 (优选痘病毒)的方法,所述方法包括以下步骤a)提供病毒,该病毒包括大小为300个核苷酸的编码100个氨基酸的核苷酸序列,和b)将大小为300个核苷酸的编码100个氨基酸的第二核苷酸序列插入到病毒中,其中由所述两个核苷酸序列中的各核苷酸序列编码的 100个氨基酸具有至少75%的氨基酸同一性,且其中所述两个核苷酸序列中的一个具有至少75个核苷酸不同于另一个核苷酸序列,其中所述不同核苷酸不改变由所述两个核苷酸序列编码的相同氨基酸。本文使用的“载体”可以为能够向宿主细胞或受试者中递送和表达核酸分子的任何试剂。因此,载体可以为PCR产物或者引入至细胞和/或整合至细胞基因组中的任何核酸;或为可以向其中插入另一个DNA片段从而使所插入的片段复制的复制子,例如质粒、噬菌体或粘粒。通常,当与适当的控制元件相连时载体可以复制。适合本发明使用的载体骨架包括,例如本领域常规使用的那些,例如质粒、病毒、人工染色体、BAC、YAC或PAC或者诸如细菌和真核细胞的重组细胞。术语“载体”包括克隆和表达载体,以及病毒载体和整合载体。“表达载体”是包含调控区的载体。适合本发明使用的表达载体包括但不限于质粒和病毒载体,源自例如植物病毒、噬菌体、杆状病毒、烟草花叶病毒、逆转录病毒和痘病毒。合适的非病毒载体包括质粒,例如 pREP4、pCEP4 (Invitrogene)、pCI (Promega)、pCDM8 (Seed, 1987, Nature 329,840)、pVAX 禾口 pgWiz(Gene Therapy System Inc ;Himoudi et al,2002, J. Virol. 76,12735-12746)。可以从诸如 Novagen (Madison, Wis.)、Clontech (Palo Alto, Calif. ) > Stratagene(La Jolla, Calif.)禾口 Invitrogen/Life Technologies(Carlsbad, Calif.)的公司商购多种载体和表达系统。在疫苗开发中,可以使用重组病毒作为用于向细胞递送遗传物质的运载体或疫苗载体。一旦存在于细胞中,遗传信息被转录和翻译成包括靶向特定疾病的插入抗原的蛋白。 如果通过载体递送至细胞中的抗原诱导机体针对所述抗原的保护免于所述疾病的免疫应答,则所述治疗是成功的。在本发明的优选的实施方式中,所述载体是质粒或病毒载体。病毒载体可以基于减毒病毒,该减毒病毒不能在宿主中复制但能够在所感染的细胞中弓丨入并表达外来基因。所述病毒或所述重组病毒由此能够产生蛋白并将其提呈至宿主的免疫系统。病毒载体的一些主要特征是其能够引发体液(B细胞)和/或细胞介导(T细胞)的免疫应答。病毒载体可以由多种不同的病毒获得。在一个实施方式中,所述病毒为动物病毒。 所述载体尤其可以从选自由以下组成的组中的病毒获得逆转录病毒、小核糖核酸病毒、流感病毒、腺病毒、腺相关病毒(AAV)、痘病毒、疱疹病毒(例如HSV-1)、麻疹病毒和泡沫病毒。研究人员通常使用病毒载体以开发用于预防和治疗传染性疾病和癌症的疫苗。其中,痘病毒(包括金丝雀痘、牛痘和家禽痘(fowl pox))属于最常规的载体疫苗候选物组。由于用于向病毒基因组中插入序列的相对大的容量,和因为其以下能力复制其基因组并在受感染的细胞质而非细胞核中进行转录由此使在其它载体(例如逆转录病毒载体) 中观察到的通过将遗传物质整合至宿主细胞的基因组而产生插入突变的风险最小化,痘病毒是用于向新宿主中输送遗传物质的优选选择。与多数其它动物病毒相比,痘病毒的毒粒较大(详见 Fields et al. , eds. , Virology, 3rd Edition, Volume 2, Chapter 83, pages 2637ff)。在本发明的优选实施方式中,所述病毒载体源自痘病毒(参见例如,Cox et al. “ Viruses in Human Gene Therapy “ Ed J. Μ. Hos, Carolina Academic Press),其可以从痘病毒的任意成员获得,并且尤其可以是禽痘病毒(avipoxvirus)或正痘病毒。适合本发明使用的禽痘病毒的实例包括任何禽痘病毒,例如家禽痘病毒、金丝雀痘病毒、Uncopoxvirus、家八哥痘病毒(Mynahpoxvirus)、鸽痘病毒、鹦鹉痘病毒、鹌鹑痘病毒、孔雀痘病毒、企鹅痘病毒、麻雀痘病毒、燕八哥痘病毒(Starlingpoxvirus)和火鸡痘病毒。优选的禽痘病毒为金丝雀痘病毒和家禽痘病毒。禽痘病毒是天然的宿主限制性的,并且仅在禽类和细胞中再生复制(Taylor et al.,Biological and immunogenic properties of a canarypox-rabies recombinant, ALVAC-RG (vCP65) in non-avian species, Vaccine 13:539-549,1995)。如果用禽痘病毒感染人细胞,则由病毒基因组表达异源基因。然而,禽痘病毒不在人细胞中完整复制,并且因此不存在人受到再生的病毒复制子的伤害的风险。已经构建了表达例如慢病毒基因产物(US 5,766,598)、细胞因子和/或肿瘤相关抗原(US 5,833,975)或狂犬病G糖蛋白(Taylor et al.,Biological and immunogenic properties of a canarypox-rabies recombinant, ALVAC-RG (vCP65) in non-avian species, Vaccine 13:539-549,1995)的多种重组禽痘病毒。已经将表达四个HIV基因gag、pol、env和nef的重组金丝雀痘病毒用在临床试验中(Peters,B. S. ,The basis for HIV immunotherapeutic vaccines, Vaccine 20 688-705,2001)。由于禽痘病毒仅在禽类细胞中再生复制,必须使用这些细胞用于病毒的扩增和重组病毒的产生。金丝雀痘病毒的实例是Rentschler株。根据布达佩斯条约将被称为ALVAC(US 5,766,598)的斑纯化金丝雀痘株保藏在美国典型培养物保藏中心(ATCC),保藏号为 VR-2547。另一个金丝雀痘病毒株为可从Institute Merieux, Inc获得的命名为LF2CEP 524 24 10 75的商业化金丝雀痘病毒疫苗株。家禽痘病毒的实例为FP-l、FP-5和TROVAC株(US 5,766,598)。FP-I是经修饰在一日龄鸡中用作疫苗的Duvette株。所述株是命名为O DCEP25/CEP67/2309 October 1980 的商业化家禽痘病毒疫苗株,并且可获自Institute Merieux, Inc0 FP-5是可从威斯康辛洲麦迪逊的美国科学实验室(Division of Schering Corp.)获得的鸡胚胎来源的商业化家禽痘病毒疫苗株,美国兽医许可号为165,序号为30321。在痘病毒中,牛痘和天花类是最熟知的两类。天花病毒是天花的起因。与天花病毒相比,牛痘病毒通常不在免疫感受态个体中引起系统性疾病,因此已将其用作针对天花进行免疫的活疫苗。在二十世纪八十年代,全世界对牛痘病毒的成功接种在作为天然疾病的天花的根除中达至丨J极点(The global eradication of smallpox. Final report of the global commission for the certification of smallpox eradication ;History of Public Health, No. 4, Geneva :fforld Health Organiziition,1980)。自]lfc,P余了___胃染的高危人群(例如实验室工作人员)外,接种已经中断多年。然而,对例如可能将引起天花的天花病毒用作生物恐怖武器的担心逐增。此外,还存在以下风险其他痘病毒,诸如牛痘、骆驼痘和猴痘,可能能够通过选择机制而突变并获得类似于天花的表型。因此一些政府正在构建基于天花的疫苗储库以在假定或实际天花攻击的接触前(遭遇天花病毒前)或接触后(遭遇天花病毒后)使用。在本发明的尤其优选的实施方式中,所述载体是牛痘病毒载体。牛痘病毒是高度免疫刺激性的,并引起针对其自身基因产物和由插入至牛痘基因组的基因表达的许多外源基因产物两者的强B细胞(体液)介导的免疫和T细胞介导(细胞)免疫。因此,将重组疫苗形式的牛痘病毒看做针对天花和其它传染性疾病以及癌症的疫苗的理想载体。文献中描述的许多重组牛痘病毒都基于完全复制能力的牛痘病毒西方储备株。然而,已知该病毒株具有高的神经毒力并因此不太适合在人和动物中使用(Morita et al. 1987, Vaccine 5,65-70)。合适的牛痘病毒能够选自由以下组成的组哥本哈根株(Goebel et al.,1990, Virol. 179,247-266 and 517-563 Johnson et al.,1993,Virol. 196,381-401),Wyeth株、 NYVAC (参见 W092/15672 和 Tartaglia et al. , 1992, Virology 188,217-232)和高度减毒的经修饰安卡拉(MVA)株(Mayr et al.,1975,Infection 3,6-16) 合适的牛痘病毒的优选实例是从病毒基因组删除18个ORF的高度减毒的牛痘病毒株NYVAC,其源自哥本哈根疫苗株的斑克隆分离物(Tartaglia et al. , NYVAC =A highly attenuated strain of vaccinia virus, Virology 188,217—232,1992)。NYVAC 的特征是在多种人组织培养细胞上的复制能力大幅降低,但保持了对外来抗原诱导强免疫应答的能力。上述所有病毒都等同适合本发明使用。在本发明最优选的实施方式中,所述病毒是已知在接种中特别安全的经修饰的牛痘病毒安卡拉(MVA)。经修饰的牛痘病毒安卡拉(MVA)病毒与属于痘病毒科正痘病毒属的一员的牛痘病毒有关。已经通过真皮牛痘株安卡拉在鸡胚胎成纤维细胞上的516次连续传代而产生 MVA(Chorioallantois vaccinia virus Ankara, CVA)(回顾可参见Mayr, Α. , et al. , Passage History :Abstammung, Eigenschaften und Verwendung des attenuierten Vaccinia-Stammes MVA, Infection 3,6-14,1975) 作为这些长期传代的结果,所产生的MVA病毒的基因组序列缺失约31kb,并由此描述被为对禽类细胞具有高度的宿主细胞限制性(Meyer, H. et al.,Mapping of deletions in the genome of the highly attenuated vaccinia virus MVA and their influence on virulence,J. Gen. Virol. 72, 1031-1038,1991 ; (Meisinger-Henschel et al.,Genomic sequence of chorioallantois vaccinia virus Ankara,the ancestor of modified vaccinia virus Ankara,J. Gen. Virol. 88,3249-3259,2007)。已知在多种动物模型中,所产生的MVA是明显没有毒力的 (Mayr, A. &Danner, K.Vaccination against pox diseases under immunosuppressiveconditions, Dev. Biol. Stand. 41 :225_34,1978)。此外,已经在临床试验中将该 MVA 株作为针对人天花病进行免疫的疫苗进行了测试(Mayr et al.,Zbl. Bakt. Hyg. I,Abt. Org. B 167,375-390[1987], Stickl et al. , MVA vaccination against smallpox :clinical tests with an attenuated live vaccinia virus strain (MVA)(作者译),Dtsch. med. Wschr. 99,2386-2392,1974)。这些研究涉及包括高危患者在内的超过120,000人,并且证明与基于牛痘的疫苗相比,MVA减少了毒力或传染性并且保持了良好的免疫原性。本发明包括利用任意或所有MVA病毒产生的重组MVA病毒。MVA株的实例为在美国典型培养物保藏中心(ATCC,马纳萨斯(Manassas),VA 20108, USA)保藏的保藏VR-1508。 在另一个实施方式中,可以根据本发明使用MVA-Vero株或其衍生物。该MVA-Vero株已经保藏在欧洲动物细胞培养物保藏中心,保藏号为ECACC V99101431和ECACC 01021411。本发明使用的MVA病毒株的其它实施例为MVA 572和575株,其保藏在欧洲动物细胞培养物保藏中心(ECACC,英国索尔兹伯里(Salisbury)),保藏号分别为ECACCV94012707和ECACC V00120707。尤其优选的MVA病毒为例如保藏在ECACC的保藏号为V00083008的MVA变异株MVA-BN ,和具有与MVA-BN⑧相同的性质的衍生物。MVA-BN 是在卓越的第三代天花疫苗的制造中使用的病毒。MVA-BN 是由MVA株 571/572进一步传代而形成的。截至目前,包括患有遗传过敏性皮炎(AD)和HIV传染病的受试者在内的超过1500位受试者已经在临床试验中接种了基于MVA-BN 的疫苗。与所保藏的MVA-BN 株具有相同性质的衍生物具有在体外在鸡胚胎成纤维细胞 (CEF)中再生复制的能力,但没有在人细胞中再生复制的能力,在人细胞中MVA 575或MVA 572可以再生复制。最优选地,该MVA没有在人角化细胞系HaCaT、人胚胎肾细胞系293、人骨肉瘤细胞系143B和人宫颈癌细胞系HeLa中再生复制的能力。本申请中使用的术语“不能再生复制”分别如WO 02/42480和美国专利6,761,893 中的定义。因此,所述术语适用于利用在美国专利6,761,893中描述的试验(该实验通过引用并入本文)在感染后4天的病毒扩增比小于1的病毒。病毒的“扩增比”是由被感染的细胞产生的病毒(输出量)与最初用于感染初始位置的细胞的病毒量(输入量)的比。 输出量和输入量之间的比为“1”表示由所感染的细胞产生的病毒量与最初用于感染细胞的病毒量相等的扩增状态。在最优选的实施方式中,在本发明中使用的MVA株为MVA-BN 或上述衍生物。 MVA-BN 的性质,可以评价MVA株是否是MVA-BN 或其衍生物的生物实验和可以获得 MVA-BN 或具有MVA-BN 性质的MVA的方法的描述公开于WO 02/42480中。该申请的内容通过引用并入本申请。可以通过,例如经修饰的牛痘病毒安卡拉(MVA),例如MVA-572或 MVA-575,的进一步传代和任选地通过斑或颗粒纯化而衍生高度减毒的MVA-BN 病毒。与祖代CVA病毒相比,MVA-BN夬少约13% (26. 5kb,来自6个主要缺失位点和多个次要缺失位点)的基因组。所述缺失影响一些毒力和宿主范围基因以及编码A型包涵体蛋白(ATI) 的基因的大片段和编码引导成熟病毒颗粒进入A型包涵体的结构蛋白基因。特别地,本发明对MVA性质的限定,如MVA-BN⑧的性质和MVA-BN 的衍生物的性质和限定,参考WO 02/42480的描述。所述参考还公开了 MVA和其它牛痘病毒如何能够传代。简而言之,用所述病毒感染真核细胞。所述真核细胞是易于用各痘病毒感染且允许感染性病毒的复制和产生的细胞。对于MVA,该类型细胞的实例是鸡胚胎成纤维细胞(CEF)和BHK 细胞(Drexler et al.,Highly attenuated modified vaccinia Ankara replicates in baby hamster kidney cells,a potential host for virus propagation,but not in various human transformed and primary cells,J. Gen. Virol. 79,347-352,1998)。CEF 细胞可以在本领域技术人员已知的条件下培养。优选地,在静止瓶或转瓶中在不含血清的培养基中培养CEF细胞。所述培养优选在37°C进行48-96小时。对于感染,优选以TCID5tl 为0. 05-1的感染复数(MOI)使用MVA,并且优选在37°C培养48-72小时。本发明使用的病毒可以在多种细胞培养物上传代,尤其在动物细胞培养物上传代。所述病毒能够感染易感的细胞培养物和可再生复制物。通过本领域的常规技术收集子代病毒。例如,对于MVA病毒和其它牛痘病毒,可以用所述病毒感染含血清或不含血清的培养基中的鸡胚胎成纤维细胞(CEF)。在所述病毒已经被允许再生复制后,收集子代病毒。本发明还涉及能够表达两个或更多个同源性核苷酸序列并且尤其是编码序列的重组痘病毒,优选牛痘病毒,尤其是MVA。所述病毒可以包含两个、三个、四个或更多个同源性核苷酸编码序列。本发明的载体包含大小为300个核苷酸的两个核苷酸序列。在优选的实施方式中,所述载体包含三个、四个、五个、六个或更多个核苷酸序列,这些核苷酸序列当然也包含本发明要求保护的两个核苷酸序列。当然,300个核苷酸也可以是较长核苷酸序列的一部分。此外,在多个实施方式中,所述两个或更多个核苷酸序列的大小为300、350、400、 450、500、600、700、800、900、1000、1500、2000、2500 或 3000 或甚至更多个核苷酸,其均可以
是较长核苷酸序列的一部分,并且其当然均可以包含本发明要求保护的300个核苷酸。本文使用的术语“多核苷酸”、“核苷酸序列”、“核酸”、“核酸分子”、“核酸序列”可交换使用,并且定义了多脱氧核糖核酸(DNA)或多核糖核酸(RNA)分子或其任何组合的聚合物。所述定义包括单链或双链、线性或环状、天然存在或合成的多核苷酸。本发明的核苷酸序列可以是编码序列,并且可以分别包含完整的基因。本文使用的术语“编码序列”指编码具体的氨基酸序列的核苷酸序列。基因的非编码序列包括内含子和控制区,例如启动子、操纵子和终止子。所述核苷酸序列还可以包含基因片段。所述核苷酸序列可以包含合成序列,例如编码氨基酸连接子序列或表位的核苷酸序列。所述核苷酸序列可以由基因、基因片段和合成序列的混合物组成。所述核苷酸序列还可以包含类似物,诸如核苷酸类似物、磷酸酯类似物和/或戊糖类似物。核苷酸类似物的定义中还包括其中的磷酸酯和/或糖磷酸酯连接被诸如N-(2-氨基乙基)_甘氨酰胺和其它胺的其它类型的连接代替的核苷酸(参见,例如 Nielsen et al.,1991,Science 254 1497-1500 ;WO 92/20702 ;美国专利 5,719,262 ; 美国专禾IJ 5,698,685 ;);吗啉代(参见例如美国专利5,698,685 ;美国专利5,378,841 ;美国专禾Ij 5,185,144);氨基甲酸酯(参见例如 Stirchak&Summerton, 1987,J. Org. Chem. 52 4202);亚甲基(甲基亚氨)(参见例如 Vasseur et al. ,1992, J.Am. Chem. Soc. 114:4006); 3'硫甲缩醛(3' thioformacetals) (3 ‘ thioformacetals)(参见例如 Jones et al., 1993,J. Org. Chem. 58 2983);氨基磺酸酯(参见例如美国专利5,470,967);通常被称为 PNA 的 2-氨基乙基甘氨酸(参见例如 Buchardt,W092/20702 ;Nielsen (1991) Science 254 1497-1500);及其他(参见例如美国专利 5,817,781 ;Frier&Altman, 1997, Nucl. Acids Res. 25 4429和其中引用的参考)。磷酸酯类似物包括但不限于(i)Cl_C4烷基磷酸酯,例如甲基磷酸酯;(ii)氨基磷酸酯;(iii)Cl-C6烷基-磷酸三酯;(iv)硫代磷酸酯;和(ν) 二硫代磷酸酯。进一步的修饰包括化学修饰(参见例如WO 92/03568 ;US 5,118,672),以提高核酸的体内稳定性、增强其递送或降低宿主受试者的清除率。此外,在一个实施方式中,所述核苷酸序列可以包含融合基因、人工基因和多表位。本文所指的融合基因是由两个事先分离的基因、基因片段或人工DNA或表位形成的杂合基因,其可以作为移位、中间缺失或倒置的结果而发生。可以通过连接至少两个DNA片段而构建融合基因,其中所述DNA片段编码相同或不同的氨基酸序列。融合蛋白可以促进蛋白的表达和/或纯化。例如,本发明的多肽可以作为谷胱甘肽-S-转移酶(GST)融合蛋白而产生。可以使用此类GST融合蛋白以简化本发明多肽的纯化,例如通过使用谷胱甘肽衍生基质而纯化(参见例如Current Protocols in Molecular Biology, eds. Ausubel et al.,(N. Y. John Wiley&Sons,1991))。在另一个实施方式中, 编码纯化前导序列(例如在重组蛋白的期望部分的N末端的聚-(His) /肠激酶切割位点序列)的融合基因可以使所表达的融合蛋白通过使用Ni2+金属树脂的亲和层析而纯化。然后可通过使用肠激酶处理而使纯化前导序列随后被除去,从而提供纯化蛋白(例如,参见 Hochuli et al.,(1987)J. Chromatography 411 177 ;禾口 Janknecht et al.,PNAS USA88 8972)。编码允许与之融合的多肽的检测、分离、增溶和/或稳定化的多肽的其他异源序列包括聚His标签、myc、HA、蛋白A、蛋白G、钙调蛋白结合肽、硫氧还蛋白、麦芽糖结合蛋白、 聚精氨酸、聚His-Asp、FLAG、免疫球蛋白的部分和胞转肽。制备融合基因的技术是为人熟知的。实际上,根据常规技术,编码不同多肽序列的多个DNA片段的连接采用以下进行连接用的平端化或交错端化末端、提供适当末端的限制性酶消化、适当的粘末端填充、避免不期望连接的碱性磷酸酶处理以及酶促连接。在另一个实施方式中,所述融合基因可以通过包括自动化DNA合成仪在内的常规技术合成。或者, 基因片段的PCR扩增可以通过以下进行利用在两个连续基因片段之间产生互补突出端的锚定引物进行,随后可将所述连续基因片段退火以产生嵌合基因序列(例如,参见Current Protocols in Molecular Biology, eds. Ausubel et al. , John Wiley&Sons : 1992),禾口,通过其中两个或更多个多核苷酸具有相同序列段的融合PCR,其中PCR反应能够产生融合的多核苷酸序列。在另一个优选的实施方式中,本发明的核苷酸序列编码多表位。多表位为包含从至少一个蛋白/抗原,优选从多于一个蛋白/抗原分离的表位的嵌合蛋白。所述表位可以是“分离的”或“生物纯的”。术语“分离的”表示基本不含在其天然存在的环境中发现时通常与之相随的组分的物质。“分离的”表位指不包括由其衍生所述表位的抗原或蛋白的完整序列的相邻氨基酸的表位。对于特定氨基酸序列,“表位”是在特定免疫球蛋白的识别中涉及的氨基酸残基组,或者在τ细胞的情况下是被T细胞受体蛋白和/或主要组织相容性复合体(MHC)分子识别所必需的那些残基。术语“肽”是指典型地通过相邻氨基酸的氨基和羧基之间的肽键而彼此相连的系列氨基酸。所述表位具有一定长度并结合至在免疫系统中发挥作用的分子,优选HLA I类和 T细胞受体。在多表位构建体中的表位可以是HLA I类表位和任选的HLA II类表位。HLA I类表位是指CTL表位,HLA II类表位是指HTL表位。一些多表位构建体可以具有HLA I类表位的一个亚群和HLA II类表位的另一个亚群。CTL表位通常由长度为13个或更少的氨基酸残基,长度为12个或更少的氨基酸残基,长度为11个或更少的氨基酸残基,优选长度为8-13个氨基酸,最优选长度为8-11个氨基酸(即8、9、10或11个氨基酸)组成。HTL表位由长度为50个或更少的氨基酸残基,通常为长度为6-30个残基,更通常为长度为12-25 个氨基酸残基组成,最优选由长度为15-20个氨基酸(即15、16、17、18、19或20个氨基酸) 组成。本发明的多表位构建体优选包含2个或更多个,5个或更多个,10个或更多个,13个或更多个,15个或更多个,20个或更多个,或25个或更多个CTL表位。更具体地,所述多表位构建体包含至少 2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、 25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、 50,55,60或更多个CTL表位。本发明的同源核苷酸序列可以源自任何生物、微生物,例如任何病毒、任何细菌、 任何真菌或寄生生物。所述同源核苷酸序列可以相对于载体序列为异源的,或者相对于其为同源的例如当使用病毒作为载体时,例如为了过表达病毒蛋白以获得增强的免疫反应性或安全性,也可以根据本发明增加病毒自身的核苷酸序列。优选地,所述同源核苷酸序列源自传染微生物或病原微生物,最优选来自所述微生物的不同株或分化体、变体、亚型或血清型。术语“株”或“分化体”为本领域技术人员熟知的技术术语,是指微生物的分类系统。 所述分类系统将目前表征的所有微生物分为科、属、种、株的分级次序(Fields Virology, ed. by Fields B. N. ,Lippincott-Raven Publishers,4th edition2001)。科成员的标准是其在系统发生学上的关系,属包括具有相同特征的所有成员,将种定义为构成复制谱系并占据特定的生态位的多特性分类(polythetic class) 0术语“株”或“分化体”描述以下微生物,即病毒其具有相同特征,如基础形态或基因组结构和组构(organisation),但生物特征如宿主范围、组织嗜性、地理分布、减毒性或致病性不同。术语“变体”或“血清型”进一步区分同一株的成员,也被称为亚型,其由于微小的基因组变异而显示单独的感染谱或抗原特性。根据本发明的进一步实施例,所述同源核苷酸序列优选选自病毒。病毒的代表性实例包括但不限于HIV(HIV-I或HIV-2)、疱疹病毒(例如HSVl或HSV2)、细胞巨化病毒 (CMV)、爱泼斯坦巴尔病毒(EBV)、肝炎病毒(例如甲型肝炎病毒(HAV)、HBV、HCV和戊型肝炎病毒)、黄病毒(例如黄热病毒)、水痘-带状疱疹病毒(VZV)、副粘病毒、呼吸道合胞病毒 (RSV)、副流感病毒、麻疹病毒、流感病毒和乳头瘤病毒。根据另一个实施方式,所述同源核苷酸序列选自登革热病毒基因。最优选源自所述病毒的不同血清型的同源基因,其中所述基因可源自4种登革热病毒血清型中的一种、 两种、三种或全部。在优选的实施方式中,所述两个同源核苷酸序列编码呼吸道合胞病毒(RSV)基因。在优选的实施方式中,所述同源核苷酸序列编码RSV-F和/或RSV-G蛋白。优选地,所述RSV基因之一为全长,另一个被截短。在另一个优选的实施方式中,所述两个优选三个同源核苷酸序列编码埃博拉病毒 (EBOV)蛋白。编码埃博拉病毒(EBOV)蛋白的三个同源核苷酸序列当然也覆盖两个同源核苷酸序列。在优选的实施方式中,所述同源核苷酸序列编码EBOV糖蛋白(GP)。在尤其优选的实施方式中,所述核苷酸序列编码来自EBOV株EBOV-B (Bundibugyo)、EBOV-S (苏丹埃博拉病毒株Gulu)和EBOV-Z (扎伊尔埃博拉病毒株Mayinga)的糖蛋白前体蛋白。在另一个实施方式中,所述同源核苷酸序列选自细菌。合适的细菌的代表性实例包括但不限于奈瑟菌属(Neisseria)(例如淋病奈瑟菌(N. gonorrhea)和脑膜炎奈瑟菌 (N. meningitidis);包特氏菌属(Bordetella)(例如百日咳包特氏菌(B. pertussis)、副百日咳包特氏菌(B. parapertussis)和支气管炎包特氏菌(B. bronchis印tica));分枝杆菌属(Mycobacteria)(例如结核分枝桿菌(M. tuberculosis)、牛分支桿菌(M. bovis)、麻风分枝杆菌(M. leprae)、鸟分枝杆菌(M. avium)、副结核分枝杆菌(M. paratuberculosis)、耻垢分枝杆菌(M. smegmatis));军团菌属(Legionella)(例如肺炎军团菌(L. pneumophila)); 埃希氏菌属(Escherichia)(例如肠产毒性大肠杆菌(enterotoxic Ε. coli)、出血性大肠杆菌(enterohemorragic E. coli)、肠致病性大肠杆菌(enteropathogenic E.coli);志贺氏菌属(Shigella)(例如宋内氏痢疾杆菌(S. sonnei)、痢疾志贺氏菌 (S. dysenteriae)、福氏志贺氏菌(S. fIexnerii));沙门氏菌属(Salmonella)(例如伤寒沙门氏菌(S. typhi)、副伤寒沙门氏菌(S. paratyphi)、猪霍乱沙门氏菌(S. choleraesuis)、 肠炎沙门氏菌(S.enteritidis));李斯特菌属(Listeria)(例如单核细胞增多性李斯特菌(L. monocytogenes));螺杆菌属(Helicobacter)(例如幽门螺杆菌(H. pylori)); 假单胞菌属(Pseudomonas)(例如绿脓假单胞菌(P. aeruginosa));葡萄球菌属 (Staphylococcus)(例如金黄色葡萄球菌(S. aureus)、表皮葡萄球菌(S^pidermidis)); 肠球菌属(Enterococcus)(例如粪肠球菌(E. faecalis)、屎肠球菌(E. faecium));杆菌属(Bacillus (例如炭疽杆菌(B. anthracis));棒状杆菌属(Corynebacterium)(例如白喉棒状杆菌(C. diphtheriae))和衣原体(Chlamydia)(例如沙眼衣原体(C. trachomatis)、 肺炎衣原体(C. pneumoniae)、鹦鹉热衣原体(C. psittaci))。寄生生物的代表性实例包括但不限于变形体(Plasmodium)(例如恶性变形体(P. falciparum));弓形体(Toxoplasma) (例如刚地弓形体(T. gondii));利什曼原虫属(Leshmania)(例如硕大利什曼原虫 (L. major));肺孢子虫(Pneumocystis)(例如卡氏肺孢子虫(P. carinii));和血吸虫 (Schisostoma)(例如曼氏血吸虫(S. mansoni))。真菌的代表性实例包括但不限于假丝酵母属(Candida)(例如白假丝酵母(C. albicans))和曲霉菌(Aspergillus)。所述至少两个核苷酸序列可以为相同大小或不同大小。在优选的实施方式中,所述两个核苷酸序列中的一个相对于另一个被截短。所述截短可以在5’或3’端。在多种实施方式中,所述两个核苷酸序列的300个核苷酸编码具有至少75%、 80 %、85 %、90 %、95 %、98 %、99 %或100 %的氨基酸同一性的100个氨基酸。在优选的实施方式中,所述氨基酸同一性在 100、125、150、175、200、250、300、350、400、450、500、600、700、 800,900或1000或更多个邻接的氨基酸序列段内。在尤其优选的实施方式中,所述氨基酸在至少150或200个邻接氨基酸的序列段内具有至少5%、80%、85%、90%、95%、98%、99%或100%的氨基酸同一性。
在其它优选的实施方式中,由所述两个核苷酸序列编码的蛋白在300或500个邻接氨基酸的序列段内具有至少75%、80%、85%、90%、95%、98%、99%或100%的氨基酸同一性。在其它优选的实施方式中,由所述至少两个核苷酸序列编码的蛋白在成对比较中在100、200、400、600或800个邻接氨基酸的序列段内具有85% -100%,尤其是100%的氨
基酸同一性。本文使用的涉及“百分比序列同一性”的任何术语,例如“氨基酸同一性”是指任一给定的查询序列和目标序列之间的同一性程度。具体而言,以下术语用于描述两个或更多个核苷酸、多核苷酸或氨基酸序列之间的序列关系“参考序列”、“比较窗口”、“序列同一性”、“序列同一性百分比”和“基本相同”。 “参考序列”是用作序列比较的基础的限定序列;参考序列可以是较大序列的子集。在两个或更多个核酸或多肽序列的情况下,术语“相同”或百分比“同一性”是指 在使用序列比较算法或通过人工比对和目测检查测定时,当进行比较和比对以在比较窗口或指定区域上将对应最大化时,两个或更多个序列或子序列是相同的或具有特定百分比的相同(例如,在成对比较中具有75%同一性、80%同一性、85%同一性、90%同一性、99%同一性或100%同一性)氨基酸残基或核苷酸。百分比通过确定两个序列中相同核酸碱基或氨基酸残基存在的位置数来计算,以获得匹配位置数,将匹配位置数除以比较窗口中的位置总数并使结果乘以100%以获得序列同一性百分比。在两个核酸或多肽的情况下,短语“基本相同”是指当在使用序列比较算法或通过目测检查测定时,当进行比较和成对比对以将对应最大化时,具有至少约85%同一性、至少约 86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100%的核苷酸或氨基酸残基同一性的两个或更多个序列或子序列。在典型实施方式中,基本相同发生在序列的长度至少约50个残基的区域上。在另一个典型的实施方式中,基本相同发生在序列的长度至少约100个残基的区域上。在再一个典型的实施方式中,基本相同发生在序列的长度至少约150个残基或更多的区域上。在一个典型的实施方式中,序列在核酸或蛋白序列的整个长度上基本相同。对于序列比较,典型地,一个序列作为参考序列,使测试序列与之比较。当使用序列比较算法时,将测试序列和参考序列输入计算机,如果需要设定子序列坐标 (subsequence coordinate),并设定序列算法程序参数。可以使用默认程序参数,或者可以设定可选的参数。然后,根据程序参数,序列比较算法计算测试序列相对于参考序列的百分比序列同一性。本文使用的“比较窗口,,包括任一个邻接位置数的片段,所述邻接位置数选自由以下组成的组20-600,通常为20-50、约50-约100、约100-约200、更通常为约100-约150 或约 20、50、100、150、200、250、300、350、400、450、500、600、700、800、900、1000、1500、2000、 2500或3000或者甚至更多,其中将序列和邻接位置数相同的参考序列进行最佳比对后,可以比较所述两个序列。百分比同一性可以使用Needleman和Wunsch比对方法(J. Mol. Biol. 48 ; 443-453(1970))确定,该方法已被证明等同于 kllers(SIAM J. of Applied Math26 ; 787-793(1974))。例如,百分比同一性可以通过以下来确定利用Devereux等人描述的 (Nuc 1. Acids Res. 12 :387,1984)可获自威斯康辛大学遗传计算机组(UWGCG)的GAP计算机程序6.0版对序列信息进行比较。GAP程序的优选默认参数包括(1)用于核苷酸的一元比较矩阵(包含用于同一性值的1和用于非同一性的值0),以及Gribskov and Burgess, Nucl Acids Res. 14 :6745,1986 的权重比较矩阵,如 Schwartz and Dayhoff, eds. , Atlas of Protein Sequence and Structure, National Biomedical Research Foundation, pp. 353-358,1979中所述,(2)每个空隙的罚分3. 0,每个空隙中的每个符号额外罚分0.10,(3)末端空隙不罚分。另一个合适的工具是使用来自VectorNTI Advance程序(INVITR0GEN)的 ContigExpress,例如 2007 年的 10. 3. 1 版。根据本发明,为了防止分子内重组,使用遗传密码的简并性以使同源或相同核苷酸序列具有较低同源性。所述差异可能已经天然包含在核苷酸序列中和/或通过取代人工包含于其中。在多个实施方式中,源自天然加源自人工取代的不同核苷酸的数量为至少75、 80、85、90、95、100、125、150、175、200、250、300、350、400、450 或 500。优选地,所述不同碱基的数量为至少75、200或450。差异数当然随核苷酸序列的核苷酸数量而分别变化和增加。在优选的实施方式中,至少75、80、85、90、95、100、125、150、175、200、250、300、 350、400、450或500个核苷酸被取代。所述取代独立于例如通过沉默突变而包含于其中的已经存在的多个不同核苷酸而被人工引入。在多个实施方式中,优选在取代后具有不大于13、12、11、10、9、8、7、6、5或4个邻接核苷酸的同一性序列段的两个核苷酸序列。在大于两个核苷酸序列的情况下,优选取代后不大于20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5或4个邻接核苷酸的同一性序列段。在另一个实施方式中,所述核苷酸序列在300、400、500、600、700、800、900、100、 1100、1200、1300、1400、1500或1600或更多个核苷酸中可以具有至少75、100、150、200、 250、300、350、400或450个取代核苷酸。在本发明的情况下,利用不同核苷酸的核苷酸取代表示通过其它核苷酸的核苷酸技术或人工置换。优选地,所述取代核苷酸不改变所编码的氨基酸序列。取代可以通过以下来进行鉴定在编码相同氨基酸的两个同源核苷酸序列中的密码子,改变所述两个同源核苷酸序列之一的密码子从而使所述密码子仍然编码相同的氨基酸。可以在一个、两个或所有同源核苷酸序列中进行改变。例如,脯氨酸由密码子CCA、CCC、CCG和CXU编码(在DNA水平上U被T代替)。可将最初在两个同源核苷酸序列中编码两个脯氨酸的简单核苷酸序列CCCCCC,在所述两个同源核苷酸序列之一中变换为也编码两个脯氨酸的CCACCG。或者,可将编码脯氨酸-脯氨酸的序列之一变换成CCCCCG,另一个变换成CCACCC。较复杂的实例是丝氨酸,其由UCA、UCC、UCG、UCU、AGC和AGU编码。类似地,可将最初编码两个不同丝氨酸的UCAUCA在多个同源序列中变换成AGCAGC (与UCAUCA没有相同的核苷酸)和UCGAGU(和UCAUCA仅有一个位置相同或者与AGCAGC有两个位置相同)等。 这样可以在向编码丝氨酸-丝氨酸的两个或更多个核苷酸序列中引入不同的核苷酸变体时具有更高的灵活性。优选地,在本发明中描述的密码子优化避免了针对期望宿主的稀有密码子,原因是稀有密码子可阻止或降低编码蛋白的表达。此外,优选避免可以引入用于期望宿主的核酸信号的取代。此信号包括但不限于剪接信号、终止信号和起始信号。优选地,根据所用载体的类型可以避免以下序列基序,例如在不是痘病毒载体的许多其它载体中不需要避免牛痘病毒早期转录终止信号-内部TATA-盒、chi-位点和核糖体进入位点;-富含-AT和富含-GC的序列段;-ARE、INS 和 CRS 序列元件;-重复序列和RNA二级结构;-(隐藏的)剪接供体位点和接受体位点和分支点;和
-牛痘早期转录终止信号(TTTTTNT)。


参考附图将更全面地理解本发明,其中图1描述了编码全长RSV-F(F)蛋白的核苷酸序列与编码所述取代的截短RSV-F β s (F es)蛋白的核苷酸序列的比对。用黑色标注相同序列,没有标注取代核苷酸。显示了引物Al和B2的位置。图2描述了全长RSV-F(F)蛋白和截短RSV-F截短(F觀)蛋白的比对。RSV-F的全长序列被截短50aa以形成截短RSV-F 蛋白。RSV-F 蛋白占全长蛋白的约91%。图3描述了在人细胞系中来自重组MVA-BN 病毒的RSV-F和RSV-F 的表达。 使用用MOI为10的基于MVA-BN 的不同病毒感染后的受感染人细胞提取物的蛋白印迹, 其中在传染后24小时进行裂解。MVA-BN (空载体对照;泳道1),MVA_mBm72B(具有全长 RSV-F 的重组 MVA-BN 泳道 2) ,MVA-mBN173B (具有截短 RSV-F Js的重组 MVA-BN 泳道3)和泳道4 :MVA-mBN175B (具有RSV-F和RSV-F截短的重组MVA-BN )。所计算的蛋白分子重量为=RSV-F (61. 6kDa)和 RSV-F—截短(56. IkDa)。图4A-C 描述了 MVA-mBN175B 的 PCR 分析。显示了 RSV-F (F)和 RSV-F 截短(F 截短)。 A 利用不同引物对的PCR结果。M=标准物(Ikb-梯度,New England Biolabs)。泳道1为 MVA-mBN175B0泳道2为阳性对照质粒(pBN;345)。泳道3为MVA_mBN 。泳道4为水对照。 泳道5为阳性对照质粒(pBN343)。B 显示用于图4A所示的PCR的引物位置的MVA_mBN175B 的图示。C 显示引物位置的野生型MVA-mBN— 的图示。图5A-C描述了在双重组MVA中全长RSV-F基因(F)和截短F基因(F efi)之间的假设重组F/Fteun以及PCR引物在重组和非重组病毒以及对照质粒中的位置。A :MVA-mBN175B0 B :pMISC173。C :pMISC172。图6描述了从用MVA-mBm75B感染的细胞分离的DNA的PCR分析。泳道1和7 为标准物泳道。泳道2为MVA-mBm75B。泳道3为用于F基因的质粒对照(pBN343)。泳道4为用于F基因的质粒对照(pBN345)。泳道5为MVA_BN_ 。泳道6为水对照。尤其由 MVA-mBN175B中的RSV-F基因和截短的F基因RSV-F 之间的假设重组产生的PCR预期产物为613个碱基对。图7描述了三个EBOV(埃博拉病毒)GP(糖蛋白)蛋白序列的比对。对埃博拉病毒株EB0V-B、EB0V_S和EBOV-Z的三个GP蛋白的氨基酸序列进行了比对。在比对中不允许空隙。所有三个蛋白序列的总的同一性为48.5%。灰色背景所有三个蛋白序列都相同。 黑色背景在两个蛋白中相同。
图8A和8B描述了在重组的基于MVA-BN 的构建体中使用的三个EBOV GP编码序列的比对。在优化前(未优化;参见图8A)和优化后(优化;参见图8B)将起源于三个 EBOV株EB0V-B、EB0V_S和EBOV-Z的GP基因的编码序列进行比对。在比对中不允许空隙。 灰色背景在三个编码序列中相同的核苷酸位置。黑色背景在两个编码序列中相同的核苷酸位置。在优化前(未优化)三个基因的核苷酸位置的同一性为45.3%,而优化后(优化)为 44.6%。图9描述了在重组的基于MVA-BN 的构建体中使用的三个EBOV GP编码序列的成对比对。在优化前(未优化;参见图9A)和优化后(优化;参见图9B)对起源于三个EBOV 株EBOV-B、EBOV-S和EBOV-Z的GP基因的编码序列进行成对比对。在比对中不允许空隙。 灰色背景在所述编码序列中相同的核苷酸位置。将优化前(未优化)和优化后(优化) 三个基因的核苷酸位置的同一性列于表C。图10描述了包含全长(RSV-F)和截短(RSV-F _)蛋白的质粒pMISC210的限制性酶切和质粒图谱。泳道1 包含RSV-F和RSV-F 的质粒PMISC210 ;泳道2 仅包含RSV-F afi的对照质粒PMISC209 ;泳道3 分子量标准。显示了标准物条带的以碱基对(bp)计的大
实施例实施例1取代的截短F基因的制备期望产生表达全长RSV-F蛋白和截短形式RSV-F 两者的重组MVA。然而,基于利用含有重复序列的MVA和其它牛痘病毒的结果,预期分子内重组将引起F基因的两个拷贝之间的重组,导致F基因的拷贝之一缺失。为了使两个F基因之间存在的相同核苷酸的长序列段最小,取代编码RSV-F 基因的核苷酸序列中的密码子,同时保持F基因的氨基酸序列。避免使用哺乳动物和鸡的稀有密码子。同时,还避免可能引入核酸信号的取代。此类信号包括内在TATA-盒、chi-位点和核糖体进入位点;富含AT和富含GC的序列段;ARE、INS和CRS序列元件;重复序列和RNA 二级结构;(隐藏的)剪接供体位点和接受体位点,和分支点;以及牛痘终止信号 (TTTTTNT)。与全长RSV-F蛋白的编码序列相比,取代核苷酸序列如图1所示。虽然遍及两个编码序列保持显著的同一性,但在两个编码序列内不存在大于9个连续核苷酸的大的同一性序列段。图2对两个编码序列的所编码的蛋白进行比对。两个蛋白在前5M个氨基酸上具有100%的同一性(取代F蛋白在羧基末端被截短)。因此,虽然这两个编码核苷酸序列编码相同的氨基酸序列段,但所述序列之一相对于另一个已经被取代。实施例2包含RSV-F基因的重组病毒的制备在两个不同的整合位点将编码全长RSV-F基因的DNA插入到MVA中以产生 MVA-mBN170B 和 MVA_mBm72B (在 IGR88/89 位点)。在 IGR148/149 位点将所取代的 RSV-F 截短基因插入到MVA中以产生MVA-mBm73B。然后产生双重组MVA,其包含在IGR88/89位点插入至MVA的全长RSV-F基因, 和在IGR148/149位点插入至同一 MVA的取代RSV-F 基因。将所述双重组病毒称为MVA-mBN175B0该病毒的图示示于图4B。实施例3重组病毒的F蛋白表达为了测定蛋白是否表达自取代核苷酸序列,对用编码全长RSV-F基因的重组的基于MVA-BN 的病毒(MVA-mBm72B)、编码取代RSV-F截短基因的病毒(MVA_mBm73B)和编码全长和RSV-F ^基因两者的双重组病毒(MVA-mBm75B)感染的人细胞系的蛋白提取物进行蛋白印迹分析。如所预期的,通过蛋白印迹分析(图3),所有三个病毒都显示适当大小的RSV-F蛋白的产生,然而MVA-BN ‘ 对照(空载体)不显示任何条带。因此,从取代编码核苷酸序列表达的全长和截短F蛋白从单重组MVA-BN⑧各自表达,但在人细胞系中,两者还从一个双重组MVA-BN 病毒(MVA-mBm75B)共表达。实施例4重组病毒的生长用包含全长F基因和取代RSV-F 基因两者的构建体MVA-mBN175B或者仅包含全长F基因的构建体感染鸡胚胎成纤维细胞,以获得第一病毒粗储备物。与仅包含全长F基因的病毒的滴度(1. 46x107TCID50)相比,包含全长F基因和截短F基因两者的双重组病毒观察到了类似滴度(1. 3^107TCID50)。这些结果表明,正在产生稳定的双重组MVA,F基因的两个拷贝之间的重组受到了序列中的取代核苷酸碱基的限制。实施例5重组病毒的PCR分析利用图4B和4C描述的插入特异性和侧翼特异性引物对对用MVA-mBN175B或 MVA-BN 感染的细胞的DNA进行PCR分析。如所预期的,利用特异于全长F基因的引物Al/ A2的PCR A在用MVA-mBN175B感染的细胞中和特定质粒阳性对照中检测到大小为663碱基对(bp)的条带。如所预期的,该条带不存在于用MVA-BN 感染的细胞或水对照中(图4A)。 如所预期的,利用特异于所取代的截短F基因的引物B1/B2的PCR B在用MVA_mBN175B感染的细胞中和特定质粒阳性对照中检测到了大小为的条带。如所预期的,该条带不存在于用MVA-BN 传染的细胞和水对照中(图4A)。利用检测IGR88/89位点的插入物的引物C1/C2的PCR C在用MVA-mBN175B感染的细胞中和特定质粒阳性对照中检测到了大小为2047bp的条带。如所预期的,该条带不存在于用空载体对照MVA-BN 感染的细胞中,但 161bp的条带表明在MVA-BN 中在IGR88/89处的野生型状况(图4A)。如所预期的,利用检测IGR148/149位点的插入物的引物D1/D2的PCRD在用MVA_mBN175B感染的细胞中和特定质粒阳性对照中检测到了大小为2062bp的条带。如所预期的,该条带不存在于用空载体对照MVA-BN⑧感染的细胞中,但360bp的条带表明在MVA-BN⑧中IGR88/89处的野生型状况(图4A)。F基因之间的重组产生了具有部分野生型F基因和部分截短F基因的杂合F基因。 (图5A)为了检测任何此类重组的存在,利用引物对A1/B2对用MVA-mBN175B或MVA-BN 感染的细胞的DNA进行PCR分析(图5B),其应该产生特异于重组F基因的613个碱基对的产物。该PCR的结果表明没有可检测的重组。(图6)这些结果表明,正在产生稳定的双重组DNA,并且两个拷贝的F基因之间的重组受到限制。实施例6
三个不同埃博拉病毒(EBOV)株的重组糖蛋白(GP)基因的制备期望产生表达三个埃博拉病毒(EBOV)糖蛋白(GP)的重组MVA。本文使用的EBOV 株为EBOV-B (本迪布焦(Bundibugyo))、EBOV-S (苏丹)和EBOV-Z (扎伊尔),均属于在所感染的人中具有高致死性的病毒株。所述三个GP的整体同一性为48. 5%,这表明在所有三个病毒株中GP蛋白的几乎每二个氨基酸中有一个是相同的,而在两个病毒株的组合比较中, 在全长蛋白序列上的百分比同一性为57. 0% -64. 2% (图7)。为了使三个EBOV GP基因内存在的相同核苷酸的长序列段最小,对所述三个核苷酸序列中的密码子进行取代,同时保持所述三个GP基因的编码氨基酸序列。避免使用哺乳动物和鸡的稀有密码子以及可能引入核酸信号的取代。此类信号包括内在TATA-盒、 chi-位点和核糖体进入位点;富含AT和富含GC的序列段;ARE、INS和CRS序列元件;重复序列和RNA 二级结构;(隐藏的)剪接供体位点和接受位点,和分支点;以及牛痘终止信号 (TTTTTNT)。ATG起始密码子后的G可以产生高表达,并且存在于所有三个EBOV GP基因的原始编码序列中且被维持。虽然在3个优化的EBOV GP编码序列中每一个的23. 3% -24. 9%的核苷酸被置换 (参见表A),但三个GP编码序列之间的整体同一性并没有明显改变(表B)。如下表B所示,在两种情况下,在对编码序列进行优化后成对比较甚至显示了稍高的同一性。表A:三个优化的EBOV GP基因中的核苷酸交换。该表显示基于核苷酸总数,与不同EBOV株的未优化(未优化)序列相比,在优化的GP编码序列(优化)的相应位置改变的核苷酸数,以]计。nt总数为1147。
权利要求
1.一种载体,其包含两个大小为300个核苷酸的核苷酸序列,各核苷酸序列编码100个氨基酸,其中由所述两个核苷酸序列中的各核苷酸序列编码的100个氨基酸具有至少75%的氨基酸同一性;且其中所述两个核苷酸序列中的一个具有至少75个核苷酸不同于另一个核苷酸序列, 其中所述不同核苷酸不改变由所述两个核苷酸序列编码的相同氨基酸。
2.一种用于产生根据权利要求1所述的载体的方法,所述方法包括以下步骤a)提供第一核苷酸序列,其大小为300个核苷酸,编码100个氨基酸;b)提供第二核苷酸序列,其大小为300个核苷酸,编码100个氨基酸,其中由所述两个核苷酸序列中的各核苷酸序列编码的100个氨基酸具有至少75%的氨基酸同一性,且其中所述两个核苷酸序列中的一个具有至少75个核苷酸不同于另一个核苷酸序列,其中所述不同核苷酸不改变由所述两个核苷酸序列编码的相同氨基酸;和c)将所述两个差异核苷酸序列插入载体中。
3.一种降低载体内的分子内重组的方法,所述载体含有两个大小为300个核苷酸的核苷酸序列,各核苷酸序列编码100个氨基酸,其中由所述两个核苷酸序列中的各核苷酸序列编码的100个氨基酸具有至少75%的氨基酸同一性,所述方法包括取代在一个或两个核苷酸序列中的核苷酸以产生显示至少75个核苷酸不同的两个差异序列,其中所述不同核苷酸不改变由所述两个核苷酸序列编码的相同氨基酸。
4.根据权利要求1所述的载体或根据权利要求2或3所述的方法,其中所述载体为病毒载体,优选痘病毒载体。
5.一种产生病毒优选痘病毒的方法,该病毒包含两个同源核苷酸序列,所述方法包括以下步骤a)提供病毒,其包含大小为300个核苷酸的编码100个氨基酸的核苷酸序列;b)将大小为300个核苷酸的编码100个氨基酸的第二核苷酸序列插入至所述病毒中; 其中由所述两个核苷酸序列中的各核苷酸序列编码的100个氨基酸具有至少75%的氨基酸同一性;且其中所述两个核苷酸序列中的一个具有至少75个核苷酸不同于另一个核苷酸序列, 其中所述不同核苷酸不改变由所述两个核苷酸序列编码的相同氨基酸。
6.根据权利要求4或5所述的载体或方法,其中所述痘病毒是牛痘病毒,优选经修饰的牛痘安卡拉(MVA)病毒。
7.根据权利要求1-6中任一项所述的载体或方法,其中将所述至少75个不同核苷酸取代。
8.根据前述权利要求1-7中任一项所述的载体或方法,其中所述两个核苷酸序列为两个呼吸道合胞病毒(RSV)基因,尤其是RSV-F和/或RSV-G基因,或两个,优选三个,线状病毒基因,尤其是线状病毒糖蛋白(GP)基因。
全文摘要
本发明涉及包含两个或更多个同源核苷酸序列的载体及其产生方法。本发明涉及用不同碱基取代同源核苷酸序列中的碱基,所述不同碱基不改变所编码的氨基酸序列。本发明可以降低同源核苷酸序列之间(尤其是在哺乳动物细胞中)的分子内重组。本发明还涉及包含取代碱基的核苷酸序列。
文档编号C12N15/863GK102325888SQ200980143410
公开日2012年1月18日 申请日期2009年11月20日 优先权日2008年11月21日
发明者罗宾·施泰格瓦尔德 申请人:巴法里安诺迪克有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1