具有修饰的ns3结构域的hcv融合蛋白的制作方法

文档序号:1039207阅读:453来源:国知局
专利名称:具有修饰的ns3结构域的hcv融合蛋白的制作方法
技术领域
本发明涉及丙肝病毒(HCV)构建物。更具体地,本发明涉及具有修饰的NS3结构域的HCV融合蛋白。该蛋白能刺激细胞介导的免疫应答,如促进和/或激活HCV-特异性T细胞。
本发明背景丙肝病毒(HCV)感染是重大的健康问题,约1%的世界人口感染此病毒。超过75%的急性感染个体最终发展成慢性携带状态,能导致硬化、肝功能衰竭和肝癌。参见Alter等(1992)N.Engl.J.Med.3271899-1905;Resnick和Koff.(1993)Arch.Intem.Med.1531672-1677;Seeff(1995)Gastrointest.Dis.620-27;Tong等(1995)N.Engl.J.Med.3321463-1466。
Houghton等首先鉴定HCV并确定其为HANBH的病因。HCV病毒基因组序列已知,获得序列的方法也已知。参见例如国际公开号WO 89/04669;WO 90/11089和WO 90/14436。HCV有9.5kb的正义、单链RNA基因组且是黄病毒(Flaviridae)家族成员。在系统发育分析的基础上,鉴定了至少6种不同但相关的HCV基因型。(Simmonds等,J.Gen.Virol.(1993)742391-2399)。病毒编码的单个多蛋白有超过3000个的氨基酸残基(Choo等,Science.(1989)244359-362;Choo等,Proc.Natl.Acad.Sci.USA(1991)882451-2455;Han等,Proc.Natl.Acad.Sci.USA(1991)881711-1715)。多蛋白共翻译和翻译后加工成结构和非结构(NS)蛋白。
特别如

图1所示,一些蛋白由HCV基因组编码。HCV多蛋白酶剪切产物的顺序和命名如下NH2-C-E1-E2-p7-NS2-NS3-NS4a-NS4b-NS5a-NS5b-COOH。多蛋白的初始切割由宿主蛋白酶催化,释放3个结构蛋白以及含病毒酶的非结构(NS)蛋白,这3个结构蛋白是N-末端核壳蛋白(命名为“核心”)和2个包膜糖蛋白“E1”(也称为E)及“E2”(也称为E2/NS1)。NS区命名为NS2、NS3、NS4和NS5。NS2是有蛋白裂解活性的整合膜蛋白,与NS3结合,切割NS2-NS3 sissle键会随之产生NS3 N-末端并释放含丝氨酸蛋白酶和RNA解旋酶活性的大多蛋白。NS3蛋白酶用于加工剩余多蛋白。在这些反应中,NS3释放NS3辅因子(NS4a)、2种蛋白(NS4b和NS5a)和RNA-依赖性RNA聚合酶(NS5b)。多蛋白成熟的完成由NS3-NS4a连接处的自催化切割起始,这由NS3丝氨酸蛋白酶催化。
尽管抗某些病毒像HIV的药物发展取得了广泛的进步,控制急性和慢性HCV感染成果有限(Hoofnagle和di Bisceglie(1997)N.Engl.J.Med.336347-356)。特别认为产生细胞免疫应答如强细胞毒T淋巴细胞(CTL)反应对控制和根除HCV感染重要。因此,本领域需要刺激对HCV的细胞免疫应答的有效方法。
本发明概述本发明的一个目标是提供试剂和方法用于刺激对HCV的细胞免疫应答,如致敏和/或激活识别HCV多肽抗原表位的T细胞。本发明的这个和其它目标由下述一个或多个实施方案完成。
本发明提供用于刺激这类反应的HCV融合蛋白。本发明的一个实施方案涉及含修饰的NS3多肽的HCV融合蛋白,修饰的NS3多肽以抑制蛋白酶活性,如抑制切割融合。除修饰的NS3多肽之外,融合蛋白包括一个或多个来自HCV多蛋白其它区域的多肽,进一步详细描述于下。这些多肽来自与NS3多肽相同的HCV分离物,或来自不同菌株和分离物,包括有任意不同HCV基因型的分离物,用于增强保护抗广泛范围的HCV基因型。
在一些实施方案中,对NS3的修饰包括取代对应于His-1083、Asp-1105和/或Ser-1165的氨基酸,编号是相对于全长HCV-1多蛋白。
在其它实施方案中,所述蛋白包括修饰的NS3多肽、NS4多肽、NS5a多肽和任选的核心多肽。
在另外的实施方案中,所述蛋白进一步包括NS5b多肽和任选的核心多肽。
在另一些实施方案中,所述蛋白进一步包括E2多肽、p7多肽、NS2多肽和任选的核心多肽。
在其它实施方案中,所述蛋白进一步包括E1多肽、E2多肽、p7多肽、NS2多肽和任选的核心多肽。
在另外的实施方案中,所述蛋白进一步包括E2多肽和任选的核心多肽。
在另一些实施方案中,所述蛋白进一步包括E1多肽、E2多肽和任选的核心多肽。
在其它实施方案中,所述蛋白包括E2多肽、修饰的NS3多肽和任选的核心多肽。
在另外的实施方案中,所述蛋白包括E1多肽、E2多肽、修饰的NS3多肽和任选的核心多肽。
另一个实施方案提供的融合蛋白主要由修饰的NS3、NS4、NS5a和任选的HCV核心多肽组成。在一些实施方案中,NS5b多肽也存在。
在上面的实施方案中,融合蛋白的不同区域不需采用天然HCV多蛋白中正常出现的顺序。因此,例如,核心多肽如果存在,可位于融合的N-和/或C-末端。
在另外的实施方案中,本发明涉及免疫原性融合蛋白,其组成从氨基末端到羧基末端方向主要是(a)修饰的NS3多肽、NS4多肽和NS5a多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(b)修饰的NS3多肽、NS4多肽、NS5a多肽和NS5b多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(c)E2多肽、p7多肽、NS2多肽、修饰的NS3多肽、NS4多肽和NS5a多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(d)E1多肽、E2多肽、p7多肽、NS2多肽、修饰的NS3多肽、NS4多肽和NS5a多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(e)E2多肽、p7多肽、NS2多肽、修饰的NS3多肽、NS4多肽、NS5a多肽和NS5b多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(f)E1多肽、E2多肽、p7多肽、NS2多肽、修饰的NS3多肽、NS4多肽、NS5a多肽和NS5b多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(g)E2多肽和修饰的NS3多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(h)E1多肽、E2多肽和修饰的NS3多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(i)E2多肽、p7多肽、NS2多肽和修饰的NS3多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(j)E1多肽、E2多肽、p7多肽、NS2多肽和修饰的NS3多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性。
在另一个实施方案中,本发明涉及免疫原性融合蛋白,其组成从氨基末端到羧基末端方向主要是(a)修饰的NS3多肽、NS4多肽、NS5a多肽和核心多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(b)修饰的NS3多肽、NS4多肽、NS5a多肽、NS5b多肽和核心多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(c)E2多肽、p7多肽、NS2多肽、修饰的NS3多肽、NS4多肽、NS5a多肽和核心多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(d)E1多肽、E2多肽、p7多肽、NS2多肽、修饰的NS3多肽、NS4多肽、NS5a多肽和核心多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(e)E2多肽、p7多肽、NS2多肽、修饰的NS3多肽、NS4多肽、NS5a多肽、NS5b多肽和核心多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(f)E1多肽、E2多肽、p7多肽、NS2多肽、修饰的NS3多肽、NS4多肽、NS5a多肽、NS5b多肽和核心多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(g)E2多肽、修饰的NS3多肽和核心多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(h)E1多肽、E2多肽、修饰的NS3多肽和核心多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(i)E2多肽、p7多肽、NS2多肽、修饰的NS3多肽和核心多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(j)E1多肽、E2多肽、p7多肽、NS2多肽、修饰的NS3多肽和核心多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性。
在另外一个实施方案中,本发明涉及的修饰的NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,因而当修饰的NS3多肽存在于HCV融合蛋白中时,蛋白酶活性被抑制。
本发明的另一个实施方案提供编码上述任意蛋白的分离多核苷酸、组成相同的重组载体、转化载体的宿主细胞和重组生成融合蛋白的方法。
本发明也提供含任意这些融合蛋白的组合物、编码融合的多核苷酸、或包括多核苷酸的重组载体、药学上可接受的载体。
本发明的另外一个实施方案提供在脊椎动物受试者中刺激细胞免疫应答的方法,这是通过施用本文所述组合物。在一些实施方案中,组合物致敏和/或激活识别HCV多肽抗原表位的T细胞。T细胞接触融合蛋白,融合蛋白包括修饰的NS3多肽和至少一种另外的HCV多肽。活化的T细胞群识别NS3和/或另外HCV多肽的抗原表位。
因此本发明提供方法和试剂用于刺激对HCV的细胞免疫应答,如致敏和/或激活识别HCV多肽抗原表位的T细胞。这些方法和试剂特别有利于鉴定与强CTL反应相关的HCV多肽抗原表位和免疫人在内的哺乳动物抗HCV。
附图简述图1是HCV基因组的图示,描述HCV多蛋白的不同区域。
图2描述了代表性的天然、未修饰的NS3蛋白酶结构域的DNA和对应氨基酸序列(SEQ ID NOS3-4)。
图3显示了代表性的修饰的融合蛋白的DNA和对应的氨基酸序列(SEQ IDNOS5-6),N-末端缺失的NS3蛋白酶结构域且包括C-末端上核心的氨基酸1-121。
发明详述除非另有说明,本发明实践使用化学、生化、重组DNA技术和免疫学的常规方法,在本领域技术范围内。这些技术在文献中详细说明。参见例如Sambrook等,《分子克隆实验室手册》(Molecular CloningA Laboratory Manual)(第2版);《酶学方法》(Methods In Enzymologyl)(S.Colowick和N.Kaplan编,Academic Press,Inc.);《DNA克隆》(DNA cloning)卷I和II(D.N.Glover编);《寡核苷酸合成》(Oligonucleotide Synthesis)(M.J.Gait编);《核酸杂交》(Nucleic Acid Hybridization)(B.D.Hames & S.J.Higgins编);《动物细胞培养》(Animal Cell Culture)(R.K.Freshney编);Perbal,B.,《分子克隆实践指南》(A Practical Guide to Molecular Cloning)。
必须指出,如本说明书和附加权利要求所用,单数“一个”、“一种”和“这种”包括复数指示物,除非内容明确另有所指。因此,例如当提及“抗原”时包括2种或多种抗原的混合物,等等。
下列氨基酸缩写在文中使用丙氨酸Ala(A) 精氨酸Arg(R)天冬酰胺Asn(N)天冬氨酸Asp(D)半胱氨酸Cys(C)谷氨酰胺Gln(Q)谷氨酸Glu(E) 甘氨酸Gly(G)组氨酸His(H) 异亮氨酸Ile(I)亮氨酸Leu(L) 赖氨酸Lys(K)甲硫氨酸Met(M)苯丙氨酸Phe(F)脯氨酸Pro(P) 丝氨酸Ser(S)苏氨酸Thr(T) 色氨酸Trp(W)酪氨酸Tyr(Y) 缬氨酸Val(V)I.定义描述本发明时,使用下列术语,术语如下所示定义。
术语“多肽”和“蛋白”指氨基酸残基聚合物,没有最小产物长度限制。因此,肽、寡肽、二聚体、多聚体等包括在定义内。全长蛋白和其片段都包含在定义内。术语也包括多肽的表达后修饰,例如糖基化、乙酰化、磷酸化等。此外,为了本发明目的,“多肽”所指蛋白包括对天然序列的修饰,如缺失、插入和取代(一般在性质上保守),只要蛋白维持所需活性。这些修饰可以是人为的,如通过定点突变,或可以是偶然的,如通过生成蛋白的宿主突变或PCR扩增导致的差错。
HCV多肽是上面定义的多肽,来自HCV多蛋白。多肽不需物理来自HCV,但可合成或重组生成。此外,多肽可来自任意不同HCV菌株和分离物,包括有Simmonds等,J.Gen.Virol.(1993)742391-2399所述任意6种HCV基因型的分离物(如菌株1、2、3、4等)以及新鉴定的分离物和这些分离物亚型如HCV1a、HCV1b等。已知这些菌株中有一些保守和可变区,一般,当排列2种序列时,来自这些区域的抗原表位的氨基酸序列有高度的序列同源性,如大于30%的氨基酸序列同源性,优选大于40%,因此例如,术语“NS4”多肽指来自任意不同HCV菌株的天然NS4以及NS4类似物、突变蛋白和免疫原性片段,如下面进一步定义。
术语“类似物”和“突变蛋白”指参考分子的生物活性衍生物或这些衍生物片段,片段保持所需活性,例如刺激细胞介导的免疫应答的能力,如下定义。在修饰的NS3的情况中,“类似物”或“突变蛋白”指缺乏其天然蛋白裂解活性的NS3分子。通常,术语“类似物”所指化合物有天然多肽序列且结构相对天然分子有一个或多个氨基酸插入、取代(一般性质保守,或在修饰的NS3的情况中在活性蛋白裂解位点性质不保守)和/或缺失,只要修饰不破坏免疫活性。术语“突变蛋白”所指肽有一个或多个肽模拟物(“肽类似物”),如国际公开号WO 91/04282所述。类似物或突变蛋白优选至少免疫活性与天然分子相同。产生多肽类似物和突变蛋白的方法在本领域已知并在下面进一步描述。
如上所述,类似物一般包括性质保守的取代,即取代发生在侧链相关的氨基酸家族内。氨基酸通常特定分成4个家族(1)酸性-天冬氨酸和谷氨酸;(2)碱性-赖氨酸、精氨酸、组氨酸;(3)非极性-丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸;(4)不带电、极性-甘氨酸、天冬酰胺、谷氨酰胺、半胱氨酸、丝氨酸、苏氨酸、酪氨酸。苯丙氨酸、色氨酸和酪氨酸有时分类为芳族氨基酸。例如,合理预测异亮氨酸或缬氨酸单独取代亮氨酸、谷氨酸取代天冬氨酸、丝氨酸取代苏氨酸或结构相关氨基酸类似保守取代氨基酸对生物活性没有大作用。例如,感兴趣多肽可包括多至约5-10个保守或非保守氨基酸取代,或甚至多至约15-25个保守或非保守氨基酸取代,或5-25间任意整数,只要所需分子功能保持完整。本领域技术人员易确定感兴趣分子可容忍变化的区域,参考本领域熟知的Hopp/Woods和Kyte-Doolittle图。
“修饰的NS3”指NS3多肽具有的修饰破坏NS3多肽的蛋白酶活性。修饰能包括一个或多个相对天然分子的氨基酸插入、取代(一般性质非保守)和/或缺失,其中NS3多肽的蛋白酶活性被破坏。测量蛋白酶活性的方法在下面进一步讨论。
“片段”指仅由完整全长多肽序列和结构一部分组成的多肽。片段可包括天然多肽的C-末端缺失和/或N-末端缺失。特定HCV蛋白的“免疫原性片段”通常包括全长分子的至少约5-10个连续氨基酸残基,优选全长分子的至少约15-25个连续氨基酸残基,更优选全长分子的至少约20-50个或更多连续氨基酸残基,它们定义一个抗原表位,或者是5个氨基酸与全长序列间的任意整数,只要讨论的片段保持免疫活性,由本文所述测定测量。
术语“抗原表位”在这里所指序列有至少约3到5个氨基酸,优选约5到10或15个且不超过约1,000个(或之间的任意整数),它们定义自身序列或作为更大序列的部分,序列结合抗体,抗体在对这些序列的应答中产生。片段长度没有关键上限,可包括进全长的蛋白序列或甚至融合蛋白,融合蛋白含2个或多个来自HCV多蛋白的抗原表位。用于试验本发明的抗原表位不限于序列与亲代蛋白部分精确一致的多肽,多肽来自亲代蛋白。确实,病毒基因组处于恒定流出的状态且包含一些可变结构域,结构域表现出相对高程度的分离物间可变性。因此术语“抗原表位”涵盖与天然序列相同的序列以及对天然序列的修饰,如缺失、插入和取代(一般性质保守)。
含抗原表位的特定多肽区能用一些本领域熟知的抗原表位图谱技术鉴定。参见例如《分子生物学方法》(Methods in Molecular Biology)66卷中的“抗原表位图谱操作”(Epitope Mapping Protocols)(Glenn E.Morris编,1996)Humana Press,Totowa,New Jersey。例如,确定线性抗原表位可通过如同时合成大量固体支持物上的肽、对应于蛋白分子部分的肽,使肽与抗体反应而肽仍附于支持物。这些技术在本领域已知并描述于例如美国专利号4,708,871;Geysen等(1984)Proc.Natl.Acad.Sci.USA813998-4002;Geysen等(1986)Molec.Immunol.23709-715。类似的,易鉴定构象抗原表位,通过确定氨基酸空间构象如用例如x-射线晶体分析法和2维核磁共振。参见例如抗原表位图谱操作,同上。也能鉴定蛋白的抗原区,使用标准抗原性和亲水性图,如用例如来自Oxford Molecular Group的Omiga 1.0版软件程序计算的图。此计算机程序使用确定抗原性分布的Hopp/Wood方法,Hopp等,Proc.Natl.Acad.Sci.USA(1981)783824-3828和用于亲水性图的Kyte-Doolittle技术,Kyte等,J.Mol.Biol.(1982)157105-132。
为描述不同HCV抗原表位,参见例如Chien等,Proc.Natl.Acad.Sci.USA(1992)8910011-10015;Chien等,J.Gastroent.Hepatol.(1993)8S33-39;Chien等,国际公开号WO 93/00365;Chien,D.Y,国际公开号WO 94/01778;美国专利号6,280,927和6,150,087。
术语“T细胞抗原表位”在这里指能诱导T细胞免疫趋向肽结构或相关半抗原的肽结构特征。T细胞抗原表位通常包括线性肽决定簇,肽决定簇呈现MHC分子肽结合裂缝内的延伸构象(Unanue等,Science.(1987)236551-557)。多肽到MHCII型相关线性肽决定簇(通常长度在5-14个氨基酸间)的转变定义为“抗原加工”,这由抗原呈递细胞(APCs)完成。T细胞抗原表位更特定由短肽结构的局部特征定义,如一级氨基酸序列性质,包括电荷和疏水性,某些不取决于全部多肽折叠的二级结构类型如螺旋度。此外,认为辅助T细胞能识别的短肽通常是两性结构,包括疏水侧(用于和MHC分子相互作用)和亲水侧(用于和T细胞受体相互作用),(Margalit等,“计算机预测T细胞抗原表位”(Computer Prediction of T-cell Epitiopes),《新生代疫苗》(New Generation Vaccines)Marcel Dekker,Inc,G.C.Woodrow等编,(1990)109-116页)且两性结构有α-螺旋构象(参见例如Spouge等,J.Immunol.(1987)138204-121;Berkower等,J.Immunol.(1986)1362498-2503)。
因此,易预测含T细胞抗原表位的蛋白区段,使用许多计算机程序。(参见例如Margalit等,“计算机预测T细胞抗原表位”,《新生代疫苗》Marcel Dekker,Inc,G.C.Woodrow等编,(1990)109-116页)。这些程序通常比较肽的氨基酸序列和已知序列以诱导T细胞反应,搜索认为T细胞抗原所需的氨基酸模式。
对HCV抗原(包括多肽和编码体内表达多肽的多核苷酸)或组合物的“免疫应答”是受试者对感兴趣组合物中所存在分子的体液和/或细胞免疫应答发展。为了本发明目的,“体液免疫应答”指抗体分子调节的免疫应答,而“细胞免疫应答”是受T淋巴细胞和/或其它白细胞介导的免疫应答。细胞免疫的一个重要方面包括细胞毒T细胞(“CTL”)的抗原特异反应。CTL对肽抗原有特异性,肽抗原呈递与蛋白相联,这些蛋白由主要组织相容性复合体(MHC)编码并在细胞表面表达。CTL有助于诱导和促进胞内微生物的胞内破坏或感染这些微生物的细胞裂解。细胞免疫的另一方面包括辅助T细胞的抗原特异反应。辅助T细胞作用于协助刺激功能,集中非特异效应细胞活性抗呈现肽抗原的细胞,肽抗原与细胞表面的MHC分子相联。“细胞免疫应答”也指生成抗病毒细胞因子、化学因子和其它这类由活化的T细胞和/或其它白细胞产生的分子,包括来自CD4+和CD8+T细胞的,包括但不限于IFN-γ和TNF-α。
引起细胞免疫应答的组合物或疫苗可用于致敏脊椎动物受试者,这是通过呈递抗原与细胞表面的MHC分子相联。细胞介导的免疫应答针对或接近细胞表面的细胞呈递抗原。另外,能生成抗原特异T淋巴细胞以进一步保护免疫宿主。
特定抗原刺激细胞介导的免疫应答的能力可通过一些测定确定,如淋巴增生(淋巴细胞激活)测定、CTL细胞毒细胞测定或测定敏化受试者中抗原特异的T淋巴细胞。这些测定在本领域熟知。参见例如Erickson等,J.Immunol.(1993)1514189-4199;Doe等,Eur.J.Immunol.(1994)242369-2376和下面的例子。
因此,本文所用的免疫应答可以是刺激CTL生成和/或辅助T细胞生成或激活的反应。感兴趣抗原也能引起抗体调节的免疫应答。因而,免疫应答可包括下列作用中的一种或多种B细胞生成抗体;和/或激活抑制性T细胞和/或γδT细胞,这些T细胞特异针对组合物或感兴趣疫苗中存在的一种或几种抗原。这些反应可用于中和传染性和/或调节抗体-补体或抗体依赖性细胞细胞毒(ADCC)以保护或缓解免疫宿主症状。能确定这些反应,使用本领域熟知的标准免疫测定和中和测定。
“等价抗原决定簇”指来自HCV不同亚类或菌株的抗原决定簇,如来自HCV菌株1、2、3等,由于序列变化,抗原决定簇不必须相同,但在所讨论HCV序列中出现在相同位置。通常,当排列2种序列时,等价抗原决定簇的氨基酸序列有高度序列同源性,例如大于30%的氨基酸序列同源性,通常大于40%,如大于60%,甚至大于80-90%同源性。
“编码序列”或“编码”所选多肽的序列是核酸分子,当置于适当调节序列控制下时,核酸分子体外或体内转录(在DNA的情况中)和翻译(mRNA的情况中)成多肽。编码序列边界由5’(氨基)末端的起始密码子和3’(羧基)末端的翻译终止密码子确定。转录终止序列可位于编码序列3’。
“核酸”分子或“多核苷酸”能包括双链和单链序列,涉及且不限于来自病毒、原核或真核mRNA的cDNA、来自病毒(如DNA病毒和逆转录病毒)或原核DNA的基因组DNA序列和特定的合成DNA序列。术语也包括含任意已知DNA和RNA碱基类似物的序列。
“操作性连接的”指元件排列,其中所述组成构型用于行使其所需功能。因此,当适当转录因子等存在时,操作性连接于编码序列的特定启动子能影响编码序列表达。启动子不需与编码序列连续,只要它能指导其表达。因而例如,未翻译但已转录的干扰序列可存在于启动子序列和编码序列间,如转录的内含子,仍能认为启动子序列“操作性连接于”于编码序列。
本文所用描述核酸分子的“重组子”指基因组、cDNA、病毒、半合成或合成起点的多核苷酸,其起点或操作与全部或部分天然相关的多核苷酸不相联。所用关于蛋白或多肽的术语“重组子”指通过重组多核苷酸表达生成的多肽。通常,克隆感兴趣基因,随后在转化生物体中表达,如下面进一步所述。宿主生物体表达外源基因以在表达条件下生成蛋白。
“控制元件”指协助相连编码序列表达的多核苷酸序列。术语包括启动子、转录终止序列、上游调节结构域、多腺苷酸化信号、非翻译区,包括5’-UTRs和3’-UTRs,适当时前导序列和增强子共同提供宿主细胞中编码序列转录和翻译。
“启动子”在这里是能结合宿主细胞中RNA聚合酶并起始下游(3’方向)操作性连接于编码序列转录的DNA调节区。为了本发明目的,启动子序列包括以背景基础上可检测水平起始感兴趣基因转录所需的最小数量碱基或元件。启动子序列内有转录起始位点以及用于结合RNA聚合酶的蛋白结合域(共有序列)。真核启动子通常不总包含“TATA”盒和“CAT”盒。
当RNA聚合酶结合启动子序列且将编码序列转录成mRNA时,控制序列在细胞中“指导转录”编码序列,mRNA随后翻译成编码序列编码的多肽。
“表达盒”或“表达构建物”指能指导感兴趣序列或基因表达的集合。表达盒包括上述控制元件,如操作性连接于(以指导转录)感兴趣序列或基因的启动子,通常也包括多腺苷酸序列。在本发明的一些实施方案中,本文所述表达盒可包含于质粒构建物中。除了表达盒组成外,质粒构建物也能包括一个或多个可选择标记、允许质粒构建物作为单链DNA存在的信号(如M13复制起点)、至少1个多克隆位点和“哺乳动物”复制起点(如SV40或腺病毒复制起点)。
“转化”在这里指插入外源多核苷酸到宿主细胞,无论插入所用方法例如,通过直接吸收、转染、感染等来转化。对于特定转染方法,进一步参见下面。外源多核苷酸可作为非整合载体维持,例如游离体,或另外可整合入宿主基因组。
“宿主细胞”是转化外源DNA序列的细胞,或能转化。
当提及多肽时,“分离”指所示分子与完整生物体分开且不连续,分子天然发现于生物体中或在几乎缺乏其它相同类型生物大分子时存在。关于多核苷酸的术语“分离”是缺乏全部或部分天然相关序列的核酸分子;或天然存在的序列,但有与其相关的异源序列;或与染色体分离的分子。
术语“纯化”在这里优选指存在至少75%重量的相同类型生物大分子,更优选至少85%重量,更加优选至少95%重量,最优选至少98%重量。
“同源性”指2种多核苷酸或2个多肽部分间的百分比同一性。当序列相对固定分子长度表现出至少约50%序列同一性,优选至少约75%,更优选至少约80-85%,优选至少约90%,最优选至少约95-98%或更高,则2种DNA或2种多肽序列彼此“基本同源”。基本同源在这里也指与特定DNA或多肽序列完全相同的序列。
通常,“同一性”分别指2种多核苷酸或多肽序列的精确核苷酸-核苷酸或氨基酸-氨基酸对应。直接比较2个分子间的序列信息能确定百分比同一性,这是通过排列序列,计算2个排列序列间的确切匹配数,除以较短序列长度,结果乘以100。可获得的计算机程序能用于协助分析,如ALIGN,Dayhoff,M.O.,《蛋白序列和结构图集》(Atlas of Protein Sequence and Structure)M.O.Dayhoff编,5 Suppl.3353-358,National biomedical Research Foundation,Washington,DC,它修改Smith和Waterman局部同源性算法用于肽分析,Advances in Appl.Math.2482-489,1981。确定核苷酸序列同一性的程序可获得于Wisconsin序列分析包,第8版(来自Genetics Computer Group,Madison,WI),例如BESTFIT、FASTA和GAP程序,它们也取决于Smith和Waterman算法。这些程序容易使用,所用默认参数由厂商推荐且描述于上示Wisconsin序列分析包。例如,特定核苷酸序列与参考序列的百分比同一性能用Smith和Waterman同源性算法确定,用6个核苷酸位置的默认记录表和缺口罚分(gap penalty)。
另一种确定本发明百分比同一性的方法是使用MPSRCH程序包,其版权归爱丁堡大学(Univeristy of Edinburgh)所有,由John F.Collins和Shane S.Sturrok开发,IntelliGenetics,Inc.(Mountain View,CA)销售。“匹配”值产生的数据反映“序列同一性”。其它计算序列间百分比同一性或相似性的适当程序通常在本领域已知,例如另一种排列程序是BLAST,使用默认参数。例如,BLASTN和BLASTP能使用下列默认参数遗传密码=标准;过滤=无;链=两条;截断=60;预期=10;矩阵=BLOSUM62;描述=50种序列;分类=高分;数据库=非冗余,GenBank+EMBL+DDBJ+PDB+GenBank CDS翻译+Swiss蛋白+Spupdate+PIR。这些程序细节可发现于下列因特网地址http//www.ncbi.nlm.gov/cgi-bin/BLAST。
另外,可通过在同源区间形成稳定双螺旋的条件下杂交多核苷酸,接着单链特异核酸酶消化,确定消化片段大小来能确定同源性。基本同源的DNA序列能在DNA杂交实验中鉴定,在例如特定系统定义的严谨条件下。定义的适当杂交条件在本领域技术范围内。参见例如Sambrook等,同上;《DNA克隆》,同上;《核酸杂交》,同上。
“核酸免疫”指将编码一个或多个所选免疫原的核酸分子导入宿主分子,用于体内表达一种或几种免疫原。核酸分子能直接导入受体受试者,如通过注射、吸入、口头、鼻内和粘膜施用等,或能活体内导入细胞,细胞从宿主中取出。在后一种情况中,转化细胞再导入受试者,其中能促进免疫应答抗核酸分子编码的抗原。
“处理”在这里指(I)防止常规疫苗中的感染或再感染,(ii)减少或取出症状,(iii)基本或完全去除所讨论病原。处理可有效预防(感染前)或治疗(感染后)。
“脊椎动物受试者”指cordata亚门的任何成员,无限制地包括人和其他灵长类动物,包括非人灵长类动物如黑猩猩和其他猿和候属;农场动物如牛、绵羊、猪、山羊和马;家养哺乳动物如狗和猫;实验动物,包括啮齿动物如小鼠、大鼠和豚鼠;鸟,包括家养、野生和猎禽如鸡、火鸡和其他鹑鸡、鸭、鹅等。术语不指示特定年龄。因此,涵盖成年和新生个体。本文所述本发明用于上面任意脊椎动物属,因为所有这些脊椎动物免疫系统运转类似。
II.完成本发明的模式详细描述本发明前,要理解本发明不限于特定制剂或加工参数,这些当然可变化。也要理解本文所用术语仅用于描述本发明的特定实施方案,而不想要限制。
尽管一些与本文所述类似或相同的组合物和方法能用于实践本发明,本文描述优选材料和方法。
本发明涉及融合蛋白和编码相同的多核苷酸,包括修饰的NS3多肽和至少一种来自HCV多蛋白的其它HCV多肽。本发明的融合蛋白能用于刺激细胞免疫应答,如激活HCV-特异性T细胞,即识别这些多肽抗原表位和/或引起辅助T细胞生成和/或刺激抗病毒细胞因子、化学因子等生成的T细胞。这些融合蛋白激活HCV-特异性T细胞,提供体外和体内模型系统用于发展HCV疫苗,特定用于鉴定与反应相关的HCV多肽抗原表位。融合蛋白也能用于在哺乳动物中产生抗HCV的免疫应答,例如CTL反应,和/或致敏CD8+和CD4+T细胞以生成抗病毒剂,用于治疗或预防用途。
为进一步理解本发明,下面提供更详细讨论关于受试组合物使用的融合蛋白以及生成蛋白、组成相同的组合物和使用蛋白的方法。
融合蛋白HCV菌株基因组包含约9,000到12,000个核苷酸的单独可读框,它转录成多蛋白。如图1和表1所示,HCV多蛋白在裂解时,生成至少10个不同产物,顺序为NH2-核心-E1-E2-p7-NS2-NS3-NS4a-NS4b-NS5a-NS5b-COOH。核心多肽出现在位置1-191,编号是相对于HCV-1(参见Choo等(1991)Proc.Natl.Acad.Sci.USA882451-2455;用于HCV-1基因组)。进一步加工此多肽以生成约1-173个氨基酸的HCV多肽。包膜多肽E1和E2分别出现在约位置192-383和384-746。P7结构域发现于约位置747-809。NS2是有蛋白裂解活性的整合膜蛋白且发现于约多蛋白位置810-1026。NS2结合NS3(发现于约位置1027-1657)切割NS2-NS3 sissle键,随之产生NS3 N末端并释放含丝氨酸蛋白酶和RNA解旋酶活性的大多蛋白。发现于约位置1027-1207的NS3蛋白酶用于加工剩余多蛋白。解旋酶活性发现于约位置1193-1657。NS3释放NS3辅因子(发现于约位置1658-1711的NS4a)、2种蛋白(发现于约位置1712-1972的NS4b和发现于约位置1973-2420的NS5a)和RNA-依赖性RNA聚合酶(发现于约位置2421-3011的NS5b)。多蛋白成熟的完成由NS3-NS4a连接处的自催化切割起始,这由NS3丝氨酸蛋白酶催化。

*u相对于HCV-1进行编号。参见Choo等(1991)Proc.Natl.Acad.Sci.USA882451-2455。
本发明的融合蛋白包括NS3多肽,修饰的NS3多肽以抑制蛋白酶活性,从而抑制融合的进一步切割。修饰的NS3多肽可通过缺失所有或部分NS3蛋白酶结构域。另外,取代蛋白酶结构域活性区内的氨基酸能抑制蛋白裂解活性。最后,插入氨基酸到结构域活性区,从而修饰催化位点,这也用于抑制蛋白裂解活性。
如上所述,蛋白裂解活性发现于约氨基酸位置1027-1207,编号是相对于全长HCV-1多蛋白(参见Choo等Proc.Natl.Acad.Sci.USA(1991)882451-2455),图2(SEQ ID NO4)的位置2-182。NS3蛋白酶结构和活性位置已知。参见例如DeFrancesco等,Antivir.Ther.(1998)399-109;Koch等,Biochemistry(2001)40631-640。因此,天然序列的缺失或修饰通常在分子活性位置或附近发生。特别需要修饰或缺失图2(SEQ ID NO4)的位置1-或2-182出现的一个或多个氨基酸,优选1-或2-170,或1-或2-155。优选修饰是蛋白酶活性位置的三重催化,即H、D和/或S残基,用于灭活蛋白酶。这些残基分别出现在位置1083、1105和1165,编号是相对于全长HCV多蛋白(分别为图2(SEQ ID NO4)的位置58、80和140)。这些修饰会抑制蛋白裂解且同时维持T细胞抗原表位。
本领域技术人员易确定用于破坏活性的NS3蛋白酶缺失部分。活性的存在或缺乏能用本领域技术人员已知方法确定。
例如,确定蛋白酶活性或缺乏活性可用下面例子所述过程以及用本领域熟知测定。参见例如Takeshita等,Anal.Biochem.(1997)247242-246;Kakiuchi等,J.Biochem.(1997)122749-755;Sali等,Biochemistry(1998)373392-3401;Cho等,J.Virol.Meth.(1998)72109-115;Cerretani等,Anal.Biochem.(1999)266192-197;Zhang等,Anal.Biochem.(1999)270268-275;Kakiuchi等,J.Virol.Meth.(1999)8077-84;Fowler等,J.Biomol.Screen.(2000)5153-158和Kim等,Anal.Biochem.(2000)28442-48。
除了修饰的NS3多肽外,本发明的融合蛋白包括一个或多个来自HCV多蛋白一个或多个其它区域的多肽。事实上,融合能包括HCV多蛋白的所有区域。这些多肽可来自与NS3多肽相同的HCV分离物,或来自不同菌株和分离物,包括有不同HCV基因型的分离物,用于增强保护抗广泛范围的HCV基因型。另外,选择多肽可在特定地理区中特定病毒地方性进化枝基础上,其中使用含融合的疫苗组合物。显然受试融合提供在多种情况下治疗HCV感染的有效方法。
在一些实施方案中,融合蛋白包括修饰的NS3(本文也称为NS3*)、NS4(NS4a和NS4b)、NS5a和任选的HCV核心多肽(NS3*NS4NS5a或NS3*NS4NS5a核心融合蛋白,本文也称为“NS3*45a”和“NS3*45a核心”)。这些区域不需采用天然HCV多蛋白中正常出现的顺序。因此,例如,核心多肽可位于融合的N-和/或C-末端。
另一个实施方案提供的融合蛋白包括NS3*、NS4、NS5a、NS5b和任选的HCV核心多肽(NS3*NS4NS5aNS5b或NS3*NS4NS5aNS5b核心融合蛋白,本文也称为“NS3*45ab”和“NS3*45ab核心”)。这些区域不需采用天然HCV多蛋白中正常出现的顺序。因此,例如,核心多肽可位于融合的N-和/或C-末端。
另外一个实施方案涉及的融合蛋白包括结合NS2的NS3*,结合NS2、p7和E2的NS3*,结合NS2、p7和E1的NS3*,结合NS2、p7、E1和E2的NS3*,结合E2的NS3*,结合E1和E2的NS3*,它们都有或没有核心多肽。如上述融合,这些区域不需采用其天然出现的顺序。此外,各个这些区域可来自相同或不同HCV分离物。
图3(SEQ ID NOS5-6)显示了代表性的修饰的融合蛋白,N-末端缺失NS3蛋白酶结构域且包括C-末端上核心的氨基酸1-121。
上述多种融合中存在的不同HCV多肽可以是全长多肽或其部分。构成融合蛋白的HCV多肽部分包括至少1个抗原表位,它由活化的T细胞上的T细胞受体识别,如2152-HEYPVGSQL-2160(SEQ ID NO1)和/或2224-AELIEANLLWRQEMG-2238(SEQ ID NO2)。能用一些方法鉴定NS2、p7、E1、E2、NS3、NS4(NS4a和NS4b)、NS5a、NS5b、NS3NS4NS5a和NS3NS4NS5aNS5b的抗原表位。例如,能分离单独多肽或含上面任意组合的融合蛋白,通过例如蛋白免疫亲和纯化,用多肽或蛋白的单克隆抗体。随后筛选分离的蛋白序列,通过蛋白酶剪切纯化蛋白来制备一系列短肽,它们一起横跨完整蛋白序列。开始时用例如100聚体多肽,能测试各多肽是否存在由HCV-活化的T细胞上T细胞受体识别的抗原表位,然后从鉴定的100聚体开始测试逐级更小和重叠片段以作出感兴趣抗原表位的图谱。
能鉴定HCV-活化的T细胞上T细胞受体识别的抗原表位,例如通过51Cr释放测定(见实施例4)或淋巴增生测定(见实施例6)。在51Cr释放测定中,能构建展示感兴趣抗原表位的靶细胞,这是通过克隆编码抗原表位的多核苷酸到表达载体并转化表达载体到靶细胞中。HCV-特异性CD8+T细胞裂解的靶细胞展示例如融合中发现的一个或多个HCV多蛋白区,此T细胞不裂解不显示这种抗原表位的细胞。在淋巴增生测定中,当用例如来自融合中发现的一个或多个HCV多蛋白区的一个或多个抗原表位培养但没有缺乏HCV抗原表位肽时,HCV-活化CD4+T细胞增殖。
不同HCV多肽可以任何顺序出现在融合蛋白中。如果需要,一种或多种多肽中的至少2、3、4、5、6、7、8、9或10个或更多可出现在融合蛋白中。出现多种病毒HCV菌株,任何这些菌株的HCV多肽能用于融合蛋白。
确定一些HCV菌株和分离物的核酸和氨基酸序列,包括HCV多蛋白不同区的核酸和氨基酸序列,含核心、NS2、p7、E1、E2、NS3、NS4、NS5a、NS5b基因和多肽。例如,分离物HCV J1.1描述于Kubo等(1989)Japan.Nucl.Acids Res.1710367-10372;Takeuchi等(1990)Gene 91287-291;Takeuchi等(1990)J.Gen.Virol.713027-3033;Takeuchi等(1990)Nucl.Acids Res.184626。2种单独分离物HCV-J和BK的完整编码序列分别描述于Kato等,(1990)Proc.Natl.Acad.Sci.USA 879524-9528和Takamizawa等,(1991)J.Virol.651105-1113。
描述HCV-1分离物的出版物包括Choo等(1990)Brit.Med.Bull.46423-441;Choo等(1991)Proc.Natl.Acad.Sci.USA 882451-2455和Han等(1991)Proc.Natl.Acad.Sci.USA 881711-1715。HCV分离物HC-J1和HC-J4描述于Okamoto等(1991)Japan J.Exp.Med.60167-177。HCV分离物HCT 18~、HCT23、Th、HCT27、EC1和EC10描述于Weiner等(1991)Virol.180842-848。HCV分离物Pt-1、HCV-K1和HCV-K2描述于Enomoto等(1990)Biochem.Biophys.Res.Commun.1701021-1025。HCV分离物A、C、D&E描述于Tsukiyama-Kohara等(1991)Virus Genes 5243-254。
融合蛋白各组成可来自相同HCV菌株或分离物或者来自不同HCV菌株或分离物。含来自例如NS3多肽的HCV多肽的融合蛋白可来自HCV的第一个菌株,其它现有HCV多肽能来自HCV的第二个菌株。另外,一个或多个其它HCV多肽例如NS2、NS4、核心、p7、E1和/或E2如果存在,可来自HCV的第一个菌株,剩余HCV多肽能来自HCV的第二个菌株。此外,现有的各HCV多肽可来自不同HCV菌株。
如上所述,本发明的融合需要包括来自HCV多蛋白核心区的多肽。此区域出现在HCV多蛋白的氨基酸位置1-191,编号是相对于HCV-1。全长蛋白、其片段如氨基酸1-160,例如氨基酸1-150、1-140、1-130、1-120,例如氨基酸1-121、1-122、1-123...1-151等,或含全长蛋白抗原表位的更小片段可用于受试融合,如发现于氨基酸10-53、氨基酸10-45、氨基酸67-88、氨基酸120-130间的抗原表位,或所鉴定任意核心抗原表位,例如鉴定于Houghton等,美国专利号5,350,671;Chien等,Proc.Natl.Acad.Sci.USA(1992)8910011-10015;Chien等,J.Gastroent.Hepatol.(1993)8S33-39;Chien等,国际公开号WO 93/00365;Chien,D.Y,国际公开号WO 94/01778;美国专利号6,280,927和6,150,087。此外,可使用多蛋白核心区移框产生的蛋白,如国际公开号WO 99/63941所述。
如果存在核心多肽,它能出现在融合的N-末端、C-末端和/或内部。特定优选C-末端上的核心多肽,这使它能与一些佐剂如ISCOMs形成复合体,如下进一步所述。
如上所述,HCV融合中有用的多肽包括来自多蛋白任意不同区域的T细胞抗原表位。在此方面,已知E1、E2、p7和NS2包含人T细胞抗原表位(CD4+和CD8+)且包括一个或多个这些抗原表位用于增加疫苗效率以及增强抗多种HCV基因型的保护水平。此外,多拷贝的特异、保守T细胞抗原表位也能用于融合,如来自不同基因型的抗原表位复合物。
例如,来自HCV E1和/或E2区的多肽能用于本发明的融合。E2以多种类型存在(Spaete等,Virol.(1992)188819-830;Selby等,J.Virol.(1996)705177-5182;Grakoui等,J.Virol.(1993)671385-1395;Tomei等,J.Virol.(1993)674017-4026),剪切和蛋白裂解可发生于E2多肽的N-末端和C-末端。因此,本文所用E2多肽可包括HCV多蛋白的氨基酸405-661,例如400、401、402...到661,如383或384-661、383或384-715、383或384-764、383或384-749或者383或384-809或者383或384到661-908间的任意C-末端,编号是相对于全长HCV-1多蛋白。类似的,本文所用E1多肽能包括HCV多蛋白的氨基酸192-326、192-330、192-333、192-360、192-363、192-383或192到326-383间的任意C-末端。
含抗原表位的E1和/或E2免疫原性片段可用于受试融合。例如,E1多肽片段可包括从约5个E1多肽氨基酸到近全长分子,如6、10、25、50、75、100、125、150、175、185个或更多氨基酸,或所定数字中的任意整数。类似的,E2多肽片段能包括6、10、25、50、75、100、150、200、250、300或350个E2多肽氨基酸,或所定数字中的任意整数。
例如,融合能包括来自例如E2高变区的抗原表位,例如横跨氨基酸383-410或390-410的区。结合到E2多肽序列的特定有效E2抗原表位包括来自此区域的共有序列,如共有序列Gly-Ser-Ala-Ala-Arg-Thr-Thr-Ser-Gly-Phe-Val-Ser-Leu-Phe-Ala-Pro-Gly-Ala-Lys-Gln-Asn(SEQ ID NO7),代表HCV1类基因组氨基酸390-410的共有序列。另外的E1和E2抗原表位已知并描述于如Chien等,国际公开号WO 93/00365。
此外,E1和/或E2多肽可能缺乏所有或部分跨膜结构域。E1通常是终止于约氨基酸位置370和更高(以HCV-1 E1编号为基础)的多肽,它由ER保持,因而不分泌到生长培养基中。E1是终止于约氨基酸位置731和更高(也以HCV-1 E2序列编号为基础)的多肽,它由ER保持且不分泌。(参见例如1996年2月15日发表的国际公开号WO 96/04301)。应指出这些氨基酸位置不绝对且可一定程度变化。因此,本发明计划使用保留跨膜结合域的E1和/或E2多肽以及缺乏所有或部分跨膜结构域的多肽,包括终止于约氨基酸369和更低的E1多肽及终止于约氨基酸730和更低的E2多肽。另外,C-末端截断能趋向N-末端延伸到跨膜结合域。因而例如,本发明也包括出现在位置低于如360的E1截断和出现在位置低于如715的E2截断。平截的E1和E2多肽必须保留功能以用于指定用途。然而,特定优选的平截E1构建物不延伸超过约氨基酸300。最优选终止于位置360的E1构建物。优选的平截E2构建物具有C-末端截断,不延伸超过约氨基酸位置715。特定优选的E2截断是在氨基酸715-730中任意一个之后平截的分子,如725。
为描述来自这些和其它HCV区的不同HCV抗原表位,参见例如Chien等,Proc.Natl.Acad.Sci.USA(1992)8910011-10015;Chien等,J.Gastroent.Hepatol.(1993)8S33-39;Chien等,国际公开号WO 93/00365;Chien,D.Y.,国际公开号WO94/01778;美国专利号6,280,927和6,150,087。
上述融合蛋白以及这些蛋白的单独组成优选重组生成。编码这些蛋白的多核苷酸能导入表达载体,表达载体可在适当表达系统中表达。本领域有多种细菌、酵母、哺乳动物和昆虫表达系统,可使用任意这类表达系统。编码这些蛋白的多核苷酸能任选在无细胞翻译体系中翻译。这种方法在本领域熟知。蛋白也可通过固相蛋白合成构建。
如果需要,融合蛋白或这些蛋白的单独组成也能包含其它氨基酸序列如氨基酸接头或信号序列,以及用于蛋白纯化的配基如谷胱甘肽-S-转移酶和葡萄球菌A蛋白。
编码融合蛋白的多核苷酸多核苷酸包含少于完整HCV基因组,或另外可包括上述有突变的NS3结构域的完整多蛋白序列。多核苷酸可以是RNA或者单或双链DNA。优选分离多核苷酸没有其它成分,如蛋白和脂类。多核苷酸编码上述融合蛋白,因此包括NS3*编码序列和至少一种来自HCV多蛋白不同区域的其它HCV多肽,如来自NS2、p7、E1、E2、NS4、NS5a、NS5b、核心等的多肽。本发明的多核苷酸也能包括其它核苷酸序列,如编码接头、信号序列的序列或用于蛋白纯化的配基如谷胱甘肽-S-转移酶和葡萄球菌A蛋白。
为有助于表达产量,需要将多蛋白裂成片段用于表达。这些片段能用于结合本文所述组合物。另外,这些片段可在表达后连接。因此例如,NS3*NS4核心能作为一种构建物表达且NS5aNS5b核心能作为第二种构建物表达。类似的,NS3*NS4NS5a能作为一种构建物表达且具有如NS3*NS4NS5aNS5b核心的第二种构建物可作为第二个构建物表达。例如,NS2p7E2 NS3*NS4能作为单个构建物表达,NS3(未修饰)NS4NS5b可作为另外构建物表达用于受试组合物。要理解上面的组合仅作为代表,可单独表达任何融合组合。
编码不同HCV多肽的多核苷酸能分离自基因组文库,文库来自存在于例如HCV感染个体的血浆、血清或肝匀浆中的核酸序列,或者多核苷酸可在实验室中合成,例如用自动合成仪。扩增方法如PCR能用于从HCV基因组DNA或其编码cDNA中扩增多核苷酸。
多核苷酸可包括这些多肽的编码序列,它们天然产生或者可以是不天然产生的人工序列。能连接这些多核苷酸以形成融合蛋白编码序列,使用标准分子生物技术。如果需要,多核苷酸能克隆到表达载体中并转化入例如细菌、酵母、昆虫或哺乳动物细胞,从而本发明的融合蛋白能在细胞培养物中表达并从中分离。
包括所需融合的本发明表达构建物或含这些融合单独成分的单独表达构建物可用于核酸免疫以刺激细胞免疫应答,使用标准基因传递操作。基因传递方法在本领域已知。参见例如美国专利号5,399,346、5,580,859、5,589,466。基因能直接传递到脊椎动物受试者,或另外活体内传递到来自受试者的细胞,细胞再植入受试者。例如,构建物能作为质粒DNA传递,例如包含于质粒如pBR322、pUC或ColE1。
另外,表达构建物可包装于脂质体,然后传递到细胞。脂封装通常用脂质体完成,脂质体能稳定结合或截留核酸。浓缩DNA与脂制品的比例可变化,但通常约1∶1(mg DNA微摩尔脂)或更多脂类。对于使用脂质体作为传递核酸载体的综述,参见Hug和Sleight,Biochim.Biophys.Acta.(1991)10971-17;Straubinger等,《酶学方法》(1983),101卷,512-527页。
本发明所用脂质体制品包括阳离子(带正电)、阴离子(带负电)和中性制品,特定优选阳离子脂质体。阳离子脂质体易获得。例如,N[1-2,3-二油氧基]丙基]-N,N,N-三乙铵(N[1-2,3-dioleyloxy]propyl)-N,N,N-triethyl-ammonium)(DOTMA)脂质体可来自GIBCO BRL,Grand Island,NY,商品名Lipofectin(也参见Felgner等,Proc.Natl.Acad.Sci.USA(1987)847413-7416)。其它可商业购买的脂类包括transfectace(DDAB/DOPE)和DOTAP/DOPE(Boerhinger)。其它阳离子脂质体可从易获得的材料制备,使用本领域熟知技术。参见例如Szoka等,Proc.Natl.Acad.Sci.USA(1978)754194-4198;PCT出版号WO 90/11092关于描述DOTAP(1,2-二(油氧基)-3-(三乙铵)丙烷)脂质体合成。不同脂质体-核酸复合体用本领域已知方法制备。参见例如Straubinger等,《酶学方法》(1983),101卷,512-527页;Szoka等,Proc.Natl.Acad.Sci.USA(1978)754194-4198;Papahadjopoulos等,Biochim.Biophys.Acta(1975)394483;Wilson等,Cell(1979)1777);Deamer和Bangham,Biochim.Biophys.Acta(1976)443629;Ostro等,Biochim.Biophys.Res.Commun.(1977)76836;Fraley等,Proc.Natl.Acad.Sci.USA(1979)763348);Enoch和Strittmatter,Proc.Natl.Acad.Sci.USA(1979)76145);Fraley等,J.Biol.Chem.(1980)25510431;Szoka和Papahadjopoulos,Proc.Natl.Acad.Sci.USA(1978)75145;Schaefer-Ridder等,Science(1982)215166。
DNA也能在螺旋形脂类组合物中传递,类似于Papahadjopoulos等,Biochim.Biophys.Acta(1975)394483-491所述。也参见美国专利号4,663,161和4,871,488。
发展了一些以病毒为基础的系统用于将基因转移到哺乳动物细胞中。例如,逆转录病毒提供便利平台用于基因传递系统,如鼠肉瘤病毒、小鼠乳癌病毒、莫洛尼鼠类白血病毒和劳氏肉瘤病毒。所选基因能插入载体并包装于逆转录病毒粒子,使用本领域已知技术。随后可分离重组病毒,体内或活体内传递到受试者细胞。描述了一些逆转录病毒系统(美国专利号5,219,740;Miller和Rosman,BioTechniques(1989)7980-990;Miller,A.D.,Human Gene Therapy(1990)15-14;Scarpa等,Virology(1991)180849-852;Burns等,Proc.Natl.Acad.Sci.USA(1993)908033-8037;Boris-Lawrie和Temin,Cur.Opin.Genet.Develop.(1993)3102-109。简要地,本发明的逆转录病毒基因传递载体易从多种逆转录病毒中构建,包括例如B、C和D类逆转录病毒以及spumaviruses和慢病毒如FIV、HIV、HIV-1、HIV-2和SIV(参见《RNA肿瘤病毒》(RNA Tumor Viruses),第2版,Cold Spring HarborLaboratory,1985)。这些逆转录病毒易来自储藏所或保藏所,如美国模式培养物保藏所(“ATCC”;10801 Univeristy Blvd.,Manassas,VA20110-2209),或用常规技术从已知来源分离。
也描述一些腺病毒载体,如腺病毒2和5类载体。不像整合到宿主基因组的逆转录病毒,腺病毒保持在染色体外,因此最小化与插入突变相关的风险(Haj-Ahmad和Graham,J.Virol.(1986)57267-274;Bett等,J.Virol.(1993)675911-5921;Mittereder等,Human Gene Therapy(1994)5717-729;Seth等,J.Virol.(1994)68933-940;Barr等,Gene Therapy(1994)151-58;Berkner,K.L.BioTechniques(1988)6616-629;Rich等,Human Gene Therapy(1993)4461-476)。
分子缀合载体如腺病毒嵌合载体也能用于基因传递,此载体描述于Michael等,J.Biol.Chem.(1993)2686866-6869和Wagner等,Proc.Natl.Acad.Sci.USA(1992)896099-6103。
α病毒属成员也可用作病毒载体以传递感兴趣基因,例如但不限于来自辛德比斯病毒和Semliki森林病毒、VEE的载体。对于本方法实践所用来自辛德比斯病毒的载体的描述,参见Dubensky等,J.Virol.(1996)70508-519;国际公开号WO95/07995和WO 96/17072。
能使用其它载体,包括但不限于猿猴病毒40和细胞巨化病毒。可使用细菌载体,如沙门氏菌属、结肠耶尔森氏杆菌(Yersinia enterocolitica)、志贺氏菌属、霍乱弧菌(Vibrio cholerae)、分枝杆菌菌株BCG和单核细胞增生李斯特菌(Listeriamonocytogenes)。也能使用微型染色体,如MC、MC1、噬菌体、粘粒(插入噬菌体λcos位点的质粒)和复制子(能在自身控制下于细胞中复制的遗传元件)。
表达构建物也可用微粒载体包装、吸收或与之相联。这些载体将多拷贝的所选分子呈递给免疫系统并促进截留和保持分子于局部淋巴结。粒子可由巨噬细胞吞噬且能通过细胞因子释放增强抗原呈递。微粒载体的例子包括来自聚甲基丙烯酸甲酯聚合物的微粒载体以及来自聚(丙交酯)和聚(丙交酯-共-乙交酯)的微粒,此微粒称为PLG。参见例如Jeffery等,Pharm.Res.(1993)10362-368;McGee等,J.Microencap.(1996)。
多种其它方法能用于将表达构建物传递到细胞。这种方法包括DEAE葡聚糖-调节的转染、磷酸钙沉淀、聚赖氨酸-或聚鸟氨酸-调节的转染、或使用其它不溶性无机盐的沉淀,如磷酸锶、含斑脱土和瓷土的硅酸铝、氧化铬、硅酸镁、滑石等。其它有用的转染方法包括电穿孔、超声波穿孔、原生质体融合、脂质体、肽类似物传递或微注射。参见例如Sambrook等,同上关于转化感兴趣细胞的技术讨论;Felgner,P.L,《高级药物传递综述》(Advanced Drug Delivery Reviews)(1990)5163-187关于基因转移所用传递系统的综述。一种用电穿孔传递DNA的特定有效方法描述于国际公开号WO/0045823。
另外,biolistic传递系统使用微粒载体如金和钨,此系统对传递本发明表达构建物特别有用。粒子包被待传递构建物并加速到高速,这通常在大气降低的情况下,使用来自“基因枪”的火药释放。对于这些技术和其有用设备的描述,参见例如美国专利号4,945,050;5,036,006;5,100,792;5,179,022;5,371,015和5,478,744。包括融合蛋白或多核苷酸的组合物本发明也提供含融合蛋白或多核苷酸的组合物。组合物可包括一种或多种融合,只要融合之一包含本文所述突变的NS3结构域。本发明的组合物也可包括药学上可接受载体。载体本身不应诱导对宿主有害的抗体生成。药学上可接受载体在本领域熟知。这些载体包括但不限于大、缓慢代谢的大分子,如蛋白、多糖例如乳胶功能化的琼脂糖凝胶、琼脂糖、纤维素、纤维素珠等,聚乳酸、聚乙醇酸、聚氨基酸如聚谷氨酸和聚赖氨酸等,氨基酸共聚物以及灭活的病毒粒子。
药学上可接受盐也能用于本发明的组合物,例如无机盐如氢氯化物、氢溴酸物、磷酸盐或硫酸盐,以及有机酸的盐如乙酸盐、丙酸盐、丙二酸盐或安息香酸盐。特别有用的蛋白底物是血清白蛋白、匙孔血蓝蛋白、免疫球蛋白分子、甲状腺球蛋白、卵清蛋白、破伤风类毒素和其它本领域技术人员熟知的蛋白。本发明的组合物也能包含脂类或赋形剂,如水、盐水、甘油、右旋糖、乙醇等,它们单独或组合,以及包含物质如润湿剂、乳化剂或pH缓冲剂。本发明的蛋白也能用脂质体和微粒载体如PLG吸收、包装或另外与之相联。脂质体和其它微粒载体描述于上。
如果需要,组合物可包括改善免疫原呈递到淋巴细胞的共刺激分子,如B7-1或B7-2或细胞因子、淋巴因子和化学因子,包括但不限于细胞因子如IL-2、修饰的IL-2(cys125→ser125)、GM-CSF、IL-12、γ-干扰素、IP-10、MIP1β、FLP-3、病毒唑和RANTES。佐剂也能任选包含于组合物。可使用的佐剂包括但不限于(1)铝盐(明矾),如氢氧化铝、正磷酸铝、硫酸铝等;(2)水中油乳剂制品(有或没有其它特异免疫刺激剂如胞壁酰肽(见下)或细菌细胞壁成分),例如(a)MF59(PCT出版号WO 90/14837),含5%鲨烯、0.5%土温80和0.5%Span 85(任选含不同量的MTP-PE),用显微流化剂如110Y型显微流化剂(Microfluidics,Newton,MA)制成亚微粒,(b)SAF,含10%鲨烯、0.4%土温80、5% pluronic-阻断聚合物L121和thr-MDP(见下),微流化入亚微粒乳剂或涡旋以产生更大颗粒大小的乳剂,(c)RibiTM佐剂系统(RAS)(Ribi Immunochem,Hamilton,MT),含2%鲨烯、0.2%土温80、一种或多种选自单磷酰脂质质A(MPL)、海藻糖dimycolate(TDM)和细胞壁骨架(CWS)的细菌细胞壁成分,优选MPL+CWS(DetoxTM);(3)可使用皂角苷佐剂如QS21或StimulonTM(Cambridge Bioscience,Worcester,MA)或者由此产生的颗粒如ISCOMs(免疫刺激复合体),ISCOMs可能缺乏另外的去垢剂(参见例如国际公开号WO 00/07621);(4)完全弗氏佐剂(CFA)和不完全弗氏佐剂(IFA);(5)细胞因子,如白介素,例如IL-1、IL-2、IL-4、IL-5、IL-6、IL-7、IL-12等(参见例如国际公开号WO 99/446636),干扰素例如γ干扰素、巨噬细胞集落刺激因子(M-CSF)、肿瘤坏死因子(TNF)等;(6)细菌ADP-核糖基化毒素的去毒突变体如霍乱毒素(CT)、百日咳毒素(PT)或大肠杆菌(E.coli)热不稳定毒素(LT),特定是LT-K63(其中赖氨酸取代位置63的野生型氨基酸)、LT-R72(其中精氨酸取代位置72的野生型氨基酸)、CT-S109(其中丝氨酸取代位置109的野生型氨基酸)和PT-K9/G129(其中赖氨酸取代位置9的野生型氨基酸且甘氨酸在位置129取代)(参见例如国际公开号WO93/13202和WO92/19265);(7)单磷酰脂质A(MPL)或3-O-脱酰化MPL(3dMPL)(参见例如GB 2220221;EPA 0689454),任选在几乎没有明矾的条件下(参见例如国际公开号WO 00/56358);(8)3d MPL与例如QS21和/或水中油乳剂的组合(参见例如EPA0835318;EPA0735898;EPA0761231);(9)聚氧乙烯醚或聚氧乙烯酯(参见例如国际公开号WO 99/52549);(10)免疫刺激寡核苷酸如CpG寡核苷酸,或皂角苷和免疫刺激寡核苷酸,如CpG寡核苷酸(参见例如国际公开号WO00/62800);(11)免疫刺激剂和金属盐粒子(参见例如国际公开号WO 00/23105);(12)皂角苷和水中油乳剂(参见例如国际公开号WO 99/11241);(13)皂角苷(如QS21)+3dMPL+IL-12(任选+固醇)(参见例如国际公开号WO 98/57659);(14)MPL衍生物RC529;(15)其它物质,作为免疫刺激剂用于提高组合物有效性。优选明矾和MF59。
如上所示,胞壁酰肽包括但不限于N-乙酰-胞壁酰-L-苏氨酰-D-异谷氨酰胺(thr-MDP)、-乙酰-去甲胞壁酰-L-丙氨酰-D-异谷氨酰胺(CGP 11637,称为nor-MDP)、N-乙酰胞壁酰-L-丙氨酰-D-异谷氨酰胺酰-L-丙氨酸-2-(1’-2’-二棕榈酰-sn-甘油-3-羟基磷酰氧基)-乙胺(CGP 19835A,称为MTP-PE)等。
此外,融合蛋白能吸收或截留于ISCOM内。经典ISCOMs通过胆固醇、皂角苷、磷脂和免疫原如病毒包膜蛋白的组合来形成。通常,免疫原(通常由疏水区)可溶于去垢剂且加入反应混合物,ISCOMs用其中所含免疫原形成。ISCOM基质组合物相同形成,但没有病毒蛋白。带高正电荷的蛋白静电结合于ISCOM粒子,而不是通过疏水作用力。对于更详细的皂角苷和ISCOMs综合讨论以及制成ISCOMs的方法,参见Barr等(1998)Adv.Drug Delivery Reviews32247-271(1998)。
本发明所用ISCOMs用本领域熟知的标准技术生成,且描述于例如美国专利号4,981,684、5,178,860、5,679,354和6,027,732;欧洲出版号EPA 109,942、180,564和231,039;Coulter等(1998)Vaccine161243。通常,术语“ISCOM”指在糖苷如三萜皂角苷(特定是QuilA)与含疏水区的抗原之间形成的免疫原性复合体。参见例如欧洲出版号EPA 109,942和180,564。在此实施方案中,HCV融合(通常有疏水区)溶于去垢剂并加入反应混合物,ISCOMs用其中所含融合形成。HCV多肽ISCOMs易用表现出两亲性质的HCV多肽制成。然而,缺乏所需疏水性质的蛋白和肽偶联具有疏水氨基酸、脂肪酸自由基、烷基自由基等的肽之后,可纳入免疫原性复合体。
如欧洲出版号EPA 231,039所说明,形成基本ISCOM结构(称为基质或ISCOMATRIX)不必须要存在抗原,此结构可形成自固醇如胆固醇、磷脂例如磷脂酰乙醇胺以及糖苷如Quil A。因此,感兴趣的HCV融合存在于基质外,而不是结合到基质中,例如经静电相互作用吸收到基质中。例如,带高正电荷的HCV融合可静电结合于ISCOM粒子,而不是通过疏水作用力。对于更详细的皂角苷和ISCOMs综合讨论以及制成ISCOMs的方法,参见Barr等(1998)Adv.Drug DeliveryReviews32247-271(1998)。
可制备ISCOM基质,例如通过将溶解的固醇、糖苷和(任选)磷脂混合一起。如果不用磷脂,形成2维结构。参见例如欧洲出版号EPA231,039。术语“ISCOM基质”用于指3维和2维结构。待使用的糖苷通常表现出两亲性质且包括分子中的疏水和亲水区。优选使用皂角苷,如来自Quillaja saponaria Molina和Quil A的皂角苷提取物。其它优选皂角苷是来自七叶树栗(Aesculus)的七叶角苷(Patt等(1960)Arzneimittelforschung10273-275和来自Gypsophilla struthium的sapoalbin(Vochten等(1968)J.Pharm.Belg.42213-226。
为制备ISCOMs,糖苷以至少关键胶束形成浓度使用。在Quil A的情况中,此浓度约为0.03%重量。用于生成ISCOMs的固醇可以是动物或植物来源的固醇,如胆固醇、羊毛甾醇、光甾醇、豆固醇和谷甾醇。适当磷脂包括磷脂酰胆碱和磷脂酰乙醇胺。通常,对于各图,糖苷(尤其当它是Quil A时)与固醇(尤其当它是胆固醇时)与磷脂的摩尔比例是1∶1∶0-1,±20%(优选不超过10%)。这与约5∶1的QuilA胆固醇重量比例相当。
增溶剂也可存在且可以是例如去垢剂、尿素或胍。通常,非离子、离子或两性离子去垢剂或基于胆酸的去垢剂如脱氧胆酸钠、胆酸盐和CTAB(鲸蜡基溴化三铵)能用于此目的。适当去垢剂的例子包括但不限于辛基葡糖苷、壬基N-甲基葡糖酰胺(nonyl N-methyl glucamide)或癸酰基N-甲基葡糖酰胺、烷基苯基聚氧乙烯醚如有9到10个乙氧烯基(oxyethylene)的聚乙二醇p-异辛基-苯乙醚(商业购买的商品名为TRITON X-100RTM)、酰基聚氧乙烯酯如酰基聚氧乙烯山梨糖酯(商业购买的商品名为土温20TM、土温80TM等)。通常去除增溶剂以形成ISCOMs,如通过超滤、透析、超离心或层析,然而,在一些方案中,此步骤不必需。(参见例如美国专利号4,981,684)。
通常,糖苷如Quil A与HCV融合的重量比例在5∶1到0.5∶1的范围内。重量比例优选约为3∶1到1∶1,比例更优0选为2∶1。
一旦形成ISCOMs,它们可制成组合物并施用给动物,如本文所述。如果需要,所得免疫原性复合体溶液可冻干,随后在使用前复水。
生成HCV-特异抗体的方法HCV融合蛋白能用于生成HCV-特异性多克隆和单克隆抗体。HCV-特异性多克隆和单克隆抗体特异结合HCV抗原。生成多克隆抗体可通过施用融合蛋白给哺乳动物,如小鼠、兔、山羊或马。收集来自免疫动物的血清,从血浆中纯化抗体,通过例如硫酸铵沉淀,接着层析,优选亲和层析。生成和加工多克隆抗血清的技术在本领域已知。
同样易生成单克隆抗体,它定向抗融合蛋白中存在的HCV-特异性抗原表位。来自哺乳动物如HCV融合蛋白免疫小鼠的正常B细胞能融合例如HAT-敏感的小鼠骨髓瘤细胞以生成杂交瘤。产生HCV-特异抗体的杂交瘤能用RIA或ELISA鉴定并通过在半固体琼脂中克隆或有限稀释来分离。生成HCV-特异抗体的克隆通过另一轮筛选来分离。
定向抗HCV抗原表位的抗体,无论单克隆或多克隆,对检测样品中HCV或HCV抗原的存在特别有用,如来自HCV感染人的血清样品。用于HCV抗原的免疫测定可使用一种抗体或几种抗体。用于HCV抗原的免疫测定可使用例如定向抗HCV抗原表位的单克隆抗体、定向抗一种HCV多肽抗原表位的单克隆抗体组合、定向抗不同HCV多肽抗原表位的单克隆抗体、定向抗相同HCV抗原的多克隆抗体、定向抗不同HCV抗原的多克隆抗体、或单克隆和多克隆抗体的组合。免疫测定操作可在例如竞争、直接反应或三明治型测定的基础上,使用例如标记抗体。标记可以是例如荧光、化学发光或放射性。
多克隆或单克隆抗体可进一步用于分离HCV粒子或抗原,使用免疫亲和柱。抗体能通过例如吸收或共价键附于固体支持物,从而抗体保持其免疫选择活性。可任选包括间隔基团,从而能接近抗体的抗原结合位点。随后固定抗体能用于结合来自生物样品的HCV粒子或抗原,生物样品如血液或血浆。从柱基质中回收结合的HCV粒子或抗原,通过例如pH变化。
HCV-特异性T细胞上述融合包括NS3*NS4NS5a融合蛋白或NS3*NS4NS5aNS5b融合蛋白,有或没有核心多肽,以及本文所述其它任意不同融合,体内或体外表达,这些融合激活的HCV-特异性T细胞优选识别HCV多肽如NS2、p7、E1、E2、NS3、NS4、NS5a或NS5b多肽的抗原表位,包括一种或多种这些肽与NS3*融合的抗原表位,融合有或没有核心多肽。HCV-特异性T细胞可以是CD8+或CD4+。
HCV-特异性CD8+T细胞可以是细胞毒T淋巴细胞(CTL),它能杀死HCV-感染细胞,感染细胞显示出任意这些与MHC I型分子形成复合体的抗原表位。能检测HCV-特异性CD8+T细胞,通过例如51Cr释放测定(见实施例4)。51Cr释放测定测量HCV-特异性CD8+T细胞裂解靶细胞的能力,靶细胞展示一种或多种这些抗原表位。本文也考虑表达抗病毒剂如IFN-γ的HCV-特异性CD8+T细胞,该T细胞也能通过免疫学方法检测,优选在用一种或多种HCV多肽体外刺激后胞内染色IFN-γ或细胞因子,HCV多肽例如但不限于NS3、NS4、NS5a或NS5b多肽(见实施例5)。
上述融合例如但不限于NS3*NS4NS5a或NS3*NS4NS5aNS5b融合蛋白,有或没有核心多肽,体内或体外表达,这些融合激活的HCV-特异性CD4+T细胞优选识别HCV多肽抗原表位,HCV多肽例如但不限于NS2、p7、E1、E2、NS3、NS4、NS5a或NS5b多肽,抗原表位包括其融合的抗原表位,例如但不限于NS3NS4NS5a或NS3NS4NS5aNS5b融合蛋白,抗原表位结合HCV感染细胞上的MHC II型分子且响应刺激而增殖,刺激用例如NS3*NS4NS5a或NS3*NS4NS5aNS5b肽,有或没有核心多肽。
HCV-特异性CD4+T细胞能通过淋巴增生测定(见实施例6)检测。淋巴增生测定测量HCV-特异性CD4+T细胞响应例如NS2、p7、E1、E2、NS3、NS4、NS5a和/或NS5b抗原表位而增殖的能力。
激活HCV-特异性T细胞的方法HCV融合蛋白或多核苷酸能用于体外或体内激活HCV-特异性T细胞。可使用HCV-特异性T细胞激活,用于提供模型系统以最优化CTL对HCV的反应和提供抗HCV感染的预防或治疗处理。对于体外激活,蛋白优选经质粒或病毒载体提供给T细胞,如上述腺病毒载体。
T细胞多克隆群能来自血液,优选来自感染HCV哺乳动物的外周淋巴器官,如淋巴结、脾或胸腺。优选哺乳动物包括小鼠、黑猩猩、狒狒和人。HCV用于增加哺乳动物中的活化HCV-特异性T细胞数量。来自哺乳动物的HCV-特异性T细胞随后可体外再刺激,这是通过加入本文所述HCV融合蛋白到T细胞,融合蛋白例如但不限于HCV NS3NS4NS5a或NS3NS4NS5aNS5b抗原表位肽,有或没有核心多肽。然后能测试HCV-特异性T细胞的增殖、IFN-γ生成和体外裂解靶细胞的能力,靶细胞展示例如NS3NS4NS5a或NS3NS4NS5aNS5b抗原表位。
在淋巴增生测定(见实施例6)中,当用HCV多肽培养但没有缺乏HCV抗原表位肽时,HCV-活化CD4+T细胞增殖,HCV多肽例如但不限于NS3、NS4、NS5a、NS5b、NS3NS4NS5a或NS3NS4NS5aNS5b抗原表位肽。因此,能用淋巴增生测定鉴定特定HCV抗原表位如NS2、p7、E1、E2、NS3、NS4、NS5a、NS5b以及这些抗原表位的融合,例如但不限于NS3NS4NS5a和NS3NS4NS5aNS5b抗原表位,这些抗原表位由HCV-特异性CD4+T细胞识别。
类似的,在上述融合蛋白体外刺激后检测HCV-特异性CD4+和/或CD8+T细胞中的IFN-γ,能用于鉴定如融合蛋白抗原表位,例如但不限于NS2、p7、E1、E2、NS3、NS4、NS5a、NS5b,以及鉴定这些抗原表位的融合,例如但不限于NS3NS4NS5a和NS3NS4NS5aNS5b抗原表位,它们对刺激CD4+和/或CD8+T细胞生成IFN-γ特别有效(实施例5)。
此外,51Cr释放测定用于确定CTL对HCV反应的水平。参见Cooper等Immunity 10439-449。例如,HCV-特异性CD8+T细胞能来自HCV感染哺乳动物的肝。这些T细胞可在51Cr释放测定中测试,抗展示例如NS3NS4NS5a或NS3NS4NS5aNS5b抗原表位的靶细胞。能够建一些表达不同NS3NS4NS5a或NS3NS4NS5aNS5b抗原表位的靶细胞群,从而各靶细胞群显示NS3NS4NS5a或NS3NS4NS5aNS5b的不同抗原表位。能测定抗各个这些靶细胞群的HCV-特异性CD8+细胞。51Cr释放测定结果可用于确定是NS3NS4NS5a还是NS3NS4NS5aNS5b的抗原表位引起最强的CTL对HCV反应。随后用来自51Cr释放测定的信息构建NS3*NS4NS5a融合蛋白或NS3*NS4NS5aNS5b融合蛋白,有或没有核心多肽,它们包含引起最强CTL反应的抗原表位。
上述HCV融合蛋白或编码这种融合蛋白的多核苷酸能施用给哺乳动物,如小鼠、狒狒、黑猩猩或人,用于体内激活HCV-特异性T细胞。施用可通过本领域已知的任意方法,包括肠胃外、鼻内、肌肉内或皮下注射,包含用弹道枪(“基因枪”)的注射,如上所讨论。
HCV多核苷酸注射优选用于激活T细胞。除了构建和修饰简单的实践优势外,注射多核苷酸导致宿主中合成融合蛋白。因此,呈递这些有天然的翻译后修饰、结构和构象的免疫原给宿主免疫系统。多核苷酸优选肌肉内注射给大型哺乳动物如人,剂量为0.5、0.75、1.0、1.5、2.0、2.5、5或10mg/kg。
本发明的组合物包括HCV融合蛋白或多核苷酸,施用方式与所用特定组合物相容,施用量有效激活HCV-特异性T细胞,通过51Cr释放测定、淋巴增生测定或IFN-γ胞内染色测量。蛋白和/或多核苷酸能施用给未感染HCV的哺乳动物或能施用给感染HCV的哺乳动物。组合物中多核苷酸或融合蛋白的特定剂量取决于许多因素,包括但不限于种类、年龄、施用组合物的哺乳动物综合情况、组合物施用模式。本发明组合物的有效量容易确定,仅使用常规实验。上述体外和体内模型能用于鉴定适当剂量。下述例子中所用多核苷酸量提供的综合指南可用于最优化HCV-特异性T细胞的体内或体外激活。通常,0.5、0.75、1.0、1.5、2.0、2.5、5或10mg/kg HCV融合蛋白或多核苷酸施用给大型哺乳动物如狒狒、黑猩猩或人,融合蛋白或多核苷酸有或没有核心多肽。如果需要,共刺激分子或佐剂也能在组合物之前、之后或一起提供。
通过传递本发明组合物产生的哺乳动物免疫应答包括激活HCV-特异性T细胞,可通过改变剂量、施用途径或强化方案来增强。本发明的组合物可以单剂量方案给予,或优选以多剂量方案,其中疫苗接种的主要过程包括1-10个单独剂量,接着以维持和/或加强免疫应答所需的后续时间间隔给予其它剂量,例如第2种剂量用1-4个月,如果需要,几个月后用一种或几种后续剂量。
III.实验下面是完成本发明的特定实施方案例子。提供例子仅用于阐明目的,而不想以任何方式限制本发明范围。本领域技术人员易理解本发明可以本说明书教授的多种方法实践。
努力确保所用数字的精确性(例如量、温度等),但当然应允许一些实验误差和偏差。
实施例1NS3*NS4NS5a核心多核苷酸的生成下列例子中的NS3*代表修饰的NS3分子。编码NS3NS4NS5a的多核苷酸(约氨基酸1027到2399,编号是相对于HCV-1)(本文也定义为“NS345a”)分离自HCV。突变分子的NS3部分是通过突变在蛋白酶活性位点上发现的His、Asp和Ser残基的编码序列,从而使所得分子在这些位置编码除His、Asp和Ser以外的氨基酸且缺乏NS3蛋白酶活性。此构建物融合编码核心多肽的多核苷酸,它包括全长多蛋白的氨基酸1-122。编码核心的多核苷酸序列从下游融合编码NS5a的构建部分,因而所得融合蛋白在其C-末端包括核心多肽。构建物被克隆到质粒、牛痘病毒和腺病毒中。另外,构建物被插入重组表达载体并被用于转化宿主细胞以生成NS3*NS4NS5a核心融合蛋白。
蛋白酶活性如下确定。将NS4A肽(KKGSVVIVGRIVLSGKPAIIPKK)(SEQ IDNO8)和融合蛋白稀释于90μl反应缓冲液(25mM Tris,pH7.5、0.15M NaCl、0.5mMEDTA、10%甘油、0.05 n-十二烷基B-D-麦芽糖苷、5mM DTT),并在室温下混合30分钟。将90μl混合物加到微量滴定板(Costar,Inc.,Corning,NY),并加入10μl HCV底物(AnaSpec,Inc,San Jose CA)。混合平板并在Fluostar平板读数器上读数。结果表示为每分钟的相对荧光单位(RFU)。
实施例2在免疫动物中致敏HCV-特异性CTL如上所述生成的HCV融合蛋白NS3*NS4NS5a核心用于如下产生HCV融合-ISCOM。制备融合-ISCOM制剂,这是通过混合融合蛋白和作用ISCOMATRIX(空ISCOMs),利用离子相互作用以最大化抗原与佐剂间的联合。制备ISCOMATRIX基本如Coulter等(1998)Vaccine161243所述。
恒河猴在麻醉情况下免疫。动物分成2组。第1组在第0个月用2×108噬斑形成单位(pfu)(皮下为1×108且划痕为1×108)的rVVC/E1感染。此组用作CTL致敏的正对照。来自第2组的动物用25-100μg上述HCV融合多肽免疫,融合多肽吸收于ISCOM,在第0、1、2和6个月肌肉内(IM)注射左四头肌。细胞毒活性在标准51Cr释放测定中分析,测定描述于例如Paliard等(2000)AIDSRes.Hum.Retroviruses16273。
实施例3用NS3*NS4NS5a核心多核苷酸免疫在一个免疫操作中,动物用50-250μg编码NS3*NS4NS5a核心融合蛋白的质粒DNA免疫,通过肌肉内注射到前胫。6周后强化注射107pfu疫苗病毒(VV)-NS5a(腹膜内)或50-250μg质粒对照(肌肉内)。
在另一个免疫操作中,肌肉内注射动物前胫,用1010编码NS3*NS4NS5a核心融合蛋白的腺病毒粒子。6周后腹膜内强化注射107pfu的VV-NS5a或肌肉内强化注射1010腺病毒粒子。
实施例4激活HCV-特异性CD8+T细胞51Cr释放测定。51Cr释放测定用于测量HCV-特异性T细胞裂解靶细胞的能力,靶细胞展示NS5a抗原表位。脾细胞收集自免疫动物。IL-2存在时,这些细胞用来自HCV-NS5a的CTL抗原表位肽p214K9(2152-HEYPVGSQL-2160;SEQ ID NO1)体外再刺激6天。随后在标准51Cr释放测定中分析脾细胞抗肽敏化靶细胞(L929)的细胞毒活性,靶细胞表达MHC I型分子而不是II型,描述于Weiss(1980)J.Biol.Chem.2559912-9917。所测效应(T细胞)与靶(B细胞)的比例为60∶1、20∶1和7∶1。计算各效应与靶比例的百分比特异裂解。
实施例5激活表达IFN-γ的HCV-特异性CD8+T细胞干扰素-γ的胞内染色(IFN-γ)。干扰素-γ的胞内染色用于在NS5a抗原表位p214K9体外刺激后鉴定分泌IFN-γ的CD8+T细胞。IL-2和莫能菌素存在时,单独免疫动物的脾细胞用p214K9或非特异肽再刺激6-12个小时。然后染色细胞的表面CD8和胞内IFN-γ,流式细胞仪分析。随后计算也对IFN-γ阳性的CD8+T细胞百分比。
实施例6HCV-特异性CD4+T细胞的增殖淋巴增生测定。收集自免疫动物的脾细胞用磁珠去除CD8+T细胞,三倍培养,用来自HCV-NS5a的NS5a-抗原表位肽p222D(2224-AELIEANLLWRQEMG-2238;SEQ ID NO2)培养,或单独在培养基中。72小时后,细胞用1μCi每孔的3H-胸苷脉冲,6-8小时后收集。收集后测量结合的放射活性。计算平均cpm。
实施例7NS3*45a核心-编码DNA疫苗制剂致敏CTL的能力动物用10-250μg编码NS3*45a核心融合蛋白的质粒DNA免疫,如实施例3所述,用PLG连接的NS3*45a核心编码DNA(见下)或编码NS3*45a核心的DNA,经电穿孔传递(对于此传递技术,参见例如国际公开号WO/0045823)。免疫后6周用编码NS3*45a核心的质粒DNA强化注射。
PLG-传递的DNA。聚丙交酯-共-乙交酯(PLG)聚合物来自BoehringerIngelheim,U.S.A.。PLG聚合物是RG505,其共聚物比例为50/50且分子量为65kDa(厂商数据)。制备有吸收DNA的阳离子微粒,使用改进的溶剂蒸发方法,方法基本如Singh Proc.Natl.Acad.Sci.USA(2000)97811-816所述。简要地,制备微粒是通过高速乳化10ml 5%w/v聚合物溶液于甲叉二氯中,甲叉二氯有1ml PBS,使用IKA均化器。初级乳剂随后加入50ml含鲸蜡三甲基溴化铵(CTAB)的蒸馏水(0.5%w/v)。这形成w/o/w乳剂,乳剂以6000rpm室温搅拌12小时,使甲叉二氯能蒸发。所得微粒在蒸馏水中洗2遍,10,000g离心并冷冻干燥。制备后,洗涤和收集,DNA吸收于微粒上,这是通过在1mg/ml DNA溶液中4C孵育100mg阳离子微粒6小时。随后离心分离微粒,沉淀用TE缓冲液洗,冷冻干燥微粒。
CTL活性和IFN-γ表达通过51Cr释放测定或胞内染色测量,如上面例子所述。
实施例8免疫途径和编码NS3*45a核心的复制粒子SINCR(DC+)制备α病毒复制粒子例如SINCR(DC+)如Polo等,Proc.Natl.Acad.Sci.USA(1999)964598-4603所述。动物肌肉内(IM)注射5×106IU编码NS3*45a核心的SINCR(DC+)复制粒子,如实施例3所述,或者在尾底部(BoT)和爪垫(FP)皮下注射(S/C),或经IM施用传递2/3 DNA结合经BoT途径施用1/3 DNA。免疫后强化注射编码NS5a的牛痘病毒,如实施例3所述。IFN-γ表达通过胞内染色测量,如实施例5所述。
实施例9α病毒复制子致敏,接着用不同强化方案制备α病毒复制粒子例如SINCR(DC+)如Polo等,Proc.Natl.Acad.Sci.USA(1999)964598-4603所述。动物用1.5×106IU编码NS345a的复制粒子SINCR(DC+)致敏,通过肌肉内注射到前胫,接着在第6周强化注射10-100μg编码NS5a的质粒DNA、1010编码NS3*45a核心的腺病毒粒子、1.5×106IU编码NS3*45a核心的SINCR(DC+)复制粒子或107pfu编码NS5a的牛痘病毒。IFN-γ表达通过胞内染色测量,如实施例5所述。
实施例10表达NS3*45a核心的α病毒制备α病毒复制粒子例如SINCR(DC+)和SINCR(LP)如Polo等,Proc.Natl.Acad.Sci.USA(1999)964598-4603所述。动物用1×102到1×106IU编码NS3*45a核心的SINCR(DC+)复制粒子免疫,通过传递途径组合(2/3IM和1/3 S/C)以及单独S/C,或用1×102到1×106IU编码NS3*45a核心的SINCR(LP)复制粒子,通过传递途径组合(2/3IM和1/3 S/C)以及单独S/C。免疫后在第6周强化注射107pfu编码NS5a的牛痘病毒。IFN-γ表达通过胞内染色测量,如实施例5所述。
至此已经描述了刺激细胞介导的免疫应答的HCV融合多肽。尽管已经在一定程度上详细描述了本发明的优选实施方案,应该理解的是,在不背离这里所定义的本发明精神和范围的前提下可作出明显的改变。
序列表<110>希龙公司(Chiron Corporation)<120>具有修饰的NS3结构域的HCV融合蛋白<130>PP19545.004(2300-19545.40)<150>60/394,510<151>2002-07-08<150>60/393,694<151>2002-07-02<150>09/721,479<151>2000-11-22<150>60/167,502<151>1999-11-24<160>8<170>PatentIn version 3.2<210>1<211>9<212>PRT<213>人工的<220>
<223>被T细胞受体识别的表位<400>1His Glu Tyr Pro Val Gly Ser Gln Leu1 5<210>2<211>15<212>PRT<213>人工的<220>
<223>被T细胞受体识别的表位<400>2Ala Glu Leu Ile Glu Ala Asn Leu Leu Trp Arg Gln Glu Met Gly1 5 10 15<210>3<211>546<212>DNA<213>人工的<220>
<223>代表性的天然、未修饰的NS3蛋白酶结构域的DNA序列<400>3atg gcg ccc atc acg gcg tac gcc cag cag aca agg ggc ctc cta ggg 48Met Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly1 5 10 15tgc ata atc acc agc cta act ggc cgg gac aaa aac caa gtg gag ggt 96Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly20 25 30gag gtc cag att gtg tca act gct gcc caa acc ttc ctg gca acg tgc 144Glu Val Gln Ile Val Ser Thr Ala Ala Gln Thr Phe Leu Ala Thr Cys35 40 45atc aat ggg gtg tgc tgg act gtc tac cac ggg gcc gga acg agg acc 192Ile Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr50 55 60atc gcg tca ccc aag ggt cct gtc atc cag atg tat acc aat gta gac 240Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Ash Val Asp65 70 75 80caa gac ctt gtg ggc tgg ccc gct ccg caa ggt agc cga tca ttg aca 288Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr85 90 95ccc tgc act tgc ggc tcc tcg gac ctt tac ctg gtc acg agg cac gcc 336Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala
100 105 110gat gtc att ccc gtg cgc cgg cgg ggt gat agc agg ggc agc ctg ctg 384Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu115 120 125tcg ccc cgg ccc att tcc tac ttg aaa ggc tcc tcg ggg ggt ccg ctg 432Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu130 135 140ttg tgc ccc gcg ggg cac gcc gtg ggc ata ttt agg gcc gcg gtg tgc 480Leu Cys Pro Ala Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys145 150 155 160acc cgt gga gtg gct aag gcg gtg gac ttt atc cct gtg gag aac cta 528Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ash Leu165 170 175gag aca acc atg agg tcc 546Glu Thr Thr Met Arg Ser180<210>4<211>182<212>PRT<213>人工的<220>
<223>代表性的天然、未修饰的NS3蛋白酶结构域的氨基酸序列<400>4Met Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly1 5 10 15Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly20 25 30Glu Val Gln Ile Val Ser Thr Ala Ala Gln Thr Phe Leu Ala Thr Cys35 40 45Ile Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr
50 55 60Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp65 70 75 80Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr85 90 95Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala100 105 110Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu115 120 125Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu130 135 140Leu Cys Pro Ala Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys145 150 155 160Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu165 170 175Glu Thr Thr Met Arg Ser180<210>5<211>5676<212>DNA<213>人工的<220>
<223>代表性的修饰的融合蛋白的DNA序列,其NS3蛋白酶结构域被从N-末端删除,且在C-末端含有核心多肽的氨基酸1-121<400>5atg gct gca tat gca gct cag ggc tat aag gtg cta gta ctc aac ccc 48Met Ala Ala Tyr Ala Ala Gln Gly Tyr Lys Val Leu Val Leu Ash Pro1 5 10 15tct gtt gct gca aca ctg ggc ttt ggt gct tac atg tcc aag gct cat 96Ser Val Ala Ala Thr Leu Gly Phe Gly Ala Tyr Met Ser Lys Ala His
20 25 30ggg atc gat cct aac atc agg acc ggg gtg aga aca att acc act ggc144Gly Ile Asp Pro Asn Ile Arg Thr Gly Val Arg Thr Ile Thr Thr Gly35 40 45agc ccc atc acg tac tcc acc tac ggc aag ttc ctt gcc gac ggc ggg192Ser Pro Ile Thr Tyr Ser Thr Tyr Gly Lys Phe Leu Ala Asp Gly Gly50 55 60tgc tcg ggg ggc gct tat gac ata ata att tgt gac gag tgc cac tcc240Cys Ser Gly Gly Ala Tyr Asp Ile Ile Ile Cys Asp Glu Cys His Ser65 70 75 80acg gat gcc aca tcc atc ttg ggc att ggc act gtc ctt gac caa gca288Thr Asp Ala Thr Ser Ile Leu Gly Ile Gly Thr Val Leu Asp Gln Ala85 90 95gag act gcg ggg gcg aga ctg gtt gtg ctc gcc acc gcc acc cct ccg336Glu Thr Ala Gly Ala Arg Leu Val Val Leu Ala Thr Ala Thr Pro Pro100 105 110ggc tcc gtc act gtg ccc cat ccc aac atc gag gag gtt gct ctg tcc384Gly Ser Val Thr Val Pro His Pro Asn Ile Glu Glu Val Ala Leu Ser115 120 125acc acc gga gag atc cct ttt tac ggc aag gct atc ccc ctc gaa gta432Thr Thr Gly Glu Ile Pro Phe Tyr Gly Lys Ala Ile Pro Leu Glu Val130 135 140atc aag ggg ggg aga cat ctc atc ttc tgt cat tca aag aag aag tgc480Ile Lys Gly Gly Arg His Leu Ile Phe Cys His Ser Lys Lys Lys Cys145 150 155 160gac gaa ctc gcc gca aag ctg gtc gca ttg ggc atc aat gcc gtg gcc528Asp Glu Leu Ala Ala Lys Leu Val Ala Leu Gly Ile Asn Ala Val Ala165 170 175tac tac cgc ggt ctt gac gtg tcc gtc atc ccg acc agc ggc gat gtt576Tyr Tyr Arg Gly Leu Asp Val Ser Val Ile Pro Thr Ser Gly Asp Val180 185 190gtc gtc gtg gca acc gat gcc ctc atg acc ggc tat acc ggc gac ttc624Val Val Val Ala Thr Asp Ala Leu Met Thr Gly Tyr Thr Gly Asp Phe
195 200 205gac tcg gtg ata gac tgc aat acg tgt gtc acc cag aca gtc gat ttc672Asp Ser Val Ile Asp Cys Asn Thr Cys Val Thr Gln Thr Val Asp Phe210 215 220agc ctt gac cct acc ttc acc att gag aca atc acg ctc ccc caa gat720Ser Leu Asp Pro Thr Phe Thr Ile Glu Thr Ile Thr Leu Pro Gln Asp225 230 235 240gct gtc tcc cgc act caa cgt cgg ggc agg act ggc agg ggg aag cca768Ala Val Ser Arg Thr Gln Arg Arg Gly Arg Thr Gly Arg Gly Lys Pro245 250 255ggc atc tac aga ttt gtg gca ccg ggg gag cgc ccc tcc ggc atg ttc816Gly Ile Tyr Arg Phe Val Ala Pro Gly Glu Arg Pro Ser Gly Met Phe260 265 270gac tcg tcc gtc ctc tgt gag tgc tat gac gca ggc tgt gct tgg tat864Asp Ser Ser Val Leu Cys Glu Cys Tyr Asp Ala Gly Cys Ala Trp Tyr275 280 285gag ctc acg ccc gcc gag act aca gtt agg cta cga gcg tac atg aac912Glu Leu Thr Pro Ala Glu Thr Thr Val Arg Leu Arg Ala Tyr Met Asn290 295 300acc ccg ggg ctt ccc gtg tgc cag gac cat ctt gaa ttt tgg gag ggc960Thr Pro Gly Leu Pro Val Cys Gln Asp His Leu Glu Phe Trp Glu Gly305 310 315 320gtc ttt aca ggc ctc act cat ata gat gcc cac ttt cta tcc cag aca1008Val Phe Thr Gly Leu Thr His Ile Asp Ala His Phe Leu Ser Gln Thr325 330 335aag cag agt ggg gag aac ctt cct tac ctg gta gcg tac caa gcc acc1056Lys Gln Ser Gly Glu Asn Leu Pro Tyr Leu Val Ala Tyr Gln Ala Thr340 345 350gtg tgc gct agg gct caa gcc cct ccc cca tcg tgg gac cag atg tgg1104Val Cys Ala Arg Ala Gln Ala Pro Pro Pro Ser Trp Asp Gln Met Trp355 360 365aag tgt ttg att cgc ctc aag ccc acc ctc cat ggg cca aca ccc ctg1152Lys Cys Leu Ile Arg Leu Lys Pro Thr Leu His Gly Pro Thr Pro Leu
370 375 380cta tac aga ctg ggc gct gtt cag aat gaa atc acc ctg acg cac cca1200Leu Tyr Arg Leu Gly Ala Val Gln Asn Glu Ile Thr Leu Thr His Pro385 390 395 400gtc acc aaa tac atc atg aca tgc atg tcg gcc gac ctg gag gtc gtc1248Val Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val405 410 415acg agc acc tgg gtg ctc gtt ggc ggc gtc ctg gct gct ttg gcc gcg1296Thr Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala420 425 430tat tgc ctg tca aca ggc tgc gtg gtc ata gtg ggc agg gtc gtc ttg1344Tyr Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Val Val Leu435 440 445tcc ggg aag ccg gca atc ata cct gac agg gaa gtc ctc tac cga gag1392Ser Gly Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr Arg Glu450 455 460ttc gat gag atg gaa gag tgc tct cag cac tta ccg tac atc gag caa1440Phe Asp Glu Met Glu Glu Cys Ser Gln His Leu Pro Tyr Ile Glu Gln465 470 475 480ggg atg atg ctc gcc gag cag ttc aag cag aag gcc ctc ggc ctc ctg1488Gly Met Met Leu Ala Glu Gln Phe Lys Gln Lys Ala Leu Gly Leu Leu485 490 495cag acc gcg tcc cgt cag gca gag gtt atc gcc cct gct gtc cag acc1536Gln Thr Ala Ser Arg Gln Ala Glu Val Ile Ala Pro Ala Val Gln Thr500 505 510aac tgg caa aaa ctc gag acc ttc tgg gcg aag cat atg tgg aac ttc1584Asn Trp Gln Lys Leu Glu Thr Phe Trp Ala Lys His Met Trp Asn Phe515 520 525atc agt ggg ata caa tac ttg gcg ggc ttg tca acg ctg cct ggt aac1632Ile Ser Gly Ile Gln Tyr Leu Ala Gly Leu Ser Thr Leu Pro Gly Asn530 535 540ccc gcc att gct tca ttg atg gct ttt aca gct gct gtc acc agc cca1680Pro Ala Ile Ala Ser Leu Met Ala Phe Thr Ala Ala Val Thr Ser Pro
545 550 555 560cta acc act agc caa acc ctc ctc ttc aac ata ttg ggg ggg tgg gtg1728Leu Thr Thr Ser Gln Thr Leu Leu Phe Asn Ile Leu Gly Gly Trp Val565 570 575gct gcc cag ctc gcc gcc ccc ggt gcc gct act gcc ttt gtg ggc gct1776Ala Ala Gln Leu Ala Ala Pro Gly Ala Ala Thr Ala Phe Val Gly Ala580 585 590ggc tta gct ggc gcc gcc atc ggc agt gtt gga ctg ggg aag gtc ctc1824Gly Leu Ala Gly Ala Ala Ile Gly Ser Val Gly Leu Gly Lys Val Leu595 600 605ata gac atc ctt gca ggg tat ggc gcg ggc gtg gcg gga gct ctt gtg1872Ile Asp Ile Leu Ala Gly Tyr Gly Ala Gly Val Ala Gly Ala Leu Val610 615 620gca ttc aag atc atg agc ggt gag gtc ccc tcc acg gag gac ctg gtc1920Ala Phe Lys Ile Met Ser Gly Glu Val Pro Ser Thr Glu Asp Leu Val625 630 635 640aat cta ctg ccc gcc atc ctc tcg ccc gga gcc ctc gta gtc ggc gtg1968Asn Leu Leu Pro Ala Ile Leu Ser Pro Gly Ala Leu Val Val Gly Val645 650 655gtc tgt gca gca ata ctg cgc cgg cac gtt ggc ccg ggc gag ggg gca2016Val Cys Ala Ala Ile Leu Arg Arg His Val Gly Pro Gly Glu Gly Ala660 665 670gtg cag tgg atg aac cgg ctg ata gcc ttc gcc tcc cgg ggg aac cat2064Val Gln Trp Met Asn Arg Leu Ile Ala Phe Ala Ser Arg Gly Asn His675 680 685gtt tcc ccc acg cac tac gtg ccg gag agc gat gca gct gcc cgc gtc2112Val Ser Pro Thr His Tyr Val Pro Glu Ser Asp Ala Ala Ala Arg Val690 695 700act gcc ata ctc agc agc ctc act gta acc cag ctc ctg agg cga ctg2160Thr Ala Ile Leu Ser Ser Leu Thr Val Thr Gln Leu Leu Arg Arg Leu705 710 715 720cac cag tgg ata agc tcg gag tgt acc act cca tgc tcc ggt tcc tgg2208His Gln Trp Ile Ser Ser Glu Cys Thr Thr Pro Cys Ser Gly Ser Trp
725 730 735cta agg gac atc tgg gac tgg ata tgc gag gtg ttg agc gac ttt aag2256Leu Arg Asp Ile Trp Asp Trp Ile Cys Glu Val Leu Ser Asp Phe Lys740 745 750acc tgg cta aaa gct aag ctc atg cca cag ctg cct ggg atc ccc ttt2304Thr Trp Leu Lys Ala Lys Leu Met Pro Gln Leu Pro Gly Ile Pro Phe755 760 765gtg tcc tgc cag cgc ggg tat aag ggg gtc tgg cga ggg gac ggc atc2352Val Ser Cys Gln Arg Gly Tyr Lys Gly Val Trp Arg Gly Asp Gly Ile770 775 780atg cac act cgc tgc cac tgt gga gct gag atc act gga cat gtc aaa2400Met His Thr Arg Cys His Cys Gly Ala Glu Ile Thr Gly His Val Lys785 790 795 800aac ggg acg atg agg atc gtc ggt cct agg acc tgc agg aac atg tgg2448Asn Gly Thr Met Arg Ile Val Gly Pro Arg Thr Cys Arg Asn Met Trp805 810 815agt ggg acc ttc ccc att aat gcc tac acc acg ggc ccc tgt acc ccc2496Ser Gly Thr Phe Pro Ile Asn Ala Tyr Thr Thr Gly Pro Cys Thr Pro820 825 830ctt cct gcg ccg aac tac acg ttc gcg cta tgg agg gtg tct gca gag2544Leu Pro Ala Pro Asn Tyr Thr Phe Ala Leu Trp Arg Val Ser Ala Glu835 840 845gaa tac gtg gag ata agg cag gtg ggg gac ttc cac tac gtg acg ggt2592Glu Tyr Val Glu Ile Arg Gln Val Gly Asp Phe His Tyr Val Thr Gly850 855 860atg act act gac aat ctt aaa tgc ccg tgc cag gtc cca tcg ccc gaa2640Met Thr Thr Asp Asn Leu Lys Cys Pro Cys Gln Val Pro Ser Pro Glu865 870 875 880ttt ttc aca gaa ttg gac ggg gtg cgc cta cat agg ttt gcg ccc ccc2688Phe Phe Thr Glu Leu Asp Gly Val Arg Leu His Arg Phe Ala Pro Pro885 890 895tgc aag ccc ttg ctg cgg gag gag gta tca ttc aga gta gga ctc cac2736Cys Lys Pro Leu Leu Arg Glu Glu Val Ser Phe Arg Val Gly Leu His
900 905 910gaa tac ccg gta ggg tcg caa tta cct tgc gag ccc gaa ccg gac gtg2784Glu Tyr Pro Val Gly Ser Gln Leu Pro Cys Glu Pro Glu Pro Asp Val915 920 925gcc gtg ttg acg tcc atg ctc act gat ccc tcc cat ata aca gca gag2832Ala Val Leu Thr Ser Met Leu Thr Asp Pro Ser His Ile Thr Ala Glu930 935 940gcg gcc ggg cga agg ttg gcg agg gga tca ccc ccc tct gtg gcc agc2880Ala Ala Gly Arg Arg Leu Ala Arg Gly Ser Pro Pro Ser Val Ala Ser945 950 955 960tcc tcg gct agc cag cta tcc gct cca tct ctc aag gca act tgc acc2928Ser Ser Ala Ser Gln Leu Ser Ala Pro Ser Leu Lys Ala Thr Cys Thr965 970 975gct aac cat gac tcc cct gat gct gag ctc ata gag gcc aac ctc cta2976Ala Asn His Asp Ser Pro Asp Ala Glu Leu Ile Glu Ala Asn Leu Leu980 985 990tgg agg cag gag atg ggc ggc aac atc acc agg gtt gag tca gaa aac3024Trp Arg Gln Glu Met Gly Gly Asn Ile Thr Arg Val Glu Ser Glu Asn995 10001005aaa gtg gtg att ctg gac tcc ttc gat ccg ctt gtg gcg gag gag gac3072Lys Val Val Ile Leu Asp Ser Phe Asp Pro Leu Val Ala Glu Glu Asp101010151020gag cgg gag atc tcc gta ccc gca gaa atc ctg cgg aag tct cgg aga3120Glu Arg Glu Ile Ser Val Pro Ala Glu Ile Leu Arg Lys Ser Arg Arg1025 103010351040ttc gcc cag gcc ctg ccc gtt tgg gcg cgg ccg gac tat aac ccc ccg3168Phe Ala Gln Ala Leu Pro Val Trp Ala Arg Pro Asp Tyr Asn Pro Pro104510501055cta gtg gag acg tgg aaa aag ccc gac tac gaa cca cct gtg gtc cat3216Leu Val Glu Thr Trp Lys Lys Pro Asp Tyr Glu Pro Pro Val Val His106010651070ggc tgc ccg ctt cca cct cca aag tcc cct cct gtg cct ccg cct cgg3264Gly Cys Pro Leu Pro Pro Pro Lys Ser Pro Pro Val Pro Pro Pro Arg
107510801085aag aag cgg acg gtg gtc ctc act gaa tca acc cta tct act gcc ttg3312Lys Lys Arg Thr Val Val Leu Thr Glu Ser Thr Leu Ser Thr Ala Leu109010951100gcc gag ctc gcc acc aga agc ttt ggc agc tcc tca act tcc ggc att3360Ala Glu Leu Ala Thr Arg Ser Phe Gly Ser Ser Ser Thr Ser Gly Ile1105 111011151120acg ggc gac aat acg aca aca tcc tct gag ccc gcc cct tct ggc tgc3408Thr Gly Asp Asn Thr Thr Thr Ser Ser Glu Pro Ala Pro Ser Gly Cys112511301135ccc ccc gac tcc gac gct gag tcc tat tcc tcc atg ccc ccc ctg gag3456Pro Pro Asp Ser Asp Ala Glu Ser Tyr Ser Ser Met Pro Pro Leu Glu114011451150ggg gag cct ggg gat ccg gat ctt agc gac ggg tca tgg tca acg gtc3504Gly Glu Pro Gly Asp Pro Asp Leu Ser Asp Gly Ser Trp Ser Thr Val115511601165agt agt gag gcc aac gcg gag gat gtc gtg tgc tgc tca atg tct tac3552Ser Ser Glu Ala Asn Ala Glu Asp Val Val Cys Cys Ser Met Ser Tyr117011751180tct tgg aca ggc gca ctc gtc acc ccg tgc gcc gcg gaa gaa cag aaa3600Ser Trp Thr Gly Ala Leu Val Thr Pro Cys Ala Ala Glu Glu Gln Lys1185 119011951200ctg ccc atc aat gca cta agc aac tcg ttg cta cgt cac cac aat ttg3648Leu Pro Ile Asn Ala Leu Ser Asn Ser Leu Leu Arg His His Asn Leu120512101215gtg tat tcc acc acc tca cgc agt gct tgc caa agg cag aag aaa gtc3696Val Tyr Ser Thr Thr Ser Arg Ser Ala Cys Gln Arg Gln Lys Lys Val122012251230aca ttt gac aga ctg caa gtt ctg gac agc cat tac cag gac gta ctc3744Thr Phe Asp Arg Leu Gln Val Leu Asp Ser His Tyr Gln Asp Val Leu123512401245aag gag gtt aaa gca gcg gcg tca aaa gtg aag gct aac ttg cta tcc3792Lys Glu Val Lys Ala Ala Ala Ser Lys Val Lys Ala Asn Leu Leu Ser
125012551260gta gag gaa gct tgc agc ctg acg ccc cca cac tca gcc aaa tcc aag3840Val Glu Glu Ala Cys Ser Leu Thr Pro Pro His Ser Ala Lys Ser Lys1265 127012751280ttt ggt tat ggg gca aaa gac gtc cgt tgc cat gcc aga aag gcc gta3888Phe Gly Tyr Gly Ala Lys Asp Val Arg Cys His Ala Arg Lys Ala Val128512901295acc cac atc aac tcc gtg tgg aaa gac ctt ctg gaa gac aat gta aca3936Thr His Ile Asn Ser Val Trp Lys Asp Leu Leu Glu Asp Asn Val Thr130013051310cca ata gac act acc atc atg gct aag aac gag gtt ttc tgc gtt cag3984Pro Ile Asp Thr Thr Ile Met Ala Lys Asn Glu Val Phe Cys Val Gln131513201325cct gag aag ggg ggt cgt aag cca gct cgt ctc atc gtg ttc ccc gat4032Pro Glu Lys Gly Gly Arg Lys Pro Ala Arg Leu Ile Val Phe Pro Asp133013351340ctg ggc gtg cgc gtg tgc gaa aag atg gct ttg tac gac gtg gtt aca4080Leu Gly Val Arg Val Cys Glu Lys Met Ala Leu Tyr Asp Val Val Thr1345 135013551360aag ctc ccc ttg gcc gtg atg gga agc tcc tac gga ttc caa tac tca4128Lys Leu Pro Leu Ala Val Met Gly Ser Ser Tyr Gly Phe Gln Tyr Ser136513701375cca gga cag cgg gtt gaa ttc ctc gtg caa gcg tgg aag tcc aag aaa4176Pro Gly Gln Arg Val Glu Phe Leu Val Gln Ala Trp Lys Ser Lys Lys138013851390acc cca atg ggg ttc tcg tat gat acc cgc tgc ttt gac tcc aca gtc4224Thr Pro Met Gly Phe Ser Tyr Asp Thr Arg Cys Phe Asp Ser Thr Val139514001405act gag agc gac atc cgt acg gag gag gca atc tac caa tgt tgt gac4272Thr Glu Ser Asp Ile Arg Thr Glu Glu Ala Ile Tyr Gln Cys Cys Asp141014151420ctc gac ccc caa gcc cgc gtg gcc atc aag tcc ctc acc gag agg ctt4320Leu Asp Pro Gln Ala Arg Val Ala Ile Lys Ser Leu Thr Glu Arg Leu
1425 143014351440tat gtt ggg ggc cct ctt acc aat tca agg ggg gag aac tgc ggc tat4368Tyr Val Gly Gly Pro Leu Thr Asn Ser Arg Gly Glu Asn Cys Gly Tyr144514501455cgc agg tgc cgc gcg agc ggc gta ctg aca act agc tgt ggt aac acc4416Arg Arg Cys Arg Ala Ser Gly Val Leu Thr Thr Ser Cys Gly Asn Thr146014651470ctc act tgc tac atc aag gcc cgg gca gcc tgt cga gcc gca ggg ctc4464Leu Thr Cys Tyr Ile Lys Ala Arg Ala Ala Cys Arg Ala Ala Gly Leu147514801485cag gac tgc acc atg ctc gtg tgt ggc gac gac tta gtc gtt atc tgt4512Gln Asp Cys Thr Met Leu Val Cys Gly Asp Asp Leu Val Val Ile Cys149014951500gaa agc gcg ggg gtc cag gag gac gcg gcg agc ctg aga gcc ttc acg4560Glu Ser Ala Gly Val Gln Glu Asp Ala Ala Ser Leu Arg Ala Phe Thr1505 151015151520gag gct atg acc agg tac tcc gcc ccc cct ggg gac ccc cca caa cca4608Glu Ala Met Thr Arg Tyr Ser Ala Pro Pro Gly Asp Pro Pro Gln Pro152515301535gaa tac gac ttg gag ctc ata aca tca tgc tcc tcc aac gtg tca gtc4656Glu Tyr Asp Leu Glu Leu Ile Thr Ser Cys Ser Ser Asn Val Ser Val154015451550gcc cac gac ggc gct gga aag agg gtc tac tac ctc acc cgt gac cct4704Ala His Asp Gly Ala Gly Lys Arg Val Tyr Tyr Leu Thr Arg Asp Pro155515601565aca acc ccc ctc gcg aga gct gcg tgg gag aca gca aga cac act cca4752Thr Thr Pro Leu Ala Arg Ala Ala Trp Glu Thr Ala Arg His Thr Pro157015751580gtc aat tcc tgg cta ggc aac ata atc atg ttt gcc ccc aca ctg tgg4800Val Asn Ser Trp Leu Gly Asn Ile Ile Met Phe Ala Pro Thr Leu Trp1585 159015951600gcg agg atg ata ctg atg acc cat ttc ttt agc gtc ctt ata gcc agg4848Ala Arg Met Ile Leu Met Thr His Phe Phe Ser Val Leu Ile Ala Arg
160516101615gac cag ctt gaa cag gcc ctc gat tgc gag atc tac ggg gcc tgc tac4896Asp Gln Leu Glu Gln Ala Leu Asp Cys Glu Ile Tyr Gly Ala Cys Tyr162016251630tcc ata gaa cca ctg gat cta cct cca atc att caa aga ctc cat ggc4944Ser Ile Glu Pro Leu Asp Leu Pro Pro Ile Ile Gln Arg Leu His Gly163516401645ctc agc gca ttt tca ctc cac agt tac tct cca ggt gaa atc aat agg4992Leu Ser Ala Phe Ser Leu His Ser Tyr Ser Pro Gly Glu Ile Asn Arg165016551660gtg gcc gca tgc ctc aga aaa ctt ggg gta ccg ccc ttg cga gct tgg5040Val Ala Ala Cys Leu Arg Lys Leu Gly Val Pro Pro Leu Arg Ala Trp1665 167016751680aga cac cgg gcc cgg agc gtc cgc gct agg ctt ctg gcc aga gga ggc5088Arg His Arg Ala Arg Ser Val Arg Ala Arg Leu Leu Ala Arg Gly Gly168516901695agg gct gcc ata tgt ggc aag tac ctc ttc aac tgg gca gta aga aca5136Arg Ala Ala Ile Cys Gly Lys Tyr Leu Phe Asn Trp Ala Val Arg Thr170017051710aag ctc aaa ctc act cca ata gcg gcc gct ggc cag ctg gac ttg tcc5184Lys Leu Lys Leu Thr Pro Ile Ala Ala Ala Gly Gln Leu Asp Leu Ser171517201725ggc tgg ttc acg gct ggc tac agc ggg gga gac att tat cac agc gtg5232Gly Trp Phe Thr Ala Gly Tyr Ser Gly Gly Asp Ile Tyr His Ser Val173017351740tct cat gcc cgg ccc cgc tgg atc tgg ttt tgc cta ctc ctg ctt gct5280Ser His Ala Arg Pro Arg Trp Ile Trp Phe Cys Leu Leu Leu Leu Ala1745 175017551760gca ggg gta ggc atc tac ctc ctc ccc aac cga atg agc acg aat cct5328Ala Gly Val Gly Ile Tyr Leu Leu Pro Asn Arg Met Ser Thr Asn Pro176517701775aaa cct caa aga aag acc aaa cgt aac acc aac cgg cgg ccg cag gac5376Lys Pro Gln Arg Lys Thr Lys Arg Asn Thr Asn Arg Arg Pro Gln Asp
178017851790gtc aag ttc ccg ggt ggc ggt cag atc gtt ggt gga gtt tac ttg ttg 5424Val Lys Phe Pro Gly Gly Gly Gln Ile Val Gly Gly Val Tyr Leu Leu179518001805ccg cgc agg ggc cct aga ttg ggt gtg cgc gcg acg aga aag act tcc 5472Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Ala Thr Arg Lys Thr Ser181018151820gag cgg tcg caa cct cga ggt aga cgt cag cct atc ccc aag gct cgt 5520Glu Arg Ser Gln Pro Arg Gly Arg Arg Gln Pro Ile Pro Lys Ala Arg1825 183018351840cgg ccc gag ggc agg acc tgg gct cag ccc ggg tac cct tgg ccc ctc 5568Arg Pro Glu Gly Arg Thr Trp Ala Gln Pro Gly Tyr Pro Trp Pro Leu184518501855tat ggc aat gag ggc tgc ggg tgg gcg gga tgg ctc ctg tct ccc cgt 5616Tyr Gly Asn Glu Gly Cys Gly Trp Ala Gly Trp Leu Leu Ser Pro Arg186018651870ggc tct cgg cct agc tgg ggc ccc aca gac ccc cgg cgt agg tcg cgc 5664Gly Ser Arg Pro Ser Trp Gly Pro Thr Asp Pro Arg Arg Arg Ser Arg187518801885aat ttg ggt aag 5676Ash Leu Gly Lys1890<210>6<211>1892<212>PRT<213>人工的<220>
<223>代表性的修饰的融合蛋白的氨基酸序列,其NS3蛋白酶结构域被从N-末端删除,且在C-末端含有核心多肽的氨基酸1-121<400>6Met Ala Ala Tyr Ala Ala Gln Gly Tyr Lys Val Leu Val Leu Asn Pro1 5 10 15
Ser Val Ala Ala Thr Leu Gly Phe Gly Ala Tyr Met Ser Lys Ala His20 25 30Gly Ile Asp Pro Asn Ile Arg Thr Gly Val Arg Thr Ile Thr Thr Gly35 40 45Ser Pro Ile Thr Tyr Ser Thr Tyr Gly Lys Phe Leu Ala Asp Gly Gly50 55 60Cys Ser Gly Gly Ala Tyr Asp Ile Ile Ile Cys Asp Glu Cys His Ser65 70 75 80Thr Asp Ala Thr Ser Ile Leu Gly Ile Gly Thr Val Leu Asp Gln Ala85 90 95Glu Thr Ala Gly Ala Arg Leu Val Val Leu Ala Thr Ala Thr Pro Pro100 105 110Gly Ser Val Thr Val Pro His Pro Asn Ile Glu Glu Val Ala Leu Ser115 120 125Thr Thr Gly Glu Ile Pro Phe Tyr Gly Lys Ala Ile Pro Leu Glu Val130 135 140Ile Lys Gly Gly Arg His Leu Ile Phe Cys His Ser Lys Lys Lys Cys145 150 155 160Asp Glu Leu Ala Ala Lys Leu Val Ala Leu Gly Ile Asn Ala Val Ala165 170 175Tyr Tyr Arg Gly Leu Asp Val Ser Val Ile Pro Thr Ser Gly Asp Val180 185 190Val Val Val Ala Thr Asp Ala Leu Met Thr Gly Tyr Thr Gly Asp Phe195 200 205Asp Ser Val Ile Asp Cys Asn Thr Cys Val Thr Gln Thr Val Asp Phe210 215 220Ser Leu Asp Pro Thr Phe Thr Ile Glu Thr Ile Thr Leu Pro Gln Asp225 230 235 240Ala Val Ser Arg Thr Gln Arg Arg Gly Arg Thr Gly Arg Gly Lys Pro
245 250 255Gly Ile Tyr Arg Phe Val Ala Pro Gly Glu Arg Pro Ser Gly Met Phe260 265 270Asp Ser Ser Val Leu Cys Glu Cys Tyr Asp Ala Gly Cys Ala Trp Tyr275 280 285Glu Leu Thr Pro Ala Glu Thr Thr Val Arg Leu Arg Ala Tyr Met Asn290 295 300Thr Pro Gly Leu Pro Val Cys Gln Asp His Leu Glu Phe Trp Glu Gly305 310 315 320Val Phe Thr Gly Leu Thr His Ile Asp Ala His Phe Leu Ser Gln Thr325 330 335Lys Gln Ser Gly Glu Asn Leu Pro Tyr Leu Val Ala Tyr Gln Ala Thr340 345 350Val Cys Ala Arg Ala Gln Ala Pro Pro Pro Ser Trp Asp Gln Met Trp355 360 365Lys Cys Leu Ile Arg Leu Lys Pro Thr Leu His Gly Pro Thr Pro Leu370 375 380Leu Tyr Arg Leu Gly Ala Val Gln Asn Glu Ile Thr Leu Thr His Pro385 390 395 400Val Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val405 410 415Thr Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala420 425 430Tyr Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Val Val Leu435 440 445Ser Gly Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr Arg Glu450 455 460Phe Asp Glu Met Glu Glu Cys Ser Gln His Leu Pro Tyr Ile Glu Gln465 470 475 480
Gly Met Met Leu Ala Glu Gln Phe Lys Gln Lys Ala Leu Gly Leu Leu485 490 495Gln Thr Ala Ser Arg Gln Ala Glu Val Ile Ala Pro Ala Val Gln Thr500 505 510Asn Trp Gln Lys Leu Glu Thr Phe Trp Ala Lys His Met Trp Asn Phe515 520 525Ile Ser Gly Ile Gln Tyr Leu Ala Gly Leu Ser Thr Leu Pro Gly Asn530 535 540Pro Ala Ile Ala Ser Leu Met Ala Phe Thr Ala Ala Val Thr Ser Pro545 550 555 560Leu Thr Thr Ser Gln Thr Leu Leu Phe Asn Ile Leu Gly Gly Trp Val565 570 575Ala Ala Gln Leu Ala Ala Pro Gly Ala Ala Thr Ala Phe Val Gly Ala580 585 590Gly Leu Ala Gly Ala Ala Ile Gly Ser Val Gly Leu Gly Lys Val Leu595 600 605Ile Asp Ile Leu Ala Gly Tyr Gly Ala Gly Val Ala Gly Ala Leu Val610 615 620Ala Phe Lys Ile Met Ser Gly Glu Val Pro Ser Thr Glu Asp Leu Val625 630 635 640Asn Leu Leu Pro Ala Ile Leu Ser Pro Gly Ala Leu Val Val Gly Val645 650 655Val Cys Ala Ala Ile Leu Arg Arg His Val Gly Pro Gly Glu Gly Ala660 665 670Val Gln Trp Met Asn Arg Leu Ile Ala Phe Ala Ser Arg Gly Asn His675 680 685Val Ser Pro Thr His Tyr Val Pro Glu Ser Asp Ala Ala Ala Arg Val690 695 700Thr Ala Ile Leu Ser Ser Leu Thr Val Thr Gln Leu Leu Arg Arg Leu705 710 715 720
His Gln Trp Ile Ser Ser Glu Cys Thr Thr Pro Cys Ser Gly Ser Trp725 730 735Leu Arg Asp Ile Trp Asp Trp Ile Cys Glu Val Leu Ser Asp Phe Lys740 745 750Thr Trp Leu Lys Ala Lys Leu Met Pro Gln Leu Pro Gly Ile Pro Phe755 760 765Val Ser Cys Gln Arg Gly Tyr Lys Gly Val Trp Arg Gly Asp Gly Ile770 775 780Met His Thr Arg Cys His Cys Gly Ala Glu Ile Thr Gly His Val Lys785 790 795 800Asn Gly Thr Met Arg Ile Val Gly Pro Arg Thr Cys Arg Asn Met Trp805 810 815Ser Gly Thr Phe Pro Ile Asn Ala Tyr Thr Thr Gly Pro Cys Thr Pro820 825 830Leu Pro Ala Pro Asn Tyr Thr Phe Ala Leu Trp Arg Val Ser Ala Glu835 840 845Glu Tyr Val Glu Ile Arg Gln Val Gly Asp Phe His Tyr Val Thr Gly850 855 860Met Thr Thr Asp Asn Leu Lys Cys Pro Cys Gln Val Pro Ser Pro Glu865 870 875 880Phe Phe Thr Glu Leu Asp Gly Val Arg Leu His Arg Phe Ala Pro Pro885 890 895Cys Lys Pro Leu Leu Arg Glu Glu Val Ser Phe Arg Val Gly Leu His900 905 910Glu Tyr Pro Val Gly Ser Gln Leu Pro Cys Glu Pro Glu Pro Asp Val915 920 925Ala Val Leu Thr Ser Met Leu Thr Asp Pro Ser His Ile Thr Ala Glu930 935 940Ala Ala Gly Arg Arg Leu Ala Arg Gly Ser Pro Pro Ser Val Ala Ser
945 950 955 960Ser Ser Ala Ser Gln Leu Ser Ala Pro Ser Leu Lys Ala Thr Cys Thr965 970 975Ala Asn His Asp Ser Pro Asp Ala Glu Leu Ile Glu Ala Asn Leu Leu980 985 990Trp Arg Gln Glu Met Gly Gly Asn Ile Thr Arg Val Glu Ser Glu Asn99510001005Lys Val Val Ile Leu Asp Ser Phe Asp Pro Leu Val Ala Glu Glu Asp101010151020Glu Arg Glu Ile Ser Val Pro Ala Glu Ile Leu Arg Lys Ser Arg Arg1025 103010351040Phe Ala Gln Ala Leu Pro Val Trp Ala Arg Pro Asp Tyr Asn Pro Pro104510501055Leu Val Glu Thr Trp Lys Lys Pro Asp Tyr Glu Pro Pro Val Val His106010651070Gly Cys Pro Leu Pro Pro Pro Lys Ser Pro Pro Val Pro Pro Pro Arg107510801085Lys Lys Arg Thr Val Val Leu Thr Glu Ser Thr Leu Ser Thr Ala Leu109010951100Ala Glu Leu Ala Thr Arg Ser Phe Gly Ser Ser Ser Thr Ser Gly Ile1105 111011151120Thr Gly Asp Asn Thr Thr Thr Ser Ser Glu Pro Ala Pro Ser Gly Cys112511301135Pro Pro Asp Ser Asp Ala Glu Ser Tyr Ser Ser Met Pro Pro Leu Glu114011451150Gly Glu Pro Gly Asp Pro Asp Leu Ser Asp Gly Ser Trp Ser Thr Val115511601165Ser Ser Glu Ala Asn Ala Glu Asp Val Val Cys Cys Ser Met Ser Tyr117011751180
Ser Trp Thr Gly Ala Leu Val Thr Pro Cys Ala Ala Glu Glu Gln Lys1185 119011951200Leu Pro Ile Asn Ala Leu Ser Asn Ser Leu Leu Arg His His Asn Leu120512101215Val Tyr Ser Thr Thr Ser Arg Ser Ala Cys Gln Arg Gln Lys Lys Val122012251230Thr Phe Asp Arg Leu Gln Val Leu Asp Ser His Tyr Gln Asp Val Leu123512401245Lys Glu Val Lys Ala Ala Ala Ser Lys Val Lys Ala Asn Leu Leu Ser125012551260Val Glu Glu Ala Cys Ser Leu Thr Pro Pro His Ser Ala Lys Ser Lys1265 127012751280Phe Gly Tyr Gly Ala Lys Asp Val Arg Cys His Ala Arg Lys Ala Val128512901295Thr His Ile Asn Ser Val Trp Lys Asp Leu Leu Glu Asp Asn Val Thr130013051310Pro Ile Asp Thr Thr Ile Met Ala Lys Asn Glu Val Phe Cys Val Gln131513201325Pro Glu Lys Gly Gly Arg Lys Pro Ala Arg Leu Ile Val Phe Pro Asp133013351340Leu Gly Val Arg Val Cys Glu Lys Met Ala Leu Tyr Asp Val Val Thr1345 135013551360Lys Leu Pro Leu Ala Val Met Gly Ser Ser Tyr Gly Phe Gln Tyr Ser136513701375Pro Gly Gln Arg Val Glu Phe Leu Val Gln Ala Trp Lys Ser Lys Lys138013851390Thr Pro Met Gly Phe Ser Tyr Asp Thr Arg Cys Phe Asp Ser Thr Val139514001405Thr Glu Ser Asp Ile Arg Thr Glu Glu Ala Ile Tyr Gln Cys Cys Asp141014151420
Leu Asp Pro Gln Ala Arg Val Ala Ile Lys Ser Leu Thr Glu Arg Leu1425 143014351440Tyr Val Gly Gly Pro Leu Thr Asn Ser Arg Gly Glu Asn Cys Gly Tyr144514501455Arg Arg Cys Arg Ala Ser Gly Val Leu Thr Thr Ser Cys Gly Asn Thr146014651470Leu Thr Cys Tyr Ile Lys Ala Arg Ala Ala Cys Arg Ala Ala Gly Leu147514801485Gln Asp Cys Thr Met Leu Val Cys Gly Asp Asp Leu Val Val Ile Cys149014951500Glu Ser Ala Gly Val Gln Glu Asp Ala Ala Ser Leu Arg Ala Phe Thr1505 151015151520Glu Ala Met Thr Arg Tyr Ser Ala Pro Pro Gly Asp Pro Pro Gln Pro152515301535Glu Tyr Asp Leu Glu Leu Ile Thr Ser Cys Ser Ser Asn Val Ser Val154015451550Ala His Asp Gly Ala Gly Lys Arg Val Tyr Tyr Leu Thr Arg Asp Pro155515601565Thr Thr Pro Leu Ala Arg Ala Ala Trp Glu Thr Ala Arg His Thr Pro157015751580Val Asn Ser Trp Leu Gly Asn Ile Ile Met Phe Ala Pro Thr Leu Trp1585 159015951600Ala Arg Met Ile Leu Met Thr His Phe Phe Ser Val Leu Ile Ala Arg160516101615Asp Gln Leu Glu Gln Ala Leu Asp Cys Glu Ile Tyr Gly Ala Cys Tyr162016251630Ser Ile Glu Pro Leu Asp Leu Pro Pro Ile Ile Gln Arg Leu His Gly163516401645Leu Ser Ala Phe Ser Leu His Ser Tyr Ser Pro Gly Glu Ile Asn Arg
165016551660Val Ala Ala Cys Leu Arg Lys Leu Gly Val Pro Pro Leu Arg Ala Trp1665 167016751680Arg His Arg Ala Arg Ser Val Arg Ala Arg Leu Leu Ala Arg Gly Gly168516901695Arg Ala Ala Ile Cys Gly Lys Tyr Leu Phe Asn Trp Ala Val Arg Thr170017051710Lys Leu Lys Leu Thr Pro Ile Ala Ala Ala Gly Gln Leu Asp Leu Ser171517201725Gly Trp Phe Thr Ala Gly Tyr Ser Gly Gly Asp Ile Tyr His Ser Val173017351740Ser His Ala Arg Pro Arg Trp Ile Trp Phe Cys Leu Leu Leu Leu Ala1745 175017551760Ala Gly Val Gly Ile Tyr Leu Leu Pro Asn Arg Met Ser Thr Asn Pro176517701775Lys Pro Gln Arg Lys Thr Lys Arg Asn Thr Asn Arg Arg Pro Gln Asp178017851790Val Lys Phe Pro Gly Gly Gly Gln Ile Val Gly Gly Val Tyr Leu Leu179518001805Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Ala Thr Arg Lys Thr Ser181018151820Glu Arg Ser Gln Pro Arg Gly Arg Arg Gln Pro Ile Pro Lys Ala Arg1825 183018351840Arg Pro Glu Gly Arg Thr Trp Ala Gln Pro Gly Tyr Pro Trp Pro Leu184518501855Tyr Gly Asn Glu Gly Cys Gly Trp Ala Gly Trp Leu Leu Ser Pro Arg186018651870Gly Ser Arg Pro Ser Trp Gly Pro Thr Asp Pro Arg Arg Arg Ser Arg187518801885
Asn Leu Gly Lys1890<210>7<211>21<212>PRT<213>人工的<220>
<223>E2表位共有序列<400>7Gly Ser Ala Ala Arg Thr Thr Ser Gly Phe Val Ser Leu Phe Ala Pro1 5 10 15Gly Ala Lys Gln Asn20<210>8<211>23<212>PRT<213>人工的<220>
<223>NS4A肽<400>8Lys Lys Gly Ser Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Lys1 5 10 15Pro Ala Ile Ile Pro Lys Lys20
权利要求
1.一种免疫原性融合蛋白,其特征在于,所述融合蛋白包括(a)修饰的NS3多肽,它含有至少1个对HCV NS3区的氨基酸取代,从而抑制蛋白酶活性,和(b)至少一种多肽,该多肽来自除了NS3区的HCV多蛋白区。
2.如权利要求1所述的融合蛋白,其特征在于,所述修饰包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白。
3.如权利要求1或2所述的融合蛋白,其特征在于,所述蛋白包括修饰的NS3多肽、NS4多肽、NS5a多肽和任选的核心多肽。
4.如权利要求3所述的融合蛋白,其特征在于,所述蛋白进一步包括NS5b多肽和任选的核心多肽。
5.如权利要求3所述的融合蛋白,其特征在于,所述蛋白进一步包括E2多肽、p7多肽、NS2多肽和任选的核心多肽。
6.如权利要求3所述的融合蛋白,其特征在于,所述蛋白进一步包括E1多肽、E2多肽、p7多肽、NS2多肽和任选的核心多肽。
7.如权利要求3所述的融合蛋白,其特征在于,所述蛋白进一步包括E2多肽和任选的核心多肽。
8.如权利要求3所述的融合蛋白,其特征在于,所述蛋白进一步包括E1多肽、E2多肽和任选的核心多肽。
9.如权利要求1所述的融合蛋白,其特征在于,所述蛋白包括E2多肽、修饰的NS3多肽和任选的核心多肽。
10.如权利要求1所述的融合蛋白,其特征在于,所述蛋白包括E1多肽、E2多肽、修饰的NS3多肽和任选的核心多肽。
11.如权利要求1-10中任一项所述的融合蛋白,其特征在于,(a)和(b)的多肽来自相同HCV分离物。
12.如权利要求1-10中任一项所述的融合蛋白,其特征在于,至少一种融合中存在的多肽来自与修饰的NS3多肽不同的分离物。
13.一种免疫原性融合蛋白,其特征在于,所述融合蛋白的组成从氨基末端到羧基末端方向主要是(a)修饰的NS3多肽、NS4多肽和NS5a多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(b)修饰的NS3多肽、NS4多肽、NS5a多肽和NS5b多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(c)E2多肽、p7多肽、NS2多肽、修饰的NS3多肽、NS4多肽和NS5a多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(d)E1多肽、E2多肽、p7多肽、NS2多肽、修饰的NS3多肽、NS4多肽和NS5a多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(e)E2多肽、p7多肽、NS2多肽、修饰的NS3多肽、NS4多肽、NS5a多肽和NS5b多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(f)E1多肽、E2多肽、p7多肽、NS2多肽、修饰的NS3多肽、NS4多肽、NS5a多肽和NS5b多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(g)E2多肽和修饰的NS3多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(h)E1多肽、E2多肽和修饰的NS3多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(i)E2多肽、p7多肽、NS2多肽和修饰的NS3多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(j)E1多肽、E2多肽、p7多肽、NS2多肽和修饰的NS3多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性。
14.一种免疫原性融合蛋白,其特征在于,所述融合蛋白的组成从氨基末端到羧基末端方向主要是(a)修饰的NS3多肽、NS4多肽、NS5a多肽和核心多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(b)修饰的NS3多肽、NS4多肽、NS5a多肽、NS5b多肽和核心多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(c)E2多肽、p7多肽、NS2多肽、修饰的NS3多肽、NS4多肽、NS5a多肽和核心多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(d)E1多肽、E2多肽、p7多肽、NS2多肽、修饰的NS3多肽、NS4多肽、NS5a多肽和核心多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(e)E2多肽、p7多肽、NS2多肽、修饰的NS3多肽、NS4多肽、NS5a多肽、NS5b多肽和核心多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(f)E1多肽、E2多肽、p7多肽、NS2多肽、修饰的NS3多肽、NS4多肽、NS5a多肽、NS5b多肽和核心多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(g)E2多肽、修饰的NS3多肽和核心多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(h)E1多肽、E2多肽、修饰的NS3多肽和核心多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(i)E2多肽、p7多肽、NS2多肽、修饰的NS3多肽和核心多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性;(j)E1多肽、E2多肽、p7多肽、NS2多肽、修饰的NS3多肽和核心多肽,NS3多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,从而抑制蛋白酶活性。
15.一种修饰的NS3多肽,其特征在于,所述多肽包括对应于His-1083、Asp-1105和/或Ser-1165的氨基酸取代,编号是相对于全长HCV-1多蛋白,因而当修饰的NS3多肽存在于HCV融合蛋白中时,蛋白酶活性被抑制。
16.一种组合物,其特征在于,所述组合物包括权利要求1-14中任一项所述的免疫原性融合蛋白或权利要求15所述的修饰的NS3多肽,与药学上可接受的赋形剂联合。
17.一种在脊椎动物受试者中刺激细胞免疫应答的方法,其特征在于,所述方法包括施用治疗有效量的权利要求16所述的组合物。
18.如权利要求15所述的组合物在用于在脊椎动物受试者中刺激细胞免疫应答的方法中的应用。
19.如权利要求1-14中任一项所述的融合蛋白或权利要求15所述的修饰的NS3多肽在制造用于在脊椎动物受试者中刺激的细胞免疫应答的药物中的应用。
20.一种生产组合物的方法,其特征在于,所述方法包括将权利要求1-14中任一项所述的免疫原性融合蛋白或权利要求15所述的修饰的NS3多肽与药学上可接受的赋形剂联合。
21.一种多核苷酸,其特征在于,所述多核苷酸包括编码权利要求1-14中任一项所述的融合蛋白或权利要求15所述的修饰的NS3多肽的编码序列。
22.一种重组载体,其特征在于,所述载体包括(a)权利要求21所述的多核苷酸;和(b)至少1个操作性连接于所述多核苷酸的控制元件,其中所述编码序列能在宿主细胞中转录和翻译。
23.一种宿主细胞,其特征在于,所述细胞包括权利要求22所述的重组载体。
24.一种生成免疫原性融合蛋白或修饰的多肽的方法,其特征在于,所述方法包括在生成所述蛋白的条件下培养权利要求23所述的宿主细胞群。
全文摘要
本发明提供了HCV融合蛋白,它包含突变的NS3蛋白酶结构域,与至少一种来自HCV多蛋白另一区域的HCV抗原表位融合。融合能用于刺激对HCV的细胞免疫应答方法,如激活丙肝病毒(HCV)-特异性T细胞,包括CD4+和CD8+T细胞。此方法可用于模拟系统以发展HCV-特异性免疫原性组合物,以及免疫哺乳动物抗HCV。
文档编号A61K38/00GK1678630SQ03820719
公开日2005年10月5日 申请日期2003年7月2日 优先权日2002年7月2日
发明者M·霍格顿 申请人:希龙公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1