鉴定和开发治疗剂的方法

文档序号:411810阅读:299来源:国知局
专利名称:鉴定和开发治疗剂的方法
技术领域
本发明总体上涉及鉴定和确定生物活性氨基酸序列的领域。具体地,本发明提供了确定宿主基因中的变异对具有特定氨基酸变体的微生物的选择的影响的方法,该方法的目的是为了设计治疗药物或疫苗或使这种治疗个体化(individualisation)。本发明也提供了鉴定HLA等位基因特异性微生物序列多态的方法,该多态由HLA限定的抗原特异性细胞免疫反应产生。它也提供了诊断和治疗方法,该方法可用于测量或治疗微生物感染或预防微生物感染。
背景技术
动物对病理微生物或肿瘤的反应由大量生物学反应和相互作用组成。例如,对感染病毒的细胞的反应主要由称为CD8+T-细胞或细胞毒性T淋巴细胞(CTL)的效应T细胞亚群介导。尽管这些细胞可直接杀死感染病毒的细胞,但它们通常需要由称为CD4+辅助T-细胞的其他T淋巴细胞亚群产生的可溶性产物或细胞因子的帮助。
参与病理微生物识别以及起始和活化对抗性免疫反应的主要CTL受体是仅存在于T-细胞表面的称为T-细胞受体分子的抗原特异性受体。该受体特定地与存在于主要组织相容性复合体(MHC)或人白细胞抗原(HLA)分子中的加工过的肽抗原反应。抗原性肽和HLA分子之间的相互作用在起始和调节免疫反应中是基本的要素。
HLA分子是在体内各种细胞表面表达的多态性受体。这些受体的功能是结合并展示某些细胞表面的不同肽片段,从而抗原可由T淋巴细胞识别。这使得免疫系统可监控体内是否存在源自感染因子或异常癌性组织的肽。这种肽当与HLA受体复合时将触发T-细胞对该“外源”因子起反应。
肽-HLA复合物的形成和随后的T-细胞识别对肽序列是高度敏感的。因而,向活化型野生肽中引入突变可消除T-细胞活化。那些具有这种突变的生物能避开宿主的免疫反应并因此具有选择优势。
人们相信HLA的多样性或多态是由协同进化的感染性疾病威胁所驱动的。同时,许多感染性因子也通过协同进化来逃避宿主HLA-特异性的选择压力。这一进化和协同进化的过程在某些病毒中是特别明显的,如人免疫缺陷病毒(HIV)、疱疹病毒和肝炎病毒如丙型肝炎病毒(HCV)。
例如,对与CTL反应减少或丧失相关的HIV-1变体的选择已在具有急性或晚期HIV-1感染的各种个体中证明。然而,其他HIV-1感染的个体缺乏显而易见的病毒逃避。迄今为止,CTL逃避型突变的频率以及其对全球HIV进化的重要性以及HLA-多样的人类群体中的致病性都尚未完全阐明。此外,对HIV-1序列的免疫作用还有许多未得到充分表征。
由于前述原因,目前的DNA或蛋白质分析方法不能解释许多竞争性压力,该压力驱动动物对病原微生物和(更特定的)由该微生物产生的蛋白质的反应。
本发明致力于提供同时确定和分析竞争性选择力的方法,该选择力在来自病原生物蛋白质的单个氨基酸水平上起作用。利用这种方法,可以分析由宿主的单个多态基因对特定微生物蛋白质序列中氨基酸施加的选择压力。也可以检查多个标记或一个标记和其他外在变量对特定蛋白质序列中氨基酸变异的影响。当患者由特定微生物感染时或当他们可能处于易于由特定微生物感染的高危组中时,收集这些数据可提供监控、选择和使患者的治疗和疫苗接种个体化的方法。
发明概述本发明提供了适合于鉴定和确定生物活性氨基酸序列的分析方法。它提供了能够确定宿主内在多肽或多核苷酸序列中的变异对微生物变体中特定氨基酸序列的选择的影响的方法。它也提供了用于分析宿主内在多肽中的变异联合一个或多个其他变量如治疗剂(如药物或疫苗)对微生物变体中特定氨基酸序列的选择的影响的方法。它提供了利用这种信息使患者的治疗个体化的方法以及确定患者对特定药物治疗的易感性的方法,并可以对患者个体定制药物治疗法。在本发明一个高度优选的形式中,提供了鉴定HLA-等位基因特异性微生物序列多态的方法,该序列多态由HLA限定的抗原特异性细胞免疫反应产生。
为了便于描述本发明,选择HIV来阐明如何应用在此处描述的方法和如何应用从该方法揭示的数据以制备适合于治疗HIV感染的患者和有HIV感染危险的患者的治疗剂。然而应该理解的是这里描述的方法可应用于大量的分析中,其并不仅仅包括疱疹病毒和肝炎(如HCV)病毒感染。
根据一个实施方案,本发明提供了确定宿主基因中的变异对具有蛋白质取代的微生物的选择的影响的方法,该方法包含以下步骤(a)选择被特定微生物感染的患者或动物群体,并根据至少一个选定的参与宿主对微生物反应的内在多肽标记对该群体中的所有个体进行分类;(b)在该群体中于步骤(a)中确定的每一个类型的足够数目个体中鉴定和确定微生物中部分多核苷酸序列或多肽序列;(c)在该群体中确定步骤(b)分析的序列中每一个残基位置上的一致(即最大频率的)氨基酸;(d)对在步骤(a)和步骤(b)中获得的数据进行比较以确定步骤(a)中的宿主多态序列如何在步骤(b)中确定的序列中的第一个目标氨基酸残基上增加或降低微生物多态的概率;(e)对步骤(b)中鉴定的每一个氨基酸重复步骤(d)并比较获得的数据。
根据第二个实施方案,本发明涉及一种方法,该方法鉴定宿主多态标记序列的变异与第二个变量(如治疗药物或疫苗)之间的相互作用以及它们对具有特定氨基酸变体的微生物的选择的影响,该方法包含以下步骤a.选择被微生物感染的患者或动物群体,其中的一些接受了第二个变量作为对所述微生物的部分治疗,并根据至少一个选定的参与宿主对微生物的反应的宿主内在多态标记序列对所述群体的个体进行分类;b.在接受第二个变量处理之前和之中,在群体每一个类型的足够数目个体中鉴定和确定微生物中的部分或全长多核苷酸和/或多肽序列,其中该多核苷酸和/或多肽序列是第二个变量的潜在或已知的靶标,另外,以相似的时间间隔在相似的但未经治疗的个体中也进行了上述操作;c.确定在步骤(b)中确定的时间点之间在步骤(b)中检查的序列中每一个残基上是否发生了变化(“突变”);d.对在步骤(a)中获得的数据、治疗和未治疗的序列中向第二个变量暴露与否的作用以及步骤(c)中获得的数据进行比较,以确定步骤(a)中的多态序列以及用第二个变量的处理如何影响步骤(c)中第一个目标氨基酸残基上突变的概率;e.对步骤(c)中确定的序列中每一个氨基酸重复步骤(d)。
根据本发明进一步的实施方案,提供了设计能够在患者中诱导特定的T-细胞反应的治疗剂的方法,该方法包含如上所述的步骤,接着分析该数据以鉴定病毒群体中因为该群体感染而发生的多态,其中该多态是HLA相关的。
根据本发明进一步的实施方案,提供了检验特定治疗剂在特定群体中的可能功效的方法。
根据本发明进一步的实施方案,提供了鉴定T细胞表位的方法,该方法包含如上所述的步骤,接着分析该数据以鉴定病毒群体中因为该群体感染而发生的多态频率,其中该多态是HLA相关的。
根据本发明进一步的实施方案,提供了对感染性疾病进行亚分类、预测和监控的方法。
根据本发明进一步的实施方案,提供了设计疫苗以防止或延迟在用对微生物特异性的特定药物治疗的患者中出现药物抗性的方法,其中该药物在核苷酸或氨基酸水平影响微生物的复制,该方法包含以下步骤进行如上所述的步骤,然后分析数据以鉴定已用抗反转录病毒药物治疗的感染个体中的病毒群体中发生的多态频率,其中该多态频率是在微生物中药物具有活性的核苷酸或氨基酸序列区城中确定的,然后设计一种或多种治疗剂,该治疗剂促进针对含有展示一种或多种鉴定的多态的病毒群体的细胞的T-细胞反应。
根据本发明的另一个方面,提供了制备根据上述方法设计的氨基酸序列或能够在患者中表达该序列的载体构建体的方法,该氨基酸序列或载体构建体能够在被微生物感染的或有该微生物感染危险的患者中诱导特异性的T-细胞反应。
本发明的另一个方面是制备组合物的方法,该方法包含制备根据上述方法设计的氨基酸序列或能够在患者中表达该序列的载体构建体,该氨基酸序列或载体构建体能够在被微生物感染的或有该微生物感染危险的患者中诱导特异性的T-细胞反应,然后将治疗剂和药物可接受的赋形剂进行组合。
本发明也提供了用于在哺乳动物中诱导对HIV的T-细胞反应的组合物。该组合物包含根据上述方法设计的氨基酸序列或能够在患者中表达该序列的载体构建体,该氨基酸序列或载体构建体能够在被微生物感染的或有该微生物感染危险的患者中诱导特异性的T-细胞反应。当该组合物用于治疗患者时,它也可包含药物可接受的赋形剂。该免疫原性组合物可进一步包含载体如生理盐水和佐剂,该佐剂如不完全弗氏佐剂、明矾或montanide。氨基酸序列可进一步如在此处所描述的进行修饰以增强其在感染的患者中的寿命或其他想要的特征。
在其他实施方案中,本发明包括在哺乳动物中诱导对抗原的T淋巴细胞反应的方法。该方法包含向哺乳动物给予根据上述方法设计的氨基酸序列或能够在患者中表达该序列的载体构建体,该氨基酸序列或载体构建体能够在被微生物感染的或有该微生物感染危险的患者中诱导特异性的T-细胞反应。
在另外的实施方案中,本发明提供了治疗或预防疾病的方法,其中该疾病对借助T细胞反应的治疗是敏感的,所述方法通过给予根据上述方法设计的氨基酸序列或能够在患者中表达该序列的载体构建体来实现,该氨基酸序列或载体构建体能够在被微生物感染的或有该微生物感染危险的患者中诱导特异性的T-细胞反应。
本发明的另一个方面是通过给予组合物而在动物中引起细胞免疫反应的方法,该组合物包含药物可接受的赋形剂和经过改变而含有细胞免疫反应表位的氨基酸序列以及佐剂,该表位包含至少与患者中HLA等位基因类型相关的病毒多态。该细胞反应可为CD8+T细胞反应、CD4+T细胞反应、或CD8+T细胞和CD4+T细胞两者的反应。
在一个可选择的形式中,本发明提供了通过给予组合物而在动物中引起细胞免疫反应的方法,该组合物包含药物可接受的赋形剂和经过改变而含有至少一个对于特定HLA类型高度保守的细胞免疫反应相关的表位的氨基酸序列,或者包含能够在动物中表达该氨基酸序列的载体构建体。待引起免疫反应的动物可为哺乳动物。在优选的实施方案中,该哺乳动物可为人,该人可为HIV阳性或HIV阴性的。
本发明的另一个方面是在暴露于感染性HIV中的动物中延迟HIV发病的方法,这是通过给动物接种药物可接受的赋形剂和根据上述方法设计的氨基酸序列或能够在患者中表达该序列的载体构建体来实现的,该氨基酸序列或载体构建体能够在被微生物感染的或有该微生物感染危险的患者中诱导特异性的T-细胞反应。
本发明也提供了能够在被HIV感染的或有HIV感染危险的患者中诱导HIV特异性T-细胞反应的HIV氨基酸序列。该T-细胞反应诱导性氨基酸序列一般为7-15个残基,且更通常为9-11个残基。
本发明的这些和其他方面将参照下面的附图和发明详述更充分地进行描述。附图和描述是用来辅助本发明的描述的,但不应该认为是限制本发明的方面的。
附图简述附图描述如下

图1HIV-1 RT的氨基酸位置95-202多态率的图和已知的氨基酸功能特征。
HIV-1 RT的氨基酸位置95-202的图显示在抗反转录病毒治疗前HIV-1 RT序列(n=185)中每一个位置上的群体一致氨基酸发生改变的患者百分比。保守的(灰色条)或非保守的(实心黑色条)氨基酸取代均进行了显示。残基的已知功能特征在靠近残基处标记为稳定性(S)、有功能的(F)、催化的(C)和外部的(E)。
图2HIV-1 RT的氨基酸位置20-227多态率的图和与HLA-A和HLA-B等位基因的关联性(association)。
已知的HLA-A和HLA-B限定的CTL表位(B.T.M.Korber等人,HIV Molecular Immunclogy Database 1999(Theoretical Biology andBiophysics,New Mexico,1999))在A框中标记为灰色线。D框显示在大多数最近的HIV-1 RT序列(n=473)中每一个位置上具有与群体一致序列不同的氨基酸的患者的百分比。显著与多态关联的HLA等位基因以及关联的比值比(odds ratio)(OR)在B框中多态残基上面显示。限定于相同的宽(broad)HLA等位基因的29个已知的CTL表位中的15个HLA-特异性多态以灰色文本显示,而侧面残基的5个以黑色文本显示。黑色文本中簇聚的关联性可位于新的或推定的CTL表位中。加框的关联性是那些在对如文中所述鉴定的残基的总数目进行校正后仍然是显著的关联性。HLA-B*5101是HLA-B5的亚型,HLA-B44是HLA-B12的亚型,而HLA-A24是HLA-A9的亚型。在C框中,负的HLA关联性用表示为倒数的OR(1/OR)标记,>1的比值比表示与一致序列无差异。如果这些位于已知的CTL表位中或在其侧面,则也用灰色或黑色文本显示。
图3所有HLA-B5患者中的HIV-RT氨基酸序列。
与群体一致序列相比,群体中所有52个患者中HIV-1 RT的最近的氨基酸序列具有血清学定义的HLA-B5(患者1-52)。将HIV-1 RT序列根据患者的HLA-B亚型进行分组。在所有序列中,点(.)显示与一致序列无差异。显示了与一致序列不同的氨基酸。在对具有不同氨基酸的准种进行探测时,除位置135之外显示了最常见的氨基酸,在位置135上显示了在混合的病毒群体中所有探测到的氨基酸。具有HLA-B*5101亚型的40个患者中除1个外(98%)均在位置135具有对一致氨基酸异亮氨酸(I)的取代,最常见地为由苏氨酸(T)的取代。1无I135x的序列是在急性HIV感染中具有HAART的单个HLA-B*5101患者的序列。2该患者没有进行分子基因分型(genotyping)。3该患者是HLA-B*5101/HLA-B*5201杂合体,但在HLA-B*5101组中仅计数了一次。
图4HIV-1蛋白酶氨基酸位置1-90多态率的图以及与HLA-A和HLA-B等位基因的关联性。
已知的HLA-A和HLA-B限定的CTL表位在A框中标记为灰色线。D框显示在大多数最近的HIV-1蛋白酶序列(n=493)中每一个位置上具有与群体一致序列不同的氨基酸的患者的百分比。显著与多态关联的HLA等位基因以及关联性的比值比(OR)在B框中多态残基上面显示。加框的关联性是那些在对如文中所述鉴定的残基的总数目进行校正后仍然是显著的关联性。在C框中,负的HLA关联性用表示为倒数的OR(1/OR)标记,>1的几率值表示与一致序列无差异。
图5(a)显示病毒对HLA-限定的反应的适应程度与HIV病毒负载之间的关系。
图5(b)显示6个疫苗候选物(SIV、A进化枝病毒(clade A virus)、C进化枝病毒(clade C virus)、HXB2病毒、我们群体的一致病毒和我们最佳的疫苗)的每一个中有利残基数目的频率分布,该候选物与西澳大利亚群体中每一个潜在的感染性病毒相匹配。结果显示疫苗候选物的功效从最高到最低排列为我们最佳的疫苗、我们群体的一致病毒、B进化枝HXB2病毒、C进化枝病毒、A进化枝病毒和SIV。
图6利用表6所示的病毒负载柱状图中估计的改变中阐明的病毒负载结果,显示了估计的HLA-限定的免疫反应强度的频率分布,该免疫反应被SIV、A进化枝病毒(clade A virus)、C进化枝病毒(clade C virus)、HXB2病毒、我们群体的一致病毒序列和我们最佳的疫苗中的每一个所诱导,并针对西澳大利亚群体(West Australian population)中每一个潜在的病毒起反应。结果显示该群体中疫苗候选物的功效从最高到最低排列为我们最佳的疫苗、我们群体的一致病毒序列、C进化枝病毒、A进化枝病毒、B进化枝HXB2病毒和SIV。
图7显示了推定的HIV蛋白酶治疗剂。
图8显示了推定的HIV RT治疗剂。
发明详述概要本领域的技术人员将理解在此处描述的发明除了那些特定描述的之外可进行变化和修饰。应理解的是本发明包括所有这些变化和修饰。本发明也包括在说明书中单独或共同涉及或显示的所有步骤、特征、组合物和化合物以及该步骤或特征的任何和所有组合或任何两个或更多组合。
本发明范围不受在此处描述的特定实施方案限制,该实施方案仅是为了示例性的目的。功能等价的产物、组合物和方法明显地在此处描述的本发明的范围之内。
在本说明书中包括的含有核苷酸和氨基酸序列信息的序列标识符(SEQ ID NO)集中在本说明书的末尾,并用程序Patentln Version 3.0制作。序列表中的每一个核苷酸或氨基酸序列均由数字标识符<210>及其后的序列号识别(如<210>1、<210>2等)。每一个核苷酸或氨基酸序列的序列长度、类型和来源生物均分别由数字标识符<211>、<212>和<213>中提供的信息显示。说明书中涉及的核苷酸和氨基酸序列由数字标识符<400>中提供的信息及其后的序列号来定义(如<400>1、<400>2等)。
所有在此处引用的出版物(包括专利、专利申请、杂志文章、实验室手册、书籍或其他文件)的全部公开内容均在此处引入作为参考。但并没有承认任何这些参考文献构成了现有技术或构成了本发明所涉及的领域中的公知常识的一部分。
如在此处所用的,术语“源于”和“源自”表示一个特定的实体从一个特定的来源获得,但不必是直接获得自该来源。
在本说明书全文中,除非另外说明,单词“包含”表示包括所述的实体或实体组,但并不排除任何其他实体或实体组。
对此处所用术语的其他定义可发现于本发明的详细描述中并应用于全文。除非另有定义,此处所用的所有其他科学和技术术语均具有与本发明所属领域中技术人员通常所理解的相同的含义。
优选实施方案的描述本发明提供了适合于鉴定和确定生物活性氨基酸序列的分析方法。它提供了能够确定宿主内在多肽或多核苷酸序列中的变异对微生物变体中特定氨基酸序列的选择的影响的方法。它也提供了用于分析宿主内在多肽中的变异联合一个或多个其他变量如治疗剂(如药物或疫苗)对微生物变体中特定氨基酸序列的选择的影响的方法。它提供了利用这种信息对患者的治疗进行个体化的方法以及确定患者对特定药物治疗的敏感性的方法,并提供了对患者个体定制药物治疗法的潜力。在本发明一个高度优选的形式中,提供了鉴定HLA-等位基因特异性微生物序列多态的方法,该序列多态由HLA限定的抗原特异性细胞免疫反应产生。
根据一个实施方案,本发明提供了确定宿主基因中的变异对具有蛋白质取代的微生物的选择的影响的方法,该方法包含以下步骤(a)选择被特定微生物感染的患者或动物群体,并根据至少一个选定的参与宿主对微生物反应的内在多肽标记对该群体中的所有个体进行分类;(b)在群体中于步骤(a)中鉴定的每一个类型的足够数目个体中鉴定和确定微生物中的部分多核苷酸序列或多肽序列;(c)在群体中确定步骤(b)中分析的序列中每一个残基位置上的一致(即最大频率的)氨基酸;(d)对在步骤(a)和步骤(b)中获得的数据进行比较以确定步骤(a)中的宿主多态序列如何在步骤(b)中确定的序列中的第一个目标氨基酸残基上增加或降低微生物多态的概率;(e)对步骤(b)中鉴定的每一个氨基酸重复步骤(d)并比较获得的数据。
在本发明的步骤(d)中可应用任何单变量的或多变量的统计学分析方法。优选地,将获得的数据在多变量的Logistic回归模型中进行分析。例如,在模型中可将步骤(a)中获得的数据用作解释性协变量(explanatory co-variable),而将步骤(b)中获得的数据用作结果(outcome)(或反应)变量。当以这种方式进行该分析时,可以对存在多态的结果设定一个值如一(1),而对无多态的结果设定另一个值如零(0)。
来自这种分析的数据将揭示倾向于变异或对变异有抗性的氨基酸序列区域。倾向于变异的氨基酸可能参与涉及所分析的蛋白质的外部生物学相互作用,或者它们可代表具有补偿性改变从而允许序列中其他位置能够发生变异的蛋白质序列区域。对改变有抗性的氨基酸残基更可能具有重要的结构、催化或功能性质。利用宿主和微生物多态之间的关联性,可以鉴定微生物序列中已进行选择性修饰以逃避宿主免疫学反应的影响的推定区域。例如,鉴定的区域可代表HLA限定的CTL相关性表位,微生物在该区域进行了选择性的修饰以逃避宿主的CTL反应。应该理解的是这种区域可提供对于治疗剂设计有价值的氨基酸序列。可选择地,当观察到负的关联性时(即在特定宿主基因多态存在时对多态变异有抗性的氨基酸),这可能代表已通过选择压力进行选择而逃避用该生物感染的以前宿主中保护性反应的氨基酸残基。这种氨基酸可能是高度重要的,这是因为它们可代表微生物中作为药物或预防或治疗性疫苗治疗的适当靶标的残基。
优选地,在步骤(a)中选择的多态序列与感染动物对所感染的微生物的反应相关联。“关联”指直接或间接地参与宿主对微生物的反应。在本发明的一个特别优选的形式中,宿主内在多态标记核酸序列是那些形成HLA的核酸序列。例如,HLA类型的标记可为I型HLA(A、B或C)或II型HLA(DR、DQ)。可选择地,标记核酸序列对于微生物可为更加特异性的,这在于它编码活跃地参与宿主-微生物相互作用的受体或其他蛋白质,如趋化因子受体,例如参与HIV结合的CCR5。
确定宿主内在标记类型和/或鉴定微生物序列中多态的方法通常是本领域技术人员公知的。这种方法可包括但不局限于DNA直接测序或如RFLP、SNP、SSO、SSP、可变数目的串联重复序列(VNTR)等分析法。假定目前可相对容易地进行测序,则该序列优选地进行直接测序。
在此处描述的方法可用于检查在宿主中展示病原性状的大量生物所面临的选择压力。这种生物包括但不局限于细菌、真菌、分枝菌属、病毒和病毒样颗粒。应该理解的是在此处描述的方法在检查已进行改变而快速进化的微生物时将具有特别的价值。这种微生物的例子包括HIV和AIDS相关病毒、疱疹病毒和肝炎相关病毒如HCV和HBV。
当在此处描述的方法涉及鉴定和确定多核苷酸和/或多肽的部分序列时,本领域技术人员将理解每一个序列均可通过本领域中公知的方法确定。如果仅知道多核苷酸序列,多肽序列可进行理论确定或在需要时进行直接测序。
应该理解的是进行检查的多核苷酸或多肽的部分序列可为仅仅20或30个氨基酸或核苷酸的短序列到包含完整基因或蛋白质序列的非常长的序列。优选地,它将包含完整的基因或蛋白质序列。
为了有效地检查在宿主中施加的选择压力对微生物的影响,在步骤(a)中选择的宿主多态基因序列优选地应该为直接或间接参与宿主和微生物之间相互作用的序列。通常,对于微生物的内在蛋白质,直接或间接与那些蛋白质或HLA基因相互作用的治疗剂是相关的。对于在微生物外表面表达的蛋白质,大量其他多态宿主因子可能也是相关的。例如,在检查HIV反转录酶(RT)基因(HIV的一种内在蛋白质)时,HIV反转录酶抑制剂药物和HLA等位基因是最相关的。如果检查HIV包膜蛋白,则应该考虑与趋化因子受体阻断剂或融合抑制剂药物、HLA等位基因、抗-HIV抗体反应、CCR5和CXCR4基因型或任何其他编码导向于包膜蛋白或与包膜蛋白相互作用的产物的多态基因相关联的作用。
为了确定步骤(b)选择的序列中的多态在所研究的群体中是随机分布的还是作为选择压力的结果与解释性协变量相关联的,将群体一致序列优选地用作参考序列,并通过在每一个位置上分配群体中最常见的氨基酸而确定该一致序列。可选择地且依赖于所进行的分析,可将在每一个宿主个体中获得的第一个序列或发表的参考序列用作参考序列。所估计的结果通常是来自检查的微生物参考序列的氨基酸中的任何改变(即使是低水平的但可探测的突变或变异序列)。可选择地,可对分析进行精炼以将对特定或特征性的氨基酸改变的检查限制于特定的残基上(例如HIV反转录酶蛋白质位置184上从M到V的改变)。
所述的用于探测宿主基因变体对微生物多态的作用的方法的能力(power)随宿主基因分型(genotyping)分辨率的改善和数据量的增加(具有宿主基因分型(genotyping)的个体数目和微生物测序)而增加。探测这些模型中任何单个内在多态标记如HLA等位基因的作用的统计学能力依赖于群体中的等位基因频率和所研究的氨基酸位置的多态频率。对每一个位置可进行初始的能力计算以确定对于哪个等位基因当存在关联性时有探测该关联性的合理的能力(如至少30%的能力来探测OR>2.0或<0.5)。然后可将该分析单独限制于所鉴定的等位基因。该方法减少了所进行的统计学比较的数目,且也鉴定了这样的等位基因/位点的组合,即对于这样的组合即使存在关联性也未有探测该关联性的足够能力(这在大的数据组中是非常明显的)。
如果解释性变量(即宿主多态)的频率是低的,且结果(即微生物多态)的频率也是低的,那么探测负关联性的能力将比探测正关联性的能力低。例如,在10.9的HLA等位基因频率和4.0%的多态频率时,探测2.0的比值比(即正关联性)的能力为30%,但探测等价的0.5负比值比的能力仅为5.6%。
优选地,在随后的分析中在每一个病毒残基上仅检查那些与多态具有一定程度的单变量关联性(如具有P≤0.1)的内在多态标记。优选地,Logistic回归模型中的最终协变量能够经受标准的正向选择和反向消除程序(backwards elimination procedure)。基于Logistic模型的排列测验也可用于确定关联性的实际P-值(参见如F.L.Ramsey和D.W.Schafer,The Statistical Sleuth,A course in methods of dataanalysis,(Duxbury Press,1997),第二章)。
对诸如这些数据的大量遗传数据的分析受到统计学困难的阻碍,该统计学困难是由多重统计学比较和大量的潜在解释性变量引起的。这些问题可应用下面方法的任何一个或全部来最小化a.将所检查的解释性协变量限制为那些具有显示关联性的能力的解释性协变量;b.将所检查的解释性协变量限制为那些在单变量分析中与结果(如p>0.1)具有一定关联性程度的解释性协变量;c.将所检查的解释性协变量限制为那些具有足够数目结果(如“突变”>5)的解释性协变量;d.在Logistic回归模型中进行正向协变量选择过程,然后进行反向协变量选择过程;和e.将宿主基因分型(genotyping)结果随机分配给其他个体,然后进行完整的分析并将该过程重复多次(“n”,如为1000)以确定统计学显著关联性的数目(“c”)(p<0.05),其中该关联性对于每一个宿主等位基因在每一个微生物残基上可单独偶然预测。该信息可用函数1-(1-P)20f来计算已对多重比较进行校正的P值,其中f等于“c”除以“n”,而P是未对在步骤(e)中生成的多重比较进行校正的p值。
在对多重比较进行校正后仍然显著的关联性(通常<0.05)更可能是真实的关联性。由Logistic回归模型鉴定的统计学显著关联性的比值比给出了对生物学作用可能强度的量度。
将所有单独的模型中的结果在步骤(c)中确定的氨基酸序列图上绘制在一起。可发现对于特定的内在多态标记特异性的多态沿着序列簇聚。
根据第二个实施方案,本发明涉及一种方法,该方法鉴定宿主多态标记序列中的变异和第二个变量如治疗药物或疫苗对具有特定氨基酸变体的微生物的选择的影响和相互作用,该方法包含以下步骤a.选择被微生物感染的患者或动物群体,其中的一些已经接受了第二个变量作为对所述微生物的部分治疗,并根据至少一个选定的参与宿主对微生物反应的内在宿主多态标记序列对所述群体中的个体进行分类;b.在用第二个变量处理之前和之中,在群体每一个类型的足够数目个体中鉴定和确定微生物中的部分或全长多核苷酸和/或多肽序列,其中该多核苷酸和/或多肽序列是第二个变量的潜在或已知的靶标,另外,以相似的时间间隔在相似的但未经治疗的个体中也进行了上述操作;c.确定在步骤(b)中确定的时间点之间在步骤(b)中检查的序列中每一个残基上是否发生了变化(“突变”);d.对在步骤(a)中获得的数据、治疗和未治疗的序列中用第二个变量处理与否的作用以及步骤(c)中获得的数据进行比较,以确定步骤(a)中的多态序列和用第二个变量的处理如何影响步骤(c)中第一个目标氨基酸残基上突变的概率;
e.对步骤(c)中确定的序列中每一个氨基酸重复步骤(d)。
尽管内在多态标记是在上述方法中检查的唯一一个协变量,但本领域技术人员应该理解的是所述方法也能够检查其他选择压力,该选择压力可充当变量且可对微生物驱动的进化变化施加选择力。任何能够对患者中的微生物群体施加选择力的变量均可通过该方法进行检查。例如在HIV感染的情况下,选择压力可为特定药物或治疗剂如叠氮胸苷(或AZT)的影响。在患者中,在细菌感染的情况下该选择压力可为特定抗生素的影响,或者在混合的生物群体的情况下为其他微生物的存在与否。可选择地,它可为特定的抗体或抗体群体或基因治疗系统(如反义相关的治疗)。
这种分析寻求检查宿主内在多态标记和第二个协变量之间对步骤(b)中的变异速率的竞争性压力。例如,当宿主多态标记是HLA等位基因,微生物是HIV-1,步骤(b)中选择的序列是反转录酶基因(RT基因)且选择压力是由治疗剂如抗反转录病毒药物导致时,HLA等位基因和抗反转录病毒药物可在病毒RT序列的位点上施加竞争性的协同或拮抗压力。
通过在所述方法中分析内在标记和治疗剂的作用,可以鉴定抗病毒药物和/或HLA类型对病毒DNA核苷酸或氨基酸残基的突变或变异具有什么影响。本领域的技术人员将理解这些数据提供了使患者的治疗方案个体化的唯一工具。抗反转录病毒药物治疗的个体化可通过应用在此处描述的方法而改进,该方法可鉴定免疫压力和药物压力之间的协同或拮抗相互作用。利用该信息,可以鉴定HLA限定的免疫反应所施加的选择压力与那些由治疗剂施加的选择压力是否是协同的或是拮抗的。如果是,那么抗反转录病毒药物治疗法可根据具有特定HLA基因型和HIV序列的群体成员而进行改变。因而该方法有效地提供了鉴定特定类型的患者对特定药物治疗法的敏感性或抗性的方法。
根据第二个实施方案的优选形式,本发明涉及一种方法,该方法确定宿主多态标记序列中的变异和治疗药物对具有特定氨基酸变体的微生物的选择的影响和相互作用,该方法包含以下步骤
(a)选择被微生物感染的患者或动物群体,其中的一些接受了至少一种意欲治疗所存在的微生物的药物,并根据至少一个选定的参与宿主对微生物反应的宿主内在多态标记序列对所述群体的个体进行分类;(b)在用药物处理之前和之中,在群体每一个治疗的个体中鉴定和确定微生物中作为药物潜在靶标的部分或全长多核苷酸或多肽序列,另外,以相似的时间间隔在相似的但未经治疗的个体中也进行了上述操作;(c)确定在步骤(b)中确定的时间点之间在步骤(b)中检查的序列中每一个残基上是否发生了变化(“突变”);(d)对在步骤(a)中获得的数据、治疗和未治疗的序列中用药物处理与否的作用以及步骤(c)中获得的数据进行比较,以确定步骤(a)中的多态序列和用药物处理如何影响步骤(c)中第一个目标氨基酸残基上的突变;(e)对步骤(c)中确定的序列中每一个氨基酸重复步骤(d)。
如在此处所用的,突变涉及与每一个个体中处理前的序列相比在处理中或处理后序列的氨基酸中的改变。在一个可选择的分析形式中,可将群体一致序列或发表的参考序列用作参考序列,在该情况下,突变定义为与群体限定的参考序列相比在处理中或处理后氨基酸中的改变。
来自上述分析的数据将揭示竞争性压力对序列中特定氨基酸或一组氨基酸的相对突变的影响。此外,这种分析将提供对微生物序列中特定的多态改变的个体相互作用压力的分析方法。
与前面的实施方案一样,在步骤(d)中可应用任何能够进行单变量或多变量分析的统计学方法。然而,优选地将该数据在多变量的Logistic回归模型中进行比较。例如,可将在步骤(a)中获得的数据以及涉及两个序列用第二个变量处理与否的数据用作单独的解释性协变量,而将在步骤(c)中获得的数据用作模型中的结果变量。当进行这种分析时,如果第二个时间点上的氨基酸与第一个时间点上的氨基酸相同,则可将结果定义为一个值(如0),而如果该氨基酸与第一个时间点的不同则定义为另一个值(如1)。此外,或者在可选择的分析形式中,该方法可用于检查HLA等位基因对一个氨基酸到另一个氨基酸的特征性抗反转录病毒药物抗性改变的影响,当有改变时分配一个值(1)而当无改变时分配另一个值(0)。例如,如果进行确定HLA等位基因对特征性拉米夫定抗性突变M184V的影响(如果有的话)的检查,那么存在改变(HIV反转录酶位置184的V)可分配一个值如1,而不存在改变可分配第二个值如0。通过比较这些数据,可以鉴定抗反转录病毒药物和HLA等位基因对所述氨基酸改变的影响。利用这种信息,可以对特定HLA类型的患者设定特定的治疗法。
一些氨基酸改变需要超过一个的(即至少2个或3个)DNA核苷酸改变。这种氨基酸改变显示了特别强的选择压力,它可与药物或疫苗设计或治疗的个体化相关联。
微生物的一个残基的多态或突变可能与微生物中别处的多态或突变连锁或相关联。可将微生物中其他残基上的改变纳入对数模型中作为解释性协变量以鉴定可能的补偿性或次级多态或突变。然而,补偿性突变可能作为中间结果起作用,因此在多变量模型中将它们纳入作为解释性协变量可取消或隐藏HLA等位基因或药物的真实的初级解释性影响。本领域的技术人员将理解在多变量模型中将中间结果纳入作为解释性协变量将导致不熟悉本领域的技术人员对结果的错误解释。
如果群体中的不同个体已在步骤(b)中不同数目的时刻(occasion)进行了测序,那么可将Logistic回归模型用通用的估算方程方法学进行修饰以进行适当的调节,从而防止那些具有较多序列的个体与具有较少序列的个体相比不成比例地对模型起作用。
在一个高度优选形式中,本发明涉及包含下面步骤的方法(a)对被HIV感染的宿主大群体进行HLA测序;(b)对每一个患者中主要的HIV种类的全部或部分进行测序;(c)通过在病毒的每一个残基位置确定最常见的氨基酸残基以限定HIV的一致序列;(d)在每一个生物的残基上
(i)对每一个个体(患者)确定目标HIV氨基酸残基与一致残基相比是相同的(“非突变的”)还是不同的(“突变的”);(ii)进行多变量(在该情况下为Logistic)回归模型分析,在得到的结果中,对突变的氨基酸分配值(1)或将非突变的氨基酸分配值(0);(iii)在多变量模型中检查一个或多个如下潜在的解释性协变量以寻找与目标结果的关联性(1)患者个体的HLA等位基因;(2)由宿主摄入的导向目标蛋白质的治疗药物(例如,当检查HIV反转录酶时为反转录酶抑制剂抗反转录病毒药物,当检查HIV蛋白酶时为蛋白酶抑制剂);和/或(3)宿主蛋白质中其他位置的突变;和(iv)解释结果。
考虑到在此处描述的方法的特性,本领域的技术人员将理解所述的分析方法在检查蛋白质相互关系和生物活性分子分析中将具有广泛的应用。这些应用的一些在下面进行阐明1.检查推定的类型I或II和逃避或非逃避对决定宿主中所测量生物的数量的任一个动态平衡(如病毒调定点(viral set point))的影响。
2.HLA类型对在例如HIV相异对(discordant pair)(非传播)、HIV相似配对(concordant pair)(传播)或任何其他类型的感染中的传播危险的影响。
3.生物中HLA限定的免疫压力、密码子使用和其他多态对由治疗剂诱导的突变途径的影响和相互作用,如HIV蛋白酶中的L90M或D30N一级药物抗性突变是否由奈非那韦诱导。
4.它提供了用于疫苗抗原选择的方法。
5.它提供了检查外部蛋白质(如包膜蛋白)与HLA限定的免疫压力和/或抗体和/或趋化因子受体应用/开关和/或避开趋化因子受体阻断剂或融合抑制剂的相互作用的方法。
6.它也提供了检查蛋白质结构/功能关系的方法。
7.它提供了使抗微生物治疗个体化的方法。例如,该方法提供了选择抗反转录病毒治疗中许多标准的治疗组合中哪一个对于由HIV感染的患者个体的治疗是最有效的方式。
根据本发明进一步的实施方案,提供了设计能够在患者中诱导特异性T-细胞反应治疗剂的方法,该方法包含如上所述的步骤,并因而分析该数据以鉴定病毒群体中由于该群体感染而产生的多态,其中该多态是HLA相关联的。
根据本方法,对个体进行HLA分类,且对编码潜在的微生物蛋白质目标(例如HIV反转录酶和蛋白酶)的基因进行测序。HLA等位基因和微生物多态之间的正和负的关联性在微生物感染个体的大群体中进行确定。该群体理想地应该与从中抽取所研究的个体的群体相同或相似。然后检查微生物氨基酸残基,其中该氨基酸残基与存在于所研究个体中的HLA等位基因有已知的关联性。
对于这种分析,可以鉴定特定的关联性,其中多态频率表现为氨基酸或核苷酸中的改变与特定的HLA类型相关联且与T-细胞逃避相关联。优选地,选择用于分析的多态频率大于10%,更优选地为大于15%,且想要地为大于20%、25%、30%、35%、40%、45%、50%、55%或60%。这种数据将揭示潜在编码T-细胞表位的氨基酸序列。这种数据也将提供可用于开发治疗剂的氨基酸序列。例如,可设计治疗剂以编码其中存在逃避突变的氨基酸区域,从而防止逃避突变发挥其作用。在此处提供的例子阐明了这种序列如何可从由上述方法获得的数据中生成。
根据本发明进一步的实施方案,提供了鉴定T细胞表位的方法,该方法包含如上所述的步骤,接着分析该数据以鉴定病毒群体中由于该群体感染而产生的多态频率,其中该多态是HLA相关联的。
根据本发明进一步的实施方案,提供了设计疫苗以防止或延迟在用对微生物特异性的特定药物治疗的患者中出现药物抗性的方法,其中该药物在核苷酸或氨基酸水平影响微生物的复制,该方法包含以下步骤进行如上所述的步骤,然后分析数据以鉴定已用抗反转录病毒药物治疗的感染个体中的病毒群体中发生的多态频率,其中该多态频率是在微生物中药物具有活性的核苷酸或氨基酸序列区域中确定的,然后设计一种或多种治疗剂,该治疗剂促进针对含有展示一种或多种所鉴定的多态的病毒群体的细胞的T-细胞反应。
当将该方法用于使抗反转录病毒治疗个体化时,对该个体进行HLA分类,并对编码抗微生物治疗的潜在微生物蛋白质靶标(例如HIV反转录酶和蛋白酶)的基因进行测序。HLA等位基因和微生物多态之间的正和负的关联性在微生物感染个体的大群体中进行确定。该群体理想地应该与从中抽取所研究个体的群体相同或相似。然后检查微生物氨基酸残基,该氨基酸残基与存在于所研究的个体中的HLA等位基因具有已知的关联性。然后根据选择具有如下特性的抗微生物药物1)在群体中HLA特异性负关联位点具有群体一致序列的残基上和在群体中HLA特异性正关联位点不具有群体一致序列的残基上促进突变发展;或2)在群体中HLA特异性正突变位点具有群体一致序列的残基上和在群体中HLA特异性负关联位点不具有群体一致序列的残基上阻止突变。如果应用超过一种抗微生物治疗手段,那么可能的是组合应用试剂,该试剂在特定的残基具有竞争性作用(即一种药物在群体中具有正关联性而另一种药物在相同残基具有负关联性)或在体外或体内证实具有协同性质。
设计疫苗的方法前述方法提供了鉴定多态区域的方法,该方法可用于治疗剂的开发。一旦对这些区域进行了定位,那么则可用下面的原则优选地设计治疗性疫苗1.编码共同的抗性突变2.编码推定的“适合性突变(fitness mutations)”,其中这些突变不与共同的关键突变(key mutations)相干涉3.尽可能应用完整蛋白质,但避免长的野生型氨基酸片段,这是因为对野生型序列的反应是相对不想要的
4.应用实施例1中描述的最优的一致序列样序列作为主链(即不是抗反转录病毒抗性突变的残基上的氨基酸序列)。可能时(如蛋白酶)应用已知可正确折叠的主链(如真实的分离物),这是因为抗原稳定性可更好。
5.在抗性突变非常靠近时(<4个氨基酸)生成仅表达单个抗性表位的分离片段,这是因为对含有2个抗性突变的表位的反应是相对不想要的6.对于含有单个突变的片段,在每一侧编码7个氨基酸以增强CD8 T细胞对所编码的突变的反应的发展和降低对野生型序列反应的可能性7.然而,编码尽可能少的分离片段,这是因为对2个片段(无关表位)的重叠氨基酸序列的反应是不想要的8.尽可能多地分离含有相同编码序列的片段,从而减少构建过程中的重组潜力制备氨基酸序列的方法根据本发明的另一个方面,提供了制备根据上述方法设计的任一个氨基酸序列的方法。
本发明的全长氨基酸序列可应用众所周知的重组DNA技术方法进行制备,如那些在Sambrook等人(Molecular CloningA LaboratoryManual,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y. )和/或Ausubel等人,eds,(Current Protocols inMolecular Biology,Green Publishers Inc.and Wiley and Sons,N.Y. )中提出的。
编码蛋白质或其片段的基因或cDNA可由例如对微生物序列的PCR扩增而获得。改进的体外扩增核酸的克隆方法描述于Wallace等人,美国专利No.5,426,039中。
可选择地,编码多肽或片段的基因可用技术人员众所周知的方法通过化学合成制备,如那些由Engels等人(Angew.Chem.Intl.Ed.,28716-734 )描述的。这些方法(除其他之外)还包括核酸合成用的磷酸三酯、亚磷酰胺和H-磷酸酯方法。这种化学合成的优选方法是应用标准亚磷酰胺化学的聚合物支持的合成。一般地,编码多肽的DNA长度将为几百个核苷酸。大于约100个核苷酸的核酸可用这些方法以几个片段进行合成。然后将片段连接在一起以形成全长的多肽。通常,编码多肽氨基末端的DNA片段将具有ATG,该ATG编码甲硫氨酸残基。依赖于宿主细胞中产生的多肽是否从该细胞分泌,该甲硫氨酸可存在于或不存在于该多肽的成熟形式中。
可将这样分离的基因或cDNA插入到适当的表达载体中以在宿主细胞中进行表达。一般选择在应用的特定宿主细胞中发挥功能的载体(即该载体与宿主细胞机器相容,从而可发生该基因的扩增和/或该基因的表达)。多肽或其片段可在原核生物、酵母、昆虫(杆状病毒系统)和/或真核宿主细胞中扩增/表达。
然后可通过现有技术的方法从细胞培养物中回收和纯化氨基酸序列,该方法包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换层析、磷酸纤维素层析、疏水相互作用层析、亲和层析、羟基磷灰石层析和凝集素层析。优选的是在纯化过程中存在低浓度的钙离子(约0.1-5mM)(Price等人,J.Biol.Chem.,244917(1969))。如果需要,在完成成熟蛋白质的构型中可应用蛋白质再折叠步骤。最后,可应用高效液相层析(HPLC)以进行最后的纯化步骤。
本发明的氨基酸序列可为天然纯化的产物,或化学合成程序的产物,或由重组技术从原核或真核宿主中产生的(例如,由培养物中的细菌、酵母、高等植物、昆虫和哺乳动物细胞产生的)。
制备能够在患者中表达该序列的载体构建体的方法,该载体构建体能够诱导特异性T-细胞反应根据本发明的另一个方面,提供了制备能够在患者中表达该序列的载体构建体的方法,该载体构建体能够在被微生物感染或有该微生物感染危险的患者中诱导特异性T-细胞反应。
根据本方法,将基因分离然后插入到能够在患者中表达该序列的载体构建体中,该载体构建体能够在患者中诱导特异性T-细胞反应。
例如,病毒转导方法可包含用重组DNA或RNA病毒感染目标细胞,该重组DNA或RNA病毒包含驱动编码多态的氨基酸表达的核酸序列。用于本发明的适当DNA病毒包括但不局限于腺病毒(Ad)、腺伴随病毒(AAV)、疱疹病毒、痘苗病毒或脊髓灰质炎病毒。用于本发明的适当RNA病毒包括但不局限于反转录病毒或辛德比斯病毒。本领域技术人员理解存在几种适用于本发明的此类DNA和RNA病毒。
已经证明腺病毒载体对于向真核细胞中的基因转移是尤其有用的(Stratford-Perricaudet,L.和M.Perricaudet,1991.Gene transferinto animalsthe promise of adenovirus.第51-61页,Human GeneTransfer,Eds,O.Cohen-Haguenauer和M.Boiron,Editions JohnLibbey Eurotext,法国)。腺病毒载体已成功用于研究真核基因表达(Levrero,M.等人,1991,Defective and nondefective adenovirusvectors for expressing foreign genes in vitro and in vivo.Gene101195-202)、疫苗开发(Graham,F.L.和L.Prevec(1992)Adenovirus-based expression vectors and recombinant vaccines.VaccinesNew Approaches to Immunological Problems,(Ellis,R.V.Ed.),第363-390页,Butterworth-heinemann,Boston)和动物模型中(Stratford-Perricaudet等人,1992,Widespread long-termgene transfer to mouse skeletal muscles and heart.J.Clin.Invest.90,626-630;Rich等人,1993,Development and analysis ofrecombinant adenoviruses for gene therapy of cystic fibrosis.Human Gene Ther.4,461-476)。人类中Ad-介导的基因治疗的首次尝试是囊性纤维化跨膜传导调节蛋白(CFTR)基因向肺中的转移(Crystal等人,1994,Nature Genetics 8,42-51)。将重组Ad在体内给予不同组织的实验途径包括气管内滴注法(Rosenfeld等人,1992,In vivo transfer of the human cystic fibrosis transmembraneconductance regulator gene to the airway epithelium.Cell 68,143-155)、肌肉内注射(Quantin,B.等人,1992,Adenovirus as anexpression vector in muscle cells in vivo.Proc.Natl.Acad.Sci.USA 89,2581-2584)、外周静脉内注射(Herz,J.和R.D.Gerard,1993,Adenovirus-mediated transfer of low density lipoproteinreceptor gene acutely accelerates cholesterol clearance innormal mice.Proc.Natl.Acad.Sci.USA 90,2812-2816)和向脑中的脑功能区定位接种(Le Gal La Salle等人,1993.An adenovirusvector for gene transfer into neurons and glia in the brain.Science 259,988-990)。因而,腺病毒载体是本领域技术人员可广泛获得的且适用于本发明。
最近已将腺伴随病毒(AAV)作为在基因治疗中具有潜在应用的基因转移系统。野生型AAV展示高水平的感染性、宽的宿主范围和向宿主细胞基因组中整合的特异性(Hermonat,P.L.和N.Muzyczka,1984,Use of adeno-associated virus as a mammalian DNA cloning vectortransduction of neomycin resistance into mammalian tissueculture cells.Proc.Natl.Acad.Sci.USA 816466-6470)。1-型单纯疱疹病毒(HSV-1)由于其亲神经性质而是有吸引力的用于神经系统中的载体系统(Geller,A.I.和H.J.Federoff,1991,The use ofHSV-1 vectors to introduce heterologous genes into neuronsimplications for gene therapy.Human Gene Transfer,Eds,O.Cohen-Haguenauer和M.Boiron,第63-73页,Editions John LibbeyEurotext,法国;Glorioso等人,1995,Herpes simplex virus as agene-delivey vectors for the central nervous system.ViralVectors-Gene therapy and neuroscience application,Eds,M.G.Kaplitt和A.D.Loewy,第1-23页,Academic Press,New York)。痘病毒(poxvirus)科中的痘苗病毒也已发展为表达载体(smith,G.L.和B.Moss,1983,Infectious poxvirus vectors have capacity forat least 25,000 base pairs of foreign DNA. Gene 2521-28;Moss,B.1992,Poxviruses as eukaryotic expression vectors.Semin.Virol.3277-283)。上述载体的每一个均是本领域技术人员可广泛获得的且适用于本发明。
反转录病毒载体能够感染大百分比的目标细胞并整合入细胞基因组中(Miller,A.D.和G.J.Rosman,1989,Improved retroviralvectors for gene therapy and expression.Biotechniques 7980-990)。反转录病毒比其他病毒相对较早发展为基因转移载体,并首先成功用于基因标记和将腺苷脱氨酶(ADA)的cDNA转导入人淋巴细胞中。
已用于或计划用于基因治疗中的“非病毒”送递技术包括DNA-配体复合物、腺病毒-配体-DNA复合物、直接DNA注射、CaPO4.sub.4沉淀、基因枪技术、电穿孔和脂质转染法(Mulligan,R.C.1993,The basicscienee of gene therapy.Science 260926-932)。这些方法的任何一个均是本领域技术人员可广泛获得的且适用于本发明。其他适当的方法是本领域技术人员可获得的,且应理解本发明可应用任何一种可用的转染方法实现。本领域的技术人员已不同程度成功地应用了几种这样的方法(Mulligan,R.C.1993,The basic science of gene therapy.Science 260926-932)。脂质转染法可通过将分离的DNA分子包被入脂质体颗粒中并使脂质体颗粒与目标细胞的细胞膜接触而实现。脂质体是自组装的胶体状颗粒,其中包含两亲性分子如磷脂酰丝氨酸或磷脂酰胆碱的脂双层包被了一部分周围的基质,从而脂双层围绕了亲水内核。可构建单层或多层脂质体,从而内核含有想要的化学药品、药物或本发明中分离的DNA分子。
治疗方法在其他的实施方案中,本发明包含在哺乳动物中诱导针对抗原的T淋巴细胞反应的方法。该方法包含向哺乳动物给予根据本发明设计的氨基酸序列或能够在患者中表达该序列的载体构建体,该氨基酸序列或载体构建体能够在被微生物感染或有该微生物感染危险的患者中诱导特异性T-细胞反应。
在另外的实施方案中,本发明提供了用于治疗或预防疾病的方法,该疾病对借助于T细胞反应的治疗是易感的,所述方法通过给予根据上述方法设计的氨基酸序列或能够在患者中表达该序列的载体构建体来实现,该氨基酸序列或载体构建体能够在被微生物感染或有该微生物感染危险的患者中诱导特异性T-细胞反应。
本发明的另一个方面是通过给予组合物而在动物中引起细胞免疫反应的方法,该组合物包含药物可接受的赋形剂、佐剂和进行改变以含有细胞免疫反应表位的氨基酸序列,该表位至少包含与患者中HLA等位基因类型相关联的病毒多态。该细胞反应可为CD8+T细胞反应、CD4+T细胞反应或CD8+T细胞和CD4+T细胞两者的反应。
在一个可选择的形式中,本发明提供了通过给予组合物而在动物中引起细胞免疫反应的方法,该组合物包含药物可接受的赋形剂和进行改变以至少含有对于特定HLA类型高度保守的细胞免疫反应相关联的表位的氨基酸序列,或者包含能够在动物中表达该氨基酸序列的载体构建体。在其中引起免疫反应的动物可为哺乳动物。在优选的实施方案中,该哺乳动物可为人,该人可为HIV阳性或HIV阴性的。
本发明的另一个方面是在暴露于感染性HIV中的动物中延迟HIV发病的方法,这是通过给动物接种药物可接受的赋形剂和根据上述方法设计的氨基酸序列或能够在患者中表达该序列的载体构建体来实现的,该氨基酸序列或载体构建体能够在被微生物感染的或有该微生物感染危险的患者中诱导特异性的T-细胞反应。
关于人类中HIV感染的治疗或预防,可如在此处提出的那样选择用于本发明中的T-细胞诱导性氨基酸序列。通过选择一种或多种可诱导针对HIV抗原的T-细胞反应的氨基酸序列,能够生成如下反应,该反应能够杀死(或抑制)感染的细胞或者表达天然HIV抗原的细胞。关于人类中HIV1和2的治疗或预防,可选择一种或多种诱导针对HIV1或HIV2抗原的T-细胞反应的氨基酸序列。HIV T-细胞诱导性氨基酸序列通常将具有至少4个残基,有时为6个残基,经常为7个或更多残基,或者与天然存在的HIV序列的相应部分相同或同源的氨基酸序列的大部分氨基酸。例如,优选地用于刺激HIV T-细胞反应的那些氨基酸序列包括鉴定为SEQ ID NO 2-10、11、13、15、17、19、21、23、25、27、29、31或33的氨基酸序列中的一个或多个。
在本发明的组合物和方法中应用的T-细胞诱导性氨基酸序列不需要与在前述公开内容中公开的特定氨基酸序列相同,且可通过各种技术进行选择,例如根据如上所述的某些方法。
在一些情况中,可能想要的是组合两个或多个氨基酸序列,该氨基酸序列在一个或多个患者中或在组织相容性类型中对刺激特异性T-细胞反应有贡献。该组合物中的氨基酸序列可为相同的或不同的,且它们一起提供了与亲代氨基酸序列等价的或更高的生物学活性。例如,应用在此处描述的方法,两个或多个氨基酸序列可限定来自特定区域的不同或重叠的T-细胞表位,该氨基酸序列可组合入“混合物”中以提供增强的T-细胞反应免疫原性,且该氨基酸序列可与具有不同MHC限制性元件的氨基酸序列组合。该组合物可有效用于拓宽由本发明的治疗剂、疫苗或诊断方法和组合物在不同群体中提供的免疫学覆盖度。
在一些实施方案中,本发明的T-细胞诱导性氨基酸序列由间隔区分子连接,或者T-细胞氨基酸序列可不由间隔区连接。当存在间隔区时,该间隔区一般包含相对小的中性分子,如氨基酸或氨基酸模拟物,该分子在生理学条件下基本是不带电荷的,且可具有线形或分支的侧链。间隔区一般选自如Ala、Gly或其他非极性氨基酸的中性间隔区或中性极性氨基酸的中性间隔区。在此处某些优选的实施方案中,中性间隔区是Ala。将理解的是本发明的间隔区可选择地不必由相同的残基组成,从而可为异寡聚体或同寡聚体。优选的间隔区是Ala的同寡聚体。当间隔区存在时,该间隔区通常具有至少1个或2个残基,更通常为3-6个残基。
本发明的氨基酸序列可通过键合以形成聚合物(多聚体),或者可形成无键合的组合物,如混合物。当相同的氨基酸序列与自身连接从而形成同聚合物时,则提供了许多重复的表位单位。当氨基酸序列不同时,如代表不同抗原种类或亚型、亚型中的不同表位、不同组织相容性限制特异性或含有表位的氨基酸序列的混合物,则提供了具有重复单位的杂聚合物。除共价连接之外,也预期能够形成分子间和结构内键的非共价连接。
本发明的氨基酸序列和其药物组合物和疫苗组合物可用于给予哺乳动物特别是人以用于治疗和/或预防病毒、细菌和寄生物感染。由于该氨基酸序列用于刺激针对感染的细胞的细胞毒性T-淋巴细胞反应,所以该组合物可用于治疗或预防急性和/或慢性感染。
对于药物组合物,可将如上所述本发明的T-细胞氨基酸序列给予已患待治疗的疾病或对其易感的哺乳动物。那些处于疾病(如病毒感染)的潜伏期或急性期的受试者可适当地单独用免疫原性氨基酸序列进行治疗或与其他治疗手段结合进行治疗。在治疗应用中,将组合物以一定量给予患者,该量足以引起对疾病的有效T-细胞反应和至少部分地阻止其症状和/或并发症。足以实现这一目的的数量定义为“治疗有效量”。用于该用途的有效量将依赖于例如氨基酸序列组合物、给予方式、所治疗疾病的阶段和严重性、患者的体重和总体健康状况和开处方医生的判断,但通常对于初始的免疫接种(即治疗或预防目的的给予)范围约1.0μg-约50mg氨基酸序列,优选地为1μg-500μg,更优选地为1μg-250μg,随后为约1.0μg-50mg氨基酸序列的强化免疫剂量,优选地为1μg-500μg,且更优选地为1μg-约250μg,该强化免疫方案持续数周至数月,具体则依赖于患者的反应和状况,其中患者的反应和状况是通过测量患者血液中的特异性T-细胞活性得到的。必须牢记的是本发明的氨基酸序列和组合物通常可应用于严重的疾病状态中,即威胁生命的或潜在地威胁生命的病症。在这种情况下,考虑到所引入外源物质的最小化和氨基酸序列的相对无毒性的特性,可能的且治疗医生认为想要的是给予显著过量的这些氨基酸序列组合物。
组合物的单次或多次给药可以以治疗医生选择的剂量水平和模式实现。无论如何,该药物制剂应该提供本发明足以有效治疗患者的细胞毒性T-淋巴细胞刺激性氨基酸序列的量。
对于治疗应用,给药应该在疾病(HIV感染)的最初迹象出现时开始,随后伴随强化给药直到症状至少显著减少且持续一段时间。在已经确诊的或慢性疾病的情况下,如慢性HIV感染,可需要负荷剂量和随后的强化剂量。在对急性疾病阶段的早期治疗中对有效T-细胞反应的诱导将使慢性疾病如HIV携带阶段的随后发展概率最小化。
用本发明的组合物对感染的哺乳动物的治疗可促进对急性患病的哺乳动物中疾病的解决。对于那些对发展慢性疾病易感(或易患病的)的哺乳动物,本发明的组合物在预防疾病的发展中特别有用。例如,如在此处所描述的当在感染前或在感染过程中确定易感个体后,可使该组合物定向应用于该个体,从而使向较大群体给药的需要最小化。
该氨基酸序列组合物也可用于治疗确诊的疾病和刺激免疫系统以消除病毒感染的细胞。感染后约3-6个月检测呈病毒阳性的个体可以被认为是具有确诊疾病的个体。因为个体可由于在其感染早期中不足的(或缺失的)T-细胞反应而发展HIV感染,所以重要的是以足以有效刺激T-细胞反应的制剂和给药模式提供本发明一定量的免疫强化性氨基酸序列组合物。因而,对于确诊疾病的治疗,代表性的剂量范围为每次给药约1.0μg-约50mg,优选地为1μg-500μg,最优选地为1μg-250μg,随后为每次给药约1.0μg-50mg的强化剂量,优选地为1μg-500μg,且更优选地为1μg-约250μg。应该持续给药直到至少临床症状或实验指示物显示HIV感染已显著减少且持续一段时间。可能需要在确定的时间间隔如1-4个星期进行免疫给药以及随后的强化给药,要治疗该感染,也可能需要延长的时间。
用于治疗处理的药物组合物意欲进行肠胃外的、局部的、口腔的或局域的给药。优选地,将药物组合物经肠胃外给药,如静脉内地、皮下地、皮内地或肌内地。因而,本发明提供了用于肠胃外给药的组合物,该组合物包含溶解于或悬浮于可接受的载体(优选地为水性载体)中的T-细胞刺激性氨基酸序列。可应用各种水性载体,如水、缓冲的水、0.4%的盐水、0.3%的甘氨酸、透明质酸等。这些组合物可通过常规的众所周知的灭菌技术进行灭菌,或可通过过滤灭菌。结果所得的水溶液可进行包装以备应用,或者可以冻干,该冻干的制剂在给药前与无菌溶液组合。该组合物可含有药物可接受的辅助物质以使其接近生理学条件,如pH调节剂和缓冲试剂、涨度调节试剂、润湿剂等,例如,乙酸钠、乳酸钠、氯化钠、氯化钾、氯化钙、单月桂酸山梨聚糖、油酸合三乙醇胺、甲醇和溶解剂如DMSO等。
本发明药物制剂中T-细胞刺激性氨基酸序列的浓度可大范围地变动,即按重量计从少于约1%、通常为或至少为约10%到高达20%-50%或更高,且根据所选的给药的特定模式而主要根据流体体积、粘度等进行选择。
因而,用于静脉内灌输的典型药物组合物可含有250ml无菌的林格溶液和50mg氨基酸序列。制备肠胃外给药的组合物的实际方法对于本领域的技术人员是公知且显而易见的,并更详细地描述于如Remington’s Pharmaceutical Sciences,第17版,Mack PublishingCompany,Easton,Pa.(1985),在此处将其引入作为参考。
本发明的氨基酸序列也可通过脂质体给药,该脂质体用于将氨基酸序列导向特定的组织如淋巴组织,或者选择性地导向感染的细胞,以及增加氨基酸序列组合物的半衰期。脂质体包括乳剂、泡沫、微团、不溶性单层、液晶、磷脂分散体、片层等。在这些制剂中,要送递的氨基酸序列作为脂质体的部分进行整合,该氨基酸序列为单独的,或者可以与结合淋巴细胞中普遍存在的受体的分子(如与CD45抗原结合的单克隆抗体)或与其他治疗性或免疫原性组合物组合。因而,充满本发明想要的氨基酸序列的脂质体可导向淋巴细胞位点,然后脂质体在该位点送递所选的治疗性/免疫原性氨基酸序列组合物。用于本发明的脂质体从标准的小泡形成性脂质生成,该脂质通常包括中性和带负电荷的磷脂和固醇如胆固醇。脂质的选择通常考虑如脂质体大小和血流中脂质体的稳定性。用于制备脂质体的各种方法是可用的,如描述于Szoka等人,Ann.Rev.Biophys.Bioeng.9467(1980),美国专利No.4,235,871、4,501,728、4,837,028和5,019,369中的,在此处将其引入作为参考。为导向免疫细胞,整合入脂质体中的配体可包括,例如对想要的免疫系统细胞的细胞表面决定簇特异性的抗体或其片段。含有氨基酸序列的脂质体悬浮液可以以一定剂量进行静脉内、局域、局部等的给药,该剂量除其他因素之外根据给药的方式、送递的氨基酸序列和治疗的疾病的阶段而变化。
对于固体组合物,可应用常规的无毒性固体载体,该载体包括如药物级的甘露醇、乳糖、淀粉、硬脂酸镁、糖精钠、滑石、纤维素、葡萄糖、蔗糖、碳酸镁等。对于口服给药,药物可接受的无毒性组合物通过将任何通常应用的赋形剂(如前面所列的那些载体)与通常10-95%的活性成分整合而形成,该活性成分即为一种或多种本发明的氨基酸序列组合物,且更优选地浓度为25%-75%。
对于气雾剂给药,T-细胞刺激性氨基酸序列组合物优选地以良好分散的形式连同表面活性剂和推进剂一起提供。氨基酸序列的典型百分比为0.01wt%-20wt%,优选地为1wt%-10wt%。表面活性剂当然必须无毒,且优选地溶于推进剂中。这种试剂的代表为脂肪酸与脂族多羟基醇或其环状酐的酯或偏酯,所述脂肪酸含有6-22个碳原子,如己酸、辛酸、月桂酸、棕榈酸、硬脂酸、亚油酸、亚麻酸、olesteric和油酸。可应用混合酯如混合的甘油酯或天然的甘油酯。表面活性剂构成组合物的0.1wt%-20wt%,优选地为0.25wt-5wt%。组合物的其余组分通常为推进剂。如果需要,也可包括载体如卵磷脂以用于鼻内送递。
在另一方面,本发明涉及含有如在此处描述的免疫原性有效量的T-细胞刺激性氨基酸序列组合物作为活性成分的治疗剂。可将该氨基酸序列引入到哺乳动物宿主包括人中,该氨基酸序列与其自身载体连接或作为活性氨基酸序列单位的同聚合物或异聚合物。这种聚合物具有增强的免疫学反应的优点,且当不同氨基酸序列用于组成该聚合物时,该聚合物具有诱导与病毒的不同抗原决定簇反应的抗体和/或细胞毒性T细胞的额外能力。有用的载体是本领域众所周知的,且包括如甲状腺球蛋白、白蛋白如人血清白蛋白、破伤风类毒素、聚氨基酸如聚(D-赖氨酸∶D-谷氨酸)、流感病毒蛋白质等。该治疗剂也可含有生理学耐受的(可接受的)稀释剂如水、磷酸缓冲盐水或盐水,且一般进一步地包括佐剂。佐剂如不完全弗氏佐剂、磷酸铝、氢氧化铝、明矾或MONTANIDE.RTM.(Seppic,Paris,法国;具有二缩甘露醇油酸酯的油基佐剂)是本领域中众所周知的材料。在用如在此处所述的氨基酸序列组合物通过注射、气雾剂、口服、经皮或其他途径进行免疫接种后,宿主的免疫系统通过产生大量对疾病相关抗原特异性的T-细胞而应激于治疗剂,且宿主变为对疾病至少部分免疫或对疾病有抗性。
将含有本发明的氨基酸序列的治疗组合物给予患者以增强患者自身的免疫反应能力,其中该患者对疾病如病毒感染易感或者处于该疾病危险之中。这种量定义为“免疫原性有效量”。在该应用中,精确的量依赖于患者的健康状况、年龄、给药方式、制剂的特性等。将氨基酸序列给予具有适当HLA类型的个体,如对于具有下面氨基酸序列的治疗组合物,应将它们给予所确定的HLA类型个体。
(i)FLDGIDKAQEEHEKYHSNWRAM和HLA-B*4402(ii)GKWSKSSMVGWPAVRERMRRAEP和HLA-C*0701(iii)AQEEEEVGFPVRPQVPLRPMTYK和HLA-B*0702(iv)SFRFGEETTTPSQKQEPIDKENY和HLA-B*4402(v)RIGCQHSRIGIIRQRRARNGASR和HLA-DRB1-0701(vi)KTIHTDNGSNFTSTTVKAACWWA and HLA-C*0501(vii)TGADDTVLEEMNLPGRWKPKMIG和HLA-DRB1-1302(viii)GEETTTPSQKQEPIDKENYPLAS和HLA-A*2402(ix)WPVKTIHTDNGSNFTSTTVKAAC和HLA-B*4402(x)MQRGNFRNQRKTVKCFNCGK和HLA-B*1801已应用了许多不同的HIV感染动物模型系统(Kindt等人,1992)。非人的灵长类动物如黑猩猩和短尾猿(pig-tailed macaque)可被HIV-1感染。尽管在这些系统中CD4+细胞未减少,但这些动物可由病毒进行可探测的感染并可用于确定HIV治疗的功效。小的动物模型包括嵌合模型,该模型包括将人体组织移植到免疫缺陷小鼠中。一种这样的系统是由Mosier等人(1988)发展的hu-PBL-SCID小鼠。另一种是由McCune等人(1988)发展的SCID-hu小鼠。在两个小鼠模型中,SCID-hu小鼠一般是优选的,这是因为在这些动物中的HIV感染与人中的更相似。植入了人肠的SCID-hu小鼠已显示是HIV粘膜传播的体内模型(Gibbons等人,1997)。构建具有人免疫系统的动物的方法描述于美国专利No.5,652,373、5,698,767和5,709,843中。
动物将用本发明的治疗剂进行接种,然后用感染性病毒剂量进行攻击。治疗的功效可由本领域技术人员公知的方法确定。通常,可检验与HIV感染相关的各种参数并在免疫接种和未免疫接种的动物之间进行比较。这种参数包括病毒血症、血液细胞中整合的HIV的探测、CD4+细胞的丧失、HIV颗粒由PBMC的产生等。如果相对于未免疫接种的组在免疫接种的组中HIV感染迹象有显著降低则认为治疗是有效的。
当然,本发明者预期应用本发明作为对人中HIV的治疗。本发明者预期对本发明作为人中的治疗手段的检验将依据标准技术和本领域技术人员公知的指南。人体应用的一个重要方面是对治疗剂产生有效的免疫反应。尽管可进行各种离体检验,例如测量抗-HIV细胞反应,但最终的检验是治疗剂在接受了该治疗剂的个体中至少改善HIV的感染或显著延长AIDS发病的能力。对人中HIV治疗剂功效的监控是本领域技术人员众所周知的,且本发明者不预期本发明将需要发展检验HIV治疗剂功效的新方法。
该氨基酸序列也可用作诊断试剂。例如,本发明的氨基酸序列可用于确定特定个体对采用该氨基酸序列或相关氨基酸序列的治疗方案的易感性,因而可有助于修改现有的治疗方案或确定对患病个体的预后。此外,该氨基酸序列也可用于预测哪些个体将基本不被HIV感染。
诊断方法根据本发明进一步的实施方案,提供了对感染性疾病进行亚分类、预测和监控的方法。
诊断和预后方法一般用从患者获得的生物学样品进行,该生物学样品含有微生物。“样品”指来自个体的怀疑含有微生物或部分(如氨基酸序列或核苷酸序列)的组织或体液样品,该样品包括但不局限于血浆、血清、脊髓液、淋巴液及体外细胞培养物成分的样品。
根据本发明的诊断和预测方法,微生物氨基酸序列的改变可用在此处描述的任何一个方法进行探测。此外,可进行诊断和预测方法以探测微生物氨基酸序列改变的频率或速率。
如在此处所用的,用于本发明上下文中的术语“诊断”或“预测”用于指1)对展示逃避突变的微生物进行分类,2)确定逃避突变的严重性,或3)在治疗前、治疗中和治疗后监控疾病进程。
为了在组织中探测野生型微生物核苷酸或氨基酸序列中的改变,从患者中分离微生物是有用的。浓缩微生物制剂的方法是本领域中公知的,且依赖于分离的微生物类型。
在DNA序列中探测多态的快速初步分析可通过观察一系列核苷酸材料的DNA印迹或RNA印迹而进行,该核苷酸材料已用一种或多种限制性内切酶切割,优选地为已用大量限制性内切酶进行切割。展示杂交片段的RNA或DNA印迹显示可能的突变。如果应用产生非常大片段的限制性内切酶,那么也可应用脉冲场凝胶电泳(PFGE)。
点突变的探测也可通过用本领域中众所周知的技术对微生物序列进行分子克隆和对等位基因进行测序而实现。可选择地,该基因序列可用公知的技术直接从核苷酸序列制剂中扩增。
用于探测基因多态是否存在的一些其他有用的诊断技术包括,但不局限于1)等位基因特异性PCR;2)单链构象分析(SSCA);3)变性梯度凝胶电泳(DGGE);4)RNase保护测定法;5)识别核苷酸错配的蛋白质的应用,如大肠杆菌mutS蛋白质;6)等位基因特异性寡核苷酸(ASO);和7)荧光原位杂交(FISH)。
突变的微生物基因的改变也可通过筛选野生型微生物蛋白质的改变而探测。这种改变可根据常规技术通过氨基酸序列分析来确定。更优选地,抗体(多克隆或单克隆)可用于探测突变的微生物蛋白质或肽中的差异或其不存在性。
对突变等位基因产物特异性的抗体可用于探测突变的微生物氨基酸序列。这种免疫学测定可以以本领域中公知的任何方便形式进行。这些包括蛋白质印迹、免疫组织化学测定和ELISA测定。探测改变的氨基酸序列的任何方法可用于探测野生型氨基酸序列中的改变。
在本发明一个优选的实施方案中,抗体可以与来自溶液的突变氨基酸序列进行免疫沉淀,以及在聚丙烯酰胺凝胶的蛋白质或免疫印迹上与突变的氨基酸序列反应。
涉及探测突变氨基酸序列的方法的优选实施方案包括酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)、免疫放射分析(IRMA)和免疫酶法测定(IEMA),其中包括应用单克隆和/或多克隆抗体的三明治测定法。
抗体制备方法本发明的抗体一般通过用含有本发明氨基酸序列的接种物对哺乳动物进行免疫接种并因而诱导哺乳动物抗体分子而产生,其中该抗体分子具有对免疫接种的氨基酸序列的免疫特异性。然后从哺乳动物中收集抗体分子并用众所周知的技术以想要的程度进行分离以获得IgG组分,该技术例如应用DEAE葡聚糖凝胶或蛋白质G。
用于本发明的诊断方法和系统中的示例性抗体分子是完整的免疫球蛋白分子、基本完整的免疫球蛋白分子和那些含有抗原互补位的免疫球蛋白部分,包括那些本领域中已知为Fab、Fab’、F(ab’)2和F(v)的部分。抗体的Fab和F(ab’)2部分分别通过众所周知的方法用木瓜蛋白酶和胃蛋白酶对基本完整的抗体的蛋白水解反应制备。参见例如美国专利No.4,342,566。Fab’抗体部分也是众所周知的且通过如下步骤从F(ab’)2部分产生,即用巯基乙醇对连接两个重链部分的二硫键进行还原,随后用如试剂碘乙酰胺对结果所得的蛋白质硫醇进行烷基化。含有完整抗体分子的抗体是优选的,且在此处用作示例物。
抗含有多态的氨基酸序列的抗体的制备是本领域中众所周知的。参见Staudt等人,J.Exp.Med.,157687-704(1983)或Sutcliffe,J.G.的教导,如描述于美国专利No.4,900,811中的,在此处将该教导引入作为参考。简言之,为了产生含有多态的本发明氨基酸序列抗体组合物,用有效量的含有多态的本发明氨基酸序列对实验室动物进行免疫学接种,其中该序列一般存在于本发明的疫苗中。然后从哺乳动物中收集因而诱导的抗氨基酸序列的抗体分子,并将那些对含有多态的氨基酸序列为免疫特异性的抗体用众所周知的技术以想要的程度进行分离,该技术如免疫亲和层析。
为了增强抗体的特异性,优选地通过免疫亲和层析用固相附着的免疫多肽对抗体进行纯化。使抗体与固相附着的免疫多肽接触足够的时间,从而使该多肽与抗体分子进行免疫反应以形成固相附着的免疫复合物。结合的抗体可通过标准技术从复合物中分离。
对于含有少于约35个氨基酸残基的氨基酸序列,为了诱导抗体产生的目的优选地是应用与载体结合的肽。可将一个或多个额外的氨基酸残基添加于多肽的氨基-或羧基-末端以有助于多肽与载体的结合。人们已发现在多肽的氨基-或羧基-末端添加半胱氨酸残基对于通过二硫键形成缀合物是特别有用的。然而,也可应用本领域中用于制备缀合物的众所周知的其他方法。本领域中目前已知的通过活化的功能基团进行多肽缀合或偶联的技术是特别适用的。参见如Aurameas等人,Scand.J.Immunol.,第8卷,增刊77-23(1978)和美国专利Nos.4,493,795、3,791,932和3,839,153。此外,可进行位点定向的偶联反应,从而可使偶联后由于多肽的定向而导致的任何活性丧失最小化。参见如Rodwell等人,Biotech.,3889-894(1985)和美国专利No.4,671,958。额外的示例性连接程序包括应用Micheal加成反应产物、应用二醛如戊二醛,Klipstein等人,J.Infect.Dis.,147318-326(1983),等等,或者应用碳二亚胺技术,如应用水溶性碳二亚胺形成与载体连接的酰胺。可选择地,可将异双功能交联剂SPDP(N-琥珀酰亚胺-3-(2-吡啶基二硫代)丙酸)用于对肽进行缀合,在该肽中引入了羧基末端的半胱氨酸。
有用的载体是本领域中众所周知的,且通常是蛋白质自身。这种载体的示例为匙孔血蓝蛋白(KLH)、麻仁球蛋白、甲状腺球蛋白、白蛋白如牛血清白蛋白(BSA)、人血清白蛋白(HSA)、血红细胞如绵羊红细胞(SRBC)、破伤风类毒素、霍乱毒素以及聚氨基酸如聚D-赖氨酸∶D-谷氨酸等。载体的选择更依赖于接种物的最终应用,并基于本发明中未特别涉及的标准。例如,应该选择在进行接种的特定动物中不生成不想要的反应的载体。
本发明的接种物含有如在此处所述有效量和免疫原性量的氨基酸序列,一般作为与载体连接的缀合物。如在此处所述每单位剂量中足以诱导对免疫接种多肽的免疫反应的氨基酸序列的有效量除其他因素之外依赖于接种的动物物种、动物的体重和选择的接种方法,且是本领域中众所周知的。接种物在每次接种(剂量)中一般含有浓度为约10微克-约500毫克的氨基酸序列,优选地为每次剂量约50微克-约50毫克。涉及接种物的术语“单位剂量”指适用于动物的单一剂型的物理离散单位,每一个单位含有预定量的经计算以产生想要的免疫原性作用的活性材料以及所需的稀释剂,即载体或赋形剂。本发明接种物的新单位剂量规格由如下部分指示并直接依赖于如下部分(a)活性材料的独特特征和要实现的特定免疫学作用,和(b)配制这些活性材料以在动物中进行免疫学应用的领域中固有的局限,如在此处详细描述的,这是本发明的特征。
接种物一般通过将氨基酸序列-缀合物在生理学耐受的(可接受的)稀释剂如水、盐水或磷酸缓冲盐水中分散以形成水组合物而从干燥的氨基酸序列缀合物中制备。该接种物也可包括佐剂作为稀释剂的部分。佐剂如完全弗氏佐剂(CFA)、不完全弗氏佐剂(IFA)和明矾是本领域中众所周知的材料,且商业上可从几个来源购得。
这样制备的抗体可用于本发明的诊断方法和系统中以探测体液样品中本发明的氨基酸序列。这种抗体的典型例子为单克隆抗体。
单克隆抗体一般由通过单细胞克隆生产的抗体组成,该单细胞克隆称为杂交瘤细胞,并且仅分泌(产生)一种抗体分子。杂交瘤细胞通过将产生抗体的细胞和骨髓瘤或其他自身永生化的细胞系融合而形成。这种抗体的制备首先由Kohler和Milstein,Nature,256495-497(1975)描述,将该描述引入作为参考。可对这样制备的杂交瘤上清液进行筛选以确定抗体分子的存在,该抗体分子与含有多态的氨基酸序列能进行免疫反应。
试剂盒本发明涉及包含可用于探测含有目标多态的氨基酸序列的特定探针的试剂盒,其中这种探针可为功能化的抗体蛋白质、多克隆抗体、单克隆抗体或这种蛋白质的抗原结合片段。优选地,该氨基酸序列基本与选自SEQ ID NOS.1-33的序列相同。
实施本发明的最好方式本发明的进一步的特征更充分描述于下面非限制性的实施例中。然而,应该理解的是该详细描述仅是为了对本发明进行示例的目的而包括的。绝不应该理解为对本发明在上文中提出的广泛描述的限制。
在下面实施例中未清楚描述的分子生物学方法报道于文献中并是本领域技术人员公知的。描述本技术领域中常规分子生物学、微生物学和重组DNA技术的综合书籍包括如Sambrook等人,Molecular CloningA Laboratory Manual,第二版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,New York(1989);Glover ed.,DNA CloningA Practical Approach,卷I和II,MRL Press,Ltd.,Oxford,英国(1985);和Ausubel,F.,Brent,R.,Kingston,R.E.,Moore,D.D.,Seidman,J.G.,Smith,J.A.,Struhl,K.,Current Protocols inMolecular Biology.Greene Publishing Associates/WileyIntersciences,New York。
实施例1
检查HIV-1反转录酶(RT)下面的实施例以对HIV-1反转录酶(RT)的检查为例阐明了本发明。HIV-1反转录酶(RT)在病毒体中是高度表达的,且在对HIV-1的早期反应中是免疫原性的。本领域的技术人员将理解可将HIV-1 RT替代为其他适当的HIV蛋白质,或者选择用于检查的序列可源自其它病毒或生物。
数据收集检查了西澳大利亚(WA)HIV群体研究中473个参加者中的HIV-1 RT序列与其HLA-A、-B和-DRB1基因型之间的关系。存在于个体中的HLA-A和-B等位基因包括A1、A2、A3、A9、A10、A11、A19、A28、A31、A36、B5、B7、B8、B12、B13、B14、B15、B16、B17、B18、B21、B22、B27、B35、B37、B40、B41、B42、B55、B56、B58、B60和B61。
群体中绝大多数的患者居住于或靠近西澳大利亚的首府Perth,该城市是世界上在地理上最隔离的城市之一。新的HIV-1感染最频繁地从西澳大利亚(53.3%)或澳大利亚其他州(24.3%)获得,而较不经常地从亚洲(8.2%)、非洲(5.1%)、欧洲(4.9%)、北美洲(3.4%)或南美洲(0.8%)获得。参加者具有某些常规收集的人口统计学、临床和实验室数据,包括I型HLA血清学分型和基于II型HLA序列的分型。HIV-1RT原病毒DNA测序在初次实验(at first presentation)时(在185个病例中为任何抗反转录病毒治疗之前)进行,接着在RT抑制剂治疗中进行。该研究包含在多年观察的约2210个患者中收集的数据。
WA群体研究于1983年确立,其是HIV感染的患者的预期观察群体研究。从1983年到1998年,该研究获取了来自西澳大利亚州中所有HIV-感染病例中80%的数据和所有通报的AIDS病例的数据。在医生诊治的门诊病人和住院病人中收集了综合的人口统计学和临床数据并将其输入电子数据库中。记录了所有抗反转录病毒治疗的起止日期。常规实验室检验结果自动从实验室下载并直接进入群体数据库中。在Logistic回归模型中对来自最多473个群体被试者的数据进行了分析,该被试者具有HLA和病毒序列数据。
HLA基因分型应用标准的NIH技术通过微量细胞毒性测定对HLA-A和HLA-B宽等位基因(broad allele)进行了分型。对于该研究,对51个HLA-B5个体和57个HLA-B35个体的HLA-B序列用以前所述的针对第一个内含子双态的引物进行了扩增(参见如N.Cereb和S.Y.Yang,Tissue Antigens 50,74-76(1997)),且将产物通过自动测序进行测序。通过用以前报道的方法进行测序而对HLA-DRB1等位基因进行分型(参见如D.Sayer等人,Tissue Antigens 57,46-54(2001))。
HIV-1 RT测序从棕黄层(buffy coat)提取HIV-1 DNA(QIAMP DNAblood mini kit;Qiagen,Hilden,德国),且通过聚合酶链反应扩增RT的密码子20-227。进行第二轮嵌套PCR,并将PCR产物用Bresatec_纯化柱进行纯化并用373 ABI DNA测序仪进行正向和反向测序。利用软件包Factura和MT Navigator(PE Biosystems)手工对原始序列进行编辑。
定量HIV RNA测定直到1999年11月所应用的病毒负载测定一直都是HIV AmplicorTM(Roche,Branchburg,美国,探测下限为400个拷贝/mL)。其后应用探测下限为50个拷贝/mL的Roche Amplicor HIVmonitor version 1.5,即Ultrasehsitive。病毒负载测定常规地在所有患者中至少每3个月进行一次。
统计学分析应用WA HIV群体研究数据库以进行基于Fisher精确性检验和Logistic回归模型的分析,将标准公式用于进行能力(power)的计算(参见如J.H.Zar,Biostatistical Analysis,Bette Kurtz,Ed.(Prentice-Hall International,New Jersey,1984),chap.22.11)。
然后用Fisher精确性检验单独估计单个协变量与研究的氨基酸位置的多态的关联性,并仅将那些具有单变量P-值≤0.1的包括进来以用于进一步分析。如果由该方法选择的协变量超过患者数目的10%,则应用基于标准Logistic回归的正向逐步程序(forward stepwiseprocedure)用于将该数目减少到10%,并应用标准的反向消除程序直到所有协变量具有P-值≤0.1。
例如,用Fisher精确性检验单独估计协变量与I135的关联性,并仅将那些具有单变量P-值≤0.1的包括进来以用于进一步分析。去除的等位基因为A1、A2、A3、A9、A11、A19、A28、B7、B8、B13、B14、B15、B16、B21、B22、B27和B35。
由于在位置I135选择的协变量数目少于患者数目的10%,所以不需要正向选择。然后在位置I135进行标准的反向消除程序。将具有最大P-值的协变量去除并修改Logistic模型。对此进行重复直到所有协变量均具有小于0.1的P-值,从而去除了HLA等位基因B12、B17和B40。
为了在一些逻辑回归中容纳相对小的样品,精确的P-值基于随机化检验而不是通常的大样本逼近(参见如F.L.Ramsey和D.W.Schafer,The statistical sleuth.A course in methods of data analysis,(Duxbury Press,1997),第2章)。在该程序中,在患者中随机排列协变量组并对每一个排列计算标准的检验值与多态的关联性。该程序对每一个模型生成了1000个随机排列,p值为基于比与实际数据相应的检验值更极端的检验值的适当百分比。将P-值≤0.05认为是显著的。
例如,在位置I135去除了等位基因HLA-A10和-B18,剩下HLA-B5与I135显著关联。
进行分析以确定在相应的已知CTL表位中随机发现至少15个显著正关联的概率。如果显著关联在残基上随机发生,那么在局限于该等位基因的已知CTL表位中HLA关联性发生的概率等于该表位中所有残基的相对百分比。因而已知表位中显著关联的总数目是不同的二项式变量的总和,该变量的分布可通过例如模拟而进行估计。与15个观察值相比,基于随机假说可以预测在已知的表位中仅有4.27个显著正关联(P值约<0.001)。
多重比较的校正因子如随后所描述的那样生成,且校正的精确P-值由函数1-(1-P)x确定,其中x=校正因子。所有位置上所有关联的总P-值通过考虑每一个位置上单个检验的总和相对于从随机化的数据集合中获得的总和值的极端性而获得。
对于病毒负载的Cox proportional hazards models,HLA关联性必须具有至少4个代表HLA等位基因对非-HLA等位基因的个体,该个体具有或不具有包括的多态(n=106)。所测量的与最初治疗前HIV-1 RT测序最接近的病毒负载被采用。
HIV-1 RT氨基酸序列中的多态受残基的功能重要性限制为了确定研究的群体中HIV-1 RT序列中的多态是随机分布还是在优选位点发生的,将群体一致序列用作参考序列,且该一致序列是通过在任何抗反转录病毒治疗(n=185)前在所有初始HIV-1 RT氨基酸序列中22-227(编码系统参考B.T.M.Korber等人,HIV MolecularImmunology Database 1999(Theoretical Biology and Biophysics,New Mexico,1999))的每一个位置上分配最常见的氨基酸而确定。该群体一致序列在RT中除122(赖氨酸而不是谷氨酸)和214(苯丙氨酸而不是亮氨酸)之外的所有位置上与B进化枝参考序列HIV-1 HXB2相匹配(L.Ratner等人,Nature 313,277-284(1985))。对每一个残基计算了治疗前初始HIV-1 RT序列中具有不同氨基酸的患者与具有一致序列的患者的比例。对该多态率和HIV-1 RT中位置95-202的氨基酸的已知功能特征(稳定性、有功能的、催化的或外部的)之间的关系进行了检查。
单个残基上的多态率是高度可变的,范围为0%-60%,且似乎与该位点改变的预期病毒耐受性相关联(图1)。例如,HIV-1 RT中3个关键的催化残基(0.53%)、稳定性残基(n=37,1.06%)和有功能的残基(n=11,3.05%)的多态率比外部残基(n=10,5.95%)的低(P=0.0009,Wilcoxon)。
HIV-1 RT中已知和推定的CTL表位中或附近残基的多态是I型HLA特异性的由于抗原特异性CTL反应是I型HLA限定的,所以对作为CTL逃避突变结果的HIV-1 RT中的多态进行检查以确定它们在群体中是否是I型HLA等位基因特异性的及是否存在于CTL表位中或附近的残基中。因此检查了多变量Logistic回归模型中HLA-A和HLA-B宽等位基因(作为解释性的协变量)和HIV-1 RT中多态(作为结果或反应变量)之间的关系。将每一个患者中最近的HIV-1 RT序列用于这些分析中(n=473)。在单独的模型中检查了HIV-1 RT中单个的氨基酸残基。在单个残基上的单独的模型确定了协变量(HLA等位基因)和结果(仅仅该残基的多态)之间的关系并给出了关联性的几率(OR)。
探测这些模型中任何单个等位基因作用的统计学能力依赖于群体中该等位基因的频率和所检查的该氨基酸位置的多态频率。对每一个位置进行了初始的能力计算以确定对于哪些等位基因存在探测关联性(如果其存在时)的合理能力(探测OR>2.0或<0.5需至少30%的能力)。在随后的分析中在每一个病毒残基上仅仅检查了那些具有与P≤0.1多态单变量关联性的HLA等位基因(1-10个HLA等位基因,在72个位置上平均为3.15个等位基因)。对Logistic回归模型中的最终协变量也进行了标准的正向选择和反向消除程序。将基于Logistic模型的排列检验用于确定关联性的精确P-值(F.L.Ramsey和D.W.Schafer,TheStatistical Sleuth,A course in methods of data analysis,(DuxburyPress,1997),第二章)。
将低于30%能力的HLA等位基因去除。在位置135去除的等位基因为A31、A36、B42、B55、B56、B58和B61。重要的是要注意用于探测负关联性的能力比用于探测正关联性的低。例如,在10.9的平均HLA频率和4.0%的平均多态时,探测2.0的OR(即正关联性)的能力为30%,但探测等价的0.5OR的负关联性的能力仅为5.6%。
将所有单个模型中的结果一起绘制于位置20-227的HIV-1 RT氨基酸序列图中(图2)。在HIV-1 RT单个残基的多态和特定的HLA-A或-B等位基因之间有64个正关联性(即OR>1)(在所有情况下P≤0.05)(图2,B框)。对特定HLA等位基因特异性的多态在序列上簇聚。例如,HLA-B7与位置158(OR=4)、162(OR=10)、165(OR=2)和169(OR=13)的多态相关联,这些位置均在已知的HLA-B7限定的CTL表位RT(156-165)中或其侧面(C.M.Hay等人,J Virol 73,5509-5519(1999);L.Menendez-Arias,A.Mas,E.Domingo,Viral Immunol11,167-181(1988);C.Brander和B.D.Walker,HIV molecularimmunology database,B.T.M.Korber等人,Eds.New Mexico(1997))。对于HLA-B12(在位置100和102、115和118、203和211)、HLA-B35(121和123)、HLA-B18(在135和142)和HLA-B15(在207、211和214)也有关联性的簇聚。
在29个CTL表位中的残基上存在15个I型HLA等位基因相关联的多态(图2,B框,以灰色文本显示),其中该残基是已表征的、已发表的且已知局限于那些等位基因。这些残基的4个(101、135、165和166)位于CTL表位中的主要锚定位置(分别受限于HLA-A3(C.Brander和P.J.R.Goulder,HIV Molecular Immunology 2000,B.T.M.Korber等人,Eds.(Theoretical Biology and Biophysics,New Mexico,2000),chap.Part 1.综述文章),HLA-B51(L.Menendez-Arias,A.Mas,E.Domingo,Viral Immunol 11,167-181(1988);N.V.Sipsas等人,J Clin Invest 99,752-762(1997))/HLA-B*5101(H.Tomiyama等人,Hum Immunol 60,177-186(1999)),HLA-B7(C.M.Hay等人,J Virol 73,5509-5519(1999);L.Menendez-Arias,A.Mas,E.Domingo,Viral Immunol 11,167-181(1988);C.Brander和B.D.Walker,HIV molecular immunology database,B.T.M.Korber等人,Eds.New Mexico(1997))和HLA-A11(Q.J.Zhang,R.Gavioli,G.Klein,M.G.Masucci,Proc Natl.Acad.Sci.U.S.A90,2217-2221(1993))),在该位置的突变将消除与HLA分子的结合。剩余的11个关联性位于发表的CTL表位的非主要锚定位置。还有5个位于CTL表位侧面且局限于相同的HLA等位基因的HLA-等位基因特异性多态残基(图2,以黑色文本显示)。位于已知的HLA-A2和HLA-A3限定的表位侧面的位置26和28的残基是预测的蛋白体切割位点(C.Kuttler等人,J Mol Biol 298,417-429(2000))。如果显著的正关联性在残基中随机发生,那么预期仅有4.18将位于相应的已知CTL表位中。而观察到的数目15显著高于该值(P<0.0004)。此外,对于具有HIV-1 RT该片段中表位的11个HLA特异性中的10个均观察到比该预期高的关联性。
进行了最后一组分析以鉴定在对在整个分析上进行独立比较的有效数字进行校正后,这些显著的HLA关联性中的哪些仍然是显著的。将HLA基因型随机在个体中进行再分配,并将以前描述的分析运行1000次以确定对于每一个HLA等位基因单独随机预测的错误正关联的数目。将获得的P-值≤0.05的平均数目乘以20(即1/0.05)以估计所进行的独立检验的有效数字,该有效数字用作对每一个HLA等位基因的多重比较的校正因子。校正因子对于正关联性的范围为5.0(HLA-B37)-92.2(HLA-B7),对于负关联性为0.8-42.8。在该校正后仍然有14个关联性的P≤0.05(图2,框中的HLA关联性)。
也将随机化的数据组用于生成对所有模型中所有位置的所有HLA关联性的显著性的总体检验,其中考虑了多重比较。该检验具有P-值≤0.001。
分子HLA亚分型可增加多态与HLA等位基因之间的关联性强度血清学定义的I型HLA等位基因具有亚型,该亚型由基于DNA序列的高分辨率分型定义,且在影响表位结合的肽结合区中具有氨基酸序列差异。对于这些等位基因,可以预期CTL逃避突变与分子亚型的关联性将比与宽HLA等位基因的更密切。作为例子,检查了2个与宽HLA等位基因的强关联,该HLA等位基因具有充分体现的断裂点、位于已知CTL表位的位点中且在分子水平上该表位的HLA限制性是已知的。与HLA-B5的存在相关联的位置135(I135x,其中I是一致氨基酸异亮氨酸而x是任何其他氨基酸)的多态是发表的表位中残基上最强的正HLA关联性(OR=17,P<0.001)。位于特定地受限于HLA-B*3501的表位中的D177x与HLA-B35相关联(OR=4,P<0.001)(图2)。
I135x与HLA-B*5101相关联异亮氨酸是一致性HIV-1 RT序列的位置135的氨基酸。它是已知的HLA-B5(*5101)限制的8聚体CTL表位RT(128-135 IIIB)的第8个氨基酸和锚定残基。表位中其他7个氨基酸残基中的6个是RT蛋白质重要的稳定性残基且在群体中是相对不变化的(图1、图2)。在所有52个HLA-B5阳性患者中,44个(85%)在位置135具有异亮氨酸的替代。在421个非-HLA-B5个体中,仅有123个(29%)具有该改变(P<0.0001,Fisher精确性检验)。
在具有HLA-B5等位基因的群体中进行DNA测序以对所有52个个体进行亚分型(图3)。一个HLA-B5患者不具有进行高分辨率HLA分型所必需的足够DNA样品。剩余的51个HLA-B5患者中的40个具有HLA-B*5101亚型。这些40个HLA-B*5101患者中除1个之外(98%)均具有I135x(在25个病例中为I135T、5个病例中为I135V、剩余的9个病例中为I135L/M/R或混合种类)。相反,群体中432个非-HLA-B*5101患者中仅有127个(29%)具有I135x(P<0.0001,Fisher精确性检验)。对于大多数常见的从异亮氨酸到苏氨酸的替代,突变表位(TAFTIPST)的解离值的预测半衰期与一致序列的(TAFTIPSI)440相比为11,从而显示在体内与HLA分子的结合取消了。该替代已显示在使目标细胞敏化以在体外由CTL进行50%的裂解(SD50)所需要的肽浓度必须有100-倍的增加(N.V.Sipsas等人,J Clin Invest 99,752-762(1997))。与一致表位相比,位置135上较不常见的异亮氨酸到缬氨酸的替代导致SD50的10-倍增加(N.V.Sipsas等人,J Clin Invest 99,752-762(1997))。
在位置135上与一致序列无差别的单个HLA-B*5101患者是在急性HIV血清转变中给予高活性抗反转录病毒治疗(HAART)的患者。该患者在病毒传播期间显示6.5log拷贝/mL的血浆HIV RNA浓度(病毒负载)和阴性HIV抗体检验。他不具有血清转变疾病的症状。在HAART治疗开始后,病毒负载在以后6个月中逐渐降低到不可探测的水平,且进一步的10个月治疗中保持不可探测的水平直到现在。
具有HLA-B*5108亚型的1个患者和具有HLA-B*5201亚型的8个患者中的4个都不具有I135x,从而提示这些亚型可能不与RT(128-135 IIIB)表位结合。这两个亚型与HLA-B*5101仅有2个氨基酸的差异(HLA-B*5108在HLA氨基酸序列的位置152和156,HLA-B*5201在位置63和67)(IMGT/HLA序列数据库;http//www.ebi.ac.uk/imgt/hla)。剩余的2个患者通过测序显示为HLA-B*5301(图3)。
D177x与HLA-B*3501相关联HLA-B35亚型HLA-B*3501与HLA-B*3502、-B*3503、-B*3504在肽结合区仅有1个或2个氨基酸的差异,而这些亚型的不同表位特异性对HIV-1感染的临床发展具有惊人的作用。表位RT(175-183)与HLA-B*3501结合,且含有与对于其他HLA-B35亚型预测的不同的结合基元(http//www.uni-teubingen.de/uni/kxi)。与416个非-HLA-B35个体中有84个(20%)相比,在研究群体中57个HLA-B35阳性的个体中,26个(46%)具有D177x(P<0.0001,Fisher精确性检验)。然而,与440个非-HLA-B*3501患者中有86个(20%)相比,33个HLA-B*3501患者中有19个(58%)具有D177x(P<0.0001,Fisher精确性检验)。因而,考虑了HLA-B35的分子亚型后,多态的单变量相对风险从2.7增加到4.7。在HIV-1 RT、I69x、D121x和D123x中对其他HLA-B35相关联的多态重复进行上述分析,在所有情况下,通过考虑HLA-B35的分子亚型增强了所述关联性。
HIV-1 RT中的HLA-特异性多态是随时间选择的为了确定HLA-特异性多态随时间选择是否是可证明的,对所有个体初始序列检查了最近的HIV-1 RT序列中存在的HLA-特异性变异的数量。对于64个HLA-特异性多态中的61个,具有特定氨基酸多态的个体数目随观察时间增加。在这些病例的52个中,与所有其他无等位基因的相比,在那些具有与多态相关联的HLA等位基因的个体中该增加是显著更高的(P=0.008,符号检验法(sign test)),如表1所示。

表1HIV-1 RT中的HLA-特异性多态与在其他位置的次级变化相关联。
HIV-1 p24表位中初级CTL逃避突变已显示可在病毒中诱导可能的补偿突变。为了确定与初级(推定的)CTL逃避突变伴随的次级或补偿突变在群体水平上是否是明显的,将在HIV-1 RT所有“其他”位置上的多态连同HLA等位基因一起包括进来作为所有多变量Logistic回归模型中的协变量。64个阳性HLA-特异性多态中除2个之外都与其他位置上的一个或多个多态相关联。
HIV-1 RT多态和HLA等位基因之间的负关联性。
在前文所述的多重Logistic回归模型中,在25个残基上多态是HLA-特异性的但具有OR<1,从而显示“负”关联性。例如,在HIV-1 RT的位置32、101、122、169和210中一致氨基酸的改变与HLA-A2的存在负关联(在所有情况下P≤0.05)。这意味着与群体中所有非-HLA-A2个体相比,HLA-A2个体显著更不可能在这些位点上发生一致序列的变化。将阴性的OR取倒数(1/OR)以得到比值比>1的值,该值表示不具有多态(图2,C框)。HLA-A2是我们群体中最常见的HLA-A等位基因,且具有25个负关联性中的5个(与64个正关联性中的3个相比)。类似地,与非-HLA-B7个体相比,具有HLA-B7的个体更可能在位置118、178和208上具有一致氨基酸。根据这一分析,探测负关联性的能力低于探测正关联性的能力。例如,在10.9的平均HLA频率和4.0%的平均多态时,探测2.0的OR(即正关联性)的能力为30%,但探测等价的0.5OR的负关联性的能力仅为5.6%。
HIV-1 RT中的HLA-特异性多态与较高的治疗前病毒负载相关联。
由于HIV-1病毒负载已显示与HIV-特异性CTL反应成反比例,所以进行了研究以确定推定的CTL逃避突变的存在是否与增加的病毒负载相关联。选择单个HLA特异性多态进行了检查。考虑了锚定残基上的多态。HLA-A11相关联的K166x位于HLA-A11表位RT(158-166 LAI)的锚定位置,且具有或不具有多态的HLA-A11组具有足以进行比较的数目。为了排除抗反转录病毒治疗的作用,仅对在治疗前具有HIV-1 RT序列和病毒负载结果的患者进行了分析。将在HIV-1 RT测序后获得的最接近的治疗前病毒负载测量在所有组之间进行比较。在HLA-A11个体中(n=19),那些具有K166x的个体中的治疗前病毒负载中数为5.54+/-0.46log cps/mL血浆(中值+/-SD),而在无K166x的那些个体中为4.31+/-0.82log cps/mL(n=15,P=0.045,Wilcoxon)。无K166x的HLA-A11个体中的病毒负载中数与非-HLA-A11个体中的无显著差异(数据未显示)。
位于CTL表位中但不在初级锚定位置上的第二个推定的CTL逃避突变显示相似的作用。具有S162x的HLA-B7患者(n=18)中治疗前的病毒负载中值(5.41+/-1.04log cps/mL)显著高于那些无S162x患者中的(n=15,4.57+/-0.83log cps/mL,P=0.046,Wilcoxon)。对于HLA-A11和HLA-B7两组,在那些具有和不具有这些推定的CTL逃避突变的组之间,平均的CD4 T细胞计数和患有AIDS的个体的基线百分比无显著差异。
然后对在群体水平上影响病毒负载的因素进行了全球分析。实施了Cox proportional hazards model,其中治疗前的病毒负载是结果,且所有HLA等位基因和HLA-特异性多态是离散的协变量。当将HLA等位基因和多态包括进来作为相互作用条件时(即多态和其正关联的HLA等位基因,或者一致氨基酸和负关联的HLA等位基因),则改善了模型的总体显著性值。前一个模型的对数似然值(likelihood)为-32.0765,自由度为40,后一个模型的对数似然值为-15.4165,自由度为25。模型中的改善是用x2分布计算的,取特殊值为上述对数似然值差的2倍,自由度为上述自由度的差(33.32-x(15),得到了0.004的P-值)。这提示在这些分析中推定地鉴定的病毒CTL逃避突变在个体中的存在以比HLA等位基因或病毒多态本身更高的程度解释了群体中病毒负载的可变性。
HIV-1 RT中的HLA-DRB1等位基因特异性多态—病毒逃避抗-HIVCD4 T辅助细胞反应的证据?我们重复了多态的Logistic回归模型,将HLA-DRB1宽等位基因作为协变量,也考虑了HLA-A和-B等位基因和其他位置的多态。在本分析中仅包括了群体中具有DRB1等位基因的患者,该DRB1等位基因由基于DNA序列的分型所确定。在位置20和227之间有13个与HLA-DRB1等位基因显著相关联的多态位点。现有技术中,在HIV-1 RT的该区段仅对5个T辅助细胞表位进行了作图(A.S.De Groot等人,J ofInfectious Diseases 164,1058-1065(1991);S.H.Van der Burg等人,J Immunol 162,152-160(1999);F.Manca等人,J of Acq.Imm.Def.Syn. & Hum.R9,227-237(1995);F.Manca等人,EurJ Immunol 25,1217-1223(1995)),且仅对一个表位,即RT(171-190)确定了HLA-DRB1等位基因特异性(S.H.Van der Burg等人,J Immunol162,152-160(1999))。5个已知的CD4 T辅助细胞表位中的4个涵盖在此处描述的模型中发现的HLA-DRB1等位基因-特异性多态位点。这些分析在RT(171-190)中没有探测到HLA-DRB1关联性。有10个HLA-DRB1相关联的多态不位于已知的T辅助细胞表位中。
讨论根据这些分析,HIV-1 RT在分离群体中是相对保守的,然而,即使在稳定的地理隔离的HIV感染人群中也有HIV-1 RT的序列多样性。在该研究中将群体一致序列用作总体上与该群体最适合的假定野生型序列,且该序列几乎与B进化枝参考序列HXB2-RT相同。然而,在该研究群体中,该一致序列的改变即使在HIV-1 RT的某一区段中也是明显的。在此处给出的发现提示该多样性是至少两个竞争性的进化压力的净结果,该进化压力选择或防止每一个氨基酸的改变。最重要的是维持病毒功能完整性的需要。受到这一基本限制束缚,病毒多态的强预报器是宿主HLA。
在HIV-1 RT中有64个(经常簇聚的)与特定HLA-A或HLA-B等位基因相关联的多态。多态存在于发表的CTL表位中或其附近的位点上,且与已知限定这些表位的HLA等位基因相关联。该相关性自身是统计学显著的,且几个相关性在对整个分子的多重比较进行严格校正之后仍然是显著的。特定例子如HLA-B*5101相关联的I135x的详细特征高度提示了CTL逃避突变影响HLA-肽的结合。CTL表位的非主要锚定残基上的多态如HLA-B*3501相关联的D177x、HLA-B7相关联的S162x和其他可赋予病毒生存优势,这是通过破坏T细胞受体-肽识别、对前体蛋白质的表位加工或通过诱导拮抗性CTL反应来实现的。CTL表位侧面残基上的5个HLA-特异性多态可能显示了通过阻断蛋白体肽的切割而导致病毒逃避。这种逃避形式特别难以用标准技术进行鉴定,该技术仅应用表位肽测量CTL反应。随时间而增加的HLA-特异性多态与其他位置上的次级改变相关联,且是群体水平上病毒负载的预兆。假定存在对其他HIV-1基因中表位的多克隆免疫反应和对病毒负载的其他独立的影响如CCR5多态,那么单个残基改变对病毒负载的作用尤其是显著的。这些数据一起提示在此处于HIV-1 RT中鉴定的HLA-特异性多态代表个体中体内CTL逃避突变的净作用。位于发表的CTL表位外的那些多态可暗示新的或推定的CTL表位定位于何处。非常强的(具有高的OR)并且是簇聚的或在对多重比较进行校正后仍然显著的(如2,在框中显示)HLA关联性极可能代表尚未定义的CTL表位中的病毒逃避突变。
CTL逃避突变已在具有HLA-B8(最常见的)、HLA-B44、HLA-B27、HLA-A11和HLA-A3的个体中进行了充分的表征,该个体由于窄范围的寡克隆CTL反应因而是更加易于逃避的。这些数据提示CTL逃避突变是常见和广泛分布的,该突变由限制于比已在个体病例中研究的更广范围的HLA等位基因的反应进行选择。尽管在该研究中许多HLA-特异性多态随时间而增加,但一些存在于治疗前的初始HIV-1 RT序列中且可反映病毒的效应,而且已成为在传播中或在急性感染的早期CTL反应中被选择的变体(图1)。通过在高度病毒血症的急性感染中应用HAART可区分无I135x的单个HLA-B*5101患者。该患者在感染的最初时期不显示症状,从而提示他尚未开始CTL反应。假定免疫选择压力减少或消除,从而说明I135x是在急性CTL反应中选择的,而不是在HLA-B*5101个体中在传播或慢性感染中选择的。对CTL逃避变体的保护可有助于HAART在急性HIV感染中的作用,从而导致更强的慢性抑制性CTL反应,该反应迄今为止主要归因于HIV-1特异性CD4 T辅助细胞的保持。
HLA等位基因也与某些残基上缺少多态相关联,包括在不具有功能限制的残基上(图2),且这些关联性独立地对病毒负载的综合模型有贡献。与在个体中导致可证实的逃避的时间依赖性正免疫选择不同,负免疫选择有利于体内野生型病毒的保持,从而仅在群体水平上是明显的。可能的是一致序列或野生型病毒原始地适应最经常遇到的CTL反应(即那些受限于宿主群体中最常见或进化上保守的HLA等位基因的)。对于HIV-1,这将至少部分地说明HIV-1进化枝的差异。群体适应也可解释在免疫逃避的重要作用的研究中为什么没有证明限制于常见等位基因HLA-A*0201的CTL表位中逃避多态的选择,以及为什么在HIV-1中仅对令人惊讶地少的HLA-A2和HLA-A1限定的表位进行了作图。此外,对暴露于HIV-1的血清阴性的个体的研究提示CTL反应可改变病毒感染性和对确立的初级HIV-1感染的易感性。与天然HIV-1抗性或易感性相关联的I型HLA等位基因在人种不同的群体中有差异。这在一定程度上可反映不同群体中共有的HLA等位基因中的差异和“群体适应的”一致病毒可适应于个体的程度。
此处对HIV-1 RT中13个HLA-DRB1特异性多态的证明(对HLA-A和HLA-B关联性和次级多态进行了调整)可支持人HIV-1感染中CD4 T辅助细胞逃避突变的概率。在HIV-1 RT中发表了相对少的T辅助细胞表位,且其II型HLA限定性未定义,从而难以估计这些结果是否与逃避突变的T辅助细胞选择相一致。然而,II型HLA限定的CD4 T辅助细胞反应在HIV-1控制中有重要的作用,且在II型HLA等位基因和HIV疾病易感性和进展(包括在HAART后)之间有几个已报道的关联性。
本研究中基于群体的方法揭示了正选择力和负选择力如何在单个残基上进行竞争以驱动最初的和当前的病毒体内进化。考虑到在这种分析中减少观察到显著HLA关联性的可能性的因素,这些结果尤其是值得注意的。首先,探测关联性的能力对于所有HLA等位基因/病毒残基组合不是恒定的。需要大数目的个体以观察到在某些残基上的任何多态,该残基处于针对突变的免疫压力下但具有强的功能限制,或者具有任何稀有的与HLA等位基因的关联性。正式的能力计算法的应用鉴定了那些不可排除的HLA关联性,且需要检查较大的数据组。其次,HLA等位基因的分子亚型预测了其体内结合性质,如通过高分辨率的HLA分型增强HLA-B5和I135x及HLA-A35和D177x之间的关联性所示的。其他具有相似频率的多重断裂的等位基因(如HLA-A10或HLA-A19)可具有不可探测的关联性,这是因为仅仅考虑了宽的等位基因。此外,在相同病毒残基上具有相反作用的分子断裂(split)将消除与宽等位基因的任何关联性。最后,发表的表位更可能位于保守区域中,这是因为研究倾向于应用实验室参考种类作为目标抗原,且保守区域更可能具有可测量的体内免疫反应。相反,该方法优先探测可变区中推定的免疫表位,从而使其与标准的表位作图方法互补。患者数目的不足、基于分子的HLA分型的缺乏和保守区中已知表位的缺乏均可导致免疫表位中未探测到“预期的”HLA-特异性多态,且可导致在一些情况下低估已证明的关联性的强度(OR)。
作为与多个变量(HLA等位基因)和在多个残基上进行比较的结果,随机关联性的生成可潜在地妨碍这种分析,尽管能力计算法和其他筛选程序在相当程度上限制了检查的等位基因和位置数目。在多变量Logistic回归模型中生成的P-值对检查的残基数目校正的程度将依赖于基因的大小,其中该基因是任意选择来进行研究的。通过该校正,该方法将丧失探测与选择的基因区域大小成正比例的关联性的能力,从而降低错误的正关联性(较高的特异性)但可能会丢失真正的正关联性(较低的灵敏性)。这些HIV-1 RT分析提供了未对多重比较进行校正的P-值的等级,从而反映了关联性强度的等级。独立的生物学确定性(validation)而不是统计学平均值将最好地确定怎样的p-值截止点(cut-offs)对于灵敏性或特异性是最适的。如果要进行校正(以得到高特异性),那么进行的随机化程序使得能够估计整个分析中有效的独立比较的数目。那些具有可经受该严格校正的P-值的HLA关联性已通过这些方法而变得突出(图2,框中的关联性)。这些高度可靠的关联性代表在HIV-1 RT中对新表位进行作图的起始点。
根据某些HLA和HIV-1疾病进展之间已知的关联性,HLA等位基因频率可在群体水平上影响“野生型”HIV-1的适应。然而,体内进化在具有不同HLA的个体中进行。该分析显示具有其相应HLA-特异性病毒多态(或一致序列)的HLA等位基因的存在比HLA等位基因自身更加是病毒负载的前兆。它也表明CTL反应的宽度确定了病毒逃避的风险以及由此导致的临床发展的风险。窄的单特异性反应(如在HLA-B*5701长期非发展型个体(non-progressors)中观察到的)可为保护性的,但也可在具有有害HLA等位基因HLA-B8的个体中增加病毒逃避的风险。已显示3个I型HLA座位杂合性的增加可预示AIDS的缓慢进展,其中所述增加可预示更宽的多克隆反应。成功的病毒CTL逃避突变依赖于在适当的残基对突变具有低的功能障碍,因而它可能是宿主表位特异性CTL反应的宽度和那些表位上的重要的病毒功能限制性之间的平衡结果。因此,窄的CTL反应如果针对保守的表位则可为保护性的,但如果针对易于变异的表位则不是保护性的或可为有害的。因此一次对推定的表位范围和观察到的该表位在群体中的多态进行作图的能力是非常有用的。将来对HIV-1 RT的分析也应在模型中整合反转录酶抑制剂作为协变量,以检查药物诱导的初级或补偿突变和HLA-关联的初级或次级多态之间的相互作用。如果免疫压力和抗反转录病毒药物在病毒序列中的位点上进行竞争,那么在患者中可观察到对药物抗性和反应的增强或减弱趋势,具体依赖于其HLA基因型。如果对免疫压力和药物压力之间的协同或拮抗相互作用有了更好的理解,那么可改进抗反转录病毒治疗的个体化。正是因为这些方法已鉴定了HIV-1 RT中推定的免疫表位的位置,所以可用相同的途径对其他HIV-1蛋白质或来自其他微生物的蛋白质中的候选表位进行筛选,然后在体外或体内用表位特异性免疫反应的标准测定法对其进行证实。在HIV包膜中,也可考虑与抗-HIV抗体反应、CCR5和CXCR4基因型及任何其他基因多态相关联的作用,其中该基因编码导向包膜蛋白质的产物。
实施例2
HIV-1 RT和蛋白酶氨基酸序列两者中的多态在本研究中用上述方法检查了HIV-1蛋白酶。特别地,本方法检查了在HIV-1 RT和蛋白酶两者中,宿主CTL压力和药物压力在特定的位点是竞争还是协同,从而以特异于给定HLA类型个体的方式影响药物抗性途径。
对从HIV-1感染的550个个体获得的大批HIV-1 RT和蛋白酶原病毒DNA序列进行了分析。一次性检查了单个氨基酸位置。确定了每一个位置的一致氨基酸,并将其与存在于每一个个体自身病毒序列的相应位置的氨基酸进行了比较。实施了对单个残基(如HIV-1 RT的残基184,一致序列中为甲硫氨酸)的多变量分析,其中目标结果是特定多态(M184V)的存在与否或一致序列的任何改变(M184x)。然后确定了该结果和协变量(如个体所用的抗反转录病毒药物和/或其HLA类型)之间关联性的统计学显著性。应用如前所述的模型选择步骤,对构成全长HIV-1 RT和蛋白酶蛋白质的每一个残基重复该过程。
研究群体研究群体取自在文中别处描述的西澳大利亚(WA)HIV群体研究。记录了所有抗反转录病毒治疗的起止日期。从1983年开始在初次实验时已常规地进行HLA-A和HLA-B基因分型。从1995年开始在初次实验时(如果可能则在治疗之前)和在抗反转录病毒治疗的常规临床管理中对HIV-1 RT原病毒DNA进行了测序。HIV-1蛋白酶测序开始于1997年。本研究中的总群体包含550个个体。所有个体均具有至少1个记录的HIV-1 RT序列,且419个个体具有可用于分析的蛋白酶序列。
统计学方法所有分析均如上所述进行。将具有标准HXB2编码和比对的HIV-1 RT(20-227)和蛋白酶(1-99)的群体一致序列用作所有分析中的参考序列。在HIV-1 RT中,群体一致序列与B进化枝参考序列HIV-1 HXB2在除122(赖氨酸而不是谷氨酸)和214(苯丙氨酸而不是亮氨酸)之外的所有位置上匹配。在HIV-1蛋白酶中,一致序列在位置37(天冬酰胺而不是丝氨酸)和63(脯氨酸而不是赖氨酸)上不同。
进行能力计算以将分析仅局限于那些位置、药物和HLA等位基因上,对于这些位置、药物和HLA等位基因至少有30%的能力以探测OR>2(正关联性)或<0.5(负关联性)且p-值<0.05。然后估计单独的协变量与突变/替代的单变量关联性,且如果p-值>0.1,即将其去除,然后进行正向选择和反向消除程序。对每一个关联性确定精确的p-值。最后,运用随机化或靴带法(bootstrap)确定校正因子以使最终(HLA)关联性根据多重比较进行调节。
HLA基因分型所有HLA-A和-B宽等位基因均用标准NIH技术通过微量细胞毒测定法进行分型。
HIV-1 RT和蛋白酶测序从棕黄层(buffy coat)提取HIV-1 DNA(QIAMP DNA blood mini kit;Qiagen,Hilden,德国),且通过聚合酶链反应扩增RT的密码子20-227。进行第二轮嵌套PCR,并将PCR产物用Bresatec_纯化柱进行纯化并用373 ABI DNA测序仪在正向和反向测序。利用软件包Factura和MT Navigator(PE Biosystems)手工对原始序列进行编辑。
在群体水平上对HIV-1序列中抗反转录病毒药物抗性突变进行选择。
对于本检查仅选择充分表征的药物抗性突变。在群体中273个具有可用的治疗前HIV-1 RT序列的个体中,12个(4.4%)含有HIV-1 RT初级和/或次级突变抗性突变。在168个具有可用的治疗前蛋白酶序列的个体中,49个(29.2%)具有蛋白酶初级抗性突变。对于那些具有已知血清转变日期的个体,从血清转变到治疗前初始序列的平均时间为5.7年。
然后检查所收集的整个群体的序列。这些个体中的288个(52.4%)在过去或现在已用抗反转录病毒药物进行了治疗,52.0%使用了NRTIs、8.2%使用了NNRTIs和16.4%使用了PIs。对于一次在一个位置实施的每一个Logistic回归模型,仅将药物抗性特征性的特定氨基酸替代认为是结果(outcome)。对每一个个体的所有后续序列进行了分析,该分析对于每一个体进行的平均跨度时间为1.9年。将最早存在的抗性突变记录为正结果,将所有后续的序列弃去,并将在结果出现之前的所有药物处理均输入作为协变量。如果在任何序列中未发展突变则将结果记录为负的。
在33.6%的被试者中于治疗后HIV-1 RT序列中探测到了初级和/或次级药物抗性突变。以足以在Logistic回归分析中进行检查的频率被探测到的突变包括M41L、D67N、K70R、L74V、K103N、Y181C/I、M184V、G190A/S、L210W、T215Y和K219Q/E,同时K65R、75、V108I、Q151M和P225H仅是很少被探测到或未被探测到(<序列的4.0%),因此几乎没有能力被检查。对于检查的所有抗性突变,与在群体水平上选择突变相关联的药物相应于那些用来选择突变的来自其他研究的已知药物(表2)。例如,拉米夫定的应用与具有OR为19的M184V的发展相关(p<0.001)。2’,3’-双脱氧胞苷的应用独立地增加了发展M184V的风险(OR=3,p=0.004)。在研究群体中未探测到L74V或M184V和阿巴卡韦应用之间的正关联性。没有足够的统计学能力探测应用地拉韦定和突变之间的关联性,这是因为该试剂很少使用。
表2-在模型中检查的HIV-1 RT中的氨基酸替代,及它们发表的原因性抗反转录病毒试剂和在该研究中在群体水平上与这些替代相关联的。OR-几率、ZDV-叠氮胸苷、ddI-2’,3’-双脱氧肌苷、3TC-拉米夫定、d4T-双脱氧胸苷、ABC-阿巴卡韦、NRTI-核苷类似物反转录酶抑制剂、NNRTI-非核苷类似物反转录酶抑制剂。

利用治疗后蛋白酶的测序,在24.1%的个体中探测到了初级PI抗性突变(D30N、M46I/L、G48V、V82A/T/F、L90M),而在30.3%的个体中探测到了次级PI抗性突变(L10I、I54V/L、A71V/T、73、V77I、I84V、N88S)。在单独的PI和初级PI抗性突变之间预测的关联性中除2个(D30N和奈非那韦、G48V和沙奎那韦)之外全部在研究群体中是明显的(表3)。没有足够的统计学能力来探测应用氨普那韦或洛匹那韦和突变之间的关联性。
在群体水平上对HIV-1序列中CTL逃避突变的选择将如上所述的模型对HIV-1 RT和蛋白酶中的所有氨基酸进行重复,并将所有个体的HLA-A和-B(宽的)血清型连同药物处理一起作为协变量。在已知为初级或次级药物抗性突变位点的那些位置上,将特征性的药物抗性氨基酸替代指定为结果。在所有其他位置上,任何非一致氨基酸则为结果。
表3-检查的HIV-1蛋白酶中的氨基酸替代。PI-蛋白酶抑制剂

表4-HIV-1 RT中对于模型中那些具有最强关联性的HLA等位基因的特征性HLA-特异性氨基酸替代。%-在其病毒序列中具有替代的HLA类型个体的百分比。

HIV-1 RT
将这些模型中与特异性HLA-A或HLA-B等位基因呈正关联的所有63个多态(OR>1)(在所有情况下p≤0.05)根据每一个残基上多态的总比率和已知的CTL表位而在HIV-1 RT图上进行作图(图2)。对于这些HLA-特异性多态关联性中的16个,该多态位于具有相应HLA限制性的CTL表位中或其侧面,与CTL逃避突变一致,且在序列上有14个关联性的簇聚。HLA-相关联的多态在CTL表位中的4个主要锚定位置和9个非主要锚定位置上是明显的,且3个位于具有相应HLA限制性的CTL表位的侧面。然后确定了存在于那些具有最强关联性的HLA等位基因中的特征性氨基酸替代(表4)。32个负HLA关联性(OR<1)也是明显的一显示相对于所有其他的等位基因,在存在这些HLA等位基因时多态或一致序列的改变是显著更不可能的。
HIV-1蛋白酶在HIV-1蛋白酶中有48个由本模型探测的HLA等位基因特异性多态(图4)。对于8个HLA等位基因有簇聚的多态,包括那些与HLA-B5在位置12、13、14和16相关联的。在仅有的2个发表的CTL表位中或其侧面存在HLA相关联的多态,尽管没有一个多态相应于预测的HLA限定的表位(基于结合基元)。存在于群体中的最强的HLA关联性及其特征性氨基酸替代在表5中显示。探测到了23个负HLA关联性。
表5-HIV-1蛋白酶中对于模型中那些具有最强关联性的HLA等位基因的特征性HLA-特异性氨基酸替代。

宿主HLA和抗反转录病毒药物抗性突变之间的相互作用在HIV-1 RT中有4个抗反转录病毒药物抗性突变(M41L、K70R、T210W和T215Y/F),而在蛋白酶中有7个(L10I/R、M46I/L、A71V/T、73、V77I、V82A/T/F和L90M),在该突变处HLA等位基因独立地增加了突变概率(图2和4,B框)。例如,与所有其他HLA-A或-B等位基因相比,具有HLA-A28的个体中发展M41L的几率显著增加了(OR=41,p<0.001)。为了更详细地检查该观察内容,我们分析了群体中在治疗后的任何时间暴露于叠氮胸苷和进行HIV-1 RT测序的所有个体(n=265)。该个体组中HLA-A28的普遍性(8.0%)与总群体中的(8.3%)相当。然而,与那些未发展M41L替代的207个个体(7.7%,RR=1.69,p=0.30,Fisher精确性检验)相比,在58个用叠氮胸苷治疗的具有M41L替代的个体中有HLA-A28的过度表现(12.1%)。对所有接受奈非那韦治疗和进行HIV-1蛋白酶测序的个体进行了相似的分析(n=133)。在接受奈非那韦之后,与Logistic回归模型中L90M相关联的HLA-B13的出现(OR=13,p<0.001,图4)在具有L90M的个体中为40.0%,而在无L90M的个体中为18.7%(RR=2.96,p=0.12,Fisher精确性检验)。
HLA等位基因降低了2个初级RT抑制剂抗性多态K103N(HLA-A19,1/OR=4,p=0.04)和M184V(HLA-B16,1/OR=4,p=0.03)和1个次级PI抗性突变L10I/R/V(HLA-A10,1/OR=4,p=0.024)的几率(图2和4,C框),增加了具有这些特定HLA等位基因的个体中拮抗性选择压力的概率,其中该个体用诱导这些突变的药物进行了治疗。
讨论本研究的发现支持HIV-1体内适应的高度动态的宿主特异性模型,其中宿主CTL反应和抗反转录病毒治疗在单个病毒残基水平上充当连续的、竞争性的或平行的相互作用进化压力。
研究的群体中常见的已知药物抗性突变的分布与在其他较大和较小观察性研究中发现的相当,包括那些在首次应用药物的个体中所观察到的。几乎所有的初级药物抗性突变和大多数次级药物抗性突变在群体中都是明显的药物相关联的多态,且在所有这些情况中,药物关联性相应于已知的原因性抗反转录病毒试剂。未探测到D30N和奈非那韦及G48V和沙奎那韦之间预期的关联性,尽管对于两个突变均有探测具有OR>2的显著药物关联性的能力(至少30%)。显著地,G48V已报道最频繁地体内存在于接受了高剂量沙奎那韦单一治疗的患者中,该单一治疗几乎从未用于本研究群体中。在大多数情况中,将沙奎那韦与利托那韦一起应用。应用基于群体的方法不能探测已知的药物相关联的多态可能是由于统计学能力的缺乏,如果药物应用或对药物的病毒学失效在群体中很少发生或者如果突变主要在体外而不是体内进行选择。该方法可用于将来新的抗反转录病毒药物,作为一种系统的途径以对由该药物诱导的最频繁的体内药物抗性突变进行表征,即使体外推定的抗性位点是未知的。
在证实对抗反转录病毒药物的预期选择作用的相同模型中,群体中几个病毒残基的序列多样性显著受宿主个体的HLA特征影响。以前,HIV-1 RT中的几个HLA等位基因特异性多态已显示相应于已知或可能的CTL逃避位点、与宽血清型相比对细分的HLA亚型更加特异、随时间增加频率并预期较高的血浆病毒负载。在本研究中通过调整药物诱导的改变进一步对HIV-1 RT序列多样性模型进行精细修改,留下了我们认为是推定的CTL逃避突变的22个多态核心组(表4)。迄今,HIV-1蛋白酶基因中的CTL逃避突变尚未经实验证明,且目前仅发表了2个CTL表位。然而,基于HLA-B5结合基元,蛋白酶(RPLVTIKI;位置8-15)是预测的CTL表位,且我们发现在HLA-B5和位置12、13、14和16的多态簇之间有强的关联性(图4)。在几个研究中已注意到蛋白酶基因的可观的天然多态,且其中至少一些可能是CTL-驱动的(图4,表5)。表4和5中所示的HIV-1 RT和蛋白酶中选择的多态具有下面关键特征的一个或全部它们与HLA等位基因的统计学关联性非常强,且在对药物相关联的改变、其他位置上的多态(即可能的次级突变)和/或多重比较进行调整后仍然是显著的(p<0.05),它们处于具有相应HLA限制性的已知CTL表位中或与其他与相同HLA等位基因相关联的多态簇聚。在所有情况中,在具有HLA等位基因和等位基因相关联的多态的个体中有1个或2个主要的氨基酸替代,这预期是CTL反应所选择的功能突变。在I135T/V的情况中,其他人已显示该替代可消除HLA在体外与病毒表位的结合。因而,正如将药物抗性突变认为是暴露于特定的抗反转录病毒药物的“特征”或信号,这些氨基酸替代是特定HLA等位基因的特征且在药物治疗的个体中是明显的。
持续抑制HIV-1复制的有效抗反转录病毒治疗已显示与抗-HIV CTL反应的减少相一致,从而提示CTL逃避不大可能发生。证实CTL逃避在个体中随时间固定的研究都是在未治疗个体中进行的。在本研究群体中,个体更可能在病毒学控制失败(virological failure)中而不是当成功进行病毒学控制时进行HIV-1 RT和/或蛋白酶测序。尽管我们不能确定每一个HLA-特异性多态一般首次出现的时间,但对病毒序列的独立的HLA和药物相关联的作用的证实暗示CTL在一些个体中抗反转录病毒药物治疗期间或之后仍将施加选择压力。
很少有这样的病毒残基,在该残基上CTL压力和药物压力在驱动野生型氨基酸的改变或不改变中起竞争或协同作用。这提高了抗-HIV CTL反应可解释体外/体内药物抗性模式不一致、基因型和表型抗性不一致和不同个体中药物抗性突变可变发生率的可能性。因此CTL压力和药物压力之间的相互作用与目前治疗策略的许多方面均有密切关系,如不同抗反转录病毒治疗法的比较、结构性治疗诊断(structured treatmentinterruptions)(STI)和不同的治疗起始时间。逐步认识到;对这些问题的研究的设计和解释受限于对什么决定这些疾病中个体间生物学可变性的不完全理解。我们迄今的发现表明HLA分型和病毒基因分型可提供设计将来临床研究的信息。例如,预期STI不能增强个体中HIV特异性的CTL反应,其中该个体已在体内逃避了那些反应。由于预期能够鉴定具有或不具有对其HLA的关键逃避突变的个体,这将使得STI能够给予那些最可能从中获利的个体。类似地,个体化的药物选择和治疗时间选择的研究可由该数据提供信息。基础和定期的治疗后RT和蛋白酶抗性基因分型目前已变为使药物治疗最适化的标准,同样地,对重要逃避突变的病毒基因分型在将来可大大增强抗反转录病毒治疗的个体化。
实施例3群体水平上HIV-1对HLA-限定的免疫反应的适应的证据HIV-1 RT中的多态率和功能限制对HIV-1 RT中单个残基上的多态率和该残基已知的功能特征之间的关系进行了检查(1)。HIV-1 RT中重要催化残基(n=3,0.53%)、稳定性残基(n=37,1.06%)和有功能的残基(n=11,3.05%)上的多态率低于外部残基(n=10,5.95%)上的多态率(P=0.0009,Wilcoxon)。
统计学方法 能力计算方法、协变量选择程序和随机化程序在下文中详细描述。
在单个氨基酸上分析的步骤—以HIV-1 RT位置135为例将在HIV-1 RT位置135上对群体序列一致氨基酸(异亮氨酸)的任何替代即I135x设定为结果/反应变量。起始的协变量/解释性变量为存在于所有个体中的HLA-A和-B等位基因(n=473)A1、A2、A3、A9、A10、A11、A19、A28、A31、A36、B5、B7、B8、B12、B13、B14、B15、B16、B17、B18、B21、B22、B27、B35、B37、B40、B41、B42、B55、B56、B58、B60和B61。对血清学定义的宽等位基因而不是由基于高分辨率DNA序列的分型定义的亚型进行了考虑,从而可包括群体中所有个体的数据。此外,对于HIV-1 RT中几个已发表的CTL表位,高分辨率分型水平的HLA限定表位是未知的。
步骤1-能力计算正式的能力计算在开始即有效排除了任何这样的HLA等位基因/位置组合,即对于该组合没有实际检查关联性的足够统计学能力(由于多态的稀少、HLA的稀少或两者)。这在相当大程度上限制了协变量的数目,并因此限制了在模型中进行的比较的数目。能力计算也正式地鉴定了哪些关联性不能由我们的分析排除且需要在较大数据组中进行检查。将标准公式用于能力计算中(2)。将具有每一个HLA等位基因和具有I135x的患者数目用于计算探测具有比值比(OR)为2(正关联性)或0.5(负关联性)的关联性的能力。将具有低于30%的能力的HLA等位基因去除。在位置135去除的等位基因为A31、A36、B42、B55、B56、B58和B61。重要的是要注意我们探测负关联性的能力低于探测正关联性的能力。例如,在10.9的平均HLA频率和4.0%的平均多态时,探测2.0的OR(即正关联性)的能力为30%,但探测等价的0.5 OR的负关联性的能力仅为5.6%。
步骤2对具有和不具有每一个HLA等位基因及具有和不具有I135x的个体数目进行了计算。为了去除可导致不稳定的Logistic回归模型的协变量,如果在任何比较群体中个体少于5个则将HLA等位基因去除。在位置135去除的等位基因为HLA-B37、B41和B60。
步骤3然后用Fisher精确性检验单独估计与I135x相关联的协变量,且仅将那些具有单变量P-值≤0.1的包括进来用于将来的分析。去除的等位基因为A1、A2、A3、A9、A11、A19、A28、B7、B8、B13、B14、B15、B16、B21、B22、B27和B35。
步骤4-正向选择如果保留的协变量数目超过个体数目的10%,则将应用Logistic回归模型进行正向选择以选择在分析中待保留的协变量。基于对添加的协变量的最小P-值对协变量进行选择直到数目等于患者数目的10%。在位置135,协变量的数目低于患者数目的10%,所以不需进行选择。
步骤5-反向消除然后实施标准的反向消除程序。使Logistic回归模型适应于剩余的协变量。如果在考虑了其他包括的协变量之后,协变量的任一P-值大于0.1,则将具有最大P-值的协变量去除并使Logistic模型再适化。将此过程重复直到所有协变量均具有低于0.1的P-值。在位置135,这去除了HLA等位基因B12、B17和B40。
步骤6-精确的P-值为了容纳相对小的样本,“精确的”P-值基于随机化检验而不是通常的大样本估计(3)。在该程序中,使最终的协变量组在个体中随机排列,并对每一个排列计算与I135x相关联的标准检验统计量。对每一个模型生成了1000个随机的排列,并且P-值基于检验值的适当百分比的程度比基于实际数据的百分比的程度更大。对每一个协变量计算了该协变量在随机数据组中具有的检验统计量相对于实际数据中具有的检验统计量的倍数比例。该比例给出了随机化的(精确的)P-值。将具有大于0.05的精确P-值的关联性依次去除,并将那些P-值低于0.05的认为是显著的。在位置135,这去除了等位基因HLA-A10和-B18,剩余HLA-B5作为与I135x的显著关联性。
对多重比较的校正为了突出显著的HLA关联性,该关联性的P-值对在整个分析中进行的比较数目进行了校正(即一个较高特异性但较低灵敏性的非常低的P-值截止点),对每一个HLA等位基因生成了校正因子。分别考虑正关联性和负关联性。如上所述从最初的数据组中生成了1000个随机化的数据组。然后对每一个氨基酸残基进行完整选择过程(包括初始模型缩减程序),并计算每一个HLA等位基因所有位置上的显著关联性总数目。例如,对于HLA-A2,在每个随机数据组中所有残基上平均有1.827个正HLA-A2关联性。将该数字除以0.05得到HLA-A2的多重比较校正因子(x)。该校正因子是实施的“独立”检验的估计的等价数字。将校正因子应用于用Bonferroni校正公式[即p*=1-(1-p)x,其中p是来自应用实际数据的模型的P-值,x是校正因子,且p*是校正的P-值]在实际数据中计算的P-值。
实际数据对随机化数据的总P-值通过考虑在每一个位置上的单独检验的总和相对于从随机化的数据组中获得的该总和值的极端性而获得所有位置上所有关联性的总P-值。对应用实际数据的所有等位基因进行的所有模型的所有检验统计量的总和进行了计算。对随机化的数据组进行相同的计算。对于1000个随机数据组,该数字均不大于实际数据,从而给出总P-值<1/1000或<0.001。
“已知”的CTL表位中关联性的显著性我们进行了分析以确定在“相应的”已知CTL表位(即限制于相同HLA等位基因的)中随机发现至少15个显著正关联性的概率。如果显著的HLA关联性在残基中随机发生,那么HLA关联性在限定于该等位基因的已知CTL表位中发生的概率等于处于该表位中的所有残基的相对比例。于是已知表位中的显著关联性的总数目是不相等的二项式变量的总和,该变量的分布可通过例如模拟进行估计。与15个观察值相比,基于随机假说在已知的表位中仅预期有4.27个显著的正关联性。对此估计的P-值为<0.001。
实施例4对CTL表位鉴定的证实应用在此处描述的方法,本发明者能够鉴定各种CTL表位。自从提交临时申请和提交完整申请以来,其他研究组已独立地报道了许多这种表位,如在HIV反转录酶位置117和126之间已描述了HLA-A11限定的CTL表位(B.Sriwanthana等人,Hum Retroviruses 17,719-34(2001))。临时申请鉴定了HIV反转录酶位置122的HLA-A11关联性。在随后发表的CTL表位中同样也鉴定了下面的关联性HLA-A3限定的CTL表位RT中位于101的HLA-A3(93-101;C.Brander和P.Goulder,HIV MolecularImmunology Database.B.T.M.Korber等人,Eds.New Mexico 2001);HLA-A*3002表位中位于178的HLA-A19(30)(173-181;C.Brander和P.Goulder,HIV Molecular Immunology Database,B.T.M.Korber等人,Eds.New Mexico,2001;和P.Gouder等人,J.Virol 75(3),1339-47(2001))和HLA-B*4001限定的CTL表位中位于207的HLA-B40(202-210;C.Brander和P.Goulder,HIV Molecular ImmunologyDatabase,B.T.M.Korber等人,Eds.New Mexico 2001)。
实施例5治疗剂开发HIV及祖先反转录病毒已在来自HLA(或MHC)限定的免疫反应的强大选择压力下进行了进化。HIV具有高度动态的和易于出错的复制现象,且该HLA限定的选择压力的证据可在单独的患者和在群体水平上观察到。在研究的473个西澳大利亚患者中,没有两个患者具有相同的HIV反转录酶氨基酸序列。多态在具有较低功能性或结构限制的位点上是最明显的,且经常与特定的宿主I型HLA等位基因相关联。在这些HLA-相关联的病毒多态上具有逃避突变的患者具有较高的HIV病毒负载。该信息显示了在感染后何种HIV肽(表位)可刺激针对病毒的最强保护性免疫反应。如果在暴露于病毒前在疫苗中给予,那么这些相同的表位则应该提供最强的保护。
由预防性HIV疫苗提供的保护作用将依赖于由该治疗剂引起的HLA限定的免疫反应的宽度和强度及感染性HIV序列逃避那些反应的程度。目的是(1.)治疗剂诱导最大数目和最大强度的HLA-限定的CTL反应;和(2.)在治疗剂表位和入侵病毒表位之间具有最大数目的相同匹配(或者病毒表位至少与治疗剂表位足够相似,从而仍然可由治疗剂诱导的CTL反应识别)。
传统的方法已尝试包括保守的表位—在所有HIV变体中不变地存在的长度为8-12个氨基酸的病毒蛋白质片段。然而,在此处提供的研究显示病毒及其祖先已在来自HLA-限定的免疫反应的强大选择压力下进行了进化,因此不太可能具有由共同的HLA类型识别的保守表位。
对具有全长测序的前80个患者的初步分析揭示了所有蛋白质中的HLA特异性关联性,以及在这些残基的逃避与较高的治疗前病毒负载相关联。最强的关联性及其与HIV病毒负载的关系在表6中显示。图5显示病毒对HLA-限定的反应的适应程度和病毒负载之间的关系。HLA-限定的关联性的数目和强度及这些解释治疗前病毒负载中可变性的程度将增加,因为可以获得大量患者的数据。
表6

图5显示了病毒对HLA-限定的反应的适应程度和病毒负载之间的关系。
进行模拟以确定不同预防性疫苗候选物的可能功效,其是通过假定使具有与HIV阳性西澳大利亚群体相同HLA多样性的HIV阴性目标群体暴露于与在西澳大利亚HIV阳性群体中观察到的相同的病毒多样性中而实现的。换句话说,对具有与249个HIV阳性西澳大利亚患者相同HLA类型的假设的249个HIV阴性患者群体进行了检查。对第一个HIV阴性患者暴露于在第一个HIV感染患者中测序的病毒的概率进行考虑,然后对暴露于第二个HIV阳性患者中的病毒进行考虑,依此类推直到考虑了所有80个病毒序列。将该过程对第二个假设的HIV阴性患者进行重复,依此类推直到考虑了所有249个HIV阴性被试者。
在图6所示的第一个分析中,本发明者对每一个潜在的治疗性候选物计算了在该治疗剂中存在多少有利的氨基酸残基(即在阳性HLA关联性的一致序列以及治疗剂和入侵病毒之间的匹配,或者在阴性HLA关联性的第二最常见的残基以及该第二最常见的残基和入侵病毒之间的匹配)。下文所示的最适化的疫苗序列在除那些具有主要的阴性HLA关联性的残基之外的所有残基上应用群体一致序列,而在具有主要的阴性HLA关联性的情况中应用群体中第二最常见的残基。
最适的治疗剂序列(基因加下划线。这些基因编码的蛋白质为斜体。Gag、pol和envelope编码几个蛋白质。其他基因仅编码一种具有与该基因相同名称的蛋白质。)(i)Gag(p17、p24、p2、p7、p1、p6)(SEQ ID NO2)关于前述的分析,已阐明了下面的Gag(p17、p24、p2、p7、p1、p6)氨基酸序列,该序列预期可对在本研究中检查的群体提供最适的CTL诱导的治疗性保护MGARASVLSGGELDRWEKIRLRPGGKKKYKLKHIVWASRELERFAVNPGLLETSEGCRQILGQLQPSLQTGSEELKSLYNTVATLYCVHQRIEVKDTKEALDKIEEEQNKSKKKAQQAAADTGNSSQVSQNYPIVQNLQGQMVHQAISPRTLNAWVKWEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINEEAAEWDRLHPVHAGPIAPGQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPTSILDIRQGPKEPFR
DYVDKFYKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGPGHKARVLAEAMSQVTNSATIMMQRGNFRNQRKTVKCFNCGKEGHIARNCRAPRKKGCWKCGKEGHQMKDCTERQANFLGKIWPSHKGRPGNFLQSRPEPTAPPEESFRFGEETTTPSQKQEPIDKELYPLASLRSLFGNDPSSQ(ii)Pol(整合酶、反转录酶、整合酶)(SEQ ID NO3)关于前述的分析,已阐明了下面的Pol(整合酶、反转录酶、整合酶)氨基酸序列,该序列预期可对在本研究中检查的群体提供最适的CTL诱导的治疗性保护FFRENLAFPQGKAREFSSEQTRANSPTRRELQVWGEDNNSTSEAGADRQGTVSFSFPQITLWQRPLVTIKIGGQLKEALLDTGADDTVLEEMNLPGRWKPKMIGGIGGFIKVRQYDQIIIEICGHKAIGTVLVGPTPVNIIGRNLLTQLGCTLNFPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALVEICTEMEKEGKISKIGPENPYNTPVFAIKKKDSTKWRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLIDKDFRKYTAFTIPSINNETPGIRYQYNVLPQGVVKGSPAIFQSSMTKILEPFRKQNPDIVIYQYMDDLYVGSDLEIGQHRTKIEELRQHLLKWGFTTPDKKHQKEPPFLWMGYELHPDKWTVQPIVLPEKDSWTVNDIQKLVGKLNWASQIYAGIKVRQLCKLLRGTKALTEVIPLTEEAELELAENREILKEPVHGVYYDPSKDLIAEIQKQGQGQWTYQIYQEPFKNLKTGKYARMRGAHTNDVKQLTEAVQKIATESIVIWGKTPKFKLPIQKETWEAWWTEYWQATWIPEWEFVNTPPLVKLWYQLEKEPIVGAETFYVDGAANRETKLGKAGYVTDRGRQKVVSLTDTTNQKTELQAIHLALQDSGLEVNIVTDSQYALGIIQAQPDKSESELVSQIIEQLIKKEKVYLAWVPAHKGIGGNEQVDKLVSAGIRKVLFLDGIDKAQEEHEKYHSNWRAMASDFNLPPVVAKEIVASCDKCQLKGEAMHGQVDCSPGIWQLDCTHLEGKIILVAVHVASGYIEAEVIPAETGQETAYFLLKLAGRWPVKTIHTDNGSNFTSTTVKAACWWAGIKQEFGIPYNPQSQGVVESMNKELKKIIGQVRDQAEHLKTAVQMAVFIHNFKRKGGIGGYSAGERIVDIIATDIQTKELQKQITKIQNFRVYYRDSRDPLWKGPAKLLWKGEGAWIQDNSDIKVVPRRKAKIIRDYGKQMAGDDCVASRQDED
(iii)vif(SEQ ID NO4)关于前述的分析,已阐明了下面的vif氨基酸序列,该序列预期可对在本研究中检查的群体提供最适的CTL诱导的治疗性保护MENRWQVMIVWQVDRMRIRTWKSLVKHHMYISKKAKGWFYRHHYESTHPRISSEVHIPLGDAKLVITTYWGLHTGERDWHLGQGVSIEWRKRRYSTQVDPDLADQLIHLYYFDCFSESAIRNAILGHIVSPRCEYQAGHNKVGSLQYLALAALITPKKIKPPLPSVTKLTEDRWNKPQKTKGHRGSHTMNGH(iv)vpr(SEQ ID NO5)关于前述的分析,已阐明了下面的vpr氨基酸序列,该序列预期可对在本研究中检查的群体提供最适的CTL诱导的治疗性保护MEQAPEDQGPQREPYNEWTLELLEELKSEAVRHFPRIWLHGLGQHIYETYGDTWAGVEAIIRILQQLLFIHFRIGCQHSRIGITRQRRARNGASRS(v)tat(SEQ ID NO6)关于前述的分析,已阐明了下面的tat氨基酸序列,该序列预期可对在本研究中检查的群体提供最适的CTL诱导的治疗性保护MEPVDPRLEPWKHPGSQPKTACTNCYCKKCCFHCQVCFIKKGLGISYGRKKRRQRRRAPQDSQTHQVSLSKQPASQPRGDPTGPKESKKKVERETETDPVD(vi)rev(SEQ ID NO7)关于前述的分析,已阐明了下面的rev基酸序列,该序列预期可对在本研究中检查的群体提供最适的CTL诱导的治疗性保护MAGRSGDSDEELLKTVRLIKFLYQSNPPPSPEGTRQARRNRRRRWRERQRQIRSISGWILSTYLGRPAEPVPLQLPPLERLTLDCNEDCGTSGTQGVGSPQILVESPAVLESGTKE*
(vii)Vpu(SEQ ID NO8)关于前述的分析,已阐明了下面的vpu氨基酸序列,该序列预期可对在本研究中检查的群体提供最适的CTL诱导的治疗性保护MQPLEILAIVALVVAAIIAIVVWTIVFIEYRKILRQRKIDRLIDRIRERAEDSGNESEGEESALVEMGVEMGHHAPWDVDDL(viii)envelope(gp120、gp41)(SEQ ID NO9)关于前述的分析,已阐明了下面的envelope(gp120、gp41)氨基酸序列,该序列预期可对在本研究中检查的群体提供最适的CTL诱导的治疗性保护MRVKGNNQHLWKWGWKWGTMLLGMLMICSATEKLWVTVYYGVPVWKEATTTLFCASDAKAYDTEVHNVWATHACVPTDPNPQEWLENVTENFNMWKNNMVEQMHEDIISLWDQSLKPCVKLTPLCVTLNCTDLNNDTNTNNTSGSNNMEKGEIKNCSFNITTSIRDKMQKEYALFYKLDWPIDNDNTSYRLISCNTSVITQACPKVSFEPIPIHYCAPAGFAILKCNDKKFNGTGPCTNVSTVQCTHGIRPWSTQLLLNGSLAEEEVVI RSENFTNNAKTIIVQLNESVEINCTRPNNNTRKSISIHIGPGRAFYATGEIGDIRQAHCNISRAEWNNTLKQIVKKLREQFGKNKTIVFNQSSGGDPEIVMHSFNCGGEFFYCNTTQLFNSTWNNSTWNTEESNNTEGNETITLPCRIKQIINMWQEVGKAMYAPPIRGQIRCSSNITGLLLTRDGGNNNNKTETFRPGGGDMRDNWRSELYKYKVVKIEPLGVAPTKAKRRWQREKRAVGIGAMFLGFLGAAGSTMGAASITLTVQARQLLSGIVQQQNNLLRAIEAQQHLLQLTVWGIKQLQARVLAVERYLKDQQLLGIWGCSGKLICTTAVPWNTSWSNKSLNKIWDNMTWMEWEKEINNYTGIIYNLIEESQNQQEKNEQELLELDKWASLWNWFDISKWLWYIKIFIMIVGGLIGLRIVFAVLSIVNRVRQGYSPLSFQTHLPTPRGPDRPEGIEEEGGERDRDRSSRLVDGFLAIIWDDLRSLCLFSYHRLRDLLLIVTRIVELLGRRGWEILKYWWNLLQYWSQELKNSAVSLLNATAIAVAEGTDRIIEVVQRACRAILHIPRRIRQGVERALL
(ix)nef(SEQ ID NO10)关于前述的分析,已阐明了下面的nef氨基酸序列,该序列预期可对在本研究中检查的群体提供最适的CTL诱导的治疗性保护MGGKWSKSSMVGWPAVRERMRRAEPAADGVGAVSRDLEKHGAITSSNTAATNADCAWLEAQEEEEVGFPVRPQVPLRPMTYKGALDLSFFLKEKGGLEGLIYSQKRQDILDLWVYHTQGYFPDWQNYTPGPGIRYPLTFGWCFKLVPVEPEKVEEANEGENNSLLHPMSQHGMDDPEREVLMWKFDSRLAFRHMARELHPEYYKDC在图6所示的第二个分析中,应用如在表6所示的病毒负载柱状图中估计的变化中所阐明的病毒结果计算估计的HLA-限定的免疫反应强度,该免疫反应可由每一种治疗剂诱导并针对每一个潜在的入侵病毒。
通常所研究的群体中一致序列的应用减少但不消除由病毒多样性引起的问题,并且包含最大数目的HLA-A、B或C特异性病毒多态(特别是那些与基于逃避的病毒负载的较大增加相关联的)预期可改善HLA-限定的反应。
如此处在西澳大利亚群体中证明的可用全长测序进行治疗剂设计以确定在治疗剂中包括的最适的病毒部分。一旦设计了治疗剂,那么可在进行疫苗接种的目标群体中重复这些分析(如美国、非洲或欧洲群体),但这次在目标群体中仅仅需要对在治疗剂中包括的病毒的部分进行测序以估计该群体中疫苗的功效(即具有不同的病毒和HLA多样性)。
实施例6治疗剂制备应用上述在特定的目标群体中估计潜在的疫苗候选物的治疗功效的模型,确定了对于目标HIV感染的西澳大利亚群体的单个最适氨基酸序列。在该情况中,HLA类型和攻击的病毒对于每一个患者均是已知的,因此人们可仅考虑HIV感染的群体且可使治疗剂中非逃避的HLA-特异性残基的数目最适化(即在正关联性处的一致序列和在负关联性处的第二最常见的残基)。应用这些技术,可在这样和相似的群体中预防HIV感染时选择上述序列(即蛋白质Gag(p17、p24、p2、p7、p1、p6)(SEQID NO2)、Pol(整合酶、反转录酶、整合酶)(SEQ ID NO3)、vif(SEQ ID NO4)、vpr(SEQ ID NO5)、tat(SEQ ID NO6)、rev(SEQ ID NO7)、vpu(SEQ ID NO8)、envelope(gp120、gp41)(SEQID NO9)和nef(SEQ ID NO10))。
1.治疗HIV特异性免疫反应的治疗剂在治疗开始时,从每一个患者中获取血液样品以用于HIV测序和HLA分型,从而应用源自我们基于群体的分析的HLA-病毒多态关联性确定已逃避了HLA-限定的免疫反应的那些残基和因此的那些病毒群体。
尽管疫苗接种最好应对那些尚未逃避的残基和因此的病毒群体进行个体化,但对于基于单一群体的疫苗,应用了如下疫苗,该疫苗用治疗前序列的正关联性的一致残基和在具有与常见等位基因主要负关联性的残基的第二最常见残基进行最适化。根据该例子,通过向患者引入一个或多个载体的方法对患者进行免疫接种,该载体适合于表达疫苗的最适蛋白质序列。尽管该载体可表达所有下述蛋白质Gag(p17、p24、p2、p7、p1、p6)(SEQ ID NO2)、Pol(整合酶、反转录酶、整合酶)(SEQ ID NO3)、vif(SEQ ID NO4)、vpr(SEQ ID NO5)、tat(SEQ ID NO6)、rev(SEQ ID NO7)、vpu(SEQ ID NO8)、enyelope(gp120、gp41)(SEQ ID NO9)和nef(SEQ ID NO10),但该疫苗优选地仅包含以下蛋白质Gag(p17、p24、p2、p7、p1、p6)(SEQ IDNO2)、Pol(整合酶、反转录酶、整合酶)(SEQ ID NO3)和nef(SEQID NO10)。
疫苗向患者中的送递可用禽痘病毒载体(或任何其他适合于将蛋白质序列送递入患者中的载体)实现。这是通过众所周知和标准的技术实现的,该技术包括编码用于疫苗中的蛋白质的核苷酸序列的分离。然后将核苷酸序列插入到载体(如禽痘病毒)中,然后以导致该蛋白质在患者中表达的方式和浓度送递入患者中。
如果选择用于疫苗中的HIV序列不编码提及的特定序列,那么可用分子生物学中众所周知的和充分理解的技术对该序列进行修饰(参见Ausubel,F.、Brent,R.、Kingston,R.E.、Moore,D.D.、Seidman,J.G.、Smith,J.A.、Struhl,K.,Current protocols in molecular biology.Greene Publishing Associates/Wiley Intersciences,New York,在此处将其内容引入作为参考),该技术包括例如定点诱变技术。
2.在有效的高活性抗反转录病毒治疗中当HIV抗原消退时维持HIV特异性免疫反应的疫苗根据本方法,在治疗开始时从每一个患者中获取血液样品以用于HIV测序和HLA分型,从而应用源自我们基于群体的分析的HLA-病毒多态关联性确定已逃避了HLA-限定的免疫反应的那些残基和因此的那些病毒群体。用于实施本分析的方法在上文描述。
然后将患者暴露于HAART中以抑制HIV复制,从而降低维持HIV抗原特异性免疫反应的HIV抗原的可利用性。HAART治疗中应用的方案依赖于待治疗的患者。医生将基于患者中感染的水平、患者的健康等采用适当的方案。
在HAART治疗过程中,对病毒负载进行了定时监控以测量治疗作用。一旦病毒负载充分地消退了,则根据前面的例子将患者置于疫苗接种规程中,该规程导致禽痘病毒载体向患者中的送递,该载体编码一种或多种应用于由上述方法鉴定的最适化疫苗中的蛋白质。送递入患者中的治疗剂优选至少编码如在此处描述的pol、gag和nef蛋白质,然而应理解的是治疗剂的精确组成将依赖于治疗医生的确切需要而变化。
3在高活性抗反转录病毒治疗中防止或延迟患者中抗反转录病毒药物抗性突变发生的疫苗。
抗反转录病毒组合治疗(ART)已导致了HIV-1死亡率降低60%,并对那些感染者提供了极大的希望。然而药物抗性的发展是它在发达国家和发展中国家提供长期利益的主要障碍。目前治疗后对HIV药物的抗性是常见的,其中美国和象牙海岸的研究证明超过50%的受治疗的患者对HIV具有一些抗性。
疫苗接种旨在防止疾病状态的发生,且在整体上已对整个社会和人类提供了无数利益。仅在最近才对在那些已由特定疾病感染的中进行疫苗接种的作用进行估计,尤其是与HIV-1相关的。在那些已由HIV-1感染的个体中防止或延迟药物抗性发展的疫苗可对患有该疾病的数百万人提供显著的利益。
HIV感染的患者中治疗性疫苗的临床优势迄今是令人失望的,这潜在地是因为患者已暴露于疫苗抗原中,且疫苗表位逃避HLA-限定的免疫反应的程度是可变的。抗反转录病毒抗性突变对于患者是有害的,但在该情况中该患者尚未暴露于该抗原。应用充分免疫原性的疫苗如DNA/禽痘病毒致敏/强化疫苗能够提供高水平的T细胞免疫原性。治疗性疫苗已根据下面的原则进行了设计1.编码共同的抗性突变2.编码推定的“适合性突变”,其中这些突变不与共同的关键突变相干涉3.尽可能应用完整蛋白质,但避免长的野生型氨基酸片段,这是因为对野生型序列的反应是相对不想要的4.应用实施例1中描述的最优的一致序列样序列作为主链(即不是抗反转录病毒抗性突变的残基上的氨基酸)。可能的话(如蛋白酶)应用已知可正确折叠的主链(如真实的分离物),这是因为抗原稳定性可更好。
5.在抗性突变密切靠近时(<4个氨基酸),生成仅表达单个抗性表位的分离片段,这是因为对含有2个抗性突变的表位的反应是相对不想要的6.对于含有单个突变的片段,在每一侧编码7个氨基酸以增强发展CD8T细胞对编码的突变的反应和降低对野生型序列反应的可能性
7.然而,编码尽可能少的分离片段,这是因为对2个片段的重叠氨基酸序列(无关表位)的反应是不想要的8.尽可能多地分离含有相同编码序列的片段,从而减少构建过程中的重组可能性应用这些原则已发展了下面的治疗剂序列(如在图7和8中阐明的)蛋白酶疫苗关于前述的分析,已阐明了下面的蛋白酶氨基酸序列,该序列预期可对在本研究中检查的群体提供最适的CTL诱导的治疗性保护最适的CTL和药物疫苗PQITLWQRPIVTIKIGGQLREALLDTGADNTVLEEMNLPGRWKPKIIGGVGGFIKVRQYDQIPIEICGH KAIGTVLVGPTPANIIGRNLMTQIGCTLNFGRWKPKMIVGIGGLIKVRQY DQLVGPTPVNVIGRNLLTQ(SEQ ID NO11)具有群体一致氨基酸序列的相同肽PQITLWQRPLVTIKIGGQLKEALLDTGADDTVLEEMNLPGRWKPKMIGGIGGFIKVRQYDQIPIEICGHKAIGTVLVGPTPVNIIGRNLLTQIGCTLNFGRWKPKMIGGIGGFIKVRQYDQLVGPTPVNIIGRNLLTQ(SEQ ID NO12)RT疫苗关于前述的分析,已阐明了下面的RT氨基酸序列,该序列预期可对在本研究中检查的群体提供最适的CTL诱导的治疗性保护最适的CTL和药物疫苗LVEICTELEKEGKISTPVFAIKRKDSTRWRKLVDFDIVIYQYVDDLYVGSHLLKWGFYTPDKKHQICTEMEKDGKISKIGAIKKKDSDKWRKVVDFRELN
QLGIPHPGGLKKNKSVTVLDVGDAYFSIPLDKDFRYQYNVLPMGWKGSPAQNPDIVICQYMDDLYVASDLEIGQHRTKIEELRQHLWKWGFFTPDQKHQKEPP(SEQ ID NO13)具有群体一致氨基酸序列的相同肽LVEICTEMEKEGKISTPVFAIKKKDSTKWRKLVDFDIVIYQYMDDLYVGSHLLKWGFTTPDKKHQICTEMEKEGKISKIGAIKKKDSTKWRKLVDFRELNQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDKDFRYQYNVLPQGWKGSPAQNPDIVIYQYMDDLYVGSDLEIGQHRTKI EELRQHLLKWGFTTPDKKHQKEPP(SEQ ID NO14)目的是当出现抗反转录病毒药物抗性突变时使治疗剂构建体与生成的新表位匹配。
理想地将对每一个患者中自身的病毒进行测序,并在治疗剂构建体(即对每一个患者个体化的疫苗)中应用除特征性药物抗性突变引入特性之外在各方面均相同的病毒。然而,这种方法这时将是费力且不实际的(每一个疫苗必须单独检验和获得批准)。与上述方法相似但不相同的治疗剂模型可用于确定目标HIV感染的西澳大利亚群体中的单个最优氨基酸序列。在该情况中,HLA类型和攻击的病毒对于每一个患者均是已知的,因此我们仅考虑HIV感染的群体,且使疫苗中非逃避的HLA-特异性残基的数目最优化(即在正关联处的一致序列和在负关联处的第二最常见残基)。
根据该例子,通过向患者引入一个或多个载体的方法对患者进行免疫接种,该载体适合于表达疫苗的最优蛋白质序列。
除非另有说明,涉及核酸技术的反应和操作均如通常描述于Sambrook等人,1989,Molecular CloningA Laboratory Manual,Cold Spring Harbor Laboratory Press的方法那样进行。
首先构建含有编码上述蛋白酶和RT氨基酸序列的cDNA的禽痘病毒载体。应以下面的方式将编码前述氨基酸序列的cDNA序列插入,以确保该序列当引入到患者中时将表达。该载体也可含有所有实现该序列想要的转录所必需的所有表达元件。在载体中也可包含其他有利的特征,如以不同形式回收核酸的机制。
然后将构建的载体通过本领域中各种公知的方法中的任何一种引入到细胞中。用于转化的方法可发现于Sambrook等人,MolecularCloningA Laboratory Manual,Cold Spring Harbor Laboratory,New York(1992);Ausubel等人,Current Protocols in MolecularBiology,John Wiley and Sons,Baltimore,Md.(1989);Chang等人,Somatic Gene Therapy,CRC Press,Ann Arbor,Mich.(1995);Vega等人,Gene Targeting,CRC Press,Ann Arbor,Mich.(1995)和Gilboa等人(1986)中,且包括例如稳定或瞬时转染、脂质转染法、电穿孔和用重组病毒载体的感染。
实施例7用于治疗HIV感染的治疗性氨基酸序列的额外特定例子根据实施例1和2中的方法揭示了下面的氨基酸序列,该氨基酸序列提供了对具有提及的特定HLA关联性的HIV感染个体进行特定治疗的手段。
(i)FLDGIDKAQEEHEKYHSNWRAM(SEQ ID NO15)和HLA-B*4402蛋白质整合酶在具有HLA-B*4402的个体中比无该HLA等位基因的患者中更经常地在位置11发生一致氨基酸谷氨酸(E)的氨基酸残基改变,该改变频率大于随机突变(在对其他HLA等位基因进行调整后比值比=166,P-值<0.0001)。此外,在整合酶位置11具有谷氨酸之外的氨基酸的HLA-B*4402阳性个体与那些在该位置具有谷氨酸的HLA-B*4402阳性患者相比,具有增加的病毒负载。因此,在位置11包括一致氨基酸谷氨酸的治疗剂与这些患者中在该位置最常见的其他氨基酸天冬氨酸(D)相比可提供对HLA-B*4402阳性患者的保护。因此,氨基酸序列FLDGIDKAQEEHEKYHSNWRAM(SEQ ID NO15)如果包括于治疗剂中则可提供对HLA-B*4402阳性患者的保护,而序列FLDGIDKAQEDHEKYHSNWRAM(SEQ ID NO16)应提供较少的保护(如果有任何保护的话)。氨基酸序列FLDGIDKAQEEHEKYHSNWRAM(SEQ ID NO15)预期含有HLA-B*4402限定的CTL表位。
(ii)GKWSKSSMVGWPAVRERMRRAEP(SEQ ID NO17)和HLA-C*0701蛋白质nef在具有HLA-C*0701的个体中比无该HLA等位基因的患者中更经常地在位置14发生一致氨基酸脯氨酸(P)的氨基酸残基改变,该改变频率大于随机突变(在对其他HLA等位基因进行调整后比值比=6.8,P-值=0.0001)。此外,在nef位置14具有脯氨酸之外的氨基酸的HLA-C*0701阳性个体与那些在该位置具有脯氨酸的HLA-C*0701阳性患者相比,具有增加的病毒负载。因此,在位置14包括一致氨基酸脯氨酸的治疗剂与这些患者中在该位置最常见的其他氨基酸丝氨酸(S)相比可提供对HLA-C*0701阳性患者的保护。因此,氨基酸序列GKWSKSSMVGWPAVRERMRRAEP(SEQ ID NO17)如果包含于治疗剂中则可提供对HLA-C*0701阳性患者的保护,而序列GKWSKSSMVGWSAVRERMRRAEP(SEQ ID NO18)应提供较少的保护(如果有任何保护的话)。氨基酸序列GKWSKSSMVGWPAVRERMRRAEP(SEQ ID NO17)预期含有HLA-C*0701限定的CTL表位。
(iii)AQEEEEVGFPVRPQVPLRPMTYK(SEQ ID NO19)和HLA-B*0702蛋白质nef在具有HLA-B*0702的个体中比无该HLA等位基因的患者中更经常地在位置71发生一致氨基酸精氨酸(R)的氨基酸残基改变,所述改变频率大于随机突变(在对其他HLA等位基因进行调整后比值比=19.4,P-值=0.0002)。此外,在nef位置71具有精氨酸之外的氨基酸的HLA-B*0702阳性个体与那些在该位置具有精氨酸的HLA-B*0702阳性患者相比具有增加的病毒负载。因此,在位置71包括一致氨基酸精氨酸的治疗剂与这些患者中在该位置最常见的其他氨基酸赖氨酸(K)相比可提供对HLA-B*0702阳性患者的保护。因此,氨基酸序列AQEEEEVGFPVRPQVPLRPMTYK(SEQ ID NO19)如果包含于治疗剂中则可提供对HLA-B*0702阳性患者的保护,而序列AQEEEEVGFPVKPQVPLRPMTYK(SEQ ID NO20)应提供较少的保护(如果有任何保护的话)。氨基酸序列AQEEEEVGFPVRPQVPLRPMTYK(SEQ ID NO19)预期含有HLA-B*0702限定的CTL表位。
(iv)SFRFGEETTTPSQKQEPIDKENY(SEQ ID NO21)和HLA-B*4402蛋白质p6在具有HLA-B*4402的个体中比无该HLA等位基因的患者中更经常地在位置25发生一致氨基酸丝氨酸(S)的氨基酸残基改变,所述改变频率大于随机突变(在对其他HLA等位基因进行调整后比值比=66.3,P-值=0.0003)。此外,在p6位置25具有丝氨酸之外的氨基酸的HLA-B*4402阳性个体与那些在该位置具有丝氨酸的HLA-B*4402阳性患者相比具有增加的病毒负载。因此,在位置25包括一致氨基酸丝氨酸的治疗剂与这些患者中在该位置最常见的其他氨基酸脯氨酸(P)相比,可提供对HLA-B*4402阳性患者的保护。因此,氨基酸序列SFRFGEETTTPSQKQEPIDKENY(SEQ ID NO21)如果包含于治疗剂中则可提供对HLA-B*4402阳性患者的保护,而序列SFRFGEETTTPPQKQEPIDKENY(SEQ ID NO22)应提供较少的保护(如果有任何保护的话)。氨基酸序列SFRFGEETTTPSQKQEPIDKENY(SEQ ID NO21)预期含有HLA-B*4402限定的CTL表位。
(v)RIGCQHSRIGIIRQRRARNGASR(SEQ ID NO23)和HLA-DRB1-0701
蛋白质vpr在具有HLA-DRB1-0701的个体中比无该HLA等位基因的患者中更不经常地在位置84发生一致氨基酸苏氨酸(T)的氨基酸残基改变,该改变频率低于随机突变(在对其他HLA等位基因进行调整后比值比=0.03,P-值=0.0005)。此外,在vpr位置84具有苏氨酸之外的氨基酸的HLA-DRB1-0701阳性个体与那些在该位置具有苏氨酸的HLA-DRB1-0701阳性患者相比,具有降低的病毒负载。因此,在位置84包括在HLA-DRB1-0701患者中发现的除一致氨基酸之外最常见的氨基酸异亮氨酸(I)的治疗剂与一致氨基酸苏氨酸相比可提供对HLA-DRB1-0701阳性患者的保护。因此,氨基酸序列RIGCQHSRIGIIRQRRARNGASR(SEQ ID NO23)如果包含于治疗剂中则可提供对HLA-DRB1-0701阳性患者的保护,而序列RIGCQHSRIGITRQRRARNGASR(SEQ ID NO24)应提供较少的保护(如果有任何保护的话)。氨基酸序列RIGCQHSRIGIIRQRRARNGASR(SEQ IDNO23)预期含有HLA-DRB1-0701限定的CTL表位。
(vi)KTIHTDNGSNFTSTTVKAACWWA(SEQ ID NO25)和HLA-C*0501蛋白质整合酶在具有HLA-C*0501的个体中比无该HLA等位基因的患者中更经常地在位置122发生一致氨基酸苏氨酸(T)的氨基酸残基改变,该改变频率高于随机突变(在对其他HLA等位基因进行调整后比值比=17.2,P-值=0.0005)。此外,在整合酶位置122具有苏氨酸外的氨基酸的HLA-C*0501阳性个体与那些在该位置具有苏氨酸的HLA-C*0501阳性患者相比具有增加的病毒负载。因此,在位置122包括一致氨基酸苏氨酸的治疗剂与这些患者中在该位置最常见的其他氨基酸异亮氨酸(I)相比,可提供对HLA-C*0501阳性患者的保护。因此,氨基酸序列KTIHTDNGSNFTSTTVKAACWWA(SEQ ID NO25)如果包含于治疗剂中则可提供对HLA-C*0501阳性患者的保护,而序列KTIHTDNGSNFISTTVKAACWWA(SEQ ID NO26)应提供较少的保护(如果有任何保护的话)。氨基酸序列KTIHTDNGSNFTSTTVKAACWWA(SEQ IDNO25)预期含有HLA-C*0501限定的CTL表位。
(vii)TGADDTVLEEMNLPGRWKPKMIG(SEQ ID NO27)和HLA-DRB1-1302蛋白质蛋白酶在具有HLA-DRB1-1302的个体中比无该HLA等位基因的患者中更经常地在位置37发生一致氨基酸天冬酰胺(N)的氨基酸残基改变,该改变频率高于随机突变(在对其他HLA等位基因进行调整后比值比=20.0,P-值=0.0006)。此外,在蛋白酶位置37具有天冬酰胺之外的氨基酸的HLA-DRB1-1302阳性个体与那些在该位置具有天冬酰胺的HLA-DRB1-1302阳性患者相比具有增加的病毒负载。因此,在位置37包括一致氨基酸天冬酰胺的治疗剂与这些患者中在该位置最常见的其他氨基酸丝氨酸(S)相比,可提供对HLA-DRB1-1302阳性患者的保护。因此,氨基酸序列TGADDTVLEEMNLPGRWKPKMIG(SEQ ID NO27)如果包含于治疗剂中则可提供对HLA-DRB1-1302阳性患者的保护,而序列TGADDTVLEEMSLPGRWKPKMIG(SEQ ID NO28)应提供较少的保护(如果有任何保护的话)。氨基酸序列TGADDTVLEEMNLPGRWKPKMIG(SEQ IDNO27)预期含有HLA-C*0701限定的CTL表位。
(viii)GEETTTPSQKQEPIDKENYPLAS(SEQ ID NO29)和HLA-A*2402蛋白质p6在具有HLA-A*2402的个体中比无该HLA等位基因的患者中更经常地在位置29发生一致氨基酸谷氨酸(E)的氨基酸残基改变,该改变频率高于随机突变(在对其他HLA等位基因进行调整后比值比=9.4,P-值=0.0008)。此外,在p6位置29具有谷氨酸之外的氨基酸的HLA-A*2402阳性个体与那些在该位置具有谷氨酸的HLA-A*2402阳性患者相比具有增加的病毒负载。因此,在位置29包括一致氨基酸谷氨酸的治疗剂与这些患者中在该位置最常见的其他氨基酸甘氨酸(G)相比可提供对HLA-A*2402阳性患者的保护。因此,氨基酸序列GEETTTPSQKQEPIDKENYPLAS(SEQ ID NO29)如果包含于治疗剂中则可提供对HLA-A*2402阳性患者的保护,而序列GEETTTPSQKQGPIDKENYPLAS(SEQ ID NO30)应提供较少的保护(如果有任何保护的话)。氨基酸序列GEETTTPSQKQEPIDKENYPLAS(SEQ ID NO29)预期含有HLA-A*2402限定的CTL表位。
(ix)WPVKTIHTDNGSNFTSTTVKAAC(SEQ ID NO31)和HLA-B*4402蛋白质整合酶在具有HLA-B*4402的个体中比无该HLA等位基因的患者中更经常地在位置119发生一致氨基酸丝氨酸(S)的氨基酸残基改变,该改变频率高于随机突变(在对其他HLA等位基因进行调整后比值比=273.6,P-值=0.0009)。此外,在整合酶位置119具有丝氨酸之外的氨基酸的HLA-B*4402阳性个体与那些在该位置具有丝氨酸的HLA-B*4402阳性患者相比具有增加的病毒负载。因此,在位置119包括一致氨基酸丝氨酸的治疗剂与这些患者中在该位置最常见的其他氨基酸脯氨酸(P)相比可提供对HLA-B*4402阳性患者的保护。因此,氨基酸序列WPVKTIHTDNGSNFTSTTVKAAC(SEQ ID NO31)如果包含于治疗剂中则可提供对HLA-B*4402阳性患者的保护,而序列WPVKTIHTDNGPNFTSTTVKAAC(SEQ ID NO32)应提供较少的保护(如果有任何保护的话)。氨基酸序列WPVKTIHTDNGSNFTSTTVKAAC(SEQ IDNO31)预期含有HLA-B*4402限定的CTL表位。
(x)MQRGNFRNQRKTVKCFNCGK(SEQ ID NO33)和HLA-B*1801蛋白质p7在具有HLA-B*1801的个体中比无该HLA等位基因的患者中更经常地在位置9发生一致氨基酸谷氨酰胺(Q)的氨基酸残基改变,该改变频率高于随机突变(在对其他HLA等位基因进行调整后比值比=30.5,P-值=0.0010)。此外,在p7位置9具有谷氨酰胺之外的氨基酸的HLA-B*1801阳性个体与那些在该位置具有谷氨酰胺的HLA-B*1801阳性患者相比具有增加的病毒负载。因此,在位置9包括一致氨基酸谷氨酰胺的治疗剂与这些患者中在该位置最常见的其他氨基酸脯氨酸(P)相比可提供对HLA-B*1801阳性患者的保护。因此,氨基酸序列MQRGNFRNQRKTVKCFNCGK(SEQ ID NO33)如果包含于治疗剂中则可提供对HLA-B*1801阳性患者的保护,而序列MQRGNFRNPRKTVKCFNCGK(SEQ IDNO34)应提供较少的保护(如果有任何保护的话)。氨基酸序列MQRGNFRNQRKTVKCFNCGK(SEQ ID NO33)预期含有HLA-B*1801限定的CTL表位。
根据在此处公开的程序,可制备包含一种或多种上述序列的治疗组合物,且该组合物预期可用于治疗具有鉴定的特定HLA关联性的HIV感染患者。
鉴定的氨基酸序列可从商业上购得,或者可根据蛋白质化学领域中公知的且在此处不再赘述的众所周知的技术制备。
实施例8HIV疫苗的临床试验—在具有药物抗性病毒的HIV-1阳性患者中对针对突变表位的CD8和CD4 T-细胞反应的估计。
本实施例描述了促进HIV疫苗临床试验的方案。进行临床试验的各种要素(包括患者的治疗和监控)根据本公开内容对于本领域的技术人员将是公知的。通常,在此处描述的治疗剂的临床研究应由以下步骤组成向人类被试者给予一种或多种在此处描述的多肽以估计安全性和细胞的、抗体的、体液的和其他临床的反应。将介绍下面的信息作为用于HIV疫苗临床试验的一般指南。关于临床试验设计的信息也可获得于American Foundation for AIDS Research’s HIV Experimental VaccineDirectory,第1卷,No.2,1998年6月。
根据WHO对临床研究中参加者所限定的正常体检和正常实验室参数,被试者必须为健康的。被试者必须能够理解并签署同意书。被试者也必须具有正常的总白细胞计数、淋巴细胞、粒细胞和血小板计数以及血红蛋白和血细胞比容。被试者必须具有正常的下列参数值尿分析、BUN、肌酸酐、胆红素、SGOT、SGPT、碱性磷酸酶、钙、葡萄糖、CPK、CD4+细胞计数和正常的血清免疫球蛋白特征。
以下是排除标准HIV-血清阳性状态;活性药物或酒精滥用;不能提供同意书;可影响免疫功能的药物,用于急性病症如头痛或外伤的低剂量的非处方强度的NSAIDS、阿司匹林或对乙酰氨基酚(acetaminophen)除外;在主要研究者看来可干扰完成研究或估计结果的任何情况。
该研究将为双盲随机化的。安慰剂为不具有灭活病毒颗粒的疫苗溶液。被试者将随机分配到上述的一个疫苗途径中。
剂量范围给药的剂量在约1.0μg-约50mg,随后为约1.0μg-50mg的强化剂量,以研究其临床安全性和免疫原性。
给药对于每一个要检验的给药,该给药方案为在0、30、60日给予一个剂量,在180日给予强化剂量。给药途径将为肌内给药。额外的给药途径可包括皮下、口腔、直肠内、阴道内、鼻内/肌内、直肠内/肌内、鼻内/皮下、直肠内/皮下。
每一个给药途径的被试者数目对于每一个剂量水平,每一个给药途径中将有12个被试者。在这12个被试者中,8个将接受疫苗,而4个将接受不含灭活病毒颗粒的溶液。
临床安全性的终点是没有临床、免疫学和实验室参数改变的证据。免疫学功效的终点是产生对抗HIV的有效细胞、体液和抗体反应的血清转变。有效的免疫学细胞反应可用对抗不同HIV进化枝的细胞毒性T淋巴细胞反应进行研究。
根据本公开内容,在此处公开和请求专利保护的所有组合物和方法均无需过度的实验即可制备和实施。尽管本发明的组合物和方法已用优选的实施方案进行了描述,但对于本领域技术人员显而易见的是,可对在此处描述的组合物和方法及方法中的步骤和步骤顺序进行改变而不背离本发明的概念、精神和范围。更特定地,显而易见的是可用某些化学和生理学相关的试剂替代在此处描述的试剂而同时实现相同或相似的结果。所有这种对于本领域技术人员显而易见的替代和修饰均认为在由附加的权利要求所限定的本发明的精神、范围和概念之内。
实施例9在具有特定HLA类型的HIV感染患者中用于估计HIV对HLA-限定的免疫反应的适应的诊断应用从前述基于群体的分析和在图1-4和表6中获得的信息可用于确定患者中依赖于其HLA类型要测序的特定氨基酸序列,从而估计其HIV病毒逃避HLA-限定的免疫反应的程度。该信息可用于使应用的治疗个体化并指导该治疗的时间安排和类型。通常,该治疗目的应防止HIV进一步从HLA-限定的免疫反应逃避或适应于该免疫反应。
根据本实施例,用本领域中公知的标准蛋白质合成技术合成了在实施例6中鉴定的序列。这种技术描述于Sambrook等人,MolecularCloningA Laboratory Manual,第二版,Cold Spring HarborLaboratory Press,Cold Spring Harbor,New York(1989);Ausubel,F.,Brent,R.,Kingston,R.E.,Moore,D.D.,Seidman,J.G.,Smith,J.A.,Struhl,K.,Current Protocols in Molecular Biology.GreenePublishing Associates/Wiley Intersciences,New York。
一旦对蛋白质进行了测序,则根据首先在Kohler和Milstein,Nature,256495-497(1975)中描述的方法,将它们方便地用于生成抗体。
然后将由上述方法制备的抗体用于如在Ausubel的第11章描述的ELISA测定,在此处将其公开内容引入作为参考。
根据本公开内容,在此处公开和请求专利保护的所有组合物和方法均无需过度的实验即可制备和实施。尽管本发明的组合物和方法已在优选的实施方案中进行了描述,但对于本领域技术人员显而易见的是可对在此处描述的组合物和方法及方法中的步骤和步骤顺序进行改变而不背离本发明的概念、精神和范围。更特定地,显而易见的是可用某些化学和生理学相关的试剂替代在此处描述的试剂而同时实现相同或相似的结果。所有这种对于本领域技术人员显而易见的替代和修饰均认为在由附加的权利要求所限定的本发明的精神、范围和概念之内。
序列表<110>Epipop Pty Ltd<120>鉴定和开发治疗剂的方法<130>107263<160>35<170>PatentIn version 3.2<210>1<211>163<212>PRT<213>HIV<400>1Phe Ala Ile Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp1 5 10 15Phe Arg Glu Leu Asn Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu20 25 30Gly Ile Pro His Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val35 40 45Leu Asp Val Gly Asp Ala Tyr Phe Ser Val Pro Leu Asp Lys Asp Phe50 55 60Arg Lys Tyr Thr Ala Phe Thr Ile Pro Ser Ile Asn Asn Glu Thr Pro65 70 75 80Gly Ile Arg Tyr Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser85 90 95Pro Ala Ile Phe Gln Ser Ser Met Thr Lys Ile Leu Glu Pro Phe Arg
100 105 110Lys Gln Asn Pro Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr115 120 125Val Gly Ser Asp Leu Glu Ile Gly Gln His Arg Thr Lys Ile Glu Glu130 135 140Leu Arg Gln His Leu Leu Arg Trp Gly Phe Thr Thr Pro Asp Lys Lys145 150 155 160His Gln Lys<210>2<211>500<212>PRT<213>HIV<400>2Met Gly Ala Arg Ala Ser Val Leu Ser Gly Gly Glu Leu Asp Arg Trp1 5 10 15Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr Lys Leu Lys20 25 30His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Val Asn Pro35 40 45Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln Ile Leu Gly Gln Leu50 55 60Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu Lys Ser Leu Tyr Asn65 70 75 80
Thr Val Ala Thr Leu Tyr Cys Val His Gln Arg Ile Glu Val Lys Asp85 90 95Thr Lys Glu Ala Leu Asp Lys Ile Glu Glu Glu Gln Asn Lys Ser Lys100 105 110Lys Lys Ala Gln Gln Ala Ala Ala Asp Thr Gly Asn Ser Ser Gln Val115 120 125Ser Gln Asn Tyr Pro Ile Val Gln Asn Leu Gln Gly Gln Met Val His130 135 140Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val Lys Val Val Glu145 150 155 160Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe Ser Ala Leu Ser165 170 175Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu Asn Thr Val Gly180 185 190Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Thr Ile Asn Glu Glu195 200 205Ala Ala Glu Trp Asp Arg Leu His Pro Val His Ala Gly Pro Ile Ala210 215 220Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile Ala Gly Thr Thr225 230 235 240Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr Asn Asn Pro Pro Ile245 250 255
Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu Gly Leu Asn Lys260 265 270Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp Ile Arg Gln Gly275 280 285Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys Thr Leu290 295 300Arg Ala Glu Gln Ala Ser Gln Glu Val Lys Asn Trp Met Thr Glu Thr305 310 315 320Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr Ile Leu Lys Ala325 330 335Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met Thr Ala Cys Gln Gly340 345 350Val Gly Gly Pro Gly His Lys Ala Arg Val Leu Ala Glu Ala Met Ser355 360 365Gln Val Thr Asn Ser Ala Thr Ile Met Met Gln Arg Gly Asn Phe Arg370 375 380Asn Gln Arg Lys Thr Val Lys Cys Phe Asn Cys Gly Lys Glu Gly His385 390 395 400Ile Ala Arg Asn Cys Arg Ala Pro Arg Lys Lys Gly Cys Trp Lys Cys405 410 415Gly Lys Glu Gly His Gln Met Lys Asp Cys Thr Glu Arg Gln Ala Asn420 425 430
Phe Leu Gly Lys Ile Trp Pro Ser His Lys Gly Arg Pro Gly Asn Phe435 440 445Leu Gln Ser Arg Pro Glu Pro Thr Ala Pro Pro Glu Glu Ser Phe Arg450 455 460Phe Gly Glu Glu Thr Thr Thr Pro Ser Gln Lys Gln Glu Pro Ile Asp465 470 475 480Lys Glu Leu Tyr Pro Leu Ala Ser Leu Arg Ser Leu Phe Gly Asn Asp485 490 495Pro Ser Ser Gln500<210>3<211>1003<212>PRT<213>HIV<400>3Phe Phe Arg Glu Asn Leu Ala Phe Pro Gln Gly Lys Ala Arg Glu Phe1 5 10 15Ser Ser Glu Gln Thr Arg Ala Asn Ser Pro Thr Arg Arg Glu Leu Gln20 25 30Val Trp Gly Glu Asp Asn Asn Ser Thr Ser Glu Ala Gly Ala Asp Arg35 40 45Gln Gly Thr Val Ser Phe Ser Phe Pro Gln Ile Thr Leu Trp Gln Arg50 55 60
Pro Leu Val Thr Ile Lys Ile Gly Gly Gln Leu Lys Glu Ala Leu Leu65 70 75 80Asp Thr Gly Ala Asp Asp Thr Val Leu Glu Glu Met Asn Leu Pro Gly85 90 95Arg Trp Lys Pro Lys Met Ile Gly Gly Ile Gly Gly Phe Ile Lys Val100 105 110Arg Gln Tyr Asp Gln Ile Ile Ile Glu Ile Cys Gly His Lys Ala Ile115 120 125Gly Thr Val Leu Val Gly Pro Thr Pro Val Asn Ile Ile Gly Arg Asn130 135 140Leu Leu Thr Gln Leu Gly Cys Thr Leu Asn Phe Pro Ile Ser Pro Ile145 150 155 160Glu Thr Val Pro Val Lys Leu Lys Pro Gly Met Asp Gly Pro Lys Val165 170 175Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile Lys Ala Leu Val Glu Ile180 185 190Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys Ile Gly Pro Glu195 200 205Asn Pro Tyr Asn Thr Pro Val Phe Ala Ile Lys Lys Lys Asp Ser Thr210 215 220Lys Trp Arg Lys Leu Val Asp Phe Arg Glu Leu Asn Lys Arg Thr Gln225 230 235 240
Asp Phe Trp Glu Val Gln Leu Gly Ile Pro His Pro Ala Gly Leu Lys245 250 255Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser260 265 270Val Pro Leu Asp Lys Asp Phe Arg Lys Tyr Thr Ala Phe Thr Ile Pro275 280 285Ser Ile Asn Asn Glu Thr Pro Gly Ile Arg Tyr Gln Tyr Asn Val Leu290 295 300Pro Gln Gly Trp Lys Gly Ser Pro Ala Ile Phe Gln Ser Ser Met Thr305 310 315 320Lys Ile Leu Glu Pro Phe Arg Lys Gln Asn Pro Asp Ile Val Ile Tyr325 330 335Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser Asp Leu Glu Ile Gly Gln340 345 350His Arg Thr Lys Ile Glu Glu Leu Arg Gln His Leu Leu Lys Trp Gly355 360 365Phe Thr Thr Pro Asp Lys Lys His Gln Lys Glu Pro Pro Phe Leu Trp370 375 380Met Gly Tyr Glu Leu His Pro Asp Lys Trp Thr Val Gln Pro Ile Val385 390 395 400Leu Pro Glu Lys Asp Ser Trp Thr Val Asn Asp Ile Gln Lys Leu Val405 410 415
Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Ala Gly Ile Lys Val Arg420 425 430Gln Leu Cys Lys Leu Leu Arg Gly Thr Lys Ala Leu Thr Glu Val Ile435 440 445Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu Ala Glu Asn Arg Glu Ile450 455 460Leu Lys Glu Pro Val His Gly Val Tyr Tyr Asp Pro Ser Lys Asp Leu465 470 475 480Ile Ala Glu Ile Gln Lys Gln Gly Gln Gly Gln Trp Thr Tyr Gln Ile485 490 495Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr Gly Lys Tyr Ala Arg Met500 505 510Arg Gly Ala His Thr Asn Asp Val Lys Gln Leu Thr Glu Ala Val Gln515 520 525Lys Ile Ala Thr Glu Ser Ile Val Ile Trp Gly Lys Thr Pro Lys Phe530 535 540Lys Leu Pro Ile Gln Lys Glu Thr Trp Glu Ala Trp Trp Thr Glu Tyr545 550 555 560Trp Gln Ala Thr Trp Ile Pro Glu Trp Glu Phe Val Asn Thr Pro Pro565 570 575Leu Val Lys Leu Trp Tyr Gln Leu Glu Lys Glu Pro Ile Val Gly Ala580 585 590
Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn Arg Glu Thr Lys Leu Gly595 600 605Lys Ala Gly Tyr Val Thr Asp Arg Gly Arg Gln Lys Val Val Ser Leu610 615 620Thr Asp Thr Thr Asn Gln Lys Thr Glu Leu Gln Ala Ile His Leu Ala625 630 635 640Leu Gln Asp Ser Gly Leu Glu Val Asn Ile Val Thr Asp Ser Gln Tyr645 650 655Ala Leu Gly Ile Ile Gln Ala Gln Pro Asp Lys Ser Glu Ser Glu Leu660 665 670Val Ser Gln Ile Ile Glu Gln Leu Ile Lys Lys Glu Lys Val Tyr Leu675 680 685Ala Trp Val Pro Ala His Lys Gly Ile Gly Gly Asn Glu Gln Val Asp690 695 700Lys Leu Val Ser Ala Gly Ile Arg Lys Val Leu Phe Leu Asp Gly Ile705 710 715 720Asp Lys Ala Gln Glu Glu His Glu Lys Tyr His Ser Asn Trp Arg Ala725 730 735Met Ala Ser Asp Phe Asn Leu Pro Pro Val Val Ala Lys Glu Ile Val740 745 750Ala Ser Cys Asp Lys Cys Gln Leu Lys Gly Glu Ala Met His Gly Gln755 760 765
Val Asp Cys Ser Pro Gly Ile Trp Gln Leu Asp Cys Thr His Leu Glu770 775 780Gly Lys Ile Ile Leu Val Ala Val His Val Ala Ser Gly Tyr Ile Glu785 790 795 800Ala Glu Val Ile Pro Ala Glu Thr Gly Gln Glu Thr Ala Tyr Phe Leu805 810 815Leu Lys Leu Ala Gly Arg Trp Pro Val Lys Thr Ile His Thr Asp Asn820 825 830Gly Ser Asn Phe Thr Ser Thr Thr Val Lys Ala Ala Cys Trp Trp Ala835 840 845Gly Ile Lys Gln Glu Phe Gly Ile Pro Tyr Asn Pro Gln Ser Gln Gly850 855 860Val Val Glu Ser Met Asn Lys Glu Leu Lys Lys Ile Ile Gly Gln Val865 870 875 880Arg Asp Gln Ala Glu His Leu Lys Thr Ala Val Gln Met Ala Val Phe885 890 895Ile His Asn Phe Lys Arg Lys Gly Gly Ile Gly Gly Tyr Ser Ala Gly900 905 910Glu Arg Ile Val Asp Ile Ile Ala Thr Asp Ile Gln Thr Lys Glu Leu915 920 925Gln Lys Gln Ile Thr Lys Ile Gln Asn Phe Arg Val Tyr Tyr Arg Asp930 935 940
Ser Arg Asp Pro Leu Trp Lys Gly Pro Ala Lys Leu Leu Trp Lys Gly945 950 955 960Glu Gly Ala Val Val Ile Gln Asp Asn Ser Asp lle Lys Val Val Pro965 970 975Arg Arg Lys Ala Lys Ile Ile Arg Asp Tyr Gly Lys Gln Met Ala Gly980 985 990Asp Asp Cys Val Ala Ser Arg Gln Asp Glu Asp995 1000<210>4<211>192<212>PRT<213>HIV<400>4Met Glu Asn Arg Trp Gln Val Met Ile Val Trp Gln Val Asp Arg Met1 5 10 15Arg Ile Arg Thr Trp Lys Ser Leu Val Lys His His Met Tyr Ile Ser20 25 30Lys Lys Ala Lys Gly Trp Phe Tyr Arg His His Tyr Glu Ser Thr His35 40 45Pro Arg Ile Ser Ser Glu Val His Ile Pro Leu Gly Asp Ala Lys Leu50 55 60Val Ile Thr Thr Tyr Trp Gly Leu His Thr Gly Glu Arg Asp Trp His65 70 75 80
Leu Gly Gln Gly Val Ser Ile Glu Trp Arg Lys Arg Arg Tyr Ser Thr85 90 95Gln Val Asp Pro Asp Leu Ala Asp Gln Leu Ile His Leu Tyr Tyr Phe100 105 110Asp Cys Phe Ser Glu Ser Ala Ile Arg Asn Ala Ile Leu Gly His Ile115 120 125Val Ser Pro Arg Cys Glu Tyr Gln Ala Gly His Asn Lys Val Gly Ser130 135 140Leu Gln Tyr Leu Ala Leu Ala Ala Leu Ile Thr Pro Lys Lys Ile Lys145 150 155 160Pro Pro Leu Pro Ser Val Thr Lys Leu Thr Glu Asp Arg Trp Asn Lys165 170 175Pro Gln Lys Thr Lys Gly His Arg Gly Ser His Thr Met Asn Gly His180 185 190<210>5<211>96<212>PRT<213>HIV<400>5Met Glu Gln Ala Pro Glu Asp Gln Gly Pro Gln Arg Glu Pro Tyr Asn1 5 10 15Glu Trp Thr Leu Glu Leu Leu Glu Glu Leu Lys Ser Glu Ala Val Arg20 25 30His Phe Pro Arg Ile Trp Leu His Gly Leu Gly Gln His Ile Tyr Glu
35 40 45Thr Tyr Gly Asp Thr Trp Ala Gly Val Glu Ala Ile Ile Arg Ile Leu50 55 60Gln Gln Leu Leu Phe Ile His Phe Arg Ile Gly Cys Gln His Ser Arg65 70 75 80Ile Gly Ile Thr Arg Gln Arg Arg Ala Arg Asn Gly Ala Ser Arg Ser85 90 95<210>6<211>101<212>PRT<213>HIV<400>6Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser1 5 10 15Gln Pro Lys Thr Ala Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Phe20 25 30His Cys Gln Val Cys Phe Ile Lys Lys Gly Leu Gly Ile Ser Tyr Gly35 40 45Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr50 55 60His Gln Val Ser Leu Ser Lys Gln Pro Ala Ser Gln Pro Arg Gly Asp65 70 75 80Pro Thr Gly Pro Lys Glu Ser Lys Lys Lys Val Glu Arg Glu Thr Glu85 90 95
Thr Asp Pro Val Asp100<210>7<211>116<212>PRT<213>HIV<400>7Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Leu Lys Thr Val1 5 10 15Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn Pro Pro Pro Ser Pro Glu20 25 30Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg35 40 45Gln Arg Gln Ile Arg Ser Ile Ser Gly Trp Ile Leu Ser Thr Tyr Leu50 55 60Gly Arg Pro Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg65 70 75 80Leu Thr Leu Asp Cys Asn Glu Asp Cys Gly Thr Ser Gly Thr Gln Gly85 90 95Val Gly Ser Pro Gln Ile Leu Val Glu Ser Pro Ala Val Leu Glu Ser100 105 110Gly Thr Lys Glu115
<210>8<211>82<212>PRT<213>HIV<400>8Met Gln Pro Leu Glu Ile Leu Ala Ile Val Ala Leu Val Val Ala Ala1 5 10 15Ile Ile Ala Ile Val Val Trp Thr Ile Val Phe Ile Glu Tyr Arg Lys20 25 30Ile Leu Arg Gln Arg Lys Ile Asp Arg Leu Ile Asp Arg Ile Arg Glu35 40 45Arg Ala Glu Asp Ser Gly Asn Glu Ser Glu Gly Glu Glu Ser Ala Leu50 55 60Val Glu Met Gly Val Glu Met Gly His His Ala Pro Trp Asp Val Asp65 70 75 80Asp Leu<210>9<211>856<212>PRT<213>HIV<400>9Met Arg Val Lys Gly Asn Asn Gln His Leu Trp Lys Trp Gly Trp Lys1 5 10 15Trp Gly Thr Met Leu Leu Gly Met Leu Met Ile Cys Ser Ala Thr Glu
20 25 30Lys Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala35 40 45Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Thr Glu50 55 60Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn65 70 75 80Pro Gln Glu Val Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp85 90 95Lys Asn Asn Met Val Glu Gln Met His Glu Asp Ile Ile Ser Leu Trp100 105 110Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr115 120 125Leu Asn Cys Thr Asp Leu Asn Asn Asp Thr Asn Thr Asn Asn Thr Ser130 135 140Gly Ser Asn Asn Met Glu Lys Gly Glu Ile Lys Asn Cys Ser Phe Asn145 150 155 160Ile Thr Thr Ser Ile Arg Asp Lys Met Gln Lys Glu Tyr Ala Leu Phe165 170 175Tyr Lys Leu Asp Val Val Pro Ile Asp Asn Asp Asn Thr Ser Tyr Arg180 185 190Leu Ile Ser Cys Asn Thr Ser Val Ile Thr Gln Ala Cys Pro Lys Val
195 200 205Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Phe Ala210 215 220Ile Leu Lys Cys Asn Asp Lys Lys Phe Asn Gly Thr Gly Pro Cys Thr225 230 235 240Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Arg Pro Val Val Ser245 250 255Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val Val Ile260 265 270Arg Ser Glu Asn Phe Thr Asn Asn Ala Lys Thr Ile Ile Val Gln Leu275 280 285Asn Glu Ser Val Glu Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg290 295 300Lys Ser Ile Ser Ile His Ile Gly Pro Gly Arg Ala Phe Tyr Ala Thr305 310 315 320Gly Glu Ile Gly Asp Ile Arg Gln Ala His Cys Asn Ile Ser Arg Ala325 330 335Glu Trp Asn Asn Thr Leu Lys Gln Ile Val Lys Lys Leu Arg Glu Gln340 345 350Phe Gly Lys Asn Lys Thr Ile Val Phe Asn Gln Ser Ser Gly Gly Asp355 360 365Pro Glu Ile Val Met His Ser Phe Asn Cys Gly Gly Glu Phe Phe Tyr
370 375 380Cys Asn Thr Thr Gln Leu Phe Asn Ser Thr Trp Asn Asn Ser Thr Trp385 390 395 400Asn Thr Glu Glu Ser Asn Asn Thr Glu Gly Asn Glu Thr Ile Thr Leu405 410 415Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Glu Val Gly Lys420 425 430Ala Met Tyr Ala Pro Pro Ile Arg Gly Gln Ile Arg Cys Ser Ser Asn435 440 445Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly Asn Asn Asn Asn Lys450 455 460Thr Glu Thr Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg465 470 475 480Ser Glu Leu Tyr Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val485 490 495Ala Pro Thr Lys Ala Lys Arg Arg Val Val Gln Arg Glu Lys Arg Ala500 505 510Val Gly Ile Gly Ala Met Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser515 520 525Thr Met Gly Ala Ala Ser Ile Thr Leu Thr Val Gln Ala Arg Gln Leu530 535 540Leu Ser Gly Ile Val Gln Gln Gln Asn Asn Leu Leu Arg Ala Ile Glu
545 550 555 560Ala Gln Gln His Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu565 570 575Gln Ala Arg Val Leu Ala Val Glu Arg Tyr Leu Lys Asp Gln Gln Leu580 585 590Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Thr Thr Ala Val595 600 605Pro Trp Asn Thr Ser Trp Ser Asn Lys Ser Leu Asn Lys Ile Trp Asp610 615 620Asn Met Thr Trp Met Glu Trp Glu Lys Glu Ile Asn Asn Tyr Thr Gly625 630 635 640Ile Ile Tyr Asn Leu Ile Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn645 650 655Glu Gln Glu Leu Leu Glu Leu Asp Lys Trp Ala Ser Leu Trp Asn Trp660 665 670Phe Asp Ile Ser Lys Trp Leu Trp Tyr Ile Lys Ile Phe Ile Met Ile675 680 685Val Gly Gly Leu Ile Gly Leu Arg Ile Val Phe Ala Val Leu Ser Ile690 695 700Val Asn Arg Val Arg Gln Gly Tyr Ser Pro Leu Ser Phe Gln Thr His705 710 715 720Leu Pro Thr Pro Arg Gly Pro Asp Arg Pro Glu Gly Ile Glu Glu Glu
725 730 735Gly Gly Glu Arg Asp Arg Asp Arg Ser Ser Arg Leu Val Asp Gly Phe740 745 750Leu Ala Ile Ile Trp Asp Asp Leu Arg Ser Leu Cys Leu Phe Ser Tyr755 760 765His Arg Leu Arg Asp Leu Leu Leu Ile Val Thr Arg Ile Val Glu Leu770 775 780Leu Gly Arg Arg Gly Trp Glu Ile Leu Lys Tyr Trp Trp Asn Leu Leu785 790 795 800Gln Tyr Trp Ser Gln Glu Leu Lys Asn Ser Ala Val Ser Leu Leu Asn805 810 815Ala Thr Ala Ile Ala Val Ala Glu Gly Thr Asp Arg Ile Ile Glu Val820 825 830Val Gln Arg Ala Cys Arg Ala Ile Leu His Ile Pro Arg Arg Ile Arg835 840 845Gln Gly Val Glu Arg Ala Leu Leu850 855<210>10<211>206<212>PRT<213>HIV<400>10Met Gly Gly Lys Trp Ser Lys Ser Ser Met Val Gly Trp Pro Ala Val1 5 10 15
Arg Glu Arg Met Arg Arg Ala Glu Pro Ala Ala Asp Gly Val Gly Ala20 25 30Val Ser Arg Asp Leu Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr35 40 45Ala Ala Thr Asn Ala Asp Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu50 55 60Glu Val Gly Phe Pro Val Arg Pro Gln Val Pro Leu Arg Pro Met Thr65 70 75 80Tyr Lys Gly Ala Leu Asp Leu Ser Phe Phe Leu Lys Glu Lys Gly Gly85 90 95Leu Glu Gly Leu Ile Tyr Ser Gln Lys Arg Gln Asp Ile Leu Asp Leu100 105 110Trp Val Tyr His Thr Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr115 120 125Pro Gly Pro Gly Ile Arg Tyr Pro Leu Thr Phe Gly Trp Cys Phe Lys130 135 140Leu Val Pro Val Glu Pro Glu Lys Val Glu Glu Ala Asn Glu Gly Glu145 150 155 160Asn Asn Ser Leu Leu His Pro Met Ser Gln His Gly Met Asp Asp Pro165 170 175Glu Arg Glu Val Leu Met Trp Lys Phe Asp Ser Arg Leu Ala Phe Arg180 185 190
His Met Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys195 200 205<210>11<211>138<212>PRT<213>HIV<400>11Pro Gln Ile Thr Leu Trp Gln Arg Pro Ile Val Thr Ile Lys Ile Glyl 5 10 15Gly Gln Leu Arg Glu Ala Leu Leu Asp Thr Gly Ala Asp Asn Thr Val20 25 30Leu Glu Glu Met Asn Leu Pro Gly Arg Trp Lys Pro Lys Ile Ile Gly35 40 45Gly Val Gly Gly Phe Ile Lys Val Arg Gln Tyr Asp Gln Ile Pro Ile50 55 60Glu Ile Cys Gly His Lys Ala Ile Gly Thr Val Leu Val Gly Pro Thr65 70 75 80Pro Ala Asn Ile Ile Gly Arg Asn Leu Met Thr Gln Ile Gly Cys Thr85 90 95Leu Asn Phe Gly Arg Trp Lys Pro Lys Met Ile Val Gly Ile Gly Gly100 105 110Leu Ile Lys Val Arg Gln Tyr Asp Gln Leu Val Gly Pro Thr Pro Val115 120 125
Asn Val Ile Gly Arg Asn Leu Leu Thr Gln130 135<210>12<211>138<212>PRT<213>HIV<400>12Pro Gln Ile Thr Leu Trp Gln Arg Pro Leu Val Thr Ile Lys Ile Gly1 5 10 15Gly Gln Leu Lys Glu Ala Leu Leu Asp Thr Gly Ala Asp Asp Thr Val20 25 30Leu Glu Glu Met Asn Leu Pro Gly Arg Trp Lys Pro Lys Met Ile Gly35 40 45Gly Ile Gly Gly Phe lle Lys Val Arg Gln Tyr Asp Gln Ile Pro Ile50 55 60Glu Ile Cys Gly His Lys Ala Ile Gly Thr Val Leu Val Gly Pro Thr65 70 75 80Pro Val Asn Ile Ile Gly Arg Asn Leu Leu Thr Gln Ile Gly Cys Thr85 90 95Leu Asn Phe Gly Arg Trp Lys Pro Lys Met Ile Gly Gly Ile Gly Gly100 105 110Phe Ile Lys Val Arg Gln Tyr Asp Gln Leu Val Gly Pro Thr Pro Val115 120 125
Asn Ile Ile Gly Arg Asn Leu Leu Thr Gln130 135<210>13<211>203<212>PRT<213>HIV<400>13Leu Val Glu Ile Cys Thr Glu Leu Glu Lys Glu Gly Lys Ile Ser Thr1 5 10 15Pro Val Phe Ala Ile Lys Arg Lys Asp Ser Thr Arg Trp Arg Lys Leu20 25 30Val Asp Phe Asp Ile Val Ile Tyr Gln Tyr Val Asp Asp Leu Tyr Val35 40 45Gly Ser His Leu Leu Lys Trp Gly Phe Tyr Thr Pro Asp Lys Lys His50 55 60Gln Ile Cys Thr Glu Met Glu Lys Asp Gly Lys Ile Ser Lys Ile Gly65 70 75 80Ala Ile Lys Lys Lys Asp Ser Asp Lys Trp Arg Lys Val Val Asp Phe85 90 95Arg Glu Leu Asn Gln Leu Gly Ile Pro His Pro Gly Gly Leu Lys Lys100 105 110Asn Lys Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser Ile115 120 125Pro Leu Asp Lys Asp Phe Arg Tyr Gln Tyr Asn Val Leu Pro Met Gly
130 135 140Trp Lys Gly Ser Pro Ala Gln Asn Pro Asp Ile Val Ile Cys Gln Tyr145 150 155 160Met Asp Asp Leu Tyr Val Ala Ser Asp Leu Glu Ile Gly Gln His Arg165 170 175Thr Lys Ile Glu Glu Leu Arg Gln His Leu Trp Lys Trp Gly Phe Phe180 185 190Thr Pro Asp Gln Lys His Gln Lys Glu Pro Pro195 200<210>14<211>203<212>PRT<213>HIV<400>14Leu Val Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Thr1 5 10 15Pro Val Phe Ala Ile Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu20 25 30Val Asp Phe Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val35 40 45Gly Ser His Leu Leu Lys Trp Gly Phe Thr Thr Pro Asp Lys Lys His50 55 60Gln Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys Ile Gly65 70 75 80
Ala Ile Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe85 90 95Arg Glu Leu Asn Gln Leu Gly Ile Pro His Pro Ala Gly Leu Lys Lys100 105 110Lys Lys Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser Val115 120 125Pro Leu Asp Lys Asp Phe Arg Tyr Gln Tyr Asn Val Leu Pro Gln Gly130 135 140Trp Lys Gly Ser Pro Ala Gln Asn Pro Asp Ile Val Ile Tyr Gln Tyr145 150 155 160Met Asp Asp Leu Tyr Val Gly Ser Asp Leu Glu Ile Gly Gln His Arg165 170 175Thr Lys Ile Glu Glu Leu Arg Gln His Leu Leu Lys Trp Gly Phe Thr180 185 190Thr Pro Asp Lys Lys His Gln Lys Glu Pro Pro195 200<210>15<211>22<212>PRT<213>hiv<400>15Phe Leu Asp Gly Ile Asp Lys Ala Gln Glu Glu His Glu Lys Tyr His1 5 10 15
Ser Asn Trp Arg Ala Met20<210>16<211>22<212>PRT<213>HIV<400>16Phe Leu Asp Gly Ile Asp Lys Ala Gln Glu Asp His Glu Lys Tyr His1 5 10 15Ser Asn Trp Arg Ala Met20<210>17<211>23<212>PRT<213>HIV<400>17Gly Lys Trp Ser Lys Ser Ser Met Val Gly Trp Pro Ala Val Arg Glu1 5 10 15Arg Met Arg Arg Ala Glu Pro20<210>18<211>23<212>PRT<213>HIV<400>18Gly Lys Trp Ser Lys Ser Ser Met Val Gly Trp Pro Ala Val Arg Glu1 5 10 15
Arg Met Arg Arg Ala Glu Pro20<210>19<211>23<212>PRT<213>HIV<400>19Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln Val Pro1 5 10 15Leu Arg Pro Met Thr Tyr Lys20<210>20<211>23<212>PRT<213>HIV<400>20Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Lys Pro Gln Val Pro1 5 10 15Leu Arg Pro Met Thr Tyr Lys20<210>21<211>23<212>PRT<213>HIV<400>21Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Lys Pro Gln Val Pro
1 5 10 15Leu Arg Pro Met Thr Tyr Lys20<210>22<211>23<212>PRT<213>HIV<400>22Ser Phe Arg Phe Gly Glu Glu Thr Thr Thr Pro Ser Gln Lys Gln Glu1 5 10 15Pro Ile Asp Lys Glu Asn Tyr20<210>23<211>23<212>PRT<213>HIV<400>23Ser Phe Arg Phe Gly Glu Glu Thr Thr Thr Pro Pro Gln Lys Gln Glu1 5 10 15Pro Ile Asp Lys Glu Asn Tyr20<210>24<211>23<212>PRT<213>HIV<400>24
Arg Ile Gly Cys Gln His Ser Arg Ile Gly Ile Ile Arg Gln Arg Arg1 5 10 15Ala Arg Asn Gly Ala Ser Arg20<210>25<211>23<212>PRT<213>HIV<400>25Arg Ile Gly Cys Gln His Ser Arg Ile Gly Ile Thr Arg Gln Arg Arg1 5 10 15Ala Arg Asn Gly Ala Ser Arg20<210>26<211>23<212>PRT<213>HIV<400>26Lys Thr Ile His Thr Asp Asn Gly Ser Asn Phe Thr Ser Thr Thr Val1 5 10 15Lys Ala Ala Cys Trp Trp Ala20<210>27<211>23<212>PRT<213>HIV<400>27
Lys Thr Ile His Thr Asp Asn Gly Ser Asn Phe Ile Ser Thr Thr Val1 5 10 15Lys Ala Ala Cys Trp Trp Ala20<210>28<211>23<212>PRT<213>HIV<400>28Thr Gly Ala Asp Asp Thr Val Leu Glu Glu Met Asn Leu Pro Gly Arg1 5 10 15Trp Lys Pro Lys Met Ile Gly20<210>29<211>23<212>PRT<213>HIV<400>29Thr Gly Ala Asp Asp Thr Val Leu Glu Glu Met Ser Leu Pro Gly Arg1 5 10 15Trp Lys Pro Lys Met Ile Gly20<210>30<211>23<212>PRT<213>HIV
<400>30Gly Glu Glu Thr Thr Thr Pro Ser Gln Lys Gln Glu Pro Ile Asp Lys1 5 10 15Glu Asn Tyr Pro Leu Ala Ser20<210>31<211>23<212>PRT<213>HIV<400>31Gly Glu Glu Thr Thr Thr Pro Ser Gln Lys Gln Gly Pro Ile Asp Lys1 5 10 15Glu Asn Tyr Pro Leu Ala Ser20<210>32<211>23<212>PRT<213>HIV<400>32Trp Pro Val Lys Thr Ile His Thr Asp Asn Gly Ser Asn Phe Thr Ser1 5 10 15Thr Thr Val Lys Ala Ala Cys20<210>33<211>23<212>PRT<213>HIV
<400>33Trp Pro Val Lys Thr Ile His Thr Asp Asn Gly Pro Asn Phe Thr Ser1 5 10 15Thr Thr Val Lys Ala Ala Cys20<210>34<211>20<212>PRT<213>HIV<400>34Met Gln Arg Gly Asn Phe Arg Asn Gln Arg Lys Thr Val Lys Cys Phe1 5 10 15Asn Cys Gly Lys20<210>35<211>20<212>PRT<213>HIV<400>35Met Gln Arg Gly Asn Phe Arg Asn Pro Arg Lys Thr Val Lys Cys Phe1 5 10 15Asn Cys Gly Lys20
权利要求
1.一种确定宿主基因中的变异对具有蛋白质替代的微生物的选择的影响的方法,该方法包含以下步骤(a)选择被特定微生物感染的患者或动物群体,并根据至少一个选定的参与宿主对微生物反应的内在多态标记对该群体中的所有个体进行分类;(b)在群体中于来自步骤(a)中鉴定的每一个类型的足够数目个体中鉴定和确定微生物中多核苷酸和/或多肽的至少部分序列;(c)在群体中确定步骤(b)中分析的序列中每一个残基位置上的一致(即最频繁的)氨基酸;(d)对在步骤(a)和步骤(b)中获得的数据进行比较以确定步骤(a)中的宿主多态序列如何在步骤(b)中确定的序列中的第一个目标氨基酸残基上增加或降低微生物多态的概率;(e)对步骤(b)中鉴定的每一个氨基酸重复步骤(d)并比较获得的数据。
2.根据权利要求1的方法,其中在步骤(d)中应用的统计学分析是单变量的或多变量的。
3.根据权利要求1或2的方法,其中将获得的数据在多重Logistic回归模型中进行分型,其中在该模型中步骤(a)中获得的数据可用作解释性协变量,而将步骤(b)中获得的数据用作结果变量。
4.根据权利要求3的方法,其中对于目标结果,可向多态分配一个值如一(1),且可向无多态分配另一个值如零(0)。
5.根据权利要求1-4任一项的方法,其中步骤(a)中选择的多态序列与被感染动物对感染其的微生物的反应相关联。
6.根据权利要求5的方法,其中宿主内部多态标记核酸序列是那些形成HLA的核酸序列。
7.根据权利要求6的方法,其中HLA类型标记可为I型HLA(A、B或C)或II型HLA(DR、DQ)。
8.根据权利要求5的方法,其中所述标记序列对于微生物是特异性的,这在于它编码受体或活性地参与宿主-微生物相互作用的其他蛋白质,如趋化因子受体,例如参与HIV结合的CCR5。
9.根据权利要求1-8中任何一项的方法在检查在宿主中展示病原性状的大量生物所面临的选择压力中的应用。
10.根据权利要求9的应用,其中该生物包括但不局限于细菌、真菌、分枝菌属、病毒和病毒样颗粒。
11.根据权利要求10的应用,用于检查已进行改变以快速进化的微生物,该微生物包括HIV和AIDS相关的病毒和肝炎相关的病毒,如HCV和HBV。
12.根据权利要求1的方法,其中步骤(b)包括DNA直接测序或如RFLP、SNP、SSO、SSP、串联重复序列可变数(VNTR)等的分析方法。
13.一种鉴定宿主多态标记序列中的变异和第二个变量如治疗药物或疫苗对具有特定氨基酸变体的微生物的选择的影响和相互作用的方法,该方法包含以下步骤(a)选择被微生物感染的患者或动物群体,其中的一些接受了第二个变量作为对该微生物的部分治疗,并根据至少一个选定的参与宿主对微生物反应的宿主内部多态标记序列对所述群体中的个体进行分类;(b)在用第二个变量处理之前和之中,在群体每一个类型的足够数目个体中鉴定和确定微生物中的部分或全长多核苷酸和/或多肽序列,该多核苷酸和/或多肽序列是第二个变量的潜在或已知的靶标,另外以相似的时间间隔在相似的但未经治疗的个体中进行上述操作;(c)确定在步骤(b)中确定的时间点之间步骤(b)中检查的序列中每一个残基上是否发生了变化(“突变”);(d)对在步骤(a)中获得的数据、治疗和未治疗的序列中用第二个变量处理与否的作用以及步骤(c)中获得的数据进行比较,以确定步骤(a)中的多态序列和用第二个变量的处理如何影响步骤(c)中第一个目标氨基酸残基上突变的概率;(e)对步骤(c)中确定的序列中每一个氨基酸重复步骤(d)。
14.一种确定宿主多态标记序列的变异和治疗药物对具有特定氨基酸变体的微生物的选择的影响和相互作用的方法,该方法包含以下步骤(a)选择被微生物感染的患者或动物群体,其中的一些接受了至少一种意欲治疗存在的微生物的药物,并根据至少一个选定的参与宿主对微生物反应的宿主内部多态标记序列对所述群体中的个体进行分类;(b)在用第二个变量处理之前和之中,在群体每一个类型的足够数目个体中鉴定和确定微生物中的部分或全长多核苷酸和/或多肽序列,该多核苷酸和/或多肽序列是所述药物的潜在或已知的靶标,另外以相似的时间间隔在相似的但未经治疗的个体中进行上述操作;(c)确定在步骤(b)中确定的时间点之间步骤(b)中检查的序列中每一个残基上是否发生了变化(“突变”);(d)对在步骤(a)中获得的数据、治疗和未治疗的序列之间用第二个变量处理与否的作用以及步骤(c)中获得的数据进行比较,以确定步骤(a)中的多态序列和药物处理如何影响步骤(c)中第一个目标氨基酸残基上突变的概率;(e)对步骤(c)中确定的序列中每一个氨基酸重复步骤(d)。
15.一种包含以下步骤的方法(a)对被HIV感染的宿主群体进行HLA测序;(b)对每一个患者中主要的HIV种类进行全长或部分测序;(c)通过在病毒的每一个残基位置确定最常见的氨基酸残基以确定HIV的一致序列;(d)在每一个生物残基上(i)对每一个个体(患者)确定目标HIV氨基酸残基与一致残基相比是相同的(“非突变的”)还是不同的(“突变的”);(ii)进行多变量回归模型,对于目标结果,对突变的氨基酸分配值(1)或对非突变的氨基酸分配值(0);和(iii)在多变量模型中检查合适的潜在解释性协变量以寻找与目标结果的关联性。
16.根据权利要求15的方法,其中解释性协变量是患者个体的HLA等位基因。
17.根据权利要求15的方法,其中解释性协变量是由宿主摄取的并导向目标蛋白质的治疗剂药物。
18.根据权利要求17的方法,其中治疗剂药物是反转录酶抑制剂抗反转录病毒药物或蛋白酶抑制剂。
19.根据权利要求15的方法,其中解释性协变量是在宿主蛋白质中其他位置上的突变。
20.一种设计能够在患者中诱导特定的T-细胞反应的治疗剂的方法,该方法包含以下步骤(a)实施如上所述权利要求1的方法;和(b)分析数据以鉴定作为该群体感染结果而在病毒群体中出现的多态,该多态是HLA相关联的;和(c)制备包括在步骤(b)中鉴定的多态的治疗剂。
21.一种鉴定T细胞表位的方法,该方法包含以下步骤(a)实施如上所述权利要求1的方法;和(b)分析数据以鉴定作为该群体感染结果而在病毒群体中出现的多态频率,其中该多态是HLA相关联的。
22.一种设计疫苗以防止或延迟在用对微生物特异性的特定药物治疗的患者中出现药物抗性的方法,其中该药物在核苷酸或氨基酸水平影响微生物的复制,该方法包含以下步骤(a)实施如上所述权利要求1的方法;和(b)分析数据以鉴定已用抗反转录病毒药物治疗的感染个体中在病毒群体中发生的多态频率,其中该多态频率是在微生物中药物具有活性的核苷酸或氨基酸序列区域中确定的;和(c)设计一种或多种治疗剂,该治疗剂促进对含有展示一种或多种所鉴定多态的病毒群体的细胞的T-细胞反应。
22.多肽序列,其选自SEQ ID NO2-10、11、13、15、17、19、21、23、25、27、29、31或33。
23.治疗剂,含有选自SEQ ID NO2-10、11、13、15、17、19、21、23、25、27、29、31或33的氨基酸序列。
24.能够在患者中表达氨基酸序列的载体构建体,其包含能够表达含有SEQ ID NO2-10、11、13、15、17、19、21、23、25、27、29、31或33的氨基酸序列的核苷酸序列。
全文摘要
本发明总体上涉及鉴定和确定生物活性氨基酸序列的领域。具体地,本发明提供了确定宿主基因中的变异对具有特定氨基酸变体的微生物的选择的影响的方法,该方法的目的是为了设计治疗药物或疫苗或使这种治疗个体化。本发明也提供了鉴定HLA等位基因特异性微生物序列多态的方法,该多态由HLA限定的抗原特异性细胞免疫反应产生。它也提供了诊断和治疗方法,该方法可用于测量或治疗微生物感染或预防微生物感染。
文档编号C12N9/50GK1602202SQ02824790
公开日2005年3月30日 申请日期2002年10月23日 优先权日2001年10月23日
发明者S·玛劳 申请人:埃皮波普股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1