肽的制作方法

文档序号：1077912阅读：11636来源：国知局

专利名称：肽的制作方法
发明概要本发明涉及作为由基因移码突变引起的蛋白产物的片段的肽，这些肽可引起T细胞免疫，本发明还涉及包含所述肽的用于抗癌治疗的癌疫苗和组合物。
本发明还涉及鉴定这些作为基因移码突变引起的蛋白产物片段的肽的方法，所述肽可引起对抵抗所述突变基因相关的癌症有用的T细胞免疫。
本发明还涉及编码至少一个移码突变肽的DNA序列，以及包含至少一个插入位点的载体，所述插入位点含有编码至少一个移码突变肽的DNA序列。
本发明进一步涉及治疗或预防基因移码突变相关癌症的方法，所述方法通过施用至少一个移码突变肽、或包含至少一个插入位点的重组病毒载体、或含有编码至少一个移码突变肽的DNA序列的分离的DNA序列来进行，其中所述插入位点含有编码至少一个移码突变肽的DNA序列。
本发明代表基于应用肽产生激活和强化机体自身免疫系统T细胞的抗癌活性的抗癌治疗或预防的进一步发展。
背景技术：
肿瘤抗原现状目前已在广谱的癌症类型中表征了多种T细胞识别抗原。根据其表达，这些抗原可划分为若干主要类群。发育分化有关抗原(睾丸肿瘤抗原、癌胚抗原等，如MAGE抗原和CEA)和组织特异分化抗原(酪氨酸酶、gp100等)构成了两个主要类群。含有真正肿瘤特异抗原的类群含有由于其编码基因突变而改变的蛋白质。在大多数情况下，突变是独特的，并在单个或少数肿瘤中检测到。这些抗原有几个似乎在肿瘤形成中起作用。癌疫苗现状癌疫苗开发的焦点是在一种形式的癌(如黑素瘤)或多种癌中高度表达的抗原。其原因之一是为了增加加入到临床研究中的患者数。该领域正处于快速发展期，这由目前在NCI的PDQ数据库中注册的癌疫苗方法列表就可以说明。可遗传的癌/癌基因检测遗传形式的癌在人群中以一定的频率发生。对于若干这些形式的癌症，已对其根本遗传缺陷作图。在构成可遗传癌重要类群的Lynch综合症癌中也是如此。在患有该综合症的家族中，家族成员遗传编码DNA错配修复(MMR)酶的缺陷基因。这种MMR缺陷的携带者常常会患有结肠直肠癌(HNPCC)或其他形式的癌(表？)。MMR酶中的突变可以以检测其它癌相关基因相同的方式采用基因检测来检测。
在这种情况下危险人群的基因检测处于一个无药的困境，因为不存在预防治疗可接受的形式。目前，手术除去有患癌危险的器官成为唯一的治疗选择。在这些患者中，只要能开发有效的疫苗，癌疫苗将是非常(有意义的)预防形式。
错配DNA有效修复的缺乏在DNA一条链中导致缺失和插入，这种情况尤其在含有重复单元(重复序列)的DNA节段中发生。迄今，焦点集中在非编码微卫星座位中的重复序列。的确，微卫星不稳定性是MMR缺陷引起的癌症的特征。我们则采取了另一种途径，集中到在编码致癌过程有关蛋白的DNA序列中发生的移码突变。这种移码突变在蛋白质的C端产生全新的氨基酸序列，并在新终止密码子出现的地方过早地终止。这导致两个重要的结果
1)移码产生的截短蛋白质通常是没有功能的，在大多数情况下导致一项重要的细胞功能的“敲除”。异常蛋白质也可能获得新的功能如聚集并形成斑的能力。在这两种情况下移码都会导致疾病。
2)阅读框移动产生的新的短C端氨基酸序列(“移码序列”)对机体而言是外源的。在突变前它并不存在，而且仅在含有突变的细胞即肿瘤细胞及其前恶性祖细胞中存在。因为它们是全新的，因而对携带者的免疫系统来说是外源的，所以它们可被携带者体内的T细胞识别。到目前为止，没有人集中在移码突变的这个方面，也没有描述蛋白质编码区的移码肽作为肿瘤抗原的报道。因此这个概念是新颖的，它形成了开发基于这些序列的疫苗的基础。然后，这些疫苗也可在遗传了属于MMR机制的缺陷酶的人中预防性地使用。因此这种疫苗将填补遗传形式癌症的治疗方法中的空白。
已显示细胞内“自身”蛋白质的单氨基酸替代可产生的肿瘤排斥抗原，由与正常肽在其氨基酸序列上不同的肽组成。识别肿瘤细胞表面主要组织相容性复合物(MHC)中的这些肽的T细胞能杀死这些肿瘤细胞，从而从宿主中排斥肿瘤。
典型地，B细胞产生的抗体识别天然构象的游离抗原，进一步可识别抗原表面暴露的几乎任何位点，相比之下，T细胞只有在抗原被MHC分子结合和呈递时才识别抗原，通常这种结合只有在适当的抗原加工之后才发生，抗原加工包括该蛋白质的蛋白水解断裂，以便获得的肽片段适合MHC分子的裂隙。由此T细胞也能识别来自细胞内蛋白的肽。因此，T细胞能识别无论来自肿瘤细胞何处的肿瘤细胞表面MHC分子中的异常肽，并能随后被激活以清除含有异常肽的肿瘤细胞。
M.Barinaga，科学(Science),257,880-881,1992给出了一个MHC怎样结合肽的短评。本发明技术背景更全面的解释可在D.Male等，高等免疫学(Advanced Immunology),1987,J.B.lippincott公司，Philadelphia中找到。两篇文献在此完整并入本文。
人MHC分子正常指HLA(人白细胞抗原)分子。它们由人类第6号染色体的HLA区域编码。
根据编码它们的染色体区域和与之相互作用并由此主要激活的T细胞亚群的不同，HLA分子表现为两个不同的类型。Ⅰ型分子由HLA A、B和C亚座位编码，它们主要激活CD8+细胞毒性T细胞。HLA Ⅱ型分子由DR、DP和DQ亚座位编码，并主要激活包括辅助细胞和细胞毒性细胞的CD4+T细胞。
每个个体正常有6种HLA Ⅰ型分子，通常A、B和C三组中各两种。相应地，所有个体都有他们自己的HLA Ⅱ型分子选择，同样DP、DQ和DR三组中各两种。A、B、C组和DP、DQ和DR组每个均再分为几个亚组。在某些情况下，由于两个HLA亚组的重叠，不同的HLA Ⅰ型或Ⅱ型分子的数目会减少。
所有这些基因产物都是高度多态的。因此不同的个体表达与其它个体的HLA分子不同的独特HLA分子。这是在移植时难以找到HLA匹配的器官供体的根据。HLA分子的遗传多样性在免疫学中的意义通过其作为免疫应答基因的作用反映出来。通过其多肽结合能力，特定HLA分子的存在或缺乏决定了个体对多肽表位应答的能力。因此，HLA分子决定对疾病的抗性或易感性。
T细胞可通过多种机制控制癌的发生和生长。细胞毒性T细胞HLAⅠ型限制的CD8+和HLA Ⅱ型限制的CD4+细胞，可直接杀死带有适当肿瘤抗原的肿瘤细胞。在细胞毒性CD8+T细胞应答和抗体应答，以及巨噬细胞和LAK细胞杀伤诱导中均需要CD4+辅助T细胞。
Ⅰ型和Ⅱ型HLA结合的必要条件是多肽必须含有结合基序，对于不同HLA组和亚组结合基序通常是不同的。结合基序的特征是需要在多肽的特定位置有特定类型的氨基酸，例如带有大的疏水或正电荷侧链基团，以便实现与HLA裂隙口袋的紧密匹配。这种匹配以及在结合裂隙内肽长度限制在8-10个氨基酸的结果是结合一类Ⅰ型HLA分子的肽极不可能也与另一类结合。因此，例如，极有可能均属于Ⅰ型的HLA-A1和HLA-A2亚组的多肽结合基序是不同的，就象HLA-A1和HLA-B1分子的结合基序是不同的一样。
由于同样的原因，完全相同的氨基酸序列不可能位于不同的Ⅱ型分子的结合裂隙内。对于HLAⅡ型分子，肽的结合序列可能更长，已发现它们通常含有10-16个氨基酸，其中在一或两端的一些氨基酸不是HLA裂隙结合基序的部分。
然而，可能出现几种HLAⅠ型和Ⅱ型分子的不同肽结合基序的重叠。具有至少两种不同的HLA分子结合序列重叠的肽被称为含有“重叠的T细胞表位”。“重叠表位肽”所含有的各种表位可通过抗原呈递细胞加工肽形成，之后与不同HLA分子结合呈递给T细胞。人HLA分子的个体差异使含有重叠表位的肽比仅能结合一类HLA分子的肽作为通用疫苗更为有用。
只有患者的至少一类HLAⅠ型和/或Ⅱ型分子可结合全长或被患者自身抗原呈递细胞加工和修剪的疫苗肽，才能实现个体的有效接种。
作为大多数人群通用疫苗的肽的实用性随其全长或抗原呈递细胞加工后形式可结合的不同HLA分子数的增加而增加。
为了使用来源于突变基因编码蛋白质的肽作为疫苗或抗癌剂以产生抗肿瘤CD4+和/或CD8+T细胞，有必要研究所述突变蛋白并鉴定最终被抗原呈递细胞加工成更短的肽之后能刺激T细胞的肽。
现有技术在我们的国际申请PCT/NO92/00032(公开号为WO92/14756)中，我们描述了与其原癌基因或肿瘤抑制基因蛋白相比具有一个点突变或易位的合成肽和癌基因蛋白片段。这些肽相应于、完全覆盖由癌细胞或其它抗原呈递细胞呈递的加工的癌基因蛋白片段或肿瘤抑制基因片段，或为其片段，并在每个个体中由至少一个等位以HLA-肽复合物呈递。这些肽还显示通过加工和在HLA分子中呈递可诱导对细胞产生的实际癌基因蛋白特异的T细胞应答。具体地，我们描述了来自p21 ras蛋白的在特定氨基酸位点即位点12、13和61具有点突变的肽。这些肽已显示对调节体外癌细胞生长有效。而且显示通过在接种疫苗或癌治疗策略中施用这些蛋白可引发抗含有突变的p21 ras癌基因蛋白的癌细胞的CD4+T细胞免疫。之后我们显示通过上述施用这些肽还引起抗含有突变的p21 ras癌基因蛋白的癌细胞的CD8+T细胞免疫。
然而，上述肽只对某些癌有用，即那些涉及在原癌或肿瘤抑制基因中具有点突变或易位的癌基因的癌。因此非常需要有效抗更普遍癌症的抗癌治疗或疫苗。
通常，对于肿瘤细胞中发现的遗传改变，不同肿瘤是非常不同的。这暗示癌疫苗潜在的治疗效果和预防作用将随该疫苗能引发T细胞免疫抵抗的靶数目的增加而增加。多靶疫苗还可通过治疗原发肿瘤的逃避变体来降低形成新肿瘤的危险。
本发明所解决问题的定义一直存在基于抗原多肽的新抗癌剂的需要，该抗原多肽可引起抗携带癌有关的突变基因的肿瘤和癌细胞的特异T细胞应答和毒性。本发明将极为有助于提供在与癌症的斗争和防护中有用的新肽，作为多靶抗癌疫苗的成分。
本发明解决的另一个问题是可对遗传性癌症高危家族或群体中的个体提供保护和治疗。在许多例子中遗传性癌症与对本发明所述对移码突变(即错配修复基因突变)易感的基因相关。目前可以诊断患遗传性癌症的危险，但还没有避免癌症发生的药物学方法。
本发明定义本发明的一个主要目标是获得可用于刺激T细胞的相应于癌细胞产生的突变蛋白质的肽片段的肽。
本发明的另一个主要目标是开发基于T细胞免疫的癌症治疗方法，该T细胞免疫可通过用根据本发明的肽在体内或体外刺激其T细胞来在患者体内诱导。
本发明的第三个主要目标是开发防止癌症发生或根除癌症的疫苗，该疫苗完全或部分基于本发明肽相应的肽，其可用于产生和激活产生抗含有突变基因的细胞的细胞毒性T细胞免疫的T细胞。
本发明的第四个主要目标是设计特别适于需要这种治疗或预防的人类个体的抗癌治疗或预防，其包括施用至少一种本发明的肽。
本发明的这些目标和其它目标通过所附权利要求来实现。
因为移码突变导致过早的终止密码子从而导致蛋白质的大部分缺失，所以通常认为具有移码突变的蛋白质没有免疫原性，所以没有人将其考虑为免疫治疗的目标。因此，现在令人惊奇的发现，肿瘤相关基因移码突变产生的整个一群新肽可用于引发对含有该移码突变基因的癌细胞的T细胞应答。
含有至少5个残基的单核苷酸重复序列(例如8个脱氧腺苷碱基(AAAAAAAA))或至少4个二核苷酸碱基单位(例如两个脱氧腺苷-脱氧胞苷单位(ACAC))的二核苷酸碱基重复序列的基因对移码突变易感。分别通过在重复序列中插入一或两个单核苷酸碱基残基或一或两个二核苷酸碱基单位，或分别通过在重复序列中缺失一或两个单核苷酸碱基残基或一或两个二核苷酸碱基单位来产生移码突变。从突变点开始，含有移码突变的基因将编码一个与正常基因产物相比具有完全不同氨基酸序列的新蛋白。在羧基端具有新突变氨基酸序列的该突变蛋白对于带有修饰基因的所有细胞将是特异的。
在本说明书的其余部分和权利要求中移码突变肽的名称将包括这些蛋白和其肽片段。
根据本发明已发现这种在癌细胞中由基因的移码突变产生的新蛋白质可产生在HLA分子中可被T细胞识别的肿瘤排斥抗原。
根据本发明还发现一组与癌细胞中由基因移码突变产生的突变蛋白质的片段相应的肽，该肽可用于产生T细胞。因此所述肽还可用于引起抗含有上述移码突变基因的癌细胞的T细胞激活。
这些肽至少8个氨基酸长，并且其全长或被抗原呈递细胞加工后相应于人癌症患者的癌细胞产生的突变基因蛋白或其片段。
根据本发明的肽的特征在于a)至少8个氨基酸长，并是癌细胞基因移码突变产生的突变蛋白的片段；和b)含有所述基因编码的蛋白质序列的突变部分的至少一个氨基酸；和c)含有突变序列氨基端之前的蛋白质序列正常部分的羧基端0-10个氨基酸，并可进一步延伸至该基因移码突变产生的新终止密码子所确定的蛋白质突变部分的羧基端；和d)以其全长或被抗原呈递细胞加工后的形式诱导T细胞应答。
本发明肽优选含有8-25、9-20、9-16、8-12或20-25个氨基酸。例如它们可包括9、12、13、16或21个氨基酸。
最优选本发明肽长至少9个氨基酸，例如9-18个氨基酸，但由于抗原呈递细胞加工的可能性，更长的肽也非常适于本发明。因此，如果其包含8个或更多氨基酸，整个突变氨基酸序列可用作根据本发明的移码突变肽。
本发明还涉及与基因移码突变有关的癌症易感个体的疫苗接种方法，其包括一或多次施用至少一种本发明肽，其施用量足以诱导对移码突变基因编码的突变蛋白产生T细胞免疫。
本发明还涉及治疗基因移码突变有关癌症的患者的方法，其包括一或多次施用至少一种本发明肽，其施用量足以诱导对癌细胞基因移码突变形成的突变蛋白产生T细胞免疫。
进一步，根据本发明已发现鉴定与基因移码突变形成的蛋白质片段相应的新肽的方法。该方法可用如下步骤来表征1)鉴定癌细胞中对移码突变易感的基因，该基因具有至少5个残基的单核苷酸碱基重复序列，或至少4个二核苷酸碱基单位的二核苷酸碱基重复序列；和2)分别从该重复序列中除去一个核苷酸碱基残基或一个二核苷酸碱基单位，并鉴定包含一个新终止密码子的改变的基因序列编码的蛋白质氨基酸序列；和/或3)分别从该重复序列中除去两个核苷酸碱基残基或两个二核苷酸碱基单位，并鉴定包含一个新终止密码子的改变的基因序列编码的蛋白质氨基酸序列；和/或
4)分别在该重复序列中插入一个核苷酸碱基残基或一个二核苷酸碱基单位，并鉴定包含一个新终止密码子的改变的基因序列编码的蛋白质氨基酸序列；和/或5)分别在该重复序列中插入两个核苷酸碱基残基或两个二核苷酸碱基单位，并鉴定包含一个新终止密码子的改变的基因序列编码的蛋白质氨基酸序列。
为了确定由此鉴定的肽是否在本发明用于治疗或预防癌症的组合物和方法中有用，应进一步进行如下步骤6)确定该新肽全长或更短片段是否能刺激T细胞。可选择性地进一步加入如下步骤7)鉴定含有不同主要HLAⅠ型和/或Ⅱ型分子的重叠表位的肽。
本发明详细描述在本说明书和权利要求中，氨基酸用本领域已知的单字母简写表示。
将通过两个不同实施方案清楚地举例说明本发明的肽，其中癌症发生基于特定基因即BAX基因和TGFβRⅡ基因的移码突变1)BAX基因已经证明BAX基因通过促进细胞凋亡参与调节细胞的存活或死亡。人BAX基因在第3个外显子含有8个脱氧鸟苷碱基(G8)重复序列，其跨越密码子38至41(ATG GGG GGG GAG)。
结肠癌细胞和前列腺癌细胞均在该G8重复中观察到移码突变，即G7(ATG GGG GGG AGG)和G9(ATG GGG GGG GGA)重复。在检查的病例中这种发生概率超过50％(Rampino,N.等，“微卫星突变基因表型结肠癌中BAX基因的体细胞移码突变”，科学(Science)(Washington DC)275:967-969,1997)。该修饰BAX基因的产物不能促进细胞凋亡，因此使进一步的肿瘤发展成为可能。而且该修饰基因产物仅在癌细胞中发现，因此是特异免疫治疗的靶标。
根据本发明，相应于BAX基因移码突变引起的转化BAX蛋白产物的肽可用作能引发抗癌症患者癌细胞的免疫系统(T细胞)细胞免疫的抗癌治疗剂或疫苗，其中所述癌症与改变的BAX基因相关。
BAX基因移码突变产生突变肽序列，与正常BAX蛋白相比，改变序列的第一个氨基酸在第41位(表1,seq.id.no.1-4)。
表1氨基酸位置 41 51 61 71正常bax肽；EAPELALDPV PQDASTKKLS ECLKRIGDELseq.id.no. 1(bax-1G)；RHPSWPWTRC LRMRPPRSseq.id.no. 4(bax+2G)；GRHPSWPWTR CLRMRPPRSseq.id.no. 2(bax-2G)；GTRAGPGPGA SGCVHQEAER VSQAHRGRTG Qseq.id.no. 3(bax+1G)；GGTRAGPGPG ASGCVHQEAE RVSQAHRGRT GQ表2显示本发明的一组肽表2seq.id.no. 5: IQDRAGRMGGRHPSWPWTRCLRMRPPRSseq.id.no. 6: IQDRAGRMGGGRHPSWPWTseq.id.no. 7: IQDRAGRMGGGGTRAGPGPGASGCVHQEAERVSQAHRGRTGQseq.id.no. 8: IQDRAGRMGGGTRAGPGPG表3中所列的肽用于体外产生识别突变BAX肽的T细胞。表3．seq id no 1: RHPSWPWTRCLRMRPPRSseq id no 9: IQDRAGRMGGRHPSWPWTRCLRseq id no 6: IQDRAGRMGGGRHPSWPWTseq id no 10: ASGCVHQEAERVSQAHRGRTGQseq id no 11: GGTRAGPGPGASGCVHQEAERVseq id no 12: IQDRAGRMGGGGTRAGPGPGASseq id no 8: IQDRAGRMGGGTRAGPGPG
根据本发明的该实施例，最优选肽列在表4中表4seq id no 1: RHPSWPWTRCLRMRPPRSseq id no 2: GTRAGPGPGASGCVHQEAERVSQAHRGRTGQseq id no 3: GGTRAGPGPGASGCVHQEAERVSQAHRGRTGQseq id no 4: GRHPSWPWTRCLRMRPPRSseq.id.no. 5: IQDRAGRMGGRHPSWPWTRCLRMRPPRSseq.id.no. 6: IQDRAGRMGGGRHPSWPWTseq.id.no. 7: IQDRAGRMGGGGTRAGPGPGASGCVHQEAERVSQAHRGRTGQseq id no 8: IQDRAGRMGGGTRAGPGPGseq id no 9: IQDRAGRMGGRHPSWPWTRCLRseq id no 10: ASGCVHQEAERVSQAHRGRTGQseq id no 11: GGTRAGPGPGASGCVHQEAERVseq id no 12: IQDRAGRMGGGGTRAGPGPGAS2)TGFβRⅡ已经证明TGFβRⅡ基团参与细胞生长的调节，TGFβRⅡ是下调细胞生长的TGFβ的受体。人TGFβRⅡ编码基因包含从第709碱基到718碱基的10个脱氧腺苷碱基(A10)的重复序列(GAA AAA AAA AAG CCT)。在大约80％的结肠癌和前列腺癌受检病例中观察到在该A10中存在移码突变，既有A9(GAA AAA AAA AGC CT)又有A11(GAA AAA AAA AAA GCC)重复(Yamamoto,H.“遗传性非多发性息肉结肠直肠癌中DNA错配修复和原凋亡基因的体细胞移码突变(Somatic frameshift mutations inDNA mismatch repair and proapoptosis genes in hereditarynonpolyposis colorectal cancer.)”，癌症研究58,997-1003,3月1日，1998)。修饰的TGFβRⅡ基因产物不能结合TGFβ而且细胞生长下调信号消失，因此使进一步的肿瘤发展成为可能。而且，修饰基因产物只在癌细胞中发现，因此是免疫治疗的靶标。
因此，TGFβRⅡ基因移码突变引起的转化TGFβRⅡ蛋白产物相应的肽可用作能引发抗癌症患者癌细胞的免疫系统(T细胞)细胞免疫的抗癌治疗剂或疫苗，其中所述癌症与改变的TGFβRⅡ基因相关。
TGFβRⅡ基因移码突变产生突变肽序列，与正常TGFβRⅡ蛋白相比，改变序列的第一个氨基酸位于第133位(一或两个碱基缺失)或第134位(1或2个碱基插入)(表5,seq.id.no.13和21)。
表5氨基酸位置133正常TGFβRⅡ； K PGETFFMCSC SSDECNDNII FSEEYNTSNPDLLLseq id no 13(-1A)； S LVRLSSCVPV ALMSAMTTSS SQKNITPAIL TCCseq id no 13(+2A)； SLVRLSSCVP VALMSAMTTS SSQKNITPAILTCCTGFbRII+1A) ； AWTGFbRII-2A) ； AW表6显示本发明的一组肽表6seq id no 14:SPKCIMKEKKSLVRLSSCVPVALMSAMTTSSSQKNITPAILTCCseq id no 15:PKCIMKEKKKSLVRLSSCVseq id no 19:SPKCIMKEKKAWseq id no 20:PKCIMKEKKKAW表7中所列的肽用于体外产生识别突变TGFβRⅡ肽的T细胞。表7seq id no 15: PKCIMKEKKKSLVRLSSCVseq id no 16: ALMSAMTTSSSQKNITPAILTCCseq id no 17: SLVRLSSCVPVALMSAMTTSSSQseq id no 18: SPKCIMKEKKSLVRLSSCVPVAseq id no 19: SPKCIMKEKKAWseq id no 20: PKCIMKEKKKAWseq id no 21: AMTTSSSQKNITPAILTCCseq id no 428: SLVRLSSCV
本发明该实施方案最优选的肽是表8seq id no 13:SLVRLSSCVPVALMSAMTTSSSQKNITPAILTCCseq id no 14:SPKCIMKEKKSLVRLSSCVPVALMSAMTTSSSQKNITPAILTCCseq id no 15:PKCIMKEKKKSLVRLSSCVseq id no 16:ALMSAMTTSSSQKNITPAILTCCseq id no 17:SLVRLSSCVPVALMSAMTTSSSQseq id no 18:SPKCIMKEKKSLVRLSSCVPVAseq id no 19:SPKCIMKEKKAWseq id no 20:PKCIMKEKKKAWseq id no 21:AMTTSSSQKNITPAILTCCseq id no428:SLVRLSSCV本发明的其它肽可以是上述表1至8所列举的肽的片段。这些肽最优选长9-16个氨基酸，并包括蛋白突变部分的至少一个氨基酸。
本说明书和权利要求中所用术语片段是指一个更长的肽或蛋白的较短部分。
含有核苷酸碱基重复序列因而对移码突变敏感，并由此成为根据本发明潜在候选肽(表9中的序列号在括弧内给出)的其它癌症相关基因见如下人TGF-β-2(hTGFβ2)基因(seq id nos 22-29)结肠直肠癌缺失(DCC)基因(seq.id.nos.30-34)人乳腺和卵巢癌易感性(BRCA1)基因(seq.id.nos.378-387)人乳腺癌易感性(BRCA2)基因(seq.id.nos.35-94)人蛋白酪氨酸磷酸酶(hPTP)基因(seq.id.nos.95-102)人DNA拓扑异构酶Ⅱ(top2)基因(seq.id.nos.103-108)人激酶(TTK)基因(seq.id.nos.109-120)人转录抑制(CTCF)基因(seq.id.nos.121-127)人FADD同源性ICE/CED-3样蛋白酶基因(seq.id.nos.128-133)推测的人错配修复/结合蛋白(hMSH3)基因(seq.id.nos.134-147)人成视网膜细胞瘤结合蛋白Ⅰ同型Ⅰ(hRBPI)基因(seq.id.nos.148-156)人FMR1(hFMR1)基因(seq.id.nos.157-161)人TINUR基因(seq.id.nos.162-169)b-raf癌基因(seq.id.nos.170-175)人神经纤维蛋白(NF1)基因(seq.id.nos.176-181)人种系n-myc基因(seq.id.nos.182-188)人n-myc基因(seq.id.nos.189-194)人ras抑制基因(seq.id.nos.195-199)人hMSH6基因(seq.id.nos.200-203 and 293-297)人鼻咽癌EBV BNLF-1基因(seq.id.nos.204-210)人细胞周期调节蛋白(ElA-结合蛋白)p300基因(seq.id.nos.211-218)人B细胞淋巴瘤3编码的蛋白(bcl-3)基因(seq.id.nos.219-226)人转化生长因子β诱导的基因产物(BIGH3)(seq.id.nos.227-232)人转录因子ETV1基因(seq.id.nos.233-239)人胰岛素样生长因子结合蛋白(IGFBP4)基因(seq.id.nos.240-246)人MUC1基因(seq.id.nos.247-266)人蛋白酪氨酸激酶(JAK1)基因(seq.id.nos.267-271)人蛋白酪氨酸激酶(JAK3)基因(seq.id.nos.272-279)人Flt4基因(编码跨膜酪氨酸激酶)(seq.id.nos.280-284)人p53相关基因(seq.id.nos.285-292)人can(hCAN)基因(seq.id.nos.298-300)人DBL(hDBL)原癌基因/人MCF2PO(hMCF2PO)基因(seq.id.nos.301-306)人dek(hDEK)基因(seq.id.nos.307-309)人成视网膜细胞瘤相关蛋白(p107)基因(seq.id.nos.310-313)人G蛋白偶联受体(hGPR1)基因(seq.id.nos.314-319)推测的人RNA结合蛋白(hRBP56)基因(seq.id.nos.320-325)人转录因子(hITF-2)基因(seq.id.nos.326-327)人恶性黑素瘤转移抑制(hKiSS-1)基因(seq.id.nos.328-334)人端粒酶相关蛋白TP-Ⅰ(hTP-1)基因(seq.id.nos.335-348)人FDF-5(hFDF-5)基因(seq.id.nos.349-356)人转移相关mtal(hMTAl)基因(seq.id.nos.357-362)人转录因子TFⅡB 90kDa亚基(hTFⅡB90)基因(seq id nos 363-369)人肿瘤抑制(hLUCA-1)基因(seq id nos370-377)人Wilm肿瘤(WIT-1)相关蛋白(seq id nos 388-393)人半胱氨酸蛋白酶(ICErel-Ⅲ)基因(seq id nos 394-398和459)人Fas配体(FasL)基因(seq id nos 399-403)人BRCA1相关RING域蛋白(BARD1)基因(seq id nos 404-417)人mcf.2(hMCF.2)基因(seq id nos 418-422)人Fas抗原(fas)基因(seq id nos 423-427)人DPC4基因(seq id nos 429-437).
根据本发明，这些基因移码突变造成的突变肽列举在表9中。
表9seq id no 22； TVGRPHISCseq id no 23； KTVGRPHISCseq id no 24； KQWEDPTSPANVIALLQTseq id no 25； QWEDPTSPANVIALLQTseq id no 26； QKTIKSTRKKTVGRPHISCseq id no 27； QKTIKSTRKKKTVGRPHISCseq id no 28； QKTIKSTRKKKQWEDPTSPANVIALLQTseq id no 29； QKTIKSTRKKQWEDPTSPANVIALLQTseq id no 30； AADLQQQFVHFLDCWDVSSIPFTLHLPQAQDITTseq id no 31； GKDAKEKSSseq id no 32； GKDAKEKKSSseq id no 33； GKDAKEKKAADLQQQFVHFLDCWDVSSIPFTLHLPQAQDITTseq id no 34； GKDAKEKAADLQQQFVHFLDCWDVSSIPFTLHLPQAQDITTseq id no 35； FSMKQTLMNVKNLKTKseq id no 36； KFSMKQTLMNVKNLKTKseq id no 37； VRTSKTRKKFSMKQTLMNVKNLKTKseq id no 38； VRTSKTRKKKFSMKQTLMNVKNLKTKseq id no 39； VRTSKTRKKNFPseq id no 40； VRTSKTRKNFPseq id no 41； IKKKLLQFQKseq id no 42； KIKKKLLQFQKseq id no 43； KSRRNYFNFKNNCQSRLseq id no 44； SRRNYFNFKNNCQSRLseq id no 45； TNLRVIQKIKKKLLQFQKseq id no 46； TNLRVIQKKIKKKLLQFQKseq id no 47； TNLRVIQKKSRRNYFNFKNNCQSRLseq id no 48； TNLRVIQKSRRNYFNFKNNCQSRLseq id no 49； KIMITseq id no 50； NIDKIPEKIMITseq id no 51； NIDKIPEKKIMITseq id no 52； IINANseq id no 53； KIINANseq id no 54； NDKTVSEKIINANseq id no 55； NDKTVSEKKIINANseq id no 56； NGLEKEYLMVNQKEseq id no 57； SQTSLLEAKNGLEKEYLMVNQKEseq id no 58； SQTSLLEAKKNGLEKEYLMVNQKEseq id no 59； SQTSLLEAKKMAseq id no 60； SQTSLLEAKMAseq id no 61； TLVFPKseq id no 62； KTLVFPKseq id no 63； LKNVEDQKTLVFPKseq id no 64； LKNVEDQKKTLVFPKseq id no 65； LKNVEDQKKHseq id no 66； LKNVEDQKHseq id no 67； KKIQLYseq id no 68； KKKIQLYseq id no 69； RKRFSYTEYLASIIRFIFSVNRRKEIQNLSSCNFKIseq id no 70； LRIVSYSKKKKIQLYseq id no 71； LRIVSYSKKKKKIQLYseq id no 72； LRIVSYSKKRKRFSYTEYLASIIRFIFSVNRRKEIQNLS--SCNFKIseq id no 73； LRIVSYSKRKRFSYTEYLASIIRFIFSVNRRKEIQNLS--SCNFKIseq id no 74； QDLPLSSICQTIVTIYWQseq id no 75； KQDLPLSSICQTIVTIYWQseq id no 76； NRTCPFRLFVRRMLQFTGNKVLDRPseq id no 77； GFVVSVVKKQDLPLSSICQTIVTIYWQseq id no 78； GFVVSVVKKKQDLPLSSICQTIVTIYWQseq id no 79； GFVVSVVKKNRTCPFRLFVRRMLQFTGNKVLDRPseq id no 80； GFVVSVVKNRTCPFRLFVRRMLQFTGNKVLDRPseq id no 81； YRKTKNQNseq id no 82； KYRKTKNQNseq id no 83； NTERPKIRTNseq id no 84； DETFYKGKKYRKTKNQNseq id no 85； DETFYKGKKKYRKTKNQNseq id no 86； DETFYKGKKNTERPKIRTNseq id no 87； DETFYKGKNTERPKIRTNseq id no 88； LSINNYRFQMKFYFRFTSHGSPFTSANFseq id no 89； KLSINNYRFQMKFYFRFTSHGSPFTSANFseq id no 90； NSVSTTTGFRseq id no 91； NIQLAATKKLSINNYRFQMKFYFRFTSHGSPFTSANFseq id no 92； NIQLAATKKKLSINNYRFQMKFYFRFTSHGSPFTSANFseq id no 93； NIQLAATKKNSVSTTTGFRseq id no 94； NIQLAATKNSVSTTTGFRseq id no 95； MEHVAPGRMSASPQSPTQseq id no 96； KMEHVAPGRMSASPQSPTQseq id no 97； KWSTWLQAECQHLHSPQRSDKPQQAGLDQQHHCFALDS--SPGPRPVFLQLLGLMGQGRHDseq id no 98； WSTWLQAECQHLHSPQRSDKPQQAGLDQQHHCFALDS--SPGPRPVFLQLLGLMGQGRHDseq id no 99； TFSVWAEKMEHVAPGRMSASPQSPTQseq id no 100； TFSVWAEKKMEHVAPGRMSASPQSPTQseq id no 101； TFSVWAEKKWSTWLQAECQHLHSPQRSDKPQQAGLDQ--QHHCFALDSSPGPRPVFLQLLGLMGQGRHDseq id no 102； TFSVWAEKWSTWLQAECQHLHSPQRSDKPQQAGLDQ--QHHCFALDSSPGPRPVFLQLLGLMGQGRHDseq id no 103； HKWLKFCLLRLVKESFHEseq id no 104； KHKWLKFCLLRLVKESFHEseq id no 105； KGGKAKGKKHKWLKFCLLRLVKESFHEseq id no 106； KGGKAKGKKKHKWLKFCLLRLVKESFHEseq id no 107； KGGKAKGKKNTNGseq id no 108； KGGKAKGKNTNGseq id no 109； VNNFFKKLseq id no 110； KVNNFFKKLseq id no 111； LSQGNVKKVNNFFKKLseq id no 112； LSQGNVKKKVNNFFKKLseq id no 113； GEKNDLQLFVMSDRRYKIYWTVILLNPCGNLHLKTTSLseq id no 114； KGEKNDLQLFVMSDRRYKIYWTVILLNPCGNLHLKTTSLseq id no 115； KGKKMICSYSseq id no 116； GKKMICSYSseq id no 117； SSKTFEKKGEKNDLQLFVMSDRRYKIYWTVILLNPCGN--LHLKTTSLseq id no 118； SSKTFEKKKGEKNDLQLFVMSDRRYKIYWTVILLNPCGN--LHLKTTSLseq id no 119； SSKTFEKKKGKKMICSYSseq id no 120； SSKTFEKKGKKMICSYSseq id no 121； QRKPKRANCVIQRRAKMseq id no 122； KQRKPKRANCVIQRRAKMseq id no 123； NKENQKEQTALLYRGGQRCRCVCLRFseq id no 123； NKENQKEQTALLYRGGQRCRCVCLRFseq id no 124； PDYQPPAKKQRKPKRANCVIQRRAKMseq id no 125； PDYQPPAKKKQRKPKRANCVIQRRAKMseq id no 126； PDYQPPAKKNKENQKEQTALLYRGGQRCRCVCLRFseq id no 127； PDYQPPAKNKENQKEQTALLYRGGQRCRCVCLRFseq id no 128； NLSSLLIseq id no 129； TCLPFseq id no 130； QPTFTLRKNLSSLLIseq id no 131； QPTFTLRKKNLSSLLIseq id no 132； QPTFTLRKKTCLPFseq id no 133； QPTFTLRKTCLPFseq id no 134； RATFLLSLWECSLPQARLCLIVSRTGLLVQSseq id no 135； GQHFYWHCGSAACHRRGCVseq id no 136； KENVRDKKRATFLLSLWECSLPQARLCLIVSRTGLLVQSseq id no 137； KENVRDKKKRATFLLSLWECSLPQARLCLIVSRTGLLVQSseq id no 138； KENVRDKKKGQHFYWHCGSAACHRRGCVseq id no 139； KENVRDKKGQHFYWHCGSAACHRRGCVseq id no 140； ITHTRWGITTWDSWSVRMKANWIQAQQNKSLILSPSFTKseq id no 141； KITHTRWGITTWDSWSVRMKANWIQAQQNKSLILSPSFTKseq id no 142； KLLTPGGELPHGILGQseq id no 143； LLTPGGELPHGILGQseq id no 144； PPVCELEKITHTRWGITTWDSWSVRMKANWIQAQQNKS--LILSPSFTKseq id no 145； PPVCELEKKITHTRWGITTWDSWSVRMKANWIQAQQNKS--LILSPSFTKseq id no 146； PPVCELEKKLLTPGGELPHGILGQseq id no 147； PPVCELEKLLTPGGELPHGILGQseq id no 148； SLKDELEKMKIseq id no 149； SLKDELEKKMKIseq id no 150； LGQSSPEKKNKNseq id no 151； LGQSSPEKNKNseq id no 152； RLRRINGRGSQIRSRNAFNRSEEseq id no 153； EPKVKEEKKTseq id no 154； EPKVKEEKKKTseq id no 155； EPKVKEEKKRLRRINGRGSQIRSRNAFNRSEEseq id no 156； EPKVKEEKRLRRINGRGSQIRSRNAFNRSEEseq id no 157； TFRYKGKQHPFFSTseq id no 158； GPNAPEEKNHseq id no 159； GPNAPEEKKNHseq id no 160； GPNAPEEKKTFRYKGKQHPFFSTseq id no 161； GPNAPEEKTFRYKGKQHPFFSTseq id no 162； MQNTCVseq id no 163； KMQNTCVseq id no 164； KCKIRVFSKseq id no 165； CKIRVFSKseq id no 166； FFKRTVQKMQNTCVseq id no 167； FFKRTVQKKMQNTCVseq id no 168； FFKRTVQKKCKIRVFSKseq id no 169； FFKRTVQKCKIRVFSKseq id no 170； LPHYLAHseq id no 171； CLITWLTNseq id no 172； GSTTGLSATPLPHYLAHseq id no 173； GSTTGLSATPPLPHYLAHseq id no 174； GSTTGLSATPPCLITWLTNseq id no 175； GSTTGLSATPCLITWLTNseq id no 176； RFADKPRPNseq id no 177； DLPTSPDQTRSGPVHVSVEPseq id no 178； DSAAGCSGTPRFADKPRPNseq id no 179； DSAAGCSGTPPRFADKPRPNseq id no 180； DSAAGCSGTPPDLPTSPDQTRSGPVHVSVEPseq id no 181； DSAAGCSGTPDLPTSPDQTRSGPVHVSVEPseq id no 182； AHPETPAQNRLRIPCSRREVRSRACKPPGAQGSDER--RGKASPGRDCDVRTGRPseq id no 183； PAHPETPAQNRLRIPCSRREVRSRACKPPGAQGSDER--RGKASPGRDCDVRTGRPseq id no 184； RPTRRHPRRIASGSPAVGGRseq id no 185； VAIRGHPRPPAHPETPAQNRLRIPCSRREVRSRACKP--PGAQGSDERRGKASPGRDCDVRTGRPseq id no 186； VAIRGHPRPPPAHPETPAQNRLRIPCSRREVRSRACKP--PGAQGSDERRGKASPGRDCDVRTGRPseq id no 187； VAIRGHPRPPRPTRRHPRRIASGSPAVGGRseq id no 188； VAIRGHPRPRPTRRHPRRIASGSPAVGGRseq id no 189； RGRTSGRSLSCCRRPRCRPAVASRSTAPSPRAGSR--RCCLRTSCGAARPRRTRSACGDWVASPPTRSS--SRTACGAASPPARSWSAPseq id no 190； GGGHLEEVseq id no 191； YFGGPDSTPRGRTSGRSLSCCRRPRCRPAVASR--STAPSPRAGSRRCCLRTSCGAARPRRTRSACGD--WVASPPTRSSSRTACGAASPPARSWSAPseq id no 192； YFGGPDSTPPRGRTSGRSLSCCRRPRCRPAVASR--STAPSPRAGSRRCCLRTSCGAARPRRTRSACGDW--VASPPTRSSSRTACGAASPPARSWSAPseq id no 193； YFGGPDSTPPGGGHLEEVseq id no 194； YFGGPDSTPGGGHLEEVseq id no 195； HRVADPseq id no 196； LSQSSELDPPSSRseq id no 197； LSQSSELDPPPSSRseq id no 198； LSQSSELDPPHRVADPseq id no 199； LSQSSELDPHRVADPseq id no 200； VILLPEDTPPSseq id no 201； VILLPEDTPPPSseq id no 202； VILLPEDTPPLLRAseq id no 203； VILLPELDPLLRAseq id no 204； PSPLPseq id no 205； PLLFHRPCSPSPALGATVLAVYRYEseq id no 206； LLFHRPCSPSPALGATVLAVYRYEseq id no 207； APRPPLGPPSPLPseq id no 208； APRPPLGPPPSPLPseq id no 209； APRPPLGPPPLLFHRPCSPSPALGATVLAVYRYEseq id no 210； APRPPLGPPLLFHRPCSPSPALGATVLAVYRYEseq id no 211； TQVLPQGCSLSLLHTTFPHRQVPHILDWseq id no 212； PTQVLPQGCSLSLLHTTFPHRQVPHILDWseq id no 213； PLQSFPKDAASAFSTPRFPTDKFPTSWTGSCPGQPHGT--RAFCQPGPEFNAFSACseq id no 214； LQSFPKDAASAFSTPRFPTDKFPTSWTGSCPGQPHGT--RAFCQPGPEFNAFSACseq id no 215； PSPRPQSQPPTQVLPQGCSLSLLHTTFPHRQVPHILDWseq id no 216； PSPRPQSQPPPTQVLPQGCSLSLLHTTFPHRQVPHILDWseq id no 217； PSPRPQSQPPPLQSFPKDAASAFSTPRFPTDKFPTS--WTGSCPGQPHGTRAFCQPGPEFNAFSACseq id no 218； PSPRPQSQPPLQSFPKDAASAFSTPRFPTDKFPTS--WTGSCPGQPHGTRAFCQPGPEFNAFSACseq id no 219； TAWPGRRRFTTPEPYCLCTPLGPWAPRFLWseq id no 220； PTAWPGRRRFTTPEPYCLCTPLGPWAPRFLWseq id no 221； PRPGPAGGALLPRSLTAFVPHSGHGLPVSSGEPAYTPIP--HDVPHGTPPFCseq id no 222； RPGPAGGALLPRSLTAFVPHSGHGLPVSSGEPAYTPIPH--DVPHGTPPFCseq id no 223； DLPAVPGPPTAWPGRRRFTTPEPYCLCTPLGPWAPRFLWseq id no 224； DLPAVPGPPPTAWPGRRRFTTPEPYCLCTPLGPWAPRFLWseq id no 225； DLPAVPGPPPRPGPAGGALLPRSLTAFVPHSGHGLPVSSG--EPAYTPIPHDVPHGTPPFCseq id no 226； DLPAVPGPPRPGPAGGALLPRSLTAFVPHSGHGLPVSSG--EPAYTPIPHDVPHGTPPFCseq id no 227； QWGLSWMSseq id no 228； NGDCHGCPEGRQSLseq id no 229； FTMDRVLTPQWGLSWMSseq id no 230； FTMDRVLTPPQWGLSWMSseq id no 231； FTMDRVLTPPNGDCHGCPEGRQSLseq id no 232； FTMDRVLTPNGDCHGCPEGRQSLseq id no 233； HHPARQCPHCIMHLQTQLIHRNLTGPSQLTSLHRS--PYQIAATPWTTDFAASFFLNPVTPFLLCRRCQGKDV--LCTNARCLSQTSPSHHKALSRTTTQCMNT--TPWLAVRPAKAFPLLseq id no 234； PHHPARQCPHCIMHLQTQLIHRNLTGPSQLTSLHRS--PYQIAATPWTTDFAASFFLNPVTPFLLCRRCQGK--DVLCTNARCLSQTSPSHHKALSRTTTQCMNTTP--WLAVRPAKAFPLLseq id no 235； HTIQHASVPTASCISKLNSYTENseq id no 236； PQVGMRPSNPPHHPARQCPHCIMHLQTQLIHRNLT--GPSQLTSLHRSPYQIAATPWTTDFAASFFLNPVTPFL--LCRRCQGKDVLCTNARCLSQTSPSHHKALSRTTTQC--MNTTPWLAVRPAKAFPLLseq id no 237； PQVGMRPSNP PPHHPARQCPHCIMHLQTQLIHRNLTGPS--QLTSLHRSPYQIAATPWTTDFAASFFLNPVTPFLLCRRC--QGKDVLCTNARCLSQTSPSHHKALSRTTTQCMNTTPWLA--VRPAKAFPLLseq id no 238； PQVGMRPSNPPHTIQHASVPTASCISKLNSYTENseq id no 239； PQVGMRPSNPHTIQHASVPTASCISKLNSYTENseq id no 240； WAARSWCERRAAAVAPLAPWAWGCPAGCTPPVAARAC--AATRPEGWRSPCTHseq id no 241； PWAARSWCERRAAAVAPLAPWAWGCPAGCTPPVAA--RACAATRPEGWRSPCTHseq id no 242； RGLRGAGARGGLRLLRHLRPGLGDALRGVHPPLR--LGPALLPAPRGGEAPAHTDARARRVHGAGGDRGHPGPAALseq id no 243； EEKLARCRPPWAARSWCERRAAAVAPLAPWAWGCPAGC--TPPVAARACAATRPEGWRSPCTHseq id no 244； EEKLARCRPPPWAARSWCERRAAAVAPLAPWAWGCPA--GCTPPVAARACAATRPEGWRSPCTHseq id no 245； EEKLARCRPPRGLRGAGARGGLRLLRHLRPGLGDA--LRGVHPPLRLGPALLPAPRGGEAPAHTDARARRVHGAGG--DRGHPGPAALseq id no 246； EEKLARCRPRGLRGAGARGGLRLLRHLRPGLGDALRG--VHPPLRLGPALLPAPRGGEAPAHTDARARRVHGAGG--DRGHPGPAALseq id no 247； QPPVSPRPRRPGRPRAPPPPQPMVSPRRRTTGPPW--RPPPLQSTMSPPPQALHQAQLLLWCTTAPLPGLPQPQ--PARALHSQFPATTLILLPPLPAIAPRLMPVALTIARYL--LSPPPITALLPSCLLGSLSFSCLFTFQTSSLIPLW--KIPAPTTTKSCRETFLKWseq id no 248； SPGCHLGPGDQAAPGLHRPPSPWCHLGAGQQARLGVHR--PSSPQCHLGLRLCIRLSFYSGAQRHLCQGYHNPSQQEHS--ILNSQPPLseq id no 249； KPAPGSTAPQPPVSPRPRRPGRPRAPPPPQPMVSPRR--RTTGPPWRPPPLQSTMSPPPQALHQAQLLLWCTTAP--LPGLPQPQPARALHSQFPATTLILLPPLPAIAPRLMPVA--LTIARYLLSPPPITALLPSCLLGSLSFSCLFTFQTS--SLIPLWKIPAPTTTKSCRETFLKWseq id no 250； KPAPGSTAPPQPPVSPRPRRPGRPRAPPPPQPMVSPR--RRTTGPPWRPPPLQSTMSPPPQALHQAQLLLWCT--TAPLPGLPQPQPARALHSQFPATTLILLPPLPAIAP--RLMPVALTIARYLLSPPPITALLPSCLLGSLSFSCLF--TFQTSSLIPLWKIPAPTTTKSCRETFLKWseq id no 251； KPAPGSTAPPSPGCHLGPGDQAAPGLHRPPSPWCHL--GAGQQARLGVHRPSSPQCHLGLRLCIRLSFYSGA--QRHLCQGYHNPSQQEHSILNSQPPLseq id no 252； KPAPGSTAPSPGCHLGPGDQAAPGLHRPPSPWCHL--GAGQQARLGVHRPSSPQCHLGLRLCIRLSFYSGAQ--RHLCQGYHNPSQQEHSILNSQPPLseq id no 253； QPMVSPRRRTTGPPWRPPPLQSTMSPPPQALHQAQL--LLWCTTAPLPGLPQPQPARALHSQFPATTLILLPPLP--AIAPRLMPVALTIARYLLSPPPITALLPSCLLGSL--SFSCLFTFQTSSLIPLWKIPAPTTTKSCRETFLKWseq id no 254； SPWCHLGAGQQARLGVHRPSSPQCHLGLRLCIRLSF--YSGAQRHLCQGYHNPSQQEHSILNSQPPLseq id no 255； RPPPGSTAPQPMVSPRRRseq id no 256； RPPPGSTAPPQPMVSPRRRseq id no 257； RPPPGSTAPPSPWCHLGAseq id no 258； RPPPGSTAPSPWCHLGAseq id no 259； RPRAPPPPSPWCHLseq id no 260； RPRAPPPPPSPWCseq id no 261； RPRAPPPPAHGVTSAPseq id no 262； RPRAPPPPPAHGVseq id no 263； APGLHRPPQPMVSPseq id no 264； AAPGLHRPQPMVSPRseq id no 265； PGLHRPPPAHGVTseq id no 266； APGLHRPPAHGVTSseq id no 267； VDRPQHTEWLSWSNLYRIRHQseq id no 268； HYLCTDVAPRseq id no 269； HYLCTDVAPPRseq id no 270； HYLCTDVAPPVDRPQHTEWLSWSNLYRIRHQseq id no 271； HYLCTDVAPVDRPQHTEWLSWSNLYRIRHQseq id no 272； SAYLSPLGTTWLRTCACRLPRPAASCLCTTPSLLW--PRRTCPAGSPRATSSPWRMPAPKSCCTTGLAFTS--PIGLGWRSATASGYARIWPVLSLTCQSWSTSLPSTAVTWseq id no 273； PSAYLSPLGTTWLRTCACRLPRPAASCLCTTPSLLWP--RRTCPAGSPRATSSPWRMPAPKSCCTTGLAFTSP--IGLGWRSATASGYARIWPVLSLTCQSWSTSLPSTAVTWseq id no 274； PAPIFLLWGPLGseq id no 275； APIFLLWGPLGseq id no 276； LPARAPGPPSAYLSPLGTTWLRTCACRLPRPAASCL--CTTPSLLWPRRTCPAGSPRATSSPWRMPAPKSCC--TTGLAFTSPIGLGWRSATASGYARIWPVLSLT--CQSWSTSLPSTAVTWseq id no 277； LPARAPGPPPSAYLSPLGTTWLRTCACRLPRPAAS--CLCTTPSLLWPRRTCPAGSPRATSSPWRMPAPKSCC--TTGLAFTSPIGLGWRSATASGYARIWPVLSLTC--QSWSTSLPSTAVTWseq id no 278； LPARAPGPPPAPIFLLWGPLGseq id no 279； LPARAPGPPAPIFLLWGPLGseq id no 280； DLEHHGGVTRHRHRseq id no 281； LVSDYSMTPRPseq id no 282； LVSDYSMTPPRPseq id no 283； LVSDYSMTPPDLEHHGGVTRHRHRseq id no 284； LVSDYSMTPDLEHHGGVTRHRHRseq id no 285； FHHIATDVGPFVRIGFLKIKGKIKGKSLRKPNW--KTQHKLKRALMFLIVKKLseq id no 286； PFHHIATDVGPFVRIGFLKIKGKIKGKSLRKPNWK--TQHKLKRALMFLIVKKLseq id no 287； PSITLQQMLAPSseq id no 298； SITLQQMLAPSseq id no 289； TSCNEMNPPFHHIATDVGPFVRIGFLKIKGKIKGKSL--RKPNWKTQHKLKRALMFLIVKKLseq id no 290； TSCNEMNPPPFHHIATDVGPFVRIGFLKIKGKIKG--KSLRKPNWKTQHKLKRALMFLIVKKLseq id no 291； TSCNEMNPPSITLQQMLAPSseq id no 292； TSCNEMNPPPSITLQQMLAPSseq id no 293； LEMILFLMTFseq id no 294； HPCITKTFLEMILFLMTFseq id no 295； HPCITKTFFLEMILFLMTFseq id no 296； HPCITKTFFWRseq id no 297； HPCITKTFWRseq id no 298； LMFEHSQMRLNSKNAHLPIISFseq id no 299； EYGSIIAFLMFEHSQMRLNSKNAHLPIISFseq id no 300； EYGSIIAFFLMFEHSQMRLNSKNAHLPIISFseq id no 301； HLNKGRRLGDKIRATseq id no 302； FHLNKGRRLGDKIRATseq id no 303； VTSGTPFFHLNKGRRLGDKIRATseq id no 304； VTSGTPFFFHLNKGRRLGDKIRATseq id no 305； VTSGTPFFFIseq id no 306； VTSGTPFFIseq id no 307； CEIERIHFFFseq id no 308； CEIERIHFFSKseq id no 309； CEIERIHFSKseq id no 310； FRYISKSIseq id no 311； RYISKSIseq id no 312； FKKYEPIFFRYISKSIseq id no 313； FKKYEPIFRYISKSIseq id no 314； FPDSDQPGPLYPLDPSCLISSASNPQELSDCHYIH--LAFGFSNWRSCPVLPGHCGVQseq id no 315； PDSDQPGPLYPLDPSCLISSASNPQELSDCHYIHL--AFGFSNWRSCPVLPGHCGVQseq id no 316； LNMFASVFSseq id no 317； LNMFASVFFSseq id no 318； LNMFASVFFPDSDQPGPLYPLDPSCLISSASNPQE--LSDCHYIHLAFGFSNWRSCPVLPGHCGVQseq id no 319； LNMFASVFPDSDQPGPLYPLDPSCLISSASNPQELS--DCHYIHLAFGFSNWRSCPVLPGHCGVQseq id no 320； AMEETVVVAVATVETEVEAMEETGVVAAMEETEVGAT--EETEVAMEAKWEEETTTEMISATDHTseq id no 321； LWVRPWLWEWLRWRPKWRLWRRQEWWRLWRRPRWGL--RRRPRWLWRENGRKKRLQKseq id no 322； YGGDRSRGAMEETVVVAVATVETEVEAMEETGVVAAM--EETEVGATEETEVAMEAKWEEETTTEMISATDHTseq id no 323； YGGDRSRGGAMEETVVVAVATVETEVEAMEETGVVA--AMEETEVGATEETEVAMEAKWEEETTTEMISATDHTseq id no 324； YGGDRSRGGLWVRPWLWEWLRWEPKWRLWRRQEWW--RLWRRPRWGLRRRPRWLWRENGRKKRLQKseq id no 325； YGGDRSRGLWVRPWLWEWLRWEPKWRLWRRQEWWR--LWRRPRWGLRRRPRWLWRENGRKKRLQKseq id no 326； EFGGGRRQKseq id no 327； EFGGRRQKseq id no 328； RRAKGGGAGASNPRQseq id no 329； GRRAKGGGAGASNPRQseq id no 330； DVGLREGALELPTRGNKRNVAseq id no 331； MRGGGGVGGRRAKGGGAGASNPRQseq id no 332； MRGGGGVGGGRRAKGGGAGASNPRQseq id no 333； MRGGGGVGGDVGLREGALELPTRGNKRNVAseq id no 334； MRGGGGVGDVGLREGALELPTRGNKRNVAseq id no 335； VWQLAGPMLAGWRSLGSWFCRMYGIseq id no 336； CGSWPALCWRAGGVWAVGSAGCMEYDPEALPAAWGP--AAAATVHPRRseq id no 337； RRYPCEWGVWQLAGPMLAGWRSLGSWFCRMYGIseq id no 338； RRYPCEWGGVWQLAGPMLAGWRSLGSWFCRMYGIseq id no 339； RRYPCEWGGCGSWPALCWRAGGVWAVGSAGCMEYD--EALPAAWGPAAAATVHPRRseq id no 340； RRYPCEWGCGSWPALCWRAGGVWAVGSAGCMEYDPE--ALPAAWGPAAAATVHPRRseq id no 341； LWLWAGWTVWWSCGPGEKGHGWPSLPTMALLLLRFSCM--RVASYseq id no 342； GLWLWAGWTVWWSCGPGEKGHGWPSLPTMALLLL--RFSCMRVASYseq id no 343； GCGCGPAGQYGGAVGLARRGTAGCLPCPPWLCCCCAF--PACGLPGTDGWRGWQGSGCVRVSGSAPWAPGFPFSP--PCPLCGTQPRWseq id no 344； CGCGPAGQYGGAVGLARRGTAGCLPCPPWLCCCCAFPACG--LPGTDGWRGWQGSGCVRVSGSAPWAPGFPFSPPC--PLCGTQPRWseq id no 345； LAFNVPGGLWLWAGWTVWWSCGPGEKGHGWPSLPTMA--LLLLRFSCMRVASYseq id no 346； LAFNVPGGGLWLWAGWTVWWSCGPGEKGHGWPSLPTM--ALLLLRFSCMRVASYseq id no 347； LAFNVPGGGCGCGPAGQYGGAVGLARRGTAGCLPCPP--WLCCCCAFPACGLPGTDGWRGWQGSGCVRVSGSAPW--APGFPFSPPCPLCGTQPRWseq id no 348； LAFNVPGGCGCGPAGQYGGAVGLARRGTAGCLPCPPW--LCCCCAFPACGLPGTDGWRGWQGSGCVRVSGSAPWA--PGFPFSPPCPLCGTQPRWseq id no 349； PPMPMPGQREAPGRQEAseq id no 350； GPPMPMPGQREAPGRQEAseq id no 351； GHQCQCQGKGRHRADRRPDTAQEEseq id no 352； HQCQCQGKGRHRADRRPDTAQEEseq id no 353； GGHSYGGGPPMPMPGQREAPGRQEAseq id no 354； GGHSYGGGGPPMPMPGQREAPGRQEAseq id no 355； GGHSYGGGGHQCQCQGKGRHRADRRPDTAQEEseq id no 356； GGHSYGGGHQCQCQGKGRHRADRRPDTAQEEseq id no 357； APCPQSSGGGseq id no 358； LPAPSQAAADELDRRPGseq id no 359； TKVRLIRGAPCPQSSGGGseq id no 360； TKVRLIRGGAPCPQSSGGGseq id no 361； TKVRLIRGGLPAPSQAAADELDRRPGseq id no 362； TKVRLIRGLPAPSQAAADELDRRPGseq id no 363； CSLAKDGSTEDTVSSLCGEEDTEDEELEAAASHLNK--DLYRELLGGseq id no 364； GCSLAKDGSTEDTVSSLCGEEDTEDEELEAAASHLNK--DLYRELLGGseq id no 365； AAAWQKMAPPRTPRPACVARRseq id no 366； ENSRPKRGGCSLAKDGSTEDTVSSLCGEEDTEDEELE--AAASHLNKDLYRELLGGseq id no 367； ENSRPKRGGGCSLAKDGSTEDTVSSLCGEEDTEDE--ELEAAASHLNKDLYRELLGGseq id no 368； ENSRPKRGGAAAWQKMAPPRTPRPACVARRseq id no 369； ENSRPKRGAAAWQKMAPPRTPRPACVARRseq id no 370； HCVLAASGASseq id no 371； GHCVLAASGASseq id no 372； GTASSRPLGLPKPHLHRPVPIRHPSCPKseq id no 373； TASSRPLGLPKPHLHRPVPIRHPSCPKseq id no 374； AGTLQLGGHCVLAASGASseq id no 375； AGTLQLGGGHCVLAASGASseq id no 376； AGTLQLGGGTASSRPLGLPKPHLHRPVPIRHPSCPKseq id no 377； AGTLQLGGTASSRPLGLPKPHLHRPVPIRHPSCPKseq id no 378； RRTPSTEKRseq id no 379； RRTPSTEKKRseq id no 380； RRTPSTEKKGRSECseq id no 381； RRTPSTEKGRSECseq id no 382； STTKCQSGTAETYNSWKVKNLQLEPRRVTSQMNRQVK--DMTAILSQSseq id no 384； SSEEIKKKSTTKCQSGTAETYNSWKVKNLQLEPRRV--TSQMNRQVKDMTAILSQSseq id no 385； SSEEIKKKKSTTKCQSGTAETYNSWKVKNLQLEPRR--VTSQMNRQVKDMTAILSQSseq id no 386； SSEEIKKKKVQPNASQAQQKPTTHGRseq id no 387； SSEEIKKKVQPNASQAQQKPTTHGRseq id no 388； NRGWVGAGEseq id no 389； IEAGseq id no 390； VHNYCNMKNRGWVGAGEseq id no 391； VHNYCNMKKNRGWVGAGEseq id no 392； VHNYCNMKKIEAGseq id no 393； VHNYCNMKIEAGseq id no 394； QLRCWNTWAKMFFMVFLIIWQNTMFseq id no 395； VKKDNHKKQLRCWNTWAKMFFMVFLIIWQNTMFseq id no 396； VKKDNHKKKQLRCWNTWAKMFFMVFLIIWQNTMFseq id no 397； VKKDNHKKKNSseq id no 398； VKKDNHKKNSseq id no 399； GAEESGPFNRQVQLKVHASGMGRHLWNCPAFWSEVseq id no 400； HPSPPPEKRSseq id no 401； HPSPPPEKKRSseq id no 402； HPSPPPEKKGAEESGPFNRQVQLKVHASGMGRHLW--NCPAFWSEVseq id no 403； HPSPPPEKGAEESGPFNRQVQLKVHASGMGRHLWN--CPAFWSEVseq id no 404； MQVLSKTHMNLFPQVLLQMFLRGLKRLLQDLEKSKKRKLseq id no 405； RCKSARLIseq id no 406； VQTQPAIKKMQVLSKTHMNLFPQVLLQMFLRGLKRLLQ--DLEKSKKRKLseq id no 407； VQTQPAIKKKMQVLSKTHMNLFPQVLLQMFLRGLKRL--LQDLEKSKKRKLseq id no 408； VQTQPAIKKRCKSARLIseq id no 409； VQTQPAIKRCKSARLIseq id no 410； ARSGKKQKRKLseq id no 411； ARSGKKQKKRKLseq id no 412； ARSGKKQKKENFSseq id no 413； ARSGKKQKENFSseq id no 414； KASARSGKSKKRKLseq id no 415； KASARSGKKSKKRKLseq id no 416； KASARSGKKAKKENSFseq id no 417； KASARSGKAKKENSFseq id no 418； HLNKGRRLGDKIRATseq id no 419； VTSGTPFFHLNKGRRLGDKIRATseq id no 420； VTSGTPFFFHLNKGRRLGDKIRATseq id no 421； VTSGTPFFFIseq id no 422； VTSGTPFFIseq id no 423； VTLLYVNTVTLAPNVNMESSRNAHSPATPSAKRK--DPDLTWGGFVFFFCQFHseq id no 424； KCRCKPNFFVTLLYVNTVTLAPNVNMESSRNAHSP--ATPSAKRKDPDLTWGGFVFFFCQFHseq id no 425； KCRCKPNFFFVTLLYVNTVTLAPNVNMESSRNAH--SPATPSAKRKDPDLTWGGFVFFFCQFHseq id no 426； KCRCKPNFFLseq id no 427； KCRCKPNFLseq id no 429； LVKKLKEKKMNWILseq id no 430； LVKKLKEKKKMNWILseq id no 431； LVKKLKEKKRseq id no 432； LVKKLKEKRseq id no 433； AAIVKDCCRseq id no 434； SQPASILGRKLseq id no 435； SQPASILGKRKLseq id no 436； SQPASILGKAAIVKDCCRseq id no 437； SQPASILGAAIVKDCCRseq id no 459； NTWAKMFFMVFLIIWQNTMF特别适于用一种或几种该化合物的组合治疗的癌症的例子是结肠直肠癌、乳腺癌、小细胞肺癌、非小细胞肺癌、肝癌(原发性和继发性)、肾癌、黑素瘤、卵巢癌、脑癌、头颈癌、胰脏癌、胃癌、食管癌、前列腺癌、白血病、或淋巴瘤。
以下列出这些突变可导致引起肿瘤的基因产物的例子结肠直肠癌的产生被认为是由一系列遗传改变所致。结肠直肠癌缺失(DCC)基因(seq id nos 30-34)、人半胱氨酸蛋白酶(ICErel-Ⅲ)基因(seq id nos 394-398和459)、推测的人错配修复/结合蛋白(hMSH3)基因(Seq id nos 134-147)、人hMSH6基因(seq id nos 201-204和295-299)、人n-myc基因(seq id nos 190-195)、人TGFβ2(hTGFβ2)基因(seq id nos 22-29)、人p53相关基因(seq id nos 287-294)可能参与了结肠直肠癌。
人乳腺癌易感性(BRCA2)(seq id nos 35-94)和人BRCA1-相关RING域蛋白(BARD1)基因(seq id nos 404-413)参与了乳腺癌，而卵巢癌人hMSH6基因(seq id nos 201-204和295-299)可能参与了脑肿瘤。
基因改变在许多类型的腺癌中是很频繁的，以下列出在许多癌中突变的一些基因人乳腺癌易感性(BRCA2)基因(seq id nos 35-94)、结肠直肠癌缺失(DCC)基因(seq id nos 30-34)、推测的人错配修复/结合蛋白(hMSH3)基因(seq id nos 134-147)、人hMSH6基因(seq id nos 201-204和295-299)、人N-MYC基因(seq id nos 190-195)、人TGFb2(hTGFb2)基因(seq id nos 22-29)、人p53相关基因(seq id nos 287-294)、人MUC1基因(seq id nos 248-267)、人种系n-myc基因(seq id nos184-195)、人Wilm氏肿瘤(WIT-1)相关蛋白(seq id nos 388-393)、人鼻咽癌EBV BNLF-1基因(seq id nos 205-211)、人转化生长因子β诱导的基因产物(BIGH3,seq id nos 228-233)。
许多突变基因可导致白血病和淋巴瘤的产生例如人神经纤维蛋白(NF1)基因(seq id nos 178-183)、b-raf癌基因(seg id nos172-177)、人蛋白酪氨酸激酶(JAK1)基因(seq id nos 268-272)、人蛋白酪氨酸激酶(JAK3)基因(seq id nos 273-280)。
参与恶性黑素瘤的基因人恶性黑素瘤转移抑制(hKiSS-1)基因(seq id nos 331-337)，参与转移的基因人转移相关mta1(hMTAl)基因(seq id nos 360-365)。
细胞周期控制和信号转导是被严格调控的。这些基因的移码突变可导致不受控制的细胞生长。易感基因的例子是人蛋白酪氨酸磷酸酶(hPTP)基因(seq id nos 95-102)、人激酶(TTK)基因(seq id nos109-121)、人转录抑制子(CTCF)基因(seq id nos 122-128)、人细胞周期调控蛋白(E1A-结合蛋白)p300基因(seq id nos 212-219)、人转化生长因子β诱导的基因产物(BIGH3)(seq id nos 228-233)、人FLt4基因(编码跨膜酪氨酸激酶)(seq id nos 281-286)、人G蛋白偶联受体(hGPR1)基因(seq id nos 317-322)、人转录因子(hlTF-2)基因(seq id nos 329-330)、人端粒酶相关蛋白TP-1(hTP-1)基因(seq idnos 338-351)、人转录因子TFⅡB的90kDa亚基(hTFBIIB90)基因(seq idnos 366-373)、人FADD同源性ICE/CED-3样蛋白酶基因(seqid nos 129-133)。
DNA合成或修复酶的突变也可导致不受控制的细胞生长。例如，人DNA端粒酶Ⅱ(top2)基因(seq id nos 103-108)和推测的人错配修复/结合蛋白(hMSH3)基因(seq id nos 134-147)和(hMSH6)基因(seg idnos201-204和205-299)。
以下是肿瘤抑制基因人成视网膜细胞瘤结合蛋白1的同型Ⅰ(hRBP1)基因(seq id nos 148-158)、人神经纤维蛋白(NF1)基因(seqid nos 178-183)、人p53相关基因(seq id nos 287-294)、人成视网膜细胞瘤相关蛋白(p107)基因(seq id nos 312-316)、人肿瘤抑制(hLUCA-1)基因(seq id nos 374-381)。这些基因的突变可导致癌的产生。
以下是癌基因、原癌基因或推测的癌基因人种系n-myc基因(seqid nos 184-189)、人n-myc基因(seq id nos 190-195)、人can(hCAN)基因(seq id nos 300-302)、人dek(hDEK)基因(seq id nos 309-311)、b-raf癌基因(seq id nos 172-177)、人DBL(hDBL)原癌基因/人MCF2PO(hMCF2PO)基因(seq id nos 303-308)。这些基因的移码突变可导致癌产生。
生物实验附图描述

图1已证明，用含有突变BAX和突变TGFβRⅡ肽的肽混合物可刺激正常供体的T细胞。图1显示了，6个不同供体的血液样品中的肽混合物依赖性T细胞增殖。结果通过用突变BAX肽(seq id nos 1,9-12)和突变TGFβRⅡ肽(seq id nos 15-21)的混合物刺激每个供体的外周血单核细胞(PBMCs)来获得。混合物中每种肽的浓度是20uM。两星期后以及之后的每周，用10-25uM肽混合物处理的自体PBMC再刺激大培养物。4-5次再刺激后，按标准增殖分析方法测试用单独PBMC(作为对照)或25uM肽处理的PBMC(作为抗原呈递细胞(APC))处理的该大培养物。图2进一步发现，用在大培养物刺激实验中使用的分离肽混合物可产生T细胞克隆。图2显示，通过在U型底96孔微量滴定板中每孔接种5个细胞并使用25uM的突变BAX肽(seq id no 12)处理的自体PBMC作为饲养细胞来克隆来自供体1(图1)的大培养物，可获得T细胞克隆521-2的增殖。在增殖实验中采用自体B-类淋巴母细胞作为APC。图3图3显示，可使用突变BAX肽和突变TGFβRⅡ肽刺激乳腺癌患者的T细胞(PBMC)。使用相同癌症患者的树突细胞(DCs)作为APC。通过用突变BAX肽(seq id nos 1,9-12)混合物和突变TGFβRⅡ肽(seqid id nos 15-21)混合物分开处理DC，然后加入自体PBMC和10ng/ml肿瘤坏死因子，获得T细胞的刺激(图3)。用于处理的混合物中每种肽的浓度是25uM。通过白细胞除去法从一直进行粒细胞集落刺激因子(G-CSF)治疗的乳腺癌患者中获得PBMC和DC。在获得DC之前，用标准方法从细胞产物中分离CD34+细胞。图4图4显示从胰腺癌患者腹水获得的T细胞识别突变BAX(seq id nos1,9-12)和突变TGFβRⅡ(seq id nos 15,17-21)的不同合成肽并增殖的能力。该T细胞系是在胰腺癌患者腹水中存在的T细胞扩增之后获得的。该T细胞系通过用100U/ml重组白细胞介素2(rlL-2)(Amersham,Aylesbury,UK)培养以体外扩增，然后用于增殖分析测试。
将5×104个照射过(30Gy)的自体PBMC接种在U型底96孔板中(Costar,Cambridge,MA)，并用单个20uM的合成肽处理两小时。每孔加入5×104个T细胞，培养板37℃孵育4天，收获前最后12小时添加18.5×104Bq/mL 3H-胸苷。该培养板在液体闪烁计数仪(PackardTopcount)上计数。数据代表对不同合成肽特异的T细胞增殖，数值是3个重复培养物的平均值。这些结果显示从胰腺癌患者分离的体细胞能应答具有源自突变BAX和TGFβRⅡ的氨基酸序列的一组肽。图5图5进一步证明从另一个胰腺癌患者腹水获得的T细胞识别突变BAX(seq id nos 1,9-12)和突变TGFβRⅡ(seq id nos 15,17-21)的不同合成多肽并增殖的能力。该T细胞系是在胰腺癌患者腹水中存在的T细胞扩增之后获得的。该实验按上述相同的方式进行。数据代表对于不同合成肽特异的T细胞增殖，数值是3个重复培养物的平均值。
为了研究后一胰腺癌患者的T细胞应答，克隆应答的T细胞。照射(30Gy)腹膜巨噬细胞，将1×104个细胞和20uM的每一种肽一起接种在U型底96孔板中(Costar)。在显微镜下计数T细胞分裂球丝，并每孔加入5个分裂球丝和100U/ml人重组白介素2(rlL-2)(Amersham,Aylesbury,UK)，总体积200ml。14天后将T细胞克隆转移至含有1mg/mL植物凝集素(PHA,Wellcome,Dartford,UK)、100 U/ml rlL-2和作为饲养层细胞的同种异体照射过的PBMC的24孔培养板(Costar)中，并在7天和14天后筛选肽特异性。图6挑选T细胞克隆520.5、520.7和520.8，用于进一步分析和表达细胞表面表型CD3+、CD8+和TcR+。图6显示T细胞克隆520.5、520.7和520.8对用seq id no 10肽处理的肽-处理自体靶细胞的识别和细胞毒性。用3H-胸苷(9.25×104Bq/ml)标记Epstein-barr病毒转化的自体B细胞过夜，洗涤一次并在培养基中含有或不含25mM合成肽(seq id no 10)和1％DMSO的96孔培养板中每孔接种2500个细胞。37℃孵育30分钟后，洗涤培养板，之后加入T细胞。培养板在37℃再孵育4小时，然后收获，之后在液体闪烁计数仪(Packard Topcount)上计数。数据代表在效应细胞/靶细胞比为10/1的情况下3H-胸苷标记的肽处理的靶细胞的特异溶解百分比。数值是三个重复培养的平均值。这些结果显示，来自胰腺癌患者腹水的三种不同T细胞克隆表现出对突变BAX相关肽(seq id no 10)处理的自体EBV靶标的特异细胞毒性。图7图7显示获自相同患者的3个不同T细胞克隆的细胞溶解特性。将这些T细胞克隆按如上所述培养和扩增，但它们是用含有来自突变TGFβRⅡ的氨基酸序列的合成肽(seq id no 17肽)产生的。T细胞克隆538.1、538.3和538.4均显示细胞表面表型CD3+、CD8+和TcR+。实验条件见如上所述(图6)。数据代表在效应细胞/靶细胞比为10/1的情况下用seq id no 428肽处理的3H-胸苷标记靶细胞的特异溶解百分比。数值是三个重复培养的平均值。这些结果显示，来自胰腺癌患者腹水的三种不同T细胞克隆表现出对突变TGFβRⅡ相关肽(seqid no 428)处理的自体EBV靶标的特异细胞毒性。图8图8显示从在结肠基部患有腺癌的患者的肿瘤活检获得的两种CD4+T细胞克隆IMT8和IMT9的特异性。免疫组织化学揭示患者有主要由CD4+T细胞造成的大量浸润，其中许多T细胞携带激活标志。在CD4 T细胞浸润区，观察到HLA DR阳性肿瘤细胞岛。从活检组织生长出来的肿瘤浸润淋巴细胞中获得T细胞克隆，之后将其在含有15U/mL重组人IL-2的培养基中培养16小时。通过在含有照射过的肽处理的APC和100U/ml IL-2的Terasaki培养板上有限稀释(1细胞/孔)，克隆这些培养物的T细胞。用TGFβRⅡ移码突变肽(seq id no.15、17和18)混合物(每种肽1ug/ml)在存在3ug/ml纯化人β2微球蛋白和10ng/ml重组人TNFα时37℃处理自体APC细胞3小时。在能扩增的14个克隆中，初步实验显示两个克隆与用于克隆的肽混合物反应。扩增后筛选在标准增殖分析中与单个肽反应的克隆。结果显示IMT8和IMT9均与TGFβRⅡ移码突变肽seg.id.no.17特异反应，而未观察到与被测的其它两个移码突变肽的反应。
该图(图8)描述了传统T细胞增殖分析的结果，其中将克隆T细胞(5×104)与照射过的APC(5×104)在收获前共培养3天，一式3份。为了测定该培养物的增殖能力，在收获前向该培养物加入3H-胸苷(3.7×104Bq/孔)，孵育过夜。数值是三个重复实验的平均每分钟计数(cpm)。图9图9说明用特异结合HLA-DR分子的抗体处理细胞可完全阻断两个T细胞克隆IMT8和IMT9对seq.id.no.17肽的特异反应性，因为阻断后的反应性和不存在该肽时这些克隆与APC的背景反应活性相同。另一方面HLAⅡ型同种型HLA-DQ和HLA-DP的抗体不能阻断这些克隆与肽处理的APC的反应。该实验明确地说明HLA-DR是负责给这两个T细胞克隆呈递该肽的分子。抗体阻断实验中采用同源EBV转化细胞系9601(IHWS9命名法)作为APC。该APC用15ug/ml浓度的肽在37℃处理1小时，然后加入10ug/ml的阻断抗体L243(pan-DR抗体)、SPVL3(pan-DQ抗体)和B7.21(pan-DP抗体)。未处理的APC和在无阻断抗体存在时肽处理的APC分别充当阴性和阳性对照。结果表示如同图8。图10
患者的IMT是HLA类型的，并证明是HLA:A1,2；B7,8；DR3,14；DQ1,2。为确定哪一种HLA-DR分子负责seg.id.no.17肽的呈递，获得一组HLA加工产生的同源BCL细胞系，并用seg.id.no.17肽处理。图10描述了HLA-DR14(DRA*0102,DRB*1401)鉴定为负责将seq.id.no.17肽呈递给T细胞克隆IMT8和IMT9的HLA-DR分子。当用自体EBV转化细胞系(Auto APC)以及细胞系9054(EK)和9061(31227ABO)呈递肽时，观察到特异的增殖应答，其中9054和9061细胞系在细胞表面表达仅有的DR分子DR14。同源细胞系给出更高的应答，反映了由于该DR分子编码基因双倍剂量的作用引起了相关Ⅱ型/肽复合物的更高水平表达。当用表达HLA-DR3(9018,L0081785)的细胞系呈递该肽时没有获得应答，HLA-DR3代表患者APC表达的其它DR分子，用不相关的HLA-DR分子也无应答。该实验按图9所述进行，只是不进行抗体阻断。结果表示如同图8中。图11图11说明用递增浓度的肽seq.id.no.17处理细胞系9054获得的剂量应答曲线。IMT8和IMT9均显示对肽的增殖应答的剂量依赖性增加。结果用本图(图11)所标示的肽浓度按图9和图10中所述获得。结果表示如同图8中。图12图12描述通过每周用肽(seq.id.no.16、17和21)处理过的照射过的自体树突细胞体外刺激从健康血液供体(供体2892)的外周血分离的T细胞所产生的细胞系的反应性。当T细胞与肽seq.id.no.21处理的自体树突细胞共孵育时，获得高于背景值以上的特异应答。在第一和第二次体外刺激后培养物中没有检测到活性。这些数据说明正常个体的T细胞库含有能识别来自正常人不存在的TGFβRⅡ突变的移码肽的少数前体细胞。在另外两个血液供体(#2706和#2896)中，具有相关特异性的前体细胞的水平极低以至无法检测。这些结果表示为用传统IFNg ELISPOT分析所测定的每104个T细胞的点数。该分析测定可特异与给定抗原反应的细胞混合物中存在的细胞数目。简要的说，用作为APC的2-5×106照射过的肽处理自体树突细胞(DC)每周刺激107个T细胞(非贴壁细胞)。按照文献所述标准程序在重组人GM-CSF和IL-4中培养贴壁细胞群体，产生DC。以15ug/ml肽处理过夜后，和重组TNFα一起培养，获得完全成熟的DC。每孔中加入104个培养T细胞进行双份实验，分别加入104个处理或未处理的DC作为APC，然后根据已知的标准程序进行ELISPOT。结果为每104个T细胞点数的平均数。图13图13显示用seq.id.no.15-21的肽体外刺激健康血液供体(供体322)的T细胞所获得的结果。按图12所述进行体外培养。当用21肽刺激seq.id.no.16和21肽混合物预先处理的T细胞培养物，以及用同样的肽刺激seq.id.no.17肽预先处理的培养物之后，可见到超过背景值的增殖应答。这些结果说明正常血液供体具有少量的特异于这些移码突变肽的循环T细胞，并说明通过用移码突变肽刺激可扩增培养物中的这些细胞。这些结果还证实了图8-11所述的结果，说明seq.id.no.17肽在人体中具有免疫原性，并且指出seq.id.no.21肽也可作为人的癌症疫苗。这些结果按图8所述方式表示。图14图14显示的结果说明HLAⅠ型表位特异的CD8+T细胞可从健康血液供体(供体905)的T细胞库中存在的T细胞产生。第二轮体外再刺激后使用任何肽均未见到超过背景以上的反应性。第四次再刺激后，肽seq.id.no.428特异的T细胞的频率从不可检测水平增加到约细胞的2.5％。这些结果说明CD8+表型的CTL前体细胞存在于健康血液供体的未预先处理的T细胞库中。这种T细胞可在体外通过使用肽seq.id.no.428特异刺激来扩增。这形成了使用该肽作为产生对这种突变的癌症患者的移码肽特异的细胞毒性T细胞的基础。该T细胞通过每周再刺激从外周血分离并经肽处理的自体DC刺激的T细胞来产生，所述刺激按图12所述进行，只是根据产生CD8表型的细胞毒性T细胞(CTL)的标准程序在培养过程中加入了Ⅰ1-7和Ⅰ1-2。所用肽是seq.id.no.428、439、446和451的肽。用图12所述的ELISPOT分析检测细胞。结果按图12所述表示。
选择并设计肽seq.id.no.17，以包含若干HLAⅠ型和HLAⅡ型分子的结合基序。因此这些肽含有CD4+和CD8+T细胞的表位，并预测只要癌细胞中天然存在的异常TGFβRⅡ蛋白发生加工并产生重叠肽，则会在癌症患者体内引起CD4和CD8两种T细胞应答。这对于CD4 T细胞现已由图8-11的结果得到证明。这些结果提示1)图8结果证明在高比例的有错配修复机构缺陷的癌症患者中存在的TGFβRⅡ受体突变形式是一种肿瘤特异抗原。
2)在直肠结肠癌中常见的浸润T细胞的抗原特异性通常是未知的。图8的结果说明组成该患者肿瘤中肿瘤浸润淋巴细胞群的T细胞的一个成分是移码突变特异的，说明TGFβRⅡ移码肽在体内是具有免疫原性的，偶尔引起自发T细胞激活。
3)从该观察得出，共同移码突变形成的TGFβRⅡ受体非功能形式被进行了加工。该加工可在肿瘤细胞内作为异常蛋白天然降解的一部分发生，或在肿瘤细胞本身或释放形式的受体被专门APC摄取之后发生，或者是两种情况都有。
4)图8的结果还指出肽seq.id.no.17能结合HLAⅡ型分子，因为用该肽处理APC导致对该肽的特异增殖应答，而且CD4 T细胞应答总是Ⅱ型限制的。这种情况可用图9所示实验结果说明。这里显示对肽seq.id.no.17特异的应答被HLA-DR的抗体完全阻断，而不被其它两种HLAⅡ型分子HLA-DQ和HLA-DP的抗体阻断。而且，通过使用一组标准同源Epstein Barr病毒(EBV)转化的覆盖患者自身APC中存在的相关HLAⅡ型分子的B细胞系(BCL)，我们得以鉴定出负责将肽seq.id.no.17呈递给TLC IMT8和IMT9的Ⅱ型分子是HLA-DR 14。同时这些发现极好地符合在来自相同肿瘤活检的平行部分中获得的免疫组织化学观察，其中我们能说明激活的CD4+T细胞在已诱导表达HLA-DR分子的肿瘤细胞附近大量存在。图11的结果说明这些T细胞克隆能对一定范围的肽剂量产生增殖应答，而且该应答是剂量依赖性的。
5)因为这些T细胞克隆是通过克隆从肿瘤活检分离的T细胞获得的，所以我们的发现的另一个提示是对肽seq.id.no.17特异的激活T细胞在刺激后能返回至肿瘤组织。
6)因为肽seq.id.no.17是肿瘤特异抗原，而且产生该肽或具有重叠序列的多个肽的移码突变在具有酶缺陷的癌中是常见的，其中所述酶是错配修复机构的一部分，该肽可用作在癌症患者或癌症高危人体中引起T细胞应答的疫苗。这种T细胞应答可潜在地影响现有肿瘤的生长或抑制手术或其它形式治疗后肿瘤的再生长，或在检测到或怀疑有错配酶缺陷的遗传性癌症患者和很有可能患上发生这种错配修复突变的癌症的患者中引起这种T细胞应答。合成使用连续流动固相肽合成来合成所述肽。采用具有适当侧链保护的N-a-Fmoc-氨基酸。为了偶联将Fmoc-氨基酸活化成五氟苯基酯，或在偶联之前采用TBTU或二异丙基碳化二亚胺活化。每次偶联后使用溶于DMF中的20％哌啶选择性除去Fmoc。从树脂分离和最终除去侧链保护用含适当清除剂的95％TFA来进行。用反向(C18)HPLC纯化和分析这些肽。通过使用电喷质谱法(Finnigan mat SSQ710)证实这些肽的身份。
用于T细胞刺激体内研究的这些肽通过这种方法合成。
本领域技术人员可使用数种其它熟知的方法来合成这些肽。
测定新的移码突变肽的方法的实施例在本实施例中，使用BAX基因说明原理。
在下列步骤的每一步中，第一行是基因序列，第二行是氨基酸序列。
在步骤2-5中，有下划线的序列代表蛋白的突变部分。
第一步正常的BAX。ATG GGG GGG GAG GCA CCC GAG CTG GCC CTG GAC CCG GTG ……M G G E A P E L A L D P V…第二步从基因序列缺失1个G。ATG GGG GGG AGG CAC CCG AGC TGG CCC TGG ACC CGG TGC CTCM G G R H P S W P W T R C LAGG ATG CGT CCA CCA AGA AGC TGAR M R P P R S 终止密码子第三步从基因序列缺失2个G。ATG GGG GGA GGC ACC CGA GCT GGC CCT GGA CCC GGT GCCM G G G T R A G P G P G ATCA GGA TGC GTC CAC CAA GAA GCT GAG CGA GTG TCT CAA GCGS G C V H Q E A E R V S Q ACAT CGG GGA CGA ACT GGA CAG TAAH R G R T G Q 终止密码子第四步在基因序列中插入1个G。ATG GGG GGG GGA GGC ACC CGA GCT GGC CCT GGA CCC GGT GCCM G G G G T R A G P G P G ATCA GGA TGC GTC CAC CAA GAA GCT GAG CGA GTG TCT CAA GCGS G C V H Q E A E R VS Q ACAT CGG GGA CGA ACT GGA CAG TAAH R G R T G Q 终止密码子第五步在基因序列中插入2个G。ATG GGG GGG GGG AGG CAC CCG AGC TGG CCC TGG ACC CGG TGCM G G G R H P S W P W T R CCTC AGG ATG CGT CCA CCA AGA AGC TGAL R M R P P R S 终止密码子在下一个实施例中，使用TGFβRⅡ基因来说明该原理。
在下列步骤的每一步中，第一行是基因序列，第二行是氨基酸序列。
在步骤2-5中，有下划线的序列代表蛋白的突变部分。
第一步正常的TGFβRⅡ。GAA AAA AAA AAG CCT GGT GAG ACT TTC TTC ATG TGT TCC ……E K K K P G E T F F M C S…第二步从基因序列缺失1个A。GAA AAA AAA AGC CTG GTG AGA CTT TCT TCA TGT GTT CCT GTAE K K S L V R L S S C V P VGCT CTG ATG AGT GCA ATG ACA ACA TCA TCT TCT CAG AAG AATA L M S A M T T S S S Q K NATA ACA CCA GCA ATC CTG ACT TGT TGC TAGI T P A I L T C C 终止密码子第三步从基因序列缺失2个A。GAA AAA AAA GCC TGG TGAE K K A W 终止密码子第四步在基因序列中插入1个A。GAA AAA AAA AAA GCC TGG TGAE K K K A W 终止密码子第五步在基因序列中插入2个A。GAA AAA AAA AAA AGC CTG GTG AGA CTT TCT TCA TGT GTT CCTE K K K S L V R L S S C V PGTA GCT CTG ATG AGT GCA ATG ACA ACA TCA TCT TCT CAG AAGV A L M S A M T T S S S Q KAAT ATA ACA CCA GCA ATC CTG ACT TGT TGC TAGN I T P A I L T C C 终止密码子因此，本发明的肽可用于治疗癌细胞携带移码突变基因的癌症的方法，其中治疗包括给需要这种治疗的病人体内或离体施用至少一种本发明的肽。
在另一个实施方案中，本发明的肽可用于通过给所述人施用至少一种本发明的肽，作为疫苗给癌细胞携带移码突变基因的癌症的易感人群接种。
另一个优点是给人类个体施用本发明肽的混合物，由此本发明的每一种肽都能结合该个体不同类型的HLAⅠ型和/或Ⅱ型分子。
进一步期望，如果包括本发明的肽，上述PCT/NO92/00032申请中公开的抗癌疫苗或肽药物的作用可极大地增强。因此，在本发明的另一个实施方案中，本发明的肽与PCT/NO92/00032中所公开的肽同时或以随意次序共同施用。
还认为，这些肽可与化合物如细胞因子和/或生长因子如白细胞介素2(IL-2)、白细胞介素12(IL-12)、粒细胞巨噬细胞集落刺激因子(GM-CSF)、Flt-3配体等一起同时或分开使用，以增强本领域已知的免疫应答。
根据本发明的肽可单独、或联合其它物质例如标准佐剂、或以本领域已知可诱导高亲和细胞毒T淋巴细胞的脂蛋白结合物形式(K.Deres，自然(Nature)，第342卷，(1989年11月))在疫苗或治疗组合物中使用。
根据本发明的肽可用于包括在基于肽或重组片段的疫苗中。
根据本发明的肽可与本领域已知的普通添加物、稀释剂、稳定剂等一起包括在药物组合物或疫苗中。
根据本发明，药物组合物或疫苗可仅包括本发明的肽或联合至少一种药物学上可接受的载体或稀释剂。
更进一步，疫苗或治疗组合物可包含作为突变蛋白质片段的肽，所述突变蛋白质是由基因重复序列中碱基插入或缺失引起的。
更进一步，疫苗组合物可包含至少一种选用于一种癌症的肽，该疫苗可施用给具有该特定癌症遗传易感性的人。
更进一步，疫苗组合物可包含至少一种选用于一种癌症的肽，该疫苗可施用给属于该特定癌症高危人群的人。
根据本发明的癌疫苗还可施用给普通人群，例如作为能对各种与移码突变基因相关的常见癌症引起T细胞免疫的肽混合物施用。
根据本发明的肽可作为一种肽或多种肽的混合物施用。作为替代，这些肽可相互共价连接形成更大的多肽甚至环型多肽。
根据本发明的癌症治疗可在体内或离体进行，主要目标是产生对与患者所患癌症类型相关的突变基因产物特异的T细胞系或克隆。
更进一步，本发明的移码突变肽可通过各种途径施用给患者，包括但不限于皮下、肌内、真皮内、腹膜内、静脉内等。在一个实施方案中，本发明的肽通过真皮内途径施用。这些肽可按治疗或预防有效的剂量在单个或多个注射位点施用给患者。
本发明的肽在1-2个月期间内仅施用一次或施用数次，如每周一次，以后可按重复次序施用，所有这些均根据治疗患者的需要来进行。
对于待接种疫苗的每个病人或个体，本发明的肽可施用1微克(1ug)-1克(1g)范围内的量。优选每次给药使用1微克(1ug)-1毫克(1mg)范围内的更小剂量。
本发明还包括编码移码突变肽的DNA序列。
此外，本发明包括含有编码至少一种移码突变肽的DNA序列的分离的DNA序列，以及作为治疗或预防与该基因移码突变相关的癌症的疫苗施用这种分离的DNA序列。
根据本发明的肽可以DNA疫苗的形式给个体施用。编码这些肽的DNA可以是克隆的质粒DNA或合成的寡核苷酸的形式。该DNA可与细胞因子如IL-2和/或其它共刺激分子一起使用。这些细胞因子和/或其它共刺激分子本身可以质粒或寡核苷酸DNA的形式施用。已显示，对DNA疫苗的应答可通过免疫刺激DNA序列(ISS)的存在来增强。这些免疫刺激DNA序列可根据下式采取含有甲基化CpG的六聚物基序的形式5’-嘌呤-嘌呤-CG-嘧啶-嘧啶-3’。因此，我们的DNA疫苗可在编码这些肽的DNA、或编码细胞因子或其它共刺激分子的DNA、或这两种分子中包含这些ISS或其他ISS。Tighe等(1998，现代免疫学(Immunology Today),19(2),89-97)提供了DNA疫苗接种的优点的综述。
在一个实施方案中，编码突变BAX肽的DNA序列包含正常BAX。ATG GGG GGG GAG GCA CCC GAG CTG GCC CTG GAC CCG GTG……从BAX基因序列缺失1个G。ATG GGG GGG AGG CAC CCG AGC TGG CCC TGG ACC CGG TGC CTCAGG ATG CGT CCA CCA AGA AGC TGA从BAX基因序列缺失2个G。ATG GGG GGA GGC ACC CGA GCT GGC CCT GGA CCC GGT GCCTCA GGA TGC GTC CAC CAA GAA GCT GAG CGA GTG TCT CAA GCGCAT CGG GGA CGA ACT GGA CAG TAA在BAX基因序列中插入1个G。ATG GGG GGG GGA GGC ACC CGA GCT GGC CCT GGA CCC GGT GCCTCA GGA TGC GTC CAC CAA GAA GCT GAG CGA GTG TCT CAA GCGCAT CGG GGA CGA ACT GGA CAG TAA在BAX基因序列中插入2个G。ATG GGG GGG GGG AGG CAC CCG AGC TGG CCC TGG ACC CGG TGCCTC AGG ATG CGT CCA CCA AGA AGC TGA在第二个实施方案中，编码突变TGFβRⅡ肽的DNA序列包含正常TGFβRⅡ基因。GAA AAA AAA AAG CCT GGT GAG ACT TTC TTC ATG TGT TCC.从TGFβRⅡ基因序列缺失1个A。GAA AAA AAA AGC CTG GTG AGA CTT TCT TCA TGT GTT CCT GTAGCT CTG ATG AGT GCA ATG ACA ACA TCA TCT TCT CAG AAG AATATA ACA CCA GCA ATC CTG ACT TGT TGC TAG从TGFβRⅡ基因序列缺失2个A。GAA AAA AAA GCC TGG TGA在TGFβRⅡ基因序列中插入1个A。GAA AAA AAA AAA GCC TGG TGA在TGFβRⅡ基因序列中插入2个A。GAA AAA AAA AAA AGC CTG GTG AGA CTT TCT TCA TGT GTT CCTGTA GCT CTG ATG AGT GCA ATG ACA ACA TCA TCT TCT CAG AAGAAT ATA ACA CCA GCA ATC CTG ACT TGT TGC TAG本发明还包括含有移码突变肽编码DNA序列的载体或质粒。所述载体包括但不限于大肠杆菌(E.Coli)质粒、李斯特杆菌属(Listeria)载体和重组病毒载体。重组病毒载体包括但不限于含有移码突变肽编码DNA序列的正痘病毒、金丝雀病毒、山羊痘病毒、猪痘病毒、牛痘病毒、杆状病毒、人腺病毒、SV40、牛乳头瘤病毒等。
还相信，抗癌治疗或预防也可通过给患者施用有效剂量的包含至少一个移码突变肽编码DNA序列插入位点的重组病毒载体或质粒，由此该患者的抗原呈递细胞转变成该载体/质粒的宿主细胞，而且获得HLA/移码突变肽复合物的呈递。
使用本发明的肽，本领域技术人员将能发现其它可能的应用组合，这些也应包括在本发明权利要求的范围之内。
本发明的肽可通过本领域已知的传统方法产生，如化学肽合成、重组DNA技术或移码突变基因编码的蛋白或肽的蛋白酶切割。化学合成的一种方法在下面的描述中阐述。
为了使癌疫苗或基于特异T细胞免疫的特定癌症治疗方法有效，必须满足三个条件1．所用肽必须以其全长或由抗原呈递细胞加工后的形式与癌细胞或其它抗原呈递细胞上HLAⅠ型和/或Ⅱ型分子呈递的加工后突变蛋白片段相应，2．所用肽必须以免疫原性形式与HLAⅠ型和/或Ⅱ型分子结合，和3．能识别并应答HLA/肽复合物的T细胞必须存在于人循环系统中。
已证明，对于本发明的一些代表性的肽，所有这些条件均符合。根据本发明的肽在体外引起特异T细胞免疫应答。已证明根据本发明的肽相应于加工过的突变蛋白片段。例如相应于转化突变BAX和TGFβRⅡ肽的片段的肽。
通过本发明可获得下列优点-提供治疗患有基因移码突变引起的癌症的患者的可能性，其中大部分目前已知的癌症还没有任何好的替代治疗方法。
-提供给具有遗传易感性或属于其它高危人群的人预防性接种疫苗的可能性。
-提供为特定癌症如直肠结肠癌或胰腺癌准备联合治疗的可能性，其中该癌症通常与基因移码突变或点突变有关。
-因为所述移码突变在大量癌症中发生，有可能使用这些多肽联合现有疫苗或将来的疫苗获得多靶向治疗。
-同样，与多个基因的多移码突变相关的癌症患者可通过联合治疗更有效地治疗。
序列表所有序列的共同信息序列类型肽序列单位氨基酸拓扑类型线性SEQ ID NO:1序列长度18氨基酸R H P S W P W T R C L R M R P P R S1 5 10 15SEQ ID NO:2序列长度31氨基酸G T R A G P G P G A S G C V H Q E A E R V S Q A H R G R T G1 510152025 30QSEQ ID NO:3序列长度32氨基酸G G T R A G P G P G A S G C V H Q E A E R V S Q A H R G R T1 5101520 2530G QSEQ ID NO:4序列长度19氨基酸G R H P S W P W T R C L R M R P P R S1 5 1015SEQ ID NO:5序列长度28氨基酸I Q D R A G R M G G R H P S W P W T R C L R M R P P R S1 51015 20 25SEQ ID NO:6序列长度19氨基酸I Q D R A G R M G G G R H P S W P W T1 5 10 15SEQ ID NO:7序列长度42氨基酸I Q D R A G R M G G G G T R A G P G P G A S G C V H Q E A E1 51015 2025 30R V S Q A H R G R T G Q35 40SEQ ID NO:8序列长度19氨基酸I Q D R A G R M G G G T R A G P G P G1 51015SEQ ID NO:9序列长度22氨基酸I Q D R A G R M G G R H P S W P W T R C L R1 5101520SEQ ID NO:10序列长度22氨基酸A S G C V H Q E A E R V S Q A H R G R T G Q1 510 1520SEQ ID NO:11序列长度22氨基酸G G T R A G P G P G A S G C V H Q E A E R V1 5 1015 20SEQ ID NO:12序列长度22氨基酸I Q D R A G R M G G G G T R A G P G P G A S1 5 10 15 20SEQ ID NO:13序列长度34氨基酸S L V R L S S C V P V A L M S A M T T S S S Q K N I T P A I1 51015 202530L T C CSEQ ID NO:14序列长度44氨基酸S P K C I M K E K K S L V R L S S C V P V A L M S A M T T S1 51015 202530S S Q K N I T P A I L T C C35 40SEQ ID NO:15序列长度19氨基酸P K C I M K E K K K S L V R L S S C V1 510 15SEQ ID NO:16序列长度23氨基酸A L M S A M T T S S S Q K N I T P A I L T C C1 510 1520SEQ ID NO:17序列长度23氨基酸S L V R L S S C V P V A L M S A M T T S S S Q1 5 1015 20SEQ ID NO:18序列长度22氨基酸S P K C I M K E K K S L V R L S S C V P V A1 5 101520SEQ ID NO:19序列长度12氨基酸S P K C I M K E K K A W1 5 10SEQ ID NO:20序列长度12氨基酸P K C I M K E K K K A W1 5 10SEQ ID NO:21序列长度19氨基酸A M T T S S S Q K N I T P A I L T C C1 5 1015SEQ ID NO:22序列长度9氨基酸T V G R P H I S C1 5SEQ ID NO:23序列长度10氨基酸K T V G R P H I S C1 5 10SEQ ID NO:24序列长度18氨基酸K Q W E D P T S P A N V I A L L Q T1 5 10 15SEQ ID NO:25序列长度17氨基酸Q W E D P T S P A N V I A L L Q T1 5 1015SEQ ID NO:26序列长度19氨基酸Q K T I K S T R K K T V G R P H I S C1 5 10 15SEQ ID NO:27序列长度20氨基酸Q K T I K S T R K K K T V G R P H I S C1 5 1015 20SEQ ID NO:28序列长度28氨基酸Q K T I K S T R K K K Q W E D P T S P A N V I A L L Q T1 5 10152025SEQ ID NO:29序列长度27氨基酸Q K T I K S T R K K Q W E D P T S P A N V I A L L Q T1 510 1520 25SEQ ID NO:30序列长度34氨基酸A A D L Q Q Q F V H F L D C W D V S S I P F T L H L P Q A Q1 5 10 152025 30D I T TSEQ ID NO:31序列长度9氨基酸G K D A K E K S S1 5SEQ ID NO: 32序列长度10氨基酸G K D A K E K K S S1 510SEQ ID NO:33序列长度42氨基酸G K D A K E K K A A D L Q Q Q F V H F L D C W D V S S I P F1 5 101520 2530T L H L P Q A Q D I T T3540SEQ ID NO:34序列长度41氨基酸G K D A K E K A A D L Q Q Q F V H F L D C W D V S S I P F T1 51015202530L H L P Q A Q D I T T35 40SEQ ID NO:35序列长度9氨基酸F S M K Q T L M N V K N L K T K1 5 1015SEQ ID NO:36序列长度17氨基酸K F S M K Q T L M N V K N L K T K1 510 15SEQ ID NO:37序列长度25氨基酸V R T S K T R K K F S M K Q T L M N V K N L K T K1 510 15 2025SEQ ID NO:38序列长度26氨基酸V R T S K T R K K K F S M K Q T L M N V K N L K T K1 5 1015 2025SEQ ID NO:39序列长度12氨基酸V R T S K T R K K N F P1 5 10SEQ ID NO:40序列长度11氨基酸V R T S K T R K N F P1 510SEQ ID NO:41序列长度10氨基酸I K K K L L Q F Q K1 5 10SEQ ID NO:42序列长度11氨基酸K I K K K L L Q F Q K1 510SEQ ID NO:43序列长度17氨基酸K S R R N Y F N F K N N C Q S R L1 5 1015SEQ ID NO:44序列长度16氨基酸S R R N Y F N F K N N C Q S R L1 5 1015SEQ ID NO:45序列长度18氨基酸T N L R V I Q K I K K K L L Q F Q K1 51015SEQ ID NO:46序列长度19氨基酸T N L R V I Q K K I K K K L L Q F Q K1 5 10 15SEQ ID NO:47序列长度25氨基酸T N L R V I Q K K S R R N Y F N F K N N C Q S R L1 5 1015 2025SEQ ID NO:48序列长度24氨基酸T N L R V I Q K S R R N Y F N F K N N C Q S R L1 5101520SEQ ID NO:49序列长度5氨基酸K I M I T1 5SEQ ID NO:50序列长度12氨基酸N I D K I P E K I M I T1 5 10SEQ ID NO:51序列长度13氨基酸N I D K I P E K K I M I T1 5 10SEQ ID NO:52序列长度5氨基酸I I N A N1 5SEQ ID NO:53序列长度6氨基酸K I I N A N1 5SEQ ID NO:54序列长度13氨基酸N D K T V S E K I I N A N1 5 10SEQ ID NO:55序列长度14氨基酸N D K T V S E K K I I N A N1 5 10SEQ ID NO:56序列长度14氨基酸N G L E K E Y L M V N Q K E1 5 10SEQ ID NO:57序列长度23氨基酸S Q T S L L E A K N G L E K E Y L M V N Q K E1 5101520SEQ ID NO:58序列长度24氨基酸S Q T S L L E A K K N G L E K E Y L M V N Q K E1 5 1015 20SEQ ID NO:59序列长度12氨基酸S Q T S L L E A K K M A1 510SEQ ID NO:60序列长度11氨基酸S Q T S L L E A K M A1 5 10SEQ ID NO:61序列长度6氨基酸T L V F P K1 5SEQ ID NO:62序列长度7氨基酸K T L V F P K1 5SEQ ID NO:63序列长度14氨基酸L K N V E D Q K T L V F P K1 5 10SEQ ID NO:64序列长度15氨基酸L K N V E D Q K K T L V F P K1 5 1015SEQ ID NO:65序列长度10氨基酸L K N V E D Q K K H1 5 10SEQ ID NO:66序列长度9氨基酸L K N V E D Q K H1 5SEQ ID NO:67序列长度6氨基酸K K I Q L Y1 5SEQ ID NO:68序列长度7氨基酸K K K I Q L Y1 5SEQ ID NO:69序列长度36氨基酸R K R F S Y T E Y L A S I I R F I F S V N R R K E I Q N L S1 510 15202530S C N F K I35SEQ ID NO:70序列长度15氨基酸L R I V S Y S K K K K I Q L Y1 5 1015SEQ ID NO:71序列长度16氨基酸L R I V S Y S K K K K K I Q L Y1 5 1015SEQ ID NO:72序列长度45氨基酸L R I V S Y S K K R K R F S Y T E Y L A S I I R F I F S V N1 510 15202530R R K E I Q N L S S C N F K I3540 45SEQ ID NO:73序列长度44氨基酸L R I V S Y S K R K R F S Y T E Y L A S I I R F I F S V N R1 5 10 15 202530R K E I Q N L S S C N F K I35 40SEQ ID NO:74序列长度18氨基酸Q D L P L S S I C Q T I V T I Y W Q1 5 1015SEQ ID NO:75序列长度19氨基酸K Q D L P L S S I C Q T I V T I Y W Q1 51015SEQ ID NO:76序列长度25氨基酸N R T C P F R L F V R R M L Q F T G N K V L D R P1 5 1015 2025SEQ ID NO:77序列长度27氨基酸G F V V S V V K K Q D L P L S S I C Q T I V T I Y W Q1 5 10152025SEQ ID NO:78序列长度28氨基酸G F V V S V V K K K Q D L P L S S I C Q T I V T I Y W Q1 5 1015 2025SEQ ID NO:79序列长度34氨基酸G F V V S V V K K N R T C P F R L F V R R M L Q F T G N K V1 5 101520 2530L D R PSEQ ID NO:80序列长度33氨基酸G F V V S V V K N R T C P F R L F V R R M L Q F T G N K V L1 5 101520 2530D R PSEQ ID NO:81序列长度8氨基酸Y R K T K N Q N1 5SEQ ID NO:82序列长度9氨基酸K Y R K T K N Q N1 5SEQ ID NO:83序列长度10氨基酸N T E R P K I R T N1 5 10SEQ ID NO:84序列长度17氨基酸D E T F Y K G K K Y R K T K N Q N1 51015SEQ ID NO:85序列长度18氨基酸D E T F Y K G K K K Y R K T K N Q N1 5 1015SEQ ID NO:86序列长度19氨基酸D E T F Y K G K K N T E R P K I R T N1 5 1015SEQ ID NO:87序列长度18氨基酸D E T F Y K G K N T E R P K I R T N1 5 1015SEQ ID NO:88序列长度28氨基酸L S I N N Y R F Q M K F Y F R F T S H G S P F T S A N F1 5 1015 2025SEQ ID NO:89序列长度29氨基酸K L S I N N Y R F Q M K F Y F R F T S H G S P F T S A N F1 5 1015 2025SEQ ID NO:90序列长度10氨基酸N S V S T T T G F R1 5 10SEQ ID NO:91序列长度37氨基酸N I Q L A A T K K L S I N N Y R F Q M K F Y F R F T S H G S1 5101520 25 30P F T S A N F35SEQ ID NO:92序列长度38氨基酸N I Q L A A T K K K L S I N N Y R F Q M K F Y F R F T S H G1 51015 20 2530S P F T S A N F35SEQ ID NO:93序列长度19氨基酸N I Q L A A T K K N S V S T T T G F R1 510 15SEQ ID NO:94序列长度18氨基酸N I Q L A A T K N S V S T T T G F R1 5 1015SEQ ID NO:95序列长度18氨基酸M E H V A P G R M S A S P Q S P T Q1 5 1015SEQ ID NO:96序列长度19氨基酸K M E H V A P G R M S A S P Q S P T Q1 5 1015SEQ ID NO:97序列长度59氨基酸K W S T W L Q A E C Q H L H S P Q R S D K P Q Q A G L D Q Q1 5 10152025 30H H C F A L D S S P G P R P V F L Q L L G L M G Q G R H D35 40455055SEQ ID NO:98序列长度58氨基酸W S T W L Q A E C Q H L H S P Q R S D K P Q Q A G L D Q Q H1 5101520 25 30H C F A L D S S P G P R P V F L Q L L G L M G Q G R H D35404550 55SEQ ID NO:99序列长度26氨基酸T F S V W A E K M E H V A P G R M S A S P Q S P T Q1 5101520 25SEQ ID NO:100序列长度27氨基酸T F S V W A E K K M E H V A P G R M S A S P Q S P T Q1 5 1015 20 25SEQ ID NO:101序列长度67氨基酸T F S V W A E K K W S T W L Q A E C Q H L H S P Q R S D K P1 5 1015 20 2530Q Q A G L D Q Q H H C F A L D S S P G P R P V F L Q L L G L35 4045 5055 60M G Q G R H D65SEQ ID NO:102序列长度66氨基酸T F S V W A E K W S T W L Q A E C Q H L H S P Q R S D K P Q1 510 1520 25 30Q A G L D Q Q H H C F A L D S S P G P R P V F L Q L L G L M3540 4550 55 60G Q G R H D65SEQ ID NO:103序列长度18氨基酸H K W L K F C L L R L V K E S F H E1 51015SEQ ID NO:104序列长度19氨基酸K H K W L K F C L L R L V K E S F H E1 51015SEQ ID NO:105序列长度27氨基酸K G G K A K G K K H K W L K F C L L R L V K E S F H E1 51015 20 25SEQ ID NO:106序列长度28氨基酸K G G K A K G K K K H K W L K F C L L R L V K E S F H E1 510152025SEQ ID NO:107序列长度13氨基酸K G G K A K G K K N T N G1 510SEQ ID NO:108序列长度12氨基酸K G G K A K G K N T N G1 5 10SEQ ID NO:109序列长度8氨基酸V N N F F K K L1 5SEQ ID NO:110序列长度9氨基酸K V N N F F K K L1 5SEQ ID NO:111序列长度16氨基酸L S Q G N V K K V N N F F K K L1 510 15SEQ ID NO:112序列长度17氨基酸L S Q G N V K K K V N N F F K K L1 510 15SEQ ID NO:113序列长度38氨基酸G E K N D L Q L F V M S D R R Y K I Y W T V I L L N P C G N1 510 15 2025 30L H L K T T S L35SEQ ID NO:114序列长度39氨基酸K G E K N D L Q L F V M S D R R Y K I Y W T V I L L N P C G1 51015 2025 30N L H L K T T S L35SEQ ID NO:115序列长度10氨基酸K G K K M I C S Y S1 510SEQ ID NO:116序列长度9氨基酸G K K M I C S Y S1 5SEQ ID NO:117序列长度46氨基酸S S K T F E K K G E K N D L Q L F V M S D R R Y K I Y W T V1 5 10 152025 30I L L N P C G N L H L K T T S L35 40 45SEQ ID NO:118序列长度47氨基酸S S K T F E K K K G E K N D L Q L F V M S D R R Y K I Y W T1 5 10 15 202530V I L L N P C G N L H L K T T S L3530 45SEQ ID NO:119序列长度18氨基酸S S K T F E K K K G K K M I C S Y S1 5 1015SEQ ID NO:120序列长度17氨基酸S S K T F E K K G K K M I C S Y S1 5 1015SEQ ID NO:121序列长度17氨基酸Q R K P K R A N C V I Q R R A K M1 5 1015SEQ ID NO:122序列长度18氨基酸K Q R K P K R A N C V I Q R R A K M1 5 1015SEQ ID NO:123序列长度26氨基酸N K E N Q K E Q T A L L Y R G G Q R C R C V C L R F1 5 101520 25SEQ ID NO:124序列长度26氨基酸P D Y Q P P A K K Q R K P K R A N C V I Q R R A K M1 5 1015 2025SEQ ID NO:125序列长度27氨基酸P D Y Q P P A K K K Q R K P K R A N C V I Q R R A K M1 5 1015 2025SEQ ID NO:126序列长度35氨基酸P D Y Q P P A K K N K E N Q K E Q T A L L Y R G G Q R C R C1 5 101520 2530V C L R F35SEQ ID NO:127序列长度34氨基酸P D Y Q P P A K N K E N Q K E Q T A L L Y R G G Q R C R C V1 5 1015202530C L R FSEQ ID NO:128序列长度7氨基酸N L S S L L I1 5SEQ ID NO:129序列长度5氨基酸T C L P F1 5SEQ ID NO:130序列长度15氨基酸Q P T F T L R K N L S S L L I1 51015SEQ ID NO:131序列长度16氨基酸Q P T F T L R K K N L S S L L I1 51015SEQ ID NO:132序列长度14氨基酸Q P T F T L R K K T C L P F1 510SEQ ID NO:133序列长度13氨基酸Q P T F T L R K T C L P F1 510SEQ ID NO:134序列长度31氨基酸R A T F L L S L W E C S L P Q A R L C L I V S R T G L L V Q1 5 1015202530SSEQ ID NO:135序列长度19氨基酸G Q H F Y W H C G S A A C H R R G C V1 51015SEQ ID NO:136序列长度39氨基酸K E N V R D K K R A T F L L S L W E C S L P Q A R L C L I V1 5101520 25 30S R T G L LV Q S35SEQ ID NO:137序列长度40氨基酸K E N V R D K K K R A T F L L S L W E C S L P Q A R L C L I1 51015 2025 30V S R T G L L V Q S35 40SEQ ID NO:138序列长度28氨基酸K E N V R D K K K G Q H F Y W H C G S A A C H R R G C V1 510152025SEQ ID NO:139序列长度27氨基酸K E N V R D K K G Q H F Y W H C G S A A C H R R G C V1 5 1015 2025SEQ ID NO:140序列长度39氨基酸I T H T R W G I T T W D S W S V R M K A N W I Q A Q Q N K S1 5 1015 202530L I L S P S F T K35SEQ ID NO:141序列长度40氨基酸K I T H T R W G I T T W D S W S V R M K A N W I Q A Q Q N K1 5 10152025 30S L I L S P S F T K3540SEQ ID NO:142序列长度16氨基酸K L L T P G G E L P H G I L G Q1 5 1015SEQ ID NO:143序列长度15氨基酸L L T P G G E L P H G I L G Q1 5 1015SEQ ID NO:144序列长度47氨基酸P P V C E L E K I T H T R W G I T T W D S W S V R M K A N W1 5 10152025 30I Q A Q Q N K S L I L S P S F T K354045SEQ ID NO:145序列长度48氨基酸P P V C E L E K K I T H T R W G I T T W D S W S V R M K A N1 5 10152025 30W I Q A Q Q N K S L I L S P S F T K354045SEQ ID NO:146序列长度24氨基酸P P V C E L E K K L L T P G G E L P H G I L G Q1 5 101520SEQ ID NO:147序列长度23氨基酸P P V C E L E K L L T P G G E L P H G I L G Q1 5 1015 20SEQ ID NO:148序列长度11氨基酸S L K D E L E K M K I1 510SEQ ID NO:149序列长度12氨基酸S L K D E L E K K M K I1 510SEQ ID NO:150序列长度12氨基酸L G Q S S P E K K N K N1 510SEQ ID NO:151序列长度11氨基酸L G Q S S P E K N K N1 510SEQ ID NO:152序列长度23氨基酸R L R R I N G R G S Q I R S R N A F N R S E E1 510 1520SEQ ID NO:153序列长度10氨基酸E P K V K E E K K T1 510SEQ ID NO:154序列长度11氨基酸E P K V K E E K K K T1 510SEQ ID NO:155序列长度32氨基酸E P K V K E E K K R L R R I N G R G S Q I R S R N A F N R S1 51015202530E ESEQ ID NO:156序列长度31氨基酸E P K V K E E K R L R R I N G R G S Q I R S R N A F N R S E1 51015202530ESEQ ID NO:157序列长度14氨基酸T F R Y K G K Q H P F F S T1 510SEQ ID NO:158序列长度10氨基酸G P N A P E E K N H1 510SEQ ID NO:159序列长度11氨基酸G P N A P E E K K N H1 510SEQ ID NO:160序列长度23氨基酸G P N A P E E K K T F R Y K G K Q H P F F S T1 5101520SEQ ID NO:161序列长度22氨基酸G P N A P E E K T F R Y K G K Q H P F F S T1 5 10 1520SEQ ID NO:162序列长度6氨基酸M Q N T C V1 5SEQ ID NO:163序列长度7氨基酸K M Q N T C V1 5SEQ ID NO:164序列长度9氨基酸K C K I R V F S K1 5SEQ ID NO:165序列长度8氨基酸C K I R V F S K1 5SEQ ID NO:166序列长度14氨基酸F F K R T V Q K M Q N T C V1 5 10SEQ ID NO:167序列长度15氨基酸F F K R T V Q K K M Q N T C V1 5 1015SEQ ID NO:168序列长度17氨基酸F F K R T V Q K K C K I R V F S K1 5 1015SEQ ID NO:169序列长度16氨基酸F F K R T V Q K C K I R V F S K1 5 1015SEQ ID NO:170序列长度7氨基酸L P H Y L A H1 5SEQ ID NO:171序列长度8氨基酸C L I T W L T N1 5SEQ ID NO:172序列长度17氨基酸G S T T G L S A T P L P H Y L A H1 5 1015SEQ ID NO:173序列长度118氨基酸G S T T G L S A T P P L P H Y L A H1 5 1015SEQ ID NO:174序列长度19氨基酸G S T T G L S A T P P C L I T W L T N1 5 1015SEQ ID NO:175序列长度18氨基酸G S T T G L S A T P C L I T W L T N1 5 1015SEQ ID NO:176序列长度9氨基酸R F A D K P R P N1 5SEQ ID NO:177序列长度20氨基酸D L P T S P D Q T R S G P V H V S V E P1 5 1015 20SEQ ID NO:178序列长度19氨基酸D S A A G C S G T P R F A D K P R P N1 5 1015SEQ ID NO:179序列长度20氨基酸D S A A G C S G T P P R F A D K P R P N1 5 10 15 20SEQ ID NO:180序列长度31氨基酸D S A A G C S G T P P D L P T S P D Q T R S G P V H V S V E1 5 10 15 20 2530PSEQ ID NO:181序列长度30氨基酸D S A A G C S G T P D L P T S P D Q T R S G P V H V S V E P1 5 10 15 20 2530SEQ ID NO:182序列长度53氨基酸A H P E T P A Q N R L R I P C S R R E V R S R A C K P P G A1 51015202530Q G S D E R R G K A S P G R D C D V R T G R P35404550SEQ ID NO:183序列长度54氨基酸P A H P E T P A Q N R L R I P C S R R E V R S R A C K P P G1 51015 2025 30A Q G S D E R R G K A S P G R D C D V R T G R P35 4045 50SEQ ID NO:184序列长度20氨基酸R P T R R H P R R I A S G S P A V G G R1 5101520SEQ ID NO:185序列长度63氨基酸V A I R G H P R P P A H P E T P A Q N R L R I P C S R R E V1 5 10152025 30R S R A C K P P G A Q G S D E R R G K A S P G R D C D V R T3540455055 60G R PSEQ ID NO:186序列长度64氨基酸V A I R G H P R P P P A H P E T P A Q N R L R I P C S R R E1 510 15202530V R S R A C K P P G A Q G S D E R R G K A S P G R D C D V R35 40 45505560T G R PSEQ ID NO:187序列长度30氨基酸V A I R G H P R P P R P T R R H P R R I A S G S P A V G G R1 51015202530SEQ ID NO:188序列长度29氨基酸V A I R G H P R P R P T R R H P R R I A S G S P A V G G R1 510152025SEQ ID NO:189序列长度85氨基酸R G R T S G R S L S C C R R P R C R P A V A S R S T A P S P1 51015202530R A G S R R C C L R T S C G A A R P R R T R S A C G D W V A35 4045505560S P P T R S S S R T A C G A A S P P A R S W S A P65 70758085SEQ ID NO:190序列长度8氨基酸G G G H L E E V1 5SEQ ID NO:191序列长度94氨基酸Y F G G P D S T P R G R T S G R S L S C C R R P R C R P A V1 51015 20 25 30A S R S T A P S P R A G S R R C C L R T S C G A A R P R R T35 4045 50 55 60R S A C G D W V A S P P T R S S S R T A C G A A S P P A R S65 7075 80 85 90W S A PSEQ ID NO:192序列长度95氨基酸Y F G G P D S T P P R G R T S G R S L S C C R R P R C R P A1 51015202530V A S R S T A P S P R A G S R R C C L R T S C G A A R P R R35 4045505560T R S A C G D W V A S P P T R S S S R T A C G A A S P P A R65 7075808590S W S A P95SEQ ID NO:193序列长度18氨基酸Y F G G P D S T P P G G G H L E E V1 51015SEQ ID NO:194序列长度17氨基酸Y F G G P D S T P G G G H L E E V1 51015SEQ ID NO:195序列长度6氨基酸H R V A D P1 5SEQ ID NO:196序列长度13氨基酸L S Q S S E L D P P S S R1 510SEQ ID NO:197序列长度14氨基酸L S Q S S E L D P P P S S R1 510SEQ ID NO:198序列长度16氨基酸L S Q S S E L D P P H R V A D P1 510 15SEQ ID NO:199序列长度15氨基酸L S Q S S E L D P H R V A D P1 51015SEQ ID NO:200序列长度11氨基酸V I L L P E D T P P S1 5 10SEQ ID NO:201序列长度12氨基酸V I L L P E D T P P P S1 5 10SEQ ID NO:202序列长度14氨基酸V I L L P E D T P P L L R A1 5 10SEQ ID NO:203序列长度13氨基酸V I L L P E L D P L L R A1 5 10SEQ ID NO:204序列长度5氨基酸P S P L P1 5SEQ ID NO:205序列长度25氨基酸P L L F H R P C S P S P A L G A T V L A V Y R Y E1 5 1015 2025SEQ ID NO:206序列长度24氨基酸L L F H R P C S P S P A L G A T V L A V Y R Y E1 5 1015 20SEQ ID NO:207序列长度13氨基酸A P R P P L G P P S P L P1 5 10SEQ ID NO:208序列长度14氨基酸A P R P P L G P P P S P L P1 510SEQ ID NO:209序列长度34氨基酸A P R P P L G P P P L L F H R P C S P S P A L G A T V L A V1 5 10152025 30Y R Y ESEQ ID NO:210序列长度33氨基酸A P R P P L G P P L L F H R P C S P S P A L G A T V L A V Y1 5 10152025 30R Y ESEQ ID NO:211序列长度28氨基酸T Q V L P Q G C S L S L L H T T F P H R Q V P H I L D W1 5 1015 2025SEQ ID NO:212序列长度29氨基酸P T Q V L P Q G C S L S L L H T T F P H R Q V P H I L D W1 5 1015 2025SEQ ID NO:213序列长度54氨基酸P L Q S F P K D A A S A F S T P R F P T D K F P T S W T G S1 5 1015 202530C P G Q P H G T R A F C Q P G P E F N A F S A C354045 50SEQ ID NO:214序列长度53氨基酸L Q S F P K D A A S A F S T P R F P T D K F P T S W T G S C1 5 1015 20 2530P G Q P H G T R A F C Q P G P E F N A F S A C35404550SEQ ID NO:215序列长度38氨基酸P S P R P Q S Q P P T Q V L P Q G C S L S L L H T T F P H R1 5 10152025 30Q V P H I L D W35SEQ ID NO:216序列长度39氨基酸P S P R P Q S Q P P P T Q V L P Q G C S L S L L H T T F P H1 51015 202530R Q V P H I L D W35SEQ ID NO:217序列长度64氨基酸P S P R P Q S Q P P P L Q S F P K D A A S A F S T P R F P T1 51015 2025 30D K F P T S W T G S C P G Q P H G T R A F C Q P G P E F N A35 4045 5055 60F S A CSEQ ID NO:218序列长度63氨基酸P S P R P Q S Q P P L Q S F P K D A A S A F S T P R F P T D1 51015 20 25 30K F P T S W T G S C P G Q P H G T R A F C Q P G P E F N A F35 404550 5560S A CSEQ ID NO:219序列长度30氨基酸T A W P G R R R F T T P E P Y C L C T P L G P W A P R F L W1 5101520 25 30SEQ ID NO:220序列长度31氨基酸P T A W P G R R R F T T P E P Y C L C T P L G P W A P R F L W1 5101520 25 30SEQ ID NO:221序列长度50氨基酸P R P G P A G G A L L P R S L T A F V P H S G H G L P V S S1 51015 202530G E P A Y T P I P H D V P H G T P P F C35 404550SEQ ID NO:222序列长度49氨基酸R P G P A G G A L L P R S L T A F V P H S G H G L P V S S G1 51015 2025 30E P A Y T P I P H D V P H G T P P F C35 40 45SEQ ID NO:223序列长度39氨基酸D L P A V P G P P T A W P G R R R F T T P E P Y C L C T P L1 510 1520 25 30G P W A P R F L W35SEQ ID NO:224序列长度40氨基酸D L P A V P G P P P T A W P G R R R F T T P E P Y C L C T P1 510 1520 25 30L G P W A P R F L W35 40SEQ ID NO:225序列长度59氨基酸D L P A V P G P P P R P G P A G G A L L P R S L T A F V P H1 510 1520 2530S G H G L P V S S G E P A Y T P I P H D V P H G T P P F C35 40 4550 55SEQ ID NO:226序列长度58氨基酸D L P A V P G P P R P G P A G G A L L P R S L T A F V P H S1 5101520 2530G H G L P V S S G E P A Y T P I P H D V P H G T P P F C35 404550 55SEQ ID NO:227序列长度8氨基酸Q W G L S W M S1 5SEQ ID NO:228序列长度14氨基酸N G D C H G C P E G R Q S L1 510SEQ ID NO:229序列长度17氨基酸F T M D R V L T P Q W G L S W M S1 51015SEQ ID NO:230序列长度18氨基酸F T M D R V L T P P Q W G L S W M S1 51015SEQ ID NO:231序列长度24氨基酸F T M D R V L T P P N G D C H G C P E G R Q S L1 51015 20SEQ ID NO:232序列长度23氨基酸F T M D R V L T P N G D C H G C P E G R Q S L1 51015 20SEQ ID NO:233序列长度115氨基酸H H P A R Q C P H C I M H L Q T Q L I H R N L T G P S Q L T1 5 1015202530S L H R S P Y Q I A A T P W T T D F A A S F F L N P V T P F354045505560L L C R R C Q G K D V L C T N A R C L S Q T S P S H H K A L657075808590S R T T T Q C M N T T P W L A V R P A K A F P L L95 100105 110 115SEQ ID NO:234序列长度116氨基酸P H H P A R Q C P H C I M H L Q T Q L I H R N L T G P S Q L1 510 15 20 2530T S L H R S P Y Q I A A T P W T T D F A A S F F L N P V T P35 40 45 5055 60F L L C R R C Q G K D V L C T N A R C L S Q T S P S H H K A65 70 75 8085 90L S R T T T Q C M N T T P W L A V R P A K A F P L L95 100105 110 115SEQ ID NO:235序列长度23氨基酸H T I Q H A S V P T A S C I S K L N S Y T E N1 5 1015 20SEQ ID NO:236序列长度126氨基酸P Q V G M R P S N P P H H P A R Q C P H C I M H L Q T Q L I1 51015 202530H R N L T G P S Q L T S L H R S P Y Q I A A T P W T T D F A35 4045 5055 60A S F F L N P V T P F L L C R R C Q G K D V L C T N A R C L65 7075 8085 90S Q T S P S H H K A L S R T T T Q C M N T T P W L A V R P A95 100105 110115 120K A F P L L125SEQ ID NO:237序列长度127氨基酸P Q V G M R P S N P P P H H P A R Q C P H C I M H L Q T Q L1 51015202530I H R N L T G P S Q L T S L H R S P Y Q I A A T P W T T D F35 4045505560A A S F F L N P V T P F L L C R R C Q G K D V L C T N A R C65 7075808590L S Q T S P S H H K A L S R T T T Q C M N T T P W L A V R P95 100 105 110 115120A K A F P L L125SEQ ID NO:238序列长度34氨基酸P Q V G M R P S N P P H T I Q H A S V P T A S C I S K L N S1 51015 20 2530Y T E NSEQ ID NO:239序列长度33氨基酸P Q V G M R P S N P H T I Q H A S V P T A S C I S K L N S Y1 51015 20 2530T E NSEQ ID NO:240序列长度51氨基酸W A A R S W C E R R A A A V A P L A P W A W G C P A G C T P1 51015202530P V A A R A C A A T R P E G W R S P C T H35 404550SEQ ID NO:241序列长度52氨基酸P W A A R S W C E R R A A A V A P L A P W A W G C P A G C T1 51015202530P P V A A R A C A A T R P E G W R S P C T H35 40 4550SEQ ID NO:242序列长度74氨基酸R G L R G A G A R G G L R L L R H L R P G L G D A L R G V H1 51015 2025 30P P L R L G P A L L P A P R G G E A P A H T D A R A R R V H35 4045 5055 60G A G G D R G H P G P A A L65 70SEQ ID NO:243序列长度61氨基酸E E K L A R C R P P W A A R S W C E R R A A A V A P L A P W1 51015 202530A W G C P A G C T P P V A A R A C A A T R P E G W R S P C T H35 4045 505560SEQ ID NO:244序列长度62氨基酸E E K L A R C R P P P W A A R S W C E R R A A A V A P L A P1 51015 202530W A W G C P A G C T P P V A A R A C A A T R P E G W R S P C T H35 4045 505560SEQ ID NO:245序列长度84氨基酸E E K L A R C R P P R G L R G A G A R G G L R L L R H L R P1 51015202530G L G D A L R G V H P P L R L G P A L L P A P R G G E A P A35 4045505560H T D A R A R R V H G A G G D R G H P G P A A L65 707580SEQ ID NO:246序列长度83氨基酸E E K L A R C R P R G L R G A G A R G G L R L L R H L R P G1 510 15 202530L G D A L R G V H P P L R L G P A L L P A P R G G E A P A H35 40 45 505560T D A R A R R V H G A G G D R G H P G P A A L65 70 75 80SEQ ID NO:247序列长度163氨基酸Q P P V S P R P R R P G R P R A P P P P Q P M V S P R R R T1 510 15 202530T G P P W R P P P L Q S T M S P P P Q A L H Q A Q L L L W C35 40 45 505560T T A P L P G L P Q P Q P A R A L H S Q F P A T T L I L L P65 70 75 808590P L P A I A P R L M P V A L T I A R Y L L S P P P I T A L L95 100 105110 115 120P S C L L G S L S F S C L F T F Q T S S L I P L W K I P A P125 130 135 140145 150T T T K S C R E T F L K W155 160SEQ ID NO:248序列长度85氨基酸S P G C H L G P G D Q A A P G L H R P P S P W C H L G A G Q1 510 152025 30Q A R L G V H R P S S P Q C H L G L R L C I R L S F Y S G A35 40 455055 60Q R H L C Q G Y H N P S Q Q E H S I L N S Q P P L65 70 758085SEQ ID NO:249序列长度172氨基酸K P A P G S T A P Q P P V S P R P R R P G R P R A P P P P Q1 510 15202530P M V S P R R R T T G P P W R P P P L Q S T M S P P P Q A L35 40 455055 60H Q A Q L L L W C T T A P L P G L P Q P Q P A R A L H S Q F65 70 758085 90P A T T L I L L P P L P A I A P R L M P V A L T I A R Y L L95 100105 110 115 120S P P P I T A L L P S C L L G S L S F S C L F T F Q T S S L125 130135 140 145 150I P L W K I P A P T T T K S C R E T F L K W155 160165170SEQ ID NO:250序列长度173氨基酸K P A P G S T A P P Q P P V S P R P R R P G R P R A P P P P1 510 15 2025 30Q P M V S P R R R T T G P P W R P P P L Q S T M S P P P Q A35 40 45 5055 60L H Q A Q L L L W C T T A P L P G L P Q P Q P A R A L H S Q65 70 75 8085 90F P A T T L I L L P P L P A I A P R L M P V A L T I A R Y L95 100105 110 115 120L S P P P I T A L L P S C L L G S L S F S C L F T F Q T S S125 130135 140 145 150L I P L W K I P A P T T T K S C R E T F L K W155 160165 170SEQ ID NO:251序列长度65氨基酸K P A P G S T A P P S P G C H L G P G D Q A A P G L H R P P1 5 10152025 30S P W C H L G A G Q Q A R L G V H R P S S P Q C H L G L R LC I R L S F Y S G A Q R H L C Q G Y H N P S Q Q E H S I L N3540455055 60S Q P P L65SEQ ID NO:252序列长度94氨基酸K P A P G S T A P S P G C H L G P G D Q A A P G L H R P P S1 510 1520 2530P W C H L G A G Q Q A R L G V H R P S S P Q C H L G L R L C35 40 4550 5560I R L S F Y S G A Q R H L C Q G Y H N P S Q Q E H S I L N S65 70 7580 8590Q P P LSEQ ID NO:253序列长度113氨基酸Q P M V S P R R R T T G P P W R P P P L Q S T M S P P P Q A1 510 15202530L H Q A Q L L L W C T T A P L P G L P Q P Q P A R A L H S Q35 40 45505560F P A T T L I L L P P L P A I A P R L M P V A L T I A R Y L65 70 7580 85 90L S P P P I T A L L P S C L L G S L S F S C L F T F Q T S SL I P L W K I P A P T T T K S C R E T F L K W95 100 105110SEQ ID NO: 254序列长度65氨基酸S P W C H L G A G Q Q A R L G V H R P S S P Q C H L G L R L1 5 10152025 30C I R L S F Y S G A Q R H L C Q G Y H N P S Q Q E H S I L N3540455055 60S Q P P L65SEQ ID NO:255序列长度18氨基酸R P P P G S T A P Q P M V S P R R R1 5 1015SEQ ID NO:256序列长度19氨基酸R P P P G S T A P P Q P M V S P R R R1 5 1015SEQ ID NO:257序列长度18氨基酸R P P P G S T A P P S P W C H L G A1 5 1015SEQ ID NO:258序列长度17氨基酸R P P P G S T A P S P W C H L G A1 5 1015SEQ ID NO:259序列长度14氨基酸R P R A P P P P S P W C H L1 5 10SEQ ID NO:260序列长度13氨基酸R P R A P P P P P S P W C1 510SEQ ID NO:261序列长度16氨基酸R P R A P P P P A H G V T S A P1 51015SEQ ID NO:262序列长度13氨基酸R P R A P P P P P A H G V1 510SEQ ID NO:263序列长度14氨基酸A P G L H R P P Q P M V S P1 510SEQ ID NO:264序列长度15氨基酸A A P G L H R P Q P M V S P R1 51015SEQ ID NO:265序列长度13氨基酸P G L H R P P P A H G V T1 510SEQ ID NO:266序列长度14氨基酸A P G L H R P P A H G V T S1 510SEQ ID NO:267序列长度21氨基酸V D R P Q H T E W L S W S N L Y R I R H Q1 5 1015 20SEQ ID NO:268序列长度10氨基酸H Y L C T D V A P R1 5 10SEQ ID NO:269序列长度11氨基酸H Y L C T D V A P P R1 5 10SEQ ID NO:270序列长度31氨基酸H Y L C T D V A P P V D R P Q H T E W L S W S N L Y R I R H1 5101520 25 30QSEQ ID NO:271序列长度30氨基酸H Y L C T D V A P V D R P Q H T E W L S W S N L Y R I R H Q1 5101520 2530SEQ ID NO:272序列长度108氨基酸S A Y L S P L G T T W L R T C A C R L P R P A A S C L C T T1 51015202530P S L L W P R R T C P A G S P R A T S S P W R M P A P K S C35 4045505560C T T G L A F T S P I G L G W R S A T A S G Y A R I W P V L6570 75808590S L T C Q S W S T S L P S T A V T W95 100105SEQ ID NO:273序列长度109氨基酸P S A Y L S P L G T T W L R T C A C R L P R P A A S C L C T1 5 10152025 30T P S L L W P R R T C P A G S P R A T S S P W R M P A P K S3540455055 60C C T T G L A F T S P I G L G W R S A T A S G Y A R I W P V6570758085 90L S L T C Q S W S T S L P S T A V T W95100 105SEQ ID NO:274序列长度12氨基酸P A P I F L L W G P L G1 5 10SEQ ID NO:275序列长度11氨基酸A P I F L L W G P L G1 510SEQ ID NO:276序列长度117氨基酸L P A R A P G P P S A Y L S P L G T T W L R T C A C R L P R1 510 152025 30P A A S C L C T T P S L L W P R R T C P A G S P R A T S S P35 40 455055 60W R M P A P K S C C T T G L A F T S P I G L G W R S A T A S65 70 758085 90G Y A R I W P V L S L T C Q S W S T S L P S T A V T W95 100105110115SEQ ID NO:277序列长度118氨基酸L P A R A P G P P P S A Y L S P L G T T W L R T C A C R L P1 51015202530R P A A S C L C T T P S L L W P R R T C P A G S P R A T S S35 4045505560P W R M P A P K S C C T T G L A F T S P I G L G W R S A T A65 7075808590S G Y A R I W P V L S L T C Q S W S T S L P S T A V T W95 100 105110 115SEQ ID NO:278序列长度21氨基酸L P A R A P G P P P A P I F L L W G P L G1 5 1015 20SEQ ID NO:279序列长度20氨基酸L P A R A P G P P A P I F L L W G P L G1 5 101520SEQ ID NO:280序列长度14氨基酸D L E H H G G V T R H R H R1 5 10SEQ ID NO:281序列长度11氨基酸L V S D Y S M T P R P1 5 10SEQ ID NO:282序列长度12氨基酸L V S D Y S M T P P R P1 5 10SEQ ID NO:283序列长度24氨基酸L V S D Y S M T P P D L E H H G G V T R H R H R1 510 1520SEQ ID NO:284序列长度23氨基酸L V S D Y S M T P D L E H H G G V T R H R H R1 510 1520SEQ ID NO:285序列长度51氨基酸F H H I A T D V G P F V R I G F L K I K G K I K G K S L R K1 510 152025 30P N W K T Q H K L K R A L M F L I V K K L35 40 4550SEQ ID NO:286序列长度52氨基酸seq id no 286；P F H H I A T D V G P F V R I G F L K I K G K I K G K S L R1 5 1015202530K P N W K T Q H K L K R A L M F L I V K K L35404550SEQ ID NO:287序列长度12氨基酸P S I T L Q Q M L A P S1 5 10SEQ ID NO:288序列长度11氨基酸S I T L Q Q M L A P S1 510SEQ ID NO:289序列长度60氨基酸T S C N E M N P P F H H I A T D V G P F V R I G F L K I K G1 51015202530K I K G K S L R K P N W K T Q H K L K R A L M F L I V K K L35 4045505560SEQ ID NO:290序列长度61氨基酸T S C N E M N P P P F H H I A T D V G P F V R I G F L K I K1 51015202530G K I K G K S L R K P N W K T Q H K L K R A L M F L I V K K354045505560LSEQ ID NO:291序列长度20氨基酸T S C N E M N P P S I T L Q Q M L A P S1 5101520SEQ ID NO:292序列长度21氨基酸T S C N E M N P P P S I T L Q Q M L A P S1 5101520SEQ ID NO:293序列长度10氨基酸L E M I L F L M T F1 510SEQ ID NO:294序列长度18氨基酸H P C I T K T F L E M I L F L M T F1 51015SEQ ID NO:295序列长度19氨基酸H P C I T K T F F L E M I L F L M T F1 51015SEQ ID NO:296序列长度11氨基酸H P C I T K T F F W R1 510SEQ ID NO:297序列长度10氨基酸H P C I T K T F W R1 510SEQ ID NO:298序列长度22氨基酸L M F E H S Q M R L N S K N A H L P I I S F1 5101520SEQ ID NO:299序列长度30氨基酸E Y G S I I A F L M F E H S Q M R L N S K N A H L P I I S F1 51015202530SEQ ID NO:300序列长度31氨基酸E Y G S I I A F F L M F E H S Q M R L N S K N A H L P I I S1 51015202530FSEQ ID NO:301序列长度15氨基酸H L N K G R R L G D K I R A T1 51015SEO ID NO:302序列长度16氨基酸F H L N K G R R L G D K I R A T1 5 1015SEQ ID NO:303序列长度23氨基酸V T S G T P F F H L N K G R R L G D K I R A T1 5101520SEQ ID NO:304序列长度24氨基酸V T S G T P F F F H L N K G R R L G D K I R A T1 5 101520SEQ ID NO:305序列长度10氨基酸V T S G T P F F F I1 510SEQ ID NO:306序列长度9氨基酸V T S G T P F F I1 5SEQ ID NO:307序列长度10氨基酸C E I E R I H F F F1 510SEQ ID NO:308序列长度11氨基酸C E I E R I H F F S K1 510SEQ ID NO:309序列长度10氨基酸C E I E R I H F S K1 510SEQ ID NO:310序列长度8氨基酸F R Y I S K S I1 5SEQ ID NO:311序列长度7氨基酸R Y I S K S I1 5SEQ ID NO:312序列长度16氨基酸F K K Y E P I F F R Y I S K S I1 51015SEQ ID NO:313序列长度15氨基酸F K K Y E P I F R Y I S K S I1 51015SEQ ID NO:314序列长度56氨基酸F P D S D Q P G P L Y P L D P S C L I S S A S N P Q E L S D1 51015202530C H Y I H L A F G F S N W R S C P V L P G H C G V Q3540455055SEQ ID NO:315序列长度55氨基酸P D S D Q P G P L Y P L D P S C L I S S A S N P Q E L S D C1 51015202530H Y I H L A F G F S N W R S C P V L P G H C G V Q3540455055SEQ ID NO:316序列长度9氨基酸L N M F A S V F S1 5SEQ ID NO:317序列长度10氨基酸L N M F A S V F F S1 51015SEQ ID NO:318序列长度64氨基酸L N M F A S V F F P D S D Q P G P L Y P L D P S C L I S S A1 51015202530S N P Q E L S D C H Y I H L A F G F S N W R S C P V L P G H354045505560C G V QSEQ ID NO:319序列长度63氨基酸L N M F A S V F P D S D Q P G P L Y P L D P S C L I S S A S1 51015202530N P Q E L S D C H Y I H L A F G F S N W R S C P V L P G H C354045505560G V QSEQ ID NO:320序列长度63氨基酸A M E E T V V V A V A T V E T E V E A M E E T G V V A A M E1 51015202530E T E V G A T E E T E V A M E A K W E E E T T T E M I S A T354045505560D H TSEQ ID NO:321序列长度55氨基酸L W V R P W L W E W L R W R P K W R L W R R Q E W W R L W R1 51015202530R P R W G L R R R P R W L W R E N G R K K R L Q K3540455055SEQ ID NO:322序列长度71氨基酸Y G G D R S R G A M E E T V V V A V A T V E T E V E A M E E1 51015202530T G V V A A M E E T E V G A T E E T E V A M E A K W E E E T354045505560T T E M I S A T D H T6570SEQ ID NO:323序列长度72氨基酸Y G G D R S R G G A M E E T V V V A V A T V E T E V E A M E1 51015202530E T G V V A A M E E T E V G A T E E T E V A M E A K W E E E354045505560T T T E M I S A T D H T6570SEQ ID NO:324序列长度64氨基酸Y G G D R S R G G L W V R P W L W E W L R W E P K W R L W R1 51015202530R Q E W W R L W R R P R W G L R R R P R W L W R E N G R K K354045505560R L Q KSEQ ID NO:325序列长度63氨基酸Y G G D R S R G L W V R P W L W E W L R W E P K W R L W R R1 51015202530Q E W W R L W R R P R W G L R R R P R W L W R E N G R K K R354045505560L Q KSEQ ID NO:326序列长度9氨基酸E F G G G R R Q K1 5SEQ ID NO:327序列长度8氨基酸E F G G R R Q K1 5SEQ ID NO:328序列长度15氨基酸R R A K G G G A G A S N P R Q1 51015SEQ ID NO:329序列长度16氨基酸G R R A K G G G A G A S N P R Q1 51015SEQ ID NO:330序列长度21氨基酸D V G L R E G A L E L P T R G N K R N V A1 5101520SEQ ID NO:331序列长度24氨基酸M R G G G G V G G R R A K G G G A G A S N P R Q1 5101520SEQ ID NO:332序列长度25氨基酸M R G G G G V G G G R R A K G G G A G A S N P R Q1 510152025SEQ ID NO:333序列长度30氨基酸M R G G G G V G G D V G L R E G A L E L P T R G N K R N V A1 51015202530SEQ ID NO:334序列长度29氨基酸M R G G G G V G D V G L R E G A L E L P T R G N K R N V A1 510152025SEQ ID NO:335序列长度25氨基酸V W Q L A G P M L A G W R S L G S W F C R M Y G I1 510152025SEQ ID NO:336序列长度46氨基酸C G S W P A L C W R A G G V W A V G S A G C M E Y D P E A L1 51015202530P A A W G P A A A A T V H P R R354045SEQ ID NO:337序列长度33氨基酸R R Y P C E W G V W Q L A G P M L A G W R S L G S W F C R M1 51015202530Y G ISEQ ID NO:338序列长度34氨基酸R R Y P C E W G G V W Q L A G P M L A G W R S L G S W F C R1 51015202530M Y G ISEQ ID NO:339序列长度55氨基酸R R Y P C E W G G C G S W P A L C W R A G G V W A V G S A G1 51015202530C M E Y D P E A L P A A W G P A A A A T V H P R R3540455055SEQ ID NO:340序列长度54氨基酸R R Y P C E W G C G S W P A L C W R A G G V W A V G S A G C1 51015202530M E Y D P E A L P A A W G P A A A A T V H P R R35404550SEQ ID NO:341序列长度43氨基酸L W L W A G W T V W W S C G P G E K G H G W P S L P T M A L1 51015202530L L L R F S C M R V A S Y3540SEQ ID NO:342序列长度44氨基酸G L W L W A G W T V W W S C G P G E K G H G W P S L P T M A1 51015202530L L L L R F S C M R V A S Y3540SEQ ID NO:343序列长度84氨基酸G C G C G P A G Q Y G G A V G L A R R G T A G C L P C P P W1 51015202530L C C C C A F P A C G L P G T D G W R G W Q G S G C V R V S354045505560G S A P W A P G F P F S P P C P L C G T Q P R W65707580SEQ ID NO:344序列长度83氨基酸C G C G P A G Q Y G G A V G L A R R G T A G C L P C P P W L1 51015202530C C C C A F P A C G L P G T D G W R G W Q G S G C V R V S G354045505560S A P W A P G F P F S P P C P L C G T Q P R W65707580SEQ ID NO:345序列长度51氨基酸L A F N V P G G L W L W A G W T V W W S C G P G E K G H G W1 51015202530P S L P T M A L L L L R F S C M R V A S Y35404550SEQ ID NO:346序列长度52氨基酸L A F N V P G G G L W L W A G W T V W W S C G P G E K G H G1 51015202530W P S L P T M A L L L L R F S C M R V A S Y35404550SEQ ID NO:347序列长度92氨基酸L A F N V P G G G C G C G P A G Q Y G G A V G L A R R G T A1 51015202530G C L P C P P W L C C C C A F P A C G L P G T D G W R G W Q354045505560G S G C V R V S G S A P W A P G F P F S P P C P L C G T Q P657075808590R WSEQ ID NO:348序列长度91氨基酸L A F N V P G G C G C G P A G Q Y G G A V G L A R R G T A G1 51015202530C L P C P P W L C C C C A F P A C G L P G T D G W R G W Q G354045505560S G C V R V S G S A P W A P G F P F S P P C P L C G T Q P R657075808590WSEQ ID NO:349序列长度17氨基酸P P M P M P G Q R E A P G R Q E A1 51015SEQ ID NO:350序列长度18氨基酸G P P M P M P G Q R E A P G R Q E A1 51015SEQ ID NO:351序列长度24氨基酸G H Q C Q C Q G K G R H R A D R R P D T A Q E E1 5101520SEQ ID NO:352序列长度23氨基酸H Q C Q C Q G K G R H R A D R R P D T A Q E E1 5101520SEQ ID NO:353序列长度25氨基酸G G H S Y G G G P P M P M P G Q R E A P G R Q E A1 510152025SEQ ID NO:354序列长度26氨基酸G G H S Y G G G G P P M P M P G Q R E A P G R Q E A1 510152025SEQ ID NO:355序列长度32氨基酸G G H S Y G G G G H Q C Q C Q G K G R H R A D R R P D T A Q1 51015202530E ESEQ ID NO:356序列长度31氨基酸G G H S Y G G G H Q C Q C Q G K G R H R A D R R P D T A Q E1 51015202530ESEQ ID NO:357序列长度10氨基酸A P C P Q S S G G G1 510SEQ ID NO:358序列长度17氨基酸L P A P S Q A A A D E L D R R P G1 51015SEQ ID NO:359序列长度18氨基酸T K V R L I R G A P C P Q S S G G G1 51015SEQ ID NO:360序列长度xx氨基酸T K V R L I R G G A P C P Q S S G G G1 510SEQ ID NO:361序列长度26氨基酸T K V R L I R G G L P A P S Q A A A D E L D R R P G1 510152025SEQ ID NO:362序列长度25氨基酸T K V R L I R G L P A P S Q A A A D E L D R R P G1 510152025SEQ ID NO:363序列长度45氨基酸C S L A K D G S T E D T V S S L C G E E D T E D E E L E A A1 51015202530A S H L N K D L Y R E L L G G354045SEQ ID NO:364序列长度46氨基酸G C S L A K D G S T E D T V S S L C G E E D T E D E E L E A1 51015202530A A S H L N K D L Y R E L L G G354045SEQ ID NO:365序列长度21氨基酸A A A W Q K M A P P R T P R P A C V A R R1 5101520SEQ ID NO:366序列长度54氨基酸E N S R P K R G G C S L A K D G S T E D T V S S L C G E E D1 51015202530T E D E E L E A A A S H L N K D L Y R E L L G G35404550SEQ ID NO:367序列长度55氨基酸E N S R P K R G G G C S L A K D G S T E D T V S S L C G E E1 51015202530D T E D E E L E A A A S H L N K D L Y R E L L G G3540455055SEQ ID NO:368序列长度30氨基酸E N S R P K R G G A A A W Q K M A P P R T P R P A C V A R R1 51015202530SEQ ID NO:369序列长度29氨基酸E N S R P K R G A A A W Q K M A P P R T P R P A C V A R R1 510152025SEQ ID NO:370序列长度10氨基酸H C V L A A S G A S1 510SEQ ID NO:371序列长度11氨基酸G H C V L A A S G A S1 510SEQ ID NO:372序列长度28氨基酸G T A S S R P L G L P K P H L H R P V P I R H P S C P K1 510152025SEQ ID NO:373序列长度27氨基酸T A S S R P L G L P K P H L H R P V P I R H P S C P K1 510152025SEQ ID NO:374序列长度18氨基酸A G T L Q L G G H C V L A A S G A S1 51015SEQ ID NO:375序列长度19氨基酸A G T L Q L G G G H C V L A A S G A S1 51015SEQ ID NO:376序列长度35氨基酸A G T L Q L G G T A S S R P L G L P K P H L H R P V P I R H1 51015202530P S C P K35SEQ ID NO:377序列长度36氨基酸A G T L Q L G G G T A S S R P L G L P K P H L H R P V P I R1 51015202530H P S C P K35SEQ ID NO:378序列长度9氨基酸R R T P S T E K R1 5SEQ ID NO:379序列长度10氨基酸R R T P S T E K K R1 510SEQ ID NO:380序列长度14氨基酸R R T P S T E K K G R S E C1 510SEQ ID NO:381序列长度13氨基酸R R T P S T E K G R S E C1 510SEQ ID NO:382序列长度46氨基酸S T T K C Q S G T A E T Y N S W K V K N L Q L E P R R V T S1 51015202530Q M N R Q V K D M T A I L S Q S354045SEQ ID NO:383序列长度17氨基酸V Q P N A S Q A Q Q K P T T H G R1 51015SEQ ID NO:384序列长度54氨基酸S S E E I K K K S T T K C Q S G T A E T Y N S W K V K N L Q1 51015202530L E P R R V T S Q M N R Q V K D M T A I L S Q S35404550SEQ ID NO:385序列长度55氨基酸S S E E I K K K K S T T K C Q S G T A E T Y N S W K V K N L1 51015202530Q L E P R R V T S Q M N R Q V K D M T A I L S Q S3540455055SEQ ID NO:386序列长度26氨基酸S S E E I K K K K V Q P N A S Q A Q Q K P T T H G R1 510152025SEQ ID NO:387序列长度xx氨基酸S S E E I K K K V Q P N A S Q A Q Q K P T T H G R1 510152025SEQ ID NO:388序列长度9氨基酸N R G W V G A G E1 5SEQ ID NO:389序列长度4氨基酸I E A G1SEQ ID NO:390序列长度17氨基酸V H N Y C N M K N R G W V G A G E1 51015SEQ ID NO:391序列长度18氨基酸V H N Y C N M K K N R G W V G A G E1 51015SEQ ID NO:392序列长度13氨基酸V H N Y C N M K K I E A G1 510SEQ ID NO:393序列长度12氨基酸V H N Y C N M K I E A G1 510SEQ ID NO:394序列长度25氨基酸Q L R C W N T W A K M F F M V F L I I W Q N T M F1 510152025SEQ ID NO:395序列长度33氨基酸V K K D N H K K Q L R C W N T W A K M F F M V F L I I W Q N1 51015202530T M FSEQ ID NO:396序列长度34氨基酸V K K D N H K K K Q L R C W N T W A K M F F M V F L I I W Q1 51015202530N T M FSEQ ID NO:397序列长度11氨基酸V K K D N H K K K N S1 510SEQ ID NO:398序列长度10氨基酸V K K D N H K K N S1 510SEQ ID NO:399序列长度35氨基酸G A E E S G P F N R Q V Q L K V H A S G M G R H L W N C P A1 51015202530F W S E V35SEQ ID NO:400序列长度10氨基酸H P S P P P E K R S1 510SEQ ID NO:401序列长度11氨基酸H P S P P P E K K R S1 510SEQ ID NO:402序列长度44氨基酸H P S P P P E K K G A E E S G P F N R Q V Q L K V H A S G M1 51015202530G R H L W N C P A F W S E V3540SEQ ID NO:403序列长度43氨基酸H P S P P P E K G A E E S G P F N R Q V Q L K V H A S G M G1 51015202530R H L W N C P A F W S E V3540SEQ ID NO:404序列长度39氨基酸M Q V L S K T H M N L F P Q V L L Q M F L R G L K R L L Q D1 51015202530L E K S K K R K L35SEQ ID NO:405序列长度8氨基酸R C K S A R L I1 5SEQ ID NO:406序列长度48氨基酸V Q T Q P A I K K M Q V L S K T H M N L F P Q V L L Q M F L1 51015202530R G L K R L L Q D L E K S K K R K L354045SEQ ID NO:407序列长度49氨基酸V Q T Q P A I K K K M Q V L S K T H M N L F P Q V L L Q M F1 51015202530L R G L K R L L Q D L E K S K K R K L354045SEQ ID NO:408序列长度17氨基酸V Q T Q P A I K K R C K S A R L I1 51015SEQ ID NO:409序列长度16氨基酸V Q T Q P A I K R C K S A R L I1 51015SEQ ID NO:410序列长度11氨基酸A R S G K K Q K R K L1 510SEQ ID NO:411序列长度12氨基酸A R S G K K Q K K R K L1 510SEQ ID NO:412序列长度13氨基酸A R S G K K Q K K E N S F1 510SEQ ID NO:413序列长度12氨基酸A R S G K K Q K E N S F1 510SEQ ID NO:414序列长度14氨基酸K A S A R S G K S K K R K L1 510SEQ ID NO:415序列长度15氨基酸K A S A R S G K K S K K R K L1 51015SEQ ID NO:416序列长度16氨基酸K A S A R S G K K A K K E N S F1 51015SEQ ID NO:417序列长度15氨基酸K A S A R S G K A K K E N S F1 51015SEQ ID NO:418序列长度15氨基酸H L N K G R R L G D K I R A T1 51015SEQ ID NO:419序列长度23氨基酸V T S G T P F F H L N K G R R L G D K I R A T1 5101520SEQ ID NO:420序列长度24氨基酸V T S G T P F F F H L N K G R R L G D K I R A T1 5101520SEQ ID NO:421序列长度10氨基酸V T S G T P F F F I1 510SEQ ID NO:422序列长度9氨基酸V T S G T P F F I1 5SEQ ID NO:423序列长度51氨基酸V T L L Y V N T V T L A P N V N M E S S R N A H S P A T P S1 51015202530A K R K D P D L T W G G F V F F F C Q F H35404550SEQ ID NO:424序列长度60氨基酸K C R C K P N F F V T L L Y V N T V T L A P N V N M E S S R1 51015202530N A H S P A T P S A K R K D P D L T W G G F V F F F C Q F H354045506560SEQ ID NO:425序列长度61氨基酸K C R C K P N F F F V T L L Y V N T V T L A P N V N M E S S1 51015202530R N A H S P A T P S A K R K D P D L T W G G F V F F F C Q F354045506560HSEQ ID NO:426序列长度10氨基酸K C R C K P N F F L1 510SEQ ID NO:427序列长度9氨基酸K C R C K P N F L1 5SEQ ID NO:428序列长度9氨基酸S L V R L S S C V1 5SEQ ID NO:429序列长度14氨基酸L V K K L K E K K M N W I L1 510SEQ ID NO:430序列长度15氨基酸L V K K L K E K K K M N W I L1 51015SEQ ID NO:431序列长度10氨基酸L V K K L K E K K R1 510SEQ ID NO:432序列长度9氨基酸L V K K L K E K R1 5SEQ ID NO:433序列长度9氨基酸A A I V K D C C R1 5SEQ ID NO:434序列长度11氨基酸S Q P A S I L G R K L1 510SEQ ID NO:435序列长度12氨基酸S Q P A S I L G K R K L1 51015SEQ ID NO:436序列长度18氨基酸S Q P A S I L G K A A I V K D C C R1 51015SEQ ID NO:437序列长度17氨基酸S Q P A S I L G A A I V K D C C R1 51015SEQ ID NO:438序列长度18氨基酸K S L V R L S S C V P V A L M S A M1 51015SEQ ID NO:439序列长度9氨基酸R L S S C V P V A1 5SEQ ID NO:440序列长度9氨基酸V R L S S C V P V1 5SEQ ID NO:441序列长度9氨基酸L V R L S S C V P15SEQ ID NO:442序列长度9氨基酸S C V P V A L M S1 5SEQ ID NO:443序列长度9氨基酸S S C V P V A L M1 5SEQ ID NO:444序列长度9氨基酸L S S C V P V A L1 5SEQ ID NO:445序列长度9氨基酸V P V A L M S A M1 5SEQ ID NO:446序列长度9氨基酸C V P V A L M S A1 5SEQ ID NO:447序列长度9氨基酸K K K S L V R L S1 5SEQ ID NO:448序列长度9氨基酸E K K K S L V R L1 5SEQ ID NO:449序列长度9氨基酸K E K K K S L V R1 5SEQ ID NO:450序列长度9氨基酸M K E K K K S L V1 5SEQ ID NO:451序列长度9氨基酸I M K E K K K S L1 5SEQ ID NO:452序列长度9氨基酸K C I M K E K K A1 5SEQ ID NO:453序列长度9氨基酸C I M K E K K A W1 5SEQ ID NO:454序列长度9氨基酸C I M K E K K K A1 5SEQ ID NO:455序列长度9氨基酸I M K E K K K A W1 5SEQ ID NO:456序列长度13氨基酸H P S W P W T R C L R M R1 510SEQ ID NO:457序列长度14氨基酸R H P S W P W T R C L R M R1 510SEQ ID NO:458序列长度16氨基酸G A S G C V H Q E A E R V S Q A1 51015SEQ ID NO:459序列长度20氨基酸N T W A K M F F M V F L I I W Q N T M F1 5101520
权利要求
1．一种肽，其特征在于它a)长至少8个氨基酸，并是癌细胞基因移码突变产生的突变蛋白质的片段；和b)包含所述基因所编码蛋白质序列的突变部分的至少一个氨基酸；和c)包含在突变序列的氨基端之前该蛋白质序列正常部分的羧基端的0-10个氨基酸，并可能进一步延伸至移码突变产生的新终止密码子确定的该蛋白质突变部分的羧基端；和d)以其全长或由抗原呈递细胞加工后的形式诱导T细胞应答。
2．根据权利要求1的肽，其特征在于它含有8-25个氨基酸。
3．根据权利要求1的肽，其特征在于它含有9-20个氨基酸。
4．根据权利要求1的肽，其特征在于它含有9-16个氨基酸。
5．根据权利要求1的肽，其特征在于它含有8-12个氨基酸。
6．根据权利要求1的肽，其特征在于它含有20-25个氨基酸。
7．根据权利要求1的肽，其特征在于它含有9个氨基酸。
8．根据权利要求1的肽，其特征在于它含有12个氨基酸。
9．根据权利要求1的肽，其特征在于它含有13个氨基酸。
10．根据权利要求1的肽，其特征在于它是BAX基因或TGFβRⅡ基因的移码突变编码的突变蛋白质的片段。
11．根据权利要求1的肽，其特征在于它是如下基因的移码突变编码的突变蛋白质的片段hTGFβ2基因、DCC基因、BRCA1基因、BRCA2基因、hPTP基因、top2基因、TTK基因、CTCF基因、人FADD同源性ICE/CED-3样蛋白酶基因、hMSH3基因、hRBP1基因、hFMR1基因、人TINUR基因、b-raf癌基因、NF1基因、人种系n-myc基因、人n-myc基因、人ras抑制基因、hMSH6基因、人鼻咽癌EBV BNLF-1基因、人细胞周期调节蛋白(E1A-结合蛋白)p300基因、bcl-3)基因、BIGH3、人转录因子ETV1基因、IGFBP4基因、人MUC1基因、JAK1基因、JAK3基因、人Flt4基因、人p53相关基因、hCAN基因、hDBL原癌基因/hMCF2PO基因、hDEK基因、p107基因、hGPR1基因、hRBP56基因、hITF-2基因、hKiSS-1基因、hTP-1基因、hFDF-5基因、hMTA1基因、hTFIIB90基因、hLUCA-1基因、人Wilm氏肿瘤(WIT-1)相关蛋白、ICErel-Ⅲ基因、FasL基因、BARD1基因、hMCF.2基因、fas基因和人DPC4基因。
12．根据权利要求1的肽，其特征在于它选自具有下列序列标识号的肽seq.id.nos.1-21、seq.id.no.428、seq.id.no.438和seq.id.nos.456-458或任何这些肽的片段。
13．根据权利要求1的肽，其特征在于它选自具有下列序列标识号的肽seq.id.nos.22-427、seq.id.no.429-437、seq.id.no.439-455和seq.id.nos.459或任何这些肽的片段。
14．含有根据上述权利要求任一项的肽和药学上可接受的载体或稀释剂的药物组合物。
15．含有根据权利要求1-13之任一项的肽和药学上可接受的载体或稀释剂的癌疫苗。
16．根据权利要求1-13的肽在制备治疗或预防癌症的药物组合物中的应用。
17．给癌症易感的或患有癌症的人接种疫苗的方法，包括一或多次施用至少一种根据权利要求1-13的肽，施用量足以诱导对移码突变基因编码的突变蛋白质或其片段特异的T细胞应答。
18．根据权利要求17的方法，其中所述肽每次施用量的范围是1微克(1ug)至1克(1g)，优选1微克(1ug)至1毫克(1mg)。
19．通过用根据权利要求1-13的肽体内或离体刺激治疗癌症患者的方法。
20．根据权利要求19的方法，其中所述肽每次施用量的范围是1微克(1ug)至1克(1g)，优选1微克(1ug)至1毫克(1mg)。
21．含有至少一种根据权利要求1-13的肽和至少一种根据PCT/NO92/00032的肽的药物组合物或疫苗组合物。
22．鉴定与基因移码突变产生的蛋白质的片段相应的新肽的方法，其特征在于包括以下步骤1)鉴定癌细胞中对移码突变易感的基因，该基因具有至少5个残基的单核苷酸碱基重复序列，或至少4个二核苷酸碱基单位的二核苷酸碱基重复序列；和2)分别从该重复序列中除去一个核苷酸碱基残基或一个二核苷酸碱基单位，并鉴定包含一个新终止密码子的所改变基因序列编码的蛋白质氨基酸序列；和/或3)分别从该重复序列中除去两个核苷酸碱基残基或两个二核苷酸碱基单位，并鉴定包含一个新终止密码子的所改变基因序列编码的蛋白质氨基酸序列；和/或4)分别在该重复序列中插入一个核苷酸碱基残基或一个二核苷酸碱基单位，并鉴定包含一个新终止密码子的所改变基因序列编码的蛋白质氨基酸序列；和/或5)分别在该重复序列中插入两个核苷酸碱基残基或两个二核苷酸碱基单位，并鉴定包含一个新终止密码子的所改变基因序列编码的蛋白质氨基酸序列。
23．根据权利要求22的方法，其特征在于它包括如下步骤6)确定该新肽全长或较短片段是否能刺激T细胞；及可选择性地，7)鉴定含有不同主要HLAⅠ型和/或Ⅱ型分子的重叠表位的肽。
24．含有编码根据权利要求1的移码突变肽的DNA序列或其变体的分离的DNA序列。
25．编码含有如下序列的肽的分离的DNA序列或其变体seq.id.nos.1-21、seq.id.no.428、seq.id.no.438和seq.id.nos.456-458。
26．编码含有如下序列的肽的分离的DNA序列或其变体seq.id.nos.22-427、seq.id.no.429-437、seq.id.no.439-455和seq.id.nos.459。
27．根据权利要求24-26之任一项的DNA序列在制备治疗或预防癌症的药物组合物中的应用。
28．通过用根据权利要求24-26的DNA序列在体内或离体刺激治疗癌症易感的或患有癌症的人的方法。
29．含有编码移码突变肽的根据权利要求24的DNA序列的质粒或病毒载体。
30．根据权利要求29的载体，其中该载体是大肠杆菌质粒、李斯特杆菌属载体和重组病毒载体。重组病毒载体包括但不限于正痘病毒、金丝雀病毒、山羊痘病毒、猪痘病毒、牛痘病毒、杆状病毒、人腺病毒、SV40、或牛乳头瘤病毒。
31．根据权利要求29的质粒或病毒载体在制备治疗或预防癌症的药物组合物中的应用。
32．通过用根据权利要求29的质粒或病毒载体在体内或离体刺激治疗癌症易感的或患有癌症的人的方法。
全文摘要
可引起T细胞免疫的来自移码突变基因的癌相关蛋白的多种肽在癌疫苗和抗癌治疗的组合物中的应用。
文档编号A61K35/76GK1305495SQ99807355
公开日2001年7月25日申请日期1999年5月3日优先权日1998年5月8日
发明者G·高德耐克, J·A·艾里克森, M·莫勒, M·K·吉尔特森, I·赛特戴尔申请人:诺尔斯海德公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：G.高德耐克;J.A.艾里克森;M.莫勒;M.K.吉尔特森;I.赛特戴尔
技术所有人：格姆瓦克斯有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。