选择新表位作为具有增强效力的用于治疗的疾病特异性靶标的制作方法

文档序号:37466972发布日期:2024-03-28 18:49阅读:13来源:国知局
选择新表位作为具有增强效力的用于治疗的疾病特异性靶标的制作方法

本发明涉及用于确定疾病特异性新表位作为疾病特异性靶标的适合性(suitability)的方法,以及这些鉴定的合适的新表位在特异性靶向表达一种或更多种鉴定的合适新表位的患者病变组织(例如肿瘤组织)的免疫治疗中的用途。


背景技术:

1、癌症是导致死亡的主要原因,占所有死亡的四分之一。传统上,癌症的治疗基于平均法则(the law of average)-即对最大数量的患者最有效。然而,由于癌症中的分子异质性,通常少于25%的被治疗个体从批准的治疗中获益。基于患者的定制治疗的个体化医疗被认为是药物开发中创新的效率低和成本高的潜在解决方案。

2、个体化癌症免疫治疗正在成为癌症治疗的潜在突破,有可能改变全球每年诊断的数百万癌症患者的护理标准。个体化癌症免疫治疗的联合方面使得免疫系统能够靶向患者癌症特有的遗传异常(突变)。这些疾病特异性突变可以编码新表位,所述新表位是疾病特异性靶标。可用作个体化免疫治疗的疾病特异性靶标的导致癌症基因组的最普遍遗传异常是非同义单核苷酸变异(nonsynonymous single nucleotide variation,snv)。因此,精确和详尽地鉴定患者基因组编码区中的snv是产生个体化癌症免疫治疗的方法中的关键步骤。

3、然而,如本文所述,了解疾病特异性突变的身份仅是蓝图的一部分。相反,突变的完整遗传分析需要知道病变细胞(例如肿瘤细胞)中含有突变的基因的确切拷贝数(包括野生型和突变等位基因两者),肿瘤细胞中突变等位基因的拷贝数(这里称为突变的接合性(zygosity)),以及病变细胞样品(例如肿瘤样品)中突变的亚克隆程度。实际上,在大多数疾病适应症中,在病变细胞中发生的拷贝数变异是病变细胞中遗传变异的重要组成部分。此外,拷贝数变异的程度,受拷贝数变异影响的基因的身份以及拷贝数变异的精确遗传组成对于每个个体是独特的,并且可以在个体之间广泛变化。通常参见shlien和malkin,2009,genome med.1:62;yang等,2013,cell 153:919-929。精确了解这些遗传特征对于选择当靶向时对肿瘤逃逸具有免疫并因此具有赋予总肿瘤控制的潜力的突变可能是重要的。

4、为了使个体化癌症免疫治疗的效力最大化并为大多数治疗的患者赋予持久的肿瘤控制,治疗需要以某种方式规避肿瘤逃避免疫监视的能力,例如通过使突变靶标的表达沉默,例如,通过使基因缺失。不解决这个问题,免疫治疗具有复发的风险,因为如果突变不表达,例如从基因组中缺失,免疫治疗就不能靶向突变。选择增强肿瘤控制的合适的新表位将有利于靶向新表位的所有个体化免疫治疗方法,无论它们如何实施。因此,本领域需要选择导致增强的肿瘤控制的由疾病特异性突变引起的新表位的方法。


技术实现思路

1、本发明提供了克服现有技术中的缺陷的方式,其通过提供用于确定由基因中的疾病特异性突变产生的新表位作为疾病特异性靶标的适合性的方法来实现,通过所述方法,病变组织不容易逃脱免疫监视,在癌症的情况下将导致增强的肿瘤控制。一旦鉴定出合适的新表位,这些合适的表位可用作疾病特异性靶标,以在患有该疾病的患者中诱导特异性免疫应答。例如,疾病可以是癌症,并且潜在地可以靶向表达合适的新表位的原发性肿瘤以及肿瘤转移,以进行更有效的治疗。

2、本发明涉及用于确定由基因中等位基因的疾病特异性突变(突变等位基因)产生的新表位作为疾病特异性靶标的适合性的方法,其包括在病变细胞或病变细胞群中确定编码新表位的突变等位基因的拷贝数。如本文所用,拷贝数也可称为接合性,例如,当突变等位基因的拷贝数为4时,突变等位基因的接合性为4。如本文所用,等位基因是基因组中具有特定核苷酸身份的位点,所述身份在基因组的母本和父本拷贝两者上可以是相同的(纯合基因型),或者所述身份在基因组的母本和父本拷贝上可以是不同的(杂合基因型)。突变等位基因是这样的等位基因,其由于疾病特异性突变而具有与相应正常基因组中的位点不同的身份,所述正常基因组为例如来自相同个体的非病变细胞的基因组(匹配的基因组),优选来自与病变细胞相同组织类型的非病变细胞的基因组。如本文所用,适合作为疾病特异性靶标的新表位(合适的新表位)是这样的新表位,当其被免疫系统靶向时,其表达被病变组织下调或沉默(例如,由于缺失)的可能性更低,以使得病变组织逃脱应答的可能性更低,优选通过例如针对新表位的疫苗接种或施用能够靶向(结合)新表位的免疫细胞而针对新表位产生的免疫应答。在一个实施方案中,突变等位基因的拷贝数可以与包含突变等位基因的基因的拷贝数相同,以使得本发明还涉及用于确定由基因中的疾病特异性突变产生的新表位作为疾病特异性靶标的适合性的方法,其包括在病变细胞或病变细胞群中确定具有疾病特异性突变的基因的拷贝数。

3、在一个实施方案中,突变等位基因或具有疾病特异性突变的基因的高拷贝数表明新表位作为疾病特异性靶标的适合性,以使得突变等位基因或具有疾病特异性突变的基因的拷贝数越高,新表位作为疾病特异性靶标的适应性就越高。在一个实施方案中,其中突变等位基因或具有疾病特异性突变的基因的拷贝数大于2,这表明新表位作为疾病特异性靶标的适合性。在一个实施方案中,其中具有疾病特异性突变的基因的拷贝数大于3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或大于100,这表明新表位作为疾病特异性靶标的适合性。

4、在其中至少一个拷贝具有突变等位基因之基因的并非所有拷贝都具有突变的情况下,优选的是所述基因的许多拷贝具有突变等位基因,即,优选的是所述基因的较高比例(fraction)而不是较低比例的拷贝具有突变等位基因(较高的接合性比例(fractionalzygosity),而不是较低的接合性比例)。因此,在某些实施方案中,在至少一个拷贝具有突变等位基因的基因中,所述突变等位基因以高比例的基因拷贝存在(接合性比例),其中接合性比例是突变等位基因的拷贝数(突变等位基因的接合性)相对于突变等位基因所映射的核苷酸位点的总拷贝数的比值,突变等位基因所映射的核苷酸位点特别是参照基因组或相应的野生型基因组或匹配的基因组,即来自相同个体的野生型基因组。突变等位基因的拷贝的接合性比例越高,新表位作为疾病特异性靶标的适合性就越高。优选地,接合性比例可以大于0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、0.95,并且最优选地,接合性比例为1,即病变细胞中所述基因的所有拷贝都具有突变等位基因。在接合性比例为1的情况下,没有基因的野生型拷贝,以使得病变细胞不能恢复到表达相应的野生型表位。如本文所用,1的比例是其中突变等位基因/基因的遗传构型(例如拷贝数、接合性)相同的假设不能被数据驳斥,即在统计学上是一致的。

5、已知诸如肿瘤的病变组织在其基因构成和基因表达方面可以是异质的,以使得可能不是病变组织中的所有病变细胞都具有相同的基因拷贝数和/或至少一个拷贝具有突变等位基因之基因的拷贝数(该基因的总拷贝数)和/或具有突变等位基因的基因的拷贝,更不用说疾病特异性突变本身。因此,优选的是,例如突变等位基因的拷贝数和/或接合性比例和/或突变等位基因所映射的核苷酸位点的总拷贝数在病变组织中的高比例的病变细胞而不是低比例的病变细胞中被发现相同或相似(高克隆比例而不是低克隆比例)。具有相同或相似的例如突变等位基因的拷贝数和/或接合性比例和/或突变等位基因所映射的核苷酸位点的总拷贝数的病变细胞的比例越高,新表位作为疾病特异性靶标的适合性就越高。例如,克隆比例(clonal fraction)可以为至少0.3、0.4、0.5、0.6、0.7、0.8或至少0.9。在一个优选的实施方案中,病变组织中的所有病变细胞具有相同或相似的拷贝数,即克隆比例为1,即在统计学上是一致的。如本文所用,相同或相似的拷贝数涵盖了相同的拷贝数或者所述拷贝数的30%、25%、20%、15%、10%、5%、4%、3%、2%或更少以内的拷贝数,例如具有或不具有误差校正(error correction)的拷贝数或绝对拷贝数。

6、优选地,突变的克隆比例可以由具有相同或相似突变遗传构型的病变细胞的比例给出,其中突变的遗传构型包括突变所映射的核苷酸位点的总拷贝数和突变等位基因的拷贝数。如果特征存在于所有病变细胞中至不能被可用数据统计学驳斥的程度,则称该特征在病变细胞群中是固定的(fixed)。优选地,克隆比例为1意味着突变的遗传构型在病变细胞群中是固定的。优选地,如果突变在病变细胞群中是固定的并且影响编码突变的位点的cnv在病变细胞群中是固定的,则突变的遗传构型在病变细胞群中是固定的。优选地,如果突变所映射的核苷酸位点的总拷贝数为2且位于病变(肿瘤)基因组的平衡区域中的突变被确定为在病变细胞群是固定的,则突变的遗传构型是固定的。

7、其中发现疾病特异性突变的基因可能潜在地位于基因组中的任何基因中。其中发现产生合适新表位的突变的优选基因类型是这样的基因,其表达导致细胞转化为癌表型或其表达的缺失导致癌细胞丧失其癌表型,即,其表达有助于肿瘤进展的基因。这样的基因被称为驱动基因(driver gene)。许多类型肿瘤的驱动基因的实例是众所周知的。例如,在tamborero等,2013,comprehensive identification of mutational cancer drivergenes across 12tumor types,scientific reports 3:2650中公开了作用于来自12种不同癌症类型的3,205种肿瘤的291种高置信度癌症驱动基因的列表。使用以下中公开的方法已经鉴定了另一些驱动基因:youn等,2011,identifying cancer driver genes in tumorgenome sequencing studies,bioinformatics 27(2):175-181,sakoparnig等,2015,identification of constrained cancer driver genes based on mutation timing,plos comput.biol.11(1):e1004027,以及forbes等,2008,current protocols in humangenetics10-11。驱动基因中的疾病特异性突变可能会或不会导致癌表型。优选地,在病变细胞中发现的驱动基因的每个拷贝都具有疾病特异性突变。还优选地,病变组织中的所有细胞都是病变细胞,其中驱动基因的每个拷贝都具有疾病特异性突变。

8、另一种优选类型的基因是必需基因(essential gene)。在一个实施方案中,必需基因是这样的基因,当其沉默或其表达降低时(例如被缺失),至少导致细胞(优选病变细胞)的生长受损或适应性(fitness)降低。这样的基因在本文中称为必需基因。在一个实施方案中,必需基因是这样的基因,与其中基因未被沉默或表达降低的细胞相比,基因被沉默或表达降低的病变细胞具有至少10%的生长降低或适应性降低。在一个实施方案中,生长降低或适应性降低至少20%、30%、40%、50%、60%、75%、80%、90%或至少95%,最优选地必需基因的沉默或表达降低导致病变细胞的致死性。优选地,在病变细胞中存在的必需基因的每个拷贝都具有疾病特异性突变。

9、必需基因是本领域众所周知的,例如,在liao等2008,proc.nat.acad.sci.usa105:6987-6992和georgi等,2013,plos genetics 9(5):e1003484中公开了人中(例如,在人细胞系中或从其他生物体中推断)必需基因的列表,以及公开了其他真核生物体中的相应直向同源物,例如小鼠(liao等,2007,trends genet.23:378-381)、果蝇(spradling等,1999,genetics153:135-177)、秀丽隐杆线虫(c.elegans)(kamath等,2003,nature421:231-237)、斑马鱼(amsterdam等,2004,proc.natl.acad.sci.usa101:12792-12797)、拟南芥(arabidopsis thaliana)(tzafrir等,2004,plant physiol.135:1206-1220)、酵母(kim等,2010,nat.biotechnol.28:617-623)等。wang等,2015,science 350:1096-1101中公开了来自人癌细胞系的必需基因的列表,并且必需基因列表可以在必需基因数据库deg5.0(zhang等,2009,nucleic acidsres.37:d455-d458)中找到。

10、另外,其缺失/沉默显著降低细胞系群的适应性的必需基因的列表可以从多个健康组织和/或癌细胞系凭经验产生,所述细胞系可以来自供体或来自患者。基因的缺失/沉默可以使用多种分子生物学技术(例如crispr技术、rna干扰等)通过实验进行,其中在推定的必需基因表达和不表达情况下确定细胞的存活或适应性。必需基因的列表也可以从细胞或细胞系通过实验确定,或者必需基因的列表可以通过生物信息学方法获得。细胞或细胞系可以是病变细胞或细胞系(肿瘤细胞或细胞系)或非病变(健康/正常)细胞或细胞系,并且可以从供体或患有该疾病的患者获得。优选地,非病变细胞或细胞系与病变细胞来自相同的组织类型,更优选来自同一患者。在其中疾病是癌症的实施方案中,细胞或细胞系可以从原发性肿瘤或任何转移瘤(如果存在的话)获得。此外,必需基因的列表可以与在体内多种组织中表达的最小基因的组基本相同。例如,必需基因是在多种不同组织中表达的基因,并且以rpkm(每千碱基转录物每百万映射读数的最小读数(minimum reads per kilobaseof transcript per million mapped reads))阈值大于0,优选大于0.1、0.5、1、2、3、4、5、10、20、25表达。这样的必需基因的列表可以通过分析获自从至少5、6、7、8、9、10、15、20、25或更多种不同的组织获得的一组细胞样品的rna表达数据(例如,rnaseq)获得。此外,如果来自患者的肿瘤细胞系可用,则可以使其中所有拷贝都含有编码新表位的突变的基因一次一个地缺失,并测量每种经修饰细胞系的生长速率。这样的测量/分析可以通过本领域已知的高通量方法进行,其允许一次筛选至少一种基因,优选一次筛选多种基因,以评估其对病变细胞或非病变细胞的适应性的影响。这样的方法还允许检测如下所述基因的合成致病或致死组合。简而言之,可以使用每个细胞系缺少一个基因的细胞系文库来测试一个或更多个候选基因的缺失,从而可以确定基因缺失对细胞的影响。

11、本发明还涉及用于确定由基因中的疾病特异性突变产生的新表位作为疾病特异性靶标的适合性的方法,其包括在病变细胞或病变细胞群中确定基因的拷贝数,即,确定其中基因的至少一个拷贝具有疾病特异性突变的基因的拷贝数。在病变细胞(例如肿瘤细胞)中基因具有高拷贝数的情况下(例如由于局灶扩增(focal amplification)),基因可能是驱动基因的可能性非常大。因此,基因的高拷贝数表明新表位作为疾病特异性靶标的适合性,并且基因的拷贝数越高,新表位作为疾病特异性靶标的适合性就越高。例如,高拷贝数可以是大于2、5、10、20、30、40、50、60、70、80、90或大于100的拷贝数。高拷贝数也可以是比相应的非病变细胞中基因的拷贝数高至少50%的拷贝数。高拷贝数也可以是其中至少一个拷贝具有疾病特异性突变的基因的拷贝数为相应非病变细胞中所述基因的拷贝数的至少2×、3×、5×、10×、15×、20×、25×、30×、40×、50×、60×、70×、80×、90×或至少100×。由于也可能存在于正常基因组中的拷贝数变异,因此正常基因组中基因的拷贝数不一定是2。此外,已知在某些疾病中比在其他地方更经常观察到局灶扩增,例如在胶质母细胞瘤中,表皮生长因子受体基因通常局灶扩增,因此该实施方案非常适合用于那些疾病。

12、此外,优选的是在高比例的病变细胞而不是低比例的病变细胞中发现基因的拷贝数相同或相似,以使得具有相同或相似拷贝数的病变细胞的比例越高,新表位作为疾病特异性靶标的适合性就越高。在一个优选的实施方案中,病变组织中的所有病变细胞的其中至少一个拷贝具有疾病特异性突变的基因具有相同或相似的拷贝数,即克隆比例为1。如本文所用,相同或相似的拷贝数涵盖了相同的拷贝数或者所述拷贝数的30%、25%、20%、15%、10%、5%、4%、3%、2%或更少以内的拷贝数,例如具有或不具有误差校正的拷贝数或绝对拷贝数。

13、此外,具有高拷贝数的其中至少一个拷贝具有产生新表位的疾病特异性突变的基因优选地可以是其表达导致细胞转化为癌表型或其表达的缺失导致癌细胞丧失其癌表型的基因,即驱动基因,例如本领域已知的那些驱动基因,或者可以是必需基因,例如,当其沉默或其表达降低时,至少导致病变细胞的生长受损或适应性降低的基因。

14、本发明还涉及用于确定由基因中的疾病特异性突变产生的新表位作为疾病特异性靶标的适合性的方法,其包括在病变细胞或病变细胞群中确定具有所述疾病特异性突变的基因是否是必需基因。在一个实施方案中,必需基因是当其沉默或其表达降低(例如通过基因缺失)时,至少导致病变细胞生长受损或适应性降低的基因。在该实施方案中,其中基因是必需基因并且必需基因的所有拷贝都具有疾病特异性突变(接合性比例为1)表明新表位作为优选的疾病特异性靶标的适合性。在一个实施方案中,必需基因是在多种不同组织中表达的基因,并且以rpkm(每千碱基转录物每百万映射读数的最小读数)阈值大于0,优选大于0.1、0.5、1、2、3、4、5、10、20、25表达。优选地,必需基因的所有拷贝都含有突变。此外,优选高比例的病变细胞含有必需基因的拷贝,其中必需基因的所有拷贝都具有疾病特异性突变(高克隆比例而不是低克隆比例),以使得含有必须基因的拷贝的病变细胞比例越高,新表位作为疾病特异性靶标的适合性就越高,其中必需基因的所有拷贝都具有疾病特异性突变。在一个更优选的实施方案中,病变组织中的所有病变细胞都具有必需基因,其中必需基因的所有拷贝都具有疾病特异性突变,即克隆比例为1。

15、已知某些基因,当单独沉默或其表达单独降低时,对于病变细胞的适应性或生长能力可能仅具有小的影响(如果有的话)。然而,已经观察到,当两种这样的基因在其都沉默或者其每种表达都降低时,可以导致强得多的生长损伤,直至致死。这种遗传组合被称为合成致死或合成致病/损伤。参见nijman,2011,synthetic lethality:general principles,utility and detection using genetic screens in human cells,febs lett.585:1-6对于合成致死和合成致病基因以及鉴定这些基因的方法的讨论。由于这两种基因都是细胞存活所必需的,因此细胞不可能使这两种基因沉默或表达降低。因此,作为疾病特异性靶标的新表位的合适组合可以由至少两种基因中的疾病特异性突变产生,这些基因一起是合成致死的或合成致病的。鉴于此,本发明还涉及用于确定由至少两种基因中的疾病特异性突变产生的至少两种新表位的组合作为疾病特异性靶标组合的适合性的方法,其包括确定各自具有疾病特异性突变的至少两种基因的组合是否是合成致死或合成致病基因。当至少两种基因的组合产生合成致死或合成致病表型时,这表明所得的新表位是疾病特异性靶标的合适组合。在一个优选的实施方案中,与从每种基因单独缺失或表达降低的累加效应所预期的相比,合成致病导致至少更高的对细胞生长/适应性的影响。在存在大量合适的新表位的情况下,这种方法是有利的,因为新表位的数量越多,可能是合成致病或致死的组合的数量就越多。例如,10种突变对应于45种可能的组合,100种突变对应于4950种组合,1000种突变对应于约500,000种组合。在某些实施方案中,在病变细胞和病变组织中的病变细胞两者中,所述至少两种基因各自具有较高而不是较低的接合性比例,优选接合性比例为1,和/或各自具有较高而不是较低的克隆比例,优选克隆比例为1。如本文所用,在合适的新表位的组合中发现的每种新表位各自被认为是用于本发明目的的合适的新表位。

16、如本文所述,无论是在病变细胞还是非病变细胞中,基因的拷贝数可以是相对拷贝数,但优选是绝对拷贝数,更优选是相对于倍性如病变细胞基因组的倍性(即基因组的拷贝数)归一化的绝对拷贝数。甚至更优选地,相对、绝对和归一化的拷贝数是经误差校正的。

17、当估计例如突变等位基因或基因的绝对拷贝数或其接合性时,估计可能是不准确的,并且需要校正绝对拷贝数以考虑误差来源。在使用下一代测序从基因组和外显子组获得序列信息的实施方案中,误差来源可包括:病变组织样品(例如肿瘤样品)的估计的纯度的偏差,导出纯度和/或绝对拷贝数所需的任何估计的参数的偏差,由于测序样品的有限覆盖率引起的随机误差,由于低纯度、低克隆比例等引起的有限的检测能力。

18、在使用含有杂合snp的平衡杂合区段(balanced heterozygous segment)确定绝对拷贝数的实施方案中,例如与本技术同日提交的题为“tumor modeling based onprimary balanced heterozygous segments”的国际pct专利申请中公开的,其公开内容通过引用整体并入本文,区段的绝对拷贝数的误差可能传播到其他估计的参数,例如编码新表位的突变等位基因(例如snv)的绝对拷贝数,突变等位基因的接合性,克隆比例等。由于这些下游估计参数对于如本文所述确定新表位作为患者的疾病特异性靶标的适合性具有临床意义,因此期望校正绝对拷贝数中的误差以获得绝对拷贝数的最准确值。此外,由于编码新表位的突变可以使用本文讨论的标准对于其待包含在给予患者的疫苗中的适合性进行优先化,并且因为1的接合性比例在质量上优于小于1的接合性比例,特别是当含有突变的基因是必需基因时,所以对绝对拷贝数和由其导出的任何参数进行最准确的估计是有益的。

19、在一个优选的实施方案中,可以对突变等位基因(例如snv)的绝对拷贝数和/或snv的接合性进行误差校正。在一个实施方案中,首先对snv的绝对拷贝数进行误差校正,然后校正snv的接合性以反映snv的误差校正的绝对拷贝数。一旦对snv的绝对拷贝数和/或snv的接合性进行了误差校正,也可以校正克隆比例的估计以反映误差校正的绝对拷贝数,包括确定克隆比例是否在统计学上符合1的值。

20、snv的绝对拷贝数优选由snv所映射的区段的绝对拷贝数给出。可以对病变(例如肿瘤)基因组中的所有区段的绝对拷贝数进行误差校正,包括snv的绝对拷贝数。一旦对基因组中所有区段的绝对拷贝数进行了误差校正,就可以基于病变(例如肿瘤)基因组中区段的误差校正的绝对拷贝数来计算误差校正的倍性。

21、在一个具体实施方案中,如果对snv的绝对拷贝数进行了误差校正,以使得新的绝对拷贝数与原始绝对拷贝数不同,则这可以作为snv的估计的绝对拷贝数不可靠的指示。

22、区段的绝对拷贝数的误差校正的一个实例是奇偶校验误差校正(parity errorcorrection),包括如果区段处于平衡区域则将区段的奇数绝对拷贝数校正为偶数绝对拷贝数。平衡区域是病变(例如肿瘤)基因组的区域,其中该区域内的母本和父本等位基因经历相等(平衡)扩增,或者母本和父本等位基因两者都没有经历任何扩增。

23、将区段的奇数绝对拷贝数进行误差校正为最接近的较高的偶数绝对拷贝数或最接近的较低的偶数绝对拷贝数的决定可取决于映射到区段的疾病读数和正常读数,以及与定义区段的绝对拷贝数的预测的边界进行比较。其中正常读数是与测序的正常样品有关的读数,而疾病读数是与测序的病变样品有关的读数。特别地,当疾病是癌症时,肿瘤读数是与测序的肿瘤样品有关的读数。

24、例如,在第一种奇偶校验误差校正中,如果cnmut是病变基因组中突变所映射的区段的绝对拷贝数,则预测具有cnmut值的区段的绝对拷贝数可以校正为cnmut+1(如果r>ρth)和cnmut-1(如果r<ρth),其中r是疾病读数相对于正常区段读数的比值(映射到区段的疾病(例如肿瘤)读数的数目相对于映射到区段的正常读数的数目的比值),其中ρth是预测的决策边界,其值也取决于疾病组织样品(例如肿瘤样品)的纯度。

25、区段的等位基因特异性拷贝数是病变基因组中区段的母本等位基因或父本等位基因的拷贝数。当区段含有杂合snp(杂合区段)时,杂合snp可用于确定区段的等位基因特异性拷贝数。可以将杂合区段分配给优选节点(node),其中节点可以定义为杂合区段的绝对拷贝数和杂合区段的等位基因特异性拷贝数的独特组合。偶数节点是节点的子集,其区段的绝对拷贝数为偶数。如果杂合区段含有多于一个杂合snp,则两个或更多个杂合snp的组可以由该组的单个成员表示,或者可以对组的所有成员的等位基因频率取平均,或者可以使用中值,只要对于在病变基因组中具有更高或更低拷贝数的等位基因,一致地计算每个杂合snp的等位基因频率即可。

26、第一种杂合区段的奇偶校验误差校正可涉及找到最可能的偶数节点以对应于杂合区段,例如,基于给出映射到区段的测量的疾病(例如肿瘤)读数和正常读数的最大可能性框架。

27、在第二种奇偶校验误差校正中,鉴定不需要进行奇偶校验误差校正的最接近的上游和下游区段,优选在包含snv的区段的10mb、5mb、1mb内。如果最接近的上游和下游区段两者的绝对拷贝数相同,则将包含snv的区段的绝对拷贝数改变为最接近区段的绝对拷贝数。通常,第二种奇偶校验误差校正优于第一种奇偶校验误差校正,除非其由于不能鉴定合适的相邻区段而不能实现,在这种情况下,可以应用第一种奇偶校验误差校正。

28、代替奇偶校验误差校正或者除了奇偶校验误差校正之外,还可以引入区段绝对拷贝数的其他形式的误差校正。例如,考虑病变基因组中包含突变的基因的紧邻区段的绝对拷贝数的方法,其中优选地如果绝对拷贝数的改变不大于3、2、优选1,并且优选地,如果大多数相邻区段(50%、60%、70%、80%、90%、100%)具有等于模式的绝对拷贝数,则将包含snv的区段的绝对拷贝数改变为相邻区段的绝对拷贝数模式。

29、用于绝对拷贝数的不同误差校正方案可以组合。在一个优选实施方案中,应用第一奇偶校验误差校正作为第一层误差校正,在其上可以应用另外的误差校正方法。

30、如本文所用,区段可以是基因组的预定区域,例如,基于参照基因组预定。区段可以跨越基因,例如,如读数进行比对的参照基因组中所定义的。区段也可以是基因的片段、外显子、外显子的结合、或给定基因内相关外显子的结合。区段还可以是参照基因组中的另一组预定区域(具有或不具有内含子),或基于正常基因组的参照基因组中的另一组预定区域。在一些具体的实施方案中,区段可以是在病变(例如肿瘤)基因组中具有给定的恒定拷贝数和/或给定的等位基因特异性拷贝数的参照基因组的区域,或者替代地,是在病变(例如肿瘤)基因组中具有给定的恒定拷贝数和/或等位基因特异性拷贝数的基因的片段。可以定义区段以包含或排除内含子。

31、给定基因组(例如,在正常基因组中或在肿瘤基因组中)中区段的拷贝数可以定义为该区段的核苷酸序列出现在基因组中的总频率,而忽略由snp和/或snv和/或其他癌症相关变化引起的变异,例如但不限于突变、插入、缺失和/或其他癌症相关遗传变体。优选地,给定基因组中区段的不同拷贝具有相同的长度或几乎相同的长度。

32、基因组中区段的拷贝数可意指含有基因组的细胞中区段的物理拷贝数。正常基因组中区段的绝对拷贝数可以定义为健康细胞中给定区段的物理拷贝数。病变(例如肿瘤)基因组中区段的绝对拷贝数可以定义为病变(例如肿瘤)细胞中给定区段的物理拷贝数。基因组中区段的拷贝数可以称为所述基因组中区段的绝对拷贝数。拷贝数可意指绝对拷贝数。

33、在一个具体实施方案中,如果在基因组中区段的仅一部分扩增或缺失,则区段的该部分拷贝可以作为区段的拷贝计数或不作为区段的拷贝计数。在一个优选的实施方案中,可以忽略跨越区段长度的小于90%、80%、70%、60%、50%、40%、30%、20%、10%或5%的区段的拷贝。

34、参照基因组用于映射读数并提供正常基因组和病变(例如肿瘤)基因组的坐标系,其中坐标系可包括提供染色体数目,染色体中的核苷酸位置以及读数的方向性,其中染色体中的位置由线表示。

35、参照基因组可以基于来自与提供病变组织样品的对象相同物种的一个或更多个成员的基因组,或者可以基于对象的正常基因组。

36、病变组织样品(例如肿瘤样品)也可能包含来自正常基因组,特别是取得样品的同一患者的正常基因组的污染物,和/或在肿瘤内异质性的情况下,也包含多于一种肿瘤基因组。纯度、肿瘤样品纯度、肿瘤纯度和样品纯度均视为等同术语,优选地意指肿瘤样品中存在的肿瘤细胞的比例。正常污染物优选地意指肿瘤样品中存在的正常细胞的比例,并且可以通过一减去纯度给出。

37、由于基因组复制事件,相对于细胞的倍性归一化用于基因拷贝的存在。在一个实施方案中,绝对拷贝数可以相对于基因组的倍性归一化,所述倍性是通过每个区段的长度加权的给定细胞中给定基因组中所有区段的绝对拷贝数的平均值。在一个实施方案中,绝对拷贝数可以相对于包含突变的目的基因(包含突变)的染色体的倍性归一化,所述倍性是通过染色体上的每个区段的长度加权的给定细胞中给定染色体上所有区段的绝对拷贝数的平均值。在一个实施方案中,绝对拷贝数可以相对于包含突变的目的基因的染色体邻近区域的倍性归一化,所述倍性是通过区域中每个区段的长度加权的给定细胞中给定区域中每个区段的平均值。邻近区域可以在具有疾病特异性突变的基因的预定距离内,例如,具有疾病特异性突变的基因的100兆碱基(mb)、75mb、50mb、25mb、10mb、5mb、4mb、3mb、2mb或1mb以内。区段的拷贝数可以通过本领域已知的方法常规地计算,包括实验或计算机两者。例如,ep专利no.2 198 292b1和ep 2 002 016b1分别公开了用于确定核酸序列的相对拷贝数和拷贝数频率的方法。此外,ep专利申请公开no.2 835 752a和国际专利申请公开no.wo2014/014497和wo 2014/138153也公开了用于确定拷贝数变异的方法。还参见machado等2013,copy number variation of fc gamma receptor genes in hiv-infected andhiv-tuberculosis co-infected individuals in sub-saharan africa,plos,8(11):e78165。其他方法包括使用facs、fish或其他基于荧光的方法、光谱核型分析(sky)和数字pcr。区段也可以是基因。

38、疾病特异性突变可以是导致新表位表达的任何突变,优选在病变细胞的表面上。特别地,突变可以是插失(indel)或基因融合事件,或者可以是单核苷酸变异(点突变)。优选地,疾病特异性突变是非同义突变,优选在肿瘤或癌细胞中表达的蛋白质的非同义突变。可以使用本领域已知的用于确定疾病特异性突变的任何方法,并且特别地使用下一代测序数据来确定病变细胞的基因组/外显子组与相应的非病变野生型细胞的基因组/外显子组之间的任何变化的方法是优选的。例如,carter等,2012,absolute quantification ofsomatic dnaalterations in human cancer,nature biotechnology 30:413-421;cibulskis等,2013,sensitive detection of somatic point mutations in impure andheterogeneous cancer samples,nature biotechnology 31:213-219;以及li和li,2014,ageneral framework for analyzing tumor subclonality using snp array anddnasequencing data,genome biology 15:473-495公开了不仅用于鉴定疾病特异性突变的方法,还公开了用于确定基因拷贝数、接合性比例以及接合性和接合性比例的亚克隆比例的方法。用于确定拷贝数(例如绝对拷贝数)的另一种方法涉及使用基因组的区段,每个区段含有至少一个杂合单核苷酸多态性(snp),并且所述区段是平衡的(相等数目的每种形式的杂合snp)并且具有共同拷贝数(初级拷贝数),其优选地是基因组的所有平衡区段中最常观察到的绝对拷贝数,如在与本技术同日提交的题为“tumor modeling based onprimary balanced heterozygous segments”的国际pct专利申请中所公开的,其公开内容通过引用整体并入本文。此外,除了确定绝对拷贝数之外,本技术还可以确定突变等位基因或至少一个拷贝包含突变等位基因之基因的接合性、接合性比例和亚克隆性(subclonality)。此外,其中的方法还对绝对拷贝数进行误差校正,这提高了绝对拷贝数和接合性以及由其导出的参数如亚克隆性、倍性等的准确性。

39、通常,突变等位基因所映射的核苷酸位点的总拷贝数可意指突变的绝对拷贝数,其可意指snv的绝对拷贝数,特别是当突变是snv时。通常,突变的绝对拷贝数可以优选地由突变所映射的区段的绝对拷贝数给出(其中绝对拷贝数在病变(例如肿瘤)基因组中)。

40、通常,编码新表位的突变等位基因的拷贝数可意指突变的突变等位基因的绝对拷贝数,其可意指snv的替代等位基因的绝对拷贝数(snv的接合性),其中snv的替代等位基因是突变等位基因,特别是当突变是snv时。

41、优选地,当突变不是snv时,可以以与应用于snv的方法类似的方式估计突变的突变等位基因的绝对拷贝数。

42、通常,基因的拷贝数可意指区段的绝对拷贝数,其中区段可以是基因,或可以涵盖基因。基因的拷贝数可意指基因的绝对拷贝数。

43、优选地,疾病可以是其中期望针对病变细胞/组织(例如病毒感染的细胞)的免疫应答的任何疾病。优选地,疾病是癌症。

44、本发明的方法可以包括确定通过本发明的方法鉴定的合适的新表位作为合适的疾病特异性靶标的可用性/适用性的进一步的步骤,其用于提供针对合适的新表位的免疫应答的方法,例如在癌症疫苗中包含合适的新表位。因此,进一步的步骤可涉及以下一种或更多种:确定合适的新表位的抗原性和/或免疫原性;评估合适的新表位是否在病变细胞表面上表达;包含合适的新表位的肽被作为mhc呈递表位呈递的能力;确定合适的新表位从编码核酸表达的效力;确定所设想的合适的新表位,特别是当存在于其天然序列环境中时,例如当侧翼氨基酸序列也是天然存在的蛋白质中所述新表位侧翼的氨基酸序列时,以及当在抗原呈递细胞中表达时,是否能够刺激t细胞,例如患者的具有期望的特异性的t细胞。

45、一旦根据其抗原性/免疫原性、表达能力、被作为mhc呈递表位呈递的能力等确定了新表位适合/适用于用作靶标,就可以根据其不从病变细胞中下调或缺失,即病变组织可以逃脱新表位靶向的可能性更低的潜力对鉴定的合适的新表位进行排序,即,优先化。例如,一种优先化从“最佳”新表位开始,其为由必需基因编码的新表位,其中必需基因的所有拷贝都具有编码新表位的突变,然后是一对合成致病或致死基因,其中每个基因的每个拷贝都具有编码新表位的突变,然后是由具有非常高的绝对拷贝数的已知驱动基因编码的新表位,其中该基因的所有拷贝都具有突变,然后是由具有非常高的绝对拷贝数和高接合性的不知道是驱动基因的基因编码的新表位,然后是由具有高拷贝数(接合性)的基因编码的新表位,等。

46、在一个实施方案中,由接合性比例为1的必需基因编码的新表位优于不由必需基因编码的其他新表位。在一个实施方案中,在接合性比例为1编码新表位的两个必需基因之间,由具有较高绝对拷贝数的基因编码的新表位是优选的。在一个实施方案中,在编码新表位的两个必需基因之间,由在缺失时导致较低适应性的基因编码的新表位是优选的。在一个实施方案中,在编码新表位的基因之间,其中所有基因的接合性比例为1,由具有较高绝对拷贝数的基因编码的新表位是优选的。在其中接合性比例小于1的实施方案中,由具有高接合性的基因编码的新表位优于具有高接合性比例的基因,并且如果接合性相同或相似,则具有高绝对拷贝数的基因优于具有高接合性比例的那些(突变等位基因的10个拷贝/核苷酸位点的20个总拷贝因为更高的接合性而比3/4更好;10/100优于10/20因为前者可能是驱动基因;9/100优于10/20,因为接合性相似,但前者可能是驱动基因)。在一个实施方案中,其中疾病特异性突变负责将细胞转化为癌表型的驱动基因编码的新表位优于其中突变在细胞转化为癌表型中不具有作用的那些。此外,优选的是新表位具有更高而不是更低的克隆比例。

47、本发明的另一些实施方案涉及确定新表位作为疾病特异性靶标的适合性的方法用于制备药物例如疫苗,例如个体化癌症疫苗的用途。疫苗可以来自通过本发明方法鉴定的一种或更多种合适的新表位或来自合适的新表位的组合。在一个优选的实施方案中,疫苗包含含有通过本发明方法鉴定的一种或更多种合适的新表位或合适的新表位的组合的肽或多肽,或者编码所述肽或多肽的核酸。

48、特别地,可以提供重组疫苗,其在施用于患者时优选提供mhc呈递表位的集合,其中至少一种是合适的新表位或其中至少两种是通过本发明方法鉴定的新表位的合适的组合,例如2种或更多种、5种或更多种、10种或更多种、15种或更多种、20种或更多种、25种或更多种、30种或更多种,并且优选多至60种、多至55种、多至50种、多至45种、多至40种、多至35种或多至30种mhc呈递表位。由患者的细胞,特别是抗原呈递细胞呈递这些表位优选地导致t细胞在与结合时靶向表位,并且因此靶向表达mhc呈递表位衍生自的抗原并且在肿瘤细胞的表面上呈递相同表位的患者肿瘤,优选原发性肿瘤以及肿瘤转移。

49、本发明的方法还可用于制备重组免疫细胞,所述重组免疫细胞表达靶向合适的新表位或合适的新表位的组合中的一种新表位的抗原受体。优选地,免疫细胞是t细胞,并且抗原受体是t细胞受体。

50、本发明还涉及用于提供靶向合适的新表位或合适的新表位的组合中的一种表位的重组免疫细胞的方法,所述方法包括用重组抗原受体转染免疫细胞,所述重组抗原受体靶向通过本发明用于确定新表位作为基因特异性靶标的适合性的方法鉴定的合适的新表位或合适的新表位的组合中的一种表位,以及涉及通过这些方法产生的重组免疫细胞。

51、本发明还提供了用于靶向表达一种或更多种新表位的细胞群或组织的方法。例如,针对一种或更多种新表位的抗体可用于靶向表达通过本文所述方法鉴定的一种或更多种新表位的细胞或组织。在一个实施方案中,本发明提供了用于在哺乳动物中提供对于表达一种或更多种新表位的靶细胞群或靶组织的免疫应答的方法,所述方法包括向所述哺乳动物施用:(a)表达靶向一种或更多种新表位的一种或更多种抗原受体的一种或更多种免疫细胞;(b)施用编码一种或更多种新表位的核酸;或(c)施用包含一种或更多种新表位的肽或多肽,其中所述新表位根据本发明用于确定新表位作为疾病特异性靶标的适合性的方法鉴定。在一个实施方案中,用于在哺乳动物中提供对于表达一种或更多种新表位的靶细胞群或靶组织的免疫应答的方法包括以下步骤:(i)在病变细胞或病变细胞群中确定编码新表位的基因中突变等位基因(疾病特异性突变)的拷贝数;以及(ii)施用(a)表达靶向由疾病特异性突变产生的新表位之抗原受体的免疫细胞;(b)施用编码由疾病特异性突变产生的新表位的核酸;或(c)施用包含由疾病特异性突变产生的新表位的肽或多肽。

52、在一个实施方案中,用于在哺乳动物中提供对于表达一种或更多种新表位的靶细胞群或靶组织的免疫应答的方法包括以下步骤:(i)在病变细胞或病变细胞群中确定以下基因的拷贝数,其中所述基因的至少一个拷贝具有产生新表位的疾病特异性突变;以及(ii)施用(a)表达靶向由疾病特异性突变产生的新表位的抗原受体的免疫细胞;(b)施用编码由疾病特异性突变产生的新表位的核酸;或(c)施用包含由疾病特异性突变产生的新表位的肽或多肽。在一个实施方案中,用于在哺乳动物中提供对于表达一种或更多种新表位的靶细胞群或靶组织的免疫应答的方法包括以下步骤:(i)在病变细胞或病变细胞群中确定具有产生新表位的疾病特异性突变的基因是否是必需基因;以及(ii)施用(a)表达靶向由疾病特异性突变产生的新表位之抗原受体的免疫细胞;(b)施用编码由疾病特异性突变产生的新表位的核酸;或(c)施用包含由疾病特异性突变产生的新表位的肽或多肽。优选地,必需基因的所有拷贝都具有疾病特异性突变,即,接合性比例为1。

53、在一个实施方案中,用于在哺乳动物中提供对于表达一种或更多种新表位的靶细胞群或靶组织的免疫应答的方法包括以下步骤:(i)在病变细胞或病变细胞群中确定各自具有产生新表位的疾病特异性突变的至少两种基因的组合是否是合成致死或合成致病基因;以及(ii)施用(a)表达靶向由至少两种基因的疾病特异性突变产生的一种或更多种新表位之一种或更多种抗原受体的一种或更多种免疫细胞,(b)施用编码由至少两种基因的疾病特异性突变产生的一种或更多种新表位的核酸;或(c)施用包含由至少两种基因的疾病特异性突变产生的一种或更多种新表位的肽或多肽。优选地,由至少两种基因的疾病特异性突变产生的所有新表位由施用的免疫细胞靶向,由施用的核酸编码,或包含在施用的肽或多肽内。

54、此外,可以向具有与由疾病特异性突变产生的新表位表达相关的疾病、障碍或病症的哺乳动物提供免疫应答,从而治疗或预防所述疾病、障碍或病症。优选地,所述疾病、障碍或病症是癌症。

55、优选地,免疫细胞是t细胞,并且抗原受体是t细胞受体,免疫应答是t细胞介导的免疫应答。更优选地,免疫应答是抗肿瘤免疫应答,并且表达一种或更多种合适的新表位的靶细胞群或靶组织是肿瘤细胞或肿瘤组织。

56、根据以下详细描述和权利要求,本发明的其他特征和优点将变得明显。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1