从数字病理学图像预测可操作突变的制作方法

文档序号:36709412发布日期:2024-01-16 11:45阅读:17来源:国知局
从数字病理学图像预测可操作突变的制作方法

本公开涉及癌症诊断、治疗和预后。


背景技术:

1、规划癌症治疗中的一个重要步骤是在考虑疾病进展和患者依从性的可能性两者的情况下识别最有可能有效的治疗选项。一旦恶性肿瘤已生长超过一定尺寸和/或已经转移,患者的选项就可能限于诸如化学疗法、放射疗法、靶向疗法和免疫治疗等治疗。由于严重的副作用让患者感到不适,患者对化学疗法和放射疗法的依从性可能面临挑战。患者也面临癌细胞可能突变并对全身性疗法产生耐药性的风险。免疫疗法是这些治疗选择中最新颖的,其激活患者自身的免疫系统并且代表管控癌症中的重要选项,尽管其可能仅对20%至30%的肿瘤有效。一般来说,跨不同的肿瘤类型应用以下基本原理,以便使直接临床效益最大化并且保障针对患者的未来治疗选项:作为第一步,应首先筛查患有晚期疾病的患者对于靶向疗法的资格。如果没有识别到突变靶标,则为患者提供单独的免疫疗法或与传统化学疗法相组合的免疫疗法。作为最后手段,如果该组合失败,则可以考虑化学疗法的组合。

2、靶向疗法可能是优选的,但由于可寻址突变的罕见性而仅适用于一小部分肿瘤。基于目前批准的疗法,可寻址突变仅在致癌基因(阳性地调节不同细胞功能的基因)上出现。在肺癌中,最常见和可操作突变(actionable mutation)存在于以下致癌基因中:egfr、alk、ret、ros1和ntrk。除了致癌基因之外,被称为肿瘤抑制因子的第二类基因在突变时也可能导致癌症。顾名思义,这些基因通常起到抑制细胞活性的作用;因此,这些基因中的突变会经由抑制的损失而导致癌症。最终,在临床实践中,使用下一代测序(ngs)实验组(panel)对肿瘤进行最全面的分子表征。该测定仅检测基因子集中的突变,其中一些实验组查询低至25个基因,而另一些实验组则可以查询多达500个基因。这代表人类基因组中的20,000至25,000个总基因的一小部分。这可以解释为什么在经由ngs(未知驱动因子)测试的肿瘤样品的一部分中未发现驱动因子突变。

3、靶向疗法可以包括靶向表皮生长因子受体(egfr)以及涉及间变性淋巴瘤激酶(alk)、ret、ros1和神经营养性酪氨酸受体激酶(ntrk)的基因融合的药物。对于egfr,尽管免疫组织化学染色可以用于识别最常见的变体(例如,其覆盖率高达egfr阳性肺腺癌患者的97%),但可能需要分子检测来识别egfr靶向疗法失败的患者中的耐药突变。还没有开发出针对ret和ros1的此类免疫组织化学染色剂,并且针对alk和ntrk的免疫组织化学染色剂的性能可能变化很大并且难以解释。

4、基因融合通常需要更复杂的分子测定,与针对有限数量基因座进行测试的更常用的“热点”测定相比,其基因组的覆盖范围更大。为了靶向基因融合,可能需要广泛得多的覆盖范围,从而导致昂贵得多的测试,这需要实验室表现出大得多的技术能力。然而,某些基因融合(例如,ntrk融合)可能极其罕见。尽管ntrk融合已在多种肿瘤类型中被识别,但在最常见的癌症适应症中(诸如在肺腺癌、结肠直肠癌和非分泌性乳腺癌中),该特定融合的频率可能小于1%。基因融合的相对罕见性(例如,在肺腺癌中范围为从针对alk的7%到针对ntrk的小于0.3%)构成了对广泛检测的显著技术和资金阻碍。目前,分子检测是迄今为止可用于确定患者中是否存在基因融合的唯一方法。然而,分子检测价格昂贵,因此患者有时会避免安排分子检测,因为患者很可能无法从靶向疗法中受益。因此,相当大比例的患者可能不太可能接受正确的测试来确定他们的肿瘤是否携带基因融合。因此,需要一种快速、稳健并且灵敏的筛查工具,以通过所需的测试类型对肿瘤样品进行分类来确定其首选并且最佳的全身性治疗选项。


技术实现思路

1、本文提供了使用数字病理学技术来识别可操作突变(包括(例如但不限于)致癌基因融合(例如,alk、ros1、ret和ntrk))的系统和方法,其中可操作突变预测对于其而言靶向疗法可用的突变以及治疗应答的预后。

2、在一些情况下,所公开的方法和系统可以应用于检测基因融合/重排,这是一种特定类型的罕见的可药性(druggable)致癌基因突变事件,其可以跨许多不同的癌症类型被识别,如果存在于肿瘤组织样品中,则其可以指示对某些靶向疗法的强烈应答。基因融合包括罕见的可药性突变事件,这些突变事件可以跨许多不同的肿瘤类型而发生,并且越来越多地作为新颖疗法的靶标。基因融合的识别可能是在技术上困难、昂贵并且耗时的过程,其最终可能仅使少数携带此类基因改变的患者受益;由于这些原因,广泛检测可能仅限于少数有能力吸收和提供在该过程中所涉及的技术和资金资源的医院。本文公开的实施方案可以通过创建、训练和使用机器学习模型(例如,数字病理学筛查模型)来解决这一差距,该机器学习模型可以从数字病理学图像(诸如经扫描、经染色的(例如,经苏木精和伊红(h&e)染色的)描绘癌组织/细胞(例如,肺腺癌)的全载玻片图像(wsi))来预测致癌基因融合的存在。此外,本文公开的实施方案可以包括快速、便宜并且足够准确的筛查工具,其可以用于指导分子检测以及与针对患者(包括但不限于肺腺癌患者)中的个体的靶向疗法的使用有关的决策制定。

3、在特定实施方案中,数字病理学图像处理系统可访问描绘来自受试者的生物学样品的特定切片中的癌细胞的数字病理学图像。数字病理学图像处理系统然后可从数字病理学图像识别一个或多个图像图块(image patch),每个图像图块描绘肿瘤细胞的一个或多个簇(例如,完全由肿瘤细胞组成的区域或包括被间质包围的一个或多个肿瘤巢(tumornest)结构的区域)。在一些情况下,当数字病理学图像已被划分为多个图块时,图像图块可以包括图像图块的一部分、多个相邻图块、或者一个或多个相邻图块与图块的一个或多个相邻部分的组合。数字病理学图像处理系统可针对该多个图像图块中的每一者生成指示图像图块描绘肿瘤细胞的簇的可能性(例如,二进制输出或百分比输出)的标记。在特定实施方案中,数字病理学图像处理系统可基于针对每个图块生成的标记来确定数字病理学图像包括对存在于生物学样品中的癌细胞中例如基因融合的发生的描绘。数字病理学图像处理系统可进一步基于对例如基因融合的检测来生成针对受试者的预后预测。在一些实施方案中,预后预测可以包括对针对受试者的一个或多个治疗方案(例如,化学疗法或靶向治疗)的适用性的预测。

4、本文公开的方法包括:访问描绘来自受试者的生物学样品的特定切片中的癌细胞的数字病理学图像,并且其中经描绘的特定切片经一种或多种染色剂染色;将数字病理学图像分割为多个图像图块;针对该多个图像图块中的每一者生成指示图像图块描绘成簇的肿瘤细胞的可能性的标记;基于针对每个图像图块生成的标记来确定数字病理学图像包括对关于癌细胞的基因融合的发生的描绘;以及基于关于癌细胞的基因融合的发生来生成针对受试者的预后预测,其中预后预测包括对针对受试者的一个或多个治疗方案的适用性的预测。

5、在一些实施方案中,该方法进一步包括:从该多个图像图块中的每一者检测一个或多个特征,其中该一个或多个特征包括临床特征或组织学特征中的一者或多者,并且其中针对该多个图像图块中的每一者生成标记是基于该一个或多个特征的。

6、在一些实施方案中,针对该多个图像图块中的每一者生成标记是基于肿瘤形态学的,其中肿瘤形态学基于对以下中的一者或多者的分析:印戒细胞的存在、印戒细胞的数量、肝样细胞的存在、肝样细胞的数量、细胞外粘蛋白或肿瘤生长模式。

7、在一些实施方案中,针对该多个图像图块中的每一者生成标记是基于一个或多个机器学习模型的,其中该方法进一步包括:基于多个训练数据来训练该一个或多个机器学习模型,该多个训练数据包括对成簇的肿瘤细胞的一个或多个带标记的描绘以及对其他组织学或临床特征的一个或多个带标记的描绘。

8、在一些实施方案中,进一步基于对一个或多个额外数字病理学图像的分析来生成预后预测,该一个或多个额外数字病理学图像中的每一者描绘来自受试者的生物学样品中的额外特定样品,并且其中分析包括:确定该一个或多个额外数字病理学图像中的每一者包括对关于癌细胞的基因融合的发生的描绘的可能性;以及对针对该一个或多个额外数字病理学图像中的每一者的确定进行组合。

9、在一些实施方案中,该方法进一步包括:经由图形用户界面来输出预后预测,其中图形用户界面包括数字病理学图像的图形表示,并且其中图形表示包括:对针对该多个图像图块中的每一者所生成的标记的指示,以及与相应标记相关联的经预测的置信水平。

10、在一些实施方案中,该方法进一步包括:生成与该一个或多个治疗方案的使用相关联的建议。

11、在一些实施方案中,生物学样品的特定切片经一种或多种染色剂染色。

12、在一些实施方案中,确定数字病理学图像包括对关于癌细胞的基因融合的发生的描绘进一步基于针对每个图像图块生成的标记的加权组合。

13、在一些实施方案中,该方法进一步包括:从数字病理学图像识别肿瘤异质性;以及测量经识别的肿瘤异质性,其中确定数字病理学图像包括对基因融合的发生的描绘进一步基于经测量的肿瘤异质性。

14、在一些实施方案中,识别肿瘤异质性包括:通过识别形态上相似的细胞(例如,通过评定核异质性)来将突变肿瘤细胞分类到表型。在一些实施方案中,评定核异质性包括:量化细胞核的某些特征以基于核形态异质性来区分突变细胞。

15、在一些实施方案中,识别肿瘤异质性包括:通过进行细胞级空间分析以评定空间分布来识别克隆细胞的区域。在一些实施方案中,评定空间分布包括:测量肿瘤细胞的最小生成树的子图内的光谱距离,其中子图中的每一者表示成簇的相邻细胞(例如,肿瘤巢),以及跨所有子图成对地计算邻接光谱距离。在一些实施方案中,可通过进行异常值检测来定义子图中的每一者。在一些实施方案中,可基于对检测到的肿瘤巢的分割来定义子图中的每一者。

16、在一些实施方案中,识别肿瘤异质性包括:通过进行细胞级空间分析以评定空间熵来识别紧密相邻的克隆细胞的区域。在一些实施方案中,评定空间熵包括:针对预定义数量的距离箱中的每一者来计算成对的细胞被识别为形态上相似的频率。

17、本文公开了一种或多种计算机可读非暂时性存储介质,其体现软件,该软件当被执行时可操作以执行本文公开的一种或多种方法的一部分或全部。

18、本文公开的系统包括:一个或多个处理器;以及非暂时性存储器,该非暂时性存储器包含指令,该指令当被一个或多个数据处理器执行时,使该一个或多个数据处理器执行本文公开的一种或多种方法的一部分或全部。

19、本文公开的方法包括:从客户端计算系统向远程计算系统传输请求通信,以处理描绘来自受试者的生物学样品的特定切片中的癌细胞的数字病理学图像,其中响应于从客户端计算系统接收请求通信,远程计算系统进行包括以下的操作:访问数字病理学图像;将数字病理学图像分割为多个图像图块;针对该多个图像图块中的每一者生成指示图像图块描绘成簇的肿瘤细胞的可能性(例如,二进制输出或百分比输出)的标记;基于针对每个图像图块生成的标记来确定数字病理学图像包括对关于癌细胞的基因融合的发生的描绘;基于关于癌细胞的基因融合的发生来生成针对受试者的预后预测,其中预后预测包括对针对受试者的一个或多个治疗方案的适用性的预测;以及经由响应通信来向客户端计算系统提供预后预测;以及由客户端计算系统响应于接收响应通信而输出预后预测。

20、本文公开的方法包括由数字病理学图像处理系统:访问描绘来自受试者的生物学样品的特定切片中的癌细胞的数字病理学图像;确定数字病理学图像包括对与基因融合的发生相互排斥的一个或多个突变的描绘;确定不存在关于癌细胞的基因融合;以及基于不存在关于癌细胞的基因融合来生成针对受试者的预后预测,其中预后预测包括对针对受试者的一个或多个治疗方案的适用性的预测。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1