生成诊断模型的方法、使用该方法诊断的方法及装置与流程

文档序号:34044592发布日期:2023-05-05 14:39阅读:19来源:国知局
生成诊断模型的方法、使用该方法诊断的方法及装置与流程

本发明涉及一种使用生物标志物组相关值信息来生成用于诊断根据患者分层信息的多种癌症的诊断模型的方法、使用该方法诊断多种癌症的方法以及使用该方法的装置,更具体地涉及一种在使用生物标志物组相关值信息诊断患者的癌症时,将影响癌症诊断的患者信息组织为分层结构并可以针对每分层患者的癌症进行诊断的诊断模型的方法、使用该方法诊断多种癌症的方法以及使用该方法的装置。


背景技术:

1、肿瘤转移是肿瘤的一部分与实体癌患者分离并通过血液移动到身体其他部位的现象,其在癌症相关死亡中占有重要的地位。目前,诊断癌症的常规方法是活检(biopsy),即在癌症转移的早期阶段,切除组织的某一部分并进行检测,但确定准确的活检部位并不容易。另一方面,近年来备受关注的液体活检(liquid biopsy)方法是采集来自患者身体的生物样本,例如患者的血液、尿液等,并检测生物样本中的肿瘤细胞,该方法被认为不仅可用于估计癌症的进展和癌症的治疗过程,而且可用于早期检测和诊断。

2、这样,可以利用生物样品中所含的蛋白质、己烷、代谢物等来检测体内变化的指标,称为生物标志物(biomarker)。

3、然而,由于仅使用单一生物标志物进行癌症诊断存在局限性,因此目前在该技术领域中正在应用使用复合生物标志物的癌症诊断方法,这是一种通过组合使用两种以上的生物标志物来提高癌症诊断敏感性和特异性的方法。

4、然而,当使用该复合生物标志物来鉴别特定癌症时,特定生物标志物不仅可以指示特定癌症的指标,而且还可以指示其他癌症的指标,因此在使用复合生物标志物来鉴别特定癌症时可能会出现误诊。

5、作为一例,当使用复合生物标志物来诊断腺癌(adenocarcinoma)时,尽管使用复合生物标志物的生物标志物组相关值信息来鉴别的结果显示腺癌,但实际患者的癌症可能会是皮肤鳞状细胞癌(squamous cell carcinoma)。

6、另外,当通过分析复合生物标志物的生物标志物组相关值信息来鉴别癌症时,根据鉴别者的不同,可以出现结果不同等问题。

7、因此,正在提出使用复合生物标志物的生物标志物组相关值信息对癌症进行分类的各种方法。

8、尤其,在使用生物标志物组相关值信息学习癌症诊断模型时,应考虑对患者的生理特征有很大影响的变量,例如性别和年龄等。

9、为此,目前正在使用一种使用患者信息将患者数据组织成分层结构并使用每分层的患者数据来学习每分层的不同分类模型的方法。

10、然而,在学习每分层的分类模型时,很直观,因为只使用每分层的数据,但当分层数量较多时,由于每分层的数据数量变少,所估计模型的方差增大,从而导致无法保证可靠性的问题。

11、因此,本发明的申请人旨在提供一种诊断模型,所述诊断模型可以使用生物标志物组相关值信息针对每分层患者的癌症进行诊断,而不会因方差而降低可靠性。


技术实现思路

1、本发明的目的在于解决所有上述问题。

2、另外,本发明的另一目的在于提供一种诊断模型,所述诊断模型可以通过使用每个患者的生物标志物组相关值信息来最小化方差以针对每分层患者的癌症进行诊断。

3、另外,本发明的另一目的还在于通过使用用于诊断多种癌症的生物标志物组相关值信息来准确地鉴别每分层患者癌症的类型。

4、另外,本发明的另一目的还在于通过使用用于诊断多种癌症的生物标志物组相关值信息的统计判别方法来准确地鉴别每分层患者癌症的类型。

5、另外,本发明的另一目的还在于通过使用用于诊断多种癌症的生物标志物组相关值信息的统计判别方法来提高每分层患者癌症鉴别的可靠性。

6、为了实现上述本发明的目的并实现后述的本发明的特征效果,本发明的特征结构如下。

7、根据本发明的一实施例,提供一种使用生物标志物组相关值信息来生成用于诊断根据患者分层信息的多种癌症的诊断模型的方法,其包括:(a)当获得包括与针对每个患者的k个分层变量对应的分层信息、生物标志物组相关值信息和真实数据癌症信息的n个学习数据时,诊断模型生成装置设置用于使用所述生物标志物组相关值信息根据所述分层信息对癌症进行分类的基本分类模型的初始预测值的处理,其中所述k为1以上的整数,所述n为1以上的整数,所述分层信息由所述k个分层变量中至少两个分层变量生成;以及(b)所述诊断模型生成装置通过使用在前一迭代中通过第1迭代至第t迭代更新的前一分类模型生成第1决策树至第t决策树来生成所述诊断模型,其中所述t为1以上的整数,在所述第1迭代的情况下,所述前一分类模型为所述基本分类模型,在t迭代中,(i)将所述n个学习数据输入到所述第t-1分类模型,即所述第t迭代中所述前一分类模型,使得所述第t-1分类模型输出对每个所述n个学习数据进行癌症分类的第t-1癌症预测值,(ii)参照针对每个所述患者的所述真实数据癌症信息与所述第t-1癌症预测值生成针对每个所述n个学习数据的每个整体残差,(iii)生成使与所述整体残差的相关性最大化的第t决策树,(iv)通过使用所述第t决策树更新所述第t-1分类模型来生成第t分类模型的处理,其中所述t为1以上且t以下的整数。

8、所述基本分类模型可以包括第1分类模型,其为使用所有所述生物标志物组相关值信息对癌症进行分类的整体分类模型;第2分类模型,其使用每个所述k个分层变量的生物标志物组相关值信息对癌症进行分类的分层变量分类模型;以及第3分类模型,其使用每个所述分层信息的生物标志物组相关值信息对癌症进行分类的分层信息分类模型。

9、在所述(b)步骤中,所述诊断模型生成装置(i)使用针对每个所述n个学习数据的每个所述残差与预设的第1正则化参数,在第t-1整体分类模型中,以使参照所述残差与所述第1正则化参数生成的整体相关性增大为基准,对第t-1整体决策树进行分支分类,(ii)使用针对每个所述n个学习数据的所述残差与预设的第2正则化参数,在第t-1分层变量分类模型中,以使参照针对每个分层变量的分层变量残差与所述第2正则化参数生成的每个分层变量相关性增大为基准,对第t-1分层变量决策树进行分支分类,(iii)使用针对每个所述n个学习数据的所述残差与预设的第3正则化参数,在第t-1分层信息分类模型中,以使参照针对每个分层信息的分层信息残差与所述第3正则化参数生成的每个分层信息相关性增大为基准,对第t-1分层信息决策树进行分支分类,(iv)可以将所述第t-1整体决策树、所述第t-1分层变量决策树和所述第t-1分层信息决策树中具有最大相关性的特定决策树生成为所述第t决策树。

10、在所述(b)步骤中,所述诊断模型生成装置可以通过对所述第t决策树应用预设权重来更新所述第t-1分类模型,其中所述预设权重为大于0且小于1。

11、在上面的描述中,所述诊断模型生成装置可以将所述权重应用于与所述第t决策树对应的第t决策树分类模型,并将应用所述权重的所述第t决策树分类模型与所述第t-1分类模型相加以生成所述第t分类模型。

12、在所述(b)步骤中,所述诊断模型生成装置可以使用针对每个所述n个学习数据的所述真实数据癌症信息与所述第t-1癌症预测值来生成损失,并对所述损失进行微分以生成整体残差。

13、根据本发明的另一实施例,提供一种使用生物标志物组相关值信息来诊断根据患者分层信息的多种癌症的方法,其包括:(a)在诊断模型生成装置通过如下处理来生成诊断模型的状态下,多种癌症诊断装置获得特定患者的特定分层信息与特定生物标志物组相关值信息:当获得包括与针对每个患者的k个分层变量对应的分层信息、生物标志物组相关值信息和真实数据癌症信息的n个学习数据时,设置用于使用所述生物标志物组相关值信息根据所述分层信息对癌症进行分类的基本分类模型的初始预测值的处理,其中所述k为1以上的整数,所述n为1以上的整数,所述分层信息由所述k个分层变量中至少两个分层变量生成;以及通过使用在前一迭代中通过第1迭代至第t迭代更新的前一分类模型生成第1决策树至第t决策树来生成所述诊断模型,其中所述t为1以上的整数,在所述第1迭代的情况下,所述前一分类模型为所述基本分类模型,在t迭代中,(i)将所述n个学习数据输入到所述第t-1分类模型,即所述第t迭代中所述前一分类模型,使得所述第t-1分类模型输出对每个所述n个学习数据进行癌症分类的第t-1癌症预测值,(ii)参照针对每个所述患者的所述真实数据癌症信息与所述第t-1癌症预测值生成针对每个所述n个学习数据的每个整体残差,(iii)生成使与所述整体残差的相关性最大化的第t决策树,(iv)通过使用所述第t决策树更新所述第t-1分类模型来生成第t分类模型的处理,其中所述t为1以上且t以下的整数;以及(b)所述多种癌症诊断装置将所述特定分层信息与所述特定生物标志物组相关值信息输入到所述诊断模型中,使所述诊断模型通过与所述特定患者的所述特定分层信息对应的特定分类模型输出根据所述特定生物标志物组相关值信息对癌症进行分类的特定癌症信息的处理。

14、所述基本分类模型可以包括第1分类模型,其为使用所有所述生物标志物组相关值信息对癌症进行分类的整体分类模型;第2分类模型,其使用每个所述k个分层变量的生物标志物组相关值信息对癌症进行分类的分层变量分类模型;以及第3分类模型,其使用每个所述分层信息的生物标志物组相关值信息对癌症进行分类的分层信息分类模型。

15、在所述(a)步骤中,所述诊断模型生成装置(i)使用针对每个所述n个学习数据的每个所述残差与预设的第1正则化参数,在第t-1整体分类模型中,以使参照所述残差与所述第1正则化参数生成的整体相关性增大为基准,对第t-1整体决策树进行分支分类,(ii)使用针对每个所述n个学习数据的所述残差与预设的第2正则化参数,在第t-1分层变量分类模型中,以使参照针对每个分层变量的分层变量残差与所述第2正则化参数生成的每个分层变量相关性增大为基准,对第t-1分层变量决策树进行分支分类,(iii)使用针对每个所述n个学习数据的所述残差与预设的第3正则化参数,在第t-1分层信息分类模型中,以使参照针对每个分层信息的分层信息残差与所述第3正则化参数生成的每个分层信息相关性增大为基准,对第t-1分层信息决策树进行分支分类,(iv)可以将所述第t-1整体决策树、所述第t-1分层变量决策树和所述第t-1分层信息决策树中具有最大相关性的特定决策树生成为所述第t决策树。

16、在所述(a)步骤中,所述诊断模型生成装置可以通过对所述第t决策树应用预设权重来更新所述第t-1分类模型,其中所述预设权重为大于0且小于1。

17、根据本发明的另一实施例,还提供一种使用生物标志物组相关值信息来生成用于诊断根据患者分层信息的多种癌症的诊断模型的诊断模型生成装置,其包括:存储器,其存储指令,所述指令用于使用生物标志物组相关值信息来生成用于诊断根据患者分层信息的多种癌症的诊断模型;以及处理器,其根据存储在所述存储器中的指令,使用所述生物标志物组相关值信息来执行生成用于诊断根据所述患者的所述分层信息的多种癌症的所述诊断模型的操作,所述处理器执行如下处理:(i)当获得包括与针对每个患者的k个分层变量对应的分层信息、生物标志物组相关值信息和真实数据癌症信息的n个学习数据时,设置用于使用所述生物标志物组相关值信息根据所述分层信息对癌症进行分类的基本分类模型的初始预测值的处理,其中所述k为1以上的整数,所述n为1以上的整数,所述分层信息由所述k个分层变量中至少两个分层变量生成;以及(ii)通过使用在前一迭代中通过第1迭代至第t迭代更新的前一分类模型生成第1决策树至第t决策树来生成所述诊断模型,其中所述t为1以上的整数,在第1迭代的情况下,所述前一分类模型为所述基本分类模型,在t迭代中,(i)将所述n个学习数据输入到所述第t-1分类模型,即所述第t迭代中所述前一分类模型,使得所述第t-1分类模型输出对每个所述n个学习数据进行癌症分类的第t-1癌症预测值,(ii)参照针对每个所述患者的所述真实数据癌症信息与所述第t-1癌症预测值生成针对每个所述n个学习数据的每个整体残差,(iii)生成使与所述整体残差的相关性最大化的第t决策树,(iv)通过使用所述第t决策树更新所述第t-1分类模型来生成第t分类模型的处理,其中所述t为1以上且t以下的整数。

18、所述基本分类模型可以包括第1分类模型,其为使用所有所述生物标志物组相关值信息对癌症进行分类的整体分类模型;第2分类模型,其使用每个所述k个分层变量的生物标志物组相关值信息对癌症进行分类的分层变量分类模型;以及第3分类模型,其使用每个所述分层信息的生物标志物组相关值信息对癌症进行分类的分层信息分类模型。

19、所述处理器在所述(ii)处理中,(i)使用针对每个所述n个学习数据的每个所述残差与预设的第1正则化参数,在第t-1整体分类模型中,以使参照所述残差与所述第1正则化参数生成的整体相关性增大为基准,对第t-1整体决策树进行分支分类,(ii)使用针对每个所述n个学习数据的所述残差与预设的第2正则化参数,在第t-1分层变量分类模型中,以使参照针对每个分层变量的分层变量残差与所述第2正则化参数生成的每个分层变量相关性增大为基准,对第t-1分层变量决策树进行分支分类,(iii)使用针对每个所述n个学习数据的所述残差与预设的第3正则化参数,在第t-1分层信息分类模型中,以使参照针对每个分层信息的分层信息残差与所述第3正则化参数生成的每个分层信息相关性增大为基准,对第t-1分层信息决策树进行分支分类,(iv)可以将所述第t-1整体决策树、所述第t-1分层变量决策树和所述第t-1分层信息决策树中具有最大相关性的特定决策树生成为所述第t决策树。

20、所述处理器在所述(ii)处理中,可以通过对所述第t决策树应用预设权重来更新所述第t-1分类模型,其中所述预设权重为大于0且小于1。

21、所述处理器可以将所述权重应用于与所述第t决策树对应的第t决策树分类模型,并将应用所述权重的所述第t决策树分类模型与所述第t-1分类模型相加以生成所述第t分类模型。

22、所述处理器在所述(ii)处理中,可以使用针对每个所述n个学习数据的所述真实数据癌症信息与所述第t-1癌症预测值来生成损失,并对所述损失进行微分以生成整体残差。

23、根据本发明的另一实施例,还提供一种使用生物标志物组相关值信息来诊断根据患者分层信息的多种癌症的多种癌症诊断装置,其包括:存储器,其存储指令,所述指令用于使用生物标志物组相关值信息来诊断根据患者分层信息的多种癌症;以及处理器,其根据存储在所述存储器中的指令,使用所述生物标志物组相关值信息来执行生成用于诊断根据所述患者的所述分层信息的多种癌症的操作,所述处理器执行如下处理:(i)在诊断模型生成装置通过如下处理来生成诊断模型的状态下,获得特定患者的特定分层信息与特定生物标志物组相关值信息:当获得包括与针对每个患者的k个分层变量对应的分层信息、生物标志物组相关值信息和真实数据癌症信息的n个学习数据时,设置用于使用所述生物标志物组相关值信息根据所述分层信息对癌症进行分类的基本分类模型的初始预测值的处理,其中所述k为1以上的整数,所述n为1以上的整数,所述分层信息由所述k个分层变量中至少两个分层变量生成;以及通过使用在前一迭代中通过第1迭代至第t迭代更新的前一分类模型生成第1决策树至第t决策树来生成所述诊断模型,其中所述t为1以上的整数,在所述第1迭代的情况下,所述前一分类模型为所述基本分类模型,在t迭代中,(i)将所述n个学习数据输入到所述第t-1分类模型,即所述第t迭代中所述前一分类模型,使得所述第t-1分类模型输出对每个所述n个学习数据进行癌症分类的第t-1癌症预测值,(ii)参照针对每个所述患者的所述真实数据癌症信息与所述第t-1癌症预测值生成针对每个所述n个学习数据的每个整体残差,(iii)生成使与所述整体残差的相关性最大化的第t决策树,(iv)通过使用所述第t决策树更新所述第t-1分类模型来生成第t分类模型的处理,其中所述t为1以上且t以下的整数;以及(ii)将所述特定分层信息与所述特定生物标志物组相关值信息输入到所述诊断模型中,使所述诊断模型通过与所述特定患者的所述特定分层信息对应的特定分类模型输出根据所述特定生物标志物组相关值信息对癌症进行分类的特定癌症信息的处理。

24、所述基本分类模型可以包括第1分类模型,其为使用所有所述生物标志物组相关值信息对癌症进行分类的整体分类模型;第2分类模型,其使用每个所述k个分层变量的生物标志物组相关值信息对癌症进行分类的分层变量分类模型;以及第3分类模型,其使用每个所述分层信息的生物标志物组相关值信息对癌症进行分类的分层信息分类模型。

25、在所述(i)处理中,所述诊断模型生成装置(i)使用针对每个所述n个学习数据的每个所述残差与预设的第1正则化参数,在第t-1整体分类模型中,以使参照所述残差与所述第1正则化参数生成的整体相关性增大为基准,对第t-1整体决策树进行分支分类,(ii)使用针对每个所述n个学习数据的所述残差与预设的第2正则化参数,在第t-1分层变量分类模型中,以使参照针对每个分层变量的分层变量残差与所述第2正则化参数生成的每个分层变量相关性增大为基准,对第t-1分层变量决策树进行分支分类,(iii)使用针对每个所述n个学习数据的所述残差与预设的第3正则化参数,在第t-1分层信息分类模型中,以使参照针对每个分层信息的分层信息残差与所述第3正则化参数生成的每个分层信息相关性增大为基准,对第t-1分层信息决策树进行分支分类,(iv)可以将所述第t-1整体决策树、所述第t-1分层变量决策树和所述第t-1分层信息决策树中具有最大相关性的特定决策树生成为所述第t决策树。

26、在所述(i)处理中,所述诊断模型生成装置可以通过对所述第t决策树应用预设权重来更新所述第t-1分类模型,其中所述预设权重为大于0且小于1。

27、除此之外,本发明还提供一种计算机可读记录介质,其用于记录用于执行本发明方法的计算机程序。

28、本发明可以提供一种诊断模型,所述诊断模型可以通过使用每个患者的生物标志物组相关值信息来最小化方差以针对每分层患者的癌症进行诊断。

29、另外,本发明可以使用用于诊断多种癌症的生物标志物组相关值信息来准确地鉴别每分层患者癌症的类型。

30、另外,本发明可以使用用于诊断多种癌症的生物标志物组相关值信息的统计判别方法来准确地鉴别每分层患者癌症的类型。

31、此外,本发明可以使用用于诊断多种癌症的生物标志物组相关值信息的统计判别方法来提高每分层患者癌症鉴别的可靠性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1