遗传代谢病的辅助诊断预测方法、装置、设备及介质与流程

文档序号:35291042发布日期:2023-09-01 13:22阅读:32来源:国知局
遗传代谢病的辅助诊断预测方法、装置、设备及介质与流程

本申请涉及医疗数据处理,特别涉及为一种遗传代谢病的辅助诊断预测方法、装置、设备及介质。


背景技术:

1、遗传代谢病是指遗传物质突变导致与蛋白质,脂肪等物质代谢相关的酶或者转运蛋白缺陷。它是危害儿童生命、影响儿童体格以及智利发育的先天性遗传疾病。根据临床表现及时发现并治疗是避免患病儿童身心产生不可逆损伤的重要临床需求之一。

2、目前临床上使用串联质谱检测技术来检测多种遗传代谢病,针对质谱检测结果的解读,传统人工判别方式是对单一指标做分析,工作量大且cutoff值(用于衡量的阈值)不明确,假阳性高同时有一定的假阴性率。同时,对遗传代谢罕见病的诊断,缺少权威标准的诊断指南,诊断水平受医疗从业人员专业背景和经验的制约。在这样的背景下,大范围推广串联质谱技术面临挑战。

3、随着医疗信息化时代的演进,大数据背景下的人工智能算法给质谱新生儿遗传代谢病辅助诊断带来了新机遇。临床医学开始使用统计学方法进行遗传代谢病诊断分析,然而对多病种的判别正确率方面不能达到令人满意的程度。c l i r系统是美国mayo诊所开发的一款基于云服务的智能化质谱数据诊断分析平台,该平台技术不透明,且要求共享健康隐私数据,使得技术壁垒和敏感信息管控方面产生隐忧,且目前的模型无法展示参数的作用机制,导致模型可信度低。

4、综上所述,国际医疗数据敏感性的限制且国内质谱遗传代谢病大数据分析平台尚不完善。智能识别解读遗传代谢疾病,成为了解决新生儿早筛及遗传代谢病诊断的技术的重要而紧迫的任务。


技术实现思路

1、基于上述提出的模型准确率低且无法展示参数(特征)对于疾病的作用机制的问题,提出了一种遗传代谢病的辅助诊断预测方法、装置、计算机设备及存储介质。

2、第一方面,本发明提供一种遗传代谢病的辅助诊断预测方法,包括:

3、获取待预测的样本数据,所述待预测的样本数据包括:尿有机酸质谱数据;

4、将所述待预测的样本数据作为第一层模型的输入,所述第一层模型用于预测样本是否为阳性,若为阳性,则将所述待预测的样本数据作为第二层模型的输入,所述第二层模型中包括多个判别器,每个判别器对应一种阳性类型,所述第二层模型用于综合所述多个判别器的输出结果给出预测结果,所述第一层模型和所述第二层模型的训练过程中采用shap特征选择模型辅助进行特征的选择,所述shap特征选择模型用于分析得到每个特征对应的贡献度;

5、获取所述第二层模型输出的预测结果;

6、基于所述预测结果和所述每个特征对应的贡献度进行可视化结果展示,所述可视化结果展示包括:综合特征展示、模型可信性展示和可视化推理展示。

7、第二方面,本发明提供一种遗传代谢病的辅助诊断预测装置,包括:

8、第一获取模块,用于获取待预测的样本数据,所述待预测的样本数据包括:尿有机酸质谱数据;

9、预测模块,用于将所述待预测的样本数据作为第一层模型的输入,所述第一层模型用于预测样本是否为阳性,若为阳性,则将所述待预测的样本数据作为第二层模型的输入,所述第二层模型中包括多个判别器,每个判别器对应一种阳性类型,所述第二层模型用于综合所述多个判别器的输出结果给出预测结果,所述第一层模型和所述第二层模型的训练过程中采用shap特征选择模型辅助进行特征的选择,所述shap特征选择模型用于分析得到每个特征对应的贡献度;

10、第二获取模块,用于获取所述第二层模型输出的预测结果;

11、可视化模块,用于基于所述预测结果和所述每个特征对应的贡献度进行可视化结果展示,所述可视化结果展示包括:综合特征展示、模型可信性展示和可视化推理展示。

12、第三方面,本发明提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上述所述方法的步骤。

13、第四方面,本发明提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述所述方法的步骤。

14、上述遗传代谢病的辅助诊断预测方法,首先通过第一层模型进行阳性预测,当预测为阳性时,采用第二层模型对阳性的类型进行预测,通过构建两层模型大大提高了预测的准确度,且第一层模型和第二层模型在训练的过程中采用shap特征选择模型辅助进行特征的选择,使得特征的选择更优,从而提高了模型预测的准确度和稳定性,另外,s ha p特征选择模型可用于分析得到每个特征对应的贡献度,基于预测结果和每个特征对应的贡献度对结果进行可视化解释,从而实现了可视化展示参数(特征)对于疾病的作用机制,提高了模型的可信度。



技术特征:

1.一种遗传代谢病的辅助诊断预测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述第一层模型的训练过程如下:

3.根据权利要求2所述的方法,其特征在于,所述对所述原始样本集中的样本进行预处理,得到第一训练数据集,包括:

4.根据权利要求3所述的方法,其特征在于,所述第二层模型的训练过程如下:

5.根据权利要求4所述的方法,其特征在于,所述基于所述均衡的第二训练数据集对所述第二层模型进行训练,且采用所述shap特征选择模型辅助进行特征的优化选择,得到训练好的第二层模型,包括:

6.根据权利要求5所述的方法,其特征在于,所述第二层模型的内部基于huber权重函数采用级联权重计算第二层模型中各个子判别器的权重,包括:

7.根据权利要求1所的方法,其特征在于,所述综合特征展示包括:特征影响力展示;所述模型可信性展示包括:阳性召回率和正确率;所述可视化推理展示包括:待预测的样本数据中每个特征的贡献度展示;

8.一种遗传代谢病的辅助诊断预测装置,其特征在于,包括:

9.一种计算机设备,包括存储器和处理器,其特征在于,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。


技术总结
本申请提供了一种遗传代谢病的辅助诊断预测方法、装置、设备及介质,首先通过第一层模型进行阳性预测,当预测为阳性时,采用第二层模型对阳性的类型进行预测;当利用第一层模型预测为阴性或指标异常时,不再对阴性或指标异常样本做进一步处理。通过构建两层模型大大提高了预测的准确度,且第一层模型和第二层模型在训练的过程中采用SHAP特征选择模型辅助进行特征的选择,使得特征的选择更优,从而提高了模型预测的准确度和稳定性,另外,SHAP特征选择模型可用于分析得到每个特征对应的贡献度,基于预测结果和每个特征对应的贡献度对结果进行可视化解释,从而实现了可视化展示参数(特征)对于疾病的作用机制,提高了模型的可信度。

技术研发人员:朱敏,赵蓓蓓,高思远,佘旭辉,李菁,陈秀如,倪周,刘畅,李映华,梁小丹,梁耀铭
受保护的技术使用者:广州金域医学检验中心有限公司
技术研发日:
技术公布日:2024/1/14
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1