一种高血压人群脑卒中风险预测模型的构建方法及系统与流程

文档序号:37426221发布日期:2024-03-25 19:13阅读:14来源:国知局
一种高血压人群脑卒中风险预测模型的构建方法及系统与流程

本发明涉及模型构建,具体而言,涉及一种高血压人群脑卒中风险预测模型的构建方法及系统。


背景技术:

1、脑卒中(stroke)是目前威胁全球人类健康的主要疾病之一,主要表现为急性缺血性脑卒中(acute ischemic stroke,ais)和出血性卒中(intracerebral hemorrhage,ich)。脑卒中具有难治能防的特点,早期筛查及早针对危险因素进行诊治可有效预防脑卒中的发生。高血压是所有类型脑卒中最重要的危险因素,因此,识别高血压患者中脑卒中高危人群对脑卒中的一级预防至关重要。

2、然而,目前,用于评估大脑微血管系统的技术,如颅脑电子计算机断层扫描、磁共振成像和正电子发射断层扫描,存在可用性有限、灵敏度不足、扫描成本高和成像耗时的局限性,不适合用于全民筛查项目。因此,需要更简单和更容易获得的技术来预测脑卒中。目前国际、国内市场上没有专门用于高血压人群脑卒中预警的生物标志物,无法满足临床需求。因此,识别和监测新的卒中生物标志物可能有助于高血压人群卒中的预测。


技术实现思路

1、为了克服上述问题或者至少部分地解决上述问题,本发明提供一种高血压人群脑卒中风险预测模型的构建方法及系统,结合蛋白组学与代谢组学联合分析数据,基于机器学习,构建精准度高的高血压人群脑卒中风险预测模型,以便后续进行精准高效的风险预测。

2、为解决上述技术问题,本发明采用的技术方案为:

3、第一方面,本发明提供一种高血压人群脑卒中风险预测模型的构建方法,包括以下步骤:

4、获取目标高血压人群的非靶向代谢组学检测数据,筛选确定差异表达代谢物数据;

5、获取目标高血压人群的dia蛋白组学检测数据,筛选确定差异表达蛋白质数据;

6、根据预设的生物功能标准对差异表达代谢物数据和差异表达蛋白质数据进行筛选分析,以确定差异代谢物样本数据和差异蛋白质样本数据;

7、对差异代谢物样本数据和差异蛋白质样本数据分别进行标准化处理,并对标准化处理后的差异代谢物样本数据和差异蛋白质样本数据进行归一化处理;

8、对进行标准化和归一化处理后的差异代谢物样本数据和差异蛋白质样本数据进行特征筛选,以确定目标特征变量;

9、利用目标特征变量构建多个分类模型,并对多个分类模型进行模型验证,以确定最终的高血压人群脑卒中风险预测模型。

10、本发明采用蛋白组学与代谢组学联合分析,代谢组学数据与蛋白组的整合可以同时从蛋白水平和代谢水平挖掘生物调控机理,相比单组学分析能更加系统全面地揭示高血压患者发生脑卒中的调控机制,对于后期分子机制模型的建立和临床应用具有很强的指导价值。同时,本发明基于机器学习构建预测模型,可以有效地处理高维数据,通过特征选择、降维等技术有效地挖掘其中的信息,发现与高血压人群发生脑卒中相关的生物标志物,提高预测模型的准确度,有利于高血压人群脑卒中的预防和治疗。

11、基于第一方面,进一步地,上述获取目标高血压人群的非靶向代谢组学检测数据,筛选确定差异表达代谢物数据的方法包括以下步骤:

12、获取目标高血压人群的lc-ms检测数据,并对lc-ms检测数据进行分析,输出分析结果;

13、对分析结果进行预处理,以得到预处理结果,该预处理结果包括化合物分子量、保留时间、峰面积和鉴定结果;

14、对预处理结果进行处理,以得到二维数据矩阵;

15、计算各代谢物在各比较组中的变化倍数,对每个代谢物在各比较组中表达量进行显著性检验,以得到显著性检验结果;

16、利用正交偏最小二乘法判别分析构建监督分类模型得到每个代谢物的变量差异贡献度值;

17、根据预设的筛选条件和每个代谢物的变量差异贡献度值筛选得到目标差异代谢物数据。

18、基于第一方面,进一步地,上述获取目标高血压人群的dia蛋白组学检测数据,筛选确定差异表达蛋白质数据的方法包括以下步骤:

19、基于串联质谱仪,在dia模式采集dia蛋白组学检测数据;

20、根据预设的蛋白质筛选条件对采集的dia蛋白组学检测数据进行筛选,以确定目标差异表达蛋白质数据。

21、基于第一方面,进一步地,上述对进行标准化和归一化处理后的差异代谢物样本数据和差异蛋白质样本数据进行特征筛选的方法包括以下步骤:

22、利用r软件对进行标准化和归一化处理后的差异代谢物样本数据和差异蛋白质样本数据进行最小绝对收缩和选择算子回归分析,并进行十折交叉验证,筛选得到多个特征变量;

23、通过多种分析变量重要性排名的算法分别对多个特征变量进行筛选,确定最终的目标特征变量。

24、基于第一方面,进一步地,上述分类模型包括:logist分类模型、gnb分类模型、rf分类模型、svm分类模型、gboost分类模型与adaboost分类模型。

25、第二方面,本发明提供一种高血压人群脑卒中风险预测模型的构建系统,包括代谢物筛选模块、蛋白质筛选模块、样本筛选模块、数据归一化模块、特征筛选模块以及模型构建模块,其中:

26、代谢物筛选模块,用于获取目标高血压人群的非靶向代谢组学检测数据,筛选确定差异表达代谢物数据;

27、蛋白质筛选模块,用于获取目标高血压人群的dia蛋白组学检测数据,筛选确定差异表达蛋白质数据;

28、样本筛选模块,用于根据预设的生物功能标准对差异表达代谢物数据和差异表达蛋白质数据进行筛选分析,以确定差异代谢物样本数据和差异蛋白质样本数据;

29、数据归一化模块,用于对差异代谢物样本数据和差异蛋白质样本数据分别进行标准化处理,并对标准化处理后的差异代谢物样本数据和差异蛋白质样本数据进行归一化处理;

30、特征筛选模块,用于对进行标准化和归一化处理后的差异代谢物样本数据和差异蛋白质样本数据进行特征筛选,以确定目标特征变量;

31、模型构建模块,用于利用目标特征变量构建多个分类模型,并对多个分类模型进行模型验证,以确定最终的高血压人群脑卒中风险预测模型。

32、本系统通过代谢物筛选模块、蛋白质筛选模块、样本筛选模块、数据归一化模块、特征筛选模块以及模型构建模块等多个模块的配合,结合蛋白组学与代谢组学联合分析数据,基于机器学习,构建精准度高的高血压人群脑卒中风险预测模型,以便后续进行精准高效的风险预测。本发明采用蛋白组学与代谢组学联合分析,代谢组学数据与蛋白组的整合可以同时从蛋白水平和代谢水平挖掘生物调控机理,相比单组学分析能更加系统全面地揭示高血压患者发生脑卒中的调控机制,对于后期分子机制模型的建立和临床应用具有很强的指导价值。同时,本发明基于机器学习构建预测模型,可以有效地处理高维数据,通过特征选择、降维等技术有效地挖掘其中的信息,发现与高血压人群发生脑卒中相关的生物标志物,提高预测模型的准确度,有利于高血压人群脑卒中的预防和治疗。

33、第三方面,本技术提供一种电子设备,其包括存储器,用于存储一个或多个程序;处理器;当一个或多个程序被处理器执行时,实现如上述第一方面中任一项的方法。

34、第四方面,本技术提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一项的方法。

35、本发明至少具有如下优点或有益效果:

36、1、采用蛋白组学与代谢组学联合分析,代谢组学数据与蛋白组的整合可以同时从蛋白水平和代谢水平挖掘生物调控机理,相比单组学分析能更加系统全面地揭示高血压患者发生脑卒中的调控机制,对于后期分子机制模型的建立和临床应用具有很强的指导价值。

37、2、基于机器学习构建预测模型,可以有效地处理高维数据,通过特征选择、降维等技术有效地挖掘其中的信息,发现与高血压人群发生脑卒中相关的生物标志物,提高预测模型的准确度,有利于高血压人群脑卒中的预防和治疗。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1