本发明属于医疗数据处理领域,一种基于体检数据的多目标集成学习恶性肿瘤风险预警的方法。
背景技术:
1、本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
2、
3、恶性肿瘤患者治疗时间较长、费用较高,住院次数也较多,这些均给患者及其家庭成员带来了巨大的经济与心理压力,也对医疗卫生服务系统、国民经济与社会发展造成了沉重负担。
4、如果能利用基本的体检指标,建立人工智能风险评估模型,识别某些肿瘤高危特征的人群,再针对高危人群投放肿瘤筛查资源,是一种经济高效的提高肿瘤的早诊早治效果的方法。
技术实现思路
1、为了解决上述问题,本发明一种基于体检数据的多目标集成学习恶性肿瘤风险预警的方法,利用常见的体检数据建立多目标集成学习风险预警模型,通过对敏感度和特异性两个目标的寻优计算,提高了预警的精度和鲁棒性,创新了恶性肿瘤预警方式。
2、为了实现上述目的,本发明采用如下技术方案:
3、采集临床数据构建样本集;
4、选择年龄、性别以及体检中常用数据作为样本特征,包括血常规、肝功生化、肾功生化、尿常规、肿瘤标志物;
5、对样本集进行数据预处理,选取训练集、验证集;
6、使用多种不平衡样本机器学习算法构建子模型;
7、使用多目标优化的集成学习算法建立多个恶性肿瘤风险预警模型;
8、利用风险预警模型计算恶性肿瘤风险。
1.一种基于体检数据的多目标集成学习恶性肿瘤风险预警的方法,其特征在于,包括:
2.如权利要求1所述的一种基于体检数据的多目标集成学习恶性肿瘤风险预警的方法,其特征在于,学习样本中分为健康人群和恶性肿瘤患者两类人群,数量比例为10:1;健康人群中也包括了非恶性肿瘤的其他常见疾病人群;样本分为训练集和验证集。
3.如权利要求2所述的一种基于体检数据的多目标集成学习恶性肿瘤风险预警的方法,其特征在于,对训练集使用多种不平衡样本机器学习算法建立多个恶性肿瘤风险预警子模型。
4.如权利要求3所述的一种基于体检数据的多目标集成学习恶性肿瘤风险预警的方法,其特征在于,通过集成算法合并子模型,通过权重系数控制每个子模型的权重,权重系数的和为1。
5.如权利要求4所述的一种基于体检数据的多目标集成学习恶性肿瘤风险预警的方法,其特征在于,以验证集的敏感度和特异性为两个目标,通过多种多目标优化算法计算子模型权重系数,将多种算法结果相比较,确定多目标pareto最优前沿对应的权重系数。
6.如权利要求5所述的一种基于体检数据的多目标集成学习恶性肿瘤风险预警的方法,其特征在于,根据pareto最优前沿对应的子模型权重系数生成多个恶性肿瘤风险预警模型。
7.如权利要求6所述的一种基于体检数据的多目标集成学习恶性肿瘤风险预警的方法,其特征在于,单独建立只包含60岁以上老年人的样本训练集和验证集,并生成恶性肿瘤风险预警模型,以提高老年人恶性肿瘤风险预警的准确性。