一种基于XGBoost预测DVT后PTS发生风险的系统

文档序号:33912205发布日期:2023-04-21 15:36阅读:64来源:国知局
一种基于XGBoost预测DVT后PTS发生风险的系统

本发明涉及一种基于xgboost预测dvt后pts发生风险的系统。


背景技术:

1、血栓后综合征(postthrombotic syndrome,pts)是下肢深静脉血栓(deep venousthrombosis,dvt)发生后最常见的长期并发症之一,即使在治疗dvt过程中使用抗凝,pts在两年内仍有20-50%的发生率。pts的发生原因与其他形式的cvi相同,都是由残余静脉阻塞和/或瓣膜损伤所致动态静脉高压引起的。pts的临床症状因人而异,可表现为下肢沉重感、疼痛、水肿、瘙痒和痉挛,这些症状在站立或行走时往往加重,在休息和卧床时则有所改善,约5%-10%的患者表现为严重的疼痛、顽固性水肿及静脉性溃疡等严重pts症状。pts不会对患者的生命造成威胁,但随着病情的恶化,患者生活质量也会受到负面影响,其影响与其他疾病如心衰或糖尿病等慢性疾病相当。此外,相较于没有pts的情况,(严重)pts发生的医疗和总费用高3倍。总之,pts发生不仅使患者的经济负担加重,还会严重降低患者的生活质量。然而,现有pts治疗方案有限,预防仍然是降低该病发病率、减小该病对患者生活质量的影响以及降低该病治疗成本的关键措施。由于pts的形成机制复杂,危险因素较多,预判pts的可能形成仍较困难。先前的研究提出了相关预测pts形成的评分模型,但部分纳入病人较少,或者模型性能未尽人意(模型区分度指标曲线下面积auc未达到0.7)。如今在心血管领域有越来越多的研究使用机器学习进行数据分析和建模应用,但其能否辅助预测dvt后pts的形成仍留有空白。

2、现有技术中,rabinovich等人开发了首个预测pts的临床预测分数,即sox-pts评分模型,开发队列包括762名患者,内部验证所得一致性指数为0.65。并在后续研究中使用来自attract研究的691名患者对sox-pts模型进行外部验证,所得一致性指数为0.63。

3、limacher等人开发了一个预测老年患者dvt后pts形成风险的模型,模型中包括11个预测变量,开发队列包括276名患者。使用bootstrap方法进行内部验证,所得auc为0.77。

4、hao huang等人开发了aptsd评分模型,其中开发队列包括107名患者,验证队列包括102名患者。aptsd评分的准确性在开发队列中为81.7%,在验证队列中为82.5%。

5、elham e.amin等人开发了两步法模型预测pts,其中开发和验证队列分别包括479名和1107名患者,开发队列中,基线模型auc值为0.71,二级模型auc值为0.6。验证队列中,基线模型auc值为0.66,二级模型auc值为0.64。

6、现有方法的缺点:

7、1.现有方法中,sox-pts评分模型和两步法模型的预测能力没有达到很好的效果。

8、2.limacher等人开发的预测老年患者pts发生模型纳入样本量较少,全为65岁及以上患者,且缺少外部验证,可能限制该模型使用的普遍性。

9、3.aptsd模型纳入样本量较少,且模型开发、验证队列均来自南京第一医院,可能限制该模型使用的普遍性。且该研究仅报告模型的准确性,而未报告其他模型性能指标,准确性受样本的分布影响大,无法全面展示该模型的特点。

10、4.现有的4个方法均为评分系统,无法准确获取pts发生的概率。


技术实现思路

1、目前还未发展出一个预测能力更好,能获取pts发生概率的模型。本发明提供了一种基于xgboost预测dvt后pts发生风险的系统,通过端到端机器学习模型对所有dvt患者进行临床评估以识别pts发生风险,为患者提供优化的治疗与预防策略,以延缓或预防pts的发生。

2、为实现上述目的,所采取的技术方案:

3、一种基于xgboost预测dvt后pts发生风险的系统,其特征在于,包括:

4、数据输入模块,用于将dvt患者临床特征检测结果输入模型计算模块,所述模块采集的信息包括以下临床特征:是否联合应用pcdt与抗凝治疗;dvt类型;年龄;性别;是否患高血压;是否患糖尿病;是否存在高胆固醇;是否患哮喘;是否患慢性阻塞性肺疾病;是否患心肌梗死;是否患心力衰竭;身高;体重;bmi;发生dvt下肢;先前是否发生vte;是否进行大手术;是否接受住院治疗;是否使用石膏模;是否生育;是否住院时发生dvt;是否服用阿司匹林;基线villalta评分;

5、模型计算模块,包括xgboost模型,用于根据dvt患者临床特征检测结果以及xgboost模型计算dvt患者评分结果;所述xgboost模型公式如下:

6、

7、其中yi为预测值,k表示树的数量,xi表示第i个样本,将k棵树的输出加权求和即为xgboost模型的最终预测值;其模型训练函数如下:

8、

9、其中,第1项为损失函数,表示第i个样本的预测误差;第2项为正则化项,规范模型复杂度以防止过拟合;

10、结果输出模块,用于根据模块输出预测概率判定dvt患者发生pts的风险;当dvt患者预测概率大于40%,判定该dvt患者为pts发生高风险组;当dvt患者预测概率小于30%,判定该dvt患者为pts发生低风险组;当dvt患者预测概率为30%到40%,判定该dvt患者为pts发生中风险组。

11、有益效果:

12、本发明提供了一种基于xgboost(extreme gradient boosting)预测dvt后pts发生风险的系统。本发明通过端到端机器学习模型,对所有dvt患者个体进行pts发生风险预测,通过对不同风险等级的患者使用优化的预防与治疗策略,更有效地预防和延缓患者院内或出院后pts的形成。

13、此系统能较好地发挥优势以弥补前人研究的不足,操作简便、快捷,预测性能更好,同时可根据患者pts发生概率选择更适合患者个体的预防与治疗策略。

14、与rabinovich等人的sox-pts评分模型相比,本发明系统在内外部验证集中都表现出更好的预测能力。与limacher等人的老年人pts发生预测模型相比,本发明系统在构建时开发队列样本量更大,且使用外部验证,模型泛化能力更强。与haohuang等人的aptsd评分模型相比,本发明系统在构建时纳入样本量更多,且系统开发、验证队列分别来自美国和中国,系统使用的普遍性更强。与现有的4个评分系统相比,本发明系统能够进一步获取pts发生的概率,为临床医生预判pts的发生提供更高效准确的方法和依据,并根据预测概率为dvt患者提供优化的治疗与预防策略。



技术特征:

1.一种基于xgboost预测dvt后pts发生风险的系统,其特征在于,包括:


技术总结
本发明提供了一种基于XGBoost(Extreme Gradient Boosting)预测DVT后PTS发生风险的系统,包括:数据输入模块,模型计算模块,结果输出模块。本发明通过端到端机器学习模型,对所有DVT患者个体进行PTS发生风险预测,通过对不同风险等级的患者使用优化的预防与治疗策略,更有效地预防和延缓患者院内或出院后PTS的形成。此系统能较好地发挥优势以弥补前人研究的不足,操作简便、快捷,预测性能更好,同时可根据患者PTS发生概率选择更适合患者个体的预防与治疗策略。

技术研发人员:黄楷,吕琳,沈润楠,尤国昌,徐嘉堂,陈雄
受保护的技术使用者:中山大学孙逸仙纪念医院
技术研发日:
技术公布日:2024/1/11
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1