一种门静脉血栓预测模型的构建方法及预测系统

文档序号:37267289发布日期:2024-03-12 20:52阅读:15来源:国知局
一种门静脉血栓预测模型的构建方法及预测系统

本发明涉及医疗信息数据处理,尤其涉及一种门静脉血栓预测模型的构建方法及预测系统。


背景技术:

1、门静脉血栓是指门静脉主干和肝内门静脉分支存在血栓,是肝硬化的常见并发症。然而,肝硬化患者非肿瘤性门静脉血栓的发展通常是无症状的。早期筛查和识别门静脉血栓患者的高危因素,进行规范化管理尤为重要。

2、现有技术中,医疗人员通过自身经验对肝硬化患者的临床数据进行人为的主观判断,实现对肝硬化患者罹患门静脉血栓风险的预测。然而,通过主观判断或者简单的多元线性回归,不仅效率低下,预测准确率不尽人意,判断本身也存在诊断主观差异性。

3、所以,构建一种辅助医疗人员进行诊治的门静脉血栓预测模型并将其用于预测肝硬化患者中的门静脉血栓风险非常有必要。


技术实现思路

1、本发明提供一种门静脉血栓预测模型的构建方法及门静脉血栓风险预测系统,用以解决现有技术依赖个人经验对肝硬化患者罹患门静脉血栓风险的预测准确性低的缺陷。

2、本发明提供一种门静脉血栓预测模型的构建方法,包括:

3、得到肝硬化人群带标签的临床数据,所述标签为肝硬化人群是否罹患门静脉血栓的属性标签;

4、对带标签的临床数据进行预处理,得到数值型数据、组合型数据、图像特征数据;

5、将数值型数据、组合型数据、图像特征数据进行合并,得到肝硬化人群的带标签病例特征;

6、根据肝硬化人群的带标签病例特征,训练得到门静脉血栓预测模型。

7、根据本发明提供的一种门静脉血栓预测模型的构建方法,所述临床数据包括:流行病学数据、病史数据、肝硬化数据、静脉数据、既往脾切除或脾栓塞史、脑血管数据、血液生化数据、影像学数据、信息采集时间数据;其中,所述流行病学数据包括至少以下各项:人口学资料、吸烟史、饮酒史,所述病史数据包括以下任一项或其任意组合:是否罹患糖尿病、是否患有高血压、是否患有冠心病,所述肝硬化数据包括以下任一项或其任意组合:肝硬化病因、初次诊断肝硬化时间、肝脏疾病的严重程度,所述静脉数据包括以下任一项或其任意组合:门静脉直径(diameter of the portal vein,dpv)、门静脉流速(portal veinvelocity)、脾静脉内径(diameter of splenic vein,dsv)、食管静脉曲张破裂出血史、既往内镜结扎史、既往内镜硬化治疗史,所述既往脾切除或脾栓塞史包括以下任一项或其任意组合:无既往脾切除、门脾静脉断流术、脾动脉栓塞、脾动脉结扎术,所述脑血管数据包括以下任一项或其任意组合:无脑血管病、脑动脉粥样硬化、脑白质脱髓鞘、脑内多发微出血灶、腔隙性脑梗死,所述血液生化参数包括以下任一项或其任意组合:肝功能参数、肾功能参数、血常规参数、凝血功能参数、c-反应蛋白(crp),所述影像学数据包括以下任一项或其任意组合:肝脏的超声图像、ct图像、mri图像。

8、根据本发明提供的一种门静脉血栓预测模型的构建方法,所述人口学资料包括以下任一项或其任意组合:年龄、性别、身高、体重、体重指数(body mass index,bmi),所述肝硬化病因为以下任一项:乙型肝炎病毒(hbv)、丙型肝炎病毒(hcv)、酒精性(alcohol)、自身免疫(autoimmune)、其他(other),所述肝脏疾病的严重程度包括以下任一项或其任意组合:child-pugh等级、meld评分,所述肝功能参数包括以下任一项或其任意组合:丙氨酸氨基转移酶(alanine aminotransaminase,alt)、天冬氨酸氨基转移酶(aspartateaminotransaminase,ast)、血清总胆红素(serum total bilirubin,tbil)、血清总蛋白(serum total protein,tp),血清白蛋白(serum albumin,alb),所述肾功能参数包括以下任一项或其任意组合:血尿素氮(blood urea nitrogen,bun)、血清肌酐(serumcreatinine,scr),所述血常规参数包括以下任一项或其任意组合:白细胞(white bloodcells,wbc)、血红蛋白(hemoglobin,hb)、血小板(platelet,plt)、中性粒细胞计数(neutrophil count,n)、淋巴细胞计数(lymphocyte count,l)、中性粒细胞与淋巴细胞比率(neutrophil to lymphocyte ratio,nlr)、单核细胞与淋巴细胞比值(monocyte-to-lymphocyte ratio,mlr)、血小板与淋巴细胞比率(platelet to lymphocyte ratio,plr),所述凝血功能参数包括以下任一项或其任意组合:凝血活酶时间(thromboplastin time,tt)、凝血酶原时间(prothrombin time,pt)、凝血活酶活性(prothrombin activity,pta)、国际标准化比值(international normalized ratio,inr)、活化部分凝血活酶时间(activated partial thromboplastin time,aptt)、纤维蛋白原(fibrinogen,fib)、d-二聚体(d-dimer)。

9、根据本发明提供的一种门静脉血栓预测模型的构建方法,所述对带标签的临床数据进行预处理,得到数值型数据、组合型数据、图像特征数据,包括:

10、对临床数据中的数值数据进行缺失值填充处理,并对临床数据中的自然语言描述进行数值化处理,得到数值型数据;

11、对临床数据中的各种数据进行组合计算,形成新临床数据,作为组合型数据;

12、对临床数据中的影像学数据进行特征提取,得到图像特征数据。

13、根据本发明提供的一种门静脉血栓预测模型的构建方法,通过以下任一项或其任意组合进行缺失值填充处理:平均值填充法、热卡填充法、k最近邻填充法,通过独热编码法或者序号编码法进行数值化处理,通过以下任一项卷积神经网络算法或其任意组合进行特征提取:vgg16、vgg19、msranet、resnet、inception resnet、inception v1、inception v2、inceptionv3、inception v4、nin、googlenet。

14、根据本发明提供的一种门静脉血栓预测模型的构建方法,通过特征融合或特征拼接实现将数值型数据、组合型数据、图像特征数据进行合并,得到肝硬化人群的带标签病例特征。

15、根据本发明提供的一种门静脉血栓预测模型的构建方法,所述根据肝硬化人群的带标签病例特征,训练得到门静脉血栓预测模型,包括:

16、对带标签病例特征进行正负样本平衡化处理;

17、基于平衡化后的带标签病例特征,采用机器学习算法,训练得到门静脉血栓预测模型;

18、其中,通过以下任一项或其任意组合进行正负样本平衡化处理:随机欠采样法、基于k最近邻聚类的欠采样法、基于亲和力传播聚类的欠采样法,机器学习算法包括以下任一项或其任意组合:支持向量机、决策树、随机森林、极限树、lightgbm、gbdt、xgboost、逻辑回归、多层感知机。

19、本发明还提供一种门静脉血栓预测模型的构建系统,包括:

20、样本数据获取模块,用于:得到肝硬化人群带标签的临床数据,所述标签为肝硬化人群是否罹患门静脉血栓的属性标签;

21、第一预处理模块,用于:对带标签的临床数据进行预处理,得到数值型数据、组合型数据、图像特征数据;

22、第一合并模块,用于:将数值型数据、组合型数据、图像特征数据进行合并,得到肝硬化人群的带标签病例特征;

23、模型训练模块,用于:根据肝硬化人群的带标签病例特征,训练得到门静脉血栓预测模型。

24、本发明还提供一种门静脉血栓预测系统,包括:

25、待测数据获取模块,用于:得到待测者的临床数据,待测者为肝硬化患者;

26、第二预处理模块,用于:对临床数据进行预处理,得到数值型数据、组合型数据、图像特征数据;

27、第二合并模块,用于:将数值型数据、组合型数据、图像特征数据进行合并,得到待测者的病例特征;

28、预测模块,用于:根据待测者的病例特征,通过上述任一项所述门静脉血栓预测模型,得到待测者是否罹患门静脉血栓的预测结果。

29、本发明还提供一种电子设备,包括处理器和存储有计算机程序的存储器,其特征在于,所述处理器执行所述计算机程序时实现如下步骤:

30、得到待测者的临床数据,待测者为肝硬化患者;

31、对临床数据进行预处理,得到数值型数据、组合型数据、图像特征数据;

32、将数值型数据、组合型数据、图像特征数据进行合并,得到待测者的病例特征;

33、根据待测者的病例特征,通过上述任一项所述门静脉血栓预测模型,得到待测者是否罹患门静脉血栓的预测结果。

34、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如下步骤:

35、得到待测者的临床数据,待测者为肝硬化患者;

36、对临床数据进行预处理,得到数值型数据、组合型数据、图像特征数据;

37、将数值型数据、组合型数据、图像特征数据进行合并,得到待测者的病例特征;

38、根据待测者的病例特征,通过上述任一项所述门静脉血栓预测模型,得到待测者是否罹患门静脉血栓的预测结果。

39、本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行如下步骤:

40、得到待测者的临床数据,待测者为肝硬化患者;

41、对临床数据进行预处理,得到数值型数据、组合型数据、图像特征数据;

42、将数值型数据、组合型数据、图像特征数据进行合并,得到待测者的病例特征;

43、根据待测者的病例特征,通过上述任一项所述门静脉血栓预测模型,得到待测者是否罹患门静脉血栓的预测结果。

44、本发明提供的一种门静脉血栓预测模型的构建方法及门静脉血栓风险预测系统,对带标签的临床数据进行预处理,得到数值型数据、组合型数据、图像特征数据并将它们综合成肝硬化人群的带标签病例特征,结合机器学习算法训练得到门静脉血栓预测模型,通过门静脉血栓预测模型能够高效、准确地预测肝硬化患者是否罹患门静脉血栓,避免占用医疗人员大量的时间和精力去依赖个人经验进行诊治的同时还无法保证决策准确性,医疗人员可以根据门静脉血栓预测模型的预测结果对真正需要门静脉血栓诊治的肝硬化患者进行及时和可靠的诊断及治疗,提高问诊速度,一定程度上解决百姓看病难的问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1