建立慢性心力衰竭患者共病情绪障碍早期预警模型的方法

文档序号:29076137发布日期:2022-03-01 22:48阅读:122来源:国知局

1.本发明涉及智能机器学习和数据处理技术领域,特别涉及慢性心力衰竭患者相关数据处理和预警模型构建,具体涉及建立慢性心力衰竭患者共病情绪障碍早期预警模型的方法。


背景技术:

2.慢性心力衰竭呈现高患病率、高住院率、高病死率及社会经济负担重的态势,使其正在成为中国严重的公共卫生问题。慢性心力衰竭不仅给患者带来了躯体的疼痛与不适,同时也给患者及其家庭带来了巨大的精神心理压力,患者甚至出现情绪障碍。中国患者伴抑郁的meta分析显示发病率大约在40.1%。前期研究发现合并中重度抑郁症的慢性心力衰竭患者比无合并抑郁患者死亡风险高4.9倍,因此,情绪障碍不仅会对慢性心力衰竭患者疾病的发生发展、治疗效果、生活质量造成影响,同时可增加再住院率及死亡率,影响患者预后。
3.近年来,医疗数据与人工智能地不断积累与发展为心力衰竭和情绪障碍患者管理提供了有力的资源和手段。中国专利111063453通过云端平台收集患者的日常生理数据,提出了统一描述海量医疗数据特性并满足复杂语义的心电数据关联关系分析和基于时间序列的生理指标相似性评估策略,从而进行心力衰竭的早期检测和预警。
4.中国专利109394203是一种采用心电传感器釆集患者的心电信号,肌电传感器釆集患者的肌电信号,语音收集组件采集患者周围的语音信号;控制器通过通讯组件将采集到的心电信号、肌电信号传输到智能终端,进行预处理与相应特征值提取,获得情绪相关特征值,与预设的情绪识别模型进行比对,得到实时情绪状态的监测方法。中国专利107922485是一种通过检测来自个体的生物样品中结缔组织生长因子(ctgf)的表达水平来确定个体是否患有情绪障碍或处于发展为情绪障碍的风险中的诊断方法。
5.上述几种方法都没有涉及慢性心力衰竭患者共病情绪障碍的问题,忽略了这方面的研究。慢性心力衰竭患者共病情绪障碍的影响因素涉及人口、生化、免疫、神经调节、社会心理等多方面,在早期进行风险因素综合分析和早期预警干预显得非常重要。目前我国尚无关于慢性心力衰竭患者共病情绪障碍的早期、智能、科学的预警系统。


技术实现要素:

6.本发明的主要目的在于提供一种建立慢性心力衰竭患者共病情绪障碍早期预警模型的方法,利用机器学习技术和大数据处理,建立慢性心力衰竭患者共病情绪障碍早期预警模型,为慢性心力衰竭患者共病情绪障碍早期干预通过切实可行的依据。
7.为了实现上述目的,根据本发明具体实施方式的一个方面,提供了一种建立慢性心力衰竭患者共病情绪障碍早期预警模型的方法,其特征在于,包括如下步骤:
8.a、构建慢性心力衰竭患者抑郁和焦虑风险指标体系;
9.该步骤包括基本信息收集及量表评估:
10.所述基本信息包括社会人口学资料、疾病相关信息、生化指标和物理检查结果;
11.所述量表包括抑郁自评量表、焦虑自评量表和明尼苏达心力衰竭生活质量问卷表;
12.b、构建慢性心力衰竭患者共病情绪障碍的风险综合评估与预警模型;
13.该步骤包括数据采集和预警模型构建;
14.所述数据采集包括数据来源选择、数据选取和数据处理;
15.所述预警模型构建包括以总体样本的一定百分比作为样本集,通过机器学习和大数据处理建立预警模型。
16.进一步的,所述社会人口学资料包括患者年龄、性别、文化程度、婚姻状况、吸烟史、饮食习惯、运动习惯、收入水平、社会支持;所述疾病相关信息包括患者身高、体重及身体质量指数;心衰病程、主要心血管疾病及所患其他非心血管疾病病史、心功能分级;所述生化指标和物理检查结果包括bnp、血红蛋白、总胆红素、总胆固醇、高密度脂蛋白胆固醇、心率变异性、左心室内径、左心房内径、左心室射血分数;b型钠尿肽、氨基末端脑钠肽前体、超敏c反应蛋白、可溶性st2。
17.进一步的,所述数据来源包括病历档案、历史数据记录;所述数据选取是以spark平台为主进行交互查询和数据分析,oracle数据库作为辅助探查与数据验证;所述数据处理,采用spark的核心抽象数据集合rdd的函数式操作编程和spark sql组件中date frame对象的结构化编程,并以spark sql语言实现数据的抽取任务。
18.进一步的,所述数据处理进一步包括数据预处理、数据清洗、数据集成、数据变换、数据规约,筛选出与相关的数据.
19.进一步的,所述预警模型构建具体为,以总体样本的70%作为样本集,基于慢性心力衰竭共病情绪障碍事件,利用spark mllib库,分别采用logistic回归、朴素贝叶斯两类分类模型算法,以auc值选取最优的模型,建立1年时长的风险预警模型。
20.进一步的,述预警模型构建包括构建多因素logisitc回归模型,通过贝叶斯定理求出后验最大概率,确定风险预警临界点及制定预警机制。
21.根据本发明技术方案及其在某些实施例中进一步改进的技术方案,本发明具有如下有益效果:
22.本发明针对危险因素,采用数据挖掘,筛选出主要的风险因子,并建立严谨的风险预警系统,能够达到早期发现、有效预防,对慢性心力衰竭患者情绪障碍的防控具有指导性作用及实际意义。
具体实施方式
23.需要说明的是,在不冲突的情况下,本技术中的具体实施方式、实施例以及其中的特征可以相互组合。
24.为了使本领域技术人员更好的理解本发明方案,下面将结合本发明具体实施方式及实施例,对本发明的技术方案进行清楚、完整的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的具体实施方式、实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施方式、实施例,都应当属于本发明保护的范围。
25.本发明的建立慢性心力衰竭患者共病情绪障碍早期预警模型的方法,能够实现对患者情绪障碍风险快速早期的评估、预警,从而进行早期的预防和干预。技术方案包括:

慢性心力衰竭患者抑郁和焦虑风险指标体系构建;

慢性心力衰竭患者共病情绪障碍的风险综合评估与预警模型构建。
26.慢性心力衰竭患者抑郁和焦虑风险指标体系构建
27.①
慢性心力衰竭患者抑郁和焦虑的发生率、影响因素研究。对符合研究纳入标准患者于入院后第1-2日待病情稳定后进行基本信息收集及量表评估。
28.社会人口学资料a,包括:a1——患者年龄、a2——性别、a3——文化程度、a4——婚姻状况、a5——吸烟史、a6——饮食习惯、a7——运动习惯、a8——收入水平、a9——社会支持;
29.疾病相关信息b,包括:b1——身高、b2——体重、b3——身体质量指数;b4——心衰病程、b5——主要心血管疾病病史、b6——他非心血管疾病病史、b7——心功能分级;
30.生化指标和物理检查结果c,包括:c1——b型钠尿肽(b-type natriuretic peptide,bnp、c2——血红蛋白、c3——总胆红素、c4——总胆固醇、c5——高密度脂蛋白胆固醇、c6——心率变异性、c7——左心室内径、c8——左心房内径、c9——左心室射血分数、c10——e/e'、c11——氨基末端脑钠肽前体(n-terminal-probnp,nt-probnp)、c12——超敏c反应蛋白(hypersensitive c-reactive protein,hs-crp)、c13——可溶性st2(soluble st2,s st2);
31.抑郁自评量表d;
32.焦虑自评量表f;
33.明尼苏达心力衰竭生活质量问卷g。
34.采用spss23.0统计软件对所有数据进行统计学处理,得到慢性心力衰竭患者情绪障碍的危险因素。
35.②
构建慢性心力衰竭患者抑郁和焦虑风险指标体系。
36.先将患者数据进行离散化分类,再构建决策表,最后基于信息熵算法对决策表属性约简筛选出风险指标。
37.(1)离散化分类:设dis=(fmax-fmin)/3,fmax对应指标的最大值,fmin对应指标的最小值;将需离散化的指标(包括:a2、a3、a4、a5、a6、a7、a8、a9、b5、b6、b7)分为3类,1表示(fmin+2
×
dis,fmax),2表示(fmin+dis,fmin+2
×
dis),3表示(fmin,fmin+dis)。
38.(2)构建决策表:包含对象集(研究样本,u={x1,x2,...,xn},其中x1,x2,...,xn代表样本中的每一个样本)、属性集(条件属性c={f1,f2,...,fn},即各项风险指标,其中f1,f2,...,fn代表样本各个指标,即a-g指标;决策属性集d={d1,d2,...,dn},即拟参与的研究对象是否发生抑郁和焦虑;d1,d2,...,dn代表每个研究对象是否发生抑郁和焦虑,即结局),这里的n为样本数量。
39.(3)决策表属性约简:从原始变量集(包括a~g所有数据)中,排除空值率(空值数量/总数量)》80%的变量,对剩余变量进行约简。
40.(4)专家咨询最终确定风险指标:邀请在慢病管理、心血管疾病、心理咨询、护理管理等相关工作领域有10年以上工作经验、本科及以上学历、高级职称的15名专家以现场访谈的形式参加慢性心力衰竭患者抑郁和焦虑风险指标的研讨以最终制定指标内容。
41.实施例
42.慢性心力衰竭患者共病情绪障碍预警模型构建
43.①
数据采集与处理。a.数据来源:四川省某三级甲等医院病历档案,历史数据共涉及5万份,总计超过9000万条医疗数据记录。b.数据选取:根据大数据特点,以spark平台为主进行交互查询和数据分析,oracle数据库作为辅助探查与数据验证。本研究中数据处理主要以慢性心力衰竭和慢性心力衰竭引起的情绪障碍方面作为研究目标,以医学知识为指导,丢弃与挖掘目标毫不相关的字段属性。c.数据处理:采用spark的核心抽象数据集合rdd的函数式操作编程和spark sql组件中date frame对象的结构化编程,并以spark sql语言实现数据的抽取任务。再经过数据预处理、数据清洗、数据集成、数据变换、数据规约,筛选出与本研究相关的数据。
44.②
预警模型构建:以总体样本的70%作为样本集,基于慢性心力衰竭共病情绪障碍事件,利用spark mllib库,分别采用logistic回归,选取最优的模型,建立1年时长的风险预警模型。
45.构建多因素logisitc回归模型:以是否发生抑郁和焦虑为因变量,将慢性心力衰竭患者共病情绪障碍的风险指标作为自变量纳入到logistic回归模型中,从而估计各危险因素的回归系数、相对危险度及其95%可信区间。
46.对危险因素进行分类并确定每个分类的值:连续变量切割分组,以组中值作为参考值;分类变量设置哑变量,编码0,1化。
47.确定所有危险因素的基础风险参考值:若患者某个危险因素取值为此值,则危险打分为0,打分越高,风险越高。
48.计算每一危险因素的分类距离基础风险的距离d:以某一回归系数为单位乘以组间距来衡量。
49.设定打1分的单位距离b。
50.给每一危险因素的分类打分,分值=d/b。
51.③
风险预警临界点的确定及制定预警机制
52.通过灵敏度和特异度确定最大约登指数,以确定抑郁和焦虑发生的临界点,本例中选择3个临界点(a、b、c),并通过德尔菲法最终确定抑郁和焦虑发生的预测概率,达到a的得分为低危预警、b为中危预警、c为高危预警及各预警等级的干预方法。
53.专家筛选标准:慢病管理、心血管疾病、心理咨询、护理管理等相关工作领域有10年以上工作经验、本科及以上学历、高级职称、对本项目具有较高的积极性,能及时反馈函询结果及解答问题;专家人数≥15名,经2-4轮专家咨询完成预警机制的制定。
54.灵敏度、特异度和约登指数三个指标是用于对筛检方法的真实性进行的评价的指标。
55.灵敏度是又称敏感度,是指筛检方法能将实际有病的人正确地判定为患者的比例;
56.特异度是指筛检方法能将实际无病的人正确地判定为非患者的比例;
57.约登指数(youden index):也称正确指数,是评价筛查试验真实性的方法,假设其假阴性(漏诊率)和假阳性(误诊率)的危害性同等意义时,即可应用约登指数。约登指数是灵敏度与特异度之和减去1。表示筛检方法发现真正的患者与非患者的总能力。指数越大说
明筛查实验的效果越好,真实性越大。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1