一种术前基于睡眠阶段数据的术后肺部并发症概率预测方法与流程

文档序号:33427113发布日期:2023-03-11 04:31阅读:85来源:国知局
一种术前基于睡眠阶段数据的术后肺部并发症概率预测方法与流程

1.本公开属于肺部并发症预测领域,具体而言涉及一种术前基于睡眠阶段数据的术后肺部并发症概率预测方法。


背景技术:

2.术后肺部并发症(postoperative pulmonary complications, ppcs)与术后病死率升高、住院天数延长和医疗支出增加有关,是导致外科手术患者术后预后差的主要原因之一。在不同手术人群中,ppcs的发生率截然不同,而心脏外科手术人群则会面临更高的ppcs风险。全球有超过4000万人患有二尖瓣或主动脉瓣疾病,心脏瓣膜手术是心脏外科手术中风险较大的之一,手术过程的体外循环易引起系统性炎症应答和氧化应激反应,导致肺缺血—再灌注的损伤。导致心脏瓣膜病手术术后人群再入icu的主要原因,其中40%是术后出现肺部并发症,23%是术后发生呼吸衰竭,均属于ppcs常见的类型。
3.手术前,对于ppcs的风险概率进行评估有利于为被预测者提供是否进行手术以及何时进行手术的重要参考信息。因此如何有效地术前预测心脏瓣膜病手术群体发生ppcs的风险,从而进行相应预警,及早介入临床干预措施,进而降低该人群ppcs的不良结局,成为亟待解决的临床问题。cavayas等人曾借助膈肌超声对心脏外科手术群体的术前膈肌功能进行了评估,发现吸气时下降的膈肌最大厚度分数(≤38.1%)能帮助识别该人群ppcs的发生风险(or=4.9; 95% ci, 1.81-13.50; p = 0.002),但这不仅需要有丰富临床超声诊断经验,还要求配备较昂贵的超声诊断设备。除此之外,其他研究者也开发了许多风险预测模型,用于识别高ppcs风险的患者,从而实现更好的围手术期管理。评估了加泰罗尼亚外科患者的ppcs发送风险,将患者分为低、中、高风险组,其回归模型的七个独立变量包括术前外周血氧饱和度是否低于96%、上个月是否有呼吸道感染、年龄、术前贫血(《100 g/dl)、手术部位、手术时间(》2h)、是否是急诊手术,valent
í
n mazo等人在欧洲人群中验证了上述模型的外部有效性,显示出较好的区分能力。另一项前瞻性多中心队列研究专门关注上腹部切口患者的ppcs风险分层,他们的回归模型中确定了五个独立的风险因素,包括麻醉时间、手术类别、呼吸并发症、当前是否吸烟和预测的最大吸氧量,得分低于2.02与ppc的高风险相关[or(ci)=8.41(3.33

21.26)],但是该模型仍需外部验证。
[0004]
目前现有风险评分方法均不同程度依赖于既往诊断(吸烟史、copd病史、术前败血症、既有胸腔或上腹部手术切口等)、临床检查结果(肺炎)、检验结果(术前白蛋白、血红蛋白、血尿素氮水平等)等指标,并且这些风险评分模型在心脏瓣膜手术人群中的鉴别力仍存在疑问,此外,在具体实施过程中,不仅过程繁琐复杂,所涉及的临床检查耗时耗力,对临床医生也有较高的专业要求,在医疗资源有限的现实条件下无疑会加重临床负担。因此,临床上需要一种可操作性强、费用低廉且预测效力好的手段对心脏瓣膜病手术人群在术前进行ppcs风险预测。


技术实现要素:

[0005]
本公开正是基于现有技术的上述需求而提出的,本公开要解决的技术问题是提供一种术前基于睡眠阶段数据的术后肺部并发症概率预测方法以在术前方便且相对准确地评估肺部术后并发症的概率,为被预测者提供参考。
[0006]
为了解决上述问题,本公开提供的技术方案包括:本公开提供了一种术前基于睡眠阶段数据的术后肺部并发症概率预测方法,包括:获取被预测者术前生理临床特征数据组,所述术前生理临床特征数据组包括术前生理特征数据组和术前临床特征数据组;获取术前临床特征数据组包括,采集被预测者睡眠阶段的连续生理信号,所述连续生理信号包括:连续的单导心电信号、连续的胸腹呼吸信号和连续的睡眠状态信号;基于所述连续生理信号提取被预测者术前临床特征数据,包括至少基于所述连续单导心电信号计算得到的nn间期得到的心率变异性的第一特征数据组、至少基于所述连续胸腹呼吸信号计算的第二特征数据组和至少基于连续的睡眠状态信号计算的第三特征数据组;基于所述生理特征数据组、第一特征数据组、第二特征数据组和第三特征数据组中每个组的至少一项特征数据,以预测函数得到预测的肺部术后并发症概率;其中,,,为输入的被预测者特征数据形成的数组x的并发症概率,θ为特征系数形成的向量,为常数,为第n项特征数据对应的特征系数,x为特征数据形成的向量,,为第n项特征数据。
[0007]
本公开发现了上述特征数据与肺部术后并发症的关系,通过获取所需的数据以及建立好的预测模型,能够准确的得出术后出现并发症的概率,以指导是否进行手术,以及需要进行哪方面的调整才能够进行手术,保证了手术的成功率,很大程度上规避了风险。
[0008]
优选的,所述第一特征数据组中的特征数据为:前后两个nn间期间隔大于50ms的个数、整个nn间期的平均值、高频能量、低高频之比和心律失常负荷。
[0009]
优选的,所述第二特征数据组中的特征数据为:睡眠期间分钟通气量平均值、睡眠期间呼吸频率平均值和睡眠期间吸气时间平均值。
[0010]
优选的,基于睡眠状态信号计算的第三特征数据组中的特征数据为:快速眼动期rem睡眠时长占整个睡眠时长的百分比、深度睡眠时长占比和有效血氧时长占比。
[0011]
优选的,所述术前生理特征数据组中的特征数据为:手术方式数据、年龄数据和术前肺动脉直径数据。
[0012]
优选的,所述预测函数通过如下步骤确定:根据与肺部术后并发症相关联的特征数据集构建第一预测模型,所述特征数据集具有m项特征数据数组;通过迭代得到第一预测模型的最优特征系数;按照大小顺序排列第一预测模型的最优特征系数,并删除最小的特征系数以及与最小的特征系数相对应的特征数据项;循环进行基于剩余的特征数据重新预测模型构建、迭代、排列和删除步骤,直至删除某一特征数据后第n预测模型的并发症预测值下降第一阈值;保留m-n项特征数据和与保留的特征数据相对应的特征系数分别作为最终特征数据和最终特征系数得到所述预测函数。
[0013]
优选的,预测模型包括逻辑回归模型,所述数据集基于逻辑回归模型的似然函数
表示为:,其中,m为数据集中连续生理临床参数数组的个数,为第i个连续生理临床参数数组,为所对应的标签,y的取值为0或1。
[0014]
优选的,基于所述似然函数得到的代价函数表示为:,其中,m为数据集中连续生理临床参数数组的个数,为第i个连续生理临床参数数组,为所对应的标签,y的取值为0或1。
[0015]
优选的,通过梯度下降初始化特征系数,并逐步更新,直至得出对于连续生理临床参数数组中特征数据最优的特征系数,表示为:,其中,为第j项特征数据对应的特征系数,α为学习率,为代价函数。
[0016]
优选的,所述第一阈值包括大于等于10%。
[0017]
优选的,所述呼吸信号中提取的特征数据由对获取的呼吸信号进行平滑滤波处理,去除异常值后通过检测波峰和波谷得到。
[0018]
优选的,所述nn间期得到的心率变异性特征数据由获取的心电图信号并检测r波峰位置得到。
[0019]
优选的,所述预测函数的形成方法还包括:验证所述预测模型,包括:将数据集平均分成5份,分别为d1、d2、d3、d4和d5,以d1-d4作为验证集,d5为验证集,计算第一折的性能参数;依次循环4次,计算第二折至第五折的性能参数;基于所述性能参数计算预测函数的精确程度以确定预测函数是否合适。
[0020]
与现有技术相比,本公开通过理论分析、经验总结以及模型计算的方式确定出睡眠阶段生理特征数据与肺部术后并发症的概率,能够在睡眠阶段的数据测试即可得到准确度高的肺部术后并发症的概率结果,方便了被预测者获得准确评估。并且,本公开通过基于四种特征数据组构建肺部术后并发症的概率预测函数,相对于现有模型基于理论分析和数据验算得到,考虑因素全面,并且避免外界环境或心理因素导致的数据不准同时选取的特征相关性强数据量适当,提高了模型的准确性和计算速度。
附图说明
[0021]
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
[0022]
图1为本公开实施例中的一种基于睡眠阶段数据预测肺部术后并发症的方法的步骤流程图;图2为本公开实施例中形成预测模型的方法步骤流程图。
具体实施方式
[0023]
为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
[0024]
在本公开实施例的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接可以是机械连接,也可以是电连接可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本公开中的具体含义。
[0025]
全文中描述使用的术语“顶部”、“底部”、“在
……
上方”、“下”和“在
……
上”是相对于装置的部件的相对位置,例如装置内部的顶部和底部衬底的相对位置。可以理解的是装置是多功能的,与它们在空间中的方位无关。
[0026]
为便于对本技术实施例的理解,下面将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本技术实施例的限定。
[0027]
本实施例提供了一种基于睡眠阶段数据预测肺部术后并发症的方法,如图1-图2所示。
[0028]
获取被预测者术前生理临床特征数据组,所述术前生理临床特征数据组包括术前生理特征数据组和术前临床特征数据组。
[0029]
被预测者术前生理临床特征数据被认为是能够反映被预测者的心肺功能的重要生理指标,由于ppcs与心肺功能密切相关,因此选取被预测者术前生理特征数据组作为评估ppcs风险概率的影响因素可以照顾到被预测者的身体器官的参数对于ppcs发生概率的影响。需要说明的是,本具体实施方式中,获取被预测者术前生理特征数据组的步骤顺序可以灵活设置,只要在需要上述数据时可以采集得到即可,而并不仅限于在第一步进行被预测者术前生理特征数据组的采集。
[0030]
在本具体实施方式中,可以包括如下特征数据:手术方式(operation)、年龄(age)、心功能分级标准(nyha)、欧洲心血管手术危险因素评分(euro score)、左室内径、左室扩大、左房内径、左房扩大、右室内径、右室扩大、右房内径、右房扩大、左室舒张末期容积、左室舒张末期结构改变参数、左室收缩末期容积、左室收缩末期结构改变参数、左室射血分数、左室收缩功能改变参数、肺动脉直径(pulmonary)。
[0031]
这些数据,在理论上被认为均与ppcs的发生有很大的影响,但是这些因素中哪些数据与ppcs属于强相关,哪些数据与ppcs属于弱相关,在已有的研究中并没有明确地揭示,一方面因为理论上讲这些数据均与心肺功能密切相关,因此不能轻易否决某个具体的数据的相关性,另一方面,由于现有的ppcs判断方式往往仅仅局限在某个角度和无法对整体影响ppcs的因素进行综合评价,这些参数与ppcs之间的对应关系并不完全明确,因此无法准确评估这些参数对ppcs影响程度的大小。
[0032]
在本具体实施方式中,优选地,在上述数据能够代表被预测者生理特征数据组中与ppcs发生风险强相关的参数,通过选取上述数据作为生理特征数据组的代表数据可以显著减ppcs预测的计算量提高预测速度还能够保证预测的准确性。
[0033]
这主要受益于本技术的预测模型考虑因素的全面和合理,并且在特征数据组中筛
选特征数据的准确性以及科学性。这将在本具体实施方式接下来的描述中逐步展开。
[0034]
除了被预测者术前生理特征之外,被预测者睡眠时的呼吸暂停情况也被认为与ppcs具有较强的关联性。
[0035]
睡眠呼吸暂停综合症(osa)是指主要由阻塞原因导致的睡眠状态下反复出现呼吸暂停或低通气,引起低氧血症、高碳酸血症、睡眠中断,从而使机体发生一系列病理生理变化的临床综合征。osa患者进行围手术期的术后并发症风险显著增加,他们术后发生呼吸衰竭、心脏并发症、低血氧症、住院时间延长的风险更高,icu转移也更频繁。osa患者由于对镇静剂和阿片类药物的敏感性更高导致其患上呼吸抑制的风险增加,此外在进行大手术后,呼吸中枢控制的异常可能导致患者对缺氧和高碳酸血症的通气反应降低,进一步使osa患者发生更严重的呼吸并发症。严重osa患者发生复杂心律失常的几率比无osa患者高2至4倍,此外osa患者术前低血氧水平也反映了心脏和肺功能状态,是术后肺部并发症的有力预测因子。
[0036]
睡眠时的生理参数与ppcs发生的风险具有很高的相关性,如果对于睡眠期间的人体生理参数进行测量,检测睡眠阶段被评估者的心肺功能参数,对于判断被评估者的ppcs风险概率具有很强的参考意义。
[0037]
因此,在本具体实施方式中,所述一种基于睡眠阶段数据的术后肺部并发症概率预测方法包括:采集被预测者睡眠阶段的连续生理信号,所述连续生理信号包括:连续的单导心电信号、连续的胸腹呼吸信号和连续的睡眠状态信号。
[0038]
在本具体实施方式中,所述单导心电信号可以采用现有的便携式心电检测设备实现,例如夹持或吸附在身体预定位置的便携式心电检测设备,检测原始单导ecg(心电)信号。胸腹呼吸信号可以采用现有技术中的带式呼吸检测传感器来实现。睡眠状态的检测可以通过检测眼动的便携式传感器以及便携式的血氧气检测传感器配合呼吸检测传感器来采集得到。
[0039]
上述信号采集设备均采集连续的相关生理信号,优选地,可以是被预测者在整晚时间的连续信号,连续信号能够反应较长时间的生理特征并能够反应这些生理特征在检测期间的变化,因此可以用于较好地评与ppcs相关的生理功能指标。
[0040]
但需要说明的是,上述信号检测只是通用的检测信号,并不仅仅是针对ppcs风险进行的检测,因此为了更加准确地评估ppcs发生的风险概率,还需要对这些数据进行处理,基于这些连续信号处理分析后得到与ppcs具有更强相关信的特征数据,即被预测者术前临床特征数据,从而提高对ppcs预测的准确性和速度。
[0041]
在本具体实施方式中,基于理论研究和试验数据的总结,对上一步骤采集的连续生理信号进行分析处理得到如下三种被预测者术前临床特征数据组,即基于所述连续单导心电信号计算得到的nn间期得到的心率变异性的第一特征数据组、基于所述连续胸腹呼吸信号计算的第二特征数据组和连续的睡眠状态信号计算的第三特征数据组。
[0042]
其中,所述nn间期为心电图中nn间期是指正常r峰之间的间期。所述nn间期得到的心率变异性特征数据集可以包括:前后两个nn间期间隔大于50ms的个数(nni_50)、前后两个nn间期间隔大于20ms的个数(nni_20)、整个nn间期的平均值(mean_nni)、整个nn间期的中值(median_nni)、整个nn间期的标准差(nni_std)、相邻两个nn间期之差的均方根(rmssd)、超低频能量(vlf)、低频能量(lf)、高频能量(hf)、低高频之比(lf_hf_ratio)、睡
眠阶段最大nn间期与最小nn间期之差(min_max_nni)、心律失常负荷(ar_burden)计算方法为前后两个nn间期差值大于160ms的个数,占整个nn间期个数的百分比。
[0043]
上述特征数据可由采集步骤得到的原始单导ecg(心电)信号并检测r波峰位置计算得到,具体为,对原始ecg信号使用hamilton方法检测r波峰值位置,其中画点表示的为检测到的r波峰位置,经过整晚ecg信号进行r波检测后得到整晚的nn间期序列,从rr间期序列中得到上述特征数据。
[0044]
基于所述连续胸腹呼吸信号计算的第二特征数据集包括:呼吸频率平均值(br_mean)、呼吸频率标准差(br_std)、吸气时间平均值(ti_mean)、吸气时间标准差(ti_std)、吸气时间占整个呼吸时长百分比的均值(ti_ratio_mean)、分钟通气量平均值(min_ven_in_mean)。将nn间期信号差值为2hz后,采用fft方法计算功率谱密度,其中:高频成分(hf)取值在0.15~0.4hz之间;低频成分(lf)取值在0.04~0.15hz之间;总功率(tf)取值在0.04~0.4hz之间;中频成分(hf)取值在0.1~0.15hz之间;t-低频成分(tlf)取值在0.04~0.1hz之间,极低频(vlf)取值在0.0033~0.04hz之间。
[0045]
上述第二特征数据集可自采集到的睡眠期间整晚的原始胸腹呼吸信号,对原始胸腹呼吸信号进行平滑滤波处理,去除异常值后通过检测波峰和波谷得到。
[0046]
所述基于睡眠状态信号计算的第三特征数据集包括:睡眠时长(sleep_len)、快速眼动期rem睡眠时长占整个睡眠时长的百分比(rem_per)、深度睡眠时长占比(deep_per)、浅睡时长占比(light_per)、睡眠过程中醒来次数(wake_times)、有效血氧时长占比(used_per)、睡眠呼吸暂停低通气指数(ahi)、睡眠期间血氧低于90%时长占比(spo2_90)、睡眠期间血氧低于85%时长占比(spo2_85)、睡眠期间最低血氧数值(spo2_min)上述基于睡眠状态信号计算的第三特征数据基于第三睡眠数据的计算方式可以采用现有技术中对于睡眠结果的评估方法来实现,或者如果已经生成了评估报告且包括了上述数据可以直接从现有的睡眠评估报告中获取。
[0047]
综上所述,与睡眠相关的生理特征数据集有47项特征数据,即:前后两个nn间期间隔大于50ms的个数(nni_50)、前后两个nn间期间隔大于20ms的个数(nni_20)、整个nn间期的平均值(mean_nni)、整个nn间期的中值(median_nni)、整个nn间期的标准差(nni_std)、相邻两个nn间期之差的均方根(rmssd)、超低频能量(vlf)、低频能量(lf)、高频能量(hf)、低高频之比(lf_hf_ratio)、睡眠阶段最大nn间期与最小nn间期之差(min_max_nni)、心律失常负荷(ar_burden)计算方法为前后两个nn间期差值大于160ms的个数,占整个nn间期个数的百分比、呼吸频率平均值(br_mean)、呼吸频率标准差(br_std)、吸气时间平均值(ti_mean)、吸气时间标准差(ti_std)、吸气时间占整个呼吸时长百分比的均值(ti_ratio_mean)、分钟通气量平均值(min_ven_in_mean)。将nn间期信号差值为2hz后,采用fft方法计算功率谱密度,其中:高频成分(hf)取值在0.15~0.4hz之间;低频成分(lf)取值在0.04~0.15hz之间;总功率(tf)取值在0.04~0.4hz之间;中频成分(hf)取值在0.1~0.15hz之间;t-低频成分(tlf)取值在0.04~0.1hz之间,极低频(vlf)取值在0.0033~0.04hz之间、睡眠时长(sleep_len)、快速眼动期rem睡眠时长占整个睡眠时长的百分比(rem_per)、深度睡眠时长占比(deep_per)、浅睡时长占比(light_per)、睡眠过程中醒来次数(wake_times)、有效血氧时长占比(used_per)、睡眠呼吸暂停低通气指数(ahi)、睡眠期间血氧低于90%时长占比(spo2_90)、睡眠期间血氧低于85%时长占比(spo2_85)、睡眠期间最低血氧数值(spo2_
min)。
[0048]
虽然理论上述47项特征数据均可能与ppcs相关,但是如此多的数据作为输入会导致计算的速度受到影响,并且47项数据中哪些数据与ppcs强相关,哪些数据与ppcs发生的风险概率并非强相关需要准确地评估。因此本具体实施方式中出于筛选上述47项数据中强相关数据以及提高预测模型的计算速度之目的,通过如下方法形成预测模型。
[0049]
获取数据集,所述数据集包括睡眠阶段多种与肺部术后并发症相关联的连续生理临床参数数组,所述连续生理临床参数数组包括获取的生理特征数据以及基于单导心电信号、胸腹呼吸信号和血氧信号分析提取的临床特征数据;所述生理临床参数数组由多项特征数据组成,所述特征数据来自nn间期得到的心率变异性特征数据、由呼吸信号中提取的特征数据、睡眠分析结果中得到的特征数据和术前生理特征数据。
[0050]
进一步的,本实施例中所使用的数据集包括整个睡眠期间的睡眠情况、心电、呼吸、血氧多维度分析,提取特征,并对特征进行筛选,最终得到所述数据集。所述数据集包括睡眠阶段多种与肺部术后并发症相关联的连续生理临床参数数组,所述生理临床参数数组所包括的多项特征数据包括四类,分别为:nn间期得到的心率变异性特征数据;从胸腹呼吸信号中提取的特征数据;睡眠分析结果中提取的特征数据和术前生理特征数据。四类中的多个基于数据集建立预测模型,得到形成所述预测函数的最终特征数据和与最终特征数据相对应的最终特征系数。
[0051]
所述基于数据集建立预测模型,包括:根据与肺部术后并发症相关联的特征数据集构建第一预测模型,所述特征数据集具有m项特征数据数组。
[0052]
基于并发症的结果需要使得预测模型最终输出一个在0~1之间的数,并且如果函数值大于0.5,就判定属于1,否则属于0。同时,函数中需要待定参数,通过利用样本训练,使得这个参数能够对训练集中的数据有很准确的预测。由此将预测模型设为逻辑回归模型,同时将sigmoid函数作为预测函数,表示为:表示为:表示为:表示为:其中,为输入的特征数据形成的数组x的并发症概率,θ为特征系数形成的向量,为第n项特征数据对应的特征系数,x为特征数据形成的向量,,为第n项特征数据。
[0053]
在本具体实施方式中,所述数据集中包括47项特征数据,即n=47,初始时特征系数随机赋值。
[0054]
所述数据集基于逻辑回归模型的似然函数表示为:其中,m为数据集中连续生理临床参数数组的个数,为第i个连续生理临床参数数组,为所对应的标签,y的取值为0或1。
[0055]
基于所述似然函数得到的代价函数表示为:。
[0056]
通过梯度下降初始化特征系数,并逐步更新,直至得出对于连续生理临床参数数组中特征数据最优的特征系数,表示为:其中,为第j项特征数据对应的特征系数,α为学习率,为代价函数。
[0057]
以上述实施方式为例,通过梯度下降的方式,不断迭代以逼近使得代价函数最小的特征系数,即为第一预测模型下的最优特征系数。
[0058]
通过上述优化过程得到特征系数后,按照大小顺序排列所述特征系数,并删除最小的特征系数以及与最小的特征系数相对应的特征数据。具体而言,将得到的第一预测模型下的最优特征系数由大到小进行排列,剔除第47项特征系数所对应的特征数据,也就是说,剔除相对于术后肺部并发症而言权重最小的特征数据,即该特征数据对于术后并发症的影响最小。
[0059]
将删除特征数据后的数据集,重新构建第二预测模型。具体而言,将剔除一个后的特征数据的数据集作为新的数据集重新进行上述过程,即基于具有46项特征数据的数据集重新形成第二预测模型。
[0060]
所述第二预测模型的预测函数同样为sigmoid函数,第二预测模型的构建过程与第一预测模型的构建过程相同,二者的不同之处在于,所述第二预测模型的数据集中没有进行第一次迭代排序后删除的特征数据,致使其最终得到的最优特征系数与第一预测模型得到的最优特征系数不同。之后,对最优特征系数按照大小顺序进行排序,在数据集中剔除与最小的特征系数相对应的特征数据。剔除过程同样用以删除对于影响术后肺部并发症能力最小的因素,以排出无需获取的数据,以简化获取过程,更加方便快速,同时还能够有效减少数据量。
[0061]
循环进行基于剩余的特征数据重新构建第n’预测模型和排列并剔除特征数据的步骤,直至删除某一特征数据后第q预测模型的并发症预测值下降第一阈值。所述第一阈值包括大于等于10%。
[0062]
保留m-q项特征数据和与保留的特征数据相对应的特征系数分别作为最终特征数据和最终特征系数得到所述预测函数。
[0063]
相比于神经网络等模型,通过逻辑回归模型在保证预测并发症概率的前提下,更
加快速且直观的得到预测结果。
[0064]
基于本实施例上述的实施方式,最终得到的预测模型的输入为15项特征数据,为:nni_50、mean_nni、lf_hf_ratio、hf、ar_burden、min_ven_in_mean、br_mean、ti_mean、rem_per、deep_per、used_per、ahi、operation、age和pulmonary。
[0065]
即所述nn间期得到的心率变异性特征数据组中的特征数据为:前后两个nn间期间隔大于50ms的个数(nni_50)、高频能量(hf)、低高频之比(lf_hf_ratio)和心律失常负荷(ar_burden)。
[0066]
基于所述连续胸腹呼吸信号计算的第二特征数据组中的特征数据为:分钟通气量平均值(min_ven_in_mean)、表示为睡眠期间呼吸频率平均值(br_mean)和表示为睡眠期间呼吸频率平均值(ti_mean)。
[0067]
基于睡眠状态信号计算的第三特征数据组中的特征数据为:快速眼动期rem睡眠时长占整个睡眠时长的百分比(rem_per)、深度睡眠时长占比(deep_per)、有效血氧时长占比(used_per)。
[0068]
所述生理特征数据组中的特征数据为:手术方式(operation)、年龄(age)和肺动脉直径(pulmonary)。
[0069]
根据所述最终确定的上述15项特征数据以及与最终特征数据相对应的最终特征系数得到预测模型,所述预测模型的预测函数表示为:所述预测模型的预测函数表示为:所述预测模型的预测函数表示为:其中,为输入的特征数据形成的数组x的并发症概率,θ为特征系数形成的向量,为第n项特征数据对应的特征系数,x为特征数据形成的向量,,为第n项特征数据。
[0070]
在本实施例上述的实施方式中,所述预测模型的预测函数表示为:ppc=0.0867386
×
operation+0.0024807
×
ahi+0.0145861
×
used_per-0.0569415
×
rem_per-0.000001
×
nni_50-0.000006
×
min_ven_in_mean+0.0218722
×
deep_per+0.0027144
×
mean_nni-0.0950354
×
br_mean-0.0469357
×
1f_hf_ratio+0.0127289
×
min_ven_in_cv+0.0181016
×
ti_mean+0.00003
×
hf-0.0601069
×
age+0.0383772
×
pulmonary+0.00250712。
[0071]
15项特征经过逻辑回归模型后,输出的结果为一个百分比数值,代表的意义为:以melbourne评分为评判标准的术后肺部并发症的发生几率。
[0072]
为了得到更加可靠稳定的模型评估,采用5折交叉验证的方式生成训练集和验证集。具体包括:整体数据集平均分成5份,分别为d1、d2、d3、d4、d5。
[0073]
取d1至d4为训练集,d5为验证集,计算第一折的性能参数。
[0074]
依次循环四次,计算二到五折的模型性能评估。
[0075]
基于所述性能参数,计算预测函数的精确程度,评估预测模型的表现。
[0076]
进一步的,由5折交叉验证的方式得到的性能参数,通过计算roc曲线(指接受者操作特征曲线)下的面积(auc)来评估模型的预测能力,此外,还计算了准确率(acc)、f1分数(f1)、精确率(precision)、召回率(recall)评价指标,多方面对模型表现进行评估。
[0077]
具体而言,根据预测模型输出的结果与真实标签情况构建以下混淆矩阵:roc是一个用于度量分类中的非均衡性的工具,roc曲线及auc常被用来评价一个二值分类器的优劣。其中横坐标为fpr(false positive rate 假阳率),纵坐标为真阳率tpr(true postive rate)。auc(area under curve)被定义为roc曲线下的面积,因为roc曲线一般都处于y=x这条直线的上方,所以取值范围在0.5和1之间,使用auc作为评价指标是因为roc曲线在很多时候并不能清晰地说明哪个分类器的效果更好,而auc作为一个数值,其值越大代表分类器效果更好。横坐标和纵坐标分别表示为:值越大代表分类器效果更好。横坐标和纵坐标分别表示为:所述准确率acc表示为:所述f1分数表示为:所述f1分数表示为:所述f1分数表示为:通过上述性能参数的验证,对预测模型进行评估,其结果表示为:通过上述验证结果以说明本实施例中最终得到的预测模型具有良好的分类性能,并通过得到的其他数据说明本预测模型的精确性和稳定性。f1是精确率和召回率的调和平均值,以用来衡量分类器的总体性能,基于以上数据来看,本实施例中的预测模型总体性能良好。
[0078]
当获取到被预测者术前以上15项数据后,结合计算ppc的表达式,能够得到被预测者术后肺部并发症的概率,通过上述方式以较为精准的预估该被预测者术后并发症的概率,以指导是否进行手术,以及需要进行哪方面的调整才能够进行手术,保证了手术的成功率,很大程度上规避了风险。
[0079]
以上所述的具体实施方式,对本技术的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本技术的具体实施方式而已,并不用于限定本技术的保护范围,凡在本技术的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1