多系统萎缩失能预测方法、模型建立方法、装置及设备与流程

文档序号:21280078发布日期:2020-06-26 23:32阅读:384来源:国知局
多系统萎缩失能预测方法、模型建立方法、装置及设备与流程

本发明属于疾病预测技术领域,具体涉及一种多系统萎缩失能预测方法、模型建立方法、装置及设备。



背景技术:

多系统萎缩(multiplesystematrophy,msa)是一种罕见的,进行性进展的神经变性疾病,其特征为帕金森综合征,小脑共济失调及自主神经功能障碍的不同组合。患者从发病到走路需要协助、坐轮椅、卧床及死亡的平均中位时间分别为3,5,8和9年。由于发病率低,该病已被国家列入罕见病目录。该病起病隐匿,进展迅速,生存期短,给患者及其家庭乃至整个社会带来极大的负担。

既往对多系统萎缩患者的预后进行研究的文献,主要以死亡作为临床结局指标,构建死亡预测模型。研究发现以植物神经症状起病、起病年龄较晚、频繁跌倒等因素与预后密切相关。

但是,现有技术中,尚无对多系统萎缩患者失能进行预测。由于多系统萎缩患者疾病进展迅速,在病程的4-5年就逐渐丧失行动能力而限制于轮椅,失去生活自理能力,严重影响生活质量。因此,建立多系统萎缩失能预测模型显得尤为重要,能够指导临床医生对患者进行个体化的精准治疗,提高其生活质量,改善患者预后。



技术实现要素:

为了至少解决现有技术存在的上述问题,本发明提供了一种多系统萎缩失能预测方法、模型建立方法、装置及设备。

本发明提供的技术方案如下:

一方面,一种多系统萎缩失能预测模型的构建方法,包括:

获取病程在预设时间段的多系统萎缩患者的基本数据,所述基本数据,包括:临床指标数据和血液学指标数据;

基于预设处理规则,对所述临床指标数据和所述血液学指标数据进行处理,获取目标数据集;

根据所述目标数据集、支持向量机算法及预设线性核函数,使用r程序中的kernlab程序包构建多系统萎缩失能的预测模型。

可选的,所述基于预设处理规则,对所述临床指标数据和所述血液学指标数据进行处理,获取目标数据集,包括:

采用快速眼动期睡眠行为障碍评估量表,对患者群内患者进行评分;

采用统一多系统萎缩评估量表,对患者的运动症状进行评估;

基于预设直立性低血压评估规则,对患者是否有直立性低血压进行评估。

可选的,临床指标包括:年龄、性别、发病年龄、诊断延迟、病程、体重指数、诊断类型、首发症状形式、是否在预设时间段内反复跌倒、是否有锥体束征、是否有喘鸣、是否有严重的鼾声、是否有快速眼动期睡眠行为障碍,统一多系统萎缩评估量表第一部分得分、统一多系统萎缩评估量表第二部分得分、统一多系统萎缩评估量表第四部分得分、统一多系统萎缩评估量表总分、是否有直立性低血压;

血液学指标包括:红细胞计数、血红蛋白、红细胞压积、平均红细胞体积、平均红细胞血红蛋白含量、平均红细胞血红蛋白浓度、红细胞分布宽度cv、红细胞分布宽度sd、血小板计数、白细胞计数、中性分叶核粒细胞百分率、淋巴细胞百分率、单核细胞百分率、嗜酸性粒细胞百分率、嗜碱性粒细胞百分率、中性分叶核粒细胞绝对值、淋巴细胞绝对值、单核细胞绝对值、嗜酸细胞绝对值、嗜碱细胞绝对值、总胆红素、直接胆红素、间接胆红素、丙氨酸氨基转移酶、门冬氨酸氨基转移酶、丙氨酸氨基转移酶/门冬氨酸氨基转移酶的比值、总蛋白、白蛋白、球蛋白、白球比例、葡萄糖、尿素、肌酐、血清胱抑素c、尿酸、甘油三酯、胆固醇、高密度脂蛋白、低密度脂蛋白、碱性磷酸酶、谷氨酰转肽酶、肌酸激酶、乳酸脱氢酶、羟丁酸脱氢酶。

可选的,所述基于预设处理规则,对所述临床指标数据和所述血液学指标数据进行处理,获取目标数据集,包括:

根据性别,对患者性别进行赋值,男性=1,女性=0;

获取患者的体重指数,体重指数=体重/身高的平方;

根据诊断类型,对患者的诊断类型进行赋值,帕金森症为主型=1、小脑共济失调为主型=0;首发症状的形式分为植物神经功能障碍起病=0;运动症状起病=1;3年内出现反复发作的跌倒=1,未出现=0;有锥体束征=1,没有=0;有喘鸣=1,没有=0;有严重的鼾声=1,没有=0;有快速眼动期睡眠行为障碍=1,没有=0;有直立性低血压=1,没有=0。

可选的,所述预设线性核函数的构建方法,包括:

构建核函数:k(xi,xj)=φ(xi)·φ(xj);

基于松弛变量,创建软间隔,获取分类平面约束条件为:yi(wxi+b)≥1,i=1,2,…,n;

获取软边界目标函数:ξi≥0,i=1,2,…,n;

yi(wxi+b)≥1-ξi,ξi≥0;

其中,c为错误惩罚因子;ξ为松弛变量。

可选的,支持向量机的的错误惩罚因子c的选择范围为5-8。

可选的,还包括:基于kappa统计量对所述预测模型的准确度进行评估。

又一方面,一种多系统萎缩失能预测方法,包括:

获取目标多系统萎缩患者的基本数据,所述基本数据,包括:临床指标数据和血液学指标数据;

基于预设处理规则,对所述目标数据进行处理,获取目标数据;

根据所述目标数据及上述任一所述的多系统萎缩失能预测模型的构建方法建立的模型,预测所述目标多系统萎缩患者的失能情况。

又一方面,一种多系统萎缩失能预测模型构建装置,包括:获取模块、处理模块和构建模块;

所述获取模块,用于获取病程在预设时间段的多系统萎缩患者的基本数据,所述基本数据,包括:临床指标数据和血液学指标数据;

所述处理模块,用于基于预设处理规则,对所述临床指标数据和所述血液学指标数据进行处理,获取目标数据集;

所述构建模块,用于根据所述目标数据集、支持向量机算法及预设线性核函数,使用r程序中的kernlab程序包构建多系统萎缩失能的预测模型。

又一方面,一种多系统萎缩失能预测设备,包括:处理器,以及与所述处理器相连接的存储器;

所述存储器用于存储计算机程序,所述计算机程序至少用于执行上述所述的多系统萎缩失能预测方法;

所述处理器用于调用并执行所述存储器中的所述计算机程序。

本发明的有益效果为:

本发明提供的多系统萎缩失能预测方法、模型建立方法、装置及设备,首次采用多系统萎缩患者的临床指标联合血液学指标作为预测数据,对预测数据进行特征筛选,对筛选出的多个特征采用支持向量机建模,从而实现对多系统萎缩患者失能的精准预测,从而指导临床医生对患者进行个体化的精准治疗,提高其生活质量,改善患者预后。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种多系统萎缩失能预测模型的构建方法流程示意图;

图2为本发明实施例提供的一种多系统萎缩失能预测方法流程示意图;

图3为本发明实施例提供的一种多系统萎缩失能预测模型构建装置结构示意图;

图4为本发明实施例提供的一种多系统萎缩失能预测设备结构示意图。

附图标记:31-获取模块;32-处理模块;33-构建模块;41-处理器;42-存储器。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。

多系统萎缩的疾病进展过程十分复杂,通常是多因素共同作用的结果,传统的回归分析统计学方法在处理复杂多因素时表现不佳,而目前尚无多系统萎缩失能的预测模型。

基于此,本发明基于支持向量机技术建立多系统萎缩的失能预测模型,从而指导个体化治疗,延缓疾病进展,提高生活质量。

本发明实施例提供一种多系统萎缩失能预测模型的构建方法。

图1为本发明实施例提供的一种多系统萎缩失能预测模型的构建方法流程示意图,请参阅图1,本发明实施例提供的方法,可以包括以下步骤:

s11、获取预设时间段的多系统萎缩患者的基本数据,基本数据,包括:临床指标数据和血液学指标数据。

s12、基于预设处理规则,对临床指标数据和血液学指标数据进行处理,获取目标数据集。

在构建多系统萎缩失能预测模型时,可以先采集病程在预设时间段的多萎缩患者的基本数据,基本数据可以包括:临床指标数据和血液学指标数据。

例如,预设时间段可以为3年,采集某医院或某区域内就诊时病程在3年内的多系统萎缩患者的基本数据(基线临床资料)。临床指标数据,可以包括:年龄、性别、发病日期、首次诊断日期、诊断延迟、病程、体重指数、诊断类型、首发症状形式、是否在3年内反复跌倒、是否有锥体束征、是否有喘鸣、是否有严重的鼾声、是否有快速眼动期睡眠行为障碍、统一多系统萎缩评估量表第一部分得分、统一多系统萎缩评估量表第二部分得分、统一多系统萎缩评估量表第四部分得分、统一多系统萎缩评估量表总分、是否有直立性低血压

其中,在判断是否有快速眼动期睡眠行为障碍(rapideyemovementsleepbehaviordisorder,rbd)时,采用快速眼动期睡眠行为障碍评估量表进行评估,评分大于或等于5分代表有rbd。采用统一多系统萎缩评估量表(unifiedratingmsascale,umsars)评估患者的运动症状。评估患者是否有直立性低血压时,可以让患者先平躺在检查床上安静休息10分钟,然后测量卧位血压并记录,然后让患者从检查床上起身保持站立位,测量1,3,5,10分钟后的立位血压并记录,若患者的任意一次立位的收缩压比卧位的下降超过30mmhg,或者舒张压比卧位下降超过15mmhg,则定义为直立性低血压(orthostatichypotension,oh)。

在获取血液学指标数据时,可以采集就诊时期患者的空腹血液学样本进行检测:检测指标为血常规、肝肾功能。

排除基线评估时即丧失行动能力坐轮椅的患者后,纳入病程小于3年的多系统萎缩患者共167例。

对167例多系统萎缩患者进行随访评估,随访评估为每年一次的面对面评估或者电话评估,观察他们有无出现丧失行动能力并限制于轮椅,并记录开始使用轮椅的时间。患者丧失行动能力限制于轮椅定义为失能。我们以失能作为结局指标。根据随访结果,我们以病程4年时间为界限,在4年内出现失能标记为0,超过4年未出现失能标记为1,同时剔除病程在4年以内但未出现失能的数据。最终得到137例多系统萎缩患者的数据,所有患者根据2008年第二版诊断标准均符合很可能的多系统萎缩。

对137例多系统萎缩患者的数据进行预处理和格式转化:性别(男性=1,女性=0);体重指数(bmi)=体重/身高的平方(国际单位kg/m2);诊断类型分为帕金森症为主型(msawithpredominantlyparkinsonianfeatures,msa-p)=1和小脑共济失调为主型(msawithpredominantlycerebellarataxia,msa-c)=0;首发症状的形式分为植物神经功能障碍起病=0(包括小便障碍和直立性低血压)和运动症状起病=1(包括小脑共济失调症状和帕金森样症状);3年内出现反复发作的跌倒=1,未出现=0;有锥体束征=1,没有=0;有喘鸣=1,没有=0;有严重的鼾声=1,没有=0;有rbd=1,没有=0;有直立性低血压=1,没有=0;其余指标均为数值型数据。

最终获取到目标数据集包括:临床指标包括:年龄、性别、发病年龄、诊断延迟、病程、体重指数(bodymassindex,bmi)、诊断类型、首发症状形式、是否在3年内反复跌倒、是否有锥体束征、是否有喘鸣、是否有严重的鼾声、是否有快速眼动期睡眠行为障碍(rbd),统一多系统萎缩评估量表(unifiedratingmsascale,umsars)第一部分得分、umsars第二部分得分、umsars第四部分得分、umsars总分、是否有直立性低血压;血液学指标包括:红细胞计数、血红蛋白、红细胞压积、平均红细胞体积、平均红细胞血红蛋白含量、平均红细胞血红蛋白浓度、红细胞分布宽度cv、红细胞分布宽度sd、血小板计数、白细胞计数、中性分叶核粒细胞百分率、淋巴细胞百分率、单核细胞百分率、嗜酸性粒细胞百分率、嗜碱性粒细胞百分率、中性分叶核粒细胞绝对值、淋巴细胞绝对值、单核细胞绝对值、嗜酸细胞绝对值、嗜碱细胞绝对值、总胆红素、直接胆红素、间接胆红素、丙氨酸氨基转移酶(alt)、门冬氨酸氨基转移酶(ast)、ast/alt的比值、总蛋白、白蛋白、球蛋白、白球比例、葡萄糖、尿素、肌酐、血清胱抑素c、尿酸、甘油三酯、胆固醇、高密度脂蛋白、低密度脂蛋白、碱性磷酸酶、谷氨酰转肽酶、肌酸激酶、乳酸脱氢酶、羟丁酸脱氢酶。

例如,以患者1为例,性别男=1,年龄49岁,发病年龄47岁,诊断延迟1.5年,病程2年,体重指数23.6,诊断类型为msa-p型=1,首发症状为运动症状=1,3年内反复跌倒=1,有锥体束征=1,无喘鸣=0,无严重鼾声=0,有快速动眼期睡眠行为障碍=1,umsars第一部分评分为10分,umsars第二部分评分为12分,umsars第四部分评分为2分,umsars总分为24分,有直立性低血压=1,红细胞计数=4.76、血红蛋白=138、红细胞压积=0.41、平均红细胞体积=86.3、平均红细胞血红蛋白含量=29、平均红细胞血红蛋白浓度=336、红细胞分布宽度cv=12.7、红细胞分布宽度sd=40.5、血小板计数=199、白细胞计数=6.1、中性分叶核粒细胞百分率=56.6、淋巴细胞百分率=36.9、单核细胞百分率=4.4、嗜酸性粒细胞百分率=1.8、嗜碱性粒细胞百分率=0.3、中性分叶核粒细胞绝对值=3.45、淋巴细胞绝对值=2.25、单核细胞绝对值=0.27、嗜酸细胞绝对值=0.11、嗜碱细胞绝对值=0.02、总胆红素=14.2、直接胆红素=3.2、间接胆红素=11、丙氨酸氨基转移酶(alt)=11、门冬氨酸氨基转移酶(ast)=15、ast/alt的比值=1.36、总蛋白=69.2、白蛋白=40.8、球蛋白=28.4、白球比例=1.44、葡萄糖=5.38、尿素=4.88、肌酐=67.1、血清胱抑素c=0.94、尿酸=424、甘油三酯=2.1、胆固醇=4.81、高密度脂蛋白=1、低密度脂蛋白=2.89、碱性磷酸酶=82、谷氨酰转肽酶=16、肌酸激酶=82、乳酸脱氢酶=173、羟丁酸脱氢酶=125。根据随访在病程第3年出现失能=0。

s13、根据目标数据集、预设线性核函数及支持向量机算法支持向量机算法及预设线性核函数,使用r程序中的kernlab程序包构建多系统萎缩失能的预测模型。

在获得到目标数据集后,优先使用线性不可分的支持向量机算法,利用核函数:k(xi,xj)=φ(xi)·φ(xj),使用r程序中的kernlab程序包构建多系统萎缩失能的预测模型。

在本申请中,分类平面约束条件,可以为:

yi(wxi+b)≥1,i=1,2,…,n。

为了权衡泛化能力和错误分类,在min1/2‖w‖2中引入惩罚项:

将目标函数转化为:

ξi≥0,i=1,2,…,n。

其中c为错误惩罚因子,也称为成本值,代表对错分样本点的惩罚程度。因此该算法试图使总成本最小,而不是寻找最大间隔。即

yi(wxi+b)≥1-ξi,ξi≥0。

将目标数据集输入支持向量机模型,通过系统将全部有效样本随机分为训练集和测试集。例如,通过系统抽样将137例样本随机分为训练集和测试集;其中80%(109例)为训练集,20%(28例)为测试集。值得说明的是,此处对数据只是列举,并不是限定。

根据支持向量机算法和上述的线性核函数、目标数据集,构建多系统萎缩失能预测模型。

支持向量机的的错误惩罚因子c的选择范围为5-20,例如可以考虑选取5,6,7,8,…,17,18,19,20及其上述数值之间的具体点值,此处不做具体赘述,,优选的惩罚因子为5-8。

为了验证失能预测模型评估的准确度,可以使用kappa统计量来衡量。kappa的取值范围是是[0,1],这个系数的值越高,则代表模型实现的分类准确度越高,一般kappa取值为0.6及以上数值时,代表模型的预测值与真实值有着较好的一致性。

本发明中使用cohen的kappa统计量计算方法,其表达式可以为:

pr(a)是表示模型预测值和真实值之间的真实一致性,pr(e)表示模型预测值和期望值的一致性。

得到预测模型结果后,用测试集进行验证,对预测结果和实际情况进行比较,得到两者之间的混淆矩阵,混淆矩阵见下表1,其中8是实际4年内发生失能被预测为失能的样本例数,2是实际4年内发生失能被预测为未发生失能的样本例数,4是实际在4年内未发生失能被预测为发生失能的样本例数;14是实际在4年内未发生失能被预测为未发生失能的样本例数。

表1

表1中,0代表4年内发生失能,1代表4年内未发生失能。

因此,本实施例构建的失能预测模型敏感度为:87.5%,特异度为:66.7%,kappa系数为0.6,0.6取值范围属于[0.6,1],因此,该模型的准确度良好。

本发明基于支持向量机的多系统萎缩失能预测模型的构建方法,根据多系统萎缩患者的临床特征联合血液学指标进行特征筛选,对筛选出的多个特征采用支持向量机建模,实现对多系统萎缩患者失能的精准预测,从而指导临床医生对患者进行个体化的精准治疗,以期改善患者预后,提高其生活质量。

本发明实施例提供的多系统萎缩失能预测模型构建方法,首次采用多系统萎缩患者的临床特征联合血液学指标作为预测数据,对预测数据进行特征筛选,对筛选出的多个特征采用支持向量机建模,从而实现对多系统萎缩患者失能的精准预测,从而指导临床医生对患者进行个体化的精准治疗,以改善患者预后情况,提高其生活质量。

基于一个总的发明构思,本发明实施例还提供一种多系统萎缩失能预测方法。

图2为本发明实施例提供的一种多系统萎缩失能预测方法流程示意图,请参阅图2,本发明实施例提供的预测方法,可以包括以下步骤:

s21、获取目标多系统萎缩患者的基本数据,基本数据,包括:临床指标数据和血液学指标数据。

s22、基于预设处理规则,对目标数据进行处理,获取目标数据。

s23、根据目标数据及上述任一的多系统萎缩失能预测模型的构建方法建立的模型,预测目标多系统萎缩患者的失能情况。

在一个具体的预测过程中,可以通过获取目标患者的基本数据,具体的获取过程及处理过程在上述实施例已记载,此处不做赘述。将获取到的目标数据,输入到构建的预测模型中,从而获取到目标患者的失能预测情况。

基于一个总的发明构思,本发明实施例还提供一种多系统萎缩失能预测模型构建装置。

图3为本发明实施例提供的一种多系统萎缩失能预测模型构建装置结构示意图,请参阅图3,本发明实施例提供的多系统萎缩失能预测模型构建装置,包括:获取模块31、处理模块32和构建模块33。

获取模块31,用于获取病程在预设时间段的多系统萎缩患者的基本数据,基本数据,包括:临床指标数据和血液学指标数据;

处理模块32,用于基于预设处理规则,对临床指标数据和血液学指标数据进行处理,获取目标数据集;

构建模块33,用于根据目标数据集、支持向量机算法及预设线性核函数,使用r程序中的kernlab程序包构建多系统萎缩失能的预测模型。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

本发明实施例提供的多系统萎缩失能预测模型构建装置,首次采用多系统萎缩患者的临床指标联合血液学指标作为预测数据,对预测数据进行特征筛选,对筛选出的多个特征采用支持向量机建模,从而实现对多系统萎缩患者失能的精准预测,从而指导临床医生对患者进行个体化的精准治疗,以改善患者预后,提高其生活质量。

基于一个总的发明构思,本发明实施例还提供一种多系统萎缩失能预测设备。

图4为本发明实施例提供的一种多系统萎缩失能预测设备结构示意图,请参阅图4,本发明实施例提供的一种多系统萎缩失能预测设备,包括:处理器41,以及与处理器相连接的存储器42。

存储器42用于存储计算机程序,计算机程序至少用于上述任一实施例记载的多系统萎缩失能预测方法;

处理器41用于调用并执行存储器中的计算机程序。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。

需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1