一种基于智能决策的疾病预测方法和装置与流程

文档序号:17153055发布日期:2019-03-19 23:38阅读:200来源:国知局
一种基于智能决策的疾病预测方法和装置与流程

本发明涉及数据处理领域,具体涉及一种基于智能决策的疾病预测方法和装置。



背景技术:

现代的医疗方法是通过早期干预来预防疾病而不是在诊断后进行治疗,这样可以很大程度上将患者从疾病中解放出来。传统上,医师或医生使用风险计算器来评估疾病发展的可能性,具体包括使用人口统计学、医疗条件、生活常规等基本信息来计算发展某种疾病的可能性。这个评估过程只考虑很少的变量,如年龄、体重、身高、性别等,但是疾病预测过程中,所涉及到的变量远远不止这些变量。因此,传统的预测方法使得疾病预测的准确率十分低,并且不能表现出疾病与时间的密切关系,进而对医疗预防提供指导。如何全方位考虑疾病发展过程中涉及到的多种变量,并将这些变量运用到疾病预测过程中,获得高准确度的疾病预测结果,是亟待解决的问题。



技术实现要素:

本发明实施例提供一种基于智能决策的疾病预测方法和装置,能够通过对患者医疗数据进行处理,选取适合的时间序列模型,最后根据医疗数据和时间序列模型,对患者进行疾病预测,能够提升疾病预测准确度,对患者的疾病预防和治疗提供指导。

本发明实施例的第一方面提供了一种基于智能决策的疾病预测方法,所述基于智能决策的疾病预测方法包括:

从医疗数据库获取脱敏后的患者唯一编码对应的治疗数据,并根据所述治疗数据建立时序数据矩阵;

根据所述时序数据矩阵的数据特点,选取用于疾病预测的时间序列模型;

根据所述时间序列模型对所述患者的疾病进行预测,获得所述患者的疾病预测结果。

在可选的情况下,所述根据所述时序数据矩阵的数据特点,选取用于疾病预测的时间序列模型,包括:

确定所述时序数据矩阵是否平稳;

若否,则对所述时序数据矩阵进行预处理,获得平稳化的时序数据矩阵;

根据所述平稳化的时序数据矩阵的特点确定其对应阶数;

采用特定的arima模型与所述平稳化的时序数据矩阵进行模型拟合;

获得最佳arima模型。

在可选的情况下,在所述根据所述时间序列模型对所述患者的疾病进行预测之前,所述方法还包括:

获得用于测试和验证的治疗数据,建立测试集时序数据矩阵和验证集时序数据矩阵;

将所述测试集时序数据矩阵导入所述最佳arima模型中,获得预测结果;

将所述预测结果与所述验证集时序数据矩阵进行对比,获得模型预测偏差,所述模型预测偏差包括决定系数或贝叶斯信息准则;

若所述模型预测偏差小于预设偏差阈值,则确定使用所述最佳arima模型。

在可选的情况下,所述根据所述治疗数据建立时序数据矩阵,包括:

将所述治疗数据进行特征提取,获得其中的患者身体状况信息;

将所述患者身体状况信息按照时间进行记录,获得时序数据;

获取所述患者身体状况信息对应的医生治疗信息,结合所述时序数据,获得时序数据矩阵。

在可选情况下,所述将所述患者身体状况按照时间进行记录,包括:

将所述患者身体状况信息与多种疾病信息中的每种疾病信息进行匹配,获得与所述每种疾病信息的匹配相似度;

若所述匹配相似度大于第一预设阈值,则判定患者有该种疾病的患病倾向;

若所述患者的具有患病倾向的疾病种类超过预设种类数,则将所述患者身体状况信息按照短期时间间隔进行记录,所述短期时间间隔为小于一星期的时间间隔。

在可选的情况下,所述根据所述时间序列模型对所述患者的疾病进行预测,获得所述患者的疾病预测结果包括:

根据所述时间序列模型结合患者的时序数据矩阵,获得所述患者的疾病预测结果,所述疾病预测结果包括所述患者可能患病的时间、类型以及概率。

在可选的情况下,所述方法还包括:

若预测到所述患者针对第一类疾病的患病概率大于第二预设阈值,则减小记录所述患者身体信息的时间间隔,获得新的时序数据矩阵;

将所述新的时序数据矩阵结合所述最佳arima模型对所述患者的疾病进行预测,获得新的疾病预测结果;

若所述新的疾病预测结果也表征所述患者针对第一类疾病的患病概率大于第二预设阈值,则确定所述患者具有患第一类疾病的风险;

针对第一类疾病对所述患者进行预防治疗。

本发明实施例的第二方面提供了一种疾病预测装置,所述疾病预测装置包括:

建立单元,用于从医疗数据库获取脱敏后的患者唯一编码对应的治疗数据,并根据所述治疗数据建立时序数据矩阵;

选取单元,用于根据所述时序数据矩阵的数据特点,选取用于疾病预测的时间序列模型;

预测单元,用于根据所述时间序列模型对所述患者的疾病进行预测,获得所述患者的疾病预测结果。

本发明实施例第三方面提供了一种电子装置,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行第一方面任一方法中的步骤的指令。

本发明实施例第四方面提供了一种计算机可读存储介质,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行第一方面任一方法所述的步骤的指令。

可见,本发明实施例所描述的基于智能决策的疾病预测方法中,首先从医疗数据库获取脱敏后的患者唯一编码对应的治疗数据,并根据治疗数据建立时序数据矩阵,然后根据时序数据矩阵的数据特点,选取用于疾病预测的时间序列模型,最后根据时间序列模型对患者的疾病进行预测,获得患者的疾病预测结果。在这个过程中,通过对医疗数据的处理,建立时序数据矩阵,使得疾病预测与时间建立联系,然后根据时序数据矩阵的数据特点选取恰当的时间序列模型,获得疾病预测结果,提升了疾病预测结果的准确度,对患者的疾病预防和治疗提供指导。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种基于智能决策的疾病预测方法流程示意图;

图2是本发明实施例提供的另一种基于智能决策的疾病预测方法的流程示意图;

图3是本发明实施例提供的另一种基于智能决策的疾病预测方法的流程示意图;

图4是本发明实施例提供的另一种基于智能决策的疾病预测方法的流程示意图;

图5是本发明实施例提供的一种电子装置的结构示意图;

图6是本发明实施例提供的一种疾病预测装置的结构框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置展示该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

下面对本发明实施例进行详细介绍。

请参阅图1,图1为本发明实施例中一种基于智能决策的疾病预测方法流程示意图,如图1所示,所述基于智能决策的疾病预测方法包括:

101、从医疗数据库获取脱敏后的患者唯一编码对应的治疗数据,并根据所述治疗数据建立时序数据矩阵。

在互联网社会,患者的健康数据,包括预约挂号、诊中数据、支付数据或健康体检等,都能够通过互联网进行记录或存储。根据这些医疗大数据建立库,以用于健康监控、患者治疗、医药开发或医保政策制定等,都具有十分重要的价值。

根据患者的健康数据建立库后,为了保证患者的隐私,需要对患者的隐私数据进行脱敏处理,具体包括对如姓名、身份证号、手机号、医保卡号、客户号等个人信息真实数据进行改造,以提供测试使用。同时为了区别不同的患者及其对应,需要为每个患者设置唯一编码,以便根据唯一编码获取该患者对应的。

获得治疗数据后,可建立时序数据矩阵。时序数据是指时间序列数据,是同一统一指标按时间顺序记录的数据列。时间数据组成的矩阵即为时序数据矩阵。医疗数据中包括患者的诊断数据和体检数据,具体又包括患者的体重、身高、工作环境、生活环境、体检结果、常见指标、医生诊断等信息,以患者的长期健康数据构建时序数据矩阵,可以获取患者身体状况信息为特征,医生诊断信息为标签,建立时序数据矩阵,具体如表1所示:

表1时序数据矩阵

获得患者身体状况信息的关键字描述后,还需要对这些信息进行量化处理,以便导入模型进行量化分析。对于身体状况信息的量化处理,可以建立一个量化表,包含原始数据及其对应的量化数值。可以根据每一项身体指标获取一个量化数值,也可以根据所有的身体指标获取一个量化数值。获得量化数值的方法可以是:求取测量参数值与正常参数值范围的最大值之差,和最小值之差,并根据与最大值之差和最小值之差求得乘积,作为量化数值。如公式1所示:

f1=(f1-fmin)*(f1-max)(1)

其中f1表示量化数值,f1表示测量参数值,fmin表示正常参数值范围的最小值,fmax表示正常参数值范围的最大值。当测量参数值不处于正常参数值范围内时,f1为正数,当测量参数值处于正常参数值范围内时,f1为负数,因此可以很容易观测测量参数值是否处于正常参数值范围。

可选的,对于医生诊断信息这一标签数据,可作为一个影响参数,用于修正量化数值。如果在获得患者的身体状况信息的同时,获得了医生诊断信息,那么根据医生诊断信息的评级,为量化数值赋予权值。例如表1中,2018.5-2018.7对患者已经确诊为1型糖尿病,那么可以为f1设置一个确诊权值α,如果对患者为“疑似”的诊断结果,那么可以为f1设置一个疑似权值β,其中α>β。

可选的,对于医生诊断信息这一标签数据,也可以作为一个指导参数,用于对患者预测疾病类型的指导,例如2018.5-2018.7对患者已经确诊为1型糖尿病,那么可预测该患者患ⅱ型糖尿病的概率。

102、根据所述时序数据矩阵的数据特点,选取用于疾病预测的时间序列模型。

时序数据存在平稳性问题,围绕着一个常数上下波动且波动范围有限,即有常数均值和常数方差,则表示时序数据平稳;如果有明显的趋势或周期性,则表明时序数据不平稳。另外,如果时序数据完全无序地随机波动,没有任何信息可提取,则表明该时序数据为白噪声序列。对于平稳的时序数据,可以采用自回归滑动平均模型(arma模型,auto-regressiveandmovingaveragemodel)作为预测模型,对于非平稳的时序数据,则可以采用自回归积分滑动平均模型(autoregressiveintegratedmovingaveragemodel,arima模型)作为预测模型,arima模型能够对时序数据进行差分、对数变换、平方根变换等处理,使时序序列达到平稳化,进而对时序数据进行模型拟合,获得最恰当的预测模型。此外,还可以采用极限梯度提升(extremegradientboosting,xgboost)算法或人工神经网络等算法针对时序数据进行疾病预测。

可选的,根据时序数据矩阵的数据特点,选取用于疾病预测的时间序列模型包括:确定时序数据矩阵是否平稳;若否,则对时序数据矩阵进行预处理,获得平稳化的时序数据矩阵;根据平稳化的时序数据矩阵的特点确定其对应阶数;采用特定的arima模型与平稳化的时序数据矩阵进行模型拟合;获得最佳arima模型。

在确定时序数据矩阵是否平稳时,可以采用的方法包括:直接画出时间序列的趋势图,看趋势判断;或者画自相关和偏自相关图,平稳的序列的自相关图(autocorrelation)和偏相关图(partialcorrelation)要么拖尾,要么是截尾;或者通过单位根检验,检验序列中是否存在单位根,如果存在单位根就是非平稳时间序列。不平稳序列可以通过差分转换为平稳序列。k阶差分就是相距k期的两个序列值之间相减。时间序列数据被平稳化处理后,arima(p,d,q)模型就转化为arma(p,q)模型。其中arima(p,d,q)中,p为自回归项,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。采用自相关函数或偏自相关函数来判别arma(p,q)模型的系数和阶数,然后对arma模型进行参数估计,可采用的参数估计方法包括最大似然估计或最小二乘积等方法。在获得多个时序模型时,不断调试比较,借助拟合优度检验统计量来对比模型的优劣度,获得最佳arima模型。

可选的,在根据时间序列模型对患者的疾病进行预测之前,该方法还包括:获得用于测试和验证的治疗数据,建立测试集时序数据矩阵和验证集时序数据矩阵;将测试集时序数据矩阵导入最佳arima模型中,获得预测结果;将预测结果与验证集时序数据矩阵进行对比,获得模型预测偏差,模型预测偏差包括决定系数或贝叶斯信息准则;若模型预测偏差小于预设偏差阈值,则确定使用最佳arima模型。

在根据时间序列模型对患者的疾病进行预测之前,需要检验时间序列模型的预测效果,即通过测试集获得测试结果,然后将测试结果与验证集中的实际结果进行对比,获得模型预测偏差,如果模型预测偏差小于预设偏差阈值,则说明该时间序列模型表现优良,可采用该最佳arima模型。

可选的,将患者身体状况按照时间进行记录,包括:将患者身体状况信息与多种疾病信息中的每种疾病信息进行匹配,获得与每种疾病信息的匹配相似度;若匹配相似度大于第一预设阈值,则判定患者有该种疾病的患病倾向;若患者的具有患病倾向的疾病种类超过预设种类数,则将患者身体状况信息按照短期时间间隔进行记录,短期时间间隔为小于一星期的时间间隔。

具体地,获取到的患者身体状况信息是非常丰富的,每种身体状况信息之间又互相融合影响,会增加会患者疾病预测的难度。因此,将患者的身体状况信息与多种疾病信息中的每一种疾病信息进行匹配,并计算患者身体状况信息与每一种疾病信息的匹配相似度,例如患者甲有5中身体状况信息处于正常范围值外,其中4项满足a类疾病的症状,而a类疾病总共有8种表现症状,那么患者甲的身体状况信息与a类疾病的匹配相似度为:4÷8*100%=50%,即患者满足该类疾病的表现症状数÷该类疾病总共表现症状数*100%。如果患者与某种疾病的相似度大于预设阈值,例如80%,说明患者有患该类疾病的倾向,如果患者有患预设种类数疾病的倾向,说明该患者是重点观察队形,需要按照短期时间间隔记录该患者身体状况信息,以便能够更严密地监测该患者的身体状况,从而做出更准确的疾病预测。其中,预设种类数可以是任意大于0的数量;短期时间间隔为不大于一星期的时间间隔,例如7天,3天等。

另外,在采用arima模型进行疾病预测时,由于人的身体情况是变化的,而arima模型是根据数据规律进行预测,那么在身体变化情况大,使得数据规律发生巨大改变时,arima模型的对应参数也会进行调整。因此,为了使每一次arima模型都与该时间段的身体情况数据相匹配,应该根据身体情况信息更新arima模型。更新的方法包括:固定时长更改法。即每个固定时长间隔更新一次arima模型,固定时长间隔可以是1年,2年等。或者采用变点预测法。即在将身体情况数据进行部分叠加时间的分段,导入arima模型,如果非叠加时间部分数据造成的预测偏差大于预设偏差值,则将非叠加时间的起点设置为变点,从变点开始,获取新的arima模型模型参数,更新arima模型。

可见,在本申请实施例中,通过对时序数据矩阵数据特定的研究,选取疾病预测的时间序列模型,并在选取了时间序列模型后,获取训练集和测试集数据,对时间序列模型的预测准确度进行评估,进一步确定最佳模型。同时,考虑到时序数据矩阵的变化性,对时间序列模型进行更新和调整,进一步确定了更准确和有效的时间序列模型,以便后续进行疾病预测时,提高预测准确性。

103、根据所述时间序列模型对所述患者的疾病进行预测,获得所述患者的疾病预测结果。

患者的患病通常具有一定的规律性,例如某些年龄段是某类疾病的高发时段,某些人群是某类疾病的高发人群,通过对患者身体状况的长期记录和模型匹配,可以对患者的患病的疾病进行预测。

可选的,根据时间序列模型对患者的疾病进行预测,获得患者的疾病预测结果包括:根据时间序列模型结合患者的时序数据矩阵,获得患者的疾病预测结果,疾病预测结果包括患者可能患病的时间、类型以及概率。

具体地,根据时序数据矩阵与时间序列模型,可以获得患者在时间轴上的身体量化数据波动情况,当数据波动到某个值时,表明患者患病,因此,可以对患者的患病时间进行预测。而患者的时序数据矩阵在时间序列模型上的波动情况,还可以与某类疾病的参数值在时间序列模型上的波动情况进行匹配,那么可以预测患者罹患疾病的类型及概率。

可选的,该方法还包括:若预测到患者针对第一类疾病的患病概率大于第二预设阈值,则减小记录患者身体信息的时间间隔,获得新的时序数据矩阵;将新的时序数据矩阵结合最佳arima模型对患者的疾病进行预测,获得新的疾病预测结果;若新的疾病预测结果也表征患者针对第一类疾病的患病概率大于第二预设阈值,则确定患者具有患第一类疾病的风险;针对第一类疾病对患者进行预防治疗。

具体地,若根据时间序列模型预测到患者针对第一类疾病的患病概率大于第二预设阈值,那么需要针对该类疾病对患者进行重点观察,缩短记录患者身体信息的时间间隔,获得新的时序数据矩阵,以便对前一次的疾病预测结果进行验证和补充,如果第二次预测结果依然表征患者针对第一类疾病的患病概率大于第二预设阈值,那么确定患者具有患第一类疾病的风险。可以针对第一类疾病对患者进行预防治疗,降低患者患病的概率。

可见,在本申请实施例中,首先从医疗数据库获取脱敏后的患者唯一编码对应的治疗数据,并根据治疗数据建立时序数据矩阵,然后根据时序数据矩阵的数据特点,选取用于疾病预测的时间序列模型,最后根据时间序列模型对患者的疾病进行预测,获得患者的疾病预测结果。在这个过程中,通过对医疗数据的处理,建立时序数据矩阵,使得疾病预测与时间建立联系,然后根据时序数据矩阵的数据特点选取恰当的时间序列模型,获得疾病预测结果,提升了疾病预测结果的准确度,对患者的疾病预防和治疗提供指导。

请参阅图2,图2是本发明实施例提供的另一种基于智能决策的疾病预测方法的流程示意图,如图所示,本实施例中的基于智能决策的疾病预测方法包括:

201、从医疗数据库获取脱敏后的患者唯一编码对应的治疗数据;

202、将所述治疗数据进行特征提取,获得其中的患者身体状况信息;

203、将所述患者身体状况信息按照时间进行记录,获得时序数据;

204、获取所述患者身体状况信息对应的医生治疗信息,结合所述时序数据,获得时序数据矩阵;

205、确定所述时序数据矩阵是否平稳;

206、若否,则对所述时序数据矩阵进行预处理,获得平稳化的时序数据矩阵;

207、根据所述平稳化的时序数据矩阵的特点确定其对应阶数;

208、采用特定的arima模型与所述平稳化的时序数据矩阵进行模型拟合,获得最佳arima模型,作为用于疾病预测的时间序列模型;

209、根据所述时间序列模型对所述患者的疾病进行预测,获得所述患者的疾病预测结果。

在本发明实施例中,通过获取治疗数据中的患者身体状况信息,结合医生治疗信息,建立时序数据矩阵,然后对时序数据进行平稳化处理,确定时序数据矩阵的阶数,并采用arima模型与平稳化的时序数据矩阵进行模型拟合,获得最佳arima模型,作为用于疾病预测的时间序列模型。这个过程提升了选取时间序列模型的效率和准确性,使得模型能够用于疾病预测,进而提高疾病预测的准确率。

请参阅图3,图3是本发明实施例提供的另一种基于智能决策的疾病预测方法的流程示意图,如图所示,本实施例中的基于智能决策的疾病预测方法包括:

301、从医疗数据库获取脱敏后的患者唯一编码对应的治疗数据,并根据所述治疗数据建立时序数据矩阵;

302、确定所述时序数据矩阵是否平稳;

303、若否,则对所述时序数据矩阵进行预处理,获得平稳化的时序数据矩阵;

304、根据所述平稳化的时序数据矩阵的特点确定其对应阶数;

305、采用特定的arima模型与所述平稳化的时序数据矩阵进行模型拟合,获得最佳arima模型;

306、获得用于测试和验证的治疗数据,建立测试集时序数据矩阵和验证集时序数据矩阵;

307、将所述测试集时序数据矩阵导入所述最佳arima模型中,获得预测结果;

308、将所述预测结果与所述验证集时序数据矩阵进行对比,获得模型预测偏差,所述模型预测偏差包括决定系数或贝叶斯信息准则;

309、若所述模型预测偏差小于预设偏差阈值,则确定使用所述最佳arima模型作为用于疾病预测的时间序列模型;

310、根据所述时间序列模型对所述患者的疾病进行预测,获得所述患者的疾病预测结果。

在本发明实施例中,通过对时序数据矩阵进行预处理,获得平稳化的时序数据矩阵,然后根据平稳化的时序数据矩阵确定最佳arima模型。针对获取到的最佳arima模型,采用测试集和验证集的时序数据矩阵对其预测偏差进行验证,如果预测偏差小于预设偏差阈值,则确定使用该最佳arima模型作为用于疾病预测的时间序列模型。这个过程对采用的最佳arima模型进行了进一步验证,使得选取的最佳arima模型的预测偏差小,满足预测需求,提升疾病预测的效率和准确率。

请参阅图4,图4是本发明实施例提供的另一种基于智能决策的疾病预测方法的流程示意图,如图所示,本实施例中的基于智能决策的疾病预测方法包括:

401、从医疗数据库获取脱敏后的患者唯一编码对应的治疗数据;

402、将所述治疗数据进行特征提取,获得其中的患者身体状况信息;

403、将所述患者身体状况信息与多种疾病信息中的每种疾病信息进行匹配,获得与所述每种疾病信息的匹配相似度;

404、若所述匹配相似度大于第一预设阈值,则判定患者有该种疾病的患病倾向;

405、若所述患者的具有患病倾向的疾病种类超过预设种类数,则将所述患者身体状况信息按照短期时间间隔进行记录,获得时序数据,所述短期时间间隔为不大于一星期的时间间隔;

406、获取所述患者身体状况信息对应的医生治疗信息,结合所述时序数据,获得时序数据矩阵;

407、根据所述时间序列模型结合患者的时序数据矩阵,获得所述患者的疾病预测结果,所述疾病预测结果包括所述患者可能患病的时间、类型以及概率;

408、若预测到所述患者针对第一类疾病的患病概率大于第二预设阈值,则减小记录所述患者身体信息的时间间隔,获得新的时序数据矩阵;

409、将所述新的时序数据矩阵结合所述最佳arima模型对所述患者的疾病进行预测,获得新的疾病预测结果;

410、若所述新的疾病预测结果也表征所述患者针对第一类疾病的患病概率大于第二预设阈值,则确定所述患者具有患第一类疾病的风险;

411、针对第一类疾病对所述患者进行预防治疗。

在本发明实施例中,获取治疗数据中的患者身体状况信息,然后根据患者身体状况信息确定患者患疾病倾向的种类数,如果患者具有患超过预测种类数的疾病的倾向,则按照短期时间间隔记录该用户的身体状况信息,生成时序数据举证,用于时间序列模型,获得预测结果。如果预测结果表明患者患某类型疾病的概率过高,则减小记录患者身体信息的时间间隔,获得新的时序数据矩阵,并最终获得新的疾病预测结果,根据新的疾病预测结果确定患者是否有患该类疾病的风险,并做出预防治疗。在这个过程中,通过对记录用户身体状况信息时间间隔的调整,使得模型对患者疾病进行更精确的预测,进而提升了疾病预测结果的准确率。

图5是本发明实施例提供的一种电子装置的结构示意图,如图5所示,该电子装置包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行以下步骤的指令:

从医疗数据库获取脱敏后的患者唯一编码对应的治疗数据,并根据所述治疗数据建立时序数据矩阵;

根据所述时序数据矩阵的数据特点,选取用于疾病预测的时间序列模型;

根据所述时间序列模型对所述患者的疾病进行预测,获得所述患者的疾病预测结果。

可见,电子装置首先从医疗数据库获取脱敏后的患者唯一编码对应的治疗数据,并根据治疗数据建立时序数据矩阵,然后根据时序数据矩阵的数据特点,选取用于疾病预测的时间序列模型,最后根据时间序列模型对患者的疾病进行预测,获得患者的疾病预测结果。在这个过程中,通过对医疗数据的处理,建立时序数据矩阵,使得疾病预测与时间建立联系,然后根据时序数据矩阵的数据特点选取恰当的时间序列模型,获得疾病预测结果,提升了疾病预测结果的准确度,对患者的疾病预防和治疗提供指导。

在一个可能的示例中,在所述根据所述时序数据矩阵的数据特点,选取用于疾病预测的时间序列模型方面,所述程序包括用于执行以下步骤的指令:

确定所述时序数据矩阵是否平稳;

若否,则对所述时序数据矩阵进行预处理,获得平稳化的时序数据矩阵;

根据所述平稳化的时序数据矩阵的特点确定其对应阶数;

采用特定的arima模型与所述平稳化的时序数据矩阵进行模型拟合,获得最佳arima模型,作为用于疾病预测的时间序列模型。

在一个可能的示例中,在所述根据所述时间序列模型对所述患者的疾病进行预测之前,所述程序包括用于执行以下步骤的指令:

获得用于测试和验证的治疗数据,建立测试集时序数据矩阵和验证集时序数据矩阵;

将所述测试集时序数据矩阵导入所述最佳arima模型中,获得预测结果;

将所述预测结果与所述验证集时序数据矩阵进行对比,获得模型预测偏差,所述模型预测偏差包括决定系数或贝叶斯信息准则;

若所述模型预测偏差小于预设偏差阈值,则确定使用所述最佳arima模型作为用于疾病预测的时间序列模型。

在一个可能的示例中,在所述根据所述治疗数据建立时序数据矩阵方面,所述程序包括用于执行以下步骤的指令:

将所述治疗数据进行特征提取,获得其中的患者身体状况信息;

将所述患者身体状况信息按照时间进行记录,获得时序数据;

获取所述患者身体状况信息对应的医生治疗信息,结合所述时序数据,获得时序数据矩阵。

在一个可能的示例中,在将所述患者身体状况按照时间进行记录方面,所述程序包括用于执行以下步骤的指令:

将所述患者身体状况信息与多种疾病信息中的每种疾病信息进行匹配,获得与所述每种疾病信息的匹配相似度;

若所述匹配相似度大于第一预设阈值,则判定患者有该种疾病的患病倾向;

若所述患者的具有患病倾向的疾病种类超过预设种类数,则将所述患者身体状况信息按照短期时间间隔进行记录,所述短期时间间隔为不大于一星期的时间间隔。

在一个可能的示例中,在根据所述时间序列模型对所述患者的疾病进行预测,获得所述患者的疾病预测结果方面,所述程序包括用于执行以下步骤的指令:

根据所述时间序列模型结合患者的时序数据矩阵,获得所述患者的疾病预测结果,所述疾病预测结果包括所述患者可能患病的时间、类型以及概率。

在一个可能的示例中,所述程序包还括用于执行以下步骤的指令:

若预测到所述患者针对第一类疾病的患病概率大于第二预设阈值,则减小记录所述患者身体信息的时间间隔,获得新的时序数据矩阵;

将所述新的时序数据矩阵结合所述最佳arima模型对所述患者的疾病进行预测,获得新的疾病预测结果;

若所述新的疾病预测结果也表征所述患者针对第一类疾病的患病概率大于第二预设阈值,则确定所述患者具有患第一类疾病的风险;

针对第一类疾病对所述患者进行预防治疗。

图6是本发明实施例中所涉及的疾病预测装置600的功能单元组成框图。该疾病预测装置600应用于电子装置,所述疾病预测装置包括:

建立单元601,用于从医疗数据库获取脱敏后的患者唯一编码对应的治疗数据,并根据所述治疗数据建立时序数据矩阵;

选取单元602,用于根据所述时序数据矩阵的数据特点,选取用于疾病预测的时间序列模型;

预测单元603,用于根据所述时间序列模型对所述患者的疾病进行预测,获得所述患者的疾病预测结果。

在此,需要说明的是,上述建立单元601、选取单元602和预测单元603的具体工作过程参见上述步骤101-103的相关描述。在此不再赘述。

可以看出,在本发明实施例中,疾病预测装置首先从医疗数据库获取脱敏后的患者唯一编码对应的治疗数据,并根据治疗数据建立时序数据矩阵,然后根据时序数据矩阵的数据特点,选取用于疾病预测的时间序列模型,最后根据时间序列模型对患者的疾病进行预测,获得患者的疾病预测结果。在这个过程中,通过对医疗数据的处理,建立时序数据矩阵,使得疾病预测与时间建立联系,然后根据时序数据矩阵的数据特点选取恰当的时间序列模型,获得疾病预测结果,提升了疾病预测结果的准确度,对患者的疾病预防和治疗提供指导。

在可选情况下,在根据所述时序数据矩阵的数据特点,选取用于疾病预测的时间序列模型方面,所述选取单元602具体用于:

确定所述时序数据矩阵是否平稳;

若否,则对所述时序数据矩阵进行预处理,获得平稳化的时序数据矩阵;

根据所述平稳化的时序数据矩阵的特点确定其对应阶数;

采用特定的arima模型与所述平稳化的时序数据矩阵进行模型拟合,获得最佳arima模型,作为用于疾病预测的时间序列模型。

在可选情况下,在根据所述时间序列模型对所述患者的疾病进行预测之前,所述选取单元602还具体用于:

获得用于测试和验证的治疗数据,建立测试集时序数据矩阵和验证集时序数据矩阵;

将所述测试集时序数据矩阵导入所述最佳arima模型中,获得预测结果;

将所述预测结果与所述验证集时序数据矩阵进行对比,获得模型预测偏差,所述模型预测偏差包括决定系数或贝叶斯信息准则;

若所述模型预测偏差小于预设偏差阈值,则确定使用所述最佳arima模型作为用于疾病预测的时间序列模型。

在可选情况下,在根据所述治疗数据建立时序数据矩阵方面,所述建立单元601具体用于:

将所述治疗数据进行特征提取,获得其中的患者身体状况信息;

将所述患者身体状况信息按照时间进行记录,获得时序数据;

获取所述患者身体状况信息对应的医生治疗信息,结合所述时序数据,获得时序数据矩阵。

在可选情况下,在将所述患者身体状况按照时间进行记录方面,所述建立单元601具体用于:

将所述患者身体状况信息与多种疾病信息中的每种疾病信息进行匹配,获得与所述每种疾病信息的匹配相似度;

若所述匹配相似度大于第一预设阈值,则判定患者有该种疾病的患病倾向;若所述患者的具有患病倾向的疾病种类超过预设种类数,则将所述患者身体状况信息按照短期时间间隔进行记录,所述短期时间间隔为不大于一星期的时间间隔。

在可选情况下,在根据所述时间序列模型对所述患者的疾病进行预测,获得所述患者的疾病预测结果方面,所述预测单元603具体用于:

根据所述时间序列模型结合患者的时序数据矩阵,获得所述患者的疾病预测结果,所述疾病预测结果包括所述患者可能患病的时间、类型以及概率。

在可选情况下,所述疾病预测装置600还包括确定单元601,具体用于:

若预测到所述患者针对第一类疾病的患病概率大于第二预设阈值,则减小记录所述患者身体信息的时间间隔,获得新的时序数据矩阵;

将所述新的时序数据矩阵结合所述最佳arima模型对所述患者的疾病进行预测,获得新的疾病预测结果;

若所述新的疾病预测结果也表征所述患者针对第一类疾病的患病概率大于第二预设阈值,则确定所述患者具有患第一类疾病的风险;

针对第一类疾病对所述患者进行预防治疗。

本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括移动终端。

本发明实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,上述计算机包括移动终端。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

上述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:u盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、rom、ram、磁盘或光盘等。

以上对本发明实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1