一种基于指数加权移动平均的症状相关性预警算法的制作方法

文档序号:16260120发布日期:2018-12-14 21:26阅读:447来源:国知局
一种基于指数加权移动平均的症状相关性预警算法的制作方法

本发明涉及一种基于指数加权移动平均的症状相关性预警算法,属于大数据分析领域。

背景技术

随着社会的发展,各种传染病肆虐着人类的身体,给无数的家庭带来了极大痛苦,并且随着社会的进步,人员流动水平和速度逐渐提升,也使得传染病在人们之间的扩散得以加剧,因此有很多部门做出传染病疫情预警的实施方案。对于症状相关性分析并没有数学的依据,结合实际,症状数量会有时间上的影响,但传统的相关性分析并没有添加这些协变量。



技术实现要素:

本发明要解决的技术问题是提供一种基于指数加权移动平均的症状相关性预警算法,意在将经过指数加权后求得均值作为相关性算法的依据,再根据求得的相关性系数进行数据比较,找出数据的异常,得出预警的时间点以及预警的数据来源,从而达到更好的预警效果。

本发明采用的技术方案是:一种基于指数加权移动平均的症状相关性预警算法,包括如下步骤:

step1:建立症状发病量的数据库:收集某地区某段时间内疾病的症状发病量情况,以每天作为一个基准窗口,建立一个时间序列上的症状发病量信息表,症状发病量信息表包括:编号,就诊时间,症状种类以及症状对应的发病数量;

step2:症状数据预处理:对采集到的症状种类信息字段进行筛选,将症状种类信息字段与所需研究的症状进行对比,剔除掉与研究无关的症状数据以及无法识别的无用症状数据;

step3:对症状进行指数加权移动平均计算:根据step2筛选好的数据,选取第一个症状作为样本x,该症状对应的每日发病数量设为第二个症状作为样本y,该症状对应的每日发病数量设为……以此类推,以样本x为例,通过按日期得到的症状数据以7天为一个基准窗口,即第一天到第七天的数据,得到第八天的指数加权移动平均值,第二天到第八天的数据,得到第九天的指数加权移动平均值,以此类推,这样就得到一系列指数加权移动平均值其中为第t天的指数加权移动平均值,同理可以得到样本y的指数加权移动平均值

step4:对症状进行相关性系数计算:通过step3得到的以7天为一个基准线的指数加权移动平均值以此作为协方差计算的均值,选取两种症状,例如:样本x和样本y来计算两种症状之间的协方差,然后继续计算该两种症状之间的相关系数rxy,以此来衡量该两种症状相关性的密切程度;

step5:对相关性系数集合进行可视化处理:通过对step4得到的一系列的rxy值进行画图显示,得到一个以7天为一个基准窗口的指数加权移动平均作为相关性系数均值的折线图,分析折线图的趋势找到异常点进行预警分析。

具体地,步骤step3中,对step3中两种症状即样本x和样本y进行指数加权移动平均计算公式为:

其中为样本x,y的第t天的指数加权移动平均值,λ为指数加权平均的阈值,λ=0.2或0.1,(1-λ)n的变量n取值从n=7开始,随着变量i增加一而减小一,直到i=t,n=1结束本次计算。

具体地,步骤step4中,

协方差计算公式为:

对step4中两种症状进行相关系数的计算公式为:

其中sx为样本x的标准差,计算公式为:

其中sy为样本y的标准差,计算公式为:

本发明的有益效果是:本发明具体是在建立症状发病量数据库、对采集到的症状信息进行筛选处理,根据所熟知症状的需求剔除不在其中的症状。传统的相关性算法只是对症状的发病数进行基本的平均值计算,忽略了在时间上的症状数据前后的影响。本发明提出的基于指数加权移动平均的症状相关性预警算法,意在将经过指数加权后求得均值作为相关性算法的依据,这样将历史回顾性数据和当前数据想结合,使得到的相关性系数更为准确,再根据求得的相关性系数进行数据比较,找出数据的异常,得出预警的时间点以及预警的数据来源,从而达到更好的预警效果。

附图说明

图1是本发明总流程图;

图2为本发明实施例中λ取值为0.1时,咳嗽和咽痛相关性系数图;

图3为本发明实施例中λ取值为0.2时,咳嗽和咽痛相关性系数图。

具体实施方式

下面结合附图和具体的实施例对本发明做进一步解说。

实施例1:如图1-3所示,一种基于指数加权移动平均的症状相关性预警算法,所述的具体方法步骤如下:

step1:获取某地区某三个月病人症状表建立的数据库,症状发病量信息表包括:编号,就诊时间,症状种类以及症状对应的发病数量;

step2:症状数据预处理:对采集到的症状种类信息字段进行筛选,将症状种类信息字段与所需研究的症状进行对比,剔除掉与研究无关的症状数据以及无法识别的无用症状数据,通过对数据库收集到的症状发病量信息进行整理得到表1:症状发病量信息表:

表1:症状发病量信息表

step3:对症状进行指数加权移动平均计算:根据表1:症状发病量信息表,选取咳嗽作为第一个样本记为x,每天的发病数量设为选取咽痛作为第二个症状y,每天的发病数量设为这里以咳嗽和咽痛两个症状作为案例样本。然后将代入到公式

这里λ取值为0.1,同样将代入到公式同样λ取值为0.1,这样我们得到一系列的值;

step4:对症状进行相关性系数计算:通过step3得到的一系列的指数加权移动平均值以此作为协方差计算的均值,首先带入到公式得到样本咳嗽和样本咽痛的一些列协方差值,然后再次将一系列的指数加权移动平均值带入到公式中得到样本咳嗽和样本咽痛的一系列标准差值,最后将上述得到的一系列协方差值和一系列的标准差值代入到公式计算该两种症状之间的一系列的相关系数rxy;

step5:对setp4得到的一系列rxy值进行绘图得到如图2:咳嗽和咽痛相关性系数图(λ=0.1)。然后改变λ的值,这里让λ=0.2再次重复step3到step5的过程,得到如图3:咳嗽和咽痛相关性系数图(λ=0.2)。

step6:通过观察图2和图3发现λ的值对该两种症状的相关性系数的总体趋之没有什么影响,只是λ取值0.2使得相关性系数的低点变高,而高点没什么变化,因此可以得出λ取值0.1或0.2对该计算结果并不大,可以忽略不计。然后通过观察咳嗽和咽痛相关性系数图,找到异常点,进行报警。

本发明提出的基于指数加权移动平均的症状相关性预警算法,意在将经过指数加权后求得均值作为相关性算法的依据,这样将历史回顾性数据和当前数据想结合,使得到的相关性系数更为准确,再根据求得的相关性系数进行数据比较,找出数据的异常,得出预警的时间点以及预警的数据来源,从而达到更好的预警效果。

以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1