一种基于疾病症状相关性的预警方法与流程

文档序号:16929733发布日期:2019-02-22 20:09阅读:482来源:国知局
一种基于疾病症状相关性的预警方法与流程

本发明涉及一种基于疾病症状相关性的预警方法,属于大数据分析技术领域。



背景技术:

在信息爆发的互联网时代,人类的生活质量从本质上得到飞跃的提升,但是随之而来,人类的健康问题往往被自己忽略,在我们身边周围有很多潜伏的疾病,比如装锁周知的sars、h7n9等,甚至还有一些不知名的病原微生物不断地由动物突传给人类,如果咋爱胜过中,我们可以通过对这些发病时间、数量和地点精确地预测出疾病的爆发,那就可以很好的控制疾病的大爆发,为营救更多的生命赢得时间。



技术实现要素:

本发明要解决的技术问题是提供一种基于疾病症状相关性的预警方法,利用疾病症状之间的相关性对疾病的异常进行预测,提前进行警示。

本发明的技术方案是:一种基于疾病症状相关性的预警方法,对收集来的症状进行筛选、根据疾病的发病历史规律在时间轴上设置不同的基线窗口,把基线窗口设置成以一个月为时间长度的小基线窗口和以一年为时间长度的大基线窗口、在不同的基线窗口下对症状进行相关性分析,即利用症状之间的一个相关系数大小判定各基线窗口下症状之间的一个相关性程度、基于相同种类症状之间的相关性在不同的基线窗口下大小的不同来判定该时间段内疾病是否异常,即比较相同种类症状在小基线窗口和大基线窗口下相关性的大小,当其之间的差值大于设定的某一个阈值时,即可认为该时段下的发病量异常,发出警告,进行预警。

具体步骤为:

step1:建立症状发病量的数据库:收集某地区一年及其以上的疾病的症状发病量情况建立一个时间轴上的症状发病量信息表,症状发病量信息表包括:症状种类编号,症状种类,对应的发病时间,症状对应的发病数量;

step2:症状筛选:在收集到的疾病症状信息字段,根据疾病与症状之间的相互关联进行一个筛选,删除无需进行相关性分析的症状;

step3:设置基线窗口:把基线窗口设置成以一个月为时间长度的基线窗口和以一年为时间长度的基线窗口,一个月为时间长度的基线窗口必须是以一年为时间的基线窗口下的一个小窗口,即10个以一个月为时间长度的基线窗口形成一个以一年为时间单位的基线窗口;

step4:症状相关性分析:根据step2筛选后的症状发病量表中,将每天各个症对应的数量依次根据症状的种类编号设为症状1:症状2:以此类推;在一年为时间长度的基线窗口下依计算不同种症状之间的协方差,把其结果进行归类筛选,移除协方差小于0的症状病种,再对剩下的症状之间进行相关系数p1计算;同样,在一个月为时间长度的基线窗口下,根据一年时间窗口下的相关症状,对其进行相关系数p2的计算;

step5:判断该时间段下疾病的发病情况是否异常:计算|p1-p2|,将其大小与设定的阈值h进行比较,当|p1-p1|>h时,表示得出p2的该窗口下这时间段内疾病的发病量出现异常,对相关部门发出警示。

所述步骤step4中,对step4中两种症状进行协方差计算公式为:

其中ai,bi分别为症状a、b第i天的发病量,为分别为样本a,b的均值。

所述步骤step4中,对step4中两种症状进行相关系数计算公式为:

其中sab为样本的协方差,计算公式为:

其中sa为样本a的标准差,计算公式为:

其中sb为样本b的标准差,计算公式为:

本发明的有益效果是:本发明较繁琐的预警系统简单直接的查找出疾病发病的异常性,大大的提高预警过程中工作的效率。

附图说明

图1是本发明的步骤流程图。

具体实施方式

下面结合附图和具体实施方式,对本发明作进一步说明。

实施例1:如图1所示,一种基于疾病症状相关性的预警方法,具体方法步骤如下:

step1:建立症状发病量的数据库:收集某地区一年及其以上的疾病的症状发病量情况建立一个时间轴上的症状发病量信息表。症状发病量信息表包括:症状种类编号,症状种类,对应的发病时间,症状对应的发病数量。

step2:症状筛选:在收集到的疾病症状信息字段,根据疾病与症状之间的相互关联进行一个筛选,删除无需进行相关性分析的症状。

step3:设置基线窗口:本发明中把基线窗口设置成以一个月为时间长度的基线窗口和以一年为时间长度的基线窗口,一个月为时间长度的基线窗口必须是以一年为时间的基线窗口下的一个小窗口,即10个以一个月为时间长度的基线窗口形成一个以一年为时间单位的基线窗口。

step4:症状相关性分析:根据step2筛选后的症状发病量表中,将每天各个症对应的数量依次根据症状的种类编号设为症状1:症状2:以此类推。在以一年为时间长度的基线窗口下带入公式:

计算不同种症状之间的协方差,把其结果进行归类筛选,移除协方差小于0的症状病种,再对剩下的症状之间进行相关系数p1计算。同样,在一个月为时间长度的基线窗口下,根据一年时间窗口下的相关症状,对其进行相关系数p2的计算,其中相关系数计算公式为:

其中sab为样本的协方差,计算公式为:

其中sa为样本a的标准差,计算公式为:

其中sb为样本b的标准差,计算公式为:

step5:判断该时间段下疾病的发病情况是否异常:计算|p1-p2|,将其大小与设定的阈值h进行比较,当|p1-p2|>h时,表示得出p2的该窗口下这时间段内疾病的发病量出现异常,对相关部门发出警示。

以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1