一种疫情风险评估方法、系统及可读存储介质与流程

文档序号:29624100发布日期:2022-04-13 14:00阅读:349来源:国知局
一种疫情风险评估方法、系统及可读存储介质与流程

1.本技术涉及大数据处理技术领域,具体而言,涉及一种疫情风险评估 方法、系统及可读存储介质。


背景技术:

2.按照新冠肺炎疫情防控中提出的“充分运用大数据分析等方法支撑新 冠肺炎疫情防控工作”的要求,借鉴sars、禽流感等疫情防控经验,各地 区已充分利用大数据、信息化技术等支撑手段,开展了疫情实时大数据报 告、健康码等建设与应用工作,这些应用在疫情防控工作中均发挥了重要 作用。然而,现有的疫情防控支撑手段,在统计、以及风险评估方面,通 常统计区域有限,且以现状评估居多,存在风险评估不全面的问题。


技术实现要素:

3.本技术实施例的目的在基于提供一种疫情风险评估方法、系统及可读 存储介质,可以提高风险评估全面性。
4.本技术实施例还提供了一种疫情风险评估方法,包括:
5.结合用于反映风险评估因子数量的数量数值维度、用于反映对应统计 疫情关联地区占地面积上的风险程度的空间密度维度、以及用于反映对应 疫情关联地区的人均风险程度的人口密度维度,确定与疫情风险相关联的 历史风险评估数据;
6.根据所述历史风险评估数据构建训练样本集,并以预设的机器学习算 法进行风险预测模型的训练;所述机器学习算法包括adaboost算法;
7.通过训练好的风险预测模型,对所确定的实时风险评估数据进行处理, 得到疫情在未来预设天数内的发展趋势。
8.第二方面,本技术实施例还提供了一种疫情风险评估系统,该系统包 括:数据处理模块、模型训练模块和风险预测模块,其中:
9.所述数据处理模块,用于结合用于反映风险评估因子数量的数量数值 维度、用于反映对应统计疫情关联地区占地面积上的风险程度的空间密度 维度、以及用于反映对应疫情关联地区的人均风险程度的人口密度维度, 确定与疫情风险相关联的历史风险评估数据;
10.所述模型训练模块,用于根据所述历史风险评估数据构建训练样本集, 并以预设的机器学习算法进行风险预测模型的训练;所述机器学习算法包 括adaboost算法;
11.所述风险预测模块,用于通过训练好的风险预测模型,对所确定的实 时风险评估数据进行处理,得到疫情在未来预设天数内的发展趋势。
12.第三方面,本技术实施例还提供了一种可读存储介质,所述可读存储 介质中包括疫情风险评估方法程序,所述疫情风险评估方法程序被处理器 执行时,实现如上述任一项所述的一种疫情风险评估方法的步骤。
13.由上可知,本技术实施例提供的一种疫情风险评估方法、系统及可读 存储介质,
通过数量数值维度、空间密度维度、以及人口密度维度,确定 与疫情风险相关联的历史风险评估数据,提高了风险评估全面性。在统计 方面,相比于现有技术只到区县级,本技术也可以通过疫情关联地区的占 地面积、以及人均风险程度进行疫情传播风险评估,涉及的统计范围更广 泛,使得最终得到的预测分析结果能够与疫情实际传播趋势相匹配。
14.本技术的其他特征和优点将在随后的说明书阐述,并且,部分地从说 明书中变得显而易见,或者通过实施本技术实施例了解。本技术的目的和 其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的 结构来实现和获得。
附图说明
15.为了更清楚地说明本技术实施例的技术方案,下面将对本技术实施例 中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术 的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人 员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相 关的附图。
16.图1为本技术实施例提供的疫情风险评估方法的一种流程图。
17.图2为一个实施例中实验研究的街道(乡镇)、社区(村)的高、中疫 情风险数量变化图。
18.图3为一个实施例中实验研究的城市中的疫情现状风险指数变化图。
19.图4为本技术实施例提供的疫情风险评估系统的一种结构示意图。
具体实施方式
20.下面将结合本技术实施例中附图,对本技术实施例中的技术方案进行 清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例, 而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组 件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本 申请的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅 仅表示本技术的选定实施例。基于本技术的实施例,本领域技术人员在没 有做出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护 的范围。
21.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一 旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步 定义和解释。同时,在本技术的描述中,术语“第一”、“第二”等仅用 于区分描述,而不能理解为指示或暗示相对重要性。
22.在本发明的一个或多个实施例中,如图1所示,提供了的一种疫情风 险预测方法,以该方法应用于计算机设备(该计算机设备具体可以是终端 或服务器,终端具体可以但不限于是各种个人计算机、笔记本电脑、智能 手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是 多个服务器组成的服务器集群)为例进行说明,包括以下步骤:
23.步骤s100,结合用于反映风险评估因子数量的数量数值维度、用于反 映对应统计疫情关联地区占地面积上的风险程度的空间密度维度、以及用 于反映对应疫情关联地区的人均风险程度的人口密度维度,确定与疫情风 险相关联的历史风险评估数据。
24.具体的,当历史风险评估数据涉及到多个评估因子时,(1)数量数值 维度可以用来反映任一单个评估因子在数量上的取值。(2)在空间密度维 度方面,若是基于确诊患者
数量来预测疫情风险传播程度,可以确定的是 在确诊患者数量相同时,占地面积越小的区域,其相对的传播风险概率则 越高。(3)还是以确诊患者数量为例进行说明,若所在区域人口密度大的 区域(即人口数量密集区域),其风险程度相对较高。
25.在其中一个实施例中,对于上述得到的历史风险评估数据,计算机设 备将按照数量数值、空间密度、人口密度三个维度进行加权计算,且,计 算过程中,在每个计算维度将依据历史水平数据设定基准线。最终,评估 因子的具体取值,将按照极差法计算得到。
26.步骤s200,根据所述历史风险评估数据构建训练样本集,并以预设的 机器学习算法进行风险预测模型的训练;所述机器学习算法包括adaboost 算法。
27.具体的,adaboost算法是一种迭代算法,其核心思想是针对同一个训 练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成 一个更强的最终分类器(强分类器)。该算法其实是一个简单的弱分类算法 提升过程,这个过程通过不断的训练,可以提高对数据的分类能力。
28.步骤s300,通过训练好的风险预测模型,对所确定的实时风险评估数 据进行处理,得到疫情在未来预设天数内的发展趋势。
29.具体的,计算机设备基于步骤s100相同的计算原理,得到实时风险评 估数据。其中,计算机设备将通过训练好的风险预测模型,对该实时风险 评估数据进行处理,以预测得到疫情在未来多天内的风险发展趋势。示例 性的,基于日期为t的实时风险评估数据,基于该步骤可以预测得到疫情 在日期t+1(即之后一天)的风险发展趋势。之后,通过逐渐增加相应天数 的实时风险评估数据集,以此类推,可以得到未来第二天、未来第三天等 的风险发展趋势。
30.由上可知,本技术实施例提供的疫情风险预测方法,通过数量数值维 度、空间密度维度、以及人口密度维度,确定与疫情风险相关联的历史风 险评估数据,提高了风险评估全面性。在统计方面,相比于现有技术只到 区县级,本技术也可以通过疫情关联地区的占地面积、以及人均风险程度 进行疫情传播风险评估,涉及的统计范围更广泛,使得最终得到的预测分 析结果能够与疫情实际传播趋势相匹配。
31.在其中一个实施例中,风险评估数据根据病患数量确定,其中,病患 类型包括确诊患病人员、高风险患病人员、疑似患病人员、敏感症状人员、 高危地区驻停返回人员、高危地区人员流入中的至少一种类型。
32.具体的,为了使得数值具有良好的可理解性,便于相关人员认知;以 及,为了使得取到的数值,符合疫情发展规律,且能够准确反映疫情爆发、 控制、以及消亡的过程;以及,为了使得取到的数值,能够在不同区域间 具有可比性;以及,为了使得取到的数值,能够在保持各自区域独立性的 同时,还能够兼顾对地域上下隶属关系的影响,例如,某个地级市下辖6 个县,其中,一个县已被划定为高风险区域,其他五个县已被划定为低风 险区域,则该地级市至少应该被划分为中风险区域。
33.因此,当前实施例中,结合现已公开的各类反映疫情控制趋势的数据, 选择了上述的病患类型,来对疫情的未来走势进行预测。
34.可以确定的是:(1)确诊患病人员数量越多、人口密度越大,则疫情 传播的风险越高。(2)高风险患病人员是指与确诊患病人员密切接触、或 同行的人员,其取到的数量、人口密度也与疫情传播风险呈正相关。(3) 疑似患病人员是指依据国家卫生健康委办公厅
《新型冠状病毒感染的肺炎 诊疗方案试行(第五版)的通知》、《新型冠状病毒感染的肺炎防控方案(第 四版)的通知》的疑似诊断标准定义的相关人员数量,其数量、人口密度 也与疫情传播风险呈正相关。(4)敏感症状人员是指发热门诊病例以及互 联网平台在线问诊(含在线购买发烧、感冒药的人员)等人员数量,其数 量、人口密度、产生频次大致也与疫情传播风险呈正相关。(5)高危地区 驻停返回人员是指本地居民从疫情地区(例如中、高风险地区)返回的人 员数量,其层曾驻停地区的疫情风险程度越高、人员数量越多、人口密度 越高,则带来的疫情传播风险越大。(6)高危地区人员流入是指外地人员 进入本地区的人员数量,其影响同高危地区驻停返回人员一致。
35.需要说明的是,确诊患病人员、高风险患病人员以及疑似患病人员数 量一般由各地的卫生、公安部门提供。敏感症状人员一般由卫生部门、互 联网问诊以及电商平台提供。高危地区驻停返回人员、以及高危地区人员 流入数量,则由社区(村)管理部门的管理数据以及信令数据计算获取。 其中,若上述提供的各项数据中还涉及到敏感数据(例如姓名、身份证号 码等信息),还需要对其进行脱敏处理,以避免用户个人信息的泄露。
36.上述实施例中,除了采用确诊患者、疑似患者、隔离者数据,还基于 跨区域人员流动、以及互联网问诊数据,涉及到的分析数据更加全面,保 证了从多角度实现数据分析,提高了风险预测结果的准确度。
37.在其中一个实施例中,步骤s100中,结合所述数量数值维度、空间密 度维度以及人口密度维度确定历史风险评估指标值,包括:
38.步骤s1001,根据病患数量过去已在数量数值维度取到的取值集合、以 及根据疫情传播趋势所确定的病患数量当前在数值数量维度取到的第一初 始当前取值,采用极差法,计算得到第一目标当前取值。
39.需要说明的是,(1)极差法通常情况下指的是使用一组数据中的最大 值减去最小值,其目的是为了观测变量的最大观测值与最小观测值之间的 区间跨度。(2)在确定病患数量时,若涉及到的病患类型为确诊患病人员、 高风险患病人员或疑似患病人员,则将该类型病患人员14天内的活动轨迹 匹配至社区(村),以此计算每天对应所涉及社区(村)的确诊患者数量、 高风险人员数量或疑似人员数量。(3)若涉及到的病患类型为敏感症状人 员,则将当天敏感症状人员住址匹配至社区(村),以此计算所涉及的社区 (村)的敏感症状人员数量。(4)若涉及到的病患类型为高危地区驻停返 回人员以及高危地区人员流入时,则通过全球疫情数据确定各国家、城市 疫情风险系数,以此分析各社区(村)驻停返回居民来自不同风险国家、 城市的人员数量,以及,分析出各社区(村)的来自不同风险国家、城市 人员数量(之前居住在外地流入本区域)。
40.步骤s1002,根据病患数量过去已在空间密度维度取到的取值集合、以 及根据所述第一目标当前取值和关联邻近地区的区域面积对应所确定的第 二初始当前取值,采用极差法,计算得到第二目标当前取值。
41.具体的,第二初始当前取值a可以根据第一目标当前取值b,与关联邻 近地区的区域面积c之间的求除结果进一步计算得到。在进行极差计算的 时候,计算机设备会先从病患数量过去已在空间密度维度取到的取值集合 中,筛选出对应的最大已取值、以及最小已取值;之后,再将上述最大已 取值、最小已取值以及第二初始当前取值带入预设的极差计算公式(具体 的计算公式可以参考公式(3),当然不同实施例中,也可以对公式(3)进 行变
形,以适应不同的计算需求),即可计算得到第二目标当前取值。
42.步骤s1003,根据病患数量过去已在人口密度维度取到的取值集合、以 及根据所述第一目标当前取值和关联邻近地区的常住人口数量对应所确定 的第三初始当前取值,采用极差法,计算得到第三目标当前取值。
43.具体的,第三初始当前取值d基于第一目标当前取值e,与关联邻近地 区的常住人口数量发f之间的求除结果计算得到(例如,d以“e/f”的求 除结果计算得到,当然,其他实施例中,d也可以基于上述公式的变形形式 计算得到,本技术实施例对此不做限定)。第三目标当前取值的计算原理可 以参考上述步骤s1002中已公开的实施例,本技术实施例对此不做过多说 明。
44.步骤s1004,对得到的第一目标当前取值、第二目标当前取值和第三目 标当前取值进行加权计算,并基于得到的加权计算结果确定历史风险评估 指标值。
45.具体的,针对上述各个病患类型,计算机设备均会从数值数量、空间 密度和人口密度三维维度进行取值计算,若对其进行量化表征,即为计算 其具体得分。也就是说,在已知其中任一病患类型(例如确诊患者)指数 的计算方法的情况下,其他,例如高危地区驻停返回人员指数也可以基于 该计算方法进一步得到。
46.在其中一个实施例中,在计算确诊患者的总和得分x1(即确诊患者对 应的历史风险评估指标值)时,可以参考以下加权计算公式:
47.x1=ωmx
1,m
+ωax
1,a

p
x
1,p

ꢀꢀ
(4)
48.其中,wm、wa、w
p
分别为确诊患者因子在数量数值、空间密度、人口 密度三个维度风险值的加权系数。x
1,m
为相应社区(村)确诊患者在数量数 值上的得分,x
1,a
为相应社区(村)确诊患者在空间密度维度上的得分,x
1,p
为 相应社区(村)确诊患者在人口密度维度上的得分。
49.需要说明的是,参照上述社区(村)的风险评估方法,也可以逐级计 算出街道(乡镇)、区(县)、市等统计单元的风险指数,本技术实施例对 其计算过程不做过多限定。
50.上述实施例中,在计算方面,本技术以指数进行量化表征,且从数量 数值、空间密度和人口密度这几个分析维度进行风险评估,提高了分析全 面性。在统计方面,相比于现有技术只到区县级,本技术也可以街道(乡 镇)乃至社区(村)为统计单元,涉及的统计范围更广泛,使得最终得到 的预测分析结果能够与疫情实际传播趋势相匹配。
51.在其中一个实施例中,步骤s1001中,所述第一初始当前取值通过以 下步骤确定:
52.步骤s10011,基于疫情传播风险随时间衰减的变化规律,通过下述公 式(1),确定总体风险传播系数λ(t):
[0053][0054]
其中,β0为0~t0时间阶段中,疫情传播风险随时间衰减的第一衰减系 数;β1为t0~t1时间阶段中,疫情传播风险随时间衰减的第二衰减系数;t为 当前日期距离被检查人员确诊为病患的日期之间的天数,t0为总体风险传播 系数开始加快降低所需的天数,t1为总体风险传播系数降为0所需的天数。
[0055]
需要说明的是,例如,新冠肺炎类似于其他传统传染病,其也有相应 的传播规律。目前,我国已在疫情防控中采取了严格、及时、以及有效的 管控措施,可以确定的是确诊患者、疑似人员以及高风险人员产生的疫情 传播风险,会随着时间而呈衰减趋势,直至降为0。基于这一规律,本技术 定义了上述的公式(1),基于公式(1)来确定确诊患者、疑似人员以及高 风险人员的风险传播系数。其中,按现有的医学统计经验,参数t0通常取值 为7,参数t1通常取值为14,参数β0的取值通常大于参数β1。
[0056]
步骤s10012,根据所述总体风险传播系数λ(t)、预定义的相邻社区(村) 风险传播系数λ
neighbor
、所确定的目标社区(村)中每天产生的病患数量、 以及与所述目标社区(村)关联的相邻社区(村)中每天产生的病患数量, 通过下述的公式(2),计算得到第一初始当前取值:
[0057][0058]
其中,x
1,m
为社区(村)相应病患类型m在数量数值维度上取到的第一 初始当前取值,n为相邻社区的总数量,m(t)为第t天目标社区(村)中产 生的病患数量,m(t,i)为第t天与所述目标社区(村)相关联的i社区(村) 中产生的病患数量。
[0059]
具体的,以计算确诊患者在数值数量上的风险得分为例,上述公式的 计算原理为:计算机设备先定义相邻社区(村)传播系数λ
neighbor
。之后, 再将每天社区(村)确诊患者数量与相邻社区(村)传播系数相乘,匹配 至其相邻社区(村)(即准确定位到存在传播风险的相邻社区(村))。之后, 再综合社区(村)自身确诊患者数量m(t),及其定位到的相邻社区(村) 的确诊患者数量m(t,i),结合风险传播系数λ(t)和λ
neighbor
,通过公式(2) 得到社区(村)确诊患者在数值数量上的风险得分x
1,m

[0060]
在其中一个实施例中,步骤s1001中,所述第一目标当前取值通过以 下步骤计算得到:
[0061]
步骤s10011,根据病患数量过去已在数量数值维度取到的取值集合, 确定最大已取值以及最小已取值
[0062]
具体的,计算机设备可以基于冒泡排序、简单选择排序等排序方法, 从上述的取值集合中筛选出相应的最大值、以及最小值。由于上述排序方 法均为现有技术,本技术实施例对此不做过多限定。
[0063]
步骤s10012,将所确定的第一初始当前取值x
1,m
、最大已取值以 及最小已取值带入到下述极差计算公式(3)中,计算得到对应的第 一目标当前取值
[0064][0065]
需要说明的是,对于第二目标当前取值、以及第三目标当前取值的计 算方法也可以参考本实施例中的步骤s10011-步骤s10012,例如,在求取 第二目标当前取值时,可以参考的计算公式包括:其中, 为基于相应取值集合所确定
的最小已取值、和最大已取值,x
1,a
为对应所确定的第二初始当前取值。
[0066]
在其中一个实施例中,步骤s200中,所述根据所述历史风险评估数据 构建训练样本集,并以预设的机器学习算法进行风险预测模型的训练,包 括:
[0067]
步骤s2001,对涉及多项不同病患类型的历史风险评估数据进行加权计 算,得到社区(村)的疫情现状风险评估指数。
[0068]
具体的,当病患类型包括确诊患病人员、高风险患病人员、疑似患病 人员、敏感症状人员、高危地区驻停返回人员、高危地区人员流入这6种 类型,以及根据步骤步骤s1001-步骤s1004,得到各病患类型分别对应的 历史风险评估数据x1~x6时,将根据下述公式,得到社区(村)的疫情现状 风险指数:
[0069][0070]
其中,fi为各因子指标对疫情现状风险指数的影响权重,在初期历史数 据较少时,将经验可以确定的是f1~f6分别为0.3、0.2、0.2、0.1、0.1、 0.1。随着数据的不断积累,通过adaboost机器学习算法的逐步迭代,可 以不断提升上述各指数赋权准确度。
[0071]
步骤s2002,根据产生日期为t的历史风险评估数据、以及产生日期为 t+1的疫情现状风险评估指数构建训练样本集。
[0072]
具体的,对于社区(村)m,选取日期t的6个风险因子以及日期t+1的疫情现状风险评估指数r
m,t+1
组成训练 样本集(x
m,t
,r
m,t+1
)。则对于所有的社区(村),组成的训练样本集即为:
[0073]
t={(x
1,t
,r
1,t+1
),...,(x
i,t
,r
i,t+1
),...,(x
m,t
,r
m,t+1
)};
ꢀꢀ
(6)
[0074]
其中,m是所有社区(村)的总数量。
[0075]
步骤s2003,以adaboost算法进行模型训练,且,训练过程中,以设 置给所述日期为t的历史风险评估数据的趋势风险系数为估计对象,并通 过逐渐增加不同天数的训练样本集进行参数估计。
[0076]
步骤s2004,在确定估计得到的趋势风险系数满足训练结束条件时,得 到训练好的风险预测模型。
[0077]
具体的,若令:
[0078][0079]
其中,ω为设置给相应风险因子x
i,t
(i=1,...,m)的趋势风险系数,则有 y=xω,此时训练过程中将基于该公式求解ω。在一个实施例中,计算机设 备通过逐渐增加不同天数的样本集进行参数估计,并在确定ω的取值逐渐收 敛、固定时,则结束迭代,得到训练好的风险预测模型。
[0080]
在其中一个实施例中,在确定风险评估数据之前,该方法还包括:获 取行政区划的基本信息,其中,所述基本信息包括矢量图层数据、以及人 口基数信息中的至少一种,所述行政区划包括社区(村)、街道(乡镇)以 及区中的至少一种;基于所述行政区划的基本信息,对风险评估数据进行 空间定位。
[0081]
具体的,人口基数是人口统计学的概念,就是在统计人口变化的时候, 所使用的人口数的一个基本量,在这个基本量的基础上,计算人口的变化, 比如增长率,增长量。同样的增长率,如果人口基数大,计算得出的增长量就 是高的。简单地说,就是变化前的人口数。
[0082]
在其中一个实施例中,人口基数信息可以通过地方政府的年鉴渠道、 社区(村)管理部门渠道、人口普查相关成果、以及电信运营商信令获取 得到。其中,涉及的定位精度到社区(村)即可。
[0083]
在其中一个实施例中,计算机设备还能够结合gis的直观、可视化等 特点对现状分析结果、风险预测分析等分析结果进行多维展示,例如,计 算机设备可以基于gis(geographic information system,地理信息系统) 提供的时间、空间维度的查询、浏览、以及统计分析功能,按照省(市)、 区(县)、街道(乡镇)、社区(村)等不同层级的统计单元进行操作,并 且针对不同的统计单元,提供时间轴(日、周、月等)的变化展示。又例 如,计算机设备还可以基于gis提供的专题图功能,提供分层设色、直方 图、以及饼图等专题图展示功能。又例如,计算机设备还可以基于gis提 供的排序查询展示功能,按照区(县)、街道(乡镇)、社区(村)等不同 层级的排名顺序,进行将相应分析结果顺排、或逆排展示在可视化界面上。
[0084]
在其中一个实施例中,以xx市实验研究区域为例,需要说明的是,xx 市辖区总面积1.xx万平方公里,下辖xx个区、xxx个街道(乡镇)、xxxx 个社区(村)。其中,涉及到的各统计单元中的人口基数是结合xx移动、 xx联通、xx电信三家电信运营商数据和xx市统计年鉴人口数据融合得出。 其中,电信运营商人口数据依托区域基站工参、日停留时长、月停留天数、 年停留月数等参数,通过相关计算模型得出;在此基础上,利用统计年鉴 人口数据进行校核优化,然后计算得出各统计单元的人口基数。
[0085]
当前实施例中,结合xx地区的实际情况,对于公式(1)中的β0和β1通 过不同取值组合对比分析其合理性,最大程度拟合该衰减规律,最后分别 取0.8和0.6;对于公式(2)中的λ
neighbor
,其初始值以0.5进行迭代优 化;对于公式(4)中的ωm、ωa、ω
p
分别以0.4、0.3、0.3作为初始化值 进行迭代;对于公式(7)中的ω的值将通过不断迭代,最后得到: ωt=[0.954 1.038 1.016 2.984 2.031 2.033]。
[0086]
请参考图2,其为2020年4月15日的街道(乡镇)、社区(村)的高、 中疫情风险数量变化趋势。自疫情以来,截至到2021年1月15日,xx市 疫情现状风险指数变化曲线出现三个波峰,分别对应了2020年2-4月、6-7 月、2021年元旦前后这三波疫情(如图3所示);从数值上看,第二波来的 相对突发、凶险;从控制效果上看,后两次比第一次持续周期相对短,第 三次相对平稳,这也间接反映了处置应对经验积累的价值。
[0087]
综上所述,本技术实施例以xx为研究区域,样本时间从2020年2月 至2021年1月,空间范围覆盖了xx市各街道(乡镇)和社区(村),在时 间和空间维度,样本均具有较好的广度和深度,通过在xx市疫情防控工作 中的实践应用,结果表明两个指数模型与疫情的实际情况和趋势吻合度贴 近,具备良好的应用前景。
[0088]
请参照图4所示,本技术实施例提供的一种疫情风险评估系统400,该 系统400包括数据处理模块401、模型训练模块402和风险预测模块403, 其中:
[0089]
所述数据处理模块401,用于结合用于反映风险评估因子数量的数量数 值维度、
用于反映对应统计疫情关联地区占地面积上的风险程度的空间密 度维度、以及用于反映对应疫情关联地区的人均风险程度的人口密度维度, 确定与疫情风险相关联的历史风险评估数据。
[0090]
所述模型训练模块402,用于根据所述历史风险评估数据构建训练样本 集,并以预设的机器学习算法进行风险预测模型的训练;所述机器学习算 法包括adaboost算法。
[0091]
所述风险预测模块403,用于通过训练好的风险预测模型,对所确定的 实时风险评估数据进行处理,得到疫情在未来预设天数内的发展趋势。
[0092]
在其中一个实施例中,风险评估数据根据病患数量确定,其中,病患 类型包括确诊患病人员、高风险患病人员、疑似患病人员、敏感症状人员、 高危地区驻停返回人员、高危地区人员流入中的至少一种类型。
[0093]
在其中一个实施例中,数据处理模块401还用于根据病患数量过去已 在数量数值维度取到的取值集合、以及根据疫情传播趋势所确定的病患数 量当前在数值数量维度取到的第一初始当前取值,采用极差法,计算得到 第一目标当前取值;根据病患数量过去已在空间密度维度取到的取值集合、 以及根据所述第一目标当前取值和关联邻近地区的区域面积对应所确定的 第二初始当前取值,采用极差法,计算得到第二目标当前取值;根据病患 数量过去已在人口密度维度取到的取值集合、以及根据所述第一目标当前 取值和关联邻近地区的常住人口数量对应所确定的第三初始当前取值,采 用极差法,计算得到第三目标当前取值;对得到的第一目标当前取值、第 二目标当前取值和第三目标当前取值进行加权计算,并基于得到的加权计 算结果确定历史风险评估指标值。
[0094]
在其中一个实施例中,数据处理模块401还用于基于疫情传播风险随 时间衰减的变化规律,通过下述公式(1),确定总体风险传播系数λ(t):
[0095][0096]
其中,β0为0~t0时间阶段中,疫情传播风险随时间衰减的第一衰减系数; β1为t0~t1时间阶段中,疫情传播风险随时间衰减的第二衰减系数;t为当 前日期距离被检查人员确诊为病患的日期之间的天数,t0为总体风险传播系 数开始加快降低所需的天数,t1为总体风险传播系数降为0所需的天数;
[0097]
根据所述总体风险传播系数λ(t)、预定义的相邻社区(村)风险传播系 数λ
neighbor
、所确定的目标社区(村)中每天产生的病患数量、以及与所 述目标社区(村)关联的相邻社区(村)中每天产生的病患数量,通过下 述的公式(2),计算得到第一初始当前取值:
[0098][0099]
其中,x
1,m
为社区(村)相应病患类型m在数量数值维度上取到的第一初始 当前取值,n为相邻社区的总数量,m(t)为第t天目标社区(村)中产生的 病患数量,m(t,i)为第t天与所述目标社区(村)相关联的i社区(村)中产 生的病患数量。
[0100]
在其中一个实施例中,数据处理模块401还用于根据病患数量过去已 在数量数值维度取到的取值集合,确定最大已取值以及最小已取值 将所确定的第一初
始当前取值x
1,m
、最大已取值以及最小已取 值带入到下述极差计算公式(3)中,计算得到对应的第一目标当前 取值
[0101][0102]
在其中一个实施例中,模型训练模块402还用于对涉及多项不同病患 类型的历史风险评估数据进行加权计算,得到社区(村)的疫情现状风险 评估指数;根据产生日期为t的历史风险评估数据、以及产生日期为t+1 的疫情现状风险评估指数构建训练样本集;以adaboost算法进行模型训练, 且,训练过程中,以设置给所述日期为t的历史风险评估数据的趋势风险 系数为估计对象,并通过逐渐增加不同天数的训练样本集进行参数估计; 在确定估计得到的趋势风险系数满足训练结束条件时,得到训练好的风险 预测模型。
[0103]
在其中一个实施例中,该系统400还包括数据预处理模块,其中:
[0104]
数据预处理模块,用于获取行政区划的基本信息,其中,所述基本信 息包括矢量图层数据、以及人口基数信息中的至少一种,所述行政区划包 括社区(村)、街道(乡镇)以及区中的至少一种;基于所述行政区划的基 本信息,对风险评估数据进行空间定位。
[0105]
由上可知,本技术实施例提供的疫情风险预测系统,通过通过数量数 值维度、空间密度维度、以及人口密度维度,确定与疫情风险相关联的历 史风险评估数据,提高了风险评估全面性。在统计方面,相比于现有技术 只到区县级,本技术也可以通过疫情关联地区的占地面积、以及人均风险 程度进行疫情传播风险评估,涉及的统计范围更广泛,使得最终得到的预 测分析结果能够与疫情实际传播趋势相匹配。
[0106]
本技术实施例提供一种存储介质,所述计算机程序被处理器执行时, 执行上述实施例的任一可选的实现方式中的方法。其中,存储介质可以由 任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机 存取存储器(static random access memory,简称sram),电可擦除可编 程只读存储器(electrically erasable programmable read-only memory, 简称eeprom),可擦除可编程只读存储器(erasable programmable read onlymemory,简称eprom),可编程只读存储器(programmable red-only memory, 简称prom),只读存储器(read-only memory,简称rom),磁存储器,快 闪存储器,磁盘或光盘。
[0107]
在本技术所提供的实施例中,应该理解到,所揭露装置和方法,可以 通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如, 所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划 分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统, 或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦 合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦 合或通信连接,可以是电性,机械或其它的形式。
[0108]
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的, 作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地 方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的 部分或者全部单元来实现本实施例方案的目的。
[0109]
再者,在本技术各个实施例中的各功能模块可以集成在一起形成一个 独立的部
分,也可以是各个模块单独存在,也可以两个或两个以上模块集 成形成一个独立的部分。
[0110]
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或 者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或 操作之间存在任何这种实际的关系或者顺序。
[0111]
以上所述仅为本技术的实施例而已,并不用于限制本技术的保护范围, 对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术 的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本 申请的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1