本发明涉及大数据流行病防控领域,特别是一种基于大数据的流行病预测防控系统。
背景技术:
流行性传染病(简称流行病)的每次爆发都会给人类社会带来巨大损失。对流行病的研究能够有助于对流行病进行防控,同时对流行病的爆发进行预警等,有效的流行病监控能够降低流行病爆发带来的影响。
在现有技术中,对流行病的预测防控通常基于流行病传播模型进行,而常规的流行病传播模型的构建通常基于人口接触网络来构建。目前,疾病传播模型中采用的人口接触网络通常由人为设定,或者采用小规模的数据集进行构建,因此可靠性不高,从而导致疾病传播模型脱离实际情况,降低了流行病预测防控的效果。
技术实现要素:
针对上述问题,本发明旨在提供一种基于大数据的流行病预测防控系统。
本发明的目的采用以下技术方案来实现:
提出一种基于大数据的流行病预测防控系统,包括:
大数据模块,与人口普查数据库、公交信息卡系统以及医院信息采集系统连接,用于获取人口普查数据、公交信息卡数据以及医院中的人群接触数据;
人口接触网络构建模块,用于根据大数据模块中的人口普查数据、公交信息卡数据以及医院中的人群接触数据构建人口接触网络;
传播模型构建模块,用于基于人口接触模型建立针对不同流行病的传播模型;
预测防控模块,用于基于流行病传播模型预测流行病的传播爆发趋势,并根据预测结果制定流行病防控策略。
在一种实施方式中,人口接触网络构建模块进一步包括:将待确定的动态人口接触网络表示为张量m∈rg×g×t的形式,其中动态人口接触网络的空间模式表示为空间rg×g×t的基底
基于人口普查数据、公交信息卡数据以及医院中的人群接触数据构建包含多个场景的虚拟社会,并基于虚拟场景计算各个场景中各虚拟个体之间的接触概率,构成动态人口接触网络的空间模式
根据流行病监控数据以及相关的病理学参数获取动态接触网络时间模式的优化目标函数,并对该优化目标函数进行拟合参数优化,估计出动态人口接触网络的时间模式w=(w1,...,wr);
基于获取的动态人口接触网络的空间模式和时间模式建模最终动态人口接触网络。
在一种实施方式中,人口接触网络构建模块进一步包括:基于人口普查数据、公交信息卡数据以及医院中的人群接触数据构建包含多个虚拟场景的虚拟社会,其中虚拟社会包含家庭、学校、工作、通勤、医院、公共场所的虚拟场景;
其中,上述构建上述虚拟场景包括:
虚拟行政区:根据人口普查数据中的行政区域划分和各个行政区内的人口统计数据,建立虚拟行政区,为每个虚拟行政区分配相应数量的虚拟个体;根据各个行政区性别比例和年龄分布数据,为各虚拟行政区中的虚拟个体指定性别和年龄;
虚拟家庭:根据各行政区家庭户数统计数量为每个虚拟行政区分配相应数量的家庭;根据户主年龄分布、家庭成员数量和家庭组成结构等统计数量将每个虚拟个体分配到不同的虚拟家庭中;
虚拟校园:根据各行政区包含学校数量和种类的统计数据,为每个虚拟行政区分配相应数量和种类的学校;根据学校类型、人数、位置及就读率等统计数据为每个适龄虚拟个体分配就读学校;
虚拟工作场所:依据各行政区的就业率数据将适龄虚拟个体指定为就业或赋闲状态;根据工作区域与生活区域的联合分布数据为就业个体分配虚拟工作区域,根据行业类型和个体年龄的联合分布数据为就业个体指定虚拟工作类型;
虚拟通勤轨迹:根据交通信息卡数据,从中得到每张交通信息卡的移动路线,进而根据交通信息卡的注册资料,为每个虚拟个体构造出相应的虚拟通勤轨迹;
虚拟社区医院:根据各行政区社区医院和诊所基本统计信息,将各虚拟行政区中的个体分配到不同的虚拟医院和诊所中。
在一种实施方式中,人口接触网络构建模块进一步包括:
采用复合人口模型表示不同场景下的接触结构,依据虚拟社会中虚拟个体的年龄,每5岁一组,将0到85岁的个体划分为17个年龄组中,将85岁以上的个体划分到第18个年龄组中,将每个虚拟场景的群体接触结构建模为一个18×18的二维矩阵,以描述不同年龄组之间的接触概率;其中不同场景内各年龄组之间的接触概率由以下函数获得:
式中,
在一种实施方式中,人口接触网络构建模块进一步包括:社区医院虚拟场景下的各年龄接触概率根据医院信息采集系统传输的医院中的人群接触数据获取;
其中医院信息采集系统获取医院中的人群接触数据包括:
将医院中抽样选择的医生、护士、病人、保洁和护理人员作为目标对象,同时为每个目标设置唯一id,其中id包含年龄、职位、性别信息,同时为每个目标对象预装带有蓝牙程序的智能设备;蓝牙程序按照设置的扫描间隔和扫描范围扫描其他预装有该蓝牙程序的蓝牙设备,若在扫描范围内扫描其他蓝牙设备,则认为目标对象之间产生接触,记录所有的接触事件。
基于上述采集的接触事件信息,计算社区医院场景下的接触概率,其中采用的接触概率函数为:
式中,
在一种实施方式中,人口接触网络构建模块进一步包括:公交信息卡数据包括交通信息卡注册信息和刷卡信息,其中刷卡信息包括刷卡车辆,刷卡时间,乘车时长。
在一种实施方式中,大数据模块还包括管理单元,管理单元用于对大数据模块中存储的数据进行管理,其中包括对大数据模块中存储的数据进行查询、分类、修改、删除处理。
在一种实施方式中,管理单元还包括身份验证单元,身份验证单元用于获取用户登录信息,并对该用户登录信息进行身份验证,当身份验证通过后获取用户相应的数据库模块管理权限。
在一种实施方式中,身份验证单元进一步包括:
登录信息验证子单元,用于获取用户登录信息,其中包括用户名和用户密码,并对接收的登录信息进行验证,输出登录信息验证结果;
指纹信息验证子单元,用于当登录信息验证结果为正确时,进一步获取用户指纹信息,并根据获取的用户指纹信息与该用户预存的指纹信息进行比对,当比对相似度大于设定的阈值时,输出身份验证结果为正确。
在一种实施方式中,指纹信息验证子单元包括
指纹图像获取子单元,用于获取用户指纹图像;
指纹图像增强子单元,用于对获取的用户指纹图像进行增强处理,获取增强后的用户指纹图像;
指纹图像分割子单元,用于对增强后的用户指纹图像进行分割处理,获取该用户指纹图像中的指纹部分;
指纹特征提取子单元,用于指纹部分进行特征提取处理,获取该指纹部分的特征参数;
指纹验证子单元,用于将获取的指纹部分特征参数与该用户登录信息预存的特征参数进行比对,当相似度大于设定的阈值时,输出指纹验证结果以及身份验证结果为正确。
在一种实施方式中,指纹图像增强子单元,对对获取的用户指纹图像进行增强处理,包括:
1)对获取的用户指纹图像进行小波分解处理,获取低频分量和高频分量;
2)采用直方图均衡处理对低频分量进行增强处理,获取增强后的低频分量;
3)采用阈值函数对高频分量进行阈值处理,获取增强后的高频分量;
4)根据增强后的低频分量和增强后的高频分量进行小波逆变换,获取重构后的用户指纹图像;
5)对重构后的用户指纹图像进行对比度增强处理,输出增强后的用户指纹图像。
本发明的有益效果为:1)本发明系统中,通过建立与外部数据库连接的大数据模块,从而从外部数据库中获取大数据作为构建人口接触网络的基础;同时,基于获取的大数据构建人口接触网络,能够实现大规模人口接触网络的构建,同时根据构建的人口接触网络构造流行病传播模型,并根据该模型对流行病进行预测防控,能够提高了流行病传播模型的可靠性,进而提高了流行病预测防控的可靠性和准确性。
2)同时,本发明通过张量模式对人口接触网络进行建模,并根据大数据模块中的数据构建虚拟社会并构建空间基底,同时根据疾病监控数据和病理学参数获取基底的组合系数,对人口接触网络进行建模,能够有效地提高人口接触网络的可靠性和适应性。
3)本发明构建基于包括通勤轨迹和社区医院等六大虚拟场景的虚拟社会,并基于复合人口模型表达不同场景下的接触概率作为人口接触网络的空间模式,使得人口接触网络的构建更加贴近实际场景和情况,进而提高了人口接触网络构建的可靠性。
4)针对大数据模块中存有隐私信息,因此本发明中还设置有管理人身份验证单元对大数据模块中的数据的访问进行权限管理,并提出结合指纹识别的方式对管理员进行身份验证,从而提高了本发明系统中数据的安全性。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1为本发明的框架结构图;
图2为本发明大数据模块的框架结构图。
附图标记:
大数据模块1、人口接触网络构建模块2、传播模型构建模块3、预测防控模块4、管理单元11、身份验证单元12、登录信息验证子单元121、指纹信息验证子单元122、指纹图像获取子单元123、指纹图像增强子单元124指纹图像分割子单元125、指纹特征提取子单元126、指纹验证子单元127
具体实施方式
结合以下应用场景对本发明作进一步描述。
参见图1,其示出一种基于大数据的流行病预测防控系统,包括:
大数据模块1,与人口普查数据库、公交信息卡系统以及医院信息采集系统连接,用于获取人口普查数据、公交信息卡数据以及医院中的人群接触数据;
人口接触网络构建模块2,用于根据大数据模块1中的人口普查数据、公交信息卡数据以及医院中的人群接触数据构建人口接触网络;
传播模型构建模块3,用于基于人口接触模型建立针对不同流行病的传播模型;
预测防控模块4,用于基于流行病传播模型预测流行病的传播爆发趋势,并根据预测结果制定流行病防控策略。
上述实施方式中,通过建立与外部数据库连接的大数据模块,从而从外部数据库中获取大数据作为构建人口接触网络的基础;同时,基于获取的大数据构建人口接触网络,能够实现大规模人口接触网络的构建,同时根据构建的人口接触网络构造流行病传播模型,并根据该模型对流行病进行预测防控,能够提高了流行病传播模型的可靠性,进而提高了流行病预测防控的可靠性和准确性。
在一种实施方式中,人口接触网络构建模块2进一步包括:将待确定的动态人口接触网络表示为张量m∈rg×g×t的形式,其中动态人口接触网络的空间模式表示为空间rg×g×t的基底
基于人口普查数据、公交信息卡数据以及医院中的人群接触数据构建包含多个场景的虚拟社会,并基于虚拟场景计算各个场景中各虚拟个体之间的接触概率,构成动态人口接触网络的空间模式
根据流行病监控数据以及相关的病理学参数获取动态接触网络时间模式的优化目标函数,并对该优化目标函数进行拟合参数优化,估计出动态人口接触网络的时间模式w=(w1,...,wr);
基于获取的动态人口接触网络的空间模式和时间模式建模最终动态人口接触网络。
在一种实施方式中,流行病监控数据包括一种或多种流行病的监控数据,其中流行病的种类包括各种流感、流感并发症、水痘、麻疹、流行性腮腺炎和侵入性肺炎等;每条监控数据包括新增病例的感染时间、地点、年龄和性别等信息。其中病理学参数包括对各种流行病的易感程度等。
上述实施方式中,通过张量模式都人口接触网络进行建模,并根据大数据模块中的数据构建虚拟社会并构建空间基底,同时根据疾病监控数据和病理学参数获取基底的组合系数,对人口接触网络进行建模,能够有效地提高人口接触网络的可靠性和适应性,其中对张量m进行演化,能够准确模拟动态大规模人口接触网络。
在一种实施方式中,人口接触网络构建模块2进一步包括:基于人口普查数据、公交信息卡数据以及医院中的人群接触数据构建包含多个虚拟场景的虚拟社会,其中虚拟社会包含家庭、学校、工作、通勤、医院、公共场所的虚拟场景;
其中采用的人口普查数据主要包括如下信息:1)地理信息,包括行政区划分,家庭、学校、工作单位等的地理分布;2)人口统计信息,包括人口数、人口分布、年龄分布、性别比例等;3)家庭信息,包括家庭数量、组成、大小、户主信息等;4)就业信息,包括就业率、行业数量、行业分类、行业人数分布、工作区域分布等;5)教育信息,包括学校类型、学校数量、入学率、学校分布等。
首先构建一个虚拟社会,其中包含家庭、学校、工作、通勤、医院、公共场所等虚拟场景,然后计算各个亚人口之间在各个虚拟场景中的交互概率作为他们在不同场景下的接触概率。其中,上述构建上述虚拟场景包括:
虚拟行政区:根据人口普查数据中的行政区域划分和各个行政区内的人口统计数据,建立虚拟行政区,为每个虚拟行政区分配相应数量的虚拟个体;根据各个行政区性别比例和年龄分布数据,为各虚拟行政区中的虚拟个体指定性别和年龄;
虚拟家庭:根据各行政区家庭户数统计数量为每个虚拟行政区分配相应数量的家庭;根据户主年龄分布、家庭成员数量和家庭组成结构等统计数量将每个虚拟个体分配到不同的虚拟家庭中;
虚拟校园:根据各行政区包含学校数量和种类的统计数据,为每个虚拟行政区分配相应数量和种类的学校;根据学校类型、人数、位置及就读率等统计数据为每个适龄虚拟个体分配就读学校;
虚拟工作场所:依据各行政区的就业率数据将适龄虚拟个体指定为就业或赋闲状态;根据工作区域与生活区域的联合分布数据为就业个体分配虚拟工作区域,根据行业类型和个体年龄的联合分布数据为就业个体指定虚拟工作类型;
虚拟通勤轨迹:根据交通信息卡数据,从中得到每张交通信息卡的移动路线,进而根据交通信息卡的注册资料,为每个虚拟个体构造出相应的虚拟通勤轨迹;
虚拟社区医院:根据各行政区社区医院和诊所基本统计信息,将各虚拟行政区中的个体分配到不同的虚拟医院和诊所中。
通过以上步骤,构建包含行政区、家庭、校园、工作场所、通勤轨迹、社会医院6个基本社会场景的虚拟社会。其中,虚拟社会中每个虚拟个体被指定了年龄、性别、学校、职业、通勤、社会医院等与接触行为相关的基本特征。
在一种实施方式中,人口接触网络构建模块2进一步包括:
采用复合人口模型表示不同场景下的接触结构,依据虚拟社会中虚拟个体的年龄,每5岁一组,将0到85岁的个体划分为17个年龄组中,将85岁以上的个体划分到第18个年龄组中,将每个虚拟场景的群体接触结构建模为一个18×18的二维矩阵,以描述不同年龄组之间的接触概率;其中不同场景内各年龄组之间的接触概率由以下函数获得:
式中,
在一种实施方式中,人口接触网络构建模块2进一步包括:社区医院虚拟场景下的各年龄接触概率根据医院信息采集系统传输的医院中的人群接触数据获取;
其中医院信息采集系统获取医院中的人群接触数据包括:
将医院中抽样选择的医生、护士、病人、保洁和护理人员作为目标对象,同时为每个目标设置唯一id,其中id包含年龄、职位、性别信息,同时为每个目标对象预装带有蓝牙程序的智能设备;蓝牙程序按照设置的扫描间隔和扫描范围扫描其他预装有该蓝牙程序的蓝牙设备,若在扫描范围内扫描其他蓝牙设备,则认为目标对象之间产生接触,记录所有的接触事件。
基于上述采集的接触事件信息,计算社区医院场景下的接触概率,其中采用的接触概率函数为:
式中,
在一种实施方式中,人口接触网络构建模块2进一步包括:公交信息卡数据包括交通信息卡注册信息和刷卡信息,其中刷卡信息包括刷卡车辆,刷卡时间,乘车时长。
上述实施方式中,构建基于包括通勤轨迹和社区医院等六大虚拟场景的虚拟社会,并基于复合人口模型表达不同场景下的接触概率作为人口接触网络的空间模式,使得人口接触网络的构建更加贴近实际场景和情况,进而提高了人口接触网络构建的可靠性。
在一种实施方式中,人口接触网络构建模块2中针对人口接触网络时间模式的获取,包括:
根据流行病监控数据以及相关的病理学参数获取动态接触网络时间模式的优化目标函数,并对该优化目标函数进行拟合参数优化,估计出动态人口接触网络的时间模式w=(w1,...,wr);
其中根据流行病监控数据以及相关的病理学参数获取动态接触网络时间模式的优化目标函数为:
其中
u和v满足
式中,n表示流行病监控数据中的流行病种类数,t表示流行病监控数据所对应时间窗的长度,
采用参数优化算法优化上述目标函数,估计出优化参数u,v,
在一种实施方式中,对该优化目标函数进行拟合参数优化,估计出动态人口接触网络的时间模式w=(w1,...,wr)包括:
根据动态人口接触网络时间模式的优化目标函数以及约束条件构造一个lagrange方程:
式中,l表示构造的lagrange方程,αr表示针对不同场景下特征向量的约束系数,γ和ρ约束条件的约束系数;
采用lasso稀疏优化技术针对上述lagrange方程构造优化算法;在该优化过程中,需要计算l关于各变量的偏导数
基于以上分析,可得到一个基于流行病模型的双重迭代稀疏优化算法。在一重迭代中,基于当前的参数u,v,
上述优化参数算法具有更好的收敛性,能够提高获取优化参数
进一步地,根据获取的动态人口接触网络的空间模式和时间模式构建动态人口接触网络m。
在一种实施方式中,传播模型构建模块3,用于基于人口接触模型建立针对不同流行病的传播模型;其中采用的流行病传播模型为:
it=ktit-1=stabtcit-1
式中,向量it表示t时刻各个年龄组的新增病例数,k表示再生矩阵,向量it和对角矩阵st分别表示t时刻的感染人数和尚未被感染的易感人数。矩阵a和c表示两个基本的流行病学参数,分别表示未感染者的易感程度和已感染者的感染能力。b+表示t时刻的接触矩阵,表示接触网络中各群体之间的接触概率,其中所述接触矩阵与动态人口接触网络m对应。
采用不同流行病的流行病学参数,结合动态人口接触网络m,以上述流行病传播模型为基础,构建针对不同种类流行病的流行病传播模型,通过模型能够对不同种类流行病的传播爆发趋势进行预测。
在一种实施方式中,参见图2,大数据模块1还包括管理单元11,管理单元11用于对大数据模块1中存储的数据进行管理,其中包括对大数据模块1中存储的数据进行查询、分类、修改、删除处理。
在一种实施方式中,管理单元11还包括身份验证单元12,身份验证单元12用于获取用户登录信息,并对该用户登录信息进行身份验证,当身份验证通过后获取用户相应的数据库模块管理权限。
在一种实施方式中,身份验证单元12进一步包括:
登录信息验证子单元121,用于获取用户登录信息,其中包括用户名和用户密码,并对接收的登录信息进行验证,输出登录信息验证结果;
指纹信息验证子单元122,用于当登录信息验证结果为正确时,进一步获取用户指纹信息,并根据获取的用户指纹信息与该用户预存的指纹信息进行比对,当比对相似度大于设定的阈值时,输出身份验证结果为正确。
针对大数据模块1中存有隐私信息(如人口普查数据、公交信息卡数据中含有的身份信息等),因此本发明中还设置有管理人身份验证单元对大数据模块中的数据的访问进行权限管理,并提出结合指纹识别的方式对管理员进行身份验证,从而提高了本发明系统中数据的安全性。
在一种实施方式中,指纹信息验证子单元122包括
指纹图像获取子单元123,用于获取用户指纹图像;
指纹图像增强子单元124,用于对获取的用户指纹图像进行增强处理,获取增强后的用户指纹图像;
指纹图像分割子单元125,用于对增强后的用户指纹图像进行分割处理,获取该用户指纹图像中的指纹部分;
指纹特征提取子单元126,用于指纹部分进行特征提取处理,获取该指纹部分的特征参数;
指纹验证子单元127,用于将获取的指纹部分特征参数与该用户登录信息预存的特征参数进行比对,当相似度大于设定的阈值时,输出指纹验证结果以及身份验证结果为正确。
本发明上述实施方式中,提出了一种完整的根据用户指纹图像对其身份进行验证的指纹信息验证子单元,其中,首先通过指纹图像获取子单元获取由用户终端或者指纹采集装置采集的用户指纹图像,针对指纹图像在传输过程中容易受到噪声的干扰,影响指纹信息的准确性,因此指纹图像增强子单元首先对获取的指纹图像进行增强处理,确保后续的指纹验证过程中采用的指纹图像消除噪声的干扰,提高了可靠性;指纹图像分割子单元通过对指纹图像中携带有关键信息的指纹部分进行边缘检测和分割处理,进一步获取具有关键信息的指纹部分;指纹特征提取子单元对指纹部分中的特征信息进行提取,准确获取用户指纹信息,并通过指纹验证子单元将指纹特征参数与数据库中预存的特征参数进行比对,从而验证用户指纹的准确性。
在一种实施方式中,指纹图像增强子单元124,对对获取的用户指纹图像进行增强处理,包括:
1)对获取的用户指纹图像进行小波分解处理,获取低频分量和高频分量;
2)采用直方图均衡处理对低频分量进行增强处理,获取增强后的低频分量;
3)采用阈值函数对高频分量进行阈值处理,获取增强后的高频分量;
4)根据增强后的低频分量和增强后的高频分量进行小波逆变换,获取重构后的用户指纹图像;
5)对重构后的用户指纹图像进行对比度增强处理,输出增强后的用户指纹图像。
上述实施方式中,提出一种指纹图像增强子单元中对指纹图像增强的方法,对用户指纹图像进行小波分解,获取描述指纹图像背景信息的低频分量和描述指纹图像细节信息和噪声信息的高频分量,首先通过直方图均衡处理对低频分量进行增强,提高图像的整体效果,然后通过阈值处理的方式对高频分量进行增强,去除图像中存在的噪声干扰,再通过小波逆变换重构指纹图像,最后进行对比度增强处理,进一步提高图像的清晰度;通过增强处理的指纹图像,图像质量大大提高,为后续对用户指纹图像进一步进行指纹特征参数提取和识别提供了保证。
在一种实施方式中,指纹图像增强子单元124中,采用阈值函数对高频分量进行阈值处理,获取增强后的高频分量;
其中采用的改进阈值函数为:
式中,
上述实施方式中,采用上述改进的阈值函数对高频分量进行阈值处理,能够根据指纹图像的细节信息特性,调整阈值函数的门限,有效地去除高频分量中存在的噪声影响,同时阈值函数中具有良好的连续性,能够防止对高频分量的“过处理”现象,实现去除噪声的同时最大限度地保留了图像中的信息部分,增强性能好。
在一种实施方式中,判定阈值g由以下函数获得:
式中,gj表示第j层的判定阈值,j表示小波分解总层数,med(·)表示中值函数。
上述实施方式中,进一步采用自适应的阈值设定函数,其中根据小波分解的层数设定自适应地设定相应的阈值,能够有助于进一步根据指纹图像的信息特性,在去噪的同时保留图像的特征信息。
在一种实施方式中,指纹图像增强子单元124中,对重构后的用户指纹图像进行对比度增强处理,包括:
其中采用的对比度增强函数为:
y′(x,y)=u′(x,y)×255
式中,y′(x,y)表示增强后用户指纹图像中像素点(x,y)的灰度值,x(x,y)表示重构后的用户指纹图像中像素点(x,y)的灰度值,f表示设定的对比度划分阈值,其中f∈[0,1],xmin和xmax分别表示重构后的用户指纹图像中像素点的灰度最小值和最大值,
针对小波分解后的高频分量进行阈值处理后,可能会使得小波逆变换后获取的图像中原噪声点的位置附近存在图像模糊的问题;由于指纹图像中存在大量密集的指纹信息,因此图像模糊的问题会影响指纹特征信息的获取,因此,本发明上述实施方式中,对小波逆变换后的图像进一步进行对比度增强处理,通过采用上述对比度增强函数,能够对指纹图像中每个像素点进行对比度提升,从而缓解像素点因“过去噪”处理带来的模糊问题,间接提高了指纹图像身份验证的可靠性。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当分析,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。