传染病感染情况预测方法、系统、设备及存储介质与流程

文档序号:33632480发布日期:2023-03-28 23:28阅读:41来源:国知局
传染病感染情况预测方法、系统、设备及存储介质与流程

1.本技术涉及传染病感染情况预测领域,特别是涉及一种传染病感染情况预测方法、系统、设备及存储介质。


背景技术:

2.传染病通常通过一个人将病菌、病毒或其他细菌直接转移到另一个人的方式来传播,对人类的正常的生产生活造成非常巨大的影响。对于传染病未来感染人数预测和流行程度的预测,一直是该领域中主要的研究问题。准确的未来传染人数预测,可以给防疫的决策措施提高参考,对于抗击传染病有重大的意义。
3.在相关技术中,通常采用sir等数理统计的方法,进行传染病感染情况的预测,智能化水平较低且预测准确率低。采用人工智能技术进行传染病感染情况的预测,由于技术方案复杂,会造成使用门槛较高,且由于传染病的感染情况是随时间动态变化的,这对于算法和系统也有动态的要求。
4.目前针对相关技术中,传染病感染情况预测准确率较低的问题,尚未提出有效的解决方案。


技术实现要素:

5.本技术实施例提供了一种传染病感染情况预测方法、系统、设备及存储介质,以至少解决相关技术中传染病感染情况预测准确率较低的问题。
6.第一方面,本技术实施例提供了一种传染病感染情况预测方法,应用于传染病感染情况预测系统,所述传染病感染情况预测系统包括增量模块、输入模块、图引擎、交互模块,所述方法包括:所述增量模块响应于预设指令,控制所述输入模块获取当前周期的新增数据,其中,所述新增数据包括在当前周期中至少一个地区的地区病情信息;所述图引擎根据所述新增数据对第一图模型进行迭代训练,直至所述第一图模型满足收敛条件,得到第二图模型,其中,所述第一图模型基于上一个周期获取的历史数据训练得到,在所述第一图模型中,以各地区作为节点,各节点特征基于地区病情信息获得,各节点按照地区之间的地理位置关系连接形成边,各边按照地区人口信息分配边权重;所述交互模块响应于用户指令,将待预测数据输入至所述第二图模型,得到预测结果,其中,所述预测结果包含目标地区在未来时间的传染病感染人数。
7.在其中一些实施例中,所述地区病情信息包括以下至少之一:地区人口密度、地区易感者人数、地区感染者人数、地区恢复者人数。
8.在其中一些实施例中,所述第一图模型包括第一节点和第二节点,所述第一节点对应第一地区,所述第二节点对应第二地区,所述地区人口信息包括:在某个设定时刻,第一地区流动到第二地区的人数,第二地区流动到第一地区的人数,第一地区流动到全部地区的人数,第二地区流动到全部地区的人数;各边按照地区人口信息分配边权重,包括:
根据所述第一地区流动到所述第二地区的人数与所述第一地区流动到全部地区的人数之间的比值、所述第二地区流动到所述第一地区的人数与所述第二地区流动到全部地区的人数的比值、和所述第一地区地理相邻的地区总数量,确定所述第一节点指向所述第二节点的边权重。
9.在其中一些实施例中,各边按照地区人口信息分配边权重还包括:在所述边权重小于第一阈值的情况下,剔除所述边权重对应的边。
10.在其中一些实施例中,所述新增数据包括在多个设定时间采集的地区病情信息,所述第一图模型包括长短期记忆神经网络,所述图引擎根据所述新增数据对第一图模型进行迭代训练,直至所述第一图模型满足收敛条件,包括:所述图引擎按照所述多个设定时间,依次输入所述新增数据至所述第一图模型,并经由所述长短期记忆神经网络对所述新增数据执行前向预测,得到预测感染人数;根据所述预测感染人数和真实感染人数,得到损失值,并根据所述损失值调整所述第一图模型的权重参数。
11.在其中一些实施例中,所述第一图模型还包括全连接层,所述图引擎按照所述多个设定时间,依次输入所述新增数据至所述第一图模型,并经由所述长短期记忆神经网络对所述新增数据执行前向预测,得到预测感染人数,包括:将当前权重参数和所述第一节点的相邻节点的节点特征进行聚合,得到聚合数据;采用激活函数处理所述聚合数据,得到嵌入表达信息;根据所述多个设定时间,依次将所述嵌入表达信息输入至所述长短期记忆神经网络,得到隐层表示信息;将所述隐层表示信息输入至所述全连接层,得到所述预测感染人数。
12.第二方面,本技术实施例提供了一种传染病感染情况预测系统,包括:增量模块、输入模块、图引擎、交互模块;其中,所述增量模块,用于响应预设指令,控制所述输入模块获取当前周期的新增数据,其中,所述新增数据包括在当前周期中至少一个地区的地区病情信息;所述图引擎,用于根据所述新增数据对第一图模型进行迭代训练,直至所述第一图模型满足收敛条件,得到第二图模型,其中,所述第一图模型基于上一个周期获取的历史数据训练得到,在所述第一图模型中,以各地区作为节点,各节点特征基于地区病情信息获得,各节点按照所述地区位置之间的地理位置关系连接形成边,各边按照地区人口信息分配边权重;所述交互模块,用于响应用户指令,将待预测数据输入至所述第二图模型,得到预测结果,其中,所述预测结果包含目标地区在未来时间的传染病感染人数。
13.在其中一些实施例中,所述输入模块包括:爬虫接口,用于爬取互联网中各地区的地区病情信息;文档接口,用于获取各地区的地区人口信息。
14.在其中一些实施例中,所述传染病感染情况预测系统还包括:构图模块,用于根据所输入模块获取的数据生成图数据,其中,所述图数据包括所述节点特征、所述边权重;或者,
图数据库,用于存储所述图数据;或者,展示模块,用于接收并展示所述预测结果。
15.在其中一些实施例中,述交互模块响应的用户指令包括以下至少之一:所述增量模块的启动时间的控制指令、所述第一图模型或者所述第二图模型的超参数设置指令、所述展示模块的缩放指令。
16.第三方面,本技术提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面中任一项所述的传染病感染情况预测方法的步骤。
17.第四方面,本技术提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面中任一项所述的传染病感染情况预测方法的步骤。
18.相比于相关技术,本技术实施例提供的传染病感染情况预测方法、系统、设备及存储介质,通过增量模块响应预设指令,控制输入模块获取新增数据,图引擎根据新增数据对基于历史数据得到的第一图模型进行迭代训练,得到第二图模型,如此进行图模型的动态更新,其中图模型以各地区作为节点,各节点特征基于地区病情信息获得,各节点按照地区之间的地理位置关系连接形成边,各边按照地区人口信息分配边权重,更新后的图模型利用交互模块选择的待预测数据进行传染病感染情况预测,解决了相关技术中传染病感染情况预测准确率较低的问题。
19.本技术的一个或多个实施例的细节在一下附图和描述中提出,以使本技术的其他特征、目的和优点更加简明易懂。
附图说明
20.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:图1是本技术实施例的传染病感染情况预测方法的终端的硬件结构框图;图2是本技术实施例的传染病感染情况预测方法的流程图;图3是本技术实施例的图模型增量训练过程示意图;图4是本技术实施例的图模型训练过程的示意图;图5是本技术实施例的传染病感染情况预测系统的结构示意图。
具体实施方式
21.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。基于本技术提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。
22.显而易见地,下面描述中的附图仅仅是本技术的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本技术应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本技术公开的内容相关的本领域的普通技术人员而言,在本技术揭
露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本技术公开的内容不充分。
23.在本技术中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本技术所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
24.除非另作定义,本技术所涉及的技术术语或者科学术语应当为本技术所属技术领域内具有一般技能的人士所理解的通常意义。本技术所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本技术所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本技术所涉及的“多个”是指两个或两个以上。
25.在本实施例中提供的方法实施例可以在终端、计算机或者类似的运算装置中执行。比如在终端上运行,图1是本实施例的传染病感染情况预测方法的终端的硬件结构框图。如图1所示,终端可以包括一个或多个(图1中仅示出一个)处理器102和用于存储数据的存储器104,其中,处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置。上述终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述终端的结构造成限制。例如,终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示出的不同配置。
26.存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如在本实施例中的传染病感染情况预测方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
27.传输设备106用于经由一个网络接收或者发送数据。上述的网络包括终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(network interface controller,简称为nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(radiofrequency,简称为rf)模块,其用于通过无线方式与互联网进行通讯。
28.在一个实施例中,提供了一种传染病感染情况预测方法,该方法应用于传染病感染情况预测系统,该系统包括增量模块、输入模块、图引擎、交互模块,图2是本实施例的传染病感染情况预测方法的流程图,如图2所示,该流程包括如下步骤:步骤s201,增量模块响应于预设指令,控制输入模块获取当前周期的新增数据,其中,新增数据包括在当前周期中至少一个地区的地区病情信息。
29.其中,预设指令是指用户输入的增量模块启动指令,输入模块爬取各地区的感染
情况数据,包括在当前周期内各地区的感染者人数、易感者人数与恢复者人数,增量模块定时控制输入模块重新爬取和输入最新数据,基于新增数据,增量模块调用图引擎进行增量训练,以实现图模型的更新。
30.步骤s202,图引擎根据新增数据对第一图模型进行迭代训练,直至第一图模型满足收敛条件,得到第二图模型,其中,第一图模型基于上一个周期获取的历史数据训练得到,在第一图模型中,以各地区作为节点,各节点特征基于地区病情信息获得,各节点按照地区之间的地理位置关系连接形成边,各边按照地区人口信息分配边权重,其中,各地区的人口信息包括各个地区之间的人口流动数据,例如在当前周期内一个地区到另一个地区的人口流动数量。
31.其中,第一图模型为基于历史感染情况数据进行训练得到的图模型,第二图模型为基于新增感染数据进行增量训练得到的更新后的图模型。将每个地区作为节点,如果两个地区的地理位置相邻,则两个地区对应的节点存在连边。边权重表示在某一个时刻一个地区的节点指向另一个地区的节点的边权重,由地区的地理位置和地区之间的人口流动数据共同决定。
32.步骤s203,交互模块响应于用户指令,将待预测数据输入至第二图模型,得到预测结果,其中,预测结果包含目标地区在未来时间的传染病感染人数。
33.其中,用户指令指用户根据需要选择待预测数据的指令,以及对于第一图模型和第二图模型的参数设置指令。在定义参数以及输入新增数据后,第一图模型进行前向传播的模型训练,得到第二图模型,第二图模型执行预测计算,预测未来传染病感染情况,并将预测结果进行展示。
34.图3是本技术实施例图模型增量训练过程示意图,如图3所示,模型对应第一图模型,模型对应第二图模型。第一图模型由过去的到时间段内的数据训练得到,第二图模型由新爬取的到时间段内的数据训练得到。图模型通过增量训练,根据增量数据不断进行更新,实现对传染病感染情况的动态预测。
35.通过上述步骤s201至s203,通过增量模块响应预设指令,控制输入模块获取新增数据,图引擎根据新增数据对基于历史数据得到的第一图模型进行迭代训练,得到第二图模型,如此进行图模型的动态更新,其中图模型以各地区作为节点,各节点特征基于地区病情信息获得,各节点按照地区之间的地理位置关系连接形成边,各边按照地区人口信息分配边权重,更新后的图模型利用交互模块选择的待预测数据进行传染病感染情况预测,解决了相关技术中传染病感染情况预测准确率较低的问题,实现了提高传染病感染情况预测准确率的有益效果。
36.在其中一些实施例中,地区病情信息包括以下至少之一:地区人口密度、地区易感者人数、地区感染者人数、地区恢复者人数。
37.其中,某个地区在t时刻的节点特征由地区病情信息直接聚合得到,具体的计算公式为:
38.其中,假设第一节点为i,第二节点为j,表示i节点对应的第一地区在t时刻的
人口密度,表示第一地区在t时刻的易感者人数,表示第一地区在t时刻的感染者人数,表示第一地区在t时刻的恢复者人数,。
39.在其中一些实施例中,第一图模型包括第一节点和第二节点,第一节点对应第一地区,第二节点对应第二地区,地区人口信息包括:在某个设定时刻,第一地区流动到第二地区的人数,第二地区流动到第一地区的人数,第一地区流动到全部地区的人数,第二地区流动到全部地区的人数;各边按照地区人口信息分配边权重,包括:根据第一地区流动到第二地区的人数与第一地区流动到全部地区的人数之间的比值、第二地区流动到第一地区的人数与第二地区流动到全部地区的人数的比值、和第一地区地理相邻的地区总数量,确定第一节点指向第二节点的边权重。
40.其中,边权重表示第一节点与第二节点之间相互关系的强弱,在确定第一节点指向第二节点的边权重时,还需要设置第一节点与第二节点的超参数。
41.第一节点i指向第二节点j的边权重的具体计算公式为:
42.其中,,表示与第一地区地理相邻的地区总数量,表示t时刻第一地区流动到第二地区的人数,表示第二地区流动到第一地区的人数,表示 t时刻第一地区和第二地区流动到所有地区的人数, α和β表示超参数。
43.在其中一些实施例中,各边按照地区人口信息分配边权重还包括:在边权重小于第一阈值的情况下,剔除边权重对应的边。
44.其中,为了防止图模型的过度连接,在边权重时,剔除该边权重对应的连边。
45.在其中一些实施例中,新增数据包括在多个设定时间采集的地区病情信息,第一图模型包括长短期记忆神经网络,图引擎根据新增数据对第一图模型进行迭代训练,直至第一图模型满足收敛条件,包括:图引擎按照多个设定时间,依次输入新增数据至第一图模型,并经由长短期记忆神经网络对新增数据执行前向预测,得到预测感染人数;根据预测感染人数和真实感染人数,得到损失值,并根据损失值调整第一图模型的权重参数。
46.其中,每次预测的损失值将反馈回图模型中,图模型根据损失值调整构图与参数。损失值为真实感染人数和预测感染人数的均方差,具体的计算公式为:,其中,loss表示损失值,mse为均方误差函数,为感染人数的预测值,为感染人数的真实值。
47.在其中一些实施例中,图4是本技术实施例图模型前向训练的示意图,如图4所示,第一图模型还包括全连接层,图引擎按照多个设定时间,依次输入新增数据至第一图模型,并经由长短期记忆神经网络对新增数据执行前向预测,得到预测感染人数,包括:
将当前权重参数和第一节点的相邻节点的节点特征进行聚合,得到聚合数据;采用激活函数处理聚合数据,得到嵌入表达信息;根据多个设定时间,依次将嵌入表达信息输入至长短期记忆神经网络,得到隐层表示信息;将隐层表示信息输入至全连接层,得到预测感染人数。
48.其中,第一节点i利用聚合函数聚合相邻节点的节点信息,在神经网络中引入非线性特征,提升了神经网络的表达能力。具体的计算公式为,为第一节点i的嵌入表达信息,σ为激活函数,表示节点i的连边,为节点i与相邻节点j的权重参数,是神经网络的一个设置参数,用以控制图模型中视图的分割,可以通过训练得到。根据设定的时间顺序,依次将嵌入表达信息输入至长短期记忆神经网络,形成神经网络的隐层表示,将隐层表示信息输入至全连接层,进行预测计算,得到预测感染人数。
49.在一个实施例中,本技术还提供了一种传染病感染情况预测系统,如图5所示,该传染病感染情况预测系统包括:增量模块8、输入模块1、图引擎4、交互模块6;其中,增量模块8,用于响应预设指令,控制输入模块1获取当前周期的新增数据,其中,新增数据包括在当前周期中至少一个地区的地区病情信息;图引擎4,用于根据新增数据对第一图模型进行迭代训练,直至第一图模型满足收敛条件,得到第二图模型,其中,第一图模型基于上一个周期获取的历史数据训练得到,在第一图模型中,以各地区作为节点,各节点特征基于地区病情信息获得,各节点按照地区位置之间的地理位置关系连接形成边,各边按照地区人口信息分配边权重;交互模块6,用于响应用户指令,将待预测数据输入至第二图模型,得到预测结果,其中,预测结果包含目标地区在未来时间的传染病感染人数。
50.在其中一些实施例中,输入模块1包括:爬虫接口,用于爬取互联网中各地区的地区病情信息;文档接口,用于获取各地区的地区人口信息。
51.其中,爬虫接口爬取网上各地每日感染者人数与每日恢复者人数,爬虫接口的网址一般为目标传染病官方公开网址中的数据,本技术的系统支持txt、csv、xls等规定格式的模板文件输入。文档接口输入各个地区的地理位置、人口总数、人口密度、各地区之间的人口流动数据。
52.在其中一些实施例中,传染病感染情况预测系统还包括:构图模块2,用于根据输入模块获取的数据生成图数据,其中,图数据包括节点特征、边权重;或者,图数据库3,用于存储图数据;或者,展示模块5,用于接收并展示预测结果。
53.在其中一些实施例中,交互模块6响应的用户指令包括以下至少之一:增量模块8的启动时间的控制指令、第一图模型或者第二图模型的超参数设置指令、展示模块5的缩放指令。
54.其中,交互模块6可以设置增量模块8启动的时间,以控制本系统的动态实时性能;交互模块6也可以设置使用的图数据库3的名称、使用的图模型7的超参数,实现对于系统的整体控制;交互模块6还可以设置展示模块5的大小与缩放比例,优化展示模块5的可视化性能。
55.如图5所示,本技术实施例的传染病感染情况预测系统的总体运行过程如下:输入模块将数据输入至构图模块,构图模块生成图数据,图数据库保存构图模块生成的图数据,
交互模块下达用户输入的图数据选择指令与图模型的参数设置指令,控制图引擎进行模型训练后进行预测,并将预测结果发送至展示模块进行展示,在数据更新时,增量模块控制输入模块将新增数据输入至构图模块进行增量构图,并调用图引擎进行增量训练,以获得更新后的第二图模型。
56.本技术还提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现如上述各实施例提供的传染病感染情况预测方法的步骤。
57.本技术还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各个实施例提供的传染病感染情况预测方法的步骤。
58.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink) dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
59.以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
60.以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1