一种基于动态网络标志物的区域性传染病疫情预警方法与流程

文档序号:23008113发布日期:2020-11-20 12:02阅读:375来源:国知局
一种基于动态网络标志物的区域性传染病疫情预警方法与流程

本发明涉及数据挖掘技术领域,具体涉及一种基于动态网络标志物(dynamicnetworkmarker,dnm)的区域性传染病疫情预警方法。



背景技术:

随着经济全球化的发展和人员流动的增多,传染性疾病的传播和蔓延变得更快更广,且难以控制。世界各国面临着新老传染病的双重威胁,少数传染病将被消灭,已经基本控制的传染病又卷土重来,新传染病不断被陆续发现;近年有多起重大传染性疾病的爆发流行,如sars的爆发流行、甲型肝炎流行和血吸虫病的再次增多,特别是最近发生的新型冠状病毒引发的肺炎疫情。可见,不管对于常规季节性传染病还是突发性新型传染病,建立一个基于城市网络的监测预警系统非常重要。有效的传染病疫情检测方法通过持续而系统性地收集、分析和解释健康数据,有可能尽早探测到爆发,有助于疾病的预防和控制。



技术实现要素:

本发明的目的是为了解决现有技术中的上述缺陷,提供一种基于动态网络标志物的区域性传染病疫情预警方法,并且最终识别出传染病传播过程中的分级预警信号。

本发明的目的可以通过采取如下技术方案达到:

一种基于动态网络标志物的区域性传染病疫情预警方法,给定区域邻接表数据和区域对应的疫情确诊人数数据,构建区域性城市网络来识别疫情爆发信号,该预警方法包括如下步骤:

s1、构建区域性城市网络。具体地,根据各个区域的地理分布信息和区域间的邻接关系构建有权无向图。在图中,每一个节点代表一个地理区域(如县、市、省等),图中的边代表两个节点的邻接关系。两个节点通过一条边相连,则表示两个节点可以直接通达。

s2、将传染病监测数据映射到城市网络图中。具体地,每一个区的传染病确诊人数即为对应节点的值。随着时间的推移,构建的城市网络将成为一个动态变化的网络图,其中,节点大小和边的权重都在时刻变化。

s3、计算景观动态网络标志物得分,简称dnmscores。具体地,首先将城市网络切分为若干个小的局部网络。每一个局部网络包含一个中心节点和它的所有一阶邻居。对于有n个节点的局部网络,即一个中心节点和n-1个一阶邻居节点,在t时刻局部网络的得分it计算如下:

it=|δsdt(in)|[|δpcct(in)|+|δpcct(out)|]

其中,|δsdt(in)|是局部网络中所有节点标准差的绝对值,详细的计算公式如下:

其中,n表示局部网络内的节点数量,sdt(i)表示局部网络中的节点i在t时刻的标准差;

|δpcct(in)|是局部网络内节点i和节点j的皮尔逊相关系数,详细的计算公式如下:

其中,n表示局部网络一共有n个节点,pcct(i,j)表示局部网络内节点i和节点j在t时刻的皮尔逊相关系数;

|δpcct(out)|是局部网络内的一个节点x与局部网络外一个节点y的皮尔逊相关系数。详细的计算公式如下:

其中,n表示局部网络一共有n个节点,pcct(x,y)表示局部网络内的一个节点x与局部网络外一个节点y在t时刻的皮尔逊相关系数。

值得注意的是,在以上计算过程中,以滑动窗口的方式来处理正规化后的数据,即基于每五周滑动窗口大小的传染病确诊数据来计算标准差和皮尔逊相关系数。

s4、基于dnm得分判断出多级预警信号。详细地,设置一个合适的阈值mthreshold作为预警信号的判断依据,当达到相应的阈值时发出相应级别的预警。对于不同的疾病,阈值的设置不尽相同,即传染性强的传染病阈值设置要低。阈值mthreshold的计算公式如下:

其中,it(i)代表在时间t,n个节点的城市网络中节点i的得分it。

本发明相对于现有技术具有如下的优点及效果:

1)本发明使用正规化的数据(该地区确诊总人数/该地区定点医院数量)作为计算原始数据,因为每个地区的人口数与诊所的数量大致成正比。

2)本发明方法将传染病的传播与爆发分为三个阶段,即正常阶段、预爆发阶段和爆发阶段。与临床就诊量陡然增加的爆发阶段不同,预爆发阶段与正常阶段没有显著差异。同时因为复杂的生物系统和社会系统,一般方法预测出预爆发阶段是非常有难度的。dnm方法则可以很好地克服以上难点,识别出预爆发阶段,给出传染病疫情的预警信号。

3)本发明根据区域的地理位置信息和区域间的邻接关系构建出宏观的城市网络。传统方法中只是根据单一地区的就诊人数来判断,忽略了传染病的传播能力和地区间的相关信息。使用城市网络带来的增益信息可以克服样本量小的问题,并通过局部网络的重叠性修正测不准的局部网络。

4)相比于传统的预警信号给出标准,本发明采用全新的阈值计算方式,这种方法包含了当前时刻及其之前的所有时刻的数据,大大提高了预警信号的置信度。

附图说明

图1是本发明公开的一种基于景观动态网络标志物的区域性传染病疫情预警方法的流程图;

图2是本发明实施例中日本东京都23个区的城市网络图;

图3是本发明实施例中设计滑动窗口处理的计算方法示意图;

图4是本发明实施例中2012年和2017年的预警信号结果图;

图5是本发明实施例中公开的方法与机器学习方法的效果对比图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例

本实施例是以收集到的日本东京都23个区2009-2018年的手足口病就诊数据集为原始数据,利用基于动态网络标志物的区域性传染病疫情预警方法来识别每一年份的预警信号。本实施例不仅指导说明本发明的方法步骤,同时佐证方法的有效性。原始数据收集自日本东京都传染病监测中心官方网站。

图1是本发明的基于动态网络标志物的区域性传染病疫情预警方法的流程图,具体包括以下步骤:

s1、如图1的s1.1中,输入区域邻接表,并根据输入的区域邻接表构建区域性城市网络。

邻接表是存储无向图的常用结构。邻接表是一个二维容器,第一维描述某个节点,第二维描述该点所对应的邻接节点。本实施例中,根据输入的区域邻接表就可以得到每个子区域与其他子区域的邻接关系,从而构建出一个无向图,即区域性城市网络。无向图中的每个节点与某个子区域对应,无向图中相邻的两个节点,表示实际地理位置相邻的两个子区域。

详细地,如图2所示,举例说明,minato区对应编号1,相关邻接表对应的信息为{…,1:[2,3,4,5,6],…},即编号1的区域与编号2、3、4、5、6五个区域是相邻的。以此类推,最终构建出一个23个节点的有权无向图。详细的23个节点信息见图2。

如图1的s1.2中输入各区域疫情数据,并对疫情数据进行正规化处理。由于每个地区的人口数与诊所的数量大致成正比,所以用该地区就诊总人数除以该地区定点医院数量,得到的该地区平均就诊人数即为正规化处理后的数据。举例说明,2015年的第30周日本东京koto区共计206例感染手足口病的病例,该区域定点医院有9家,因此正规化后的平均就诊人数为22.89例/家。

s2、将s1中经过正规化的疫情数据映射到s1中构建的区域性城市网络中。详细地,s1中经过正规化的疫情数据表示区域性城市网络各个区域的平均就诊人数。正规化的疫情数据与图中节点是一一对应关系,按此对应关系进行映射。随着时间的推移,构建的城市网络成为一个节点信息动态变化的网络图。

s3、对于映射后的区域性城市网络(一个节点信息动态变化的无向网络图),采用动态网络标志物方法计算景观动态网络标志物得分(dnmscores)。具体方法如下:

1)设计五周时间作为滑动窗口处理动态变化的城市网络图。滑动窗口的详细使用如图3所示。举例说明,在计算相关性时,使用第1-5周的数据计算节点i,j的皮尔逊相关系数。

2)城市网络切分为若干个小的局部网络。每一个局部网络包含一个中心节点和它的所有一阶邻居。

3)对于有n个节点的局部网络(1个中心节点和n-1个一阶邻居节点),计算t时刻局部网络中所有节点标准差的绝对值。具体计算方法如下:

其中,n表示局部网络一共有n个节点,sdt(i)表示局部网络中的节点i在t时刻的标准差。

4)在上述局部网络中,计算t时刻网络内部节点i和节点j的皮尔逊相关系数。具体计算方法如下:

其中,n表示局部网络一共有n个节点,pcct(i,j)表示局部网络内节点i和节点j在t时刻的皮尔逊相关系数。

5)在上述局部网络中,计算t时刻局部网络内的一个节点x与局部网络外一个节点y的皮尔逊相关系数|δpcct(out)|。具体计算方法和|δpcct(in)|计算类似。其中,n表示局部网络一共有n个节点,pcct(i,j)表示局部网络内的一个节点x与局部网络外一个节点y在t时刻的皮尔逊相关系数。

6)基于3)、4)、5)中的计算,可以计算出t时刻该局部网络中心节点的dnm得分it。具体计算方法如下:

it=|δsdt(in)|[|δpcct(in)|+|δpcct(out)|],其中,|δsdt(in)|是局部网络中所有节点标准差的绝对值,|δpcct(in)|是局部网络内节点i和节点j的皮尔逊相关系数,|δpcct(out)|是局部网络内的一个节点i与局部网络外一个节点j的皮尔逊相关系数。

7)基于6)中的计算,可以以此类推计算出在t时刻,东京都城市网络划分出的23个局部网络中心节点i的dnm得分it(i)。

s4、使用s3中得到的不同时刻(t=1,…,t=t)23个节点对应的dnm得分it(i),计算出每一时刻阈值mthreshold。具体方法如下:

其中,it(i)代表在时间t,n个节点的城市网络中节点i的得分it。

对于东京都手足口病的传播和爆发情况,当某一时刻阈值达到5倍,则传染病疫情监测系统发出橙色预警;当某一时刻阈值达到10倍,则传染病疫情检测系统发出最高级红色预警。

对于本实例中,挑选有代表性的两个年份(2012年,2017年)展示预警效果。如图4所示,本发明方法给出的预警信号距离真实就诊人数爆发周,提前4-8周时间。可以让各区域疾控中心充分认识到疫情的发展趋势并及时采取有效的防控措施。另外,还与机器学习中的逻辑回归预测方法进行对比,并绘制出两种方法的roc曲线,如图5所示。可以看出,在仅使用东京都定点医院就诊记录的条件下,基于dnm方法的监测系统比基于逻辑回归方法的预测系统表现更好。

综上所述,本实施例公开了一种基于景观动态网络标志物的区域性传染病疫情预警方法,该方法的理论背景为动态网络生物标志物(dynamicnetworkbiomarker,dnb)。该理论通过分析驱动生物分子的动力学,即导致传染病发展临界状态转变的一组基因和蛋白质,来识别疾病发展的临界阶段。dnb方法最早应用于以基因和蛋白质调控为主的微观生物分子网络中,并取得了令人满意的结果,包括细胞癌变的临界点、细胞分化的临界点以及检测各种生物学过程中的临界期。不同于以基因和蛋白质调控为主的微观生物分子网络,本预警方法根据区域间的地理分布和人口流动来构建宏观城市网络。基于这种城市网络,景观动态网络标志物(landscapedynamicnetworkmarker,l-dnm)方法有助于研究疫情动态,有效地发现任何潜在传染病疫情的预警信号,从而达到预警和预防的目的。

上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1