基于数据的传染病传播率及疫情评估方法与流程

文档序号:21313175发布日期:2020-06-30 20:40阅读:1497来源:国知局
基于数据的传染病传播率及疫情评估方法与流程

本发明涉及传染病传播评估技术领域,特别涉及一种基于数据的传染病传播率及疫情评估方法。



背景技术:

近年来,大范围的传染病疫情频繁爆发,2003年的非典型肺炎(sars)、2005年的h1n1禽流感、2012年的中东呼吸综合征(mers)以及2019年的新型冠状病毒(2019-ncov)肺炎,其造成的后果,除了直接人员伤亡和巨额医疗费用外,对经济的间接影响、对民众心理和社会安定的危害都是非常严重的。

流行病学界一直从动力学角度寻求更多的信息以探求疫情的发展机制,其中最关键的参数为基本传染数r0。r0是指在无人为干预情况下易感(即对该传染病病毒无免疫力的)人群中由单个(典型)感染者产生的二代病例个数,即传播疾病平均人数的期望值:

显然r0是一个依赖于很多参数的量值。公式(1)中τ是传播能力(即易感个体和感染个体接触后发生传染的概率),是易感人群和感染者的平均接触率,d是感染者传染期。在理想条件下,用r0来预测在一个完全易感且同质的群体中疫情的发展过程具有一定的有效性。然而r0量值需要太多信息,在传染病暴发过程中较准确估算该参数非常困难,不同研究组取值差别很大。因此,r0难以通过实测的方法获取,而是以人为调整数学模型结果来得到一个猜测值,这很大程度上限制了其实用性。况且,在不同阶段疫情传播的动力可能会呈现不同的方式,因此采用常数来描述疫情整个发展过程是不尽合理的。比如,行政管控和新型诊断及医疗手段也会显著改变疫情演变的动力过程。一线抗击疫情和有效管控所需要的科学支撑是快速而鲁棒性的直观估计结果,以此来实时监测疫情的演变态势。



技术实现要素:

针对现有技术的上述缺陷,本发明实施例提供一种基于数据的传染病传播率及疫情评估方法。

本发明实施例提供的基于数据的传染病传播率及疫情评估方法包括:

收集和统计病例数据,所述病例数据包括疫情期间的确诊病例、治愈病例及死亡病例数量,采样周期为“日”;

选择起始参考时间,所述起始参考时间为疫情发生期间、可获取数据以来的任意时间;

基于自然增长率模型建立如公式(2)所示的疫情发展动力模型:

n(tk+1)=n(tk)·exp{a(tk+1)·(tk+1-tk)}(2)

式中,k为整数,且k≥0;t0为起始参考时间,tk+1和tk为相邻两个采样时间,n(tk)为与tk对应的现有感染者总数量,n(tk+1)为与tk+1对应的现有感染者总数量,n(tk)、n(tk+1)均为统计数据;现有感染者总数量等于确诊病例总数量减去治愈病例总数量及死亡病例总数量;a(tk)为现有感染者总数量的增长率,a(tk)随着时间t变化,在本模型中a(tk)为待定量,a(tk)从t0的下一采样时间开始;

对公式(2)两边取自然对数,得到疫情现有感染者总数量的增长率的表达式公式(3):

a(tk+1)=ln{n(tk+1)/n(tk)}/(tk+1-tk)(3)

假设传染病传播符合公式(2)所示的自然增长率,根据统计病例数据由公式(3)和公式(4)计算出随时间变化的感染者增长率at;

记:at={a(tk)}(4)

根据计算出的随时间变化的感染者增长率at,由公式(5)计算随时间变化的传染病传播率ct;

ct=1+at(5)

根据传染病传播率ct的变化对传染病过往疫情进行过程追踪,根据传染病传播率ct的趋势对疫情的未来发展状况作出预估;

传染病传播率ct的趋势包括线性和非线性趋势;所述线性趋势是通过对ct进行最小二乘法拟合得到的直线;所述非线性趋势是通过对ct进行经验模态分解,取其残余分量作为ct的非线性趋势。

如上所述的传染病传播率及疫情评估方法,其中,传染病增长率at是根据观测数据由传染病自然增长模型导出,随时间变化;传染病传播率ct是基于数据的、且随时间变化的变量。

如上所述的传染病传播率及疫情评估方法,当传染病在时间t的传播率ct>1时,现有感染者总数量随时间t增加;当ct=1时,现有感染者总数量达到峰值;当ct<1时,现有感染者总数量随时间t呈现减少趋势。

如上所述的传染病传播率及疫情评估方法,其中,所述根据传染病传播率ct的变化对传染病过往疫情进行追踪,根据传染病传播率ct的趋势对疫情的未来发展状况作出预估,具体包括:

依据已有数据得到的传染病传播率ct追踪过往疫情或评估疫情防控效果;通过对传染病传播率ct的趋势做外延,预估疫情未来的发展情况,计算疫情拐点出现的时间和疫情高峰时的现有感染者总数量。

本发明实施例提供的技术方案简单、直接,可计算出由统计数据驱动且随时间变化的疫情传播率,该传播率可用于传染病疫情的分析,包括揭示疫情发展的内在规律、监测疫情的发展并预判其未来态势。由于传播率是基于直接的观测数据,因此可直接应用已有数据对过往疫情进行追踪,也可以根据传播率的变化趋势对疫情未来发展情况做出预估。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明提供的基于数据的传染病传播率评估方法的流程图;

图2为本发明的一个应用实施例中病例累计确诊人数随时间的变化示意图;

图3为图2所述的应用实施例中疫情传播率随时间的变化示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明提供的基于数据的传染病传播率评估方法的流程图。如图1所示,本实施例的传染病传播率评估方法可以包括以下内容。

s101、收集和统计病例数据,所述病例数据包括疫情期间的确诊病例、治愈病例及死亡病例数量,采样周期为“日”。

s102、选择起始参考时间,所述起始参考时间为疫情发生期间、可获取数据以来的任意时间。

具体的,所述起始参考时间可以是疫情发生期间、可获取数据以来的任意时间,通常视研究目标而定,可以是传染病疫情数据公布的起始时间,也可以是分析所关注的关键时间节点,比如某些防控措施开始实施的时间等。优选地,以传染病疫情数据公布的起始时间,或研究所关注的关键时间节点,比如某些防控措施开始实施的时间。

例如,对于2019年爆发的新型冠状病毒(2019-ncov)肺炎,可以选择武汉“封城”日期作为参考时间。

s103、基于自然增长率模型建立如公式(2)所示的疫情发展动力模型。

由于背景技术部分所述的r0描述传染病动力学的诸多限制,本申请提出了一个简单且源于实际数据的新参数来跟踪及预估疫情的发展过程。该方案基于自然增长率:

n(tk+1)=n(tk)·exp{a(tk+1)·(tk+1-tk)}(2)

式中,k为整数,且k≥0;t0为起始参考时间,tk+1和tk为相邻两个采样时间,n(tk)为与tk对应的现有感染者总数量,n(tk+1)为与tk+1对应的现有感染者总数量,n(tk)、n(tk+1)均为统计数据;现有感染者总数量等于确诊病例总数量减去治愈病例总数量及死亡病例总数量;a(tk)为现有感染者总数量的增长率,a(tk)随着时间t变化,在本模型中a(tk)为待定量,a(tk)从t0的下一采样时间开始。

现有感染者总数量指具有传染性的病例数量,一般可采用确诊病例数减去治愈病例以及死亡病例数。a(tk)为现有感染者总数量的增长率,它随着时间t变化,在本模型中是个待定量。由于t0时刻的感染者数量体现不出疫情的发展,故a(tk)从t0时刻的下一采样点开始,它的时间序列长度比疫情数据长度少1。

s104、对公式(2)两边取自然对数,得到疫情现有感染者总数量的增长率的表达式公式(3)。

a(tk+1)=ln{n(tk+1)/n(tk)}/(tk+1-tk)(3)

s105、假设传染病传播符合公式(2)所示的自然增长率,根据统计病例数据由公式(3)计算出随时间变化的感染者增长率at。

记:at={a(tk)}(4)

s106、根据计算出的随时间变化的感染者增长率at,由公式(5)计算随时间变化的传染病传播率ct。

ct=1+at(5)

s107、根据传染病传播率ct的变化对传染病过往疫情进行过程追踪,根据传染病传播率ct的趋势对疫情的未来发展状况作出预估。

传染病传播率ct的趋势包括线性和非线性趋势;所述线性趋势是通过对ct进行最小二乘法拟合得到的直线;所述非线性趋势是通过对ct进行经验模态分解,取其残余分量作为ct的非线性趋势。

如上所述的传染病传播率及疫情评估方法中,传染病增长率at是根据观测数据由传染病自然增长模型导出,随时间变化;传染病传播率ct是基于数据的、且随时间变化的变量。

如上所述的传染病传播率及疫情评估方法,当传染病在时间t的传播率ct>1时,现有感染者总数量随时间t增加;当ct=1时,现有感染者总数量达到峰值;当ct<1时,现有感染者总数量随时间t呈现减少趋势。

如上所述的传染病传播率及疫情评估方法,其中,所述根据传染病传播率ct的变化对传染病过往疫情进行追踪,根据传染病传播率ct的趋势对疫情的未来发展状况作出预估,具体可以包括:

依据已有数据得到的传染病传播率ct追踪过往疫情或定量评估疫情防控效果;通过对传染病传播率ct的趋势做外延,预估疫情未来的发展情况,预判疫情拐点出现的时间和疫情高峰时的现有感染者总数量。

上述公式模型中,每个参数都是时间的函数,且这些参数可以直接由每天发布的数据直接计算得出。因此,ct可取代模糊不清的r0而直接作为跟踪疫情动态发展的核心参数。

本发明实施例提供的技术方案简单、直接,可计算出由统计数据驱动且随时间变化的传播率,该传播率可用于传染病疫情的分析与研判。由于传播率评估是基于直接的观测数据,因此可直接应用于已有数据的分析和过往疫情追踪,也可以根据传播率的变化趋势对疫情未来发展情况做出预估。

图2为本发明的一个应用实施例中现有感染者数量(确诊病例减去死亡病例和治愈病例)随时间的变化示意图,图3为图2所述的应用实施例中疫情传播率随时间的变化示意图。该应用实施例为2019年的新型冠状病毒(2019-ncov)肺炎。2019年12月31日,中国向世界卫生组织提交了关于武汉市发现可引起肺炎的不明新型冠状病毒的报告。在此前后,中国政府采取了一系列强有力的防控措施以遏制疫情的大规模爆发。为保持信息透明,中华人民共和国国家卫生健康委员会每天发布确诊病例数量、疑似病例数量以及死亡人数等关键信息。

在图2中,横轴为自2020年1月16日(timestartjan.16:day)起,逐日2019-ncov现有感染者数量,纵轴为自然对数坐标(lncasenumber)。从图2可知,2019-ncov现有感染者总数量总体呈现线性特征,表明:现有感染者数量基本符合自然增长率模型。但进一步分析可以看出,曲线逐渐出现轻微的弯曲特征。利用该数据,基于公式(2)、公式(3)和公式(4)可计算出2019-ncov在时间t的传播率。

在图3中,横轴自2020年1月16日起,纵轴为2019-ncov的传播率(transmissionrate),计算初始时间为2020年1月16日(timestartjan.16:day)。emd线为由emd分解得到的传播率变化趋势,ls虚线为由最小二乘法得到的线性趋势,虚线为武汉“封城”后传播率变化趋势。“quarantime”表示武汉“封城”的时间点(1月23日武汉“封城”,从次日起考虑其效果)。

图3中同时给出了由传统的最小二乘法以及经验模态分解法(emd)得到的传播率发展趋势。尽管由两个方法得出的结果相似,但emd方法由于其完全自适应性、不需提前预设基函数而更有优势。传播率呈现一个缓慢下降的趋势,表明传染病的传播正在得到有效控制。感染人数样本越大,所估算的传染率的不确定性越低。

本发明提供的技术方案,传播率是基于直接的观测数据,可直接应用于已有数据的分析和过往疫情追踪,且根据传播率的变化趋势也可对疫情未来发展情况做出预估。例如,对于2019年的新型冠状病毒(2019-ncov)肺炎,如果按照总体的传播率线性趋势外推,即假定传播率不变,则预测累计的确诊感染人数会从2020年2月2日起在第15天达到峰值,之后开始下降。

特别需要指出的是,上述线性趋势由所有的数据平均加权获得。由于初期缺乏足够的病例数、快速准确的诊断方法以及适当的行政干预,疫情初期的数据质量或许存在一定问题。如果取2020年1月24日(武汉市实施“封城”隔离的次日)后的数据,如图3所示,传播率线性趋势与不隔离情况出现显著差异,该趋势定量表明了隔离及其他管控措施的有效性。众所周知,在没有有效药物治疗情况下,隔离是控制流行病最有效的措施。如果以该趋势持续下去,那么疫情则会在从2020年2月2日开始的7天后(即2020年2月9日)达到峰值。按照本发明提供的公式模型估计,届时的感染人数总量预计在3.7万至4.4万人之间。上述估计可为抗击疫情的宏观决策提供参考,也可以使公众了解疫情的基本趋势。

需要指出,准确预测传染病感染人数峰值(也称拐点)的出现时间和累计感染人数是一项极其复杂的工作,不同模型的预测结果差异很大。网络信息显示,钟南山院士研究组预测峰值出现在202年2月8日左右;使用传统模型的结果显示武汉疫情将在2020年4月甚至更晚达到峰值,并且累计感染人数将达到令人难以置信高量值;美国斯坦福大学michaellevitt教授(诺贝尔化学奖获得者)2月2日网络发布的报告认为,从确诊人数同比倍数看不到明显信息,而从死亡人数同比倍数推测出下周新增死亡人数将迅速减少。同时,《纽约时报》预警存在疫情大暴发可能。面对如此互相矛盾且混乱的信息,提供简单且鲁棒性的预估是政府和公众的迫切需求。虽然方法与路径完全不同,本申请正是从确诊人数计算得到传播率,从而外推出拐点时间和预计感染人数。

如果正确调整“易感者-感染者-移出者(sir)”模型的参数,传统的r0参数也能提供深层次的传染病动力学信息。然而这将依赖于大量的假设和详尽的数据,而这些数据可能无法或者难以获取。本申请提出的传播率是一种简单、直接、由公报数据可直接计算的参数,基于该传播率的模型更加简洁、直观、具有鲁棒性,且是从疫情整体上进行把握。既然各种传染病扩散模型都有很大的不确定性,本方法就遵从奥卡姆剃刀原理以求删繁就简。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1