一种基于离散数据的SIS模型可用性评估方法及系统

文档序号:32305077发布日期:2022-11-23 09:42阅读:38来源:国知局
一种基于离散数据的SIS模型可用性评估方法及系统
一种基于离散数据的sis模型可用性评估方法及系统
技术领域
1.本发明属于网络拓扑动力学技术领域,涉及一种基于离散数据的sis模型可用性评估方法及系统。


背景技术:

2.复杂网络传播动力学模型有着很广阔的应用面,比如:传染性疾病通过人与人之间的接触不断的传播,木马病毒在计算机网络上的扩散,信息舆论在社交网络上的传递等等。研究中,sis(susceptible-infected-susceptible)仓室模型是一个常用的传播动力学模型。如果个体处于s状态,则表示其处于健康状态。而i状态表示感染状态。人们通常采用连续时间sis模型来研究动力学传播的过程,而现实数据是基于离散时间的。
3.目前,研究人员通常采用线性映射(即,转变速率=转变概率
÷
时间间隔)来连接连续时间sis模型和基于离散时间的数据。但在使用的过程中还是存在一些问题,首先现有的线性映射方法需要时间间隔趋于0才能成立,当时间间隔或状态转移概率太大时,描述结果的精确度就会下降;其次是缺少判断连续时间sis模型可用性的定量判据,导致数据评判的精确度下降。


技术实现要素:

4.本发明的目的在于解决现有技术中无法对模型进行定量评判,导致数据评判结果的精确度低的问题,提供一种基于离散数据的sis模型可用性评估方法及系统。
5.为达到上述目的,本发明采用以下技术方案予以实现:
6.一种基于离散数据的sis模型可用性评估方法,包括以下步骤:
7.s1:以固定时间间隔采集某传播数据集,获取数据集中个体的状态数据,基于个体状态数据得到个体的关联性状态数据,基于个体的关联性状态数据构建关联性时间序列;
8.s2:基于构建的关联性时间序列,计算固定时间间隔内个体感染概率和个体康复概率;
9.s3:引入判据公式,基于个体感染概率和个体康复概率判断该数据集是否能够用sis模型进行描述,当判据满足,则通过sis模型评估数据集中数据的传播特性,当判据不满足,则返回s1。
10.本发明的进一步改进在于:
11.所述步骤s1中,获取的个体状态数据包括易感状态s和感染状态i;
12.所述步骤s1中的个体关联性状态数据包括当前时刻和上一时刻均为易感的状态ss、当前时刻为感染和上一时刻为易感的状态si、当前时刻为易感和上一时刻为感染的状态is以及当前时刻和上一时刻均为感染的状态ii;
13.所述步骤s1中的关联性时间序列包括ss(t)、si(t)、is(t)和ii(t);
14.其中,ss(t)表示时刻t和时刻t-δt都为易感状态的个体数量;
15.si(t)表示时刻t为感染状态且时刻t-δt为易感状态的个体数量;
16.is(t)表示时刻t为易感状态且时刻t-δt为感染状态的个体数量;
17.ii(t)表示时刻t和时刻t-δt均为感染状态的个体数量。
18.所述步骤s2中固定时间间隔内个体感染概率通过式(1)计算:
[0019][0020]
所述固定时间间隔内个体康复概率通过式(2)计算:
[0021][0022]
所述判据公式为:
[0023]
a(t)+b(t)《1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0024]
其中,a(t)表示个体感染概率,b(t)表示个体康复概率。
[0025]
所述步骤s3中,当判据满足,则通过sis模型评估数据集中数据传播特性包括以下步骤:
[0026]
计算sis模型在时间间隔[t-δt,t]内的个体平均感染速率:
[0027][0028]
计算sis模型在时间间隔[t-δt,t]内的个体平均感染速率
[0029][0030]
计算sis模型在时间间隔[t-δt,t]内一个易感个体接触一个感染个体的平均感染速率:
[0031][0032]
其中,i(t)=si(t)+ii(t)表示时刻t的感染状态的个体数量;
[0033]
基于得到的《c》、《d》和《β》,评估该数据集中数据的传播特性。
[0034]
所述步骤s3还包括以下步骤:
[0035]
当判据不满足时,返回步骤s1,检查数据集是否采集错误,若数据集采集错误,则重新采集;
[0036]
若数据集采集正确,则证明该传播数据集不适用于通过sis模型进行描述,不对该数据集进行描述。
[0037]
所述步骤s1中,固定时间间隔设定为1。
[0038]
一种基于离散数据的sis模型可用性评估系统,包括数据采集模块、概率计算模块和判据模块;
[0039]
数据采集模块,以固定时间间隔采集某传播数据集,获取数据集中个体的状态数据,基于个体状态数据得到个体的关联性状态数据,基于个体的关联性状态数据构建关联性时间序列;
[0040]
概率计算模块,用于基于构建的关联性时间序列,计算固定时间间隔内个体感染
概率和个体康复概率;
[0041]
判据模块,用于基于个体感染概率和个体康复概率判断该数据集是否能够用sis模型进行描述,当判据满足,则通过sis模型评估数据集中数据的传播特性,当判据不满足,则返回数据采集模块。
[0042]
一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求本发明任一项所述方法的步骤。
[0043]
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如本发明任一项所述方法的步骤。
[0044]
与现有技术相比,本发明具有以下有益效果:
[0045]
本发明公开了一种基于离散数据的sis模型可用性评估方法,基于构建的时间序列计算固定时间间隔内个体感染概率和个体康复概率,将得到的结果结合判据公式评判sis模型是否可以对数据进行描述,对模型进行定量评判,提高了数据描述结果的精确度,同时,本方法在时间间隔较大或转移概率较大时,仍然能够得到准确计算结果,通过计算结果可以直观展示参数随时间的演化,通过提前判断sis模型的可用性,避免出现误判的结果。
[0046]
进一步的,本发明时间间隔可以设定为1,时间间隔较大,相比较与线性映射,在时间间隔较大的同时,仍然可以保持精确的评判结果。
附图说明
[0047]
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0048]
图1为本发明的应用流程图;
[0049]
图2为sis模型的传播机理图;
[0050]
图3为感染者密度的时间演化图;
[0051]
图4为连续时间sis模型个体平均感染速率和个体平均康复速率的时间演化图。
具体实施方式
[0052]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
[0053]
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0054]
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一
个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
[0055]
在本发明实施例的描述中,需要说明的是,若出现术语“上”、“下”、“水平”、“内”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0056]
此外,若出现术语“水平”,并不表示要求部件绝对水平,而是可以稍微倾斜。如“水平”仅仅是指其方向相对“竖直”而言更加水平,并不是表示该结构一定要完全水平,而是可以稍微倾斜。
[0057]
在本发明实施例的描述中,还需要说明的是,除非另有明确的规定和限定,若出现术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
[0058]
下面结合附图对本发明做进一步详细描述:
[0059]
参见图1-2,本发明公开了一种基于离散数据的sis模型可用性评估方法,包括以下步骤:
[0060]
步骤1:以固定时间间隔采集某传播数据集,获取数据集中个体的状态数据,基于个体状态数据得到个体的关联性状态数据;基于个体的关联性状态数构建关联性时间序列;
[0061]
以固定时间间隔δt采集个体的状态数据包括易感状态s和感染状态i;
[0062]
基于个体状态数据得到个体的关联性状态数据包括:
[0063]
本时刻和上一时刻都为易感的状态ss;
[0064]
本时刻为感染和上一时刻为易感的状态si;
[0065]
本时刻为易感和上一时刻为感染的状态is;
[0066]
本时刻和上一时刻都为感染的状态ii;
[0067]
基于个体的关联性状态数据构建关联性时间序列包括ss(t)、si(t)、is(t)、ii(t),构建时间序列。
[0068]
其中,ss(t)表示时刻t和时刻t-δt都为易感状态的个体数量;
[0069]
si(t)表示时刻t为感染状态且时刻t-δt为易感状态的个体数量;
[0070]
is(t)表示时刻t为易感状态且时刻t-δt为感染状态的个体数量;
[0071]
ii(t)表示时刻t和时刻t-δt都为感染状态的个体数量。
[0072]
所述步骤1中的状态数据采集可以来自实际的采集,也可以来自模拟算法的生成。
[0073]
本发明实施例中固定时间间隔可以为1,也可以根据实际情况调整固定时间间隔的值。
[0074]
步骤2:基于构建的关联性时间序列,计算固定时间间隔内个体感染概率和个体康复概率;
[0075]
通过式(1)计算时间间隔[t-δt,t]内个体感染概率
[0076][0077]
通过式(2)计算时间间隔[t-δt,t]内个体康复概率
[0078][0079]
步骤3:引入判据公式,基于个体感染概率和个体康复概率判断该数据集是否能够用sis模型进行描述;
[0080]
根据判据公式(3)来判断该过程是否可用连续时间sis模型来描述:
[0081]
a(t)+b(t)《1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0082]
如果满足判据公式,则基于sis模型评估数据的传播特性;如果不满足判据公式,则表示数据采集有误或者该过程不可使用连续时间sis模型,其中具体的评判方法为:
[0083]
返回步骤1,核查数据的采集是否有误,若数据采集有误,则重新执行步骤1,重新采集数据;若数据采集无误,则证明该过程不可使用连续时间sis模型。
[0084]
本发明实施例中,基于sis模型评估数据的传播特性。
[0085]
根据非线性映射关系,计算连续时间sis模型在时间间隔[t-δt,t]内的个体平均感染速率、个体平均康复速率参数、以及一个易感个体接触一个感染个体的平均感染速率;最后基于这些得到的数据,分析参数的演化特征,评估数据的传播特性。
[0086]
计算sis模型在时间间隔[t-δt,t]内的个体平均感染速率:
[0087][0088]
计算sis模型在时间间隔[t-δt,t]内的个体平均感染速率
[0089][0090]
计算sis模型在时间间隔[t-δt,t]内一个易感个体接触一个感染个体的平均感染速率:
[0091][0092]
其中,i(t)=si(t)+ii(t)表示时刻t的感染状态的个体数量;
[0093]
本发明还公开了一具体实施例:
[0094]
本实施例预先设定一个系统,通过离散时间随机模拟算法生成步骤1所需的数据。
[0095]
假定种群规模1000000的系统里,时间间隔δt为1,一个易感个体接触一个感染个体的感染概率为0.000001,感染个体的康复概率为0.7,初始感染人数为100。
[0096]
步骤1,通过离散时间随机模拟算法生成所需的数据,即得到以固定时间间隔δt的关联性时间序列ss(t)、si(t)、is(t)、ii(t),经过组合也可以构建出传统的时间序列,参见图3。
[0097]
步骤2,通过公式(1)和公式(2)分别计算时间间隔[t-δt,t]内的个体感染概率和个体康复概率
[0098][0099][0100]
本实施例为一特殊假定系统,经数据拟合后,a(t)和b(t)基本满足a(t)=1-(1-0.000001)
i(t)
和b(t)=0.7。
[0101]
步骤3,根据步骤2的结果可以得到a(t)+b(t)恒小于1,即满足判据公式,可用连续时间sis模型来描述。
[0102]
参见图4,通过公式(4)和(5)分别计算连续时间sis模型在时间间隔[t-δt,t]内的个体平均感染速率和个体平均感染速率:
[0103][0104][0105]
最后,通过公式(6)计算连续时间sis模型在时间间隔[t-δt,t]内一个易感个体接触一个感染个体的平均感染速率:
[0106][0107]
计算连续时间sis模型在时间间隔[t-δt,t]内一个易感个体接触一个感染个体的平均感染速率。
[0108]
通过连续时间动力学的随机模拟得到曲线,它和步骤1生成的散点数据完全重合,这说明了本发明方法的可靠性。
[0109]
本发明所述的sis模型即为连续时间sis模型。
[0110]
一种基于离散数据的sis模型可用性评估系统,包括数据采集模块、概率计算模块和判据模块;
[0111]
数据采集模块,以固定时间间隔采集某传播数据集,获取数据集中个体的状态数据,基于个体状态数据得到个体的关联性状态数据,基于个体的关联性状态数据构建关联性时间序列;;
[0112]
概率计算模块,用于基于构建的时间序列,计算固定时间间隔内个体感染概率和个体康复概率;
[0113]
判据模块,用于基于个体感染概率和个体康复概率判断该数据集是否能够用sis模型进行描述,当判据满足,则通过sis模型评估数据集中数据的传播特性,当判据不满足,则返回数据采集模块。
[0114]
本发明一实施例提供的终端设备的示意图。该实施例的终端设备包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序。所述处理器执行所述计算机程序时实现上述各个方法实施例中的步骤。或者,所述处理器执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能。
[0115]
所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。
[0116]
所述终端设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器、存储器。
[0117]
所述处理器可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
[0118]
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述终端设备的各种功能。
[0119]
所述终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
[0120]
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1