一种传播网络中感染源的确定方法及装置与流程

文档序号:18104738发布日期:2019-07-06 11:34阅读:262来源:国知局
一种传播网络中感染源的确定方法及装置与流程

本发明涉及信息传播技术领域,具体涉及一种传播网络中感染源的确定方法及装置。



背景技术:

信息技术的发展使人们之间的沟通和交流愈发便捷和频繁,促使形成了一个以人为节点,人们之间影响关系为边的复杂传播网络,传播着各式各样的内容。同时,网络的普遍性使人们更容易受到各种网络风险的影响。例如,某些谣言或者不良言论容易在facebook、微博等在线社交网络中快速传播造成舆论恐慌。知道信息传播的起源可以帮助我们更好地了解信息传播的原因,从而更好的防范信息传播过程,减少不良信息传播给社会造成的财力和劳动损失,因此推断传播网络中的感染源头具有重要的现实意义。

现有技术中,大多数推断传播网络中感染源的方法是利用结点是否具有传播中心性或者是模拟仿真近似计算的策略来确定。

本申请发明人在实施本发明的过程中,发现现有技术的方法,至少存在如下技术问题:

现有技术中的方法比较适用于树状的传播网络,或者具有较高的时间复杂度,而实际生活中的传播网络结构比树状结构更为复杂,同时具有较高的时间需求,使得现有的这些方法难以应用在实际生活中。

由此可知,现有技术中的方法存在应用范围较窄和效率不高的技术问题。



技术实现要素:

有鉴于此,本发明提供了一种传播网络中感染源的确定方法及装置,用以解决或者至少部分解决现有技术中的方法存在的应用范围较窄和效率不高的技术问题。

本发明第一方面提供了一种传播网络中感染源的确定方法,该方法包括:

步骤s1:基于影响传播模型计算不同结点作为感染源时,传播网络中每个结点在不同时刻的感染概率,其中,影响传播模型为g={v,e,w},其中,v={v1,v2,...,vn}表示传播网络中的n个结点,e表示传播网络中影响关系的有向边集合,w表示有向边上对应的权重集合,同时,并采用集合s={s(1),...,s(n)}记录网络中的结点在传播过程结束后的感染状态,其中,s(i)表示传播过程结束后结点vi的感染状态,s(i)=1表示传播过程结束后结点vi被感染,s(i)=0表示传播过程结束后结点vi没有被感染;

步骤s2:根据在不同时刻的感染概率,计算不同结点作为感染源时产生收集的观测数据的概率;

步骤s3:根据结点产生观测数据的概率,确定目标结点,将其作为传播感染源。

在一种实施方式中,步骤s1具体包括:

计算每个结点vs作为感染源时,传播网络中每个结点vi在t时刻被感染的概率i_si(t),其中,1≤s≤n,0≤t≤m,

其中,n表示传播网络中结点的个数,m表示时刻单位,n(i)表示能够对结点vj产生影响的结点的索引集合,wji表示结点vj和vi之间的权重。

在一种实施方式中,步骤s2具体包括:

根据每个结点vi在t时刻被感染的概率i_si(t),计算每个结点vs作为感染源时产生观测数据s的概率p(s),

其中,s(i)表示收集到的观测数据中结点vi的状态,s(i)=1表示结点vi被感染,s(i)=0表示结点vi未被感染。

在一种实施方式中,步骤s3具体包括:

根据产生观测数据s的概率p(s),对传播网络中的n个结点进行排序,将满足预设条件的前k个结点作为感染源,其中,k为大于0的正整数。

在一种实施方式中,步骤s3中,k的选取范围为1~n。

基于同样的发明构思,本发明第二方面提供了一种传播网络中感染源的确定装置,包括:

结点感染概率计算模块,用于基于影响传播模型计算不同结点作为感染源时,传播网络中每个结点在不同时刻的感染概率,其中,影响传播模型为g={v,e,w},其中,v={v1,v2,...,vn}表示传播网络中的n个结点,e表示传播网络中影响关系的有向边集合,w表示有向边上对应的权重集合,同时,并采用集合s={s(1),...,s(n)}记录网络中的结点在传播过程结束后的感染状态,其中,s(i)表示传播过程结束后结点vi的感染状态,s(i)=1表示传播过程结束后结点vi被感染,s(i)=0表示传播过程结束后结点vi没有被感染;

结点产生观测数据的概率计算模块,用于根据在不同时刻的感染概率,计算不同结点作为感染源时产生收集的观测数据的概率;

感染源确定模块,用于根据结点产生观测数据的概率,确定目标结点,将其作为传播感染源。

在一种实施方式中,结点感染概率计算模块具体用于:

计算每个结点vs作为感染源时,传播网络中每个结点vi在t时刻被感染的概率i_si(t),其中,1≤s≤n,0≤t≤m,

其中,n表示传播网络中结点的个数,m表示时刻单位,n(i)表示能够对结点vj产生影响的结点的索引集合,wji表示结点vj和vi之间的权重。

在一种实施方式中,结点产生观测数据的概率计算模块具体用于:

根据每个结点vi在t时刻被感染的概率i_si(t),计算每个结点vs作为感染源时产生观测数据s的概率p(s),

其中,s(i)表示收集到的观测数据中结点vi的状态,s(i)=1表示结点vi被感染,s(i)=0表示结点vi未被感染。

基于同样的发明构思,本发明第三方面提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被执行时实现第一方面所述的方法。

基于同样的发明构思,本发明第四方面提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述的方法。

本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:

本发明提供的一种传播网络中感染源的确定方法,首先通过构建影响传播模型来计算不同结点作为感染源时,网络中各个结点在不同时刻的感染概率;然后通过结点被感染的概率来计算不同结点作为感染源时产生收集的观测数据的概率;最后根据结点产生观测数据的概率来衡量结点是传播源头的可能性,从而选择最终的传播感染源。

由于本发明可以基于信息传播过程结束后传播网络中结点的最终感染状态数据,通过建立信息传播过程的模型来拟合感染状态数据,从而确定出最有可能的结点作为感染源。不需要传播网络的结构是树状的传播网络,适用于一般的传播网络结构,同时算法的运行效率较高,从而达到扩大应用范围以及提高效率的技术效果,能够快速有效地解决现有传播网络中的感染源推断方法存在的应用范围较窄和效率不高的技术问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例中传播网络中感染源的确定方法的流程图;

图2为本发明实施例在传播网络上推断的传播源对应的错误距离的结果示意图;

图3为本发明实施例中传播网络中感染源的确定装置的结构框图;

图4为本发明实施例中一种计算机可读存储介质的结构框图;

图5为本发明实施例中计算机设备的结构图。

具体实施方式

本发明的目的在于提供一种传播网络中感染源的确定方法及装置,用以改善现有技术中的方法存在的应用范围较窄和效率不高的技术问题。

为了解决上述技术问题,本发明的主要构思如下:

首先通过构建影响传播模型来计算不同结点作为感染源时,网络中各个结点在不同时刻的感染概率;然后通过结点被感染的概率来计算不同结点作为感染源时产生收集的观测数据的概率;最后根据结点产生观测数据的概率来衡量结点是传播源头的可能性,从而选择最终的传播感染源。

本发明不需要对传播网络的结构增加限制,适用于不同结构的传播网络;提出了新的方法来根据感染状态数据快速准确地推断传播过程中的感染源。

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例一

本实施例提供了一种传播网络中感染源的确定方法,请参见图1,该方法包括:

步骤s1:基于影响传播模型计算不同结点作为感染源时,传播网络中每个结点在不同时刻的感染概率,其中,影响传播模型为g={v,e,w},其中,v={v1,v2,...,vn}表示传播网络中的n个结点,e表示传播网络中影响关系的有向边集合,w表示有向边上对应的权重集合,同时,并采用集合s={s(1),...,s(n)}记录网络中的结点在传播过程结束后的感染状态,其中,s(i)表示传播过程结束后结点vi的感染状态,s(i)=1表示传播过程结束后结点vi被感染,s(i)=0表示传播过程结束后结点vi没有被感染。

具体来说,由于现有技术中的方法现一般是利用结点是否具有传播中心性或者是模拟仿真近似计算的策略来确定,然而这些方法比较适用于树状的传播网络,而实际中的传播网络比树状结构更为复杂,因而现有的方法并不适用。本发明提供的是一种不依赖时间信息的感染源推断方法。可以基于信息传播过程结束后传播网络中结点的最终感染状态数据,并通过建立信息传播过程的模型来拟合感染状态数据,找到最有可能的结点作为感染源。

其中,影响传播模型即为传播网络中的影响关系图,通过该模型可以计算出计算不同结点作为感染源时,传播网络中每个结点在不同时刻的感染概率。

在具体的实施方式中,步骤s1具体包括:

计算每个结点vs作为感染源时,传播网络中每个结点vi在t时刻被感染的概率i_si(t),其中,1≤s≤n,0≤t≤m,

其中,n表示传播网络中结点的个数,m表示时刻单位,n(i)表示能够对结点vj产生影响的结点的索引集合,wji表示结点vj和vi之间的权重。

具体的实施过程中,为了找到寻找感染源,本发明需要计算出每一个结点单独作为感染源时产生观测数据的概率,因而,初始时刻(t=0时),只有一个结点被当作感染源,如果结点被作为感染源,自身被感染的概率为1,如果结点没有被作为感染源,自身被感染的概率则为0。

步骤s2:根据在不同时刻的感染概率,计算不同结点作为感染源时产生收集的观测数据的概率。

具体来说,在计算出每个结点作为感染源时,传播网络中每个结点在不同时刻的感染概率后,接下来需要计算每一个结点单独作为感染源时产生观测数据的概率。

在具体的实施过程中,步骤s2具体包括:

根据每个结点vi在t时刻被感染的概率i_si(t),计算每个结点vs作为感染源时产生观测数据s的概率p(s),

其中,s(i)表示收集到的观测数据中结点vi的状态,s(i)=1表示结点vi被感染,s(i)=0表示结点vi未被感染。

步骤s3:根据结点产生观测数据的概率,确定目标结点,将其作为传播感染源。

在具体的实施方式中,步骤s3具体包括:

根据产生观测数据s的概率p(s),对传播网络中的n个结点进行排序,将满足预设条件的前k个结点作为感染源,其中,k为大于0的正整数。

具体来说,按照产生观测数据s的概率p(s)从大到小的顺序,将传播网络中的对应的n个结点排序,选择前k个结点作为感染源。

在一种实施方式中,步骤s3中k的选取范围为1~n。

为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施示例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。

请参见图2,为具体实施方式中,在传播网络上推断的传播源对应的错误距离的结果示意图,其中,错误距离表示通过本发明方法确定出的感染源与真实的感染源在传播网络中的测地距离。错误距离越大表示确定出的感染源与真实的感染源相距越远,错误距离越小表示确定出的感染源与真实的感染源之间的距离越近。也就是错误距离越小,表示本发明的感染源确定算法越准确。

在本实施例中,具体使用九个lfr算法生成的人工网络(如表1所示)以及一个表示科学家研究工作合作关系的真实网络poster,其中,poster网络中的结点表示科学家,网络中的边表示两个科学家之间存在合作关系。具体地,在十个网络(九个lfr和一个poster)上进行测试,每个网络上进行一次模拟传播,根据收集的感染数据推断每个网络中的感染源。

每个网络的传播数据生成过程如下:假定网络中存在影响关系的两个结点之间的感染概率为0.3,模拟传播时从测试网络中随机选一个结点作为初始“感染”点,并根据ic模型进行传播模拟,记录传播模拟结束后每个结点的感染状态作为实验的观测数据集。

表1实验网络

其中,表1表示的是九个lfr网络,具体为:net1(包含100个结点,平均度为4),net2(包含150个结点,平均度为4),net3(包含200个结点,平均度为4),net4(包含250个结点,平均度为4),net5(包含300个结点,平均度为4),net6(包含200个结点,平均度为2),net7(包含200个结点,平均度为3),net8(包含200个结点,平均度为5),net9(包含200个结点,平均度为6)。另外,poster网络379个结点,1602条边。

本实施方式中,采用多个测试网络是为了衡量算法在不同网络上的适用性,net1-5用于衡量网络大小对算法的影响,net6-9用于衡量网络稀疏程度对算法的影响,poster用于衡量算法在真实网络上的准确性。通过图2,可以看出,采用本发明的方法来确定感染源,错误距离可以控制在3以内,并且在net3、net4、net6、net9上的效果最佳,从而不需要传播网络的结构是树状的传播网络,适用于一般的传播网络结构,同时算法的运行效率较高,能够快速有效地解决传播网络中的感染源推断问题。

基于同一发明构思,本申请还提供了与实施例一中传播网络中感染源的确定方法对应的装置,详见实施例二。

实施例二

本实施例提供了一种传播网络中感染源的确定装置,请参见图3,该装置包括:

结点感染概率计算模块201,用于基于影响传播模型计算不同结点作为感染源时,传播网络中每个结点在不同时刻的感染概率,其中,影响传播模型为g={v,e,w},其中,v={v1,v2,...,vn}表示传播网络中的n个结点,e表示传播网络中影响关系的有向边集合,w表示有向边上对应的权重集合,同时,并采用集合s={s(1),...,s(n)}记录网络中的结点在传播过程结束后的感染状态,其中,s(i)表示传播过程结束后结点vi的感染状态,s(i)=1表示传播过程结束后结点vi被感染,s(i)=0表示传播过程结束后结点vi没有被感染;

结点产生观测数据的概率计算模块202,用于根据在不同时刻的感染概率,计算不同结点作为感染源时产生收集的观测数据的概率;

感染源确定模块203,用于根据结点产生观测数据的概率,确定目标结点,将其作为传播感染源。

在一种实施方式中,结点感染概率计算模块201具体用于:

计算每个结点vs作为感染源时,传播网络中每个结点vi在t时刻被感染的概率i_si(t),其中,1≤s≤n,0≤t≤m,

其中,n表示传播网络中结点的个数,m表示时刻单位,n(i)表示能够对结点vj产生影响的结点的索引集合,wji表示结点vj和vi之间的权重。

在一种实施方式中,结点产生观测数据的概率计算模块202具体用于:

根据每个结点vi在t时刻被感染的概率i_si(t),计算每个结点vs作为感染源时产生观测数据s的概率p(s),

其中,s(i)表示收集到的观测数据中结点vi的状态,s(i)=1表示结点vi被感染,s(i)=0表示结点vi未被感染。

在一种实施方式中,感染源确定模块203具体用于:

根据产生观测数据s的概率p(s),对传播网络中的n个结点进行排序,将满足预设条件的前k个结点作为感染源,其中,k为大于0的正整数。

在一种实施方式中,感染源确定模块203中,k的选取范围为1~n。

由于本发明实施例二所介绍的装置,为实施本发明实施例一中传播网络中感染源的确定方法所采用的装置,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该装置的具体结构及变形,故而在此不再赘述。凡是本发明实施例一的方法所采用的装置都属于本发明所欲保护的范围。

实施例三

请参见图4,基于同一发明构思,本申请还提供了一种计算机可读存储介质300,其上存储有计算机程序311,该程序被执行时实现如实施例一中所述的方法。

由于本发明实施例三所介绍的计算机可读存储介质为实施本发明实施例一中传播网络中感染源的确定方法所采用的计算机设备,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该计算机可读存储介质的具体结构及变形,故而在此不再赘述。凡是本发明实施例一中方法所采用的计算机可读存储介质都属于本发明所欲保护的范围。

实施例四

基于同一发明构思,本申请还提供了一种计算机设备,请参见图5,包括存储401、处理器402及存储在存储器上并可在处理器上运行的计算机程序403,处理器402执行上述程序时实现实施例一中的方法。

由于本发明实施例四所介绍的计算机设备为实施本发明实施例一中传播网络中感染源的确定方法所采用的计算机设备,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该计算机设备的具体结构及变形,故而在此不再赘述。凡是本发明实施例一中方法所采用的计算机设备都属于本发明所欲保护的范围。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1