在线社会网络多源点信息溯源系统及其方法

文档序号:9810718阅读:710来源:国知局
在线社会网络多源点信息溯源系统及其方法
【技术领域】
[0001] 本发明涉及网络安全领域,特别涉及一种在线社会网络多源点信息溯源系统及其 方法。
【背景技术】
[0002] 随着各种新兴媒体的广泛应用,信息流动模式和服务模式也发生了重大变化,网 民均可借助第三方应用平台生产信息、部署软件、提供服务,这使得信息源急剧增大,信息 发布方式多样,互联网上任何一个人都有可能是信息的发送者和接收者,社会事件在网络 中随着不同的意识形态、社会思潮逐步演化并不断发酵、扩散,形成一个又一个热点问题。 尤其是针对网络中的不良信息传播者,如何有效实现信息溯源,对于实现网络舆情监管,及 时了解网络舆情的发展动向具有重要意义,并将为从源头上实现网络舆情治理提供有力指 导。
[0003] 现有的信息溯源研究已经取得了部分进展。但是,仍存在以下局限和不足:一、目 前的溯源方法多以网络快照为研究背景,而且大多数研究方法需要获取全部感染节点的状 态,在线社会网网络中实时获知全部节点的状态难以实现;二、在静态快照为前提的背景下 不具备节点获取信息的时间信息,无法利用时间维度信息来提高追溯源点的准确性,而在 线社会网络中观察节点通常可以确定节点获取信息的时刻;三、针对多点溯源问题,现有方 法通常都有限制条件,在确定源点数量的条件下确定源点的位置,目前还没有对未知源点 数量条件下的溯源方法。在线社会网络中并不容易实时的获取所有节点的状态,因此,目前 的大多数静态方法并不适用于在线社会网络中确定信息传播源点。

【发明内容】

[0004] 针对现有技术中的不足,本发明提供一种在线社会网络多源点信息溯源系统及其 方法,在解决不确定信息源点数量情况下,在网络中布置部分观察节点来代替获取全部节 点状态的方式,获取消息是由哪些邻居节点接收的以及接收到消息的时刻来完成信息溯 源,充分利用时间维度来提高确定信息源点的准确性。
[0005] 按照本发明所提供的设计方案,一种在线社会网络多源点信息溯源系统,包含原 始数据采集模块、备选集选取模块、基于近邻传播的聚类模块、协同反馈模块,
[0006] 原始数据采集模块,构建在线社会网络结构并在网络中布置观察节点,对观察节 点接收到的节点信息进行量化表示;
[0007] 备选集选取模块,根据接收时间、节点信息与网络结构的映射关系,缩小信息源点 范围,采用重启式随机游走算法确定备选源点集和时延备选集;
[0008] 基于近邻传播的聚类模块,利用单次接收的观察节点和备选源点集在空间和时间 上的相近性确定信息源点的位置和数量,通过设计基于近邻传播的聚类算法,对观察节点 与备选源点集中节点进行聚类,一个聚类中心的代表点为一个可能的信息源点;
[0009] 协同反馈模块,对基于近邻传播的聚类结果进行检测,并判断检测结果是否达到 预定标准,若达到预定标准,则结束执行,否则,根据检测结果生成备选集调节命令,分别发 送给备选集选定模块和基于近邻传播的聚类模块,备选集选定模块和基于近邻传播的聚类 模块根据备选集调节命令调节备选源点集和每跳时延备选集范围。
[0010] 上述的,基于近邻传播的聚类算法:计算观察节点和备选源点集的相似度,构造相 似度矩阵,这里的相似度不是基于欧几里得空间,而是基于空间跳数与传播时间的比例关 系;对近邻传播的对象有所限制,因为观察节点不可能成为信息源点,而且同一紧密时间块 的备选节点集中只可能确定一个信息源点。
[0011] 上述的,协同反馈模块对基于近邻传播的聚类结果进行检测,并判断检测结果是 否达到预定标准,具体是指:协同反馈模块执行基于近邻传播的聚类算法,完成迭代循环, 判断迭代过程中迭代次数是否达到规定数值或迭代过程中改变的信息量是否小于设定阈 值,迭代过程中改变的信息量小于设定阈值即指近邻传播迭代过程中所有观察节点的归属 不再变化,。
[0012] -种在线社会网络多源点信息溯源方法,包含如下步骤:
[0013] 步骤1.构建在线社会网络结构,并在网络结构中布置多个观察节点,对观察节点 接收到的信息进行量化;
[0014] 步骤2.根据观察节点中多次接收信息的节点,将信息的传播方向信息与传播时间 信息映射到网络结构中,确定备选源点集和时延备选集;
[0015] 步骤3.确定观察节点中单次接收信息的观察节点;
[0016] 步骤4.计算单次接收信息的观察节点和备选源点集的相似度,构造相似度矩阵, 确定信息源点数量及位置,并确定信息源点的传播与影响范围,执行基于近邻传播的聚类 算法;
[0017] 步骤5.对基于近邻传播的聚类结果进行迭代,当迭代次数达到规定数值或迭代过 程中改变的信息量小于设定阈值时,迭代过程中改变的信息量小于设定阈值即指近邻传播 迭代过程中所有观察节点的归属不再变化,则进入步骤7,否则,生成备选源点集调节指令, 进入下一步骤;
[0018] 步骤6.根据备选源点集调节指令,调节备选源点集的范围,将观察节点的邻居节 点作为备选源点集,返回步骤4;
[0019] 步骤7.确定全部信息源点的数量与位置,结束执行过程。
[0020] 优选的,所述步骤2具体包含如下步骤:
[0021] 步骤2.1假设步骤1中布置k个观察节点,并定义观察节点集合为0 = 每个观察节点的节点信息
表示,其中,〇1表示k个观察节点中第i个观察 节点;v i, j表示观察节点i从邻居节点j接收到了信息,t i, j记录了接收信息的时刻,m为接收 到信息的次数,将多次接收信息的观察节点的方向信息与时间信息映射到网络结构中,定 义时刻集合Tc;Pt = {ti, ti+i,. . .,ti+k}中,如果k 2 2且ti+k-ti < 2u,其中,u为每一跳时延的方 差,那么时刻集合T#定义为紧密时间块,对应的邻居节点为紧密时间块节点集1Ρ*={ νι, Vi+1, . . .,Vi+k},定义节点prn,Pth是紧密时间块节点集ν_= {vi,Vi+i, . . .,Vi+k}的共同前趋,η 代表观察节点拥有相同前趋的邻居节点个数;pth表示共同前趋到紧密时间块节点的路径 的跳数;
[0022] 步骤2.2根据网络结构特征,根据观察节点为信息源点的概率,针对任意紧密时间 块节点集Vcpt= {vi,vi+i,. . .,vi+k},假设prn,Pth的路径路数都相同,Pr={prn, Pth}贝为共同前 趋集合,共同前趋集合的类型用|Pr|来表示,p(prn,pth)表示共同前趋pr n,pth成为信息源点 的概率的大小,如果| Pri | < | Pr21,那么max(p(0 = Pri)) 2 max(p(0 = Pr2)),初步确定信息 源点的范围和位置;
[0023] 步骤2.3根据网络结构与观察节点接收信息关系,通过紧密时间块得到信息源点 的方向、数量和与距离,根据首达时间点与紧密时间块的关系获取观察节点与信息源点之 间的最短距离,缩小备选源点集范围,确定每跳时延的均值和方差,缩小备选源点集范围, 确定每跳时延的均值和方差;采用重启式随机游走算法确定备选源点集和时延备选集,以 观察节点的邻居节点为出发源点,根据驻留时间和共同节点情况,确定信息源点和每跳时 延。
[0024] 上述的,步骤2.3中根据首达时间点与紧密时间块的关系获取观察节点与信息源 点之间的最短距离具体指:多次接收信息的观察节点中,在接收时间轴上,根据首达时间与 紧密时间块的关系,分为三种情况:情况1:多次接收到信息的观察节点时间轴上,t为观察 节点接收到信息的首达时间,T#是该观察节点的首个紧密时间块,并且满足& e ,观察 对应的网络结构,Pr是[^的共同前趋集,PTH。, pr是观察节点到共同前趋的路径集合,如果
则利用该前趋节点进一步确定每 , 一跳时延备选集,在紧密时间块前到达观察节点的信息存在由共同前
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1