一种基于随机游走机制的有向社交网络关键传播节点发现方法与流程

文档序号:12125747阅读:1466来源:国知局

本发明涉及一种基于随机游走机制的有向社交网络关键传播节点发现方法。



背景技术:

近年来,随着微博、博客、社区论坛、微信、电子邮件等社交网络的迅猛发展,相对于传统媒体,包括正面的及负面的各种信息都能够借助于社交网络快速传播,并且达到了非常广的传播范围以及非常大的传播程度。相比较而言,微博等有向社交网络的使用方便快捷,并且不受时间、地域等方面的限制,可以让用户充分表达自己的观点,发表不同的意见,因此更加受到大多数用户的青睐,相应的其在信息传播方面的作用也更加突出。比如,各种谣言借助于微博进行传播,给人们的日常生活造成了较大的负面影响。当然,各级政府也可使用微博平台发布各种正面的信息,以揭露谣言本身的虚假性,从而达到辟谣的目的。为了使微博等社交网络信息传播更好地服务于社会以及人们的日常生活,我们就需要掌握其内在的传播机理,而这又建立在微博信息传播动力学行为研究的基础之上。

在深入理解社交网络信息传播规律的基础上,我们就可以有针对性地采取措施加速正面信息的传播,同样也可以设计用于抑制负面社交网络信息传播的有效干预机制。网络中关键传播节点的确定对于深刻理解社交网络信息的传播规律非常重要,因此该研究也受到了国内外众多研究者的关注,并提出了多种发现网络中关键传播节点的算法,但是这些算法或多或少存在一些不足之处,比如,有些算法需要了解网络的全局信息,而有些算法的复杂度较大等等。此外,经过分析社交网络的形成过程可知,很多社交网络比如微博、博客等都是有向网络,即信息总是从一个节点传播给它的邻居节点,只有两节点彼此之间相互关注,信息才能够在这两个节点之间双向传播,现有发现网络中关键传播节点算法涉及的有向网络的更是比较少。因此,无论是为了更好地控制负面微博信息的传播,还是为了加快正面微博信息的传播,设计出能够用于发现微博等有向网络中关键传播节点的算法至关重要。对于所设计的关键传播节点发现算法,需要采用蒙特卡罗仿真及真实环境运行等方法对该算法进行全面验证,确保其精确、合理、高效。



技术实现要素:

本发明的目的在于针对现有网络关键传播节点发现算法在有向社交网络中存在的问题及不足,提供一种基于随机游走机制的有向社交网络关键传播节点发现方法,该方法充分利用随机游走机制的灵活性,并且仅需要了解网络节点的局部信息,算法本身不仅简单、高效,而且其扩展性也比较好,稍作修改即可用于无向社交网络、无向通信网络等。

为实现上述目标,本发明采用以下技术方案予以实现:

基于随机游走机制的有向社交网络关键传播节点发现方法,包括以下步骤:

1)随机游走起始节点的选取:对于正面信息的传播,从网络中任意选取一个节点作为游走的起始节点;对于负面信息的防控,任意选取一个已接受信息的节点作为游走的起始节点;

2)确定了游走的起始节点后,从该起始节点开启游走过程;在整个游走过程中,始终记录下拥有邻居节点较多的节点,直至游走达到预设的步数为止。

本发明进一步的改进在于:

所述步骤2)的具体方法如下:

2-1)预设随机游走的步数n,以及游走过程中需要存储的关键传播节点数量m;

2-2)记录起始节点的ID号及其邻居节点数量,并从该起始节点开始游走,每一步都游走至当前节点的邻居节点中拥有最大邻居节点数量的节点,并记录该节点的ID号及其邻居节点数量,直到被记录的节点数量为m;从第m+i个节点开始,与前面被记录的m个节点中邻居节点数量最小的节点进行比较,若第m+i个节点拥有的邻居节点数量大,则就用该节点代替m个节点中那个邻居节点数量最小的节点,继续游走直到游走的步数为n;其中,i∈N+,N+是正整数集;

2-3)若被记录的节点的邻居节点数量为0,则后退两步并选择拥有邻居节点数量为次大的节点继续游走,直到游走的步数为n;若退回到了起始节点,则从新选取起始节点并从步骤2-1)开始新的游走过程。

所述随机游走的步数n以及存储的关键传播节点数量m,应当根据实际需要并兼顾算法效率来设置。

所述随机游走过程中始终记录的是拥有较大邻居节点数量的节点。

与现有技术相比,本发明具有以下有益效果:

本发明公开了一种基于随机游走机制的有向社交网络关键传播节点发现方法,首先需要完成随机游走起始节点的选取,对于正面网络信息的传播,起始节点可以从网络中随机选取;对于负面网络信息的传播,可以随机选择一个已经接受信息的节点作为起始节点,目的就是提高负面网络信息传播的防控效果。

进一步的,本发明在随机游走过程中,每一步都记录下当前节点的邻居节点中,邻居节点数量最多的节点,这表明算法能够获取影响网络信息传播的关键节点;当遇到邻居节点数量最多的节点时,并不是立即存储该节点,而是与已经存储的m个节点相比较,随后确定是否存储该节点。本发明通过采用简单的随机游走机制,获取网络中的关键传播节点,该算法非常易于由软件进行实现,能够适用于社交网络中的正面信息传播、网络舆情传播防控以及其它通信网络中的关键传播节点的发现。

进一步的,本发明同时兼顾算法可靠性及算法效率优化,在整个随机游走过程中不会出现重复游走的节点,同时也不会出现死循环及无路可走的情况。此外,本发明与网络的规模的大小无关,通过调整游走的步数可适用于各种规模的社交网络之中。

【具体实施方式】

下面对本发明做进一步详细描述:

本发明基于随机游走机制的有向社交网络关键传播节点发现方法,包括以下步骤:

1)随机游走起始节点的选取:对于正面网络信息的传播,从网络中任意选取一个节点作为游走的起始节点;对于负面网络信息的防控,任意选取一个已接受信息的节点作为游走的起始节点。

2)确定了游走的起始节点后,就可以从该起始节点开启游走过程。在游走过程中,始终记录下拥有邻居节点较多的那些节点,直至游走达到预设的步数为止。

该步骤具体包括:

2-1)预设随机游走的步数n,以及游走过程中需要存储的关键传播节点数量m;

2-2)记录起始节点的ID号及其邻居节点数量,从起始节点开始游走,每一步都游走至当前节点的邻居节点中拥有最大邻居节点数量的节点,并记录该节点的ID号及其邻居节点数量,直到被记录的节点数量为m。从第m+i(i∈N+,N+是正整数集)个节点开始,与前面被记录的m个节点中邻居节点数量最小的节点进行比较,若第m+i个节点拥有的邻居节点数量大,则就用该节点代替m个节点中邻居节点数量最小的那个节点,随后继续游走直到游走的步数为n;

2-3)若被记录节点的邻居节点数量为0,则后退两步并选择拥有邻居节点数量为次大的节点继续游走,直到游走的步数为n;若退回到了起始节点,则从新选取起始节点并从步骤2-1)开始新的游走过程。

在随机游走的过程中,分别设置了游走的步数n及存储关键节点数m两种参数,其中的参数n决定了游走的深度,该参数会影响算法的时间复杂度;而参数m则决定了算法的有效性,同时也会影响算法的效率;具体包括以下步骤:

A、在本发明提出的网络关键传播节点发现算法中,考虑了节点的邻居节点数量的大小,这代表了该节点的出度,因为和入度相比,节点的出度对社交网络信息传播的影响更大;

B、起始节点的选取:其一,对于网络中正面信息的传播,从网络中任意选取一个节点作为起始节点;其二,对于网络中负面信息的防控,任意选取一个已接受信息的节点作为起始节点;

C、赋初值:设定随机游走的步数n,以及游走过程中需要存储的关键传播节点数量m;

D、存储初始关键节点:记录起始节点的ID号及其邻居节点数量,从起始节点开始游走,每一步都游走至当前节点的邻居节点中拥有最大邻居节点数量的节点,并记录该节点的ID号及其邻居节点数量,直到被记录的节点数量为m;

E、更新关键节点:从第m+i(i∈N+,N+是正整数集)个节点开始,与前面被记录的m个节点中邻居节点数量最小的节点进行比较,若第m+i个节点拥有的邻居节点数量大,则就用该节点代替已存储的m个节点中邻居节点数量最小的那个节点,继续游走直到游走的步数为n;

F、在整个游走过程中,若被记录的节点的邻居节点数量为0,则后退两步并选择拥有邻居节点数量为次大的节点继续游走,直到游走的步数为n;若退回到了起始节点,则从新选取起始节点开始新的游走过程。

在社交网络信息传播过程中,网络中的关键节点对信息的传播特性起着重要作用。相对于节点的入度,出度会更加影响信息的传播速率以及最终的传播程度等。因此,本发明以节点的邻居节点数量(即为节点出度)作为节点被记录的依据。这是因为,邻居节点数量越大表示该节点的出度越大,在信息传播过程中将扮演更加重要的角色。

本发明中存储的m个关键节点是动态变化的,随机游走的每一步都会替换m个关键节点中邻居节点数量最小的那个节点,始终保持所记录节点拥有的邻居节点数量是较大的,这是本发明有效的重要的保证。

本发明首先根据实际网络环境确定随机游走的步数及存储的关键节点数量,随后进行随机游走并实时更新记录的关键节点,综合目的是使本发明能够尽可能地获取真实社交网络中影响信息传播的关键节点。

在随机游走的过程中,仅存储关键节点的ID号及其邻居节点数量,并且每一步仅替换已经存储的节点中邻居节点数量最少的那个节点。本发明通过采用简单、合理有效的随机游走规则,设计了能够获取有效社交网络关键传播节点算法。该算法易于软件实现,在社交网络信息传播、网络舆情传播、网络通信协议效率等方面的研究能够得到广泛应用。

本发明充分考虑了算法的实用性以及效率的优化设计。由于采用了后退机制,整个随机游走过程不会出现死循环或无路可走的情况。算法的应用环境对网络规模没有要求,具有较强的实用性。

本发明充分融入了多种现有随机游走算法的优点,深入考虑了真实社交网络信息传播过程中具有的特点,能够有效获取真实社交网络中的关键节点。此外,本发明还具有结构简单、运行速度快、低复杂度以及较好的可移植性等特点,完全适用于现实生活中的各类社交网络中负面信息传播的防控或正面信息的传播。

以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1