基于智慧社区大数据知识图谱的不良舆论传播抑制方法

文档序号:25280654发布日期:2021-06-01 17:27阅读:162来源:国知局
基于智慧社区大数据知识图谱的不良舆论传播抑制方法

【技术领域】

本发明属于知识图谱技术领域,特别是涉及一种基于智慧社区大数据知识图谱的不良舆论传播抑制方法。



背景技术:

社区中的社会关系可以用复杂网络来表示,社区结构作为复杂网络的一个重要性质,在复杂网络行为预测与结构挖掘中得到了越来越多的应用。随着近年来信息网络的快速发展,信息传播是近年来复杂网络的研究热点。如何理解并利用信息传播意义重大且有很大的实用价值。如对影响力大的节点进行广告投放可以获得最大的价值。然而网络舆论的传播往往对我们的生活和健康造成重大损失,因此如何研究不良舆论传播抑制的模型并加以控制是非常必要的。

在近些年的研究中,信息传播被学者建模为疾病传播模型,将言论的传播基于仿生学的传播控制方法实现对不良言论传播的控制。对于免疫策略来看,免疫一个节点需要付出一定的代价,因此如何通过免疫最少量的节点取得最大的抑制效果是免疫的研究要点,从不良舆论传播上来看,如何通过最小化影响民众的言论自由来实现对不良言论的传播检测与控制。之前的研究中学者们提出了大量的免疫策略,而目标免疫是免疫中常用的一种策略,根据网络不同的结构特性选择免疫节点但是随着传播阈值函数的提出,传播抑制问题被建模为优化问题,通过优化阈值可以找到最优的免疫节点,传统的免疫策略不再适用于优化模型。

因此,有必要提供一种新的基于智慧社区大数据知识图谱的不良舆论传播抑制方法来解决上述问题。



技术实现要素:

本发明的主要目的在于提供一种基于智慧社区大数据知识图谱的不良舆论传播抑制方法,通过基于智慧社区的大数据知识图谱和人工智能的不良舆论抑制算法,可以实现低成本、小影响、高效率的不良舆论抑制,提升管理者的管理效果、减少管理负担。

本发明通过如下技术方案实现上述目的:一种基于智慧社区大数据知识图谱的不良舆论传播抑制方法,其包括以下步骤:

s1)构建基于智慧社区不良舆论传播抑制模型的知识图谱,基于此模型构建不良舆论传播抑制模型的社区网络;

s2)对于构建的社区网络,采用社团检测算法将社区网络划分为多个社团,采用经典的bgll算法,通过定义模块度函数,将社团检测问题转变为一个优化的问题;

s3)根据社团结构的性质,选择对应节点得到一个候选免疫节点集;

s4)基于步骤s3)得到的候选免疫节点集,结合网络社团的性质,利用改进memetic算法优化传播阈值函数从候选免疫节点集中选择最终的免疫节点,高效的抑制智慧社区中不良舆论的传播。

进一步的,所述步骤s1)中,构建基于智慧社区不良舆论传播抑制模型的知识图谱,包括从原始的社区数据出发,通过知识抽取和知识表示从原始数据和第三方数据库中抽取出来社区知识,然后将提取的所述社区知识存入知识库的数据层和模式层中,通过知识融合包括实体链接和知识合并,解决已有的社区知识存在冗余、缺乏逻辑性的问题;对社区知识形成的知识图谱中由于数据源或不同构建方法产生的冲突,根据数据源可靠性或机器学习方法进行冲突解决,形成所述智慧社区大数据知识图谱。

进一步的,所述步骤s2)中采用社团检测算法将社区网络划分为多个社团,具体包括:

s21)采用社团检测算法将复杂社会网络划分为不同的子网络,在构建了智慧社区大数据知识图谱后,建立社区知识图谱的模块度函数,其定义如下:

其中,a是网络的邻接矩阵,m是网络中的边数,ki是节点i的度即发生在节点i上所有边的权重之和,当节点i和节点j在同一个社团时,δ(i,j)=1,否则δ(i,j)=0;

s22)采用基于模块度优化的bgll算法,自底向上的不断聚合,将社区网络中的每个节点划分为一个子社区,对于网络中的每个节点i,考虑所有的邻居节点j,把节点i从它所在的社区移动到其邻居j所在的社区,模块度增量变化,把节点i移动到使得模块度增量最大的节点j所在的社区,每一次节点移动一个孤立节点到其邻居所在的社团模块度增益为δq:

其中∑in是社区网络内部中所有边的权重之和,∑tot是社区网络中所有节点相关的边的权重之和,ki为节点度即发生在节点i上所有边的权重之和,ki,in是节点i到社区网络中所有节点的边的权重和,m是网络中所有的边的权重之和;

s23)将步骤s22)中所划分出来的社团看作一个节点,从而得到一个新的网络,新节点之间的边的权重为两个新节点之间原本的权重之和,处在同一社区中的节点之间的边导致新网络中该新节点有自环的边;然后对于构建的新网络使用s22)中的方法进行迭代,当网络不再改变即出现了最大模块度的时候停止迭代,得到多个社团划分。

进一步的,所述步骤s3)中,根据社团结构的性质,选择合适的节点得到一个候选免疫节点集;具体包括:

s31)计算社团每个节点的节点度,其计算公式如下:

其中入度出度当节点i和节点j之间存在一条边时aij=1,反之aij=0;

s32)取每个社团中靠前设定数量的内度最大的节点作为枢纽节点,外度大于1的所有节点作为桥节点,该桥节点即为候选种子节点。

与现有技术相比,本发明一种基于智慧社区大数据知识图谱的不良舆论传播抑制方法的有益效果在于:通过基于智慧社区的大数据知识图谱和人工智能的不良舆论抑制算法,可以实现低成本、小影响、高效率的不良舆论抑制,提升管理者的管理效果、减少管理负担。具体的,

1)将大数据图谱应用于社区不良舆论及疾病传播上;

2)提出疾病传播的抑制模型,通过免疫社区复杂网络中的关键节点进行节点免疫来抑制复杂网络的快速传播机制;

3)基于模块度函数来优化社区社团网络,经典的bgll算法就是基于模块度优化中的聚合类算法,自底向上的不断聚合,通过模块度q的增量变化对社团网络进行检测,有效的解决复杂网络下社团结构的检测问题以及候选集的查找问题;

4)在候选集的产生中,通过复杂网络的节点度来快速锁定候选集种子节点,通过对枢纽节点和桥节点的免疫,可以更高效的抑制传播;

5)采用memetic算法来防止算法陷入局部最优,减小计算的复杂度。

【附图说明】

图1为本发明实施例中的主要方法框架图;

图2为本发明实施例中不良舆论传播抑制模型的知识图谱;

图3为本发明实施例中候选免疫节点的示意图;

图4为本发明实施例中基于memetic算法中交叉操作示意图;

图5为本发明实施例中基于memetic算法中变异操作示意图。

【具体实施方式】

实施例:

请参照图1-图5,本实施例为基于智慧社区大数据知识图谱的不良舆论传播抑制方法,其包括以下步骤:

s1)第一步,构建基于智慧社区不良舆论传播抑制模型的知识图谱,基于此模型构建不良舆论传播抑制模型的社区网络;

s2)第二步,对于构建的社区网络,采用社团检测算法将社区网络划分为多个社团,主要使用了经典的bgll算法,通过定义模块度函数,将社团检测变为一个优化的问题;

s3)第三步,仅仅基于社团结构仍然不能得到免疫的节点,根据社团结构的性质,选择合适的节点得到一个候选免疫节点集;

s4)第四步,基于第三步得到的候选免疫节点集,结合网络社团的性质,利用改进memetic算法优化传播阈值函数从候选免疫节点集中选择最终的免疫节点,高效的抑制智慧社区中不良舆论的传播。

所述步骤s1)中,构建基于智慧社区不良舆论传播抑制模型的知识图谱,包括从原始的社区数据出发,通过知识抽取和知识表示从原始数据和第三方数据库中抽取出来社区知识,然后将提取的所述社区知识存入知识库的数据层和模式层中,通过知识融合包括实体链接和知识合并,解决已有的社区知识存在冗余、缺乏逻辑性的问题,提高社区知识质量;对社区知识形成的知识图谱中由于数据源或不同构建方法产生的冲突,根据数据源可靠性或机器学习方法进行冲突解决,形成所述智慧社区大数据知识图谱。

所述智慧社区大数据知识图谱的构建过程包含:知识抽取、知识表示、知识融合、知识推理四个过程,每次更新的一个周期都包括这四个阶段。知识图谱的构建采用自底向上的方式,先从一些开放链接的数据中提取出实体,然后选择其中可信度较高的知识加入到知识库中,再构建顶层的本体模式。

所述原始数据来源包括社区微信群聊信息、社区居民的聊天信息。抽取出来的社区知识包括社区人员的生活行为特征,所述行为特征包括工作情况、社交关系、微信群聊信息、社区热点话题的发布等。

所述步骤s2)中采用社团检测算法将社区网络划分为多个社团,具体包括:

s21)社团检测将复杂社会网络划分为不同的子网络,在构建了智慧社区大数据知识图谱后,鉴于社区中存在众多的人员特征和人员个体,针对不同节点其紧密度高的群体难以获得,建立社区知识图谱的模块度函数,定义如下:

其中,a是网络的邻接矩阵,m是网络中的边数,ki是节点i的度即发生在节点i上所有边的权重之和,当节点i和节点j在同一个社团时,δ(i,j)=1,否则δ(i,j)=0。这样社团检测就变成了一种基于模块度优化的社团检测算法;

s22)采用基于模块度优化的bgll算法,自底向上的不断聚合,将社区网络中的每个节点划分为一个子社区,对于网络中的每个节点i,考虑所有的邻居节点j,把节点i从它所在的社区移动到其邻居j所在的社区,模块度增量变化,我们把节点i移动到使得模块度增量最大的节点j所在的社区,每一次节点移动一个孤立节点到其邻居所在的社团模块度增益为δq:

其中∑in是社区网络内部中所有边的权重之和,∑tot是社区网络中所有节点相关的边的权重之和,ki为节点度即发生在节点i上所有边的权重之和,ki,in是节点i到社区网络中所有节点的边的权重和,m是网络中所有的边的权重之和;

s23)将步骤s22)中所划分出来的社团看作一个节点,从而得到一个新的网络。新节点之间的边的权重为两个新节点之间(即两个社区之间)原本的权重之和,处在同一社区中的节点之间的边导致新网络中该新节点有自环的边。然后对于构建的新网络使用s22)中的方法进行迭代,当网络不再改变即出现了最大模块度的时候停止迭代,得到多个社团划分。

所述的bgll算法相比于其他社团检测算法有很多的优势:首先,bgll算法的社团检测效果非常好。第二,bgll算法的时间复杂度非常低,因此bgll可对大规模网络进行社团检测。第三,bgll算法不需要提前给定社团个数,更具普适性。

所述步骤s3)中,根据社团结构的性质,选择合适的节点得到一个候选免疫节点集;具体包括:

s31)计算社团每个节点的节点度,其计算公式如下:

其中入度出度当节点i和节点j之间存在一条边时aij=1,反之aij=0。

当社团检测结束后,并不能得到免疫的节点,社团检测不适用于优化传染阈值,而候选集的产生是为了利用社团的性质寻找候选种子,最大程度减少算法搜索空间,基于社团的免疫策略,在社团结构明显的网络中,枢纽节点和桥节点在不良舆论及疾病的传播过程中影响颇深,本技术以社团节点中的节点度选择候选种子节点,对于一个有向的社区网络来说,节点度ki由入度和出度构成;

s32)取每个社团中前20%的内度(即每个社团内部的节点之间的节点度)最大的节点作为枢纽节点,外度(即社团与社团之间的节点之间的节点度)大于1的所有节点作为桥节点,该桥节点即为候选种子节点。如图3所示,节点2为枢纽节点,节点12为桥节点,即为候选种子节点。在不良舆论及疾病的传播中枢纽节点会快速传播给社团内其他节点,桥节点会使得传播在不同社团之间传播。

所述步骤s4)中,当有了候选集后,由于贪婪算法的时间复杂度很大,选择最终免疫节点依然困难,为了减少计算复杂度,本技术基于memetic算法从候选免疫节点集中选择最终的免疫节点,该memetic算法的框架如下:

具体步骤包括:

s41)解的表示和初始化:在memetic算法中,每个染色体表示一组需要免疫的节点,每个染色体编码为一个整数字符串:

x={x1,x2,l,xr}(4)

其中r是免疫节点的数量,xi是候选集中第i个需要被免疫的节点,在每个染色体中,每个节点只能出现一次,对于每个染色体,都能用随机初始化;

s42)基因操作:在memetic算法中,基因操作是为了阻止算法陷入局部最优,交叉和变异操作根据网络和社区的结构知识重新设计交叉操作。

本技术采用了随机交叉的操作,给定两个染色体xa和xb,两个染色体共同的元素保持不变。对于每一个染色体中独有的元素,首先产生一个随机数,如果随机数大于0.5,则相应的元素进行交换,否则保持不变。图4给出了交叉操作的过程,在该图中需要免疫6个节点,两个父代染色体有3个共同的节点,这些节点保持不变,父代染色体1中节点16、5、15。父代染色体2中的节点6、10、4需要进行交叉操作,假设该三对染色体的随机数分别为0.7、0.6以及0.3,节点16和6将会交换,节点5和10同样需要交换,节点4和15保持不变。这种交叉操作新产生的子代种群可以继承父代染色体中的大部分元素;

本技术采用了单点变异的操作,对染色体中xa中的每一个节点,首先产生一个随机数。如果随机数大于变异概率pm,选择的节点vi将会被vj替代,其中vj不属于染色体xa,并且vj和vi在不同的社团中。图5给出了变异操作的过程。在该图中,网络有三个社区,节点1和2属于社区1,节点3、4和5属于社区2,节点6、7、8、9和10属于社区3.假设节点10进行变异操作,从社区1和2中随机选取一个节点替代节点10;

s43)在交叉变异中,父代通过交换部分染色体得到子代染色体,染色体中并没有新的节点,变异操作倾向于搜索其他社区的节点,因此本技术采用了一种基于邻域的局部搜索算法,假设节点i在社团c中,节点i的邻域定义为社团c中除了节点i的所有节点,在局部搜索中,节点i被节点i邻域中的某个节点替代,该操作可以得到最优解,仅仅对种群中目标函数最优的染色体进行局部搜索操作,在此提出的局部搜索着重在于社团内搜索最优解,下述算法给出了局部搜索的过程:

s44)通过matlab仿真软件对不良舆论传播抑制模型的有效性进行验证,通过基于memetic的基因遗传算法获得最终的免疫节点,免疫目标节点完成基于智慧社区大数据知识图谱的不良舆论传播抑制。

本发明一种基于智慧社区大数据知识图谱的不良舆论传播抑制方法,通过基于智慧社区的大数据知识图谱和人工智能的不良舆论抑制算法,可以实现低成本、小影响、高效率的不良舆论抑制,提升管理者的管理效果、减少管理负担。具体的,

1)将大数据图谱应用于社区不良舆论及疾病传播上;

2)提出疾病传播的抑制模型,通过免疫社区复杂网络中的关键节点进行节点免疫来抑制复杂网络的快速传播机制;

3)基于模块度函数来优化社区社团网络,经典的bgll算法就是基于模块度优化中的聚合类算法,自底向上的不断聚合,通过模块度q的增量变化对社团网络进行检测;

4)在候选集的产生中,通过复杂网络的节点度来快速锁定候选集种子节点,通过对枢纽节点和桥节点的免疫,可以更高效的抑制传播;

5)采用memetic算法来防止算法陷入局部最优。

以上所述的仅是本发明的一些实施方式。对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1