基于深度学习的社交网络影响力最大化传播效果评估方法

文档序号:37309476发布日期:2024-03-13 20:57阅读:38来源:国知局
基于深度学习的社交网络影响力最大化传播效果评估方法

本发明属于深度学习和社交网络影响力最大化的,具体涉及一种基于深度学习的社交网络影响力最大化传播效果评估方法。


背景技术:

1、社交网络影响力最大化是一个热门的研究话题,它涉及到如何在一个社交网络中选择一些初始的节点,使得其能够通过某种传播机制影响尽可能多的其他节点;这个问题在市场营销、舆情分析、信息传播等领域有着重要的应用价值。

2、众所周知,社交网络的拓扑结构、用户交互行为及用户内容构成了社会网络的三个要素。为此,从拓扑结构、行为特征及内容特征这三个维度来度量影响力具有不同的研究角度和典型方法。其中,基于拓扑结构特征度量的方法有邻居节点分析、随机游走分析、节点位置分析及社团结构分析等;基于内容特征度量的方法有话题分析、新颖度分析、敏感度分析、文本倾向性分析及文本相似性分析等;基于行为特征度量的方法有用户活跃度分析、时序自相似分析、交互强度分析及传播范围分析等。

3、基于拓扑结构特征的影响力度量方法虽然从整个社会网络宏观层面取得了很好的效果,且度量指标简单易算,在大规模网络上拥有较大的优势,但是社交网络拓扑结构只能从宏观层面表示整个社交网络,并不能刻画微观层面上节点对其他节点产生的影响力的形成以及演化规律,忽略了节点本身的行为和节点对其他节点多种形式的交互行为。基于行为特征和内容特征的影响力度量方法认为虽然用户的影响力看不见摸不着,但是用户通过自身影响力使社交网络中其他用户产生的变化却是可以观测到的,这种变化或表现为内容上的相似性和行为上的一致性,或表现为观念态度的转变,因此基于用户内容特征和行为特征的影响力度量方法相比于基于拓扑结构特征的影响力度量方法能够更好地刻画用户与用户之间影响力的形成和发展状况。

4、由于影响力没有一致的定义和度量方法,造成迄今为止社交网络影响力最大化研究并没有公认统一的评价指标。有关影响力最大化研究模型和指标虽然数量众多,但都是从各自研究角度建立指标去分析论证影响力最大化算法的传播效果,这是十分片面狭隘的。社交网络影响力最大化传播效果评估标准缺失一直是社交网络影响力最大化研究的一大痛点,本发明正是基于该痛点出发,采用深度学习技术建立起了指标覆盖全面的社交网络影响力最大化传播效果评估体系,开创性的填补这一评估标准的空缺。


技术实现思路

1、本发明的主要目的在于克服现有技术的缺点与不足,提供一种基于深度学习的社交网络影响力最大化传播效果评估方法,可实时精准的完成对社交网络影响力最大化传播效果的评估,为舆情管理应对提供决策参考。

2、为了达到上述目的,本发明一方面提供一种基于深度学习的社交网络影响力最大化传播效果评估方法,包括下述步骤:

3、基于网络拓扑、用户行为及传播途径构建社交网络信息传播效果的评估指标体系,包括一级指标、二级指标和三级指标;

4、采集国内外社交网络平台不同事件数据并依据三级指标进行标注,作为样本数据集;

5、对样本数据集进行数据清洗并使用smote方法进行数据增强,得到指标体系数据集并按比例随机划分为训练集和测试集;

6、使用赋权法对指标体系数据集进行特征选择及计算,获取三级指标特征值构成特征向量;

7、构建评估模型,将特征向量输入评估模型中,评估模型首先对特征向量进行归一化处理,然后输入残差神经网络中进行训练和学习,得到三级指标得分;

8、使用加权平均法对各级指标得分依次进行聚合计算,得到某事件在某时间节点下信息传播效果的预测得分;

9、通过实时统计并计算该时间节点下各个三级指标的数据信息,得到各个三级指标的分数,随后通过依次聚合计算得到某事件在某时间节点下信息传播效果的实际得分;将实际得分与预测得分进行作差,得到的差值作为对社交网络影响力最大化传播效果的评估结果。

10、作为优选的技术方案,所述网络拓扑、用户行为及传播途径均为一级指标;

11、所述网络拓扑包含两个二级指标,分别为演化阶段特征和网络结构特征;

12、所述用户行为包含三个二级指标,分别为传播热度特征、受众情感倾向特征和交互内容倾向特征;

13、所述传播途径包含两个二级指标,分别为媒体参与度特征和关键节点特征;

14、所述演化阶段特征包含三个三级指标,分别为传播时间跨度、演化阶段和传播速率;

15、所述网络结构特征包含三个三级指标,分别为网络密度、聚集系数和连接强度;

16、所述传播热度特征包含七个三级指标,分别为帖子数、转发数、评论数、点赞数、帖子原创比例、参与平台数和覆盖用户数;

17、所述受众情感倾向特征包含七个三级指标,分别为正向情感词频、反向情感词频、中立情感词频、情绪强度分析、正向情感受众比例、反向情感受众比例和中立情感受众比例;

18、所述交互内容倾向特征包含七个三级指标,分别为转发比例、包含图片比例、包含音频比例、包含视频比例、包含话题比例、提及他人数量和帖子内容tf-idf;

19、所述媒体参与度特征包含五个三级指标,分别为参与话题媒体数、媒体发文数、新闻媒体关注量、新闻点赞量和新闻转发量;

20、所述关键节点特征包含四个三级特征,分别为接近中心性、度中心性、中介中心性和特征向量中心性。

21、作为优选的技术方案,所述赋权法包括主观赋权法、客观赋权法及直接计算法;

22、采用主观赋权法对三级指标中的传播时间跨度、演化阶段及传播速率进行赋权,得到的权值作为三级指标特征值;

23、根据指标体系数据集,使用客观赋权法直接对三级指标中的帖子数、转发数、评论数、点赞数、帖子原创比例、参与平台数、覆盖用户数、转发比例、包含图片比例、包含音频比例、包含视频比例、包含话题比例、提及他人数量、参与话题媒体数、媒体发文总数、新闻媒体关注量、新闻点赞量和新闻转发量进行统计确定各自权值作为三级指标特征值;

24、对于三级指标中的网络密度、聚集系数、连接强度、正向情感词频、反向情感词频、中立情感词频、情绪强度分析、正向情感受众比例、反向情感受众比例、中立情感受众比例、帖子内容tf-idf、接近中心性、度中心性、中介中心性和特征向量中心性均根据指标体系数据集中相应的数据使用直接计算法确定各自权值作为三级指标特征值;

25、对于缺失的指标值或因网络结构特点不同导致价值忽略不计的三级指标,将其指标的权值置为0作为三级指标特征值;

26、最终依据三级指标特征值构成某事件的特征向量;所述向量为n维的向量表示;n为向量的列数,即三级指标的数量。

27、作为优选的技术方案,所述评估模型包括归一化层、残差神经网络和全连接输出层;

28、所述归一化层用于对特征向量采用离差标准化进行归一化处理,得到归一化后的特征向量;

29、所述残差神经网络包括输入层、多个残差块及多个注意力机制;

30、所述残差块包含依次连接的两个或三个卷积层、一个shortcut connection及relu函数激活层;

31、每个残差块后连接一注意力机制,再与下一个残差块进行连接;

32、最后一个残差块与注意力机制连接后,与全连接输出层进行连接;

33、所述全连接输出层采用softmax激活函数进行输出。

34、作为优选的技术方案,所述归一化处理的公式为:

35、

36、其中,x为特征向量中某一样本当前值,y为该样本归一化后的值,min(x)为特征向量中样本最小值,max(x)为特征向量中样本最大值。

37、作为优选的技术方案,所述输入残差神经网络中进行训练和学习,得到三级指标得分,具体为:

38、将归一化处理后的特征向量输入到残差神经网络中,经过输入层获取特征图;

39、残差块中的shortcut connection将特征图复制并加到卷积层的输出上,或通过一个1x1卷积层来改变特征图的维度和通道数,以匹配卷积层的输出,shortcutconnection的输出表示为:y=f(x)+x,其中f(x)是卷积层输出,x为特征图;再经过残差块中的relu函数激活层,得到一个非线性变换后的特征图,同时残差块后的注意力机制,对非线性变换后的特征图生成一个掩码,与非线性变换后的特征图相乘相加后,得到注意力特征图作为下一残差块的输入特征图;所述注意力特征图表示为:z=m(n)*n+n,其中n为非线性变换后的特征图,m(n)为生成的掩码;

40、经过多个残差块及注意力机制后,在最后一个残差块及注意力机制后连接一个全连接输出层将其输出的注意力特征图展平为一维向量,并通过softmax激活函数得到最后的输出向量。

41、作为优选的技术方案,所述残差神经网络采用均方误差损失函数,计算损失函数后运用梯度下降算法反向传播更新网络参数,使残差神经网络训练参数的改变总是朝着网络实际输出与期望输出间均方差变小的方向,最终达到最小误差时停止训练,获取此时残差神经网络中各神经元节点的权重即为各三级指标的权重系数,用来预测计算各三级指标得分。

42、作为优选的技术方案,所述使用加权平均法对各级指标得分依次进行聚合计算,得到某事件在某时间节点下信息传播效果的预测得分,具体为:

43、获得各三级指标得分后,将二级指标下的三级指标得分进行加权平均,向上聚合计算得到各二级指标得分;

44、接着将一级指标下的二级指标得分进行加权平均,向上聚合计算得到各一级指标得分;

45、最后再将一级指标得分进行加权平均,向上聚合计算得到某事件在某时间节点下信息传播效果的预测得分。

46、另一发面,提供一种基于深度学习的社交网络影响力最大化传播效果评估系统,包括指标构建模块、数据获取模块、数据处理模块、特征提取模块、模型学习模块、得分计算模块及差值评估模块;

47、所述指标构建模块用于基于网络拓扑、用户行为及传播途径构建社交网络信息传播效果的评估指标体系,包括一级指标、二级指标和三级指标;

48、所述数据获取模块用于采集国内外社交网络平台不同事件数据并依据三级指标进行标注,作为样本数据集;

49、所述数据处理模块用于对样本数据集进行数据清洗并使用smote方法进行数据增强,得到指标体系数据集并按比例随机划分为训练集和测试集;

50、所述特征提取模块用于使用赋权法对指标体系数据集进行特征选择及计算,获取三级指标特征值构成特征向量;

51、所述模型学习模块用于构建评估模型,将特征向量输入评估模型中,评估模型首先对特征向量进行归一化处理,然后输入残差神经网络中进行训练和学习,得到三级指标得分;

52、所述得分计算模块用于使用加权平均法对各级指标得分依次进行聚合计算,得到某事件在某时间节点下信息传播效果的预测得分;

53、所述差值评估模块用于通过实时统计并计算该时间节点下各个三级指标的数据信息,得到各个三级指标的分数,随后通过依次聚合计算得到某事件在某时间节点下信息传播效果的实际得分;将实际得分与预测得分进行作差,得到的差值作为对社交网络影响力最大化传播效果的评估结果。

54、还一方面,提供一种计算机可读存储介质,存储有程序,其特征在于,所述程序被处理器执行时,实现上述的基于深度学习的社交网络影响力最大化传播效果评估方法。

55、本发明与现有技术相比,具有如下优点和有益效果:

56、1.本发明构建的社交网络影响力最大化传播效果评估指标在评估和决策中起着重要的作用,而指标的选择是构建有效指标体系的关键环节之一,而多层次、多维度指标体系中的评估指标选择更加复杂,因为涉及到多个指标之间的相互影响和权衡,因此如何选择合适的指标,是实现科学、合理、有效的评价和决策的前提和基础。同时,由于迄今为止社交网络影响力最大化研究并没有公认统一的评价指标,都是从各自研究角度建立指标去分析论证影响力最大化算法的传播效果,这是十分片面狭隘的。正因如此,本发明从网络拓扑、用户行为及传播途径三个角度出发,将其作为一级指标,通过层级化构建二级指标和三级指标,建立指标全面、覆盖面广、指标代表性强的社交网络信息传播效果评估指标,将通过评估模型的预测结果与实时统计计算的真实结果进行作差,将差值视为社交网络影响力最大化的传播效果,开创性地填补评估标准的空缺,客观、实时、准确地度量影响力最大化传播后的效果。

57、2.本发明结合深度学习技术,通过训练残差神经网络来学习社交网络信息传播度量的主要指标,实现社交网络信息传播的准确度量。残差神经网络是一种在cnn基础上增加了残差连接的网络结构,可以有效地解决深度网络中的梯度消失问题;同时在残差块中添加注意力机制(attention mechanism)可以提高网络的性能和效率,其基本思想是让网络能够自动地关注输入或输出中最重要或最相关的部分,以获取更多所需要关注目标的细节信息,而抑制其他无用信息,从而提高网络性能。

58、3.本发明通过残差神经网络获取到三级指标得分后,采用加权平均法对低级指标进行聚合计算来获得最终评估得分,不仅能够全面考虑影响因素,还可以提高结果的准确性和代表性,确保影响力最大化传播效果的评估可靠性。

59、4.本发明通过对某社交网络事件在某时刻的信息传播影响力的预测度量以及实时统计计算,可实时精准的完成对社交网络影响力最大化传播效果的评估。针对现实社交网络平台舆情事件,其具有传播多线杂面广,传播数据量庞大,互动性、即时性、自主性强等特点,而本发明可以很好的满足实时性要求,通过评估模型精确衡量对于某舆情引导策略的效果,为舆情管理应对提供决策参考,及时阻止舆情事件发酵。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1