基于深度学习的网络信息传播指标体系构建及量化评估方法及系统

文档序号:29039302发布日期:2022-02-25 20:08阅读:273来源:国知局
基于深度学习的网络信息传播指标体系构建及量化评估方法及系统

1.本发明属于网络信息传播技术领域,具体涉及一种基于深度学习的网络信息传播指标体 系构建及量化评估方法及系统。


背景技术:

2.目前在舆情态势评估方面的研究一方面集中在定性评估上,包括对网络舆情、事件的扩 散范围、聚集效应、网民对事件的倾向性等方面的评估;另一方面集中在定量研究上,主要 使用德尔菲法和层次分析法确定指标权重,最后在指标体系实时量化的计算方面,现有的方 法主要集中在贝叶斯网络、svm等机器学习方法上。
[0003][0004]
但现有的信息传播指标体系的构建,从指标体系设计过程来看,主要集中在某一个特定 领域和方面,缺少整体的把握与全面的分析,不能够彻底、客观、全面地分析某个舆情事件 在传播中的影响程度;从指标体系权重计算过程来看,主要是使用层次分析法或者德尔菲法 来确立指标的权重值,存在一定的主观性与局限性;从指标体系评估过程来看,现有技术主 要是使用加权平均等计算方法,不能客观、准确地给出某一舆情事件在传播过程中的影响程 度。


技术实现要素:

[0005]
本发明的主要目的在于克服现有技术的缺点与不足,提供了一种基于深度学习的网络信 息传播指标体系构建及量化评估方法及系统,本发明从多维度构建多层次多粒度的指标体系, 全面地刻画舆论事件的评估指标,通过卷积神经网络训练评估模型,获取每个指标的权重, 客观准确地对舆论事件态势进行评估。
[0006]
为了达到上述目的,本发明采用以下技术方案:
[0007]
本发明一方面提供了一种基于深度学习的网络信息传播指标体系构建及量化评估方法, 包括以下步骤:
[0008]
获取网络平台的数据组成数据集,利用德尔菲法确定信息传播态势指标体系的三层指标, 并通过主成分分析法,分析不同指标间的相关度,构建多层次多粒度多维度的信息传播态势 评估指标体系;所述三层指标分别为一级指标、二级指标及三级指标,每个一级指标包括多 个二级指标,每个二级指标包括多个三级指标;
[0009]
获取数据集中的事件数据,采用区间赋值法对三级指标中的定性指标进行量化表述,采 用数据归一化对三级指标中的定量指标进行量化处理,得到相应三级指标的指标值;
[0010]
将每个事件的指标拼成二维矩阵作为卷积神经网络的输入进行模型训练,得到宣传态势 评估模型;
[0011]
将待测试数据输入所述宣传态势评估模型,得到预测结果和宣传态势等级。
[0012]
作为优选的技术方案,所述信息传播态势评估指标体系从舆情事件、传播媒介、舆情受 众三个大层次进行分析,涉及演化阶段特征、发帖内容特征、信息维度特征、网络结构特征、 受众情感倾向、用户身份特征、媒体参与度传播热度及地区分布。
[0013]
作为优选的技术方案,所述一级指标包含舆情事件、舆情受众及传播媒介;
[0014]
所述一级指标的舆情事件是从舆情事件本身角度分析,用于对舆情所处传播阶段的判断, 从而分析传播趋势,所述舆情事件包括二级指标演化阶段特征、发帖内容特征、信息维度特 征及网络结构特征;
[0015]
所述一级指标的舆情受众是从参与某一舆情事件的用户角度分析,用于反映受众规模、 结构及心理状况,是舆情传播的重要构成,舆情受众包括二级指标受众情感倾向以及用户身 份特征;
[0016]
所述一级指标的传播媒介是从舆情事件的传播媒介角度分析,是衡量舆情事件传播范围 的重要标准,所述传播媒介包括二级指标媒体参与度、传播热度以及地区分布;
[0017]
二级指标的演化阶段特征包括三级指标传播时间跨度、演化阶段和传播速率;
[0018]
二级指标的发帖内容特征包括三级指标转发比例、图片比例、音频比例、视频比例、话 题比例和“@”他人数量;
[0019]
二级指标的信息维度特征包括三级指标帖子标题长度、博文字符长度、博文向量化特征 和博文平均tf-idf;
[0020]
二级指标的网络特征包括三级指标网络密度、聚集系数和连接强度;
[0021]
二级指标的受众情感倾向包括三级指标正向情感词频、中立情感词频、反向情感词频、 情绪强度分级、正向情感比例、中立情感比例和反向情感比例;
[0022]
二级指标的用户身份特征包括三级指标性别比例、身份认证比例、账号注册时长、用户 年龄分布、受教育水平分布、政治面貌分布、是否有用户名和是否上传头像;
[0023]
二级指标的媒体参与度包括三级指标报道新闻媒体数、新闻报道总数、媒体新闻转发量 和媒体关注人数;
[0024]
二级指标的传播热度包括三级指标帖子数、转发数、评论数、点赞数、参与平台数、覆 盖用户数和帖子原创比例;
[0025]
二级指标的地区分布包括三级指标地区覆盖度、境外帖子比例、域名分布和境内帖子比 例。
[0026]
作为优选的技术方案,所述采用区间赋值法对三级指标中的定性指标进行量化表述,具 体为:
[0027]
对于演化阶段这一定性指标,共有5个取值,分别为:平息阶段、消退阶段、上升阶段、 稳定阶段和形成阶段,使用如下五个取值范围来对演化阶段这一定性指标进行量化赋值:
[0028]
[0,0.2)表示该三级指标处于形成阶段;
[0029]
[0.2,0.4)表示该三级指标处于稳定阶段;
[0030]
[0.4,0.6)表示该三级指标处于上升阶段;
[0031]
[0.6,0.8)表示该三级指标处于消退阶段;
[0032]
[0.8,1]表示该三级指标处于平息阶段;
[0033]
对于传播速率这一定性指标,共有5个取值,分别为:快速、较快、适中、较慢和停
滞, 使用如下五个取值范围来对传播速率这一定性指标进行量化赋值:
[0034]
[0,0.2)表示该三级指标表示停滞;
[0035]
[0.2,0.4)表示该三级指标表示较慢;
[0036]
[0.4,0.6)表示该三级指标表示适中;
[0037]
[0.6,0.8)表示该三级指标表示较快;
[0038]
[0.8,1]表示该三级指标处于表示快速;
[0039]
对于情绪强度分级、地区覆盖度和地区聚集度这些定性指标,共有5个取值,分别为: 高、较高、适中、较低和低,使用如下五个取值范围来对这些定性指标进行量化赋值:
[0040]
[0,0.2)表示该三级指标表示程度低;
[0041]
[0.2,0.4)表示该三级指标表示程度较低;
[0042]
[0.4,0.6)表示该三级指标表示程度适中;
[0043]
[0.6,0.8)表示该三级指标表示程度较高;
[0044]
[0.8,1]表示该三级指标表示程高。
[0045]
作为优选的技术方案,所述数据归一化是指对获取的事件数据进行计算,消除不同格式 数据的运算困难,并通过数据映射,得到一定范围内的新数据,具体计算方法为:
[0046]
极值法,对原始数据的线性变换,使结果值映射到0-1之间,适用于三级指标中最大值 最小值已知的情况,转换函数为:
[0047]

[0048]
其中,x,y分别表示归一化之前的数值和归一化之后的结果值,maxvalue表示该指标 值中的最大值,minvalue表示该指标值中的最小值;
[0049]
统计标准化,给予原始数据的均和标准差进行数据标准化,使经过处理的数据符合标准 正态分布,即均值为0,标准差为1,适用于三级指标中最大值最小值未知的情况,转化函数 为:
[0050][0051]
其中,x,y分别表示归一化之前的数值和归一化之后的结果值,μ表示所有样本的均值, σ表示所有样本的标准差;
[0052]
反余切函数法,利用反余切函数将原数据映射到0-1之间,适用于三级指标中数据最大 值为无穷的情况,转化函数为:
[0053][0054]
其中,x,y分别表示归一化之前的数值和归一化之后的结果值,r为实数集;
[0055]
在指标体系中,三级指标中存在具有向量化特征与情感特征的指标;
[0056]
向量化特征指标使用tf-idf算法,统计正文文本的平均词频-逆文件频率;
[0057]
情感特征指标使用snownlp算法来对文本进行情感分析,计算情感评分,其中小于0.4 为负向情感,大于0.6为正向情感,其他为中立情感,以此获得相应三级指标的指标值。
[0058]
作为优选的技术方案,所述二维矩阵是将49个三级指标按顺序拼成7*7的矩阵。
[0059]
作为优选的技术方案,所述卷积神经网络结构包括:
[0060]
输入层,输入为7*7的二维矩阵;
[0061]
第一卷积层,采用大小为7*7的16通道卷积,卷积核大小为3*3;
[0062]
第一池化层,大小为2*2;
[0063]
第二卷积层,采用大小为7*7的64通道卷积,卷积核大小为3*3;
[0064]
第二池化层,大小为2*2;
[0065]
第三和第四全连接层,长度分别为1024和256;
[0066]
使用softmax作为输出层;
[0067]
所述得到宣传态势评估模型,具体为:
[0068]
卷积神经网络将二维矩阵通过两个卷积层以及池化层进行特征筛选,得到的向量输入构 建的两个全连接层,最终通过softmax函数进行输出,得到预测结果并进行结果评估,若预 测结果不符合期望,则调整偏移值与权重值继续训练,直至得到期望的宣传态势评估模型。
[0069]
作为优选的技术方案,所述卷积神经网络使用relu函数作为各层的激活函数,交叉熵作 为损失函数,并使用预先设立的adam算法来进行反向传播优化;最终训练得到模型,并使 用captum神经网络可解释性算法来输出卷积神经网络输入层的权值;
[0070]
所述relu函数表达式为:
[0071]
f(x)=max(0,x)
[0072]
当输入值x为负数,则输出值为零;输入为正数,则输出值与输入值x不变;
[0073]
所述交叉熵函数表达式为:
[0074][0075]
其中,l代表损失loss,m代表类别的数量,y
ic
代表符号函数,取值为0或1,i为观测 样本,c为真实类别,p
ic
代表观测样本属于类别c的概率。
[0076]
作为优选的技术方案,所述预测结果为宣传态势评估模型输出的整数,取值为(1~5),根 据整数,得到对应的宣传态势等级;
[0077]
所述宣传态势等级包含五个等级;
[0078]
第一等级表示舆情热度低,该舆情事件不会成为热点事件;
[0079]
第二等级表示舆情热度较低,该舆情事件信息传播范围有限,事件本身内容不够敏感, 信息处于衰退期,传播速率不高,且受众对其多表示中立;
[0080]
第三等级表示舆情热度一般,该舆情事件传播速率中等,受众情感强度正常,既不是非 常重要的舆情事件,也没有过高的热度,该舆情事件是否能够转变成焦点事件有待观察;
[0081]
第四等级表示舆情热度较高,该舆情事件信息传播较广,受到大量关注;该事件敏感度 高,是舆情关注者较重点关注的事件类型,事件传播速率较快;且受众情感强度较高、倾向 性较强可能引发舆情事件;
[0082]
第五等级表示舆情热度高,该舆情事件信息传播广,受到广泛关注;该事件敏感度高, 是舆情关注者重点关注的事件类型,事件传播速率快;且受众情感强度高、倾向性强极易引 发舆情事件。
[0083]
本发明另一方面提供了一种基于深度学习的网络信息传播指标体系构建及量化评估系统, 应用于上述的基于深度学习的网络信息传播指标体系构建及量化评估方法,包括数据获取模 块、量化模块、训练模块以及预测模块;
[0084]
所述数据获取模块,用于获取网络平台的数据组成数据集,利用德尔菲法确定信息传播 态势指标体系的三层指标,并通过主成分分析法,分析不同指标间的相关度,构建多层次多 粒度多维度的信息传播态势评估指标体系;所述三层指标分别为一级指标、二级指标及三级 指标,每个一级指标包括多个二级指标,每个二级指标包括多个三级指标;
[0085]
所述量化模块,获取数据集中的事件数据,采用区间赋值法对三级指标中的定性指标进 行量化表述,采用数据归一化对三级指标中的定量指标进行量化处理,得到相应三级指标的 指标值;
[0086]
所述训练模块,用于将每个事件的指标拼成二维矩阵作为卷积神经网络的输入进行模型 训练,得到宣传态势评估模型;
[0087]
所述预测模块,用于输入待测试数据,得到预测结果和宣传态势等级。
[0088]
本发明与现有技术相比,具有如下优点和有益效果:
[0089]
本发明将现有的信息传播指标体系整合起来,从多个维度构建了多层次、多粒度、全面 的信息传播指标体系,能够更加全面地刻画一个舆论事件在信息传播的过程中的评估值,并 且在权重确立的过程中,使用了深度学习的方法,通过卷积神经网络构建相应的指标体系, 来获取每个指标在指标体系中的权重,相比传统的德尔菲法和层次分析法能够更加客观与准 确地进行评估。
附图说明
[0090]
为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附 图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域 普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0091]
图1为本发明实施例基于深度学习的网络信息传播指标体系构建及量化评估方法的流程 图;
[0092]
图2为本发明实施例宣传态势评估模型训练过程图;
[0093]
图3是本发明实施例宣传态势评估模型预测传播态势的准确率图;
[0094]
图4是本发明实施例宣传态势评估模型的损失函数的折线图;
[0095]
图5是本发明实施例基于深度学习的网络信息传播指标体系构建及量化评估系统的结构 示意图。
具体实施方式
[0096]
为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图, 对本技术实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本技术 一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域技术人员在没有做出 创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
[0097]
在本技术中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以
包含 在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实 施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地 理解的是,本技术所描述的实施例可以与其它实施例相结合。
[0098]
如图1所示,本实施例提供了基于深度学习的网络信息传播指标体系构建及量化评估方 法,包括下述步骤:
[0099]
s1、获取网络平台的数据组成数据集,利用德尔菲法确定信息传播态势指标体系的三层 指标,并通过主成分分析法,分析不同指标间的相关度,构建多层次多粒度多维度的信息传 播态势评估指标体系;所述三层指标分别为一级指标、二级指标及三级指标,每个一级指标 包括多个二级指标,每个二级指标包括多个三级指标;
[0100]
s2、获取数据集中的事件数据,采用区间赋值法对三级指标中的定性指标进行量化表述, 采用数据归一化对三级指标中的定量指标进行量化处理,得到相应三级指标的指标值;
[0101]
s3、将每个事件的指标拼成二维矩阵作为卷积神经网络的输入进行模型训练,得到宣传 态势评估模型;
[0102]
s4、输入待测试数据,得到预测结果和宣传态势等级。
[0103]
进一步的,信息传播态势评估指标体系从舆情事件、传播媒介、舆情受众三个大层次进 行分析,涉及演化阶段特征、发帖内容特征、信息维度特征、网络结构特征、受众情感倾向、 用户身份特征、媒体参与度传播热度及地区分布。
[0104]
本实施例从境内外有关社交网络平台获取发帖数据,组成数据集,通过多个角度分析, 针对信息传播态势涉及的因素多样化特征,且每个因素对不同层次、不同粒度的信息传播态 势影响不同,从舆情事件、传播媒介、舆情受众等各个角度深入分析挖掘影响信息传播态势 各种因素属性的特点及其对信息传播态势影响的规律,构建了多层次多粒度多维度的信息传 播态势指标体系。
[0105]
表1为本发明信息传播态势指标体系的三层指标特征表:
[0106]
[0107][0108]
其中一级指标的舆情事件是从舆情事件本身角度分析,包括二级指标舆情事件演化阶段 特征发帖内容特征、信息维度特征以及网络结构特征等方面,是描述舆情事件在传播过程中 状态的一类指标;主要用于对舆情所处传播阶段的判断,从而分析传播趋势。
[0109]
一级指标的舆情受众是从参与某一舆情事件的用户角度分析,包括二级指标受众情感倾 向以及受众身份等特征;受众倾向分析是舆情分析中不可或缺的一部分,倾向分析也从另一 个角度反映出受众的规模、结构及心理状况,是舆情传播的重要构成。
[0110]
一级指标的传播媒介是从舆情事件的传播媒介角度分析,包括二级指标媒体参与度、传 播热度以及地区分布等指标,是衡量舆情事件传播范围的重要标准。
[0111]
二级指标的演化阶段特征包括三级指标传播时间跨度、演化阶段和传播速率;
[0112]
二级指标的发帖内容特征包括三级指标转发比例、图片比例、音频比例、视频比例、话 题比例和“@”他人数量;
[0113]
二级指标的信息维度特征包括三级指标帖子标题长度、博文字符长度、博文向量化特征 和博文平均tf-idf;
[0114]
二级指标的网络特征包括三级指标网络密度、聚集系数和连接强度;
[0115]
二级指标的受众情感倾向包括三级指标正向情感词频、中立情感词频、反向情感词频、 情绪强度分级、正向情感比例、中立情感比例和反向情感比例;
[0116]
二级指标的用户身份特征包括三级指标性别比例、身份认证比例、账号注册时长、用户 年龄分布、受教育水平分布、政治面貌分布、是否有用户名和是否上传头像;
[0117]
二级指标的媒体参与度包括三级指标报道新闻媒体数、新闻报道总数、媒体新闻转发量 和媒体关注人数;
[0118]
二级指标的传播热度包括三级指标帖子数、转发数、评论数、点赞数、参与平台数、覆 盖用户数和帖子原创比例;
[0119]
二级指标的地区分布包括三级指标地区覆盖度、境外帖子比例、域名分布和境内帖子比 例。
[0120]
进一步的,一般来说,原始指标数据根据是否可以被直接简明的公式进行量化处理分为 定性指标和定量指标;
[0121]
对于无法被直接简明的公式进行量化处理的定性指标,采用区间赋值法对三级指标中的 定性指标进行量化表述,具体为:
[0122]
对于演化阶段这一定性指标,共有5个取值,分别为:平息阶段、消退阶段、上升阶段、 稳定阶段和形成阶段,使用如下五个取值范围来对演化阶段这一定性指标进行量化赋值:
[0123]
[0,0.2)表示该三级指标处于形成阶段;
[0124]
[0.2,0.4)表示该三级指标处于稳定阶段;
[0125]
[0.4,0.6)表示该三级指标处于上升阶段;
[0126]
[0.6,0.8)表示该三级指标处于消退阶段;
[0127]
[0.8,1]表示该三级指标处于平息阶段;
[0128]
对于传播速率这一定性指标,共有5个取值,分别为:快速、较快、适中、较慢和停滞, 使用如下五个取值范围来对传播速率这一定性指标进行量化赋值:
[0129]
[0,0.2)表示该三级指标表示停滞;
[0130]
[0.2,0.4)表示该三级指标表示较慢;
[0131]
[0.4,0.6)表示该三级指标表示适中;
[0132]
[0.6,0.8)表示该三级指标表示较快;
[0133]
[0.8,1]表示该三级指标处于表示快速;
[0134]
对于情绪强度分级、地区覆盖度和地区聚集度这些定性指标,共有5个取值,分别为: 高、较高、适中、较低和低,使用如下五个取值范围来对这些定性指标进行量化赋值:
[0135]
[0,0.2)表示该三级指标表示程度低;
[0136]
[0.2,0.4)表示该三级指标表示程度较低;
[0137]
[0.4,0.6)表示该三级指标表示程度适中;
[0138]
[0.6,0.8)表示该三级指标表示程度较高;
[0139]
[0.8,1]表示该三级指标表示程高。
[0140]
对于可被直接简明的公式进行量化处理的定量数据,由于在宣传态势评估中以及宣传态 势指标体系构建时,最初从社交网络平台采集到的原始数据由于采集工具、采集数据格式甚 至于数据规模比例的因素的各不相同而难以被直接使用,故数据归一化势在必行;通过数据 归一化,简化了计算以及消除不同数据格式数据之间带来的运算困难,通过将原始数据进行 数据映射,得到一定范围内的新数据,具体计算方法为:
[0141]
极值法,对原始数据的线性变换,使结果值映射到0-1之间,适用于三级指标中最大值 最小值已知的情况,转换函数为:
[0142]

[0143]
其中,x,y分别表示归一化之前的数值和归一化之后的结果值,maxvalue表示该指标 值中的最大值,minvalue表示该指标值中的最小值;
[0144]
统计标准化,给予原始数据的均和标准差进行数据标准化,使经过处理的数据符合标准 正态分布,即均值为0,标准差为1,适用于三级指标中最大值最小值未知的情况,转化函数 为:
[0145][0146]
其中,x,y分别表示归一化之前的数值和归一化之后的结果值,μ表示所有样本的均值, σ表示所有样本的标准差;
[0147]
反余切函数法,利用反余切函数将原数据映射到0-1之间,适用于三级指标中数据最大 值为无穷的情况,转化函数为:
[0148][0149]
其中,x,y分别表示归一化之前的数值和归一化之后的结果值,r为实数集;
[0150]
在指标体系中,三级指标中存在具有向量化特征与情感特征的指标;
[0151]
向量化特征指标使用tf-idf算法,统计正文文本的平均词频-逆文件频率;
[0152]
情感特征指标使用snownlp算法来对文本进行情感分析,计算情感评分,其中小于0.4 为负向情感,大于0.6为正向情感,其他为中立情感,以此获得相应三级指标的指标值。
[0153]
进一步的,将原数据计算以及归一化之后,将每一事件的49个三级指标按顺序拼成7*7 的二维矩阵;
[0154]
如图2所示,将拼接的二维矩阵作为卷积神经网络的输入,具体为:
[0155]
卷积神经网络将二维矩阵通过两个卷积层以及池化层进行特征筛选,得到的向量输入构 建的两个全连接层,最终通过softmax函数进行输出,得到预测结果并进行结果评估,若预 测结果不符合期望,则调整偏移值与权重值继续训练,直至得到期望的宣传态势评估模型。
[0156]
如图3和图4所示,卷积神经网络通过卷积和池化操作可以对特征进行多层次多粒度的 提取,并最终学习到真正能够判别宣传态势的宣传态势特征,针对不同层次、不同粒
度的宣 传态势评估需求,测试不同深度的卷积神经网络和以及不同组合的数据输入方式对算法性能 的影响,测试卷积神经网络对宣传态势量化评估的效果,经过试验和测试,我们得到实验效 果较为优秀的网络结构。
[0157]
如下表2所示,卷积神经网络结构包括:
[0158]
输入层,输入为7*7的二维矩阵;
[0159]
第一卷积层,采用大小为7*7的16通道卷积,卷积核大小为3*3;
[0160]
第一池化层,大小为2*2;
[0161]
第二卷积层,采用大小为7*7的64通道卷积,卷积核大小为3*3;
[0162]
第二池化层,大小为2*2;
[0163]
第三和第四全连接层,长度分别为1024和256;
[0164]
使用softmax作为输出层。
[0165][0166][0167]
在本实施例中,卷积神经网络使用relu函数作为各层的激活函数,交叉熵作为损失函数, 并使用adam算法来进行反向传播优化;最终训练得到模型,并使用captum神经网络可解释 性算法来输出卷积神经网络输入层的权值;
[0168]
其中,relu函数:
[0169]
f(x)=max(0,x)
[0170]
当输入值x为负数,则输出值为零;输入为正数,则输出值与输入值x不变。
[0171]
交叉熵函数:
[0172][0173]
其中,l代表损失loss,m代表类别的数量,y
ic
代表符号函数(0或1),i为观测样本,c为 真实类别,p
ic
代表观测样本属于类别c的概率。
[0174]
进一步的,将待测试数据输入训练好的宣传态势评估模型中进行评估,输出预测结果, 及宣传态势评估模型输出的整数,取值为(1~5);根据取值得到某事件的宣传态势等级,
[0175]
本实施例的宣传态势等级包含五个等级,分别为:
[0176]
第一等级表示舆情热度低,该舆情事件不会成为热点事件;
[0177]
第二等级表示舆情热度较低,该舆情事件信息传播范围有限,事件本身内容不够敏感, 信息可能处于衰退期,传播速率不高,且受众对其多表示中立;
[0178]
第三等级表示舆情热度一般,该舆情事件传播速率中等,受众情感强度正常,既不是非 常重要的舆情事件,也没有过高的热度,该舆情事件是否能够转变成焦点事件有待观察;
[0179]
第四等级表示舆情热度较高,该舆情事件信息传播较广,受到大量关注;该事件敏感度 高,是舆情关注者较重点关注的事件类型,事件传播速率较快;且受众情感强度较高、倾向 性较强可能引发舆情事件;
[0180]
第五等级表示舆情热度高,该舆情事件信息传播广,受到广泛关注;该事件敏感度高, 是舆情关注者重点关注的事件类型,事件传播速率快;且受众情感强度高、倾向性强极易引 发舆情事件。
[0181]
需要说明的是,对于前述的各方法实施例,为了简便描述,将其都表述为一系列的动作 组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本 发明,某些步骤可以采用其它顺序或者同时进行。
[0182]
基于与上述实施例中的基于深度学习的网络信息传播指标体系构建及量化评估方法相同 的思想,本发明还提供了基于深度学习的网络信息传播指标体系构建及量化评估系统,该系 统可用于执行上述基于深度学习的网络信息传播指标体系构建及量化评估方法。为了便于说 明,基于深度学习的网络信息传播指标体系构建及量化评估系统实施例的结构示意图中,仅 仅示出了与本发明实施例相关的部分,本领域技术人员可以理解,图示结构并不构成对装置 的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[0183]
如图5所示,在本技术的另一个实施例中,提供了一种基于深度学习的网络信息传播指 标体系构建及量化评估系统100,应用于所述的基于深度学习的网络信息传播指标体系构建 及量化评估方法,包括数据获取模块101、量化模块102、训练模块103以及预测模块104;
[0184]
所述数据获取模块101,用于获取网络平台的数据组成数据集,利用德尔菲法确定信息 传播态势指标体系的三层指标,并通过主成分分析法,分析不同指标间的相关度,构建多层 次多粒度多维度的信息传播态势评估指标体系;所述三层指标分别为一级指标、二级指标及 三级指标,每个一级指标包括多个二级指标,每个二级指标包括多个三级指标;
[0185]
所述量化模块102,获取数据集中的事件数据,采用区间赋值法对三级指标中的定性指 标进行量化表述,采用数据归一化对三级指标中的定量指标进行量化处理,得到相应三级指 标的指标值;
[0186]
所述训练模块103,用于将每个事件的指标拼成二维矩阵作为卷积神经网络的输入进行 模型训练,得到宣传态势评估模型;
[0187]
所述预测模块104,用于输入待测试数据,得到预测结果和宣传态势等级。
[0188]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计 算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质 中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提
供的各实施 例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失 性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程 rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储 器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态 ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、 增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直 接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态 ram(rdram)等。
[0189]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各 个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应 当认为是本说明书记载的范围。
[0190]
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制, 其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应 为等效的置换方式,都包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1