基于深度学习的网络信息传播指标体系构建及量化评估方法及系统

文档序号:29039302发布日期:2022-02-25 20:08阅读:来源:国知局

技术特征:
1.基于深度学习的网络信息传播指标体系构建及量化评估方法,其特征在于,包括下述步骤:获取网络平台的数据组成数据集,利用德尔菲法确定信息传播态势指标体系的三层指标,并通过主成分分析法,分析不同指标间的相关度,构建多层次多粒度多维度的信息传播态势评估指标体系;所述三层指标分别为一级指标、二级指标及三级指标,每个一级指标包括多个二级指标,每个二级指标包括多个三级指标;获取数据集中的事件数据,采用区间赋值法对三级指标中的定性指标进行量化表述,采用数据归一化对三级指标中的定量指标进行量化处理,得到相应三级指标的指标值;将每个事件的指标拼成二维矩阵作为卷积神经网络的输入进行模型训练,得到宣传态势评估模型;将待测试数据输入所述宣传态势评估模型,得到预测结果和宣传态势等级。2.根据权利要求1所述的基于深度学习的网络信息传播指标体系构建及量化评估方法,其特征在于,所述信息传播态势评估指标体系从舆情事件、传播媒介、舆情受众三个大层次进行分析,涉及演化阶段特征、发帖内容特征、信息维度特征、网络结构特征、受众情感倾向、用户身份特征、媒体参与度传播热度及地区分布。3.根据权利要求1所述的基于深度学习的网络信息传播指标体系构建及量化评估方法,其特征在于,所述一级指标包含舆情事件、舆情受众及传播媒介;所述一级指标的舆情事件是从舆情事件本身角度分析,用于对舆情所处传播阶段的判断,从而分析传播趋势,所述舆情事件包括二级指标演化阶段特征、发帖内容特征、信息维度特征及网络结构特征;所述一级指标的舆情受众是从参与某一舆情事件的用户角度分析,用于反映受众规模、结构及心理状况,是舆情传播的重要构成,舆情受众包括二级指标受众情感倾向以及用户身份特征;所述一级指标的传播媒介是从舆情事件的传播媒介角度分析,是衡量舆情事件传播范围的重要标准,所述传播媒介包括二级指标媒体参与度、传播热度以及地区分布;二级指标的演化阶段特征包括三级指标传播时间跨度、演化阶段和传播速率;二级指标的发帖内容特征包括三级指标转发比例、图片比例、音频比例、视频比例、话题比例和“@”他人数量;二级指标的信息维度特征包括三级指标帖子标题长度、博文字符长度、博文向量化特征和博文平均tf-idf;二级指标的网络特征包括三级指标网络密度、聚集系数和连接强度;二级指标的受众情感倾向包括三级指标正向情感词频、中立情感词频、反向情感词频、情绪强度分级、正向情感比例、中立情感比例和反向情感比例;二级指标的用户身份特征包括三级指标性别比例、身份认证比例、账号注册时长、用户年龄分布、受教育水平分布、政治面貌分布、是否有用户名和是否上传头像;二级指标的媒体参与度包括三级指标报道新闻媒体数、新闻报道总数、媒体新闻转发量和媒体关注人数;二级指标的传播热度包括三级指标帖子数、转发数、评论数、点赞数、参与平台数、覆盖
用户数和帖子原创比例;二级指标的地区分布包括三级指标地区覆盖度、境外帖子比例、域名分布和境内帖子比例。4.根据权利要求1所述的基于深度学习的网络信息传播指标体系构建及量化评估方法,其特征在于,所述采用区间赋值法对三级指标中的定性指标进行量化表述,具体为:对于演化阶段这一定性指标,共有5个取值,分别为:平息阶段、消退阶段、上升阶段、稳定阶段和形成阶段,使用如下五个取值范围来对演化阶段这一定性指标进行量化赋值:[0,0.2)表示该三级指标处于形成阶段;[0.2,0.4)表示该三级指标处于稳定阶段;[0.4,0.6)表示该三级指标处于上升阶段;[0.6,0.8)表示该三级指标处于消退阶段;[0.8,1]表示该三级指标处于平息阶段;对于传播速率这一定性指标,共有5个取值,分别为:快速、较快、适中、较慢和停滞,使用如下五个取值范围来对传播速率这一定性指标进行量化赋值:[0,0.2)表示该三级指标表示停滞;[0.2,0.4)表示该三级指标表示较慢;[0.4,0.6)表示该三级指标表示适中;[0.6,0.8)表示该三级指标表示较快;[0.8,1]表示该三级指标处于表示快速;对于情绪强度分级、地区覆盖度和地区聚集度这些定性指标,共有5个取值,分别为:高、较高、适中、较低和低,使用如下五个取值范围来对这些定性指标进行量化赋值:[0,0.2)表示该三级指标表示程度低;[0.2,0.4)表示该三级指标表示程度较低;[0.4,0.6)表示该三级指标表示程度适中;[0.6,0.8)表示该三级指标表示程度较高;[0.8,1]表示该三级指标表示程高。5.根据权利要求4所述的基于深度学习的网络信息传播指标体系构建及量化评估方法,其特征在于,所述数据归一化是指对获取的事件数据进行计算,消除不同格式数据的运算困难,并通过数据映射,得到一定范围内的新数据,具体计算方法为:极值法,对原始数据的线性变换,使结果值映射到0-1之间,适用于三级指标中最大值最小值已知的情况,转换函数为:和其中,x,y分别表示归一化之前的数值和归一化之后的结果值,maxvalue表示该指标值中的最大值,minvalue表示该指标值中的最小值;统计标准化,给予原始数据的均和标准差进行数据标准化,使经过处理的数据符合标准正态分布,即均值为0,标准差为1,适用于三级指标中最大值最小值未知的情况,转化函数为:
其中,x,y分别表示归一化之前的数值和归一化之后的结果值,μ表示所有样本的均值,σ表示所有样本的标准差;反余切函数法,利用反余切函数将原数据映射到0-1之间,适用于三级指标中数据最大值为无穷的情况,转化函数为:其中,x,y分别表示归一化之前的数值和归一化之后的结果值,r为实数集;在指标体系中,三级指标中存在具有向量化特征与情感特征的指标;向量化特征指标使用tf-idf算法,统计正文文本的平均词频-逆文件频率;情感特征指标使用snownlp算法来对文本进行情感分析,计算情感评分,其中小于0.4为负向情感,大于0.6为正向情感,其他为中立情感,以此获得相应三级指标的指标值。6.根据权利要求1所述的基于深度学习的网络信息传播指标体系构建及量化评估方法,其特征在于,所述二维矩阵是将49个三级指标按顺序拼成7*7的矩阵。7.根据权利要求1所述的基于深度学习的网络信息传播指标体系构建及量化评估方法,其特征在于,所述卷积神经网络结构包括:输入层,输入为7*7的二维矩阵;第一卷积层,采用大小为7*7的16通道卷积,卷积核大小为3*3;第一池化层,大小为2*2;第二卷积层,采用大小为7*7的64通道卷积,卷积核大小为3*3;第二池化层,大小为2*2;第三和第四全连接层,长度分别为1024和256;使用softmax作为输出层;所述得到宣传态势评估模型,具体为:卷积神经网络将二维矩阵通过两个卷积层以及池化层进行特征筛选,得到的向量输入构建的两个全连接层,最终通过softmax函数进行输出,得到预测结果并进行结果评估,若预测结果不符合期望,则调整偏移值与权重值继续训练,直至得到期望的宣传态势评估模型。8.根据权利要求7所述的基于深度学习的网络信息传播指标体系构建及量化评估方法,其特征在于,所述卷积神经网络使用relu函数作为各层的激活函数,交叉熵作为损失函数,并使用预先设立的adam算法来进行反向传播优化;最终训练得到模型,并使用captum神经网络可解释性算法来输出卷积神经网络输入层的权值;所述relu函数表达式为:f(x)=max(0,x)当输入值x为负数,则输出值为零;输入为正数,则输出值与输入值x不变;所述交叉熵函数表达式为:
其中,l代表损失loss,代表类别的数量,y
ic
代表符号函数,取值为0或1,i为观测样本,c为真实类别,p
ic
代表观测样本属于类别c的概率。9.根据权利要求1所述的基于深度学习的网络信息传播指标体系构建及量化评估方法,其特征在于,所述预测结果为宣传态势评估模型输出的整数,取值为(1~5),根据整数,得到对应的宣传态势等级;所述宣传态势等级包含五个等级;第一等级表示舆情热度低,该舆情事件不会成为热点事件;第二等级表示舆情热度较低,该舆情事件信息传播范围有限,事件本身内容不够敏感,信息处于衰退期,传播速率不高,且受众对其多表示中立;第三等级表示舆情热度一般,该舆情事件传播速率中等,受众情感强度正常,既不是非常重要的舆情事件,也没有过高的热度,该舆情事件是否能够转变成焦点事件有待观察;第四等级表示舆情热度较高,该舆情事件信息传播较广,受到大量关注;该事件敏感度高,是舆情关注者较重点关注的事件类型,事件传播速率较快;且受众情感强度较高、倾向性较强可能引发舆情事件;第五等级表示舆情热度高,该舆情事件信息传播广,受到广泛关注;该事件敏感度高,是舆情关注者重点关注的事件类型,事件传播速率快;且受众情感强度高、倾向性强极易引发舆情事件。10.基于深度学习的网络信息传播指标体系构建及量化评估系统,其特征在于,应用于权利要求1-9中任一项所述的基于深度学习的网络信息传播指标体系构建及量化评估方法,包括数据获取模块、量化模块、训练模块以及预测模块;所述数据获取模块,用于获取网络平台的数据组成数据集,利用德尔菲法确定信息传播态势指标体系的三层指标,并通过主成分分析法,分析不同指标间的相关度,构建多层次多粒度多维度的信息传播态势评估指标体系;所述三层指标分别为一级指标、二级指标及三级指标,每个一级指标包括多个二级指标,每个二级指标包括多个三级指标;所述量化模块,获取数据集中的事件数据,采用区间赋值法对三级指标中的定性指标进行量化表述,采用数据归一化对三级指标中的定量指标进行量化处理,得到相应三级指标的指标值;所述训练模块,用于将每个事件的指标拼成二维矩阵作为卷积神经网络的输入进行模型训练,得到宣传态势评估模型;所述预测模块,用于输入待测试数据,得到预测结果和宣传态势等级。

技术总结
本发明公开了基于深度学习的网络信息传播指标体系构建及量化评估方法及系统,方法包括:获取网络平台的数据组成数据集,利用德尔菲法确定信息传播态势指标体系的三层指标,通过主成分分析法,分析不同指标间的相关度,构建指标体系;获取数据集的事件数据,采用区间赋值法对定性指标进行量化表述,用数据归一化对定量指标进行量化处理得到指标值;将每个事件拼成二维矩阵作为卷积神经网络的输入进行模型训练,得到宣传态势评估模型;输入待测试数据进行预测结果和宣传态势等级。本发明从多维度构建多层次多粒度的指标体系,全面地刻画舆论事件的评估指标,通过卷积神经网络训练评估模型,获取每个指标的权重,客观准确地对舆论事件态势进行评估。论事件态势进行评估。论事件态势进行评估。


技术研发人员:李树栋 肖林鹤 韩伟红 吴晓波
受保护的技术使用者:广州大学
技术研发日:2021.10.28
技术公布日:2022/2/24
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1