一种基于事件链的网络舆情关联推演预测分析方法

文档序号:26791717发布日期:2021-09-28 23:37阅读:来源:国知局

技术特征:
1.一种基于事件链的网络舆情关联推演预测分析方法,其特征在于,包括以下步骤:s1、通过elmo模型对微博训练集语料进行预训练,得到预训练模型后对测试集进行词向量处理;s2、通过one

pass聚类算法合并相似微博数据,得到节点事件集合;s3、对步骤s2中的节点事件集合的关键词再次使用预训练模型向量化处理,得到节点集合的向量化表示;s4、通过active learning进行少标签数据学习,为每个节点贴标;s5、通过seq2pat发现标签之间转移对数;s6、通过马尔科夫链构建节点事件之间关联,并生成关联树;s7、通过n步马尔科夫链预测每个节点事件的舆情发展趋势。2.如权利要求1所述的一种基于事件链的网络舆情关联推演预测分析方法,其特征在于,所述步骤s1还包括对微波文本进行数据预处理,包括以下步骤:s11、通过textrank算法对分词后的博文词汇集进行关键词提取,得到博文关键词词汇集,构建在emlo模型;s12、使用一个双向的lstm语言模型,将elmo直接当做特征拼接到具体任务模型的词向量输入或者是模型的最高层表示上,对测试集语料中词向量化。3.如权利要求1所述的一种基于事件链的网络舆情关联推演预测分析方法,其特征在于,所述步骤s2包括对于每条向量化后的博文进行余弦相似性计算,通过one

pass聚类,得到节点事件。4.如权利要求1所述的一种基于事件链的网络舆情关联推演预测分析方法,其特征在于,所述步骤s3包括以下步骤:s31、通过步骤s1得到的预训练模型,再次进行词向量化;s32、随后进行语义消歧任务,使用semcor3.0语料库,利用bilms来计算语料库中所有的词汇向量表示;s33、再利用1近邻法求这个词汇可能的位置及向量化。5.如权利要求1所述的一种基于事件链的网络舆情关联推演预测分析方法,其特征在于,所述步骤s4中通过基于池的采样(pool

based sampling)的active learning对节点事件进行标注。6.如权利要求1所述的一种基于事件链的网络舆情关联推演预测分析方法,其特征在于,所述步骤s5中使用seq2pat基于约束的顺序模式挖掘算法,使用多值决策图(mdd)的顺序数据库表示方法,通过利用对称性对项目序列及其属性进行紧凑编码。7.如权利要求1所述的一种基于事件链的网络舆情关联推演预测分析方法,其特征在于,所述步骤s6中,根据节点事件的先验概率和转移概率,计算得到马尔科夫链模型,并生成事件链状态转移概率树。8.如权利要求1所述的一种基于事件链的网络舆情关联推演预测分析方法,其特征在于,所述步骤s7中,通过n步马尔科夫链,计算达到稳态,并生成每个子节点事件演化概率图。

技术总结
本发明公开了一种基于事件链的网络舆情关联推演预测分析方法,包括:将微博博文文本数据根据事件发展提取相关节点事件,通过聚类关联和模式挖掘匹配预测,形成主题演化树和舆情演化概率图;其中,通过ELMO模型对微博训练集语料进行预训练,并向量化微博博文;通过One


技术研发人员:李仁德 马皓添 曹春萍
受保护的技术使用者:上海理工大学
技术研发日:2021.07.15
技术公布日:2021/9/27
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1