一种基于混合节点图的涉案微博对象级情感分类方法

文档序号:25734032发布日期:2021-07-06 18:42阅读:来源:国知局

技术特征:

1.一种基于混合节点图的涉案微博对象级情感分类方法,其特征在于:所述方法将评论及其评价对象类别视为一个混合节点,根据混合节点之间的语义相似性和情感关联性分别构建语义图和情感图;然后,将语义图和情感图堆叠为一个图张量,并对图张量的每一层执行图内卷积和图间卷积两种卷积操作;最后,在标签的监督下,基于混合节点的特征完成情感分类。

2.根据权利要求1所述的基于混合节点图的涉案微博对象级情感分类方法,其特征在于:所述方法具体包括如下步骤:

step1、收集文本;

step2、文本处理;

step3、混合节点特征的初始化;

step4、构建情感图与语义图;

step5、构建图张量和特征学习;

step6、将混合节点的特征向量送入softmax分类器,得到该混合节点属于不同情感类别的概率。

3.根据权利要求2所述的基于混合节点图的涉案微博对象级情感分类方法,其特征在于:所述文本处理包括分词、去除停用词、词频统计、文档频率统计。

4.根据权利要求2所述的基于混合节点图的涉案微博对象级情感分类方法,其特征在于:所述step3中,混合节点特征的初始化如下:

用主题模型对整个数据集进行建模,得到不同评价对象类别的代表性词项及每个评论对应的评价对象类别概率分布;

其中,对于有标签评论,根据其标签类别确定其对应的代表性词项;

对于无标签评论,根据其概率分布的最大值确定其类别标签,进一步确定其对应的代表性词项;

通过上述方法得到每个评论的类别及其代表性词项;然后使用google发布的中文预训练bert模型对混合节点进行bert向量编码,获得混合节点的语义表征。

5.根据权利要求2所述的基于混合节点图的涉案微博对象级情感分类方法,其特征在于:所述step4中包括:

如果两个评论既针对同一类评价对象展开讨论,又含有同样的情感词,则认为二者具有情感关联,即可构建基于情感图;

如果两个混合节点的bert向量具有相似度,则它们应该是相邻节点,并且应该交换它们的信息,即可构建语义图。

6.根据权利要求2所述的基于混合节点图的涉案微博对象级情感分类方法,其特征在于:所述step4中,情感图的邻接矩阵中两个混合节点vi与vj之间边的权重计算如下所示:

其中#{.}表示满足条件的词的总数,wk是情感词典中的第k个词,xi和xj表示数据集中的第i和第j个评论。

如果两个混合节点的语义具有相似度,则构建语义图,通过以下公式得到两个混合节点之间的边权重和语义图的邻接矩阵中的边权重;

其中,hi是混合节点vi的初始特征,hj是混合节点vj的初始特征,,||·||表示向量的大小,α是度量相似性的阈值。

7.根据权利要求2所述的基于混合节点图的涉案微博对象级情感分类方法,其特征在于:所述step5中,利用情感图和语义图构造图张量,一个图张量表示为其中gi=(vi,ei,ai)是第i个单独的图;t=2;在不同的图中,节点相同而节点间的边不同,即vi=vj,ai≠aj,i,j=1,2,…,t,且i≠j;将不同的邻接矩阵堆叠为一个张量;将称为一个图邻接张量,其中ai(i=1,2,…,t)是图张量中第i个图的邻接矩阵;同样,将不同的特征矩阵堆叠为一个特征张量其中是图张量中第i个图的特征矩阵;所构建的图张量中,图节点在特征学习时,除了同一张图中不同节点进行信息传递,不同图的同一节点间的信息也进行异构信息的传递,故对于图张量的每一层,执行同一张图的图内卷积、不同图的图间卷积。


技术总结
本发明涉及一种基于混合节点图的涉案微博对象级情感分类方法,属于情感分类技术领域。本发明所述方法将评论及其评价对象类别视为一个混合节点,根据混合节点之间的语义相似性和情感关联性分别构建语义图和情感图;然后,将语义图和情感图堆叠为一个图张量,并对图张量的每一层执行图内卷积和图间卷积两种卷积操作;最后,在标签的监督下,基于混合节点的特征完成情感分类,本发明能显著提高情感分类性能。

技术研发人员:相艳;谭晓聪;王红斌;余正涛;郭军军
受保护的技术使用者:昆明理工大学
技术研发日:2021.04.25
技术公布日:2021.07.06
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1