1.一种基于混合节点图的涉案微博对象级情感分类方法,其特征在于:所述方法将评论及其评价对象类别视为一个混合节点,根据混合节点之间的语义相似性和情感关联性分别构建语义图和情感图;然后,将语义图和情感图堆叠为一个图张量,并对图张量的每一层执行图内卷积和图间卷积两种卷积操作;最后,在标签的监督下,基于混合节点的特征完成情感分类。
2.根据权利要求1所述的基于混合节点图的涉案微博对象级情感分类方法,其特征在于:所述方法具体包括如下步骤:
step1、收集文本;
step2、文本处理;
step3、混合节点特征的初始化;
step4、构建情感图与语义图;
step5、构建图张量和特征学习;
step6、将混合节点的特征向量送入softmax分类器,得到该混合节点属于不同情感类别的概率。
3.根据权利要求2所述的基于混合节点图的涉案微博对象级情感分类方法,其特征在于:所述文本处理包括分词、去除停用词、词频统计、文档频率统计。
4.根据权利要求2所述的基于混合节点图的涉案微博对象级情感分类方法,其特征在于:所述step3中,混合节点特征的初始化如下:
用主题模型对整个数据集进行建模,得到不同评价对象类别的代表性词项及每个评论对应的评价对象类别概率分布;
其中,对于有标签评论,根据其标签类别确定其对应的代表性词项;
对于无标签评论,根据其概率分布的最大值确定其类别标签,进一步确定其对应的代表性词项;
通过上述方法得到每个评论的类别及其代表性词项;然后使用google发布的中文预训练bert模型对混合节点进行bert向量编码,获得混合节点的语义表征。
5.根据权利要求2所述的基于混合节点图的涉案微博对象级情感分类方法,其特征在于:所述step4中包括:
如果两个评论既针对同一类评价对象展开讨论,又含有同样的情感词,则认为二者具有情感关联,即可构建基于情感图;
如果两个混合节点的bert向量具有相似度,则它们应该是相邻节点,并且应该交换它们的信息,即可构建语义图。
6.根据权利要求2所述的基于混合节点图的涉案微博对象级情感分类方法,其特征在于:所述step4中,情感图的邻接矩阵中两个混合节点vi与vj之间边的权重计算如下所示:
其中#{.}表示满足条件的词的总数,wk是情感词典中的第k个词,xi和xj表示数据集中的第i和第j个评论。
如果两个混合节点的语义具有相似度,则构建语义图,通过以下公式得到两个混合节点之间的边权重和语义图的邻接矩阵中的边权重;
其中,hi是混合节点vi的初始特征,hj是混合节点vj的初始特征,,||·||表示向量的大小,α是度量相似性的阈值。
7.根据权利要求2所述的基于混合节点图的涉案微博对象级情感分类方法,其特征在于:所述step5中,利用情感图和语义图构造图张量,一个图张量表示为