基于LC-GCN方面级情感分析方法、系统、存储介质和电子设备

文档序号:28267519发布日期:2021-12-31 18:55阅读:158来源:国知局
基于LC-GCN方面级情感分析方法、系统、存储介质和电子设备
基于lc

gcn方面级情感分析方法、系统、存储介质和电子设备
技术领域
1.本发明涉及方面级情感分析技术领域,具体涉及一种基于lc

gcn方面级情感分析方法、系统、存储介质和电子设备。


背景技术:

2.随着互联网技术和社交媒体的不断发展,由互联网用户产生的关于产品、服务或事件的评论数据迅速增长。如何利用自然语言处理(natural language processing,nlp)技术从评论文本中挖掘有价值的信息,例如情感分析任务,已成为当前研究热点且受到众多研究人员的高度关注。
3.情感分析任务除了分析整体评论情感外,其子任务可进一步挖掘评论文本中评论者关于一个或多个方面的情感极性,因此方面级情感分析成为nlp领域重要研究方向之一。方面级情感分析可细粒度地挖掘评论文本中某一方面的情感极性,例如评论语句“good food but dreadful service at that restaurant”,传统情感分析仅从整体上分析其情感极性为中性,而方面级情感分析可分析出用户对于“food”和“service”两方面分别表现为积极和消极的情绪。可见方面级情感分析可从评论文本中分析评论者对于不同方面的喜好程度,该研究任务挖掘的信息受益于产品推荐、股票预测和舆情分析等实际应用领域。
4.目前,在方面级情感分析任务中,由于基于卷积神经网络(cnn)可提取局部信息,以及循环神经网络(rnn)可提取长距离信息,因此两种深度学习知识常被用于提取上下文特征信息。常用的分析手段还包括注意力机制和句法依存解析技术。其中,注意力机制可用于关联上下文和方面词信息,实现将方面词信息融入上下文特征的效果。而句法依存解析技术可用于解析上下文中各词之间存在的句法依存结构。此外,有研究表明上下文中方面词的情感特征取决于其周围单词特征信息,因此还提出局部上下文(local context,lc)的概念。
5.但是,现有方面级情感分析技术进行特征提取时,存在忽略上下文各词间存在的句法关系和未能针对性地提取上下文语义信息两方面问题,可能提取部分与方面词无关的噪声信息,导致无法准确挖掘评论文本的各方面情感。


技术实现要素:

6.(一)解决的技术问题
7.针对现有技术的不足,本发明提供了一种基于lc

gcn方面级情感分析方法、系统、存储介质和电子设备,解决了现有方面级情感分析技术未能针对性地提取上下文的句法关系和语义信息的技术问题。
8.(二)技术方案
9.为实现以上目的,本发明通过以下技术方案予以实现:
10.一种基于lc

gcn方面级情感分析方法,包括:
11.根据待分析的评论上下文,获取词嵌入矩阵,所述评论上下文中至少包括一个方
面词;
12.根据所述词嵌入矩阵,获取融合了上下文语义的隐藏特征向量;
13.根据所述方面词在评论上下文中的局部上下文,获取动态上下文权重矩阵和局部上下文加权邻接图;
14.根据所述隐藏特征向量、动态上下文权重矩阵和局部上下文加权邻接图,采用多层gcn网络获取聚焦于局部上下文信息的方面词特征矩阵,并标记所述方面词特征矩阵;
15.根据标记后的方面词特征矩阵,获取所述方面词对应的情感极性。
16.优选的,所述根据所述方面词在评论上下文中的局部上下文,获取动态上下文权重矩阵,具体包括:
17.s1a、定义所述方面词在评论上下文为中心位置,获取所述方面词在评论上下文中的局部上下文;
18.s2a、根据当前单词在所述评论上下文中的位置与所述中心位置的语义相关距离,判断当前单词是否属于所述局部上下文;
19.s3a、根据判断结果,采用动态上下文赋权方式获取所述动态上下文权重矩阵。
20.优选的,所述局部上下文加权邻接图的获取方式,具体包括:
21.s1b、根据所述评论上下文,采用句法依存解析方法获取原始句法依存图;
22.s2b、根据所述原始句法依存图中各个节点的依存关系,获取句法依存矩阵;
23.s3b、根据当前节点与所述方面词对应节点的语义相关距离,计算所述评论上下文的权重矩阵;
24.s4b、根据所述句法依存矩阵和权重矩阵,获取所述局部上下文加权邻接图。
25.优选的,所述根据所述隐藏特征向量、动态上下文权重矩阵和局部上下文加权邻接图,采用多层gcn网络获取聚焦于局部上下文信息的方面词特征矩阵,具体包括:
26.s1c、根据所述隐藏特征向量和动态上下文权重矩阵,获取输入到首层gcn网络的特征矩阵;
27.s2c、根据所述局部上下文加权邻接图,以及所述原始句法依存图中各个节点的依存关系,获取标准化的各节点的度;
[0028][0029]
其中,g
i
表示所述评论上下文中第i个单词在所述局部上下文加权邻接图g中对应的元素;d
i,j
表示当前单词i对应节点与其他任意单词j对应节点之间的依存关系,若存在依存关系,取1,否则取0;表示当前节点i的度,n表示所述评论上下文中一共包括n个单词;表示标准化的当前节点的度;
[0030]
s3c、根据所述第一特征矩阵和标准化的各节点的度,采用多层gcn网络获取所述方面词特征矩阵;
[0031][0032][0033]
其中,relu表示非线性激活函数;w
l
和b
l
分别表示需要预先训练的参数矩阵和偏置
项;l表示总层数为l层的gcn网络中的第l层;表示所述评论上下文中第i个单词在所述动态上下文权重矩阵w
h
中对应元素;分别表示第l

1层和第l层gcn网络输出的特征矩阵;表示第l

1层gcn网络提取到的特征矩阵经过上下文动态赋权所得结果,当l取1时,表示所述隐藏特征向量。
[0034]
优选的,所述标记所述方面词特征矩阵,具体包括:
[0035]
根据所述当前单词在所述评论上下文中的位置与所述中心位置的语义相关距离,保留所述方面词特征矩阵中的方面词特征向量;采用零向量替换所述方面词特征矩阵中的非方面词特征向量,获取所述标记后的方面词特征矩阵。
[0036]
优选的,所述获取所述方面词对应的情感极性,具体包括:
[0037]
s1d、根据所述隐藏特征向量和标记后的方面词特征矩阵,采用点积注意力的赋权方式,获取所述评论上下文中各词与所述方面词之间的相关性;
[0038]
s2d、根据所述各词与所述方面词之间的相关性,获取最终特征信息;
[0039]
s3d、将所述最终特征信息输入全连接层后,采用softmax分类器计算得到各种情感极性对应的概率值,将最高概率值对应的情感极性作为所述方面词对应的情感极性。
[0040]
优选的,所述根据待分析的评论上下文,获取词嵌入矩阵,具体采用预训练glove语料库生成所述词嵌入矩阵。
[0041]
优选的,所述根据所述词嵌入矩阵,获取融合了上下文语义的隐藏特征向量,具体采用bilstm网络获取所述隐藏特征向量。
[0042]
一种基于lc

gcn方面级情感分析系统,包括:
[0043]
词嵌入模块,用于根据待分析的评论上下文,获取词嵌入矩阵,所述评论上下文中至少包括一个方面词;
[0044]
融合模块,用于根据所述词嵌入矩阵,获取融合了上下文语义的隐藏特征向量;
[0045]
第一获取模块,用于根据所述方面词在评论上下文中的局部上下文,获取动态上下文权重矩阵和局部上下文加权邻接图;
[0046]
第二获取模块,用于根据所述隐藏特征向量、动态上下文权重矩阵和局部上下文加权邻接图,采用多层gcn网络获取聚焦于局部上下文信息的方面词特征矩阵,并标记所述方面词特征矩阵;
[0047]
输出模块,用于根据标记后的方面词特征矩阵,获取所述方面词对应的情感极性。
[0048]
一种存储介质,其存储有用于基于lc

gcn方面级情感分析的计算机程序,其中,所述计算机程序使得计算机执行如上所述的基于lc

gcn方面级情感分析方法。
[0049]
一种电子设备,包括:
[0050]
一个或多个处理器;
[0051]
存储器;以及
[0052]
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如上所述的基于lc

gcn方面级情感分析方法。
[0053]
(三)有益效果
[0054]
本发明提供了一种基于lc

gcn方面级情感分析方法、系统、存储介质和电子设备。
与现有技术相比,具备以下有益效果:
[0055]
本发明中待分析的评论上下文至少包括一个方面词;根据评论上下文的词嵌入矩阵,获取融合了上下文语义的隐藏特征向量;根据所述方面词在评论上下文中的局部上下文,获取动态上下文权重矩阵和局部上下文加权邻接图;根据所述隐藏特征向量、动态上下文权重矩阵和局部上下文加权邻接图,采用多层gcn网络获取聚焦于局部上下文信息的方面词特征矩阵,并标记所述方面词特征矩阵;根据标记后的方面词特征矩阵,获取所述方面词对应的情感极性。提出的上下文动态赋权方法,增强了特征提取过程对局部上下文的关注度;构建了融合了上下文句法特征和局部上下文语义信息的邻接图;采用多层图卷积网络(gcn)的方式不断提取聚焦于局部上下文的方面词特征,保证方面词特征矩阵融合局部上下文信息,实现更加准确地挖掘评论文本的各方面情感。
附图说明
[0056]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0057]
图1为本发明实施例提供的一种基于lc

gcn方面级情感分析方法的方法流程示意图;
[0058]
图2为本发明实施例提供的一种lc

gcn模型结构示意图;
[0059]
图3为本发明实施例提供的一个基于现有句法依存解析方法生成上下文句法依存图的示例;
[0060]
图4为本发明实施例提供的一种基于lc

gcn方面级情感分析方法的系统结构框图。
具体实施方式
[0061]
为使本发明实施例的目的、技术方案和优点更加清楚,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0062]
本技术实施例通过提供一种基于lc

gcn方面级情感分析方法、系统、存储介质和电子设备,解决了现有方面级情感分析技术未能针对性地提取上下文的句法关系和语义信息的技术问题,实现更加准确地挖掘评论文本的各方面情感。
[0063]
本技术实施例中的技术方案为解决上述技术问题,总体思路如下:
[0064]
本发明实施例中待分析的评论上下文至少包括一个方面词;根据评论上下文的词嵌入矩阵,获取融合了上下文语义的隐藏特征向量;根据所述方面词在评论上下文中的局部上下文,获取动态上下文权重矩阵和局部上下文加权邻接图;根据所述隐藏特征向量、动态上下文权重矩阵和局部上下文加权邻接图,采用多层gcn网络获取聚焦于局部上下文信息的方面词特征矩阵,并标记所述方面词特征矩阵;根据标记后的方面词特征矩阵,获取所述方面词对应的情感极性。提出的上下文动态赋权方法,增强了特征提取过程对局部上下
文的关注度;构建了融合了上下文句法特征和局部上下文语义信息的邻接图;采用多层图卷积网络(gcn)的方式不断提取聚焦于局部上下文的方面词特征,保证方面词特征矩阵融合局部上下文信息,实现更加准确地挖掘评论文本的各方面情感。
[0065]
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
[0066]
实施例:
[0067]
第一方面,如图1所示,本发明实施例提供了一种基于lc

gcn方面级情感分析方法,包括:
[0068]
s1、根据待分析的评论上下文,获取词嵌入矩阵,所述评论上下文中至少包括一个方面词;
[0069]
s2、根据所述词嵌入矩阵,获取融合了上下文语义的隐藏特征向量;
[0070]
s3、根据所述方面词在评论上下文中的局部上下文,获取动态上下文权重矩阵和局部上下文加权邻接图;
[0071]
s4、根据所述隐藏特征向量、动态上下文权重矩阵和局部上下文加权邻接图,采用多层gcn网络获取聚焦于局部上下文信息的方面词特征矩阵,并标记所述方面词特征矩阵;
[0072]
s5、根据标记后的方面词特征矩阵,获取所述方面词对应的情感极性。
[0073]
本发明实施例提出的上下文动态赋权方法,增强了特征提取过程对局部上下文的关注度;构建了融合了上下文句法特征和局部上下文语义信息的邻接图;采用多层图卷积网络(gcn)的方式不断提取聚焦于局部上下文的方面词特征,保证方面词特征矩阵融合局部上下文信息,实现更加准确地挖掘评论文本的各方面情感。
[0074]
需要说明的是,为了有针对性地提取上下文语义信息和句法特征,本发明实施例提出的情感分析方法可以理解为依托于lc

gcn模型展开,如图2所示,具体是指一种基于局部上下文(local context,lc)和图卷积网络(graph convolutional networks,gcn)的方面级情感分析模型(lc

gcn),模型总体结构由上下文特征融合、构建加权矩阵和加权邻接图、方面词特征提取和输出四个部分组成。
[0075]
下面将结合具体内容介绍上述方案的各个步骤,具体如下:
[0076]
s1、根据待分析的评论上下文,获取词嵌入矩阵,所述评论上下文中至少包括一个方面词。
[0077]
本发明实施例给定一条包括n个单词的待分析的评论上下文c=[w1,w2...,w
τ+1
,...,w
τ+m
,...,w
n
],其子序列t=[w
τ+1
,...,w
τ+m
]是长度为m的方面词(即该方面词包括m个单词,w
τ+1
表示该方面词在评论上下文中的起始单词)。而本发明实施例的任务为预测所述评论上下文c中方面词t的情感极性。
[0078]
具体的,获取所述评论上下文的词嵌入矩阵,具体采用预训练glove语料库生成所述词嵌入矩阵。
[0079]
词嵌入操作是指将所述评论上下文中每个单词w
i
根据其在词嵌入查询表v中的索引,映射成低维特征向量x
i
的过程,其中v∈r
n
×
e_dim
,x
i
∈r
e_dim
,n和e_dim分别表示查询表大小和词向量维度。所述评论上下文c通过词嵌入操作后,可生成对应的词嵌入矩阵x=[x1,x2,...x
n
],其中x∈r
n
×
e_dim
。由于本文模型采用预训练glove语料库作为词嵌入查询表来初始化词向量,显然由此方式生成的词向量未融合上下文信息,需要进一步特征融合操作。
[0080]
s2、根据所述词嵌入矩阵,获取融合了上下文语义的隐藏特征向量。
[0081]
为了使词嵌入后的低维向量结合上下文信息,本步骤利用bilstm网络可提取长距离特征的优势,从前向和后向分别提取上下文隐藏特征,以此方式生成的特征信息可充分将上下文信息融合,因此本发明实施例将词嵌入矩阵x输入bilstm网络,经前向lstm网络生成隐藏特征矩阵同样方式由后向lstm网络生成隐藏特征矩阵其中h_dim表示隐藏维度。
[0082]
为了将两个方向特征信息结合,采用前向和后向隐藏特征拼接的方式,即其中“;”表示拼接操作,由此所得结果作为bilstm网络提取的融合了上下文语义的隐藏特征其中h
c
∈r
n
×
2*h_dim

[0083]
s3、根据所述方面词在评论上下文中的局部上下文,获取动态上下文权重矩阵和局部上下文加权邻接图。
[0084]
考虑到方面词特征很大程度取决于其周围信息,本发明实施例在更新隐藏特征向量和构建邻接图的过程中,采用赋权的方式不断提升对局部上下文的关注度。
[0085]
一方面,为了突出局部上下文隐藏特征信息的重要性,通过上下文动态赋权的方式,削弱了与方面词语义无关的特征信息。
[0086]
另一方面,在由现有句法依存解析方法生成上下文句法依存图的基础上,为局部上下文赋权修整句法依存图,由此构成的邻接图利用了上下文句法信息的同时,有效地融入了语义信息。
[0087]
所述s3中获取动态上下文权重矩阵具体包括:
[0088]
s1a、定义所述方面词在评论上下文为中心位置,获取所述方面词在评论上下文中的局部上下文。
[0089]
在所述评论上下文c中,将所述方面词t所在的中心位置前α到后α个上下文词所组成的子序列lc=[w
τ+1

α
,...,w
τ+1
,...w
τ+m
,...w
τ+m+α
]称为所述方面词在评论上下文中的局部上下文(local context,lc);α表示调整局部上下文序列长度的参数。
[0090]
s2a、根据当前单词在所述评论上下文中的位置与所述中心位置的语义相关距离,判断当前单词是否属于所述局部上下文。
[0091][0092][0093]
其中,i和p
a
分别表示在所述评论上下文中当前单词w
i
的位置和方面词的中心位置;srd
i
表示当前单词w
i
在所述评论上下文中的位置与所述中心位置的语义相关距离;比较当前单词w
i
的语义相关距离srd
i
与α大小关系,判断该单词是否属于局部上下文,具体采用lc
i
标记当前单词w
i
是否属于所述局部上下文,属于时,取true,否则取false。
[0094]
s3a、根据判断结果,采用动态上下文赋权方式获取所述动态上下文权重矩阵。
[0095]
对于上下文隐藏特征,处于局部上下文的信息决定了方面词情感极性,而非局部上下文信息随着离方面词距离的增加,呈现出语义相关度递减的趋势。
[0096]
为了突出局部上下文语义特征,且保留非局部上下文信息,本发明实施例采取了
动态上下文赋权的方式,可减小由非局部上下文隐藏特征产生的噪声影响。
[0097][0098]
如上式所示,根据非局部上下文各词与局部上下文的语义距离计算权重,其中e表示元素为1的2*h_dim维列向量,即e∈r
2*h_dim
。最终生成的动态上下文权重矩阵其中表示当前单词w
i
对应的权重;w
h
∈r
n
×
2*h_dim
用于后续步骤中为上下文隐藏特征向量赋权,以更新所提取到的特征。
[0099]
所述s3中所述局部上下文加权邻接图的获取方式,具体包括:
[0100]
s1b、根据所述评论上下文,采用句法依存解析方法获取原始句法依存图。
[0101]
为方便理解,图3给出一个句法依存解析方法生成上下文句法依存图的一个示例,从“food”周围的“good”可判断对于“food”这一方面表达的是积极情感,从“dreadful”可判断“service”为消极情感,显然生成的原始句法依存图包含了上下文各词(各个节点)间存在的句法依存关系。
[0102]
s2b、根据所述原始句法依存图中各个节点的依存关系,获取句法依存矩阵d(dependency matrix)。
[0103][0104][0105]
如上式所示,d
i,j
表示当前单词i对应节点与其他任意单词j对应节点之间的依存关系,若存在依存关系,取1,否则取0。其中w
i

w
j
即表示两者之间存在依存关系。
[0106]
为了适应后续步骤中gcn网络处理无向邻接图的情形,如本步骤中第二个公式所示,将存在依存关系的两个节点对应位置d
i,j
和d
j,i
在句法依存矩阵中置为1,否则为0,以此生成以主对角线为轴对称的句法依存矩阵d,其中d∈r
n
×
n

[0107]
s3b、根据当前节点与所述方面词对应节点的语义相关距离,计算所述评论上下文的权重矩阵。
[0108]
本步骤构建权重矩阵的方法如下式所示,当两个节点同时属于局部上下文时,根据各节点与方面词节点的语义相关距离计算相应的权重,否则权重为0。对输入的评论上下文中局部上下文赋权,可生成权重矩阵w
g
(weighted matrix),其中w
g
∈r
n
×
n

[0109][0110]
其中,当前单词i对应节点与其他任意单词j对应节点之间权重。
[0111]
s4b、根据所述句法依存矩阵和权重矩阵,获取所述局部上下文加权邻接图。
[0112][0113]
如上式所示,在所述句法依存矩阵d的基础上整合权重矩阵w
g
,可生成结合了句法依存关系和针对局部上下文赋权的邻接图,即所述局部上下文加权邻接图(adjacency graph),其中g∈r
n
×
n

[0114]
s4、根据所述隐藏特征向量、动态上下文权重矩阵和局部上下文加权邻接图,采用多层gcn网络获取聚焦于局部上下文信息的方面词特征矩阵,并标记所述方面词特征矩阵。
[0115]
在经过上述步骤s2中bilstm网络提取上下文语义信息(隐藏特征向量)后,如何针对性地提取上下文句法特征是关键。在修整后的句法依存图(局部上下文加权邻接图)的基础上,本发明实施例采用gcn网络提取上下文句法信息,同时为gcn网络提取到的非局部上下文隐藏特征动态赋权,可针对性地提取局部上下文句法特征。其次,为了多次卷积提取结合了局部上下文语义的句法特征,本文通过多层gcn网络提取不断聚焦于局部上下文信息方面词特征,以上下文动态赋权的方式不断削弱了与方面词无关的特征。最后,通过mask标记提取由多层gcn网络生成的聚集了局部上下文信息的方面词特征矩阵。
[0116]
所述s4具体包括:
[0117]
s1c、根据所述隐藏特征向量和动态上下文权重矩阵,获取输入到首层gcn网络的特征矩阵。
[0118]
s2c、根据所述局部上下文加权邻接图,以及所述原始句法依存图中各个节点的依存关系,获取标准化的各节点的度。
[0119]
由于所述局部上下文加权邻接图中不同节点重要程度不同,需要根据图中各节点的度进行标准化。
[0120][0121]
其中,g
i
表示所述评论上下文中第i个单词在所述局部上下文加权邻接图g中对应的元素;d
i,j
表示当前单词i对应节点与其他任意单词j对应节点之间的依存关系,若存在依存关系,取1,否则取0;表示当前节点i的度,n表示所述评论上下文中一共包括n个单词;表示标准化的当前节点的度;
[0122]
s3c、根据所述第一特征矩阵和标准化的各节点的度,采用多层gcn网络获取所述方面词特征矩阵;
[0123][0124]
在gcn网络特征提取过程中,第l层gcn网络的每个节点输出的特征矩阵根据上式计算更新,该过程提取的特征融合了与其相邻节点的特征信息。
[0125][0126]
其中,relu表示非线性激活函数;w
l
和b
l
分别表示需要预先训练的参数矩阵和偏置
项;l表示总层数为l层的gcn网络中的第l层;表示所述评论上下文中第i个单词在所述动态上下文权重矩阵w
h
中对应元素;分别表示第l

1层和第l层gcn网络输出的特征矩阵;表示第l

1层gcn网络提取到的特征矩阵经过上下文动态赋权所得结果,当l取1时,表示所述隐藏特征向量。
[0127]
在所述局部上下文加权邻接图g保持不变的前提下,不断通过上述上下文动态赋权的方式为每层gcn提取到的特征赋权,经过多层gcn特征提取后,最终得到充分聚焦于局部上下文信息的方面词特征矩阵其中h
l
∈r
n
×
2*h_dim

[0128]
所述s4中标记所述方面词特征矩阵,具体包括:
[0129]
经过上述l层gcn网络提取的方面词特征矩阵充分融合了局部上下文信息,为了提取方面词特征,本发明实施例采用mask标记从该方面词特征矩阵h
l
中提取方面词所在位置的特征向量。
[0130][0131]
具体的,如上式所示,根据所述当前单词在所述评论上下文中的位置与所述中心位置的语义相关距离(当语义相关距离为0时,对应位置向量即为方面词特征向量),保留所述方面词特征矩阵中的方面词特征向量;采用零向量替换所述方面词特征矩阵中的非方面词特征向量,获取所述标记后的方面词特征矩阵
[0132]
s5、根据标记后的方面词特征矩阵,获取所述方面词对应的情感极性。
[0133]
本步骤根据由bilstm提取的隐藏特征向量,采用点积注意力赋权方式提取与所述方面词相关的重要特征信息。
[0134]
所述s5具体包括:
[0135]
s1d、根据所述隐藏特征向量和标记后的方面词特征矩阵,如下面两个公式所示,采用点积注意力的赋权方式获取所述评论上下文中各词与所述方面词之间的相关性α
t

[0136][0137][0138]
s2d、根据所述各词与所述方面词之间的相关性,如下式所示,获取最终特征信息r。
[0139][0140]
s3d、将所述最终特征信息输入全连接层后,采用softmax分类器计算得到各种情感极性对应的概率值y,将最高概率值对应的情感极性作为所述方面词对应的情感极性。
[0141]
y=softmax(w
o
r+b
o
)
[0142]
本发明实施例中的情感极性可以根据实际需要设定种类,例如包括积极情感、消
极情感以及中性情感。
[0143]
为了有针对性地提取上下文语义信息和句法特征,由上述介绍内容可知,本发明实施例提出的情感分析方法可以理解为依托于lc

gcn模型展开,如图3所示,具体是指一种基于局部上下文(local context,lc)和图卷积网络(graph convolutional networks,gcn)的方面级情感分析模型(lc

gcn)。
[0144]
为了验证本发明实施例提供的lc

gcn模型相较于现有技术,能能够更加准确地挖掘评论文本的各方面情感,提供如下对比实验予以证明。
[0145]
首先介绍两种用于对比参照的现有模型。
[0146]
(1)gcae模型:主要根据上下文与方面词的相关信息构建了门控卷积网络,进而可在特征提取过程中将与方面词无关的上下文信息剔除。
[0147]
具体实现过程如下:首先,使用预训练语料库作为词嵌入工具可生成上下文和方面词的特征表示e
c
和e
a
。其次,构建门控卷积网络过程中使用卷积神经网络对方面词特征向量e
a
进行卷积操作后,通过最大池化得到最具代表的方面词特征信息g
a
。对上下文进行卷积操作后将结果使用tanh激活函数进行特征强化得到g
c
,随后通过上下文和方面词卷积结果相加的方式进行相似度计算,通过relu激活函数可将与方面词无关的上下文信息置为0,即可得到过滤矩阵f
c
。使用另一种卷积对上下文进行卷积操作可得g

c
,并将结果通过过滤矩阵f
c
,即可实现卷积过程的门控机制。最终将卷积后的结果使用最大池化作为最终提取到的特征,并使用softmax分类器计算每种情感极性的概率值,选择其中最大值作为预测结果。
[0148]
(2)asgcn模型:首次使用gcn网络,在句法依存解析上下文生成句法依存结构的基础上,提取上下文句法特征。
[0149]
具体实现过程如下:首先,通过预训练语料库glove得到上下文词嵌入表示为w
c
后,使用bilstm网络提取上下文特征信息得到h
c
。其次,使用句法依存解析技术解析上下文生成了邻接图g,使用gcn网络根据邻接图和上下文特征信息,提取上下文句法特征最后,从上下文句法特征中抽取出方面词特征h
a
,以点积注意力的方式与上下文特征h
c
关联生成最后特征。
[0150]
a、数据集和实验参数设置
[0151]
实验采用国际语义评测大会semeval2014任务4中提供的两种公开数据集,分别是顾客关于饭店(restaurant)和笔记本(laptop)的评论文本。数据集中方面词情感极性包括积极(positive)、中性(neural)和消极(negative)三种。实验过程中将两种数据集划分成训练集和测试集,根据情感极性分类统计各数据量如表1所示。
[0152]
表1数据统计表
[0153][0154]
本发明实施例提供的lc

gcn模型在实验过程中,使用300维预训练glove语料库初始化词嵌入矩阵,将bilstm提取的单向隐藏层维度h_dim设置为300。局部上下文中可调整参数α和gcn层数l可能随数据集中数据特征差异而不同,经过实验分析可得具体参数值如表2所示。在模型训练过程中,将数据按每批32条分批训练,将学习率设置为0.001,并采用adam优化器不断优化模型参数。
[0155]
表2参数α和gcn层数设置l
[0156][0157]
b、验证模型分类效果
[0158]
实验采用accuracy和macro

f1两种评价指标来表示模型分类效果。
[0159][0160]
如上式所示,accuracy表示模型预测正确的样本数与总样本数之比,其中t表示预测正确的样本数,n表示总样本数。
[0161][0162][0163][0164]
[0165][0166]
如上式所示,macro

f1由各个类别的f1值表示精确率和召回率的调和平均,其中每个类别中,tp表示预测正样本数,fp表示预测错误正样本数,tn表示预测正确负样本数,fn表示预测错误的负样本数。正如上所述,为了验证本发明实施例提供的lc

gcn模型分类效果的有效性,实验选取gcae模型和asgcn模型两种方面级别情感分析模型进行分析和对比。
[0167]
表3模型分类效果
[0168][0169]
实验结果如表3所示,本发明实施例在两种数据集上的各种指标都处于最优(加粗的数据表示效果最佳),可验证本发明实施例在该任务下的有效性。
[0170]
第二方面,本发明实施例提供了一种基于lc

gcn方面级情感分析系统,包括:
[0171]
词嵌入模块,用于根据待分析的评论上下文,获取词嵌入矩阵,所述评论上下文中至少包括一个方面词;
[0172]
融合模块,用于根据所述词嵌入矩阵,获取融合了上下文语义的隐藏特征向量;
[0173]
第一获取模块,用于根据所述方面词在评论上下文中的局部上下文,获取动态上下文权重矩阵和局部上下文加权邻接图;
[0174]
第二获取模块,用于根据所述隐藏特征向量、动态上下文权重矩阵和局部上下文加权邻接图,采用多层gcn网络获取聚焦于局部上下文信息的方面词特征矩阵,并标记所述方面词特征矩阵;
[0175]
输出模块,用于根据标记后的方面词特征矩阵,获取所述方面词对应的情感极性。
[0176]
第三方面,本发明实施例提供了一种存储介质,其存储有用于基于lc

gcn方面级情感分析的计算机程序,其中,所述计算机程序使得计算机执行如上所述的基于lc

gcn方面级情感分析方法。
[0177]
第四方面,本发明实施例提供了一种电子设备,包括:
[0178]
一个或多个处理器;
[0179]
存储器;以及
[0180]
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如上所述的基于lc

gcn方面级情感分析方法。
[0181]
可理解的是,本发明实施例提供的基于lc

gcn方面级情感分析系统、存储介质和电子设备与本发明实施例提供的基于lc

gcn方面级情感分析方法相对应,其有关内容的解释、举例和有益效果等部分可以参考基于lc

gcn方面级情感分析方法中的相应部分,此处不再赘述。
[0182]
综上所述,与现有技术相比,具备以下有益效果:
[0183]
本发明实施例中待分析的评论上下文至少包括一个方面词;根据评论上下文的词嵌入矩阵,获取融合了上下文语义的隐藏特征向量;根据所述方面词在评论上下文中的局部上下文,获取动态上下文权重矩阵和局部上下文加权邻接图;根据所述隐藏特征向量、动态上下文权重矩阵和局部上下文加权邻接图,采用多层gcn网络获取聚焦于局部上下文信息的方面词特征矩阵,并标记所述方面词特征矩阵;根据标记后的方面词特征矩阵,获取所述方面词对应的情感极性。提出的上下文动态赋权方法,增强了特征提取过程对局部上下文的关注度;构建了融合了上下文句法特征和局部上下文语义信息的邻接图;采用多层图卷积网络(gcn)的方式不断提取聚焦于局部上下文的方面词特征,保证方面词特征矩阵融合局部上下文信息,实现更加准确地挖掘评论文本的各方面情感。
[0184]
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0185]
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1