本发明涉及方面词情感分析,尤其是涉及一种方面词情感分析方法、装置、电子设备及存储介质。
背景技术:
1、在信息爆炸式增长的时代,人们从网络上获取有用信息的难度加大。对评论文本所表达的观点进行自动获取的情感分析技术,通过对文本中的观点、情感、评价和态度进行计算,实现自动化情感识别,能够为获取观点信息带来便利。
2、方面级情感分析(aspect-based sentiment analysis,absa)是情感分析领域的一个细粒度的任务,方面级情感分析包含方面词抽取(aspect term extraction,ate),观点词抽取(opinion term extraction,ote),方面级情感分类(aspect-level sentimentclassification,asc)三部分。其中方面词抽取旨在抽取正确的方面词,观点词抽取旨在抽取正确的观点词,方面级情感分类旨在对给定的方面词的情感极性进行分类,常见的情感极性包含积极(positive)、中性(neutral)、消极(negative)。
3、现有一种基于片段的方面词情感三元组抽取模型span-aste,它采用了基于片段的框架来提取方面词情感三元组。span-aste通过直接对待分析文本进行枚举,以获取方面词和观点词的候选词,然后通过多层感知机(mlp)对候选词进行预测,得到正确的方面词和观点词。然而,这种方法将产生过多的候选方面词和观点词,由此加大了预测正确的方面词和观点词的难度,导致最终的情感分析误差较大。
技术实现思路
1、本发明的目的在于克服现有技术的缺点与不足,提供一种方面词情感分析方法,能够正确提取方面词和观点词,减小情感分析误差。
2、本发明是通过以下技术方案实现的:一种方面词情感分析方法,包括如下步骤:
3、获取待分析文本,计算所述待分析文本中相邻词之间的成分句法距离;
4、若一对相邻词之间的所述成分句法距离大于成分句法阈值,则在该对相邻词之间对所述待分析文本进行切割,得到若干文本片段;
5、针对每一所述文本片段,枚举得到候选词集合;
6、对所述候选词集合中的所有候选词进行词类预测,得到候选方面词和候选观点词;
7、将所述候选方面词与所述候选观点词进行配对,得到候选方面词-观点词对;
8、对所述候选方面词-观点词对进行情感极性预测,得到有效的方面词-观点词对及其情感极性。
9、相对于现有技术,本发明的方面级情感分析方法通过引入待分析文本的成分句法信息来获取候选的方面词和观点词,所获取的候选方面词和观点词更为合理,能够提高方面词和观点词的词类预测的效率和准确性,从而增强方面级情感分析的准确性。
10、进一步地,将所述候选方面词与所述候选观点词进行配对,得到候选方面词-观点词对,包括步骤:
11、计算每一所述候选方面词与每一所述候选观点词之间的依存句法距离;
12、若一对所述候选方面词和所述候选观点词之间的依存句法距离小于依存句法阈值,则将该对候选方面词和候选观点词配对为候选方面词-观点词对。
13、进一步地,对所述候选词集合中的所有候选词进行词类预测,得到候选方面词和候选观点词,包括步骤:
14、计算所述候选词对于每一词类型的概率,确定所有候选词中方面词类型概率最高的n*z1个所述候选词为候选方面词,确定所有候选词中观点词类型概率最高的n*z2个所述候选词为候选观点词;其中,n为待分析文本所包含的单词数,z1、z2为可调节的超参数。
15、进一步地,通过第一多层感知机对所述候选词集合中的所有候选词进行词类预测,通过第二多层感知机对所述候选方面词-观点词对进行的情感极性预测;
16、对所述第一多层感知机和所述第二多层感知机进行训练的目标函数为第一多层感知机的负对数似然和第二多层感知机的负对数似然之和。
17、基于同一发明构思,本发明还提供一种方面词情感分析装置,包括:
18、成分句法距离计算模块,用于获取待分析文本,计算所述待分析文本中相邻词之间的成分句法距离;
19、文本切割模块,用于若一对相邻词之间的所述成分句法距离大于成分句法阈值,则在该对相邻词之间对所述待分析文本进行切割,得到若干文本片段;
20、候选词枚举模块,用于针对每一所述文本片段,枚举得到候选词集合;
21、词类预测模块,用于对所述候选词集合中的所有候选词进行词类预测,得到候选方面词和候选观点词;
22、配对模块,用于将所述候选方面词与所述候选观点词进行配对,得到候选方面词-观点词对;
23、情感极性预测模块,用于对所述候选方面词-观点词对进行情感极性预测,得到有效的方面词-观点词对及其情感极性。
24、进一步地,所述配对模块包括:
25、依存句法距离计算子模块,用于计算每一所述候选方面词与每一所述候选观点词之间的依存句法距离;
26、候选方面词观点词配对子模块,用于若一对所述候选方面词和所述候选观点词之间的依存句法距离小于依存句法阈值,则将该对候选方面词和候选观点词配对为候选方面词-观点词对。
27、进一步地,所述词类预测模块包括:
28、概率预测子模块,用于计算所述候选词对于每一词类型的概率,确定所有候选词中方面词类型概率最高的n*z1个所述候选词为候选方面词,确定所有候选词中观点词类型概率最高的n*z2个所述候选词为候选观点词;其中,n为待分析文本所包含的单词数,z1、z2为可调节的超参数。
29、进一步地,通过第一多层感知机对所述候选词集合中的所有候选词进行词类预测,通过第二多层感知机对所述候选方面词-观点词对进行的情感极性预测;
30、还包括训练模块,所述训练模块用于对所述第一多层感知机和所述第二多层感知机进行训练的目标函数为第一多层感知机的负对数似然和第二多层感知机的负对数似然之和。
31、基于同一发明构思,本发明还提供一种电子设备,包括:
32、处理器;
33、存储器,用于存储由所述处理器执行的计算机程序;
34、其中,所述处理器执行所述计算机程序时实现上述方法的步骤。
35、基于同一发明构思,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被执行时实现上述方法的步骤。
36、为了更好地理解和实施,下面结合附图详细说明本发明。
1.一种方面词情感分析方法,其特征在于,包括如下步骤:
2.根据权利要求1所述方法,其特征在于,将所述候选方面词与所述候选观点词进行配对,得到候选方面词-观点词对,包括步骤:
3.根据权利要求1所述的方法,其特征在于,对所述候选词集合中的所有候选词进行词类预测,得到候选方面词和候选观点词,包括步骤:
4.根据权利要求1所述的方法,其特征在于:通过第一多层感知机对所述候选词集合中的所有候选词进行词类预测,通过第二多层感知机对所述候选方面词-观点词对进行的情感极性预测;
5.一种方面词情感分析装置,其特征在于,包括:
6.根据权利要求5所述的装置,其特征在于,所述配对模块包括:
7.根据权利要求5所述的装置,其特征在于,所述词类预测模块包括:
8.根据权利要求5所述的装置,其特征在于:通过第一多层感知机对所述候选词集合中的所有候选词进行词类预测,通过第二多层感知机对所述候选方面词-观点词对进行的情感极性预测;
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被执行时实现权利要求1-4中任一项所述方法的步骤。