一种融合句法信息和特征交互的情感分析方法及装置

文档序号:34862362发布日期:2023-07-23 11:48阅读:86来源:国知局
一种融合句法信息和特征交互的情感分析方法及装置

本发明涉及文本预测领域,特别是涉及文本极性预测领域。


背景技术:

1、情感分析目前是自然语言处理领域重要的领域之一,其旨在对用户的文本、语音等信息进行分析,从而得到用户当时的情感倾向。目前情感分析主要还是基于文本的层次上进行的,围绕这一基础,目前有两类情感分析模型:基于传统机器学习的模型与基于深度学习的模型。

2、基于深度学习的情感分析模型分为:基于注意力机制的序列模型、基于句法信息的模型。其中,基于句法信息的模型主要是以提取文本中的句法信息为主,进而分析文本关键词的情感极性。此类模型的优点就是考虑了文本的句法信息并尝试提取到模型中,相比于基于注意力的方法有一定程度上的提升,此类方法首先需要构造文本的句法分析树,然后再使用相关图神经网络进行句法信息的提取。在此过程中,构造句法分析树的正确与否至关重要,目前不同的句法分析树构建工具会出现构建出不一致的句法分析树,从而导致模型提取出的信息有相当大的差异,在句法依赖树构造工具上仍需要一定程度的改进研究。并且不同的图神经网络不同的模型结构都会产生对这些句法分析树的特征提取能力不一的现象,从而基于句法信息的模型在情感分析上仍有一定的局限性,导致预测结果准确性不高。


技术实现思路

1、基于此,本发明的目的在于,提供一种融合句法信息和特征交互的情感分析方法及装置,通过结合局部输入文本构建依赖矩阵,再将文本输入与依赖矩阵进行特征交互,充分提取文本信息,从而提高了文本极性预测的准确度。

2、本技术是通过如下技术方案实现的:

3、一方面,本技术提供一种融合句法信息和特征交互的情感分析方法,其包括:

4、获取用户文本数据,并对用户文本数据进行预处理,得到用户文本的局部输入和用户文本的全局输入;

5、将所述局部输入进行编码和局部上下文聚焦,得到局部特征矩阵;

6、根据所述局部输入构建依赖解析树,得到依赖矩阵;

7、将所述全局输入进行编码得到全局特征向量;

8、将所述全局特征向量与局部特征矩阵进行矩阵相乘得到第一临时向量;

9、将所述全局特征向量与依赖矩阵进行矩阵相乘得到第二临时向量;

10、将所述第一临时向量进行编码,得到第一临时特征向量;

11、将所述第二临时向量进行编码,得到第二临时特征向量;

12、将所述第一临时特征向量和所述第二临时特征向量拼接后进行特征交互,得到全局特征表示;

13、将所述局部特征矩阵和所述依赖矩阵进行拼接,得到局部特征表示;

14、将所述全局特征表示和局部特征表示进行相加后进行线性处理,池化处理得到文本的情感极性预测结果。

15、进一步地,局部的文本通过如下方式进行拼接:

16、wl={[cls]+[raw]+[sep]+aspect+[sep]}

17、全局的文本通过如下方式进行拼接:

18、wg={[cls]+[raw]+[sep]}

19、其中[cls]、[sep]为模型输入的特定标识符,[raw]为用户文本中的一段文本数据,aspect为样本中的需要预测的方面词。

20、进一步地,在分别对用户文本的局部输入和用户文本的全局输入进行编码后,还包括分别将局部输入和全局输入进行归一化处理。

21、进一步地,将所述局部特征向量经过局部上下文聚焦得到局部特征矩阵具体为:

22、判断局部特征向量的局部上下文范围,当局部上下文范围小于等于设定阈值时,局部特征向量采用cdm策略生成局部特征矩阵;

23、当局部上下文范围大于设定阈值时,局部特征向量采用cdw策略生成局部特征矩阵。

24、进一步地,所述cdm策略的具体计算公式为:

25、

26、

27、

28、其中vi是输入序列中每个词的值处理方式,e表示1,o表示0,a是该词距离方面词的距离长度,是每条输入转成的向量表示,是局部特征向量,cdm则是与相乘之后得到的矩阵,synrd为预设阈值。

29、进一步地,所述cdw策略的具体计算公式为:

30、

31、

32、

33、其中vi是输入序列中每个词的值处理方式,e表示1,a是该词距离方面词的距离长度,n表示输入文本长度,是每条输入序列转成的向量表示,cdw则是与相乘之后得到的矩阵,synrd为预设阈值。

34、进一步地,将所述全局特征表示和局部特征表示进行相加后进行线性处理,池化处理得到文本的情感极性预测结果具体包括:

35、将全局特征表示与局部特征表示进行相加,再通过一个线性处理得到融合了局部特征表示与全局特征表示的新矩阵;

36、通过池化处理进行特征提炼,并将得到的结果作为文本情感极性的预测结果。

37、进一步地,池化处理进行特征提炼,并将得到的结果作为文本情感极性的预测结果是通过如下公式实现的:

38、opool=pool(featurelg)

39、sentiment=argmax(opool·wo+bo)

40、其中bo∈r3×1,dh为模型默认维度。得到sentiment分类结果,有-1,0,1三类结果,-1代表消极,0代表中立,1代表积极。

41、另一方面,本技术还提供一种融合句法信息和特征交互的情感分析装置,其包括:文本预处理模块:用于获取用户文本数据,并对用户文本数据进行预处理,得到用户文本的局部输入和用户文本的全局输入;

42、局部输入聚焦模块:用于将所述局部输入进行编码和局部上下文聚焦,得到局部特征矩阵;

43、全局输入编码模块:用于将所述全局输入进行编码得到全局特征向量;

44、依赖矩阵构建模块:用于根据所述局部输入构建依赖解析树,得到依赖矩阵;

45、第一全局特征交互子模块:用于将所述全局特征向量与局部特征矩阵进行矩阵相乘得到第一临时向量;

46、第二全局特征交互子模块:用于将所述全局特征向量与依赖矩阵进行矩阵相乘得到第二临时向量;

47、第一临时特征向量获取子模块:用于将所述第一临时向量进行编码,得到第一临时特征向量;

48、第二临时特征向量获取子模块:用于将所述第二临时向量进行编码,得到第二临时特征向量;

49、全局特征表示获取模块:用于将所述第一临时特征向量和所述第二临时特征向量拼接后进行特征交互,得到全局特征表示;

50、局部特征表示获取模块:用于将所述局部特征矩阵和所述依赖矩阵进行拼接,得到局部特征表示;

51、极性预测模块:用于将所述全局特征表示和局部特征表示进行相加后进行线性处理,池化处理得到文本极性预测结果。

52、进一步地,所述文本编码模块包括归一化子模块:用于分别将局部输入和全局输入进行归一化处理。

53、本技术提供一种融合句法信息和特征交互的情感分析方法及装置,其通过将双通道对输入的全局文本和局部文本进行编码,其中局部通道的文本输入会进行句法依赖树的构造,由此得到的矩阵会复制一份作为特征交互的两部分之一与全局特征向量进行交互,另一份通过图注意力神经网络进行提取,此方式能较好地提取出文本蕴含的句法信息。另外,局部通道经过bert的嵌入层得到的向量,经过局部上下文聚焦机制之后得到的向量,作为特征交互的另外一部分与全局特征进行交互之后将两部分的向量进行相加,能很好地保留文本的信息特征。从而提高文本极性预测的准确度。

54、为了更好地理解和实施,下面结合附图详细说明本发明。

55、附图说明

56、图1为本技术提供的一种融合句法信息和特征交互的情感分析方法的流程图;

57、图2为本技术提供的一种一种融合句法信息和特征交互的情感分析装置的结构框图。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1