一种简单的情感知识增强提示调优的方面级情感分类方法

文档序号:34612259发布日期:2023-06-29 08:05阅读:60来源:国知局
一种简单的情感知识增强提示调优的方面级情感分类方法

本发明属于人工智能的自然语言处理领域,特别是涉及一种简单的情感知识增强提示调优的方面级情感分类方法。


背景技术:

1、方面级情感分类是目前最细粒度的分类方法,可以针对文本中各个方面对象,确定每个方面词所表达的情感信息,通常将情感分为三类,积极、消极和中性。方面级情感分类在消费者口碑分析,社交媒体,事件走向预测,舆情监控,以及用户兴趣挖掘领域有着广泛的应用。

2、一般来说,大多数方面级情感分类的解决方案可以分为基于神经网络和预训练语言模型的方法。基于神经网络的方法试图构建各种复杂的特征提取器来提取数据本身的语义特征(例如,卷积神经网络、递归神经网络和图形卷积网络)。基于图卷积网络的模型除了提取语义特征外,还结合句子依赖树提取了语法特征(句子结构信息)。尽管这些方法很有效,但它们利用的是数据集本身的特征,并且需要更多的监督数据来进行训练。与之不同的是,基于预训练语言模型的方法可以充分利用大规模数据集丰富的知识。这类方法通过让预训练语言模型在目标数据集上进行微调的方式取得不错的效果,但预训练目标和下游任务之间存在一定差距,需要大量的监督数据微调,成本很高。而在许多实际情况下,准确的标记数据是稀缺的,需要密集的人力劳动。最近,提示调优受到了很多的关注,并在低数据场景中显示出了巨大的优势。

3、对于分类任务来说,应用提示调优方法的最关键步骤是为类别标签和特定类别的词(标签词)之间的映射关系定义一个映射表达器。

4、一些现有的工作试图通过构建手动或自动映射表达器来提高提示调优性能。手动映射表达器是使用人工筛选的合适的词(单个标签词或多个标签词)来表示类别标签。而自动映射表达器是通过离散搜索或梯度下降的方式来学习标签词。在样本稀缺的情况下,自动构建映射表达器需要训练样本不断学习,手动映射表达器仍然占主导地位。其中,将外部情感知识整合到映射表达器中增加标签词覆盖范围的方法取得了卓越的效果。然而,目前可用的情感词只包含积极和消极的情绪,导致只能分两级,对于方面级别三极情感分类任务来说,缺乏中性情感词。此外,也缺乏与下游任务相关的领域内情感词来提升预测性能。

5、综上所述,现存的技术问题是:目前基于提示调优的方面级情感分类方法缺乏一个全面的适合三极分类的情感词库来扩展提示调优中情感标签词的覆盖范围,从而使得预测存在偏差。因此,亟需提出一种简单的情感知识增强提示调优的方面级情感分类方法。


技术实现思路

1、本发明的目的是提供一种简单的情感知识增强提示调优的方面级情感分类方法,将情感知识融入映射表达器增强提示调优的框架,以解决上述现有技术存在的问题。

2、为实现上述目的,本发明提供了一种简单的情感知识增强提示调优的方面级情感分类方法,包括以下步骤:

3、构建提示模板,将所述提示模板和待分类文本输入到预训练语言模型中进行预测,获得待分类文本对应的若干个词的预测概率;

4、构建情感知识映射表达器,并对所述情感知识映射表达器中的若干个情感标签词进行优化,获得优化后的情感标签词;

5、基于所述若干个词的预测概率,获得优化后的情感标签词的预测概率;

6、通过所述情感知识映射表达器将所述优化后的情感标签词的预测概率映射到类别标签,获得类别标签的最终预测概率。

7、可选地,构建情感知识映射表达器的过程包括:从用于三元组情感分类任务的数据集中提取积极情感、中性情感和消极情感的情感标签词,并分别获取所述情感标签词的词频并排序,基于词频排序结果,为不同的情感标签词设置对应的阈值,获得领域内的情感标签词;之后从二元情感词典中继续提取积极情感和消极情感的情感标签词,以及基于关键词搜索获得中性情感的情感标签词,进而获得域外的情感标签词,完成情感知识映射表达器的构建。

8、可选地,对所述情感知识映射表达器中的若干个情感标签词进行优化的过程包括:对所述情感标签词进行情感倾向性优化、学习向量量化优化、可学习的权值优化和小样本先验优化。

9、可选地,对所述情感标签词进行情感倾向性优化的过程包括:对所述情感标签词进行去重处理后,基于社交媒体情感分析工具获取情感标签词的类别,并基于词性识别工具处理无情感倾向的情感标签词。

10、可选地,对所述情感标签词进行学习向量量化优化的过程包括:基于学习向量量化构造情感标签词不同类别的原型向量,对属于相同类别的情感标签词进行聚类。

11、可选地,对所述情感标签词进行可学习的权值优化的过程包括:为每一个情感标签词分配一个可学习的权值,将所有可学习的权值构成一个向量并进行归一化处理,优化每一个情感标签词所占的权重。

12、可选地,对所述情感标签词进行小样本先验优化的过程包括:预设抽取比例,基于所述抽取比例从训练集中获取若干个例子并去除标签,获得测试集,基于所述测试集,获得每一个情感标签词的先验概率并进行排序,去除不符合预设概率的情感标签词。

13、可选地,获得类别标签的最终预测概率的过程包括:当在零样本场景中,假设所述优化后的情感标签词对于相应的类别预测的贡献相同,将优化后的情感标签词的平均值作为类别标签的最终预测概率;当在小样本场景中,将优化后的情感标签词的加权平均值作为类别标签的最终预测概率。

14、本发明的技术效果为:

15、本发明提出了情感知识增强提示调优用于方面级情感分类的方法,通过引入外部知识来提高情感标签词的语义表达能力,同时减少了由单个标签词引起的偏差。

16、本发明构建了一个完整的情感词库适合方面级别的三极分类任务,包含领域内外的积极、消极和中性的情感词。

17、本发明提出了处理含噪声情感知识的通用优化方法,使用规则组合就可以达到优化分类的目的。



技术特征:

1.一种简单的情感知识增强提示调优的方面级情感分类方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的简单的情感知识增强提示调优的方面级情感分类方法,其特征在于,

3.根据权利要求1所述的简单的情感知识增强提示调优的方面级情感分类方法,其特征在于,

4.根据权利要求3所述的简单的情感知识增强提示调优的方面级情感分类方法,其特征在于,

5.根据权利要求3所述的简单的情感知识增强提示调优的方面级情感分类方法,其特征在于,

6.根据权利要求3所述的简单的情感知识增强提示调优的方面级情感分类方法,其特征在于,

7.根据权利要求3所述的简单的情感知识增强提示调优的方面级情感分类方法,其特征在于,

8.根据权利要求1所述的简单的情感知识增强提示调优的方面级情感分类方法,其特征在于,


技术总结
本发明公开了一种简单的情感知识增强提示调优的方面级情感分类方法,属于人工智能的自然语言处理领域,包括以下步骤:构建提示模板,将所述提示模板和待分类文本输入到预训练语言模型中进行预测,获得待分类文本对应的若干个词的预测概率;构建情感知识映射表达器,并对所述情感知识映射表达器中的若干个情感标签词进行优化,获得优化后的情感标签词;基于所述若干个词的预测概率,获得优化后的情感标签词的预测概率;通过所述情感知识映射表达器将所述优化后的情感标签词的预测概率映射到类别标签,获得类别标签的最终预测概率。本发明通过引入外部情感词库来提高情感标签词的语义表达能力,同时减少了由单个情感标签词引起的偏差。

技术研发人员:徐昊,赵玉杰,谷雪,玄昶,宋瑞,石立达
受保护的技术使用者:吉林大学
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1