一种情感词典构建方法及系统与流程

文档序号:18740720发布日期:2019-09-21 01:44阅读:来源:国知局

技术特征:

1.一种情感词典构建方法,其特征在于,包括以下步骤:

将单个语句的文本语料分割为若干个词;

将分割出的每一个词输入情感识别模型中,输出得到每个词的权重和整个语句的情感概率值;

将每个词的权重与整个语句的情感概率值相乘,分别得到每个词的情感分数,将情感分数大于等于设定阈值的词作为情感词加入情感词典中。

2.根据权利要求1所述的方法,其特征在于,所述情感识别模型基于Self-Attention机制完成情感识别。

3.根据权利要求2所述的方法,其特征在于,所述情感识别模型通过以下步骤训练得到:

S101,对单个语句的文本语料进行人工标注,并将标注后的文本语料按照一定比例划分为训练集和测试集;

S102,将训练集和测试集中的各个语句分别分割为若干个词;

S103,初始化情感识别模型的参数,将全部训练集输入初始情感识别模型中进行训练;

S104,将全部测试集输入经步骤S103训练得到的情感识别模型进行预测,并根据预测结果进行损失计算,若损失变化大于设定阈值,则优化模型的参数,并返回步骤S103,循环执行步骤S103~S104;若损失变化小于设定阈值,则训练结束。

4.一种情感词构建系统,其特征在于,包括以下模块:

分词模块,用于对文本语料进行分词,将单个语句分割为若干个词;

情感识别模块,用于将分割出的每一个词输入情感识别模型中,输出得到每个词的权重和整个语句的情感概率值;

词典构建模块,用于将每个词的权重与整个语句的情感概率值相乘,分别得到每个词的情感分数,将情感分数大于等于设定阈值的词作为情感词加入情感词典中。

5.根据权利要求4所述的系统,其特征在于,所述情感识别模块还用于通过机器学习训练得到所述情感识别模型。

6.一种包括计算机可读指令的计算机可读存储介质,其特征在于,所述计算机可读指令在被执行时使处理器执行权利要求1-3任一所述方法中的操作。

7.一种电子设备,其特征在于,所述的设备包括:

存储器,存储程序指令;

处理器,与所述存储器相连接,执行存储器中的程序指令,实现权利要求1-3任一所述方法中的步骤。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1