一种评论数据的处理方法及处理装置与流程

文档序号：12465335阅读：来源：国知局

技术特征：

1.一种评论数据的处理方法，其特征在于，包括：

获取情感倾向已知的样本评论语句；

计算所述样本评论语句的句向量；

利用所述样本评论语句的句向量与所述样本评论语句的情感倾向对基于学习的分类器进行训练，得到情感分类器；

利用所述情感分类器对待测评论语句的情感倾向进行预测。

2.根据权利要求1所述的评论数据的处理方法，其特征在于，所述情感倾向包括第一情感、第二情感和第三情感；

所述情感分类器包括第一情感模型、第二情感模型和第三情感模型，所述第一情感模型用于计算所述待测评论语句的情感倾向为第一情感的第一概率，所述第二情感模型用于计算所述待测评论语句的情感倾向为第二情感的第二概率，所述第三情感模型用于计算所述待测评论语句的情感倾向为第三情感的第三概率。

3.根据权利要求2所述的评论数据的处理方法，其特征在于，利用所述样本评论语句的句向量与所述样本评论语句的情感倾向对基于学习的分类器进行训练得到所述第一情感模型，包括：

判断所述样本评论语句的情感倾向是否为第一情感；

若是，则将所述样本评论语句的句向量加入预建的所述第一情感模型的第一集合；

若否，则将所述样本评论语句的句向量加入预建的所述第一情感模型的第二集合；

利用所述第一集合和所述第二集合进行二分类训练建模，得到所述第一情感模型；

利用所述第一情感模型对待测评论语句的情感倾向进行预测包括：

利用所述第一情感模型计算所述待测评论语句的句向量属于所述第一情感模型的第一集合的概率。

4.根据权利要求3所述的评论数据的处理方法，其特征在于，利用所述情感分类器对待测评论语句的情感倾向进行预测包括：

分别利用所述第一情感模型、所述第二情感模型和所述第三情感模型对所述待测评论语句的情感倾向进行预测，得到第一概率、第二概率和第三概率；

确定所述第一概率、所述第二概率和所述第三概率中取值最大的概率对应的情感模型为目标情感模型；

确定所述目标情感模型对应的情感倾向为所述待测评论语句的情感倾向。

5.根据权利要求1至4中任一项所述的评论数据的处理方法，其特征在于，所述计算所述样本评论语句的句向量包括：

对所述样本评论语句进行分词，得到样本词集合；

利用基于Word2Vec的神经网络计算所述样本词集合中的样本词的词向量，得到所述样本评论语句对应的样本词向量集合；

计算所述样本词向量集合的中心向量，作为所述样本评论语句的句向量。

6.一种评论数据的处理装置，其特征在于，包括：

获取模块，用于获取情感倾向已知的样本评论语句；

计算模块，用于计算所述样本评论语句的句向量；

训练模块，用于利用所述样本评论语句的句向量与所述样本评论语句的情感倾向对基于学习的分类器进行训练，得到情感分类器；

预测模块，用于利用所述情感分类器对待测评论语句的情感倾向进行预测。

7.根据权利要求6所述的评论数据的处理装置，其特征在于，所述情感倾向包括第一情感、第二情感和第三情感；

8.根据权利要求7所述的评论数据的处理装置，其特征在于，所述训练模块包括第一训练子模块，所述第一训练子模块用于利用所述样本评论语句的句向量与所述样本评论语句的情感倾向对基于学习的分类器进行训练得到所述第一情感模型，所述第一训练子模块包括：

判断单元，用于判断所述样本评论语句的情感倾向是否为第一情感；

第一添加单元，用于当所述判断单元判定所述样本评论语句的情感倾向是第一情感时，将所述样本评论语句的句向量加入预建的所述第一情感模型的第一集合；

第二添加单元，用于当所述判断单元判定所述样本评论语句的情感倾向不是第一情感时，将所述样本评论语句的句向量加入预建的所述第一情感模型的第二集合；

建模单元，用于利用所述第一集合和所述第二集合进行二分类训练建模，得到所述第一情感模型；

所述预测模块包括第一预测单元，用于利用所述第一情感模型对待测评论语句的情感倾向进行预测，所述第一预测单元包括：

计算子单元，用于利用所述第一情感模型计算所述待测评论语句的句向量属于所述第一情感模型的第一集合的概率。

9.根据权利要求8所述的评论数据的处理装置，其特征在于，所述预测模块包括：

预测子模块，用于分别利用所述第一情感模型、所述第二情感模型和所述第三情感模型对所述待测评论语句的情感倾向进行预测，得到第一概率、第二概率和第三概率，所述预测单元包括所述第一预测子单元；

第一确定子模块，用于确定所述第一概率、所述第二概率和所述第三概率中取值最大的概率对应的情感模型为目标情感模型；

第二确定子模块，用于确定所述目标情感模型对应的情感倾向为所述待测评论语句的情感倾向。

10.根据权利要求6至9中任一项所述的评论数据的处理装置，其特征在于，所述计算模块包括：

分词子模块，用于对所述样本评论语句进行分词，得到样本词集合；

第一计算子模块，用于利用基于Word2Vec的神经网络计算所述样本词集合中的样本词的词向量，得到所述样本评论语句对应的样本词向量集合；

第二计算子模块，用于计算所述样本词向量集合的中心向量，作为所述样本评论语句的句向量。

完整全部详细技术资料下载

当前第2页1 2 3