基于用户评价的推荐理由生成方法与流程

文档序号：12464661阅读：1105来源：国知局

本发明属于信息处理技术领域，尤其涉及一种基于用户评价的推荐理由生成方法。

背景技术：

随着信息化服务在社会各个领域迅速发展，各种服务平台也逐渐被人们广泛的接受，用户在使用服务过程中，也会对这个服务进行评价，评价里包含各种具有情感含义的表情、缩略语、以及简短、口语化、出现拼写错误等各种情况，计算机如何有效的从这种不确定的评价中得到基于正面的评价、并从中分析得出一个推荐的理由给用户，而且应该是来源于评价、且具有简短的口语化等特点，供用户快速的了解这个服务，这成了一个技术难题。

传统的文本情感分析，常用的进行词意进行按照褒义、贬义、中立等进行特征分析，并以频率作为权重指标。这种从情感词汇向量的角度作为切入点，以词频的情感分析适合普通的文本分类模型，而情感分析需要从这些不规则的文本中，进行语句分析、考虑主谓宾等句型、句式等特点。

技术实现要素：

本发明的发明目的是：为了解决现有技术中存在的以上问题，本发明提出了一种针对评价数据的特点提高情感分析后推荐理由的准确性的基于用户评价的推荐理由生成方法。

本发明的技术方案是：一种基于用户评价的推荐理由生成方法，包括：

A、提取用户对服务的评价数据，将评价数据分割为若干个短句数据保存至数据库中；

B、从步骤A中的数据库中随机抽取若干条短句数据建立训练集，对训练集中的短句数据进行词性分析生成训练结果；

C、从步骤A中的数据库中随机抽取若干条短句数据建立测试集，利用步骤B中的训练结果对测试集中的短句数据进行分析生成测试结果；

D、根据步骤C中的测试结果对测试集中的短句数据进行拼接，生成推荐理由。

进一步地，所述步骤A中将评价数据分割为若干个短句数据具体为将评价数据按照符号进行分割，形成若干个短句数据。

进一步地，所述步骤B中训练结果具体为：对训练集中的短句数据进行情感分类并生成标注值；其中标注值为负数时表示负面情感、标注值为正数时表示正面情感、标注值为0时表示中立词。

进一步地，所述步骤B中对训练集中的短句数据进行情感分类具体为采用归类算法对短句数据进行情感分类。

进一步地，所述步骤B还包括对生成的标注值进行修正生成修正标注值，再采用归类算法对训练集中的短句数据进行情感分类生成二次标注值。

进一步地，所述步骤D中对测试集中的短句数据进行拼接具体为采用主谓宾语法结构再生成方式对测试集中的短句数据进行拼接。

本发明的有益效果是：本发明针对评价数据的特点，分别建立训练集和测试集，利用训练集对评价数据进行情感分析后对测试集进行处理，从而生成推荐理由，大大提高了基于情感分析后的推荐理由的准确性。

附图说明

图1是本发明的基于用户评价的推荐理由生成方法流程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

图1是本发明的基于用户评价的推荐理由生成方法流程示意图。一种基于用户评价的推荐理由生成方法，包括：

A、提取用户对服务的评价数据，将评价数据分割为若干个短句数据保存至数据库中；

B、从步骤A中的数据库中随机抽取若干条短句数据建立训练集，对训练集中的短句数据进行词性分析生成训练结果；

C、从步骤A中的数据库中随机抽取若干条短句数据建立测试集，利用步骤B中的训练结果对测试集中的短句数据进行分析生成测试结果；

D、根据步骤C中的测试结果对测试集中的短句数据进行拼接，生成推荐理由。

在步骤A中，本发明根据服务的序列号，通过jdbc并使用java编程的方式提取出互联网上针对这个服务发布的所有用户的评价数据；再利用断句分析器对这个服务的所有用户的评价数据按符号进行断成若干短句保存到数据库中。这里的符号包括“。||\\.|\\.|！|\\||？|～|；|，|'|～|；|……|,”。

在步骤B中，本发明从步骤A中的数据库保持的短句数据中随机抽取若干条短句数据建立训练集，优选地，本发明随机抽取500条短句数据；再采用归类算法对随机抽取的500条短句数据的词性按照“中性”、“贬义”、“褒义”进行情感分类，并生成标注值，形成训练结果；这里的标注值分别表示为0、-99、99，其中标注值为负数时表示负面情感、标注值为正数时表示正面情感、标注值为0时表示中立词。

为了提高通过对训练集进行训练生成的训练结果的准确性，本发明还包括对生成的标注值进行修正生成修正标注值，再采用归类算法对训练集中的短句数据进行情感分类生成二次标注值。这里对生成的标注值进行修正可以采用人工介入查看训练集并进行人工修正的方式。

在步骤C中，本发明从步骤A中的数据库保持的短句数据中随机抽取若干条短句数据建立测试集，优选地，本发明随机抽取500条短句数据；再利用步骤B中的训练结果对测试集中的短句数据进行情感分析生成标注，形成测试结果。

在步骤D中，本发明根据步骤C中的测试结果对测试集中的短句数据进行拼接，具体为采用主谓宾语法结构再生成方式对测试集中的短句数据进行拼接，从而生成推荐理由。

本发明针对评价数据的特点，分别建立训练集和测试集，利用训练集对评价数据进行情感分析后对测试集进行处理，从而生成推荐理由，大大提高了基于情感分析后的推荐理由的准确性。

本领域的普通技术人员将会意识到，这里所述的实施例是为了帮助读者理解本发明的原理，应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合，这些变形和组合仍然在本发明的保护范围内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：唐雪飞;杨炜林;贾俊德
技术所有人：成都康赛信息技术有限公司
我是此专利的发明人

上一篇：一种基于深度图像的物体测量方法与流程
上一篇：基于广义相移数字全息的微小位移测量方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。