基于用户评价的推荐理由生成方法与流程

文档序号:12464661阅读:1105来源:国知局

本发明属于信息处理技术领域,尤其涉及一种基于用户评价的推荐理由生成方法。



背景技术:

随着信息化服务在社会各个领域迅速发展,各种服务平台也逐渐被人们广泛的接受,用户在使用服务过程中,也会对这个服务进行评价,评价里包含各种具有情感含义的表情、缩略语、以及简短、口语化、出现拼写错误等各种情况,计算机如何有效的从这种不确定的评价中得到基于正面的评价、并从中分析得出一个推荐的理由给用户,而且应该是来源于评价、且具有简短的口语化等特点,供用户快速的了解这个服务,这成了一个技术难题。

传统的文本情感分析,常用的进行词意进行按照褒义、贬义、中立等进行特征分析,并以频率作为权重指标。这种从情感词汇向量的角度作为切入点,以词频的情感分析适合普通的文本分类模型,而情感分析需要从这些不规则的文本中,进行语句分析、考虑主谓宾等句型、句式等特点。



技术实现要素:

本发明的发明目的是:为了解决现有技术中存在的以上问题,本发明提出了一种针对评价数据的特点提高情感分析后推荐理由的准确性的基于用户评价的推荐理由生成方法。

本发明的技术方案是:一种基于用户评价的推荐理由生成方法,包括:

A、提取用户对服务的评价数据,将评价数据分割为若干个短句数据保存至数据库中;

B、从步骤A中的数据库中随机抽取若干条短句数据建立训练集,对训练集中的短句数据进行词性分析生成训练结果;

C、从步骤A中的数据库中随机抽取若干条短句数据建立测试集,利用步骤B中的训练结果对测试集中的短句数据进行分析生成测试结果;

D、根据步骤C中的测试结果对测试集中的短句数据进行拼接,生成推荐理由。

进一步地,所述步骤A中将评价数据分割为若干个短句数据具体为将评价数据按照符号进行分割,形成若干个短句数据。

进一步地,所述步骤B中训练结果具体为:对训练集中的短句数据进行情感分类并生成标注值;其中标注值为负数时表示负面情感、标注值为正数时表示正面情感、标注值为0时表示中立词。

进一步地,所述步骤B中对训练集中的短句数据进行情感分类具体为采用归类算法对短句数据进行情感分类。

进一步地,所述步骤B还包括对生成的标注值进行修正生成修正标注值,再采用归类算法对训练集中的短句数据进行情感分类生成二次标注值。

进一步地,所述步骤D中对测试集中的短句数据进行拼接具体为采用主谓宾语法结构再生成方式对测试集中的短句数据进行拼接。

本发明的有益效果是:本发明针对评价数据的特点,分别建立训练集和测试集,利用训练集对评价数据进行情感分析后对测试集进行处理,从而生成推荐理由,大大提高了基于情感分析后的推荐理由的准确性。

附图说明

图1是本发明的基于用户评价的推荐理由生成方法流程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

图1是本发明的基于用户评价的推荐理由生成方法流程示意图。一种基于用户评价的推荐理由生成方法,包括:

A、提取用户对服务的评价数据,将评价数据分割为若干个短句数据保存至数据库中;

B、从步骤A中的数据库中随机抽取若干条短句数据建立训练集,对训练集中的短句数据进行词性分析生成训练结果;

C、从步骤A中的数据库中随机抽取若干条短句数据建立测试集,利用步骤B中的训练结果对测试集中的短句数据进行分析生成测试结果;

D、根据步骤C中的测试结果对测试集中的短句数据进行拼接,生成推荐理由。

在步骤A中,本发明根据服务的序列号,通过jdbc并使用java编程的方式提取出互联网上针对这个服务发布的所有用户的评价数据;再利用断句分析器对这个服务的所有用户的评价数据按符号进行断成若干短句保存到数据库中。这里的符号包括“。||\\.|\\.|!|\\||?|~|;|,|'|~|;|……|,”。

在步骤B中,本发明从步骤A中的数据库保持的短句数据中随机抽取若干条短句数据建立训练集,优选地,本发明随机抽取500条短句数据;再采用归类算法对随机抽取的500条短句数据的词性按照“中性”、“贬义”、“褒义”进行情感分类,并生成标注值,形成训练结果;这里的标注值分别表示为0、-99、99,其中标注值为负数时表示负面情感、标注值为正数时表示正面情感、标注值为0时表示中立词。

为了提高通过对训练集进行训练生成的训练结果的准确性,本发明还包括对生成的标注值进行修正生成修正标注值,再采用归类算法对训练集中的短句数据进行情感分类生成二次标注值。这里对生成的标注值进行修正可以采用人工介入查看训练集并进行人工修正的方式。

在步骤C中,本发明从步骤A中的数据库保持的短句数据中随机抽取若干条短句数据建立测试集,优选地,本发明随机抽取500条短句数据;再利用步骤B中的训练结果对测试集中的短句数据进行情感分析生成标注,形成测试结果。

在步骤D中,本发明根据步骤C中的测试结果对测试集中的短句数据进行拼接,具体为采用主谓宾语法结构再生成方式对测试集中的短句数据进行拼接,从而生成推荐理由。

本发明针对评价数据的特点,分别建立训练集和测试集,利用训练集对评价数据进行情感分析后对测试集进行处理,从而生成推荐理由,大大提高了基于情感分析后的推荐理由的准确性。

本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1