一种兼顾多样性和有效性的评论排序和筛选方法

文档序号:10594092阅读:1131来源:国知局
一种兼顾多样性和有效性的评论排序和筛选方法
【专利摘要】本发明涉及一种兼顾多样性和有效性的评论排序和筛选方法,具体为:①从待排序评论集中提取评论目标的特征集。②依次对待排序评论集中的每一条评论进行处理,得到每条评论中涉及的特征数。③对待排序评论集根据特征进行聚类,使每条评论归属到一个特征类别中。④在每个聚类中,按照评论涉及的评论数由高到低的顺序,对该聚类中的评论进行排序。⑤设定选取数量为m,从每个聚类中选取前n为聚类数。然后,将选取出来的条评论,按照评论涉及的评论数由高到低的顺序重新排序并展示。本发明方法使评论列表排序效果更符合人类认知,能够优先输出对其他用户更有帮助的列表排序,而且兼顾评论内容的全面性。
【专利说明】
-种兼顾多样性和有效性的评论排序和筛选方法
技术领域
[0001] 本发明设及一种兼顾多样性和有效性的评论排序和筛选方法,属于计算机应用技 术领域。
【背景技术】
[0002] 评论数据(Review Data)是一种发布在互联网上,表达评论目标某些特征方面状 况和自己对评价目标情感的数据。围绕同一个评论目标的评论文本构成了评论数据集,在 展示评论数据集时多采用列表的方式。
[0003] 传统的排序方法大多是基于评论文本的某一项属性进行排序,例如按照评论发表 的时间先后顺序、按照评论的点赞数排序、按照评论人的用户级别等。运类方法的排序对象 之间仅存在排序属性上的次序关系,而运些排序属性是符合用户思路或者产品需求的,对 评论文本排序具有良好的效果。但是,评论文本是用户对评论目标基于自身认识而发表的 个人意见性文本,评论中包含了对评论目标的使用感受、情感和特征描述等内容,对于其他 用户具有参考价值,评论内容的有效性也是影响评论排序的关键因素。此外,不同用户发表 的评论文本在描述评价对象时的侧重点不同,围绕评论目标进行全方位的评论文本展示具 有很重要的作用。因此,传统基于单一排序属性的方法不适合对评论文本列表进行排序。
[0004] 目前,在已有文献中,还未有兼顾多个特征的评论排序和筛选方法的相关记载。

【发明内容】

[0005] 本发明的目的是提出一种兼顾多样性和有效性的评论排序和筛选方法。该方法能 够筛选出比依赖单一排序属性方法更加符合人类需求的排序结果。
[0006] 本发明的目的是通过下述技术方案实现的。
[0007] 本发明的一种兼顾多样性和有效性的评论排序和筛选方法,其具体操作步骤为: [000引步骤一、从待排序评论集中提取评论目标的特征集。
[0009] 步骤1.1:采用词性标注工具对评论进行标注。
[0010] 步骤1.2:对待排序评论集中的名词出现次数进行统计,利用出现次数大于频次中 位数的名词构成评价目标的特征集。
[0011] 步骤二、依次对待排序评论集中的每一条评论进行处理,得到每条评论中设及的 特征数。
[0012] 步骤=、对待排序评论集根据特征进行聚类,使每条评论归属到一个特征类别中。
[0013] 步骤四、在每个聚类中,按照评论设及的评论数由高到低的顺序,对该聚类中的评 论进行排序。
[0014] 步骤五、设定选取数量为m,从每个聚类中选取前条评论,其中,n为聚类数。然 后,将选取出来的^ X n条评论,按照评论设及的评论数由高到低的顺序重新排序并展 LnJ /J、- O
[0015] 经过上述步骤的操作,即兼顾多样性和有效性,对待评论集评论中的评论进行排 序和筛选。
[0016] 有益效果
[0017] 本发明提出的兼顾多样性和有效性的评论排序和筛选方法与已有技术相比较,本 发明方法使评论列表排序效果更符合人类认知,能够优先输出对其他用户更有帮助的列表 排序,节省用户寻找有用评论的时间,并且兼顾评论内容的全面性,便于用户全面了解目标 W及其他用户对于该目标的观点。
【具体实施方式】
[0018] 下面结合附图和具体实施例对本发明技术方案做进一步描述。
[0019] 本实施例使用兼顾多样性和有效性的评论排序和筛选方法对一个企业评论集进 行排序和筛选,其操作流程如图1所示,其具体操作步骤为:
[0020] 步骤一、从待排序评论集中提取评论目标的特征集。待排序评论集是A公司员工对 本公司的260条评论,获取特征集的方法为:
[0021 ] 步骤1.1:采用词性标注工具对评论进行标注。
[0022] 步骤1.2:对待排序评论集中的名词出现次数进行统计,利用出现次数大于频次中 位数的名词构成评价目标的特征集。
[0023] 经过该步骤的操作,得到的特征集为:{:员工待遇、加班情况、伙食、出差补助、管理 方式、开会次数、面试难度、工作压力、名气}。
[0024] 步骤二、依次对待排序评论集中的每一条评论进行处理,将每一条评论与特征集 中的特征进行对比,得到每条评论中设及特征的数量。
[0025] 步骤S、对待排序评论集根据特征进行聚类为n个类别,n = 4,使每条评论归属到 一个特征类别中。
[0026] 步骤四、在每个聚类中,按照评论设及的评论数由高到低的顺序,对该聚类中的评 论进行排序。
[0027] 步骤五、设定选取数量为m = 20,从每个聚类中选取前5条评论。然后,将选取出来 的20条评论,按照评论设及的评论数由高到低的顺序重新排序并展示。
[0028] 经过上述步骤的操作,即兼顾多样性和有效性,对待评论集评论中的评论进行排 序和筛选。
【主权项】
1. 一种兼顾多样性和有效性的评论排序和筛选方法,其特征在于:其具体操作步骤为: 步骤一、从待排序评论集中提取评论目标的特征集; 步骤1.1:采用词性标注工具对评论进行标注; 步骤1.2:对待排序评论集中的名词出现次数进行统计,利用出现次数大于频次中位数 的名词构成评价目标的特征集; 步骤二、依次对待排序评论集中的每一条评论进行处理,得到每条评论中涉及的特征 数; 步骤三、对待排序评论集根据特征进行聚类,使每条评论归属到一个特征类别中; 步骤四、在每个聚类中,按照评论涉及的评论数由高到低的顺序,对该聚类中的评论进 tx排序; 步骤五、设定选取数量为m,从每个聚类中选取前条评论,其中,η为聚类数;然后,将 选取出来的|^| X m条评论,按照评论涉及的评论数由高到低的顺序重新排序并展示; 经过上述步骤的操作,即兼顾多样性和有效性,对待评论集评论中的评论进行排序和 筛选。
【文档编号】G06F17/27GK105955990SQ201610245146
【公开日】2016年9月21日
【申请日】2016年4月19日
【发明人】牛振东, 陈杰
【申请人】北京理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1