商品评论信息中重复信息处理方法

文档序号:9727420阅读:484来源:国知局
商品评论信息中重复信息处理方法
【技术领域】
[0001]本发明涉及计算机网络技术领域,特别是涉及一种商品评论信息中重复信息处理方法。
【背景技术】
[0002]在电子商务领域,人们出了关心的商品本身的描述信息以外,还特别关注商品的评论信息,而这些评论信息都是购买过该商品的用户作出的,评论信息包括商品质量、性能参数等,是反映商品性能和服务质量的重要信息,往往受到人们的重点关注。
[0003]但是,在实际情况中,很多用户对评论信息并不重视,只是为了完结商品网购流程而敷衍了事,导致常常出现一些毫无实际内容的评论信息,当某件商品存在很多条这样的评论信息时,将要购买该商品的用户在浏览评论信息时,将很难快速获得有价值的评论信息,这就导致商品交易效率比较低。

【发明内容】

[0004]本发明主要解决的技术问题是提供一种商品评论信息中重复信息处理方法,能够识别并处理重复的评论信息。
[0005]为解决上述技术问题,本发明采用的一个技术方案是:提供一种商品评论信息中重复信息处理方法,包括:S1:从商品评论信息中选取第一评论信息和第二评论信息;S2:从所述第一评论信息和第二评论信息中选择相同的关键词,并计算所述每个关键词在所述第一评论信息中出现的第一次数以及所述每个关键词在所述第二评论信息中出现的第二次数;S3:比较所述每个关键词的第一次数和第二次数,并计算所述每个关键词的第一次数和第二次数之间的差值;S4:如果所述第一次数大于第二次数,且所述差值在预设阈值内,则保留所述第一评论信息并隐藏所述第二评论信息;如果所述第一次数小于第二次数,且所述差值在预设阈值内,则保留所述第二评论信息并所述隐藏第一评论信息。
[0006]优选地,还包括:S5:如果所述第一次数大于第二次数或者所述第一次数小于第二次数,但所述差值大于预设阈值,则均保留所述第一评论信息和所述第二评论信息。
[0007]区别于现有技术的情况,本发明的有益效果是:通过不同评论信息中关键词的比对来查找内容实质相同的评论信息,从而能够识别并处理重复的评论信息,可以提高用户的体验。
【附图说明】
[0008]图1是本发明实施例商品评论信息中重复信息处理方法的流程示意图。
【具体实施方式】
[0009]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0010]参见图1,是本发明实施例商品评论信息中重复信息处理方法的流程示意图。本发明实施例商品评论信息中重复信息处理方法包括以下步骤:
[0011 ] S1:从商品评论信息中选取第一评论信息和第二评论信息。
[0012]其中,第一评论信息和第二评论信息是两条不相同的评论信息,它们既可以是不同用户提交的,也可以是由同一个用户提交的,例如,用户购买了两次商品。
[0013]S2:从第一评论信息和第二评论信息中选择相同的关键词,并计算每个关键词在第一评论信息中出现的第一次数以及每个关键词在第二评论信息中出现的第二次数。
[0014]其中,第一评论信息和第二评论信息均包含文字内容,可以通过比对的方式从它们中找到相同的关键词,例如,当商品为手机时,关键词可以是“系统流畅”、“省电”、“功能齐全”、“分辨率高”、“性价比高”等等具有实际价值的内容,也可以是“物流慢”、“快递慢”、“手机一般”等笼统性或无价值的内容。如果第一评论信息和第二评论信息中相同的关键词不止一个,那么,每一个关键词都要计算第一次数和第二次数。
[0015]S3:比较每个关键词的第一次数和第二次数,并计算每个关键词的第一次数和第二次数之间的差值。
[0016]S4:如果第一次数大于第二次数,且差值在预设阈值内,则保留第一评论信息并隐藏第二评论信息;如果第一次数小于第二次数,且差值在预设阈值内,则保留第二评论信息并隐藏第一评论信息。
[0017]其中,如果第一次数和第二次数之间的差值在预设阈值内,说明第一评论信息和第二评论信息的内容基本一致,则保留第一次数和第二次数中最多的评论信息,而隐藏另一个评论信息。经过隐藏后,商品评论信息的条数将大为减少,用户可以快速查询到有价值的评论信息,从而提高了用户的体验。
[0018]在本实施例中,商品评论信息中重复信息处理方法还包括:
[0019]S5:如果第一次数大于第二次数或者第一次数小于第二次数,但差值大于预设阈值,则均保留第一评论信息和第二评论信息。
[0020]其中,如果第一次数和第二次数之间的差值相差太大,说明第一评论信息和第二评论信息中均存在互不相同的内容,则第一评论信息和第二评论信息都保留。
[0021]通过上述方式,本发明实施例的商品评论信息中重复信息处理方法通过不同评论信息中关键词的比对来查找内容实质相同的评论信息,从而能够识别并处理重复的评论信息,可以提尚用户的体验。
[0022]以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
【主权项】
1.一种商品评论信息中重复信息处理方法,其特征在于,包括: S1:从商品评论信息中选取第一评论信息和第二评论信息; S2:从所述第一评论信息和第二评论信息中选择相同的关键词,并计算所述每个关键词在所述第一评论信息中出现的第一次数以及所述每个关键词在所述第二评论信息中出现的第二次数; S3:比较所述每个关键词的第一次数和第二次数,并计算所述每个关键词的第一次数和第二次数之间的差值; S4:如果所述第一次数大于第二次数,且所述差值在预设阈值内,则保留所述第一评论信息并隐藏所述第二评论信息;如果所述第一次数小于第二次数,且所述差值在预设阈值内,则保留所述第二评论信息并所述隐藏第一评论信息。2.根据权利要求1所述的商品评论信息中重复信息处理方法,其特征在于,还包括: S5:如果所述第一次数大于第二次数或者所述第一次数小于第二次数,但所述差值大于预设阈值,则均保留所述第一评论信息和所述第二评论信息。
【专利摘要】本发明提供了一种商品评论信息中重复信息处理方法,其包括:S1:从商品评论信息中选取第一评论信息和第二评论信息;S2:从第一评论信息和第二评论信息中选择相同的关键词,并计算每个关键词在第一评论信息中出现的第一次数以及每个关键词在第二评论信息中出现的第二次数;S3:比较每个关键词的第一次数和第二次数,并计算每个关键词的第一次数和第二次数之间的差值;S4:如果第一次数大于第二次数,且差值在预设阈值内,则保留第一评论信息并隐藏第二评论信息;如果第一次数小于第二次数,且差值在预设阈值内,则保留第二评论信息并隐藏第一评论信息,本发明能够识别并处理重复的评论信息。
【IPC分类】G06F17/30, G06Q30/06
【公开号】CN105488144
【申请号】CN201510836742
【发明人】黄正强
【申请人】四川诚品电子商务有限公司
【公开日】2016年4月13日
【申请日】2015年11月25日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1