一种识别特定用户的方法和装置制造方法

文档序号:6487208阅读:115来源:国知局
一种识别特定用户的方法和装置制造方法
【专利摘要】本申请提供了一种识别特定用户的方法和装置,其中所述方法包括:从交易平台中提取交易评价信息的样本;从所述交易评价信息的样本中筛选出聚类用的交易评价信息;从所述聚类用的交易评价信息中提取评价用户作为候选用户;按各候选用户分别组织对应的第一评价信息集合和第二评价信息集合;统计所述第二评价信息集合在第一评价信息集合中的占比,若超过第一阈值,则判定为特定用户。本申请可以用来提高卖家信用的真实有效性,提高搜索准确性,并减轻服务器的负担,减少网络资源的占用。
【专利说明】—种识别特定用户的方法和装置
【技术领域】
[0001]本申请涉及电子交易平台数据处理的【技术领域】,特别是涉及一种特定用户的方法和一种识别特定用户的装置。
【背景技术】
[0002]电子商务(Electronic Commerce, EC)是指在全球各地广泛的商业贸易活动中,在因特网开放的网络环境下,基于网络通讯技术,买卖双方可不谋面地进行各种商贸活动,实现消费者的网上购物、商户之间的网上交易和在线电子支付,以及各种商务活动、交易活动、金融活动和相关的综合服务活动的一种新型的商业运营模式。电子商务涵盖的范围很广,一般可分为企业对企业(Business-to-Business,B2B)、企业对消费者(Business-to-Customer, B2C)或消费者对消费者(Customer-to-Customer, C2C)等模式。近几年来,国内电子商务迅速发展,各种B2B、C2C、B2C模式的电子商务网站(俗称购物网站),如淘宝网、当当网、卓越亚马逊、拍拍网、京东商城等,已被网民认可和接受。
[0003]为了帮助广大消费者对网上卖家提供的商品和服务进行甄别,目前的电子商务平台一般都会提供交易评价的功能,对商品和服务的质量以直观的方式,允许购买以后的买家进行打分,或者留下具体的文字、图片的描述,从而帮助更多的买家进行购买时的参考决策。例如,当买家与卖家完成一笔交易后,买家按照评价系统提供的“好评”、“中评”与“差评”的参数选项,选择其中一个评价参数,并给出相应的说明。或如,买家按照电子商务网站中设置的评价参数选项,比如,商品质量、卖家服务态度、物流速度等,选择其相应级别进行打分,根据分数对应到关联的“好评”、“中评”或“差评”的评价参数,并给出相应说明。
[0004]电子商务平台作为充分竞争的网上交易平台,大量的卖家之间存在着良性和非良性的竞争关系。在非良性的竞争关系中,表现之一就是在购买对方的商品和服务以后进行评价时对卖家进行恶意诋毁。目前我国的网上交易并未实行对买家、卖家的实名制,因此买家的评价过程和内容,对于电子商务平台本身是不可控的。一些买家利用这一特点,对购买以后的商品或者服务做出恶意诋毁的评价,混淆消费者的判断,目前的电子商务平台只能弓丨导买家自行注意鉴别,但买家自行鉴别的困难巨大。同时,现在的网上交易中还存在一种特定用户——职业差评师,即通过购买由竞争对手指定的电子商务平台卖家的商品或者服务,购买结束以后,恶意诋毁所购买的商品或者服务质量,以达到打击竞争对手并且个人从中牟利的买家用户。一些职业差评师买家在评价时往往附上图片、详细的文字描述,更增加了买家识别上的难度。职业差评师的存在,不仅严重干扰的网络秩序,还会影响卖家信用的真实性,而卖家信用往往是电子商务网站搜索排序的重要参数,虚假的卖家信用导致优质的搜索结果的排序降低,相应的劣质的搜索结果排序上升,这将严重影响到搜索结果的准确性,导致用户需要时间和精力去分辨,甚至需要重新搜索等,这不但加重了访问服务器的负担,而且浪费了网络资源。
[0005]因此,目前需要本领域技术人员迫切解决的一个技术问题就是:提出一种识别特定用户及其评价信息的机制,用以提高卖家信用的真实有效性,提高搜索准确性,并减轻服务器的负担,减少网络资源的占用。

【发明内容】

[0006]本申请的目的是提供一种识别特定用户的方法和装置,用以打击网络犯罪,维护网络交易的秩序,提闻卖家/[目用的真实有效性,提闻搜索准确性,并减轻服务器的负担,减少网络资源的占用。
[0007]为了解决上述问题,本申请实施例公开了一种识别特定用户的方法,包括:
[0008]从交易平台中提取交易评价信息的样本,所述交易评价信息包括交易信息及对应的评价用户和评价信息;
[0009]从所述交易评价信息的样本中筛选出聚类用的交易评价信息;
[0010]从所述聚类用的交易评价信息中提取评价用户作为候选用户;
[0011]按各候选用户分别组织对应的第一评价信息集合和第二评价信息集合,其中,所述第一评价信息集合为各候选用户在所述交易评价信息的样本中对应的评价信息集合;所述第二评价信息集合为各候选用户在聚类用的交易评价信息中对应的评价信息集合;
[0012]统计所述第二评价信息集合在第一评价信息集合中的占比,若超过第一阈值,则判定为特定用户。
[0013]优选地,所述从交易评价信息的样本中筛选出聚类用的交易评价信息的步骤包括:
[0014]若所述评价信息为中评或差评,则将该条交易评价信息提取为聚类用的交易评价
信息;
[0015]和/ 或,
[0016]若所述评价信息中的交易评分值低于第二阈值,则将该条交易评价信息提取为聚类用的交易评价信息;
[0017]和/ 或,
[0018]若所述评价信息中的评价内容包括预置的差评关键词,则将该条交易评价信息提取为聚类用的交易评价信息。
[0019]优选地,所述交易信息中包括商品信息,所述从交易评价信息的样本中筛选出聚类用的交易评价信息的步骤还包括:
[0020]根据商品信息组织对应的评价信息,统计差评占比,所述差评占比为满足差评规则的评价信息,在该交易信息对应的所有评价信息中所占的比例;其中,所述差评规则包括:评价信息为中评或差评;和/或,评价信息中的交易评分值低于第二阈值;和/或,评价信息中的评价内容包括预置的差评关键词;
[0021]根据所述商品信息组织对应的评价用户,计算评价用户的分散度;
[0022]若存在所述差评占比大于第三阈值,并且,所述评价用户的分散度高于第四阈值的交易评价信息,则去除该条交易评价信息。
[0023]优选地,所述的方法还包括:
[0024]提取所述特定用户的特征,训练生成特定用户的评定指标。
[0025]优选地,所述特定用户的特征包括评价用户的注册时间长短,购买商品的类目分布,确认收货与作为评价的时间间隔,评价内容,和/或,在交易平台的活动行为信息。[0026]优选地,所述的方法还包括:
[0027]当获得新的交易评价信息时,按照所述评定指标判定当前交易评价信息中的评价用户是否为特定用户;
[0028]若是,则屏蔽或删除所述特定用户的评价信息,或者,降低所述特定用户的评价信息的权重。
[0029]优选地,所述的方法还包括:
[0030]提取所述特定用户生成黑名单。
[0031]优选地,所述的方法还包括:
[0032]当获得新的交易评价信息时,提取当前交易评价信息中的评价用户,判断所述评价用户是否在黑名单中;
[0033]若是,则屏蔽或删除所述特定用户的评价信息,或者,降低所述特定用户的评价信息的权重。
[0034]本申请实施例还公开了一种识别特定用户的装置,包括:
[0035]样本采集模块,用于从交易平台中提取交易评价信息的样本,所述交易评价信息包括交易信息及对应的评价用户和评价信息;
[0036]数据清洗模块,用于从所述交易评价信息的样本中筛选出聚类用的交易评价信息;
[0037]用户提取模块,用于从所述聚类用的交易评价信息中提取评价用户作为候选用户;
[0038]组织模块,用于按各候选用户分别组织对应的第一评价信息集合和第二评价信息集合,其中,所述第一评价信息集合为各候选用户在所述交易评价信息的样本中对应的评价信息集合;所述第二评价信息集合为各候选用户在聚类用的交易评价信息中对应的评价信息集合;
[0039]识别模块,用于统计所述第二评价信息集合在第一评价信息集合中的占比,若超过第一阈值,则判定为特定用户。
[0040]优选地,所述数据清洗模块包括:
[0041]第一提取子模块,用于在所述评价信息为中评或差评时,将该条交易评价信息提取为聚类用的交易评价信息;
[0042]和/ 或,
[0043]第二提取子模块,用于在所述评价信息中的交易评分值低于第二阈值时,将该条交易评价信息提取为聚类用的交易评价信息;
[0044]和/ 或,
[0045]第三提取子模块,用于在所述评价信息中的评价内容包括预置的差评关键词时,将该条交易评价信息提取为聚类用的交易评价信息。
[0046]优选地,所述交易信息中包括商品信息,所述数据清洗模块还包括:
[0047]第一计算子模块,用于根据商品信息组织对应的评价信息,统计差评占比,所述差评占比为满足差评规则的评价信息,在该交易信息对应的所有评价信息中所占的比例;其中,所述差评规则包括:评价信息为中评或差评;和/或,评价信息中的交易评分值低于第二阈值;和/或,评价信息中的评价内容包括预置的差评关键词;[0048]第二计算子模块,用于根据所述商品信息组织对应的评价用户,计算评价用户的分散度;
[0049]去除子模块,用于在存在所述差评占比大于第三阈值,并且,所述评价用户的分散度高于第四阈值的交易评价信息时,去除该条交易评价信息。
[0050]优选地,所述的装置还包括:
[0051]聚类建模模块,用于提取所述特定用户的特征,训练生成特定用户的评定指标。
[0052]优选地,所述特定用户的特征包括评价用户的注册时间长短,购买商品的类目分布,确认收货与作为评价的时间间隔,评价内容,和/或,在交易平台的活动行为信息。
[0053]优选地,所述的装置还包括:
[0054]第一用户识别处理模块,用于在获得新的交易评价信息时,按照所述评定指标判定当前交易评价信息中的评价用户是否为特定用户;若是,则屏蔽或删除所述特定用户的评价信息,或者,降低所述特定用户的评价信息的权重。
[0055]优选地,所述的装置还包括:
[0056]黑名单创建模块,用于提取所述特定用户生成黑名单。
[0057]优选地,所述的装置还包括:
[0058]第二用户识别处理模块,用于在获得新的交易评价信息时,提取当前交易评价信息中的评价用户,判断所述评价用户是否在黑名单中;若是,则屏蔽或删除所述特定用户的评价信息,或者,降低所述特定用户的评价信息的权重。
[0059]与现有技术相比,本申请包括以下优点:
[0060]本申请针对所有的成功交易进行评价信息取样,能够在全局角度,即在交易平台所有交易的角度,而不是某一件商品交易的角度,方便地对职业差评师进行识别,具体通过交易平台的开放接口获取到全网的交易评价信息后,对交易评价信息进行数据清洗,然后通过聚类模型,从买家中筛选出职业差评师,并把此模型应用于更广泛的买家对象,建立起长效机制,有效打击了职业差评师的网络犯罪行为,维护网上交易的健康秩序;并且保证卖家信用的真实有效性,还原了商品的真实信息,使好的交易信息能在用户搜索时正常出现在搜索结果的前列,减少用户反复搜索的时间,从而减轻服务器的负担,减少网络资源的占用。
【专利附图】

【附图说明】
[0061]图1是本申请的一种识别特定用户的方法实施例1的步骤流程图;
[0062]图2是本申请的一种识别特定用户的方法实施例2的步骤流程图;
[0063]图3是本申请的一种识别特定用户的方法实施例3的步骤流程图;
[0064]图4是本申请实施例应用在交易平台搜索中的步骤流程图;
[0065]图5是本申请的一种识别特定用户的装置实施例的结构框图。
【具体实施方式】
[0066]为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和【具体实施方式】对本申请作进一步详细的说明。
[0067]一般而言,职业差评师的活动流程为:获取由团伙主使指定购买的目标对象,购买商品,等待收货,收到货物完成以后,对购买的对象做出差评。评价完成以后,得到团伙主使分配的报酬。在目前没有采用实名制的交易平台中,职业差评师的存在,不仅严重干扰的网络秩序,还会影响卖家信用的真实性,还将进一步影响到搜索结果的准确性,例如,一些好的交易信息会受到说明栏中说明信息的影响,基于其所获得的差评,不会与好评的交易信息一同排在搜索结果的前列,导致用户需要时间和精力去分辨,甚至需要重新搜索等,这不但加重了访问服务器的负担,而且浪费了网络资源。
[0068]针对上述问题,本申请发明人提出本申请实施例的核心构思之一在于,针对所有的成功交易进行评价信息取样,能够在全局角度,即在交易平台所有交易的角度,而不是某一件商品交易的角度,方便地对职业差评师进行识别,具体通过交易平台的开放接口获取到全网的交易评价信息后,对交易评价信息进行数据清洗,然后通过聚类模型,从买家中筛选出职业差评师,并把此模型应用于更广泛的买家对象,建立起长效机制,有效打击了职业差评师的网络犯罪行为,维护网上交易的健康秩序;并且保证卖家信用的真实有效性,还原了商品的真实信息,使好的交易信息能在用户搜索时正常出现在搜索结果的前列,减少用户反复搜索的时间,从而减轻服务器的负担,减少网络资源的占用。
[0069]参照图1,其示出了本申请的一种识别特定用户及其评价信息的方法实施例1的步骤流程图,具体可以包括如下步骤:
[0070]步骤101,从交易平台中提取交易评价信息的样本;
[0071]其中,所述交易评价信息包括交易信息,及其对应的评价用户和评价信息;
[0072]在具体实现中,可以在交易平台提供有开放接口(应用程序接口 API)的情况下,通过该开放接口获取到交易评价信息的样本;在交易平台没有提供开放接口的情况下,则可以采用网页爬虫的方式获取到交易评价信息的样本。
[0073]为提升数据处理速度,减少资源耗费,所述交易评价信息可以只取预设时间段内的交易评价信息,比如,某交易平台中最近半年内的交易评价信息。获取到所述交易评价信息的样本后,可以进行存储,例如,放入某云服务器的存储数据库,或放入交易平台服务器
由T寸。
[0074]作为本申请实施例具体应用的一种示例,所述交易信息可以包括商品ID,商品价格,商品类目等信息,评价用户可以包括用户ID,用户昵称,用户注册时间和注册地,用户收货地址等信息,评价信息可以包括好评、中评、差评、商品与描述相符度、卖家的服务态度、卖家发货的速度、物流发货的速度、交易的具体评论、评论是否推荐到社区、评价时间等信
肩、O
[0075]例如,从交易平台中提取的一条交易评价信息样本如下表所示:
[0076]
【权利要求】
1.一种识别特定用户的方法,其特征在于,包括: 从交易平台中提取交易评价信息的样本,所述交易评价信息包括交易信息及对应的评价用户和评价信息; 从所述交易评价信息的样本中筛选出聚类用的交易评价信息; 从所述聚类用的交易评价信息中提取评价用户作为候选用户; 按各候选用户分别组织对应的第一评价信息集合和第二评价信息集合,其中,所述第一评价信息集合为各候选用户在所述交易评价信息的样本中对应的评价信息集合;所述第二评价信息集合为各候选用户在聚类用的交易评价信息中对应的评价信息集合; 统计所述第二评价信息集合在第一评价信息集合中的占比,若超过第一阈值,则判定为特定用户。
2.根据权利要求1所述的方法,其特征在于,所述从交易评价信息的样本中筛选出聚类用的交易评价信息的步骤包括: 若所述评价信息为中评或差评,则将该条交易评价信息提取为聚类用的交易评价信息; 和/或, 若所述评价信息中的交易评分值低于第二阈值,则将该条交易评价信息提取为聚类用的交易评价信息; 和/或,· 若所述评价信息中的评价内容包括预置的差评关键词,则将该条交易评价信息提取为聚类用的交易评价信息。
3.根据权利要求2所述的方法,其特征在于,所述交易信息中包括商品信息,所述从交易评价信息的样本中筛选出聚类用的交易评价信息的步骤还包括: 根据商品信息组织对应的评价信息,统计差评占比,所述差评占比为满足差评规则的评价信息,在该交易信息对应的所有评价信息中所占的比例;其中,所述差评规则包括:评价信息为中评或差评;和/或,评价信息中的交易评分值低于第二阈值;和/或,评价信息中的评价内容包括预置的差评关键词; 根据所述商品信息组织对应的评价用户,计算评价用户的分散度; 若存在所述差评占比大于第三阈值,并且,所述评价用户的分散度高于第四阈值的交易评价息,则去除该条交易评价息。
4.根据权利要求1或2或3所述的方法,其特征在于,还包括: 提取所述特定用户的特征,训练生成特定用户的评定指标。
5.根据权利要求4所述的方法,其特征在于,所述特定用户的特征包括评价用户的注册时间长短,购买商品的类目分布,确认收货与作为评价的时间间隔,评价内容,和/或,在交易平台的活动行为信息。
6.根据权利要求5所述的方法,其特征在于,还包括: 当获得新的交易评价信息时,按照所述评定指标判定当前交易评价信息中的评价用户是否为特定用户; 若是,则屏蔽或删除所述特定用户的评价信息,或者,降低所述特定用户的评价信息的权重。
7.根据权利要求1或2或3所述的方法,其特征在于,还包括: 提取所述特定用户生成黑名单。
8.根据权利要求7所述的方法,其特征在于,还包括: 当获得新的交易评价信息时,提取当前交易评价信息中的评价用户,判断所述评价用户是否在黑名单中; 若是,则屏蔽或删除所述特定用户的评价信息,或者,降低所述特定用户的评价信息的权重。
9.一种识别特定用户的装置,其特征在于,包括: 样本采集模块,用于从交易平台中提取交易评价信息的样本,所述交易评价信息包括交易信息及对应的评价用户和评价信息; 数据清洗模块,用于从所述交易评价信息的样本中筛选出聚类用的交易评价信息; 用户提取模块,用于从所述聚类用的交易评价信息中提取评价用户作为候选用户; 组织模块,用于按各候选用户分别组织对应的第一评价信息集合和第二评价信息集合,其中,所述第一评价信息集合为各候选用户在所述交易评价信息的样本中对应的评价信息集合;所述第二评价信息集合为各候选用户在聚类用的交易评价信息中对应的评价信息集合; 识别模块,用于统计所述第二评价信息集合在第一评价信息集合中的占比,若超过第一阈值,则判定为特定用户。
10.根据权利要求9所述的装置,其特征在于,所述数据清洗模块包括: 第一提取子模块,用于在所述评价信息为中评或差评时,将该条交易评价信息提取为聚类用的交易评价信息; 和/或, 第二提取子模块,用于在所述评价信息中的交易评分值低于第二阈值时,将该条交易评价信息提取为聚类用的交易评价信息; 和/或, 第三提取子模块,用于在所述评价信息中的评价内容包括预置的差评关键词时,将该条交易评价信息提取为聚类用的交易评价信息。
11.根据权利要求10所述的装置,其特征在于,所述交易信息中包括商品信息,所述数据清洗模块还包括: 第一计算子模块,用于根据商品信息组织对应的评价信息,统计差评占比,所述差评占比为满足差评规则的评价信息,在该交易信息对应的所有评价信息中所占的比例;其中,所述差评规则包括:评价信息为中评或差评;和/或,评价信息中的交易评分值低于第二阈值;和/或,评价信息中的评价内容包括预置的差评关键词; 第二计算子模块,用于根据所述商品信息组织对应的评价用户,计算评价用户的分散度; 去除子模块,用于在存在所述差评占比大于第三阈值,并且,所述评价用户的分散度高于第四阈值的交易评价信息时,去除该条交易评价信息。
12.根据权利要求9或10或11所述的装置,其特征在于,还包括: 聚类建模模块,用于提取所述特定用户的特征,训练生成特定用户的评定指标。
13.根据权利要求12所述的装置,其特征在于,所述特定用户的特征包括评价用户的注册时间长短,购买商品的类目分布,确认收货与作为评价的时间间隔,评价内容,和/或,在交易平台的活动行为信息。
14.根据权利要求13所述的装置,其特征在于,还包括: 第一用户识别处理模块,用于在获得新的交易评价信息时,按照所述评定指标判定当前交易评价信息中的评价用户是否为特定用户;若是,则屏蔽或删除所述特定用户的评价信息,或者,降低所述特定用户的评价信息的权重。
15.根据权利要求9或10或11所述的装置,其特征在于,还包括: 黑名单创建模块,用于提取所述特定用户生成黑名单。
16.根据权利要求15所述的装置,其特征在于,还包括: 第二用户识别处理模块,用于在获得新的交易评价信息时,提取当前交易评价信息中的评价用户,判断所述评价用户是否在黑名单中;若是,则屏蔽或删除所述特定用户的评价信息,或者,降低所述特定用户的评价信息的权重。
【文档编号】G06F17/30GK103577988SQ201210258891
【公开日】2014年2月12日 申请日期:2012年7月24日 优先权日:2012年7月24日
【发明者】陈春明, 王正刚, 许亮, 吴云崇 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1