一种基于大数据采集与分析的刷单评价行为处理方法与流程

文档序号:11952955阅读:639来源:国知局

本发明是一种基于大数据采集与分析的刷单评价行为处理方法,属于数据处理技术领域。



背景技术:

询价等订单信息的有效性直接影响最终的销售效果,如何保证线索信息的有效性,防止刷单等行为是下单流程中需要实现的一个重要模块,越接近买家购物行为的刷单越不容易被系统识别。在大数据基础上开发的刷单检测系统唯一没办法判定为刷单的就是真实订单。所以刷单技术的更新总是围绕着如何模仿真实买家购物行为进展。市面上流行的刷单方法包含刷单路径分布、七天螺旋刷单规律、刷单流程主要控制浏览时长、浏览整个页面、账号检查等。更具体的刷单方法包括:IP防止作弊、Netclean防止作弊、点击比率、来源统计、唯一参数、点击时间顺差和鼠标值。

传统的刷单数据处理流程类似于工厂中生产线上的工人们那样组织工作者。每个工作者只负责作业中的部分工作。当完成了自己的这部分工作时工作者会将作业转发给下一个工作者。但当前面的生产者出现问题是后面的生产者则无法执行相应的工作。如果出现较长的数据库查询等情况时则需要等待全部函数检查完毕。

而现有实际情况是,订单数据的实时处理量比较大,传统的刷单数据处理服务存在:处理订单数据慢,效率低且可用性差的问题。



技术实现要素:

针对现有技术存在的不足,本发明目的是提供一种基于大数据采集与分析的刷单评价行为处理方法,以解决上述背景技术中提出的问题。

为了实现上述目的,本发明是通过如下的技术方案来实现:一种基于大数据采集与分析的刷单评价行为处理方法,包括以下步骤:

步骤1,数据采集与分析,通过多个小型的数据库实时的采集用户的评价行为信息,集合一个用户的所有评价行为信息,将一个用户的所有评价行为信息发送至一个大的数据库中,提取用户的评价行为特征,设定一评价阀值,将用户的评价行为特征与评价阀值进行对比,对用户的评价行为进行划分;

步骤2,提取用户所评价商品的购物信息,通过多个小型的数据库的采集用户所评价商品的购物信息,将这些信息发送至一个大的数据库中,提取用户的购物行为特征,进行判断;

步骤3,处理,根据判断结果,对用户以及店铺进行处理。

进一步地,在步骤1中,用户的评价行为特征指用户对于一件商品评价的字数、用户对于一件商品评价的内容、用户对于一件商品评价的次数、用户在一个时间段对于一件商品评价的字数、用户在一个时间段对于一件商品评价的次数以及用户对于一件商品评价的时间;

所述评价阀值指用户对于一件商品评价的字数、用户对于一件商品评价的内容、用户对于一件商品评价内容的关键词衍生词、用户对于一件商品评价的次数、用户在一个时间段对于一件商品评价的字数、用户在一个时间段对于一件商品评价的次数以及用户对于一件商品评价的时间;

用户的评价行为特征为A,评价阀值为B,采用所设置的评价阀值对用户的评价行为特征进行匹配,若A>=B,将该用户的评价行为作为疑似刷单行为,并进行下一步,若A<B,将该用户的评价行为作为非刷单行为并删除。

进一步地,在步骤2中,判断的依据为:

静默转化率,提取用户购买商品所在类目的静默转化率,将这个商品所在类目的静默转化率与购物平台的相应类目综合静默转化率进行对比;

店铺停留时间,提取用户购买商品时在商品页面停留的时间,根据商品的价值提取购物平台中相等价值下商品页面平均停留的时间,将用户购买商品时在商品页面停留的时间,与平均停留时间对比;

购物时间,提取用户购买商品时的购物时间,同时提取此商品所在类目的集中购物时间,将用户购买商品时的购物时间,与集中购物时间进行对比;

收藏占比,提取用户购买商品所在店铺的收藏占比,将这个商品所在店铺的收藏占比与购物平台的相应类目综合收藏占比进行对比;

评价内容,根据用户对于一件商品评价的字数、对于一件商品评价的次数、在一个时间段对于一件商品评价的字数、在一个时间段对于一件商品评价的次数以及一件商品评价的时间进行判断;

无线端占比,提取用户购买商品所在店铺的无线端占比,将这个商品所在店铺的无线端占比与购物平台的相应类目综合无线端占比进行对比。

本发明的有益效果:本发明的一种基于大数据采集与分析的刷单评价行为处理方法,通过大数据抓取用户的评价,并对用户的购物行为进行判断,有效的查出用户和店铺的刷单行为,从而建立运行平稳、安全高效的网络购物运行新机制,构建以人为本、惠及全民的民生服务新体系,开启大众创业、万众创新的创新驱动新格局,培育高端智能、新兴繁荣的产业发展新生态。

具体实施方式

为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。

本发明提供一种技术方案:一种基于大数据采集与分析的刷单评价行为处理方法,包括以下步骤:

步骤1,数据采集与分析,通过多个小型的数据库实时的采集用户的评价行为信息,集合一个用户的所有评价行为信息,将一个用户的所有评价行为信息发送至一个大的数据库中,提取用户的评价行为特征,设定一评价阀值,将用户的评价行为特征与评价阀值进行对比,对用户的评价行为进行划分;

步骤2,提取用户所评价商品的购物信息,通过多个小型的数据库的采集用户所评价商品的购物信息,将这些信息发送至一个大的数据库中,提取用户的购物行为特征,进行判断;

步骤3,处理,根据判断结果,对用户以及店铺进行处理。

在步骤1中,用户的评价行为特征指用户对于一件商品评价的字数、用户对于一件商品评价的内容、用户对于一件商品评价的次数、用户在一个时间段对于一件商品评价的字数、用户在一个时间段对于一件商品评价的次数以及用户对于一件商品评价的时间;

评价阀值指用户对于一件商品评价的字数、用户对于一件商品评价的内容、用户对于一件商品评价内容的关键词衍生词、用户对于一件商品评价的次数、用户在一个时间段对于一件商品评价的字数、用户在一个时间段对于一件商品评价的次数以及用户对于一件商品评价的时间;

用户的评价行为特征为A,评价阀值为B,采用所设置的评价阀值对用户的评价行为特征进行匹配,若A>=B,将该用户的评价行为作为疑似刷单行为,并进行下一步,若A<B,将该用户的评价行为作为非刷单行为并删除。

在步骤2中,判断的依据为:

静默转化率,提取用户购买商品所在类目的静默转化率,将这个商品所在类目的静默转化率与购物平台的相应类目综合静默转化率进行对比;

店铺停留时间,提取用户购买商品时在商品页面停留的时间,根据商品的价值提取购物平台中相等价值下商品页面平均停留的时间,将用户购买商品时在商品页面停留的时间,与平均停留时间对比;

购物时间,提取用户购买商品时的购物时间,同时提取此商品所在类目的集中购物时间,将用户购买商品时的购物时间,与集中购物时间进行对比;

收藏占比,提取用户购买商品所在店铺的收藏占比,将这个商品所在店铺的收藏占比与购物平台的相应类目综合收藏占比进行对比;

评价内容,根据用户对于一件商品评价的字数、对于一件商品评价的次数、在一个时间段对于一件商品评价的字数、在一个时间段对于一件商品评价的次数以及一件商品评价的时间进行判断;

无线端占比,提取用户购买商品所在店铺的无线端占比,将这个商品所在店铺的无线端占比与购物平台的相应类目综合无线端占比进行对比。

做为本发明的一个实施例:包括以下步骤:

步骤1,数据采集与分析,通过多个小型的数据库实时的采集用户的评价行为信息,集合一个用户的所有评价行为信息,将一个用户的所有评价行为信息发送至一个大的数据库中,提取用户的评价行为特征,设定一评价阀值,将用户的评价行为特征与评价阀值进行对比,对用户的评价行为进行划分。

用户的评价行为特征指用户对于一件商品评价的字数、用户对于一件商品评价的内容、用户对于一件商品评价的次数、用户在一个时间段对于一件商品评价的字数、用户在一个时间段对于一件商品评价的次数以及用户对于一件商品评价的时间;

评价阀值指用户对于一件商品评价的字数、用户对于一件商品评价的内容、用户对于一件商品评价内容的关键词衍生词、用户对于一件商品评价的次数、用户在一个时间段对于一件商品评价的字数、用户在一个时间段对于一件商品评价的次数以及用户对于一件商品评价的时间;

用户的评价行为特征为A,评价阀值为B,即在用户评价行为中,用户对于一件商品评价的字数为A、用户对于一件商品评价的内容为A、用户对于一件商品评价的次数为A、用户在一个时间段对于一件商品评价的字数为A、用户在一个时间段对于一件商品评价的次数为A以及用户对于一件商品评价的时间为A;在评价阀值中,用户对于一件商品评价的字数为B、用户对于一件商品评价的内容为B、用户对于一件商品评价的次数为B、用户在一个时间段对于一件商品评价的字数为B、用户在一个时间段对于一件商品评价的次数为B以及用户对于一件商品评价的时间为B;采用所设置的评价阀值对用户的评价行为特征进行匹配,若A>=B,将该用户的评价行为作为疑似刷单行为,并进行下一步,若A<B,将该用户的评价行为作为非刷单行为并删除。

步骤2,提取用户所评价商品的购物信息,通过多个小型的数据库的采集用户所评价商品的购物信息,将这些信息发送至一个大的数据库中,提取用户的购物行为特征,进行判断;

判断的依据为:

静默转化率,提取用户购买商品所在类目的静默转化率,将这个商品所在类目的静默转化率与购物平台的相应类目综合静默转化率进行对比,一般标准化的产品、大众商品、价值比较低的商品以及重复购买的商品,这些东西的静默转化率是比较高的。相反,不是标准化的产品的东西,价值比较高的东西静默转化率就比较低,根据静默转化率判断用户和店铺是否存在刷单行为;

店铺停留时间,提取用户购买商品时在商品页面停留的时间,根据商品的价值提取购物平台中相等价值下商品页面平均停留的时间,将用户购买商品时在商品页面停留的时间,与平均停留时间对比,一件商品的价值越高,购买商品时在商品页面停留的时间便越长,如果用户购买商品时在商品页面停留的时间过短,便可能存在刷单行为;

购物时间,提取用户购买商品时的购物时间,同时提取此商品所在类目的集中购物时间,将用户购买商品时的购物时间,与集中购物时间进行对比,每个商品所对应的购物时间是不同的,有的商品在23点到0点是最多的,如果不再这个时间段,这个商品卖出了很多,便可能存在刷单行为;

收藏占比,提取用户购买商品所在店铺的收藏占比,将这个商品所在店铺的收藏占比与购物平台的相应类目综合收藏占比进行对比;

评价内容,根据用户对于一件商品评价的字数、对于一件商品评价的次数、在一个时间段对于一件商品评价的字数、在一个时间段对于一件商品评价的次数以及一件商品评价的时间进行判断,如果用户对于每一笔订单都有评价,并且评价都很长,尤其是一些很简单,价值很低的商品,便可能存在刷单行为;

无线端占比,提取用户购买商品所在店铺的无线端占比,将这个商品所在店铺的无线端占比与购物平台的相应类目综合无线端占比进行对比,判断是否存在刷单行为。

步骤3,处理,根据判断结果和购物平台的相关规则,对用户以及店铺进行处理。

本发明通过大数据抓取用户的评价,并对用户的购物行为进行判断,有效的查出用户和店铺的刷单行为,从而建立运行平稳、安全高效的网络购物运行新机制,构建以人为本、惠及全民的民生服务新体系,开启大众创业、万众创新的创新驱动新格局,培育高端智能、新兴繁荣的产业发展新生态。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点,对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1