基于用户行为数据特征的刷单检测方法及系统与流程

文档序号:15463257发布日期:2018-09-18 18:41阅读:273来源:国知局
本发明涉及电子商务信息
技术领域
,尤其涉及的是一种基于用户行为数据特征的刷单检测方法及系统。
背景技术
:在电子商务飞速发展的今天,网上购物已经变得十分普及,消费者在享受电子商务带来便捷的同时,也深受电子商务发展过快所带来的信誉欺诈问题的影响。目前,在电子商务的交易中,卖家和买家都是通过网络进行交易的,买家不了解卖家的实际情况,也无法看到实物本身,不知道卖家商品的好坏,只能通过网上的一些信息去进行判断。对于消费者来说,购物最主要的就是看卖家的商品描述、卖家的信誉、别人对于自己想购买的物品的评价。随着电子商务市场规模蓬勃发展,卖家的竞争越来越大,商家付出的广告费、推广费与商品的销量和流量都有关系,销量好的商品可以得到更多的展示机会且更容易取信消费者。因此,一些不法商家通过刷单手段,获取平台更多的资源,以达到提升展现机会和销售转化的目的,这对诚信经营的商家和被误导的消费者造成了严重的伤害。此外,虚假交易行为严重扰乱了电商市场的正常秩序,更有甚者,借用刷单行为来进行诈骗,造成了严重的社会危害。传统的反刷单方法往往基于某一商品的订单量在某段时间内的异常增长、大量相同访问IP及相同物流编号等信息对刷单行为进行识别。这种反刷单方法准确率低、识别效率不高且难以识别隐蔽的专业刷单行为。技术实现要素:本发明所要解决的技术问题是提供一种基于用户行为数据特征的刷单检测方法及系统,有效避免现有基于订单销量统计或简单规则的反刷单方式在应对日益专业的刷单手段时识别率偏低、容易失效等缺陷。为解决上述问题,本发明提出一种基于用户行为数据特征的刷单检测方法,包括以下步骤:S1:获取当前待检测交易的交易行为信息,包括多维度的行为特征属性;S2:输入所述交易行为信息至预先建立的大数据离群预测模型,提取出当前待检测交易中离群的行为特征属性,而判定其对应的交易行为为异常交易行为;所述大数据离群预测模型的建立步骤如下:获取一定时间段内一定量的用户购买商品所发生的交易行为信息;针对各个用户的交易行为信息,统计用户的多维度的行为特征属性,并将各个用户的行为特征属性依据属性关键词进行自动分集合归类;对分集合归类的各个行为特征属性进行离群分析,建立大数据离群预测模型;S3:针对所述异常交易行为的各个离群的行为特征属性,获取基于离群对应的行为特征属性构建的决策树进行验证,以判定所述异常交易行为是否为刷单行为。根据本发明的一个实施例,所述多维度的行为特征属性包括:交易频率、售前咨询比率、复购率、确认收货时间、长评价比率、交易前网站页面浏览时长;所述步骤S2中,将各个用户的行为特征属性依据属性关键词进行自动分集合归类后,对应得到包含有对应行为特征属性的数据集合A-F。根据本发明的一个实施例,所述步骤S2中,对分集合归类的各个行为特征属性进行离群分析,建立大数据离群预测模型,具体为:根据分集合归类各个行为特征属性后的数据集合A-F所包含的数据值,分别计算得到各个数据集合A-F的非离群取值区间,从而建立起用于判断各个行为特征属性是否离群的预测模型;通过预先建立的大数据离群预测模型,筛选出当前待检测交易中离群的行为特征属性,具体为:针对当前待检测交易的交易行为信息,利用所述数据集合A-F的非离群取值区间分别计算各个对应的行为特征属性是否离群,甄选出当前待检测交易中离群的行为特征属性。根据本发明的一个实施例,所述利用所述数据集合A-F的非离群取值区间分别计算各个对应的行为特征属性是否离群通过下述公式实现,若满足则为不离群,否则离群:其中,a为确定用户的交易频率这一属性的非离群取值区间时所设的第一预设值,为数据集合A中交易频率的平均值;b为确定用户的售前咨询比率这一属性的非离群取值区间时所设的第二预设值,为数据集合B中售前咨询比率的平均值;c为确定用户的复购率这一属性的非离群取值区间时所设的第三预设值,为数据集合C中复购率的平均值;d为确定用户的确认收货时间这一属性的非离群取值区间时所设的第四预设值,为数据集合D中确认收货时间的平均值;e为确认用户的长评价比率这一属性的非离群取值区间时所设的第五预设值,为数据集合E中长评价比率的平均值;f为确定用户的交易前网站页面浏览时长这一属性的非离群取值区间时所设的第六预设值,为数据集合F中交易前网站页面浏览时长的平均值。根据本发明的一个实施例,所述步骤S3包括:S31:根据各个异常交易行为所存在的各个离群的行为特征属性,建立或者获取基于离群对应的行为特征属性的决策树;S32:将每个所述异常交易行为中存在的各个离群的行为特征属性分别通过对应的决策树来验证,若所述异常交易行为中的全部离群的行为特征属性均被验证为刷单行为,则该异常交易行为判定为刷单行为,否则该异常交易行为判定为非刷单行为。根据本发明的一个实施例,建立基于用户的交易频率这一特征属性的决策树包括以下步骤A1和A2:A1:设定刷单行为的判定标准,将同时具有以下特征的IP或交易账号的交易行为判定为刷单行为:相同IP或交易账号的月购买商品频数大于一定单数;相同IP或交易账号购买商品的订单均为同一卖家的比例超过一定比例;相同IP或交易账号购买商品时收货地址一致;A2:根据先验知识提取交易频率的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户同IP或交易账号的交易频率的决策树;采用基于用户同IP或交易账号的交易频率的决策树验证时,获取初判为异常交易行为的待检测用户的月购买商品频数、卖家信息、收货地址,通过基于用户同IP或交易账号的交易频率的决策树判断异常交易行为是否为刷单行为。根据本发明的一个实施例,建立基于用户的售前咨询比率这一特征属性的决策树包括以下步骤B1和B2:B1:设定刷单行为的判定标准,将同时具有以下特征的用户售前咨询行为判定为刷单行为:超过一定比例的月订单均进行售前咨询;咨询时长均大于一定时长;B2:根据先验知识提取售前咨询比率的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的售前咨询比率的决策树;采用基于用户的售前咨询比率的决策树验证时,获取初判为异常交易行为的待检测用户购买商品订单信息、进行售前咨询信息,通过基于用户的售前咨询比率的决策树判断异常交易行为是否为刷单行为。根据本发明的一个实施例,建立基于用户的复购率这一特征属性的决策树包括以下步骤C1和C2:C1:设定刷单行为的判定标准,将同时具有以下特征的用户重复购买行为判定为刷单行为:相同交易账号月购买同一商品的频数大于一定单数;相同交易账号月购买同一商品均属于同一卖家;相同交易账号月购买同一商品收货地址均一致;C2:根据先验知识提取复购率的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的复购率的决策树;采用基于用户的复购率的决策树验证时,获取初判为异常交易行为的交易账号信息、对应账号购买同一商品的数量信息、卖家信息、商品收货地址,通过基于用户的复购率的决策树判断异常交易行为是否为刷单行为。根据本发明的一个实施例,建立基于确认收货时间这一特征属性的决策树构包括以下步骤D1和D2:D1:设定刷单交易的判定标准,将具有以下特征的确认收货行为判定为刷单行为:月购买一定比例以上订单的确认收货时间与下单时间间隔不超过一定时长;D2:根据先验知识提取确认收货时间的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的确认收货时间的决策树;采用基于用户的确认收货时间的决策树验证时,获取初判为异常交易行为的商品订单信息、下单时间、确认收货时间,通过基于用户的确认收货时间的决策树判断异常交易行为是否为刷单行为。根据本发明的一个实施例,建立基于长评价比率这一特征属性的决策树构包括以下步骤E1和E2:E1:设定刷单交易的判定标准,将同时具有以下特征的评价行为判定为刷单行为:月购买一定比例以上订单均参与评价;参与评价的订单评价字数均超过一定字数;参与评价的订单评价性质均为好评;E2:根据先验知识提取属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的长评价比率的决策树;采用基于用户的长评价比率的决策树验证时,获取初判为异常交易行为的商品订单信息、评价字数、评价性质、所对应用户参与评价的订单数量,通过基于用户的长评价比率的决策树判断异常交易行为是否为刷单行为。根据本发明的一个实施例,基于交易前网站页面浏览时长这一特征属性的决策树构建步骤包括以下步骤F1和F2:F1:设定刷单行为的判定标准,将具有以下特征的评价行为判定为刷单行为:月订单一定比例以上交易前浏览其他同类商品页面时长未超过一定时长;F2:根据先验知识提取交易前网站页面浏览时长的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的交易前网站页面浏览时长的决策树;采用基于用户的交易前网站页面浏览时长的决策树验证时,获取初判为异常交易行为的用户交易前浏览其他商品页面的时长信息,通过基于用户的交易前网站页面浏览时长的决策树判断异常交易行为是否为刷单行为。本发明还提供一种基于用户行为数据特征的刷单检测系统,包括:信息获取单元,执行获取当前待检测交易的交易行为信息,包括多维度的行为特征属性;刷单行为初判单元,执行输入所述交易行为信息至预先建立的大数据离群预测模型,提取出当前待检测交易中离群的行为特征属性,而判定其对应的交易行为为异常交易行为;所述大数据离群预测模型的建立步骤如下:获取一定时间段内一定量的用户购买商品所发生的交易行为信息;针对各个用户的交易行为信息,统计用户的多维度的行为特征属性,并将各个用户的行为特征属性依据属性关键词进行自动分集合归类;对分集合归类的各个行为特征属性进行离群分析,建立大数据离群预测模型;刷单行为判定单元,执行针对所述异常交易行为的各个离群的行为特征属性,获取基于离群对应的行为特征属性构建的决策树进行验证,以判定所述异常交易行为是否为刷单行为。采用上述技术方案后,本发明相比现有技术具有以下有益效果:本发明通过对大量用户交易记录进行多维度上的特征统计分析从而甄选出离群的异常交易记录,其中多维度包括交易频率、售前咨询比率、复购率、确认收货时间、长评价比率、交易前网站页面浏览时长,覆盖了交易的多方面,从多个维度来筛选当前交易的异常点,准确率相较于传统的反刷单方法有大大的提高,可将隐蔽的刷单行为检测出来;同时,通过大数据离群检测算法检测出当前交易各个维度的离群数据,提高了异常交易的识别效率;另外,在上述离群数据筛选结果的基础上,利用决策树算法对离群数据进行决策树交叉验证,判断所甄选的离群记录是否为刷单行为,防止将正常交易误判为刷单,进一步提高了异常交易检测的准确率。综上,与传统技术相比,基于用户行为数据特征的刷单检测方法使得识别率更高、且采用决策树验证提高了判断的准确性;同时在很大程度上维护了消费者的正当权益,保障了网上购物的真实性,也维持了电商市场的正常秩序。附图说明图1为本发明实施例的基于用户行为数据特征的刷单检测方法的流程示意图;图2为本发明实施例的基于用户进行售前咨询比率这一特征属性所构建的决策树示意图;图3为本发明实施例的基于用户长评价比率这一特征属性所构建的决策树示意图;图4为本发明实施例的基于用户相同IP/付款账号交易频率这一特征属性所构建的决策树示意图;图5为本发明实施例的基于用户确认收货时间这一特征属性所构建的决策树示意图;图6为本发明实施例的基于用户复购率这一特征属性所构建的决策树示意图;图7为本发明实施例的基于用户交易前浏览其他网站页面时长这一特征属性构建的决策树示意图。具体实施方式为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施的限制。参看图1,在一个实施例中,基于用户行为数据特征的刷单检测方法可以包括以下步骤:S1:获取当前待检测交易的交易行为信息,包括多维度的行为特征属性;S2:输入所述交易行为信息至预先建立的大数据离群预测模型,提取出当前待检测交易中离群的行为特征属性,而判定其对应的交易行为为异常交易行为;所述大数据离群预测模型的建立步骤如下:获取一定时间段内一定量的用户购买商品所发生的交易行为信息;针对各个用户的交易行为信息,统计用户的多维度的行为特征属性,并将各个用户的行为特征属性依据属性关键词进行自动分集合归类;对分集合归类的各个行为特征属性进行离群分析,建立大数据离群预测模型;S3:针对所述异常交易行为的各个离群的行为特征属性,获取基于离群对应的行为特征属性构建的决策树进行验证,以判定所述异常交易行为是否为刷单行为。本发明针对大量虚假交易的出现并且在现有技术无法甄别有组织的专业刷单的情况下,提出基于用户行为数据特征的刷单检测方法及系统,通过对过往用户的大量购物行为在多个维度上的特征统计分析数据,筛选出那些离群的行为特征属性具有的特性,从而建立模型。之后利用模型去检测当前交易中的行为特征属性是否离群,并采用离群的行为特征属性对应的决策树进行交叉验证和确定。解决了传统甄别虚假交易方法的不足,有效避免现有基于订单销量统计或简单规则的反刷单方法在应对日益专业的刷单手段时识别率偏低、容易失效等缺陷,同时也维持了电商市场的正常秩序,维护了消费者的正当权益。下面对本发明实施例的基于用户行为数据特征的刷单检测方法进行更具体的描述。步骤S1中,获取当前待检测交易的交易行为信息,包括多维度的行为特征属性。该多维度的行为特征属性是步骤S2中用来进行大数据离群预测的,因而符合模型的数据输入要求。接着执行步骤S2,输入所述交易行为信息至预先建立的大数据离群预测模型,提取出当前待检测交易中离群的行为特征属性,而判定其对应的交易行为为异常交易行为。所述大数据离群预测模型的建立步骤如下:1、获取一定时间段内一定量的用户购买商品所发生的交易行为信息;2、针对各个用户的交易行为信息,统计用户的多维度的行为特征属性,并将各个用户的行为特征属性依据属性关键词进行自动分集合归类;3、对分集合归类的各个行为特征属性进行离群分析,建立大数据离群预测模型。大数据离群预测模型的建立步骤中,首先,获取一定时间段内一定量的用户购买商品所发生的交易行为信息。该一定量最好是大量的,优选是上万个,具体并不限制,例如获取某网购平台上10万个用户某段时间内购买商品的交易行为信息。同样的,所述的一定时间段也并不限制,可以根据需要而选择。所获取的交易行为信息中可以提取出用户多维度的行为特征属性数据。当然,获取的数据源可以是直接从网络平台上获取,当然也可以是预存在服务器中的数据,具体不限。网络平台是可购物的任意网络平台,具体不限。本发明实施例获取的交易行为信息是基于用户的,各个用户拥有对应的交易行为信息。这些交易行为信息可以直接提取出行为特征属性数据,或者通过一定的统计计算之后得到行为特征属性数据。大数据离群预测模型的建立步骤中,然后,针对各个用户的交易行为信息,统计用户的多维度的行为特征属性,并将各个所述用户的行为特征属性依据属性关键词进行自动分集合归类,可利用数据库查询语言通过计算机执行自动实现。对用户的交易行为信息进行数据预处理,计算得出用户多维度的行为特征属性,不再是单一维度,而且是基于用户的交易行为信息处理得到的行为特征属性,提高刷单行为的识别率。优选的,所述步骤S2中,多维度的行为特征属性包括:交易频率、售前咨询比率、复购率、确认收货时间、长评价比率、交易前网站页面浏览时长。当然,步骤S1中的多维度的行为特征属性也可以包括这些内容。交易频率可以是用户的同IP或交易账号(交易账号例如是付款账号)的交易频率。同IP/付款账号的交易频率指用户使用同一交易账号或者相同IP地址在某段时间内交易次数所占该用户总交易次数的比例。售前咨询比率指用户交易前与卖家进行商品咨询的交易次数所占该用户总交易次数的比例。复购率指单位时间段(设定)内用户使用某一交易账号对某一商品的重复购买次数。长评价比率指用户对商品进行评价的字数超过一定字数(例如是200字)的订单所占总交易订单的比例。确认收货时间指用户购买商品并付款后在交易平台与卖家确认货物已收到的时间。交易前网站页面浏览时长指用户购买商品前浏览其他同类商品网页的时长。以上统计数据的依据均为从某网购平台上获取的10万个用户某段时间内购买商品的交易行为信息,以上所涉及的用户总交易也为该笔数据中该用户的总交易。将各个用户的行为特征属性依据属性关键词进行自动分集合归类后,对应得到包含有对应行为特征属性的数据集合A-F。本发明实施例采用多维度统计分析,基于用户交易行为信息中多个属性角度对数据进行统计筛选,即用户同IP/付款账号的交易频率、进行售前咨询的比率、复购率、确定收货时间、长评价比率、交易前网站页面浏览时长,经统计后将数据相近的属性所对应的交易行为归为一类,从而筛选出离群的异常交易行为。用户的数量例如是n个。在选取的用户交易行为信息中,将各个用户所对应的同IP/付款账号的交易频率A1、A2、A3...Ar这一特征属性分配至数据集合A中,即A={A1、A2、A3...An};将各个用户所对应的进行售前咨询比率B1、B2、B3...Bn这一特征属性分配至数据集合B中,即B={B1、B2、B3...Bn},将各个用户所对应的复购率C1、C2、C3...Cn这一特征属性分配至数据集合C中,即C={C1、C2、C3...Cn};将各个用户所对应的确定收货时间D1、D2、D3...Dn这一特征属性分配至数据集合D中,即D={D1、D2、D3...Dn};将各个用户所对应的长评价比率E1、E2、E3...En这一特征属性分配至数据集合E中,即E={E1、E2、E3...En},将各个用户所对应的交易前网站页面浏览时长F1、F2、F3...Fn这一特征属性分配至数据集合F中,即F={F1、F2、F3...Fn}。大数据离群预测模型的建立步骤中,最后,对分集合归类的各个行为特征属性进行离群分析,建立大数据离群预测模型。从而可以根据建立的大数据离群预测模型,将步骤S1中的当前待检测的交易行为信息进行初判,筛选出当前待检测交易中离群的行为特征属性,将其对应的交易行为初判为异常交易行为。在一个实施例中,所述步骤S2中,对分集合归类的各个行为特征属性进行离群分析,建立大数据离群预测模型,具体为:根据分集合归类各个行为特征属性后的数据集合A-F所包含的数据值,分别计算得到各个数据集合A-F的非离群取值区间,从而建立起用于判断各个行为特征属性是否离群的预测模型;通过预先建立的大数据离群预测模型,筛选出当前待检测交易中离群的行为特征属性,具体为:针对当前待检测交易的交易行为信息,利用所述数据集合A-F的非离群取值区间分别计算各个对应的行为特征属性是否离群,甄选出当前待检测交易中离群的行为特征属性。优选的,所述利用所述数据集合A-F的非离群取值区间分别计算各个对应的行为特征属性是否离群通过下述公式实现,若满足则为不离群,否则离群:其中,a为确定用户的交易频率这一属性的非离群取值区间时所设的第一预设值,为数据集合A中交易频率的平均值;可由下式计算得:b为确定用户的售前咨询比率这一属性的非离群取值区间时所设的第二预设值,为数据集合B中售前咨询比率的平均值;可由下式计算得:c为确定用户的复购率这一属性的非离群取值区间时所设的第三预设值,为数据集合C中复购率的平均值;可由下式计算得:d为确定用户的确认收货时间这一属性的非离群取值区间时所设的第四预设值,为数据集合D中确认收货时间的平均值;可由下式计算得:e为确认用户的长评价比率这一属性的非离群取值区间时所设的第五预设值,为数据集合E中长评价比率的平均值;可由下式计算得:f为确定用户的交易前网站页面浏览时长这一属性的非离群取值区间时所设的第六预设值,为数据集合F中交易前网站页面浏览时长的平均值,可由下式计算得知:预设值a~f可以根据数据的分布确定,在获取对应数据的时候,可以统计得出大部分数据的数字区间,从而可以设定出偏远数据的判定阈值。本实施例将对用户的交易行为信息中选定的每个属性进行逐个判定,若用户交易行为信息中存在任何一个或一个以上属性未落入上述非离群取值区间内,则该属性为离群的异常属性,提取该属性所对应的用户交易行为,并将该交易行为初判为异常交易行为。在初判出异常交易行为后,接着执行步骤S3,针对所述异常交易行为的各个离群的行为特征属性,获取基于离群对应的行为特征属性构建的决策树进行验证,以判定所述异常交易行为是否为刷单行为。若在甄选离群的异常交易行为时用户因某一个或者一个以上特征属性异常而被初判为异常交易行为,在进行决策树验证时则基于离群的异常特征属性对初判为异常交易的行为进行验证。在一个实施例中,所述步骤S3包括:S31:根据各个异常交易行为所存在的各个离群的行为特征属性,建立或者获取基于离群对应的行为特征属性的决策树;由于在行为特征属性数据均确定的情况下,这些决策树可以预先建立,而在确定离群的行为特征属性时,可以基于该离群的行为特征属性调取对应的决策树进行判定;S32:将每个所述异常交易行为中存在的各个离群的行为特征属性分别通过对应的决策树来验证,若所述异常交易行为中的全部离群的行为特征属性均被验证为刷单行为,则该异常交易行为判定为刷单行为,否则该异常交易行为判定为非刷单行为。若在筛选离群交易行为时某个用户因多个特征属性异常而被初判为异常交易行为,则分别用对应的决策树进行验证,若其中一个决策树判定为刷单,则必须进行下一个决策树的判定,必须要离群属性特征均为刷单才行,只要有其中一个判为非刷单,则该交易为非刷单,提高判为刷单的条件,以防止将正常交易误判为刷单。优选的,参看图4,建立基于用户的交易频率这一特征属性的决策树包括以下步骤A1和A2:A1:设定刷单行为的判定标准,将同时具有以下特征的IP或交易账号的交易行为判定为刷单行为:相同IP或交易账号的月购买商品频数大于一定单数,例如是10单;相同IP或交易账号购买商品的订单均为同一卖家的比例超过一定比例,例如是90%;相同IP或交易账号购买商品时收货地址一致;A2:根据先验知识提取交易频率的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户同IP或交易账号的交易频率的决策树。信息增益可以对属性特征进行一定的定量,可以通过信息学知识来计算信息增益,在此不再赘述。采用基于用户同IP或交易账号的交易频率的决策树验证时,获取初判为异常交易行为的待检测用户的月购买商品频数、卖家信息、收货地址,通过基于用户同IP或交易账号的交易频率的决策树判断异常交易行为是否为刷单行为。优选的,参看图2,建立基于用户的售前咨询比率这一特征属性的决策树包括以下步骤B1和B2:B1:设定刷单行为的判定标准,将同时具有以下特征的用户售前咨询行为判定为刷单行为:超过一定比例的月订单均进行售前咨询,例如是90%以上;咨询时长均大于一定时长,例如是8min;B2:根据先验知识提取售前咨询比率的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的售前咨询比率的决策树。采用基于用户的售前咨询比率的决策树验证时,获取初判为异常交易行为的待检测用户购买商品订单信息、进行售前咨询信息,通过基于用户的售前咨询比率的决策树判断异常交易行为是否为刷单行为。优选的,参看图6,建立基于用户的复购率这一特征属性的决策树包括以下步骤C1和C2:C1:设定刷单行为的判定标准,将同时具有以下特征的用户重复购买行为判定为刷单行为:相同交易账号月购买同一商品的频数大于一定单数,例如是10单;相同交易账号月购买同一商品均属于同一卖家;相同交易账号月购买同一商品收货地址均一致;C2:根据先验知识提取复购率的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的复购率的决策树。采用基于用户的复购率的决策树验证时,获取初判为异常交易行为的交易账号信息、对应账号购买同一商品的数量信息、卖家信息、商品收货地址,通过基于用户的复购率的决策树判断异常交易行为是否为刷单行为。优选的,参看图5,建立基于确认收货时间这一特征属性的决策树构包括以下步骤D1和D2:D1:设定刷单交易的判定标准,将具有以下特征的确认收货行为判定为刷单行为:月购买一定比例(例如是90%)以上订单的确认收货时间与下单时间间隔不超过一定时长(例如2小时);D2:根据先验知识提取确认收货时间的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的确认收货时间的决策树;采用基于用户的确认收货时间的决策树验证时,获取初判为异常交易行为的商品订单信息、下单时间、确认收货时间,通过基于用户的确认收货时间的决策树判断异常交易行为是否为刷单行为。优选的,参看图3,建立基于长评价比率这一特征属性的决策树构包括以下步骤E1和E2:E1:设定刷单交易的判定标准,将同时具有以下特征的评价行为判定为刷单行为:月购买一定比例(例如是90%)以上订单均参与评价;参与评价的订单评价字数均超过一定字数(例如是200字);参与评价的订单评价性质均为好评;E2:根据先验知识提取属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的长评价比率的决策树;采用基于用户的长评价比率的决策树验证时,获取初判为异常交易行为的商品订单信息、评价字数、评价性质、所对应用户参与评价的订单数量,通过基于用户的长评价比率的决策树判断异常交易行为是否为刷单行为。优选的,参看图7,基于交易前网站页面浏览时长这一特征属性的决策树构建步骤包括以下步骤F1和F2:F1:设定刷单行为的判定标准,将具有以下特征的评价行为判定为刷单行为:月订单一定比例(例如是80%)以上交易前浏览其他同类商品页面时长未超过一定时长(2min);F2:根据先验知识提取交易前网站页面浏览时长的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的交易前网站页面浏览时长的决策树;采用基于用户的交易前网站页面浏览时长的决策树验证时,获取初判为异常交易行为的用户交易前浏览其他商品页面的时长信息,通过基于用户的交易前网站页面浏览时长的决策树判断异常交易行为是否为刷单行为。下面结合一个具体实例对本发明进一步解释:获取某网购平台上10万个用户某段时间内购买商品的交易行为信息,对数据进行预处理后计算得出用户同IP/付款账号的交易频率、售前咨询比率、复购率、确认收货时间、长评价比率、交易前网站页面浏览时长。下面仅以其中10个为例,具体信息如表(1)所示:表(1)获取用户行为交易信息后,对用户交易信息进行预处理,计算得出用户同IP/付款账号的交易频率、售前咨询比率、确认收货时间、复购率、长评价比率、交易前网站页面浏览时长、同一IP地址切换不同账号进行交易的交易频率这七个特征属性,将该实施例中用户同IP/付款账号的交易频率这一特征属性划分至数据集合A中,其中A={0.28、0.30......0.28};将该实施例中用户进行售前咨询=比率这一特征属性划分至数据集合B中,其中B={20.00%、0.00%......25.00%};将该实施例用户复购率这一特征属性划分至数据集合C中,其中C={1.00%、0.00%......5.00%};将该实施例中用户确认收货时间这一特征属性划分至数据集合D中,其中D={80h、120h......88h};将该实施例中用户长评价比率这一特征属性划分至数据集合E中,其中E={39.00%、36.00%......35.00%},将该实施例中用户交易前网站页面浏览时长这一特征属性划分至数据集合F中,其中F={5min、8min......9min}。设用户交易行为信息中同IP/付款账号的交易频率的平均值为根据表(1)提供的数据,可由下式计算:经计算得知,用户的交易行为信息中用户同IP/付款账号的交易频率的平均值为0.296,系统在确定用户同IP/付款账号交易频率这一属性的非离群取值区间时所设的预设值a=0.15,根据本发明实施例提供的计算公式来判断待检测交易行为是否属于离群的异常交易行为:0.296-0.15≤Ai≤0.296+0.15设用户进行售前咨询比率的平均值为根据表(1)提供的数据,可由下式计算:经计算得知,用户的交易行为信息中用户进行售前咨询比率的平均值为0.236,系统在确定用户进行售前咨询比率这一属性的非离群取值区间时所设的预设值b=0.1,根据本发明实施例提供的计算公式来判断待检测交易行为是否属于离群的异常交易行为:0.236-0.1≤Bi≤0.236+0.1设用户复购率的平均值为根据表(1)提供的数据,可由下式计算:经计算得知,用户的交易行为中用户复购率的平均值为0.068,系统在确定用户复购率这一属性的非离群取值区间时所设的预设值c=0.06,根据本发明实施例提供的计算公式来判断待检测交易行为是否属于离群的异常交易行为:0.068-0.06≤Ci≤0.068+0.06设用户确认收货时间的平均值为根据表(1)提供的数据,可由下式计算:经计算得知,用户的交易行为中确定收货时间的平均值为78.5h,系统在确定用户确认收货时间这一属性的非离群取值区间时所设的预设值d=24h,根据本发明实施例提供的计算公式来判断待检测交易行为是否属于离群的异常交易行为:78.5-24≤Di≤78.5+24设用户长评价比率的平均值为根据表(1)提供的数据,可由下式计算:经计算得知,用户的交易行为中长评价比率的平均值为0.402,系统在确定用户长评价比率这一属性的非离群取值区间时所设的预设值e=0.2,根据本发明实施例提供的计算公式来判断待检测交易行为是否属于离群的异常交易行为:0.402-0.2≤Ei≤0.402+0.2设用户交易前网站页面浏览时长的平均值为根据表(1)中提供的数据,可由下式计算:经计算得知,用户的交易行为中用户交易前浏览网站页面时长的平均值为6.7min,系统在确定用户交易前浏览网站页面时长这一属性的非离群取值区间时所设的预设值f=4min,根据本发明实施例提供的计算公式来判断待检测交易行为是否属于离群的异常交易行为:6.7-4≤Fi≤6.7+4至此,大数据离群预测模型建立完成。现当前有一笔交易信息如下:通过大数据离群预测模型筛选出该交易的离群的属性特征为售前咨询比率、复购率、确认收货时间,因此将上述交易初判为异常交易行为,再通过决策树对其是否是刷单行为进行进一步的判定,具体步骤如下:若在甄选离群的异常交易行为时用户因某一个或者一个以上特征属性异常而被初判为异常交易行为,在进行决策树判定时则基于离群的异常特征属性对初判为异常的交易行为进行交叉验证。若在筛选离群交易行为时某个用户因多个特征属性异常而被初判为异常交易行为,则分别用对应的决策树进行验证,若其中一个决策树判定为刷单,则必须进行另一个决策树的判定,必须要离群属性特征均为刷单才行,只要有其中一个判为非刷单,则该交易为非刷单。对于上述交易行为,在筛选离群交易行为时因售前咨询比率、复购率、确认收货时间这三个特征属性异常而被初判为异常交易行为,故在进行决策树验证时基于这三个特征属性对其构建或获取决策树,若这三个特征属性在决策树验证时均满足刷单交易的判定标准,则确定该用户的交易行为为刷单行为,具体步骤可以分别根据图2、图6和图5来实现。基于该用户售前咨询比率这一特征属性构建决策树验证如图2所示,具体步骤如下:获取该用户近一个月内购买商品的进行售前咨询的记录,如表(2)所示:交易账号交易时间商品名称是否进行售前咨询咨询时长marry@qq.com2017.11.01登山靴否0marry@qq.com2017.11.01登山包否0marry@qq.com2017.11.02棉衣否0marry@qq.com2017.11.06棉衣否0marry@qq.com2017.11.15羽绒服否0marry@qq.com2017.11.18羽绒服否0marry@qq.com2017.11.18钢笔否0marry@qq.com2017.11.20钢笔否0marry@qq.com2017.11.29钢笔否0marry@qq.com2017.11.30钢笔否0表(2)由上表可知,该用户近一个月内购买商品时均未进行售前咨询,该用户进行售前咨询行为不符合刷单判定标准,故不需要再从复购率、确认收货时间这两个特征属性对其进行决策树,故该交易行为不属于刷单行为。另当前有一笔交易信息如下:对于该笔交易行为,在筛选离群交易行为时因长评价比率这一个特征属性异常而被初判为异常交易行为,故在进行决策树验证时基于这一个特征属性对其构建决策树,若这一个特征属性在决策树验证时均满足刷单交易的判定标准,则确定该用户的交易行为为刷单行为,具体步骤如下:基于该用户长评价比率这一特征属性构建决策树验证如图3所示,具体步骤如下:获取该用户近一个月内购买商品时参与评价的记录信息,如表(3)所示:交易账号交易时间商品名称是否参与评价评价字数评价性质138620350282017.11.04手机是220好评138620350282017.11.04棉衣是218好评138620350282017.11.17棉衣是209好评138620350282017.11.18棉衣是200好评138620350282017.11.18拖鞋是254好评138620350282017.11.18羽绒服是204好评138620350282017.11.19拖鞋是213好评138620350282017.11.25拖鞋是222好评138620350282017.11.27拖鞋是224好评138620350282017.11.29围巾是235好评138620350282017.11.30羽绒服是220好评138620350282017.11.30卫衣是210好评138620350282017.11.30棉衣是201好评表(3)由上表可知,该用户近一个月内购买商品时90%以上订单均参与评价,且每笔订单评价字数均为200字以上,评价性质均为好评;该用户参与评价行为符合刷单标准,故该笔交易行为属于刷单行为。本发明还提供一种基于用户行为数据特征的刷单检测系统,包括:信息获取单元,执行获取当前待检测交易的交易行为信息,包括多维度的行为特征属性;刷单行为初判单元,执行输入所述交易行为信息至预先建立的大数据离群预测模型,提取出当前待检测交易中离群的行为特征属性,而判定其对应的交易行为为异常交易行为;所述大数据离群预测模型的建立步骤如下:获取一定时间段内一定量的用户购买商品所发生的交易行为信息;针对各个用户的交易行为信息,统计用户的多维度的行为特征属性,并将各个用户的行为特征属性依据属性关键词进行自动分集合归类;对分集合归类的各个行为特征属性进行离群分析,建立大数据离群预测模型;刷单行为判定单元,执行针对所述异常交易行为的各个离群的行为特征属性,获取基于离群对应的行为特征属性构建的决策树进行验证,以判定所述异常交易行为是否为刷单行为。关于本发明实施例的基于用户行为数据特征的刷单检测系统的具体内容可以参看前述实施例中关于基于用户行为数据特征的刷单检测方法部分的描述内容,在此不再赘述。本发明虽然以较佳实施例公开如上,但其并不是用来限定权利要求,任何本领域技术人员在不脱离本发明的精神和范围内,都可以做出可能的变动和修改,因此本发明的保护范围应当以本发明权利要求所界定的范围为准。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1