一种基于订单属性和用户行为的反作弊识别方法及系统与流程

文档序号：15560319发布日期：2018-09-29 02:05阅读：217来源：国知局

本发明实施例涉及数据处理技术领域，尤其涉及一种基于订单属性和用户行为的反作弊识别方法及系统。

背景技术：

当前，打车场景的反作弊就是通过技术手段去识别异常的订单、司机及乘客，其技术的核心是如何准确的识别这些异常的订单和用户。常用的技术手段是，根据历史信息和经验制定识别反作弊的规则，如果用户行为被这个规则覆盖，那么该用户就是作弊用户。例如，某一个乘客长期使用高额代金券支付车费，那么这个乘客作弊的嫌疑就非常大。

由于现有的识别反作弊的规则是人为设定的单一的反作弊规则，仅根据历史信息和经验来判定，脱离了对待判断订单的自身属性信息，缺乏弹性和更新能力，一方面准确性难以保证；另一方面，为了获取平台补贴，同时躲避平台的反作弊策略，司机和乘客常常会研究平台的反作弊策略，单一的反作弊规则很容易被发现，进而会被作弊的司机和乘客利用，所以单一的反作弊规则往往过一段时间就开始失效，使用周期短。

因此，如何准确识别作弊的订单、乘客和司机的问题是目前业界亟待解决的需要课题。

技术实现要素：

针对现有技术中的缺陷，本发明实施例提供一种基于订单属性和用户行为的反作弊识别方法及系统。

一方面，本发明实施例提供一种基于订单属性和用户行为的反作弊识别方法，包括：

获取所述订单的属性信息和所述订单相关的用户的行为信息；

根据所述属性信息和所述行为信息，通过作弊预测模型获得所述订单的作弊概率；

将所述订单的作弊概率与第一阈值相比较，如果所述订单的作弊概率大于所述第一阈值，则判断所述订单为作弊订单。

另一方面，本发明实施例提供一种基于订单属性和用户行为的反作弊识别系统，包括：

第一获取单元，用于获取所述订单的属性信息和所述订单相关的用户的行为信息；

第二获取单元，用于根据所述属性信息和所述行为信息，通过作弊预测模型获得所述订单的作弊概率；

第一判定单元，用于将所述订单的作弊概率与第一阈值相比较，如果所述订单的作弊概率大于所述第一阈值，则判断所述订单为作弊订单。

本发明实施例提供的基于订单属性和用户行为的反作弊识别方法及系统，综合考虑订单的属性信息和与该订单相关的用户的行为信息，并通过作弊预测模型来识别该订单是否为作弊订单，精确度高，进而能有效地提高识别订单的准确性，同时也能避免被作弊的用户利用，以延长作弊预测模型的使用效力。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的基于订单属性和用户行为的反作弊识别方法的流程示意图；

图2为本发明实施例提供的基于订单属性和用户行为的反作弊识别方法中建立作弊预测模型的流程示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明实施例提供的基于订单属性和用户行为的反作弊识别方法的流程示意图，如图1所示，本实施例提供一种基于订单属性和用户行为的反作弊识别方法，包括：

s1、获取所述订单的属性信息和所述订单相关的用户的行为信息；

具体地，本申请提供的反作弊识别方法综合考虑了订单的属性信息和与该订单相关的用户的行为信息，能有效避免了现有的单一规则很容易被发现，进而会被作弊的用户所利用，造成识别准确率低及容易失效的问题；其中，用户包括司机和下单用户，为便于描述，将司机标记为司机，下单用户则相应标记为乘客。

s2、根据所述属性信息和所述行为信息，通过作弊预测模型获得所述订单的作弊概率；

具体地，在训练好的作弊预测模型中输入步骤s1中获取的订单的属性信息和与该订单相关的用户的行为信息，经计算后，可以输出该订单是否为作弊订单的概率，以为后续判断该订单是否为作弊订单提供数据支撑。其中，订单的作弊概率越高，则该订单作弊的可能性越大。

s3、将所述订单的作弊概率与第一阈值相比较，如果所述订单的作弊概率大于所述第一阈值，则判断所述订单为作弊订单。

具体地，将步骤s2中计算得到的该待识别订单的作弊概率与第一阈值进行比较，若该待识别订单的作弊概率大于第一阈值，则认定该待识别的订单为作弊订单；其中，第一阈值的选择关系到作弊订单的识别，即选择高的阈值，作弊订单的识别会比较准确，但是相应的可以识别的作弊订单数量会降低，具体可根据实际实施条件进行合理的确定第一阈值的数值大小。

在上述实施例的基础上，进一步地，在步骤s3中，还包括：若该待识别订单的作弊概率小于等于第一阈值，则认定该待识别的订单为正常订单。在本实施例中，该订单的状态分为作弊订单和正常订单两种，通过作弊预测模型计算得到的该订单的作弊概率与第一阈值的比较，来判定该订单为作弊订单或正常订单。

进一步地，在上述实施例的基础上，在判断所述订单为作弊订单后，就可以根据作弊订单来判定该用户是否为作弊用户了，即：

增加所述作弊订单对应的用户的作弊订单数；将所述作弊订单数与第二阈值相比较，若所述作弊订单数大于第二阈值，则判断所述用户为作弊用户。具体地，增加与该作弊订单相关的用户的作弊订单数，如可以采取单次加一的方式来增加用户的作弊订单数，当该用户的作弊订单数超过第二阈值时，则将该用户列为作弊用户。其中，第二阈值的选择直接关系到作弊用户的识别，即选择高的阈值，作弊用户的识别会比较准确，但是相应的可以识别的作弊用户数量会降低，具体可根据实际实施条件进行合理的确定第二阈值的数值大小。

特别的，在本实施例中，用户包括司机及乘客，具体地，作弊司机和作弊乘客的判定，可以根据一个司机或者乘客对应的作弊订单数，并与设置相应的阈值比较后进行判定，如可以认为某乘客的作弊订单数大于n(其中，阈值设为n)，则该乘客为作弊乘客；如可以认为某司机的作弊订单数大于m(其中，阈值设为m)，则该司机为作弊司机；m和n的值可以根据具体实施条件来自由调整。

另外，本发明实施例提供的基于订单属性和用户行为的反作弊识别方法及系统，可用于所有存在“订单”、“乘客”、“司机”用户的o2o平台，如：乘客、司机刷单骗取平台的补贴。具体通过综合考虑订单的属性信息和司机、乘客在该订单的行为信息，基于作弊预测模型来识别该订单是否为作弊订单，提高了识别订单的准确性，同时也避免被作弊的司机和乘客利用，以延长作弊预测模型的使用效力。

在上述实施例的基础上，进一步地，在步骤s2之前，所述方法还包括作弊预测模型的建立过程，具体如图2所示，包括：

p1、获取订单样本集合，所述订单样本集合中的至少一个订单样本包括订单的属性信息、所述用户在该订单样本的行为信息及所述用户的历史行为信息；其中，用户包括司机和乘客；

具体地，先获取订单样本集合，该订单样本集合包括若干个订单样本，至少一个订单样本包括订单的属性信息、所述用户在该订单样本的行为信息及所述用户的历史行为信息；部分乘客首次使用的订单样本只包括订单的属性信息、司机和乘客在该订单的行为信息及司机的历史行为信息；部分司机首次使用的订单样本只包括订单的属性信息、司机和乘客在该订单的行为信息及乘客的历史行为信息。

p2、根据所述订单样本集合，采用机器学习算法，训练得到所述作弊预测模型。

具体地，对步骤p1中的订单样本集合进行分析，采用机器学习算法，对作弊预测模型的参数进行优化，经过训练得到作弊预测模型。其中，线下训练时，选择机器学习算法进行不断的迭代和优化模型，直到得到识别作弊订单的准确性满足要求的作弊预测模型，实现简单、易于理解和实现、计算速度很快且存储资源低。其中，机器学习算法可以为迭代决策树，也可以为逻辑斯蒂回归，或为其它如朴素贝叶斯算法或平均单依赖估计等算法。

其中，作弊预测模型综合考虑了订单的属性信息、司机和乘客在该订单的行为信息、司机和乘客的历史行为信息，避免了现有的单一规则很容易被发现，进而会被作弊的司机和乘客利用，造成识别准确率低及容易失效的问题。

在上述实施例的基础上，进一步地，在根据所述订单样本集合，采用机器学习算法，对所述作弊预测模型的参数进行优化，训练得到所述作弊预测模型之前，还包括：基于判断规则识别所述订单样本集合的每一个订单样本的订单类别，所述订单类别为正样本或负样本。

具体地，所述订单样本集合内的订单类别可以分为正样本和负样本两大类；其中，正样本指的是正常订单，负样本指的是作弊订单，正样本和负样本是根据判断规则来确认的。特别的，作弊订单包括司机作弊订单和乘客作弊订单；为了防止误伤，判断司机或者乘客是否作弊，可以根据一个司机或者乘客对应的作弊订单数，设置相应的阈值来判定，具体的阈值可以根据所需负样本识别的准确率来进行相应的设置。

在上述实施例的基础上，进一步地，在所述训练得到所述作弊预测模型之后，还包括：对所述作弊预测模型的参数进行优化，直至优化后的所述作弊预测模型识别作弊订单的正确率达到第三阈值；其中，所述识别作弊订单的正确率包括所述负样本识别的召回率和所述负样本识别的准确率。其中，两者的定义如下：

负样本召回率＝a/(a+b)；负样本准确率＝a/(a+c)

其中，a：原负样本，预测为负样本；b：原负样本，预测为正样本；c：原正样本，预测为负样本。

特别的，负样本识别的召回率和负样本识别的准确率这两个指标一般情况是负向的关系，同一模型的负样本召回率越高则负样本识别的准确率会越低，具体可以根据业务的需要来选择需要偏向的指标。比如，要求尽量多的召回负样本，识别作弊订单，那么负样本识别的准确率可以稍微降低一些；要求高精度的识别作弊订单，那么负样本识别的召回率可以稍微降低一些。

本申请提供的基于订单属性和用户行为的反作弊识别方法综合考虑了待识别订单的属性信息、司机、乘客在该单的行为信息及司机和乘客的历史行为信息，建立作弊预测模型，大大提高了识别订单的准确性，同时也避免被作弊的司机和乘客利用。

在上述实施例的基础上，进一步地，所述用户的历史行为信息包括以下信息的一种或多种：所述乘客的历史作弊行为、所述乘客的注册时间、所述乘客的手机号/设备是否是黑名单用户、所述司机的历史作弊行为、所述司机的注册时间及所述司机的该天的订单数；所述订单的属性信息包括以下信息的一种或多种：所述乘客的发单时间、所述乘客的发单区域、所述司机完成所述订单的速度、所述订单的距离费用比及所述司机完成所述订单的时间；所述行为信息包括以下信息的一种或多种：所述司机的行驶速度、所述司机的行驶轨迹、所述乘客距离订单起点的位置及所述乘客支付时距离终点的位置。

其中，所述乘客的发单区域指的是乘客在发出订单时其所在区域；所述订单的距离费用比指的是：司机从接乘客地点至送达乘客地点之间的距离与乘客支付该订单的金额的比值，可根据经验值来判断该订单属于作弊订单还是正常订单。

在上述实施例的基础上，进一步地，本发明实施例还提供了一种基于订单属性和用户行为的反作弊识别系统，包括：

第一获取单元，用于获取所述订单的属性信息和所述订单相关的用户的行为信息；第二获取单元，用于根据所述属性信息和所述行为信息，通过作弊预测模型获得所述订单的作弊概率；第一判定单元，用于将所述订单的作弊概率与第一阈值相比较，如果所述订单的作弊概率大于所述第一阈值，则判断所述订单为作弊订单。其中，用户包括司机及乘客。

具体地，本申请提供的基于订单属性和用户行为的反作弊识别系统，首先通过第一获取单元来获取订单的属性信息和司机、乘客在该订单的行为信息，其次通过第二获取单元订单，根据订单的属性信息及行为信息，结合作弊预测模型来计算该订单为作弊订单的概率，最后通过第一判定单元将该订单为作弊订单的概率与第一阈值做比值，若获取订单的作弊概率大于第一阈值，则判定该订单为作弊订单；相应的，若获取订单的作弊概率小于等于第一阈值，则判定该订单为正常订单。其中，第一阈值的选择关系到作弊订单的识别，即选择高的阈值，作弊订单的识别会比较准确，但是相应的可以识别的作弊订单数量会降低，具体可根据实际实施条件进行合理的确定第一阈值的数值大小。

在上述实施例的基础上，进一步地，所述系统还包括：

记录单元，用于在所述判断所述订单为作弊订单后，增加所述作弊订单对应的用户的作弊订单数；

第二判定单元，用于将所述作弊订单数与第二阈值相比较，若所述作弊订单数大于第二阈值，则判断所述用户为作弊用户。

具体地，在判断该订单为作弊订单后，通过记录单元增加所述作弊订单对应的用户的作弊订单数，并将增加后的用户的作弊订单数与第二阈值相比较，若所述作弊订单数大于第二阈值，则判断所述用户为作弊用户。

用户包括司机和乘客，若该订单为作弊订单，进一步地，可分别根据司机和乘客各自对应的阈值进行进一步地判断该司机是否为作弊司机及该乘客是否为作弊乘客。其中，判别标准为若大于预设作弊阈值，则为作弊用户；若小于等于预设作弊阈值，则为正常用户。

在上述实施例的基础上，进一步地，所述系统还包括：

第三获取单元，用于在所述通过作弊预测模型获得所述订单的作弊概率之前获取订单样本集合，所述订单样本集合中的至少一个订单样本包括订单的属性信息、所述用户在该订单样本的行为信息及所述用户的历史行为信息；建模单元，用于根据所述订单样本集合，采用机器学习算法，训练得到所述作弊预测模型。

在计算单元计算获取订单的作弊概率之前需先建立作弊预测模型，具体地，首先通过第三获取单元获取订单样本集合，其次通过建模单元分析订单样本集合的信息，采用机器学习算法，训练得到作弊预测模型。

在上述实施例的基础上，进一步地，所述系统还包括：识别单元，用于在所述根据所述订单样本集合，采用机器学习算法，训练得到所述作弊预测模型之前，基于判断规则识别所述订单样本集合的每一个订单样本的订单类别，所述订单类别为正样本或负样本。

具体地，在训练得到作弊预测模型之前，通过识别单元来识别订单样本集合的每一个订单的订单类别，以为后续的计算负样本识别的召回率和所述负样本识别的准确率做准备。

在上述实施例的基础上，进一步地，所述系统还包括：优化单元，用于在所述训练得到所述作弊预测模型之后，对所述作弊预测模型的参数进行优化，直至优化后的所述作弊预测模型识别作弊订单的正确率达到第三阈值；其中，所述识别作弊订单的正确率包括所述负样本识别的召回率和所述负样本识别的准确率。

用户包括乘客和司机，具体地，所述用户的历史行为信息包括以下信息的一种或多种：所述乘客的历史作弊行为、所述乘客的注册时间、所述乘客的手机号/设备是否是黑名单用户、所述司机的历史作弊行为、所述司机的注册时间及所述司机在预设时间段内的订单数；所述属性信息包括以下信息的一种或多种：所述乘客的发单时间、所述乘客的发单区域、所述司机完成所述订单的速度、所述订单的距离费用比及所述司机完成所述订单的时间；所述行为信息包括以下信息的一种或多种：所述司机的行驶速度、所述司机的行驶轨迹、所述乘客距离订单起点的位置及所述乘客支付时距离终点的位置。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：戚立才;张怡菲
技术所有人：北京嘀嘀无限科技发展有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。