司机分类的方法、装置、设备以及存储介质与流程

文档序号：12735088阅读：266来源：国知局

本发明实施例涉及数据处理技术，尤其涉及一种司机分类的方法、装置、设备以及存储介质。

背景技术：

用车业务发展到现在，已经展现出多种产品形态，比如专车、快车、顺风车、多人拼车、甚至是日租车、时租车等。乘客通过叫车产品将包括起终点的叫车订单发送至产品平台，平台向乘客周围的司机派送该叫车订单，司机通过平台获取想要的订单，来降低自己的空驶率，提升运营效率，对于社会而言则节约了沟通成本，减少了能源消耗。在线叫车服务中，司机接单行为是决定叫车成功与否的关键。由于在接单过程中考虑的因素不一样，不同的司机可能具有不同的接单行为。如何将具有类似行为的司机划分到同一类别对于分析司机的接单行为具有重要意义。

现有的方法中使用了司机的历史接单记录训练决策树模型，根据输入数据在训练完成的决策树模型中经过的路径中非叶子节点的属性收益向量生成决策向量以完成司机分类。

发明人在实现本发明的过程中发现：现有技术生成决策向量的方法计算量大，过程繁琐，耗时长。

技术实现要素：

本发明实施例提供一种司机分类的方法、装置、设备以及存储介质，能够优化现有的司机分类方法，提高司机分类效率。

第一方面，本发明实施例提供了一种司机分类的方法，包括：

根据历史叫车订单的订单信息、与所述历史叫车订单关联的司机状态信息以及司机对所述历史叫车订单的接单情况构造训练样本；

使用所述训练样本对分类预测模型进行训练，生成司机接单预测模型，其中，所述司机接单预测模型中包括至少两个输出端；

将目标司机接收到的叫车订单的订单信息，以及与所述叫车订单关联的所述目标司机的司机状态信息输入至所述司机接单预测模型中，并根据所述司机接单预测模型中至少两个输出端的输出结果，生成与所述目标司机对应的司机行为向量；

根据与至少两个司机对应的司机行为向量，进行司机分类。

第二方面，本发明实施例还提供了一种司机分类的装置，包括：

训练样本构造模块，用于根据历史叫车订单的订单信息、与所述历史叫车订单关联的司机状态信息以及司机对所述历史叫车订单的接单情况构造训练样本；

接单预测模型生成模块，用于使用所述训练样本对分类预测模型进行训练，生成司机接单预测模型，其中，所述司机接单预测模型中包括至少两个输出端；

行为向量生成模块，用于将目标司机接收到的叫车订单的订单信息，以及与所述叫车订单关联的所述目标司机的司机状态信息输入至所述司机接单预测模型中，并根据所述司机接单预测模型中至少两个输出端的输出结果，生成与所述目标司机对应的司机行为向量；

司机分类模块，用于根据与至少两个司机对应的司机行为向量，进行司机分类。

第三方面，本发明实施例还提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序所述处理器执行所述程序时实现如本发明实施例中任一所述的司机分类的方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例中任一所述的司机分类的方法。

本发明实施例提供了一种司机分类的方法、装置、设备以及存储介质，通过根据历史叫车订单的订单信息、与所述历史叫车订单关联的司机状态信息以及司机对所述历史叫车订单的接单情况构造训练样本训练生成司机接单预测模型；将目标司机接收到的叫车订单的订单信息，以及与所述叫车订单关联的所述目标司机的司机状态信息输入至所述司机接单预测模型中，并根据所述司机接单预测模型中至少两个输出端的输出结果，生成与所述目标司机对应的司机行为向量；根据与至少两个司机对应的司机行为向量，进行司机分类，实现了将司机的历史接单记录转化为一个司机行为向量，然后在司机行为向量的基础上进行司机分类，可以将历史接单记录中包括的多个不可量化因素基于所述司机接单预测模型中的多个输出端的输出结果，最终以一个标准的向量形式表示，提供了一种新的司机的向量表示法，方案实现简单，计算量小，处理速度快。

附图说明

图1是本发明实施例一中的一种司机分类的方法的流程图；

图2是本发明实施例二中的一种司机分类的方法的流程图；

图3是本发明实施例三中的一种司机分类的方法的流程图；

图4是本发明实施例四中的一种司机分类的装置的结构图；

图5是本发明实施例五中的一种计算机设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理，但是其中的许多操作可以被并行地、并发地或者同时实施。此外，各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

实施例一

图1为本发明实施例一提供的一种司机分类的方法的流程图，本实施例可适用于对网络叫车服务中注册的司机进行分类的情况，该方法可以由本发明实施例提供的司机分类的装置来执行，该装置可采用软件和/或硬件的方式实现，该装置可集成在用于提供司机分类服务的服务器或者终端设备中。如图1所示，本实施例的方法具体包括：

110、根据历史叫车订单的订单信息、与所述历史叫车订单关联的司机状态信息以及司机对所述历史叫车订单的接单情况构造训练样本。

在本实施例中，所述历史叫车订单是指网络叫车平台已经撮合完成的叫车服务中(所述叫车服务包括：乘客发送叫车订单，司机确认接单并搭载乘客到目的地，以及乘客成功付费这一完整过程)，乘客曾经发送至叫车平台的叫车订单；与所述历史叫车订单关联的司机状态信息是指在乘客发送所述历史叫车订单时，接收到该历史叫车订单的司机的司机状态信息；司机对所述历史叫车订单的接单情况是指针对该历史叫车订单司机是否接单(接单或者未接单)。

其中，所述历史叫车订单的订单信息可以包括下述至少一项：订单的起终点位置、订单起终点位置是否为常驻地(例如，乘客的家或者乘客的单位等)、订单起终点是否为为商圈，订单起终点是否为交通枢纽，订单所在城市，订单出发时间、订单车辆类型，订单起终点距离、订单预计价格、订单预计价格与全部订单平均价格比、订单预计行驶时间、订单预计行驶速度与全部订单平均行驶速度比、订单是否穿越拥堵区域、以及所述乘客的性别等。

典型的，为了便于处理，订单的起终点位置可以转化为区域编码，转化成区域编码的方式有多种，可以是geohash(空间索引编码)，也可以是按照经纬度划分为矩形或者六边形等形状的区块，然后分别对不同的区块赋予不同的id或者编号等。订单的出发时间可以包含多个维度，例如：可以包括是否上午，是否下午，是否晚上，是否后半夜，星期，小时，是否周末或者是否为上下班高峰等。

所述司机状态信息可以包括：司机实时位置关联信息，和/或司机历史行为信息；

所述司机实时位置关联信息可以包括下述至少一项：当前移动速度(司机接收到该历史叫车订单时的移动速度)、当前位置(司机接收到该历史叫车订单时所在的位置)、接人行驶距离、接人行驶距离与全部订单的平均接人距离的比值、预期接人行驶时间、预期接人行驶时间与全部订单的平均接人行驶时间的比值、以及预期接人平均行驶速度；

所述司机历史行为信息可以包括下述至少一项：历史N天推单接单比、历史N天平均在线时长与全部司机历史N天平均在线时长比值、历史N天在线时长的4分位数与全部司机历史N天在线时长的4分位数均值的比值、历史N天平均推单次数与全部司机历史N天平均推单次数比、历史N天平均接单次数与全部司机历史N天接单次数比、历史N天轨迹中的移动状态时间占比、以及历史N天轨迹中的移动状态时间占比与全部司机历史N天轨迹中的移动状态时间占比均值的比值，N为大于等于1的整数。

当然，所述订单信息以及所述司机状态信息中还可以包括其他类型的参数，本领域技术人员可以根据实际情况进行适应性调整，本实施例对此并不进行限制。

在本实施例的一个可选的实施方式中，根据历史叫车订单的订单信息、与所述历史叫车订单关联的司机状态信息以及司机对所述历史叫车订单的接单情况构造训练样本可以包括：

获取一条历史叫车订单作为当前处理订单；根据所述当前处理订单中包括的订单起点，确定派单范围；确定在所述派单范围内，接收到所述当前处理订单的至少一个匹配司机；根据所述当前处理订单的订单信息以及所述匹配司机的司机状态信息构造训练样本，并根据所述匹配司机对所述目标订单的接单情况标记(例如，接单标记为1，未接单标记为0)构造的所述训练样本。

在一个具体的例子中，获取了某个历史时间下的历史叫车订单A，并根据该历史叫车订单A的订单起点确定了接收到该历史叫车订单A的司机B、司机C和司机D，并确定司机C接单了，而司机B和司机D没有接单。进而可以根据该历史叫车订单A的订单信息，以及司机B、司机C和司机D的司机状态信息以及接单情况分别构造并标记3条训练样本：

训练样本1(历史叫车订单A的订单信息，司机B的司机状态信息，“0”)、训练样本2(历史叫车订单A的订单信息，司机C的司机状态信息，“1”)以及训练样本3(历史叫车订单A的订单信息，司机D的司机状态信息，“0”)。

120、使用所述训练样本对分类预测模型进行训练，生成司机接单预测模型，其中，所述司机接单预测模型中包括至少两个输出端。

在本实施例中，所述分类预测模型用于对输入的训练样本进行分类，并在训练完成后对司机的接单情况进行预测(接单或者不接单)。其中，所述分类预测模型可以为BP(Back Propagatio，后向传播)神经网络模型或者决策树模型等，本实施例对此并不进行限制。但是，所述分类预测模型在训练完成后需要具有至少两个针对不同分类结果的输出端，且不同输出端能够输出对司机接单情况的预测结果(典型的，司机接单概率值)。

在本实施例的一个可选的实施方式中，所述分类预测模型可以包括决策树模型，所述司机接单预测模型中包括的输出端可以包括所述决策树中的叶子节点。

130、将目标司机接收到的叫车订单的订单信息，以及与所述叫车订单关联的所述目标司机的司机状态信息输入至所述司机接单预测模型中，并根据所述司机接单预测模型中至少两个输出端的输出结果，生成与所述目标司机对应的司机行为向量。

发明人通过研究发现：在使用训练样本生成该司机接单预测模型之后，在使用一个新的叫车订单的订单信息，以及与所述新的叫车订单关联的目标司机的司机状态信息输入至所述司机接单预测模型中之后，该司机接单预测模型中的各个输出端均会对应输出一个输出结果(例如：无输出结果或者输出一个司机接单概率值)，且一个训练好的司机接单预测模型中包括的输出端的数量也是固定的。因此，基于上述司机接单预测模型中各个输出端的输出结果，无需进行任何其他操作，即可以简单、便捷的将包括有多个不同类型数据(例如：布尔、整数、浮点数以及字符串型等)的司机的历史接单记录快速转化为一个标准格式的司机行为向量，对现有的司机向量生成方法进行了很好的优化。

在一个具体的例子中，司机接单模型包括10个输出端，可以对每个输出端进行编号，再将目标司机接收到的叫车订单的订单信息，以及与所述叫车订单关联的所述目标司机的司机状态信息输入至所述司机接单预测模型中之后，可以根据每个输出端的输出结果构成包括10个向量元素的司机行为向量[A1、A2、…、Ai、…、A10]，其中Ai代表第i号输出端的输出结果。

进一步的，可以将同一司机在一定时间段内的接收到的全部或者部分叫车订单的订单信息，以及与所述叫车订单关联的该司机的司机状态信息分别输入至所述司机接单预测模型中，并将得到的各个向量进行加权求和以最终生成所述司机行为向量。

140、根据与至少两个司机对应的司机行为向量，进行司机分类。

可以理解的是，司机的历史接单记录中包括有多个不同类型的数据，其很难被量化。但是如果将该历史接单记录转化为司机行为向量，则可以很容易的根据该向量进行司机分类。

在本实施例的一个可选的实施方式中，根据与至少两个司机对应的司机行为向量，进行司机分类可以包括：

根据与至少两个司机对应的司机行为向量，以及设定聚类算法，对各所述司机行为向量进行聚类处理；将归类于同一类别的司机行为向量对应的司机分为一类。

其中，所述聚类算法可以包括：基于密度的聚类算法，例如：dbscan算法；分层聚类算法，例如：Ward算法；或者基于距离的聚类算法，例如：K-Means算法或者Mean-shift算法等。聚类后获得的每一簇既为一个司机分类。每一个簇中所有司机行为向量的均值为该类司机的行为向量。聚类过程中采用的距离可以采用Minkowsky距离(曼哈顿距离或者欧氏距离)，也可以采用余弦距离，本实施例对此并不进行限制。

本发明实施例提供的司机分类的方法，通过根据历史叫车订单的订单信息、与所述历史叫车订单关联的司机状态信息以及司机对所述历史叫车订单的接单情况构造训练样本训练生成司机接单预测模型；将目标司机接收到的叫车订单的订单信息，以及与所述叫车订单关联的所述目标司机的司机状态信息输入至所述司机接单预测模型中，并根据所述司机接单预测模型中至少两个输出端的输出结果，生成与所述目标司机对应的司机行为向量；根据与至少两个司机对应的司机行为向量，进行司机分类，实现了将司机的历史接单记录转化为一个司机行为向量，然后在司机行为向量的基础上进行司机分类，可以将历史接单记录中包括的多个不可量化因素基于所述司机接单预测模型中的多个输出端的输出结果，最终以一个标准的向量形式表示，提供了一种新的司机的向量表示法，方案实现简单，计算量小，处理速度快。

实施例二

图2为本发明实施例二提供的一种司机分类的方法的流程图，本实施例以上述实施例为基础进行优化，在本实施例中，将所述分类预测模型具体优化为决策树模型，所述司机接单预测模型中包括的输出端具体优化为所述决策树中的叶子节点；以及

将目标司机接收到的叫车订单的订单信息，以及与所述叫车订单关联的所述目标司机的司机状态信息输入至所述司机接单预测模型中，并根据所述司机接单预测模型中至少两个输出端的输出结果，生成与所述目标司机对应的司机行为向量，具体优化为：获取所述目标司机接收到的一条叫车订单作为目标订单，并将所述目标订单的订单信息，以及与所述目标订单关联的所述目标司机的司机状态信息输入至所述司机接单预测模型中；根据所述司机接单预测模型中各叶子节点的输出结果，生成与所述目标订单对应的单订单行为向量，其中，所述单订单行为向量的类型包括：接单行为向量、或者拒单行为向量；根据所述目标司机在设定时间段内接收到的叫车订单所关联的单订单行为向量，以及单订单行为向量的类型，生成所述目标司机的司机行为向量。

相应的，本发明实施例的方法包括：

210、根据历史叫车订单的订单信息、与所述历史叫车订单关联的司机状态信息以及司机对所述历史叫车订单的接单情况构造训练样本。

在本实施例中，可以根据实际的应用需求以及精确度要求，确定训练样本的数量，本实施例对此并不进行限制。

220、使用所述训练样本对决策树模型进行训练，生成司机接单预测模型，其中，所述司机接单预测模型中包括至少两个叶子节点。

其中，决策树算法是一种归纳分类算法，它通过对训练集的学习，挖掘出有用的规律，用于对新集进行预测。叶子节点是一个决策树的终端节点，代表分类后所获得的分类标记。在将构造的多个训练样本输入至一个原始的决策树模型中之后，该原始的决策树模型会适应性的调整其内部结构，以最终生成包括有多个叶子节点的司机接单预测模型。

在使用决策树模型训练生成该司机接单预测模型之后，每个训练样本都对会应一个叶子节点，通过统计与各个叶子节点对应的各个训练样本的标记值(接单或者未接单)，可以进而确定与每个叶子节点对应的输出结果，即：司机接单概率值。

在一个具体例子中，训练生成的司机接单预测模型包括5个叶子节点，叶子节点A对应于1000个训练样本，在该1000个训练样本中，有900个训练样本被标记为接单，则该叶子节点A对应的输出结果为0.9。

230、获取所述目标司机接收到的一条叫车订单作为目标订单，并将所述目标订单的订单信息，以及与所述目标订单关联的所述目标司机的司机状态信息输入至所述司机接单预测模型中。

240、根据所述司机接单预测模型中各叶子节点的输出结果，生成与所述目标订单对应的单订单行为向量。

在本实施例中，所述单订单行为向量的类型包括：接单行为向量、或者拒单行为向量。

可以理解的是，各个叶子节点输出的接单概率值的范围可以为[0，1]，其中，根据有些叶子节点的输出结果可能判定该司机会接单，根据另一些叶子节点的输出结果则可能判定该司机会拒单。

因此，在本实施例中，为了后续的司机分类结果更加准确以及符合实际分类需求，可以根据所述司机接单预测模型中各叶子节点的输出结果，生成与所述目标订单对应的，不同类型的单订单行为向量，即：接单行为向量或者拒单行为向量。

250、根据所述目标司机在设定时间段内接收到的叫车订单所关联的单订单行为向量，以及单订单行为向量的类型，生成所述目标司机的司机行为向量。

其中，所述设定时间段可以根据实际情况进行预设，例如：1周或者2周或者一个月等。

通过操作240的方法，可以得到与所述目标司机在设定时间段内接收到的叫车订单(全部或者部分叫车订单)分别关联的各个单订单行为向量。

在本实施例中，可以仅根据得到的多个接单行为向量，生成司机行为向量；也可以仅根据得到的多个拒单行为向量，生成司机行为向量；还可以根据得到的多个接单行为向量以及多个拒单行为向量的组合，生成司机行为向量，本实施例对此并不进行限制。

典型的，可以通过对多个单订单行为向量取统计平均的方式，生成所述目标司机的司机行为向量。

260、根据与至少两个司机对应的司机行为向量，进行司机分类。

需要说明的是，可以根据实际的司机分类需求，确定所述司机行为向量中使用的单订单行为向量类型。

例如：如果需要仅根据司机的接单行为对司机进行分类，所述司机行为向量中可以仅使用接单行为向量；如果需要仅根据司机的拒单行为对司机进行分类，所述司机行为向量中可以仅使用拒单行为向量；如果需要综合根据司机的接单行为以及拒单行为对司机进行分类，所述司机行为向量中可以同时使用接单行为向量以及拒单行为向量。

本发明实施例的技术方案通过获取目标司机接收到的一条叫车订单作为目标订单，并将所述目标订单的订单信息，以及与所述目标订单关联的所述目标司机的司机状态信息输入至所述司机接单预测模型中；根据所述司机接单预测模型中各叶子节点的输出结果，生成与所述目标订单对应的单订单行为向量，根据所述目标司机在设定时间段内接收到的叫车订单所关联的单订单行为向量，以及单订单行为向量的类型，生成所述目标司机的司机行为向量，解决了现有技术生成决策向量的方法计算量大，过程繁琐，耗时长等问题，提供了一种新的司机的向量表示法，方案实现简单，计算量小，处理速度快。

实施例三

图3为本发明实施例三提供的一种司机分类的方法的流程图，本实施例以上述实施例为基础进行优化。在本实施例中，将根据所述司机接单预测模型中各叶子节点的输出结果，生成与所述目标订单对应的单订单行为向量具体优化为：获取所述司机接单预测模型中目标叶子节点中输出的接单概率值；根据所述接单概率值的取值，确定与所述目标订单对应的单订单行为向量的类型；根据所述单订单行为向量的类型，以及所述接单概率值生成目标向量值；根据所述目标叶子节点在所述司机接单预测模型中的编号值，将所述目标向量值填充于第一向量中的对应位置处，生成所述单订单行为向量；以及

将根据所述目标司机在设定时间段内接收到叫车订单所关联的单订单行为向量，以及单订单行为向量的类型，生成所述目标司机的司机行为向量，具体优化为：根据司机分类需求，在所述目标司机在设定时间段内收到叫车订单所关联的单订单行为向量中，获取设定类型的所述单订单行为向量；在获取的类型相同的所述单订单行为向量中，将相同向量位置的向量元素进行加和处理以及归一化处理后，生成所述目标司机的司机行为向量。

相应的，本实施例的方法包括：

310、根据历史叫车订单的订单信息、与所述历史叫车订单关联的司机状态信息以及司机对所述历史叫车订单的接单情况构造训练样本。

320、使用所述训练样本对决策树模型进行训练，生成司机接单预测模型，其中，所述司机接单预测模型中包括至少两个叶子节点；

330、获取所述目标司机接收到的一条叫车订单作为目标订单，并将所述目标订单的订单信息，以及与所述目标订单关联的所述目标司机的司机状态信息输入至所述司机接单预测模型中。

340、获取所述司机接单预测模型中目标叶子节点中输出的接单概率值。

350、根据所述接单概率值的取值，确定与所述目标订单对应的单订单行为向量的类型。

在本实施例的一个可选的实施方式中，根据所述接单概率值的取值，确定与所述目标订单对应的单订单行为向量的类型，可以包括：

如果所述接单概率值满足接单门限条件，则确定与所述目标订单对应的单订单行为向量的类型为接单行为向量；

如果所述接单概率值满足拒单门限条件，则确定与所述目标订单对应的单订单行为向量的类型为拒单行为向量。

其中，所述接单门限条件以及拒单门限条件的合集可以覆盖全部取值接单概率值(例如：接单门限条件为接单概率值大于等于0.8，拒单门限条件为接单概率值小于0.8)，所述接单门限条件以及拒单门限条件的合集也可以不完全覆盖全部取值接单概率值(例如：接单门限条件为接单概率值大于等于0.8，拒单门限条件为接单概率值小于等于0.2)，本实施例对此并不进行限制。

可选的，如果所述接单概率值既未满足接单门限条件，也未满足拒单门限条件，则可以直接将与该接单概率值对应的训练样本进行舍弃。

360、根据所述单订单行为向量的类型，以及所述接单概率值生成目标向量值。

在本实施例的一个可选的实施方式中，根据所述单订单行为向量的类型，以及所述接单概率值生成目标向量值，可以包括：

如果所述单订单行为向量的类型为接单行为向量，则根据公式：F＝W*p，计算所述目标向量值F；

如果所述单订单行为向量的类型为拒单行为向量，则根据公式：F＝W*(1-p)，计算所述目标向量值F；

其中，W为设定权重系数，p为所述接单概率值。

其中，所述W可以为1，也可以为1/p(将目标向量值固定设置为1)，也可以为其他类型的权重系数。

370、根据所述目标叶子节点在所述司机接单预测模型中的编号值，将所述目标向量值填充于第一向量中的对应位置处，生成所述单订单行为向量。

在本实施例中，所述第一向量为全0向量，且所述第一向量中的向量元素的数量与所述司机接单预测模型中包括的叶子节点的数量相一致。

在一个具体例子中，司机接单预测模型中包括的叶子节点的数量为5，各个叶子节点的编号分别为1-5，则该第一向量为[0，0，0，0，0]。如果将目标订单的订单信息，以及与所述目标订单关联的所述目标司机的司机状态信息输入至所述司机接单预测模型中之后，3号叶子节点具有输出结果，并根据该输出结果计算得到的目标向量值为0.3，则最终生成的单订单行为向量为[0，0，0.3，0，0]。

380、根据司机分类需求，在所述目标司机在设定时间段内收到叫车订单所关联的单订单行为向量中，获取设定类型的所述单订单行为向量。

390、在获取的类型相同的所述单订单行为向量中，将相同向量位置的向量元素进行加和处理以及归一化处理后，生成所述目标司机的司机行为向量。

其中，所述司机行为向量可以仅根据类型为接单行为向量的单订单行为向量生成，相应的，该司机行为向量可以被定义为accept_vec；所述司机行为向量也可以仅根据类型为拒单行为向量的单订单行为向量生成，相应的，该司机行为向量可以被定义为reject_vec；所述司机行为向量可以根据类型为接单行为向量的单订单行为向量以及类型为拒单行为向量的单订单行为向量生成，相应的，该司机行为向量可以被定义为(accept_vec，reject_vec)。

在一个具体例子中，目标司机的司机行为向量accept_vec为目标司机在过去一段时间(例如一个月)的接单行为向量和的归一化向量，记作：

accept_vec＝∑_{j∈accept order}vec_acc(j)/nomalizer1；

其中，accept order为接单行为向量的集合，vec_acc(j)代表第j个接单行为向量，j∈[1，N]；N为接单行为向量的总数量；nomalizer1，为归一化因子，该归一化因子的取值优选与N相同。

相类似的，目标司机的司机行为向量reject_vec为目标司机在过去一段时间(例如一个月)的拒单行为向量和的归一化向量，记作：

reject_vec＝∑_{k∈reject order}vec_rec(k)/nomalizer2；

其中，reject order为拒单行为向量的集合，k∈[1，M]；M为拒单行为向量的总数量；nomalizer2，为归一化因子，该归一化因子的取值优选与M相同。

在一个具体的例子中，接单行为向量1为[0，0.92，0，0，0]，接单行为向量2为[0，0，0，0.87，0]，则计算得到的司机行为向量accept_vec为[0，0.92/2，0，0.87/2，0]。

3100、根据与至少两个司机对应的司机行为向量，进行司机分类。

本发明实施例的技术方案通过获取所述司机接单预测模型中目标叶子节点中输出的接单概率值；根据所述接单概率值的取值，确定与所述目标订单对应的单订单行为向量的类型；根据所述单订单行为向量的类型，以及所述接单概率值生成目标向量值；根据所述目标叶子节点在所述司机接单预测模型中的编号值，将所述目标向量值填充于第一向量中的对应位置处，生成所述单订单行为向量，可以简单、便捷的将历史接单记录中包括的多个不可量化因素，最终以一个标准的向量形式表示，提供了一种新的司机的向量表示法，方案实现简单，计算量小，处理速度快。

实施例四

图4为本发明实施例四提供的一种司机分类的装置的结构示意图，如图4所示，所述装置包括：训练样本构造模块41、接单预测模型生成模块42、行为向量生成模块43以及司机分类模块44。

训练样本构造模块41，用于根据历史叫车订单的订单信息、与所述历史叫车订单关联的司机状态信息以及司机对所述历史叫车订单的接单情况构造训练样本。

接单预测模型生成模块42，用于使用所述训练样本对分类预测模型进行训练，生成司机接单预测模型，其中，所述司机接单预测模型中包括至少两个输出端。

行为向量生成模块43，用于将目标司机接收到的叫车订单的订单信息，以及与所述叫车订单关联的所述目标司机的司机状态信息输入至所述司机接单预测模型中，并根据所述司机接单预测模型中至少两个输出端的输出结果，生成与所述目标司机对应的司机行为向量。

司机分类模块44，用于根据与至少两个司机对应的司机行为向量，进行司机分类。

本发明实施例提供了一种司机分类的装置，通过根据历史叫车订单的订单信息、与所述历史叫车订单关联的司机状态信息以及司机对所述历史叫车订单的接单情况构造训练样本训练生成司机接单预测模型；将目标司机接收到的叫车订单的订单信息，以及与所述叫车订单关联的所述目标司机的司机状态信息输入至所述司机接单预测模型中，并根据所述司机接单预测模型中至少两个输出端的输出结果，生成与所述目标司机对应的司机行为向量；根据与至少两个司机对应的司机行为向量，进行司机分类，实现了将司机的历史接单记录转化为一个司机行为向量，然后在司机行为向量的基础上进行司机分类，可以将历史接单记录中包括的多个不可量化因素基于所述司机接单预测模型中的多个输出端的输出结果，最终以一个标准的向量形式表示，提供了一种新的司机的向量表示法，方案实现简单，计算量小，处理速度快。

在上述各实施例的基础上，所述分类预测模型可以包括决策树模型，所述司机接单预测模型中包括的输出端可以包括所述决策树中的叶子节点。

在上述各实施例的基础上，所述行为向量生成模块，可以包括：

信息输入单元，用于获取所述目标司机接收到的一条叫车订单作为目标订单，并将所述目标订单的订单信息，以及与所述目标订单关联的所述目标司机的司机状态信息输入至所述司机接单预测模型中；

单订单行为向量生成单元，用于根据所述司机接单预测模型中各叶子节点的输出结果，生成与所述目标订单对应的单订单行为向量，其中，所述单订单行为向量的类型包括：接单行为向量、或者拒单行为向量；

司机行为向量生成单元，用于根据所述目标司机在设定时间段内接收到的叫车订单所关联的单订单行为向量，以及单订单行为向量的类型，生成所述目标司机的司机行为向量。

在上述各实施例的基础上，所述单订单行为向量生成单元，具体可以包括：

接单概率值获取子单元，用于获取所述司机接单预测模型中目标叶子节点中输出的接单概率值；

向量类型确定子单元，用于根据所述接单概率值的取值，确定与所述目标订单对应的单订单行为向量的类型；

目标向量值生成子单元，用于根据所述单订单行为向量的类型，以及所述接单概率值生成目标向量值；

行为向量生成子单元，用于根据所述目标叶子节点在所述司机接单预测模型中的编号值，将所述目标向量值填充于第一向量中的对应位置处，生成所述单订单行为向量；

其中，所述第一向量为全0向量，且所述第一向量中的向量元素的数量与所述司机接单预测模型中包括的叶子节点的数量相一致。

在上述各实施例的基础上，所述向量类型确定子单元，具体可以用于：

如果所述接单概率值满足接单门限条件，则确定与所述目标订单对应的单订单行为向量的类型为接单行为向量；

如果所述接单概率值满足拒单门限条件，则确定与所述目标订单对应的单订单行为向量的类型为拒单行为向量；

所述目标向量值生成子单元，具体可以用于：

如果所述单订单行为向量的类型为接单行为向量，则根据公式：F＝W*p，计算所述目标向量值F；

如果所述单订单行为向量的类型为拒单行为向量，则根据公式：F＝W*(1-p)，计算所述目标向量值F；

其中，W为设定权重系数，p为所述接单概率值。

在上述各实施例的基础上，所述司机行为向量生成单元，具体可以用于：

根据司机分类需求，在所述目标司机在设定时间段内接收到叫车订单所关联的单订单行为向量中，获取设定类型的所述单订单行为向量；

在获取的类型相同的所述单订单行为向量中，将相同向量位置的向量元素进行加和处理以及归一化处理后，生成所述目标司机的司机行为向量。

在上述各实施例的基础上，所述行为向量生成模块，可以用于：

获取一条历史叫车订单作为当前处理订单；

根据所述当前处理订单中包括的订单起点，确定派单范围；

确定在所述派单范围内，接收到所述当前处理订单的至少一个匹配司机；

根据所述当前处理订单的订单信息以及所述匹配司机的司机状态信息构造训练样本，并根据所述匹配司机对所述目标订单的接单情况标记构造的所述训练样本。

上述司机分类的装置可执行本发明任意实施例所提供的司机分类的方法，具备执行的司机分类的方法相应的功能模块和有益效果。

实施例五

图5为本发明实施例五提供的一种计算机设备的结构示意图。图5示出了适于用来实现本发明实施方式的示例性计算机设备12的框图。图5显示的计算机设备12仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图5所示，计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于：一个或者多个处理器或者处理单元16，系统存储器28，连接不同系统组件(包括系统存储器28和处理单元16)的总线18。

总线18表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(ISA)总线，微通道体系结构(MAC)总线，增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。

计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

系统存储器28可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统34可以用于读写不可移动的、非易失性磁介质(图5未显示，通常称为“硬盘驱动器”)。尽管图5中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块42的程序/实用工具40，可以存储在例如存储器28中，这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。

计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信，还可与一个或者多个使得用户能与该计算机设备12交互的设备通信，和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且，计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白，尽管图5中未示出，可以结合计算机设备12使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

处理单元16通过运行存储在系统存储器28中的程序，从而执行各种功能应用以及数据处理，例如实现本发明实施例所提供的司机分类的方法。

也即：所述处理单元执行所述程序时实现：根据历史叫车订单的订单信息、与所述历史叫车订单关联的司机状态信息以及司机对所述历史叫车订单的接单情况构造训练样本；使用所述训练样本对分类预测模型进行训练，生成司机接单预测模型，其中，所述司机接单预测模型中包括至少两个输出端；将目标司机接收到的叫车订单的订单信息，以及与所述叫车订单关联的所述目标司机的司机状态信息输入至所述司机接单预测模型中，并根据所述司机接单预测模型中至少两个输出端的输出结果，生成与所述目标司机对应的司机行为向量；根据与至少两个司机对应的司机行为向量，进行司机分类。

实施例六

本发明实施例六提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本申请所有发明实施例提供的活动时间的确定方法：

也即：该程序被处理器执行时实现：根据历史叫车订单的订单信息、与所述历史叫车订单关联的司机状态信息以及司机对所述历史叫车订单的接单情况构造训练样本；使用所述训练样本对分类预测模型进行训练，生成司机接单预测模型，其中，所述司机接单预测模型中包括至少两个输出端；将目标司机接收到的叫车订单的订单信息，以及与所述叫车订单关联的所述目标司机的司机状态信息输入至所述司机接单预测模型中，并根据所述司机接单预测模型中至少两个输出端的输出结果，生成与所述目标司机对应的司机行为向量；根据与至少两个司机对应的司机行为向量，进行司机分类。

可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于——无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王超
技术所有人：百度在线网络技术（北京）有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。