在线叫车服务平台中司机的接单意愿评价方法和装置与流程

文档序号:12126037阅读:448来源:国知局
在线叫车服务平台中司机的接单意愿评价方法和装置与流程

本发明涉及互联网技术,特别涉及在线叫车服务平台中司机的接单意愿评价方法和装置。



背景技术:

在线叫车服务平台中,不同的司机接单意愿差别很大。在线叫车服务提供商往往趋向于通过各种手段挽留接单意愿高的司机。同时,在派单的过程中,需要尽可能地将订单派送给接单意愿高的司机,以促进叫车成功。因此,如何评价司机的接单意愿对在线叫车服务具有重要意义。

现有技术中,主要是通过一些简单的指标来评价司机的接单意愿,比如推单接单比,司机在线时长、接单量等,评价结果很不准确。

比如,具有相似接单推单比的司机可能接单意愿差别巨大,如有的司机趋向于在大型交通枢纽附近接单,接单率很高,但在非热点区域接单率却很低,这样,如果简单地采用接单推单比来评价司机的接单意愿,会产生很大的偏差。



技术实现要素:

本发明提供了在线叫车服务平台中司机的接单意愿评价方法和装置,能够。

具体技术方案如下:

一种在线叫车服务平台中司机的接单意愿评价方法,包括:

获取训练样本,每个训练样本中包括:订单信息、司机状态信息和司机接单与否信息;

根据所述训练样本训练得到决策树模型;

根据所述决策树模型,分别将每个训练样本中的所述订单信息和所述司机状态信息转换为属性向量,得到转换后的训练样本;

根据所述转换后的训练样本训练得到司机接单概率预测模型;

根据所述司机接单概率预测模型确定出司机的接单意愿。

一种在线叫车服务平台中司机的接单意愿评价装置,包括:样本获取单元、第一训练单元、样本转换单元、第二训练单元以及评价单元;

所述样本获取单元,用于获取训练样本,并发送给所述第一训练单元,每个训练样本中包括:订单信息、司机状态信息和司机接单与否信息;

所述第一训练单元,用于根据所述训练样本训练得到决策树模型,并将所述决策树模型和所述训练样本发送给所述样本转换单元;

所述样本转换单元,用于根据所述决策树模型,分别将每个训练样本中的所述订单信息和所述司机状态信息转换为属性向量,得到转换后的训练样本,并将所述转换后的训练样本发送给所述第二训练单元;

所述第二训练单元,用于根据所述转换后的训练样本训练得到司机接单概率预测模型,并将所述司机接单概率预测模型发送给所述评价单元;

所述评价单元,用于根据所述司机接单概率预测模型确定出司机的接单意愿。

基于上述介绍可以看出,采用本发明所述方案,可基于由订单信息、司机状态信息以及司机接单与否信息组成的训练样本训练得到决策树模型,进而可通过决策树模型将各训练样本中的订单信息和司机状态信息转换为属性向量,以得到转换后的训练样本,并根据转换后的训练样本训练得到司机接单概率预测模型,根据司机接单概率预测模型确定出司机的接单意愿,从而相比于现有技术中仅通过一些简单的指标来对司机的接单意愿进行评价的方式,较好地提高了评价结果的准确性。

【附图说明】

图1为本发明所述在线叫车服务平台中司机的接单意愿评价方法实施例的流程图。

图2为本发明所述在线叫车服务平台中司机的接单意愿评价装置实施例的组成结构示意图。

【具体实施方式】

为了使本发明的技术方案更加清楚、明白,以下参照附图并举实施例,对本发明所述方案作进一步地详细说明。

实施例一

图1为本发明所述在线叫车服务平台中司机的接单意愿评价方法实施例的流程图,如图1所示,包括以下具体实现方式:

在11中,获取训练样本,每个训练样本中包括:订单信息、司机状态信息和司机接单与否信息;

在12中,根据训练样本训练得到决策树模型;

在13中,根据决策树模型,分别将每个训练样本中的订单信息和司机状态信息转换为属性向量,得到转换后的训练样本;

在14中,根据转换后的训练样本训练得到司机接单概率预测模型;

在15中,根据司机接单概率预测模型确定出司机的接单意愿。

以下分别对上述各部分的具体实现进行详细说明。

一)获取训练样本

为了得到决策树模型,需要首先获取训练样本,进而通过训练样本训练得到决策树模型。

每个训练样本中可包括:订单信息、司机状态信息以及司机接单与否信息。

比如,对于用户提交的一个订单,可获取该订单的订单信息,假设该订单派送给了司机a,那么该订单的订单信息、司机a的司机状态信息以及司机a是否接单信息即可组成一个训练样本,如果司机a接单,可记为1,否则,可记为0。

订单信息中可包括:订单的起点位置和终点位置、起点位置和终点位置是否为商圈、起点位置和终点位置是否为交通枢纽、所在城市、订单出发时间、起点位置和终点位置之间的距离、订单预计价格、订单预计价格与所在城市历史实际成单平均价格比、订单预计行驶时间、订单预计行驶速度与所在城市历史实际成单平均行驶速度比、是否穿越拥堵区域、提交订单的用户性别等。

其中,订单的起点位置和终点位置需要转化成区域编码,转换成区域编码的方式有多种,比如可以采用GeoHash方式,也可以是按照经纬度划分为矩形或者六边形等形状的区块,然后分别对不同的区块赋予不同的id或编号。

订单的出发时间可以包含多个维度,如可包括:是否上午、是否下午、是否晚上、是否后半夜、星期、小时、是否周末、是否为上下班高峰等。

司机状态信息可包括:位置相关信息以及历史信息。

其中,位置相关信息可包括:当前移动速度、当前移动状态持续时间、当前位置(也需要转化成区域编码)、接人行驶距离、预期接人行驶时间、预期接人平均行驶速度等。

历史信息可包括:司机过去M天接单推单比、司机过去M天平均在线时长与所在城市所有司机过去M天平均在线时长比、司机过去M天在线时长的4分位数与所在城市所有司机过去M天在线时长的4分位数均值比、司机过去M天平均推单次数与所在城市所有司机过去M天平均推单次数比、司机过去M天平均接单次数与所在城市所有司机过去M天平均接单次数比、司机过去M天轨迹中的移动状态时间占比、司机过去M天轨迹中的移动状态时间占比与所在城市所有司机过去M天轨迹中的移动状态时间占比均值的比值等。

上述订单信息和司机状态信息中具体包括哪些信息可根据实际需要而定,不限于以上所示。

本发明所述方案中,可针对待评价的所有司机,统一获取训练样本,每个训练样本中包括:过往派送的任一订单的订单信息、被派送该订单的任一司机在该订单发生时的司机状态信息,以及,司机接单与否信息。

或者,也可针对每个待评价的司机,分别获取该待评价的司机的训练样本,每个训练样本中包括:过往派送给该待评价的司机的任一订单的订单信息、该待评价的司机在该订单发生时的司机状态信息,以及,该待评价的司机的接单与否信息。

当针对待评价的所有司机统一获取训练样本时,后续针对待评价的所有司机,统一确定出一个决策树模型和一个司机接单概率预测模型。

当针对每个待评价的司机分别获取训练样本时,针对每个待评价的司机,分别确定出一个决策树模型和一个司机接单概率预测模型。

二)决策树模型

以针对每个待评价的司机分别获取该待评价的司机的训练样本为例,每向该待评价的司机派送一次订单,即可获取一个训练样本,当积累到足够多的训练样本后,即可训练得到该待评价的司机的决策树模型。

所述决策树模型可为随机森林(Random Forest)模型或梯度提升决策树(GBDT,Gradient Boosting Decision Tree)模型等。

如何训练得到上述决策树模型为现有技术。

上述决策树模型中会包括N棵决策树,N为大于一的正整数,具体取值由训练过程中的参数来控制。

三)属性向量

在得到决策树模型之后,可根据决策树模型,分别将每个训练样本中的订单信息和司机状态信息转换为属性向量。

具体地,可首先分别对N棵决策树进行1~N的编号,并针对每棵决策树,分别将该决策树中的各叶子节点按照1~该决策树中包括的叶子节点数进行编号。

比如,N的取值为3,那么各决策树可分别编号为1~3,假设编号为2的决策树中包括4个叶子节点,那么可将编号为2的决策树中的各叶子节点分别编号为1~4。

并且,可设置一个包括N*M位元素的属性向量,M表示N棵决策树中叶子节点数最多的决策树中的叶子节点数,初始,属性向量中的各元素的取值均为0。

在上述基础上,针对每个训练样本,可分别按照以下方式将该训练样本中的订单信息和司机状态信息转换为属性向量:

分别将该训练样本中的订单信息和司机状态信息提供给各决策树,并分别获取各决策树的输出结果;

对于结果为接单的每个输出结果,分别将属性向量中的第((n-1)*M+m)位元素的取值设置为1,从而得到该训练样本的转换后的属性向量,其中,n表示该输出结果对应的决策树的编号,m表示该输出结果对应的决策树中输出该输出结果的叶子节点的编号。

针对每个训练样本,每个决策树都会有一个叶子节点输出该训练样本的接单概率,如果接单概率大于预定阈值,则可将输出结果标记为1,表示接单,否则,可将输出结果标记为0,表示拒单。

当编号为n的决策树中编号为m的叶子节点的输出结果为1时,则将属性向量中的第((n-1)*M+m)位元素的取值设置为1。

可以看出,按照上述方式得到的属性向量中,当编号为n的决策树中编号为m的叶子节点的输出结果为0时,属性向量中的第((n-1)*M+m)位元素的取值将为0,各决策树中不输出结果的叶子节点对应的元素的取值也为0,如果某一决策树中的叶子节点数小于M,将超出该决策树中的叶子节点数后面的元素用0补足。

举例说明:

假设决策树模型中包括3棵决策树,各决策树中的叶子节点数分别为3、3、4,即M的取值为4,属性向量中将包括3*4=12位元素;

针对某一训练样本,编号为1的决策树中编号为1的叶子节点的输出结果为1,编号为2的决策树中编号为2的叶子节点的输出结果为0,编号为3的决策树中编号为4的叶子节点的输出结果也为1,那么可得到属性向量(1,0,0,0,0,0,0,0,0,0,0,1),该属性向量即为将该训练样本中的订单信息和司机状态信息进行转换后得到的属性向量。

四)转换后的训练样本

经过上述处理后,每个转换后的训练样本中将包括:根据订单信息和司机状态信息转换得到的属性向量,以及,用1或0表示的司机接单与否信息,如1表示接单,0表示拒单。

五)司机接单概率预测模型

在得到转换后的训练样本之后,可训练得到司机接单概率预测模型,该模型可为逻辑回归模型。

如何训练得到逻辑回归模型为现有技术。

六)司机接单意愿

在得到司机接单概率预测模型之后,可根据司机接单概率预测模型确定出司机的接单意愿。

具体地,当平台中每接收到用户提交的一个订单后,可按照现有规则将该订单派送给P个司机,P为正整数,并可针对包括P个司机在内的每个待评价的司机,分别进行以下1~2)所示处理。

1)获取该待评价的司机的历史信息,并分别将所述P个司机中的每个司机当前的位置相关信息作为该待评价的司机的位置相关信息,将该待评价的司机的每份位置相关信息分别与该待评价的司机的历史信息进行组合,得到P份该待评价的司机的司机状态信息。

2)获取该订单的订单信息,并且,针对每份该待评价的司机的司机状态信息,分别根据决策树模型,将订单信息以及该待评价的司机的司机状态信息转换为属性向量,并根据转换得到的属性向量以及司机接单概率预测模型,预测出该待评价的司机的接单概率。

这样,经过预定时长后,针对每个待评价的司机,可分别得到多个接单概率,即可针对每个待评价的司机,分别统计出最近预定时长内得到的该待评价的司机的所有接单概率,根据统计结果确定出该待评价的司机的接单意愿。

比如,可将最近预定时长内得到的该待评价的司机的所有接单概率相加,并用相加之和除以最近预定时长内得到的该待评价的司机的所有接单概率数,从而得到该待评价的司机的接单意愿。

所述最近预定时长的具体取值可根据实际需要而定,比如,最近一个月。

举例说明:

假设最近一个月内平台上共接收到了2个订单(实际数量远大于此),分别为订单1和订单2;

订单1被派送给了司机x和司机y,订单2被派送给了司机i和司机j;

那么对于任一待评价的司机a来说,针对订单1,可分别将司机x和司机y当时的位置相关信息作为司机a的位置相关信息,从而结合司机a的历史信息,得到2份司机a的司机状态信息,进而分别将每份司机a的司机状态信息与订单1的订单信息组成一个转换对象,共得到2个转换对象,并根据决策树模型,分别将每个转换对象转换为一个属性向量,之后,可根据每个属性向量以及司机接单概率预测模型,分别预测出司机a的接单概率,即针对订单1共预测出2个司机a的接单概率;

类似地,针对订单2,可分别将司机i和司机j当时的位置相关信息作为司机a的位置相关信息,从而结合司机a的历史信息,得到2份司机a的司机状态信息,进而分别将每份司机a的司机状态信息与订单2的订单信息组成一个转换对象,共得到2个转换对象,并根据决策树模型,分别将每个转换对象转换为一个属性向量,之后,可根据每个属性向量以及司机接单概率预测模型,分别预测出司机a的接单概率,即针对订单2也预测出2个司机a的接单概率;

这样,针对司机a,最近一个月内共获取到了4个接单概率,将这4个接单概率相加,并用相加之和除以4,得到的商即为司机a的接单意愿。

按照上述方式,可分别得到每个司机的接单意愿。

以上是关于方法实施例的介绍,以下通过装置实施例,对本发明所述方案进行进一步说明。

实施例二

图2为本发明所述在线叫车服务平台中司机的接单意愿评价装置实施例的组成结构示意图,如图2所示,包括:样本获取单元21、第一训练单元22、样本转换单元23、第二训练单元24以及评价单元25。

样本获取单元21,用于获取训练样本,并发送给第一训练单元22,每个训练样本中包括:订单信息、司机状态信息和司机接单与否信息。

第一训练单元22,用于根据训练样本训练得到决策树模型,并将决策树模型和训练样本发送给样本转换单元23。

样本转换单元23,用于根据决策树模型,分别将每个训练样本中的订单信息和司机状态信息转换为属性向量,得到转换后的训练样本,并将转换后的训练样本发送给第二训练单元24。

第二训练单元24,用于根据转换后的训练样本训练得到司机接单概率预测模型,并将司机接单概率预测模型发送给评价单元25。

评价单元25,用于根据司机接单概率预测模型确定出司机的接单意愿。

为了得到决策树模型,需要首先获取训练样本,进而通过训练样本训练得到决策树模型。

每个训练样本中可包括:订单信息、司机状态信息以及司机接单与否信息。

比如,对于用户提交的一个订单,可获取该订单的订单信息,假设该订单派送给了司机a,那么该订单的订单信息、司机a的司机状态信息以及司机a是否接单信息即可组成一个训练样本,如果司机a接单,可记为1,否则,可记为0。

订单信息中可包括:订单的起点位置和终点位置、起点位置和终点位置是否为商圈、起点位置和终点位置是否为交通枢纽、所在城市、订单出发时间、起点位置和终点位置之间的距离、订单预计价格、订单预计价格与所在城市历史实际成单平均价格比、订单预计行驶时间、订单预计行驶速度与所在城市历史实际成单平均行驶速度比、是否穿越拥堵区域、提交订单的用户性别等。

其中,订单的起点位置和终点位置需要转化成区域编码,转换成区域编码的方式有多种,比如可以采用GeoHash方式,也可以是按照经纬度划分为矩形或者六边形等形状的区块,然后分别对不同的区块赋予不同的id或编号。

订单的出发时间可以包含多个维度,如可包括:是否上午、是否下午、是否晚上、是否后半夜、星期、小时、是否周末、是否为上下班高峰等。

司机状态信息可包括:位置相关信息以及历史信息。

其中,位置相关信息可包括:当前移动速度、当前移动状态持续时间、当前位置(也需要转化成区域编码)、接人行驶距离、预期接人行驶时间、预期接人平均行驶速度等。

历史信息可包括:司机过去M天接单推单比、司机过去M天平均在线时长与所在城市所有司机过去M天平均在线时长比、司机过去M天在线时长的4分位数与所在城市所有司机过去M天在线时长的4分位数均值比、司机过去M天平均推单次数与所在城市所有司机过去M天平均推单次数比、司机过去M天平均接单次数与所在城市所有司机过去M天平均接单次数比、司机过去M天轨迹中的移动状态时间占比、司机过去M天轨迹中的移动状态时间占比与所在城市所有司机过去M天轨迹中的移动状态时间占比均值的比值等。

上述订单信息和司机状态信息中具体包括哪些信息可根据实际需要而定,不限于以上所示。

本发明所述方案中,样本获取单元21可针对待评价的所有司机,统一获取训练样本,每个训练样本中包括:过往派送的任一订单的订单信息、被派送该订单的任一司机在该订单发生时的司机状态信息,以及,司机接单与否信息。

或者,样本获取单元21也可针对每个待评价的司机,分别获取该待评价的司机的训练样本,每个训练样本中包括:过往派送给该待评价的司机的任一订单的订单信息、该待评价的司机在该订单发生时的司机状态信息,以及,该待评价的司机的接单与否信息。

当针对待评价的所有司机统一获取训练样本时,后续针对待评价的所有司机,统一确定出一个决策树模型和一个司机接单概率预测模型。

当针对每个待评价的司机分别获取训练样本时,针对每个待评价的司机,分别确定出一个决策树模型和一个司机接单概率预测模型。

以针对每个待评价的司机分别获取该待评价的司机的训练样本为例,每向该待评价的司机派送一次订单,即可获取一个训练样本,当积累到足够多的训练样本后,即可由第一训练单元22根据训练样本训练得到该待评价的司机的决策树模型。

所述决策树模型可为Random Forest模型或GBDT模型等。

上述决策树模型中会包括N棵决策树,N为大于一的正整数,具体取值由训练过程中的参数来控制。

样本转换单元23可根据决策树模型,分别按照以下方式将每个训练样本中的订单信息和司机状态信息转换为属性向量:

分别对N棵决策树进行1~N的编号,并针对每棵决策树,分别将该决策树中的各叶子节点按照1~该决策树中包括的叶子节点数进行编号;

设置一个包括N*M位元素的属性向量,M表示N棵决策树中叶子节点数最多的决策树中的叶子节点数,初始,属性向量中的各元素的取值均为0;

针对每个训练样本,分别进行以下处理:

分别将该训练样本中的订单信息和司机状态信息提供给各决策树,并分别获取各决策树的输出结果;

对于结果为接单的每个输出结果,分别将属性向量中的第((n-1)*M+m)位元素的取值设置为1,得到转换后的属性向量,其中,n表示该输出结果对应的决策树的编号,m表示该输出结果对应的决策树中输出该输出结果的叶子节点的编号。

这样,每个转换后的训练样本中将包括:

根据订单信息和司机状态信息转换得到的属性向量,以及,用1或0表示的司机接单与否信息,1表示接单,0表示拒单。

在得到转换后的训练样本之后,可由第二训练单元24根据转换后的训练样本训练得到司机接单概率预测模型,该模型可为逻辑回归模型。

在得到司机接单概率预测模型之后,可由评价单元25根据司机接单概率预测模型确定出司机的接单意愿。

如图2所示,评价单元25中可具体包括:第一处理子单元251和第二处理子单元252。

第一训练单元22进一步用于,将决策树模型发送给第一处理子单元251。

第一处理子单元251,用于在每接收到一个订单时,按照预定规则将订单派送给P个司机,P为正整数,并针对包括这P个司机在内的每个待评价的司机,分别进行以下处理:

获取该待评价的司机的历史信息,并分别将P个司机中的每个司机当前的位置相关信息作为该待评价的司机的位置相关信息,将该待评价的司机的每份位置相关信息分别与该待评价的司机的历史信息进行组合,得到P份该待评价的司机的司机状态信息;

获取订单的订单信息;

针对每份该待评价的司机的司机状态信息,分别根据决策树模型,将订单信息以及该待评价的司机的司机状态信息转换为属性向量,并根据转换得到的属性向量以及司机接单概率预测模型,预测出该待评价的司机的接单概率。

第二处理子单元252,用于针对每个待评价的司机,分别统计最近预定时长内得到的该待评价的司机的所有接单概率,根据统计结果确定出该待评价的司机的接单意愿。

比如,第二处理子单元252可将最近预定时长内得到的该待评价的司机的所有接单概率相加,并用相加之和除以最近预定时长内得到的该待评价的司机的所有接单概率数,得到该待评价的司机的接单意愿。

图2所示装置实施例的具体工作流程请参照前述方法实施例中的相应说明,此处不再赘述。

总之,采用本发明所述方案,可基于由订单信息、司机状态信息以及司机接单与否信息组成的训练样本训练得到决策树模型,进而可通过决策树模型将各训练样本中的订单信息和司机状态信息转换为属性向量,以得到转换后的训练样本,并根据转换后的训练样本训练得到司机接单概率预测模型,根据司机接单概率预测模型确定出司机的接单意愿,从而相比于现有技术中仅通过一些简单的指标来对司机的接单意愿进行评价的方式,较好地提高了评价结果的准确性;而且,本发明所述方案可适用于各种在线叫车服务平台,具有广泛适用性。

在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1