代驾订单预测方法和代驾运力调度方法_2

文档序号:9616532阅读:来源:国知局
对每个基础时间段都执行步骤S34后,使得每个向量样本类中的基础时间段 在时间上连续,并且各向量样本类中不存在重叠的基础时间段;然后对m个向量样本类分 别进行基础时间段的合并,从而形成m个所述订单预测基准时间段。
[0042] 更进一步地,所述步骤S4中提取一订单预测基准时间段内的订单数据包括:对于 一区域类中的每个预定场所,提取所述历史期间内的每一天的该订单预测基准时间段内的 订单量及对应的日期;所述变化因子至少包括每一天的该订单预测基准时间段的天气情 况。
[0043] 更进一步地,所述步骤S4中采用BP神经网络进行非线性拟合具体包括:
[0044] 选择神经元的输入输出对照公式以及激活函数;
[0045] 定义BP神经网络的层数以及各层的神经元数;
[0046] 将一区域类中的一订单预测基准时间段内的所述订单数据及所述变化因子放入 BP神经网络进行训练,即可得到该区域类中的该订单预测基准时间段的所述订单预测模 型。
[0047] 更进一步地,在步骤S1之前还包括步骤S0 :将代驾订单依据路线的不同分为不同 的代驾类型,并对各所述代驾类型的代驾订单也执行步骤S1至S4;
[0048] 并且,步骤S5中在接收到订单预测请求时,还需判断所述订单预测请求中的代驾 订单属于何种代驾类型,以选择相应代驾类型下相应区域类中相应订单预测基准时间段的 订单预测模型。
[0049] 总之,本发明所提供的上述代驾订单预测方法,针对某些预定场所,通过数据挖掘 技术来对历史订单数据进行深层分析,对订单进行有效合理的预测,以对代驾司机进行合 理的调度,使代驾司机的利用率得以有效的提高。
[0050] 另,本发明还提供一种代驾运力调度方法,包括:采用前述的代驾订单预测方法 来预测订单;根据订单预测结果,产生代驾司机调度方案,所述调度方案为:代驾司机人数 为预测的订单量的一预定倍数,所述预定倍数大于1。将该代驾运力调度方法用于所述预定 场所,根据上述代驾订单预测方法所预测的订单结果,对司机进行合理的调度分配,以提高 执行效率,提高客户满意度。
【具体实施方式】
[0051] 下面结合优选的实施方式对本发明作进一步说明。
[0052] 本发明的【具体实施方式】提供一种基于数据挖掘技术的代驾运力调度方法,用于某 些特定场所(例如机场、高铁站、渡口、码头等,不限于此),通过对这些特定场所在任意时 间段的订单量进行预测,并基于预测结果给出合理的代驾司机调度方案,以高效地为需要 找代驾的车主服务,同时使代驾司机的利用率(即代驾司机执行代驾任务的几率)尽可能 尚。
[0053] 所述代驾运力调度方法主要包括两大步骤:代驾订单预测和代驾司机调度,下面 以预定场所系机场为例对如何进行代驾订单预测和代驾司机调度进行详细的说明。
[0054] -种代驾订单预测方法,包括以下步骤S1至S5:
[0055]S1、分别获取多个预定场所在一历史期间内的代驾订单数据并进行数据预处理, 以分别建立各预定场所的订单数据库;
[0056]S2、基于每个预定场所的所述订单数据库,将所述多个预定场所按照订单变化相 似度进行区域聚类,使得所述多个预定场所归于不同的区域类;
[0057]S3、对于每个所述区域类,都执行以下操作:将一天均匀划分为多个基础时间段, 从所述订单数据库中获取同一区域类中的预定场所在所述历史期间内的每一天的每一所 述基础时间段中的订单量,根据各所述基础时间段内的订单量将所述多个基础时间段进行 时间段聚类,以使所述多个基础时间段聚类至不同的订单预测基准时间段;
[0058]S4、针对每一区域类中的每一订单预测基准时间段,都执行以下操作:提取一订单 预测基准时间段内的订单数据和相应的变化因子,并输入BP神经网络进行非线性拟合,以 获得每一区域类中的每一订单预测基准时间段的订单预测模型;
[0059]S5、接收订单预测请求,判断所述订单预测请求来自哪个区域类以及请求预测的 时间属于哪个订单预测基准时间段,以选择相应区域类下相应订单预测基准时间段的订单 预测模型,并获取所述订单预测请求中的变化因子以供所对应的订单预测模型进行订单量 预测。
[0060] 在一种具体的实施例中,预定场所以机场为例,那么,步骤S1中所述的多个预定 场所例如可以包括深圳机场、广州机场、北京机场以及香港机场等。则步骤S1具体包括:从 现有的机场代驾预约系统中提取系统运行前期的历史订单数据,例如,分别提取机场A1、机 场A2、机场A3、…、机场A10 (此处的机场个数仅仅是列举,不构成对本发明的限制,只要是 使用机场代驾预约系统的机场都可以)在当天的前300天内(此处的历史期间=300天仅 仅是列举,不构成对本发明的限制)的订单数据,然后从这些订单数据中提取关键信息,所 述关键信息至少包括这300天内每天的预约订单量YYDDL、约定执行时间YDZXSJ、订单实际 执行时间SJZX、取消订单量QXL以及取消订单原因QXYY,同时,还需要计算每个成功执行的 订单的顾客等待时间DDSJ,其中,顾客等待时间f=:fχ/?,其中f为所有订单的约定执行 时间与订单实际执行时间之间的时间差的平均值,μ是本着顾客至上的原则而在实际等待 时间的基础上进行适当的夸大,即μ>1但也不宜过大,在1~1. 5之间最佳。从而,每一个 机场就产生如下表1所示的订单数据库:
[0061]
[0062]表1
[0063] 在表1中,"第1天"表示这300天中最早的一天,以此类推,"第300天"为当天的 前一天。
[0064] 接上例,所述步骤S2进行区域聚类的方法具体包括:
[0065]对每个机场的上述订单数据库,将300天内相邻两天之间的订单量变化采用三方 向链码来描述,以建立各机场的订单变化描述序列。例如:机场Α1在这300天中,第1天 至第300天的订单量数组为{50, 70, 55, 100,……,280, 100},该数组共300个元素,第一个 元素50即表示机场Α1在所述第1天内的订单量。三方向链码为0、1、2,当后一天的订单量 减去前一天的订单量所得差值Ad大于一第一阈值时,用链码"2"表示上升;当差值Ad小 于一第二阈值时,用链码"〇"表示下降;当差值Ad位于第二阈值与第一阈值之间时,用链 码"1"表示订单量不变,其中,所述第一阈值为正数,例如可以是10、20等,视情况而定义, 所述第二阈值为负数,例如可以是-10、-20等,视情况而定义。例如,若第一阈值和第二阈 值分别为10和-10,则对于上述订单量数组{50, 70, 55, 60,……,280, 100},第1天与第2 天之间的订单量变化则用链码2表示,第2天与第3天之间的订单量变化则用链码0表示, 第3天与第4天之间的订单量变化用链码1表示,以同样的方法计算,可将机场A1在300 天内的订单量变化用一个长度为299的三方向链码串(即订单变化描述序列)来表示。
[0066] 采用上述同样的方法,对机场A2至A10在300天内的订单变化也采用基于三方向 链码的订单变化描述序列来表示。从而得到10个分别对应机场A1至A10的长度为299的 订单变化描述序列。
[0067] 接着,计算10个机场两两之间的编辑距离,以判断两机场之间的订单变化相似 度。以计算机场A1和A2之间的编辑距离为例来说明:
[0068] 1)选取机场A1和机场A2的订单变化描述序列81:1';[1^1与string2,先计算序列 stringi中的第i个链码string丨⑴与序列string2中的第j个链码string2(j)之间的链 码编辑距离edit(i,j),其中i和j的取值在0与序列长度299之间;
[0069] 2)初始化一个299X299的矩阵D,采用如下公式计算所述链码编辑距离 edit(i,j),并用链码编辑距离edit(i,j)来填充矩阵D:
[0070]
[0071] 经过上述公式计算得到完整的矩阵D,如下:
[0072]
[0073] 并且,矩阵D中的元素D(299, 299) =edit(299, 299)即为机场A1与机场A2之间 的编辑距离。
[0074] 按照上述方法计算任意两个机场之间的编辑距离,从而10个机场A1~A10之间, 即可存在.⑴X(j〇彳).=45个编辑距离。 7
[0075] 对上述求得的45个编辑距离采用迭代自组织分析算法IS0DATA进行聚类,以将 10个机场进行区域聚类。此处也可以采
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1