代驾订单预测方法和代驾运力调度方法

文档序号:9616532阅读:1128来源:国知局
代驾订单预测方法和代驾运力调度方法
【技术领域】
[0001] 本发明涉及代驾智能设备技术领域,尤其涉及一种基于数据挖掘技术的代驾订单 预测方法和代驾运力调度方法。
【背景技术】
[0002] 现如今,越来越多的人选择自驾前往机场乘坐飞机出行,然而,自驾去机场时停车 会遇到如下问题:
[0003] 1、浪费时间:相较于乘坐地铁、的士等交通工具的人而言,需要花费停车过程的时 间,尤其是机场客流量大、停车场时常处于饱和状态,导致停车过程会耽误预料之外的宝贵 时间,甚至误机。返程回来时,还可能忘记车辆停放位置,给自驾车主带来很大的麻烦;
[0004] 2、费用昂贵:由于机场停车场的独占性和垄断性,导致机场停车费用昂贵;
[0005] 3、车辆无人照料:车辆停放于机场而车主出行的期间,车辆无人照料,同时还成为 了一种闲置资源。
[0006] 基于上述机场停车所存在的问题,机场代驾服务应运而生,自驾来机场的车主可 以通过选择代驾,付出一点小费,以省去停车所耽误的宝贵时间,同时车辆还能得到很好的 看护。最初的机场代驾服务大致是:自驾车主电话咨询代驾服务台,服务台向代驾司机播报 需求信息,代驾司机接单后去给车主代驾。但这种方式一方面响应不及时,另一方面可能导 致多个代驾司机重复接单甚至抢单的情况发生。
[0007] 随着技术的不断发展,以及智能电子设备的普及,诸如智能导航设备、智能手机的 普及,代驾模式也发生了较大的变革,从最初的电话咨询变为网络或移动终端APP咨询,衍 生了许多代驾软件,例如e代驾、滴滴代驾、E都市等。但这些代驾软件存在下列问题:
[0008] 1)大部分代驾软件对订单量的预估和分析做得不到位,导致司机分配不合理,并 且,对代驾司机的动态调度算法仍存在缺陷,导致有些司机时常空闲而有些司机分配订单 过多而耽误车主,导致顾客体验不佳,订单量下降,司机资源利用不合理。
[0009] 2)大部分代驾软件都是面向全部城市群体,市场上缺少针对特定区域(例如机 场、高铁站、码头渡口等)、特定方向的专门代驾服务。

【发明内容】

[0010] 本发明的主要目的在于提出一种代驾订单预测方法,基于数据挖掘技术,对历史 订单情况进行多维度分析,更准确地预测订单,以解决现有技术因对订单的预估和分析不 到位而导致的代驾司机分配不合理的技术问题。
[0011] 本发明解决上述技术问题的技术方案如下:
[0012] -种代驾订单预测方法,用于预定场所,包括以下步骤:
[0013] S1、分别获取多个预定场所在一历史期间内的代驾订单数据并进行数据预处理, 以分别建立各预定场所的订单数据库;
[0014] S2、基于每个预定场所的所述订单数据库,将所述多个预定场所按照订单变化相 似度进行区域聚类,使得所述多个预定场所归于不同的区域类;
[0015]S3、对于每个所述区域类,都执行以下操作:将一天均匀划分为多个基础时间段, 从所述订单数据库中获取同一区域类中的预定场所在所述历史期间内的每一天的每一所 述基础时间段中的订单量,根据各所述基础时间段内的订单量将所述多个基础时间段进行 时间段聚类,以使所述多个基础时间段聚类至不同的订单预测基准时间段;
[0016]S4、针对每一区域类中的每一订单预测基准时间段,都执行以下操作:提取一订单 预测基准时间段内的订单数据和相应的变化因子,并输入BP神经网络进行非线性拟合,以 获得每一区域类中的每一订单预测基准时间段的订单预测模型;
[0017]S5、接收订单预测请求,判断所述订单预测请求来自哪个区域类以及请求预测的 时间属于哪个订单预测基准时间段,以选择相应区域类下相应订单预测基准时间段的订单 预测模型,并获取所述订单预测请求中的变化因子以供所对应的订单预测模型进行订单量 预测。
[0018] 采用上述代驾订单预测方法来预测一些特定场所(即所述预定场所)例如机场、 码头、渡口、高铁站等的代驾订单,至少具有以下优势:
[0019] 1)由于本发明所使用的预定场所有多种类型,并且分布于全国甚至世界各地,存 在很大的差异性,因此本发明通过区域聚类将很多个预定场所进行分类,属于同一区域类 的预定场所的数据可以采用一个算法流程,减少并行执行的算法数量,更重要的是,将预定 场所进行归类,使得一个算法流程中的数据量大大增加,因而增加了预测结果的准确性;
[0020] 2)由于本发明中的代驾订单预测,订单量的多少所取决的自变因素较多,包括但 不限于天气,订单量与这些自变因素之间的关系应当是非常复杂的非线性关系,因此采用 BP神经网络来对订单预测模型的生成进行非线性拟合,能够获得更加合理的订单预测模 型,以更加准确地预测代驾订单。
[0021] 更进一步地,所述步骤S1中的所述数据预处理包括:
[0022] 提取所述代驾订单数据中的关键信息,所述关键信息至少包括所述历史期间内每 天的预约订单量、约定执行时间、订单实际执行时间、取消订单量以及取消订单原因;计算 每个成功执行的订单的顾客等待时间。
[0023] 更进一步地,所述步骤S2具体包括:
[0024]S21、基于每个所述预定场所的所述订单数据库,将所述历史期间内订单量的变化 采用三方向链码来描述,以建立各所述预定场所的变化描述序列;
[0025]S22、对所述多个预定场所,采用所述变化描述序列计算两两之间的编辑距离;
[0026]S23、根据编辑距离来判断所述订单变化相似度以将所述多个预定场所进行区域 类的划分。
[0027] 更进一步地,所述步骤S22具体包括:
[0028] 选取待计算的两个预定场所A和B的变化描述序列81:1';[1^1与string2,计算变化 描述序列stringi中的第i个链码string丨(i)与变化描述序列string2中的第j个链码 string2(j)之间的链码编辑距离edit(i,j),其中0彡i彡L1,0彡j彡L2,L1和L2分别 表示变化描述序列stringystring2的总长度;
[0029] 初始化一个LIXL2的矩阵D,采用如下公式计算所述链码编辑距离edit(i,j)来 填充矩阵D:
[0030]
[0031] 经过上述公式计算得到完整的L1XL2的矩阵D,并且,矩阵D中的元素D(L1,L2) 即为两个所述预定场所A与B之间的编辑距离editAB;
[0032] 按照上述方法,计算任意两个所述预定场所的编辑距离,共得到个编辑 距离,其中E为预定场所的总个数;
[0033] 所述步骤S23具体包括:对步骤S22中得到的_^11个编辑距离采用迭代自组 2 织数据分析算法进行聚类,以使得E个预定场所按照订单变化相似度划分为不同的区域 类。
[0034] 更进一步地,所述三方向链码包括0、1、2:订单量比前一天增加并且增加的值大 于第一阈值时用链码2表不"上升";订单量比前一天减少并且减少的值大于所述第一阈值 时用链码0表示"下降";订单量与前一天相比不变,或者增大但增大的值小于所述第一阈 值,或者减小但减小的值小于所述第一阈值时,用链码1表示"不变"。
[0035] 更进一步地,所述步骤S3中所述基础时间段的时长不小于所述顾客等待时间;
[0036] 所述步骤S3中进行所述时间段聚类具体包括:
[0037]S31、对每一区域类都执行以下操作:统计一区域类中的所有所述预定场所每一天 在每一基础时间段内的订单量,分别以各所述基础时间段和每一基础时间段内对应的订单 量为维度数据建立二维向量X(r,h),则该区域类存在y=FXH个二维向量XdX2,X3,L,Xy, 其中H为所述基础时间段的个数,F为所述历史期间所含的天数;
[0038]S32、对每一个区域类均执行以下操作:将每个二维向量中各维度的数据进行标准 化以统一量纲,标准化公式々=(^_)/(·^ -,其中x_、x_分别为y个二维向量中 同一维度数据中的最小值和最大值,从而得到y个标准化后的二维向量,J>
[0039]S33、对于每一个区域类,采用最近邻聚类方法,基于欧氏距离对步骤S32中标准 化后得到的y个二维向量,&:进行聚类,得到基于订单量相似程度的m个向量样 本类;
[0040]S34、统计一基础时间段在m个向量样本类中分别拥有多少订单量,然后将该基础 时间段归类于出现订单量最多的一个向量样本类中;
[0041]S35、
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1