代驾订单预测方法和代驾运力调度方法_3

文档序号:9616532阅读:来源:国知局
用其他聚类方法,只不过IS0DATA聚类方法可以自 适应选择聚类数量,使最终的聚类结果更加合理、紧凑。由于IS0DATA聚类算法属于现有技 术,具体的聚类过程在此不再赘述。
[0076] 从而,将10个机场A1~A10基于订单变化相似度分成不同的区域类,假设将这10 个机场进行所述区域聚类后分为三个区域类:B1 (A2、A3、A6)、B2 (Al、A8、A9、A10)、B3 (A4、A5、A7)。则对10个机场的后续数据处理将以区域类来聚类执行,即对区域类B1、B2、B3都 将按照同样的算法流程来并行执行;而同一区域类中的多个机场的数据将集中到一个算法 流程,不再每个机场分别执行算法。
[0077] 下面将对每一区域类进行步骤S3中所述的时间段聚类,以区域类B1 (机场A2、机 场A3、机场A6)为例来说明如何进行时间段聚类:
[0078] 步骤1、将一天均分为多个基础时间段,基础时间段的时长应当不小于所述顾客等 待时间,在此例子中,将一天分为24个基础时间段0, 1,2,……,23,其中0表示0点至1点 之间的时间段,1表示1点至2点之间的时间段,以此类推;
[0079] 步骤2、从订单数据库中获取机场A2、机场A3、机场A6在300天内的每一天的每 一所述基础时间段中的订单量之和,即可得到以基础时间段和相应订单量为维度数据建立 的二维向量X(r,h),其中h表不24个基础时间段中的某一基础时间段,r表不某一天中该 基础时间段内三个机场的订单量之和。即可得到y个(此处y=FXΗ= 300X24 = 7200) 二维向量乂1,乂2,乂3,1^乂¥,例如向量乂 1(300,0)表示300天内第1天(日期最早的一天)中的 0点至1点之间三个机场Α2、A3、Α6的订单总量为300个,Χ2 (200, 1)表示所述第1天中的 1点至2点之间上述三个机场的订单总量为200个,Χ25 (200, 0)表示第2天中的0点至1点 之间上述三个机场的订单总量为200个,以此类推;
[0080] 步骤3、对以上y个二维向量的各个维度数据进行标准化,以统一量纲,消除因 为量纲不同带来的极大误差。标准化公式i=:(3c-,其中x_、χ_分别为 y个二维向量中同一维度数据中的最小值和最大值,从而得到y个标准化后的二维向量
[0081] 步骤4、采用最近邻聚类方法,基于欧氏距离对上述步骤3中得到的y个二维向量 尤,元丄,.·?,进行聚类,得到基于订单量相似程度的m个向量样本类。具体地,首先设定欧 氏距离的非负阈值V,从y个二维向量名,矣,L,fv中随机选取一个向量氧作为聚类中心Zi,假设u= 1即氧=粟,那么,计算向量尤2与聚类中心间的欧氏距离d12:
[0082] 若d12>V,则新建一个聚类中心Z2,且矣=毛,再比较向量.烏与聚类中心冗2的 距离d13、d23,若d13和d23均大于V,则再新建一个聚类中心Z3且=t4座续进行比较;若 d13和d23均小于V,且d13〈(123〈¥,则说明向量尤距离聚类中心21更近,.激 3应当与為同属一 类;而若d23〈d13〈V,则说明向量氧距离聚类中心Z2更近,矣应当与氣同属一类;
[0083] 如果d12〈V,则说明之是在以ΖΛ中心以V为半径的超球体聚类簇中,即名和尤 同属一类,再比较尤与Zi之间的距离d13,若d13>v则新建一个聚类中心z2,且再比 较尤与聚类中心Zpz2的欧式距离;
[0084] 采用同样的方法不断进行比较、聚类,最终将y个二维向量尤,文2丄,i,.聚类成为 基于订单量相似程度的m个向量样本类Cl、c2、……、(;;在每一个向量样本类中,向量数不 一定相同。
[0085] 步骤5、统计一基础时间段在m个向量样本类中分别拥有多少订单量,然后将 该基础时间段归类于出现订单量最多的一个向量样本类中。在本例中,由于选取了 300 天,每种基础时间段存在300个向量,可能分散于多个向量样本类中,并不能确定某个基 础时间段到底最终应当归于哪个向量样本类,因此采用最大隶属度原则,统计每个基础 时间段在m个向量样本类中分别拥有多少个订单量,例如,属于基础时间段0的300个 向量分散于向量样本类(^和C2,但是在(^中,基础时间段0的订单总量为200,而在C2 中为30,则基础时间段0应当归于向量样本类Q中而不属于C2。以同样的方法对每个 基础时间段进行归类,最终得到的m个向量样本类中,不存在重复的基础时间段,且每 个向量样本类中的基础时间段是连续的,将每个向量样本类中连续的基础时间段合并, 即可得到m个订单预测基准时间段。例如,采用最大隶属度原则归类后得到的m个向 量样本类,例如m= 3,得到{(0, 100),(1,200),(2, 300)}、{(3, 10),(4, 25),(5, 50)}、 {(6, 500), (7, 500), (8,600),……,(23, 500) },从而得到三个订单预测基准时间段0~2、 3~5、6~23,即表示对于区域类B1,其三个机场A2、A3、A6中的任一个机场在时间段0~ 2内采用同一个订单预测模型,而在时间段3~5采用另一个订单预测模型,在时间段6~ 23又采用不同的订单预测模型。
[0086] 对于不同的区域类,不同的订单预测基准时间段,订单预测模型将不同。下面将详 述如何生成订单预测模型:
[0087] 提取某一区域类中的某一订单预测基准时间段内的订单数据和相应的变化因子, 并输入BP神经网络进行非线性拟合,即可获得该区域类中的该订单预测基准时间段的订 单预测模型。例如:获取区域类B1中订单预测基准时间段0~2所对应的订单预测模型, 首先提取区域类B1中各机场在300天内每一天的0点~2点之间的订单量,以及每个订单 对应的日期、该日期中0点~2点期间的天气情况,将所提取的这些数据输入至BP神经网 络进行训练(采用非线性拟合),以获得区域类B1在订单预测基准时间段0~2的订单预 测模型。应当说明,在将所提取的数据输入至BP神经网络之前,需要针对待输入的数据来 设计BP神经网络的层数、每层的神经元数、神经元的输入输出对照公式以及激活函数。在 一种优选的实施例中,神经元的输入和输出对照公式为:-夂yi =f(netJ, 其中,激活函数选择为S形函数(SigmoidFunction) : /'(.v) = -^-―(I) < /{'ν) <1) , ... 1+e t;x2=w;x3=a。而BP神经网络的层数可如此确定:基于区域类的不同,定义一层,该层 的神经元个数即为区域类的个数;基于各区域类中具有多个不同的订单预测基准时间段, 再定义一层,该层的神经元个数为订单预测基准时间段的个数;而输入层,以上述为例,需 输入订单数量(指的是某一区域、某一订单预测基准时间段的订单数量)、日期、天气,因此 输入层的神经元个数为3。
[0088] 采用上述方法BP神经网络的方法,就能够得到不同区域类不同订单预测基准时 间段的订单预测模型。根据订单预测请求,判断所述订单预测请求来自哪个区域类以及请 求预测的时间属于哪个订单预测基准时间段,以选择相应区域类下相应订单预测基准时间 段的订单预测模型,并获取所述订单预测请求中的变化因子例如天气,然后即可运行该订 单预测模型来预测订单量。
[0089] 在另一些实施例中,假如代驾订单不只有一种类型,根据路线的不同会有多种订 单类型,例如有两种:航站楼一停车场,停车场一航站楼,对于此种情况,可先将代驾订单进 行分类,然后在步骤S1中获取代驾订单数据时需要获取属于同类代驾订单的数据,这样一 来,订单预测模型种类将会更多,每一订单类型中的每一区域类下的每一订单预测基准时 间段都将对应不同的订单预测模型。在步骤S5中接收到订单预测请求时就还需要判断代 驾订单属于那种类型(例如是航站楼一停车场,还是停车场一航站楼)。
[0090] 还提供一种代驾运力调度方法,在通过前述的代驾订单预测方法进行较为准确的 订单预测的基础上,可以对代驾司机进行合理的调配。例如,某一机场接收到预测结果显示 某一时间段停车场一航站楼的订单量为20,那么,系统将分配25个代驾司机于该时间段 内停车场等候,之所以代驾司机人数多于订单量,是为了防止车主找不到司机,造成顾客体 验不好。
[0091]在一些优选的实施例中,可以通过一定的系统规则设定,防止一人重复下单,司机 重复接单,顾客过度等待等情况发生。同时引入打分机制,顾客可以对乘务司机进行评分, 对于表现不积极、态度恶劣或送车泊车慢的司机进行处理。具体如下:
[0092] ①通过获取顾客订单的手机号以及手机頂EI序
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1