一种车辆调度方法、装置、电子设备及可读存储介质与流程

文档序号：30070642发布日期：2022-05-18 01:59阅读：71来源：国知局

1.本技术涉及智能技术领域，特别涉及一种车辆调度方法、装置、电子设备及可读存储介质。

背景技术：

2.时至今日，在打车出行行业中，仍然存在大量客户端和司机端的需求匹配和合理而导致的问题，如用户打车难或等待时间长久，再如司机接单距离远等问题。
3.现有技术中采用的运营车辆资源调度的深度强化学习技术，以单智能体深度强化学习的方法和系统为主，基于打车市场和用户市场的复杂性，单智能体深度强化学习的方法和系统不能精确预测乘客用车需求分布和车辆调度目标区域。

技术实现要素：

4.本技术为克服上述现有技术存在的缺陷而提供一种能够精确预测乘客用车需求分布和车辆调度目标区域的车辆调度方法、装置、电子设备及可读存储介质。
5.为解决上述技术问题，本技术提供以下技术方案：
6.根据本技术实施例的第一方面，提供一种车辆调度方法，包括：
7.获取调度区域内的乘客特征和各目标车辆对应的车辆特征；所述调度区域是对预设地理范围进行划分得到的多个调度区域中的任一调度区域，所述目标车辆为处于空闲状态的运营车辆；
8.将所述调度区域内的乘客特征输入至区域用车期望预测模型进行用车期望预测处理，得到所述调度区域的用车期望信息；
9.将所述调度区域内各目标车辆对应的车辆特征分别与所述调度区域对应的用车期望信息相融合，得到所述调度区域内各目标车辆对应的融合特征；
10.将所述调度区域内各目标车辆对应的融合特征输入至调度区域预测模型进行调度区域预测处理，得到所述调度区域内各目标车辆的预测调度区域；
11.根据每个所述调度区域内各目标车辆的预测调度区域，对所述多个调度区域中的目标车辆进行调度。
12.在一个示例性的实施方式中，所述方法还包括：
13.获取所述调度区域内各运营车辆的运营状态信息；
14.根据所述运营状态信息，确定处于空闲状态的运营车辆，得到所述调度区域内的目标车辆。
15.在一个示例性的实施方式中，所述方法还包括：
16.获取样本调度区域在第一时刻的样本乘客特征，以及所述样本调度区域对应的用车标签信息；所述用车标签信息根据样本调度区域在第二时刻的预约用车信息和实际用车信息确定，所述第二时刻是指所述第一时刻之后的时刻；
17.将所述样本调度区域的所述样本乘客特征输入至第一预设神经网络模型进行用
车期望预测，得到所述样本调度区域对应的用车期望信息；
18.根据所述样本调度区域对应的用车期望信息与所述样本调度区域对应的用车标签信息之间的差异，调整所述第一预设神经网络模型的模型参数；
19.基于调整后的模型参数继续进行迭代训练，直至达到预设的训练结束条件，得到所述区域用车期望预测模型。
20.在一个示例性的实施方式中，所述方法还包括：
21.获取所述样本调度区域在第二时刻的预约用车信息和实际用车信息；
22.确定所述预约用车信息和所述实际用车信息分别对应的权重；
23.根据所述预约用车信息和所述实际用车信息以及相应的权重进行加权求和，得到所述用车标签信息。
24.在一个示例性的实施方式中，所述方法还包括：
25.获取所述样本调度区域内各样本车辆在第三时刻的样本车辆特征，以及所述样本调度区域对应的调度标签信息；所述调度标签信息根据所述样本调度区域在第四时刻被调度车辆的接单信息确定，所述第三时刻是指所述第四时刻之后的时刻；
26.将各所述样本车辆的样本车辆特征和所述样本调度区域对应的用车期望信息相融合，得到各所述样本车辆对应的融合特征，将各所述样本车辆对应的融合特征输入至第二预设神经网络模型进行调度区域预测，得到各所述样本车辆对应的调度区域预测结果；
27.根据各所述样本车辆对应的调度区域预测结果与所述调度标签信息之间的差异，调整所述第二预设神经网络模型的模型参数；
28.基于调整后的模型参数继续进行迭代训练，直至达到预设的训练结束条件，得到所述调度区域预测模型。
29.在一个示例性的实施方式中，所述方法还包括：
30.获取所述样本调度区域在第四时刻被调度车辆的接单信息，所述接单信息包括接单量和用车结算信息；
31.确定所述接单量和所述用车结算信息分别对应的权重；
32.根据所述接单量和所述用车结算信息以及相应的权重进行加权求和，得到所述调度标签信息。
33.在一个示例性的实施方式中，所述第一预设神经网络模型和所述第二预设神经网络模型为深度神经网络或基于误差逆向传播算法的多层前馈神经网络。
34.根据本技术实施例的第二方面，提供一种车辆调度装置，所述装置包括：
35.特征获取模块，用于获取调度区域内的乘客特征和各目标车辆对应的车辆特征，所述调度区域是对预设地理范围进行划分得到的多个区域中的任一区域，所述目标车辆为处于空闲状态的运营车辆；
36.区域用车期望预测模块，用于基于所述调度区域内的乘客特征，获取所述调度区域的用车期望信息；
37.用车期望信息提取模块，用于提取所述调度区域的所述用车期望信息；
38.特征融合模块，用于获取所述调度区域内各目标车辆对应的融合特征，所述调度区域内各目标车辆对应的融合特征基于所述调度区域内各目标车辆特征及所述调度区域对应的用车期望信息；
39.调度区域预测模块，用于基于所述调度区域内各目标车辆对应的融合特征，获取所述调度区域内各目标车辆的预测调度区域；
40.目标车辆调度模块，用于基于所述调度区域内各目标车辆的预测调度区域，调度所述多个调度区域中的目标车辆。
41.在一个示例性的实施方式中，所述装置还包括：
42.特征获取模块，基于调度区域内各运营车辆的运营状态信息，获取调度区域内的目标车辆。
43.在一个示例性的实施方式中，所述装置还包括：
44.第一样本特征获取模块，用于获取样本调度区域在第一时刻的样本乘客特征，以及样本调度区域对应的用车标签信息；用车标签信息根据样本调度区域在第二时刻的预约用车信息和实际用车信息确定，第二时刻是指第一时刻之后的时刻；
45.样本区域用车期望预测模块，用于基于样本调度区域的样本乘客特征和第一预设神经网络模块，获取样本调度区域对应的用车期望信息；
46.第一样本参数调整模块，用于基于样本调度区域对应的用车期望信息与样本调度区域对应的用车标签信息之间的差异，调整第一预设神经网络模块的模块参数；
47.第一判断模块，用于根据样本调度区域对应的用车期望信息与样本调度区域对应的用车标签信息之间的差异，判断调整后的第一预设神经网络模块的模块参数是否达到预设的训练结束条件。
48.在一个示例性的实施方式中，所述装置还包括：
49.第二样本特征获取模块，用于获取样本调度区域内各样本车辆在第三时刻的样本车辆特征，以及样本调度区域对应的调度标签信息；调度标签信息根据样本调度区域在第四时刻被调度车辆的接单信息确定，第三时刻是指第四时刻之后的时刻；
50.样本用车期望信息提取模块，用于从样本区域用车期望预测模块中提取样本调度区域对应的用车期望信息；
51.样本特征融合模块，用于各样本车辆对应的融合特征，各样本车辆对应的融合特征基于各样本车辆的样本车辆特征和样本调度区域对应的用车期望信息；
52.样本调度区域预测模块，用于基于各样本车辆对应的融合特征和第二预设神经网络模块，获取各样本车辆对应的调度区域预测结果；
53.第二样本参数调整模块，用于基于各样本车辆对应的调度区域预测结果与调度标签信息之间的差异，调整第二预设神经网络模块的模块参数；
54.第二判断模块，用于对比各样本车辆对应的调度区域预测结果与调度标签信息之间的差异，根据该差异调整第二预设神经网络模块的模块参数。
55.根据本技术实施例的第三方面，提供一种电子设备，包括处理器和存储器，所述存储器中存储有至少一条指令或者至少一段程序，所述至少一条指令或者所述至少一段程由所述处理器加载并执行以实现上述的车辆调度方法。
56.根据本技术实施例的第四方面，提供一种计算机可读存储介质，所述存储介质中存储有至少一条指令或者至少一段程序，所述至少一条指令或者所述至少一段程序由处理器加载并执行以实现上述的车辆调度方法。
57.采用上述技术方案，本技术具有如下有益效果：
58.本技术提供的一种车辆调度方法、装置、电子设备及可读存储介质，通过采用区域用车期望预测模型和调度区域预测模型的双智能模型的技术方案，并且区域用车期望预测模型和调度区域预测模型均为实时更新的深度强化学习系统，更适合应对复杂场景下多种不确定因素的模拟和预测，使预测结果更贴近真实的用车场景，从而达到可以精确预测乘客用车需求分布和车辆调度目标区域的效果，促进车辆资源的分布更符合用户对车辆资源的需求预期，实现合理的资源调度。
附图说明
59.为了更清楚地说明本技术实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
60.图1为本技术实施例提供的一种车辆调度方法的流程示意图；
61.图2为本技术实施例提供的一种用车期望预测模型的训练流程图；
62.图3为本技术实施例提供的一种调度区域预测模型的训练流程图；
63.图4为本技术实施例提供的一种车辆调度装置的结构框图；
64.图5为本技术实施例提供的运行一种车辆调度方法的电子设备的硬件结构框图。
具体实施方式
65.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都属于本技术保护的范围。
66.此处所称的“一个实施例”或“实施例”是指可包含于本技术至少一个实现方式中的特定特征、结构或特性。在本技术实施例的描述中，需要理解的是，术语“上”、“下”、“顶”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本技术和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本技术的限制。此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含的包括一个或者更多个该特征。而且，术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
67.请参阅图1，其所示为本技术实施例提供的一种车辆调度方法的流程示意图,该车辆调度方法包括：
68.步骤s101：获取调度区域内的乘客特征和各目标车辆对应的车辆特征；调度区域是对预设地理范围进行划分得到的多个调度区域中的任一调度区域，目标车辆为处于空闲状态的运营车辆；
69.步骤s102:将调度区域内的乘客特征输入至区域用车期望预测模型进行用车期望
预测处理，得到调度区域的用车期望信息；
70.步骤s103:将调度区域内各目标车辆对应的车辆特征分别与调度区域对应的用车期望信息相融合，得到调度区域内各目标车辆对应的融合特征；
71.步骤s104:将调度区域内各目标车辆对应的融合特征输入至调度区域预测模型进行调度区域预测处理，得到调度区域内各目标车辆的预测调度区域；
72.步骤s105:根据每个调度区域内各目标车辆的预测调度区域，对多个调度区域中的目标车辆进行调度。
73.在一个具体的实施例中，预先将预设地理范围进行划分，得到多个调度区域；通过步骤s101获取调度区域内的乘客特征和各运营车辆的运营状态信息，其中，通过调度区域内各运营车辆的运营状态信息，确定处于空闲状态的运营车辆，即目标车辆，进而提取各目标车对应的车辆特征；通过步骤s102预测调度区域的用车期望信息，即用车需求，其中，为了使预测出的调度区域的用车期望信息更贴近真实的用车场景，达到精确预测乘客需求分布的目的，区域用车期望预测模型的深度强化学习系统为实时更新的在线学习系统；通过步骤s103得到调度区域内各目标车辆对应的融合特征；通过步骤s104预测各目标车辆的预测调度区域，其中，为了使预测调度区域与实际需求贴合，达到精确预测车辆调度目标区域的效果，调度区域预测模型的深度强化学习系统为实时更新的在线学习系统；通过步骤s105发送指令给目标车辆，使目标车辆前往预测调度区域，达到车辆调度的目的。本实施例通过采用区域用车期望预测模型和调度区域预测模型的双智能模型的技术方案，并且区域用车期望预测模型和调度区域预测模型均为实时更新的深度强化学习系统，更适合应对复杂场景下多种不确定因素的模拟和预测，使预测结果更贴近真实的用车场景，从而达到可以精确预测乘客用车需求分布和车辆调度目标区域的效果，促进车辆资源的分布更符合用户对车辆资源的需求预期，实现合理的资源调度。
74.需要说明的是，调度区域内的乘客特征和各目标车辆对应的车辆特征包括乘客和目标车辆的实时定位坐标、乘客的历史打车习惯、交通实时拥堵情况、当天的日期特征、乘客和目标车辆所在区域的实时天气情况和下一时刻的天气情况。
75.具体的，本技术实施例还可以包括确定目标车辆的步骤，该步骤具体包括：
76.获取调度区域内各运营车辆的运营状态信息；
77.根据运营状态信息，确定处于空闲状态的运营车辆，得到调度区域内的目标车辆。
78.在一个具体的实施例中，先通过各运营车辆的运营状态信息确定处于空闲状态的运营车辆，再基于处于空闲状态的运营车辆定为调度区域内的目标车辆，可以避免在调度过程中错误调度处于运载状态下的运营车辆，造成乘客空等的情况发生。
79.请参阅图2，其所示为本技术实施例提供的一种用车期望预测模型的训练流程图，该用车期望预测模型的训练包括：
80.步骤s201:获取样本调度区域在第一时刻的样本乘客特征，以及样本调度区域对应的用车标签信息；用车标签信息根据样本调度区域在第二时刻的预约用车信息和实际用车信息确定，第二时刻是指第一时刻之后的时刻；
81.步骤s202:将样本调度区域的样本乘客特征输入至第一预设神经网络模型进行用车期望预测，得到样本调度区域对应的用车期望信息；
82.步骤s203:根据样本调度区域对应的用车期望信息与样本调度区域对应的用车标
签信息之间的差异，调整第一预设神经网络模型的模型参数；
83.步骤s204：判断调整后的第一预设神经网络模型的模型参数是否达到预设的训练结束条件；
84.若否，基于调整后的模型参数继续进行迭代训练；
85.若是，则执行步骤s205：得到区域用车期望预测模型。
86.在一个具体的实施例中，预先收集样本调度区域内各历史时刻的样本乘客特征，以及样本调度区域对应的用车标签信息，即各历史时刻的预约用车信息和实际用车信息；通过步骤s201获取样本调度区域在第一时刻的样本乘客特征，以及样本调度区域对应的用车标签信息，即第二时刻的预约用车信息和实际用车信息；通过步骤s202得到样本调度区域对应的用车期望信息，即样本调度区域对应的用车需求；通过步骤s203对比样本调度区域对应的用车期望信息与样本调度区域对应的用车标签信息之间的差异，根据该差异调整第一预设神经网络模型的模型参数，其中，第一预设神经网络模型为深度神经网络或基于误差逆向传播算法的多层前馈神经网络；通过步骤s204判断经过步骤s203调整后的第一预设神经网络模型的模型参数是否达到预设的训练结束条件，如果没有达到预设的训练结束条件，则基于调整后的第一预设神经网络模型的模型参数，返回步骤s201进行迭代训练，直至经过步骤s203调整后的第一预设神经网络模型的模型参数达到预设的训练结束条件，满足步骤s204的判定条件，则执行步骤s205；通过步骤s205，得到步骤s102所需的区域用车期望预测模型。本实施例是基于收集得到的历史数据，通过步骤s201～s205训练得到符合预设条件的区域用车期望预测模型，该区域用车期望预测模型在实际应用中会实时更新，通过在线学习的方式，得以精确预测乘客用车需求分布，促进车辆资源的分布更符合用户对车辆资源的需求预期，达到合理的资源调度。
87.需要说明的是，区域用车期望预测模型的训练是一个基于历史数据的迭代训练，只有当第一预设神经网络模型的模型参数达到预设的训练结束条件时，才能得到执行步骤s102所需的调度区域预测模型。
88.还需要说明的是，在迭代训练的过程中，每次执行步骤s201，所获取的第一时刻和第二时刻均是基于前一次执行步骤s201时获取的第一时刻和第二时刻的后续时刻。
89.还需要说明的是，预约用车信息可具体为预约用车订单数量，实际用车信息可具体为实际用车成单数量。
90.具体的，本技术实施例还可以包括确定上述用车标签信息的步骤，该步骤具体包括：
91.获取样本调度区域在第二时刻的预约用车信息和实际用车信息；
92.确定预约用车信息和实际用车信息分别对应的权重；
93.根据预约用车信息和实际用车信息以及相应的权重进行加权求和，得到用车标签信息。
94.在一个具体的实施例中，用车标签信息由预约用车信息和实际用车信息以及相应的权重的加权求和得出，其中，预约用车信息可具体为预约用车订单数量，实际用车信息可具体为实际用车成单数量，即用车标签信息可由预约用车订单数量和实际用车成单数量以及相应的权重加权求和得出。
95.请参阅图3，其所示为本技术实施例提供的一种调度区域预测模型的训练流程图，
该调度区域预测模型的训练包括：
96.步骤s301:获取样本调度区域内各样本车辆在第三时刻的样本车辆特征，以及样本调度区域对应的调度标签信息；调度标签信息根据样本调度区域在第四时刻被调度车辆的接单信息确定，第三时刻是指第四时刻之后的时刻；
97.步骤s302:将各样本车辆的样本车辆特征和样本调度区域对应的用车期望信息相融合，得到各样本车辆对应的融合特征；
98.步骤s303:将各样本车辆对应的融合特征输入至第二预设神经网络模型进行调度区域预测，得到各样本车辆对应的调度区域预测结果；
99.步骤s304:根据各样本车辆对应的调度区域预测结果与调度标签信息之间的差异，调整第二预设神经网络模型的模型参数；
100.步骤s305:判断调整后的第二预设神经网络模型的模型参数是否达到预设的训练结束条件；
101.若否，基于调整后的模型参数继续进行迭代训练；
102.若是，则s306:得到调度区域预测模型。
103.在一个具体的实施例中，预先收集样本调度区域内各历史时刻的各样本车辆特征，以及样本调度区域对应的调度标签信息，即各历史时刻的被调度车辆的接单信息；通过步骤s301获取样本调度区域内各样本车辆在第三时刻的样本车辆特征，以及样本调度区域对应的调度标签信息，即第二时刻被调度车辆的接单信息；通过步骤s302得到各样本车辆对应的融合特征；通过步骤s303得到各样本车辆对应的调度区域预测结果，即各样本车辆对应的预测调度区域；通过步骤s304对比各样本车辆对应的调度区域预测结果与调度标签信息之间的差异，根据该差异调整第二预设神经网络模型的模型参数，其中，第二预设神经网络模型为深度神经网络或基于误差逆向传播算法的多层前馈神经网络；通过步骤s305判断经过步骤s304调整后的第二预设神经网络模型的模型参数是否达到预设的训练结束条件，如果没有达到预设的训练结束条件，则基于调整后的第二预设神经网络模型的模型参数，返回步骤s301进行迭代训练，直至经过步骤s304调整后的第二预设神经网络模型的模型参数达到预设的训练结束条件，满足步骤s305的判定条件，则执行步骤s306；通过步骤s306，得到步骤s104所需的调度区域预测模型。本实施例是基于收集得到的历史数据，通过步骤s301～s306训练得到符合预设条件的调度区域预测模型，该调度区域预测模型在实际应用中会实时更新，通过在线学习的方式，得以精确预测车辆调度目标区域，促进车辆资源的分布更符合用户对车辆资源的需求预期，达到合理的资源调度。
104.需要说明的是，调度区域预测模型的训练是一个基于历史数据的迭代训练，只有当第二预设神经网络模型的模型参数达到预设的训练结束条件时，才能得到执行步骤s104所需的调度区域预测模型。
105.还需要说明的是，在迭代训练的过程中，每次执行步骤s301，所获取的第三时刻和第四时刻均是基于前一次执行步骤s301时获取的第三时刻和第四时刻的后续时刻。
106.还需要说明的是，接单信息包括接单量和用车结算信息，其中，用车结算信息可具体为用车结算金额。
107.具体的，本技术实施例还可以包括确定上述调度标签信息的步骤，该步骤具体包括：
108.获取样本调度区域在第四时刻被调度车辆的接单信息，接单信息包括接单量和用车结算信息；
109.确定接单量和用车结算信息分别对应的权重；
110.根据接单量和用车结算信息以及相应的权重进行加权求和，得到调度标签信息。
111.在一个具体的实施例中，调度标签信息由接单量和用车结算信息以及相应的权重的加权求和得出，其中，用车结算信息可具体为用车结算金额，即调度标签信息由接单量和用车结算金额以及相应的权重的加权求和得出。
112.具体的，第一预设神经网络模型和第二预设神经网络模型为深度神经网络或基于误差逆向传播算法的多层前馈神经网络。
113.在一个具体的实施例中，采用深度神经网络或基于误差逆向传播算法的多层前馈神经网络可以用较少的参数表示复杂的函数，且减少误差信号，有利于保障第一预设神经网络模型和第二预设神经网络模型运行的平稳性和精确性，进而保障区域用车期望预测模型和调度区域预测模型运行的平稳性和精确性。
114.由本技术实施例的上述技术方案可见，本技术实施例通过采用区域用车期望预测模型和调度区域预测模型的双智能模型的技术方案，并且区域用车期望预测模型和调度区域预测模型均为实时更新的深度强化学习系统，更适合应对复杂场景下多种不确定因素的模拟和预测，使预测结果更贴近真实的用车场景，从而达到可以精确预测乘客用车需求分布和车辆调度目标区域的效果，促进车辆资源的分布更符合用户对车辆资源的需求预期，实现合理的资源调度。
115.与上述实施例提供的车辆调度方法相对应，本技术实施例还提供一种车辆调度装置，由于本技术实施例提供的车辆调度装置与上述实施例提供的车辆调度方法相对应，因此前述车辆调度方法的实施方式也适用于本实施例提供的车辆调度装置，在本实施例中不再详细描述。
116.请参阅图4，其所示为本技术实施例提出的一种车辆调度装置的结构框图，该车辆调度装置包括：
117.特征获取模块，用于获取调度区域内的乘客特征和各目标车辆对应的车辆特征，调度区域是对预设地理范围进行划分得到的多个区域中的任一区域，目标车辆为处于空闲状态的运营车辆；
118.区域用车期望预测模块，用于基于调度区域内的乘客特征，获取调度区域的用车期望信息；
119.用车期望信息提取模块，用于提取调度区域的用车期望信息；
120.特征融合模块，用于获取调度区域内各目标车辆对应的融合特征，调度区域内各目标车辆对应的融合特征基于调度区域内各目标车辆特征及调度区域对应的用车期望信息；
121.调度区域预测模块，用于基于调度区域内各目标车辆对应的融合特征，获取调度区域内各目标车辆的预测调度区域；
122.目标车辆调度模块，用于基于调度区域内各目标车辆的预测调度区域，调度多个调度区域中的目标车辆。
123.在一个具体的实施例中，预先将预设地理范围进行划分，得到多个调度区域；通过
特征获取模块获取调度区域内的乘客特征和各运营车辆的运营状态信息，其中，通过调度区域内各运营车辆的运营状态信息，确定处于空闲状态的运营车辆，即目标车辆，进而提取各目标车对应的车辆特征；通过区域用车期望预测模块获取调度区域的用车期望信息，即用车需求，其中，为了使预测出的调度区域的用车期望信息更贴近真实的用车场景，达到精确预测乘客需求分布的目的，区域用车期望预测模块通过在线学习的方式，利用实时更新的区域用车期望预测相关的深度强化学习系统，预测调度区域的用车期望信息；通过用车期望信息提取模块将调度区域的用车期望信息从区域用车期望预测模块中提取出来；通过特征融合模块获取调度区域内各目标车辆对应的融合特征；通过调度区域预测模块获取调度区域内各目标车辆的预测调度区域，其中，为了使预测调度区域与实际需求贴合，达到精确预测车辆调度目标区域的效果，调度区域预测模块通过在线学习的方式，利用实时更新的调度区域预测相关的深度强化学习系统，预测目标车辆的调度区域；通过目标车辆调度模块发送指令给目标车辆，使目标车辆前往预测调度区域，达到车辆调度的目的。本实施例通过采用区域用车期望预测模块和调度区域预测模块的双智能模块的技术方案，并且区域用车期望预测模块和调度区域预测模块均为实时更新的深度强化学习系统，更适合应对复杂场景下多种不确定因素的模拟和预测，使预测结果更贴近真实的用车场景，从而达到可以精确预测乘客用车需求分布和车辆调度目标区域的效果，促进车辆资源的分布更符合用户对车辆资源的需求预期，实现合理的资源调度。
124.需要说明的是，调度区域内的乘客特征和各目标车辆对应的车辆特征包括乘客和目标车辆的实时定位坐标、乘客的历史打车习惯、交通实时拥堵情况、当天的日期特征、乘客和目标车辆所在区域的实时天气情况和下一时刻的天气情况。
125.具体的，本技术实施例还可以包括确定目标车辆的步骤，该步骤具体包括：
126.特征获取模块，基于调度区域内各运营车辆的运营状态信息，获取调度区域内的目标车辆；
127.在一个具体的实施例中，先通过特征获取模块获取调度区域内各运营车辆的运营状态信息，再基于调度区域内各运营车辆的运营状态信息确定处于空闲状态的运营车辆，将处于空闲状态的运营车辆定为调度区域内的目标车辆，可以避免在调度过程中错误调度处于运载状态下的运营车辆，造成乘客空等的情况发生。
128.具体的，本技术实施例还可以包括区域用车期望预测模块的训练过程，该过程具体包括：
129.第一样本特征获取模块，用于获取样本调度区域在第一时刻的样本乘客特征，以及样本调度区域对应的用车标签信息；用车标签信息根据样本调度区域在第二时刻的预约用车信息和实际用车信息确定，第二时刻是指第一时刻之后的时刻；
130.样本区域用车期望预测模块，用于基于样本调度区域的样本乘客特征和第一预设神经网络模块，获取样本调度区域对应的用车期望信息；
131.第一样本参数调整模块，用于基于样本调度区域对应的用车期望信息与样本调度区域对应的用车标签信息之间的差异，调整第一预设神经网络模块的模块参数；
132.第一判断模块，用于根据样本调度区域对应的用车期望信息与样本调度区域对应的用车标签信息之间的差异，判断调整后的第一预设神经网络模块的模块参数是否达到预设的训练结束条件。
133.在一个具体的实施例中，预先收集样本调度区域内各历史时刻的样本乘客特征，以及样本调度区域对应的用车标签信息，即各历史时刻的预约用车信息和实际用车信息；通过第一样本特征获取模块获取样本调度区域在第一时刻的样本乘客特征，以及样本调度区域对应的用车标签信息，即第二时刻的预约用车信息和实际用车信息；通过样本区域用车期望预测模块获取样本调度区域对应的用车期望信息，即样本调度区域对应的用车需求；通过第一样本参数调整模块对比样本调度区域对应的用车期望信息与样本调度区域对应的用车标签信息之间的差异，根据该差异调整第一预设神经网络模块的模块参数，其中，第一预设神经网络模块为深度神经网络或基于误差逆向传播算法的多层前馈神经网络；通过第一判断模块判断经过第一样本参数调整模块调整后的第一预设神经网络模块的模块参数是否达到预设的训练结束条件，如果没有达到预设的训练结束条件，则基于调整后的第一预设神经网络模块的模块参数，返回第一样本特征获取模块进行迭代训练，直至经过第一样本参数调整模块调整后的第一预设神经网络模块的模块参数达到预设的训练结束条件，满足第一判断模块的判定条件，则将符合预设的训练结束条件的第一预设神经网络模块的模块参数输入区域用车期望预测模块。本实施例是基于收集得到的历史数据，通过第一样本特征获取模块、样本区域用车期望预测模块、第一样本参数调整模块和第一判断模块训练得到符合预设条件的区域用车期望预测模块，该区域用车期望预测模块在实际应用中会实时更新，通过在线学习的方式，得以精确预测乘客用车需求分布，促进车辆资源的分布更符合用户对车辆资源的需求预期，达到合理的资源调度。
134.需要说明的是，区域用车期望预测模块的训练是一个基于历史数据的迭代训练，只有当第一预设神经网络模块的模块参数达到预设的训练结束条件时，才能得到区域用车期望预测模块的模块运行参数。
135.还需要说明的是，第一样本特征获取模块中获取的第一时刻和第二时刻均是基于前一次运行第一样本特征获取模块时获取的第一时刻和第二时刻的后续时刻。
136.还需要说明的是，用车标签信息由预约用车信息和实际用车信息以及相应的权重的加权求和得出，其中，预约用车信息可具体为预约用车订单数量，实际用车信息可具体为实际用车成单数量，即用车标签信息可由预约用车订单数量和实际用车成单数量以及相应的权重加权求和得出。
137.具体的，本技术实施例还可以包括调度区域预测模块的训练过程，该过程具体包括：
138.第二样本特征获取模块，用于获取样本调度区域内各样本车辆在第三时刻的样本车辆特征，以及样本调度区域对应的调度标签信息；调度标签信息根据样本调度区域在第四时刻被调度车辆的接单信息确定，第三时刻是指第四时刻之后的时刻；
139.样本用车期望信息提取模块，用于从样本区域用车期望预测模块中提取样本调度区域对应的用车期望信息；
140.样本特征融合模块，用于各样本车辆对应的融合特征，各样本车辆对应的融合特征基于各样本车辆的样本车辆特征和样本调度区域对应的用车期望信息；
141.样本调度区域预测模块，用于基于各样本车辆对应的融合特征和第二预设神经网络模块，获取各样本车辆对应的调度区域预测结果；
142.第二样本参数调整模块，用于基于各样本车辆对应的调度区域预测结果与调度标
签信息之间的差异，调整第二预设神经网络模块的模块参数；
143.第二判断模块，用于对比各样本车辆对应的调度区域预测结果与调度标签信息之间的差异，根据该差异调整第二预设神经网络模块的模块参数。
144.在一个具体的实施例中，预先收集样本调度区域内各历史时刻的各样本车辆特征，以及样本调度区域对应的调度标签信息，即各历史时刻的被调度车辆的接单信息；通过步第二样本特征获取模块获取样本调度区域内各样本车辆在第三时刻的样本车辆特征，以及样本调度区域对应的调度标签信息，即第二时刻被调度车辆的接单信息；通过样本用车期望信息提取模块从样本区域用车期望预测模块中提取样本调度区域对应的用车期望信息；通过样本特征融合模块获取各样本车辆对应的融合特征；通过样本调度区域预测模块获取各样本车辆对应的调度区域预测结果，即各样本车辆对应的预测调度区域；通过第二样本参数调整模块对比各样本车辆对应的调度区域预测结果与调度标签信息之间的差异，根据该差异调整第二预设神经网络模块的模块参数，其中，第二预设神经网络模块为深度神经网络或基于误差逆向传播算法的多层前馈神经网络；通过第二判断模块判断经过第二样本参数调整模块调整后的第二预设神经网络模块的模块参数是否达到预设的训练结束条件，如果没有达到预设的训练结束条件，则基于调整后的第二预设神经网络模块的模块参数，返回第二样本特征获取模块进行迭代训练，直至经过第二样本参数调整模块调整后的第二预设神经网络模块的模块参数达到预设的训练结束条件，满足第二判断模块的判定条件，则将符合预设的训练结束条件的第二预设神经网络模块的模块参数输入调度区域预测模块。本实施例是基于收集得到的历史数据，通过第二样本特征获取模块、样本用车期望信息提取模块、样本特征融合模块、样本调度区域预测模块、第二样本参数调整模块和第二判断模块训练得到符合预设条件的调度区域预测模块，该调度区域预测模块在实际应用中会实时更新，通过在线学习的方式，得以精确预测车辆调度目标区域，促进车辆资源的分布更符合用户对车辆资源的需求预期，达到合理的资源调度。
145.需要说明的是，调度区域预测模块的训练是一个基于历史数据的迭代训练，只有当第二预设神经网络模块的模块参数达到预设的训练结束条件时，才能得到调度区域预测模块的模块运行参数。
146.还需要说明的是，在迭代训练的过程中，第二样本特征获取模块中获取的第三时刻和第四时刻均是基于前一次运行第二样本特征获取模块时获取的第三时刻和第四时刻的后续时刻。
147.还需要说明的是，调度标签信息由接单量和用车结算信息以及相应的权重的加权求和得出，其中，用车结算信息可具体为用车结算金额，即调度标签信息由接单量和用车结算金额以及相应的权重的加权求和得出。
148.具体的，第一预设神经网络模块和第二预设神经网络模块采用深度神经网络或基于误差逆向传播算法的多层前馈神经网络。
149.在一个具体的实施例中，采用深度神经网络或基于误差逆向传播算法的多层前馈神经网络可以用较少的参数表示复杂的函数，且减少误差信号，有利于保障第一预设神经网络模型和第二预设神经网络模型运行的平稳性和精确性，进而保障区域用车期望预测模型和调度区域预测模型运行的平稳性和精确性。
150.需要说明的是，上述实施例提供的装置，在实现其功能时，仅以上述各功能模块的
划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的装置与方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。
151.本技术实施例的车辆调度装置通过采用区域用车期望预测模块和调度区域预测模块的双智能模块的技术方案，并且区域用车期望预测模块和调度区域预测模块均为实时更新的深度强化学习系统，更适合应对复杂场景下多种不确定因素的模拟和预测，使预测结果更贴近真实的用车场景，从而达到可以精确预测乘客用车需求分布和车辆调度目标区域的效果，促进车辆资源的分布更符合用户对车辆资源的需求预期，实现合理的资源调度。
152.本技术实施例还提供了一种电子设备，包括处理器和存储器，存储器中存储有至少一条指令或者至少一段程序，至少一条指令或者至少一段程由处理器加载并执行以实现如上述方法实施例所提供的车辆调度方法。
153.存储器可用于存储软件程序以及模块，处理器通过运行存储在存储器的软件程序以及模块，从而执行各种功能应用以及车辆调度。存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、功能所需的应用程序等；存储数据区可存储根据设备的使用所创建的数据等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器还可以包括存储器控制器，以提供处理器对存储器的访问。
154.本技术实施例所提供的方法实施例可以在计算机终端、服务器或者类似的运算装置中执行，即上述电子设备可以包括计算机终端、服务器或者类似的运算装置。图5是本技术实施例提供的运行一种车辆调度方法的电子设备的硬件结构框图，如图5所示，该电子设备的内部结构可包括但不限于：处理器、网络接口及存储器。其中，电子设备内的处理器、网络接口及存储器可通过总线或其他方式连接，在本说明书实施例所示图5中以通过总线连接为例。
155.其中，处理器(或称cpu(central processing unit，中央处理器))是电子设备的计算核心以及控制核心。网络接口可选的可以包括标准的有线接口、无线接口(如wi-fi、移动通信接口等)。存储器(memory)是电子设备中的记忆设备，用于存放程序和数据。可以理解的是，此处的存储器可以是高速ram存储设备，也可以是非不稳定的存储设备(non-volatile memory)，例如至少一个磁盘存储设备；可选的还可以是至少一个位于远离前述处理器的存储装置。存储器提供存储空间，该存储空间存储了电子设备的操作系统，可包括但不限于：windows系统(一种操作系统)，linux(一种操作系统)，android(安卓，一种移动操作系统)系统、ios(一种移动操作系统)系统等等，本技术对此并不作限定；并且，在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令，这些指令可以是一个或一个以上的计算机程序(包括程序代码)。在本说明书实施例中，处理器加载并执行存储器中存放的一条或一条以上指令，以实现上述方法实施例提供的车辆调度方法。
156.本技术实施例还提供了一种计算机可读存储介质，存储介质中存储有至少一条指令或者至少一段程序，至少一条指令或者至少一段程序由处理器加载并执行以实现方法实施例提供的车辆调度方法。
157.可选地，在本实施例中，上述存储介质可以包括但不限于：u盘、只读存储器(rom，
read-only memory)、随机存取存储器(ram，random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
158.需要说明的是：上述本技术实施例先后顺序仅仅为了描述，不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多车辆调度和并行处理也是可以的或者可能是有利的。
159.本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。
160.本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。
161.以上仅为本技术的较佳实施例，并不用以限制本技术，凡在本技术的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本技术的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：章毅王磊钟恕罗顺风黎勇
技术所有人：杭州优行科技有限公司
我是此专利的发明人

上一篇：防止触发RAT间改变的方法及其通信装置与流程
上一篇：一种用于金属防腐蚀的阻燃超疏水/超疏油涂层及其制备方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。