模型训练方法、预测方法、装置和存储介质与流程

文档序号:31934883发布日期:2022-10-26 01:29阅读:50来源:国知局
模型训练方法、预测方法、装置和存储介质与流程

1.本发明实施例涉及计算机技术领域,尤其涉及一种模型训练方法、预测方法、装置和存储介质。


背景技术:

2.网约车服务平台需要依托技术构建服务平台,接入符合条件的出租车或其他类型的运营车辆向社会大众提供出行服务。
3.目前,出行用户在通过网约车应用软件预约或呼叫网约车时,该软件需要向用户展示预估行驶路线及对应的预估价格。而发明人发现,部分类型的网约车在预估价格时需要考虑低速行驶时长,即,网约车的平均车速过低时,需要基于低速行驶时长进行计价补偿。由于预估低速行驶时长对于预估价格的准确性有一定影响,因此,需要提供准确的低速行驶时长的预估方案,以保证预估价格的准确性,提升用户体验。


技术实现要素:

4.有鉴于此,本发明实施例提供一种模型训练方法、预测方法、装置、电子设备和存储介质,以解决或缓解上述问题。
5.根据本发明实施例的第一方面,提供了一种模型训练方法,包括:获取原始样本,所述原始样本包括历史行程的历史预估行驶路线及相应的历史实际行驶路线,所述历史实际行驶路线是出现了低速行驶时长的路线;确定与所述历史实际行驶路线的路线相似度满足预设的相似度阈值的历史预估行驶路线作为目标历史预估行驶路线;获取所述目标历史预估行驶路线包含的目标历史道路的实时道路状态特征作为实时类特征;获取所述目标历史道路的历史道路通行统计特征作为历史类特征;采用所述实时类特征和所述历史类特征作为训练样本,对预设的机器学习模型进行训练,以得到能用于预测所述低速行驶时长的预测模型。
6.根据本发明实施例的第二方面,提供了一种预测方法,包括:获取当前行程的当前预估行驶路线;确定所述当前预估行驶路线包含的当前道路的实时道路状态特征作为实时类特征,并且确定所述当前道路的历史道路通行统计特征作为历史类特征;将所述实时类特征和所述历史类特征输入到预测模型中,得到所述当前预估行驶路线的低速行驶时长,所述预测模型通过根据第一方面所述的模型训练方法训练得到。
7.根据本发明实施例的第三方面,提供了一种模型训练装置,包括:第一获取模块,获取原始样本,所述原始样本包括历史行程的历史预估行驶路线及相应的历史实际行驶路线,所述历史实际行驶路线是出现了低速行驶时长的路线;确定模块,确定与所述历史实际行驶路线的路线相似度满足预设的相似度阈值的历史预估行驶路线作为目标历史预估行驶路线;第二获取模块,获取所述目标历史预估行驶路线包含的目标历史道路的实时道路状态特征作为实时类特征;第三获取模块,获取所述目标历史道路的历史道路通行统计特征作为历史类特征;训练模块,采用所述实时类特征和所述历史类特征作为训练样本,对预
设的机器学习模型进行训练,以得到能用于预测所述低速行驶时长的预测模型。
8.根据本发明实施例的第四方面,提供了一种预测装置,包括:获取模块,获取当前行程的当前预估行驶路线;确定模块,确定所述当前预估行驶路线包含的当前道路的实时道路状态特征作为实时类特征,并且确定所述当前道路的历史道路通行统计特征作为历史类特征;预测模块,将所述实时类特征和所述历史类特征输入到预测模型中,得到所述当前预估行驶路线的低速行驶时长,所述预测模型通过根据第一方面所述的模型训练方法训练得到。
9.根据本发明实施例的第五方面,提供了一种电子设备,所述设备包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如第一方面或第二方面所述的方法对应的操作。
10.根据本发明实施例的第六方面,提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面或第二方面所述的方法。
11.在本发明实施例的方案中,由于数据库中记录的目标历史预估行驶路线与出现了低速行驶时长的历史实际行驶路线的路线相似度满足预设的相似度阈值,因此,目标历史预估行驶路线更匹配低速行驶时长。此外,实时道路状态特征和历史道路通行统计特征能够更好地反映影响低速行驶时长的各个因素,因此采用目标历史预估行驶路线包含的目标历史道路的实时道路状态特征和历史道路通行统计特征作为训练样本,使得训练得到的预测模型能够基于预估行驶路线准确地预测低速行驶时长。
附图说明
12.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
13.图1为一个示例的车辆行程计价系统所适用的网络架构示意图;
14.图2为本发明的一个实施例的模型训练方法的示意图;
15.图3为本发明的另一实施例的样本筛选方法的示意图;
16.图4为本发明的另一实施例的低速行驶时长预测方法的示意图;
17.图5为本发明的另一实施例的低速行驶时长预测方法的示意性框图;
18.图6为本发明的另一实施例的模型训练装置的示意性框图;
19.图7为本发明的另一实施例的低速行驶时长预测装置的示意性框图;
20.图8为本发明的另一实施例的电子设备的硬件结构。
具体实施方式
21.为了使本领域的人员更好地理解本发明实施例中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明实施例一部分实施例,而不是全部的实施例。基于本发明实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本发明实施例保护的范围。
22.下面结合本发明实施例附图进一步说明本发明实施例具体实现。
23.图1为一个示例的车辆行程计价系统所适用的网络架构示意图。如图1所示的网络架构包括发起网约车请求的用户设备110、接收网约车请求的候选车辆121-124、作为后台服务端的路线确定服务器130和计价服务器140。其中,可以基于某种算法(候选车辆的驾驶员抢单算法、或系统自动派单算法),从候选车辆121-124中,确定目标车辆为利用用户设备110发起网约车请求的用户服务。文中的用户设备110是示意性的,可以代表一个或多个诸如手机的用户设备,用户设备中可以安装有诸如网约车应用程序的出行类应用程序的乘客客户端。候选车辆121-124也是示意性的,候选车辆的数量可以为任意的,并且候选车辆中可以安装有诸如车机的车载设备,车载设备中可以安装有诸如网约车应用程序的出行类应用程序的驾驶员客户端。
24.应理解,路线确定服务器130包括通信模块131和路线确定模块132。通信模块131可以通过诸如互联网、移动网络等网络与用户设备110、候选车辆121-124中的至少一者通信。通信模块131可以经由上述通信方式获取用于设备110、以及候选车辆121-124的诸如gps定位信息的位置信息。路线确定模块132可以调用预先存储的地图数据与获取的位置信息,计算较优预估行驶路线。
25.还应理解,计价服务器140包括计价模块141,计价模块141可以从路线确定服务器130获取预估行驶路线信息,并且基于预先存储的统一的计价规则(例如,起步价信息与增加单位里程计价信息),计算预估行驶路线信息的计价。计价模块140可以调用低速行驶时长计算模块142确定的低速行驶时长信息,辅助执行预估行驶路线的计价估计。通常,由于真实的低速行驶时长在车辆行程完成之后,才能知晓,因此,对于网约车而言,基于预估行驶路线计算低速行驶时长会存在较大误差,导致最终的行程计价不准确。
26.图2为本发明的一个实施例的模型训练方法的示意图。图2的模型训练方法适用于包括图1所示的网络架构在内的多种网络架构,并且适用于任意适当的具有数据处理能力的电子设备,包括但不限于:服务器、移动终端(如手机、pad等)和pc机等,该方法包括:
27.s210:获取原始样本,原始样本包括历史行程的历史预估行驶路线及相应的历史实际行驶路线,历史实际行驶路线是出现了低速行驶时长的路线。
28.应理解,历史行程可以为网约车的计价车程,例如,乘客所乘坐的网约车从甲地开始计价,并且在乙地结束计价,则甲地到乙地之间的行程为一次行程。通常,车辆在完成该行程之后,可以确定其低速行驶时长。历史实际行驶路线是出现了低速行驶时长的路线,换言之,该历史行程是指具有已确定的低速行驶时长的车辆行程。
29.此外,历史行程的历史预估行驶路线是指在乘客所乘坐的车辆出发前向乘客以及车辆的驾驶员(例如,通过应用程序客户端)所展示的行驶路线。历史实际行驶路线是指车辆的行驶路线,其在一些情况下与历史预估行驶路线符合,而在另一些情况下,可能不与历史预估行驶路线符合。例如,在车辆出发之后,与历史预估行驶路线相关的交通状态发生变化,应用程序的实时导航路线也会动态的变化,从而历史实际行驶路线与导航行程一致,但是与历史预估行驶路线不一致。又例如,历史实际行驶路线与实时导航路线一致,但是驾驶员由于主观原因没有跟随导航路线,而是选择了不同的路线,也会使最终的历史实际行驶路线与历史实际行驶路线不一致。
30.此外,文中的历史行程可以为与时间无关的历史行程、也可以为一段时间内的历
史行程。预估行驶路线和实际行驶路线可以包括一个或多个路段。该路段可以为不同的路口之间的部分,例如,相邻的路口之间的部分,或者不同名称的道路的路口之间的部分,本发明实施例对此不作限定。在诸如拼单行程的情况下,该历史行程可以具有多个目的地,相应地,历史预估行驶路线可以包括两个以上相同路段(例如,多次经过同一路段),历史实际行驶路线也可以包括两个以上相同路段(例如,多次经过同一路段)。
31.s220:确定与历史实际行驶路线的路线相似度满足预设的相似度阈值的历史预估行驶路线作为目标历史预估行驶路线。
32.应理解,该路线相似度指示历史预估行驶路线与历史实际行驶路线的匹配程度。例如,该路线相似度包括但不限于预估行驶路线与实际行驶路线之间的方向的匹配度、相同路段的匹配度、最长连续路段的数目、最长公共路段数目中的至少一者。
33.还应理解,目标历史预估行驶路线可以不仅满足上述的路线相似度,目标历史预估行驶路线对应的目标历史实际行驶路线的行驶时间信息还可以满足预设统计指标。
34.s230:获取目标历史预估行驶路线包含的目标历史道路的实时道路状态特征作为实时类特征。
35.应理解,可以根据历史实时路况和处于该历史实时路况的路段长度、以及道路规划信息,确定该目标历史道路的实时道路状态特征。
36.s240:获取目标历史道路的历史道路通行统计特征作为历史类特征。
37.应理解,历史道路通行统计特征可以包括基于目标历史道路的历史道路通行统计信息确定,历史道路通行统计信息包括基于车辆通行时间信息、车辆等待时间信息、以及派单后交通状态中的至少一者进行统计得到的统计结果。其中,派单后交通状态可以包括派单时的交通状态、派单之后一段时间的交通状态,例如,派单后半小时、一小时之后的变化情况。
38.还应理解,上述的历史道路通行统计信息与可以是基于目标历史道路的各个路段进行统计得到的统计结果。
39.s250:采用实时类特征和历史类特征作为训练样本,对预设的机器学习模型进行训练,以得到能用于预测低速行驶时长的预测模型。
40.应理解,预测模型用于预测基于目标行程(例如,当前行程)的预估行驶路线(例如,当前预估行驶路线)预测该预估行驶路线的低速行驶时长。此外,该方法还可以包括导出该低速行驶时长的预测模型到行程计价服务器、或者行程计价模块。
41.在本发明实施例的方案中,由于数据库中记录的目标历史预估行驶路线与出现了低速行驶时长的历史实际行驶路线的路线相似度满足预设的相似度阈值,因此,目标历史预估行驶路线更匹配低速行驶时长。此外,实时道路状态特征和历史道路通行统计特征能够更好地反映影响低速行驶时长的各个因素,因此采用目标历史预估行驶路线包含的目标历史道路的实时道路状态特征和历史道路通行统计特征作为训练样本,使得训练得到的预测模型能够基于预估行驶路线准确地预测低速行驶时长。
42.在上述实施例的一个示例中,目标时间段内的历史行程中的目标时间段,历史行程的起始时刻和结束时刻处于该目标时间段内。
43.在上述实施例的一个示例中,如果采用基于诸如预估里程和预估时长的低速行驶时长计价规则计算低速行驶时长,由于不同交通管辖区域(例如,不同国家、省、市、县等)的
计价规则不同,并且同一交通管辖区域的计价规则也可能不同(例如,出租车服务商不同),则计价规则数据的量比较大,后台服务器会响应发起低速行驶时长计算请求的交通管辖区域、以及服务商等调用相应的计价规则。采用本技术的模型训练方法,无论发起低速行驶时长计算请求的交通管辖区域如何、以及服务商如何,都能够通过调用同一低速行驶时长预测模型,计算低速行驶时长,从而扩展了低速行驶时长预测的适用范围和提高了扩展性。
44.在本发明的另一实现方式中,该方法还包括:确定历史实际行驶路线的路段与历史预估行驶路线的路线相似度。
45.在本发明的另一实现方式中,确定历史实际行驶路线的路段与历史预估行驶路线的路线相似度,包括:确定历史实际行驶路线的路段与历史预估行驶路线的路段之间的最长公共路段数目;根据历史实际行驶路线的路段数目和历史预估行驶路线的路段数目中的至少一者与最长公共路段数目之间的比例关系,确定历史实际行驶路线与历史预估行驶路线的路线相似度。
46.由于最长公共路段数目准确地指示了预估行驶路线与实际行驶路线之间的相似度,因此提高了路线相似度的准确性。
47.具体而言,公共路段数目可以为预估行驶路线与实际行驶路线都经过的路段。最长路段数目为预估行驶路线与实际行驶路线都经过的所有路段的数目,上述所有路段中的各个路段之间可以是连续的,也可以是非连续的。
48.预设的相似度阈值可以针对最长公共路段数目与预估行驶路线的路段数目之间的比值(例如,可以被称为预估相似度)设置、也可以针对最长公共路段数目与实际行驶路线的路段数目之间的比值(例如,可以被称为实际相似度)设置。
49.相应地,可以认为上述任一比值指示该车辆历史行程对应的相似度(即,任一比值大于该相似度阈值),这样的设置方式,使得提高了相似度的确定效率。也可以认为上述两个比值都指示该车辆历史行程对应的相似度(即,两个比值均大于该相似度阈值),这样的设置方式,使得提高了相似度确定的准确度。
50.可替代地,预设的相似度阈值可以针对预估行驶路线的路段数目与最长公共路段数目之间的比值(例如,可以被称为预估相似度)设置、也可以针对实际行驶路线的路段数目与最长公共路段数目之间的比值(例如,可以被称为实际相似度)设置。
51.相应地,作为另一种设置方式,也可以认为小于相似度阈值为满足相似度阈值。本发明实施例对此不作赘述。
52.在本发明的另一实现方式中,根据历史实际行驶路线的路段数目和历史预估行驶路线的路段数目中的至少一者与最长公共路段数目之间的比例关系,确定历史实际行驶路线与历史预估行驶路线的路线相似度,包括:根据历史实际行驶路线的路段数目与最长公共路段数目之间的比例关系,确定实际路线相似度,并且根据历史预估行驶路线的路段数目与最长公共路段数目之间的比例关系,确定预估路线相似度,其中,目标历史预估行驶路线的实际路线相似度和预估路线相似度均满足预设的相似度阈值。
53.由于目标历史预估行驶路线的实际路线相似度和预估路线相似度均满足预设的相似度阈值,因此进一步提高了所确定的相似度的可靠性。
54.具体而言,实际路线相似度和预估路线相似度可以满足预设的同一相似度阈值。
55.在本发明的另一实现方式中,目标历史道路的历史道路通行统计特征通过以下方
式确定:获取目标历史道路的路段在历史时段内的路段通行信息,路段通行信息包括车辆通行时间和路口等待时间中的至少一者;对路段在历史时段的路段通行信息进行累计统计,得到目标历史道路的历史道路通行统计特征。
56.由于目标历史道路中路段较多,各个路段的路段通行信息差异较大,各个路段的路段通行信息反映了影响低速行驶时长的历史因素,因此,对路段在历史时段的路段通行信息进行累计统计,得到目标历史道路的历史道路通行统计特征,使得历史道路通行统计特征更加准确地反映了影响低速行驶时长的历史因素。
57.具体而言历史时段可以包括历史预估行驶路线的行程订单下达之前(例如,至少一天之前)的预设时段、以及历史预估行驶路线的历史行程订单下达之后的至少一个预设时段(可以包括派单时的交通状态、派单之后一段时间的交通状态,例如,派单后半小时、一小时之后的变化情况),应理解,历史预估行驶路线的历史行程订单下达之后的至少一个预设时段指示订单下达之后的道路通行变化规律,历史预估行驶路线的行程订单下达之前的预设时段指示历史道路通行规律。例如,可以确定历史时段,并且从道路通行状态监测服务器中获取符合该历史时段的上述数据,然后基于上述数据进行统计处理,得到历史道路通行统计特征。
58.此外,路段通行信息可以包括在车辆通行时间信息、车辆等待时间信息、以及派单后交通状态中的至少一者。例如,可以构建基于指示上述信息的历史路况特征矩阵,该历史路况特征矩阵(历史类特征矩阵)可以包括对应于车辆通行时间信息、车辆等待时间信息、以及派单后交通状态中的至少一个维度。
59.例如,可以计算预估行驶路线中的每个路段的历史通行时间(例如,平均通行时间、最大通行时间和最小通行时间中的至少一者),以统计预估行驶路线的历史通行时间信息。
60.例如,可以计算预估行驶路线中的每个路段的车辆等待时间(例如,平均等待时间、最大等待时间和最小等待时间中的至少一者),以统计预估行驶路线的车辆等待时间信息。
61.在本发明的另一实现方式中,目标历史道路的实时道路状态特征通过以下方式确定:获取目标历史道路的历史实时路况以及处于该历史实时路况的路段长度;根据历史实时路况以及路段长度,确定目标历史道路的实时道路状态特征。
62.由于历史实时路况和路段长度较好地反映了影响低速行驶时长的实时因素,根据历史实时路况以及路段长度,确定目标历史道路的实时道路状态特征,使得实时道路状态特征更加准确地反映了影响低速行驶时长的实时因素。
63.具体而言,实时道路状态特征包括预估行驶路线中的历史实时路况和路段长度中的至少一者。例如,可以构建指示上述信息的实时道路特征矩阵(实时类特征矩阵),该实时道路特征矩阵可以包括对应于历史实时路况和路段长度中的至少一个维度。
64.此外,可以将实时类特征矩阵和历史类特征矩阵进行拼接,得到对应于目标历史道路的拼接矩阵,应理解,在该拼接矩阵中,历史类特征矩阵中的各个维度与实时类特征矩阵的各个维度可以以任意方式排列。
65.在本发明的另一实现方式中,目标历史道路的实时道路状态特征还包括目标历史道路的道路规划特征。具体而言,道路规划特征包括但不限于道路几何信息(例如,直路或
弯路、曲率半径等)等。
66.由于目标历史道路的道路规划特征也能反映影响低速行驶时长的实时因素,因此,采用目标历史道路的道路规划特征,得到了更加准确的预测模型。
67.在本发明的另一实现方式中,采用实时类特征和历史类特征作为训练样本,对预设的机器学习模型进行训练,以得到能用于预测低速行驶时长的预测模型,包括:将实时类特征和历史类特征作为输入,将历史实际行驶路线中的低速行驶时长作为监督条件,对预设的机器学习模型进行训练,得到预测模型。
68.由于历史实际行驶路线中的低速行驶时长作为监督条件,更有利于预测低速行驶时长,此外,将实时类特征和历史类特征作为输入,提高了模型训练效率。
69.具体而言,预设的机器学习模型包括但不限于诸如adaboost模型、gbdt模型、xgboost模型、或lightgbm的回归模型,上述回归模型能够在保证预测准确度的同时提高训练效率。
70.在本发明的另一实现方式中,目标历史预估行驶路线对应的目标历史实际行驶路线的行驶时间信息满足预设统计指标。可以排除相应的历史实际行驶路线偏离预设统计指标的历史预估行驶路线。例如,各个历史实际行驶路线的行驶时间信息包括起点时间和终点时间,可以分别对起点时间和终点时间中的至少一者进行聚类处理,通过排除起点时间和终点时间不在相应的聚类中的历史实际行驶路线,得到上述目标历史实际行驶路线。在一个示例中,可以分别对起点时间和终点时间两者进行聚类处理,通过排除起点时间和终点时间均不在相应的聚类中的历史实际行驶路线,得到目标历史实际行驶路线。
71.还应理解,在一个示例中,可以首先确定满足预设的相似度阈值的历史预估行驶路线对应的历史实际行驶路线,然后从对应的历史实际行驶路线中排除起点时间和终点时间均不在相应的聚类中的历史实际行驶路线,得到与目标历史预估行驶路线对应的目标历史实际行驶路线。在另一示例中,可以首先确定从历史实际行驶路线中排除起点时间和终点时间均不在相应的聚类中的历史实际行驶路线,得到满足预设统计指标的历史实际行驶路线。然后,可以确定与预设统计指标的历史实际行驶路线满足预设的相似度阈值的目标历史预估行驶路线。
72.具体而言,图3示出了本发明的另一实施例的样本筛选方法。应理解,图3的方法中的各个步骤是示意性的,可以包括更多或更少的步骤,也可以替换其中的一些步骤,获得其他实施方式。作为一个示例,图3的方法可以包括如下步骤:
73.s310:获取原始样本,原始样本中包括多个历史车辆行程的历史预估行驶路线和历史实际行驶路线,然后执行步骤s320。
74.s320:确定每个历史车辆行程的历史预估行驶路线与历史实际行驶路线之间的预估路线相似度和实际路线相似度(其中,预估路线相似度和实际路线相似度的可行的计算方式如上文论述,此处不再赘述),然后执行步骤s330。
75.s330:判断预估路线相似度和实际路线相似度是否均满足预定的相似度阈值?如果为是,则执行步骤s340;如果为否,则执行步骤s360。
76.s340:判断历史实际行驶路线的行程时间信息是否异常?如果否,则执行步骤350;如果为否,则执行步骤360。具体而言,基于预设统计指标,判断历史实际行驶路线的行程时间信息是否异常,可以排除相应的历史实际行驶路线偏离预设统计指标的历史预估行驶路
线。
77.s350:将历史实际行驶路线对应的历史预估行驶路线中包含的目标历史道路的历史类特征和实时类特征作为训练样本。
78.s360:从原始样本中排除该历史实际行驶路线对应的历史预估行驶路线。
79.上述描述了各个实施例的模型训练方法,相应地,下文将描述与模型训练方法相应的低速行驶时长的预测方法。
80.图4为本发明的另一实施例的低速行驶时长预测方法的示意图。图3的低速行驶时长预测方法适用于任意适当的具有数据处理能力的电子设备,包括但不限于:服务器、移动终端(如手机、pad等)和pc机等,该方法包括:
81.s410:获取当前行程的当前预估行驶路线。
82.应理解,可以从网约车平台的计价服务器或计价模块等处获取低速行驶时长预测指令,低速行驶时长预测指令包括指示当前行程的预估行驶路线的数据。
83.s420:确定当前预估行驶路线包含的当前道路的实时道路状态特征作为实时类特征,并且确定当前道路的历史道路通行统计特征作为历史类特征。
84.s430:将实时类特征和历史类特征输入到预测模型中,得到当前预估行驶路线的低速行驶时长,预测模型通过模型训练方法训练得到。
85.应理解,该方法还可以包括将得到的当前预估行驶路线的低速行驶时长上传到计价模块或计价服务器。
86.具体而言,可以对当前路段在历史时段的路段通行信息进行累计统计,得到当前历史道路的历史道路通行统计特征。路段通行信息可以包括在车辆通行时间信息、车辆等待时间信息、以及派单后交通状态中的至少一者。例如,可以构建基于指示上述信息的历史路况特征矩阵,该历史路况特征矩阵(历史类特征矩阵)可以包括对应于车辆通行时间信息、车辆等待时间信息、以及派单后交通状态中的至少一个维度。
87.例如,可以计算预估行驶路线中的每个路段的历史通行时间(例如,平均通行时间、最大通行时间和最小通行时间中的至少一者),以统计预估行驶路线的历史通行时间信息。
88.例如,可以计算预估行驶路线中的每个路段的车辆等待时间(例如,平均等待时间、最大等待时间和最小等待时间中的至少一者),以统计预估行驶路线的车辆等待时间信息。
89.例如,派单后交通状态可以包括派单时的交通状态、派单之后一段时间的交通状态,例如,派单后半小时、一小时之后的变化情况。
90.此外,当前路段的实时道路状态特征包括当前预估行驶路线中的历史实时路况和路段长度中的至少一者。例如,可以构建指示上述信息的实时道路特征矩阵(实时类特征矩阵),该实时道路特征矩阵可以包括对应于历史实时路况和路段长度中的至少一个维度。
91.此外,可以将实时类特征矩阵和历史类特征矩阵进行拼接,得到对应于当前道路的拼接矩阵,应理解,在该拼接矩阵中,历史类特征矩阵中的各个维度与实时类特征矩阵的各个维度可以以任意方式排列。
92.在本发明的另一实现方式中,目标历史道路的实时道路状态特征还包括目标历史道路的道路规划特征。具体而言,道路规划特征包括但不限于道路几何信息(例如,直路或
弯路、曲率半径等)等。
93.在本发明实施例的方案中,由于数据库中记录的目标历史预估行驶路线与出现了低速行驶时长的历史实际行驶路线的路线相似度满足预设的相似度阈值,因此,目标历史预估行驶路线更匹配低速行驶时长。此外,实时道路状态特征和历史道路通行统计特征能够更好地反映影响低速行驶时长的各个因素,因此采用目标历史预估行驶路线包含的目标历史道路的实时道路状态特征和历史道路通行统计特征作为训练样本,使得训练得到的预测模型能够基于预估行驶路线准确地预测低速行驶时长。
94.具体而言,图5示出了本发明的另一实施例的低速行驶时长预测方法的示意性框图。如图所示,预估行驶路线数据可以输入到特征提取模块执行特征提取。例如,提取预估行驶路线数据中的历史路况特征和实时路况特征中的至少一者。可以将提取到的特征输入到预先训练的低速行驶时长预测模型中,得到预估行驶路线的低速行驶时长。
95.图6为本发明的另一实施例的模型训练装置的示意性框图。图6的模型训练装置适用于任意适当的具有数据处理能力的电子设备,包括但不限于:服务器、移动终端(如手机、pad等)和pc机等,该装置包括:
96.第一获取模块610,获取原始样本,原始样本包括历史行程的历史预估行驶路线及相应的历史实际行驶路线,历史实际行驶路线是出现了低速行驶时长的路线;
97.确定模块620:确定与历史实际行驶路线的路线相似度满足预设的相似度阈值的历史预估行驶路线作为目标历史预估行驶路线;
98.第二获取模块630:获取目标历史预估行驶路线包含的目标历史道路的实时道路状态特征作为实时类特征;
99.第三获取模块640:获取目标历史道路的历史道路通行统计特征作为历史类特征;
100.训练模块650:采用实时类特征和历史类特征作为训练样本,对预设的机器学习模型进行训练,以得到能用于预测低速行驶时长的预测模型。
101.在本发明实施例的方案中,由于数据库中记录的目标历史预估行驶路线与出现了低速行驶时长的历史实际行驶路线的路线相似度满足预设的相似度阈值,因此,目标历史预估行驶路线更匹配低速行驶时长。此外,实时道路状态特征和历史道路通行统计特征能够更好地反映影响低速行驶时长的各个因素,因此采用目标历史预估行驶路线包含的目标历史道路的实时道路状态特征和历史道路通行统计特征作为训练样本,使得训练得到的预测模型能够基于预估行驶路线准确地预测低速行驶时长。
102.在本发明的另一实现方式中,确定模块还用于:确定历史实际行驶路线的路段与历史预估行驶路线的路线相似度。
103.在本发明的另一实现方式中,确定模块具体用于:确定历史实际行驶路线的路段与历史预估行驶路线的路线相似度,包括:确定历史实际行驶路线的路段与历史预估行驶路线的路段之间的最长公共路段数目;根据历史实际行驶路线的路段数目和历史预估行驶路线的路段数目中的至少一者与最长公共路段数目之间的比例关系,确定历史实际行驶路线与历史预估行驶路线的路线相似度。
104.在本发明的另一实现方式中,确定模块具体用于:根据历史实际行驶路线的路段数目与最长公共路段数目之间的比例关系,确定实际路线相似度,并且根据历史预估行驶路线的路段数目与最长公共路段数目之间的比例关系,确定预估路线相似度,其中,目标历
史预估行驶路线的实际路线相似度和预估路线相似度均满足预设的相似度阈值。
105.在本发明的另一实现方式中,目标历史道路的历史道路通行统计特征通过以下方式确定:获取目标历史道路的路段在历史时段内的路段通行信息,路段通行信息包括车辆通行时间和路口等待时间中的至少一者;对路段在历史时段的路段通行信息进行累计统计,得到目标历史道路的历史道路通行统计特征。
106.在本发明的另一实现方式中,目标历史道路的实时道路状态特征通过以下方式确定:获取目标历史道路的历史实时路况以及处于该历史实时路况的路段长度;根据历史实时路况以及路段长度,确定目标历史道路的实时道路状态特征。
107.在本发明的另一实现方式中,目标历史道路的实时道路状态特征还包括目标历史道路的道路规划特征。
108.在本发明的另一实现方式中,训练模块具体用于:将实时类特征和历史类特征作为输入,将历史实际行驶路线中的低速行驶时长作为监督条件,对预设的机器学习模型进行训练,得到预测模型。
109.本实施例的装置用于实现前述多个方法实施例中相应的方法,并具有相应的方法实施例的有益效果,在此不再赘述。此外,本实施例的装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述,在此亦不再赘述。
110.图7为本发明的另一实施例的低速行驶时长预测装置的示意性框图。图5的低速行驶时长预测装置适用于任意适当的具有数据处理能力的电子设备,包括但不限于:服务器、移动终端(如手机、pad等)和pc机等,该装置包括:
111.获取模块710,获取当前行程的当前预估行驶路线。
112.确定模块720,确定所述当前预估行驶路线包含的当前道路的实时道路状态特征作为实时类特征,并且确定所述当前道路的历史道路通行统计特征作为历史类特征。
113.预测模块730,将所述实时类特征和所述历史类特征输入到预测模型中,得到所述当前预估行驶路线的低速行驶时长,所述预测模型通过模型训练方法训练得到。
114.在本发明实施例的方案中,由于数据库中记录的目标历史预估行驶路线与出现了低速行驶时长的历史实际行驶路线的路线相似度满足预设的相似度阈值,因此,目标历史预估行驶路线更匹配低速行驶时长。此外,实时道路状态特征和历史道路通行统计特征能够更好地反映影响低速行驶时长的各个因素,因此采用目标历史预估行驶路线包含的目标历史道路的实时道路状态特征和历史道路通行统计特征作为训练样本,使得训练得到的预测模型能够基于预估行驶路线准确地预测低速行驶时长。
115.本实施例的装置用于实现前述多个方法实施例中相应的方法,并具有相应的方法实施例的有益效果,在此不再赘述。此外,本实施例的装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述,在此亦不再赘述。
116.图8为本发明的另一实施例的电子设备的硬件结构;如图8所示,该电子设备的硬件结构可以包括:处理器801,通信接口802,存储介质803和通信总线804;
117.其中处理器801、通信接口802、存储介质803通过通信总线804完成相互间的通信;
118.可选地,通信接口802可以为通信模块的接口;
119.其中,处理器801具体可以配置为:获取原始样本,所述原始样本包括历史行程的历史预估行驶路线及相应的历史实际行驶路线,所述历史实际行驶路线是出现了低速行驶
时长的路线;确定与所述历史实际行驶路线的路线相似度满足预设的相似度阈值的历史预估行驶路线作为目标历史预估行驶路线;获取所述目标历史预估行驶路线包含的目标历史道路的实时道路状态特征作为实时类特征;获取所述目标历史道路的历史道路通行统计特征作为历史类特征;采用所述实时类特征和所述历史类特征作为训练样本,对预设的机器学习模型进行训练,以得到能用于预测所述低速行驶时长的预测模型;
120.或者,获取当前行程的当前预估行驶路线;确定所述当前预估行驶路线包含的当前道路的实时道路状态特征作为实时类特征,并且确定所述当前道路的历史道路通行统计特征作为历史类特征;将所述实时类特征和所述历史类特征输入到预测模型中,得到所述当前预估行驶路线的低速行驶时长,所述预测模型通过模型训练方法训练得到。
121.上述的处理器可以是通用处理器,包括中央处理器(central processing unit,简称cpu)、网络处理器(network processor,简称np)等;还可以是数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
122.上述的存储介质可以是,但不限于,随机存取存储介质(random access memory,ram),只读存储介质(read only memory,rom),可编程只读存储介质(programmable read-only memory,prom),可擦除只读存储介质(erasable programmable read-only memory,eprom),电可擦除只读存储介质(electric erasable programmable read-only memory,eeprom)等。
123.特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在存储介质上的计算机程序,该计算机程序包含配置为执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(cpu)执行时,执行本发明的方法中限定的上述功能。需要说明的是,本发明所述的存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。存储介质例如可以但不限于是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储介质(ram)、只读存储介质(rom)、可擦式可编程只读存储介质(eprom或闪存)、光纤、便携式紧凑磁盘只读存储介质(cd-rom)、光存储介质件、磁存储介质件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何存储介质,该存储介质可以发送、传播或者传输配置为由指令执行系统、装置或者器件使用或者与其结合使用的程序。存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
124.可以以一种或多种程序设计语言或其组合来编写配置为执行本发明的操作的计
算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如”c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络:包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
125.附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个配置为实现规定的逻辑功能的可执行指令。上述具体实施例中有特定先后关系,但这些先后关系只是示例性的,在具体实现的时候,这些步骤可能会更少、更多或执行顺序有调整。即在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
126.描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。这些模块的名称在某种情况下并不构成对该模块本身的限定。
127.作为另一方面,本发明还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例所描述的方法。
128.作为另一方面,本发明还提供了一种存储介质,该存储介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述存储介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:获取原始样本,所述原始样本包括历史行程的历史预估行驶路线及相应的历史实际行驶路线,所述历史实际行驶路线是出现了低速行驶时长的路线;确定与所述历史实际行驶路线的路线相似度满足预设的相似度阈值的历史预估行驶路线作为目标历史预估行驶路线;获取所述目标历史预估行驶路线包含的目标历史道路的实时道路状态特征作为实时类特征;获取所述目标历史道路的历史道路通行统计特征作为历史类特征;采用所述实时类特征和所述历史类特征作为训练样本,对预设的机器学习模型进行训练,以得到能用于预测所述低速行驶时长的预测模型;
129.或者,获取当前行程的当前预估行驶路线;确定所述当前预估行驶路线包含的当前道路的实时道路状态特征作为实时类特征,并且确定所述当前道路的历史道路通行统计特征作为历史类特征;将所述实时类特征和所述历史类特征输入到预测模型中,得到所述当前预估行驶路线的低速行驶时长,所述预测模型通过模型训练方法训练得到。
130.在本公开的各种实施方式中所使用的表述“第一”、“第二”、“所述第一”或“所述第二”可修饰各种部件而与顺序和/或重要性无关,但是这些表述不限制相应部件。以上表述仅配置为将元件与其它元件区分开的目的。例如,第一用户设备和第二用户设备表示不同的用户设备,虽然两者均是用户设备。例如,在不背离本公开的范围的前提下,第一元件可
称作第二元件,类似地,第二元件可称作第一元件。
131.当一个元件(例如,第一元件)称为与另一元件(例如,第二元件)“(可操作地或可通信地)联接”或“(可操作地或可通信地)联接至”另一元件(例如,第二元件)或“连接至”另一元件(例如,第二元件)时,应理解为该一个元件直接连接至该另一元件或者该一个元件经由又一个元件(例如,第三元件)间接连接至该另一个元件。相反,可理解,当元件(例如,第一元件)称为“直接连接”或“直接联接”至另一元件(第二元件)时,则没有元件(例如,第三元件)插入在这两者之间。
132.以上描述仅为本发明的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本发明中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本发明中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1