模型训练方法、装置及电子设备与流程

文档序号:30701159发布日期:2022-07-09 19:50阅读:149来源:国知局
模型训练方法、装置及电子设备与流程

1.本公开涉及导航技术领域,具体涉及一种模型训练方法、装置及电子设备。


背景技术:

2.随着互联网技术的发展,人们的出行越来越依赖于基于位置的服务系统。基于位置的服务包括导航、路径规划、地图渲染等。路径规划服务中基于用户提供的起点和终点给出推荐的导航规划路线,并且针对导航规划路线预测行驶时间、红绿灯路口、道路收费信息等路线附加信息。路线附加信息对于用户的路线选择倾向具有一定的影响,有时甚至能够对部分用户路线选择起决定作用。因此,在路径规划服务中准确预测上述路线附加信息是必要的。以道路收费信息为例,已有技术中采用的里程计费方式,由于各地区费率、计费规则等有所不同,维护困难。因此,有必要提出一种解决方案,更加准确地预测新路线的道路收费信息等路线附加信息。


技术实现要素:

3.本公开实施例提供一种模型训练方法、装置及电子设备。
4.第一方面,本公开实施例中提供了一种模型训练方法,其中,包括:获取样本路线对应的目标路段集合以及所述样本路线对应的路线附加信息;所述目标路段集合包括所述样本路线上的至少一个目标路段、所述目标路段的长度以及所述目标路段的分类特征;所述分类特征包括所述目标路段所在的区域以及对应的道路标识;基于所述分类特征对所述目标路段集合中的所述目标路段进行聚合;其中,所述分类特征相同的所述目标路段被聚合为同一目标道路类别;聚合结果包括所述目标道路类别以及同一所述目标道路类别下的目标路段的总长度;基于所述样本路线对应的所述聚合结果以及所述路线附加信息训练机器自学习模型,以确定所述目标道路类别对应的道路附加信息。
5.进一步地,基于所述样本路线对应的所述聚合结果以及所述路线附加信息训练机器自学习模型,以确定所述目标道路类别对应的道路附加信息,包括:基于所述聚合结果获得所述机器自学习模型的样本特征变量及样本特征真值;所述样本特征变量包括属于同一所述目标道路类别的目标路段的总长度,所述样本特征真值包括所述样本路线的所述路线附加信息;利用多个所述样本路线对应的所述样本特征变量以及所述样本特征真值训练所述机器自学习模型,得到所述目标道路类别对应的道路附加信息。
6.进一步地,获取样本路线对应的目标路段集合,包括:获取样本路线;通过在分叉路口处打断的方式将所述样本路线划分成多个目标路段,以获得所述样本路线对应的所述目标路段集合。
7.进一步地,所述路线附加信息包括路线费用信息;获取样本路线对应的目标路段
集合以及所述样本路线对应的路线附加信息,包括:获取路网数据以及收费站数据;基于所述路网数据以及所述收费站数据建立收费站路网子图;所述收费站路网子图中的点为收费站,边为两两收费站之间的连通路线;所述连通路线包括多个目标路段;基于所述收费站路网子图获得进入收费站和退出收费站之间的样本路线;基于已有的点对点里程计费方式确定所述样本路线对应的初始费用信息。
8.获取收集的路线费用真值以及该路线费用真值对应的真值路线;将与所述真值路线相匹配的所述样本路线的路线费用信息更新为所述路线费用真值。
9.第二方面,本公开实施例中提供了一种附加信息预测方法,其中,包括:获取待预测路线对应的待预测路段集合以及目标道路类别集合;所述待预测路段集合包括所述待预测路线中的待预测路段、待预测路段的长度以及所述待预测路段的分类特征;所述分类特征包括所述待预测路段所在的区域以及对应的道路标识;所述目标道路类别集合包括至少一个目标道路类别以及所述目标道路类别对应的道路附加信息;基于所述分类特征将所述待预测路段集合中的所述待预测路段与所述目标道路类别集合中的目标道路类别进行匹配;基于匹配结果中所述目标道路类别对应的道路附加信息以及所述待预测路段的长度确定所述待预测路线的路线附加信息。
10.进一步地,基于所述分类特征将所述待预测路段集合中的所述待预测路段与所述目标道路类别集合中的目标道路类别进行匹配,包括:基于分类特征将所述待预测路段集合中的待预测路段进行聚合;其中,聚合结果包括属于同一待预测道路类别的待预测路段的总长度;其中,属于同一待预测道路类别的所述分类特征相同;将所述聚合结果中的待预测道路类别与所述目标道路类别集合进行匹配,获得包括相匹配的待预测道路类别以及目标道路类别的匹配结果。
11.进一步地,基于所述分类特征将所述待预测路段集合中的所述待预测路段与所述目标道路类别集合中的目标道路类别进行匹配,包括:基于分类特征确定所述待预测路段集合中所述待预测路段所属的待预测道路类别;将所述待预测道路类别与所述目标道路类别集合进行匹配,获得包括相匹配的待预测道路类别以及目标道路类别的匹配结果。
12.进一步地,所述目标道路类别集合预先通过多个样本路线训练机器自学习模型得到;在训练机器自学习模型的过程中,所述样本路线的路线附加信息已知,对所述样本路线对应的目标路段集合中的目标路段进行聚合得到目标道路类别,以及利用目标道路类别下所述目标路段的总长度、所述路线附加信息对所述机器自学习模型训练后,得到所述目标道路类别对应的道路附加信息。
13.第三方面,本公开实施例提供了一种基于位置的服务提供方法,所述方法利用第一方面和/或第二方面所述的方法为被服务对象提供基于位置的服务,所述基于位置的服务包括:导航、地图渲染、路线规划中的一种或多种。
14.第四方面,本公开实施例提供了一种模型训练装置,其中,包括:第一获取模块,被配置为获取样本路线对应的目标路段集合以及所述样本路线对应的路线附加信息;所述目标路段集合包括所述样本路线上的至少一个目标路段、所述目标路段的长度以及所述目标路段的分类特征;所述分类特征包括所述目标路段所在的区域以及对应的道路标识;聚合模块,被配置为基于所述分类特征对所述目标路段集合中的所述目标路段进行聚合;其中,所述分类特征相同的所述目标路段被聚合为同一目标道路类别;聚合结果包括所述目标道路类别以及同一所述目标道路类别下的目标路段的总长度;训练模块,被配置为基于所述样本路线对应的所述聚合结果以及所述路线附加信息训练机器自学习模型,以确定所述目标道路类别对应的道路附加信息。
15.第五方面,本公开实施例提供了一种附加信息预测装置,其中,包括:第二获取模块,被配置为获取待预测路线对应的待预测路段集合以及目标道路类别集合;所述待预测路段集合包括所述待预测路线中的待预测路段、待预测路段的长度以及所述待预测路段的分类特征;所述分类特征包括所述待预测路段所在的区域以及对应的道路标识;所述目标道路类别集合包括至少一个目标道路类别以及所述目标道路类别对应的道路附加信息;匹配模块,被配置为基于所述分类特征将所述待预测路段集合中的所述待预测路段与所述目标道路类别集合中的目标道路类别进行匹配;确定模块,被配置为基于匹配结果中所述目标道路类别对应的道路附加信息以及所述待预测路段的长度确定所述待预测路线的路线附加信息。
16.所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
17.在一个可能的设计中,上述装置的结构中包括存储器和处理器,所述存储器用于存储一个或多条支持上述装置执行上述对应方法的计算机指令,所述处理器被配置为用于执行所述存储器中存储的计算机指令。上述装置还可以包括通信接口,用于上述装置与其他设备或通信网络通信。
18.第六方面,本公开实施例提供了一种电子设备,包括存储器、处理器以及存储在存储器上的计算机程序,其中,所述处理器执行所述计算机程序以实现上述任一方面所述的方法。
19.第七方面,本公开实施例提供了一种计算机可读存储介质,用于存储上述任一装置所用的计算机指令,该计算机指令被处理器执行时用于实现上述任一方面所述的方法。
20.第八方面,本公开实施例提供了一种计算机程序产品,其包含计算机指令,该计算机指令被处理器执行时用于实现上述任一方面所述的方法。
21.本公开实施例提供的技术方案可以包括以下有益效果:本公开实施例中,为了确定新路线的路线附加信息,利用多个样本路线以及多个样本路线的已知路线附加信息,确定该样本路线中各个目标道路类别的道路附加信息,其中,目标道路类别基于所在区域以及对应的道路标识是否相同来划分;本实施例中通过样本路线对应的目标道路类别以及目标道路类别下各目标路段的总长度训练机器自学习模型,得到各个目标道路类别的道路附加信息。上述方式中,不同区域和/或不同道路标识上
的路段被认为属于不同的目标道路类别,而相同区域和相同道路标识的路段才被认为属于同一目标道路类别,并且基于样本路线以及路线附加信息求解不同目标道路类别对应的道路附加信息,因此通过对路线进行了更加细致的划分,使得求得的道路附加信息更加准确,从而基于道路附加信息预测新路线的路线附加信息,能够提高该新路线的路线附加信息的预测准确率。
22.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
23.结合附图,通过以下非限制性实施方式的详细描述,本公开的其它特征、目的和优点将变得更加明显。以下是对附图的说明。
24.图1示出根据本公开一实施方式的模型训练方法的流程图。
25.图2示出根据本公开实施方式的样本路线划分效果示意图。
26.图3示出根据本公开一实施方式的高速费率数据生产流程的一种实现示意图。
27.图4示出根据本公开一实施方式的附加信息预测方法的流程图。
28.图5示出根据本公开一实施方式的路线费用计算流程示意图。
29.图6示出根据本公开一实施方式的地图导航场景下的应用场景示意图。
30.图7示出根据本公开一实施方式的模型训练装置的结构框图。
31.图8示出根据本公开一实施方式的附加信息预测装置的结构框图。
32.图9是适于用来实现根据本公开一实施方式的模型训练方法、附加信息预测方法和/或基于位置的服务提供方法的电子设备的结构示意图。
具体实施方式
33.下文中,将参考附图详细描述本公开的示例性实施方式,以使本领域技术人员可容易地实现它们。此外,为了清楚起见,在附图中省略了与描述示例性实施方式无关的部分。
34.在本公开中,应理解,诸如“包括”或“具有”等的术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在或被添加的可能性。
35.另外还需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
36.下面通过具体实施例详细介绍本公开实施例的细节。
37.图1示出根据本公开一实施方式的模型训练方法的流程图。如图1所示,该模型训练方法包括以下步骤:在步骤s101中,获取样本路线对应的目标路段集合以及所述样本路线对应的路线附加信息;所述目标路段集合包括所述样本路线上的至少一个目标路段、所述目标路段的长度以及所述目标路段的分类特征;所述分类特征包括所述目标路段所在的区域以及对应的道路标识;在步骤s102中,基于所述分类特征对所述目标路段集合中的所述目标路段进行聚
合;其中,所述分类特征相同的所述目标路段被聚合为同一目标道路类别;聚合结果包括所述目标道路类别以及同一所述目标道路类别下的目标路段的总长度;在步骤s103中,基于所述样本路线对应的所述聚合结果以及所述路线附加信息训练机器自学习模型,以确定所述目标道路类别对应的道路附加信息。
38.本实施例中,该模型训练方法可以在云端或者服务器上执行。样本路线可以是路线附加信息已知的路线。在一些实施例中,样本路线可以是车辆在高速上的行驶路线,其路线附加信息可以通过相应方式获得,以道路收费信息为例,可以通过etc对账数据、出租车发票、网约车费用信息等获得。在另一些实施例中,样本路线也可以基于路网数据,通过点对点方式建立任意两个目标位置点之间的连通路线而得到;而此时样本路线的路线附加信息可以通过已经发生的实际行驶路线得到,可以通过已有的较为初始的原则得到,例如以道路收费信息为例,可以通过点对点之间的路线长度以及费率计算得到样本路线的道路收费信息。
39.在一些实施例中,所获得的样本路线如果没有对应的目标路段集合时,可以针对不对应有目标路段集合的每个样本路线进行预处理。预处理过程中可以将每个样本路线划分成包括多个目标路段的目标路段集合。该目标路段集合包括目标路段的标识、目标路段的长度以及目标路段所在的区域和道路标识等。道路标识可以是目标路段所在道路的名称或id标识等。
40.需要说明的是,一条道路可以包括多个目标路段,路段(link)是描述道路的最小数据结构,一个路段可以为路线切分出来的最小一段路,具有道路等级、道路构成、路名、长度、形状点、方向等属性信息。在路网数据中,每个路段都被赋予了唯一标识。
41.在一些实施例中,目标路段所在区域可以是路网数据中所划分的区域,例如省和直辖市等。同一道路中可能存在一部分目标路段与另一部分目标路段不在同一区域的情况。
42.因此,针对同一样本路线,可以将具有相同分类特征的目标路段划分至同一种目标道路类别,并且可以认为该类目标道路类别下的目标路段具有相同的区域以及道路标识。在一些实施例中,分类特征可以包括但不限于区域以及道路标识。可以理解的是,同一目标道路类别中的目标路段属于同一条道路,而不同目标道路类别中的目标道路可能属于同一条道路,也可能属于不同道路。因此,基于目标路段的分类特征对目标路段集合中的目标路段进行聚合时,可以将分类特征中的所有特征均相同的目标路段进行聚合,并计算聚为同一目标道路类别的目标路段的总长度。
43.下面举例说明:一条高速包括路段1、路段2、路段3和路段4,其中在路网数据中路段1和路段4对应的道路名称为aa高速,而路段2对应的道路名称为b高架,路段4的道路名称为c桥。因此,针对包括该高速的样本路线进行聚合时,路段1和路段4被聚为同一目标道路类别,而路段2和3分别聚为不其他的目标道路类别。
44.在一些实施例中,针对任意一条样本路线的目标路段进行聚合后,得到的聚合结果包括该当前样本路线对应的各个目标道路类别以及各个目标道路类别下目标路段的长度。
45.在一些实施例中,目标道路类别可以使用区域和道路标识来区分。例如区域可以使用路网数据中的区域编码adcode,而道路标识可以使用路网数据中的道路名称。
46.针对所收集的多个样本路线经过上述处理后,获得各自对应的聚合结果。聚合结果包括该样本路线所涉及的目标道路类别以及每个目标道路类别下目标路段的总长度。通过样本路线的收集以及构建,可以使得最终得到的样本路线对应的目标道路类别覆盖整个路网数据中的全部或者大部分道路。因此,通过构建机器自学习模型,并将各个样本路线对应的聚合结果中包括的目标道路类别下目标路段的总长度以及样本路线的路线附加信息作为输入训练该机器自学习模型,使得通过该机器自学习模型能够求解出各个目标道路类别对应的道路附加信息。在一些实施例中,目标道路类别对应的道路附加信息可以理解为路线上属于该目标道路类别的一段道路在单位长度下的附加信息。基于该目标道路类别对应的道路附加信息以及路线上属于该目标道路类别的一段道路的长度即可确定该段道路的附加信息,进而可以得到整个路线的附加信息。
47.在一些实施例中,该机器自学习模型可以采用线性回归模型。
48.在一些实施例中,路线附加信息为道路收费信息。样本路线的路线附加信息可以理解为该样本路线上属于不同目标道路类别的各段道路对应的附加信息之和。一个路线上道路收费信息跟路线长度有关,因此在利用多个样本路线上的各个目标道路类别训练机器自学习模型时,可以基于目标道路类别、目标道路类别对应的总长度、样本路线的路线附加信息进行线性拟合,并且可以将目标道路类别、目标道路类别对应的总长度、样本路线的路线附加信息等作为输入,训练机器自学习模型,从而求解出各个目标道路类别的附加信息。
49.本公开实施例中,为了确定新路线的路线附加信息,利用多个样本路线以及多个样本路线的已知路线附加信息,确定该样本路线中各个目标道路类别的道路附加信息,其中,目标道路类别基于所在区域以及对应的道路标识是否相同来划分;本实施例中通过样本路线对应的目标道路类别以及目标道路类别下各目标路段的总长度训练机器自学习模型,得到各个目标道路类别的道路附加信息。上述方式中,不同区域和/或不同道路标识上的路段被认为属于不同的目标道路类别,而相同区域和相同道路标识的路段才被认为属于同一目标道路类别,并且基于样本路线以及路线附加信息求解不同目标道路类别对应的道路附加信息,因此通过对路线进行了更加细致的划分,使得求得的道路附加信息更加准确,从而基于道路附加信息预测新路线的路线附加信息,能够提高该新路线的路线附加信息的预测准确率。
50.在本实施例的一个可选实现方式中,步骤s103,即基于所述样本路线对应的所述聚合结果以及所述路线附加信息训练机器自学习模型,以确定所述目标道路类别对应的道路附加信息的步骤,进一步包括以下步骤:基于所述聚合结果获得所述机器自学习模型的样本特征变量及样本特征真值;所述样本特征变量包括属于同一所述目标道路类别的目标路段的总长度,所述样本特征真值包括所述样本路线的所述路线附加信息;利用多个所述样本路线对应的所述样本特征变量以及所述样本特征真值训练所述机器自学习模型,得到所述目标道路类别对应的道路附加信息。
51.该可选的实现方式中,可以将样本路线中各目标道路类别下目标路段的总长度确定为机器自学习模型的样本特征变量,而将样本路线的路线附加信息作为样本特征真值训练该机器自学习模型,以便基于该机器自学习模型求解出各个目标道路类别的道路附加信息。该机器自学习模型可以采用线性回归模型。
52.该线性回归模型中,样本特征变量包括目标道路类别下目标路段的总长度,而样本特征真值为样本路线的路线附加特征,求解的是目标道路类别的道路附加信息。也即线性回归模型左侧的样本特征变量包括目标道路类别下目标路段的总长度,线性回归模型右侧的样本特征真值包括样本路线的路线附加特征。
53.由于训练线性回归模型需要大量的样本路线,而不同样本路线中的目标道路类别可能相同也可能不同,为了能够区分相同目标道路类别以及不同目标道路类别,可以为同一个目标道路类别赋予唯一的标识,该唯一的标识可以作为机器自学习模型中的变量名称。在一些实施例中,同一目标道路类别的标识包括从路网数据中提取出的区域和道路标识。
54.在一些实施例中,分类特征还可以包括时间。同一目标道路类别下的路段在不同时段可能具有不同的道路附加信息,例如按时段计费的路段,其费用信息在不同时间有所不同。因此可以将属于同一区域、道路名相同并且时间在同一预设时段内的目标路段划分为一类目标道路类别,而将区域、道路标识和时间所在的预设时段任意一项不同的目标路段划分至不同目标道路类别下。
55.下面以道路收费信息为例说明:假如对某个样本路线进行聚合后得到如下三个目标道路类别,分别标识为:keya1=id1_name1_1500,keya2=id1_name2_3000,keya3=id2_name2_2000。
56.其中,该三个目标道路类别表明该条样本路线经过两条道路(分别为name1和name2),并且第二条道路跨过两个区域(分别为id1和id2)。
57.经过模型训练之后,可以求解出keya1、keya2和keya3对应的道路附加信息。
58.假如机器自学习模型为线性回归模型,并且所有样本路线中总共聚合出n个目标道路类别,分别为keya1,keya2,....keyan,则该线性回归模型的输入变量x的矩阵形式如下表示:keya1,keya2,....keyan
ꢀꢀꢀ
(对应于样本路线a)keyb1,keyb2,....keybn
ꢀꢀꢀ
(对应于样本路线b)keyc1,keyc2,....keycn
ꢀꢀꢀ
(对应于样本路线c)n的大小即为要求解的目标道路类别的个数。可以统计所有参与求解的样本路线中的目标道路类别。在实际求解过程中,每条样本路线的输入数据中可能仅包括n个目标道路类别的其中部分目标道路类别的总长度,而该样本路线中不涉及的目标道路类别的总长度可以为0。
59.求解过程可以简单如下表示:其中,keya1,keya2,....keyan为样本路线a中n个目标道路类别下目标路段的总长度,keyb1,keyb2,....keybn为样本路线b中n个目标道路类别下目标路段的总长度,keyc1,keyc2,....keycn为样本路线c中n个目标道路类别下目标路段的总长度;w1,w2,
……
,wn为n个目标道路类别的道路费用,也即道路附加信息,ya,yb和yc分别为样本路
线a、b和c的道路收费信息,也即路线附加信息。需要说明的是,目标道路类别的道路费用为单位长度对应的费用。
60.在本实施例的一个可选实现方式中,步骤s101,即获取样本路线对应的目标路段集合的步骤,进一步包括以下步骤:获取样本路线;通过在分叉路口处打断的方式将所述样本路线划分成多个目标路段,以获得所述样本路线对应的所述目标路段集合。
61.该可选的实现方式中,获取的样本路线可能是一个从起点到终点的连续路线,而该连续路线可以由多个目标路段构成。为了将样本路线划分成目标路段集合的形式,可以从样本路线的起点开始搜索,遇到分叉路口后,在分叉路口处将该样本路线打断的方式进行划分,打断后得到的一段路线作为目标路段加入该样本路线的目标路段集合中,该目标路段的路段长度也加入该目标路段集合中。
62.图2示出根据本公开实施方式的样本路线划分效果示意图。如图2所示,对于样本路线ab、ac、ad和af,分别进行上述方式的划分后得到的目标路段集合分别为:{af_x1,fh_x2,hb_x3},{ af_x4,fh_x5,hc_x6 },{ af_x7,fg_x8,gc_x9 },{ af_x10,fg_x11,gd_x11}。其中,af_x1中af表示该目标路段,x1表示该目标路段的路段长度。
63.在本实施例的一个可选实现方式中,所述路线附加信息包括路线费用信息;步骤s101,即获取样本路线对应的目标路段集合以及所述样本路线对应的路线附加信息的步骤,进一步包括以下步骤:获取路网数据以及收费站数据;基于所述路网数据以及所述收费站数据建立收费站路网子图;所述收费站路网子图中的点为收费站,边为两两收费站之间的连通路线;所述连通路线包括多个目标路段;基于所述收费站路网子图获得进入收费站和退出收费站之间的样本路线;基于已有的点对点里程计费方式确定所述样本路线对应的初始费用信息。
64.获取收集的路线费用真值以及该路线费用真值对应的真值路线;将与所述真值路线相匹配的所述样本路线的路线费用信息更新为所述路线费用真值。
65.该可选的实现方式中,路线附加信息可以是路线收费信息。根据实际情况,通常情况下道路收费对应有收费站,因此可以基于路网数据以及收费站数据建立收费站子网图。该子网图中可以包括路网数据中的所有收费站,以及两两收费站之间的连通路线,收费站为子网图上的点,而连通路线为两点之间的路径。基于该收费站子网图可以获得进入收费站和退出收费站之间的样本路线,该进入收费站和退出收费站可以是子网图中的任意两个收费站。
66.针对样本路线可以基于点对点的里程计费方式确定初始费用信息。点对点的里程计费方式可以是利用默认的单位长度费用,以及两点也即进入收费站和退出收费站之间样本路线的长度计算费用的方式。通常情况,样本路线的初始费用信息为进入收费站和退出收费站之间样本路线的长度乘以单位长度费用。在一些实施例中的,单位长度费用可以基于区域不同而不同,和/或基于时段的不同而不同。
67.由于上述样本路线的初始费用信息采用已有的点对点里程计算方式得到,结果并
不很准确。
68.因此还可以通过收集用户反馈的费用信息、在授权情况下从对帐助手等相关软件获得的费用信息以及其他能够获取真值数据的渠道获取的费用信息得到各个样本路线对应的路线费用真值,该路线费用真值为在退出收费站口被真实收取的费用信息。可以理解的是,通过这种方式可能只能获取到部分样本路线的路线费用真值,因此可以将该部分路线的路线费用信息替换为该路线费用真值,而未获得路线费用真值的样本路线依然沿用初始费用信息即可。
69.经过上述方式可以获取到尽可能全面的样本路线以及较为准确的路线费用信息。
70.图3示出根据本公开一实施方式的高速费率数据生产流程的一种实现示意图。如图3所示,该高速费率数据生产流程主要生成路网数据中两两高速收费站之间各个路线对应的道路收费费率,该道路收费费率对应的是任意两个高速收费站之间的任意路线上,区域代码和道路名称相同的道路每公里被收的高速费用。
71.该高速费率数据生产流程的处理流程包括数据编译阶段、基础语料生成阶段、真值语料补充替换阶段、训练样本生成阶段和模型生成费率数据阶段。
72.在数据编译阶段,加载上文中实施例提到的路网数据和收费站数据,路网数据包括全部或部分的道路数据,如道路名称、道路位置、道路所属的区域等,而收费站数据包括全部或者部分收费站位置。基于路网数据以及收费站数据可以确定各个收费站所连接的道路,通过对每个收费站进行遍历,获得以当前遍历的收费站为起点,其他收费站为终点的各个连通路径,基于遍历的收费站以及连通路径建立两两收费站之间的连通子图,该连通子图中的点为个收费站,点与点之间的路径为两收费站之间的连通路线。输出结果如图3右侧所示,从进入收费站(具有唯一的linkid)和退出收费站(具有唯一的linkid)之间的路线由路段的linkid序列来表示。
73.基础语料生成阶段,加载上一阶段生成的两两收费站连通子图,通过排列组合所有进入收费站和退出收费站的连通路线,进而基于已有的p2p计费数据(也即点对点里程计费方式得到的每两个收费站之间的收费数据)计算各个连通路线的收费金额。输出结果如图3右侧所示。
74.真值语料补充替换阶段,收集用户反馈语料,并挖掘获得两两收费站之间路线的收费真值数据,还可以通过对账助手、获取其他能够或者收费真值数据的渠道获取两两收费站之间路线的收费真值数据。从收费真值数据对应的起点坐标匹配前述连通路线上的进入收费站linkid和退出收费站linkid,最终可以得到大量连通路线上的收费真值,利用收费真值替换连通路线对应的原收费金额。通过这种方式可以得到大部分两两收费站之间连通路线上的收费真值,而无法获得真值的连通路线依然使用已有p2p计费数据中的收费金额。
75.训练样本生成阶段,将上述连通路线以及对应的收费金额作为待清洗数据进行清洗,例如连通路线不在当前所针对地区内的数据可以清洗掉,将路线不全部在当前地区内的数据也进行清洗,还可以根据相关部门公开的费率信息,将明显计费异常的数据进行清洗。
76.对每条连通路线上属于同一区域以及道路名称相同的路段进行聚合,此处区域可以用adcode表示,adcode相同,并且该路段在路网数据中的道路名称相同,则聚合为同一道
路类别,并计算每条连通路线上各个道路类别的总里程长度,每个道路类别可以用同一个key来表示。
77.在聚合完成后,还可以统计各个道路类别对应的连通路线的数量,如果数量过少,可以将该到道路类别对应的数据删除,这是因为如果对应的训练样本数据较少的话,容易计算出异常费率数据 ,会影响费率结果。
78.最终得到的数据中的连通路线及其对应的计费金额即为所生成的训练样本数据。该阶段的结果输出可参见图3右侧所示。
79.在模型生成费率数据阶段,加载上述训练样本数据,并利用tensorflow生成各个key也即道路类别对应的费率数据,该费率数据为该道路类别下道路每公里的费用。
80.此外,还可以针对每个道路类别按照相关部门给出的费率数据计算默认的基准费率,通过比较基准费率和模型计算得到的费率,进行效果评测得到最终的费率数据。该阶段的结果输出可参见图3右侧所示。
81.需要说明的是,在收集到足够多的新的真值数据之后,还可以从真值语料补充替换阶段重新执行一遍,更新费率数据。
82.图4示出根据本公开一实施方式的附加信息预测方法的流程图。如图4所示,该附加信息预测方法包括以下步骤:在步骤s401中,获取待预测路线对应的待预测路段集合以及目标道路类别集合;所述待预测路段集合包括所述待预测路线中的待预测路段、待预测路段的长度以及所述待预测路段的分类特征;所述分类特征包括所述待预测路段所在的区域以及对应的道路标识;所述目标道路类别集合包括至少一个目标道路类别以及所述目标道路类别对应的道路附加信息;在步骤s402中,基于所述分类特征将所述待预测路段集合中的所述待预测路段与所述目标道路类别集合中的目标道路类别进行匹配;在步骤s403中,基于匹配结果中所述目标道路类别对应的道路附加信息以及所述待预测路段的长度确定所述待预测路线的路线附加信息。
83.本实施例中,该附加信息预测方法适用于在服务器上执行,例如可以在导航服务器上执行。用户使用导航终端请求导航信息时,导航服务器可以基于导航终端提供的起点位置以及终点位置生成导航规划路线,还可以预测该导航规划路线的路线附加信息,该实施例中该导航规划路线即为待预测路线。需要说明的是,待预测路线的路线附加信息未知,而待预测路段集合中各待预测路段所属的目标道路类别的道路附加信息已预先确定,该目标道路类别集合可以包括路网数据中全部或部分目标道路类别以及该目标道路类别的道路附加信息。
84.在一些实施例中,待预测路线可以包括一个或者多个待预测路段,需要说明的是,路段(link)是描述道路的最小数据结构,一个路段可以为路线切分出来的最小一段路,具有道路等级、道路构成、车道数量、车道速度、路段名、长度、形状点、方向等信息。在电子地图的路网数据中,每个路段都会被赋予路段标识。
85.在一些实施例中,待预测路线对应的待预测路段集合可以通过在分叉路口打断的方式将待预测路线划分成包括多个待预测路段的待预测路段集合,例如可以如下得到:可以从待预测路线的起点开始搜索,遇到分叉路口后,在分叉路口处将该待预测
路线打断的方式进行划分,打断后得到的一段路线作为待预测路段加入该待预测路线的待预测路段集合中。在一些实施例中,待预测路线为导航规划路线时,由于导航规划路线均是以路段为单位进行规划,因此待预测路段集合在生成导航规划路线已对应生成,可以直接获取,而无需执行上述划分步骤。
86.在一些实施例中,利用样本路线对应的目标路段集合以及样本路线对应的已知的路线附加信息,预先通过训练机器自学习模型而得到目标路段集合中各目标路段所属目标道路类别对应的道路附加信息。在一些实施例中,目标路段所属目标道路类别的道路附加信息的获取过程可以参见上文中对模型训练方法的描述,在此不再赘述。当然可以理解的是,目标路段所属目标道路类别的道路附加信息也可以通过其他方式获得,只要目标道路类别的道路附加信息已知即可,在此不做限制。
87.因此,获取了待预测路线对应的待预测路段集合后,可以通过将待预测路段集合中的待预测路段与目标道路类别集合进行匹配,确定待预测路线包括的所有待预测路段所属目标道路类别以及该目标道路类别的道路附加信息,进而再基于待预测路段的长度以及所属目标道路类别的道路附加信息确定待预测路线的路线附加信息。在一些实施例中,目标道路类别的道路附加信息为每单位长度对应的附加信息,如每单位长度(比如每公里)的费用。
88.也就是说,本公开实施例中目标道路类别下每单位长度的附加信息已知,通过将待预测路线划分成多个待预测路段后,基于分类特征确定待预测路段所属目标道路类别,进而再基于该目标道路类别下每单位长度的附加信息以及待预测路段的长度确定待预测路线的路线附加信息。
89.本公开实施例中,在预测待预测路线如导航规划路线的路线附加信息时,获取该待预测路线对应的待预测路段集合,并将该待预测路段集合中的待预测路段与目标道路类别集合进行匹配,目标道路类别集合包括至少一个目标道路类别以及该至少一个目标道路类别对应的道路附加信息;基于相匹配的目标道路类别对应的道路附加信息以及待预测路段的长度确定待预测路线的路线附加信息。通过上述方式,由于预先确定了目标道路类别集合中各目标道路类别的道路附加信息,并且目标道路类别由包括区域和道路标识的分类特征进行划分,因此通过匹配该目标道路类别集合,并基于相匹配的目标道路类别的道路附加信息确定待预测路线的路线附加信息,能够提高路线附加信息的预测准确率。
90.在本实施例的一个可选实现方式中,步骤s402,即基于所述分类特征将所述待预测路段集合中的所述待预测路段与所述目标道路类别集合中的目标道路类别进行匹配的步骤,进一步包括以下步骤:基于分类特征将所述待预测路段集合中的待预测路段进行聚合;其中,聚合结果包括属于同一待预测道路类别的待预测路段的总长度;其中,属于同一待预测道路类别的所述分类特征相同;将所述聚合结果中的待预测道路类别与所述目标道路类别集合进行匹配,获得包括相匹配的待预测道路类别以及目标道路类别的匹配结果。
91.该可选的实现方式中,可以先将待预测路段集合中的待预测路段进行聚合,聚合的依据是相同分类特征的待预测路段被聚为一类,获得一个或多个待预测道路类别,此外,还可以确定每个待预测道路类别下待预测路段的总长度。
92.该一个或多个待预测道路类别与目标道路类别集合中的目标道路类别进行匹配,获得包括相匹配的待预测道路类别与目标道路类别的匹配结果。
93.基于该匹配结果可以确定待预测道路类别的道路附加信息,进而可以基于待预测道路类别下待预测路段的总长度以及道路附加信息确定待预测路线的路线附加信息。以道路收费信息为例,待预测路线的道路收费信息可以通过将每个待预测道路类别下待预测路段的总长度与该待预测道路类别的道路费用信息相乘后,再将各待预测路段类别对应的乘积相加得到。
94.在本实施例的一个可选实现方式中,步骤s402,即基于所述分类特征将所述待预测路段集合中的所述待预测路段与所述目标道路类别集合中的目标道路类别进行匹配的步骤,进一步包括以下步骤:基于分类特征确定所述待预测路段集合中所述待预测路段所属的待预测道路类别;将所述待预测道路类别与所述目标道路类别集合进行匹配,获得包括相匹配的待预测道路类别以及目标道路类别的匹配结果。
95.该可选的实现方式中,如上文所述,目标道路类别可以基于分类特征赋予类别标识,该类别标识中包括对应的分类特征,也即包括区域和道路标识,而待预测路段的分类特征已知的情况下,可以基于该待预测路段的分类特征获取该待预测路段所属的待预测道路类别的类别标识,将该待预测道路类别的类别标识与目标道路类别集合中目标道路类别的类别标识进行匹配,可以确定与待预测道路类别相匹配的目标道路类别,从而获得相匹配的待预测道路类别与目标道路类别的匹配结果。
96.基于该匹配结果可以确定待预测道路类别的道路附加信息,进而可以基于待预测道路类别下待预测路段的总长度以及道路附加信息确定待预测路线的路线附加信息。以道路收费信息为例,待预测路线的道路收费信息可以通过将每个待预测道路类别下待预测路段的总长度与该待预测道路类别的费用信息相乘后,再将各待预测路段类别对应的乘积相加得到。
97.在本实施例的一个可选实现方式中,所述待预测路线包括导航规划路线中入口收费站至出口收费站之间的路线;所述路线附加信息为所述待预测路线的总体道路收费信息;所述道路附加信息为所述目标道路类别的路段每单位长度的道路收费信息。
98.该可选的实现方式中,可以在导航服务器上执行上述附加信息预测方法,待预测路线可以是导航服务器基于导航终端提供的起点位置和终点位置而规划的导航规划路线中的部分路线,该部分路线为入口收费站和出口收费站之间的一段路线。也即待预测路线为收费路段上的路线。路线附加信息为待预测路线的总体道路收费信息;而道路附加信息为目标道路类别下每单位长度的道路收费信息。
99.在本实施例的一个可选实现方式中,所述目标道路类别集合预先通过多个样本路线训练机器自学习模型得到;在训练机器自学习模型的过程中,所述样本路线的路线附加信息已知,对所述样本路线对应的目标路段集合中的目标路段进行聚合得到目标道路类别,以及利用目标道路类别下所述目标路段的总长度、所述路线附加信息对所述机器自学习模型训练后,得到所述目标道路类别对应的道路附加信息。
100.该可选的实现方式中,可以收集到大量的样本路线,并将每个样本路线划分成包
括多个目标路段的目标路段集合。划分过程中,可以从样本路线的起点开始搜索,遇到分叉路口后,在分叉路口处将该样本路线打断的方式进行划分,打断后得到的一段路线作为目标路段加入该样本路线的目标路段集合中,该目标路段的路段长度也加入该目标路段集合中。
101.针对每个样本路线划分得到对应的目标路段集合之后,可以基于目标路段集合以及该样本路线的路线附加信息确定目标路段集合中各个目标路段的路段附加信息。
102.在一些实施例中,可以将样本路线对应的目标路段集合中的目标路段进行聚合,将具有相同分类特征的目标路段聚为一类,而将分类特征不同的目标路段聚为不同类,获得样本路线对应的目标道路类别。还可以确定每个目标道路类别下目标路段的总长度,基于目标道路类别下目标路段的总长度以及样本路线的路线附加信息训练机器子学习模型后,确定各个目标道路类别的道路附加信息。
103.可以理解的是,每个样本路线对应的路线附加信息已知,并且该样本路线被划分成多个目标路段之后,每个目标路段的路段长度也已知,样本路线的路线附加信息基于该样本路线被划分成的各个目标路段的路段附加信息得到。而分类特征相同的目标路段的路段附加信息相同,基于此可以通过将每个样本路线中划分出的目标路段所属的目标道路类别、目标道路类别下目标道路类别的总长度以及样本路线的路线附加信息作为训练样本集,训练机器自学习模型,得到每个目标道路类别对应的道路附加信息,进而在线预测时,可以基于目标道路类别对应的道路附加信息以及该新路线中各路段所属目标道路类别及长度确定新路线的路线附加信息。在一些实施例中,该机器自学习模型可以采用线性回归模型。
104.在一些实施例中,路线附加信息为道路收费信息。样本路线的路线附加信息也即道路收费信息为该样本路线被划分出的目标路段对应的路段附加信息也即道路收费信息之和。一个路线上道路收费信息跟路线长度有关,因此可以利用多个样本路线上的各个目标路段所属目标道路类别及总长度、路线附加信息拟合线性回归模型,进而求解出各个目标道路类别的道路附加信息。
105.下面以道路收费为例说明一些例外情形。
106.在实际道路计费中,收费站并不全是里程式计费 ,有一部分是过站式计费。过站式计费可以理解为按次收费,与里程无关,每穿行一次收费站,收固定金额的路费。
107.在本实施例中,可以将过站式收费站的费率数据与前述实施例中按照道路类别计算的费率数据独立存储并使用。过站式收费站的费率数据可以作为按道路类别计费的费率数据的补充数据,通过外挂表的形式存储。
108.过站式收费站的费率数据包括关键词、道路名称和费用金额;其中可以以该过站式收费站退出方向上的经纬度坐标位置为关键词(key),道路名称可以作为辅助信息。
109.过站式收费站的费率数据可以基于相关部门发布的信息、用户反馈的数据、大数据采集得到的数据等为依据,并周期性进行更新。
110.在另一些实施例中,对于新增道路和训练模型过程中未计算出费用的道路类别,可以基于所在区域的相关部门给出的费率生成默认费率,附加在上述训练模型得到的道路类别对应的费率数据中。
111.在本实施例的一个可选实现方式中,所述路线附加信息为路线费用信息;基于所
述分类特征将所述待预测路段集合中的所述待预测路段与所述目标道路类别集合中的目标道路类别进行匹配的步骤,进一步包括以下步骤:将待预测路段结合中的所述待预测路段与过站式费用数据进行匹配;在所述待预测路段与所述过站式费用数据相匹配时,基于所述过站式费用数据获得所述待预测路线的第一部分费用信息;在所述待预测路段与所述过站式费用数据不相匹配时,将所述待预测路段与所述目标道路类别集合中的目标道路类别进行匹配;在所述待预测路段与所述目标道路类别集合中的目标道路类别相匹配时,将与所述待预测路段的所述目标道路类别及其道路附加信息加入所述匹配结果中;基于匹配结果中所述目标道路类别对应的道路附加信息以及所述待预测路段的长度确定所述待预测路线的路线附加信息,包括:基于所述匹配结果中所述目标道路类别对应的道路附加信息以及所述待预测路段的长度确定所述待预测路线的第二子费用信息;基于所述第一部分费用信息和所述第二部分费用信息获得所述待预测路段的路线费用信息。
112.在本实施例的一个可选实现方式中,基于所述分类特征将所述待预测路段集合中的所述待预测路段与所述目标道路类别集合中的目标道路类别进行匹配的步骤,进一步还包括以下步骤:在所述待预测路段与所述目标道路类别集合中的目标道路类别不匹配时,基于所述待预测路段所在区域的默认费用数据以及所述待预测路段的长度计算所述待预测路线的第三部分费用信息;基于所述第一部分费用信息和所述第二部分费用信息获得所述待预测路段的路线费用信息,包括:基于所述第一部分费用信息、第二部分费用信息以及第三部分费用信息获得所述待预测路线的路线费用信息。
113.图5示出根据本公开一实施方式的路线费用计算流程示意图。如图5所示,加载道路类别对应的费率数据以及过站式费率数据,并获取待预测路线的目标路段集合(linkid序列),从所述linkid序列的第一个linkid开始遍历,针对当前遍历的linkid先匹配过站式费率数据,如果在过站式费率数据中,则采用过站式费率数据计算当前遍历的linkid对应路段的费用金额,并遍历下一linkid;如果不在过站式费率数据中,则获取当前linkid对应的区域adcode以及道路名称,基于区域adcode和道路名称匹配道路类别对应的费率数据,如果匹配到道路类别对应的费率数据,则基于道路类别对应的费率数据以及该路段长度计算费用金额,并遍历下一linkid;如果不存在道路类别对应的费率数据,则利用该linkid所在区域的默认费率以及该linkid的路段长度计算费用金额,并遍历下一linkid。
114.在待预测路线上的所有linkid均遍历完成之后,可以将所有linkid对应的费用金额进行累积,得到该预测路线的费用金额。
115.图6示出根据本公开一实施方式的地图导航场景下的应用场景示意图。如图6所示,收费信息确定服务器从样本库中获取样本路线及其路线收费信息;对样本路线划分成目标路段集合后,基于分类特征对目标路段集合中的目标路段进行聚合,同一目标道路类
别下目标路段的长度加和得到该目标道路类别的总长度,基于目标道路类别的总长度、样本路线的道路收费信息训练线性回归模型,得到每个目标道路类别对应每公里费用。收费信息确定服务器将包括所有目标道路类别及其每公里费用的目标道路类别集合发送至导航服务器。导航服务器接收到导航终端的导航请求后,基于位置信息生成导航规划路线,并基于目标类别集合预测导航规划路线的收费信息,导航服务器将收费信息作为导航规划路线的附加信息提供给导航终端,供导航终端或者使用导航终端的用户选择相应的导航规划路线。
116.根据本公开一实施方式的基于位置的服务提供方法,该基于位置的服务提供方法利用上述模型训练方法和/或附加信息预测方法为被服务对象提供基于位置的服务,所述基于位置的服务包括:导航、地图渲染、路线规划中的一种或多种。
117.本实施例中,该基于位置的服务提供方法可以在位置服务终端上执行,位置服务终端是手机、ipad、电脑、智能手表、车载设备等。本公开实施例,可以在导航、路径规划和/或地图渲染过程中,预测路线对应的道路收费信息,进而在导航过程中可以被服务对象推送该道路收费信息,在路径规划服务中基于道路收费信息为被服务对象规划费用低的路线,和/或在地图渲染过程中,可以将路线的道路收费信息渲染在地图上,供被服务对象查看。
118.被服务对象可以是手机、ipad、电脑、智能手表、自动驾驶车辆、机器人等。服务器可以将上述方法获得目标道路集合和/或预测的道路收费信息下发给位置服务终端,位置服务终端在为被服务对象导航、规划路径或者渲染地图上的道路时,为被服务对象提供道路收费信息,具体细节可以参见上述对模型训练方法和/或附加信息预测方法的描述,在此不再赘述。
119.下述为本公开装置实施例,可以用于执行本公开方法实施例。
120.图7示出根据本公开一实施方式的模型训练装置的结构框图。该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图7所示,该模型训练装置包括:第一获取模块701,被配置为获取样本路线对应的目标路段集合以及所述样本路线对应的路线附加信息;所述目标路段集合包括所述样本路线上的至少一个目标路段、所述目标路段的长度以及所述目标路段的分类特征;所述分类特征包括所述目标路段所在的区域以及对应的道路标识;聚合模块702,被配置为基于所述分类特征对所述目标路段集合中的所述目标路段进行聚合;其中,所述分类特征相同的所述目标路段被聚合为同一目标道路类别;聚合结果包括所述目标道路类别以及同一所述目标道路类别下的目标路段的总长度;训练模块703,被配置为基于所述样本路线对应的所述聚合结果以及所述路线附加信息训练机器自学习模型,以确定所述目标道路类别对应的道路附加信息。
121.本实施例中,该模型训练装置可以在云端或者服务器上执行。样本路线可以是路线附加信息已知的路线。在一些实施例中,样本路线可以是车辆在高速上的行驶路线,其路线附加信息可以通过相应方式获得,以道路收费信息为例,可以通过etc对账数据、出租车发票、网约车费用信息等获得。在另一些实施例中,样本路线也可以基于路网数据,通过点对点方式建立任意两个目标位置点之间的连通路线而得到;而此时样本路线的路线附加信
息可以通过已经发生的实际行驶路线得到,可以通过已有的较为初始的原则得到,例如以道路收费信息为例,可以通过点对点之间的路线长度以及费率计算得到样本路线的道路收费信息。
122.在一些实施例中,所获得的样本路线如果没有对应的目标路段集合时,可以针对不对应有目标路段集合的每个样本路线进行预处理。预处理过程中可以将每个样本路线划分成包括多个目标路段的目标路段集合。该目标路段集合包括目标路段的标识、目标路段的长度以及目标路段所在的区域和道路标识等。道路标识可以是目标路段所在道路的名称或id标识等。
123.需要说明的是,一条道路可以包括多个目标路段,路段(link)是描述道路的最小数据结构,一个路段可以为路线切分出来的最小一段路,具有道路等级、道路构成、路名、长度、形状点、方向等属性信息。在路网数据中,每个路段都被赋予了唯一标识。
124.在一些实施例中,目标路段所在区域可以是路网数据中所划分的区域,例如省和直辖市等。同一道路中可能存在一部分目标路段与另一部分目标路段不在同一区域的情况。
125.因此,针对同一样本路线,可以将具有相同区域以及道路标识的目标路段划分至同一种目标道路类别,并且可以认为该类目标道路类别下的目标路段具有相同的区域以及道路标识。可以理解的是,同一目标道路类别中的目标路段属于同一条道路,而不同目标道路类别中的目标道路可能属于同一条道路,也可能属于不同道路。因此,基于目标路段所在的区域以及对应的道路标识对目标路段集合中的目标路段进行聚合时,可以将区域和道路标识均相同的目标路段进行聚合,并计算聚为同一目标道路类别的目标路段的总长度。
126.在一些实施例中,针对任意一条样本路线的目标路段进行聚合后,得到的聚合结果包括该当前样本路线对应的各个目标道路类别以及各个目标道路类别下目标路段的长度。
127.在一些实施例中,目标道路类别可以使用区域和道路标识来区分。例如区域可以使用路网数据中的区域编码adcode,而道路标识可以使用路网数据中的道路名称。
128.针对所收集的多个样本路线经过上述处理后,获得各自对应的聚合结果。聚合结果包括该样本路线所涉及的目标道路类别以及每个目标道路类别下目标路段的总长度。通过样本路线的收集以及构建,可以使得最终得到的样本路线对应的目标道路类别覆盖整个路网数据中的全部或者大部分道路。因此,通过构建机器自学习模型,并将各个样本路线对应的聚合结果中包括的目标道路类别下目标路段的总长度以及样本路线的路线附加信息作为输入训练该机器自学习模型,使得通过该机器自学习模型能够求解出各个目标道路类别对应的道路附加信息。在一些实施例中,目标道路类别对应的道路附加信息可以理解为路线上属于该目标道路类别的一段道路在单位长度下的附加信息。基于该目标道路类别对应的道路附加信息以及路线上属于该目标道路类别的一段道路的长度即可确定该段道路的附加信息,进而可以得到整个路线的附加信息。
129.在一些实施例中,该机器自学习模型可以采用线性回归模型。
130.在一些实施例中,路线附加信息为道路收费信息。样本路线的路线附加信息可以理解为该样本路线上属于不同目标道路类别的各段道路对应的附加信息之和。一个路线上道路收费信息跟路线长度有关,因此在利用多个样本路线上的各个目标道路类别训练机器
自学习模型时,可以基于目标道路类别、目标道路类别对应的总长度、样本路线的路线附加信息进行线性拟合,并且可以将目标道路类别、目标道路类别对应的总长度、样本路线的路线附加信息等作为输入,训练机器自学习模型,从而求解出各个目标道路类别的附加信息。
131.本公开实施例中,为了确定新路线的路线附加信息,利用多个样本路线以及多个样本路线的已知路线附加信息,确定该样本路线中各个目标道路类别的道路附加信息,其中,目标道路类别基于所在区域以及对应的道路标识是否相同来划分;本实施例中通过样本路线对应的目标道路类别以及目标道路类别下各目标路段的总长度训练机器自学习模型,得到各个目标道路类别的道路附加信息。上述方式中,不同区域和/或不同道路标识上的路段被认为属于不同的目标道路类别,而相同区域和相同道路标识的路段才被认为属于同一目标道路类别,并且基于样本路线以及路线附加信息求解不同目标道路类别对应的道路附加信息,因此通过对路线进行了更加细致的划分,使得求得的道路附加信息更加准确,从而基于道路附加信息预测新路线的路线附加信息,能够提高该新路线的路线附加信息的预测准确率。
132.在本实施例的一个可选实现方式中,所述训练模块,包括:第一获取子模块,被配置为基于所述聚合结果获得所述机器自学习模型的样本特征变量及样本特征真值;所述样本特征变量包括属于同一所述目标道路类别的目标路段的总长度,所述样本特征真值包括所述样本路线的所述路线附加信息;训练子模块,被配置为利用多个所述样本路线对应的所述样本特征变量以及所述样本特征真值训练所述机器自学习模型,得到所述目标道路类别对应的道路附加信息。
133.该可选的实现方式中,可以将样本路线中各目标道路类别下目标路段的总长度确定为机器自学习模型的样本特征变量,而将样本路线的路线附加信息作为样本特征真值训练该机器自学习模型,以便基于该机器自学习模型求解出各个目标道路类别的道路附加信息。该机器自学习模型可以采用线性回归模型。
134.该线性回归模型中,样本特征变量包括目标道路类别下目标路段的总长度,而样本特征真值为样本路线的路线附加特征,求解的是目标道路类别的道路附加信息。也即线性回归模型左侧的样本特征变量包括目标道路类别下目标路段的总长度,线性回归模型右侧的样本特征真值包括样本路线的路线附加特征。
135.由于训练线性回归模型需要大量的样本路线,而不同样本路线中的目标道路类别可能相同也可能不同,为了能够区分相同目标道路类别以及不同目标道路类别,可以为同一个目标道路类别赋予唯一的标识,该唯一的标识可以作为机器自学习模型中的变量名称。在一些实施例中,同一目标道路类别的标识包括从路网数据中提取出的区域和道路标识。
136.在本实施例的一个可选实现方式中,所述第一获取模块,包括:第二获取子模块,被配置为获取样本路线;划分子模块,被配置为通过在分叉路口处打断的方式将所述样本路线划分成多个目标路段,以获得所述样本路线对应的所述目标路段集合。
137.该可选的实现方式中,获取的样本路线可能是一个从起点到终点的连续路线,而该连续路线可以由多个目标路段构成。为了将样本路线划分成目标路段集合的形式,可以从样本路线的起点开始搜索,遇到分叉路口后,在分叉路口处将该样本路线打断的方式进
行划分,打断后得到的一段路线作为目标路段加入该样本路线的目标路段集合中,该目标路段的路段长度也加入该目标路段集合中。
138.在本实施例的一个可选实现方式中,所述第一获取模块,包括:第三获取子模块,被配置为获取路网数据以及收费站数据;建立子模块,被配置为基于所述路网数据以及所述收费站数据建立收费站路网子图;所述收费站路网子图中的点为收费站,边为两两收费站之间的连通路线;所述连通路线包括多个目标路段;第四获取子模块,被配置为基于所述收费站路网子图获得进入收费站和退出收费站之间的样本路线;第一确定子模块,被配置为基于已有的点对点里程计费方式确定所述样本路线对应的初始费用信息。
139.第五获取子模块,被配置为获取收集的路线费用真值以及该路线费用真值对应的真值路线;更新子模块,被配置为将与所述真值路线相匹配的所述样本路线的路线费用信息更新为所述路线费用真值。
140.该可选的实现方式中,路线附加信息可以是路线收费信息。根据实际情况,通常情况下道路收费对应有收费站,因此可以基于路网数据以及收费站数据建立收费站子网图。该子网图中可以包括路网数据中的所有收费站,以及两两收费站之间的连通路线,收费站为子网图上的点,而连通路线为两点之间的路径。基于该收费站子网图可以获得进入收费站和退出收费站之间的样本路线,该进入收费站和退出收费站可以是子网图中的任意两个收费站。
141.针对样本路线可以基于点对点的里程计费方式确定初始费用信息。点对点的里程计费方式可以是利用默认的单位长度费用,以及两点也即进入收费站和退出收费站之间样本路线的长度计算费用的方式。通常情况,样本路线的初始费用信息为进入收费站和退出收费站之间样本路线的长度乘以单位长度费用。在一些实施例中的,单位长度费用可以基于区域不同而不同,和/或基于时段的不同而不同。
142.由于上述样本路线的初始费用信息采用已有的点对点里程计算方式得到,结果并不很准确。
143.因此还可以通过收集用户反馈的费用信息、在授权情况下从对帐助手等相关软件获得的费用信息以及其他能够获取真值数据的渠道获取的费用信息得到各个样本路线对应的路线费用真值,该路线费用真值为在退出收费站口被真实收取的费用信息。可以理解的是,通过这种方式可能只能获取到部分样本路线的路线费用真值,因此可以将该部分路线的路线费用信息替换为该路线费用真值,而未获得路线费用真值的样本路线依然沿用初始费用信息即可。
144.经过上述方式可以获取到尽可能全面的样本路线以及较为准确的路线费用信息。
145.图8示出根据本公开一实施方式的附加信息预测装置的结构框图。该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图8所示,该附加信息预测装置包括:第二获取模块801,被配置为获取待预测路线对应的待预测路段集合以及目标道
路类别集合;所述待预测路段集合包括所述待预测路线中的待预测路段、待预测路段的长度以及所述待预测路段的分类特征;所述分类特征包括所述待预测路段所在的区域以及对应的道路标识;所述目标道路类别集合包括至少一个目标道路类别以及所述目标道路类别对应的道路附加信息匹配模块802,被配置为基于所述分类特征将所述待预测路段集合中的所述待预测路段与所述目标道路类别集合中的目标道路类别进行匹配;确定模块803,被配置为基于匹配结果中所述目标道路类别对应的道路附加信息以及所述待预测路段的长度确定所述待预测路线的路线附加信息。
146.本实施例中,该附加信息预测装置适用于在服务器上执行,例如可以在导航服务器上执行。用户使用导航终端请求导航信息时,导航服务器可以基于导航终端提供的起点位置以及终点位置生成导航规划路线,还可以预测该导航规划路线的路线附加信息,该实施例中该导航规划路线即为待预测路线。需要说明的是,待预测路线的路线附加信息未知,而待预测路段集合中各待预测路段所属的目标道路类别的道路附加信息已预先确定,该目标道路类别集合可以包括路网数据中全部或部分目标道路类别以及该目标道路类别的道路附加信息。
147.在一些实施例中,待预测路线可以包括一个或者多个待预测路段,需要说明的是,路段(link)是描述道路的最小数据结构,一个路段可以为路线切分出来的最小一段路,具有道路等级、道路构成、车道数量、车道速度、路段名、长度、形状点、方向等信息。在电子地图的路网数据中,每个路段都会被赋予路段标识。
148.在一些实施例中,待预测路线对应的待预测路段集合可以通过在分叉路口打断的方式将待预测路线划分成包括多个待预测路段的待预测路段集合,例如可以如下得到:可以从待预测路线的起点开始搜索,遇到分叉路口后,在分叉路口处将该待预测路线打断的方式进行划分,打断后得到的一段路线作为待预测路段加入该待预测路线的待预测路段集合中。在一些实施例中,待预测路线为导航规划路线时,由于导航规划路线均是以路段为单位进行规划,因此待预测路段集合在生成导航规划路线已对应生成,可以直接获取,而无需执行上述划分步骤。
149.在一些实施例中,利用样本路线对应的目标路段集合以及样本路线对应的已知的路线附加信息,预先通过训练机器自学习模型而得到目标路段集合中各目标路段所属目标道路类别对应的道路附加信息。在一些实施例中,目标路段所属目标道路类别的道路附加信息的获取过程可以参见上文中对模型训练装置的描述,在此不再赘述。当然可以理解的是,目标路段所属目标道路类别的道路附加信息也可以通过其他方式获得,只要目标道路类别的道路附加信息已知即可,在此不做限制。
150.因此,获取了待预测路线对应的待预测路段集合后,可以通过将待预测路段集合中的待预测路段与目标道路类别集合进行匹配,确定待预测路线包括的所有待预测路段所属目标道路类别以及该目标道路类别的道路附加信息,进而再基于待预测路段的长度以及所属目标道路类别的道路附加信息确定待预测路线的路线附加信息。在一些实施例中,目标道路类别的道路附加信息为每单位长度对应的附加信息,如每单位长度(比如每公里)的费用。
151.也就是说,本公开实施例中目标道路类别下每单位长度的附加信息已知,通过将
待预测路线划分成多个待预测路段后,基于分类特征确定待预测路段所属目标道路类别,进而再基于该目标道路类别下每单位长度的附加信息以及待预测路段的长度确定待预测路线的路线附加信息。
152.本公开实施例中,在预测待预测路线如导航规划路线的路线附加信息时,获取该待预测路线对应的待预测路段集合,并将该待预测路段集合中的待预测路段与目标道路类别集合进行匹配,目标道路类别集合包括至少一个目标道路类别以及该至少一个目标道路类别对应的道路附加信息;基于相匹配的目标道路类别对应的道路附加信息以及待预测路段的长度确定待预测路线的路线附加信息。通过上述方式,由于预先确定了目标道路类别集合中各目标道路类别的道路附加信息,并且目标道路类别由包括区域和道路标识的分类特征进行划分,因此通过匹配该目标道路类别集合,并基于相匹配的目标道路类别的道路附加信息确定待预测路线的路线附加信息,能够提高路线附加信息的预测准确率。
153.在本实施例的一个可选实现方式中,所述匹配模块,包括:第二聚合子模块,被配置为基于分类特征将所述待预测路段集合中的待预测路段进行聚合;其中,聚合结果包括属于同一待预测道路类别的待预测路段的总长度;其中,属于同一待预测道路类别的所述分类特征相同;第一匹配子模块,被配置为将所述聚合结果中的待预测道路类别与所述目标道路类别集合进行匹配,获得包括相匹配的待预测道路类别以及目标道路类别的匹配结果。
154.该可选的实现方式中,可以先将待预测路段集合中的待预测路段进行聚合,聚合的依据是相同分类特征的待预测路段被聚为一类,获得一个或多个待预测道路类别,此外,还可以确定每个待预测道路类别下待预测路段的总长度。
155.该一个或多个待预测道路类别与目标道路类别集合中的目标道路类别进行匹配,获得包括相匹配的待预测道路类别与目标道路类别的匹配结果。
156.基于该匹配结果可以确定待预测道路类别的道路附加信息,进而可以基于待预测道路类别下待预测路段的总长度以及道路附加信息确定待预测路线的路线附加信息。以道路收费信息为例,待预测路线的道路收费信息可以通过将每个待预测道路类别下待预测路段的总长度与该待预测道路类别的道路费用信息相乘后,再将各待预测路段类别对应的乘积相加得到。
157.在本实施例的一个可选实现方式中,所述匹配模块,包括:第二确定子模块,被配置为基于分类特征确定所述待预测路段集合中所述待预测路段所属的待预测道路类别;第二匹配子模块,被配置为将所述待预测道路类别与所述目标道路类别集合进行匹配,获得包括相匹配的待预测道路类别以及目标道路类别的匹配结果。
158.该可选的实现方式中,如上文所述,目标道路类别可以基于分类特征赋予类别标识,该类别标识中包括对应的分类特征,也即包括区域和道路标识,而待预测路段的分类特征已知的情况下,可以基于该待预测路段的分类特征获取该待预测路段所属的待预测道路类别的类别标识,将该待预测道路类别的类别标识与目标道路类别集合中目标道路类别的类别标识进行匹配,可以确定与待预测道路类别相匹配的目标道路类别,从而获得相匹配的待预测道路类别与目标道路类别的匹配结果。
159.基于该匹配结果可以确定待预测道路类别的道路附加信息,进而可以基于待预测
道路类别下待预测路段的总长度以及道路附加信息确定待预测路线的路线附加信息。以道路收费信息为例,待预测路线的道路收费信息可以通过将每个待预测道路类别下待预测路段的总长度与该待预测道路类别的费用信息相乘后,再将各待预测路段类别对应的乘积相加得到。
160.在本实施例的一个可选实现方式中,所述目标道路类别集合预先通过多个样本路线训练机器自学习模型得到;在训练机器自学习模型的过程中,所述样本路线的路线附加信息已知,对所述样本路线对应的目标路段集合中的目标路段进行聚合得到目标道路类别,以及利用目标道路类别下所述目标路段的总长度、所述路线附加信息对所述机器自学习模型训练后,得到所述目标道路类别对应的道路附加信息。
161.该可选的实现方式中,可以在导航服务器上执行上述附加信息预测装置,待预测路线可以是导航服务器基于导航终端提供的起点位置和终点位置而规划的导航规划路线中的部分路线,该部分路线为入口收费站和出口收费站之间的一段路线。也即待预测路线为收费路段上的路线。路线附加信息为待预测路线的总体道路收费信息;而道路附加信息为目标道路类别下每单位长度的道路收费信息。
162.在本实施例的一个可选实现方式中,所述目标道路类别集合预先通过多个样本路线训练机器自学习模型得到;在训练机器自学习模型的过程中,所述样本路线的路线附加信息已知,对所述样本路线对应的目标路段集合中的目标路段进行聚合得到目标道路类别,以及利用目标道路类别下所述目标路段的总长度、所述路线附加信息对所述机器自学习模型训练后,得到所述目标道路类别对应的道路附加信息。
163.该可选的实现方式中,可以收集到大量的样本路线,并将每个样本路线划分成包括多个目标路段的目标路段集合。划分过程中,可以从样本路线的起点开始搜索,遇到分叉路口后,在分叉路口处将该样本路线打断的方式进行划分,打断后得到的一段路线作为目标路段加入该样本路线的目标路段集合中,该目标路段的路段长度也加入该目标路段集合中。
164.针对每个样本路线划分得到对应的目标路段集合之后,可以基于目标路段集合以及该样本路线的路线附加信息确定目标路段集合中各个目标路段的路段附加信息。
165.在一些实施例中,可以将样本路线对应的目标路段集合中的目标路段进行聚合,将具有相同分类特征的目标路段聚为一类,而将分类特征不同的目标路段聚为不同类,获得样本路线对应的目标道路类别。还可以确定每个目标道路类别下目标路段的总长度,基于目标道路类别下目标路段的总长度以及样本路线的路线附加信息训练机器子学习模型后,确定各个目标道路类别的道路附加信息。
166.可以理解的是,每个样本路线对应的路线附加信息已知,并且该样本路线被划分成多个目标路段之后,每个目标路段的路段长度也已知,样本路线的路线附加信息基于该样本路线被划分成的各个目标路段的路段附加信息得到。而分类特征相同的目标路段的路段附加信息相同,基于此可以通过将每个样本路线中划分出的目标路段所属的目标道路类别、目标道路类别下目标道路类别的总长度以及样本路线的路线附加信息作为训练样本集,训练机器自学习模型,得到每个目标道路类别对应的道路附加信息,进而在线预测时,可以基于目标道路类别对应的道路附加信息以及该新路线中各路段所属目标道路类别及长度确定新路线的路线附加信息。在一些实施例中,该机器自学习模型可以采用线性回归
模型。
167.在一些实施例中,路线附加信息为道路收费信息。样本路线的路线附加信息也即道路收费信息为该样本路线被划分出的目标路段对应的路段附加信息也即道路收费信息之和。一个路线上道路收费信息跟路线长度有关,因此可以利用多个样本路线上的各个目标路段所属目标道路类别及总长度、路线附加信息拟合线性回归模型,进而求解出各个目标道路类别的道路附加信息。
168.下面以道路收费为例说明一些例外情形。
169.在实际道路计费中,收费站并不全是里程式计费 ,有一部分是过站式计费。过站式计费可以理解为按次收费,与里程无关,每穿行一次收费站,收固定金额的路费。
170.在本实施例中,可以将过站式收费站的费率数据与前述实施例中按照道路类别计算的费率数据独立存储并使用。过站式收费站的费率数据可以作为按道路类别计费的费率数据的补充数据,通过外挂表的形式存储。
171.过站式收费站的费率数据包括关键词、道路名称和费用金额;其中可以以该过站式收费站退出方向上的经纬度坐标位置为关键词(key),道路名称可以作为辅助信息。
172.过站式收费站的费率数据可以基于相关部门发布的信息、用户反馈的数据、大数据采集得到的数据等为依据,并周期性进行更新。
173.在另一些实施例中,对于新增道路和训练模型过程中未计算出费用的道路类别,可以基于所在区域的相关部门给出的费率生成默认费率,附加在上述训练模型得到的道路类别对应的费率数据中。
174.根据本公开一实施方式的基于位置的服务提供装置,该基于位置的服务提供装置利用上述模型训练装置和/或附加信息预测装置为被服务对象提供基于位置的服务,所述基于位置的服务包括:导航、地图渲染、路线规划中的一种或多种。
175.本实施例中,该基于位置的服务提供装置可以在位置服务终端上执行,位置服务终端是手机、ipad、电脑、智能手表、车载设备等。本公开实施例,可以在导航、路径规划和/或地图渲染过程中,预测路线对应的道路收费信息,进而在导航过程中可以被服务对象推送该道路收费信息,在路径规划服务中基于道路收费信息为被服务对象规划费用低的路线,和/或在地图渲染过程中,可以将路线的道路收费信息渲染在地图上,供被服务对象查看。
176.被服务对象可以是手机、ipad、电脑、智能手表、自动驾驶车辆、机器人等。服务器可以将上述装置获得目标道路集合和/或预测的道路收费信息下发给位置服务终端,位置服务终端在为被服务对象导航、规划路径或者渲染地图上的道路时,为被服务对象提供道路收费信息,具体细节可以参见上述对模型训练装置和/或附加信息预测装置的描述,在此不再赘述。
177.图9是适于用来实现根据本公开一实施方式的模型训练方法、附加信息预测方法和/或基于位置的服务提供方法的电子设备的结构示意图。
178.如图9所示,电子设备900包括处理单元901,其可实现为cpu、gpu、fpga、npu等处理单元。处理单元901可以根据存储在只读存储器(rom)902中的程序或者从存储部分908加载到随机访问存储器(ram)903中的程序而执行本公开上述任一方法的实施方式中的各种处理。在ram903中,还存储有电子设备900操作所需的各种程序和数据。处理单元901、rom902
以及ram903通过总线904彼此相连。输入/输出(i/o)接口905也连接至总线904。
179.以下部件连接至i/o接口905:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至i/o接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机程序根据需要被安装入存储部分908。
180.特别地,根据本公开的实施方式,上文参考本公开实施方式中的任一方法可以被实现为计算机软件程序。例如,本公开的实施方式包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行本公开实施方式中任一方法的程序代码。在这样的实施方式中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。
181.附图中的流程图和框图,图示了按照本公开各种实施方式的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,路程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
182.描述于本公开实施方式中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
183.作为另一方面,本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施方式中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本公开的方法。
184.以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1