一种信息获取方法及装置与流程

文档序号:15690532发布日期:2018-10-16 22:01阅读:140来源:国知局

本发明涉及互联网应用技术领域,尤其涉及一种信息获取方法及装置。



背景技术:

地图数据是地图类服务和应用的基础,如果地图数据出现错误,将影响地图算法的发挥,会导致地图类服务和应用输出数据的准确性降低,出现糟糕案例。因此,及时且准确的进行地图数据的更新是地图类服务和应用的基础性工作。实际应用中需要收集地图更新信息,然后运维人员需要根据地图更新信息对基础路网数据进行更新,地图更新速度快。

现有技术中,收集地图更新信息的方式有两种,一种是从官方部门公开发布的信息中获取地图更新信息,例如城市交管部门的网站发布的高速公路更新信息;另一种是通过互联网数据进行挖掘,发现兴趣点的更新信息。然而,第一种方式仅能够获取大型道路的更新信息,且无法获取存在道路特征属性更新的道路,第二种方式主要获取的是兴趣点的更新信息,也无法获取存在道路特征属性更新的道路。



技术实现要素:

有鉴于此,本发明实施例提供了一种信息获取方法及装置,用以解决现有技术中无法获取存在道路特征属性更新的道路的问题。

一方面,本发明实施例提供了一种信息获取方法,包括:

基于时间计算模型,根据起始地和目的地获得所述起始地与所述目的地之间各车辆行驶道路和各车辆行驶道路的预计到达时间;

根据车辆到达各车辆行驶道路两端的时刻,获得每个车辆行驶道路的实际到达时间;

获取预计到达时间与实际到达时间之间的差异满足预设条件的车辆行驶道路,以作为候选道路;

在所述候选道路中去除具有异常实际到达时间的候选道路、具有异常实时平均行驶速度的候选道路和具有异常历史平均行驶速度的候选道路,得到目标道路。

如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,获取预计到达时间与实际到达时间之间的差异满足预设条件的车辆行驶道路,以作为候选道路,包括:

根据各车辆行驶道路的预计到达时间和各车辆行驶道路的实际到达时间,获得各车辆行驶道路的相对误差均值和各车辆行驶道路的绝对误差均值;

获取相对误差均值大于或者等于第一阈值且绝对误差均值大于或者等于第二阈值的车辆行驶道路,以作为所述候选道路。

如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在所述候选道路中去除具有异常实际到达时间的候选道路,包括:

获取车辆在各候选道路上行驶时对应的状态信息;

基于每个状态信息,若该状态信息不为载客状态且不为导航状态,确定该状态信息对应的候选道路具有异常实际到达时间,并去除该状态信息对应的候选道路。

如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在所述候选道路中去除具有异常实时平均行驶速度的候选道路,包括:

基于每个候选道路,确定获取该候选道路的实时平均行驶速度时所使用的车辆数目,若所述车辆数目小于或者等于第三阈值,确定该候选道路具有异常实时平均行驶速度,并去除该候选道路;其中,所述实时平均行驶速度为在指定时刻根据该指定时刻当前各车辆的预估到达时长获得的该候选道路上车辆的实时平均行驶速度。

如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在所述候选道路中去除具有异常历史平均行驶速度的候选道路,包括:

基于每个候选道路,确定获取该候选道路的历史平均行驶速度时所使用的车辆数目,若所述车辆数目小于或者等于第四阈值,确定该候选道路具有异常历史平均行驶速度,并去除该候选道路;其中,所述历史平均行驶速度为根据指定时长内各车辆的实际到达时长获得的该候选道路在该指定时长内车辆的历史平均行驶速度。

如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,基于时间计算模型,根据起始地和目的地获得所述起始地与所述目的地之间各车辆行驶道路和各车辆行驶道路的预计到达时间之前,还包括:

根据地图类客户端的历史记录,采集作为训练样本的车辆行驶道路;

获取作为训练样本的车辆行驶道路中每个车辆行驶道路中各子路径的标识、每个车辆行驶道路的实际到达时间;

获取各用户车辆行驶道路的指定特征,所述指定特征包括实时平均行驶速度、历史平均行驶速度和道路属性特征;

基于所述指定特征,利用机器学习算法对作为训练样本的车辆行驶道路、作为训练样本的车辆行驶道路中每个车辆行驶道路中各子路径的标识和每个车辆行驶道路的实际到达时间进行训练,得到所述时间计算模型。

如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,还包括:

输出所述目标道路上各子路段的标识、所述目标道路的道路属性特征以及所述目标道路作为地图更新信息的可信度。

另一方面,本发明实施例提供了一种信息获取装置,包括:

信息获取单元,用于基于时间计算模型,根据起始地和目的地获得所述起始地与所述目的地之间各车辆行驶道路和各车辆行驶道路的预计到达时间;还用于根据车辆到达各车辆行驶道路两端的时刻,获得每个车辆行驶道路的实际到达时间;

道路获取单元,用于获取预计到达时间与实际到达时间之间的差异满足预设条件的车辆行驶道路,以作为候选道路;

道路筛选单元,用于在所述候选道路中去除具有异常实际到达时间的候选道路、具有异常实时平均行驶速度的候选道路和具有异常历史平均行驶速度的候选道路,得到目标道路。

如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述道路获取单元,具体用于:

根据各车辆行驶道路的预计到达时间和各车辆行驶道路的实际到达时间,获得各车辆行驶道路的相对误差均值和各车辆行驶道路的绝对误差均值;

获取相对误差均值大于或者等于第一阈值且绝对误差均值大于或者等于第二阈值的车辆行驶道路,以作为所述候选道路。

如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述道路筛选单元用于在所述候选道路中去除具有异常实际到达时间的候选道路时,具体用于:

获取车辆在各候选道路上行驶时对应的状态信息;

基于每个状态信息,若该状态信息不为载客状态且不为导航状态,确定该状态信息对应的候选道路具有异常实际到达时间,并去除该状态信息对应的候选道路。

如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述道路筛选单元用于在所述候选道路中去除具有异常实时平均行驶速度的候选道路时,具体用于:

基于每个候选道路,确定获取该候选道路的实时平均行驶速度时所使用的车辆数目,若所述车辆数目小于或者等于第三阈值,确定该候选道路具有异常实时平均行驶速度,并去除该候选道路;其中,所述实时平均行驶速度为在指定时刻根据该指定时刻当前各车辆的预估到达时长获得的该候选道路上车辆的实时平均行驶速度。

如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述道路筛选单元用于在所述候选道路中去除具有异常历史平均行驶速度的候选道路时,具体用于:

基于每个候选道路,确定获取该候选道路的历史平均行驶速度时所使用的车辆数目,若所述车辆数目小于或者等于第四阈值,确定该候选道路具有异常历史平均行驶速度,并去除该候选道路;其中,所述历史平均行驶速度为根据指定时长内各车辆的实际到达时长获得的该候选道路在该指定时长内车辆的历史平均行驶速度。

如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述装置还包括:

模型生成单元,用于根据地图类客户端的历史记录,采集作为训练样本的车辆行驶道路;以及,获取作为训练样本的车辆行驶道路中每个车辆行驶道路中各子路径的标识、每个车辆行驶道路的实际到达时间;以及,获取各用户车辆行驶道路的指定特征,所述指定特征包括实时平均行驶速度、历史平均行驶速度和道路属性特征;以及,基于所述指定特征,利用机器学习算法对作为训练样本的车辆行驶道路、作为训练样本的车辆行驶道路中每个车辆行驶道路中各子路径的标识和每个车辆行驶道路的实际到达时间进行训练,得到所述时间计算模型。

如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述装置还包括:

信息输出单元,用于输出所述目标道路上各子路段的标识、所述目标道路的道路属性特征以及所述目标道路作为地图更新信息的可信度。

上述技术方案中的一个技术方案具有如下有益效果:

本发明实施例中,先获取用户车辆行驶道路,然后利用各用户车辆行驶道路的预计到达时间与实际到达时间的差异,对用户车辆行驶道路进行筛选,得到候选道路,最后在候选道路中去除具有异常实际到达时间的候选道路、具有异常实时平均行驶速度的候选道路和具有异常历史平均行驶速度的候选道路,得到目标道路。在候选道路中,除了去除掉的候选道路以外,剩下的候选道路,即目标道路,出现异常的原因主要是道路特征属性的异常,而候选道路如果具有异常道路属性特征,往往是道路属性存在不准确或者道路属性发生变化,需要对这些道路进行信息更新,因此,本发明实施例提供的技术方案可以实现获得需要进行道路属性更新的道路,从而实现了自动化获取需要更新的道路,弥补了现有技术中的技术空白。

【附图说明】

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。

图1是本发明实施例所提供的信息获取方法的流程示意图;

图2是本发明实施例所提供的实现步骤101的流程示意图;

图3是本发明实施例所提供的实现步骤102的流程示意图;

图4是本发明实施例所提供的从所述候选道路中筛选出具有异常道路属性特征的候选道路的原理示例图;

图5是本发明实施例所提供的信息获取方法的另一流程示意图;

图6是本发明实施例所提供的信息获取装置的功能方块图;

图7是本发明实施例所提供的服务器的示意图。

【具体实施方式】

为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。

应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。

应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。

应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述阈值,但这些阈值不应限于这些术语。这些术语仅用来将阈值彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一阈值也可以被称为第二阈值,类似地,第二阈值也可以被称为第一阈值。

取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

针对现有技术所存在的无法获取道路特征属性的更新的问题,本发明实施例提供了相应的解决思路:收集车辆的实际行驶道路作为获取更新信息的初始集合,然后在初始集合的基础上,利用预设的与预计到达时间相关的量化指标,对初始集合进行筛选,得到候选集合,最后在候选集合中排除具有异常实际到达时间的候选道路、具有异常实时平均行驶速度的候选道路和具有异常历史平均行驶速度的候选道路,得到所需要的目标道路,确保这些目标道路作为最终的糟糕案例(badcase)是由于道路属性特征变化所引起的,有很大可能性是由于目标道路的道路属性特征已经不准确或者发生变化才导致这些目标道路作为糟糕案例被筛选得到,因此,需要在地图数据中对这些目标道路的信息进行更新。

本发明实施例提供了一种信息获取方法,请参考图1,其为本发明实施例所提供的信息获取方法的流程示意图,如图1所示,该信息获取方法可以包括以下步骤:

101、基于时间计算模型,根据起始地和目的地获得起始地与目的地之间各车辆行驶道路和各车辆行驶道路的预计到达时间;以及,根据车辆到达各车辆行驶道路两端的时刻,获得每个车辆行驶道路的实际到达时间。

102、获取预计到达时间与实际到达时间之间的差异满足预设条件的车辆行驶道路,以作为候选道路。

103、在候选道路中去除具有异常实际到达时间的候选道路、具有异常实时平均行驶速度的候选道路和具有异常历史平均行驶速度的候选道路,得到目标道路。

在一个具体的实现方案中,本发明实施例提供的信息获取方法可以执行在服务器中,而且可以在服务器上周期地执行,例如,可以每天执行一次,或者,也可以每周执行一次,周期的具体时长可以根据实际需求进行配置,本发明实施例对此不进行特别限定。

针对步骤101的实现,本发明实施例在此提供了以下可行的实施方式,如图2所示,包括:

201、根据地图类客户端的历史记录,采集作为训练样本的车辆行驶道路。

本发明实施例中,为了生成用于计算预计到达时间(estimatedtimeofarrival,eta)的时间计算模型,需要先获取与预计到达时间真值(即实际到达时间(actualtimeofarrival,ata))有关的大数据,一般的,只要是预计到达时间的使用场景,都可以收集到与实际到达时间有关的大数据,一般地图类客户端都可以收集到与实际到达时间有关的大数据,与实际到达时间有关的大数据一般存储在地图类客户端的历史记录中,因此,本发明实施例中,可以先获取地图类客户端的历史记录,然后从历史记录中提取记录的车辆行驶道路,如车辆行驶道路的名称。在一个具体的实现方案中,地图类客户端可以包括但不限于:导航应用的客户端、地图应用的客户端、打车应用的客户端等,本发明实施例这里仅为举例说明,并不用于限定地图类客户端的实现方式。其中,可以从地图类客户端相对应的服务器获取历史记录,如果是第三方应用,也可以从第三方应用提供者获取历史记录,并将历史记录输入到步骤201的执行主体,从而获得历史记录。

需要说明的是,历史记录可以包含但不限于:用户标识、车辆行驶道路和车辆到达各车辆行驶道路两端的时刻。这样,服务器可以根据历史记录的格式从历史记录中提取所需要的信息,本发明实施例中,需要从历史记录中提取车辆行驶道路,提取的车辆行驶道路作为生成时间计算模型时需要使用的训练样本。

202、获取作为训练样本的车辆行驶道路中每个车辆行驶道路中各子路径的标识、每个车辆行驶道路的实际到达时间。

在一种可行的实现方案中,路网数据库中可以存储多个车辆行驶道路、每个车辆行驶道路中各子路径的标识、每个车辆行驶道路的道路属性特征。在获取到作为训练样本的车辆行驶道路后,可以根据其中每个车辆行驶道路的名称,在路网数据库中进行匹配,以获得每个车辆行驶道路中各子路径的标识(identification,id)。

在一种可行的实现方案中,路网数据库可以设置在服务器内,或者,也可以在服务器之外单独设置,本发明实施例对此不进行特别限定。本发明实施例中,由于车辆行驶道路可以包含多个子路径,因此可以使用各子路径的标识组成的标识序列来表征车辆行驶道路,这样,一个车辆行驶道路就可以表示成一系列的子路径的标识,且各子路径是收尾相接的。

在一个具体的实现方案中,基于每个车辆行驶道路,可以从该车辆行驶道路所在的历史记录中,获取车辆到达该车辆行驶道路两端的时刻,然后根据该车辆行驶道路两端的时刻之间的时间间隔,进行计算,获得该车辆行驶道路的实际到达时间,这样,对于作为训练样本的车辆行驶道路中每个车辆行驶道路,都可以获得其实际到达时间。

203、获取各车辆行驶道路的指定特征,所述指定特征包括实时平均行驶速度、历史平均行驶速度和道路属性特征。

可以理解的是,机器学习算法可以在给定特征集的前提下,对训练样本进行训练,以生成相应的模型。因此,本发明实施例中还需要获取生成时间计算模型所需要使用的特征集,本发明实施例中该特征集指的是各车辆行驶道路的指定特征,该指定特征可以包括实时特征、挖掘特征和道路属性特征。

本发明实施例中,实时特征指的是在指定时刻根据该指定时刻当前各车辆的预估到达时长获得的该车辆行驶道路上车辆的实时平均行驶速度。

在一种可行的实现方案中,基于作为训练样本的每个车辆行驶道路,获取当前时刻在该车辆行驶道路上车辆的预估到达时长,然后利用车辆行驶道路的长度除以该预估到达时长,得到该车辆行驶道路上车辆的实时平均行驶速度。实际应用中,实时平均行驶速度可以以千米/分钟为单位进行计算。

本发明实施例中,挖掘特征指的是根据指定时长内各车辆的实际到达时长获得的该车辆行驶道路在该指定时长内车辆的历史平均行驶速度。

在一种可行的实现方案中,可以先从过去一段时长内历史记录中获取该车辆行驶道路的多个实际到达时长,然后计算多个实际到达时长的平均值,最后利用该车辆行驶道路的长度除以该平均值,得到该车辆行驶道路在该指定时长内车辆的历史平均行驶速度。

例如,所述指定时长可以是过去的三个月,或者,也可以是过去的一个月,指定时长的具体长度可以根据实际需求进行配置,本发明实施例对此不进行特别限定。

本发明实施例中,车辆行驶道路的道路属性特征可以包括但不限于:

车辆行驶道路的长度;

车辆行驶道路的限速信息;

车辆行驶道路的铺设情况;

车辆行驶道路上的红绿灯数目及位置;以及,

车辆行驶道路上的拐弯数目及位置。

本领域技术人员可以理解,这里仅为举例说明,不用于限定道路属性特征的包含内容。

在一种可行的实现方案中,道路属性特征可以预先存储在上述路网数据库中,当需要获取时,可以根据给定的车辆行驶道路在路网数据库中进行匹配,从而可以获取到车辆行驶道路的道路属性特征。

204、基于所述指定特征,利用机器学习算法对作为训练样本的车辆行驶道路、作为训练样本的车辆行驶道路中每个车辆行驶道路中各子路径的标识和每个车辆行驶道路的实际到达时间进行训练,得到所述时间计算模型。

在一种可行的实现方案中,利用的机器学习算法可以为决策树算法,如梯度提升决策树(gradientboostingdecisiontree,gbdt)算法或者随机森林算法等,本发明实施例对此不进行特别限定。

205、利用预先生成的时间计算模型,并根据起始地和目的地获得所述起始地与所述目的地之间各车辆行驶道路和预计到达时间,以分别作为车辆行驶道路和该车辆行驶道路的预计到达时间。

在生成上述时间计算模型后,将该时间计算模型用于线上服务,如上述地图类应用,这样,可以通过线上服务收集所需要的数据,作为后续筛选时所需要使用的初始集合。

在一个具体的实现方案中,时间计算模型用于线上服务时,会将用户使用服务时输入的起始地和目的地作为时间计算模型的输入,该时间计算模型可以输出起始地与目的地之间各车辆行驶道路以及各车辆行驶道路的预计到达时间。如此,可以在每次提供线上服务时,对得到的起始地与目的地之间各车辆行驶道路以及各车辆行驶道路的预计到达时间进行收集,然后将一段时间内收集到的信息中,多个车辆行驶道路作为车辆行驶道路,以及,将一段时间内收集到的信息中,每个车辆行驶道路的预计到达时间作为车辆行驶道路的预计到达时间。

206、根据车辆到达各车辆行驶道路两端的时刻,获得每个车辆行驶道路的实际到达时间。

在车辆按照利用所述时间计算模型得到的车辆行驶道路行驶过程中,记录车辆到达各车辆行驶道路两端的时刻,并根据每个车辆行驶道路两端的时刻之间的时间间隔,获得每个车辆行驶道路的实际到达时间。例如,基于车辆到达每个车辆行驶道路两端的时刻,利用后一时刻减去前一时刻,得到每个车辆行驶道路的实际到达时间。

时间计算模型用于线上服务时,会得到起始地与目的地之间各车辆行驶道路,如果车辆按照该车辆行驶道路行驶时,可以记录下车辆到达各车辆行驶道路两端的时刻,然后经过一段时间的收集后,可以得到多组时刻,最后可以计算每个车辆行驶道路两端的时刻之间的时间间隔,即利用后一时刻减去前一时刻得到时间间隔,该时间间隔作为该车辆行驶道路的实际到达时间,即车辆行驶道路的实际到达时间。

需要说明的是,步骤205和步骤206得到的车辆行驶道路、该车辆行驶道路的预计到达时间以及车辆行驶道路的实际到达时间,作为步骤102的输入数据,步骤102需要对该输入数据进行处理。

针对步骤102的实现,本发明实施例在此提供了以下可行的实施方式,如图3所示,包括:

301、根据各车辆行驶道路的预计到达时间和各车辆行驶道路的实际到达时间,获得各车辆行驶道路的相对误差均值。

基于每个车辆行驶道路,利用如下公式获得该车辆行驶道路的相对误差均值(meanabsolutepercentageerror,mape):

其中,eta表示车辆行驶道路的预计到达时间;ata表示车辆行驶道路的实际到达时间;||表示绝对值。

302、根据各车辆行驶道路的预计到达时间和各车辆行驶道路的实际到达时间,获得各车辆行驶道路的绝对误差均值。

基于每个车辆行驶道路,利用如下公式获得该车辆行驶道路的绝对误差均值(meanabsoluteerror,mae):

mae=|eta-ata|

其中,eta表示车辆行驶道路的预计到达时间;ata表示车辆行驶道路的实际到达时间;||表示绝对值。

需要说明的是,步骤301和步骤302的执行顺序可以先执行步骤301,后执行步骤302,或者,也可以是先执行步骤302,后执行步骤301,或者,还可以是步骤301和步骤302同时执行,本领域技术人员可以理解,步骤301和步骤302的限定仅为一种可行的执行顺序的举例说明,不用于限定执行顺序。

303、获取相对误差均值大于或者等于第一阈值且绝对误差均值大于或者等于第二阈值的车辆行驶道路,以作为所述候选道路。

需要说明的是,对于mape和mae,mape或者mae的值越大,表示实际到达时间与预计到达时间的差异越大,说明时间计算模型所输出的预计到达时间越不准确,用户体验越差,属于预计到达时间的糟糕案例,因此需要作为候选道路以便于进一步筛选和输出。

本发明实施例中,基于步骤101最终得到的多个车辆行驶道路中的每个车辆行驶道路,判断其相对误差均值与第一阈值的大小,以及判断其绝对误差均值与第二阈值的大小。

若相对误差均值大于或者等于第一阈值且绝对误差均值大于或者等于第二阈值,说明该车辆行驶道路的预计到达时间与实际到达时间的差异比较大,预计到达时间不准确,该车辆行驶道路可以作为候选道路,也即该用户车辆行驶道路可能是预计到达时间的糟糕案例,候选道路需要经过步骤103的进一步筛选。

反之,若不满足相对误差均值大于或者等于第一阈值且绝对误差均值大于或者等于第二阈值,说明该车辆行驶道路的预计到达时间与实际到达时间的差异比较小,预计到达时间比较准确,则该车辆行驶道路可以被筛除,不作为候选道路。

例如,若车辆行驶道路的相对误差均值大于或者等于50%且绝对误差均值大于或者等于15分钟,说明该车辆行驶道路的预计到达时间与实际到达时间的差异比较大,预计到达时间不准确,该车辆行驶道路可以作为候选道路,其有可能是预计到达时间的糟糕案例。

针对步骤103的实现,本发明实施例在此提供了以下可行的实施方式,包括:

上述候选道路,即具有不准确的预计到达时间的候选道路(或称为预计到达时间的糟糕案例),是由于预计到达时间的不准确造成的,一般来说,预计到达时间的不准确受到以下四个方面影响:

第一方面、实际到达时间的不准确;

第二方面、实时平均行驶速度的不准确;

第三方面、历史平均行驶速度的不准确;

第四方面、道路属性特征的不准确。

相应的,具有不准确的预计到达时间的候选道路包括以下四类:

第一类、具有异常实际到达时间的候选道路;

第二类、具有异常实时平均行驶速度的候选道路;

第三类、具有异常历史平均行驶速度的候选道路;

第四类、具有异常道路属性特征的候选道路。

因此,本发明实施例中,只需要在候选道路中将前三类候选道路排除,就可以较准确的判断出具有异常道路属性特征的候选道路,即该候选道路的预计到达时间的不准确是由于道路属性特征的影响而不准确的,进而可以判断出当前路网中,某些道路的道路属性存在不准确的属性或者属性发生变化,因此需要对这些道路进行信息更新。

请参考图4,其为本发明实施例所提供的从所述候选道路中筛选出具有异常道路属性特征的候选道路的原理示例图,如图4所示,基于上述原理,可以在所述候选道路中去除具有异常实际到达时间的候选道路、具有异常实时平均行驶速度的候选道路和具有异常历史平均行驶速度的候选道路,以得到具有异常道路属性特征的候选道路,将具有异常道路属性特征的候选道路作为目标道路。

举例说明,在所述候选道路中去除具有异常实际到达时间的候选道路的实现方案可以包括:获取车辆在各候选道路上行驶时对应的状态信息;基于每个状态信息,若该状态信息不为载客状态且不为导航状态,确定该状态信息对应的候选道路具有异常实际到达时间,并去除该状态信息对应的候选道路。

可以理解的是,实际到达时间的不准确,一般是由于用户在驾驶车辆时不按照路况行驶造成的。例如,用户违反规定超车,或者由于一些突发事件(如车祸或者路边停车时间较长)造成的,而如果用户正常实用导航,或者用户驾驶车辆载客时,会很大概率正常行驶,因此出现实际到达时间的不准确的可能性很小,也即,如果用户没有使用导航且没有载客,认为其出现实际到达时间的不准确的可能性很大。基于该原理,本发明实施例中,通过过滤条件(如用户车辆在各候选道路上行驶时对应的状态信息不为导航状态且不为载客状态)对候选道路进行筛选,在候选路径中去除状态信息是不为载客状态且不为导航状态的候选道路。

另外,可以计算去除的候选道路的数目与候选道路的总数的比值,然后利用1减去该比值,得到候选道路中实时到达时间的准确率x%。例如,实际应用中,利用上述方法对候选道路进行筛选时,得到的候选道路中实时到达时间的准确率可达95%。

举例说明,在所述候选道路中去除具有异常实时平均行驶速度的候选道路的实现方案可以包括:基于每个候选道路,确定获取该候选道路的实时平均行驶速度时所使用的车辆数目,若所述车辆数目小于或者等于第三阈值,确定该候选道路具有异常实时平均行驶速度,并去除该候选道路;其中,所述实时平均行驶速度为在指定时刻根据该指定时刻当前各车辆的预估到达时长获得的该候选道路上车辆的实时平均行驶速度。

可以理解的是,实时特征的不准确,一般是参与计算实时平均行驶速度的车辆数目不够多,当参与计算实时平均行驶速度的车辆的数目足够多时,实时平均行驶速度的准确性比较容易得到保证。基于该原理,本发明实施例中,通过过滤条件(如获取候选道路的实时平均行驶速度时所使用的车辆数目大于第三阈值)对候选道路进行筛选,如果获取某候选道路的实时平均行驶速度时所使用的用户车辆数目小于或者等于第三阈值(例如第三阈值等于5),说明计算实时平均行驶速度时,参与计算的车辆的数目不够多,容易影响实时平均行驶速度的准确性,从而认为该候选道路具有异常实时平均行驶速度,因此需要去除该候选道路。

另外,可以计算去除的候选道路的数目与候选道路的总数的比值,然后利用1减去该比值,得到候选道路中实时平均行驶速度的准确率y%。例如,实际应用中,利用上述方法对候选道路进行筛选时,得到的候选道路中实时平均行驶速度的准确率可达95%。

举例说明,在所述候选道路中去除具有异常历史平均行驶速度的候选道路的实现方案可以包括:基于每个候选道路,确定获取该候选道路的历史平均行驶速度时所使用的车辆数目,若所述车辆数目小于或者等于第四阈值,确定该候选道路具有异常历史平均行驶速度,并去除该候选道路;其中,所述历史平均行驶速度为根据指定时长内各车辆的实际到达时长获得的该候选道路在该指定时长内车辆的历史平均行驶速度。

可以理解的是,历史平均行驶速度属于挖掘特征,挖掘特征是通过对一段时间内的历史数据进行挖掘得到的,如果挖掘的时间足够长,获取该候选道路的挖掘特征时所使用的车辆数目应该越多,从而挖掘特征一般就比较准确,因此挖掘特征的不准确,通常是挖掘时数据量较少导致的。基于该原理,本发明实施例中,通过过滤条件(如获取候选道路的历史平均行驶速度时所使用的车辆数目大于第四阈值)对候选道路进行筛选,如果获取某候选道路的历史平均行驶速度时所使用的车辆数目小于或者等于第四阈值(例如第四阈值等于10),说明计算历史平均行驶速度时,参与计算的车辆的数目不够多,容易影响历史平均行驶速度的准确性,从而认为该候选道路具有异常历史平均行驶速度,需要去除该候选道路。

另外,可以计算去除的候选道路的数目与候选道路的总数的比值,然后利用1减去该比值,得到候选道路中挖掘特征的准确率z%。例如,实际应用中,利用上述方法对候选道路进行筛选时,得到的候选道路中挖掘特征的准确率可达98%。

需要说明的是,对于影响预计到达时间的不准确的四个方面中,实际到达时间的不准确是受用户行为影响,对于服务提供者而言无法进行用户行为的约束,因此获取受实际到达时间影响的候选道路没有实际意义,所以在本发明实施例中需要在候选道路中去除这一类候选道路。另外,实时特征的不准确和挖掘特征的不准确,受服务器中所使用的算法影响,服务器中所使用的算法与需要获取路网中道路更新信息没有直接关联,因此本发明实施例中需要在候选道路中也去除这一类候选道路。

另外,本发明实施例中,由于使用排除法获得具有异常道路属性特征的候选道路,所以得到的具有异常道路属性特征的候选道路(也即目标道路),是只具有异常道路属性特征,也就是说,仅因为道路属性特征的不准确而导致的候选道路的预计到达时间的不准确。其原因是:例如,某候选道路同时具有异常道路属性特征和具有异常实时平均行驶速度,该候选道路会在筛选过程中由于具有异常实时平均行驶速度而被去除。

在步骤101~步骤103的基础上,本发明实施例在此提供了以下可行的实施方式,如图5所示,在步骤103之后还可以包括以下步骤:

104、输出目标道路上各子路段的标识、目标道路的道路属性特征以及目标道路作为地图更新信息的可信度。

在一种可行的实现方案中,在获取到具有异常实时平均行驶速度的候选道路,即目标道路之后,需要输出与目标道路有关的情报信息,表示目标道路的道路属性特征很可能存在变化和更新。本发明实施例中,输出的与目标道路有关的情报信息中可以包括但不限于:

目标道路上各子路段的标识;

目标道路的道路属性特征;以及,

目标道路作为地图更新信息的可信度。

可以理解的是,上述提到可以使用各子路径的标识组成的标识序列来表征行驶道路,所以这里可以输出目标道路上各子路段的标识,用来表征目标道路。该目标道路上各子路段的标识可以作为输出的情报信息中的主体内容。需要说明的是,输出目标道路上各子路段的标识可以方便用户直观获知是哪个目标道路、目标道路中有哪些子路段、包括几个子路段等信息,从而方便用户根据输出的情报信息进行验证和处理,以实现将情报信息转化为地图更新信息,应用于对地图数据的更新。

在一个具体的实现方案中,可以将目标道路的道路属性特征作为情报信息中的表项进行输出。实际应用中,情报信息中的目标道路的道路属性特征可以通过各道路属性特征的名称集合实现。本发明实施例中,目标道路的道路属性特征可以包括但不限于:

道路的长度;

道路的限速信息;

道路的铺设情况;

道路的红绿灯数目及位置;以及,

道路上的拐弯数目及位置。

本领域技术人员可以理解,这里仅为举例说明,不用于限定道路属性特征的包含内容。

另外,上述情报信息中还可以包含目标道路作为地图更新信息的可信度。需要说明的是,由于目标道路的道路属性特征发生变化和更新并不是绝对的,也就是说,并不是百分之百的真的发生变化和更新,只是有很大的可能性是发生了变化和更新,因此,为了对这个可能性进行量化,本发明实施例中,可以计算这个可能性的概率,利用该可能性的概率来表征目标道路作为地图更新信息的可信度。

在一个可行的实现方案中,利用如下公式计算该可能性的概率,即目标道路作为地图更新信息的可信度p:

p≥x%×y%×z%

其中,x%表示候选道路具有异常实时到达时间的准确率,y%表示候选道路具有异常实时平均行驶速度的准确率,z%表示候选道路具有异常历史平均行驶速度的准确率。

例如,候选道路中实时到达时间的准确率x%=95%,候选道路具有异常实时平均行驶速度的准确率y%=95%,候选道路具有异常历史平均行驶速度的准确率z%=98%,则:

p≥x%×y%×z%=95%×95%×98%≈88%

需要说明的是,输出目标道路作为地图更新信息的可信度p,可以方便用户根据该目标道路作为地图更新信息的可信度p和其他来源得到的地图更新信息的可信度,按照可信度由高到低的顺序,对各来源得到的地图更新信息进行排序,其中,可信度越高,优先级越高,用户可以优先对优先级较高的地图更新信息进行验证和处理。可见,本发明实施例提供的技术方案可以作为地图更新信息的一种来源,可以与其他来源得到的地图更新信息相结合。

本发明实施例进一步给出实现上述方法实施例中各步骤及方法的装置实施例。

请参考图6,其为本发明实施例所提供的信息获取装置的功能方块图。如图所示,该装置包括:

信息获取单元601,用于基于时间计算模型,根据起始地和目的地获得所述起始地与所述目的地之间各车辆行驶道路和各车辆行驶道路的预计到达时间;还用于根据车辆到达各车辆行驶道路两端的时刻,获得每个车辆行驶道路的实际到达时间;

道路获取单元602,用于获取预计到达时间与实际到达时间之间的差异满足预设条件的车辆行驶道路,以作为候选道路;

道路筛选单元603,用于在所述候选道路中去除具有异常实际到达时间的候选道路、具有异常实时平均行驶速度的候选道路和具有异常历史平均行驶速度的候选道路,得到目标道路。

在一种可行的实现方案中,所述道路获取单元602,具体用于:

根据各车辆行驶道路的预计到达时间和各车辆行驶道路的实际到达时间,获得各车辆行驶道路的相对误差均值和各车辆行驶道路的绝对误差均值;

获取相对误差均值大于或者等于第一阈值且绝对误差均值大于或者等于第二阈值的车辆行驶道路,以作为所述候选道路。

在一种可行的实现方案中,所述道路筛选单元603用于在所述候选道路中去除具有异常实际到达时间的候选道路时,具体用于:

获取车辆在各候选道路上行驶时对应的状态信息;

基于每个状态信息,若该状态信息不为载客状态且不为导航状态,确定该状态信息对应的候选道路具有异常实际到达时间,并去除该状态信息对应的候选道路。

在一种可行的实现方案中,所述道路筛选单元603用于在所述候选道路中去除具有异常实时平均行驶速度的候选道路时,具体用于:

基于每个候选道路,确定获取该候选道路的实时平均行驶速度时所使用的车辆数目,若所述车辆数目小于或者等于第三阈值,确定该候选道路具有异常实时平均行驶速度,并去除该候选道路;其中,所述实时平均行驶速度为在指定时刻根据该指定时刻当前各车辆的预估到达时长获得的该候选道路上车辆的实时平均行驶速度。

在一种可行的实现方案中,所述道路筛选单元603用于在所述候选道路中去除具有异常历史平均行驶速度的候选道路时,具体用于:

基于每个候选道路,确定获取该候选道路的历史平均行驶速度时所使用的车辆数目,若所述车辆数目小于或者等于第四阈值,确定该候选道路具有异常历史平均行驶速度,并去除该候选道路;其中,所述历史平均行驶速度为根据指定时长内各车辆的实际到达时长获得的该候选道路在该指定时长内车辆的历史平均行驶速度。

在一种可行的实现方案中,所述信息获取单元601,还用于在车辆按照利用所述时间计算模型得到的车辆行驶道路行驶过程中,记录车辆到达各车辆行驶道路两端的时刻;

所述信息获取单元601具体用于:基于车辆到达每个车辆行驶道路两端的时刻,利用后一时刻减去前一时刻,得到每个车辆行驶道路的实际到达时间。

在一种可行的实现方案中,所述装置还包括:

模型生成单元604,用于根据地图类客户端的历史记录,采集作为训练样本的车辆行驶道路;以及,获取作为训练样本的车辆行驶道路中每个车辆行驶道路中各子路径的标识、每个车辆行驶道路的实际到达时间;以及,获取各用户车辆行驶道路的指定特征,所述指定特征包括实时平均行驶速度、历史平均行驶速度和道路属性特征;以及,基于所述指定特征,利用机器学习算法对作为训练样本的车辆行驶道路、作为训练样本的车辆行驶道路中每个车辆行驶道路中各子路径的标识和每个车辆行驶道路的实际到达时间进行训练,得到所述时间计算模型。

在一种可行的实现方案中,所述装置还包括:

信息输出单元605,用于输出所述目标道路上各子路段的标识、所述目标道路的道路属性特征以及所述目标道路作为地图更新信息的可信度

由于本实施例中的各单元能够执行图1至图5所示的方法,本实施例未详细描述的部分,可参考对图1至图5的相关说明。

请参考图7,其为本发明实施例所提供的服务器的示意图。如图所示,该服务器包括上述信息获取装置。

本发明实施例的技术方案具有以下有益效果:

本发明实施例中,先获取用户车辆行驶道路,然后利用各用户车辆行驶道路的预计到达时间与实际到达时间的差异,对用户车辆行驶道路进行筛选,得到候选道路,最后在候选道路中去除具有异常实际到达时间的候选道路、具有异常实时平均行驶速度的候选道路和具有异常历史平均行驶速度的候选道路,得到目标道路。在候选道路中,除了去除掉的候选道路以外,剩下的候选道路,即目标道路,出现异常的原因主要是道路特征属性的异常,而候选道路如果具有异常道路属性特征,往往是道路属性存在不准确或者道路属性发生变化,需要对这些道路进行信息更新,因此,本发明实施例提供的技术方案可以实现获得需要进行道路属性更新的道路,从而实现了自动化获取需要更新的道路,弥补了现有技术中的技术空白。

另外,由于是基于车辆的实际行驶道路进行筛选,且车辆的实际行驶道路包括各种道路,如大型道路和中小型道路,因此具有异常道路属性特征的候选道路可以包含中小型道路,与现有技术中第一种方式相比,实现了获取到中小型道路的更新信息,解决了第一种方式只能获取到大型道路的更新信息的问题,提高了更新信息的覆盖范围。与现有技术中第二种方式相比,能够获取到道路的更新信息,而且具有异常道路属性特征的候选道路的获取是经过两次筛选过程得到的,因此获取的具有异常道路属性特征的候选道路的可信度较高,与现有技术中第二种方式相比提升了获取的更新信息的可信度和准确度。

实际应用中,最后输出的作为更新信息的某些道路,其需要映射到路网基础数据中,因此需要将道路转化为各子路径的标识(如id),现有技术中一般输出的是道路名称,因此需要人工将其转化为该道路上各子路径的标识,耗费很多人力物力,且映射效率比较低。本发明实施例中,在生成模型时使用的是道路上各子路径的标识,且上述各步骤流程都基于各子路径的标识来表征道路,因此最后可以直接输出各子路径的标识,避免了人工映射,节省人力物力,提高了映射效率。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1