预估到达时间的方法及系统与流程

文档序号:16266555发布日期:2018-12-14 21:57阅读:588来源:国知局
预估到达时间的方法及系统与流程

本公开实施例涉及数据处理技术领域,更具体而言,涉及一种预估到达时间的方法及一种预估到达时间的系统。

背景技术

目前,在电子地图和导航领域,移动主体(车辆,行人等)在给定路线时,由起点到终点所要花费的时间是一个非常重要的技术指标,它描述了出行的相关代价和花费。对这一时间的估计叫做到达时间预估(estimatedtimeofarrival,eta)。相关技术中,在进行eta的常用解决方案有两种:一种是对这一过程进行物理建模,计算每一段路程的速度,由此得到经过每条路段所需的时间,加上通过路口的时间代价,最终得到整体的时间,该方法解决方案基于gbdt(gradientboostingdecisiontree,梯度提升决策树)模型,但是由于不同行程的link(道路)数目不一致,该方法只能针对整体路径提取整体的特征,无法单独针对每条link进行特征提取建模,限制了模型的性能;另一种是把eta建模称为一个机器学习问题,把历史行程作为训练数据,以整个路径的统计特征等作为样本特征,以真实的行驶时间作为标签,学习得到回归模型,该方法解决方案基于rnn(recurrentneuralnetwork,回归神经网络),可以根据每条link的特征进行序列学习,不再局限于整体特征,但rnn的强项在于实数特征,而在稀疏特征的建模上需要改进。

公开实施例内容

本公开实施例旨在至少解决现有技术中存在的技术问题之一。

本公开实施例的一个方面提供了一种预估到达时间的方法。

本公开实施例的一个方面提供了一种预估到达时间的系统。

本公开实施例的一个方面提供了一种计算机设备。

本公开实施例的一个方面提供了一种计算机可读存储介质。

鉴于上述,本公开实施例提供的一种预估到达时间的方法,预估到达时间的方法包括:获取不同场景中的各订单的行程轨迹数据;提取行程轨迹数据中的全局特征数据及序列特征数据,且全局特征数据为针对各订单中包含的信息进行提取的数据,序列特征数据为针对行程轨迹数据中的各路段进行提取的数据;将全局特征数据及序列特征数据分别进行处理,得到全局特征数据对应的全局信息及序列特征数据对应的序列信息;将全局信息及序列信息进行融合并预测到达时间。

根据本公开实施例提供的预估到达时间的方法,首先获取不同场景中的各订单的行程轨迹数据,同时可以对提取的行程轨迹数据进行清洗、去除噪声,以提高数据的真实可信度;随后在行程轨迹数据中提取全局特征数据和序列特征数据,此时的全局特征数据为针对各订单中包含的信息进行提取的数据,将整个订单作为整体,提取能反应订单的特征数据,序列特征数据则为针对行程轨迹数据中的各路段进行提取的数据,序列特征数据会将行程轨迹数据中各个路段进行单独提取分析,使得各个路段中涉及的数据都能被分别标注提取出;随后将全局特征数据进行分析处理,以得到相对应的全局信息,同时对序列特征数据进行分析处理,以得到相对应的序列信息,全局信息和序列信息为分别通过一定的模型,对全局特征数据和序列特征数据进行学习和编码而得到的,最后将全局信息及序列信息进行信息融合,并且通过融合后的信息来预测到达时间,本公开实施例通过分别对订单和路段进行全局特征数据和序列特征数据的提取,使得在预估到达时间时其结果能够更加的准确。

可以想到地,全局特征数据在反应订单中的信息时,可以针对订单本身涉及到的特征,也可以是针对发生订单时的外界的特征,如发生订单时的天气、时段、星期、订单起点和终端之间的距离等特征,而序列特征数据则针对各个路段的特征,如涉及的路段的名称、限速情况、路段长度、通信速度等。

另外,根据本公开实施例提供的一种预估到达时间的方法还具有如下附加技术特征:

在上述任一技术方案中,优选地,提取行程轨迹数据中的全局特征数据及序列特征数据的步骤具体包括:将行程轨迹数据按照订单维度及路段维度进行分类;在订单维度中统计各订单的第一离散特征及第一实数特征组成全局特征数据,且在路段维度中统计各路段的第二离散特征及第二实数特征组成序列特征数据;其中,第一离散特征包括至少一种描述订单的离散数据,第一实数特征包括至少一种描述订单的实数值数据,第二离散特征包括至少一种描述路段的离散名义数据,第二实数特征包括至少一种描述路段的实数值数据。

在该技术方案中,在提取行程轨迹数据中的全局特征数据及序列特征数据时,首先会将行程轨迹数据按照订单维度和路段维度进行分类,并且在订单维度中,分别统计第一离散特征和第一实数特征,全局特征数据为由第一离散特征和第一实数特征共同组成,第一离散特征中包括至少一种描述订单的离散数据(稀疏数据),第一实数特征中包括至少一种描述订单的实数值数据,同时在路段维度中统计各路段的第二离散特征及第二实数特征,序列特征数据由第二离散特征及第二实数特征共同组成,第二离散特征包括至少一种描述路段的离散名义数据(稀疏数据),第二实数特征包括至少一种描述路段的实数值数据,使得在后续对全局特征数据及序列特征数据进行处理分析时,能保证对订单及路段都能获取到针对离散数据和实数连续数据两种类型的数据。

在上述任一技术方案中,优选地,将全局特征及序列特征分别进行处理,得到全局特征对应的全局信息及序列特征对应的序列信息的步骤具体包括:将全局特征输入wide模型及deep模型分别进行学习,以得到全局信息;将序列特征输入rnn模型进行学习,以得到序列信息,其中序列信息包含rnn最终时刻的隐状态。

在该技术方案中,在对全局信息进行处理时,分别对其输入到wide模型及deep模型分别进行学习,在输入至wide模型时,将全局特征数据进行二阶交叉(两两相乘)并进行学习,同时用deep模型基于深层神经网络对全局特征数据进行特征的抽象表示;并且rnn模块对序列特征数据进行学习:按照道路的顺序,将序列特征数据依次输入到rnn中。rnn提取序列的信息,将其编码在最后一个时刻的隐状态中。

在本公开实施例中,一方面可以通过rnn单独针对每条道路进行特征提取建模,进行序列学习,进行序列特征的精细建模,不再局限于整体特征,大大提高了有效特征的范围。另一方面通过wide模型和deep模型提供对全局特征(尤其是稀疏特征)的良好建模,这样使得既可以处理道路的序列化特征,又可以对全局的稀疏特征有良好的建模。

在上述任一技术方案中,优选地,将全局信息及序列信息进行融合并预测到达时间的步骤具体包括:将全局信息和序列信息合并至同一向量中,并将向量输入至神经网络模型,计算得到预测到达时间。

在该技术方案中,在最终预测到达时间时,会将rnn最终的隐状态和wide模型、deep模型的对应输出合并成一个向量,然后输入到一个多层感知机(多层神经网络模型)中,在多层感知机中利用融合后的信息,预测到达时间。

在上述任一技术方案中,优选地,第一离散特征包括以下任一或组合:天气、星期、接单司机、订单地域、下单时段;和/或第一实数特征包括以下任一或组合:订单路程、以订单起点和订单终点为对角线组成的矩形面积;和/或第二离散特征包括以下任一或组合:路段名称、路段编号、路段限速等级;和/或第二实数特征包括以下任一或组合:路段实时通行速度、路段长度、路段宽度。

在该技术方案中,第一离散特征可以包括天气、星期、接单司机、订单地域、下单时段等任一数据或任意组合,对于在同一订单中,第一离散特征都为相同值,并且第一离散特征都为不连续的离散数据值;对于第一实数特征可以是订单路程、以订单起点和订单终点为对角线组成的矩形面积等任一数据或任意组合,对于在同一订单中,第一实数特征都为相同值,同时第一实数特征可以为实数域中任意取值;对于第二离散特征可以为路段名称、路段编号、路段限速等级等关于车辆在行驶中涉及的道路的各项数据,在同一道路中,第二离散特征都为相同值,并且第二离散特征都为不连续的离散数据值;第二实数特征可以为路段实时通行速度(其间接反应路段拥堵情况)、路段长度、路段宽度等数据,对于同一道路中,第二实数特征都为相同值,同时第二实数特征可以为实数域中任意取值。

本公开实施例提供一种预估到达时间的系统,预估到达时间的系统包括:获取单元,用于获取不同场景中的各订单的行程轨迹数据;提取单元,用于提取行程轨迹数据中的全局特征数据及序列特征数据,且全局特征数据为针对各订单中包含的信息进行提取,序列特征数据为针对行程轨迹数据中的各路段进行提取;处理单元,用于将全局特征数据及序列特征数据分别进行处理,得到全局特征对应的全局信息及序列特征对应的序列信息;预设单元,用于将全局信息及序列信息进行融合并预测到达时间。

根据本公开实施例提供的预估到达时间的系统,首先获取单元获取不同场景中的各订单的行程轨迹数据,同时可以对提取的行程轨迹数据进行清洗、去除噪声,以提高数据的真实可信度;随后通过提取单元在行程轨迹数据中提取全局特征数据和序列特征数据,此时的全局特征数据为针对各订单中包含的信息进行提取的数据,将整个订单作为整体,提取能反应订单的特征数据,序列特征数据则为针对行程轨迹数据中的各路段进行提取的数据,序列特征数据会将行程轨迹数据中各个路段进行单独提取分析,使得各个路段中涉及的数据都能被分别标注提取出;随后通过处理单元将全局特征数据进行分析处理,以得到相对应的全局信息,同时对序列特征数据进行分析处理,以得到相对应的序列信息,全局信息和序列信息为分别通过一定的模型,对全局特征数据和序列特征数据进行学习和编码而得到的,最后通过预设单元将全局信息及序列信息进行信息融合,并且通过融合后的信息来预测到达时间,本公开实施例通过分别对订单和路段进行全局特征数据和序列特征数据的提取,使得在预估到达时间时其结果能够更加的准确。

可以想到地,全局特征数据在反应订单中的信息时,可以针对订单本身涉及到的特征,也可以是针对发生订单时的外界的特征,如发生订单时的天气、时段、星期、订单起点和终端之间的距离等特征,而序列特征数据则针对各个路段的特征,如涉及的路段的名称、限速情况、路段长度、通信速度等。

在上述任一技术方案中,优选地,提取单元具体包括:分类子单元,用于将行程轨迹数据按照订单维度及路段维度进行分类;提取子单元,用于在订单维度中统计各订单的第一离散特征及第一实数特征组成全局特征数据,且在路段维度中统计各路段的第二离散特征及第二实数特征组成序列特征数据;其中,第一离散特征包括至少一种描述订单的离散数据,第一实数特征包括至少一种描述订单的实数值数据,第二离散特征包括至少一种描述路段的离散名义数据,第二实数特征包括至少一种描述路段的实数值数据。

在该技术方案中,在提取单元提取行程轨迹数据中的全局特征数据及序列特征数据时,首先分类子单元会将行程轨迹数据按照订单维度和路段维度进行分类,并且提取子单元会在订单维度中,分别统计第一离散特征和第一实数特征,全局特征数据为由第一离散特征和第一实数特征共同组成,第一离散特征中包括至少一种描述订单的离散数据(稀疏数据),第一实数特征中包括至少一种描述订单的实数值数据,同时提取子单元会在路段维度中统计各路段的第二离散特征及第二实数特征,序列特征数据由第二离散特征及第二实数特征共同组成,第二离散特征包括至少一种描述路段的离散名义数据(稀疏数据),第二实数特征包括至少一种描述路段的实数值数据,使得在后续对全局特征数据及序列特征数据进行处理分析时,能保证对订单及路段都能获取到针对离散数据和实数连续数据两种类型的数据。

在上述任一技术方案中,优选地,处理单元具体包括:第一处理子单元,用于将全局特征输入wide模型及deep模型分别进行学习,以得到全局信息;第二处理子单元,用于将序列特征输入rnn模型进行学习,以得到序列信息,其中序列信息包含rnn最终时刻的隐状态。

在该技术方案中,在处理单元对全局信息进行处理时,第一处理子单元分别对其输入到wide模型及deep模型分别进行学习,在输入至wide模型时,将全局特征数据进行二阶交叉(两两相乘)并进行学习,同时用deep模型基于深层神经网络对全局特征数据进行特征的抽象表示;并且第二处理子单元通过rnn模块对序列特征数据进行学习:按照道路的顺序,将序列特征数据依次输入到rnn中。rnn提取序列的信息,将其编码在最后一个时刻的隐状态中。

在本公开实施例中,一方面可以通过rnn单独针对每条道路进行特征提取建模,进行序列学习,进行序列特征的精细建模,不再局限于整体特征,大大提高了有效特征的范围。另一方面通过wide模型和deep模型提供对全局特征(尤其是稀疏特征)的良好建模,这样使得既可以处理道路的序列化特征,又可以对全局的稀疏特征有良好的建模。

在上述任一技术方案中,优选地,预设单元具体用于将全局信息和序列信息合并至同一向量中,并将向量输入至神经网络模型,计算得到预测到达时间。

在该技术方案中,在最终预测到达时间时,预设单元会将rnn最终的隐状态和wide模型、deep模型的对应输出合并成一个向量,然后输入到一个多层感知机(多层神经网络模型)中,在多层感知机中利用融合后的信息,预测到达时间。

在上述任一技术方案中,优选地,第一离散特征包括以下任一或组合:天气、星期、接单司机、订单地域、下单时段;和/或第一实数特征包括以下任一或组合:订单路程、以订单起点和订单终点为对角线组成的矩形面积;和/或第二离散特征包括以下任一或组合:路段名称、路段编号、路段限速等级;和/或第二实数特征包括以下任一或组合:路段实时通行速度、路段长度、路段宽度。

在该技术方案中,第一离散特征可以包括天气、星期、接单司机、订单地域、下单时段等任一数据或任意组合,对于在同一订单中,第一离散特征都为相同值,并且第一离散特征都为不连续的离散数据值;对于第一实数特征可以是订单路程、以订单起点和订单终点为对角线组成的矩形面积等任一数据或任意组合,对于在同一订单中,第一实数特征都为相同值,同时第一实数特征可以为实数域中任意取值;对于第二离散特征可以为路段名称、路段编号、路段限速等级等关于车辆在行驶中涉及的道路的各项数据,在同一道路中,第二离散特征都为相同值,并且第二离散特征都为不连续的离散数据值;第二实数特征可以为路段实时通行速度(其间接反应路段拥堵情况)、路段长度、路段宽度等数据,对于同一道路中,第二实数特征都为相同值,同时第二实数特征可以为实数域中任意取值。

根据本公开实施例的第三个方面提供了一种计算机装置,计算机装置包括处理器,处理器用于执行存储器中存储的计算机程序时实现如上述任一技术方案的预估到达时间的方法,因此,该计算机装置具有上述任一技术方案的预估到达时间的方法的全部有益效果。

根据本公开实施例的第四个方面提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述任一技术方案的预估到达时间的方法,因此,该计算机可读存储介质具有如上述任一技术方案的预估到达时间的方法的全部有益效果。

根据本公开实施例的附加方面和优点将在下面的描述部分中给出,部分将从下面的描述中变得明显,或通过本公开实施例的实践了解到。

附图说明

本公开实施例的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:

图1示出了根据本公开实施例的预估到达时间的方法的流程示意图;

图2示出了根据本公开实施例的预估到达时间的方法的又一流程示意图;

图3示出了根据本公开实施例的预估到达时间的方法的又一流程示意图;

图4示出了根据本公开实施例的预估到达时间的方法的又一流程示意图;

图5示出了根据本公开实施例的预估到达时间的系统的框架示意图;

图6示出了根据本公开实施例的预估到达时间的系统的又一框架示意图;

图7示出了根据本公开实施例的计算机设备的示意图。

具体实施方式

为了能够更清楚地理解本公开实施例的上述目的、特征和优点,下面结合附图和具体实施方式对本公开实施例进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本公开实施例,但是,本公开实施例还可以采用其他不同于在此描述的方式来实施,因此,本公开实施例的保护范围并不受下面公开的具体实施例的限制。

下面参照图1至图7来描述根据本公开实施例提供的预估到达时间的方法及预估到达时间的系统。

图1示出了根据本公开实施例的预估到达时间的方法的流程示意图。如图1所示,本公开实施例提供的一种预估到达时间的方法,预估到达时间的方法包括:

s102,获取不同场景中的各订单的行程轨迹数据;

s104,提取行程轨迹数据中的全局特征数据及序列特征数据,且全局特征数据为针对各订单中包含的信息进行提取的数据,序列特征数据为针对行程轨迹数据中的各路段进行提取的数据;

s106,将全局特征数据及序列特征数据分别进行处理,得到全局特征数据对应的全局信息及序列特征数据对应的序列信息;

s108,将全局信息及序列信息进行融合并预测到达时间。

根据本公开实施例提供的预估到达时间的方法,首先获取不同场景中的各订单的行程轨迹数据,同时可以对提取的行程轨迹数据进行清洗、去除噪声,以提高数据的真实可信度;随后在行程轨迹数据中提取全局特征数据和序列特征数据,此时的全局特征数据为针对各订单中包含的信息进行提取的数据,将整个订单作为整体,提取能反应订单的特征数据,序列特征数据则为针对行程轨迹数据中的各路段进行提取的数据,序列特征数据会将行程轨迹数据中各个路段进行单独提取分析,使得各个路段中涉及的数据都能被分别标注提取出;随后将全局特征数据进行分析处理,以得到相对应的全局信息,同时对序列特征数据进行分析处理,以得到相对应的序列信息,全局信息和序列信息为分别通过一定的模型,对全局特征数据和序列特征数据进行学习和编码而得到的,最后将全局信息及序列信息进行信息融合,并且通过融合后的信息来预测到达时间,本公开实施例通过分别对订单和路段进行全局特征数据和序列特征数据的提取,使得在预估到达时间时其结果能够更加的准确。

可以想到地,全局特征数据在反应订单中的信息时,可以针对订单本身涉及到的特征,也可以是针对发生订单时的外界的特征,如发生订单时的天气、时段、星期、订单起点和终端之间的距离等特征,而序列特征数据则针对各个路段的特征,如涉及的路段的名称、限速情况、路段长度、通信速度等。

在本公开实施例中,优选地,提取行程轨迹数据中的全局特征数据及序列特征数据的步骤具体包括:将行程轨迹数据按照订单维度及路段维度进行分类;在订单维度中统计各订单的第一离散特征及第一实数特征组成全局特征数据,且在路段维度中统计各路段的第二离散特征及第二实数特征组成序列特征数据;其中,第一离散特征包括至少一种描述订单的离散数据,第一实数特征包括至少一种描述订单的实数值数据,第二离散特征包括至少一种描述路段的离散名义数据,第二实数特征包括至少一种描述路段的实数值数据。

在该实施例中,在提取行程轨迹数据中的全局特征数据及序列特征数据时,首先会将行程轨迹数据按照订单维度和路段维度进行分类,并且在订单维度中,分别统计第一离散特征和第一实数特征,全局特征数据为由第一离散特征和第一实数特征共同组成,第一离散特征中包括至少一种描述订单的离散数据(稀疏数据),第一实数特征中包括至少一种描述订单的实数值数据,同时在路段维度中统计各路段的第二离散特征及第二实数特征,序列特征数据由第二离散特征及第二实数特征共同组成,第二离散特征包括至少一种描述路段的离散名义数据(稀疏数据),第二实数特征包括至少一种描述路段的实数值数据,使得在后续对全局特征数据及序列特征数据进行处理分析时,能保证对订单及路段都能获取到针对离散数据和实数连续数据两种类型的数据。

图2示出了根据本公开实施例的预估到达时间的方法的流程示意图。如图2所示,本公开实施例提供的一种预估到达时间的方法,预估到达时间的方法包括:

s202,获取不同场景中的各订单的行程轨迹数据;

s204,提取行程轨迹数据中的全局特征数据及序列特征数据,且全局特征数据为针对各订单中包含的信息进行提取的数据,序列特征数据为针对行程轨迹数据中的各路段进行提取的数据;

s206,将全局特征输入wide模型及deep模型分别进行学习,以得到全局信息;

s208,将序列特征输入rnn模型进行学习,以得到序列信息,其中序列信息包含rnn最终时刻的隐状态;

s210,将全局信息及序列信息进行融合并预测到达时间。

在该实施例中,在对全局信息进行处理时,分别对其输入到wide模型及deep模型分别进行学习,在输入至wide模型时,将全局特征数据进行二阶交叉(两两相乘)并进行学习,同时用deep模型基于深层神经网络对全局特征数据进行特征的抽象表示;并且rnn模块对序列特征数据进行学习:按照道路的顺序,将序列特征数据依次输入到rnn中。rnn提取序列的信息,将其编码在最后一个时刻的隐状态中。

在本公开实施例中,一方面可以通过rnn单独针对每条道路进行特征提取建模,进行序列学习,进行序列特征的精细建模,不再局限于整体特征,大大提高了有效特征的范围。另一方面通过wide模型和deep模型提供对全局特征(尤其是稀疏特征)的良好建模,这样使得既可以处理道路的序列化特征,又可以对全局的稀疏特征有良好的建模。

图3示出了根据本公开实施例的预估到达时间的方法的流程示意图。如图3所示,本公开实施例提供的一种预估到达时间的方法,预估到达时间的方法包括:

s302,获取不同场景中的各订单的行程轨迹数据;

s304,提取行程轨迹数据中的全局特征数据及序列特征数据,且全局特征数据为针对各订单中包含的信息进行提取的数据,序列特征数据为针对行程轨迹数据中的各路段进行提取的数据;

s306,将全局特征数据及序列特征数据分别进行处理,得到全局特征数据对应的全局信息及序列特征数据对应的序列信息;

s308,将全局信息和序列信息合并至同一向量中,并将向量输入至神经网络模型,计算得到预测到达时间。

在该实施例中,在最终预测到达时间时,会将rnn最终的隐状态和wide模型、deep模型的对应输出合并成一个向量,然后输入到一个多层感知机(多层神经网络模型)中,在多层感知机中利用融合后的信息,预测到达时间。

在本公开实施例中,优选地,第一离散特征包括以下任一或组合:天气、星期、接单司机、订单地域、下单时段;和/或第一实数特征包括以下任一或组合:订单路程、以订单起点和订单终点为对角线组成的矩形面积;和/或第二离散特征包括以下任一或组合:路段名称、路段编号、路段限速等级;和/或第二实数特征包括以下任一或组合:路段实时通行速度、路段长度、路段宽度。

在该实施例中,第一离散特征可以包括天气、星期、接单司机、订单地域、下单时段等任一数据或任意组合,对于在同一订单中,第一离散特征都为相同值,并且第一离散特征都为不连续的离散数据值;对于第一实数特征可以是订单路程、以订单起点和订单终点为对角线组成的矩形面积等任一数据或任意组合,对于在同一订单中,第一实数特征都为相同值,同时第一实数特征可以为实数域中任意取值;对于第二离散特征可以为路段名称、路段编号、路段限速等级等关于车辆在行驶中涉及的道路的各项数据,在同一道路中,第二离散特征都为相同值,并且第二离散特征都为不连续的离散数据值;第二实数特征可以为路段实时通行速度(其间接反应路段拥堵情况)、路段长度、路段宽度等数据,对于同一道路中,第二实数特征都为相同值,同时第二实数特征可以为实数域中任意取值。

如图4所示为本公开实施例的一个方面提供预估到达时间的方法的一个流程示意图。

图5示出了根据本公开实施例的预估到达时间的系统100的框架示意图。如图5所示,本公开实施例提供的一种预估到达时间的系统100,包括:

获取单元102,用于获取不同场景中的各订单的行程轨迹数据;

提取单元104,用于提取行程轨迹数据中的全局特征数据及序列特征数据,且全局特征数据为针对各订单中包含的信息进行提取,序列特征数据为针对行程轨迹数据中的各路段进行提取;

处理单元106,用于将全局特征数据及序列特征数据分别进行处理,得到全局特征对应的全局信息及序列特征对应的序列信息;

预设单元108,用于将全局信息及序列信息进行融合并预测到达时间。

根据本公开实施例提供的预估到达时间的系统,首先获取单元102获取不同场景中的各订单的行程轨迹数据,同时可以对提取的行程轨迹数据进行清洗、去除噪声,以提高数据的真实可信度;随后通过提取单元104在行程轨迹数据中提取全局特征数据和序列特征数据,此时的全局特征数据为针对各订单中包含的信息进行提取的数据,将整个订单作为整体,提取能反应订单的特征数据,序列特征数据则为针对行程轨迹数据中的各路段进行提取的数据,序列特征数据会将行程轨迹数据中各个路段进行单独提取分析,使得各个路段中涉及的数据都能被分别标注提取出;随后通过处理单元106将全局特征数据进行分析处理,以得到相对应的全局信息,同时对序列特征数据进行分析处理,以得到相对应的序列信息,全局信息和序列信息为分别通过一定的模型,对全局特征数据和序列特征数据进行学习和编码而得到的,最后通过预设单元108将全局信息及序列信息进行信息融合,并且通过融合后的信息来预测到达时间,本公开实施例通过分别对订单和路段进行全局特征数据和序列特征数据的提取,使得在预估到达时间时其结果能够更加的准确。

可以想到地,全局特征数据在反应订单中的信息时,可以针对订单本身涉及到的特征,也可以是针对发生订单时的外界的特征,如发生订单时的天气、时段、星期、订单起点和终端之间的距离等特征,而序列特征数据则针对各个路段的特征,如涉及的路段的名称、限速情况、路段长度、通信速度等。

在本公开实施例中,优选地,提取单元具体包括:分类子单元,用于将行程轨迹数据按照订单维度及路段维度进行分类;提取子单元,用于在订单维度中统计各订单的第一离散特征及第一实数特征组成全局特征数据,且在路段维度中统计各路段的第二离散特征及第二实数特征组成序列特征数据;其中,第一离散特征包括至少一种描述订单的离散数据,第一实数特征包括至少一种描述订单的实数值数据,第二离散特征包括至少一种描述路段的离散名义数据,第二实数特征包括至少一种描述路段的实数值数据。

在该实施例中,在提取单元提取行程轨迹数据中的全局特征数据及序列特征数据时,首先分类子单元会将行程轨迹数据按照订单维度和路段维度进行分类,并且提取子单元会在订单维度中,分别统计第一离散特征和第一实数特征,全局特征数据为由第一离散特征和第一实数特征共同组成,第一离散特征中包括至少一种描述订单的离散数据(稀疏数据),第一实数特征中包括至少一种描述订单的实数值数据,同时提取子单元会在路段维度中统计各路段的第二离散特征及第二实数特征,序列特征数据由第二离散特征及第二实数特征共同组成,第二离散特征包括至少一种描述路段的离散名义数据(稀疏数据),第二实数特征包括至少一种描述路段的实数值数据,使得在后续对全局特征数据及序列特征数据进行处理分析时,能保证对订单及路段都能获取到针对离散数据和实数连续数据两种类型的数据。

图6示出了根据本公开实施例的预估到达时间的系统200的框架示意图。如图6所示,本公开实施例提供的一种预估到达时间的系统200,包括:

获取单元202,用于获取不同场景中的各订单的行程轨迹数据;

提取单元204,用于提取行程轨迹数据中的全局特征数据及序列特征数据,且全局特征数据为针对各订单中包含的信息进行提取,序列特征数据为针对行程轨迹数据中的各路段进行提取;

处理单元206,用于将全局特征数据及序列特征数据分别进行处理,得到全局特征对应的全局信息及序列特征对应的序列信息;

预设单元208,用于将全局信息及序列信息进行融合并预测到达时间;其中,处理单元206具体包括:

第一处理子单元210,用于将全局特征输入wide模型及deep模型分别进行学习,以得到全局信息;

第二处理子单元212,用于将序列特征输入rnn模型进行学习,以得到序列信息,其中序列信息包含rnn最终时刻的隐状态。

在该实施例中,在处理单元206对全局信息进行处理时,第一处理子单元210分别对其输入到wide模型及deep模型分别进行学习,在输入至wide模型时,将全局特征数据进行二阶交叉(两两相乘)并进行学习,同时用deep模型基于深层神经网络对全局特征数据进行特征的抽象表示;并且第二处理子单元212通过rnn模块对序列特征数据进行学习:按照道路的顺序,将序列特征数据依次输入到rnn中。rnn提取序列的信息,将其编码在最后一个时刻的隐状态中。

在本公开实施例中,一方面可以通过rnn单独针对每条道路进行特征提取建模,进行序列学习,进行序列特征的精细建模,不再局限于整体特征,大大提高了有效特征的范围。另一方面通过wide模型和deep模型提供对全局特征(尤其是稀疏特征)的良好建模,这样使得既可以处理道路的序列化特征,又可以对全局的稀疏特征有良好的建模。

在本公开实施例中,优选地,预设单元具体用于将全局信息和序列信息合并至同一向量中,并将向量输入至神经网络模型,计算得到预测到达时间。

在该实施例中,在最终预测到达时间时,预设单元会将rnn最终的隐状态和wide模型、deep模型的对应输出合并成一个向量,然后输入到一个多层感知机(多层神经网络模型)中,在多层感知机中利用融合后的信息,预测到达时间。

在本公开实施例中,优选地,第一离散特征包括以下任一或组合:天气、星期、接单司机、订单地域、下单时段;和/或第一实数特征包括以下任一或组合:订单路程、以订单起点和订单终点为对角线组成的矩形面积;和/或第二离散特征包括以下任一或组合:路段名称、路段编号、路段限速等级;和/或第二实数特征包括以下任一或组合:路段实时通行速度、路段长度、路段宽度。

在该实施例中,第一离散特征可以包括天气、星期、接单司机、订单地域、下单时段等任一数据或任意组合,对于在同一订单中,第一离散特征都为相同值,并且第一离散特征都为不连续的离散数据值;对于第一实数特征可以是订单路程、以订单起点和订单终点为对角线组成的矩形面积等任一数据或任意组合,对于在同一订单中,第一实数特征都为相同值,同时第一实数特征可以为实数域中任意取值;对于第二离散特征可以为路段名称、路段编号、路段限速等级等关于车辆在行驶中涉及的道路的各项数据,在同一道路中,第二离散特征都为相同值,并且第二离散特征都为不连续的离散数据值;第二实数特征可以为路段实时通行速度(其间接反应路段拥堵情况)、路段长度、路段宽度等数据,对于同一道路中,第二实数特征都为相同值,同时第二实数特征可以为实数域中任意取值。

根据本公开实施例的第三个方面提供了一种计算机装置,计算机装置包括处理器,处理器用于执行存储器中存储的计算机程序时实现如上述任一技术方案的预估到达时间的方法,因此,该计算机装置具有上述任一技术方案的预估到达时间的方法的全部有益效果。

图7示出了根据本公开实施例的一个实施例提供的计算机设备的结构示意图。

如图7所示,根据本公开实施例的一个实施例的计算机设备1包括:存储器12、处理器14及存储在存储器12上并可在处理器14上运行的计算机程序,处理器14执行计算机程序时实现上述任一技术方案的预估到达时间的方法。

根据本公开实施例的第四个方面提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述任一技术方案的预估到达时间的方法,因此,该计算机可读存储介质具有如上述任一技术方案的预估到达时间的方法的全部有益效果。

在本说明书的描述中,术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本公开实施例和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本公开实施例的限制;术语“连接”、“安装”、“固定”等均应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本公开实施例中的具体含义。

在本说明书的描述中,术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本公开实施例的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上仅为本公开实施例的优选实施例而已,并不用于限制本公开实施例,对于本领域的技术人员来说,本公开实施例可以有各种更改和变化。凡在本公开实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开实施例的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1