交通数据预测方法及装置与流程

文档序号:12819888阅读:472来源:国知局
交通数据预测方法及装置与流程

本发明涉及智能交通技术领域,特别是涉及一种交通数据预测方法及装置。



背景技术:

随着社会经济和交通运输业的不断发展,交通拥挤等交通问题越来越凸现出来,成了全球共同关注的问题。对于交通数据的预测不仅是城市交通控制与诱导的基础,还是解决道路拥堵问题的关键技术之一。交通数据的预测是智能交通系统的重要组成部分,交通数据预测能够通过目前已知的交通数据,合理地推算未来一段时间段内的交通状况。如果能精确的预测交通网中各个路段的汽车流量,那么我们可以运用规划方法对交通流进行合理的优化,从而使得道路的利用率达到最大,也可以解决部分拥堵问题。

现有的交通数据预测方法中,常采用短时交通预测模型来预测交通流量。通过使用短时交通数据预测模型来预测交通数据,可以有效地对待测路段在未来一定时间段内交通流量进行预测。但是,现有的交通流预测方法只利用一种方式获取历史交通数据,并利用获取的历史交通数据来预测未来一定时间段内的交通数据。而在实际应用中,由于交通数据具有复杂性和随机性,采用通过一种方式获取的历史交通数据来进行交通数据的预测,预测结果不准确,误差较大。



技术实现要素:

本发明实施例的目的在于提供一种交通数据预测方法及装置,以提高交通数据预测的准确性。具体技术方案如下:

第一方面,本发明提供了一种交通数据预测方法,应用于服务器,所述方法包括:

根据设定时间长度内时间段的划分规则,确定当前时间段、当前时间段之前的每个时间段对应的维度;

采用k近邻knn算法在历史数据库中,查找与该当前时间段及该当前时间段之前的每个时间段获取到的交通数据距离临近的k组历史交通数据,其中所述历史数据库中保存有多个该设定时间长度内每个维度对应获取到的历史交通数据,所述交通数据为采用至少两种方式获取的初始交通数据经处理后得到的,k为大于零的整数;

根据当前时间段的维度,确定该当前时间段的下一时间段的第一维度;

根据k组历史交通数据中该第一维度对应获取到的历史交通数据,预测该当前时间段的下一时间段的交通数据。

进一步地,所述查找与该当前时间段及该当前时间段之前的每个时间段获取到的交通数据距离临近的k组历史交通数据,包括:

根据当前时间段及该当前时间段之前的每个时间段对应的维度、每个维度获取的交通数据,确定该组交通数据;

根据该组交通数据及历史数据库中保存的多个设定时间长度内对应维度的每组历史交通数据,计算该组交通数据与历史数据库中每组历史交通数据的距离;

在获取的距离中,将最小的预定数量的距离对应的历史交通数据加入到所述k组历史交通数据中。

进一步地,所述根据k组历史交通数据中该第一维度对应获取到的历史交通数据,预测该当前时间段的下一时间段的交通数据,包括:

计算所述k组历史交通数据中所述第一维度对应获取到的历史交通数据的算术平均值;

确定所计算得到的算术平均值为所述该当前时间段的下一时间段的交通数据。

进一步地,通过如下步骤,预先保存该设定时间长度内每个维度对应获取的历史交通数据:

采用至少两种方式,获取该设定时间长度内每个维度对应的至少两种初始交通数据;

对每个维度对应的至少两种初始交通数据进行处理,获取每个维度的历史交通数据并保存。

进一步地,当初始交通数据包括初始牌识数据、初始固定源数据和初始浮动车数据时,所述对每个维度对应的至少两种初始交通数据进行处理,获取每个维度的历史交通数据并保存,包括:

针对每个维度,根据初始牌识数据中每个车辆的车牌号、每个车牌号的车辆出现在每个卡口的时间,确定每个维度的车辆的第一平均速度;

针对每个维度,根据初始固定源数据中包含的每个车辆的第二速度,确定每个维度的车辆的第二平均速度,并根据所述初始固定源数据中包含的总车辆数量以及检测到的车辆在设定位置的时间,确定每个维度车流量和时间占有率;

针对每个维度,根据初始浮动车数据中包含的车辆的实时速度信息,确定每个维度的车辆的第三平均速度;

针对每个维度,根据该维度的车辆的第一平均速度、第二平均速度以及第三平均速度,确定该维度的速度均值;

针对每个维度,在历史数据库中保存该维度的速度均值、车流量和时间占有率。

进一步地,根据该维度的车辆的第一平均速度、第二平均速度以及第三平均速度,确定该维度的速度均值,包括:

识别第一平均速度、第二平均速度和第三平均速度中的小于设定的速度阈值的每个平均速度;

根据小于设定的速度阈值的每个平均速度,确定该维度的速度均值。

进一步地,所述对每个维度对应的至少两种初始交通数据进行处理之前,还包括:

对每个维度对应的至少两种初始交通数据进行过滤。

进一步地,所述对每个维度对应的至少两种初始交通数据进行处理包括:

对每个维度对应的至少两种初始交通数据进行分布式处理。

第二方面,本发明提供了一种交通数据预测装置,应用于服务器,所述装置包括:

第一确定模块,用于根据设定时间长度内时间段的划分规则,确定当前时间段、当前时间段之前的每个时间段对应的维度;

查找模块,用于采用k近邻knn算法在历史数据库中,查找与该当前时间段及该当前时间段之前的每个时间段获取到的交通数据距离临近的k组历史交通数据,其中所述历史数据库中保存有多个该设定时间长度内每个维度对应获取到的历史交通数据,所述交通数据为采用至少两种方式获取的初始交通数据经处理后得到的,k为大于零的整数;

第二确定模块,用于根据当前时间段的维度,确定该当前时间段的下一时间段的第一维度;

预测模块,用于根据k组历史交通数据中该第一维度对应获取到的历史交通数据,预测该当前时间段的下一时间段的交通数据。

进一步地,所述查找模块具体用于:

根据当前时间段及该当前时间段之前的每个时间段对应的维度、每个维度获取的交通数据,确定该组交通数据;

根据该组交通数据及历史数据库中保存的多个设定时间长度内对应维度的每组历史交通数据,计算该组交通数据与历史数据库中每组历史交通数据的距离;

在获取的距离中,将最小的预定数量的距离对应的历史交通数据加入到所述k组历史交通数据中。

进一步地,所述预测模块具体用于:

计算所述k组历史交通数据中所述第一维度对应获取到的历史交通数据的算术平均值;

确定所计算得到的算术平均值为所述该当前时间段的下一时间段的交通数据。

进一步地,所述装置还包括:存储模块;

所述存储模块包括:

获取子模块,用于采用至少两种方式,获取该设定时间长度内每个维度对应的至少两种初始交通数据;

处理子模块,用于对每个维度对应的至少两种初始交通数据进行处理,获取每个维度的历史交通数据并保存。

进一步地,当初始交通数据包括初始牌识数据、初始固定源数据和初始浮动车数据时,所述处理子模块包括:

第一确定子单元,用于针对每个维度,根据初始牌识数据中每个车辆的车牌号、每个车牌号的车辆出现在每个卡口的时间,确定每个维度的车辆的第一平均速度;

第二确定子单元,用于针对每个维度,根据初始固定源数据中包含的每个车辆的第二速度,确定每个维度的车辆的第二平均速度,并根据所述初始固定源数据中包含的总车辆数量以及检测到的车辆在设定位置的时间,确定每个维度车流量和时间占有率;

第三确定子单元,用于针对每个维度,根据初始浮动车数据中包含的车辆的实时速度信息,确定每个维度的车辆的第三平均速度;

第四确定子单元,用于针对每个维度,根据该维度的车辆的第一平均速度、第二平均速度以及第三平均速度,确定该维度的速度均值;

保存子单元,用于针对每个维度,在历史数据库中保存该维度的速度均值、车流量和时间占有率。

进一步地,所述第四确定子单元具体用于:

识别第一平均速度、第二平均速度和第三平均速度中的小于设定的速度阈值的每个平均速度;

根据小于设定的速度阈值的每个平均速度,确定该维度的速度均值。

进一步地,所述装置还包括:

过滤模块,用于在对每个维度对应的至少两种初始交通数据进行处理之前,对每个维度对应的至少两种初始交通数据进行过滤。

进一步地,所述处理子模块,具体用于:

对每个维度对应的至少两种初始交通数据进行分布式处理,获取每个维度的历史交通数据并保存。

本发明实施例提供的交通数据预测方法及装置,通过至少两种方式获取各时间段的初始交通数据,并将多种初始交通数据处理后得到对应各时间段的交通数据,能够提高获取的交通数据的准确性。在进行交通数据预测时,通过在历史交通数据库中查找与当前时间段及当前时间段之前的多个时间段对应的历史交通数据,预测当前时间段下一个时间段的交通数据,能够提高交通数据预测的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示出了根据本发明提供的交通数据预测方法的一个实施例的示意性流程图;

图2示出了图1所示实施例中预先保存设定时间长度内每个维度对应获取的历史交通数据的方法的示意性流程图;

图3示出了根据本发明提供的交通数据预测装置的一个实施例的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征 可以相互组合。下面将参考附图并结合实施例来详细说明本发明。

请参考图1,其示出了根据本发明提供的交通数据预测方法的一个实施例的示意性流程图。

如图1所示,本实施例提供的交通数据预测方法,应用于服务器,可以包括如下步骤:

步骤101,根据设定时间长度内时间段的划分规则,确定当前时间段、当前时间段之前的每个时间段对应的维度。

为了给用户合理规划出行路线,服务器可以进行交通数据预测。例如,可以根据已知的当前时间段、当前时间段之前的每个时间段的交通数据,并结合历史数据库中保存的历史交通数据预测下一时间段的交通数据。

可以理解,服务器可以对各路段、各时间长度内的交通数据进行预测。在本实施例中,为了便于描述,以对任一路段、任一时间长度内的交通数据进行预测来说明本实施例提供的交通数据预测方法。

在本发明实施例中针对该设定时间长度内的交通数据进行预测,该设定时间长度是固定的,可以是一天,也可以是一天里的一个时间段,例如10:00-15:00,或者是高峰时段7:00-9:00、17:00-19:00等。相应的历史数据库中保存有预先采集的多组历史交通数据,每组历史交通数据为该设定时间长度内获取的交通数据。

为了方便预测,将该设定时间长度按照划分规则,划分为多个时间段,其中该划分规则可以是按照时间段的长度进行划分,例如按照每5分钟、10分钟为一个时间段,将该设定时间长度划分为多个时间段。为了便于后续的计算,该设定时间长度相同,时间段的划分规则相同,因此可以为每一时间段赋予唯一的维度,例如将一天按照每5分钟划分为一个时间段,则一天可以划分为288个时间段,则每个时间段的维度分别为1、2、3、……、288等。

步骤102,采用k近邻knn算法在历史数据库中,查找与该当前时间段及该当前时间段之前的每个时间段获取到的交通数据距离临近的k组历史交通数据,其中所述历史数据库中保存有多个该设定时间长度内每个维度对应获取到的历史交通数据,所述交通数据为采用至少两种方式获取的初始交通数据 经处理后得到的,k为大于零的整数。

确定当前时间段、当前时间段之前的每个时间段对应的维度后,可以采用k近邻knn算法在历史数据库中,查找与该当前时间段及该当前时间段之前的每个时间段获取到的交通数据距离临近的k组历史交通数据,以对当前时间段的下一个时间段的交通数据进行预测。

在本发明实施例中,在历史数据库中保存有大量的历史交通数据,该历史交通数据为设定时间长度内按照划分规则,划分得到的每个时间段监测的历史交通数据。

在对各路段进行交通数据预测时,为了提高预测效率,可以针对每个路段分别建立其对应的历史数据库;或者将针对每个路段的历史数据都保存在同一历史数据库中,每个路段的历史数据采用该路段的标识信息进行标识。当针对某一路段进行交通数据预测时,根据该路段的标识信息到历史数据库中查找该标识信息对应的历史交通数据。

为了便于区分,在本发明实施例以及之后的实施例中,将历史数据库中保存的交通数据称为历史交通数据。

另外,当前时间段及该当前时间段之前的每个时间段获取到的交通数据,以及历史交通数据的准确性对交通数据预测结果的准确性有很大的影响。获取的交通数据准确性越高,预测的交通数据也越准确。因此,为了提高交通数据预测的准确性,在本实施例中,可以采用至少两种方式获取初始交通数据,将初始交通数据处理后得到交通数据。

例如,可以通过利用视频采集设备、速度检测仪、安装于车辆上的gps等方式获取初始交通数据。初始交通数据可以包括各车辆速度。可选地,初始交通数据还可以包括:总车辆数量、检测到的车辆在设定位置的时间等。相应的,将初始交通数据处理后得到的交通数据可以包括车辆平均速度。可选地,交通数据还可以包括:车流量、时间占有率等。

knn算法是一种数据挖掘方法,knn算法的核心思想是如果一个样本的特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有该类别所属的特征。

具体地,可以根据以下步骤查找与该当前时间段及该当前时间段之前的每个时间段获取到的交通数据距离临近的k组历史交通数据:根据当前时间段及该当前时间段之前的每个时间段对应的维度、每个维度获取的交通数据,确定该组交通数据;根据该组交通数据及历史数据库中保存的多个设定时间长度内对应维度的每组历史交通数据,计算该组交通数据与历史数据库中每组历史交通数据的距离;在获取的距离中,将最小的预定数量(如10、20、30等)的距离对应的历史交通数据加入到所述k组历史交通数据中。

采用knn算法在历史数据库中,查找与该当前时间段及该当前时间段之前的每个时间段监测的交通数据距离临近的k组历史交通数据时,将每个设定时间长度的每个时间段监测的交通数据称为一组历史交通数据,确定该组历史交通数据的标识信息,即该组的标识信息,确定该当前时间段及该当前时间段之前的每个时间段监测的交通数据及历史数据库中每组历史交通数据的欧式距离,即可查找到与该当前时间段及该当前时间段之前的每个时间段监测的交通数据距离临近的k组历史交通数据,可以根据其中dk为与第k组历史交通数据的距离,hik为第k组历史交通数据的第i维历史交通数据,ci为第i个时间段监测的交通数据,当前时间段为第m个时间段。

步骤103,根据当前时间段的维度,确定该当前时间段的下一时间段的第一维度。

在设定时间长度内根据时间段的划分规则,将该设定时间长度划分为多个时间段,并确定每个时间段对应的维度。无论是预测的过程,还是针对获取的历史交通数据,对设定时间长度都是按照相同的划分规则进行划分的,并且每个对应时间段的维度都是相同的。因此确定了该当前时间段的下一时间段的第一维度后,即可确定该历史数据库中对应的该第一维度监测的历史交通数据。

步骤104,根据k组历史交通数据中该第一维度对应获取到的历史交通数 据,预测该当前时间段的下一时间段的交通数据。

当确定当前时间段的下一时间段的第一维度后,可以根据k组历史交通数据中该第一维度对应获取到的历史交通数据,预测该当前时间段的下一时间段的交通数据。由于k组历史交通数据为与当前时间段及当前时间段之前的每一时间段获取的交通数据距离邻近的历史交通数据。也就是说,在历史数据库中保存的多组该设定时间长度内的历史交通数据中,这k组历史交通数据是与当前时间段及当前时间段之前的多个时间段获取的交通数据最接近的。因此,可以利用k组历史交通数据中该第一维度对应获取到的历史交通数据,预测该当前时间段的下一时间段的交通数据。

在本实施例的一种实现方式中,可以首先计算k组历史交通数据中第一维度对应获取到的历史交通数据的算术平均值,然后将所计算得到的算术平均值确定为该当前时间段的下一时间段的交通数据。

优选地或附加地,由于k组历史交通数据中每一组历史交通数据与该当前时间段及该当前时间段之前的每个时间段获取到的交通数据的距离是不完全相同的,因此,为了提高预测效率,可以根据k组历史交通数据中每一组历史交通数据与该当前时间段及该当前时间段之前的每个时间段获取到的交通数据的距离,计算k组历史交通数据中每一组历史交通数据的权重系数。进一步地,根据各组历史交通数据与对应的权重系数,预测当前时间段的下一时间段的交通数据。

例如,每个时间段获取的交通数据与历史数据库中对应组的历史交通数据的距离越小,说明两者之间的相似度越高,相应的,在预测时,该组在预测过程中的权重系数应该较大。因此,在一种实现方式中,可以利用各距离值的倒数来表示各组的权重系数。

本实施例提供的交通数据预测方法,通过至少两种方式获取各时间段的初始交通数据,并将多种初始交通数据处理后得到对应各时间段的交通数据,能够提高获取的交通数据的准确性。在进行交通数据预测时,通过在历史交通数据库中查找与当前时间段及当前时间段之前的多个时间段对应的历史交通数据,预测当前时间段下一个时间段的交通数据,能够提高交通数据预测的准确性。

在图1所示实施例的基础上,本发明还提供了另外一种实施方式,如图2所示,其示出了预先保存设定时间长度内每个维度对应获取的历史交通数据的方法的示意性流程图。

如图2所示,本实施例提供的预先保存设定时间长度内每个维度对应获取的历史交通数据的方法,应用于服务器,可以包括如下步骤:

步骤201,采用至少两种方式,获取该设定时间长度内每个维度对应的至少两种初始交通数据。

在本实施例中,为了提高交通数据预测的准确性,可以采用多种方式获取该设定时间长度内每个维度对应的至少两种初始交通数据。具体地,可以采用至少两种方式获取该设定时间长度内每个维度对应的至少两种初始交通数据。

例如,可以通过在各路口设置视频采集装置的方式获取初始交通数据;或者,通过在各路段设置固定源检测器的方式获取初始交通数据;也可以通过设置在车辆上的设备获取初始交通数据。获取的初始交通数据可以为包含每个车辆的车牌号、每个车牌号的车辆出现在每个卡口的时间的初始牌识数据,或者,初始交通数据可以为包含每个车辆速度、总车辆数量以及检测到的车辆在设定位置的时间的初始牌识数据,初始交通数据还可以为包含各车辆实时速度信息的初始浮动车数据。

步骤202,对每个维度对应的至少两种初始交通数据进行处理,获取每个维度的历史交通数据并保存。

获取到该设定时间长度内每个维度对应的至少两种初始交通数据后,可以进一步地对每个维度对应的至少两种初始交通数据进行处理,并且将处理后的数据进行融合,获取每个维度的历史交通数据并保存。

在本实施例中,针对每个维度都获取至少两种初始交通数据,由于每种初始交通数据的数据源都比较庞大,对服务器的性能要求较高,当在一台服务器上对所有的初始交通数据进行处理时,可以会导致数据处理比较慢。因此,为了提高数据处理速度,可以对初始交通数据进行分布式处理。例如,当初始交通数据包含初始牌识数据、初始固定源数据和初始浮动车数据时,可以通过3台服务器分别对初始牌识数据、初始固定源数据和初始浮动车数据进行处理。

可选地或附加地,为了提高交通数据预测的准确性,对每个维度对应的至少两种初始交通数据进行处理之前,还可以对每个维度对应的至少两种初始交通数据进行过滤,如,过滤掉无法识别的车牌等数据。

作为一种示例,当初始交通数据包括初始牌识数据、初始固定源数据和初始浮动车数据时,对每个维度对应的至少两种初始交通数据进行处理,获取每个维度的历史交通数据并保存,可以包括:

针对每个维度,根据初始牌识数据中每个车辆的车牌号、每个车牌号的车辆出现在每个卡口的时间,确定每个维度的车辆的第一平均速度;

针对每个维度,根据初始固定源数据中包含的每个车辆的第二速度,确定每个维度的车辆的第二平均速度,并根据所述初始固定源数据中包含的总车辆数量以及检测到的车辆在设定位置的时间,确定每个维度车流量和时间占有率;

针对每个维度,根据初始浮动车数据中包含的车辆的实时速度信息,确定每个维度的车辆的第三平均速度;

针对每个维度,根据该维度的车辆的第一平均速度、第二平均速度以及第三平均速度,确定该维度的速度均值;

针对每个维度,在历史数据库中保存该维度的速度均值、车流量和时间占有率。

在本实施例中,针对每个维度,都获取了初始牌识数据、初始固定源数据和初始浮动车数据这3种初始交通数据。服务器可以分别根据这3中初始交通数据计算相应的交通数据,然后将计算得到的交通数据融合,得到各维度对应的历史交通数据,并将其保存在历史数据库中。

针对每个维度,可以根据该维度内初始牌识数据中每个车辆的车牌号、每个车牌号的车辆出现在每个卡口的时间,确定每个维度的车辆的第一平均速度。获取到包含每个车辆的车牌号、每个车牌号的车辆出现在每个卡口的时间后,可以对每辆车经过各卡口的时间进行排序,从而计算出每辆车通过每两个卡口之间的时间。然后通过路网拓扑数据获取每两个卡口之间的距离,从而根据每两个卡口之间的距离以及各车辆经过对应每两个卡口之间的时间,计算出 各车辆的平均速度。根据该维度内每辆车的平均速度,可以计算该维度的车辆的第一平均速度。

针对每个维度,还可以根据初始固定源数据中包含的每个车辆的第二速度,确定每个维度的车辆的第二平均速度,并根据初始固定源数据中包含的总车辆数量以及检测到的车辆在设定位置的时间,确定每个维度车流量和时间占有率。在获取初始固定源数据时,可以通过设置在预定位置处的多种传感器(如线圈检测器、微波检测器等)获取检测到的车辆的速度、总车辆数量以及检测到的车辆在设定位置的时间。得到初始固定源数据后,可以根据初始固定源数据中包含的每个车辆的第二速度,计算每个维度的车辆的第二平均速度。将初始固定源数据中包含的总车辆数量确定为该维度的车流量。还可以通过检测到的车辆在设定位置的时间除以每个维度的时间长度,得到对应每个维度的时间占有率。

针对每个维度,还可以根据初始浮动车数据中包含的车辆的实时速度信息,确定每个维度的车辆的第三平均速度。在一些车辆(如公交车、出租车等)中,可以安装有预定的设备,用来检测车辆的实时速度信息。针对每个维度,获得车辆的实时速度信息后,可以根据该维度的时间长度,计算该维度的车辆的第三平均速度。可选地,针对各路段进行交通数据预测时,为了将初始浮动车数据与经过国家加密的地图进行匹配,可以首先对初始浮动车数据进行火星坐标加密,然后进行坐标转换,以确定初始浮动车数据中各车辆出现的路段位置,进而可以计算得到每个维度中各路段的车辆的第三平均速度。

得到每个维度的车辆的第一平均速度、第二平均速度以及第三平均速度后,可以根据该维度的车辆的第一平均速度、第二平均速度以及第三平均速度,确定该维度的速度均值。在一种实现方式中,为了提高交通数据预测的准确性,可以对每个维度的车辆的第一平均速度、第二平均速度以及第三平均速度进行过滤。如,针对每个维度,可以识别第一平均速度、第二平均速度和第三平均速度中的小于设定的速度阈值的每个平均速度。然后可以根据小于设定的速度阈值的每个平均速度,确定该维度的速度均值。

本实施例提供的预先保存设定时间长度内每个维度对应获取的历史交通数据的方法,能够采用至少两种方式,获取设定时间长度内每个维度对应的至少两种初始交通数据,然后对每个维度对应的至少两种初始交通数据进行处 理,获取每个维度的历史交通数据并保存,能够提高获取的历史交通数据的准确性。并且,在进行交通数据预测时,通过在历史数据库中查找与当前时间段及当前时间段之前的多个时间段对应的历史交通数据,预测当前时间段下一个时间段的交通数据,提高了交通数据预测的准确性。

请参考图3,其示出了根据本发明提供的交通数据预测装置的一个实施例的结构示意图。

如图3所示,本实施例提供的交通数据预测装置,应用于服务器,可以包括:第一确定模块310、查找模块320、第二确定模块330以及预测模块340。

第一确定模块310,用于根据设定时间长度内时间段的划分规则,确定当前时间段、当前时间段之前的每个时间段对应的维度;

查找模块320,用于采用k近邻knn算法在历史数据库中,查找与该当前时间段及该当前时间段之前的每个时间段获取到的交通数据距离临近的k组历史交通数据,其中历史数据库中保存有多个该设定时间长度内每个维度对应获取到的历史交通数据,k为大于零的整数,交通数据为采用至少两种方式获取的初始交通数据经处理后得到的;

第二确定模块330,用于根据当前时间段的维度,确定该当前时间段的下一时间段的第一维度;

预测模块340,用于根据k组历史交通数据中该第一维度对应获取到的历史交通数据,预测该当前时间段的下一时间段的交通数据。

进一步地,查找模块320具体用于:

根据当前时间段及该当前时间段之前的每个时间段对应的维度、每个维度获取的交通数据,确定该组交通数据;

根据该组交通数据及历史数据库中保存的多个设定时间长度内对应维度的每组历史交通数据,计算该组交通数据与历史数据库中每组历史交通数据的距离;

在获取的距离中,将最小的预定数量的距离对应的历史交通数据加入到所述k组历史交通数据中。

进一步地,预测模块340具体用于:

计算k组历史交通数据中第一维度对应获取到的历史交通数据的算术平均值;

确定所计算得到的算术平均值为该当前时间段的下一时间段的交通数据。

进一步地,所述装置还包括:

过滤模块(未示出),用于在对每个维度对应的至少两种初始交通数据进行处理之前,对每个维度对应的至少两种初始交通数据进行过滤。

在本实施例的一个可选实现方式中,所述装置还包括:存储模块(未示出);

所述存储模块包括:

获取子模块,用于采用至少两种方式,获取该设定时间长度内每个维度对应的至少两种初始交通数据;

处理子模块,用于对每个维度对应的至少两种初始交通数据进行处理,获取每个维度的历史交通数据并保存。

进一步地,当初始交通数据包括初始牌识数据、初始固定源数据和初始浮动车数据时,所述处理子模块包括:

第一确定子单元,用于针对每个维度,根据初始牌识数据中每个车辆的车牌号、每个车牌号的车辆出现在每个卡口的时间,确定每个维度的车辆的第一平均速度;

第二确定子单元,用于针对每个维度,根据初始固定源数据中包含的每个车辆的第二速度,确定每个维度的车辆的第二平均速度,并根据初始固定源数据中包含的总车辆数量以及检测到的车辆在设定位置的时间,确定每个维度车流量和时间占有率;

第三确定子单元,用于针对每个维度,根据初始浮动车数据中包含的车辆的实时速度信息,确定每个维度的车辆的第三平均速度;

第四确定子单元,用于针对每个维度,根据该维度的车辆的第一平均速度、第二平均速度以及第三平均速度,确定该维度的速度均值;

保存子单元,用于针对每个维度,在历史数据库中保存该维度的速度均值、车流量和时间占有率。

进一步地,所述第四确定子单元具体用于:

识别第一平均速度、第二平均速度和第三平均速度中的小于设定的速度阈值的每个平均速度;

根据小于设定的速度阈值的每个平均速度,确定该维度的速度均值。

进一步地,所述处理子模块,具体用于:

对每个维度对应的至少两种初始交通数据进行分布式处理,获取每个维度的历史交通数据并保存。

本实施例提供的交通数据预测装置,通过至少两种方式获取各时间段的初始交通数据,并将多种初始交通数据处理后生成对应各时间段的交通数据,能够提高获取的交通数据的准确性。在进行交通数据预测时,通过在历史交通数据库中查找与当前时间段及当前时间段之前的多个时间段对应的历史交通数据,预测当前时间段下一个时间段的交通数据,能够提高交通数据预测的准确性。

对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的 比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1