交通路况预测方法及装置与流程

文档序号:11546061阅读:310来源:国知局
交通路况预测方法及装置与流程

本发明涉及交通数据处理领域及智能交通领域,尤其涉及一种交通路况预测方法及装置。



背景技术:

随着城市汽车保有量的不断提高,城市交通拥堵、交通事故等问题愈发受到交通管理人员及参与者的关注。为了缓解交通压力,提高交通运行效率,交通领域相关人员在现有技术的基础上,提出了多种辅助思路。其中交通路况预测对于改善交通现状有着重要意义。交通路况预测一方面可以指导交通出行人员合理规划出行路径,避免拥堵区域;另一方面可以为交通管理者指定交通管理措施提供可靠的参考,从而有效的避免大范围交通拥堵的产生,提高交通出行效率。

当前常用的技术手段中,存在利用实时获取的交通路况数据进行短时交通路况预测方法,及利用当前实时数据和历史数据相似度进行计算的长时交通流量预测算法,此两种算法对实时数据都有一定的依赖性,且预测输入复杂,难以从日期属性数据(如星期属性、天气属性)上体现交通路况变化规律,因此对以日期属性数据为基础的道路交通路况预测算法进行研究,有着显著意义。



技术实现要素:

本发明的目的是提供一种基于历史数据及日期属性数据的交通路况预测方法及装置,用于解决现有技术交通路况预测对实时数据有一定的依赖性,预测输入复杂,难以从日期属性数据(如星期属性、天气属性)上体现交通路况变化的规律的问题。

为实现上述目的,本发明实施例提供了一种交通路况预测方法,包括:获取一特定道路的历史路况数据;获取所述道路的与交通路况相关的历史日期属性数据和待预测日期对应的日期属性数据;其特征在于:

对于所述道路生成历史路况数据中不同日期间的路况相似度评估数据;

以所述历史路况相似度评估数据及其日期属性数据为基础,训练相似度分类预测模型以获得相应路况预测模型;

基于所述路况预测模型,待预测日期对应的日期属性数据、历史日期属性数据及历史路况数据,进行待预测日期的路况预测。

本发明实施例还提供了一种交通路况预测装置,包括:第一路况数据获取模块,用于获取一特定道路的历史路况数据;第一日期属性数据获取模块,用于获取所述道路与交通路况相关的历史日期属性数据及待预测日期对应的日期属性数据;其特征在于,还包括:

第一路况相似度评估模块,用于对于所述道路生成历史路况数据中不同日期间的路况相似度评估数据;

第一模型训练模块,用于以所述历史路况相似度评估数据及日期属性数据为基础,训练相似度分类预测模型以获得相应路况预测模型;

第一路况预测模块,用于基于所述路况预测模型,待预测日期对应的日期属性数据、历史日期属性数据及历史路况数据,进行待预测日期的路况预测。

本发明实施例还提供了另一种交通路况预测方法,包括:获取多个特定道路的历史路况数据;获取所述多个道路的与交通路况相关的历史日期属性数据和待预测日期对应的日期属性数据;其特征在于:

对于所述多个道路中的每一个,生成历史路况数据中不同日期间的路况相似度评估数据;

根据道路间交通变化规律相似度进行道路聚类,以得到不同道路所属类别;

对于同一类别道路,以所述道路历史路况相似度评估数据及其日期属性数据为基础,训练相似度分类预测模型以获得相应路况预测模型;

基于所述路况预测模型,待预测日期对应的日期属性数据、历史日期属性数据及历史路况数据,进行所述多个道路待预测日期的路况预测。

本发明实施例还提供了另一种交通路况预测装置,包括:第二路况数据获取模块,用于获取多个特定道路的历史路况数据;第二日期属性数据获取模块,用于获取所述多个道路的与交通路况相关的历史日期属性数据和待预测日期对应的日期属性数据;其特征在于还包括:

第二路况相似度评估模块,对于所述多个道路中的每一个,生成历史路况数据中不同日期间的路况相似度评估数据;

道路聚类模块,用于根据道路间交通变化规律相似度进行道路聚类,以得到不同道路所属类别;

第二模型训练模块,对于同一类别道路以所述道路历史路况相似度评估数据及其日期属性数据为基础,训练相似度分类预测模型以获得相应路况预测模型;

第二路况预测模块,基于所述路况预测模型,待预测日期对应的日期属性数据、历史日期属性数据及历史路况数据,进行所述多个路段待预测日期的路况预测。

本发明实施例提供了一种交通路况预测方法及装置,通过对日期属性数据与道路路况关系的挖掘,以道路历史路况数据及日期属性数据为基础,建立可靠有效的长时路况预测模型,即通过研究历史多天日期属性数据及道路路况数据,完成基于日期属性数据的不同日期间道路交通路况变化过程相似度分类预测建模;基于得到的交通路况变化过程相似度模型,以及待预测日期对应的日期属性数据和历史日期对应的日期属性及路况数据进行待预测日期的路况预测。这种路况预测不同于短时交通预测及长时单步预测,不依赖于实时数据,且预测输入简化,本预测方法将预测长时间段内不同时刻上的交通状态,即一段时间内的交通状态变化趋势,同时所述方法预测过程中以属性数据为基础,其预测效果可随着属性数据的不断丰富而改进,可扩展性较强。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明一个实施例提供的交通路况预测方法的流程图;

图2为特定路段特定日期下路况随时间变化展示图;

图3为本发明一个实施例提供的路况预测模型训练及预测方法的详细流程图;

图4为本发明一个实施例提供的交通路况预测装置的结构示意图;

图5为本发明另一个实施例提供的交通路况预测方法的流程图;

图6为本发明另一个实施例提供的交通路况预测装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1示意性的示出了本发明一个实施例提供的交通路况预测方法的流程图。如图1所示,本发明一个实施例提供的交通路况预测方法,具体包括以下步骤:

步骤1:获取一特定道路的历史路况数据。其中,所述历史路况数据至少包括道路旅行速度或者旅行时间。

道路历史路况数据:所述部分数据对道路路况变化过程进行描述,以道路旅行速度、旅行时间等的形式记录不同时段内的道路通行状态,后续描述中将以旅行速度为例描述交通路况预测流程,其数据内容主要包括道路id、时间戳、车辆在路段上的行驶速度。其中道路id用以唯一标识特定道路(区分行车方向),该实施例后期数据训练及预测过程均针对道路id相同的特定道路路况数据进行设计,所述数据展示了特定道路上一段时期内道路路况变化过程,为后期数据挖掘工作提供基础,图2对特定路段特定日期下的道路路况变化过程进行了展示。

步骤2:获取所述道路与交通路况相关的历史日期属性数据及待预测日期对应的日期属性数据。所述日期属性数据至少包括:天气属性、工作日属性、政策属性、事件属性中的一个或多个。

历史日期属性数据及预测日期对应的日期属性数据:所述部分数据描述不同日期所对应的属性,即日期的特征化表示,和交通路况相关的日期属性特征主要包括:天气属性,如温度、湿度、能见度、降雨量等;工作日属性,如星期一、星期二、节假日、周末等;政策属性,如限行限号、管制措施等;事件属性,如大型活动、紧急事件等。考虑对应属性的获取手段限制及不同属性间的相关性,本发明主要以最低温度、最高温度、降雨量、降雪量、工作日属性为例,对道路路况预测方法进行介绍。

其中最低温度、最高温度、降雨量、降雪量均可表示为连续的数值,工作日属性则可划分为星期一、星期二、星期三、星期四、星期五、星期六、星期日、节假日第一天及最后一天、节假日、调休10类,分别于整数1-10对应。

步骤3:对于所述道路生成历史路况数据中不同日期间的路况相似度评估数据。

在一个实施例中,对于所述道路生成历史路况数据中不同日期间的路况相似度评估数据包括:计算任意两日期下的交通路况变化相似度,假设表示路段link在日期date对应的路况变化向量,其具体表达公式如(1)所示:

其中表示路段link在日期date第ti时刻采样到的路况变化向量,n表示对应日期下采样点个数;通过以下两种公式之一所示的方法计算特定两个不同日期间的交通路况变化相似度sdate2,date1

其中表示日期date1对应的路况变化向量,表示日期date2对应的路况变化向量,||·||2表示向量的二范数。

通过计算任意两日期下的交通路况变化相似度则可得历史交通路况变化相似度向量如下:

其中表示日期datej及日期datei对应的路况变化向量间的相似度,通过对历史交通路况变化相似度进行归一化预处理后,可得预处理后的相似度向量

其中表示日期datej及日期datei对应的预处理后的路况变化向量间的相似度,

datej>dateii=1,2,…,n;j=1,2,…,n;n取决于训练样本所覆盖的天数。

参见图3所示,本步骤首先根据历史日期属性数据及路况数据生成不同日期组合对应的相似度值,主要为建立相似度推断模型做准备,其目的是对一路段对应的不同日期下的交通路况变化相似度进行评估。

step301:基于历史数据的不同日期间路况相似度计算。

假设表示路段link在日期date对应的路况变化向量,其具体表达公式如(1)所示:

其中表示路段link在日期date第ti时刻采样到的路况变化向量(如道路行车速度),n表示对应日期下采样点个数,例如当采样间隔为1小时,则有n=24。

在获得同一路段id所对应的多天历史数据后,则可以例如通过以下两种公式(2)、(3)之一所示的方法计算特定两个不同日期间的交通路况变化相似度:

其中表示日期date1对应的路况变化向量,表示日期date2对应的路况变化向量,||·||2表示向量的二范数,上述两种公式计算得到的sdate2,date1相似度评估值,取值均为[0,1],其值越大表示对应两日期下的道路路况变化越相似。

通过计算任意两日期下的交通路况变化相似度则可得历史交通路况变化相似度向量如下:

其中datej>datei表示日期datej及日期datei对应的路况变化向量间的相似度,i=1,2,…,n;j=1,2,…,n;n取决于训练样本所覆盖的天数。

step302:对历史交通路况相似度进行归一化处理。

在step301之后,通过以下公式可得预处理后的历史交通路况变化相似度及相似度向量如下:

其中p5(·)表示数组的下95分位数,p95(·)表示数组的下5分位数;通过对历史交通路况变化相似度预处理后,可实现对相似度进行线性归一化,为后续相似度分类(模型训练的输入数据)做准备。需要说明预处理公式不唯一,后面模型训练过程中起主要作用的相似度的顺序,因此能够体现相似度顺序和差距的归一公式都可以。

步骤4:以所述历史路况相似度评估数据及其日期属性数据为基础,训练相似度分类预测模型以获得相应路况预测模型。

本步骤主要目的为挖掘历史数据规律,建立以日期属性为依据的,能够推断不同日期间交通路况变化规律相似度的推断模型,以供后期利用日期属性数据进行道路路况预测。以step3中计算得到相似度向量为基础,结合历史日期对应日期属性数据,完成以历史日期属性数据为依据的,路况变化向量相似度推断模型建模。本步骤模型训练的流程如下:

step401:对相似度进行分类完成模型训练输出数据整理。

按照相似度值的大小,对中的元素进行分类,完成模型训练输出数据整理。其中,所述对中的元素进行分类的分类方式包括:相似度小于0.5的为第一类,对相似度大于0.5的,按照一定的间隔,依次划分为不同的类别。

表示相似度所属类别,例如可按以下方式分类:

可得相似度类别向量如下:

需要说明的是:所述示例中对中的元素进行分类的分类依据:(1)相似度小于0.5的为第一类,(2)对相似度大于0.5的,按照一定的间隔,依次划分为不同的类别。具体分类个数,依照训练样本数量及后期应用时的样本数量决定,具体可测试不同分类数量的预测结果,选定预测效果最好的分类数目,分类方法并不仅限于所述实施例。

step402:日期属性数据处理,完成模型训练输入数据整理。

具体包括:以所述历史路况相似度评估数据及其日期属性数据为基础,训练相似度分类预测模型以获得相应路况预测模型。

假设以表示路段link在日期date对应的日期属性向量,其具体表达公式如(9)所示:

其中s=1,2,...,m,表示路段link在日期date第s个属性值,m表示对应日期下日期属性个数,当采用最低温度、最高温度、降雨量、降水量、工作日属性作为日期属性时,有m=5。按照各元素的日期排列顺序及路段link,整理出特定两日期对应的模型输入向量如下:

其中datej-datei表示日期datej及日期datei所间隔的天数。进一步可得模型输入矩阵p如下:

其中i=1,2,…,n;j=1,2,…,n;n取决于训练样本所覆盖的天数。

step403:分类预测模型训练。

建立相似度分类预测模型以作为路况预测模型,即基于历史日期属性数据作为训练输入,且基于历史路况数据中不同日期间的路况相似度评估数据作为对应输出向量,训练分类模型从而得到相似度分类预测模型。相似度分类预测模型是利用随机森林模型建立的训练模型,具体地,可以p作为训练输入,作为对应输出向量,训练分类模型即可得相似度评估模型本发明提供一实施例以随机森林算法作为基础算法完成相似度大小推断。随机森林模型是一种基于决策树的机器学习算法,可被应用为回归及分类问题的实现上,通过对样本及属性的随机采样,训练多个决策树,通过多颗决策树的组合,整合多个决策树模型的输出作为随机森林的最终输出,完成相应任务。随机森林算法解决了决策树模型中的过拟合问题,采用随机森林算法作为基础算法完成相似度大小推断与采用其他分类模型相比较,具有更好的模型稳定性和鲁棒性。

需要说明的是:所述算法实现过程中,也可以利用其他现有分类技术(如支持向量机、神经网络等)完成所述步骤,以得到可用的分类模型,在其他模型的训练过程中,同样以p作为训练输入,作为对应输出向量即可。

步骤5:基于所述路况预测模型,待预测日期对应的日期属性数据、历史日期属性数据及历史路况数据,进行待预测日期的路况预测。

本步骤以训练得到的相似度分类预测模型为基础,通过待预测日期对应的日期属性向量和历史日期对应的日期属性推断两日期间交通路况变化相似度,而后引入knn算法中加权平均思想,完成历史日期道路路况变化与待预测日期道路路况变化相似度的评估,实现长时交通路况预测,参见图3历史日期道路路况变化与待预测日期道路路况变化相似度的具体预测流程如下:

假设已获得目标路段link待预测日期对应的日期属性向量如下:

同时已获得目标路段link历史日期对应的路况变化向量及日期属性向量如下:

其中分别表示日期datei所对应的路况变化向量及日期属性向量,式13中i=1,2,...,n,n表示获取的历史数据所包含的日期数目,式12、14中i=1,2,...,m,m表示获取的历史数据所包含的日期数目。则进行长时间路况预测的具体流程如下:

step501:依据预测模型和日期属性数据完成待预日期路况变化相似度评估。

本步骤以步骤3得到的分类预测模型为基础,以待预测日期属性数据和历史日期属性数据为依据,完成历史日期道路路况变化与待预测日期道路路况变化相似度的评估。

首先按照模型输入所需内容,整理出待预测日期datet及历史日期datei对应的输入向量:

而后,可得预测日期datet与所有历史日期datei,i=1,2,...,n间相似度分类结果即:

其中model(·)表示预测模型。

step502:基于历史路况数据和预测模型输出完成交通路况预测。

在获得待预测日期datet与所有历史日期datei,i=1,2,...,n间相似度分类结果后,则可利用加权平均的方法计算得出交通路况预测结果,也可将相似度分类结果数值最高的历史日期对应的路况数据作为待预测日期的路况数据得出预测结果。本发明中可采用knn加权平均的方法计算得出交通路况预测结果,具体过程如下:

首先挑选相似度分类结果数值较高的前k个历史日期作为有效历史日期dateα,α=1,2,...,k,0<k<ld,ld表示历史数据的天数;

而后以加权平均的方式计算待预测日期的路况变化向量为:

其中f(x)=2x表示各历史日期所对应的权重系数。

如图4所示,与上述方法相对应地,本发明实施例还提供一种交通路况预测装置,包括:第一路况数据获取模块101,用于获取一特定道路的历史路况数据;第一日期属性数据获取模块105,用于获取所述道路与交通路况相关的历史日期属性数据及待预测日期对应的日期属性数据;第一路况相似度评估模块102,用于对于所述道路生成历史路况数据中不同日期间的路况相似度评估数据;第一模型训练模块103,用于以所述历史路况相似度评估数据及日期属性数据为基础,建立相似度分类预测模型以获得相应路况预测模型;第一路况预测模块104,用于基于所述路况预测模型,待预测日期对应的日期属性数据、历史日期属性数据及历史路况数据,进行待预测日期的路况预测。

进一步的,第一路况数据获取模块101获取道路历史路况数据,获取的日期属性数据内容可参见上述步骤1所述,此处不再赘述。第一日期属性数据获取模块105获取历史日期属性数据及待预测日期对应的属性数据,获取的日期属性数据内容可参见上述步骤2所述,此处不再赘述。第一路况相似度评估模块102从路况第一数据获取模块101和第一日期属性数据获取模块105分别获得历史路况数据和日期属性数据,对于所述道路生成历史路况数据中不同日期间的路况相似度评估数据,生成相似度评估数据的过程可参见上述步骤3所述,在此不再赘述。

第一模型训练模块103,其主要为挖掘历史数据规律,建立以日期属性为依据的,能够推断不同日期间交通路况变化规律相似度的推断模型,以供后期利用日期属性数据进行道路路况预测;所述第一模型训练模块103基于历史日期属性数据作为训练输入,且基于历史路况数据中不同日期间的路况相似度评估数据作为对应输出向量,训练分类模型从而得到相似度分类预测模型,其具体实现流程可以参见上述步骤4所述,此处不再赘述。第一路况预测模块104根据第一模型训练模块103训练得到的相似度分类预测模型为基础,基于所述路况预测模型,以及待预测日期对应的日期属性数据和历史日期属性及其路况数据,进行待预测日期的路况预测,其具体实现流程可以参见上述步骤4所述,此处不再赘述。

如图5所示,本发明另一个实施例提供的交通路况预测方法,具体包括以下步骤:

步骤1*:获取多个特定道路的历史路况数据。其中,历史路况数据至少包括道路旅行速度或者旅行时间。

当需要进行城市路网多个路段的交通路况预测时,本发明所涉及算法可应用在大规模城市路网当中包括众多不同路段,可获取多个道路历史路况数据:对多个道路路况变化过程进行描述,以道路旅行速度、旅行时间等的形式记录不同时段内的道路通行状态,其数据内容主要包括道路id、时间戳、车辆在路段上的行驶速度。其中道路id用以唯一标识特定道路(区分行车方向)。

步骤2*:获取所述多个道路的与交通路况相关的历史日期属性数据和待预测日期对应的日期属性数据。

对应于多个道路,分别获取各个道路id对应的与其路况相关的历史日期属性数据及预测日期对应的属性数据,日期属性数据内容与之前步骤2中描述的单个特定道路的数据内容相同,在此不再赘述。

步骤3*:对于所述多个道路中的每一个,生成历史路况数据中不同日期间的路况相似度评估数据。

对应于多个道路,可首先分别计算各个道路id对应的历史路况数据中不同日期间的路况相似度,例如取一定时间段内(如一个月)的各个路段的历史道路交通路况数据,对于各个路段分别基于道路历史路况数据及其日期属性数据完成不同日期间的交通变化趋势相似度评估,得到对应第ri条道路的相似度描述向量其中ri表示第ri条道路。各个路段的相似度描述向量的计算方法与之前步骤3中描述的单个特定道路的计算方式及内容相同,在此不再赘述。

步骤4*:根据道路间交通变化规律相似度进行道路聚类,以得到不同道路所属类别。

由于本发明所涉及算法可应用在大规模城市路网当中包括众多不同路段,因此提高算法运行效率是十分必要的,在进行模型训练前,可根据实际需要进行选择,即根据道路间交通变化规律相似性,进行道路分类,即将数量较大的原始道路划分为数目较小的类别,而后以每类别中包含的相似度向量及日期属性数据为基础完成模型训练。利用欧式距离或曼哈顿距离定义不同道路相似度向量间的距离d如下:

其中分别表示对应第p条道路、第q条道路的相似度描述向量,其中p、q分别表示第p条道路、第q条道路,||·||2表示向量的二范数,||·||1表示向量的一范数。

在上述距离d定义的基础上,完成原始道路的聚类分析,得到不同道路所属类别。具体的,可利用成熟的聚类算法,如k近邻、k中心点及层次聚类等算法完成原始道路的聚类分析,得到不同道路所属类别;而后可以基于同一类别所包含的历史路况相似度数据及日期属性数据完成模型训练。其中类别个数可根据实际需求进行确定,当类别个数和原始道路数目一致时,则会针对每一条道路训练独立的模型。

步骤5*:对于同一类别道路以所述道路历史路况相似度评估数据及其日期属性数据为基础,训练相似度分类预测模型以获得相应路况预测模型。

对于聚类后的道路,可分别进行各个类别对应的相似度评估模型训练,其主要基于同一类别所包含的历史路况相似度数据及日期属性数据完成模型训练,获得日期属性特征对道路路况的影响权重,以供后期利用日期属性数据进行道路路况预测。对于每一类别下的相似度分类预测模型训练方法与之前步骤4中描述的单个特定道路的预测模型训练方法及内容相同,在此不再赘述。

步骤6*:基于所述路况预测模型,待预测日期对应的日期属性数据、历史日期属性及其路况数据,进行所述多个路段待预测日期的路况预测。

对于各个路段根据上述步骤获得其所属类别对应的相似度分类预测模型后,依据预测模型,待预测日期对应的日期属性数据和历史日期属性及其历史路况数据,完成各个路段待预测日期的路况预测,预测方法与之前步骤5中描述的单个特定道路的预测模型训练方法相同,在此不再赘述。

如图6所示,与上述方法相对应地,本发明实施例还提供另一种交通路况预测装置,包括:包括:第二路况数据获取模块101,用于获取多个特定道路的历史路况数据;第二日期属性数据获取模块105,用于获取所述多个道路的与交通路况相关的历史日期属性数据和待预测日期对应的日期属性数据;第二路况相似度评估模块102,对于所述多个道路中的每一个,生成历史路况数据中不同日期间的路况相似度评估数据;道路聚类模块106,用于根据道路间交通变化规律相似度进行道路聚类,以得到不同道路所属类别;第二模型训练模块103,对于同一类别道路以所述道路历史路况相似度评估数据及其日期属性数据为基础,训练相似度分类预测模型以获得相应路况预测模型;第二路况预测模块104,基于所述路况预测模型,待预测日期对应的日期属性数据和历史日期属性及其路况数据,进行所述多个路段待预测日期的路况预测。

本发明实施例提供了一种交通路况预测方法及装置,不同于短时交通预测及长时单步预测,不依赖于实时数据,且预测输入简化,本预测方法将预测长时间段内不同时刻上的交通状态,即一段时间内的交通状态变化趋势,同时所述方法预测过程中以属性数据为基础,其预测效果可随着属性数据的不断丰富而改进,可扩展性较强。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1