一种基于信息融合和马尔可夫模型的交通客流预测方法与流程

文档序号:12272522阅读:240来源:国知局

本发明涉及数据预测领域,更具体地,涉及一种基于信息融合和马尔可夫模型的交通客流预测方法。



背景技术:

随着城镇化和机动化进程的加快,早期的客流分配、线网规划已经不适应现代化发展的需要,同时城市交通拥堵已成为困扰我国城市发展的难题。现有技术中,在智能交通方面对城市交通进行信息化,精细化和智能化的管理、规划和设计,提高客流分配、线网规划的合理性,确保在缓解交通拥堵方面进度甚少,同时现有技术中也鲜有对公交客流进行监测和预测,公交客流进行监测和预测的重点是对客流的预测,通过历史客流数据和实时监测数据以及一定的算法,能够预测城市短期内的交通客流量,这样为公交营运调度创造有利条件。



技术实现要素:

本发明提供一种基于信息融合和马尔可夫模型的交通客流预测方法,该方法可提高交通客流预测的准确率。

为了达到上述技术效果,本发明的技术方案如下:

一种基于信息融合和马尔可夫模型的交通客流预测方法,包括以下步骤:

S1:对多源交通数据通过信息融合技术与分步预处理相结合的方法进行预处理;

S2:对预处理后的多源交通数据采用马尔可夫模型来进行客流预测。

进一步地,所述步骤S1的具体过程如下:

S11:多源信息融合与ETL处理-运用信息融合技术把相同类型或者不同类型的局部测量值加以综合相互补充,消除信息之前的冗余和不真实数据,减少单源测量值出错所带来的影响,再对数据进行去噪、清洗、变换、归约、重复数据块删除操作;

S12:无损数据压缩-采用小波变换多层分解的形式对数据流进行多层分解、空间多层分解、参数多层分解后,形成按时间为线索的数据压缩流,使交通数据的重要特征充分保留和突显;

S13:特征提取-通过映射或变换的方法,将多源交通数据的高维的属性空间压缩为低维的属性空间,即将原始属性变换为较少的新属性。

进一步地,所述步骤S2的具体过程如下:

S21:建立交通站点的马尔可夫模型需要站点与站点的转移概率矩阵;

S22:在马尔可夫模型转移概率矩阵的训练过程中,将获取的多源交通信息采用信息融合技术,采用自适应的加权平均方法来确定站点间的转移概率;

S23:分析交通站点的状态影响因素,通过识别不同的影响因素来确定转移矩阵的维度,并作为状态影响因子引入转移概率矩阵,对客流进行预测。

进一步地,所述步骤S12中对数据流进行多层分解、空间多层分解、参数多层分解后的数据通过多层还原的形式还原数据来确保信息的无损利用。

进一步地,所述步骤S11的具体过程包括:使用Twitter的Storm对交通源数据进行流式计算,并采用多余数据删除技术,以减轻数据存储压力,减少数据冗余,使数据更为有效。这一阶段主要集中在对重复数据块的删除,以及数据噪声的减弱。

进一步地,所述步骤S23的具体过程如下:

1)定义站点A的状态为P{x(t+k)=j|x(1)=i1,x(2)=i2,...x(t)=it},由于客流状态通常与越接近它的站点和时间点的客流状态关联最紧密,而与之越远的站点或时间点对它的的影响越小,甚至可以忽略,具有马尔可夫性。因此,可描述为P{x(t+k)=j|x(t)=it},k≥1;

2)从A站点至B站点情况下,转移出发状态i,转移步k,到达状态j,其转移概率为Pij(k)=Pij(t,t+k);

3)根据信息融合技术,判断观测站点的关联站点,假设关联站点有n含观测站点,确定转移概率矩阵维度为n,并根据关联性分析对客流进行突发事件检测、客流异常检测、路段规律,形成状态影响因子ai=a1,a2,...an,0<i≤n;

4)采用信息融合技术中推荐的与马尔可夫模型匹配的滤波器的混合初始概率,客流量相互影响的因素构成n×n的转移概率矩阵:

5)通过概率矩阵预测观测站点的状态,预测值为:

x(t)=a1s(t-1)p+a2s(t-2)p2+...+aks(t-k)pk

与现有技术相比,本发明技术方案的有益效果是:

本发明通过信息融合技术与马尔可夫模型的结合,提出适用于交通客流预测的新方法,该方法通过信息融合技术对交通流数据进行处理,然后再对处理后的数据构建马尔可夫模型,同时利用信息融合技术训练马尔可夫模型中的转移概率矩阵,提高交通客流预测的准确率。

附图说明

图1为本发明方法的流程图。

具体实施方式

附图仅用于示例性说明,不能理解为对本专利的限制;

为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;

对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。

下面结合附图和实施例对本发明的技术方案做进一步的说明。

实施例1

如图1所示,一种基于信息融合和马尔可夫模型的交通客流预测方法,包括以下步骤:

S1:对多源交通数据通过信息融合技术与分步预处理相结合的方法进行预处理;

S2:对预处理后的多源交通数据采用马尔可夫模型来进行客流预测。

智能交通系统的交通数据来源广泛、形式多样,包括动态的交通流数据和智能交通子系统的管理控制数据,以及静态的道路环境数据等;智能交通系统管理和控制的对象是交通流,交通流数据是按时间顺序采样得到的一系列数值型数据序列,是交通系统中最重要的数据,也是客流预测的主要数据来源,智能交通系统记录了大量交通流信息,如电子警察系统将交通违法车辆的违法行为过程用图像和数据记录下来,提供交通违法信息,包括车辆违法地点、违法日期、违法时间、违法类型、违法参数、违法车辆全景图像序列、违法车辆牌照图像;交通事故接处警系统提供报警时间、报警地点、报警电话号码以及相关的交通事故信息;交通信号控制系统提供与路口有关的运行状态、色步递进信息等;

针对智能交通大数据的特点,模型提出多源信息融合与分步预处理相结合的方式,是指在数据导入阶段对数据进行清洗,对已存储数据进行压缩,对算法使用前的数据进行特征提取;有别于普通的数据预处理流程和方式,不仅仅是减少数据冗余,解决现阶段普遍存在的大数据存储难题,同时也可以进一步提高算法的准确度和精度,使智能交通大数据充分发挥出潜在价值,为客流预测分析作好准备;

步骤S1的具体过程如下:

S11:多源信息融合与ETL处理-运用信息融合技术把相同类型或者不同类型的局部测量值加以综合相互补充,消除信息之前的冗余和不真实数据,减少单源测量值出错所带来的影响,再对数据进行去噪、清洗、变换、归约、重复数据块删除操作;

首先是在数据的终端采集之后、数据导入分布式数据库之前进行数据信息融合和预处理操作,运用信息融合技术把相同类型或者不同类型的局部测量值加以综合,如多源检测的数据中选择最优值、求平均值等,相互补充,消除信息之前的冗余和不真实数据,减少单源测量值出错所带来的影响。交通客流采集数据中采用信息融合技术,可以从多源量测数据选取最优的测量信息,提高判断结果的可信度;也可以采用检测和推理等运算,有效降低事件模糊程序和不确定性,有效提高客流预测方法的准确率。通过信息融合技术后的数据,再运用数据预处理中去噪、清洗、变换、归约、重复数据块删除等操作;

通常对普通数据进行分析评估或挖掘利用之前,都会采用数据预处理,用于提高数据的有效性,可是往往都是对存储成数据库之后的数据进行清洗、变换、归约等操作,而大数据比普通的数据非常庞大,并以指数据迅猛增长,而智能交通大数据又具有采集端分散、前端数据库繁多的特点,在对这些海量数据要进行分析和利用之前,需要将数据导入到一个集中的大型分布式的数据库或分布式的存储集群。本专利在这数据导入阶段,就引入数据清洗和预处理技术,融合RFID等技术所感知的多源客流信息,使用Twitter的Storm对数据进行流式计算,并采用多余数据删除技术,以减轻数据存储压力,减少数据冗余,使数据更为有效。这一阶段主要集中在对重复数据块的删除,以及数据噪声的减弱;

S12:无损数据压缩-采用小波变换多层分解的形式对数据流进行多层分解、空间多层分解、参数多层分解后,形成按时间为线索的数据压缩流,使交通数据的重要特征充分保留和突显;

该步骤主要对数据进行时间维度压缩,通过对数据进行重新编码来降低数据的冗余度,这部分技术在现阶段的大数据处理中成熟度较高,目前对大数据的数据压缩方案主要集中在一些经典的数据压缩算法,如常见的霍夫曼(Huffman)算法和LZW(Lempel一Ziv&W el ch)压缩算法;

针对智能交通大数据存在大量时间序列数据的特点,采取适用于时间序列的预处理方式—时间维度归约。针对智能交通大数据中通常表现为时间序列数据的特征,时序数据以三维的形式描述,即数据的特征(或变量)(feature/variable)、数据的记录(或样本)(record/sample)以及数据的时间维度(time stamp/time dimension)。由于时序数据与时间相关联,因而其数据量一般都是非常庞大的,这就对时序数据挖掘技术提出了更高的要求。该步骤的数据压缩主要集中在时间维度的归约。时间维度归约是对时间序列数据中时间点的值进行数值归约,时间维度归约是使用替代的、较小的数据表示形式来减少数据量.参数方法使用模型估计数据,只需存放参数(还可能是离群点)而非实际数据.回归和对数线性模型是一个例子,非参数方法包括直方图,聚类和抽样.直方图有等宽、等频、V最优、MaxDiff,后两者是最准确和实用的。本专利采用小波变换多层分解的形式,研究在大数据量下适用于智能交通数据时间维度的压缩算法,通过对数据流的多层分解、空间多层分解、参数多层分解后,形成按时间为线索的数据压缩流,使交通数据的重要特征充分保留和突显,同时,对压缩保存后的数据,还可以通过多层还原的形式还原数据,确保信息的无损利用;

S13:特征提取-通过映射或变换的方法,将多源交通数据的高维的属性空间压缩为低维的属性空间,即将原始属性变换为较少的新属性。

马尔可夫模型是根据系统状态之前的转移矩阵来描述一个随机动态系统未来的发展状况,转移概率则反映了各状态之前某种内在的规律性,交通客流信息是一个动态信息,具有随机性的特点,而马尔可夫模型正适合描述这种具有随机波动特点的动态信息。因此,将信息融合技术跟马尔可夫模型相结合,适用于地面交通中对客流量的预测。

在公交系统中,虽然交通客流是连续的,但是道路的各站点,可以视为离散值,而且交通数据某站点某时刻的客流状态,与越接近它的站点和时间点的客流状态关联最紧密,而与之越远的站点或时间点对它的的影响越小,甚至可以忽略,具有马尔可夫性。建立站点的马尔可夫模型需要站点与站点的转移概率矩阵,在马尔可夫模型转移概率矩阵的训练过程中,将获取的多源交通信息采用信息融合技术,采用自适应的加权平均方法来确定站点间的转移概率,从而提高客流预测的准确率。同时,分析交通站点的状态影响因素,如具有固定的路线、运行时间的公交、地铁、客车等运行因素,或具有随机性的人流、车流运行因素,通过识别不同的影响因素来确定转移矩阵的维度,并作为状态影响因子引入转移概率矩阵,对客流进行预测。

步骤S2的具体过程如下:

S21:建立交通站点的马尔可夫模型需要站点与站点的转移概率矩阵;

S22:在马尔可夫模型转移概率矩阵的训练过程中,将获取的多源交通信息采用信息融合技术,采用自适应的加权平均方法来确定站点间的转移概率;

S23:分析交通站点的状态影响因素,通过识别不同的影响因素来确定转移矩阵的维度,并作为状态影响因子引入转移概率矩阵,对客流进行预测。

进一步地,所述步骤S23的具体过程如下:

1)定义站点A的状态为P{x(t+k)=j|x(1)=i1,x(2)=i2,...x(t)=it},由于客流状态通常与越接近它的站点和时间点的客流状态关联最紧密,而与之越远的站点或时间点对它的的影响越小,甚至可以忽略,具有马尔可夫性。因此,可描述为P{x(t+k)=j|x(t)=it},k≥1;

2)从A站点至B站点情况下,转移出发状态i,转移步k,到达状态j,其转移概率为Pij(k)=Pij(t,t+k);

3)根据信息融合技术,判断观测站点的关联站点,假设关联站点有n含观测站点,确定转移概率矩阵维度为n,并根据关联性分析对客流进行突发事件检测、客流异常检测、路段规律,形成状态影响因子ai=a1,a2,...an,0<i≤n;

4)采用信息融合技术中推荐的与马尔可夫模型匹配的滤波器的混合初始概率,客流量相互影响的因素构成n×n的转移概率矩阵:

5)通过概率矩阵预测观测站点的状态,预测值为:

x(t)=a1s(t-1)p+a2s(t-2)p2+...+aks(t-k)pk

本发明针对智能交通大数据的特点,提出三步预处理方式的设想,有别于普通的数据预处理流程和方式,使智能交通大数据充分发挥出潜在价值,为良好的挖掘效果作支撑。分步预处理方式是指在数据导入阶段对数据进行清洗,对已存储数据进行压缩,对算法使用前的数据进行特征提取;针对智能交通大数据的时间序列数据进行时间维度归约,采用小波变换多层分解在时间维度归约方面对数据进行压缩保存并追求无损还原,有效解决数据存储难题的同时最大可能地保留数据的信息;通过三步预处理与马尔可夫模型的结合,提出适用于交通客流预测的新方法,该方法通过三步预处理技术对交通流数据进行处理,然后再对处理后的数据构建马尔可夫模型,同时利用信息融合技术训练马尔可夫模型中的转移概率矩阵,提高交通客流预测的准确率。

相同或相似的标号对应相同或相似的部件;

附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制;

显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1