一种基于主成分分析算法的道路交通时间序列上数据压缩方法

文档序号:10534790阅读:471来源:国知局
一种基于主成分分析算法的道路交通时间序列上数据压缩方法
【专利摘要】一种基于主成分分析算法的道路交通时间序列数据压缩方法,首先,基于道路交通时间序列上历史数据,结合主成分分析方法,获取道路交通历史数据的投影矩阵;其次,基于道路交通时间序列上实时数据,获得道路交通数据矩阵;基于投影矩阵,获取道路交通数据矩阵的主成分,实现道路交通时间序列上实时数据的压缩;最后,基于道路交通数据矩阵的主成分和投影矩阵,求取重构的数据矩阵,实现道路交通时间序列上实时数据的重构。实验结果表明,本方法在道路交通时间序列上数据压缩方面具有很好的性能。
【专利说明】
一种基于主成分分析算法的道路交通时间序列上数据压缩 方法
技术领域
[0001 ]本发明属于道路交通数据处理领域,涉及道路交通数据的分析与压缩,是一种道 路交通数据的压缩方法。
【背景技术】
[0002] 随着智能交通系统数据采集技术的不断发展,基于连续采集得到的智能交通数 据,交通领域即将面临海量数据问题,必须对其进行有效的数据压缩,才能进行处理、分析 和存储。
[0003] 交通流数据的内在特征主要包括:周期性、相似性、相关性等。邻近路段的交通流 之间存在着复杂的时空关联关系,往往相似性较高,同一交通流在时间上表现出极强的相 关性与周期性。这些相似性表明数据中存在大量的冗余信息。
[0004] 基于交通流相似性的特征,目前已有多种方法应用到道路交通数据压缩领域中。 主要包括:主成分分析法(PCA)、独立成分分析、预测编码与字典编码串联法、基于小波(包) 变换方法、人工神经网络等方法。其主要利用变换域的思想,将道路交通数据进行多尺度变 换并进行相关处理,实现数据的压缩,并且取得较好的效果。
[0005] 既有的道路交通数据压缩方法大多对道路交通网络数据进行数据压缩,对同一路 段时间序列上的数据压缩方法研究较少。

【发明内容】

[0006] 为了克服已有道路交通数据压缩方法的算法复杂、处理速度较慢的不足,本发明 提供一种简化算法、提升处理速度的基于主成分分析算法的道路交通时间序列数据压缩方 法。
[0007] 本发明解决其技术问题所采用的技术方案是:
[0008] -种基于主成分分析算法的道路交通时间序列数据压缩方法,所述方法包括以下 步骤:
[0009] 1)基于道路交通特征参考序列的历史数据,获取道路交通投影矩阵,过程如下: [0010]从道路交通特征参考序列中提取该路段同一模态、同一时段的交通状态时间序列 上历史数据,并将其变换为P x q的矩阵,记为:ApXq,其中,p X q = n;
[0011]矩阵Apxq第j列的均值为:
(I)
[0013]基于,获得Apxq的归一化矩阵SApxq:
[0015]归一化矩阵SA的协方差矩阵CSA为: (2) (3)
[0017] 获得协方差矩阵CSA的特征值D和特征向量V,则D= [Xi,A2."\]山2 A〗2…2入q;V = [V1,V2---Vq];
[0018] 则前i个特征值对应的累积贡献率Per (i)为:
(4)
[0020] 设定累积贡献率的阈值为Thr,则选取阈值范围内的特征向量构成投影矩阵,即为:
[0021] VS= [vi,V2-,,Vr]Per(r) > Thr (5)
[0022] 基于投影矩阵VS,获取零均值矩阵的主成分PApxr:
[0023] PAPxr = SApxqXVSqxr (6)
[0024] 其中,p表示矩阵的行,q表示矩阵的列,n表示历史数据采集个数,0〈p〈n,0〈q〈n; M、Vl分别表示第i个特征值和特征向量,〇〈i〈q,压缩比为:r/q,基于压缩比,获取最优的投 影矩阵和相应的(P,q);
[0025] 2)基于投影矩阵和时间序列上实时数据构成的数据矩阵,获取数据矩阵的主成 分,实现道路交通时间序列上实时数据的压缩,过程如下:
[0026] 获取道路交通时间序列上实时数据,并将其变换为pxq的矩阵,记为:Bpxq,其中,p x q = n;
[0027]矩阵Bpxq第j列的均值为:
(7)
[0029]基于bj,获得Bpxq的零均值矩阵SBpxq:
[0030] SBi;j = (Bi;j-bj) (8)
[0031]基于投影矩阵VS,获取零均值矩阵的主成分PBpxr:
[0032] PBPxr = SBpxqXVSqxr (9)
[0033] 实现零均值化处理后的矩阵的压缩,间接实现道路交通时间序列上实时数据的压 缩,压缩比为:r/q。
[0034]进一步,所述方法还包括以下步骤:
[0035] 3)基于数据矩阵的主成分和投影矩阵,求取重构的实时数据,实现道路交通时间 序列上实时数据的解压,过程如下:
[0036]基于道路交通实时数据零均值化处理矩阵的主成分PBpxr和投影矩阵的转置VST, 重构道路交通实时数据零均值化处理矩阵cstSBpxq:
[0037] cstSBpxq = PBpxrXVSqxrT (10)
[0038] 基于重构道路交通实时数据零均值化处理矩阵和均值数据,重构道路交通数据矩 阵 cstBi,j:
[0039] cstBi, j = cstSBi, j+bj (11)。
[0040] 本发明的技术构思为:由于交通参与者的出行需求、出行时间具有一定的规律性, 故同一路段的道路交通状态在相似的时间节点上具有很强的相关性,即同一路段的道路交 通状态变化曲线具有一定的周期性。该周期从大到小可以分为周、月、季度、年等不同单位, 并各自表征出不同的相关特性。基于道路交通时间序列上相关性的特点,针对同一路段时 间序列上的交通数据进行压缩。
[0041 ]本发明的有益效果主要表现在:基于道路交通时间序列上历史数据,获取道路交 通投影矩阵;基于道路交通时间序列上实时数据,获得道路交通数据矩阵;基于投影矩阵, 获取道路交通数据矩阵的主成分,实现道路交通时间序列上实时数据的压缩;基于道路交 通数据矩阵的主成分和投影矩阵,求取重构的道路交通数据,实现道路交通时间序列上实 时数据的解压,最终实现道路交通数据的重构。
【附图说明】
[0042]图1是基于主成分分析算法的道路交通时间序列数据压缩方法的流程图。
[0043]图2是重构方法的流程图。
【具体实施方式】
[0044]下面结合附图对本发明作进一步描述。
[0045] 参照图1和图2,一种基于主成分分析算法的道路交通时间序列数据压缩方法,包 括以下步骤:
[0046] 1)基于道路交通时间序列上的历史数据,获取道路交通投影矩阵,过程如下:
[0047] 从道路交通特征参考序列中提取该路段同一模态、同一时段的道路交通状态时间 序列上历史数据,并将其变换为pXq的矩阵,记为:A pXq,其中,pXq = n。
[0048]矩阵Apxq第j列的均值为:
(1)
[0050]基于aj,获得Apxq的归一化矩阵SApxq:
(2)
[0052]归一化矩阵SA的协方差矩阵CSA为:
(3)
[0054] 获得协方差矩阵CSA的特征值D和特征向量V,则0=[心,\2……2A q;V = [V1,V2---Vq];
[0055]则前i个特征值对应的累积贡献率Per (i)为:
(4)
[0057] 设定累积贡献率的阈值为Thr,则选取阈值范围内的特征向量构成投影矩阵,即为:
[0058] VS= [vi,V2-,,Vr]Per(r) > Thr (5)
[0059] 基于投影矩阵VS,获取零均值矩阵的主成分PApxr:
[0060] PApxr = SApxq XVSqxr (6)
[0061] 其中,p表示矩阵的行,q表示矩阵的列,n表示历史数据采集个数,0〈p〈n,0〈q〈n; M、Vl分别表示第i个特征值和特征向量,〇〈i〈q。压缩比为:r/q。基于压缩比,获取最优的投 影矩阵和相应的(P,q),完成训练的过程。
[0062] 2)基于道路交通时间序列上实时数据,获得道路交通数据矩阵;基于投影矩阵,获 取道路交通数据矩阵的主成分,实现道路交通时间序列上实时数据的压缩,过程如下:
[0063] 获取道路交通时间序列上实时数据,并将其变换为pxq的矩阵,记为:Bpxq,其中,p x q = n〇
[0064]矩阵Bpxq第j列的均值为:
(7)
[0066] 基于bj,获得Bpxq的零均值矩阵SBpxq:
[0067] SBi;j = (Bi;j-bj) (8)
[0068]基于投影矩阵VS,获取零均值矩阵的主成分PBpxr:
[0069] PBPxr = SBpxqXVSqxr (9)
[0070] 从而实现零均值矩阵的压缩,间接实现道路交通时间序列上实时数据的压缩,压 缩比为:r/q。
[0071] 参照图2,基于道路交通数据矩阵的主成分和投影矩阵,求取重构的道路交通数 据,实现道路交通时间序列上实时数据的解压,重构方法的过程如下:
[0072]基于道路交通实时数据零均值矩阵的主成分PBpxr和投影矩阵的转置矩阵VST,重 构道路交通实时数据零均值矩阵cstSBpxq:
[0073] cstSBpxq = PBpxrXVSqxrT (10)
[0074]基于重构的道路交通零均值矩阵和均值数据,重构道路交通数据矩阵CStB1>J:
[0075] cstBi, j = cstSBi, j+bj (11)。
[0076] 实例:一种基于主成分分析算法的道路交通时间序列数据压缩方法,包括以下步 骤:
[0077] 1)基于道路交通时间序列上的历史数据,获取道路交通投影矩阵,过程如下:
[0078] 由于同一路段、对应时间的道路交通流具有相似性,故选择北京三条典型路段、 2011年6月四天周末(18、19、25、26)相同测试点实测流量数据(采样间隔为2分钟)作为样本 序列,路段信息表1所示。
[0080]表 1
[0081]基于18日的流量数据作为历史数据,进行算法参数设定。19、25、26三天的数据作 为实时数据,进行算法的测试和应用。
[0082]从道路交通特征参考序列中提取该路段同一模态、同一时段的交通状态时间序列 上历史数据,并将其变换为pXq的矩阵,记为:ApXq,其中,pXq = n。 (1)
[0083]矩阵Apxq第j列的均值为:
[0085]基于a」,获得Apxq的归一化矩阵SApxq:
(2)
[0087]归一化矩阵SA的协方差矩阵CSA为:
(3)
[0089] 获得协方差矩阵CSA的特征值D和特征向量V,贝llD=[h,h……2人q;V = [vi,V2-'-Vq]〇
[0090]则前i个特征值对应的累积贡献率Per (i)为:
(4)
[0092] 设定累积贡献率的阈值为Thr,则选取阈值范围内的特征向量构成投影矩阵,即为:
[0093] VS= [vi,V2-,,Vr]Per(r) > Thr (5)
[0094] 基于投影矩阵VS,获取零均值矩阵的主成分PApxr:
[0095] PApxr = SApxq XVSqxr (6)
[0096] 其中,p表示矩阵的行,q表示矩阵的列,n表示历史数据采集个数,0〈p〈n,0〈q〈n; M、Vl分别表示第i个特征值和特征向量,〇〈i〈q。压缩比为:r/q。基于压缩比,获取最优的投 影矩阵和相应的(P,q),完成训练的过程。
[0097] 2)基于道路交通时间序列上实时数据,获得道路交通数据矩阵;基于投影矩阵,获 取道路交通数据矩阵的主成分,实现道路交通时间序列上实时数据的压缩,过程如下:
[0098] 获取道路交通时间序列上实时数据,并将其变换为pxq的矩阵,记为:Bpxq,其中,p x q = n〇
[0099] 矩阵Bpxq第j列的均值为:
(7)
[0101] 基于bj,获得Bpxq的零均值矩阵SBpxq:
[0102] SBi;j = (Bi;j-bj) (8)
[0103] 基于投影矩阵VS,获取零均值矩阵的主成分PBpxr:
[0104] PBPxr = SBpxq XVSqxr (9)
[0105]从而实现零均值化处理的矩阵的压缩,间接实现道路交通时间序列上实时数据的 压缩,压缩比为:r/q。
[0106] 3)基于道路交通数据矩阵的主成分和投影矩阵,求取重构的道路交通数据,实现 道路交通时间序列上实时数据的解压,过程如下:
[0107] 基于道路交通零均值矩阵的主成分PBpxr和投影矩阵的转置VST,重构道路交通零 均值矩阵cstSB pxq:
[0108] CStSBpxq = PBpxr XVSqxr1 (10)
[0109] 基于重构道路交通零均值矩阵和均值数据,重构道路交通数据矩阵CStB1>J:
[0110] cstBi, j = cstSBi, j+bj (11)
[0111] 引入实时数据的压缩比、重构误差百分比参数对算法精度的影响进行分析:
(12)
[0114] 其中,CMa*压缩前时间序列上流量数据数量,CMb为压缩后时间序列上流量数据数 量;CR为对应的压缩比;P1为压缩前时间序列上流量数据,P2为压缩后时间序列上流量数 据 ;11^^1'1'为百分比误差,为保证重构数据不影响原始数据反映的信息,11^代1'1'控制在10% 以内。
[0115] 本算法主要由A,p,q,Thr等参数决定,即对于不同的(A,p,q,Thr),存在与之对应的 CR和marerr。故存在如下等式:
[0116] (CR, marerr) = f (A,p,q,Thr) (14)
[0117] 即(A,p,q,Thr)与CR、marerr存在某种分布关系f,寻找CR最大、marerr控制在一定 范围内时,对应的(A,p,q,Thr),即为最优参数。故可以得到如下模型:
[0120] 最终(A,p,q,Thr)的取值可以通过上述模型确定。
[0121] 4)实验结果
[0122] 基于同一路段对应时间段的道路交通时间序列上历史数据,获取最优参数(A,p, q,Thr)。本实验结果主要针对路段的车流量值进行压缩。提取同一路段、道路交通时间序列 上相同时间段实时数据,基于主成分分析的道路交通时间序列上数据压缩方法,实现实时 数据的压缩。
[0123] 选取压缩比(CR)、绝对误差(AE)、对误差百分比(marerr)、误差标准差(〇)作为道 路交通流预测精度的指标,CR,mar err在式(11)、(12)已分别给出,AE,〇的计算公式分别如 下式所示:
[0126]其中, (16) (17)
[0129]其中y为重构后的时间序列上实时数据与原始实时数据的误差值;为重构后的时 间序列上实时数据与原始实时数据的误差平均值。
[0130]三条实验路段2011年6月19、25、26日流量数据的压缩结果统计分析如下表2、3、4 所示,表2为HI 2075a路段统计结果,表3为HI 3002b路段统计结果,表4为HI7000d路段统计结 果。
【主权项】
1. 一种基于主成分分析算法的道路交通时间序列数据压缩方法,其特征在于:所述方 法包括以下步骤: 1) 基于道路交通特征参考序列的历史数据,获取道路交通投影矩阵,过程如下: 从道路交通特征参考序列中提取该路段同一模态、同一时段的交通状态时间序列上历 史数据,并将其变换为?\9的矩阵,记为^[^(1,其中,?\9 = 11; 矩阵Ap X q第j列的均值为:(!) 基于aj,获得Apxq的归一化矩阵SApxq:(2) 归一化矩阵SA的协方差矩阵CSA为:(3) 获得协方差矩阵CSA的特征值D和特征向量V,则D= [A1J2…λ。] 2 λ2 2…2 Aq5V = [vi,V2---Vq]; 则前i个特征值对应的累积贡献率Per (i)为:(4) 设定累积贡献率的阈值为Thr,则选取阈值范围内的特征向量构成投影矩阵,即为: VS= [vi,V2---vr] Per(r)>Thr (5) 基于投影矩阵VS,获取零均值矩阵的主成分PApxr: PApxr=SApxqXVSqxr (6) 其中,P表示矩阵的行,q表示矩阵的列,η表示历史数据采集个数,0〈p〈n,0〈q〈n; Ai、Vi分 别表示第i个特征值和特征向量,〇〈i〈q,压缩比为:r/q,基于压缩比,获取最优的投影矩阵 和相应的(p,q); 2) 基于投影矩阵和时间序列上实时数据构成的数据矩阵,获取数据矩阵的主成分,实 现道路交通时间序列上实时数据的压缩,过程如下: 获取道路交通时间序列上实时数据,并将其变换为P X q的矩阵,记为:Bpxq,其中,p X q =n; 矩阵Bpxq第j列的均值为:(J) 基于bj,获得Bpxq的零均值矩阵SBpxq: SBij= (Bi, j-bj) (8) 基于投影矩阵VS,获取零均值矩阵的主成分PBpxr: PBpxr=SBpxqXVSqxr (9) 实现零均值化处理后的矩阵的压缩,间接实现道路交通时间序列上实时数据的压缩, 压缩比为:r/q。2.如权利要求1所述的一种基于主成分分析算法的道路交通时间序列数据压缩方法, 其特征在于:所述方法还包括以下步骤: 3)基于数据矩阵的主成分和投影矩阵,求取重构的实时数据,实现道路交通时间序列 上实时数据的解压,过程如下: 基于道路交通实时数据零均值化处理矩阵的主成分PBpxr和投影矩阵的转置VSt,重构 道路交通实时数据零均值化处理矩阵CStSBpxq: CStSBpxq = PBpxr X VSqxrT (10) 基于重构道路交通实时数据零均值化处理矩阵和均值数据,重构道路交通数据矩阵 cstBi, j : cstBi, j = CstSBi, j+bj (11) 〇
【文档编号】G06F17/16GK105893331SQ201610183761
【公开日】2016年8月24日
【申请日】2016年3月28日
【发明人】徐东伟, 王永东, 张贵军, 李章维, 周晓根, 郝小虎, 丁情, 吴浪
【申请人】浙江工业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1