基于在线标定的快速路交通流数据填补方法及系统与流程

文档序号:13473914阅读:180来源:国知局
基于在线标定的快速路交通流数据填补方法及系统与流程

本发明属于智能交通控制系统领域,尤其涉及一种基于在线标定的快速路交通流数据填补方法及系统。



背景技术:

近年来,城市快速路由于交通需求不断增加而出现日益严重的交通拥堵。为了缓解拥堵,用于快速路控制的智能交通系统已经在实际中应用。智能交通控制系统利用交通流检测器收集数据,进行交通状态估计或预测,并优化和提出控制决策。快速路控制系统在很大程度上依赖于实时交通数据,然而由于硬件故障或通信失败,实时收集的数据很容易遇到数据丢失或错误等问题。交通控制系统的有效运行需要准确完整的数据,交通数据在很短的时间内丢失会引起交通控制系统暂停使用,暂时的停止将导致系统性能不可靠,并可能危及交通安全。因此,在应用交通控制策略之前,必须设计能够解决数据缺失或错误问题的填补方法,以提高交通控制系统的数据质量。针对此,本发明给出了一种交通流缺失数据填补方法。

城市快速路上的交通检测器每天都会收集大量的数据,由于存储空间和处理时间有限,实时快速路控制需要实用、准确、高效的数据填补方法。现有研究已有可在线应用的数据填补方法。然而,这些在线填补方法仅考虑了时间和空间关系的一种:将缺失数据换为同时刻历史数据平均值以反映流量的日变化趋势;或使用与周边检测器的空间相关性填补缺失数据以反映流量实时波动。然而,仅考虑时间关系无法反映每日交通流的实时特点,而仅考虑空间相关性无法在全部周边检测器失灵情况下依旧能够提供填补结果。尚无在线填补方法同时结合时间变化趋势和空间相关性修复缺失数据。此外,以往的数据填补方法应用静态模型参数,从而有可能错误地预测交通流在时间和空间上的变化。如何在兼顾时间和空间关系的基础上及在多种数据缺失情况下实现准确可靠的数据填补,是目前本领域技术人员迫切解决的技术问题。



技术实现要素:

为克服上述现有技术的不足,本发明提供了一种基于在线标定的快速路交通流缺失数据填补方法及系统,该方法基于数据检测器实时检测的数据,诊断数据缺失或错误,建立多元线性模型,通过前期数据在线标定及预测当前时间点的模型参数,并通过多元线性模型填补缺失数据。本发明具有计算简单、存储空间小、预测结果精确等优点。

为实现上述目的,本发明采用如下技术方案:

一种基于在线标定的快速路交通流数据填补方法,包括:

数据采集:对检测器分组编号,根据所述检测器采集到的交通流数据建立交通流数据库;

实时诊断:对所述检测器实时采集到的交通流数据进行诊断,诊断是否缺失或错误;

模型建立:根据各组检测器各车道数据的时间趋势和空间关系,建立多元线性模型;

在线标定:建立参数自回归预测模型,基于交通流数据库中的前期数据所得模型参数预测当前时刻的模型参数;

数据填补:根据所述多元线性模型及当前时刻的模型参数进行交通流数据填补。

所述交通流数据库包括交通流实时数据、历史数据平均值和各时刻的前期数据,所述各时刻的前期数据是指该时刻之前指定时间步长内所采集的数据。

所述诊断基于预先设定的交通流数据阈值、可接受区域和待诊断数据相应的上游车道数据进行的诊断模块。

若某时刻采集的交通流数据超出阈值或可接受区域,则诊断该时刻交通流数据为错误数据;若某时刻采集的交通流数据为零,且其相应的上游车道数据非零,则诊断该时刻为缺失数据。

通过实时诊断为每个检测器获取数据完整性指标:

m为检测器分组编号,n为每条车道检测器编号。

所述模型建立基于时间趋势和空间相关性;所述时间趋势通过同时刻历史数据的平均值反映,所述空间相关性体现在检测器之间相关性所得到的代表即时波动的估计值。

所述模型建立阶段建立多元线性模型:

其中,xest表示交通流数据向量,α,β和γ为模型参数,α用于体现交通流数据空间相关性;β用于体现交通流数据与时间平均趋势的相关性;

β=diag(β1,β2,...,βn)

δ=diag(△1,△2,...,△n)

x=(x1,...,xn)t

γ=(γ0,...,γn)t为常数项;αij表示填补车道i时根据数据空间相关性得到的车道j在多元线性模型中的系数;βi为填补车道i数据时车道i的时间平均趋势在多元线性模型中的系数;δ为数据完整度矩阵;ω=diag(1,...,1);x为检测器检测到的流量或密度;为同时刻历史数据的平均值;ε=(ε0,...,εn)t为误差项。

所述在线标定具体包括:根据建立的多元线性模型,采用前几个时间步长内的前期数据,运用最小二乘法对模型参数进行优化,使误差项接近于零;通过重复优化过程,得到与前期数据对应的模型参数;基于前期数据对应的模型参数预测当前时刻的模型参数。

根据本发明的第二目的,本发明还提供了一种基于在线标定的快速路交通流数据填补系统,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行以下处理:

数据采集:对检测器分组编号,根据所述检测器采集到的交通流数据建立交通流数据库;

实时诊断:对所述检测器实时采集到的交通流数据进行诊断,诊断是否缺失或错误;

模型建立:根据各组检测器各车道数据的时间趋势和空间关系,建立多元线性模型;

在线标定:建立参数自回归预测模型,基于交通流数据库中的前期数据所得模型参数预测当前时刻的模型参数;

数据填补:根据所述多元线性模型及当前时刻的模型参数进行交通流数据填补。

根据本发明的第三目的,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,用于快速路交通流数据填补,该程序被处理器执行时执行以下步骤:

数据采集:对检测器分组编号,根据所述检测器采集到的交通流数据建立交通流数据库;

实时诊断:对所述检测器实时采集到的交通流数据进行诊断,诊断是否缺失或错误;

模型建立:根据各组检测器各车道数据的时间趋势和空间关系,建立多元线性模型;

在线标定:建立参数自回归预测模型,基于交通流数据库中的前期数据所得模型参数预测当前时刻的模型参数;

数据填补:根据所述多元线性模型及当前时刻的模型参数进行交通流数据填补。

与现有技术相比,本发明的有益效果是:

本发明基于测量阈值、可接受区域和相应的上游数据进行对时实进行诊断,辨别错误数据和缺失数据;再在线根据前几个临近数据采集周期数据运用最小二乘法对模型参数进行标定;并基于标定结果预测当前时刻的模型参数;兼顾了交通流数据时间趋势和空间相关性对数据进行填补,可实现检测器数据暂时全部缺失情况下的数据填补,本发明具有方法精确、计算简单、存储空间要求小等优点。

附图说明

构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。

图1是本发明的一种基于在线标定的快速路交通流数据填补流程图。

图2是本发明在缺失20%数据时各车道密度数据填补的效果。

具体实施方式

应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。

实施例一

图1是本发明的一种基于在线标定的快速路交通流数据填补流程图。

本实施例提供了一种基于在线标定的快速路交通流数据填补方法,包括以下步骤:

步骤1:建立交通流数据库

对检测器分组编号,根据所述检测器采集到的交通流数据建立交通流数据库。

通过对检测器按上下游顺序进行分组编号m=1,...,m,对每条车道检测器编号n=1,...,n,建立交通流数据库,所述数据库包括实时数据、历史数据平均值和前期数据,其中所述前期数据是指当前时间点之前指定时间步长内所采集的数据。

步骤2:实时诊断

对所述检测器实时采集到的交通流数据进行诊断,诊断是否缺失或错误。

所述诊断是基于测量阈值、可接受区域和相应的上游数据,其中所述上游数据是指现采集位置对应的交通流上游所采集的数据。预先确定交通流数据的阈值和可接受范围,一旦实时收集的交通流数据超出阈值或可接受区域,则诊断该时刻交通流数据为错误。并且,如果检测器输出流量值为零,但其相应的上游车道具有非零流量,则该零流量被诊断为缺失数据。诊断算法针对各组检测器各车道得到数据完整性指标

在δ=0的车道处,激发在线标定和数据填补模块。

步骤3:模型建立

根据各组检测器各车道数据的时间趋势和空间关系,建立多元线性模型。

本发明提出了一种基于多元线性模型的数据填补方法,同时考虑了交通流数据时间趋势和空间相关性。同时刻历史数据的平均值在时间上反映了交通流变化总体趋势,而通过检测器之间相关性得到的估计值则代表了即时波动。本发明将时间趋势与空间即时波动相结合,从而得到更精确的数据填补结果。交通流数据向量xest与其他车道检测数据x和同时刻历史平均值的关系如下式所示:

其中,α,β和γ为模型参数,将在在线标定阶段确定(δ=(α,β,γ));α可体现交通流数据空间相关性,如式(2)所示,例如αij表示填补车道i时根据数据空间相关性得到的车道j在多元线性模型中的系数;β可体现交通流数据与时间平均趋势的相关性,如式(3)所示,例如βi为填补车道i数据时车道i的时间平均趋势在多元线性模型中的系数;γ=(γ0,...,γn)t为常数项;δ为每组检测器的数据完整度矩阵,如式(4)所示;ω=diag(1,...,1);x为检测器检测到的流量或密度,如式(5)所示;为同时刻历史数据的平均值(如式(6)所示);ε=(ε0,...,εn)t为误差项。

β=diag(β1,β2,...,βn)(3)

δ=diag(△1,△2,...,△n)(4)

x=(x1,...,xn)t(5)

其中,x1,...,xn和为检测器车道1到车道n的交通测量值和同时刻历史数据的平均值。

步骤4:在线标定

建立参数自回归预测模型,基于交通流数据库中的前期数据所得模型参数预测当前时刻的模型参数。

在线标定分为两个部分。首先,参数标定阶段使用前期数据对模型(式(1))参数(δ=(α,β,γ))运用最小二乘法对模型参数进行优化标定,使误差项ε接近于0。然后,通过重复优化过程,得到对前几个时间步长内前期数据分别对应的模型参数,并应用自回归预测当前时刻的模型参数如下式所示:

其中,w—自回归参数;ε—随机误差项。

步骤5:数据填补

根据所述多元线性模型及当前时刻的模型参数进行交通流数据填补。

根据步骤4得出的模型参数利用步骤3的多元线性模型进行数据填补;填补结果将更新数据库以备随后的填补使用。需填补的交通流数据向量xest按下式计算,时间趋势和空间相关性的结合确保了该算法能够在所有车道数据均缺失的情况下估计缺失值。

实施例二

本实施例的目的是提供一种基于在线标定的快速路交通流数据填补系统。

为了实现上述目的,本发明采用如下一种技术方案:

一种基于在线标定的快速路交通流数据填补系统,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行以下处理:

数据采集:对检测器分组编号,根据所述检测器采集到的交通流数据建立交通流数据库;

实时诊断:对所述检测器实时采集到的交通流数据进行诊断,诊断是否缺失或错误;

模型建立:根据各组检测器各车道数据的时间趋势和空间关系,建立多元线性模型;

在线标定:建立参数自回归预测模型,基于交通流数据库中的前期数据所得模型参数预测当前时刻的模型参数;

数据填补:根据所述多元线性模型及当前时刻的模型参数进行交通流数据填补。

实施例三

本实施例的目的是提供一种计算机可读存储介质。

为了实现上述目的,本发明采用如下一种技术方案:

一种计算机可读存储介质,其上存储有计算机程序,用于快速路交通流数据填补,该程序被处理器执行时执行以下步骤:

数据采集:对检测器分组编号,根据所述检测器采集到的交通流数据建立交通流数据库;

实时诊断:对所述检测器实时采集到的交通流数据进行诊断,诊断是否缺失或错误;

模型建立:根据各组检测器各车道数据的时间趋势和空间关系,建立多元线性模型;

在线标定:建立参数自回归预测模型,基于交通流数据库中的前期数据所得模型参数预测当前时刻的模型参数;

数据填补:根据所述多元线性模型及当前时刻的模型参数进行交通流数据填补。

以上实施例二和实施例三中,各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。

实验结果

现以某城市快速路交通流检测器2013年-2016年数据为例,进行实例验证。

表1列出了其中两组检测器车道间流量和密度的皮尔森相关系数,从中看出车道间流量和密度比速度更相关。从检测器1的数据看出,车道1和2比其他车道之间的流量和密度更加相关。同样,对于检测器2,车道2和3与车道1和4比其他车道的流量和密度更加相关。从中看出,车道间的数据相关性有很大的不同。

表1皮尔森相关系数

选取两个指标来量化填补精度:平均绝对百分误差(mape)和归一化均方根误差(nrmse)。这两个指标按下式计算:

数据填补方法在matlab软件中编码和实现。该测试程序可创建数据完整性矩阵,并将其中的缺失数据删除。缺失数据可完全随机,也可事先确定。在总数据量中丢失数据量的百分比,即缺失数据比例,是可调整的。测试程序每分钟查询一次数据库数据,通过诊断算法诊断完整性,生成一个数据完整性矩阵,并将其输入到填补模块中。填补模块进行填补计算并将计算值填补到缺失数据位置。在随后的计算中,填补值将被视为真实值以备填补其他数据。

为了评估时间趋势在模型中的作用,本发明首先将该模型与只考虑空间相关性的模型进行了比较。模型1是本文所提出的模型(即公式(1)),模型2是只利用空间相关性填补缺失数据的模型(即公式(10))。这一部分的评估运用离线标定,假设缺失数据在预定的车道,而不是完全随机的,预定车道上的数据被假定为全天全部缺失。

利用检测器1中2015年5月前两周工作日的数据进行标定的,然后利用当月第三周工作日的数据对模型进行了评估。表2列出了得到的模型系数和统计值。结果发现,在所有情况下同时考虑时间趋势和空间相关性的模型提高了填补精度。模型1所得的r2值均大于0.8。另外,所有mape和nrmse值均比模型1小,特别是第3车道估计值得到了明显的改善。因此,将时间趋势纳入填补模型中显著提高了填补精度。

表2模型的系数和统计值

(a)流量数据缺失填补

(b)密度数据缺失填补

在确定了模型中引入时间趋势的有效性之后,接下来将对比在线标定和离线标定在数据填补中的效果,阐明在线标定对填补精度的提升及其在交通控制系统中的适用性。在线标定模型动态生成模型参数,而离线标定模型从历史数据中标定固定模型参数。按照一定的缺失数据比例,从数据库中随机删除数据。缺失数据比例从5%到30%不等。对于每一种缺失数据比例,生成不同的缺失数据情况运行20次填补。图2显示了检测器1缺失20%数据进行密度数据填补的效果。图中显示了在线和离线标定数据填补结果与完整数据的比较。与离线标定数据填补相比,在线标定数据填补更贴合原始数据。在晚高峰时段,在线标定填补能够捕捉到密度突然增加或减少的情况。相反,离线标定填补造成了不合理的填补结果波动。在线标定下mape值从0.101下降到0.075,nrsme值从0.1978下降到0.1490,比离线标定填补提供更好的数据填补效果。

本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。

上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1