基于时间和路段相关性的数据修复方法

文档序号:10725418阅读:248来源:国知局
基于时间和路段相关性的数据修复方法
【专利摘要】本发明提出了一种基于时间和路段相关性的数据修复方法,包括:获取经过数据清洗的动态交通数据;对所述动态交通数据进行基于时间相关性模型的修复,包括:采用二次指数平滑法对所述动态交通数据中连续点上缺失的交通进行预测,得到修复的观测值对所述动态交通数据进行基于路段相关性模型的修复,包括:根据相邻路段之间的相关,计算缺失数据路段上的车辆速度;根据vti,t和vsi,t计算基于时间相关性模型和路段相关性模型线性融合的i表示路段编号。本发明提高了数据修复的质量和数据修复预测的精度,从而提高了道路交通状态的检测精度。
【专利说明】
基于时间和路段相关性的数据修复方法
技术领域
[0001] 本发明涉及智能交通及车联网技术领域,特别涉及一种基于时间和路段相关性的 数据修复方法。
【背景技术】
[0002] 随着ITS(Intelligent Transport System,智能交通系统)的广泛发展,动态交通 数据的应用越来越广泛。通常所说的动态交通数据的清洗包括原始数据中异常数据的识 另IJ、过滤和修复等过程。由于数据过滤会引起信息的丢失,为保证城市道路交通状态预测的 精确性,有必要使用数据修复方法对缺失的数据进行修复。目前常用与数据修复的算法有 加权平均算法和指数平滑法等两种。
[0003] (1)加权平均算法是一种优先考虑相邻时间对缺失数据的影响的算法。一般而言, 观测值与缺失数据时间相隔越大,其对缺失数据的贡献因子越小;观测值与缺失数据时间 相隔越小,其对缺失数据的贡献因子越大。但是该算法只考虑当前相邻时间间隔内观测值 对缺失数据的影响,并没有不考虑缺失点的历史趋势,缺乏一定的灵活性。
[0004] (2)二次指数平滑法是在移动平均方法基础发展起来的一种时间序列分析预测算 法,是对市场现象中的实际观测值计算两次平滑值,并由此建立预测模型,对市场现象进行 预测的方法。相对于一次指数平滑法,二次指数平滑法适用于预测有明显趋势变化的市场 现象,而且可以实现对市场现象的多期预测和修复。
[0005] 二次指数平滑法修复缺失数据的关键在于平滑系数的取值,根据以往的研究资 料,如果样本点整体波动较大,则平滑系数的值应取大一些,即增加近期样本点对预测结果 的影响。如果样本点整体平稳,则平滑系数的值应取小一些。然而,实际的交通系统中,车辆 在道路网中采集的信息复杂多样,并不能完全根据采集的交通信息就能判定出需要使用的 修复模型。此外,在相邻时间间隔和相邻路段采集的信息很难同步,这意味着如果只考虑交 通信息的路段相关性或时间相关性来修复数据,很大程度上将大大增大数据修复的误差。
[0006] 因此,为提高数据修复和预测的精确度,有必要同时考虑城市道路网中路段的时 间相关性和路段相关性,对缺失的数据进行修复。

【发明内容】

[0007] 本发明的目的旨在至少解决所述技术缺陷之一。
[0008] 为此,本发明的目的在于提出一种基于时间和路段相关性的数据修复方法,提高 了数据修复的质量和数据修复预测的精度,从而提高了道路交通状态的检测精度。
[0009] 为了实现上述目的,本发明的实施例提供一种基于时间和路段相关性的数据修复 方法,包括如下步骤:
[0010]步骤S1,获取经过数据清洗的动态交通数据;
[0011]步骤S2,对所述动态交通数据进行基于时间相关性模型的修复,包括:采用二次指 数平滑法对所述动态交通数据中连续点上缺失的交通进行预测,得到修复的观测值其 中,T表示待修复数据与已知采样点的时间间隔,t表示当前时刻;
[0012] 步骤S3,对所述动态交通数据进行基于路段相关性模型的修复,包括:根据相邻路 段之间的相关,计算缺失数据路段上的车辆速度<,r表示缺失数据所在的路段号;
[0013] 步骤S4,根据步骤S2中的计算出时间相关模型下的道路车辆速度vt1>t,根据步 骤S3中的vf计算出路段相关模型下的道路车辆速度 Vsi,t,根据vti,t和vsi,t计算基于时间相 关性模型和路段相关性模型线性融合的?, i表示路段编号。 ':,
[0014] 进一步,在所述步骤S2中,
[0015] v-tvF = at -¥htT i
[0016] 其中,at,bt分别表示模型参数。
[0017] 进一步,
[0020] 其中,vf表示一次指数平滑所得的值,vf1表示二次指数平滑所得的值,令 # = C = >VQ表示用于预测数据的第一个速度值,〇1表示平滑常数,ai e (〇,1)。
[0021] 进一步,对下式取最小值,得到CH,
[0025]其中,r表示缺失数据所在的路段号,矿表示与路段r相邻的路段的总条数,表示相 邻路段的序列号,表示相邻路段h在时间t时的车辆速度;/?'表示权值因子
[0027]其中,<表示缺失数据所在路段r与其他相邻路段之间的路段相关系数。
[0028] 进一步,在所述步骤S4中,
[0029] = az · vt, , +(\-a2)· v.v,,
[0030] 其中,\表示路段^的道路交通速度,〇2表示平滑系数,α2 e (〇,1)。
[0031 ]根据本发明实施例的基于时间和路段相关性的数据修复方法,将时间相关性修复 和路段相关性修复进行融合,对缺失的交通状态数据进行修复。提出的基于时间-路段相关 性模型进行数据修复的方法是可行的。从实际的城市道路网来,路段之间错综复杂,相互影 响。本发明相较于基于时间相关性模型的数据修复,修复结果更逼近实际观测值,数据修复 的质量更高,提高了数据修复预测的精度,从而提高了道路交通状态的检测精度,为后期交 通策略的制定提供了理论基础。
[0032] 本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变 得明显,或通过本发明的实践了解到。
【附图说明】
[0033] 本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得 明显和容易理解,其中:
[0034] 图1为根据本发明实施例的基于时间和路段相关性的数据修复方法的流程图;
[0035] 图2为根据本发明实施例的局部路段空间分布示意图。
【具体实施方式】
[0036] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终 相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附 图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
[0037] 本发明提出一种基于时间和路段相关性的数据修复方法,通过建立在完善的"端 (客户端)-管(管理系统)-云(云平台)"三层架构之上。利用道路参数的阈值属性,实现车云 平台数据的清洗;根据缺失数据的类型,使用城市道路网中路段的时间相关性和路段相关 性进行缺失数据的修复。
[0038] 如图1所示,本发明实施例的基于时间和路段相关性的数据修复方法,包括如下步 骤:
[0039] 步骤S1,获取经过数据清洗的动态交通数据。
[0040] 具体地,如果采集的动态交通数据在相邻一段时间间隔内相对比较完整,则可以 采用交通信息的时间相关模型对数据进行修复和预测。
[0041] 在道路网中相邻路段信息比较完整的情况下,交通信息的路段相关模型更适用数 据的修复和预测。
[0042] 步骤S2,对动态交通数据进行基于时间相关性模型的修复,包括:采用二次指数平 滑法对动态交通数据中连续点上缺失的交通进行预测,得到修复的观测值,
[0043] ν?+τ: = at + btf (: 1:)
[0044] 其中,T表示待修复数据与已知采样点的时间间隔,T = 1,2,…,t表示当前时刻,中 间变量£lt,bt分别表示模型参数。
[0045] at,bt可以通过以下公式计算得到:

[0048] 其中,表示一次指数平滑所得的值,vf表示二次指数平滑所得的值,令 # = vf = VU VQ表示用于预测数据的第一个速度值,〇1表示平滑常数,aie (〇, 1)。 .,
[0049] 令绝对误差
[0051]理论上预测值越接近实际观测值,即ε越小,说明数据修复越成功,此时的al即最 优的平滑系数。因此,对公式(4)取最小值,得到的〇1即为最优值。
[0052]图2为单车道的局部路段空间分布示意图。
[0053] 如图2所示,黑色圆圈表示路口,实线表示道路(A1至A9路段),箭头表示道路交通 流方说向。由于以单车道为例,因此箭头为单向箭头。表1列出了图2中非高峰时段内路段A6 与其他路段之间的相关系数。由表1可知,相邻路段的相关系数相对较大,路段之间的相关 系数随着路段之间距离的增大而变小。需要注意的是,路段A6和上下流路段,即路段A5和路 段A9之间的相关系数相对其他路段要大,而平行路段之间的相关系数相对比较小。例如,路 段A6与路段A1、路段A2和路段A3之间的相关系数较小。因此,路段之间的相关系数可以通过 相邻路段之间的道路平均速度计算得到。
[0054]
[0055] 表 1
[0056] 步骤S3,对动态交通数据进行基于路段相关性模型的修复,包括:根据相邻路段之 间的相关,计算缺失数据路段上的车辆速度<,r表示缺失数据所在的路段号;
[0058]其中,r表示缺失数据所在的路段号,矿表示与路段r相邻的路段的总条数,表示相 邻路段的序列号,<(/〇表示相邻路段h在时间t时的车辆速度表示权值因子
[0060] 其中,r/表示缺失数据所在路段r与其他相邻路段之间的路段相关系数。
[0061] 在本发明的一个实施例中,路段之间的相关系数随时间变化而变化,如果数据之 间没有相关性,则 <可以取数据缺失日期之间一段时间内的相关系数的平均值。
[0062] 步骤S4,根据步骤S2中的;;&计算出时间相关模型下的道路车辆速度vt1>t,根据步 骤S3中的 <计算出路段相关模型下的道路车辆速度vsi,t,根据vti,t和vsi,t计算基于时间相 关性模型和路段相关性模型线性融合的% ^表示路段编号。
[0064] 其中,<表示路段^的道路交通速度,〇2表示平滑系数,a2 e (〇,1)。
[0065] 由此,&即为基于时间相关性和路段相关性进行数据修复后得到的缺失数据。采 用上述方法对各个路段上的车辆缺失的交通数据进行修复,从而可以得到较为准确道路交 通状态,为后期应用分析提供准确的数据基础。
[0066] 根据本发明实施例的基于时间和路段相关性的数据修复方法,将时间相关性修复 和路段相关性修复进行融合,对缺失的交通状态数据进行修复。提出的基于时间-路段相关 性模型进行数据修复的方法是可行的。从实际的城市道路网来,路段之间错综复杂,相互影 响。本发明相较于基于时间相关性模型的数据修复,修复结果更逼近实际观测值,数据修复 的质量更高,提高了数据修复预测的精度,从而提高了道路交通状态的检测精度,为后期交 通策略的制定提供了理论基础。
[0067] 在本说明书的描述中,参考术语"一个实施例"、"一些实施例"、"示例"、"具体示 例"、或"一些示例"等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特 点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不 一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何 的一个或多个实施例或示例中以合适的方式结合。
[0068] 尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例 性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨 的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。本发明的范围 由所附权利要求极其等同限定。
【主权项】
1. 一种基于时间和路段相关性的数据修复方法,其特征在于,包括如下步骤: 步骤S1,获取经过数据清洗的动态交通数据; 步骤S2,对所述动态交通数据进行基于时间相关性模型的修复,包括:采用二次指数平 滑法对所述动态交通数据中连续点上缺失的交通进行预测,得到修复的观测值,其中,T 表示待修复数据与已知采样点的时间间隔,t表示当前时刻; 步骤S3,对所述动态交通数据进行基于路段相关性模型的修复,包括:根据相邻路段之 间的相关,计算缺失数据路段上的车辆速度<,r表示缺失数据所在的路段号; 步骤S4,根据步骤S2中的;:w计算出时间相关模型下的道路车辆速度^i,t,根据步骤S3 中的 < 计算出路段相关模型下的道路车辆速度VSi,t,根据和VSi,t计算基于时间相关性 模型和路段相关性模型线性融合的i表示路段编号。2. 如权利要求1所述的基于时间和路段相关性的数据修复方法,其特征在于,在所述步 骤S2中,其中,at, bt分别表示模型参数。3. 如权利要求2所述的基于时间和路段相关性的数据修复方法,其特征在于,其中,V严表示一次指数平滑所得的值,咕"表示二次指数平滑所得的值,令皆j = vf = ?, VO表示用于预测数据的第一个速度值,αι表示平滑常数,αι e (Ο,1)。4. 如权利要求3所述的基于时间和路段相关性的数据修复方法,其特征在于,对下式取 最小值,得到曰1,5. 如权利要求1所述的基于时间和路段相关性的数据修复方法,其特征在于,在所述步 骤S3中,其中,r表示缺失数据所在的路段号,HT表示与路段r相邻的路段的总条数,表示相邻路 段的序列号,<林)表示相邻路段h在时间t时的车辆速度;爲表示权值因子其中,语表示缺失数据所在路段r与其他相邻路段之间的路段相关系数。6.如权利要求1所述的基于时间和路段相关性的数据修复方法,其特征在于,在所述步 骤S4中,其中,表示路段ri的道路交通速度,表示平滑系数,e (0,1)。
【文档编号】G06F19/00GK106096302SQ201610459938
【公开日】2016年11月9日
【申请日】2016年6月22日
【发明人】刘化胜, 李从萍, 董文杰
【申请人】江苏迪纳数字科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1