基于大量时间序列的交通流因果关系挖掘方法

文档序号:9304848阅读:377来源:国知局
基于大量时间序列的交通流因果关系挖掘方法
【技术领域】
[0001] 本发明涉及交通信息处理技术领域,特别涉及一种基于大量时间序列的交通流因 果关系挖掘方法。
【背景技术】
[0002] 在智能交通系统中,精确可靠的交通流量预测在交通控制策略制定、交通流量分 配优化等方面起到了重要作用,因此如何提高交通预测的精度一直是智能交通系统交通预 测领域中的一个重点。
[0003] 近年来,除了在改进单传感器预测模型上进行不断的尝试,研究人员越来越关注 如何利用多个传感器检测数据间存在的相关关系来提高预测精度,诸多研究证明,如果可 以有效利用目标检测点相关的其它检测点数据,确实能够有效提高交通预测精度。
[0004] 虽然在其它领域已经对提取因果关系的方法有了一段时间的应用,但是在交通领 域仍缺少完整有效的交通流时间序列关系的评定方法,同时随着交通数据量的不断增大, 如何在仅占用有限的硬件资源的情况下,快速高效的从大量的时间序列中提取出与目标节 点间存在因果关系的时间序列的问题也日益突出。目前,出现了一些相关的技术方案,例如 一种基于格兰杰因果性的脑电源定位方法,而所关注的问题是利用格兰杰因果性理论对检 测到的电信号间的因果性进行一对一的验证,并没有关注大量时间序列情况下求解时间耗 费等求解效率问题。另一种方案提出了一种基于行为时间序列的社交网络因果关系发现 算法,而该方法所关注的问题是全局因果关系图的建立、因果影响滞后期确定、因果关系图 的结构优化,通过全局因果图检查全局因果关系图中边及其对应的滞后期,剔除冗余的因 果关系以及缩短因果影响中冗余的滞后期,并没有关注原始时间序列中的波动对因果关系 提取的影响。还有一种方案为基于海洛因成瘾模型的大脑回路因果作用关系分析方法,该 方法所关注的问题为使用Granger因果关系方法确定差异核团之间的因果作用关系,并没 有关注检测数据存在异常点时对结果的影响,同时没有关注大量时间序列下的求解效率问 题。

【发明内容】

[0005] 本发明旨在至少在一定程度上解决上述相关技术中的技术问题之一。
[0006] 为此,本发明的目的在于提出一种基于大量时间序列的交通流因果关系挖掘方 法,该方法能够快速、高效地从大量时间序列中提取与目标时间序列因果相关的因果关系 时间序列,提高了后期交通流预测的精度,并且能够一定程度上抑制交通流突变点对因果 关系判定结果的影响。
[0007] 为了实现上述目的,本发明的实施例提出了一种基于大量时间序列的交通流因果 关系挖掘方法,包括以下步骤:S1 :获取待测区域内的多个检测点上连续多天的交通流时 间序列;S2 :预处理过程,包括:对每个检测点检测到的每天的交通流时间序列进行时间聚 合,以压缩生成期望的时间序列,根据所述期望的时间序列对交通流缺失数据进行补偿,并 对所述每天的交通流时间序列进行去趋势处理;S3 :选取目标检测点及因果关系备选检测 点,并分别对所述目标检测点和所述因果关系备选检测点进行如所述S2中的预处理,以得 到所述目标检测点预处理后的交通流时间序列和所述因果关系备选检测点预处理后的交 通流时间序列;S4 :根据所述目标检测点预处理后的交通流时间序列和所述因果关系备选 检测点预处理后的交通流时间序列提取因果关系时间序列;S5 :判断是否需要对除所述目 标检测点和因果关系备选检测点外的剩余检测点进行因果关系提取,如果是,则返回所述 S3,否则,输出所述因果关系时间序列。
[0008] 另外,根据本发明上述实施例的基于大量时间序列的交通流因果关系挖掘方法还 可以具有如下附加的技术特征:
[0009] 在一些示例中,在所述步骤S2中,进一步包括:对同一检测点检测的连续多天的 交通流数据进行时间聚合及交通流缺失数据补偿后为:
[001 0]Ytl -[ytii)yti2> ? ? ? >ytin] > ,YtN- [ytNi,ytN2,...,ytNn],
[0011] 其中,n表示所述检测点每天的交通流采样点数;
[0012] 则所述检测点的交通流趋势通过如下公式得到:
[0013]
[0014] 去趋势处理后的交通流时间序列为:
[0015] ^{1 ~ ^1 _^Jierage^tN~ ~^Aiierage ? '9 O
[0016] 在一些示例中,所述步骤S4进一步包括:
[0017] S41 :采用如下公式对所有的交通流时间序列进行预处理:
[0018]
[0019] 其中,表示所述交通流时间序列的标准差,晃表示时间序列{yt} 为所述目标检测点预处理后的交通流时间序列,{vZ1为剩余的检测点预处理后的交通流时 间序列,其中j=I,一,
[0020] 求解标准Lasso回归问题,其中,所述标准Lasso回归问题描述如下:
[0021]
[0022] 其中,P表示可能存在因果关系的时间序列个数,A是范数惩罚权重,用以决定所 得回归系数ajP摩的稀疏度;
[0023]S42 :对所述可能存在因果关系的时间序列进行RobustLassoGranger因果关系 模型求解,以选取备选因果关系时间序列,其中,所述RobustLassoGranger因果关系模型 描述如下:
[0024]
[0025] 其中函数H(?)的数学定义如下:
[0026]
[0027] 该函数对残差值小于m(m>0)的残差设定为平方惩罚,对于残差值大于m的残差则 采用线性惩罚;
[0028]S43 :对得到的所述备选因果关系时间序列进行一对一的Granger-Wald假设检 验,以判断每一个时间序列与目标时间序列间的因果相关性关系,具体包括:
[0029] 分别进行如下两个回归分析:
[0032] 其中,{xt}为待验证的备选因果关系时间序列,L是预测中使用的最大的时间延 迟,l和et,2分别代表以上两个回归分析中t时刻的残差值,aJPbiS相应的回归系 数,
[0033] 计算统计量GWSin&为:
[0034]
[0035] 其中,<2是残差序列{et,2}方差的估计值,<,是残差序列{et,J方差的估计 值,采样点为t=L+1,…,N),
[0036] 当序列{xj与序列{yj间不存在Granger因果关系成立时,统计量GWSingle将服 从自由度为L的卡方分布,当序列{xj与序列{yt}间不存在Granger因果关系被具有显著 意义的GWSingl(J/f否定时,则判定序列{xj与序列{yt}间存在Granger因果关系,否贝lj,则 认为两者不存在Granger因果关系。
[0037] 根据本发明实施例的基于大量时间序列的交通流因果关系挖掘方法,能够快速、 高效地从大量时间序列中提取与目标时间序列因果相关的因果关系时间序列,提高了后期 交通流预测的精度。另外,该方法中包含的门限策略下的标准Lasso模型及robustLasso Granger因果关系模型在提取因果关系过程中可以有效的抑制交通流数据突变点对因果关 系造成的影响,包含的拆分求解策略及ADMM求解算法在降低运算过程中的硬件消耗、提高 求解速度上有着极大的优势。
[0038] 本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变 得明显,或通过本发明的实践了解到。
【附图说明】
[0039] 本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变 得明显和容易理解,其中:
[0040] 图1是根据本发明一个实施例的基于大量时间序列的交通流因果关系挖掘方法 的流程图;
[0041] 图2是根据本发明一个实施例的因果关系时间序列的提取流程示意图。
【具体实施方式】
[0042] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终 相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附 图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
[0043] 以下结合附图描述根据本发明实施例的基于大量时间序列的交通流因果关系挖 掘方法。
[0044] 图1是根据本发明一个实施例的基于大量时间序列的交通流因果关系挖掘方法 的流程图。如图1所示,该方法包括以下步骤:
[0045] 步骤S1 :获取待测区域内的多个检测点(如1000个或2000个等)上连续多天 (如三周或一个月等)的交通流时间序列。
[0046] 步骤S2 :预处理过程,包括:根据需求,对每个检测点检测到的每天的交通流时间 序列进行时间聚合,以压缩生成期望的时间序列,根据期望的时间序列对交通流缺失数据 进行补偿,而后对每天的交通流时间序列进行去趋势处理。
[0047] 具体地说,在本发明的一个实施例中,假设同一检测点检测的连续多天的交通流 数据进行时间聚合及交通流缺失数据补偿后为:
[0048]Ytl -[ytii)yti2> ? ? ? >ytin] > ,YtN- [ytNi,ytN2,...,ytNn],
[0049] 其中,n表示该检测点每天的交通流采样点数,如果将采样间隔设定为30秒,则有 n= 2880。
[0050] 则该检测点的交通流趋势通过如下公式(简单平均的方法)得到:
[0051]
[0052] 去趋势处理后的交通流时间序列为:
[0053]
[0054] 步骤S3 :根据需要选取目标检测点及因果关系备选检测点,并分别对目标检测点 和因果关系备选检测点进行如S2中的预处理,以得到目标检测点预处理后的交通流时间 序列{yj和因果关系备选检测点预处理后的交通流时间序列其中j= 1,…,不同的 取值代表不同的时间序列。
[0055] 步骤S4 :根据目标检测点预处理后的交通流时间序列和因果关系备选检测点预 处理后的交通流时间序列提取因果关系时间序列。换言之,即该步骤的目的为从大量时间 序列数据中挑选出有限的可能与目标时间序列具备相关性的时间序列。
[0056] 在本发明的一个实施例中,如图2所示,步骤S4进一步包括:
[0057] 步骤S41:采用如下公式对所有的交通流时间序列进行预处理:
[0058]
[0059] 其中表示交通流时间序列的标准差,卩表示时间序列{yt}、{r/},{yt}为目 标检测点预处理后的交通流时间序列,为因果关系备选检测点预处理后的交通流时间 序列,其中j= 1,…;
[0060] 而后,求解一系列的标准Lasso回归问题(拆分求解策略),以减少求解过程对硬 件资源的要求,对问题进行适当的拆分,以确保每一次求解的标准Lasso回归问题规模在 普通PC的承受范围内。其中,标准L
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1