基于大量时间序列的交通流因果关系挖掘方法_2

文档序号:9304848阅读:来源:国知局
asso回归问题描述如下:
[0061]
[0062] 其中,P表示可能存在因果关系的时间序列个数,A是范数惩罚权重,用以决定所 得回归系数&1和的稀疏度(即非零元素所占比例)。
[0063] 以下描述拆分求解过程的示例:假设存在1000个有待通过鲁棒性LassoGranger 因果关系模型进行计算的时间序列(将第一个序列作为目标序列,其余999个作为可能相 关的时间序列),同时假设仅有小于100的时间序列与目标时间序列存在真实的相关关系。 则在当前步骤内,可以通过首先求解前200个时间序列的标准Lasso回归问题,之后抛弃掉 回归系数〇 (或者接近〇)所对应的100个时间序列。而后将保留下来的100个时间序列同 后续的100个时间序列(第300-399时间序列)组合,并放入到标准Lasso回归问题中进 行下一次求解。重复上述过程直至所有的Lasso问题都求解完毕,则可以确定原始的1000 个时间序列中与目标时间序列最可能相关的时间序列,该过程中采用ADMM算法加速Lasso 问题求解。
[0064] 步骤S42:对步骤S41中得到的可能存在因果关系的时间序列进行RobustLasso Granger因果关系模型求解,以进一步选取备选因果关系时间序列,其中,RobustLasso Granger因果关系模型描述如下:
[0065]
[0066] 其中函数H(?)的数学定义如下:
[0067]
[0068] 该函数对残差值小于m(m>0)的残差设定为平方惩罚,对于残差值大于m的残差则 采用线性惩罚。需要说明的是,该过程中同样采用ADMM算法对上述问题进行求解。
[0069] 步骤S43:对得到且保留下来的备选因果关系时间序列进行一对一的 Granger-Wald假设检验,以判断每一个时间序列与目标时间序列间的因果相关性关系,具 体包括:
[0070]分别进行如下两个回归分析:
[0073] 其中,{xt}为待验证的备选因果关系时间序列,L是预测中使用的最大的时间延 迟,l和et,2分别代表以上两个回归分析中t时刻的残差值,aJPbiS相应的回归系 数;
[0074] 而后,计算统计量GWSingle为:
[0075]
[0076]其中,是残差序列{et,2}方差的估计值,< 是残差序列{e方差的估计 值,采样点为t=L+1,…,N),
[0077] 当序列{xj与序列{yj间不存在Granger因果关系时,统计量GWSingl』_服从自 由度为L的卡方分布,当原假设(序列{xt}与序列{yj间不存在Granger因果关系)被具 有显著意义的GW^jS/f否定时,则判定序列{xj与序列{yt}间存在Granger因果关系,否 贝1J,则认为两者不存在Granger因果关系。
[0078] 步骤S5:判断是否需要对除目标检测点和因果关系备选检测点外的剩余检测点 进行因果关系提取,如果是,则返回步骤S3,否则,输出因果关系时间序列。
[0079] 综上,根据本发明实施例的基于大量时间序列的交通流因果关系挖掘方法,能够 快速、尚效地从大量时间序列中提取与目标时间序列因果相关的因果关系时间序列,提尚 了后期交通流预测的精度。另外,该方法中包含的门限策略下的标准Lasso模型及robust LassoGranger因果关系模型在提取因果关系过程中可以有效的抑制交通流数据突变点对 因果关系造成的影响,包含的拆分求解策略及ADMM求解算法在降低运算过程中的硬件消 耗、提高求解速度上有着极大的优势。
[0080] 在本发明的描述中,需要理解的是,术语"中心"、"纵向"、"横向"、"长度"、"宽度"、 "厚度"、"上"、"下"、"前"、"后"、"左"、"右"、"竖直"、"水平"、"顶"、"底" "内"、"外"、"顺时 针"、"逆时针"、"轴向"、"径向"、"周向"等指示的方位或位置关系为基于附图所示的方位或 位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必 须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
[0081] 此外,术语"第一"、"第二"仅用于描述目的,而不能理解为指示或暗示相对重要性 或者隐含指明所指示的技术特征的数量。由此,限定有"第一"、"第二"的特征可以明示或 者隐含地包括至少一个该特征。在本发明的描述中,"多个"的含义是至少两个,例如两个, 三个等,除非另有明确具体的限定。
[0082] 在本发明中,除非另有明确的规定和限定,术语"安装"、"相连"、"连接"、"固定"等 术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连 接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内 部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员 而言,可以根据具体情况理解上述术语在本发明中的具体含义。
[0083] 在本发明中,除非另有明确的规定和限定,第一特征在第二特征"上"或"下"可以 是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在 第二特征"之上"、"上方"和"上面"可是第一特征在第二特征正上方或斜上方,或仅仅表示 第一特征水平高度高于第二特征。第一特征在第二特征"之下"、"下方"和"下面"可以是 第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
[0084] 在本说明书的描述中,参考术语"一个实施例"、"一些实施例"、"示例"、"具体示 例"、或"一些示例"等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特 点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不 必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任 一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技 术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结 合和组合。
[0085] 尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例 性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述 实施例进行变化、修改、替换和变型。
【主权项】
1. 一种基于大量时间序列的交通流因果关系挖掘方法,其特征在于,包括以下步骤: 51 :获取待测区域内的多个检测点上连续多天的交通流时间序列; 52 :预处理过程,包括:对每个检测点检测到的每天的交通流时间序列进行时间聚合, 以压缩生成期望的时间序列,根据所述期望的时间序列对交通流缺失数据进行补偿,并对 所述每天的交通流时间序列进行去趋势处理; 53 :选取目标检测点及因果关系备选检测点,并分别对所述目标检测点和所述因果关 系备选检测点进行如所述S2中的预处理,以得到所述目标检测点预处理后的交通流时间 序列和所述因果关系备选检测点预处理后的交通流时间序列; S4:根据所述目标检测点预处理后的交通流时间序列和所述因果关系备选检测点预处 理后的交通流时间序列提取因果关系时间序列; S5 :判断是否需要对除所述目标检测点和因果关系备选检测点外的剩余检测点进行因 果关系提取,如果是,则返回所述S3,否则,输出所述因果关系时间序列。2. 根据权利要求1所述的基于大量时间序列的交通流因果关系挖掘方法,其特征在 于,在所述步骤S2中,进一步包括: 对同一检测点检测的连续多天的交通流数据进行时间聚合及交通流缺失数据补偿后 为: Yt「[ytii,yti2,---,ytin],,YtN_ [ytN 1,ytN 2,? ? ?,ytN n], 其中,n表示所述检测点每天的交通流采样点数; 謹卡於姍丨占的赤一苗、涛抬执一苗]卄fmc/入才但不il: _ j-上、^j, 去趋势处理后的交通流时间序列为:3. 根据权利要求1所述的基于大量时间序列的交通流因果关系挖掘方法,其特征在 于,所述步骤S4进一步包括: S41 :采用如下公式对所有的交通流时间序列进行预处理:其中,七^表示所述交通流时间序列的标准差,另表示时间序列{yj、{yJ为所 述目标检测点预处理后的交通流时间序列,Ixt]}为所述因果关系备选检测点预处理后的交 通流时间序列,其中j=l,…; 求解标准Lasso回归问题,其中,所述标准Lasso回归问题描述如下:其中,P表示可能存在因果关系的时间序列个数,A是范数惩罚权重,用以决定所得回 归系数ajP年的稀疏度; S42:对所述可能存在因果关系的时间序列进行RobustLassoGranger因果关系模型 求解,以选取备选因果关系时间序列,其中,所述RobustLassoGranger因果关系模型描述 如下:该函数对残差值小于m(m>0)的残差设定为平方惩罚,对于残差值大于m的残差则采 用线性惩罚; S43 :对得到的所述备选因果关系时间序列进行一对一的Granger-Wald假设检验,以 判断每一个时间序列与目标时间序列间的因果相关性关系,具体包括: 分别进行如下两个回归分析: 兵T,Ut丨止tfJ食?囚米大系时间序列,L是预测中使用的最大的时间延迟, 和et,2分别代表以上两个回归分析中t时刻的残差值为相应的回归系数; 计算统计量GWSl_为:其中,是残差序列1>t,2}方差的估计值,是残差序列(eJ方差的估计值,采 样点为t=L+l,…,N), 当序列{xj与序列{yj间不存在Granger因果关系时,统计量GWSingl廣服从自由度 为L的卡方分布,当序列{xt}与序列{yt}间不存在Granger因果关系被具有显著意义的 GWSl_所否定时,则判定序列{xt}与序列{yj间存在Granger因果关系,否则,则认为两者 不存在Granger因果关系。
【专利摘要】本发明提出一种基于大量时间序列的交通流因果关系挖掘方法,包括:S1:获取多个检测点上连续多天的交通流时间序列;S2:对每个检测点每天的交通流时间序列进行时间聚合,生成期望的时间序列,并据此对交通流缺失数据进行补偿,并对每天的交通流时间序列进行去趋势处理;S3:选取目标检测点及因果关系备选检测点,分别对其进行预处理,得到目标检测点预处理后的交通流时间序列和因果关系备选检测点预处理后的交通流时间序列;S4:根据S3得到的结果提取因果关系时间序列;S5:判断是否需要对剩余检测点进行因果关系提取,如果是,则返回S3,否则,输出因果关系时间序列。本发明的方法能够快速、高效地从大量时间序列中提取因果关系时间序列。
【IPC分类】G06Q10/04, G06N5/02
【公开号】CN105023044
【申请号】CN201510432423
【发明人】李志恒, 李力, 苏晓楠
【申请人】清华大学
【公开日】2015年11月4日
【申请日】2015年7月21日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1