一种基于增量核主成分分析的增量轨迹异常检测的方法

文档序号:10656150阅读:288来源:国知局
一种基于增量核主成分分析的增量轨迹异常检测的方法
【专利摘要】一种基于增量核主成分分析的增量轨迹异常检测的方法,属于增量轨迹异常检测的方法。该方法:首先进行模型的初始化计算,使用传统的Batch KPCA进行初始核特征空间计算,每当有M条新增轨迹数据到来时,先对这M条轨迹数据进行标准化;然后使用Batch KPCA计算新增数据的核特征空间;分别计算新增数据和训练数据的平均重建误差,如果两者误差大于给定阀值,则执行后续的核特征空间分割?合并方法,更新核特征空间;接着对更新后的核特征空间进行投影,提取出主分量;最后利用一类支持向量机进行无监督学习和异常检测。优点:该方法优于传统的核主成分分析方法,降低了计算复杂性,提高了轨迹异常检测的效率。
【专利说明】
-种基于増量核主成分分析的増量轨迹异常检测的方法
技术领域
[0001] 本发明设及一种增量轨迹异常检测的方法,特别是一种基于增量核主成分分析的 增量轨迹异常检测的方法。
【背景技术】
[0002] 轨迹数据包含地理位置坐标、速度、方向等多种特征,可W看作一种高维数据。核 主成分分析是一种非线性的主成分分析轨迹异常检测方法,通过非线性映射将轨迹数据从 原始数据空间映射到高维特征空间中,然后在高维特征空间中运用线性主成分分析进行特 征提取。但是核主成分分析在进行核矩阵特征分解时的计算复杂度为〇(N3),严重影响在大 规模数据集上的应用。引入增量学习方式来降低时间复杂度是提高此类方法的关键。

【发明内容】

[0003] 本发明的目的是要提供一种基于增量核主成分分析的增量轨迹异常检测的方法, 解决现有核主成分分析方法的计算复杂度高的问题。
[0004] 本发明的目的是运样实现的:该方法:
[0005] 首先进行模型的初始化计算,使用传统的Batch KPCA进行初始核特征空间计算, 每当有M条新增轨迹数据到来时,先对运M条轨迹数据进行标准化;
[0006] 然后使用Batch KPCA计算新增数据的核特征空间;
[0007] 分别计算新增数据和训练数据的平均重建误差,如果两者误差大于给定阀值,贝U 执行后续的核特征空间分割-合并方法,更新核特征空间;
[000引接着对更新后的核特征空间进行投影,提取出主分量;
[0009] 最后利用一类支持向量机进行无监督学习和异常检测;
[0010] 该方法具体步骤如下:
[0011] (1)该基于增量核主成分分析的增量轨迹异常检测方法,首先需要设定滑动窗口 的大小P和每次更新的轨迹数目M;P代表了每次需要更新的核特征空间的大小,核特征空间 大小在算法执行期间固定不变;M代表了每次增量的大小;
[0012] (2)然后使用传统的Batch KPCA计算滑动数据窗口的初始核特征空间模型W及计 算其平均重建误差写之后循环批量处理新增的轨迹数据向量;在处理新增轨迹数据 向量时,先构造其核特征空间模型,计算其平均重建误差焉;
[OOU] (3)接着计算其与滑动窗口核特征空间之间的平均重建误差比率EratiO;当EratiO高 于给定阀值V时,使用核特征空间分割-合并算法更新滑动窗口核特征空间,先采用核特征 空间分割方法从滑动数据窗口中移除最早的M条轨迹数据特征向量,缩减核特征空间;然后 采用核特征空间合并方法将新增的M条轨迹数据向量合并到滑动窗口核特征空间中;
[0014] (4)同时计算滑动窗口核特征空间投影,求取主成分并计算其特征空间投影;
[0015] (5)最后使用一类支持向量机对提取的主分量进行无监督学习和异常检测,记录 检测到的异常轨迹;检测完之后,需要重新计算滑动窗口核特征空间平均重建误差 焉。,化便处理下一次新增轨迹数据。
[0016] 有益效果,由于采用了上述方案,该基于增量核主成分分析的增量轨迹异常检测 方法采用核特征空间分割-合并算法来更新核特征空间数据模型。维持一个固定大小的滑 动数据窗口,每当有M条新增轨迹到来时,先从滑动数据窗口核特征空间模型中移除最早的 M条轨迹数据,再将新增的M条轨迹数据合并到核特征空间中;只需要计算M条轨迹的核特征 空间,在原有滑动数据窗口核特征空间的基础上增量地更新核特征空间,避免了每次更新 时都要重新计算核特征空间的不足,解决了现有核主成分分析方法的计算复杂度高的问 题,达到了本发明的目的。
[0017] 优点:该方法优于传统的核主成分分析方法,降低了计算复杂性,提高了轨迹异常 检测的效率。
【附图说明】
[0018] 图1为本发明基于增量核主成分分析的增量轨迹异常检测方法框架的流程图。
[0019] 图2为本发明与基于传统KPCA的增量轨迹异常检测方法的对比效果图。
[0020] 图3为本发明异常检测效果图。
[0021 ]图4为本发明异常检测效果图。
【具体实施方式】
[0022] 下面结合附图及实施例对本发明作进一步说明。
[0023] 实施例1:首先进行模型的初始化计算,使用传统的Batch KPCA进行初始核特征空 间计算,每当有M条新增轨迹数据到来时,先对运M条轨迹数据进行标准化;然后使用Batch KPCA计算新增数据的核特征空间。分别计算新增数据和训练数据的平均重建误差,如果两 者误差大于给定阀值,则执行后续的核特征空间分割-合并方法,更新核特征空间;接着对 更新后的核特征空间进行投影,提取出主分量;最后利用一类支持向量机进行无监督学习 和异常检测。
[0024] 参见图1所示,一种基于增量核主成分分析的增量轨迹异常检测方法,包括W下步 骤:
[0025] (1)初始轨迹数据,轨迹标准化;
[0026] (2)确定一个固定大小的滑动数据窗口,计算初始核特征空间W及重建误差;
[0027] (3)计算新增数据和滑动窗口之间的平均重建误差比率,如果两者误差大于给定 阀值,则执行核特征空间分割-合并方法,更新核特征空间;
[0028] (4)计算更新后滑动窗口核特征空间投影,提取出主分量;
[0029] (5)利用一类支持向量机进行无监督学习和异常检测;
[0030] 具体方法如下;
[0031] 该基于增量核主成分分析的增量轨迹异常检测方法,首先采用Min-max方法标准 化每条轨迹,设定滑动窗口的大小P和每次更新的轨迹数目MdP代表了每次需要更新的核特 征空间的大小,核特征空间大小在算法执行期间固定不变;M代表了每次增量的大小;
[0032] 然后使用传统的Batch KPCA计算滑动数据窗口的初始核特征空间模型W及计算 其平均重建误差5,W,UW;-个n维的输入向量t通过核函数映射为一个1维的向量d) (t);重 建误差e就是声(0与其在核特征空间中投影之间的平方距离,其中多約是中屯、化后的映射向 量4 (t);之后循环批量处理新增的轨迹数据向量;在处理新增轨迹数据向量时,先构造其 核特征空间模型,计算其平均重建误差&如。,f。平均重建误差比率Eratio是新增的M条轨迹数 据的平均重建误差和滑动数据窗口中训练数据集平均重建误差之间的比值。具体计算公式 为
[0033]
[0034] 接着计算其与滑动窗口核特征空间之间的平均重建误差比率Eratio;当Eratio高于 给定阀值V时,使用核特征空间分割-合并算法更新滑动窗口核特征空间,先采用核特征空 间分割方法从滑动数据窗口中移除最早的M条轨迹数据特征向量,缩减核特征空间,核特征 空间分割方法即基于原始输入空间的特征空间分割方法,对其进行核化得到适用于增量核 主成分分析的核特征空间分割方法;然后采用核特征空间合并方法将新增的M条轨迹数据 向量合并到滑动窗口核特征空间中,核特征空间合并即经过核特征空间分割后,从滑动数 据窗口核特征空间中分割并得到由剩余轨迹构成的核特征空间模型Q=化,?x,a,A,N), 新增的M条轨迹构成的核特征空间模型为0=(V,Oy,0,A,M),合并Q和0得到更新后的 核特征空间模型Q=(W,〇z,T,n,P)。
[0035] 同时计算滑动窗口核特征空间投影,求取主成分并计算其特征空间投影;
[0036] 最后使用一类支持向量机对提取的主分量进行无监督学习和异常检测,遍历轨迹 集合,对于数据集中每条轨迹样本,利用决策函数判断异常轨迹,记录检测到的异常轨迹, 并设置相应的轨迹标签;检测完之后,需要重新计算滑动窗口核特征空间平均重建误差 馬,,,,。>,,_.,。,,W便处理下一次新增轨迹数据。
[0037] 实施例2:本发明与基于传统KPCA(Batch KPCA)的增量轨迹异常检测算法的比较;
[0038] 为了验证本发明的有效性,选取大西洋赃风数据中1990年到2006年之间的7270个 轨迹点共计221条轨迹作为实验数据集来进行验证。从图2可W看出基于传统KPCA的增量轨 迹异常检测方法的执行时间随着滑动数据窗口的增大在快速增加。而基于核特征空间分 害合并的增量轨迹异常检测算法的执行时间也会随着滑动数据窗口的增大而增加,但是 幅度不算大。并且在相同滑动数据窗口大小的情况下,基于核特征空间分割-合并的增量轨 迹异常检测算法要比基于传统KPCA的增量轨迹异常检测方法所用的计算时间更少,且随着 滑动数据窗口的增大,运种差异会越来越大。
[0039] 实施例3:本发明的异常检测效果图;
[0040] 选取本发明方法在大西洋赃风数据集上第4次迭代和第6次迭代的检测结果,如图 3和图4所示。图中较粗的线条代表检测出的异常轨迹,较细的线条代表正常轨迹。从图中可 W看出,异常检测效果很好,很多行为反常的轨迹都被检测了出来。并且从两次迭代的结果 可W看出,随着新增轨迹的不断加入,一些新的异常轨迹被检测出来,又由于核特征空间在 不断更新,一些早先的异常轨迹被忽略了。
【主权项】
1. 一种基于增量核主成分分析的增量轨迹异常检测的方法,其特征是:该方法: 首先进行模型的初始化计算,使用传统的Batch KPCA进行初始核特征空间计算,每当 有M条新增轨迹数据到来时,先对这M条轨迹数据进行标准化; 然后使用Batch KPCA计算新增数据的核特征空间; 分别计算新增数据和训练数据的平均重建误差,如果两者误差大于给定阀值,则执行 后续的核特征空间分割-合并方法,更新核特征空间; 接着对更新后的核特征空间进行投影,提取出主分量; 最后利用一类支持向量机进行无监督学习和异常检测。2. 根据权利要求1所述的一种基于增量核主成分分析的增量轨迹异常检测的方法,其 特征是:该方法具体步骤如下: (1) 该基于增量核主成分分析的增量轨迹异常检测方法,首先需要设定滑动窗口的大 小P和每次更新的轨迹数目M;P代表了每次需要更新的核特征空间的大小,核特征空间大小 在算法执行期间固定不变;M代表了每次增量的大小; (2) 然后使用传统的Batch KPCA计算滑动数据窗口的初始核特征空间模型以及计算其 平均重建误差之后循环批量处理新增的轨迹数据向量;在处理新增轨迹数据向量 时,先构造其核特征空间模型,计算其平均重建误差 (3) 接着计算其与滑动窗口核特征空间之间的平均重建误差比率。高于给 定阀值V时,使用核特征空间分割-合并算法更新滑动窗口核特征空间,先采用核特征空间 分割方法从滑动数据窗口中移除最早的M条轨迹数据特征向量,缩减核特征空间;然后采用 核特征空间合并方法将新增的M条轨迹数据向量合并到滑动窗口核特征空间中; (4) 同时计算滑动窗口核特征空间投影,求取主成分并计算其特征空间投影; (5) 最后使用一类支持向量机对提取的主分量进行无监督学习和异常检测,记录检测 到的异常轨迹;检测完之后,需要重新计算滑动窗口核特征空间平均重建误差&__^,以 便处理下一次新增轨迹数据。
【文档编号】G06K9/62GK106022368SQ201610325491
【公开日】2016年10月12日
【申请日】2016年5月17日
【发明人】张磊, 樊庆富, 刘磊军, 鲍苏宁, 张国兴
【申请人】中国矿业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1