一种无类别标签的时间序列异常检测方法

文档序号:8922694阅读:470来源:国知局
一种无类别标签的时间序列异常检测方法
【技术领域】
[0001] 本发明涉及无类别标签的时间序列异常检测方法。
【背景技术】
[0002] 通过对卫星遥测数据中的偏航姿态角进行分析,偏航姿态角的整体变化趋势如图 2所示,其细节变化如图3所示,得出卫星遥测数据具有明显地周期性,且该特性已与卫星 遥测数据提供单位进行了确认。通过对遥测数据的每个周期进行分析,可以得出卫星在该 周期之内的运行状态是否正常,按照固定点对卫星遥测数据分段效果不理想的情况,如图4 所示,各个分段序列之间的耦合度不够高,存在一定的偏差,随着时间的推进这种偏差会愈 发明显。
[0003] 目前卫星遥测数据各周期内的正常模式、异常模式、故障模式等均没有较为明确 的可参考资料,因此分段后得到的时间序列没有所属类别标签,在此类无类别标签的时间 序列基础之上实现离线和在线的异常检测目前没有可直接利用的异常检测方法框架。
[0004] 对离线数据进行异常检测,一般采用聚类方法进行,并将聚类结果中成员极少类 别视为异常类别,其中聚类方法中较为常用的聚类方法是层次聚类方法,但是该算法存在 需要人工设定聚类数目的缺陷,若聚类数目设定不当将会使得聚类结果以及异常检测结果 不够理想。

【发明内容】

[0005] 本发明的目的是为了解决针对卫星遥测数据进行固定点分段效果不理想、层次聚 类需要人工设定聚类数目以及目前尚无一种可直接利用的能够实现无类别标签时间序列 的离线和在线的异常检测方法框架的问题,而提出了一种无类别标签的时间序列异常检测 方法。
[0006] 上述的发明目的是通过以下技术方案实现的:
[0007] 步骤一、根据卫星遥测数据的周期特性对卫星遥测历史数据进行分段,得到无类 别标签的时间序列X={Xl,x2,…,xn},其中n为大于0的正整数,表示时间序列数目,Xl为无 类别标签的时间序列中第一个时间序列,x2为无类别标签的时间序列中第二个时间序列,xn 为无类别标签的时间序列中第n个时间序列;
[0008]步骤二、对步骤一得到的无类别标签的时间序列X={xpx2,…,xn}进行自适应 层次聚类,并判定和删除无类别标签的时间序列中的异常序列,得到卫星正常运行模式含 有类别标签的时间序列.
和类别标签
,其中nz为大于 〇的正整数,表示正常时间序列数目,X'i为含有类别标签的时间序列中第一个正常时间序 列,1'2为含有类别标签的时间序列中第二个正常时间序列,< 为含有类别标签的时间序 列中第nz个正常时间序列,1' :为类别标签中第一个正常时间序列,1' 2为类别标签中第二 个正常时间序列,为类别标签中第\个正常时间序列;
[0009] 步骤三、结合匹配阈值以步骤二中获得的含有类别标签的时间序列
和类别标签
为样本,采用最近邻居算法对最新卫星 遥测时间序列X"进行模式匹配,并根据模式匹配结果实现卫星遥测数据异常检测。
[0010] 发明效果
[0011] 异常检测是数据挖掘任务中的一项重要功能,本发明针对卫星运行过程中的遥 测数据特点,首先,根据卫星遥测数据的周期特性对卫星遥测历史数据进行分段;然后, 对分段后得到的无类别标签时间序列进行自适应层次聚类同时根据异常判定参数对其中 的异常类别进行删除,得到卫星正常运行的类别模式;最后,结合匹配阈值采用最近邻居 (1-NearestNeighbor,1-NN)算法对最新卫星遥测数据进行模式匹配,并根据模式匹配结 果实现卫星遥测数据异常检测。各部分的具体发明效果如下:
[0012] 首先针对按照固定点对卫星遥测数据分段效果不理想的情况,如图4所示,提出 了按照卫星遥测数据中的幅角突变点为标识进行分段的方法,其分段效果如图5所示,以 幅角为标识进行分段的分段结果更为紧凑,各个分段序列之间的耦合度更高、更为合理。
[0013] 其次,针对层次聚类需要人工设定聚类数目的问题,提出了一种以类间类内距离 比值为评价标准的自适应层次聚类方法,使层次聚类算法能够自动确定最优类别数目,避 免了由于人工设定聚类数目不当的情况导致的聚类结果以及异常检测结果不够理想的问 题。
[0014] 最后,针对目前尚无一种可直接利用的能够实现无类别标签时间序列的离线和在 线的异常检测方法框架,提出了一种无类别标签的时间序列异常检测方法。该方法首先对 历史卫星遥测数据采用自适应层次聚类方法并根据异常判定参数对其中的异常类别进行 删除,获得正常类别模式,实现离线无类别标签时间序列的异常检测;然后结合匹配阈值采 用1-NN算法对最新卫星遥测数据进行模式匹配,并根据模式匹配结果实现卫星遥测数据 异常检测,实现在线无类别标签时间序列的异常检测。
[0015] 通过对卫星遥测数据中的飞轮转速D参量采用异常注入的方式进行仿真实验,其 实验结果表明,该方法能够有效的检测出离线和在线卫星遥测数据中的异常时间序列,如 图 10、图 11a、图 11b、图llbc、图 12、图 13a、图 13b、图 13c所示。
[0016] 针对卫星遥测数据开展无类别标签时间序列离线和在线异常检测的验证实验,用 于实验的具体测试参量为飞轮转速D,其原始数据如图6所示。其中用于离线异常检测实验 的无类别标签时间序列样本数为50,所有时间序列经与数据提供单位确认已无异常,通过 采用异常准入的方式对其中一个时间序列注入脉冲型异常,异常幅值为二分之一倍参量最 大值减去最小值,注入位置为时间序列中间位置,注入异常后的样本如图10所示。
[0017] 针对上述无类别标签时间序列样本采用自适应层次聚类方法并设定异常判定参 数为〇. 05,进行异常检测结果如图1la、1lb、1lc所示,通过该结果可以发现基于自适应层 次聚类方法的异常检测方法能够有效识别异常时间序列,并对正常时间序列确定较好的类 别数目并实现聚类。
[0018] 将通过前述处理后得到的含有类别标签的正常时间序列作为1-NN分类算法的训 练样本,设定灵敏度系数为1,用于实现卫星遥测数据的在线异常检测。仿真输入测试样本 为50,所有时间序列经与数据提供单位确认已无异常,通过采用异常准入的方式对其中一 个时间序列注入阶跃型异常,异常幅值为负四分之一倍参量最大值减去最小值,注入位置 为时间序列的四分之三处位置,注入异常后的样本如图12所示。
【附图说明】
[0019] 图1为本发明流程图;
[0020] 图2为原始测试数据偏航姿态角测试序列示例图;
[0021] 图3为原始测试数据偏航姿态角测试序列前450点示例图;
[0022] 图4为偏航姿态角测试序列固定点分段叠加绘图结果图;
[0023] 图5为偏航姿态角测试序列以幅角分段叠加绘图结果图,时间单位为秒;
[0024] 图6为飞轮转速D测试序列分段叠加绘图结果图,时间单位为秒;
[0025] 图7为实施例中自适应层次聚类仿真测试数据图;
[0026] 图8为实施例中自适应层次聚类质量曲线图;
[0027] 图9为实施例中自适应层次聚类结果图;
[0028] 图10为注入异常后的无标签时间序列样本图,时间单位为秒;
[0029] 图11a为类别1基于自适应层次聚类异常检测结果图,时间单位为秒;
[0030] 图
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1