一种数控系统指令域序列异常数据检测方法_4

文档序号:8943261阅读:来源:国知局
中心线,通过二分法或直接搜索法获取包络线比率r ; (2) 、构造窗宽N、临界长度X、连续异常点长度和阶梯点长度分界线Y、数据流分析长度 Z的经验公式并根据经验公式设置相应参数;初始化单步处理样本点数u、滑动窗口异常记 录多维序列Iciuuict、过程记录序列1_、过程记录正常序列ln_al; (3) 、利用N确定滑动窗口长度,利用滑动窗口分割数据流,利用简单移动平均法或多 项式拟合法获取滑动窗口数据中心线,利用滑动窗口数据中心线、r、公式yk= xk±r · R求 取当前滑动窗口上下包络线,R为样本值偏离中心线值的均方差,包络线外样本为当前滑动 窗口内判定的异常点,存入Iciuuict,当前滑动窗口内异常点判定完毕后,利用过程记录序列 1_、过程记录正常序列ln_al、X、Y确定最终判定类型; (4) 、达到指定的数据流分析长度Z时,结束异常检查,否则清除序列号为(i-l)u+N+l、 (i-l)u+N+2.....i · u+N的数据缓存,进入第i+1个滑动窗口的分析。2. 如权利要求1所述的方法,其特征在于,所述步骤(1)中简单移动平均法或多项式拟 合法具体为: 简单移动平均法如下:其中X1为序列号为i的样本点,yk为获取的第k个中心点值,d为移动平均项数,[d/2] 为向左取整,d计算方法如下: d = k3l (2) 多项式拟合法确定多项式项数w后,数据中心线多项式为:yk= awxkw+aw k…+a。,利 用最小二乘法求取多项式系数a。、S1、…、aw, 根据数据中心线、r,上下包络线公式如下: yk=xk±r,R (3) 其中r为包络线比率,R为样本值偏离中心线值的均方差,在式(3)外的样本点为滑动 窗口内判定的异常点。3. 如权利要求1或2所述的方法,其特征在于,所述步骤(1)中利用二分法搜索获取r 具体包括如下步骤: (1-1)、给定最小和最大r分别为a。、最大迭代次数k,令当前迭代次数i = 1 ; (1-2)、根据公式(3)依次计算包络线比率分别为a。、ai,时是否满足条件3,满足输出 满足条件的值,迭代结束,否则转入(1-3); (1-3)、令 i = i+Ι,左右节点 L、R 分别为 a。、a1;a ;= (L+R)/2 ; (1-4)、若&1满足条件1,则需要减小r,使包络线外样本增加,故左节点不变,右节点更 新为a1;若满足条件2,则需要增大r,使包络线外样本减少,故右节点不变,左节点更新为 Si; (1-5)、重复步骤(1-3)、(1-4),直到满足条件3或达到最大迭代次数,输出最终r; 其中二分法搜索获取r的条件如下: 条件1:包络线外样本点数小于kl · 1 ; 条件2:包络线外样本点数大于k2 · 1 ; 条件3:包络线外样本点总数小于k2 · 1,大于kl · 1 ; 其中,所述kl是最小异常数据占样本总量的比率,k2是最大异常数据占样本总量的比 率。4. 如权利要求1或2所述的方法,其特征在于,所述步骤(1)中利用直接搜索法获取r 具体包括如下步骤: 从最大值%或最小值a。,按照指定步长s搜索减小或增大r值,为达到精度q要求,S需满足:正负代表搜索方向,为正则由a。开始搜索,反之从a i开始。5. 如权利要求1或2所述的方法,其特征在于,所述步骤(2)中: 窗宽N根据采样周期T、单步处理样本点数u、单步检测与存储需要的时间c确定,窗宽 N需满足下式:u · T多c,若不满足,则适当减小窗宽N,若不满足需相应增大N ; 其中X、Y、Z、N应满足下式:初始化单步处理样本点数u、滑动窗口异常记录多维序列Iciuuict、过程记录序列1_、过 程记录正常序列Inmial,用u确定滑动窗口滑动一次处理的样本点数,用Iciuuict记录滑动窗 口内判定的异常点的序列号及其累计异常数,用1_记录通过滑动窗口且待处理的样本点 序列号及其初始判定类型,用Inmial记录通过滑动窗口且为初始判定正常点的序列号及其 初始判定类型。6. 如权利要求1或2所述的方法,其特征在于,所述步骤(3)中: 利用滑动窗口分割数据流是指滑动窗口包含N个连续样本点,第i个滑动窗口异常检 测后,位于滑动窗口前部的u个序列号为(i-l)u+l、(i-l)u+2.....i ·ιι的样本点通过窗 口,滑动窗口尾部添加 u个新样本点(i-l)u+N+l、(i-l)u+N+2.....i · u+N,获取第i+1个 窗口。7. 如权利要求1或2所述的方法,其特征在于,所述步骤(3)中下述方法确定异常类 型: 滑动窗口异常记录多维序列Iciuuict,记录滑动窗口内判定的异常点序列号及其累计异 常数t\,t\表示序列号为k的样本点在第i个滑动窗口判定完毕后的累计异常数,其记录 格式为 l〇utlier {(序列号,t1,)}; 当前滑动窗口内异常点判定完毕后,利用过程记录序列1_、过程记录正常序列Inmial 依次记录通过窗口的样本点,记录格式均为{(flag,序列号)}。flag为0、1、2、3、4时分别 代表初始判定异常点、初始判定正常点、孤立异常点、连续异常点、阶梯点;初始判定类型包 括初始判定异常点、初始判定正常点,序列号为k的样本点通过滑动窗口时利用t\确定其 初始判定类型;最终判定类型包括孤立异常点、连续异常点、阶梯点。8. 如权利要求7所述的方法,其特征在于,其中利用t \确定初始判定类型具体方法如 下: (3-1-1)、根据r、滑动窗口数据中心线、式(3)获取第i个滑动窗口判定的异常点序列 In11, Ii12, ···,Ii11J后,与第i-Ι个滑动窗口获取的Ioutller中序列号比较获取第i个滑动窗口 新增异常点的序列号为nal, na2,. . .,nan及未变的异常点的序列号为n bl, nb2,. . .,nbn; (3-1-2)、对第i个滑动窗口新增异常点有Vk= t 1 \+l (k = nal, na2,. . ·,nam),更新 l〇utlier? (3-1-3)、判断 tVN' 彡 50% (v = (i-l)u+l,(i-l)u+2,...,i ·ιι)是否满足,若满足 则序列号为V的样本点为初始判定正常点,若不满足则序列号为V的样本点为初始判定异 常点,其中Ν'为序列号为V的样本点通过的滑动窗口总数,V彡N时,Ν' = [N/u],ν〈Ν时, Ν' = [v/u]+l,中括号代表向左取整。9. 如权利要求7所述的方法,其特征在于,确定样本点最终判定类型具体步骤如下: (3-2-1)、若V为初始正常点,更新Inew= {1 _,(1,v)}、1 normal {1 normal, (Ι,ν)}; (3-2-2)、若ν为初始判定异常点,更新1_= {1 _,(0, ν)},通过如下步骤确定最终判 定类型: 判定Iength(Inmial)》X,若否则判定下一个样本点,若是从Inew中去除I nOTmal包含的样 本点; 判定Iength(Inew)多Y,若是则Inew中均为阶梯点,若否则从I _中寻找相邻的初始判 定异常点构成异常子序列,通过子序列长度判定各子序列中样本点是孤立异常点还是连续 异常点; 从中去除1 _包含的样本点,初始化I n_al,通过子序列长度判别样本类型,更新 Inew= {(V, 〇)}; 确定最终判定类型后,存储异常点及其类型标记,记录格式为SE = {SE,(类型标记,起 始序列号,终止序列号)},其中length表示求取序列长度; (3-2-3)、当v>i · u时计算下一个滑动窗口的,对刚通过滑动窗口的u个样本点 重复(3-2-1)、(3H)、(3H)。10. 如权利要求9所述的方法,其特征在于,获取异常子序列并通过其长度判定各子序 列中样本点是孤立异常点还是连续异常点的具体步骤如下: (3-3-1)、获取1_中flag及相应的序列号分别构成序列P、序列S ; (3-3-2)、获取序列Q1= P1-P1 JQ1=-1,i彡2)中值等于-1和1的索引号分别存入 序列indexl、index2,二者长度相等,设长为1 ; (3-3-3)、第1^=1,2,*",1)段异常子序列为{5^1(,5;~1;+1,"_,5;"*4- 1丨,若 indeX2k-indeXlk= 1,则异常子序列为孤立异常点,否则异常子序列中样本点均为连续异 常点。
【专利摘要】本发明公开了一种数控系统指令域序列异常数据检测方法,包括(1)获取训练样本数据中心线,获取包络线比率r;(2)构造窗宽N、临界长度X、连续异常点长度和阶梯点长度分界线Y、数据流分析长度Z的经验公式并根据经验公式设置相应参数;(3)利用N确定滑动窗口长度,利用滑动窗口分割数据流,利用简单移动平均法或多项式拟合法获取滑动窗口数据中心线,包络线外样本为当前滑动窗口内判定的异常点存入loutlier,利用过程记录序列lnew、过程记录正常序列lnormal、X、Y确定最终判定类型;(4)达到指定的数据流分析长度Z时,结束异常检查,否则清除序列号为(i-1)u+N+1、(i-1)u+N+2、...、i·u+N的数据缓存,进入第i+1个滑动窗口的分析。
【IPC分类】G06F17/30, G06F19/00
【公开号】CN105160181
【申请号】CN201510560253
【发明人】杨建中, 马驰飞, 陈吉红, 许光达, 薛聪
【申请人】华中科技大学, 武汉华中数控股份有限公司
【公开日】2015年12月16日
【申请日】2015年9月2日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1