一种基于核估计LOF的机械监测数据异常段检测方法与流程

文档序号:16630907发布日期:2019-01-16 06:33阅读:305来源:国知局
一种基于核估计LOF的机械监测数据异常段检测方法与流程

本发明属机械监测数据质量改善技术领域,具体涉及一种基于核估计lof的机械监测数据异常段检测方法。



背景技术:

在机械故障诊断领域,由于机械装备分布面广、测点众多、数据采样频率高、服役历时长,积累了海量的监测数据。对海量监测数据进行分析处理,可以挖掘设备运行的各种信息,提前发现设备故障。而机械装备的工作环境常常十分恶劣,导致监测数据中混杂大量漂移、失真、残缺的脏数据,这些脏数据往往严重影响对监测数据的分析效果,导致机械健康状态的误判,进而制定出错误的运维策略。异常段数据是脏数据的一种,与机械自身健康状态无关,准确检测并剔除监测数据中的异常段可以有效提升监测数据的分析效果,从而更好的保障设备安全可靠的运行。目前尚无针对机械监测数据异常段检测的公开文献发表。



技术实现要素:

为了克服上述现有技术的缺点,本发明的目的在于提供了一种基于核估计lof(localoutlierfactor)的机械监测数据异常段检测方法,能准确检测出机械监测数据的异常段。

为了达到上述目的,本发明采取的技术方案为:

一种基于核估计lof的机械监测数据异常段检测方法,包括以下步骤:

1)利用长度为w1的滑动时窗将机械监测数据分割成n个数据段,并定义滑动时窗长度增量δw,令相邻两窗重叠率为90%,得到数据段的一个集合d;

2)分别从时域、频域、时频域中提取每个数据段的特征指标,组成特征指标集合其中表示滑动时窗长度为w1时第i个数据段的特征指标向量,特征指标包括均值、最大值、最小值、峰峰值、方差、峭度、均方根、波形因子、峰值因子、脉冲因子、方根幅值、裕度因子、偏斜度、重心频率、均方频率、均方根频率、小波能量谱;

3)基于每个数据段与其对应的特征指标向量,将每个数据段视为一个多维度点,利用nadaraya-watson核估计法进行核回归lof的构建与计算,包含以下步骤:

3.1)设置lof算法中k的取值范围为[kmin,kmax],令k的初始值为kmin,并定义滑动时窗参数w2=l/kmin,其中l为机械监测数据的长度;

3.2)根据lof算法,计算每一个数据段的局部异常因子值,得到序列其中lofik表示第i个数据段的局部异常因子值,具体计算过程如下:

3.2.1)从集合d中任取数据段i,计算数据段i的第k距离kd(i),并得到数据段i的k邻域nk(i);

3.2.2)定义局部可达密度lrdk(·),数据段i的局部可达密度计算如下:

其中,数据段o为数据段i的邻域,kd(o)表示数据段o的第k距离,d(i,o)表示数据段o和数据段i两数据段在特征空间中的欧氏距离,max{·}表示取所有值中的最大值;

3.2.3)计算数据段i的局部异常因子值lofik,其计算公式如下:

其中,lrdk(o)为数据段o的局部可达密度;

3.2.4)重复3.2.1)到3.2.3)直至计算出所有数据段的局部异常因子值;

3.3)基于nadaraya-watson核估计法,进行异常局部因子值的核回归估计,核函数其中参数β的默认值为1,可得基于核估计的局部异常因子估计值序列其中表示第i个数据段的局部异常因子估计值,其计算公式如下所示:

其中,kd(j)表示数据段j的第k距离;γ为敏感因子,默认值为2;表示滑动时窗长度为w1时第j个数据段的特征指标向量;为数据段j的局部异常因子值;

3.4)定义迭代误差阈值其中std(·)表示计算标准差;

3.5)如果ε>s或者k≤kmax,则对k进行迭代,k的值增加1,重复3.2)至3.4);否则停止迭代,输出此时的

4)令w1的值增大δw,如果w1<w2,重复步骤1)至步骤3);否则停止迭代;对w1的迭代结束后,每种滑动时窗长度都对应着一个基于核估计的局部异常因子估计值的序列从所有序列找到最大的输出该值所在的局部异常因子估计值序列该序列中的局部异常因子估计值代表不同程度的脏数据,其值越大,数据质量越低;

5)根据步骤4)中得到的确定阈值,将阈值设置为t=μ+λσ,其中μ表示序列的算术平均;λ为异常因子,λ越大表示异常度越大,根据3σ准则将λ设置为3;σ表示该序列的标准差;

6)根据阈值t检测异常数据段,从序列中选出大于t的所有根据窗宽w1与数据段序号i确定出原始机械监测数据中脏数据段的位置。

本发明的有益效果为:

本发明提取数据段的特征值,将异常段的检测问题转化为多维度异常点的检测问题;基于nadaraya-watson核估计法实现了lof算法中k值的自适应选择,通过对滑动时窗的长度迭代,实现了异常段长度的自适应检测;根据设定的阈值,对基于核估计的局部异常因子估计值进行筛选,从而能够准确检测出机械监测数据中的异常段。

附图说明

图1为本发明的流程图。

图2为实施例齿轮箱监测数据的时域波形图。

图3为实施例最终的局部异常因子估计值序列图。

图4为实施例检测异常段的结果图。

具体实施方式

下面结合附图对本发明做进一步详细描述。

如图1所示,一种基于核估计lof的机械监测数据异常段检测方法,包括以下步骤:

1)利用长度为w1的滑动时窗将机械监测数据分割成n个数据段,并定义滑动时窗长度增量δw,令相邻两窗重叠率为90%,得到数据段的一个集合d;

2)分别从时域、频域、时频域中提取每个数据段的特征指标,组成特征指标集合其中表示滑动时窗长度为w1时第i个数据段的特征指标向量,特征指标包括均值、最大值、最小值、峰峰值、方差、峭度、均方根、波形因子、峰值因子、脉冲因子、方根幅值、裕度因子、偏斜度、重心频率、均方频率、均方根频率、小波能量谱;

3)基于每个数据段与其对应的特征指标向量,将每个数据段视为一个多维度点,利用nadaraya-watson核估计法进行核回归lof的构建与计算,包含以下步骤:

3.1)设置lof算法中k的取值范围为[kmin,kmax],令k的初始值为kmin,并定义滑动时窗参数w2=l/kmin,其中l为机械监测数据的长度;

3.2)根据lof算法,计算每一个数据段的局部异常因子值,得到序列其中lofik表示第i个数据段的局部异常因子值,具体计算过程如下:

3.2.1)从集合d中任取数据段i,计算数据段i的第k距离kd(i),并得到数据段i的k邻域nk(i);

3.2.2)定义局部可达密度lrdk(·),数据段i的局部可达密度计算如下:

其中,数据段o为数据段i的邻域,kd(o)表示数据段o的第k距离,d(i,o)表示两数据段(数据段o和数据段i)在特征空间中的欧氏距离,max{·}表示取所有值中的最大值;

3.2.3)计算数据段i的局部异常因子值lofik,其计算公式如下:

其中,lrdk(o)为数据段o的局部可达密度;

3.2.4)重复3.2.1)到3.2.3)直至计算出所有数据段的局部异常因子值;

3.3)基于nadaraya-watson核估计法,进行异常局部因子值的核回归估计,核函数其中参数β的默认值为1,可得基于核估计的局部异常因子估计值序列其中表示第i个数据段的局部异常因子估计值,其计算公式如下所示:

其中,kd(j)表示数据段j的第k距离;γ为敏感因子,默认值为2;表示滑动时窗长度为w1时第j个数据段的特征指标向量;为数据段j的局部异常因子值;

3.4)定义迭代误差阈值其中std(·)表示计算标准差;

3.5)如果ε>s或者k≤kmax,则对k进行迭代,k的值增加1,重复3.2)至3.4);否则停止迭代,输出此时的

4)令w1的值增大δw,如果w1<w2,重复步骤1)至步骤3);否则停止迭代;对w1的迭代结束后,每种滑动时窗长度都对应着一个基于核估计的局部异常因子估计值的序列从所有序列找到最大的输出该值所在的局部异常因子估计值序列该序列中的局部异常因子估计值代表不同程度的脏数据,其值越大,数据质量越低;

5)根据步骤4)中得到的确定阈值,将阈值设置为t=μ+λσ,其中μ表示序列的算术平均;λ为异常因子,λ越大表示异常度越大,根据3σ准则将λ设置为3;σ表示该序列的标准差;

6)根据阈值t检测异常数据段,从序列中选出大于t的所有根据窗宽w1与数据段序号i确定出原始机械监测数据中脏数据段的位置。

下面结合实施例对本发明做详细描述,实施例采用齿轮箱实验监测数据对本发明进行验证。

本实施例是在某厂建立的混合动力驱动系统上进行的,实验工况较为恶劣。实验系统由两级定轴齿轮箱、一级行星齿轮箱和磁力制动器组成,磁力制动器施加可变负载,在第二级定轴变速箱的中间齿轮上有磨损故障,加速度计安装在电机驱动端中间轴的轴承座上。采样频率为12.8khz,电机转频为40hz。图2为采集数据的时域波形,即机械监测数据。从这些波形中,可以发现其中有一段发生数据漂移,为数据异常段。

使用本发明方法对异常段进行检测,机械监测数据原始长度为492700,首先选择滑动时窗的初始长度w1为500,增量δw为500,lof算法中的k设置为5,提取的机械监测数据特征指标向量包含均值、最大值、最小值、峰峰值、方差、峭度、均方根、波形因子、峰值因子、脉冲因子、方根幅值、裕度因子、偏斜度;然后将参数k的取值范围设置为[5,20],则滑动时窗的最大长度w2为98540;利用nadaraya-watson核估计法对参数k进行迭代,获得一个经过权重平均的局部异常因子估计值序列;再对w1进行迭代,则对应每个滑动时窗长度w1都有一个局部异常因子值序列;选取最大的局部异常因子估计值,绘制其所在的序列;计算该序列的均值与标准差,根据3σ准则可得阈值t为9.783,将阈值用虚线绘制于图3中;比较可得,第99至108个数据段的基于核估计的局部异常因子估计值大于阈值t,则对应机械监测数据中点划线方框部分异常段,如图4所示。

通过采用工厂中齿轮箱实验数据验证了本发明方法在机械监测数据异常段检测的优势。基于nadaraya-watson核估计法解决了传统lof算法中需要依靠经验选择参数k的缺点,实现了参数k的自适应选择;同时,通过对滑动时窗的长度进行迭代,自适应地准确检测出异常段。因此,采用本发明方法的机械监测数据异常段检测的效果较为理想。另外应当指出,在不脱离本发明构想的前提下,所做的调整和变形也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1