一种基于ETR‑LDA的硬盘磁头磨损状态识别方法与流程

文档序号:12123865阅读:310来源:国知局
一种基于ETR‑LDA的硬盘磁头磨损状态识别方法与流程

本发明属机械设备故障诊断领域,具体涉及一种基于ETR-LDA的硬盘磁头磨损状态识别方法。



背景技术:

故障诊断是工业生产中的重要环节,关键设备零部件故障的准确及时识别是保障设备安全运行、避免重大事故发生以及降低人员伤亡关键基础。由于设备故障形式多样,且设备运行过程中的早期故障响应微弱难以识别,存在着巨大安全隐患。一旦故障类型及程度诊断失误,对应的维修决策无法及时矫正系统到正常状态,随着缺陷的进一步恶化,将会引起设备的重大事故,甚至威胁到现场人员的生命安全。

硬盘作为一种重要的存储设备,其安全运行是保证数据安全、机电设备正常运行的重要基础。随着硬盘存储密度需求的不断提升,硬盘中磁头磁盘间隙已降低至1nm以下,由于微观接触力、摩擦力、静电力、分子间作用力的影响,头盘间的近接触不可避免,由此导致磁头磁盘间的磨损可能性大大增加。随着磨损的逐渐积累,硬盘的存储性能和可靠性均会下降,如何有效识别运行过程中硬盘磁头的磨损状态,进而提前制定维修更换策略是保障数据安全的重要手段。因此,工业生产中急需一种能够有效识别硬盘磁头磨损状态的诊断方法。

工业中应用故障诊断的方法多种多样,借助时域、频域、时频域及智能算法等分析方法均被应用到故障诊断中。而故障诊断往往被看成是模式识别问题,即通过获取的状态信息区分设备当前状态是属于正常或异常状态,更进一步可识别出设备的异常类型、故障程度,以便指导进一步的维修决策。由于状态信息的多样性,众多的时域、频域、时频域等指标组成了高维的状态特征,增加了模式识别的难度。为了减少计算量并消除冗余特征的干扰,有必要对高维特征进行降维。以主成分分析(PCA)为代表的多种线性、非线性,有监督、无监督降维算法被广泛应用到故障诊断领域。其中,线性判别分析(LDA)以类间距离最大、类内距离最小为最终降维目标,与故障模式识别的目标贴合紧密,且借助迹比手段求解高效,是一种适合进行故障诊断的降维算法。然而,有些故障类型的响应相似,或是早期故障微弱难以区分。即便在类间距离最大、类内距离最小的原线性判别分析降维目标下,虽然能有效区分出典型故障,但对于振动响应相似的故障以及微弱故障仍不能有效识别,因此,有必要开发一种能够识别相似响应故障的诊断方法。使得算法不仅可以识别出典型故障,对微弱故障或难以区分的故障模式之间也可以有效识别,合理规划维修时间,减少维修以及意外停机带来的经济损失。

目前借助TR-LDA降维算法的故障诊断仍依赖于其原始的目标函数,即在最大化总类间距离的同时最小化类内距离,但TR-LDA并不能有效解决对微弱故障、响应相似故障的识别问题。另外,相比于复杂的时域、频域指标提取方法,借助统计分析的统计特征提取不受信号平稳性的影响,对任意波形皆适用,实行起来更为简洁、高效。因此,需要研究借助统计特征的新型TR-LDA算法,克服原有方法的限制,实现对混叠故障与微弱故障的识别。



技术实现要素:

针对上述缺陷或不足,本发明的目的在于提供一种基于ETR-LDA的硬盘磁头磨损状态识别方法,采用统计分析方法提取磁头运行期间所采集得到声发射振动信号的高维统计特征,并通过提出的ETR-LDA降维算法得到低维的特征融合指标,基于数据集在低维空间的分布,判断设备所处的状态类型,实现故障的可视化诊断。

为达到以上目的,本发明的技术方案为:

一种基于ETR-LDA的硬盘磁头磨损状态识别方法,通过声发射传感器获取硬盘磁头磁盘磨损期间的振动信号,并对获取的振动信号在时域幅值范围内进行区间划分,统计信号在各个区间内的分布规律,获得与区间个数等维度的硬盘磁头状态信息的高维统计特征;改进TR-LDA算法的目标函数形成ETR-LDA算法,并将ETR-LDA算法用于磁头振动信号的高维统计特征降维,获得不同磨损程度的磁头数据在低维空间的分布规律,识别出磁头磨损程度,并以可视化的形式呈现,完成故障的诊断。

本发明进一步的改进在于,所述时域幅值范围具体通过以下过程获得:

截取一段信号,统计信号幅值的波动范围,为保证所有的数据集在统一的统计区间进行分析,幅值范围要综合全部数据,第i组数据幅值范围为其中和分别为第i组信号的幅值最大值与最小值;

在统计了所有组信号后,得到声发射传感器获取信号y(t)时域幅值范围yrange为:

yrange=[ymin ymax]

其中,

本发明进一步的改进在于,所述获得与区间个数等维度的硬盘磁头状态信息的高维统计特征具体过程如下:

1)对时域幅值范围进行区间划分,所划区间的个数为m;则每个区间的长度为整体区间分布范围为[ymin:Δ:ymax];

2)在划分得到的区间分布内统计不同组信号的分布规律,并将所有区间的统计结果汇总,得到对应信号的高维统计特征x=[x1x2…xm]T

其中,xi为信号y(t)在区间[ymin+(i-1)Δ+1,ymin+iΔ]范围内数据点的统计个数,i=1,2,…,m。

本发明进一步的改进在于,所述改进TR-LDA算法的目标函数形成ETR-LDA算法的具体过程如下:

1)首先,通过获取的带标签数据统计数据集的初始分布:

基于高维状态特征x分别计算每两类数据之间的类间离散度矩阵Sbij,并利用迹运算度量其类间距离大小Dij=Tr(Sbij),选取最小类间距离对应的离散度矩阵其中,Sbij=Ni(ui-u)(ui-u)T+Nj(uj-u)(uj-u)T,ui为第i类数据的均值,u为所有样本均值;

2)其次,考虑离散度矩阵Sbmin并修改原目标函数,得到新的目标函数:

基于迹比算子的TR-LDA目标函数为:

为弥补原TR-LDA算法的不足,将统计得到的最小类间距离对应的离散度矩阵Sbmin添加到TR-LDA算法的目标函数的分子位置,并赋予尺度参数α,新的ETR-LDA算法目标函数J为:

其中,Sb为类间离散度矩阵,Sw为类内离散度矩阵。

本发明进一步的改进在于,将ETR-LDA算法用于磁头振动信号的高维统计特征降维,获得不同磨损程度的磁头数据在低维空间的分布规律的具体过程如下:

在新的目标函数下,借助ITR-SCORE迭代算法求解,得到从高维空间到低维空间的投影矩阵W,投影矩阵W能够实现将原始数据从维数n到d的变换,并且保证最终得到的数据集中,不同类别数据之间的距离处于较大的幅值,类内距离处于较小幅值,并且最小的类间距离得到提升;原始维度为n,即高维统计特征x∈Rn,降维后低维特征z维度为d,即低维特征z∈Rd,d<<n,则降维变换为:

z=WTx

其中,W∈Rn×d

本发明进一步的改进在于,投影矩阵

其中,Sb为类间离散度矩阵,Sw为类内离散度矩阵。

本发明进一步的改进在于,获得不同磨损程度的磁头数据在低维空间的分布规律,识别出磁头磨损程度的具体过程如下:

将降维后数据投影至低维空间中,根据带标签的训练数据在低维空间的投影结果可以识别出不同的故障模式在低维空间的分布范围,相同类别数据相互聚集,不同类别数据之间有明显界限,将测试数据同样进行降维处理并投影至该低维空间,此时将测试数据的低维空间分布与训练数据进行对比,如果测试数据与正常样本之间距离最小,则认定该组测试数据正常;否则,则认为硬盘磁头处于其在低维空间中距离最小的故障模式。

本发明进一步的改进在于,以可视化的形式呈现的具体过程如下:

在低维空间内,根据数据的三维或二维空间位置来确定数据的类别,因此,在带标签的训练数据在低维空间形成一定的分布规律后,测试数据在低维空间的位置信息,确定其故障模式,并为数据点赋予颜色或位置标签,进而实现故障的可视化诊断。

与现有技术比较,本发明具有的有益效果为:

1)通过对声发射传感器得到的振动信号在时域进行统计分析,并将其作为高维特征用于后续的特征降维和模式识别。其次,提出了一种改进的迹比线性判别分析算法(ETR-LDA),通过修改原始TR-LDA算法的目标函数,即在迭代求解投影平面的过程中考虑最小类间距离且在迭代过程中尽可能地增大最小类间距离,对故障分类中存在的“短板效应”进行修正。最后,提出了一种故障诊断的可视化识别方法,将故障模式以直观可视化的形式展现在二维平面内。该方法在保证算法收敛性与全局最优性的同时,故障分类结果准确性明显提升,为设备的在线监测与故障诊断提供了一种有效的分析方法。

2)本发明采用统计特征分析提取高维特征,得到能够反映设备状态信息的统计特征,计算量低且无需借助复杂的信号处理方法,对多种传感信号均适用。

3)本发明采用改进的ETR-LDA算法对高维统计特征进行降维,在不改变算法收敛性与全局最优性的基础上,有效提高降维结果中的最小类间距离,进而提高故障模式分类的准确性。

4)本发明的诊断结果可以反映到二维或三维空间内,以可视化的形式呈现给现场工作人员,可直观地反映设备的健康状态与故障模式,为设备的健康监测与可视化诊断提供了一种有效的新技术。

5)本发明的诊断方法简单可靠、直观,便于在工程实践中使用。

附图说明

图1为长度为2000的硬盘磁头振动信号时域波形;

图2为两组不同的距离分布的分类结果对比;

图3为ETR-LDA算法流程图;

图4为ETR-LDA算法得到的可视化分类结果;

图5为硬盘磁头磨损程度诊断的一个实例,其中,(a)为原TR-LDA算法诊断结果;(b)为ETR-LDA算法诊断结果。

具体实施方式

下面结合附图对本发明做详细描述。

本发明中TR-LDA为迹比线性判别分析算法,ETR-LDA为改进的迹比线性判别分析算法。

本发明提出了一种可视化的硬盘磁头磨损程度识别方法。建立在磁头声发射振动信号高维统计特征提取的基础之上,通过将测试得到的高维统计指标输入至ETR-LDA降维算法中,根据降维后数据点集的空间分布判断测试数据是否出现异常,并以可视化的形式给出诊断结果。

参见图3,本发明提供了一种基于改进的迹比线性判别分析硬盘磁头磨损状态识别方法,具体包括以下步骤:

1、基于统计分析的设备状态信息高维统计特征提取:

通过声发射传感器获取硬盘磁头磁盘磨损期间的振动信号,并对获取的振动信号在时域幅值范围内进行区间划分,利用直方图统计信号在各个区间内的分布规律,获得与区间个数等维度的设备状态信息的高维统计特征,并作为输入用于后续的特征降维与故障诊断分析;具体过程如下:

1)获取传感信号时域幅值范围

截取一段信号,统计信号幅值的波动范围,为保证所有的数据集在统一的统计区间进行分析,幅值范围要综合全部数据,信号时域幅值范围为不同组信号统计分析后得到的最大幅值与最小幅值组成的总区间,第i组数据幅值范围为其中和分别为第i组信号的幅值最大值与最小值;

在统计了所有组信号后,得到声发射传感器获取信号y(t)时域幅值范围yrange为:

yrange=[ymin ymax]

其中,

采用相同的幅值提取方法对所有的待分析信号进行幅值统计,汇总后得到统一的分布区间为:

yrange=[ymin ymax]

其中,

2)对统计分析得到的幅值分布进行区间划分,得到m个长度相同的分布区间,m的大小决定了最终得到高维特征维数的大小;所有传感信号的幅值均包含在这些区间内。区间的个数为m,每个区间的长度为所有的区间分布范围为区间集合:[ymin:Δ:ymax];

3)分别统计长度为N的每组信号时域幅值在每个区间的分布规律,并将所有区间的统计结果汇总,得到对应信号的高维统计特征x=[x1x2…xm]T

其中,xi为信号y(t)在区间[ymin+(i-1)Δ+1,ymin+iΔ]范围内数据点的统计个数,用来表示信号时域幅值的分布规律,且满足其中,i=1,2,…,m。

2、基于ETR-LDA的硬盘磁头磨损状态识别方法:

在保证总类间距离足够大且总类内距离足够小的基础上,提升最小类间距离;在投影至低维空间后,根据数据集在低维空间的分布识别不同数据所处的故障类别,实现故障模式的可视化诊断。通过统计分析获取带标签的设备传感信号的高维统计特征,并将高维指标集作为输入利用改进后的ETR-LDA算法进行降维处理。在经过ETR-LDA降维处理后,不同类别之间的距离仍处于较大幅值,相同类别之间的距离处于较小幅值,同时,最小类间距离得到提升,使得数据集整体的可分性增强。不同故障模式的数据相互分割开来并各自聚集,进而,根据测试数据在低维空间的分布规律即可获取设备状态所处的故障模式,即在保证总类间距离足够大且总类内距离足够小的基础上,提升最小类间距离;在投影至低维空间后,根据数据集在低维空间的分布识别不同数据所处的故障类别,从而实现设备故障的可视化诊断;具体包含的步骤如下:

1)首先,根据原始数据高维特征计算分类问题中的薄弱环节:

基于高维状态特征x分别计算每两类数据的类间离散度矩阵Sbij,Sbij=Ni(ui-u)(ui-u)T+Nj(uj-u)(uj-u)T,其中,ui为第i类数据的均值,u为所有样本均值。并利用迹运算度量类间距离的大小Dij=Tr(Sbij),进一步确定分类问题中最难区分的两类数据的类间离散度矩阵,即最小类间距离对应的类间离散度矩阵为:

2)其次,修正TR-LDA判别函数,考虑分类问题中的薄弱环节:

将计算得到的最小类间距离对应的类间离散度矩阵Sbmin添加到原始TR-LDA算法的目标函数的中,分子位置,并赋予尺度参数α,新的目标函数J为:

在新的目标函数下,投影矩阵W的求解公式为:

其中,Sb为类间离散度矩阵,Sw为类内离散度矩阵。

与原TR-LDA目标函数相比,新的目标函数考虑了薄弱环节对最终分类准确性的影响。此时求解的投影矩阵W不再以获取最大类间距离与最小类内距离为目标,而是在保证总类间距离与类内距离幅值处于一定水平的基础上,有效提高最小类间距离。因此,数据集在该低维空间的投影结果会具有更好的可分性,原本难以区分的薄弱环节亦更易于识别;

3)最终,在投影矩阵W确定后,获取新的测试数据对其进行高维统计特征提取与降维处理,根据其在低维空间的分布确定其故障模式,实现硬盘磁头磨损程度的可视化诊断。具体过程如下:

在新的目标函数下,将已获取带标签的高维统计特征x作为ETR-LDA的输入,借助ITR-SCORE迭代算法求解,得到从高维空间到低维空间的投影矩阵W,W能够实现将原始数据从维数n到d的变换,并且保证最终得到的数据集中,不同类别数据之间的距离处于较大的幅值,类内距离处于较小幅值,并且最小的类间距离得到提升;原始维度为n,即高维统计特征x∈Rn,降维后低维特征z维度为d,即z∈Rd,d<<n,则降维变换为:

z=WTx

其中,W∈Rn×d

4)根据数据集在低维空间的分布判断其所属类别:

将降维后数据投影至低维空间中,根据带标签的训练数据在低维空间的投影结果可以识别出不同的故障模式在低维空间的分布范围,相同类别数据相互聚集,不同类别数据之间有明显界限,将测试数据同样进行降维处理并投影至该低维空间,此时将测试数据的低维空间分布与训练数据进行对比,如果其分布距离正常样本较近则认定该组测试数据正常;否则,则认为测试设备处于其在低维空间中距离最近的故障模式。

5)实现故障的可视化诊断:

在低维空间内,很容易根据数据的三维或二维空间位置来确定数据的类别,因此,在带标签的训练数据在低维空间形成一定的分布规律后,测试数据在低维空间的位置信息即可表征其状态信息,确定其故障模式,并为数据点赋予颜色或位置标签,进而实现故障的可视化诊断。

测试样本中已经包含了包括正常运行状态在内的多种硬盘磁头磨损状态,经ETR-LDA降维处理后,不同状态的数据集各自分布在不同的位置并聚集一起,形成不同的状态空间区域。获取测试数据并将其投影至低维空间后对其所处位置进行分析,分别计算该数据点距离样本数据点集之间的距离,选择距离其最近的模式并赋予其对应的标签,进而实现磨损程度的判断。

实施例

该实施例结合硬盘磁头磨损状态识别验证该发明的有效性。

示例性的,为提取传感信息的高维统计特征,采用硬盘磁头的振动信号分析基于ETR-LDA的磨损状态识别方法步骤。

图1为长度为2000的硬盘磁头振动信号时域波形。在分析时,首先对信号时域幅值范围进行统计,得到信号的时域幅值范围为[-0.2554,0.2864],将区间分成20等分,统计每个区间内的信号时域幅值分布,结果如图2所示,并作为高维统计特征用于后续诊断分析。该特征提取方法无需借助复杂的信号处理方法,不依赖对故障机理的深入研究,关注信号的统计特征,为复杂设备的状态特征提取提供了便利。

在故障诊断问题中,振动响应相对相近的数据集能否被有效区分衡量故障诊断水平的重要因素。然而,直接采用TR-LDA得到的最大类间距离与最小类间距离的分类结果并不能将薄弱环节区分开来,因此需要对原目标函数进行改进。分别计算每两类数据之间的类间离散度矩阵Sbij,选取最小类间距离对应的离散度矩阵记录为分类问题中的“短板”Sbmin,得到模式识别问题中最难区分的两类模式,并将其作为修正项添加到原目标函数中,得到新的目标函数为:

在新的目标函数下,投影矩阵W的获取变成了如下的特征值分解问题:

(Sb+αSbmintSwi=τiωi

式中,Sb,Sw和Sbmin分别为系统的类间离散度矩阵、类内离散度矩阵和最小类间离散度矩阵,α为尺度参数,用于平衡最小类间距离与总类间距离之间的数量级差异,ωi为对应的特征向量,τi为特征向量ωi的特征值。然后分别对每个特征向量ωi计算其评估因子si,并对所有的特征向量按照评估因子的大小进行排序,选取其中d个si幅值最大的特征向量组成低维投影空间Wt。迭代更新λt+1,重复以上运算直至λt+1收敛,并由Wt组成最终的投影矩阵。

由前所述,诊断问题可以看成是模式识别问题,诊断结果即将故障模式与正常模式以及不同故障程度的故障区分开来。但是,在故障模式振动响应相似或者微弱故障响应特征不明显的情况下,相近的故障模式之间距离非常接近,在原TR-LDA的降维思想中,即使得降维后类间距离最大类内距离最小的理念已不再适用。其原因在于,由于薄弱环节的距离量级非常小,与典型故障之间的距离相比微不足道,因此在迭代求解投影矩阵的过程中,为使得总类间距离最大会尽可能的扩大典型故障之间的距离,而忽略薄弱环节的数值。然而在实际应用中,一味的增大典型故障之间的距离并不能得到更优的分类结果,那些薄弱环节,即难以区分的模式之间依然混叠。相比之下,在保证总类间距离与类内距离在一定水平的基础上,对量级较小的最小类间距离进行优化即可得到较好的识别效果。

在此思想基础上对TR-LDA的目标函数改进即可有效解决薄弱环节的限制。目标函数中最小类间离散度矩阵(Sb+αSbmin)的加入使得迭代求解过程中,投影矩阵的选择不再单一地增大总类间距离,在保证整体类间距离幅值的基础上加入了对最小类间距离的考虑。最终的求解结果或许总类间距离可能会减小,但其幅值仍处于合适的范围内,而且最小类间距离会有所提升,这将会对分类结果带来一定改善。原本混叠一起难区分的故障模式在类间距离增加后重叠区域减少甚至相互分离开来,分类准确性相应地有所提高。

仍以硬盘磁头为对象,选取四种不同运行状态的磁头振动信号作为训练数据,分别对应着硬盘磁头的正常状态、轻度磨损、中度磨损、重度磨损。对四组振动信号进行统计分析,提取状态特征后分别计算每两组不同类别之间的距离,其幅值大小分别为D=[D12D13D14D23D24D34],如表1所示。

表1硬盘磁头不同运行状态的类间距离

对比得到min(Dij)=D23,对应的最小类间离散度矩阵Sbmin=Sb23,即类别2与3之间相距较近,相对来说最难以区分。因此,将类别2与类别3,即轻度磨损与中度磨损的有效区分定义为本故障诊断问题中的薄弱环节。将高维特征向量以及Sbmin代入改进的ETR-LDA算法,得到从高维空间向低维空间映射的投影矩阵W。W代表着低维空间的基向量,是高维数据在低维空间重构的基础。于是降维后的低维数据z为:

z=WTx

由于新的目标函数综合考虑了薄弱环节的影响,迭代求解的过程中会逐渐弥补最小类间距离的不足,最终得到的分类结果中D23应有所提升。获取投影矩阵W后,将高维数据投影至低维空间。在这里低维空间维度为2,即2维平面。不同故障类型在2维平面内有各自的分布位置,如图4所示,因此可根据新获取数据点在投影平面内与不同类别集合的距离远近来判定其类别归属。

原始的TR-LDA以获取最大类间距离为目标,算法在经过48次迭代后收敛,得到总类间距离Dt=35.62,最小类间距离Ds=D23=1.52e-4。最小类间距离的幅值数量级远小于总类间距离,这是导致类别2、类别3之间相互混叠难以区分的直接原因。而本发明提出的ETR-LDA算法在迭代13次后收敛,得到总类间距离Dt=34.23,与TR-LDA相比下降3.9%,但其最小类间距离Ds=D23=6.35e-2,提升了两个数量级。且从最终分类结果来看,如图5所示,在TR-LDA中,类别2、类别3、类别4聚集在一起难以区分。而ETR-LDA则成功将四种不同磨损程度的硬盘磁头状态很好地区分开来,从最终结果来看,虽然类别2、类别3之间仍相距较近,但类别间的重叠已完全消除。结果表明,ETR-LDA方法具有较好的分类结果。

本发明提出的基于ETR-LDA的硬盘磁头磨损程度识别方法,能够方便地提取硬盘磁头振动信号的高维统计特征,并能够在考虑薄弱环节的条件下借助改进算法实现对故障模式的精确可视化识别。该方法的分析结果可以从理论上指导硬盘磁头磨损程度识别与故障诊断问题。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1