一种基于层级分类算法的风机转子的故障诊断方法与流程

文档序号:30961144发布日期:2022-07-30 13:24阅读:65来源:国知局
一种基于层级分类算法的风机转子的故障诊断方法与流程

1.本发明涉及风机转子故障预测的技术领域,尤其涉及一种基于层级分类算法的风机转子的故障诊断方法。


背景技术:

2.大型旋转机械,如压缩机、汽轮机、燃气轮机,是能源、化工和发电等许多过程工业的关键设备。由于转子转速高、动量大,离心力可能导致转子部件飞离,给运行安全带来很大威胁。早期检测和预测潜在故障可以防止灾难性的工厂停工和经济损失。
3.而现有技术中分类模型评估指标,如混淆矩阵、真假准确度,是静态的,大部分模型评价指标都是对模型进行线下评价,如:数值指标、错误率、灵敏度、特异性、精确度等和基于图的评价指标、成本曲线,其都是基于决策树、神经网络等分类算法,从大型历史数据集上进行学习建模,然后统计不同的模型在离线测试集的表现,基于误差最小化原则选出“最优”故障预测模型,这些评价指标都没有考虑模型在线部署后,无法进行持续监测和评估模型预测的准确性和稳定性。


技术实现要素:

4.本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本技术的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
5.鉴于上述现有技术中存在的问题,提出了本发明。
6.为解决上述技术问题,本发明提供如下技术方案:一种基于层级分类算法的风机转子的故障诊断方法,包括以下步骤:
7.步骤一:获取风机转子机组设备的原始运行数据,并对其进行n-a标记,即数据集的分类标记,确定是否发生故障;
8.步骤二:使用分层抽样的方式,选择80%的机组原始运行数据作为训练集,20%的机组原始运行数据作为测试集;
9.步骤三:对于发生故障的风机转子机组设备,基于其观测时点距离发生故障时刻的时长,并对其进行r-h标记,即运行状态的分类标记;
10.步骤四:使用80%的n-a数据集训练n-a分类模型,用发生故障的机组的劣化数据集的80%来训练r-h分类模型;
11.步骤五:对所有的训练集进行小波滤噪,以及样本均衡化处理,提取提取信号数据的时域和频域特征,然后筛选出有效的特征组合并进行标准化处理;
12.步骤六:确定分类模型的特征组合后,选择出合适的机器学习模型,对n-a训练集以及r-h训练集分别训练二分类模型,并统计各算法五折交叉平均的精确性accuracy和稳定性c的分数;
13.步骤七:选取模型稳定性c和精确性accuracy分数都较高的几个模型作为备选模
型,然后构造两阶段分类的模型组合;
14.步骤八:最后使用测试集对模型组合进行测试,记录测试集的精确性accuracy和opai分数,选择分数最高的模型组合作为最终的cascade模型即层级分类模型;
15.其中,opai代表在线预测的能力。
16.作为本发明所述一种基于层级分类算法的风机转子的故障诊断方法的一种优选方案,其中:所述步骤一过程中n-a标记的具体方式为:根据风机转子机组设备是否发生劣化,将数据集标记为正常和异常,异常表示数据集处于劣化过程中,包括风险和高危两种状态。
17.作为本发明所述一种基于层级分类算法的风机转子的故障诊断方法的一种优选方案,其中:所述步骤三过程中r-h标记的具体方式为:将距离故障时间在1天以上1个月以内标记为风险运行,距离故障发生1天以内标记为高危运行。
18.作为本发明所述一种基于层级分类算法的风机转子的故障诊断方法的一种优选方案,其中:所述步骤五过程中,同时对所有的测试集进行降噪音,特征生成和特征选择以及标准化处理。
19.作为本发明所述一种基于层级分类算法的风机转子的故障诊断方法的一种优选方案,其中:所述精确性accuracy的分数记为s,其通过以下公式计算获得:
[0020][0021][0022]
其中,error(i)表示第i时刻预警值的误差,α,β,γ是调整系数,是常数,ta记为机组设备开始运行时刻,tb记为进入风险运行时刻,tc记为机组设备进入高位运行时刻,td记为机组设备高危阶段的终点,n记为连续观测同一台设备,在发生一次故障的循环内得到的n个观测信号,其中包括正常区间的n1个观测信号,风险区间的n2个观测信号以及高危运行区间的n3个观测信号,i表示第i个信号,ti表示观测到第i个信号的采集时刻,yi表示机器的运行状态,且yi∈{0,1,2},yi=0表示机器处于正常运行中,yi=1表示机器处于风险运行,yi=2表示机器处于高危运行,表示ti时刻的机器状态预测值。
[0023]
作为本发明所述一种基于层级分类算法的风机转子的故障诊断方法的一种优选方案,其中:所述稳定性c的分数由三个区间的预测稳定性平均算得,三个区间的预测稳定性分别表示:正常运行区间的模型预测稳定性c1、风险运行区间的模型预测稳定性c2、高危运行区间的模型预测稳定性c3。
[0024]
作为本发明所述一种基于层级分类算法的风机转子的故障诊断方法的一种优选方案,其中:所述c、c1、c2、c3的表达式分别为:
[0025][0026]
[0027][0028][0029]
作为本发明所述一种基于层级分类算法的风机转子的故障诊断方法的一种优选方案,其中:对所述α,β,γ三个参数进行调整,使正常区间、危险区间和高危区间计分分别占总分的20%、30%和50%。
[0030]
本发明的有益效果:
[0031]
1、本发明提出联级分类算法对转子故障进行预测,首先,使用正常-异常二分类模型预测设备是否正常,当设备处于正常状态,则无需无需浪费计算资源,使用复杂的故障劣化程度评估模型对数据进行预测,当发现设备进入异常(早期劣化)状态,则进一步使用风险-高危二分类模型预测故障发展的程度,能够在节省计算资源和时间成本的基础上很好地实现故障预测。实现对故障的早期特征进行识别,在线持续监测和预测,一旦发现故障发生,则可迅速指导运维人员实现隔离和故障调节等操作,在特征工程和分类预测中融合了机理,使得故障预测过程更简单,可解释性和泛化能力更强;
[0032]
2、本发明在评价指标方面,基于距离故障发生时刻的时间距离赋予数据不同的权重,对模型的预测准确性进行评估,并且,考虑到在线持续监测和预测的情况,构建指标对模型在设备处于不同状态的区间预测稳健性进行评估,并以设备实际运行数据验证了本文提出算法、评价指标的有效性。
附图说明
[0033]
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
[0034]
图1为本发明提出的一种基于层级分类算法的风机转子的故障诊断方法的流程示意图。
具体实施方式
[0035]
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明。
[0036]
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
[0037]
实施例1
[0038]
参照图1,为本发明的一个实施例,提供了一种基于层级分类算法的风机转子的故障诊断方法,此方法包括以下步骤:
[0039]
步骤一:获取风机转子机组设备的原始运行数据,并对其进行n-a标记,即即数据集的分类标记,确定是否发生故障,具体方式为根据风机转子机组设备是否发生劣化,将数
据集标记为正常和异常,异常表示数据集处于劣化过程中,包括风险和高危两种状态;
[0040]
步骤二:使用分层抽样的方式,选择80%的机组原始运行数据作为训练集,20%的机组原始运行数据作为测试集;
[0041]
步骤三:对于发生故障的风机转子机组设备,基于其观测时点距离发生故障时刻的时长,并对其进行r-h标记,即运行状态的分类标记,具体方式为:将距离故障时间在1天以上1个月以内标记为风险运行,距离故障发生1天以内标记为高危运行;
[0042]
步骤四:使用80%的n-a数据集训练n-a分类模型,用发生故障的机组的劣化数据集的80%来训练r-h分类模型;
[0043]
步骤五:对所有的训练集进行小波滤噪,以及样本均衡化处理,提取提取信号数据的时域和频域特征,然后筛选出有效的特征组合并进行标准化处理,同时对所有的测试集进行降噪音,特征生成和特征选择以及标准化处理;
[0044]
步骤六:确定分类模型的特征组合后,选择出合适的机器学习模型,对n-a训练集以及r-h训练集分别训练二分类模型,并统计各算法五折交叉平均的精确性accuracy和稳定性c的分数;
[0045]
步骤七:选取模型稳定性c和精确性accuracy分数都较高的几个模型作为备选模型,然后构造两阶段分类的模型组合;
[0046]
步骤八:最后使用测试集对模型组合进行测试,记录测试集的精确性accuracy和opai分数,选择分数最高的模型组合作为最终的cascade模型即层级分类模型。
[0047]
其中,opai代表在线预测的能力。
[0048]
需要特别说明的是:某转子设备从ta时刻开始运行,从时刻tb进入风险运行状态,从tc时刻进入高位运行状态,我们定义td为高危阶段的终点,若在该时刻未能发现故障并提前检修,则会导致机器从td时刻到t
fault
经历故障,并且因故障而停机,t
fault
为停机时刻,所以有:ta《tb《tc《td《t
fault
。在对机器进行维修后,机器将进入下一个循环。因此,从正常运行到第一次发生故障的时间区间包括:正常运行区间[ta,tb),风险运行区间[tb,tc)和高危运行区间,[tc,td]。
[0049]
而精确性accuracy的分数记为s,其通过以下公式计算获得:
[0050][0051][0052]
error(i)表示第i时刻预警值的误差,稳定性c的分数由三个区间的预测稳定性平均算得,三个区间的预测稳定性分别表示:正常运行区间的模型预测稳定性c1、风险运行区间的模型预测稳定性c2、高危运行区间的模型预测稳定性c3,具体表达式为:
[0053][0054]
[0055][0056][0057]
其中,α,β,γ是调整系数,是常数,n记为连续观测同一台设备,在发生一次故障的循环内得到的n个观测信号,其中包括正常区间的n1个观测信号,风险区间的n2个观测信号以及高危运行区间的n3个观测信号,可得出,n=n1+n2+n3,i表示第i个信号,ti表示观测到第i个信号的采集时刻,yi表示机器的运行状态,且yi∈{0,1,2},yi=0表示机器处于正常运行中,yi=1表示机器处于风险运行,yi=2表示机器处于高危运行,表示ti时刻的机器状态预测值,对α,β,γ三个参数进行调整,使正常区间、危险区间和高危区间计分分别占总分的20%、30%和50%。
[0058]
本发明提出联级分类算法对转子故障进行预测,首先,使用正常-异常二分类模型预测设备是否正常,当设备处于正常状态,则无需无需浪费计算资源,使用复杂的故障劣化程度评估模型对数据进行预测,当发现设备进入异常(早期劣化)状态,则进一步使用风险-高危二分类模型预测故障发展的程度,能够在节省计算资源和时间成本的基础上很好地实现故障预测。实现对故障的早期特征进行识别,在线持续监测和预测,一旦发现故障发生,则可迅速指导运维人员实现隔离和故障调节等操作,在特征工程和分类预测中融合了机理,使得故障预测过程更简单,可解释性和泛化能力更强,在评价指标方面,基于距离故障发生时刻的时间距离赋予数据不同的权重,对模型的预测准确性进行评估,并且,考虑到在线持续监测和预测的情况,构建指标对模型在设备处于不同状态的区间预测稳健性进行评估,并以设备实际运行数据验证了本文提出算法、评价指标的有效性。
[0059]
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1