一种工况分类方法与流程

文档序号:20876217发布日期:2020-05-26 16:34阅读:635来源:国知局
一种工况分类方法与流程
本发明涉及一种工况分类方法。
背景技术
:随着现代生产设备日益向大型、复杂、精密方向发展。现代工业过程生产规模的不断扩大,企业生产系统的自动化水平和集成化程度也在不断提高。企业功能复杂化和规模集成化,使各个生产单元间关系复杂,耦合现象严重。这些趋势可能影响设备安全和工作性能引发一系列生产事故,最终影响产品质量和物耗能耗。在大型化、复杂化的工业过程中,不断检测过程的变化和故障信息是十分必要的。生产单元中存在很多变量,也存在着大量的数据。随着各种状态监测系统的出现,大量的实际数据被采集,但是95%的数据只采集了一个数值,没有任何标签,我们并不知道数据是否异常,所以需要从海量数据中进行统计和分类,以区分不同时刻、不同数据所处的工况,以进一步分析数据所处模块、系统的健康状况。近几年,对于无标签数据普遍采用特征提取方法结合一些机器学习方法对工况进行分类。cn107679734a公开了一种基于聚类方法的无标签数据分类预测的方法。cn106834662b中公开了一种利用模糊c均值聚类算法对烧结过程参数的工况分类方法。cn107516107a中公开了一种利用k均值聚类算法在离线状态下将车辆行驶工况分类方法。但上述方法至少存在如下缺陷:采用基于数据聚类的方法,数据模型大多只能在小的工况变化范围内有效,外推能力较差;模型效果过度依赖建模数据的质量;模型参数缺乏物理意义。技术实现要素:为了解决上述技术问题,本发明的目的在于提供一种工况分类方法。本发明通过以下技术方案来实现:一种工况分类方法,包括以下步骤:s1:确定需要分析的工况变量;s2:对工况变量间的相关性分析;s3:对工况变量间的相似性分析;s4:确定输入工况变量与输出工况变量;s5:对工况变量进行标准化;s6:处理输入工况变量;s7:进行工况分类。其中,所述工况分类根据采用数值范围、数量范围和数值范围与数量范围结合考虑的概率密度划分方法进行划分。优选地,所述工况分类会对概率低于0.3的工况进行合并。优选地,所述工况变量间的相关性分析是根据专家经验在所有工况变量之间发现工况之间的相关性。优选地,所述处理输入工况变量中在m个输入工况变量中,根据概率分布找出m1个快变化工况变量和m2个慢变化工况变量,且m1+m2=m。优选地,所述慢变化工况变量需要进行积分操作,然后与快变化工况变量进行合并排序。本发明具有如下有益效果:(1)可以改善无标签的工况分类效果。(2)具有较好的外推能力,模型适应性强。(3)可以在大范围内描述非线性特性。附图说明为了更清楚地说明本发明的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。图1是本发明的工况分类流程图。图2是本发明的机组简化示意图。图3是本发明处理输入工况变量的流程图。图中:1、叶轮;2、主轴承;3、主轴;4、齿轮箱;5、联轴器;6、发电机。具体实施方式下面将结合本发明实施例中的附图,对发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。参考说明书附图1,其应用于某大型风电场中的一组风机为例,对该方法进行详细说明。s1.确定需要分析的工况变量;具体地,如说明书附图2所示为某机组的简化示意图,机组的传动链部分包括了:叶轮(含叶片和轮毂)、主轴、主轴承、齿轮箱、联轴器和发电机部分,每一个部分都安装多个传感器实时监测其运行状态,比如,主轴承安装有温度传感器和振动传感器(加速度计)以监测轴承温度和振动情况。通过分布图可以确定如下数据需求表:序号参数序号参数1齿轮箱转速(r/s)9机舱温度(℃)2叶轮转速(r/s)10非驱动端轴承温度(℃)3发电机转速(r/s)11驱动端轴承温度(℃)4环境温度(℃)12绕组温度(1-6)(℃)5风速(m/s)13水冷系统出口温度(℃)6风向(°)14端口电压(v)7励磁电流(a)15有功功率(kw)8励磁电压(v)表1为机组的周期性状态量从表1我们可以分析出外部变量为环境温度、风速、风向,内部变量分为温度变量(绕组温度、机舱温度、非驱动端轴承温度、驱动端轴承温度、水冷系统出口温度)、转速变量(发电机转速、齿轮箱转速、叶轮转速)和其他变量(励磁电流、励磁电压、端口电压、有功功率)。s2.工况变量间的相关性分析;具体地,该机组一共确定将要对20个变量进行分析,由于绕组温度1-6几乎一样,因此只取绕组温度1用于分析,共计15个变量。对15个变量进行相关性分析,对变量是否服从正态分布得出结论。(1)两者的相关性对部分变量(如环境温度、机舱温度、风向)而言,正态相关和非正态相关系数没什么差距,可将这类变量视为服从正态分布;(2)对部分变量(如驱动端轴承温度、非驱动端轴承温度、叶轮转速、风速)而言,大部分正态相关和非正态相关系数差距不大,小部分差距较大,可将这类变量视为具备一部分的正态分布特性;(3)对部分变量(如水冷系统温度、绕组温度1、有功功率、端口电压、励磁电流、励磁电压、叶轮转速、发电机转速、齿轮箱转速)而言,大部分正态相关和非正态相关系数差距非常大,可将这类变量认定为非正态分布。s3.工况变量间的相似性分析;具体地,然后以非正态相关系数为准,寻找变量间的相似性,尝试发现特性相似或一致的变量,并实现变量的维度降低。为了更清洗地发现规律,删去正态相关系数,只把非正态相关系数单独取出来进行观察,得出以下结论:(1)有功功率、端口电压、叶轮转速、发电机转速、齿轮箱转速的与其他变量的非正态相关性表现几乎一样,且端口电压、叶轮转速、发电机转速、齿轮箱转速的曲线趋势相近,另外,有功功率是根据端口电压计算的,因此有功功率和端口电压的相关性表现一致但曲线幅值存在差异也比较合理,因此这5个变量可只取其一,只保留叶轮转速;(2)从相关性数值上看,励磁电流和励磁电压的相关性十分接近,且励磁电流与励磁电压的相关性高达0.9,且两者的曲线趋势相近,因此可只取其一,另外,励磁电流和励磁电压和其他变量的相关性都很小,因此可删去;(3)环境温度、机舱温度的相关性表现十分接近,且曲线趋势相近,因此可只取其一,只保留波动较大的机舱温度;(4)风向对其他所有变量的相关度均较小,可忽略不计,因此删去风向;s4.确定输入工况变量与输出工况变量;具体地,最后将简化后所剩的7个变量,包括前端2个变量(风速和叶轮转速),中端1个变量(机舱温度),后端4个变量(驱动端轴承温度、非驱动端轴承温度、水冷系统温度、绕组温度1),通过专家经验,确定输入工况变量和输出工况变量。确定输出工况变量:输入工况变量应该能够对输出工况变量产生较明显的直接或间接影响,且多个工况变量的类型尽量不同,比如尽量包含温度、功率、转速等不同维度特征,在此例中暂取“有功功率、发电机转速、机舱温度、水冷系统出口温度”作为输出工况变量。确定输入工况变量;输出工况变量应该对系统故障行为拥有较好的表征能力,在此例中暂取“非驱动端轴承温度、驱动端轴承温度、绕组温度1”作为输出变量。s5.工况变量标准化;具体地,通过数据标准化将不同工况变量的数据按比例缩放,使之落入一个小的特定区间,并去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的数据能够进行整合处理。在此例中,取典型的数据归一化进行处理,采用min-max标准化方法,将m个工况变量的数据均统一映射到[0,1]区间上。数据归一化还可提升后续模型的收敛速度和精度,防止模型梯度爆炸情况的出现。s6.处理输入工况变量;具体地,在m个输入工况变量中,可根据概率分布找出m1个快变化工况变量和m2个慢变化工况变量,且m1+m2=m。在此例的“有功功率、发电机转速、机舱温度、水冷系统出口温度”4个输入工况变量中,将有功功率和发动机转速确定为快变化的工况变量,将机舱温度和水冷系统出口温度确定为慢变化的工况变量,并在后续分析中采取差异处理。其中,输入工况变量可以由以下更详细的步骤进行处理,如说明书附图3所示。s601.对慢变化输入工况变量特征提取;具体地,将过去时间段[t-t,t]的数据变化趋势或特征用来描述一个当前瞬时时刻t的状态。由于连续数据具有丰富的信息,通过特征提取方法,可将一个时间段内连续数据的变化趋势抽取为相应的统计指标,用单个统计数值描述当前瞬时状态过去一段时间的变化趋势,增加单个时刻变量数值的信息丰富度。特别地,对时间窗口t大小的选择,通常影响计算复杂度以及前后时刻特征的区分度,一般选择总数据长度0.001%-0.05%的作为数据窗口。在此例中,总数据长度为一年的约600万个,取物理时长为一小时的720个数据作为时间窗口t。s602.对慢变化变量进行积分操作;具体地,温度变化是累积量,因此,输入参数要考虑积分量,目前考虑一个小时,以x(t-720+1)至x(t)的累加当作t时刻积分量。特别地,在做积分计算时,小于720的时刻,直接累加可能会影响积分曲线对原始曲线的还原性,可考虑k*720/t,其中t为当前时刻,k取1到3之间的数值。s603.合并快慢变化工况变量;具体地,对之前处理过的慢变化工况变量与不进行任何操作的快变量工况变量进行合并。s604.对合并后的工况进行工况变量排序。具体地,将合并后的工况变量从小到大进行排列,进行一次均分(分成class段),接着仅对概率大于2/class的区间进行二次均分(分成3段),最后仅对概率大于1/class的区间进行三次均分(分成2段)。s7.工况分类。具体地,为了更科学合理地划分工况,采用数值范围和数量范围统筹考虑的概率密度划分方法。根据不同需求,一共有三种不同的分类方法。(1)采用基于数量划分的方法:首先采用平均计算复杂度o(nlogn)较低的快速排序方法,分别对各个工况变量进行从小到大排序。接着分别统计各个工况变量在所有数值下的数量,并绘制数量分布图片。其中,若数据精度较高,可采取类似四舍五入的方式适当降低数据精度,增加数量分布的集中度,例如发电机转速变化范围为[0-1900),但存在13.48、800.16、1200.98等小数位,可将其处理为13、800、1200。(2)采用基于数值划分的方法:按照样本量比例给各个变量分别划分5个等级,依次为[0,20%)、[20%,40%)、[40%,60%)、[60%,80%)、[80%,100%]。(3)采用基于数值与数量混合的方法:对于每一个工况变量,在已绘制的数量分布中,先按数值范围粗糙地、均匀地划分成p个工况,接着基于数量范围划分的思想,统计p个工况所对应的数据段的出现概率,将工况区分为出现概率不同的n个等级。此例取n=4,概率区间为0.9-1称为出现概率较高的等级;概率区间为0.6-0.9称为出现概率高的等级;概率区间为0.3-0.6称为出现概率中的等级;概率区间为0-0.3称为出现概率低的等级。并且:1、将出现概率较高的工况所对应的数据段,再根据数值范围划分的思想均匀地细化分成q1个工况,2、将出现概率为高的工况,所对应的数据段再细化分成q2个工况;3、对于出现概率为中的工况保持不变;4、对于p个工况中出现概率为低的工况,进行相应的合并。其中,工况合并首先挑出样本数小于2000的工况m个,从前往后扫,从第i个工况的相邻工况(从m个里面判断)中选择样本数最少的一个工况,将其合并至第i个工况处,然后被合并工况处添加一个指针指向合并工况处,且指向是唯一的,最后当工况数量不在减少时,停止合并。特别地,在此例中,为了更准确地描述工况,也额外引入了新的工况标签:升温和降温标签。原有的工况标签均是数值大小,根据数值大小可判断所处的数值区间。对于机舱温度、水冷系统出口温度,现根据t时刻以及t-t时刻的温度值,计算两者的温差,升温为一大类,降温也为一大类。因此,原有的4个工况变量“有功功率、发电机转速、机舱温度、水冷系统出口温度”,被细分成了6个工况变量:“有功功率、发电机转速、升温的机舱温度、降温的机舱温度、升温的水冷系统出口温度、降温的水冷系统出口温度”。6个工况变量用于描述当前设备的工况,各个工况变量划分后的类别分别为8,8,10,8,8,8,总的工况类别为8×8×10×8×8×8=32万个,工况信息是十分全面丰富的。上述说明示出并描述了本发明的优选实施例,如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1