基于特征分组和分布维度均衡化的风电机组故障诊断方法

文档序号:28161765发布日期:2021-12-24 20:18阅读:来源:国知局

技术特征:
1.一种基于特征分组和分布维度均衡化的风电机组故障诊断方法采用离线学习模型参数,在线执行故障诊断的算法框架,诊断算法的离线学习部分主要由数据预处理,特征提取,合成少数过采样(smote),模型训练几个模块组成,在线分析部分主要由故障诊断模块组成。2.根据权利要求1所述的离线数据预处理模块,其特征在于:所述数据预处理部分主要步骤包括数据清洗、数据结构标准化、数据标定以及数据归一化;所述的数据清洗步骤负责删除原始数据文件里面的无效数据,包括停机数据,有缺失项数据;所述的数据结构标准化步骤负责将可能的异构原始数据统一转换为相同的数据格式,方便后续步骤执行;所述的数据标定是根据故障数据和其对应的故障标号对每个原始数据进行数据标定;所述的数据归一化步骤负责将不同尺度的多元参数都去中心化和归一化。3.根据权利要求1所述的合成少数过采样模块,其特征在于:所述的过采样部分主要步骤包括少数类确定、计算k近邻样本集、选择近邻样本和生成新样本;所述的少数类确定步骤将已标定的数据群中的故障类数据分隔开;所述的k近邻样本集步骤对每个少数类样本生成k近邻的样本集;所述的选择近邻样本步骤负责从生成的近邻样本集中选择一个近邻样本代表;所述的生成新样本步骤负责产生新的少数类样本。4.根据权利要求1所述的特征提取模块,其特征在于:所述的特征提取部分主要步骤包括初始化权重和权重迭代更新;所述的初始化权重步骤负责为所有特征初始化零值;所述的权重迭代更新步骤负责在设定的采样次数内,通过随机采样故障样本,并分别抽取故障集中的最近邻样本和其他样本集中的最近邻样本来迭代更新所有特征的权重,最后根据预先设置的阈值,筛选最优特征集。5.根据权利要求1所述的模型训练模块,其特征在于:所述的模型训练部分主要步骤包括马氏距离计算、度量正态化和异常阈值挖掘;所述的马氏距离计算步骤负责对所提取的特征数据依次计算其到中心数据的马氏距离;所述的度量正态化步骤负责将非正态分布的度量转换为正态分布度量;所述的异常阈值挖掘步骤负责从正态化的度量中挖掘异常检测的阈值。6.根据权利要求1所述的故障诊断模块,其特征在于:所述的故障诊断部分主要步骤包括模型加载、异常检测、模型更新和故障概率计算;所述的模型加载步骤负责加载离线时训练完成的概率分布模型;所述的异常检测步骤负责将实时数据输入到正常概率模型内进而输出异常与否;所述的模型更新步骤包括诊断结果先验和模型参数更新;所述的诊断结果先验步骤负责将诊断结果的正常数据进行缓存;所述的模型参数更新步骤负责根据先验对模型参数进行动态微调;所述的故障概率计算步骤负责将异常数据分别输入到不同故障模式概率模型内,并输出对应的概率。

技术总结
本发明提出了一种基于特征分组和分布维度均衡化的风电机组故障诊断方法。所述的故障诊断技术分为离线和在线两种模式,离线模式由历史数据加载、数据处理、数据标定、特征提取、合成少数过采样、模型训练和模型导出等部分组成;在线模式主要由系统实时数据获取、数据处理、特征提取、异常检测、模型动态更新和故障诊断等部分组成。历史数据首先经过数据预处理,对于少数类的历史数据再进行合成少数过采样处理使得故障数据和正常数据尺度上相近,提升后续模型训练效果;所述的离线模式中模型导出后,可以在算法在线模式中加载,对于系统实时数据的处理过程则和离线模式相同。数据的处理过程则和离线模式相同。数据的处理过程则和离线模式相同。


技术研发人员:于劲松 石昊东 李鑫 高占宝 唐荻音 刘浩
受保护的技术使用者:北京航空航天大学
技术研发日:2021.09.13
技术公布日:2021/12/23
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1