用于设备状态监测中故障诊断的归纳的模式识别的制作方法

文档序号:6302995阅读:212来源:国知局
用于设备状态监测中故障诊断的归纳的模式识别的制作方法
【专利摘要】在设备状态监测中使用归纳的模式识别来识别故障。在运行数据中识别模式簇。除了评注的训练数据,使用模式簇来训练分类器。运行数据也被用来将运行数据中的信号聚类为信号簇。通过评价置信度矢量,然后分类所监测的数据样本,所述置信度矢量包括用在与训练数据中所包含的信号相同的信号簇中的信号替换该包含在训练数据中的信号。
【专利说明】用于设备状态监测中故障诊断的归纳的模式识别

【技术领域】
[0001] 本发明一般地涉及设备状态监测,并且更具体涉及用于使用有监督的基于模式识 别的技术从有限的训练数据中检测设备故障的方法、系统和计算机可读介质。

【背景技术】
[0002] 设备状态监测的任务是在早期阶段检测设备故障,使得能够及时进行维护。在故 障情况下,非常重要的是知道故障的原因,从而能够进行相应定位的、并且由此更有效的维 护。
[0003] 基于规则的系统也许是最广泛使用的状态监测方法。规则的一般格式是"如果一 个条件,则一个故障类型"。规则通过拥有基础系统模型的知识的专家定义;然而,设计精确 的规则是非常深思熟虑并且耗时的过程,特别是对于具有许多传感器和故障类型的复杂系 统。例如,需要80人数年的时间来开发商业上成功的状态监测规则库。


【发明内容】

[0004] 本发明要通过提供一种用于设备状态监测的方法而解决上述需求。通过计算机接 收包括了随着时间来自于0个信号的历史运行数据。从来自于在运行数据中的个体信号的 数据中提取I个模式X。基于相似性,将I个模式聚类为K个模式簇c k,并且基于0个信号 中的相关性,将0个信号聚类为R个信号簇。
[0005] 接收评注的训练数据样本,其包含来自于从0个信号中选择的N个信号的数据并 且具有至少一个标记的故障时段。创建KXN置信度矢量,其包含了用于N个信号中的每个 信号的K个置信度值,每个置信度值代表了在信号的标记的故障时段中从数据中提取的模 式X属于K个模式簇中的一个的置信度。通过使用KXN置信度矢量来训练分类器。
[0006] 然后接收监测的数据样本,其包括来自于0个信号的数据。基于0个信号中的至 少一个不在I个信号中的信号处于与I个信号中的一个信号相同的信号簇中,并且还基于 对〇个信号中的至少一个信号具有与I个信号中的一个信号的、包含于KXN置信度矢量中 的置信度值相似的置信度值的判断,将监测的数据样本被分类为提示故障。
[0007] 在本发明的另一方面,提供了一种非暂时性计算机可用的介质,其具有存储在其 上的计算机可读指令,用于由处理器执行,以执行如上所述用于设备状态监测的方法。

【专利附图】

【附图说明】
[0008] 图1是按照本发明的一个实施方式的设备状态监测工具的示意图,
[0009] 图2是示出了按照本发明的一个实施方式的用于不同信号分类的置信度水平的 示例表,
[0010] 图3是示出了按照本发明的一个实施方式的用于实例化一个工具的计算机系统 的示意图。

【具体实施方式】 toon] 本公开着重于一种用于使用机器学习的方法,并且具体地是有监督的基于模式识 别的技术。机器学习模型是数据驱动的:它们是从训练数据自动被学习的。这可以非常快 地完成(例如,在数分钟之内)。如果被合适地训练,则机器学习模型能够比使用规则库所 可能的更好地描述复杂故障状态。
[0012] 因为机器学习技术是数据驱动的,所以它们需要足够的训练数据以获得期望的精 度。训练数据应当代表正常运行和故障模式二者。然而该要求是非常难以满足的。容易获 得代表了正常状态的训练数据,因为设备在其大部分寿命期间应当正常运行。而获取代表 了故障类型的训练数据是相当的挑战,因为某些类型的故障可能仅非常罕见地发生(甚至 我们考虑相似设备的集合)。即使对于那些少数实例,用户也不可能花时间评注它们全部。 由此非常可能的是,仅可获得代表了一个故障的一个训练样本,其使得故障相当难以学习。 此外,在监测期间,相同的故障类型可能在与在训练期间规定的信号不同的组的信号上显 示。由此如果采用传统的分类方法,几乎不可能分类新的故障类型。
[0013] 图1中示出的图100提供在此提出的技术的概览。技术包括两部分:训练部分120 和监测部分150。训练部分120附加地包括两个子部分。在第一子部分中,使用运行数据 131。特征在132从运行数据中被提取并且被用于信号聚类133和模式聚类134。在训练 120的第二子部分中,对用户评注的数据141进行特征提取142并且将其转换为置信度矢量 143,其在144被用来训练分类器。
[0014] 在监测期间,来自于提取的特征151的信号聚类和模式聚类的结果被用来计算用 于测试模式的置信度值表152。然后在153从置信度值表中创建候选假定。最可能的候选假 定在154被分类以做出最终判断("是"意味着存在故障并且"否"意味着模式是正常的。)
[0015] 在此描述的技术从有限的训练样本归纳出在未来监测期间可以预期到的故障特 征。在以下提出归纳的两个方案,即模式聚类134和信号聚类133 (图1),以从所述设备或 类似设备的运行数据中提取有用信息。这样的运行数据是容易获得的。运行数据可以包括 用户评注的训练数据和未评注的数据,并且可以包含已知或未知的故障。
[0016] 在模式聚类方案中,模式通过将运行数据中的所有模式进行聚类而被归纳。每个 簇可以被看作是一个症候。在与评注的模式相同的簇内的所有模式是相似的并且能够被看 作是评注的模式的可能变形。示出了一个症候的模式的置信度也被计算,以允许软聚类。
[0017] 在信号聚类方案中,信号通过使用运行数据对所有信号进行聚类而被归纳。假定 是,对于相同的故障类型的相似的症候在未来只能在相似的信号上发生。在监测期间,不是 仅检查通过评注所规定的信号,而是检查与评注的信号相似的所有可能信号。每个可能的 候选形成一个假设并且主要的假设被用于做出最终判断。
[0018] 问题定义
[0019] 在训练期间,用户从总共0个可获得的和有意义的信号中选择N个信号, S1, S2, ...,Sn。那些选择的N个信号可以是原始的传感器(例如测量温度、压力)。它们也 可以是来自于先前的数据处理的结果,诸如计算的值(例如几个原始传感器的平均值)或 残差(传感器值与其理想值的偏差)。此外,用户在故障发生时标记在h-Τ+Ι和h之间的 时间阶段T。数据评注通过图1的块141示出。
[0020] 上面的评注的目的是提示故障看起来如何并且其何时发生。用户可以评注该故障 的L个这样的实例。理想地,应当仅选择涉及该故障的信号。类似地,应当仅标记当故障发 生时的时间戳。设X,T维的矢量,表示信号s的模式,使得
[0021] X = [s (t0_T+l),s (t0_T+2),· · ·,s (t0) ]τ。
[0022] 所有N个模式可以被置于

【权利要求】
1. 一种用于设备状态监测的方法,包括: 通过计算机接收包括了随着时间来自于O个信号的历史运行数据; 从来自于在运行数据中的个体信号的数据中提取I个模式X; 基于相似性,将所述I个模式聚类为K个模式簇Ck; 基于所述O个信号中的相关性,将所述O个信号聚类为R个信号簇; 接收评注的训练数据样本,其包含了来自于从所述O个信号中选择的N个信号的数据 并且具有至少一个标记的故障时段; 创建KXN置信度矢量,其包含了用于所述N个信号中的每个信号的K个置信度值,每 个置信度值代表了从信号的标记的故障时段中的数据中提取的模式X属于K个模式簇中的 一个的置信度; 使用所述KXN置信度矢量来训练分类器; 通过计算机接收包括了来自于所述O个信号的数据的监测的数据样本;以及 基于所述〇个信号中的不在I个信号中的至少一个信号处于与所述I个信号中的一个 信号相同的信号簇中,并且还基于对所述〇个信号中的至少一个信号具有与所述I个信号 中的一个信号的、包含于所述KXN置信度矢量中的置信度值相似的置信度值的判断,而通 过计算机将监测的数据样本分类为提示故障。
2. 根据权利要求1所述的方法,其中,从运行数据中的个体信号提取I个模式包括使用 固定长度的滑动时间窗。
3. 根据权利要求1所述的方法,其中,将所述I个模式聚类为K个模式簇并且将所述O 个信号聚类为R个信号簇还包括: 对于所述I个模式的每一个,提取描述了模式的标量特征;和 使用所述标量特征来聚类模式和信号。
4. 根据权利要求1所述的方法,其中,将所述I个模式聚类为K个模式簇对于所有O个 信号执行。
5. 根据权利要求1所述的方法,其中,将所述I个模式聚类为K个模式簇对于相同信号 簇中的信号执行。
6. 根据权利要求1所述的方法,其中,将所述I个模式聚类为K个模式簇包括应用 K-mean聚类以形成簇。
7. 根据权利要求1所述的方法,其中,将所述O个信号聚类为R个信号簇还包括: 基于历史运行数据计算成对的信号相关性;和 使用分级式聚类对信号进行聚类。
8. 根据权利要求1所述的方法,其中,代表模式X属于模式簇ck的置信度的每个置信 度值通过下式定义:
其中Pk是簇ck的权重,并且dist(f(x),μk)是在描述模式X的模式特征矢量f(x)和 簇Ck的平均μk之间的距离。
9. 根据权利要求1所述的方法,其中,对于特定信号,K个置信度值中的一个置信度值 等于1,并且该K个置信度值中的剩余置信度值等于零。
10. 根据权利要求1所述的方法,其中,对于N个信号中的每一个,K个置信度值的和等 于1。
11. 根据权利要求1所述的方法,其中,对监测的数据样本进行分类包括: 对于监测的数据样本信号O的子组合,评价置信度矢量,其中每个评注的数据训练信 号N或者包括在子组合中或者在子组合中由如下所监测的数据样本信号代表,该所监测的 数据样本信号处于与被代表的评注的数据训练信号相同的信号簇Ck中。
12. 根据权利要求11所述的方法,其中,对监测的数据样本进行分类还包括: 应用贪婪算法,以识别主导的置信度矢量;和 判断,用于所述主导的置信度矢量的评价函数值是否超过阈值。
13. -种非暂时性计算机可用介质,具有存储于其上的计算机可读指令,用于由处理器 运行,以执行设备状态监测的方法,该方法包括: 接收随着时间来自于O个信号的历史运行数据; 从来自于在运行数据中的个体信号的数据中提取I个模式X; 基于相似性,将所述I个模式聚类为K个模式簇ck; 基于所述O个信号中的相关性,将所述O个信号聚类为R个信号簇; 接收有评注的训练数据样本,其包含了来自于从所述O个信号中选择的N个信号的数 据并且具有至少一个标记的故障时段; 创建KXN置信度矢量,其包含了用于N个信号中的每个信号的K个置信度值,每个置 信度值代表了从信号的标记的故障时段中的数据中提取的模式X属于所述K个模式簇中的 一个的置信度; 通过使用所述KXN置信度矢量来训练分类器; 接收包括来自于所述O个信号的数据的监测的数据样本; 基于所述O个信号中的至少一个不在I个信号中的信号处于与所述I个信号中的一个 信号相同的信号簇中,并且还基于对所述O个信号中的至少一个信号具有与所述I个信号 中的一个信号的、包含于所述KXN置信度矢量中的置信度值相似的置信度值的判断,而将 监测的数据样本分类为提示故障。
14. 根据权利要求13所述的非暂时性计算机可用介质,其中,从运行数据中的个体信 号提取I个模式包括使用固定长度的滑动时间窗。
15. 根据权利要求13所述的非暂时性计算机可用介质,其中,将所述I个模式聚类为K 个模式簇并且将所述〇个信号聚类为R个信号簇还包括: 对于所述I个模式的每一个,提取描述了该模式的标量特征;和 使用所述标量特征来聚类模式和信号。
16. 根据权利要求13所述的非暂时性计算机可用介质,其中,将所述I个模式聚类为K 个模式簇对于所有〇个信号执行。
17. 根据权利要求13所述的非暂时性计算机可用介质,其中,将所述I个模式聚类为K 个模式簇对于相同信号簇中的信号执行。
18. 根据权利要求13所述的非暂时性计算机可用介质,其中,将所述I个模式聚类为K 个模式簇包括应用K-mean聚类以形成簇。
19. 根据权利要求13所述的非暂时性计算机可用介质,其中,将所述O个信号聚类为R 个信号簇还包括: 基于历史运行数据计算成对的信号相关性;和 使用分级式聚类对信号进行聚类。
20. 根据权利要求13所述的非暂时性计算机可用介质,其中,代表模式X属于模式簇ck 的置信度的每个置信度值通过下式定义:
其中Pk是簇ck的权重,并且dist(f(x),μk)是在描述模式X的模式特征矢量f(x)和 簇Ck的平均μk之间的距离。
21. 根据权利要求13所述的非暂时性计算机可用介质,其中,对于特定信号,K个置信 度值中的一个置信度值等于1,并且该K个置信度值的剩余置信度值等于0。
22. 根据权利要求13所述的非暂时性计算机可用介质,其中,对于所述N个信号中的每 一个,K个置信度值的和等于1。
23. 根据权利要求13所述的非暂时性计算机可用介质,其中,对监测的数据样本进行 分类包括: 对于监测的数据样本信号O的子组合,评价置信度矢量,其中每个评注的数据训练信 号N或者包括在子组合中、或者在子组合中由如下监测的数据样本信号代表,该监测的数 据样本信号处于与被代表的评注的数据训练信号相同的信号簇Ck中。
24. 根据权利要求23所述的非暂时性计算机可用介质,其中,对监测的数据样本进行 分类还包括: 应用贪婪算法,以识别主导的置信度矢量;和 判断,用于主导的置信度矢量的评价函数值是否超过阈值。
【文档编号】G05B23/02GK104471501SQ201380036704
【公开日】2015年3月25日 申请日期:2013年6月3日 优先权日:2012年6月12日
【发明者】C.袁, A.查克雷博蒂, L.威布金, H.哈克斯坦 申请人:西门子公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1