带噪声的监控器检测和间歇故障隔离的制作方法

文档序号:6336916阅读:654来源:国知局
专利名称:带噪声的监控器检测和间歇故障隔离的制作方法
技术领域
本发明总体上涉及数据处理系统和方法,且更具体地涉及从具有间歇系统故障的 带噪声的监控器辨别伪故障。
背景技术
间歇故障可能在数据处理系统内在没有进行任何动作比如对系统配置的维修和 更换的情况下出现或消失。故障可从其感测信号的间歇现象检测。这种检测可转换为诊断 监控,其中“O”指示未检测到故障(解除)而“1”指示检测到故障(指示)。然而,已知系统在 辨别由带噪声的监控器或来自可能成为永久故障的间歇故障的瞬态环境状况生成的暂时 异常传感器值时是无效的,从而导致例如错误的信息或连接器问题。从可能导致永久故障 的间歇故障辨别这些暂时异常传感器值是有利的。间歇故障的实时检测和诊断已经成为系统诊断的挑战。一方面涉及故障自身的间 歇性。同间歇性关联的两个主要挑战是1)不可预测的发生故障的频率,这使得检测变得困 难,和2)故障的起因,其不仅取决于所研究系统的潜在故障,而且还取决于不可预测的瞬态 环境状况。另一方面涉及用于检测故障的传感器/监控器。待检测的系统没有故障,但是 传感器/监控器本身因为它们自身的故障而有噪声,这是很有可能的。使实时检测和诊断变得困难的是对事件的采样。故障的不可预测性使得难以确定 在可能推断出检测到的故障是系统的真实故障、监控器是带噪声的、还是存在需要进一步 监控的情况之前,事件应该被监控多长时间。因此,期望提供一种从间歇系统故障中辨别出伪故障的方法和系统,该伪故障例 如可能由产生暂时异常传感器值的瞬态环境状况或带噪声的监控器造成。此外,本发明的 其他期望特征和特性将从随后的详细说明和所附权利要求,连同附图和前述的技术领域和 背景技术变得显而易见。

发明内容
—种检测和诊断系统故障的方法,包括在操作期间检测监控器的带噪声的状态并 且结合量化的监控器不确定性等级以支持故障隔离推理。另一种检测和诊断系统故障的方法,包括采集数据且执行数据的监控器评价以确 定该监控器是否是带噪声的。如果监控器不是带噪声的,则确定故障隔离。如果不能确定 监控器不是带噪声的,则采集附加数据。对监控器是否是带噪声的或是否存在间歇故障进 行评价。如果不能进行评价,则确定监控器的不确定性。


在下文中,将连同下列附图描述本发明,其中相似的数字表示相似的元件,且 图1是适于在实施优选实施例中使用的计算机系统的框图2-6是图示监控器值的五个观察情景的图表; 图7是图示序列概率比测试的图表; 图8是图2-6中五种情景的观察值表; 图9是图8中五种情景的观察值的图表; 图10是不确定性随概率的变化图表; 图11是对于图2情境的不确定性计算值的表; 图12是对于图6情境的不确定性计算值的表;以及 图13是监控器推理架构的流程图。
具体实施例方式下面对发明的详细说明实际上只是示例性的,并且不意图限制本发明或本发明的 应用和使用。此外,不意图被前述的技术领域、背景技术、发明内容、或以下的详细说明所给 出的任何理论所限制。本文描述的示例性实施例使用序列概率比测试(SPRT)来统计测试监控器的带噪 声的状态。SPRT是贝叶斯统计过程,其要求在执行数据采集之前,详细描述模型的结果期 望。如果在数据采集期间满足某些条件,则将就继续数据采集和所收集的数据的解释作出 判定。当数据被采集时,计算对数似然比的和。如果该和大于第一预先限定的阈值,则接受 第一预先限定的假设,或者如果该和小于第二阈值,则接受第二预先限定的假设。在数据正 在被采集时对该数据进行分析允许比经典假设测试得到更早的结论。香农熵理论被用于量化监控器的不确定性等级以支持监控器值在故障隔离中的 使用。在信息论(数据处理)中,熵是对同随机变量有关的不确定性的测量。香农熵是对信 息期望值的测量,通常用比特表示。更具体地,当随机变量未知时,香农熵理论是对平均信 息内容的测量。例如,如果两个事件是均等可能的,则熵为1 (比特),或者如果事件之一绝 对会发生,则熵为0。因此随机事件的熵值X为0彡X彡1。香农熵常规上已被用于测量 包含在消息中、与可预测的消息部分相反的信息,例如涉及字母或单词重复的出现频率的 语言结构或统计属性中的冗余度。基于所作的判定,在故障诊断推理中可能考虑或可能不考虑监控器。如果基于上述 算法,没有检测到带噪声的监控器,且故障间歇超出了预期值,那么宣布故障是间歇性的。参考图1,可被用来实施本文描述的示例性实施例的数据处理设备100的框图可 以被配置为通用计算装置,例如计算机102。数据处理设备100通常包括处理器104,存储 器106,和在操作中将各种系统元件耦合到处理器104的系统总线108。处理器104可能包 括,例如单一中央处理器(CPU)或并行处理环境。数据处理设备100进一步包括一个或多个用于存储和读取程序和其他数据的数 据存储设备,例如盘驱动器110。盘驱动器110可以包括例如硬盘驱动器,磁盘驱动器,或者 光盘驱动器(未显示)中的一个或多个,且通过盘驱动器接口 112耦合到系统总线108。这 些盘驱动器110和与它们关联的计算机可读介质提供了计算机可读指令、数据结构、程序模块和数据处理设备100所使用的其他数据的非易失性存储。监控器120通过适配器114 或其他接口耦合到系统总线108。另外,数据处理设备100可能包括其他外围输出装置(未 显示),其包括例如扬声器和打印机。要指出,本文公开的示例性实施例可以在主机操作系统和一个或多个模块的背景 下实施。在计算机编程现有技术中,软件模块可通常被实施为执行特定任务或实施特定抽 象数据类型的例程和/或数据结构的集合。软件模块通常包括可存储于数据处理设备的存储器位置内的指令介质,且通常包 括两个部分。第一,软件模块可能列出可以被其他模块或例程访问的常量、数据类型、变量、 例程等等。第二,软件模块可以被配置为实施方式,其可以是专用的(或许仅可由模块访 问),且包含实际上实施模块基于的例程或子例程的源代码。本文所使用的术语模块因此可 以指代软件模块(dule)或其实施方式。这样的模块可单独使用或一起使用以形成可以通 过信号承载介质实施的程序产品,所述信号承载介质包括传输介质和可记录介质。要重点指出的是,尽管在全功能数据处理设备100例如计算机的背景中描述了实 施例,但是本领域技术人员将意识到本发明的机制能够被分配为各种形式的程序产品,且 意识到所描述的示例性实施例同等地应用,而不管实际用来实行分配的信号承载介质的特 定类型。信号承载介质的示例包括,但是不限于,可记录型介质(例如软盘或CD ROM)和传 输型介质(例如模拟或数字通信链路)。可以结合实施例来使用可以存储数据(所述数据可由计算机访问)的任何类型的 计算机可读介质,例如磁带,闪存卡,数字多功能光盘(DVD),伯努利盒式磁带(bernoulli cartridge),随机存取存储器(RAM)和只读存储器。数据处理设备100可以使用到一个或多个远程计算机(未显示)的逻辑连接而在联 网环境中操作。使用耦合到数据处理设备或与数据处理设备集成的通信装置来实施这些逻 辑连接。要被分析的数据序列可以存在于联网环境中的远程计算机上。远程计算机可以是 另一台计算机、服务器、路由器、网络PC、客户端,或者对等装置或者其他公用网络节点。逻 辑连接通过网络接口 1 同数据处理设备100对接。这样的联网环境在办公网络、企业广 域计算机网络、内联网和互联网中是常见的。本领域技术人员将意识到所示的网络连接通 过举例的方式提供,并且可以使用用于在计算机之间建立通信链路的通信装置和其其他装 置。示例性实施例的算法对如下各项加以区别1)归因于带噪声的监控器的伪故障,2) 归因于不可预测环境/操作状况的瞬态故障,和3)待检测的可能导致永久故障的系统的真 正间歇故障。算法还将间歇的不确定性等级结合到故障隔离中。监控系统的监控器(算法)提供指示符,当检测到故障(指示)时,所述指示符取值 为1,当无故障(解除)时,其取值为0。监控器可能是来自待检测系统的直接信号(例如心 跳),或来自与故障有关现象的导出指示符(例如振动频率)。监控器可被用于指示一个或多 个故障,且故障可触发一个或多个监控器。提供了代表上面讨论的典型间歇情况的五种情景。要指出在下面讨论的图中,数 据的记录开始于监控器的值第一次发生变为“1”(指示)时。还要指出在运行时间期间只 要数据以连续字符串到达,数据就不必为周期的。尽管仅示出一个监控器,但也可以使用多 个监控器和多个故障。
第一种情景(非间歇)是当监控器被触发,且它的值保持为M = 1时。这指示永久 故障(非间歇),因此M = 1可被用于设计以用作故障隔离的证据(图2)。第二种情景代表当监控器被触发短暂的时间段,并且然后返回到解除的情形(图 3)。这种类型的故障典型地由暂时操作/环境状况造成,因此当异常状况停止时指示报告 消失。检测这种间歇的常规方法每预先限定的时间段延迟报告指示状态。尽管这种常规方 法可能消除一些间歇问题,却有一个根本缺陷,就是间歇的频率难以预测,从而导致预先限 定延迟周期变得非常主观。第三种情景(瞬态故障/状况)代表监控器值在1和0之间来回切换(图4)的情 况。尽管仅示出了几个循环,应该理解可能发生许多更多循环。监控器的值最终被固定在 M=O (解除)处,指示检测到的故障是瞬态的。这种间歇可能是由于间歇故障或系统在时间 段期间频繁经历的瞬态异常状况。在第四种情景(间歇故障到永久故障)中,监控器观察指示(图5)故障起初是间歇 的,然后被转变为永久故障。间歇周期可能比所示的长得多。在第五种情景(带噪声的监控器或间歇故障)中,在系统的操作期间,监控器值既 不固定在0处,也不固定在1处(图6)。这可能是由于带噪声的监控器或连续间歇故障。判 定这是由于带噪声的监控器还是由于间歇故障要求附加信息(数据)。这将在随后更详细地 讨论。可以自动区分上述间歇情景,然后使用间歇信息来引导故障隔离的算法在故障诊 断中是非常期望的。为了区分间隙检测,统计顺序概率比(SPRT)测试方法被使用。静态运算参数被限定为ρ彡Pl (不带噪声的),以及P彡p2(带噪声的),其中pi 和P2是用户基于系统对噪声的容限等级限定的(例如pl=0. 1和p2=0.4)。当真实监控器 值为0,但是LRUI记录成1时,误差小于α。当真实监控器值为1,但是LRUI记录成0时, 误差小于β。再次,α和β是用户基于系统的误差容限限定的(例如α = 1%和β = 1%)。 对于每个周期性监控的动态观察参数包括1)监控报告的总次数(从第一次监控器报告值1 开始)为N_m,和2)监控器已将其状态从0切换到1的总次数(包括初始的1)为N_s。SPRT主要优点在于它不需要预先限定的样本大小,但是样本大小可以在操作期间 累积直到作出判定为止,而不管备择假设(alternative hypothesis)是否正确。这是一个 具有吸引力的特征应用于对由于间歇特征发生的时间段不可预测性引起的间歇故障的检 测,且不需要预先限定的延迟周期。在检测到任何故障之前,假设系统工作正常。因此,零假设(null hypothesis)为 M=O (解除,即无故障),并且其对照M=I (指示,即检测到故障)的备择假设测试。基于M的 观察值,这种方法可能导致三个结果1)统计地M=O (接受零,并且拒绝备择假设);2)统计 地M=I (拒绝零,并且接受备择假设);和3)未定的(利用现有数据,无法做出判定)。要指出, 在这三种情况的任一种中,在给定时间监控器值可以是0或1,并且判定基于累积数据的统 计显著性。因此,监控器值的间歇在任何一种情况下都是允许的。对于1)和2),结论是监 控器是不带噪声的,且为故障隔离设置监控器值。对于3),或者监控器是带噪声的,或者存 在连续间歇故障,且需要其他信息来对情况进行区分。为了阐明测试,当传感器第一次从0变为1 (第一次指示)时,采集数据用于间歇分 析,如图4-8和上述讨论所示的那样,且在给定时间采集到的全部数据点作为N_m被计数。在该时间期间,N_m被计数,当M=I时数据点的总数也被计数为N_s。于是在该周期期间M=I 的概率为p=N_s/N_m。较低的概率被限定为p_low (例如1096,即0. 1),而较高的概率被限定*p_high (例如9096,即0.9),以致于当ρ <= p_low时,接受零假设,其中假的负误差为α (例如, M=I但是被测得为M=O的机率为0. 001,即0. 1%),且当ρ >= p_high时,接受备择假设,其中 假的正误差为β (例如,M=O但是被测得为M=I的机率为0. 001,即0. 1%)。当p_low<p<p_ high时,如果M=O或M=I则无法进行判定。给定所观察的监控器值为“ 1 ”的概率,即P,和在样本N_m中M=I的N_s数,获得如 所观察的样本的概率为
权利要求
1.一种检测和诊断系统故障的方法,包括在操作期间尝试确定监控器是否是带噪声的;以及如果不能确定带噪声的状态,则结合量化的监控器不确定性等级以支持故障隔离推理。
2.根据权利要求1所述的方法,其中该尝试步骤包括设置第一阈值; 设置第二阈值; 采集数据;当所述数据被采集时,计算对数似然比的和;以及如果所述和超过第一阈值,则接受第一假设,或者如果所述和小于第二阈值,则接受第 二假设。
3.根据权利要求1所述的方法,进一步包括 将对带噪声的状态的检测转换为诊断监控。
4.根据权利要求1所述的方法,其中尝试步骤包括区分归因于带噪声监控器的伪故障、归因于不可预测状况的瞬态故障和间歇故障。
5.一种检测和诊断系统故障的方法,包括a)采集数据;b)执行对所述数据的监控器的第一评价以确定所述监控器是否是带噪声的;c)如果所述监控器不是带噪声的,则确定故障隔离;d)如果不能确定所述监控器是带噪声的,则采集附加数据;e)执行所述监控器是否是带噪声的或是否存在间歇故障的第二评价; f )如果不能执行所述第二评价,则确定不确定性。
6.根据权利要求5所述的方法,其中所述确定步骤包括 使用香农熵理论。
7.根据权利要求5所述的方法,其中所述步骤b-e包括 使用序列概率比统计测试。
8.根据权利要求7所述的方法,其中所述确定步骤包括 使用香农熵理论。
9.根据权利要求5所述的方法,进一步包括 将对带噪声的状态的检测转换为诊断监控。
10.根据权利要求5所述的方法,其中所述步骤b-e包括区分归因于带噪声监控器的伪故障、归因于不可预测状况的瞬态故障和间歇故障。
全文摘要
本发明涉及带噪声的监控器检测和间歇故障隔离。一种检测和诊断系统故障的方法,包括在操作期间尝试检测监控器的带噪声的状态,且结合量化的监控器不确定性等级以支持故障隔离推理。序列概率比统计测试被用于统计地测试监控器的带噪声的状态,且香农熵理论被用于量化监控器的不确定性等级以支持监控器值在故障隔离中的使用。
文档编号G06F11/22GK102141948SQ20101056131
公开日2011年8月3日 申请日期2010年11月26日 优先权日2010年1月29日
发明者B·J·巴顿, D·M·科尔贝, D·米勒, Q·G·邵, R·R·芒努松 申请人:霍尼韦尔国际公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1