故障预测装置制造方法

文档序号:6298974阅读:119来源:国知局
故障预测装置制造方法
【专利摘要】本发明涉及故障预测装置。在不对系统产生影响的条件下预测应用于系统的机器单体的故障。根据实施方式,故障预测装置具有:第一收集单元,收集表示故障预测对象系统的各部分的运行状态的系统状态以及该状态下的系统各部分的行为信息;生成单元,根据收集的系统状态与行为信息,生成作为与系统的状态相应的行为信息的模型的动作预测模型;第二收集单元,在故障预测对象的系统的运行中,收集系统的状态与该状态下的系统各部分的行为信息;故障预测单元,根据第二收集单元的收集结果与生成的动作预测模型,判断运行中的系统的状态中的行为信息是否与动作预测模型中的相同系统状态中的行为信息不同,从而进行系统的故障预测。
【专利说明】故障预测装置

【技术领域】
[0001 ] 本发明的实施方式涉及故障预测装置。

【背景技术】
[0002]产业用计算机适用于社会基础设施系统等要求稳定的连续运行的系统。这样的系统构成为通过冗余化等的方法防止系统内的机器单体的故障给整个系统带来影响。
[0003]防止由机器单体的故障给整个系统带来影响的技术,由检测机器单体的故障的技术以及将发生故障的机器执行的处理由其他手段代替的技术组成。
[0004]在先技术文献
[0005]专利文献
[0006]专利文献1:特开2008-206135号公报


【发明内容】

[0007]然而,为了检测机器单体的故障,需要在使用该机器的系统进行动作的状态中检测该机器单体的故障,所以不能使用在机器单体的验证中被使用的测试程序等。
[0008]此外,在通常的安装状态下,机器单体处于故障状态后,即便检测出该故障,需要时间来替代机器,所以难以防止对系统的影响。
[0009]本发明旨在提供一种可在不影响系统的条件下预测应用于系统的机器单体的故障的故障预测装置。
[0010]根据实施方式,故障预测装置具有:第一收集单元,收集系统状态以及该状态下的系统各部分的行为信息,其中,所述系统状态表示故障预测对象系统的各部分的运行状态;生成单元,根据收集的系统状态与行为信息,生成动作预测模型,作为与系统的状态相应的行为信息的模型;第二收集单元,在故障预测对象系统的运行中,收集系统的状态以及该状态下的系统各部分的行为信息;故障预测单元,根据第二收集单元的收集结果以及生成的动作预测模型,判断运行中的系统的状态中的行为信息是否与动作预测模型中的相同系统状态下的行为信息不同,从而进行系统的故障预测。

【专利附图】

【附图说明】
[0011]图1是表示实施方式的故障预测装置的构成例的框图。
[0012]图2是表示实施方式的故障预测装置进行的故障预测对象系统的动作预测模型的生成或故障预测的概要的图。
[0013]图3是说明实施方式的用于生成动作预测模型的各种功能的图。
[0014]图4是表示实施方式的用于生成动作预测模型的步骤的一例的流程图。
[0015]图5是以表格形式表示实施方式的动作预测模型的一例的图。
[0016]图6是说明关于实施方式的用于故障预测的各种功能的图。
[0017]图7是表示实施方式的用于故障预测的步骤的一例的流程图。

【具体实施方式】
[0018]以下,参照【专利附图】
附图
【附图说明】实施方式。
[0019]图1是表示实施方式的故障预测装置的构成例的框图。
[0020]如图1所示,故障预测装置10具有非易失性存储器等的存储装置11、通信接口12、控制装置20、输入装置30、以及显示装置40。
[0021]输入装置30为键盘或鼠标。显示装置40例如为液晶显示器。
[0022]存储装置11具有状态信息存储部Ila以及动作预测模型信息存储部lib。
[0023]控制装置20具有状态信息收集部21、行为信息收集部22、动作预测模型生成部23、故障预测部24、以及通知部25。
[0024]通信接口 12以可通信的方式与个人电脑(PC)等的故障预测对象系统50连接。
[0025]在图1所示的例子中,故障预测装置10与故障预测对象系统50被分开,但并不限定于此,也可以构成为:将故障预测装置10的各种功能例如构成为软件并应用于故障预测对象系统50,使其在该故障预测对象系统50内动作。
[0026]图2是表示实施方式的故障预测装置进行的故障预测对象系统的动作预测模型的生成或故障预测的概要的图。
[0027]故障预测装置10能够根据故障预测对象系统50的各机器的状态信息或机器单体的行为信息,生成作为故障预测对象系统50的各机器的故障预测模型的动作预测模型。在该动作预测模型中,显示出故障预测对象系统50的各机器对于各种状态或状态变化的正常的行为信息。
[0028]状态信息是表示故障预测对象系统50的各种运行状态以及发生何种状态变化的信息。该信息通过操作员使用输入装置30被输入。
[0029]行为信息是表示操作员对故障预测对象系统50进行操作后的各机器单体的变化的信息。
[0030]例如,故障预测对象系统50主体内的温度传感器、电压传感器的检测结果、网络数据包的统计信息、以及PCle (PCI Express (注册商标))之类的以数据包为基础的串行总线的数据包统计信息等,相当于各部分的行为信息。
[0031]动作预测模型的生成方法需要是能够允许一定程度的模糊性的方法。贝叶斯滤波器、神经网络等的自适应学习法相当于该方法。
[0032]动作预测模型生成后,故障预测装置10将所述状态信息作为教师信号,将输入了所述行为信息的结果反馈到动作预测模型,从而进行动作预测模型的强化学习。
[0033]故障预测装置10对故障预测对象系统50的所有表示状态或状态变化的信息进行动作预测模型的强化学习,在可进行故障预测对象系统50的故障的正确预测时,结束动作预测模型的生成。
[0034]在故障预测对象系统50的故障预测时,故障预测装置10使用上述生成的动作预测模型进行故障预测。
[0035]具体地说,故障预测装置10在故障预测时输入故障预测对象系统50的状态信息或行为信息。
[0036]状态信息通过行为信息收集机构通知给故障预测机构。该通知后的系统各部分的行为信息被行为信息收集机构收集并通知给故障预测机构。
[0037]故障预测机构对照这些收集的状态信息与行为信息的组合和动作预测模型。通过该对照,当收集的状态信息的对应行为信息相当于动作预测模型中的相同的状态信息的对应行为信息时,故障预测机构认为由该状态信息所表示的系统状态或系统的状态变化中存在故障征兆。
[0038]此时,故障预测机构将故障预测通知发送到故障预测对象系统50的处理机构或操作员。
[0039]这样,如果能够检测到机器单体的故障的征兆,通过预先将在该机器中执行的处理转换至代替装置,能够预先防止该机器单体的故障对系统带来的影响。
[0040]其次,分别对动作预测模型生成以及故障预测的具体情况进行说明。
[0041]首先对用于动作预测模型生成的各种功能的具体情况进行说明。
[0042]图3是说明用于实施方式的动作预测模型生成的各种功能的图。在此表示安装用于进行作为故障预测对象系统50的PC的故障预测的故障预测装置10的例子。在此,假设为,图1中所示的控制装置20内的各部分的功能在故障预测对象系统50中作为模型化机构、行为信息收集机构、以及行为信息收集驱动程序等被安装。
[0043]图4是表示用于实施方式的动作预测模型生成的步骤的一例的流程图。
[0044]操作员通过对输入装置30的操作,输入表示故障预测对象系统50的系统状态以及发生何种状态变化的信息(SI)(图3中的(I))。模型化机构(在此,对应于状态信息取得部21)取得该输入信息,并存储到存储装置11的状态信息存储部Ila (S2)。
[0045]操作员对故障预测对象系统50的系统应用程序进行操作,以生成在SI中输入的系统状态或状态变化(S3)(图3中的(2))。
[0046]系统应用程序根据S2中的操作使系统进行动作(S3)(图3中的(3))。
[0047]其次,行为信息收集机构(对应于行为信息收集部22)收集系统各部分的行为信息,并发送到行为信息收集驱动程序(S4)(图3中的(4))。
[0048]例如,行为信息收集机构收集CPU总线状态、存储器总线状态、各种内部传感器信息(例如温度、电压等)、PCle总线数据包统计信息、数据包的类别(存储器请求、I/O请求、配置请求、完成请求、消息(message))、数据包的数目、以及重试次数等。
[0049]如上收集总线数据包统计信息是因为直接保存数据包是困难的。
[0050]模型化机构(在此对应于动作预测模型生成部23)收集来自行为信息收集驱动程序的行为信息(S5)(图3中的(5))。
[0051]模型化机构根据SI中输入的状态信息以及S5中收集的行为信息,生成动作预测模型(S6),该动作预测模型表示对于状态信息的各状态和状态变化的正确行为,然后,将该生成的动作预测模型存储到存储装置11的动作预测模型信息存储部lib (S7)。
[0052]图5是以表格形式表示实施方式的动作预测模型的一例的图。
[0053]其次,说明关于动作预测模型生成后的用于故障预测的各种功能的具体情况。图6是说明关于用于实施方式的动作预测模型生成的各种功能的图。在此表示用于进行作为故障预测对象系统50的PC的故障预测的故障预测装置10的安装例子。在此假设,图1中所示的控制装置20内的各部分的功能在故障预测对象系统50中作为故障预测机构、行为信息收集机构、以及行为信息收集驱动程序等被安装。
[0054]图7是表示用于实施方式的故障预测的步骤的一例的流程图。操作员通过对输入装置30的操作,进行操作使故障预测对象系统50的系统应用程序动作(Sll)(图6中的
(7))。
[0055]系统应用程序将通过Sll的操作发生的表示系统状态或状态变化的状态信息通知给故障预测机构(在此对应于故障预测部24) (S12)(图6中的(8))。
[0056]系统应用程序根据Sll中的操作使系统动作(S13)(图6中的(9))。
[0057]行为信息收集机构(对应于行为信息收集部22)收集系统各部分的行为信息,并发送到行为信息收集驱动程序(S14)(图6中的(10))。所收集的信息的种类与动作预测模型生成时相同。
[0058]故障预测机构(在此对应于故障预测部24)收集来自行为信息收集驱动程序的行为信息(S15)(图6中的(11))。
[0059]故障预测机构(在此对应于故障预测部24)读出存储于动作预测模型信息存储部Ilb中的动作预测模型。该故障预测机构根据该动作预测模型、在S12中被通知的状态信息以及在S15中收集的行为信息,进行故障预测对象系统50的故障预测(S17)(图6中的
(12))。
[0060]当在故障预测对象系统50中发现故障的征兆时,也就是说当对于在S12中被通知的状态信息而在S15中被通知的状态信息与在动作预测模型中表示的相同状态信息的对应行为信息不一致时,故障预测机构(在此对应于通知部25)向系统应用程序或操作员通知表示该状态信息所涉及的故障征兆的故障预测结果(S18)(图6中的(13))。
[0061]如上,实施方式的故障预测装置将故障预测对象系统动作的状态中的各部分的行为信息模型化,并通过比较该模型与系统的动作中的行为信息,能够进行故障预测。
[0062]因此,在故障预测对象系统处于系统运行中的状态下,能够防止对该系统的影响,并且能够预测系统内的机器单体的故障。
[0063]此外,所述收集各种内部传感器的信息或收集CPU总线、存储器总线、以及数据包统计信息的功能是一般搭载于计算机的功能,所以无须大量增加用于收集使用于动作预测模型生成的行为信息的硬件,所以能够以低成本对具备故障预测对象系统的现有的系统附加故障预测功能。
[0064]由此,构成要求连续的运行的系统变得容易,且能够使系统稳定性提高。
[0065]说明了发明的几个实施方式,这些实施方式是作为示例提出的,并非限定发明的保护范围。这些新的实施方式可以以其他多种方式实施,在不偏离发明宗旨的范围内,可以进行各种省略、替换、变更。这些实施方式或其变形,包含于发明的保护范围或宗旨内,也包含于权利要求书中记载的发明和等同的保护范围内。
【权利要求】
1.一种故障预测装置,其特征在于,具备: 第一收集单元,收集系统状态以及该状态下的系统各部分的行为信息,其中,所述系统状态表示故障预测对象系统的各部分的运行状态; 生成单元,根据收集的所述系统状态与行为信息,生成动作预测模型,作为与系统的状态相应的行为信息的模型; 第二收集单元,在故障预测对象系统的运行中,收集系统的状态以及该状态下的系统各部分的行为信息; 故障预测单元,根据所述第二收集单元的收集结果以及所述生成的动作预测模型,判断所述运行中的系统的状态中的行为信息是否与所述动作预测模型中的相同系统状态下的行为信息不同,从而进行所述系统的故障预测。
2.根据权利要求1所述的故障预测装置,其特征在于, 所述第一收集单元收集故障预测对象系统的各部分的从第一状态到第二状态的状态变化以及该状态下的系统各部分的行为信息; 所述生成单元根据收集的所述状态变化与行为信息,生成动作预测模型,作为与系统的状态变化相应的行为信息的模型; 所述第二收集单元在故障预测对象系统的运行中收集系统的状态变化以及该状态变化下的系统各部分的行为信息; 所述故障预测单元根据所述第二收集单元的收集结果与所述生成的动作预测模型,判断所述运行中的系统的状态变化中的行为信息是否与所述动作预测模型中的相同状态变化下的行为信息不同,从而进行所述系统的故障预测。
3.根据权利要求1或2所述的故障预测装置,其特征在于, 所述行为信息包括所述系统的CPU总线状态、存储器总线状态、以及各种传感器的检测状态中的至少一种。
【文档编号】G05B23/02GK104281143SQ201310751451
【公开日】2015年1月14日 申请日期:2013年12月31日 优先权日:2013年7月12日
【发明者】阿南和弘 申请人:株式会社东芝
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1