系统分析设备和系统分析方法

文档序号:9308571阅读:427来源:国知局
系统分析设备和系统分析方法
【技术领域】
[0001 ] 本发明涉及系统分析设备和系统分析方法。
【背景技术】
[0002]在PTLl中描述了操作管理系统的一个示例,该操作管理系统使用系统性能的时序信息来对系统进行建模,并且使用所产生的模型来确定系统的故障、异常等的原因。
[0003]PTLl中描述的操作管理系统基于系统的多个度量的测量值来确定指示多个度量当中的每一对的关联的关联函数,以产生系统的关联模型。然后,操作管理系统使用所产生的关联t吴型来检测关联的破坏(关联破坏),并且基于关联破坏来确定系统的故障原因。以该方式基于关联破坏来分析系统状态的技术被称为不变关系分析。
[0004]在不变关系分析中,在PTL2中公开了用于基于关联破坏的状态在过去的故障的时间和当前时间之间的相似度来确定故障原因的技术的一个示例。PTL2中描述的操作管理设备将度量分类为若干组,并且将在各个组中在过去的故障发生的时间和当前发生的时间之间的关联破坏的多个度量的分布。然而,在PTL2的操作管理设备中,即使关联破坏发生的度量在各个组中是不同的,当各个组中关联破坏发生的多个度量的分布类似时,可以确定是相同的故障。
[0005]在PTL3中公开了用于解决该问题的技术的一个示例。PTL3中描述的操作管理设备比特关联破坏在过去的故障的时间和当前之间的关联的模式(关联破坏模式)。通过比较在关联模型中的各个关联中的关联破坏的发生的存在或不存在的对应比率,操作管理设备确定故障的原因。
[0006][引用列表]
[0007][专利文献]
[0008][PTL1]日本专利公开 N0.4872944
[0009][PTL2]W0 2010/032701
[0010][PTL3]W0 2011/155621

【发明内容】

[0011]技术问题
[0012]在上述PTL3的技术中,因为比较关联破坏模式,所以需要在过去故障时的系统和当前时间的系统是具有相同关联模型的相同系统过去出现故障时的系统和目前的系统需要是具有相同关联模式的相同系统。另外,除非过去出现故障时的故障位置和当前时间的故障位置是相同的,否则无法确定是相同的故障。
[0013]例如,当系统的关联模型在过去故障时和当前时间之间存在改变,则通过添加执行分布式处理的相同类型的设备,在过去故障时无法使用关联故障模式来确定故障原因。另外,当过去出现故障的设备和当前出现故障的设备是执行分布式处理的相同类型的设备,但是是不同设备时,无法使用过去故障时的关联破坏模式来确定故障原因。
[0014]本发明的目的是为了解决上述问题,并且提供一种系统分析设备和系统分析方法,该系统分析设备和系统分析方法可以在使用关联破坏模式的系统的状态检测中,改善关联破坏模式的多用性。
[0015]对问题的解决方案
[0016]根据本发明的示例性方面的系统分析设备包括:关联破坏模式存储装置,用于存储多个关联破坏模式,其中的每一个是在系统中的度量对的关联当中检测到的关联破坏的关联集合;聚合破坏模式产生装置,用于产生通过聚合多个关联破坏模式当中的相同类型的关联破坏模式而得到的聚合破坏模式;以及相似度计算装置,用于计算并且输出在聚合的破坏模式和新检测到的关联破坏模式之间的相似度。
[0017]根据本发明的示例性方面的系统分析方法包括:存储多个关联破坏模式,其中的每一个是在系统中的度量对的关联当中检测到的关联破坏的关联集合;产生通过聚合多个关联破坏模式当中的相同类型的关联破坏模式而得到的聚合破坏模式;以及计算并且输出在聚合的破坏模式和新检测到的关联破坏模式之间的相似度。
[0018]根据本发明的示例性方面的计算机可读存储介质记录有程序,该程序使得计算机执行方法,包括:存储多个关联破坏模式,其中的每一个是在系统中的度量对的关联当中检测到的关联破坏的关联集合;产生通过聚合多个关联破坏模式当中的相同类型的关联破坏模式而得到的聚合破坏模式;以及计算并且输出在聚合的破坏模式和新检测到的关联破坏模式之间的相似度。
[0019]本发明的有益效果
[0020]本发明的有益效果将能够在使用关联破坏模式的系统的状态检测中,改善关联破坏模式的多用性。
【附图说明】
[0021]图1是示出本发明的示例性实施例的特征配置的框图。
[0022]图2是示出本发明的示例性实施例中的系统分析设备100的配置的框图。
[0023]图3是示出本发明的示例性实施例中的被监视系统的示例的示图。
[0024]图4是示出本发明的示例性实施例中的聚合破坏模式产生处理的流程图。
[0025]图5是示出本发明的示例性实施例中的异常水平计算处理的流程图。
[0026]图6是示出本发明的示例性实施例中的关联模型122的示例的示图。
[0027]图7是示出本发明的示例性实施例中的关联映射125的示例的示图。
[0028]图8是示出本发明的示例性实施例中的关联破坏检测结果的示例的示图。
[0029]图9是示出本发明的示例性实施例中的关联破坏模式123的示例的示图。
[0030]图10是示出本发明的示例性实施例中的关联破坏检测结果的另一示例的示图。
[0031]图11是不出本发明的不例性实施例中的关联破坏I旲式123的另一个不例的不图。
[0032]图12是示出本发明的示例性实施例中的聚合破坏模式124的产生示例的示图。
[0033]图13是示出本发明的示例性实施例中的关联破坏检测结果的另一示例的示图。
[0034]图14是不出本发明的不例性实施例中的关联破坏I旲式123的另一个不例的不图。
[0035]图15是示出本发明的示例性实施例中的相似度的计算示例的示图。
[0036]图16是示出本发明的示例性实施例中的显示画面300的示例的示图。
【具体实施方式】
[0037]将描述本发明的示例性实施例。
[0038]首先,将描述本发明的示例性实施例的配置。图2是示出本发明的示例性实施例中的系统分析设备100的配置的框图。
[0039]参考图2,本发明的示例性实施例中的系统分析设备100连接到包括一个或多个被监视设备200的被监视系统。被监视设备200是配置被监视系统的服务器设备或网络设备。这里,提供相同服务的被监视设备200,诸如分布地布置的服务器设备或网络设备,属于相同的设备组。可以给出包括设备组的标识符的被监视设备200的设备标识符。
[0040]要注意,在下面的描述中,引号中的代码指示标识符。例如,设备组“WEB”指示具有标识符WEB的设备组,并且Web服务器“WEB1 ”指示具有标识符WEBl的Web服务器。
[0041 ] 图3是示出本发明的示例性实施例中的被监视系统的示例的示图。在图3的示例中,如被监视设备200,被监视系统包括网络设备“NW1 ”和“NW2”、Web服务器“WEB1 ”、“WEB2”和“WEB3”、应用(AP)服务器“API”和“AP2”以及数据库(DB)服务器“DB1”和“DB2”。这里,网络设备“NW1”和“NW2”属于设备组“NW”。Web服务器“WEB1”、“WEB2”和“WEB3”属于设备组“WEB”。应用(AP)服务器“API”和“AP2”属于设备组“AP”。数据库(DB)服务器“DB1,,和“DB2”属于设备组“WEB”。
[0042]被监视设备200以规则间隔测量被监视设备200的多个项的性能值的实际测量数据(测量值),并且将实际测量数据传送到系统分析设备100。例如,作为性能值的项,使用计算机资源或网络资源的利用率或使用率,诸如CPU(中央处理单元)利用率、存储器利用率、磁盘存取频率和输入/输出分组计数。
[0043]这里,被监视设备200和性能值的项的组合被定义为度量(性能指标),并且同时测量的多个度量的值的组合被定义为性能信息。用整数或十进制数的数值来表示度量。该度量对应于PTLl中产生关联模型的“元件”。
[0044]下文中,用设备标识符和性能值的项的组合来指示度量的标识符。例如,度量“WEB1.CPU”指示Web服务器“WEB I”的CPU利用率。另外,度量“NW1
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1