用于不间断运行的数据处理系统的异常监控及处理装置和方法

文档序号:7983749阅读:476来源:国知局
用于不间断运行的数据处理系统的异常监控及处理装置和方法
【专利摘要】本发明提出了用于不间断运行的数据处理系统的异常监控及处理装置和方法。其中,所述方法包括:监控目标系统的基础环境,并且生成基础环境报告信息;周期性地向所述目标系统发送应用处理逻辑监控测试消息,并且生成应用处理逻辑报告信息;基于监控规则以及所述基础环境报告信息和应用处理逻辑报告信息判断所述目标系统是否异常以及异常的性质,并基于判断结果自动地执行与所述异常相关联的异常处理操作。本发明所公开的异常监控及处理装置和方法能够实时准确地监控异常并自动地实施相关联的应急预案。
【专利说明】用于不间断运行的数据处理系统的异常监控及处理装置和方法
【技术领域】
[0001]本发明涉及异常监控及处理装置和方法,更具体地,涉及用于不间断运行的数据处理系统的异常监控及处理装置和方法。
【背景技术】
[0002]目前,随着计算机和网络应用的日益广泛以及不同领域的业务种类的日益丰富,对不间断运行的数据处理系统(即7X24小时连续运行的数据处理系统,例如金融领域中的交易处理服务器)的异常进行监控和处理变得越来越重要。
[0003]现有的用于不间断运行的数据处理系统的异常监控系统及方法仅针对目标系统的状态进行监控,并且对于监控发现的异常和告警通常需要人工介入处理。
[0004]由上可见,现有的用于不间断运行的数据处理系统的异常监控系统及方法存在如下问题:(I)由于需要人工介入处理,故会导致人工误差,并且时效性较低;(2)由于常规的监控系统不监控目标系统的业务逻辑,即相对独立并具有通用性,故无法建立特定的监控规则以监控目标系统的业务逻辑;(3)由于在进行异常处理时缺乏综合判断并且需要人工介入处理,故不能快速的应对异常以及准确实施应急预案。
[0005]因此,存在如下需求:提供能够实时准确地监控异常并自动地实施相关联的应急预案的用于不间断运行的数据处理系统的异常监控及处理装置和方法。

【发明内容】

[0006]为了解决上述现有技术方案所存在的问题,本发明提出了能够实时准确地监控异常并自动地实施相关联的应急预案的用于不间断运行的数据处理系统的异常监控及处理装置和方法。
[0007]本发明的目的是通过以下技术方案实现的:
一种异常监控及处理装置,所述异常监控及处理装置包括:
第一监控单元,所述第一监控单元监控目标系统的基础环境,并且生成基础环境报告信息,以及将所述基础环境报告信息发送到主控制器;
第二监控单元,所述第二监控单元周期性地向所述目标系统发送应用处理逻辑监控测试消息,并且生成应用处理逻辑报告信息,以及将所述应用处理逻辑报告信息传送到所述主控制器;
主控制器,所述主控制器基于监控规则以及接收到的所述基础环境报告信息和应用处理逻辑报告信息判断所述目标系统是否异常以及异常的性质,并基于判断结果自动地执行与所述异常相关联的异常处理操作,以使所述目标系统恢复正常;
存储器,所述存储器存储所述监控规则。
[0008]在上面所公开的方案中,优选地,所述第一监控单元监控所述目标系统的基础环境包括执行下列操作中的至少一个:监控网络状态、监控主机运行状态、监控进程状态、监控应用日志。
[0009]在上面所公开的方案中,优选地,所述第一监控单元基于至少一个监控指标监控所述目标系统的基础环境。
[0010]在上面所公开的方案中,优选地,所述第二监控单元基于至少一个应用业务维度上的至少一个业务应用监控指标监控所述目标系统的应用处理逻辑。
[0011]在上面所公开的方案中,优选地,所述第二监控单元通过所述应用处理逻辑监控测试消息从所述目标系统的应用数据中获取信息并关注所述目标系统的输出,以及根据所述目标系统历史行为建立基线,从而监控所述目标系统的应用处理逻辑。
[0012]在上面所公开的方案中,优选地,所述主控制器在基于所述监控规则执行判断操作前基于过滤规则对接收到的所述基础环境报告信息和应用处理逻辑报告信息执行过滤操作,以去除无关的信息,其中,所述存储器存储所述过滤规则。
[0013]在上面所公开的方案中,优选地,用户通过所述异常监控及处理装置的用户接口或通过配置文件设置所述监控规则、和/或过滤规则、和/或异常与异常处理操作之间的关联关系。
[0014]在上面所公开的方案中,优选地,所述存储器进一步存储异常与异常处理操作之间的关联关系。
[0015]在上面所公开的方案中,优选地,所述主控制器在执行完所述异常处理操作后监控所述异常处理操作的实施结果。
[0016]本发明的目的也可以通过以下技术方案实现:
一种异常监控及处理方法,所述异常监控及处理方法包括下列步骤:
(Al)监控目标系统的基础环境,并且生成基础环境报告信息;
(A2)周期性地向所述目标系统发送应用处理逻辑监控测试消息,并且生成应用处理逻辑报告信息;
(A3)基于监控规则以及所述基础环境报告信息和应用处理逻辑报告信息判断所述目标系统是否异常以及异常的性质,并基于判断结果自动地执行与所述异常相关联的异常处理操作,以使所述目标系统恢复正常。
[0017]本发明所公开的用于不间断运行的数据处理系统的异常监控及处理装置和方法具有以下优点:(1)由于异常处理操作自动地执行而无需人工介入,故不会引入人工误差,并且异常处理的时效性较高;(2)由于监控目标系统的应用处理逻辑,故可以通过建立特定的监控规则而监控目标系统的应用处理逻辑是否发生异常;(3)由于基于基础环境报告信息和应用处理逻辑报告信息综合判断,故可以快速的应对异常并准确地实施应急预案。
【专利附图】

【附图说明】
[0018]结合附图,本发明的技术特征以及优点将会被本领域技术人员更好地理解,其中:
图1是根据本发明的实施例的异常监控及处理装置的示意性结构图;
图2是根据本发明的实施例的异常监控及处理方法的流程图。
【具体实施方式】[0019]图1是根据本发明的实施例的异常监控及处理装置的示意性结构图。如图1所示,本发明所公开的异常监控及处理装置包括主控制器1、第一监控单元2、第二监控单元3和存储器4。其中,所述第一监控单元2监控目标系统(即需要被监控的数据处理系统)的基础环境,并且生成基础环境报告信息,以及将所述基础环境报告信息发送到主控制器I。所述第二监控单元3周期性地(例如每分钟)向所述目标系统发送应用处理逻辑监控测试消息(例如用于检测交易处理服务器的业务表现行为是否正常的交易探针),并且生成应用处理逻辑报告信息,以及将所述应用处理逻辑报告信息传送到所述主控制器I。所述主控制器I基于监控规则以及接收到的所述基础环境报告信息和应用处理逻辑报告信息判断所述目标系统是否异常以及异常的性质(示例性地,该判断操作在几秒内完成),并基于判断结果自动地执行与所述异常相关联的异常处理操作(例如应急预案),以使所述目标系统恢复正常。所述存储器4存储所述监控规则。
[0020]优选地,在本发明所公开的异常监控及处理装置中,所述第一监控单元2监控所述目标系统的基础环境包括执行下列中的至少一个:监控网络状态、监控主机运行状态、监控进程状态、监控应用日志。
[0021]优选地,在本发明所公开的异常监控及处理装置中,所述第一监控单元2基于至少一个监控指标监控所述目标系统的基础环境。
[0022]优选地,在本发明所公开的异常监控及处理装置中,所述第二监控单元3基于至少一个应用业务维度(即应用业务)上的至少一个业务应用监控指标监控所述目标系统的应用处理逻辑。
[0023]示例性地,在本发明所公开的异常监控及处理装置中,所述第二监控单元3通过所述应用处理逻辑监控测试消息从所述目标系统的应用数据(例如交易数据)中获取信息并关注所述目标系统的输出,以及根据所述目标系统历史行为建立基线(即用于随后的判断操作的基础),从而监控所述目标系统的应用处理逻辑(例如交易处理逻辑)。
[0024]优选地,在本发明所公开的异常监控及处理装置中,所述主控制器I在基于所述监控规则执行判断操作前基于过滤规则对接收到的所述基础环境报告信息和应用处理逻辑报告信息执行过滤操作,以去除无关的信息,其中,所述存储器4存储所述过滤规则。
[0025]优选地,在本发明所公开的异常监控及处理装置中,用户通过所述异常监控及处理装置的用户接口(未示出)或通过配置文件设置所述监控规则、和/或过滤规则、和/或异常与异常处理操作之间的关联关系。
[0026]优选地,在本发明所公开的异常监控及处理装置中,所述存储器4进一步存储异常与异常处理操作之间的关联关系(即异常与异常处理操作之间的一一对应的关系)。
[0027]优选地,在本发明所公开的异常监控及处理装置中,所述主控制器I在执行完所述异常处理操作后监控所述异常处理操作的实施结果。
[0028]示例性地,在本发明所公开的异常监控及处理装置中,所述主控制器I通过telnet协议或HTTP协议执行所述异常处理操作。
[0029]由上可见,本发明所公开的异常监控及处理装置具有如下优点:(1)由于异常处理操作自动地执行而无需人工介入,故不会引入人工误差,并且异常处理的时效性较高;
(2)由于监控目标系统的应用处理逻辑,故可以通过建立特定的监控规则而监控目标系统的应用处理逻辑是否发生异常;(3)由于基于基础环境报告信息和应用处理逻辑报告信息综合判断,故可以快速的应对异常并准确地实施应急预案。
[0030]图2是根据本发明的实施例的异常监控及处理方法的流程图。如图2所示,本发明所公开的异常监控及处理方法包括下列步骤:(Al)监控目标系统(即需要被监控的数据处理系统)的基础环境,并且生成基础环境报告信息;(A2)周期性地(例如每分钟)向所述目标系统发送应用处理逻辑监控测试消息(例如用于检测交易处理服务器的业务表现行为是否正常的交易探针),并且生成应用处理逻辑报告信息;(A3)基于监控规则以及所述基础环境报告信息和应用处理逻辑报告信息判断所述目标系统是否异常以及异常的性质(示例性地,该判断操作在几秒内完成),并基于判断结果自动地执行与所述异常相关联的异常处理操作(例如应急预案),以使所述目标系统恢复正常。
[0031]优选地,在本发明所公开的异常监控及处理方法中,所述步骤(Al)进一步包括:执行下列操作中的至少一个:监控网络状态、监控主机运行状态、监控进程状态、监控应用日志。
[0032]优选地,在本发明所公开的异常监控及处理方法中,所述步骤(Al)进一步包括:基于至少一个监控指标监控所述目标系统的基础环境。
[0033]优选地,在本发明所公开的异常监控及处理方法中,所述步骤(A2)进一步包括:基于至少一个应用业务维度(即应用业务)上的至少一个业务应用监控指标监控所述目标系统的应用处理逻辑。
[0034]示例性地,在本发明所公开的异常监控及处理方法中,所述步骤(A2)进一步包括:通过所述应用处理逻辑监控测试消息从所述目标系统的应用数据(例如交易数据)中获取信息并关注所述目标系统的输出,以及根据所述目标系统历史行为建立基线(即用于随后的判断操作的基础),从而监控所述目标系统的应用处理逻辑(例如交易处理逻辑)。
[0035]优选地,在本发明所公开的异常监控及处理方法中,所述步骤(A3)进一步包括:在基于所述监控规则执行判断操作前基于过滤规则对所述基础环境报告信息和应用处理逻辑报告信息执行过滤操作,以去除无关的信息。
[0036]优选地,在本发明所公开的异常监控及处理方法中,用户通过用户接口或配置文件设置所述监控规则、和/或过滤规则、和/或异常与异常处理操作之间的关联关系。
[0037]优选地,在本发明所公开的异常监控及处理方法中,所述步骤(A3)进一步包括:在执行完所述异常处理操作后监控所述异常处理操作的实施结果。
[0038]示例性地,在本发明所公开的异常监控及处理方法中,通过telnet协议或HTTP协议执行所述异常处理操作。
[0039]由上可见,本发明所公开的异常监控及处理方法具有如下优点:(1)由于异常处理操作自动地执行而无需人工介入,故不会引入人工误差,并且异常处理的时效性较高;
(2)由于监控目标系统的应用处理逻辑,故可以通过建立特定的监控规则而监控目标系统的应用处理逻辑是否发生异常;(3)由于基于基础环境报告信息和应用处理逻辑报告信息综合判断,故可以快速的应对异常并准确地实施应急预案。
[0040]尽管本发明是通过上述的优选实施方式进行描述的,但是其实现形式并不局限于上述的实施方式。应该认识到:在不脱离本发明主旨和范围的情况下,本领域技术人员可以对本发明做出不同的变化和修改。
【权利要求】
1.一种异常监控及处理装置,所述异常监控及处理装置包括: 第一监控单元,所述第一监控单元监控目标系统的基础环境,并且生成基础环境报告信息,以及将所述基础环境报告信息发送到主控制器; 第二监控单元,所述第二监控单元周期性地向所述目标系统发送应用处理逻辑监控测试消息,并且生成应用处理逻辑报告信息,以及将所述应用处理逻辑报告信息传送到所述王控制器; 主控制器,所述主控制器基于监控规则以及接收到的所述基础环境报告信息和应用处理逻辑报告信息判断所述目标系统是否异常以及异常的性质,并基于判断结果自动地执行与所述异常相关联的异常处理操作,以使所述目标系统恢复正常; 存储器,所述存储器存储所述监控规则。
2.根据权利要求1所述的异常监控及处理装置,其特征在于,所述第一监控单元监控所述目标系统的基础环境包括执行下列操作中的至少一个:监控网络状态、监控主机运行状态、监控进程状态、监控应用日志。
3.根据权利要求2所述的异常监控及处理装置,其特征在于,所述第一监控单元基于至少一个监控指标监控所述目标系统的基础环境。
4.根据权利要求3所述的异常监控及处理装置,其特征在于,所述第二监控单元基于至少一个应用业务维度上的至少一个业务应用监控指标监控所述目标系统的应用处理逻辑。
5.根据权利要求4所述的异常监控及处理装置,其特征在于,所述第二监控单元通过所述应用处理逻辑监控测试消息从所述目标系统的应用数据中获取信息并关注所述目标系统的输出,以及根据所述目标系统历史行为建立基线,从而监控所述目标系统的应用处理逻辑。
6.根据权利要求5所述的异常监控及处理装置,其特征在于,所述主控制器在基于所述监控规则执行判断操作前基于过滤规则对接收到的所述基础环境报告信息和应用处理逻辑报告信息执行过滤操作,以去除无关的信息,其中,所述存储器存储所述过滤规则。
7.根据权利要求6所述的异常监控及处理装置,其特征在于,用户通过所述异常监控及处理装置的用户接口或通过配置文件设置所述监控规则、和/或过滤规则、和/或异常与异常处理操作之间的关联关系。
8.根据权利要求7所述的异常监控及处理装置,其特征在于,所述存储器进一步存储异常与异常处理操作之间的关联关系。
9.根据权利要求8所述的异常监控及处理装置,其特征在于,所述主控制器在执行完所述异常处理操作后监控所述异常处理操作的实施结果。
10.一种异常监控及处理方法,所述异常监控及处理方法包括下列步骤: (Al)监控目标系统的基础环境,并且生成基础环境报告信息; (A2)周期性地向所述目标系统发送应用处理逻辑监控测试消息,并且生成应用处理逻辑报告信息; (A3)基于监控规则以及所述基础环境报告信息和应用处理逻辑报告信息判断所述目标系统是否异常以及异常的性质,并基于判断结果自动地执行与所述异常相关联的异常处理操作,以使所述目标系统恢复正常。
【文档编号】H04L12/26GK103701657SQ201210368459
【公开日】2014年4月2日 申请日期:2012年9月28日 优先权日:2012年9月28日
【发明者】戚跃民, 胡文斌, 程军, 陈根, 吴正中, 黄明雄, 王昊, 冀乃庚, 杨燕明, 蒋群华, 张凉 申请人:中国银联股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1