系统监控方法与装置与流程

文档序号:16067841发布日期:2018-11-24 12:51阅读:237来源:国知局

本发明实施例涉及计算机技术领域,具体而言,涉及一种能够提供as400系统补充监控的系统监控方法与装置。

背景技术

as400操作系统是当今世界上最流行的中小型、多用户商业计算机系统,在多用户服务器领域里,始终保持着最畅销的地位。作为服务器操作系统,as400的安全运行关系到外围系统以及客户端的正常运行,因此,监控as400系统运行状态,从而在系统发生故障时进行处理成为系统运维的必要需求。

ibm提供的监控软件通过在as400上安装代理软件以及在开放平台安装与as400的进行代理通信的监控报警软件,可以采集到as400系统的cpu使用率、作业总数、存储使用率等的实时状态并且报警。但是,该监控软件与as400的连接不稳定,常常在没有通知显示的情况下停止运行。此时如果发生系统状态异常,监控软件不能及时报警,则可能导致非常严重的生产事故。

此外,由于现有监控软件无法监控外围系统连到as400的连接数以及不良sql语句使用等对于系统比较重要的数据,且对监控到的数据不保留历史数据,十分不便于对系统进行整体数据分析,因此,需要一种更稳定、更符合实际需求的系统监控方法。

需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明实施例的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。



技术实现要素:

本发明实施例的目的在于提供一种系统监控方法与系统监控装置,用于解决现有as400系统监控存在的监控盲点。

根据本发明实施例的第一方面,提供一种系统监控方法,包括:获取系统运行数据,所述系统运行数据包括系统性能数据、网络链接数据以及sql语句运行数据;在所述系统运行数据满足预设报警条件时,将报警信息写入报警数据库;轮询所述报警数据库,在判断有未读的报警信息时,将所述报警记录设置为已读,并发送给报警平台。

可选的,还包括:

将所述系统运行数据写入历史数据库;

响应系统分析指令,根据所述历史数据库中的系统运行数据以及所述报警数据库中的报警数据生成统计文件。

可选的,所述在所述系统运行数据满足预设报警条件时,将报警信息写入报警数据库包括:

判断所述系统性能数据的系统性能种类,获取每个所述系统性能种类对应的报警阈值;

判断每个所述系统性能数据是否超过所述系统性能种类对应的报警阈值;

如果超过,将所述系统性能数据及对应的系统性能种类写入所述报警信息。

可选的,所述在所述系统运行数据满足预设报警条件时,将报警信息写入报警数据库包括:

根据所述网络链接数据获取多个ip地址对应的链接;

对每个所述ip地址对应的链接进行求和汇总以获取每个所述ip地址对应的链接总数;

在所述链接总数超过第一预设值时,将所述链接总数对应的ip地址写入所述报警信息。

可选的,所述在所述系统运行数据满足预设报警条件时,将报警信息写入报警数据库包括:

根据所述sql语句运行数据获取多个任务执行的sql语句及所述sql语句的开始运行时间;

在当前时间与所述开始运行时间的差值大于第二预设值时,将执行所述sql语句的任务的任务标识符写入所述报警信息。

根据本发明实施例的第二方面,提供一种系统监控装置,包括:

数据获取模块,设置为获取系统运行数据,所述系统运行数据包括系统性能数据、网络链接数据以及sql语句运行数据;

报警判断模块,设置为在所述系统运行数据满足预设报警条件时,将报警信息写入报警数据库;

报警监控模块,设置为轮询所述报警数据库,在判断有未读的报警信息时,将所述报警记录设置为已读,并发送给报警平台。

可选的,还包括历史数据统计模块,包括:

记录保留单元,设置为将所述系统运行数据写入历史数据库;

记录分析单元,设置为响应系统分析指令,根据所述历史数据库中的系统运行数据以及所述报警数据库中的报警数据生成统计文件。

可选的,所述报警判断模块包括:

数据种类判断单元,设置为判断所述系统性能数据的系统性能种类,获取每个所述系统性能种类对应的报警阈值;

种类阈值确定单元,设置为判断每个所述系统性能数据是否超过所述系统性能种类对应的报警阈值;

种类报警判断单元,设置为如果超过,将所述系统性能数据及对应的系统性能种类写入所述报警信息。

可选的,所述报警判断模块包括:

链接数据获取单元,设置为根据所述网络链接数据获取多个ip地址对应的链接;

链接数据汇总单元,设置为对每个所述ip地址对应的链接进行求和汇总以获取每个所述ip地址对应的链接总数;

网络报警判断单元,设置为在所述链接总数超过第一预设值时,将所述链接总数对应的ip地址写入所述报警信息。

可选的,所述报警判断模块包括:

语句数据获取单元,设置为根据所述sql语句运行数据获取多个任务执行的sql语句及所述sql语句的开始运行时间

语句报警判断单元,设置为在当前时间与所述开始运行时间的差值大于第二预设值时,将执行所述sql语句的任务的任务标识符写入所述报警信息。

根据本发明实施例的第三方面,提供一种电子设备,包括:存储器;以及耦合到所属存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如上述任意一项所述的方法。

根据本发明实施例的第四方面,提供一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如上述任意一项所述的系统监控方法。

本发明实施例通过调用as400系统的api读取sql语句运行状态、外部链接数以及系统运行数据,在系统数据超过阈值时发送报警信息,为as400系统提供了有效的补充监控;通过运行本监控方法,解决了现有系统监控连接不稳定的问题;通过实时记录数据,为系统数据分析以及排除故障提供了保障。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明实施例。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明实施例的实施例,并与说明书一起用于解释本发明实施例的原理。显而易见地,下面描述中的附图仅仅是本发明实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示意性示出本发明实施例示例性实施例中系统监控方法的流程图。

图2示意性示出本发明实施例示例性实施例中的一个子流程图。

图3示意性示出本发明实施例示例性实施例中的一个子流程图。

图4示意性示出本发明实施例示例性实施例中的一个子流程图。

图5示意性示出本发明实施例示例性实施例中的一个子流程图。

图6示意性示出本发明实施例一个示例性实施例中一种系统监控装置的方框图。

图7示意性示出本发明实施例一个示例性实施例中系统监控装置与系统关系的示意图。

图8示意性示出本发明实施例一个示例性实施例中一种系统监控设备的方框图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明实施例将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本发明实施例的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本发明实施例的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本发明实施例的各方面变得模糊。

此外,附图仅为本发明实施例的示意性图解,图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

下面结合附图对本发明实施例示例实施方式进行详细说明。

图1示意性示出本发明实施例示例性实施例中系统监控方法的流程图。参考图1,系统监控方法100可以包括:

步骤s1,获取系统运行数据,所述系统运行数据包括系统性能数据、网络链接数据以及sql语句运行数据;

步骤s2,在所述系统运行数据满足预设报警条件时,将报警信息写入报警数据库;

步骤s3,轮询所述报警数据库,在判断有未读的报警信息时,将所述报警记录设置为已读,并发送给报警平台。

上述步骤序号仅为方便说明而设,实际运行中,各步骤均并行运行,不分先后。

本发明实施例通过调用as400系统的api读取sql语句运行状态、外部链接数以及系统运行数据,在系统数据超过阈值时发送报警信息,为as400系统提供了有效的补充监控;通过运行本监控方法,解决了现有系统监控连接不稳定的问题;通过实时记录数据,为系统数据分析以及排除故障提供了保障。

下面,对系统监控方法100的各步骤进行详细说明。

在步骤s1,获取系统运行数据,所述系统运行数据包括系统性能数据、网络链接数据以及sql语句运行数据。

在一些实施例中,系统性能数据例如可以包括系统的cpu使用率、活动作业数、asp使用率及iasp使用率。在实际运行中,本领域技术人员可以根据实际需求自行调整监控目标。可以调用as400系统本身提供的api(applicationprogramminginterface,应用程序编程接口)读取系统数据。示例性而言,可以通过调用as400系统的api(例如qwcrssts、qyaspol),以轮询方式读取到系统的cpu使用率、活动作业数、asp使用率及iasp使用率。

网络链接数据例如可以为系统当前链接的ip地址、每个链接的链接时间、通讯速度等数据。示例性而言,可以通过组合调用as400的api(quscrtus、qusptrus、lstnetcnn、qusdltus)按预设周期轮询读取系统的链接信息,并将数据保存在netstatr等中间文件里。

sql语句运行数据例如可以为运行sql语句的任务、sql语句的起始运行时间等。可以通过调用as400的api(quscrtus、qusljob、qusrjobi)轮询读取作业中执行的sql语句及该sql语句在系统中的开始时间。

步骤s2,在所述系统运行数据满足预设报警条件时,将报警信息写入报警数据库。

对于不同的系统运行数据,可以根据不同的预设报警条件判断是否生成报警信息。

图2是本公开一种示例性实施例中步骤s2的子流程图。

参考图2,在一些实施例中,步骤s2可以包括:

步骤s21,判断所述系统性能数据的系统性能种类,获取每个所述系统性能种类对应的报警阈值;

步骤s22,判断每个所述系统性能数据是否超过所述系统性能种类对应的报警阈值;

步骤s23,如果超过,将所述系统性能数据及对应的系统性能种类写入所述报警信息。

由于系统性能数据包括cpu使用率、活动作业数、asp使用率及iasp使用率等多种数据,因此首先要找到每种数据对应的报警阈值。可以预先为多种系统性能数据设置报警阈值,对于一种系统性能数据,又可以设置多级报警阈值,例如预警、警告、严重警告等,以便于对系统性能数据进行多级判断,并将判断结果写入报警信息。

与系统性能数据对应的报警信息可以记录报警的系统性能数据及其对应的系统性能种类、报警发生时间、报警等级等信息,在其他一些实施例中,也可以设置将其他信息写入报警信息,本公开不以此为限。

图3是本公开一种示例性实施例中步骤s2的子流程图。

参考图3,在一些实施例中,步骤s2可以包括:

步骤s24,根据所述网络链接数据获取多个ip地址对应的链接;

步骤s25,对每个所述ip地址对应的链接进行求和汇总以获取每个所述ip地址对应的链接总数;

步骤s26,在所述链接总数超过第一预设值时,将所述链接总数对应的ip地址写入所述报警信息

可以首先对读取到的网络链接信息按ip地址进行分组,从而可以判断出与系统有链接的ip地址的个数,即系统与外部系统的链接数。最后,判断该链接数是否超过第一预设值,如果超过,则向所述报警数据库写入报警信息,在报警信息中记录报警的ip地址。

通过设置链接数监控报警,可以避免服务器的总作业数异常升高,以及继而出现的cpu使用率升高导致的服务器对外响应缓慢,用户体验变差。

图4是本公开一种示例性实施例中步骤s2的子流程图。

参考图4,在一些实施例中,步骤s2可以包括:

步骤s27,根据所述sql语句运行数据获取多个任务执行的sql语句及所述sql语句的开始运行时间;

步骤s28,在当前时间与所述开始运行时间的差值大于第二预设值时,将执行所述sql语句的任务的任务标识符写入所述报警信息。

将开始时间与当前时间进行比较可以得出该sql语句已运行的时间。判断该已运行时间是否超过第二预设值,如果超过,则将该作业的标识信息写入报警信息,将报警信息写入报警数据库。

通过监控运行时间异常的不良sql语句,可以避免系统存储被大量占用,以及当存储空间快速减少时cpu使用率的升高导致的作业响应缓慢。

步骤s3,轮询所述报警数据库,在判断有未读的报警信息时,将所述报警记录设置为已读,并发送给报警平台。

可以通过jdbcforas400工具包连接到as400系统的报警数据库,通过轮询的方式查询是否有未读的报警信息,如果有则将该未读的报警信息设置为已读,并将该条报警信息发送给监控报警平台。

监控报警平台接收全部报警信息,并通过多种方式例如声音、灯光、邮件等方式提示系统维护人员。在一些实施例中,还可以通过对数值进行判断设置多种报警方式,例如,在报警信息记载的预设故障的数值小于第一预设值时,将其判定为非紧急故障,定时或分批对系统维护人员进行报警;在报警信息记载的预设故障的数值大于第二预设值时,将其判定为紧急故障,马上启动所有报警手段等。

通过对系统的报警数据库进行读取,可以避免现有监控软件运行不稳定导致的监控不及时问题,为系统监控提供稳定的保障。

图5是本公开一种示例性实施例中的子流程图。

参考图5,在一些实施例中,方法100可以包括:

步骤s4,将所述系统运行数据写入历史数据库;

步骤s5,响应系统分析指令,根据所述历史数据库中的系统运行数据以及所述报警数据库中的报警数据生成统计文件。

可以将读取到的所有系统运行数据以及读取时间写入历史数据库,从而在周期报告或运维人员主动检测系统时,能够提供详尽的数据帮助运维人员进行系统数据分析,填补相关技术对as400系统监控的空白。

通过将读取的信息进行保存,并定时或被动生成数据报表或具有统计信息的统计报表,可以为系统数据分析提供有力保障,便于系统维护人员在故障发生时查看近期运行数据,填补了as400系统监控的空白。

总而言之,本方法通过自动化监控并与商业监控软件并行运行,解决相关商业监控软件与系统连接不稳定的问题,可以有力保障系统故障报警的及时性,增加运维效率;通过增加历史数据库及对应的数据采集工具填补了现有技术无法保存历史性能数据的空白;通过对外围系统链接数进行实时统计并报警,可以快速定位不稳定的服务器ip地址,克服了服务器链接数不稳定的问题;通过对不良sql语句进行监控,监控系统中运行时间异常的sql语句并报警,减少了系统发生异常风险的可能性。

对应于上述方法实施例,本发明实施例还提供一种系统监控装置,可以用于执行上述方法实施例。

图6示意性示出本发明实施例一个示例性实施例中系统监控装置的方框图。

参考图6,系统监控装置600可以包括:

数据获取模块61,设置为获取系统运行数据,所述系统运行数据包括系统性能数据、网络链接数据以及sql语句运行数据;

报警判断模块62,设置为在所述系统运行数据满足预设报警条件时,将报警信息写入报警数据库;

报警监控模块63,设置为轮询所述报警数据库,在判断有未读的报警信息时,将所述报警记录设置为已读,并发送给报警平台。

可选的,还包括历史数据统计模块64,包括:

记录保留单元641,设置为将所述系统运行数据写入历史数据库;

记录分析单元642,设置为响应系统分析指令,根据所述历史数据库中的系统运行数据以及所述报警数据库中的报警数据生成统计文件。

可选的,所述报警判断模块62包括:

数据种类判断单元621,设置为判断所述系统性能数据的系统性能种类,获取每个所述系统性能种类对应的报警阈值;

种类阈值确定单元622,设置为判断每个所述系统性能数据是否超过所述系统性能种类对应的报警阈值;

种类报警判断单元623,设置为如果超过,将所述系统性能数据及对应的系统性能种类写入所述报警信息。

可选的,所述报警判断模块62包括:

链接数据获取单元624,设置为根据所述网络链接数据获取多个ip地址对应的链接;

链接数据汇总单元625,设置为对每个所述ip地址对应的链接进行求和汇总以获取每个所述ip地址对应的链接总数;

网络报警判断单元626,设置为在所述链接总数超过第一预设值时,将所述链接总数对应的ip地址写入所述报警信息。

可选的,所述报警判断模块62包括:

语句数据获取单元627,设置为根据所述sql语句运行数据获取多个任务执行的sql语句及所述sql语句的开始运行时间

语句报警判断单元628,设置为在当前时间与所述开始运行时间的差值大于第二预设值时,将执行所述sql语句的任务的任务标识符写入所述报警信息。

由于装置600的各功能已在其对应的方法实施例中予以详细说明,本发明实施例于此不再赘述。

图7示意性示出本发明实施例一个示例性实施例中系统监控装置的示意图。

参考图7,在实际运行中,系统监控装置600与系统的关系如图所示:

系统监控装置600可以与商用的系统运行监控模块74同时运行。系统监控装置600通过系统服务器71上运行的as400系统的api读取系统运行数据后,将系统运行数据保存在历史数据库73中,有利于根据历史数据库定期生成数据报告。

此外,系统监控装置600对系统运行数据进行判断,并生成报警信息存储到报警数据库72中,最终将报警信息发送给报警平台75进行报警,在此过程中,报警数据库72也可以将报警信息写入历史数据库73。

最后,系统监控装置600中的历史数据统计模块64可以调用历史数据库73和报警数据库72中的数据生成统计文件。

本发明实施例通过读取as400系统的运行数据、将数据保存在历史数据库中并定期生成数据分析报表,可以填补现有as400系统监控的空白;通过对多种系统运行数据进行分析,并在数据超过阈值时发送报警信息,可以对系统进行全面监控,弥补现有监控的漏洞;通过与商业监控软件并行运行,并主动读取系统报警数据库并进行报警,可以补偿现有监控软件与系统连接不稳定所造成的监控故障。

根据本发明实施例的一个方面,提供一种电子设备,包括:

存储器;以及

耦合到所属存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如上述任意一项所述的方法。

该实施例中的装置的处理器执行操作的具体方式已经在有关该系统监控方法的实施例中执行了详细描述,此处将不做详细阐述说明。

图8是根据一示例性实施例示出的电子设备800的框图,电子设备800例如可以为运行有as800系统的服务器。

参照图8,电子设备800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806。

处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作以及记录操作相关联的操作等。处理组件802可以包括一个或多个处理器818来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。

存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。存储器804中还存储有一个或多个模块,该一个或多个模块被配置成由该一个或多个处理器818执行,以完成上述任一所示方法中的全部或者部分步骤。

电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。

在示例性实施例中,装置800可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

可选地,还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如上述任意一项所述的系统监控方法。该计算机可读存储介质例如可以为包括指令的临时性和非临时性计算机可读存储介质。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明实施例的其它实施方案。本申请旨在涵盖本发明实施例的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明实施例的一般性原理并包括本发明实施例未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明实施例的真正范围和构思由权利要求指出。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1