IT设备监控指标扩展方法及IT综合监控系统与流程

文档序号:12131723阅读:361来源:国知局
IT设备监控指标扩展方法及IT综合监控系统与流程

本发明涉及计算机技术IT设备管理的技术领域,具体涉及一种IT设备监控指标扩展方法及IT综合监控系统。



背景技术:

随着信息化的高速发展,网络规模不断增大,业务系统不断增长,对IT设备运行状态进行实时监控已成为信息化部门运维管理的重要手段。通过IT综合监控系统实现IT设备的实时监控、性能告警和故障定位,从而保障IT设备和网络的稳定、可靠运行。

IT设备监控系统是通过设备(包括主机、网络设备、安全设备、数据库、Web服务器、中间件、虚拟化)监控指标的运行数据来反映设备的运行状态。不同运维管理人员针对不同应用环境所关注的监控指标会略有不同。当前的IT设备监控系统只能对系统开发时定义好的监控指标进行监控,在需要监控新指标时,必须重新修改程序,开发成本较大,且不能及时满足用户需求。

因此,改变现有IT设备监控系统指标定义的方法,实现设备监控指标的自定义扩展,满足IT监控系统中被监控设备和指标变化的需求,对于节省IT设备监控系统的开发成本,提高监控系统应用范围具有重要意义。



技术实现要素:

本发明实施例提供一种IT设备监控指标扩展方法及IT综合监控系统,用于解决现有IT设备监控系统中监控指标不能灵活配置、缺乏可扩展性、不能满足被监控设备和指标变化的需求等问题。

一种IT设备监控指标扩展方法,包括:

定义待扩展IT设备的监控指标;

对所述监控指标进行配置,生成配置信息;其中,所述配置信息包括所述监控指标的采集配置参数和告警阈值参数;

将已配置的监控指标与一个或多个所述待扩展IT设备进行关联;

根据所述配置信息中的采集配置参数和IT设备监控信息,周期性地采集相应的IT设备监控指标的运行数据;

根据所述配置信息中的告警阈值参数,对所述监控指标的运行数据进行分析处理,以对超出阈值的情况进行告警。

可选地,所述监控指标包括指标名称、指标类型以及指标单位。

可选地,所述对所述监控指标进行配置,生成配置信息,包括:

分析采集所述监控指标所使用的采集协议;

根据所述采集协议配置所述监控指标的对象标识符OID或采集命令;

配置所述监控指标的采集时间间隔;

配置所述监控指标的告警阈值参数。

可选地,所述根据所述配置信息中的采集配置参数和IT设备监控信息,周期性地采集相应的IT设备监控指标的运行数据,包括:

获取所述监控指标的采集配置参数,所述采集配置参数包括所述采集协议、所述指标的OID或所述采集命令以及所述采集时间间隔;

根据所述采集协议获取所述IT设备监控信息;其中,所述IT设备监控信息包括IP地址、用户名、密码、团体字、端口、加密协议、加密密钥、认证协议以及认证密钥等信息;

根据所述采集配置参数和所述IT设备监控信息,周期性地采集相应IT设备监控指标的运行数据。

可选地,所述根据所述配置信息中的告警阈值参数,对所述监控指标的运行数据进行分析处理,以对超出阈值的情况进行告警,包括:

获取所述监控指标的告警阈值参数;其中,所述告警阈值参数包括一般告警阈值、严重告警阈值、紧急告警阈值、判断逻辑以及重复次数;

判断各IT设备监控指标的运行数据是否满足告警阈值参数中规定的告警条件,如果判断为是,则生成告警信息。

一种支持监控指标扩展的IT设备综合监控系统,包括:

监控指标定义单元,用于定义待扩展IT设备的监控指标;

监控指标配置单元,用于对所述监控指标进行配置,生成配置信息;其中,所述配置信息包括所述监控指标的采集配置参数和告警阈值参数;

IT设备关联单元,用于将已配置的监控指标与一个或多个所述待扩展IT设备进行关联;

监控指标数据采集单元,用于根据所述配置信息中的采集配置参数和IT设备监控信息,周期性地采集相应的IT设备监控指标的运行数据;

监控指标数据处理单元,用于根据所述配置信息中的告警阈值参数,对所述监控指标的运行数据进行分析处理,以对超出阈值的情况进行告警。

可选地,所述监控指标包括指标名称、指标类型以及指标单位。

可选地,所述监控指标配置单元进一步用于:

分析采集所述监控指标所使用的采集协议;

根据所述采集协议配置所述监控指标的对象标识符OID或采集命令;

配置所述监控指标的采集时间间隔;

配置所述监控指标的告警阈值参数。

可选地,所述监控指标数据采集单元进一步用于:

获取所述监控指标的采集配置参数,所述采集配置参数包括所述采集协议、所述指标的OID或所述采集命令以及所述采集时间间隔;

根据所述采集协议获取所述IT设备监控信息;其中,所述IT设备监控信息包括IP地址、用户名、密码、团体字、端口、加密协议、加密密钥、认证协议以及认证密钥等信息;

根据所述采集配置参数和所述IT设备监控信息,周期性地采集相应IT设备监控指标的运行数据。

可选地,所述监控指标数据处理单元进一步用于:

获取所述监控指标的告警阈值参数;其中,所述告警阈值参数包括一般告警阈值、严重告警阈值、紧急告警阈值、判断逻辑以及重复次数;

判断各IT设备监控指标的运行数据是否满足告警阈值参数中规定的告警条件,如果判断为是,则生成告警信息。

本发明的IT设备监控指标扩展方法及IT综合监控系统,通过定义待扩展IT设备的监控指标,并对所述监控指标进行配置,生成配置信息,进而将已配置的监控指标与一个或多个所述待扩展IT设备进行关联,根据所述配置信息中的采集配置参数和IT设备监控信息,周期性地采集相应的IT设备监控指标的运行数据,以根据所述配置信息中的告警阈值参数,对所述监控指标的运行数据进行分析处理,以对超出阈值的情况进行告警,可以实现灵活配置IT设备监控系统中监控指标,增强可扩展性,满足被监控设备和指标变化的需求。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明一个实施例的IT设备监控指标扩展方法的流程示意图;

图2为本发明另一个实施例的IT设备监控指标扩展方法的流程示意图;

图3为本发明一个实施例的支持监控指标扩展的IT设备综合监控系统的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明一个实施例的IT设备监控指标扩展方法的流程示意图,如图1所示,该方法包括:

S1:定义待扩展IT设备的监控指标;

S2:对所述监控指标进行配置,生成配置信息;其中,所述配置信息包括所述监控指标的采集配置参数和告警阈值参数;

S3:将已配置的监控指标与一个或多个所述待扩展IT设备进行关联;

S4:根据所述配置信息中的采集配置参数和IT设备监控信息,周期性地采集相应的IT设备监控指标的运行数据;

S5:根据所述配置信息中的告警阈值参数,对所述监控指标的运行数据进行分析处理,以对超出阈值的情况进行告警。

其中,作为本实施例的优选,所述监控指标包括指标名称、指标类型以及指标单位。

本实施例的IT设备监控指标扩展方法,通过定义待扩展IT设备的监控指标,并对所述监控指标进行配置,生成配置信息,进而将已配置的监控指标与一个或多个所述待扩展IT设备进行关联,根据所述配置信息中的采集配置参数和IT设备监控信息,周期性地采集相应的IT设备监控指标的运行数据,以根据所述配置信息中的告警阈值参数,对所述监控指标的运行数据进行分析处理,以对超出阈值的情况进行告警,可以实现灵活配置IT设备监控系统中监控指标,增强可扩展性,满足被监控设备和指标变化的需求。

进一步地,作为上述方法实施例的优选,步骤S2中所述对所述监控指标进行配置,生成配置信息,可以包括:

S21:分析采集所述监控指标所使用的采集协议;

S22:根据所述采集协议配置所述监控指标的对象标识符OID或采集命令;

S23:配置所述监控指标的采集时间间隔;

S24:配置所述监控指标的告警阈值参数。

进一步地,作为上述方法实施例的优选,步骤S4所述根据所述配置信息中的采集配置参数和IT设备监控信息,周期性地采集相应的IT设备监控指标的运行数据,包括:

S41:获取所述监控指标的采集配置参数,所述采集配置参数包括所述采集协议、所述指标的OID或所述采集命令以及所述采集时间间隔;

S42:根据所述采集协议获取所述IT设备监控信息;其中,所述IT设备监控信息包括IP地址、用户名、密码、团体字、端口、加密协议、加密密钥、认证协议以及认证密钥等信息;

S43:根据所述采集配置参数和所述IT设备监控信息,周期性地采集相应IT设备监控指标的运行数据。

进一步地,作为上述方法实施例的优选,步骤S5所述根据所述配置信息中的告警阈值参数,对所述监控指标的运行数据进行分析处理,以对超出阈值的情况进行告警,可以包括:

S51:获取所述监控指标的告警阈值参数;其中,所述告警阈值参数包括一般告警阈值、严重告警阈值、紧急告警阈值、判断逻辑以及重复次数;

S52:判断各IT设备监控指标的运行数据是否满足告警阈值参数中规定的告警条件,如果判断为是,则生成告警信息。

下面以一具体的实施例来说明本发明的IT设备监控指标扩展方法,但不限定本发明的保护范围。

图2为本发明另一个实施例的IT设备监控指标扩展方法的流程示意图,如图2所示,本实施例的方法包括:

步骤101:定义待扩展IT设备的监控指标;

具体实施时,分析待扩展的监控指标类型、指标单位,定义监控指标名称。如可定义新扩展指标名称:CPU温度,指标类型:性能指标,指标单位:℃

步骤102:对监控指标进行配置,生成监控指标采集配置参数和告警阈值参数;

具体实施时,分析采集监控指标使用的协议,根据采集协议配置监控指标的OID或采集命令,配置监控指标的采集时间间隔,配置监控指标的告警阈值参数。如配置采集CPU温度协议:SNMP,采集OID:1.3.6.1.4.1.2021.11.12.0,采集间隔:180秒,一般告警阈值:50℃、严重告警阈值:70℃、紧急告警阈值:80℃、判断逻辑:>=、重复次数:3。

步骤103:将已配置监控指标与具体的一个或多个IT设备进行关联;

进一步地,本方法还包括:

步骤104:根据配置信息和IT设备监控信息,周期性采集IT设备监控指标的运行数据;

具体实施时,采集程序获取监控指标的采集配置参数和IT设备监控信息,根据此信息,周期性地采集相应IT设备监控指标的运行数据。如采集程序获取采集CPU温度协议:SNMP,采集OID:1.3.6.1.4.1.2021.11.12.0,采集间隔:180秒,设备IP地址:172.22.51.147,端口:161,团体字:public,SNMP版本:v2。根据获取的信息,每隔180秒采集一次CPU温度的运行数据。

步骤105:根据配置信息中告警阈值参数,对监控指标的运行数据进行分析处理,对超出指标阈值的情况进行告警。

具体实施时,处理程序获取监控指标的告警阈值参数,判断IT设备监控指标的运行数据是否满足告警阈值参数中规定的告警条件,如果判断为是,则生成告警信息。如获取一般告警阈值:50℃、严重告警阈值:70℃、紧急告警阈值:80℃、判断逻辑:>=、重复次数:3,连续三次采集CPU温度为72℃,74℃,73℃,分析上述数据,生成严重告警。

图3为本发明一个实施例的支持监控指标扩展的IT设备综合监控系统的结构示意图,如图3所示,该系统包括:

监控指标定义单元31用于定义待扩展IT设备的监控指标;

监控指标配置单元32用于对所述监控指标进行配置,生成配置信息;其中,所述配置信息包括所述监控指标的采集配置参数和告警阈值参数;

IT设备关联单元33用于将已配置的监控指标与一个或多个所述待扩展IT设备进行关联;

监控指标数据采集单元34用于根据所述配置信息中的采集配置参数和IT设备监控信息,周期性地采集相应的IT设备监控指标的运行数据;

监控指标数据处理单元35用于根据所述配置信息中的告警阈值参数,对所述监控指标的运行数据进行分析处理,以对超出阈值的情况进行告警。

本实施例所述的支持监控指标扩展的IT设备综合监控系统可以用于执行上述方法实施例,其原理和技术效果类似,此处不再赘述。

进一步地,作为上述系统实施例的优选,所述监控指标包括指标名称、指标类型以及指标单位。

作为上述系统实施例的优选,所述监控指标配置单元32进一步用于:

分析采集所述监控指标所使用的采集协议;

根据所述采集协议配置所述监控指标的对象标识符OID或采集命令;

配置所述监控指标的采集时间间隔;

配置所述监控指标的告警阈值参数。

作为上述系统实施例的优选,所述监控指标数据采集单元34进一步用于:

获取所述监控指标的采集配置参数,所述采集配置参数包括所述采集协议、所述指标的OID或所述采集命令以及所述采集时间间隔;

根据所述采集协议获取所述IT设备监控信息;其中,所述IT设备监控信息包括IP地址、用户名、密码、团体字、端口、加密协议、加密密钥、认证协议以及认证密钥等信息;

根据所述采集配置参数和所述IT设备监控信息,周期性地采集相应IT设备监控指标的运行数据。

作为上述系统实施例的优选,所述监控指标数据处理单元35进一步用于:

获取所述监控指标的告警阈值参数;其中,所述告警阈值参数包括一般告警阈值、严重告警阈值、紧急告警阈值、判断逻辑以及重复次数;

判断各IT设备监控指标的运行数据是否满足告警阈值参数中规定的告警条件,如果判断为是,则生成告警信息。

具体来说,监控指标定义单元31定义待扩展的IT设备监控指标,完成待扩展的IT设备监控指标名称、指标类型、指标单位等信息;

监控指标配置单元32配置采集监控指标需要配置参数和处理监控指标的告警阈值参数;

作为本实施例的优选,监控指标配置单元32还可以包括:监控指标采集参数配置模块和监控指标处理参数配置模块,其中:

监控指标采集参数配置模块用于配置监控指标采集需要的基础数据,如监控指标采集协议、监控指标OID或采集命令、采集时间间隔等;

监控指标处理参数配置模块用于配置监控指标处理需要的参数,如一般告警阈值、严重告警阈值、紧急告警阈值、判断逻辑、重复次数等。

IT设备关联单元33将新扩展的监控指标与既有一个或多个IT设备进行关联;

监控指标数据采集单元34周期性采集IT设备监控指标的运行数据;

具体地,监控指标数据采集单元34还可以包括:采集参数获取模块和运行数据采集模块,其中:

采集参数获取模块用于获取采集监控指标运行数据需要的监控指标配置参数和相应IT设备监控信息,如采集协议、指标OID/指标采集命令、采集间隔、设备IP地址、用户名、密码、团体字、端口、加密协议、加密密钥、认证协议、认证密钥等;

运行数据采集模块用于周期性采集IT设备监控指标的运行数据。

监控指标数据处理单元35分析处理监控指标的运行数据,生成告警信息。

具体地,监控指标数据处理单元35包括:告警阈值参数获取模块和数据处理模块,其中:

告警阈值参数获取模块用于从监控指标配置信息中获取告警阈值参数;

数据处理模块用于对采集的监控指标数据进行分析处理,并判断监控指标数据是否满足告警配置参数中规定的告警条件,如果判断为是,则生成告警信息。

本发明可以实现IT设备监控指标的自定义扩展,只需要通过简单的用户配置既可自定义所需的监控指标,实现设备监控指标的自定义扩展,满足IT监控系统中被监控设备和指标变化的需求,对于节省IT设备监控系统的开发成本,提高监控系统应用范围具有重要意义。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以生成一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令生成用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

需要说明的是术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本发明的说明书中,说明了大量具体细节。然而能够理解的是,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。类似地,应当理解,为了精简本发明公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释呈反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

以上实施例仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1