信息与应用资源运行状态监控及评价方法

文档序号:6380729阅读:462来源:国知局
专利名称:信息与应用资源运行状态监控及评价方法
技术领域
本发明属于信息技术领域,特别是涉及一种信息与应用资源运行状态监控及评价方法。
背景技术
近年来,随着信息技术(IT)的迅速发展,IT设施及其应用已经渗透到国民经济的各个领域,成为各领域发展的动力和基础保证。但在IT设施迅速普及应用的同时,IT设施自身的维护管理,特别是与用户业务密切相关的信息与应用资源的管理越来越复杂、故障诊断越来越困难,故障对业务持续性的影响越来越严重,反映到整体IT设施的维护管理成本不断膨胀。为加强信息与应用资源的管理,减少信息与应用资源故障对用户业务可能带来的影响,市场上已经推出了许多信息与应用资源管现工具。这些工具从各自对信息与应用资源的管理要求出发,大多针对特定的、或特定类型的信息与应用资源进行监控管理,从一定程度上提高了信息与应用资源的自动化管理水平,减轻了信息与应用资源管理的复杂性。由于在信息与应用资源管理方面缺乏可以遵循的标准和方法,目前的信息与应用资源管理工具存在下列缺陷(I)这些管理工具本身非常专业,需要具备较高的专业技能才能够有效应用;(2)这些管理工具只针对特定的或特定类型的IT设施,用户需要同时采用多种管理工具才能实现对所有IT设施进行管理;(3)这些管理工具相互独立,对信息与应用资源的运行状态没有统一的评判标准,管理工具应用本身已经成为一件很复杂的工作;(4)这些管理工具自动化程度低,有效应用的前提仍然需要专业人员值守;(5)缺乏用户管现信息与应用资源所需要的辅助手段,如故障诊断、故障排除知识的积累和传播;(6)缺乏对用户业务的信息和应用资源的管理能力。

发明内容
鉴于以上缺陷,本发明的主要目的在于提供一种信息与应用资源运行状态监控及评价方法,便于非专业人员监控管理用户信息与应用资源运行状态,降低信息与应用资源不间断监控管理对专业人员的紧密依赖,方便用户对信息与应用资源运行的维护管理做到日常值守与故障排除工作分离。为了达到以上目的,本发明提供的该种信息与应用资源运行状态监控及评价方法,包括以下步骤步骤1、根据监控对象的定义,获取监控对象所有监控指标的监测数据;步骤2、计算监控对象中计算型监控指标的监测数据;步骤3、根据监控对象中每项监控指标的运行状态判别规则,判别每项监控指标所表示的监控对象运行状态;步骤4、按照监控对象运行状态合成方法,合成监控对象的运行状态;步骤5、按照组合监控对象运行状态合成方法,合成组合监控对象的运行状态,直到得到所监控系统的运行状态;步骤6、按照监控对象运行状态输出要求,输出监控对象的运行状态。本发明将需要监控管理运行状态的信息与应用资源称为监控对象,比如服务器、操作系统、应用中间件等,每个监控对象根据运行状态监控管理的需要包含若于监控指标,如CPU率用率、网络流量等。根据监控对象的物理部署和相互之间的位置关系,监控对象可以包含若干子监控对象,称该监控对象为组合监控对象。监控对象也可以是对用户系统中同类信息与应用资源的统一表示(如部署的所有数据库管理系统),或分布式系统中一级系统的表示,称这种监控对象为逻辑监控对象。逻辑监控对象是组合监控对象的一种。包含子监控对象的监控对象,对应地可称为父监控对象。监控指标可以是直接采集获得的,称为采集型监控指标;也可以是通过对直接采集获得的监控指标进行计算获得的,称为计算型监控指标。假定监控对象包含的每项监控指标可以独立地相互不重叠地表示监控对象的运行状态。本发明将监控对象的运行状态统一为“停机”、“正常”、“异常”、“故障”四种。监控对象的运行状态通过对监控指标的状态判别获得。为判别每项监控指标所表示的监控对象运行状态,需要给每项监控指标确定四个判别规则(关系表达式),分别对应“停机”、“正常”、“异常”、“故障”四种运行状态的判别。对这四个判别规则的要求是(I)判别规则覆盖了对应监控指标的所有值域,即监控指标的任何一个监测值,必然可以被判别为“停机”、“正常”、“异常”、“故障”四种状态之一。(2)判别规则不相互重叠,即监控指标的任何一个监测值,只能被判别为“停机”、“正常”、“异常”、“故障”四种状态之一。根据上述判别规则的要求,可以简化为只要给出三个判别规则,第四个规则可以
自动生存。监控对象的运行状态由对监控指标判别的结果合成,合成的方法如下(I)没有获得监控数据的监控指标不参与对监控对象运行状态的判别;(2)若监控指标判别中有是“故障”状态的,则监控对象的运行状态为“故障”;(3)若监控指标判别中没有是“故障”状态的,有是“异常”状态的,则监控对象的运行状态为“异常”;(4)若监控指标判别中没有是“故障”和“异常”状态的,有是“停机”状态的,则监控对象的运行状态为“停机”;(5)上述判别得到的监控对象运行状态不是“故障”、“异常”和“停机”时,则监控对象的运行状态为“正常”。组合监控对象、逻辑监控对象的运行状态由子监控对象的运行状态和监控指标判别的结果合成,合成的方法如下(I)将子监控对象运行状态视为一项监控指标判别的结果;(2)按照上述监控对象运行状态合成的方和合成组合对象的运行状态。按照上述逻辑监控对象的定义,用户可以按照信息与应用资源监控管理的分工,构成按专业划分或按监控对象类型划分或按部署地域划分的监控对象层次结构,其中顶级组合对象即可用于表示整个系统的运行状态,所得到的运行状态即为整个系统(全部IT设施)的运行状态。并可按上述监控对象运行状态的判别方法,对系统整体运行状态进行判别。本发明具有以下有益效果便于非专业人员监控管理用户IT设施运行状态,降低IT设施不间断监控管理对专业人员的紧密依赖,方便用户对IT设施运行的维护管理做到日常值守与故障排除工作分离。


图1为信息与应用资源监控概念框架示意图;图2为信息与应用资源监控对象层次结构示意图;图3为信息与应用资源监控对象逻辑层次结构示意图;图4为监控视图层次结构示意图;图5为运行状态监控基本流程示意图;图6为监控对象及其分类示意图;图7为监控对象及其基本监控指标示意图。
具体实施例方式以下结合具体实施例及附图对本发明的技术方案进一步说明,但不做对其的限定本实施例以跨部门交通安全系统为例(一 )信息与应用资源监控概念框架概念框架用于信息与应用资源监控与状态管理平台中监控方法和系统设计的描述,如图1所示。图示各概念的定义如下定义1:监控对象是指需要监控其运行状态、发现运行故障的硬件、软件和信息,记为O。定义2 :若有监控对象0a、Ob, 3α c Ch ,则称Oa是Ob的父监控对象,称Ob是Oa的
子监控对象。由监控对象的定义,可以构造监控对象的树型层次结构,如图2所示。定义3 :若监控对象O与信息系统中的一个独立设备、软件或信息对应,并有其监控内容可以表示监控对象的运行状态,则称O为物理监控对象。定义4 :监控指标指表示监控对象运行状态的监控内容,记为P。监控对象可以有多项监控指标。对监控指标的检测数据称为监控数据,记为d。监控对象中能够被检测到、反映监控对象运行状态的因素都可被设置为监控指标,如计算机的空闲内存数、CPU的空闲时间、信息的数值范围、应用软件看门标志等。监控数据可以是各种可理解的类型数据、逻辑值、枚举值等。定义5:若有监控对象030,|1 = 1,2,...,11,11>0,则称0为组合监控对象。组合监控对象也可以有自己独立的监控 指标。含有监控指标的监控对象层次关系如图3所
/Jn ο
定义6 :若监控对象O与信息系统中的一个独立设备、软件或信息对应,并有其监控内容可以表示监控对象的运行状态,则称O为物理监控对象。定义7 :对物理监控对象对应,也称组合监控对象为逻辑监控对象。定义8 :级联监控对象指在分布式系统中,由联网的信息与应用资源监控管理平台提供监控结果的监控对象。级联监控对象一般是逻辑监控对象,但也可以是物理监控对象。组合监控对象中也可以含有级联监控对象。定义9 :运行状态指监控对象的运行情况,由监控指标及其监控数据表示。运行状态可以表示为监控指标的函数,称运行状态函数,记为F(Pi|i = 1,2,...,η),代入监控数据后得运行状态值V。根据V可以将运行状态划分为容易理解的等级。子监控对象的运行状态也是父监控对象的监控指标。定义10 :监控策略由监控指标检测方式(如时间间隔)、运行状态函数组成,用于获得运行状态随时间变化的运行状态值。定义11 :系统视图用于表示信息系统逻辑关系的图,由节点O与连接节点的有向边I构成,节点为监控对象,边为监控对象之间的关系,记为Γ Γ = Γ (O, Li O = (Oi I i = I, 2, ... n}, L = (Iij i, j = 1,2, ... η}) (4-1)定义12 :若系统视图是信息系统的直接表示,即监控对象都是物理监控对象、边都是物理监控对象之间的实际网络连线,则称该系统视图为物理视图,否则称为逻辑视图。

根据监控管理业务的组织和岗位职责情况,可以根据监控管理任务为每个岗位建立监控视图。根据监控对象之间的关系,监控视图可以有多个层级,各层级可以象目录树一样展开和收缩,如图4所示。定义13 :监控视图是系统视图的可视化表示。信息与应用资源监控与状态管理的过程是(I)根据监控管理要求和岗位职责划分,确定监控对象及其相互之间的关系,形成系统视图。(2)根据监控对象运行状态监控的要求,确定每个物理监控对象的监控指标和监控策略,包括运行状态函数。(3)按照监控策略获取监控数据,同时计算对应监控对象的运行状态。(4)诊断运行状根据运行状态等级划分,确定运行状态所属运行状态所属等级。(5)将运行状态展示在监控视图上。若发现故障,采用安装报警设备发出故障报
m
目O( 二)信息与应用资源运行状态监控原理信息与应用资源运行状态监控采用SNMP协议,并按照信息与应用资源运行状态监控的要求进行扩展,使既有信息基础设施(如服务器、路由器、交换机等)的运行状态监控不需要再部署任何软硬件,同时又便于对信息与应用资源状态监控根据实际情况进行扩展。在被监控的信息与应用资源中部署监控代理,由监控代理维护状态监控的管理
库-MIB (Management information Base)。MIB为树型结构,MIB中的每个叶节点对应一
项监控指标,有唯一的节点号-OID(Object Identifier) □ MIB中记录了监控指标的名称、数据类型、采样方法、状态数据采集接口等信息。当监控代理收到监控系统的状态数据采集请求时,首先解析出请求需要采集的监控内容,再根据请求的监控指标节点号,调用状态数据采集接口获取相应的监控数据,最后将采集到的监控数据反馈给监控系统。信息与应用资源监控管理以并发异步获取方式,向各个监控对象中的监控代理发送状态检测请求,获取监控对象的运行状态信息。监控对象的运行状态信息被保存至系统内置数据库中,由运行状态分析处现程序根据应用资源监控指标进行分析、统计和运行状态等级诊断,最终进行运行状态展示、故障报警或生成统计报表。信息与应用资源监控管理遵循以下基本流程,如图5所示。(三)信息与应用资源对象分类与结构针对现有政务IT体系,各种应用各自独立、简单堆叠的局面,与实际情况相结合后,将现有政务信息系统中的资源对象分为系统设备、系统软件、业务信息、应用系统和特殊设备等。分类层次结构如图6所示。按照监控对象实体组成,监控对象在监控视图中可以组成的逻辑层次结构,如图6。(四)信息与应用资源状态 表示方法信息与应用资源状态的表示应以量化资源状态为前提,且可以直观的表示资源当前状态。因此,量化资源状态的数据主要是文字、数据、逻辑值、比率等形式,最终通过运算这些数据得到用以表示监控对象运行状态的指标。根据表示监控对象运行状态的数据形式(格式),监控指标的形式可以是数值(包括平均数)或百分比。按照数值或百分比进行分段,分别表示不同的运行状态等级。百分比的算法为P = ν/Τ(100% ),其中V为采集数据;τ为允许的最大值。例如内存利用率,CPU空闲率等。为了简化信息与应用资源监控与状态管理,使监控视图简单易懂、概念明确。将监控对象的运行状态分为停机、正常、异常和故障四种等级(I)停机表示监控对象未启动、未联网、网络配置不正确,不能获取监控指标的检测数据,记为Α。(2)正常表示监控对象正常运行,记为t2。(3)异常表示监控对象所需资源不能完全满足要求,表现为运行不稳定、性能下降,应该引起管理人员注意,记为t3。(4)故障表示监控对象存在故障,虽仍然运行,但不能按照要求提供和执行相应的功能,记为t4。四种运行状态等级构成一个有限集T T = It1, t2, t3, t4}(4-2)根据运行状态等级的划分及其含义,针对每类监控对象的运行状态函数的值域,值域构成运行状态集V。可以对运行状态函数的值域划分为与停机、正常、异常和故障相应的四个集合。停机的运行状态函数值集合记为S,正常的运行状态函数值集合记为N,异常的运行状态函数值集合记为A,故障的运行状态函数值集合记为M,运行状态函数值域有V = Sunuaum SnN=O,SnA=O,SnM=O
权利要求
1.一种信息与应用资源运行状态监控及评价方法,其特征在于,包括以下步骤 步骤1、根据监控对象的定义,获取监控对象所有监控指标的监测数据; 步骤2、计算监控对象中计算型监控指标的监测数据; 步骤3、根据监控对象中每项监控指标的运行状态判别规则,判别每项监控指标所表示的监控对象运行状态; 步骤4、按照监控对象运行状态合成方法,合成监控对象的运行状态; 步骤5、按照组合监控对象运行状态合成方法,合成组合监控对象的运行状态,直到得到所监控系统的运行状态; 步骤6、按照监控对象运行状态输出要求,输出监控对象的运行状态。
2.根据权利要求1所述的信息与应用资源运行状态监控及评价方法,其特征在于,步骤I所述的获取监控对象所有监控指标的监测数据的方法主要有主动获取和被动接收两种 (1)主动获取,通过管理系统向监控对象发送数据帧,监控对象接收到数据帧后,调用相应的接口模块查询此刻自身运行状态,并随即将运行状态信息发回管理系统,管理系统根据相应的监控指标将此运行状态数据分类储存、分析实现监控对象的检测; (2)被动获取,监控对象接收到来自管理系统数据帧后,记录数据帧来源,待自身状态发生变化后,发送数据帧给管理系统,管理系统通过接收监控对象发送的数据帧实时检测网络设备的运行状态信息。
3.根据权利要求2所述的信息与应用资源运行状态监控及评价方法,其特征在于,获取监控对象所有监控指标的监测数据采用主动获取为主被动获取为辅的方法,以主动的方式收集各种日常工作状态信息,并根据历史信息、预设监控指标阀值和参考信息分析、建立状态变化的趋势,以被动接收的方式获得突发事件信息。
4.根据权利要求1所述的信息与应用资源运行状态监控及评价方法,其特征在于,步骤3所述判别的运行状态为“停机”、“正常”、“异常”、“故障”四种。
5.根据权利要求1所述的信息与应用资源运行状态监控及评价方法,其特征在于,步骤4所述的合成方法如下 (1)没有获得监控数据的监控指标不参与对监控对象运行状态的判别; (2)若监控指标判别中有是“故障”状态的,则监控对象的运行状态为“故障”; (3)若监控指标判别中没有是“故障”状态的,有是“异常”状态的,则监控对象的运行状态为“异常”; (4)若监控指标判别中没有是“故障”和“异常”状态的,有是“停机”状态的,则监控对象的运行状态为“停机”; (5)上述判别得到的监控对象运行状态不是“故障”、“异常”和“停机”时,则监控对象的运行状态为“正常”。
6.根据权利要求1所述的信息与应用资源运行状态监控及评价方法,其特征在于,步骤5所述的合成方法如下 (1)将子监控对象运行状态视为一项监控指标判别的结果; (2)按照上述监控对象运行状态合成的方和合成组合对象的运行状态。
全文摘要
本发明属于信息技术领域,提供一种信息与应用资源运行状态监控及评价方法,包括以下步骤步骤1、根据监控对象的定义,获取监控对象所有采集型监控指标的监测数据;步骤2、计算监控对象中计算型监控指标的监测数据;步骤3、根据监控对象中每项监控指标的运行状态判别规则,判别每项监控指标所表示的监控对象运行状态;步骤4、按照监控对象运行状态合成方法,合成监控对象的运行状态;步骤5、按照组合监控对象运行状态合成方法,合成组合监控对象的运行状态,直到得到所监控系统的运行状态;步骤6、按照监控对象运行状态输出要求,输出监控对象的运行状态。本发明便于非专业人员监控管理用户信息与应用资源运行状态,降对专业人员的依赖。
文档编号G06F11/30GK103049365SQ20121043973
公开日2013年4月17日 申请日期2012年11月7日 优先权日2012年11月7日
发明者张遂征, 唐堃, 南海斌, 赵世雄, 葛大伟, 贾献博, 聂淼 申请人:北京宏德信智源信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1