监控管理系统及方法与流程

文档序号:15829064发布日期:2018-11-03 00:16阅读:164来源:国知局

本申请主要涉及设备监控技术,特别涉及一种以多程序自动化管理设备监控作业的系统及方法。

背景技术

近年来,由于大众对普适运算(ubiquitouscomputing)与网络通信的需求大幅增长,各种无线技术纷纷问世,例如:全球移动通信系统(globalsystemformobilecommunications,gsm)技术、通用分组无线服务(generalpacketradioservice,gprs)技术、全球增强型数据传输(enhanceddataratesforglobalevolution,edge)技术、宽带码分多工接入(widebandcodedivisionmultipleaccess,wcdma)技术、码分多工接入-2000(codedivisionmultipleaccess2000,cdma-2000)技术、时分同步码分多工接入(timedivision-synchronouscodedivisionmultipleaccess,td-scdma)技术、全球互通微波接入(worldwideinteroperabilityformicrowaveaccess,wimax)技术、长期演进(longtermevolution,lte)技术、以及时分长期演进(time-divisionlte,td-lte)技术等。

随着网络逐渐普及化,一般来说,服务供应商或代管商会将服务设备架设于互联网上运行,让使用者可随时随地通过遍及的网络来接入各式的服务及应用,而为了维持服务及应用的稳定性,网管人员会对服务设备的系统环境进行监控以随时掌握异常状况的发生并采取即时的处理。然而,在服务设备的硬件架构复杂、或服务设备所运行的服务繁多时,网管人员必须针对个别服务设备及个别服务设定要进行监控的项目,即便是针对同服务类型的设备,重复的设定依然需要用手动的方式进行,以监控管理的角度而言,不仅容易发生监控项目的遗漏,设定及管理也相当耗时。



技术实现要素:

为了解决上述问题,本申请提出一种监控管理系统及方法,将监控管理的流程划分为规则注册、信息收集、以及规则判断等三个阶段,并以编程的方式去实现各个阶段的执行,以即时捕捉服务设备的状态异动(例如:硬件新增/移除、或服务新增/移除)并进行相应的处理。

本申请的一实施例提供了一种监控管理系统,包括一通信装置、一存储装置、以及一控制器。上述通信装置用以提供网络连线到至少一服务设备。上述存储装置用以存储计算机可读取的指令或程序代码。上述控制器用以载入并执行上述指令或程序代码以通过上述通信装置对上述服务设备进行监控管理,所述监控管理包括以下步骤:检测上述服务设备的一系统环境设定;决定上述系统环境设定是否符合上述服务设备所对应的一监控规则,若是,则产生一监控设定;以及根据上述监控设定指派至少一监控主机对上述服务设备进行监控。

本申请的另一实施例提供了一种监控管理方法,适用于一监控管理系统管理对至少一服务设备所进行的监控作业,上述监控管理方法包括以下步骤:检测上述服务设备的一系统环境设定;决定上述系统环境设定是否符合上述服务设备所对应的一监控规则,若是,则产生一监控设定;以及根据上述监控设定指派至少一监控主机对上述服务设备进行监控,其中,上述服务设备与上述监控规则之间存在一绑定关系,检测上述系统环境设定的步骤是根据上述绑定关系所执行。

关于本申请其他附加的特征与优点,本领域技术人员在不脱离本申请的精神和范围内,当可根据本申请实施方法中所公开的监控管理系统以及监控管理方法做些许的更动与润饰而得到。

附图说明

图1是根据本申请一实施例所述的设备监控环境的示意图。

图2是根据本申请一实施例所述的监控管理系统10的硬件架构示意图。

图3是根据本申请一实施例所述的监控管理方法的软件架构示意图。

图4是根据本申请一实施例所述的系统环境检测代理人321的作业流程图。

图5是根据本申请一实施例所述的规则判断代理人323的作业流程图。

图6是根据图3的实施例所述的监控管理方法的运作示意图。

【符号说明】

100设备监控环境

10监控管理系统

11通信装置

12存储装置

13控制器

20设备监控系统

30互联网

40~60服务设备1~3

310定义模块

311异动事件定义

312监控任务定义

313监控规则定义

314规则与监控标的绑定

320代理人模块

321系统环境检测代理人

322定义搜集代理人

323规则判断代理人

s401~s403步骤编号

s501~s505步骤编号

具体实施方式

本章节所叙述的是实施本申请的最佳方式,目的在于说明本申请的精神而非用以限定本申请的保护范围,应理解下列实施例可经由软件、硬件、固件、或上述任意组合来实现。

图1是根据本申请一实施例所述的设备监控环境的示意图。设备监控环境100包括监控管理系统10、设备监控系统20、互联网30、以及服务设备40~60,其中,监控管理系统10及设备监控系统20可通过互联网30连接到服务设备40~60。

监控管理系统10可为一具备网络通信功能的运算装置,如:笔记型计算机、桌上型计算机、工作站、服务器等,用以设定监控任务由服务设备40~60执行。

设备监控系统20可由一或多部监控主机(如:笔记型计算机、桌上型计算机、工作站、服务器等)所组成,其中每一部监控主机皆可执行监控软件,用以根据被设定的监控任务对服务设备40~60进行监控。

在另一实施例,监控管理系统10及设备监控系统20可整合在同一系统中。

服务设备40~60可各别为一计算机主机,包括多个硬件资源(如:处理器、硬盘、存储器、以及网络卡等)用以执行并提供服务/应用,例如:电子邮件收发服务、数据库服务、网页服务、移动推播服务、或文件传输协议(filetransferprotocol,ftp)服务等。

图2是根据本申请一实施例所述的监控管理系统10的硬件架构示意图。监控管理系统10包括通信装置11、存储装置12、以及控制器13。

通信装置11用以提供连线至互联网30、以及互联网30上的设备监控系统20以及服务设备40~60。通信装置11可依循至少一特定通信技术提供有线或无线网络连线,例如:以太网(ethernet)技术、无线区网(wirelessfidelity,wi-fi)技术、全球互通微波接入技术、全球移动通信系统技术、宽带码分多工接入技术、或长期演进技术等。

存储装置12为非暂态(non-transitory)的计算机可读取存储介质,例如:随机存取存储器(randomaccessmemory,ram)、快闪存储器,或硬盘、光盘,或上述介质的任意组合,用以存储计算机可读取的指令或程序代码,包括:应用/通信协议的程序代码、和/或本申请的方法的程序代码及数据库。

在一具体实施例中,存储装置12亦包括数据库。

控制器13可为通用处理器、微处理器(microcontrolunit,mcu)、应用处理器(applicationprocessor,ap)、或数字信号处理器(digitalsignalprocessor,dsp)等,其可包括各式电路逻辑,用以提供数据处理及运算的功能、控制通信装置11的运作以提供网络连线、从存储装置12读取或存储数据。特别是,控制器13用以协调通信装置11以及存储装置12的运作,以执行本申请的监控管理方法。

本领域技术人员当可理解,控制器13中的电路逻辑通常可包括多个晶体管,用以控制该电路逻辑的运作以提供所需的功能及作业。更进一步的,晶体管的特定结构及其之间的连结关系通常是由编译器所决定,例如:寄存器转移语言(registertransferlanguage,rtl)编译器可由处理器所运作,将类似组合语言码的指令脚本(script)编译成适用于设计或制造该电路逻辑所需的形式。

当可理解的是,图2所示的元件仅用以提供一说明的范例,并非用以限制本申请的保护范围。举例来说,监控管理系统10还可包括:显示屏幕(如:液晶显示器(liquidcrystaldisplay,lcd)、发光二极管显示器(liquidcrystaldisplay,lcd)、或电子纸显示器(electronicpaperdisplay,epd)等)、输入输出装置(如:一或多个按钮、键盘、鼠标、触碰板、视频镜头、麦克风、或喇叭)、电源供应器、和/或全球定位系统(globalpositioningsystem,gps)仪等。

图3是根据本申请一实施例所述的监控管理方法的软件架构示意图。在此实施例,监控管理方法适用于监控管理系统10,明确来说,监控管理方法可用程序代码实作为多个软件模块,并由控制器13载入并执行。如图3所示,监控管理方法的软件架构可包括定义模块310以及代理人模块(agentmodule)320。

定义模块310主要负责提供监控作业所需规则定义,其中这些规则定义可依照系统环境设定(即服务设备40~60)的异动、或依使用者设定的异动而随时更新并存储于数据库中。定义模块310包括异动事件定义311、监控任务定义312、监控规则定义313、以及规则与监控标的绑定314。

异动事件定义311主要用以设定需要监控的异动事件,也就是系统环境设定的异动,设定可依照使用者的需求经验法则而有所调整、或者可进一步根据监控任务的历史记录来决定出最佳化设定。在一实施例,可先取得目前所支持的可监控的异动事件,并从中选定要监控的异动事件进行设定。

异动事件的设定可包括:异动项目、异动类型、运算值、和/或阈值,其中异动项目是指异动的服务或硬件资源,异动类型是指异动项目为“新增”或“移除”,运算值及阈值是指异动的条件及阈值,条件可为“大于”、“小于”、或“等于”,而阈值可为任意正整数。在一实施例,可针对使用者输入/选定的异动项目、异动类型、运算值、和/或阈值进行正确性检查,并在通过检查时才将异动事件的设定存入数据库。

举例来说,异动事件可以是指某服务设备新增运行一数据库服务,相应地,异动事件的异动项目为数据库服务,异动事件的异动类型为新增,异动事件的运算值为“等于”,阈值为1。或者,异动事件可以是指某服务设备移除运行之一网页服务,相应地,异动事件的异动项目为网页服务,异动事件的异动类型为移除,异动事件的运算值为“等于”,阈值为1。或者,异动事件可以是指某服务设备新增多台硬盘,相应地,异动事件的异动项目为硬盘,异动事件的异动类型为新增,异动事件的运算值为“大于”,阈值为1。

监控任务定义312主要用以设定当异动事件发生时所需执行的一或多个监控任务。举例来说,当某服务设备新增运行一数据库服务时(异动事件发生),其对应的监控任务可包括在平日白天由监控软件a负责监控该数据库服务、以及在平日晚上额外加入监控软件b一同负责监控该数据库服务。

在一实施例,可先取得目前所支持的监控任务,并从中选定监控任务进行设定,并且可对监控任务的设定进行正确性检查,并在通过检查时才将监控任务的设定存入数据库。举例来说,若设定平日白天由监控软件a进行监控,另外,又设定平日整天由监控软件a进行监控,则表示平日白天的监控任务重复,为了避免监控任务运作资源的浪费,会建议进行监控任务的调整。

监控规则定义313主要用以设定异动事件与监控任务之间的对应关系。举例来说,异动事件1可以是指某服务设备新增运行一套网页服务器软件,而异动事件2可以是指网页服务器软件架设了一个以上的网页服务,当异动事件1与2同时满足或其中一个满足时,对应的监控任务可以是由监控软件b来监控网页服务中每个网页的流量以及线上使用人数。

在一实施例,在设定异动事件与监控任务之间的对应关系之前,可先判断异动事件与监控任务是否相抵触,若没有抵触才将对应关系的设定存入数据库。举例来说,异动事件1是指网页服务器软件“架设”一个以上的网页服务,异动事件2是网页服务器软件“删除”一个以上的网页服务,此时若监控规则(参下述)绑订同时满足异动事件1以及异动事件2时执行某监控任务,由于异动事件1以及异动事件2不可能同时发生,代表此监控规则永远无法触发,因此将会提醒加以调整。

规则与监控标的绑定314主要用以设定监控规则与监控标的之间的绑定关系,也就是要对哪一台服务设备实施哪一个监控规则,其中监控标的可以是特定的一台服务设备、或位于特定网络协议(internetprotocol,ip)地址区段内的服务设备、或由多台服务设备所组成的群组。举例来说,可以指定位于某区段的网络协议地址(如192.168.0.1~192.168.0.255)的服务设备为监控标的,因此,当有任何新增的服务设备其网络协议地址落在此区段,就会自动被纳入监控。

为方便理解,以一范例说明定义模块310所提供的规则定义。异动事件定义311可包括异动事件a1~a4,其中异动事件a1为“新增一网页服务”、异动事件a2为“新增一数据库服务”、异动事件a3为“移除一网页服务”、以及异动事件a4为“移除一数据库服务”。监控任务定义312可包括监控任务b1~b4,其中监控任务b1为“设定对网页服务的监控”、监控任务b2为“取消对网页服务的监控”、监控任务b3为“设定对数据库服务的监控”、以及监控任务b4为“取消对数据库服务的监控”。监控规则定义313可包括:a1对应至b1、a2对应至b3、a3对应至b2、以及a4对应至b4。规则与监控标的绑定314可包括:对服务设备40实施监控规则(a1,b1)、对服务设备40实施监控规则(a3,b2)、对服务设备40实施监控规则(a2,b3)、以及对服务设备50实施监控规则(a1,b1)。

代理人模块320包括系统环境检测代理人(或第一任务代理人)321、定义搜集代理人(或第二任务代理人)322、以及规则判断代理人(或第三任务代理人)323,其中每个代理人分别由一或多个程序所执行,各自根据定义模块310中的规则定义进行监控管理作业中的不同任务,以分工的方式完成整个监控管理作业。

系统环境检测代理人321主要负责以一或多个程序来执行一或多个任务代理人,由任务代理人定期检测系统环境设定,并将系统环境设定存入系统现况队列中等待写入数据库。明确来说,系统环境设定包括:特定服务设备目前运行的特定服务、和/或特定硬件资源。系统环境检测代理人321是根据数据库中已注册的监控规则与监控标的之间的绑定关系,来决定要监控哪一台服务设备以及该服务设备上所运行的哪个服务或硬件资源。

在一实施例,当系统环境中的服务设备数量超过系统环境检测代理人321所能处理的阈值(如:一预定数量)时,可新增程序以执行该代理人的副本,也就是可进行代理人的数量扩展,以适应系统环境的变化。同样地,当系统环境中的服务设备数量减少至低于一预定数量时,可减少代理人的副本数量。

图4(建议同时参考图6)是根据本申请一实施例所述的系统环境检测代理人321的作业流程图。首先,系统环境检测代理人321会从数据库读取目前已注册的监控规则与监控标的之间的绑定关系,以决定要检测的目标并定期进行检测(步骤s401),然后将每次检测的结果存入系统现况队列中(步骤s402),由系统现况队列来触发将检测的结果一笔一笔写入数据库(步骤s403),流程结束。

定义搜集代理人322主要负责以一或多个程序来执行一或多个任务代理人,由任务代理人将数据库目前已注册的监控规则与监控标的之间的绑定关系全部读取出来,存入定义讯息队列中等待规则判断代理人323来读取。

在一实施例,当数据库中已注册的监控规则与监控标的之间的绑定关系过多(超过定义搜集代理人322所能处理的阈值)时,可新增程序以执行该代理人的副本,也就是可进行代理人的数量扩展,以提高读取绑定关系的效率。同样地,当绑定关系减少至低于一预定数量时,可减少代理人的副本数量。

规则判断代理人323主要负责以一或多个程序来执行一或多个任务代理人,由任务代理人比对系统现况是否符合监控规则与监控标的的任一绑定关系。

在一实施例,当定义讯息队列中等待读取的绑定关系过多时,可新增程序以执行规则判断代理人323的副本,也就是可进行代理人的数量扩展,以提高规则判断代理人323的执行效率。同样地,当绑定关系减少至低于一预定数量时,可减少代理人的副本数量。

图5是根据本申请一实施例所述的规则判断代理人323的作业流程图(建议同时参考图6)。首先,规则判断代理人323从定义讯息队列中取出已注册的监控规则与监控标的之间的绑定关系(步骤s501),然后依照绑定关系从数据库中查询监控标的的系统现况(步骤s502),并决定监控标的的系统现况是否符合对应的监控规则(步骤s503),若否,则流程结束。

反之,若监控标的的系统现况符合对应的监控规则,则根据监控规则中的监控任务产生一监控设定并存入监控设定讯息队列(步骤s504)。明确来说,监控设定可包括:一指标指示由哪个监控主机或监控软件来执行监控作业、一监控时间指示进行监控的确切时间、以及一监控项目(即哪个服务设备上所运行的哪个服务或硬件资源)。

接着,由监控设定讯息队列来触发对应的监控软件对监控标的(服务设备)进行监控(步骤s505),流程结束。

图6是根据图3的实施例所述的监控管理方法的运作示意图。如图6所示,系统环境检测代理人321根据数据库中已注册的监控规则与监控标的之间的绑定关系,定期检测系统环境设定,并将检测结果存入系统现况队列,由系统现况队列来触发将检测的结果一笔一笔写入数据库。

举例来说,已注册的绑定关系若指示与服务设备40的网页服务及数据库服务有关、以及与服务设备50的网页服务有关,则只针对服务设备40的网页服务及数据库服务、以及服务设备50的网页服务进行定期的检测。

接着,定义搜集代理人322将数据库目前已注册的监控规则与监控标的之间的绑定关系全部读取出来,并存入定义讯息队列。

然后,规则判断代理人323从定义讯息队列读取已注册的监控规则与监控标的之间的绑定关系,然后向数据库查询该绑定关系中的监控标的的系统现况。接着,规则判断代理人323判断监控标的的系统现况是否符合该绑定关系中的监控规则,若是,则根据监控规则中的监控任务产生一监控设定并存入监控设定讯息队列。

之后,由监控设定讯息队列中的监控设定一一触发指派特定监控主机上的监控软件对监控标的进行监控。

本申请虽以各种实施例公开如上,然而其仅为范例参考而非用以限定本申请的范围,本领域技术人员在不脱离本申请的精神和范围内,当可做些许的更动与润饰。因此上述实施例并非用以限定本申请的范围,本申请的保护范围当视所附权利要求书界定范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1