优化系统报警的方法及装置的制造方法

文档序号:9237968阅读:455来源:国知局
优化系统报警的方法及装置的制造方法
【技术领域】
[0001]本发明涉及计算机技术领域,具体而言,本发明涉及一种优化系统报警的方法及
目.0
【背景技术】
[0002]现有技术中存在多种网络监控方式,如Ganglia、Zabbix等监控方式。Zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案,其能监视各种网络参数,保证网络设备的安全运营;且提供了报警机制以让系统管理员快速定位并解决存在的各种问题。但现有的报警机制比较简单,仅可以通过单一的报警方式、固定的报警次数及固定的报警时间间隔来发布报警信息,且报警信息内容单一,无法向系统管理员提供全面的报警信息,同时由于报警方式单一导致报警效率较差,降低系统维护效率。

【发明内容】

[0003]为克服上述技术问题或者至少部分地解决上述技术问题,特提出以下技术方案:
[0004]本方案的实施例中提供了一种优化系统报警的方法,包括:
[0005]通过实时监控多台计算机设备,来采集每一计算机设备多个监控项的监控结果数据;
[0006]当任一监控项的监控结果数据达到该监控项的报警阈值时,生成报警信息;
[0007]基于当前总报警次数来调整报警方式及报警时间间隔;以及
[0008]根据调整后的报警方式及报警时间间隔来发布报警信息。
[0009]本方案的另一实施例中提供了一种优化系统报警的装置,包括:
[0010]结果采集模块,用于通过实时监控多台计算机设备,来采集每一计算机设备多个监控项的监控结果数据;
[0011]第一生成模块,用于当任一监控项的监控结果数据达到该监控项的报警阈值时,生成报警信息;
[0012]调整模块,用于基于当前总报警次数来调整报警方式及报警时间间隔;
[0013]发布模块,用于根据调整后的报警方式及报警时间间隔来发布报警信息。
[0014]本发明的实施例中,由于基于当前总报警次数来调整报警方式及报警时间间隔,使得报警方式多元化,且报警时间间隔与当前总报警次数相关联,避免发布过多的报警信息对系统管理员造成接收干扰;同时,丰富的报警信息可以向系统管理员提供全面的报警信息,从而提高报警信息发布效率,进一步地,为提高系统维护效率提供了可靠保证。
[0015]本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
【附图说明】
[0016]本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0017]图1为本发明中数据库数据恢复的方法一个实施例的流程示意图;
[0018]图2为本发明中数据库数据恢复的装置一个实施例的结构示意图。
【具体实施方式】
[0019]下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
[0020]本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
[0021]本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
[0022]图1为本发明中数据库数据恢复的方法一个实施例的流程示意图。
[0023]步骤SllO:通过实时监控多台计算机设备,来采集每一计算机设备多个监控项的监控结果数据;步骤S120:当任一监控项的监控结果数据达到该监控项的报警阈值时,生成报警信息;步骤S130:基于当前总报警次数来调整报警方式及报警时间间隔;步骤S140:根据调整后的报警方式及报警时间间隔来发布报警信息。
[0024]本发明的实施例中,由于基于当前总报警次数来调整报警方式及报警时间间隔,使得报警方式多元化,且报警时间间隔与总报警次数相关联,避免发布过多的报警信息对系统管理员造成接收干扰;同时,丰富的报警信息可以向系统管理员提供全面的报警信息,从而提高报警信息发布效率,进一步地,为提高系统维护效率提供了可靠保证。
[0025]步骤SllO:通过实时监控多台计算机设备,来采集每一计算机设备多个监控项的监控结果数据。
[0026]具体地,通过Zabbix、Ganglia等监控方式来实时监控多台计算机设备,并以预定的采集频率来采集每一计算机设备多个监控项的监控结果数据。
[0027]步骤S120:当任一监控项的监控结果数据达到该监控项的报警阈值时,生成报警信息。
[0028]具体地,预设置每一监控项的报警阈值,当任一监控项的监控结果数据达到该监控项的报警阈值时,即该监控项异常,生成报警信息。
[0029]其中,报警信息包括但不限于:设备相关信息;监控项的监控类型;监控项的监控结果数据;报警问题的处理状态。
[0030]其中,设备相关信息包括但不限于:设备标识,如主机名;分区标识,如分区名;端口号;IP地址;数据库类型,如MySQL数据库、Mongo数据库等;数据库主从角色,如主、从数据库。
[0031]其中,监控项的监控类型包括但不限于:CPU使用状态、内存占用状态、分区使用状态、硬盘占用状态、网络状态、数据库状态、端口状态等。相应地,监控项的监控结果数据包括但不限于:CPU使用率、内存占用率、分区使用率、硬盘占用率、网络通断状态、数据库可读写状态、端口通断状态等。
[0032]其中,报警问题的处理状态包括但不限于:报警问题已处理,报警问题未处理、未处理的时间长度。
[0033]具体地,设备相关信息、监控项的监控类型、监控项的监控结果数据和报警问题的处理状态分别保存于数据库中,如保存在MySQL数据库的多张表中,且多张表通过该监控项的监控项ID相互关联,当任一监控项的监控结果数据达到该监控项的报警阈值时,基于该监控项ID,从数据库的多张表中分别提取与该监控项ID相应的报警参数信息,合并生成报警信息。
[0034]例如,当采集到监控项CPU使用状态的监控结果数据为CPU使用率为90%,达到预设的CPU使用状态的报警阈值时,生成报警信息,该报警信息包括如下信息:
[0035]主机名:M:db02.add.shgt ;
[0036]分区名:/datal;
[0037]监控项的监控类型及监控结果数据..CPU使用率异常:90% ;
[0038]报警问题的处理状态:PR0BLEM。
[0039]步骤S130:基于当前总报警次数来调整报警方式及报警时间间隔。
[0040]其中,具体调整方式包括但不限于:
[0041]若当前总报警次数未达到第一报警次数阈值时,确定报警方式为第一报警方式,并确定报警时间间隔为第一报警时间间隔;
[0042]若当前总报警次数达到第一报警次数阈值时,将报警方式调整为第二报警方式,并将报警时间间隔调整为第二报警时间间隔;
[0043]若当前总报警次数达到第二报警次数阈值时,将报警方式调整为第三报警方式,并将前次报警与本次报警之间的时间间隔调整为第三报警时间间隔;
[0044]若当前总报警次数达到第三报警次数阈值时,将当前报警方式调整为第四报警方式,并将当前报警时间间隔调整为第四报警时间间隔。
[0045]其
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1