监控系统的制作方法

文档序号:12068124阅读:187来源:国知局
监控系统的制作方法与工艺

本申请涉及监控技术领域,具体而言,涉及一种监控系统。



背景技术:

目前,许多单位采用定时人工巡检方式进行信息系统运维工作,需要运维人员根据信息系统保障级别定时定点查看主机设备及信息系统相关状态、告警,存在故障发现不及时、运维效率较低等问题。随着设备及系统数目增加,在运维人员人数不变的情况下,人工巡检方式显得越来越力不从心。这种以人工为主的信息系统运维方式越来越不足以支撑实际业务要求。

针对相关技术中随着设备及系统数目增加,采用人工巡检方式进行信息系统进行监控不足以支撑实际业务要求的问题,目前尚未提出有效的解决方案。



技术实现要素:

本申请的主要目的在于提供一种监控系统,以解决关技术中随着设备及系统数目增加,采用人工巡检方式进行信息系统进行监控不足以支撑实际业务要求的问题。

为了实现上述目的,根据本申请的一个方面,提供了一种监控系统。该监控系统包括:内网监控系统和外网监控系统,内网监控系统和外网监控系统之间采用防火墙逻辑隔离;内网监控系统中包括:第一监控主服务器、第一数据库服务器和代理服务器集合,其中,第一监控主服务器的一端与第一数据库服务器连接;第一监控主服务器的另一端与代理服务器集合连接,代理服务器集合包括多台代理服务器,每台代理服务器用于采集被监控项目的数据信息,并将采集到的被监控项目的数据信息发送至第一监控主服务器;外网监控系统中包括:第二监控主服务器、第二数据库服务器和被监控服务器集合,第二监控主服务器的一端与第二数据库服务器连接;第二监控主服务器的另一端与被监控服务器集合连接,被监控服务器集合包括多台被监控服务器,第二监控主服务器用于采集每台被监控服务器的数据信息。

进一步地,第一监控主服务器与每台代理服务器之间开设双向端口。

进一步地,在内网监控系统中还包括:在第一监控主服务器上安装第一预设运维软件;在第一预设运维软件中创建第一目标脚本;根据第一目标脚本对代理服务器集合中的每个监控项目进行安装部署。

进一步地,在外网监控系统中还包括:在第二监控主服务器上安装第二预设运维软件;在第二预设运维软件中创建第二目标脚本;根据第二目标脚本对被监控服务器集合中的每台被监控服务器进行安装部署。

进一步地,在内网监控系统中还包括:将第一告警信息转换成内网监控系统对应的格式;将转化格式后的第一告警信息发送至短信平台;以及通过短信平台发送转化格式后的第一告警信息至第一目标地址。

进一步地,第一告警信息为在内网监控系统中的监控指标高于对应的告警阈值时产生的告警信息,内网监控系统中的监控指标包括以下至少之一:内存、CPU、磁盘、网络流量、日志。

进一步地,在外网监控系统中还包括:将第二告警信息转换成内网监控系统对应的格式;将转化格式后的第二告警信息发送至微信平台;以及通过微信平台发送转化格式后的第二告警信息至第二目标地址。

进一步地,第二告警信息为在外网监控系统中的监控指标高于对应的告警阈值时产生的告警信息,外网监控系统中的监控指标包括以下至少之一:内存、CPU、磁盘、网络流量、日志。

进一步地,在内网监控系统中还包括:对第一监控主服务器部署自动化脚本,其中,自动化脚本用于监控网页链接和服务器端口地址;以及对第一监控主服务器的服务端进行配置,以将自动化脚本部署至代理服务器集合中的每个监控项目。

进一步地,在外网监控系统中还包括:对第二监控主服务器部署自动化脚本,其中,自动化脚本用于监控网页链接和服务器端口地址;以及对第二监控主服务器的服务端进行配置,以将自动化脚本部署至被监控服务器集合中的每台被监控服务器。

通过本申请,采用以下结构的监控系统:内网监控系统和外网监控系统,内网监控系统和外网监控系统之间采用防火墙逻辑隔离;内网监控系统中包括:第一监控主服务器、第一数据库服务器和代理服务器集合,其中,第一监控主服务器的一端与第一数据库服务器连接;第一监控主服务器的另一端与代理服务器集合连接,代理服务器集合包括多台代理服务器,每台代理服务器用于采集被监控项目的数据信息,并将采集到的被监控项目的数据信息发送至第一监控主服务器;外网监控系统中包括:第二监控主服务器、第二数据库服务器和被监控服务器集合,第二监控主服务器的一端与第二数据库服务器连接;第二监控主服务器的另一端与被监控服务器集合连接,被监控服务器集合包括多台被监控服务器,第二监控主服务器用于采集每台被监控服务器的数据信息,解决了关技术中随着设备及系统数目增加,采用人工巡检方式进行信息进行监控工作不足以支撑实际业务要求的问题。通过采用信息系统内外网监控系统的方式,对进而达到了提升对服务器设备的监控效率,从而也降低了对信息系统运维成本的效果。

附图说明

构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1是根据本申请实施例提供的监控系统的示意图;

图2是根据本申请实施例提供的一种内网监控系统原理拓扑图;以及

图3是根据本申请实施例提供的一种外网监控系统原理拓扑图。

具体实施方式

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本申请的实施例,提供了一种监控系统。

图1是根据本申请实施例提供的监控系统的示意图,如图1所示,该监控系统包括:内网监控系统和外网监控系统,内网监控系统和外网监控系统之间采用防火墙逻辑隔离;内网监控系统中包括:第一监控主服务器、第一数据库服务器和代理服务器集合,其中,第一监控主服务器的一端与第一数据库服务器连接;第一监控主服务器的另一端与代理服务器集合连接,代理服务器集合包括多台代理服务器,每台代理服务器用于采集被监控项目的数据信息,并将采集到的被监控项目的数据信息发送至第一监控主服务器;外网监控系统中包括:第二监控主服务器、第二数据库服务器和被监控服务器集合,第二监控主服务器的一端与第二数据库服务器连接;第二监控主服务器的另一端与被监控服务器集合连接,被监控服务器集合包括多台被监控服务器,第二监控主服务器用于采集每台被监控服务器的数据信息。

本申请提供的监控系统分为内网监控系统和外网监控系统,其中内网监控采用分布式架构设计,有一台主服务器、一台数据库服务器和N台代理服务器;外网监控采用集中式架构设计,只有一台主服务器和一台数据库服务器,内外网监控工具全部采用server-agent模式。

可选地,在本申请实施例提供的监控系统中,第一监控主服务器与每台代理服务器之间开设双向端口。

内网监控系统由于现有待监控节点(被监控服务器)数目较多(约1000台),进一步考虑到信息业务发展需要,因此采用分布式设计,使监控系统具有万台设备监控能力。内网的代理服务器选取分散主服务器压力。不仅如此,在机房的要安全域中各放置一台代理服务器,减少安全域中设备与主服务器通信开设专门端口需求,只需每个安全域中代理服务器与主服务器之间开设双向端口即可。外网监控系统由于现有待监控节点数据较少(约100台),采用集中式设计,节省公司设备资源,提高设备利用率。

针对拥有本部多个核心机房,设备在地理上呈现分布式架构态势的现状,同时考虑到现有主机设备数目以及发展需求,监控系统采用分布式架构搭建。分布式架构,意味着一个中心点、多个分节点的模式可以正常运行,这种架构特别适合跨机房、跨地域的网络监控结构。监控服务器代理(分节点)代替监控主服务器(中心点)收集和接收被监控项目的监控数据,并将数据发送到监控主服务器上,由主服务器处理或报警,已达到减轻监控主服务器的压力,从而实现分布式架构系统的构建。图2是根据本申请实施例提供的一种内网监控系统原理拓扑图,监控分布拓扑示意图参见图2,其中所有服务器操作系统为Red Hat Enterprise 6.6,数据库服务器为mysql 5.7。外网信息系统数目较少且位置集中特点,外网监控系统采用集中式部署方案,图3是根据本申请实施例提供的一种外网监控系统原理拓扑图,监控拓扑示意图参见图3,其中所有服务器操作系统为Red Hat Enterprise 6.6,数据库服务器为mysql 5.7。

通过本申请,采用以下结构的监控系统:内网监控系统和外网监控系统,内网监控系统和外网监控系统之间采用防火墙逻辑隔离;内网监控系统中包括:第一监控主服务器、第一数据库服务器和代理服务器集合,其中,第一监控主服务器的一端与第一数据库服务器连接;第一监控主服务器的另一端与代理服务器集合连接,代理服务器集合包括多台代理服务器,每台代理服务器用于采集被监控项目的数据信息,并将采集到的被监控项目的数据信息发送至第一监控主服务器;外网监控系统中包括:第二监控主服务器、第二数据库服务器和被监控服务器集合,第二监控主服务器的一端与第二数据库服务器连接;第二监控主服务器的另一端与被监控服务器集合连接,被监控服务器集合包括多台被监控服务器,第二监控主服务器用于采集每台被监控服务器的数据信息,解决了关技术中随着设备及系统数目增加,采用人工巡检方式进行信息进行监控工作不足以支撑实际业务要求的问题。通过采用信息系统内外网监控系统的方式,对进而达到了提升对服务器设备的监控效率,从而也降低了对信息系统运维成本的效果。

可选地,在本申请实施例提供的监控系统中,在内网监控系统中还包括:在第一监控主服务器上安装第一预设运维软件;在第一预设运维软件中创建第一目标脚本;根据第一目标脚本对代理服务器集合中的每个监控项目进行安装部署。

针对Linux操作系统的自动化开源架构上的程序(例如,zabbix_agent)部署脚本,内网监控系统虽然支持SNMP、ICMP等协议,但很多高级功能实现需要在第一监控主服务器上安装agent程序(第一预设运维软件)。例如有服务器千余台,大部分为红帽操作系统,采用ansible自动化运维软件,并编写相应脚本(第一目标脚本),对所有红帽待监控服务器进行自动化安装部署,提升安装部署的工作效率。

可选地,在本申请实施例提供的监控系统中,在外网监控系统中还包括:在第二监控主服务器上安装第二预设运维软件;在第二预设运维软件中创建第二目标脚本;根据第二目标脚本对被监控服务器集合中的每台被监控服务器进行安装部署。

针对Linux操作系统的自动化开源架构上的程序(例如,zabbix_agent)部署脚本,外网监控系统虽然支持SNMP、ICMP等协议,但很多高级功能实现需要在第二监控主服务器上安装agent程序(第二预设运维软件)。例如有服务器千余台,大部分为红帽操作系统,采用ansible自动化运维软件,并编写相应脚本(第二目标脚本),对所有红帽待监控服务器进行自动化安装部署,提升安装部署的工作效率。

可选地,在本申请实施例提供的监控系统中,在内网监控系统中还包括:将第一告警信息转换成内网监控系统对应的格式;将转化格式后的第一告警信息发送至短信平台;以及通过短信平台发送转化格式后的第一告警信息至第一目标地址。

在内网监控系统中,例如:微信告警脚本通过调用相应API接口,将所需要信息封装成对应格式,传给微信服务器。短信告警脚本将告警信息封装成短信平台所需信息格式,发送至短信平台,由短信平台统一发送告警短信至用户(第一目标地址)。

可选地,在本申请实施例提供的监控系统中,第一告警信息为在内网监控系统中的监控指标高于对应的告警阈值时产生的告警信息,内网监控系统中的监控指标包括以下至少之一:内存、CPU、磁盘、网络流量、日志。

可选地,在本申请实施例提供的监控系统中,在外网监控系统中还包括:将第二告警信息转换成内网监控系统对应的格式;将转化格式后的第二告警信息发送至微信平台;以及通过微信平台发送转化格式后的第二告警信息至第二目标地址。

在外网监控系统中,例如:微信告警脚本通过调用相应API接口,将所需要信息封装成对应格式,传给微信服务器。短信告警脚本将告警信息封装成微信平台所需信息格式,发送至微信平台,由微信平台统一发送告警短信至用户(第二目标地址)。

可选地,在本申请实施例提供的监控系统中,第二告警信息为在外网监控系统中的监控指标高于对应的告警阈值时产生的告警信息,外网监控系统中的监控指标包括以下至少之一:内存、CPU、磁盘、网络流量、日志。

可选地,在本申请实施例提供的监控系统中,在内网监控系统中还包括:对第一监控主服务器部署自动化脚本,其中,自动化脚本用于监控网页链接和服务器端口地址;以及对第一监控主服务器的服务端进行配置,以将自动化脚本部署至代理服务器集合中的每个监控项目。

在内网监控系统中选取一台管理服务器(第一监控主服务器),部署自动化脚本,在server端进行简单配置,即可实现URL和端口监控批量配置,提升工作效率。

可选地,在本申请实施例提供的监控系统中,在外网监控系统中还包括:对第二监控主服务器部署自动化脚本,其中,自动化脚本用于监控网页链接和服务器端口地址;以及对第二监控主服务器的服务端进行配置,以将自动化脚本部署至被监控服务器集合中的每台被监控服务器。

在内网监控系统中选取一台管理服务器(第二监控主服务器),部署自动化脚本,在server端进行简单配置,即可实现URL和端口监控批量配置,提升工作效率。

本申请提供的监控系统中可实现的具体功能,例如:

1、监控系统支持Windows、Linux、AIX、HP-UX等主流操作系统的CPU、内存、磁盘空间、网络流量等关键参数监控。

2、监控系统通过插件形式支持ORACLE、MYSQL等主流数据库监控,以及WEBLOGIC等主流中间件监控。

3、监控系统可以实现对URL地址、端口地址监控,确保信息系统安全稳定运行。

4、监控系统支持包括AGENT、SNMP、IPMI、JMX、SSH、Telnet在内多种监控数据收集模式,可以根据各个信息系统实际需求自定义数据收集频率。

5、监控系统具有告警功能,并可以根据实际需求灵活定义告警阈值、定制告警信息,根据告警级别分级通过邮件、微信、短信等形式发送告警信息。通过预先设定条件,当发生更大规模事故时实现告警升级功能。

6、监控系统具有良好的图形化展示功能。

7、监控系统可以根据需求储存历史数据,方便运维人员对设备状态进行分析,排查设备隐患。一旦设备出现故障,方便运维人员查找故障,并在故障后对故障原因进行深入分析。

8、监控系统具有完善用户权限管理和日志审计功能,有较高安全性能。

监控系统在开源监控开源架构的系统(例如,zabbix)基础上针对报警模块进行二次开发,使内网监控报警可以通过短信发送、外网监控报警可以通过微信发送,并完成针对红帽企业版5、6操作系统的开源架构上的程序(例如,zabbix_agent)自动部署。还针对开源架构系统的告警阈值及server、agent配置参数进行优化,完成URL和端口监控批量部署,使之更符合日常生产需要。

需要说明的是,在监控系统中,监控指标及相应阈值为监控系统最核心技术。根据自身业务需要,制定符合需要的监控指标及相应告警阈值,有效减少误报、漏报。监控指标涉及内存、CPU、磁盘、网络流量、日志等多方面,充分满足日常生产需求。

开源架构的监控系统由于部署规模、服务器性能不同,server配置需要做相应调整。经过实践可以总结归纳出较为优化的配置参数。

处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数监控服务器设备。

存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。

以上所述仅为本申请的优选实施例,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1