一种融合基础架构监控管理系统的制作方法

文档序号:30096233发布日期:2022-05-18 10:57阅读:69来源:国知局
一种融合基础架构监控管理系统的制作方法

1.本发明涉及媒体运营技术领域,尤其涉及一种融合基础架构监控管理系统。


背景技术:

2.随着业务的不断拓展,业务系统的建设与扩容,带来了一系列痛点。设备种类、品牌、数量繁多,系统架构、版本各异,人为巡检监控的有穷性;多运维流程,多种媒介,电子化覆盖不足;多运维形态,传统环境,虚拟化环境,云环境。亟需依托itss国家标准,遵循itil先进的服务管理理念提升信息化应用产品能力与运营维护能力,需要支撑系统向着“it即服务”的方向转变,以期更有效的节约运营成本,简化工作流程,统一自动化监管。
3.目前还存在运维体系落后、运维自动化流程低、运维人员紧缺等制约因素,对的运营发展存在在巨大的制约,亟需通过手段来完善和提高整体运维体系的运作效率。


技术实现要素:

4.本发明的目的是为了解决现有技术中存在的缺点,而提出的一种融合基础架构监控管理系统。
5.为了实现上述目的,本发明采用了如下技术方案:
6.一种融合基础架构监控管理系统,该系统包括如下模块:资源监控管理、模板管理、告警管理和报表管理;
7.资源监控管理包括如下子模块:网络设备与配置管理、服务器硬件监控、存储监控、虚拟化监控、容器监控、操作系统监控、数据库监控、中间件监控;
8.模板管理包括如下子模块:连接参数模板管理和监控模板管理;
9.告警管理包括如下子模块:设备告警上报与主动轮询、阈值告警和屏蔽重复告警;
10.报表管理包括如下子模块:报表自定义、报表设计、文件导出格式。
11.优选地,所述网络设备与配置管理中设备类型包括:路由器、交换机、负载均衡、防火墙、无线等设备进行管理,实现网络设备资源的集中化管理,通过增加设备和自动发现两种方式,将网络资源加入系统中进行管理;通过网络拓扑,用户可以更加准确的把握网络的连接情况和设备的实际物理位置及配置。
12.优选地,所述服务器硬件监控可对x86架构服务器硬件状态、硬件性能数据进行监控,并具备自动巡检功能,可以有效的替代传统的通过查看服务器状态灯的人工巡检模式,通过带外管理端口直接对服务器硬件的监控,不需要在每台服务器上安装代理软件或服务器厂家的管理软件,实现与操作系统的无关性。
13.优选地,所述存储监控对存储设备的监控通过标准的协议进行,包括smi-s、snmp、restful,可根据不同的存储设备型号支持的监控类型设置不同的连接协议访问参数。
14.优选地,所述虚拟化监控可对虚拟化软件管理的数据中心、集群、宿主机、虚拟机、虚拟交换机等各个部件的状态进行监控,也可对各部件的cpu、内存、磁盘资源使用,以及接口流量、磁盘i/o性能数据监控。
15.优选地,所述容器监控通过多种方式对容器以及容器平台进行监控,可对kubernetes容器平台集群、节点以及pod的基本信息以及状态进行监控,可通过命令行或者restful接口调用的方式对docker容器进行监控,满足客户实际的需求,其包括容器基本信息、磁盘信息、镜像信息以及使用的资源信息、性能信息。
16.优选地,所述操作系统监控对多种主机操作系统的管理,提供业务主机整体负载情况的监测,包括cpu负载,内存与虚拟内存利用率,主机网络会话数量、源与目的及流量信息,各个物理网络接口流量信息,设备连续运行时间;支持业务主机各文件系统的磁盘空间大小、利用率、剩余空间、inode利用率,磁盘增长率的管理;提供业务主机上关键进程的运行状况及其对cpu和内存占用情况的管理;主机监控的进程down可主动发送告警通知管理员。
17.优选地,所述数据库监控对各种数据库的管理,提供各种数据库可用性和性能的整体监控,包括数据库连接信息、数据库明细、表空间,数据库大小、缓存性能、内存、读、写、i/o状态、sql统计。
18.优选地,所述中间件监控管理各类应用服务器、web服务器等中间件,可检测应用服务器的会话性能、虚拟机内存、线程池、事务状态、jms,队列、负载度量、运行模式,可检测web服务器的可用性、响应时间、访问性能统计、页面传输性能、当前状态。
19.优选地,所述连接参数模板管理对各类管理对象的的连接参数进行统一管理,通过模板进行配置。配置访问参数模板后,在监控、自动发现等组件中都可选择使用,实现一次配置,多处引用的目标。同时,对于连接参数的模板统一进行管理和维护,在一次修改也可以在其他引用的地方生产,简化对连接参数的配置;
20.连接参数模板从协议维度和管理对象维度进行配置,根据不同管理对象类型,使用不同的连接参数模板,方便使用。
21.与现有技术相比,本发明的有益效果是:
22.1、资源监控管理通过设备trap上报、主动轮询、自定义采集等多种方式快速准确发现资源故障;以图形化形式展示监控结果和资源运行状态;通过实时告警与拓扑提示、通过告警板声光提示、通过手机短信及email、微信等远程提示,快速通知运维管理员详细准确的故障信息;
23.2、模板管理分为连接参数模板管理可对各类管理对象的的连接参数进行统一管理,通过模板进行配置,以及监控模板管理对监控对象进行各项配置;
24.3、告警管理,提供统一的全流程故障管理体系;
25.4、报表管理提供集中的报表管理平台,实现对报表模板管理、周期性报表管理和报表模板的发布,同时提供实时报表和周期性报表的查看。
附图说明
26.为了更具体直观地说明本发明实施例或者现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简要介绍。
27.图1为本发明的资源监控管理架构图。
具体实施方式
28.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
29.参照图1,一种融合基础架构监控管理系统,该系统包括如下模块:资源监控管理、模板管理、告警管理和报表管理;
30.资源监控管理包括如下子模块:网络设备与配置管理、服务器硬件监控、存储监控、虚拟化监控、容器监控、操作系统监控、数据库监控、中间件监控;
31.模板管理包括如下子模块:连接参数模板管理和监控模板管理;
32.告警管理包括如下子模块:设备告警上报与主动轮询、阈值告警和屏蔽重复告警;
33.报表管理包括如下子模块:报表自定义、报表设计、文件导出格式。
34.本实施方案中,网络设备与配置管理中设备类型包括:路由器、交换机、负载均衡、防火墙、无线等设备进行管理,实现网络设备资源的集中化管理,通过增加设备和自动发现两种方式,将网络资源加入系统中进行管理;通过网络拓扑,用户可以更加准确的把握网络的连接情况和设备的实际物理位置及配置。
35.本实施方案中,服务器硬件监控可对x86架构服务器硬件状态、硬件性能数据进行监控,并具备自动巡检功能,可以有效的替代传统的通过查看服务器状态灯的人工巡检模式,通过带外管理端口直接对服务器硬件的监控,不需要在每台服务器上安装代理软件或服务器厂家的管理软件,实现与操作系统的无关性。
36.本实施方案中,存储监控对存储设备的监控通过标准的协议进行,包括smi-s、snmp、restful,可根据不同的存储设备型号支持的监控类型设置不同的连接协议访问参数。
37.本实施方案中,虚拟化监控可对虚拟化软件管理的数据中心、集群、宿主机、虚拟机、虚拟交换机等各个部件的状态进行监控,也可对各部件的cpu、内存、磁盘资源使用,以及接口流量、磁盘i/o性能数据监控。
38.本实施方案中,容器监控通过多种方式对容器以及容器平台进行监控,可对kubernetes容器平台集群、节点以及pod的基本信息以及状态进行监控,可通过命令行或者restful接口调用的方式对docker容器进行监控,满足客户实际的需求,其包括容器基本信息、磁盘信息、镜像信息以及使用的资源信息、性能信息。
39.本实施方案中,操作系统监控对多种主机操作系统的管理,提供业务主机整体负载情况的监测,包括cpu负载,内存与虚拟内存利用率,主机网络会话数量、源与目的及流量信息,各个物理网络接口流量信息,设备连续运行时间;支持业务主机各文件系统的磁盘空间大小、利用率、剩余空间、inode利用率,磁盘增长率的管理;提供业务主机上关键进程的运行状况及其对cpu和内存占用情况的管理;主机监控的进程down可主动发送告警通知管理员。
40.本实施方案中,数据库监控对各种数据库的管理,提供各种数据库可用性和性能的整体监控,包括数据库连接信息、数据库明细、表空间,数据库大小、缓存性能、内存、读、写、i/o状态、sql统计。
41.本实施方案中,中间件监控管理各类应用服务器、web服务器等中间件,可检测应用服务器的会话性能、虚拟机内存、线程池、事务状态、jms,队列、负载度量、运行模式,可检
测web服务器的可用性、响应时间、访问性能统计、页面传输性能、当前状态。
42.本实施方案中,连接参数模板管理对各类管理对象的的连接参数进行统一管理,通过模板进行配置。配置访问参数模板后,在监控、自动发现等组件中都可选择使用,实现一次配置,多处引用的目标。同时,对于连接参数的模板统一进行管理和维护,在一次修改也可以在其他引用的地方生产,简化对连接参数的配置;
43.连接参数模板从协议维度和管理对象维度进行配置,根据不同管理对象类型,使用不同的连接参数模板,方便使用。
44.监控模板管理对监控对象的各项配置,均通过监控模板的方式进行,在监控模板中,可集中管理监控指标、指标阈值配置、指标采集周期配置等,对于相同类型的管理对象,可配置多个监控模板,不同的监控实例可选择不同的监控模板,做到按需监控,以满足不同客户的监控个性化需求。
45.告警管理,提供统一的全流程故障管理体系;通过设备trap上报与主动轮询双向确保快速准确发现网络故障;通过实时告警关联分析,屏蔽重复无效告警,分析生成根因告警;通过实时告警与拓扑提示、通过告警板声光提示、通过手机短信及email、微信等远程提示,快速通知网络管理员详细准确的故障信息;通过固化用户维护经验,为后续相关告警处理提供经验参考与快速定位指导。
46.设备告警上报与主动轮询可以接收各类告警源的告警事件,包括设备告警、资源性能监视告警、网络流量异常监视告警、日志告警等;同时通过支持对设备以及资源的定时轮询,实现通断告警、可用性告警、性能阈值、配置变更告警等。
47.设备告警包括电源电压、设备温度、风扇等告警事件,设备冷启动、热启动、接口down等重要告警事件,路由信息事件(ospf,bgp)变化,热备份路由(hsrp)状态变化等告警事件,支持对h3c、cisco、华为、3com等多厂商设备告警的识别和解析。
48.资源性能性能监视包括cpu利用率,内存使用率,以及rmon告警的故障管理。
49.定期轮询告警通过对设备性能、接口、链路、操作系统、数据库、中间件等各类应用等运行状态和性能定时进行轮循,并及时上报通断告警、响应时间告警等告警事件。
50.根据标准mib中的trap信息预定义了大量告警定义用于接收解析告警,同时提供新增及通过mib导入trap定义功能,厂家私有告警可以填加平台告警定义中,后面再收到该告警事件会按用户定义的格式进行解析。
51.阈值告警可以在监控模板管理中,对监控模板中的每一个指标设置阈值。支持5级的阈值设置,1~5级阈值对应的告警级别分别为:通知、警告、次要、重要、紧急。对于不同的告警级别,设置不同的轮询触发次数。可根据实际的需求以及指标的重要程度进行灵活设置,满足不同的个性化需求。
52.屏蔽重复告警可对接收到的trap事件进行关联分析,能在故障恢复时自动恢复相关告警,并且缺省支持对重复trap事件、闪断trap事件、未知trap事件、未管理设备trap事件的过滤分析。同时提供用户自定义trap分析升级规则,以有效压缩海量网络告警,使得管理员直接关注真正的网络故障。
53.报表管理提供集中的报表管理平台,实现对报表模板管理、周期性报表管理和报表模板的发布,同时提供实时报表和周期性报表的查看。
54.以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,
任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1