基于业务变化量的系统资源监控装置的制造方法

文档序号:8498641阅读:377来源:国知局
基于业务变化量的系统资源监控装置的制造方法
【技术领域】
[0001] 本发明涉及一种系统资源容量监控装置,尤其涉及一种基于业务变化量的系统资 源监控装置。
【背景技术】
[0002] 目前大中型企业的数据主要存放在数据库中,通过对数据的增、删、改、查与计算 实现特定业务的功能,每次都将消耗一定的系统基础资源如CPU、内存或者空间来完成对数 据库的操作。当系统相对空闲时,各种操作之间因为基础资源充分不会产生争用,但随着业 务量的增加,业务系统将会因为基础资源的不足而变得运行缓慢,甚至不可用。在业务高峰 期尤为明显,严重影响到业务系统的稳定运行。
[0003]目前解决方式主要有以下2种途径:
[0004] 1、通过对基础资源使用率进行采集,当超过阀值时进行通报,随后管理员通过脚 本或自动工作负载信息库(AWR)查询历史情况,定期对最耗资源的进程、SQL语句进行分析 与优化解决。
[0005] 2、用户在使用时发现响应变慢,报障给业务部门,业务部门再反馈给维护侧,进 行资源紧急扩容。
[0006] 现有技术有以下缺点:
[0007] 方法一:通过对基础资源(CPU、内存)使用率进行实时采集、分析,筛选出资源使 用率超过阀值的主机进行告警通报,随后系统管理员逐一对告警的主机进行分析优化,定 位资源告警的原因,确定是因为正常业务增长原因还是资源使用异常导致。如果确定为前 者则进行资源扩容,如果是后者则进行集中变更优化。但是当主机规模超过百台、千台之 后,每天告警通报的主机达几十台,需要扩容的数量过多,而备件不足需要统一采购时间冗 长或者本身已经无法扩容。当前的方式对主机资源管理较粗,无法统筹的考虑资源扩容情 况,导致事发才补救,没有前瞻性的把控同时也增加了管理成本。
[0008] 方法二:通过用户发现响应缓慢报障,再由业务部门反应给维护侧,进行紧急扩 容,该现象主要发生在业务高峰时,由于用户使用量的增加导致资源使用产生瓶颈,但在业 务低峰时该现象又消失系统恢复正常,但因为已经对用户使用产生了影响,降低了用户体 验度,造成了非常被动的局面。当问题发生后,产生问题的主机是因为业务增长导致资源耗 尽,但因为备件不足或者已经扩满导致问题不能及时修复。
[0009] 由上可见,以上两种方法存在管理成本较高、资源扩容不及时、扩容需求评估困难 等缺点,因此,有必要对现有的资源容量监控装置进行改进。

【发明内容】

[0010] 本发明所要解决的技术问题是提供一种基于业务变化量的系统资源监控装置,能 够结合业务变化量实时监控基础资源利用率,精确控制系统资源的扩容计划,大大降低故 障发生率和管理成本,提高系统的稳定性。
[0011] 本发明为解决上述技术问题而采用的技术方案是提供一种基于业务变化量的系 统资源监控装置,包括集中配置模块:配置被监控主机列表、采集监控项、采集时间、采集格 式以及业务模块与SQL语句的对应关系;统一采集模块:根据集中配置模块的配置信息实 时采集相关元数据并发送给分布式分析模块进行实时分析;分布式分析模块:根据采集到 的元数据统计业务量指标和系统资源使用情况,计算系统资源消耗分布情况,并结合业务 增长趋势估算资源扩容计划;历史数据归档模块:对元数据进行压缩归档,并根据配置的 离线时间下线较早部分的元数据;对结果数据归档用作报表展示与历史趋势分析。
[0012] 上述的基于业务变化量的系统资源监控装置,其中,还包括自定义展示模块,根据 选择的时间范围、目标主机信息向历史数据归档模块请求数据,并将从历史数据归档模块 返回的数据进行展示与分析。
[0013] 上述的基于业务变化量的系统资源监控装置,其中,所述集中配置模块的采集监 控项包括应用程序业务指标、主机CPU使用状态、主机内存使用状态以及数据库性能指标, 所述集中配置模块通过在应用程序发起的数据库SQL语句中添加业务类型与功能标识配 置业务模块与SQL语句的对应关系,并定期自动地进行更新。
[0014] 上述的基于业务变化量的系统资源监控装置,其中,所述统一采集模块采集的元 数据包括单位时间片内:单类业务受理总量、单类业务受理成功数量、单类业务受理失败数 量、CPU消耗按照系统用户占比、CPU使用百分比、CPU等待10百分比、CPU空闲百分比、内存 消耗按照系统用户占比、内存使用百分比、内存空闲百分比、数据库耗时总量、数据库耗CPU 总量、数据库内存分配总量、数据库物理读总量、数据库逻辑读总量、单类业务受理成功SQL 耗时总量、单类业务受理成功SQL耗CPU总量、单类业务受理失败SQL耗时总量以及单类业 务受理失败SQL耗CPU总量。
[0015] 上述的基于业务变化量的系统资源监控装置,其中,所述分布式分析模块根据不 同资源类型计算系统资源分布情况,并在不同业务类型的指标上进行二次运算得出单比业 务资源消耗的数量与单类业务资源消耗占比;所述分布式分析模块通过计算单类业务模块 所有SQL消耗CPU得到该类业务所消耗的CPU资源,最终求得当前CPU使用量所包含的各 类业务、进程消耗的总和。
[0016] 上述的基于业务变化量的系统资源监控装置,其中,所述分布式分析模块计算确 定单比业务CPU使用量的占比,业务处理SQL占用系统CPU的总量以及系统CPU资源的使 用率后,结合业务变化量绘制CPU使用量与业务增长量的曲线,估算CPU扩容需求。
[0017] 上述的基于业务变化量的系统资源监控装置,其中,所述分布式分析模块计算确 定数据库数据缓存区内存的使用率,主机内存资源的使用率,数据库内存资源的使用量以 及当前主机内存的使用量后,结合业务变化量绘制内存使用量与业务增长量的曲线,估算 内存扩容需求。
[0018] 上述的基于业务变化量的系统资源监控装置,其中,所述分布式分析模块统计单 位时间内已配置的各类业务调用次数与主机、数据库资源消耗关系,统计高峰时期的业务 变化趋势及需要的系统资源,并进行提前优化减少业务高峰期不必要的批量作业调用,或 者根据估算的CPU扩容需求、内存扩容需求提前扩容以满足业务发展的需求。
[0019] 上述的基于业务变化量的系统资源监控装置,其中,所述分布式分析模块根据历 史业务高峰期资源消耗分布进行异常提醒处理,对超出历史同期业务高峰期CPU资源消耗 或内存资源消耗达到预设阀值的业务调用判断为异常消耗,并对引起异常消耗的业务进行 排查优化。
[0020] 本发明对比现有技术有如下的有益效果:本发明提供的基于业务变化量的系统资 源监控装置,通过实时采集、监控业务量与主机资源使用情况,准确地结合业务量历史变化 趋势估算扩容需求与优化需求,使资源消耗清晰化,扩容与优化需求可预见化,大大降低故 障发生率和管理成本,提高系统的稳定性。
【附图说明】
[0021] 图1为本发明基于业务变化量的系统资源监控装置架构示意图;
[0022] 图2为本发明基于业务变化量的系统资源监控装置处理流程示意图。
【具体实施方式】
[0023] 下面结合附图和实施例对本发明作进一步的描述。
[0024] 图1为本发明基于业务变化量的系统资源监控装置架构示意图。
[0025] 请参见图1,本发明提供的基于业务变化量的系统资源监控装置,包括统一采集
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1