一种预防可用空间耗尽的云硬盘自动化运维方法与流程

文档序号:22757829发布日期:2020-10-31 09:55阅读:161来源:国知局
一种预防可用空间耗尽的云硬盘自动化运维方法与流程

本发明涉及云计算技术领域,特别涉及一种预防可用空间耗尽的云硬盘自动化运维方法。



背景技术:

用户购买云服务厂商虚机和云盘后用于部署自己的业务系统对外提供服务。用户的业务系统在运行过程中需要不断记录日志、临时文件,随着系统运行中日志文件越积越多,垃圾冗余数据不断膨胀,保存的图片、视频、临时文件等不可控的增加,在不知不觉中吞食了大量的云硬盘空间,与之带来的是系统运行速度变慢甚至最终会使得系统终端运行,严重影响对外服务的效率和客户的认可度。

用户购买的虚机和云盘在运行较长时间以后,可能会逐渐忽视对资源包括存储资源的关注和维护,可能导致服务突然降速甚至中断。

由于mq自身原因、网络原因和磁盘故障均有可能导致云盘不可用,因而当购买虚机的客户发现的服务出现运行故障,例如部署在虚拟中的mq服务中断时,通常无法第一时间定位到发生问题的具体原因。

为了避免因为云盘空间告急和耗尽带来的不良影响,本发明提出了一种预防可用空间耗尽的云硬盘自动化运维方法。



技术实现要素:

本发明为了弥补现有技术的缺陷,提供了一种简单高效的预防可用空间耗尽的云硬盘自动化运维方法。

本发明是通过如下技术方案实现的:

一种预防可用空间耗尽的云硬盘自动化运维方法,其特征在于:实时统计用户虚机的每块云盘空间使用量,并预设两个阈值:云盘使用量预警临界值和云盘使用量即将耗尽的临界值;在云盘空间被占满前发出预警通知,提醒用户及时对云硬盘进行扩容或清理冗余的垃圾数据;当云盘空间被占满时,发出告警通知并临时扩展云硬盘空间;用户在接收告警通知后,及时对云硬盘进行扩容或清理冗余的垃圾数据,从而规避云硬盘占满而出现业务中断的风险。

包括以下步骤:

第一步,实时统计用户虚机的每块云盘空间使用量;

第二步,调用qga接口采集云盘使用量数据,并保存在独立于用户虚机之外的服务器上;

第三步,设定云盘使用量预警临界值,如果用户的云盘使用量达到了该临界值,则发出预警通知;

第四步,设定云盘使用量即将耗尽的临界值,若用户的云盘使用量达到了预设的临界值,则发出告警通知,并根据用户的需求为用户临时扩展云硬盘空间,防止出现业务中断的情况。

所述第一步中,利用shell脚本实时统计用户虚机的每块云盘空间使用量,并将统计的云盘空间使用量保存到云硬盘指定文件中。

所述shell脚本的核心命令是df-k|grep$folder|awk'{print$5}'|awk-f%'{print$1}。

所述第二步中,利用监控工具prometheus调用qga(guest-filesystem-usagerate)接口采集云硬盘指定文件中的云盘使用量数据,并保存在单独的服务器的数据库中,以供统计计算。

所述第二步中,监测程序包括iops(input/outputoperationspersecond,每秒进行读写(i/o)操作的次数)监测程序,云硬盘使用量监测程序和云硬盘吞吐量监测程序。

为了给用户争取更多的处理时间,所述第三步中,用户设自定义置预警临界值以及超过该预警值时关闭进程的优先级;当用户的云盘使用量达到了预设的临界值时,按照预设的优先级关闭指定的进程。

通过shell脚本中断用户启动的某些个进程(需要用户提供)。如果用户没有提供,则不操作这一步。

为了提高用户体验,云硬盘提供在线扩容技术,所述第四步中,扩容方案为shell脚本调用cinder-api的扩容接口,扩展大小按照原有云硬盘的比例扩展,调用的存储后端使用ceph。

所述预警通知和告警通知的形式包括但不限于邮件通知,手机短信通知和电话通知,以保证及时通知到用户。

本发明的有益效果是:该预防可用空间耗尽的云硬盘自动化运维方法,通过预设云硬盘使用量预警临界值和云盘使用量即将耗尽的临界值两道关卡,能够提前预警通知用户,提前做出预防措施;如果云硬盘用尽时依然没有解决,再次预警通知用户并动态扩展一定比例的云硬盘空间,防止出现云硬盘占满后,现业务中断,导致经济损失,客户的流失等严重问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

附图1为本发明预防可用空间耗尽的云硬盘自动化运维方法示意图。

附图2为本发明云硬盘的架构示意图。

附图3为本发明监控系统架构示意图。

具体实施方式

为了使本技术领域的人员更好的理解本发明中的技术方案,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚,完整的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

该预防可用空间耗尽的云硬盘自动化运维方法,实时统计用户虚机的每块云盘空间使用量,并预设两个阈值:云盘使用量预警临界值和云盘使用量即将耗尽的临界值;

在云盘空间被占满前发出预警通知,提醒用户提前做出预防措施,及时对云硬盘进行扩容或清理冗余的垃圾数据;当云盘空间被占满时,发出告警通知并临时扩展云硬盘空间;用户在接收告警通知后,及时对云硬盘进行扩容或清理冗余的垃圾数据,从而规避云硬盘占满而出现业务中断的风险。

包括以下步骤:

第一步,实时统计用户虚机的每块云盘空间使用量;

第二步,监测程序调用qga接口采集云盘使用量数据,并保存在独立于用户虚机之外的服务器上;

第三步,设定云盘使用量预警临界值,如果用户的云盘使用量达到了该临界值,则发出预警通知;

第四步,设定云盘使用量即将耗尽的临界值,若用户的云盘使用量达到了预设的临界值,则发出告警通知,并根据用户的需求为用户临时扩展云硬盘空间,防止出现业务中断的情况。

所述第一步中,利用shell脚本实时统计用户虚机的每块云盘空间使用量,并将统计的云盘空间使用量保存到云硬盘指定文件中。

所述shell脚本的核心命令是df-k|grep$folder|awk'{print$5}'|awk-f%'{print$1}。

所述第二步中,利用监控工具prometheus调用qga(guest-filesystem-usagerate)接口采集云硬盘指定文件中的云盘使用量数据,并保存在单独的服务器的数据库中,以供统计计算。

所述第二步中,监测程序包括iops(input/outputoperationspersecond,每秒进行读写(i/o)操作的次数)监测程序,云硬盘使用量监测程序和云硬盘吞吐量监测程序。

为了给用户争取更多的处理时间,所述第三步中,用户设自定义置预警临界值以及超过该预警值时关闭进程的优先级;当用户的云盘使用量达到了预设的临界值时,按照预设的优先级关闭指定的进程。

通过shell脚本中断用户启动的某些个进程(需要用户提供)。如果用户没有提供,则不操作这一步。

为了提高用户体验,云硬盘提供在线扩容技术,所述第四步中,扩容方案为shell脚本调用cinder-api的扩容接口,扩展大小按照原有云硬盘的比例扩展,调用的存储后端使用ceph。

所述预警通知和告警通知的形式包括但不限于邮件通知,手机短信通知和电话通知,以保证及时通知到用户。

与目前的现有技术相比,该预防可用空间耗尽的云硬盘自动化运维方法,具有以下特点:

第一、通过预设云硬盘使用量预警临界值和云盘使用量即将耗尽的临界值两道关卡,能够提前预警通知用户,提前做出预防措施;

第二、如果云硬盘用尽时用户依然没有及时对云硬盘进行扩容或清理冗余的垃圾数据,再次告警通知用户并动态扩展一定比例的云硬盘空间,防止出现云硬盘占满后,现业务中断,导致经济损失,客户的流失等严重问题。

以上所述的实施例,只是本发明具体实施方式的一种,本领域的技术人员在本发明技术方案范围内进行的通常变化和替换都应包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1