一种IT运维管理方法及装置与流程

文档序号:12692425阅读:190来源:国知局
一种IT运维管理方法及装置与流程

本发明涉及IT运维管理技术领域,特别是涉及一种IT运维管理方法及装置。



背景技术:

随着信息时代的持续发展,IT运维已经成为IT服务内涵中重要的组成部分。面对越来越复杂的业务,面对越来越多样化的用户需求,不断扩展的IT应用需要越来越合理的模式来保障IT服务能灵活便捷、安全稳定地持续保障,这种模式中的保障因素就是IT运维。从初期的几台服务器发展到庞大的数据中心,单靠人工已经无法满足在技术、业务、管理等方面的要求,那么标准化、自动化、架构优化、过程优化等降低IT服务成本的因素越来越被人们所重视。其中,自动化最开始作为代替人工操作为出发点的诉求被广泛研究和应用。

传统运维管理方式存在很多问题,如运维人员被动、效率低,缺乏一套高效的IT运维机制,缺乏高效的IT运维技术工具。现在IT系统的复杂性已经客观上要求IT运维必须能够实现数字化、自动化维护,但是目前IT运维都需要人工参与管理,不能实现自动化管理。



技术实现要素:

本发明的目的是提供一种IT运维管理方法及装置,以实现自动化管理。

为解决上述技术问题,本发明提供一种IT运维管理方法,该方法包括:

建立自动化运维管理平台;

在自动化运维管理平台上,建立故障事件自动触发流程;

在自动化运维管理平台上,建立故障事件跟踪流程。

优选的,所述自动化运维管理平台包括:服务器、中间件、存储备份模块,业务应用模块和客户端。

优选的,建立故障事件自动触发流程,包括:

利用流程化的框架将事件与IT流程相关联,若系统发生性能超标,触发性能超标对应的事件以及事件定义好的流程,启动故障响应和恢复机制。

优选的,建立故障事件跟踪流程之后,还包括:

利用表格工具记录故障及故障处理情况,建立运维日志。

本发明还提供一种IT运维管理装置,用于实现所述IT运维管理方法,该装置包括:

平台建立模块,用于建立自动化运维管理平台;

触发流程模块,用于在自动化运维管理平台上,建立故障事件自动触发流程;

跟踪流程模块,用于在自动化运维管理平台上,建立故障事件跟踪流程。

优选的,所述自动化运维管理平台包括:服务器、中间件、存储备份模块,业务应用模块和客户端。

优选的,触发流程模块具体用于在自动化运维管理平台上,利用流程化的框架将事件与IT流程相关联,若系统发生性能超标,触发性能超标对应的事件以及事件定义好的流程,启动故障响应和恢复机制。

优选的,跟踪流程模块还包括:记录单元,用于利用表格工具记录故障及故障处理情况,建立运维日志。

本发明所提供的一种IT运维管理方法及装置,建立自动化运维管理平台;在自动化运维管理平台上,建立故障事件自动触发流程;在自动化运维管理平台上,建立故障事件跟踪流程。可见,建立故障事件自动触发流程,一旦系统发生性能超标或宕机,会触发相关事件以及事先定义好的流程,可自动启动故障响应和恢复机制,由于建立了故障事件自动触发流程和故障事件跟踪流程,实现自动化管理,并且,自动化运维管理平台帮助IT运维人员完成日常的重复性工作如备份、杀毒等,提高IT运维效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明所提供的一种IT运维管理方法的流程图;

图2为本发明所提供的一种IT运维管理装置的结构示意图。

具体实施方式

本发明的核心是提供一种IT运维管理方法及装置,以实现自动化管理。

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参考图1,图1为本发明所提供的一种IT运维管理方法的流程图,该方法包括:

S11:建立自动化运维管理平台;

S12:在自动化运维管理平台上,建立故障事件自动触发流程;

S13:在自动化运维管理平台上,建立故障事件跟踪流程。

可见,该方法建立故障事件自动触发流程,一旦系统发生性能超标或宕机,会触发相关事件以及事先定义好的流程,可自动启动故障响应和恢复机制,由于建立了故障事件自动触发流程和故障事件跟踪流程,实现自动化管理。

并且,自动化运维管理平台帮助IT运维人员完成日常的重复性工作如备份、杀毒等,提高IT运维效率。

基于上述方法,具体的,所述自动化运维管理平台包括:服务器、中间件、存储备份模块,业务应用模块和客户端。

进一步的,步骤S12中,建立故障事件自动触发流程的过程具体为:利用流程化的框架将事件与IT流程相关联,若系统发生性能超标,触发性能超标对应的事件以及事件定义好的流程,启动故障响应和恢复机制。

进一步的,步骤S13中,建立故障事件跟踪流程之后,还包括:利用表格工具记录故障及故障处理情况,建立运维日志。

进一步的,所述方法还包括:采用优先处理原则设置自动化流程。

详细的,本方法基于流程化的框架,将事件与IT流程相关联,一旦被监控系统发生性能超标或宕机,会触发相关事件以及事先定义好的流程,可自动启动故障响应和恢复机制。并且提高IT运维效率、预测故障、在故障发生前报警,把故障消除在发生前,将所产生损失减到最低。

本方法应用于浪潮云海OS,浪潮云海OS是一体化的数据中心资源管理平台软件,本方法基于该业界领先的云管理平台软件,提供分布式应用部署环境,本方法提供一个建立高效IT运维自动化管理的解决方案。

本方法中,IT运维管理的自动化是指通过将日常IT运维中大量的重复性工作,小到简单的日常检查、配置变更和软件安装,大到整个变更流程的组织调度,由过去的手工执行转为自动化操作,从而减少乃至消除运维中的延迟,实现“零延时”的IT运维。

简单的说,IT运维自动化是指基于流程化的框架,将事件与IT流程相关联,一旦被监控系统发生性能超标或宕机,会触发相关事件以及事先定义好的流程,可自动启动故障响应和恢复机制。自动化工作平台还可帮助IT运维人员完成日常的重复性工作(如备份、杀毒等),提高IT运维效率。同时,IT运维的自动化还要求能够预测故障、在故障发生前能够报警,让IT运维人员把故障消除在发生前,将所产生损失减到最低。

基于本方法,具体实施过程如下:

(1)建立自动化运维管理平台;

IT运维自动化管理建设的第一步是要先建立IT运维的自动化监控和管理平台。通过监控工具实现对用户操作规范的约束和对IT资源进行实时监控,包括服务器、数据库、中间件、存储备份、网络、安全、机房、业务应用和客户端等内容,通过自动监控管理平台实现故障或问题综合处理和集中管理。本方法基于该业界领先的云管理平台,提供分布式应用部署环境。

(2)建立故障事件自动触发流程,提高故障处理效率;

需要事先建立自动工单式流程管理,当设备或软件发生异常或超出预警指标时会触发相关的事件,同时触发相关工单处理流程给相关IT运维人员。IT运维人员必须在指定时间内完成流程所规定的环节与工作,以提高IT运维响应问题的效率。

(3)建立规范的事件跟踪流程,强化运维执行力度;

IT运维自动化管理建设时,首先需要建立故障和事件处理跟踪流程,利用表格工具等记录故障及其处理情况,以建立运维日志,并定期回顾从中辨识和发现问题的线索和根源。事实上许多实践也证明,建立每种事件的规范化处理和跟踪指南,可以减少IT运维操作的随意性和强化运维的执行力度,在很大程度上可降低故障发生的概率。同时,用户还应可以通过自助服务台、电话服务台等随时追踪该故障请求的处理状态。

(4)设立IT运维关键流程,引入优先处理原则。

设置自动化流程时还需要引入优先处理原则,例行的事按常规处理,特别事件要按优先级次序处理,也就是把事件细分为例行事件和例外关键事件。

实现IT运维的自动化管理是指通过将IT运维中日常的、大量的重复性工作自动化,把过去的手工执行转为自动化操作。自动化是IT运维工作的升华,IT运维自动化不单纯是一个维护过程,更是一个管理的提升过程,是IT运维的最高层次。

请参考图2,图2为本发明所提供的一种IT运维管理装置的结构示意图,用于实现上述IT运维管理方法,该装置包括:

平台建立模块101,用于建立自动化运维管理平台;

触发流程模块102,用于在自动化运维管理平台上,建立故障事件自动触发流程;

跟踪流程模块103,用于在自动化运维管理平台上,建立故障事件跟踪流程。

可见,该装置建立故障事件自动触发流程,一旦系统发生性能超标或宕机,会触发相关事件以及事先定义好的流程,可自动启动故障响应和恢复机制,由于建立了故障事件自动触发流程和故障事件跟踪流程,实现自动化管理。

并且,自动化运维管理平台帮助IT运维人员完成日常的重复性工作如备份、杀毒等,提高IT运维效率。

基于上述装置,具体的,所述自动化运维管理平台包括:服务器、中间件、存储备份模块,业务应用模块和客户端。

进一步的,触发流程模块具体用于在自动化运维管理平台上,利用流程化的框架将事件与IT流程相关联,若系统发生性能超标,触发性能超标对应的事件以及事件定义好的流程,启动故障响应和恢复机制。

进一步的,跟踪流程模块还包括:记录单元,用于利用表格工具记录故障及故障处理情况,建立运维日志。

进一步的,所述装置还包括:流程设置模块,应用采用优先处理原则设置自动化流程。

详细的,本装置基于流程化的框架,将事件与IT流程相关联,一旦被监控系统发生性能超标或宕机,会触发相关事件以及事先定义好的流程,可自动启动故障响应和恢复机制。并且提高IT运维效率、预测故障、在故障发生前报警,把故障消除在发生前,将所产生损失减到最低。

本装置应用于浪潮云海OS,浪潮云海OS是一体化的数据中心资源管理平台软件,本装置基于该业界领先的云管理平台软件,提供分布式应用部署环境,本装置提供一个建立高效IT运维自动化管理的解决方案。

以上对本发明所提供的一种IT运维管理方法及装置进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1