一种基于ITIL的云数据中心的监控运维管理系统的制作方法

文档序号:12733425阅读:196来源:国知局
一种基于ITIL的云数据中心的监控运维管理系统的制作方法与工艺

本发明涉及云数据技术领域,特别涉及一种基于ITIL的云数据中心的监控运维管理系统。



背景技术:

随着现代社会科技的发展,云数据中心的越来越普及,而针对云数据中心的监控运维业务日益成为各个数据中心面临的难题。

现有技术中,传统异构环境下的监控运维方式,因为监控与运维管理模块的独立运转,已经严重不能满足当前多变的运维业务,而且运维工作的无序化也严重影响了云数据中心的服务支撑能力。因此,如何使监控与运维管理模块相互结合,使运维工作按流程化规划的顺序进行工作,提升云数据中心的服务支撑能力,是现今急需解决的问题。



技术实现要素:

本发明的目的是提供一种基于ITIL的云数据中心的监控运维管理系统,以将监控与运维管理模块相结合,整合与数据中心的各种资源,提高云数据中心的服务支持能力和水平,提升用户体验度。

为解决上述技术问题,本发明提供一种基于ITIL的云数据中心的监控运维管理系统,包括:

监控模块,用于对云数据中心的基础资源信息进行监控,获取故障信息,并将所述故障信息发送至运维管理模块;其中,所述基础资源信息包括网络设备信息、数据库信息、物理或虚拟主机信息、应用系统信息和第三方软件信息中至少一项;

所述运维管理模块,用于对所述故障信息通过ITIL流程化规划进行处理。

可选的,所述监控模块,包括:

采集单元,用于采集所述基础资源信息中的数据信息;其中,所述数据信息包括:CPU信息、MEM信息、流量信息、网络通断信息中至少一项;

分析单元,用于对所述数据信息进行分析,生成分析结果;

展示单元,用于将所述分析结果中的所述基础资源的状态信息进行展示,并将所述分析结果中的所述故障信息发送至所述运维管理模块。

可选的,所述展示单元,包括:

故障展示子单元,用于将所述故障信息按预设的等级划分条件进行等级的划分,并将划分好故障等级的所述故障信息进行展示;

故障发送子单元,用于将达到预设等级的所述故障信息发送至所述运维管理模块。

可选的,该系统还包括:

用户操作统一入口模块,用于用户登录查看于所述云数据中心的信息。

可选的,所述运维管理模块,包括:

运维管理单元,用于根据运维人员的输入判断所述故障信息是否被解决;若否,则将所述故障信息生成一个故障事件;

事件管理单元,用于对所述故障事件进行配置项的关联,并通过第一处理组对所述故障事件进行处理;若所述故障事件不能解决,则生成一个问题;

问题管理单元,用于通过第二处理组对所述问题进行处理,并将处理后经所述运维管理单元确认已解决的所述问题对应的处理步骤和处理解决方案存储至系统知识库;

所述系统知识库,用于存储所述故障信息对应的问题的处理步骤和处理解决方案。

可选的,所述运维管理模块,还包括:

变更管理单元,用于所述事件管理单元对所述问题进行处理需要变更配置时,通过执行配置管理操作对配置管理数据库中的配置信息进行变更,并将更改的所述配置信息发送至所述用户操作统一入口模块进行展示;

所述配置管理数据库,用于存储配置信息。

可选的,所述运维管理模块,还包括:

反馈单元,用于动态反馈所述云数据中心的硬件资源的状态;和/或

检测单元,用于对网络状态的在线检测;和/或

部署单元,用于对物理机或虚拟机的软件部署;和/或

生命周期管理单元,用于对虚拟资源生命周期的管理。

可选的,该系统还包括:

用户认证和授权模块,用于对登录人员的身份和等级进行认证。

可选的,该系统还包括:

邮件模块,用于将所述故障信息通过邮件发送给预设的邮件地址;和/或

短信模块,用于将所述故障信息通过短信发送给预设的手机号码。

本发明所提供的一种基于ITIL的云数据中心的监控运维管理系统,包括:监控模块,用于对云数据中心的基础资源信息进行监控,获取故障信息,并将所述故障信息发送至运维管理模块;其中,所述基础资源信息包括网络设备信息、数据库信息、物理或虚拟主机信息、应用系统信息和第三方软件信息中至少一项;所述运维管理模块,用于对所述故障信息通过ITIL流程化规划进行处理;

可见,本发明通过监控和运维管理模块相结合的方式对云数据中心进行监控运维管理,提升了监控和运维管理模块之间的联系,可以整合云数据中心的各种资源,通过在运维管理模块中运用ITIL流程化规划,可以借鉴优秀ITIL管理实践,并结合服务流程管理,能够有效指导云数据中心的监控运维管理系统的规范化,提高了云平台的服务支持能力和水平,提升了用户体验度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例所提供的一种基于ITIL的云数据中心的监控运维管理系统的结构图;

图2为本发明实施例所提供的另一种基于ITIL的云数据中心的监控运维管理系统的结构图;

图3为本发明实施例所提供的另一种基于ITIL的云数据中心的监控运维管理系统的模型示意图;

图4为本发明实施例所提供的另一种基于ITIL的云数据中心的监控运维管理系统的运维管理模块的流程示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参考图1,图1为本发明实施例所提供的一种基于ITIL的云数据中心的监控运维管理系统的结构图。该系统可以包括:

监控模块10,用于对云数据中心的基础资源信息进行监控,获取故障信息,并将故障信息发送至运维管理模块20;其中基础资源信息包括网络设备信息、数据库信息、物理或虚拟主机信息、应用系统信息和第三方软件信息中至少一项;

运维管理模块20,用于对故障信息通过ITIL流程化规划进行处理。

其中,监控模块10对基础资源信息进行监控的方式,可以为采用Syslog事件分析、协议包分析、Ping等技术对网络层进行监控,采集CPU、MEM、流量、网络通断等数据信息,然后通过数据分析生成分析结果,将分析结果中的基础资源的状态信息进行展示,并将分析结果中的故障信息发送至运维管理模块20,也就是通过采集单元、分析单元和展示单元将故障信息发送至运维管理模块20;也可以通过其他方式进行监控,只要监控模块10可以将监控出的故障信息发送至运维管理模块20,对于具体的监控方式,本实施例不做任何限制。

可以理解的是,对于监控模块10将故障信息发送至运维管理模块20的方式,可以为将故障信息发送至运维管理人员,通过运维管理人员在运维管理模块20通过ITIL流程化规划对故障信息进行处理,如通过展示单元将故障信息进行展示,调用监控运维管理系统的邮件模块或短息模块将故障信息发送至运维管理人员的邮箱或手机,或触发预设的预警机制,通过报警的方式告知运维管理人员;也可以为直接将故障信息发送至运维管理模块20的展示单元,直接告知运维管理人员故障信息。本实施例对此不受任何和限制。

具体的,对于运维管理模块20对故障信息通过ITIL流程化规划进行处理的方式,可以为先通过运维管理单元由运维管理人员对故障信息通过自身的经验或查阅知识库进行处理,若不能解决,则生成一个故障事件;再通过事件管理单元对故障事件进行配置项的关联,并由第一处理组对故障事件进行处理;若故障事件不能解决,则生成一个问题;然后通过问题管理单元由第二处理组对问题进行处理,并将处理后经运维管理单元确认已解决的问题对应的处理步骤和处理解决方案存储至系统知识库;若需要变更配置,则可通过变更管理单元对配置管理数据库中的配置信息进行变更;其中,第一处理组可以由一般的处理人员组成,第二处理组可以由经验更加丰富的专家人员组成。也可以为通过ITIL流程化规划中其他优秀的管理实践对应的单元,对故障信息进行处理,本实施例对此不受任何限制。

优选的,对于本实施例所提供监控运维管理系统,还可以包括用户操作统一入口模块,用于方便一般用户登录查看于云数据中心的信息;还可以包括其他支撑模块,如用户认证和授权模块,用于对登录人员的身份和等级进行认证;和邮件或短信模块,用于将故障信息通过邮件或短信发送给预设的邮件地址或手机号码。本实施例对此不受任何限制。

另外,对于监控模块10和运维管理模块20其他的功能,如运维管理模块20对监控运维管理系统的日常管理所包括的硬件资源状态动态反馈和网络状态在线检测等功能,可以通过与现有技术相似的方式实现,本实施例对此不受任何限制。

需要说明的是,本实施例所提供监控运维管理系统的目的是基于ITIL流程化规划通过构建统一的用户操作入口(服务台)、配置管理、问题管理、事件管理等几个ITIL服务内容,对监控运维管理系统进行优化。本实施例中只是以故障问题处理的方式对ITIL流程化规划进行的展示,对于监控运维管理系统的其他问题的处理方式,可以通过类似故障问题处理的方式采用ITIL流程化规划进行处理,本实施例对此不受任何限制。对于在监控运维管理系统中加入用户操作统一入口、配置管理、问题管理和事件管理等几个ITIL服务内容的方式,可以如本实施例所示在运维管理模块20中加入,也可以通过其他方式,如直接在监控运维管理系统加入用户操作统一入口模块、配置管理模块、问题管理模块和事件管理模块等,对于监控运维管理系统的具体配置方式,本实施例不做任何限制。

本实施例中,本发明实施例通过监控模块10和运维管理模块20相结合的方式对云数据中心进行监控运维管理,提升了监控和运维管理模块20之间的联系,可以整合云数据中心的各种资源,通过在运维管理模块20中运用ITIL流程化规划,可以借鉴优秀ITIL管理实践,并结合服务流程管理,能够有效指导云数据中心的监控运维管理系统的规范化,提高了云平台的服务支持能力和水平,提升了用户体验度。

请参考图2、图3和图4,图2为本发明实施例所提供的另一种基于ITIL的云数据中心的监控运维管理系统的结构图;图3为本发明实施例所提供的另一种基于ITIL的云数据中心的监控运维管理系统的模型示意图;图4为本发明实施例所提供的另一种基于ITIL的云数据中心的监控运维管理系统的运维管理模块的流程示意图。该系统可以包括:

采集单元11,用于采集基础资源信息中的数据信息;其中,数据信息包括:CPU信息、MEM信息、流量信息、网络通断信息中至少一项。

分析单元12,用于对数据信息进行分析,生成分析结果。

展示单元13,用于将分析结果中的基础资源的状态信息进行展示,并将分析结果中的故障信息发送至运维管理单元21。

运维管理单元21,用于根据运维人员的输入判断故障信息是否被解决;若否,则将故障信息生成一个故障事件。

事件管理单元22,用于对故障事件进行配置项的关联,并通过第一处理组对故障事件进行处理;若故障事件不能解决,则生成一个问题。

问题管理单元23,用于通过第二处理组对问题进行处理,并将处理后经运维管理单元21确认已解决的问题对应的处理步骤和处理解决方案存储至系统知识库24。

系统知识库24,用于存储故障信息对应的问题的处理步骤和处理解决方案。

变更管理单元25,用于事件管理单元22对问题进行处理需要变更配置时,通过执行配置管理操作对配置管理数据库26中的配置信息进行变更,并将更改的配置信息发送至用户操作统一入口模块30进行展示。

配置管理数据库26,用于存储配置信息。

用户操作统一入口模块30,用于用户登录查看于云数据中心的信息。

其中,用户通过登录用户操作统一入口模块30,可以查看各自等级对应的云数据中心的信息,可以提升用户的体验度,对于具体的用户操作统一入口模块30的设置方式,本实施例不做任何限制。

优选的,展示单元13还可以包括故障展示子单元和故障发送子单元,故障展示子单元,用于将故障信息按预设的等级划分条件进行等级的划分,并将划分好故障等级的故障信息进行展示;故障发送子单元,用于将达到预设等级的故障信息发送至运维管理模块。其中,对于将划分好故障等级的故障信息进行展示的方式,可以以表格的方式进行展示,也可以如数列或其他方式进行展示,本实施例对此不受任何限制。

可选的,本实施例所提供的监控运维管理系统可以如图3所示,除了采集单元11(监控数据采集层)、分析单元12(监控信息分析层)和展示单元13(监控信息展示层),还可以包括其他支撑模块,如用户认证和授权模块(用户认证和权限认证)和邮件或短信模块(邮件、短信系统)。本实施例对此不受任何限制。

需要说明的是,对于运维管理模块20的中各单元间基于ITIL的流程可以如图4所示,监控运维平台展示系统故障或者向运维人员通知重大故障,运维管理人员通过主动发现或者通知对系统故障进行修复,对于普通问题,运维管理人员可以凭借自己的经验或者查阅系统知识库24对问题进行处理,如果不能处理则派单进入事件管理单元22流程流转,由事件处理组进行事件信息的配置项的关联,如果处理组处理不了则生成一个问题,进行问题管理单元23流程流转,有专家组进行问题处理;如果问题管理需要变更配置,那么需要流转到变更管理单元25流程流转;如果变更管理单元25处理需要进行配置的变更,需要流转到配置管理数据库26流程进行处理。最后将处理好的配置信息通过监控运维平台的用户统一入口模块展示,由发起人员核对事件是否解决,如果己解决,平台将所有的处理步骤和处理解决方案存入知识库,作为下次处理类似事件的共享知识。本实施例对此不受任何限制。

可以理解的是,对于运维管理模块20对监控运维管理系统的日常管理所包括的硬件资源状态动态反馈和网络状态在线检测等功能,可以通过与现有技术相似的方式实现,本实施例对此不受任何限制。

本实施例中,本发明实施例通过监控模块10中各单元的设置,可以更好的对基础资源信息进行监控和展示,通过运维管理模块20中各单元的设置,可以通过ITIL流程化规划对故障信息进行处理,通过设置用户操作统一入口模块30,可以使用户云数据中心的信息,通过各模块间的信息交互,达到了整合云数据中心的各种资源,借鉴优秀ITIL管理实践,并结合服务流程管理,有效指导云数据中心的监控运维管理系统的规范化的目的,提高了云平台的服务支持能力和水平,提升了用户体验度。

说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上对本发明所提供的基于ITIL的云数据中心的监控运维管理系统进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1