一种云平台基础架构监管系统的制作方法

文档序号:7999860阅读:216来源:国知局
一种云平台基础架构监管系统的制作方法
【专利摘要】本发明公开了一种云平台基础架构监管系统,包括:节点、组管理系统,用于创建和维护节点和组的列表;操作系统部署系统,用于对所述列表中新增的所述节点和组进行操作系统的安装;节点、组信息监控系统,用于实时监控所述列表中的所述节点和组的软硬件配置信息和运行状态;服务器报警系统,用于在已经部署好操作系统的所述节点和组上进行监控策略及告警策略的配置与执行。本发明的云平台基础架构监管系统将工作人员从原始的人工部署系统中解放出来,实现了新机上架后可以远程快速部署系统。此过程中不用人工参与。大量的减少了人力资源的耗费。
【专利说明】一种云平台基础架构监管系统

【技术领域】
[0001]本发明涉及服务器集群监控管理【技术领域】,尤其涉及一种云平台基础架构监管系统。

【背景技术】
[0002]现有的用于支持大型数据中心服务器的技术有IPMI (Intelligent PlatformManagement Interface)。IPMI是智能型平台管理接口。IPMI的信息通过基板管理控制器BMC (Baseboard Management Controller)传输。
[0003]Intel DCM(Intel Datacenter Manager)是 Intel 公司推出的数据中心管理平台。该平台可以根据服务器的优先级别动态分配电源,用实际测量到的数值来评估数据中心制冷设备和分析供电负载。其带来的实际价值是直接节省数据中心的能耗,并对数据中心中各节点进行有效的监控,管理和报表任务。DCM对于将要应用它的软件平台向上提供一系列的接口便于软件系统直接调用。
[0004]现有的数据中心管理平台系统有些可以实现如远程开关机等操作。如对节点实现监控,并进行告警。但并无一款独立的系统可以包含实现远程开关机,远程一键部署系统,智能节点监控告警。


【发明内容】

[0005]本发明的目的在于提供一种能够对数据中心的服务器进行从上架,组网,以及监控告警等一系列的操作以及后续的维护及服务,同时能进行服务器管理及能耗控制的云平台基础架构监管系统,从而解决现有技术中存在的前述问题。
[0006]为了实现上述目的,本发明采用的技术方案如下:
[0007]一种云平台基础架构监管系统,包括:
[0008]节点、组管理系统,用于创建和维护节点和组的列表;具体为:将自动发现的节点和组添加到所述列表中,还用于将手动创建的组添加到所述列表中;
[0009]操作系统部署系统,用于对所述列表中新增的所述节点和组进行操作系统的安装;还用于对已经在所述列表中且已经安装过操作系统但需要更换或更新操作系统的所述节点和组进行操作系统的安装;
[0010]节点、组信息监控系统,用于实时监控所述列表中的所述节点和组的软硬件配置信息和运行状态;
[0011]服务器报警系统,用于在已经部署好操作系统的所述节点和组上进行监控策略及告警策略的配置与执行。
[0012]优选的,还包括:
[0013]服务器智能能耗控制系统,用于对每个所述节点以及每个所述组进行智能能耗控制;
[0014]日志管理系统,用于对所述节点和组中的日志进行存储及备份,还用于对所述云平台基础架构管理系统的运行日志及用户操作日志进行存储及备份;还用于提供日志查询服务。
[0015]优选的,所述节点、组管理系统,包括:组管理模块、节点管理模块和节点自动发现模块;所述组管理模块用于创建、维护和管理组;所述节点管理模块用于对每一个节点或服务器进行管理,所述管理包括节点或服务器的添加或删除以及调整节点或服务器的组别;所述节点自动发现模块,用于当新服务器或新节点的IPMI 口已经接到交换机后,根据IPMI协议自动发现所述新服务器或新节点。
[0016]优选的,所述操作系统部署系统在部署操作系统时,底层基于Windows Server部署服务器进行部署。
[0017]优选的,所述节点、组信息监控系统,包括节点监控模块、组监控模块、节点信息获取模块和节点远程控制模块;所述节点监控模块,用于实时监控节点的性能信息、存储状态、能耗状态和告警信息;所述组监控模块,用于实时监测组的变化及所述组中的成员节点的操作系统类型、运行状态;所述节点信息获取模块,用于从底层接口获取所述节点的信息后并展示出来,所述节点的信息包括-.CPU信息、内存信息、主板B1S信息、风扇信息、进风口温度和网络信息;所述节点远程控制模块,用于对所述节点进行远程开关机操作和远程重启操作。
[0018]优选的,所述服务器报警系统,包括告警策略配置模块和策略执行模块;所述告警策略配置模块,用于在已经部署好操作系统的节点上或组上进行监控策略配置及告警策略配置;所述告警策略执行模块,用于执行所述监控策略及所述告警策略。
[0019]优选的,所述监控策略包括监控CPU利用率、内存利用率和进风口温度;所述告警策略包括判断所述CPU利用率和/或内存利用率和/或进风口温度是否达到预设阈值,如果达到或超过所述阈值则发出报警。
[0020]优选的,所述服务器智能能耗控制系统,包括智能功耗策略配置模块和智能功耗控制模块;所述智能功耗策略配置模块,用于创建和维护功耗策略以供所述智能功能控制模块使用;所述智能功耗控制模块用于依照所述功耗策略实时监控所述节点和组的功耗情况,当某一节点的功耗值达到或超过预设阈值时,则控制该节点减少其负载以降低功耗到所述预设阈值以下;所述智能功耗控制模块还用于将所述功耗策略中指定给某一服务器组的总功耗动态分配给该组中的每一台服务器或节点,以保证该组中的服务器或节点负载均衡。
[0021 ] 优选的,所述日志管理系统,包括DCM日志记录模块、操作日志记录模块、告警日志记录模块和日志查询模块;所述DCM日志记录模块,用于通过intel DCM提供的数据中心管理接口进行日志的提取与存储;所述操作日志记录模块,用于对所述的云平台基础架构监管系统的使用者的所有操作进行日志记录;所述告警日志记录模块,用于记录所有的告警信息;所述日志查询模块,用于为所述使用者提供对所有日志的查询服务。
[0022]优选的,所述节点为单台服务器或虚拟机,所述组包括二台以上服务器和/或二个以上节点。
[0023]本发明的有益效果是:
[0024]本发明的云平台基础架构监管系统将工作人员从原始的人工部署系统中解放出来,实现了新机上架后可以远程快速部署系统。此过程中不用人工参与。大量的减少了人力资源的耗费。本发明还提供了高效的管理数据中心中服务器的效果,能够有效控制能耗,保证服务器负载均衡,同时还可以针对运行情况及时报警,避免故障出现,提高了整个数据中心的可靠性。

【专利附图】

【附图说明】
[0025]图1是本发明的云平台基础架构监管系统的结构示意图;
[0026]图2是本发明的云平台基础架构监管系统在运行时的基本流程概述图;
[0027]图3是是本发明的云平台基础架构监管系统自身安装流程及发现服务器的过程示意图。

【具体实施方式】
[0028]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。应当理解,此处所描述的【具体实施方式】仅仅用以解释本发明,并不用于限定本发明。
[0029]如图1-2所示,本发明公开了一种云平台基础架构监管系统,包括:
[0030]节点、组管理系统,用于创建和维护节点和组的列表;具体为:将自动发现的节点和组添加到所述列表中,还用于将手动创建的组添加到所述列表中;所述节点、组管理系统,包括:组管理模块、节点管理模块和节点自动发现模块;所述组管理模块用于创建、维护和管理组;所述节点管理模块用于对每一个节点或服务器进行管理,所述管理包括节点或服务器的添加或删除以及调整节点或服务器的组别;所述节点自动发现模块,用于当新服务器或新节点的IPMI 口已经接到交换机后,根据IPMI协议自动发现所述新服务器或新节点。
[0031]操作系统部署系统,用于对所述列表中新增的所述节点和组进行操作系统的安装;还用于对已经在所述列表中且已经安装过操作系统但需要更换或更新操作系统的所述节点和组进行操作系统的安装;所述操作系统部署系统在部署操作系统时,底层基于Windows Server部署服务器进行部署。
[0032]节点、组信息监控系统,用于实时监控所述列表中的所述节点和组的软硬件配置信息和运行状态;所述节点、组信息监控系统,包括节点监控模块、组监控模块、节点信息获取模块和节点远程控制模块;所述节点监控模块,用于实时监控节点的性能信息、存储状态、能耗状态和告警信息;所述组监控模块,用于实时监测组的变化及所述组中的成员节点的操作系统类型、运行状态;所述节点信息获取模块,用于从底层接口获取所述节点的信息后并展示出来,所述节点的信息包括-.CPU信息、内存信息、主板B1S信息、风扇信息、进风口温度和网络信息;所述节点远程控制模块,用于对所述节点进行远程开关机操作和远程重启操作。
[0033]服务器报警系统,用于在已经部署好操作系统的所述节点和组上进行监控策略及告警策略的配置与执行;所述服务器报警系统,包括告警策略配置模块和策略执行模块;所述告警策略配置模块,用于在已经部署好操作系统的节点上或组上进行监控策略配置及告警策略配置;所述告警策略执行模块,用于执行所述监控策略及所述告警策略。
[0034]还可以包括:
[0035]服务器智能能耗控制系统,用于对每个所述节点以及每个所述组进行智能能耗控制;所述服务器智能能耗控制系统,包括智能功耗策略配置模块和智能功耗控制模块;所述智能功耗策略配置模块,用于创建和维护功耗策略以供所述智能功能控制模块使用;所述智能功耗控制模块用于依照所述功耗策略实时监控所述节点和组的功耗情况,当某一节点的功耗值达到或超过预设阈值时,则控制该节点减少其负载以降低功耗到所述预设阈值以下;所述智能功耗控制模块还用于将所述功耗策略中指定给某一服务器组的总功耗动态分配给该组中的每一台服务器或节点,以保证该组中的服务器或节点负载均衡;所述监控策略包括监控CPU利用率、内存利用率和进风口温度;所述告警策略包括判断所述CPU利用率和/或内存利用率和/或进风口温度是否达到预设阈值,如果达到或超过所述阈值则发出报警。
[0036]日志管理系统,用于对所述节点和组中的日志进行存储及备份,还用于对所述云平台基础架构管理系统的运行日志及用户操作日志进行存储及备份;还用于提供日志查询服务;所述日志管理系统,包括DCM日志记录模块、操作日志记录模块、告警日志记录模块和日志查询模块;所述DCM日志记录模块,用于通过intel DCM提供的数据中心管理接口进行日志的提取与存储;所述操作日志记录模块,用于对所述的云平台基础架构监管系统的使用者的所有操作进行日志记录;所述告警日志记录模块,用于记录所有的告警信息;所述日志查询模块,用于为所述使用者提供对所有日志的查询服务。所述节点为单台服务器,所述服务器组为由二台以上服务器组成的服务器组。
[0037]以下介绍本发明的云平台基础架构监管系统的初始化及部署流程:
[0038]I前期本发明的云平台基础架构监管系统安装准备。本发明的云平台基础架构监管系统需要提前装载在一台单独的服务器(例如:超云服务器R6240-G9)或PC机上,之后该台机器即可对数据中心中的节点进行一系列的远程操作或控制。
[0039]2新机上架。将待部署物理机放入机架,由数据中心工作人员将网线接通。其中一台交换机分别对应接到服务器四个节点中每个节点的IPMI通信网口。每个节点的另外一个LAN 口统一接到另外一台交换机。由本发明的云平台基础架构监管系统在远程进行新上架服务器的搜索。搜索完毕后新上架物理机可以批量添加至本发明的云平台基础架构监管系统中并进行后续的维护及管理。
[0040]3部署系统。在本发明的云平台基础架构监管系统中可以显示出已经添加的物理机的基本信息。就可以进行部署系统过程了,选择想要安装的操作系统,直接进行拖拽即可将待安装的操作系统一键部署至待部署节点。在部署过程中无需人工的干预即可完成部署任务。本发明的云平台基础架构监管系统支持部署市场上大多数操作系统如Windows,Linux, VMWare 虚拟机等。
[0041]4组创建。为已经成功添加到本发明的云平台基础架构监管系统中的节点设置组。组可以支持Rack, Row, Room, DataCenter以及Logical group。这样做方便数据中心中服务器的管理。也便于支持更好的能好控制。
[0042]5监控告警。在已经部署好操作系统的节点上或组上进行监控策略及告警策略配置。监控策略和告警策略可以配置在单节点上或组上。
[0043]本发明的云平台基础架构监管系统支持包括CPU利用率,内存利用率,进风口温度告警等告警项。在被管理节点触发了告警的条件时,比如某节点的CPU利用率为80%,该节点上设置的告警阈值为CPU利用率高于50%时告警。则本发明的云平台基础架构监管系统会显示告警信息,必要时会发送短信给数据中心相关人员。
[0044]6智能能耗控制。本发明的云平台基础架构监管系统可以对单个节点以及组进行智能能耗控制。如当某节点功耗超过300W时,用户此前已设定该节点功耗应小于280W。此时,本发明的云平台基础架构监管系统中的智能功耗控件发挥作用,将该节点功耗控制在280W以下。针对一组服务器,本发明的云平台基础架构监管系统可以直接对组进行功耗策略配置,如设定含有8个节点的一组服务器的功耗阈值为2000W。则本发明的云平台基础架构监管系统即可自动根据业务需求在不影响业务需求的前提下分配适当的功耗给组中的每个节点以保证负载均衡。
[0045]通过采用本发明公开的上述技术方案,得到了如下有益的效果:
[0046]本发明的云平台基础架构监管系统将工作人员从原始的人工部署系统中解放出来,实现了新机上架后可以远程快速部署系统。此过程中不用人工参与。大量的减少了人力资源的耗费。本发明还提供了高效的管理数据中心中服务器的效果,能够有效控制能耗,保证服务器负载均衡,同时还可以针对运行情况及时报警,避免故障出现,提高了整个数据中心的可靠性。
[0047]以上所述仅是本发明的优选实施方式,应当指出,对于本【技术领域】的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。
【权利要求】
1.一种云平台基础架构监管系统,其特征在于,包括: 节点、组管理系统,用于创建和维护节点和组的列表;具体为:将自动发现的节点和组添加到所述列表中,还用于将手动创建的组添加到所述列表中; 操作系统部署系统,用于对所述列表中新增的所述节点和组进行操作系统的安装;还用于对已经在所述列表中且已经安装过操作系统但需要更换或更新操作系统的所述节点和组进行操作系统的安装; 节点、组信息监控系统,用于实时监控所述列表中的所述节点和组的软硬件配置信息和运行状态; 服务器报警系统,用于在已经部署好操作系统的所述节点和组上进行监控策略及告警策略的配置与执行。
2.根据权利要求1所述的云平台基础架构监管系统,其特征在于,还包括: 服务器智能能耗控制系统,用于对每个所述节点以及每个所述组进行智能能耗控制; 日志管理系统,用于对所述节点和组中的日志进行存储及备份,还用于对所述云平台基础架构管理系统的运行日志及用户操作日志进行存储及备份;还用于提供日志查询服务。
3.根据权利要求1或2所述的云平台基础架构监管系统,其特征在于,所述节点、组管理系统,包括:组管理模块、节点管理模块和节点自动发现模块;所述组管理模块用于创建、维护和管理组;所述节点管理模块用于对每一个节点或服务器进行管理,所述管理包括节点或服务器的添加或删除以及调整节点或服务器的组别;所述节点自动发现模块,用于当新服务器或新节点的IPMI 口已经接到交换机后,根据IPMI协议自动发现所述新服务器或新节点。
4.根据权利要求1或2所述的云平台基础架构监管系统,其特征在于,所述操作系统部署系统在部署操作系统时,底层基于Windows Server部署服务器进行部署。
5.根据权利要求1或2所述的云平台基础架构监管系统,其特征在于,所述节点、组信息监控系统,包括节点监控模块、组监控模块、节点信息获取模块和节点远程控制模块;所述节点监控模块,用于实时监控节点的性能信息、存储状态、能耗状态和告警信息;所述组监控模块,用于实时监测组的变化及所述组中的成员节点的操作系统类型、运行状态;所述节点信息获取模块,用于从底层接口获取所述节点的信息后并展示出来,所述节点的信息包括:CPU信息、内存信息、主板B1S信息、风扇信息、进风口温度和网络信息;所述节点远程控制模块,用于对所述节点进行远程开关机操作和远程重启操作。
6.根据权利要求1或2所述的云平台基础架构监管系统,其特征在于,所述服务器报警系统,包括告警策略配置模块和策略执行模块;所述告警策略配置模块,用于在已经部署好操作系统的节点上或组上进行监控策略配置及告警策略配置;所述告警策略执行模块,用于执行所述监控策略及所述告警策略。
7.根据权利要求6所述的云平台基础架构监管系统,其特征在于,所述监控策略包括监控CPU利用率、内存利用率和进风口温度;所述告警策略包括判断所述CPU利用率和/或内存利用率和/或进风口温度是否达到预设阈值,如果达到或超过所述阈值则发出报警。
8.根据权利要求2所述的云平台基础架构监管系统,其特征在于,所述服务器智能能耗控制系统,包括智能功耗策略配置模块和智能功耗控制模块;所述智能功耗策略配置模块,用于创建和维护功耗策略以供所述智能功能控制模块使用;所述智能功耗控制模块用于依照所述功耗策略实时监控所述节点和组的功耗情况,当某一节点的功耗值达到或超过预设阈值时,则控制该节点减少其负载以降低功耗到所述预设阈值以下;所述智能功耗控制模块还用于将所述功耗策略中指定给某一服务器组的总功耗动态分配给该组中的每一台服务器或节点,以保证该组中的服务器或节点负载均衡。
9.根据权利要求2所述的云平台基础架构监管系统,其特征在于,所述日志管理系统,包括DCM日志记录模块、操作日志记录模块、告警日志记录模块和日志查询模块;所述DCM日志记录模块,用于通过intel DCM提供的数据中心管理接口进行日志的提取与存储;所述操作日志记录模块,用于对所述的云平台基础架构监管系统的使用者的所有操作进行日志记录;所述告警日志记录模块,用于记录所有的告警信息;所述日志查询模块,用于为所述使用者提供对所有日志的查询服务。
10.根据权利要求1或2所述的云平台基础架构监管系统,其特征在于,所述节点为单台服务器或虚拟机,所述组包括二台以上服务器和/或二个以上节点。
【文档编号】H04L29/08GK104184604SQ201310198963
【公开日】2014年12月3日 申请日期:2013年5月24日 优先权日:2013年5月24日
【发明者】徐荆, 李文华, 路伟, 张晓萌 申请人:北京天地超云科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1