云数据中心故障管理方法和装置制造方法

文档序号:7810044阅读:210来源:国知局
云数据中心故障管理方法和装置制造方法
【专利摘要】本发明提供了一种云数据中心故障管理方法和系统,其中方法包括:组织管理服务器接收用户终端提交的故障信息,判断是否能确定与故障信息对应的组织管理故障类型;若能够确定与故障信息对应的组织管理故障类型,则组织管理服务器根据组织管理故障类型对故障进行修复;若不能确定与故障信息对应的组织管理故障类型,则组织管理服务器将故障信息发送给系统管理服务器,系统管理服务器根据故障信息确定系统管理故障类型,并根据所述系统管理故障类型对故障进行修复。本发明能够对故障进行及时处理,使系统资源有效使用。
【专利说明】云数据中心故障管理方法和装置

【技术领域】
[0001]本发明涉及云计算【技术领域】,尤其涉及一种云数据中心故障管理方法和装置。

【背景技术】
[0002]随着云计算技术的不断成熟,云计算逐步成为业界的发展热点。云数据中心操作系统是数据中心完成从硬件到资源池转换的唯一方案,将大量的异构设备融合为标准统一的逻辑资源池,动态调度给云应用,完成对终端的服务。同时,云数据中心操作系统也承担着对上接口应用、对下调度管理硬件的中间功能,是链接硬件与应用的唯一链路,处于核心地位,对于应用系统、硬件等技术指标具有决定性影响。
[0003]云海操作系统是完整的云数据中心解决方案,以套件的形式覆盖了云数据中心的所有需求,系统包括交互层、平台管理层、资源虚拟化层三层架构,其中交互层功能由
实现,分为管理员界面和用户界面,不同的角色使用统一的平台实现资源服务;平台管理层由资源池调度(1(31011(115111518610、资源管理(10680111^615111518610、统计计费(1(?犯'阴)、自助服务(136^1(36)等功能模块组成;资源虚拟化层由传统的服务器虚拟化软件承载,实现物理资源的虚拟化。
[0004]在云海操作系统中,虚拟机及网络的虚拟机资源在使用过程中可能会出现一些故障,如网络不可用,或者虚拟机无法开机等问题,但是由于资源的访问限制,用户无法解决故障,从而导致系统资源不能有效使用。


【发明内容】

[0005]为了解决上述技术问题,本发明提供了一种云数据中心故障管理方法和装置,能够对故障进行及时处理,使系统资源有效使用。
[0006]为了达到本发明目的,本发明提供了一种云数据中心故障管理方法,包括:组织管理服务器接收用户终端提交的故障信息,判断是否能确定与故障信息对应的组织管理故障类型;若能够确定与故障信息对应的组织管理故障类型,则组织管理服务器根据组织管理故障类型对故障进行修复;若不能确定与故障信息对应的组织管理故障类型,则组织管理服务器将故障信息发送给系统管理服务器,系统管理服务器根据故障信息确定系统管理故障类型,并根据所述系统管理故障类型对故障进行修复。
[0007]进一步地,该方法还包括:组织管理服务器预先设置组织管理故障类型集,组织管理服务器根据需求对组织管理故障类型集进行修改;系统管理服务器预先设置系统管理故障类型集,系统管理服务器根据需求对系统管理故障类型集进行修改。
[0008]进一步地,组织管理服务器接收用户终端提交的故障信息,判断是否能确定与所述故障信息对应的组织管理故障类型,包括:组织管理服务器接收用户终端提交的故障信息,将故障信息和预先设置的组织管理故障类型集进行比对,判断是否能确定与故障信息对应的组织管理故障类型;如果组织管理故障类型集中存在与故障信息对应的组织管理故障类型,则判断出能够确定与故障信息对应的组织管理故障类型;如果组织管理故障类型集中不存在与故障信息对应的组织管理故障类型,则判断出不能确定与故障信息对应的组织管理故障类型。
[0009]进一步地,该方法还包括:记录组织管理故障修复的状态,组织管理故障修复的状态包括故障信息提交、故障信息转移、故障正在处理、故障已解决或故障关闭;和/或,记录系统管理故障修复的状态,系统管理故障修复的状态包括故障信息提交、故障正在处理、故障已解决或故障关闭。
[0010]本发明提供了一种云数据中心故障管理系统,包括:用户终端,用于向组织管理服务器发送故障信息;组织管理服务器,用于接收用户终端提交的故障信息,判断是否能确定与故障信息对应的组织管理故障类型,若能够确定与故障信息对应的组织管理故障类型,则组织管理服务器根据组织管理故障类型对故障进行修复,若不能确定与故障信息对应的组织管理故障类型,则组织管理服务器将故障信息发送给系统管理服务器;系统管理服务器,用于接收来自组织管理服务器的故障信息,根据故障信息确定系统管理故障类型,并根据系统管理故障类型对故障进行修复。
[0011]进一步地,组织管理服务器,还用于:预先设置组织管理故障类型集,根据需求对组织管理故障类型集进行修改;系统管理服务器,还用于:预先设置系统管理故障类型集,根据需求对系统管理故障类型集进行修改。
[0012]进一步地,组织管理服务器,具体用于:接收用户终端提交的故障信息,将故障信息和预先设置的组织管理故障类型集进行比对,判断是否能确定与故障信息对应的组织管理故障类型;如果组织管理故障类型集中存在与故障信息对应的组织管理故障类型,则判断出能够确定与故障信息对应的组织管理故障类型;如果组织管理故障类型集中不存在与故障信息对应的组织管理故障类型,则判断出不能确定与故障信息对应的组织管理故障类型。
[0013]进一步地,组织管理服务器,还用于:记录组织管理故障修复的状态,组织管理故障修复的状态包括故障信息提交、故障信息转移、故障正在处理、故障已解决或故障关闭;系统管理服务器,还用于:记录系统管理故障修复的状态,系统管理故障修复的状态包括故障信息提交、故障正在处理、故障已解决或故障关闭。
[0014]与现有技术相比,本发明包括:组织管理服务器接收用户终端提交的故障信息,判断是否能确定与故障信息对应的组织管理故障类型;若能够确定与故障信息对应的组织管理故障类型,则组织管理服务器根据组织管理故障类型对故障进行修复;若不能确定与故障信息对应的组织管理故障类型,则组织管理服务器将故障信息发送给系统管理服务器,系统管理服务器根据故障信息确定系统管理故障类型,并根据所述系统管理故障类型对故障进行修复。本发明在用户发现故障后,通过用户终端及时向组织管理服务器发送故障信息,组织管理服务器根据故障信息确定故障类型,或者组织管理服务器转发给系统管理服务器确定故障类型,组织管理服务器或者系统管理服务器根据故障类型对故障进行修复,由此能够对故障进行及时处理,使系统资源有效使用。

【专利附图】

【附图说明】
[0015]图1是本发明云数据中心故障管理方法的流程示意图。
[0016]图2是本发明云数据中心故障管理装置的结构示意图。

【具体实施方式】
[0017]以下将结合附图所示的【具体实施方式】对本发明进行详细描述。
[0018]在云海操作系统中,云数据中心的角色分别是系统管理员、组织管理员和用户。系统管理员管理整个基础架构,将统一的数据中心资源划分成多个云数据中心,由组织管理员管理。组织管理员将分支机构的云数据中心交付给不同的用户需求。系统管理员、组织管理员和用户分别通过系统管理服务器、组织管理服务器和用户终端进行通信。
[0019]图1是本发明云数据中心故障管理方法的流程示意图,如图1所示,包括:
[0020]步骤11,组织管理服务器预先设置组织管理故障类型集,系统管理服务器预先设置系统管理故障类型集;
[0021]在本步骤中,由于组织管理服务器和系统管理服务器所使用的虚拟资源不相同,所以组织管理服务器和系统管理服务器分别设置自己的故障类型集,该故障类型集可以包括网络不可用,或者虚拟机无法开机等故障类型。
[0022]组织管理服务器和系统管理服务器可以根据需求对设置的故障类型集进行修改,例如增加或删除某种故障类型。
[0023]步骤12,组织管理服务器接收用户终端提交的故障信息,判断是否能确定与该故障信息对应的组织管理故障类型,如果能,进入步骤13 ;如果不能,进入步骤14。
[0024]在本步骤中,若用户发现故障,可以通过用户终端向组织管理服务器提交故障信息,组织管理服务器将故障信息和预先设置的组织管理故障类型集进行比对,判断是否能确定与该故障信息对应的组织管理故障类型。
[0025]步骤13,若能够确定与该故障信息对应的组织管理故障类型,则组织管理服务器根据该组织管理故障类型对故障进行修复。
[0026]在本步骤中,如果组织管理故障类型集中存在与该故障信息对应的组织管理故障类型,则判断出能够确定与该故障信息对应的组织管理故障类型。
[0027]组织管理服务器根据该组织管理故障类型对故障进行修复,并记录该组织管理故障修复的状态,例如故障信息提交、故障信息转移、故障正在处理、故障已解决或故障关闭,以便用户可以向组织管理服务器查看故障处理的状态。
[0028]步骤14,若不能确定与该故障信息对应的组织管理故障类型,则组织管理服务器将故障信息发送给系统管理服务器。
[0029]在本步骤中,如果组织管理故障类型集中不存在与该故障信息对应的组织管理故障类型,则判断出不能确定与该故障信息对应的组织管理故障类型。
[0030]步骤15,系统管理服务器将故障信息和预先设置的系统管理故障类型集进行比对,确定与该故障信息对应的系统管理故障类型,并根据该系统管理故障类型对故障进行修复。
[0031]在本步骤中,系统管理服务器根据该系统管理故障类型对故障进行修复,并记录该系统管理故障修复的状态,例如故障信息提交、故障正在处理、故障已解决或故障关闭,以便用户可以向系统管理服务器查看故障处理的状态。
[0032]本发明在用户发现故障后,通过用户终端及时向组织管理服务器发送故障信息,组织管理服务器根据故障信息确定故障类型,或者组织管理服务器转发给系统管理服务器确定故障类型,组织管理服务器或者系统管理服务器根据故障类型对故障进行修复,由此能够对故障进行及时处理,使系统资源有效使用。
[0033]图2是本发明云数据中心故障管理系统的结构示意图,如图2所示,包括:
[0034]用户终端,用于向组织管理服务器发送故障信息;
[0035]组织管理服务器,用于预先设置组织管理故障类型集;接收用户终端提交的故障信息,判断是否能确定与该故障信息对应的组织管理故障类型;若能够确定与该故障信息对应的组织管理故障类型,则根据该组织管理故障类型对故障进行修复;若不能确定与该故障信息对应的组织管理故障类型,则将故障信息发送给系统管理服务器;
[0036]系统管理服务器,用于预先设置系统管理故障类型集;接收来自组织管理服务器的故障信息,将故障信息和预先设置的系统管理故障类型集进行比对,确定与该故障信息对应的系统管理故障类型,并根据该系统管理故障类型对故障进行修复。
[0037]其中,组织管理服务器和系统管理服务器可以根据需求对设置的故障类型集进行修改,例如增加或删除某种故障类型。
[0038]其中,组织管理服务器将故障信息和预先设置的组织管理故障类型集进行比对,判断是否能确定与该故障信息对应的组织管理故障类型。如果组织管理故障类型集中存在与该故障信息对应的组织管理故障类型,则判断出能够确定与该故障信息对应的组织管理故障类型,组织管理服务器根据该组织管理故障类型对故障进行修复,并记录该故障修复的状态,例如故障信息提交、故障信息转移、故障正在处理、故障已解决或故障关闭,以便用户可以向组织管理服务器查看故障处理的状态。如果组织管理故障类型集中不存在与该故障信息对应的组织管理故障类型,则判断出不能确定与该故障信息对应的组织管理故障类型。
[0039]其中,系统管理服务器根据该系统管理故障类型对故障进行修复,并记录该故障修复的状态,例如故障信息提交、故障正在处理、故障已解决或故障关闭,以便用户可以向系统管理服务器查看故障处理的状态。
[0040]本发明在用户发现故障后,通过用户终端及时向组织管理服务器发送故障信息,组织管理服务器根据故障信息确定故障类型,或者组织管理服务器转发给系统管理服务器确定故障类型,组织管理服务器或者系统管理服务器根据故障类型对故障进行修复,由此能够对故障进行及时处理,使系统资源有效使用。
[0041]应当理解,虽然本说明书根据实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施方式中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
[0042]上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用于限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。
【权利要求】
1.一种云数据中心故障管理方法,其特征在于,包括: 组织管理服务器接收用户终端提交的故障信息,判断是否能确定与所述故障信息对应的组织管理故障类型; 若能够确定与所述故障信息对应的组织管理故障类型,则组织管理服务器根据所述组织管理故障类型对故障进行修复; 若不能确定与所述故障信息对应的组织管理故障类型,则组织管理服务器将故障信息发送给系统管理服务器,系统管理服务器根据所述故障信息确定系统管理故障类型,并根据所述系统管理故障类型对故障进行修复。
2.根据权利要求1所述的云数据中心故障管理方法,其特征在于,该方法还包括: 组织管理服务器预先设置组织管理故障类型集,所述组织管理服务器根据需求对组织管理故障类型集进行修改; 系统管理服务器预先设置系统管理故障类型集,所述系统管理服务器根据需求对系统管理故障类型集进行修改。
3.根据权利要求2所述的云数据中心故障管理方法,其特征在于,所述组织管理服务器接收用户终端提交的故障信息,判断是否能确定与所述故障信息对应的组织管理故障类型,包括: 组织管理服务器接收用户终端提交的故障信息,将故障信息和预先设置的组织管理故障类型集进行比对,判断是否能确定与所述故障信息对应的组织管理故障类型; 如果组织管理故障类型集中存在与所述故障信息对应的组织管理故障类型,则判断出能够确定与所述故障信息对应的组织管理故障类型; 如果组织管理故障类型集中不存在与所述故障信息对应的组织管理故障类型,则判断出不能确定与所述故障信息对应的组织管理故障类型。
4.根据权利要求1所述的云数据中心故障管理方法,其特征在于,该方法还包括: 记录组织管理故障修复的状态,所述组织管理故障修复的状态包括故障信息提交、故障信息转移、故障正在处理、故障已解决或故障关闭;和/或, 记录系统管理故障修复的状态,所述系统管理故障修复的状态包括故障信息提交、故障正在处理、故障已解决或故障关闭。
5.一种云数据中心故障管理系统,其特征在于,包括: 用户终端,用于向组织管理服务器发送故障信息; 组织管理服务器,用于接收用户终端提交的故障信息,判断是否能确定与所述故障信息对应的组织管理故障类型,若能够确定与所述故障信息对应的组织管理故障类型,则组织管理服务器根据所述组织管理故障类型对故障进行修复,若不能确定与所述故障信息对应的组织管理故障类型,则组织管理服务器将故障信息发送给系统管理服务器; 系统管理服务器,用于接收来自组织管理服务器的故障信息,根据所述故障信息确定系统管理故障类型,并根据所述系统管理故障类型对故障进行修复。
6.根据权利要求5所述的云数据中心故障管理系统,其特征在于,所述组织管理服务器,还用于:预先设置组织管理故障类型集,根据需求对组织管理故障类型集进行修改; 所述系统管理服务器,还用于:预先设置系统管理故障类型集,根据需求对系统管理故障类型集进行修改。
7.根据权利要求6所述的云数据中心故障管理系统,其特征在于,所述组织管理服务器,具体用于:接收用户终端提交的故障信息,将故障信息和预先设置的组织管理故障类型集进行比对,判断是否能确定与所述故障信息对应的组织管理故障类型; 如果组织管理故障类型集中存在与所述故障信息对应的组织管理故障类型,则判断出能够确定与所述故障信息对应的组织管理故障类型; 如果组织管理故障类型集中不存在与所述故障信息对应的组织管理故障类型,则判断出不能确定与所述故障信息对应的组织管理故障类型。
8.根据权利要求6所述的云数据中心故障管理系统,其特征在于,所述组织管理服务器,还用于:记录组织管理故障修复的状态,所述组织管理故障修复的状态包括故障信息提交、故障信息转移、故障正在处理、故障已解决或故障关闭; 所述系统管理服务器,还用于:记录系统管理故障修复的状态,所述系统管理故障修复的状态包括故障信息提交、故障正在处理、故障已解决或故障关闭。
【文档编号】H04L12/24GK104333459SQ201410363945
【公开日】2015年2月4日 申请日期:2014年7月28日 优先权日:2014年7月28日
【发明者】陈光新, 朱波 申请人:浪潮(北京)电子信息产业有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1