一种云桌面系统的灾难恢复及动态迁移系统的制作方法

文档序号:11138311阅读:355来源:国知局
一种云桌面系统的灾难恢复及动态迁移系统的制造方法与工艺

本发明涉及云计算和云桌面领域,更具体地,涉及一种云桌面系统的灾难恢复及动态迁移系统。



背景技术:

随着云桌面技术的普及,云桌面具有随时随地均可访问,能动态配置等特点促使越来越多的中小企业将员工的办公环境迁往云桌面。为了保持云桌面的可持续服务,中小企业往往需要投入双倍的硬件资源来使得一个云桌面能在两个不同的服务器上进行相互同步,并在一个云桌面服务中断时能及时切换到另外一个同步的云桌面上继续进行服务。但是在这种模式下,中小企业虽然能享受云计算所带来的好处,但是企业需要承受高昂的成本。这是中小企业往往所无法承受的。

在现有的解决方案中,均是使用双桌面互同步的方案来确保云桌面的可持续服务。在这种技术下,企业往往需要投入双倍的硬件资源。该技术的成本问题往往令中小企业望而却步。



技术实现要素:

本发明提供一种云桌面系统的灾难恢复及动态迁移系统,该系统可实现当桌面所在机器出现故障时,故障机器上的桌面能被撤离到其他正常运行的服务器上,同时在正常运作的机器上还能实现动态负载均衡。

为了达到上述技术效果,本发明的技术方案如下:

一种云桌面系统的灾难恢复及动态迁移系统,包括:

迁移管理模块,提供整机一键迁移,桌面批量迁移,单个桌面迁移,集群机器状态查询,机器是否为备用机器的设置;

集群机器状态实时监控模块,通过代理的方式实时监测集群中各机器的网络状态、服务状态,负载状态,以供故障判别及动态负载均衡处理策略参考;

实时灾难恢复及动态迁移模块,负责在出现服务器故障时自动进行故障判别,执行故障处理措施并及时通知管理员故障的发生以及在出现服务器负载不均衡时根据服务器的当前负载状态执行负载均衡策略。

进一步地,所述迁移管理模块包括:

1)整机一键迁移单元:用于管理员选择某一主机,发起一键迁移请求,管理系统根据迁移策略将主机上的所有云桌面迁移或撤离到其他合适的主机上;

2)桌面批量迁移单元:用于管理员选择多个桌面进行迁移,迁移前由用户选择适当的一台主机或多台主机,管理系统根据管理员提供的主机信息和系统的迁移策略将所选择的桌面迁移或撤离到所选择的主机上;

3)单个桌面迁移单元:用于管理系统根据迁移策略将该桌面迁移到负载最小的主机上或由用户指定目的主机,管理系统将该桌面迁移或撤离到目的主机上;

4)集群机器状态查询单元:用于管理员查看集群机器的实时健康状况;

5)备用机器设置单元:用于是否设置机器为备用极,机器设置为备用机器后,主机不参与新建云桌面的调度中,只能保留为应急使用。

进一步地,所述集群机器状态实时监控模块由管理系统的机器状态监控数据接收器和处于各机器上的监控代理组成,机器状态监控数据接收器负责接收由监控代理反馈的监控数据,并修改管理系统上保存的机器状态信息,根据机器状态信息触发动态迁移;处于各机器上的监控代理负责收集机器上的运行状态并定期发送给接收器;接收器和监控代理之间保持网络连接,以便于接收器诊断网络状态,触发灾难恢复策略,确保云桌面提供持续服务。

进一步地,所述实时灾难恢复及动态迁移模块包括:

灾难恢复执行器:负责将一台处于故障机器上的云桌面在其他正常运行的机器上进行重建;

在线迁移执行器:负责将一台处于正常运行的机器上的云桌面无中断地热迁移到其他正常运行的机器上,继续提供服务;

迁移或撤离计算模块:根据监控信息对桌面选择负载最小的主机进行迁移或撤离。

进一步地,所述集群机器健康状态包括:访问网络状态,管理网络状态以及计算服务状态。

进一步地,所述集群机器的运行状态包括当前机器的负载,机器的处理器核心总数,机器的内存总数,当前机器上所有运行的云桌面所使用的虚拟CPU数,当前机器上所有运行的云桌面所占用的虚拟内存总数。

进一步地,所述迁移或撤离计算模块的计算过程包括以下步骤:

a)实时灾难恢复及动态迁移模块接收并诊断由监控模块提供的机器状态信息;

b)实时灾难恢复及动态迁移模块判断机器的相关服务状态是否健康,如访问网络状态,管理网络状态,计算服务状态;

c)如果机器的相关服务状态不健康,则按情况判断需采用的故障动作;

d)如果访问网络状态正常,管理网络状态正常,计算服务状态异常,则发邮件或短信向管理员告警;

e)如果访问网络状态正常,管理网络状态异常,计算服务状态正常,则发邮件或短信向管理员告警;

f)如果访问网络状态正常,管理网络状态异常,计算服务状态异常,则发邮件或短信向管理员告警;

g)如果访问网络状态异常,管理网络状态正常,计算服务状态正常,则发邮件或短信向管理员告警,并将该主机上的云桌面迁移到其他负载小的机器上;

h)如果访问网络状态异常,管理网络状态正常,计算服务状态异常,则发邮件或短信向管理员告警,并将该主机上的云桌面撤离到其他负载小的机器上;

i)如果访问网络状态异常,管理网络状态异常,计算服务状态正常,则发邮件或短信向管理员告警,等待计算服务状态异常,并将该主机上的云桌面撤离到其他负载小的机器上;

j)如果访问网络状态异常,管理网络状态异常,计算服务状态异常,则发邮件或短信向管理员告警,并将该主机上的云桌面撤离到其他负载小的机器上;

k)如果机器的相关服务状态健康,则判断该机器的负载是否高于半数集群中的机器负载;

l)如果该机器的负载高于半数集群中的机器的负载,则选择部分云桌面迁移到其他负载较小的机器上;

m)如果该机器的负载不高于半数集群中的机器的负载,则不作任何处理。

与现有技术相比,本发明技术方案的有益效果是:

本发明能有效地在缺乏大量冗余硬件资源的情况下出现故障时能及时恢复问题主机上的云桌面的对外服务能力;在机器健康的情况下能动态地平衡机器的负载,提供更优质的桌面体验。

附图说明

图1为本发明系统的总体架构图;

图2为本发明迁移或撤离计算模块的计算过程流程图。

具体实施方式

附图仅用于示例性说明,不能理解为对本专利的限制;

为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;

对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。

下面结合附图和实施例对本发明的技术方案做进一步的说明。

实施例1

如图1所示,一种云桌面系统的灾难恢复及动态迁移系统,包括:

迁移管理模块,提供整机一键迁移,桌面批量迁移,单个桌面迁移,集群机器状态查询,机器是否为备用机器的设置;

集群机器状态实时监控模块,通过代理的方式实时监测集群中各机器的网络状态、服务状态,负载状态,以供故障判别及动态负载均衡处理策略参考;

实时灾难恢复及动态迁移模块,负责在出现服务器故障时自动进行故障判别,执行故障处理措施并及时通知管理员故障的发生以及在出现服务器负载不均衡时根据服务器的当前负载状态执行负载均衡策略。

迁移管理模块包括:

1)整机一键迁移单元:用于管理员选择某一主机,发起一键迁移请求,管理系统根据迁移策略将主机上的所有云桌面迁移或撤离到其他合适的主机上;

2)桌面批量迁移单元:用于管理员选择多个桌面进行迁移,迁移前由用户选择适当的一台主机或多台主机,管理系统根据管理员提供的主机信息和系统的迁移策略将所选择的桌面迁移或撤离到所选择的主机上;

3)单个桌面迁移单元:用于管理系统根据迁移策略将该桌面迁移到负载最小的主机上或由用户指定目的主机,管理系统将该桌面迁移或撤离到目的主机上;

4)集群机器状态查询单元:用于管理员查看集群机器的实时健康状况;

5)备用机器设置单元:用于是否设置机器为备用极,机器设置为备用机器后,主机不参与新建云桌面的调度中,只能保留为应急使用。

集群机器状态实时监控模块由管理系统的机器状态监控数据接收器和处于各机器上的监控代理组成,机器状态监控数据接收器负责接收由监控代理反馈的监控数据,并修改管理系统上保存的机器状态信息,根据机器状态信息触发动态迁移;处于各机器上的监控代理负责收集机器上的运行状态并定期发送给接收器;接收器和监控代理之间保持网络连接,以便于接收器诊断网络状态,触发灾难恢复策略,确保云桌面提供持续服务。

实时灾难恢复及动态迁移模块包括:

灾难恢复执行器:负责将一台处于故障机器上的云桌面在其他正常运行的机器上进行重建;

在线迁移执行器:负责将一台处于正常运行的机器上的云桌面无中断地热迁移到其他正常运行的机器上,继续提供服务;

迁移或撤离计算模块:根据监控信息对桌面选择负载最小的主机进行迁移或撤离。

集群机器健康状态包括:访问网络状态,管理网络状态以及计算服务状态;集群机器的运行状态包括当前机器的负载,机器的处理器核心总数,机器的内存总数,当前机器上所有运行的云桌面所使用的虚拟CPU数,当前机器上所有运行的云桌面所占用的虚拟内存总数。

如图2所示,迁移或撤离计算模块的计算过程包括以下步骤:

a)实时灾难恢复及动态迁移模块接收并诊断由监控模块提供的机器状态信息;

b)实时灾难恢复及动态迁移模块判断机器的相关服务状态是否健康,如访问网络状态,管理网络状态,计算服务状态;

c)如果机器的相关服务状态不健康,则按情况判断需采用的故障动作;

d)如果访问网络状态正常,管理网络状态正常,计算服务状态异常,则发邮件或短信向管理员告警;

e)如果访问网络状态正常,管理网络状态异常,计算服务状态正常,则发邮件或短信向管理员告警;

f)如果访问网络状态正常,管理网络状态异常,计算服务状态异常,则发邮件或短信向管理员告警;

g)如果访问网络状态异常,管理网络状态正常,计算服务状态正常,则发邮件或短信向管理员告警,并将该主机上的云桌面迁移到其他负载小的机器上;

h)如果访问网络状态异常,管理网络状态正常,计算服务状态异常,则发邮件或短信向管理员告警,并将该主机上的云桌面撤离到其他负载小的机器上;

i)如果访问网络状态异常,管理网络状态异常,计算服务状态正常,则发邮件或短信向管理员告警,等待计算服务状态异常,并将该主机上的云桌面撤离到其他负载小的机器上;

j)如果访问网络状态异常,管理网络状态异常,计算服务状态异常,则发邮件或短信向管理员告警,并将该主机上的云桌面撤离到其他负载小的机器上;

k)如果机器的相关服务状态健康,则判断该机器的负载是否高于半数集群中的机器负载;

l)如果该机器的负载高于半数集群中的机器的负载,则选择部分云桌面迁移到其他负载较小的机器上;

m)如果该机器的负载不高于半数集群中的机器的负载,则不作任何处理。

相同或相似的标号对应相同或相似的部件;

附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制;

显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1