支持多云生产环境的容灾方法及系统与流程

文档序号:30849126发布日期:2022-07-23 04:56阅读:162来源:国知局
支持多云生产环境的容灾方法及系统与流程

1.本发明涉及云存储领域,具体而言,涉及一种支持多云生产环境的容灾方法及系统。


背景技术:

2.现有技术提供了一种实现云服务产品主备容灾的方法,该方法将主备数据中心的机器做成一个容器集群,在主数据中心部署所有产品组件,在备数据中心部署租户关键业务组件,租户关键业务组件在主备数据中心同时运行;租户业务访问负载均衡,负载均衡分发业务流量到主数据中心,当主数据中心不能提供服务时,切换到备数据中心,当主数据中心修复后,业务切回到主数据中心。该实现云服务产品主备容灾的方法,当服务产品所在数据中心由于不可抗拒因素不能提供服务时,能够实现主数据中心与备数据中心的快速切换。
3.该技术方案更接近是一种部署策略,本质是业务应用在不同数据中心的部分冗余部署,更多的是起到负载均衡的作用。因备用数据中心只部署了关键业务组件,备用数据中心在主数据中心不能提供服务时,实际上并不能做到整个业务应用的容灾。因备用生产环境不具有主数据中心的全部功能及数据,不能真正起到容灾的效果。同时,该方案也未采用智能相关技术或实现手段。
4.现有技术还提供了另一种容灾方法、系统和装置,该方法能够获取待容灾的云应用的第一描述信息,该描述信息包括所述待容灾的云应用在生产站点所使用的源虚拟机的信息和源网络的信息,基于这种从整体上对待容灾的云应用进行描述的第一描述信息,可以生成所述待容灾的云应用在容灾站点的第二描述信息,该第二描述信息从整体上对所述待容灾的云应用在容灾站点的部署进行了描述,所述容灾站点能够获取所述第二描述信息,在所述容灾站点中恢复所述待容灾的云应用,实现了基于云应用的容灾。
5.该方案本质上是获取待容灾云应用的虚拟机、网络及部署描述信息,再利用这些描述信息在容灾站点对待容灾云应用进行重建,从而达到容灾目标。该方法的容灾对象或粒度局限于虚拟机,本质上是虚拟机的复制和配置,缺少灵活性且不具有普遍一般性。同时,该方案也未采用智能相关技术或实现手段。
6.现有技术还提供了一种容灾系统创建方法,在该方法中,创建分布于不同云平台的均具备纳管功能的多个数据中心,并创建包含多个存储节点的用于保存业务数据的存储集群,从多个数据中心中确定出目标数据中心,为目标数据中心创建一个与容灾云主机规格需求相符的云硬盘,在目标数据中心创建用于作为主设备的目标云主机,分别利用其余每个数据中心的纳管功能对云硬盘进行纳管,以建立其余数据中心对云硬盘的管理权限,并在其余数据中心分别创建与目标云主机的规格相一致的用于作为从设备的云主机。
7.该方案将业务数据进行同步至多个数据中心云硬盘,在发生灾难时,将业务应用部署至其他数据中心并连接至备用云硬盘,达到云应用容灾的目的。该方案本质是存储备份系统与备份业务应用分离。此外,该方案也未采用智能相关技术或实现手段。
8.针对上述的问题,目前尚未提出有效的解决方案。


技术实现要素:

9.本发明实施例提供了一种支持多云生产环境的容灾方法及系统,以至少解决相关技术中容灾过程不够智能化的技术问题。
10.根据本发明实施例的一个方面,提供了一种支持多云生产环境的容灾方法,包括:在接收到容灾指令之后,基于业务规则和所获取的生产对象描述信息,进行容灾策略编排,生成容灾策略,其中,所述生产对象描述信息用于描述待容灾的云应用的生产环境;根据所述容灾策略,执行容灾操作,其中,所述容灾操作包括以下至少之一:数据的备份和/或恢复、生产环境迁移和/或重建,dns切换和/或回切以及生产环境的状态采集和监控。
11.根据本发明实施例的另一方面,还提供了一种支持多云生产环境的容灾系统,包括:策略编排单元,被配置为:在接收到容灾指令之后,基于业务规则和所获取的生产对象描述信息,进行容灾策略编排,生成容灾策略,其中,所述生产对象描述信息用于描述待容灾的云应用的生产环境;容灾执行单元,被配置为:根据所述容灾策略,执行容灾操作,其中,所述容灾操作包括以下至少之一:数据的备份和/或恢复、生产环境迁移和/或重建,dns切换和/或回切以及生产环境的状态采集和监控。
12.在本发明实施例中,借助机器学习等技术或手段,使得整个容灾过程更加智能化自动化,从而解决了相关技术中容灾过程不够智能化的技术问题。
附图说明
13.此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:图1是根据本发明实施例的一种支持多云生产环境的容灾方法;图2是根据本发明实施例的另一种支持多云生产环境的容灾方法;图3是根据本发明实施例的构建和训练应用模型的方法;图4是根据本发明实施例的又一种支持多云生产环境的容灾方法;图5是根据本发明实施例的一种智能化的支持多云生产环境的容灾方法;图6是根据本发明实施例的一种支持多云生产环境的容灾系统的结构示意图;图7是根据本发明实施例的容灾执行单元的结构示意图;图8是根据本发明实施例的一种容灾系统部署的示意图;图9是根据本发明实施例的另一种容灾系统部署的示意图;图10是根据本发明实施例的又一种容灾系统部署的示意图。
具体实施方式
14.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
15.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
16.术语解释本技术中以下术语的含义如下:私有云:是将云基础设施与软硬件资源建立在防火墙内,以供机构或企业内各部门共享数据中心内的资源。私有云是完全为特定组织而运作的云端基础设施。
17.公有云:是第三方提供给个人、机构或企业使用的云端基础设施,通常以租借方式出售云端服务供客戶使用的云端服务。
18.混合云:由两个或更多云端系统组成云端基础设施,这些云端系统包含私有云、社区云、公用云等。
19.多云生产环境:本技术中特指部署在组织内部的私有云、公有云、混合云上的生产环境,包括连同业务应用在内的软件运行环境。其中,生产环境内部的业务应用可以是一个或多个。
20.容灾:容灾是指为保障业务的连续性,在主生产环境及其业务应用发生短时间内无法修复的故障时,将业务流量导入到备用生产环境中的一次业务活动。其中,备用生产环境及其业务应用是预先准备好的,或根据业务需要按需、弹性创建的。
21.实施例1根据本发明实施例,提供了一种支持多云生产环境的容灾方法,如图1所示,该方法包括:步骤s102,在接收到容灾指令之后,基于业务规则和所获取的生产对象描述信息,进行容灾策略编排,生成容灾策略,其中,所述生产对象描述信息用于描述待容灾的云应用的生产环境;步骤s104,根据所述容灾策略,执行容灾操作,其中,所述容灾操作包括以下至少之一:数据的备份和/或恢复、生产环境迁移和/或重建,dns切换和/或回切以及生产环境的状态采集和监控。
22.在一个示例性实施例中,在接收到容灾指令之前,所述方法还包括:周期性地扫描部署于私有云、公有云或混合云的生产环境,基于深度机器学习而构建的应用模型对所述生产环境的生成对象进行识别,以获取所述生产对象描述信息。
23.在一个示例性实施例中,通过以下方法构建并训练所述应用模型:对采集到的不同生产环境中的样本生产对象数据按对象类型进行标记;对所述样本生产对象数据进行预处理,所述预处理包括以下至少之一:归一化处理、对齐处理和补全处理;从预处理之后的所述样本生产对象数据中提取特征,并基于所提取的特征构建与训练相应的所述应用模型。
24.在一个示例性实施例中,基于业务规则和所获取的生产对象描述信息,进行容灾
策略编排,生成容灾策略包括:根据所获取的生产对象描述信息,按照业务规则,编排所述容灾策略;采用预设的编排算法,对所述容灾策略自动迭代优化,生成无限接近最优解的所述容灾策略。
25.在一个示例性实施例中,根据所述容灾策略,执行容灾操作,包括:根据预设的调度策略包含的任务内容和任务属性,选择最优的调度策略;基于所述调度策略,将所述容灾策略要执行的容灾操作传递到各个相关组件,以执行容灾操作。
26.在一个示例性实施例中,数据的备份包括以下至少之一:将所述生产环境内的关联的一种或多种数据库数据备份至异地私有云、多有云或多云;对所述生产环境内的需要备份的文件目录、运行环境中的业务应用本身及关联文件、或生产环境镜像备份至异地私有云、多有云或多云;和/或生产环境迁移和重建包括以下至少之一:将所述生产环境内的运行环境、包括运行环境中的业务应用本身及关联文件、或生产环境镜像迁移至异地私有云、多有云或多云;将所述生产环境内的运行环境、所述运行环境中的业务应用本身及关联文件、或生产环境镜像,在异地私有云、多有云或多云上进行重建,以保证业务的连续性;和/或dns切换包括:通过 dns域名解析服务切换,将业务流量从主生产环境切换至备用生产环境;和/或dns回切包括:通过 dns域名解析服务回切,将业务流量从备用生产环境回切至主生产环境。
27.在一个示例性实施例中,执行容灾操作包括以下至少之一:将部署在私有云上的所述生产环境容灾至异地私有云或公有云,并将备份数据同步公有云的一个或多个节点;将部署在公有云上的所述生产环境容灾至所述公有云,并将备份数据同步公有云的一个或多个节点;将部署在公有云上的所述生产环境容灾至私有云。
28.现有的容灾技术缺少智能化和自动化能力。本技术实施例借助机器习等技术手段,使得整个容灾过程更加智能化自动化。
29.此外,现有技术针对的是单一业务环境,对多云多业务环境不适用,即不具有普遍一般性,不能适应多种业务场景。本技术实施例基于第一性原理,可以适配多种生产环境及业务场景,可部署于私有云、公有云、混合云等云、多云生产环境,不限制生产环境内的业务应用数量,甚至同时对多个生产环境展开业务容灾活动。
30.实施例2本技术实施例提供了一种可支持云、多云生产智能化的自动容灾方法,该容灾方法重点体现方法的智能和自动化特征,可适应多种生产环境及业务场景需求。
31.该容灾方法包含容灾对象的识别、容灾计划编排、执行容灾过程和输出容灾报告等四个步骤,对应容灾系统主要包含容灾调度单元、对象识别单元、策略编排单元、容灾执行单元、全局管控单元等模块构成,此外还包含应用模型库、业务规则库及调度策略库,作为容灾系统的智能、自动化的基础支撑库。
32.容灾活动前,通过周期性扫描生产环境获取生产对象描述信息。在发生容灾活动时,根据已经获取的生产对象描述信息及容灾业务规则,通过算法产生容灾编排策略,再按照一定的调度策略,通过容灾执行单元执行容灾操作,完成一次容灾活动。
33.图2是根据本发明实施例的另一种支持多云生产环境的容灾方法,如图2所示,该方法包括:步骤s202,容灾对象的识别。
34.生产对象识别过程在发生容灾过程之前完成,由对象识别单元的智能学习模块完成。通过自动周期性扫描待容灾的云应用的生产环境,结合智能学习模块的智能学习算法,对生产环境中的生成对象进行识别,保证发生容灾前获取到的生产对象描述信息的及时性和准确性。
35.具体地,容灾活动前,加载应用模型库。应用模型库包含了业务应用的网络环境、操作系统、中间件、数据库、业务应用自身等生产对象及关联关系等。应用模型库具有机器学习能力,通过对多种不同生产环境及不同业务应用及使用场景的训练,最终做到自动建立业务应用模型的能力,并将应用模型自动加入到应用模型库中,供开展容灾活动时使用。同时,应用模型库设置手动的维护入口,可根据业务需求,对应用模型库中的内容进行增加、修改或删除等操作。
36.对象识别单元周期性扫描部署于私有云、公有云或混合云的客户生产环境,其中,生产环境包括操作系统、文件系统、集群、容器、镜像库等运行环境,业务应用自身的构成情况等,其中,业务应用自身的构成情况包括:进程及端口号,通讯协议、调用关系,识别业务应用所依赖的包含的数据库(包括关系及非关系型),应用服务器、中间件等。
37.采集生产环境中的生产对象数据,将所采集到的生产环境中的生产对象数据输入到相应的应用模型中,相应的应用模型输出生产对象识别结果,即生产对象描述信息。
38.在一个示例中,智能学习模块如图3所示通过以下方法构建并训练应用模型:步骤s302,采集生产对象数据作为样本生产对象数据。
39.采集生产环境中的生产对象数据作为样本生产对象数据,并对采集到的样本生产对象数据按对象类型进行标记;若已知对象类型,则直接标记,若是未知对象类型,则通过引起识别后的反馈结果进行标记和修正。
40.步骤s304,数据预处理。
41.将样本生产对象数据进行归一化、对齐、补全等预处理。
42.步骤s306,特征提取。
43.对预处理后的样本生产对象数据的特征进行提取,其中,这些特征包括操作系统、数据库类型与版本号,文件系统类型,端口号,进程号,协议标识等。这些特征是智能学习模型构建应用模型的基础。
44.步骤s308,利用智能学习模型构建与训练应用模型。
45.针对不同的生产对象数据特点、参数维度等,利用智能学习模型来构建与训练应用模型。将采集的样本生产对象数据按8:2比例进行分割,多的部分作为训练数据,少的部分作为测试数据;智能学习模型利用算法库中的算法,通过训练数据对构建的应用模型进行训练,并通过测试数据进行测试验证准确性,最终得到所需的参数固定的应用模型。
46.其中,算法库中的算法可以是无监督学习算法和监督学习算法,包括k-均值聚类、层次聚类、支持向量机算法等。
47.步骤s310,生产对象识别结果。
48.将采集的样本生产对象数据输入到应用模型中,进行生产对象识别,得到的生产对象识别结果反馈到步骤s302中,对数据标记结果进行修正。通过这样的迭代的训练过程,训练出更准确的应用模型。
49.步骤s204,容灾计划编排。
50.根据步骤s202获得的生产环境(包括业务应用运行环境及构成)情况,根据规则库内的业务规则,完成对生产环境的容灾编排,输出生产环境/业务应用的容灾策略,供后续发生容灾活动调度使用,其中,容灾策略包含具体执行步骤。
51.容灾策略编排过程应用相应编排算法、例如遗传算法,可以对编排的容灾策略自动迭代优化,形成无限接近最优解的容灾编排策略。
52.规则库包含了备份规则、恢复规则,启动顺序规则、生产环境重建规则、迁移规则等业务规则。规则库具有开放的维护入口,可根据业务需求,对规则库内容进行增加、修改或删除等操作。
53.此外,根据调度策略包含的任务内容及优先级、周期性等任务属性,选择最优的调度策略。
54.步骤s206,执行容灾过程。
55.根据前一步骤s204获得的容灾策略及调度策略库内的调度策略,开始执行容灾过程,完成数据备份、恢复、生产环境重建、迁移等容灾操作。
56.调度策略库的策略包括先来先服务策略、高优先权优先策略、定期执行策略、调度策略及自定义策略等。策略库具有开放的维护入口,可根据业务需求,完成对策略库内容进行增加、修改或删除等操作。
57.步骤s208,输出容灾报告。
58.容灾操作执行完毕后,输出生产环境的容灾报告,概要描述本次容灾的容灾情况及每个容灾步骤的详细执行情况,包括具体的执行步骤,供生产环境负责人及技术人员参考。
59.本实施例的生产环境容灾方法包含容灾对象的识别、容灾计划编排、执行容灾过程和输出容灾报告等四个步骤。在发起生产环境容灾指令后,整个容灾过程不需要人工干预,智能自动化完成。
60.实施例3图4是根据本发明实施例的又一种支持多云生产环境的容灾方法。该容灾方法由容灾系统执行。容灾系统主要包括容灾调度单元、对象识别单元、策略编排单元、容灾执行单元、全局管控单元等单元构成,此外还包括应用模型库、业务规则库及调度策略库,作为容灾系统的基础支撑库。
61.如图4所示,本实施例中的支持多云生产环境的容灾方法包括:步骤s402,获取生产对象描述信息。
62.发生未容灾活动时,容灾调度单元周期性发起生产环境识别指令到容灾执行单元,容灾识别单元加载应用模型库,通过容灾代理扫描生产环境,获取生产环境的生产对象描述信息。
63.步骤s404,将容灾指令发送到容灾调度单元。
64.当系统用户通过全局管控单元发起一次生产环境/业务应用的容灾活动时,全局管控单元将容灾指令传递至容灾调度单元。
65.步骤s406,将已获取的生产对象描述信息传递至策略编排单元。
66.容灾调度单元收到容灾指令后,发起获取生产对象描述信息指令到容灾执行单元,容灾识别单元将已获取的生产对象描述信息传递至策略编排单元。
67.步骤s408,编排容灾策略。
68.策略编排单元加载业务规则库,根据相关的业务规则及生产对象描述信息完成对生产环境/业务应用的容灾策略编排,并将容灾策略传递至容灾调度单元。
69.步骤s410,执行容灾操作。
70.容灾调度单元根据调度策略包含的任务内容及优先级、周期性等任务属性,选择最优的调度策略发送至容灾执行单元,容灾执行单元将容灾策略要执行的容灾操作传递到各个相关组件,执行容灾操作。
71.根据设置的容灾策略,容灾操作主要包括:云生产环境及业务应用数据/文件备份/恢复、云生产环境及业务应用迁移/重建和云生成环境dns一键切换/回切。
72.在一个示例中,云生产环境及业务应用数据/文件备份/恢复主要包括:1)将生产环境内的关联的一种或多种数据库数据备份至异地私有云、多有云或多云,按需完成数据恢复;2)将生产环境内的需要备份的文件/目录、运行环境中的业务应用本身及关联文件、或生产环境镜像备份至异地私有云、多有云或多云,按需完成文件恢复。
73.在一个示例中,云生产环境及业务应用迁移/重建主要包括:1)将生产环境内的运行环境、包括的业务应用本身及关联文件、或生产环境镜像迁移至异地私有云、多有云或多云;2) 将生产环境内的运行环境、业务应用本身及关联文件、或生产环境镜像,在异地私有云、多有云或多云上进行重建,保证业务的连续性。
74.在一个示例中,云生成环境dns一键切换/回切主要包括:1)通过设定触发规则自动触发或人工触发,通过 dns域名解析服务切换/回切,将业务流量从主生产环境切换至备用生产环境;2)通过设定触发规则自动触发或人工触发,通过 dns域名解析服务回切,将业务流量从备用生产环境回切至主生产环境。
75.在一个示例中,云生产环境及业务应用状态采集/监控包括:1)通过容灾代理采集生产环境的状态数据及业务应用的运行情况;2)通过全局管理单元监控生产环境的状态数据及业务应用的运行情况。
76.在一个示例中,容灾业务过程执行完毕后,容灾代理上报容灾执行结果到全局管控单元,显示容灾结果供系统用户查看、参考。
77.本技术实施例提供的智能、自动化容灾方法和系统采用全新的问题求解思路,创新性提出基于智能自动化的生产环境容灾方法和系统,通过引入机器学习、遗传算法等智能手段和算法,使得整个容灾过程智能、自动化能力显著提高。
78.实施例4本技术实施例提供了又一种可支持云、多云生产智能化的自动容灾方法,如图5所示,该方法包括:步骤s502,针对不同的生产环境,训练不同的应用模型。
79.在容灾之前,针对不同的生产环境,训练不同的应用模型。采集各种不同生产环境的生产对象数据作为样本生产对象数据。
80.将样本生产对象数据进行归一化、对齐、补全、滤波、增强等处理。基于增强卡尔曼滤波法,消除生产环境中的生产对象数据的误差。将进行归一化、对齐、补全、滤波、增强等预处理后的数据作为数据样本,选取训练数据集对利用智能学习模型进行应用模型的训练。训练完成后,用验证数据集验证应用模型。通过检验应用模型的准确率、召回率等,来评
价应用模型的有效性和优化方向,进一步优化应用模型。
81.例如,基于深度神经网络建立智能学习模型,利用智能学习模型来构建和训练应用模型。
82.在一个示例中,可以基于生产环境中的生产对象数据的数量、生产对象数据的权值、学习率、学习因子、神经网络的误差和结构,来构建智能学习模型。例如,通过以下的方式来构建智能学习模型:其中,m为以往的生产环境中的生产对象数据的数量,为生产对象数据的权值,为学习率,b为学习因子,为误差对权值的导数,为误差对学习因子的导数,i表示第i个输入参数,j表示神经网络的第j个隐藏层,表示神经元权值的修正,y表示输出值,x表示输入。
83.在其他的实施例中,智能学习模型的构建方式也可以采用其他算法,这些算法存储在算法库中,可以基于实际需求,利用算法库中的其他算法,来构建智能学习模型。
84.此外,还利用反向传播算法来不断更新神经网络中的参数,防止在训练数据集上过拟合。
85.在智能学习模型构建好之后,利用智能学习模型,针对各种生产环境,来训练适用于不同生产环境的应用模型。应用模型构建和训练好之后,还要经过一致性校验。
86.在一个示例中,可以基于校验矩阵的阶数、最大特征根和平均随机一致性校验指标来进行一致性校验。例如,一致性校验公式如下:其中,ci为一致性校验结果,r为校验矩阵的阶数,ri为校验矩阵的平均随机一致性校验指标,为校验矩阵的最大特征根。
87.校验矩阵如下:其中,w表示生产对象数据,m表示生产环境中的生产对象数据的个数,n表示生产环境的数量。
88.最后,将训练后的应用模型存储到应用模型库中。
89.本实施例通过深度神经网络算法,来构建智能学习模型,并通过所构建的智能学习模型训练适用于不同生产环境的应用模型,用于识别生产对象数据。通过这种ai智能识
别生产对象数据,能够更准确地识别出待容灾的生产环境的生产对象,从而使得容灾更为智能化。
90.步骤s504,周期性地扫描生产环境。
91.周期性地扫描部署于私有云、公有云或混合云的客户生产环境,其中,生产环境包括操作系统、文件系统、集群、容器、镜像库等运行环境,业务应用自身的构成情况等,其中,业务应用自身的构成情况包括:进程及端口号,通讯协议、调用关系,识别业务应用所依赖的包含的数据库(包括关系及非关系型),应用服务器、中间件等。
92.步骤s506,进行生产对象识别。
93.将所采集到的生产环境中的生产对象数据输入到相应的应用模型中,相应的应用模型输出生产对象识别结果,即生产对象描述信息。
94.生产对象识别过程在发生容灾过程之前完成,由对象识别单元的智能学习模块完成。通过自动周期性扫描待容灾的云应用的生产环境,结合智能学习模块的智能学习算法生成的应用模型,对生产环境中的生成对象进行识别,保证发生容灾前获取到的生产对象描述信息的及时性和准确性。
95.步骤s508,容灾计划编排。
96.根据识别出的生产对象,基于规则库内的业务规则,对生产环境进行容灾编排,输出生产环境/业务应用的容灾策略,供后续发生容灾活动调度使用。
97.容灾策略编排过程应用相应编排算法、例如遗传算法,可以对编排的容灾策略自动迭代优化,形成无限接近最优解的容灾编排策略。
98.步骤s510,容灾调度。
99.根据调度策略包含的任务内容及优先级、周期性等任务属性,选择最优的调度策略。调度策略库的策略包括先来先服务策略、高优先权优先策略、定期执行策略、调度策略及自定义策略等。
100.步骤s512,执行容灾过程。
101.根据前面步骤获得的容灾策略及调度策略,开始执行容灾过程,完成数据备份、恢复、生产环境重建、迁移等容灾操作。
102.需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
103.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
104.实施例5根据本发明实施例,还提供了一种支持多云生产环境的容灾系统,如图6所示,该
系统包括容灾调度单元64、对象识别单元62、策略编排单元63、容灾执行单元61、全局管控单元60等模块构成,此外还包含应用模型库65、业务规则库66及调度策略库67,作为容灾系统的基础支撑库。
105.全局管控单元60要由全局管理入口组件构成。提供系统用户与系统之间的交互能力,对容灾过程进行管理、过程监控,查看容灾结果等交互逻辑。
106.容灾调度单元64要由调度引擎、调度策略库等组件构成。根据调度策略完成对系统内部各单元的调度工作。
107.对象识别单元62主要由生产对象识别引擎、应用模型库等组件构成。由对象识别引擎加载模式识别库,对扫描获取的数据进行处理,完成生产环境的识别。同时,对象识别单元62使用机器学习技术,通过训练实现应用模型的自动创建,达到生产对象识别的智能自动化能力。
108.策略编排单元63主要由编排引擎、业务规则库等组件构成。编排引擎根据生产环境包含的生产对象,按照业务规则生成最优容灾策略编排,包括数据备份策略、数据恢复策略、生产环境/业务应用迁移、重建等容灾策略。策略编排单元63内建编排优化引擎,使用遗传算法,经过多代进化获得最优编排策略。
109.容灾执行单元61执行由容灾调度单元64下发的指令,完成容灾过程涉及的全部容灾相关操作。
110.下面将详细描述容灾执行单元61,请参考图6和图7,容灾执行单元61主要由容灾代理621、云数据管理622、数据/文件备份/恢复623、生产环境迁移/重建624、dns切换/回切/625和生产环境状态采集/监控626多个组件构成。
111.容灾执行单元61中的容灾代理接收调度单元的容灾指令,通过云数据/管理组件完成具体容灾操作,包括数据/文件的备份/恢复、生产环境迁移/重建,dns切换/回切及生产环境的状态采集/监控等操作。
112.本实施例的图7中为一个3节点的云数据管理组件,作为容灾系统的基础支撑部分,完成对各容灾操作的调度、协调和管理。在其他的实施例中,也可以是多个3个以上节点的云数据管理组件。
113.容灾执行单元61可以有多种工作模式。
114.1)工作模式1:可以支持将客户的私有云部署的生产环境容灾至异地私有云。同时,根据需要,支持再将备份数据同步至公有云的一个或多个节点(包括不同数据中心及云服务商);2)工作模式2:支持将客户的私有云部署的生产环境容灾至公有云。同时,根据需要,支持再将备份数据同步至公有云的一个或多个节点(不同数据中心及云服务商)。
115.3)工作模式3:支持将客户的公有云部署的生产环境容灾至公有云。同时,根据需要,支持再将备份数据同步至公有云的一个或多个节点(不同数据中心及云服务商)。
116.4)工作模式4:支持将客户的公有云部署的生产环境容灾至私有云。
117.本实施例中的容灾系统的工作流程如下:发生未容灾活动时,容灾调度单元64周期性发起生产环境识别指令到容灾执行单元61,容灾识别单元加载应用模型库通过容灾代理通过扫描生产环境,获取生产对象描述信息;
当系统用户通过全局管控单元60发起一次生产环境/业务应用的容灾活动,并将该指令传递至容灾调度单元64;容灾调度单元64收到容灾指令后,发起获取生产对象描述信息指令到容灾执行单元61,容灾识别单元将以获取的生产对象描述信息传递至策略编排单元63;策略编排单元63加载业务规则库,根据相关的业务规则及生产对象描述信息完成对生产环境/业务应用的容灾策略编排,并将容灾策略传递至容灾调度单元64。
118.容灾调度单元64根据调度策略包含的任务内容及优先级、周期性等任务属性,选择最优的调度策略发送至容灾执行单元61,容灾执行单元61将容灾策略要执行的容灾操作传递到各个相关组件,执行容灾操作。
119.容灾业务过程执行完毕后,容灾代理上报容灾执行结果到全局管控单元60,显示容灾结果供系统用户查看、参考。
120.本实施例中的容灾系统能够实现实施例1至3中的容灾方法,此处不再赘述。
121.实施例6本实施例提供了另外一种支持多云生产环境的容灾系统。该系统如图6所示,包括容灾调度单元64、对象识别单元62、策略编排单元63、容灾执行单元61、全局管控单元60等模块构成,此外还包含应用模型库65、业务规则库66及调度策略库67,作为容灾系统的基础支撑库。
122.容灾系统可以有多种部署方式。例如,私有云部署方式、公有云部署方式和混合云部署方式。
123.私有云部署方式如图8所示,系统部署于客户私有云82,同时在客户生产环境80部署容灾执行单元的容灾代理84,容灾系统100系统通过客户端86发起容灾,管理、查看容灾结果。本部署方式支持将客户生产环境容灾至异地私有云备用生产环境。
124.公有云部署方式如图9所示,系统部署于客户公有云,同时在客户生产环境部署容灾代理,系统通过客户端发起容灾,管理、查看容灾结果。本部署方式支持将客户生产环境容灾至不同公有云备用生产环境,包括公有云包括不同的数据中心或云服务商。
125.公有云部署方式如图10所示,系统同时部署于客户私有云和公有云,同时在客户的私有云和公有云生产环境部署容灾代理,系统通过客户端发起容灾,管理、查看容灾结果。同时,支持将客户私有云生产容灾或扩展至公有云生产环境。本部署支持将客户生产环境容灾至异地私有云备用生产环境,或容灾至公有云备用生产环境;将客户公有云生产环境容灾至不同公有云备用生产环境。以上公有云包括不同的数据中心或云服务商。
126.请参考图6至10,本实施例中的容灾系统的各个单元的操作如下:策略编排单元63在接收到容灾指令之后,基于业务规则和所获取的生产对象描述信息,进行容灾策略编排,生成容灾策略,其中,所述生产对象描述信息用于描述待容灾的云应用的生产环境。
127.容灾执行单元61根据所述容灾策略,执行容灾操作,其中,所述容灾操作包括以下至少之一:数据的备份和/或恢复、生产环境迁移和重建,dns切换和/或回切以及生产环境的状态采集和监控。
128.在一个示例性实施例中,该容灾系统还包括对象识别单元62,在接收到容灾指令之前,周期性地扫描部署于私有云、公有云或混合云的生产环境,基于通过深度机器学习而
构建的智能学习模型对所述生产环境的生成对象进行识别,以获取所述生产对象描述信息。
129.在一个示例性实施例中,对象识别单元62还被配置为构建并训练应用模型。例如,对采集到的不同生产环境中的样本生产对象数据按对象类型进行标记;对所述样本生产对象数据进行预处理,所述预处理包括以下至少之一:归一化处理、对齐处理和补全处理;从预处理之后的所述样本生产对象数据中提取特征,并基于所提取的特征,利用智能学习模型构建与训练相应的应用模型。
130.在一个示例性实施例中,策略编排单元63根据所获取的生产对象描述信息,按照业务规则,编排所述容灾策略;采用预设的编排算法,对所述容灾策略自动迭代优化,生成无限接近最优解的所述容灾策略。
131.在一个示例性实施例中,容灾调度单元64根据预设的调度策略包含的任务内容和任务属性,选择最优的调度策略;基于所述调度策略,将所述容灾策略要执行的容灾操作传递到各个相关组件,以执行容灾操作。
132.在一个示例性实施例中,容灾执行单元61可以执行数据的备份,例如将所述生产环境内的关联的一种或多种数据库数据备份至异地私有云、多有云或多云;对所述生产环境内的需要备份的文件目录、运行环境中的业务应用本身及关联文件、或生产环境镜像备份至异地私有云、多有云或多云,其中,所述文件目录包括运行环境中的业务应用本身及关联文件和目录。
133.在一个示例性实施例中,容灾执行单元61可以执行生产环境迁移和重建。例如,将所述生产环境内的运行环境、包括运行环境中的业务应用本身及关联文件、或生产环境镜像迁移至异地私有云、多有云或多云;将所述生产环境内的运行环境、所述运行环境中的业务应用本身及关联文件、或生产环境镜像,在异地私有云、多有云或多云上进行重建,以保证业务的连续性。
134.在一个示例性实施例中,容灾执行单元61可以执行dns切换和回切。例如,通过 dns域名解析服务切换,将业务流量从主生产环境切换至备用生产环境;通过 dns域名解析服务回切,将业务流量从备用生产环境回切至主生产环境。
135.在一个示例性实施例中,执行容灾操作包括将部署在私有云上的所述生产环境容灾至异地私有云或公有云,并将备份数据同步公有云的一个或多个节点;将部署在公有云上的所述生产环境容灾至所述公有云,并将备份数据同步公有云的一个或多个节点;将部署在公有云上的所述生产环境容灾至私有云。
136.本实施例中的容灾系统能够实现实施例1至3中的容灾方法,此处不再赘述。
137.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
138.上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
139.在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有
详述的部分,可以参见其他实施例的相关描述。
140.在本技术所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
141.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
142.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
143.以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1