基于云数据中心的智能平滑重启方法及装置与流程

文档序号:11154615阅读:270来源:国知局
基于云数据中心的智能平滑重启方法及装置与制造工艺
本发明涉及云计算
技术领域
,特别涉及基于云数据中心的智能平滑重启方法。
背景技术
:一般情况下,随着云计算技术的快速发展和容器的快速崛起,传统的数据中心已经向云数据中心转变,同时融合容器技术,可以快速方便的部署和恢复业务,提高业务的高可用性。在容器云时代,通过先启动部分新的实例,然后关闭老的实例,达到灰度发布应用的效果。这种方式可以保证在不影响业务连续性的前提下对应用进行升级、回滚等操作。由于业务扩展需要,业务系统往往会存在添加功能或删除功能的需求,在发布应用新版本时,需要重新启动应用实例,在重启过程中需要保证业务的连续性。当集群中实例个数过多,如果在保证老实例不关闭的情况下,启动新的实例,会出现资源不足的现象,进行动态扩容底层资源,造成资源浪费。业内通常的做法是首先根据现有业务的类型,对应用实例进行选择性的关闭,再启动新实例来保障业务的连续性。如图1所示,当进行业务更新时,要对实例中的代码包进行替换,替换之后,为了保证业务的连续,需要对实例进行灰度的重启。策略一般为先启动新的实例,再关闭老的实例,这样就可以保证应用的高可用性。在以下情况会导致数据中心的业务的连续性出现故障:1)核心应用的实例个数较多,当先启动新的实例时,会瞬时占用过多的系统资源,导致启动不成功;2)没有考虑当前业务的使用情况,不能智能的选择对应的策略进行业务的重启操作。在生产环境中,业务的需要重启的情况较多,不当的重启操作和重启策略会影响业务的连续性,影响用户的感知。在发生以上问题时,由于重启过程不能被打断,在发生故障后,只能做被动的故障处理,重新修改策略。严重时,导致业务系统宕机,需要重新启动主机,这对于核心系统来说是不可接受的。技术实现要素:为解决的不当的重启操作和重启策略会影响业务的连续性,影响用户的感知的技术问题,本发明提出了基于云数据中心的智能平滑重启方法及装置来实现。基于云数据中心的智能平滑重启方法,包括以下步骤:响应于应用重启请求信号,进行弹性调度;采集部署应用实例的数据指标;分析数据指标对于系统的整体需求和重要程度,得出重启策略;选择相应重启策略,进行重启。作为一种可实施方式,所述分析数据指标对于系统的整体需求和重要程度,得出重启策略,包括以下步骤:根据数据指标对于系统的整体需求和重要程度,构建判断矩阵,计算权重值;根据权重值和权重值所对应的指标值,得到总的资源使用情况;结合总的资源使用情况,根据应用的实际运行状况和运维经验,得到重启策略。作为一种可实施方式,所述根据数据指标对于系统的整体需求和重要程度,构建判断矩阵,计算权重值,过程如下:构建判断矩阵:其中,A表示判断矩阵,B表示判断矩阵经过转换后的矩阵,表示指标对于数据指标的重要程度,将矩阵B的每一行进行归一化处理,可以得出i行1列的矩阵,矩阵B中的每行数据值代表各个指标对应的权重值;检验判断矩阵构建的好坏程度,对判断矩阵B进行一致性检验;一致性检验的计算公式如下,其中,表示一致性指标,表示一致性比率,是判断矩阵B的最大特征根,是比中的最大整数,是随机一致性指标;当一致性比率CR小于0.1时,满足条件,选取一致性比率CR小于0.1作为权重值。作为一种可实施方式,所述采集部署应用实例的数据指标,是指请求队列长度、CPU使用率和内存的使用率中的至少一种。作为一种可实施方式,所述应用重启请求为出现问题重新发布和应用更新中的至少一种。一种云数据中心的智能平滑重启的装置,包括重启请求模块、智能重启调度模块和重启应用模块,所述智能重启调度模块包括数据采集模块和数据分析模块;所述重启请求模块用于响应于应用重启请求信号,进行弹性调度;所述数据采集模块用于采集部署应用实例的数据指标;所述数据分析模块用于分析数据指标对于系统的整体需求和重要程度,得出重启策略;所述重启应用模块选择相应重启策略,进行重启。作为一种可实施方式,所述数据分析模块设置为:根据数据指标对于系统的整体需求和重要程度,构建判断矩阵,计算权重值;根据权重值和权重值所对应的指标值,得到总的资源使用情况;结合总的资源使用情况,根据应用的实际运行状况和运维经验,得到重启策略。作为一种可实施方式,所述根据数据指标对于系统的整体需求和重要程度,构建判断矩阵,计算权重值,过程如下:构建判断矩阵:其中,A表示判断矩阵,B表示判断矩阵经过转换后的矩阵,表示指标对于数据指标的重要程度,将矩阵B的每一行进行归一化处理,可以得出i行1列的矩阵,矩阵B中的每行数据值代表各个指标对应的权重值;检验判断矩阵构建的好坏程度,对判断矩阵B进行一致性检验;一致性检验的计算公式如下,其中,表示一致性指标,表示一致性比率,是判断矩阵B的最大特征根,是比中的最大整数,是随机一致性指标;当一致性比率CR小于0.1时,满足条件,选取一致性比率CR小于0.1作为权重值。作为一种可实施方式,所述数据采集模块设置为:所述采集部署应用实例的数据指标是指请求队列长度、CPU使用率和内存的使用率中的至少一种。作为一种可实施方式,所述重启请求模块设置为:所述应用重启请求为出现问题重新发布和应用更新中的至少一种。本发明相比于现有技术的有益效果在于:本发明的基于云数据中心的智能平滑重启方法,包括以下步骤:响应于应用重启请求信号,进行弹性调度;采集部署应用实例的数据指标;分析数据指标对于系统的整体需求和重要程度,得出重启策略;选择相应重启策略,进行重启。通过采用本发明的方法,在进行重启时不会造成用户感知能力强和数据中心的资源耗尽的缺陷,提高了数据中心的稳健性保证了业务的连续性。本发明综合考虑了应用的访问和各实例所使用的各项资源情况,并加以分析计算,使数据中心能够准确快速响应外部重启请求,具有很强的实用性和扩展性,便于推广应用。附图说明图1为现有技术的整体流程示意图;图2为本发明的整体流程示意图;图3为本发明的分析数据指标对于系统的整体需求和重要程度的流程示意图;图4为本发明的应用场景流程示意图;图5为本发明的整体结构示意图;图6为本发明的智能重启调度模块的结构示意图;图7为智能重启调度模块的工作过程示意图。具体实施方式以下结合附图,对本发明上述的和另外的技术特征和优点进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的部分实施例,而不是全部实施例。本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。发明概述本发明基于云数据中心的智能平滑重启方法,包括以下步骤:S1,响应于应用重启请求信号,进行弹性调度;S2,采集部署应用实例的数据指标;S3,分析数据指标对于系统的整体需求和重要程度,得出重启策略;S4,选择相应重启策略,进行重启。进一步地,参照附图3,所述分析数据指标对于系统的整体需求和重要程度,得出重启策略,包括以下步骤:S21,根据数据指标对于系统的整体需求和重要程度,构建判断矩阵,计算权重值;S22,根据权重值和权重值所对应的指标值,得到总的资源使用情况;S23,结合总的资源使用情况,根据应用的实际运行状况和运维经验,得到重启策略。通过采用本发明的方法,在进行重启时不会造成用户感知能力强和数据中心的资源耗尽的缺陷,提高了数据中心的稳健性保证了业务的连续性。本发明综合考虑了应用的访问和各实例所使用的各项资源情况,并加以分析计算,使数据中心能够准确快速响应外部重启请求,具有很强的实用性和扩展性,便于推广应用。下面结合具体实施例来说明本发明的方法和装置。实施例1参照附图2,本发明基于云数据中心的智能平滑重启方法,包括以下步骤:S1,响应于应用重启请求信号,进行弹性调度;S2,采集部署应用实例的数据指标;S3,分析数据指标对于系统的整体需求和重要程度,得出重启策略;S4,选择相应重启策略,进行重启。进一步地,参照附图3,在步骤S3中,具体包括以下步骤:S31,根据数据指标对于系统的整体需求和重要程度,构建判断矩阵,计算权重值;S32,根据权重值和权重值所对应的指标值,得到总的资源使用情况;S33,结合总的资源使用情况,根据应用的实际运行状况和运维经验,得到重启策略。步骤S31的具体实现方式如下:构建判断矩阵:其中,A表示判断矩阵,B表示判断矩阵经过转换后的矩阵,表示指标对于数据指标的重要程度,将矩阵B的每一行进行归一化处理,可以得出i行1列的矩阵,矩阵B中的每行数据值代表各个指标对应的权重值;检验判断矩阵构建的好坏程度,对判断矩阵B进行一致性检验;一致性检验的计算公式如下,其中,表示一致性指标,表示一致性比率,是判断矩阵B的最大特征根,是比中的最大整数,是随机一致性指标;当一致性比率CR小于0.1时,满足条件,选取一致性比率CR小于0.1作为权重值。下附随机一致性指标RI值,参见表1表1随机一致性指标RI值n1234567891011RI000.580.901.121.241.321.411.451.491.51应用场景示例,如图4所示,当有外部请求需要重启时,开始采集应用的资源和使用情况包括请求队列长度、CPU使用率和内存的使用率,并且对数据进行分析,分析数据指标对于系统的整体需求和重要程度,选取重启策略,执行重启动作,重启的同时还可以可以通过策略维护模块进行策略的查询和变更维护。一种云数据中心的智能平滑重启的装置,包括重启请求模块1、智能重启调度模块2和重启应用模块3,智能重启调度模块2包括数据采集模块21和数据分析模块22;重启请求模块1用于响应于应用重启请求信号,进行弹性调度;数据采集模块21用于采集部署应用实例的数据指标;数据分析模块22用于分析数据指标对于系统的整体需求和重要程度,得出重启策略;重启应用模3块选择相应重启策略,进行重启。附图6是智能重启调度模块的工作示意图,数据采集模块21采集数据中心应用集群实例(包括CPU、内存、带宽和硬盘)的CPU使用率,请求队列长度以及内存的使用率,计算总的资源使用情况,根据总的资源使用情况选择合适的重启策略。数据分析模块22设置为:根据数据指标对于系统的整体需求和重要程度,构建判断矩阵,计算权重值;根据权重值和权重值所对应的指标值,得到总的资源使用情况;结合总的资源使用情况,根据应用的实际运行状况和运维经验,得到重启策略。根据数据指标对于系统的整体需求和重要程度,构建判断矩阵,计算权重值,过程如下:构建判断矩阵:其中,A表示判断矩阵,B表示判断矩阵经过转换后的矩阵,表示指标对于数据指标的重要程度,将矩阵B的每一行进行归一化处理,可以得出i行1列的矩阵,矩阵B中的每行数据值代表各个指标对应的权重值;检验判断矩阵构建的好坏程度,对判断矩阵B进行一致性检验;一致性检验的计算公式如下,其中,表示一致性指标,表示一致性比率,是判断矩阵B的最大特征根,是比中的最大整数,是随机一致性指标;当一致性比率CR小于0.1时,满足条件,选取一致性比率CR小于0.1作为权重值。数据采集模块22设置为:采集部署应用实例的数据指标是指请求队列长度、CPU使用率和内存的使用率中的至少一种。重启请求模块22设置为:应用重启请求为出现问题重新发布和应用更新中的至少一种。智能重启调度模块2还包括了策略维护模块23,的策略维护包括以下内容:1)新重启实例个数1个,上浮重启实例个数2个。2)新重启实例个数3个,上浮重启实例个数5个。3)新重启实例个数4个,上浮重启实例个数5个。4)新重启实例个数X个,上浮重启实例个数M个。其中,策略维护模块可以根据运维人员和应用人员的经验进行对X和M进行调整。以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,应当理解,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围。特别指出,对于本领域技术人员来说,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1