服务器的配置方法和装置制造方法

文档序号:6492450阅读:179来源:国知局
服务器的配置方法和装置制造方法
【专利摘要】本申请公开了一种服务器的配置方法和装置,其中,该方法包括:获取运行时长维度参数和实际时间维度参数,其中,上述运行时长维度参数用于指示不同运行时长下服务器的宕机概率,上述实际时间维度参数用于指示不同实际时间下上述服务器的宕机概率;根据上述运行时长维度参数和实际时间维度参数计算上述服务器在预定时间点上的宕机概率;根据上述服务器在预定时间点上的宕机概率对上述服务器进行配置。本申请解决了现有技术中仅通过实际维度参数所指示的宕机概率对服务器进行配置而导致的对服务器的配置不合理的技术问题,达到了有效区分周期性规律和突发情况以提高对服务器进行配置的合理性的技术效果。
【专利说明】服务器的配置方法和装置【技术领域】
[0001]本申请涉及互联网领域,具体而言,涉及一种服务器的配置方法和装置。
【背景技术】
[0002]计算中心的服务器数量的动态配置一直是行业中的一大难题。动态配置的主要依据是对整个中心的服务器宕机概率进行预测的预测结果。然而,现实中服务器的运行总是伴随着一些有规律的周期性波动(例如:早上或者晚上会存在不同的使用高峰期和使用低谷期,或者节假日会经常出现网络使用高峰期)以及一些不规律的由外在因素造成的波动(例如:自然灾害、停电、以及人为的临时大促销活动等等)。当这些有规律的周期性波动和不规律的临时性波动重叠时,会使得正常的服务器整体宕机的概率预测出现比较大的偏差,从而导致很难从根本上区分在同个时间点发生的突然的高频率宕机事件是由于正常波动引起的还是由外来事件引起的。上述情况的发生,使得在对整条历史宕机概率曲线进行观察和预测时,无法很好地在数量上确定这两种因素各自的所产生的效应。
[0003]对于有规律的周期性分解,目前业界比较通行的做法主要包括以下步骤:
[0004]S1:估计趋势;
[0005]S2:消除序列中的趋势;
[0006]S3:估计周期因素;
[0007]然后,重 复执行上述步骤SI至S3,最终估计出趋势因素和不规则因素。
[0008]参考图1,在理想状况下(B卩,没有外生突发因素的干扰的情况下),实线为实际服务器中心的宕机发生率。根据传统方法,将实线部分不断地进行移动平均平滑后,就可以得到趋势线(虚线表示的线)。然后将实际的宕机发生率减去趋势线,就可以获得在单一指标(宕机发生率)的周期性分解。值得注意的是,图中的周期长短只是示例,事实上没有限制,可以是早上至晚上的周期,也可以是季度的季节性周期。
[0009]然而,现实的情况通常比这种情况要复杂的多,外在的不可抗因素或者人为的活动总是不定期的会在某个时间点发生。例如,可能服务器中心的空调突然失灵(图中左边的第一个虚线波动);或者,某销售旺季导致网站访问量突然猛增(比如图中右边的实线波动)。这些波动可能在整条宕机发生率曲线上面的任何一个时间点上发生(图中只是举了 2个例子)。对于这些波动通过单纯的平滑操作后就很难完全消除,即使消除了,当用实际发生率减去趋势线后,这些波动也会干扰正常的周期性波动,从而改变真正的周期性规律。
[0010]仍以上述图1为例进行说明,波动部分会将整体的周期性因素拉高,因为单纯的一元数据无法区分这些波动是常规的还是临时的。
[0011]上面介绍的现有技术中的方法主要存在以下几个缺点:
[0012]I)仅基于一个维度的数据,当这条线出现较大的波动时,趋势线、周期性、以及不规则因素之间很难进行区分。尤其是当外部政策影响正好和周期性波动发生在同一时间点时,这种区别很难在数据上进行区分。
[0013]2)由于估计趋势线用的是移动平均,对于最接近现在的几个点的估计通常不如历史数据准确。比如,如果采用6个月移动平均的话,那么2012年I月到2012年6月的平均只能代表3、4月的数,而对于6月份的代表性就相对较差(因为理论上6月需要3-9月的平均才能代表。但是如果站在当前6月份这个点上,6月以后的数据是没有的)
[0014]针对上述仅通过实际维度参数所指示的宕机概率对服务器进行配置而导致的对服务器的配置不合理的技术问题,尚未提出有效的解决方法。

【发明内容】

[0015]本申请提供了一种服务器的配置方法和装置,以至少解决了现有技术中仅通过实际维度参数所指示的宕机概率对服务器进行配置而导致的对服务器的配置不合理的技术问题。
[0016]根据本申请的一个方面,提供了一种服务器的配置方法,包括:获取运行时长维度参数和实际时间维度参数,其中,运行时长维度参数用于指示不同运行时长下服务器的宕机概率,实际时间维度参数用于指示不同实际时间下服务器的宕机概率;根据运行时长维度参数和实际时间维度参数计算服务器在预定时间点上的宕机概率;根据服务器在预定时间点上的宕机概率对服务器进行配置。
[0017]优选地,根据运行时长维度参数和实际时间维度参数计算服务器在预定时间点上的宕机概率包括:根据运行时长维度参数计算得到服务器周期参数,其中,服务器周期参数用于指示服务器在预定的每个运行时长周期上去除了由突发事件所带来的不规律值之后的宕机概率;将服务器周期参数与实际时间维度参数进行叠加得到服务器在预定时间点上的宕机概率。
[0018]优选地,运行时长维度参数为不同运行时长下服务器的实际宕机概率,根据运行时长维度参数计算得到服务器周期参数包括:在每个运行时长周期内将不同运行时长下服务器的实际宕机概率进行平滑拟合,以得到服务器在不同运行时长下的拟合宕机概率,其中,每个周期内的运行时长的取值范围相同;将实际宕机概率减去拟合宕机概率得到不同运行时长中每个运行时长下的差分值;根据不同运行时长中每个运行时长下的差分值判断不同运行时长中的每个运行时长下是否存在由突发事件所带来的不规律值;对于不同运行时长中的第一运行时长,将每个运行时长周期内第一运行时长下服务器的实际宕机概率的平均值减去第一运行时长下由突发事件所带来的不规律值,以得到服务器周期参数,其中,第一运行时长下存在由突发事件所带来的不规律值;对于不同运行时长中的第二运行时长,将每个运行时长周期内第二运行时长下服务器的实际宕机概率的平均值作为服务器周期参数,其中,第二运行时长下不存在由突发事件所带来的不规律值。
[0019]优选地,在每个运行时长周期内将不同运行时长下服务器的实际宕机概率进行平滑拟合包括:在每个运行时长周期内将不同运行时长下服务器的实际宕机概率进行线性拟合;或者在每个运行时长周期内将不同运行时长下服务器的实际宕机概率进行非线性拟
口 ο
[0020]优选地,根据不同运行时长中每个运行时长下的差分值判断不同运行时长中的每个运行时长下是否存在由突发事件所带来的不规律值包括:对于不同运行时长中的每个运行时长执行以下步骤,其中,当前执行的运行时长为第三运行时长:判断是否连续预定个周期内的第三运行时长下的差分值的绝对值超过预定阈值;若是连续预定个周期内的第三运行时长下的差分值的绝对值超过预定阈值,则判断出第三运行时长下存在由突发事件所带来的不规律值,并将连续预定个周期内的第三运行时长下的差分值进行平均,以作为第三运行时长下存在由突发事件所带来的不规律值;否则,则判断出第三运行时长下不存在由突发事件所带来的不规律值。
[0021]优选地,根据不同运行时长中每个运行时长下的差分值判断不同运行时长中的每个运行时长下是否存在由突发事件所带来的不规律值包括:对于不同运行时长中的每个运行时长执行以下步骤,其中,当前执行的运行时长为第四运行时长:统计符合预定条件的周期的个数,其中,预定条件为第四运行时长下的差分值的绝对值超过预定阈值;判断符合预定条件的周期的个数是否超过预定个数;若是符合预定条件的周期的个数超过预定个数,则判断出第四运行时长下存在由突发事件所带来的不规律值,并将符合预定条件的周期内第四运行时长下的差分值进行平均,以作为第四运行时长下存在由突发事件所带来的不规律值;否则,则判断出第四运行时长下不存在由突发事件所带来的不规律值。
[0022]根据本申请的另一方面,提供了一种服务器的配置装置,包括:获取单元,用于获取运行时长维度参数和实际时间维度参数,其中,运行时长维度参数用于指示不同运行时长下服务器的宕机概率,实际时间维度参数用于指示不同实际时间下服务器的宕机概率;计算单元,用于根据运行时长维度参数和实际时间维度参数计算服务器在预定时间点上的宕机概率;配置单元,用于根据服务器在预定时间点上的宕机概率对服务器进行配置。
[0023]优选地,计算单元包括:计算模块,用于根据运行时长维度参数计算得到服务器周期参数,其中,服务器周期参数用于指示服务器在预定的每个运行时长周期上去除了由突发事件所带来的不规律值之后的宕机概率;叠加模块,用将服务器周期参数与实际时间维度参数进行叠加得到服务器在预定时间点上的宕机概率。
[0024]优选地,计算模块包括:拟合子模块,用于在运行时长维度参数为不同运行时长下服务器的实际宕机概率的情况下,在每个运行时长周期内将不同运行时长下服务器的实际宕机概率进行平滑拟合,以得到服务器在不同运行时长下的拟合宕机概率,其中,每个周期内的运行时长的取值范围相同;第一计算子模块,用于将实际宕机概率减去拟合宕机概率得到不同运行时长中每个运行时长下的差分值;判断子模块,用于根据不同运行时长中每个运行时长下的差分值判断不同运行时长中的每个运行时长下是否存在由突发事件所带来的不规律值;第二计算子模块,用于对于不同运行时长中的第一运行时长,将每个运行时长周期内第一运行时长下服务器的实际宕机概率的平均值减去第一运行时长下由突发事件所带来的不规律值,以得到服务器周期参数,其中,第一运行时长下存在由突发事件所带来的不规律值;第三计算子模块,用于对于不同运行时长中的第二运行时长,将每个运行时长周期内第二运行时长下服务器的实际宕机概率的平均值作为服务器周期参数,其中,第二运行时长下不存在由突发事件所带来的不规律值。
[0025]优选地,判断子模块还用于对不同运行时长中的每个运行时长执行以下步骤,其中,当前执行的运行时长为第三运行时长:判断是否连续预定个周期内的第三运行时长下的差分值的绝对值超过预定阈值;若是连续预定个周期内的第三运行时长下的差分值的绝对值超过预定阈值,则判断出第三运行时长下存在由突发事件所带来的不规律值,并将连续预定个周期内的第三运行时长下的差分值进行平均,以作为第三运行时长下存在由突发事件所带来的不规律值;否则,则判断出第三运行时长下不存在由突发事件所带来的不规律值。
[0026]在本申请中,同时获取运行时长维度参数和实际时间维度参数,从而通过两个方面来标识服务器的宕机概率,然后根据这两个参数计算得到服务器在预定时间点上的宕机概率,进而根据获取的结果对服务器进行配置,通过这种方式有效解决了现有技术中仅通过实际维度参数所指示的宕机概率对服务器进行配置而导致的对服务器的配置不合理的技术问题,达到了有效区分周期性规律和突发情况以提高对服务器进行配置的合理性的技术效果。
【专利附图】

【附图说明】
[0027]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0028]图1是相关技术中服务器的实际宕机概率和平滑后得到的趋势线的示意图;
[0029]图2是根据本申请实施例的服务器的配置系统的一种优选结构示意图;
[0030]图3是根据本申请实施例的服务器的配置装置的一种优选结构示意图;
[0031]图4是根据本申请实施例的服务器的配置装置的另一种优选结构示意图;
[0032]图5是根据本申请实施例的服务器的配置装置的又一种优选结构示意图;
[0033]图6是根据本申请实施例的服务器的配置方法的一种优选流程图;
[0034]图7是根据本申请实施例的计算服务器在预定时间点上的宕机概率的一种优选流程图;
[0035]图8是根据本申请实施例的服务器组在整个生命周期中的宕机概率的曲线示意图;
[0036]图9是根据本申请实施例的按日期排列的不同运行年限的服务器组宕机概率的曲线示意图;
[0037]图10是根据本申请实施例的按运行时长排列的服务器组宕机概率的曲线示意图;
[0038]图11是根据本申请实按运行时长排列服务器组宕机概率的曲线示意图。
【具体实施方式】
[0039]下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
[0040]在描述本申请的各实施例的进一步细节之前,将参考图2来描述可用于实现本申请的原理的一个合适的计算体系结构。在以下描述中,除非另外指明,否则将参考由一个或多个计算机执行的动作和操作的符号表示来描述本申请的各实施例。由此,可以理解,有时被称为计算机执行的这类动作和操作包括计算机的处理单元对以结构化形式表示数据的电信号的操纵。这一操纵转换了数据或在计算机的存储器系统中的位置上维护它,这以本领域的技术人员都理解的方式重配置或改变了计算机的操作。维护数据的数据结构是具有数据的格式所定义的特定属性的存储器的物理位置。然而,尽管在上述上下文中描述本申请,但它并不意味着限制性的,如本领域的技术人员所理解的,后文所描述的动作和操作的各方面也可用硬件来实现。[0041]转向附图,其中相同的参考标号指代相同的元素,本申请的原理被示为在一个合适的计算环境中实现。以下描述基于所述的本申请的实施例,并且不应认为是关于此处未明确描述的替换实施例而限制本申请。
[0042]图2示出了可用于这些设备的一个示例计算机体系结构的示意图。出于描述的目的,所绘的体系结构仅为合适环境的一个示例,并非对本申请的使用范围或功能提出任何局限。也不应将该计算系统解释为对图2所示的任一组件或其组合具有任何依赖或需求。
[0043]本申请的原理可以使用其它通用或专用计算或通信环境或配置来操作。适用于本申请的众所周知的计算系统、环境和配置的示例包括但不限于,个人计算机、服务器,多处理器系统、基于微处理的系统、小型机、大型计算机、以及包括任一上述系统或设备的分布式计算环境。
[0044]在其最基本的配置中,图2中的服务器的配置系统200至少包括:一个网站的服务器202以及一个或多个客户端204。服务器202可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置、用于存储数据的存储装置以及与客户端通信的传输装置;客户端204可以包括:微处理器MCU、与服务器通信的传输装置、与用户交互的显示装置。在本说明书和权利要求书中,“系统”也可以被定义为能够执行软件、固件或微码来实现功能的任何硬件组件或硬件组件的组合服务器的配置系统200甚至可以是分布式的,以实现分布式功能。
[0045]如本申请所使用的,术语“模块”、“组件”或“单元”可以指在服务器的配置系统200上执行的软件对象或例程。此处所描述的不同组件、模块、单元、引擎和服务可被实现为在服务器的配置系统200上执行(例如,作为单独的线程)的对象或进程。尽管此处所描述的系统和方法较佳地以软件来实现,但是硬件或软件和硬件的组合的实现也是可能并被构想的。
[0046]实施例1
[0047]图3是根据本申请实施例服务器的配置装置的一种优选的结构示意图,优选的,本实施例中的装置位于服务器202上或者客户端204上。
[0048]优选的,如图3所示的服务器的配置装置可以包括获取单元302、计算单元304以及配置单元306:
[0049]I)获取单元302,用于获取运行时长维度参数和实际时间维度参数,其中,所述运行时长维度参数用于指示不同运行时长下服务器的宕机概率,所述实际时间维度参数用于指示不同实际时间下所述服务器的宕机概率。优选地,上述的时长维度参数和实际实线维度参数等可以是由第三方服务器根据每个服务器的运行状态进行统计和汇总后得到的。
[0050]2)计算单元304,与获取单元302耦合,用于根据所述运行时长维度参数和实际时间维度参数计算所述服务器在预定时间点上的宕机概率;即,增加了一个运行时长维度参数,并利用该运行时长维度参数来重新确定宕机概率,从而可以有效确定突发事件对宕机概率的影响。
[0051]3)配置单元306,与计算单元304耦合,用于根据所述服务器在预定时间点上的宕机概率对所述服务器进行配置。优选地,所谓对服务器进行配置主要是在预计服务器宕机发生概率高的时间段增加备用服务器数量,而在低发的时间段可以相应的减少服务器备份数量,从而在效率上更好的实时配置实际需要运行的服务器数量。[0052]在上述优选实施方式,同时获取运行时长维度参数和实际时间维度参数,从而通过两个方面来标识服务器的宕机概率,然后根据这两个参数计算得到服务器在预定时间点上的宕机概率,进而根据获取的结果对服务器进行配置,通过这种方式有效解决了现有技术中仅通过实际维度参数所指示的宕机概率对服务器进行配置而导致的对服务器的配置不合理的技术问题,达到了有效区分周期性规律和突发情况以提高对服务器进行配置的合理性的技术效果。
[0053]下面将结合几种优选的实施方式对上述计算单元304所执行的步骤进行具体的描述。
[0054]在生成预定时间点上的宕机概率的过程中,可以先由运行时长维度上的宕机概率参数计算服务器的周期宕机参数,然后将实际时间维度参数和服务器周期宕机参数进行叠加最终得到预定时间点上的宕机概率,从而实现对服务器宕机概率的一个有效预测。在一个优选实施方式中,如图4所示,计算单元304包括:计算模块402,用于根据所述运行时长维度参数计算得到服务器周期参数,其中,所述服务器周期参数用于指示所述服务器在预定的每个运行时长周期上去除了由突发事件所带来的不规律值之后的宕机概率;叠加模块404,与计算模块402耦合,用将所述服务器周期参数与实际时间维度参数进行叠加得到所述服务器在预定时间点上的宕机概率。
[0055]在上述运行时长维度参数是不同运行时长下服务器的实际宕机概率的情况下,在一个优选实施方式中,如图5所示,上述计算模块包括:拟合子模块502,用于在所述运行时长维度参数为所述不同运行时长下服务器的实际宕机概率的情况下,在所述每个运行时长周期内将所述不同运行时长下服务器的实际宕机概率进行平滑拟合,以得到所述服务器在所述不同运行时长下的拟合宕机概率,其中,所述每个周期内的运行时长的取值范围相同;第一计算子模块504,用于将所述实际宕机概率减去所述拟合宕机概率得到所述不同运行时长中每个运行时长下的差分值;判断子模块506,用于根据所述不同运行时长中每个运行时长下的所述差分值判断所述不同运行时长中的每个运行时长下是否存在由突发事件所带来的不规律值;第二计算子模块508,用于对于所述不同运行时长中的第一运行时长,将所述每个运行时长周期内所述第一运行时长下服务器的实际宕机概率的平均值减去所述第一运行时长下由突发事件所带来的不规律值,以得到所述服务器周期参数,其中,所述第一运行时长下存在由突发事件所带来的不规律值;第三计算子模块510,用于对于所述不同运行时长中的第二运行时长,将所述每个运行时长周期内所述第二运行时长下服务器的实际宕机概率的平均值作为所述服务器周期参数,其中,所述第二运行时长下不存在由突发事件所带来的不规律值。
[0056]在上述根据所述运行时长维度参数和实际时间维度参数计算所述服务器在预定时间点上的宕机概率的过程中的核心思想就是,先拟合得到在不同运行时长下服务器的宕机概率,然后,根据拟合得到的这样一个概率来计算实际宕机概率和该拟合概率之间的一个差分值,从而确定是否在这样一个运行时长内存在突发事件,如果有,就减去这样的一个突发事件带来的不规律值,如果没有就直接将拟合的概率作为最终的服务器周期参数。
[0057]优选地,上述拟合的方式可以采用线性拟合也可以采用非线性拟合,本申请在此不做限定,可以根据需要以及拟合的效果决定最终的拟合方式。在一个优选实施方式中,在所述每个运行时长周期内将所述不同运行时长下服务器的实际宕机概率进行平滑拟合可以包括:在每个运行时长周期内将不同运行时长下服务器的实际宕机概率进行线性拟合;或者在每个运行时长周期内将不同运行时长下服务器的实际宕机概率进行非线性拟合。
[0058]根据拟合概率曲线和实际的宕机概率曲线来确定是否存在有突发事件所带来的不规律的过程可以是预先设定一个阈值,如果差分值大于这样一个预定的阈值,则可以认为出现了突发事件所带来的不规律变化。优选地,对于这个突发事件所带来的不规律值可以是连续预定个周期内的差分值的一个平均值。通过这样一个求平均的运算可以提高该不规律值的可靠性。在一个优选实施方式中,在一个优选实施方式中,上述判断子模块还用于对不同运行时长中的每个运行时长执行以下步骤,其中,当前执行的运行时长定义为第三运行时长:
[0059]步骤S1:判断是否连续预定个周期内的所述第三运行时长下的差分值的绝对值超过预定阈值;
[0060]步骤S2:若是连续预定个周期内的所述第三运行时长下的差分值的绝对值超过预定阈值,则判断出所述第三运行时长下存在由突发事件所带来的不规律值,并将所述连续预定个周期内的所述第三运行时长下的差分值进行平均,以作为所述第三运行时长下存在由突发事件所带来的不规律值;否则,则判断出所述第三运行时长下不存在由突发事件所带来的不规律值。
[0061]或者,也可以确定超出预定阈值的周期的个数是否达到一个设定值,如果大于,则可以认为存在突发事件。在一个优选实施方式中,根据所述不同运行时长中每个运行时长下的所述差分值判断所述不同运行时长中的每个运行时长下是否存在由突发事件所带来的不规律值包括:对于不同运行时长中的每个运行时长执行以下步骤,其中,当前执行的运行时长为第四运行时长:
[0062]步骤S1:统计符合预定条件的周期的个数,其中,预定条件为第四运行时长下的差分值的绝对值超过预定阈值;
[0063]步骤S2:判断符合预定条件的周期的个数是否超过预定个数;
[0064]步骤S3:若是符合预定条件的周期的个数超过预定个数,则判断出第四运行时长下存在由突发事件所带来的不规律值,并将符合预定条件的周期内第四运行时长下的差分值进行平均,以作为第四运行时长下存在由突发事件所带来的不规律值;否则,则判断出第四运行时长下不存在由突发事件所带来的不规律值。
[0065]实施例2
[0066]在图2至图5所示的系统的基础上,本申请提供了一种优选的服务器的配置方法。如图6所示,该方法可以包括如下步骤:
[0067]步骤S602:获取运行时长维度参数和实际时间维度参数,其中,运行时长维度参数用于指示不同运行时长下服务器的宕机概率,实际时间维度参数用于指示不同实际时间下服务器的宕机概率;优选地,上述的时长维度参数和实际实线维度参数等可以是由第三方服务器根据每个服务器的运行状态进行统计和汇总后得到的。
[0068]步骤S604:根据运行时长维度参数和实际时间维度参数计算服务器在预定时间点上的宕机概率;即,增加了一个运行时长维度参数,并利用该运行时长维度参数来重新确定宕机概率,从而可以有效确定突发事件对宕机概率的影响。
[0069]步骤S606:根据服务器在预定时间点上的宕机概率对服务器进行配置。优选地,所谓对服务器进行配置主要是在预计服务器宕机发生概率高的时间段增加备用服务器数量,而在低发的时间段可以相应的减少服务器备份数量,从而在效率上更好的实时配置实际需要运行的服务器数量。
[0070]在上述优选实施方式,同时获取运行时长维度参数和实际时间维度参数,从而通过两个方面来标识服务器的宕机概率,然后根据这两个参数计算得到服务器在预定时间点上的宕机概率,进而根据获取的结果对服务器进行配置,通过这种方式有效解决了现有技术中仅通过实际维度参数所指示的宕机概率对服务器进行配置而导致的对服务器的配置不合理的技术问题,达到了有效区分周期性规律和突发情况以提高对服务器进行配置的合理性的技术效果。
[0071]下面将结合几种优选的实施方式对上述步骤S604进行具体的描述。
[0072]在生成预定时间点上的宕机概率的过程中,可以先由运行时长维度上的宕机概率参数计算服务器的周期宕机参数,然后将实际时间维度参数和服务器周期宕机参数进行叠加最终得到预定时间点上的宕机概率,从而实现对服务器宕机概率的一个有效预测。在一个优选实施方式中,根据所述运行时长维度参数和实际时间维度参数计算所述服务器在预定时间点上的宕机概率可以如图7所示,包括以下步骤:
[0073]步骤S702:根据运行时长维度参数计算得到服务器周期参数,其中,服务器周期参数用于指示服务器在预定的每个运行时长周期上去除了由突发事件所带来的不规律值之后的宕机概率;
[0074]步骤S704:将服务器周期参数与实际时间维度参数进行叠加得到服务器在预定时间点上的宕机概率。
[0075]在上述运行时长维度参数是不同运行时长下服务器的实际宕机概率的情况下,根据所述运行时长维度参数计算得到服务器周期参数可以包括:
[0076]步骤S1:在每个运行时长周期内将不同运行时长下服务器的实际宕机概率进行平滑拟合,以得到服务器在不同运行时长下的拟合宕机概率,其中,每个周期内的运行时长的取值范围相同(即,在每个周期所对应的时间长度是相同的);
[0077]步骤S2:将实际宕机概率减去拟合宕机概率得到不同运行时长中每个运行时长下的差分值;
[0078]步骤S3:根据不同运行时长中每个运行时长下的差分值判断不同运行时长中的每个运行时长下是否存在由突发事件所带来的不规律值;
[0079]步骤S4:对于不同运行时长中的第一运行时长,将每个运行时长周期内第一运行时长下服务器的实际宕机概率的平均值减去第一运行时长下由突发事件所带来的不规律值,以得到服务器周期参数,其中,第一运行时长下存在由突发事件所带来的不规律值;
[0080]步骤S5:对于不同运行时长中的第二运行时长,将每个运行时长周期内第二运行时长下服务器的实际宕机概率的平均值作为所述服务器周期参数,其中,第二运行时长下不存在由突发事件所带来的不规律值。
[0081]在上述根据所述运行时长维度参数和实际时间维度参数计算所述服务器在预定时间点上的宕机概率的过程中的核心思想就是,先拟合得到在不同运行时长下服务器的宕机概率,然后,根据拟合得到的这样一个概率来计算实际宕机概率和该拟合概率之间的一个差分值,从而确定是否在这样一个运行时长内存在突发事件,如果有,就减去这样的一个突发事件带来的不规律值,如果没有就直接将拟合的概率作为最终的服务器周期参数。
[0082]优选地,上述拟合的方式可以采用线性拟合也可以采用非线性拟合,本申请在此不做限定,可以根据需要以及拟合的效果决定最终的拟合方式。在一个优选实施方式中,在所述每个运行时长周期内将所述不同运行时长下服务器的实际宕机概率进行平滑拟合可以包括:在每个运行时长周期内将不同运行时长下服务器的实际宕机概率进行线性拟合;或者在每个运行时长周期内将不同运行时长下服务器的实际宕机概率进行非线性拟合。
[0083]根据拟合概率曲线和实际的宕机概率曲线来确定是否存在有突发事件所带来的不规律的过程可以是预先设定一个阈值,如果差分值大于这样一个预定的阈值,则可以认为出现了突发事件所带来的不规律变化。优选地,对于这个突发事件所带来的不规律值可以是连续预定个周期内的差分值的一个平均值。通过这样一个求平均的运算可以提高该不规律值的可靠性。在一个优选实施方式中,根据所述不同运行时长中每个运行时长下的所述差分值判断所述不同运行时长中的每个运行时长下是否存在由突发事件所带来的不规律值可以对不同运行时长中的每个运行时长执行以下步骤来判断的,其中,当前执行的运行时长定义为第三运行时长:
[0084]步骤S1:判断是否连续预定个周期内的第三运行时长下的差分值的绝对值超过预定阈值;
[0085]步骤S2:若是连续预定个周期内的所述第三运行时长下的差分值的绝对值超过预定阈值,则判断出第三运行时长下存在由突发事件所带来的不规律值,并将连续预定个周期内的所述第三运行时长下的差分值进行平均,以作为所述第三运行时长下存在由突发事件所带来的不规律值;否则,则判断出所述第三运行时长下不存在由突发事件所带来的不规律值。
[0086]或者,也可以确定超出预定阈值的周期的个数是否达到一个设定值,如果大于,则可以认为存在突发事件。在一个优选实施方式中,根据所述不同运行时长中每个运行时长下的所述差分值判断所述不同运行时长中的每个运行时长下是否存在由突发事件所带来的不规律值包括:对于不同运行时长中的每个运行时长执行以下步骤,其中,当前执行的运行时长为第四运行时长:
[0087]步骤S1:统计符合预定条件的周期的个数,其中,预定条件为第四运行时长下的差分值的绝对值超过预定阈值;
[0088]步骤S2:判断符合预定条件的周期的个数是否超过预定个数;
[0089]步骤S3:若是符合预定条件的周期的个数超过预定个数,则判断出第四运行时长下存在由突发事件所带来的不规律值,并将符合预定条件的周期内第四运行时长下的差分值进行平均,以作为第四运行时长下存在由突发事件所带来的不规律值;否则,则判断出第四运行时长下不存在由突发事件所带来的不规律值。
[0090]实施例3
[0091]本申请提供了一种优选的实施例来进一步对本申请进行解释,但是值得注意的是,该优选实施例只是为了更好的描述本申请,并不构成对本申请不当的限定。
[0092]组成服务器中心总体宕机概率通常是由不同采购时间、投入运行时间以及不同运行时长的服务器组共同决定的,例如:10%的服务器组已经运行了 5年,15%的服务器组已经运行了 4年,……,20%的服务器组已经运行了 I年。以此类推,对于这些经历了不同运行时长的服务器组本身由于质量、品牌、以及配置的不同,对应的整个生命周期,通常都会经历由故障低发期,到故障稳定期,再到故障高发期。对于这样一个生命周期如果以运行时长为一个时间维度可以采用如图8所示的曲线来描述。其中,横轴为服务器组运行时长(以月份为单位),纵轴为宕机概率。由图8可知,一开始服务器为新机器时,发生宕机的概率非常低,然而运行一段时间后,机器开始老化,宕机发生概率就开始增长。对于硬件来说,这样的服务生命周期的模式本身是非常有规律和可观测的。
[0093]然而,不同的服务器组之间由于质量、品牌、以及配置之间存在着差异,因此如果把不同质量、品牌、以及配置的服务器组的宕机生命周期按照运行时长组合起来的话,就可以得出相似机群在不同月份(或年份)投入运行的各自的生命周期曲线。然后将这些不同月份(或年份)的周期曲线分别按照日期和运行时间来描述,就可以发现,不同的维度(运行时长)可以清晰的将外生因素和周期性因素从趋势线上分解出来。
[0094]以图9为例进行说明,图9中的,实线(即“一”线)、虚线I (即...”线)、虚线
2 (即“----”线)分别为2005年,2006年,2007年投入运行的所有服务器组。由于投入
运行时间点在时间轴上是不同的,可以看到他们的宕机发生率是错开的。这是一种排列宕机发生率的方式。作为另外一种排列方式,也可以以实际运行时长作为横轴来排列,如图10所示,这样同样的3条曲线将叠在一起,因为他们基本上都会有一个从低到平稳到高的整体趋势,这种生命周期在服务器硬件的集群上是通常是非常有规律和可观测的。
[0095]很明显的可以看到,通过不同的排列方式,同样发生的一个外生随机事件(B卩,突发事件),即图9和图10中的虚线部分,在图9中由于重叠在一个时间点上,很难被区分开,但是在不同维度上(运行时长上)可以被明确的分离开。因为显然,同样的突发事件对于这3组机群来讲是发生在它们各自不同的运行生命周期月份上的。
[0096]具体的分解方法如下(参考表1,周期以月度为例子,其中的列A-1表述了整个分解流程):`[0097]步骤S1:(表1 jl」A-D):以服务器为单位,根据投入运行时间(即运行时长)和日期,对其实际发生的宕机率进行汇总,汇总后的数据将呈现为表1中列A至列D。
[0098]根据表1中的数据,通过不同维度的展现,就可以构造出图9和图10的分解曲线(曲线只是作为示意)。
[0099]表1
[
【权利要求】
1.一种服务器的配置方法,其特征在于,包括: 获取运行时长维度参数和实际时间维度参数,其中,所述运行时长维度参数用于指示不同运行时长下服务器的宕机概率,所述实际时间维度参数用于指示不同实际时间下所述服务器的宕机概率; 根据所述运行时长维度参数和实际时间维度参数计算所述服务器在预定时间点上的宕机概率; 根据所述服务器在预定时间点上的宕机概率对所述服务器进行配置。
2.根据权利要求1所述的方法,其特征在于,根据所述运行时长维度参数和实际时间维度参数计算所述服务器在预定时间点上的宕机概率包括: 根据所述运行时长维度参数计算得到服务器周期参数,其中,所述服务器周期参数用于指示所述服务器在预定的每个运行时长周期上去除了由突发事件所带来的不规律值之后的宕机概率; 将所述服务器周期参数与实际时间维度参数进行叠加得到所述服务器在预定时间点上的宕机概率。
3.根据权利要求2所述的方法,其特征在于,所述运行时长维度参数为所述不同运行时长下服务器的实际宕机概率,根据所述运行时长维度参数计算得到服务器周期参数包括: 在所述每个运行时长周期内将所述不同运行时长下服务器的实际宕机概率进行平滑拟合,以得到所述服务器在所述不同运行时长下的拟合宕机概率,其中,所述每个周期内的运行时长的取值范围相同;· 将所述实际宕机概率减去所述拟合宕机概率得到所述不同运行时长中每个运行时长下的差分值; 根据所述不同运行时长中每个运行时长下的所述差分值判断所述不同运行时长中的每个运行时长下是否存在由突发事件所带来的不规律值; 对于所述不同运行时长中的第一运行时长,将所述每个运行时长周期内所述第一运行时长下服务器的实际宕机概率的平均值减去所述第一运行时长下由突发事件所带来的不规律值,以得到所述服务器周期参数,其中,所述第一运行时长下存在由突发事件所带来的不规律值; 对于所述不同运行时长中的第二运行时长,将所述每个运行时长周期内所述第二运行时长下服务器的实际宕机概率的平均值作为所述服务器周期参数,其中,所述第二运行时长下不存在由突发事件所带来的不规律值。
4.根据权利要求3所述的方法,其特征在于,在所述每个运行时长周期内将所述不同运行时长下服务器的实际宕机概率进行平滑拟合包括: 在所述每个运行时长周期内将所述不同运行时长下服务器的实际宕机概率进行线性拟合;或者 在所述每个运行时长周期内将所述不同运行时长下服务器的实际宕机概率进行非线性拟合。
5.根据权利要求3所述的方法,其特征在于,根据所述不同运行时长中每个运行时长下的所述差分值判断所述不同运行时长中的每个运行时长下是否存在由突发事件所带来的不规律值包括: 对于所述不同运行时长中的每个运行时长执行以下步骤,其中,当前执行的运行时长为第三运行时长: 判断是否连续预定个周期内的所述第三运行时长下的差分值的绝对值超过预定阈值; 若是所述连续预定个周期内的所述第三运行时长下的差分值的绝对值超过预定阈值,则判断出所述第三运行时长下存在由突发事件所带来的不规律值,并将所述连续预定个周期内的所述第三运行时长下的差分值进行平均,以作为所述第三运行时长下存在由突发事件所带来的不规律值;否则,则判断出所述第三运行时长下不存在由突发事件所带来的不规律值。
6.根据权利要求3所述的方法,其特征在于,根据所述不同运行时长中每个运行时长下的所述差分值判断所述不同运行时长中的每个运行时长下是否存在由突发事件所带来的不规律值包括: 对于所述不同运行时长中的每个运行时长执行以下步骤,其中,当前执行的运行时长为第四运行时长: 统计符合预定条件的周期的个数,其中,所述预定条件为所述第四运行时长下的差分值的绝对值超过预定阈值; 判断所述符合预定条件的周期的个数是否超过预定个数; 若是所述符合预定条件的周期的 个数超过所述预定个数,则判断出所述第四运行时长下存在由突发事件所带来的不规律值,并将所述符合预定条件的周期内所述第四运行时长下的差分值进行平均,以作为所述第四运行时长下存在由突发事件所带来的不规律值;否贝U,则判断出所述第四运行时长下不存在由突发事件所带来的不规律值。
7.一种服务器的配置装置,其特征在于,包括: 获取单元,用于获取运行时长维度参数和实际时间维度参数,其中,所述运行时长维度参数用于指示不同运行时长下服务器的宕机概率,所述实际时间维度参数用于指示不同实际时间下所述服务器的宕机概率; 计算单元,用于根据所述运行时长维度参数和实际时间维度参数计算所述服务器在预定时间点上的宕机概率; 配置单元,用于根据所述服务器在预定时间点上的宕机概率对所述服务器进行配置。
8.根据权利要求7所述的装置,其特征在于,所述计算单元包括: 计算模块,用于根据所述运行时长维度参数计算得到服务器周期参数,其中,所述服务器周期参数用于指示所述服务器在预定的每个运行时长周期上去除了由突发事件所带来的不规律值之后的宕机概率; 叠加模块,用将所述服务器周期参数与实际时间维度参数进行叠加得到所述服务器在预定时间点上的宕机概率。
9.根据权利要求8所述的装置,其特征在于,所述计算模块包括: 拟合子模块,用于在所述运行时长维度参数为所述不同运行时长下服务器的实际宕机概率的情况下,在所述每个运行时长周期内将所述不同运行时长下服务器的实际宕机概率进行平滑拟合,以得到所述服务器在所述不同运行时长下的拟合宕机概率,其中,所述每个周期内的运行时长的取值范围相同; 第一计算子模块,用于将所述实际宕机概率减去所述拟合宕机概率得到所述不同运行时长中每个运行时长下的差分值; 判断子模块,用于根据所述不同运行时长中每个运行时长下的所述差分值判断所述不同运行时长中的每个运行时长下是否存在由突发事件所带来的不规律值; 第二计算子模块,用于对于所述不同运行时长中的第一运行时长,将所述每个运行时长周期内所述第一运行时长下服务器的实际宕机概率的平均值减去所述第一运行时长下由突发事件所带来的不规律值,以得到所述服务器周期参数,其中,所述第一运行时长下存在由突发事件所带来的不规律值; 第三计算子模块,用于对于所述不同运行时长中的第二运行时长,将所述每个运行时长周期内所述第二运行时长下服务器的实际宕机概率的平均值作为所述服务器周期参数,其中,所述第二运行时长下不存在由突发事件所带来的不规律值。
10.根据权利要求9所述的装置,其特征在于,所述判断子模块还用于对所述不同运行时长中的每个运行时长执行以下步骤,其中,当前执行的运行时长为第三运行时长: 判断是否连续预定个周期内的所述第三运行时长下的差分值的绝对值超过预定阈值; 若是所述连续预定个周期内的所述第三运行时长下的差分值的绝对值超过预定阈值,则判断出所述第三运行时长下存在由突发事件所带来的不规律值,并将所述连续预定个周期内的所述第三运行时长下的差分值进行平均,以作为所述第三运行时长下存在由突发事件所带来的不规律值;否则,则判断出所述第三运行时长下不存在由突发事件所带来的不规律值。·
【文档编号】G06F15/177GK103856348SQ201210520886
【公开日】2014年6月11日 申请日期:2012年12月6日 优先权日:2012年12月6日
【发明者】盛子夏, 叶家杰 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1