一种服务调度方法、装置和服务调度系统的制作方法

文档序号:7682457阅读:187来源:国知局
专利名称:一种服务调度方法、装置和服务调度系统的制作方法
技术领域
本发明涉及网络应用(Application)技术领域,更具体地说,本发明涉 及一种服务调度方法、装置和服务调度系统。
背景技术
在现有的互联网等大型服务系统中,都有一系列的服务器(Server)来 支撑服务。这些服务器上运行着一系列的服务,其中某些关键服务需要提供 较高的服务质量,即需要将无法服务时间控制在一定程度内。对于这些关键服务,目前通常会采取l.. 1的热备份系统来予以支撑。 比如,假设某关键服务需要2台服务器来支撑,则需要在后台另外设置2台 与前台服务器硬件上接近的服务器作为备份设备。平时大部分时间,后台的 2台后台服务器处于空闲状态,但仍处于运行状态。在这种1: l的备份方案中,由于使用硬件性能接近的服务器以及采用 与前台服务器1: 1的数量分布, 一旦前台服务器异常,后台服务器可以立 即顶替并运行同样的服务程序,因此服务性能无任何损失。但是,1: 1的 服务备份方式中后台服务器长期处于空闲状态,因此会浪费资源,不利于节 约运行维护成本。目前,还有一种能够节约成本的1: n服务备份方案。在这种1: n的服 务备份方案中,后台使用与前台服务器硬件性能有一定差距的后台服务器, 前端服务器与后台服务器成1: n的数量分布,其中n大于l,而且每台后 台服务器中只运行单一种类的服务。比如,假设某关键服务A需要1台服 务器来支撑,则需要在后台另外设置n台与前台服务器硬件性能有一定差距 的服务器作为备份设备,而且每台后台服务器中只运行关键服务A,其中n大于1。在这种1: n的服务备份方案中,由于采用了较多的硬件设备,必 然也会占用较多的硬件放置空间,相应的也会消耗较多的周边资源,如供电, 空调等设施,而且过多的设备显然也会增加运维成本,因此1: n的服务备 份方案也不利于降低运行维护成本。由此可见,无论是L l的备份方案还是l: n的备份方案,都不利于降 低运行维护成本。发明内容本发明实施例提出 一 种服务调度方法,以降低运行维护成本。 本发明实施例提出一种服务调度装置,以降低运行维护成本。 本发明实施例还提出 一种服务调度系统,以降低运行维护成本。 本发明实施例的技术方案如下 一种服务调度方法,所述方法包括根据前台服务的历史运行记录计算前台服务出现最大异常的概率,并根据 所述概率确定准备替换所述前台服务的后台服务备用资源量;所述前台服务有异常时计算恢复所述服务需要的资源量,并从所述后台 服务备用资源量中调用该计算出的资源量以恢复该异常前台服务。一种服务调度装置,所述服务调度装置包括备用资源量确定单元,用于根据前台服务的历史运行记录计算前台服务出 用资源量;服务恢复单元,用于当前台服务有异常时计算恢复所述服务需要的资源 量,并从所述后台服务备用资源量中调用该计算出的资源量以恢复该异常前 台服务。一种服务恢复系统,所述系统包括前台服务器群、后台服务器群和服务切 换单元,其中前台服务器群由至少两台前台服务器组成,后台服务器群由至少 两台后台服务器组成;其中所述前台服务器群,用于运行前台服务;所述服务切换单元,用于当前台服务有异常时计算恢复所述服务需要的资 源量,并从后台服务器群备用资源量中调用该计算出的资源量以恢复该异常前台服务;所述后台服务器群,用于接收服务切换单元的调用恢复出现异常的前台 服务,所述后台服务器群的备用资源量是根据前台服务器群历史运行记录计 算出的前台服务最大异常概率所确定的。从上述技术方案中可以看出,在本发明实施例中,首先根据前台服务的 历史运行记录计算前台服务出现最大异常的概率,并根据该概率确定准备替 换所述前台服务的后台服务备用资源量;然后再从后台服务备用资源量中调 用资源量以恢复该异常服务。由此可见,本发明实施例既没有采用成本昂贵 的1: l备份方案,也没有简单地釆用1: n备份方案,而是首先根据概率确 定准备替换前台服务的后台服务备用资源量,在备份资源和服务质量之间取 得了动态平衡点,因此可以更好地降低运行维护成本,并且能够保证服务质 量。另外,应用本发明实施例以后,通过对资源有沖突的服务进行调度,可 以在同一台后台服务器上同时运行不同服务,从而可以更好地利用资源。并 且,应用本发明实施例以后,人为干预程度较低,可以降低运营人员的劳动 强度。


图i为根据本发明实施例的服务调度方法示范性流程图; 图2为根据本发明实施例的服务调度装置示范性结构图; 图3为根据本发明实施例的服务恢复系统的示范性结构图。
具体实施方式
为使本发明的目的、技术方案和优点表达得更加清楚明白,下面结合附图及具体实施例对本发明再作进一步详细的说明。在本发明实施例中,首先根据前台服务的历史运行记录计算前台服务出 现最大异常的概率,并根据该概率确定准备替换所述前台服务的后台服务备用资源量;然后再从后台服务备用资源量中调用资源量以恢复该异常服务。 另外,在本发明实施例中,作为后台服务器的后台服务器可以不再运行 单一种类的服务,而是可以运行多种服务,并在前台服务器发生异常时可动 态调度所需要的后台服务器数量和对应运行的服务类型与数据资源。 图1为根据本发明实施例的服务调度方法示范性流程图。 如图1所示,该方法包括步骤101:根据前台服务的历史运行记录计算前台服务出现最大异常的 概率,并根据所述概率确定准备替换所述前台服务的后台服务备用资源量。其中,运行前台服务的前台服务器可以为一台、两台或者两台以上。当 前台服务器的数量为两台或者两台以上时,根据运行前台服务的各前台服务 器的历史运行记录计算所有前台服务器同时出现异常的概率,并根据所述概 率确定后台服务的备用资源量。其中,可以实时或者半实时地监控前台服务 器的运行状态并调控这些服务所需要的数据资源,还可以建立前端服务和所 需资源的动态列表。同样地,运行后台服务的后台服务器也可以为一台、两台或者两台以上。 当后台服务器的数量大于一台时,后台服务器的备用资源量由各台后台服务务,而是可以在同一台后台服务器上运行多种服务。同样地,可以实时或者 半实时地监控后台服务器的运行状态并调控这些服务所需要的数据资源,还 可以建立后台服务器的可用资源动态列表。步骤102:前台服务有异常时计算恢复所述服务需要的资源量,并从所 述后台服务备用资源量中调用该计算出的资源量以恢复该异常前台服务。以上流程中,优选地,当至少两种前台服务同时出现异常时,首先计算 恢复该至少两种前台服务需要的资源量,从后台服务备用资源量中调用计算出的资源量以恢复该至少两种前台服务,其中至少有一台后台服务器同时运 行所述至少两种出现异常的前台服务。比如假设有A、 B、 C三种服务同时对外服务。简单起见,可以分别 运行在Sa、 Sb、 Sc三台前台服务器上。根据Sa 、 Sb、 Sc服务的日常监控 记录,可以分别计算出Sa、 Sb、 Sc的失败率,即需要后台服务器立刻顶替 A、 B、 C服务的概率,这样可以计算出Sa、 Sb、 Sc这三台前台服务器同时 出现异常的概率(通常是最极端的情况),根据这个概率可以确定准备替换 前台服务的最低后台服务备用资源量。进一步,还可以根据后台服务器的运 行参数以及所确定的后台服务备用资源量,来确定需要的具体后台服务器数 量N。假设每台后台服务器上都可部署并运行A、 B、 C三种服务,则任何1 台后台服务器可随时顶替在线的前台服务器的任何服务。假设前台服务器Sa发生异常,则检视可用的后台服务器资源后,发现有N台后台服务器可 用,计算出顶替Sa机对外服务性能所需要的后台服务器数量后(假设为0.5, 则需要1台后台服务器即可),则可以向后台服务器可用资源动态列表中的 后台服务器B1发出调控指令,将1台后台服务器的服务调整为A并对外服 务,同时更新后台服务器可用资源动态列表。至此,完成l个备份服务的调 度和切换过程。假如在前台服务器Sa异常后,前台服务器Sb也发生异常,类似上面过 程,如果计算出需要1.5台后台服务器,则动态调度另一台后台服务器B2 运行服务B,并更新后台服务器可用资源动态列表,完成对应的服务和资源 调度。假设A、 B服务可同时在一台服务器上运行,则可将正在运行服务A 的后台服务器Bl的B服务调度成运行状态,这样B2和Bl同时对外运行顶 替Sb服务,同时更新后台服务器可利用资源列表。当Sa或Sb异常修复后, 可以反向调度上述过程并更新对应的资源列表。可见,应用本流程以后,可以较为经济地动态部署后台服务器的数量和 服务种类,可最大限度的利用后台服务器的性能,同时最大限度的维持前端另外,当至少两种前台服务出现异常且所述前台服务相互冲突时,不在 同一台后台服务器同时运行所述出现冲突的前台服务,从而避免在同一台服 务器上同时运行几个有沖突的服务。具体地,由于同一台后台服务器需要支撑多种服务,可能会遇到需要的 软件和数据资源冲突的情况,这就需要一个沖突服务调度机制,负责避免在 同一台服务器上同时运行几个有冲突的服务。根据运营的统计数据,可以荻 得一个有较高故障率的服务列表,根据这个动态列表,来调整后台服务器上运行的服务和服务的数量,以此来满足可能发生异常情况时用最少的时间来 完成后台服务器顶替服务的调度过程。对于有冲突的服务而言,可以得到这 些服务的失败概率和相关的失败序列概率(即A服务异常后B服务通常也 会发生异常),这样就可以得到一个动态更新的故障率服务列表,由此可以 动态调度某一时刻处于预备状态的服务资源。本发明实施例所需要的后台服务器数量是一个动态的数字,可根据近期 的服务质量监控得出一个预测值,根据这个预测值来调整处于备份运营状态 的服务器资源,或增或减。基于上述分析,本发明还提出了一种服务调度装置。图2为根据本发明实施例的服务调度装置的结构示意图。 如图2所示,该服务调度装置包括备用资源量确定单元201,用于根据前台服务的历史运行记录计算前台服 务出现最大异常的概率,并根据所述概率确定准备替换所述前台服务的后台服 务备用资源量;服务恢复单元202,用于当前台服务有异常时计算恢复所述服务需要的 资源量,并从所述后台服务备用资源量中调用该计算出的资源量以恢复该异 常前台服务。本发明还提出了一种服务恢复系统。图3为根据本发明实施例的服务恢复系统的结构示意图。如图3所示,该系统包括前台服务器群301、后台服务器群302和服务切 换单元303,其中前台服务器群301由至少两台前台服务器组成,后台服务器 群302由至少两台后台服务器组成;其中所述前台服务器群301,用于运行前台服务;所述服务切换单元303,用于当前台服务有异常时计算恢复所述服务需要 的资源量,并从后台服务器群备用资源量中调用该计算出的资源量以恢复该异 常前台服务;所述后台服务器群302,用于接收服务切换单元303的调用恢复出现异 常的前台服务,所述后台服务器群的备用资源量是根据前台服务器群历史运 行记录计算出的前台服务最大异常概率所确定的。优选地,服务切换单元303,用于根据运行所述前台服务的各前台服务 器的历史运行记录计算所有前台服务器同时出现异常的概率,并根据所述概 率确定准备替换所述前台服务的后台服务备用资源量。优选地,服务切换单元303,用于当至少两种前台服务出现异常时,计算 恢复所述两种前台服务需要的资源量,并从所述后台服务器群备用资源量中调 用该计算出的资源量以恢复该异常前台服务;此时所述后台服务器群中至少有 一台后台服务器同时运行所述至少两种出现异常的前台服务。该服务恢复系统还可以进一步包括前台服务监控单元304,所述前台服务监控单元304,用于监控前台服务的运行状况,并在所述前 台服务出现异常时向所述服务切换单元303发出报警信息,此时所述服务切换单元303,用于响应于所述报警信息计算恢复所述异常服 务需要的资源量,并从所述后台服务器群备用资源量中调用该计算出的资源 量以恢复该异常服务。该服务恢复系统进一步包括后台服务监控单元305,所述后台服务监控单元305,用于当至少两种前台服务出现异常且所述 前台服务相互沖突时,不在同一台后台服务器同时运行所述出现冲突的服 务。综上所述,在本发明实施例中,首先根据前台服务的历史运行记录计算 前台服务出现最大异常的概率,并根据该概率确定准备替换所述前台服务的后台服务备用资源量;然后再从后台服务备用资源量中调用资源量以恢复该 异常服务。由此可见,本发明实施例既没有采用成本高的1: 1备份方案, 也没有简单地采用1: n备份方案,而是首先根据概率确定准备替换前台服 务的后台服务备用资源量,在备份资源和服务质量之间取得了动态平衡点, 因此可以更好地降低运行维护成本,并且能够保证服务质量。另外,应用本发明实施例以后,人为干预程度较低,可以降低运营人员 的劳动强度。而且,应用本发明实施例后可以在一台后台服务器上同时运行 不同服务,可以更好地利用资源。以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护 范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等, 均应包含在本发明的保护范围之内。
权利要求
1、一种服务调度方法,其特征在于,所述方法包括根据前台服务的历史运行记录计算前台服务出现最大异常的概率,并根据所述概率确定准备替换所述前台服务的后台服务备用资源量;所述前台服务有异常时计算恢复所述服务需要的资源量,并从所述后台服务备用资源量中调用该计算出的资源量以恢复该异常前台服务。
2、 根据权利要求1所迷的服务调度方法,其特征在于,运行所述前台服务 的前台服务器至少为两台;所述根据前台服务的历史运行记录计算前台服务出现最大异常的概率,并根据运行所述前台服务的各前台服务器的历史运行记录计算所有前台服务 器同时出现异常的概率,并根据所述概率确定准备替换所述前台服务的后台服 务备用资源量。
3、 根据权利要求2所述的服务调度方法,其特征在于,运行替换所述前台 服务的后台服务的后台服务器至少为两台,所述后台服务器备用资源量由各台后台服务器共同承担。
4、 根据权利要求3所述的服务调度方法,其特征在于,所述方法中,当至 少两种前台服务同时出现异常时,计算恢复所述至少两种前台服务需要的资源 量,从所述后台服务备用资源量中调用计算出的资源量以恢复该至少两种前台服务,其中至少有一台后台服务器同时运行所述至少两种出现异常的前台服务。
5、 根据权利要求4所述的服务调度方法,其特征在于,当至少两种前台服 务出现异常且所述前台服务相互冲突时,不在同一台后台服务器同时运行所述 出现冲突的前台服务。
6、 一种服务调度装置,其特征在于,所述服务调度装置包括 备用资源量确定单元,用于根据前台服务的历史运行记录计算前台服务出现最大异常的概率,并根据所迷概率确定准备替换所述前台服务的后台服务备用资源量;服务恢复单元,用于当前台服务有异常时计算恢复所述服务需要的资源量, 并从所述后台服务备用资源量中调用该计算出的资源量以恢复该异常前台服 务。
7、 一种服务恢复系统,其特征在于,所述系统包括前台服务器群、后台服 务器群和服务切换单元,其中前台服务器群由至少两台前台服务器组成,后台 服务器群由至少两台后台服务器组成;其中所述前台服务器群,用于运行前台服务;所述服务切换单元,用于当前台服务有异常时计算恢复所述服务需要的资 源量,并从后台服务器群备用资源量中调用该计算出的资源量以恢复该异常前 台服务;所述后台服务器群,用于接收服务切换单元的调用恢复出现异常的前台服 务,所述后台服务器群的备用资源量是根据前台服务器群历史运行记录计算出 的前台服务最大异常概率所确定的。
8、 根据权利要求7所述的服务恢复系统,其特征在于, 所述服务切换单元,用于根据运行所述前台服务的各前台服务器的历史运行记录计算所有前台服务器同时出现异常的概率,并根据所述概率确定准备替 换所述前台服务的后台服务备用资源量。
9、 根据权利要求7所述的服务恢复系统,其特征在于, 所迷服务切换单元,用于当至少两种前台服务出现异常时,计算恢复所述两种前台服务需要的资源量,并从所述后台服务器群备用资源量中调用该计算 出的资源量以恢复该异常前台服务;所述后台服务器群中至少有一台后台服务器同时运行所述至少两种出现异 常的前台服务。
10、 根据权利要求7、 8或9所述的服务恢复系统,其特征在于,所述服务 恢复系统进一步包括前台服务监控单元,所述前台服务监控单元,用于监控前台服务的运行状况,并在所述前台服务出现异常时向所述服务切换单元发出报警信息,所述服务切换单元,用于响应于所述报警信息计算恢复所述异常服务需要 的资源量,并从所述后台服务器群备用资源量中调用该计算出的资源量以恢复 该异常服务。
11、根据权利要求7、 8或9所述的服务恢复系统,其特征在于,所述服务恢复系统进一 步包括后台服务监控单元,所述后台服务监控单元,用于当至少两种前台服务出现异常且所述前台服 务相互沖突时,不在同 一 台后台服务器同时运行所述出现沖突的服务。
全文摘要
本发明公开了一种服务调度方法,该方法包括根据前台服务的历史运行记录计算前台服务出现最大异常的概率,并根据所述概率确定准备替换所述前台服务的后台服务备用资源量;所述前台服务有异常时计算恢复所述服务需要的资源量,并从所述后台服务备用资源量中调用该计算出的资源量以恢复该异常前台服务。本发明还公开了一种服务调度装置和服务恢复系统。应用本发明以后,可以降低运行维护成本,而且可以在同一台后台服务器上同时运行不同服务,可以更好地利用资源。
文档编号H04L12/24GK101222362SQ20081000234
公开日2008年7月16日 申请日期2008年1月8日 优先权日2008年1月8日
发明者晖 王 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1