一种故障自愈方法及系统的制作方法_2

文档序号:9237947阅读:来源:国知局
应的内部标识,根据所述内部标识将与所述内部标 识对应的服务器标记为预处理服务器。
[0056] 进一步地,所述方法还包括:
[0057] 根据内部标识累计每个子集群中预处理服务器的数量,并根据所述预处理服务器 的数量确定每个子集群的预警状态。
[0058] 本发明实施例故障自愈方法及系统可以通过JSP(JavaServerPages)视图技术 和javascript脚本技术,将调用服务器失败的次数、或者子集群中预处理服务器的个数, 与故障自愈系统中预警颜色模块中的颜色对应,达到预警提示目的。
[0059] 具体地,表1为预处理服务器的个数、与预警颜色和预警等级的关系表,如表1所 示,将预处理服务器的个数、与预警模块中的预警颜色进行对应,得到预警等级,以便工作 人员根据预警等级对存在问题的服务器进行维修。
[0060]
[0061]表 1
[0062] 本发明实施例采用集群中的子集群作为服务节点,且每个子集群至少包括两台服 务器,且各个服务器均能独立实现与服务器对应的服务节点的功能,当某台服务器发生故 障时,调用与所述服务器处于同一服务节点的其他服务器作为备用设备,以保障业务通信 系统的正常运行,因此,本发明实施例方法能实现同一服务节点中的各个服务器间的自动 切换功能,使互联网中的业务通信系统自动修复,维持系统的正常运行;
[0063] 另外,由于标记并记录每个子集群中发生故障的服务器的累计个数,因此,本发明 实施例方法能根据累计个数预警子集群的状态,便于管理人员检测,为业务通信系统的正 常运行奠定基础。
[0064] 为实现上述方法,本发明实施例还提供了一种对应于上述方法的故障自愈系统, 如图2所示,所述系统包括:
[0065] 获取单元21,用于确定第一服务器未能正常运行时,获取所述第一服务器当前的 业务数据信息及业务配置信息;
[0066] 查找单元22,用于查找当前能调用的第二服务器;
[0067] 发送单元23,用于将所述业务数据信息及业务配置信息发送至所述第二服务器, 使所述第二服务器利用所述业务配置信息进行业务配置,并根据所述业务数据信息执行所 述第一服务器未能正常运行时的当前业务;
[0068] 其中,所述第一服务器为处于集群中的子集群中的任意一个服务器,所述第二服 务器为与所述第一服务器处于同一子集群中的不同的服务器。
[0069] 进一步地,所述集群至少包括两个以上的子集群,且所述子集群包括至少两个以 上的服务器。
[0070] 进一步地,所述系统还包括:
[0071] 分配单元,用于为集群中的每个子集群分配标识,将子集群的标识分别作为子集 群中的各服务器的外部标识;还用于为每个子集群中各服务器分配互不相同的内部标识;
[0072] 对应地,如图3所示,所述查找单元22包括:
[0073] 确定子单元221,用于确定未能正常运行的所述第一服务器的外部标识和内部标 识;
[0074] 查找子单元222,用于根据所述外部标识查找与所述外部标识相同的、并根据所述 内部标识查找与所述第一服务器的内部标识不相同的、且当前能调用的第二服务器。
[0075] 进一步地,所述系统还包括:
[0076] 标记单元,用于标记并记录所述第一服务器对应的内部标识,根据所述内部标识 将与所述内部标识对应的服务器标记为预处理服务器。
[0077] 进一步地,所述系统还包括:
[0078] 累计单元,用于根据内部标识累计每个子集群中预处理服务器的数量,并根据所 述预处理服务器的数量确定每个子集群的预警状态。
[0079] 这里,所述获取单元、查找单元、发送单元、分配单元、标记单元以及累计单元均可 以运行于计算机上,可由位于计算机上的中央处理器(CPU)、或微处理器(MPU)、或数字信 号处理器(DSP)、或可编程门阵列(FPGA)实现。
[0080] 采用本发明实施例故障自愈预警方法及系统时,当某一服务节点对应的服务器发 生故障时,与所述故障自愈预警方法对应的故障自愈预警系统能自动调用与所述唯一外部 标识对应子集群中的其他服务器,以保障业务通信系统的正常运行;另外,本发明实施的 故障自愈预警方法及系统采用分布式集群,且所述分布式集群中的子集群分布在不同的网 络、不同的地域中,因此,能避免自然灾害对系统的摧毁性打击。
[0081] 以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
【主权项】
1. 一种故障自愈方法,其特征在于,所述方法包括: 确定第一服务器未能正常运行时,获取所述第一服务器当前的业务数据信息及业务配 置信息; 查找当前能调用的第二服务器,并将所述业务数据信息及业务配置信息发送至所述第 二服务器,使所述第二服务器利用所述业务配置信息进行业务配置,并根据所述业务数据 信息执行所述第一服务器未能正常运行时的当前业务; 其中,所述第一服务器为处于集群中的子集群中的任意一个服务器,所述第二服务器 为与所述第一服务器处于同一子集群中的不同的服务器。2. 根据权利要求1所述的方法,其特征在于,所述集群至少包括两个以上的子集群,且 所述子集群包括至少两个以上的服务器。3. 根据权利要求1或2所述的方法,其特征在于,所述方法还包括: 为集群中的每个子集群分配标识,将子集群的标识分别作为子集群中的各服务器的外 部标识; 为每个子集群中各服务器分配互不相同的内部标识; 对应地,所述查找当前能调用的第二服务器,包括: 确定未能正常运行的所述第一服务器的外部标识和内部标识,根据所述外部标识查 找与所述外部标识相同的、并根据所述内部标识查找与所述第一服务器的内部标识不相同 的、且当前能调用的第二服务器。4. 根据权利要求3所述的方法,其特征在于,所述确定第一服务器未能正常运行之后, 所述方法还包括: 标记并记录所述第一服务器对应的内部标识,根据所述内部标识将与所述内部标识对 应的服务器标记为预处理服务器。5. 根据权利要求4所述的方法,其特征在于,所述方法还包括: 根据内部标识累计每个子集群中预处理服务器的数量,并根据所述预处理服务器的数 量确定每个子集群的预警状态。6. -种故障自愈系统,其特征在于,所述系统包括: 获取单元,用于确定第一服务器未能正常运行时,获取所述第一服务器当前的业务数 据信息及业务配置信息; 查找单元,用于查找当前能调用的第二服务器; 发送单元,用于将所述业务数据信息及业务配置信息发送至所述第二服务器,使所述 第二服务器利用所述业务配置信息进行业务配置,并根据所述业务数据信息执行所述第一 服务器未能正常运行时的当前业务; 其中,所述第一服务器为处于集群中的子集群中的任意一个服务器,所述第二服务器 为与所述第一服务器处于同一子集群中的不同的服务器。7. 根据权利要求6所述的系统,其特征在于,所述集群至少包括两个以上的子集群,且 所述子集群包括至少两个以上的服务器。8. 根据权利要求6或7所述的系统,其特征在于,所述系统还包括: 分配单元,用于为集群中的每个子集群分配标识,将子集群的标识分别作为子集群中 的各服务器的外部标识;还用于为每个子集群中各服务器分配互不相同的内部标识; 对应地,所述查找单元包括: 确定子单元,用于确定未能正常运行的所述第一服务器的外部标识和内部标识; 查找子单元,用于根据所述外部标识查找与所述外部标识相同的、并根据所述内部标 识查找与所述第一服务器的内部标识不相同的、且当前能调用的第二服务器。9. 根据权利要求8所述的系统,其特征在于,所述系统还包括: 标记单元,用于标记并记录所述第一服务器对应的内部标识,根据所述内部标识将与 所述内部标识对应的服务器标记为预处理服务器。10. 根据权利要求9所述的系统,其特征在于,所述系统还包括: 累计单元,用于根据内部标识累计每个子集群中预处理服务器的数量,并根据所述预 处理服务器的数量确定每个子集群的预警状态。
【专利摘要】本发明公开了一种故障自愈方法,包括:确定第一服务器未能正常运行时,获取所述第一服务器当前的业务数据信息及业务配置信息;查找当前能调用的第二服务器,并将所述业务数据信息及业务配置信息发送至所述第二服务器,使所述第二服务器利用所述业务配置信息进行业务配置,并根据所述业务数据信息执行所述第一服务器未能正常运行时的当前业务;其中,所述第一服务器为处于集群中的子集群中的任意一个服务器,所述第二服务器为与所述第一服务器处于同一子集群中的不同的服务器。本发明还公开了一种故障自愈系统。
【IPC分类】H04L12/24
【公开号】CN104954157
【申请号】CN201410118947
【发明人】钱堃
【申请人】中国移动通信集团湖北有限公司
【公开日】2015年9月30日
【申请日】2014年3月27日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1