一种综合前端系统故障处理方法及计算机设备的制作方法

文档序号:6582419阅读:186来源:国知局
专利名称:一种综合前端系统故障处理方法及计算机设备的制作方法
技术领域
本发明涉及计算机应用领域,尤其涉及一种综合前端系统故障处理方法 及计算机设备。
背景技术
目前银行前端上线营运系统的重大故障(服务器宕机等)处理模式基本 上停留在前台报告故障,分析运维人员经过初步分析后,通过热线与后台技 术专家团队沟通,由后台专家远程分析解决问题,其实现的全过程基本上全 部由人工完成。
随着银行业务的发展,银行对生产系统稳定运行的要求越来越严格,传 统的全人工处理流程无法满足整个系统运营的要求,由于完全靠人工处理,
诊断全凭经验,许多情况下无法立刻给出处理预案,难以保证运行的稳定性; 且对于故障出现之后,其诊断过程和分析取决于维护人员和专家团队的沟通 效率,/人而不能保证快速解决故障,而且人工解决方式其人工成本也4艮高。

发明内容
鉴于上述现有技术所存在的问题,本发明提供了一种综合前端系统故障 处理方法及计算机设备,对于综合前端系统出现的故障采取不同的处理方法。
为了达到上述发明目的,本发明提供了一种综合前端系统故障处理方法, 包括
检测综合前端系统是否出现故障;
当检测到综合前端系统出现了故障时,分析所述故障的类别; 当分析出所述故障的类別时,根据所述故障的类别选择所迷故障的类别 所对应的故障处理模式对所述故障进行处理。
相应地,本发明还提供了一种计算机设备,包括 检测模块,用于检测综合前端系统是否出现故障;分析模块,用于当所述检测模块检测到综合前端系统出现了故障时,分
析所述故障的类别;
处理模块,用于当所述分析模块分析出所述故障的类别时,根据所述故 障的类别选择所对应的故障处理才莫式对所迷故障进行处理。
通过实施本发明,在;^测综合前端系统出现故障时,对出现的故障进行 分析出故障的类别,再根据故障的类别选择所对应的故障处理^i式对故障进 行处理,这样通过针对不同级別的故障,采用不同的处理模式,减少处理时 间,保障了系统连续稳定的运行。


图l是本发明实施例的综合前端系统故障处理方法的流程图; 图2是本发明实施例的计算机设备的结构示意图。
具体实施例方式
实施本发明实施例通过在综合前端系统增加了故障诊断手段和处理手段, 改变了以往完全依赖于人工诊断和处理故障的模式,下面结合附图来详细说 明。
首先,请参阅图l,图l示出了本发明实施例的综合前端系统故障处理方 法的流程图,包括以下步骤 步骤S101,开始;
步骤S102,检测综合前端系统是否现出故障,若检测到综合前端系统出 现故障,则进行步骤S103,否则继续进行步骤S102;
具体的,在综合前端系统中设置一个软件客户端,通过相应的软件客户 端来监控综合前端系统,当检测到综合前端系统出现故障时,执行步骤S103。
系统一般可以分为操作系统,基础软件系统,应用软件模块(通讯, 服务,安全,数据库)等层次。监控平台会每隔一段时间(可以设定)启动 安装在服务器上的代理程序(Agent),启动一个系统检查脚本,首先检查各 参数是否在设定的正常范围内。例如文件描述符、进程数、已经使用的中央 处理器(CPU)消耗、内存(MEM)消耗等这样的操作系统参数是否会超过 设定的安全阀值;例如已使用的线程、连接数等这样的服务器参数是否超过设定的安全阀值。然后检查运行进程列表各中关键进程(主进程,通讯进程, 安全服务进程)是否缺失。接下来自动测试各端口是否处于正常监听状态, 如果出现问题就会给出相应提示。随后代理程序会发起一个模拟交易(可以
设定判断策略,例如每分钟发起3次交易,如果成功2次代表正常),测试系 统的反应,从而判断系统的状态,并且如果未能得到预期结果或者超时(可 以设定时间),会通过返回码提示进程在哪个软件模块内出现异常。这个过 程基本覆盖了系统的各层次,并且基本能够基本判断在哪一个层次或模块出 现异常。
步骤S103,分析故障的类别;
具体的,根据故障威胁程度将检测出的故障进行分析,其故障类别主要 是系统级故障和应用级故障,其中,系统级故障包括硬件故障和操作故障, 应用级故障包括基础软件故障和交易级故障。
在实施过程中,对综合前端系统上的数据进行收集,当检测到综合前端 系统出现故障时,分析故障所处的环境和位置,若是系统本身自身检测到的 故障,在上报故障过程中,可以获知该系统故障的类别;也可以根据基础软 件的日志上报故障信息,根据该日志上报的故障信息分析出该故障的类别。 这里主要采用的方式是系统内部的自侦测故障模式,在进行故障收集,根据 收集的故障来分析出故障的类别。
步骤S104,根据所述故障类别选择所对应的故障处理模式对所述故障进 行处理。
具体的,根据故障类别选择故障处理模式对出现的故障进行相应处理, 故障处理4莫式为自动处理^^莫式或通知人工处理^t式。其中自动处理才莫式主 要由热备机制提供技术支持,采用2+N分组热备刀片集群,每组2片备机+N片 生产机(每组最多不超过10片),当生产刀片发生故障时,备份刀片会短时 间内自动接管,从而保证正常生产不间断。自动处理模式可以处理系统故障 中的硬件故障因刀片服务器本身故障导致的连续运行问题和满足操作系统故 障连续运行的需求,同时也可以解决应用级故障中的基础软件故障,自动处 理模式只需要重新启动系统就可以运行的故障导致的连续运行问题。通知人 工处理模式可以处理所有级别的故障,其主要用于分析和解决问题。
进一步需要说明的,在此过程中,可以首先对故障分析后,下发故障告警方式给管理平台或者管理人员,如通过短信或者邮件或者日志报告等方式 让管理人员获得故障信息。
步骤S105:结束。
通过实施本发明实施例,在检测综合前端系统出现故障时,对出现的故 障进行分析出故障的类别,再根据故障的类别选择所对应的故障处理模式对 故障进行处理,这样通过针对不同级别的故障,采用不同的处理模式,减少 处理时间,保障了系统连续稳定的运行。
请参阅图2,图2示出了本发明实施例的计算机设备的结构示意图,包括 检测模块21、分析模块22和处理模块23,其中
检测模块21 ,用于检测综合前端系统是否出现故障;
具体的,在综合前端系统中设置一个软件客户端,通过相应的软件客户 端来监控综合前端系统。
分析模块22,用于当所述检测模块21检测到综合前端系统出现了故障时, 分析所述故障的类别;
具体的,根据故障威胁程度将检测出的故障进行分析,其故障类别主要 分为系统级故障和应用级故障,其中,系统级故障包括硬件故障和操作故障, 应用级故障包括^出软件故障和交易级故障。
在实施过程中,检测到综合前端系统出现故障时,分析故障所处的环境 和位置,若是系统本身自身检测到的故障,在上报故障过程中,可以获知该 系统故障的类别;也可以根据基础软件的日志上报故障信息,根据该日志上 报的故障信息分析出该故障的类别。这里主要采用的方式是系统内部的自侦 测故障才莫式,在进行故障收集,才艮据收集的故障来分析出故障的类别。
处理模块23,用于当所述分析模块22分析出所述故障的类别时,根据所 述故障的类别选择所述故障的类别所对应的故障处理才莫式对所述故障进行处 理。
具体的,根据故障类别选择所对应的故障处理模式对所述故障进行处理, 故障处理模式为自动处理模式或通知人工处理模式。自动处理模式主要由热 备机制提供技术支持,采用2+N分组热备刀片集群,每组2片备机+N片生产机 (每组最多不超过10片),当生产刀片发生故障时,^f分刀片会短时间内自 动接管,从而保证正常生产不间断。自动处理模式可以处理系统故障中的硬件故障因刀片服务器本身故障导致的连续运行问题和满足操作系统故障连续 运行的需求,同时也可以解决应用级故障中的基础软件故障,自动处理^t式 只需要重新启动系统就可以运行的故障导致的连续运行问题。通知人工处理 模式可以处理所有级别的故障,其主要用于分析和解决问题。进一步需要说
明的,处理模块23可以首先对故障分析后,下发故障告警方式给管理平台或 者管理人员,如通过短信或者邮件或者日志报告等方式让管理人员获得故障 信息。
综上所述,通过实施本发明实施例,在4企测综合前端系统出现故障时, 对出现的故障进行分析出故障的类别,再根据故障的类别选择所对应的故障 处理模式对故障进行处理,这样通过针对不同级别的故障,采用不同的处理 模式,减少反应时间,保障了系统连续稳定的运行。
以上所揭露的仅为本发明 一种较佳实施例而已,当然不能以此来限定本 发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵 盖的范围。
权利要求
1.一种综合前端系统故障处理方法,其特征在于,包括检测综合前端系统是否出现故障;当检测到所述综合前端系统出现了故障时,分析所述故障的类别;当分析出所述故障的类别时,根据所述故障的类别选择所述故障的类别所对应的故障处理模式对所述故障进行处理。
2. 如权利要求1所述的方法,其特征在于,所述分析所述故障的类别步骤 具体为根据故障威胁程度对所述检测出的故障进行故障类别的分析。
3. 如权利要求1或2所述的方法,其特征在于,所述故障的类别包括系统级 故障和应用级故障。
4. 如权利要求3所述的方法,其特征在于,所述系统级故障包括硬件级故 障和操作系统级故障。
5. 如权利要求3所述的方法,其特征在于,所述应用级故障包括^f出软件 级故障和交易级故障。
6. 如权利要求1所述的方法,其特征在于,所述故障处理模式为自动处理 才莫式或通知人工处理纟莫式。
7. 如权利要求6所述的方法,其特征在于,所述自动处理模式为热备切换 模式,当分析出所述故障的类别时,将当前的综合前端系统切换到备用的综 合前端系统。
8. —种计算机设备,其特征在于,包括 检测模块,用于检测综合前端系统是否出现故障;分析模块,用于当所述检测模块检测到综合前端系统出现了故障时,分析所述故障的类别;处理模块,用于当所述分析模块分析出所述故障的类别时,根据所述故 障的类别选择所述故障的类别所对应的故障处理才莫式对所述故障进^t处理。
9.如权利要求8所述的计算机设备,其特征在于,所述分析模块具体根据 故障威胁程度对所述检测出的故障进行故障类别的分析。
全文摘要
本发明公开了一种综合前端系统故障处理方法,包括检测综合前端系统是否出现故障;当检测到所述综合前端系统出现了故障时,分析所述故障的类别;当分析出所述故障的类别时,根据所述故障的类别选择所对应的故障处理模式对所述故障进行处理。本发明还公开了一种计算机设备,采用本发明所提供的方案,通过分析检测出的故障类别,并根据故障类别选择所对应的故障处理模式对故障进行处理,改变以往对故障完全依赖于人工诊断和处理的模式,减少了处理时间,保障了系统连续稳定的运行。
文档编号G06Q40/00GK101556679SQ20091020343
公开日2009年10月14日 申请日期2009年5月21日 优先权日2009年5月21日
发明者卜天奇, 周子坚, 烨 曾, 杜永健, 杨志勇, 臻 王, 意 罗, 芸 耿, 宏 胡, 静 邵 申请人:中国建设银行股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1