一种实现应用故障诊断的方法及装置的制造方法

文档序号:9564513阅读:506来源:国知局
一种实现应用故障诊断的方法及装置的制造方法
【技术领域】
[0001]本发明涉及计算机应用领域,尤指一种实现应用故障诊断的方法及装置。
【背景技术】
[0002]随着IT技术应用的不断发展,企业的各种业务进行过程已经越来越紧密地与互联网技术结合在一起,由服务器、数据库、中间件等组成的应用信息系统也变得越来越复杂。即使对技术人员的水平要求逐步提高,却依旧存在进行故障排除越来越困难的问题。业务应用的运行质量(完成业务的能力、速度和稳定性)直接关系企业可以提供给用户的业务水平。对关键业务应用的性能进行监控管理,及时有效的针对性能监管中存在的问题进行分析和诊断,是提高用户业务应用可用性的迫切要求。
[0003]目前,对业务应用的性能进行监控管理主要包含以下几个方面:1、对应用的访问情况进行监控;2、当业务应用发生性能异常时,判断是否由于网络系统性能出现异常造成;
3、当业务应用发生访问异常时,判断是否由于网络或应用遭受到攻击造成。通过对业务应用故障的诊断,可以有效的帮助技术人员进行业务应用的即时恢复。
[0004]现有的业务应用的故障诊断主要从流量数据或监控数据(例如,应用日志)等单一的数据进行故障分析;由于进行故障诊断分析的数据单一,容易导致获得的故障诊断结果存在片面或不足,这就需要借助更多人工参与来完成故障诊断。

【发明内容】

[0005]为了解决上述技术问题,本发明提供一种实现应用故障诊断的方法及装置,能够根据多维的数据,对业务故障进行全面诊断,减少人为参与。
[0006]为了达到上述发明目的,本发明公开了一种实现应用故障诊断的方法,包括:
[0007]采集多维应用数据;
[0008]当业务应用发生异常时,对采集到的多维应用数据从业务异常的时间和空间关联关系中、根据业务异常类型获取业务异常涉及到的关联诊断数据;
[0009]将获取的业务异常涉及到的关联诊断数据,分别与各关联诊断数据的历史诊断数据进行比较,确定应用故障类型。
[0010]进一步地,多维应用数据包括:根据业务应用服务器IP提取的监控数据、业务应用服务器IP和目的地址提取的流量数据、和业务应用服务器IP和目的地址提取的应用性能数据。
[0011]进一步地,监控数据至少包括:IP地址、和/或监控时间、和/或CPU利用率、和/或磁盘利用率、和/或磁盘输入输出1、和/或内存相关信息、和/或交换空间相关信息、和/或网络接口相关信息、和/或数据库响应时间、和/或从磁盘调入内存的交换内存使用s1、和/或从内存调入磁盘的交换内存使用so、和/或从内存写入磁盘的大小bo、和/或从磁盘写入内存的大小b1、和/或服务状态。
[0012]进一步地,流量数据为由相同五元组所唯一标识的一个会话,至少包括:采集时间、和/或源/目的地址、和/或源/目的端口、和/或协议、和/或发送TCP/IP建立连接时使用的握手信号SYN包数、和/或发送TCP报头的码位字段FIN包数、和/或TCP相关信息、和/或发送RST次数、和/或单位时间内访问指定服务的总流量异常。
[0013]进一步地,应用性能数据至少包括:源/目的地址、和/或目的端口、和/或请求时间、和/或服务器响应时间、和/或载入时间、和/或页面相关信息、和/或Http相关信息、和/或tomcat全局访问速度异常、和/或单位时间内数据库访问量异常、和/或Weblogic当前会话数异常;
[0014]所述应用性能数据采集于HTTP协议的性能数据、和/或ORACLE数据库服务的性能数据、和/或MYSQL数据库服务器的性能数据。
[0015]进一步地,将获取的业务异常涉及到的关联诊断数据,分别与各关联诊断数据的历史诊断数据进行比较,确定应用故障类型具体包括:
[0016]将获取的业务异常涉及到的关联诊断数据,分别与各关联诊断数据的历史诊断数据通过周期性基线或移动窗口基线进行比较,根据预先设定的各关联诊断数据的阈值范围,确定应用故障类型。
[0017]进一步地,所述历史诊断数据为:第一预设时长内的监控数据;第二预设时长内的流量数据、及实时的应用性能数据。
[0018]进一步地,当故障诊断未分析出结果时,该方法还包括:将涉及异常的多维数据进行存储,在历史数据更新后再进一步确定应用故障类型。
[0019]进一步地,该方法还包括:根据确定应用故障类型,从历史诊断数据中提供故障恢复建议。
[0020]另一方面,本申请还提供一种实现应用故障诊断的装置,包括:采集单元、获取单元和故障诊断单元;其中,
[0021]采集单元,用于采集多维应用数据;
[0022]获取单元,用于当业务应用发生异常时,对采集到的多维应用数据从业务异常的时间和空间关联关系中、根据业务异常类型获取业务异常涉及到的关联诊断数据;
[0023]故障诊断单元,用于将获取的业务异常涉及到的关联诊断数据,分别与各关联诊断数据的历史诊断数据进行比较,确定应用故障类型。
[0024]进一步地,多维应用数据包括:根据业务应用服务器IP提取的监控数据、业务应用服务器IP和目的地址提取的流量数据、和业务应用服务器IP和目的地址提取的应用性能数据。
[0025]进一步地,监控数据至少包括:IP地址、和/或监控时间、和/或CPU利用率、和/或磁盘利用率、和/或磁盘输入输出1、和/或内存相关信息、和/或交换空间相关信息、和/或网络接口相关信息、和/或数据库响应时间、和/或从磁盘调入内存的交换内存使用s1、和/或从内存调入磁盘的交换内存使用so、和/或从内存写入磁盘的大小bo、和/或从磁盘写入内存的大小b1、和/或服务状态。
[0026]进一步地,流量数据为由相同五元组所唯一标识的一个会话,至少包括:采集时间、和/或源/目的地址、和/或源/目的端口、和/或协议、和/或发送TCP/IP建立连接时使用的握手信号SYN包数、和/或发送TCP报头的码位字段FIN包数、和/或TCP相关信息、和/或发送RST次数、和/或单位时间内访问指定服务的总流量异常。
[0027]进一步地,应用性能数据至少包括:源/目的地址、和/或目的端口、和/或请求时间、和/或服务器响应时间、和/或载入时间、和/或页面相关信息、和/或Http相关信息、和/或tomcat全局访问速度异常、和/或单位时间内数据库访问量异常、和/或Weblogic当前会话数异常;
[0028]所述应用性能数据采集于HTTP协议的性能数据、和/或ORACLE数据库服务的性能数据、和/或MYSQL数据库服务器的性能数据。
[0029]进一步地,故障诊断单元具体用于,将获取的业务异常涉及到的关联诊断数据,分别与各关联诊断数据的历史诊断数据通过周期性基线或移动窗口基线进行比较,根据预先设定的各关联诊断数据的阈值范围,确定应用故障类型。
[0030]进一步地,历史诊断数据为:第一预设时长内的监控数据;第二预设时长内的流量数据、及实时的应用性能数据。
[0031]进一步地,该装置还包括后续诊断单元,用于当故障诊断未分析出结果时将涉及异常的多维数据进行存储,在历史数据更新后再进一步确定应用故障类型。
[0032]进一步地,该装置还包括恢复建议单元,用于根据确定应用故障类型,从历史诊断数据中提供故障恢复建议。
[0033]本申请技术方案包括:采集多维应用数据;当业务应用发生异常时,对采集到的多维应用数据从业务异常的时间和空间关联关系中、根据业务异常类型获取业务异常涉及到的关联诊断数
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1