一种远程智能监控与分析raid故障的方法

文档序号:7745379阅读:111来源:国知局
专利名称:一种远程智能监控与分析raid故障的方法
技术领域
本发明涉及计算机存储、人工智能技术领域,具体地说是一种远程智能监控与分 析RAID故障的方法。
背景技术
用户使用RAID,有两个方向,RAID0,提高磁盘响应速度;RAID1/RAID5/RAID10,实
现数据冗余,保障数据安全。对于RAID1/RAID5/RAID1,如果掉一块硬盘,数据还能有效的恢复,但如果掉盘后, 客户不知情,后续再次出现其他硬盘掉盘,数据就会出现不可挽回的丢失。传统的方法,在发生RAID掉盘后,给出蜂鸣、背板灯等方面的报警,但这些报警, 都仅限于本地。当前,客户的计算机往往托管到电信机房,如果掉盘,虽然本地触发报警,但客户 往往并不知道。通过远程跨网段的只能RAID监控方法,可以及时有效的通知客户更换硬 盘,从而规范了数据丢失的风险。为了解决因RAID故障或工作异常而用户不知情、需智能故障判断与方案支持的 问题,提出一种远程智能监控RAID的方法。

发明内容
本发明的目的是提供一种远程智能监控与分析RAID故障的方法。本发明的目的是按以下方式实现的,采用分布式数据处理模式,本地实时监视与 预测RAID的工作状态,当发出现异常时,本地计算机将与RAID相关的参数及RAID的工作 状态发送至Web服务端,由服务端程序确定告警的级别和相应的处理方案,并将告警信息 与系统自动产生的故障解决方案及时告知用户,该方法的体系结构包括本地信息收集与 预处理单元(1),通信单元(2)和远程智能决策与决策执行单元(3),其中本地信息收集与预处理单元(1),负责收集本地与RAID相关的RAID卡、物理盘和 虚拟盘的信息,包括RAID型号、类型、温度,物理盘的标定访问速度与实际速度、温度、加电 时间、读写情况,虚拟盘的大小、RAID等级、工作状态,本地程序首先将影响RAID工作的参 数数值化,利用本地预设的值对各个工作参数进行初步判断,与本地预设值不符,则将数据 发送到服务端;通信单元⑵,负责本地客户端与服务端之间传递数据;远程智能决策与决策执行单元(3),负责接收由客户端发来的数据,利用BP神经 网络对RAID信息进行判断,根据判断结果确定报警的等级及类型,由报警类型从解决方案 库中提取相应的解决方案,并通过邮件、短信方式告知用户。本地信息收集与预处理单元(1)能够获取影响RAID工作的各项参数,并将参数数 值化,与本地预设参数的工作范围或正常状态比较,出现非期望的值时向服务端发送异常 信息;服务端程序利用前向型三层BP神经网络对故障类型进行判断,并根据故障类型在方
3案库中提取相应的解决方案,最后通过短信方式告知用户,由用户决定如何执行。远程智能决策与决策执行单元(3)对BP神经网络的权值进行初始化的样本数据, 来源于实验数据与对RAID诊断的经验;神经网络的训练函数为正态分布函数与窗函数的 对准中心点后的乘积;故障方案库为对RAID各种故障的解决方法长期积累的结果。本发明的有益效果是RAID发生故障或异常时及时告知用户,避免因数据丢失带 来的损失。为用户提供远程的智能化的故障诊断与问题解决方案,帮助用户快速定位故障, 并迅速有效的解决问题。


附图1传统的RAID诊断方法;附图2远程智能化的RAID诊断方法;
具体实施例方式本方法的执行过程为(参考附图2)1)收集本地与RAID相关的RAID卡、物理盘和虚拟盘的信息,如的RAID型号、类 型、温度,物理盘的标定访问速度与实际速度、温度、加电时间、读写情况,虚拟盘的大小、 RAID等级、工作状态等;2)本地程序首先将影响RAID工作的参数数值化,利用本地预设的值对各个工作 参数进行初步判断;3)如果与本地预设值不符,则采用RPC协议以XML格式数据发送到服务端;4)接收由客户端发来的数据,利用BP神经网络对RAID信息进行判断;5)根据判断结果确定报警的等级及类型;6)由报警类型从解决方案库(以文本方式存放)中提取相应的解决方案,并写日 志文件;7)将报警信息与解决方案通过邮件、短信等方式告知用户。实施例采用分布式数据处理模式,本地实时监视与预测RAID的工作状态,当发出现异常 时(可能已经发生故障),本地计算机将与RAID相关的参数及RAID的工作状态发送至Web 服务端。由服务端程序确定告警的级别和相应的处理方案,并将告警信息与系统自动产生 的故障解决方案通过邮件、短信等方式告知用户。该方法的体系结构包括本地信息收集与 预处理单元(1),通信单元(2),远程智能决策与决策执行单元(3)。其中本地信息收集与预处理单元(1),收集本地与RAID相关的RAID卡、物理盘和虚 拟盘的信息,如的RAID型号、类型、温度,物理盘的标定访问速度与实际速度、温度、加电时 间、读写情况,虚拟盘的大小、RAID等级、工作状态等。本地程序首先将影响RAID工作的参 数数值化,利用本地预设的值对各个工作参数进行初步判断,如果与本地预设值不符,则将 数据发送到服务端;通信单元(2),主要负责本地客户端与服务的通信,采用RPC协议以XML格式传递 fn息;远程智能决策与决策执行单元(3),接收由客户端发来的数据,利用BP神经网络
4对RAID信息进行判断,根据判断结果确定报警的等级及类型,由报警类型从解决方案库 (以文本方式存放)中提取相应的解决方案,并通过邮件、短信等方式告知用户。
权利要求
一种远程智能监控与分析RAID故障的方法,其特征在于,采用分布式数据处理模式,本地实时监视与预测RAID的工作状态,当发出现异常时,本地计算机将与RAID相关的参数及RAID的工作状态发送至Web服务端,由服务端程序确定告警的级别和相应的处理方案,并将告警信息与系统自动产生的故障解决方案及时告知用户,该方法的体系结构包括本地信息收集与预处理单元(1),通信单元(2)和远程智能决策与决策执行单元(3),其中本地信息收集与预处理单元(1),负责收集本地与RAID相关的RAID卡、物理盘和虚拟盘的信息,包括RAID型号、类型、温度,物理盘的标定访问速度与实际速度、温度、加电时间、读写情况,虚拟盘的大小、RAID等级、工作状态,本地程序首先将影响RAID工作的参数数值化,利用本地预设的值对各个工作参数进行初步判断,与本地预设值不符,则将数据发送到服务端;通信单元(2),负责本地客户端与服务端之间传递数据;远程智能决策与决策执行单元(3),负责接收由客户端发来的数据,利用BP神经网络对RAID信息进行判断,根据判断结果确定报警的等级及类型,由报警类型从解决方案库中提取相应的解决方案,并通过邮件、短信方式告知用户。
2.根据权利要求1所述的方法,其特征在于本地信息收集与预处理单元(1)能够获 取影响RAID工作的各项参数,并将参数数值化,与本地预设参数的工作范围或正常状态比 较,出现非期望的值时向服务端发送异常信息;服务端程序利用前向型三层BP神经网络对 故障类型进行判断,并根据故障类型在方案库中提取相应的解决方案,最后通过短信方式 告知用户,由用户决定如何执行。
3.根据权利要求1所述的方法,其特征在于远程智能决策与决策执行单元(3)对BP 神经网络的权值进行初始化的样本数据,来源于实验数据与对RAID诊断的经验;神经网络 的训练函数为正态分布函数与窗函数的对准中心点后的乘积;故障方案库为对RAID各种 故障的解决方法长期积累的结果。
全文摘要
本发明提供一种远程智能监控与分析RAID故障的方法,采用分布式数据处理模式,本地实时监视与预测RAID的工作状态,当发出现异常时,本地计算机将与RAID相关的参数及RAID的工作状态发送至Web服务端,由服务端程序确定告警的级别和相应的处理方案,并将告警信息与系统自动产生的故障解决方案及时告知用户,本发明的有益效果是RAID发生故障或异常时及时告知用户,避免因数据丢失带来的损失。为用户提供远程的智能化的故障诊断与问题解决方案,帮助用户快速定位故障,并迅速有效的解决问题。
文档编号H04L29/08GK101887387SQ201010140518
公开日2010年11月17日 申请日期2010年4月7日 优先权日2010年4月7日
发明者朱锦雷, 王洪亮 申请人:山东高效能服务器和存储研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1