一种利用raid卡批量检测硬盘监控和报警的方法

文档序号:9326775阅读:651来源:国知局
一种利用raid卡批量检测硬盘监控和报警的方法
【专利说明】一种利用RAID卡批量检测硬盘监控和报警的方法
[0001]
技术领域
[0002]本发明涉及硬盘检测技术,具体的说是一种利用RAID卡批量检测硬盘监控和报警的方法。
【背景技术】
[0003]随着计算机技术的提升和业务的发展,以及数据中心业务量的不断增加,数据存储量也越来越大,要求服务器存储系统的密度也在增加,硬盘的数量也越来越大,出现故障也很难避免,一旦某块硬盘出现故障,通常会严重影响机器的正常运行。
[0004]客户大批量购买使用服务器对公司的发展是有利的,但是从另一个方面,也要求技术人员能够快速判断检测硬件是否有故障问题。面对满机房成百上千甚至更多的服务器,如何快速检测定位出有隐患或者故障的硬盘是急需解决的问题。

【发明内容】

[0005]本发明针对目前需求以及现有技术发展的不足之处,提供一种利用RAID卡批量检测硬盘监控和报警的方法。
[0006]本发明所述一种利用RAID卡批量检测硬盘监控和报警的方法,解决上述技术问题采用的技术方案如下:所述批量检测硬盘监控和报警的方法,通过脚本分析RAID卡日志,进行批量机器的硬盘批量检查,定位出有故障或者有故障隐患的硬盘;该方法的主要步骤包括:第一、在服务器Iinux系统下预先安装开机自动启动的脚本,第二、服务器正常开机后,脚本自动执行后输出所有硬盘的状态,分析检测故障或隐患硬盘的情况,第三、若发现有故障或隐患的硬盘,则让RAID卡对该硬盘发出定位指令,使该硬盘指示灯闪烁。
[0007]优选的,所述脚本集成了 Megacli和Arcconf两个工具,这两个工具能够分别管理LSI 和 ADAPTREC 两种 RAID 卡。
[0008]优选的,服务器正常开机后,脚本自动执行收集RAID卡的日志,输出所有硬盘的状态,若硬盘的media error和pred fail count不为0,则对该硬盘执行locate命令使得该硬盘闪烁。
[0009]本发明的一种利用RAID卡批量检测硬盘监控和报警的方法与现有技术相比具有的有益效果是:该方法通过脚本分析RAID卡日志,对服务器硬盘批量检查,能够快速确认故障硬盘,显著提高了硬盘故障确定率,以便及时更换故障或隐患硬盘,提高了系统的稳定性和高效性,并且该方法能够定制化脚本,来适合不同服务器的硬盘配置环境;使用该方法进行硬盘故障监控和报警,整个操作实现过程简单快捷,极大提高了产品的竞争力。
【附图说明】
[0010]附图1:所述利用RAID卡批量检测硬盘监控和报警的方法的流程图。
【具体实施方式】
[0011]为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明所述一种利用RAID卡批量检测硬盘监控和报警的方法进一步详细说明。
[0012]本发明所述一种利用RAID卡批量检测硬盘监控和报警的方法,通过脚本分析RAID卡日志,进行批量机器的硬盘批量检查,定位出有故障或者有故障隐患的硬盘;通过该方法能够在服务器开机的瞬间,检测出哪些硬盘有故障或者隐患,从而快速恢复故障或者排除隐患硬盘,为客户后期平稳运行提供保障。
[0013]该利用RAID卡批量检测硬盘监控和报警的方法的执行步骤包括:第一、在服务器设备内预先安装好Iinux系统,第二、在Iinux系统下预先安装脚本,具有开机自动启动的功能,第三、服务器正常开机后,自动执行脚本后输出所有硬盘的状态,分析检测哪些硬盘是有故障或者隐患的,第四、若发现有故障或隐患的硬盘,则让RAID卡对该硬盘发出定位指令,使该硬盘指示灯闪烁,能够准确判断出哪些硬盘故障或者隐患。
[0014]实施例:
本实施例所述一种利用RAID卡批量检测硬盘监控和报警的方法,由于RAID卡本身都对硬盘的磁头单元、硬盘温度、盘片表面介质材料、马达及其驱动系统、硬盘内部电路等进行监测,能够及时分析并预报硬盘可能发生的问题,RAID卡是硬盘的一个预警损害系统。当各属性某个数据接近(小于)或达到关键阶段值,则表示硬盘临近报废,或者是超过它的设计使用极限了,相关人员应该对问题硬盘及时做备份或更换。
[0015]本实施例所述批量检测硬盘监控和报警的方法,具体执行步骤如下:
步骤一,在服务器设备内预先安装好Iinux系统,内嵌到Iinux系统下一个脚本,该脚本具有开机自启动的功能,集成了 MegacIi和Arcconf两个工具,这两个工具可以分别管理LSI 和 ADAPTREC 两种 RAID 卡;
步骤二,服务器正常开机后,自动脚本执行收集RAID卡的日志,输出所有硬盘的状态,一旦发现有硬盘的media error和pred fail count不为0,则对该硬盘执行locate命令使得该硬盘闪烁,能够快速定位出故障硬盘,进而更换有潜在隐患的硬盘,如附图1所示。
[0016]本实施例所述批量检测硬盘监控和报警的方法,所使用脚本shell.Sh如下(以LSI的RAID卡为例):
#!/bin/bash
rpm -1 MegaCl1-*.noarch, rpm # 安装 megacli 软件megacl1-LdPdInfo -aALL > MgLdPdInfo # 收集所有硬盘信息for (i=0, I, i++)
{if (media error ! =0||pred fail count ! =0)locate pd i
}
#让有故障或者隐患的硬盘闪烁。此外,所述脚本可定制化,以适合不同服务器的硬盘配置环境。
[0017]上述【具体实施方式】仅是本发明的具体个案,本发明的专利保护范围包括但不限于上述【具体实施方式】,任何符合本发明的权利要求书的且任何所属技术领域的普通技术人员对其所做的适当变化或替换,皆应落入本发明的专利保护范围。
【主权项】
1.一种利用RAID卡批量检测硬盘监控和报警的方法,其特征在于,通过脚本分析RAID卡日志,进行批量机器的硬盘批量检查,定位出有故障或者有故障隐患的硬盘;该方法的主要步骤包括:第一、在服务器Iinux系统下预先安装开机自动启动的脚本,第二、月艮务器正常开机后,脚本自动执行后输出所有硬盘的状态,分析检测故障或隐患硬盘的情况,第三、若发现有故障或隐患的硬盘,则让RAID卡对该硬盘发出定位指令,使该硬盘指示灯闪烁。2.根据权利要求1所述一种利用RAID卡批量检测硬盘监控和报警的方法,其特征在于,所述脚本集成了 Megacli和Arcconf两个工具,这两个工具能够分别管理LSI和ADAPTREC 两种 RAID 卡。3.根据权利要求2所述一种利用RAID卡批量检测硬盘监控和报警的方法,其特征在于,服务器正常开机后,脚本自动执行收集RAID卡的日志,输出所有硬盘的状态,若硬盘的media error和pred fail count不为0,则对该硬盘执行locate命令使得该硬盘闪烁。
【专利摘要】本发明公开一种利用RAID卡批量检测硬盘监控和报警的方法,涉及硬盘检测技术,通过脚本分析RAID卡日志,进行批量机器的硬盘批量检查,定位出有故障或者有故障隐患的硬盘;该方法的主要步骤包括:第一、在服务器linux系统下预先安装开机自动启动的脚本,第二、服务器正常开机后,脚本自动执行后输出所有硬盘的状态,分析检测故障或隐患硬盘的情况,第三、若发现有故障或隐患的硬盘,则让RAID卡对该硬盘发出定位指令,使该硬盘指示灯闪烁。通过该方法能够对服务器硬盘批量检查,快速确认故障硬盘,以便及时更换故障或隐患硬盘,提高了系统的稳定性和高效性。
【IPC分类】G06F11/22
【公开号】CN105045689
【申请号】CN201510356477
【发明人】姜政君, 陈彬, 任华进
【申请人】浪潮电子信息产业股份有限公司
【公开日】2015年11月11日
【申请日】2015年6月25日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1