磁盘监控方法

文档序号:6380798阅读:187来源:国知局
专利名称:磁盘监控方法
技术领域
本发明基本上涉及网络领域,更具体地来说,涉及一种磁盘监控方法。
背景技术
随着用户数据量的与日剧增,存储设备的容量也日趋增大。磁盘作为存储设备的基本介质与存储单元,其运行状态直接关系到数据的稳定与安全性。在大规模存储系统中,磁盘数量成千上万,如果管理员不能及时发现磁盘状态的异常或者故障进行及时修复,磁盘数量损坏到一定程度后,将无法恢复用户的数据,给用户带来巨大的损失。现有磁盘监控技术主要针对单个磁盘进行监控,而用户的存储设备通常是多台,具有数量众多的磁盘;另外,磁盘监控目前主要针对硬件层次的监控,而很多时候在硬件状态显示正常时,可能存在软件无法正常写入数据的现象。

发明内容
为了克服上述缺陷,本发明提出了一种磁盘监控方法,解决了如何更全面地进行磁盘监控的技术问题。本发明公开了一种磁盘监控方法,包括步骤SI :采集所述磁盘的文件系统运行参数;以及步骤S2 :如果所述文件系统运行参数超出预定文件系统运行阈值,则通过告警
丰吴块告警。优选地,所述步骤SI包括磁盘信息采集模块通过文件系统监控模块采集所述磁盘的文件系统运行参数。优选地,所述步骤SI还包括所述磁盘信息采集模块采集所述磁盘的硬件指标参数,并且其中,所述步骤S2包括如果所述文件系统运行参数超出预定文件系统运行阈值或者所述硬件指标参数超出预定硬件指标阈值,则通过告警模块告警。优选地,所述文件系统运行参数包括写入速度、读取速度或者单位时间I/O请求数。优选地,所述硬件指标参数包括容量、转速或者缓存大小。优选地,所述方法还包括将文件系统监控模块作为插件嵌入所述磁盘所在的系统,并且通过插件管理模块对所述文件系统监控模块进行初始化、合法性验证或者配制信
息管理。优选地,所述方法还包括通过插件调度模块控制相应插件来采集相应的所述文件系统运行参数;通过磁盘指标处理模块处理所述磁盘指标参数;通过参数汇总模块将经过处理的磁盘指标参数汇总;以及将汇总后的经过处理的磁盘指标参数存储在数据存储模块中。优选地,所述方法还包括通过网络状态检测模块检测网络状态是否能够Ping通,如果无法Ping通,则通过所述告警模块告警。优选地,所述方法还包括当有新节点加入或者有新磁盘插入节点中时,通过磁盘加载模块加载所述新节点的磁盘或者所述新磁盘,并将所述新节点的磁盘或者所述新磁盘的配置参数和指标参数存储在内存中。优选地,所述方法还包括当减少磁盘或者替换磁盘时,通过磁盘更新模块对数据库磁盘表和数据库配置参数表进行更新。通过本发明所述公开的磁盘监控方法,能够更全面地进行磁盘监控。


附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中图I是根据本发明的一种磁盘监控方法的总体实施例的流程图;图2是根据本发明的一种磁盘监控方法的一个优选实施例的流程图;图3和图4分别示出了实现本发明的磁盘监控方法的磁盘监控系统的实例。
具体实施例方式以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。图I是根据本发明的一种磁盘监控方法的总体实施例的流程图。在图I中步骤SlOO :采集存储系统中磁盘的文件系统运行参数。该文件系统运行参数指的是磁盘的各种软件指标。其中,该文件系统运行参数包括但不限于写入速度、读取速度或者单位时间I/O请求数。由于造成硬盘无法正常使用的原因不仅有硬件问题,很多时候无法检测到磁盘的硬件出现问题,而硬盘仍无法进行正常读写,因此,通过对于磁盘软件指标进行监控,可以更全面、更直接地监控到磁盘故障。步骤S102 :如果文件系统运行参数超出预定文件系统运行阈值,则通过告警模块告警。其中,该预定文件系统运行阈值可以预先存储在存储模块中,包括但不限于最高写入速度、最低写入速度、最高读取速度、最低读取速度、最高单位时间I/O请求数和/或最低单位时间I/o请求数。通过本实施例所描述的磁盘监控方法,可以更全面、更直接地监控磁盘,从而更好地保证了存储系统的正常运行。此外,本发明所描述的磁盘监控系统还可以包括其他附加功能。以下将列举多个优选实施例,但这只是列举,而并不限于此。文件系统监控模块可以作为插件嵌入所监控的磁盘所在的系统,通过插件管理模块对该文件系统监控模块进行初始化、合法性验证或者配制信息管理。通过该优选实施例,可以通过插件管理模块对于文件系统监控模块进行统一管理,从而提高了监控系统的稳定性。可以通过插件调度模块控制相应插件来采集相应的文件系统运行参数,通过磁盘指标处理模块处理磁盘指标参数,通过参数汇总模块将经过处理的磁盘指标参数汇总,并且将汇总后的经过处理的磁盘指标参数存储在数据存储模块中。通过该优选实施例,可以针对不同的文件系统运行参数嵌入不同的插件,增强了该监控系统的灵活性。此外,还可以通过网络状态检测模块检测网络状态是否能够Ping通,如果无法Ping通,则通过告警模块告警。由于有时所检测出磁盘的读写故障并非是磁盘本身造成的,例如是由于磁盘所在的存储系统的网络不畅通造成的,因此,通过检测网络状态可以更好地定位故障原因。当有新节点加入或者有新磁盘插入节点中时,可以通过磁盘加载模块加载新节点的磁盘或者新磁盘,并将新节点的磁盘或者新磁盘的配置参数和指标参数存储在内存中。本优选实施例针对的是整个存储系统中的磁盘增加的情况,比如系统中加入了新服务器,或者在服务器中插入了新磁盘。通过本优选实施例可以更好地应对多磁盘存储系统进行监控。当减少磁盘或者替换磁盘时,通过磁盘更新模块对数据库磁盘表和数据库配置参数表进行更新。通过本优选实施例,可以随时保持存储系统内的磁盘数量等信息保持最新状态,从而能够更好地应对多硬盘存储系统的运行及维护。图2是根据本发明的一种磁盘监控方法的一个优选实施例的流程图。在图2中步骤S200 :磁盘信息采集模块通过文件系统监控模块采集磁盘的文件系统运行参数,并且磁盘信息采集模块采集磁盘的硬件指标参数。与上述实施例相同,该文件系统运行参数包括但不限于写入速度、读取速度或者单位时间I/O请求数。由于造成硬盘无法正常使用的原因不仅有硬件问题,很多时候无法检测到磁盘的硬件出现问题,而硬盘仍无法进行正常读写,因此,通过对于磁盘软件指标进行监控,可以更全面、更直接地监控到磁盘故障。与上述实施例不同的是,本优选实施例不仅监控了磁盘的软件指标,还监控了磁盘的硬件指标,从而更全面地对磁盘进行监控。其中,该硬件指标参数包括但不限于磁盘的容量、转速或者缓存大小。步骤S202 :如果文件系统运行参数超出预定文件系统运行阈值或者硬件指标参数超出预定硬件指标阈值,则通过告警模块告警。其中,该预定文件系统运行阈值可以预先存储在存储模块中,包括但不限于最高写入速度、最低写入速度、最高读取速度、最低读取速度、最高单位时间I/O请求数和/或最低单位时间I/O请求数。该预定硬件阈值包括但不限于最高容量、最低容量、最高转速、最低转速、最高缓存和/或最低缓存。通过本实施例所描述的磁盘监控方法,可以从软件、硬件两个方面对磁盘进行监控,从而更全面、更直接地监控磁盘,从而更好地保证了存储系统的正常运行。与上述实施例相同,本实施例所描述的磁盘监控系统还可以包括其他附加功能。以下将列举多个优选实施例,但这只是列举,而并不限于此。文件系统监控模块可以作为插件嵌入所监控的磁盘所在的系统,通过插件管理模块对该文件系统监控模块进行初始化、合法性验证或者配制信息管理。通过该优选实施例,可以通过插件管理模块对于文件系统监控模块进行统一管理,从而提高了监控系统的稳定性。可以通过插件调度模块控制相应插件来采集相应的文件系统运行参数,通过磁盘指标处理模块处理磁盘指标参数,通过参数汇总模块将经过处理的磁盘指标参数汇总,并且将汇总后的经过处理的磁盘指标参数存储在数据存储模块中。通过该优选实施例,可以针对不同的文件系统运行参数嵌入不同的插件,增强了该监控系统的灵活性。此外,还可以通过网络状态检测模块检测网络状态是否能够Ping通,如果无法Ping通,则通过告警模块告警。由于有时所检测出磁盘的读写故障并非是磁盘本身造成的,例如是由于磁盘所在的存储系统的网络不畅通造成的,因此,通过检测网络状态可以更好地定位故障原因。当有新节点加入或者有新磁盘插入节点中时,可以通过磁盘加载模块加载新节点的磁盘或者新磁盘,并将新节点的磁盘或者新磁盘的配置参数和指标参数存储在内存中。本优选实施例针对的是整个存储系统中的磁盘增加的情况,比如系统中加入了新服务器,或者在服务器中插入了新磁盘。通过本优选实施例可以更好地应对多磁盘存储系统进行监控。当减少磁盘或者替换磁盘时,通过磁盘更新模块对数据库磁盘表和数据库配置参数表进行更新。通过本优选实施例,可以随时保持存储系统内的磁盘数量等信息保持最新状态,从而能够更好地应对多硬盘存储系统的运行及维护。图3和图4分别示出了实现本发明的磁盘监控方法的磁盘监控系统的实例。在图3中,包括I)资源加载模块(磁盘加载模块),用于加载资源、资源配置参数、指标等信息,并对其进行处理,放入相应的缓冲区。2)资源更新模块(磁盘更新模块),用于根据实际采集到的资源,对数据库资源表和资源配置参数表进行更新。3)网络状态检测模块,用于进行网络状态的检测,是否可以ping通。4)指标处理模块,用于将需要采集的指标按照一定逻辑关系进行处理5)采集调度模块,用于调度插件进行信息采集。6)信息汇总接收模块,用于收集采集代理发送来的采集信息,进行汇总。7)数据存储模块,用于将采集的数据存储到数据库中。8)插件管理模块,用于对采集插件进行管理的模块,比如初始化、合法性验证、配
置信息管理等。9)磁盘信息采集模块,用于按照系统框架要求实现的磁盘采集插件,获取所需的
磁盘信息。10)文件系统监控模块,用于从文件系统角度监控相关状态、性能数据。在图4中,包括I)资源加载模块(磁盘加载模块)加载资源配置及指标信息,即需要监控哪些节点,以及节点上的哪些信息。2)指标调度从资源加载的缓冲区获取指标,进行初始化排序。3)采集调度调用指标调度模块接口,获取本轮需要采集的指标,根据指标从插件管理模块获取相应插件,并查询网络状态检测模块的检测结果,调度插件并采集信息。4)磁盘信息采集模块,作为一个插件,调用文件系统监控模块,获取需要的磁盘信息,并交由框架统一处理。5)采集到新的资源,则由资源更新模块调用数据存储模块进行资源更新。6)主动采集到的数据或者由信息汇总接收模块接收到的数据,由告警产生模块进行告警和恢复的判断,并将告警和恢复信息发送至告警管理系统。7)信息汇总接收模块接收采集代理发送来的数据,并调用存储模块进行存储。
8)配置更新模块会更新各个采集代理节点的配置信息。
9)数据采样模块会定期扫描数据库,对数据表进行抽样平均。10)同时系统采用分区存储策略,当系统规模较大时,将系统划分成若干个分区,分区内的磁盘信息汇总至一台机器,不同分区的所有信息最终汇总到一台总的机器,从而实现大规模磁盘监控系统。本实例从文件系统(软件指标)的角度实现了对磁盘的监控,可以在系统真实无法写入数据时及时获取故障信息,为用户准确报警;同时,本发明针对大规模存储系统设计实现了对应的磁盘监控系统和方法,能有效监控大规模磁盘。以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
权利要求
1.ー种磁盘监控方法,其特征在于,包括 步骤Si:釆集所述磁盘的文件系统运行参数;以及 步骤S2 :如果所述文件系统运行参数超出预定文件系统运行阈值,则通过告警模块告m目O
2.根据权利要求I所述的磁盘监控方法,其特征在于,所述步骤SI包括磁盘信息采集模块通过文件系统监控模块采集所述磁盘的文件系统运行參数。
3.根据权利要求2所述的磁盘监控方法,其特征在干,所述步骤SI还包括所述磁盘信息采集模块采集所述磁盘的硬件指标參数, 并且其中,所述步骤S2包括如果所述文件系统运行參数超出预定文件系统运行阈值或者所述硬件指标參数超出预定硬件指标阈值,则通过告警模块告警。
4.根据权利要求1-3中任ー项所述的磁盘监控方法,其特征在于,所述文件系统运行參数包括写入速度、读取速度或者単位时间I/O请求数。
5.根据权利要求4所述的磁盘监控方法,其特征在于,所述硬件指标參数包括容量、转速或者缓存大小。
6.根据权利要求1-3所述的磁盘监控方法,其特征在于,所述方法还包括将文件系统监控模块作为插件嵌入所述磁盘所在的系统,并且通过插件管理模块对所述文件系统监控模块进行初始化、合法性验证或者配制信息管理。
7.根据权利要求1-3所述的磁盘监控方法,其特征在于,所述方法还包括 通过插件调度模块控制相应插件来采集相应的所述文件系统运行參数; 通过磁盘指标处理模块处理所述磁盘指标參数; 通过參数汇总模块将经过处理的磁盘指标參数汇总;以及 将汇总后的经过处理的磁盘指标參数存储在数据存储模块中。
8.根据权利要求1-3所述的磁盘监控方法,其特征在于,所述方法还包括通过网络状态检测模块检测网络状态是否能够Ping通,如果无法Ping通,则通过所述告警模块告警。
9.根据权利要求1-3所述的磁盘监控方法,其特征在于,所述方法还包括当有新节点加入或者有新磁盘插入节点中时,通过磁盘加载模块加载所述新节点的磁盘或者所述新磁盘,并将所述新节点的磁盘或者所述新磁盘的配置參数和指标參数存储在内存中。
10.根据权利要求1-3所述的磁盘监控方法,其特征在于,所述方法还包括当减少磁盘或者替换磁盘时,通过磁盘更新模块对数据库磁盘表和数据库配置參数表进行更新。
全文摘要
本发明公开了一种磁盘监控方法,包括步骤S1采集磁盘的文件系统运行参数;以及步骤S2如果文件系统运行参数超出预定文件系统运行阈值,则通过告警模块告警。通过本发明所述公开的磁盘监控方法,能够更全面、更直接地对磁盘进行监控。
文档编号G06F11/30GK102981939SQ20121044159
公开日2013年3月20日 申请日期2012年11月7日 优先权日2012年11月7日
发明者郭庆, 徐学辉, 谢莹莹, 苗艳超, 刘新春, 邵宗有 申请人:曙光信息产业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1