一种自动定位坏盘的方法、装置、设备及存储介质与流程

文档序号:16324648发布日期:2018-12-19 05:51阅读:150来源:国知局
一种自动定位坏盘的方法、装置、设备及存储介质与流程

本发明涉及分布式存储技术领域,特别是涉及一种自动定位坏盘的方法、装置、设备及存储介质。

背景技术

随着现在海量数据的产生,通常会用一组阵列或者分布式存储系统来存储这些海量数据。阵列或者分布式存储系统都包含了大量的磁盘,如一套分布式存储系统,对外提供4pb的存储空间,大约需要27台36盘位的存储节点,约需要1000块6tb的硬盘,随着存储空间的增加,磁盘的数据也会相应的增加。所以在以上存储系统中磁盘数据量越多,出现坏盘的概率就越大。

同时客户现场机房环境不一,如通风不好,电源不稳定等等因素也减少了磁盘的使用寿命,使得坏盘概率大大增加。

由于以上情况,为了保证数据不丢失,保证存储容量不减少,减少数据恢复带来的存储压力,应及时发现坏盘,并及时更新坏盘。但是随着存储节点的增加,磁盘数量增加,单纯通过运维工程师来排查坏盘这是一项庞大的工作量。



技术实现要素:

有鉴于此,本发明的目的在于提供一种自动定位坏盘的方法、装置、设备及存储介质,可以减少运维工程师的工作量,提高可维护性。其具体方案如下:

一种自动定位坏盘的方法,包括:

选择集群中某节点作为主节点;

通过所述集群中每个节点定时检测是否有坏盘;

发现坏盘后及时将所述节点收集的坏盘信息推送给所述主节点,并点亮所述坏盘的定位灯。

优选地,在本发明实施例提供的上述自动定位坏盘的方法中,所述主节点提供服务端服务,用于监听所有客户端服务;

所述集群中每个节点均提供一个所述客户端服务,用于将所述坏盘信息推送给所述主节点。

优选地,在本发明实施例提供的上述自动定位坏盘的方法中,在将所述坏盘信息推送给所述主节点之后,还包括:

将所述坏盘信息写入坏盘日志;

通过查看所述坏盘日志获知当前的坏盘信息。

优选地,在本发明实施例提供的上述自动定位坏盘的方法中,点亮所述坏盘的定位灯,具体包括:

在所述坏盘日志中显示所述坏盘对应于哪一块sas卡或raid卡上的哪一个槽位;

根据所述sas卡或raid卡的id、所述槽位id,将所述坏盘的定位灯点亮。

优选地,在本发明实施例提供的上述自动定位坏盘的方法中,还包括:

若未发现坏盘,则通过所述集群中每个节点继续定时检测是否有坏盘。

本发明实施例还提供了一种自动定位坏盘的装置,包括:

主节点选择模块,用于选择集群中某节点作为主节点;

坏盘检测模块,用于通过所述集群中每个节点定时检测是否有坏盘;

信息推送模块,用于发现坏盘后及时将所述节点收集的坏盘信息推送给所述主节点;

定位灯点亮模块,用于点亮所述坏盘的定位灯。

优选地,在本发明实施例提供的上述自动定位坏盘的装置中,所述主节点提供服务端服务,用于监听所有客户端服务;

所述集群中每个节点均提供一个所述客户端服务,用于将所述坏盘信息推送给所述主节点。

优选地,在本发明实施例提供的上述自动定位坏盘的装置中,还包括:

信息写入模块,用于将所述坏盘信息写入坏盘日志;

信息查看模块,用于查看所述坏盘日志获知当前的坏盘信息。

本发明实施例还提供了一种自动定位坏盘的设备,包括处理器和存储器,其中,所述处理器执行所述存储器中保存的计算机程序时实现如本发明实施例提供的上述自动定位坏盘的方法。

本发明实施例还提供了一种计算机可读存储介质,用于存储计算机程序,其中,所述计算机程序被处理器执行时实现如本发明实施例提供的上述自动定位坏盘的方法。

本发明所提供的一种自动定位坏盘的方法、装置、设备及存储介质,该方法包括:选择集群中某节点作为主节点;通过所述集群中每个节点定时检测是否有坏盘;发现坏盘后及时将所述节点收集的坏盘信息推送给所述主节点,并点亮所述坏盘的定位灯。本发明通过自动化定时检测,及时发现坏盘,并将坏盘信息推送到设定的主节点,同时会自动将该坏盘的定位灯点亮,这样机房运维工程师只需要到机房将亮灯的磁盘换成新盘即可,节省了运维工程师的工作量,也便于产品市场化后的维护,减少运维成本,提高产品竞争力。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的自动定位坏盘的方法的流程图;

图2为本发明实施例提供的自动定位坏盘的方法的具体流程图;

图3为本发明实施例提供的自动定位坏盘的装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提供一种自动定位坏盘的方法,如图1所示,包括以下步骤:

s101、选择集群中某节点作为主节点;

s102、通过所述集群中每个节点定时检测是否有坏盘;

s103、发现坏盘后及时将所述节点收集的坏盘信息推送给所述主节点,并点亮所述坏盘的定位灯。

在本发明实施例提供的上述自动定位坏盘的方法中,首先选择集群中某节点作为主节点;然后通过所述集群中每个节点定时检测是否有坏盘;最后发现坏盘后及时将所述节点收集的坏盘信息推送给所述主节点,并点亮所述坏盘的定位灯。这样通过自动化定时检测,及时发现坏盘,并将坏盘信息推送到设定的主节点,同时会自动将该坏盘的定位灯点亮,使得机房运维工程师只需要到机房将亮灯的磁盘换成新盘即可,节省了运维工程师的工作量,也便于产品市场化后的维护,减少运维成本,提高产品竞争力。

进一步地,在具体实施时,在本发明实施例提供的上述自动定位坏盘的方法中,如图2所示,所述主节点(如节点1)可以提供服务端(server)服务,用于监听所有客户端(cilent)服务,接收坏盘信息;所述集群中每个节点(如节点2、节点3、节点4)均可以提供一个所述客户端(cilent)服务,用于将所述坏盘信息推送给所述主节点。具体地,运行cilent服务的节点,定时检测是否有坏盘,并将坏盘信息(如节点名、坏盘盘符、卡id、槽位slotid,坏盘时间等等信息)发送给运行server服务的主节点。

更进一步地,在具体实施时,在本发明实施例提供的上述自动定位坏盘的方法中,如图2所示,所述主节点可以创建坏盘日志文件,在将所述坏盘信息推送给所述主节点之后,即server收到client发过来的信息后,还可以包括:将所述坏盘信息写入坏盘日志,这样运维工程师只需要关注该主节点的坏盘日志,通过查看所述坏盘日志获知当前的坏盘信息即可。

更进一步地,在具体实施时,在本发明实施例提供的上述自动定位坏盘的方法中,点亮所述坏盘的定位灯,具体可以包括:在所述坏盘日志中显示所述坏盘对应于哪一块sas卡或raid卡(或其他介质等)上的哪一个槽位;根据所述sas卡或raid卡(或其他介质等)的id、所述槽位id,将所述坏盘的定位灯点亮,这样运维工程师只需要查看点亮的定位灯就可以知道物理设备中具体哪一块盘为坏盘。

在具体实施时,在本发明实施例提供的上述自动定位坏盘的方法中,如图2所示,还可以包括:若未发现坏盘,则通过所述集群中每个节点继续定时检测是否有坏盘。

基于同一发明构思,本发明实施例还提供了一种自动定位坏盘的装置,由于该自动定位坏盘的装置解决问题的原理与前述一种自动定位坏盘的方法相似,因此该自动定位坏盘的装置的实施可以参见自动定位坏盘的方法的实施,重复之处不再赘述。

在具体实施时,本发明实施例提供的自动定位坏盘的装置,如图3所示,具体包括:

主节点选择模块11,用于选择集群中某节点作为主节点;

坏盘检测模块12,用于通过所述集群中每个节点定时检测是否有坏盘;

信息推送模块13,用于发现坏盘后及时将所述节点收集的坏盘信息推送给所述主节点;

定位灯点亮模块14,用于点亮所述坏盘的定位灯。

在本发明实施例提供的上述自动定位坏盘的装置中,可以通过上述四个模块的相互作用,可以一方面减少运维工程师定时在存储系统中的大量磁盘中筛选坏盘的工作量,另一方面提高存储系统在市场化中的可维护,易维护性,减少运维成本,提高产品竞争力。

进一步地,在具体实施时,在本发明实施例提供的上述自动定位坏盘的装置中,所述主节点提供服务端(server)服务,用于监听所有客户端(cilent)服务;所述集群中每个节点均提供一个所述客户端(cilent)服务,用于将所述坏盘信息推送给运行服务端(server)服务的所述主节点。

进一步地,在具体实施时,在本发明实施例提供的上述自动定位坏盘的装置中,还包括:信息写入模块,用于将所述坏盘信息写入坏盘日志;信息查看模块,用于查看所述坏盘日志获知当前的坏盘信息。

关于上述各个模块更加具体的工作过程可以参考前述实施例公开的相应内容,在此不再进行赘述。

相应的,本发明实施例还公开了一种自动定位坏盘的设备,包括处理器和存储器;其中,处理器执行存储器中保存的计算机程序时实现前述实施例公开的自动定位坏盘的方法。

关于上述方法更加具体的过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。

进一步的,本发明还公开了一种计算机可读存储介质,用于存储计算机程序;计算机程序被处理器执行时实现前述公开的自动定位坏盘的方法。

关于上述方法更加具体的过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置、设备、存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本发明实施例提供的一种自动定位坏盘的方法、装置、设备及存储介质,该方法包括:选择集群中某节点作为主节点;通过所述集群中每个节点定时检测是否有坏盘;发现坏盘后及时将所述节点收集的坏盘信息推送给所述主节点,并点亮所述坏盘的定位灯。本发明通过自动化定时检测,及时发现坏盘,并将坏盘信息推送到设定的主节点,同时会自动将该坏盘的定位灯点亮,这样机房运维工程师只需要到机房将亮灯的磁盘换成新盘即可,节省了运维工程师的工作量,也便于产品市场化后的维护,减少运维成本,提高产品竞争力。

最后,还需要说明的是,在本文中,关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本发明所提供的自动定位坏盘的方法、装置、设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1