一种集群文件系统动态修改存储单元failover的方法

文档序号:6374676阅读:187来源:国知局
专利名称:一种集群文件系统动态修改存储单元failover的方法
技术领域
本发明涉及计算机技术领域,具体地说是一种集群文件系统动态修改存储单元failover的方法。
背景技术
目前部分分布式文件系统为了实现存储单元(LUN)的高可用性,一般的做法是给存储单元(LUN)添加failover域,failover域是一种高可用机制,包含存储单元(LUN)的挂载节点信息,主要是ip地址和网络类型,这样当某个节点失效的时候,存储单元会自动迁移到failover域中指定的节点上去,从 而保证数据高可用性。但是该方法的问题是,该方法不能动态实现给存储单元(LUN)添加failover域,具有一定的局限性。本发明就是针对该问题而提出的一种能够动态修改failover域的方法,能够有效的提高集群文件系统的高可用性。

发明内容
本发明的目的是提供一种集群文件系统动态修改存储单元failover的方法。该方法主要创新是卷管理模块(3)能够时时检测数据存储集群(I)中各个节点的状态,并且当某一个节点失效的时候,能够保证动态修改与该失效节点对应的存储单元(LUN)的failover,从而可以有效的提高集群的高可用性。本发明的目的是按以下方式实现的,系统包括数据存储集群(I);存储单元管理模块(2);卷管理模块(3),其中
数据存储集群(I)提供数据存储单元,负责去掉元数据之后的数据存储;
存储单元管理模块(2)提供多个存储单元LUN给数据存储集群(I ),用来提供数据存储的载体;
卷管理模块(3)作用是时时监控存储单元的failover域和节点状态,并能够动态修改存储单元的failover ;
具体步骤如下
1)在正常情况下,指定LUNO的failover为10.0. 0. I和10. 0. 0. 2两个ip地址;
2)当节点Node2出现故障后,卷管理模块(3)会启动,根据集群中各个节点的负载情况,自动检测集群中没有出现故障的节点作为LUNO的failover ;
3)然后,卷管理模块(3)自动修改LUNO的failover值,并且是在不影响客户端业务的情况下进行;
4)修改后的LUNO 的 failover 值变成了 10. 0. 0. I 和 10. 0. 0. 3,此时 LUNO 的 failover域重新恢复完成,保证了存储单元的高可用性,从而提高了集群系统的稳定性。卷管理模块(3)能够监控集群节点状态,当集群中节点出现故障时,能够动态修改该节点对应存储单元的failover值,保证存储单元能够切换到其他节点上,所有这些操作都是在不停掉服务的前提下实现的,保证客户端业务不中断。
本发明的有益效果是通常适用于分布式、并行文件系统中,能够实现存储单元(LUN)的failover动态改变,并且是在不中断业务的情况下执行,最大程度的保证了存储单元的可用性,提高了集群的数据安全性。


附图I为节点出现故障前存储单元的状态;
附图2为节点出现故障后存储单元的状态。
具体实施例方式参照说明书附图对本发明的作以下详细地说明。如附图所示,系统包括数据存储集群(I);存储单元管理模块(2);卷管理模块
(3),其中
数据存储集群(I)提供数据存储单元,负责去掉元数据之后的数据存储;
存储单元管理模块(2)提供多个存储单元LUN给数据存储集群(I ),用来提供数据存储的载体;
卷管理模块(3)作用是时时监控存储单元的failover域和节点状态,并能够动态修改存储单元的failover。
实施例I)在正常情况下,指定LUNO的failover为10. O. O. I和10. O. O. 2两个ip地址;
2)当节点Node2出现故障后,卷管理模块(3)会启动,根据集群中各个节点的负载情况,自动检测集群中没有出现故障的节点作为LUNO的failover
3)然后,卷管理模块(3)自动修改LUNO的failover值,并且是在不影响客户端业务的情况下进行;
4)修改后的LUNO 的 failover 值变成了 10. 0. 0. I 和 10. 0. 0. 3,此时 LUNO 的 failover域重新恢复完成,保证了存储单元的高可用性,从而提高了集群系统的稳定性。除说明书所述的技术特征外,均为本专业技术人员的已知技术。
权利要求
1.一种集群文件系统动态修改存储单元failover的方法,其特征在于系统包括数据存储集群(I);存储单元管理模块(2);卷管理模块(3),其中 数据存储集群(I)提供数据存储单元,负责去掉元数据之后的数据存储; 存储单元管理模块(2)提供多个存储单元LUN给数据存储集群(1),用来提供数据存储的载体; 卷管理模块(3)作用是时时监控存储单元的failover域和节点状态,并能够动态修改存储单元的failover ; 具体步骤如下 1)在正常情况下,指定LUNO的failover为10.O. O. I和10. O. O. 2两个ip地址; 2)当节点Node2出现故障后,卷管理模块(3)会启动,根据集群中各个节点的负载情况,自动检测集群中没有出现故障的节点作为LUNO的failover ; 3)然后,卷管理模块(3)自动修改LUNO的failover值,并且是在不影响客户端业务的情况下进行;4)修改后的LUNO 的 failover 值变成了 10. 0. 0. I 和 10. 0. 0. 3,此时 LUNO 的 failover域重新恢复完成,保证了存储单元的高可用性,从而提高了集群系统的稳定性。
2.根据权利要求I所述的方法,其特征在于卷管理模块(3)能够监控集群节点状态,当集群中节点出现故障时,能够动态修改该节点对应存储单元的failover值,保证存储单元能够切换到其他节点上,所有这些操作都是在不停掉服务的前提下实现的,保证客户端业务不中断。
全文摘要
本发明提供一种集群文件系统动态修改存储单元failover的方法,系统包括数据存储集群(1);存储单元管理模块(2);卷管理模块(3),其中数据存储集群(1)提供数据存储单元,负责去掉元数据之后的数据存储;存储单元管理模块(2)提供多个存储单元LUN给数据存储集群(1),用来提供数据存储的载体;卷管理模块(3)作用是时时监控存储单元的failover域和节点状态,并能够动态修改存储单元的failover;该方法适用于分布式、并行文件系统中,能够实现存储单元(LUN)的failover动态改变,并且是在不中断业务的情况下执行,最大程度的保证了存储单元的可用性,提高了集群的数据安全性。
文档编号G06F17/30GK102855289SQ20121028179
公开日2013年1月2日 申请日期2012年8月9日 优先权日2012年8月9日
发明者胡振 申请人:浪潮电子信息产业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1