一种基于文件级实时同步的Parastor200管理节点高可用方法与流程

文档序号:12040060阅读:202来源:国知局
本发明涉及一种基于文件级实时同步的Parastor200管理节点高可用方法。

背景技术:
ParaStor200并行存储系统采用了代表存储技术、网络通信技术以及数据管理技术发展方向的并行体系架构,是一款面向海量非结构化数据处理、拥有自主知识产权的高端存储系统。它可以提供TB/s级的高速带宽和EB级的海量存储空间,能够满足飞机汽车船舶设计、生物基因研究、材料科学研究、天气预报、地震监测、环境监测分析、能源勘探、电子商务、网络游戏、社交与视频分享网站建设、动漫渲染、视频编辑处理等领域中对于存储容量和I/O性能要求极高的应用,可广泛应用于政府、教育、科研、制造、企业、医疗、石油、广电、互联网等行业。MGR表示Parastor200的管理节点,提供统一的控制管理界面,管理员通过该节点管理整个存储系统。oPara表示Parastor200元数据节点,用于管理存储系统的所有索引数据和命名空间,对外提供单一的全局映像,支持多个节点以Active-Active集群模式工作。oStor表示Parastor200数据节点,用于提供数据存储空间,内嵌高性能数据存取引擎,并行处理所有客户端的数据访问请求,支持多个oStor以副本方式(1-3个副本)容错。Parastor200的管理节点,提供统一的控制管理界面,它保存着整个系统重要的拓扑结构及配置信息,管理员通过该节点管理整个存储系统。在整个存储系统中,管理节点的使用频度相对较低,只有当挂载客户端、查看存储系统状态、添加存储单元、删除存储单元等管理操作时才会用到管理节点。在小规模集群中通常管理较为简单,管理操作也比较少,此时管理节点的重要性相对较低,即使管理节点出现故障,我们也有充分的时间去修复管理节点,就算出现管理节点磁盘永久损坏也不至于出现灾难性后果,因为我们可以通过元数据节点、数据节点上的配置信息来重构管理节点上的重要信息。而丢失的只是一些历史数据和授权信息,不会对存储系统造成太大的影响。目前,针对这一问题的解决办法是通过管理界面定期备份管理节点配置信息,当管理节点出现故障时,可以使用备用节点安装管理节点图形界面程序,然后导入备份的信息来完成。现有方案有几个潜在的风险。首先,即便备份频率较高,但还是无法避免两次备份间系统配置被更改的可能。特别是进行了增加或者减少存储单元、更改客户端授权信息等操作,恢复后的信息和真实信息不一样,将会影响系统的正常运行。其次,即便没有任何信息丢失,重构一台管理节点耗费的时间还是比较长的,对于那些规模较大,用户较多,需要经常进行管理操作的系统显然是无法接受的。

技术实现要素:
针对现有技术的不足,本发明提供一种基于文件级实时同步的Parastor200管理节点高可用方法;本发明通过实现Parastor200管理节点的高可用使Parastor200实现了完全意义上的全冗余设计,系统中任何部件的损坏不影响存储系统的使用。管理节点任何部件的损坏,都可以在数秒内将服务切换到备用节点上。这样既不影响正常使用,又有充足的时间去修复故障。本发明的目的是采用下述技术方案实现的:一种基于文件级实时同步的Parastor200管理节点高可用方法,其改进之处在于,所述方法通过以下两个方面实现:(1)管理节点存储系统信息的同步;(2)管理节点故障切换。其中,所述(1)中,所述管理节点存储系统信息同步是指当管理节点上的存储系统信息发生变更时,识别并激发增量拷贝到备用的管理节点上;实现在线管理节点和备用管理节点上存储系统信息的同步。其中,所述管理节点为Parastor200管理节点,所述Parastor200管理节点运行在Linux操作系统上;Linux内核包含文件系统事件机制Inotify,所述文件系统事件机制Inotify监控文件系统操作,实现实时触发同步;所述文件系统操作读取、写入和创建。其中,所述Parastor200管理节点存储系统信息包括配置文件和日志;所述配置文件为IO统计信息数据库;所述Parastor200管理节点存储系统采用对IO统计信息数据库和日志信息的进行定期分割,以及在定期分割的基础上实现增加备份式同步。其中,所述(2)中,采用心跳机制判断故障管理节点,即通过在线管理节点和备用管理节点间连接心跳线发送信息和应答对方的监测,并通过ping第三方节点方式判断故障管理节点并自动实现故障切换。其中,在进行故障切换时结合资源和服务的迁移实现;所述资源和服务包括:1)管理节点存储系统信息文件;2)管理节点管理IP;3)Parastor200管理服务以及Parastor200图形界面服务;4)数据同步服务。其中,所述1)中,管理节点存储系统信息文件资源通过同步备份到备用管理节点上。其中,所述2)中,所述管理节点管理IP为管理节点向元数据节点、数据节点发送管理命令所走的IP,所述管理节点管理IP在故障切换时从在线管理节点迁移到备用管理节点上。其中,所述3)中,所述Parastor200管理服务以及Parastor200图形界面服务在故障切换时,从在线管理节点切换到备用管理节点上。其中,所述4)中,切换后备用管理节点成为主管理节点(主管理节点即为在线管理节点),将备用管理节点的信息反过来备份到原来的主管理节点上。与现有技术比,本发明达到的有益效果是:本发明提供基于文件级实时同步的Parastor200管理节点高可用方法,使用inotify文件系统事件机制和rsync结合实现文件级的实时同步,实用文件级实时同步在Parastor200管理节点高可用中的应用。通过实现Parastor200管理节点的高可用使Parastor200实现了完全意义上的全冗余设计,系统中任何部件的损坏不影响存储系统的使用。管理节点任何部件的损坏,都可以在数秒内将服务切换到备用管理节点上。这样既不影响正常使用,又有充足的时间去修复故障。具体实施方式下面对本发明的具体实施方式作进一步的详细说明。本发明是要实现Parastor200管理节点的高可用。通过分析现有技术存在的问题我们便知道,本发明是要解决以下两个问题:(1)管理节点存储系统信息的同步;(2)管理节点故障切换。解决管理节点信息同步,即当管理节点上的存储系统信息发生变更时,必须能够立刻识别到这个变更,并立即激发增量拷贝到备用管理节点上,实现在线管理节点和备用管理节点上存储系统信息的同步。Parastor200管理节点运行在Linux操作系统上。Linux内核有一种文件系统事件机制称为Inotify,它监控文件系统操作,比如读取、写入和创建。Inotify反应灵敏,用法非常简单,并且比cron(cron任务)任务的繁忙轮询高效得多。因此Inotify是我们实现实时触发同步的最好选择。Parastor200存储系统信息包括配置文件和日志,大部分文件都比较小,但随着时间的推移,配置文件的IO统计信息数据库和日志信息都在不断的增长。为了减小同步时间窗,达到几乎瞬间完成同步,一方面要对日志及数据库进行定期的主动分割,另一方面在分割的基础上实现增量备份式的同步。由于Parastor200存储系统配置信息一般情况下更改不多,我们通过监控文件系统事件提供了实时响应事件的机制,大大减少同步要扫描的文件数量。另外,通过增量备份大大减少了同步时需要通过网络传输的数据量。最后通过定期对文件主动分割可以使增量备份需要计算的校验值也大大减少。因此管理节点上的存储信息可以实时地同步到备份管理节点上。管理节点故障切换时,故障切换首先需要解决的问题就是如何判断故障,这里我们采用心跳机制,通过管理节点和备用管理节点间连接心跳线发送信息和应答对方的监测,并通过ping第三方节点等方式判断故障节点并自动实现故障切换。进行故障切换还需要解决一个重要的问题就是服务、资源的迁移。在本发明中资源和服务包括:1)管理节点存储系统信息文件,这些资源已通过同步备份到备用管理节点上。2)管理节点管理IP,这个IP不同于两个节点间同步文件所走的网络的IP。它是管理节点向元数据节点、数据管理节点发送管理命令所走的IP。这个IP需要在故障切换时从主管理节点迁移到备用管理节点上。3)Parastor200管理服务以及Parastor200图形界面服务,这两个服务也在故障切换时,从管理节点切换到备用节点上。4)数据同步服务,即切换后备用节点成为了主管理节点,它需要将它上面的信息反过来备份到原来的主管理节点上。最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求范围当中。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1