Infiniband网络中IP地址漂移处理方法、装置、系统、存储介质和设备与流程

文档序号:17148182发布日期:2019-03-19 23:10阅读:427来源:国知局
Infiniband网络中IP地址漂移处理方法、装置、系统、存储介质和设备与流程

本发明涉及计算机存储领域,特别是涉及一种infiniband网络中ip地址漂移处理方法、装置、系统、存储介质和设备。



背景技术:

网络附属存储(networkattachedstorage,nas)集群是由多个节点构成的一种松散耦合的计算服务器结合,协同起来对外提供服务。其中ip地址漂移是高可用集群nas中的必备的功能,具有此功能的集群nas,能够在不中断主机业务的情况下,快速将故障端口上的业务迁移到其他同种类型的可用端口上,而用户无感知。当故障端口恢复工作后,又可重新接管之前的业务。

在高性能集群nas中一般使用的infiniband网卡(ib卡)的远程直接数据存取(remotedirectmemoryaccess,rdma)作为业务通道,infiniband是一种支持多并发链接的“转换线缆”技术,不是用于一般网络连接的,它的主要设计目的是针对服务器端的连接问题的。这样就会出现一个问题:

基于infiniband网络的集群nas的ip地址漂移是根据ip的变化而自动切换业务网口,但是ib卡的rdma并不依赖ip,依赖的是ib卡端口的全局唯一标识符(globallyuniqueidentifier,guid)。当业务ip变动,ib卡的连接并没有断开的情况,就会出现逻辑链路和物理链路不同步的情况,导致业务并不会自动进行切换。



技术实现要素:

本发明的目的是提供一种可以解决基于infiniband网络的集群nas使用ib卡的rdma作为业务通道时无法自动进行ip地址漂移问题的方法,可以让集群nas使用ib卡的rdma大幅提升性能的同时又可以保证集群nas的高可用性,在出现故障时可以自动根据ip地址进行业务口切换。

一种infiniband网络中ip地址漂移处理方法,包括:

从infiniband网络接收rdma连接请求命令,以及ip地址漂移命令;

根据ip地址漂移命令,从ip地址漂移参数中提取准备ip地址漂移的ip地址;

设置一个标志,表示不再接收infiniband网络中的任何新的io请求;

处理完成所述ip地址连接上缓存的所有io请求;

断开rdma连接,删除该ip地址。

一种ip地址漂移处理装置,包括:

接收模块,用于从infiniband网络接收rdma连接请求命令,以及ip地址漂移命令;

提取模块,用于根据ip地址漂移命令,从ip地址漂移参数中提取准备ip地址漂移的ip地址;

设置模块,用于设置一个标志,表示不再接收infiniband网络中的任何新的io请求;

缓存处理模块,用于处理所述ip地址连接上缓存的所有io请求;

执行模块,用于断开rdma连接,删除该ip地址。

一种infiniband网络中ip地址漂移处理系统,包括存储服务器、计算服务器和交换机:

所述存储服务器从infiniband网络接收rdma连接请求命令,以及ip地址漂移命令和参数;根据所述ip地址漂移命令,从所述ip地址漂移参数中提取准备ip地址漂移的ip地址;设置一个标志,表示不再接收所述infiniband网络中的任何新的io请求;处理完成所述ip地址连接上缓存的所有io请求;断开所述rdma连接,删除所述ip地址。

所述计算服务器,用于生成所述rdma连接请求和所述io请求;

所述交换机,用与传输所述计算服务器和所述存储服务器之间的数据。

所述存储服务器还用于存储数据,并接收所述io请求,对数据进行读写操作。

进一步地,所述计算服务器采用nfs协议与所述存储服务器上的文件系统连接。

进一步地,所述计算服务器之间采用网络文件系统协议中的rdma协议通过所述交换机连接。

进一步地,所述计算服务器包括至少一块ibhca卡,所述ibhca卡与所述交换机连接并传输数据。

进一步地,所述存储服务器包括至少一块硬盘和至少一块ibhca卡,所述硬盘作为文件系统用于存储数据,所述ibhca卡与所述交换机连接并传输数据;

一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行后,使得所述处理器执行以下步骤:

从infiniband网络接收rdma连接请求命令,以及ip地址漂移命令;

根据ip地址漂移命令,从ip地址漂移参数中提取准备ip地址漂移的ip地址;

设置一个标志,表示不再接收infiniband网络中的任何新的io请求;

处理完成所述ip地址连接上缓存的所有io请求;

断开rdma连接,删除该ip地址。

一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:

从infiniband网络接收rdma连接请求命令,以及ip地址漂移命令;

根据ip地址漂移命令,从ip地址漂移参数中提取准备ip地址漂移的ip地址;

设置一个标志,表示不再接收infiniband网络中的任何新的io请求;

处理完成所述ip地址连接上缓存的所有io请求;

断开rdma连接,删除该ip地址。

上述infiniband网络中ip地址漂移处理方法、装置、系统、存储介质和设备,当接收到ip地址漂移命令时,从ip地址漂移参数中提取准备ip地址漂移的ip地址,通过设置标志来拒绝网络中的任何新的io请求,等待该ip地址的连接上缓存的所有请求处理完,断开rdma连接,删除该ip地址。实现了业务ip变动时,ib卡的连接自动断开,进而实现了业务自动切换。

附图说明

图1为本发明的系统的物理拓扑图;

图2为本发明的数据传输架构示意图;

图3为本发明的数据传输流程图;

图4为本发明的infiniband网络中ip地址漂移处理方法流程图;

图5为本发明的infiniband网络中ip地址漂移处理装置组成结构示意图。

具体实施方式

下面结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所提供的实施例仅仅用于解释本发明,并不用于限定本发明。另外,以下所提供的实施例是用于实施本发明的部分实施例,而非提供实施本发明的全部实施例,在不冲突的情况下,本发明实施例记载的技术方案可以任意组合的方式实施。

需要说明的是,本发明实施例中,术语“包括”、“包含”或者其任何变体意在涵盖非排他性的包含,从而使得包括一系列要素的方法或者装置不仅包括所明确记载的要素,而且还包括没有明确列出的其他要素,或者是还包括为实施方法或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的方法或者装置中还存在另外的相关要素(例如方法中的步骤或者装置中的模块,例如的模块可以是部分电路、部分处理器、部分节点、部分程序或软件等等)。

例如,本发明实施例提供的infiniband网络中ip地址漂移处理方法包含了一系列的步骤,但是本发明实施例提供的infiniband网络中ip地址漂移处理方法不限于所记载的步骤,同样地,本发明实施例提供的infiniband网络中ip地址漂移处理装置包含了一系列的模块,但是本发明实施例记载的装置不限于包括所明确记载的模块。

对本发明实施例进行详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释。

1)无限带宽技术(infiniband),是一种支持多并发链接的“转换线缆”技术,不是用于一般网络连接的,它的主要设计目的是针对服务器端的连接问题。通过infiniband网络传送数据时,数据是以数据包方式传输,这些数据包会组合成一条条信息。这些信息的操作方式可能是远程直接内存存取的读写程序,或者是通过信道接受发送的信息,或者是多点传送传输。

2)网络附属存储(networkattachedstorage,nas)集群,连接在网络上,具备资料存储功能的装置,因此也称为“网络存储器”。它是一种专用数据存储服务器。它以数据为中心,将存储设备与服务器彻底分离,集中管理数据,从而释放带宽、提高性能、降低总拥有成本、保护投资。

3)远程直接数据存取(rdma),就是为了解决网络传输中服务器端数据处理的延迟而产生的。rdma通过网络把资料直接传入计算机的存储区,将数据从一个系统快速移动到远程系统存储器中,而不对操作系统造成任何影响,这样就不需要用到多少计算机的处理功能。它消除了外部存储器复制和上下文切换的开销,因而能解放内存带宽和cpu周期用于改进应用系统性能。

4)ip地址漂移,利用共享的“虚拟”ip地址,当本地进行节点切换与路由切换,使另一端的发送和收方端没有感觉到本地节点地址有变化,保证了通信的连续性,起到断点保护的作用。

5)网络文件系统(nfs),它允许网络中的计算机之间通过tcp/ip网络共享资源。

6)infiniband主机通道适配器(ibhca卡),infiniband接口卡的一种。

图1为一个实施例中infiniband网络中ip地址漂移处理方法的应用环境图。参照图1,该infiniband网络中ip地址漂移处理方法应用于infiniband网络中ip地址漂移处理系统。该系统包括包括计算服务器,存储服务器和交换机。计算服务器用于处理存储服务器经所述交换机输出的数据。存储服务器用于从infiniband网络接收rdma连接请求命令,以及ip地址漂移命令和参数;根据所述ip地址漂移命令,从所述ip地址漂移参数中提取准备ip地址漂移的ip地址;设置一个标志,表示不再接收所述infiniband网络中的任何新的io请求;处理完成所述ip地址连接上缓存的所有io请求;断开所述rdma连接,删除所述ip地址。交换机用于传输计算服务器和存储服务器之间的数据。存储服务器还用于存储和传输所述计算服务器需处理的数据。

在一实施例中,为了保证集群nas的高可靠性,存储服务器的数量至少为2台以上。为了降低系统的运维成本和部署成本,计算服务器通常采用x86架构的pc服务器。

图2为数据传输架构示意图。参照图2,在一实施例中,计算服务器包括至少一块ibhca卡,所述ibhca卡与交换机连接并传输数据;

在一实施例中,存储服务器包括至少一块硬盘和至少一块ibhca卡,硬盘作为文件系统用于存储数据,ibhca卡与交换机连接并传输数据;

在一实施例中,交换机采用infiniband交换机。

在一实施例中,计算服务器采用nfs协议(networkfilesystem)与存储服务器上的文件系统连接。

在一实施例中,计算服务器之间采用nfs的rdma协议通过infiniband交换机连接。

本领域的技术人员可以理解,计算服务器、存储服务器和交换机可以是位于集群nas环境中。在集群nas环境中,正确的ip地址漂移根据ip的变化而自动切换业务网口,应该是软件层和物理层一起断,然后到对端去连接,但是infiniband网络中ip地址漂移后,因为ib卡的rdma并不依赖ip,依赖的是ib卡端口的全局唯一标识符(globallyuniqueidentifier,guid),当业务ip变动,ib卡的连接并没有断开的情况,就会出现逻辑链路(软件层)和物理链路(物理层)不同步的情况,导致业务并不会自动进行切换,也就是ib卡无法支持ip地址漂移。

作为实现本发明实施例infiniband网络中ip地址漂移处理方法的一个可选实施例,图3为本发明实施例提供的infiniband网络中ip地址漂移处理方法的一个可选的流程示意图,以下进一步说明。

步骤101:请求连接。

在所述存储服务器部署prodigy集群nas系统,利用存储池技术将硬盘格式化为zfs文件系统,并通过nfs将该文件系统共享出去,所述计算服务器通过infiniband交换机,并采用nfs的rdma协议向所述存储服务器发送mount请求消息,交换数据。

步骤102:建立连接。

所述计算服务器采用nfs协议的rdma协议与所述存储服务器建立连接。

步骤103:进行读写业务。

所述计算服务器循环对所述存储服务器的目录进行文件创建,删除,读写,修改,移动等操作。

步骤104:手动切换存储池。

在所述计算服务器业务进行的同时,所述存储服务器通过集群nas系统的命令zpoolreleasepool,手动切换存储池,触发ip地址漂移。

步骤105:断开ib的rdma连接,详细流程见图4。

s1,接收rdma连接请求命令,以及ip地址漂移命令;

s2,根据ip地址漂移命令,从ip地址漂移参数中提取准备ip地址漂移的ip地址;

s3,设置一个标志,表示不再接收infiniband网络中的任何新的io请求;

s4,处理完成所述ip地址连接上缓存的所有io请求;

s5,断开rdma连接,删除该ip地址。计算服务器重新发起连接请求时,由于连接请求的目的ip地址在该存储服务器中并不存在,会拒绝所述计算服务器的连接请求。

步骤106:ip地址漂移。

存储服务器执行zpoolreleasepool后,存储池会自动切换到另外一个存储服务器上,同时集群的ip地址也会跟着漂移到另外一个存储服务器上。

步骤107:重新建立连接.

计算服务器发现rdma连接断开后,会主动重新根据mount时的ip地址建立nfs的连接,而此时存储池的ip地址已经漂移到另外一个存储服务器上了,另外一个存储服务器接收到所述计算服务器的重新连接请求后,发现连接请求的目的ip地址在本地存在,则允许接收连接请求,成功和所述主机建立新的连接。

步骤108:业务恢复.

所述计算服务器和另外一个存储服务器成功连接后,并不知道连接的存储服务器已经发生了变化,所述主机认为只是连接断开了一会儿然后又重新连接上了,整个过程对所述主机节点透明,连接恢复后,所述主机节点可以正常的进行读写业务。

应用本发明上述实施例,具有以下有益效果:

解决了infiniband网络中ip地址漂移后逻辑链路和物理链路不同步的问题,连接被认为只是短暂断开了,连接恢复后,可以正常的进行读写业务,让集群nas使用ib卡的rdma大幅提升性能的同时又可以保证集群nas的高可用性,在出现故障时可以自动根据ip地址进行业务口切换。

作为实现本发明实施例的一个可选实施例,本发明实施例infiniband网络中ip地址漂移处理方法包括:

1)请求连接

在所述存储服务器dfa部署prodigy集群nas系统,利用存储池技术将硬盘格式化为zfs文件系统/poola/fs,并通过nfs将该文件系统共享出去,所述计算服务器通过infiniband交换机,并采用nfs的rdma协议向所述存储服务器发送mount请求消息,交换数据;

2)建立连接

所述计算服务器采用nfs协议的rdma协议与所述存储服务器建立连接;具体命令如下:mount-tnfs-overs=3,proto=rdma,port=20049192.168.36.120:/poola/fs/mnt/test

3)进行读写业务

所述计算服务器循环对所述存储服务器的目录/mnt/test进行文件创建,删除,读写,修改,移动等操作。

4)手动切换存储池

在所述计算服务器业务进行的同时,所述存储服务器dfa通过集群nas系统的命令zpoolreleasepoola,手动切换存储池;

5)断开ib的rdma连接。

所述存储服务器dfa在切换存储池前会通过ioctl的方式下发一个断开rdma连接的命令给内核的rpc的rdma模块,并将准备ip地址漂移的ip地址“192.168.20.120”作为参数传输给rpc的rdma模块,rpc的rdma模块接收到断开rdma连接的命令和ip地址后,将会设置一个标志,表示“192.168.20.120”这个接口不再接收所述计算服务器的任何请求,rpc模块拒绝所述计算服务器的发往“192.168.20.120”这个接口的所有io请求。rpc模块等待“192.168.20.120”的连接上缓存的所有请求处理完,再主动的断开rdma连接,同时从该存储服务器dfa中删除该ip地址。所述计算服务器重新发起连接请求时,所述存储服务器dfa判断连接请求的目的ip“192.168.20.120”地址是否存在该存储服务器中,由于ip地址“192.168.20.120”在存储服务器dfa已经被删除,则拒绝所述计算服务器的连接请求。

6)ip地址漂移

所述存储服务器dfa执行zpoolreleasepoola后,poola存储池会自动切换到另外一个存储服务器dfb上,同时集群的ip地址“192.168.20.120”也会跟着漂移到另外一个存储服务器dfb上。

7)重新建立连接

所述计算服务器发现rdma连接断开后,会主动重新根据mount时的ip地址“192.168.20.120”建立nfs的连接,而此时存储池的ip地址已经漂移到另外一个存储服务器dfb上了,存储服务器dfb接收到所述计算服务器的重新连接请求后,发现连接请求的目的ip地址在本地存在,则允许接收连接请求,成功和所述主机建立新的连接。

8)业务恢复

所述计算服务器和另外一个存储服务器dfb成功连接后,并不知道连接的存储服务器已经发生了变化,所述主机认为只是连接断开了一会儿然后又重新连接上了,整个过程对所述主机节点透明,连接恢复后,所述主机节点可以正常的进行读写业务。

本发明实施例还提供了一种infiniband网络中ip地址漂移处理装置,图5所示为本发明实施例提供的的组成结构示意图,参见图5,本发明实施例提供的infiniband网络中ip地址漂移处理装置包括:

接收模块11,用于从infiniband网络接收rdma连接请求命令,以及ip地址漂移命令;

提取模块12,用于根据ip地址漂移命令,从ip地址漂移参数中提取准备ip地址漂移的ip地址;

设置模块13,用于设置一个标志,表示不再接收infiniband网络中的任何新的io请求;

缓存处理模块14,用于处理所述ip地址连接上缓存的所有io请求;

执行模块15,用于断开rdma连接,删除该ip地址。

本发明实施例还提供一种存储有计算机程序的计算机可读存储介质,例如存储有计算机程序的存储器,所述计算机程序被处理器执行时实现以下步骤:从infiniband网络接收rdma连接请求命令,以及ip地址漂移命令;根据ip地址漂移命令,从ip地址漂移参数中提取准备ip地址漂移的ip地址;设置一个标志,表示不再接收infiniband网络中的任何新的io请求;处理完成所述ip地址连接上缓存的所有io请求;断开rdma连接,删除该ip地址。

上述计算机可读存储介质可以是只读内存(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、只读光盘(compactdiscread-onlymemory,cd-rom)、磁带、软盘和光数据存储设备等。

本发明实施例还提供一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,计算机程序被所述处理器执行时,使得处理器执行以下步骤:从infiniband网络接收rdma连接请求命令,以及ip地址漂移命令;根据ip地址漂移命令,从ip地址漂移参数中提取准备ip地址漂移的ip地址;设置一个标志,表示不再接收infiniband网络中的任何新的io请求;处理完成所述ip地址连接上缓存的所有io请求;断开rdma连接,删除该ip地址。

上述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1