本发明涉及数据复制领域,具体涉及一种基于重删的异步远程复制系统及复制方法。
背景技术:
目前企业对数据量不断增长的需求,使得数据中心面临严峻的挑战。研究发现,存储系统中高达60%的数据是冗余的,如何缩减存储系统的冗余数据受到越来越多的关注。
技术实现要素:
为解决上述问题,本发明提供一种采用HyperSteam平台作为重删检测的平台的基于重删的异步远程复制系统及复制方法。
本发明的技术方案是:一种基于重删的异步远程复制系统,包括:
HyperStream客户端:将备份数据传输至HyperStream服务端;
HyperStream服务端:对接收的备份数据进行重删检测和重删处理,并将重删后的备份数据发送至第一DPS服务端;
第一DPS服务端:将接收到的重删后的备份数据备份到第一存储设备;并在预设时间读取第一存储设备内的备份数据,将该备份数据传输至第二DPS服务端;
第二DPS服务端:将接收到的备份数据备份到第二存储设备。
进一步地,HyperStream服务端包括:重删引擎、数据库和流文件;
所述重删引擎通过数据库存储所有备份数据的数据块信息,并提示数据块是否已保存;
所述流文件存放数据块标识。
进一步地,HyperStream服务端:通过数据块标识进行重删检测。
进一步地,第一存储设备为物理磁带库或虚拟磁带库;
第二存储设备为物理磁带库或虚拟磁带库。
一种基于重删的异步远程复制方法,包括:HyperStream客户端、HyperStream服务端、第一DPS服务端、第二DPS服务端、第一存储设备、第二存储设备;
S1:HyperStream客户端将备份数据传输至HyperStream服务端;
S2:HyperStream服务端对接收的备份数据进行重删检测和重删处理,并将重删后的备份数据发送至第一DPS服务端;
S3:第一DPS服务端将接收到的重删后的备份数据备份到第一存储设备;并在预设时间读取第一存储设备内的备份数据,将该备份数据传输至第二DPS服务端;
S4:第二DPS服务端将接收到的备份数据备份到第二存储设备。
根据权利要求5所述的基于重删的异步远程复制方法,其特征在于,HyperStream服务端包括:重删引擎、数据库和流文件;
所述重删引擎通过数据库存储所有备份数据的数据块信息,并提示数据块是否已保存;
所述流文件存放数据块标识。
进一步地,步骤S2中,HyperStream服务端通过数据块标识进行重删检测。
进一步地,第一存储设备为物理磁带库或虚拟磁带库;
第二存储设备为物理磁带库或虚拟磁带库。
本发明采用采用HyperSteam平台作为重删检测的平台,将其部署在PC或服务器集群中,用以实现重复数据的检测,具有较高扩展性、易管理及高可靠性等优点,同时采用DPS系统将重删后的数据进行保存和远程复制到其他存储设备,防止出现当前数据中心数据损坏,数据无法还原的问题,且重删可大大减少存储系统中的冗余数据,提高存储系统的使用率。
附图说明
图1是本发明具体实施例原理示意图。
图2是本发明具体实施例方法流程图。
具体实施方式
下面结合附图并通过具体实施例对本发明进行详细阐述,以下实施例是对本发明的解释,而本发明并不局限于以下实施方式。
如图1所示,本发明提供的基于重删的异步远程复制系统,包括:HyperStream客户端1、HyperStream服务端2、第一DPS服务端3、第二DPS服务端5、第一存储设备4、第二存储设备6。
HyperStream客户端1:将备份数据传输至HyperStream服务端2。
HyperStream服务端2:对接收的备份数据进行重删检测和重删处理,并将重删后的备份数据发送至第一DPS服务端3。
第一DPS服务端3:将接收到的重删后的备份数据备份到第一存储设备4;并在预设时间读取第一存储设备4内的备份数据,将该备份数据传输至第二DPS服务端5。用户可根据需要自行设置预设时间。
第二DPS服务端5:将接收到的重删后的备份数据备份到第二存储设备6。
HyperStream服务端2包括:重删引擎、数据库和流文件;重删引擎通过数据库存储所有备份数据的数据块信息,并提示数据块是否已保存,即哪些数据块是已经保存过的; 流文件存放数据块标识; HyperStream服务端2:通过数据块标识进行重删检测,即判断数据块是否重复。
第一存储设备4为物理磁带库或虚拟磁带库;第二存储设备6为物理磁带库或虚拟磁带库。
如图2所示,本发明提供的基于重删的异步远程复制方法,包括以下步骤:
S1:HyperStream客户端1将备份数据传输至HyperStream服务端2;
S2: HyperStream服务端2对接收的备份数据进行重删检测和重删处理,并将重删后的备份数据发送至第一DPS服务端3;
S3:第一DPS服务端3将接收到的重删后的备份数据备份到第一存储设备4;并在预设时间读取第一存储设备4内的备份数据,将该备份数据传输至第二DPS服务端5;
S4:第二DPS服务端5将接收到的备份数据备份到第二存储设备7。
HyperStream服务端2包括:重删引擎、数据库和流文件;重删引擎通过数据库存储所有备份数据的数据块信息,并提示数据块是否已保存,即哪些数据块是已经保存过的; 流文件存放数据块标识; 上述步骤S2中, HyperStream服务端2通过数据块标识进行重删检测,即判断数据块是否重复。
上述第一存储设备4为物理磁带库或虚拟磁带库;第二存储设备6为物理磁带库或虚拟磁带库。
以上公开的仅为本发明的优选实施方式,但本发明并非局限于此,任何本领域的技术人员能思之的没有创造性的变化,以及在不脱离本发明原理前提下所作的若干改进和润饰,都应落在本发明的保护范围内。