数据备份的方法和装置的制造方法

文档序号:9547057阅读:587来源:国知局
数据备份的方法和装置的制造方法
【技术领域】
[0001]本发明实施例涉及数据备份领域,尤其涉及一种数据备份的方法和装置。
【背景技术】
[0002]随着大数据时代的到来,IT系统的数据量变的越来越庞大,在数据量不断增长的情况下,为了防止数据丢失,常常需要对数据进行备份。目前,现有技术中常采用全备份或者增量备份的方法来备份数据。
[0003]全备份在备份时要对整个需要备份的数据集进行备份,以得到该数据集的完整副本,全备份为数据提供了最好最完整的保护,但是当要备份的数据集中包含的数据发生变化或者添加新的数据时需要重新进行全备份,这样每次对数据都是进行全备份,这会耗费大量的时间,并且需要大量的磁盘或者磁带来存储数据。
[0004]增量备份是在全备份的基础上做了一些改进,增量备份只备份上次备份之后新添加或者更改的数据,例如,在初始状态,源数据库共有100个文件,那么第一次备份时需要备份这100个文件,过了一段时间源数据库中新增加了 10个文件变成了 110个文件,这样在第二次备份时只需要备份这10个新增的文件,又过了一段时间,源数据库中又新增加了5个文件变成了 115个文件,这样在第三次备份时只需要备份这5个新增的文件。
[0005]由此看来,增量备份减少了备份的工作量,但是增量备份在恢复备份的数据时需要将多次备份的数据进行组合恢复,比较耗时。回到上面的例子,假如要恢复第三次备份时的115个文件,那么必须先恢复第一次备份的100个文件,接下来再恢复第二次备份的10个文件,最后再恢复第三次备份的5个数文件,这样才能得到整个115个数据。恢复过程比较耗时,如果中间发生任何磁盘丢失或者损坏,那么数据将无法完全恢复。

【发明内容】

[0006]本发明实施例提供一种数据备份的方法和设备,以减少数据备份对存储资源的占用,提高数据恢复的效率。
[0007]第一方面,提供了一种数据备份的方法,包括:备份客户端获取第一文件的元数据信息和指纹信息;备份客户端确定所述第一文件在备份服务器端的备份数据存储库中是否已经备份;如果确定所述第一文件已经备份,所述备份客户端将所述第一文件的元数据信息和指纹信息发送给所述备份服务器端,以便于所述备份服务器端根据所述指纹信息获取在所述备份数据存储库已经备份的所述第一文件的存储地址的地址信息,并将所述第一文件的元数据信息、指纹信息和所述地址信息保存在索引信息表中;如果确定所述第一文件没有备份,所述备份客户端将所述第一文件及所述第一文件的元数据信息、指纹信息发送给所述备份服务器端,以便于所述备份服务器端向所述备份数据存储库申请新的存储地址用于保存所述第一文件,并将所述第一文件的元数据信息、指纹信息和所述新的存储地址的地址信息保存在所述索引信息表中。
[0008]第二方面,提供了一种数据备份的方法,包括:备份服务器端接收备份客户端发送的数据恢复请求消息;备份服务器端确定所述数据恢复请求消息对应的索引信息表;所述备份服务器端根据所述索引信息表从备份数据存储库中获取之前备份的文件,其中,所述索引信息表包含至少两个批次备份的文件的元数据信息、指纹信息和地址信息。
[0009]第三方面,提供了一种数据备份的装置,包括:获取模块,用于获取第一文件的元数据信息和指纹信息;确定模块,用于确定所述第一文件在备份服务器端的备份数据存储库中是否已经备份;执行模块,用于当所述确定模块确定所述第一文件已经备份时,将所述第一文件的元数据信息和指纹信息发送给所述备份服务器端,以便于所述备份服务器端根据所述指纹信息获取在所述备份数据存储库已经备份的所述第一文件的存储地址的地址信息,并将所述第一文件的元数据信息、指纹信息和所述地址信息保存在索引信息表中;所述执行模块还用于当所述确定模块确定所述第一文件没有备份时,将所述第一文件及所述第一文件的元数据信息、指纹信息发送给所述备份服务器端,以便于所述备份服务器端向所述备份数据存储库申请新的存储地址用于保存所述第一文件,并将所述第一文件的元数据信息、指纹信息和所述新的存储地址的地址信息保存在所述索引信息表中。
[0010]第四方面,提供了一种数据备份的装置,包括:接收模块,用于接收备份客户端发送的数据恢复请求消息;确定模块,用于确定所述数据恢复请求消息对应的索引信息表;执行模块,用于根据所述索引信息表从备份数据存储库中获取之前备份的文件,其中,所述索引信息表包含至少两个批次备份的文件的元数据信息、指纹信息和地址信息。
[0011]本发明实施例中,每次备份时将已经备份的文件和新增文件的元数据信息、指纹信息以及地址信息都保存在本次备份建立的索引信息表中,这样在恢复数据时就可以根据查找到的该索引信息表直接从备份数据存储库中恢复本次备份的数据,而不用像增量备份那样需要依次恢复之前备份的数据才能最终得到本次备份的数据,本发明实施例减少了数据备份对存储资源的占用,提高了数据恢复的效率。
【附图说明】
[0012]图1是根据本发明实施例的数据备份的方法中的备份客户端和备份服务器端。
[0013]图2是根据本发明实施例的数据备份的方法的示意性流程图。
[0014]图3是根据本发明实施例的数据备份的方法的示意性流程图。
[0015]图4是根据本发明实施例的数据备份的方法的流程图。
[0016]图5是根据本发明实施例的数据备份的方法的流程图。
[0017]图6是根据本发明实施例的数据备份的方法的流程图。
[0018]图7是根据本发明实施例的数据备份的装置的示意性框图。
[0019]图8是根据本发明实施例的数据备份的装置的示意性框图。
[0020]图9是根据本发明实施例的数据备份的装置的示意性框图。
[0021]图10是根据本发明实施例的数据备份的装置的示意性框图。
【具体实施方式】
[0022]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
[0023]为了解决现有技术中增量备份方法恢复数据比较耗时,并且当出现任何磁盘丢失或者损坏那么整个数据将无法完全恢复的问题,本发明实施例在增量备份的基础上做了进一步的改进,在对文件进行备份时仍然只备份新增数据或者变化的数据,但是在每次备份的过程中不仅将新增数据或者变化的数据的元数据信息、指纹信息和地址信息保存本次备份建立的索引信息表中。这样在以后恢复备份数据时只要查找到本次备份时建立的索引信息表就可以直接根据该索引信息表从备份数据存储库中恢复本次备份的数据。这样的话只要查找到索引信息表就可以恢复备份的数据,而不用像现有技术恢复增量备份方法备份的数据时需要先恢复全备份数据,然后再依次恢复之前新备份的数据才能得到本次备份的数据,本发明实施例减少了数据备份对存储资源的占用,提高了数据恢复的效率。
[0024]本发明实施例的数据备份的方法可以由图1中的备份客户端和备份服务器端来共同执行。备份客户端可以是在客户端的宿主机器上安装备份客户代理得到的,备份服务器端可以是在服务器端的宿主机器上安装备份服务器端代理得到的。备份客户端主要负责需要备份的源端数据的读取和需要恢复的数据的写入;备份服务器端主要负责接收备份客户端的发送的备份数据,并组织和管理备份数据的存储,以及响应恢复时备份数据副本的读取和发送。
[0025]图2是根据本发明实施例的数据备份的方法的示意性流程图。该方法可以由备份客户端执行。图2的方法包括:
[0026]210、备份客户端获取第一文件的元数据信息和指纹信息。
[0027]上述第一文件可以是从备份数据源获得的要备份的文件,具体可以是备份客户端从备份数据源获取第一文件的路径,然后再根据路径获取第一文件,然后得到第一文件的元数据信息。第一文件的指纹信息可以是通过对第一文件的元数据信息处理得到的,具体来说,备份客户端可以先获取第一文件的元数据信息,然后再对该元数据信息进行哈希运算,得到该第一文件的指纹信息。其中元数据信息可以包括该第一文件的创建时间、修改时间、文件名称及属性、文件路径等信息。指纹信息是对该第一文件的元数据信息进行哈希计算得到的唯一的哈希值,也称为指纹值,指纹信息并不会表征该第一文件的文件路径信息,而是表征了文件的其他的本身的一些属性信息。这样的话,如果两个文件相同,那么他们对应的指纹信息就相同,而不论这两个文件路径信息是否相同。
[0028]220、备份客户端确定第一文件在备份服务器端的备份数据存储库中是否已经备份。
[0029]可选地,确定第一文件是否已经备份可以根据第一文件的指纹信息与备份客户端本地的第一指纹信息库或者与备份服务器端的第二指纹信息库中的指纹信息进行匹配查找,以确定第一文件在备份数据存储库中是否已经备份。应理解,该备份数据存储库可以位于备份服务器端也可以位于单独的存储系统中。
[0030]具体来说,备份客户端可以将上述第一文件的指纹信息与该备份客户端中的第一指纹信息库中的指纹信息进行匹配查找,确定该第一文件在备份数据存储库中是否已经备份,其中,所述第一指纹信息库包含已备份文件的指纹信息。
[0031]可选地,备份客户端还可以将上述第一文件的指纹信息发送给备份服务器端,以便于备份服务器端将上述第一文件的指纹信息与备份服务器端的第二指纹信息库中的指纹信息进行匹配查找;接下来,备份服务器端可以将匹配查找的结果通过第一指示信息反馈给备份客户端;备份客户端接收备份服务器端发送的第一指示信息,并根据该第一指示信息确定上述第一文件在备份数据存储库中是否已经备份,其中,该第一指示信息用于指示上述备份服务器端对所述第一文件的匹配查找结果。
[0032]应理解,确定第一文件是否备份既可以由备份客户端自己进行匹配查找,也可以由备份服务器端进行匹配查找,当然,为了提高查找结果的准确性和可靠性,还可以先由备份客户端进行匹配查找,如果备份客户端查找不到则由备份服务器端进行再次查找。还应理解,上述第一文件可以是一个文件,也可以是一批文件,也就是说本发明实施例的数据备份的方法既可以对需要备份的多个文件逐个进行备份,也可以是对需要备份的多个文件同时进行备份(也就是批量备份)。例如,假设第一文件为10个文件,那么首先确定这10个文件是否已经备份,如果有6个文件已经备份,那么可以将这6个文件的元数据信息、指纹信息和地址信息保存在索引信息表中,对于剩余的未备份4的文件,需要先将这4个文件保存在备份数据存储库中,然后再将这4个文件的元数据信息、指纹信息和地址信息保存在索引信息表中。
[0033]因此,备份客户端可以将上述第一文件的指纹信息与备份客户端中的第一指纹信息库中的指纹信息进行第一次匹配查找;在第一次匹配查找的结果表示未在第一指纹数据库中查找到匹配的指纹信息时,备份客户端将上述第一文
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1