一种基于git的数据备份方法及系统与流程

文档序号:11949892阅读:568来源:国知局
一种基于git的数据备份方法及系统与流程

本发明属于数据备份技术领域,特别是涉及一种基于git的数据备份方法及系统。



背景技术:

当今社会,互联网信息行业高速发展,每天产生的数据数以EB计。在这么多的数据中,有很多是很重要的数据,需要做数据备份。由于需要备份的数据规模庞大,因此就需要占用大规模的存储空间,导致存储成本较高。通过研究发现,有些数据之间具有较大的关联性,例如,两个需要备份的数据大部分是相同的,而只有小部分有所不同,但现有技术中对二者进行存储时,依然是分别进行存储,这就造成了极大的空间浪费,因此为了达到节省存储空间的目的,如何高效的利用存储空间就变得尤为重要。



技术实现要素:

为解决上述问题,本发明提供了一种基于git的数据备份方法及系统,能够高效的利用存储空间,降低存储成本。

本发明提供的一种基于git的数据备份方法,包括:

接收需要备份的多个数据单元;

设定所述多个数据单元中的一个数据单元为标准数据单元;

利用git分别确定其他数据单元相对于所述标准数据单元的数据增量;

保存所述标准数据单元和所述数据增量;

删除所述其他数据单元。

优选的,在上述基于git的数据备份方法中,

所述设定所述多个数据单元中的一个数据单元为标准数据单元之前,还包括:在备份服务器创建git仓库。

优选的,在上述基于git的数据备份方法中,

所述设定所述多个数据单元中的一个数据单元为标准数据单元之后,还包括:

将标准数据单元添加到git仓库的主分支。

优选的,在上述基于git的数据备份方法中,

所述利用git分别确定其他数据单元相对于所述标准数据单元的数据增量包括:

通过git工具将其他数据单元与所述标准数据单元作比较,找出其他数据单元相对于所述标准数据单元的数据增量。

优选的,在上述基于git的数据备份方法中,

所述保存所述标准数据单元和所述数据增量包括:

保存所述标准数据单元,并将所述数据增量进行打包和区别保存。

本发明提供的一种基于git的数据备份系统,包括:

接收模块,用于接收需要备份的多个数据单元;

设定模块,用于设定所述多个数据单元中的一个数据单元为标准数据单元;

确定模块,用于利用git分别确定其他数据单元相对于所述标准数据单元的数据增量;

保存模块,用于保存所述标准数据单元和所述数据增量;

删除模块,用于删除所述其他数据单元。

优选的,在上述基于git的数据备份系统中,还包括:

创建模块,用于在备份服务器创建git仓库。

优选的,在上述基于git的数据备份系统中,还包括:

添加模块,用于将标准数据单元添加到git仓库的主分支。

优选的,在上述基于git的数据备份系统中,所述确定模块中包括:

比较单元,用于通过git工具将其他数据单元与所述标准数据单元作比较,找出其他数据单元相对于所述标准数据单元的数据增量。

优选的,在上述基于git的数据备份系统中,所述保存模块包括:

第一保存单元,用于保存所述标准数据单元;

第二保存单元,用于将所述数据增量进行打包和区别保存。

通过上述描述可知,本发明提供的上述基于git的数据备份方法及系统,由于先接收需要备份的多个数据单元,然后设定所述多个数据单元中的一个数据单元为标准数据单元,再利用git分别确定其他数据单元相对于所述标准数据单元的数据增量,再保存所述标准数据单元和所述数据增量,最后删除所述其他数据单元,因此能够高效的利用存储空间,降低存储成本。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的第一种基于git的数据备份方法的示意图;

图2为数据服务器向备份服务器传递需要备份数据单元的示意图;

图3为利用git确定数据增量的示意图;

图4为数据恢复的流程图;

图5为本申请实施例提供的第一种基于git的数据备份系统的示意图。

具体实施方式

本发明的核心思想在于提供一种基于git的数据备份方法及系统,能够高效的利用存储空间,降低存储成本。

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本申请实施例提供的第一种基于git的数据备份方法如图1所示,图1为本申请实施例提供的第一种基于git的数据备份方法的示意图。该方法包括如下步骤:

S1:接收需要备份的多个数据单元;

在该步骤中,可以利用备份服务器接收需要备份的数据,其中数据接收包括定时接收和实时接收两种方式,以每次接收的数据为一个数据单元。

S2:设定所述多个数据单元中的一个数据单元为标准数据单元;

在该步骤中,不同的数据单元之间有部分相同的数据,可以从中选取一个数据单元作为标准数据单元,其他的数据单元均与其有部分相同数据。

S3:利用git分别确定其他数据单元相对于所述标准数据单元的数据增量;

在该步骤中,利用git技术确定出数据增量,就不再需要将相同的数据部分都进行保存,从而节省大量存储空间,也提高存储效率。

S4:保存所述标准数据单元和所述数据增量;

在该步骤中,由于不同数据单元之间有部分相同数据,因此不需要对重复数据进行保存,只需要保存其他数据单元和标准数据单元之间的差异就可以,这部分数据比较小,从而达到备份数据的同时又节省存储空间的效果。

S5:删除所述其他数据单元。

在该步骤中,将其他数据单元删除,仅仅保留标准数据单元和数据增量,这就大大降低了所需的存储空间,保证存储的效率足够高。

另外需要说明的是,当需要某个数据单元时,将对应的数据增量,应用到所述标准数据单元,就能够得到对应的额数据单元,这就是所需要的数据。

通过上述描述可知,本申请实施例提供的上述第一种基于git的数据备份方法,由于先接收需要备份的多个数据单元,然后设定所述多个数据单元中的一个数据单元为标准数据单元,再利用git分别确定其他数据单元相对于所述标准数据单元的数据增量,再保存所述标准数据单元和所述数据增量,最后删除所述其他数据单元,因此能够高效的利用存储空间,降低存储成本。

本申请实施例提供的第二种基于git的数据备份方法,是在上述第一种基于git的数据备份方法的基础上,还包括如下技术特征:

所述设定所述多个数据单元中的一个数据单元为标准数据单元之前,还包括:在备份服务器创建git仓库。

具体的,参考图2,图2为数据服务器向备份服务器传递需要备份数据单元的示意图,其中,备份服务器上预装git仓库,所有的数据单元都将数据传输至所述git仓库中,然后有git仓库对数据做后续处理。

本申请实施例提供的第三种基于git的数据备份方法,是在上述第二种基于git的数据备份方法的基础上,还包括如下技术特征:

所述设定所述多个数据单元中的一个数据单元为标准数据单元之后,还包括:

将标准数据单元添加到git仓库的主分支。

在这种情况下,保证git仓库暂存区没有要提交的数据。

本申请实施例提供的第四种基于git的数据备份方法,是在上述第三种基于git的数据备份方法的基础上,还包括如下技术特征:

所述利用git分别确定其他数据单元相对于所述标准数据单元的数据增量包括:

如图3所示,图3为利用git确定数据增量的示意图。通过git工具将备份服务器将收到的其中一份数据单元作为标准数据单元后,其他数据单元与标准数据单元作比较,将备份数据相比如标准数据的增量进行打包处理,并分别区别单独存放。

本申请实施例提供的第五种基于git的数据备份方法,是在上述第一种至第四种基于git的数据备份方法中任一种的基础上,还包括如下技术特征:

所述保存所述标准数据单元和所述数据增量包括:

保存所述标准数据单元,并将所述数据增量进行打包和区别保存。

具体的,将备份服务器接收到的数据单元相对于标准数据单元的增量利用git打包,并将打包数据区别存放。然后,将备份服务器接收到的并且和标准数据单元比较打包增量之后的各个数据单元删除,以节省存储空间。

如图4所示,图4为数据恢复的流程图。在恢复某一个数据单元时,将对应的打包的增量应用于标准数据单元,得到的数据单元就是所需要的数据单元。

本申请实施例提供的第一种基于git的数据备份系统如图5所示,图5为本申请实施例提供的第一种基于git的数据备份系统的示意图。该系统包括:

接收模块1,用于接收需要备份的多个数据单元,可以利用备份服务器接收需要备份的数据,其中数据接收包括定时接收和实时接收两种方式,以每次接收的数据为一个数据单元。;

设定模块2,用于设定所述多个数据单元中的一个数据单元为标准数据单元,由于不同的数据单元之间有部分相同的数据,因此可以从中选取一个数据单元作为标准数据单元,其他的数据单元均与其有部分相同数据;

确定模块3,用于利用git分别确定其他数据单元相对于所述标准数据单元的数据增量,利用git技术确定出数据增量,就不再需要将相同的数据部分都进行保存,从而节省大量存储空间,也提高存储效率;

保存模块4,用于保存所述标准数据单元和所述数据增量,由于不同数据单元之间有部分相同数据,因此不需要对重复数据进行保存,只需要保存其他数据单元和标准数据单元之间的差异就可以,这部分数据比较小,从而达到备份数据的同时又节省存储空间的效果;

删除模块5,用于删除所述其他数据单元,需要说明的是,将其他数据单元删除,仅仅保留标准数据单元和数据增量,这就大大降低了所需的存储空间,保证存储的效率足够高。

本申请实施例提供的上述第一种基于git的数据备份系统,能够高效的利用存储空间,降低存储成本。

本申请实施例提供的第二种基于git的数据备份系统,是在上述第一种基于git的数据备份系统的基础上,还包括如下技术特征:

创建模块,用于在备份服务器创建git仓库。

备份服务器上预装git仓库,所有的数据单元都将数据传输至所述git仓库中,然后有git仓库对数据做后续处理。

本申请实施例提供的第三种基于git的数据备份系统,是在上述第二种基于git的数据备份系统的基础上,还包括如下技术特征:

添加模块,用于将标准数据单元添加到git仓库的主分支。

在这种情况下,保证git仓库暂存区没有要提交的数据。

本申请实施例提供的第四种基于git的数据备份系统,是在上述第三种基于git的数据备份系统的基础上,还包括如下技术特征:

所述确定模块中包括:

比较单元,用于通过git工具将其他数据单元与所述标准数据单元作比较,找出其他数据单元相对于所述标准数据单元的数据增量。

通过git工具将备份服务器将收到的其中一份数据单元作为标准数据单元后,其他数据单元与标准数据单元作比较,将备份数据相比如标准数据的增量进行打包处理,并分别区别单独存放。

本申请实施例提供的第五种基于git的数据备份系统,是在上述第一种至第四种基于git的数据备份系统中任一种的基础上,还包括如下技术特征:

第一保存单元,用于保存所述标准数据单元;

第二保存单元,用于将所述数据增量进行打包和区别保存。

具体的,将备份服务器接收到的数据单元相对于标准数据单元的增量利用git打包,并将打包数据区别存放。然后,将备份服务器接收到的并且和标准数据单元比较打包增量之后的各个数据单元删除,以节省存储空间。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1