基于分布式存储系统的数据恢复方法、装置及系统与流程

文档序号:12120299阅读:388来源:国知局
基于分布式存储系统的数据恢复方法、装置及系统与流程

本发明实施例涉及数据存储领域,尤其涉及一种基于分布式存储系统的数据恢复方法、装置及系统。



背景技术:

随着信息技术的不断发展以及数据量的不断提高,分布式存储系统随之出现,其中,分布式存储系统是将数据按照一定规则切分并打散存储在多台独立通用存储服务器上。分布式存储系统通过采用可扩展的系统结构,利用多台存储服务器分担存储负荷以及利用位置服务器定位存储信息,提高了系统的可靠性、可用性、存取效率以及扩展性。此外,分布式存储系统通过存储集群的成千上万台服务器将数据充分冗余,提高了数据的安全性。然而,在分布式存储系统中存储服务器的磁盘发生损坏和故障是不可避免的。在磁盘损坏或者失效之前,将数据恢复到分布式存储系统中的新磁盘中,能够防止数据丢失,以及避免数据处于降级的状态以及保证数据的可靠性。在实际应用中,存储在分布式存储系统中的很多文件都是空洞文件,其中,空洞文件是指包含空洞(无任何内容,通常为全0)的文件。

目前,在进行数据恢复时,通常将待进行数据恢复的磁盘中完整的空洞文件传输给新磁盘。然而,发明人在实现发明的过程中发现,若将待进行数据恢复的磁盘中完整的空洞文件传输给新磁盘,需要传输的数据量较大,造成数据传输和数据写入的速度较慢,从而造成数据恢复的速度较慢,以及造成数据降级的时间较长,进而导致数据丢失的风险较高以及数据的可靠性较低。此外,传输较大数据量的数据,会造成占用较多的网络资源,从而导致网络资源浪费。



技术实现要素:

本发明实施例提供一种基于分布式存储系统的数据恢复方法、装置及系统,用以解决现有技术数据丢失的风险较高、数据的可靠性较低以及网络资源浪费的缺陷。

一方面,本发明实施例提供一种基于分布式存储系统的数据恢复方法,包括:

获取分布式存储系统中待进行数据恢复的磁盘上的空洞文件;

从所述空洞文件中提取出待进行数据恢复的真实数据;

将所述真实数据进行传输。

另一方面,本发明实施例提供另一种基于分布式存储系统的数据恢复方法,包括:

接收待进行数据恢复的真实数据,所述真实数据为从空洞文件提取的;

将所述真实数据恢复到新磁盘的本地中。

又一方面,本发明实施例提供一种基于分布式存储系统的数据恢复装置,包括:

获取单元,用于获取分布式存储系统中待进行数据恢复的磁盘上的空洞文件;

提取单元,用于从所述获取单元获取的所述空洞文件中提取出待进行数据恢复的真实数据;

传输单元,用于将所述提取单元提取的所述真实数据进行传输。

再一方面,本发明实施例提供一种基于分布式存储系统的数据恢复装置,包括:

接收单元,用于接收待进行数据恢复的真实数据,所述真实数据为从空洞文件提取的;

恢复单元,用于将所述接收单元接收的所述真实数据恢复到新磁盘的本地中。

又再一方面,本发明实施例提供一种基于分布式存储系统的数据恢复系统,包括:

待进行数据恢复的磁盘,用于获取分布式存储系统中待进行数据恢复的磁盘上的空洞文件,并从所述空洞文件中提取出待进行数据恢复的真实数据;

新磁盘,用于接收所述待进行数据恢复的磁盘传输的所述真实数据并将所述真实数据恢复到新磁盘的本地中。

本发明实施例提供的一种基于分布式存储系统的数据恢复方法、装置及系统,首先待进行数据恢复的磁盘获取分布式存储系统中待进行数据恢复的磁盘上的空洞文件,从所述空洞文件中提取出待进行数据恢复的真实数据,并将所述真实数据进行传输,然后新磁盘接收所述真实数据并将所述真实数据恢复到所述新磁盘的本地中。与现有技术中在进行数据恢复时,通常将待进行数据恢复的磁盘中完整的空洞文件传输给新磁盘相比,本发明实施例通过从空洞文件中提取出待进行数据恢复的真实数据,然后将所述真实数据进行传输,减少了需要传输的数据量,提升了数据传输和数据写入的速度以及提升了数据恢复的速度,以及降低了数据降级的时间,从而降低了数据丢失的风险以及提升了数据的可靠性。此外,通过传输真实数据,减少了网络资源的占用,从避免了网络资源浪费。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于分布式存储系统的数据恢复方法流程图;

图2为本发明实施例提供的另一种基于分布式存储系统的数据恢复方法流程图;

图3为本发明实施例提供的又一种基于分布式存储系统的数据恢复方法流程图;

图4为本发明实施例提供的再一种基于分布式存储系统的数据恢复方法流程图;

图5为本发明实施例提供的一种基于分布式存储系统的数据恢复装置的结构示意图;

图6为本发明实施例提供的另一种基于分布式存储系统的数据恢复装置的结构示意图;

图7为本发明实施例提供的又一种基于分布式存储系统的数据恢复装置的结构示意图;

图8为本发明实施例提供的再一种基于分布式存储系统的数据恢复装置的结构示意图;

图9为本发明实施例提供的一种基于分布式存储系统的数据恢复装置实体的结构示意图;

图10为本发明实施例提供的一种基于分布式存储系统的数据恢复系统的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为使本发明技术方案的优点更加清楚,下面结合附图和实施例对本发明作详细说明。

本发明实施例提供一种基于分布式存储系统的数据恢复方法,如图1所示,所述方法包括:

101、获取分布式存储系统中待进行数据恢复的磁盘上的空洞文件。

其中,所述待进行数据恢复的磁盘可以为性能下降的磁盘。磁盘在损坏或者失效之前,通常会读写速度变慢,缓存失效等性能会下降的现象。在分布式存储系统中会存储很多空洞文件,其中,所述空洞文件可以为包含空洞的文件,空洞通常为全0,即空洞文件可以为某一段为全0的文件。

需要说明的是,可以通过分布式存储系统中各个磁盘读写数据的读写延时时间识别待进行数据恢复的磁盘。具体地,当磁盘的读写延时时间大于或者等于预置阈值时,确定为所述磁盘为需要进行数据恢复的磁盘。

102、从空洞文件中提取出待进行数据恢复的真实数据。

其中,待进行数据恢复的真实数据可以为空洞文件中非0的数据。

例如:待进行数据恢复磁盘上的某空洞文件的大小为4K,即数据量为4096个字节,如果空洞文件中第1024字节到第2048字节是空洞,即[1024,2048]这1024个字节实际上全为0数据,则说第0字节到第1024字节和第2048字节到第4096字节中的3072个字节数据是真实数据。

103、将待进行数据恢复的真实数据进行传输。

例如,空洞文件的大小为4K,即数据量为4096个字节。其中,第0字节到1024字节、以及第2048字节到第4096字节中的3072个字节数据是真实数据,则将空洞文件中该真实数据进行传输,而对第1024字节到第2048字节不进行传输。与现有技术传输整个空洞文件相比,本发明实施例通过只传输真实数据,减少了1/4的数据传输量,提升了数据传输和数据写入的速度以及提升了数据恢复的速度,以及降低了数据降级的时间,从而降低了数据丢失的风险以及提升了数据的可靠性。此外,通过传输真实数据,减少了网络资源的占用,从避免了网络资源浪费。

需要说明的是,对于本发明实施例所举例的4K空洞文件,仅仅是用于举例说明本发明的内容。对于空洞文件的数据量大小,并不做具体的限定,所述空洞文件可能为9M的文件,或也可能是7G的文件等。而且,根据用户在分布式存储系统中存储和读写的文件的不同,空洞文件中的空洞部分也并不相同,在本发明实施例中所述空洞部分仅仅作为说明,也不作为具体限定。

本发明实施例提供的一种基于分布式存储系统的数据恢复方法,首先获取分布式存储系统中待进行数据恢复的磁盘上的空洞文件;然后从所述空洞文件中提取出待进行数据恢复的真实数据;最后将所述真实数据进行传输。与现有技术中在进行数据恢复时,通常将待进行数据恢复的磁盘中完整的空洞文件传输给新磁盘相比,本发明实施例通过从空洞文件中提取出待进行数据恢复的真实数据,然后将所述真实数据进行传输,减少了需要传输的数据量,提升了数据传输和数据写入的速度以及提升了数据恢复的速度,以及降低了数据降级的时间,从而降低了数据丢失的风险以及提升了数据的可靠性。此外,通过传输真实数据,减少了网络资源的占用,从避免了网络资源浪费。

本发明实施例提供另一种基于分布式存储系统的数据恢复方法,如图2所示,所述方法包括:

201、获取分布式存储系统中待进行数据恢复的磁盘上的空洞文件。

其中,待进行数据恢复的磁盘以及空洞文件在步骤101中已进行了详细描述,在此不做赘述。

202、从空洞文件中提取出待进行数据恢复的真实数据在磁盘中的磁盘位置区间。

对于本发明实施例,步骤202具体可以为:利用预置位置提取控制命令字从所述空洞文件中提取出所述真实数据在所述磁盘中的磁盘位置区间。

其中,预置位置提取控制命令字可以为本地文件系统支持的名称为FS_IOC_FIEMAP的控制命令字,用于获取一个文件在磁盘上的非空洞的位置,具体地,可以用于获取一个文件在磁盘上的非空洞的位置。在本发明实施例中,非空洞可以为待进行数据恢复的真实数据。所述本地文件系统可以用于构建分布式存储系统。

例如,通过预置位置提取控制命令字FS_IOC_FIEMAP对一个大小为4K的文件进行提取,得到[0,1024]、[2048,4096]两个位置区间,那么说明该文件的前1024字节和从第2048字节到第4096字节中的2048个字节是真实数据,而其他部分则是空洞。

203、根据磁盘位置区间从空洞文件中提取出真实数据。

204、将真实数据以及真实数据在磁盘中的磁盘位置区间进行传输。

例如,通过预置位置提取控制命令字FS_IOC_FIEMAP对一个大小为4K,的文件进行提取,得到[0,1024]、[2048,4096]两个位置区间,分别提取[0,1024]、[2048,4096]两个位置区间中的真实数据,然后3072个字节的真实数据进行传输,同时传输[0,1024]、[2048,4096]这两个位置区间信息。

对于本发明实施例,在所述将真实数据进行传输之前,所述方法还包括:创建空洞文件标识信息,所述空洞文件标识信息用于标识所述真实数据为从空洞文件提取的。此时,所述将真实数据进行传输具体可以包括:将所述真实数据以及所述空洞文件标识信息进行传输。对于本发明实施例,通过创建空洞文件标识信息,能够方便新磁盘识别待进行数据恢复的真实数据为空洞文件中的真实数据,从而能够保证恢复出完整的空洞文件。

本发明实施例提供的另一种基于分布式存储系统的数据恢复方法,首先获取分布式存储系统中待进行数据恢复的磁盘上的空洞文件;然后从空洞文件中提取出真实数据以及真实数据在磁盘中的磁盘位置区间;之后创建空洞文件标识信息,所述空洞文件标识信息用于标识所述真实数据为从所述空洞文件提取的;最后将真实数据以及真实数据在磁盘中的磁盘位置区间进行传输。与现有技术中在进行数据恢复时,通常将待进行数据恢复的磁盘中完整的空洞文件传输给新磁盘相比,本发明实施例通过从空洞文件中提取出待进行数据恢复的真实数据以及真实数据在磁盘中的磁盘位置区间,然后将所述真实数据及其磁盘位置区间进行传输,减少了需要传输的数据量,提升了数据传输和数据写入的速度以及提升了数据恢复的速度,以及造成数据降级的时间较长,从而降低了数据丢失的风险以及提升了数据的可靠性。此外,通过传输真实数据,减少了网络资源的占用,从避免了网络资源浪费。并且在进行数据恢复的过程中创建了空洞文件标识,用以区分传输过程中分布式存储系统中的其他文件,避免了恢复数据时可能造成的错误。

本发明实施例提供又一种基于分布式存储系统的数据恢复方法,如图3所示,所述方法包括:

301、接收待进行数据恢复的真实数据。

其中,所述真实数据为从空洞文件提取的。

需要说明的是,本发明实施例的执行主体可以为新磁盘或者为嵌入在新磁盘中的装置。所述待进行数据恢复的真实数据可以为分布式存储系统中待进行数据恢复的磁盘或者为嵌入在待进行数据恢复的磁盘中的装置发送的,具体可以为从空洞文件中提取出所述真实数据发送的。

302、将待进行数据恢复的真实数据恢复到新磁盘的本地中。

本发明实施例提供的又一种基于分布式存储系统的数据恢复方法,首先获取分布式存储系统中待进行数据恢复的磁盘以及所述磁盘上的空洞文件;然后从所述空洞文件中提取出待进行数据恢复的真实数据;最后将所述真实数据进行传输。与现有技术中在进行数据恢复时,通常将待进行数据恢复的磁盘中完整的空洞文件传输给新磁盘相比,本发明实施例通过从空洞文件中提取出待进行数据恢复的真实数据,然后将所述真实数据进行传输,减少了需要传输的数据量,提升了数据传输和数据写入的速度以及提升了数据恢复的速度,以及降低了数据降级的时间,从而降低了数据丢失的风险以及提升了数据的可靠性。此外,通过传输真实数据,减少了网络资源的占用,从避免了网络资源浪费。

本发明实施例提供了再一种基于分布式存储系统的数据恢复方法,如图4所示,所述方法包括:

401、接收待进行数据恢复的真实数据。

对于发明实施例,步骤401具体可以为:接收待进行数据恢复的数据;检测待进行数据恢复的数据中是否存在空洞文件标识信息,所述空洞文件标识信息用于标识所述真实数据为从空洞文件提取的;若是,则确定所述数据为待进行数据恢复的真实数据。

402、接收待进行数据恢复的真实数据对应的磁盘位置区间。

403、根据磁盘位置区间将待进行数据恢复的真实数据恢复到新磁盘的本地中。

需要说明的是,在确认接收到的数据为所述待数据恢复的真实数据后,可以依次提取真实数据对应的磁盘位置区间,然后将真实数据写入并恢复到新磁盘中。

例如,接收到真实数据和真实数据对应的磁盘位置区间[0,1024]、[1024,2048],首先会提取到[0,1024]这个区间,并该区间内的1024个字节写入到新的磁盘中。接下来提取[2048,4096]这一区间,并该区间内的2048个字节写入到新的磁盘中。当真实数据写入和恢复完成后,真实数据对应的空洞文件恢复完成。

本发明实施例提供的再一种基于分布式存储系统的数据恢复方法,首先获取分布式存储系统中待进行数据恢复的磁盘上的空洞文件;然后从空洞文件中提取出真实数据以及真实数据在磁盘中的磁盘位置区间;之后创建空洞文件标识信息,所述空洞文件标识信息用于标识所述真实数据为从所述空洞文件提取的;最后将真实数据以及真实数据在磁盘中的磁盘位置区间进行传输。与现有技术中在进行数据恢复时,通常将待进行数据恢复的磁盘中完整的空洞文件传输给新磁盘相比,本发明实施例通过从空洞文件中提取出待进行数据恢复的真实数据以及真实数据在磁盘中的磁盘位置区间,然后将所述真实数据及其磁盘位置区间进行传输,减少了需要传输的数据量,提升了数据传输和数据写入的速度以及提升了数据恢复的速度,以及降低了数据降级的时间,从而降低了数据丢失的风险以及提升了数据的可靠性。此外,通过传输真实数据,减少了网络资源的占用,从避免了网络资源浪费。并且通过创建空洞文件标识信息,能够方便新磁盘识别待进行数据恢复的真实数据为空洞文件中的真实数据,从而能够保证恢复出完整的空洞文件。

进一步的,本发明实施例提供了一种基于分布式存储系统的数据恢复装置,所述装置可以为分布式存储系统中待进行数据恢复的磁盘或者为嵌入在待进行数据恢复的磁盘中的装置,如图5所示,所述装置包括:获取单元51,提取单元52、传输单元53。

获取单元51,可以用于获取分布式存储系统中待进行数据恢复的磁盘以及所述磁盘上的空洞文件。获取单元51可以为本基于分布式存储系统的数据恢复装置中获取分布式存储系统中待进行数据恢复的磁盘以及所述磁盘上的空洞文件的功能模块。

提取单元52,可以用于从所述获取单元51获取的所述空洞文件中提取出待进行数据恢复的真实数据。提取单元52可以为本基于分布式存储系统的数据恢复装置中提取出待进行数据恢复的真实数据的功能模块。

传输单元53,可以用于将所述提取单元52提取的所述真实数据进行传输。传输单元53可以为本基于分布式存储系统的数据恢复装置中将所述真实数据进行传输的功能模块。

需要说明的是,本发明实施例提供的一种基于分布式存储系统的数据恢复装置所涉及各功能模块的其他相应描述,可以参考图1所示方法的对应描述,在此不再赘述。针对上述基于分布式存储系统的数据恢复装置,凡是本发明实施例中使用到的各个模块的功能都可以通过硬件处理器(hardware processor)来实现。

本发明实施例提供的一种基于分布式存储系统的数据恢复装置。所述装置包括:获取单元,提取单元、传输单元。获取单元,用于获取分布式存储系统中待进行数据恢复的磁盘以及所述磁盘上的空洞文件;提取单元,用于从所述获取单元获取的所述空洞文件中提取出待进行数据恢复的真实数据;传输单元,用于将所述提取单元提取的所述真实数据进行传输。与现有技术中在进行数据恢复时,通常将待进行数据恢复的磁盘中完整的空洞文件传输给新磁盘相比,本发明实施例通过从空洞文件中提取出待进行数据恢复的真实数据,然后将所述真实数据进行传输,减少了需要传输的数据量,提升了数据传输和数据写入的速度以及提升了数据恢复的速度,以及降低了数据降级的时间,从而降低了数据丢失的风险以及提升了数据的可靠性。此外,通过传输真实数据,减少了网络资源的占用,从避免了网络资源浪费。

进一步地,本发明实施例提供了另一种基于分布式存储系统的数据恢复装置,所述装置可以为分布式存储系统中待进行数据恢复的磁盘或者为嵌入在待进行数据恢复的磁盘中的装置,如图6所示,所述装置包括:获取单元61、提取单元62、传输单元63。

获取单元61,可以用于获取分布式存储系统中待进行数据恢复的磁盘以及所述磁盘上的空洞文件。获取单元61可以为本基于分布式存储系统的数据恢复装置中获取分布式存储系统中待进行数据恢复的磁盘以及所述磁盘上的空洞文件的功能模块。

提取单元62,可以用于从所述获取单元61获取的所述空洞文件中提取出待进行数据恢复的真实数据。提取单元62可以为本基于分布式存储系统的数据恢复装置中提取出待进行数据恢复的真实数据的功能模块。

传输单元63,可以用于将所述提取单元62提取的所述真实数据进行传输。传输单元63可以为本基于分布式存储系统的数据恢复装置中将所述真实数据进行传输的功能模块。

所述提取单元62,具体用于从所述空洞文件中提取出所述真实数据在所述磁盘中的磁盘位置区间;并用于根据所述磁盘位置区间从所述空洞文件中提取出待进行数据恢复的真实数据。

所述传输单元63,可以具体用于将所述真实数据的磁盘位置区间以及所述真实数据进行传输。传输单元63具体可以为本基于分布式存储系统的数据恢复装置中将所述真实数据的磁盘位置区间以及所述真实数据进行传输的功能模块。

进一步的,本装置还包括:创建单元64。

所述创建单元64,可以用于创建空洞文件标识信息,所述空洞文件标识信息用于标识所述真实数据为从所述空洞文件提取的。创建单元64具体可以为本基于分布式存储系统的数据恢复装置中创建空洞文件标识信息的功能模块。

进一步的,传输单元63,具体可以用于将所述真实数据和所述创建单元64创建的所述空洞文件标识信息进行传输。传输单元63具体可以为本基于分布式存储系统的数据恢复装置中将将所述真实数据和以及所述空洞文件标识信息进行传输的功能模块。

进一步的,所述提取单元62,具体用于利用预置位置提取控制命令字从所述空洞文件中提取出所述真实数据在所述磁盘中的磁盘位置区间。提取单元62具体可以为本基于分布式存储系统的数据恢复装置中利用预置位置提取控制命令字从所述空洞文件中提取出所述真实数据在所述磁盘中磁盘位置区间的功能模块。

需要说明的是,本发明实施例提供的另一种基于分布式存储系统的数据恢复装置所涉及各功能模块的其他相应描述,可以参考图2所示方法的对应描述,在此不再赘述。针对上述基于分布式存储系统的数据恢复装置,凡是本发明实施例中使用到的各个模块的功能都可以通过hardware processor来实现。

本发明实施例提供的另一种基于分布式存储系统的数据恢复装置。所述装置包括:获取单元,提取单元、传输单元。获取单元,用于获取分布式存储系统中待进行数据恢复的磁盘以及所述磁盘上的空洞文件;提取单元,用于从所述获取单元获取的所述空洞文件中提取出待进行数据恢复的真实数据;传输单元,用于将所述提取单元提取的所述真实数据进行传输。与现有技术中在进行数据恢复时,通常将待进行数据恢复的磁盘中完整的空洞文件传输给新磁盘相比,本发明实施例通过从空洞文件中提取出待进行数据恢复的真实数据以及真实数据在磁盘中的磁盘位置区间,然后将所述真实数据及其磁盘位置区间进行传输,减少了需要传输的数据量,提升了数据传输和数据写入的速度以及提升了数据恢复的速度,以及降低了数据降级的时间,从而降低了数据丢失的风险以及提升了数据的可靠性。此外,通过传输真实数据,减少了网络资源的占用,从避免了网络资源浪费。并且通过创建空洞文件标识信息,能够方便新磁盘识别待进行数据恢复的真实数据为空洞文件中的真实数据,从而能够保证恢复出完整的空洞文件。

进一步地,本发明实施例提供了又一种基于分布式存储系统的数据恢复装置,所述装置可以为分布式存储系统中的新磁盘或者为嵌入在所述新磁盘中的装置,如图7所示,所述装置包括:接收单元71、恢复单元72。

接收单元71,可以用于接收待进行数据恢复的真实数据,所述真实数据为从空洞文件提取的。接收单元71是本基于分布式存储系统的数据恢复装置中接收待进行数据恢复的真实数据,所述真实数据为从空洞文件提取的功能模块。

恢复单元72,可以用于将所述接收单元71接收的所述真实数据恢复到新磁盘的本地中。恢复单元72是本基于分布式存储系统的数据恢复装置中将所述真实数据恢复到新磁盘的本地中的功能模块。

需要说明的是,本发明实施例提供的又一种基于分布式存储系统的数据恢复装置所涉及各功能模块的其他相应描述,可以参考图3所示方法的对应描述,在此不再赘述。针对上述基于分布式存储系统的数据恢复装置,凡是本发明实施例中使用到的各个模块的功能都可以通过硬件处理器(hardware processor)来实现。

本发明实施例提供的又一种基于分布式存储系统的数据恢复装置。所述装置包括:接收单元、恢复单元接收单元,用于接收待进行数据恢复的真实数据,所述真实数据为从空洞文件提取的;恢复单元,用于将所述接收单元接收的所述真实数据恢复到新磁盘的本地中。与现有技术中在进行数据恢复时,通常将待进行数据恢复的磁盘中完整的空洞文件传输给新磁盘相比,本发明实施例通过从空洞文件中提取出待进行数据恢复的真实数据,然后将所述真实数据进行传输,减少了需要传输的数据量,提升了数据传输和数据写入的速度以及提升了数据恢复的速度,以及造成数据降级的时间较长,从而降低了数据丢失的风险以及提升了数据的可靠性。此外,通过传输真实数据,减少了网络资源的占用,从避免了网络资源浪费。

进一步地,本发明实施例提供了再一种基于分布式存储系统的数据恢复装置,如图8所示,所述装置包括:接收单元81、恢复单元82。

接收单元81,可以用于接收待进行数据恢复的真实数据,所述真实数据为从空洞文件提取的。接收单元81是本基于分布式存储系统的数据恢复装置中接收待进行数据恢复的真实数据,所述真实数据为从空洞文件提取的功能模块。

恢复单元82,可以用于将所述接收单元81接收的所述真实数据恢复到新磁盘的本地中。恢复单元82是本基于分布式存储系统的数据恢复装置中将所述真实数据恢复到新磁盘的本地中的功能模块。

所述接收单元81,还可以用于接收所述真实数据对应的磁盘位置区间。接收单元81是本基于分布式存储系统的数据恢复装置中接收所述真实数据对应的磁盘位置区间的功能模块。

所述恢复单元82,具体可以用于根据所述接收单元81接收的所述磁盘位置区间将所述真实数据恢复到新磁盘的本地中。恢复单元82是本基于分布式存储系统的数据恢复装置中根据所述磁盘位置区间将所述真实数据恢复到新磁盘的本地中的功能模块。

进一步地,所述接收单元81包括:接收模块8101、检测模块8102和确定模块8103。

接收模块8101,可以用于接收待进行数据恢复的数据。

检测模块8102,可以用于检测所述接收模块8101接收的所述数据中是否存在空洞文件标识信息,所述空洞文件标识信息用于标识所述真实数据为从空洞文件提取的。

确定模块8103,可以用于若所述检测模块8102检测待所述数据中存在空洞文件标识信息,则确定所述数据为待进行数据恢复的真实数据。

需要说明的是,本发明实施例提供的再一种基于分布式存储系统的数据恢复装置所涉及各功能模块的其他相应描述,可以参考图4所示方法的对应描述,在此不再赘述。针对上述基于分布式存储系统的数据恢复装置,凡是本发明实施例中使用到的各个模块的功能都可以通过hardware processor来实现。

示例性的,如图9所示,图9示出了本发明实施例提供的再一种基于分布式存储系统的数据恢复装置的实体结构示意图,该分布式存储系统中的数据恢复装置可以包括:一个或多个处理器(processor)91、通信接口(Communications Interface)92、存储器(memory)93和总线94,其中,处理器91、通信接口92、存储器93通过总线94完成相互间的通信。通信接口92可以用于获取单元、检测单元与确定单元之间的信息传输。处理器91可以调用存储器93中的逻辑指令,使得所述装置能够执行上述任意实施例中的访问方法。

此外,上述的存储器93中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本发明实施例提供的再一种基于分布式存储系统的数据恢复装置。所述装置包括:接收单元、检测单元、恢复单元。接收单元,用于接收待进行数据恢复的数据;检测单元,用于检测所述接收单元接收的所述待进行数据恢复的数据是否为从空洞文件中提取的待进行数据恢复的真实数据。恢复单元,用于若检测单元检测到所述待进行数据恢复的数据为从空洞文件中提取的待进行数据恢复的真实数据,则将所述真实数据恢复到新磁盘的本地中。与现有技术中在进行数据恢复时,通常将待进行数据恢复的磁盘中完整的空洞文件传输给新磁盘相比,本发明实施例通过从空洞文件中提取出待进行数据恢复的真实数据以及真实数据在磁盘中的磁盘位置区间,然后将所述真实数据及其磁盘位置区间进行传输,减少了需要传输的数据量,提升了数据传输和数据写入的速度以及提升了数据恢复的速度,从而降低了数据丢失的风险以及提升了数据的可靠性。此外,通过传输真实数据,减少了网络资源的占用,从避免了网络资源浪费。并且在进行数据恢复的过程中创建了空洞文件标识,用以区分传输过程中分布式存储系统中的其他文件,避免了恢复数据时可能造成的错误。

进一步地,本发明实施例提供了一种基于分布式存储系统的数据恢复系统,如图10所示,所述系统包括:待进行数据恢复的磁盘1001和新磁盘1002。

所述待进行数据恢复的磁盘1001,可以用于获取分布式存储系统中待进行数据恢复的磁盘上的空洞文件,从所述空洞文件中提取出待进行数据恢复的真实数据,并将所述真实数据进行传输;

所述新磁盘1002,用于接收所述真实数据并将所述真实数据恢复到所述新磁盘的本地中。

需要说明的是,针对上述待进行数据恢复的磁盘、新磁盘及基于分布式存储系统的数据恢复系统,凡是本发明实施例中使用到的各个单元模块的功能都可以通过hardware processor来实现。

本发明实施例提供的一种基于分布式存储系统的数据恢复系统,首先待进行数据恢复的磁盘获取分布式存储系统中待进行数据恢复的磁盘以及所述磁盘上的空洞文件,从所述空洞文件中提取出待进行数据恢复的真实数据,并将所述真实数据进行传输,然后新磁盘接收所述真实数据并将所述真实数据恢复到所述新磁盘的本地中。与现有技术中在进行数据恢复时,通常将待进行数据恢复的磁盘中完整的空洞文件传输给新磁盘相比,本发明实施例通过从空洞文件中提取出待进行数据恢复的真实数据,然后将所述真实数据进行传输,减少了需要传输的数据量,提升了数据传输和数据写入的速度以及提升了数据恢复的速度,以及降低了数据降级的时间,从而降低了数据丢失的风险以及提升了数据的可靠性。此外,通过传输真实数据,减少了网络资源的占用,从避免了网络资源浪费。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1