用于存储管理的方法、电子设备和计算机程序产品与流程

文档序号:30156971发布日期:2022-05-26 07:50阅读:65来源:国知局
用于存储管理的方法、电子设备和计算机程序产品与流程

1.本公开的实施例总体涉及存储管理,具体涉及用于存储管理的方法、电子设备和计算机程序产品。


背景技术:

2.随着存储技术的发展,越来越多的数据被备份到存储系统中,以避免数据丢失。在这种情况下,对存储系统的安全性的要求越来越高。然而,传统的数据备份方式存在各种安全性问题。例如,存储在存储系统中的备份数据可能被篡改,或者客户端可能被定向到伪造的存储服务器从而获得伪造的备份数据。因此,传统的数据备份方式是不安全的。


技术实现要素:

3.本公开的实施例提供了用于存储管理的方法、电子设备和计算机程序产品。
4.在本公开的第一方面,提供了一种用于存储管理的方法。该方法包括:在客户端处,生成用于恢复第一目标数据的第一备份块,客户端将第一目标数据备份到第一服务器中并且将第一目标数据的元数据备份到第二服务器中,客户端与至少一个其他客户端和第二服务器维护包括至少一个备份块的相同的备份链;将第一备份块添加到客户端处维护的备份链中;以及向至少一个其他客户端和第二服务器分发第一备份块以用于添加到至少一个其他客户端和第二服务器处维护的备份链中。
5.在本公开的第二方面,提供了一种电子设备。该设备包括至少一个处理单元和至少一个存储器。至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令。该指令当由至少一个处理单元执行时使得设备执行动作,该动作包括:在客户端处,生成用于恢复第一目标数据的第一备份块,客户端将第一目标数据备份到第一服务器中并且将第一目标数据的元数据备份到第二服务器中,客户端与至少一个其他客户端和第二服务器维护包括至少一个备份块的相同的备份链;将第一备份块添加到客户端处维护的备份链中;以及向至少一个其他客户端和第二服务器分发第一备份块以用于添加到至少一个其他客户端和第二服务器处维护的备份链中。
6.在本公开的第三方面,提供了一种计算机程序产品。计算机程序产品被有形地存储在非瞬态计算机可读介质上并且包括机器可执行指令,机器可执行指令在被执行时使机器实现根据本公开的第一方面所描述的方法的任意步骤。
7.提供发明内容部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开的关键特征或必要特征,也无意限制本公开的范围。
附图说明
8.通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常
代表相同部件。
9.图1示出了本公开的一些实施例能够在其中实现的存储系统的示例的示意图;
10.图2示出了根据本公开的一些实施例的用于存储管理的方法的示例的流程图;
11.图3示出了根据本公开的一些实施例的备份块的示例的示意图;
12.图4示出了根据本公开的一些实施例的数据恢复过程的示例的泳道图;以及
13.图5示出了可以用来实施本公开内容的实施例的示例设备的示意性框图。
14.在各个附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
15.下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
16.在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
17.如上所述,随着存储技术的发展,越来越多的数据被备份到存储系统中,以避免数据丢失。例如,随着云存储技术的发展,越来越多的用户倾向于将大量数据存储在云中。与专用存储相比,云存储成本更低,并且更易于扩展。
18.然而,由于传统的存储系统通常基于内部网络设计,而没有考虑云环境中的安全保护,因此存储服务器位于云中将产生潜在安全风险。例如,在访问云时,客户端可能连接到伪造的存储服务器(例如,通过dns(domain name system,域名系统)重新绑定攻击)以进行备份还原。在这种情况下,客户端将利用存储服务器提供的伪造的备份数据进行还原,从而存在客户端上的数据被篡改或攻击的风险。
19.根据本公开的示例实施例,提出了一种用于存储管理的改进方案。在该方案中,在客户端处,生成用于恢复目标数据的备份块,客户端将目标数据备份到第一服务器中并且将目标数据的元数据备份到第二服务器中,客户端与至少一个其他客户端和第二服务器维护包括至少一个备份块的相同的备份链;将备份块添加到客户端处维护的备份链中;以及向至少一个其他客户端和第二服务器分发备份块以用于添加到至少一个其他客户端和第二服务器处维护的备份链中。
20.以此方式,在本方案中,备份块被维持在由多个客户端和第二服务器共同维持的、无法被篡改的备份链中,从而保证了备份块无法被篡改。这样的备份块可以在恢复目标数据时用于验证备份数据与目标数据的一致性,从而提高了存储安全性和可靠性。以下将参照附图来具体描述本公开的实施例。
21.图1示出了本公开的一些实施例能够在其中实现的存储系统100的示例的示意图。存储系统100包括多个客户端(例如,客户端110-1和110-2,在下文中,统称为“客户端110”)、第一服务器130和第二服务器140。客户端和服务器可以被实现为一个或多个计算设
备,其至少包含处理器、存储器以及其他通常存在于通用计算机中的组件,以便实现计算、存储、通信、控制等功能。例如,客户端和服务器可以是个人计算机、平板计算机、可穿戴设备、大型机、分布式计算系统等。应理解,虽然图1中仅示出了两个客户端110和120,但是客户端的数目可以更多或更少。
22.客户端110可以将其上存储的目标数据备份到服务器中。例如,客户端110-1可以将目标数据111备份到第一服务器130中,从而在第一服务器130中存储作为目标数据111的副本的备份数据137。此外,客户端110-1还可以将目标数据111的元数据113备份到第二服务器140中,从而在第二服务器140中存储作为元数据113的副本的备份元数据147。
23.在某些实施例中,第一服务器130可以是远程存储服务器,例如位于云中的存储服务器。而第二服务器140可以是本地存储服务器。将元数据147备份到本地,一方面可以提高元数据的安全性,另一方面由于元数据的大小较小,仅将元数据备份到本地,而将目标数据备份到成本更低的云中,能够降低存储成本。
24.此外,客户端110和第二服务器140可以实现称为备份链的区块链,例如备份链115-1至115-3(在下文中,统称为“备份链115”)。备份链115可以包括多个备份块,例如备份链115-1可以包括备份块117-1和117-2(在下文中,统称为“备份块117”)。一个备份块117可以对应于一次备份。也就是说,客户端110在进行一次备份时,可以生成一个备份块117。备份块117可以在恢复目标数据111时用于验证备份数据137,以确保目标数据111和备份数据137的一致性。应理解,虽然图1中仅示出了备份链115-1包括两个备份块117-1和117-2,但是备份链115中的备份块117的数目可以更多或更少。
25.为了实现备份链115,在客户端110和第二服务器140之间可以建立连接,例如,对等连接。备份链115是去中心化的,因此维持备份链115的客户端110和第二服务器140都是相等的节点。通过共识机制,客户端110和第二服务器140可以维护相同的备份链115。这样的备份链115无法被篡改,从而保证了备份链115中的备份块117无法被篡改。进一步地,由于备份链115由本地的客户端110和第二服务器140维护,更加确保了备份链115的安全性和可靠性。
26.如上所述,备份链115由备份块117构成,而备份块117是由客户端110在进行备份时生成的。例如,在客户端110-1对目标数据111进行备份时,可以生成用于恢复目标数据111的备份块117-2。客户端110-1可以将备份块117-2添加到客户端110-1处维护的备份链115-1中。此外,客户端110-1可以向至少一个其他客户端(例如,客户端110-2等)和第二服务器140分发备份块117-2以用于添加到至少一个其他客户端和第二服务器140处维护的备份链(例如,备份链115-2和115-3)中。以此方式,在恢复目标数据111时,客户端110可以利用备份块117-2来确保备份数据137与目标数据111是一致的,避免客户端110上的数据被篡改或攻击,从而提高了存储安全性和可靠性。
27.图2示出了根据本公开的一些实施例的用于存储管理的方法200的流程图。方法200可以由如图1所示的客户端110来实现。备选地,方法200也可以由除了客户端110之外的其他主体实现。应当理解的是,方法200还可以包括未示出的附加步骤和/或可以省略所示出的步骤,本公开的范围在此方面不受限制。
28.在210,客户端110(例如,客户端110-1)生成用于恢复目标数据(例如,目标数据111)的备份块(例如,备份块117-2)。客户端110-1与至少一个其他客户端(例如,客户端
110-2)和第二服务器140维护包括至少一个备份块117的相同的备份链115。客户端110-1将目标数据111备份到第一服务器130中,并且将目标数据111的元数据113备份到第二服务器140中。
29.在某些实施例中,客户端110-1可以将目标数据111划分成多个数据分片,并且将这些数据分片及其各自的哈希值存储到第一服务器130中。此外,客户端110-1还可以将目标数据111的元数据113和元数据113的哈希值存储到第二服务器140中。以此方式,可以实现源重复数据删除。源重复数据删除可以具有若干优点。具体地,对于重复的数据分片,客户端仅需要将该数据分片的哈希值发送到存储服务器,而无需发送数据分片本身,由此可以显著减少备份过程中使用的网络流量并提高备份效率。此外,由于相同的数据分片在存储服务器中仅具有一个副本,因此可以节省存储空间。
30.图3示出了根据本公开的一些实施例的备份块的示例的示意图300。在下文中将以备份链115-1中的备份块117-1和117-2作为备份块的示例进行描述。
31.备份块117可以包括备份块117在备份链115中的编号,随机值,在备份链115中位于备份块117之前的备份块的哈希值,和/或备份块117的哈希值。在某些实施例中,随机值可以是对于每个备份块117唯一的、随机生成的值。此外,由于备份块117包括其之前的备份块的哈希值,从而通过一个备份块就可以找到其之前的备份块,使得备份块形成了一个可定位的备份链115。例如,由于备份块117-2包括其前一备份块117-1的哈希值,因此通过备份块117-2可以定位到备份块117-1。在某些实施例中,由于备份链115的第一个备份块(例如,备份块117-1)之前不存在其他备份块,因此其之前的备份块的哈希值可以被设置为预定值(例如,空)。
32.进一步地,备份块117还可以包括目标数据111的哈希值,针对目标数据111的文件路径信息,以及目标数据110中的至少一个文件各自的哈希值。在某些实施例中,文件路径信息可以指示目标数据110中的至少一个文件在客户端110上的存储路径。
33.返回参考图2,在220,客户端110-1将备份块117-2添加到客户端110-1处维护的备份链115-1中。在230,客户端110-1向至少一个其他客户端和第二服务器140分发备份块117-2以用于添加到至少一个其他客户端和第二服务器140处维护的备份链115中。
34.除了添加备份块117之外,客户端110还可以删除备份块117。在某些实施例中,如果客户端110确定接收到删除备份块117的请求,则客户端110可以从其维护的备份链115中删除备份块117。此外,客户端110还可以向至少一个其他客户端和第二服务器140发送从这些客户端和第二服务器140处维护的备份链115中删除备份块117的请求。进一步地,由备份块从备份链中删除,其后一备份块将变为连接到或引用其前一备份块。因此,后一备份块所包括的之前的备份块的哈希值也将从被删除的备份块的哈希值变为前一备份块的哈希值。
35.在某些实施例中,为了安全的目的,仅允许添加和删除备份块117,而不允许修改备份块117,从而防止恶意第三方破坏备份块117。
36.以此方式,由于利用安全的备份块117来恢复目标数据111时,可以确保备份数据137与目标数据111是一致的,从而避免客户端110被篡改或攻击,提高了存储安全性和可靠性。
37.在上文中描述了备份块的生成过程,在下文中将参考图4描述利用备份块来恢复目标数据的过程。图4示出了根据本公开的一些实施例的数据恢复过程400的示例的泳道
图。过程400可以由如图1所示的客户端110和第一服务器130来实现。备选地,过程400也可以由除了客户端110和第一服务器130之外的其他主体实现。应当理解的是,过程400还可以包括未示出的附加步骤和/或可以省略所示出的步骤,本公开的范围在此方面不受限制。
38.客户端110(例如,客户端110-1)可以向第一服务器130发送410针对目标数据111的恢复请求。应理解,目标数据111仅是待恢复数据的示例,客户端110可以恢复已经备份的任何目标数据。第一服务器130在接收到该恢复请求之后,可以基于该恢复请求,确定415第一服务器130上存储的、对应于目标数据111的备份数据137。然后,第一服务器130可以确定备份数据137的哈希值,并且向客户端110发送420备份数据137的哈希值。
39.客户端110可以从第一服务器130接收备份数据137的哈希值,并且基于备份数据137的哈希值,从备份链117中选择425备份块(例如,备份块117-2),其中备份块117-2所包括的目标数据111的哈希值与备份数据137的哈希值匹配。
40.客户端110可以基于备份块117-2,从第一服务器130获取针对目标数据111的备份数据137。由此,客户端110可以基于备份数据137来恢复目标数据111。在某些实施例中,目标数据111可以包括要恢复的目标文件。在这种情况下,为了获取备份数据137,客户端110可以从备份块117-2中提取目标文件在客户端110上的存储路径,并且向第一服务器130发送430指示该存储路径的信息。
41.第一服务器130在接收到指示该存储路径的信息之后,可以基于该存储路径,确定435第一服务器130上存储的、对应于该存储路径的目标文件的备份文件。然后,第一服务器130可以确定备份文件的哈希值,并且向客户端110发送440备份文件的哈希值。
42.客户端110可以从第一服务器130接收备份文件的哈希值,并且确定445所接收的备份文件的哈希值与备份块117所包括的目标文件的哈希值是否匹配。如果所接收的备份文件的哈希值与备份块117所包括的目标文件的哈希值匹配,则客户端110可以向第一服务器130发送450文件恢复请求。
43.第一服务器130在接收到该文件恢复请求之后,可以基于该文件恢复请求,确定455备份文件要被恢复,并且向客户端110发送460该备份文件。客户端110在从第一服务器130接收到备份文件之后,可以利用该备份文件恢复465目标文件。
44.在某些实施例中,客户端110还可以对恢复的目标文件进行进一步验证。例如,客户端110可以生成恢复的目标文件的哈希值,并且确定恢复的目标文件的哈希值与备份块170所包括的目标文件的哈希值是否匹配。如果恢复的目标文件的哈希值与备份块117所包括的目标文件的哈希值匹配,则客户端110可以确定目标文件恢复成功。
45.以此方式,由于在数据恢复过程中,利用安全的备份块进行了验证,可以确保恢复后的数据并未被篡改,从而提高了存储安全性和可靠性。
46.图5示出了可以用来实施本公开内容的实施例的示例设备500的示意性框图。例如,如图1所示的客户端110、第一服务器130和第二服务器140可以由设备500来实施。如图所示,设备500包括中央处理单元(cpu)510,其可以根据存储在只读存储器(rom)520中的计算机程序指令或者从存储单元580加载到随机访问存储器(ram)530中的计算机程序指令,来执行各种适当的动作和处理。在ram 530中,还可存储设备500操作所需的各种程序和数据。cpu510、rom 520以及ram 530通过总线540彼此相连。输入/输出(i/o)接口550也连接至总线540。
47.设备500中的多个部件连接至i/o接口550,包括:输入单元560,例如键盘、鼠标等;输出单元570,例如各种类型的显示器、扬声器等;存储单元580,例如磁盘、光盘等;以及通信单元590,例如网卡、调制解调器、无线通信收发机等。通信单元590允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
48.上文所描述的各个过程和处理,例如过程200和400,可由处理单元510执行。例如,在一些实施例中,过程200和400可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元580。在一些实施例中,计算机程序的部分或者全部可以经由rom 520和/或通信单元590而被载入和/或安装到设备500上。当计算机程序被加载到ram 530并由cpu 510执行时,可以执行上文描述的过程200和400的一个或多个动作。
49.本公开可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。
50.计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
51.这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
52.用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如java、smalltalk、c++等,以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
53.这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
54.这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
55.也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
56.附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
57.以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1