用于数据传输的方法、电子设备和计算机程序产品与流程

文档序号:31868907发布日期:2022-10-21 17:53阅读:35来源:国知局
用于数据传输的方法、电子设备和计算机程序产品与流程

1.本公开的实施例涉及数据管理领域,并且更具体地,涉及用于数据传输的方法、电子设备和计算机程序产品。


背景技术:

2.随着计算机技术的发展,越来越多的计算机设备被使用。在计算机的使用过程中,会产生大量的数据。有时,计算机生成的数据对于用户非常重要,因此需要对这些数据进行传输和备份处理,以在设备故障或损坏时还能从备份的数据进行恢复操作。
3.现在的任务备份通常通过用于远距离数据传输的异步复制来实现。为了保证用户设置的恢复点目标(recovery point objective,rpo),通常会依据该rpo来对数据进行备份。然而,在这样的过程中还存在着许多需要解决的问题,例如往往无法在用户设置的时间内完成数据传输。


技术实现要素:

4.本公开的实施例提供了一种用于数据传输的方法、电子设备和计算机程序产品。
5.根据本公开的第一方面,提供了一种用于数据传输的方法。该方法包括:获取待处理的一组数据传输作业各自的数据传输特性,每个数据传输作业的数据传输特性指示数据传输作业的期望传输时间以及数据量中的至少一项;基于一组数据传输作业的数据传输特性,确定一组数据传输作业的相应权重;以及基于权重和用于一组数据传输的总传输速率,确定每个数据传输作业的传输速率。
6.根据本公开的第二方面,提供了一种电子设备。该电子设备包括至少一个处理器;以及存储器,耦合至至少一个处理器并且具有存储于其上的指令,指令在由至少一个处理器执行时使设备执行动作,该动作包括:获取待处理的一组数据传输作业各自的数据传输特性,每个数据传输作业的数据传输特性指示数据传输作业的期望传输时间以及数据量中的至少一项;基于一组数据传输作业的数据传输特性,确定一组数据传输作业的相应权重;以及基于权重和用于一组数据传输的总传输速率,确定每个数据传输作业的传输速率。
7.根据本公开的第三方面,提供了一种计算机程序产品,该计算机程序产品被有形地存储在非易失性计算机可读介质上并且包括机器可执行指令,该机器可执行指令在被执行时使机器执行本公开的第一方面中的方法的步骤。
附图说明
8.通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常代表相同部件。
9.图1示出了可以在其中实现本公开的某些实施例中的数据传输方法的数据传输环境100的示意图;
10.图2示出了根据本公开的实施例的数据传输方法200的流程图;
11.图3示出了根据本公开的实施例的确定所述传输速率300的流程图;
12.图4示出了根据本公开的另一实施例的确定所述传输速率400的流程图;以及
13.图5示出了可以用来实施本公开的实施例的示例设备500的示意性框图。
14.在各个附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
15.下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
16.在本公开的实施例的描述中,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
17.下面将参考附图中示出的若干示例实施例来描述本公开的原理。虽然附图中显示了本公开的优选实施例,但应当理解,描述这些实施例仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。
18.在传统的数据传输或备份中,如果存在多个数据传输作业,通常将系统的传输速率平均分分配给每个数据传输作业。然而由于不同的数据传输作业可能具有不同的期望传输时间(例如恢复点目标)。此外,每个数据传输作业的数据量也往往不同。对于不同数据传输作业简单地分配相同的传输速率有时无法在期望传输时间内完成数据传输。因此,传统的数据传输方法并不能带来良好的用户体验。
19.为了解决上述和其他潜在的问题,本公开提出了一种用于数据传输的方法。在该方法中,首先获取待处理的一组数据传输作业中的每个数据传输作业的数据传输特性,数据传输特性可以为数据传输作业的期望传输时间和数据量。然后根据上述数据传输特性,确定一组数据传输作业中的每个数据传输作业的权重。最后根据上述确定的权重和用于一组数据传输的总传输速率(例如系统的总传输速率),确定每个数据传输作业的传输速率。通过该方法,可以按照数据传输特性对不同数据传输作业分配不同的传输速率,使得在期望时间内完成对数据传输作业额传输,从而提高故障发生之前的恢复点目标(rpo)完成率。
20.图1示出了可以在其中实现本公开的某些实施例中的数据传输方法的数据传输环境100的示意图。数据传输环境100包括源存储设备110、数据传输作业120-1、120-2和120-3(下文可以被称为一组数据传输作业120)、存储管理器130、网络140以及目标存储设备150。需要指出的是,数据传输环境100仅仅是示例性而不是限制性的,并且其是可扩展的,其中可以包括更多的源存储设备和数据传输作业,甚至还可以包括更多的目标存储设备,从而使得可以满足更多用户同时进行数据传输的需求。
21.在数据传输环境100中,源存储设备110通过网络140与目标存储设备140进行交互。在一个示例中,源存储设备110可以通过网络140利用异步复制(例如基于unity快照的复制实现)执行数据传输作业,以将数据传输到目标存储设备140。
22.存储管理器130用于执行与数据传输相关联的各种操作。在一些实施例中,存储管理器130可以获取一组数据传输作业120的数据传输特性,并且根据数据传输特性来针对每个数据传输作业分配传输速率。该传输数据速率例如是文件系统的最大可用传输速率或者是用户预先设定的传输速率,本公开在此不做限制。在一些实施例中,存储管理器130可以在目标存储设备150中分配存储空间来存储所传输的数据。需要指出的是,存储管理器130虽然被示出为源存储设备110和目标存储设备150之外,但其也可以相对于源存储设备110和目标存储设备150在本地。
23.在一些实施例中,源存储设备110可以是指能够生成数据并接受数据传输或者备份服务的任何设备。在一些实施例中,这样的设备包括但不限于,个人计算机、平板计算机、膝上型计算机、笔记本计算机、上网本计算机、任何其他类型的计算机、蜂窝电话或智能电话、媒体播放器设备、电子书设备、移动wifi设备、可穿戴设备、无线设备、移动设备、用户设备、以及任何其他类型的电子设备。
24.在一些实施例中,存储管理器130可以包括任何能够实现计算功能和/或控制功能的设备,包括但不限于,专用计算机、通用计算机、通用处理器、微处理器、微控制器、或状态机。
25.在一些实施例中,网络140可以是能够实现源存储设备110与目标存储设备150之间的数据通信或控制信号通信的任何形式的连接或耦合,包括但不限于,同轴电缆、光纤电缆、双绞线、或无线技术(诸如红外、无线电和微波)。在一些实施例中,网络140还可以包括但不限于,网卡、集线器、调制解调器、中继器、网桥、交换机、路由器等用于网络连接的设备、以及各种网络连接线路、无线链路等。在一些实施例中,网络140可以包括各种类型的总线。在其他实施例中,网络140可以包括计算机网络、通信网络、或者其他有线或无线网络。
26.应当理解,图1仅示意性地示出了数据传输环境100中的与本公开的实施例相关的单元、模块或组件。在实践中,数据传输环境100还可以包括用于其他功能的其他单元、模块或组件。因此,本公开的实施例不限于图1所描绘的具体设备、单元、模块或组件,而是一般性地适用于任何可以执行数据传输的系统环境。
27.下面结合图2描述根据本公开的实施例的数据传输方法200,其中方法200可以在图1中的存储管理器130或任何其他适当设备处执行。
28.在图2的框210处,存储管理器130获取待处理的一组数据传输作业120各自的数据传输特性,每个数据传输作业的数据传输特性指示数据传输作业的期望传输时间以及数据量中的至少一项。例如,存储管理器130可以获取数据传输作业120-1、120-2和120-3的期望传输时间以及数据量。
29.在一些实施例中,期望传输时间可以为执行数据传输作业所允许的最长持续时间。例如,在数据备份领域,传输作业所允许的最长持续时间可以为恢复点目标rpo,其可以按照时间进行度量。例如恢复点目标rpo为一小时,其指示每一小时进行一次数据传输,则意味着系统允许丢失的数据量为一小时的数据量。可以理解的是,必须在rpo内完成数据传输,否则无法进行下一次的数据传输。
30.在一些实施例中,期望传输时间可以是预先设置的,例如由用户或者存储管理器130的管理人员。备选地,在一些实施例中,也可以由存储系统根据其自身的计算能力动态地调整期望传输时间,本公开在此不做限制。
31.在一些实施例中,可以对数据传输作业120-1、120-2和120-3中的全部内容进行数据传输。在一些实施例中,可以仅对数据传输作业120-1、120-2和120-3中的修改部分进行数据传输,执行增量数据传输。
32.请注意,虽然本公开仅以期望传输时间和数据量作为示例,但可以理解的是,还可以存在其他类型的数据传输特性,例如待处理的数据传输作业中的数据类型等。
33.在图2的框220处,存储管理器130基于一组数据传输作业的数据传输特性,确定一组数据传输作业的相应权重。例如,存储管理器130可以上述确定的期望传输时间和数据量,确定数据传输作业120-1、120-2和120-3中较为重要的数据传输作业,并且对其分配较高的权重。
34.在一些实施例中,存储管理器130首先基于每个数据传输作业的期望传输时间和数据量,确定数据传输作业的重要性水平。并且然后基于重要性水平,确定数据传输作业的权重。例如,存储肝理气可以根据如下等式(1)和等式(2)来确定数据传输作业的权重:
[0035][0036][0037]
其中di为一组数据传输作业中的每个数据传输作业中的待传输的数据量,ri为一组数据传输作业中的每个数据传输作业的期望传输时间(例如rpo),ei为用于在期望传输时间内完成相应数据量的传输,所期望的传输速率,wi为一组数据传输作业中的每个数据传输作业的权重。可以理解的是,待传输的数据量越高,所期望的传输速率(例如rpo)越低,则可以指示相应数据传输作业的重要性水平越高。通过在进行数据传输之前,根据数据传输特性确定数据的权重,可以为后续的传输速率的分配打下基础。从而在总传输速率被限制的情况下,为重要性水平高的数据分配更快的传输速率。
[0038]
请注意,上述等式(2)仅仅是示例性的,还可以根据需要设置不同的权重计算方法,例如为所期望的传输速率设置更高的优先级,即等式(2)的分母变为r
in
。本公开在此不做限制。
[0039]
在图2的框230处,存储管理器130基于权重和用于一组数据传输的总传输速率,确定每个数据传输作业的传输速率。下面将结合图3和图4详细描述确定传输速率的方法。
[0040]
图3示出了根据本公开的实施例的确定所述传输速率300的流程图。在图3的框310处,存储管理器130基于每个数据传输作业的期望传输时间和数据量,确定用于一组数据传输作业的预估传输速率。例如,存储管理器130可以获取每个数据传输作业120-1、120-2和120-3的各自的期望传输时间和数据量,然后根据上文中的等式(1)确定预估传输速率。为了清楚起见,将结合表1进行描述。请注意,下文中的物理量的单位仅仅是示例性的,其不旨在限制本公开的范围。
[0041]
表1
[0042][0043]
在图3的框320处,存储管理器130确定一组数据传输作业120的预估传输速率之和是否大于总传输速率。存储管理器130可以确定存储系统的总传输速率,该总传输速率可以是存储系统可用的最大传输速率或者预先分配给该一组数据传输作业120的传输速率。例如,存储管理器130确定该总传输速率为300,然后根据表1确定预估传输速率之和为305,则确定一组数据传输作业120的预估传输速率之和大于总传输速率。可以理解的是,在这种情况下,如果按照传统的数据传输方法进行传输,则会导致一组数据传输作业120中的一些或者全部数据传输作业无法在期望传输时间(rpo)内被完成,例如,按照传统方法,将出现表2中呈现的情况:
[0044]
表2
[0045][0046]
在图3的框330处,存储管理器130按照权重将总传输速率分配给一组数据传输作业。存储管理器130在确定一组数据传输作业120的预估传输速率之和大于总传输速率的情况下,存储管理器130可以根据上述等式(2)确定每个数据传输作业120-1、120-2和120-3的各自的权重w1=0.796;w2=0.199;w3=0.005。然后根据等式(3)确定其各自的传输速率。
[0047]
si=li*wiꢀꢀꢀ
等式(3)
[0048]
其中si为分配给相应的数据传输作业的传输速率,li为总传输速率。存储管理器130可以根据等式(3)确定表3:
[0049]
表3
[0050][0051][0052]
从表3中可以看到,为权重较高(重要性水平较高)的数据传输作业分配了较高的
传输速率。由此,可以在系统的总传输速率有限的情况下,提高rpo完成率。此外,由上述等式可见,实现该方法的复杂程度较低,所需计算能力较低,进一步节省了硬件成本。
[0053]
在一些实施例中,如果存储管理器130确定一组数据传输作业120中的一个数据传输作业120-1被完成,则确定一组数据传输作业120中的、除该数据传输作业120-1以外的剩余数据传输作业120-2和120-3的数据传输特性。存储管理器130然后基于剩余数据传输作业120-2和120-3的数据传输特性来更新权重。并且最后基于更新的权重来确定用于执行剩余数据传输作业120-2和120-3的传输速率。
[0054]
例如,继续以上述示例进行描述,数据传输作业120-1在4.188分钟内被完成。则存储管理器130可以根据剩余数据传输作业120-2和120-3的剩余数据量和剩余期望传输时间来更新权重w2′
=0.956;w3′
=0.044,接着按照更新的权重来分配传输速率,如表4所示:
[0055]
表4
[0056][0057]
按照重新分配的传输速率,数据传输作业120-2在2.615分钟内被完成,然后存储系统的总传输速率都被分配给数据传输作业120-3。一组数据传输作业120的完后情况如表5所示:
[0058]
表5
[0059][0060]
可以看出,与传统方法所得出的表2中所示的结果不同,一组数据传输作业120中的每个数据传输作业都在期望传输时间内被完成。由此,可以提高输出传输的rpo完成率,增强用户对存储系统的使用体验。
[0061]
上面的实施例描述了预估传输速率之和超过系统的总传输速率的情况,下面结合图4描述预估传输速率之和不超过系统的总传输速率的情况。
[0062]
图4示出了根据本公开的另一实施例的确定所述传输速率400的流程图。在图4的框410处,存储管理器130基于每个数据传输作业的期望传输时间和数据量,确定用于一组数据传输作业的预估传输速率。在图4的框420处,存储管理器130确定一组数据传输作业的预估传输速率之和小于总传输速率。步骤410和420与上述步骤310和320类似,在此将不再赘述。
[0063]
在图4的框430处,存储管理器130将预估传输速率分配给一组数据传输作业。例如,存储管理器130在确定一组数据传输作业的预估传输速率之和小于总传输速率的情况下,首先将各自的预估传输速率分配给相应的数据传输作业,以确保其可以至少在期望传输时间内被完成。
[0064]
在图4的框440处,存储管理器130按照权重,将总传输速率中的、除预估传输速率之和以外的剩余传输速率分配给一组数据传输作业。例如,存储管理器130可以将胜率的传输速率按照上述权重进行分配,参见以下等式(4):
[0065]
si=ei+(l
i-∑ei)*wiꢀꢀꢀ
等式(4)
[0066]
其中ei为用于在期望传输时间内完成相应数据量的传输,所期望的传输速率,wi为一组数据传输作业中的每个数据传输作业的权重,si为分配给相应的数据传输作业的传输速率,li为总传输速率。上述方法的优点在于,即使在总传输速率足以实现每个数据传输作业的期望传输时间的情况下,也可以按照权重优先执行重要性水平高的数据传输作业。
[0067]
根据本公开的实施例,可以提高数据传输(特别是异步复制)中的rpo实现率,且该方法复杂度低,所需硬件/软件成本低,不会对系统性能造成影响。由此,可以提高用户体验。
[0068]
请注意,上述权重确定的示例仅仅示意性的,还可以根据其他数据传输特性确定权重。例如,可以根据待处理的数据传输作业中的数据的类型确定数据传输的优先级,例如优先文本格式的数据传输等。可以根据不同的应用场景设置不同的权重和优先级,本公开在此不做限制。
[0069]
图5示出了可以用来实施本公开内容的实施例的示例设备500的示意性框图。例如,如图1所示的存储管理器130可以由设备500来实施。如图所示,设备500包括中央处理单元cpu 501,其可以根据存储在只读存储器rom 502中的计算机程序指令或者从存储单元508加载到随机访问存储器ram 503中的计算机程序指令,来执行各种适当的动作和处理。在ram 503中,还可存储设备500操作所需的各种程序和数据。cpu 501、rom 502以及ram 503通过总线504彼此相连。输入/输出i/o接口505也连接至总线504。
[0070]
设备500中的多个部件连接至i/o接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0071]
上文所描述的各个过程和处理,例如方法200、300和400可由处理单元501执行。例如,在一些实施例中,方法200、300和400可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由rom 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序被加载到ram 503并由cpu 501执行时,可以执行上文描述的方法200、300和400的一个或多个动作。
[0072]
本公开可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。
[0073]
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的
更具体的例子,非穷举的列表,包括:便携式计算机盘、硬盘、随机存取存储器ram、只读存储器rom、可擦式可编程只读存储器eprom或闪存、静态随机存取存储器sram、便携式压缩盘只读存储器cd-rom、数字多功能盘dvd、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波,例如,通过光纤电缆的光脉冲、或者通过电线传输的电信号。
[0074]
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
[0075]
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构isa指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如smalltalk、c++等,以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机,例如利用因特网服务提供商来通过因特网连接。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列fpga或可编程逻辑阵列pla,该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
[0076]
这里参照根据本公开实施例的方法、装置/系统和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
[0077]
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
[0078]
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
[0079]
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代
表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0080]
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1