用于云计算的数据存储的负载均衡方法及其系统与流程

文档序号：32350620发布日期：2022-11-26 12:54阅读：35来源：国知局

1.本技术涉及云计算存储的负载均衡的领域，且更为具体地，涉及一种用于云计算的数据存储的负载均衡方法及其系统。

背景技术：

2.云计算环境下，数据及其副本存储在各个节点上，随着数据不断地存储、更新及删除，势必造成各个节点数据存储的不均衡。即使在每个节点上存储的数据量是均衡的，也就是，存储数据平均分布在各个节点，这种均衡只能算是数据分布的均衡，实际情况应该考虑更多的因素，例如，各个节点的配置异构性，存储同样多的数据，异构的节点必然承担的负载不同；再如，很少被访问的文件相比于经常被访问的文件或者并发被多个用户访问的文件，显然前者对物理机产生的负载比后者小。
3.也就是，考虑到各个节点的硬件配置的差异性、数据访问频度的差异性、数据访问并发度的差异性、网络带宽的差异性等因素，这些节点的储存负载极有可能是不均衡的。数据存储负载的不均衡会影响用户的访问、甚至更严重地引起节点的宕机。因此，为了处理好各个节点的数据存储的负载均衡问题，期望一种用于云计算的数据存储的负载均衡方法。

技术实现要素：

4.为了解决上述技术问题，提出了本技术。本技术的实施例提供了一种用于云计算的数据存储的负载均衡方法及其系统，其通过基于上下文的编码器模型来对所述输入参数进行处理以获得全局性的参数关联信息，并利用卷积神经网络模型来从基于所述各节点之间的并发访问文件数目构造的邻接矩阵中提取出所述各节点之间的并发访问文件数目的高维关联特征，进一步使用图神经网络来生成包含特征信息与不规则的拓扑结构信息的表征矩阵，以在后续使用分类损失函数值和交叉熵值来训练分类器中提高分类的准确性。这样，可以对数据存储的负载是否均衡进行准确地判断，进而避免各个节点的数据存储的负载不均衡而导致的问题。
5.根据本技术的一个方面，提供了一种用于云计算的数据存储的负载均衡方法，其包括：训练阶段，包括：获取云计算系统中各个节点的多个负载数据，所述多个负载数据包括文件的访问次数、文件的并发访问数、文件的未访问时间、文件的大小、第i次访问文件的时间、网络带宽的大小、节点的可用存储空间的大小、节点的cpu能力和节点的内存值；将各个所述节点的各个负载数据转化为输入向量后通过基于上下文的编码器以获得各个所述节点的参数特征向量的序列；拼接所述参数特征向量的序列中的所有参数特征向量以获得各个所述节点的节点特征向量，并将各个所述节点的节点特征向量二维排列为节点特征矩阵；基于各个所述节点之间的并发访问文件数目构建用于表示访问邻接关系的邻接矩阵，其中，所述邻接矩阵中各个位置的特征值表示对应的两个节点之间的并发访问文件数目；将所述邻接矩阵通过作为特征提取器的卷积神经网络以获得邻接特征矩阵；将所述邻接特征矩阵和所述节点特征矩阵输入图神经网络以获得特征图表示矩阵，所述图神经网络用于
通过可学习的神经网络参数来生成包含特征信息与不规则的拓扑结构信息的表征矩阵；将各个所述节点的节点特征向量映射到所述特征图表示矩阵的特征空间中以获得各个所述节点的分类特征向量；将各个所述节点的分类特征向量通过分类器以获得分类损失函数值，其中，所述分类器包括用于对分类特征向量进行全连接编码的多个全连接层；基于所述分类损失函数值以及所述分类损失函数值和各个所述节点的每一个参数特征向量之间的交叉熵损失函数值对所述分类器进行基于对应于每项负载数据的块结构的训练；以及推断阶段，包括：获取云计算系统中各个节点的多个负载数据，所述多个负载数据包括文件的访问次数、文件的并发访问数、文件的未访问时间、文件的大小、第i次访问文件的时间、网络带宽的大小、节点的可用存储空间的大小、节点的cpu能力和节点的内存值；将各个所述节点的各个负载数据转化为输入向量后通过基于上下文的编码器以获得各个所述节点的参数特征向量的序列；拼接所述参数特征向量的序列中的所有参数特征向量以获得各个所述节点的节点特征向量，并将各个所述节点的节点特征向量二维排列为节点特征矩阵；基于各个所述节点之间的并发访问文件数目构建用于表示访问邻接关系的邻接矩阵，其中，所述邻接矩阵中各个位置的特征值表示对应的两个节点之间的并发访问文件数目；将所述邻接矩阵通过作为特征提取器的卷积神经网络以获得邻接特征矩阵；将所述邻接特征矩阵和所述节点特征矩阵输入图神经网络以获得特征图表示矩阵，所述图神经网络用于通过可学习的神经网络参数来生成包含特征信息与不规则的拓扑结构信息的表征矩阵；将各个所述节点的节点特征向量映射到所述特征图表示矩阵的特征空间中以获得各个所述节点的分类特征向量；以及将各个所述节点的分类特征向量通过经训练阶段训练完成的所述分类器以获得分类结果，所述分类结果用于表示节点的数据存储的负载是否均衡。
6.根据本技术提供的用于云计算的数据存储的负载均衡方法及其系统，其通过基于上下文的编码器模型来对所述输入参数进行处理以获得全局性的参数关联信息，并利用卷积神经网络模型来从基于所述各节点之间的并发访问文件数目构造的邻接矩阵中提取出所述各节点之间的并发访问文件数目的高维关联特征，进一步使用图神经网络来生成包含特征信息与不规则的拓扑结构信息的表征矩阵，以在后续使用分类损失函数值和交叉熵值来训练分类器中提高分类的准确性。这样，可以对数据存储的负载是否均衡进行准确地判断，进而避免各个节点的数据存储的负载不均衡而导致的问题。
附图说明
7.通过结合附图对本技术实施例进行更详细的描述，本技术的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本技术实施例的进一步理解，并且构成说明书的一部分，与本技术实施例一起用于解释本技术，并不构成对本技术的限制。在附图中，相同的参考标号通常代表相同部件或步骤。
8.图1为根据本技术实施例的用于云计算的数据存储的负载均衡方法中训练阶段的流程图。
9.图2为根据本技术实施例的用于云计算的数据存储的负载均衡方法中推断阶段的流程图。
10.图3为根据本技术实施例的用于云计算的数据存储的负载均衡方法中训练阶段的架构示意图。
11.图4为根据本技术实施例的用于云计算的数据存储的负载均衡方法中推断阶段的架构示意图。
12.图5为根据本技术实施例的用于云计算的数据存储的负载均衡系统的框图。
具体实施方式
13.下面，将参考附图详细地描述根据本技术的示例实施例。显然，所描述的实施例仅仅是本技术的一部分实施例，而不是本技术的全部实施例，应理解，本技术不受这里描述的示例实施例的限制。
14.场景概述
15.如前所述，云计算环境下，数据及其副本存储在各个节点上，随着数据不断地存储、更新及删除，势必造成各个节点数据存储的不均衡。即使在每个节点上存储的数据量是均衡的，也就是，存储数据平均分布在各个节点，这种均衡只能算是数据分布的均衡，实际情况应该考虑更多的因素，例如，各个节点的配置异构性，存储同样多的数据，异构的节点必然承担的负载不同；再如，很少被访问的文件相比于经常被访问的文件或者并发被多个用户访问的文件，显然前者对物理机产生的负载比后者小。
16.也就是，考虑到各个节点的硬件配置的差异性、数据访问频度的差异性、数据访问并发度的差异性、网络带宽的差异性等因素，这些节点的储存负载极有可能是不均衡的。数据存储负载的不均衡会影响用户的访问、甚至更严重地引起节点的宕机。因此，为了处理好各个节点的数据存储的负载均衡问题，期望一种用于云计算的数据存储的负载均衡方法。
17.各个参数对文件的负载的影响如下：
18.1.文件的访问次数：文件的负载值与被访问的次数成正比关系，被访问次数越多，负载值越大。
19.2.文件的并发访问数：并发访问次数多的文件的负载更大。
20.3.文件的未访问时间：随着文件不断访问时间的增加，它的负载值不断减小。
21.4.文件大小：文件的负载值与其文件大小成正比关系，文件越大，负载值越大。
22.5.第i次访问文件的时间：文件的负载值与文件的被访问的时间长短成正比关系，被访问的时间越长，负载值越大。
23.6.网络带宽大小：访问的数据量相同时，节点的负载值与网络带宽成反比关系，网络带宽越大，节点的负载值越小。
24.7.节点的可用存储空间大小：访问的数据量相同时，节点的负载值与节点的可用存储空间成反比关系，节点可用空间越大，其负载值越小。
25.8.节点的cpu能力、节点的内存大小：访问同等数据量时，节点的负载与节点的cpu能力及节点的内存成反比关系，节点性能越好，其负载值越小。
26.具体地，在本技术的技术方案中，将1-8项的输入参数每个转换为输入向量之后，输入基于上下文的编码器，以获得参数特征向量的序列，并通过拼接参数特征向量得到节点特征向量。
27.基于各节点之间的并发访问文件数目，获得用于表示访问邻接关系的邻接矩阵，即矩阵中的每个位置表示对应的两个节点之间的并发访问文件数目，并输入卷积神经网络以得到邻接特征矩阵。
28.然后，将邻接特征矩阵和各个节点的节点特征向量二维排列组成的节点特征矩阵输入图神经网络，生成特征图表征矩阵，该图神经网络通过可学习的神经网络参数来生成包含特征信息与不规则的拓扑结构信息的表征矩阵，用于表达出在不规则的非欧几里得空间内的图结构导致的数据样本之间的关联关系。
29.这样，当需要判定某个节点的文件存储情况时，将对应于该节点的节点特征向量映射到特征图表征矩阵的特征空间内，以得到分类特征向量。
30.进一步地，本技术的技术方案考虑到由于得到分类特征向量的节点特征向量是通过参数特征向量拼接得到的，因此在节点特征向量中存在拼接结构，这就使得在分类特征向量通过分类器进行回归时，分类器的由多个全连接层组成的神经网络也应该存在相对于每个参数特征向量的块结构。为了能够提高对于块结构的训练度，在每个迭代周期内，除使用基于分类特征向量的分类损失函数值进行参数更新之外，还计算每一个参数特征向量与分类损失函数值的交叉熵值，并以此作为损失函数来进行参数更新，从而基于分类器的各节点参数之间的超过阈值的预定相似表示形式来强化分类器的对应于每项参数的块结构的训练，以此提高分类器的回归准确性。此外，通过基于每一个参数特征向量与分类损失函数值的交叉熵值的训练，还可以挖掘出各个参数之间的隐含独立状态，比如某些参数与负载成正比，某些参数与负载成反比，而使得分类器的参数的更新更有针对性。
31.基于此，本技术提出了一种用于云计算的数据存储的负载均衡方法，其包括：训练阶段和推断阶段。其中，训练阶段包括步骤：获取云计算系统中各个节点的多个负载数据，所述多个负载数据包括文件的访问次数、文件的并发访问数、文件的未访问时间、文件的大小、第i次访问文件的时间、网络带宽的大小、节点的可用存储空间的大小、节点的cpu能力和节点的内存值；将各个所述节点的各个负载数据转化为输入向量后通过基于上下文的编码器以获得各个所述节点的参数特征向量的序列；拼接所述参数特征向量的序列中的所有参数特征向量以获得各个所述节点的节点特征向量，并将各个所述节点的节点特征向量二维排列为节点特征矩阵；基于各个所述节点之间的并发访问文件数目构建用于表示访问邻接关系的邻接矩阵，其中，所述邻接矩阵中各个位置的特征值表示对应的两个节点之间的并发访问文件数目；将所述邻接矩阵通过作为特征提取器的卷积神经网络以获得邻接特征矩阵；将所述邻接特征矩阵和所述节点特征矩阵输入图神经网络以获得特征图表示矩阵，所述图神经网络用于通过可学习的神经网络参数来生成包含特征信息与不规则的拓扑结构信息的表征矩阵；将各个所述节点的节点特征向量映射到所述特征图表示矩阵的特征空间中以获得各个所述节点的分类特征向量；将各个所述节点的分类特征向量通过分类器以获得分类损失函数值，其中，所述分类器包括用于对分类特征向量进行全连接编码的多个全连接层；以及，基于所述分类损失函数值以及所述分类损失函数值和各个所述节点的每一个参数特征向量之间的交叉熵损失函数值对所述分类器进行基于对应于每项负载数据的块结构的训练。其中，推断阶段包括步骤：获取云计算系统中各个节点的多个负载数据；将各个所述节点的各个负载数据转化为输入向量后通过基于上下文的编码器以获得各个所述节点的参数特征向量的序列；拼接所述参数特征向量的序列中的所有参数特征向量以获得各个所述节点的节点特征向量，并将各个所述节点的节点特征向量二维排列为节点特征矩阵；基于各个所述节点之间的并发访问文件数目构建用于表示访问邻接关系的邻接矩阵，其中，所述邻接矩阵中各个位置的特征值表示对应的两个节点之间的并发访问文件数
目；将所述邻接矩阵通过作为特征提取器的卷积神经网络以获得邻接特征矩阵；将所述邻接特征矩阵和所述节点特征矩阵输入图神经网络以获得特征图表示矩阵，所述图神经网络用于通过可学习的神经网络参数来生成包含特征信息与不规则的拓扑结构信息的表征矩阵；将各个所述节点的节点特征向量映射到所述特征图表示矩阵的特征空间中以获得各个所述节点的分类特征向量；以及，将各个所述节点的分类特征向量通过经训练阶段训练完成的所述分类器以获得分类结果，所述分类结果用于表示节点的数据存储的负载是否均衡。
32.在介绍了本技术的基本原理之后，下面将参考附图来具体介绍本技术的各种非限制性实施例。
33.示例性方法
34.图1图示了根据本技术实施例的用于云计算的数据存储的负载均衡方法中训练阶段的流程图。如图1所示，根据本技术实施例的用于云计算的数据存储的负载均衡方法，包括：训练阶段，包括步骤：s110，获取云计算系统中各个节点的多个负载数据，所述多个负载数据包括文件的访问次数、文件的并发访问数、文件的未访问时间、文件的大小、第i次访问文件的时间、网络带宽的大小、节点的可用存储空间的大小、节点的cpu能力和节点的内存值；s120，将各个所述节点的各个负载数据转化为输入向量后通过基于上下文的编码器以获得各个所述节点的参数特征向量的序列；s130，拼接所述参数特征向量的序列中的所有参数特征向量以获得各个所述节点的节点特征向量，并将各个所述节点的节点特征向量二维排列为节点特征矩阵；s140，基于各个所述节点之间的并发访问文件数目构建用于表示访问邻接关系的邻接矩阵，其中，所述邻接矩阵中各个位置的特征值表示对应的两个节点之间的并发访问文件数目；s150，将所述邻接矩阵通过作为特征提取器的卷积神经网络以获得邻接特征矩阵；s160，将所述邻接特征矩阵和所述节点特征矩阵输入图神经网络以获得特征图表示矩阵，所述图神经网络用于通过可学习的神经网络参数来生成包含特征信息与不规则的拓扑结构信息的表征矩阵；s170，将各个所述节点的节点特征向量映射到所述特征图表示矩阵的特征空间中以获得各个所述节点的分类特征向量；s180，将各个所述节点的分类特征向量通过分类器以获得分类损失函数值，其中，所述分类器包括用于对分类特征向量进行全连接编码的多个全连接层；以及，s190，基于所述分类损失函数值以及所述分类损失函数值和各个所述节点的每一个参数特征向量之间的交叉熵损失函数值对所述分类器进行基于对应于每项负载数据的块结构的训练。
35.图2图示了根据本技术实施例的用于云计算的数据存储的负载均衡方法中推断阶段的流程图。如图2所示，根据本技术实施例的用于云计算的数据存储的负载均衡方法，还包括：推断阶段，包括步骤：s210，获取云计算系统中各个节点的多个负载数据；s220，将各个所述节点的各个负载数据转化为输入向量后通过基于上下文的编码器以获得各个所述节点的参数特征向量的序列；s230，拼接所述参数特征向量的序列中的所有参数特征向量以获得各个所述节点的节点特征向量，并将各个所述节点的节点特征向量二维排列为节点特征矩阵；s240，基于各个所述节点之间的并发访问文件数目构建用于表示访问邻接关系的邻接矩阵，其中，所述邻接矩阵中各个位置的特征值表示对应的两个节点之间的并发访问文件数目；s250，将所述邻接矩阵通过作为特征提取器的卷积神经网络以获得邻接特征矩阵；s260，将所述邻接特征矩阵和所述节点特征矩阵输入图神经网络以获得特征图表示
矩阵，所述图神经网络用于通过可学习的神经网络参数来生成包含特征信息与不规则的拓扑结构信息的表征矩阵；s270，将各个所述节点的节点特征向量映射到所述特征图表示矩阵的特征空间中以获得各个所述节点的分类特征向量；以及，s280，将各个所述节点的分类特征向量通过经训练阶段训练完成的所述分类器以获得分类结果，所述分类结果用于表示节点的数据存储的负载是否均衡。
36.图3图示了根据本技术实施例的用于云计算的数据存储的负载均衡方法中训练阶段的架构示意图。如图3所示，在训练阶段中，在该网络架构中，首先，将获得的各个所述节点的各个负载数据(例如，如图3中所示意的p)转化为输入向量(例如，如图3中所示意的v1)后通过基于上下文的编码器(例如，如图3中所示意的e)以获得各个所述节点的参数特征向量的序列(例如，如图3中所示意的vf1)；接着，拼接所述参数特征向量的序列中的所有参数特征向量以获得各个所述节点的节点特征向量(例如，如图3中所示意的vf2)，并将各个所述节点的节点特征向量二维排列为节点特征矩阵(例如，如图3中所示意的mf1)；然后，基于各个所述节点之间的并发访问文件数目构建用于表示访问邻接关系的邻接矩阵(例如，如图3中所示意的m)；接着，将所述邻接矩阵通过作为特征提取器的卷积神经网络(例如，如图3中所示意的cnn)以获得邻接特征矩阵(例如，如图3中所示意的mf2)；然后，将所述邻接特征矩阵和所述节点特征矩阵输入图神经网络(例如，如图3中所示意的gnn)以获得特征图表示矩阵(例如，如图3中所示意的mf)；接着，将各个所述节点的节点特征向量映射到所述特征图表示矩阵的特征空间中以获得各个所述节点的分类特征向量(例如，如图3中所示意的vf)；然后，将各个所述节点的分类特征向量通过分类器(例如，如图3中所示意的圈s)以获得分类损失函数值(例如，如图3中所示意的clv)；以及，最后，基于所述分类损失函数值以及所述分类损失函数值和各个所述节点的每一个参数特征向量之间的交叉熵损失函数值(例如，如图3中所示意的lv)对所述分类器进行基于对应于每项负载数据的块结构的训练。
37.图4图示了根据本技术实施例的用于云计算的数据存储的负载均衡方法中推断阶段的架构示意图。如图4所示，在推断阶段中，在该网络结构中，首先，将获得的各个所述节点的各个负载数据(例如，如图4中所示意的q)转化为输入向量(例如，如图4中所示意的v1)后通过基于上下文的编码器(例如，如图4中所示意的e)以获得各个所述节点的参数特征向量的序列(例如，如图4中所示意的vf1)；接着，拼接所述参数特征向量的序列中的所有参数特征向量以获得各个所述节点的节点特征向量(例如，如图4中所示意的vf2)，并将各个所述节点的节点特征向量二维排列为节点特征矩阵(例如，如图4中所示意的mf1)；然后，基于各个所述节点之间的并发访问文件数目构建用于表示访问邻接关系的邻接矩阵(例如，如图4中所示意的m)；接着，将所述邻接矩阵通过作为特征提取器的卷积神经网络(例如，如图4中所示意的cnn)以获得邻接特征矩阵(例如，如图4中所示意的mf2)；然后，将所述邻接特征矩阵和所述节点特征矩阵输入图神经网络(例如，如图4中所示意的gnn)以获得特征图表示矩阵(例如，如图4中所示意的mf)；接着，将各个所述节点的节点特征向量映射到所述特征图表示矩阵的特征空间中以获得各个所述节点的分类特征向量(例如，如图4中所示意的vf)；以及，最后，将各个所述节点的分类特征向量通过经训练阶段训练完成的所述分类器(例如，如图4中所示意的圈s)以获得分类结果，所述分类结果用于表示节点的数据存储的负载是否均衡。
38.更具体地，在训练阶段中，在步骤s110和步骤s120中，获取云计算系统中各个节点
的多个负载数据，并将各个所述节点的各个负载数据转化为输入向量后通过基于上下文的编码器以获得各个所述节点的参数特征向量的序列。如前所述，考虑到各个节点的硬件配置的差异性、数据访问频度的差异性、数据访问并发度的差异性、网络带宽的差异性等因素，这些所述节点的储存负载极有可能是不均衡的。而数据存储负载的不均衡会影响用户的访问、甚至更严重地引起节点的宕机。因此，为了处理好各个节点的数据存储的负载均衡问题，在本技术的技术方案中，考虑通过文件的访问次数、文件的并发访问数、文件的未访问时间、文件的大小、第i次访问文件的时间、网络带宽的大小、节点的可用存储空间的大小、节点的cpu能力和节点的内存值这几个参数数据来对所述节点的数据存储的负载是否均衡进行判断。
39.也就是，具体地，首先，从云计算系统中获取各个节点的多个负载数据，这里，所述多个负载数据包括文件的访问次数、文件的并发访问数、文件的未访问时间、文件的大小、第i次访问文件的时间、网络带宽的大小、节点的可用存储空间的大小、节点的cpu能力和节点的内存值。然后，将各个所述节点的各个负载数据转化为输入向量后通过基于上下文的编码器，以获得各个所述节点的参数特征向量的序列。相应地，在一个具体示例中，首先，将各个所述节点的各项负载数据通过嵌入层以转化为所述输入向量；然后，将各个所述节点的多个输入向量输入作为所述编码器的转换器模型以获得各个所述节点的参数特征向量的序列。应可以理解，由于基于转换器的编码器模型可以基于上下文对所述输入向量进行编码，从而使得获得的各个所述节点的参数特征向量具有全局性的参数关联特征。
40.更具体地，在训练阶段中，在步骤s130中，拼接所述参数特征向量的序列中的所有参数特征向量以获得各个所述节点的节点特征向量，并将各个所述节点的节点特征向量二维排列为节点特征矩阵。也就是，在本技术的技术方案中，在得到各个所述节点的参数特征向量的序列后，进一步拼接所述参数特征向量的序列中的所有参数特征向量，以获得各个所述节点的节点特征向量；接着，再将各个所述节点的节点特征向量二维排列为节点特征矩阵，以便于后续对其进行处理。
41.更具体地，在训练阶段中，在步骤s140和步骤s150中，基于各个所述节点之间的并发访问文件数目构建用于表示访问邻接关系的邻接矩阵，其中，所述邻接矩阵中各个位置的特征值表示对应的两个节点之间的并发访问文件数目，并将所述邻接矩阵通过作为特征提取器的卷积神经网络以获得邻接特征矩阵。也就是，在本技术的技术方案中，接着，再基于各个所述节点之间的并发访问文件数目构建用于表示访问邻接关系的邻接矩阵，其中，所述邻接矩阵中各个位置的特征值表示对应的两个节点之间的并发访问文件数目。应可以理解，所述邻接矩阵是表示顶点之间相邻关系的矩阵，是n阶方阵，这里，利用所述邻接矩阵可以表示各个所述节点之间的并发访问文件数目之间的关联性信息。然后，再将所述邻接矩阵通过作为特征提取器的卷积神经网络中进行处理，以提取出各个所述节点之间的并发访问文件数目之间的高维隐含关联特征，从而获得邻接特征矩阵。值得一提的是，这里，所述卷积神经网络基于过滤器在各层的正向传递的过程中对所述输入数据进行沿通道维度的均值池化以获得所述邻接特征矩阵。
42.更具体地，在本技术实施例中，将所述邻接矩阵通过作为特征提取器的卷积神经网络以获得邻接特征矩阵的过程，包括：所述卷积神经网络中除最后一层以外的各层对输入数据进行卷积处理、池化处理和激活处理以获得邻接特征图；以及，所述卷积神经网络的
最后一层对所述邻接特征图进行沿通道维度的全局平均池化以获得所述邻接特征矩阵。应可以理解，通过对所述邻接特征图进行全局池化处理，可以减少参数的数量，以提高训练的速度，进而对整个网络在结构上做正规化防止过拟合。
43.更具体地，在训练阶段中，在步骤s160中，将所述邻接特征矩阵和所述节点特征矩阵输入图神经网络以获得特征图表示矩阵，所述图神经网络用于通过可学习的神经网络参数来生成包含特征信息与不规则的拓扑结构信息的表征矩阵。也就是，进一步将所述邻接特征矩阵和各个所述节点的节点特征向量二维排列组成的节点特征矩阵输入图神经网络，生成特征图表征矩阵。这里，该所述图神经网络通过可学习的神经网络参数来生成包含特征信息与不规则的拓扑结构信息的表征矩阵，用于表达出在不规则的非欧几里得空间内的图结构导致的数据样本之间的关联关系。
44.更具体地，在训练阶段中，在步骤s170中，将各个所述节点的节点特征向量映射到所述特征图表示矩阵的特征空间中以获得各个所述节点的分类特征向量。也就是，在得到各个所述节点的节点特征向量和所述特征图表示矩阵后，进一步地，在一个具体示例中，将各个所述节点的节点特征向量与所述特征图表示矩阵进行矩阵相乘，从而把各个所述节点的节点特征向量映射到所述特征图表示矩阵的特征空间中，以获得各个所述节点的分类特征向量。
45.更具体地，在训练阶段中，在步骤s180和步骤s190中，将各个所述节点的分类特征向量通过分类器以获得分类损失函数值，其中，所述分类器包括用于对分类特征向量进行全连接编码的多个全连接层，并基于所述分类损失函数值以及所述分类损失函数值和各个所述节点的每一个参数特征向量之间的交叉熵损失函数值对所述分类器进行基于对应于每项负载数据的块结构的训练。应可以理解，考虑到由于得到所述分类特征向量的节点特征向量是通过所述参数特征向量拼接得到的，因此在所述节点特征向量中存在拼接结构，这就使得在所述分类特征向量通过分类器进行回归时，分类器的由多个全连接层组成的神经网络也应该存在相对于所述每个参数特征向量的块结构。为了能够提高对于块结构的训练度，在每个迭代周期内，除使用基于所述分类特征向量的分类损失函数值进行参数更新之外，还计算所述每一个参数特征向量与所述分类损失函数值的交叉熵值，并以此作为损失函数来进行参数更新，从而基于分类器的各节点参数之间的超过阈值的预定相似表示形式来强化分类器的对应于每项参数的块结构的训练，以此提高分类器的回归准确性。此外，通过基于所述每一个参数特征向量与所述分类损失函数值的交叉熵值的训练，还可以挖掘出所述各个参数之间的隐含独立状态，比如某些参数与负载成正比，某些参数与负载成反比，而使得分类器的参数的更新更有针对性。
46.具体地，在本技术实施例中，各个所述节点的分类特征向量通过分类器以获得分类损失函数值的过程，包括：所述分类器以如下公式对所述分类特征向量进行处理以获得分类结果，其中，所述公式为：softmax{(wn，b1)：...：(w1，b1)|x}，其中，w1至wn为各层全连接层的权重矩阵，b1至bn表示各层全连接层的偏置矩阵；以及，计算所述分类结果与真实值之间的交叉熵值作为所述分类损失函数值。
47.具体地，在本技术实施例中，基于所述分类损失函数值以及所述分类损失函数值和各个所述节点的每一个参数特征向量之间的交叉熵损失函数值对所述分类器进行基于对应于每项负载数据的块结构的训练的过程，包括：在每一轮迭代周期中，计算所述分类损
失函数值与每一个所述参数特征向量之间的交叉熵值，以及，计算所述交叉熵值与所述分类损失函数值的加权和作为损失函数值来更新所述分类器的参数，通过这样的方式，基于分类器的各节点参数之间的超过阈值的预定相似表示形式来强化分类器的对应于每项负载数据的块结构的训练。
48.在训练完成后，进入推断阶段。具体地，在推断阶段中，同样地，首先，获取云计算系统中各个节点的多个负载数据。接着，将各个所述节点的各个负载数据转化为输入向量后通过基于上下文的编码器以获得各个所述节点的参数特征向量的序列。然后，拼接所述参数特征向量的序列中的所有参数特征向量以获得各个所述节点的节点特征向量，并将各个所述节点的节点特征向量二维排列为节点特征矩阵。接着，基于各个所述节点之间的并发访问文件数目构建用于表示访问邻接关系的邻接矩阵。然后，将所述邻接矩阵通过作为特征提取器的卷积神经网络以获得邻接特征矩阵。接着，将所述邻接特征矩阵和所述节点特征矩阵输入图神经网络以获得特征图表示矩阵。当需要判定某个节点的文件存储情况时，然后，将各个所述节点的节点特征向量映射到所述特征图表示矩阵的特征空间中以获得各个所述节点的分类特征向量。最后，将各个所述节点的分类特征向量通过经训练阶段训练完成的所述分类器以获得分类结果，所述分类结果用于表示节点的数据存储的负载是否均衡。
49.综上，基于本技术实施例的用于云计算的数据存储的负载均衡方法被阐明，其通过基于上下文的编码器模型来对所述输入参数进行处理以获得全局性的参数关联信息，并利用卷积神经网络模型来从基于所述各节点之间的并发访问文件数目构造的邻接矩阵中提取出所述各节点之间的并发访问文件数目的高维关联特征，进一步使用图神经网络来生成包含特征信息与不规则的拓扑结构信息的表征矩阵，以在后续使用分类损失函数值和交叉熵值来训练分类器中提高分类的准确性。这样，可以对数据存储的负载是否均衡进行准确地判断，进而避免各个节点的数据存储的负载不均衡而导致的问题。
50.示例性系统
51.图5图示了根据本技术实施例的用于云计算的数据存储的负载均衡系统的框图。如图5所示，根据本技术实施例的用于云计算的数据存储的负载均衡系统600，包括：训练模块610和推断模块620。
52.如图5所示，所述训练模块610，包括：负载数据获取单元6101，用于获取云计算系统中各个节点的多个负载数据，所述多个负载数据包括文件的访问次数、文件的并发访问数、文件的未访问时间、文件的大小、第i次访问文件的时间、网络带宽的大小、节点的可用存储空间的大小、节点的cpu能力和节点的内存值；编码单元6102，用于将各个所述负载数据获取单元6101获得的所述节点的各个负载数据转化为输入向量后通过基于上下文的编码器以获得各个所述节点的参数特征向量的序列；拼接单元6103，用于拼接所述编码单元6102获得的所述参数特征向量的序列中的所有参数特征向量以获得各个所述节点的节点特征向量，并将各个所述节点的节点特征向量二维排列为节点特征矩阵；邻接矩阵构造单元6104，用于基于各个所述负载数据获取单元6101获得的所述节点之间的并发访问文件数目构建用于表示访问邻接关系的邻接矩阵，其中，所述邻接矩阵中各个位置的特征值表示对应的两个节点之间的并发访问文件数目；特征提取单元6105，用于将所述邻接矩阵构造单元6104获得的所述邻接矩阵通过作为特征提取器的卷积神经网络以获得邻接特征矩阵；
图网络单元6106，用于将所述特征提取单元6105获得的所述邻接特征矩阵和所述拼接单元6103获得的所述节点特征矩阵输入图神经网络以获得特征图表示矩阵，所述图神经网络用于通过可学习的神经网络参数来生成包含特征信息与不规则的拓扑结构信息的表征矩阵；映射单元6107，用于将各个所述拼接单元6103获得的所述节点的节点特征向量映射到所述图网络单元6106获得的所述特征图表示矩阵的特征空间中以获得各个所述节点的分类特征向量；分类器处理单元6108，用于将各个所述映射单元6107获得的所述节点的分类特征向量通过分类器以获得分类损失函数值，其中，所述分类器包括用于对分类特征向量进行全连接编码的多个全连接层；以及，训练单元6109，用于基于所述分类器处理单元6108获得的所述分类损失函数值以及所述分类损失函数值和各个所述编码单元6102获得的所述节点的每一个参数特征向量之间的交叉熵损失函数值对所述分类器进行基于对应于每项负载数据的块结构的训练。
53.如图5所示，所述推断模块620，包括：数据获取单元621，用于获取云计算系统中各个节点的多个负载数据，所述多个负载数据包括文件的访问次数、文件的并发访问数、文件的未访问时间、文件的大小、第i次访问文件的时间、网络带宽的大小、节点的可用存储空间的大小、节点的cpu能力和节点的内存值；特征向量生成单元622，用于将各个所述数据获取单元621获得的所述节点的各个负载数据转化为输入向量后通过基于上下文的编码器以获得各个所述节点的参数特征向量的序列；特征矩阵拼接单元623，用于拼接所述特征向量生成单元622获得的所述参数特征向量的序列中的所有参数特征向量以获得各个所述节点的节点特征向量，并将各个所述节点的节点特征向量二维排列为节点特征矩阵；邻接矩阵生成单元624，用于基于各个所述数据获取单元621获得的所述节点之间的并发访问文件数目构建用于表示访问邻接关系的邻接矩阵，其中，所述邻接矩阵中各个位置的特征值表示对应的两个节点之间的并发访问文件数目；邻接特征矩阵生成单元625，用于将所述邻接矩阵生成单元624获得的所述邻接矩阵通过作为特征提取器的卷积神经网络以获得邻接特征矩阵；特征图表示矩阵生成单元626，用于将所述邻接特征矩阵生成单元625获得的所述邻接特征矩阵和所述特征矩阵拼接单元623获得的所述节点特征矩阵输入图神经网络以获得特征图表示矩阵；分类特征向量生成单元627，用于将各个所述特征矩阵拼接单元623获得的所述节点的节点特征向量映射到所述特征图表示矩阵生成单元626获得的所述特征图表示矩阵的特征空间中以获得各个所述节点的分类特征向量；以及，分类单元628，用于将各个所述分类特征向量生成单元627获得的所述节点的分类特征向量通过经训练阶段训练完成的所述分类器以获得分类结果，所述分类结果用于表示节点的数据存储的负载是否均衡。
54.这里，本领域技术人员可以理解，上述用于云计算的数据存储的负载均衡系统600中的各个单元和模块的具体功能和操作已经在上面参考图1到图4的用于云计算的数据存储的负载均衡方法的描述中得到了详细介绍，并因此，将省略其重复描述。
55.如上所述，根据本技术实施例的用于云计算的数据存储的负载均衡系统600可以实现在各种终端设备中，例如用于云计算的数据存储的负载均衡算法的服务器等。在一个示例中，根据本技术实施例的用于云计算的数据存储的负载均衡系统600可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如，该用于云计算的数据存储的负载均衡系统600可以是该终端设备的操作装置中的一个软件模块，或者可以是针对于该终端设备所开发的一个应用程序；当然，该用于云计算的数据存储的负载均衡系统600同样可以是该终
端设备的众多硬件模块之一。
56.替换地，在另一示例中，该用于云计算的数据存储的负载均衡系统600与该终端设备也可以是分立的设备，并且该用于云计算的数据存储的负载均衡系统600可以通过有线和/或无线网络连接到该终端设备，并且按照约定的数据格式来传输交互信息。
57.以上结合具体实施例描述了本技术的基本原理，但是，需要指出的是，在本技术中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本技术的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本技术为必须采用上述具体的细节来实现。
58.本技术中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。
59.还需要指出的是，在本技术的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本技术的等效方案。
60.提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本技术。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本技术的范围。因此，本技术不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。
61.为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本技术的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：茹康哲
技术所有人：杭州卓壹网络技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。