工作机的暂态学习性能提升的方法、装置、设备及介质与流程

文档序号:33631939发布日期:2023-03-28 23:16阅读:29来源:国知局
工作机的暂态学习性能提升的方法、装置、设备及介质与流程

1.本发明涉及机器学习领域,尤其涉及一种工作机的暂态学习性能提升的方法、装置、设备及介质。


背景技术:

2.物联网产生大量的分布数据,一种典型的训练方式是将这些数据存储在服务器上,通过服务器训练模型,然而,这种方式的通信效率以及计算效率的问题明显,比如,一辆汽车几个小时产生的数百gb的数据在传输和计算过程中,都是极大的负担。分布式机器学习对于计算量太大、训练数据太多以及模型规模太大的情况可以有效的解决,在实际应用中,一般分布式机器学习采用深度神经网络作为机器学习模型,这种机器学习模型在许多应用中都取得了空前的成功,比如模型分类与模式识别,但是主要局限在离线学习。在实际应用中工作机会获得数据流,因此在线学习是解决这一问题的有效方式。
3.现有技术中,在工作机完成局部预测和服务器完成全局预测之后,直接对融合后的预测误差与局部预测误差进行对比,这在理论上不容易进行证明。此外,现有技术中采用均方误差的概念,也没有太好的结果出现,尤其在工作机的暂态响应方面,得不到较好的学习性能提升结果。


技术实现要素:

4.有鉴于此,本发明提出了一种工作机的暂态学习性能提升的方法、装置、设备及介质,其中,本发明提出的一种工作机的暂态学习性能提升的方法采用高斯过程回归(gaussian process regression,gpr),高斯过程回归可以处理流数据,实现对测试输出进行预测,并将局部预测的期望和方差发送至服务器。通过服务器对接收的所有工作机的期望和方差进行聚合,得到全局预测期望和方差,将全局预测的期望和方差发送回各个工作机。通过比较局部预测的方差和全局预测的方差构建工作机的最优预测模型,如果全局预测的方差不大于局部预测的方差,那么局部预测的方差利用全局预测的方差替换;如果全局预测的方差大于局部预测的方差,那么局部预测的方差保持不变。同时,可以采用间接的方法进行验证,融合后的预测误差的上界要比原始局部预测误差的上界小,即也就是融合后的预测值有更小的置信区间。
5.基于以上目的,本发明的实施例的一个方面提供了工作机的暂态学习性能提升的方法,所述方法包括以下步骤:构建每个工作机用于局部预测的训练集,将所述每个工作机在所述训练集上进行训练,得到所述每个工作机对测试数据的局部预测的方差;通过服务器对所述局部预测的方差进行聚合,得到对测试数据的全局预测的方差;根据所述全局预测的方差和所述局部预测的方差对所述每个工作机设置融合算法,得到所述每个工作机的最优预测模型。
6.在一些实施例中,所述构建每个工作机用于局部预测的训练集,将所述每个工作机在所述训练集上进行训练,得到所述每个工作机对测试数据的局部预测的方差包括:构
建目标函数并基于所述目标函数构建训练集,计算测试数据到所述训练集中的投影,得到所述测试数据对应的投影数据;根据所述测试数据对应的投影数据构建新的训练集,在所述新的训练集上计算高斯后验概率分布,得到所述每个工作机对测试数据的局部预测的方差。
7.在一些实施例中,所述通过服务器对所述局部预测的方差进行聚合,得到对测试数据的全局预测的方差包括:将所述每个工作机对测试数据的局部预测的方差发送给服务器,在所述服务器上通过聚合算法对所述局部预测的方差进行聚合,得到对测试数据的全局预测的方差。
8.在一些实施例中,所述根据所述全局预测的方差和所述局部预测的方差对所述每个工作机设置融合算法,得到所述每个工作机的最优预测模型包括:
9.将所述全局预测的方差发送给所述每个工作机并构建不确定性的测试数据集合,在所述不确定性的测试数据集合上根据所述全局预测的方差和所述每个工作机的局部预测的方差设置融合算法,得到所述每个工作机的最优预测模型。
10.在一些实施例中,所述将所述全局预测的方差发送给所述每个工作机并构建一个不确定性的测试数据集合,在所述不确定性的测试数据集合上根据所述全局预测的方差和所述每个工作机的局部预测的方差设置融合算法,得到所述每个工作机的最优预测模型包括:在所述不确定性的测试数据的集合上比较所述全局预测的方差和所述每个工作机的局部预测的方差的大小;响应于所述全局预测的方差不大于所述每个工作机的局部预测的方差,通过所述全局预测设置所述每个工作机的最优预测模型。
11.在一些实施例中,所述将所述全局预测的方差发送给所述每个工作机并构建一个不确定性的测试数据集合,在所述不确定性的测试数据集合上根据所述全局预测的方差和所述每个工作机的局部预测的方差设置融合算法,得到所述每个工作机的最优预测模型还包括:响应于所述全局预测的方差大于所述每个工作机的局部预测的方差,通过所述每个工作机的局部预测设置所述每个工作机的最优预测模型。
12.在一些实施例中,所述方法还包括:根据所述局部预测的误差与所述全局预测的误差的大小验证所述最优预测模型的预测性能是否为最优预测性能。
13.本发明实施例的另一个方面,还提供了一种工作机的暂态学习性能提升的装置,所述装置包括:第一模块,配置用于构建每个工作机用于局部预测的训练集,将所述每个工作机在所述训练集上进行训练,得到所述每个工作机对测试数据的局部预测的方差;第二模块,配置用于通过服务器对所述局部预测的方差进行聚合,得到对测试数据的全局预测的期望方差;以及第三模块,配置用于根据所述全局预测的方差和所述局部预测的方差对所述每个工作机设置融合算法,得到所述每个工作机的最优预测模型。
14.在一些实施例中,所述第一模块进一步配置用于:构建目标函数并基于所述目标函数构建训练集,计算测试数据到所述训练集中的投影,得到所述测试数据对应的投影数据;根据所述测试数据对应的投影数据构建新的训练集,在所述新的训练集上计算高斯后验概率分布,得到所述每个工作机对测试数据的局部预测的方差。
15.在一些实施例中,所述第二模块进一步配置用于:将所述每个工作机对测试数据的局部预测的方差发送给服务器,在所述服务器上通过聚合算法对所述局部预测的方差进行聚合,得到对测试数据的全局预测的方差。
16.在一些实施例中,所述第三模块进一步配置用于:将所述全局预测的方差发送给所述每个工作机并构建不确定性的测试数据集合,在所述不确定性的测试数据集合上根据所述全局预测的方差和所述每个工作机的局部预测的方差设置融合算法,得到所述每个工作机的最优预测模型。
17.在一些实施例中,所述第三模块进一步配置用于:在所述不确定性的测试数据的集合上比较所述全局预测的方差和所述每个工作机的局部预测的方差的大小;响应于所述全局预测的方差不大于所述每个工作机的局部预测的方差,通过所述全局预测设置所述每个工作机的最优预测模型。
18.在一些实施例中,所述第三模块进一步配置用于:响应于所述全局预测的方差大于所述每个工作机的局部预测的方差,通过所述每个工作机的局部预测设置所述每个工作机的最优预测模型。
19.本发明实施例的另一方面,还提供一种计算机设备,包括至少一个处理器;以及存储器,存储器存储有可在处理器上运行的计算机指令,指令由处理器执行时实现上述任一方法的步骤。
20.本发明实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有被处理器执行时实现如上任一方法步骤的计算机程序。
21.本发明至少具有以下有益效果:本发明提出一种工作机的暂态学习性能提升的方法、装置、设备及介质,其中,本发明提出的一种工作机的暂态学习性能提升的方法理论上可以保证每一个工作机在利用局部预测和全局预测进行融合后的暂态性能提升;同时,本发明的方法还进行了预测结果的验证,论证了得到的最优预测模型的有效性,使得理论与实际验证结果相一致。
附图说明
22.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的实施例。
23.图1为本发明提供的一种工作机的暂态学习性能提升的方法的实施例的示意图;
24.图2为本发明提供的工作机的局部预测性能的实施例的示意图;
25.图3为本发明提供的最优预测模型的预测性能的实施例的示意图;
26.图4为本发明提供的一种工作机的暂态学习性能提升的装置的实施例的示意图;
27.图5为本发明提供的一种计算机设备的实施例的示意图;
28.图6为本发明提供的一种计算机可读存储介质的实施例的示意图。
具体实施方式
29.以下描述了本发明的实施例。然而,应该理解,所公开的实施例仅仅是示例,并且其它实施例可以采取各种替代形式。
30.此外,需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方
便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。术语“包括”、“包含”或其任何其它变形旨在涵盖非排他性的包括,以使包含一系列要素的过程、方法、物品或装置不仅包括那些要素,也可以包括未明确列出的或这些过程、方法、物品或装置所固有的要素。
31.下面将结合附图说明本技术的一个或多个实施例。
32.基于以上目的,本发明实施例的第一个方面,提出了一种工作机的暂态学习性能提升的方法的实施例。图1示出的是本发明提供的一种工作机的暂态学习性能提升的方法的实施例的示意图。如图1所示,本发明实施例的一种工作机的暂态学习性能提升的方法包括以下步骤:
33.s1、构建每个工作机用于局部预测的训练集,将所述每个工作机在所述训练集上进行训练,得到所述每个工作机对测试数据的局部预测的方差;
34.s2、通过服务器对所述局部预测的方差进行聚合,得到对测试数据的全局预测的方差;
35.s3、根据所述全局预测的方差和所述局部预测的方差对所述每个工作机设置融合算法,得到所述每个工作机的最优预测模型。
36.根据本发明的若干实施例,构建每个工作机用于局部预测的训练集,将每个工作机在训练集上进行训练,得到每个工作机对测试数据的局部预测的方差包括:构建目标函数并基于目标函数构建训练集,计算测试数据到训练集中的投影,得到测试数据对应的投影数据;根据测试数据对应的投影数据构建新的训练集,在新的训练集上计算高斯后验概率分布,得到每个工作机对测试数据的局部预测的方差。
37.根据本发明的若干实施例,通过服务器对局部预测的方差进行聚合,得到对测试数据的全局预测的方差包括:将每个工作机对测试数据的局部预测的方差发送给服务器,在服务器上通过聚合算法对局部预测的方差进行聚合,得到对测试数据的全局预测的方差。
38.根据本发明的若干实施例,根据全局预测的方差和局部预测的方差对每个工作机设置融合算法,得到每个工作机的最优预测模型包括:将全局预测的方差发送给每个工作机并构建不确定性的测试数据集合,在不确定性的测试数据集合上根据全局预测的方差和每个工作机的局部预测的方差设置融合算法,得到每个工作机的最优预测模型。
39.根据本发明的若干实施例,将全局预测的方差发送给每个工作机并构建一个不确定性的测试数据集合,在不确定性的测试数据集合上根据全局预测的方差和每个工作机的局部预测的方差设置融合算法,得到每个工作机的最优预测模型包括:在不确定性的测试数据的集合上比较全局预测的方差和每个工作机的局部预测的方差的大小;响应于全局预测的方差不大于每个工作机的局部预测的方差,通过全局预测设置每个工作机的最优预测模型。
40.根据本发明的若干实施例,将全局预测的方差发送给每个工作机并构建一个不确定性的测试数据集合,在不确定性的测试数据集合上根据全局预测的方差和每个工作机的局部预测的方差设置融合算法,得到每个工作机的最优预测模型还包括:响应于全局预测的方差大于每个工作机的局部预测的方差,通过每个工作机的局部预测设置每个工作机的最优预测模型。
41.根据本发明的若干实施例,本发明的方法还可以包括:根据局部预测的误差与全局预测的误差的大小验证最优预测模型的预测性能是否为最优预测性能。
42.以下给出了基于本发明的工作机的暂态学习性能提升的方法的另一实施例的具体步骤。
43.定义目标函数为其中是n
x
维输入空间。不失一般性,我们假设输出为一维,即在时刻t,给定相应的输出是
44.y=f(x)+ε
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
45.ε是服从均值为0,方差为的高斯概率分布的高斯噪声,即定义如下形式的训练集其中是输入数据集合,y=[y(1),y(2),...,y(ns)]
τ
是聚合了输出的列向量。高斯过程回归目标是利用训练集在测试数据集合上逼近函数f。
[0046]
定义对称正半定的核函数即∫k(x,x')f(x)f(x')dν(x)dν(x')≥0,其中ν是测度。让返回一个列向量,使得它的第i个元素等于f(x(i))。假设函数f是来自高斯过程先验概率分布的一个采样,这个先验分布的均值函数为μ,核函数是k。那么训练输出和测试输出服从联合概率分布
[0047][0048]
其中和返回由μ(x(i))和μ(x
*
(i))组成的向量,返回一个矩阵使得第i行第j列的元素是k(x(i),x
*
(j))。
[0049]
利用高斯过程的性质,高斯过程回归利用训练集预测测试数据集的输出。这个输出服从正态分布,即这里
[0050][0051]
在分布式机器学习中,考虑一个网络中有n个工作机。定义这个集合为在每一个时刻t,每一个工作机利用局部的训练数据来预测函数对于测试输入的输出。yi(t)=[yi(1),...,yi(t)]每一个工作机训练的局部预测值为
[0052][0053]
如果在联邦学习框架下,每一个工作机都会将训练好的局部预测covi(f
*
)发送给服务器。
[0054]
以下为分布式训练和融合的具体步骤。
[0055]
(1)基于对训练集投影构造训练子集,定义两个训练数据点x和x'的距离为d(x,x')=||x-x'||,数据点x到集合的距离为定义数据点x到集合的投影集合为
[0056]
考虑每一个工作机及其局部训练数据集针对一个测试数据x
*
,计算测试数据x
*
到训练集的投影:
[0057][0058]
在每一个时刻t,这个局部投影集合包含有个投影数据,即
[0059]
对每一个工作机及其投影集合取出每一个投影点,标注为这里下标j表示第j个投影点。然后针对每一个投影点找出它的一个邻域使得并且针对并且针对这里需要注意,邻域的个数是可调的,可以实现选取固定。
[0060]
对每一个工作机构造新的训练集合
[0061]
(2)选择核函数,在实际应用中,一般选择核函数:
[0062][0063]
(3)针对每一个工作机在新的训练集上计算高斯后验概率分布,即:
[0064][0065]
在训练子集利用公式(7)得到局部预测和covi(f
*
),然后将此局部预测发送给服务器,里可以证明,局部预测误差小于一个上界,我们定义为gi(covi(f
*
)),即针对测试输入,有如下不等式成立
[0066][0067]
(4)服务器利用如下的聚合算法对局部预测值进行聚合,给出全局预测期望和方差:
[0068][0069]
之后,服务器将全局预测的期望和方差cov
global
(f
*
)发送回各个工作机,可以验证得到,全局预测的误差小于一个上界值,这个上界依赖于cov
global
(f
*
)。我们将预测误差不等式表示为:
[0070][0071]
(5)根据全局预测方差cov
rbcm
(f
*
)和局部预测方差covi(f
*
),对每一个工作机设计融合算法,使得融合后的预测期望更加逼近目标函数f的真实值。构造一个具有小不确定性的测试数据x
*
的集合如下:
[0072][0073]
如果这个集合不是空集,来自服务器的全局预测将被使用;如果这个集合为空集,来自工作机的局部预测将会被使用。
[0074]
由于无法严格证明出融合后的预测误差小于局部预测误差,即但是采用间接的方法可以得到理论结果。如果融合后的预测误差上界g(cov
global
(f
*
))小于每一个工作机的局部预测误差上界gi(covi(f
*
)),则表明融合后得到的最优预测模型的预测有更窄的置信区间。通过这样的间接方法说明融合后得到的最优预测模型提升了每一个工作机的预测结果的准确度。其次,所讨论的是每一个预测输入点,在时刻t的预测值,即讨论的是工作机预测的暂态性能,当cov
global
(f
*
)《covi(f
*
),那么g(cov
global
(f
*
))《gi(covi(f
*
))。
[0075]
(6)利用构造的数据集,验证融合后得到的最优预测模型预测的有效性。对于公式(1),建立如下的目标函数:
[0076]
f(x)=5x2sin(12x)+(x
3-0.5)sin(3x-0.5)+4cos(2x)
ꢀꢀꢀꢀ
(12)
[0077]
和高斯噪声在[0,1]区间产生104的训练数据,并且随机选择120个测试点。设置网络中一共有40个工作机,然后我们将训练数据平均分为40等份,使得每一个工作机拥有250个训练数据。如图2和图3所示,为工作机的局部预测性能和利用融合后得到的最优预测模型的预测性能的示意图,其中图2和图3中的连续曲线为真实的测量输出,而间断虚线为基于局部数据的预测值。由图2可知,预测值围绕真实量测值进行跳变,有剧烈地震荡特性,而且置信区间有毛刺边缘,增加了预测的不确定性。由图3可知,曲线和间断虚线的重合度很高,并且其置信区间更窄,即利用融合后得到的最优预测模型的预测的准确度达到了预期水平。因此,我们看到每一个工作机的暂态性能提升较为明显。
[0078]
本发明的实施例的第二个方面,提出了一种工作机的暂态学习性能提升的装置。图4示出的是本发明提供的一种工作机的暂态学习性能提升的装置的实施例的示意图。如
图4所示,本发明提供的一种工作机的暂态学习性能提升的装置包括:第一模块,配置用于构建每个工作机用于局部预测的训练集,将所述每个工作机在所述训练集上进行训练,得到所述每个工作机对测试数据的局部预测的期望和方差;第二模块,配置用于通过服务器对所述局部预测的期望和方差进行聚合,得到对测试数据的全局预测的期望和方差;以及第三模块,配置用于根据所述全局预测的方差和所述局部预测的方差对所述每个工作机设置融合算法,得到所述每个工作机的最优预测模型,并根据所述全局预测的期望和所述局部预测的期望对所述每个工作机的最优预测模型进行验证。
[0079]
基于以上目的,本发明实施例的第三个方面,提出了一种计算机设备,图5示出的是本发明提供的一种计算机设备的实施例的示意图。如图5所示,本发明提供的一种计算机设备的实施例,包括以下模块:至少一个处理器021;以及存储器022,存储器022存储有可在处理器021上运行的计算机指令023,该计算机指令023由处理器021执行时实现如上所述的方法的步骤。
[0080]
本发明还提供了一种计算机可读存储介质。图6示出的是本发明提供的一种计算机可读存储介质的实施例的示意图。如图6所示,计算机可读存储介质031存储有被处理器执行时执行如上方法的计算机程序032。
[0081]
最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,设置系统参数的方法的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,程序的存储介质可为磁碟、光盘、只读存储记忆体(rom)或随机存储记忆体(ram)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
[0082]
此外,根据本发明实施例公开的方法还可以被实现为由处理器执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被处理器执行时,执行本发明实施例公开的方法中限定的上述功能。
[0083]
此外,上述方法步骤以及系统单元也可以利用控制器以及用于存储使得控制器实现上述步骤或单元功能的计算机程序的计算机可读存储介质实现。
[0084]
本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
[0085]
在一个或多个示例性设计中,功能可以在硬件、软件、固件或其任意组合中实现。如果在软件中实现,则可以将功能作为一个或多个指令或代码存储在计算机可读介质上或通过计算机可读介质来传送。计算机可读介质包括计算机存储介质和通信介质,该通信介质包括有助于将计算机程序从一个位置传送到另一个位置的任何介质。存储介质可以是能够被通用或专用计算机访问的任何可用介质。作为例子而非限制性的,该计算机可读介质可以包括ram、rom、eeprom、cd-rom或其它光盘存储设备、磁盘存储设备或其它磁性存储设备,或者是可以用于携带或存储形式为指令或数据结构的所需程序代码并且能够被通用或
专用计算机或者通用或专用处理器访问的任何其它介质。此外,任何连接都可以适当地称为计算机可读介质。例如,如果使用同轴线缆、光纤线缆、双绞线、数字用户线路(dsl)或诸如红外线、无线电和微波的无线技术来从网站、服务器或其它远程源发送软件,则上述同轴线缆、光纤线缆、双绞线、d0l或诸如红外线、无线电和微波的无线技术均包括在介质的定义。如这里所使用的,磁盘和光盘包括压缩盘(cd)、激光盘、光盘、数字多功能盘(dvd)、软盘、蓝光盘,其中磁盘通常磁性地再现数据,而光盘利用激光光学地再现数据。上述内容的组合也应当包括在计算机可读介质的范围内。
[0086]
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
[0087]
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
[0088]
上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
[0089]
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0090]
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1