联邦学习建模优化方法、设备、介质及产品与流程

文档序号:26504374发布日期:2021-09-04 07:23阅读:99来源:国知局
联邦学习建模优化方法、设备、介质及产品与流程

1.本申请涉及金融科技(fintech)的人工智能技术领域,尤其涉及一种联邦学习建模优化方法、设备、介质及产品。


背景技术:

2.随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术(如分布式、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要求,如对金融业对应待办事项的分发也有更高的要求。
3.随着计算机技术的不断发展,联邦学习的应用也越来越广泛,目前,在联邦学习过程中,通常采用同态加密或者多方安全计算的方式保护数据隐私,但是,多方安全计算涉及到复杂的密码学操作,因此通信和计算开销都较大,使得联邦学习时的计算效率较低。而同态加密后的密文数据的数据复杂度和数据量远远大于明文数据,所以同态加密的计算开销极大,使得联邦学习时的计算效率较低,且同态加密的方式在联邦学习过程中需要执行大量的加解密过程,将进一步降低联邦学习时的计算效率。


技术实现要素:

4.本申请的主要目的在于提供一种联邦学习建模优化方法、设备、介质及产品,旨在解决现有技术中联邦学习时计算效率低的技术问题。
5.为实现上述目的,本申请提供一种联邦学习建模优化方法,所述联邦学习建模优化方法应用于第一方,所述联邦学习建模优化方法包括:
6.获取待训练第一方底端特征提取模型和待训练顶端预测模型,并提取第一方待训练样本和所述第一方训练样本对应的预设真实标签;
7.基于所述待训练第一方底端特征提取模型,将所述第一方训练样本和预设第一方底端护照数据共同转换为具有护照嵌入的第一方训练中间输出;
8.基于所述第一方训练中间输出、所述预设真实标签、预设第一方顶端护照数据以及所述待训练顶端预测模型,通过与各第二方进行联邦交互,联合各所述第二方生成的具有护照嵌入的第二方训练中间输出,计算所述待训练顶端预测模型对应的模型总损失,其中,所述第二方训练中间输出由所述第二方获取的待训练第二方底端特征提取模型,对预设第二方底端护照数据和所述第一方训练样本对应的第二方训练样本进行转换得到;
9.基于所述模型总损失,优化所述待训练第一方底端特征提取模型和所述待训练顶端预测模型,获得第一方底端特征提取模型和顶端预测模型。
10.为实现上述目的,本申请提供一种联邦学习建模优化方法,所述联邦学习建模优化方法应用于第二方,所述联邦学习建模优化方法包括:
11.获取待训练第二方底端特征提取模型,并提取第二方训练样本;
12.基于所述待训练第二方底端特征提取模型,将所述第二方训练样本与预设第二方底端护照数据转换为第二方训练中间输出;
13.将所述第二方训练中间输出发送至第一方,以供所述第一方聚合各所述第二方发送的第二方训练中间输出,以及基于第一方训练样本与预设第一方底端护照数据转换得到的第一方训练中间输出,获得聚合训练中间输出,并基于所述聚合训练中间输出和预设第一方顶端护照数据转换得到的输出预测标签,以及所述第一方训练样本对应的预设真实标签,计算模型总损失;
14.接收所述第一方发送的模型总损失相对于所述第二方训练中间输出的第二方梯度,并基于所述第二方梯度,优化所述待训练第二方底端特征提取模型,获得第二方底端特征提取模型。
15.本申请提供一种联邦预测优化方法,所述联邦预测优化方法应用于第一方,所述联邦预测优化方法包括:
16.获取第一方待预测样本、预设第一方底端护照数据和预设第一方顶端护照数据;
17.基于所述预设第一方底端护照数据进行联邦学习构建的第一方底端特征提取模型,将所述第一方待预测样本和所述预设第一方底端护照数据共同转换为具有护照嵌入的第一方中间输出;
18.接收各第二方发送的具有护照嵌入的第二方中间输出,其中,所述第二方中间输出由所述第二方基于预设第二方底端护照数据进行联邦学习构建的第二方底端特征提取模型,对所述预设第二方底端护照数据和所述第一方待预测样本对应的第二方待预测样本进行转换得到;
19.对所述第一方护照嵌入中间输出和各所述第二方护照嵌入中间输出进行聚合,获得聚合护照嵌入中间输出;
20.基于所述预设第一方顶端护照数据进行联邦学习构建的顶端预测模型,将所述聚合护照嵌入中间输出和所述预设第一方顶端护照数据转换为目标预测结果。
21.本申请提供一种联邦预测优化方法,所述联邦预测优化方法应用于第二方,所述联邦预测优化方法包括:
22.获取第二方待预测样本和预设第二方底端护照数据;
23.基于所述预设第二方底端护照数据进行联邦学习构建的第二方底端特征提取模型,将所述第二方待预测样本和所述预设第二方底端护照数据共同转换为具有护照嵌入的第二方中间输出;
24.将所述第二方中间输出发送至第一方,以供所述第一方基于各所述第二方发送的第二方中间输出、所述第二方待预测样本对应的第一方待预测样本、预设第一方底端护照数据和预设第一方顶端护照数据,通过基于所述预设第一方底端护照数据进行联邦学习构建的第一方底端特征提取模型以及基于所述预设第一方顶端护照数据进行联邦学习构建的顶端预测模型,生成目标预测结果。
25.本申请还提供一种联邦学习建模优化装置,所述联邦学习建模优化装置为虚拟装置,且所述联邦学习建模优化装置应用于第一方,所述联邦学习建模优化装置包括:
26.提取模块,用于获取待训练第一方底端特征提取模型和待训练顶端预测模型,并提取第一方待训练样本和所述第一方训练样本对应的预设真实标签;
27.转换模块,用于基于所述待训练第一方底端特征提取模型,将所述第一方训练样本和预设第一方底端护照数据共同转换为具有护照嵌入的第一方训练中间输出;
28.计算模块,用于基于所述第一方训练中间输出、所述预设真实标签、预设第一方顶端护照数据以及所述待训练顶端预测模型,通过与各第二方进行联邦交互,联合各所述第二方生成的具有护照嵌入的第二方训练中间输出,计算所述待训练顶端预测模型对应的模型总损失,其中,所述第二方训练中间输出由所述第二方获取的待训练第二方底端特征提取模型,对预设第二方底端护照数据和所述第一方训练样本对应的第二方训练样本进行转换得到;
29.优化模块,用于基于所述模型总损失,优化所述待训练第一方底端特征提取模型和所述待训练顶端预测模型,获得第一方底端特征提取模型和顶端预测模型。
30.本申请还提供一种联邦学习建模优化装置,所述联邦学习建模优化装置为虚拟装置,且所述联邦学习建模优化装置应用于第二方,所述联邦学习建模优化装置包括:
31.提取模块,用于获取待训练第二方底端特征提取模型,并提取第二方训练样本;
32.转换模块,用于基于所述待训练第二方底端特征提取模型,将所述第二方训练样本与预设第二方底端护照数据转换为第二方训练中间输出;
33.计算模块,用于将所述第二方训练中间输出发送至第一方,以供所述第一方聚合各所述第二方发送的第二方训练中间输出,以及基于第一方训练样本与预设第一方底端护照数据转换得到的第一方训练中间输出,获得聚合训练中间输出,并基于所述聚合训练中间输出和预设第一方顶端护照数据转换得到的输出预测标签,以及所述第一方训练样本对应的预设真实标签,计算模型总损失;
34.优化模块,用于接收所述第一方发送的模型总损失相对于所述第二方训练中间输出的第二方梯度,并基于所述第二方梯度,优化所述待训练第二方底端特征提取模型,获得第二方底端特征提取模型。
35.本申请还提供一种联邦预测优化装置,所述联邦预测优化装置为虚拟装置,且所述联邦预测优化装置应用于第一方,所述联邦预测优化装置包括:
36.获取模块,用于获取第一方待预测样本、预设第一方底端护照数据和预设第一方顶端护照数据;
37.第一转换模块,用于基于所述预设第一方底端护照数据进行联邦学习构建的第一方底端特征提取模型,将所述第一方待预测样本和所述预设第一方底端护照数据共同转换为具有护照嵌入的第一方中间输出;
38.接收模块,用于接收各第二方发送的具有护照嵌入的第二方中间输出,其中,所述第二方中间输出由所述第二方基于预设第二方底端护照数据进行联邦学习构建的第二方底端特征提取模型,对所述预设第二方底端护照数据和所述第一方待预测样本对应的第二方待预测样本进行转换得到;
39.聚合模块,用于对所述第一方护照嵌入中间输出和各所述第二方护照嵌入中间输出进行聚合,获得聚合护照嵌入中间输出;
40.第二转换模块,用于基于所述预设第一方顶端护照数据进行联邦学习构建的顶端预测模型,将所述聚合护照嵌入中间输出和所述预设第一方顶端护照数据转换为目标预测结果。
41.本申请还提供一种联邦预测优化装置,所述联邦预测优化装置为虚拟装置,且所述联邦预测优化装置应用于第二方,所述联邦预测优化装置包括:
42.获取模块,用于获取第二方待预测样本和预设第二方底端护照数据;
43.转换模块,用于基于所述预设第二方底端护照数据进行联邦学习构建的第二方底端特征提取模型,将所述第二方待预测样本和所述预设第二方底端护照数据共同转换为具有护照嵌入的第二方中间输出;
44.发送模块,用于将所述第二方中间输出发送至第一方,以供所述第一方基于各所述第二方发送的第二方中间输出、所述第二方待预测样本对应的第一方待预测样本、预设第一方底端护照数据和预设第一方顶端护照数据,通过基于所述预设第一方底端护照数据进行联邦学习构建的第一方底端特征提取模型以及基于所述预设第一方顶端护照数据进行联邦学习构建的顶端预测模型,生成目标预测结果。
45.本申请还提供一种联邦学习建模优化设备,所述联邦学习建模优化设备为实体设备,所述联邦学习建模优化设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述联邦学习建模优化方法的程序,所述联邦学习建模优化方法的程序被处理器执行时可实现如上述的联邦学习建模优化方法的步骤。
46.本申请还提供一种联邦预测优化设备,所述联邦预测优化设备为实体设备,所述联邦预测优化设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述联邦预测优化方法的程序,所述联邦预测优化方法的程序被处理器执行时可实现如上述的联邦预测优化方法的步骤。
47.本申请还提供一种介质,所述介质为可读存储介质,所述可读存储介质上存储有实现联邦学习建模优化方法的程序,所述联邦学习建模优化方法的程序被处理器执行时实现如上述的联邦学习建模优化方法的步骤。
48.本申请还提供一种介质,所述介质为可读存储介质,所述可读存储介质上存储有实现联邦预测优化方法的程序,所述联邦预测优化方法的程序被处理器执行时实现如上述的联邦预测优化方法的步骤。
49.本申请还提供一种产品,所述产品为计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的联邦学习建模优化方法的步骤。
50.本申请还提供一种产品,所述产品为计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的联邦预测优化方法的步骤。
51.本申请提供了一种联邦学习建模优化方法,相比于现有技术采用的在联邦学习过程中,通过同态加密或者多方安全计算的方式保护数据隐私的技术手段,本申请首先获取待训练第一方底端特征提取模型和待训练顶端预测模型,并提取第一方待训练样本和所述第一方训练样本对应的预设真实标签,进而基于所述待训练第一方底端特征提取模型,将所述第一方训练样本和预设第一方底端护照数据共同转换为具有护照嵌入的第一方训练中间输出,进而基于所述第一方训练中间输出、所述预设真实标签、预设第一方顶端护照数据以及所述待训练顶端预测模型,通过与各第二方进行联邦交互,联合各所述第二方生成的具有护照嵌入的第二方训练中间输出,计算所述待训练顶端预测模型对应的模型总损失,其中,所述第二方训练中间输出由所述第二方获取的待训练第二方底端特征提取模型,对预设第二方底端护照数据和所述第一方训练样本对应的第二方训练样本进行转换得到,其中,需要说明的是,所述具有护照嵌入的第二方训练中间输出仍然为明文数据,其数据复杂度和数据量远远小于同态加密的数据,且由于在所述第二方训练中间输出中嵌入了预设
第二方底端护照数据中的护照,而第一方未持有预设第二方底端护照数据,第一方即使接收属于明文数据的第二方训练中间输出,也无法反推出属于第二方的隐私数据,进而基于所述模型总损失,优化所述待训练第一方底端特征提取模型和所述待训练顶端预测模型,获得第一方底端特征提取模型和顶端预测模型,进而实现了基于护照嵌入构建联邦模型的目的,保护了联邦学习过程中的数据隐私,且无需通过同态加密或者多方安全计算的方式保护数据隐私,达到了在明文状态下执行联邦学习中的数据安全计算的目的,减少了联邦学习过程中的数据计算复杂度以及避免了联邦学习过程中大量的数据加解密过程,所以,克服了现有技术中由于多方安全计算涉及到复杂的密码学操作,因此通信和计算开销都较大,使得联邦学习时的计算效率较低,而同态加密后的密文数据的数据复杂度和数据量远远大于明文数据,所以同态加密的计算开销极大,使得联邦学习时的计算效率较低,且同态加密的方式在联邦学习过程中需要执行大量的加解密过程,将进一步降低联邦学习时的计算效率的技术缺陷,所以,提升了联邦学习时的计算效率。
附图说明
52.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
53.为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
54.图1为本申请联邦学习建模优化方法第一实施例的流程示意图;
55.图2为本申请联邦学习建模优化方法中待训练顶端护照嵌入模块的示意图;
56.图3为本申请联邦学习建模优化方法中待训练顶端护照嵌入层的结构示意图;
57.图4为本申请联邦学习建模优化方法中基于护照嵌入的纵向联邦学习的流程示意图;
58.图5为本申请联邦学习建模优化方法第二实施例的流程示意图;
59.图6为本申请联邦学习建模优化方法第三实施例的流程示意图;
60.图7为本申请联邦学习建模优化方法第四实施例的流程示意图;
61.图8为本申请实施例中联邦学习建模优化方法涉及的硬件运行环境的设备结构示意图;
62.图9为本申请实施例中联邦预测优化方法涉及的硬件运行环境的设备结构示意图;
63.图10为本申请实施例方案涉及的联邦学习的硬件架构示意图。
64.本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
65.应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
66.本申请实施例提供一种联邦学习建模优化方法,在本申请联邦学习建模优化方法的第一实施例中,参照图1,所述联邦学习建模优化方法应用于第一方,所述联邦学习建模优化方法包括:
67.步骤s10,获取待训练第一方底端特征提取模型和待训练顶端预测模型,并提取第一方待训练样本和所述第一方训练样本对应的预设真实标签;
68.在本实施例中,需要说明的是,所述联邦学习建模优化方法应用于纵向联邦学习场景,第一方和第二方均为纵向联邦学习的参与方,所述第一方的数量可以为一个或者多个,其中,所述第一方中设置有待训练第一方底端特征提取模型、待训练顶端预测模型以及具备预设真实标签的训练样本,所述第二方中设置有待训练第二方底端特征提取模型以及无样本标签的训练样本,其中,所述待训练第一方底端特征提取模型为第一方中未训练好的神经网络模型,用于将第一方中的训练样本转换为具有护照嵌入的中间输出,所述待训练第二方底端特征提取模型为第二方中未训练好的神经网络模型,用于将第二方中的训练样本转换为具有护照嵌入的中间输出,所述待训练顶端预测模型为第一方中未训练好的神经网络模型,用于将待训练第一底端特征提取模型的输出与各待训练第二底端特征提取模型的输出的聚合结果转换为输出预测标签,所述预设真实标签为所述第一方待训练样本的标识,用于标识第一方待训练样本的类别或者属性等信息。
69.步骤s20,基于所述待训练第一方底端特征提取模型,将所述第一方训练样本和预设第一方底端护照数据共同转换为具有护照嵌入的第一方训练中间输出;
70.在本实施例中,需要说明的是,所述预设第一方底端护照数据至少包括一第一方待嵌入护照样本,其中,所述第一方待嵌入护照样本为预先设置好的用于在所述待训练第一方底端特征提取模型中进行护照嵌入的样本,其中,所述第一方待嵌入护照样本可以为图片、文字或者特定的编码矩阵等,所述待训练第一方底端特征提取模型中至少包括一待训练第一方护照嵌入模块,用于将所述第一方待嵌入护照样本嵌入所述第一方训练样本在所述待训练第一方底端特征提取模型中的模型中间输出,并与所述第一方训练样本共同转换为模型最终输出,其中,所述模型中间输出为模型的中间网络层的输出,所述模型最终输出为模型的输出层产生的输出,例如,假设神经网络模型a包括一输入层、10层隐藏层和一输出层,则输入层的输出与10个隐藏层的输出均为所述模型中间输出。
71.具体地,将所述第一方训练样本和所述预设第一方底端护照数据输入待训练第一方底端特征提取模型后,通过所述待训练第一方底端特征提取模型中各待训练第一方护照嵌入模块,分别将各所述待训练第一方护照嵌入模块对应的第一方待嵌入护照样本嵌入所述第一方训练样本对应的模型中间输出,并在模型预测执行完毕后,由所述待训练第一方底端特征提取模型的输出层输出具有护照嵌入的第一方训练中间输出,例如,假设所述待训练第一方底端特征提取模型包括2个待训练第一方护照嵌入模块a和b,其中,待训练第一方护照嵌入模块a设置于待训练第一方底端特征提取模型的第3层隐藏层与第4层隐藏层之间,则通过待训练第一方护照嵌入模块a,在第3层隐藏层的3层输出中嵌入a对应的第一方待嵌入护照样本,并将嵌入a对应的第一方待嵌入护照样本后的3层输出作为第4层隐藏层的输入,而待训练第一方护照嵌入模块b设置于待训练第一方底端特征提取模型的第40层隐藏层与第41层隐藏层之间,则通过待训练第一方护照嵌入模块b,在第40层隐藏层的40层输出中嵌入b对应的第一方待嵌入护照样本,并将嵌入b对应的第一方待嵌入护照样本后的40层输出作为第41层隐藏层的输入,最后由所述待训练第一方底端特征提取模型的输出层输出第一方训练中间输出。
72.其中,所述待训练第一方底端特征提取模型包括待训练第一方底端神经网络,所
述待训练第一方底端神经网络至少包括一待训练第一方护照嵌入模块,所述预设第一方底端护照数据至少包括一所述待训练第一方护照嵌入模块对应的第一方待嵌入护照样本,
73.所述基于所述待训练第一方底端特征提取模型,将所述第一方训练样本和预设第一方底端护照数据共同转换为具有护照嵌入的第一方训练中间输出的步骤包括:
74.步骤s21,基于所述待训练第一方底端神经网络中处于所述待训练第一方护照嵌入模块之前的第一部分待训练第一方底端神经网络,将所述第一方训练样本转换为待训练第一方底端网络中间输出;
75.在本实施例中,需要说明的是,所述第一部分待训练第一方底端神经网络为所述待训练第一方底端神经网络中产生作为所述待训练第一方护照嵌入模块的输入的模型中间输出所对应的部分神经网络,可用于将第一方训练样本转换为所述待训练第一方护照嵌入模块的部分输入。
76.具体地,在将所述第一方训练样本输入所述待训练第一方底端神经网络之后,通过所述待训练第一方底端神经网络中处于所述待训练第一方护照嵌入模块之前的第一部分待训练第一方底端神经网络,将所述第一方训练样本映射为待训练第一方底端网络中间输出。
77.步骤s22,基于所述待训练第一方护照嵌入模块,将所述待训练第一方底端网络中间输出和所述第一方待嵌入护照样本共同转换为待训练第一方底端护照嵌入模块输出;
78.在本实施例中,具体地,基于所述待训练第一方护照嵌入模块,通过将所述第一方待嵌入护照样本嵌入所述待训练第一方护照嵌入模块针对于所述待训练第一方底端网络中间输出生成的嵌入模块输出,获得待训练第一方底端护照嵌入模块输出。
79.进一步地,所述待训练第一方护照嵌入模块包括待训练第一方护照嵌入层和待训练第一方模块神经网络层,步骤s22还包括:
80.基于所述待训练第一方模块神经网络层,将所述待训练第一方底端网络中间输出映射为第一方待嵌入输出,并将所述第一方待嵌入护照样本映射为第一方待嵌入护照,进而基于所述待训练第一方护照嵌入层中的护照嵌入函数,将所述待嵌入护照转换为第一方护照嵌入参数,进而基于所述第一方护照嵌入参数,对所述待嵌入输出进行护照嵌入,获得所述待训练第一方底端护照嵌入模块输出,其中,所述基于所述第一方护照嵌入参数,对所述待嵌入输出进行护照嵌入,获得所述待训练第一方底端护照嵌入模块输出的过程具体如下:
81.x=γ*x
t

82.其中,x为所述待训练第一方底端护照嵌入模块输出,x
t
为所述待嵌入输出,γ和β为所述第一方护照嵌入参数。
83.步骤s23,基于所述待训练第一方底端神经网络中处于所述待训练第一方护照嵌入模块之后的第二部分待训练第一方底端神经网络,将所述待训练第一方底端护照嵌入模块输出转换为所述第一方训练中间输出。
84.在本实施例中,需要说明的是,所述第二部分待训练第一方底端神经网络为所述待训练第一方底端神经网络中将所述待训练第一方护照嵌入模块的输出作为输入的部分神经网络,可用于将所述待训练第一方护照嵌入模块的输出转换为所述第一方训练中间输出。
85.具体地,通过所述待训练第一方底端神经网络中处于所述待训练第一方护照嵌入模块之后的第二部分待训练第一方底端神经网络,将所述待训练第一方底端护照嵌入模块输出映射为所述第一方训练中间输出。
86.步骤s30,基于所述第一方训练中间输出、所述预设真实标签、预设第一方顶端护照数据以及所述待训练顶端预测模型,通过与各第二方进行联邦交互,联合各所述第二方生成的具有护照嵌入的第二方训练中间输出,计算所述待训练顶端预测模型对应的模型总损失,其中,所述第二方训练中间输出由所述第二方获取的待训练第二方底端特征提取模型,对预设第二方底端护照数据和所述第一方训练样本对应的第二方训练样本进行转换得到;
87.在本实施例中,需要说明的是,各所述第二方中均设置有待训练第二方底端特征提取模型,且所述第二方将基于所述待训练第二方底端特征提取模型,将第一方训练样本对应的第二方训练样本以及预设第二方底端护照数据转换为第二方训练中间输出,其中,所述第二方训练样本与所述第一方训练样本对应同一公共样本i d,所述公共样本i d由第一方与各第二方进行样本对齐时确定,所述第二方生成第二方训练中间输出的具体过程可参数步骤s20及其细化步骤中的内容,在此不再赘述。
88.具体地,接收各所述第二方发送的第二方训练中间输出,并基于预设聚合方式,对所述第一方训练中间输出和各所述第二方训练中间输出进行聚合,生成聚合训练中间输出,并基于所述待训练顶端预测模型,将所述聚合训练中间输出和预设第一方顶端护照数据共同转换为输出预测标签,进而基于所述输出预测标签和所述预设真实标签,计算模型总损失,其中,所述预设聚合方式包括加权平均以及求和等。
89.其中,所述基于所述第一方训练中间输出、所述预设真实标签、预设第一方顶端护照数据以及所述待训练顶端预测模型,通过与各第二方进行联邦交互,联合各所述第二方生成的具有护照嵌入的第二方训练中间输出,计算所述待训练顶端预测模型对应的模型总损失的步骤包括:
90.步骤s31,接收各所述第二方发送的具有护照嵌入的第二方训练中间输出;
91.在本实施例中,需要说明的是,所述第二方将所述第二方训练样本和所述预设第二方底端护照数据输入待训练第二方底端特征提取模型后,通过所述待训练第二方底端特征提取模型中各待训练第二方护照嵌入模块,分别将所述预设第二方底端护照数据中各待训练第二方护照嵌入模块对应的待嵌入护照样本嵌入所述第二方训练样本对应的模型中间输出,并在模型预测执行完毕后,由所述待训练第二方底端特征提取模型的输出层输出具有护照嵌入的第二方训练中间输出,其中,由于第二方在生成第二方训练中间输出时,嵌入了预设第二方底端护照数据,进而第一方在接收第二方训练中间输出后,由于第一方未持有所述预设第二方底端护照数据,无法通过第二方训练中间输出,反推出第一方的隐私数据,例如模型参数与样本等,实现了保护数据隐私的目的。
92.步骤s32,对所述第一方训练中间输出和各所述第二方训练中间输出进行聚合,获得聚合训练中间输出;
93.在本实施例中,具体地,基于预设聚合方式,将所述第一方训练中间输出和各所述第二方训练中间输出聚合为聚合训练中间输出,其中,所述预设聚合方式包括加权平均以及求和等。
94.步骤s33,通过所述待训练顶端预测模型,将所述聚合训练中间输出和所述预设第一方顶端护照数据共同转换为输出预测标签;
95.在本实施例中,具体地,将所述聚合训练中间输出和所述预设第一方顶端护照数据输入待训练顶端预测模型后,通过所述待训练顶端预测模型中各待训练顶端护照嵌入模块,分别将所述预设第一方顶端护照数据中将各待训练顶端护照嵌入模块对应的顶端护照嵌入样本嵌入所述聚合训练中间输出对应的模型中间输出,并在模型预测执行完毕后,由所述待训练顶端预测模型的输出层输出所述输出预测标签。
96.其中,所述待训练顶端预测模型包括待训练顶端神经网络,所述待训练顶端神经网络至少包括一待训练顶端护照嵌入模块,所述预设第一方顶端护照数据至少包括一所述待训练顶端护照嵌入模块对应的顶端护照嵌入样本,
97.所述通过所述待训练顶端预测模型,将所述聚合训练中间输出和所述预设第一方顶端护照数据共同转换为输出预测标签的步骤包括:
98.步骤s331,基于所述待训练顶端神经网络中处于所述待训练顶端护照嵌入模块之前的第一部分待训练顶端神经网络,将所述聚合训练中间输出转换为待训练顶端网络中间输出;
99.在本实施例中,需要说明的是,所述第一部分待训练顶端神经网络为所述待训练顶端神经网络中作为所述待训练顶端护照嵌入模块的输入的模型中间输出所对应的部分神经网络,用于将聚合训练中间输出转换为所述待训练顶端护照嵌入模块的部分输入。
100.具体地,在将所述聚合训练中间输出输入所述待训练顶端神经网络之后,通过所述待训练顶端神经网络中处于所述待训练顶端护照嵌入模块之前的第一部分待训练顶端神经网络,将所述聚合训练中间输出映射为待训练顶端网络中间输出。
101.步骤s332,基于所述待训练顶端护照嵌入模块,将所述待训练顶端网络中间输出和所述顶端护照嵌入样本共同转换为待训练顶端护照嵌入模块输出;
102.在本实施例中,具体地,基于所述待训练顶端护照嵌入模块,通过将所述顶端护照嵌入样本嵌入所述待训练顶端护照嵌入模块针对于所述待训练顶端网络中间输出生成的嵌入模块输出,获得待训练顶端护照嵌入模块输出。
103.其中,所述待训练顶端护照嵌入模块包括待训练顶端护照嵌入层和待训练顶端模块神经网络层,
104.所述基于所述待训练顶端护照嵌入模块,将所述待训练顶端网络中间输出和所述顶端护照嵌入样本共同转换为待训练顶端护照嵌入模块输出的步骤包括:
105.步骤a10,基于所述待训练顶端模块神经网络层,将所述待训练网络中间输出线性变换为待嵌入训练网络层输出,以及将所述顶端护照嵌入样本线性变换为顶端待嵌入护照;
106.在本实施例中,具体地,基于所述待训练顶端模块神经网络层,对所述待训练网络中间输出和所述顶端护照嵌入样本进行线性变换,获得所述待训练网络中间输出对应的待嵌入训练网络层输出,以及所述顶端护照嵌入样本对应的顶端待嵌入护照。
107.步骤a20,基于所述第一方护照嵌入层中的护照函数,将所述顶端待嵌入护照转换为护照嵌入参数;
108.在本实施例中,需要说明的是,所述护照函数为预先设置好的用于基于顶端待嵌
入护照生成护照嵌入参数的函数。
109.具体地,将所述顶端待嵌入护照输入所述护照嵌入层中的护照函数,输出所述顶端待嵌入护照对应的护照嵌入参数。
110.步骤a30,基于所述待嵌入训练网络层输出和所述护照嵌入参数,生成所述待训练顶端护照嵌入模块输出。
111.在本实施例中,需要说明的是,所述护照嵌入参数包括第一护照嵌入参数和第二护照嵌入参数。
112.具体地,通过计算所述待嵌入训练网络层输出与第一护照嵌入参数之间的目标乘积,以及所述目标乘积与所述第二护照嵌入参数之间的和,对所述待嵌入训练网络层输出进行护照嵌入,生成所述待训练顶端护照嵌入模块输出,如图2所示为所述待训练顶端护照嵌入模块的示意图,其中,护照嵌入层为所述待训练顶端护照嵌入层,神经网络层为所述待训练顶端模块神经网络层,x为所述待训练网络中间输出,p为所述顶端护照嵌入样本,x

为所述待嵌入训练网络层输出,p

为所述顶端待嵌入护照,x~为所述待训练顶端护照嵌入模块输出。
113.步骤s333,基于所述待训练顶端神经网络中处于所述待训练顶端护照嵌入模块之后的第二部分待训练顶端神经网络,将所述待训练顶端护照嵌入模块输出转换为所述输出预测标签。
114.在本实施例中,需要说明的是,所述第二部分待训练顶端神经网络为所述待训练顶端神经网络中将所述待训练顶端护照嵌入模块的输出作为输入的部分神经网络,用于所述待训练顶端护照嵌入模块的输出转换为所述输出预测标签。
115.进一步地,在一种可实施方式中,如图3所示为待训练顶端护照嵌入层的结构示意图,其中,x

为所述待嵌入训练网络层输出,p

为所述顶端待嵌入护照,γ和β为所述护照嵌入参数,数据变换层用于对待嵌入训练网络层输出进行数据变换,生成x
t
,x~为所述待训练顶端护照嵌入模块输出,在另一种可实施方式中,可将图3中的护照嵌入层中的数据变换层去除,并以x

代替x
t
参与计算。
116.步骤s34,基于所述输出预测标签和所述预设真实标签,计算所述模型总损失。
117.在本实施例中,基于所述输出预测标签和所述预设真实标签,计算所述模型总损失,具体地,将所述输出预测标签和所述预设真实标签之间的差值作为模型总损失。
118.其中,在所述基于所述第一方训练中间输出、所述预设真实标签、预设第一方顶端护照数据以及所述待训练顶端预测模型,通过与各第二方进行联邦交互,联合各所述第二方生成的具有护照嵌入的第二方训练中间输出,计算所述待训练顶端预测模型对应的模型总损失的步骤之后,所述联邦学习建模优化方法还包括:
119.步骤b10,计算所述模型总损失相对于各所述第二方训练中间输出的第二方梯度;
120.在本实施例中,具体地,对所述模型总损失分别针对于各所述第二方训练中间输出求偏导,获得各所述第二方训练中间输出对应的第二方梯度。
121.步骤b20,将各所述第二方梯度分别发送至各自对应的第二方,以供所述第二方基于所述第二方梯度,优化所述待训练第二方底端特征提取模型,获得第二方底端特征提取模型。
122.在本实施例中,具体地,将各所述第二方梯度分别发送至各自对应的第二方,以供
所述第二方基于所述第二方梯度,通过预设模型优化方法,对所述待训练第二方底端特征提取模型进行更新,并判断更新后的待训练第二方底端特征提取模型是否满足预设训练结束条件,若更新后的待训练第二方底端特征提取模型满足预设训练结束条件,则将所述待训练第二方底端特征提取模型作为所述第二方底端特征提取模型,若更新后的待训练第二方底端特征提取模型不满足预设训练结束条件,则返回执行生成所述第二方训练中间输出的步骤,其中,所述预设模型优化方法包括梯度上升法以及梯度下降法等,所述预设训练结束条件包括损失函数收敛以及达到最大迭代次数阈值等,而由于第一方在生成输出预测标签时,嵌入了预设第一方顶端护照数据,进而第二方在得到基于输出预测标签生成的模型总损失对应的第二方梯度时,由于第二方并未持有预设第一方底端护照数据和预设第一方顶端护照数据,进而第二方无法根据第二方梯度,反推出第一方的隐私数据,例如模型参数和样本等,实现了保护数据隐私的目的。
123.步骤s40,基于所述模型总损失,优化所述待训练第一方底端特征提取模型和所述待训练顶端预测模型,获得第一方底端特征提取模型和顶端预测模型。
124.在本实施例中,具体地,基于所述模型总损失,计算所述待训练第一方底端特征提取模型对应的第一方底端模型梯度以及所述待训练顶端预测模型对应的第一方顶端模型梯度,进而依据所述第一方底端模型梯度,更新所述待训练第一方底端特征提取模型,并依据所述第一方顶端模型梯度,更新所述待训练顶端预测模型,进而判断所述待训练第一方底端特征提取模型和所述待训练顶端预测模型是否均满足预设训练结束条件,若所述待训练第一方底端特征提取模型和所述待训练顶端预测模型均满足预设训练结束条件,则将所述待训练第一方底端特征提取模型作为所述第一方底端特征提取模型,并将所述待训练顶端预测模型作为所述顶端预测模型,若所述待训练第一方底端特征提取模型和所述待训练顶端预测模型未均满足预设训练结束条件,则返回执行所述提取第一方待训练样本和所述第一方训练样本对应的预设真实标签的步骤,如图4所示为基于护照嵌入的纵向联邦学习的流程示意图,其中,参与方1为所述第一方,参与方2至参与方n为各所述第二方,为所述第一方训练中间输出,至为各所述第二方训练中间输出,z~为所述聚合训练中间输出,以为输入的模型为所述待训练顶端预测模型,以为输出的模型为所述待训练第一方底端特征提取模型,以至为输出的模型为各所述待训练第二方底端特征提取模型,l为所述模型总损失,p
ln
表示参与方n第l个护照嵌入模块,护照嵌入网络模块均为护照嵌入模块,x1为所述第一方训练样本,x2至x
n
为各所述第二方训练样本。
125.其中,在所述基于所述模型总损失,优化所述待训练第一方底端特征提取模型和所述待训练顶端预测模型,获得第一方底端特征提取模型和顶端预测模型的步骤之后,所述联邦学习建模优化方法还包括:
126.步骤c10,获取第一方待预测样本,并基于所述第一方底端特征提取模型,将所述第一方待预测样本和所述预设第一方底端护照数据共同转换为具有护照嵌入的第一方中间输出;
127.在本实施例中,需要说明的是,所述第一方底端特征提取模型至少包括一第一方护照嵌入模块,所述预设第一方底端护照数据至少包括一第一方待嵌入护照样本,其中,所述第一方护照嵌入模块和所述第一方待嵌入护照样本一一对应。
128.具体地,获取第一方待预测样本,并将所述第一方待预测样本和所述预设第一方底端护照数据输入第一方底端特征提取模型后,通过所述第一方底端特征提取模型中各第一方护照嵌入模块,分别将所述预设第一护照数中各第一方护照嵌入模块对应的第一方待嵌入护照样本嵌入所述第一方待预测样本对应的模型中间输出,并在模型预测执行完毕后,由所述第一方底端特征提取模型的输出层输出具有护照嵌入的第一方中间输出。
129.步骤c20,接收各所述第二方发送的具有护照嵌入的第二方中间输出,其中,所述第二方中间输出由所述第二方基于所述第二方底端特征提取模型,对所述预设第二方底端护照数据和所述第一方待预测样本对应的第二方待预测样本进行转换得到;
130.在本实施例中,需要说明的是,各所述第二方中均设置有第二方底端特征提取模型,且所述第二方将基于所述第二方底端特征提取模型,将第一方待预测样本对应的第二方待预测样本以及预设第二方底端护照数据转换为第二方中间输出,所述第二方生成第二方中间输出的具体过程可参数步骤c20的内容,在此不再赘述,其中,虽然第二方中间输出为明文数据,当由于在生成所述第二方中间输出时,嵌入了预设第二方底端护照数据,进而由于第一方未持有预设第二方底端护照数据,进而第一方根据第二方中间输出,无法反推出第二方的隐私数据。
131.步骤c30,对所述第一方中间输出和各所述第二方中间输出进行聚合,获得聚合中间输出;
132.在本实施例中,具体地,基于预设聚合方式,将所述第一方中间输出和各所述第二方中间输出聚合为聚合中间输出。
133.步骤c40,基于所述顶端预测模型,将所述聚合中间输出和所述预设第一方顶端护照数据共同转换为目标预测结果。
134.在本实施例中,具体地,将所述聚合中间输出和所述预设第一方顶端护照数据输入顶端预测模型后,通过所述顶端预测模型中各第二方护照嵌入模块,分别将所述预设第一方顶端护照数据中将各第二方护照嵌入模块对应的顶端护照嵌入样本嵌入所述聚合中间输出对应的模型中间输出,并在模型预测执行完毕后,由所述顶端预测模型的输出层输出所述目标预测结果。
135.本申请实施例提供了一种联邦学习建模优化方法,相比于现有技术采用的在联邦学习过程中,通过同态加密或者多方安全计算的方式保护数据隐私的技术手段,本申请实施例首先获取待训练第一方底端特征提取模型和待训练顶端预测模型,并提取第一方待训练样本和所述第一方训练样本对应的预设真实标签,进而基于所述待训练第一方底端特征提取模型,将所述第一方训练样本和预设第一方底端护照数据共同转换为具有护照嵌入的第一方训练中间输出,进而基于所述第一方训练中间输出、所述预设真实标签、预设第一方顶端护照数据以及所述待训练顶端预测模型,通过与各第二方进行联邦交互,联合各所述第二方生成的具有护照嵌入的第二方训练中间输出,计算所述待训练顶端预测模型对应的模型总损失,其中,所述第二方训练中间输出由所述第二方获取的待训练第二方底端特征提取模型,对预设第二方底端护照数据和所述第一方训练样本对应的第二方训练样本进行转换得到,其中,需要说明的是,所述具有护照嵌入的第二方训练中间输出仍然为明文数据,其数据复杂度和数据量远远小于同态加密的数据,且由于在所述第二方训练中间输出中嵌入了预设第二方底端护照数据中的护照,而第一方未持有预设第二方底端护照数据,
第一方即使接收属于明文数据的第二方训练中间输出,也无法反推出属于第二方的隐私数据,进而基于所述模型总损失,优化所述待训练第一方底端特征提取模型和所述待训练顶端预测模型,获得第一方底端特征提取模型和顶端预测模型,进而实现了基于护照嵌入构建联邦模型的目的,保护了联邦学习过程中的数据隐私,且无需通过同态加密或者多方安全计算的方式保护数据隐私,达到了在明文状态下执行联邦学习中的数据安全计算的目的,减少了联邦学习过程中的数据计算复杂度以及避免了联邦学习过程中大量的数据加解密过程,所以,克服了现有技术中由于多方安全计算涉及到复杂的密码学操作,因此通信和计算开销都较大,使得联邦学习时的计算效率较低,而同态加密后的密文数据的数据复杂度和数据量远远大于明文数据,所以同态加密的计算开销极大,使得联邦学习时的计算效率较低,且同态加密的方式在联邦学习过程中需要执行大量的加解密过程,将进一步降低联邦学习时的计算效率的技术缺陷,所以,提升了联邦学习时的计算效率。
136.进一步地,参照图5,在本申请的另一实施例中,所述联邦学习建模优化方法应用于第二方,所述联邦学习建模优化方法包括:
137.步骤d10,获取待训练第二方底端特征提取模型,并提取第二方训练样本;
138.在本实施例中,需要说明的是,所述联邦学习建模优化方法应用于纵向联邦学习场景,第一方和第二方均为纵向联邦学习的参与方,所述第一方与所述第二方的介绍具体可参照步骤s10对应的实施例内容部分,在此不再赘述。
139.步骤d20,基于所述待训练第二方底端特征提取模型,将所述第二方训练样本与预设第二方底端护照数据转换为第二方训练中间输出;
140.在本实施例中,需要说明的是,所述预设第二方底端护照数据至少包括一第二方待嵌入护照样本,其中,所述第二方待嵌入护照样本为预先设置好的用于在所述待训练第二方底端特征提取模型中进行护照嵌入的样本,其中,所述第二方待嵌入护照样本可以为图片样本、文字样本或者特定的编码矩阵等,所述待训练第二方底端特征提取模型中至少包括一待训练第二方护照嵌入模块,用于将所述第二方待嵌入护照样本嵌入所述第二方训练样本的模型中间输出,并与所述第二方训练样本共同转换为模型最终输出,其中,所述模型中间输出为模型的中间网络层的输出,所述模型最终输出为模型的输出层产生的输出,例如,假设神经网络模型a包括一输入层、10个隐藏层和一输出层,则输入层的输出与10个隐藏层的输出均为所述模型中间输出。
141.具体地,将所述第二方训练样本和所述预设第二方底端护照数据输入待训练第二方底端特征提取模型后,通过所述待训练第二方底端特征提取模型中各待训练第二方护照嵌入模块,分别将各所述待训练第二方护照嵌入模块对应的第二方待嵌入护照样本嵌入所述第二方训练样本对应的模型中间输出,并在模型预测执行完毕后,由所述待训练第二方底端特征提取模型的输出层输出具有护照嵌入的第二方训练中间输出,例如,假设所述待训练第二方底端特征提取模型包括2个待训练第二方护照嵌入模块a和b,其中,待训练第二方护照嵌入模块a设置于待训练第二方底端特征提取模型的第3层隐藏层与第4层隐藏层之间,则通过待训练第二方护照嵌入模块a,在第3层隐藏层的3层输出中嵌入a对应的第二方待嵌入护照样本,并将嵌入a对应的第二方待嵌入护照样本后的3层输出作为第4层隐藏层的输入,而待训练第二方护照嵌入模块b设置于待训练第二方底端特征提取模型的第40层隐藏层与第41层隐藏层之间,则通过待训练第二方护照嵌入模块b,在第40层隐藏层的40层
输出中嵌入b对应的第二方待嵌入护照样本,并将嵌入b对应的第二方待嵌入护照样本后的40层输出作为第41层隐藏层的输入,最后由所述待训练第二方底端特征提取模型的输出层输出第二方训练中间输出。
142.其中,所述待训练第二方底端特征提取模型包括待训练第二方底端神经网络,所述待训练第二方底端神经网络至少包括一待训练第二方护照嵌入模块,所述预设第二方底端护照数据至少包括一所述待训练第二方照嵌入模块对应的第二方待嵌入护照样本,
143.所述基于所述待训练第二方底端特征提取模型,将所述第二方训练样本与预设第二方底端护照数据转换为第二方训练中间输出的步骤包括:
144.步骤d21,基于所述待训练第二方底端神经网络中处于所述待训练第二方护照嵌入模块之前的第一部分待训练第二方底端神经网络,将所述第二方训练样本转换为待训练第二方底端网络中间输出;
145.在本实施例中,需要说明的是,所述第一部分待训练第二方底端神经网络为所述待训练第二方底端神经网络中作为所述待训练第二方护照嵌入模块的输入的模型中间输出所对应的部分神经网络,用于将第二方训练样本转换为所述待训练第二方护照嵌入模块的部分输入。
146.具体地,在将所述第二方训练样本输入所述待训练第二方底端神经网络之后,通过所述待训练第二方底端神经网络中处于所述待训练第二方护照嵌入模块之前的第一部分待训练第二方底端神经网络,将所述第二方训练样本映射为待训练第二方底端网络中间输出。
147.步骤d22,基于所述待训练第二方护照嵌入模块,将所述待训练第二方底端网络中间输出和所述第二方待嵌入护照样本共同转换为待训练第二方底端护照嵌入模块输出;
148.在本实施例中,具体地,基于所述待训练第二方护照嵌入模块,通过将所述第二方待嵌入护照样本嵌入所述待训练第二方护照嵌入模块针对于所述待训练第二方底端网络中间输出生成的嵌入模块输出,获得待训练第二方底端护照嵌入模块输出。
149.进一步地,所述待训练第二方护照嵌入模块包括待训练第二方护照嵌入层和待训练第二方模块神经网络层,步骤d22还包括:
150.基于所述待训练第二方模块神经网络层,将所述待训练第二方底端网络中间输出映射为第二方待嵌入输出,并将所述第二方待嵌入护照样本映射为第二方待嵌入护照,进而基于所述待训练第二方护照嵌入层中的护照嵌入函数,将所述第二方待嵌入护照转换为第二方嵌入护照参数,进而基于所述第二方嵌入护照参数,对所述第二方待嵌入输出进行护照嵌入,获得待训练第二方底端护照嵌入模块输出,其中,所述基于所述第二方嵌入护照参数,对所述第二方待嵌入输出进行护照嵌入,获得所述待训练第二方底端护照嵌入模块输出的过程具体如下:
151.x=γ*x
t

152.其中,x为所述待训练第二方底端护照嵌入模块输出,x
t
为所述第二方待嵌入输出,γ和β为所述第二方护照嵌入参数。
153.步骤d23,基于所述待训练第二方底端神经网络中处于所述待训练第二方护照嵌入模块之后的第二部分待训练第二方底端神经网络,将所述待训练第二方底端护照嵌入模块输出转换为所述第二方训练中间输出。
154.在本实施例中,需要说明的是,所述第二部分待训练第二方底端神经网络为所述待训练第二方底端神经网络中将所述待训练第二方护照嵌入模块的输出作为输入的部分神经网络,用于所述待训练第二方护照嵌入模块的输出转换为所述第二方训练中间输出。
155.具体地,通过所述待训练第二方底端神经网络中处于所述待训练第二方护照嵌入模块之后的第二部分待训练第二方底端神经网络,将所述待训练第二方底端护照嵌入模块输出映射为所述第二方训练中间输出。
156.步骤d30,将所述第二方训练中间输出发送至第一方,以供所述第一方聚合各所述第二方发送的第二方训练中间输出,以及基于第一方训练样本与预设第一方底端护照数据转换得到的第一方训练中间输出,获得聚合训练中间输出,并基于所述聚合训练中间输出和预设第一方顶端护照数据转换得到的输出预测标签,以及所述第一方训练样本对应的预设真实标签,计算模型总损失;
157.在本实施例中,具体地,将所述第二方训练中间输出发送至第一方,以供所述第一方对生成的第一方训练输出和各第二方发送的第二方训练中间输出进行聚合,获得聚合训练中间输出,进而依据待训练顶端预测模型,将所述聚合训练中间输出和预设第一方顶端护照数据共同转换为输出预测标签,进而基于所述输出预测标签和预设真实标签,计算模型总损失,并进而第一方基于所述模型总损失,优化待训练第一方底端特征提取模型和待训练顶端预测模型,获得第一方底端特征提取模型和顶端预测模型,并计算针对于各第二方训练中间输出的各第二方梯度,进而第一方将各所述第二方梯度分别发送至各自对应的第二方,其中,所述第一方生成第一方训练中间输出和生成模型总损失、构建第一方底端特征提取模型以及构建顶端预测模型的具体过程可参照步骤s10至步骤s40及其细化步骤中的内容,在此不再赘述。
158.步骤d40,接收所述第一方发送的模型总损失相对于所述第二方训练中间输出的第二方梯度,并基于所述第二方梯度,优化所述待训练第二方底端特征提取模型,获得第二方底端特征提取模型。
159.在本实施例中,具体地,接收所述第一方发送的模型总损失相对于所述第二方训练中间输出的第二方梯度,接收所述第一方发送的模型总损失相对于所述第二方训练中间输出的第二方梯度,并基于所述第二方梯度,更新所述待训练第二方底端特征提取模型,并判断更新后的待训练第二方底端特征提取模型是否满足预设训练结束条件,若更新后的待训练第二方底端特征提取模型满足预设训练结束条件,则将所述待训练第二方底端特征提取模型作为所述第二方底端特征提取模型,若更新后的待训练第二方底端特征提取模型不满足预设训练结束条件,则返回执行所述提取第二方训练样本的步骤。
160.其中,在所述接收所述第一方发送的模型总损失相对于所述第二方训练中间输出的第二方梯度,并基于所述第二方梯度,优化所述待训练第二方底端特征提取模型,获得第二方底端特征提取模型的步骤之后,所述联邦学习建模优化方法还包括:
161.步骤e10,获取第二方待预测样本,并基于所述第二方底端特征提取模型,将所述第二方待预测样本和所述预设第二方底端护照数据共同转换为具有护照嵌入的第二方中间输出;
162.在本实施例中,需要说明的是,所述第二方底端特征提取模型至少包括一第二方护照嵌入模块,所述预设第二方底端护照数据至少包括一第二方待嵌入护照样本,其中,所
述第二方护照嵌入模块与所述第二方待嵌入护照样本一一对应。
163.具体地,获取第二方待预测样本,并将所述第二方待预测样本和所述预设第二方底端护照数据输入第二方底端特征提取模型后,通过所述第二方底端特征提取模型中各第二方护照嵌入模块,分别将所述预设第二方底端护照数据中各第二方护照嵌入模块对应的第二方待嵌入护照样本嵌入所述第二方待预测样本对应的模型中间输出,并在模型预测执行完毕后,由所述第二方底端特征提取模型的输出层输出具有护照嵌入的第二方中间输出。
164.步骤e20,将所述第二方中间输出发送至第一方,以供所述第一方基于各所述第二方发送的第二方中间输出、所述第二方待预测样本对应的第一方待预测样本、所述预设第一方底端护照数据和所述预设第一方顶端护照数据,通过基于所述预设第一方底端护照数据进行联邦学习构建的第一方底端特征提取模型以及基于所述预设第一方顶端护照数据进行联邦学习构建的顶端预测模型,生成目标预测结果。
165.在本实施例中,具体地,将所述第二方中间输出发送至第一方,以供所述第一方基于第一方底端特征提取模型,将第一方待预测样本和预设第一方底端护照数据共同转换为第一方中间输出,进而第一方将第一方中间输出和各第二方发送的第二方中间输出聚合,获得聚合中间输出,进而第一方基于顶端预测模型,将所述聚合中间输出和所述预设第二方底端护照数据共同转换为目标预测结果,其中,所述第一方生成第一方中间输出以及目标预测结果的具体过程可参照步骤c10至步骤c40中的具体内容,在此不再赘述。
166.本申请实施例提供了一种联邦学习建模优化方法,相比于现有技术采用的在联邦学习过程中,通过同态加密或者多方安全计算的方式保护数据隐私的技术手段,本申请实施例首先获取待训练第二方底端特征提取模型,并提取第二方训练样本,进而基于所述待训练第二方底端特征提取模型,将所述第二方训练样本与预设第二方底端护照数据转换为第二方训练中间输出,进而将所述第二方训练中间输出发送至第一方,以供所述第一方聚合各所述第二方发送的第二方训练中间输出,以及基于第一方训练样本与预设第一方底端护照数据转换得到的第一方训练中间输出,获得聚合训练中间输出,并基于所述聚合训练中间输出和预设第二方底端护照数据转换得到的输出预测标签,以及所述第一方训练样本对应的预设真实标签,计算模型总损失,其中,需要说明的是,所述具有护照嵌入的第二方训练中间输出仍然为明文数据,其数据复杂度和数据量远远小于同态加密的数据,且由于在所述第二方训练中间输出中嵌入了预设第二方底端护照数据中的护照,进而由于第一方未持有预设第二方底端护照数据,第一方即使接收属于明文数据的第二方训练中间输出,也无法反推出属于第二方的隐私数据,进而接收所述第一方发送的模型总损失相对于所述第二方训练中间输出的第二方梯度,其中,由于第二方梯度是基于模型总损失生成的,而模型总损失又是基于嵌入了预设第一方底端护照数据第一方训练中间输出和预设第二方底端护照数据生成的,进而在第二方未持有预设第一方底端护照数据和预设第二方底端护照数据的情况下,无法通过第二方梯度反推出第一方的隐私数据,进而基于所述第二方梯度,优化所述待训练第二方底端特征提取模型,获得所述第二方底端特征提取模型,实现了基于护照嵌入构建联邦模型的目的,保护了联邦学习过程中的数据隐私,且无需通过同态加密或者多方安全计算的方式保护数据隐私,达到了在明文状态下执行联邦学习中的数据安全计算的目的,减少了联邦学习过程中的数据计算复杂度以及避免了联邦学习过程中大量
的数据加解密过程,所以,克服了现有技术中由于多方安全计算涉及到复杂的密码学操作,因此通信和计算开销都较大,使得联邦学习时的计算效率较低,而同态加密后的密文数据的数据复杂度和数据量远远大于明文数据,所以同态加密的计算开销极大,使得联邦学习时的计算效率较低,且同态加密的方式在联邦学习过程中需要执行大量的加解密过程,将进一步降低联邦学习时的计算效率的技术缺陷,所以,提升了联邦学习时的计算效率。
167.进一步地,参照图6,在本申请的另一实施例中,所述联邦预测优化方法应用于第一方,所述联邦预测优化方法包括:
168.步骤f10,获取第一方待预测样本、预设第一方底端护照数据和预设第一方顶端护照数据;
169.在本实施例中,需要说明的是,所述联邦预测优化方法应用于纵向联邦学习场景,第一方和第二方均为纵向联邦学习的参与方,所述第一方的数量可以为一个或者多个,其中,所述第一方中设置有第一方底端特征提取模型、顶端预测模型以及具备预设真实标签的第一方待预测样本,所述第二方中设置有第二方底端特征提取模型以及无样本标签的第二方待预测样本,其中,所述第一方待预测样本和所述第二待预测样本对应同一公共样本id,所述第一方底端特征提取模型用于将第一方待预测样本转换为具有护照嵌入的第一方中间输出,所述第二方底端特征提取模型用于将第二方待预测样本转换为具有护照嵌入的第二方中间输出,所述顶端预测模型用于第一底端特征提取模型的输出与各第二底端特征提取模型的输出的聚合结果转换为目标预测结果。
170.步骤f20,基于所述预设第一方底端护照数据进行联邦学习构建的第一方底端特征提取模型,将所述第一方待预测样本和所述预设第一方底端护照数据共同转换为具有护照嵌入的第一方中间输出;
171.在本实施例中,需要说明的是,所述第一方底端特征提取模型至少包括一第一方护照嵌入模块,所述预设第一方底端护照数据至少包括一第一方待嵌入护照样本,其中,所述第一方护照嵌入模块和所述第一方待嵌入护照样本一一对应,所述第一方底端特征提取模型为所述第一方基于预设第一方底端护照数据,与第二方进行纵向联邦学习而构建的机器学习模型,其中,所述第一方底端特征提取模型的具体构建过程可参照步骤s10至步骤s40及其细化步骤中的内容,在此不再赘述。
172.具体地,将所述第一方待预测样本和所述预设第一方底端护照数据输入第一方底端特征提取模型后,通过所述第一方底端特征提取模型中各第一方护照嵌入模块,分别将所述预设第一护照数中各第一方护照嵌入模块对应的第一方待嵌入护照样本嵌入所述第一方待预测样本对应的模型中间输出,并在模型预测执行完毕后,由所述第一方底端特征提取模型的输出层输出具有护照嵌入的第一方中间输出。
173.其中,所述第一方底端特征提取模型包括第一方底端神经网络,所述第一方底端神经网络至少包括一第一方护照嵌入模块,所述预设第一方底端护照数据至少包括一所述第一方护照嵌入模块对应的第一方待嵌入护照样本,
174.所述基于所述预设第一方底端护照数据进行联邦学习构建的第一方底端特征提取模型,将所述第一方待预测样本和所述预设第一方底端护照数据共同转换为具有护照嵌入的第一方中间输出的步骤包括:
175.步骤f21,基于所述第一方底端神经网络中处于所述第一方护照嵌入模块之前的
第一部分第一方底端神经网络,将所述第一方待预测样本转换为第一方底端网络中间输出;
176.在本实施例中,需要说明的是,所述第一部分底端神经网络为所述第一方底端神经网络中作为所述第一方护照嵌入模块的输入的模型中间输出所对应的部分神经网络,用于将第一方待预测样本转换为所述第一方护照嵌入模块的部分输入。
177.具体地,基于所述第一方底端神经网络中处于所述第一方护照嵌入模块之前的第一部分底端神经网络,将所述第一方待预测样本映射为第一方底端网络中间输出。
178.步骤f22,基于所述第一方护照嵌入模块,将所述第一方底端网络中间输出和所述第一方待嵌入护照样本共同转换为第一方底端护照嵌入模块输出;
179.在本实施例中,具体地,基于所述第一方护照嵌入模块,通过将所述第一方待嵌入护照样本嵌入所述第一方护照嵌入模块针对于所述底端网络中间输出生成的嵌入模块输出,获得第一方底端护照嵌入模块输出。
180.其中,所述第一方护照嵌入模块包括第一方护照嵌入层和第一方模块神经网络层,
181.所述基于所述第一方护照嵌入模块,将所述第一方底端网络中间输出和所述第一方待嵌入护照样本共同转换为第一方底端护照嵌入模块输出的步骤包括:
182.步骤f221,基于所述第一方模块神经网络层,将所述第一方底端网络中间输出线性变换为待嵌入网络层输出,以及将所述第一方待嵌入护照样本线性变换为待嵌入护照;
183.步骤f222,基于所述第一方护照嵌入层中的护照函数,将所述待嵌入护照转换为护照嵌入参数;
184.在本实施例中,需要说明的是,所述护照函数为预先设置好的基于待嵌入护照生成护照嵌入参数的函数。
185.具体地,将所述待嵌入护照输入所述第一方护照嵌入层中的护照函数,输出所述待嵌入护照对应的护照嵌入函数。
186.步骤f223,基于所述待嵌入网络层输出和所述护照嵌入参数,生成所述第一方底端护照嵌入模块输出。
187.在本实施例中,需要说明的是,所述护照嵌入参数包括第一护照嵌入参数和第二护照嵌入参数。
188.具体地,通过计算所述待嵌入网络层输出与第一护照嵌入参数之间的目标乘积,以及所述目标乘积与所述第二护照嵌入参数之间的和,对所述待嵌入网络层输出进行护照嵌入,生成所述第一方底端护照嵌入模块输出,其中,生成所述第一方底端护照嵌入模块输出的具体过程如下:
189.x=γ*x
t

190.其中,x为所述第一方底端护照嵌入模块输出,x
t
为所述待嵌入网络层输出,γ为所述第一护照嵌入参数,β为所述第二护照嵌入参数。
191.步骤f23,基于所述第一方底端神经网络中处于所述第一方护照嵌入模块之后的第二部分第一方底端神经网络,将所述第一方底端护照嵌入模块输出转换为所述具有护照嵌入的第一方中间输出。
192.在本实施例中,基于所述第一方底端神经网络中处于所述第一方护照嵌入模块之
后的第二部分第一方底端神经网络,将所述第一方底端护照嵌入模块输出映射为所述具有护照嵌入的第一方中间输出。
193.步骤f30,接收各第二方发送的具有护照嵌入的第二方中间输出,其中,所述第二方中间输出由所述第二方基于预设第二方底端护照数据进行联邦学习构建的第二方底端特征提取模型,对所述预设第二方底端护照数据和所述第一方待预测样本对应的第二方待预测样本进行转换得到;
194.在本实施例中,需要说明的是,各所述第二方中均设置有第二方底端特征提取模型,且所述第二方将基于所述第二方底端特征提取模型,将第一方待预测样本对应的第二方待预测样本以及预设第二方底端护照数据转换为第二方中间输出,其中,虽然第二方中间输出为明文数据,当由于在生成所述第二方中间输出时,嵌入了预设第二方底端护照数据,进而由于第一方未持有预设第二方底端护照数据,进而第一方根据第二方中间输出,无法反推出第二方的隐私数据。
195.步骤f40,对所述第一方护照嵌入中间输出和各所述第二方护照嵌入中间输出进行聚合,获得聚合护照嵌入中间输出;
196.在本实施例中,具体地,基于预设聚合方式,将所述第一方中间输出和各所述第二方中间输出聚合为聚合中间输出。
197.步骤f50,基于所述预设第一方顶端护照数据进行联邦学习构建的顶端预测模型,将所述聚合护照嵌入中间输出和所述预设第一方顶端护照数据转换为目标预测结果。
198.在本实施例中,具体地,将所述聚合护照嵌入中间输出和所述预设第一方顶端护照数据输入顶端预测模型后,通过所述顶端预测模型中各顶端护照嵌入模块,分别将所述预设第一方顶端护照数据中将各顶端护照嵌入模块对应的顶端护照嵌入样本嵌入所述聚合护照嵌入中间输出对应的模型中间输出,并在模型预测执行完毕后,由所述顶端预测模型的输出层输出所述目标预测结果。
199.其中,所述顶端预测模型包括顶端神经网络,所述顶端神经网络至少包括一顶端网络护照嵌入模块,所述预设第一方顶端护照数据至少包括一所述顶端网络护照嵌入模块对应的顶端护照嵌入样本,
200.所述基于所述预设第一方顶端护照数据进行联邦学习构建的顶端预测模型,将所述聚合护照嵌入中间输出和所述预设第一方顶端护照数据转换为目标预测结果的步骤包括:
201.步骤f51,基于所述顶端神经网络中处于所述顶端网络护照嵌入模块之前的第一部分顶端神经网络,将所述聚合护照嵌入中间输出转换为顶端网络层中间输出;
202.在本实施例中,需要说明的是,所述第一部分顶端神经网络为所述顶端神经网络中作为所述顶端网络护照嵌入模块的输入的模型中间输出所对应的部分神经网络,用于将聚合护照嵌入中间输出转换为所述顶端护照嵌入模块的部分输入。
203.具体地,基于所述顶端神经网络中处于所述顶端网络护照嵌入模块之前的第一部分顶端神经网络,将所述聚合护照嵌入中间输出映射为顶端网络层中间输出。
204.步骤f52,基于所述顶端护照嵌入模块,将所述顶端网络层中间输出和所述顶端护照嵌入样本共同转换为顶端护照嵌入模块输出;
205.在本实施例中,具体地,基于所述顶端护照嵌入模块,通过将所述顶端护照嵌入样
本嵌入所述顶端护照嵌入模块针对于所述顶端网络层中间输出生成的嵌入模块输出,获得顶端护照嵌入模块输出。
206.其中,所述顶端护照嵌入模块包括顶端护照嵌入层和顶端模块神经网络层,步骤f52还包括:
207.基于所述顶端模块神经网络层,将所述顶端网络层中间输出映射为顶端待嵌入输出,并将所述顶端护照嵌入样本映射为顶端顶端待嵌入护照,进而基于所述顶端护照嵌入层中的护照嵌入函数,将所述顶端顶端待嵌入护照转换为嵌入护照参数,进而基于所述嵌入护照参数,对所述顶端待嵌入输出进行护照嵌入,获得所述顶端护照嵌入模块输出,其中,生成顶端护照嵌入模块输出的过程具体如下:
208.x=γ*x
t

209.其中,x为所述顶端护照嵌入模块输出,x
t
为所述顶端待嵌入输出,γ和β为所述顶端护照嵌入参数。
210.步骤f53,基于所述顶端神经网络中处于所述顶端网络护照嵌入模块之后的第二部分顶端神经网络,将所述顶端护照嵌入模块输出转换为所述目标预测结果。
211.在本实施例中,需要说明的是,所述第二部分顶端神经网络为所述顶端神经网络中将所述第二护照嵌入模块的输出作为输入的部分神经网络,用于所述第二护照嵌入模块的输出转换为所述目标预测结果。
212.具体地,基于所述顶端神经网络中处于所述顶端网络护照嵌入模块之后的第二部分顶端神经网络,将所述顶端护照嵌入模块输出映射为所述目标预测结果。
213.其中,在所述基于所述预设第一方底端护照数据进行联邦学习构建的第一方底端特征提取模型,将所述第一方待预测样本和所述预设第一方底端护照数据共同转换为具有护照嵌入的第一方中间输出的步骤之前,所述联邦预测优化方法还包括:
214.步骤f60,获取待训练第一方底端特征提取模型和待训练顶端预测模型,并提取第一方待训练样本和所述第一方训练样本对应的预设真实标签;
215.在本实施例中,需要说明的是,所述待训练第一方底端特征提取模型为未训练好的第一方底端特征提取模型,所述待训练顶端预测模型为未训练好的顶端预测模型。
216.步骤f70,基于所述待训练第一方底端特征提取模型,将所述第一方训练样本和预设第一方底端护照数据共同转换为具有护照嵌入的第一方训练中间输出;
217.在本实施例中,具体地,将所述第一方训练样本和所述预设第一方底端护照数据输入待训练第一方底端特征提取模型后,通过所述待训练第一方底端特征提取模型中各待训练第一方护照嵌入模块,分别将各所述待训练第一方护照嵌入模块对应的第一方待嵌入护照样本嵌入所述第一方训练样本对应的模型中间输出,并在模型预测执行完毕后,由所述待训练第一方底端特征提取模型的输出层输出具有护照嵌入的第一方训练中间输出。
218.步骤f80,基于所述第一方训练中间输出、所述预设真实标签、预设第一方顶端护照数据以及所述待训练顶端预测模型,通过与各第二方进行联邦交互,联合各所述第二方生成的具有护照嵌入的第二方训练中间输出,计算所述待训练顶端预测模型对应的模型总损失,其中,所述第二方训练中间输出由所述第二方获取的待训练第二方底端特征提取模型,对预设第二方底端护照数据和所述第一方训练样本对应的第二方训练样本进行转换得到;
219.在本实施例中,需要说明的是,各所述第二方中均设置有待训练第二方底端特征提取模型,且所述第二方将基于所述待训练第二方底端特征提取模型,将第一方训练样本对应的第二方训练样本以及预设第二方底端护照数据转换为第二方训练中间输出,其中,所述第二方训练样本与所述第一方训练样本对应同一公共样本i d,所述公共样本i d由第一方与各第二方进行样本对齐时确定,所述第二方生成第二方训练中间输出的具体过程可参数步骤s20及其细化步骤中的内容,在此不再赘述。
220.具体地,接收各所述第二方发送的第二方训练中间输出,并基于预设聚合方式,对所述第一方训练中间输出和各所述第二方训练中间输出进行聚合,生成聚合训练中间输出,并基于所述待训练顶端预测模型,将所述聚合训练中间输出和预设第一方顶端护照数据共同转换为输出预测标签,进而基于所述输出预测标签和所述预设真实标签,计算模型总损失,其中,所述预设聚合方式包括加权平均以及求和等。
221.其中,所述基于所述第一方训练中间输出、所述预设真实标签、预设第一方顶端护照数据以及所述待训练顶端预测模型,通过与各第二方进行联邦交互,联合各所述第二方生成的具有护照嵌入的第二方训练中间输出,计算所述待训练顶端预测模型对应的模型总损失的步骤包括:
222.步骤f81,接收各所述第二方发送的具有护照嵌入的第二方训练中间输出;
223.在本实施例中,需要说明的是,所述第二方将所述第二方训练样本和所述预设第二方底端护照数据输入待训练第二方底端特征提取模型后,通过所述待训练第二方底端特征提取模型中各待训练第二方护照嵌入模块,分别将所述预设第二方底端护照数据中各待训练第二方护照嵌入模块对应的待嵌入护照样本嵌入所述第二方训练样本对应的模型中间输出,并在模型预测执行完毕后,由所述待训练第二方底端特征提取模型的输出层输出具有护照嵌入的第二方训练中间输出,其中,由于第二方在生成第二方训练中间输出时,嵌入了预设第二方底端护照数据,进而第一方在接收第二方训练中间输出后,由于第一方未持有所述预设第二方底端护照数据,无法通过第二方训练中间输出,反推出第一方的隐私数据,例如模型参数与样本等,实现了保护数据隐私的目的。
224.步骤f82,对所述第一方训练中间输出和各所述第二方训练中间输出进行聚合,获得聚合训练中间输出;
225.在本实施例中,需要说明的是,聚合的方式包括加权平均以及求和等方式。
226.步骤f83,通过所述待训练顶端预测模型,将所述聚合训练中间输出和所述预设第一方顶端护照数据共同转换为输出预测标签;
227.具体地,将所述聚合训练中间输出和所述预设第一方顶端护照数据输入待训练顶端预测模型后,通过所述待训练顶端预测模型中各待训练顶端护照嵌入模块,分别将所述预设第一方顶端护照数据中将各待训练顶端护照嵌入模块对应的顶端护照嵌入样本嵌入所述聚合训练中间输出对应的模型中间输出,并在模型预测执行完毕后,由所述待训练顶端预测模型的输出层输出所述输出预测标签。
228.步骤f84,基于所述输出预测标签和所述预设真实标签,计算所述模型总损失。
229.在本实施例中,具体地,将所述输出预测标签和所述预设真实标签之间的差值作为模型总损失。
230.其中,在所述基于所述第一方训练中间输出、所述预设真实标签、预设第一方顶端
护照数据以及所述待训练顶端预测模型,通过与各第二方进行联邦交互,联合各所述第二方生成的具有护照嵌入的第二方训练中间输出,计算所述待训练顶端预测模型对应的模型总损失的步骤之后,所述联邦学习建模优化方法还包括:
231.步骤g10,计算所述模型总损失相对于各所述第二方训练中间输出的第二方梯度;
232.在本实施例中,具体地,对所述模型总损失分别针对于各所述第二方训练中间输出求偏导,获得各所述第二方训练中间输出对应的第二方梯度。
233.步骤g20,将各所述第二方梯度分别发送至各自对应的第二方,以供所述第二方基于所述第二方梯度,优化所述待训练第二方底端特征提取模型,获得第二方底端特征提取模型。
234.在本实施例中,具体地,将各所述第二方梯度分别发送至各自对应的第二方,以供所述第二方基于所述第二方梯度,通过预设模型优化方法,对所述待训练第二方底端特征提取模型进行更新,并判断更新后的待训练第二方底端特征提取模型是否满足预设训练结束条件,若更新后的待训练第二方底端特征提取模型满足预设训练结束条件,则将所述待训练第二方底端特征提取模型作为所述第二方底端特征提取模型,若更新后的待训练第二方底端特征提取模型不满足预设训练结束条件,则返回执行生成所述第二方训练中间输出的步骤,其中,所述预设模型优化方法包括梯度上升法以及梯度下降法等,所述预设训练结束条件包括损失函数收敛以及达到最大迭代次数阈值等,而由于第一方在生成输出预测标签时,嵌入了预设第一方顶端护照数据,进而第二方在得到基于输出预测标签生成的模型总损失对应的第二方梯度时,由于第二方并未持有预设第一方底端护照数据和预设第一方顶端护照数据,进而第二方无法根据第二方梯度,反推出第一方的隐私数据,例如模型参数和样本等,实现了保护数据隐私的目的。
235.步骤f90,基于所述模型总损失,优化所述待训练第一方底端特征提取模型和所述待训练顶端预测模型,获得第一方底端特征提取模型和顶端预测模型。
236.在本实施例中,具体地,基于所述模型总损失,计算所述待训练第一方底端特征提取模型对应的第一方底端模型梯度以及所述待训练顶端预测模型对应的第一方顶端模型梯度,进而依据所述第一方底端模型梯度,更新所述待训练第一方底端特征提取模型,并依据所述第一方顶端模型梯度,更新所述待训练顶端预测模型,进而判断所述待训练第一方底端特征提取模型和所述待训练顶端预测模型是否均满足预设训练结束条件,若所述待训练第一方底端特征提取模型和所述待训练顶端预测模型均满足预设训练结束条件,则将所述待训练第一方底端特征提取模型作为所述第一方底端特征提取模型,并将所述待训练顶端预测模型作为所述顶端预测模型,若所述待训练第一方底端特征提取模型和所述待训练顶端预测模型未均满足预设训练结束条件,则返回执行所述提取第一方待训练样本和所述第一方训练样本对应的预设真实标签的步骤,其中,步骤f60至步骤f90中的具体过程可参照步骤s10至步骤s40及其细化步骤中的内容,在此不再赘述。
237.本申请实施例提供了一种联邦预测优化方法,其中,首先获取第一方待预测样本、预设第一方底端护照数据和预设第一方顶端护照数据,进而基于所述预设第一方底端护照数据进行联邦学习构建的第一方底端特征提取模型,将所述第一方待预测样本和所述预设第一方底端护照数据共同转换为具有护照嵌入的第一方中间输出,进而接收各第二方发送的具有护照嵌入的第二方中间输出,其中,所述第二方中间输出由所述第二方基于预设第
二方底端护照数据进行联邦学习构建的第二方底端特征提取模型,对所述预设第二方底端护照数据和所述第一方待预测样本对应的第二方待预测样本进行转换得到,其中,虽然所述第二方中间输出仍然为明文数据,但是第二方中间输出嵌入了预设第二方底端护照数据,所以在第一方未持有预设第二方底端护照数据的情况下,第一方无法根据第二方中间输出反推出第二方的隐私数据,进而对所述第一方护照嵌入中间输出和各所述第二方护照嵌入中间输出进行聚合,获得聚合护照嵌入中间输出,并基于所述预设第一方顶端护照数据进行联邦学习构建的顶端预测模型,将所述聚合护照嵌入中间输出和所述预设第一方顶端护照数据转换为目标预测结果,实现了在保护数据隐私的同时,在明文状态下执行联邦学习过程中的数据计算过程的目的,进而相比于基于同态加密或者多方安全计算的联邦预测的方式,减小了联邦预测过程中的数据计算复杂度,且避免了大量的数据加解密过程,所以,提升了联邦预测时的计算效率。
238.进一步地,参照图7,在本申请的另一实施例中,所述联邦预测优化方法应用于第二方,所述联邦预测优化方法包括:
239.步骤h10,获取第二方待预测样本和预设第二方底端护照数据;
240.在本实施例中,所述联邦预测优化方法应用于纵向联邦学习场景,第一方和第二方均为纵向联邦学习的参与方,所述第一方和所述第二方的具体解释内容可参照步骤f10对应的实施例内容,在此不再赘述。
241.步骤h20,基于所述预设第二方底端护照数据进行联邦学习构建的第二方底端特征提取模型,将所述第二方待预测样本和所述预设第二方底端护照数据共同转换为具有护照嵌入的第二方中间输出;
242.在本实施例中,需要说明的是的,所述第二方底端特征提取模型为第二方基于预设第二方底端护照数据,与第一方进行纵向联邦学习构建的机器学习模型,其中,所述第二方底端特征提取模型至少包括一第二方护照嵌入模块,所述预设第二方底端护照数据至少包括一第二方待嵌入护照样本,其中,所述第二方护照嵌入模块与所述第二方待嵌入护照样本一一对应。
243.具体地,将所述第二方待预测样本和所述预设第二方底端护照数据输入第二方底端特征提取模型后,通过所述第二方底端特征提取模型中各第二方护照嵌入模块,分别将所述预设第二方底端护照数据中各第二方护照嵌入模块对应的第二方待嵌入护照样本嵌入所述第二方待预测样本对应的模型中间输出,并在模型预测执行完毕后,由所述第二方底端特征提取模型的输出层输出具有护照嵌入的第二方中间输出。
244.其中,所述第二方底端特征提取模型包括第二方底端神经网络,所述第二方底端神经网络至少包括一第二方护照嵌入模块,所述述预设第二方底端护照数据至少包括一所述第二方护照嵌入模块对应的第二方待嵌入护照样本,
245.所述基于所述预设第二方底端护照数据进行联邦学习构建的第二方底端特征提取模型,将所述第二方待预测样本和所述预设第二方底端护照数据共同转换为具有护照嵌入的第二方中间输出的步骤包括:
246.步骤h21,基于所述第二方底端神经网络中处于所述第二方护照嵌入模块之前的第一部分第二方底端神经网络,将所述第二方待预测样本转换为第二方第一方底端网络中间输出;
247.在本实施例中,需要说明的是,所述第一部分第二方底端神经网络为所述第二方底端神经网络中作为所述第二方护照嵌入模块的输入的模型中间输出所对应的部分神经网络,用于将第二方待预测样本转换为所述第二方护照嵌入模块的部分输入。
248.具体地,基于所述第二方底端神经网络中处于所述第二方护照嵌入模块之前的第一部分第二方底端神经网络,将所述第二方待预测样本映射为第二方第一方底端网络中间输出。
249.步骤h22,基于所述第二方护照嵌入模块,将所述第二方第一方底端网络中间输出和所述第二方待嵌入护照样本共同转换为第二方底端护照嵌入模块输出;
250.在本实施例中,具体地,基于所述第二方护照嵌入模块,通过将所述第二方待嵌入护照样本嵌入所述待第二方护照嵌入模块针对于所述第二方第一方底端网络中间输出生成的嵌入模块输出,获得第二方底端护照嵌入模块输出。
251.进一步地,所述第二方护照嵌入模块包括第二方护照嵌入层和第二方模块神经网络层,步骤h22还包括:
252.基于所述第二方模块神经网络层,将所述第二方第一方底端网络中间输出映射为第二方待嵌入输出,并将所述第二方待嵌入护照样本映射为第二方待嵌入护照,进而基于所述第二方护照嵌入层中的护照嵌入函数,将所述第二方待嵌入护照转换为第二方嵌入护照参数,进而基于所述第二方嵌入护照参数,对所述第二方待嵌入输出进行护照嵌入,获得所述第二方底端护照嵌入模块输出,其中,生成所述第二方底端护照嵌入模块输出的过程具体如下:
253.x=γ*x
t

254.其中,x为所述第二方底端护照嵌入模块输出,x
t
为所述第二方待嵌入输出,γ和β为所述第二方护照嵌入参数。
255.步骤h23,基于所述第二方底端神经网络中处于所述第二方护照嵌入模块之后的第二部分第二方底端神经网络,将所述第二方底端护照嵌入模块输出转换为所述具有护照嵌入的第二方中间输出。
256.在本实施例中,需要说明的是,所述第二部分第二方底端神经网络为所述第二方底端神经网络中将所述第二方护照嵌入模块的输出作为输入的部分神经网络,用于所述第二方护照嵌入模块的输出转换为所述第二方中间输出。
257.具体地,基于所述第二方底端神经网络中处于所述第二方护照嵌入模块之后的第二部分第二方底端神经网络,将所述第二方底端护照嵌入模块输出映射为所述具有护照嵌入的第二方中间输出。
258.步骤h30,将所述第二方中间输出发送至第一方,以供所述第一方基于各所述第二方发送的第二方中间输出、所述第二方待预测样本对应的第一方待预测样本、预设第一方底端护照数据和预设第一方顶端护照数据,通过基于所述预设第一方底端护照数据进行联邦学习构建的第一方底端特征提取模型以及基于所述预设第一方顶端护照数据进行联邦学习构建的顶端预测模型,生成目标预测结果。
259.在本实施例中,具体地,将所述第二方中间输出发送至第一方,以供所述第一方基于第一方底端特征提取模型,将第一方待预测样本和预设第一方底端护照数据共同转换为第一方中间输出,进而第一方将第一方中间输出和各第二方发送的第二方中间输出聚合,
获得聚合中间输出,进而第一方基于顶端预测模型,将所述聚合中间输出和所述预设第一方顶端护照数据共同转换为目标预测结果,其中,所述第一方生成第一方中间输出以及目标预测结果的具体过程可参照步骤c10至步骤c40中的具体内容,在此不再赘述。
260.其中,在所述基于所述预设第二方底端护照数据进行联邦学习构建的第二方底端特征提取模型,将所述第二方待预测样本和所述预设第二方底端护照数据共同转换为具有护照嵌入的第二方中间输出的步骤之前,所述联邦预测优化方法还包括:
261.步骤m10,获取待训练第二方底端特征提取模型,并提取第二方训练样本;
262.在本实施例中,需要说明的是,所述第一方中设置有待训练第一方底端特征提取模型与待训练顶端预测模型以及具备预设真实标签的第一方训练样本,所述第二方中设置有待训练第二方底端特征提取模型以及无样标签的第二方训练样本,其中,所述待训练第一方底端特征提取模型为第一方中未训练好的第一方底端特征提取模型,用于将第一方中的训练样本转换为具有护照嵌入的中间输出,所述待训练第二方底端特征提取模型为第二方中未训练好的第二方底端特征提取模型,用于将第二方中的训练样本转换为具有护照嵌入的中间输出,所述待训练顶端预测模型为第一方中未训练好的顶端预测模型,用于将待训练第一底端特征提取模型的输出与各待训练第二底端特征提取模型的输出的聚合结果转换为输出预测标签,所述预设真实标签为所述第一方待训练样本的标识,用于标识第一方待训练样本的类别或者属性等信息。
263.步骤m20,基于所述待训练第二方底端特征提取模型,将所述第二方训练样本与所述预设第二方底端护照数据转换为第二方训练中间输出;
264.在本实施例中,需要说明的是,所述预设第二方底端护照数据至少包括一第二方待嵌入护照样本,其中,所述第二方待嵌入护照样本为预先设置好的用于在所述待训练第二方底端特征提取模型中进行护照嵌入的样本,其中,所述第二方待嵌入护照样本可以为图片样本、文字样本或者特定的编码矩阵等,所述待训练第二方底端特征提取模型中至少包括一待训练第二方护照嵌入模块,用于将所述第二方待嵌入护照样本嵌入所述第二方训练样本的模型中间输出,并与所述第二方训练样本共同转换为模型最终输出,其中,所述模型中间输出为模型的中间网络层的输出,所述模型最终输出为模型的输出层产生的输出,例如,假设神经网络模型a包括一输入层、10个隐藏层和一输出层,则输入层的输出与10个隐藏层的输出均为所述模型中间输出。
265.具体地,将所述第二方训练样本和所述预设第二方底端护照数据输入待训练第二方底端特征提取模型后,通过所述待训练第二方底端特征提取模型中各待训练第二方护照嵌入模块,分别将各所述待训练第二方护照嵌入模块对应的第二方待嵌入护照样本嵌入所述第二方训练样本对应的模型中间输出,并在模型预测执行完毕后,由所述待训练第二方底端特征提取模型的输出层输出具有护照嵌入的第二方训练中间输出,例如,假设所述待训练第二方底端特征提取模型包括2个待训练第二方护照嵌入模块a和b,其中,待训练第二方护照嵌入模块a设置于待训练第二方底端特征提取模型的第3层隐藏层与第4层隐藏层之间,则通过待训练第二方护照嵌入模块a,在第3层隐藏层的3层输出中嵌入a对应的第二方待嵌入护照样本,并将嵌入a对应的第二方待嵌入护照样本后的3层输出作为第4层隐藏层的输入,而待训练第二方护照嵌入模块b设置于待训练第二方底端特征提取模型的第40层隐藏层与第41层隐藏层之间,则通过待训练第二方护照嵌入模块b,在第40层隐藏层的40层
输出中嵌入b对应的第二方待嵌入护照样本,并将嵌入b对应的第二方待嵌入护照样本后的40层输出作为第41层隐藏层的输入,最后由所述待训练第二方底端特征提取模型的输出层输出第二方训练中间输出,其中,生成所述第二方训练中间输出的具体过程可参照步骤d21至步骤d23中的具体内容,在此不再赘述。
266.步骤m30,将所述第二方训练中间输出发送至第一方,以供所述第一方聚合各所述第二方发送的第二方训练中间输出,以及基于所述第一方训练样本与所述预设第一方底端护照数据转换得到的第一方训练中间输出,获得聚合训练中间输出,并基于所述聚合训练中间输出和所述预设第一方顶端护照数据转换得到的输出预测标签,以及所述第一方训练样本对应的预设真实标签,计算模型总损失;
267.在本实施例中,具体地,将所述第二方训练中间输出发送至第一方,以供所述第一方对生成的第一方训练输出和各第二方发送的第二方训练中间输出进行聚合,获得聚合训练中间输出,进而依据待训练顶端预测模型,将所述聚合训练中间输出和预设第一方顶端护照数据共同转换为输出预测标签,进而基于所述输出预测标签和预设真实标签,计算模型总损失,并进而第一方基于所述模型总损失,优化待训练第一方底端特征提取模型和待训练顶端预测模型,获得第一方底端特征提取模型和顶端预测模型,并计算针对于各第二方训练中间输出的各第二方梯度,进而第一方将各所述第二方梯度分别发送至各自对应的第二方,其中,所述第一方生成第一方训练中间输出和生成模型总损失、构建第一方底端特征提取模型以及构建顶端预测模型的具体过程可参照步骤s10至步骤s40及其细化步骤中的内容,在此不再赘述。
268.步骤m40,接收所述第一方发送的模型总损失相对于所述第二方训练中间输出的第二方梯度,并基于所述第二方梯度,优化所述待训练第二方底端特征提取模型,获得第二方底端特征提取模型。
269.在本实施例中,具体地,接收所述第一方发送的模型总损失相对于所述第二方训练中间输出的第二方梯度,接收所述第一方发送的模型总损失相对于所述第二方训练中间输出的第二方梯度,并基于所述第二方梯度,更新所述待训练第二方底端特征提取模型,并判断更新后的待训练第二方底端特征提取模型是否满足预设训练结束条件,若更新后的待训练第二方底端特征提取模型满足预设训练结束条件,则将所述待训练第二方底端特征提取模型作为所述第二方底端特征提取模型,若更新后的待训练第二方底端特征提取模型不满足预设训练结束条件,则返回执行所述提取第二方训练样本的步骤。
270.本申请实施例提供了一种联邦预测优化方法,其中,首先获取第二方待预测样本和预设第二方底端护照数据,进而基于所述预设第二方底端护照数据进行联邦学习构建的第二方底端特征提取模型,将所述第二方待预测样本和所述预设第二方底端护照数据共同转换为具有护照嵌入的第二方中间输出,进而将所述第二方中间输出发送至第一方,以供所述第一方基于各所述第二方发送的第二方中间输出、所述第二方待预测样本对应的第一方待预测样本、预设第一方底端护照数据和预设第一方顶端护照数据,通过基于所述预设第一方底端护照数据进行联邦学习构建的第一方底端特征提取模型以及基于所述预设第一方顶端护照数据进行联邦学习构建的顶端预测模型,生成目标预测结果,进而第一方可将目标预测结果反馈至各第二方,其中,虽然所述第二方中间输出仍然为明文数据,但是第二方中间输出嵌入了预设第二方底端护照数据,所以在第一方未持有预设第二方底端护照
数据的情况下,第一方无法根据第二方中间输出反推出第二方的隐私数据,实现了在保护数据隐私的同时,在明文状态下执行联邦学习过程中的数据计算过程的目的,进而相比于基于同态加密或者多方安全计算的联邦预测的方式,减小了联邦预测过程中的数据计算复杂度,且避免了大量的数据加解密过程,所以,提升了联邦预测时的计算效率。
271.参照图8,图8是本申请实施例方案涉及的硬件运行环境的设备结构示意图。
272.如图8所示,该联邦学习建模优化设备可以包括:处理器1001,例如cpu,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non

volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
273.可选地,该联邦学习建模优化设备还可以包括矩形用户接口、网络接口、摄像头、rf(radio frequency,射频)电路,传感器、音频电路、wifi模块等等。矩形用户接口可以包括显示屏(display)、输入子模块比如键盘(keyboard),可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如wi

fi接口)。
274.本领域技术人员可以理解,图8中示出的联邦学习建模优化设备结构并不构成对联邦学习建模优化设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
275.如图8所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及联邦学习建模优化程序。操作系统是管理和控制联邦学习建模优化设备硬件和软件资源的程序,支持联邦学习建模优化程序以及其它软件和/或,程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与联邦学习建模优化系统中其它硬件和软件之间通信。
276.在图8所示的联邦学习建模优化设备中,处理器1001用于执行存储器1005中存储的联邦学习建模优化程序,实现上述任一项所述的联邦学习建模优化方法的步骤。
277.本申请联邦学习建模优化设备具体实施方式与上述联邦学习建模优化方法各实施例基本相同,在此不再赘述。
278.参照图9,图9是本申请实施例方案涉及的硬件运行环境的设备结构示意图。
279.如图9所示,该联邦预测优化设备可以包括:处理器1001,例如cpu,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non

volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
280.可选地,该联邦预测优化设备还可以包括矩形用户接口、网络接口、摄像头、rf(radio frequency,射频)电路,传感器、音频电路、wifi模块等等。矩形用户接口可以包括显示屏(display)、输入子模块比如键盘(keyboard),可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如wi

fi接口)。
281.本领域技术人员可以理解,图9中示出的联邦预测优化设备结构并不构成对联邦预测优化设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
282.如图9所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通
信模块以及联邦预测优化程序。操作系统是管理和控制联邦预测优化设备硬件和软件资源的程序,支持联邦预测优化程序以及其它软件和/或,程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与联邦预测优化系统中其它硬件和软件之间通信。
283.在图9所示的联邦预测优化设备中,处理器1001用于执行存储器1005中存储的联邦预测优化程序,实现上述任一项所述的联邦预测优化方法的步骤。
284.本申请联邦预测优化设备具体实施方式与上述联邦预测优化方法各实施例基本相同,在此不再赘述。
285.本申请实施例还提供一种联邦学习建模优化装置,所述联邦学习建模优化装置应用于第一方,所述联邦学习建模优化装置包括:
286.提取模块,用于获取待训练第一方底端特征提取模型和待训练顶端预测模型,并提取第一方待训练样本和所述第一方训练样本对应的预设真实标签;
287.转换模块,用于基于所述待训练第一方底端特征提取模型,将所述第一方训练样本和预设第一方底端护照数据共同转换为具有护照嵌入的第一方训练中间输出;
288.计算模块,用于基于所述第一方训练中间输出、所述预设真实标签、预设第一方顶端护照数据以及所述待训练顶端预测模型,通过与各第二方进行联邦交互,联合各所述第二方生成的具有护照嵌入的第二方训练中间输出,计算所述待训练顶端预测模型对应的模型总损失,其中,所述第二方训练中间输出由所述第二方获取的待训练第二方底端特征提取模型,对预设第二方底端护照数据和所述第一方训练样本对应的第二方训练样本进行转换得到;
289.优化模块,用于基于所述模型总损失,优化所述待训练第一方底端特征提取模型和所述待训练顶端预测模型,获得第一方底端特征提取模型和顶端预测模型。
290.可选地,所述计算模块还用于:
291.接收各所述第二方发送的具有护照嵌入的第二方训练中间输出;
292.对所述第一方训练中间输出和各所述第二方训练中间输出进行聚合,获得聚合训练中间输出;
293.通过所述待训练顶端预测模型,将所述聚合训练中间输出和所述预设第一方顶端护照数据共同转换为输出预测标签;
294.基于所述输出预测标签和所述预设真实标签,计算所述模型总损失。
295.可选地,所述计算模块还用于:
296.基于所述待训练顶端神经网络中处于所述待训练顶端护照嵌入模块之前的第一部分待训练顶端神经网络,将所述聚合训练中间输出转换为待训练顶端网络中间输出;
297.基于所述待训练顶端护照嵌入模块,将所述待训练顶端网络中间输出和所述顶端护照嵌入样本共同转换为待训练顶端护照嵌入模块输出;
298.基于所述待训练顶端神经网络中处于所述待训练顶端护照嵌入模块之后的第二部分待训练顶端神经网络,将所述待训练顶端护照嵌入模块输出转换为所述输出预测标签。
299.可选地,所述计算模块还用于:
300.基于所述待训练顶端模块神经网络层,将所述待训练网络中间输出线性变换为待
嵌入训练网络层输出,以及将所述顶端护照嵌入样本线性变换为待嵌入护照;
301.基于所述第一方护照嵌入层中的护照函数,将所述待嵌入护照转换为护照嵌入参数;
302.基于所述待嵌入训练网络层输出和所述护照嵌入参数,生成所述待训练顶端护照嵌入模块输出。
303.可选地,所述计算模块还用于:
304.基于所述待训练第一方底端神经网络中处于所述待训练第一方护照嵌入模块之前的第一部分待训练第一方底端神经网络,将所述第一方训练样本转换为待训练第一方底端网络中间输出;
305.基于所述待训练第一方护照嵌入模块,将所述待训练第一方底端网络中间输出和所述第一方待嵌入护照样本共同转换为待训练第二方底端护照嵌入模块输出;
306.基于所述待训练第一方底端神经网络中处于所述待训练第一方护照嵌入模块之后的第二部分待训练第一方底端神经网络,将所述待训练第二方底端护照嵌入模块输出转换为所述第一方训练中间输出。
307.可选地,所述联邦学习建模优化装置还用于:
308.计算所述模型总损失相对于各所述第二方训练中间输出的第二方梯度;
309.将各所述第二方梯度分别发送至各自对应的第二方,以供所述第二方基于所述第二方梯度,优化所述待训练第二方底端特征提取模型,获得第二方底端特征提取模型。
310.可选地,所述联邦学习建模优化装置还用于:
311.获取第一方待预测样本,并基于所述第一方底端特征提取模型,将所述第一方待预测样本和所述预设第一方底端护照数据共同转换为具有护照嵌入的第一方中间输出;
312.接收各所述第二方发送的具有护照嵌入的第二方中间输出,其中,所述第二方中间输出由所述第二方基于所述第二方底端特征提取模型,对所述预设第二方底端护照数据和所述第一方待预测样本对应的第二方待预测样本进行转换得到;
313.对所述第一方中间输出和各所述第二方中间输出进行聚合,获得聚合中间输出;
314.基于所述顶端预测模型,将所述聚合中间输出和所述预设第一方顶端护照数据共同转换为目标预测结果。
315.本申请联邦学习建模优化装置的具体实施方式与上述联邦学习建模优化方法各实施例基本相同,在此不再赘述。
316.本申请实施例还提供一种联邦学习建模优化装置,所述联邦学习建模优化装置应用于第二方,所述联邦学习建模优化装置包括:
317.提取模块,用于获取待训练第二方底端特征提取模型,并提取第二方训练样本;
318.转换模块,用于基于所述待训练第二方底端特征提取模型,将所述第二方训练样本与预设第二方底端护照数据转换为第二方训练中间输出;
319.计算模块,用于将所述第二方训练中间输出发送至第一方,以供所述第一方聚合各所述第二方发送的第二方训练中间输出,以及基于第一方训练样本与预设第一方底端护照数据转换得到的第一方训练中间输出,获得聚合训练中间输出,并基于所述聚合训练中间输出和预设第一方顶端护照数据转换得到的输出预测标签,以及所述第一方训练样本对应的预设真实标签,计算模型总损失;
320.优化模块,用于接收所述第一方发送的模型总损失相对于所述第二方训练中间输出的第二方梯度,并基于所述第二方梯度,优化所述待训练第二方底端特征提取模型,获得第二方底端特征提取模型。
321.可选地,所述转换模块还用于:
322.基于所述待训练第二方底端神经网络中处于所述待训练第二方护照嵌入模块之前的第一部分待训练第二方底端神经网络,将所述第二方训练样本转换为待训练第二方底端网络中间输出;
323.基于所述待训练第二方护照嵌入模块,将所述待训练第二方底端网络中间输出和所述第二方待嵌入护照样本共同转换为待训练第二方底端护照嵌入模块输出;
324.基于所述待训练第二方底端神经网络中处于所述待训练第二方护照嵌入模块之后的第二部分待训练第二方底端神经网络,将所述待训练第二方底端护照嵌入模块输出转换为所述第二方训练中间输出。
325.可选地,所述联邦学习建模优化装置还用于:
326.获取第二方待预测样本,并基于所述第二方底端特征提取模型,将所述第二方待预测样本和所述预设第二方底端护照数据共同转换为具有护照嵌入的第二方中间输出;
327.将所述第二方中间输出发送至第一方,以供所述第一方基于各所述第二方发送的第二方中间输出、所述第二方待预测样本对应的第一方待预测样本、所述预设第一方底端护照数据和所述预设第一方顶端护照数据,通过基于所述预设第一方底端护照数据进行联邦学习构建的第一方底端特征提取模型以及基于所述预设第一方顶端护照数据进行联邦学习构建的顶端预测模型,生成目标预测结果。
328.本申请联邦学习建模优化装置的具体实施方式与上述联邦学习建模优化方法各实施例基本相同,在此不再赘述。
329.本申请实施例还提供一种联邦预测优化装置,所述联邦预测优化装置应用于第一方,所述联邦预测优化装置包括:
330.获取模块,用于获取第一方待预测样本、预设第一方底端护照数据和预设第一方顶端护照数据;
331.第一转换模块,用于基于所述预设第一方底端护照数据进行联邦学习构建的第一方底端特征提取模型,将所述第一方待预测样本和所述预设第一方底端护照数据共同转换为具有护照嵌入的第一方中间输出;
332.接收模块,用于接收各第二方发送的具有护照嵌入的第二方中间输出,其中,所述第二方中间输出由所述第二方基于预设第二方底端护照数据进行联邦学习构建的第二方底端特征提取模型,对所述预设第二方底端护照数据和所述第一方待预测样本对应的第二方待预测样本进行转换得到;
333.聚合模块,用于对所述第一方护照嵌入中间输出和各所述第二方护照嵌入中间输出进行聚合,获得聚合护照嵌入中间输出;
334.第二转换模块,用于基于所述预设第一方顶端护照数据进行联邦学习构建的顶端预测模型,将所述聚合护照嵌入中间输出和所述预设第一方顶端护照数据转换为目标预测结果。
335.可选地,所述第一转换模块还用于:
336.基于所述第一方底端神经网络中处于所述第一方护照嵌入模块之前的第一部分第一方底端神经网络,将所述第一方待预测样本转换为第一方底端网络中间输出;
337.基于所述第一方护照嵌入模块,将所述第一方底端网络中间输出和所述第一方待嵌入护照样本共同转换为第一方底端护照嵌入模块输出;
338.基于所述第一方底端神经网络中处于所述第一方护照嵌入模块之后的第二部分第一方底端神经网络,将所述第一方底端护照嵌入模块输出转换为所述具有护照嵌入的第一方中间输出。
339.可选地,所述第一转换模块还用于:
340.基于所述第一方模块神经网络层,将所述第一方底端网络中间输出线性变换为待嵌入网络层输出,以及将所述第一方待嵌入护照样本线性变换为待嵌入护照;
341.基于所述第一方护照嵌入层中的护照函数,将所述待嵌入护照转换为护照嵌入参数;
342.基于所述待嵌入网络层输出和所述护照嵌入参数,生成所述第二方底端护照嵌入模块输出。
343.可选地,所述第二转换模块还用于:
344.基于所述顶端神经网络中处于所述顶端网络护照嵌入模块之前的第一部分顶端神经网络,将所述聚合护照嵌入中间输出转换为顶端网络层中间输出;
345.基于所述顶端护照嵌入模块,将所述顶端网络层中间输出和所述顶端护照嵌入样本共同转换为顶端护照嵌入模块输出;
346.基于所述顶端神经网络中处于所述顶端网络护照嵌入模块之后的第二部分顶端神经网络,将所述顶端护照嵌入模块输出转换为所述目标预测结果。
347.可选地,所述联邦预测优化装置还包括:
348.获取待训练第一方底端特征提取模型和待训练顶端预测模型,并提取第一方待训练样本和所述第一方训练样本对应的预设真实标签;
349.基于所述待训练第一方底端特征提取模型,将所述第一方训练样本和预设第一方底端护照数据共同转换为具有护照嵌入的第一方训练中间输出;
350.基于所述第一方训练中间输出、所述预设真实标签、预设第一方顶端护照数据以及所述待训练顶端预测模型,通过与各第二方进行联邦交互,联合各所述第二方生成的具有护照嵌入的第二方训练中间输出,计算所述待训练顶端预测模型对应的模型总损失,其中,所述第二方训练中间输出由所述第二方获取的待训练第二方底端特征提取模型,对预设第二方底端护照数据和所述第一方训练样本对应的第二方训练样本进行转换得到;
351.基于所述模型总损失,优化所述待训练第一方底端特征提取模型和所述待训练顶端预测模型,获得第一方底端特征提取模型和顶端预测模型。
352.可选地,所述联邦预测优化装置还包括:
353.接收各所述第二方发送的具有护照嵌入的第二方训练中间输出;
354.对所述第一方训练中间输出和各所述第二方训练中间输出进行聚合,获得聚合训练中间输出;
355.通过所述待训练顶端预测模型,将所述聚合训练中间输出和所述预设第一方顶端护照数据共同转换为输出预测标签;
356.基于所述输出预测标签和所述预设真实标签,计算所述模型总损失。
357.可选地,所述联邦预测优化装置还包括:
358.计算所述模型总损失相对于各所述第二方训练中间输出的第二方梯度;
359.将各所述第二方梯度分别发送至各自对应的第二方,以供所述第二方基于所述第二方梯度,优化所述待训练第二方底端特征提取模型,获得第二方底端特征提取模型。
360.本申请联邦预测优化装置的具体实施方式与上述联邦预测优化方法各实施例基本相同,在此不再赘述。
361.本申请实施例还提供一种联邦预测优化装置,所述联邦预测优化装置应用于第二方,所述联邦预测优化装置包括:
362.获取模块,用于获取第二方待预测样本和预设第二方底端护照数据;
363.转换模块,用于基于所述预设第二方底端护照数据进行联邦学习构建的第二方底端特征提取模型,将所述第二方待预测样本和所述预设第二方底端护照数据共同转换为具有护照嵌入的第二方中间输出;
364.发送模块,用于将所述第二方中间输出发送至第一方,以供所述第一方基于各所述第二方发送的第二方中间输出、所述第二方待预测样本对应的第一方待预测样本、预设第一方底端护照数据和预设第一方顶端护照数据,通过基于所述预设第一方底端护照数据进行联邦学习构建的第一方底端特征提取模型以及基于所述预设第一方顶端护照数据进行联邦学习构建的顶端预测模型,生成目标预测结果。
365.可选地,所述转换模块还用于:
366.基于所述第二方底端神经网络中处于所述第二方护照嵌入模块之前的第一部分第二方底端神经网络,将所述第二方待预测样本转换为第二方第一方底端网络中间输出;
367.基于所述第二方护照嵌入模块,将所述第二方第一方底端网络中间输出和所述第二方待嵌入护照样本共同转换为第二方底端护照嵌入模块输出;
368.基于所述第二方底端神经网络中处于所述第二方护照嵌入模块之后的第二部分第二方底端神经网络,将所述第二方底端护照嵌入模块输出转换为所述具有护照嵌入的第二方中间输出。
369.可选地,所述联邦预测优化装置还用于:
370.获取待训练第二方底端特征提取模型,并提取第二方训练样本;
371.基于所述待训练第二方底端特征提取模型,将所述第二方训练样本与所述预设第二方底端护照数据转换为第二方训练中间输出;
372.将所述第二方训练中间输出发送至第一方,以供所述第一方聚合各所述第二方发送的第二方训练中间输出,以及基于所述第一方训练样本与所述预设第一方底端护照数据转换得到的第一方训练中间输出,获得聚合训练中间输出,并基于所述聚合训练中间输出和所述预设第一方顶端护照数据转换得到的输出预测标签,以及所述第一方训练样本对应的预设真实标签,计算模型总损失;
373.接收所述第一方发送的模型总损失相对于所述第二方训练中间输出的第二方梯度,并基于所述第二方梯度,优化所述待训练第二方底端特征提取模型,获得第二方底端特征提取模型。
374.本申请联邦预测优化装置的具体实施方式与上述联邦预测优化方法各实施例基
本相同,在此不再赘述。
375.本申请实施例提供了一种介质,所述介质为可读存储介质,且所述可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的联邦学习建模优化方法的步骤。
376.本申请可读存储介质具体实施方式与上述联邦学习建模优化方法各实施例基本相同,在此不再赘述。
377.本申请实施例提供了一种介质,所述介质为可读存储介质,且所述可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的联邦预测优化优化方法的步骤。
378.本申请可读存储介质具体实施方式与上述联邦预测优化优化方法各实施例基本相同,在此不再赘述。
379.本申请实施例提供了一种产品,所述产品为计算机程序产品,且所述计算机程序产品包括有一个或者一个以上计算机程序,所述一个或者一个以上计算机程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的联邦学习建模优化方法的步骤。
380.本申请计算机程序产品具体实施方式与上述联邦学习建模优化方法各实施例基本相同,在此不再赘述。
381.本申请实施例提供了一种产品,所述产品为计算机程序产品,且所述计算机程序产品包括有一个或者一个以上计算机程序,所述一个或者一个以上计算机程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的联邦预测优化方法的步骤。
382.本申请计算机程序产品具体实施方式与上述联邦预测优化方法各实施例基本相同,在此不再赘述。
383.以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1