联邦学习分类树构建方法、模型构建方法，及终端设备与流程

文档序号：22546335发布日期：2020-10-17 02:16阅读：来源：国知局

技术特征：

1.一种联邦学习分类树构建方法，其特征在于，所述方法由第一数据提供方执行，所述方法包括：

根据第一分类特征和与所述第一分类特征对应的第一分类阈值，将当前的用户样本集合进行分类后，获取至少两组用户样本子集；

按照预设规则向第一子集中添加混淆用户样本，获取经过混淆后的第二子集，其中所述第一子集为所述至少两组用户样本子集中的任一个子集；

根据预获取的与所述第二子集中每一个用户样本对应的一次加密梯度值，计算第一加密梯度值之和；

对所述第二子集中每一个用户样本分别对应的一次加密梯度值进行二次加密后，与所述第二子集共同发送至第二数据提供方；

接收所述第二数据提供方反馈的第二加密梯度值之和，所述第二加密梯度值之和为所述第二数据提供方根据第二分类特征、与所述第二分类特征对应的第二分类阈值、所述第二子集以及所述第二子集中每一个用户样本分别对应的二次加密梯度值计算得到并进行加密的梯度值之和；

对所述第二加密梯度值之和进行一次解密后，与所述第一加密梯度值之和、所述第一分类特征的信息以及所述第一分类阈值的信息共同反馈至所述第二数据提供方；

接收所述第二数据提供方反馈的最优分类特征的信息和与所述最优分类特征对应的最优分类阈值的信息，其中，最优分类特征的信息和最优分类阈值的信息为所述第二数据提供方根据所述第一加密梯度值之和，以及所述第二加密梯度值之和，确定的信息；

根据所述最优分类特征信息和与所述最优分类阈值的信息，对所述第一子集进行分类，形成联邦学习分类树的分支节点；

根据所有分支节点，构建所述联邦学习分类树。

2.根据权利要求1所述的方法，其特征在于，所述第一分类特征、所述第一分类阈值、所述第二分类特征，以及所述第二分类阈值的数量均包括一个或多个。

3.根据权利要求1所述的方法，其特征在于，所述按照预设规则，对所述至少两组用户样本子集中的第一子集中添加混淆用户样本，获取经过混淆后的第二子集，具体包括：

当所述第一子集中用户样本数量低于预设阈值时，从所述用户样本集合中选择部分用户样本作为所述混淆用户样本，加入到所述第一子集中，获取所述第二子集；

或者，当所述第一子集中用户样本数量高于所述预设阈值时，将所述用户样本集合中除所述第一子集外的所有用户样本作为所述混淆用户样本，加入到所述第一子集中，获取所述第二子集。

4.根据权利要求1-3任一项所述的方法，其特征在于，所述第一子集中用户样本对应的一次加密梯度值为：根据所述第一子集中用户样本对应的真实梯度值进行加密后得到的一次加密梯度值；所述混淆用户对应的一次加密梯度值为对预设固定数值进行加密后得到的一次加密梯度值。

5.根据权利要求1-3任一项所述的方法，其特征在于，当前构建的分类树为第t棵树，且t大于1时，所述第一子集中每一个用户样本对应的一次加密梯度值为根据所述第一子集中每一个用户样本对应的实际标签，以及在第t-1棵树中的预测标签计算得出的，且为所述第一数据提供方和第二数据提供方共同计算得出；

或者，当t＝1时，所述第一子集中的每一个用户样本对应的一次加密梯度值为所述第二数据提供方根据所述第一子集中每一个用户样本对应的实际标签计算得出。

6.一种联邦学习分类树构建方法，其特征在于，所述方法由第二数据提供方执行，所述方法包括：

接收第一数据提供方发送的第二子集以及第二子集中每一个用户样本对应的二次加密梯度值；

根据第二分类特征、与所述第二分类特征对应的第二分类阈值、所述第二子集以及所述第二子集中每一个用户样本分别对应的二次加密梯度值，计算相应的梯度值之和后，进行加密得到第二加密梯度值之和；

将所述第二加密梯度值之和反馈至所述第一数据提供方；

接收所述第一数据提供方反馈的第一加密梯度值之和、第一分类特征的信息、第一分类阈值的信息，以及经过一次解密的后的第二加密梯度值之和；

根据所述第一数据提供方反馈的第一加密梯度值之和计算第一增益信息；

根据所述经过一次解密的后的第二加密梯度值之和计算第二增益信息；

从所述第一增益信息和所述第二增益信息中，确定最大的增益信息；

根据所述最大的增益信息，从所述第一分类特征的信息、所述第一分类阈值的信息、所述第二分类特征的信息、以及所述第二分类阈值的信息中匹配最优分类特征的信息，以及所述最优分类特征的最优分类阈值的信息；

将所述最优分类特征的信息以及所述最优分类阈值的信息反馈至所述第一数据提供方。

7.一种联邦学习分类模型构建方法，其特征在于，所述方法包括：根据至少一棵如权利要求1-5任一项所述的方法构建的联邦分类树，组成联邦分类模型。

8.一种终端设备，其特征在于，所述终端设备包括：至少一个处理器和存储器；

所述处理器用于执行所述存储器中存储的联邦学习分类树构建程序，以实现权利要求1-5中任一项所述的联邦学习分类树构建方法，或者执行如权利要求7所述的联邦学习分类模型构建方法。

9.一种终端设备，其特征在于，所述终端设备包括：至少一个处理器和存储器；

所述处理器用于执行所述存储器中存储的联邦学习分类树构建程序，以实现权利要求6中所述的联邦学习分类树构建方法。

10.一种计算机存储介质，其特征在于，所述计算机存储介质存储有一个或者多个程序，所述一个或者多个程序可被如权利要求9所述的终端设备执行，以实现权利要求1～5中任一项所述的联邦学习分类树构建方法，或者执行如权利要求7所述的联邦学习分类模型构建方法。

11.一种计算机存储介质，其特征在于，所述计算机存储介质存储有一个或者多个程序，所述一个或者多个程序可被如权利要求9所述的终端设备执行，以实现权利要求6所述的联邦学习分类树构建方法。

技术总结
本发明实施例涉及一种联邦学习分类树构建方法、模型构建方法，及终端设备，包括：根据第一分类特征和第一分类阈值，将用户样本集合进行分类，获取至少两组用户样本子集；向第一子集中添加混淆用户样本，获取第二子集；计算与第二子集对应的第一加密梯度值之和；对一次加密梯度值进行二次加密后，与第二子集共同发送至第二数据提供方；接收第二加密梯度值之和；对第二加密梯度值之和进行一次解密，与第一加密梯度值之和、第一分类特征的信息以及第一分类阈值的信息反馈至第二数据提供方；接收最优分类特征的信息和与最优分类特征对应的最优分类阈值的信息；根据二者对第一子集进行分类，形成联邦学习分类树的分支节点，构建联邦学习分类树。

技术研发人员：周帅;陈忠;张一凡;王虎;黄志翔;彭南博;程建波
受保护的技术使用者：京东数字科技控股有限公司
技术研发日：2020.06.29
技术公布日：2020.10.16

完整全部详细技术资料下载

当前第2页1 2