一种数据分析方法及装置与流程

文档序号:35778440发布日期:2023-10-21 13:29阅读:27来源:国知局
一种数据分析方法及装置与流程

本技术涉及数据分析,尤其涉及一种数据分析方法及装置。


背景技术:

1、联邦学习是一种由分布式机器学习衍生出的隐私保护技术框架,可以让多个用户在保证各自数据安全的情况下,联合多个用户的数据训练得到一个联邦模型,有效解决因数据孤岛导致训练的模型性能不佳的问题。

2、为了能够融合数据价值,目前现有技术中,通常采用纵向联邦或横向联邦的方式,进行融合数据价值。然而,采用纵向联邦或横向联邦进行融合数据价值的方式,无法实现融合后的数据价值为最大的融合数据价值,从而导致根据训练的模型分析的数据效果较低。


技术实现思路

1、本技术实施例提供一种目标值集合的分析方法及装置,用以提升数据融合价值,从而提升数据分析的效果。

2、第一方面,本技术实施例提供了一种目标值集合的分析方法,包括:第一设备接收来自于多个设备的加密值集合,任一设备对应的加密值集合包括设备的加密值集合中的样本的加密值和/或特征的加密值。第一设备将至少一个第一加密值集合分别与至少一个第二加密值集合进行融合,获得多个第三加密值集合,第一加密值集合是根据第四加密值集合和至少一个第一设备的第五加密值集合获得的,第四加密值集合和第五加密值集合具有相同的目标值集合,任一第二加密值集合是根据第六加密值集合的集合中的多个加密值集合获得的,第六加密值集合的集合中加密值集合均不包括目标值集合,第四加密值集合和第六加密值集合的集合中的加密值集合为来自于多个设备的加密值集合。第一设备根据多个第三加密值集合的数据信息量,从多个第三加密值集合中确定第七加密值集合。第一设备根据第七加密值集合对第五加密值集合的目标值集合对应的样本或特征进行分析。

3、采用该方法,在确保数据融合准确性的基础上,将数据融合的过程标准化,提高数据融合价值,从而提升数据分析的效果。

4、在一种可能的设计中,第一设备将第四加密值集合中的样本的加密值与第五加密值集合中的样本的加密值进行求交,获得第一样本的加密值交集。第一设备将第四加密值集合中的特征的加密值与第五加密值集合中的特征的加密值进行求交,获得第一特征的加密值交集。在第一样本的加密值交集和第一特征的加密值交集满足第一条件时,第一设备将第四加密值集合与第五加密值集合进行融合,获得第一加密值集合。

5、采用该设计,第一设备根据预先设定的规则,对第四加密值集合与第五加密值集合进行融合判定,若满足融合条件,则将两个加密值集合进行融合。该处理过程将数据融合的过程标准化,提高数据融合价值。

6、在一种可能的设计中,第一设备将第六加密值集合的集合中的多个加密值集合的样本的加密值进行求交,获得第二样本的加密值交集。第一设备将第六加密值集合的集合中的多个加密值集合的特征的加密值进行求交,获得第二特征的加密值交集。在第二样本的加密值交集和第二特征的加密值交集满足第二条件时,第一设备将多个加密值集合进行融合,获得第二加密值集合。

7、采用该设计,第一设备根据预先设定的规则,对第六加密值集合的集合中的两个加密值集合进行融合判定,若满足融合条件,则将两个加密值集合进行融合。该处理过程将数据融合的过程标准化,提高数据融合价值。

8、在一种可能的设计中,第三加密值集合的数据信息量是根据第三加密值集合的样本的加密值、样本的加密值的数量、特征的加密值和特征的加密值的数量中的至少一项确定的。

9、采用该设计,根据样本的加密值、样本的加密值的数量、特征的加密值和特征的加密值的数量,可以准确的确定第三加密值集合的信息量。

10、在一种可能的设计中,第一设备将第七加密值集合中的样本的加密值与第八加密值集合中的样本的加密值进行求交,获得第三样本的加密值交集,第八加密值集合为至少一个第二加密值集合中未对应第七加密值集合的第二加密值集合。第一设备将第七加密值集合中的特征的加密值与第八加密值集合中的特征的加密值进行求交,获得第三特征的加密值交集。在第三样本的加密值交集和第三特征的加密值交集满足第三条件时,第一设备将第七加密值集合与第八加密值集合进行融合,获得第九加密值集合。第一设备根据第九加密值集合对第五加密值集合的目标值集合对应的样本或特征进行分析。

11、采用该设计,第一设备可以将第七加密值集合与第八加密值集合进行融合条件判定,若满足融合条件,则将第七加密值集合和第八加密值集合进行融合,获得第九加密值集合,并将第九加密值集合作为分析第五加密值集合的目标值集合的加密值集合,进一步扩大融合数据的价值,从而提高训练模型的性能。

12、在一种可能的设计中,第一设备将第七加密值集合中的样本的加密值与第十加密值集合中的样本的加密值进行求交,获得第四样本的加密值交集,第十加密值集合为不满足第一条件的第四加密值集合、不满足第二条件的第六加密值集合以及不满足第三条件的第八加密值集合中的一个或多个加密值集合。第一设备根据第四样本的加密值交集,将第七加密值集合与第十加密值集合进行融合,获得第十一加密值集合。若第十一加密值集合的数据信息量大于第七加密值集合的数据信息量,则第一设备根据第十一加密值集合对第五加密值集合的目标值集合对应的样本或特征进行分析。

13、采用该设计,第一设备可以将第七加密值集合和第十加密值集合进行融合,获得第十一加密值集合,并将第十一加密值集合与第七加密值集合中数据信息量较高的加密值集合作为分析第五加密值集合的目标值集合的加密值集合,进一步扩大融合数据的价值,从而提高训练模型的性能。

14、第二方面,本技术实施例提供了一种目标值集合的分析装置,包括:通信模块,用于接收来自于多个设备的加密值集合,任一设备对应的加密值集合包括设备的加密值集合中的样本的加密值和/或特征的加密值;

15、处理模块,用于将至少一个第一加密值集合分别与至少一个第二加密值集合进行融合,获得多个第三加密值集合,第一加密值集合是根据第四加密值集合和至少一个第一设备的第五加密值集合获得的,第四加密值集合和第五加密值集合具有相同的目标值集合,任一第二加密值集合是根据第六加密值集合的集合中的多个加密值集合获得的,第六加密值集合的集合中加密值集合均不包括目标值集合,第四加密值集合和第六加密值集合的集合中的加密值集合为来自于多个设备的加密值集合;

16、处理模块,还用于根据多个第三加密值集合的数据信息量,从多个第三加密值集合中确定第七加密值集合;

17、处理模块,还用于根据第七加密值集合对第五加密值集合的目标值集合对应的样本或特征进行分析。

18、在一种可能的设计中,处理模块具体用于,将第四加密值集合中的样本的加密值与第五加密值集合中的样本的加密值进行求交,获得第一样本的加密值交集。将第四加密值集合中的特征的加密值与第五加密值集合中的特征的加密值进行求交,获得第一特征的加密值交集。在第一样本的加密值交集和第一特征的加密值交集满足第一条件时,将第四加密值集合与第五加密值集合进行融合,获得第一加密值集合。

19、在一种可能的设计中,处理模块具体用于,将第六加密值集合的集合中的多个加密值集合的样本的加密值进行求交,获得第二样本的加密值交集。将第六加密值集合的集合中的多个加密值集合的特征的加密值进行求交,获得第二特征的加密值交集。在第二样本的加密值交集和第二特征的加密值交集满足第二条件时,将多个加密值集合进行融合,获得第二加密值集合。

20、在一种可能的设计中,第三加密值集合的数据信息量是根据第三加密值集合的样本的加密值、样本的加密值的数量、特征的加密值和特征的加密值的数量中的至少一项确定的。

21、在一种可能的设计中,处理模块,还用于将第七加密值集合中的样本的加密值与第八加密值集合中的样本的加密值进行求交,获得第三样本的加密值交集,第八加密值集合为至少一个第二加密值集合中未对应第七加密值集合的第二加密值集合。

22、处理模块,还用于将第七加密值集合中的特征的加密值与第八加密值集合中的特征的加密值进行求交,获得第三特征的加密值交集。在第三样本的加密值交集和第三特征的加密值交集满足第三条件时,处理模块,还用于将第七加密值集合与第八加密值集合进行融合,获得第九加密值集合。处理模块,还用于根据第九加密值集合对第五加密值集合的目标值集合对应的样本或特征进行分析。

23、在一种可能的设计中,处理模块,还用于将第七加密值集合中的样本的加密值与第十加密值集合中的样本的加密值进行求交,获得第四样本的加密值交集,第十加密值集合为不满足第一条件的第四加密值集合、不满足第二条件的第六加密值集合以及不满足第三条件的第八加密值集合中的一个或多个加密值集合。处理模块,还用于根据第四样本的加密值交集,将第七加密值集合与第十加密值集合进行融合,获得第十一加密值集合。若第十一加密值集合的数据信息量大于第七加密值集合的数据信息量,处理模块还用于根据第十一加密值集合对第五加密值集合的目标值集合对应的样本或特征进行分析。

24、第三方面,本技术实施例还提供了一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时,实现第一方面和第二方面及其任意一种设计的方法。

25、第四方面,本技术实施例还提供了一种电子设备,包括存储器和处理器,存储器上存储有可在处理器上运行的计算机程序,当计算机程序被处理器执行时,使得处理器实现第一方面和第二方面及其任意一种设计的方法。

26、第二方面至第四方面及其任意一种设计所带来的技术效果可参见第一方面中对应的设计所带来的技术效果,此处不再赘述。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1