数据处理方法、装置、设备及存储介质与流程

文档序号:37158115发布日期:2024-02-26 17:22阅读:15来源:国知局
数据处理方法、装置、设备及存储介质与流程

本申请属于数据处理,尤其涉及一种数据识别方法、装置、设备及存储介质。


背景技术:

1、随着互联网资源交易的普及,单一平台的数据资源难以支持该平台所有的服务需求,新的服务需求促使平台寻找跨机构的参与方,借此引入参与方数据以训练平台本地的全局数据模型,实现多个平台间的有效合作。

2、在相关技术中,由于一些平台的审核门槛较低且泄露隐私数据带来的巨大利益,恶意数据提供方出现的可能性正在逐步增加,若平台引入了恶意数据提供方的数据,则会影响本地全局数据模型的准确性,造成平台损失。


技术实现思路

1、本申请实施例提供一种数据处理方法、装置、设备及存储介质,能够解决相关技术中无法识别恶意数据提供方,增加平台损失的问题。

2、第一方面,本申请实施例提供一种数据处理方法,该方法可以包括:

3、接收数据提供方发送的局部数据模型;

4、通过局部数据模型,更新数据应用方的第一全局数据模型,得到第二全局数据模型;

5、基于数据应用方的锚样本,计算锚样本与第一全局数据模型对应的第一锚样本损失值和锚样本与第二全局数据模型对应的第二锚样本损失值,锚样本用于表征数据应用方在n个数据类别中的第i个数据类别的数据特征,i∈[1,n];

6、根据第一锚样本损失值和第二锚样本损失值,生成数据提供方的评价数据,评价数据用于确定数据提供方是否为恶意数据提供方。

7、第二方面,本申请实施例提供一种数据处理装置,该装置可以包括:

8、接收模块,用于接收数据提供方发送的局部数据模型;

9、更新模块,用于通过局部数据模型,更新数据应用方的第一全局数据模型,得到第二全局数据模型;

10、计算模块,用于基于数据应用方的锚样本,计算锚样本与第一全局数据模型对应的第一锚样本损失值和锚样本与第二全局数据模型对应的第二锚样本损失值,锚样本用于表征数据应用方在n个数据类别中的第i个数据类别的数据特征,i∈[1,n];

11、生成模型,用于根据第一锚样本损失值和第二锚样本损失值,生成数据提供方的评价数据,评价数据用于确定数据提供方是否为恶意数据提供方。

12、第三方面,本申请实施例提供了一种计算机设备,该计算机设备包括:处理器以及存储有计算机程序指令的存储器;

13、处理器执行计算机程序指令时实现如第一方面所示的数据处理方法。

14、第四方面,本申请实施例提供了一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面所示的数据处理方法。

15、第五方面,本申请实施例提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现如第一方面所示的数据处理方法。

16、第六方面,本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面所示的数据处理方法。

17、本申请实施例的数据处理方法、装置、设备及存储介质,在接收到数据提供方发送的局部数据模型时,可以通过局部数据模型,更新数据应用方的第一全局数据模型,得到第二全局数据模型,接着,基于数据应用方中用于表征数据应用方在n个数据类别中的第i个数据类别的数据特征的锚样本,计算锚样本与第一全局数据模型对应的第一锚样本损失值和锚样本与第二全局数据模型对应的第二锚样本损失值,然后,根据第一锚样本损失值和第二锚样本损失值,生成数据提供方的评价数据,评价数据用于确定数据提供方是否为恶意数据提供方。这样,数据应用方可以在横向逻辑回归联合建模中结合本地第一全局数据模型以及通过数据提供方提供的用于与数据应用方进行联合建模的局部数据模型,独立评估数据提供方提供的局部数据模型对于数据应用方不同数据类别的自有样本区分性,从而完成对数据提供方是否是恶意数据提供方的判定,无需数据参与额外传输其他验证信息比如训练局部数据模型的样本和方式,即可由数据应用方完成对数据提供方的检测,在减少了数据提供方数据信息暴露的同时,还可以减少数据应用方与数据提供方之间的交互频率,提高验证数据提供方是否是恶意数据提供方的效率,如此,在通过评价数据确定数据提供方为恶意数据提供方的情况下,可及时阻断恶意数据提供方对联合建模的影响,避免数据应用方的损失,另外,数据应用方为开展评估所需寻找的锚样本无需与数据提供方协作,在预先在计算第一锚样本损失值和第二锚样本损失值之前完成,不增加额外的计算开销,也不会给数据应用方带来数据安全风险,提高数据应用方数据的安全性。



技术特征:

1.一种数据处理方法,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述数据应用方的锚样本,计算所述锚样本与所述第一全局数据模型对应的第一锚样本损失值和所述锚样本与所述第二全局数据模型对应的第二锚样本损失值之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述y个交易维度的交易数据进行聚类,得到m个交易聚类簇,包括:

4.根据权利要求2所述的方法,其特征在于,所述计算所述第一数据点在所述第i个交易聚类簇中的第一精度值和所述第二数据点在所述第i个交易聚类簇中的第二精度值,包括:

5.根据权利要求2所示的方法,其特征在于,所述根据所述第一精度值和所述第二精度值,从所述m个交易聚类簇中筛选目标数据点作为所述锚样本,包括:

6.根据权利要求5所述的方法,其特征在于,所述基于所述第一交易聚类簇中的目标数据点,生成所述锚样本,包括:

7.根据权利要求6所述的方法,其特征在于,所述方法还包括:

8.根据权利要求1所述的方法,其特征在于,所述基于所述数据应用方的锚样本,计算所述锚样本与所述第一全局数据模型对应的第一锚样本损失值和所述锚样本与所述第二全局数据模型对应的第二锚样本损失值,包括:

9.根据权利要求8所述的方法,其特征在于,所述基于所述数据应用方的锚样本,构建与所述锚样本对应的三元组损失函数,包括:

10.根据权利要求9所述的方法,其特征在于,所述锚样本包括携带第一数据类别标签的第一类锚样本和携带第二数据类别标签的第二类锚样本,所述三元组损失函数包括与所述第一类锚样本对应的第一类三元组损失函数和与所述第二类锚样本对应的第二类三元组损失函数;

11.根据权利要求10所述的方法,其特征在于,所述通过所述三元组损失函数,计算所述锚样本与所述第一全局数据模型对应的第一锚样本损失值以及所述锚样本与所述第二全局数据模型对应的第二锚样本损失值,包括:

12.根据权利要求1所述的方法,其特征在于,所述根据所述第一锚样本损失值和第二锚样本损失值,生成所述数据提供方的评价数据,包括:

13.根据权利要求1所述的方法,其特征在于,所述通过所述局部数据模型,更新数据应用方的第一全局数据模型,得到第二全局数据模型,包括:

14.一种数据处理装置,包括:

15.一种计算机设备,所述设备包括:处理器以及存储有计算机程序指令的存储器;

16.一种存储介质,所述存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-13任意一项所述的数据处理方法。


技术总结
本申请公开了一种数据处理方法、装置、设备及存储介质。该方法包括根据数据提供方提供的局部数据模型,更新数据应用方的第一全局数据模型,得到第二全局数据模型;基于数据应用方在N个数据类别中第i个数据类别的数据特征的锚样本,计算锚样本与第一全局数据模型对应的第一锚样本损失值和与第二全局数据模型对应的第二锚样本损失值;根据第一锚样本损失值和第二锚样本损失值,生成用于确定数据提供方是否为恶意数据提供方的评价数据。如此,数据应用方结合本地第一全局数据模型和数据提供方提供的用于联合建模的局部数据模型,独立评估局部数据模型对于数据应用方不同数据类别的自有样本区分性,以完成对数据提供方是否是恶意数据提供方的判定。

技术研发人员:张远健,周雍恺,丁亚丹,徐照晔,李定洲,彭行翠,高鹏飞
受保护的技术使用者:中国银联股份有限公司
技术研发日:
技术公布日:2024/2/25
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1