1.一种为多个数据方提供数据模型的方法,其中,所述方法包括:
利用所述多个数据方分别提供的用户数据训练第一模型,确定第一模型的多个模型参数;
分别确定各个数据方所提供的用户数据对所述第一模型的各个数据贡献度,其中,单个数据方所提供的用户数据的数据贡献度基于所述第一模型和利用其他数据方所提供的用户数据训练的第二模型确定,所述第一模型和所述第二模型包含相同的算法;
按照各个数据贡献度的大小,确定分别针对各个数据方提供数据模型的各个提供方案,以根据各个提供方案向相应数据方提供所述第一模型。
2.根据权利要求1所述的方法,其中,所述单个数据方所提供的用户数据的数据贡献度,基于测试数据集在第一模型上的评价指标与测试数据集在第二模型上的评价指标的对比结果确定,所述对比结果包括,测试数据集在第一模型上的评价指标与测试数据集在第二模型上的评价指标的差值,或者测试数据集在第一模型上的评价指标与测试数据集在第二模型上的评价指标的比值,所述数据贡献度与所述对比结果正相关。
3.根据权利要求2所述的方法,其中,所述评价指标根据准确度、召回率、误差率中的至少一项确定。
4.根据权利要求1所述的方法,其中,所述提供方案包括对所述第一模型的多个模型参数添加随机扰动,所述多个数据方包括第一数据方,所述按照各个数据贡献度的大小,确定分别针对各个数据方提供第一模型的各个提供方案包括:
按照各个数据贡献度的大小,确定针对所述第一数据方,进行随机扰动的扰动参数;
按照所确定的扰动参数对所述第一模型的多个模型参数添加随机扰动,并将经过随机扰动后的第一模型提供给所述第一数据方。
5.根据权利要求4所述的方法,其中,针对所述第一数据方的随机扰动在所述多个模型参数上的扰动量满足高斯分布,且高斯分布的均值为预定值,方差与所述第一数据方的数值贡献度负相关。
6.根据权利要求1所述的方法,其中,所述提供方案包括单个数据方额外提供的资源份额,所述按照各个数据贡献度的大小,确定分别针对各个数据方提供第一模型的各个提供方案包括:
按照单个数据方的数据贡献度的大小,确定所述单个数据方额外提供的各个资源份额,其中,单个数据方额外提供的资源份额与所述单个数据方对应的数据贡献度负相关。
7.根据权利要求1所述的方法,其中,所述按照各个数据贡献度的大小,确定分别针对各个数据方提供数据模型的各个提供方案包括:
将各个数据贡献度分别与参考数据贡献度进行对比;
根据对比结果确定分别针对各个数据方提供数据模型的各个提供方案。
8.根据权利要求7所述的方法,其中,所述参考数据贡献度是预先设定的参考值,或者各个数据贡献度中的最大值。
9.根据权利要求7所述的方法,其中,单个数据贡献度与所述参考数据贡献度的对比结果包括以下至少一项:
所述参考数据贡献度与单个数据贡献度的差值;
单个数据贡献度与所述参考数据贡献度的比值。
10.一种为多个数据方提供数据模型的装置,其中,所述装置包括:
模型训练单元,配置为利用所述多个数据方分别提供的用户数据训练第一模型,确定第一模型的多个模型参数;
数据质量确定单元,配置为分别确定各个数据方所提供的用户数据对所述第一模型的各个数据贡献度,其中,单个数据方所提供的用户数据的数据贡献度基于所述第一模型和利用其他数据方所提供的用户数据训练的第二模型确定,所述第一模型和所述第二模型包含相同的算法;
模型提供单元,配置为按照各个数据贡献度的大小,确定分别针对各个数据方提供数据模型的各个提供方案,以根据各个提供方案向相应数据方提供所述第一模型。
11.根据权利要求10所述的装置,其中,所述单个数据方所提供的用户数据的数据贡献度,基于测试数据集在第一模型上的评价指标与测试数据集在第二模型上的评价指标的对比结果确定,所述对比结果包括以下之一:测试数据集在第一模型上的评价指标与测试数据集在第二模型上的评价指标的差值、测试数据集在第一模型上的评价指标与测试数据集在第二模型上的评价指标的比值;所述数据贡献度与所述对比结果正相关。
12.根据权利要求11所述的装置,其中,所述评价指标根据准确度、召回率、误差率中的至少一项确定。
13.根据权利要求10所述的装置,其中,所述提供方案包括对所述第一模型的多个模型参数添加随机扰动,所述多个数据方包括第一数据方,所述模型提供单元还配置为:
按照各个数据贡献度的大小,确定针对所述第一数据方,进行随机扰动的扰动参数;
按照所确定的扰动参数对所述第一模型的多个模型参数添加随机扰动,并将经过随机扰动后的第一模型提供给所述第一数据方。
14.根据权利要求13所述的装置,其中,针对所述第一数据方的随机扰动在所述多个模型参数上的扰动量满足高斯分布,且高斯分布的均值为预定值,方差与所述第一数据方的数值贡献度负相关。
15.根据权利要求10所述的装置,其中,所述提供方案包括单个数据方额外提供的资源份额,所述模型提供单元还配置为:
按照单个数据方的数据贡献度的大小,确定所述单个数据方额外提供的各个资源份额,其中,单个数据方额外提供的资源份额与所述单个数据方对应的数据贡献度负相关。
16.根据权利要求10所述的装置,其中,所述模型提供单元还配置为:
将各个数据贡献度分别与参考数据贡献度进行对比,其中,所述参考数据贡献度是预先设定的参考值,或者各个数据贡献度中的最大值;
根据对比结果确定分别针对各个数据方提供数据模型的各个提供方案。
17.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-9中任一项的所述的方法。
18.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-9中任一项所述的方法。