公平用户建模方法、系统、设备及存储介质

文档序号:37276206发布日期:2024-03-12 21:10阅读:9来源:国知局
公平用户建模方法、系统、设备及存储介质

本发明涉及机器学习和用户建模,尤其涉及一种公平用户建模方法、系统、设备及存储介质。


背景技术:

1、用户建模是许多应用中的一项基本任务(例如,推荐系统,认知诊断等),其目标是通过分析用户的行为信息(如能力和偏好)来推断潜在特征。来自用户建模的结果作为决策制定的重要依据,可能在某种程度上影响用户的生活。为了缓解用户建模中的不公平现象,目前已经提出了许多方法,如约束优化、对抗学习和正则化方法,其中对抗方法显示出了它们的理论优雅性并受到了广泛关注。虽然这些方法显示出很好的效果,但其中大多数需要明确的敏感属性来指导公平模型训练。然而,在现实世界的情境中,由于隐私问题,用户并不总是愿意分享敏感信息。例如,仅有14%的青少年用户在meta上公开他们的完整个人资料。敏感属性缺失的情况意味着只有已知敏感属性的有限数量的数据能参与模型训练,导致了现有方法存在的训练数据不足问题。最实际的解决方案是利用具有未知敏感属性的数据来促进模型训练。为了实现这一点,最直接的一种方式是基于已知敏感属性的数据来预测缺失的敏感标签,从而利用具有未知敏感属性的数据。然而,这些预测伪标签的准确性不能保证,特别是在极端缺失敏感的情况下。这会导致未知敏感属性数据利用次优的问题,从而导致次优的公平效果。因此如何在缺失敏感属性的场景下,缓解预测伪标签这种方式带来的数据次优问题,最大程度的利用缺失敏感属性的数据以提升用户建模结果的公平性是一个亟待解决的问题。


技术实现思路

1、本发明的目的是提供一种公平用户建模方法、系统、设备及存储介质,可以为用户进行准确公平的建模,公平的用户建模结果能够充分在下游任务中得到应用。

2、本发明的目的是通过以下技术方案实现的:

3、一种公平用户建模方法,包括:

4、构建对抗性学习的框架,框架中包括过滤器与判别器;

5、收集多个用户的用户数据,并根据用户数据将用户划分为已知敏感属性数据的用户与未知敏感属性数据的用户;结合已知敏感属性数据的用户与未知敏感属性数据的用户的用户数据构建过滤器的损失函数,损失函数的训练目标为使过滤器过滤敏感属性;结合已知敏感属性数据的用户的用户数据构建判别器的损失函数,损失函数的训练目标为判别过滤器是否去除敏感属性,结合过滤器的损失函数与判别器的损失函数,通过对抗性学习交替优化过滤器与判别器,获得最终的过滤器;

6、使用任一用户建模模型结合给定用户的用户数据生成原始用户建模结果,再利用所述最终的过滤器过滤所述原始用户建模结果中的敏感属性,获得公平的用户建模结果。

7、一种公平用户建模系统,包括:

8、对抗性学习的框架构建单元,用于构建对抗性学习的框架,框架中包括过滤器与判别器;

9、训练单元,用于收集多个用户的用户数据,并根据用户数据将用户划分为已知敏感属性数据的用户与未知敏感属性数据的用户;结合已知敏感属性数据的用户与未知敏感属性数据的用户的用户数据构建过滤器的损失函数,损失函数的训练目标为使过滤器过滤敏感属性;结合已知敏感属性数据的用户的用户数据构建判别器的损失函数,损失函数的训练目标为判别过滤器是否去除敏感属性,结合过滤器的损失函数与判别器的损失函数,通过对抗性学习交替优化过滤器与判别器,获得最终的过滤器;

10、公平用户建模单元,用于使用任一用户建模模型结合给定用户的用户数据生成原始用户建模结果,再利用所述最终的过滤器过滤所述原始用户建模结果中的敏感属性,获得公平的用户建模结果。

11、一种处理设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序;

12、其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现前述的方法。

13、一种可读存储介质,存储有计算机程序,当计算机程序被处理器执行时实现前述的方法。

14、由上述本发明提供的技术方案可以看出,考虑现实场景中用户敏感数据缺失的问题,充分利用缺失敏感属性的数据去训练过滤器,能够缓解现实场景中敏感属性缺乏的问题,为用户的公平建模提供理论和技术上的保障;最终利用训练得到的过滤器得到准确公平的用户建模结果。



技术特征:

1.一种公平用户建模方法,其特征在于,包括:

2.根据权利要求1所述的一种公平用户建模方法,其特征在于,所述收集多个用户的用户数据,并根据用户数据将用户划分为已知敏感属性数据的用户与未知敏感属性数据的用户包括:

3.根据权利要求1所述的一种公平用户建模方法,其特征在于,所述结合已知敏感属性数据的用户与未知敏感属性数据的用户的用户数据构建过滤器的损失函数包括:

4.根据权利要求1或3所述的一种公平用户建模方法,其特征在于,结合已知敏感属性数据的用户与未知敏感属性数据的用户的用户数据构建过滤器的损失函数包括:

5.根据权利要求4所述的一种公平用户建模方法,其特征在于,该方法还包括:结合下游任务中用户建模损失函数来构建过滤器的损失函数,表示为:

6.根据权利要求1或3所述的一种公平用户建模方法,其特征在于,所述结合已知敏感属性数据的用户的用户数据构建判别器的损失函数包括:

7.根据权利要求1所述的一种公平用户建模方法,其特征在于,所述结合过滤器的损失函数与判别器的损失函数,通过对抗性学习交替优化过滤器与判别器包括:

8.一种公平用户建模系统,其特征在于,包括:

9.一种处理设备,其特征在于,包括:一个或多个处理器;存储器,用于存储一个或多个程序;

10.一种可读存储介质,存储有计算机程序,其特征在于,当计算机程序被处理器执行时实现如权利要求1~7任一项所述的方法。


技术总结
本发明公开了一种公平用户建模方法、系统、设备及存储介质,它们是一一对应的方案,方案中:收集用户数据,并将用户划分为已知敏感属性数据的用户与未知敏感属性数据的用户;结合已知敏感属性数据的用户与未知敏感属性数据的用户的用户数据构建过滤器的损失函数;结合已知敏感属性数据的用户的用户数据构建判别器的损失函数,结合过滤器的损失函数与判别器的损失函数,通过对抗性学习交替优化过滤器与判别器,获得最终的过滤器;利用最终的过滤器过滤原始用户建模结果中的敏感属性,获得公平的用户建模结果。上述方案,充分利用缺失敏感属性的数据去训练过滤器,可以为用户进行准确公平的建模,公平的用户建模结果能够充分在下游任务中得到应用。

技术研发人员:刘淇,陈恩红,张征,蒋皓,黄振亚
受保护的技术使用者:中国科学技术大学
技术研发日:
技术公布日:2024/3/11
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1