针对推荐系统的用户隐私保护方法、系统、设备及介质

文档序号:34319378发布日期:2023-06-01 00:57阅读:76来源:国知局

本发明涉及信息安全领域,尤其涉及一种针对推荐系统的用户隐私保护方法、系统、设备及介质。


背景技术:

1、推荐系统通过分析用户的私人数据并推断他们的偏好,对用户进行量身定制,以提供个性化的服务。近年来,成员推断(membership inference)被指出,可以被用来保护推荐系统中用户的隐私数据。成员推断旨在通过精心设计的分类模型来确定给定数据是否被目标推荐系统所训练过。通过这个手段,检测者可以判断出目标推荐系统的训练数据,从而判断目标推荐系统是否使用了某些隐私数据。此外,根据通用数据保护条例(gdpr),用户有被遗忘的权利,这意味着推荐系统此时不应该使用这些用户的数据,包括隐私信息与非隐私信息。在这些场景下,成员推断将是一种检测推荐系统是否遵守相关条例、保护用户隐私的有效方法。

2、将经过目标推荐系统训练的用户数据所对应的用户称为成员用户,其他用户则称为非成员用户。大多数推荐系统无法向非成员用户提供个性化的推荐。为此,之前的工作假设目标推荐系统为每个非成员用户推荐最流行的物品。流行物品的计算过程与非成员用户的信息无关。通过比对用户浏览物品与被推荐物品的差异,检测者可以构建一组差异向量。由于成员用户与非成员用户遵循不同的推荐模式,他们的差异向量截然不同,可以作为检测者判断成员与非成员的依据。然而,基于差异向量的检测方法在归纳式推荐系统中失效了。其根本原因在于归纳式推荐系统对非成员与成员用户遵循相同的个性化推荐方式,使得二者差异向量的分歧消失了。

3、有鉴于此,特提出本发明。


技术实现思路

1、本发明的目的是提供一种针对推荐系统的用户隐私保护方法、系统、设备及介质,可以提取目标推荐系统内部更庞大的信息,从而获得更具分辨度的用户特征向量,进而更有效的检测用户隐私是否受到威胁。本发明的目的是通过以下技术方案实现的:

2、一种针对推荐系统的用户隐私保护方法,包括:

3、获取与目标推荐系统训练数据同源的用户数据,形成影子数据集,并获得与所述目标推荐系统交互的权限;

4、利用所述目标推荐系统生成的推荐列表训练一个用于提取所述目标推荐系统内部信息的代理模型;

5、构建与所述目标推荐系统具有相同结构和训练模式的影子模型,将所述影子数据集划分为两部分用户数据,利用第一部分用户数据训练所述影子模型,再将第一部分用户数据与第二部分用户数据分别输入至训练后的影子模型中,并对训练后的影子模型的输出结果进行特征提取,获得第一部分用户数据对应的成员用户特征向量以及第二部分用户数据对应的非成员用户特征向量;

6、利用所述成员用户特征向量与非成员用户特征向量训练一个用于判断成员用户与非成员用户的分类模型;

7、对于当前的用户数据,将其输入至训练后的代理模型,并对代理模型的输出结果进行特征提取,再输入至训练后的分类模型,结合分类模型的判断结果确定所述目标推荐系统是否使用了当前的用户数据。

8、一种针对推荐系统的用户隐私保护系统,该系统包括:

9、数据与权限获取单元,用于获取与目标推荐系统训练数据同源的用户数据,形成影子数据集,并获得与所述目标推荐系统交互的权限;

10、代理模型训练单元,用于利用所述目标推荐系统生成的推荐列表训练一个用于提取所述目标推荐系统内部信息的代理模型;

11、影子模型训练与数据特征提取单元,用于构建与所述目标推荐系统具有相同结构和训练模式的影子模型,将所述影子数据集划分为两部分用户数据,利用第一部分用户数据训练所述影子模型,再将第一部分用户数据与第二部分用户数据分别输入至训练后的影子模型中,并对训练后的影子模型的输出结果进行特征提取,获得第一部分用户数据对应的成员用户特征向量以及第二部分用户数据对应的非成员用户特征向量;

12、分类模型训练单元,用于利用所述成员用户特征向量与非成员用户特征向量训练一个用于判断成员用户与非成员用户的分类模型;

13、用户分类单元,用于对于当前的用户数据,将其输入至训练后的代理模型,并对代理模型的输出结果进行特征提取,再输入至训练后的分类模型,结合分类模型的判断结果确定所述目标推荐系统是否使用了当前的用户数据。

14、一种处理设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序;

15、其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现前述的方法。

16、一种可读存储介质,存储有计算机程序,当计算机程序被处理器执行时实现前述的方法。

17、由上述本发明提供的技术方案可以看出,通过获取目标推荐系统隐藏的内部信息,从而提取了更丰富的用户特征向量,产生了更强大的推断和隐私保护效果,通过代理模型与影子模型,学习了目标推荐系统的内部信息与针对成员用户与非成员用户的预测分歧,同时,通过用户特征生成器来提取用户特征向量,方便后续训练区分成员用户与非成员用户的分类模型,进而更有效的检测用户隐私是否受到威胁。



技术特征:

1.一种针对推荐系统的用户隐私保护方法,其特征在于,包括:

2.根据权利要求1所述的一种针对推荐系统的用户隐私保护方法,其特征在于,所述用户数据包括:用户浏览记录数据;所述第一部分用户数据对应用户为所述影子模型的成员用户,所述第二部分用户数据对应用户为所述影子模型的非成员用户。

3.根据权利要求1或2所述的一种针对推荐系统的用户隐私保护方法,其特征在于,通过用户特征生成器进行特征提取;

4.根据权利要求1所述的一种针对推荐系统的用户隐私保护方法,其特征在于,所述利用所述目标推荐系统生成的推荐列表训练一个用于提取所述目标推荐系统内部信息的代理模型包括:

5.一种针对推荐系统的用户隐私保护系统,其特征在于,包括:

6.根据权利要求5所述的一种针对推荐系统的用户隐私保护系统,其特征在于,所述用户数据包括:用户浏览记录数据;所述第一部分用户数据对应用户为所述影子模型的成员用户,所述第二部分用户数据对应用户为所述影子模型的非成员用户。

7.根据权利要求5或6所述的一种针对推荐系统的用户隐私保护系统,其特征在于,通过用户特征生成器进行特征提取;

8.根据权利要求5所述的一种针对推荐系统的用户隐私保护系统,其特征在于,所述利用所述目标推荐系统生成的推荐列表训练一个用于提取所述目标推荐系统内部信息的代理模型包括:

9.一种处理设备,其特征在于,包括:一个或多个处理器;存储器,用于存储一个或多个程序;

10.一种可读存储介质,存储有计算机程序,其特征在于,当计算机程序被处理器执行时实现如权利要求1~4任一项所述的方法。


技术总结
本发明公开了一种针对推荐系统的用户隐私保护方法、系统、设备及介质,它们是一一对应的方案,方案中:通过获取目标推荐系统隐藏的内部信息,从而提取了更丰富的用户特征向量,产生了更强大的推断和隐私保护效果,通过代理模型与影子模型,学习了目标推荐系统的内部信息与针对成员用户与非成员用户的预测分歧,同时,通过提取用户特征向量,方便后续训练区分成员用户与非成员的分类模型,进而更有效的检测用户隐私是否受到威胁。

技术研发人员:连德富,陈恩红,朱志豪,吴陈旺,范睿
受保护的技术使用者:中国科学技术大学
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1