一种基于联邦学习的用户数据隐私保护方法及系统与流程

文档序号:36705026发布日期:2024-01-16 11:39阅读:33来源:国知局
一种基于联邦学习的用户数据隐私保护方法及系统与流程

本发明涉及智能网联汽车的座舱数据安全和隐私保护技术,具体为一种基于联邦学习的用户数据隐私保护方法及系统。


背景技术:

1、随着车联网、智能座舱技术的迅猛发展,智能汽车越发普及,智能座舱等智能网联设备向云端或边缘端设备发送的信息数据中可能涵盖了车主用户的身份隐私、驾驶行为信息、车辆位置信息、车辆行驶信息如车辆的车速、方向、转向数据,经常出入地点比如家或常用目的地poi(point of interest)信息以及用户操作行为等个人敏感信息。

2、同时,国家层面的数据隐私安全保护法规越来越清晰、严格,受限于用户隐私信息保护等合规问题,车机端敏感数据不能离车或加密离车的需求越来越高。前述各类信息/用户个人数据未来很可能被禁止/限制直接分享给汽车生产厂家或者第三方机构。

3、具体来讲就是,依照法律法规前述各个数据有明确的拥有者,如车辆用户、车辆生产企业、监管机构各自拥有部分数据。对于汽车生产厂家或者第三方机构而言,部分数据(特别是用户数据)属于法规中禁止离开/上传的本地数据,也是用于提升车主体验时不可或缺的数据。

4、现有解决数据安全性问题的方法通常包括:

5、1.通过加密和认证手段将采集到的原始数据直接进行加密传输。

6、该方式中,采集和传输用户数据还是用户原始数据集,并未真正将用户隐私数据保留在车机本地,数据在云端和传输过程中均有泄露或非法滥用的风险。

7、2.采用可信计算环境tee(trusted execution environment)对采集的隐私数据进行加密存储。

8、该方式一般是在云端后台进行脱敏和匿名化处理,但未真正在采集端对用户数据进行处理,未从采集源头上对用户隐私进行脱敏处理

9、上述现有方法,仅考虑到用户数据在联网传输过程中的泄露风险,未解决在保障用户隐私的情况下实现车辆信息共享,同时,满足汽车生产厂商运营或第三方监管机构需求,对用户的本地数据的充分及合理使用问题。


技术实现思路

1、本发明提供一种基于联邦学习的用户数据隐私保护方法和系统,通过联邦系统中加密机制下的参数交换方式,联合建立一个全局的共享模型,建好的模型在各自的区域只为本地的目标服务,达到数据不出本地的协同计算训练目的,并且高动态车辆只需将所训练的模型参数传送到云端或者路侧单元,不需要共享整个原始数据集,从而避免隐私泄露的风险。

2、本发明所述的一种基于联邦学习的用户数据隐私保护方法:

3、s1、先采集车机端数据,将车机端数据按照数据权属、敏感度、抵触程度分为三类:

4、一类车机端数据,是用户个人的敏感隐私数据,这类数据具有高度敏感属性,用户一般会强烈抵触分享;

5、二类车机端数据,是一般用户数据,用户敏感度较低,用户不抵触分享;

6、三类车机端数据,是车辆行驶数据;

7、s2、依据车机端数据所述种类,采用相应策略进行处理:

8、对于二类车机端数据和三类车机端数据,采用安全加密方式从车机端传递到云端或第三方监管端,云端可通过加密信道完全获取车机端采集到的原始数据信息;

9、对于一类车机端数据,结合可信执行环境的本地化安全存储技术,只存储在车机端本地;

10、车机端通过联邦学习计算框架利用已经存储的车机端模型,结合一类车机端数据进行模型训练,并向云端提交训练后的车机端模型;

11、云端将其接收的训练后的车机端模型与云端模型进行聚合,云端对聚合后的模型进行大数据运算。

12、本发明将车机端数据按照用户权限分成三类,对三类数据采用不同的处理策略,其中,用户个人的敏感隐私数据仅存储于车机端,在车机端进行车机端模型训练,车机端向云端提交训练后的车机端模型,云端对聚合后的模型进行大数据运算。该方法无须分享敏感原始数据,又能通过分享模型参数达到对隐私数据合理应用的目的。

13、相比目前直接上传用户原始数据进行后端模型计算或者后端数据隐私保护的方案,本方案从数据采集源头上就对数据进行脱敏保护,但同时又能达到端侧推荐模型计算与模型交换与更新的目的,最终完成用户场景智能推荐与用户隐私保护的双重目的。

14、优选的,所述一类车机端数据包括:车主用户人脸数据、指纹数据、声纹数据、车主年龄、车主性别、车主用户身份证号、车主手机好、车主联系人名单、车辆行驶轨迹、车辆位置信息等。

15、优选的,所述二类车机端数据包括:车辆颜色、车辆品牌、车辆vin码、车牌号等。

16、优选的,所述三类车机端数据包括:车辆行驶里程、车辆油耗、车辆电量消耗量、车速、转向角度、挡位信息、发动机工况数据、驱动电机工况数据、车辆远程诊断数据等。

17、优选的,所述车机端进行车机端模型训练时,初始的车机端模型是随机获得或根据同类任务的模型迁移获得。

18、优选的,对所述车机端模型的训练,包括:

19、s21、选择满足车辆注册状态条件的车辆作为模型训练车辆向云端进行车辆注册;

20、s22、云端根据预设任务选择初始的车机端模型及参数,并将初始的车机端模型及参数下发到模型训练车辆的车机端;

21、s23、模型训练车辆的车机端利用车机端数据(包含全部三类)对初始的车机端模型进行本地循环迭代训练,更新车机端模型及参数;

22、s24、车机端将训练后的车机端模型及参数经过加密后上传给云端;

23、s25、云端对车机端加密上传的车机端模型及参数,通过加权平均等方式聚合到云端模型中,得到新的云端模型及参数并更新云端原有的模型及参数;

24、s26、迭代执行步骤s24、s25,直到满足设定的迭代次数;

25、s27、云端根据更新后的云端模型及参数,对车机端的车机端模型及参数进行更新。

26、更优选的,s22中,云端根据预设任务还选择了车机端训练权重,并将车机端训练权重下发到模型训练车辆的车机端;

27、s23中,车机端依据车机端训练权重对初始的车机端模型进行本地循环迭代训练,更新车机端模型及参数;

28、更优选的,s22中,云端是根据预设任务及二类车机端数据,选择初始的车机端模型及参数

29、更优选的,所述二类车机端数据是车辆品牌和/或车辆型号。

30、更优选的,所述车辆注册状态条件包括:电或油量达到预设值、网络状态良好、处于泊车状态,达到这些车辆注册状态条件,可以减少模型训练异常中断情况。

31、更优选的,s26中,云端根据更新后的云端模型及参数,对车机端的车机端模型及参数进行更新;之后,

32、s27、迭代执行步骤s24、s25,直到满足设定的迭代次数。

33、将迭代次数的判断设置在最后一步,使得模型聚合是实时聚合方式,降低了模型训练中的等待时长,提升了数据共享效率;云端在收到模型训练车辆发来的车机端模型后,可以立刻进行聚合,并将聚合后的云端模型发给车机端,无需等待所有车辆发来模型更新后才能进行聚合,保障了训练过程的高效性。

34、本发明所述的一种基于联邦学习的用户数据隐私保护系统,包括:车机端、云端,车机端和云端双向数据连接,其中,

35、车机端,包括数据采集系统、本地模型参数训练模块、本地模型参数更新模块,其中,

36、数据采集系统用于存储车机端模型及按照数据权属、敏感度、抵触程度分成的三种类型的车机端数据,其中,

37、一类车机端数据,是用户个人的敏感隐私数据,这类数据具有高度敏感属性,用户一般会强烈抵触分享;

38、二类车机端数据,是一般用户数据,用户敏感度较低,用户不抵触分享;

39、三类车机端数据,是车辆行驶数据;

40、所述本地模型参数训练模块通过联邦学习计算框架利用已经存储的车机端模型,结合一类车机端数据进行模型训练,向云端提交训练后的车机端模型;

41、所述本地模型参数更新模块用于存储及接收云端分发的车机端模型;

42、所述车机端将二类车机端数据和三类车机端数据,采用安全加密方式从车机端传递到云端或第三方监管端;

43、所述车机端将一类车机端数据结合可信执行环境的本地化安全存储技术,只存储在车机端本地;

44、云端,包括初始模型构建模块、模型训练模块、参数聚合模块、云端模型参数更新模块,其中,

45、所述初始模型构建模块用于存储云端模型;

46、所述模型训练模块用于接收车机端训练后的车机端模型;

47、所述参数聚合模块用于将车机端模型与云端模型进行聚合、向车机端分发聚合后的云端模型;

48、所述云端模型参数更新模块用于对聚合后的云端模型进行大数据运算;

49、所述云端存储三类车机端数据、二类车机端数据。

50、本发明将车机端数据按照用户权限分成三类,将三类数据按级别存储于车机端和/或云端,从数据采集源头上就对数据进行脱敏保护,但同时又能达到端侧推荐模型计算与模型交换与更新的目的,最终完成用户场景智能推荐与用户隐私保护的双重目的。

51、优选的,所述车机端和云端设有身份认证模块,身份认证模块依据车辆注册状态条件判断是否启动模型参数训练。

52、优选的,所述车机端设有初始的车机端模型,初始的车机端模型是从云端随机获得或根据同类任务的模型迁移获得。

53、更优选的,所述云端的模型训练模块是根据二类车机端数据向车机端分发初始的车机端模型。

54、更优选的,所述二类车机端数据是车辆品牌和/或车辆型号。

55、本发明结合车联网特点,根据车辆本地数据进行模型训练产生模型更新内容,仅将更新模型上传至云端,在完成训练任务的同时保护了模型训练车辆的数据隐私。单个车辆感知到的信息是有限的,云端可以将多个车辆感知到的信息进行模型训练并聚合,得到更加准确且全局的信息,该架构可以使得车辆感知的数据得以充分利用。

56、本发明通过在车机端和云端进行联邦学习,让各个数据持有方根据自己的条件和规则各自在本地训练模型,将脱敏参数汇总到中央服务器进行计算后,再下发回各个数据持有方更新自己本地的模型,直至全局模型稳健。模型训练车辆与云端建立起联合训练的模式后,车辆无需将本地数据上传至云端,而是将车辆本地训练后的最小模型更新上传至云端进行模型聚合,在数据不出车辆本地的情况下,保护了车辆自身的数据隐私。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1