一种非交互式在线医疗预诊系统的数据隐私保护方法

文档序号:35013095发布日期:2023-08-04 05:56阅读:52来源:国知局
一种非交互式在线医疗预诊系统的数据隐私保护方法

本发明涉及隐私计算,具体涉及一种非交互式在线医疗预诊系统的数据隐私保护方法。


背景技术:

1、随着智慧医疗行业的快速发展和人们对自身健康的日益重视,在线医疗预诊系统已成为个人对自身疾病进行预诊断的一个有效手段。医疗用户可以通过客户端向远程在线医疗预诊系统发送咨询请求,并通过返回的诊断结果提供选择进一步医疗手段的支持,从而为用户提供科学的诊疗指导,有助于合理利用医疗资源、确定正确的科室和疾病类别。

2、在线医学预诊系统的核心是根据已有的医学数据建立起一个机器学习模型,利用该模型可以为用户的未知样本进行预测,判断该样本是否表征患有某种疾病。诊断的准确性取决于机器模型的可靠性。高精度机器学习模型的建立依赖于大量有效的数据样本,而医疗数据通常是分散式存储,并具有隐私性,使得基于机器学习的诊断系统的构建面临极大的挑战,同时具有隐私保护的机器学习(privacy preserving machine learning,ppml)模型也很难构建。

3、由于密码技术的限制、模型的复杂性,目前构建的ppml方案仍然存在一定的局限性:

4、1)在线医疗预诊系统涉及到的医疗数据是高度隐私的,现有很多系统(比如基于联邦学习的方案)都是弱安全性,不能很好地抵御推断攻击,应用差分隐私增加噪声抵御推断攻击的方法由于数据扰动造成模型精度的降低,无法满足预诊系统精准医疗的目标。

5、2)医疗数据是高度分散的,机器学习模型的建立需要聚合各方的数据样本,形成很多安全多方计算的ppml框架,但它们都是交互性的,要求数据提供者实时在线,缺乏灵活性,同时对网络的带宽以及可靠性提出了更高的要求,不利于现实场景的部署。

6、3)现有的ppml方案大都针对水平分区数据,并不适用于垂直分区的数据,在技术上,垂直分区的数据分布既需要样本维度的安全聚合,又需要属性维度下的安全聚合。


技术实现思路

1、本发明的目的在于提供一种非交互式在线医疗预诊系统的数据隐私保护方法,解决现有隐私保护在线医疗预诊系统中高通信量、要求数据提供者实时在线和无法抵抗推断攻击的技术问题。

2、为实现上述目的,本发明提供了一种非交互式在线医疗预诊系统的数据隐私保护方法,包括下列步骤:

3、构建包含第三方可信机构tpa、数据提供商组dpi、辅助云服务器csau和训练云服务器cslr的隐私传输系统;

4、梯度更新公式转换;

5、全局数据矩阵生成;

6、本地数据矩阵加密;

7、全局模型参数更新。

8、可选的,所述第三方可信机构tpa负责构建底层密码系统,将公钥传递给其他实体,并向辅助云服务器csau提供私钥服务;

9、所述数据提供商组dpi包含若干个数据提供商,其中i=1,...,m,每个数据供应商拥有一组部分数据属性,并对其私有属性进行预处理以生成本地数据矩阵,通过内积函数和随机掩码技术,将本地数据矩阵加密为矩阵密文并上传到辅助云服务器csau;

10、所述辅助云服务器csau用于隐私保护聚合,通过第三方可信机构tpa发送的函数派生密钥dkv对本地数据矩阵密文进行解密,以获得盲化的全局数据矩阵;

11、所述训练云服务器cslr通过第三方可信机构tpa发送的盲化因子的逆γ-1来解密盲化的全局数据矩阵,以恢复聚合的全局数据矩阵真实结果。

12、可选的,梯度更新公式转换的过程,包括下列步骤:

13、步骤1:使用最小二乘逼近在区间[-4,4]上对logistic函数log(1+e-z)近似,得到损失函数的近似形式:

14、

15、其中,ξ0=0.744204,ξ1=-0.5,ξ2=0.085660;

16、步骤2:分别对参数ω中的每个分量求偏导得到梯度更新公式的近似形式:

17、

18、

19、其中,t是当前迭代次数,j=1,2,...,d;

20、步骤3:利用矩阵计算和求和式公式,变换梯度更新公式的数学形式,获得用户数据和模型参数解耦的梯度更新公式:

21、

22、

23、可选的,在全局数据矩阵生成的过程中,数据提供商组dpi将其本地医疗数据作统一处理以生成相同维度的本地数据矩阵,具体为将本地的每一条垂直医疗数据样本填充为特征加1的维度向量,再将利用维度向量计算获得本地数据矩阵,最终形成全局数据矩阵。

24、可选的,本地数据矩阵加密的过程,包括下列步骤:

25、系统初始化;

26、数据加密;

27、数据解密。

28、可选的,系统初始化的任务是生成为内积函数加密系统的相关参数feip,系统初始化的过程,包括下列步骤:

29、步骤1:由第三方可信机构tpa执行,将安全参数λ作为输入,并生成数学组(g,p,g)和其中n定义为样本数,通过主密钥生成创建公钥以及私钥mskfeip=s;

30、步骤2:第三方可信机构tpa随机选择一个一次性盲化因子γ∈¢n并计算其逆γ-1;

31、步骤3:第三方可信机构tpa将公钥pkfeip分配给dpa、将一次性盲化因子γ分配给dpb并将γ-1分发到训练云服务器cslr,在训练阶段,第三方可信机构tpa将向辅助云服务器csau提供私钥服务,其中dpa、dpb分别为不同的数据提供商。

32、可选的,在数据加密的过程中,dpa通过公钥pkfeip对本地数据进行加密,dpb通过一次性盲化因子γ对本地数据进行加密。

33、可选的,数据解密的过程,包括下列步骤:

34、步骤1:第三方可信机构tpa根据从dpb发送的bk,l生成函数派生的密钥并将密钥分发给辅助云服务器csau;

35、步骤2:辅助云服务器csau将密文函数派生密钥作为输入,并以g为底返回离散对数

36、

37、然后,辅助云服务器csau将上传给训练云服务器cslr;

38、步骤3:在接收到后,训练云服务器cslr利用γ-1计算

39、

40、步骤4:通过对矩阵中每个位置的元素执行上述操作,训练云服务器cslr可以获得矩阵:

41、

42、进一步的,为简化记号,用vij表示矩阵m中的元素mi,j,用ui表示矩阵m中的元素mi,d+1,i=0,1,...,d,j=0,1,...,d,将矩阵m表示为

43、

44、可选的,全局模型参数更新的过程,包括下列步骤:

45、步骤1:训练云服务器cslr初始化学习率η、最大迭代次数itermax、收敛阈值ε和随机初始化的模型参数ω0=(ω0,ω1,...,ωd);

46、步骤2:训练云服务器cslr从矩阵m中提取v0,vj其中v0=(n,v01,...,v0d),vj=(v0j,vj1,...,vjd);

47、步骤3:训练云服务器cslr更新模型参数通过计算

48、

49、

50、其中,j=0,1,...,d;

51、步骤4:训练云服务器cslr重复步骤2和步骤3,直到达到最大迭代次数itermax或者参数收敛至收敛阈值ε,并最终获得全局模型参数ω*。

52、本发明提供了一种非交互式在线医疗预诊系统的数据隐私保护方法,针对复杂的垂直分区医疗数据场景,构建了一种保护用户数据的ppml模型,与传统的ppml方案不同,数据提供商组将对本地垂直医学数据集进行预处理,将本地数据属性转化为数据矩阵,并通过内积函数加密和随机盲因子对矩阵进行加密,将其上传到云服务器后,随即离线,实现非交互式模型训练;同时引入辅助云服务器进行隐私保护数据聚合,训练云服务器负责训练lr模型,两者之间只存在一次单向单轮通信;此外,由于辅助云服务器获得的是聚合结果的密文,而训练云服务器获得的是通过整合数据训练得到的全局模型,因此不能通过推断攻击获得单个用户的信息,保护了隐私。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1