一种基于内积函数加密的隐私保护计算机辅助诊断方法

文档序号：37517069发布日期：2024-04-01 14:29阅读：13来源：国知局

本发明属于生物信息学领域，具体为一种基于内积函数加密的隐私保护计算机辅助诊断方法。

背景技术：

1、基于机器学习模型的计算机辅助诊断的快速发展对现代医学活动产生了深远的影响。计算机辅助诊断可以帮助医生做出正确的诊断，从而为患者提供更好的医疗服务，同时，计算机辅助诊断的大规模推广能够大幅度提升偏远、落后地区的医疗水平，促进全民健康。然而，当前的计算机辅助诊断系统在数据隐私和模型所有权方面面临一系列挑战。例如，在这些系统中，医疗模型的所有者必须公开模型参数或访问用于医疗场景中的预测任务的用户数据，然而，一方面用户数据通常包含敏感和隐私信息，另一方面企业或医院训练的机器学习模型是重要的资产，模型参数的泄露会造成企业的损失，不应由第三方随意访问。因此，如何在计算机辅助诊断过程中同时保证用户隐私以及模型参数的安全性，允许模型拥有者、诊断系统提供商、医院以及用户在保证各自利益的前提下进行医疗活动，是推动计算机辅助诊断大规模应用的重要前提。

2、隐私保护的模型预测

3、为了保证机器学习模型预测过程中参与者的数据隐私，当前主要有三种主流的技术路线：差分隐私(differential privacy，dp)、同态加密(homomorphic encryption，he)和安全多方计算(secure multi-party computation，mpc)。其中差分隐私(dp)最早由dwork于2006年提出(dwork,c."differential privacy.automata,languages andprogramming.2006."1-12.)。针对隐私保护的预测问题，dwork等人提出了基于dp的隐私保护预测的概念(dwork,cynthia,and vitaly feldman."privacy-preservingprediction."conference on learning theory.pmlr,2018.)，即通过引入特定分布的随机数对原始模型参数进行加噪，从而能够在不知道原始模型参数的情况下计算预测结果。然而，基于dp的方案中引入的随机噪声对模型的预测精度往往会产生较大影响，这就导致此类方案难以在实际场景中进行应用。在基于he的隐私保护预测中，模型预测结果的使用者首先生成he的密钥对(pk1,sk1)，并将公钥pk1发送给模型所有者。然后，该用户用pk1加密原始数据，并将得到的密文发送给模型所有者。在接收到密文后，模型所有者通过计算来生成预测结果，并将结果的密文发送给数据所有者。最后，数据所有者对密文进行解密，得到预测结果。然而，在整个过程中，需要执行一系列的加密和解密操作以及同态乘法和加法运算，这些操作非常耗时。在基于mpc的预测中，模型所有者和数据所有者通过算术秘密共享协议相互共享其本地数据的秘密分片。也就是说，模型所有者计算其中是模型参数的向量，是随机向量。数据所有者以相同的方式计算然后，数据所有者和模型所有者交换其本地数据的共享(模型所有者获得数据所有者获得)。他们通过按顺序执行mpc乘法和求和协议，共同计算和的内积。最后，数据所有者通过中间结果重构预测结果。在基于mpc的预测中，所有中间结果都是在随机数上计算的，因此不存在关于原始数据的信息泄露。然而，尽管计算开销相对较小，但其通信成本是巨大的。因此，在基于he的预测和基于mpc的预测中，所有参与者都需要实时在线来完成预测过程，且该过程的计算和通信成本都很高昂。

技术实现思路

1、针对现有技术中存在的问题，本发明的目的主要在于提出一种基于内积函数加密的隐私保护计算机辅助诊断方法，用于计算机辅助医疗诊断场景中机器学习模型的外包和私有化部署，同时保证模型参数的安全性。本发明中提出的方法主要关注以下两类特性：首先，第一种特性是用户可以在不与模型所有者交互的情况下获得预测结果。其次，另一种特性是个人数据的所有者可以以灵活的方式向相关第三方提供预测结果的授权。例如，一家生产计算机辅助诊断医学模型的公司，当患者在医院寻求治疗时，主治医师需要使用患者的数据(如检查结果和电子病例记录)访问模型并获取预测结果，如果需要进一步诊断，医生需要授权当前的预测结果作为其他相关医生的参考。在这种情况下，公司作为模型所有者，第一位医生是预测结果的用户，而随后的医生是需要被授权才能访问先前预测结果的使用者。

2、本发明的技术方案为：

3、基于内积函数加密的隐私保护计算机辅助诊断方法包括如下步骤：

4、1)系统初始化：密钥生成中心调用群生成算法生成其中为乘法循环群，e为双线性映射，p为乘法循环群的阶。选取随机数计算gt＝e(g1,g2)。选取哈希函数h:(表示p阶非零整数群)以及随机数(为p阶整数群)，计算f(·)＝vh(·)。主密钥可以表示为：msk＝(s,t,h)，公共参数可以表示为：pp＝(e,g1,g2,gt,h1,h2,k1,f)。

5、2)密钥生成和分发：根据步骤1)中的主密钥msk，数据拥有者的标识信息id以及输入向量(其中表示用户的个人信息对应的特征向量，每一个元素xi表示第i个特征的特征值，n为特征总数)，密钥生成中心计算并返回密钥给id对应的数据拥有者。对于被授权用户，假设其标识信息为id′，密钥生成中心计算并发送给被授权用户。

6、3)模型参数加密和模型外包部署：根据步骤1)中的公共参数pp，数据拥有者的标识信息id以及输入向量(其中表示模型拥有者所拥有的参数向量，每个元素θi表示输入向量中的第i个特征对应的权重)，模型拥有者选取随机数并计算d＝e(h1,h2)r。对于i∈{1,2,…n}，计算并发送模型参数对应的密文至数据拥有者指定的计算机辅助诊断设备，执行步骤4)；当所述数据拥有者指定一被授权用户时，将密文发送至数据拥有者指定的代理服务器，执行步骤5)。

7、4)隐私保护模型预测。根据步骤3)中的模型参数密文以及步骤2)中的密钥数据拥有者首先获取内积运算结果随后计算即为预测结果。

8、5)预测结果代理授权。

9、a)假设被授权用户的标识信息为id′，根据步骤2)中的数据拥有者私钥数据拥有者首先选取随机数并计算随后选取随机数并计算令重加密密钥可以表示为rkid→id′＝(d′1,d′2,d′3)。最终数据拥有者发送rkid→id′给数据拥有者指定的代理服务器。

10、b)代理服务器利用步骤a)中的rkid→id′对步骤3)中的模型参数密文进行重加密：计算并令d′＝d′3，重加密密文可以表示为发送给被授权用户。

11、c)被授权用户获取步骤b)中的并利用步骤2)中的密钥执行解密操作：计算随后计算

12、d)被授权用户计算即为预测结果。

13、本发明的有益效果：

14、基于上述隐私保护计算机辅助诊断框架，本发明实现了隐私保护的模型预测以及预测结果的代理授权，同时实现了基于标识信息(id)的密文访问控制。

15、针对计算机辅助诊断中的模型参数以及用户数据隐私保护问题，本发明提出了一个新的隐私保护预测框架，该框架可以用于模型外包情况下的计算机辅助诊断。本发明提出的框架利用了一种基于身份的内积代理再加密方案，该方案引入了一种灵活的代理授权特性，同时结合了基于标识信息的访问控制的概念，允许通过用户标识信息进行权限验证，同时保障了原始数据以及预测结果的安全性。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴中海,沈晴霓,冯新宇,李聪,方跃坚
技术所有人：北京大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。