一种基于医疗大数据的隐私保护数据挖掘系统及方法与流程

文档序号:16906835发布日期:2019-02-19 18:24阅读:536来源:国知局
一种基于医疗大数据的隐私保护数据挖掘系统及方法与流程

本发明属于信息安全技术领域,涉及一种隐私保护数据挖掘系统及方法,具体涉及针对医疗大数据隐私保护的需要,通过结合数据挖掘、非交互零知识证明、分布式技术的隐私保护数据挖掘系统及方法。

技术背景

随着现代医疗信息化的建设,基础医疗信息化设施日趋成熟,当前医疗信息系统his(hospitalinformationsystem)主要包括医学影像信息系统pacs(picturearchivingandcommunicationsystems)、临床信息系统cis(clinicalinformationsystem)、放射学信息系统ris(radiologyinformationsystem)、实验室信息系统lis(laboratoryinformationsystem)。目前,其发展状态已经由完整的医院信息系统阶段过渡到远程医疗阶段。基于互联网的远程医疗将各大医疗信息资源相互共享互通,以一种高效的方式协同提供医疗服务。随着海量大数据时代的到来,海量数据的分析与挖掘技术使得智慧云医疗的概念应运而生。智慧云医疗利用医疗大数据、云计算等关键技术,实现了了优质医疗资源共享,满足了医疗行业对更好数据的需求。

然而,在享受医疗信息共享所带来便利的同时,隐私安全问题阻碍着智慧医疗的发展。医疗数据隐私虽然受到一些传统隐私保护手段保护,例如匿名化、引入噪声、数据脱敏、权限限制等手段等,可是其无法适应当前大数据时代下智慧医疗行业的各种需求。具体来说,传统隐私保护手段不适用于医疗信息数据挖掘,甚至会因大数据超强的分析能力而面临失效。大数据环境下的医疗信息共享导致隐私泄露问题也成为了信息安全领域研究的热点。

对于这类问题,目前已存在一些解决方案,例如隐私保护的数据挖掘技术等。简单来说数据挖掘主要是以一种高效的方式从海量的数据中搜索出重要信息的方式,具体的算法由于应用场景的不同可以按需选择。隐私保护的数据挖掘旨在数据挖掘的基础上利用密码学等信息安全相关技术,设计出既能满足隐私安全需求又能合理搜索信息的新方法。相似度是一种数据挖掘中常用的手段,基于此方法设计的现有方案大多无法满足较高安全需求下的应用,例如一个伪造的数据拥有者可以利用虚假的数据套取病人的隐私信息,黑客利用攻击手段将不可信的医疗信息提供给医生等。



技术实现要素:

针对医疗大数据隐私保护的需要,本发明通过结合数据挖掘、非交互零知识证明、分布式技术,提出了一种基于医疗大数据的隐私保护数据挖掘系统及方法。

本发明的系统所采用的技术方案是:一种基于医疗大数据的隐私保护数据挖掘系统,其特征在于:包括客户端与服务端两部分;

所述服务端由公共卫生数据中心pbdc和省级区域卫生云平台phcp组成;所述客户端hc为各区域三级及以下医院机构信息系统;

所述公共卫生数据中心pbdc用于管理存储的医疗信息数据,所述公共卫生数据中心pbdc由若干分布式高性能存储设备组成,通过协同作业的方式在逻辑上构成一个数据中心,对各省级区域卫生云平台phcp提供数据管理服务;

所述省级区域卫生云平台phcp由一系列服务器集群组成,用于对各市地三级及以下医院提供统一的资源调度、响应请求服务;

所述各区域三级及以下医院机构信息系统为his(pacs、cis、ris、lis(“his”与“pacs、cis、ris、lis),用于在需要查询相关医疗信息数据时向所述省级区域卫生云平台phcp发起服务请求。

本发明的方法所采用的技术方案是:一种基于医疗大数据的隐私保护数据挖掘方法,其特征在于,包括以下步骤:

步骤1:初始化隐私保护数据挖掘系统;

步骤2:本地数据承诺;

步骤3:在线数据挖掘。

本发明方法与现有的技术相比有如下的优点和有益效果:

1.本发明能确保客户端在得到结果的同时不会向服务端泄露自己提供的样例;

2.本发明能确保恶意的客户端不能伪造虚假的样例来获取匹配结果;

3.本发明针对医疗大数据环境下提供高效的安全样例匹配方法。

附图说明

图1:本发明实施例的系统模型图;

图2:本发明实施例的方法流程图。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。

请见图1,本发明提供的一种基于医疗大数据的隐私保护数据挖掘系统,包括客户端与服务端两部分。服务端由公共卫生数据中心pbdc和省级区域卫生云平台phcp组成,客户端hc为各区域三级及以下医院机构信息系统。公共卫生数据中心的主要负责管理存储海量的医疗信息数据,具体指的是电子健康记录(electronichealthrecord,ehr)、各种医学影像(包括核磁、ct、dr、超声、各种x光机等设备产生的图像)等,其在物理上是由海量的分布式高性能存储设备组成,通过协同作业的方式在逻辑上构成一个数据中心,对各省级云平台提供数据管理服务。省级区域云平台由一系列服务器集群组成,主要任务是对各市地三级及以下医院提供统一的资源调度、响应请求等服务。各区域三级及以下医院机构信息系统主要是his(包括pacs、cis、ris、lis),主要负责在需要查询相关医疗信息数据时向省级云平台发起服务请求。

请见图2,本发明提供的一种基于医疗大数据的隐私保护数据挖掘方法,包括以下步骤:

步骤1:初始化隐私保护数据挖掘系统;

步骤1.1:省级区域卫生云平台phcp生成零知识证明全局参数,并将全局参数对各区域三级及以下医院机构信息系统和公共卫生数据中心pbdc公开;

本实施例中,各省级区域卫生云平台phcp选取大素数q,生成阶为q的群g,从群g中选取生成元g,以及整数域zq,以及哈希函数h:{0,1}*→zq,并设置全局参数(zq,g,q,g),其中,所述哈希函数用于将任意长度的0、1串映射到整数域zq;公开全局参数(zq,g,q,g),以及哈希函数h:{0,1}*→zq,将全局参数对各区域三级及以下医院机构信息系统和公共卫生数据中心pbdc公开,并定期更新;

步骤1.2:各区域三级及以下医院机构信息系统在向省级区域卫生云平台phcp发送查询请求时,首先整理本地样例数据。

本实施例中,样例数据整理为元组的形式{a1,..,ak},其中a1与ak分别表示不同的信息类型,例如病人的疾病类型、症状的关键词等。

步骤2:本地数据承诺;

步骤2.1:各区域三级及以下医院机构信息系统使用全局参数对样例数据构建承诺;

本实施例中,从整数域zq随机选择vi,i∈1,...,k,构成元组{v1,..,vk},采用零知识证明构造样例承诺,具体包括:

ri′=vi-c′ai,i∈1,...,k;

其中,xi′与以生成元g为底数,vi与ai为指数;xi包含第一信息元组{a1,..,ak},包含随机选取的元组{y1,...,ym};

样例承诺记为:β′=(c′,{(r′i,x′i)|i∈1,...,k});

步骤2.2:公共卫生数据中心pbdc使用全局参数对存储的数据构造承诺;

本实施例中,公共卫生数据中心pbdc使用全局参数对存储所有的数据关键词元组按照id号构造承诺;存储的数据关键词元组记作{b1,...,bm}id,其中id号为存储数据的单元标识,从整数域zq随机选择wj,j∈1,...,m,构成元组{w1,...,wj}采用零知识证明构造承诺,对每条记录的操作具体包括以下部分:

rjid=wj-cidbj,bj∈{b1,...,bm}id,wj∈{w1,...,wj};

其承诺为βid=(cid,{(rjid,yjid)|j∈1,...,m})。

步骤3:在线数据挖掘;

步骤3.1:各区域三级及以下医院机构信息系统将承诺发送给省级区域卫生云平台phcp;省级区域卫生云平台phcp对各区域三级及以下医院机构信息系统发送的承诺进行验证,验证通过则保持通信,否则结束通信;

本实施例中,各区域三级及以下医院机构信息系统将样例承诺β′发送给省级区域卫生云平台phcp,省级区域卫生云平台phcp对β′进行验证:i∈1,...,k,判断等式是否成立,若验证通过则保持通信,否则结束通信;

步骤3.2:省级区域卫生云平台phcp基于公共卫生数据中心pbdc提供的承诺与各区域三级及以下医院机构信息系统提供的承诺进行相似度计算,并保存结果;

本实施例中,公共卫生数据中心pbdc向省级区域卫生云平台phcp发送构造承诺βid;省级区域卫生云平台phcp对公共卫生数据中心pbdc的数据构造承诺βid与各区域三级及以下医院机构信息系统提供的承诺β′进行相似度检测,将结果以(id,αid,βid,β′)的格式保存于表h,其中:

步骤3.3:将保存的结果按从大到小排序,选取相似度最高的前n项结果,根据其id查询具体医疗数据,将其承诺与具体医疗数据返回给各区域三级及以下医院机构信息系统;

本实施例中,省级区域卫生云平台phcp对表h按照αid的值由高到低进行顺序排序,选取前n项结果,根据对应的id向数据中心查询具体信息,将与样例相似度高的医疗数据和对应的承诺βid返回给各区域三级及以下医院机构信息系统;

步骤3.4:各区域三级及以下医院机构信息系统验证收到的承诺,验证通过则接受,否则拒绝;

本实施例中,各区域三级及以下医院机构信息系统对省级区域卫生云平台phcp提供的βid进行验证:判断等式是否成立,若验证通过则接受返回的医疗数据,否则拒绝。

应当理解的是,本说明书未详细阐述的部分均属于现有技术。

应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1