本发明涉及医疗数据脱敏存储,具体涉及一种医疗数据脱敏存储方法、装置、电子设备与存储介质。
背景技术:
1、5g与人工智能应用等新技术使医疗服务大步走向真正意义的智能化。远程医疗、ai辅助诊断、远程急救、远程会诊、机器人超声等极大提升了医疗诊断工作的效率。
2、但是随之产生的大量医疗数据,种类复杂、数据量大、数据存储年限长,并且每年递增数据量大。传统数据中心多以磁存储为主,数据运营能耗高、设备运维复杂、数据按年限需要多次迁移等问题愈发突出。而且这些医疗数据通常会记录有患者的隐私数据,在多机构进行数据采集、传输、共享等过程中,可能导致大量敏感信息泄露、个人隐私信息侵犯等数据安全事件。
技术实现思路
1、本发明的目的就在于解决上述背景技术的问题,而提出一种医疗数据脱敏存储方法、装置、电子设备与存储介质。
2、本发明的目的可以通过以下技术方案实现:
3、本发明实施例第一方面,提供了一种医疗数据脱敏存储方法,所述方法包括:
4、获取待存储的医疗数据,识别所述医疗数据包含的数据内容确定所述医疗数据的安全策略;所述安全策略包括数据脱敏方式与数据存储方式;
5、根据所述安全策略对所述医疗数据进行数据脱敏处理,得到去标识化医疗数据;
6、根据所述安全策略确定所述医疗数据在分布式数据库ipfs上的存储节点,并将数据存储时生成的索引存储在预设医疗数据区块链上。
7、可选地,识别所述医疗数据包含的数据内容确定所述医疗数据的安全策略包括:
8、识别所述医疗数据包含的数据内容,若所述数据内容仅包含患者的基础信息,则确定数据脱敏方式为文字数据脱敏,数据存储方式为连续存储;所述基础信息包括患者的基本信息、门诊记录、急诊记录、住院记录、检验检查记录、处方记录、手术记录和医保数据中的至少一种;
9、若所述数据内容还包含患者的医学影像数据,则确定数据脱敏方式为文字数据和图像数据混合脱敏,数据存储方式为离散存储。
10、可选地,根据所述安全策略对所述医疗数据进行数据脱敏处理,得到去标识化医疗数据包括:
11、若所述数据脱敏方式为文字数据脱敏,扫描所述医疗数据确定预设字段的数据为敏感数据,使用预设脱敏方法对所述敏感数据进行脱敏处理,得到去标识化医疗数据;预设脱敏方法包括基于规则的脱敏方法、加密脱敏方法、伪装脱敏方法、数据扰动脱敏方法和数据屏蔽脱敏方法中的至少一种;
12、若所述数据脱敏方式为文字数据和图像数据混合脱敏,将所述医疗数据分割为所述基础信息和所述医学影像数据,扫描所述基础信息确定预设字段的数据为敏感数据,使用预设脱敏方法对所述敏感数据进行脱敏处理,得到第一医疗数据,获取所述医学影像数据的元数据和数据格式,对所述元数据使用预设脱敏方法进行脱敏处理,根据所述数据格式确定所述医学影像数据的各数据元素类型,根据元素类型进行对应去标识操作,得到第二医疗数据,所述第一医疗数据和所述第二医疗数据合并作为所述去标识化医疗数据;所述去标识操作包括清除属性项的值、覆盖属性项的值和删除属性项。
13、可选地,根据所述安全策略确定所述医疗数据在分布式数据库ipfs上的存储节点包括:
14、计算所述医疗数据在分布式数据库ipfs上的存储节点的存储代价:其中,p为存储代价,b为传输带宽,s为存储节点的存储空间大小,α为预设常数,d为所述医疗数据所在服务器与存储节点的距离,t为传输时延;
15、将各存储节点按照存储代价从小到大的顺序进行排序,得到节点列表;
16、若所述数据存储方式为连续存储,选择所述节点列表中第一个作为所述医疗数据在分布式数据库ipfs上的存储节点;
17、若所述数据存储方式为离散存储,选择所述节点列表中第一个和第二个作为所述医疗数据在分布式数据库ipfs上的存储节点,将所述第一医疗数据和所述第二医疗数据分别存储。
18、本发明实施例第二方面,还提供了一种医疗数据脱敏存储装置,所述装置包括:
19、识别模块,用于获取待存储的医疗数据,识别所述医疗数据包含的数据内容确定所述医疗数据的安全策略;所述安全策略包括数据脱敏方式与数据存储方式;
20、脱敏模块,用于根据所述安全策略对所述医疗数据进行数据脱敏处理,得到去标识化医疗数据;
21、存储模块,用于根据所述安全策略确定所述医疗数据在分布式数据库ipfs上的存储节点,并将数据存储时生成的索引存储在预设医疗数据区块链上。
22、可选地,所述识别模块包括:
23、第一识别子模块,用于识别所述医疗数据包含的数据内容,若所述数据内容仅包含患者的基础信息,则确定数据脱敏方式为文字数据脱敏,数据存储方式为连续存储;所述基础信息包括患者的基本信息、门诊记录、急诊记录、住院记录、检验检查记录、处方记录、手术记录和医保数据中的至少一种;
24、第二识别子模块,用于若所述数据内容还包含患者的医学影像数据,则确定数据脱敏方式为文字数据和图像数据混合脱敏,数据存储方式为离散存储。
25、可选地,所述脱敏模块包括:
26、文字数据脱敏模块,用于若所述数据脱敏方式为文字数据脱敏,扫描所述医疗数据确定预设字段的数据为敏感数据,使用预设脱敏方法对所述敏感数据进行脱敏处理,得到去标识化医疗数据;预设脱敏方法包括基于规则的脱敏方法、加密脱敏方法、伪装脱敏方法、数据扰动脱敏方法和数据屏蔽脱敏方法中的至少一种;
27、混合脱敏模块,用于若所述数据脱敏方式为文字数据和图像数据混合脱敏,将所述医疗数据分割为所述基础信息和所述医学影像数据,扫描所述基础信息确定预设字段的数据为敏感数据,使用预设脱敏方法对所述敏感数据进行脱敏处理,得到第一医疗数据,获取所述医学影像数据的元数据和数据格式,对所述元数据使用预设脱敏方法进行脱敏处理,根据所述数据格式确定所述医学影像数据的各数据元素类型,根据元素类型进行对应去标识操作,得到第二医疗数据,所述第一医疗数据和所述第二医疗数据合并作为所述去标识化医疗数据;所述去标识操作包括清除属性项的值、覆盖属性项的值和删除属性项。
28、可选地,存储模块包括:
29、计算模块,用于计算所述医疗数据在分布式数据库ipfs上的存储节点的存储代价:其中,p为存储代价,b为传输带宽,s为存储节点的存储空间大小,α为预设常数,d为所述医疗数据所在服务器与存储节点的距离,t为传输时延;
30、排序模块,用于将各存储节点按照存储代价从小到大的顺序进行排序,得到节点列表;
31、第一存储子模块,用于若所述数据存储方式为连续存储,选择所述节点列表中第一个作为所述医疗数据在分布式数据库ipfs上的存储节点;
32、第二存储子模块,用于若所述数据存储方式为离散存储,选择所述节点列表中第一个和第二个作为所述医疗数据在分布式数据库ipfs上的存储节点,将所述第一医疗数据和所述第二医疗数据分别存储。
33、本发明实施例第三方面,还提供了一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
34、存储器,用于存放计算机程序;
35、处理器,用于执行存储器上所存放的程序时,实现上述任一所述的方法步骤。
36、本发明实施例第四方面,还提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的方法步骤。
37、本发明的有益效果:
38、本发明实施例提供了一种医疗数据脱敏存储方法,获取待存储的医疗数据,识别医疗数据包含的数据内容确定医疗数据的安全策略;安全策略包括数据脱敏方式与数据存储方式;根据安全策略对医疗数据进行数据脱敏处理,得到去标识化医疗数据;根据安全策略确定医疗数据在分布式数据库ipfs上的存储节点,并将数据存储时生成的索引存储在预设医疗数据区块链上。通过识别医疗数据的具体内容,执行不同的安全策略,执行不同的数据脱敏方式和存储方式,既保证了敏感隐私信息的安全性,又保证了数据存储的效率。