基于内容唯一性的医疗影像脱敏数据的管理方法及系统与流程

文档序号:16684778发布日期:2019-01-19 00:50阅读:419来源:国知局
基于内容唯一性的医疗影像脱敏数据的管理方法及系统与流程

本发明涉及数据管理技术领域,尤其涉及一种基于内容唯一性的医疗影像脱敏数据的管理方法及系统。



背景技术:

随着医疗领域的数字化发展,医疗影像数据往往通过dicom(digitalimagingandcommunicationsinmedicine)标准格式进行交流传输,在临床与科研活动中,会对从临床获得的医疗影像数据先进行脱敏,将与病人和伦理有关的标签从dicom数据中删除,再提供给科研人员使用。反之,在必要情况下,也有从科研使用的脱敏数据反向找回相应原始数据,以查询病人等敏感信息的需求。因此,目前的主流脱敏数据管理方法是,基于影像数据的各种id,如检查id,影像序列id等,或者多个非敏感信息id(敏感id包括病人id等)的某种组合,来管理原始影像数据和脱敏数据之间的一一映射关系。目前主流的方法是从原始的dicom影像数据和脱敏数据中,选择共有的一个或多个相关id组合,来做映射关系,其缺点在于如果脱敏数据的标签或者id有改动,则会失去这些id信息,就不能再恢复原始数据与脱敏数据的对应关系了。因此本着严谨的科学态度,为了解决现有技术中存在的技术问题,提供一种基于内容唯一性的医疗影像脱敏数据的管理的方案。



技术实现要素:

本发明目的是提供一种基于内容唯一性的医疗影像脱敏数据的管理方法及系统,利用原始数据与脱敏数据内容哈希值的唯一性,更高效的完全保证脱敏数据与原始数据的一一映射关系。

本发明解决技术问题采用如下技术方案:

一种基于内容唯一性的医疗影像脱敏数据的管理方法,应用于医疗系统中影像脱敏数据的管理,至少包括以下步骤:

获取医疗影像脱敏的源数据以及脱敏数据dicom,并分别计算两数据的sha256哈希值,并对应对两者的唯一标识并存储至数据库;

删除所述源数据和脱敏数据dicom的标签数据,单独计算两者所述影像数据的sha256哈希值,比较所述删除标签后的源数据和删除标签后的脱敏数据计算出的sha256哈希值,并在两哈希值相同时将其作为所述源数据与脱敏数据对应的准确标识并存储至数据库;

依据所数据库所存储的各sha256值查询相对应的源数据。

其中,所述的数据库中存储的所述源数据实际存储位置与所述dicom数据的sha256值对应。

其中,所述的方法可配合ipfs系统。

本发明还提供一种基于内容唯一性的医疗影像脱敏数据的管理系统,应用于医疗系统中影像脱敏数据的管理,其特征在于,至少包括以下模块:

数据库,用于存储数据;

唯一标识获取模块,用于获取医疗影像脱敏的源数据以及脱敏数据dicom,并分别计算两数据的sha256哈希值,并对应对两者的唯一标识并存储至数据库;

准确标识获取模块,用于删除所述源数据和脱敏数据dicom的标签数据,单独计算两者所述影像数据的sha256哈希值,比较所述删除标签后的源数据和删除标签后的脱敏数据计算出的sha256哈希值,并在两哈希值相同时将其作为所述源数据与脱敏数据对应的准确标识并存储至数据库;

源数据查询模块,用于依据所数据库所存储的各sha256值查询相对应的源数据。

本发明还提供一种基于内容唯一性的医疗影像脱敏数据的管理系统,包括网络、存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如所述方法的步骤。

本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述的计算机程序被处理器执行时实现如所述方法的步骤。

本发明具有如下有益效果:

由于本发明利用原始数据与脱敏数据内容哈希值的唯一性来管理脱敏数据,基于内容唯一性的方法则可以保证除非影像数据内容本身被修改,否则无论dicom的标签如何修改,都能保证脱敏数据与原始数据的对应关系,因此能更高效的完全保证脱敏数据与原始数据的一一映射关系;另外本发明还可以同时配合ipfs(interplanetaryfilesystem)系统,可以避免数据的重复保存,大大节省存储成本。

附图说明

图1为本发明的基于内容唯一性的医疗影像脱敏数据的管理方法的流程简图。

具体实施方式

下面结合实施例及附图对本发明的技术方案作进一步阐述。

参考图1所示,本发明为一种基于内容唯一性的医疗影像脱敏数据的管理方法,应用于医疗系统中影像脱敏数据的管理,至少包括以下步骤:

获取医疗影像脱敏的源数据以及脱敏数据dicom,并分别计算两数据的sha256哈希值,并对应对两者的唯一标识并存储至数据库;即在该步骤中,分别计算源数据和脱敏数据dicom的sha256哈希值,作为两者的唯一标识,因为源数据和脱敏数据的dicom标签不完全相同,因此两者的sha256值不会相同;

删除所述源数据和脱敏数据dicom的标签数据,单独计算两者所述影像数据的sha256哈希值,比较所述删除标签后的源数据和删除标签后的脱敏数据计算出的sha256哈希值,并在两哈希值相同时将其作为所述源数据与脱敏数据对应的准确标识并存储至数据库;在该步骤中,结合图1所示,即将源数据dicom数据的标签数据全部删除,单独计算影像数据的sha256哈希值,对于源数据和脱敏数据,其所计算出的sha256值应该是相同的,所以可以作为将源数据和脱敏数据一一对应起来的准确标识。

依据所数据库所存储的各sha256值查询相对应的源数据。在数据库中记录源数据dicom的sha256值、脱敏数据的sha256值以及删除标签后的数据sha256值,由于源数据dicom和脱敏dicom各自删除标签后的内容即为影像部分数据,因此获得的sha256的值相同,可作为源数据和脱敏数据之间的对应关系。记录脱敏数据的sha256是为了加查询速度,也可以通过直接计算脱敏数据删除dicom标签后的sha256值来反向查询对应的源数据。尤其如果脱敏数据的dicom标签被改动,导致其对应的sha256没有在数据库中记录过时,直接计算无标签dicom的sha256值并反向查询,则依然能找到相对应的源数据。这是现有脱敏系统无法实现的。所述的数据库中存储的所述源数据实际存储位置与所述dicom数据的sha256值对应。所述的方法可配合ipfs系统实现。

另外,在本发明方法的实施例中,均是基于已有的开源软件组件实施,可以使用go,javascript,python,c++,java等语言均可,也可以两两组合实现,本实施例中,使用javascript+java来实现,因为此内容属于现有技术的内容,对于原理在此不再进行赘述。

采用本发明的方法,在pacs系统中同样通过dicom的sha256值来查找实际的存储位置,对于相同的dicom数据,其sha256值也相同,因此可以避免重复保存多个不需要的副本。

在本发明的方案中,本发明还提供一种基于内容唯一性的医疗影像脱敏数据的管理系统,应用于医疗系统中影像脱敏数据的管理,至少包括以下模块:

数据库,用于存储数据;

唯一标识获取模块,用于获取医疗影像脱敏的源数据以及脱敏数据dicom,并分别计算两数据的sha256哈希值,并对应对两者的唯一标识并存储至数据库;

准确标识获取模块,用于删除所述源数据和脱敏数据dicom的标签数据,单独计算两者所述影像数据的sha256哈希值,比较所述删除标签后的源数据和删除标签后的脱敏数据计算出的sha256哈希值,并在两哈希值相同时将其作为所述源数据与脱敏数据对应的准确标识并存储至数据库;

源数据查询模块,用于依据所数据库所存储的各sha256值查询相对应的源数据。

对于本发明的数据库存储部分,可以采用传统pacs或者其他存储方式,配合存有dicom内容唯一哈希值与存储路径对应关系的数据库,一样可以达到类似ipfs的效果,但是在自动备份和任务调度上会与ipfs有所区别,有关具体的内容可参考现有技术的内容。

本系统对应于上述方法,因此有关具体的处理过程在此不再赘述。

本发明还提供一种基于内容唯一性的医疗影像脱敏数据的管理系统,包括网络、存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如所述方法的步骤。所述处理器可为中央处理单元(centralprocessingunit,cpu)等硬件组件,所述存储器可为硬盘、内存、插接硬盘、智能存储卡,安全数字卡闪存等存储器件等,所述的计算机程序包括计算机程序代码,可源代码形式,对象代码、可执行文件或者某些中间形式等等。

本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述的计算机程序被处理器执行时实现如所述方法的步骤。所述的程序可采用go,javascript,python,c++,java等语言实现均可,也可以两两组合实现。

综上所述,本发明利用基于医疗影像数据内容的哈希编码,来实现原始数据和脱敏数据之间的一一映射关系,以达到从脱敏数据反向找到原始数据的目的,且利用数据内容哈希值的唯一性和ipfs存储系统,减少重复数据的存储,降低存储成本。在实际操作中,由于影像数据往往较大,虽然标签的内容很容易被改变,但影像部分的内容一般不会修改,所以临床和科研活动中,保存多份重复副本的意义不大,但是又很难避免。而基于内容唯一性的管理方法,通过对唯一哈希值的比较,可以完美解决数据的重复保存问题。

以上实施例的先后顺序仅为便于描述,不代表实施例的优劣。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1