医疗图像脱敏方法、装置、电子设备及可读存储介质与流程

文档序号：37216410发布日期：2024-03-05 15:06阅读：16来源：国知局

本技术涉及图像脱敏的，尤其是涉及一种医疗图像脱敏方法、装置、电子设备及可读存储介质。

背景技术：

1、随着大数据与互联网的迅速发展，网络信息增长，我国在网络信息安全方面面临巨大的挑战。其中，医疗行业数据安全问题是普遍存在的问题之一。医疗信息中包含大量敏感数据，若在收集、存储、传输过程中若未实施有效的加密措施，那么医疗信息则处于极大的泄露风险中。

2、在医疗行业中存储有大量的检查单图像，在检查单图像中包括病人隐私信息，如姓名、病案号、门诊号等，针对这些隐私信息，需要进行脱敏处理。目前，对检查单图像脱敏时，可以预设脱敏数据库，在脱敏数据库中预存敏感信息对应的图像信息，进而将检查单图像与预存图像信息对比，确定脱敏区域，进而在脱敏区域进行数据脱敏。

3、而脱敏数据库中的预存图像信息较多，通过逐个对比，对比速度缓慢，影像脱敏效率。

技术实现思路

1、为了提高脱敏效率，本技术提供一种医疗图像脱敏方法、装置、电子设备及可读存储介质。

2、第一方面，本技术提供一种医疗图像脱敏方法，采用如下的技术方案：

3、获取检查单图像；

4、确定所述检查单图像的类别；

5、确定所述检查单图像中的文字区域，提取所述文字区域对应的第一图像的第一关键点描述符；

6、获取预设的脱敏信息库中所述类别对应的预存图像信息，确定所述预存图像信息的第二关键点描述符；

7、将所述第一关键点描述符与各个所述第二关键点描述符对比，确定第一图像中的敏感信息标题，确定所述敏感信息标题后的区域为需要脱敏的敏感区域；

8、在所述敏感区域进行数据脱敏。

9、通过采用上述技术方案，获取检查单图像，分析检查单图像的类别，确定检查单图像中的文字区域，提取文字区域对应的第一图像的第一关键点描述符，进而获取脱敏数据库中对应类别的预存图像信息，确定预存图像信息的第二关键点描述符，将第一关键点描述符与第二关键点描述符对比，确定第一图像中的敏感信息标题，从而确定标题后的区域为敏感区，进而便于在敏感区域数据脱敏。因此通过分类对比，减小用于对比的预存图像信息数量，减小计算量，提高脱敏效率。

10、进一步地，所述类别包括清晰度和倾斜度，所述确定所述检查单图像的类别，包括：

11、运用fft确定检查单图像的清晰度；

12、运用训练好的神经网络模型确定所述检查单图像中文字的倾斜度。

13、通过采用上述技术方案，通过算法确定检查单图像的清晰度和文字倾斜度，进行快速细致分析。

14、进一步地，所述将所述第一关键点描述符与各个所述第二关键点描述符对比，确定第一图像中的敏感信息标题，包括：

15、将第一关键点描述符作为共轭实体,将所述第二关键点描述符作为匹配实体，通过计算匹配实体之间的相似性测度以实现共轭实体配准的影像匹配方法，确定第一图像中的敏感信息标题。

16、进一步地，所述方法还包括：

17、基于大数据获取包括敏感文字的第一图像以及历史检查单图像中包括敏感文字的第二图像，改变所述第一图像和第二图像的清晰度和/或文字倾斜度，确定第三图像；

18、将所述第一图像、所述第二图像和所述第三图像确定为图库图片；

19、获取所述图库图片的清晰度和文字倾斜度；

20、根据所述清晰度和所述文字倾斜度对所述图库图片进行分类，分别确定多个清晰度以及文字倾斜度对应的类别，每个类别中包括至少一个图库图片；

21、确定每个所述图库图片及对应的第二关键点描述符为一个预存图像信息；

22、根据每个类别对应的预存图像信息建立脱敏数据库。

23、通过采用上述技术方案，电子设备根据大数据和历史数据获取第一图像和第二图像，进而通过对第一图像和第二图像变形，确定第三图像，进而丰富图库图片的种类，使分类后的脱敏数据库的数据量足够大，便于分析准确。

24、进一步地，若所述脱敏信息库中不包括所述类别对应的预存图像信息，所述确定第一图像中的敏感信息标题，包括：

25、获取至少一个相邻类别的预存图像信息；

26、将所述第一关键点描述符分别与相邻类别预存图像信息的第二关键点描述符对比，确定第一关键点描述符与各个第二关键点描述符的相似度；

27、根据相似度最高的第二关键点描述符对应的预存图像信息与所述检查单图像的第一关键点描述符对比，确定确定第一图像中的敏感信息标题。

28、通过采用上述技术方案，通过相邻类别的预存图像信息的第二关键点描述符与第一关键点描述符对比，选取相似度最高的结果来确定敏感信息标题。提高分析准确度。

29、进一步地，所述提取所述文字区域对应的第一图像的第一图像描述符，包括：

30、s11：尺度空间极值检测，获取尺度空间,构建图像金字塔，包括：

31、基于对小的关键点使用小的窗口，对大的关键点使用大的窗口的原则，使用尺度空间滤波器，采用唯一可产生多尺度空间的核函数的高斯核；

32、定义一个图像的尺度空间,如下：

33、l(x,y,σ)=g(x,y,σ)*i(x,y) (1)；

34、g(x,y,σ)= (2)；

35、其中，(x,y)代表图像的像素位置，i(x,y)表示原始图像，*表示卷积运算, g(x,y,σ)表示高斯函数，σ是尺度空间因子，是高斯正态分布的标准差，反映了图像被模糊的程度，其值越大图像越模糊，对应的尺度也就越大；

36、不同图像的尺度空间构成图像高斯金字塔，通过公式（1）、（2）函数对图像进行模糊以及降采样得到若干组图像，不同组包括若干层图像，其中，高斯金字塔的组数计算公式如下：

37、（3）；

38、其中，表示高斯金字塔的组数，m，n分别是原始图像的行和列；系数是0-之间的任意值；

39、再次，由公式（4）关系得到高斯滤波参数σ：

40、（4）；

41、其中, s是所在的层，是初始尺度，s是每组的层数，o为所在的组数；之后，确定同组内相邻层的图像尺度间的关系：

42、，（5）；

43、确定相邻组之间的关系：

44、（6）；

45、s12：构建图像高斯差分金字塔；图像沿着尺度轴做高斯差分，获得尺度空间上尺度轴上的梯度极值，采用dog函数计算梯度极值，在高斯金字塔中每个组中相邻两层使用dog函数构成高斯差分金字塔，dog函数如下：

46、d(x,y,σ)=l(x,y,kσ)- l(x,y,σ) （7）；

47、s13：寻找极值点，在dog空间中寻找极值，极值比设定周围点都大或者都小的点认为是关键点；

48、s14：特征点过滤与关键点定位；

49、去除较小的极值，为了获得更加准确的关键点位置，将每个关键点的每小段dog函数进行泰勒二次展开：

50、（8）；

51、其中， , 是高斯滤波参数，x，y是图像像素点；

52、然后，对公式（8）求极值，并令公式（8）导数为零得到极值点：

53、（9）；

54、其次，对公式（9）得到极值点处的极值：：

55、（10）；

56、并剔除的极值点，以去除边缘噪声，即剔除山脊线；

57、s15：通过hessian矩阵刻画该公式（9）极值点周围的变化趋势，协方差矩阵的特征值对应着在特征向量方向上的投影，hessian矩阵的特征值和特征值所在特征向量方向上的曲率成正比；

58、通过二阶差分公式（11）计算得到hessian矩阵：

59、（11）；

60、其中，，，，表示dog函数关于像素点x，y二阶偏导数；

61、计算特征值的比值，获得特征值在特征向量方向的变化趋势；

62、假设两个特征值分别为，，则：

63、（12）；

64、（13）；

65、其中, ，分别是矩阵的迹和矩阵的行列式；

66、其次，设为较大特征值，并且，则

67、（14）；

68、其中，，分别是矩阵的迹和矩阵的行列式，是，的比值；

69、当是最小，当越大时，对应的越大，将的点剔除；

70、s16：方向确定：

71、为了实现旋转不变性，需要为每个关键点分配一个方向角度，也就是根据检测到的关键点所在的高斯尺度图像的领域结构中确认关键点的方向；

72、对于任意一个关键点，采集所在高斯金字塔图像以r为半径的区域内所有像素的梯度特征，半径r为：

73、（15）；

74、梯度幅度和方向的计算公式为：

75、（16）；

76、（17）；

77、其中，x，y表示示像素点，是对应尺度的尺度图像；

78、通过公式（16）、公式（17）计算关键点周围区域内的所有样本点的梯度值与方向；将方向分为若干个bins，使用高斯函数加权统计样本点的方向直方图，取最大峰值对应的bins，其就是关键点的方向；

79、s17：确定关键点描述符；

80、找得图像在不同尺度的关键点后，为了实现后续的分类或者匹配，需要获取关键点周围的特征；

81、将关键点附件半径为r的领域划分为的子区域，在每个子区域统计长度h（h=9）为的方向直方图，每个直方图作为一个种子点，获得一个长度为的向量；

82、然后，为保证旋转不变性，固定关键点的方向为相同方向，即将图像旋转使得关键点的方向为坐标轴x轴方向，再对旋转后的图像进行区域统计方向直方图；

83、坐标旋转后的值为：

84、（18）；

85、其中，是关键点方向与x坐标轴的夹角，顺时针旋转角度为负值，逆时针为正值；

86、其次，计算子区域内的像素的梯度，并按照进行高斯加权，并采用双线性插值法得到每个种子的八个方向的梯度；

87、再次，在方向直方图p处，方向o上的增量为：

88、

89、（19）；

90、其中，是p点周围旋转后的样本点，限制其距离在单位内，是的坐标，是高斯权重，分别是对该网络点在两个方向的影响率和所求方向上的影响率；

91、之后，区域大小的选择和高斯权重尺度的选择，每个子区域的选择和计算关键点方向时的区域大小一致，即，其中是图像在尺度空间的尺度；

92、再后，考虑到旋转的问题，为了避免旋转后半径为的区域内有部分是空的，在选的区域要能够在旋转后仍然后的区域检测到，每个子区域的半径为：

93、（20）；

94、所以，总体区域半径为：

95、（21）；

96、往后，为了去除光照影响：将关键点生成的特征向量归一化，计算公式如下：

97、（22）；

98、其中，是方差。

99、进一步地，所述在所述敏感区域进行数据脱敏包括：

100、在所述文字区域建立坐标系；

101、基于所述坐标系确定敏感区域所在的坐标范围；

102、在所述敏感区域的最左边缘确定第一起始边和第二移动边，以所述第一起始边作为起点，向右平移所述第二移动边，直至第二移动边左侧预设距离均为空白，确定所述第一起始边和所述第二移动边之间的区域为待脱敏区域；

103、在所述待脱敏区域叠加空白图像。

104、通过采用上述技术方案，确定敏感区域所在的坐标范围，便于精确确定敏感区域范围，且确定第一起始边和第一移动边，准确确定待脱敏区域。

105、第二方面，本技术提供一种医疗图像脱敏装置，采用如下的技术方案：

106、检查单图像获取模块，用于获取检查单图像；

107、类别确定模块，用于确定所述检查单图像的类别；

108、第一关键点描述符提取模块，用于确定所述检查单图像中的文字区域，提取所述文字区域对应的第一图像的第一关键点描述符；

109、第二关键点描述符确定模块，用于获取预设的脱敏信息库中所述类别对应的预存图像信息，确定所述预存图像信息的第二关键点描述符；

110、敏感区域确定模块，用于将所述第一关键点描述符与各个所述第二关键点描述符对比，确定第一图像中的敏感信息标题，确定所述敏感信息标题后的区域为需要脱敏的敏感区域；

111、脱敏模块，用于在所述敏感区域进行数据脱敏。

112、通过采用上述技术方案，检查单图像获取模块获取检查单图像，类别确定模块分析检查单图像的类别，第一关键点描述符提取模块确定检查单图像中的文字区域，提取文字区域对应的第一图像的第一关键点描述符，进而第二关键点描述符确定模块获取脱敏数据库中对应类别的预存图像信息，确定预存图像信息的第二关键点描述符，敏感区域确定模块将第一关键点描述符与第二关键点描述符对比，确定第一图像中的敏感信息标题，从而确定标题后的区域为敏感区，进而便于脱敏模块在敏感区域数据脱敏。因此通过分类对比，减小用于对比的预存图像信息数量，减小计算量，提高脱敏效率。

113、第三方面，本技术提供一种电子设备，采用如下的技术方案：

114、一种电子设备，包括：

115、至少一个处理器；

116、存储器；

117、至少一个计算机程序，其中所述至少一个计算机程序被存储在所述存储器中并被配置为由所述至少一个处理器执行，所述至少一个计算机程序配置用于：执行如第一方面中任一项所述的方法。

118、通过采用上述技术方案，处理器执行存储器中的计算机程序，获取检查单图像，分析检查单图像的类别，确定检查单图像中的文字区域，提取文字区域对应的第一图像的第一关键点描述符，进而获取脱敏数据库中对应类别的预存图像信息，确定预存图像信息的第二关键点描述符，将第一关键点描述符与第二关键点描述符对比，确定第一图像中的敏感信息标题，从而确定标题后的区域为敏感区，进而便于在敏感区域数据脱敏。因此通过分类对比，减小用于对比的预存图像信息数量，减小计算量，提高脱敏效率。

119、第四方面，本技术提供一种计算机可读存储介质，采用如下的技术方案：

120、一种计算机可读存储介质，存储有能够被处理器加载并执行如第一方面中任一项所述的方法的计算机程序。

121、通过采用上述技术方案，处理器执行计算机可读存储介质中的计算机程序，获取检查单图像，分析检查单图像的类别，确定检查单图像中的文字区域，提取文字区域对应的第一图像的第一关键点描述符，进而获取脱敏数据库中对应类别的预存图像信息，确定预存图像信息的第二关键点描述符，将第一关键点描述符与第二关键点描述符对比，确定第一图像中的敏感信息标题，从而确定标题后的区域为敏感区，进而便于在敏感区域数据脱敏。因此通过分类对比，减小用于对比的预存图像信息数量，减小计算量，提高脱敏效率。

122、综上所述，本技术包括以下至少一种有益技术效果：

123、1.获取检查单图像，分析检查单图像的类别，确定检查单图像中的文字区域，提取文字区域对应的第一图像的第一关键点描述符，进而获取脱敏数据库中对应类别的预存图像信息，确定预存图像信息的第二关键点描述符，将第一关键点描述符与第二关键点描述符对比，确定第一图像中的敏感信息标题，从而确定标题后的区域为敏感区，进而便于在敏感区域数据脱敏。因此通过分类对比，减小用于对比的预存图像信息数量，减小计算量，提高脱敏效率；

124、2.电子设备根据大数据和历史数据获取第一图像和第二图像，进而通过对第一图像和第二图像变形，确定第三图像，进而丰富图库图片的种类，使分类后的脱敏数据库的数据量足够大，便于分析准确；

125、3.确定敏感区域所在的坐标范围，便于精确确定敏感区域范围，且确定第一起始边和第一移动边，准确确定待脱敏区域。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王莹
技术所有人：唐山启奥科技股份有限公司
我是此专利的发明人

上一篇：视频显示控制方法及装置与流程
上一篇：多路阀、液压系统及挖掘机的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。