无监督学习的医学图像配准方法及系统

文档序号：27833220发布日期：2021-12-07 22:49阅读：367来源：国知局

1.本发明涉及医学图像配准领域，特别涉及一种无监督学习的医学图像配准方法及系统。

背景技术：

2.现有的多模态医学图像配准多基于迭代数值优化方法，需在迭代过程中反复进行数值优化，计算量巨大，导致计算耗时过长，无法做到实时性。深度学习方法的推理速度快，但难以感知多模态图像中的大形变区域，难以实现大形变配准，现有的深度学习方法需要大量组织分割标签或形变场标签，在实际应用中通常获取以上标签。
3.所以，现在需要一种更可靠的方案。

技术实现要素：

4.本发明所要解决的技术问题在于针对上述现有技术中的不足，提供一种无监督学习的医学图像配准方法及系统。
5.为解决上述技术问题，本发明采用的技术方案是：一种无监督学习的医学图像配准方法，包括以下步骤：
6.1)构建深度学习配准网络，其包括空间自注意力配准网络和多分辨率图像配准网络；
7.2)将图像对：固定图像f和待配准的浮动图像m输入深度学习配准网络中，得到固定图像f和浮动图像m之间的形变场
8.3)基于形变场采用三线性插值对浮动图像m进行空间变换，得到最终的配准结果配准过程中，将配准结果与固定图像f的结构信息相似测度、平滑约束项和雅可比负值折叠罚项共同作为深度学习配准网络的损失函数l来引导网络参数的优化。
9.优选的是，所述步骤2)中，图像对：固定图像f和浮动图像m输入空间自注意力配准网络进行不同程度的下采样，形成多个低分辨率的图像，得到图像对之间的粗配准形变场然后通过多分辨率图像配准网络对低分辨率的图像进行配准，最终得到固定图像f和浮动图像m之间的形变场
10.优选的是，所述空间自注意力配准网络包括编码模块、解码模块和自注意力门控模块；
11.图像对：固定图像f和浮动图像m连接为2通道图像作为空间自注意力配准网络的输入，依次经过编码和解码阶段，最终得到3通道的粗配准形变场
12.其中，编码阶段使用卷积核大小为3、步长为1的3d卷积层，并且每个卷积后面都紧接着leakyrelu激活层；并且在编码阶段，使用两个最大池化层来下采样空间维度，同时增加通道深度；
13.其中，解码阶段交替使用上采样层、跨越连接和卷积层来逐步传递特征，最后经过一个步长为1的卷积和softsign激活层输出目标形变场；
14.其中，跨越连接采用自注意力门控模块连接，以将来自编解码阶段的不同水平信息合并到空间特征图上。
15.优选的是，其中，自注意力门控模块通过连接编码和解码阶段不同尺度的邻阶特征图，来获取空间维度上的不同权值，进而保留相关区域激活，去除不相关或者噪声响应，具体包括：
16.首先对解码阶段的当前特征图c进行上采样操作，得到与先前特征图p通道数目和图像大小一致的特征图c
′
；
17.然后沿着通道轴对p和c
′
分别采用平均池化和最大池化，并且将结果相加，得到一个有效的文本特征描述cf；
18.对于cf，再进行卷积核大小为1、步长为1的标准卷积操作后，得到的注意力特征图af通过sigmoid激活来归一化，消除差异性噪声；
19.最后，将af与p进行体素间对位相乘，可得到具有丰富上下文信息的空间注意力特征图。
20.优选的是，所述步骤2)中，通过多分辨率图像配准网络得到形变场的步骤具体包括：
[0021]2‑
1)首先，将输入的固定图像f和浮动图像m均通过三线性插值分别下采样为原来图像大小的1/2和1/4，即f＝2f2＝4f1，m＝2m2＝4m1；
[0022]2‑
2)将图像对(f1，m1)作为第一阶段的输入，通过空间自注意力配准网络计算图像f1和图像m1之间的形变场
[0023]2‑
3)对上采样，得到与图像对f2、m2大小一样的形变场将作为形变场并对m2进行空间形变得到
[0024]2‑
4)将图像对作为第二阶段的输入，通过空间自注意力配准网络计算图像f2和图像之间的形变场将与相加得到
[0025]2‑
5)对上采样，得到与图像对f、m大小一样的形变场利用形变场对m进行空间形变得到
[0026]2‑
6)将图像对作为第二阶段的输入，通过空间自注意力配准网络计算图像f和图像之间的形变场将与相加得到最终的形变场
[0027]
优选的是，损失函数l的表达式为：
[0028][0029]
其中，为配准结果与固定图像f的结构信息相似测度，l
smooth
为平滑约束项，l
jet
为雅可比负值折叠罚项，α、β和γ均为权值。
[0030]
优选的是，α、β和γ分别为10、0.5和200。
[0031]
优选的是，其中，的计算方法包括以下步骤：
[0032]3‑
1)对于图像i中的任意一点x的局部结构用六邻域进行表示：中心图块是以点x为中心、大小为p
×
p
×
p的图像块，外周是与中心图块距离为r的六邻域块；x点的邻域结构描述由x与六邻域图像块的高斯核距离来表示，假设六邻域中任一图像块为x
i
，则x与x
i
的高斯核距离表示为：
[0033][0034]
表示6组图像对的均方欧氏距离之和，其中，每组图像对表示为：
[0035]
其中，i＝1，2...6，d
p
(i，x，x
i
)表示6组图像对的均方欧氏距离之和，其中的每组图像对(x，x
i
)的均方欧氏距离为：以x为中心的图像块i
p
(x)与以x
i
为中心的图像块i
p
(x
i
)之间的均方欧氏距离；
[0036]
其中，σ2是所有图像对的均方欧氏距离的期望值，即：
[0037][0038]3‑
2)计算出所有的高斯核距离，定义模态无关邻域特征损失mind为：
[0039]
mind＝[d
gauss
(i，x，x
i
)}，i＝1，2...6；
[0040]3‑
3)定义为：
[0041][0042]
其中，n＝6。
[0043]
优选的是，其中，l
jet
的表达式为：
[0044][0045]
其中，m是中的全部元素总数，σ(
·
)表示一个线性激活函数，对所有正值都是线性的，负值全部为零；代表形变场的在位置p上的雅可比矩阵；
[0046]
的表达式为：
[0047][0048]
本发明还提供一种无监督学习的医学图像配准系统，其采用如上所述的方法进行医学图像配准。
[0049]
本发明的有益效果是：本发明提供的无监督学习的医学图像配准方法，无需预先准备的分割标签或形变场标签，可对不同模态中的大形变区域得到较好的配准精度，且本发明的配准速度快、可达到实时性效果。
附图说明
[0050]
图1为本发明的无监督学习的医学图像配准方法的原理框架图；
[0051]
图2为本发明的空间自注意力配准网络的结构图；
[0052]
图3为本发明的自注意力门控模块的结构图；
[0053]
图4为本发明的多分辨率图像配准网络的原理流程图；
[0054]
图5为mind邻域结构图。
具体实施方式
[0055]
下面结合实施例对本发明做进一步的详细说明，以令本领域技术人员参照说明书文字能够据以实施。
[0056]
应当理解，本文所使用的诸如“具有”、“包含”以及“包括”术语并不排除一个或多个其它元件或其组合的存在或添加。
[0057]
实施例1
[0058]
本实施例提供一种无监督学习的医学图像配准方法，包括以下步骤：
[0059]
1)构建深度学习配准网络，其包括空间自注意力配准网络和多分辨率图像配准网络；
[0060]
2)将图像对：固定图像f和待配准的浮动图像m输入深度学习配准网络中，得到固定图像f和浮动图像m之间的形变场
[0061]
其中，图像对：固定图像f和浮动图像m输入空间自注意力配准网络进行不同程度的下采样，形成多个低分辨率的图像，得到图像对之间的粗配准形变场然后通过多分辨率图像配准网络对低分辨率的图像进行配准，最终得到固定图像f和浮动图像m之间的形变场。
[0062]
给定一对三维图像：固定图像f和浮动图像m，配准的目的就是寻找一组最优的形变转换参数使得配准后的浮动图像与固定图像f在形态和解剖结构上对齐。本发明建了一个深度学习网络模型，直接估计f和m之间的形变场，可表示为：
[0063][0064]
其中f表示深度学习网络要学习的映射函数，θ是网络参数，是估计得到的形变场。一般通过最大化相似测度函数来训练网络，学习最优的网络参数其图像配准过程可表示为：
[0065][0066]
式中s表示固定图像f和配准后图像之间的相似测度，r是为了保持的平滑性而添加的正则项，代表非线性形变操作。
[0067]
3)基于形变场采用三线性插值对浮动图像m进行空间变换，得到最终的配准结果配准过程中，将配准结果与固定图像f的结构信息相似测度、平滑约束项和雅可比负值折叠罚项共同作为深度学习配准网络的损失函数l来引导网络参数的优化。
[0068]
参照图1，为本发明的整体配准框架。
[0069]
参照图2，本实施例中，空间自注意力配准网络包括编码模块、解码模块和自注意力门控模块；
[0070]
图像对：固定图像f和浮动图像m连接为2通道图像作为空间自注意力配准网络的输入，依次经过编码和解码阶段，最终得到3通道的粗配准形变场
[0071]
其中，编码阶段使用卷积核大小为3、步长为1的3d卷积层，并且每个卷积后面都紧接着参数为0.2的leakyrelu激活层；并且在编码阶段，使用两个最大池化层来下采样空间维度，同时增加通道深度；
[0072]
其中，解码阶段交替使用上采样层、跨越连接和卷积层来逐步传递特征，最后经过
一个步长为1的卷积和softsign激活层输出目标形变场；
[0073]
一般在学习目标形变时，为了防止低水平特征的消失，编解码路径上都会使用跨越连接。在优选的实施例中，跨越连接采用自注意力门控模块连接，以将来自编解码阶段的不同水平信息合并到空间特征图上。
[0074]
参照图3，其中，自注意力门控模块通过连接编码和解码阶段不同尺度的邻阶特征图，来获取空间维度上的不同权值，进而保留相关区域激活，去除不相关或者噪声响应，具体包括：
[0075]
首先对解码阶段的当前特征图c(current feature map)进行上采样操作，得到与先前特征图p(previous feature map)通道数目和图像大小一致的特征图c
′
；
[0076]
然后沿着通道轴对p和c
′
分别采用平均池化和最大池化，并且将结果相加，得到一个有效的文本特征描述cf(context feature)；
[0077]
对于cf，再进行卷积核大小为1、步长为1的标准卷积操作后，得到的注意力特征图af(attention feature)通过sigmoid激活来归一化，消除差异性噪声；
[0078]
最后，将af与p进行体素间对位相乘，可得到具有丰富上下文信息的空间注意力特征图。由于仅使用池化操作和卷积核为1的卷积操作，增加的必须优化的参数几乎为零，所以可以配合更加深层的网络使用，而几乎不增加额外的时间成本。
[0079]
图像配准的困难程度受结构差异较大区域对齐程度的影响，一般来说，差异较大区域与大形变关系密切，并且难以对齐。为了进一步提升网络抓取图像间结构差异的能力，本实施例中在跨越连接层前加入了空间自注意力门控模块，利用不同水平的空间和文本信息能突出大形变区域，精细化形变场。
[0080]
本实施例中，参照图4，在步骤2)中，通过多分辨率图像配准网络得到形变场的步骤具体包括：
[0081]2‑
1)首先，将输入的固定图像f和浮动图像m均通过三线性插值分别下采样为原来图像大小的1/2和1/4，即f＝2f2＝4f1，m＝2m2＝4m1；
[0082]2‑
2)将图像对(f1，m1)作为第一阶段的输入，通过空间自注意力配准网络计算图像f1和图像m1之间的形变场
[0083]2‑
3)对上采样，得到与图像对f2、m2大小一样的形变场将作为形变场并对m2进行空间形变得到
[0084]2‑
4)将图像对作为第二阶段的输入，通过空间自注意力配准网络计算图像f2和图像之间的形变场将与相加得到
[0085]2‑
5)对上采样，得到与图像对f、m大小一样的形变场利用形变场对m进行空间形变得到
[0086]2‑
6)将图像对作为第二阶段的输入，通过空间自注意力配准网络计算图像f和图像之间的形变场将与相加得到最终的形变场
[0087]
深度学习网络存在固有的视野域较小的缺陷，不利于较大形变的配准，由于网络的直接优化较为困难，收敛较慢且容易陷入局优，本实施例中，基于残差形变估计思想，提出了了一个多分辨率图像配准网络，将大形变配准问题简化为从粗到细的逐步配准的问题，能克服以上缺陷。
[0088]
在本实施例中，损失函数l的表达式为：
[0089][0090]
其中，为配准结果与固定图像f的结构信息相似测度，l
smooth
为平滑约束项，l
jet
为雅可比负值折叠罚项，α、β和γ均为权值。在一种优选的实施例中，α、β和γ分别为10、0.5和200。
[0091]
对于多模态图像配准，相似测度需要摆脱模态的限制，能够真正度量多模态图像对的相似性。为了解决这个问题，本发明引入基于结构信息的相似性损失，即模态无关邻域特征(mind)损失。mind被定义在基于自相似的非局部(non
‑
local)图像块上，依赖局部图像结构信息而不是图像灰度分布。具体的，本实施例中，的计算方法包括以下步骤：
[0092]3‑
1)参照图5，对于图像i中的任意一点x的局部结构用六邻域进行表示：中心图块是以点x为中心、大小为p
×
p
×
p的图像块，外周是与中心图块距离为r的六邻域块；x点的邻域结构描述由x与六邻域图像块的高斯核距离来表示，假设六邻域中任一图像块为x
i
，则x与x
i
的高斯核距离表示为：
[0093][0094]
表示6组图像对的均方欧氏距离之和，其中，每组图像对表示为：
[0095]
其中，i＝1，2...6，d
p
(i，x，x
i
)表示6组图像对的均方欧氏距离之和，其中的每组图像对(x，x
i
)的均方欧氏距离为：以x为中心的图像块i
p
(x)与以x
i
为中心的图像块i
p
(x
i
)之间的均方欧氏距离；
[0096]
其中，σ2是所有图像对的均方欧氏距离的期望值，即：
[0097][0098]3‑
2)计算出所有的高斯核距离，定义模态无关邻域特征损失mind为：
[0099]
mind＝{d
gauss
(i，x，x
i
)}，i＝1，2...6；
[0100]3‑
3)定义为：
[0101][0102]
本实施例中采用六邻域，所以n＝6；当然也可以采用八邻域，十六邻域等。
[0103]
在图像配准过程中，所有的体素不一定经历相同的形变量，严重变形的体素会导致折叠或者撕裂现象。为了减少上述情况发生，本发明中提出使用基于雅可比负值折叠罚项的动态折叠罚项来进一步约束形变。
[0104]
具体的，其中，雅可比负值折叠罚项l
jet
的表达式为：
[0105][0106]
其中，m是中的全部元素总数，σ(
·
)表示一个线性激活函数，对所有正值都是线性的，负值全部为零，本实施例中，设置σ(
·
)为relu函数；代表形变场的在位置p上的雅可比矩阵；
[0107]
的表达式为：
[0108][0109]
其中，x、y、z在这里是表示方向，即x轴方向，y轴方向和z轴方向。
[0110]
形变场的雅可比矩阵是三个方向的形变导数的二阶张量，其行列式可以用于分析形变场的局部状态。例如：点为正值，表示点p在其邻域范围内能够保持方向性。相反的，如果点为负值，表示点p在其邻域范围内存在折叠，导致正常的拓扑性遭到破坏。我们根据此事实，在雅可比负值体素上嵌入反折叠罚项，这样，雅可比行列式中负值区域将受到惩罚，正值区域几乎不受影响。进一步的，本实施例中还联合使用平滑约束项l
smooth
，在反折叠的同时还能尽量保持整体形变的平滑。
[0111]
实施例2
[0112]
本实施例提供一种无监督学习的医学图像配准系统，其采用实施例1的方法进行医学ct和mr图像的配准。
[0113]
尽管本发明的实施方案已公开如上，但其并不仅仅限于说明书和实施方式中所列运用，它完全可以被适用于各种适合本发明的领域，对于熟悉本领域的人员而言，可容易地实现另外的修改，因此在不背离权利要求及等同范围所限定的一般概念下，本发明并不限于特定的细节。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：戴亚康;周志勇;胡冀苏;钱旭升;耿辰
技术所有人：中国科学院苏州生物医学工程技术研究所
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。