本发明属于计算机视觉领域,具体涉及一种基于彩色图引导的深度图超分辨率重建网络构建方法。
背景技术:
随着获取深度信息的技术的发展,如激光雷达,飞行时间(tof)相机,三维结构光,深度图像已被广泛应用于移动机器人,人机交互,人体姿态估计和三维场景重建等。然而,从这些技术获得的深度图像仍然无法满足实际需求,尤其是获取的深度图像分辨率较低。因此,如何将低分辨率的深度图像重建成高质量高分辨率深度图像成为计算视觉领域的研究热点。
近年来,随着深度学习的发展,越来越多的基于卷积神经网络的超分辨方法被提出。经过在大量图片数据集上的训练,卷积神经网络能够充分学习目标物体的特征,并将这些特征进行组合得到最后的重建结果。相较传统的超分辨算法,基于卷积神经网络的超分辨算法需要依赖于非常大的数据集,所以通过卷积层提取出的特征更具有普适性,更能代表物体的通用特征。通常,基于cnn的深度超分辨率方法可以实现比传统方法更好的性能。
目前大量的传统深度图像超分辨算法都是基于同场景的彩色图像引导的重建,获取高分辨率高质量的彩色图像的方法已经比较成熟,但相较于深度图像,彩色图像纹理区域较多,利用普通的卷积神经网进行彩色图像引导深度图像重建可能会带来负面作用,因此需要构建具有强大的特征提取能力的网络。
技术实现要素:
本发明的目的就是克服现有技术的不足,提出了一种基于彩色图引导的深度图超分辨率重建网络构建方法。本方法不仅可以很好地提取了同场景下高分辨率高质量的彩色图像可以提供的深度图像重建有利信息,而且可以丰富深度特征图像的多样性。最终融合这些有利信息,重建出高分辨率高质量的深度图像。具体步骤如下:
步骤(1):利用rgb-d相机获取同场景彩色图像和深度图像
使用rgb-d相机得到一张低分辨率深度图像idepth其分辨率为m*n,和一张相同视角下的高分辨率彩色图像icolor其分辨率为rm*rn,其中r为倍率,m和n分别为图像的高和宽。对低分辨率的深度图像idepth进行双三次上采样操作放大至rm*rn,获得了初始的低质量高分辨率深度图像
步骤(2):基于卷积神经网络的双支图像特征提取结构构建,在图像特征提取阶段两支结构相同,每一支在特征提取的阶段由两层卷积核大小为3*3的卷积层和五个权值共享的多尺度残差块multi-scalerecursiveresidualblock组成,这个阶段中的所有的卷积层之后都紧连着一个rectifiedlinearunit激活层,得到了设计网络的特征提取部分。
(a)
(b)多尺度残差结构构建,然后各自经过五个多尺度残差块的提取特征,假设输入特征图为xm-1,每个多尺度残差块的计算步骤如下:
①
首先将特征图xm-1经过并行结构中卷积核大小为3*3的卷积层之后通过激活层得到的特征图r1。其中σ(·)代表激活层,
②
同时特征图xm-1也经过并行结构中卷积核大小为5*5的卷积层之后通过激活层得到的特征图p1,其中
③
之后将特征图r1和特征图p1拼接在一起,输入卷积核大小为5*5的卷积层
④
最后特征图r2通过卷积核大小为1*1的卷积层
初始的特征图
步骤(3):特征融合网络结构构建
特征融合引导阶段的网络由一个特征图像拼接操作、三个权值共享的多尺度残差块和一个卷积核大小为3*3的卷积层构成,该阶段的每个卷积层之后都紧连一个rectifiedlinearunit激活层。
将深度图像的特征图
步骤(4):残差结构构建,重建高质量高分辨率深度图像
重建阶段的卷积神经网络由一个卷积核大小为3*3的卷积层和一次残差连接操作构成。
本发明的有益效果:本发明利用卷积神经网络学习彩色图像中对引导深度图像重建有利的信息,可以免去人工寻找彩图引导特征的过程,很好的利用了深度图像和彩色图像相关性,能够重建出高质量高分辨率的深度图像。
附图说明
图1为本发明的流程图。
具体实施方式
以下结合附图1对本发明作进一步说明,本发明包括以下步骤:
步骤(1):利用rgb-d相机获取同场景彩色图像和深度图像
使用rgb-d相机得到一张低分辨率深度图像idepth其分辨率为m*n,和一张相同视角下的高分辨率彩色图像icolor其分辨率为rm*rn,其中r为倍率,m和n分别为图像的高和宽。对低分辨率的深度图像idepth进行双三次上采样操作放大至rm*rn,获得了初始的低质量高分辨率深度图像
步骤(2):基于卷积神经网络的双支图像特征提取结构构建,在图像特征提取阶段两支结构相同,每一支在特征提取的阶段由两层卷积核大小为3*3的卷积层和五个权值共享的多尺度残差块multi-scalerecursiveresidualblock组成,这个阶段中的所有的卷积层之后都紧连着一个rectifiedlinearunit激活层,得到了设计网络的特征提取部分。
(a)
(b)多尺度残差结构构建,然后各自经过五个多尺度残差块的提取特征,假设输入特征图为xm-1,每个多尺度残差块的计算步骤如下:
①
首先将特征图xm-1经过并行结构中卷积核大小为3*3的卷积层之后通过激活层得到的特征图r1。其中σ(·)代表激活层,
②
同时特征图xm-1也经过并行结构中卷积核大小为5*5的卷积层之后通过激活层得到的特征图p1,其中
③
之后将特征图r1和特征图p1拼接在一起,输入卷积核大小为5*5的卷积层
④
最后特征图r2通过卷积核大小为1*1的卷积层
初始的特征图
步骤(3):特征融合网络结构构建
特征融合引导阶段的网络由一个特征图像拼接操作、三个权值共享的多尺度残差块和一个卷积核大小为3*3的卷积层构成,该阶段的每个卷积层之后都紧连一个rectifiedlinearunit激活层。
将深度图像的特征图
步骤(4):残差结构构建,重建高质量高分辨率深度图像
重建阶段的卷积神经网络由一个卷积核大小为3*3的卷积层和一次残差连接操作构成。