基于PSV神经网络的跨尺度图像拼接方法及装置与流程

文档序号:21699560发布日期:2020-07-31 23:00阅读:293来源:国知局
基于PSV神经网络的跨尺度图像拼接方法及装置与流程

本发明涉及数字图像及视频的处理技术领域,特别涉及一种基于psv神经网络的跨尺度图像拼接方法及装置。



背景技术:

随着计算机视觉技术的不断发展和对高质量图像视频的需求越来越大,而单相机的图像分辨率提升困难,难以满足图像分辨率需求,因此催生了单相机扫描、相机阵列等多种亿级像素图像的获取技术,而基于低分辨率全局参考图像的跨尺度相机阵列则是当前最受关注的一种高分辨率图像获取方法。多尺度相机阵列在传统相机阵列的基础上增加了一个短焦距的全局参考相机,以其获取的全局画面为参考,将其他局部画面拼接在一起,形成最终的高分辨率图像。然而,由于相机阵列中各个相机位置存在差异,不同相机采集的图像之间存在视差,传统的基于稀疏特征和图像扭转的图像拼接技术具有受视差影响大、无法保持图像一致性等固有缺陷,难以实现高质量的拼接效果和实时拼接。因此,寻找能够消除视差影响,实现高质量实时拼接的算法成为十亿像素技术发展和工程化应用的迫切需求。此外,由于这一技术所处理的图像具有大尺寸,大视差的特点,现有的基于神经网络的拼接算法也难以应用。

近年来,使用卷积神经网络实现基于参考图的图像超分辨率重建取得了较好的效果,产生了多种实现方法和网络结构。

一是基于图像块的匹配和拼接。郑海天等人提出了使用卷积神经网络实现基于参考图的图像超分辨率重建。首先将低分辨率图像和高分辨率参考图像拆分成多个小图像块,然后通过cc-net提取每个小图像块的多尺度特征,并在其邻域内寻找其最佳匹配,最后通过ss-net将小图像块拼接起来生成结果图像。这种方法类似于网格化非均匀扭转算法,通过卷积神经网络使图像块尺寸更小,匹配精度更高。之后又有多篇文章对这一方法进行了不同改进,使重建结果更加精确和稳定,但是这种基于小图像块的方法会使重建图像具有无法避免的与非均匀扭转算法类似的网格效应。

二是基于像素的扭转。为了消除网格效应,郑海天等人提出了crossnet,抛弃了基于图像块匹配拼接的思路,采用了基于像素扭转的方法,使用全卷积跨尺度扭转模块将每个点进行扭转对齐,最后再通过卷积层生成目标图像。通过这一方法,在消除网格效应,提升图像质量的同时,有效提高了计算效率,计算速度较refsr提高了100倍。

以上两种方法基本沿用了传统图像拼接中匹配、拼接的思想,通过卷积神经网络实现了基于小图像块或像素点的匹配、拼接,有效改善了拼接效果,提升了拼接速度。然而,现有的跨尺度图像拼接方法存在如下缺陷:

(1)传统拼接方法,主要通过两个图像之间的稀疏特征点提取与匹配,对图像进行扭转对齐,该方法的主要问题是拼接过程复杂,结果图像存在统一性差或网格效应;(2)利用神经网络进行图像的特征提取与匹配,进行基于像素的扭转匹配,这种方法可以提高结果图像的统一性,消除网格效应,提高拼接速度,但是难以实现大视差的图像拼接。



技术实现要素:

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

为此,本发明的一个目的在于提出一种基于psv神经网络的跨尺度图像拼接方法,该方法具有拼接效果好,一致性好,能够处理大视差、大尺寸图像,计算速度快,可用于实时拼接等特点,在处理大尺寸图像和现实场景图像方面具有独特的优势。

本发明的另一个目的在于提出一种基于psv神经网络的跨尺度图像拼接装置。

为达到上述目的,本发明一方面实施例提出了一种基于psv神经网络的跨尺度图像拼接方法,包括以下步骤:对图像进行扫描,生成图像psv;将所述图像psv送入神经网络,以提取图像特征,并计算权重;根据所述权重进行加权组合,获得拼接结果图像。

本发明实施例的基于psv神经网络的跨尺度图像拼接方法,首先对图像进行扫描形成图像psv,然后将其送入神经网络提取特征,计算权重,最后加权组合获得结果图像,从而通过psv处理和特殊的网络结构,一方面使网络能够处理大视差的图像对,一方面减少了网络信息承载量和网络参数,提高了网络性能,进而在提高拼接速度和图像统一性的前提下,有效提高了对大视差图像的处理能力,在处理大尺寸图像和现实场景图像方面具有独特的优势。

另外,根据本发明上述实施例的基于psv神经网络的跨尺度图像拼接方法还可以具有以下附加的技术特征:

进一步地,在本发明的一个实施例中,在对所述图像进行扫描之前,还包括:将待处理的所述图像对进行基线校准,使视差分布在水平方向,并设置第一预设分辨率局部图像输入的水平方向尺寸满足预设条件;将所述待处理的图像对进行颜色匹配校准。

进一步地,在本发明的一个实施例中,所述对图像进行扫描,生成图像psv,包括:以低于第二预设分辨率全局图像大小为视窗,在局部图像水平方向进行滑动扫描,生成多个与全局图像相同大小的局部子图像;将每个子图像堆叠起来,形成平面扫描体。

进一步地,在本发明的一个实施例中,所述将所述图像psv送入神经网络,以提取图像特征,并计算权重,包括:将所述图像psv与所述低于第二预设分辨率全局图像送入所述神经网络进行特征提取和处理,生成多张权重图。

进一步地,在本发明的一个实施例中,所述根据所述权重进行加权组合,获得拼接结果图像,包括:将所述多张权重图与所述psv进行加权组合,获得大于所述第三分辨率的结果图像;将所述结果图像进行基线反变换处理,拼接后生成所述拼接结果图像。

为达到上述目的,本发明另一方面实施例提出了一种基于psv神经网络的跨尺度图像拼接装置,包括:psv处理模块,用于对图像进行扫描,生成图像psv;输入模块,用于将所述图像psv送入神经网络,以提取图像特征,并计算权重;加权组合模块,用于根据所述权重进行加权组合,获得拼接结果图像。

本发明实施例的基于psv神经网络的跨尺度图像拼接装置,首先对图像进行扫描形成图像psv,然后将其送入神经网络提取特征,计算权重,最后加权组合获得结果图像,从而通过psv处理和特殊的网络结构,一方面使网络能够处理大视差的图像对,一方面减少了网络信息承载量和网络参数,提高了网络性能,进而在提高拼接速度和图像统一性的前提下,有效提高了对大视差图像的处理能力,在处理大尺寸图像和现实场景图像方面具有独特的优势。

另外,根据本发明上述实施例的基于psv神经网络的跨尺度图像拼接装置还可以具有以下附加的技术特征:

进一步地,在本发明的一个实施例中,还包括:预处理模块,用于在对所述图像进行扫描之前,将待处理的所述图像对进行基线校准,使视差分布在水平方向,并设置第一预设分辨率局部图像输入的水平方向尺寸满足预设条件;将所述待处理的图像对进行颜色匹配校准。

进一步地,在本发明的一个实施例中,所述psv处理模块进一步用于以低于第二预设分辨率全局图像大小为视窗,在局部图像水平方向进行滑动扫描,生成多个与全局图像相同大小的局部子图像;将每个子图像堆叠起来,形成平面扫描体。

进一步地,在本发明的一个实施例中,所述输入模块进一步用于将所述图像psv与所述低于第二预设分辨率全局图像送入所述神经网络进行特征提取和处理,生成多张权重图。

进一步地,在本发明的一个实施例中,所述加权组合模块进一步用于将所述多张权重图与所述psv进行加权组合,获得大于所述第三分辨率的结果图像;将所述结果图像进行基线反变换处理,拼接后生成所述拼接结果图像。

本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1为根据本发明实施例的基于psv神经网络的跨尺度图像拼接方法的流程图;

图2为根据本发明实施例的基于psv神经网络的输入示意图;

图3为根据本发明实施例的基于psv神经网络的psv生成示意图;

图4为根据本发明实施例的基于psv神经网络的psv与权重图加权组合的示意图;

图5为根据本发明实施例的基于psv神经网络的网络结构示意图;

图6为根据本发明实施例的基于psv神经网络的拼接效果示意图;

图7为根据本发明实施例的基于psv神经网络的跨尺度图像拼接装置的结构示意图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

本发明实施例所提出的方法及装置的目标是实现跨尺度图像拼接,即利用低分辨率图像和相似视角高分辨率图像,经神经网络提取特征和计算,生成高分辨率的目标图像。

下面参照附图描述根据本发明实施例提出的基于psv神经网络的跨尺度图像拼接方法及装置,首先将参照附图描述根据本发明实施例提出的基于psv神经网络的跨尺度图像拼接方法。

图1是本发明一个实施例的基于psv神经网络的跨尺度图像拼接方法的流程图。

如图1所示,该基于psv神经网络的跨尺度图像拼接方法,利用多尺度相机阵列获取的低分辨率全局图像和相似视角高分辨率局部图像,其中,方法包括以下步骤:

在步骤s101中,对图像进行扫描,生成图像psv。

可以理解的是,如图2所示,本发明实施例对高分辨率局部图像进行psv处理。

在本发明的一个实施例中,对图像进行扫描,生成图像psv,包括:以低于第二预设分辨率全局图像大小为视窗,在局部图像水平方向进行滑动扫描,生成多个与全局图像相同大小的局部子图像;将每个子图像堆叠起来,形成平面扫描体。

可以理解的是,如图3所示,以低分辨率全局图像大小为视窗在局部图像水平方向进行滑动扫描,生成d个与全局图像相同大小的局部子图像,再将各个子图像堆叠起来形成平面扫描体(psv)。

举例而言,生成psv的具体步骤如下:

(1)以步长1生成psv151;

(2)以步长5生成psv31;

(3)psv31和psv151分别与低分辨率全局图像堆叠形成psv31+lg和psv151+lg。

进一步地,采用本发明实施例的生成psv方法可以减少网络输入量,减少计算量,提高网络效率。

进一步地,在本发明的一个实施例中,在对图像进行扫描之前,还包括:将待处理的图像对进行基线校准,使视差分布在水平方向,并设置第一预设分辨率局部图像输入的水平方向尺寸满足预设条件;将待处理的图像对进行颜色匹配校准。

可以理解的是,如图2所示,在对图像进行扫描之前,本发明实施例对图像进行预处理,具体地:将待处理的图像对进行基线校准,使视差分布在水平方向,并设置高分辨率局部图像输入的水平方向尺寸略大;颜色校准,将待处理图像对进行颜色匹配校准。其中,本发明实施例可以设置全局图像和局部图像的水平方向像素差为150个像素。

在步骤s102中,将图像psv送入神经网络,以提取图像特征,并计算权重。

在本发明的一个实施例中,将图像psv送入神经网络,以提取图像特征,并计算权重,包括:将图像psv与低于第二预设分辨率全局图像送入神经网络进行特征提取和处理,生成多张权重图。

可以理解的是,如图2所示,本发明实施例将psv与低分辨率全局图像一起送入卷积神经网络进行特征提取和处理,生成d张权重图,其中,网络结构如图4所示。

举例而言,将psv与低分辨率全局图像一起送入卷积神经网络进行特征提取和处理,生成d张权重图的具体步骤如下:

(1)将psv31+lg送入网络卷积层进行特征筛选和提取,生成152张权重图;

(2)将psv151+lg与生成的权重图进行加权组合,生成高分辨率结果图像。

进一步地,步骤s102中的网络卷积层包括4个全连接卷积模块,每个全连接卷积模块包括4层全连接卷积层,每个卷积层包括32个卷积核。除最后一层使用softmax外,其他卷积层均使用relu作为激活函数。

优选的,本发明实施例提出的基于psv的神经网络在训练时的损失函数包括两部分,一是目标图像损失,二是权重约束。目标图像损失部分采用目标图像与真值的均方差;权重约束部分主要包括以三点:一是在目标图像中,来自lg的像素数量应尽可能少;二是目标图像中的一个点应该来自hl中的一个点;三是hl中的每个点应该被使用1次或0次,即每个点的权重应为“1”或“0”。

优选的,本发明实施例提出的基于psv的神经网络的训练使用kitti的city数据集,该数据集中的图片为双相机拍摄的城市实景图像。

在步骤s103中,根据权重进行加权组合,获得拼接结果图像。

在本发明的一个实施例中,根据权重进行加权组合,获得拼接结果图像,包括:将多张权重图与psv进行加权组合,获得大于第三分辨率的结果图像;将结果图像进行基线反变换处理,拼接后生成拼接结果图像。

可以理解的是,本发明实施例将d张权重图与psv进行加权组合,获得输出的高分辨率结果图像,加权组合示意如图5所示。然后,将获得的高分辨率结果图像进行后处理,即基线反变换,完成拼接,拼接效果示意图如图6所示。

综上,本发明实施例根据跨尺度相机阵列的嵌入式拼接特点,引入在光场重建和显微领域广泛应用的超分辨率重建思想,采用基于psv的卷积神经网络实现以高分辨率局部图像为参考的低分辨率全局图像的超分辨率重建,进而实现跨尺度嵌入式拼接。相较于传统拼接技术,该方法可以在实现嵌入式拼接的同时完成视角转换,消除视差影响,保持目标图像一致性,并有效提高拼接速度,为实时拼接提供可能。

根据本发明实施例提出的基于psv神经网络的跨尺度图像拼接方法,首先对图像进行扫描形成图像psv,然后将其送入神经网络提取特征,计算权重,最后加权组合获得结果图像,从而通过psv处理和特殊的网络结构,一方面使网络能够处理大视差的图像对,一方面减少了网络信息承载量和网络参数,提高了网络性能,进而在提高拼接速度和图像统一性的前提下,有效提高了对大视差图像的处理能力,在处理大尺寸图像和现实场景图像方面具有独特的优势。

其次参照附图描述根据本发明实施例提出的基于psv神经网络的跨尺度图像拼接装置。

图7是本发明一个实施例的基于psv神经网络的跨尺度图像拼接装置的结构示意图。

如图7所示,该基于psv神经网络的跨尺度图像拼接装置10包括:psv处理模块100、输入模块200和加权组合模块300。

其中,psv处理模块100用于对图像进行扫描,生成图像psv;输入模块200用于将图像psv送入神经网络,以提取图像特征,并计算权重;加权组合模块300用于根据权重进行加权组合,获得拼接结果图像。本发明实施例的装置10具有拼接效果好,一致性好,能够处理大视差、大尺寸图像,计算速度快,可用于实时拼接等特点,在处理大尺寸图像和现实场景图像方面具有独特的优势。

进一步地,在本发明的一个实施例中,本发明实施例的装置10还包括:预处理模块。其中,预处理模块用于在对图像进行扫描之前,将待处理的图像对进行基线校准,使视差分布在水平方向,并设置第一预设分辨率局部图像输入的水平方向尺寸满足预设条件;将待处理的图像对进行颜色匹配校准。

进一步地,在本发明的一个实施例中,psv处理模块100进一步用于以低于第二预设分辨率全局图像大小为视窗,在局部图像水平方向进行滑动扫描,生成多个与全局图像相同大小的局部子图像;将每个子图像堆叠起来,形成平面扫描体。

进一步地,在本发明的一个实施例中,输入模块200进一步用于将图像psv与低于第二预设分辨率全局图像送入神经网络进行特征提取和处理,生成多张权重图。

进一步地,在本发明的一个实施例中,加权组合模块300进一步用于将多张权重图与psv进行加权组合,获得大于第三分辨率的结果图像;将结果图像进行基线反变换处理,拼接后生成拼接结果图像。

需要说明的是,前述对基于psv神经网络的跨尺度图像拼接方法实施例的解释说明也适用于该实施例的基于psv神经网络的跨尺度图像拼接装置,此处不再赘述。

根据本发明实施例提出的基于psv神经网络的跨尺度图像拼接装置,首先对图像进行扫描形成图像psv,然后将其送入神经网络提取特征,计算权重,最后加权组合获得结果图像,从而通过psv处理和特殊的网络结构,一方面使网络能够处理大视差的图像对,一方面减少了网络信息承载量和网络参数,提高了网络性能,进而在提高拼接速度和图像统一性的前提下,有效提高了对大视差图像的处理能力,在处理大尺寸图像和现实场景图像方面具有独特的优势。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1