一种结合深度图切片和神经网络的目标检测方法和系统与流程

文档序号:18944523发布日期:2019-10-23 01:27阅读:389来源:国知局
一种结合深度图切片和神经网络的目标检测方法和系统与流程

本申请涉目标检测领域,尤其涉及一种结合深度图切片和神经网络的目标检测方法和系统。



背景技术:

随着卷积神经网络(cnn)在图像特征提取领域取得的巨大成功,很多研究开始将cnn网络移植到3d点云进行试验,比如pointnet++在3d物体分类上取得了成功。但是点云的卷积网络复杂度高,运算量大,且样本收集都非常困难,离产品化还有不小的距离。

利用深度相机很容易获得彩色和深度(rgb-d)数据,但是基于神经网络的图像检测算法中,卷积对于深度图的特征提取能力较弱,常常忽略目标的轮廓,因此,采用传统的cnn网络对深度图片进行卷积对图像的分割和目标识别帮助不大,反而会增加了运算量。对此,传统的图像算法有着很好的效果,比如在深度方向进行切片二值化,往往能很有效的对目标进行分离。但是这个方法的缺点是通用性很差,需要人去进行观察或者根据场景进行参数调整。



技术实现要素:

本申请实施例提供了一种结合深度图切片和神经网络的目标检测方法和系统,解决了现有技术中神经网络不能完整提取目标的整体轮廓信息,反而增加了运算量的技术问题。

有鉴于此,本申请第一方面提供了一种结合深度图切片和神经网络的目标检测方法,所述方法包括:

采集包含目标物体的rgb-d图像;

切片处理所述rgb-d图像中的深度图,将包含目标物体轮廓的切片图进行叠加,得到目标轮廓图;

将所述rgb-d图像中的rgb图像卷积处理;

将所述切片处理后的目标轮廓图以及所述卷积处理后的rgb图像输入深度卷积神经网络中,得到目标检测分割结果。

优选地,在所述采集包含目标物体的rgb-d图像后还包括:

对所述rgb-d图像中的rgb图像进行坐标变换和对齐处理,对所述rgb-d图像中的深度图进行坐标变换和对齐处理。

优选地,所述切片处理所述rgb-d图像中的深度图,将包含目标物体轮廓的切片进行叠加,得到目标轮廓图具体包括:

将所述深度图切片,得到若干切片;

将每个所述切片二值化处理,得到切片二值图;

对所述切片灰度图形态学操作和连通区域分析,得到第一连通图像;

对第一连通图像过滤处理,去除掉小连通区域,得到第二连通图像;

计算每一个第二连通图像的重心;

根据每个所述第二连通图像的重心,对所述第二连通图像聚合处理;

叠加所述聚合处理后的第二连通图像,得到包含有目标物体轮廓的目标轮廓图。

优选地,所述将深度图切片的方法为均匀切片或者百分位切片;

所述均匀切片即等深度切片,相邻切片之间为完全不重叠或者存在部分重叠;

所述百分位切片是按照固定的百分位切片,每个切片包含固定比例的深度信息,相邻切片之间为完全不重叠或者存在部分重叠。

优选地,在所述将深度图切片,得到若干切片之前还包括:

对所述深度图进行平滑滤波处理或者深度阈值分割。

本申请第二方面提供一种结合深度图切片和神经网络的目标检测系统,所述系统包括:

图像采集模块,所述图像采集模块用于采集包含目标物体的rgb-d图像;

切片处理模块,所述切片处理模块用于切片处理所述rgb-d图像中的深度图,将包含目标物体轮廓的切片图进行叠加,得到目标轮廓图;

图像卷积模块,所述图像卷积模块用于对所述rgb-d图像中的rgb图像卷积处理;

目标检测分割模块,所述目标检测分割模块用于将所述切片处理后的目标轮廓图以及所述卷积处理后的rgb图像输入深度卷积神经网络中,得到目标检测分割结果。

优选地,所述系统还包括预处理模块;

所述预处理模块用于对所述rgb-d图像中的rgb图像进行坐标变换和对齐处理,对所述rgb-d图像中的深度图进行坐标变换和对齐处理。

优选地,所述切片处理模块包括:

切片模块,所述切片模块用于将所述深度图切片,得到若干切片;

二值化模块,所述二值化模块用于将每个所述切片二值化处理,得到切片二值图;

连通区域分析模块,所述连通区域分析模块用于对所述切片灰度图形态学操作和连通区域分析,得到第一连通图像;

图像过滤模块,所述图像过滤模块用于对第一连通图像过滤处理,去除掉小连通区域,得到第二连通图像;

重心计算模块,所述重心计算模块用于计算每一个第二连通图像的重心;

聚合模块,所述聚合模块用于根据每个所述第二连通图像的重心,对所述第二连通图像聚合处理;

叠加模块,所述叠加模块用于叠加所述聚合处理后的第二连通图像,得到包含有目标物体轮廓的目标轮廓图。

优选地,所述系统还包括平滑滤波模块或者深度阈值分割模块;

所述平滑滤波模块用于对所述深度图进行平滑滤波处理;

所述深度阈值分割模块用于对所述深度图进行阈值分割处理。

本申请第三方面提供一种结合深度图切片和神经网络的目标检测设备,所述设备包括处理器以及存储器:

所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;

所述处理器用于根据所述程序代码中的指令,执行如上述第一方面所述的结合深度图切片和神经网络的目标检测方法的步骤。

从以上技术方案可以看出,本申请实施例具有以下优点:本申请提供了一种结合深度图切片和神经网络的目标检测方法,包括:采集包含目标物体的rgb-d图像;切片处理所述rgb-d图像中的深度图,将包含目标物体轮廓的切片图进行叠加,得到目标轮廓图;将所述rgb-d图像中的rgb图像卷积处理;将所述切片处理后的目标轮廓图以及所述卷积处理后的rgb图像输入深度卷积神经网络中,得到目标检测分割结果。

本申请实施例中,提供了一种结合深度图切片和神经网络的目标检测方法,通过采用对深度图切割的方法,可以有效的分割出场景中的目标形状,并利用分割好的形状作为目标检测神经网络的输入,有力的弥补了神经网络只关注细节特征而忽略轮廓特征的缺点,极大的提高了目标检测的稳定性和抗干扰能力。

附图说明

图1为本申请一种结合深度图切片和神经网络的目标检测方法的一个实施例的流程图;

图2为本申请一种结合深度图切片和神经网络的目标检测方法的另一个实施例的方法流程图;

图3为本申请一种结合深度图切片和神经网络的目标检测系统的一个实施例的系统框图;

图4为本申请一种结合深度图切片和神经网络的目标检测系统的另一个实施例的系统框图;

图5为本申请一种结合深度图切片和神经网络的目标检测方法的球形坐标切片方式的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

应理解,图1为本申请一种结合深度图切片和神经网络的目标检测方法的一个实施例流程图,如图1所示,图1中包括:

101、采集包含目标物体的rgb-d图像。

需要说明的是,采集的包含目标物体的rgb-d图像为三维图像,它包含有深度图和rgb图像,其中深度图中每个像素值是传感器距离物体的实际距离,rgb图像是常见的rgb三通道彩色图像。

102、切片处理rgb-d图像中的深度图,将包含目标物体轮廓的切片图进行叠加,得到目标轮廓图。

需要说明的是,将深度图切片处理是根据实际距离的不同,选取不同的距离区间进行切片,再选取包含有目标物体轮廓的切片进行叠加就可以得到目标物体的具体轮廓。

103、将rgb-d图像中的rgb图像卷积处理。

104、将切片处理后的目标轮廓图以及卷积处理后的rgb图像输入深度卷积神经网络中,得到目标检测分割结果。

需要说明的是,将切片处理后的深度图以及卷积处理后的rgb图像分别作为深度神经网络的输入,经过神经网络的训练和学习获取轮廓清晰、高精度的目标图像。

本申请实施例中,提供了一种结合深度图切片和神经网络的目标检测方法,通过采用对深度图切割的方法,可以有效的分割出场景中的目标形状,并利用分割好的形状作为目标检测神经网络的输入,有力的弥补了神经网络只关注细节特征而忽略轮廓特征的缺点,极大的提高了目标检测的稳定性和抗干扰能力。

应理解,图2为本申请一种结合深度图切片和神经网络的目标检测方法的另一个实施例的流程图,如图2所示,图2中包括:

201、采集包含目标物体的rgb-d图像。

需要说明的是,采集的包含目标物体的rgb-d图像为三维图像,它包含有深度图和rgb图像,其中深度图中每个像素值是传感器距离物体的实际距离,rgb图像是常见的rgb三通道彩色图像。

202、将rgb-d图像中的rgb图像卷积处理。

进一步的,在对rgb-d图像中的rgb图像卷积处理之前,先要对rgb图像进行坐标变换和对齐处理。

203、将深度图切片,得到若干切片。

需要说明的是,在将深度图切片之前,首先对深度图进行坐标变换和对齐处理;并且为了能够尽可能细致的提取出目标物体所在的深度范围的深度图,需要先将整个深度图进行切片处理。

进一步的,在深度图切片之前,可以先对深度图预处理,预处理包括平滑滤波处理或者深度阈值分割;平滑滤波是为了去除深度图噪声;深度阈值分割即只在一个或者多个给定的深度范围内进行切割。

进一步的,深度切片可以是按照切片图像上每个点到相机镜头所在平面等距离进行切片,也可以按照切片图像上每个像素点到相机镜头等距离进行切片,即以相机镜头为球形坐标原点进行球面切片,具体如图5所示。

进一步的,对深度图切片的方法可以采用均匀切片或者百分位切片;其中,均匀切片即等深度切片,相邻切片之间为完全不重叠或者存在部分重叠;在具体的实施例当中,采用的深度相机采集的rgb-d图像的深度为50cm到500cm,在以相机为原点的3维坐标系,相机镜头所在的平面为xy平面,相机面向的方向为轴。50cm和500cm就相当于2个平面(z=50和z=500),那么如果均匀切片9份,就是将这个空间每隔50cm一个平面,(z=100,150,...,500)将空间分割开,每两个平面之间的物体透过小孔成像为一张wxh的图片;若重叠设置,则可以分成17份,即每相邻两个50cm的深度区间之间包含25cm的重叠部分。

百分位切片是按照固定的百分位切片,每个切片包含固定比例的深度信息,相邻切片之间为完全不重叠或者存在部分重叠;在具体实施例中,将z=50,到z=500之间先用很小的区间均匀切片,计算每个切片里面的成像物体的面积,可以获得一个直方图h(z),然后再在直方图上面寻找一组z来分割,使得每两个切片目标物体的体积是相等的;也可以采用复杂的百分位切片,可以选取动态的百分比输入进行切割。

204、将每个切片二值化处理,得到切片二值图。

需要说明的是,为了便于后续的处理,需要先将深度切片图二值化处理,以减少图像的数据量,并凸显出目标的轮廓。

205、对切片灰度图形态学操作和连通区域分析,得到第一连通图像。

需要说明的是,为了能够更好地凸显出图像的轮廓信息,需要对二值化后的图像进行形态学处理和连通区域分析。

206、对第一连通图像过滤处理,去除掉小连通区域,得到第二连通图像。

需要说明的是,为了减少干扰,凸显出图像的轮廓信息,需要过滤第一连通图像中的小连通区域。

207、计算每一个第二连通图像的重心。

208、根据每个第二连通图像的重心,对第二连通图像聚合处理。

需要说明的是,通过对连通区域的重心计算切片图像的距离,根据切片图像的距离聚合处理,得到目标物体所在深度范围的深度图。

进一步的,切片聚合算法可以采用包括k-means聚合算法,每两个相邻的切片之间的距离就是切片的质心之间的空间距离。

进一步的,切片聚合可以采用神经网络的方式实现。

209、叠加聚合处理后的第二连通图像,得到包含有目标物体轮廓的待检测切片图。

需要说明的是,聚合后的图像需要按照顺序将包含目标物体轮廓的切片依次叠加,得到包含目标物体轮廓的目标轮廓图。

210、将切片处理后的目标深度图以及卷积处理后的rgb图像输入深度卷积神经网络中,得到目标检测结果。

需要说明的是,将切片处理后的待测深度图以及卷积处理后的rgb图像分别作为深度神经网络的输入,经过神经网络的训练和学习获取轮廓清晰、高精度的目标图像。

在一种实施例中,rgb图像卷积的输入是3通道(r/g/b)的图像wxh的矩阵,经过n个卷积核之后的输出是n个通道的wxh的矩阵。深度图经过切片聚合等处理后会输出m个通道的wxh的矩阵,这两个矩阵合并为m+n个通道的wxh的矩阵序列作为深度神经网络的输入进行进一步的特征分解合并和提取。需要说明的是,上述深度神经网络可以采用的目标检测神经网络包括:vgg、yolo以及mobilenet网络等。

本实施例通过对采用多种切片方法对深度图进行切片,以便选出最优的目标物体所在深度范围,大大减少深度切片处理计算量和处理时间,通过二值化处理、形态学操作、连通域分析以及过滤处理更好的选择出目标物体的轮廓,同时将分割好的目标物体轮廓作为目标检测神经网络的输入,有力的弥补了神经网络只关注细节特征而忽略轮廓特征的缺点,极大的提高了目标检测的稳定性和抗干扰能力。

应理解,图3为本申请一种结合深度图切片和神经网络的目标检测系统的一个实施例的系统框图,如图3所示,图3中包括:

图像采集模块301,图像采集模块301用于采集包含目标物体的rgb-d图像。

切片处理模块302,切片处理模块302用于切片处理rgb-d图像中的深度图,将包含目标物体轮廓的切片图进行叠加,得到目标轮廓图;

图像卷积模块303,图像卷积模块303用于对rgb-d图像中的rgb图像卷积处理;

目标检测分割模块304,目标检测分割模块304用于将切片处理后的目标轮廓图以及卷积处理后的rgb图像输入深度卷积神经网络中,得到目标检测分割结果。

需要说明的是,采集的包含目标物体的rgb-d图像为三维图像,它包含有深度图和rgb图像,其中深度图中每个像素值是传感器距离物体的实际距离,rgb图像是常见的rgb三通道彩色图像;将深度图切片处理是根据实际距离的不同,选取不同的距离区间进行切片,再选取包含有目标物体轮廓的切片进行叠加就可以得到目标物体的具体轮廓;将切片处理后的深度图以及卷积处理后的rgb图像分别作为深度神经网络的输入,经过神经网络的训练和学习获取轮廓清晰、高精度的目标图像。

本申请实施例中,提供了一种结合深度图切片和神经网络的目标检测方法,通过采用对深度图切割的方法,可以有效的分割出场景中的目标形状,并利用分割好的形状作为目标检测神经网络的输入,有力的弥补了神经网络只关注细节特征而忽略轮廓特征的缺点,极大的提高了目标检测的稳定性和抗干扰能力。

应理解,图4为本申请一种结合深度图切片和神经网络的目标检测系统的另一个实施例的系统框图,如图4所示,图4中包括:

图像采集模块401,图像采集模块401用于采集包含目标物体的rgb-d图像;

切片处理模块402,切片处理模块403用于切片处理所述rgb-d图像中的深度图,将包含目标物体轮廓的切片图进行叠加,得到目标轮廓图;

图像卷积模块403,图像卷积模块403用于对rgb-d图像中的rgb图像卷积处理;

目标检测分割模块404,目标检测分割模块404用于将切片处理后的目标轮廓图以及卷积处理后的rgb图像输入深度卷积神经网络中,得到目标检测分割结果。

进一步地,系统还包括预处理模块,预处理模块用于对rgb-d图像中的rgb图像进行坐标变换和对齐处理,对rgb-d图像中的深度图进行坐标变换和对齐处理。

进一步地,切片处理模块还包括:

切片模块4031,切片模块4031用于将深度图切片,得到若干切片;

二值化模块4032,二值化模块4032用于将每个切片二值化处理,得到切片二值图;

连通区域分析模块4033,连通区域分析模块4033用于对切片灰度图形态学操作和连通区域分析,得到第一连通图像;

图像过滤模块4034,图像过滤模块4034用于对第一连通图像过滤处理,去除掉小连通区域,得到第二连通图像;

重心计算模块4035,重心计算模块4035用于计算每一个第二连通图像的重心;

聚合模块4036,聚合模块4036用于根据每个第二连通图像的重心,对第二连通图像聚合处理;

叠加模块4037,叠加模块4037用于叠加聚合处理后的第二连通图像,得到包含有目标物体轮廓的目标轮廓图。

进一步地,系统还包括平滑滤波模块或者深度阈值分割模块;平滑滤波模块用于对深度图进行平滑滤波处理;深度阈值分割模块用于对深度图进行阈值分割处理。

本申请实施例还提供一种结合深度图切片和神经网络的目标检测设备,设备包括处理器以及存储器:存储器用于存储程序代码,并将程序代码传输给所述处理器;处理器用于根据程序代码中的指令执行本申请实施例第一方面的一种结合深度图切片和神经网络的目标检测方法。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:只存在a,只存在b以及同时存在a和b三种情况,其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(英文全称:read-onlymemory,英文缩写:rom)、随机存取存储器(英文全称:randomaccessmemory,英文缩写:ram)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1