基于RGB-D图像的前后景分离方法及其前后景分离装置与流程

文档序号:15236362发布日期:2018-08-24 05:20阅读:1212来源:国知局

本发明涉及前后景分离技术领域,尤其涉及一种基于rgb-d图像的前后景分离方法及其前后景分离装置。



背景技术:

目标检测是视觉跟踪和行为识别等领域的核心问题,也是计算机视觉的重要研究方向。目前比较流行的目标检测算法包括帧间运动估计方法,例如光流法和块匹配法;帧间差分法,通过连续两帧图像差分分离前景目标;背景差分法,为背景构建模型,通过比较当前帧与背景模型来提取运动目标。其中,背景差分法是目前较为常用的运动目标检测算法。

vibe算法是2011年提出的一种背景建模算法,该算法采用领域像素来创建背景模型,通过比对背景模型和当前输入像素值来检测前景,具体可分为三个步骤:步骤1,初始化单帧图像中每个像素点的背景模型;步骤2,对后续的图像序进行前景目标分隔操作;步骤3,更新背景模型。这种方法是一种具有随机性的非参数化背景差分算法,其具有初始化速度快、判断过程简单的优点。但也存在以下一些缺点:1、容易出现背景变化被识别为前景的情况;2、rgb图像容易受到外界光照或环境的影响,从而影响分割精度;3、前景物体在初始帧中会被误识别为背景模型。

为此,申请人进行了有益的探索和尝试,找到了解决上述问题的办法,下面将要介绍的技术方案便是在这种背景下产生的。



技术实现要素:

本发明所要解决的技术问题之一在于:针对现有技术的不足而提供一种避免出现背景变化被识别为前景的情况、改善前景物体在初始帧中被误识别为背景模型的问题、提高前后景分离准确度的基于rgb-d图像的前后景分离方法。

本发明所要解决的技术问题之二在于:提供一种实现上述基于rgb-d图像的前后景分离方法的前后景分离装置。

作为本发明第一方面的一种基于rgb-d图像的前后景分离方法,包括以下步骤:

步骤s10,获取需要进行前后景分离的rgb-d图像,并对获取到的rgb-d图像进行读取,其中所述rgb-d图像由rgb图像和深度图像构成;

步骤s20,分别对所述rgb图像和深度图像进行背景掩码矩阵计算,获取所述rgb图像和深度图像的背景掩码矩阵;

步骤s30,将所述rgb图像和深度图像的背景掩码矩阵进行融合和校准处理得到最终的背景掩码矩阵,再根据融合校准后的背景掩码矩阵获取所述rgb-d图像的最终的前景图像,从而实现将所述rgb-d图像的前后景图像进行分离。

在本发明的一个优选实施例中,在所述步骤s20中,对所述rgb-d图像中的深度图像进行背景掩码矩阵计算,获取深度图像的背景掩码矩阵,包括以下步骤:

步骤s211,计算固定数量的初始化深度图的均值和方差;

步骤s212,找出深度图中的静止区域,即其方差小于门限的区域;

步骤s213,根据静止区域更新深度图的背景数据,并优先考虑远距离的背景数据。

步骤s214,计算背景掩码矩阵,背景掩码矩阵是一个0-1二值矩阵,将步骤s213计算得到的背景区域设置为1,其余区域设置为0。

在本发明的一个优选实施例中,在所述步骤s20中,对所述rgb-d图像中的rgb图像进行前景掩码矩阵计算,获取rgb图像的背景掩码矩阵,包括以下步骤:

步骤s221,根据固定数量的rgb图像的初始帧建立背景模型;

步骤s222,计算rgb图像的背景区域,对每一帧图像,每一个像素点和背景模型作比较,判断其是否属于背景;

步骤s223,根据计算得到的背景区域更新背景模型。

步骤s224,计算背景掩码矩阵,背景掩码矩阵是一个0-1二值矩阵,将步骤s222计算得到的背景区域设置为1,其余区域设置为0。

在本发明的一个优选实施例中,在所述步骤s30中,将所述rgb图像和深度图像的背景掩码矩阵进行融合和校准处理得到最终的背景掩码矩阵,包括以下步骤:

步骤s31,将深度图像的像素坐标转换成世界坐标,根据深度相机的摄像头内部参数来计算深度图像的像素坐标与世界坐标的对应关系;

步骤s32,将rgb图像的像素坐标转换成世界坐标,根据rgb相机的摄像头内部参数来计算rgb图像的像素坐标与世界坐标的对应关系;

步骤s33,根据深度图像的像素坐标和rgb图像的像素坐标与世界坐标的对应关系,转换成深度图像的像素坐标和rgb图像的像素坐标的对应关系;

步骤s34,根据深度图像的像素坐标和rgb图像的像素坐标的对应关系,对深度图像的背景掩码矩阵与rgb图像的背景掩码矩阵进行融合处理,得到rgb-d图像的最终的背景掩码矩阵。

作为本发明第二方面的一种实现上述基于rgb-d图像的前后景分离方法的前后景分离装置,包括:

一图像读取单元,所述图像读取单元用于读取需要进行前后景分离的rgb-d图像,并可将读取后的rgb-d图像分解成rgb图像和深度图像;

一背景掩码矩阵计算单元,所述背景掩码矩阵计算单元由一rgb图像背景掩码矩阵计算模块和一深度图像背景掩码矩阵计算模块构成,所述rgb图像背景掩码矩阵计算模块用于对所述图像读取单元读取的rgb-d图像的rgb图像进行背景掩码矩阵计算,并获取rgb图像的背景掩码矩阵,所述深度图像背景掩码矩阵计算模块用于对所述图像读取单元读取的rgb-d图像的深度图像进行背景掩码矩阵计算,并获取深度图像的背景掩码矩阵;以及

一融合及校准单元,所述融合及校准单元用于将所述rgb图像和深度图像的背景掩码矩阵进行融合和校准处理得到最终的背景掩码矩阵,再根据融合校准后的背景掩码矩阵获取所述rgb-d图像的最终的前景图像。

由于采用了如上的技术方案,本发明的有益效果在于:

1、本发明结合rgb-d图像中的rgb图像和深度图像,从而实现将rgb-d图像的前后景图像进行分离,克服了现有的前后景分离方法存在易受光照、环境等因素影响的缺点;

2、本发明引入深度图像数据,完善了背景的定义,同时改进了远处背景物体运动被误识别成前景的问题;

3、本发明改进了vibe算法中前景物体存在初始帧中造成背景误识别的问题;

4、本发明可实时运行,具有前后景分离准确度高的优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明的前后景分离方法的流程示意图。

图2是本发明的前后景分离装置的结构示意图。

具体实施方式

为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体图示,进一步阐述本发明。

参见图1,图中给出的是一种基于rgb-d图像的前后景分离方法,包括以下步骤:

步骤s10,获取需要进行前后景分离的rgb-d图像,并对获取到的rgb-d图像进行读取,其中rgb-d图像由rgb图像和深度图像构成;

步骤s20,分别对rgb图像和深度图像进行背景掩码矩阵计算,获取rgb图像和深度图像的背景掩码矩阵;

步骤s30,将rgb图像和深度图像的背景掩码矩阵进行融合和校准处理得到最终的背景掩码矩阵,再根据融合校准后的背景掩码矩阵获取rgb-d图像的最终的前景图像,从而实现将rgb-d图像的前后景图像进行分离。

在上述步骤s20中,对rgb-d图像中的深度图像进行背景掩码矩阵计算,获取深度图像的背景掩码矩阵,包括以下步骤:

步骤s211,计算固定数量的初始化深度图的均值和方差;

步骤s212,找出深度图中的静止区域,即其方差小于门限的区域;

步骤s213,根据静止区域更新深度图的背景数据,并优先考虑远距离的背景数据。

步骤s214,计算背景掩码矩阵,背景掩码矩阵是一个0-1二值矩阵,将步骤s213计算得到的背景区域设置为1,其余区域设置为0。

在上述步骤s20中,对rgb-d图像中的rgb图像进行前景掩码矩阵计算,获取rgb图像的背景掩码矩阵,包括以下步骤:

步骤s221,根据固定数量的rgb图像的初始帧建立背景模型;

步骤s222,计算rgb图像的背景区域,对每一帧图像,每一个像素点和背景模型作比较,判断其是否属于背景;

步骤s223,根据计算得到的背景区域更新背景模型。

步骤s224,计算背景掩码矩阵,背景掩码矩阵是一个0-1二值矩阵,将步骤s222计算得到的背景区域设置为1,其余区域设置为0。

在上述步骤s30中,将rgb图像和深度图像的背景掩码矩阵进行融合和校准处理得到最终的背景掩码矩阵,包括以下步骤:

步骤s31,将深度图像的像素坐标转换成世界坐标,根据深度相机的摄像头内部参数来计算深度图像的像素坐标与世界坐标的对应关系;

步骤s32,将rgb图像的像素坐标转换成世界坐标,根据rgb相机的摄像头内部参数来计算rgb图像的像素坐标与世界坐标的对应关系;

步骤s33,根据深度图像的像素坐标和rgb图像的像素坐标与世界坐标的对应关系,转换成深度图像的像素坐标和rgb图像的像素坐标的对应关系;

步骤s34,根据深度图像的像素坐标和rgb图像的像素坐标的对应关系,对深度图像的背景掩码矩阵与rgb图像的背景掩码矩阵进行融合处理,得到rgb-d图像的最终的背景掩码矩阵。

参见图2,图中给出的是一种实现上述基于rgb-d图像的前后景分离方法的前后景分离装置,包括图像读取单元100、背景掩码矩阵计算单元200以及融合及校准单元300。

图像读取单元100用于读取需要进行前后景分离的rgb-d图像,并可将读取后的rgb-d图像分解成rgb图像和深度图像;

背景掩码矩阵计算单元200由一rgb图像背景掩码矩阵计算模块210和一深度图像背景掩码矩阵计算模块220构成,rgb图像背景掩码矩阵计算模块210用于对图像读取单元读取的rgb-d图像的rgb图像进行背景掩码矩阵计算,并获取rgb图像的背景掩码矩阵,深度图像背景掩码矩阵计算模块220用于对图像读取单元读取的rgb-d图像的深度图像进行背景掩码矩阵计算,并获取深度图像的背景掩码矩阵。

融合及校准单元300用于将rgb图像和深度图像的背景掩码矩阵进行融合和校准处理得到最终的背景掩码矩阵,再根据融合校准后的背景掩码矩阵获取rgb-d图像的最终的前景图像。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1