一种改进的背景减除方法与流程

文档序号:12471886阅读:2121来源:国知局
一种改进的背景减除方法与流程

本发明涉及地理信息系统、地理学、计算机视觉以及摄像测量学等领域,具体涉及一种改进的背景减除方法。



背景技术:

背景减除是将视频序列图像中有意义的运动目标与不需要的背景信息区分开的一种检测方法,是各类视频分析算法、视频压缩算法的基础。在智能视频监控领域中,通过运动目标检测可以将行人、车辆与背景区分开,降低目标(行人/车辆)检测与跟踪的计算量。

背景减除算法面临的挑战是在将背景和前景分离时,提取的真实前景的同时会包含部分背景与噪声信息。噪声产生的主要原因是通过背景建模无法将所有的前景与背景像素区分开提取的运动前景包含了运动目标的同时也包含了其他信息,如背景像素被误判断为前景像素,视频中局部光照变化,非运动目标的遮挡等。为了提高检测的精度,传统的思路是通过提高背景减除的精度,通过精确、复杂的背景建模,以牺牲速度与内存来提高前景的准确性,从而提高运动目标检测的精度。这类改进方法包括包括混合高斯背景建模、多图层背景建模、vibe背景建模。另一种思路是在提取得到前景之后通过后处理方式对前景进行筛选过滤,去除噪声信息。

传统的算法是腐蚀、膨胀去除较小的噪声点,然后计算前景联通区域的像素面积,采用像素大小阈值保留符合要求的前景区域。DH Parks(Parks D H,Fels S S.Evaluation of Background Subtraction Algorithms with Post-Processing[C].IEEE International Conference on Advanced Video and Signal Based Surveillance,Avss 2008,Santa Fe,New Mexico,Usa,1-3September.2008:192-199.)在论文中证明了通过后处理方法能够显著提高背景减除算法的精度。

然而,由于透视现象的存在,距离相机近的对象所占像素面积较大,距离相机远的对象所占像素面积则较小。这就导致图像中近处的非前景对象(树叶、流水)的像素面积往往会大于稍远处运动前景对象,尤其在大范围室外监控中,这一现象非常明显。



技术实现要素:

发明目的:本发明的目的在于解决现有技术中存在的不足,提供一种改进的背景减除方法。

技术方案:本发明一种改进的背景减除方法,依次包括以下步骤:

(1)在视频图像和二维地图上选取4对同名控制点,然后计算得到图像到地图的单应矩阵H,具体过程为:

若视频图像平面中的p点转换到二维地图平面中的p′点,则有如下定义:

图像平面与地图平面之间的单应性关系可以简洁的表示为:

p′=Hp

H为单应矩阵,可表示为3×3的二维矩阵:

(2)计算图像内每个像素点的地理面积:

设某个像素p的坐标为(x,y),则该像素的四个角点坐标分别为(x-0.5,y-0.5)、(x+0.5,y-0.5)、(x-0.5,y+0.5)和(x+0.5,y+0.5),根据单应矩阵H转换为地理坐标分别为(x1,y1)、(x2,y2)、(x3,y3)和(x4,y4):

计算地理坐标下的四边形面积,即可得到坐标为(x,y)像素的地理面积geoPixel(x,y):

(3)将视频彩色图像转为8位灰度图像,视频中后一帧图像的像素灰度值减去前一帧的像素灰度值,计算结果绝对值小于等于5的保存为0,结果绝对值大于5的像素保存为255,得到前景二值图;

(4)直接使用现有SNAKE算法提取前景二值图中的轮廓;

(5)前景轮廓内像素坐标为:

objectPixels={(x1,y1),(x2,y2),…,(xn,yn)}

每个像素的地理面积为geoPixel(x,y),前景的地理面积为:

其中,i∈(1,2….n);

(6)根据实际情况设定最大面积阈值Tmax,和最小面积阈值Tmin,保留符合阈值范围的运动目标:

Tmin≤objectArea≤Tmax。例如当检测的前景为行人时,通常行人的身高为1至2米,肩宽为0.3至1米,考虑到行人的姿态,设置地理面积的最大阈值Tmax是2平方米,最小阈值Tmin是0.3平方米。

有益效果:现有的背景减除方法仅利用图像尺度去除噪声信息,当前景和噪声尺寸相似时无法有效去除噪声;而本发明不但能够利用像素的地理面积进行前景提取,从而透视现象带来的影响,而且还可以根据真实大小有效去除噪声,进而提高背景减除方法的精度。

附图说明

图1为本发明的流程图;

图2是本发明中计算单应矩阵示意图;

图3是本发明更精确前景提取示意图。

具体实施方式

下面对本发明技术方案进行详细说明,但是本发明的保护范围不局限于所述实施例。

实施例1:

如图1所示,本实施例中背景减除方法包括以下基本步骤:

(1)如图2所示,计算视频图像与地图之间的4组对应点,包括4个图像点的X坐标和Y坐标,以及4个地图点的X坐标、Y坐标

选取的对应点集为:

P1={(227,158,1)、(438,158,2)、(588,386,3)、(106,388,4)};

P2={(13237036.567687,3778659.262119,1)、(13237035.970523,3778680.16286,2)、(13237079.563515,3778680.162869,3)、(13237080.459262,3778658.963537,4)};

其中,P1为图像点,P2位地图点,括号中数字分布代表每个点的X坐标、Y坐标,编号相同的点位对应点,计算图像到地图的单应矩阵H;

H={(-196037541888,9806238711808,132362469900288)、(-55944654848,2799295791104,37781267021824)、(-0.001481,0.074081,1)},本实施例中,H是3*3的矩阵,括号中表示矩阵的一行内的数字。

(2)计算图像内每个像素点的地理面积,如:坐标为(x,y)的像素,四个角点坐标分别为(x-0.5,y-0.5)、(x+0.5,y-0.5)、(x-0.5,y+0.5)、(x+0.5,y+0.5),将其转换为地理坐标(x1,y1)、(x2,y2)、(x3,y3)、(x4,y4),计算地理坐标下的四边形面积得到像素的地理面积geoPixel(x,y)。

(3)将视频彩色图像转为8位灰度图像,视频中后一帧图像的像素灰度值减去前一帧的像素灰度值,计算结果绝对值小于5的保存为0,结果绝对值大于5的像素保存为255,得到前景二值图。

(4)使用SNAKE算法提取前景二值图中的轮廓。

(5)前景轮廓内像素坐标为:

objectPixels={(x1,y1),(x2,y2),…,(xn,yn)}

每个像素的地理面积为geoPixel(x,y),前景的地理面积为:

(6)此处检测的运动目标为行人,通常行人的身高为1至2米,肩宽为0.3至1米,考虑到行人的姿态,设置Tmax为2平方米,Tmin为0.3平方米。

0.3≤objectArea≤2

过滤噪声信息得到更精确的前景,如图3所示。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1