基于差分卷积神经网络的运动目标检测方法

文档序号:25352918发布日期:2021-06-08 14:01阅读:329来源:国知局

1.本发明属于视频监控技术领域,具体涉及一种基于差分卷积神经网络的运动目标检测方法。


背景技术:

2.近些年来,视频得到了广泛的应用。然而,目前的视频监控只是一个简单的记录。近年来,智能视频监控逐渐成为安全领域的核心技术之一。运动目标检测是智能视频监控的重要基础,对目标的建模、跟踪和识别有着重要的影响。
3.动态背景下的运动目标检测仍然是一项具有挑战性的任务。在学者们的不断努力下,提出了许多方法。这些方法可以分为以下几种:深度学习方法、基于像素的方法和子空间学习方法。这些方法取得了令人满意的实际效果,尤其是深度学习方法。然而,这些深度学习方法存在很大的缺陷,即泛化能力差。它们只能处理与培训数据相关的数据。在特定场景中,不可能为每个摄影机收集注释数据来训练模型。因此需要一种方法来提高深度学习在运动目标检测中的泛化能力。


技术实现要素:

4.本发明的目的在于提供一种基于差分卷积神经网络的运动目标检测方法,能够极大地提高深度学习在运动目标检测中的泛化能力。
5.为达到上述目的,本发明采用的技术方案为:本发明提供一种基于差分卷积神经网络的运动目标检测方法,包括训练部分和测试部分,所述训练部分包括以下步骤:1.1)数据初始化将所选择的视频的分辨率调整为240
×
320;标注调整分辨率后的视频中的运动目标,得到视频中每一帧的groundtruth,记为i
g
;对调整分辨率后的视频进行中值滤波处理,得到背景帧,记为i
b
;将视频的当前帧i
c
与对应的背景帧i
b
进行差分,得到当前帧的差分图像,记为i
input
;1.2)构建卷积神经网络:所述卷积神经网络包含输入层、隐含层和输出层:所述输入层包括一个分辨率为240
×
320、通道数为3的立体图像,其中立体图像为i
input
;卷积神经网络中的卷积尺寸大小为3
×
3;所述隐含层中第1层采用卷积、批归一化、激活层和池化层conv+bn+relu+maxpool,使用8个卷积来生成8个特征图;所述隐含层中第2层采用卷积、批归一化、激活层和池化层conv+bn+relu+maxpool,使用8个卷积来生成8个特征图;
所述隐含层中第3层采用卷积、批归一化、激活层和池化层conv+bn+relu+maxpool,使用32个卷积来生成32个特征图;所述隐含层中第4层采用卷积、批归一化、激活层和池化层conv+bn+relu+maxpool,使用64个卷积来生成64个特征图;所述隐含层中第5层采用卷积、批归一化、激活层和池化层conv+bn+relu+maxpool,使用64个卷积来生成64个特征图;所述隐含层中第6层采用卷积、批归一化、激活层和池化层conv+bn+relu,使用128个卷积来生成128个特征图;所述隐含层中第7层采用卷积、批归一化、激活层和池化层deconv+bn+relu,使用64个卷积来生成64个特征图;所述隐含层中第8层采用卷积、批归一化、激活层和池化层deconv+bn+relu,使用32个卷积来生成32个特征图;所述隐含层中第9层采用卷积、批归一化、激活层和池化层deconv+bn+relu,使用8个卷积来生成8个特征图;所述隐含层中第10层采用卷积、批归一化、激活层和池化层deconv+bn+clippedrelu,使用1个卷积来生成1个特征图;所述输出层中包含了回归层;1.3)设置卷积神经网络采用adam对卷积神经网络进行参数更新;参数更新过程中的均方误差为卷积神经网络的损失函数;1.4)训练卷积神经网络对步骤1.2)设定的卷积神经网络进行训练,得到卷积神经网络模型;所述测试部分包括以下步骤:2.1)得到卷积神经网络模型输入将步骤1.1)得到的i
input
作为卷积神经网络模型的输入,对应的i
g
作为卷积神经网络模型的输出,i
input

i
g
;2.2)得到运动目标的检测结果将步骤2.1)得到的卷积神经网络模型的输入放入卷积神经网络模型中进行计算,即得到运动目标的检测结果。
6.所述步骤1.1)中的中值滤波处理步骤如下:给定视频中的一个像素v,它的时间上的邻域像素为n
v
={v
i

n
,

,v
i
,

,i
i+n
},其中n为正整数,代表着窗口的大小,n取30,计算n
v
的中值,得到像素v的背景像素;依次类推,对视频中的所有像素进行中值滤波,得到所有像素的背景像素,形成背景帧i
b

7.相对于现有技术,本发明的有益效果为:本发明提供的基于差分卷积神经网络的运动目标检测方法,通过构建卷积神经网络对运动目标进行检测,其优点是将视频的当前帧与对应的背景帧进行差分,得到差分图像,将差分图像作为模型的输入,模型的输入不包含场景信息,如背景帧。本发明中构建的卷积神经网络只是学习场景的变化,所以在该卷积神经网络中没有关于场景的具体信息,因此该卷积神经网络具有较强的泛化能力。本发明构建的卷积神经网络只需要训练一次,
就可以检测出同一类型的视频,这可以大大扩展卷积神经网络模型的使用范围,极大地提高深度学习在运动目标检测中的泛化能力,具有良好的应用前景。经测试,现有的基于深度学习的运动目标检测模型在测试与训练视频无关的视频时,f

measure值为0.2至0.3之间,而本发明提供的基于差分卷积神经网络的运动目标检测方法在测试与训练视频无关的视频时,f

measure值为0.73。
具体实施方式
8.下面进一步阐述本发明,以下实例仅用于描述本发明而不用于限制本发明的使用范围,各领域工程技术人员对本发明的各种等价变换均包含在本发明所要求的权力范围内。
9.本发明提供的基于差分卷积神经网络的运动目标检测方法,包括训练部分和测试部分两个过程:所述的训练部分如下:步骤:1_1数据初始化:选择一些视频进行分辨率调整,调整为240
×
320;标注调整后的视频中的运动目标,得到视频中每一帧的groundtruth,记为i
g
;使用中值滤波对视频进行处理得到背景帧,记为i
b
;中值滤波步骤如下:给定视频中的一个像素v,它的时间上的邻域像素为n
v
={v
i

n
,

,v
i
,

,i
i+n
},其中n为正整数,代表着窗口的大小,n取30,计算n
v
的中值,得到背景像素。对视频中的所有像素进行中值滤波,得到背景i
b

10.将当前帧i
c
与背景帧i
b
进行差分得到当前帧的差分图像,记为i
input
;步骤:1_2构建卷积神经网络:该卷积神经网络包含输入层、隐含层和输出层:输入层包括一个分辨率为240
×
320,通道数为3的立体图像,其中立体图像为i
input
;卷积神经网络模型中的卷积尺寸大小为3
×
3;隐含层中第1层采用卷积、批归一化、激活层和池化层(conv+bn+relu+maxpool),使用8个卷积来生成8个特征图;隐含层中第2层采用卷积、批归一化、激活层和池化层(conv+bn+relu+maxpool),使用8个卷积来生成8个特征图;隐含层中第3层采用卷积、批归一化、激活层和池化层(conv+bn+relu+maxpool),使用32个卷积来生成32个特征图;隐含层中第4层采用卷积、批归一化、激活层和池化层(conv+bn+relu+maxpool),使用64个卷积来生成64个特征图;隐含层中第5层采用卷积、批归一化、激活层和池化层(conv+bn+relu+maxpool),使用64个卷积来生成64个特征图;隐含层中第6层采用卷积、批归一化、激活层和池化层(conv+bn+relu),使用128个卷积来生成128个特征图;隐含层中第7层采用卷积、批归一化、激活层和池化层(deconv+bn+relu),使用64个卷积来生成64个特征图;
隐含层中第8层采用卷积、批归一化、激活层和池化层(deconv+bn+relu),使用32个卷积来生成32个特征图;隐含层中第9层采用卷积、批归一化、激活层和池化层(deconv+bn+relu),使用8个卷积来生成8个特征图;隐含层中第10层采用卷积、批归一化、激活层和池化层(deconv+bn+clippedrelu),使用1个卷积来生成1个特征图;输出层包含了回归层;步骤:1_3设置卷积神经网络:采用adam进行参数更新;均方误差为网络模型的损失函数;步骤:1_4训练卷积神经网络:根据步骤1_2中卷积神经网络的设定,训练卷积神经网络,得到卷积神经网络模型;所述的测试部分如下:步骤2_1:得到卷积神经网络模型输入将步骤1_1得到的i
input
作为卷积神经网络模型的输入,对应的i
g
作为卷积神经网络模型的输出,i
input

i
g
;步骤2_2:得到运动目标的检测结果将步骤2_1得到的模型输入放入卷积神经网络模型进行计算,得到运动目标的检测结果。
11.本发明通过构建差分卷积神经网络(d

net)对运动目标进行检测。d

net网络的优点是网络输入不包含场景信息,如背景帧。d

net网络只是学习场景的变化。所以在d

net网络中没有关于场景的具体信息。因此d

net网络具有较强的泛化能力。d

net网络只需要训练一次,就可以检测出同一类型的视频。这可以大大扩展卷积神经网络模型的使用范围。
12.经测试,现有的基于深度学习的运动目标检测模型在测试与训练视频无关的视频时,f

measure值为0.2至0.3之间,而本发明提供的基于差分卷积神经网络的运动目标检测方法在测试与训练视频无关的视频时,f

measure值为0.73。说明本发明可以极大地提高深度学习在运动目标检测中的泛化能力,具有良好的应用前景。
13.以上所述,仅是本发明的较佳实施例,并非对本发明作任何限制,凡是根据本发明技术实质对以上实施例所作的任何简单修改、变更以及等效结构变换,均仍属于本发明技术方案的保护范围内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1