一种目标识别方法及图像处理设备与流程

文档序号:19993422发布日期:2020-02-22 02:30阅读:319来源:国知局
一种目标识别方法及图像处理设备与流程

本发明属于机器视觉技术领域,特别是涉及一种目标识别方法及图像处理设备。



背景技术:

目前,许多场景中都设置有监控设备,比如,商场、学校、写字楼等场景中,通常设置有多台摄像机对场景进行监控。与摄像机相连的图像处理设备对摄像机采集到的图像进行分析,根据分析结果,可以识别图像中的目标。

但是,当场景中光线较暗或处于夜晚时,摄像机难以拍摄到目标的面部,采集的目标信息较为模糊,导致目标识别不准确。



技术实现要素:

本发明的目的在于提供一种目标识别方法及图像处理设备,通过图像优化技术,解决了场景中光线较暗或处于夜晚时,摄像机难以拍摄到目标的面部,采集的目标信息较为模糊,导致目标识别不准确的问题。

为解决上述技术问题,本发明是通过以下技术方案实现的:

本发明为一种目标识别方法,包括:

ss01检测视频帧图像中的目标;

ss02图像优化:将检测视频帧图像中的目标进行图像增强,再对检测视频帧图像中的目标进行面部捕捉,再将检测视频帧图像中的目标进行图像缩放,得到目标面部的图像;

ss03将目标面部的的图像区域输入至深度特征网络中,得到目标面部的特征;其中,所述深度特征网络为:将多张面部图像输入至深度卷积神经网络训练得到;

ss04在预先存储的特征与身份的对应关系中,查找与所述特征相匹配的身份;

ss05将查找到的身份确定为目标识别结果。

进一步地,所述检测视频帧图像中的目标,包括:

利用图像检测算法,检测视频帧图像中的目标;

或者,将视频帧图像与预先设定的目标模型进行匹配,将匹配成功的图像区域确定为目标所在的图像区域。

进一步地,所述深度特征网络的训练过程包括:

获取多张面部图像,所述多张面部图像中包含多角度下的同一目标;

将所述多张面部图像中的目标所在区域输入至深度卷积神经网络;

利用随机梯度下降算法,对所述多角度下的同一目标进行分类训练,反向传播计算所述深度卷积神经网络中各层参数;

根据所述各层参数,构建所述深度特征网络。

进一步地,所述视频帧图像包括至少两台图像采集设备所采集的图像,在所述将查找到的身份确定为目标识别结果之后,还包括:

利用各台图像采集设备对应的目标识别结果,对所述各台图像采集设备所采集的图像中的目标进行跟踪。

一种图像处理设备,包括:处理器和存储器,其中,存储器用于存储可执行程序代码,处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行以下步骤:

ss01检测视频帧图像中的目标;

ss02图像优化:将检测视频帧图像中的目标进行图像增强,再对检测视频帧图像中的目标进行面部捕捉,再将检测视频帧图像中的目标进行图像缩放,得到目标面部的图像;

ss03将目标面部的的图像区域输入至深度特征网络中,得到目标面部的特征;其中,所述深度特征网络为:将多张图像输入至深度卷积神经网络训练得到;

ss04在预先存储的特征与身份的对应关系中,查找与所述特征相匹配的身份;

ss05将查找到的身份确定为目标识别结果。

进一步地,所述处理器还用于执行如下步骤:

利用图像检测算法,检测视频帧图像中的目标;

或者,将视频帧图像与预先设定的目标模型进行匹配,将匹配成功的图像区域确定为目标所在的图像区域。

进一步地,所述处理器还用于执行如下步骤:

获取多张面部图像,所述多张面部图像中包含多角度下的同一目标;

将所述多张面部图像中的目标所在区域输入至深度卷积神经网络;

利用随机梯度下降算法,对所述多角度下的同一目标进行分类训练,反向传播计算所述深度卷积神经网络中各层参数;

根据所述各层参数,构建所述深度特征网络。

进一步地,所述视频帧图像包括至少两台图像采集设备所采集的图像,在所述将查找到的身份确定为目标识别结果之后,还包括:

利用各台图像采集设备对应的目标识别结果,对所述各台图像采集设备所采集的图像中的目标进行跟踪。

本发明具有以下有益效果:本发明通过图像优化技术,将检测视频帧图像中的目标进行图像增强,再对检测视频帧图像中的目标进行面部捕捉,再将检测视频帧图像中的目标进行图像缩放,得到目标面部的图像,利用深度特征网络,识别视频帧图像中目标的面部特征,再结合预先存储的特征与身份的对应关系,识别该目标的身份,识别准确度较高,解决了场景中光线较暗或处于夜晚时,摄像机难以拍摄到目标的面部,采集的目标信息较为模糊,导致目标识别不准确的问题。

当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为一种目标识别方法的流程示意图;

图2为本发明实施例中的一种应用场景示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

请参阅图1-2,本发明为一种目标识别方法,包括:

ss01检测视频帧图像中的目标;

ss02图像优化:将检测视频帧图像中的目标进行图像增强,再对检测视频帧图像中的目标进行面部捕捉,再将检测视频帧图像中的目标进行图像缩放,得到目标面部的图像;

ss03将目标面部的的图像区域输入至深度特征网络中,得到目标面部的特征;其中,所述深度特征网络为:将多张面部图像输入至深度卷积神经网络训练得到;

ss04在预先存储的特征与身份的对应关系中,查找与所述特征相匹配的身份;

ss05将查找到的身份确定为目标识别结果。

其中,图像增强是通过一定手段对原图像附加一些信息或变换数据,有选择地突出图像中感兴趣的特征或者抑制图像中某些不需要的特征,使图像与视觉响应特性相匹配,具体采用空域法,空域法是对图像中的像素点进行操作,用公式描述如下:

g(x,y)=f(x,y)*h(x,y)

其中f(x,y)是原图像;h(x,y)为空间转换函数;g(x,y)表示进行处理后的图像。

其中,面部捕捉采用现有optitrack的面部表情捕捉技术,能够准确捕捉到检测视频帧图像中的目标面部。

其中,图像缩放主要目的是放大图像中目标的面部,从而可以显示高分辨率的目标面部,具体采用现有基于区域的图像插值算法,首先将原始低分辨率图像分割成不同区域,然后将插值点映射到低分辨率图像,判断其所属区域,最后根据插值点的邻域像素设计不同的插值公式,计算插值点的值,即获得目标高分辨率的面部特征。

其中,所述检测视频帧图像中的目标,包括:

利用图像检测算法,检测视频帧图像中的目标;

或者,将视频帧图像与预先设定的目标模型进行匹配,将匹配成功的图像区域确定为目标所在的图像区域。

其中,所述深度特征网络的训练过程包括:

获取多张面部图像,所述多张面部图像中包含多角度下的同一目标;

将所述多张面部图像中的目标所在区域输入至深度卷积神经网络;

利用随机梯度下降算法,对所述多角度下的同一目标进行分类训练,反向传播计算所述深度卷积神经网络中各层参数;

根据所述各层参数,构建所述深度特征网络。

其中,所述视频帧图像包括至少两台图像采集设备所采集的图像,在所述将查找到的身份确定为目标识别结果之后,还包括:

利用各台图像采集设备对应的目标识别结果,对所述各台图像采集设备所采集的图像中的目标进行跟踪。

一种图像处理设备,包括:处理器和存储器,其中,存储器用于存储可执行程序代码,处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行以下步骤:

ss01检测视频帧图像中的目标;

图像处理设备与图像采集设备通信连接,本设备可以获取图像采集设备采集的视频帧图像,针对获取的每一视频帧图像,都可以利用本方案进行目标识别。

ss02图像优化:将检测视频帧图像中的目标进行图像增强,再对检测视频帧图像中的目标进行面部捕捉,再将检测视频帧图像中的目标进行图像缩放,得到目标面部的图像;

ss03将目标面部的的图像区域输入至深度特征网络中,得到目标面部的特征;其中,所述深度特征网络为:将多张图像输入至深度卷积神经网络训练得到;

ss04在预先存储的特征与身份的对应关系中,查找与所述特征相匹配的身份;

该对应关系可以以数据表的形式存储,在数据表中,身份用key(键)表示,特征用value(值)表示,该数据表可以存储于本设备中,也可以存储于与本设备相连的其他设备中,具体不做限定。

ss05将查找到的身份确定为目标识别结果。

其中,所述处理器还用于执行如下步骤:

利用图像检测算法,检测视频帧图像中的目标;

或者,将视频帧图像与预先设定的目标模型进行匹配,将匹配成功的图像区域确定为目标所在的图像区域。

其中,所述处理器还用于执行如下步骤:

获取多张面部图像,所述多张面部图像中包含多角度下的同一目标;

将所述多张面部图像中的目标所在区域输入至深度卷积神经网络;

利用随机梯度下降算法,对所述多角度下的同一目标进行分类训练,反向传播计算所述深度卷积神经网络中各层参数;

根据所述各层参数,构建所述深度特征网络。

其中,所述视频帧图像包括至少两台图像采集设备所采集的图像,在所述将查找到的身份确定为目标识别结果之后,还包括:

利用各台图像采集设备对应的目标识别结果,对所述各台图像采集设备所采集的图像中的目标进行跟踪。

本发明通过图像优化技术,将检测视频帧图像中的目标进行图像增强,再对检测视频帧图像中的目标进行面部捕捉,再将检测视频帧图像中的目标进行图像缩放,得到目标面部的图像,利用深度特征网络,识别视频帧图像中目标的面部特征,再结合预先存储的特征与身份的对应关系,识别该目标的身份,识别准确度较高,解决了场景中光线较暗或处于夜晚时,摄像机难以拍摄到目标的面部,采集的目标信息较为模糊,导致目标识别不准确的问题。

在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1