图像识别方法和图像识别装置与流程

文档序号:12601664阅读:614来源:国知局
图像识别方法和图像识别装置与流程

本发明涉及图像识别方法和图像识别装置,具体而言,涉及图像识别中消除或减少误检测、降低误检率的方法、以及使用该方法的图像识别装置。



背景技术:

近年来,图像识别技术发展迅速,其在安全、金融、信息、教育等诸多领域有着广泛的应用前景。图像识别一般基于已知的识别物体特征库,利用计算机或嵌入式设备等分析图像,进而利用识别物体特征库中的特征模式来检测出目标物体。具体来说,例如利用各种识别物体的特征模式,让计算机对目标物体进行特征模式学习,并利用分类算法将目标物体检测出来。



技术实现要素:

然而在实际的检测中,经常会有误检测的情况。例如图7所示的情况。

图7中,左图为实际想要检测的汽车的车头,而右图本来为一个监控系统的视频中显示时间部分的画面,却被误检测为车头。该监控系统本来需要监控的目标是车头,但却将该显示时间的画面频繁地误检测为是需要监控的目标。

之所以产生这样的误检测,主要是因为当将图像进行多尺度识别时,图像中的某些局部图像的特征模式与对目标物体进行学习后的特征模式非常相似。因此,该局部图像容易被误识别为目标物体。一旦该局部图像反复出现,就会反复地被误识别为目标物体。例如图7的例子中显示时间的画面在监控视频画面经常出现,于是频繁被误认为是需要监控的目标,造成大量无用的干扰。

本发明鉴于上述现有技术中存在的问题,目的在于提供一种能够 在图像识别中消除或减少误检测、降低误检率的方法、以及使用该方法的图像识别装置。

为了解决上述技术问题,本发明提供一种图像识别方法,用于降低图像识别中的误检率,其特征在于,包括:图像取得步骤,取得待识别图像;预识别步骤,对上述待识别图像进行预识别,取得被预识别为包含目标物体的多个图像块;明显特征过滤步骤,用上述目标物体的明显特征对上述被识别为包含目标物体的多个图像块进行过滤,提取出误识别可能性大的多个图像块;图像块分组步骤,基于图像块的位置、大小和像素特征对上述误识别可能性大的多个图像块进行分组,将位置、大小和像素特征大致相同的图像块归为一组,得到多个图像块组;图像块组选择步骤,计算各上述图像块组中的图像块的个数,选择出图像块的个数多于规定阈值的多个图像块组;光流计算步骤,对上述图像块的个数多于规定阈值的多个图像块组中的每个图像块进行光流计算,提取出没有光流变化的多个图像块;背景计算步骤,将没有光流变化的各个图像块与该图像块所对应的局部背景作比较,提取出与背景大致相同的图像块作为误识别图像块;和反例学习步骤,将所得到的上述误识别图像块的特征作为图像识别的反例进行反例学习,在之后进行的识别中剔除误识别图像块,得到包含上述目标物体的图像块作为识别结果。

本发明的图像识别方法也可以包括:图像取得步骤,取得待识别图像;预识别步骤,对上述待识别图像进行预识别,取得被预识别为包含目标物体的多个图像块;明显特征过滤步骤,用上述目标物体的明显特征对上述被识别为包含目标物体的多个图像块进行过滤,提取出误识别可能性大的多个图像块;图像块分组步骤,基于图像块的位置、大小和像素特征对上述误识别可能性大的多个图像块进行分组,将位置、大小和像素特征大致相同的图像块归为一组,得到多个图像块组;图像块组选择步骤,计算各上述图像块组中的图像块的个数,选择出图像块的个数多于规定阈值的多个图像块组;光流计算步骤,从上述图像块的个数多于规定阈值的多个图像块组的每个图像块组中任选一个图像块作为该图像块组的代表进行光流计算,提取出没有光流变化的多个图像块组;背景计算步骤,从没有光流变化的多个图像 块组的每个图像块组中任选一个图像块作为该图像块组的代表与该图像块所对应的局部背景作比较,提取出与背景大致相同的图像块作为误识别图像块;和反例学习步骤,将所得到的上述误识别图像块的特征作为图像识别的反例进行反例学习,在之后进行的识别中剔除误识别图像块,得到包含上述目标物体的图像块作为识别结果。

在上述图像识别方法中,上述图像块分组步骤包括:位置大小分组步骤,基于图像块的位置、大小对上述误识别可能性大的多个图像块进行分组,将位置、大小大致相同的图像块归为一组,得到多个图像块组;和像素分组步骤,将上述位置大小分组步骤中分类得到的多个图像块组基于像素特征进行进一步分组,将像素特征大致相同的图像块归为一组,得到位置、大小和像素特征大致相同的多个图像块组。

在上述图像识别方法中,在上述背景计算步骤与反例学习步骤之间还包括用户确认步骤,将上述背景计算步骤中得到的上述误识别图像块显示在图形用户界面上由用户进行确认,得到用户确认后的误识别图像块。

在上述图像识别方法中,上述明显特征过滤步骤中,用下式进行过滤:

E=ω0C+ΣωiCLi

当E<TE时提取出该图像块,式中,E为误识别可能评价值,C为图像块的确信度,CLi为明显特征、局部特征的确信度,ω为权值;TE为设定的阈值。上述像素分组步骤中,判断像素特征大致相同采用如下公式:

if│Gn(i,j)–Gn+1(i,j)│<T0,d(i,j)=0;

if│Gn(i,j)–Gn+1(i,j)│>T0,d(i,j)=1;

Σd(i,j)/(H*W)<T1

式中,Gn(i,j)为某个图像块的像素(i,j)的灰度值;Gn+1(i,j)为上述位置大小分组步骤中分出的位置大小大致相同的组中的下一个图像块的像素(i,j)的灰度值;d为对每一像素是否相近进行判断后的相近评价值;T0为灰度不同的阈值。

在上述图像识别方法中,上述像素分组步骤中,判断像素特征大致相同采用如下公式:

if│Rn(i,j)–Rn+1(i,j)│<TR0,dr(i,j)=0;

if│Gn(i,j)–Gn+1(i,j)│<TG0,dg(i,j)=0;

if│Bn(i,j)–Bn+1(i,j)│<TB0,db(i,j)=0

if│Rn(i,j)–Rn+1(i,j)│>TR0,dr(i,j)=1;

if│Gn(i,j)–Gn+1(i,j)│>TG0,dg(i,j)=1;

if│Bn(i,j)–Bn+1(i,j)│>TB0,db(i,j)=1

Σdr(i,j)+Σdg(i,j)+Σdb(i,j)/3*(H*W)<T1

式中,Rn(i,j)、Gn(i,j)、Bn(i,j)为某个图像块的像素(i,j)的红色分量、蓝色分量、绿色分量,Rn+1(i,j)、Gn+1(i,j)、Bn+1(i,j)为上述位置大小分组步骤中分出的位置大小大致相同的组中的下一个图像块的像素(i,j)的红色分量、蓝色分量、绿色分量;TR0、TG0、TB0为红色分量、蓝色分量、绿色分量不同的阈值;dr,dg,db为对每个像素的红色分量、蓝色分量、绿色分量是否相近进行判断后的相近评价值;T1为像素大致相同的阈值;H、W为图像块的高和宽。

在上述图像识别方法中,上述像素分组步骤中,判断像素特征大致相同采用如下公式:

ΣΣGn(i,j)Gn+1(i,j)/(SQRT(ΣΣGn(i,j)2)×SQRT(ΣΣGn+1(i,j)2))>T2

式中,Gn(i,j)为某个图像块的像素(i,j)的灰度值;Gn+1(i,j)为上述位置大小分组步骤中分出的位置大小大致相同的组中的下一个图像块的像素(i,j)的灰度值;T1、T2为阈值,T1的范围在0~1之间,T2的范围在-1~1之间。

在上述图像识别方法中,上述光流计算步骤中,光流的计算采用如下公式:

<mrow> <mfrac> <mrow> <mo>&part;</mo> <mi>I</mi> </mrow> <mrow> <mo>&part;</mo> <mi>x</mi> </mrow> </mfrac> <msub> <mi>V</mi> <mi>x</mi> </msub> <mo>+</mo> <mfrac> <mrow> <mo>&part;</mo> <mi>I</mi> </mrow> <mrow> <mo>&part;</mo> <mi>y</mi> </mrow> </mfrac> <msub> <mi>V</mi> <mi>y</mi> </msub> <mo>+</mo> <mfrac> <mrow> <mo>&part;</mo> <mi>I</mi> </mrow> <mrow> <mo>&part;</mo> <mi>t</mi> </mrow> </mfrac> <mo>=</mo> <mn>0</mn> </mrow>

式中I为亮度,Vx为x轴上的速度,Vy为y轴上的速度。

为了解决上述技术问题,本发明提供一种图像识别装置,其特征在于,包括:图像取得单元,其取得待识别图像;预识别单元,其对上述待识别图像进行预识别,取得被预识别为包含目标物体的多个图像块;明显特征过滤单元,其用明显特征对上述被预识别为包含目标物体的多个图像块进行过滤,提取出误识别可能性大的多个图像块;图像块分组单元,其基于图像块的位置、大小和像素特征对上述误识 别可能性大的多个图像块进行分组,将位置、大小和像素特征大致相同的图像块归为一组,得到多个图像块组;图像块组选择单元,其计算各上述图像块组中的图像块的个数,选择出图像块的个数多于规定阈值的多个图像块组;光流计算单元,其对上述图像块的个数多于规定阈值的多个图像块组中的每个图像块进行光流计算,提取出没有光流变化的多个图像块;背景计算单元,其将没有光流变化的各个图像块与该图像块所对应的局部背景作比较,提取出与背景大致相同的图像块作为误识别图像块;和反例学习单元,其将所得到的上述误识别图像块的特征作为图像识别的反例进行反例学习,在之后进行的正式识别中剔除误识别图像块,得到包含上述目标物体的图像块作为识别结果。

本发明的图像识别装置也可以包括:图像取得单元,其取得待识别图像;预识别单元,其对上述待识别图像进行预识别,取得被预识别为包含目标物体的多个图像块;明显特征过滤单元,其用明显特征对上述被预识别为包含目标物体的多个图像块进行过滤,提取出误识别可能性大的多个图像块;图像块分组单元,其基于图像块的位置、大小和像素特征对上述误识别可能性大的多个图像块进行分组,将位置、大小和像素特征大致相同的图像块归为一组,得到多个图像块组;图像块组选择单元,其计算各上述图像块组中的图像块的个数,选择出图像块的个数多于规定阈值的多个图像块组;光流计算单元,其从上述图像块的个数多于规定阈值的多个图像块组的每个图像块组中任选一个图像块作为该图像块组的代表进行光流计算,提取出没有光流变化的多个图像块组;背景计算单元,其从没有光流变化的多个图像块组的每个图像块组中任选一个图像块作为该图像块组的代表与该图像块所对应的局部背景作比较,提取出与背景大致相同的图像块作为误识别图像块;和反例学习单元,其将所得到的上述误识别图像块的特征作为图像识别的反例进行反例学习,在之后进行的正式识别中剔除误识别图像块,得到包含上述目标物体的图像块作为识别结果。

在图像识别装置中,上述图像块分组单元包括:位置大小分组单元,其基于图像块的位置、大小对上述误识别可能性大的多个图像块进行分组,将位置、大小大致相同的图像块归为一组,得到多个图像 块组;和像素分组单元,其将由上述位置大小分组单元分类得到的多个图像块组基于像素进行进一步分组,将像素特征大致相同的图像块归为一组,得到位置、大小和像素特征大致相同的多个图像块组。

在图像识别装置中,还包括用户确认单元,将由上述背景计算单元得到的上述误识别图像块显示在图形用户界面上由用户进行确认,得到用户确认后的误识别图像块。

在图像识别装置中,上述明显特征过滤单元用下式进行过滤:

E=ω0C+ΣωiCLi

当E<TE时提取出该图像块,式中,E为误识别可能评价值,C为图像块的确信度,CLi为明显特征、局部特征的确信度,ω为权值;TE为设定的阈值。

在图像识别装置中,上述像素分组单元判断像素特征大致相同采用如下公式:

if│Gn(i,j)–Gn+1(i,j)│<T0,d(i,j)=0;

if│Gn(i,j)–Gn+1(i,j)│>T0,d(i,j)=1;

Σd(i,j)/(H*W)<T1

式中,Gn(i,j)为某个图像块的像素(i,j)的灰度值;Gn+1(i,j)为上述位置大小分组步骤中分出的位置大小大致相同的组中的下一个图像块的像素(i,j)的灰度值;d为对每一像素是否相近进行判断后的相近评价值;T0为灰度不同的阈值。

在图像识别装置中,上述像素分组单元判断像素特征大致相同采用如下公式:

if│Rn(i,j)–Rn+1(i,j)│<TR0,dr(i,j)=0;

if│Gn(i,j)–Gn+1(i,j)│<TG0,dg(i,j)=0;

if│Bn(i,j)–Bn+1(i,j)│<TB0,db(i,j)=0

if│Rn(i,j)–Rn+1(i,j)│>TR0,dr(i,j)=1;

if│Gn(i,j)–Gn+1(i,j)│>TG0,dg(i,j)=1;

if│Bn(i,j)–Bn+1(i,j)│>TB0,db(i,j)=1

Σdr(i,j)+Σdg(i,j)+Σdb(i,j)/3*(H*W)<T1

式中,Rn(i,j)、Gn(i,j)、Bn(i,j)为某个图像块的像素(i,j)的红色分量、蓝色分量、绿色分量,Rn+1(i,j)、Gn+1(i,j)、Bn+1(i,j)为上述位置大小分组步骤中分出的位置大小大致相同的组中的下一个图像块的像素(i,j) 的红色分量、蓝色分量、绿色分量;TR0、TG0、TB0为红色分量、蓝色分量、绿色分量不同的阈值;dr,dg,db为对每个像素的红色分量、蓝色分量、绿色分量是否相近进行判断后的相近评价值;T1为像素大致相同的阈值;H、W为图像块的高和宽。

在图像识别装置中,上述像素分组单元判断像素特征大致相同采用如下公式:

ΣΣGn(i,j)Gn+1(i,j)/(SQRT(ΣΣGn(i,j)2)×SQRT(ΣΣGn+1(i,j)2))>T2

式中,Gn(i,j)为某个图像块的像素(i,j)的灰度值;Gn+1(i,j)为上述位置大小分组步骤中分出的位置大小大致相同的组中的下一个图像块的像素(i,j)的灰度值;T1、T2为阈值,T1的范围在0~1之间,T2的范围在-1~1之间。

在图像识别装置中,上述光流计算单元计算光流采用如下公式:

<mrow> <mfrac> <mrow> <mo>&part;</mo> <mi>I</mi> </mrow> <mrow> <mo>&part;</mo> <mi>x</mi> </mrow> </mfrac> <msub> <mi>V</mi> <mi>x</mi> </msub> <mo>+</mo> <mfrac> <mrow> <mo>&part;</mo> <mi>I</mi> </mrow> <mrow> <mo>&part;</mo> <mi>y</mi> </mrow> </mfrac> <msub> <mi>V</mi> <mi>y</mi> </msub> <mo>+</mo> <mfrac> <mrow> <mo>&part;</mo> <mi>I</mi> </mrow> <mrow> <mo>&part;</mo> <mi>t</mi> </mrow> </mfrac> <mo>=</mo> <mn>0</mn> </mrow>

式中I为亮度,Vx为x轴上的速度,Vy为y轴上的速度。

(发明效果)

根据本发明,能够在现有的图像识别中提取误检测的图像块进行反例学习,从而消除或减少同类型的误检测,能够提供一种能够在图像识别中消除或减少误检测、降低误检率的方法、以及使用该方法的图像识别装置。

附图说明

图1是本发明的实施方式1的功能框图。

图2是本发明的实施方式1的流程图。

图3是本发明的实施方式2的功能框图。

图4是本发明的实施方式2的流程图。

图5是本发明的实施方式3的功能框图。

图6是本发明的实施方式3的流程图。

图7是用于例示误检测的图。

具体实施方式

下面参照附图对本发明的实施方式和实施例进行具体说明,图中相同的标号表示相同的元件或功能模块。本发明不受下述具体的实施方式和实施例限制。

<实施方式1>

首先对本发明的实施方式1进行详细说明。

图1是本发明的实施方式1的功能框图。

图1中,11为图像取得单元,用于取得待识别图像。此处所说的图像,包括静态图像和视频等动态图像。

12为预识别单元,将由图像取得单元11取得的待识别图像用多尺度滑动窗口扫描进行预识别,取得被预识别为目标物体的多个图像块。预识别能够用现有的图像识别装置进行。

13为明显特征过滤单元,用图像块的明显特征对被预识别为目标物体的多个图像块进行过滤,排除明显不可能为误识别的图像块,提取出误识别可能性大的多个图像块。

14为图像块分组单元,基于位置、大小和像素特征对误识别可能性大的多个图像块进行分组,将位置、大小和像素大致相同的图像块归为一组,得到多个图像块组。图像块分组单元14可以包括位置大小分组单元15和像素分组单元16。

位置大小分组单元15基于图像块的位置、大小对误识别可能性大的多个图像块进行分组,将位置、大小大致相同的图像块归为一组,得到多个图像块组。本说明书中的大致相同定义为量化差别不超过一定阈值。

像素分组单元16将由位置大小分组单元分类得到的多个图像块组基于像素特征进行进一步分组,将像素特征大致相同的图像块归为一组,得到位置、大小和像素特征大致相同的多个图像块组。

20为图像块组选择单元,计算各图像块组中的图像块的个数,选择出图像块的个数多于规定阈值的多个图像块组。这个阈值用户是可以修改的,默认值例如为5。

17为光流计算单元,对图像块的个数多于规定阈值的多个图像块组中的每个图像块进行光流计算,提取出没有光流变化的多个图像块组。

18为背景计算单元,将没有光流变化的各个图像块与该图像块所对应的局部背景作比较,搜索得到与背景大致相同的图像块作为误识别图像块。

19为反例学习单元,将所得到的误识别图像块的特征作为图像识别的反例进行反例学习,在之后进行的正式识别中剔除误识别图像块,得到包含目标物体的图像块作为识别结果。

下面对实施方式1的具体流程进行说明。

实施方式1的流程步骤如图2所示。

首先,在图像取得步骤21中,由图像取得单元11取得待识别图像。此处所说的图像,包括静态图像和视频等动态图像。接着在预识别步骤22中,将由图像取得单元11取得的待识别图像划分为多个图像块并进行预识别,取得被预识别为目标物体的多个图像块。图像块的划分基于一定的规则,一般要使得到的各图像块中均包含能够表征所述待识别图像中的待识别目标的特征的像素点。图像块通常为矩形,该矩形为能够框住待识别目标的最小矩形。当然矩形只是一例,不一定必须为矩形,只要能够框住带识别目标,可以为任意形状。图像取得和预识别能够用现有的装置和方法来进行。

接着,在明显特征过滤步骤23中,用明显特征对被预识别为目标物体的多个图像块进行过滤,排除明显不可能为误识别的图像块,提取出误识别可能性大的多个图像块。明显特征为待识别物体所具有的明显的特征,例如包括人脸的颜色、纹理、人脸的局部特征,车的纹理、轮廓、局部特征等。在过滤的时候,进行误识别判断的阈值优选设置得比较宽泛以避免误过滤,尽量把具有误识别可能的图像块提取出来。经过明显特征过滤步骤23过滤后提取出的具有误识别可能的图像块的集合,是误识别可能性比较大的集合。

在明显特征过滤步骤23中,例如可以采用如下算法进行计算从而提取出误识别可能性大的图像块。

E=ω0C+ΣωiCLi

当E<TE时提取出该图像块,式中,E为误识别可能评价值,C为图像块的确信度,CLi为明显特征、局部特征各项的确信度,ω为权值,TE为设定的阈值。在这里确信度为PAC算法的错误分类概率相反值或者 为神经网络实际算出的接近目标标签的值等。

接着在图像块分组步骤24中,基于图像块的位置、大小和像素特征对误识别可能性大的多个图像块进行分组,将位置、大小和像素特征大致相同的图像块归为一组,得到多个图像块组。图像块分组步骤24例如可以分为位置大小分组步骤25和像素分组步骤26来进行。

在位置大小分组步骤25中,基于图像块的位置、大小对误识别可能性大的多个图像块进行分组,将位置、大小大致相同的图像块归为一组,得到多个图像块组。本说明书中的大致相同定义为量化差别不超过一定阈值。其中,先搜索位置、尺寸大致相同的图像块。此处所说的图像块的位置、尺寸大致相同,是指定义一定的阈值,只要图像块的位置、大小尺寸在阈值的范围内,就判断为位置、尺寸大致相同。例如(例子中的数字为举例的数字),对从一个摄像头采集的待识别物体记录进行预识别之后的图像块的集合中,存在500个位置为(10,30,50,60)的图像块,本例中,图像块为矩形。其中10,30为图像块的左上角的横坐标、纵坐标。50,60为图像块的右下角的横坐标、纵坐标。这500个图像块的矩形的坐标可以略有差异,只要不超过规定的阈值,就认为它们是大小尺寸基本上相同的图像块。当然,这只是一例,对从该摄像头采集的待识别物体记录进行预识别之后的图像块的集合中还可能存在其他位置、尺寸大致相同的图像块。

然后,对搜索出的位置、尺寸大致相同的图像块进行分组。也就是说,同组的图像块,位置、尺寸大致相同;不同组的图像块,大致的位置、尺寸不同。

接着在像素分组步骤26,将位置大小分组步骤中分类得到的多个图像块组基于像素进行进一步分组,将像素特征大致相同的图像块归为一组,得到位置、大小和像素特征大致相同的多个图像块组。其中,先在位置大小分组步骤25中划分的组中,搜索像素特征大致相同的图像块。然后,对搜索出的像素大致相同的图像块进行分组。也就是说,同组的图像块,像素特征大致相同;不同组的图像块,像素特征大致不同。

判断像素特征大致相同例如可以采用如下公式:

if│Gn(i,j)–Gn+1(i,j)│<T0,d(i,j)=0;

if│Gn(i,j)–Gn+1(i,j)│>T0,d(i,j)=1;

Σd(i,j)/(H*W)<T1

在式中,Gn(i,j)为某个图像块的像素(i,j)的灰度值;Gn+1(i,j)为位置大小分组步骤25中分出的位置大小大致相同的组中的下一个图像块的像素(i,j)的灰度值;d为对每一像素是否相近进行判断后的相近评价值;T0为灰度不同的阈值;T1为像素大致相同的阈值;H、W为图像块的高和宽。此处,作为相近评价值d的设置,可以让用户进行选择。作为预设的默认值,可以选择最大值的黄金分割比来作为默认值。

此外,还可以采用如下方式来搜索像素特征大致相同的项目。

if│Rn(i,j)–Rn+1(i,j)│<TR0,dr(i,j)=0;

if│Gn(i,j)–Gn+1(i,j)│<TG0,dg(i,j)=0;

if│Bn(i,j)–Bn+1(i,j)│<TB0,db(i,j)=0

if│Rn(i,j)–Rn+1(i,j)│>TR0,dr(i,j)=1;

if│Gn(i,j)–Gn+1(i,j)│>TG0,dg(i,j)=1;

if│Bn(i,j)–Bn+1(i,j)│>TB0,db(i,j)=1

Σdr(i,j)+Σdg(i,j)+Σdb(i,j)/3*(H*W)<T1

式中,Rn(i,j)、Gn(i,j)、Bn(i,j)为某个图像块的像素(i,j)的红色分量、蓝色分量、绿色分量;Rn+1(i,j)、Gn+1(i,j)、Bn+1(i,j)为位置大小分组步骤25中分出的位置大小大致相同的组中的下一个图像块的像素(i,j)的红色分量、蓝色分量、绿色分量;TR0、TG0、TB0为红色分量、蓝色分量、绿色分量不同的阈值;dr,dg,db为对每一像素的红色分量、蓝色分量、绿色分量是否相近进行判断后的相近评价值;T1为像素大致相同的阈值;H、W为图像块的高和宽。

另外,还可以采用以下相似性算法公式来判断像素相似性。

ΣΣGn(i,j)Gn+1(i,j)/(SQRT(ΣΣGn(i,j)2)×SQRT(ΣΣGn+1(i,j)2))>T2

式中Gn(i,j)为某个图像块的像素(i,j)的灰度值,Gn+1(i,j)为位置大小分组步骤25中分出的位置大小大致相同的组中的下一个图像块的像素(i,j)的灰度值。T1、T2为阈值。T1的范围在0~1之间,T2的范围在-1~1之间。

经过位置大小分组步骤25和像素分组步骤26,图像块被分为位置、大小和像素大致相同的各个组。由此,具有重复性的图像块被合并。

接着在图像块组选择步骤30中,计算各图像块组中的图像块的个数,选择出图像块的个数多于规定阈值的多个图像块组。这个阈值用户是可以修改的,默认值例如为5。这是因为图像块的个数低于阈值的图像块组基本上不可能存在误检测的可能性,不是我们需要进行处理的对象。

接着在光流计算步骤27中,对图像块组选择步骤30中得到的多个图像块组中的每个图像块进行光流计算,从中搜索得到没有光流变化的多个图像块。搜索没有光流的图像块,也就是说搜索没有动作的各项。光流的计算采用如下方程式进行运算。

<mrow> <mfrac> <mrow> <mo>&part;</mo> <mi>I</mi> </mrow> <mrow> <mo>&part;</mo> <mi>x</mi> </mrow> </mfrac> <msub> <mi>V</mi> <mi>x</mi> </msub> <mo>+</mo> <mfrac> <mrow> <mo>&part;</mo> <mi>I</mi> </mrow> <mrow> <mo>&part;</mo> <mi>y</mi> </mrow> </mfrac> <msub> <mi>V</mi> <mi>y</mi> </msub> <mo>+</mo> <mfrac> <mrow> <mo>&part;</mo> <mi>I</mi> </mrow> <mrow> <mo>&part;</mo> <mi>t</mi> </mrow> </mfrac> <mo>=</mo> <mn>0</mn> </mrow>

式中I为亮度,Vx为x轴上的速度,Vy为y轴上的速度。利用光的变化,计算出待识别物体的速度。

接着,在背景计算步骤28中,将没有光流变化的各个图像块与该图像块所对应的局部背景作比较,搜索得到与背景大致相同的图像块作为误识别图像块。在这里大致相同为上面的像素相似性公式来进行计算判断,当像素的相似性在某阈值范围内时就认为大致相同。在背景运算是可以采取差分法进行背景的运算,也可以采用混合高斯模型来进行背景的运算。例如对于检测目标为汽车的误识别检测系统,进行背景计算的帧图像选择最长时间,这样是为了剔除把停滞车辆也作为误检测的情况。同样也可以在明显特征过滤步骤23中通过局部特征的模式识别、颜色纹理模式识别等的方式,剔除把停滞车辆也作为误检测的情况。

经过以上运算,得到了误识别图像块。

接着在反例学习步骤29中,将所得到的误识别图像块的特征作为图像识别的反例进行反例学习,在之后进行的识别中剔除误识别图像块,得到包含目标物体的图像块作为识别结果。学习的方法可以采用SVM、深度学习的方式,学习出作为反例的误识别模型。在学习中将采用误识别的轮廓、纹理、颜色等作为特征进行模型学习。然后用学习出的模型,作为反例进行模式识别,防止出现再次误识别。

<实施方式2>

接着对本发明的实施方式2进行详细说明。对实施方式2与实施方式1相同的部件标注相同标号并省略说明。

图3是本发明的实施方式2的功能框图。如图3所示,本实施方式2与实施方式1相比,不同点在于,用光流计算单元17’替代光流计算单元17,用背景计算单元18’替代背景计算单元18。

其中,光流计算单元17’从图像块的个数多于规定阈值的多个图像块组的每个图像块组中任选一个图像块作为该图像块组的代表进行光流计算,提取出没有光流变化的多个图像块组。

背景计算单元18’从没有光流变化的多个图像块组的每个图像块组中任选一个图像块作为该图像块组的代表与该图像块所对应的局部背景作比较,提取出与背景大致相同的图像块作为误识别图像块。

实施方式2的流程步骤如图4所示。

如图4所示,本实施方式2的流程与实施方式1大致相同,不同点在于,用光流计算步骤27’替代光流计算步骤27,用背景计算步骤28’替代背景计算步骤28。

其中,光流计算步骤27’中,从图像块的个数多于规定阈值的多个图像块组的每个图像块组中任选一个图像块作为该图像块组的代表进行光流计算,提取出没有光流变化的多个图像块组。

背景计算步骤28’中,从没有光流变化的多个图像块组的每个图像块组中任选一个图像块作为该图像块组的代表与该图像块所对应的局部背景作比较,提取出与背景大致相同的图像块作为误识别图像块。

在本实施方式2中,光流计算步骤和背景计算步骤中不对图像块组中的所有图像块进行计算,而是选取一个作为代表来进行计算。这是因为,经过图像块分组步骤24得到的图像块组中的每个图像块,其位置、大小和像素特征是大致相同的,所以可以任取一个作为代表来进行计算,由此能够大幅减少计算量。

但是需要注意的是,如果只选一个进行计算,在某些情况下、例如图像块分组步骤24中的阈值设置过宽的情况下有可能发生漏检。即如果图像块分组步骤24中的阈值设置过宽,则图像块分组步骤24中得到的图像块组中的各个图像块有可能并不满足实际要求的大致相同的标准。在这种情况下,也可以选择多个图像块作为代表,在最极端 的情况下选择所有图像块进行计算,则实际上与实施方式1相同。

<实施方式3>

接着对本发明的实施方式3进行详细说明。对实施方式3与实施方式1相同的部件标注相同标号并省略说明。

图5是本发明的实施方式3的功能框图。如图5所示,本实施方式3与实施方式1相比,追加了用户确认单元50,将由背景计算单元18得到的误识别图像块显示在图形用户界面(GUI)上由用户进行确认,得到用户确认后的误识别图像块。

实施方式3的流程步骤如图6所示。

如图6所示,本实施方式3的流程与实施方式1大致相同,不同点在于,在背景计算步骤28与反例学习步骤29之间追加了用户确认步骤60,将背景计算步骤28中得到的误识别图像块显示在图形用户界面(GUI)上由用户进行确认,得到用户确认后的误识别图像块。众所周知,人眼在图像识别上有着先天的优势,经过人工确认的误识别图像块能够取得更好的准确性。本实施方式3是在实施方式1的基础上追加了用户确认步骤,当然也可以在实施方式2的基础上追加用户确认步骤,能够获得与本实施方式3相同的技术效果。

以上所述仅是本发明的优选的实施方式,应当指出,对于本领域的技术人员来说,在不脱离本发明原理和基础的前提下,还可以做出若干改进、润饰、更换步骤组合等,这些改进、润饰、更换步骤组合等也应该是本发明的保护范围。

本领域技术人员应明白,本发明能够提供为方法、系统、或计算机程序产品。本发明能够完全由硬件实现、完全由软件实现、或结合软件和硬件来实现。而且,本发明能够采用在一个或多个包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是根据本发明具体实施方式的方法、系统、或计算机程序产品的流程图和/或方框图来描述的。应理解能够由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。能够将这些计算机程序指令提供给通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理 器以实现一个通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也能够存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也能够装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

工业上的可利用性

本发明的图像识别方法和图像识别装置,将取得的待识别图像划分为多个图像块并进行预识别后,基于位置、大小和像素特征对误识别可能性大的多个图像块进行分组并进一步进行光流计算和背景计算,由此得到误识别图像块用于反例学习,从而消除或减少同类型的误检测,在图像识别领域是极为有用的。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1