一种行人检测方法、系统及装置的制作方法

文档序号:6424306阅读:192来源:国知局
专利名称:一种行人检测方法、系统及装置的制作方法
技术领域
本发明属于图像处理技术领域,尤其涉及一种行人检测方法、系统及装置。
背景技术
行人检测是物体检测的重要分支,是近年来计算机视觉领域备受关注的前沿方向和研究热点。在视频监控、汽车安全系统、购物行为分析等领域有着重要的应用。然而,由于人体固有的一些特性,应用场景的复杂性,人与人或人与环境之间的相互影响,使得人体的检测和跟踪成为计算机视觉研究领域中研究的难点。现有行人检测系统在检测被遮挡的行人和未被遮挡的行人时,无法根据行人是否被遮挡采取自适应的检测方式进行行人的检测,使得其检测性能受到较大的影响,检测效果比较差。

发明内容
本发明实施例的目的在于提供一种行人检测方法、系统及装置,旨在解决由于现有行人检测系统无法根据行人是否被遮挡采取自适应的检测方式进行行人的检测,使得其检测性能受到较大的影响,检测效果比较差的问题。本发明实施例是这样实现的,一种行人检测方法,所述方法包括下述步骤接收输入的图像数据,获取图像数据的特征向量;根据公式d(x) = lg((exp(a*f(x))+exp(a*g(x)))/a)计算输入的图像数据的特征值d(x),其中f (χ) = w.x,g(x) =11^,《和11为预设的向量常数,a为预设的常数,·为向量点积运算符号,χ为获取的图像数据的特征向量;将计算得到的图像数据的特征值与预设的阈值进行比较,输出所述运动物体是否为行人的信息。本发明实施例的另一目的在于提供一种行人检测系统,所述系统包括特征向量获取单元,用于接收输入的图像数据,获取图像数据的特征向量;特征值计算单元,用于根据公式d(x) = lg((exp(a*f(x))+exp(a*g(x)))/a)计算输入的图像数据的特征值d(x),其中f(X) = W.x,g(x) =1!^,《和1!为预设的向量常数, a为预设的常数,·为向量点积运算符号,X为获取的图像数据的特征向量;以及信息输出单元,用于将计算得到的图像数据的特征值与预设的阈值进行比较,输出所述运动物体是否为行人的信息。本发明实施例的另一目的在于提供一种包括上述行人检测系统的行人检测装置。本发明实施例通过接收输入的图像数据的特征向量,根据公式d(x)= Ig ((exp (a*f (χ)) +exp (a*g (χ))) /a)计算输入的图像数据的特征值d (χ),将计算得到的图像数据的特征值与预设的阈值进行比较,输出运动物体是否为行人的信息,解决了现有行人检测系统无法根据行人是否被遮挡采取自适应的检测方式进行行人的检测,检测效果比较差的问题,从而当输入的图像数据中存在行人时通过自适应地选择相应的检测函数检测行人,为用户提供了一种通用的、健壮的、精确的行人检测方法。


图1是本发明第一实施例提供的行人检测方法的实现流程图;图2是本发明第二实施例提供的行人检测方法的实现流程图;图3是本发明第三实施例提供的行人检测系统的结构图;图4是本发明第四实施例提供的行人检测系统的结构图。
具体实施例方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。本发明实施例通过接收输入的图像数据的特征向量,根据公式d(x)= Ig ((exp (a*f (χ)) +exp (a*g (χ))) /a)计算输入的图像数据的特征值d (χ),将计算得到的图像数据的特征值与预设的阈值进行比较,输出运动物体是否为行人的信息,解决了现有行人检测系统无法根据行人是否被遮挡采取自适应的检测方式进行行人的检测,检测效果比较差的问题,从而当输入的图像数据中存在行人时通过自适应地选择相应的检测函数检测行人,为用户提供了一种通用的、健壮的、精确的行人检测方法。以下结合具体实施例对本发明的具体实现进行详细描述实施例一图1示出了本发明第一实施例提供的行人检测方法的实现流程,详述如下在步骤SlOl中,接收输入的图像数据,获取图像数据的特征向量。在本发明实施例中,当需要对输入的图像进行行人检测时,可以预先对图像进行预处理,例如,对输入的灰度图像进行大小归一化,避免因图像的变形而影响后续的处理, 通过灰度拉伸增强图像对比度,通过二值化处理实现图像中背景和对象的分割。采用动态阈值法确定图像二值化的关键阈值,使用带修正的自适应邻域平均法消除图像干扰和噪音等,从而解决图像因为天气或者采集角度等原因造成的图像模糊、歪斜或缺损的情况。在步骤S102 中,根据公式 d(x) = Ig ((exp (a*f (χ)) +exp (a*g (χ))) /a)计算输入的图像数据的特征值d(x),其中f(x) =w.x,g(x) =1!1,《和1!为预设的向量常数,a为预设的常数,·为向量点积运算符号,X为获取的图像数据的特征向量。在本发明实施例中,采用函数softmax(f(x),g(x))来计算输入的图像数据的特征值,其中 softmax (f (χ), g (χ)) = Ig ((exp (a*f (χ)) +exp (a*g (χ))) /a), f (χ) = w · χ,为基于全身信息的行人检测函数,g(x) =U-X是一个基于头部和肩部的行人检测函数,w和 u为预设的向量常数,a为预设的常数, 为向量点积运算符号,χ为获取的图像数据的特征向量,由于softmax函数可柔化输出值,减小值之间的差,使得d(x)的计算公式可以自适应地选择相应的检测函数(基于全身信息或者基于头肩部信息),准确地检测到输入图像中的行人。在步骤S103中,将计算得到的图像数据的特征值与预设的阈值进行比较,输出图像数据是否包含行人的信息。
在本发明实施例中,将计算得到的图像数据的特征值与预设的阈值进行比较,当计算得到的图像数据的特征值大于预设的阈值时,输出图像数据包含行人的信息,当计算得到的图像数据的特征值不大于预设的阈值时,输出图像数据不包含行人的信息。在具体的实施过程中,可以根据用户的需求信息对包括行人的图像数据的行人进行标注出来,从而更直观地提示用户,或用于行人的跟踪与统计等。实施例二 在本发明实施例中,为了确定行人检测过程中图像数据的特征值d(x)= Ig ((exp (a*f (χ)) +exp (a*g (χ))) /a)中涉及到的w和u的值,应预先对该函数进行训练,获取w和u的值。图2示出了本发明第二实施例提供的行人检测方法的实现流程,详述如下在步骤S201中,对采集到的包括行人的图像数据中行人的头部、肩部和全身进行标注。在本发明实施在,应该预先采集图像数据以用于对检测函数进行训练,确定向量参数w和u的值,采集的图像应包括背景图像以及包含有行人全身的图像,图像的数量可以根据用户对检测的精度要求采集相应数量的图像。对其中包括行人全身的图像数据中行人的头部、肩部和全身进行标注,具体可以通过手动或自动进行标注,手动标注时,首先标注出行人的头部的包围框,基于一定的比例,对头部包围框进行扩展,作为头-肩部位的包围框,进一步对头部包围框进行扩展成为全身的包围框。也可以采用相应的算法识别出行人的头部、肩部和全身,实现行人的头部、肩部和全身的标注,具体的标注方法在此不用限制本发明。在步骤S203中,将采集到的背景图像数据和包括行人的图像数据存储到预先建立一个图像数据训练集中。在步骤S203中,预先设置向量参数《和u的初始值,以训练集为定义域,通过最优值计算模块获取函数softmax (0,l-y*d(x))在取得最小值时w和u的值,其中SOftmaX(0, l-y*d (χ)) = Ig ((1+exp (a* (l_y*d (x)))) /a),a为预设的常数,χ为输入的图像数据的特征向量,y 等于 1 或-1,当 y = 1 时,d(x) = lg((eXp(a*f(Xl))+eXp(a*g(X2)))/a),Xl 为 χ 中标注的行人的全身的特征向量,X2为χ中标注的行人的头部和肩部的特征向量,当y = -1 时,d (χ) = Ig ((exp (a*f (χ)) +exp (a*g (χ))) /a)。在本发明实施例中,预先设置向量参数w和U的初始值,以训练集中的图像作为函数的输入,通过最优值计算模块获取函数lg((l+eXp(a*(l-y*d(X))))/ a)在取得最小值时w和u的值。具体地,在接收到输入的包括行人全身的图像后, 获取整个图像的特征向量χ,并根据标注信息或根据变量y的值(y = 1),获取χ中头部和肩部对应的特征向量χ2,以及行人全身对应的特征向量^,根据公式d(x)= Ig ((exp (a*f (X1)) +exp (a*g (x2))) /a)求解d (χ)的值,当y = -1时,说明该图像为不包括行人的图像,根据公式d(x) = Ig ((exp (a*f (χ)) +exp (a*g (χ))) /a)求解d(x)的值,从而在函数lg((l+eXp(a*(l-y*d(X))))/a)取得最小值时获取w和u的值,较优地,a可以设为10, 在具体实施过程中,最优值计算模块可以采用递度下降算法、遗传算法或神经网络等,在此不用以限制本发明。在步骤S204中,将w和u值的值设置为函数Ig ((1+exp (a* (l_y*d (χ)))) /a)取得最小值时的值。在本发明实施例中,将步骤S203中通过最优值计算模块在函数 lg((l+eXp(a*(l-y*d(X))))/a)取得最小值时获得的w和u的值设为参数《和u的值。在步骤S205中,采用纵横比为8 3的窗口对待检测的输入图像进行扫描,生成图像对应的图像数据信息。在本发明实施例中,当完成对检测函数的训练后,获得了 w和U的值,从而可以实现对待检测的输入图像的检测,具体地,可以采用典型的纵横比为8 3的窗口对待检测的输入图像进行扫描,生成图像对应的图像数据信息。另外,也可以在检测前,对检测函数进行测试,根据测试结果决定是否还需要对函数进行训练,调整w和u的值,从而得到更高精度的行人检测效果。在步骤S206中,接收输入的图像数据,获取图像数据的特征向量。在步骤S207 中,根据公式 d(x) = Ig ((exp (a*f (χ)) +exp (a*g (χ))) /a)计算输入的图像数据的特征值d(x),其中f(x) = w.x,g(x) =1!1,《和1!为预设的向量常数,a为预设的常数,·为向量点积运算符号,X为获取的图像数据的特征向量。在步骤S208中,将计算得到的图像数据的特征值与预设的阈值进行比较,输出所述图像数据是否包含行人的信息。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中, 所述的存储介质,如ROM/RAM、磁盘、光盘等。实施例三图3示出了本发明第三实施例提供的行人检测系统的结构,为了便于说明,仅示出了与本发明实施例相关的部分。该行人检测系统可以用于具有行人检测功能的视频监控终端,例如视频监控器等中,可以是运行于这些视频监控终端内的软件单元,也可以作为独立的挂件集成到这些视频监控终端中或者运行于这些视频监控终端的应用系统中,其中特征向量获取单元31接收输入的图像数据,获取图像数据的特征向量。在本发明实施例中,当需要对输入的图像进行行人检测时,可以预先对图像进行预处理,例如,对输入的灰度图像进行大小归一化,避免因图像的变形而影响后续的处理, 通过灰度拉伸增强图像对比度,通过二值化处理实现图像中背景和对象的分割。采用动态阈值法确定图像二值化的关键阈值,使用带修正的自适应邻域平均法消除图像干扰和噪音等,从而解决图像因为天气或者采集角度等原因造成的图像模糊、歪斜或缺损的情况。特征值计算单元32 根据公式 d (χ) = Ig ((exp (a*f (χ)) +exp (a*g (χ))) /a)计算输入的图像数据的特征值d(x),其中f (X) =WX, g(x) =U · X,《和U为预设的向量常数, a为预设的常数,·为向量点积运算符号,χ为获取的图像数据的特征向量。在本发明实施例中,采用函数softmax(f(x),g(x))来计算输入的图像数据的特征值,softmax (f (χ), g (χ)) = Ig ((exp (a*f (χ)) +exp (a氺g (χ))) /a),其中 f (χ) = w · χ,用于基于全身信息的行人检测函数,g(x) = u ·χ,用于基于头部和肩部的行人检测函数,w和 u为预设的向量常数,a为预设的常数, 为向量点积运算符号,χ为获取的图像数据的特征向量,由于softmax函数可柔化输出值,减小值之间的差,使得d(x)的计算公式可以自适应地选择相应的检测函数(基于全身信息或者基于头肩部信息),准确地检测到输入图像中的行人。信息输出单元33将计算得到的图像数据的特征值与预设的阈值进行比较,输出所述图像数据是否包含行人的信息。在本发明实施例中,将计算得到的图像数据的特征值与预设的阈值进行比较,当计算得到的图像数据的特征值大于预设的阈值时,输出图像数据包含行人的信息,当计算得到的图像数据的特征值不大于预设的阈值时,输出图像数据不包含行人的信息。在具体的实施过程中,可以根据用户的需求信息对包括行人的图像数据的行人进行标注出来,从而更直观地提示用户,或用于行人的跟踪与统计等。实施例四图4示出了本发明第四实施例提供的行人检测系统的结构,为了便于说明,仅示出了与本发明实施例相关的部分。标注单元41对采集到的包括行人的图像数据中行人的头部、肩部和全身进行标注。存储单元42将采集到的背景图像数据和包括行人的图像数据存储到预先建立一个图像数据训练集中。参数值获取单元43预先设置向量参数w和u的初始值,以训练集为定义域,通过最优值计算模块获取函数Ig((1+exp (a*(l_y*d(χ))))/a)在取得最小值时w和u的值,其中a为预设的常数,χ为输入的图像数据的特征向量,y等于1或-1,当y= 1时,d(x)= Ig ((exp (a*f (X1)) +exp (a*g (X2))) /a),X1为χ中标注的行人的全身的特征向量,X2为x中标注的行人的头部和肩部的特征向量,当y = _l时,d(x) =lg((eXp(a*f(X))+eXp(a*g(X)))/ a) ο参数值设置单元44将《和u值的值设置为参数值获取单元43在函数 Ig((1+exp (a*(l_y*d(χ))))/a)取得最小值时获取的w和u的值。图像数据信息生成单元45采用纵横比为8 3的窗口对待检测的输入图像进行扫描,生成图像对应的图像数据信息。特征向量获取单元46接收输入的图像数据,获取图像数据的特征向量。特征值计算单元47 根据公式 d (χ) = Ig ((exp (a*f (χ)) +exp (a*g (χ))) /a)计算输入的图像数据的特征值d(x),其中f (X) =WX, g(x) =U · X,《和U为预设的向量常数, a为预设的常数,·为向量点积运算符号,χ为获取的图像数据的特征向量。信息输出单元48将计算得到的图像数据的特征值与预设的阈值进行比较,输出所述图像数据是否包含行人的信息。本发明实施例通过对d(x) = Ig((exp (a*f (χ)) +exp (a*g(χ))) /a)进行训练,获取其取得最小值时W和U的值,从而为用户提供了一个有效的检测函数, 当接收到待检测的输入图像数据时,获取该图像的特征向量,根据公式d(x)= Ig ((exp (a*f (χ)) +exp (a*g (χ))) /a)计算输入的图像数据的特征值d (χ),将计算得到的图像数据的特征值与预设的阈值进行比较,输出运动物体是否为行人的信息,解决了现有行人检测系统无法根据行人是否被遮挡采取自适应的检测方式进行行人的检测,检测效果比较差的问题,从而当输入的图像数据中存在行人时通过自适应地选择相应的检测函数检测行人,为用户提供一种通用的、健壮的、精确的行人检测方法。 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
权利要求
1.一种行人检测方法,其特征在于,所述方法包括下述步骤接收输入的图像数据,获取图像数据的特征向量;根据公式d (χ) = 1 g ((exp (a*f (χ)) +exp (a*g (χ))) /a)计算输入的图像数据的特征值d(x),其中f(x) =w.x,g(x) =u*X,W*u为预设的向量常数,a为预设的常数,·为向量点积运算符号,χ为获取的图像数据的特征向量;将计算得到的图像数据的特征值与预设的阈值进行比较,输出所述图像数据是否包含行人的信息。
2.如权利要求1所述的方法,其特征在于,所述接收输入的图像数据,获取图像数据的特征向量的步骤之前,所述方法还包括下述步骤对采集到的包括行人的图像数据中行人的头部、肩部和全身进行标注;将采集到的背景图像数据和包括行人的图像数据存储到预先建立一个图像数据训练集中;预先设置向量参数w和u的初始值,以所述训练集为定义域,通过最优值计算模块获取函数lg((l+eXp(a*(l-y*d(X))))/a)在取得最小值时w和u的值,其中a为预设的常数,χ为输入的图像数据的特征向量,y等于1或-1,当y = 1时,d(x)= Ig ((exp (a*f (X1)) +exp (a*g (X2))) /a),X1为χ中标注的行人的全身的特征向量,X2为x中标注的行人的头部和肩部的特征向量,当y = _l时,d(x) =lg((eXp(a*f(X))+eXp(a*g(X)))/ a);将w和u值的值设置为函数Ig((1+exp (a*(l_y*d(χ))))/a)取得最小值时w和u的值。
3.如权利要求1或2所述的方法,其特征在于,所述a的值为10。
4.如权利要求1所述的方法,其特征在于,所述接收输入的图像数据,获取图像数据的特征向量的步骤之前,所述方法还包括采用纵横比为8 3的窗口对待检测的输入图像进行扫描,生成图像对应的图像数据 fn息ο
5.如权利要求ι所述的方法,其特征在于,所述将计算得到的图像数据的特征值与预设的阈值进行比较,输出所述图像数据是否包含行人的信息的步骤具体为当计算得到的图像数据的特征值大于预设的阈值时,输出所述图像数据包含行人的信息;当计算得到的图像数据的特征值不大于预设的阈值时,输出所述图像数据不包含行人的信息。
6.一种行人检测系统,其特征在于,所述系统包括特征向量获取单元,用于接收输入的图像数据,获取图像数据的特征向量;特征值计算单元,用于根据公式d(x) = lg((exp(a*f(x))+exp(a*g(x)))/a)计算输入的图像数据的特征值d(X),其中f(X) =W.X,g(X) =1!1,《和1!为预设的向量常数,a为预设的常数,·为向量点积运算符号,χ为获取的图像数据的特征向量;以及信息输出单元,用于将计算得到的图像数据的特征值与预设的阈值进行比较,输出所述图像数据是否包含行人的信息。
7.如权利要求6所述的系统,其特征在于,所述系统还包括标注单元,用于对采集到的包括行人的图像数据中行人的头部、肩部和全身进行标注;存储单元,用于将采集到的背景图像数据和包括行人的图像数据存储到预先建立一个图像数据训练集中;参数值获取单元,用于预先设置向量参数w和u的初始值,以训练集为定义域,通过最优值计算模块获取函数Ig((1+exp (a*(l_y*d(χ))))/a)在取得最小值时w和u的值,其中a为预设的常数,χ为输入的图像数据的特征向量,y等于1或-1,当y = 1时,d(x)= Ig ((exp (a*f (X1)) +exp (a*g (X2))) /a),X1为χ中标注的行人的全身的特征向量,X2为x中标注的行人的头部和肩部的特征向量,当y = _l时,d(x) =lg((eXp(a*f(X))+eXp(a*g(X)))/ a);以及参数值设置单元,用于将w和u值的值设置为所述参数值获取单元在函数 Ig((1+exp (a*(l_y*d(χ))))/a)取得最小值时获取的w和u的值。
8.如权利要求6或7所述的系统,其特征在于,所述a的值为10。
9.如权利要求6所述的系统,其特征在于,所述系统还包括图像数据信息生成单元,用于采用纵横比为8 3的窗口对待检测的输入图像进行扫描,生成图像对应的图像数据信息。
10.一种行人检测装置,其特征在于,所述装置包括权利要求6至9任一项所述的行人检测系统。
全文摘要
本发明适用于图像处理技术领域,提供了一种行人检测方法、系统及装置,所述方法包括下述步骤接收输入的图像数据,获取图像数据的特征向量;根据公式d(x)=lg((exp(a*f(x))+exp(a*g(x)))/a)计算输入的图像数据的特征值d(x),其中f(x)=w·x,g(x)=u·x,w和u为预设的向量常数,a为预设的常数,“·”为向量点积运算符号,x为获取的图像数据的特征向量;将计算得到的图像数据的特征值与预设的阈值进行比较,输出运动物体是否为行人的信息,本发明解决了现有行人检测系统无法根据行人是否被遮挡采取自适应的检测方式进行行人的检测,检测效果比较差的问题,从而当输入的图像数据中存在行人时通过自适应地选择相应的检测函数检测行人,为用户提供了一种通用的、健壮的、精确的行人检测方法。
文档编号G06K9/66GK102214308SQ201110127360
公开日2011年10月12日 申请日期2011年5月17日 优先权日2011年5月17日
发明者詹东晖 申请人:詹东晖
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1