基于Retinex与S‑SIFT特征结合的低照度车型识别方法与流程

文档序号:11458871阅读:227来源:国知局
基于Retinex与S‑SIFT特征结合的低照度车型识别方法与流程

本发明涉及计算机视觉领域,特指一种基于retinex与s-sift(sparsescaleinvariantfeaturetransform)特征结合的低照度条件下的车型识别方法。



背景技术:

随着现代化交通、安防等行业的迅速发展,车型自动识别技术越来越受到人们的重视,是近年来计算机视觉与模式识别技术在智能交通领域的重要研究课题之一。车型的自动识别系统可用于公路收费站、停车场、十字路口等场所的车辆管理,也可用于现代化小区或者工业园区的车辆进出管理,对于公共安全,社区安防,道路交通和停车场车辆管理都具有重要的促进作用。

车型识别一般包括三个方面的研究,国内外专家学者也开展了大量的工作,主要包括:车牌的定位与识别,车标的检测与识别,以及车型大小的分类。其中,根据车前脸图像来识别具体车型的研究方法是最近几年的热点研究方向。

现实中,在实际中采集的图片通常背景复杂、光照不均、分辨率低、车辆旧、车辆脏等,尤其是当夜晚或者天气昏暗时,由于光线照度低,导致车辆视频图像模糊不清,同时视频监控系统对于车辆图像拍摄的角度通常来说都不相同,这些都给车型识别带来了很大的困难。



技术实现要素:

本发明要解决的技术问题在于:针对现行夜晚低照度的情况下,车型识别系统存在的难点问题,提出一种基于retinex与s-sift(sparsescaleinvariantfeaturetransform)特征结合的低照度条件下的车型识别方法,有效地提高了监控系统的车型识别的准确程度,并使其满足实时性需求。

本发明技术方案具体包括如下步骤:

s1)基于retinex算法和小波变换的低照度图像增强;

s2)车牌定位;

s3)截取车脸区域图像;

s4)建立车脸区域图像的s-sift特征模型并结合svm训练器进行车型识别。

作为本发明技术方案的进一步改进,所述步骤s1)具体包括:

s1.1)通过采用单尺度retinex算法恢复车牌图像的色度的恒常性和增强图像的清晰度;

s1.2)通过改进的小波阈值去噪算法实现车型图像的小波去噪处理,具体包括:

a)对经过retinex算法处理后的恢复图像进行n层小波分解;

b)选定一小波阈值tj,比较小波系数与小波阈值tj的差值从而判断相关性,相关性大的是主要信息,需要增强。相关性小,则为噪声部分,将该噪声部分小波系数置零;

c)遍历所有尺度,在相邻的尺度每一点都进行一遍阈值相关性判断和小波系数置零或增强处理;

d)选取一个增强函数对步骤c)处理后图像进行增强,然后进行小波重构。

作为本发明技术方案的进一步改进,所述步骤s2)具体包括s2.1)训练车牌样本特征提取及特征组织和s2.2)车牌的检测定位;

所述s2.1)包括:

s2.1.1)手动抠取出任意正常国标车牌;

s2.1.2)对抠取出的车牌图像进行积分通道特征提取:首先分别建立luv通道、梯度幅值通道和梯度直方图通道,并根据luv通道、梯度幅值通道和梯度直方图通道得到对应通道的车牌图像特征;

s2.1.3)基于adaboost算法训练检测器:训练阶段,利用adaboost算法对提取的积分通道特征训练出强分类器;在判别阶段,计算检测出定位车牌窗口的积分通道特征,运用强分类器判别车牌位置的自信度,最后存储一段视频中自信最高的那一帧或者几帧图像;

所述s2.2)包括:

s2.2.1)采用滑窗法对经过增强处理的目标图像进行扫描,将每次扫描截取的图像进行积分通道特征计算,与adaboost算法训练出的强检测器进行比对,选取相似度最高的图像区域作为初定位车牌图像;

s2.2.2)将检测器输出的初定位图像进行非极大值抑制处理后的初定位结果进行基于霍夫变换的倾斜校正,并对倾斜校正后的图像再次进行积分通道特征提取后输入强检测器进行二次定位,得到二次定位后的车牌图像。

作为本发明技术方案的进一步改进,所述步骤s3)具体包括:在定位出准确的车牌位置后,通常根据车牌的长宽,选取一定的比例进行车脸图像的截取。

作为本发明技术方案的进一步改进,所述步骤s4)具体包括:

s4.1)建立车脸区域图像的s-sift特征模型,其包括采用s-sift算法处理车脸区域图像sift特征描述子得到稀疏编码,并采用池化方法统计稀疏编码结果,获取车脸区域图像的概要统计特征;

s4.2)车脸区域图像车型特征分类与识别,其包括在提取s-sift特征以后,利用svm训练器进行训练分类;训练分类后,将截取的包含车型特征信息的车脸区域图像输入svm训练器中,并输出识别的车型信息。

与现有技术相比,本发明具有以下有益效果:

1、本发明方法首先利用retinex算法进行颜色恢复处理并采用一种改进的小波阈值去噪算法,同时针对传统小波去噪算法在黑暗条件下处理效果的局限性,加入了retinex算法来调节车牌图像的颜色,有效保持原图像的颜色恒定性、可以有效增强图像的色彩对比度。

2、本发明方法结合已经经过增强处理的车型特征图像,提取目标图像的低层sift特征向量,再经训练获得编码字典和稀疏sift特征,得到更深层次图像特征,以适应不同视角、光照变化、阴影、遮挡等复杂场景,进一步提高识别率;最后用线性支持向量机实现稀疏sift特征分类,降低时间复杂度,保证实时性。

3、本发明方法可靠性高,辩识别度好,能够针对昏暗复杂条件下的车辆图像进行车牌识别处理,同时本算法鲁棒性好,步骤计算简单,能保持高效率,实时性也能满足需求。

附图说明

图1是本实施例所述整体方法流程图;

图2是本实施例所述基于retinex图像增强效果对比;

图3是本实施例所述基于小波去噪与retinex结合算法图像处理对比图;

图4是本实施例所述车牌图像三种积分特征通道图像;

图5是本实施例所述四个方向梯度算子示意图;

图6是本实施例所述像素点方向示意图;

图7是本实施例所述霍夫变换倾斜校正的车牌图像;

图8是本实施例所述截取的车脸图像范围各参数实例。

具体实施方式

现结合附图对本发明做进一步详细说明,本实施例提出一种基于retinex与s-sift(sparsescaleinvariantfeaturetransform)特征结合的低照度条件下的车型识别方法,该车型识别方法具体步骤如下所示:

s1.基于retinex和小波变换的低照度图像增强:

s1.1通过采用单尺度retinex算法来恢复车牌图像的色度的恒常性和增强图像的清晰度;

retinex算法的理论是一种在人眼视觉特性的基础上建立起来的图像增强算法,其基本原理是:目标物体对不同波长的光线的反射能力决定了所采集的目标图像的色彩,光照的明暗变化不会对实物的颜色造成影响,即物体的色彩具有恒常性。retinex算法可以有效的利用图像的颜色恒常性,对图像进行动态范围压缩、边缘增强和图像颜色恒常性处理,因此可以对低照度图像进行自适应处理。

基于以上内容,retinex算法的理论对类似受光照影响的暗景图像有很好的处理效果,因为物体的固有属性-色彩与光源的强度大小没有依赖关系,而图像的颜色由像素点值确定,像素点的矫正可以通过像素间的相对明暗关系得出。

retinex算法的基本原理具体如下式所示:设s(x,y)是计算机接收到的图像,r(x,y)是反射物体图像,l(x,y)是入射光图像,r(x,y)是retinex算法处理后的图像,retinex算法利用实际目标s(x,y)求解出亮度图像l(x,y)。

s(x,y)=r(x,y)·l(x,y)

求解过程通常需要借助高斯卷积函数作为中心环绕函数,求解原理具体如以下公式所示:

∫∫g(x,y)dxdy=1

l(x,y)=s(x,y)*g(x,y)

其中,设g(x,y)是中心环绕函数,相比于平方反比函数和指数型中心函数,高斯型函数作用距离近,细节增强效果和动态压缩效果都很好。

公式(1)c是滤波半径,是g(x,y)环绕范围的尺度参数,滤波半径的选择是retinex算法处理的关键。c值较小图像压缩范围大,细节突出明显,但会造成颜色失真。c值较大颜色接近实际值,但图像压缩范围小。所以选择合适的尺度参数很重要,通常c值选取15、80或20,其分别对应尺度小、中和大。

针对低照度环境,本发明实施例对传统只靠小波理论进行增强的算法进行了改进,即在进行自适应增强之前加入了单尺度retinex算法处理,该处理既能有效的增强图像的细节部分,还能保持色彩的对比度。

根据实际需求,选取一个合适尺度参数c值(通常c值在15,80,20之间选择),然后利用高斯核函数对图像进行retinex算法处理,具体步骤包括:

a)首先分别计算待处理图像r、g、b分量大小,并进行数据类型归一化处理,并将像素值转换为浮点数,以便进行计算。

b)设置尺度参数并创建高斯核函数:包括定义模板矩阵大小,并由模板大小计算出模板中心即滤波半径c。

c)将待处理图像r、g、b分量分别与高斯核函数进行卷积处理,并对处理结果取对数。

d)将步骤c)得到的对数与输入图像矩阵的对数做差,并且分别对r、g、b分量进行对比度拉伸处理。

e)将步骤d)得到结果进行取指数处理,此时得到的r、g、b分量即组成了恢复图像。

retinex算法有较好的恢复效果,其可以增强图像关键信息和增加图像清晰度。本发明实施例效果对比结果如图2所示。

但是retinex算法处理后虽然恢复了图像色彩对比度,但图像还含有大量噪声干扰,并且单尺度retinex算法在细节恢复方面具有局限性。因此本发明实施例结合小波阈值增强算法对retinex算法处理后的图像的噪声和细节信息进行处理。

s1.2通过改进的小波阈值去噪算法实现车型图像的小波去噪处理:

小波多尺度分解过程是:先对图像进行一维小波分解,分别进行低通、高通滤波,然后进行二元抽样,得到平均、细节两部分系数。通过不断地对上一级分解得到的低频系数进行小波分解,一系列递归过程即构成小波多层分解。

小波函数为:

式中,r+=r-{0}为不等于零的所有实数,函数的傅里叶变换,是母小波函数。

对于实数对(a,b),参数a为非零实数,函数:

即小波函数,它是由小波母函数经过伸缩平移得到的连续小波函数,其中(a,b)分别代表伸缩因子和平移因子。

f(x)的连续小波变换则定义为:

逆变换为:

针对低照度的环境下,图像采集受环境因素变化影响大的特点,本发明实施例采用了最适合的小波自适应的阈值去噪算法,即自适应滤波增强算法,其基本原理是:

首先利用小波多尺度分解,获得含噪图像的细节和噪声系数,然后增强细节部分的小波系数,将噪声系数置零。其中恢复的关键是选择合适的阈值函数,该阈值函数能自适应地对多尺度下的小波系数进行处理。所述自适应滤波增强算法改善了传统算法单纯处理高频或者将图像小波系数进行整体处理过程中带来的噪声放大问题。但该自适应滤波增强算法能有效地增强图像并抑制噪声,对复杂条件下细节信号较弱的图像具有很好的增强效果。

为了进一步增强处理效果,在原始图像经过retinex算法处理恢复了图像色彩对比度以后,本发明实施例采取改进的自适应阈值去噪算法,该自适应阈值去噪算法能有效根据不同的小波分量进行自适应处理。该自适应阈值去噪算法的步骤具体包括:

a)对经过retinex算法处理后的恢复图像进行n层小波分解。

b)选定一小波阈值tj,比较小波系数与小波阈值tj的差值从而判断相关性,相关性大的是主要信息,需要增强。相关性小,则为噪声部分,将该噪声部分小波系数置零。

c)遍历所有尺度,在相邻的尺度每一点都进行一遍阈值相关性判断和小波系数置零或增强处理。

d)选取一个增强函数对步骤c)处理后图像进行增强,然后进行小波重构。

其中,小波阈值tj的选取依据的是噪声方差估计值、子带系数能量分布等信息。若阈值选取过小时,会造成大量噪声残留,图像效果不佳。如果阈值选取过大,会将细节信息误判为噪声信号去除,造成图像信息丢失。小波分解尺度增大,噪声部分的小波变换系数减小,所以不同分解层次下小波阈值tj选取值不同,因此本发明实施例采用有效的估计算法确定每层阈值。

对于小波阈值tj(λ)的选取,采用通用阈值估计函数其中σ和n分别代表噪声方差和信号长度。本发明实施例选取σ=0.01的高斯白噪声。而在实际图像处理过程中,由于环境复杂噪声信息和噪声的方差不确定,所以首先要对噪声水平进行估算。本发明采用的估算算法利用每个分解尺度下细节的小波系数的绝对值的中值来进行估算,估算公式如下所示:

σ=median(|wj,k|)/0.6745

所述改进的小波阈值去噪算法处理的效果图如图3所示,由结果可知应用本发明实施例的所述改进的小波阈值去噪算法恢复出的图像清晰,同时有效地保留图像有用信息。

s2车牌定位:

s2.1训练车牌样本特征提取及特征组织;

s2.1.1手动抠取出任意正常国标车牌;

s2.1.2对抠取出的车牌图像进行积分通道特征提取;

积分通道特征由dollárp等人在2009年提出,最早通常用于行人检测,是目前评估效果较好的检测算子。积分通道特征的基本思想是通过对输入图形进行各种线性和非线性的变换,图像的很多常用特征,例如局部求和、直方图、haar以及它们的变种,可以借助积分图来快速、高效地计算。给定一个输入图像矩阵i,其对应的通道指的是原始输入图像的某种输出响应。对于灰度图,其对应的通道矩阵c=i,即原图本身;

对于彩图,其每个颜色通道都对应一个通道。其他类似的通道可以通过各种线性和非线性的方法计算得到。令ω代表图像的某种通道计算函数,则对应的通道c=ω(i)。

在计算中,不同的变换可以形成不同的通道类型,本发明中选取3种不同的通道作为积分通道特征,以保证其准确性。其中luv颜色通道能够很好地描述车牌亮度及色度变化,梯度幅值通道很好地反映了车牌的轮廓,梯度直方图通道则从不同梯度方向上综合对车牌位置姿态变化进行描述。3种通道变换效果如图4所示。

s2.1.2.1luv通道的建立

在图像处理中,luv色彩空间(全称cie1976(l*,u*,v*))优于rgb色彩空间。luv色彩空间的目的是建立与人的视觉统一的色彩空间,具备一致性和均匀性且各色彩分量之间不相关。在luv色彩空间中,l表示亮度,u、v表示色度。一般图像颜色都是rgb颜色空间的,通过下面的公式可以转换到luv颜色空间中。

最后计算得到luv色彩空间中的l、u、v通道。

s2.1.2.2梯度幅值通道:

梯度幅值是一种用于图像边缘检测的描述方法。一幅图像中每个像素点具有八邻域以及四个边缘检测方向。为了能够在像素点x方向、y方向、z方向上检测边缘,本发明实施例使用在窗口中分别计算x方向y方向、z方向的一阶偏导数有限差分均值来确定像素点的梯度幅值的方法。四个方向的梯度算子分别为图5所示。其中i[i,j]是坐标为3×3窗口中心像素点的灰度值,m[i,j]为中心像素点的梯度幅值,其计算公式如下所示,对应四个方向上的计算公式为:

m[i,j]=(|px[i,j]|+|p45°[i,j]|+|py[i,j]|+|p135°[i,j]|)

由上述公式最后得到整幅图像的梯度幅值图。

s2.1.2.3梯度直方图通道:

梯度直方图思想来源于梯度方向直方图(histogramsoforientedgradients,hog)是2005年dalal等人将它用于行人识别而得名。hog作为一种局部特征描述子,对方向、尺度、光照不敏感。后来deniz等人将hog成功应用于人脸识别,得到了比较好的效果。

梯度直方图特征提取过程如下:

步骤1以图像i[i,j]为中心取3×3的像素邻域作为采样窗口。

步骤2计算该像素点[i,j]的梯度方向θ[i,j]和梯度幅值m[i,j]。

θ[i,j]=arctan(i[i,j+1]-i[i,j-1])/i[i+1,j]-i[i-1,j]

如图6所示,箭头代表该像素点[i,j]的方向。

步骤3将梯度方向分为6个方向,即将180°平均分成6份,平均间隔30°。按照椭圆圈的高斯加权范围将该像素邻域上所有梯度方向角度相同的像素点梯度幅值相加。

步骤4最后统计6个方向上的梯度幅值累加和,得到整幅图像6个方向上的梯度幅值图。

最后得到的包括luv通道、梯度幅值通道、梯度直方图通道等10个通道的图像如图4所示。

s2.1.3基于adaboost算法训练检测器:

训练阶段,利用adaboost算法对提取的积分通道特征训练出强分类器,在判别阶段,计算检测出定位车牌窗口的积分通道特征,运用强分类器进行打分(判别车牌位置的自信度),最后存储一段视频中分数最高的那一帧或者几帧图像。

adaboost算法由schapire、freund等人于1996年提出,其实质是弱分类器的分类学习过程,是集成机器学习方法的一种,具有计算效率高、调节参数少、针对弱分类器的构造兼容性强、以及对样本先验知识和数据格式要求低等优点,因此,得到广泛推广。adaboost算法中每个特征都对应一个弱分类器,但并不是每一个特征都能很好地描述前景目标的特点。如何从大量特征中挑选出最优特征并制作成弱分类器,再通过弱分类器集成,最终获得高精度的强分类器,是adaboost算法训练过程所要解决的关键问题。

弱分类器的定义为:

其中,fj表示一个特征,pj表示不等式方向,θj表示阈值。

s2.1.3.1具体训练算法

(1)给定n个样本图像,xi是输入样本图像,yi是类别标志,其中yi=0表示为负样本,yi=1表示为正样本。

(2)初始化权重:

其中m和l分别为非正确车牌样本和正确车牌样本的数量,n=m+l。

(3)fort=1,2,3,…,t

1、归一化权重:其中ωt为统计分布。

2、随机选择积分通道特征j:

随机选择通道索引bink(k=1,2,…,10);

随机选择矩形区域rectj并计算像素值之和

3、对每个特征j,训练一个弱分类器hj,计算相应的ωt的错误率:

εj=∑iωi|hj(xi)-yi|

4、选择最小错误率εt的弱分类器ht。

5、更新权重:其中,当xi被正确分类时,ei=0,反之,ei=1;

(4)最终强分类器为h(x):

其中,

s2.2.车牌的检测定位;

s2.2.1用滑窗法对经过增强处理的目标图像进行扫描,获取初定位车牌图像;

本发明实施例根据国内车牌的固定比例,设定一个固定大小的滑窗,从获取视频图像顶端开始进行逐一扫描,为了提高扫描准确度,通常设置滑窗步长为4个像素,将每次扫描截取的图像进行积分通道特征计算,与adaboost算法训练出的强检测器进行比对,得到得分最高的(即相似度最高的)图像区域,即初步判定为车牌位置,截取该得分最高的图像区域为初定位图像并输出检测器。

s2.2.2将检测器输出的初定位图像进行非极大值抑制处理后的初定位结果进行基于霍夫变换的倾斜校正得到二次定位后的车牌图像;

非极大值抑制在物体检测中应用十分广泛,其主要目的是为了消除多余干扰因素,找到最佳的物体检测的位置。非极大值抑制是检测的后处理过程,是关键环节之一。

启发式窗口融合算法对非重合目标检测效果很好,但对于车辆车牌检测并不适合。启发式窗口融合算法,将初始检测窗口划分为若干个不重合的子集,然后计算每个子集的中心,最后每个子集只保留一个检测窗口,显然该启发式窗口融合算法容易造成大量漏检。

dalal等提出了均值漂移非极大值抑制方法,其不仅计算复杂,需要将检测窗口在3维空间(横坐标,纵坐标,尺度)表示,检测分数转换,计算不确定性矩阵,迭代优化,而且还需要调整很多与检测器的步长等相关联的参数,因此,目前较少使用。

当前,大多数的目标检测普遍使用基于贪心策略的非极大值抑制算法,因为它简单高效,主要步骤如下:

(1)将初始检测窗口按照检测分数从高到低排序;

(2)将第1个初始检测窗口作为当前的抑制窗口;

(3)非极大值抑制。将所有检测分数比当前抑制窗口低的初始窗口作为被抑制窗口。计算当前抑制窗口与被抑制窗口的重合面积比率:面积的交集/面积的并集。剔除重合面积比率高于设定阈值的窗口;

(4)如果只剩最后一个初始检测窗口则结束,否则按照排好的顺序,取下一个未被抑制的窗口作为抑制窗口,转到步骤(3)。

本发明实施例同样使用的是简单高效的基于贪心策略的非极大值抑制算法,并将经过非极大值抑制处理后的车牌图像进行基于霍夫变换的倾斜校正。

霍夫变换是一种强有力的特征提取方法,它利用局部图像信息有效的积累所有可能的模型实例的依据,这使得它既能方便地从外部数据中获得额外的信息,又能敏锐地从只有一部分的实例中呈现出有效信息。霍夫变换普遍应用在计算机视觉中形状,位置,几何变换参数的判断中。自霍夫变换提出以来,其得到了广泛的应用。近些年,专家学者们对霍夫变换的理论性质与应用方法又进行了进一步的探讨。霍夫变换作为一种有效的识别直线的算法,具有良好的抗干扰性及鲁棒性。

霍夫变换方法包含一个从图像空间中的特征到参数空间中点的集合的映射。每一个参数空间中的点表征着图像空间中模型的一个实例,图像特征利用一个函数被映射到参数空间当中去,这个函数产生能够兼容观察到的图像特征与假设的模型的所有的参数组合。每一个图像特征将在多维的参数空间中产生一个不同的平面,但是由所有图像特征产生的属于同一个模型的实例的一切平面都会相交在描绘共同的实例的点,霍夫变换的根本是产生这些平面并且识别与之相交的参数点。

经过基于霍夫变换的倾斜校正后的车牌图像为系统二次定位后的图像。霍夫变换倾斜校正的车牌图像示例如图7所示。

s2.2.3将输出的二次定位后的车牌图像输入强检测器,得出最终定位车牌结果。

将经过非极大值抑制处理和基于霍夫变换的倾斜校正后的车牌图像输出后再次进行积分通道特征提取后输入强检测器进行二次定位,包括与adaboost算法训练出的强检测器进行比对,得到得分最高的(即相似度最高的)图像区域,即判定为车牌位置,截取该得分最高的图像区域为二次定位图像并输出检测器,得到最终的定位结果。

s3车脸区域图像的截取:

在定位出准确的车牌位置后,通常根据车牌的长宽,选取一定的比例进行车脸图像的截取,以卡口相机的正脸拍摄车型区域为例,通常,以车牌的左右两边各截取1.3倍车牌长度为车脸区域的长,而车型图片高度为车牌之上0.8倍车牌长度,车牌之下为0.3倍车牌长度,参数可根据需要实时调整。截取的车脸图像范围各参数实例如图8所示。

s4建立车牌区域图像的s-sift特征模型并结合svm训练器进行车型识别:

对于已经截取好的包括车型信息的车脸区域图像,需要进行识别才能输出最终车型结果,本发明实施例基于深度学习理论,提出了一种基于稀疏sift特征的车型识别方法,该车型识别方法首先提取目标车牌区域图像的低层sift特征向量,再经训练获得编码字典和稀疏sift特征,得到更深层次图像特征,以适应不同视角、光照变化、阴影、遮挡等复杂场景,进一步提高识别率;最后用线性支持向量机实现稀疏sift特征分类,降低时间复杂度,保证实时性。车型识别方法的具体步骤如下:

s4.1建立s-sift特征模型

s4.1.1s-sift特征算法:

s-sift特征算法是在图像sift特征的基础上,进一步训练超完备字典基,在l1范数约束下编码的稀疏sift,可以实现更高层次车辆图像抽象。

定义矩阵x包含图像在d维特征空间的m个s-sift特征描述子,x=(x1,…,xm)t,则x可以表示为:

x=wc

式中:w是稀疏编码的系数,c=(c1,…,ck)t是k个基向量。求解x的稀疏编码可以表征为下式对w和c求解最优化问题:

式中:||·||和|·|分别表示l2范数和l1范数。由l1范数约束性质可知,惩罚项|wm|保证了编码结果的稀疏性,稀疏系数β控制|wm|的权重,即稀疏性。基向量是过完备的(k>d),因此用cg的l2约束避免平凡解。

虽然求解式时w和c同时变化,目标函数不是凸优化问题,但是分别固定w和c时,目标函数分别退化为关于c和w的凸函数。固定w时,目标函数退化为关于c的最小二乘问题:

可以用拉格朗日对偶算法快速求解。固定c,目标函数退化为单独对每一个wm求最优解的线性回归问题:

可以用特征符号搜索算法求解。

本发明实施例试验中选取d=128,β=0.15,k选用8、32、128、512、1024共5种编码维度。m取决于图像大小。以一幅256×256像素的图像为例,sift图像块大小定义为16×16像素,步长为6,则横向作(256—16)/6=40次匹配,纵向作次匹配,m=40×40,即1600,用512维s-sift算法处理sift特征子,最终输出的稀疏编码为1600个512维的向量。

s4.1.2池化

池化是统计稀疏编码结果的过程,其模拟人眼视觉皮层的生理机制,可以减少输入向量维数,有利于降低训练分类器的时间复杂度。以本发明实施例中所述256×256图像为例,其稀疏sift编码维度为1600×512=819200,训练一个输入向量维度超过80万的分类器难度很大,且容易出现过拟合。因此本实施例采用池化方法,获取一幅图像的概要统计特征,不仅降低了训练分类器的难度,而且避免了过拟合现象。

目前常见的池化方法有平均池化和最大池化等,计算方法为:

平均池化:

最大池化:pj=max{|w1j|,…,|wmj|}

式中:wm是稀疏编码向量;p是池化结果;wij表示第i个稀疏编码向量的第j个元素。池化后的特征用简单的线性svm分类器就能达到较好的分类效果,时间复杂度仅为o(n)。

s4.2车脸区域图像车型特征分类:

s4.2.1svm分类器的参数训练

车型特征分类主要是指将待识别的包括车型信息的车脸区域图像与经过学习的训练车型特征通过某一算法进行对比来进行识别。常用的分类器主要包括最小距离分类器、k-最近邻分类器、贝叶斯分类器、决策树、adaboost级联分类器、人工神经网络和支持向量机(svm)。根据需要训练分类的车型图像特性及不同分类器的特点,本发明主要采用支持向量机进行分类。支持向量机的核心思想在于利用一个分类超平面当作决策的曲面,来最大化正类和负类两者的边缘距离。

本发明中,定义q={(xi,yi)},i=1,…,n,其中q是n个输入数据点集;xi表示输入变量;yi表示目标值,在二类问题中yi∈{1,-1}。分类函数定义为:

式中,表示从输入空间到高维特征空间的映射。根据序列最小优化算法(sequentialminimaloptimization,smo)可以求得决策函数如下:

式中:ai表示拉格朗日乘子;k<xi,x>表示核函数,用于快速计算映射到高维空间后两个向量的内积。

常见的核函数有线性核、高斯核、多项式核。用非线性核svm分类器,其训练时间复杂度为o(n2~n3),分类时间复杂度为o(n);而采用线性核则可以将训练时间复杂度降低到o(n),分类时间复杂度仍为o(n)。在实际应用中,通常采用线性核函数以提高训练效率,保证系统实时性。

综上所述,在提取特征以后,利用svm进行训练分类。训练分类后,将截取的包含车型特征信息的车脸区域图像输入svm训练器中,并输出识别的车型信息。

本发明中提出的方法实际上可嵌入fpga实现,运用于具有实时输出图像功能的车型识别功能的相机或摄像机监控系统中。

本领域技术人员将清楚本发明的范围不限制于以上讨论的示例,有可能对其进行若干改变和修改,而不脱离所附权利要求书限定的本发明的范围。尽管己经在附图和说明书中详细图示和描述了本发明,但这样的说明和描述仅是说明或示意性的,而非限制性的。本发明并不限于所公开的实施例。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1