一种基于车型图像的模式集直方图的车型识别方法

文档序号:9708787阅读:486来源:国知局
一种基于车型图像的模式集直方图的车型识别方法
【技术领域】
[0001] 本发明属于模式分类和数据挖掘技术领域,特别涉及一种基于车型图像的模式集 直方图的车型识别方法。
【背景技术】
[0002] 随着当今经济的高速发展,机动车的保有量迅速增加,导致交通状况的不断恶化。 现在无论哪个国家都毫无例外的受到不同程度的交通问题的困扰,在中国,这种情况尤为 突出并给环境、经济、社会及人类生活带来了严重的影响。为从根本上解决交通拥挤堵塞的 问题,人们开始运用各种新技术,如信息技术、计算机技术、通信技术、控制技术等,将人、 车、路紧密联系起来,不仅有效地缓解了交通阻塞问题,而且对交通事故的应急处理、环境 的保护、能源的节约都有了显著的效果。此时,智能交通系统应运而生。
[0003] 近年来出现了各种各样的车型识别技术,其中绝大多数是根据检测车辆的某些物 理参数来归纳分类以实现车辆的自动识别,这些参数往往是通过线圈、光电感应器等传感 器获得的车辆的车宽、车长、轮距、车重、底盘轴粗、底盘高等多种物理数据。这种方法可以 较为容易地进行车型识别,算法较为简单。但获得车辆数据的方法比较麻烦,需要架设大量 的外部辅助测量设备,增加了系统的不稳定性。通常来说,此方式一般只能判断车辆的大小 和类型,而无法通过识别判断车辆更进一步的信息。
[0004] 而基于图像处理的车型识别技术可以有效地解决这类问题。在图像处理领域,有 多种图像表示的方法,例如基本的SIFT特征、词袋模型、费舍尔向量等,运用这类图像表示 方法,再使用分类器进行分类,可以很好地实现车型识别,然而这类图像表示方法,特征维 数会比较大,面对大规模图像处理会带来维数灾难,在实际大规模车型图像识别问题中往 往运算时间长,识别效率低。另一方面,在数据挖掘领域,一种基于跳跃显露模式的数据挖 掘方法被广泛运用,使用跳跃显露模式的数据挖掘方法,可以寻找到数据集中的最能表示 当前类别的显露模式集,可以高效地以较少的项目集表示原类别数据集。
[0005] 根据以上所述,本发明提出了一种基于车型图像的模式集直方图的车型识别方 法,可以很好地解决上述问题,算法快速高效,提高了识别速度,消耗内存少,具有较高的实 用性和鲁棒性。

【发明内容】

[0006] 本发明中所述方法是为了克服上述现有技术的缺点,主要针对已经提取的车辆特 征对车型进行细分识别的问题,提出了一种基于车型图像的模式集直方图的车型识别方 法。具体的技术方案如下所述。
[0007] 本发明采用的技术方案如下:
[0008] -种基于车型图像的模式集直方图的车型识别方法,包括以下步骤:
[0009] 步骤1:对车型图像数据库,根据词袋模型构建图像的直方图表示;
[0010]步骤2:对构建的图像直方图进行多次随机投影,然后进行二值化处理,得到图像 的二值化事务项数据集;
[0011] 步骤3:对图像的二值化事务项数据集进行模式挖掘,构成图像的模式集直方图表 示;
[0012] 步骤4:对所有车型图像的模式集直方图进行one vs rest线性SVM训练,得到每种 类别车型图像的分类器,联合后得到车型识别系统;
[0013] 步骤5:对测试车型图像,提取其基于训练集中每种车型图像的模式集直方图表 示,将其导入车型识别系统进行测试,识别出车型。
[0014] 上述技术方案中,所述步骤1根据词袋模型构建图像的直方图表示,包括以下几个 步骤:
[0015] 步骤1.1:提取所有车型图像的SIFT特征,进行KMeans聚类,得到一个具有D个视觉 单词的字典;
[0016] 步骤1.2:对每个车型图像,由最近邻算法将其SIFT特征分配给离其最近的视觉单 词;
[0017] 步骤1.3:根据每个视觉单词周围的SIFT特征的个数,构建一个基于视觉单词的直 方图,归一化后,得到图像的D维直方图表示。
[0018] 上述技术方案中,所述步骤2中对构建的图像直方图进行多次随机投影,然后进行 二值化处理,得到图像的二值化事务项数据集,包括以下几个步骤:
[0019] 步骤2.1:对图像的直方图表示,随机选取P个视觉单词的直方图,P〈D;
[0020] 步骤2.2:对选取的P个视觉单词的直方图进行二值化处理:
[0021]
[0022]
[0023]其彳
为阈值;hp为所选P个视觉单词的直方图的集合,够为其中任 意一个,」[[1,一,?];以111^(111))表示集合1 11)中第1^个直方图的索引脚标,所选视觉单词直方 图中,前k个直方图被二值化为1,余下直方图被二值化为0; k表示排序的序列中的第k个值;
[0024] 步骤2.3:二值化后的直方图视为一个事务项X,重复随机选取R次,得到当前图像 的R个事务项数据集Χ= {χι,X2,…,xr},其中Xi(i e [ 1,R])表示任意一个事务项;
[0025] 步骤2.4:对全部图像,按步骤2.3中相同的顺序选取R次,构成全部图像的R个事务 项数据集乂 = {&}。
[0026] 上述技术方案中,所述步骤3中对图像的二值化事务项数据集进行模式挖掘,构成 图像的模式集直方图表示,包括以下几个步骤:
[0027] 步骤3.1:对图像的每一个事务项^(16[1,R]),都将当前类别的车型图像的事务 项设为正类丨穹丨(? ,其他类别的车型图像的事务项设为负类丨疋丨(/ e [1,/?]);
[0028] 步骤3.2:对得到的每个正类事务项数据集&和负类事务项数据集5卩进行跳跃显 露模式挖掘,分别得到R个事务项的正类和负类的显露模式集 表示第j个事务项的正类显露模式集,Γ表示第j个事务项的负类显露模式集;
[0029] 步骤3.3:对当前类别图像,统计其每个事务项xi(ie[l,R])在对应的正类和负类 显露模式集中的个数,得到最终2R维的模式集直方图表示;
[0030] 步骤3.4:重复步骤3.1到步骤3.3的操作,得到所有类别车型图像的模式集直方图 表不。
[0031] 上述技术方案中,所述步骤3.2中对正类和负类事务项数据集进行跳跃显露模式 挖掘,包括以下几个步骤:
[0032] 步骤3 . 2 . 1 :对正类事务项数据集和负类事务项数据集 f/_ e p, 1^,设定最小支持度阈值为δ,也即支持度s 2 δ,其中支持度s定义为:
[0033]
[0034] 其中count(A)表示数据集}中包含实例Α的数目,数据集Ζ中包含的总 实例数为I Z | ;
[0035]步骤3.2.2:通过显露模式挖掘,首先在正类中寻找支持度大于等于δ,在负类中支 持度为0的事务项集合{Υ+},然后在负类中寻找支持度大于等于S,在正类中支持度为0的事 务项集合{Υ?;
[0036]步骤3.2.3:得到当前事务项数据集的正类和负类的显露模式集{Υ+,Υ?。
[0037]上述技术方案中,所述步骤4中对所有车型图像的模式集直方图进行one vs rest 线性SVM训练,得到每种类别车型图像的分类器,联合后得到车型识别系统,包括以下几个 步骤:
[0038]步骤4.1:将当前类别车型图像的模式集直方图作为正样本,其他类别车型图像的 模式集直方图作为负样本;
[0039]步骤4.2:使用线性SVM训练这两个样本,得到当前类别车型图像的分类器;
[0040] 步骤4.3:重复步骤4.1到步骤4.2的操作,得到所有类别车型图像的分类器,联合 后构成车型识别系统。
[0041] 上述技术方案中,所述步骤5中对测试车型图像,提取其基于训练集中每种车型图 像的模式集直方图表示,将其导入车型识别系统进行测试,识别出车型,包括以下几个步 骤:
[0042] 步骤5.1:对测试车型图像,通过步骤1到步骤2的操作,得到其R个事务项数据集; [0043]步骤5.2:对提取到的R个事务项数据集,将其与训练集中每种车型图像的显露模 式集进行匹配统计,得到其基于训练集中每种车型图像的模式集直方图表示;
[0044] 步骤5.3:将得到的测试车型图像的每种模式集直方图表示,导入步骤4中的车型 识别系统进行测试,根据最大概率匹配,识别出车型。
[0045] 因为本发明采用上述技术方案,因此具备以下有益效果:
[0046] 本发明采用了词袋模型来构建车型图像的直方图表示,算法简单高效,再使用跳 跃显露模式挖掘方法来挖掘图像特征的内在联系,大大降低了图像特征的维度,提升了运 算效率,减少了内存消耗,具有较高的实用性和鲁棒性。
【附图说明】
[0047] 本发明将通过例子并参照附图的方式说明,其中:
[0048] 图1为图像的模式集直方图算法实现示意图;
[0049] 图2为根据词袋模型构建图像直方图示意图;
[0050] 图3为随机投影二值化过程示意图; 图4为构建图像的模式集直方图示意图; 图5为显露模式挖掘示意图。
【具体实施方式】
[0051] 本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥 的特征和/或步骤以外,均可以以任何方式组合。
[0052] 为详细说明本发明的技术内容、构造特征、所实现目的及效果,以下结合实施方式 并配合附图详予说明。
[0053] 本专利提出了一种基于局部特征聚合描述符的车型识别方法,在车辆车型识别上 取得良好的效果。整个算法实现示意图如图1所示,包括步骤:
[0054]步骤1:对车型图像数据库,根据词袋模型构建图像的直方图表示;
[0055] 具体地,对具有N类车型图像的图像数据库,构建图像的直方图表示的方法有很 多,例如梯度方向直方图、局部三值模式、词袋模型等,由于词袋模型算法简单,易实现,本 发明使用词袋模型构建图像的直方图,示意图如图2所示,包括以下几个步骤:
[0056] 步骤1.1:提取所有N类车型图像的SIFT特征,进行KMeans聚类,得到一个具有D个 视觉单词的字典;
[0057]步骤1.2:对每个车型图像,由最近邻算法将其SIFT特征分配给离其最近的视觉单 词;
[0058]步骤1.3:根据每个视觉单词周围的SIFT特征的个数,构建一个基于视觉单词的直 方图,归一化后,得到图像的D维直方图表示。
[0059] 步骤2:对构建的图像直方图进行多次随机投影,然后进行二值化处理,得到图像 的二值化事务项数据集;
[0060] 具体地,由于构建的图像直方图维数还是很高,所以需要进行投影降维,在实验中 采取PCA方法和直接对图像直方图进行多次随机投影的方法做对比,实验结果表明PCA并没 有提升实验效果,且其算法较复杂,故本发明采取对图像直方图进行多次随机投影的方法, 并进行二值化处理,构成图像的二值化事务项数据集,示意图如图3所示,包括以下几个步 骤:
[0061] 步骤2.1:对图像的直方图表示,随机选取P个视觉单词的直方图,
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1