一种基于车型图像的模式集直方图的车型识别方法

文档序号：9708787阅读：486来源：国知局

一种基于车型图像的模式集直方图的车型识别方法
【技术领域】
[0001] 本发明属于模式分类和数据挖掘技术领域，特别涉及一种基于车型图像的模式集直方图的车型识别方法。
【背景技术】
[0002] 随着当今经济的高速发展，机动车的保有量迅速增加，导致交通状况的不断恶化。现在无论哪个国家都毫无例外的受到不同程度的交通问题的困扰，在中国，这种情况尤为突出并给环境、经济、社会及人类生活带来了严重的影响。为从根本上解决交通拥挤堵塞的问题，人们开始运用各种新技术，如信息技术、计算机技术、通信技术、控制技术等，将人、车、路紧密联系起来，不仅有效地缓解了交通阻塞问题，而且对交通事故的应急处理、环境的保护、能源的节约都有了显著的效果。此时，智能交通系统应运而生。
[0003] 近年来出现了各种各样的车型识别技术，其中绝大多数是根据检测车辆的某些物理参数来归纳分类以实现车辆的自动识别，这些参数往往是通过线圈、光电感应器等传感器获得的车辆的车宽、车长、轮距、车重、底盘轴粗、底盘高等多种物理数据。这种方法可以较为容易地进行车型识别，算法较为简单。但获得车辆数据的方法比较麻烦，需要架设大量的外部辅助测量设备，增加了系统的不稳定性。通常来说，此方式一般只能判断车辆的大小和类型，而无法通过识别判断车辆更进一步的信息。
[0004] 而基于图像处理的车型识别技术可以有效地解决这类问题。在图像处理领域，有多种图像表示的方法，例如基本的SIFT特征、词袋模型、费舍尔向量等，运用这类图像表示方法，再使用分类器进行分类，可以很好地实现车型识别，然而这类图像表示方法，特征维数会比较大，面对大规模图像处理会带来维数灾难，在实际大规模车型图像识别问题中往往运算时间长，识别效率低。另一方面，在数据挖掘领域，一种基于跳跃显露模式的数据挖掘方法被广泛运用，使用跳跃显露模式的数据挖掘方法，可以寻找到数据集中的最能表示当前类别的显露模式集，可以高效地以较少的项目集表示原类别数据集。
[0005] 根据以上所述，本发明提出了一种基于车型图像的模式集直方图的车型识别方法，可以很好地解决上述问题，算法快速高效，提高了识别速度，消耗内存少，具有较高的实用性和鲁棒性。

【发明内容】

[0006] 本发明中所述方法是为了克服上述现有技术的缺点，主要针对已经提取的车辆特征对车型进行细分识别的问题，提出了一种基于车型图像的模式集直方图的车型识别方法。具体的技术方案如下所述。
[0007] 本发明采用的技术方案如下：
[0008] -种基于车型图像的模式集直方图的车型识别方法，包括以下步骤：
[0009] 步骤1:对车型图像数据库，根据词袋模型构建图像的直方图表示；
[0010]步骤2:对构建的图像直方图进行多次随机投影，然后进行二值化处理，得到图像的二值化事务项数据集；
[0011] 步骤3:对图像的二值化事务项数据集进行模式挖掘，构成图像的模式集直方图表示；
[0012] 步骤4:对所有车型图像的模式集直方图进行one vs rest线性SVM训练，得到每种类别车型图像的分类器，联合后得到车型识别系统；
[0013] 步骤5:对测试车型图像，提取其基于训练集中每种车型图像的模式集直方图表示，将其导入车型识别系统进行测试，识别出车型。
[0014] 上述技术方案中，所述步骤1根据词袋模型构建图像的直方图表示，包括以下几个步骤：
[0015] 步骤1.1:提取所有车型图像的SIFT特征，进行KMeans聚类，得到一个具有D个视觉单词的字典；
[0016] 步骤1.2:对每个车型图像，由最近邻算法将其SIFT特征分配给离其最近的视觉单词；
[0017] 步骤1.3:根据每个视觉单词周围的SIFT特征的个数，构建一个基于视觉单词的直方图，归一化后，得到图像的D维直方图表示。
[0018] 上述技术方案中，所述步骤2中对构建的图像直方图进行多次随机投影，然后进行二值化处理，得到图像的二值化事务项数据集，包括以下几个步骤：
[0019] 步骤2.1:对图像的直方图表示，随机选取P个视觉单词的直方图，P〈D;
[0020] 步骤2.2:对选取的P个视觉单词的直方图进行二值化处理：
[0021]
[0022]
[0023]其彳
为阈值;hp为所选P个视觉单词的直方图的集合，够为其中任意一个，」[[1，一，？];以111^(111))表示集合1 11)中第1^个直方图的索引脚标，所选视觉单词直方图中，前k个直方图被二值化为1，余下直方图被二值化为0; k表示排序的序列中的第k个值；
[0024] 步骤2.3:二值化后的直方图视为一个事务项X，重复随机选取R次，得到当前图像的R个事务项数据集Χ= {χι，X2，…，xr}，其中Xi(i e [ 1，R])表示任意一个事务项；
[0025] 步骤2.4:对全部图像，按步骤2.3中相同的顺序选取R次，构成全部图像的R个事务项数据集乂 = {&}。
[0026] 上述技术方案中，所述步骤3中对图像的二值化事务项数据集进行模式挖掘，构成图像的模式集直方图表示，包括以下几个步骤：
[0027] 步骤3.1:对图像的每一个事务项^(16[1，R])，都将当前类别的车型图像的事务项设为正类丨穹丨(? ，其他类别的车型图像的事务项设为负类丨疋丨(/ e [1,/?]);
[0028] 步骤3.2:对得到的每个正类事务项数据集&和负类事务项数据集5卩进行跳跃显露模式挖掘，分别得到R个事务项的正类和负类的显露模式集表示第j个事务项的正类显露模式集，Γ表示第j个事务项的负类显露模式集；
[0029] 步骤3.3:对当前类别图像，统计其每个事务项xi(ie[l，R])在对应的正类和负类显露模式集中的个数，得到最终2R维的模式集直方图表示；
[0030] 步骤3.4:重复步骤3.1到步骤3.3的操作，得到所有类别车型图像的模式集直方图表不。
[0031] 上述技术方案中，所述步骤3.2中对正类和负类事务项数据集进行跳跃显露模式挖掘，包括以下几个步骤：
[0032] 步骤3 . 2 . 1 :对正类事务项数据集和负类事务项数据集 f/_ e p, 1^，设定最小支持度阈值为δ，也即支持度s 2 δ，其中支持度s定义为：
[0033]
[0034] 其中count(A)表示数据集}中包含实例Α的数目，数据集Ζ中包含的总实例数为I Z | ;
[0035]步骤3.2.2:通过显露模式挖掘，首先在正类中寻找支持度大于等于δ，在负类中支持度为0的事务项集合{Υ+}，然后在负类中寻找支持度大于等于S，在正类中支持度为0的事务项集合{Υ?;
[0036]步骤3.2.3:得到当前事务项数据集的正类和负类的显露模式集{Υ+，Υ?。
[0037]上述技术方案中，所述步骤4中对所有车型图像的模式集直方图进行one vs rest 线性SVM训练，得到每种类别车型图像的分类器，联合后得到车型识别系统，包括以下几个步骤：
[0038]步骤4.1:将当前类别车型图像的模式集直方图作为正样本，其他类别车型图像的模式集直方图作为负样本；
[0039]步骤4.2:使用线性SVM训练这两个样本，得到当前类别车型图像的分类器；
[0040] 步骤4.3:重复步骤4.1到步骤4.2的操作，得到所有类别车型图像的分类器，联合后构成车型识别系统。
[0041] 上述技术方案中，所述步骤5中对测试车型图像，提取其基于训练集中每种车型图像的模式集直方图表示，将其导入车型识别系统进行测试，识别出车型，包括以下几个步骤：
[0042] 步骤5.1:对测试车型图像，通过步骤1到步骤2的操作，得到其R个事务项数据集； [0043]步骤5.2:对提取到的R个事务项数据集，将其与训练集中每种车型图像的显露模式集进行匹配统计，得到其基于训练集中每种车型图像的模式集直方图表示；
[0044] 步骤5.3:将得到的测试车型图像的每种模式集直方图表示，导入步骤4中的车型识别系统进行测试，根据最大概率匹配，识别出车型。
[0045] 因为本发明采用上述技术方案，因此具备以下有益效果：
[0046] 本发明采用了词袋模型来构建车型图像的直方图表示，算法简单高效，再使用跳跃显露模式挖掘方法来挖掘图像特征的内在联系，大大降低了图像特征的维度，提升了运算效率，减少了内存消耗，具有较高的实用性和鲁棒性。
【附图说明】
[0047] 本发明将通过例子并参照附图的方式说明，其中：
[0048] 图1为图像的模式集直方图算法实现示意图；
[0049] 图2为根据词袋模型构建图像直方图示意图；
[0050] 图3为随机投影二值化过程示意图；图4为构建图像的模式集直方图示意图；图5为显露模式挖掘示意图。
【具体实施方式】
[0051] 本说明书中公开的所有特征，或公开的所有方法或过程中的步骤，除了互相排斥的特征和/或步骤以外，均可以以任何方式组合。
[0052] 为详细说明本发明的技术内容、构造特征、所实现目的及效果，以下结合实施方式并配合附图详予说明。
[0053] 本专利提出了一种基于局部特征聚合描述符的车型识别方法，在车辆车型识别上取得良好的效果。整个算法实现示意图如图1所示，包括步骤：
[0054]步骤1:对车型图像数据库，根据词袋模型构建图像的直方图表示；
[0055] 具体地，对具有N类车型图像的图像数据库，构建图像的直方图表示的方法有很多，例如梯度方向直方图、局部三值模式、词袋模型等，由于词袋模型算法简单，易实现，本发明使用词袋模型构建图像的直方图，示意图如图2所示，包括以下几个步骤：
[0056] 步骤1.1:提取所有N类车型图像的SIFT特征，进行KMeans聚类，得到一个具有D个视觉单词的字典；
[0057]步骤1.2:对每个车型图像，由最近邻算法将其SIFT特征分配给离其最近的视觉单词；
[0058]步骤1.3:根据每个视觉单词周围的SIFT特征的个数，构建一个基于视觉单词的直方图，归一化后，得到图像的D维直方图表示。
[0059] 步骤2:对构建的图像直方图进行多次随机投影，然后进行二值化处理，得到图像的二值化事务项数据集；
[0060] 具体地，由于构建的图像直方图维数还是很高，所以需要进行投影降维，在实验中采取PCA方法和直接对图像直方图进行多次随机投影的方法做对比，实验结果表明PCA并没有提升实验效果，且其算法较复杂，故本发明采取对图像直方图进行多次随机投影的方法，并进行二值化处理，构成图像的二值化事务项数据集，示意图如图3所示，包括以下几个步骤：
[0061] 步骤2.1:对图像的直方图表示，随机选取P个视觉单词的直方图，

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李鸿升;胡欢;周辉;范峻铭;曹滨;
技术所有人：电子科技大学;
我是此专利的发明人

上一篇：一种基于哈希二值编码的特征袋图像检索方法
上一篇：一种路面二值图像的边缘矢量线提取算法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。