一种应用于行人再识别的多核支持向量机多示例学习算法

文档序号：6540280阅读：330来源：国知局

一种应用于行人再识别的多核支持向量机多示例学习算法
【专利摘要】本发明公开了一种应用于行人再识别的多核支持向量机多示例学习算法，包括多特征描述和多核SVM模型多示例学习算法两个主要步骤。本发明通过提取了同一行人在A、B摄像机机下二张图片的HSV颜色特征和SIFT局部特征并构建词袋，用二种特征的差异矢量代表两摄像机下特征的转移关系作为二个示例样本,并封装为一个包；其次对多核支持向量机模型进行了优化，采用高斯核和多项式核线性融合对包进行训练，并用多示例学习获得最优的参数，具有较高的识别率。
【专利说明】—种应用于行人再识别的多核支持向量机多示例学习算法
【【技术领域】】
[0001]本发明涉及行人再识别算法的【技术领域】，特别是应用于行人再识别的多核支持向量机多示例学习算法的【技术领域】。
【【背景技术】】[0002]随着平安城市战略的启动，越来越多的监控摄像机被安装在了交通要塞，这些交通要塞距离较远，采用传统的单摄像机来进行跟踪难以满足需要。行人再识别是指在非重叠视域多摄像机监控下进行的行人匹配，即如何确认不同位置的摄像机在不同时刻发现的目标是否为同一人。由于摄像机的成像受参数、光照条件、角度、背景等因素的影响，导致不同摄像机拍摄的同一目标差异较大。
[0003]再识别方法可以分为两种:描述法和测度学习法。描述法先对目标进行特征提取，再求特征向量之间的距离(主要有欧式、马氏、巴氏等)来表示两者之间的相似度。Gheissari等人为了克服行人姿态的变化，把行人划分为三角状以提高相似度，但该方法只对视角相似的行人识别率较高。为克服直接采用颜色直方图进行匹配的不足，Wang等人将行人分割成区域块，提取不同区域的颜色特征来进行识别^arenzena等人提取行人的多种特征来进行识别；Cheng等将行人分割成头、胸、腰、腿四个部位，并提取每个部位的颜色特征来进行识别。Gray等人提取行人的颜色和纹理特征，采用adaboost方法选择相关性，该方法速度较快，但识别率不高。测度学习法采用对提取的行人特征进行训练学习，在另外一个测度空间对特征进行比较。为提高SVM方法的识别率，Prosser等人提出了合成SVM排名算法，先对训练样本进行分类学习，得到N个弱分类器，再用boosting算法进行加权融合获得一个强分类器，该算法效果不错，但复杂度较高。Tamar等人对训练样本分类进行了改进，将同类样本和异类样本分别串接，再用SVM实现，虽提高了运算速度，但识别率和稳定性都不高。
[0004]描述法依赖于稳定的特征，且单一特征直接匹配识别率较低，只有多个特征进行融合才能保证识别效果。而目前测度学习法主要针对单一特征来进行学习和匹配，而不同摄像机拍到的同一人物外观可能存在巨大的变化，如VIPeR数据集中同一行人在A摄像机中是正面图像，B摄像机中可能是后背或侧面，差异较大，显然，单一特征来描述一个行人的正面、侧面、后面图像存在较大的局限。本文在测度学习法的基础上，结合描述性方法的多特征，将一个行人的单个特征作为一个示例，多个特征构成一个包，并采用多个核函数来对该包进行训练学习的算法，即多核多示例的行人再识别算法。该算法与多核SVM方法的最大区别在于前者中包有标签而示例没有标签，后者中所有样本都有标签。包标签为正的含义是A、B摄像机下的行人为同一个人，负表示不是同一个人。示例标签为正的含义是用该特征能很好表达A、B摄像机下行人的差异；负表示该特征不能表达差异。
【
【发明内容】
】
[0005]本发明的目的就是解决现有技术中的问题，提出一种应用于行人再识别的多核支持向量机多示例学习算法，将同一个人的多个特征描述构建差异矢量，作为示例样本封装成包，采用多核支持向量机对包进行训练，多示例算法学习获得最优解，本算法与单特征算法及经典的再识别算法相比，准确度有了较大的提高。
[0006]为实现上述目的，本发明提出了一种应用于行人再识别的多核支持向量机多示例学习算法，包括以下步骤:
[0007]a)多特征描述:
[0008]al)颜色特征:颜色特征按照如下方法进行提取，先把行人图像划分为五个大小相等的区域，每个区域提取H、S、V三个分量的直方图，间隔取10，将提取的区域特征串联，最终构成特征为150维的列向量的全局特征，区域划分的目的是保留图像的局部信息，防止不同区域中的相同颜色产生的误匹配；
[0009]a2) SIFT特征提取及其词袋的构建:按照4X4模板进行提取SIFT特征，由于图像的SIFT特征只是局部特征描述，在采用SVM进行训练和学习前需要采用词袋模型对SIFT特征进行规则化，规则化的过程就是将数量不定的无序特征转变成有序的固定维数的向量;
[0010]a3)示例及包的构建:用<,,描述摄像机A所拍摄的目标m的第i幅图片特征，
描述摄像机B所拍摄的目标η的第j幅图片特征，.<L，4/s = r+1.—为差异矢
量，用以描述A、B摄像机之间的特征转移关系，将同一行人的每个差异矢量作为一个示例，多种特征差异矢量构成的示例封装成一个样本包Oi = {(si,s2),y},y e {1，-1}，用以描述多种特征在不同摄像机间的转移关系，本算法中局部特征和全局特征属于不同的高维空间平面，没有交集，可以把包看成两个示例向量的切面，由同一个行人构成的包其标签号为正包，否则为负包；
[0011]b)多核SVM模型多示例学习算法:
[0012]bl)多示例问题描述:给定样本集C = {(O1, Y1)，(02，Y2)，...，(0n，Yn)}，含义是当Yj = I时，(0j, Yj)表示正包Oi中至少存在一个示例是正示例；当Yj
=-1时，(O」, Y」)的含义是负包q = h}中所有不例sji是均是负不例；对样本
包O I =|51,，….，sKl，…，}只有包中所有的样本都是负时，才能被认定为负
包,否则为正,其决策函数为
【权利要求】
1.一种应用于行人再识别的多核支持向量机多示例学习算法，包括以下步骤: a)多特征描述: al)颜色特征:颜色特征按照如下方法进行提取，先把行人图像划分为五个大小相等的区域，每个区域提取H、S、V三个分量的直方图，间隔取10，将提取的区域特征串联，最终构成特征为150维的列向量的全局特征，区域划分的目的是保留图像的局部信息，防止不同区域中的相同颜色产生的误匹配； a2) SIFT特征提取及其词袋的构建:按照4X4模板进行提取SIFT特征，由于图像的SIFT特征只是局部特征描述，在采用SVM进行训练和学习前需要采用词袋模型对SIFT特征进行规则化，规则化的过程就是将数量不定的无序特征转变成有序的固定维数的向量； a3)示例及包的构建:用描述摄像机A所拍摄的目标m的第i幅图片特征，x:j描述摄像机B所拍摄的目标η的第j幅图片特征
2.如权利要求1所述的一种应用于行人再识别的多核支持向量机多示例学习算法，其特征在于:所述步骤a2)中的词袋是指将一组经过打包和封装数据，对图像建立词袋模型进行描述，主要是将图像中特征点进行聚类，形成多个词袋，并建立索引，以便更好地来描述图像，在本算法中，采用K-means算法对SIFT特征进行聚类，生成若干个类，并用编码的方法对每个特征点在所属类别中建立索，这样每个聚类被称为视觉关键字，用以描述图像中局部相似特征点的集合，所有的聚类称为视觉关键字词表，形成关键字词表后，图像就可以用视觉关键字词表的直方图表示出来，从而固定了维数。
【文档编号】G06K9/46GK103839084SQ201410091319
【公开日】2014年6月4日申请日期:2014年3月12日优先权日:2014年3月12日
【发明者】蒋云良, 刘红海, 侯向华, 黄旭申请人:湖州师范学院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：蒋云良;刘红海;侯向华;黄旭
技术所有人：湖州师范学院
我是此专利的发明人

上一篇：基于Householder变换的无约束结构静力分析方法
上一篇：一种电子即开型彩票信誉保障方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。