基于度量学习和多示例支持向量机的图像分类方法与流程

文档序号:16538944发布日期:2019-01-08 20:09阅读:218来源:国知局
基于度量学习和多示例支持向量机的图像分类方法与流程

本发明涉及图像分类技术领域,更具体地,涉及一种基于度量学习和多示例支持向量机的图像分类方法。



背景技术:

随着计算机技术的快速发展以及移动设备的普及,导致互联网上面存在着海量图像,并且每天新上传至互联网上的图像的数量呈指数上升;同时,移动设备的更新换代,使得图像所包含的场景也越来越丰富。由于互联网上面的图像大部分是无标记的,导致这些图片至今还没有得到互联网公司的充分利用。在图像的数量还很少的情况下,让专家进行对这些图像进行人工标注的方式还是可行的,但是互联网上面的图像数量是海量的,并且每天还以指数增加,此时使用人工标注的形式对图像进行分类是不可取的。因此,如何让计算机识别出未被标记的图像,并且准确分类到对应的类别中以更好地服务互联网用户,是大部分互联网公司都在研究的一个问题。

一方面,由于移动设备的普及与发展,上传到互联网的图像的场景已经是非常丰富的,即图像在拍摄过程中会包含各式的背景。例如,在拍摄人物照时,拍摄地点的不同,会使得图像包含的背景不一样。当在大街上拍摄人物照时,将会把街上的人群也拍进这个图像里面;而在动物园拍摄人物照时,将会把许多的动物和植物拍进去。现有的大部分图像分类方法属于单示例分类方法,即是将整个图像当成单一向量(示例)。然而由于互联网图像含有多个场景,将整个图像转换成单一示例,将会无法描述出图像场景之间的关系。此时,采用单示例分类方法进行图像分类,可能会导致误分类。相对于单示例学习,多示例学习能够根据图像场景,把图像转换为多示例的形式,并且保存了图像场景的相关性。

另一方面,用于训练分类器的图像可能是相同的,即同一组图像集,可能用作不同的图像分类任务。举个例子,分类任务可以是根据目标身份进行一组人脸图像的分类,也可以是按照人脸姿势对这组人脸图像的进行分类。当根据目标身份进行一组人脸图像的分类时,人物发色、脸型等关键特征应比图像其他的特征更加重要;而当分类任务是基于人脸姿势时,此时图像之间的人脸姿势相似性应要比图像其他的特征含有更高权重。在进行图像之间的距离和相似性处理时,大部分传统的图像分类方法都是基于欧式距离公式。然而,欧式距离公式无法突出图像集的特征信息,在计算图像之间的相似性和距离时,图像特征的权重都是相同的。所以,采用欧式距离公式进行图像处理时,同一组图像集无法同时用于多个不同分类任务的训练。而度量学习则能够根据类别的信息,使相同类别图像之间的距离缩短,不同类别图像之间的距离拉大,从而把图像特征的相关信息保存下来。



技术实现要素:

本发明为克服上述现有技术所述的至少一种缺陷,提供一种基于度量学习和多示例支持向量机的图像分类方法,根据分类信息,设计一个合适的度量距离公式,基于这个优化的度量距离公式,将图像数据转换为多示例形式,设计一个多示例支持向量机模型,构建了一个基于度量学习的多示例支持向量机模型,极大的提高了分类器在进行图像分类时的精度。

为解决上述技术问题,本发明采用的技术方案是:一种基于度量学习和多示例支持向量机的图像分类方法,包括以下步骤:

s1.获取图像,以人工的形式,对图像进行人工标记,并且将标记好的图像转换为多示例数据。

s2.对用于图像分类的多示例包的示例标签进行初始化,赋予每个类别的包中示例一个合适的标签。

s3.构建一个基于示例与类别的相似性的度量学习问题,求解该优化问题,得到优化后的度量学习矩阵,所述的度量学习问题为:

yijk[(bij-ck)tm(bij-ck)-b]≥1-ξij,

ξij≥0,m>=0,b≥1

式中,||·||f表示为矩阵的f范式;正则项||m||2f用来保证学习出来的度量学习矩阵的元素不会过大;|bi|为包bi的示例个数;ξij是一个非负误差项,c为可调参数,用来控制误差项的大小;bij代表了第i个包bi的第j个示例,ck为第k个类别中所有示例的中心点;如果包中示例bij属于第k类,则yijk=-1,否则,yijk=1;m>=0用来强制约束度量学习矩阵是正半定矩阵,保证计算出来的图像之间的距离不会为负数;

在本发明中,很明显,该度量学习问题是凸优化问题,可以得到全局最优的度量学习矩阵m。通过求解该优化问题,保证了包中示例离所属类别的中心的距离小于等于b-1,离其他类别的中心的距离大于等于b+1,从而确保了相同标签的图像之间更近,不同标签的图像之间更远。

s4.基于s3步骤中优化出的度量学习矩阵m,构建一个多示例支持向量机问题,所述的多示例支持向量机问题为:

hij(w·m·bij-b)≥1-ηij,

ηij≥0

式中,hij为包中示例bij所属的标签,如果为正示例,则hij为+1,如果为负示例,则hij为-1;ηij为松弛变量,可调参数d用来控制松弛变量的大小;该优化问题保证了在多示例学习环境下,求得一组间距最大的超平面,能够很好的把不同类别的图像分割开来。

s5.求解s4步骤的基于度量学习的多示例支持向量机问题,得到训练好的图像分类器,并对训练包的示例进行重新标记。

s6.判断训练出来的图像分类模型的精度是否达到预期精度或者是否已经达到最大训练迭代次数,不满足则跳到s3步骤,重新进行分类器的训练;如果满足,则输出优化后的基于度量学习的多示例图像分类器f(bs)。

进一步地,所述的s1步骤具体包括:

s11.采用经典的图像处理方法,如blobworld系统,将图像按照场景进行区域切割;

s12.对切割好的图像区域进行特征提取,将其转换为计算机可以处理的示例向量;

s13.由于图像含有多个场景,则切割为多个图像区域,产生多个示例;此时每张图像称为一个包,进行特征提取的图像区域称为包中示例。

进一步地,所述的s2步骤,在初始化过程中,对于正包,将正包的所有示例当成正示例进行处理,即将包中所有示例的标签设为+1;对于负包,将负包的所有示例当成负示例进行处理,即将包中所有示例的标签设为-1。在多示例学习环境中,包的标签是已知的,而包中示例的标签是未知的。因此,在初始化过程中,对于正包,将正包的所有示例当成正示例进行处理,即将包中所有示例的标签设为+1;对于负包,将负包的所有示例当成负示例进行处理,即将包中所有示例的标签设为-1。

进一步地,所述的s4步骤中,在度量学习的训练环境下,包bp中的示例bpi与包bn中的示例bnj的相似性公式为bpi·m·bnj;所述的多示例支持向量机问题是基于该相似性公式构建的。求解s3步骤中的最优化问题,可以得到训练出来的度量学习矩阵m,此时图像之间的距离和相似性会与图像类别挂钩;在度量学习的训练环境下,包bp中的示例bpi与包bn中的示例bnj的相似性公式为bpi·m·bnj,基于该相似性公式,本专利构建了一个多示例支持向量机问题。

进一步地,所述的s5步骤包括:

s51.通过引入非负拉格朗日因子将多示例支持向量机问题转换为对偶形式的优化问题,该对偶形式的优化问题如下:

s52.采用经典的二次规划算法对所述的对偶形式的优化问题进行求解,通过求解该二次规划问题,可以计算出非负拉格朗日因子此时最优化的变量为:

则用于图像分类的多示例分类模型为:

其中,bs为未知标签的图像多示例包。

在本发明中,利用该分类模型,可以重新标记所有训练包的所有示例。

与现有技术相比,有益效果是:本发明提供的一种基于度量学习和多示例支持向量机的图像分类方法,采用度量学习框架,根据类别的信息,设计一个合适的度量距离公式,基于这个优化的度量距离公式,将图像数据转换为多示例形式,设计了一个多示例支持向量机模型,使相同类别图像之间的距离缩短,不同类别图像之间的距离拉大,从而把图像特征的相关信息保存下来,并且将图像多示例化,保留了图像中的场景相关性,从而构建了一个基于度量学习的多示例支持向量机模型,极大的提高了分类器在进行图像分类时的精度。

附图说明

图1是本发明方法流程图。

具体实施方式

附图仅用于示例性说明,不能理解为对本发明的限制;为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。附图中描述位置关系仅用于示例性说明,不能理解为对本发明的限制。

如图1所示,一种基于度量学习和多示例支持向量机的图像分类方法,包括以下步骤:

步骤1.获取图像,以人工的形式,对图像进行人工标记,并且将标记好的图像转换为多示例数据。具体包括:

s11.采用经典的图像处理方法,如blobworld系统,将图像按照场景进行区域切割;

s12.对切割好的图像区域进行特征提取,将其转换为计算机可以处理的示例向量;

s13.由于图像含有多个场景,则切割为多个图像区域,产生多个示例;此时每张图像称为一个包,进行特征提取的图像区域称为包中示例。

步骤2.对用于图像分类的多示例包的示例标签进行初始化,赋予每个类别的包中示例一个合适的标签。在初始化过程中,对于正包,将正包的所有示例当成正示例进行处理,即将包中所有示例的标签设为+1;对于负包,将负包的所有示例当成负示例进行处理,即将包中所有示例的标签设为-1。

步骤3.构建一个基于示例与类别的相似性的度量学习问题,求解该优化问题,得到优化后的度量学习矩阵,所述的度量学习问题为:

yijk[(bij-ck)tm(bij-ck)-b]≥1-ξij,

ξij≥0,m>=0,b≥1

式中,||·||f表示为矩阵的f范式;正则项||m||2f用来保证学习出来的度量学习矩阵的元素不会过大;|bi|为包bi的示例个数;ξij是一个非负误差项,c为可调参数,用来控制误差项的大小;bij代表了第i个包bi的第j个示例,ck为第k个类别中所有示例的中心点;如果包中示例bij属于第k类,则yijk=-1,否则,yijk=1;m>=0用来强制约束度量学习矩阵是正半定矩阵,保证计算出来的图像之间的距离不会为负数;

在本发明中,很明显,该度量学习问题是凸优化问题,可以得到全局最优的度量学习矩阵m。通过求解该优化问题,保证了包中示例离所属类别的中心的距离小于等于b-1,离其他类别的中心的距离大于等于b+1,从而确保了相同标签的图像之间更近,不同标签的图像之间更远。

步骤4.基于步骤3中优化出的度量学习矩阵m,求解步骤3中的最优化问题,可以得到训练出来的度量学习矩阵m,此时图像之间的距离和相似性会与图像类别挂钩;在度量学习的训练环境下,包bp中的示例bpi与包bn中的示例bnj的相似性公式为bpi·m·bnj,基于该相似性公式,本专利构建了一个多示例支持向量机问题,构建一个多示例支持向量机问题,所述的多示例支持向量机问题为:

hij(w·m·bij-b)≥1-ηij,

ηij≥0

式中,hij为包中示例bij所属的标签,如果为正示例,则hij为+1,如果为负示例,则hij为-1;ηij为松弛变量,可调参数d用来控制松弛变量的大小;该优化问题保证了在多示例学习环境下,求得一组间距最大的超平面,能够很好的把不同类别的图像分割开来。

步骤5.求解步骤4的基于度量学习的多示例支持向量机问题,得到训练好的图像分类器,并对训练包的示例进行重新标记。具体包括:

s51.通过引入非负拉格朗日因子将多示例支持向量机问题转换为对偶形式的优化问题,该对偶形式的优化问题如下:

s52.采用经典的二次规划算法对所述的对偶形式的优化问题进行求解,通过求解该二次规划问题,可以计算出非负拉格朗日因子此时最优化的变量为:

则用于图像分类的多示例分类模型为:

其中,bs为未知标签的图像多示例包。

在本发明中,利用该分类模型,可以重新标记所有训练包的所有示例。

步骤6.判断训练出来的图像分类模型的精度是否达到预期精度或者是否已经达到最大训练迭代次数,不满足则跳到s3步骤,重新进行分类器的训练;如果满足,则输出优化后的基于度量学习的多示例图像分类器f(bs)。

显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1