基于改进的mfa和迁移学习的小样本集的物体分类方法

文档序号:9708803阅读:362来源:国知局
基于改进的mfa和迁移学习的小样本集的物体分类方法
【技术领域】
[0001] 本发明涉及一种计算机视觉技术领域的小样本集的物体分类方法,具体为一种基 于改进的MFA和迀移学习的小样本集的物体分类方法。
【背景技术】
[0002] 近年来,随着计算机技术和模式识别技术的迅速发展,物体分类技术是当前国内 外计算机视觉领域一个活跃的研究方向,在越来越多的领域得到了应用,例如行人检测、智 能交通(Intelligent Transportation systems)、医疗图像分类等。基于现实场景,如何设 计一种对物体图像进行准确而鲁棒性好的分类方法,是物体分类技术走向实际应用的关键 核心问题。
[0003] 传统的物体分类方法,大都是基于大量的标记样本作为训练样本,最终训练分类 器的各个参数。然而,在实际场景的应用中,获取大量标记样本是一个非常棘手的问题。大 量标记样本的获取是一个昂贵、极其耗费人力和时间的过程,同时人工标记过程中很可能 会出现一些人为标记错误的情况。在少量样本集上,由于缺乏大量的标记训练数据,按照传 统的图像分类方法得到的分类器并不能得到理想的分类准确率。那么我们可以利用现有的 标记样本的大样本集(源域)来提高小样本集(目标域)的分类准确率。但是,源域训练得到 的分类器直接应用在目标域中并不能得到理想的效果,这是因为不同域中的特征分布是有 差异的。导致域间差异的因素有很多,比如相机参数、光线、视角、分辨率、背景和姿态等等, 如图1所示。图1中源域(上)与目标域(下)是存在差异的,与源域相比,目标域中的背景更复 杂,分辨率更低,视角更多样。
[0004] -个重要的问题是我们如何将源域作为目标域的先验知识,利用域间的相关性, 通过迀移学习的方法来提高目标域的分类准确率。针对小样本集的物体分类问题,Saenko 等人于2010年发表在《European Conference on Computer Vision》(欧洲计算机视觉国际 会议)的一篇文章 "Adapting Visual Category Models to New Domains" 中就该问题进行 的探讨,提出了基于域适应的算法计算出源域和目标域间的特征映射矩阵提高目标域的分 类准确率。Long 等人于 2015 年在《IEEE Transactions on Knowledge & Data Engineering〉〉上的 "Domain Invariant Transfer Kernel Learning"--文中学习了--种會κ 够直接使源域和目标域间的特征分布相匹配的域间不变核,从而达到域间迀移学习提高小 样本集的物体分类准确率的目的。
[0005] 虽然借助于源域中的标记样本来优化目标域的分类模型提高分类准确率,然而现 有的方法普遍存在如下两个问题:首先,现有算法缺乏考虑如果源域内不同类在特征空间 中相互交错,不具有很好的类别差异性,那么目标域中的类别映射到源域也不能保证相互 之间是可区分的。其次,在现有算法的特征转换训练过程中,源域中的训练样本是随机选取 并与目标域中的标记样本组成训练对,如果该过程选取的点是在源域对应类别的边界上, 那么目标域样本也会被映射到源域的边界区域,这样势必会影响类别间的分类。
[0006] 因此,当目标域仅有少量标记样本时,为了更充分地利用大量已有的同构标记数 据、学习高效的域间迀移学习进而提高小样本集的物体分类的准确率,本发明提出了基于 改进的MFA和迀移学习的小样本集的物体分类方法,从而提高小样本集上的物体分类的鲁 棒性和准确性。

【发明内容】

[0007] 本发明为了解决现有技术中的问题,提出一种基于改进的MFA和迀移学习的小样 本集的物体分类方法,利用改进后的MFA算法将特征映射到新的特征空间上,学习大样本集 和小样本集间非线性的特征转换将小样本集上的样本映射到大样本集中,从而利用大样本 集上训练得到的分类器提升小样本集物体分类的鲁棒性和准确性。
[0008] 本发明采用以下技术方案:一种基于改进的MFA和迀移学习的小样本集的物体分 类方法,包括以下步骤:
[0009] 步骤1:提取图像的底层特征:对源域和目标域中的每一幅图片,分别进行灰度化, 提取图像的纹理特征,并进行量化,其中源域中包含大量的标记样本,目标域中仅少量的样 本是有标记的;
[0010] 步骤2:计算特征变换矩阵M:基于图嵌入的框架利用内积作为距离的度量,利用源 域中的标记数据构造出表示类内紧凑性的本征图和表示类间区分性的惩罚图,并计算出特 征变换矩阵M,将源域和目标域中样本的特征映射到新的特征空间中;
[0011] 步骤3:自适应筛选迀移学习过程中的训练样本对:剔除源域中各类别的边界奇异 点,其余点作为候选点,从候选点中选取出kA个源域样本点构成集合T(A),并和目标域中的 k B个标记样本点集T(B)共同组成训练样本对;
[0012] 步骤4:域间迀移学习出特征转换矩阵W:通过特征转换矩阵W将目标域映射到源 域,正则化W,记为γ (M),该迀移学习的优化问题表示为:
[0013] min if):
[0014] s.t. fi(XTWY)>0,l<i<c.
[0015] 其中fi(XTWY)为约束函数,c为类别数。设σι,σ2, . . .σρ是w的奇异值,则
γ」是一个标量函数。假设(>,,/,〇是源域中的标记样本,其中//是样 本&的标签;(A,/;)是目标域中的标记样本,其中$是样本h的标签。1为相似性上限,u为 相似性下限,该问题的约束条件表示为:
[0016]
[0017]该迀移学习问题的求解表示为:
[0018]
[0019] s.t.Xi,eT(A),yj,eT(B)
[0020] 其中Xi' =Mxi,yj' =Myj,A为松弛系数。并将算法引入特征的核化空间,算法中出 现特征向量内积的地方用核化函数表示,求解得到W;
[0021] 步骤5:在源域上训练分类器,并计算目标域中的物体分类。
[0022] 进一步地,所述步骤2具体包括以下子步骤:
[0023] 步骤2.1:本征图的类内紧凑性的计算方法如下:
[0024] 在本征图Gc中,类内紧凑性Sc是由源域中的每一个样本与其近邻且同类的样本点 的距离之和描述;
[0025] 步骤2.2:惩罚图的类间区分性的计算方法如下:
[0026] 在惩罚图心中,类间分离性心是由源域中边界奇异点与其近邻且异类的边界点的 距离之和描述;
[0027] 步骤2.3:特征变换矩阵Μ利用图嵌入结构,通过最小化类内紧凑性和类间分离性 计算得到,ΒΡ
[0028] 本发明采用以上技术方案与现有技术相比,具有以下技术效果:
[0029] 1)本发明考虑到样本的类别标记获取难度大的问题,将已有标记的大样本集的样 本集作为先验知识,通过与小样本集中少量标记样本间的迀移学习,实现提升小样本集上 物体分类的准确性和鲁棒性;
[0030] 2)本发明改进了传统的MFA算法,利用内积作为距离度量,将原始特征映射到了新 的特征空间中,充分提高源域的类内紧凑性和类间区分性,从而保证目标域映射到源域后 尽可能地实现类内更紧凑,类间更分离的效果;
[0031] 3)与现有技术相比,本发明更考虑到了迀移学习过程中训练样本对的筛选过程, 通过自适应的训练样本对的筛选算法,避免边界奇异点对于特征转换矩阵学习结果的影 响,使得迀移学习的效果更强。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1