基于改进的mfa和迁移学习的小样本集的物体分类方法_2

文档序号:9708803阅读:来源:国知局
【附图说明】
[0032] 图1为源域与目标域的差异图,(a)为源域,(b)为目标域;
[0033]图2为本发明的整体流程示意图。
【具体实施方式】
[0034]下面结合具体实施例,对本发明的技术方案做进一步的详细说明。
[0035]以下实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具 体的操作过程,但本发明的保护范围不限于下述的实施例。
[0036] 实施例
[0037] 本实施例对某数据库中的amazon,webcam两个数据域进行处理。这两个域中均有 31个物体类别。amazon,webcam分别作为源域和目标域。在本发明的实施例中,如图2所示, 该方法包括以下步骤:
[0038]步骤1:提取图像的底层特征:对源域和目标域中的每一幅图片,分别进行灰度化, 并提取其SURF特征作为图像的纹理特征,最后被量化成800维的特征;
[0039]步骤2:改进传统的MFA算法,计算特征变换矩阵Μ:对传统的MFA方法进行改进,基 于图嵌入的框架利用内积作为距离的度量,利用源域中的标记数据构造出表示类内紧凑性 的本征图和表示类间区分性的惩罚图,并计算出特征变换矩阵Μ,将源域和目标域中样本的 特征映射到新的特征空间中。该步骤具体包括以下子步骤:
[0040] 步骤2.1:本征图的类内紧凑性的计算方法如下:
[0041] 在本征图Gc中,类内紧凑性Sc是由源域中每一个样本与其近邻且同类的样本点的 距离之和描述。类内紧凑性S c表示为:
[0042]
[0043] 其中Μ代表特征变换矩阵,萬& (?表示ki个与样本Xi同类并与Xi近邻的样本点的索 引集;
[0044] 步骤2.2:惩罚图的类间区分性的计算方法如下:
[0045] 在惩罚图心中,类间分离性心是由源域中边界奇异点与其近邻且异类的边界点的 距离之和描述。类间分离性SP表示为:
[0046]
[0047] 其中巧2(5)表示{(/',7)#',./>_气}中1^2个最邻近的边界样本对集,气为(^类别 的边界样本点的索引集;
[0048] 步骤2.3:特征变换矩阵Μ利用图嵌入结构,通过最小化类内紧凑性和类间分离性 计算得到,即:
[0049]
[0050] 步骤3:自适应筛选迀移学习过程中的训练样本对:分别用样本间的内积作为度量 计算源域每个类别中各个样本间的距离,剔除源域中各类别的边缘奇异点,其余点作为候 选点,从候选点中选取出20个源域样本点构成集合Τ(Α),并和目标域中的3个标记样本点集 Τ(Β)共同组成训练样本对;
[0051] 步骤4:域间迀移学习出特征转换矩阵W:通过特征转换矩阵W将目标域映射到源 域,正则化W,记为γ (Μ),该迀移学习的优化问题表示为:
[0052]
[0053] s.t. fi(XTffY)>0,l<i<c.
[0054] 其中fi(XTWY)为约束函数,c为类别数,本实施例中,c = 31。设0^02, . . .σρ是W的奇 异值,则
;是一个标量函数。假设(A,/,:4)是源域中的标记样本,其中 //是样本私的标签;(>,,.,/;)是目标域中的标记样本,其中//是样本η的标签。1为相似性上 限,U为相似性下限,该问题的约束条件表示为:
[0055]
[0056] 该迀移学习问题的求解表示为:
[0057]
[0058] s.t.Xi,eT(A),yj,eT(B)
[0059] 其中Xi' =Mxi,yj' =Myj,在该实施例中,λ=1〇3。并将算法引入特征的核化空间,算 法中出现特征向量内积的地方用核化函数表示,其中核函数利用的是高斯RBF核函数,求解 得到W;
[0060] 步骤5:在源域上训练分类器,并计算目标域中的物体分类:将目标域中的样本通 过步骤4中学习的特征转换矩阵W映射到源域,并输入到分类器中计算目标域上即小样本集 上的物体类别。
【主权项】
1. 一种基于改进的MFA和迀移学习的小样本集的物体分类方法,其特征在于,包括以下 步骤: 步骤1:提取图像的底层特征:对源域和目标域中的每一幅图片,分别进行灰度化,提取 图像的纹理特征,并进行量化,其中源域中包含大量的标记样本,目标域中仅少量的样本是 有标记的; 步骤2:计算特征变换矩阵M:基于图嵌入的框架利用内积作为距离的度量,利用源域中 的标记数据构造出表示类内紧凑性的本征图和表示类间区分性的惩罚图,并计算出特征变 换矩阵M,将源域和目标域中样本的特征映射到新的特征空间中; 步骤3:自适应筛选迀移学习过程中的训练样本对:剔除源域中各类别的边界奇异点, 其余点作为候选点,从候选点中选取出kA个源域样本点构成集合T(A),并和目标域中的kB个 标记样本点集T(B)共同组成训练样本对; 步骤4:域间迀移学习出特征转换矩阵W:通过特征转换矩阵W将目标域映射到源域,正 则化W,记为γ (M),该迀移学习的优化问题表示为: s.t.fi(XTWY) > 0,1 < i < c. 其中f i ( X T W Y )为约束函数,c为类别数。设〇 i〇 2,〃 〇 P是W的奇异值,则 是一个标量函数。假设是源域中的标记样本,其中f是样 本^的标签;是目标域中的标记样本,其中$是样本η的标签。1为相似性上限,u为 相似性下限,该问题的约束条件表示为: ,/:(Λ^Γ;) = Λ^ν;-Λ i:=r: f^Wy^u-x^yj, /X 则该迀移学习问题的求解表示为: s.t.Xi'ET(A),yj'eT(B) 其中Xi' =Mxi,yj' =Myj,A为松弛系数。并将算法引入特征的核化空间,算法中出现特征 向量内积的地方用核化函数表示,求解得到W; 步骤5:在源域上训练分类器,并计算目标域中的物体分类。2. 根据权利要求1所述的一种基于改进的MFA和迀移学习的小样本集的物体分类方法, 其特征在于:所述步骤2具体包括以下子步骤: 步骤2.1:本征图的类内紧凑性的计算方法如下: 在本征图Gc中,类内紧凑性Sc是由源域中的每一个样本与其近邻且同类的样本点的距 离之和描述; 步骤2.2:惩罚图的类间区分性的计算方法如下: 在惩罚图心中,类间分离性SP是由源域中边界奇异点与其近邻且异类的边界点的距离 之和描述; 步骤2.3:特征变换矩阵Μ利用图嵌入结构,通过最小化类内紧凑性和类间分离性计算 S 得到,BP: A/=argwmuif-。
【专利摘要】本发明公开了一种基于改进的MFA(Marginal?Fisher?Analysis)和迁移学习的小样本集(目标域)分类算法。首先,利用一个具有大量标记样本的同构数据集(源域)和内积度量距离的边际Fisher准则将源域和目标域样本的特征映射到低维空间;之后,剔除源域边界奇异点,选择源域密集区域样本点并与目标域中少量的标记样本点组成迁移学习训练样本对;然后在核化空间上,学习目标域到源域的非线性特征转换矩阵;最后利用源域的大量标记样本训练分类器,通过非线性特征转换矩阵将目标域样本映射到源域中,并输入到训练好的分类器中得到小样本集上的物体分类结果。
【IPC分类】G06K9/62
【公开号】CN105469111
【申请号】CN201510801292
【发明人】于慧敏, 舒醒, 郑伟伟
【申请人】浙江大学
【公开日】2016年4月6日
【申请日】2015年11月19日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1