一种联合鲁棒主成分特征学习与视觉分类方法及系统的制作方法

文档序号:9766212阅读:270来源:国知局
一种联合鲁棒主成分特征学习与视觉分类方法及系统的制作方法
【技术领域】
[0001 ]本发明设及计算机视觉和机器学习技术领域,更具体地说,设及一种联合鲁棒主 成分特征学习与视觉分类方法及系统。
【背景技术】
[0002] 在众多的实际应用中,现实生活中的许多模式(例如图像、音频、视频等多媒体对 象)均可用高维的属性或特征进行描述,然而高维的数据通常含有许多无用的干扰性特征、 冗余特征、W及噪声数据等。随着计算机技术的不断发展,如何通过特征学习或低秩与稀疏 编码技术来恢复原始数据或更准确地描述数据已经发展成为计算机视觉和图像处理中非 常重要的一个研究课题。特征提取的目的在于找到一个潜在投影或映射,通过将高维的数 据变换到一个描述性更强特征空间,同时有效保持数据中的重要几何特性。
[0003] 最具代表性的数据特征提取方法是主成分分析(Principal Component Analysis,简称PCA)"PCA是基于变量协方差矩阵对信息进行处理、压缩和特征抽取的有效 方法。PCA可有效掲示数据间的线性关系,但是基于L2范式的PCA被证明对噪声或异常非常 敏感。近年来,为了克服PCA的运个缺点,一些更加鲁棒模型被提出,例如RPCAUobust Principal Component Analysis),基于Ll范式的PCA(PCA-Ll)和基于核范数的IRPCA (Inductive Robust Principal Component Analysis)等。PCA-Ll通过将PCA中的L2范数替 换成LI范数来衡量散度矩阵,因此运种方法具有旋转不变性并对噪音和异常值健壮。IRPCA 通过核范式最小化问题来恢复和表示原始数据,学习得到一个低秩的投影将给定数据映射 到基础子空间中,进而除去或纠正样本数据中可能含有的错误。和PCA-Ll和IRPCA相比, RPCA无法处理新来数据,即直推式模型。尽管上述PCA-Ll和IRPCA均能够有效提升数据特征 描述过程中鲁棒性,但是发明人发现,上述技术方案只考虑了特征提取问题,且在特征提取 的过程中只考虑了数据的低秩或稀疏特性,但是却无法保证提取得到的鲁棒特征对于分类 是最优的。
[0004] 综上所述,如何提供一种能够在进行联合低秩与稀疏主成分特征提取的同时,确 保得到的联合主成分特征对于分类是最优的的技术方案,是目前本领域技术人员亟待解决 的问题。

【发明内容】

[0005] 本发明的目的是提供一种联合鲁棒主成分特征学习与视觉分类方法及系统,为了 确保得到的联合主成分特征对于分类是最优的,本发明将鲁棒主成分特征学习、编码错误 和基于主成分特征的分类错误集成到一个统一的最小化框架,W克服现有技术中只是单纯 关注于编码低秩或稀疏主成分特征,且没有同时考虑联合分类的问题,即本申请能够在进 行联合低秩与稀疏主成分特征提取的同时,确保得到的联合主成分特征对于分类是最优 的。
[0006] -种联合鲁棒主成分特征学习与视觉分类方法,包括:
[0007] 基于训练样本集,通过将鲁棒主成分特征学习、编码错误和基于主成分特征的分 类错误集成到一个统一的最小化框架,可同时进行联合低秩与稀疏主成分特征提取和数据 纠错,且可确保得到的联合主成分特征对于分类是最优的;为了得到描述性更强的鲁棒特 征,同时考虑了数据的鲁棒与稀疏特性,同时将经过一个投影嵌入的特征进行低秩和Ll-范 数最小化,确保提取的特征满足低秩与稀疏特性;最终得到一个线性投影矩阵和一个线性 分类器;其中,所述训练样本集中包含的训练样本为已知其类别的样本;
[0008] 利用所述线性投影矩阵通过嵌入方式提取待测样本的联合低秩与稀疏主成分特 征;其中,所述待测样本为未知其类别的样本;
[0009] 将提取到的所述待测样本对应的联合低秩与稀疏主成分特征向所述线性分类器 进行映射,得到所述待测样本的软类别标签,其中包括测试样本归属各个类别的概率,根据 所述概率中最大值对应的位置,确定为所述待测样本的类别,完成分类过程。
[0010] 优选的,在基于所述待测样本集得到所述线性投影矩阵及所述线性分类器之前, 还包括:
[0011] 对所述训练样本集中的训练样本进行预处理。
[0012] 优选的,基于所述待测样本集得到所述线性投影矩阵及所述线性分类器,包括:
[0013] 按照下列公式将所述训练样本集分解为一个联合特征矩阵PX和一个稀疏错误矩 阵E,并得到所述线性投影矩阵P及所述线性分类器W:
[0014] 總声圳I* +〇||脚| +尸|矿卢叫I" +义I怎I
[0015] s.t.X = PX+E
[0016] 其中,X表示所述训练样本集,义=|>1,义2,...,而^]£化^&',]1表示每个所述训练样本 的维度,N表示所述训练样本的数量,化表示nXN的矩阵空间,MHT-xTpTw||2,i表示基于鲁 棒1 2'1范数度量的分类错误;QE [0,1]表示用于权衡低秩主成分特征编码和稀疏主成分特 征编码的最小化项;丫表示正的权衡参数,为了衡量分类错误项||HT-xTpTw| ki的贡献程 度;A>0表示依赖于错误或噪音级别的权衡参数;巧=执為Jw]e政"W,表示与所述训练 样本的类别对应的初始标签,C表示所述训练样本中包含的类别的个数,政《^表示CXN的矩 阵空间;I IeMi表示稀疏错误项,Il ? II*表示核范数,Il ? 111表示Ii范数,Il ? Iki表示I2 '1范数。
[0017] 优选的,利用所述线性投影矩阵通过嵌入方式提取待测样本的联合低秩与稀疏主 成分特征,包括:
[0018] 将所述待测样本向所述线性投影矩阵进行嵌入,得到对应的嵌入结果即为所述待 测样本的联合低秩与稀疏主成分特征。
[0019] -种联合鲁棒主成分特征学习与视觉分类系统,包括:
[0020] 训练模块,用于:基于训练样本集,通过将鲁棒主成分特征学习、编码错误和基于 主成分特征的分类错误集成到一个统一的最小化框架,可同时进行联合低秩与稀疏主成分 特征提取和数据纠错,且可确保得到的联合主成分特征对于分类是最优的;为了得到描述 性更强的鲁棒特征,同时考虑了数据的鲁棒与稀疏特性,同时将经过一个投影嵌入的特征 进行低秩和Ll-范数最小化,确保提取的特征满足低秩与稀疏特性;最终得到一个线性投影 矩阵和一个线性分类器;其中,所述训练样本集中包含的训练样本为已知其类别的样本;
[0021 ]投影模块,用于利用所述线性投影矩阵通过嵌入方式提取待测样本的联合低秩与 稀疏主成分特征;其中,所述待测样本为未知其类别的样本;
[0022] 分类模块,用于将提取到的所述待测样本对应的联合低秩与稀疏主成分特征向所 述线性分类器进行映射,得到所述待测样本的软类别标签,其中包括测试样本归属各个类 别的概率,根据所述概率中最大值对应的位置,确定为所述待测样本的类别,完成分类过 程。
[0023] 优选的,还包括:
[0024] 训练预处理模块,用于对所述训练样本集中的训练样本进行预处理。
[0025] 优选的,训练模块包括:
[0026] 训练单元,用于按照下列公式将所述训练样本集分解为一个联合特征矩阵PX和一 个稀疏错误矩阵E:
[0027] |^?(1-?)||尸义||*+?|Rr| +/Il巧7' +乂I 应I [002引 s.t.X = PX+E
[0029] 其中,X表示所述训练样本集,X = [.Yi,jc2,...,Xv] E化"<&',n表示每个所述训练样本 的维度,N表示所述训练样本的数量,ITXW表示n X N的矩阵空间,M HT-XTpTw M 2,1表示基于鲁 棒12'1范数度量的分类错误;QE [0,1]表示用于权衡低秩主成分特征编码和稀疏主成分特 征编码的最小化项;丫表示正的权衡参数,为了衡量分类错误项||HT-xTpTw| ki的贡献程 度;A>0表示依赖于错误或噪音级别的权衡参数;巧=化,/;2,...,4^,]€股"'\',表示与所述训练 样本的类别对应的初始标签,C表示所述训练样本中包含的类别的个数,吸aw表示CXN的矩 阵空间;I IeMi表示稀疏错误项,Il ? II*表示核范数,Il ? 111表示Ii范数,Il ? Iki表示I2 '1范数。
[0030] 优选的,投影模块包括:
[0031] 投影单元,用于将所述待测样本向所述线性投影矩阵进行嵌入,得到对应的嵌入 结果即为所述待测样本的联合低秩与稀疏主成分特征。
[0032] 经由本发明公开的上述技术方案可知,与现有技术相比,本发明公开了一种联合 鲁棒主成分特征学习与视觉分类的新方案,通过对训练样本运用该方案进行联合训练
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1