小样本线性鉴别特征的快速实时抽取方法

文档序号:6530527阅读:285来源:国知局
专利名称:小样本线性鉴别特征的快速实时抽取方法
技术领域
发明涉及小样本线性鉴别特征的快速实时抽取和识别领域,具体是小样本条件 下的高维数据的线性鉴别特征快速实时抽取和识别方法。本发明可用于机器学习和模式 识别领域,可用于小样本条件下的各种高维数据的特征快速实时抽取和识别。
背景技术
特征抽取技术是模式识别中的一个重要内容,通常可分为监督和非监督特征抽 取两大类。非监督的特征抽取方法可分为主分量分析和独立分量分析两类,由于没有 用到训练样本所属的类别信息,因此难以获得对分类识别有用的鉴别特征。监督的鉴别 特征抽取利用了每个样本所属的类别这一重要信息,因此可以得到有利于分类的鉴别特 征。监督的鉴别特征抽取常用的是基于某个准则的特征抽取方法,此类方法通过最 优化一个准则函数得到一个变换阵,将原始高维样本特征降维至低维子空间,使在低维 子空间中的特征更紧凑,有更好的可分性,因此这类方法也称之为子空间方法。识别阶段针对所抽取到的特征设计适合的分类方法,将样本特征空间分为各个 区域,然后根据待识别样本特征所在的区域将其归入对应类别中。特征抽取阶段得到高 维样本的鉴别特征后,常用最近邻分类器分类。在基于子空间的线性特征抽取方法中,常见的是基于Fisher准则的线性鉴别分 析(简称FLDA)方法。FLDA方法通过最优化Fisher准则,使得到的鉴别矢量对样本降 维后,在低维空间样本特征的类间散度最大以及类内散度最小,从而所得鉴别特征在降 维变换后有最好的类可分性。但是当样本的维数大于类内散度阵的秩时,则求解最佳鉴 别特征存在病态奇异问题,此问题也称为小样本条件下的病态奇异问题。目前已有的解 决小样本病态奇异问题的方法中,规整化方法对奇异的类内散度阵加上一个小的扰动阵 使其可逆,广义逆方法则利用类内散度阵的广义逆取代逆矩阵。对高维的小样本问题, 这两种方法的计算量较大,难以实用。基于零空间的方法需要计算类内散度阵的零空 间,计算量也较大,难以应用到样本数较多的场合;基于主分量分析和零空间的方法首 先对样本进行主分量分析,将样本降维,再应用零空间方法得到线性鉴别特征,虽然降 低了计算量,但是对大量高维样本进行主分量分析存在计算量大和数值不稳定的问题。 在FLDA方法中计算最佳鉴别矢量等效于求解广义特征方程的特征矢量,而对高维数据 求解特征矢量存在计算量大和数值计算不稳定的问题。鉴别共同矢量方法(DCV)在类内 散度阵的零空间中求解鉴别矢量最优化类间散度,克服了 FLDA的小样本问题,计算量 小且数值稳定。其整个计算过程分两步完成首先在每个类别中任选一个样本投影到类 内散度阵的零空间中得到该类别的共同矢量,然后利用共同矢量最优化类间散度得到最 佳Fisher鉴别矢量。为降低计算量和增加数值稳定性,进一步利用正交化过程代替求解 特征方程。然而改进的DCV方法需要进行一次高维数据的降维,并进行两次正交化过 程,这样也增加了计算的复杂度。

发明内容
本发明目的是针对现有高维小样本数据线性鉴别特征抽取技术存在的缺陷提供 一种快速实时的线性鉴别特征抽取方法。本发明为实现上述目的,采用如下技术方案本发明小样本线性鉴别特征的快速实时抽取方法包括如下步骤(1)、计算线性鉴别矢量有C个类别的样本,第i个类别有Ii1个训练样本,i = l,2…’ C,总样本数为 本计算n-1个差矢量為Ι + ^為2,…,,其中d\=x\+l-x\ 左= H^1-I,d\ = x\ -X11 1 = 2,...,C, 1 = 2”..,%,表示第1个类别中的第k+1个样本,X11表示第1个类别中第1个样本,X丨表示 第i个类别中的第1个样本;利用n-1个差矢量<,dc计算η--1个新矢量
Sl,—^ S H1-I^ Sl ” ..^Sn2-I7C C 2 ...? Sl ” .. ? Snc —1, Sl , ■C 7 Sl,
其中
ο 1 ? · · ·,Sw1-I = ”9
Sl ”··2 τ2 ,^w2-1 = α2
Sl,..Snc-I = d2
Sl ”··^Si —dx,..■Λ,
将n--1个新矢量
权利要求
1. 一种小样本线性鉴别特征的快速实时抽取方法,其特征在于包括如下步骤(1)、计算线性鉴别矢量有C个类别的样本,第i个类别有II1个训练样本,i=l,2...,C,总样本数为 = 将采集到的样本用矢量表示,即<表示第i个类别中的第j个样本;用η个总样 本计算η-1个差矢量為Ι + ^為2,…,,其中dI = xLi -xI 左=1,2”..,W1-I, d\ = X11 -X11 j = 2,...,C, 1 = 2,...,^ ,·4+1表示第1个类别中的第k+1个样本,X11表示第1个类别中第1个样本,劣表示第i 个类别中的第1个样本;利用η-1个差矢量為ι",<,..., ζ计算η-1个新矢量
全文摘要
本发明公布了一种小样本线性鉴别特征的快速实时抽取方法。所述方法包括利用训练样本构造差矢量,对其计算和重新排列得到新的矢量,对新矢量构成的矩阵进行QR分解得到小样本条件下的最佳线性鉴别矢量;在识别阶段将样本特征和待识别特征分别投影到计算出的线性鉴别矢量上,得到最佳鉴别特征,然后计算待识别特征和样本特征的距离,将待识别人脸图像归入最小距离对应的人脸类别中。本发明所得线性鉴别矢量和特征互不相关,消除了线性鉴别特征间的冗余,提高了所得鉴别特征的鉴别能力。所得线性鉴别矢量位于总散度阵的秩空间和类内散度阵的零空间中。由于使用QR分解计算正交化的线性鉴别矢量,因此本方法有较好的数值稳定性和快速实时的性能。
文档编号G06K9/66GK102013023SQ20101056817
公开日2011年4月13日 申请日期2010年12月1日 优先权日2010年12月1日
发明者贺云辉 申请人:南京信息工程大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1