自适应无参数的特征提取方法_2

文档序号:8259581阅读:来源:国知局
,Cj为相邻的类;
[0011] 步骤三:建立一个大小为叫%的矩阵G,用于存储步骤二中得到的任意两个相邻 的类之间样本与样本的关系,矩阵G初始化为全零,其中lvnj为属于任意两个相邻的类 Ci, Cj样本的数目;
[0012] 步骤四:对于属于(^的任意一个样本c ik计算其与属于c」的任意样本c ^的相关 系数Pkl,如果两个样本的相关系数大于或等于cik与c 2上所有样本的相关系数的均值m,即 Pkl> m,则置矩阵G中对应位置上G (i,j) = 1,遍历属于c i的所有的样本,由于相关系数的 性质可知,G为对称矩阵,即同时可以得到属于的每个样本与属于c i的每个样本之间的 关系;
[0013] 步骤五:按行扫描G,使用集合freq记录每行中1所在的位置,也就是对应样本在 q类中的下标号,统计freq中一共出现多少个互异的样本以及每个样本出现的次数,如果 某个样本出现的次数大于或等于平均次数T,T = freq中样本的总数目/互异的样本数目, 则认为该样本与Ci类相邻,并置这两类的类间权重矩阵B对应位置上B (i,j) = 1 ;
[0014] 步骤六:按列扫描G,使用集合freq记录每列中1所在的位置,也就是对应样本在 Cj类中的下标号,统计freq中一共出现多少个互异的样本以及每个样本出现的次数,如果 某个样本出现的次数大于或等于平均次数T,T = freq中样本的总数目/互异的样本数目, 则认为该样本与h类相邻,并置这两类的类间权重矩阵B对应位置上B (i,j) = 1 ;
[0015] 步骤七:根据步骤一和步骤六得到的类内权重矩阵和类间权重矩阵,建立类内散 布矩阵和类间散布矩阵,组成目标函数,在Fisher准则下求解目标函数,得到最优投影方 向,在此方向对样本进行投影,完成特征提取。
[0016] 本发明与现有技术相比,本发明克服了现存的特征提取算法中存在的的需要设置 参数的问题,实现了自适应无参数的特征提取算法。其优点在于:
[0017] (1)为了减小图像中噪声的影响,使用相关系数替代传统的欧式距离去衡量样本 之间的关系。
[0018] (2)对于同一类样本,依据样本相关系数的均值和各个相关系数之间的关系自适 应的建立类内权重矩阵,实现建立类内权重矩阵时的无参数化。
[0019] (3)对于不同类,依据类与类之间相关系数的关系自适应的选择出相互近邻的类。 [0020] (4)对于任意两个相邻的类,采用基于相关系数的方法自适应的选择出更加能反 映出两者关系的样本来建立类间权重矩阵,实现建立类间权重矩阵时的无参数化。
[0021] 得到类内权重矩阵和类间权重矩阵后,建立类内散布矩阵和类间散布矩阵用于描 述类内的局部结构和类间的离散性,在Fisher准则下求得一个最优的投影方向,在此投影 方向上类间散布矩阵达到最大的同时类内散布矩阵达到最小,从而完成特征提取。
【附图说明】
[0022] 图1是两个相邻类样本之间相互关系的示意图。
[0023] 图2是本发明算法得到的矩阵G。
[0024] 图3是AR数据集中两个人的人脸图像。
[0025] 图4是红外数据集中人和杯子不同姿态下的图像。
[0026] 图5是PIE数据集中两个人不同姿态下的图像。
【具体实施方式】
[0027] 假设样本为X= [Xl,x2,...,xN] e Rm,一共有C类,每一类的样本数目为叫,其中 i〈 = C,特征提取之后的对应的样本为Y = [yi,y2,…,yN] G Rd,其中d〈〈m,最优投影矩阵 为 A,即 Y = At*X。
[0028] 原始的LPP算法以及由其衍生出的一些算法普遍存在着两个明显的缺陷:①原始 LPP是一种非监督的算法,不能有效的利用不同类别之间的类别信息,这样将其直接运用于 分类时,分类的效果不会很理想;②LPP的参数的选择问题,对于同一个数据集如果LPP的 参数不一样,最终的结果也不一样。针对LPP存在的问题本文提出了一种新的基于LPP的 无参数特征提取算法。
[0029] 本发明的出发点是在尽量分开不同类的同时保持类内局部关系不变。为此需要更 加准确的衡量不同类之间的离散性,在LDA中使用每一类的均值和总的均值来衡量不同类 之间的离散性,但是由于类内数据分布的不确定性,类均值不能很好的反映整个类上的数 据分布,因此用于计算出的类间散布矩阵就会有差错。在CMVM中,则是将两类之间的全部 数据都不加区分的都考虑进来,这样虽然能将真正近邻的数据包含进来,但是同时也会将 许多不需要考虑的样本带入进来,会干扰有用的信息,不利于后续的处理。在MMDA中,使用 每一类的类内权重矩阵的和去加权该类的均值,然后使得类间散布矩阵达到最小,其本质 上还是使用类内均值去处理,不能完全的反映数据之间的信息。而在真是的数据之中,任意 两类数据之间往往只是有一部分数据距离较近,其他的部分距离相对较远,为此,只要能找 出两类数据之间距离较近的部分,然后使用这些距离较近的样本进行处理即可。
[0030] 由于真实的图像的数据包含一定的噪声,尤其是对于一些低照度下采集的图像, 直接使用欧式距离来衡量两幅图像之间的距离在某些情况下可能会出现差错,为了使这种 影响能够达到最小同时为了能够实现自适应和无参数化,使用样本的相关性去衡量两个样 本之间的相似性,从而来实现参数的自适应选择。
[0031] 步骤一:计算任意两个样本之间的相关系数Pm如公式(1)所示。
[0032]
【主权项】
1. 一种自适应无参数的特征提取方法,其特征在于包括w下步骤: 步骤一;计算任意两个样本之间的相关系数Pu,使用增强的无参数的局部保留算法建 立全部样本所属类的类内权重矩阵W ; 步骤二;寻找相邻类;依据步骤一中得到的相关系数Pu构成的矩阵P,计算任意一类Ci 与其他所有类的相关系数的平均值IV计算任意一类Ci与某一类C j.的相关系数的平均值 m。,如果叫m i 1,则认为Ci、Cj为相邻的类; 步骤建立一个大小为的矩阵G,用于存储步骤二中得到的任意两个相邻的类 之间样本与样本的关系,矩阵G初始化为全零,其中ni A为属于任意两个相邻的类Ci、Cj梓 本的数目; 步骤四:对于属于Ci的任意一个样本C ik计算其与属于C j的任意一个样本C ji的相关 系数Pkl,如果该两个样本的相关系数Pkl,大于或等于Cik与属于C j.的所有样本的相关系数 的均值m,即Pki> m,则置矩阵G中对应位置上G(i,如=1,遍历属于C i的所有的样本,得 到属于Ci的每个样本与属于C j.的每个样本之间的关系,由于相关系数的性质可知,G为对 称矩阵,即同时可W得到属于Cj.的每个样本与属于C i的每个样本之间的关系; 步骤五:按行扫描G,使用集合化eq记录每行中1所在的位置,也就是对应样本在Ci类 中的下标号,统计化eq中一共出现多少个互异的样本W及每个样本出现的次数,如果某个 样本出现的次数大于或等于平均次数T,T =化eq中样本的总数目/互异的样本数目,则认 为该样本与Ci类相邻,并置该两类的类间权重矩阵B对应位置上B (i,j) = 1 ; 步骤六:按列扫描G,使用新的集合化eql记录每列中1所在的位置,也就是对应样本 在Cj.类中的下标号,统计化eql中一共出现多少个互异的样本W及每个样本出现的次数, 如果某个样本出现的次数大于或等于平均次数T1,T1 =化eql中样本的总数目/互异的样 本数目,则认为该样本与Cj.类相邻,并置该两类的类间权重矩阵B对应位置上B (i,j) = 1 ; 步骤走;根据步骤一和步骤六得到的类内权重矩阵W和类间权重矩阵B,建立类内散布 矩阵和类间散布矩阵,组成目标函数,在Fisher准则下求解目标函数,得到最优投影方向, 在此方向对样本进行投影,完成特征提取。
【专利摘要】本发明公开了一种新的无参数的有监督的特征提取算法。该发明在原有的特征提取算法的基础上对其进行改进,使之更加合理。首先该发明使用相关系数描述样本之间的相似性,通过建立类内散布矩阵来描述流形的局部结构,然后根据类与类之间相关系数的关系建立类间散布矩阵去描述流形之间的离散关系,最后建立目标函数使用Fisher准则对其进行求解,使其在达到类内散布矩阵最小的同时,类间散布矩阵达到最大,在整个过程中不需要人为设定任何参数,实现了无参数化。在三个数据库上的实验表明该发明的识别率较原始算法有所提高,达到了预期的效果。
【IPC分类】G06K9-62
【公开号】CN104573714
【申请号】CN201410850457
【发明人】柏连发, 张毅, 赵壮, 韩静, 岳江, 陈钱, 顾国华
【申请人】南京理工大学
【公开日】2015年4月29日
【申请日】2014年12月31日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1