一种基于稀疏表示的红外光谱数据分类识别方法与流程

文档序号:14136212阅读:289来源:国知局
一种基于稀疏表示的红外光谱数据分类识别方法与流程

本发明涉及红外光谱数据分类识别方法,具体是指一种基于稀疏表示的红外光谱数据分类识别方法。



背景技术:

红外光谱检测具有快速、安全、低成本、无损的特点,用红外光谱来对物质进行快速检测是一种行之有效的办法。但在用算法对光谱数据进行快速识别的时候往往需要平滑,变量选择等预处理方式或者需要空间投影或者傅立叶变化等算法来提升分类算法的有效性,但是这些过程对于分类并没有实际的意义。

因此,亟需一种能减少对红外光谱数据进行特征选择或者空间变换之类的预处理过程,从而实现对红外光谱数据快速分类识别。



技术实现要素:

本发明实施例所要解决的技术问题在于,提供一种基于稀疏表示的红外光谱数据分类识别方法,该方法能够快速实现对红外数据进行分类识别,同时避免了红外数据需进行特征选择或者空间变换之类的预处理过程。

为实现上述目的,本发明的技术方案是包括以下步骤:

s01:选择目标样本y,明确某一个需要识别其红外光谱数据类别标签的样本,做成行为维度列为1的矩阵;

s02:构造训练样本矩阵,将已获知类别标签的训练样本的红外光谱数据排成行为维度,列为样本数的形式,并且同类样本放在一起,构造线性系统y=ax中的a的矩阵,矩阵表示如下:a=[a1,a2,...ak]=[v1,1,v1,2,...,vk,nk];

s03:对训练样本矩阵进行标准化处理,对每个训练样本除以对应训练样本的二维范数;

s04:求解稀疏解,对于预测目标样本y,求解线性系统y=ax的解,对于红外光谱数据而言,其维度大于样本数,即线性系统y=ax是超定的,通过求使这个解的1阶范数最小来逼近0阶范数最小的稀疏效果,然后得到稀疏解x1;

s05:根据某一类稀疏解以及样本信息对预测样本进行估计,由上一步求得的稀疏解以及对应之前的训练样本信息,求得这类标签对应的训练集与稀疏解的矩阵乘积,产生这一类训练样本的信息对预测样本进行表示,得到某类训练数据对预测样本的估计,也就是

s06:类别判决,根据某一类训练集对预测样本的估计与实际预测样本的差异来进行判决,以某一类估计样本与预测样本差值的二维范数作为标准,用与实际预测样本差异最小的类别标签作为预测集的类别,所述二维范数即某一类估计样本与预测样本差值的欧式距离;

s07:输出预测样本的类别标签。

进一步设置是所述的步骤s04中,利用一阶homotopy函数包,设定好迭代次数和容错大小,求解这个一阶范数最小的解来逼近零阶范数最小的稀疏解,如果预测样本的类别为第i类,那么理想的稀疏解为x0=[0,…,0,αi,1,αi,2,…,αi,60,0,…,0]t

实施本发明实施例,具有如下有益效果:

本发明引入了稀疏表示的算法,根据未知样本对于已知样本的近似程度来进行判决,这样的过程对于分类有实际的意义。步骤是先通过将未知的样本用已知的样本进行稀疏表示,求出对应的稀疏解,然后通过已知标签信息的稀疏解的分布来表示未知样本的方式,以此来实现光谱数据的快速分类,本发明的方法无需对红外光谱数据进行特征选择或者空间变换之类的预处理过程,具有快速识别的效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本发明的范畴。

图1本发明的红外光谱数据分类识别方法的流程图;

图2本发明实施例是实施流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。

本发明所提到的方向和位置用语,例如「上」、「下」、「前」、「后」、「左」、「右」、「内」、「外」、「顶部」、「底部」、「侧面」等,仅是参考附图的方向或位置。因此,使用的方向和位置用语是用以说明及理解本发明,而非对本发明保护范围的限制。

如图1至图2所示,为本发明实施例中,提供一种基于稀疏表示的红外光谱数据分类识别方法,包括以下步骤:

s01,选择目标样本y。一共有五类泥蚶样本,分别为泥蚶a,泥蚶b,泥蚶c,泥蚶d,泥蚶e。每个泥蚶样品的红外数据为3000×1的列矩阵。选择一个未知的泥蚶样本作为目标样本。

s02,构造训练样本矩阵。已知类别标签的每种泥蚶样品数为15个,然后将泥蚶样本数据排成行为维度,列为样本数的形式,并且1~15列为第一类泥蚶a,16~30列为第二类泥蚶b,以此类推,构造线性系统y=ax中的a的矩阵,a=[a1,a2,...a5]=[v1,1,v1,2,...,v5,15*5]。

s03,对训练样本矩阵进行标准化处理。对每个样本的列矩阵点除以这个样本的二维范数,进行标准化,成为新的训练样本矩阵,也就是vi,j=vi,j/||vi,j||2。

s04,求解稀疏解。在已知训练样本矩阵a以及预测样本y的条件下,求解线性系统y=ax的解。利用一阶homotopy函数包,设定好迭代次数,容错大小等求解条件参数,求解这个一阶范数最小的解来逼近零阶范数最小的稀疏解,如果预测样本的类别为第i类,那么理想的稀疏解为x0=[0,…,0,αi,1,αi,2,…,αi,60,0,…,0]t

s05,根据某一类稀疏解以及对应的样本信息对预测样本进行估计。由上一步得到的稀疏解x0,以及之前的样本信息a,对每一类都产生一个预测样本的估计,由于之前的a是存在样本的标签信息的,所以对应的稀疏解的分布也是存在标签信息。通过每一类的稀疏解求得每一类的预测估计,由于稀疏解的存在,对于不是与预测集同一类的估计极有可能输出为3000×1的0矩阵。

s06,类别判决。根据某一类的预测样本的估计与实际预测样本的差异来进行判决,这里的差异性是通过估计样本与预测样本之间的欧式距离作为标准,以误差最小的那类标签作为实际的预测样本的类别。即

s07,输出预测样本的类别标签。输出

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如rom/ram、磁盘、光盘等。

以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1