一种基于高光谱成像的分类识别方法、装置及系统与流程

文档序号:16506557发布日期:2019-01-05 09:04阅读:199来源:国知局
一种基于高光谱成像的分类识别方法、装置及系统与流程

本发明属于数据处理领域,尤其涉及一种基于高光谱成像的分类识别方法、装置及系统。



背景技术:

高光谱成像技术集成光谱技术和图像技术到一个系统,通过在电磁波范围内,扫描并获取样品在每一波长的大量光学图像,在测得许多连续光谱的同时获得被测样品空间位置的图像,是一种具有高的光谱和空间分辨率现代光学成像技术。光谱与成像结合使得该系统能获取所测样品的物理信息的同时提供物质化学的光谱分析,由于不同化学、物理特征所影响的吸收率、反射率等的差异,在特定波长处有对应的吸收值,所以根据特定波长处的吸收峰值可推算出一个物体独一无二的属性,提升物质分类、检测工作的精度。所得数据中蕴藏了大量信息,结合机器学习的相关技术,训练出精度高、反应快的模型,从而有效的降低企业成本、提高生产效率。

高光谱成像技术提供了更高的分辨率,所获取的波段数众多、实验数据庞大,所以整体的数据矩阵非常庞大,相邻波段信息间强相关性或噪音数据都将对模型精度、分析速度造成一定程度的干扰。传统的数据处理方法,如移动平均平滑法可能由于所选取宽度的误差造成信息损失或没有取得预期的降噪目标,即使使用savitzky-golay卷积平滑法,用最小二乘拟合滤波函数,也无法有效的取出无关信息。将这样的样本输入机器学习的模型不仅将大大增加数据的计算量还会干扰训练,影响模型准确度。



技术实现要素:

本发明为解决现有的基于高光谱成像的识别技术数据量大、计算量大的技术问题,提供一种基于高光谱成像的分类识别方法、装置及系统。

本发明第一个目的是,提供一种基于高光谱成像的分类识别方法,包括:

对样品进行分类;

接收各类样品的多帧高光谱图像并进行降噪处理,获得特征图像;

对各类样品的特征图像进行分析,提取公共因子;

将所述公共因子进行归零处理,获得特征子区间,并根据权重进行排列;

将排序后的特征子区间数据导入机器学习模型进行训练;

将待识别样品的高光谱图像输入至训练后的机器学习模型进行识别,并输出识别结果。

根据本发明的一个实施例,对各类样品的特征图像进行分析,提取公共因子,包括:

建立因子分析模型;

求标准化数据的相关矩阵、特征值以及特征向量;

获取特征值大于预设阈值的特征值个数;

根据极大似然法求解因子载荷矩阵;

根据方差极大法进行因子旋转;

根据旋转后的因子载荷矩阵计算因子得分;

降低数据维度,获得公共因子。

根据本发明的一个实施例,所述因子分析模型如下所示:

其中,x为样本数据,μ为样本均值,f为公共因子,ε为特殊因子,a为系数。

根据本发明的一个实施例,所述预设阈值为1。

根据本发明的一个实施例,所述权重根据所述特征子区间的长度比确定。

根据本发明的一个实施例,所述权重根据特征子区间内的方差大小比值确定。

本发明的第二个目的是,提供一种基于高光谱成像的分类识别装置,包括处理器和存储器,所述存储器用于存储多条指令,所述处理器用于读取所述指令并执行:

接收各类样品的多帧高光谱图像并进行降噪处理,获得特征图像;

对各类样品的特征图像进行分析,提取公共因子;

将所述公共因子进行归零处理,获得特征子区间,并根据权重进行排列;

将排序后的特征子区间数据导入机器学习模型进行训练;

将待识别样品的高光谱图像输入至训练后的机器学习模型进行识别,并输出识别结果。

根据本发明的一个实施例,所述处理器还用于执行:

建立因子分析模型;

求标准化数据的相关矩阵、特征值以及特征向量;

获取特征值大于预设阈值的特征值个数;

根据极大似然法求解因子载荷矩阵;

根据方差极大法进行因子旋转;

根据旋转后的因子载荷矩阵计算因子得分;

降低数据维度,获得公共因子。

根据本发明的一个实施例,所述处理器还用于执行:

根据特征子区间内的方差大小比值或者特征子区间的长度比确定权重。

本发明的第三个目的是,提供一种基于高光谱成像的分类识别系统,包括上述的分类识别装置,还包括高光谱图像采集装置,所述高光谱图像采集装置与所述处理器连接,所述高光谱图像采集装置用于接收各类样品的多帧高光谱图像。

本实施例提供的基于高光谱成像的分类识别方法、装置及系统,至少包括如下有益效果:

(1)方法较简单,有效节约计算流程,减小计算量,通过多次采集高光谱图像并进行降噪,有效避免因为环境,测试方法、测试人员的改变而产生变化,使之能够得到一个更有效、更稳定的识别算法;对有效的特征子空间,进行提取和分割,能够快速的定位到标识不同属性的特征;

(2)采用了特征量降维,主要的特征作为不同的权重,神经网络进行分类的时候,它能够把非重要特征或相同特征的噪声带来的问题有效避免掉;

(3)经过特征降维和特征提取后得到本征特征,将特征空间的显著子空间提取出来,并得出一个权重分布的排列,然后采用半监督学习进行有效的识别与分类,从而得到一个更准确的识别效果;

(4)相对传统的物理化学方法而言,提高了检测速度;同时,在对待测物品各组分含量的测量中,利用传统的化学、光谱技术测量食物中某一化学成分的含量,所得的数值为样品中待测量的平均数值,而高光谱成像技术可以获得空间上每个点的信息,可以获得更精细的成分分布信息,从而提高一定的准确率。

本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

图1是本发明实施例提供的基于高光谱成像的分类识别方法的流程图。

图2是本发明实施例提供的基于高光谱成像的分类识别方法中对于二维的高光谱图像降噪的示意图。

图3是本发明实施例提供的基于高光谱成像的分类识别方法中对于三维的高光谱图像降噪的示意图。

图4是本发明实施例提供的基于高光谱成像的分类识别方法中对各类样品的特征图像进行分析的流程图。

图5是本发明实施例提供的基于高光谱成像的分类识别方法中对p类样本进行探索性因子分析获得公共因子和特殊因子的示意图。

图6为本发明实施例提供的基于高光谱成像的分类识别装置的结构示意图。

图7为本发明实施例提供的基于高光谱成像的分类识别系统的结构示意图。

具体实施方式

为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

实施例一

参考图1,本实施例提供一种基于高光谱成像的分类识别方法,包括:

步骤s101,对样品进行分类;

步骤s102,接收各类样品的多帧高光谱图像并进行降噪处理,获得特征图像;

步骤s103,对各类样品的特征图像进行分析,提取公共因子;

步骤s104,将所述公共因子进行归零处理,获得特征子区间,并根据权重进行排列;

步骤s105,将排序后的特征子区间数据导入机器学习模型进行训练;

步骤s106,将待识别样品的高光谱图像输入至训练后的机器学习模型进行识别,并输出识别结果。

具体地,首先执行步骤s101,将样品进行分类,样品共有p类,分别记为a1,a2,......,ap。

执行步骤s102,接收各类样品的多帧高光谱图像,优选地,对同一类样品进行多次采集,并进行降噪处理,对于二维的高光谱图像降噪参考图2,对于三维的高光谱图像降噪图3,经过降噪之后,获得特征图像a1*,a2*,......ap*

如果直接基于特征光谱做分类识别,可能会受到环境,测试方法、测试人员的改变而产生巨大的变化,所以有必要对于特征光谱进行有效的降噪,使之能够得到一个更有效、更稳定的识别算法。采用单点的高光谱探测器进行检测,为了得到一个高质量的降噪,首先需要对需分类的样品确定对应标签,分成若干组,分别在每组里面进行重复性的高光谱波段的检测,采用平滑、滤波的方式去除数据噪声,得到组内平滑曲线。

执行步骤s103,针对各类样本,优选采用探索性因子分析法对特征图像进行分析,探寻公共因子,找出多远观观测值得本质结构,从而筛选出一系列差异较大的波段。

参考图4,对各类样品的特征图像进行分析,提取公共因子,包括:

步骤s1031,建立因子分析模型;

步骤s1032,求标准化数据的相关矩阵、特征值以及特征向量;

步骤s1033,获取特征值大于预设阈值的特征值个数;

步骤s1034,根据极大似然法求解因子载荷矩阵;

步骤s1035,根据方差极大法进行因子旋转;

步骤s1036,根据旋转后的因子载荷矩阵计算因子得分;

步骤s1037,降低数据维度,获得公共因子。

具体地,步骤s1031中,建立因子分析模型,该因子分析模型如下:

其中,x为样本数据,μ为样本均值,f为公共因子,ε为特殊因子,a为系数。

步骤s1032中,求标准化数据的相关矩阵、特征值以及特征向量:

标准化数据的相关矩阵r如下所示:

求解r的特征值和特征向量:

令|r-λi|=0;

其中,λ为特征值,i为单位矩阵,λ可能有p个取值,p个特征值中大于0的个数,即为因子的个数;

解方程(r-λii)xi=0,xi为λi的特征向量。

步骤s1033中,获取特征值大于预设阈值的特征值个数,作为一种优选的实施方式,该预设阈值为1。

步骤s1034中,根据极大似然法求解因子载荷矩阵:

上述因子分析模型可简写为:

x=μ+aρ+ε;

可以证明:r=a·a*+d;

其中,d为对角矩阵;

则似然函数为

求解方程:

求唯一解,求得因子载荷矩阵a*

步骤s1035中,根据方差极大法进行因子旋转:

a=a*·t;

其中,hi为方差贡献;

因子载荷矩阵a*的第j列元素平方的相对方差为

选择正交矩阵t,因子载荷矩阵a*旋转后的m个列元素平方和的相对方差之和:

v=v1+v2+...vm

得到旋转后的矩阵a=a*·t。

步骤s1036中,根据旋转后的因子载荷矩阵计算因子得分:

用微分求极值得:

对应的因子得分为:

其中,为估计值,xj为样本数据。

参考图5,对p类样本进行探索性因子分析,公共因子为区间ii,特殊因子包括区间iii和区间i。

本实施例所用的探索因子分析法也可换成其他方法,基于对单一类别进行多次测量并预处理,再对所有类别进行降维处理的方法均可以采用。

进一步地,参考图6,执行步骤s104,将公共因子做归零处理,即可获得特征子区间,将特征子区间按照权重进行排列,其中,所述权重根据所述特征子区间的长度比确定,或者根据特征子区间内的方差大小比值确定。

对不同分类的特征图像采用降维分析(efa、pca)等方法,得到不同类别特征光谱里变化最小,反应了公共信息的波段。在整个特征光谱区间上对此类区间取反,便可在整个特征光谱中获取若干子区间,这些子区间记录了类与类之间最显著的差异信息,它的剧烈变化直接反映当前这一类物体的特征,而在其他的波段范围的空间,几乎没什么改变,所以有必要把这样一些能够明显反应它子区间的图像,对应的分布范围,通过特征降维,通过一定的衡量指标,如方差贡献率、权重等,进行重新排序,将特征光谱变换到另外的特征空间里。

进一步地,执行步骤s106,将排序后的特征子区间数据导入机器学习模型进行训练,并引入attentionmodel,导入权重信息。

进一步地,执行步骤s107,将待识别样品的高光谱图像输入至训练后的机器学习模型进行识别,即可得到识别结果。

本实施例提供的基于高光谱成像的分类识别方法,至少包括如下有益效果:

(1)方法较简单,有效节约计算流程,减小计算量,通过多次采集高光谱图像并进行降噪,有效避免因为环境,测试方法、测试人员的改变而产生变化,使之能够得到一个更有效、更稳定的识别算法;对有效的特征子空间,进行提取和分割,能够快速的定位到标识不同属性的特征;

(2)采用了特征量降维,主要的特征作为不同的权重,神经网络进行分类的时候,它能够把非重要特征或相同特征的噪声带来的问题有效避免掉;

(3)经过特征降维和特征提取后得到本征特征,将特征空间的显著子空间提取出来,并得出一个权重分布的排列,然后采用半监督学习进行有效的识别与分类,从而得到一个更准确的识别效果。

(4)相对传统的物理化学方法而言,提高了检测速度;同时,在对待测物品各组分含量的测量中,利用传统的化学、光谱技术测量食物中某一化学成分的含量,所得的数值为样品中待测量的平均数值,而高光谱成像技术可以获得空间上每个点的信息,可以获得更精细的成分分布信息,从而提高一定的准确率。

实施例二

参考图6,本实施例提供一种基于高光谱成像的分类识别装置,包括处理器201和存储器202,存储器202用于存储多条指令,处理器201用于读取所述指令并执行:

接收各类样品的多帧高光谱图像并进行降噪处理,获得特征图像;

对各类样品的特征图像进行分析,提取公共因子;

将所述公共因子进行归零处理,获得特征子区间,并根据权重进行排列;

将排序后的特征子区间数据导入机器学习模型进行训练;

将待识别样品的高光谱图像输入至训练后的机器学习模型进行识别,并输出识别结果。

具体地,处理器201用于接收各类样品的多帧高光谱图像,优选地,对同一类样品进行多次采集,并进行降噪处理,对于二维的高光谱图像降噪参考图2,对于三维的高光谱图像降噪图3,经过降噪之后,获得特征图像a1*,a2*,......ap*

如果直接基于特征光谱做分类识别,可能会受到环境,测试方法、测试人员的改变而产生巨大的变化,所以有必要对于特征光谱进行有效的降噪,使之能够得到一个更有效、更稳定的识别算法。采用单点的高光谱探测器进行检测,为了得到一个高质量的降噪,首先需要对需分类的样品确定对应标签,分成若干组,分别在每组里面进行重复性的高光谱波段的检测,采用平滑、滤波的方式去除数据噪声,得到组内平滑曲线。

进一步地,处理器201采用探索性因子分析法对特征图像进行分析,探寻公共因子,找出多远观观测值得本质结构,从而筛选出一系列差异较大的波段。处理器201还用于执行:

建立因子分析模型;

求标准化数据的相关矩阵、特征值以及特征向量;

获取特征值大于预设阈值的特征值个数;

根据极大似然法求解因子载荷矩阵;

根据方差极大法进行因子旋转;

根据旋转后的因子载荷矩阵计算因子得分;

降低数据维度,获得公共因子。

具体地,建立因子分析模型,该因子分析模型如下:

其中,x为样本数据,μ为样本均值,f为公共因子,ε为特殊因子,a为系数。

求标准化数据的相关矩阵、特征值以及特征向量:

标准化数据的相关矩阵r如下所示:

求解r的特征值和特征向量:

令|r-λi|=0;

其中,λ为特征值,i为单位矩阵,λ可能有p个取值,p个特征值中大于0的个数,即为因子的个数;

解方程(r-λii)xi=0,xi为λi的特征向量。

获取特征值大于预设阈值的特征值个数,作为一种优选的实施方式,该预设阈值为1。

根据极大似然法求解因子载荷矩阵:

上述因子分析模型可简写为:

x=μ+aρ+ε;

可以证明:r=a·a*+d;

其中,d为对角矩阵;

则似然函数为

求解方程:

求唯一解,求得因子载荷矩阵a*

根据方差极大法进行因子旋转:

a=a*·t;

其中,hi为方差贡献;

因子载荷矩阵a*的第j列元素平方的相对方差为

选择正交矩阵t,因子载荷矩阵a*旋转后的m个列元素平方和的相对方差之和:

v=v1+v2+...vm

得到旋转后的矩阵a=a*.t。

根据旋转后的因子载荷矩阵计算因子得分:

用微分求极值得:

对应的因子得分为:

其中,为估计值,xj为样本数据。

参考图5,对p类样本进行探索性因子分析,公共因子为区间ii,特殊因子包括区间iii和区间i。

本实施例所用的探索因子分析法也可换成其他方法,基于对单一类别进行多次测量并预处理,再对所有类别进行降维处理的方法均可以采用。

进一步地,处理器201还用于:将公共因子做归零处理,即可获得特征子区间,将特征子区间按照权重进行排列,其中,所述权重根据所述特征子区间的长度比确定,或者根据特征子区间内的方差大小比值确定。

对不同分类的特征图像采用降维分析(efa、pca)等方法,得到不同类别特征光谱里变化最小,反应了公共信息的波段。在整个特征光谱区间上对此类区间取反,便可在整个特征光谱中获取若干子区间,这些子区间记录了类与类之间最显著的差异信息,它的剧烈变化直接反映当前这一类物体的特征,而在其他的波段范围的空间,几乎没什么改变,所以有必要把这样一些能够明显反应它子区间的图像,对应的分布范围,通过特征降维,通过一定的衡量指标,如方差贡献率、权重等,进行重新排序,将特征光谱变换到另外的特征空间里。

进一步地,处理器201还用于将排序后的特征子区间数据导入机器学习模型进行训练,并引入attentionmodel,导入权重信息。

进一步地,处理器201还用于将待识别样品的高光谱图像输入至训练后的机器学习模型进行识别,即可得到识别结果。

本实施例提供的基于高光谱成像的分类识别装置,至少包括如下有益效果:

(1)有效节约计算流程,减小计算量,通过多次采集高光谱图像并进行降噪,有效避免因为环境,测试方法、测试人员的改变而产生变化,使之能够得到一个更有效、更稳定的识别算法;对有效的特征子空间,进行提取和分割,能够快速的定位到标识不同属性的特征;

(2)采用了特征量降维,主要的特征作为不同的权重,神经网络进行分类的时候,它能够把非重要特征或相同特征的噪声带来的问题有效避免掉;

(3)经过特征降维和特征提取后得到本征特征,将特征空间的显著子空间提取出来,并得出一个权重分布的排列,然后采用半监督学习进行有效的识别与分类,从而得到一个更准确的识别效果。

(4)相对传统的物理化学方法而言,提高了检测速度;同时,在对待测物品各组分含量的测量中,利用传统的化学、光谱技术测量食物中某一化学成分的含量,所得的数值为样品中待测量的平均数值,而高光谱成像技术可以获得空间上每个点的信息,可以获得更精细的成分分布信息,从而提高一定的准确率。

实施例三

参考图7,本实施例提供一种基于高光谱成像的分类识别系统,包括分类识别装置301,还包括高光谱图像采集装置302,高光谱图像采集装置302与分类识别装置301中的处理器连接,高光谱图像采集装置302用于接收各类样品的多帧高光谱图像。

分类识别装置301的工作原理请参考实施例二,在此不再赘述。

本实施例提供的分类识别系统,至少包括如下有益效果:

(1)有效节约计算流程,减小计算量,通过多次采集高光谱图像并进行降噪,有效避免因为环境,测试方法、测试人员的改变而产生变化,使之能够得到一个更有效、更稳定的识别算法;对有效的特征子空间,进行提取和分割,能够快速的定位到标识不同属性的特征;

(2)采用了特征量降维,主要的特征作为不同的权重,神经网络进行分类的时候,它能够把非重要特征或相同特征的噪声带来的问题有效避免掉;

(3)经过特征降维和特征提取后得到本征特征,将特征空间的显著子空间提取出来,并得出一个权重分布的排列,然后采用半监督学习进行有效的识别与分类,从而得到一个更准确的识别效果。

(4)相对传统的物理化学方法而言,提高了检测速度;同时,在对待测物品各组分含量的测量中,利用传统的化学、光谱技术测量食物中某一化学成分的含量,所得的数值为样品中待测量的平均数值,而高光谱成像技术可以获得空间上每个点的信息,可以获得更精细的成分分布信息,从而提高一定的准确率。

实施例四

本实施例提供具体应用场景,对分类识别装置做进一步说明。

应用于食品工业安全检测领域,对高品质肉类和劣质肉类首先进行分类,通过高光谱图像采集装置采集不同种类的肉的多帧高光谱图像并进行降噪处理,获得特征图像;对各类样品的特征图像进行分析,提取公共因子;将公共因子进行归零处理,获得特征子区间,并根据权重进行排列,将排序后的特征子区间数据导入机器学习模型进行训练,获得训练好的模型。

实际检验中,高品质肉类和劣质肉类混在一起,通过高光谱图像采集装置采集待检测肉类的多帧高光谱图像,发送至处理器,输入已训练好的识别模型中,即可检测出待测肉类的成分、品质、污染物保证期等特征因素,从而识别出高品质肉类和劣质肉类。相对传统的物理化学方法而言,提高了检测速度;同时,在肉品各组分含量的测量中,利用传统的化学、光谱技术测量食物中某一化学成分的含量,所得的数值为样品中待测量的平均数值,而高光谱成像技术可以获得空间上每个点的信息,可以获得更精细的成分分布信息,从而提高一定的准确率。

在本发明的描述中,需要理解的是,术语″中心″、″纵向″、″横向″、″长度″、″宽度″、″厚度″、″上″、″下″、″前″、″后″、″左″、″右″、″竖直″、″水平″、″顶″、″底″″内″、″外″、″顺时针″、″逆时针″、″轴向″、″径向″、″周向″等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,限定有″第一″、″第二″的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,″多个″的含义是两个或两个以上。

在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语″安装″、″相连″、″连接″应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

在本说明书的描述中,参考术语″一个实施例″、″一些实施例″、″示意性实施例″、″示例″、″具体示例″、或″一些示例″等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1