基于浓度残差信息的近红外光谱检测水果品质的方法及系统与流程

文档序号:11232839阅读:656来源:国知局
基于浓度残差信息的近红外光谱检测水果品质的方法及系统与流程

本发明涉及红外光谱数据分析技术领域和水果检测技术领域,尤其涉及一种基于浓度残差信息的近红外光谱检测水果品质的方法及系统。



背景技术:

红外光谱检测具有快速、安全、低成本、无损的特点,用红外光谱来对物质进行快速检测是一种行之有效的办法。然而,现有采用红外光谱数据的常用模式来识别水果品质的方法或多或少都存在一些缺陷,如偏最小二乘法回归算法(pls)方法,需要涉及复杂的不直观的空间投影,又如主成份分析法(pca),需要确定主成份数或者隐函数因子的大小,对参数的选择有更高的要求。

因此,亟需一种基于浓度残差信息的近红外光谱检测水果品质的方法,避免红外光谱数据需要平滑、变量选择的过程,达到快速识别水果品质的目的。



技术实现要素:

本发明实施例的目的在于提供一种基于浓度残差信息的近红外光谱检测水果品质的方法及系统,避免红外光谱数据需要平滑、变量选择的过程,达到快速识别水果品质的目的。

为了解决上述技术问题,本发明实施例提供了一种基于浓度残差信息的近红外光谱检测水果品质的方法,所述方法包括:

s1、提取已知浓度数据的水果样本为训练样本以及未知浓度数据的水果样本为预测样本,并确定所述训练样本和所述预测样本各自对应的红外光谱数据,且进一步得到由所述训练样本的红外光谱数据形成的训练样本光谱矩阵以及由所述预测样本的红外光谱数据形成的预测样本光谱矩阵;其中,所述训练样本光谱矩阵的行数为训练样本数量、列数为红外光谱数据的固定光谱维度;所述预测样本光谱矩阵的行数为预测样本数量、列数为红外光谱数据的固定光谱维度;

s2、设置迭代次数,以及得到由所述训练样本的已知浓度数据形成的行数为训练样本数量、列数为1的浓度矩阵;

s3、获取当前迭代次数和当前浓度矩阵;

s4、将所述训练样本光谱矩阵与所述当前浓度矩阵构建线性关系并利用最小二乘法回归算法进行求解,得到求解后的当前回归系数,且进一步根据所述求解后的当前回归系数以及所述训练样本光谱矩阵,利用最小二乘法回归算法反向求解出当前回归浓度矩阵;

s5、根据所述求解出的当前回归浓度矩阵和所述当前浓度矩阵,得到当前浓度残差矩阵,并将所述得到的当前浓度残差矩阵与所述当前浓度矩阵组合成新浓度矩阵,且将所述当前迭代次数减一;其中,所述当前浓度残差矩阵的行数固定为训练样本数量、列数固定为1;

s6、待判定所述当前迭代次数减一后不为0时,返回所述步骤s3继续迭代运算;

s7、待判定所述当前迭代次数减一后为0时,结束迭代运算,输出最后求解的回归系数;

s8、根据所述预测样本光谱矩阵和所述最后求解的回归系数,利用最小二乘法回归算法进行反向求解,得到预测样本浓度矩阵,并提取所述预测样本浓度矩阵的第一列数据作为预测样本的浓度数据。

其中,所述步骤s4具体包括:

将所述训练样本光谱矩阵与所述当前浓度矩阵构建线性关系,根据公式得到求解后的当前回归系数其中,a表示所述训练样本光谱矩阵;c表示所述当前浓度矩阵;c+表示所述当前浓度矩阵的伪逆矩阵;

将所述求解后的当前回归系数以及所述训练样本光谱矩阵a导入公式中,得到当前回归浓度矩阵

其中,所述步骤s5中的“当前浓度残差矩阵”由来实现。

其中,所述步骤s5中的“新浓度矩阵”是通过在所述当前浓度矩阵的基础上增加一列来实现,且其所增加的一列数据为对应当前所得浓度残差矩阵的数据。

其中,所述步骤s8具体包括:

将所述预测样本光谱矩阵和所述最后求解的回归系数导入公式中,得到预测样本浓度矩阵并提取所述预测样本浓度矩阵的第一列数据作为预测样本的浓度数据;其中,at表示所述预测样本光谱矩阵;表示所述最后求解的回归系数。

其中,所述浓度数据为水果的甜度值或酸度值。

本发明实施例还提供了一种基于浓度残差信息的近红外光谱检测水果品质的系统,所述系统包括:

第一设置单元,用于提取已知浓度数据的水果样本为训练样本以及未知浓度数据的水果样本为预测样本,并确定所述训练样本和所述预测样本各自对应的红外光谱数据,且进一步得到由所述训练样本的红外光谱数据形成的训练样本光谱矩阵以及由所述预测样本的红外光谱数据形成的预测样本光谱矩阵;其中,所述训练样本光谱矩阵的行数为训练样本数量、列数为红外光谱数据的固定光谱维度;所述预测样本光谱矩阵的行数为预测样本数量、列数为红外光谱数据的固定光谱维度;

第二设置单元,用于设置迭代次数,以及得到由所述训练样本的已知浓度数据形成的行数为训练样本数量、列数为1的浓度矩阵;

获取单元,用于获取当前迭代次数和当前浓度矩阵;

第一计算单元,用于将所述训练样本光谱矩阵与所述当前浓度矩阵构建线性关系并利用最小二乘法回归算法进行求解,得到求解后的当前回归系数,且进一步根据所述求解后的当前回归系数以及所述训练样本光谱矩阵,利用最小二乘法回归算法反向求解出当前回归浓度矩阵;

第二计算单元,用于根据所述求解出的当前回归浓度矩阵和所述当前浓度矩阵,得到当前浓度残差矩阵,并将所述得到的当前浓度残差矩阵与所述当前浓度矩阵组合成新浓度矩阵,且将所述当前迭代次数减一;其中,所述当前浓度残差矩阵的行数固定为训练样本数量、列数固定为1;

第一判定单元,用于待判定所述当前迭代次数减一后不为0时,返回所述获取单元;

第二判定单元,用于待判定所述当前迭代次数减一后为0时,结束迭代运算,输出最后求解的回归系数;

预测结果输出单元,用于根据所述预测样本光谱矩阵和所述最后求解的回归系数,利用最小二乘法回归算法进行反向求解,得到预测样本浓度矩阵,并提取所述预测样本浓度矩阵的第一列数据作为预测样本的浓度数据。

其中,所述第二计算单元包括:

回归系数计算模块,用于将所述训练样本光谱矩阵与所述当前浓度矩阵构建线性关系,根据公式得到求解后的当前回归系数其中,a表示所述训练样本光谱矩阵;c表示所述当前浓度矩阵;c+表示所述当前浓度矩阵的伪逆矩阵;

回归浓度矩阵计算模块,用于将所述求解后的当前回归系数以及所述训练样本光谱矩阵a导入公式中,得到当前回归浓度矩阵

其中,所述当前浓度残差矩阵由来实现。

其中,所述新浓度矩阵是通过在所述当前浓度矩阵的基础上增加一列来实现,且其所增加的一列数据为对应当前所得浓度残差矩阵的数据。

实施本发明实施例,具有如下有益效果:

本发明实施例基于简单的最小二乘法框架,以通过不断地迭代优化浓度数据的方式来确定水果的未知浓度数据,能达到快速识别水果品质的目的,该方法不仅避免了光谱数据需要平滑、变量选择的过程,迭代残差矩阵的过程同时也是个收敛的过程,避免了类似参数选择不佳,致使模型过拟合的情况。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本发明的范畴。

图1为本发明实施例提供的基于浓度残差信息的近红外光谱检测水果品质的方法的流程图;

图2本发明实施例提供的基于浓度残差信息的近红外光谱检测水果品质的系统的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

如图1所示,本发明实施例中,提出一种基于浓度残差信息的近红外光谱检测水果品质的方法,所述方法包括:

步骤s101、提取已知浓度数据的水果样本为训练样本以及未知浓度数据的水果样本为预测样本,并确定所述训练样本和所述预测样本各自对应的红外光谱数据,且进一步得到由所述训练样本的红外光谱数据形成的训练样本光谱矩阵以及由所述预测样本的红外光谱数据形成的预测样本光谱矩阵;其中,所述训练样本光谱矩阵的行数为训练样本数量、列数为红外光谱数据的固定光谱维度;所述预测样本光谱矩阵的行数为预测样本数量、列数为红外光谱数据的固定光谱维度;

具体过程为,将水果样本划分成训练样本和预测样本,该训练样本的浓度数据已知,而预测样本的浓度数据未知,但是所有水果样本的红外光谱数据都可以准确获得,因此可以基于训练样本的已知浓度数据,通过红外光谱数据来快速识别预测样本的未知浓度数据。

在本发明实施例中,构建训练样本光谱矩阵a,该训练样本光谱矩阵a由训练样本的红外光谱数据形成的行数为训练样本数量、列数为红外光谱数据的固定光谱维度的矩阵;构建预测样本光谱矩阵at,该预测样本光谱矩阵at由预测样本的红外光谱数据形成的行数为预测样本数量、列数为红外光谱数据的固定光谱维度的矩阵。应当说明的是,红外光谱数据的固定光谱维度固定为1557。

步骤s102、设置迭代次数,以及得到由所述训练样本的已知浓度数据形成的行数为训练样本数量、列数为1的浓度矩阵;

具体过程为,选择一个比较合适的迭代次数,对于比较纯净的样本,可以选择比较小的迭代次数,对于复杂的样本,可以选择比较大的迭代次数,通常来说,迭代次数可以取大一些,即使迭代多了,也不会造成过拟合的影响,只会提前收敛到一个特定的值。同时为了能够利用最小二乘法回归算法,需要构建与训练样本光谱矩阵呈线性关系对应的浓度矩阵,该浓度矩阵是由训练样本的已知浓度数据形成的行数为训练样本数量、列数为1的矩阵,浓度数据为水果的甜度值或酸度值,即浓度矩阵由水果的甜度值或酸度值组成。

步骤s103、获取当前迭代次数和当前浓度矩阵;

具体过程为,开始循环迭代运算,获取每次运算前的迭代次数和浓度矩阵,以便于确定每次迭代计算过程。

步骤s104、将所述训练样本光谱矩阵与所述当前浓度矩阵构建线性关系并利用最小二乘法回归算法进行求解,得到求解后的当前回归系数,且进一步根据所述求解后的当前回归系数以及所述训练样本光谱矩阵,利用最小二乘法回归算法反向求解出当前回归浓度矩阵;

具体过程为,将训练样本光谱矩阵与当前浓度矩阵构建线性关系,根据公式得到求解后的当前回归系数其中,a表示训练样本光谱矩阵;c表示当前浓度矩阵;c+表示当前浓度矩阵的伪逆矩阵;

进一步的,将求解后的当前回归系数以及训练样本光谱矩阵a导入公式中,得到当前回归浓度矩阵

步骤s105、根据所述求解出的当前回归浓度矩阵和所述当前浓度矩阵,得到当前浓度残差矩阵,并将所述得到的当前浓度残差矩阵与所述当前浓度矩阵组合成新浓度矩阵,且将所述当前迭代次数减一;其中,所述当前浓度残差矩阵的行数固定为训练样本数量、列数固定为1;

具体过程为,根据求解出的当前回归浓度矩阵和当前浓度矩阵c,得到前浓度残差矩阵应当说明的是,每次迭代计算后的当前浓度残差矩阵的行数固定为训练样本数量、列数固定为1。

将当前浓度残差矩阵与当前浓度矩阵c组合成的新浓度矩阵是通过在当前浓度矩阵c的基础上增加一列来实现,且其所增加的一列数据为对应当前所得浓度残差矩阵的数据。

步骤s106、判定所述当前迭代次数减一后是否为0;如果否,则返回所述步骤s103继续迭代运算;如果是,则执行下一步骤s107;

步骤s107、结束迭代运算,输出最后求解的回归系数;

具体过程为,通过与步骤s106结合,通过当前迭代次数来判定迭代运算是否结束,如果迭代运算结束则输出最后求解的回归系数反之,继续迭代运算,重复步骤s103至步骤s106。

步骤s108、根据所述预测样本光谱矩阵和所述最后求解的回归系数,利用最小二乘法回归算法进行反向求解,得到预测样本浓度矩阵,并提取所述预测样本浓度矩阵的第一列数据作为预测样本的浓度数据。

具体过程为,将预测样本光谱矩阵at和最后求解的回归系数导入公式中,得到预测样本浓度矩阵并提取预测样本浓度矩阵的第一列数据作为预测样本的浓度数据。

对本发明实施例中于红外光谱数据识别水果浓度的方法的应用场景做进一步说明,具体如下:

共有250个橘子样本,所有橘子样本的红外光谱数据的光谱维度是1557,浓度数据采用酸度值来表示,即此时浓度矩阵为酸度矩阵。以4:1的比例划分训练集与预测集,得到200个已知酸度值的训练样本和50个未知酸度值的预测样本,构建训练样本光谱矩阵a和预测样本光谱矩阵at,其中,训练样本光谱矩阵a是由200个已知酸度值的训练样本的红外光谱数据形成的200行、1557列的矩阵,预测样本光谱矩阵at是由50个未知酸度值的预测样本的红外光谱数据形成的50行、1557列的矩阵。

设置迭代次数为100,酸度矩阵c初始由200个训练样本的已知酸度值形成,行数为200、列为1,如

开始迭代运算,求出当前回归酸度矩阵以及当前酸度残差矩阵该当前酸度残差矩阵是由200行、1列的对于酸度的残差值,如

构造新酸度矩阵将当前酸度矩阵添加上当前酸度残差矩阵,生成新的酸度矩阵,如即在原来酸度矩阵的基础上,添加上残差的那一列。通过继续迭代运算直至结束,可知最后的酸度矩阵应该是200行,迭代次数加1列(101列)的酸度矩阵,且最终得出的回归系数它的行数是迭代次数(100),列数是1557。

通过50个预测样本光谱数据at,根据公式得出预测的酸度,然后取出第一列的酸度值作为最终的酸度结果值输出。

如图2所示,为本发明实施例中,提供的一种基于浓度残差信息的近红外光谱检测水果品质的系统,所述系统包括:

第一设置单元110,用于提取已知浓度数据的水果样本为训练样本以及未知浓度数据的水果样本为预测样本,并确定所述训练样本和所述预测样本各自对应的红外光谱数据,且进一步得到由所述训练样本的红外光谱数据形成的训练样本光谱矩阵以及由所述预测样本的红外光谱数据形成的预测样本光谱矩阵;其中,所述训练样本光谱矩阵的行数为训练样本数量、列数为红外光谱数据的固定光谱维度;所述预测样本光谱矩阵的行数为预测样本数量、列数为红外光谱数据的固定光谱维度;

第二设置单元120,用于设置迭代次数,以及得到由所述训练样本的已知浓度数据形成的行数为训练样本数量、列数为1的浓度矩阵;

获取单元130,用于获取当前迭代次数和当前浓度矩阵;

第一计算单元140,用于将所述训练样本光谱矩阵与所述当前浓度矩阵构建线性关系并利用最小二乘法回归算法进行求解,得到求解后的当前回归系数,且进一步根据所述求解后的当前回归系数以及所述训练样本光谱矩阵,利用最小二乘法回归算法反向求解出当前回归浓度矩阵;

第二计算单元150,用于根据所述求解出的当前回归浓度矩阵和所述当前浓度矩阵,得到当前浓度残差矩阵,并将所述得到的当前浓度残差矩阵与所述当前浓度矩阵组合成新浓度矩阵,且将所述当前迭代次数减一;其中,所述当前浓度残差矩阵的行数固定为训练样本数量、列数固定为1;

第一判定单元160,用于待判定所述当前迭代次数减一后不为0时,返回所述获取单元130;

第二判定单元170,用于待判定所述当前迭代次数减一后为0时,结束迭代运算,输出最后求解的回归系数;

预测结果输出单元180,用于根据所述预测样本光谱矩阵和所述最后求解的回归系数,利用最小二乘法回归算法进行反向求解,得到预测样本浓度矩阵,并提取所述预测样本浓度矩阵的第一列数据作为预测样本的浓度数据。

其中,所述第二计算单元150包括:

回归系数计算模块1501,用于将所述训练样本光谱矩阵与所述当前浓度矩阵构建线性关系,根据公式得到求解后的当前回归系数其中,a表示所述训练样本光谱矩阵;c表示所述当前浓度矩阵;c+表示所述当前浓度矩阵的伪逆矩阵;

回归浓度矩阵计算模块1502,用于将所述求解后的当前回归系数以及所述训练样本光谱矩阵a导入公式中,得到当前回归浓度矩阵

其中,所述当前浓度残差矩阵由来实现。

其中,所述新浓度矩阵是通过在所述当前浓度矩阵的基础上增加一列来实现,且其所增加的一列数据为对应当前所得浓度残差矩阵的数据。

实施本发明实施例,具有如下有益效果:

本发明实施例基于简单的最小二乘法框架,以通过不断地迭代优化浓度数据的方式来确定水果的未知浓度数据,能达到快速识别水果品质的目的,该方法不仅避免了光谱数据需要平滑、变量选择的过程,迭代残差矩阵的过程同时也是个收敛的过程,避免了类似参数选择不佳,致使模型过拟合的情况。

值得注意的是,上述系统实施例中,所包括的各个系统单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如rom/ram、磁盘、光盘等。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1