本发明涉及近红外光谱分析,特别涉及一种基于近红外光谱的样本识别方法。
背景技术:
1、烟叶原料是卷烟工业的基础,一直以来都是行业关注和研究的重点,尤其是卷烟配方设计的基础。由于在烟叶生长过程中受内部遗传组成、外部环境条件和栽培措施等因素的影响,不同种植地区、不同部位以及不同等级的烟叶品质差别很大,风格特征迥异,因而可在卷烟配方设计过程中,掺配不同类别的片烟,以满足产品的不同定位需求。
2、烟草行业中,种植产区是烟叶品质分类管理的重要依据,目前大多企业依靠外观评价和传统化学分析方法对烟叶产地进行鉴别,存在主观性强、准确性低、费时费力等缺点。因此,建立一种快速有效的非人工烟叶产地鉴别方法具有重要意义。
技术实现思路
1、本发明的主要目的在于解决现有技术中依靠外观评价和传统化学分析方法对烟叶产地进行鉴别所存在的主观性强、准确性低、费时费力的问题。为实现上述目的,本发明提供了一种基于近红外光谱的样本识别方法,其可基于近红外光谱技术对烟叶产地进行快速识别,且本发明采用两次识别方法来确定待测样本的类别,大大提高了样本识别的准确性。
2、本发明一实施例提供了一种基于近红外光谱的样本识别方法,包括:
3、获取总识别模型和多个分类模型,其中,总识别模型是基于多个不同类别的建模样本的近红外光谱获取的,多个分类模型分别对应不同类别且每一分类模型是基于同一类别的建模样本的近红外光谱获取的;
4、确定第一阈值;
5、获取待测样本的近红外光谱作为待测光谱,并获取待测光谱与总识别模型空间正交的第一残差向量的长度;
6、基于第一残差向量的长度小于第一阈值,针对每一分类模型,分别获取待测光谱与分类模型空间正交的第二残差向量的长度;
7、基于各第二残差向量的长度确定待测样本的类别。
8、作为本发明的一个具体实施方式,基于各第二残差向量的长度确定待测样本的类别,包括:
9、分别对各第二残差向量的长度进行标准化,以获得各第二残差向量的标准长度;
10、确定标准长度最小的第二残差向量所对应的类别作为待测样本的类别。
11、作为本发明的一个具体实施方式,分别对各第二残差向量的长度进行标准化,以获得各第二残差向量的标准长度,包括:
12、针对每一类别,分别基于该类别对应的分类模型和该类别的各建模样本的近红外光谱,确定该类别对应的标准上限和标准下限;
13、基于如下公式对各第二残差向量进行标准化处理,获取各第二残差向量的标准长度;
14、
15、其中,cp表示第p个类别对应的第二残差向量的标准长度,rdp表示第p个类别对应的第二残差向量的长度,max(rp,q)和min(rp,q)分别表示第p个类别对应的标准上限和标准下限。
16、作为本发明的一个具体实施方式,分别基于该类别对应的分类模型和该类别的各建模样本的近红外光谱,确定该类别对应的标准上限和标准下限,包括:
17、将属于类别的所有建模样本的近红外光谱向类别对应的分类模型进行投影,以获取类别的各建模样本的近红外光谱与分类模型空间正交的第三残差向量的长度,并分别获取各第三残差向量的长度中的最大值和最小值,作为该类别对应的标准上限和标准下限。
18、作为本发明的一个具体实施方式,确定第一阈值,包括:
19、分别将所有建模样本的近红外光谱向总识别模型进行投影,以获取各建模样本的近红外光谱与总识别模型空间正交的第四残差向量的长度;
20、获取各第四残差向量的长度;
21、确定各第四残差向量的长度的平均值和标准偏差;
22、基于平均值和标准偏差确定第一阈值。
23、作为本发明的一个具体实施方式,第一阈值等于平均值与3~5倍的标准偏差的和。
24、作为本发明的一个具体实施方式,总识别模型的获取步骤包括:
25、确定建模样本集,获取建模样本集中所有建模样本的近红外光谱;其中,建模样本集包括多个不同类别的建模样本;
26、基于所有建模样本的近红外光谱构建总光谱矩阵,对总光谱矩阵进行奇异值分解,并利用分解得到的第一设定数量的主成分因子对总光谱矩阵进行光谱重构,获得总重构光谱矩阵;
27、基于总重构光谱矩阵构建总识别模型。
28、作为本发明的一个具体实施方式,总识别模型为:
29、
30、其中,ht表示总识别模型,i表示单位矩阵,xtnew表示总重构光谱矩阵,为xtnew的广义逆矩阵。
31、作为本发明的一个具体实施方式,第一设定数量是基于交互检验获得。
32、作为本发明的一个具体实施方式,多个分类模型的获取包括分别对各类别的建模样本进行以下步骤:
33、针对同一类别的所有建模样本,获取其近红外光谱;
34、基于类别的所有建模样本的近红外光谱构建分类光谱矩阵,对分类光谱矩阵进行奇异值分解,并利用分解得到的第二设定数量的主成分因子对分类光谱矩阵进行光谱重构,获得分类重构光谱矩阵;
35、基于分类重构光谱矩阵构建类别对应的分类模型。
36、相比于现有技术,本发明至少具有以下技术效果:
37、本发明提供的基于近红外光谱的样本识别方法,通过建立建模样本集中所有样本的总模型和建模样本集中每个类别样本的分类模型,然后将待测样本的近红外光谱分别投影到总模型和各个分类模型上,获得待测样本与该模型正交的残差向量的长度,通过残差向量的大小排序后,实现对待测样本的分类,可以减少时间和成本,提高检测效率。
1.一种基于近红外光谱的样本识别方法,其特征在于,包括:
2.如权利要求1所述的基于近红外光谱的样本识别方法,其特征在于,基于各所述第二残差向量的长度确定所述待测样本的类别,包括:
3.如权利要求2所述的基于近红外光谱的样本识别方法,其特征在于,分别对各所述第二残差向量的长度进行标准化,以获得各所述第二残差向量的标准长度,包括:
4.如权利要求3所述的基于近红外光谱的样本识别方法,其特征在于,分别基于所述类别对应的所述分类模型和该类别的各所述建模样本的所述近红外光谱,确定所述类别对应的标准上限和标准下限,包括:
5.如权利要求1所述的基于近红外光谱的样本识别方法,其特征在于,确定第一阈值,包括:
6.如权利要求5所述的基于近红外光谱的样本识别方法,其特征在于,所述第一阈值等于所述平均值与3~5倍的所述标准偏差的和。
7.如权利要求1所述的基于近红外光谱的样本识别方法,其特征在于,所述总识别模型的获取步骤包括:
8.如权利要求7所述的基于近红外光谱的样本识别方法,其特征在于,所述总识别模型为:
9.如权利要求7所述的基于近红外光谱的样本识别方法,其特征在于,所述第一设定数量是基于交互检验获得。
10.如权利要求1所述的基于近红外光谱的样本识别方法,其特征在于,所述多个分类模型的获取包括分别对各类别的建模样本进行以下步骤: