一种近红外定性鉴别方法

文档序号:6246240阅读:263来源:国知局
一种近红外定性鉴别方法
【专利摘要】本发明公开了一种近红外定性鉴别方法,该方法包括:步骤1:采集样本的近红外光谱数据;步骤2:确定建模样本数据并进行预处理;步骤3:对建模样本数据进行偏最小二乘特征提取;步骤4:对建模样本数据进行正交线性判别分析特征提取;步骤5:用仿生模式识别方法建立定性分析模型;步骤6:用所建立的定性分析模型进行定性鉴别。与传统定性鉴别方法相比,本发明提供的方法简单快捷、准确高效,并且无须专业人士操作。
【专利说明】一种近红外定性鉴别方法

【技术领域】
[0001] 本发明涉及近红外的定性分析领域,特别是一种近红外定性鉴别方法。

【背景技术】
[0002] 近红外光谱(Near Infrared Spectrum,NIR)是介于可见光(Vis)和中红外(MIR) 之间的电磁辐射波,美国材料检测协会(ASTM)将近红外光谱区定义为780?2526nm的区 域,是人们在吸收光谱中发现的第一个非可见光区。近红外光谱区与有机分子中含氢基团 (〇-H、N-H、C-H)振动的合频和各级倍频的吸收区一致,通过扫描样品的近红外光谱,可以得 到样品中有机分子含氢基团的特征信息,而且利用近红外光谱技术分析样品具有方便、快 速、高效、准确和成本较低,不破坏样品,不消耗化学试剂,不污染环境等优点,因此该技术 受到越来越多人的青睐。
[0003] 随着分析技术的快速发展,基于近红外光谱的各类检测技术虽然得到了广泛的应 用,但是基本都是在定量分析中的应用,在定性分析应用中较少。而目前较为需求的则是近 红外光谱的定性分析鉴别技术,例如在食品安全领域,要鉴别作物种子的品种真实性,以保 障农民的生产利益;检测奶粉中是否含有某些危害身体健康的物质以确保食用安全;检测 药物中是否含有某一种不安全成分,以确保用药安全等。
[0004] 以往的定性鉴别方法,主要依靠人工考察经验的专业判断,往往会受到很多主观 和客观因素的影响,不但速度慢,而且费工费时,制约了定性鉴别的效率。而近红外光谱分 析技术所具备的快速、高效、无损等特点,已经开始在定性鉴别分析领域得到了重视。
[0005] 仿生模式识别理论自从2002年被提出以来,已经在众多领域得到了应用。覃鸿、 徐春燕等把仿生模式识别应用到语音识别领域,通过对高维空间同类语音样本的副高,达 到识别的目的。徐建、曲延锋等人,在人脸识别和人脸确认过程中,运用多权值神经元构造 了同类样本的高维复杂几何形体,取得了比传统模式识别更高的识别效果。与传统模式识 别相比,仿生模式识别对数据集分布的认识更加精确,它是以"最佳覆盖"为目标,区别于 传统模式识别的"最佳划分"为目标。因此将仿生模式识别应用在近红外定性分析鉴别领 域中,能够提高定性鉴别效果。
[0006] 因此,为了解决上述问题,本方法提供了一种近红外定性鉴别方法,以满足日益增 长的定性分析鉴别的应用需求。


【发明内容】

[0007] (一)要解决的技术问题
[0008] 有鉴于此,本发明的主要目的是为了提供一种简单可行的近红外定性鉴别方法。
[0009] (二)技术方案
[0010] 为达到上述目的,本发明提供了一种近红外定性鉴别方法,该方法包括:
[0011] 步骤1:采集样本的近红外光谱数据;
[0012] 步骤2 :确定建模样本数据并进行预处理;
[0013] 步骤3 :对建模样本数据进行偏最小二乘(PLS)特征提取;
[0014] 步骤4 :对建模样本数据进行正交线性判别分析(OLDA)特征提取;
[0015] 步骤5 :用仿生模式识别(BPR)方法建立定性分析模型;
[0016] 步骤6 :用所建立的定性分析模型进行定性鉴别。
[0017] 上述方案中,步骤1中所述采集样本的近红外光谱数据,是采用近红外光谱仪在 不同时间采集样本的近红外光谱数据。所述近红外光谱仪是测试单粒样本的微型光谱仪, 或者是测试整杯样本的普通光谱仪,采集方式包括漫反射或透射。如果有相同型号的多台 近红外光谱仪,则在采集样本的近红外光谱数据时,多台近红外光谱仪所处的外部环境相 同;对同一份样本,在相同的测量时间点要求在不同的近红外光谱仪上进行测量,得到对应 的多条光谱数据。
[0018] 上述方案中,步骤2中所述的确定建模样本数据,是将能够对一些不确定信息进 行包容的数据作为建模样本数据,以减小光谱的变动影响模型对光谱鉴别的准确性,该些 不确定信息是指样本自身属性不同、光谱采集时间不同和/或光谱采集仪器不同。
[0019] 上述方案中,步骤2中所述的预处理,是去除或降低不确定的背景信息对光谱数 据的噪声干扰,采用的预处理方法包括数据归一化处理、导数法处理、平滑处理或中心化及 标准化处理。所述不确定的背景信息是指受近红外光谱仪仪器状态、测定条件与环境影响 的信息。
[0020] 上述方案中,步骤3中所述对建模样本数据进行偏最小二乘特征提取,具体包括:
[0021] 步骤31 :对建模集数据进行偏最小二乘特征提取,得到偏最小二乘特征矩阵,以 利用该矩阵将数据变换到偏最小二乘空间;其中所述的建模样本数据,是指经过预处理之 后的建模样本数据;所述进行偏最小二乘特征提取,得到偏最小二乘特征矩阵,具体包括:
[0022] 步骤311 :对样本数据进行标准化处理,即令样本的各个变量的均值为0,方差为 1 ;令样本矩阵为Xtl,类别信息矩阵为Ytl ;其中,Xtl定义为n条光谱p个数据点的原始光谱矩 阵,Ytl为对应的类别属性矩阵:
[0023]

【权利要求】
1. 一种近红外定性鉴别方法,其特征在于,该方法包括: 步骤1 :采集样本的近红外光谱数据; 步骤2 :确定建模样本数据并进行预处理; 步骤3 :对建模样本数据进行偏最小二乘特征提取; 步骤4 :对建模样本数据进行正交线性判别分析特征提取; 步骤5 :用仿生模式识别方法建立定性分析模型; 步骤6 :用所建立的定性分析模型进行定性鉴别。
2. 根据权利要求1所述的近红外定性鉴别方法,其特征在于,步骤1中所述采集样本的 近红外光谱数据,是采用近红外光谱仪在不同时间采集样本的近红外光谱数据。
3. 根据权利要求2所述的近红外定性鉴别方法,其特征在于,所述近红外光谱仪是测 试单粒样本的微型光谱仪,或者是测试整杯样本的普通光谱仪,采集方式包括漫反射或透 射。
4. 根据权利要求2所述的近红外定性鉴别方法,其特征在于,如果有相同型号的多台 近红外光谱仪,则在采集样本的近红外光谱数据时,多台近红外光谱仪所处的外部环境相 同;对同一份样本,在相同的测量时间点要求在不同的近红外光谱仪上进行测量,得到对应 的多条光谱数据。
5. 根据权利要求1所述的近红外定性鉴别方法,其特征在于,步骤2中所述的确定建模 样本数据,是将能够对一些不确定信息进行包容的数据作为建模样本数据,以减小光谱的 变动影响模型对光谱鉴别的准确性,该些不确定信息是指样本自身属性不同、光谱采集时 间不同和/或光谱采集仪器不同。
6. 根据权利要求1所述的近红外定性鉴别方法,步骤2中所述的预处理,是去除或降低 不确定的背景信息对光谱数据的噪声干扰,采用的预处理方法包括数据归一化处理、导数 法处理、平滑处理或中心化及标准化处理。
7. 根据权利要求6所述的近红外定性鉴别方法,其特征在于,所述不确定的背景信息 是指受近红外光谱仪仪器状态、测定条件与环境影响的信息。
8. 根据权利要求1所述的近红外定性鉴别方法,其特征在于,步骤3中所述对建模样本 数据进行偏最小二乘特征提取,具体包括: 步骤31 :对建模集数据进行偏最小二乘特征提取,得到偏最小二乘特征矩阵,以利用 该矩阵将数据变换到偏最小二乘空间; 步骤32 :利用得到的偏最小二乘特征矩阵,将经过预处理之后的建模集数据变换到偏 最小二乘空间中。
9. 根据权利要求8所述的近红外定性鉴别方法,其特征在于,步骤3中所述的建模样本 数据,是指经过预处理之后的建模样本数据。
10. 根据权利要求8所述的近红外定性鉴别方法,其特征在于,步骤31中所述进行偏最 小二乘特征提取,得到偏最小二乘特征矩阵,具体包括: 步骤311 :对样本数据进行标准化处理,即令样本的各个变量的均值为0,方差为1 ;令 样本矩阵为X0,类别信息矩阵为Ytl ;其中,Xtl定义为η条光谱p个数据点的原始光谱矩阵, Ytl为对应的类别属性矩阵:
Y(i中,yu = 1表示第i条光谱属于第j类,yu = O表示第i条光谱不属于第j类; 步骤312:求矩阵Γ Jtl的协方差矩阵C = X' A),协方差矩阵常数舍弃; 步骤313 :求得协方差矩阵C的特征值以及对应的特征向量,并将特征向量按照特征值 的大小排列,取最大的η维特征值对应的特征向量组成投影矩阵W1^ ; 步骤314 :得到新的特征向量为:x' i = XiW' PIjS。
11. 根据权利要求1所述的近红外定性鉴别方法,其特征在于,步骤4中所述对建模样 本数据进行正交线性判别分析特征提取,具体包括: 步骤41 :对经过偏最小二乘特征提取之后的建模集数据进行正交线性鉴别分析特征 提取,得到正交线性鉴别分析特征矩阵; 步骤42 :利用得到的正交线性鉴别分析特征矩阵,将经过偏最小二乘特征提取之后的 建模集数据变换到正交线性鉴别分析空间中; 步骤43 :利用变换到正交线性鉴别分析空间中的建模集数据进行建模。
12. 根据权利要求11所述的近红外定性鉴别方法,其特征在于,步骤4中所述的建模样 本数据,是指经过偏最小二乘特征提取之后的建模样本数据;正交线性判别分析特征提取 方法,与传统的线性判别分析相比,能够解决后者在现实应用中遇到的小样本问题。
13. 根据权利要求11所述的近红外定性鉴别方法,其特征在于,步骤41中所述进行正 交线性鉴别分析特征提取,得到正交线性鉴别分析特征矩阵,具体包括: 步骤411 :假设有C类样本,总样本数为N,Ni为第i类样本数,则定义类内散布矩阵Sw、 类间散布矩阵Sb如下:
其中
/为第i类模式的均值:
,为总样本均值; 步骤412 :将正交线性鉴别分析的优化问题转换为求解下式的优化问题:
其中,Wi (i = 1,2,...,)对应为下式特征值降序排列前η个值对应的特征向量,且要 满足WtW = I : SBw = λ Sww ; 步骤413 :得到Wrai^pt后,取最大的η维特征值对应的特征向量组成投影矩阵Wcma,即 可进行数据转换t =YW' _Α。
14. 根据权利要求11所述的近红外定性鉴别方法,其特征在于,步骤41中所述正交线 性鉴别分析特征矩阵,与线性鉴别分析相比,正交线性鉴别分析在求解变换矩阵的过程中, 特征向量之间是两两正交的,即满SW tW = I。
15. 根据权利要求1所述的近红外定性鉴别方法,其特征在于,步骤5中所述用仿生模 式识别方法建立定性分析模型,具体包括: 步骤51 :计算超香肠神经元:首先对建模集中的每一类样本进行模糊聚类,在每一个 聚类簇上建立超香肠神经元,最终建立的超香肠神经元数目为类别数目CX每类的聚类数 Κ,超香肠神经元输出采用简单的点到超香肠距离的倒数,分母上加1的目的是为确保分母 不为零:
其中X表示输入样本向量,τ表示超香肠神经元的核; 步骤52 :计算感知器神经元:感知器数目等于类别数目C,对于建模样本集X,行表示样 本,列表不变量,对每一类定义一个感知器的期望输出列向量qi,其值由〇或1组成,1表不 训练样本属于第i类,〇表示训练样本不属于第i类;对于未知样本X,其第i个感知器输出 标量为: qi = Xwi,其中 Wi = (X' ΧΠ ' qi 步骤53 :超香肠神经元和感知器联合输出为: 0J = Pj*Qi 其中,为第j个超香肠神经元的输出,第j个超香肠神经元属于类别i,Qi为该类别 的感知器输出; 步骤54 :采用最小二乘法直接求解得出线性神经元的权值,用O表示超香肠神经元和 感知器联合输出矩阵,其中表示第i个样本在第j个超香肠神经元和感知器的联合输 出,定义y为训练集期望输出列向量,则对应的线性神经元权值为: ψ = (O' 0)_10/ y 步骤55 :对得到的估计值$选取合适的阈值,便能够进行分类。
16. 根据权利要求15所述的近红外定性鉴别方法,其特征在于,步骤6中所述的用所建 立的定性分析模型进行定性鉴别,包括: 首先获取测试样本的光谱数据,然后对测试样本光谱数据进行预处理、特征提取,最后 利用所建立的定性分析模型进行快速鉴别,并给出鉴别结果。
17. 根据权利要求16所述的近红外定性鉴别方法,其特征在于,对测试样本光谱数据 进行的预处理,其方法与建立的定性分析模型所用的预处理方法相同。
18. 根据权利要求16所述的近红外定性鉴别方法,其特征在于,对测试样本光谱数据 进行的特征提取,包括偏最小二乘和正交线性判别分析。
【文档编号】G01N21/359GK104374737SQ201410598348
【公开日】2015年2月25日 申请日期:2014年10月30日 优先权日:2014年10月30日
【发明者】董肖莉, 李卫军, 覃鸿, 张丽萍 申请人:中国科学院半导体研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1