基于高光谱成像技术的枸杞子品种识别方法与流程

文档序号:17246707发布日期:2019-03-30 08:51阅读:310来源:国知局
基于高光谱成像技术的枸杞子品种识别方法与流程

本发明涉及基于高光谱成像技术的枸杞子品种识别方法,属于中药材鉴定领域。



背景技术:

枸杞资源在国内外分布多大80余种,在我国有7种,3变种。能够药用的有宁夏枸杞、黄果枸杞、黑果枸杞、中国枸杞,其中宁夏枸杞是我国药典规定的药用枸杞品种。宁夏枸杞经多年研究,已经繁育出多个类型的成熟树种,如大麻叶枸杞、宁杞1号至宁杞7号、宁杞9号、蒙杞1号。由于品种繁多,质量控制困难,市场流通的商品来源无法确保,至使枸杞子市场混乱,以次充好、以其他品种冲抵的现象频发。在市场交易过程中,对于枸杞子品质的鉴定多采用经验鉴别的方法,此方法误差较大,主观性较强,再加之枸杞子的品种本就多种,因此单单只依据经验鉴别可信度较低。而化学检验、分子检测由于操作方法复杂费时费力,因此也不能普及。

近年来高光谱成像技术取得了飞速的发展,从最早仅仅应用于航空航天领域。再发展至地质勘探,矿石识别。紧随其后又步入农业领域,对农作物的品质进行识别,种类进行区分。如此一来,高光谱成像技术已深入生活的方方面面,唯独在中医药领域涉足不多。



技术实现要素:

本发明的目的是提供基于高光谱成像技术的枸杞子品种识别方法,本发明技术操作流程,具有科学、高效识别的特点。

本发明提供的一种基于高光谱成像技术的枸杞子品种识别方法,包括如下步骤:1)对同一产地不同品种的枸杞子进行光谱扫描,收集1000~2400nm波段的高光谱数据;

2)将样本原始的高光谱数据进行rad校正;

3)将步骤2)中rad校正后的数据进行黑白校正,处理为相对反射率数据;

4)对所述相对反射率数据进行阈值分割,删除小面积运算;

5)步骤4)中处理后的数据进行感兴趣区域提取,得到感兴趣区域平均光谱值;

6)将所述感兴趣区域平均光谱值进行多元散射校正,得到多元散射校正值;

7)将步骤6)得到的多元散射校正值进行数据分割,分为训练集,验证集与测试集;

8)将由步骤7)处理后的训练集光谱得到的主要光谱信息与品种信息利用偏最小二乘回归进行建模,得到枸杞子品种识别模型;利用验证集与测试集调试模型;由最终确立的品种识别模型进行枸杞子品种识别。

上述的方法中,所述的样本数量大于等于300;

采用高光谱成像仪进行所述光谱扫描;

所述光谱扫描的条件如下:所述高光谱成像仪的镜头与所述枸杞子的距离为20~30cm;平台移动速度为1.5mm/s;当所收集的光谱范围在1000~2400nm时,积分时间可为4500μs,帧时间可为46928。

上述的方法中,步骤2)中rad校正为radiometriccalibration辐射校准,为仪器自带校准软件。

上述的方法步骤3)中,黑白校正公式如下:

式中r表示经过校正后的图像的相对反射率,ir表示原始图像的能量值,iw表示白板图像的能量值,ib表示黑板图像的能量值。

上述的方法步骤4)采用matlab软件进行所述阈值分割,删除小面积运算。

上述的方法步骤5)中,采用matlab软件进行所述感兴趣区域提取以及平均光谱计算。

本发明步骤5)中,所述感兴趣区域提取的提取标准是按照本领域公知的常识,本发明具体提取的是枸杞子部分的光谱数据。

上述的方法步骤6)采用matlab软件进行多元散射校正;

所述多元散射校正处理方法为多波长数据建模预处理时常用方法;

所述多元散射校正处理方法具体步骤如下:所述感兴趣区域的平均光谱经多元散射校正后可有效消除散射影响,增强与特征变量相关的光谱吸收信息;首先计算所有样品近红外光谱的平均光谱,将平均光谱作为标准光谱,具体如下:

将每个样品的近红外光谱与标准光谱进行一元线性回归运算,求得各光谱相对于标准光谱的线性平移量(回归常数)和倾斜偏移量(回归系数),具体如下:

在每个样品原始光谱中减去线性平移量同时除以回归系数修正光谱的基线相对倾斜,这样每个光谱的基线平移和偏移都在标准光谱的参考下予以修正,从而提高了光谱的信噪比。以下为具体的算法过程:

以上公式中a表示n×p维定标光谱数据矩阵,n为定标样品数,p为光谱采集所用的波长点数,a表示所有样品的原始近红外光谱在各个波长点处求平均值所得到的平均光谱矢量,ai是1×p维矩阵,表示单个样品光谱矢量,mi和bi分别表示样品近红外光谱ai与平均光谱a进行一元线性回归后得到的相对偏移系数和平移量。

上述的方法中,步骤7)中多元散射校正光谱值分割为三部分的操作如下:采用matlab软件进行数据分割,将采用随机无放回的方式抽取光谱,生成1到mt随机数集r,将光谱数据对应随机数集,按照比例将光谱数据集中的mt条光谱数据分成三个数据集:训练集,验证集和测试集;训练集是用来训练模型,验证集是用来调节参数,测试集是用来测试模型性能。

上述的方法中,步骤8)采用matlab软件进行所述偏最小二乘回归模型建立;偏最小二乘回归作为多元线性回归、典型相关分析和主成分分析的集合与演化,其思路如下:从自变量集合x中提取成分th(h=1,2,…),各成分间相互独立。随后建立提取成分th与因变量y间的回归方程。

上述的方法中,所述同一产地不同品种的枸杞子的品种具体可为宁杞1号、宁杞5号、宁杞7号、宁杞9号、蒙杞1号中的至少一种;

所述同一产地不同品种的枸杞子的产地具体可为新疆、内蒙、甘肃、青海和宁夏中的至少一种。

本发明具有以下优点:

本发明采用高光谱成像技术,将其应用于中药材品种识别领域,不仅有利于药材品种的市场流通监控;还降低了人工识别的成本,提高了鉴别的准确性与科学性。本发明将高光谱应用于中药材品种鉴别,关键所在是找出了高光谱曲线与药材品种、药材本身性状、特征成分之间的关系。

本发明在光谱预处理时采用多元散射校正,本校正方法能够有效的消除散射影响,增强与成分含量、样品特征相关的光谱吸收信息的强度。

附图说明

图1为本发明基于高光谱成像光谱仪对不同品种枸杞子进行鉴别的流程图。

图2为本发明所用整体装置。

图3为枸杞摆放原图。

图4为阈值分割图像,其中图4中n1、n5、n7、n9、m1分别表示宁杞1号、宁杞5号、宁杞7号、宁杞9号、蒙杞1号的枸杞子的图像。

图5为不同品种光谱曲线,其中图5中n1、n5、n7、n9、m1分别表示宁杞1号、宁杞5号、宁杞7号、宁杞9号、蒙杞1号的枸杞子的光谱曲线。

具体实施方式

下述实施例中所使用的实验方法如无特殊说明,均为常规方法。

下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。

实施例、

按照图1所示的流程图,基于高光谱成像光谱仪对不同品种同一产地枸杞子进行鉴别,具体步骤如下:

1、通过高光谱成像仪对不同品种同一产地的枸杞子进行光谱扫描,扫描时,1000-2400nm镜头工作,收集高光谱数据。

取不同品种同一产地的枸杞子样品各300粒,每次100粒分3次扫描,每次扫描时尽量不要超出镜头范围。摆放枸杞子时,突出每一颗粒的特征,尽量没有重叠的紧密摆,将用于黑白校正的白板摆放在样品后方5cm处。等待仪器连接、自检。设置高光谱成像仪扫描参数,镜头距离30cm,平台移动速度1.5mm/s,1000-2400nm镜头积分时间为4500μs,帧时间46928。其中积分时间为单位时间内进入镜头的光子数,在不产生过曝点的情况下,积分时间越长,图像的质量越高。帧时间反应的是图像的长宽比,数值越大,则被扫描物体在水平方向上的比例被拉大,需要进行反复调试,找到最佳比例,进行数据记录。

2、将扫描后的结果利用光谱仪自带的rad校正软件进行校正,此校正可消除因

扫描时外界环境不稳定而引起的条带与噪声,使图像质量更好。

3、采用matlab软件导入高光谱数据,利用黑白校正公式,将图像原始数据处理为相对反射率数据。

4、将进行过黑白校正的光谱图像进行阈值分割,删除小面积,得到图像的感兴趣区域掩模。

5、将确定好的掩模图像利用matlab软件进行感兴趣区域(枸杞子部分的光谱数据)的提取,计算roi区域内的平均光谱值。

6、将感兴趣区域的平均光谱,进行多元散射校正,用得到的多元散射校正后数据进行数据分割,分为训练集,验证集与测试集。光谱数据集的划分,包括采用随机无放回的方式抽取光谱,首先生成1到nr的随机数集a,将标签信息与随机数据集对应,同时光谱数据又与每条标签对应。按照设定的比例通过抽取不同的标签信息将光谱信息分别划分入:训练集,验证集和测试集。其中训练集进行模型的训练,验证集进行参数的调节,测试集进行模型性能的测试。

多元散射校正光谱值划分,分3次平行采集225粒枸杞样品,将样品分为训练集、验证集、测试集,具体分类表如下表1。

表1数据分布

多元散射校正处理方法为多波长数据建模预处理时常用方法。光谱数据经多元散射校正后可有效消除散射影响,增强与特征变量相关的光谱吸收信息。首先计算所有样品近红外光谱的平均光谱,将平均光谱作为标准光谱,具体如下:

将每个样品的近红外光谱与标准光谱进行一元线性回归运算,求得各光谱相对于标准光谱的线性平移量(回归常数)和倾斜偏移量(回归系数),具体如下:

在每个样品原始光谱中减去线性平移量同时除以回归系数修正光谱的基线相对倾斜,这样每个光谱的基线平移和偏移都在标准光谱的参考下予以修正,从而提高了光谱的信噪比。以下为具体的算法过程:

以上公式中a表示n×p维定光谱曲线标光谱数据矩阵,n为定标样品数,p为光谱采集所用的波长点数,a表示所有样品的原始近红外光谱在各个波长点处求平均值所得到的平均光谱矢量,ai是1×p维矩阵,表示单个样品光谱矢量,mi和bi分别表示样品近红外光谱ai与平均光谱a进行一元线性回归后得到的相对偏移系数和平移量。

7、将由训练集光谱得到的主要光谱信息与品种信息利用偏最小二乘回归进行建模,得到枸杞子品种识别模型,利用所述光谱数据验证集与测试集光谱数据调试模型;由最终确立的品种识别模型进行枸杞子品种识别。

具体的一个应用如下:

采用本发明方鉴别宁夏产宁杞1号、宁杞5号、宁杞7号、宁杞9号、蒙杞1号,具体步骤如下:

1、取宁夏产宁杞1号、宁杞5号、宁杞7号、宁杞9号、蒙杞1号的枸杞子样品各300粒子,分3次摆放至移动平台上,尽量不要超出镜头范围。摆放枸杞子时,突出每一颗粒的特征,尽量没有重叠的紧密摆,将用于黑白校正的白板摆放在样品后方5cm处。等待仪器连接、自检。设置高光谱成像仪扫描参数,镜头距离30cm,平台移动速度1.5mm/s,1000-2400nm镜头积分时间为4500μs,帧时间46928。

2、将扫描后的结果利用光谱仪自带的rad校正软件进行校正,此校正可消除因扫描时外界环境不稳定而引起的条带与噪声,使图像质量更好。

3、采用matlab软件导入高光谱数据,利用黑白校正公式,将图像原始数据处理为相对反射率数据。

4、取相对反射率数据进行阈值分割(对样品与背景进行计算,用黑白两色自动划分出两种区域范围),删除小面积,得到图像的感兴趣区域掩模。

本步骤中提到的阈值分割方法,主要是将图像设为f(x,y)图像的灰度采集范围是[0,l],在0和l之间选择一个合适的灰度值t,则图像可根据灰度值t进行与背景之间的分割,具体公式如下:

此时得到的g(x,y)图像为二值图像,利用得到的二值图像对原有光谱图像进行感兴趣区域的提取,如图4所示。

5、将确定好的掩模图像利用matlab软件进行感兴趣区域的提取,计算roi区域内的平均光谱值,如图5所示。

6、将感兴趣区域的平均光谱,进行多元散射校正,用得到的多元散射校正后数据进行数据分割,分为训练集,验证集与测试集。

7、将由训练集光谱得到的主要光谱信息与品种信息利用偏最小二乘回归进行建模,得到枸杞子品种识别模型;利用所述光谱数据验证集与测试集光谱数据调试模型;由最终确立的品种识别模型进行枸杞子品种识别。

训练集预处理完采用pls-da建模,训练集平均准确率100%,验证集平均准确率99.45%,测试集准确率为93.23%,测试集准确率标准差为0.0107。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1