产地鉴别的方法、装置、电子设备及存储介质

文档序号:26950996发布日期:2021-10-16 01:24阅读:56来源:国知局
产地鉴别的方法、装置、电子设备及存储介质

1.本发明涉及计算机技术领域,具体涉及产地鉴别的方法、装置、电子设备及存储介质。


背景技术:

2.农产品的品种繁多,随着农产品市场需求的不断增加,目前市场上的农产品品质参差不齐且仅凭外形易造成产地混淆,以次充好、产地造假现象时有发生。
3.在市场交易的过程中,人工鉴别农产品误差大且可信度较低,化学、生物鉴别农产品的传统方法操作复杂且周期长,因此不能普及。
4.综上,目前亟需一种产地鉴别的技术,用于解决上述现有技术存在的问题。


技术实现要素:

5.由于现有方法存在上述问题,本发明提供产地鉴别的方法、装置、电子设备及存储介质。
6.第一方面,本发明提供了产地鉴别的方法,包括:
7.获取待测农产品的高光谱数据;
8.将所述待测农产品的高光谱数据输入至训练好的产地鉴别模型,得到所述待测农产品的产地鉴别结果;
9.其中,所述训练好的产地鉴别模型为利用与不同产地的农产品对应的高光谱数据进行训练后得到。
10.进一步地,在所述将所述待测农产品的高光谱数据输入至训练好的产地鉴别模型,得到所述待测农产品的产地鉴别结果之前,还包括:
11.获取多组农产品的高光谱数据以及所述多组农产品的高光谱数据对应的多个产地信息;其中,所述多组农产品的高光谱数据与所述多个产地信息一一对应;
12.根据所述高光谱数据确定感兴趣区域平均光谱值;
13.根据所述感兴趣区域平均光谱值生成光谱训练集、光谱验证集和光谱测试集;
14.根据所述光谱训练集以及所述光谱训练集对应的产地信息对所述产地鉴别模型进行训练,根据所述光谱验证集和所述光谱测试集对所述产地鉴别模型进行调试,得到所述训练好的产地鉴别模型。
15.进一步地,所述根据所述高光谱数据确定感兴趣区域平均光谱值,包括:
16.根据所述高光谱数据确定相对反射率数据;
17.根据所述相对反射率数据确定所述感兴趣区域平均光谱值。
18.进一步地,在所述根据所述光谱训练集以及所述光谱训练集对应的产地信息对所述产地鉴别模型进行训练之前,还包括:
19.通过多元散射校正对所述光谱训练集、所述光谱验证集和所述光谱测试集进行预处理;
20.通过偏最小二乘回归对所述光谱训练集、所述光谱验证集和所述光谱测试集进行降维。
21.进一步地,所述根据所述感兴趣区域平均光谱值生成光谱训练集、光谱验证集和光谱测试集,包括:
22.按照18:2:5的比例生成所述光谱训练集、所述光谱验证集和所述光谱测试集。
23.进一步地,所述农产品为枸杞;所述多个产地信息包含宁夏、青海、内蒙古、新疆、甘肃、河南以及河北。
24.第二方面,本发明提供了一种产地鉴别的装置,包括:
25.获取模块,用于获取待测农产品的高光谱数据;
26.处理模块,用于将所述待测农产品的高光谱数据输入至训练好的产地鉴别模型,得到所述待测农产品的产地鉴别结果;其中,所述训练好的产地鉴别模型为利用与不同产地的农产品对应的高光谱数据进行训练后得到。
27.进一步地,所述处理模块还用于:
28.在所述将所述待测农产品的高光谱数据输入至训练好的产地鉴别模型,得到所述待测农产品的产地鉴别结果之前,获取多组农产品的高光谱数据以及所述多组农产品的高光谱数据对应的多个产地信息;其中,所述多组农产品的高光谱数据与所述多个产地信息一一对应;
29.根据所述高光谱数据确定感兴趣区域平均光谱值;
30.根据所述感兴趣区域平均光谱值生成光谱训练集、光谱验证集和光谱测试集;
31.根据所述光谱训练集以及所述光谱训练集对应的产地信息对所述产地鉴别模型进行训练,根据所述光谱验证集和所述光谱测试集对所述产地鉴别模型进行调试,得到所述训练好的产地鉴别模型。
32.进一步地,所述处理模块具体用于:
33.根据所述高光谱数据确定相对反射率数据;
34.根据所述相对反射率数据确定所述感兴趣区域平均光谱值。
35.进一步地,所述处理模块还用于:
36.在所述根据所述光谱训练集以及所述光谱训练集对应的产地信息对所述产地鉴别模型进行训练之前,通过多元散射校正对所述光谱训练集、所述光谱验证集和所述光谱测试集进行预处理;
37.通过偏最小二乘回归对所述光谱训练集、所述光谱验证集和所述光谱测试集进行降维。
38.进一步地,所述处理模块具体用于:
39.按照18:2:5的比例生成所述光谱训练集、所述光谱验证集和所述光谱测试集。
40.进一步地,所述处理模块具体用于:
41.所述农产品为枸杞;所述多个产地信息包含宁夏、青海、内蒙古、新疆、甘肃、河南以及河北。
42.第三方面,本发明还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的产地鉴别的方法。
43.第四方面,本发明还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所述的产地鉴别的方法。
44.由上述技术方案可知,本发明提供的产地鉴别的方法、装置、电子设备及存储介质,通过建立产地鉴别模型降低了人工识别成本,提高了鉴别的效率、准确性。
附图说明
45.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。
46.图1为本发明提供的产地鉴别的方法的系统框架;
47.图2为本发明提供的产地鉴别的方法的流程示意图;
48.图3为本发明提供的产地鉴别的方法的示意图;
49.图4为本发明提供的产地鉴别的方法的流程示意图;
50.图5为本发明提供的产地鉴别的方法的光谱图;
51.图6为本发明提供的产地鉴别的装置的结构示意图;
52.图7为本发明提供的电子设备的结构示意图。
具体实施方式
53.下面结合附图,对本发明的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
54.本发明实施例提供的产地鉴别的方法,可以适用于如图1所示的系统架构中,该系统架构包括高光谱成像仪100、服务器200。
55.具体的,高光谱成像仪100用于获取待测农产品的高光谱数据。
56.在一种可能的实施方式中,本发明实施例采用可见光以及近红外光。
57.举例来说,高光谱成像仪的镜头采用400nm至1000nm镜头。
58.服务器200用于将待测农产品的高光谱数据输入至训练好的产地鉴别模型,得到待测农产品的产地鉴别结果。
59.本发明实施例中,训练好的产地鉴别模型为利用与不同产地的农产品对应的高光谱数据进行训练后得到。
60.需要说明的是,图1仅是本发明实施例系统架构的一种示例,本发明对此不做具体限定。
61.基于上述所示意的系统架构,图2为本发明实施例提供的一种产地鉴别的方法所对应的流程示意图,如图2所示,该方法包括:
62.步骤201,获取待测农产品的高光谱数据。
63.本发明实施例中,如图3所示,采用高光谱成像仪进行光谱扫描。
64.在一种可能的实施方式中,本发明实施例针对可见光以及近红外光进行高光谱成像。
65.需要说明的是,近红外光是介于可见光和中红外光之间的电磁波。
66.在一种可能的实施方式中,本发明实施例搜集400nm至1000nm 的高光谱数据。
67.需要说明的是,还可以搜集580nm至2500nm波长范围的高光谱数据,本发明实施例对此不做具体限定。
68.举例来说,光谱扫描的条件为:高光谱成像仪的镜头与农产品的距离为19cm;传送带所在平台的移动速度为0.45cm/s;采用400nm 至1000nm镜头时,积分时间为9.7ms。
69.进一步地,本发明实施例中,光谱扫描的次数为多次,比如50 次,每次搜集400nm至1000nm的高光谱数据,再取平均得到高光谱数据。
70.上述方案,通过多次光谱扫描取平均,提高了待测农产品的高光谱数据的准确性。
71.步骤202,将待测农产品的高光谱数据输入至训练好的产地鉴别模型,得到待测农产品的产地鉴别结果。
72.需要说明的是,其中,训练好的产地鉴别模型为利用与不同产地的农产品对应的高光谱数据进行训练后得到。
73.以农产品为枸杞举例,产地鉴别结果可以为宁夏中宁县宁杞5号、青海都兰县宁杞7号、内蒙古巴彦淖尔乌拉特前旗宁杞5号、新疆精河县精杞1号、甘肃瓜州县宁杞5号等。
74.上述方案,通过采用产地鉴别模型提高了产地鉴别的准确性,降低了人工识别的成本。
75.本发明实施例在步骤202之前,方法流程如图4所示,具体步骤流程为:
76.步骤401,获取多组农产品的高光谱数据以及多组农产品的高光谱数据对应的多个产地信息。
77.需要说明的是,其中,多组农产品的高光谱数据与多个产地信息一一对应。
78.具体的,对不同产地的农产品进行光谱扫描。
79.本发明实施例中,如图3所示,多组农产品放置在背景板上,背景板和白板放置在传送带上,溴钨灯照亮多组农产品,高光谱成像仪的镜头对多组农产品进行光谱扫描得到高光谱数据并将高光谱数据发送至计算机。
80.进一步地,本发明实施例中,光谱扫描的次数为多次,比如50 次,每次搜集400nm至1000nm的高光谱数据,再取平均得到高光谱数据。
81.上述方案,通过多次光谱扫描取平均,提高了高光谱数据的准确性。
82.在一种可能的实施方式中,农产品为枸杞;多个产地信息包含宁夏、青海、内蒙古、新疆、甘肃、河南以及河北。
83.需要说明的是,农产品还可以为牛肉、羊肉等,产地信息还包含天津、北京等,本发明实施例对此不做具体限定。
84.步骤402,根据高光谱数据确定感兴趣区域平均光谱值。
85.步骤403,根据感兴趣区域平均光谱值生成光谱训练集、光谱验证集和光谱测试集。
86.本发明实施例中,将感兴趣区域平均光谱值分割成三部分,记为光谱训练集、光谱验证集和光谱测试集。
87.在一种可能的实施方式中,按照18:2:5的比例生成光谱训练集、光谱验证集和光谱测试集。
88.需要说明的是,还可以按照16:3:5的比例生成光谱训练集、光谱验证集和光谱测
试集,本发明实施例对此不做具体限定。
89.具体的,通过python的sklearn库中的train_test_split函数,将光谱扫描的数据分成三份,按比例进行光谱训练集、光谱验证集和光谱测试集随机分组。
90.步骤404,根据光谱训练集以及光谱训练集对应的产地信息对产地鉴别模型进行训练,根据光谱验证集和光谱测试集对产地鉴别模型进行调试,得到训练好的产地鉴别模型。
91.在一种可能的实施方式中,基于softmax模型建立产地鉴别模型。
92.需要说明的是,softmax回归模型是logistic回归模型在多分类问题上的推广。
93.具体的,本发明实施例提供的产地鉴别模型预测待测农产品的产地的概率,把预测概率最大的产地作为待测农产品的产地鉴别结果,若其与待测农产品对应的真实产地一致,则说明预测正确。
94.本发明实施例中,根据光谱训练集得到的主要光谱信息与对应的产地信息通过softmax进行建模,通过光谱验证集与光谱测试集调试模型,由训练好的产地鉴别模型进行农产品的产地鉴别。
95.本发明实施例在步骤402中,根据高光谱数据确定相对反射率数据。
96.在一种可能的实施方式中,将多组农产品的高光谱数据进行黑白矫正,得到相对反射率数据。
97.进一步地,黑白校正的具体计算公式如下:
[0098][0099]
需要说明的是,其中,i
new
表示经过校正后的图像的相对反射率, i
raw
表示原始图像的能量值,i
dark
表示黑板图像的能量值,i
whit
表示白板图像的能量值。
[0100]
上述方案,通过黑白矫正对多组农产品的高光谱数据进行去噪,提高了产地鉴别模型预测的准确性。
[0101]
进一步地,根据相对反射率数据确定感兴趣区域平均光谱值。
[0102]
本发明实施例中,对相对反射率数据进行感兴趣区域提取,然后计算得到感兴趣区域平均光谱值。
[0103]
举例来说,农产品为枸杞的情况下,提取的感兴趣区域是枸杞部分的光谱数据。
[0104]
本发明实施例在步骤404之前,通过多元散射校正对光谱训练集、光谱验证集和光谱测试集进行预处理。
[0105]
需要说明的是,多元散射校正可以有效的消除由于散射水平不同带来的光谱差异,从而增强光谱与数据之间的相关性。通过理想光谱修正光谱数据的基线平移和偏移现象,在实际应用中,无法获取真正的理想光谱数据,因此常常假设所有光谱数据的平均值作为理想光谱。
[0106]
具体的,求得光谱数据的平均值,将每个农产品的光谱与平均光谱进行一元线性回归,求解得到每个农产品的基线平移量和偏移量,减去基线平移量后除以偏移量,得到校正后的光谱数据。
[0107]
进一步地,具体的计算公式如下:
[0108][0109]
需要说明的是,原始光谱数据维度为m*n,m代表农产品个数, n代表光谱采集所用的波长点数。公式表示农产品的平均光谱,χ
i
是 1
×
n维矩阵,表示单个农产品光谱矢量,w
i
和b
i
分别表示各农产品近红外光谱χ
i
与平均光谱a进行一元线性回归后得到的相对偏移系数和平移量。
[0110]
上述方案,通过多元散射校正对光谱训练集、光谱验证集和光谱测试集进行预处理减少了干扰数据,提高了产地鉴别模型预测的准确性。
[0111]
需要说明的是,还可以通过归一化、卷积平滑法、标准正态变量、小波变换、正交信号校正等方法进行光谱训练集、光谱验证集和光谱测试集的预处理,本发明实施例对此不做具体限定。
[0112]
进一步地,通过偏最小二乘回归对光谱训练集、光谱验证集和光谱测试集进行降维。
[0113]
需要说明的是,偏最小二乘回归是通过投影分别将预测变量和观测变量投影到一个新空间,来寻找一个线性回归模型。采用matlab 进行偏最小二乘回归降维。
[0114]
具体的,从自变量集合x中提取成分t
h
(h=1,2,

),各成分间相互独立。随后建立提取成分t
h
与因变量y之间的回归方程。
[0115]
上述方案,通过偏最小二乘回归对光谱训练集、光谱验证集和光谱测试集进行降维,去除了干扰的同时实现了高效计算。
[0116]
需要说明的是,还可以通过线性判别分析(lda)、主成分分析 (pca)对光谱训练集、光谱验证集和光谱测试集进行降维,本发明实施例对此不做具体限定。
[0117]
上述方案,通过建立产地鉴别模型降低人工识别成本的同时提高了鉴别的效率、准确性。
[0118]
进一步地,以枸杞举例,图5为不同产地的枸杞光谱曲线,图中 nx、qh、nm、xj、gs分别表示宁夏中宁县宁杞5号、青海都兰县宁杞7号、内蒙古巴彦淖尔乌拉特前旗宁杞5号、新疆精河县精杞1 号、甘肃瓜州县宁杞5号的光谱曲线。
[0119]
基于同一发明构思,图6示例性的示出了本发明实施例提供的一种产地鉴别的装置,该装置可以为一种产地鉴别的方法的流程。
[0120]
所述装置,包括:
[0121]
获取模块601,用于获取待测农产品的高光谱数据;
[0122]
处理模块602,用于将所述待测农产品的高光谱数据输入至训练好的产地鉴别模型,得到所述待测农产品的产地鉴别结果;其中,所述训练好的产地鉴别模型为利用与不同产地的农产品对应的高光谱数据进行训练后得到。
[0123]
进一步地,所述处理模块602还用于:
[0124]
在所述将所述待测农产品的高光谱数据输入至训练好的产地鉴别模型,得到所述待测农产品的产地鉴别结果之前,获取多组农产品的高光谱数据以及所述多组农产品的高光谱数据对应的多个产地信息;其中,所述多组农产品的高光谱数据与所述多个产地信息一一对应;
[0125]
根据所述高光谱数据确定感兴趣区域平均光谱值;
[0126]
根据所述感兴趣区域平均光谱值生成光谱训练集、光谱验证集和光谱测试集;
[0127]
根据所述光谱训练集以及所述光谱训练集对应的产地信息对所述产地鉴别模型进行训练,根据所述光谱验证集和所述光谱测试集对所述产地鉴别模型进行调试,得到所述训练好的产地鉴别模型。
[0128]
进一步地,所述处理模块602具体用于:
[0129]
根据所述高光谱数据确定相对反射率数据;
[0130]
根据所述相对反射率数据确定所述感兴趣区域平均光谱值。
[0131]
进一步地,所述处理模块602还用于:
[0132]
在所述根据所述光谱训练集以及所述光谱训练集对应的产地信息对所述产地鉴别模型进行训练之前,通过多元散射校正对所述光谱训练集、所述光谱验证集和所述光谱测试集进行预处理;
[0133]
通过偏最小二乘回归对所述光谱训练集、所述光谱验证集和所述光谱测试集进行降维。
[0134]
进一步地,所述处理模块602具体用于:
[0135]
按照18:2:5的比例生成所述光谱训练集、所述光谱验证集和所述光谱测试集。
[0136]
进一步地,所述处理模块602具体用于:
[0137]
所述农产品为枸杞;所述多个产地信息包含宁夏、青海、内蒙古、新疆、甘肃、河南以及河北。
[0138]
基于相同的发明构思,本发明实施例提供了一种电子设备,参见图7,所述电子设备具体包括如下内容:处理器701、存储器702、通信接口703和通信总线704;
[0139]
其中,所述处理器701、存储器702、通信接口703通过所述通信总线704完成相互间的通信;所述通信接口703用于实现各设备之间的信息传输;
[0140]
所述处理器701用于调用所述存储器702中的计算机程序,所述处理器执行所述计算机程序时实现上述产地鉴别的方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:获取待测农产品的高光谱数据;将所述待测农产品的高光谱数据输入至训练好的产地鉴别模型,得到所述待测农产品的产地鉴别结果;其中,所述训练好的产地鉴别模型为利用与不同产地的农产品对应的高光谱数据进行训练后得到。
[0141]
基于相同的发明构思,本发明又一实施例提供了一种非暂态计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述产地鉴别的方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:获取待测农产品的高光谱数据;将所述待测农产品的高光谱数据输入至训练好的产地鉴别模型,得到所述待测农产品的产地鉴别结果;其中,所述训练好的产地鉴别模型为利用与不同产地的农产品对应的高光谱数据进行训练后得到。
[0142]
此外,上述的存储器中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,用户生活模式预测装置,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom, read

only memory)、随机存取存储器(ram,random accessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0143]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0144]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,用户生活模式预测装置,或者网络设备等)执行各个实施例或者实施例的某些部分所述的用户生活模式预测方法。
[0145]
此外,在本发明中,诸如“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0146]
此外,在本发明中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0147]
此外,在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0148]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可
以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1