基于改进深度森林算法的肉类新鲜度无损检测方法及系统

文档序号:32604640发布日期:2022-12-17 19:32阅读:33来源:国知局
基于改进深度森林算法的肉类新鲜度无损检测方法及系统

1.本发明涉及肉类新鲜度检测技术领域,尤其涉及一种基于改进深度森林算法的肉类新鲜度无损检测方法及系统。


背景技术:

2.羊肉因其含有丰富的营养物质,已经成为了人们饮食中重要的组成部分,羊肉品质的管理和监测也受到了人们的高度关注。羊肉品质会受到自身成分、贮藏环境和微生物的相互作用发生腐败变质现象,给羊肉食品的品质和安全带来极大的影响,使得羊肉新鲜度检测成为肉类食品监测和管理的重要内容之一。羊肉品质的传统检测方法以感官评价和实验室检测为主,感官检测通过视觉、嗅觉和剪切力度等方法分析样本色泽、气味和嫩度判断新鲜度,但受主观影响较大且缺乏对样本内部成分变化的准确判断;实验室检测可以分析出样本内部成分,但操作复杂,实验周期较长,且需要破坏样本,不易实现快速检测。


技术实现要素:

3.本发明通过提供一种基于改进深度森林算法的肉类新鲜度无损检测方法及系统,通过构建冷鲜羊肉多层级联新鲜度评价深度森林模型,实现了对肉类新鲜度的无损检测。
4.本发明提供了一种基于改进深度森林算法的肉类新鲜度无损检测方法,包括:
5.获取肉类光谱图像;
6.对所述肉类光谱图像进行预处理;
7.将所述预处理后的光谱图像输入到预先构建好的多层级联新鲜度评价深度森林模型中,得到肉类新鲜度检测结果;其中,在所述深度森林模型的每一层之间增加上一层候选特征筛选与层增长控制机制。
8.具体来说,所述对所述肉类光谱图像进行预处理,包括:
9.对所述肉类光谱图像进行s-g平滑滤波和多元散射校正处理。
10.具体来说,所述特征筛选根据不同的度量指标计算每一层随机森林输出的置信度;通过比较置信度,重新组成特征输入到下一层中。
11.具体来说,所述层增长控制机制,包括:
12.当通过所述特征筛选得到所述深度森林模型的第t层的输出h
t
之后,根据度量指标m计算该层的度量值q[t];若q[t]大于性能最好的度量值q
best
,则更新q
best
值;若q[t]连续三次小于q
best
并且t在模型最大深度t的范围内,则停止层的增长,同时保留包括q
best
所在的层与该层前面的所有层,并删除该层后面的所有层。
[0013]
本发明还提供了一种基于改进深度森林算法的肉类新鲜度无损检测系统,包括:
[0014]
光谱图像获取模块,用于获取肉类光谱图像;
[0015]
光谱图像预处理模块,用于对所述肉类光谱图像进行预处理;
[0016]
新鲜度评价模块,用于将所述预处理后的光谱图像输入到预先构建好的多层级联新鲜度评价深度森林模型中,得到肉类新鲜度检测结果;其中,在所述深度森林模型的每一
层之间增加上一层候选特征筛选与层增长控制机制。
[0017]
具体来说,所述光谱图像预处理模块,具体用于对所述肉类光谱图像进行s-g平滑滤波和多元散射校正处理。
[0018]
具体来说,所述特征筛选根据不同的度量指标计算每一层随机森林输出的置信度;通过比较置信度,重新组成特征输入到下一层中。
[0019]
具体来说,所述层增长控制机制,包括:
[0020]
当通过所述特征筛选得到所述深度森林模型的第t层的输出h
t
之后,根据度量指标m计算该层的度量值q[t];若q[t]大于性能最好的度量值q
best
,则更新q
best
值;若q[t]连续三次小于q
best
并且t在模型最大深度t的范围内,则停止层的增长,同时保留包括q
best
所在的层与该层前面的所有层,并删除该层后面的所有层。
[0021]
本发明中提供的一个或多个技术方案,至少具有如下技术效果或优点:
[0022]
本发明通过构建layer-by-layer多层级联的深度森林模型。模型第一层随机森林的输入与模型的输入一致,为经过预处理的冷鲜羊肉样本高光谱成像数据,经过计算形成不同的候选特征空间,为保证原始特征,与预处理后的样本高光谱数据拼接共同作为下一层的输入,模型的输出为新鲜度等级概率。为了充分挖掘多个新鲜度评价指标的相关性,在深度森林的每一层之间增加了上一层候选特征筛选与层增长控制机制,在充分挖掘样本的多个新鲜度指标相关性的同时确定模型的层数来降低模型过拟合的风险,达到控制模型复杂度的目的。
附图说明
[0023]
图1为本发明实施例提供的基于改进深度森林算法的肉类新鲜度无损检测方法的流程图;
[0024]
图2为本发明实施例中的特征筛选图;
[0025]
图3为本发明实施例提供的基于改进深度森林算法的肉类新鲜度无损检测系统的模块图;
[0026]
图4为本发明实施例中各新鲜度等级冷鲜羊肉样本照片;
[0027]
图5为本发明实施例中实验样本原始光谱dn值曲线图;
[0028]
图6为本发明实施例中预处理后的光谱反射率曲线图;
[0029]
图7为本发明实施例中提取特征波段曲线图;
[0030]
图8为本发明实施例中冷鲜羊肉样本标记图;
[0031]
图9为本发明实施例中的深度森林模型在训练集上的分类结果图;
[0032]
图10为本发明实施例中的深度森林模型在测试集上的分类结果图。
具体实施方式
[0033]
本发明实施例通过提供一种基于改进深度森林算法的肉类新鲜度无损检测方法及系统,通过构建冷鲜羊肉多层级联新鲜度评价深度森林模型,实现了对肉类新鲜度的无损检测。
[0034]
本发明实施例中的技术方案为实现技术效果,总体思路如下:
[0035]
1)先将冷鲜羊肉样本分成三组样本,分别对应理化试验指标测定、微生物试验指
标测定和采集高光谱成像数据作为试验样本。
[0036]
2)选取一组冷鲜羊肉样本测定理化试验指标tvb-n与ph,用半微量凯氏定氮法测定样本的tvb-n含量,使用非均值化试样测定方法检测样本的ph。
[0037]
3)在另外两组羊肉样本中选取一组测定微生物试验指标tac和anc,得到单位质量菌落总数标准值测定样本tac含量,使用单位质量大肠杆菌近似数测定样本anc含量。
[0038]
4)选取最后一组羊肉样本,利用高光谱成像技术采集每个样本在400~1000nm波长下的高光谱反射图像并生成bil文件。
[0039]
5)使用envi软件打开bil文件查看图像,选取感兴趣区域,分别提取这n个样本的光谱反射曲线,计算并保存感兴趣区域内的样本高光谱图像的像素灰度值。
[0040]
6)对保存的羊肉原始光谱数据进行预处理,采用s-g平滑滤波法消除原始光谱数据中的噪声,采用多元散射校正方法消除基线偏移现象。
[0041]
7)对预处理后的光谱数据使用连续投影法提取特征波段,结合每个样本对应的新鲜度评价指标建立多层级联新鲜度评价深度森林模型。
[0042]
8)根据多标记评价指标hamming loss、one-error、ranking loss和macro-auc对多层级联新鲜度评价深度森林模型进行性能评价。
[0043]
9)将提取出的光谱数据输入到多层级联新鲜度评价深度森林模型进行新鲜度评价。
[0044]
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
[0045]
参见图1,本发明实施例提供的基于改进深度森林算法的肉类新鲜度无损检测方法,包括:
[0046]
步骤s110:获取肉类光谱图像;
[0047]
步骤s120:对肉类光谱图像进行预处理;
[0048]
对本步骤进行具体说明,对肉类光谱图像进行预处理,包括:
[0049]
对肉类光谱图像进行s-g平滑滤波和多元散射校正处理。
[0050]
步骤s130:将预处理后的光谱图像输入到预先构建好的多层级联新鲜度评价深度森林模型中,得到肉类新鲜度检测结果;其中,在深度森林模型的每一层之间增加上一层候选特征筛选与层增长控制机制。
[0051]
具体地,特征筛选根据不同的度量指标计算每一层随机森林输出的置信度;通过比较置信度,重新组成特征输入到下一层中。
[0052]
进一步具体来说,假设深度森林模型中每一层的输出为h
t
,该值由若干森林的输出拼接得到,通过森林数量对h
t
求平均值得到该层的预测概率矩阵p,p的行数为样本数,p的列数为标记数。当度量指标基于实例时,把矩阵p的每一行元素按照从大到小排序;当度量指标基于标记时,把矩阵p的每一列元素按照从大到小排序。
[0053]
hamming loss用来判断p上的分类是否正确。假设阈值θ=0.5,若p
ij
>0.5,则预测结果为1,该值越大,证明预测为1的概率越大,故置信度越大;若p
ij
≤0.5,则预测结果为0,该值越小,证明预测为0的概率越大,故置信度越大。因此,hamming loss置信度αj可以定义为:
[0054][0055]
其中,n为样本数,p
ij
为第i个样本在第j个标记上的模型预测概率,
[0056]
one-error用来判断相关标记中预测的最大概率,故one-error置信度可以定义为预测最大概率值:
[0057]
αi=max p
ij
[0058]
ranking loss用来判断样本的所有标记的排列顺序,当ranking loss为0时,模型性能最佳,故在定义置信度时,需要列出ranking loss为0时的各种组合。若存在4个标记,则可能的组合有{0000,1000,1100,1110,1111}五种,通过计算这些组合的概率之和得到ranking loss置信度。
[0059][0060]
其中,q为标记总数,p
ik
为第i个样本在第k个标记上的模型预测概率。
[0061]
macro-auc用来判断标记上所有样本的排列顺序,与ranking loss类似,当macro-auc为1时,模型性能最佳,故在定义置信度时,需要列出macro-auc为1时的各种组合,计算这些组合的概率之和,得到macro-auc置信度:
[0062][0063]
其中,n为样本数,p
kj
为第k个样本在第j个标记上的模型预测概率。
[0064]
通过置信度对特征进行筛选,表1为特征筛选过程。
[0065]
表1特征筛选过程
[0066]
[0067][0068]
假设训练集为x,标记集为y,指定一个度量指标m,第t层的随机森林输出为h
t
,度量值为第t层的阈值为θ
t
。将h
t
的值赋给g
t
,g
t
用来表示一组新的特征。若度量是基于标记的,则对于某一标记的所有实例,计算其置信度若度量是基于实例的,则对于某一实例的所有标记,计算其置信度如果置信度小于阈值θ
t
,则将g
t
中对应的元素替换成上一层的特征表示g
t-1
中的对应元素,如图2所示。
[0069]
根据森林的输出h
t
和标记集y计算当前层的度量值,在计算度量值时也需要将基于实例的度量和基于标记的度量分开计算。每一层的阈值将由该层的度量值和置信度决定,若当前层特征上的度量值小于前一层特征上的度量值,则将当前层特征上的置信度存储到集合s中,最后对s中的置信度求平均值作为当前层的阈值。
[0070]
层增长控制机制,包括:
[0071]
对于每一组数据,使用其他所有组的数据进行训练,并对当前组数据进行预测。表2为层增长控制流程,假设深度森林模型的最大深度为t,训练集为x,标记集为y,度量指标为m,以及包含每层度量值的数组q,其中性能最好的度量值定义为q
best
。当通过特征筛选得到深度森林模型的第t层的输出h
t
之后,根据度量指标m计算该层的度量值q[t];若q[t]大于性能最好的度量值q
best
,则更新q
best
值;若q[t]连续三次小于q
best
并且t在模型最大深度t的范围内,则停止层的增长,同时保留包括q
best
所在的层与该层前面的所有层,并删除该层后面的所有层。
[0072]
表2层增长控制流程
[0073][0074]
[0075]
参见图3,本发明实施例提供的基于改进深度森林算法的肉类新鲜度无损检测系统,包括:
[0076]
光谱图像获取模块100,用于获取肉类光谱图像;
[0077]
光谱图像预处理模块200,用于对所述肉类光谱图像进行预处理;
[0078]
具体地,光谱图像预处理模块200,具体用于对所述肉类光谱图像进行s-g平滑滤波和多元散射校正处理。
[0079]
新鲜度评价模块300,用于将所述预处理后的光谱图像输入到预先构建好的多层级联新鲜度评价深度森林模型中,得到肉类新鲜度检测结果;其中,在深度森林模型的每一层之间增加上一层候选特征筛选与层增长控制机制。其中,特征筛选根据不同的度量指标计算每一层随机森林输出的置信度;通过比较置信度,重新组成特征输入到下一层中。层增长控制机制,包括:当通过特征筛选得到深度森林模型的第t层的输出h
t
之后,根据度量指标m计算该层的度量值q[t];若q[t]大于性能最好的值q
best
,则更新q
best
值;若q[t]连续三次小于q
best
并且t在模型最大深度t的范围内,则停止层的增长,同时保留包括q
best
所在的层与该层前面的所有层,并删除该层后面的所有层。
[0080]
下面通过具体实施例对本方法及系统进行具体说明:
[0081]
1)试验材料
[0082]
试验所用的冷鲜羊肉样本取自内蒙古锡林郭勒盟苏尼特右旗农贸市场,选择屠宰后经过排酸的5只羊酮体里脊部位,去除脂肪和结缔组织,均匀分割成6cm
×
6cm
×
1cm的肉片,用保鲜袋分3组密封包装、并编号,无挤压放置在温度为4℃的冰箱中,存放14天。每隔24小时取一次样本,在室内放置25分钟,挥发掉样本表面的水分,用于挥发性盐基氮(total volatile basic nitrogen,tvb-n)、酸碱度(ph值)、菌落总数(total aerobic count,tac)、大肠菌群近似数(approximate number of coliforms,anc)测定和光谱反射率采集,试验样本覆盖了新鲜、次新鲜和不新鲜三个冷鲜羊肉新鲜度等级,如图4所示,新鲜羊肉表面有光泽,肉细而紧密;不新鲜羊肉表面无光泽,肉色深暗,肉质松弛无弹性;次新鲜为过渡阶段,无论表面情况或触摸手感均处于新鲜与不新鲜之间。
[0083]
2)新鲜度指标实验室测定
[0084]
在本试验中,样品的tvb-n含量依据gb/5009.228-2016《食品安全国家标准食品中挥发性盐基氮的测定》中的半微量凯氏定氮法测定,ph值依据gb/5009.237-2016《食品安全国家标准食品ph值的测定》中的非均值化试样测定法测定,tac含量依据gb/4789.2-2016《食品安全国家标准食品微生物学检验菌落总数测定》中单位质量菌落总数标准值进行检测试验。anc含量依据gb/4789.3-2016《食品安全国家标准食品微生物学检验大肠菌群计数》中单位质量大肠菌群数标准值进行检测试验。根据国家食品卫生监测标准和以往的研究成果,当tvb-n≤15mg/100g时,为新鲜肉;当15mg/100g《tvb-n≤
[0085]
25mg/100g时,为次鲜肉;当tvb-n》25mg/100g时,为不新鲜肉。目前,我国食品卫生检测标准中尚未制定冷鲜羊肉的菌落总数、ph和大肠菌群近似数指标,本实施例以tvb-n作为主要指标,通过比较tac、ph值和anc指标测量值共同确定样本的新鲜度等级。
[0086]
3)样本光谱数据采集与预处理
[0087]
高光谱采集系统包括照明设备、机械扫描平台、高光谱成像仪(hyperspec vnir n-series)、反射参考板和图像采集软件,光谱仪可采集的波长范围在400~1000nm,共有
750个光谱通道,分辨率为2.8nm。
[0088]
每次试验时,提前30min打开光谱仪预热,将样本放置在光谱仪镜头约40cm处,设置像元混合次数为6次,光谱仪曝光时间为3ms,调节光谱像元亮度(dn)值小于8500。试验时,利用调焦板调节光谱仪,设置光谱仪扫描方向、次数和移动速度,采集黑白校正光谱图像,用于获取样本校正光谱数据。利用envi软件,从样本的每一个光谱图像中选择20个感兴趣点作为特征提取和校正模型建立试验数据。图5为实验样本原始光谱dn值曲线图。
[0089]
黑白校正后的光谱数据仍存在部分噪声且光谱强度有差异,需要对其进行预处理,因此,实验过程中采用卷积平滑法(savitzky-golay)进行平滑滤波,再采用多元散射校正对平滑滤波后的光谱数据进行处理,消除光谱中的基线平移或偏移现象,提高光谱信噪比,用于后期的特征提取和分类识别。经过平滑滤波和散射校正后的光谱反射率曲线如图6所示。
[0090]
4)样本光谱数据特征提取
[0091]
试验采用连续投影算法对样本光谱数据进行特征提取,假设数据集x中的样本数为m,原始特征数为j,选择的第一个波段为i(0),算法在每次迭代中合并新的波段,直到集合中存在n个波段,算法流程如表3。
[0092]
表3连续投影算法
[0093][0094][0095]
若n和i(0)是未知的,则对n定义一个范围n
min
≦n≦n
max
,对每个n,需要考虑初始波
段i(0)从1到j的每一种情况,进行上述步骤计算,根据输出结果i(n)建立多元线性回归分析模型,以i(n)对应的光谱数据作为测试集,以tvb-n、ph、tac和anc含量为标记,计算均方根误差rmse,其最小值对应的i(0)和n即为最优初始波段和选择的波段数。
[0096]
试验设置特征波长个数范围为5~30,共提取了18个特征波段,如图7所示。
[0097]
5)建立评价模型
[0098]
试验采用本实施例提出的深度森林建立冷鲜羊肉多层级联新鲜度评价深度森林模型,将280个光谱样本按照3:1的比例划分为训练集和测试集,训练集和测试集样本个数分别为196个和84个,表4为训练集和测试集的新鲜、次新鲜和不新鲜样本数统计结果。
[0099]
表4冷鲜羊肉不同新鲜度样本数统计
[0100][0101]
将理化微生物实验方法测得的tvb-n、ph、tac和avc四项新鲜度评价指标按照国家食品卫生监测标准,分别划分出新鲜、次新鲜和不新鲜的区间,并组成标记,图8为建立新鲜度多层级联新鲜度评价深度森林模型所用的冷鲜羊肉样本标记。
[0102]
其中三种不同的颜色对应三个新鲜度等级,中灰色表示新鲜区间,浅灰色表示次新鲜区间,深灰色表示不新鲜区间。新鲜度多层级联新鲜度评价深度森林模型中的所有标记均按照此规则产生,若将其视为一个长度为12的数组z。当样本新鲜度为新鲜时,中灰色单元格所在的标记为属于该样本的标记,其数组为[1,0,0,1,0,0,1,0,0,1,0,0];当样本新鲜度为次新鲜时,浅灰色单元格所在的标记为属于该样本的标记,其数组为[0,1,0,0,1,0,0,1,0,0,1,0];当样本新鲜度为不新鲜时,深灰色单元格所在的标记为属于该样本的标记,其数组为[0,0,1,0,0,1,0,0,1,0,0,1]。
[0103]
在新鲜度评价过程中,若四项新鲜度评价指标含量都处于新鲜区间,则表明样本为新鲜;若其中一项或多项处于次新鲜区间,则表明样本为次新鲜;若其中一项或多项处于不新鲜区间,则表明样本为不新鲜。
[0104]
试验建立的深度森林参数设置如下,将最大层数设置为10,每层的森林数为2,分别为pct组成的一个随机森林和一个极端随机森林,其中每一个森林设置5棵树,后面的每一层都比前一层多5棵树,该方法可以保证模型在每一层都能学习到不同的表示。同理,森林的最大深度为3,后面的每一层都比前一层的森林最大深度多3个单位。最后设置5折交叉验证以防止过拟合。
[0105]
6)新鲜度评价
[0106]
本试验使用hamming loss、one-error、ranking loss和macro-auc四个度量指标对冷鲜羊肉多层级联新鲜度评价深度森林模型进行评价。将本实施例提出的深度森林评价模型与ml-knn,rf-pct相比较,其在测试集上的各项度量指标如表5所示。
[0107]
表5不同多标记分类算法下建立的冷鲜羊肉新鲜度评价模型性能
[0108][0109]
试验设置ml-knn模型参数k值为10。rf-pct模型中,设置森林最大深度为3,树的总数为100。试验分别在以上算法中,记录了10次测试集的度量值和偏差,并取平均度量值用于模型性能比较。由表可知,本实施例提出的深度森林评价模型在每个度量指标上均优于ml-knn和rf-pct,验证了多指标新鲜度评价模型在冷鲜羊肉高光谱数据集上的有效性。
[0110]
图9、10分别为深度森林模型在训练集和测试集上的分类结果图,其中横坐标表示样本数,纵坐标表示分类值,纵坐标上的“1”,“2”,“3”分别代表新鲜、次新鲜和不新鲜三个新鲜度等级,“o”表示样本的实际新鲜度等级,“+”表示模型预测结果。从图中可以看出模型取得了较好的分类结果。由本发明提出的深度森林模型得到的冷鲜羊肉新鲜度分类结果混淆矩阵如表6所示。
[0111]
表6冷鲜羊肉新鲜度分类结果混淆矩阵
[0112][0113]
本试验以冷鲜羊肉为研究对象,以高光谱成像技术为检测方法,以tvb-n、ph、tac和anc为冷鲜羊肉新鲜度评价指标,通过提取冷鲜羊肉样本高光谱图像的感兴趣点,并采用平滑滤波法和多元散射校正法对原始光谱图像进行预处理。使用连续投影法提取光谱的特征波段,利用基于pct的随机树构造冷鲜羊肉多层级联新鲜度评价深度森林模型,实现了多指标冷鲜羊肉新鲜度的无损检测,模型识别准确率达到98.57%。利用hamming loss、one-error、ranking loss和macro-auc等度量指标筛选每层计算得到的特征信息,控制模型的复杂度,并通过试验与其他多标记分类算法ml-knn、rf-pct进行比较。结果表明,本发明实施例提出的深度森林模型在冷鲜羊肉高光谱数据集上分类效果更好,证明了深度森林用于多指标冷鲜羊肉新鲜度分类上的有效性和可适用性。
[0114]
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0115]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0116]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0117]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0118]
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
[0119]
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1