一种基于流判别模型的奶粉掺杂非定向检测方法

文档序号:30848235发布日期:2022-07-23 03:42阅读:95来源:国知局
一种基于流判别模型的奶粉掺杂非定向检测方法

1.本发明涉及食品安全检测技术领域,更具体的说是涉及奶粉掺杂非定向检测的拉曼高光谱成像流判别模型及方法。


背景技术:

2.奶粉产品作为一种优质的营养源,是目前人类饮食中重要的组成部分。然而奶粉产品却面临着经济利益驱动的掺杂行为威胁,食品安全事件层出不穷,特别是以三聚氰胺、大头奶粉为代表的奶粉掺杂事件,不仅对婴幼儿的健康造成严重危害,还严重打击了国产乳制品产业的整体声誉,至今尚没有完全恢复。因此,必须对奶粉掺杂行为进行严格的监管。
3.奶粉掺杂检测是奶粉质量安全监管的重要环节,目前主要依赖于定向检测方法,即针对已知的掺杂物按照国标方法进行穷举筛查。相关定向检测方法大都为实验室标准分析方法,面临的最大挑战是如何筛查未知的掺杂物信息,这些掺杂物可能源自数百万种化合物中任何潜在的一种。相关检测方法需要大量的样品前处理过程,检测流程繁琐、昂贵且低效,难以有效满足当前严峻的奶粉质量安全形势。此外,当前奶粉安全的定向检测方法的检测范围有限,难以识别千变万化的未知掺杂物,导致现有奶粉安全监管体系存在一定的监管盲区。因此,基于知识挖掘的食品安全非定向检测方法应运而生,代表着食品安全检测的最新发展方向。
4.目前非定向检测方法发展仍处于初级阶段, 主要依赖于色谱-质谱联用法,依旧无法摆脱需构建海量质谱数据库以推导后续可能存在的未知化合物种类的传统模式,依旧存在费时、费力、费用高、专业要求高且数据挖掘困难等问题,导致当前的非定向检测依旧依赖于掺杂物质数据库的先验知识,难以有效覆盖未知掺杂物质范围,更难以满足数以百万吨的奶粉安全现场筛查需求;此外,非定向检测模型的建立过程存在诸多不可控因素,导致模型迁移效率低,难以在当前奶粉掺杂大数据应用场景下实现广泛适配。
5.因此,如何提供一种效率高识别准确的基于流判别模型的奶粉掺杂非定向检测方法是本领域技术人员亟需解决的问题。


技术实现要素:

6.有鉴于此,本发明提供了一种基于流判别模型的奶粉掺杂非定向检测方法,有效克服传统定向检测方法的效率低、覆盖范围窄、费用高、操作繁琐等问题,有望应用于海量奶粉的真实性监管。
7.为了实现上述目的,本发明采用如下技术方案:一种基于流判别模型的奶粉掺杂非定向检测方法,包括以下步骤:采用拉曼高光谱成像技术,逐点或逐行扫描样本,采集待测奶粉的光谱信息和空间分布信息进行融合后得到拉曼高光谱信息;将所述拉曼高光谱信息输入至训练好的流判别模型获取对应的对数似然值,若所得到的对数似然值大于训练好的流判别模型的深层空
间判别边界,则判断当前待测奶粉为有掺杂样本,若小于训练好的流判别模型的深层空间判别边界,则判断当前待测奶粉为正常样本;其中,所述流判别模型的训练过程包括:s1.设置可信样本,形成训练集,并针对每个所述可信样本获取光谱信息和空间信息并进行融合,对应获得每个所述可信样本的图谱合一的拉曼高光谱信息;s2.构建流判别模型,通过所述流判别模型的转移函数f分别获取每个拉曼高光谱信息对应的特征数据f(x),根据所述特征数据f(x)计算每个可信样本对应的拉曼高光谱的概率密度;s3.分别采用刚性变换通道和耦合变换通道提取光谱特征,并在每层网络之间交换刚性通道与耦合通道的顺序并进行耦合操作,经过多次耦合操作后,得到样本最终特征;s4. 对于所述训练集中的每个训练样本,每次得到所述样本最终特征后计算其在特征空间上的负对数似然值,并按负对数似然梯度下降方向对模型参数进行更新;s5.重复s2-s4的内容进行迭代训练,直至所述训练集的平均负对数似然值的波动处于稳定阈值范围内,则停止迭代,完成流判别模型的训练,并将所述训练集上最大的对数似然值作为深层空间判别边界。
8.优选的,s2中构建流判别模型的具体内容包括:(1)初始化分布转移函数利用多层卷积神经网络构建分布转移函数,通过随机初始化神经网络得到初始化转移函数f,转移函数f将正常样本的拉曼图像数据x映射到拉曼图像特征空间,得到特征数据f(x);(2)确定目标转移分布转移函数将原始复杂数据分布设置为简单数据分布,后续通过耦合迭代的方式有效逼近原始复杂数据的分布;其中,所述简单数据分布为标准正态分布;(3)概率计算流模型基于密度保持原理计算概率密度,样本服从正常分布的概率计算方法为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中p
normal
表示样本服从正常分布的概率,pz表示样本特征服从标准正态分布的概率,jf表示转移函数f的雅可比矩阵,具体表示为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)其中,为特征向量z的第n个维度元素对输入向量x的第n个维度元素的偏导数;(4)流判别模型训练流判别模型采用公式(1)的负对数形式作为代价函数,代价函数具体为:
ꢀꢀꢀꢀꢀꢀꢀ
(3)
其中,z为特征向量;优化方向为梯度下降方向,每次迭代沿着该优化方向更新模型的参数,从而使得转移函数能够将原始复杂数据分布变换为简单的标准正态分布,致使原始复杂数据分布边界被变换为简单的已知分布边界,用于区分可信样本与掺杂样本,即为非定向判别模型。
9.优选的,s3中的耦合操作包括以下内容:优选的,s3中的耦合操作包括以下内容:优选的,s3中的耦合操作包括以下内容:优选的,s3中的耦合操作包括以下内容:优选的,s3中的耦合操作包括以下内容:其中h表示每层耦合层所得特征,上标表示通道编号,下标表示层数,所述耦合通道包括s和t两个变换函数,其中s函数称为特征函数,t函数称为偏置函数,函数s和t函数采用深度卷积网络形式,scaling函数表示权重层,latent为对应光谱在特征空间的表示方法。
10.优选的,所述流判别模型的训练过程还包括:s6.对训练后的流判别模型进行准确性验证。
11.优选的,s1中设置的可信样本具体为满足国标要求的不同品种的可信奶粉样品。
12.优选的,通过拉曼高光谱成像仪获取多个空间点的光谱信息,空间采集范围至少满足50mm
×
50mm区域的要求,样本采样间距在1mm至5mm之间。
13.经由上述的技术方案可知,与现有技术相比,本发明公开提供一种基于流判别模型的奶粉掺杂非定向检测方法,有益效果包括:(1)本方法仅需简单的便携式拉曼高光谱成像设备即可完成奶粉掺杂的非定向筛查,样本无需前处理即可实现原位无损检测,有效避免了复杂且昂贵的实验室检测方法,极大提升了检测效率。
14.(2)本方法采用的流判别模型只需要采集质量公认的可信样本,即可构建深层可信空间边界,巧妙规避了传统掺杂检测方法需要穷举掺杂物的困境,从理论上全面覆盖所有未知掺杂物的识别范围,使得该方法同时兼备非定向筛查的高灵敏度和广谱检测能力。
15.(3)流判别模型创新性采用分布转移策略计算高维复杂拉曼高光谱概率密度,巧妙实现了深度学习训练过程的数值化分析,其模型迁移效率高,后续模型维护和更新非常简单,只需添加质量可信的新样本,即可快速自动刻画新的深层可信空间边界,有效克服了
非定向建模困难问题,具备良好的实用性。
附图说明
16.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
17.图1附图为本发明提供的流判别模型的计算流程示意图。
具体实施方式
18.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
19.本发明实施例公开了一种基于流判别模型的奶粉掺杂非定向检测方法,包括以下步骤:采用拉曼高光谱成像技术,逐点或逐行扫描样本,采集待测奶粉的光谱信息和空间分布信息进行融合后得到拉曼高光谱信息;将拉曼高光谱信息输入至训练好的流判别模型获取对应的对数似然值,若所得到的对数似然值大于训练好的流判别模型的深层空间判别边界,则判断当前待测奶粉为有掺杂样本,若小于训练好的流判别模型的深层空间判别边界,则判断当前待测奶粉为正常样本;其中,流判别模型的训练过程包括:s1.设置可信样本,形成训练集,并针对每个可信样本获取光谱信息和空间信息并进行融合,对应获得每个可信样本的图谱合一的拉曼高光谱信息;s2.构建流判别模型,通过流判别模型的转移函数f分别获取每个拉曼高光谱信息对应的特征数据f(x),根据特征数据f(x)计算每个可信样本对应的拉曼高光谱的概率密度;s3.分别采用刚性变换通道和耦合变换通道提取光谱特征,并在每层网络之间交换刚性通道与耦合通道的顺序并进行耦合操作,经过多次耦合操作后,得到样本最终特征;s4. 对于训练集中的每个训练样本,每次得到样本最终特征后计算其在特征空间上的负对数似然值,并按负对数似然梯度下降方向对模型参数进行更新;s5.重复s2-s4的内容进行迭代训练,直至训练集的平均负对数似然值的波动处于稳定阈值范围内,则停止迭代,完成流判别模型的训练,并将训练集上最大的对数似然值作为深层空间判别边界。
20.需要说明的是:本发明实施例s1中采用拉曼高光谱成像技术,即二维位移平台与光谱仪联动的方式逐点或逐行扫描样本;本发明实施例中流判别模型用于可信样本拉曼高光谱特征边界的划分,需要借助一定数据量的可信样本建立可信数据集,其样本数要求大于100以上。
21.本发明实施例s3中,刚性变换采用恒等变换函数构成,耦合通道采用s和t两个变
换函数构成,其中s函数称为特征函数,t函数称为偏置函数。
22.为了进一步实施上述技术方案,s2中构建流判别模型的具体内容包括:(1)初始化分布转移函数利用多层卷积神经网络构建分布转移函数,该神经网络具有双射可逆性,即所得转移函数存在逆函数。通过随机初始化神经网络得到初始化转移函数f,转移函数f将正常样本的拉曼图像数据x映射到拉曼图像特征空间,得到特征数据f(x);(2)确定目标转移分布转移函数将原始复杂数据分布设置为简单数据分布,后续通过耦合迭代的方式有效逼近原始复杂数据的分布;其中,简单数据分布为标准正态分布;需要说明的是:流模型建立过程旨在优化转移函数f,使得所得特征数据f(x)服从标准正态分布,从而直接数值化地计算高维复杂拉曼高光谱的概率密度值,即样本为可信样本的概率;(3)概率计算流模型基于密度保持原理计算概率密度;已知转移函数f可将正常样本的拉曼高光谱特征分布变换为简单的标准正态分布,则基于概率密度保持原理可知,样本服从正常分布的概率计算方法为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中p
normal
表示样本服从正常分布的概率,pz表示样本特征服从标准正态分布的概率,jf表示转移函数f的雅可比矩阵,具体表示为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)其中,为特征向量z的第n个维度元素对输入向量x的第n个维度元素的偏导数;(4)流判别模型训练流判别模型采用公式(1)的负对数形式作为代价函数,代价函数具体为:
ꢀꢀꢀꢀꢀꢀꢀ
(3)其中,z为特征向量;优化方向为梯度下降方向,每次迭代沿着该优化方向更新模型的参数,从而使得转移函数能够将原始复杂数据分布变换为简单的标准正态分布,致使原始复杂数据分布边界被变换为简单的已知分布边界,用于区分可信样本与掺杂样本,即为非定向判别模型。
23.为了进一步实施上述技术方案,s3中的耦合操作包括以下内容:
其中h表示每层耦合层所得特征,上标表示通道编号,下标表示层数,耦合通道包括s和t两个变换函数,其中s函数称为特征函数,t函数称为偏置函数,函数s和t函数采用深度卷积网络形式,scaling函数表示权重层,latent为对应光谱在特征空间的表示方法。
24.需要说明的是:具体耦合操作的次数通过测试得到,本实施例中测试一共采用四层结构,每个特征经过两次耦合操作,两次刚性操作。上述公式表示一个4层耦合层结构的流判别模型,可采用堆叠更多层耦合层得到更复杂的网络,具体需要根据训练效果决定,越深的网络可得到越复杂的模型,但也同时可能导致网络容易过拟合。
25.为了进一步实施上述技术方案,流判别模型的训练过程还包括:s6.对训练后的流判别模型进行准确性验证。
26.为了进一步实施上述技术方案,s1中设置的可信样本具体为满足国标要求的不同品种的可信奶粉样品。
27.为了进一步实施上述技术方案,通过拉曼高光谱成像仪获取多个空间点的光谱信息,空间采集范围至少满足50mm
×
50mm区域的要求,样本采样间距在1mm至5mm之间。
28.下面将进一步通过实例来对流判别模型进行训练的过程进行说明:(1)可信样本数据准备本实施例中准备了来自不同供应商的不同配方的多种可信奶粉,相关样本经过权威机构测试,且所准备奶粉均满足国标要求。在实验中,一共采集200份可信奶粉样本,单个样本重20g。
29.(2)可信样本拉曼高光谱成像数据采集采用拉曼高光谱成像采集设备,高效采集可信样本的拉曼高光谱成像信息,其中拉曼光谱仪的激发光波长为785nm,光谱分辨率为6cm-1
,光谱范围覆盖200cm到2000cm波段,激光功率为100mw。奶粉样本放置在透明平底容器中,通过位移平台进行移动采样,采样间隔为1mm,在50mm
×
50mm的区域内采集2500个样本点的拉曼光谱。在此基础上,结合其空间分布信息,最终得到可信奶粉的拉曼高光谱数据。
30.(3)流判别模型的建立依据图1中所示流判别模型框架,在可信样本的拉曼高光谱数据集上,根据上文内容建立流判别模型。在建模过程中,从判别问题出发,建立单条拉曼光谱和判别属性之间的概率关系,然后用可逆的神经网络来迭代训练,通过多次迭代训练后达到收敛条件,建模结
束。
31.流判别模型训练的具体过程可表示为,将输入光谱数据x分成两部分,分别输入流判别模型第一层的相应部分,得到各自对应的特征。随后,不断交换特征顺序并进行相应操作,其中函数s和t函数在本实施例中采用深度卷积网络形式,scaling函数表示权重层,得到的latent即为对应光谱在特征空间的表示方法。模型经过每次迭代后,需要统计整个可信数据集在特征空间上的平均对数似然值,当对数似然值在十次循环中波动在1%之内时,则停止迭代。计算结束后,将可信数据集上最大的对数似然值作为深层空间判别边界,准确判断未知奶粉样本是否掺杂。如果待测样本的拉曼高光谱数据经过流模型投影后,得到的对数似然大于判别边界,则判断为掺杂样本;如小于判别边界,则为正常样本。
32.下面将根据实例来对多种均匀掺杂奶粉的可信性判断进行说明:测试样本的准备:该实施例中对多种存在非法添加剂的奶粉样本进行可信性分析,其中用到的非法添加剂包括三聚氰胺、三聚氰酸、淀粉、乳清粉和麦芽糖糊精,通过将以上添加剂添加入纯奶粉中,共制备了150组单掺杂物奶粉样本和200组多掺杂物奶粉样本。其中,掺杂物浓度范围在0.5%~1.5%之间,且通过搅拌器与奶粉进行均匀混合。
33.数据采集:采用上文可信样本数据准备过程中的第二步所述方法,对所有掺杂样本进行拉曼高光谱数据采集,共得到350个大小为50
×
50
×
1024大小的拉曼高光谱数据矩阵。
34.样本可信性分析:将第二步得到的拉曼高光谱图像数据依次输入训练后的流判别模型中,统计每条样本所得的对数似然值,并与判别边界进行对比,得到判别结果。计算结果表明,在该实施例中,对于掺杂奶粉的判别准确率达到了99.5%,充分说明流判别模型具备奶粉掺杂非定向检测能力,其模型预测精度令人满意。
35.本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
36.对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1