本发明涉及计算机视觉与模式识别,尤其涉及一种蜂胶成分智能鉴别与溯源系统及方法。
背景技术:
1、当前蜂胶成分鉴别技术存在显著局限性,难以满足精准化、高效化需求。传统蜂胶鉴别多依赖人工感官与单一检测手段:人工鉴别通过观察颜色、闻气味、尝口感判断,主观性强,易受经验水平影响,对轻微掺假难以识别;单一近红外光谱检测虽操作便捷,但仅能捕捉表层光谱信息,受样本颗粒度、湿度变化影响大,当蜂胶与掺假成分光谱特征相似时,误判率高;高效液相色谱(hplc)虽能精准检测活性成分含量,但操作复杂、耗时久,依赖专业人员与实验室环境,无法满足现场快速鉴别需求。同时,现有鉴别模型多基于固定样本训练,泛化能力弱,面对新型掺假手段(如树胶改性处理、添加合成黄酮)时,模型性能快速衰减,难以适配市场上不断变化的掺假类型,导致监管部门难以高效打击蜂胶造假行为。
2、蜂胶溯源体系存在数据不可靠、信息不透明等问题,无法保障消费者知情权与市场秩序。现有溯源多采用中心化数据库存储信息,加工企业可单方面修改产地、加工工艺等关键数据,数据篡改风险高;部分企业为降低成本,不完整记录加工参数,甚至伪造检测报告,导致溯源信息与实际情况脱节。消费者查询溯源信息时,仅能获取简单的产地名称,无法查看活性成分含量、检测过程等关键内容,难以判断蜂胶品质;监管部门需人工核查溯源数据真实性,流程繁琐、效率低,无法实现全区域蜂胶样本的实时监管,当出现掺假蜂胶流入市场时,难以快速追溯源头责任主体,导致问题蜂胶召回不及时,损害消费者健康与市场信任。
3、数据处理与模型应用环节的缺陷进一步制约蜂胶鉴别与溯源技术的落地效果。现有系统缺乏完善的数据质量管控机制,近红外光谱采集时易因仪器稳定性差出现信噪比低、光谱波动大的问题,hplc数据中重叠峰未有效剔除,导致后续特征提取精度下降;特征向量构建多未考虑特征重要性差异,将背景光谱等低贡献特征与活性成分峰面积等高贡献特征同等对待,增加模型计算量的同时降低鉴别精度。此外,模型缺乏持续优化能力,当新产地蜂胶样本或新掺假类型出现时,需重新采集大量样本进行全量训练,耗时费力,且训练过程中未充分考虑环境干扰对模型的影响,导致模型在实际应用中难以稳定发挥性能,无法长期为蜂胶品质管控提供可靠技术支撑。
技术实现思路
1、本发明提出的一种蜂胶成分智能鉴别与溯源系统及方法,以解决上述现有技术中提到的问题。
2、为了实现上述目的,本发明采用了如下技术方案:一种蜂胶成分智能鉴别与溯源系统,包括以下模块:
3、数据采集模块,包含近红外光谱采集单元、高效液相色谱采集单元及溯源信息采集单元;近红外光谱采集单元用傅里叶变换近红外光谱仪,每样本扫描3次取平均光谱;高效液相色谱采集单元用紫外检测器,按梯度洗脱程序采集5类活性成分数据;溯源信息采集单元扫码读取蜂胶包装识别码并采集信息;
4、数据预处理单元,对近红外光谱数据采用savitzky-golay滤波去除噪声,再通过asymmetricleastsquares算法进行基线校正;对高效液相色谱数据采用高斯峰拟合算法提取色谱峰,将两类数据分别归一化至[0,1]区间;
5、成分特征提取模块,包含光谱特征提取单元与色谱特征提取单元;光谱特征提取单元筛选10个特征峰并计算峰参数,色谱特征提取单元计算5类活性成分色谱参数;两类特征拼接为60维初始向量,经主成分分析降维至32维;
6、智能鉴别模块,包含模型训练单元与实时鉴别单元;模型训练单元构建“cnn-lstm”模型,用2000个蜂胶样本训练并结合数据增强;实时鉴别单元输入待检样本32维特征向量,输出纯度等级及置信度;
7、溯源管理模块,包含区块链存储单元与分布式数据库单元;区块链存储单元部署3个节点,采用授权证明共识机制,将蜂胶信息上链,每笔记录生成唯一哈希值;分布式数据库单元存储用户查询权限数据,不同用户对应不同查询范围;
8、结果输出模块,包含可视化终端单元与告警单元;可视化终端单元实时显示蜂胶样本的活性成分含量、纯度等级、置信度及溯源链路图;当鉴别置信度<0.8或溯源信息完整性<90%时,告警单元触发声光提示,推送异常信息至监管部门终端。
9、进一步的,还包括成分相似度计算单元,在智能鉴别模块中用于量化待检样本与标准样本的成分匹配度,计算方式为其中s为成分相似度;n为特征维度;ai为待检样本第i个特征的归一化值;bi为标准正品样本第i个特征的归一化值,通过该计算,当s≥0.95时判定为“高相似度”,对应纯度等级“优”或“良”;当0.8≤s<0.95时判定为“中等相似度”,需结合高效液相色谱活性成分含量验证;当s<0.8时判定为“低相似度”,直接标记为“掺假”或“非正品”。
10、进一步的,所述溯源管理模块还包括溯源可信度评估单元,溯源可信度计算方式为c=w1e+w2p;其中c为溯源可信度;w1、w2为权重系数;e为产地环境匹配度;p为加工记录完整性;通过该评估,当c≥0.9时判定为“高可信”,溯源信息直接对外展示;当0.7≤c<0.9时判定为“中可信”,需加工企业补充缺失记录后再展示;当c<0.7时判定为“低可信”,限制该蜂胶样本的销售流通,同时通知监管部门核查。
11、进一步的,所述成分特征提取模块还包括特征权重优化单元,采用互信息熵计算各特征对鉴别结果的重要性,优化特征向量的贡献占比;具体为计算每个特征与纯度等级标签的互信息值i(x,y),其中x为特征值,y为纯度等级标签,按互信息值i(x,y)从大到小排序,保留前25个高重要性特征,从原32维特征中剔除7个低重要性特征。
12、进一步的,所述智能鉴别模块还包括模型在线更新单元,每周从分布式数据库中提取近7天的鉴别日志,经专业检测机构复核并标注真实纯度等级后加入训练集,专业检测机构采用液相色谱-质谱联用仪确认成分;采用增量训练方式,固定cnn层参数,仅更新lstm层与输出层权重,学习率设为1e-4,为初始训练学习率的1/5,迭代20次后完成更新;每次更新后通过测试集验证精度,当精度提升≥2%时保存新模型并替换原模型。
13、进一步的,所述数据采集模块还包括数据质量检测单元,对近红外光谱数据检测信噪比与光谱平滑度,当信噪比<30db或波动>5%时,控制光谱仪重新扫描样本;对高效液相色谱数据检测色谱峰分离度与峰形对称性,峰形对称性要求对称因子0.8-1.2,当分离度<1.5或对称因子超出范围时,调整流动相梯度后重新进样;对溯源信息检测必填字段完整性,缺失时提示补充。
14、进一步的,所述结果输出模块还包括用户交互单元,支持不同角色用户个性化查询与反馈;消费者扫码查看简化版溯源信息及鉴别摘要,加工企业通过企业终端查看加工记录与各批次鉴别数据,生成质量分析报表,监管部门通过监管终端查看全区域蜂胶样本的鉴别异常统计,再发起专项核查并将结果录入区块链。
15、进一步的,一种蜂胶成分智能鉴别与溯源系统的方法,包括以下步骤:
16、步骤一:数据采集与预处理,采用近红外光谱仪采集蜂胶样本的漫反射光谱,每样本扫描3次,取平均光谱;采用高效液相色谱采集5类活性成分的色谱数据;通过扫码枪读取蜂胶识别码,关联采集溯源信息;对光谱数据采用savitzky-golay滤波去噪、asymmetricleastsquares基线校正,将两类数据分别归一化至[0,1]区间;
17、步骤二:成分特征提取,通过偏最小二乘判别分析筛选10个光谱特征峰,计算每个特征峰的峰面积、半高宽及峰强度;计算高效液相色谱中5类活性成分的保留时间、峰高及峰面积;将光谱特征与色谱特征拼接为初始特征向量,采用主成分分析将初始特征向量降维至32维特征向量,再通过互信息熵优化特征权重,保留25个高重要性特征;
18、步骤三:智能鉴别,将优化后的特征向量输入“cnn-lstm”混合模型,输出纯度等级与置信度;同时计算成分相似度s,计算方式为当s≥0.95且置信度≥0.8时判定为正品,当s<0.8时直接标记为掺假;每周从分布式数据库提取近7天的鉴别日志,筛选置信度<0.7的低置信度样本,经专业检测机构复核标注后加入训练集,采用增量训练方式更新模型参数;
19、步骤四:溯源管理,将产地环境数据、加工参数、检测报告编号上传至区块链存储,区块链采用授权证明共识机制,每笔记录生成唯一哈希值;计算溯源可信度:c=w1e+w2p,当c≥0.9时展示完整溯源链路,当c<0.7时限制该蜂胶样本流通并通知监管部门;
20、步骤五:结果输出,通过可视化终端显示蜂胶样本的活性成分含量、纯度等级、溯源链路,当鉴别置信度<0.8或溯源可信度c<0.7时触发声光告警;消费者通过移动端查询简化版溯源信息,加工企业通过企业终端查询质量分析报表,监管部门通过监管终端查询鉴别异常统计并反馈核查结果。
21、进一步的,步骤三中“cnn-lstm”混合模型的训练过程还包括交叉验证与数据增强优化;采用5折交叉验证,将2000个训练样本分为5组,每次取4组作为训练集、1组作为验证集,循环5次完成交叉验证,计算每次验证的准确率与损失值,取平均值作为模型初始性能;数据增强加入高斯噪声与光谱旋转,模拟实际采集过程中的环境干扰,训练完成后,将模型在含100个新样本的测试集上进行验证。
22、进一步的,步骤四中溯源信息的上传与审核流程还包括多级校验;产地检测站上传环境数据后,需提交土壤检测报告、气象记录至监管部门,监管部门审核通过后的数据进行上链,加工企业上传工艺参数时,需关联生产车间的监控视频片段,区块链节点验证视频时间戳与参数上传时间一致后,确认数据有效性;仓储企业上传温湿度数据时,需每24小时上传1次,连续3天的温湿度数据波动控制在±2℃、±5%rh以内视为有效。
23、与现有的技术相比,本发明的有益效果是:
24、在成分鉴别维度,系统采用近红外光谱与hplc多源数据融合,既发挥近红外快速检测优势,又通过hplc精准捕捉活性成分特征,结合savitzky-golay滤波、基线校正等数据预处理手段,有效消除样本状态、环境因素对检测的干扰,大幅降低相似成分的误判概率;“cnn-lstm”混合模型能同时提取特征的空间分布与时序关联,配合特征权重优化,强化高贡献特征对鉴别的支撑,使鉴别结果更精准,即使面对新型掺假成分,也能通过模型在线更新快速适配,长期保持稳定的鉴别性能,为监管部门打击造假、企业把控原料品质提供可靠技术依据。
25、溯源体系的可信度与透明度显著提升,切实保障消费者权益与市场秩序。系统采用区块链技术存储溯源信息,多节点共识机制与唯一哈希值确保数据无法篡改,加工企业、产地检测站、监管部门多主体参与信息上传,避免单一主体造假;溯源可信度评估与多级校验机制,能筛选出不完整、不真实的溯源数据,限制低可信度蜂胶流通,倒逼企业规范记录加工参数、完善产地信息。消费者可通过移动端便捷查询蜂胶的活性成分含量、检测过程、全链路责任主体等详细信息,不再仅依赖简单产地名称判断品质,增强消费信心;监管部门可实时查看区域内蜂胶鉴别异常统计,快速定位高风险企业与问题蜂胶源头,提升监管效率,维护市场公平竞争环境。
26、系统在数据处理与用户适配性上的优化,提升实用价值与落地能力。数据质量检测单元实时监控光谱、色谱数据的有效性,通过重新扫描、调整流动相梯度等手段确保输入数据可靠,为后续特征提取与模型鉴别奠定高质量基础;用户交互单元针对消费者、加工企业、监管部门设计差异化功能,消费者获取简化易懂的溯源摘要,企业生成质量分析报表辅助生产管理,监管部门实现异常数据快速核查,满足不同角色的实际需求。整体而言,本发明实现“成分鉴别-溯源管理-结果应用”全流程智能化,既解决传统鉴别效率低、溯源不可信的问题,又能适配长期市场变化与多场景应用需求,推动蜂胶行业向品质可控、信息透明的方向发展,兼具经济价值与社会价值。