基于可见近红外光谱的孵化早期受精种蛋判别模型的建立方法与流程

文档序号:21697992发布日期:2020-07-31 22:49阅读:277来源:国知局
基于可见近红外光谱的孵化早期受精种蛋判别模型的建立方法与流程
本发明涉及受精种蛋的检测领域,具体是一种孵化早期种蛋受精信息判别模型的建立方法。
背景技术
:我国是农业大国,禽蛋业是畜牧业中的优势产业,具有良好的发展前景,但繁育过程耗能、耗时,鸡蛋孵化不仅对孵化环境的温度和湿度等有很高的要求,而且孵化大约需要3周时间。一部分种蛋最终不能孵化成功,进而造成一定浪费。根据相关资料显示,种蛋孵化成功率约为86%~95%,不能孵化成功的大概率原因是种蛋胚胎未受精。在孵化早期,若能检测未受精不能孵化的种蛋并将其清除,不仅能够使无精蛋依然可供食用,减少经济损失、节省资源,还能一定程度上避免由于未发育种蛋变质产生的霉菌感染其他种蛋。因此,检测早期种蛋孵化情况是有重要意义的。目前,检测种蛋孵化情况的方法是人工照蛋,也就是工人手持照蛋器在黑暗的环境中对孵化一定时间的种蛋透视从而检测胚胎发育情况,然后根据胚胎形态剔除未受精蛋和已经死亡的胚胎蛋,但该方法不仅存在检测效率低下,工人的劳动强度较大的问题,而且检测结果还受各种客观因素的影响,例如,蛋壳厚度、蛋壳颜色等,使结果具有不确定性。而且72小时后的种鸡蛋和死胚蛋已不再具备食用价值,带来了更大的经济损失。目前,对种蛋孵化情况的检测判别方法有机器视觉法、光学检测法、敲击振动法、高光谱法、核磁共振成像、超声波和激光散斑成像等,上述方法或多或少均存在一些缺陷。近红外光谱检测分析方法作为一种快速无损检测分析方法,能够对各种形态的物品属性进行检测分析。秦五昌等公开发表的“基于可见/近红外透射光谱的孵化早期受精鸡蛋的判别”中研制了基于可见/近红外透射光谱的静态采集系统,并使用该系统进行光谱采集。但是,其是采用的可见/近红外透射光谱进行受精判别,对应的可见/近红外光谱检测系统包括暗箱、光源、温度检测装置、散热装置等,检测系统较为复杂,操作不便。祝志慧等公开发表的“基于近红外光谱的孵前种蛋检测”中公开“通过选取不同的谱区范围、不同的主成分因子和不同的光谱预处理方法分析校正模型判别精度,选择一定谱区范围的光谱数据,主成分因子数为19,snv+一阶导数+norris微分过滤的预处理方法,利用马氏距离法对校正集和验证集进行定性判别分析”,可见,其分析方法十分复杂,过程繁琐。技术实现要素:针对上述问题,本发明提供一种基于可见近红外光谱的孵化早期受精种蛋判别模型的建立方法,通过采集系统获取近红外光谱数据,利用算法对所获数据进行分析运算,搭建模型,基于光的漫反射原理,光谱数据采集方便,分析过程简单,通过所述方法建立的模型可以在孵化早期有效判别种蛋受精情况,能够实现种蛋受精情况的无损检测与判别,判别准确率较高,能有效提高检测效率。为了实现上述目的,本发明采用的具体方案为:基于可见近红外光谱的孵化早期受精种蛋判别模型的建立方法,包括以下步骤:步骤一、数据采集:对种蛋样本进行编号,采用y型三接头光纤,入孵前在种蛋样本大头端选择一固定位置,将种蛋样本大头朝上竖直放入孵化箱中,每隔24h在固定位置采集一次数据;采集数据时将y型三接头光纤的一端探头在不损坏种蛋的前提下紧贴于所述固定位置,所述y型三接头光纤的另外两端分别连接光源和光谱仪,所述光谱仪通过数据线与安装有光谱采集软件的计算机相连;步骤二、数据预处理:将经步骤一采集的数据进行小波分析预处理,经预处理后的光谱数据用unscrambler软件进行主成分分析,得到载荷得分图;将所述得分图与霍特林矩阵结合筛选剔除由于信号差异性大、会影响模型准确率的无效样本,获得合格样本;步骤三、模型搭建:获取种蛋样本的受精信息,并将受精蛋标记为1、无精蛋标记为2;将步骤二筛选后获得的合格样本结合受精信息搭建随机森林模型和支持向量机分类模型,向随机森林模型和支持向量机分类模型分别导入5组相同的数据,并均设置1/5的样本进行交叉验证,将随机森林算法运行100次待模型稳定后得出分类正确率,与支持向量机分类模型的分类正确率对比,评出每组结果的获胜模型,根据获胜次数选出判别效果较优的模型。作为对上述方案的进一步优化,步骤一所述每隔24h在固定位置采集一次数据,在每次采集数据前,将所述探头对准校准白板采集参考光谱。作为对上述方案的进一步优化,步骤一中,设置光谱仪的积分时间为4000微秒,平均次数为10,平滑度为5。作为对上述方案的进一步优化,步骤二中,在unscrambler软件中将主成分数设置为5,并规定随机选择9个样本作为交叉验证集进行交叉验证。本发明还提供采用上述方法建立的模型在孵化早期种蛋受精判别方面的应用。有益效果:本研究应用近红外光谱分析技术原理对种蛋早期受精情况进行检测研究,利用其分析速度快、测量准确度高、对样品无损等特点,通过采集系统获取近红外光谱数据,利用算法对所获数据进行分析运算,搭建模型,对种蛋胚胎孵化情况进行判别。在数据采集中,采用y型三接头光纤探头,紧贴在种蛋样本大头端的固定位置,该方法是基于光的漫反射原理,将探头紧贴于固定位置可避免除入射光源外其他光源的影响且避免光的溢出,保证采集到的数据的准确性。通过spectrasuite软件采集光谱数据后,用matlab进行小波分析预处理,减少信号中噪声的干扰。将获得的预处理后数据用unscrambler进行主成分分析降低维度,将得分图结合霍特林矩阵筛选剔除个体差异性大的无效样本,提高判别模型的准确率。本发明所述的方法是在鸡种蛋孵化一段时间后,使用光纤光谱仪获取待测种蛋的光谱数据,然后用随机森林算法和支持向量机算法搭建出可以判别受精蛋和无精蛋的模型,根据分类正确率的结果,选出判断鸡种蛋受精情况效果较优的模型。实验发现,随机森林模型的判别准确率比支持向量机分类模型的判别准确率较高,随机森林模型的判别效果较好,判别准确率可达93.3%。在所述模型的建立过程中,光谱数据采集方便,分析过程简单,通过所述方法建立的模型可以在孵化早期有效判别种蛋受精情况,能够实现种蛋受精情况的无损检测与判别,判别准确率较高,能有效提高检测效率。附图说明图1为本发明使用的检测装置结构示意图;其中,1、种蛋;2、光谱仪;3、光源;4、计算机;5、y型三接头光纤;图2为本发明使用的数据分析方法流程图;图3为主成分分析结果图;图4为随机森林模型分析结果图;图5为支持向量机模型分析结果图。具体实施方式本发明所提供的是一种基于可见/近红外光谱的种蛋孵化早期受精情况的检测模型,采用的建模方式为全波段建模,基本原理是基于受精蛋和无精蛋在发育过程中光反射率不同的特点。结合检测装置对检测方法进一步说明。实施例11、检测装置检测装置主要包括光源、usb2000+光纤光谱仪、一根y型三接头光纤和一台装有光谱仪配套光谱采集软件spectrasuite的计算机。所述光谱采集软件是spectrasuite光谱分析软件。采用的数据分析软件是matlab2017b。采用的另一数据分析软件是theunscramblerx10.4。2、实验方法如图1,y型三接头光纤一头连接光源,一头连接光谱仪,使用探头处采集样本数据。光谱仪通过数据线与计算机相连。将光谱采集软件spectrasuite的积分时间设置为4000微秒、平均次数设置为10,平滑度设置为5,在采集样本数据前,需要将探头对准校准白板采集参考光谱,可以通过调整光源强度,使每次采集时的参考光谱保持在同一水平,保证每次采集到的数据都基于同一参考值。在孵化种蛋前,清洁孵化箱后消毒,并检查孵化箱的各项功能。设置孵化箱的温度为37.8°c,相对湿度为68%,将孵化箱加热30分钟。实验样本为柴鸡蛋,样本数量为46,将种蛋表面清理、消毒,对种蛋样本进行分别标号,在种蛋样本的大头附近选择一固定位置,然后将样本种蛋依次大头朝上竖直放入孵化箱中。入孵后每隔24h在固定位置采集一次数据。采集方法为,将种蛋从孵化箱中取出,大头朝下对准y型光纤探头竖直放置,使探头对准固定位置,在不损坏种蛋的情况下将种蛋紧贴于探头。每次采集前要将光谱仪预热30分钟。最后获得多组数据。整理所获数据后导入matlab中进行小波分析预处理;孵化18天后将种蛋样本进行破壳处理,获取种蛋受精情况。将预处理后的数据、种蛋样本标号和受精情况整理为一个excel文件后导入unscrambler,选择处理后的数据矩阵,将最大成份数设置为5,设置9个样本作为交叉验证样本,进行主成分分析,该光谱数据主成分分析结果显示前两个主成分的累计贡献率为99%,然后将主成分分析的结果得分图结合霍特林矩阵,且将数据按照受精情况分组。在如附图3所示的得分图中,霍特林矩阵所代表的圆圈外的样本即为个体差异性大,不利于模型准确率的无效样本,剔除该样本数据后,将剩余合格样本的数据导入matlab中搭建模型。创新性:由于霍特林矩阵多用于根据观测量主成分是否稳定进行无效样本的检测,本方法利用这一特点筛选剔除诸多样本中的个体差异性大,会影响建模效果的样本,可以提高后续搭建模型的针对性和准确率。随机森林模型的理论基础是通过投票根据“少数服从多数”原则选出获得更多票数的决策树,而决策树模型简单来说就是通过一个树型结构的流程图,将分类标准不断细化后得到分类结果。搭建随机森林模型时,由于经主成分分析剔除的无效样本数不一定,所以通过调用randperm函数将样本随机排列并固定地将前30个样本设为训练集,剩下的所有样本设为测试集,并设置9个样本进行交叉验证,然后调用classrf_train函数创建随机森林分类器,classrf_predicet函数进行仿真测试,待算法运行100次模型稳定后得出该模型如附图4所示的分类结果。支持向量机的理论基础是在实际分析中,存在一个最优超平面将两类样本以较高的准确率区分。在matlab中的gui界面将光谱数据设为输入,将样本的受精情况设为输出,并选择9个样本进行交叉验证后,进行支持向量机分类分析,待模型稳定后得出该模型如附图5所示的分类结果,取正确率最高的linearsvm模型的结果作为最终支持向量机模型的分类正确率。取孵化前5天采集到的5组光谱数据,依次进行如上所述的预处理、主成分分析、搭建随机森林和支持向量机模型的过程,得出5组分类正确率,如表1。比较每组分类正确率,将分类正确率较高的模型判为获胜模型,比较结束后,获胜次数多的模型即为判别效果较好的模型。实验发现,支持随机森林模型的获胜次数多,判别效果较好,且分类正确率可达93.3%,对受精蛋和无精蛋的判别较准确。表1:孵化前5天的5组数据随机森林和支持向量机判别准确率对比结果。第一组第二组第三组第四组第五组随机森林53.3%93.3%71.4%66.7%57.2%支持向量机61.4%80%57.8%60%63.6%获胜模型支持向量机随机森林随机森林随机森林支持向量机本发明的目的是寻找能在种蛋孵化早期判别受精情况的一种方法,以及时筛选出无精蛋,使其依然具备食用价值,减少由于其不可食用造成的经济损失,故选取孵化前5天的数据进行比较分析。虽然评价模型好坏的方法有很多种,但本方法评价哪个模型更适于实验时采用的是最直观快速的方法,也就是直接将最终结果进行比较,5组数据中获胜次数较多即可表示该模型的判别效果优于另一模型。需要说明的是,以上所述的实施方案应理解为说明性的,而非限制本发明的保护范围,本发明的保护范围以权利要求书为准。对于本领域技术人员而言,在不背离本发明实质和范围的前提下,对本发明作出的一些非本质的改进和调整仍属于本发明的保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1