一种基于红外和拉曼光谱数据的人工智能学习物质分析方法与流程

文档序号:12061187阅读:175来源:国知局
一种基于红外和拉曼光谱数据的人工智能学习物质分析方法与流程

本发明属于光谱分析检测领域,尤其涉及一种基于人工智能自我学习进行光谱分析建模并映射目标被测物化学组分成分的方法。



背景技术:

红外吸收光谱和拉曼发射光谱均为基于物质分子振动信息的光谱分析技术。通过不同分子在不同光波段的特异性吸收,红外吸收光谱可以提供物质的分子组分信息。而通过不同分子在激发光下产生的不同波段的特异性发射,拉曼光谱可以提供物质的分子成分信息。这两种光谱分析方法以其高效,快速,非侵入性,重复性强等优势,在生产质量监测,有害物质检测等方面有着广泛的应用。

公开号为CN105928901A的专利公开了一种定性定量相结合的近红外定量模型构建方法,对分析样品的近红外光谱进行定性投影,分类,并结合化学分析获得的数据库建立回归模型,将光谱不同波段的投影与实际化学分析得到的组分数据建立映射关系,以利用该关系进行光谱的近红外光谱定量分析。

公开号为CN102305772A的专利公开了一种基于遗传核偏最小二乘法的近红外光谱特征波长筛选方法,利用化学分析方法对样品建立化学成分数据库,人为分为校正集和预测集后利用遗传算法对所有光谱信号点进行搜索分析,并依赖核最小二乘法交互验证求解均方差最小值的方式获得最优数据转换矩阵,从而得到最佳的校正分析预测模型。

公开号为CN106092960A的专利公开了一种快速校正近红外光谱检测设备病检测农产品中化学成分的方法,利用化学方法分析数据与标准近红外采集光谱一一建立映射关系,以建立广谱的光谱分析预测模型。

由上可见,传统的光谱分析方法依赖于对每个独立分析样品的校正和建模,该过程通常需要大量的化学分析和模型校正,且对于每个不同样品都需要不同的分析方法和建模方法,使得其运用需要大量的专业人员和时间成本而无法广泛大规模运用。如何建立一种易于使用,成本低廉,并可以广泛自适应运用于大量不同被测样品的分析技术,一直是光谱分析检测领域继续解决的技术难题。

人工智能的无监督学习技术提供了观察大量数据规对数据自动分组的方法。人工智能监督学习技术提供了学习已知数据标签,对未知数据进行同样分类的方法,通过对大量数据的学习,可以获得精确分类结果。使用人工智能技术自动学习光谱分类模型可以很好的解决光谱检测领域大量专业人员需求的难题。



技术实现要素:

为减少在传统光谱分析建模方法中的人工与时间成本,本发明提供了一种基于人工智能自我学习技术的对于红外和拉曼光谱数据的物质分析方法。该方法可以广泛运用于各种不同物质的光谱分析建模处理,并极大降低了对化学分析方法校正的数据量要求,从而使得光谱分析可以被简单地运用于不同类型物质的定性和定量分析。

本发明采用了如下技术方案:

一种基于红外和拉曼光谱数据的人工智能学习物质分析方法,包括以下步骤:

步骤一,对目标物质进行红外吸收光谱和拉曼发射光谱的采集,对于每种目标被测物质,进行n个不同样品的m次平行测试,因而得到n X m X2组光谱数据;

步骤二,对获得的光谱数据进行基于以往类似物质数据的统计学分析,去除统计学上的意外或无效数据,从而获得有效光谱数据组;

步骤三,使用人工智能分析程序对有效光谱数据组进行无监督分类处理,并基于程序分析的结果对初始的n个样品进行分组;

步骤四,对每个分组内的样品进行抽样化学方法分析,获得每个抽样样品的准确化学组分数据;

步骤五,基于化学组分数据,用人工智能监督学习算法进行二次分类;

步骤六,重复步骤三至五直至程序习得准确有效的数据分析算法模型;

步骤七,利用习得的分析算法模型,该人工智能分析程序可用于对任意未知样品的光谱分析处理,并返回置信度可靠的物质成分分析结果。

在对上述基于红外和拉曼光谱数据的人工智能学习物质分析方法的改进方案中,A: 对于n个被采集光谱的样品,只需对每个分组内的k个样品进行化学方法分析,其中k<<n;B: 对于任意样品的分析,人工智能分析程序对其光谱数据的特异性和相似度进行自我修正和学习,并在多次迭代修正后返回置信度可靠的分类算法模型;C: 对于不同的分析样品,分析程序将返回和存储习得的针对该种样品的算法模型;D:对于任意样品,通过迭代习得的算法模型可直接用于同种样品的基于光谱数据的定性定量分析,返回化学组分及成分信息。

在对上述基于红外和拉曼光谱数据的人工智能学习物质分析方法的改进方案中,实际中采用的设备为台式,集成式,或便携式红外光谱仪和拉曼光谱仪。

在对上述基于红外和拉曼光谱数据的人工智能学习物质分析方法的改进方案中,实际中为运行在电脑端,智能手机端,云服务器端,或任意其他具备数据输入输出功能的客户端。

在对上述基于红外和拉曼光谱数据的人工智能学习物质分析方法的改进方案中,包含数量可自适应变动的逻辑层,每个层包含多个利用不同分析或映射模型算法的模块,每个模块之间和每个逻辑层之间由多维度向量相连;该模块可以使用的算法模型包括但不限于深度神经网络,卷积神经网络,循环神经网络,对抗神经网络,主成分分析和支持向量机;逻辑层数量,模块数量和种类,及向量数量和数值,均由程序本身针对特异样品实际光谱数据进行自我优化迭代调节。

本发明的有益效果:由于通过在已采集数据上的学习预测未知样品,极大的减少了校正和建模所需花费的时间和人工成本;此方法适用于大量样品的快速光谱分析检测,并可以根据特殊应用需要进行精确度调整,以方便在成本费用和分析速度准度之间获得一个最佳平衡点;此外,由于该人工智能分析程序的普适性,该方法可以被任何人熟练掌握并快速运用于不同的样品测试场景中,具有巨大的应用前景和潜力。

附图说明

图1为人工智能学习模型建立流程框架图;

图2为实际样品化学成分分析检测框架图。

具体实施方式

实施方式一:

对苹果样品的质量检测与监控:

步骤一,对5000个苹果分别进行红外吸收光谱和拉曼发射光谱的采集。对于每个苹果样品,进行50次平行测试,因而得到50*5000*2=500000 组光谱数据;

步骤二,对红外和拉曼光谱数据进行统计学分析,去除统计学上的意外或无效数据,从而获得有效光谱数据组(约为499800组数据);

步骤三,使用人工智能分析程序对有效光谱数据组进行自动鉴别和分类处理,将红外和拉曼光谱数据进行并行处理,并自动进行样品分类(约为500组);

步骤四,对每个分组内的样品进行抽样化学方法分析,获得每个抽样样品的准确化学组分数据(水分,质地,甜度,酸度,农药残留,污染物含量等);

步骤五,基于化学组分数据,如果其标准差高于实际应用所需误差,则对人工智能分析程序输入修正参数,并令其基于修正参数进行二次分类(通常会获得比步骤三多两到三倍的分类,约为1000-1500组);

步骤六,重复步骤三至五直至程序习得准确有效的符合应用需要的数据分析算法模型;

步骤七,利用习得的分析算法模型,该人工智能分析程序可用于对任意未知苹果样品的光谱分析处理,并返回置信度可靠的物质成分分析结果。

此应用可运用于任意水果蔬菜食品等日常消费品的快速质量检测与分析,具体实现应用可包括但不限于: 水果中含水量,质地,甜度和酸度分析,奶粉产品中三聚氰胺及有效蛋白含量分析, 蔬菜中农药残留及重金属含量分析等。

实施方式二:

对药物片剂的质量检测与防伪

步骤一,对5000种药物片剂分别进行红外吸收光谱和拉曼发射光谱的采集。对于每种药物样品,进行50次平行测试,因而得到50*5000*2=500000 组光谱数据;

步骤二,对每种药物样品的红外和拉曼光谱数据进行统计学分析,去除统计学上的意外或无效数据,从而获得有效光谱数据组(约为499800组数据);

步骤三,使用人工智能分析程序对带有药物种类标记的有效光谱数据组进行自动鉴别和分类处理,将红外和拉曼光谱数据进行并行处理,并自动进行随机样品分类,其中每种药物可出现在多个分类中以建立不同纬度的区分算法模型;

步骤四,对已知药物样品进行红外吸收光谱和拉曼光谱采集,并将光谱数据导入已有的区分算法模型中,返回每一个含有该种药物数据的模型预测值;

步骤五,基于模型预测值,令人工智能分析程序对原油的随机分类进行优化再次分类;

步骤六,重复步骤四至五直至程序习得准确有效的符合应用需要的数据分类算法模型;

步骤七,利用习得的分类分析算法模型,进行任意药物片剂样品的光谱分析处理,并返回药物的质量分析和真伪判断。

此应用可运用于任意商品的快速产品检测和真伪鉴定,具体实现应用可包括但不限于: 酒类商品的真伪鉴定,药物片剂的真伪鉴定,高档成衣的材料真伪鉴定,奢侈品箱包的真伪鉴定等。

实施方式三:

对人体皮肤的成分测定和健康分析

步骤一,对10000名被测人群的面部皮肤分别进行红外吸收光谱和拉曼发射光谱的采集。对于每个被测人员,在面部不同位置进行50次平行测试,因而得到50*10000*2=1000000 组光谱数据;

步骤二,对每个被测人员的红外和拉曼光谱数据进行统计学分析,去除统计学上的意外或无效数据,从而获得有效光谱数据组(约为999800组数据);

步骤三,使用人工智能分析程序对带有来源对象标记的有效光谱数据组进行自动鉴别和分类处理,将红外和拉曼光谱数据进行并行处理,并自动进行随机样品分类;

步骤四,对更多被测人群进行红外吸收光谱和拉曼光谱采集,并将光谱数据导入已有的区分算法模型中,返回基于先前分类的置信值;

步骤五,基于模型分类置信值,令人工智能分析程序对原油的随机分类进行优化再次分类;

步骤六,重复步骤四至五直至程序习得分类置信度为1的可靠数据分类和所需的算法模型;

步骤七,对优化后分出的每类人群进行抽样医疗仪器深度检测,对每一类标记获得的准确成分数据与健康参数(含水度,脂肪含量,蛋白含量,毛孔洁净程度及尺寸等);

步骤八,利用建立的模型,对任意未知待测人群进行光谱采集,并即时返回分类结果和所对应的准确皮肤成分数据与健康参数。如分类确信度不为1,则返回步骤五进行分析算法再优化以获得更准确的分类预测模型。

此应用可运用于多种人体指标的健康数据跟踪测试与分析,具体实现应用可包括但不限于: 脸部皮肤的成分测定与健康分析,头皮表层的成分测定和健康分析,舌苔的成分测定与健康分析,近表皮静脉血管的成分测定和健康分析等。

由上可见,本方法适用于大量样品的快速光谱分析检测,并可以根据特殊应用需要进行精确度调整,以方便在成本费用和分析速度准度之间获得一个最佳平衡点。此外,由于该人工智能分析程序的普适性,该方法可以被任何人熟练掌握并快速运用于不同的样品测试场景中,具有巨大的应用前景和潜力。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1