根据光谱数据和化学检测数据的映射集合设计公式的方法与流程

文档序号:11912494阅读:236来源:国知局

本发明属于物质检测领域,特别是涉及利用光谱检测化学成分的方法,具体是涉及根据光谱数据和化学检测数据的映射集合设计公式的方法。



背景技术:

光谱分析中的关键问题很多,包括光谱收集器的标准化,化学检测的标准化和快速化,但是还有一个非常关键的技术是建模中设计公式的技术。

在分析光谱信息和组分之间建立函数关系,建立数学模型是近红外光谱分析的核心技术之一。目前现有分析建模的改进算法和新方法的应用不断出现,但每种算法各具优点的同时也存在着一定的局限性。对于不同类型待测物的数学模型,优化的方法也有所不同,所以在实际应用中将多种数学挖掘方法结合,相互取长补短,提高校正模型的预测精度和稳健性,减少建模与预测时间将成为今后研究方向之一。

我国从20世纪80年代开始涉足近红外光谱技术的研究,首但是由于其硬件系统和软件技术还不够完善方便,建成的模型也未能广泛的推广应用。90年代中期,北京蔬菜研究中心在蔬菜、水果的品质分析方面做了大量的工作,研究出40多个数学模型,在大白菜和西红柿品质育种中发挥了重要作用。

目前在建模方面,一方面充实完善模型数据库,另一方面开发价廉便携式的可用于现场检测的近红外光谱仪,通过现代网络技术,使建立的数学模型更广泛地与终端用户共享,并利用丰富的终端样品信息,不断修正完善现有模型。

本发明提供了一种设计公式的方法,该方法在设计总体层面上解决多成分同时检测或单独检测所需公式的需求。



技术实现要素:

为解决上述技术问题,本发明提供了一种根据光谱数据和化学检测数据的映射集合设计公式的方法,该方法包括确定公式数量、确定波长数量、建立公式、公式验证和公式运 算,其特征在于根据映射数据库中化学数据中检测成分的数量T确定公式的数量K,K≥T,优选的,K满足的关系为:

C表示组合式的含义。

具体的,本发明提供的一种根据光谱数据和化学检测数据的映射集合设计公式的方法包括如下步骤:

确定公式数量:根据映射数据库中化学数据中检测成分的数量T确定公式的数量K,则公式的数量K满足如下关系式(其中C表示组合式的含义):

每一种成分建立一个公式,新的成分的组合建立新的公式,成分组合不同,则必须建立独立的公式,成分组合中的成分顺序不分先后。

例如成分为检测成分T为3,其成分为蛋白质、淀粉、脂肪,则针对蛋白质的检测需要建立一个公式,针对淀粉的检测需要建立一个公式,针对蛋白质和淀粉同时检测也需要建立一个新的公式,其不能与单独检测蛋白质的公式相同,也不能与单独检测淀粉的公式相同,但是针对(蛋白质+淀粉)和(淀粉+蛋白质)的检测则公式相同,成分顺序不分先后,只要成分组成相同,则公式相同。

确定波长数量:在映射数据库中选择2-100个波长,波长数量的选择根据所建公式针对的成分进行选择,波长数量要求大于等于2,当公式针对的成分为一种时,可以选择2个波长,当公式针对的成分为2种时,可以选择2个波长,也可以选择3个波长,甚至是5个波长,波长的数量一般不大于100。

建立公式:确定完波长数量后,采用数学运算方法选择波长,根据选择的波长及吸光度、成分及含量建立公式(也可称函数关系)。选择波长的方法包括但不限于相关系数法、方差分析法、逐步回归分析方法、无信息变量消除方法和连续投影算法、遗传算法、模拟退火算法和区间偏最小二乘法等。

公式验证:建立完公式后进行R个新光谱数据的输入运算,根据光波运算结果与实际化学检测数据的误差要求确定光波波长和数量选择的可行性,不可行则重新选择波长和波长数量,重复建立公式步骤;当根据已有映射数据库建立的公式进行R个新光谱数据运算 后,满足误差要求,则确定公式可行。该步骤中,R≥5,优选R≥10,其中新光谱数据的输入和化学检测数据的校正可以是与原系统不同的实现系统,例如检测器不同等,验证不同的检测器在应用相同的数据模型的时候是否会产生预料不到的差异。

公式运算:当所有公式建立完成后,将公式编写为运算服务器可运行的语言,并嵌入运算服务器中,运算服务器根据待检测成分要求自动匹配公式,同时自动选择运行公式所需要的波长,实现根据新光谱数据运算出所代表的成分及含量。

上述方法中,映射数据库的建立方法优选为如下方法:

将物体的光谱数据输入光谱数据库,将相同物体的化学检测数据输入化学数据库,然后将光谱数据库中的光谱数据和化学数据库中的化学检测数据进行映射,形成该物体的映射数据库,其特征在于:光谱数据按照纳米级光谱波长及吸光度分别作为单一光谱数据条,化学检测数据按照成分名称和成分含量分别作为单一成分数据条,通过单一光谱数据条与所有成分数据条对应形成映射数据组,将所有光谱数据条分别与所有成分数据条对应形成映射数据集,n次检测形成光谱数据和化学检测数据形成的n个映射数据集,将该映射数据集统一输入数据库中形成该物体的映射数据库。

具体的,将光谱数据和化学检测数据映射的方法包括将物体的光谱数据输入光谱数据库,将相同物体的化学检测数据输入化学数据库,然后将光谱数据库中的光谱数据和化学数据库中的化学检测数据进行映射,形成该物体的映射数据库,具体步骤如下:

光谱数据输入光谱数据库中,按照纳米级建立数据条,每个纳米级波长定义为一个数据条,将每个纳米级波长数据和波长吸光度数据录入数据库中,形成光谱数据库中的光谱数据条,光谱范围中的纳米波长数量z对应形成相应数量的光谱数据条z;例如波长范围为1000-1500纳米,则有501条光谱数据条,z为501,每个光谱数据条包括波长和吸光度;

化学检测数据输入化学数据库中,将化学检测数据按所检测成分的数量建立数据条,照成分建立数据条,每个成分定义为一条数据条,将每个成分名称及成分含量录入数据库中,形成化学数据库中的成分数据条,成分的数量r对应形成相应数量的成分数据条r;例如某物体的化学检测数据中有5种成分,则有5条数据条,r为5,分别为Y1、Y2……Y5,每个数据条包括成分名称和成分含量;

将光谱表中的一条光谱数据条对应化学数据表中的所有成分数据条,形成映射数据组,对应原则是一条光谱数据条分别对应各成分数据条,形成单光谱和多成分对应的映射数据组;例如光谱数据条为X1000,成分数据条为Y1、Y2、Y3、Y4、Y5,则针对1000纳米的 单光谱和多成分对应的映射数据组为{X1000Y1,X1000Y2,X1000Y3,X1000Y4,X1000Y5};

按照上述建立映射数据组的方法,将光谱表中的所有光谱数据条与化学数据表中所有成分数据条进行分别对应,形成所有映射数据组的集合,即为映射数据集合;例如光谱数据条为501条,成分数据条为5条,则一次检测所形成的光谱数据和化学检测数据的映射数据集合中包含501×5=2505条数据,该2505条数据即为物体该次检测的映射数据集合,即映射数据集合中的映射数据条为z*R条。

对该物体的不同样品进行n次检测,则形成n个映射数据集合,将n个映射数据集合统一输入一个单独的数据库中,则形成该物体映射数据库。映射数据库中的数据条数为n*z*r。

上述方法中,n大于30,优选大于50,尤其优选大于100。

上述方法中,物体为食物、农产品、土壤、植物的植株或其部分等,农产品包括但不限于粮食、蔬菜、水果等,粮食包括但不限于小麦、水稻、马铃薯、红薯、玉米等,水果包括但不限于苹果、柑橘、梨、火龙果、木瓜、西瓜等。

上述方法中,数据库的载体为存储设备等。数据库的格式不受限制,只要能够形成数据条、映射数据组、映射数据集合、映射数据库即可。

上述方法中,光谱的波长范围为700-2500nm。优选的,光谱的波长范围为800-1800nm,或光谱的波长范围为1500-2500,或者是700-2500nm内任意范围的波长范围。

上述方法中,成分包括但不限于所有的有机成分,包括营养成分,例如蛋白、淀粉、维生素、纤维素、糖类等,包括药品类,例如有机农药化学物质、有机医药化学物质等,包括危害人类健康的有害的有机物质。

本发明的方法中,化学测量数据,也称为化学计量数据,是指通过某些物质的国家标准进行测量获得的化学数据。例如马铃薯中的淀粉含量,需要按照国家标准或者是行业标准进行测量,也可以采用满足国标测量精度的仪器进行测量。

本发明的方法中,光谱数据为通过光谱收集装置收集的不同波长的光能量,通过光转化信号装置转化为光谱数据,光谱数据一般要求具有光谱吸光度,即使某波长光波吸光度为零,则在光谱数据也需要记载。

有益效果

本发明方法的有益效果体现在如下三个方面:

1、本发明的设计公式方法实现了针对同一映射数据库,实现单物质、多物质组合的公式建立,以满足多样化检测需求,合理确定公式的数量。

2、公式的验证方法采用多个新光谱数据和新化学检测数据进行验证,保证验证能够最大程度的满足公式准确性的要求,而且验证数量要大于等于5,以验证对数据模型使用的硬件影响因素。

具体实施方式

实施例1马铃薯数据模型中设计单成分检测公式的方法

设计公式前建立马铃薯映射数据库,映射数据库中包含150个马铃薯的光谱数据和化学数据的映射数据组,其中化学数据包括蛋白质、淀粉、脂肪的含量数据,光谱数据为波长范围为800-1800nm的全波段、整数波长的纳米波长及吸光度的光谱数据集合。

确定公式数量:马铃薯的检测成分为3种:蛋白质、淀粉、脂肪,需要建立3个公式。

确定波长数量:按照如下方法为实例,演示设定公式方法,其中每个波长的纳米nm数随机选择或者按照公式选择。

检测蛋白质确定波长为4个,分别为p1nm和p2nm、p3nm、p4nm

检测淀粉确定波长为2个,分别为d1nm、d2nm。

检测脂肪确定波长为3个,分别为z1nm、z2nm、z3nm。

依次确定检测单物质的波长数量和波长。

建立公式:根据选择的波长及吸光度、成分及含量建立公式。

公式验证:建立完公式后对每个物质分别进行5个新光谱数据的输入运算,根据光波运算结果与实际化学检测数据的误差要求确定光波波长和数量选择的可行性,不可行则重新选择波长和波长数量,重复建立公式步骤;当根据已有映射数据库建立的公式进行5个新光谱数据运算后,满足误差要求,则确定公式可行。

公式运算:当所有公式建立完成后,将公式编写为运算服务器可运行的语言,并嵌入运算服务器中,运算服务器根据待检测成分要求自动匹配公式,同时自动选择运行公式所需要的波长,实现根据新光谱数据运算出所代表的成分及含量。

实施例2马铃薯数据模型中设计单成分和多成分公式的方法

设计公式前建立马铃薯映射数据库,映射数据库中包含100个马铃薯的光谱数据和化学数据的映射数据组,其中化学数据包括蛋白质、淀粉、脂肪的含量数据,光谱数据为波长范围为1200-2400nm的全波段、整数波长的纳米波长及吸光度的光谱数据集合。

确定公式数量:马铃薯的检测成分为3种:蛋白质、淀粉、脂肪,需要建立3个公式。

确定波长数量:按照如下方法为实例,演示设定公式方法,其中每个波长的纳米nm数随机选择或者按照公式选择。

检测蛋白质确定波长为4个,分别为p1nm和p2nm、p3nm、p4nm

检测淀粉确定波长为2个,分别为d1nm、d2nm。

检测脂肪确定波长为3个,分别为z1nm、z2nm、z3nm。

然后再依次确定检测多物质的波长数量和波长。

检测蛋白质和淀粉确定波长为9个,分别为pd1nm……pd9nm

检测淀粉和脂肪确定波长为7个,分别为dz1nm……d7nm。

检测脂肪和蛋白质确定波长为12个,分别为zp1nm……zp12nm。

检测淀粉、脂肪和蛋白质确定波长为15个,分别为dzp1nm……dzp15nm。

建立公式:根据选择的波长及吸光度、成分及含量建立公式。

在映射数据库中选择相应的波长、吸光度及相应的物质和成分含量,不断地进行运算,形成每组选择的公式的建立。

公式验证:建立完公式后,对每个公式进行5个新光谱数据的输入运算,根据光波运算结果与实际化学检测数据的误差要求确定光波波长和数量选择的可行性,不可行则重新选择波长和波长数量,重复建立公式步骤;当根据已有映射数据库建立的公式进行5个新光谱数据运算后,满足误差要求,则确定公式可行。

公式运算:当所有公式建立完成后,将公式编写为运算服务器可运行的语言,并嵌入运算服务器中,运算服务器根据待检测成分要求自动匹配公式,同时自动选择运行公式所需要的波长,实现根据新光谱数据运算出所代表的成分及含量。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1