一种复杂体系中目标物及其类似物的定量和定性检测方法与流程

文档序号:18753362发布日期:2019-09-24 21:29阅读:330来源:国知局
一种复杂体系中目标物及其类似物的定量和定性检测方法与流程

本发明涉及物质检测技术领域,尤其涉及的是一种复杂体系中目标物及其类似物的定量和定性检测方法。



背景技术:

近年来,因为太赫兹时域光谱(thz-tds)具有低光子能量的要求,高信噪比,和分子共振响应,已被证明可作为一个快速的非接触式提取各种材料的性能的方法。现有技术中存在对溶液中含有特定物质的含量进行测定的需求,由于太赫兹光谱具有指纹谱的特征,物质的不同组成与光谱中的波峰位置具有一一对应的关系,因此可以利用太赫兹光谱进行物质种类的识别。

现有技术中常用的对混合物中物质的定性和定量检测方法是:使用有足够纯度单色光的分光光度计,在相同的条件下测定相近浓度的待测试样和标准品的溶液的吸收光谱,然后比较二者吸收光谱特征:吸收峰数目及位置、吸收谷及肩峰所在的位置等,分子结构相同的化合物应有完全相同的吸收光谱。在对定性出的物质进行定量检测,而这样的方法中若对含有多种组分的混合物进行检测,比较繁琐,是很多情况下混合物中物质并不能准确确定,从而给最终结果带来较大误差,不能满足对混合物所含物质的准确定性和定量分析的需要。

因此,现有技术还有待于进一步的改进。



技术实现要素:

本发明的目的在于为用户提供一种复杂体系中目标物及其类似物的定量和定性检测方法,通过支持向量回归(svr)的方法获得频率与目标质量分数的函数,克服现有技术中预测值误差较大的缺陷。

本发明解决技术问题所采用的技术方案如下:

一种复杂体系中目标物及其类似物的定量和定性检测方法,其中,包括以下步骤:

a、获取待检测混合物样本的太赫兹时域波形,根据所述太赫兹时域波形得到所述混合物样本的吸收光谱;

b按照预设频率步长从吸收光谱中选取多个吸收光谱数据,将所述吸收光谱数据分别代入已知目标物及其类似物组成的一元混合物、二元混合物以及多元混合物在不同频率值所对应不同质量分数的多个支持向量回归模型,得到混合物样本中所述目标物及其类似物质量分数的预测值;

c、利用留一交叉验证方法根据所述预测值对混合物样本的吸收光谱进行重建,并根据重建后得到的吸收光谱定性分析出混合物样本中所含目标物和/或目标物类似物的名称。

可选的,所述方法还包括:

a01、分别获取目标物及其类似物组成的一元混合物,二元混合物、以及多元混合物中预设质量分数范围内不同质量分数所对应不同频率的吸收光谱;

a02、利用支持向量回归法分析质量分数与频率之间的关系,分别得到目标物及其类似物组成的一元混合物、二元混合物、以及多元混合物中基础支持向量回归模型:

a03、利用留-交叉验证方法对所述基础支持向量回归模型进行训练,得到训练后的支持向量回归模型。

可选的,所述步骤b还包括:

步骤b1、步骤b1、在所述目标物及其类似物所在的频率范围内选择出多个频率值,依次将所述吸收光谱数据代入目标物及其类似物组成的一元混合物、二元混合物、以及多元混合物相对应的支持向量回归模型,得到不同频率值所对应的目标物和/或目标物类似物的质量分数的预测值。

可选的,所述步骤c还包括:

步骤c1、将混合物中目标物和/或目标物类似物的质量分数输入支持向量回归模型,得到太赫兹吸收光谱曲线。

可选的,所述步骤b包括:

步骤b2、依次将吸收光谱数据代入目标物及类似物的一元混合物所对应的支持向量回归模型、二元混合物所对应的支持向量回归模型和各个多元混合物所对应的支持向量回归模型,分别得到所述支持向量回归模型输出的目标物及类似物质量分数。

可选的,所述利用留一交叉验证方法根据所述预测值对混合物样本的吸收光谱进行重建的步骤包括:

步骤c2、将部分质量分数的预测值作为测试数据,将剩余部分的质量分数预测值作为训练数据;使用训练数据对支持向量回归模型进行训练;

步骤c3、将支持向量回归模型输出的各个频率值所对应的吸收系数作为吸收光谱数据,重建吸收光谱。

进一步的,所述步骤a03中还包括:

计算训练后得到的支持向量回归模型输出的结果与真实值之间误差的测定系数和/或均方误差;

当所述测定系数和/或均方误差满足预设阈值时,则停止对所述支持向量回归模型的训练,执行步骤b。

有益效果,本发明提供了一种复杂体系中目标物及其类似物的定量和定性检测方法,通过采用支持向量回归(svr)方法,对单组分、双组分、三组分和四组分双酚的太赫兹光谱数据进行分析,以获得与混合物中目标物及其类似物在预设质量分数对应的频率的支持向量回归模型。利用所述支持向量回归模型对未知混合物样本的质量分数进行预测,最后,通过光谱重构,直观地评价支持向量回归模型对在太赫兹区混合物中的目标物质量分数预测的准确性,为对未知混合物中特定物质的质量分数检测提供了一种更加准确的方法。

附图说明

图1是本发明提供的所述复杂体系中目标物及其类似物的定量和定性检测方法的步骤流程图;

图2是本发明实施例中频率在0.3-2.8thz范围内纯双酚a、双酚e、双酚s和双酚af的吸收光谱图;

图3是本发明实施例中支持向量回归模型的数据矩阵结构示意图;

图4a是本发明验证所得thz频率中的一元混合物样品中bpa吸收光谱重建与预测值的比较图;

图4b是本发明验证所得thz频率中的二元混合物样品中bpa吸收光谱重建与预测值的比较图;

图4c是本发明验证所得thz频率中的三元混合物样品中bpa吸收光谱重建与预测值的比较图;

图4d是本发明验证所得thz频率中的四元混合物样品中bpa吸收光谱重建与预测值的比较图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。

本发明所述方法提供了一种复杂体系中目标物及其类似物的定量和定性检测方法,如图1所示,包括以下步骤:

s1、获取待检测混合物样本的太赫兹时域波形,根据所述太赫兹时域波形得到所述混合物样本的吸收光谱。

将待检测混合物样本放置到太赫兹时域光谱系统的样品台上,获取该混合物样本的太赫兹时域波形,并将所述太赫兹时域波形中的光谱经过傅里叶变换并转换成吸收系数光谱。

s2、按照预设频率步长从吸收光谱中选取多个吸收光谱数据,将所述吸收光谱数据分别代入已知目标物及其类似物组成的一元混合物、二元混合物以及多元混合物在不同频率值所对应不同质量分数的多个支持向量回归模型,得到混合物样本中所述目标物及其类似物质量分数的预测值。

在预定的频率范围内(例如:双酚混合物的光谱范围为0.3-2.3thz),选择多个频率点,并将多个频率点所对应的数据信息输入到支持向量回归模型,得到的预测质量分数。由于所述支持向量回归模型是吸收光谱频率与目标物或者目标物类似物的质量分数的函数,因此基于频率点信息,可以得到目标物或者目标物类似物的质量分数信息。

具体的,本步骤中由于混合物样本具体含有的几种目标物及其类似物,和混合物样本中含有上述物质的质量分数均未知,因此为了实现对多元混合物中目标物及其类似物的定量和定性分析,本步骤还包括:

步骤s21、依次将吸收光谱数据中选取出的多个频率点代入目标物及类似物的一元混合物所对应的支持向量回归模型、二元混合物所对应的支持向量回归模型和各个多元混合物所对应的支持向量回归模型,分别得到所述支持向量回归模型输出的目标物及类似物质量分数。

s3、利用留一交叉验证方法根据所述预测值对混合物样本的吸收光谱进行重建,并根据重建后得到的吸收光谱定性分析出混合物样本中所含目标物和/或目标物类似物的名称。

利用留-交叉验证方法对上述步骤中预测出的混合物样本中的目标物及其类似物的质量分数对混合物样本的吸收光谱进行重建,并根据重建结果确定混合物样本中所含目标物和/或目标物类似物的质量分数及其名称。实现了对其进行定量和定性分析。

可选的,所述步骤s3还包括:

步骤s31、将混合物中目标物和/或目标物类似物的质量分数输入支持向量回归模型,得到太赫兹吸收光谱曲线。

具体的,上述步骤中所述利用留一交叉验证方法根据所述预测值对混合物样本的吸收光谱进行重建的步骤包括:

步骤s32、将计算出的部分已知质量分数作为测试数据,将计算出的剩余已知质量分数作为训练数据;使用训练数据对支持向量回归模型进行训练;

步骤s33、将支持向量回归模型输出的各个频率值所对应的吸收系数作为吸收光谱数据,重建吸收光谱。

分别通过依次对混合物中的目标物的质量分数、第一个目标物的类似物的质量分数、第二个目标物的类似物的质量分数和第三个目标物的类似物的质量分数进行预测,并将预测得到的质量分数相结合,对混合物的吸收光谱进行重建,判定出该混合物为一元混合物、二元混合物、三元混合物还是四元混合物。

在具体实施时,为了得到更好的预测效果,所述方法还包括:

s01、分别获取目标物及其类似物组成的一元混合物,二元混合物、以及多元混合物中预设质量分数范围内不同质量分数所对应不同频率的吸收光谱;

s02、利用支持向量回归法分析质量分数与频率之间的关系,分别得到目标物及其类似物组成的一元混合物、二元混合物、以及多元混合物中基础支持向量回归模型:

s03、利用留-交叉验证方法对所述基础支持向量回归模型进行训练,得到训练后的支持向量回归模型。

上述步骤首先基于已知数据,对支持向量回归模型进行训练,并计算训练后得到的支持向量回归模型输出的结果与真实值之间误差的测定系数和/或均方误差;当所述测定系数和/或均方误差满足预设阈值时,则停止对所述支持向量回归模型的训练,说明训练后的支持向量回归模型预测结果相对精准,已经可以满足需求。

下面以对混合物中双酚a及其类似物的定量和定性检测,对本发明所述方法做更为详细的说明。

由于这些限制,双酚a逐渐被一些其他双酚类化合物取代,如双酚s(bps),双酚af(bpaf)或双酚e(bpe)。这些化学物质共有典型的双羟苯基官能团结构,统称为双酚类似物。尽管这些类似物不存在局限性,但现有研究已报道了双酚类似物(如bpaf和bps)的多种毒性作用。应用上述所公开的方法对未知混合物中双酚a及其类似物进行定量和定性检测。

h1、获取混合物样本的吸收光谱。

对待测混合物样本在透射几何中使用自由空间thz-tds系统进行thz-tds测量。该系统由300mw锁模运转、800nm中心波长和84mhz重复频率脉冲组成,脉冲由ti:蓝宝石振荡器产生,ti:蓝宝石振荡器为2.2w532nmnd:yv04激光器(sprouttm,灯塔光子学)泵浦。gaas半导体天线用于产生thz脉冲,并采用znte晶体进行电光检测。以扫描速度为5μm/步,间隔时间为300ms,结果标称分辨率为45ghz的参数记录0-3.3mm(相当于0-22ps的时间窗)的thz光谱。所有样品都制作在样品台上,直径为3毫米的圆形区域。利用氮气吹扫光学装置,除去空气中的水蒸气,将湿度降低到小于5%。该系统的可用频率范围为0.1至2.6thz。为了使系统产生的随机误差和样品中存在的异质性最小化,对测试混合物样品测量多次,求平均值。

步骤h2、将混合物样本的吸收光谱输入支持向量回归模型,得到输出结果。

将混合物引入到支持向量回归模型中,用支持向量回归模型分别对单一、二元、三元和四元混合物中bpa的质量分数百分比从0到48%进行拟合。注意,散射图越接近参考线,支持向量回归模型的预测就越可靠。预测也可以用测定系数(r2)和均方误差(mse)进行定量评价。r2≤1是预测值与实际值的相关系数。mse≥0是预测值与实际值之间的均方误差。r2越大和mse值越小表明越好。

重复上述步骤,用支持向量回归模型分别对单一、二元、三元和四元混合物中对双酚s(bps),双酚af(bpaf)或双酚e(bpe)的质量分数从0到48%进行拟合,预测出双酚s(bps),双酚af(bpaf)或双酚e(bpe)的质量分数。

步骤h3、根据预测结果对混合物样本的吸收光谱进行重建。

将上述步骤中得到的预测结果输入支持向量回归模型,利用保留验证方案对混合物的吸收光谱进行重建。

本实施例通过透射式太赫兹时域光谱对四种双酚类混合物进行测量,应用支持向量机对其进行了分析。采用留一交叉验证方案,对双酚类混合物中bpa浓度的thz谱数据进行了有效的预测。采用保留验证方案作为重建thz吸收光谱的回归方法。我们的测量和方法突出了机器学习方法从复杂混合物系统的太赫兹谱中提取模糊特征的独特能力。我们的结果提供了进一步的证据,太赫兹光谱学结合机器学习方法是一个灵敏的定量分析工具,并应在未来的工业应用中发挥更大的作用。

在具体实施时,以双酚混合物中双酚类似物进行检测的方法,对如何根据已知信息构建支持向量回归模型进行以下解释:

设置双酚混合物的光谱范围为0.3-2.3thz,每个光谱中选择28个频率点。使用从每个吸收光谱中选择的优化频率步长给出n个光谱数据的训练数据集,其中,每个光谱数据点由m维向量(m=28)和目标物质量分数组成。支持向量回归模型的目的是找到频率对混合物中双酚类似物质量分数x的函数f(x),使得所有训练数据都可被预测,且与实际目标y的不超过预定义偏差ε≥0,同时函数f(x)尽可能平坦。

在支持向量回归模型中,f(x)的一般形式定义如下:

(1)

其中w是权重向量,是偏置项,如果考虑非线性回归,φ(x)是将x映射到高维空间的映射函数;否则,φ(x)=x,并且w•φ(x)计算w和φ(x)的点生成。

f(x)的平坦性可通过欧氏范数||w||2的最小化来保证。如果,则对,,的预测被认为是精确的。在实践中,为了允许违反某种合理程度的偏差,通常引入两个松弛变量,使得:

(2)

(3)

其中,回归误差可容忍到的值。f(x)的求解可归结为凸优化问题:

(4)

服从等式(2)和(3)。正常数c控制f(x)的平坦度和偏差违反的公差之间的折衷。方程(4)中的极小化问题可以用内核技巧在其对偶公式中更容易地求解。

对上述函数f(x)进行求解,通过将该质量分数的28个频率值输入到f(x),得到如图3所示的数据矩阵(图三的矩阵中包括:具有4i+4行(i质量分数*4次测量)和29列(28个频率+1个质量分数值)),以获得函数输出值,即可得到预测未知的测试数据。较佳的,本发明中采用libsvm库中的ε-svr模型。

为了验证本发明所提供方法的可以取得较准确的定量和定性结果,下面以实验结果对其进行验证。

首先,在具体的实施例中,选用双酚a(alfaaesar)及其三个双酚类似物、双酚e(tcitokyokasei)、双酚s和双酚af(j&kscience)。分别称出含有少于0.05%杂质的4个待检测物样本,并用球磨机研磨成粉末。将纯聚乙烯(pe,sigma-aldrich)150mg与不同量的bpa混合,并混合其他三种双酚制成单组分、二元混合、三元混合和四元混合的颗粒。表1给出了颗粒中不同双酚的质量分数。将所有混合物以少量反复混合在一起并再次研磨,以避免在样品中形成聚集体和异质簇和限制获得太赫兹光谱时出现的散射干扰。

表一

用颗粒压力机以8tons/cm2的力对所有样品压2min制成直径为13mm的样品圆形样品块。每种混合物制备两个样品,其中一个作为thz-tds测定的参考,以同样的方法制备出纯pe(150mg)颗粒和4种纯双酚颗粒。对每个样品测量4次,得到每个样品的太赫兹时域波形。

由于每个样品需要记录两个thz吸收光谱。因此,需要考虑每个样品的4个光谱。针对四元混合物的检测,则需要考虑到72个样品的混合物分析,144个原始光谱需引入到支持向量回归模型中。本发明中首先使用loocv来评估支持向量回归模型的性能。在loocv中,每次从原始数据集中选择吸收光谱作为测试数据,并且剩余的吸收光谱作为训练数据。svr用训练数据训练,并对剩下的光谱数据进行测试以获得偏差。重复这个过程,直到数据集中的每个谱数据都测试一次,并在所有数据上平均svr的性能。

将四类双酚混合物所得到的光谱数据(144个样本)引入到loocv-svr(留一交叉验证-支持向量回归)模型中用于预测,loocv-svr模型估计的预测值与实际值非常接近(r2=0.97985和mse=0.0080439),因此本发明所述公开的检测方法可以取得较为准确的预测值。

另外,为了检验svr模型的准确性和直观地呈现预测结果,随后采用保持验证方案。将样品中双酚的各种质量分数输入回归模型,得到thz吸收光谱的输出值。特别地,在每次验证过程中,将所有浓度数据中的已知质量分数值作为测试数据,剩余的质量分数值作为训练数据。在训练数据上训练svr,并在来自完全未知浓度的保持数据上进行测试svr。重复上述过程,直到每个浓度百分比测试一次,并通过对所有测试数据进行平均来获得svr的性能。考虑到每次输出一个频率处的每个吸收值,经过多次计算,得到宽带太赫兹谱。

为了得到清晰的光谱图像,我们仅给出四个质量分数混合物的重建结果,如图4a-图4d所示,预测结果与实验结果吻合较好,四个质量分数混合物分别是:

单混合物(bpa=36%);

二元混合物(bpa:bpe=24%:24%);

三元混合物(bpa:bpe:bps=24%:12%:12%)

四元混合物(bpa:bpe:bps:bpaf=24:8:8:8)。

本发明提供了一种复杂体系中目标物及其类似物的定量和定性检测方法,通过采用支持向量回归(svr)方法,对单组分、双组分、三组分和四组分双酚的太赫兹光谱数据进行分析,以获得与混合物中目标物及其类似物在预设质量分数对应的频率的支持向量回归模型。利用所述支持向量回归模型对未知混合物样本的质量分数进行预测,最后,通过光谱重构,直观地评价支持向量回归模型对在太赫兹区混合物中的目标物质量分数预测的准确性,为对未知混合物中特定物质的质量分数检测提供了一种更加准确的方法。

可以理解的是,对本领域普通技术人员来说,可以根据本发明的技术方案及其发明构思加以等同替换或改变,而所有这些改变或替换都应属于本发明所附的权利要求的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1