本发明涉及一种混合物成分定性识别方法,尤其是涉及一种基于二极管阵列检测器和含噪向量误差模型的混合物成分闪速定性识别方法。
背景技术:
色谱技术已经成为一门用于混合物分离的通用技术,广泛应用于中草药、葡萄酒、农产品、石油等产品的质量控制和样品制备。图1给出了目前比较流行的液相色谱(hplc)联用二极管阵列检测器(dad)技术的原理示意图。分析溶剂(也称为流动相)保存在溶剂存储器1中,并通过输液泵2将流动相压入色谱柱3(也称为固定相)中。待分析的样品溶液通过送样器4进入分析系统,并跟随溶剂经过色谱柱3。由于溶液中的不同物质在色谱柱中停留的时间之间存在差异,在一定的分析条件(溶剂、色谱柱以及流程控制)下,不同物质会先后从色谱柱尾端流出。在色谱柱尾端安装二极管阵列检测器(dad)5,对流出色谱柱的物质进行检测记录。实验人员根据记录结果,对溶液中的物质组成进行定性与定量分析。物质在设定分析条件下流出色谱柱的时间(保留时间)可以作为定性分析的依据;物质流出时,检测器得到的信号强弱,可以作为定量分析的依据。图1中标号6代表计算机分析系统。
根据图1的结构组成可知,液相色谱技术的分析时间之所以较长,主要是溶液完全流经色谱柱需要较长的时间。这也是液相色谱技术之所以能够起到分离作用的工作原理。但如果能够在去除图1中色谱柱这一时间消耗单元的情况下,能够实现溶液中特定组成物质的定性识别,无疑会减少液相色谱技术的分析时间,提高溶液中的物质组成定性分析效率。
技术实现要素:
本发明针对现有技术不足,基于二极管阵列检测器获得dad检测数据,然后采用含噪向量误差模型分析算法,加强了计算机处理能力;实现了混合物成分闪速定性识别。在去除图1中色谱柱这一时间消耗单元的情况下,能够实现溶液中特定组成物质的定性识别;同时降低了由于色谱柱的存在而抬高的对输液泵的性能要求。
本发明所采用的技术方案:
一种混合物成分闪速定性识别方法,首先,将待测对象的样本送入dad检测系统获得dad数据x;然后,然后,对数据x建立如公式(1)所示的数学模型
式中,变量n表示样本中所含成分的个数;行向量
接下来,从标准光谱曲线库中提取待识别物质的标准光谱曲线s*;再将x和s*输入含噪识别算法进行识别,获得阳性或者阴性的识别结果;所述含噪识别算法为了判断dad数据x中是否包含了光谱曲线s*,通过引入一个行向量wt,得到公式(2)
yt=wt×x→s*t(2)
其中,yt是根据数据x和该行向量wt产生的一条曲线;符号→表示yt逼近s*t;
如果数据x中存在向量s*t,则yt和s*t将在形态上一样,否则,yt和s*t在形态上具有较大差别,因此,建立由公式(3)所示的含噪向量误差模型:
其中,符号
为了方便公式(3)的求解,重写公式(3)如公式(4)所示。
其中,
如果设定
其中,d=[d,d,…,d]是与wt相对应的一个常数向量,则公式(4)可以被写为
根据karush-kuhn-tucher条件,公式(7)的解满足如下方程
其中,s*t(j)表示曲线s*t的第j个元素的数值;
采用牛顿法求解公式(8)计算雅各比矩阵:
因此,可以得到如公式(10)所示的牛顿迭代公式
曲线yt可以按照公式(11)计算而来
最后,根据公式(12)所示的判据来判断dad数据x中是否含有目标成分的光谱s*t:
其中,ε的值根据公式(3)求解;ε*是提前设定好的一个很小的数。
所述的混合物成分闪速定性识别方法,矩阵m的求解方法如下:首先按照公式计算矩阵
然后按照公式(14)计算协方差矩阵c的特征值和特征向量,
[e,λ]=evd(c)(14)
其中,矩阵e是矩阵c特征值的正交特征向量;矩阵λ是矩阵c的特征值组成的对角矩阵;
按照公式(15)计算矩阵m,求得从
mt×t=inv[sqrt(λ)]×et(15)
所述的混合物成分闪速定性识别方法,含噪向量误差模型中所构建的数据
根据公式(7)的定义,得出如公式(17)所示的等式:
其中,m是矩阵
所以,我们有如公式(18)所示的关系
根据公式(5),得出如下公式(19):
因为从
将公式(19)和公式(20)代入公式(18),得到如公式(16)所示的等式。
所述的混合物成分闪速定性识别方法,首先,对dad数据进行如公式(1)所示的数学建模:
式中,变量n表示样本中所含成分的个数;行向量
本发明的有益效果:
1、本发明混合物成分闪速定性识别方法,采用含噪向量误差模型分析算法,加强了计算机处理能力;从而在去除图1中色谱柱这一时间消耗单元的情况下,能够实现溶液中特定组成物质的定性识别。
2、本发明混合物成分闪速定性识别方法,将不经过色谱柱而直接由dad进行检测的数据成为dad数据,然后通过含噪向量误差模型分析算法进行混合物成分闪速定性识别,程序简化,效率高;同时降低了由于色谱柱的存在而抬高的对输液泵的性能要求。
附图说明
图1所示是hplc-dad工作原理及本发明分析系统结构示意图;
图2所示是本发明闪速识别方法中的算法原理示意图;
图3是本发明闪速识别方法实验分析的试验数据;其中d、d1、d2、d3分别为混合样品、安赛蜜、山梨酸和糖精钠的三维视图数据;
图4所示为试验用的光谱曲线;
图5所示为计算误差曲线。
具体实施方式
下面通过具体实施方式,对本发明的技术方案做进一步的详细描述。
实施例1
参见图1、图2,本发明混合物成分闪速定性识别方法,首先准备待测对象的样本,并送入dad检测系统获得dad数据x;然后,然后,对数据x建立如公式(1)所示的数学模型
式中,变量n表示样本中所含成分的个数;行向量
接下来,从标准光谱曲线库中提取待识别物质的标准光谱曲线s*;将x和s*输入识别算法,获得阳性或者阴性的识别结果;所述识别算法为了判断dad数据x中
是否包含了光谱曲线s*,通过引入一个行向量wt,得到公式(2)
yt=wt×x→s*t(2)
其中,yt是根据数据x和该行向量wt产生的一条曲线;符号→表示yt逼近s*t;
如果数据x中存在向量s*t,则yt和s*t将在形态上一样,否则,yt和s*t在形态上具有较大差别,因此,建立由公式(3)所示的含噪向量误差模型:
其中,符号
为了方便公式(3)的求解,重写公式(3)如公式(4)所示。
其中,
如果设定
其中,d=[d,d,…,d]是与wt相对应的一个常数向量,则公式(4)可以被写为
根据karush-kuhn-tucher条件,公式(7)的解满足如下方程
其中,s*t(j)表示曲线s*t的第j个元素的数值;
采用牛顿法求解公式(8)计算雅各比矩阵:
因此,可以得到如公式(10)所示的牛顿迭代公式
曲线yt可以按照公式(11)计算而来
最后,根据公式(12)所示的判据来判断dad数据x中是否含有目标成分的光谱s*t。
其中,ε的值根据公式(3)求解;ε*是提前设定好的一个很小的数。
实施例2
参见图2,本实施例的混合物成分闪速定性识别方法,与实施例1的不同之处在于:进一步公开了矩阵m的求解方法:以求得从
首先按照公式计算矩阵
然后按照公式(14)计算协方差矩阵c的特征值和特征向量,
[e,λ]=evd(c)(14)
其中,矩阵e是矩阵c特征值的正交特征向量;矩阵λ是矩阵c的特征值组成的对角矩阵;
按照公式(15)计算矩阵m,求得从
mt×t=inv[sqrt(λ)]×et(15)。
实施例3
参见图2,本实施例的混合物成分闪速定性识别方法,与实施例1或实施例2的不同之处在于:所述含噪向量误差模型中所构建的数据
根据公式(7)的定义,得出如公式(17)所示的等式:
其中,m是矩阵
所以,我们有如公式(18)所示的关系
根据公式(5),得出如下公式(19):
因为从
将公式(19)和公式(20)代入公式(18),得到如公式(16)所示的等式。
实施例4
参见图1、图2,本实施例的混合物成分闪速定性识别方法,与前述各实施例的不同之处在于:进行速定性识别之前,首先对dad数据进行如公式(1)所示的数学建模:
式中,变量n表示样本中所含成分的个数;行向量
试验分析
试验数据如图3所示,其中d,d1,d2,d3分别为混合样品、安赛蜜、山梨酸和糖精钠的三维视图数据。图4所示为试验用的光谱曲线。其中,s1,s2,s3分别对应了安赛蜜、山梨酸和糖精钠的光谱曲线。s4,…,s16是根据s1,s2,s3的翻转,叠加等操作构造出来的光谱曲线。16条光谱曲线的计算结果见图5所示的计算误差曲线和表1所示的计算误差列表。
其中,曲线s10和s12对应的误差也比较小,那是因为他们和s2在形态上比较接近(见图4)。
表1.计算误差列表