一种适用于中药混悬体系的检测方法与流程

文档序号:15017880发布日期:2018-07-25 00:00阅读:301来源:国知局

本发明属于中药智能制造领域,具体涉及中药智能制造在线分析领域,特别是涉及一种中药混悬体系的检测方法。



背景技术:

在线中红外(Mid-infrared,MIR)光谱技术采用傅立叶变换红外技术,衰减全反射探头浸入液体中直接测量物质的MIR区域(3000-650cm-1)的吸收,实时跟踪成分的含量变化,能有效监控连续的生产工艺。在线中红外光谱技术有以下优点:(1)不破坏样品;(2)检测速度快,信息丰富,准确度高;(3)不受固体颗粒、气泡、温度的影响;(4)能够在线检测。

传统针对中药混悬体系的含量分析方法,是通过手动取样离线分析或者在线安装过滤装置,实现含量的分析与监测。例如张燕等(张燕,吴永江,吴春艳,等.近红外在线检测丹红注射液醇沉过程中指标成分的含量变化[J].中药现代应用药学,2015,1(32):67-71.)针对丹红注射液醇沉过程采用在线近红外(NIR)光谱技术检测,样品经过了双联过滤器之后再进行了NIR光谱的检测及样品的收集。李彤彤等(李彤彤,胡甜,聂磊,等.近红外光谱技术快速测定参枝苓口服液醇沉过程中的5种指标成分[J].中国中药杂志,2016,9(41):3543-3549.)采用离线近红外光谱测定参枝苓口服液醇沉过程中指标成分的含量变化,样品经过了离心预处理,然后才进行的光谱扫描及含量测定。上述离线分析或者安装过滤装置的在线近红外分析存在以下潜在的缺点:离线分析涉及到工厂和操作者的安全,可能对生产过程破坏,并且需要保证样品在离线分析前不会继续反应或者改变,离线分析结果之前导致时间的耽误;在线安装过滤装置,由于过滤器易堵塞,清洗工程费时费力,会影响在线模型的预测精度。

CN200810094561.7公开了一种中药提取物的中红外光谱多组分定量分析方法,其是针对中药浸膏采用的离线中红外分析,由于该专利的离线检测,其需要先收集样本,再采集光谱,并且,该专利方法与现有技术中的离线分析方法存在相同的缺点,即涉及到工厂和操作者的安全,可能对生产过程破坏,并且需要保证样品在离线分析前不会继续反应或者改变,离线分析结果之前导致时间的耽误。

因此,为了更好的在线分析中药混悬体系中成分的含量,提高模型的在线适用性,在现有技术的基础上,建立了一种不受固体颗粒、气泡或者温度影响的在线中红外分析技术,该方法操作简便、快速,样品无需预处理。



技术实现要素:

本发明所要解决的技术问题是克服现有技术中的在线近红外检测时需要安装过滤装置,且过滤装置易堵塞、难清洗的问题,提供一种无需对样品进行预处理且预测准确度高的中药混悬体系的在线中红外定量分析方法。

为达到上述目的,本发明采用的技术方案是:

本发明的一个目的是提供一种中药混悬体系的检测方法,包括如下步骤:

步骤(1)、对中药混悬体系样品进行中红外光谱扫描并在线采集光谱数据,收集中药混悬体系样品并获取样品中成分含量的化验值;

步骤(2)、将采集到的光谱数据和化验值采用化学计量学方法进行模型参数优化,其中,进行所述的模型参数优化时采用多个评价指标;

步骤(3)、根据步骤(2)优化得到的模型数据,采用线性或非线性建模方法对光谱数据和化验值进行模型优化,建立最优模型;

步骤(4)、在线扫描待测中药混悬体系的光谱,将获得的光谱数据代入所述的最优模型中预测所述的待测中药混悬体系中成分的含量。

本发明中,所述的中药混悬体系是指难溶或不溶性颗粒不均匀的分散在中药药液内所形成的体系。

优选地,所述的中药混悬体系包括中药吸附过程的混悬体系或中药醇沉过程的混悬体系。

本发明中,中药混悬体系样品为中药吸附过程或中药醇沉过程中的样本。

本发明中,检测内容包括成分含量、固含物、金属离子和部分无机盐等,具体根据生产工序质量控制要求决定。

优选地,在进行步骤(1)之前,先设置光谱仪的参数,对所述的光谱仪进行调试及验证,并采集背景光谱及溶剂光谱。

本发明中的在线分析是指样品光谱为实时获取,预测的成分含量为实时获取。即,本发明中的样品无需进行预处理。本发明的方法检测时不受固体颗粒、气泡或温度的影响。

具体地,在进行光谱数据的采集时,探头直接接触中药混悬体系。

优选地,采用在线衰减全反射(ATR)法进行光谱的扫描。

具体地,步骤(2)中,所述的模型参数优化包括异常样本的识别、代表性样本的筛选、最佳光谱预处理方法的筛选及最优波段的筛选。其中,最优波段的筛选又称变量的筛选。

优选地,所述的最优波段范围为800-1700cm-1

本发明中,所述的异常样本的识别的方法有残差-杠杆值法、马氏距离法和主成分得分图法。

优选地,采用残差-杠杆值法进行异常样本的识别。

本发明中,所述的代表性样本的筛选的方法包括Kennard-Stone算法,Random sampling算法和Sample set partitioning based on joint X-Y distances算法。

优选地,采用Kennard-Stone算法进行代表性样本的筛选,划分校正集样本及验证集样本。

本发明中,所述的光谱预处理方法包括Savitzky-Golay平滑(Savitzky-Golay smoothing,S-G平滑)、小波去噪、Savitzky-Golay平滑结合一阶导数(Savitzky-Golay smoothing plus first-order derivatives,S-G 1st)、Savitzky-Golay平滑结合二阶导数(Savitzky-Golay smoothing plus second-order derivatives,S-G 2nd)、基线校正、多元散射校正(Multiplicative scatter correction,MSC)、标准正态变量变换(Standard normal variate transformation,SNV)、归一化。

优选地,采用Savitzky-Golay平滑来进行光谱的预处理。

本发明中,最优波段的筛选的方法包括相关系数法、间隔偏最小二乘法、协同间隔偏最小二乘法(synergy interval partial least squares,SiPLS)和移动窗口偏最小二乘法。

优选地,采用SiPLS法进行最优波段的筛选。

本发明中,优化后的模型数据是指样品光谱经异常样本的识别、代表性样本的筛选、最佳光谱预处理方法处理及波段筛选后得到的最佳数据。

本发明中,步骤(3)中,采用偏最小二乘法(partial least squares,PLS)、人工神经网络(artificial neural network,ANN)或最小二乘支持向量机(Least squares support vector machines,LS-SVM)建立最优模型。

优选地,采用PLS法建立最优模型。

本发明中,模型建立过程中,评价指标包括相关系数(Correlation coefficient,r)、校正集误差均方根(Root mean square error of calibration,RMSEC)、交叉验证集误差均方根(Root mean square error of cross validation,RMSECV)、预测集误差均方根(Root mean square of prediction,RMSEP)、偏差(BIAS)、性能偏差比(Ratio of performance to deviation,RPD)和预测相对偏差(Relative standard error of prediction,RSEP)。r越大,表明预测值与真实值越接近;RMSEC、RMSECV、RMSEP、BIAS、RSEP值越小,表明模型预测准确性越高;RPD值越大,表明模型的预测能力越强。

优选地,在步骤(3)中,采用优化后的模型数据建立模型后,将模型导入仪器中,在线预测新样本并调试验证,直至模型预测的准确度在生产可接受的标准范围内,获得最优模型。

优选地,步骤(3)中,将优化后的模型数据导入IC IR软件,建立最优模型。

优选地,步骤(4)中,所述的待测中药混悬体系设置平行样,平行测定两次,成分的化验值与预测值之间的差异小于等于5%。

由于上述技术方案运用,本发明与现有技术相比具有下列优点:

本发明通过对模型参数以及模型的优化,提高了中红外模型对成分的预测准确性,实现了中药混悬体系的在线分析,并能够准确分析中药混悬体系中成分的含量,该方法属于原位非破坏性技术,能实时、连续及时、安全地采集分析数据,深入了解工艺历程、机理和关键控制参数、判断生产工艺终点、操作简便快速,可用于中药生产工艺成分含量的在线分析与监控。

附图说明

附图1为解吸附液的MIR图谱。

具体实施方式

以下结合具体实施例对本发明做进一步详细说明。应理解,这些实施例是用于说明本发明的基本原理、主要特征和优点,而本发明不受以下实施例的范围限制。实施例中采用的实施条件可以根据具体要求做进一步调整,未注明的实施条件通常为常规实验中的条件。

实施例1:

1.样品的收集

根据银杏二萜内酯的解吸附工艺,制备10批不同批次(Z160104、Z160115、Z160125、Z160205、Z160214、Z160223、Z160302、Z160312、Z160322、Z160401)的解吸附过程样本。

2.光谱采集

打开MIR主机,预热30min后,设置光谱采集参数如下:光谱扫描起始波数650cm-1,终止波长3000cm-1,波数增量4cm-1,扫描次数256次。样品无需处理,直接用于扫描MIR光谱,每个样品平行测定3次,3条光谱的平均光谱用于模型建立,解吸附液的MIR图谱见图1。

3.含量测定

3.1对照品溶液的制备

精密称取对照品银杏内酯A(GA,纯度95.4%)10.068mg、银杏内酯B(GB,纯度95.4%)9.842mg,置于20mL容量瓶中,加质量百分比为50%丙酮溶解并定容至刻度,摇匀,即得GA浓度为0.4802mg·mL-1,GB浓度为0.4695mg·mL-1的混合对照品溶液,于4℃冰箱中冷藏,备用。

3.2供试品溶液的制备

取解吸附液适量,离心,取上清液适量,微孔滤膜(0.45μm)过滤,取续滤液,即得。

3.3色谱条件

色谱柱:Kromasil C18(250×4.6mm,5μm);流动相:甲醇(25%)-四氢呋喃(10%)-水(65%);洗脱模式:等度洗脱;柱温:35℃;流速:1mL·min-1;蒸发光检测器氮气流速为2.5L·min-1;漂移管温度:105℃;分别吸取对照品溶液和供试品溶液各适量,注入液相色谱仪。

4.模型优化

模型优化过程中,评价指标有相关关系数(Correlation coefficient,r)、校正集误差均方根(Root mean square error of calibration,RMSEC)、交叉验证集误差均方根(Root mean square error of cross validation,RMSECV)、预测集误差均方根(Root mean square of prediction,RMSEP)、偏差(BIAS)、性能偏差比(Ratio of performance to deviation,RPD)和预测相对偏差(Relative standard error of prediction,RSEP)。r越大,表明预测值与真实值越接近;RMSEC、RMSECV、RMSEP、BIAS、RSEP值越小,表明模型预测准确性越高;RPD值越大,表明模型的预测能力越强。

4.1异常点剔除

针对收集的样本,先进行异常样本剔除。异常样本的存在会影响模型的准确度和稳健性。根据样本光谱变量(X变量)和参考值(Y变量)的杠杆值和残差值来判别异常样本。样本的杠杆值和残差值越偏离0,越不利于模型的建立。X变量的异常或Y变量的异常,都应视为异常样本,予以剔除。同时,手工比对异常样本的光谱及化验值,排除人为因素干扰导致异常样本的误判。

4.2光谱预处理

由于NIR光谱的信噪比低,吸收峰重叠严重,因而需要通过有效的光谱预处理方法来消除噪音和干扰,获取有效的模型建立的信息,提高模型的稳健性。本文采用的预处理方法有:S-G平滑、归一化、S-G 1st、S-G 2nd、基线校正、MSC、SNV、小波去噪。

4.3波段筛选

本文针对预处理优选后的光谱,进一步采用SiPLS法将光谱划分为20个子区间,以RMSECV值为衡量标准,利用其中的4个子区间联合建立定量模型。

5.模型建立与验证

将经异常点剔除、光谱预处理和波段筛选之后的样本进行回归模型的建立。采用Kennard-Stone法优选80%样本作为校正集样本,20%的样本作为预测集样本。采用PLS法建立光谱矩阵和成分含量之间的定量模型。本文在综合其他指标的基础上,以RPD≥3,RSEP≤5%作为判别定量模型是否建立成功的依据。

对比例1

原中红外仪器自带的处理方法计算结果,基本与实施例1相同,模型优化采用如下方法:

原中红外仪器(ReactIR 15,METTLER TOLEDO)自带的数据处理软件IC IR,光谱预处理只能做简单的基线校正,波段选择是靠肉眼手动选择,模型参数较少,优化结果如下,r越大,表明预测值与真实值越接近;RMSEC、RMSECV值越小,表明模型预测准确性越高。由表1和表2可知,最佳建模波段为800-1600cm-1

表1银杏内酯A的中红外光谱的波段筛选结果

RMSEC、RMSECV的单位为“mg·mL-1”。

表2银杏内酯B的中红外光谱的波段筛选结果

RMSEC、RMSECV的单位为“mg·mL-1”。

取自生产的样本集,样本含量可能不在原校正集含量范围内,亦称为外部验证集。将建立好的模型应用于外部验证集的预测,其参考值与预测值见表3。GA含量的MIR模型的验证集RESP为5.19%,GB含量的MIR模型的验证集RESP为6.38%,均大于5%,GA含量和GB含量MIR模型应用于生产尚需进一步优化。

表3外部验证集的参考值与预测值

实施例2

数据经异常样本识别、代表性样本筛选后,基于MATLAB(R2012a,Mathwork Inc.,USA)平台,采用不同的光谱预处理方法及自动化的波段筛选方法对原有实验数据进行重新处理。基本与实施例1相同,模型优化采用如下方法:

有效的光谱预处理可消除光谱的噪音和干扰,获取有效的模型建立的信息,提高模型稳健性。常用的预处理方法有:①Savitzky-Golay平滑(Savitzky-Golay smoothing,S-G平滑);②归一化;③Savitzky-Golay平滑结合一阶导数(Savitzky-Golay smoothing plus first-order derivatives,S-G 1st);④Savitzky-Golay平滑结合二阶导数(Savitzky-Golay smoothing plus second-order derivatives,S-G 2nd)⑤基线校正;⑥多元散射校正(Multiplicative scatter correction,MSC);⑦标准正态变量变换(Standard normal variate transformation,SNV);⑧小波去噪。

S-G平滑和小波去噪主要用于除去光谱的噪音,提高信噪比;一阶导数用于消除光谱的基线漂移,二阶导数可消除光谱的旋转;MSC和SNV可降低样本中固体颗粒分布不均、大小不同和附加的散射对光谱的影响,SNV还可消除光程变化对光谱的影响;归一化处理可消除光程变化或样品稀释等变化对光谱产生的影响。为进一步对模型进行优化,本方法运用MATLAB软件,对光谱进行了多种预处理方法的比较,筛选依据r越大,表明预测值与真实值越接近;RMSEC、RMSECV、RMSEP、BIAS、RSEP值越小,表明模型预测准确性越高;RPD值越大,表明模型的预测能力越强。

不同预处理方法对银杏内酯A含量的PLS模型性能的影响结果见表4如下所示,最佳预处理方法确定为S-G平滑。其校正集rcal值为0.9856,RMSEC、RMSECV和BIAScal值分别为0.0081、0.0508、0.0064mg·mL-1;预测集rpre值为0.7820,RMSEP和BIASpre值分别为0.0403、0.0346mg·mL-1;模型的RPD值为1.49,RSEP值为9.43%。

表4不同预处理方法对银杏内酯A含量的PLS模型性能的影响

RMSEC、RMSECV、BIAS、RMSEP的单位为“mg·mL-1”;RSEP的单位均为“%”。

不同预处理方法对银杏内酯B含量的PLS模型性能的影响结果见表5如下所示,最佳预处理方法确定为S-G平滑。其校正集rcal值为0.9764,RMSEC、RMSECV和BIAScal值分别为0.0092、0.0374、0.0073mg·mL-1;预测集rpre值为0.8180,RMSEP和BIASpre值分别为0.0286、0.0223mg·mL-1;模型的RPD值为1.78,RSEP值为10.46%。

表5不同预处理方法对银杏内酯B含量的PLS模型性能的影响

RMSEC、RMSECV、BIAS、RMSEP的单位为“mg·mL-1”;RSEP的单位均为“%”。

中红外光谱经S-G平滑预处理和SiPLS法筛选后,结果如表6所示。最佳波段组合为1685-1573、1569-1458、1454-1342、1223-1111cm-1

表6GA与GB含量的PLS模型的变量筛选结果

经SiPLS法筛选后的光谱建立模型的结果如表7所示。以RPD和RSEP值为主要评判标准,GA含量的PLS模型中,SiPLS变量筛选后建立的模型性能较优,其校正集rcal值为0.9585,RMSEC、RMSECV和BIAScal值分别为0.0121、0.0183、0.0096mg·mL-1;预测集rpre值为0.9832,RMSEP和BIASpre值分别为0.0146、0.0112mg·mL-1;模型的RPD值为3.47,RSEP值为1.82%。

GB含量的PLS模型中,SiPLS法筛选后建立的模型性能较优,其校正集rcal值为0.8544,RMSEC、RMSECV和BIAScal值分别为0.0253、0.0348、0.0206mg·mL-1;预测集rpre值为0.9506,RMSEP和BIASpre值分别为0.0192、0.0150mg·mL-1;模型的RPD值为3.12,RSEP值为2.23%。

表7光谱最优变量波段筛选前后建模结果

RMSEC、RMSECV、BIAS、RMSEP的单位为“mg·mL-1”;RSEP的单位均为“%”。

取自生产的样本集,样本含量可能不在原校正集含量范围内,亦称为外部验证集。外部验证集的参考值与预测值见表8。GA含量的MIR模型的验证集RESP为2.42%,GB含量的MIR模型的验证集RESP为2.91%,均小于5%,GA含量和GB含量MIR模型应用于生产是可行的。

表8.外部验证集的参考值与预测值

结论

从对比例1和实施例2可见,中红外仪器自带的数据处理软件建立的模型中,GA含量的MIR模型的验证集RESP为5.19%,GB含量的MIR模型的验证集RESP为6.38%,均大于5%,GA含量和GB含量的MIR模型应用于生产尚需进一步优化。上述原始数据经重新处理后,GA含量的MIR模型的验证集RESP为2.42%,GB含量的MIR模型的验证集RESP为2.91%,均小于5%,优化后的GA含量和GB含量MIR模型应用于生产是可行的。

上述实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围,凡根据本发明精神实质所作的等效变化或修饰,都应涵盖在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1