专属性模式识别模型判别分析中药材资源指纹信息的方法

文档序号:5967973阅读:206来源:国知局
专利名称:专属性模式识别模型判别分析中药材资源指纹信息的方法
技术领域
本发明涉及中药质量控制技术领域,尤其涉及一种专属性模式识别模型判别分析中药材资源指纹信息的方法,该方法是一种对中药材资源的近红外和中红外指纹图谱构建专属性模式识别模型进行判别分析的质量控制方法。
背景技术
中药质量控制研究一直是中药化学非常热衷的研究领域之一。尽管我国有关中药质量控制方法的记载是世界上最早最全面的,但传统中药材在安全、有效、均匀、稳定等质量方面依然缺乏标准化的科学质量评价体系,中药国家质量标准还很不完善,尚不能充分反映中药质量状况,特别是一些指标成分含量测定,难以通过“量”达到控制“质”的目的。且许多指标成分并非某一药材所独有,通过指标成分控制质量,专属性也较差。而且中药材属生物体,因地理环境、种植条件、栽培技术、异地引种、采收时间和采集部位不同等诸方面的因素,即使同一种中药材,也很难控制化学成分的一致性。为了确保中药材的稳定性和高效性,以及保证中药其疗效和用药安全性,充分利用好中药这一博大的优势资源,必须对中药材资源进行质量控制,这主要包括控制对中药材资源的不同基源、有无掺杂使假、质量等级以及药材的道地性进行质量控制。但是,通常这些不同基源、真伪优劣中药材、道地性中药材的形态学特征和大多数化学物理特征可能几乎没有区别,仅由专家进行感官评价或性状鉴别、组织显微鉴别、理化鉴别等传统方法难以判别并且也缺乏客观依据。而从分析科学的角度出发,若沿用西药质控模式,测定一种或几种有效成分对中药进行质量判别,不能真正反映中药的质量。因为对于中药,其单味药的化学组成都已非常复杂并且大多为未知,少则几十种,多则成百上千种。而且,在传统的物理或化学分离过程中可能会造成一些组分或有效组分的损失甚至破坏,特别是那些微量或痕量组分极易流失或分解,这样从一部分组分的化学分析结果或一部分形态指数进行评价中药质量,不仅工作量极大,耗时耗材,而且对于中药的信息获取的不充分导致分析评价结果存在大的偏差。

发明内容
针对现有技术中存在的不足,本发明的目的在于提供了一种简便快速、科学客观、准确可靠的评价中药材资源的基源种属、真伪、优劣和道地性保护等质量控制问题的方法。该方法通过获取中药材的全息近红外和中红外的指纹校正信息,并对其进行虚拟的矩阵编码,再运用连续滑动窗口偏最小二乘判别分析方法对各中药材在所有窗口中校正指纹信息与虚拟的矩阵编码间关联建模,构建对各药材校正指纹信息的专属性模式识别模型,从而实现对未知中药材的辨识与判别。本发明的目的通过如下技术方案实现一种专属性模式识别模型判别分析中药材资源指纹信息的方法,其特征在于,按如下步骤进行(I)中药材样品的制备;(2)中药材近红外和中红外光谱全息指纹图谱的获取与光谱预处理校正;
(3)对中药材资源进行虚拟的矩阵编码;(4)中药材质量控制专属性模式识别训练模型的构建;(5)专属性训练模型对中药材资源的辨识与判断。本发明中药材样品的制备为经去泥沙、清洗干净,真空干燥后,用中药粉碎机粉碎过目筛,获取可供分析的中药材样品。本发明中药材样品的近红外指纹图谱的获取是以金箔为参比进行近红外光谱全波段扫描。中红外指纹图谱的获取可将中药材样品与适量溴化钾混合后压片,进行中红外全波段扫描。对全息中红外和近红外指纹图谱进行多元散射校正处理以克服不同波长点可能存在的不同程度影响以及由样品颗粒的大小和折射率等物理性质使光谱散射所导致的差异和/或通过二阶导数校正消除基线漂移和倾斜所造成的误差,改善光谱分辨峰,获取中药材全息得以增强的校正指纹信息。本发明中对中药材资源进行虚拟的矩阵编码,是通过将用于训练模型的中药材资源(如不同种植品种、不同产地、不同采收时期、不同加工炮制、不同贮存时间等的中药材,本发明列举了不同基源中药材,真伪中药材,不同道地性中药材的实施例)进行虚拟编码,每一行代表一个样品,将其虚拟编码为矢量code=、其编码原则为第j个元素为1,其余元素均为O。由此,可将用于训练模型的不同类中药材资源编码为一个矩阵Inxm,该矩阵的行数等于建模所用的中药材资源训练样本数n,列数等于中药材资源不同类别数m。本发明中对中药材质量控制专属性模式识别训练模型的构建,是通过设置一个以指纹校正图谱中第一个光谱数据点为窗口的起点,且窗口大小w取值为20至40间的任意窗口连续地在中药材训练集的全息近红外或中红外的校正指纹图谱数据中滑动,连续滑动的窗口中的光谱作为η个训练样本的响应信号矩阵Xnxp的子矩阵Xnxw,运用偏最小二乘判别分析方法将滑动的每一个窗口中的中药材训练集近红外和中红外的指纹校正图谱数据分别与编码的中药材资 源的类别训练矩阵Inxm关联,且在每一个窗口位置,对所有训练集样本建立不同隐变量的偏最小二乘判别分析子模型,SP:1nXm,t=XnXw, tR m, t+EnXffl,t;其中,RwXm,t是t个隐变量的偏最小二乘判别分析模型的回归系数矩阵,Enxm,t为残差矩阵。然后计算这一系列不同隐变量下偏最小二乘判别分析子模型训练的分类残差,并对窗口作图,获取具有低的(优先选择分类残差在整个光谱区间最小的区段,若指纹信息量不够,依次选择次小的区段进行组合)分类残差和低维数(当模型中隐变量的增加不能显著减小分类残差时,则优选该隐变量数)模型的特征指纹信息区间,即由此有效地消除不同类中药材资源指纹信息中非线性和复共线性等相关因素的影响,甄别得到中药材全息校正光谱中所隐含的专属指纹特征信息的系列有用变量区间,并将其组合后与中药材资源的虚拟编码类别矩阵间构建具有专属性特征的偏最小二乘判别分析模型,即:Inxm=XnxpRpxm;其中,P是提取得到的差异性专属指纹特征信息区间所含的波长数,m是类别数。编码的中药材资源的类别训练矩阵Inxm的每一列对获得的专属性特征信息矩阵Xnxp进行PLSl回归,回归矩阵Rpxm的每一列为PLSl的回归系数量,最佳隐变量数由η-重交互验证(η不小于5)确定。本发明中专属性训练模式识别模型对中药材资源的辨识与判断,是通过辨识和判别未知中药材资源样品类别矩阵Im的解码进行。该未知样品类别矩阵Iun的解码的获得计算如下:在未知样品的响应信号矩阵Xu^p专属性模型回归得到的矩阵Rpxm之间建模,即:im=xmRPxm。通过解码的ImM可获知未知的任意第j个样品的类别解码矢量V中最大值所出现的第m个位置,从而判定中药材资源的类别属性。即=Mj=CbCodemax (V ,.);其中,Mj为第j个样品的类别,deCOdemax(V'表示第j个样品的解码矢量V'」最大元素的位置。本发明中所阐述的方法,相比传统以指标化学成分含量高低评判中药质量的方法有诸多优势,包括样品预处理简单、无损分析、无有机溶剂污染、操作简便、分析速度快,能更全面科学客观地从不同的中药材中寻找出决定样本差异的特征隐变量,从而达到对不同属性和特征的中药材进行专属性快速判别的目的。相比近红外全息指纹质量控制方法,该方法通过甄别剔除无用光谱信息干扰和专属性提取隐含的有用特征指纹信息,不仅能极大提高分析速度,而且能提高识别能力,更适应于大批量药材质量控制与监测。本发明为客观评价中药材的种属、真伪、优劣和道地性保护等质量控制问题提供一种简便快速、科学客观、准确可靠的技术手段。


图1为中药材秦艽4种基原植物共1120个样品的近红外指纹图谱(a)原始光谱;(b)多元散射校正光谱;(C) 二阶导数光谱;(d)多元散射校正结合二阶导数校正光谱;图2为中药材秦艽4种基原植物共1120个样品的中红外指纹图谱(a)原始光谱;(b)多元散射校正光谱;(C) 二阶导数光谱;(d)多元散射校正结合二阶导数校正光谱;图3为甄别的中药材秦艽4种基原植物的专属性特征差异指纹信息区间图示。(a)近红外;(b)中红外;箭头间所指区域为专属性指纹区间。图4为本发明方法建立的专属性训练模式识别模型对4种基原植物解码的辨识与判断图示。(a)近红外;(b)中红外。图5为麻花秦艽与2种其伪品黑秦艽和红秦艽共560个样品的近红外指纹图谱(a)原始光谱;(b)多元散射校正光谱;(C) 二阶导数光谱。图6为麻花秦艽与2种其伪品黑秦艽和红秦艽共560个样品的中红外指纹图谱
(a)原始光谱;(b)多元散射校正光谱;(C) 二阶导数光谱。图7为甄别的麻花秦艽与2种其伪品黑秦艽和红秦艽的专属性特征差异指纹信息区间图示。(a)近红外;(b)中红外;箭头间所指区域为专属性指纹区间。图8为本发明方法建立的专属性训练模式识别模型对麻花秦艽与2种其伪品黑秦艽和红秦艽解码的辨识与判断图示。(a)近红外;(b)中红外。图9为6种不同道地性小秦艽共480个样品的近红外指纹图谱(a)原始光谱;(b)多元散射校正光谱;(C) 二阶导数光谱。图10为6种不同道地性小秦艽共480个样品的中红外指纹图谱(a)原始光谱;(b)多元散射校正光谱;(C) 二阶导数光谱。图11为甄别的6种不同道地性小秦艽的专属性特征差异指纹信息区间图示。(a)近红外;(b)中红外;箭头间所指区域为专属性指纹区间。图12为本发明方法建立的专属性训练模式识别模型对6种不同道地性的小秦艽解码的辨识与判断图示。(a)近红外;(b)中红外。
具体实施方式
下面申请人将结合具体的实施例对本发明方法做进一步的详细说明,以使本领域技术人员更加清楚地理解本发明。但以下内容不应理解为是对本发明的权利要求书请求保护范围的限制。实施例1:中药材秦艽4种基源植物指纹信息的判别分析主要仪器:Antaris II傅立叶变换近红外光谱仪;FT_IR NIC0LET6700傅立叶变换红外光谱仪。1.中药材秦艽4种基源植物近红外光谱和中红外光谱指纹信息采集将中药材粗茎秦艽、秦艽、小秦艽、麻花秦艽4种秦艽的基源植物分别经去泥沙、清洗干净,真空干燥2小时,用中药粉碎机粉碎后过200目筛,分别取适量各秦艽的基源植物样品置测量杯中,以金箔为参比,在^OO-lOOOOcnT1波数范围进行近红外全谱扫描,共收集了 1120个4种秦艽的基源植物样品的近红外光谱指纹信息,见图1(a);另取适量各秦艽的基源植物样品粉末2mg与200mg溴化钾混合研磨均匀、压片,经傅立叶变换红外光谱仪进行测定,也共收集了 1120个4种秦艽的基源植物样品的中红外光谱指纹信息,见图2(a);对于采集得到的近红外光谱和中红外光谱的数据集划分一致,均将1120个4种秦艽的基源植物样品光谱随机随机划分为726个训练样本和394个预测样本,其中各基源植物样品光谱标记信息具体参见表I。表I中药材秦艽4种基源植物样品光谱标记信息
权利要求
1.一种专属性模式识别模型判别分析中药材资源指纹信息的方法,其特征在于,按如下步骤进行: (1)中药材样品的制备; (2)中药材近红外和中红外光谱全息指纹图谱的获取与光谱预处理校正; (3)对中药材资源进行虚拟的矩阵编码; (4)中药材质量控制专属性模式识别训练模型的构建; (5)专属性训练模型对中药材资源的辨识与判断。
2.如权利要求1所述的方法,其特征在于步骤(I)中药材样品的制备过程为去泥沙、清洗干净,真空干燥后,用中药粉碎机粉碎过目筛,获取可分析的中药材样品。
3.如权利要求1所述的方法,其特征在于步骤(2)中中药材样品的近红外指纹图谱的获取是以金箔为参比进行近红外光谱全波段扫描;中红外指纹图谱的获取为将中药材样品与适量溴化钾混合后压片,进行中红外全波段扫描,并对全息中红外和近红外指纹图谱进行多元散射校正和/或通过二阶导数校正,获取中药材全息得以增强的校正指纹信息。
4.如权利要求1所述的方法,其特征在于步骤(3)中对中药材资源进行虚拟的矩阵编码,是通过将用于训练模型的中 药材资源进行虚拟编码,每一行代表一个样品,将其虚拟编码为矢量code=、其编码原则为第j个元素为1,其余元素均为0,由此,将用于训练模型的不同类中药材资源编码为一个矩阵Inxm,该矩阵的行数等于建模所用的中药材资源训练样本数n,列数等于均中药材资源不同类别数m。
5.如权利要求1所述的方法,其特征在于步骤(4)中对中药材质量控制专属性模式识别训练模型的构建,通过设置一个以指纹校正图谱中第一个光谱数据点为起点、大小取值在20至40间的任意窗口连续地在中药材各训练样本集的全息近红外或中红外的校正指纹图谱数据中滑动,连续滑动的窗口中的光谱作为η个训练样本的响应信号矩阵Xnxp的子矩阵Xnxw,运用偏最小二乘判别分析方法将滑动的窗口中的中药材训练集近红外或中红外的指纹校正图谱数据与编码的中药材资源的类别训练矩阵Inxm关联,且在每一个窗口位置,对所有训练集样本建立不同隐变量的偏最小二乘判别分析子模型: InXm, t—-^nXw, t^wXm, t+EnXm, t 其中,Inxffl, t是t个隐变量的偏最小二乘判别分析模型的类别训练矩阵,Rwxm, t是t个隐变量的偏最小二乘判别分析模型的回归系数矩阵,Enxm,t为残差矩阵; 计算这一系列不同隐变量下偏最小二乘判别分析子模型的分类残差,并对窗口作图,获取具有低的分类残差和低维数模型的特征指纹信息区间,甄别得到中药材全息校正光谱中所隐含的专属指纹特征信息的系列有用变量区间,并将其组合后与中药材资源的虚拟编码类别矩阵间构建具有专属性特征的偏最小二乘判别分析模型,即=Inxm=XnxpRpxm;其中,P是提取得到的差异性专属指纹特征信息区间所含的波长数,m是类别数,Inxm为中药材资源的类别训练矩阵,Xnxp为获得的专属性特征信息矩阵,Rpxm为回归矩阵;模型对Inxm的每一列对获得的专属性特征信息矩阵Xnxp进行PLSl回归,回归矩阵Rpxm的每一列为PLSl的回归系数量,最佳隐变量数由η-重交互验证确定。
6.如权利要求1所述的方法,其特征在于步骤(5)中专属性训练模式识别模型对中药材资源的辨识与判断,是通过对辨识和判别的未知中药材资源样品的类别矩阵Iun进行解码,获知未知的任意第j个样品的类别解码矢量中最大值所出现的第m个位置,从而判定中药材资源的类别属性。
7.如权利要求6所述的方法,其特征在于步骤(5)中未知样品类别矩阵Im的解码的获得计算如下:通过未知样品的响应信号矩阵Xm和专属性模型回归得到的矩阵Rpxm之间建模获得未知样品类别矩阵Iun的解码,即=Iun=XunRpxm, MJ=MJ=decodemax(v/」..);其中,Mj为第j个样品的类别,deCOdemax(V',.)表示某个所需预测判别的未知中药材样品解码矢量V,」最大元素的位 置。
全文摘要
本发明属于中药质量控制技术领域,具体公开了一种专属性模式识别模型判别分析中药材资源指纹信息的方法,该方法按如下步骤进行(1)中药材样品的制备;(2)中药材近红外和中红外光谱全息指纹图谱的获取与光谱预处理校正;(3)对中药材资源进行虚拟的矩阵编码;(4)中药材质量控制专属性模式识别训练模型的构建;(5)专属性训练模型对中药材资源的辨识与判断。本发明方法为客观评价中药材的种属、真伪、优劣和道地性保护等质量控制问题提供一种简便快速、科学客观、准确可靠的技术手段。
文档编号G01N21/35GK103076300SQ201210593100
公开日2013年5月1日 申请日期2012年12月31日 优先权日2012年12月31日
发明者杨天鸣, 付海燕 申请人:武汉鑫方生物科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1