假药判别分析装置、系统以及方法

文档序号:5872817阅读:210来源:国知局
专利名称:假药判别分析装置、系统以及方法
技术领域
本发明涉及一种假药判别分析装置、包括该假药判别分析装置的假药分析系统, 以及一种假药分析方法。
背景技术
假药是世界各国特别是发展中国家共同面临的问题之一。目前,制售假药的现象 时有发生,导致药物的安全性往往无法得到保证,严重危害人民健康,且扰乱了药品市场的 正当有序竞争。药品抽验是药品监督管理工作的必要技术支撑,在基层监督中开展快速鉴 别药品、提高识别假药的能力及工作效率,已是当务之急。当然由于造假形式多变,假药的 现场快速识别也面临很严峻的技术挑战。假药主要有四种情况(根据其化学本质分类)1,药片中不含主药;1,药片中含有 主药成分,但是主药的化学结构完全不同于真药的主药;3,药片中含有主药成分,且主药的 化学结构与真药的主药有很大的相似性(如同系物);4,假药中含有正确的主药成分,但是 主药的含量与真药中主药含量不一致。针对以上四种假药的情况,假药识别通常有化学反应、薄层色谱、液相色谱及联用 技术等多种定性与定量方法,综合分析测定结果,互相补充验证判定。但由于它们耗时较 长,样品需要量较大,多为破坏性鉴别等原因,普及性存在一定问题。出于基层打假经常性 的大范围筛查样品的需求,需要有一些准确、快速、简便的方法。近年来,随着化学计量学的 发展,光谱法受到国内外广泛的重视近红外光谱重叠严重,对很多药品的测定精度不够理 想;红外光谱法对测试环境温湿度要求相当高,样品制作也较麻烦,检测周期较长,不能满 足快速检验的要求;而拉曼光谱法比较适用于假药的检测,尤其是便携式拉曼光谱仪具有 仪器体积小,轻巧便捷;样品需要量少,无需前处理;可以快速、无损地获取药品光谱等优 点o获取药品拉曼光谱以后,光谱信息处理手段主要有光谱直接比对法和模式识别 方法等。光谱直接比对的方法主要适用于主药含量相对高的药片,现有的文献显示该方法 的检测限约为10% ;模式识别方法需要建立许多模型来鉴别假药,每个药品至少需要建立 一个模型,并且每个模型都需要大量的样本作为训练集,所以这需要非常多的样品(常用 药品上千种,每种药品均需要数百个训练集样品)和极大的工作量作为支撑,使其推广受 到诸多限制。而且,便携式光谱仪在应用时还存在一些缺点,例如分辨率较低无法表现光谱 的细节特征、噪音较大、峰位偏移、真药的主药成分含量必需已知等。因此,如何在人力、试验场地、试验仪器、试验样品等均有限的条件下,采用环保、 快速的便携式拉曼光谱仪,发展准确、易用的拉曼光谱信息处理方法,从而有效而准确地识 别药品的真伪,已成为众多科研、药检人员关注的重点之一。为解决上述问题,本申请人曾在前一申请(申请号CN 2006100288495)中公开了 一种药物检测方法,该方法基于红外光谱检验中药掺杂化学药品,但该方法未能解决上述 缺陷,也未能充分考虑到便携式拉曼光谱仪的一些特殊情况,因此该方法不能简单套用于
5假药的判别。

发明内容
为了解决本领域的上述问题,作出了本发明。本发明的目的在于提供一种新颖的假药判别分析装置和包括该假药判别分析装 置的假药分析系统,以及一种新颖的假药分析方法。在第一个方面,本发明提供了一种假药判别分析装置,其包括以下的数据处理模 块⑴控制模块;(2)数据接收模块该模块在控制模块的控制下从拉曼光谱仪接收拉曼光谱图数 据,并将该数据传输至小波滤噪模块;(3)小波滤噪模块该模块被配置为将从数据接收模块传输的拉曼光谱图进行小 波变换以滤除噪音;(4)插值模块该模块被配置为对经小波滤噪的拉曼光谱图进行插值运算,将计 算的函数值插入光谱图原有的数据点之间,再将所有的数据点重新拟合为新的插值后光 谱;(5)选峰模块该模块被配置为将待测药片主药成分对照品的插值后光谱进行选 峰处理,选择强度大于最强峰的 10%,优选5%的散射峰作为选定峰位;(6)基线光谱计算模块该模块被配置为分别取各选定峰位对应的待测药片拉曼 光谱的峰,减去主药成分对照品对应的峰X主药成分含量P,从而得到理论上的基线光谱;(7)峰数比较模块该模块被配置为对上述基线光谱中的近直线的原始光谱峰的 个数进行计数,并计算主药成分对照品选定峰位的峰个数的一半作为主药成分对照品半峰 数,然后将近直线原始谱峰计数结果与主药成分对照品半峰数进行比较;以及(8)判断模块A 该模块根据依照峰数来判定所述样品是否为假药的预定判定条 件对峰数比较模块的比较结果进行判定,符合条件(在本发明的一个优选实施方式中为上 述计数结果小于主药成分对照品半峰数)的直接判定为假药,不符合条件(该计数结果不 小于主药成分对照品半峰数)的判定为可疑样品,并将判定结果输出至控制模块。在此要注意的是,步骤(8)中的预定判定条件可以根据具体的情况来调整,本发 明不限于依照峰数来判定结果,还可以是其他的判定条件,只要能够对判断模块A所接收 到的数据进行分析判定并得到结果,均可以应用于本发明的装置中。该预定判定条件可在 作为本发明的装置中所带有的数据分析软件的参数而预设,或嵌入在硬件的处理器中,也 可以由用户经人机界面通过输入输出装置而输入。在第二个方面,本发明提供了一种假药判别分析装置,除了上述各模块以外,还进 一步包括(9)峰位校正模块该模块被配置为将经判断模块A判为可疑样品的待测药片 光谱与主药成分对照品原光谱上的散射峰根据预定匹配阈值,并将匹配成功的峰位根据 上述基线光谱进行相应的红移或蓝移校正,其中所述预定匹配阈值为士1 士5CHT1,优选 士 3CHT1 ;(10)含量区间计算模块该模块被配置为对经峰位校正获得的各选定峰作如下计算待测药片峰,减去对应的主药成分对照品的峰XP/2,获得的光谱根据公式r = corroef(ArzA2)计算每个选定峰位处的连续多个光谱数据点的局部直线的回归系数r,其 中corroef函数表示相关系数,含量因子z由-100%至+100%取值,其步长为0. 01 %,为 待测药片光谱,A2为主药成分对照品光谱;以及取|r| >N为局部直线的判据,所对应的含 量因子构成的区间即每个选定峰位处的含量区间,其中N选自0. 9 0. 9999,优选0. 99 ;(11)含量区间平移模块该模块被配置为将待测药片的每个选定峰位处计算出 来的含量区间,根据基线光谱在每个选定峰位处对应的凹凸情况,对上述含量区间进行平 移;(12)含量区间加权模块该模块被配置为对待测药片的每个选定峰位处计算出 来的含量区间进行加权,根据主药成分对照品光谱的每个选定峰的绝对峰强与相对峰强进 行加权;(13)药物含量预测模块该模块被配置为将每个选定峰位处的含量区间,经平 移、加权后纵向叠加求取各个选定峰的含量区间之和,以计算的含量区间和为纵轴,含量因 子值为横轴做图,在该图的纵轴上的最大含量区间和S_所对应的横轴上的含量因子值,即 为预测得的待测药片主药成分含量zp ;以及(14)判断模块B 该模块根据预定判定条件对经药物含量预测模块预测的含量因 子%进行判定,符合条件(在本发明的一个优选实施方式中为%<0)的直接判定为假药, 不符合条件(Zp > 0)的判定为可疑样品,并将结果输出至控制模块。在第三个方面,本发明提供了一种假药分析装置,其还进一步包括以下模块(15)主成分分析模块该模块被配置为从此类药品的已知真药与经判断模块A或 B判为可疑样品的所有待测药片的原始光谱中,选取合适的波段(例如,信号较丰富的一段 光谱谱段),进行小波滤噪、一阶导数和向量标准化的预处理,再进行主成分分析;以及(16)判断模块C 根据预定判定条件对主成分分析后的结果进行判定,符合条件 (在本发明的一个优选实施方式中为主成分分析图即PCA图中的集中点)判定为真药,不符 合条件(PCA图中的离散点)判定为假药,并将结果输出至控制模块。在第四个方面,本发明提供了一种假药分析系统,该分析系统包括上述各假药判 别分析装置和拉曼光谱仪,其中两者以任意的连接方式相连接以传输数据。在第五个方面,本发明提供了一种假药分析方法,该方法包括以下的步骤(1)通过拉曼光谱仪分别获取待测药片和待测药片主药成分对照品的拉曼光谱图 (后者可预存于分析系统中);(2)对待测药片和主药成分对照品的原始光谱进行小波滤噪以滤除高频噪音;(3)对经步骤(2)滤噪后的拉曼光谱图上的各原始数据点进行插值运算,将计算 后的函数值插入至光谱原有的数据点之间,再将所有的数据点重新拟合为新的插值后光 谱;(4)对经步骤(3)获得的光谱曲线进行选峰处理,将主药成分对照品光谱中强度 大于最强峰的 10%,优选5%的散射峰作为选定峰位;(5)取与各选定峰位对应的待测药片拉曼光谱的峰,减去主药成分对照品对应的 光谱X主药成分含量P,从而得到理论上的基线光谱;以及(6)对步骤(5)中获得的基线光谱中近直线的原始光谱峰的个数进行计数,并将其计数结果与主药成分对照品半峰数进行比较,如果上述计数结果小于主药成分对照品半 峰数,则直接判定该待测药片为假药,否则判为可疑样品。在第六个方面,本发明提供了一种假药分析方法,该方法可进一步包括以下的步 骤(7)如果上述计数结果不小于主药成分对照品半峰数,则将步骤(3)获得的该待 测药片光谱与主药成分对照品原光谱上的散射峰根据预定匹配阈值进行匹配,将匹配成功 的峰位根据上述基线光谱进行相应的红移或蓝移校正,其中所述预定匹配阈值为士 1 士 5CHT1,优选 士 3CHT1 ;(8)对经峰位校正获得的各选定峰作如下计算待测药片峰,减去对应的主药成 分对照品峰XP/2,获得的光谱再根据公式r = corroef(A1-zA2)计算每个选定峰位处的连 续多个光谱数据点的局部直线的回归系数r,其中含量因子z由-100%至+100%取值,其步 长为0. 01%,其中~为待测药片光谱,A2为主药成分对照品光谱;(9)取|r| >N为局部直线的判据,所对应的含量因子构成的区间即每个选定峰位 处的含量区间,其中N选自0. 9 0. 9999,优选0. 99 ;(10)将待测药片的每个选定峰位处计算出来的含量区间,根据基线光谱在每个选 定峰位处对应的凹凸情况,对上述含量区间进行平移;若基线光谱为凸曲线,则含量区间向 左平移;若基线光谱为近直线,则含量区间不平移;若基线光谱为凹曲线,则含量区间向右 平移;(11)对待测药片的每个选定峰位处计算出来的含量区间经平移后,根据主药 成分对照品光谱的每个选定峰的绝对峰强与相对峰强,根据下式进行加权求和S_ = E hXIiXRI丄,其中r,待测药片主药成分第i个峰的含量因子区间I,待测药片主药成分第i个峰的绝对峰强的权重因子R 待测药片主药成分第i个峰的相对峰强的权重因子从而获得这些峰的|r|加权后以计算的含量区间和为纵轴,含量因子值为横轴做 图,在该图的纵轴上的最大含量区间和S_所对应的横轴上的含量因子值,即为预测得的待 测药片主要成分含量zp;以及(12)若药物含量预测模块所预测的含量因子zp < 0,则其对应的待测药片直接判 为假药,否则判为可疑样品。在第七个方面,本发明提供了一种假药分析方法,该方法还可进一步包括以下步 骤(13)若待测药片预测的含量因子zp > 0,则从此类药品的已知真药与判为可疑样 品的所有待测药片的原始光谱中,选取合适的波段(例如,信号较丰富的一段光谱谱段), 进行小波滤噪、一阶导数和向量标准化的预处理,再进行主成分分析;以及(14)将主成分分析后对应于PCA图中离散点对应的待测药片判定为假药,其余则 判为真药。本发明的假药判别分析装置和假药分析方法采用无模型分析法的原理,形成一种 新颖的假药判别系统和体系。本发明的优点在于不需要对每个药品各自建立模型,大大减 少了分析工作量、繁琐程度和工作实践,提高了检测效率和速度。本发明的有益效果综合如
8下1.本发明的假药分析方法在原LSLS (局部直线筛选)方法的基础上进行了改 进,使其更加稳健、合理,并且结合PCA(主成分分析法),形成一套完整的假药判别体系。 其中对于原LSLS方法的改进主要包括以下几个方面小波变换和插值的预处理、将“药 片_P/2(药片光谱-主药成分光谱XP/2) ”光谱作为LSLS的计算光谱、峰位校正、含量区 间的平移和加权以及药物含量的预测方式等。2.本发明的假药判别分析方法只需要一张待检化合物光谱与极少量的真品药片 (药片数目< 10个)光谱,就可以对待测药片进行真伪鉴别。3.本发明的假药分析系统通过将本发明的假药判别分析装置与拉曼光谱仪连接, 可以实现药物的在线和实时监测,快速、简便、准确率高。


图1是根据本发明的第一实施方式的配置示意图;图2是根据本发明的第二实施方式的配置示意图;图3是根据本发明的第三实施方式的配置示意图;图4是一段曲线插值前后的比较;图5是含量因子区间平移原理图;图6是加权前(左)与加权后(右)的结果图;图7是实现本发明的假药分析方法的主例程的计算机流程示意图;图8是实现本发明的假药分析方法的子例程1的计算机流程示意图;图9是实现本发明的假药分析方法的子例程2的计算机流程示意图;图10是多种药片的拉曼光谱图,其中格列喹酮片为(1),格列本脲片为(2),格列 齐特片为(3),格列吡嗪片为(4),吡格列酮片为(5)以及格列美脲片为(6);图11是多种药片小波变换后的拉曼光谱图,其中格列喹酮片为(1),格列本脲片 为(2),格列齐特片为(3),格列吡嗪片为(4),吡格列酮片为(5)以及格列美脲片为(6);图12是本发明的实施例的PCA结果图,其中左图中的点6、7是离散点;右图中的 点6、7、9是离散点,均判定为假药。
具体实施例方式术语定义下面给出本文中所使用的一些术语的定义。在此应注意,为简便起见,在下面给出 的定义仅是一般性的定义,如没有定义或产生歧义,其准确的含义应以本领域普通技术人 员所知晓的在本领域中所使用的常用定义,或是本领域的工具参考书中的定义为准。无模型分析常规的分析方法需要大量的已知样品建立模型,然后利用该模型对 未知样品进行分析。但药品类型太多,每类药品的生产商众多、批次众多,如果每类药品都 建立模型,工作量极其巨大。无模型分析考虑假药现场快速分析的实际需求,不建立每类药 品的分析模型,依据主药成分对照品与待测样品的各一张光谱,直接进行分析。小波变换小波变换是一种窗口大小(即窗口面积)固定但其形状可改变,时间窗 和频率窗都可改变的时频局域化分析方法,即在低频部分具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率,所以也被称为数学 显微镜。插值在离散数据的基础上补插连续函数,使得这条连续曲线通过全部给定的离 散数据点。插值是离散函数逼近的重要方法,利用它可通过函数在有限个点处的取值状况, 估计出函数在其它点处的近似值。主药成分药品制剂中发挥药效的成分。基线光谱基线光谱一般是扫描空白样品(不含主药成分)得到的空白光谱。本 文中,基线光谱是含量区间平移的依据。近直线任意连续3点组成的窗口,由最小二乘线性回归法求得的直线回归系数 绝对值|r| >0.99(或极近1),那么这三点绘成的线形,被称为近直线。匹配阈值能够进行匹配的最大权限范围,匹配范围内的最大值。红移光谱向长波(红)端的位移。蓝移光谱向短波(蓝)端的位移。局部直线全谱中某些连续数据点连成的谱段为直线或近直线,这些直线或近直 线上的点组成的谱段称为局部直线。含量区间将药片谱段对化合物光谱的选定峰进行差减,差减的系数为含量因子, 含量因子由-100%至+100%取值,其步长为0.01%。当差减到从近直线到直线时候,会产 生一组含量因子,这些含量因子组成的范围称为每个选定峰的含量区间。光谱凹曲线光谱上任意连续3点组成的窗口,由最小二乘线性回归法求得的直 线回归系数绝对值|r|小于0.99且该段曲线位于其切线上方,那么这三点绘成的线形,被 称为光谱凹曲线。光谱凸曲线光谱上任意连续3点组成的窗口,由最小二乘线性回归法求得的直 线回归系数绝对值|r|小于0.99且该段曲线位于其切线下方,那么这三点绘成的线形,被 称为光谱凸曲线。小波滤噪对光谱信号进行小波分解,一般地,噪声信号多包含在具有较高频率的 细节中,从而,可利用门限阈值等形式对所分解的小波系数进行处理,然后对信号进行小波 重构即可达到对信号降噪的目的。对信号降噪实质上是抑制信号中的无用部分,恢复信号 中有用部分的过程。一阶导数对样品扫描时,由于制样条件和仪器参数等对光谱的影响,谱图可能发 生平移、旋转(随着波数的变小,差谱值呈现规律上升)以及图谱的其它变形。导数法可消 除信号中的低频背景和常数项,降低高次项的幂次,从而使高频信号显现出来,利用一阶求 导可以消除图谱平移的影响。向量标准化向量标准化(Standard Normal Variate,SNV)主要用于消除固体颗 粒大小、表面散射以及光程变化对光谱的影响,具有与标准化相同的计算公式。SNV通过标 准化(Normalization)处理光谱,还可以减小光谱漂移现象。下面结合

实现本发明的优选实施方式。图1为本发明的第一实施方式,其中假药判别分析装置1包括控制模块、数据接收 模块、小波滤噪模块、插值模块、选峰模块、基线光谱计算模块、峰数比较模块、判断模块A。图2为本发明的第二实施方式,其中假药判别分析装置1除了第一实施方式中的
10模块以外,还进一步包括峰位校正模块、含量因子和含量区间计算模块、含量区间平移模 块、含量区间加权模块、药物含量预测模块、判断模块B。图3为本发明的第三实施方式,其中假药判别分析装置1除了第一和第二实施方 式中的模块以外,还进一步包括主成分分析模块和判断模块C。本发明中的各实施方式只是为了更好地举例说明本发明的最佳实现方式和最佳 效果,应该理解的是各实施方式可以灵活地根据具体需要进行适当地改变和任意地组合。 例如,第三实施方式可不包括第二实施方式中的各模块;再例如,当第三实施方式无法进行 时(连少量几个真品药片都无法获得的情况下),第一、第二实施方式可组合使用而不必进 行第三实施方式。另外,本发明的假药分析装置1还可根据需要包括用于进行数据处理、输入指令、 输出数据的其他必要硬件设备、模块或装置,诸如存储装置(诸如内部存储器、硬盘存储器 等)、显示装置、输入输出模块、输入装置、打印设备等,还可包括网络通信模块通过局域网、 互联网连接远程数据库。下面分别说明各模块及其功能控制模块在本发明中控制模块的功能是控制数据在各模块之间的传输以及各模 块的数据处理例程,因此只要能够控制数据的传输和各模块的数据处理例程,可以使用任 意的控制装置,诸如中央处理器(CPU)、工业计算机用控制芯片等。小波滤噪模块该模块被配置为将从数据接收模块接收的拉曼光谱图进行小波变 换以滤除高频噪音。本发明利用小波分析方法去噪,小波去噪一般分为3个步骤(1)信号 的小波分解;(2)小波分解的高频系数的阈值量化,对各个分解尺度下的高频系数选择一 个阈值进行软阈值量化处理;(3) —维小波重构,根据小波分解的底层低频系数和各层高 频系数进行一维小波重构。优选采用正交小波函数,在matlab上实现。插值模块根据常规方法和仪器的实际情况,便携式拉曼光谱分辨率都低于 5cm—1。但是在该分辨率下得到的光谱数据点间距较宽,不能完全表现光谱的细节特征。为了 克服上述问题,采用“插值”的方法,不仅能解决分辨率低的问题,还能避免为提高分辨率而 增加仪器噪音的后果。本文所述的“插值”是根据原光谱图中原有数据点的分布规律,拟合 出一条能够用某一函数表达的曲线,这样可以在函数上读出任意点。本发明在原有的LSLS 的基础上,优选采用三次样条函数插值法,利用拟合的多项式计算函数值,将计算的函数值 插入到原有的实验点之间,然后再根据所有实验点拟合成曲线。图4的示意图表示一段曲 线插值前后的变化,从该图中可以看到,插值后的曲线2更为完整、平滑,找到的光谱峰的 峰尖位置也更为准确。选峰模块该模块被配置为将待测药片主药成分对照品的光谱进行小波滤噪和插 值的预处理后再进行选峰处理,选择强度大于最强峰的 10%,优选5%的散射峰作为 选定峰位。基线光谱计算模块该模块被配置为分别取各选定峰位对应的待测药片拉曼光谱 的峰,减去主药成分对照品对应的峰X主药成分的含量P,从而得到理论上的基线光谱。峰数比较模块该模块被配置为对上述基线光谱中的近直线的原始光谱峰的个数 进行计数,并将计数结果与主药成分对照品选定峰位的峰个数的一半(即主药成分对照品 半峰数)进行比较。根据LSLS的基本原理,先选择化合物的峰,然后根据化合物的峰选定药片的峰。将药片的峰强度-化合物峰强度XP(P:主药成分的含量),得到的峰基本应该 为近直线。此处的“近直线”以相关系数>N值为条件,N值作为半峰数比较的参数,可以在 0. 9 0. 9999的范围内考察选定,优选0. 99。如果上述计数结果小于主药成分对照品半峰 数,则直接判定该待测药片为假药;否则判为可疑样品。峰位校正模块不同采集仪器,不同操作条件,甚至不同采集时间都有可能引起峰 位偏移的现象,从而对算法的准确判定造成干扰。为了改善这种情况,加入了峰位校正模 块,即将药片图谱同对照品化合物原谱上的散射峰匹配,匹配窗尺度为士1 士5CHT1,优选 士 3cm—1,将匹配成功的峰位进行红移或蓝移校正。含量区间计算模块该模块被配置为对经峰位校正获得的各选定峰作如下 计算待测药片峰,减去对应的主药成分对照品的峰XP/2,获得的光谱根据公式r = corroef(ArzA2)计算每个选定峰位处的连续多个光谱数据点的局部直线的回归系数r,其 中corroef函数表示相关系数,含量因子z由-100%至+100%取值,其步长为0. 01 %,为 待测药片光谱,A2为主药成分对照品光谱;以及取|r| >N为局部直线的判据,所对应的含 量因子构成的区间即每个选定峰位处的含量区间,其中N选自0. 9 0. 9999,优选0. 99。上述连续多个光谱数据点作为直线拟合的参数,可以在3 11个点的范围内考察 选定,优选7个数据点。以11个点为例,取点方式为以峰尖一点为中心,左右各取1、2、3、4、 5点,从而组成3、5、7、9、11个连续的光谱数据点。含量区间平移模块该模块被配置为将待测药片的每个选定峰位处计算出来的含 量区间,根据基线光谱在每个选定峰位处对应的凹凸情况,对上述含量区间进行平移。在本 发明中如下进行平移若基线光谱为凸曲线,则含量区间向左平移;若基线光谱为近直线, 则含量区间不平移;若基线光谱为凹曲线,则含量区间向右平移。另外,根据基线光谱的凹 凸程度,含量区间平移的程度也不一样。本发明采用r来衡量基线光谱的凹凸情况,当0. 98 < r ^ 0. 99,含量区间平移的程度选自0. 5. 0%,优选3% ;当0. 99 < r < 0. 999,含 量区间平移程度选自0. 1 % 5. 0 %,优选1 % ;当r彡0. 999,则基线光谱被认定为近直线, 含量区间不平移。本发明对含量区间平移的原理解释如下。由于当化合物峰叠加在凸曲线/近直线/凹曲线的三种基线线型上时,计算出来 的含量因子的结果分别为大于真值/接近真值/小于真值。可见基线光谱对结果影响较大 (基线光谱=待测药片光谱-化合物光谱XP),所以根据基线的不同情况,进行区间平移, 如图5。图中i、ii、iii、iv、v代表5种情况的光谱曲线,其中“_”或“ + ”分别表示区间分 别向左或者向右平移,参数一栏表示平移的程度。“药片-P/2”代表药片光谱-化合物光 谱XP/2。同系物之间的药片光谱较为相近,或者一些辅料的光谱也存在一些较相似的峰, 在这样的情况下,如果直接用药片的图谱作为计算光谱,经过区间平移后会出现许多假阳 性(如表1)。引进“药片-P/2”光谱作为计算光谱,可以降低他们的相似度,从而降低假阳 性率。表1原始光谱和“药片-P/2”光谱作为计算光谱的计算结果 注上述数据中> 0表示被判别为真药,^ 0表示被判别为假药。含量区间加权模块该模块被配置为对待测药片的每个选定峰位处计算出来的 含量区间进行加权,根据主药成分对照品光谱的每个选定峰的绝对峰强与相对峰强进行加 权。拉曼光谱中的峰,峰强都各不相同,因此加和在药片基线上,拉曼光谱上引起的变 化也不相同,因此各个峰及其差减后得到的含量因子区间,所起的作用也应该有所区别。原 始的LSLS方法计算中,对每一个峰求得的含量区间都一视同仁,没有进行区别对待,这在 统计学上显然是不合理的,应赋予它们不同的具有权衡轻重作用的权数,这个权数就是加 权因子。理论上认为,光谱强度越大的峰,加和在药片的基线图谱上时,引起的变化越明显, 其特征性越强,对应求得的含量因子区间也更具代表性。在原始的LSLS方法中,并没有体 现出峰强大小的区分作用。为了改善上述情况,本发明的改进引进了峰强加权的思想,将峰 的绝对峰强和相对峰强作为加权的依据。绝对峰强指的是在图谱中峰的实际强度,它可能 受到基线、峰的本身响应信号的影响。相对峰强与峰的起点、顶点、终点有关,该指标可以扣 除光谱采集过程中散射和反射的能量损失以及基线漂移和其它组分谱带的干扰,一般有较 好的重复性,能够较好地反映真实情况。为了使得权重合理,最大的权重因子和最小的权重 因子被控制在5 1。加权前后的结果如图6,左边一列是没有经过加权的结果图,右边一 列是经过加权的结果。结果显示,对于真药而言,加权可以减少误判。药物含量预测模块该模块被配置为计算每个选定峰位处的含量区间,经平移、经 平移、加权后纵向叠加求取各个选定峰的含量区间之和,以计算的含量区间和为纵轴,含量 因子值为横轴做图(类似于图6),在该图的纵轴上的最大含量区间和S_所对应的横轴上 的含量因子值,即为预测得的待测药片主药成分含量zp。主成分分析模块该模块被配置为从此类药品的已知真药与从经上述假药分析装置被判定为可疑样品的所有待测药片的原始光谱中,选取合适的波段(例如,信号较丰富 的一段光谱谱段,选取的方法是本领域普通技术人员所公知的,可根据各种分析软件的具 体设定参数或根据光谱的具体情况由技术人员来确定),进行小波滤噪、一阶导数和向量标 准化的预处理,再进行主成分分析。主成分分析法是一种降维的统计方法,它借助于一个正交变换,将其分量相关的 原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差 阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点 散布最开的P个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度 转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。在另一个方面,本发明提供了一种假药分析系统,该分析系统包括拉曼光谱仪和 本发明的假药判别分析装置。在本发明中,拉曼光谱仪用来获取待测样品和药物标准品 的拉曼光谱图,因此只要能够获得样品的拉曼光谱图,在本发明的分析系统中可以使用任 意型号的拉曼光谱仪,例如B&WTek公司的i-Raman、Ahura Scientific公司的Truscan、 OceanOptics 公司的 RSL-1 等。在本发明的假药分析系统中,本发明的假药判别分析装置和拉曼光谱仪可通过各 种连接方式连接以传输数据,包括但不限于电缆直接连接、通过有线或无线局域网连接、有 线或无线互联网远程连接、蓝牙、红外线等数据传输方式。本发明的方法可通过编程的计算机程序并借助于计算软件来实现,也可通过硬件 来实现。用来实现本发明的方法的计算软件的例子包括matlab(用于主例程和子例程1的 计算)、0PUS(用于子例程2的计算),它们可以单独使用或组合使用。另外,本发明的方法 还可以用VB、VC、C++等语言进行编写。下面依照图7-9的计算机程序流程来说明实现本发明的假药分析方法的计算机 流程图7为实现本发明的假药分析方法的主例程的计算机流程图。在步骤S1,从拉曼光谱仪接收光谱数据。在步骤S2,对接收到的光谱进行小波滤噪。在步骤S3,将步骤S2中经小波变换的光谱图进行插值运算,获得新的插值后光在步骤S4,将对步骤S3获得的光谱进行选峰处理,获得选定峰位。在步骤S5,取与步骤S4中获得的各选定峰位对应的待测药片的拉曼光谱峰,减去 主药成分对照品对应的光谱X主药成分含量P,从而得到理论上的基线光谱。在步骤S6,对步骤S5中获得的基线光谱中的近直线的原始光谱峰的个数进行计 数。在步骤S7,将步骤S6中获得的计数结果与主药成分对照品半峰数进行比较,如小 于主药成分对照品半峰数,则判定该待测药片为假药,本例程结束,否则转到子例程1。图8为实现本发明的假药分析方法的子例程1的计算机流程图。在步骤S8,将步骤S3获得的待测药片光谱与主药成分对照品原光谱上的散射峰 根据峰位校正进行相应的红移或蓝移校正。在步骤S9,对经校正后的各选定峰作如下计算待测药片峰,减去对应的主药成
14分对照品峰XP/2,获得的光谱再根据公式r = C0rr0ef(Al-zA2)计算每个选定峰位处的连 续多个光谱数据点的局部直线的回归系数r。在步骤S10,取|r| >0.99为局部直线的判据,所对应的含量因子构成的区间即每 个选定峰位处的含量区间。在步骤S11,将待测药片的每个选定峰位处计算出来的含量区间,根据步骤S5中 获得的基线光谱的情况进行平移。在步骤S12,对平移后的含量区间,根据主药成分对照品光谱的每个选定峰的绝对 峰强与相对峰强进行加权求和后,以计算的含量区间和的最大含量区间和S_所对应的含 量因子值,即为预测得的待测药片主药成分含量zp。在步骤S13,若药物含量预测模块所预测的含量因子zp ^ 0,则其对应的待测药片 判为假药,本例程结束。图9为实现本发明的假药分析方法的子例程2的计算机流程图。若在子例程1中预测的含量因子zp > 0,如果样品量足够大,则可转到子例程2继 续进行子例程2的处理。在步骤S14,将此类的已知真药与从前述步骤中被判定为可疑样品的所有待测药 片的原始光谱中选取合适的波段,进行小波滤噪、一阶导数和向量标准化的预处理。在步骤S15,对步骤S14中预处理的波段进行主成分分析。在步骤S16,将步骤S15中经主成分分析后对应于离散点的待测药片判定为假药, 其余则判为真药。下面结合具体实施例来说明本发明的假药分析方法。实施例一、材料和设备1、药片和化合物样品5个格列美脲药片样品,5个格列本脲药片样品,阴性样品 分别为4个二甲双胍药片,蔗糖,糊精,淀粉,PVPK30,滑石粉,硬脂酸镁,预胶化淀粉,羧甲
基淀粉,羟丙纤维素,乳糖,微晶纤维素,羟丙基甲基纤维素。2、假药分析系统计算机硬件系统采用Intel Pentium Dual E218002. 00GHz芯 片,计算软件为matlab7. 0 (数据预处理软件为OPUS 5. 0),以及B&WTek i-Raman-785型拉 曼光谱仪。
二、实验步骤1.将上述药片和阴性样品进行刮除表面包膜的处理,采集药片和化合物的拉曼光 谱图;2.对药片和化合物的原始光谱进行小波去噪(小波变换前后的拉曼光谱图见图 10和图11)和插值的预处理。计算基线光谱(药片光谱-主药成分光谱XP),并计算“药 片-P/2”光谱(药片光谱-主药成分光谱XP/2);3.对各样品的拉曼散射光谱进行标峰处理,选择强度大于最强峰5%的光谱峰;4.差减后的峰的线性个数(n’ )与化合物峰的峰个数的一半(n)进行比较;如果 n’ < n,则直接将待测药片判定为假药;否则为可疑样品,则需要进行下一步进行判定;5.对“药片-P/2”光谱进行后续计算r = corroef (A「zA2)
其中z为含量因子,r为该散射峰位处每个选定峰位的连续7个光谱数据点的直 线拟合回归系数;6.设置z取值范围为-100%% 100%,按0.01%的间隔逐步递增,计算所有含 量因子下每个光谱峰的r值;7.取所有Abs(r) >0.99的各拉曼峰的含量区间,经平移、加权后纵向叠加求取各 个选定峰的含量区间之和,以计算的含量区间和为纵轴,含量因子值为横轴做图,在该图的 纵轴上的最大含量区间和S_所对应的横轴上的含量因子值,即为预测得的待测药片主药 成分含量zp ;8.如果zp ( 0,则直接将待测药片判定为假药;如果zp > 0,则可判定待测药片为 可疑样品,则需要进行下一步进行判定;9.对被判定为真药的药片和所有的可疑样品的原始光谱选取合适的波段,进行小 波滤噪、一阶导数(窗口点数为9)和向量标准化的预处理,再进行主成分分析。将PCA结 果图(见图12)中离散点对应的样品判定为假药,其余样品则都认为是真药。三、实验结果表 2表 4 图12中显示点6和点7 (二甲双胍片)相对于其他集中点(格列美脲片)是离散 点,所以样品6和样品7被判定为假药。同样地,样品6(蔗糖)、7(PVPK30)、9(乳糖)被判 定为冒充格列本脲片的假药。表2显示5个格列美脲片(真药)和12个辅料(假药)的判定结果,正的结果显 示该样品被判定为真药,负的结果表示该样品被判别为假药,全部判别正确;表3显示5个 格列本脲片(真药)和12个辅料(假药)的判定结果,正的结果显示该样品被判定为真药, 负的结果表示该样品被判别为假药,其中有一个判别错误(微晶纤维素);表4显示5个格 列美脲片(真药)和4个二甲双胍片(假药)的判定结果,正的结果显示该样品被判定为 真药,负的结果表示该样品被判别为假药,全部判别正确。表2、表3为辅料冒充假药的结果 表,表4为低价药冒充高价药的结果表。结果显示,只有一个辅料被错误判别,证明了该方 法有较高的准确度。尽管通过引述实际分析中的特定细节和参数说明了本发明,应该理解,这只是按 示例的方式而不是限制的方式来描述,这些设定和数值可以有变化,这些变化仍然在本发 明的范围之内。对于受本发明启示的本领域技术人员来说,许多替换、改型、改变和变化都 是显而易见的。因此,本发明旨在包含这些本发明范围的替换、改型、改变和变化。
权利要求
一种假药判别分析装置,包括以下的处理模块(1)控制模块;(2)数据接收模块该模块在所述控制模块的控制下从拉曼光谱仪接收对待测药片和主药成分对照品检测的拉曼光谱图数据,并将该数据传输至小波滤噪模块;(3)小波滤噪模块该模块被配置为将从数据接收模块接收的拉曼光谱图进行小波变换以滤除噪音;(4)插值模块该模块被配置为对经小波滤噪的拉曼光谱图进行插值运算,将计算的函数值插入光谱图原有的数据点之间,再将所有的数据点重新拟合为新的插值后光谱;(5)选峰模块该模块被配置为将待测药片主药成分对照品的插值后光谱进行选峰处理,选择强度大于最强峰的1%~10%,优选5%的散射峰作为选定峰位;(6)基线光谱计算模块该模块被配置为分别取各选定峰位对应的待测药片的拉曼光谱峰,减去主药成分对照品对应的峰×主药成分含量P,从而得到理论上的基线光谱;(7)峰数比较模块该模块被配置为对上述基线光谱中近直线的原始光谱峰的个数进行计数,并计算主药成分对照品选定峰位的峰个数的一半作为主药成分对照品半峰数,然后将近直线原始谱峰计数结果与主药成分对照品半峰数进行比较;以及(8)判断模块A该模块根据预定判定条件对峰数比较模块的比较结果进行判定,符合条件的直接判定为假药,不符合条件的判定为可疑样品,并将判定结果输出至控制模块。
2.根据权利要求1所述的假药判别分析装置,其中所述预定判定条件为若所述峰数 比较模块所计数的基线光谱中近直线的原始光谱峰的个数小于主药成分对照品半峰数,则 直接判定该待测药片为假药;否则判为可疑样品。
3.根据权利要求1或2所述的假药判别分析装置,进一步包括(9)峰位校正模块该模块被配置为将经判断模块A判为可疑样品的待测药片光谱与 主药成分对照品原光谱上的散射峰根据预定的匹配阈值进行匹配,并将匹配成功的峰位根 据上述基线光谱进行相应的红移或蓝移校正,其中所述预定匹配阈值为士 1 士ScnT1Jt 选 士 3cm—1 ;(10)含量区间计算模块该模块被配置为对经峰位校正获得的各选定峰作如下 计算待测药片峰减去对应的主药成分对照品的峰XP/2,获得的光谱根据公式r = Corroef(A1-ZA2)计算每个选定峰位处的连续多个光谱数据点的局部直线的回归系数r,其 中corroef函数表示相关系数,含量因子ζ由-100%至+100%取值,其步长为0. 01 %,A1为 待测药片光谱,A2为主药成分对照品光谱;以及取|r| > N为局部直线的判据,所对应的含 量因子构成的区间即每个选定峰位处的含量区间,其中N选自0. 9 0. 9999,优选0. 99 ;(11)含量区间平移模块该模块被配置为将待测药片的每个选定峰位处计算出来的 含量区间,根据基线光谱在每个选定峰位处对应的光谱曲线的凹、凸情况,对上述含量区间 进行平移;(12)含量区间加权模块该模块被配置为对待测药片的每个选定峰位处计算出来的 含量区间进行加权,根据主药成分对照品光谱的每个选定峰的绝对峰强与相对峰强进行加 权;(13)药物含量预测模块该模块被配置为将每个选定峰位处的含量区间,经平移、力口 权后纵向叠加求取各个选定峰的含量区间之和,以计算的含量区间和为纵轴,含量因子值为横轴做图,在该图的纵轴上的最大含量区间和Smax所对应的横轴上的含量因子值,即为预 测得的待测药片主药成分含量Zp ;(14)判断模块B该模块根据预定判定条件对经药物含量预测模块预测的所述含量因 子Zp进行判定,符合条件的直接判定为假药,不符合条件的判定为可疑样品,并将结果输出 至控制模块。
4.根据权利要求3所述的假药判别分析装置,其中所述预定判定条件为若待测样品 计算的Zp ^ O直接判定为假药,若Zp > O则判定为真药。
5.根据权利要求1-4任意一项所述的假药判别分析装置,进一步包括以下模块(15)主成分分析模块该模块被配置为从此类药品的已知真药与经判断模块A或B判 为可疑样品的所有待测药片的原始光谱中选取包含了特征峰的光谱波段,进行小波滤噪、 一阶导数和向量标准化的预处理,再进行主成分分析;以及(16)判断模块C根据预定判定条件对主成分分析后的结果进行判定,在主成分分析 图中,集中点对应的样品判定为真药,离散点对应的样品判定为假药,并将结果输出至控制 模块。
6.一种假药分析系统,包括根据权利要求1-5任意一项所述的假药判别分析装置和拉 曼光谱仪。
7.一种假药分析方法,包括以下的步骤(1)通过拉曼光谱仪分别获取待测药片和待测药片主药成分对照品的拉曼光谱;(2)对待测药片和主药成分对照品的原始拉曼光谱进行小波滤噪以滤除高频噪音;(3)对经步骤(2)滤噪后的拉曼光谱上的各原始数据点进行插值运算,将计算后的函 数值插入至光谱原有的数据点之间,再将所有的数据点重新拟合为新的插值后光谱;(4)对经步骤(3)获得的光谱曲线进行选峰处理,将主药成分对照品光谱中强度大于 最强峰的 10%,优选5%的散射峰作为选定峰位;(5)取与各选定峰位对应的待测药片拉曼光谱的峰,减去主药成分对照品对应的光 谱X主药成分含量P,从而得到理论上的基线光谱;以及(6)对步骤(5)中获得的基线光谱中近直线的原始光谱峰的个数进行计数,并将其计 数结果与主药成分对照品半峰数进行比较,如果上述计数结果小于主药成分对照品半峰 数,则直接判定该待测药片为假药;否则判为可疑样品。
8.根据权利要求7所述的假药分析方法,进一步包括以下的步骤(7)若在步骤(6)中待测药片被判为可疑样品,则将步骤(3)获得的该待测药片光谱 与主药成分对照品原光谱上的散射峰根据预定匹配阈值进行匹配,将匹配成功的峰位根据 上述基线光谱进行相应的红移或蓝移校正,其中所述预定匹配阈值为士1 士5CHT1,优选 士 3CHT1 ;(8)对经峰位校正获得的各选定峰作如下计算待测药片峰,减去对应的主药成分 对照品峰XP/2,获得的光谱根据公式r = Corroef(A1-ZA2)计算每个选定峰位处的连续 多个光谱数据点的局部直线的回归系数r,其中corroef函数表示相关系数,含量因子ζ 由-100%至+100%取值,其步长为0. 01% ,A1为待测药片光谱,A2为主药成分对照品光谱;(9)取|r|局部直线的判据,所对应的含量因子构成的区间即每个选定峰位处的 含量区间,其中N选自0. 9 0. 9999,优选0. 99;(10)将待测药片的每个选定峰位处计算出来的含量区间,根据基线光谱在每个选定峰 位处对应的光谱曲线的凹、凸情况,对上述含量区间进行平移;若基线光谱为凸曲线,则含 量区间向左平移;若基线光谱为近直线,则含量区间不平移;若基线光谱为凹曲线,则含量 区间向右平移;(11)对待测药片的每个选定峰位处计算出来的含量区间经平移后,根据主药成 分对照品光谱的每个选定峰的绝对峰强与相对峰强,根据下式进行加权求和=Smax = Σ IriXIiXRI丄,其中待测药片主药成分第i个峰的含量因子区间; Ii 待测药片主药成分第i个峰的绝对峰强的权重因子;R 待测药片主药成分第i个峰的相对峰强的权重因子;ζ与步骤(8)中的定义相同;从而获得这些峰的|r|加权求和后,以计算的含量区间和为纵轴,含量因子值为横轴 做图,在该图的纵轴上的最大含量区间和Smax所对应的横轴上的含量因子值,即为预测得的 待测药片主要成分含量Zp ;以及(12)若所述预测的含量因子Zp( 0,则其对应的待测药片直接判为假药;否则判为可 疑样品。
9.根据权利要求7或8所述的假药分析方法,进一步包括以下步骤(13)若待测药片被判为可疑样品,则从此类药品的已知真药与判为可疑样品的所有待 测药片的原始光谱中,选取合适的波段,进行小波滤噪、一阶导数和向量标准化的预处理, 再进行主成分分析;以及(14)将主成分分析后对应于主成分分析图中离散点对应的待测药片判定为假药,其余 则判为真药。
全文摘要
本发明涉及一种假药判别分析装置、包括该假药判别分析装置的假药分析系统,以及一种假药分析方法。本发明的假药分析方法采用无模型分析法,在原有的局部直线筛选法的基础上进行了改进,使其更加稳健、合理,并且结合主成分分析法,形成一套完整的假药判别体系。本发明的假药判别分析装置、假药分析系统和假药分析方法仅需要待检化合物光谱和极少量的真品药片,就可以实现对待测药片的快速简便的真伪鉴别。
文档编号G01N21/65GK101852734SQ20101019244
公开日2010年10月6日 申请日期2010年6月1日 优先权日2010年6月1日
发明者尹利辉, 张中湖, 张学博, 柴逸峰, 翁欣欣, 陆峰 申请人:中国人民解放军第二军医大学;中国药品生物制品检定所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1