基于PLS确定中药复方的成分配比的方法和装置与流程

文档序号:16000281发布日期:2018-11-20 19:22阅读:338来源:国知局
本申请涉及医疗
技术领域
,尤其涉及一种基于PLS确定中药复方的成分配比的方法和装置。
背景技术
:中医药学是我国传统医学的瑰宝,其优势在于临床疗效,其进一步发展所面临的突出问题仍然是疗效问题。影响中医疗效的关键因素除辨证论治、方剂配伍、中药药性及药材质量以外,与方药的用量有着密切的关系,也就是所谓的“中医不传之秘在于药量”。由于中药成分和作用机制的复杂性,使得中药量效关系的研究远比单成分的化学药困难,与化学药常见的“S”型曲线有着显著的区别,实验数据大多数呈现非线性关系。其中,量效关系是指中药复方中的成分含量与疗效指标之间的关系。近年来,如何采用合适的方法引入中药的量效研究,已引起众多学者的关注。比如,一种传统的方案中,利用偏最小二乘法(PartialLeastSquares,PLS)回归模型对中药复方的成分含量与疗效指标的数据进行回归建模,得到中药复方中的成分含量与疗效指标之间的关系。其中,成分含量作为自变量,疗效指标作为因变量。这种传统的PLS回归模型虽然在存在多重共线性的情况下依然可对数据进行回归建模,但是在提取主分量时,采用的是交叉核验原则来选择使协方差尽可能最大的成分,由PLS性质得知,这种主分量就是自变量列向量的线性组合,接着主分量与因变量进行多元线性回归,显然,这样的回归模型是建立在这些主分量之上的,由于中药复方数据的复杂性,难以建立明确的量效关系模型。技术实现要素:为至少在一定程度上克服相关技术中存在的问题,本申请提供一种基于PLS确定中药复方的成分配比的方法和装置。根据本申请实施例的第一方面,提供一种基于PLS确定中药复方的成分配比的方法,包括:获取中药复方的样本数据;所述样本数据包含多组所述中药复方的量效数据;每组所述量效数据包含所述中药复方的n个成分的含量数据和对应的疗效指标的数据;采用灰色关联度确定所述中药复方的n个成分与疗效指标的关联度,去除所述中药复方中的关联度最低的成分,得到新样本数据;所述新样本数据中,每组所述量效数据包含所述中药复方的n-1个成分的含量数据和对应的疗效指标的数据;通过PLS回归模型,对所述新样本数据进行回归拟合,得到所述疗效指标关于n-1个成分的回归方程;根据所述回归方程,确定所述中药复方的n-1个成分的配比。较佳地,采用灰色关联度确定所述中药复方的n个成分与疗效指标的关联度,包括:将所述样本数据中的疗效指标的数据,作为参考序列y(k),k=1,2,...,m;其中,m表示参考序列中疗效指标的数据的总数,k表示第k个疗效指标的数据;将所述中药复方中的n个成分对应的含量数据,作为比较序列xj(k),k=1,2,...,m,j=1,2,...,n;其中,n表示比较序列的个数,j表示第j个比较序列,m表示第j个比较序列中的含量数据的个数,k表示第j个比较序列中第k个含量数据;根据所述参考序列y(k)和所述比较序列xj(k),计算灰色关联系数ξj(k);确定所述比较序列与所述参考序列的关联度:将所述比较序列的关联度R1,R2,...,Rj,...,Rn,作为对应的n个成分与疗效指标的关联度。较佳地,所述获取中药复方的样本数据之后,采用灰色关联度确定所述中药复方的n个成分与疗效指标的关联度之前,所述方法还包括:将所述样本数据进行归一化处理,得到包含所有含量数据的矩阵X和包含所有疗效指标的数据的矩阵Y;通过OSC方法对所述样本数据进行预处理,以去除X中与Y正交的分量。较佳地,所述通过OSC方法对所述样本数据进行预处理,包括:按照如下公式计算各分量的权值向量w:wT=YTX/(YTY);其中,T表示矩阵的转置;按照如下公式对w进行归一化:w=w/||w||;按照如下公式计算每个分量的得分t:t=Xw/(wTw);以及得到载荷的转置向量P:PT=tTX/(tTt);按照如下公式计算正交分量的权值向量:w⊥=p-w;以及对w⊥进行归一化:w⊥=w⊥/||w⊥||;计算各分量的正交分量t⊥:计算正交分量的载荷向量从X中减去正交分量,得到修正后的XOSC:判断正交分量的权值向量w⊥与载荷向量的模的比值k=||w⊥||/||p||与预设值的大小,如果大于预设值,则继续修正,否则,停止修正。较佳地,所述方法还包括:计算所述回归方程的复测定系数。根据本申请实施例的第二方面,提供一种基于PLS确定中药复方的成分配比的装置,包括:样本获取模块,用于获取中药复方的样本数据;所述样本数据包含多组所述中药复方的量效数据;每组所述量效数据包含所述中药复方的n个成分的含量数据和对应的疗效指标的数据;关联度确定模块,用于采用灰色关联度确定所述中药复方的n个成分与疗效指标的关联度,去除所述中药复方中的关联度最低的成分,得到新样本数据;所述新样本数据中,每组所述量效数据包含所述中药复方的n-1个成分的含量数据和对应的疗效指标的数据;回归拟合模块,用于通过PLS回归模型,对所述新样本数据进行回归拟合,得到所述疗效指标关于n-1个成分的回归方程;确定模块,用于根据所述回归方程,确定所述中药复方的n-1个成分的配比。较佳地,所述关联度确定模块,具体用于:将所述样本数据中的疗效指标的数据,作为参考序列y(k),k=1,2,...,m;其中,m表示参考序列中疗效指标的数据的总数,k表示第k个疗效指标的数据;将所述中药复方中的n个成分对应的含量数据,作为比较序列xj(k),k=1,2,...,m,j=1,2,...,n;其中,n表示比较序列的个数,j表示第j个比较序列,m表示第j个比较序列中的含量数据的个数,k表示第j个比较序列中第k个含量数据;根据所述参考序列y(k)和所述比较序列xj(k),计算灰色关联系数ξj(k);确定所述比较序列与所述参考序列的关联度:将所述比较序列的关联度R1,R2,...,Rj,...,Rn,作为对应的n个成分与疗效指标的关联度。较佳地,还包括预处理模块;所述预处理模块,用于所述获取中药复方的样本数据之后,采用灰色关联度确定所述中药复方的n个成分与疗效指标的关联度之前,将所述样本数据进行归一化处理,得到包含所有含量数据的矩阵X和包含所有疗效指标的数据的矩阵Y;通过OSC方法对所述样本数据进行预处理,以去除X中与Y正交的分量。较佳地,所述通过OSC方法对所述样本数据进行预处理时,所述预处理模块,具体用于:按照如下公式计算各分量的权值向量w:wT=YTX/(YTY);其中,T表示矩阵的转置;按照如下公式对w进行归一化:w=w/||w||;按照如下公式计算每个分量的得分t:t=Xw/(wTw);以及得到载荷的转置向量P:PT=tTX/(tTt);按照如下公式计算正交分量的权值向量:w⊥=p-w;以及对w⊥进行归一化:w⊥=w⊥/||w⊥||;计算各分量的正交分量t⊥:计算正交分量的载荷向量从X中减去正交分量,得到修正后的XOSC:判断正交分量的权值向量w⊥与载荷向量的模的比值k=||w⊥||/||p||与预设值的大小,如果大于预设值,则继续修正,否则,停止修正。较佳地,还包括测定系数计算模块;所述测定系数计算模块,用于:计算所述回归方程的复测定系数。根据本申请实施例的第三方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器执行时,使得处理器能够执行一种基于PLS确定中药复方的成分配比的方法,所述方法包括:获取中药复方的样本数据;所述样本数据包含多组所述中药复方的量效数据;每组所述量效数据包含所述中药复方的n个成分的含量数据和对应的疗效指标的数据;采用灰色关联度确定所述中药复方的n个成分与疗效指标的关联度,去除所述中药复方中的关联度最低的成分,得到新样本数据;所述新样本数据中,每组所述量效数据包含所述中药复方的n-1个成分的含量数据和对应的疗效指标的数据;通过PLS回归模型,对所述新样本数据进行回归拟合,得到所述疗效指标关于n-1个成分的回归方程;根据所述回归方程,确定所述中药复方的n-1个成分的配比。较佳地,采用灰色关联度确定所述中药复方的n个成分与疗效指标的关联度,包括:将所述样本数据中的疗效指标的数据,作为参考序列y(k),k=1,2,...,m;其中,m表示参考序列中疗效指标的数据的总数,k表示第k个疗效指标的数据;将所述中药复方中的n个成分对应的含量数据,作为比较序列xj(k),k=1,2,...,m,j=1,2,...,n;其中,n表示比较序列的个数,j表示第j个比较序列,m表示第j个比较序列中的含量数据的个数,k表示第j个比较序列中第k个含量数据;根据所述参考序列y(k)和所述比较序列xj(k),计算灰色关联系数ξj(k);确定所述比较序列与所述参考序列的关联度:将所述比较序列的关联度R1,R2,...,Rj,...,Rn,作为对应的n个成分与疗效指标的关联度。较佳地,所述获取中药复方的样本数据之后,采用灰色关联度确定所述中药复方的n个成分与疗效指标的关联度之前,所述方法还包括:将所述样本数据进行归一化处理,得到包含所有含量数据的矩阵X和包含所有疗效指标的数据的矩阵Y;通过OSC方法对所述样本数据进行预处理,以去除X中与Y正交的分量。较佳地,所述通过OSC方法对所述样本数据进行预处理,包括:按照如下公式计算各分量的权值向量w:wT=YTX/(YTY);其中,T表示矩阵的转置;按照如下公式对w进行归一化:w=w/||w||;按照如下公式计算每个分量的得分t:t=Xw/(wTw);以及得到载荷的转置向量P:PT=tTX/(tTt);按照如下公式计算正交分量的权值向量:w⊥=p-w;以及对w⊥进行归一化:w⊥=w⊥/||w⊥||;计算各分量的正交分量t⊥:计算正交分量的载荷向量从X中减去正交分量,得到修正后的XOSC:判断正交分量的权值向量w⊥与载荷向量的模的比值k=||w⊥||/||p||与预设值的大小,如果大于预设值,则继续修正,否则,停止修正。较佳地,所述方法还包括:计算所述回归方程的复测定系数。根据本申请实施例的第四方面,提供一种基于PLS确定中药复方的成分配比的装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:获取中药复方的样本数据;所述样本数据包含多组所述中药复方的量效数据;每组所述量效数据包含所述中药复方的n个成分的含量数据和对应的疗效指标的数据;采用灰色关联度确定所述中药复方的n个成分与疗效指标的关联度,去除所述中药复方中的关联度最低的成分,得到新样本数据;所述新样本数据中,每组所述量效数据包含所述中药复方的n-1个成分的含量数据和对应的疗效指标的数据;通过PLS回归模型,对所述新样本数据进行回归拟合,得到所述疗效指标关于n-1个成分的回归方程;根据所述回归方程,确定所述中药复方的n-1个成分的配比。较佳地,采用灰色关联度确定所述中药复方的n个成分与疗效指标的关联度时,所述处理器具体被配置为:将所述样本数据中的疗效指标的数据,作为参考序列y(k),k=1,2,...,m;其中,m表示参考序列中疗效指标的数据的总数,k表示第k个疗效指标的数据;将所述中药复方中的n个成分对应的含量数据,作为比较序列xj(k),k=1,2,...,m,j=1,2,...,n;其中,n表示比较序列的个数,j表示第j个比较序列,m表示第j个比较序列中的含量数据的个数,k表示第j个比较序列中第k个含量数据;根据所述参考序列y(k)和所述比较序列xj(k),计算灰色关联系数ξj(k);确定所述比较序列与所述参考序列的关联度:将所述比较序列的关联度R1,R2,...,Rj,...,Rn,作为对应的n个成分与疗效指标的关联度。较佳地,所述处理器还被配置为:所述获取中药复方的样本数据之后,采用灰色关联度确定所述中药复方的n个成分与疗效指标的关联度之前,将所述样本数据进行归一化处理,得到包含所有含量数据的矩阵X和包含所有疗效指标的数据的矩阵Y;通过OSC方法对所述样本数据进行预处理,以去除X中与Y正交的分量。较佳地,所述通过OSC方法对所述样本数据进行预处理时,所述处理器具体被配置为:按照如下公式计算各分量的权值向量w:wT=YTX/(YTY);其中,T表示矩阵的转置;按照如下公式对w进行归一化:w=w/||w||;按照如下公式计算每个分量的得分t:t=Xw/(wTw);以及得到载荷的转置向量P:PT=tTX/(tTt);按照如下公式计算正交分量的权值向量:w⊥=p-w;以及对w⊥进行归一化:w⊥=w⊥/||w⊥||;计算各分量的正交分量t⊥:计算正交分量的载荷向量从X中减去正交分量,得到修正后的XOSC:判断正交分量的权值向量w⊥与载荷向量的模的比值k=||w⊥||/||p||与预设值的大小,如果大于预设值,则继续修正,否则,停止修正。较佳地,所述处理器还被配置为:计算所述回归方程的复测定系数。本申请的实施例提供的技术方案可以包括以下有益效果:由于采用灰色关联度从样本数据中将中药复方的多个成分中与疗效指标关联度最小的成分剔除,即去除了对样本回归影响最不好的成分,选取出关键的成分,获取了高质量的样本数据,基于获取的样本数据进行PLS回归模型,得到疗效和成分的回归方程,基于回归方程确定的成分和成分的配比,更加精确、有效、快速的确定量效关系。本方案尤其适合处理成分复杂的中药复方,可使最终所得的模型中数据大大减少,能消除输入数据间的多重相关性后再进行建模,与相关技术中的传统的PLS回归模型得到的量效关系相比,更加准确。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。图1是本申请一个实施例提供的一种基于PLS确定中药复方的成分配比的方法的流程示意图。图2是本申请另一个实施例提供的一种基于PLS确定中药复方的成分配比的装置的结构示意图。图3是本申请另一个实施例提供的一种基于PLS确定中药复方的成分配比的装置的结构示意图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。图1是本申请一个实施例提供的基于PLS确定中药复方的成分配比的方法流程图。参见图1,本实施例的方法可以包括:步骤11、获取中药复方的样本数据;样本数据包含多组中药复方的量效数据;每组量效数据包含中药复方的n个成分的含量数据和对应的疗效指标的数据;步骤12、采用灰色关联度确定中药复方的n个成分与疗效指标的关联度,去除中药复方中的关联度最低的成分,得到新样本数据;新样本数据中,每组量效数据包含中药复方的n-1个成分的含量数据和对应的疗效指标的数据;步骤13、通过PLS回归模型,对新样本数据进行回归拟合,得到疗效指标关于n-1个成分的回归方程;步骤14、根据回归方程,确定中药复方的n-1个成分的配比。由于采用灰色关联度从样本数据中将中药复方的多个成分中与疗效指标关联度最小的成分剔除,即去除了对样本回归影响最不好的成分,选取出关键的成分,获取了高质量的样本数据,基于获取的样本数据进行PLS回归模型,得到疗效和成分的回归方程,基于回归方程确定的成分和成分的配比,更加精确、有效、快速的确定量效关系。本方案尤其适合处理成分复杂的中药复方,可使最终所得的模型中数据大大减少,能消除输入数据间的多重相关性后再进行建模,与相关技术中的传统的PLS回归模型得到的量效关系相比,更加准确。为了保证样本数据的有效性,较佳地,在上述步骤11获取中药复方的样本数据之后,上述步骤12采用灰色关联度确定中药复方的n个成分与疗效指标的关联度之前,本实施例的方法还可以包括:将样本数据进行归一化处理,得到包含所有含量数据的矩阵X和包含所有疗效指标的数据的矩阵Y;通过OSC方法对样本数据进行预处理,以去除X中与Y正交的分量。如此,可以将样本数据中与疗效无关的中药成分的数据去除,比如,可以将包含正交的分量的一组量效数据去除,不会影响模型回归,将横向的中药成分个数以及纵向的疗效指标的数据都进行了优化,缩减了模型的内部结构,提高了模型的解释能力,保证了模型在不同用药量情况下预测精度的准确性。具体的,通过OSC方法对样本数据进行预处理,可以是:步骤一、按照如下公式计算各分量的权值向量w:wT=YTX/(YTY);其中,T表示矩阵的转置;步骤二、按照如下公式对w进行归一化:w=w/||w||;步骤三、按照如下公式计算每个分量的得分t:t=Xw/(wTw);以及得到载荷的转置向量P:PT=tTX/(tTt);步骤四、按照如下公式计算正交分量的权值向量:w⊥=p-w;以及对w⊥进行归一化:w⊥=w⊥/||w⊥||;步骤五、计算各分量的正交分量t⊥:步骤六、计算正交分量的载荷向量步骤七、从X中减去正交分量,得到修正后的XOSC:步骤八、判断正交分量的权值向量w⊥与载荷向量的模的比值k=||w⊥||/||p||与预设值的大小,如果大于预设值,则继续修正,否则,停止修正。本实施例中,步骤五不经过迭代计算,直接得到正交分量t⊥,大大简化了计算。一般,灰色关联度中,反映系统行为特征的为参考序列,影响系统行为的为比较序列。基于此,较佳地,上述步骤12采用灰色关联度确定中药复方的n个成分与疗效指标的关联度,具体实现方式可以是:步骤一、将样本数据中的疗效指标的数据,作为参考序列y(k),k=1,2,...,m;其中,m表示参考序列中疗效指标的数据的总数,k表示第k个疗效指标的数据;步骤二、将中药复方中的n个成分对应的含量数据,作为比较序列xj(k),k=1,2,...,m,j=1,2,...,n;其中,n表示比较序列的个数,j表示第j个比较序列,m表示第j个比较序列中的含量数据的个数,k表示第j个比较序列中第k个含量数据;步骤三、根据参考序列y(k)和比较序列xj(k),计算灰色关联系数ξj(k);两级最小差记为Δ(min),两级最大差记为Δ(max),参考数列与比较数列的绝对差值|y(k)-xj(k)|记为Δj(k)则原式可化简为:其中,ρ称为分辨系数。ρ越小,分辨力越大,一般ρ的取值区间为(0,1),具体取值可视情况而定。当ρ<=0.5463时,分辨力最好,通常取ρ=0.5。步骤四、确定比较序列与参考序列的关联度:步骤五、将比较序列的关联度R1,R2,...,Rj,...,Rn,作为对应的n个成分与疗效指标的关联度。假设,R2大于R1,则比较数列x2比x1更接近参考数列,从而说明比较数列x2对应的自变量更重要。上述步骤13中,PLS回归模型为常规的模型,下面进行简单介绍。设有q个因变量(对应中药复方的各疗效指标){Y1,Y2,L,Yq}和p个自变量(对应中药复方的各成分的含量){X1,X2,L,Xp},观测n个样本点,由此构造出自变量X={x1,x2,L,xp}n×p与因变量的数据表Y={y1,y2,L,yq}n×q。PLS回归模型的基本做法是在X中提取主分量t1(t1是x1,x2,L,xp的线性组合),同时在Y中提取主分量u1(u1是y1,y2,L,yq的线性组合)。为了符合降维建模的思想,提取的这2个主分量需要满足下列2个要求:(1)t1和u1应尽可能多地携带它们各自数据表中的变异信息;(2)t1和u1的相关程度能够达到最大。这2个要求的限制,不仅使提取的主分量t1和u1能较好地代表原数据表X和Y,同时还使得自变量的主分量t1对因变量的主分量u1有很强的解释能力。PLS回归模型是一个以迭代法逐步提取主分量的方法,对主分量的提取,是将利用X被t1解释后的残余信息以及Y被u1解释后的残余信息分别代替X和Y重复第一步的迭代过程。利用PLS对中药复方提取N个主分量t1,t2,L,tN,PLS回归模型将通过施行Yk(k=1,2,...,q)对t1,t2,L,tN回归,表达成疗效指标Yk关于中药成分X1,X2,L,Xp的回归方程式。本实施例中,k取值为1,即有一个疗效指标。较佳地,本实施例的方法还可以包括:计算回归方程的复测定系数。将计算得到的复测定系数与传统的方案得到的PLS回归模型的复测定系数相比,检验精度是否提高。下面通过具体的应用场景,对本实施例提供的基于PLS确定中药复方的成分配比的方法进行更加详细地说明。本实施例的场景中,智能辅助确定中药复方配方比所采用的系统包括:中药成分测定设备、接口软件、PC机、Windows操作系统、采用本方法开发的全自动智能计算软件。需要使用中药成分测定设备检测出各批药材各成分的含量,将各批药材的成分含量通过软件接口读入内存。下面以经典的中医复方的成分配比对疗效指标的影响为例介绍本方法的具体实施过程。读取中药成分测定设备上的数据包,在内存中打开数据包文件,搜索有效成分字节空间,并对有效成分字节的内容转换成表格的形式存储在内存中,该表格的内容见表1所示的大承气汤的量效关系实验数据表。表1中包括大承气汤的成分及对人体内的d-乳酸的影响,表中一共有十组数据,包括原方和九组配方,自变量x1-x9(即中药复方的各成分)分别是芦荟大黄素、大黄素、大黄酸、大黄酚、大黄素甲醚、厚朴酚、厚朴酚、橙皮苷、辛弗林的成分含量,疗效指标y为d-乳酸含量。利用灰色关联度确定各自变量与疗效指标的关联度,并给自变量排序,参见表2,剔除关联度最小的自变量。表1大承气汤的量效关系实验数据表表2基于关联度的自变量排序关联度0.46670.46770.4830.54540.62840.63420.63820.6490.6673自变量排序X8X9X7X6X1X3X2X4X5由表2可知,X8的关联度最弱,由此删除自变量X8后,得到新样本数据,然后通过PLS回归模型对新样本数据进行回归拟合。拟合后得到回归方程,标准化后的方程如下:Y=0.2302X1+0.2275X2+0.1922X3-0.0156X4-0.2448X5+0.5505X6-0.5966X7+0.1235X9反标准化后的方程如下:Y=0.0888+0.3368X1+0.3552X2+0.145X3-0.0116X4-0.5779X5+1.0995X6-6.134X7+0.0341X9同时求得复测定系数为R^2=0.9548。实验结果对比:以表1数据为例进行实验研究(1)当不删除任何自变量时,对该样本数据进行回归拟合,可得到如下方程:Y=0.0916+0.2229X1+0.2167X2+0.0964X3+0.0292X4-0.1552X5+1.0706X6-5.8149X7-0.0155X8+0.0194X9并求得复测定系数为R^2=0.9277。(2)基于灰色关联度,删除了自变量X8之后,再通过PLS回归模型进行线性回归,求得的复测定系数要比不删除任何变量下的复测定系数要高出0.0217。(3)用PLS回归模型自带的VIP算法通过自变量的重要性筛选,使用SIMCA-P软件求得重要性排序,如表3:表3各自变量VIP值排序VIP值0.70050.7560.86220.87070.880.88580.88650.4241.4364自变量排序X9X8X4X1X3X5X2X7X6由此可得删除VIP值最弱的自变量X9,然后重新整理样本数据,再次进行拟合回归,得到回归方程如下:Y=0.0952+0.3012X1+0.2898X2+0.1216X3+0.0027X4-0.4434X5+1.0057X6-6.2745X7+0.0160X8同时求得复测定系数为R^2=0.9467。将(2)(3)整理可得下表4:表4自变量排序和复测定系数结果对比上述实验结果表明,以复测定系数作为判断模型可靠性标准,针对中药实验数据的自变量,通过灰色关联度删除关联度最弱的自变量X8,计算出灰色关联度优化后的PLS回归模型的回归方程的复测定系数为95.48%,高出删除VIP值最小的自变量X9后得到的复测定系数的0.81%,同时也比在不删除任何自变量下的拟合精度高2.17%。由此可见,通过灰色关联度删除自变量后,方程的拟合精度有所提高,而且提高的精度要远大于用VIP算法的提高精度。说明用该方法优化PLS归回模型是有效的。同样的,以中医药方剂的麻杏石甘汤止咳数据为例,麻杏石甘汤治疗大鼠咳嗽的实验数据共有62个样本,是分别在10个不同杏仁用量下的大鼠体内血药成分关于药理指标的影响。自变量(即上述中药复方的主成分)为大鼠体内主要的血药成分,分别为:麻黄碱、伪麻黄碱、甲基麻黄碱、野黑樱苷以及苦杏仁苷;疗效指标,为咳嗽持续次数。部分实验数据如表5所示:表5麻杏石甘汤止咳的量效关系实验数据表利用灰色关联度确定各自变量与疗效指标的关联度,并给自变量排序,参见表6,剔除关联度最小的自变量。表6基于关联度的各自变量排序关联度0.14480.170.25890.20390.2224自变量排序X5X4X2X1X3由表6可知,X5的关联度最弱,由此删除自变量X5后,得到新样本数据,然后通过PLS回归模型对新样本数据进行回归拟合。拟合后得到回归方程如下:Y=45.7274-0.0014X1-0.0051X2-0.0866X3-0.1502X4同时求得复测定系数为R^2=0.5829。实验结果对比:以表5数据为例进行实验研究(1)当不删除任何自变量时,对该样本数据进行回归拟合,可得到如下方程:Y=45.5780-0.0007X1-0.0046X2-0.0801X3-0.1404X4-0.0091X5并求得复测定系数为R^2=0.5456。(2)基于灰色关联度,删除了自变量X5之后,再通过PLS回归模型进行线性回归,求得的复测定系数要比不删除任何变量下的复测定系数要高出0.0373。(3)用PLS回归模型自带的VIP算法通过自变量的重要性筛选,使用SIMCA-P软件求得重要性排序,如表7:表7各自变量VIP值排序VIP值0.50400.58350.66071.02390.7090自变量排序X1X5X2X3X4由此可得删除VIP值最弱的自变量X1,然后重新整理样本数据,再次进行拟合回归,得到回归方程如下:Y=45.6640-0.0076X2-0.1066X3-0.1351X4+0.0036X5同时求得复测定系数为R^2=0.5746。将(2)(3)整理可得下表:表8自变量排序和复测定系数结果对比上述实验结果表明,以复测定系数作为判断模型可靠性标准,针对中药实验数据的自变量,通过灰色关联度删除关联度最弱的自变量X5,计算出灰色关联度优化后的PLS回归模型的回归方程的复测定系数为58.29%,高出删除VIP值最小的自变量X1后得到的复测定系数的0.83%,同时也比在不删除任何自变量下的拟合精度高3.73%。由此可见,通过灰色关联度删除自变量后,方程的拟合精度有所提高,而且提高的精度要远大于用VIP算法的提高精度。说明用该方法优化PLS回归模型是有效的。图2是本申请一个实施例提供的基于PLS确定中药复方的成分配比的装置示意图。参见图2,本实施例的装置可以包括:样本获取模块201,用于获取中药复方的样本数据;样本数据包含多组中药复方的量效数据;每组量效数据包含中药复方的n个成分的含量数据和对应的疗效指标的数据;关联度确定模块202,用于采用灰色关联度确定中药复方的n个成分与疗效指标的关联度,去除中药复方中的关联度最低的成分,得到新样本数据;新样本数据中,每组量效数据包含中药复方的n-1个成分的含量数据和对应的疗效指标的数据;回归拟合模块203,用于通过PLS回归模型,对新样本数据进行回归拟合,得到疗效指标关于n-1个成分的回归方程;确定模块204,用于根据回归方程,确定中药复方的n-1个成分的配比。较佳地,关联度确定模块,具体用于:将样本数据中的疗效指标的数据,作为参考序列y(k),k=1,2,...,m;其中,m表示参考序列中疗效指标的数据的总数,k表示第k个疗效指标的数据;将中药复方中的n个成分对应的含量数据,作为比较序列xj(k),k=1,2,...,m,j=1,2,...,n;其中,n表示比较序列的个数,j表示第j个比较序列,m表示第j个比较序列中的含量数据的个数,k表示第j个比较序列中第k个含量数据;根据参考序列y(k)和比较序列xj(k),计算灰色关联系数ξj(k);确定比较序列与参考序列的关联度:将比较序列的关联度R1,R2,...,Rj,...,Rn,作为对应的n个成分与疗效指标的关联度。较佳地,还包括预处理模块;预处理模块,用于获取中药复方的样本数据之后,采用灰色关联度确定中药复方的n个成分与疗效指标的关联度之前,将样本数据进行归一化处理,得到包含所有含量数据的矩阵X和包含所有疗效指标的数据的矩阵Y;通过OSC方法对样本数据进行预处理,以去除X中与Y正交的分量。较佳地,通过OSC方法对样本数据进行预处理时,预处理模块,具体用于:将样本数据进行归一化处理,得到包含所有含量数据的矩阵X和包含所有疗效指标的数据的矩阵Y;按照如下公式计算各分量的权值向量w:wT=YTX/(YTY);其中,T表示矩阵的转置;按照如下公式对w进行归一化:w=w/||w||;按照如下公式计算每个分量的得分t:t=Xw/(wTw);以及得到载荷的转置向量P:PT=tTX/(tTt);按照如下公式计算正交分量的权值向量:w⊥=p-w;以及对w⊥进行归一化:w⊥=w⊥/||w⊥||;计算各分量的正交分量t⊥:计算正交分量的载荷向量从X中减去正交分量,得到修正后的XOSC:较佳地,还包括测定系数计算模块;测定系数计算模块,用于:计算回归方程的复测定系数。本申请的一个实施例还提供一种非临时性计算机可读存储介质,当存储介质中的指令由处理器执行时,使得处理器能够执行一种基于PLS确定中药复方的成分配比的方法,本实施例的方法包括:获取中药复方的样本数据;样本数据包含多组中药复方的量效数据;每组量效数据包含中药复方的n个成分的含量数据和对应的疗效指标的数据;采用灰色关联度确定中药复方的n个成分与疗效指标的关联度,去除中药复方中的关联度最低的成分,得到新样本数据;新样本数据中,每组量效数据包含中药复方的n-1个成分的含量数据和对应的疗效指标的数据;通过PLS回归模型,对新样本数据进行回归拟合,得到疗效指标关于n-1个成分的回归方程;根据回归方程,确定中药复方的n-1个成分的配比。较佳地,采用灰色关联度确定中药复方的n个成分与疗效指标的关联度,包括:将样本数据中的疗效指标的数据,作为参考序列y(k),k=1,2,...,m;其中,m表示参考序列中疗效指标的数据的总数,k表示第k个疗效指标的数据;将中药复方中的n个成分对应的含量数据,作为比较序列xj(k),k=1,2,...,m,j=1,2,...,n;其中,n表示比较序列的个数,j表示第j个比较序列,m表示第j个比较序列中的含量数据的个数,k表示第j个比较序列中第k个含量数据;根据参考序列y(k)和比较序列xj(k),计算灰色关联系数ξj(k);确定比较序列与参考序列的关联度:将比较序列的关联度R1,R2,...,Rj,...,Rn,作为对应的n个成分与疗效指标的关联度。较佳地,获取中药复方的样本数据之后,采用灰色关联度确定中药复方的n个成分与疗效指标的关联度之前,本实施例的方法还包括:将样本数据进行归一化处理,得到包含所有含量数据的矩阵X和包含所有疗效指标的数据的矩阵Y;通过OSC方法对样本数据进行预处理,以去除X中与Y正交的分量。较佳地,通过OSC方法对样本数据进行预处理,包括:按照如下公式计算各分量的权值向量w:wT=YTX/(YTY);其中,T表示矩阵的转置;按照如下公式对w进行归一化:w=w/||w||;按照如下公式计算每个分量的得分t:t=Xw/(wTw);以及得到载荷的转置向量P:PT=tTX/(tTt);按照如下公式计算正交分量的权值向量:w⊥=p-w;以及对w⊥进行归一化:w⊥=w⊥/||w⊥||;计算各分量的正交分量t⊥:计算正交分量的载荷向量从X中减去正交分量,得到修正后的XOSC:判断正交分量的权值向量w⊥与载荷向量的模的比值k=||w⊥||/||p||与预设值的大小,如果大于预设值,则继续修正,否则,停止修正。较佳地,本实施例的方法还包括:计算回归方程的复测定系数。图3是本申请一个实施例提供的基于PLS确定中药复方的成分配比的装置的结构示意图。参见图3,本实施例的装置,包括:处理器301;用于存储处理器可执行指令的存储器302;其中,处理器301被配置为:获取中药复方的样本数据;样本数据包含多组中药复方的量效数据;每组量效数据包含中药复方的n个成分的含量数据和对应的疗效指标的数据;采用灰色关联度确定中药复方的n个成分与疗效指标的关联度,去除中药复方中的关联度最低的成分,得到新样本数据;新样本数据中,每组量效数据包含中药复方的n-1个成分的含量数据和对应的疗效指标的数据;通过PLS回归模型,对新样本数据进行回归拟合,得到疗效指标关于n-1个成分的回归方程;根据回归方程,确定中药复方的n-1个成分的配比。较佳地,采用灰色关联度确定中药复方的n个成分与疗效指标的关联度时,处理器具体被配置为:将样本数据中的疗效指标的数据,作为参考序列y(k),k=1,2,...,m;其中,m表示参考序列中疗效指标的数据的总数,k表示第k个疗效指标的数据;将中药复方中的n个成分对应的含量数据,作为比较序列xj(k),k=1,2,...,m,j=1,2,...,n;其中,n表示比较序列的个数,j表示第j个比较序列,m表示第j个比较序列中的含量数据的个数,k表示第j个比较序列中第k个含量数据;根据参考序列y(k)和比较序列xj(k),计算灰色关联系数ξj(k);确定比较序列与参考序列的关联度:将比较序列的关联度R1,R2,...,Rj,...,Rn,作为对应的n个成分与疗效指标的关联度。较佳地,处理器还被配置为:获取中药复方的样本数据之后,采用灰色关联度确定中药复方的n个成分与疗效指标的关联度之前,将样本数据进行归一化处理,得到包含所有含量数据的矩阵X和包含所有疗效指标的数据的矩阵Y;通过OSC方法对样本数据进行预处理,以去除X中与Y正交的分量。较佳地,通过OSC方法对样本数据进行预处理时,处理器具体被配置为:按照如下公式计算各分量的权值向量w:wT=YTX/(YTY);其中,T表示矩阵的转置;按照如下公式对w进行归一化:w=w/||w||;按照如下公式计算每个分量的得分t:t=Xw/(wTw);以及得到载荷的转置向量P:PT=tTX/(tTt);按照如下公式计算正交分量的权值向量:w⊥=p-w;以及对w⊥进行归一化:w⊥=w⊥/||w⊥||;计算各分量的正交分量t⊥:计算正交分量的载荷向量从X中减去正交分量,得到修正后的XOSC:判断正交分量的权值向量w⊥与载荷向量的模的比值k=||w⊥||/||p||与预设值的大小,如果大于预设值,则继续修正,否则,停止修正。较佳地,所述处理器还被配置为:计算所述回归方程的复测定系数。关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。需要说明的是,在本申请的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是指至少两个。流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属
技术领域
的技术人员所理解。应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。本
技术领域
的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。上述提到的存储介质可以是只读存储器,磁盘或光盘等。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1