基于R语言和正交试验的水蛭素提取工艺的优化方法与流程

文档序号:14572294发布日期:2018-06-01 23:06阅读:412来源:国知局

本发明涉及一种水蛭素提取工艺的优化方法,具体涉及一种水蛭素提取工艺的优化方法。



背景技术:

水蛭为水蛭科动物蚂蟥、水蛭或柳叶蚂蟥的干燥全体,味苦、咸;性平,具有通络活血、逐瘀散结之功效。

水蛭素是从水蛭唾液腺中分离出的一种多肽类分泌物,通过抑制凝血酶与血小板结合从而延缓血液凝固和促进纤维蛋白溶解。经过多年实验研究和临床应用研究证实,水蛭素的抗凝效果明显高于肝素,是迄今为止发现的最高效的且直接作用于凝血酶的抑制剂。因此,将其开发成高效特异性抗凝血抗血栓药物已受到国内外研究者的广泛关注,但水蛭素的抗凝血活性低、纯度低以及提取成本高等局限性使其临床上的应用与推广受限。因此,应用高效低廉的方法获得水蛭素的最大产量,将为水蛭素的实际生产带来很大改观,具有较高的经济效益和市场价值。

现有的水蛭素提取工艺的优化方法多基于实际实验,这样大大耗费了人力和物力而且未必能实现最优的效果。



技术实现要素:

一种基于R语言和正交试验的水蛭素提取工艺的优化方法,该方法包括如下步骤:设计不同的因素参数进行正交试验并获得正交试验数据;确定水蛭素提取工艺的因素参数;在R语言环境下建立具有至少一个隐层的BP神经网络模型;将输入层分别设为因素参数;将输出层的节点至少被设为水蛭素活性参数;采用实际水蛭素提取工艺中所采用的因素参数和实测所得的活性参数对BP神经网络进行训练;在R语言环境下利用遗传算法和BP神经网络模型求最优解。该最优解所对应的输入层节点的参数就是最佳的工艺参数。

进一步地,因素参数的数目大于等于3。

进一步地,BP神经网络模型的输入层的节点数目大于等于3。

进一步地,因素参数分别为浸泡时间,液料比和提取次数。

进一步地,隐层神经元的节点数为0。

进一步地,输出层的水蛭素活性参数为抗凝血酶活性。

进一步地,抗凝血酶活性为每1g原料的提取物所含凝血酶活性单位。

进一步地,BP神经网络模型包括一个设为误差项的输入层节点。

进一步地,采用遗传算法时,种群大小设定为1000,接近的最大代数为100,最大不可变代数为10,收敛公差为1×10-4

进一步地,在选取BP神经网络模型的隐层神经元节点时针对实际实验数据采用留一法进行交叉验证,以平均拟合误差和平均预测误差作为选取隐层神经元节点数目的标准。

本的有益之处在于:

提供了一种能够利用现有数据进行运算和分析从改良原有工艺的基于R语言和正交试验的水蛭素提取工艺的优化方法。

附图说明

图1是本发明的基于R语言和正交试验的水蛭素提取工艺的优化方法步骤示意框图。

具体实施方式

如图1所示,基于R语言和正交试验的水蛭素提取工艺的优化方法,该方法包括如下步骤:一种基于R语言和正交试验的水蛭素提取工艺的优化方法,该方法包括如下步骤:设计不同的因素参数进行正交试验并获得正交试验数据;确定水蛭素提取工艺的因素参数;在R语言环境下建立具有至少一个隐层的BP神经网络模型;将输入层分别设为因素参数;将输出层的节点至少被设为水蛭素活性参数;采用实际水蛭素提取工艺中所采用的因素参数和实测所得的活性参数对BP神经网络进行训练;在R语言环境下利用遗传算法和BP神经网络模型求最优解。该最优解所对应的输入层节点的参数就是最佳的工艺参数。

比如一种水蛭素提取方法包括:称取A质量份水蛭粉末;准备B质量份的生理盐水;将水蛭粉末和生理盐水均置入浸提容器中进行预设时间的浸提处理,该时间为了方便说明定义为浸泡时间;对浸提容器中已经浸提处理的混合液进行离心处理;离心处理后留取预设体积的上清液。

其中,作为一种具体方案,可以称取1g水蛭粉末,加入5mL生理盐水,摇匀后浸提30分钟,浸提过程中可以持续或间断地摇晃。离心后取100μL上清液置1.5mL的EP管中。

为提高提取的效果,在进行浸提时,对容器施以超声波震荡,具体而言,将容器置于一夹持机构,驱动该夹持机构使容器摇晃;在容器的周边设置若干超声波探头向容器所处的方向施加超声波。在容器进行摇晃时,超声波的频率较高但幅值较低,且以脉冲的形式进行输出;在容器静止时,超声波的频率较低但幅值较高且以持续的形式输出。

在进行离心时,同样对容器施以超声波以提高提取效率,具体而言,设置若干超声波探头使容器做离心的运动的空间存在超声波,在开始离心的初始阶段,以较低的转速进行离心,此时使超声波以较高的频率和幅值进行持续输出,在满足第一预设时间后,使离心速度增加,同时使超声波以较高的频率和幅值进行脉冲输出,在满足第二预设时间后,使离心速度增加至最大,使超声波以较低的频率和幅值进行脉冲输出,这个脉冲的频率低于之前的脉冲频率。

采用这样的方式,可以利用离心时的时间进一步提高提取的效率。

为了检测所提取的液体的抗凝血酶的活性,可以采用以下的方案,取三羟甲基氨基甲烷盐酸缓冲液(Tris-Hcl)配制的0.5%牛纤维蛋白原溶液200μL,摇匀后于37℃水浴锅中温提5min,在此过程中每分钟滴加5μL浓度为40U/mL的凝血酶溶液(现配),边滴加边轻轻摇晃直至可挑出白色絮状物,记录滴加凝血酶溶液的次数,并按照下式计算水蛭素的抗凝血酶活性:

C1V1

U=C2V2

式中U—每1g水蛭含凝血酶活性单位,单位U/g;

C1—凝血酶溶液的浓度,单位为μL/mL;

C2—供试品溶液的浓度,单位为g/mL;

V1—消耗凝血酶溶液的体积,单位为μL;

V2—供试品溶液的加入量,单位为μL。

其中,一个抗凝血酶活性单位即为中和一个单位的凝血酶的量。

具体而言,水蛭粉的质量份A与生理盐水的质量份B的比值的取值范围为0.05至0.2。比如,水蛭粉与生理盐水的比值为1:6或1:8或1:10。水蛭粉的质量份A与生理盐水的质量份B的比值的倒数定义为液料比。

作为具体方案,生理盐水的浓度为0.9%,该浓度为质量浓度(请确认)。

作为具体方案,浸提处理的预设时间的取值范围为20分钟至150分钟;更优的取值范围为30分钟至120分钟;作为更具体的时间取值范围,浸提处理的预设时间的取值范围为85分钟至110分钟。

浸提处理的次数大于等于2。可以反复对同一浸提容器中的水蛭粉进行多次提取,该次数定义提取次数。

具体到实际,因素参数分别为浸泡时间,液料比和提取次数和误差项。

如下表1和表2所示,设计不同的参数进行正交实验。按照以上方式实验得到结果如表2所示。将表2中正交实验结果进行方差分析,结果见表3。

表1正交因素水平设计表

表2正交试验及结果

表3抗凝血活性方差分析

查表得临界值F0.05(2,2)=19.0,F0.01(2,2)=99.0

以水蛭素抗凝血活性为考察指标,由表2中极差项可以得出,影响因素的主次顺序为B>A>C>D,由表3方差分析结果可知,B因素对水蛭素的影响具有显著性意义(P﹤0.05),A因素、C因素和D因素无统计学差异(P﹥0.05),从表2直观分析得知,最优提取工艺组合为A3B3C2D1,即浸泡时间120min、液料比10:1、提取次数2次,此条件下提取得到的水蛭素的最佳抗凝活性为311.67U/g。

将正交试验的9组数据分别采用留一法进行交叉验证,以平均拟合误差和平均预测误差作为选取隐层神经元节点数目的依据和标准,结果如表4。由表4可知,隐层神经元节点数目为0时,交叉验证训练后平均拟合误差、平均预测误差均小于5%,符合筛选条件,而隐层神经元数为1、2、3时,平均拟合误差或平均预测误差无统计学意义。BP神经网络的隐层神经元个数增加到一定数量时,可能会产生拟合过度现象。

继而在上述参数条件下,以正交试验的9组数据为测试样本,对不同个数的隐层神经元节点数目进行拟合误差的测试训练,结果如表5所示。随着隐层神经元节点数目个数的增加,拟合误差呈先增大再降低的趋势,由此可判断为隐层神经元节点数目0之后增加神经元数将导致网络模型拟合过度。因此,此次模型的隐层神经元个数设定为0,此时BP神经网络精度可,且稳定可信。

表4隐层神经元(size)训练结果(%)

表5隐层神经元(size)测试训练结果

遗传算法是一种借鉴优胜劣汰的自然进化规律发展起来的解决最优解类问题的算法。在优胜劣汰的生物进化论基础上,遗传算法将初始群体的全部个体进行编码,计算适用度后,通过复制、交叉、突变等操作产生新的个体,淘汰适应度低的个体,将适应度高的个体重新组成一个种群,重复此过程,直至满足要求为止。遗传算法不依赖繁琐的辅助公式及参数或其他领域的知识,整体搜索能力强,因此本次网络模型中应用遗传算法思想对水蛭素提取因素各水平进行全局寻优。

依据遗传算法的基本思想,并基于已建立的BP神经网络,采用实数编码方式,种群大小设定为1000,接近的最大代数为100,最大不可变代数为10,收敛公差为1×10-4,其他参数设为默认值。

作为具体的方案,运用遗传算法的方法包括如下步骤:

1.初始化:即进行编码,把所需要选择的特征进行编号,每一个特征就是一个基因,一个解就是一串基因的组合。设置进化代数计数器t=0,设置最大进化代数100,随机生成个体作为初始群体P(0)。具体而言,这里所指的特征即为以上所指出浸泡时间、液料比、提取次数等因素参数。

2.个体评价:计算群体中各个个体的适应度。计算交换产生的新个体的适应度。适应度用来度量种群中个体优劣(符合条件的程度)的指标值,这里的适应度就是特征组合的判据的值。这个判据的选取是遗传算法的关键所在。

3.选择运算:将选择算子作用于群体。选择的目的是把优化的个体直接遗传到下一代或通过配对交叉产生新的个体再遗传到下一代。

遗传算法通过选择过程体现这一思想,进行选择的原则是适应性强的个体为下一代贡献的概率大,选择实现了达尔文的适者生存原则。本文直接选取交换后的群体中具有最大适应度的前N个个体作为下一代进行繁殖。这一步骤的存在使得当前群体是所有搜索过的解之中是最优的前N个的集合。

4.交叉运算:将交叉算子作用于群体。遗传算法中起核心作用的就是交叉算子。

由交换概率(Pc)挑选的每两个父代通过将相异的部分基因进行交换(如果交换全部相异的就变成了对方而没什么意义),从而产生新的个体。可以得到新一代个体,新个体组合了其父辈个体的特性。交换体现了信息交换的思想。

5.变异运算:将变异算子作用于群体。即是对群体中的个体串的某些基因座上的基因值作变动。

群体P(t)经过选择、交叉、变异运算之后得到下一代群体P(t+1)。

随机地改变串结构数据中某个基因的值。同生物界一样,GA中变异发生的概率很低,通常取值在0.001~0.01之间。变异为新个体的产生提供了机会。

6.终止条件判断:若t=T,则以进化过程中所得到的具有最大适应度个体作为最优解输出,终止计算。

作为一个具体的实例,以下列出一种运算的具体方法:

根据以上的方法进行求解,可知运用R语言环境进行编程,最终由遗传算法得到的结果为运行时间为2s,运行到第12代时找到提取水蛭素的最大抗凝活性为328.37U/g,其提取条件为浸泡时间90min、液料比12:1、提取2次。

重复5次经过优化后的提取工艺进行验证,所得出的结果如表6所示,可知本发明的方法为一种较为可靠和高效的优化方法。

表6 R语言工艺验证结果

中药的化学成分复杂多样,且有效成分提取过程中受众多外界和内在因素的影响,难以对各实验因素进行全面分析。正交试验设计仅仅考虑了各影响因素的某几个试验点对提取工艺的影响,未从整个试验区间进行考察,因此优选出的提取因素的水平往往是局部最优解。本发明在R环境下结合BP神经网络及遗传算法对正交试验9组数据进行优化处理及预测分析,依据网络的仿真功能对试验中各影响因素的变化进行仿真分析,将正交设计各提取因素水平以外的实验过程进行延伸与预测,对各实验因素进行全面分析,从而获得多因素连续区域中的最优组合。本次正交试验得出的最佳值为311.67U/g,而R语言环境下利用正交实验数据进行数学建模目标寻优后得到最优解为328.37U/g,明显优于正交试验最优解,且筛选后得到的最佳提取条件即浸泡时间90min、液料比12:1、提取2次,是正交试验设计中未体现的。经工艺验证,R语言环境下结合BP神经网络及遗传算法处理正交试验数据得出的实验测量值和网络预测值的相对误差较小,由此可简便科学的预测及分析中药有效部位和成分的提取工艺。

综上所述,R语言环境下应用BP神经网络结合遗传算法思想进行中药提取影响因素的目标寻优是科学可行的,在正交试验数据基础上无需增加实验次数,就能寻找最佳提取条件,并可用于在提取工艺中建立多指标与多参数之间的关系模型[10],应用正交设计却又优于正交设计,为解决中药提取过程中多维复杂非线性模型的建立及其参数寻优提供了新的方法和参考。

以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,上述实施例不以任何形式限制本,凡采用等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1