一种预测菌体浓度的方法

文档序号:37659937发布日期:2024-04-18 20:33阅读:8来源:国知局
一种预测菌体浓度的方法

本发明属于毕赤酵母发酵,具体涉及一种预测菌体浓度的方法。


背景技术:

1、作为当前最有价值的外源蛋白表达系统之一,毕赤酵母蛋白表达系统可以有效表达数千种蛋白,包括各类生物酶、调节蛋白、抗原及抗体等。因此,准确实时地检测毕赤酵母发酵过程中的生物参量对于提高毕赤酵母生产效率有着重要意义。为避免离线采样-化验分析带来的染菌及实时性较差等问题,应用易于实时获得的参量(如温度,ph,搅拌速率等)构建机器学习模型来达到实时预测不易直接测量的生物参量的效果的软测量检测方法得到广泛应用。

2、然而,实际工业过程中不同工况下发酵过程数据分布差异较大,导致源工况下建立的软测量模型应用于目标工况时模型失准。


技术实现思路

1、为了克服上述现有技术存在的不足,本发明提供了一种预测菌体浓度的方法。

2、为了实现上述目的,本发明提供如下技术方案:

3、一种预测菌体浓度的方法,包括:

4、获取多个源工况数据,所述源工况数据为在源工况下毕赤酵母发酵过程中的菌体浓度数据以及与之对应的物理参数数据;获取目标工况的已知数据,所述目标工况的已知数据为在目标工况下已知的毕赤酵母发酵过程中的菌体浓度数据以及与之对应的物理参数数据;

5、利用迁移成分分析法最小化源工况数据和目标工况的已知数据的边缘概率分布后,得到新的源工况数据;将新的源工况数据作为训练集;

6、利用多个训练集分别训练多个最小二乘支持向量机,得到训练好的多个最小二乘支持向量机;

7、计算训练集的子集质心,并计算测试集中的数据与各个子集质心的关联度系数作为各个最小二乘支持向量机的权重;所述关联度系数为皮尔逊相关系数,所述训练集的子集质心为训练集数据的平均值;

8、将各个最小二乘支持向量机按照权重加权后得到集成迁移软测量模型;

9、将待测的目标工况的物理参数数据输入集成迁移软测量模型中,得到待测工况数据下所对应的菌体浓度。

10、进一步,所述利用迁移成分分析法最小化源工况数据和目标工况的已知数据的边缘概率分布后,得到新的源工况数据;包括:

11、设源域为ds={xs,ys},其中xs为源域样本数据集,ys为源域标签数据集;

12、假目标域dt={xt},其中xt为目标域样本数据集,目标域标签数据未知;

13、使用p(xs)和p(xt)之间的距离近似两个领域之间的差异,其表达式为:

14、

15、假设存在一个特征映射φ,使得映射后数据的分布满足:

16、p(φ(xs))≈p(φ(xt))

17、利用最大均值差异mmd作为源域和目标域之间的距离计算公式,以获得未知的特征映射φ:

18、

19、式中,n1为源域样本个数,n2为目标域样本个数;xi∈xs,xj∈xt;||·||h表示再生核希尔伯特空间范数;

20、将展开后的内积转化为核矩阵形式,将式(2)进一步表示为:

21、dist(xs,xt)=tr(kl)

22、

23、式中:ks,s、kt,t、ks,t、kt,s分别为源域,目标域及两域间的核矩阵,且l为度量矩阵,其表达式为:

24、

25、将核矩阵分解为k=(kk-1/2)(k-1/2k),同时定义低维矩阵将核映射转化为m维空间上(m<n1+n2),转化后的核矩阵表示为:

26、

27、在最小化两域间距离即式(2)时,引入正则化项tr(wtw),约束项是数据的散度;对映射后的数据wtk而言,约束项是其协方差矩阵其中i表示单位矩阵,i表示n1+n2行的全1列向量;

28、优化目标公式为:

29、

30、s.t. wtkhkw=im                         (6)

31、式中:μ为权衡因子;

32、求解式(6),得到最优映射矩阵w,

33、利用最优映射矩阵w实现对源域和目标域特征数据空间的映射,得到新的源工况数据。

34、进一步,在训练最小二乘支持向量机时:利用粒子群优化算法优化最小二乘支持向量机的模型参数;所述利用粒子群优化算法优化最小二乘支持向量机的模型参数;包括:

35、每个粒子的更新速度vi和位置的表达式为:

36、

37、式中:c1和c2表示加速因子,用于调节粒子的运动速度和方向,r1和r2服从u(0,1)分布的随机数,惯性权重w用于平衡局部勘探和全局探勘。

38、进一步,所述惯性权重w为:

39、

40、式中,rand(k)为当前迭代次数的随机概率。

41、进一步,加速因子c1和c2分别为:

42、c1=c1s-(c1s-c1e)cos(k/k)          (17)

43、c2=c2s-(c2s-c2e)cos(k/k)           (18)

44、式中,c1s和c2s分别代表学习因子c1和c2的初始值;c1e和c2e分别为学习因子c1和c2最终值。

45、进一步,所述利用粒子群优化算法优化最小二乘支持向量机的模型参数,最小二乘支持向量机的优化问题为:

46、

47、i=1,2,…,n

48、式中,γ和ξi分别表示正则化系数和误差,w和b分别表示权重项和偏执项,x表示输入变量,为非线性逼近函数;

49、求解最小二乘支持向量机的优化问题得到最优的最小二乘支持向量机。

50、进一步,所述求解最小二乘支持向量机的优化问题;包括:

51、将最小二乘支持向量机的优化问题表示为拉格朗日形式:

52、

53、式中:ai为拉格朗日乘子;

54、通过对各个变量求其偏导并令偏导为0求解,得到以下方程组:

55、

56、消去w和ξi,将优化问题定义为:

57、

58、式中,ω和i分别表示核矩阵和恒等式矩阵;核矩阵表示为

59、求解式(11)获得lssvm函数估计如下:

60、

61、式中:k(xi,x)为核函数;

62、所述核函数k(xi,x)为径向基函数rbf,径向基函数rbf的表达式为:

63、

64、式中,σ2为待定参数,表示径向基函数宽度;

65、利用粒子群优化算法对σ2和γ进行优化,得到最小二乘支持向量机的优化问题的解。

66、一种预测菌体浓度的系统,其特征在于,包括:

67、数据采集模块,用于获取多个源工况数据,所述源工况数据为在源工况下毕赤酵母发酵过程中的菌体浓度数据以及与之对应的物理参数数据;获取目标工况的已知数据,所述目标工况的已知数据为在目标工况下已知的毕赤酵母发酵过程中的菌体浓度数据以及与之对应的物理参数数据;

68、数据平衡模块,用于利用迁移成分分析法最小化源工况数据和目标工况的已知数据的边缘概率分布后,得到新的源工况数据;将新的源工况数据作为训练集;

69、模型训练模块,用于利用多个训练集分别训练多个最小二乘支持向量机,得到训练好的多个最小二乘支持向量机;

70、计算模块,用于计算训练集的子集质心,并计算测试集中的数据与各个子集质心的关联度系数作为各个最小二乘支持向量机的权重;所述关联度系数为皮尔逊相关系数,所述训练集的子集质心为训练集数据的平均值;模型生成模块,用于将各个最小二乘支持向量机按照权重加权后得到集成迁移软测量模型;

71、预测模块,用于将待测的目标工况的物理参数数据输入集成迁移软测量模型中,得到待测工况数据下所对应的菌体浓度。

72、本发明提供的一种预测菌体浓度的方法具有以下有益效果:

73、本发明针对毕赤酵母不同工况下发酵过程数据分布差异较大问题,引入迁移学习当中的迁移成分分析法适配源工况数据和目标工况的已知数据的边缘概率分布以降低不同工况下数据分布差异。在此基础上,由于迁移学习问题比较复杂,仅从单个源域中建立单个模型对迁移学习任务进行评估存在一定的局限性,因此需要利用多种源工况数据训练多个模型,并为每个模型分配不同的权重进行加权,以得到一个能够适配多个工况的集成模型从而进一步提升模型预测精度。解决了现有技术中源工况下建立的软测量模型应用于目标工况时模型失准的问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1