生物过程的监测、模拟、以及控制的制作方法

文档序号:37794472发布日期:2024-04-30 17:04阅读:5来源:国知局
生物过程的监测、模拟、以及控制的制作方法

本公开涉及用于监测、模拟、优化和控制生物过程的计算机实现方法、计算机程序和系统。本公开的特定方法、程序和系统使用机器学习来预测生物过程中的产物的一个或多个关键质量属性。


背景技术:

1、生物过程使用生物系统来生产特定的生物材料,例如,具有治疗作用的生物分子。该过程通常涉及在受控的大气条件下将细胞和/或微生物放入具有包含营养物的培养基的生物反应器中。培养基被细胞消耗并用于生长和其他代谢功能,包括生产特定的生物材料和副产物。

2、生物反应器通常包含仪器或与仪器相关联,该仪器连续(例如,每秒、每分钟、每小时一次)测量过程条件(例如温度、ph和溶解氧)以及营养物和气体的添加和离开生物反应器的流的流量和含量。通常,周期性地(例如,每天一次或两次,或多于两次)采集培养物样本,以测量主体流体(bulk fluid)的含量,包括一个或多个代谢物(例如,葡萄糖、谷氨酰胺、乳酸盐、nh4等)的浓度、细胞度量(例如总细胞和活细胞密度(viable cell density,vcd))、以及产物生物材料的浓度(也称为滴度(titer))。通常,也测量产物生物材料的质量度量(有时也称为“质量属性”或“关键质量属性”(critical quality attribute,cqa)),例如,产物的糖基化谱(glycosylation profile)或活性。这些质量度量通常仅在过程结束时测量一次,并且在离线测量之后可用,且可用性具有显著的延迟(例如,数天或数周)。因为许多cqa的测量非常缓慢,所以通常仅在过程已经运行之后才确定质量,并且不能再采取校正动作。

3、统计过程分析方法可以用来评估生物过程的良好的性能。特别地,多元统计模型(包括主成分分析(principal component analysis,pca)和(正交)偏最小二乘((orthogonal)partial least square,(o)pls)回归)已经成为用于识别过程条件的流行工具,这些过程条件对于确保cqa在规范内(统称为“关键过程参数”(critical processparameter,cpp)),并在生物过程进展到完成时确定这些过程条件的可接受范围非常重要。这样的工具已经在软件套件(sartorius stedim data analytics)中实现,这是一种用于对生物制药开发和制造过程进行建模和优化的领先的数据分析软件。

4、在典型的生物过程分析中,在生物过程完成期间测量一系列过程变量(例如数十个过程变量,包括温度、关键营养物和代谢物的浓度、ph、体积、气体浓度、活细胞密度等)。这些过程变量一起表示“过程条件”。这些变量中的许多变量是高度相关的,因此,可以使用pca和pls等方法来识别捕获数据中相关结构的概要变量(summary variable)。然后可以提取这些变量(通常相对较少),并且可以估计定义“正常”的过程条件(预期将产生具有可接受的cqa的产物)的这些变量的值的范围。使用这些方法,通过将cpp保持在定义的限制内或者在规定的轨迹上来运行生物过程,上述方法已被确定会产生具有cqa的产物,该产物被认为表示可接受的优质产物。cpp与cqa之间的联系通常没有得到充分理解,导致cpp限制仅基于历史观察。根据具体情况,这些可能是不必要的限制且不足以确保cqa。

5、因此,需要一种用于监测、模拟和控制生物过程的改进方法的系统和方法,以确保可接受的cqa,这种系统和方法没有现有技术的所有缺点。


技术实现思路

1、根据本公开的第一方面,提供了一种用于监测生物过程的方法,该生物过程包括生物反应器中的细胞培养物,该方法包括以下步骤:获得状态空间模型的一个或多个成熟度的一个或多个状态变量的值以及可选地一个或多个成熟度的从该一个或多个状态变量导出的一个或多个变量的值,该状态空间模型包括表示细胞培养物的状态的变化的动力学生长模型以及可选地,表示生物反应器中的一个或多个代谢物的主体浓度的变化的物质平衡模型;使用机器学习模型预测生物过程的产物的一个或多个关键质量属性的值,该机器学习模型被训练用于基于输入变量来预测一个或多个关键质量属性的值,该输入变量包括一个或多个成熟度的一个或多个状态变量的值或者一个或多个成熟度的从该一个或多个状态变量导出的变量的值。

2、在本公开的上下文中,可以以时间单位表示成熟度。例如,成熟度可以指自生物过程开始以来的时间量或任何其他参考时间。因此,对特定“成熟度”和“成熟度函数”的提及应解释为包括“时间点”、“时间”和“时间函数”。

3、第一方面的方法可以具有以下可选特征中的任一特征或任何特征组合。

4、该方法还可以包括获得一个或多个过程条件的值,一个或多个过程条件包括一个或多个成熟度的一个或多个过程参数和/或一个或多个代谢物浓度。输入变量还可以包括一个或多个过程条件的值。输入变量可以包括一个或多个状态变量中的至少一个的值。输入变量可以包括状态空间模型的多个状态变量的值。输入变量可以包括一个或多个状态变量中的至少一个的值、以及从该一个或多个状态变量导出的至少一个变量的值。获得一个或多个过程条件的值可以包括直接或间接测量一个或多个过程条件的值。获得一个或多个过程条件的值可以包括例如从用户、计算设备或存储器接收这些值。

5、动力学生长模型可以包括将细胞培养物的活细胞密度xv、死细胞密度xd、总细胞密度xt和裂解细胞密度xl中的一个或多个的变化表示为时间/成熟度函数的一个或多个方程。这些方程中的每一个都可以表示状态空间模型的状态变量。动力学生长模型可以包括莫诺德动力学模型(monod kinetic model)或饱和动力学模型(saturation kinetic model)。动力学生长模型可以用于估计随时间变化的细胞生长。例如,可以使用方程(11)至方程(14)或者从方程(11)至方程(14)导出的方程中的任何或所有方程。例如,可以通过以下方式从这些方程导出方程:用从方程(14)导出的对应项替换方程(11)-(13)中的一项或多项;根据对应的假设(例如,其中假设不存在特定流)删除方程(11)-(14)中的任何方程中的一项或多项;或者根据对应的假设(例如,其中假设存在附加流)添加方程(11)-(14)中的任何方程中的一项或多项。在方程(11)-(13)中,项μeff和/或项μd可以使用方程(15)-(24)中的任何方程来建模。物质平衡模型可以包括表示生物反应器中的一个或多个代谢物的主体浓度的变化的一个或多个方程。例如,对于一个或多个代谢物中的每一个,物质平衡模型可以包括由方程(25)给出的形式的方程,例如方程(26)或等价方程(例如,方程(26a)-(26d))。

6、产物可以包括诸如细胞产生的一个或多个小分子或大分子的一个或多个生物分子。产物可以包括培养物中的生物质和/或诸如一个或多个细胞器的生物质的部分。关键质量属性可以包括任何物理、化学、生物或微生物属性或特性,这些属性或特性应该低于或高于适当的阈值、在适当的范围内、或者属于适当的分布,以确保产物的所需质量(其中,适当的阈值、范围或分布可以根据这些属性/特性和产物的所需质量来预先确定)。一个或多个关键质量属性可以选自:包括在产物中或者是产物的小分子或大分子的分子结构、包括在产物中或者是产物的蛋白质或肽的糖基化谱、产物的活性、产物的产率、一个或多个宿主细胞蛋白(host cell protein)的存在或不存在、以及产物的纯度。产物的纯度也可以表示为一个或多个污染物的浓度。产物的活性可以指任何感兴趣的活性,例如,在存在产物的情况下(例如,通过产物对反应的催化)特定的反应或反应的集合的速率、产物与一个或多个靶点的结合亲和力(binding affinity)等。产物的活性可以指与包括酶的产物相关联的酶活性,其中产物可以是细胞培养物或包括由该细胞培养物产生的酶的纯化组合物。产物的纯度和/或活性可以指生物过程的粗制产物的纯度和/或活性,也可以指在一个或多个下游处理步骤(例如,纯化)之后的生物过程的产物的纯度和/或活性。

7、一个或多个状态变量或者从该一个或多个状态变量导出的变量可以包括选自以下的至少一个变量:代谢物的单位转运速率、代谢物的主体流体浓度、产物的主体流体浓度、由于细胞生长而在培养物中积累并抑制细胞生长的生物材料的主体流体浓度、滴度的单位生产率、以及细胞状态变量。细胞状态变量可以选自:活细胞密度、死细胞密度、总细胞密度、细胞活力、有效生长速率、死亡速率、以及裂解细胞密度。一个或多个状态变量可以是生物过程的动态模型的变量,该动态模型包括动力学生长模型。动力学生长模型可以包括描述活细胞密度、死细胞密度、以及裂解细胞密度的动力学的方程。动力学生长模型可以包括表示生物材料的浓度的变量,该生物材料由于细胞生长而在培养物中积累并抑制细胞生长和/或对该细胞有毒动力学生长模型可以包括描述变量的动力学的方程,该变量表示由于细胞生长而在培养物中积累的生物材料的浓度。动力学生长模型可以包括使用细胞生长速率参数描述活细胞密度的动力学的方程,该细胞生长速率参数是最大生长速率和描述由于细胞生长而在培养物中积累的生物材料对生长的抑制的因子的乘积。动力学生长模型可以包括常微分方程。动力学生长模型可以包括方程(11)-(24)或其等价方程中的任何一个或多个,例如方程(11a)、(12a)、(13a)、(16a)、(22a)和(15a)。

8、使用方程(11)-(30)和其等价方程中的任何方程,尤其使用方程(11)-(16)、(22)、(25)-(27)和其等价方程中的任何或所有方程(例如,方程(11a)、(12a)、(13a)、(16a)、(22a)和(15a)),来获得一个或多个状态变量或者从该一个或多个状态变量导出的变量。代谢物i的第一成熟度的单位转运速率可以从一个或多个状态变量导出,该一个或多个状态变量包括代谢物i的第一成熟度和第一成熟度之前的第二成熟度的浓度。这可以使用物质平衡模型来执行,例如使用方程(27)或等价方程(例如,方程(27a)-(27f)),或者捕获方程(25)中的流的任何其他方程)来执行。代谢物i的第一成熟度的单位转运速率可以使用机器学习模型从一个或多个状态变量导出,该一个或多个状态变量包括代谢物i的一个或多个成熟度的浓度和该一个或多个成熟度的一个或多个过程条件的值,该机器学习模型被训练用于基于输入变量来预测包括代谢物i的一个或多个代谢物的单位转运速率,该输入变量包括代谢物i或其前体(precursor)的一个或多个成熟度的浓度和/或该一个或多个成熟度的一个或多个过程条件的值。代谢物i的单位转运速率可以是每细胞和每单位成熟度在细胞和培养基之间转运的代谢物的净量。一个或多个成熟度可以包括第一成熟度和/或第一成熟度之前的一个或多个成熟度。优选地,用于预测一个或多个代谢物的单位转运速率的一个或多个过程条件值包括至少一个代谢物浓度值。一个或多个过程条件值还可以包括过程条件的至少一个其他值,优选地至少两个其他值。一个或多个代谢物浓度值可以包括已确定单位转运速率的一个或多个代谢物的浓度。一个或多个代谢物可以替代地或另外包括一个或多个代谢物的浓度,这些代谢物是已确定了单位转运速率的一个或多个代谢物的前体。一个或多个代谢物可以替代地或另外包括一个或多个代谢物的浓度,这些代谢物是生产或消耗已确定了单位转运速率的一个或多个代谢物的反应产物。代谢物的主体流体浓度可以使用诸如方程(26)或其等价方程(例如,方程(25)和方程(26a)-(26d))的物质平衡方程来获得。活细胞密度可以使用方程(11)或其等价方程来获得。细胞活力可以使用方程(11)-(14)或其等价方程,作为活细胞密度与总细胞密度的比率而获得。死细胞密度可以使用方程(12)或其等价方程来获得。裂解细胞密度可以使用方程(13)或其等价方程来获得。由于细胞生长而在培养物中积累并抑制细胞生长的生物材料的主体流体浓度可以使用方程(16)或其等价方程来获得。产物的主体流体浓度可以使用诸如物质平衡方程,例如方程(26)或其等价方程(例如,方程(25)和方程(26a)-(26d)),或者方程(30)来获得。有效生长速率可以使用方程(22)或其等价方程来获得。死亡速率可以使用方程(15)或其等价方程来获得。滴度的单位生产率可以使用多元模型(例如pls或(o)pls)来获得,该多元模型用于例如使用选自一个或多个代谢物、一个或多个代谢物浓度、以及一个或多个过程变量的单位转运速率的变量,来预测随本文所述的代谢条件变化的滴度的单位生产率。所提供的方程的等价方程可以指捕获相同过程但因一个或多个基础模型假设而不同的方程。

9、状态空间模型和/或动力学生长模型可以是已使用来自与预测了关键质量属性的值的生物过程不同的一种生物过程的数据进行参数化的模型。例如,预测了关键质量属性的值的生物过程可以是灌注(perfusion)生物过程或连续(continuous)培养,并且状态空间模型和/或动力学生长模型可以是已使用来自分批或补料分批(fed-batch)过程的数据进行参数化的模型。状态空间模型和/或动力学生长模型可以是已使用来自与预测了关键质量属性的值的生物过程相同的一种生物过程的数据进行参数化的模型。

10、一个或多个过程条件包括一个或多个过程参数,该一个或多个过程参数选自溶解氧、溶解co2、ph、温度、渗透压、搅拌速度、搅拌功率、顶空气体成分(例如,co2压力)、流速(例如,进料速率、出料速率、收获速率)、进料介质成分、以及培养物的体积;和/或其中,一个或多个代谢物浓度包括细胞室、培养基室、或者整个细胞培养物中的一个或多个代谢物的浓度。

11、该方法还可以包括将一个或多个关键质量属性的值与一个或多个预定值进行比较。该方法还可以包括基于该比较确定生物过程是否正常运行(或符合规范)。生物过程的产物的一个或多个关键质量属性的预测值可以与成熟度相关联。与一个或多个关键质量属性的预测值相关联的成熟度可以是与作为输入提供给机器学习模型的值相关联的一个或多个成熟度中的一个成熟度。或者,与一个或多个关键质量属性的预测值相关联的成熟度可以不是与作为输入提供给机器学习模型的值相关联的一个或多个成熟度中的一个成熟度。例如,其可以是未来成熟度,例如最终成熟度(例如,分批或补料分批生物过程的结束)。一个或多个关键质量属性可以与成熟度相关联,并且将一个或多个关键质量属性与一个或多个预定值进行比较可以包括:将一个或多个关键质量属性和与对应成熟度(例如,相同或类似成熟度,例如预定值可用的最近成熟度)相关联的一个或多个预定值进行比较。将一个或多个关键质量属性的值与一个或多个预定值进行比较可以包括:将一个或多个关键质量属性的值与一个或多个相应的预定阈值(例如,下限阈值和/或上限阈值)进行比较。例如,将一个或多个关键质量属性的值与一个或多个预定值进行比较可以包括:确定关键质量属性的值是否在预定范围内、高于预定下限阈值、或者低于预定上限阈值。阈值和/或范围可以基于被认为产生可接受的产物的cqa的值来确定。将一个或多个关键质量属性的值与一个或多个预定值进行比较可以包括:将一个或多个关键质量属性的值与被认为根据规范运行的一组生物过程中的对应变量的平均值进行比较。一个或多个预定值可以基于产物的一个或多个所需特征来确定。例如,最低产率、纯度或活性、或特定的糖基化谱可能是产物可用所必需的。如果一个或多个关键质量属性的值在被认为正常运行的一组生物过程中相应的对应变量的平均值的预定范围内,则可以认为该生物过程根据规范运行。该预定范围可以定义为与被认为正常运行的一组生物过程中相应的对应变量的平均值相关联的标准偏差的函数。如果一个或多个变量c的值在定义为average(c)±n*sd(c)的范围内,则可以认为生物过程正常运行,其中,average(c)是被认为正常运行的一组生物过程中的变量c的平均值,sd(c)是与average(c)相关联的标准偏差,并且n是预定常数(对于子范围average(c)+n*sd(c)和子范围average(c)-n*sd(c),n可以相同,或者在这些子范围之间可以不同)。可以将n的值选择为1、2、3、或实现所选置信区间(例如,95%置信区间)的值。如果一个或多个变量c的值在定义为置信区间(例如,基于c的假设分布的围绕average(c)的95%置信区间)的范围内,则可以认为生物过程正常运行。假设分布可以是高斯(正态)分布、卡方分布(chi-squared distribution)等。在假设分布是正态分布的情况下,p%置信区间(其中p可以是例如95)可以等效于average(c)±n*sd(c)的范围,其中,n是实现p%置信区间的单个值(例如,对于95%置信区间,n可以约为1.96)。该方法还可以包括:如果上述比较步骤指示生物过程不正常运行,则向用户输出信号。可以通过诸如屏幕的用户界面或通过诸如音频或触觉信令的任何其他方式输出信号。

12、机器学习模型可以是回归模型。机器学习模型可以选自线性回归模型、随机森林回归器、人工神经网络(artificial neural network,ann)、及其组合。适合地,机器学习模型可以是人工神经网络。机器学习模型可以包括多个机器学习模型,其中,每个机器学习模型已经被训练用于预测一个或多个关键质量属性的单独选择的子集的值。机器学习模型可以已被训练用于联合预测一个或多个关键质量属性的值。有利地,机器学习模型是ann或ann的集合。本发明人已经发现ann特别适合用于当下的任务。在不希望被理论束缚的情况下,发明人认为这至少部分是因为ann非常适合用于使用具有复杂相关结构的输入数据来预测值。因此,ann在联合预测多个关键质量属性方面表现很好。机器学习模型可以包括多个机器学习模型,其中,每个机器学习模型已经被训练用于预测多个关键质量属性中的一个或多个。联合预测多个关键质量属性(即,其全部或子集)可以有利地提高预测的准确性,其中,联合预测的关键质量属性彼此相关。机器学习模型可以已使用来自多个类似生物过程的数据进行训练,其中,类似生物过程是将相同细胞用于相同目的的生物过程。机器学习模型可以已使用来自多个类似生物过程的数据进行训练,其中,至少一些生物过程在随成熟度变化的一个或多个过程条件方面彼此不同。机器学习模型可以已被训练用于基于输入变量来预测与生物过程的结束对应的成熟度的一个或多个关键质量属性的值,该输入变量包括一个或多个先前成熟度的一个或多个状态变量的值或者一个或多个先前成熟度的从该一个或多个状态变量导出的变量的值、以及可选地一个或多个先前成熟度的一个或多个过程条件的值。在这样的实施例中,生物过程可以是分批或补料分批过程。机器学习模型可以已被训练用于基于输入变量来预测当前成熟度的一个或多个关键质量属性的值,该输入变量包括一个或多个成熟度的一个或多个状态变量的值或者一个或多个成熟度的从该一个或多个状态变量导出的变量的值、以及可选地一个或多个成熟度的一个或多个过程条件的值,该一个或多个成熟度包括当前成熟度和/或一个或多个先前成熟度。在这样的实施例中,生物过程可以是灌注过程。一个或多个成熟度可以包括当前成熟度。

13、获得一个或多个成熟度的一个或多个状态变量以及可选地一个或多个成熟度的一个或多个过程条件的值可以包括获得多个成熟度的一个或多个状态变量以及可选地多个成熟度的一个或多个过程条件的值;并且机器学习模型可以已被训练用于使用输入来预测多个成熟度中的最晚成熟度或较晚成熟度的一个或多个关键质量属性,该输入包括多个成熟度的一个或多个状态变量以及可选地多个成熟度的生物过程的一个或多个过程条件的值。例如,机器学习模型可以已被训练用于基于输入值来预测两个不同成熟度中的最晚成熟度或较晚成熟度的一个或多个关键质量属性,该输入值包括两个不同成熟度的一个或多个状态变量以及可选地两个不同成熟度的生物过程的一个或多个过程条件的值。用作机器学习模型输入的一个或多个状态变量以及可选地过程条件的值可以与彼此相隔成熟度差(difference in maturity)的多个成熟度相关联,成熟度差约等于用于训练机器学习模型的值之间的成熟度差。与使用单个成熟度的预测变量相比,使用多个成熟度的预测变量(即,输入变量)预测关键质量属性可以有利地提高预测的准确性。在不希望被理论束缚的情况下,通过使用在多个时间点的预测变量可以提高机器学习预测的准确性,这是因为这些数据可以捕获关于生物过程动力学的信息。

14、获得状态空间模型的一个或多个成熟度的一个或多个状态变量的值和/或一个或多个成熟度的从该一个或多个状态变量导出的变量的值可以包括:使用状态空间模型预测生物过程的状态轨迹。使用状态空间模型预测生物过程的状态轨迹可以包括:查找表示状态空间模型的解的一个或多个成熟度的一个或多个状态空间变量的值。换言之,获得状态空间模型的一个或多个成熟度的一个或多个状态变量的值或者一个或多个成熟度的从该一个或多个状态变量导出的变量的值可以包括:例如通过对共同构成了该模型的一个或多个方程求积分,或者根据该模型使用任何其他合适的方法(例如,随机模拟(stochasticsimulation)),在该一个或多个成熟度求解状态空间模型。过程的状态可以包括这样的模型中的任何变量的值,例如一个或多个细胞培养物状态变量(在本文中也称为“细胞培养物参数”和/或代谢物浓度)的值。过程的状态轨迹可以包括多个时间点/成熟度的状态变量的值。因此,代谢物i的浓度可以视为过程条件(例如,其中浓度是生物过程/状态空间模型的初始条件,或者其中浓度不是作为模型中的状态变量捕获的浓度),或者视为状态空间模型的状态变量(例如,其中浓度是状态空间模型的状态变量并且通过在给定成熟度或多个成熟度求解状态空间模型来获得)。获得状态空间模型的一个或多个成熟度的一个或多个状态变量的值或者一个或多个成熟度的从该一个或多个状态变量导出的变量的值可以包括:通过直接或间接测量一个或多个变量的值,或者通过例如从用户、计算设备或存储器接收这些值,来获得一个或多个状态变量的值。此外,可以接收一个或多个状态变量的一些值(例如,通过测量获得、从用户、计算设备或存储器获得),并且可以通过使用状态空间模型预测生物过程的状态轨迹来确定一些值,作为本方法的一部分。使用状态空间模型预测生物过程的状态轨迹可以包括:确定单个成熟度或多个成熟度的一个或多个状态空间变量的值。换言之,轨迹可以包括单个成熟度的一组状态变量的值。

15、使用状态空间模型预测生物过程的状态轨迹可以包括:使用如上所述的机器学习模型来预测该模型中的每个代谢物i的第一成熟度的单位转运速率,以及使用预测的单位转运速率来使用物质平衡模型确定对应的一个或多个代谢物的较晚成熟度的浓度。例如,确定对应的一个或多个代谢物的较晚成熟度的浓度包括:求解相应的物质平衡方程。例如,确定代谢物i(mi)在成熟度k的浓度可以包括在mi已知的先前成熟度和成熟度k之间对方程(25)、(26a)-(26c)和(29)中的任何方程求积分(例如,使用方程(27a)-(27f)中的任何方程),其中,k是与预测的单位转运速率相关联的成熟度。该方法还可以包括使用一个或多个上述浓度来确定较晚成熟度的细胞状态变量的值。确定较晚成熟度的细胞状态变量的值包括求解动力学生长模型。在成熟度k求解动力学生长模型可以包括在xv、xl、xd和/或xt(活细胞密度、裂解细胞密度、死细胞密度和/或总细胞密度)已知的先前成熟度和成熟度k之间对方程(11)至(14)中的任何方程求积分。该方法还可以包括使用一个或多个上述代谢物浓度和/或生物质相关度量值作为被训练用于预测单位转运速率的机器学习模型的输入,来预测模型中的每个代谢物i的其他成熟度的单位转运速率

16、使用状态空间模型预测生物过程的状态轨迹可以包括:使用物质平衡模型,例如使用方程(27)或等价方程(例如,方程(27a)-(27f),或者捕获方程(25)中的流的任何其他方程)、以及一个或多个代谢物的第一成熟度和先前成熟度的浓度,来确定模型中的一个或多个代谢物i的第一成熟度的单位转运速率。该方法还可以包括使用第一成熟度的一个或多个上述浓度来确定第一成熟度的细胞状态变量的值。确定第一成熟度的细胞状态变量的值可以包括求解动力学生长模型。可以在一个或多个其他成熟度重复该过程,以确定一个或多个代谢物在上述其他成熟度中的每个成熟度的的单位转运速率以及一个或多个细胞状态变量的值。该方法还可以包括:通过将特定值包括在物质平衡模型、动力学生长模型、和/或机器学习模型用于预测单位转运速率的输入值、和/或机器学习模型用于预测关键质量属性的输入值中,来预测过程参数的特定值的影响。一个或多个代谢物可以包括所需产物。类似地,生物质本身可以包括所需产物。因此,该方法可以包括使用状态空间模型来预测生物过程中所需产物的浓度。

17、可以使用从用户、计算设备或存储器接收的过程条件值来执行本方面的各种方法。可以使用在生物过程运行期间实时获得的过程条件值来执行本方面的各种方法。这样的过程条件值可以包括运行设置(即,由运行者设置的参数),和/或在生物过程运行期间在线内测量(即,在线或线上)或离线测量的值。因此,本文描述的监测生物过程的各种方法可以实时地实施,即在生物过程的运行期间实时地实施。在这样的实施例中,获得一个或多个过程条件的值的步骤可以包括接收最晚成熟度的一个或多个过程条件的值(已经测量或确定该最晚成熟度的这样的值),并且可选地包括从数据存储器获得一个或多个先前成熟度的一个或多个过程条件的值。

18、本方面的任何方法可以包括在数据存储器中记录一个或多个过程条件的值、一个或多个状态变量的值、确定的关键质量属性和/或从该关键质量属性导出的值。该方法还可以包括:通过将特定值包括在物质平衡方程、动力学生长模型、和/或机器学习模型用于预测其他成熟度的关键质量属性的输入值中,来预测较晚成熟度的过程参数的特定值的影响。

19、预测生物过程的状态轨迹可以等效于模拟生物过程。因此,还根据本方面描述了模拟生物过程的方法,该生物过程包括生物反应器中的细胞培养物,该方法包括:获得一组初始条件,该组初始条件包括一个或多个初始成熟度的包括一个或多个过程参数的一个或多个过程条件的值、以及状态空间模型的一个或多个状态变量的值,该状态空间模型包括表示细胞培养物的状态的变化的动力学生长模型、以及可选地表示生物反应器中的一个或多个代谢物的主体浓度的变化的物质平衡模型;通过使用状态空间模型和该组初始条件预测生物过程的状态轨迹,来获得状态空间模型的一个或多个后续成熟度的一个或多个状态变量的值以及可选地一个或多个后续成熟度的从该一个或多个状态变量导出的一个或多个变量的值;使用机器学习模型预测生物过程的产物的一个或多个关键质量属性的值,该机器学习模型被训练用于基于输入变量来预测一个或多个关键质量属性的值,该输入变量包括一个或多个所选成熟度的一个或多个状态变量的值或者一个或多个所选成熟度的从该一个或多个状态变量导出的变量的值、以及可选地一个或多个所选成熟度的一个或多个过程条件的值,该输入变量包括选自一个或多个后续成熟度的一个或多个成熟度的一个或多个状态变量的值和/或选自一个或多个后续成熟度的一个或多个成熟度的从该一个或多个状态变量导出的变量的值。用作机器学习模型输入的任何过程参数的值可以从用户界面、计算设备或存储器获得。例如,可以提供一个或多个过程参数的轨迹作为该方法的输入,其中,过程参数的轨迹包括多个成熟度的过程参数的值。

20、根据第二方面,提供了一种用于控制生物过程的方法,该方法包括:执行根据上述第一方面的任何实施例的方法;将一个或多个关键质量属性的值或者从该一个或多个关键质量属性导出的值与一个或多个预定值进行比较;基于上述比较确定是否实施校正动作。该方法还可以包括:如果上述确定步骤指示要实施校正动作,则向一个或多个效应器装置发送信号以实施校正动作。

21、根据本方面的方法可以具有关于第一方面公开的任何特征。本方面的方法还可以具有以下可选特征中的任一特征或任何特征组合。

22、基于上述比较确定是否实施校正动作可以包括基于上述比较确定生物过程是否正常运行,如果上述比较步骤指示生物过程不正操运行,则向一个或多个效应器装置发送信号以实施校正动作。基于上述比较确定是否实施校正动作可以包括基于上述比较确定生物过程是否最佳地运行,如果上述比较步骤指示生物过程未最佳地运行,则向一个或多个效应器装置发送信号以实施校正动作。确定生物过程是否最佳地运行可以包括确定一个或多个过程条件的不同集合是否与一个或多个关键质量属性的改进值或者从该一个或多个关键质量属性导出的值相关联。在这样的实施例中,一个或多个预定值可以包括与过程条件的一个或多个不同集合相关联的值。

23、该方法还可以包括在自获得一个或多个状态变量的值以及可选地一个或多个过程条件的值以来经过预定时间段之后,重复上述监测生物过程的方法的步骤。校正动作可以与一个或多个过程条件的值的变化相关联。该方法还可以包括:通过将上述值包括在状态空间模型和/或机器学习模型用于预测关键质量属性的输入中,来预测校正动作的效果,以确定要实施的校正动作。效应器装置可以是耦合至生物反应器的任何设备,效应器装置用于改变生物反应器中的一个或多个物理条件或化学条件。

24、根据第三方面,提供了一种优化生物过程的方法,该生物过程包括生物反应器中的细胞培养物,该方法包括:使用第一组过程条件和至少另一组过程条件(例如,每组过程条件用于使用状态空间模型预测状态轨迹,从而获得与每组过程条件相关联的一个或多个状态变量的值以及可选地从该一个或多个状态变量导出的一个或多个变量的值)来执行上述第一方面的任何实施例的方法;通过比较与各组过程条件相关联的关键质量属性或从该关键质量属性导出的值,来确定另一组过程条件是否优于第一组过程条件。

25、比较与各组过程条件相关联的关键质量属性或从该关键质量属性导出的值可以包括:针对每组过程条件确定期望函数(desirability function)的值,该期望函数对在预定范围之外的关键质量属性的值施加惩罚。这些范围可以是封闭的或开放的。期望函数可以对应用于生物过程的度量的一个或多个目标,例如最大化产率、所需产物的浓度、一段时间内产生的所需产物的总量等给予奖励。例如,期望函数可以包括一项或多项,如果关键质量属性或从该关键质量属性导出的值在预定范围之外,则该一项或多项降低函数值,并且可选地,该一项或多项随生物过程的一个或多个度量增加(例如,在产出的情况下)或减少(例如,在进料消耗的情况下)而增加函数值。

26、该方法还可以包括选择另一组过程条件,并将与另一组过程条件相关联的关键质量属性或从该关键质量属性导出的值和与一组或多组先前使用的条件相关联的关键质量属性或从该关键质量属性导出的值进行比较。上述选择另一组过程条件的步骤可以包括从用户界面接收另一组条件、从数据库或计算设备获得另一组条件、使用优化算法确定另一组条件、或其组合。本方面的方法还可以包括:识别一组过程条件作为生物过程的最佳过程条件,以及根据所识别的该组过程条件运行生物过程。该方法还可以包括:使用一个或多个传感器来测量随成熟度变化的生物过程的实验过程条件;监测测量的实验过程条件,以检测与最佳过程条件的偏差;当检测到偏差时,向用户发送通知和/或向控制生物反应器的控制器提供反馈以自动调整实验过程条件,以最小化与最佳过程条件的偏差。

27、根据第四方面,提供了一种提供用于监测生物过程的工具的方法,该生物过程包括生物反应器中的细胞培养物,该方法包括以下中的步骤:获得状态空间模型的多个生物过程的一个或多个成熟度的一个或多个状态变量的值以及可选地多个生物过程的一个或多个成熟度的从该一个或多个状态变量导出的一个或多个变量的值和/或多个生物过程的一个或多个成熟度的一个或多个过程条件的值,该状态空间模型包括表示细胞培养物的状态的变化的动力学生长模型、以及可选地表示生物反应器中的一个或多个代谢物的主体浓度的变化的物质平衡模型;使用获得的值来训练机器学习模型基于输入变量预测一个或多个关键质量属性的值,该输入变量包括一个或多个成熟度的一个或多个状态变量的值和/或一个或多个成熟度的从该一个或多个状态变量导出的变量的值。

28、上述任何方面的方法还可以包括参数化状态空间模型。例如,参数化状态空间模型可以包括:(例如,通过从生物过程获得测试样品)获得与生物过程的状态变量对应的测量值、使用具有第一组参数的状态空间模型来预测生物过程的一个或多个状态变量的值、以及确定该测量值是否在由具有第一组参数的状态空间模型预测的值的范围内。状态空间模型的参数可以包括与状态空间模型相关联的系数,例如方程(11)至方程(29)的任何系数。该方法还可以包括基于测量值与由具有第一组参数的状态空间模型预测的值之间的差值来提供第二组参数。

29、除非上下文另有指示,否则本文描述的方法的所有步骤都是计算机实现的。特别地,本方法的任何步骤可由计算设备实现,可选地,该计算设备与一个或多个传感器、其他计算设备和/或用户界面进行可操作通信。

30、根据第五方面,提供了一种用于监测生物过程的系统,该生物过程包括生物反应器中的细胞培养物,该系统包括:至少一个处理器;包含指令的至少一个非暂时性计算机可读介质,当由至少一个处理器执行时,该指令使至少一个处理器执行以下操作:获得状态空间模型的一个或多个成熟度的一个或多个状态变量的值以及可选地一个或多个成熟度的从该一个或多个状态变量导出的一个或多个变量的值,该状态空间模型包括表示细胞培养物的状态的变化的动力学生长模型、以及可选地表示生物反应器中的一个或多个代谢物的主体浓度的变化的物质平衡模型;使用机器学习模型预测生物过程的产物的一个或多个关键质量属性的值,该机器学习模型被训练用于基于输入变量来预测一个或多个关键质量属性的值,该输入变量包括一个或多个成熟度的一个或多个状态变量的值或者一个或多个成熟度的从该一个或多个状态变量导出的变量的值。根据本方面的系统可以用于实现根据第一方面的任何实施例的方法。特别地,上述至少一个非暂时性计算机可读介质可以包含指令,当由至少一个处理器执行时,该指令使至少一个处理器执行包括关于第一方面描述的任何操作的操作。该系统还可以包括与上述处理器可操作地连接的以下中的一个或多个:用户界面,可选地,其中,指令还使处理器向用户界面提供以输出到用户的以下中的一个或多个:一个或多个关键质量属性的值或从该一个或多个关键质量属性导出的变量的值、上述比较步骤的结果、以及指示生物过程已被确定为正常运行或不正常运行的信号;一个或多个生物质传感器;一个或多个代谢物传感器;一个或多个过程条件传感器;一个或多个效应器装置。

31、根据本公开的第六方面,提供了一种用于控制生物过程的系统,该系统包括:根据前述方面的用于监测生物过程的系统;以及可操作地连接到用于监测生物过程的上述系统的处理器的至少一个效应器装置。根据本方面的系统可以用于实现第二方面的任何实施例的方法。特别地,上述至少一个非暂时性计算机可读介质可以包含指令,当由至少一个处理器执行时,该指令使至少一个处理器执行包括关于第二方面描述的任何操作的操作。

32、根据第七方面,提供了一种用于优化生物过程的系统,该生物过程包括生物反应器中的细胞培养物,该系统包括:至少一个处理器;包含指令的至少一个非暂时性计算机可读介质,当由至少一个处理器执行时,该指令使至少一个处理器执行以下操作:使用第一组过程条件和至少另一组过程条件(例如,每组过程条件用于使用状态空间模型预测状态轨迹,从而获得与每组过程条件相关联的一个或多个状态变量的值)来执行上述第一方面的任何实施例的方法;通过比较与各组过程条件相关联的关键质量属性或从该关键质量属性导出的值,来确定另一组过程条件是否优于第一组过程条件。根据本方面的系统可以用于实现根据第三方面的任何实施例的方法。特别地,上述至少一个非暂时性计算机可读介质可以包含指令,当由至少一个处理器执行时,该指令使至少一个处理器执行包括关于第三方面描述的任何操作的操作。

33、根据第八方面,提供了一种提供用于监测和/或控制和/或优化生物过程的工具的系统,该生物过程包括生物反应器中的细胞培养物,该系统包括:至少一个处理器;包含指令的至少一个非暂时性计算机可读介质,当由至少一个处理器执行时,该指令使至少一个处理器执行以下操作:获得状态空间模型的多个生物过程的一个或多个成熟度的一个或多个状态变量的值以及可选地多个生物过程的一个或多个成熟度的从该一个或多个状态变量导出的一个或多个变量的值、以及可选地多个生物过程的一个或多个成熟度的一个或多个过程条件的值,该状态空间模型包括表示细胞培养物的状态的变化的动力学生长模型、以及可选地表示生物反应器中的一个或多个代谢物的主体浓度的变化的物质平衡模型;使用获得的值来训练机器学习模型基于输入变量来预测一个或多个关键质量属性的值,该输入变量包括一个或多个成熟度的一个或多个状态变量的值或者一个或多个成熟度的从该一个或多个状态变量导出的变量的值。根据本方面的系统可以用于实现根据第四方面的任何实施例的方法。特别地,上述至少一个非暂时性计算机可读介质可以包含指令,当由至少一个处理器执行时,该指令使至少一个处理器执行包括关于第四方面描述的任何操作的操作。

34、根据另一方面,提供了一种包括指令的非暂时性计算机可读介质,当由至少一个处理器执行时,该指令使至少一个处理器执行本文所述的任何方面的任何实施例的方法。

35、根据另一方面,提供了一种包括代码的计算机程序,当在计算机上执行时,该代码使计算机执行本文所述的任何方面的任何实施例的方法。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1