用于色谱数据分析的方法和系统与流程

文档序号:31029931发布日期:2022-08-06 01:45阅读:71来源:国知局
用于色谱数据分析的方法和系统与流程
用于色谱数据分析的方法和系统
本技术是发明专利201780066406.1的分案申请。相关申请的交叉引用
1.本技术要求于2016年10月25日提交的美国申请号62/368,438的优先权,其全部公开内容通过引用并入本文。
技术领域
2.本发明的方法总体上涉及色谱系统和方法,且具体地涉及用于色谱数据分析,例如,用于色谱系统的过程中监测和控制的方法和系统的实施例。


背景技术:

3.填充床色谱处理在生物药物产品的生产中起着重要作用。使用填充床色谱法来纯化许多活性生物制剂,诸如蛋白质,以用于药物产品中。因此,色谱柱操作可能对制造关键工艺参数(cpp)和关键质量属性(cqa)具有显著影响。而且,与例如小分子相比,生物制剂的复杂性和大小可能使得分析生物质量和纯度变得相对更加困难。因此,经由过程中控制来监测色谱方法和设备的质量、一致性和完整性对于确保产品质量满足任何适用标准(例如,政府法规)来说是非常重要的。
4.通常,柱的完整性可以经由流动相的均匀塞流通过柱的固定相(例如树脂)来确定。柱的完整性丧失的示例可包括,例如通道化、顶部空间、流动的污染区域等的证据。除其他之外,当流动相能够从柱的入口朝向柱的出口行进一段距离而不接触固定相时,可能导致通道化。除其他之外,顶部空间可以指当在柱中产生横向区域时,允许流体相的非塞流的空间。流动的污染区域可以包括在入口或出口玻璃料表面上或在树脂孔上的污垢或其他残留物。
5.存在有几种用于监测色谱柱性能和完整性的技术。一些技术,诸如用于测量理论板当量高度(hetp)的脉冲注入方法需要缓冲溶液,该缓冲溶液需要特殊制备。脉冲注入技术通常需要在正常处理之外操作色谱设备和柱,从而导致增加的处理时间和劳动力。其他技术包括作为常规生产的一部分的监测关键参数(例如,在载荷期间的步骤产率、前池体积和最大光密度)。然而,对这些参数设置报警限是困难且不精确的,且可能导致假警报或过宽的限制。
6.需要具有准确性和精确性以及对处理干扰最小的测量和管理柱性能和完整性的方法、系统和处理工艺。而且,由于针对正在进行色谱分析的任何给定产品的色谱柱、色谱柱循环和/或生产批次之间存在固有差异,因此需要用于为特定的柱或多个柱、特定的循环或多个循环和/或特定批次或多个批次的产品定制柱性能和完整性的分析的方法、系统和处理工艺。最后,需要使用这种分析的精确的过程中控制,以及用于响应与这些控制的偏离的方法和系统,以便可以及早地识别和纠正柱完整性和性能的问题,同时使浪费和费用最小化。


技术实现要素:

7.本发明的实施例可以涉及一种处理控制方法,该方法包括:接收包括多个信号的原始色谱数据,其中多个信号中的每个信号与多个块中的一个相关联;通过从原始色谱数据选择第一块和第一信号的组合来获得数据子集;通过对数据子集应用降噪技术来生成经处理的色谱数据;通过对经处理的色谱数据执行转换分析来生成转换数据;以及基于转换数据执行动作。
8.在一些实施例中,该方法还可以包括执行色谱柱运行,其中原始色谱数据可以从色谱柱运行接收。在其他实施例中,原始色谱数据可以从色谱处理仪(chromatography process skid)接收。在更进一步的实施例中,多个块中的每个块可以对应于色谱处理中的步骤。在另外的实施例中,选定的组合可以包括第一块、第一信号和多个信号中的第二信号。
9.在更进一步的实施例中,该方法还可以包括根据限定多个选择标准的配置文件选择第一块和第一信号的组合。在一些实施例中,多个选择标准可以包括:块是否以规则的色谱循环间隔出现;多个信号中的一个使检测器饱和的程度;多个信号在不同水平上接近固定相的程度;在多个信号中的变化幅度;和/或在转换相期间由多个信号示出的多个拐点。
10.在一些实施例中,选择第一块和第一信号的组合可以包括选择主块和信号组合,且该方法还可以包括选择次块和信号组合。在另外的实施例中,降噪技术可以包括:使用预定的设定点来选择要分析的数据子集中的一部分;将部分归一化以防止幅度偏差;在部分上使用至少一个平滑滤波器以生成平滑数据;以及分析部分的动态信号错误。在又一些实施例中,该方法还可以包括:选择匹配色谱转换的特征的平滑数据,其中特征包括下列中的一个:导数持续时间;最大强度;距离开始的持续时间;或预期的背景传感器噪声。在更进一步的实施例中,转换分析可以包括使用处理的色谱数据生成曲线;以及分析曲线以生成性能参数。
11.在一些实施例中,该方法还可以包括基于转换数据生成单值图、移动范围图或范围图;以及通过对单值图、移动范围图或范围图应用统计处理控制生成性能数据,其中基于转换数据执行动作可以包括基于性能数据执行动作。在一些实施例中,应用统计处理控制可以包括执行多变量数据分析或主成分分析中的一个。在一些实施例中,基于性能数据执行动作可以包括生成事件通知,生成对事件的评估,或生成偏差通知表。本发明的一些实施例可以包括色谱分析方法,其包括在运行色谱柱的同时执行处理控制方法。
12.本发明的一些方面可以涉及一种处理控制方法,该方法包括:接收对原始色谱数据的选择;通过向对原始色谱数据的选择应用降噪技术来生成平滑数据;通过选择匹配色谱转换的特征的平滑数据来生成处理的色谱数据;以及基于处理的色谱数据执行动作。降噪技术可以包括:使用预定的设定点来选择要分析的平滑数据的一部分;将该数据部分归一化以防止幅度偏差;在该数据部分上使用至少一个平滑滤波器以生成平滑数据;以及分析该数据部分的动态信号错误。
13.在一些实施例中,接收对原始色谱数据的选择可以包括接收包括多个信号和多个块的原始色谱数据,其中多个信号中的每个信号可以与块相关联;以及从原始色谱数据选择第一块和第一信号的组合。
14.在一些实施例中,该方法还可以包括使用处理的色谱数据来生成单值图、移动范
围图或范围图中的一个;以及通过执行多变量数据分析或主成分分析来对单值图、移动范围图或范围图应用统计处理控制以生成性能数据。在一些实施例中,基于处理的色谱数据执行动作可以包括基于性能数据执行动作。在一些实施例中,动作可以包括生成事件通知,生成对事件的评估,或生成偏差通知表。
15.本发明的一些方面可以包括一种处理控制方法,该方法包括接收处理的色谱数据,其包括第一块和第一信号的组合;对处理的色谱数据执行转换分析;基于转换分析生成单值-移动范围-范围(i-mr-r)图中的一个;通过对i-mr-r图应用多变量统计分析方法来生成性能数据;以及基于性能数据执行动作。动作可以包括生成事件通知,生成对事件的评估,或生成偏差通知表中的一个。
16.在一些实施例中,处理的色谱数据可以包括对原始色谱数据的选择,已对该对原始色谱数据的选择应用了降噪技术。在一些实施例中,对原始色谱数据的选择可以从色谱处理仪接收。
附图说明
17.并入并构成本说明书的一部分的附图示出了所公开的实施例,该附图与描述一起用于解释所公开的实施例的原理。在附图中:
18.图1以示意图的形式描绘了示例性色谱系统,利用该色谱系统可以实施本发明的各种实施例。
19.图2描绘了示例性色谱图。
20.图3描绘了色谱升压转换的示例性归一化图。
21.图4描绘了根据本发明的一些方面的用于三个批次的平衡传导块的色谱升压转换图。
22.图5描绘了根据本发明的一些方面的分析色谱数据并执行处理控制的示例性处理。
23.图6描绘了根据本发明的一些方面的分析色谱数据并执行处理控制的另一个示例性处理。
24.图7描绘了根据本发明的一些方面的示例性数据文件。
25.图8描绘了根据本发明的一些方面的多变量模型的示例性载荷图。
26.图9描绘了根据本发明的一些方面的示例性数据平滑处理。
27.图10描绘了根据本发明的一些方面的来自27个批次的主成分中每个变量的载荷图。
28.图11描绘了根据本发明的一些方面的来自27个批次的示例性得分图。
29.图12描绘了根据本发明的一些方面的多变量模型的示例性载荷图。
30.图13描绘了根据本发明的一些方面的示例性得分图。
31.图14描绘了根据本发明的一些方面的给定色谱单元操作中的斜度的单值图。
32.图15描绘了根据本发明的一些方面的给定色谱单元操作中的斜度的移动范围图。
33.图16描绘了根据本发明的一些方面的给定色谱单元操作中的斜度的范围图。
34.图17描绘了根据本发明的一些方面的非高斯hetp(ng-hetp)的单值图。
35.图18描绘了根据本发明的一些方面的ng-hetp的移动范围图。
36.图19描绘了根据本发明的一些方面的ng-hetp的范围图。
37.图20描绘了根据本发明的一些方面的ng-hetp的另一个单值图。
38.图21描绘了根据本发明的一些方面的ng-hetp的又一个单值图。
39.图22描绘了可以在其上面实施本发明的各方面的示例性系统。
40.图23描绘了根据本发明的一些方面的示例性用户界面。
41.图24描绘了根据本发明的一些方面的示例性报告。
具体实施方式
42.本发明涉及药物产品制造和实验室处理工艺的改进,以及与药物产品制造和实验室处理工艺相关的计算机功能的改进。特别地,本发明的各方面涉及色谱方法和系统,以及用于色谱数据分析的方法和系统,例如用于色谱处理和系统的监测和控制。
43.除非另有限定外,本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。材料、方法和示例仅仅是说明性的且不旨在限制。本领域的普通技术人员将理解,所公开的材料、方法和示例的常规变化是可能的,且无需过多的实验。本文提及的所有公开、专利申请、专利、序列、数据库条目和其他参考文献都通过引用整体并入本文。如果发生冲突,则以本说明书,包括定义为准。
44.如本文所使用的,术语“包括”、“包含”或其任何其他的变型旨在涵盖非排他性的内容物,以使得包括一列要素的处理、方法、物品或设备不仅仅包括那些要素,而是可以包括未明确列出或不是这种处理、方法、物品或设备所固有的其他要素。术语“示例性”是按“示例”而非“典范”的意义使用的。对于这样的术语并且对于术语“例如”和“诸如”及其语法等同物来说,除非另有明确说明,否则应理解为后面跟着短语“且不限于”。如本文所使用的,术语“约”和能指旨在解释由于实验误差而引起的变化。除非另有明确说明,否则本文报道的所有测量值均应理解为由术语“约”修饰,而无论是否明确使用了该术语。如本文所使用的,单数形式“一”、“一个”和“该”包括复数个指示物,除非上下文另有指示外。此外,在权利要求中,值、限制和/或其他范围表示值、限制和/或范围+/-10%。
45.如本文所使用的,术语“抗体”包括抗原结合分子以及完整抗体分子的抗原结合片段。如本文所使用的,术语抗体的“抗原结合部分”、抗体的“抗原结合片段”等特异性结合抗原以形成复合物的包括任何天然存在的、可酶促获得的、合成的或基因工程的多肽或糖蛋白。抗体的抗原结合片段可以使用任何合适的标准技术,诸如涉及操纵和表达dna编码抗体可变域和可选的恒定域的蛋白水解消化或重组基因工程技术来从,例如完整抗体分子获得。这种dna是已知的和/或易于从例如商业来源、dna文库(包括,例如噬菌体-抗体文库)获得,或可以是合成的。dna可以通过化学方法或通过使用分子生物学技术进行测序和操纵,例如,用于将一个或多个可变域和/或恒定域布置成合适的形态,或用于引入密码子,产生半胱氨酸残基,修饰、添加或删除氨基酸等。
46.抗原结合片段的未限制性示例包括:(i)fab片段;(ii)f(ab’)2片段;(iii)fd片段;(iv)fv片段;(v)单链fv(scfv)分子;(vi)dab片段;以及(vii)由模拟抗体高变区的氨基酸残基组成的最小识别单位(例如,分离的互补决定区(cdr),诸如cdr3肽)或受约束的fr3-cdr3-fr4肽。其他工程分子,诸如域特异性抗体、单域抗体、域缺失抗体、嵌合抗体、cdr嫁接抗体、双抗体、三抗体、四抗体、微抗体、纳米抗体(例如,单价纳米抗体、二价纳米抗体等)、
小模块化免疫药物(smip)和鲨鱼可变ignar域也包括在如本文所使用的表达“抗原结合片段”内。
47.如本文所使用的,术语“生物学”可以指在生命系统,诸如细胞中产生的大分子(例如,具有大于30kda的大小)。生物制剂可以包括蛋白质(例如,抗体)、核酸、大糖等。与可能具有明确定义的化学结构的小分子不同,生物制剂可能具有无法通过实验室方法容易地量化的高度复杂的结构。因此,可能期望在生物制剂的制造中实现纯度、一致性和质量,以确保生物质量,特别是当用于医疗用途时。
48.如本文所使用的,术语“色谱法”可以指任何制备或分析色谱法。虽然本发明的大部分是在用于纯化生物制剂的制备性填充床色谱法的背景下提供的,但是可以设想本文公开的系统和方法也适用于多种色谱处理。
49.如本文所使用的,术语“药物产品”可以指分配到初级包装组件中的一定体积的配制药物物质,以用于包装、运输、输送和/或施用至患者。药物产品可以包括活性成分,包括例如,生物制剂。
50.如本文所使用的,术语“原料”可以指包括一种或多种生物制剂的混合物,其适于经由色谱处理分离或纯化。
51.如本文所使用的,术语“原始色谱数据”可以指如最初收集的在其原生数据状态中的色谱数据。例如,原始色谱数据可以是.res文件类型(其他类型的原始文件类型)或在包含直接从测量设备获得的值的数据库中。
52.如本文所使用的,术语“提取的色谱数据”可以指已经从原始数据移动而没有任何翻译的色谱数据。这可以是excel或.csv文件格式,或在位于色谱系统或计算系统中的数据库中。
53.如本文所使用的,术语“降噪数据”可以指已经归一化、平滑、导出和/或进行峰选择的色谱数据,例如转换数据。
54.如上所述,需要监测和维持色谱柱和处理质量,例如,多次色谱运行、多个批次期间以及在两个运行期间和两个运行之间经过的时间处。本文公开的系统和方法可以允许分析色谱转换数据(也称为“转换分析”),并且使用这种分析来监测色谱性能、识别色谱性能的变化并且基于这种分析和处理来执行相关于色谱系统的动作。此外,在一些方面中,本文公开的系统和方法可以是一个或多个处理中制造或纯化控制的一部分,和/或可以允许使用在标准色谱处理中收集的数据进行过程中控制,从而使实施单独的处理控制所需的成本和工作的增加最小化。
55.现在将详细参考下面所述且在附图中所示的本发明的示例性实施例。只要有可能,在所有附图中将使用相同的参考数字来指代相同或相似的部分。
56.图1以示意图的形式描绘了示例性色谱系统100,利用该色谱系统可以实施本发明的各种实施例。系统100包括流动相液体供应系统102、材料注入系统104、柱106、处理控制器108、计算装置110和检测器112。
57.系统100可以是色谱系统的全部或一部分,包括色谱柱106。在一些情况下,系统100可以是色谱仪。系统100可以包括运行色谱柱所需的任何硬件和/或软件。系统100可以被配置成执行各种类型的色谱法,诸如高效液相色谱法(hplc)、离子交换色谱法、尺寸排阻色谱法、疏水相互作用色谱法(hic)、反相色谱法、混合模式色谱法或亲和色谱法。系统100
可以用于例如分离原始混合物中的生物制剂,分离和/或纯化单一类型的生物制剂,和/或从混合物消除污染物。在一些情况下,系统100可以是药物产品制造系统的一部分,诸如用于制造含有生物制剂,诸如抗体的药物产品的系统。
58.流动相液体供应系统102可以是用于将流动相供应到柱106的入口的任何合适的系统。流动相液体供应系统102可以包括一个或多个贮存器以保持用于驱动由材料注入系统104通过柱106注入的原料的的流体相流体。流动相液体系统102可以包括一个或多个泵,其被配置成向流动相液体施加压力。在一些实施例中,流动相液体供应系统102的泵可以被配置成在将组合溶液供应到柱106的入口之前按所需比例混合两种或更多种溶剂(例如,来自两个或更多个贮存器的)。在一些实施例中,流动相液体供应系统102可以被配置成将第一流动相供应到柱106的入口,且然后,在已供应所需体积的第一流动相之后将第二流动相供应到柱106的入口。在一些实施例中,流动相液体供应系统可以由处理控制器108或通过人类交互来控制。
59.材料注入系统104可以是用于供应需要在柱106中分离和/或纯化的原料的任何合适的系统。在一些实施例中,例如,材料注入系统104可以包括一个或多个贮存器以保持原料。这些原料可以包括一种或多种生物制剂、污染物、溶剂或其他材料。
60.柱106可以是适合于从材料注入系统104分离和纯化注入的原料的任何柱。本领域的普通技术人员将认识到,柱106可具有多种尺寸中的任一种(例如,范围为约30cm至约1500cm的直径),并且可以用多种固定相中的任何一种填充。考虑到需要在柱106中分离的原料,可以选择柱106的尺寸、形状和填充。
61.处理控制器108和/或计算装置110可以适于在色谱运行期间控制系统100的各方面。处理控制器108可以链接到系统100的一个或多个部分,包括流动相液体供应系统102、材料注入系统104、柱106、计算装置110和检测器112。在一些实施例中,处理控制器108可以是被编程为根据所需程序控制系统100的各部分的计算机。例如,在一些实施例中,过程控制器可以被编程为打开和关闭流动相液体供应系统102的泵,以及打开和关闭检测器112。在一些实施例中,处理控制器108可具有显示器和/或其他用户界面元件(例如,按钮、鼠标、键盘、触摸屏等),通过其可以由例如,人类操作员输入命令。在其他实施例中,可以使用例如,计算装置110对处理控制器108进行编程。
62.计算装置110可以是任何计算机,诸如台式计算机、服务器计算机、膝上型计算机、平板电脑或个人便携式装置(例如,智能电话)。在一些实施例中,计算装置110可具有显示器和/或其他用户界面元件(例如,按钮、鼠标、键盘、触摸屏等),通过其可以由例如,操作员输入命令。计算装置110还可以从处理控制器108和/或系统100的其他部分,诸如检测器112收集数据。计算装置110可以包括一个或多个程序,其被配置为将这样的数据显示或输出到例如,屏幕、硬盘或经由互联网连接显示或输出至远程位置。计算装置110本身可以经由有线连接连接到系统100的其他方面,或可以无线连接到系统100的其他方面(例如,处理控制器108)。在一些实施例中,计算装置110可以相对于系统100远程定位。在一些实施例中,计算装置110可以被配置为显示一个或多个用户界面或报告。在一些实施例中,处理控制器108和计算装置110可以是单个装置。
63.检测器112可以是适合于检测在柱106的出口处的一个或多个特性的任何类型的检测器。尽管在图1中描绘了单个检测器112,但系统100也可以包括一个以上的这种检测
器,其被配置为检测在柱106的出口处的各种特性。这些特性可以包括,例如柱出口的导电性、ph、光密度和其他特性。在一些实施例中,检测器112可以是例如,导电性检测器、紫外(uv)检测器、荧光检测器、折射检测器、ph检测器、压力计或任何其他类型的检测器。
64.例如使用系统100运行的色谱循环通常可以包括一系列步骤。这些步骤可以包括,例如,就地清洗步骤、平衡步骤、载荷步骤、洗涤步骤、洗脱步骤、条带步骤和再生步骤。可以使用从在色谱柱出口处的检测器(例如,在柱106出口处的检测器112)收集的数据来跟踪和/或记录色谱循环。例如,uv检测和uv色谱可以用于通过例如,洗涤、洗脱、收集和条带步骤来跟踪色谱处理。图2描绘了具有用于收集单一蛋白质的典型配置文件的示例性uv色谱。当一定体积的流体通过柱(由x轴表示)时,uv检测器在接近洗脱步骤开始时检测到具有单峰的吸光度相当稳定的上升。在小洗脱峰之后可以开始收集,在此期间,当大部分的分析物通过uv检测器时吸光度形成峰形。
65.色谱(或色谱)转换是当一个流动相被另一个替换时,对在柱的入口处的步骤变化(例如,从洗涤步骤到洗脱步骤的变化或从洗脱步骤到条带步骤的变化)的在柱(例如柱106)的出口处的响应。取决于在柱的出口处检测到什么参数(例如,通过检测器112中的一个或多个进行的),可以按一个或多个参数的增加(升高转换)或减小(降低转换)来检测到转换,接下来则是发生转换之后该参数的平稳状态。图3描绘了分为三相的色谱增加转换的示例性归一化图。在转换之前,检测器检测到参数的基线值。在转换期间,参数“升高”或增加,然后在转换后平稳化。在一些情况下,升高转换后的平稳状态是由于检测器饱和引起的。在转换期间得到的数据是定量的且对柱性能的细微变化很敏感。
66.可能在转换中改变的可测量参数的示例包括导电性、ph、盐浓度、光吸收、在用合适波长的光激发后的荧光、折射率、电化学响应和由质谱分析产生的数据。然而,本领域普通技术人员将理解,可能在转换中改变的任何其他可测量参数可以用于根据本发明的转换分析中。
67.为了执行转换分析以确定色谱柱和/或处理的质量和/或完整性,可以将色谱数据分成多个块,每个块对应于色谱处理中的步骤(例如,就地清洗块、平衡块、载荷块、洗涤块、洗脱块、条带块、再生块、存储块等)。每个块包括在块期间由一个或多个检测器提供的多个信号。为了执行转换分析,可以使用任何数量或组合的块和信号,诸如1到8个块(例如,1个块、2个块、3个块、4个块或5个块),以及约1到8个信号(例如,1个信号、2个信号、3个信号、4个信号、5个信号、6个信号或7个信号)。也可以使用更多的块和/或信号。
68.图4描绘了在三个色谱运行的平衡块中的升高转换期间作为体积的函数的所检测的导电性的示例图。每次运行包括在相同柱中对相同原料进行的相同色谱处理,包括分离相同的蛋白质,但却使用了不同批次的原料。第一个峰形(在所有三次运行中)代表系统的主要部分。在峰形出现后,如可以看到的,三次运行表现出转换相的变化。最短的虚线描绘了最接近理想的转换相的虚线,这是因为转换是最“竖直的”(即,出现在最短的体积量上)。较长的虚线表示一些指示柱失效的特性,即转换相的早期开始和锥形结束。总的来说,这种转换发生在更大量的体积上。实线表示柱失效的更强的特性,这是因为转换相开始得非常早且花费了过多的时间以达到饱和。虽然这些差异在视觉上是显而易见的,但它们可能不易于在彼此不能比较的情况下进行量化或给定上下文。本发明提供了用于使用这些数据执行分析以及使用这种分析可选地执行处理控制的系统和方法。
69.图5和6描绘了根据本发明的一些方面的分析色谱数据并使用这种分析以执行处理控制的示例性处理。图5描绘了更一般细节水平的示例性处理,而图6则描绘了示例性处理的更多细节。虽然在下面对其进行了单独描述,但图6的处理的细节和详情也可以适用于图5的处理,且反之亦然。
70.图5描绘了根据本发明的一些方面的分析色谱数据并执行处理控制的示例性通用处理500。根据步骤510,可以处理原始色谱数据。根据步骤520,可以从原始色谱数据获取数据。根据步骤530,可以处理所获取的数据。根据步骤540,可以分析所处理的数据(例如,转换分析)。根据步骤550,可以执行一个或多个统计处理控制。根据步骤560,可以报告数据。
71.根据步骤510,可以处理原始色谱数据。可以通过运行一个或多个色谱循环并从一个或多个检测器(例如,柱106的检测器112)获得信号来获得原始色谱数据。信号可以包括例如,uv信号、导电性信号、压力信号、ph信号和/或其他信号。数据可以在例如,处理控制器108和/或计算装置110处获得且可以存储在,例如,数据库或.res文件。数据可以包括,例如,一系列信号值和测量信号所在的相应体积。数据还可以包括在色谱循环中每个块/步骤的开始和结束的指示符。
72.处理数据可以包括提取数据并将数据组织在计算装置,例如,计算装置110中的数据文件中。示例性数据文件包括,例如电子表格、文本文件、数据库、其组合等。可以向包含提取的色谱数据的数据文件分配各种元数据,以允许一致的存储和处理。元数据可以包括,例如,名称、日期、柱运行时间、柱运行体积、柱流动相、原始混合物的识别、使用柱的制造处理的识别和/或可以允许对数据文件进行一致的自动或手动处理的任何其他数据。
73.根据步骤520,可以从数据文件获取数据以用于分析。在一些实施例中,自动化软件程序(诸如cron、jobber、宏或其他自动或调度软件)可以监测用于配合一个或多个配置文件的用于一个或多个数据文件的一个或多个可能的数据文件存储位置。可以基于,例如,与数据文件相关联的元数据向数据文件分配配置文件。配置文件可以是,例如,用于选择适于执行转换分析的一个或多个块和信号组合的预先制定的一系列选择标准。可以基于例如,正在运行的柱的类型、流动相的特性、正在运行的流动相的体积、柱运行时间或数据文件的其他特性来分配配置文件。
74.获取用于分析的数据可以包括基于分配的配置文件选择一个或多个块和信号组合,其中块对应于色谱处理中的步骤,且信号对应于正在收集的数据类型(例如,uv数据、导电性、ph等)。在一些实施例中,可以选择主要的块和信号组合。在另外的实施例中,可以选择主要的块和信号组合以及一个或多个次要的块和信号组合。首先,可以利用主要的块和信号组合来执行转换分析,且可选地利用一个或多个次要的块和信号组合执行第二转换分析。关于处理600更详细地描述了配置文件、选择标准以及块和信号组合。
75.根据步骤530,可以再次处理所获取的数据以获得降噪数据。处理所获取的数据可以包括将一个或多个平滑和/或降噪技术应用于所获取的数据中的数据集,诸如与主要的块和信号组合相关联的数据,以及可选的与次要的块和信号组合相关联的数据。在一些实施例中,处理数据可以包括使数据集的大小标准化,以允许平滑窗口的一致影响。在一些实施例中,处理数据可以包括对数据进行归一化,以便基于转换的幅度消除变化。这种变化可能是由于流动相缓冲液的独特制备,其包含基线相或饱和相的终值中的固有可变性。
76.降噪技术可以包括去除由测量工具(例如,系统100中的检测器112)引入的隐式错
误,以及当搜集数据时由批量处理引入的随机错误(例如,在方法500的较早的步骤中)。降噪可以包括数据集中记录的重复数据删除、异常值检测和移除和/或用于增加数据集中的信噪比的任何其他技术。降噪还可以包括数据平滑和信号拒绝,这将在下面关于处理600进一步详细描述。
77.处理的数据可以包括例如,步骤产率和/或其他流动相参数的测量值,其可以是对应于一个或多个色谱步骤转换的一个或多个平滑曲线的形式。一个或多个曲线可以表示归一化的溶质信号数据阵列。
78.根据步骤540,可以分析降噪数据。这种分析可以是转换分析。转换分析可以包括对处理的数据执行一个或多个数学处理。例如,可以通过例如,获取曲线的一阶导数来从处理的数据生成一个或多个曲线,以生成以峰为特征的另一个曲线。可以分析该曲线以生成性能参数,诸如,例如,多个拐点、最大变化率、穿透体积、累积误差、ng-hetp、曲线不对称性和高斯hetp。这些性能参数(单独地或与过去的数据组合地)可以帮助确定柱的完整性。
79.例如,拐点数量的增加可以指示正在发生少量的转换溶液的早期穿透,这可能与完整性破坏相关联。多个柱使用的最大变化率的降低可能指示在较大的柱上发生了转换,这可能是完整性破坏的指示。穿透体积的减小也可以表征完整性破坏。ng-hetp或高斯hetp的增加可以指示柱完整性的降低。可以基于数据集方差、斜度、峰度、峰不对称性、穿透或洗出体积和总误差来生成转换的其他特性。下面更详细地描述了转换分析。在例如,通过引用全部并入本文的larson等的使用处理数据来评估生产规模的蛋白质纯化柱中的色谱性能,biotechnol,prog.,2003,19,485-492中也描述了执行转换分析的系统和方法。
80.转换分析的结果可以与其他数据一起存储在例如,计算装置110的存储器元件中,或另一个计算装置中。例如,可以存储所有原始数据、初始数据集、平滑数据集和转换分析数据。
81.根据步骤550,可以使用转换分析的结果来执行一个或多个统计处理控制。在一些实施例中,统计处理控制可以包括执行数个类别中的一个的技术,其包括1)非常规控制图分析(例如,单值图、移动范围图和/或范围图分析),2)变量分析(mva),或3)非常规控制图分析和mva的组合。这些处理可以包括,例如,分析作为更大数据集的一部分的转换分析的结果,其包括源于之前的色谱运行,例如,在相同生产周期中的运行、相同产品批次的运行或相同原料的运行的转换分析结果。下面关于处理600来更具体地描述这些处理。
82.执行一个或多个统计处理控制的结果可以称为性能评估数据。性能评估数据可以指包括转换分析结果的任何处理数据,其在评估处理的再现性和成功时具有意义。
83.根据步骤560,可以报告数据。在一些实施例中,可以生成一个或多个报告。例如,所公开的方法和系统可以生成使用给定的配置文件分析的任何结果的表格报告。可以基于特定时间范围、特定运行和/或特定批次的所需数量的先前色谱运行生成报告。在图24中描绘了示例报告且在下面对其进行了更详细的描述。
84.图6比图5更详细地描绘了根据本发明的一些方面的分析色谱数据并执行处理控制的示例性处理600。根据步骤610,可以接收原始色谱数据。根据步骤620,可以根据配置文件处理原始色谱数据。根据步骤630,可以应用降噪技术。根据步骤640,可以对处理的色谱数据执行转换分析以生成表示柱完整性的转换数据。根据步骤650,可以基于转换数据生成单值(i)图、移动范围(mr)图或范围(r)图中的至少一个。根据步骤660,可以将一个或多个
多变量统计分析方法应用于至少一个i图、mr图或r图以生成性能数据。根据步骤660,可以基于性能数据执行动作。
85.根据步骤610,可以接收原始色谱数据。与处理500一样,原始色谱法可以从例如色谱系统,诸如系统100获得。原始色谱数据可以包括与多个块相关联的多个信号。接收原始色谱数据可以包括直接从一个或多个检测器(例如,系统100的检测器112)或从计算装置(例如,计算装置110)检索原始色谱数据和/或可以包括监测用于原始色谱数据文件的网络位置。在一些实施例中,可以处理原始色谱数据,如上面在处理500中关于步骤510所述的。
86.在图7中描绘了提取的色谱数据的示例性数据文件1000。数据文件1000可以包括例如数据文件名,其可以帮助由自动化系统识别数据文件。如图所示,数据文件1000中提取的色谱数据可以采用电子表格的形式(例如,microsoft excel)。数据文件1000可以包括第一柱1002中的体积测量,其可以对应于已经通过色谱系统的总体积的定期测量。第二柱1004可以包括对应于柱1002中的体积测量中的每一个的信号测量(例如,uv、导电性、ph等)。在这种情况下,第二柱1004包含以ms/cm表示的导电性数据。其他柱可以提供额外的数据。在这里,例如,第三柱1006包括对应于在第四柱1008中的日志条目的体积测量。这可以允许识别色谱运行的各种特性,诸如块/步骤开始和结束点(cg002_start、cg002_end、cg003_start)、流率和色谱系统的各方面被启动的点(例如,泵1可以对应于当激活例如,与流动相液体供应系统102相关联的泵的时间)。普通技术人员将理解,数据文件1000的许多变化是可能的。例如,尽管体积测量在数据文件1000中被示为色谱运行中的进展的标记,但是也可以使用其他测量,诸如时间。可以包括用于其他信号数据的额外柱,且可以包括额外的日志数据(例如,识别流动相、识别分析物等)。
87.返回参考图6,根据步骤620,可以根据配置文件处理色谱数据。如关于步骤520简要描述的,可以根据文件中的色谱数据的特性为色谱数据选择配置文件。例如,之前已针对给定类型的色谱运行、给定的色谱柱和/或给定的分析物创建了配置文件。因此,这种配置文件可以与用于适当运行、柱和/或分析物的色谱数据文件相匹配。
88.在一些方面中,可以由用户创建配置文件。配置文件可以与特定药物或药物产品相关联。在一个方面中,药物是小分子。在其他方面中,药物是肽或多肽。
89.在一些方面中,药物是血管内皮生长因子(vegf)衍生物。在其他方面中,药物是阿柏西普,其在美国专利号7,070,959、7,303,746、7,303,747、7,306,799、7,374,757、7,374,758、7,531,173、7,608,261、7,972,598、8,029,791、8,092,803、8,343,737和8,647,842中进行了描述,该专利中的每一个均通过引用全部并入本文。
90.在其他方面中,药物是抗原结合分子。在一些方面中,抗原结合分子是抗体或抗原结合片段。在一些方面中,药物是阿利库单抗,其在美国专利申请公开号2014/0356371和2014/035670中进行了描述,该专利中的每一个通过引用全部并入本文。在另一个方面中,药物是萨瑞鲁单抗,其在美国专利申请公开号2016/0152717、2014/0302053和2013/0149310中进行了描述,该专利中的每一个通过引用全部并入本文。在另一个方面中,药物是杜匹鲁单抗,其在美国专利申请公开号2014/0356372中进行了描述,该专利通过引用全部并入本文。在另一个方面中,药物选自依洛尤单抗、贝伐珠单抗、兰尼单抗、托珠单抗、赛妥珠单抗、依那西普、阿达木单抗、阿巴他塞、英夫利昔单抗、利妥昔单抗、阿那白滞、曲妥珠单抗、培非格司亭、干扰素β-1a、甘精胰岛素[rdna来源]注射液、红细胞生成素α、达贝泊汀、
菲利格司亭和戈利木单抗。
[0091]
在一些实施例中,配置文件可以被配置为指示sentinel软件程序(例如,宏、jobber、cron或其他调度软件)来定期扫描为色谱数据文件指定的网络位置。当文件名与配置文件中的文件名标识符相匹配时,配置文件可以指示从文件进行数据获取。
[0092]
一旦已选择了配置文件或已为数据文件选择了配置文件或配置文件已与数据文件相匹配,则可以扫描数据文件。例如,关于图7中的示例性数据文件1000,可以针对块开始时间、结束时间、流率等的指示来扫描包括日志条目的第四柱1008。例如,关于数据文件1000,对应于“cg002_start”和“cg002_end”的体积测量包括对应于感兴趣的色谱操作和信号转换的体积测量。然后,第一柱1002和第二柱1004可以用于提取用于该操作的信号和体积测量的全部数据集。
[0093]
配置文件中的值还可以定义用于选择执行转换分析的色谱数据文件中的块和/或信号的一个或多个组合的一个或多个选择标准。因此,配置文件可以是用于从色谱数据文件获取优选的数据子集的工具。配置文件中的选择标准可以根据,例如,实验性经验、结构化优化和/或处理归档进行预先确定。这样的选择标准可以使得能够识别块和信号组合,其可以允许进行更精确、准确或以其他方式更有用的分析。这样的选择标准可以包括,例如,是否易于获得转换材料。这包括转换到产品溶液或从产品溶液转换出来的块。如果需要的话,这允许在制造操作之间进行额外的柱评估。这样的选择标准还可以或替代地包括块是否以规则的间隔发生的。这包括在制造批次的最终收集周期结束后未执行的块。这种选择标准还可以或替代地包括信号是否在转换之前或之后达到检测器饱和。这样的选择标准还可以或替代地包括信号是否以不同且可识别的水平接近固定相且并不连接漂移。这种选择标准还可以或替代地包括在给定块中的信号是否具有在最小和最大值之间的大的差异。这种选择标准还可以或替代地包括信号是否在转换期间具有许多拐点。较少的拐点可能表示更可靠的数据收集。
[0094]
在一些情况下,先前的色谱运行可以帮助识别用于选择在将来的色谱运行中的块和信号组合的合适的选择标准。图8例如示出了六个不同色谱批次(批次a-f)的两个不同的块和信号组合(洗脱步骤-uv信号组合和再平衡步骤-导电性信号组合)的ng-hetp计算图。提供了指示用于每组的三个标准偏差的实心条作为参考。从该图中可以看出,洗脱步骤-uv信号组合的ng-hetp计算表现出比用于再平衡步骤-导电性信号组合的那些的更大的变化。可以看出,趋势的规模和标准偏差是不同的。当监测性能转变时,可能希望在被认为是典型批次之间具有较小的变化。这允许在监测性能转变时提高灵敏度。因此,用于类似于批次a-f的批次的色谱运行的选择标准可以包括使再平衡步骤和导电性信号组合优先于洗脱步骤和uv信号组合。本领域的技术人员将理解,以类似方式对先前色谱运行的分析可以揭示其他可能的块和信号组合选择标准。
[0095]
在一些实施例中,配置文件可以包括将一个或多个选择标准应用于具有相关色谱数据的数据文件的指令。因此,根据配置文件处理色谱数据可以包括识别并提取用于转换分析的优选(例如,主要的)块和信号组合,和/或用于转换分析的一个或多个额外的(例如,次要的)块和信号组合。在一些实施例中,主要的块和信号组合将满足色谱数据文件中所有可能的块和信号组合的配置文件中的大多数选择标准。在一些实施例中,次要的块和信号组合将满足色谱数据文件中所有可能的块和信号组合的配置文件中的第二多的选择标准。
虽然主要的块和信号组合可以包括最有可能提供用于评估柱和处理的完整性的有价值的转换分析,但是次要的块和信号组合也可以提供对柱的完整性的次要测量和交叉检查。
[0096]
在一些实施例中,根据步骤620的配置文件可以是其自身中或其自身的数据文件,其可以包含用于从具有相关元数据的色谱数据文件提取某些数据或改变具有相关元数据的色谱数据文件的指令。在一些实施例中,配置文件中的这种指令可以由计算机程序执行。
[0097]
返回参考图6,在已根据配置文件处理色谱数据之后,可以根据步骤630向处理的数据应用降噪技术。与处理500的步骤530一样,该步骤可以包括将一个或多个平滑和/或降噪技术应用于处理的数据(例如,与所选择的块和信号组合相关联的数据)。在一些实施例中,该步骤包括使数据集的大小标准化,以允许平滑窗口的一致影响。在一些实施例中,该步骤可以包括对数据进行归一化,以便基于转换的幅度消除变化。这种变化可能是由于流动相缓冲液的独特制备,其包含基线相或饱和相的终值中的固有可变性。
[0098]
降噪技术可以包括去除由测量工具(例如,系统100中的检测器112)引入的隐式错误,以及当搜集数据时由批量处理引入的随机错误(例如,在方法500的较早的步骤中)。降噪可以包括数据集中记录的重复数据删除、异常值检测和移除和/或用于增加数据集中的信噪比的任何其他技术。
[0099]
降噪还可以或替代地包括应用数据平滑和信号错误拒绝算法。图9以流程图的形式描绘了这方面的示例性算法900。根据算法900的步骤902和904,算法可以开始,并且检索相关信号数据(例如,已经根据步骤620处理的数据)。根据步骤906,可以对检索到的数据进行归一化以去除幅度偏差。
[0100]
随后,可以应用多级平滑算法950。这可以包括根据期望的平滑滤波器设定点(909、911)应用一个或多个初始平滑滤波器(步骤908、910)。根据步骤912,可以可选地执行推导。然后可以根据额外的期望的平滑滤波器设定点(913、915)应用一个或多个额外的平滑滤波器(步骤914、916)。应用的平滑滤波器的数量(步骤908、910、914、916)以及设定点909、911、913、915的数量和特性可以根据例如数据条件、预期结果、信号类型和其他因素变化。是否对数据执行推导也可以取决于这些因素。
[0101]
然后,处理可以继续到动态信号错误拒绝算法980。该算法可以被配置为从检索到的数据去除不是由于色谱转换而引起的数据。例如,为了允许进行有意义的转换分析而应该去除的错误包括警报、机器停止、仪器传感器故障或数据间隙。这可以通过识别色谱图转换的预期特征,诸如导数持续时间、最大强度、距离开始的持续时间或预期的背景噪声来实现。例如,可以基于预期的转换位置919进行初始点拒绝918,可以基于预期的背景噪声水平921进行初始死区拒绝920,可以基于预期的信号错误特性来进行导数高度和宽度拒绝,以及可以基于预期的背景噪声水平925进行最终死区拒绝。例如,可以基于先前累积的转换数据来生成预期的转换特征。在完成算法900后,根据步骤990,数据可以准备好用于转换分析。
[0102]
虽然算法900是平滑和信号错误拒绝算法的一个示例性模型,但是本领域的普通技术人员将认识到对该算法的变化是可能的。例如,可以仅执行平滑算法950,或者可以仅执行信号错误拒绝算法980。额外地或替代地,可以应用更多或更少的平滑滤波器,和/或可以拒绝更多或更少的点。
[0103]
在对数据应用降噪和/或平滑技术之后,数据可以包括例如,步骤产率和其他流动
相参数的测量,其采用对应于步骤转换的穿透或洗出曲线的形式。
[0104]
返回参考图6,根据步骤640,可以对处理的色谱数据执行转换分析以生成表示柱完整性的转换数据。转换分析可以包括对处理的数据执行一个或多个数学处理,以便从步骤转换推断出离散参数。例如,可以通过例如,获取曲线的一阶导数来从处理的数据生成一个或多个曲线,以生成以峰为特征的另一个曲线。该曲线可以用于生成性能参数,诸如,例如,多个拐点、最大变化率、穿透体积、累积误差、ng-hetp、曲线不对称性和高斯hetp。如关于步骤540所述,这些参数可用作柱完整性或缺乏其的指示符(例如,当针对先前的代表性色谱数据的转换分析参数进行检查时)。
[0105]
例如,拐点数量的增加可以指示正在发生少量的转换溶液的早期穿透,这可能与完整性破坏相关联。当绘制导数曲线与合计的体积数据时,可以从多个峰确定多个拐点。
[0106]
作为另一个示例,多个柱使用的最大变化率的降低可能指示在较大的柱上发生了转换,这可能是完整性破坏的指示。最大变化率等于导数曲线的最大值。
[0107]
作为另一个示例,穿透体积的减小也可以表征完整性破坏。可以通过找到第一体积值来确定穿透体积,在该第一体积值处,信号小于其最高值(用于高到低的转换)的95%或大于其最低值(用于低到高的转换)的5%。
[0108]
作为另一个示例,ng-hetp或高斯hetp的增加可以指示柱完整性的降低。可以基于数据集方差、斜度、峰度、峰不对称性、穿透或洗出体积和总误差来生成转换的其他特性。在例如,通过引用全部并入本文的larson等的使用处理数据来评估生产规模的蛋白质纯化柱中的色谱性能,biotechnol,prog.,2003,19,485-492中也描述了执行转换分析的系统和方法。
[0109]
转换分析的结果可以与其他数据一起存储在例如,计算装置110的存储器元件中,或另一个计算装置中。例如,可以存储所有原始数据、初始数据集、平滑数据集和转换分析数据。
[0110]
返回参考图6,根据步骤650,可以基于转换数据生成单值(i)图、移动范围(mr)图或范围(r)图中的至少一个。为了简单起见,本发明将其统称为i-mr-r图;然而,“i-mr-r图”应理解为仅指代i图、仅mr图、仅r图或任何组合和数量的此类图。i-mr-r图构成转换分析输出的单独可视化,且可以帮助以ng-hetp、斜度、峰度或其他参数的形式解释多个柱运行或批次的转换分析数据中的趋势。i-mr-r图的一个优点是数据可以快速查看,且可以从视觉角度很容易地解释说明。这使得在早期阶段可以识别出微小趋势或即时数据移位。
[0111]
例如,i图可以绘制用于每个分析批次的值(例如,斜度)。mr图可以绘制用于每个分析批次的值和之前分析批次之间的差异的值。r图可以绘制用于批次内的值之间的差异的值(例如,对于主要的块和信号组合和次要的块和信号组合在一个批次上完成的两个转换分析的斜度)。每个图可以包括平均线、控制上限(ucl)和控制下限(lcl),其可以使用已被确定为代表典型处理的可用数据进行计算并在每个图中被置于与平均线等距的位置上。
[0112]
当在i-mr-r图上绘制时,一些参数,诸如转换分析的ng-hetp和斜度可以描绘在某些限制的寿命期间的显著动力学。在这种情况下,使用具有用短期标准估计的控制限制的i-mr-r图可能导致过度的超趋势信号,甚至是在重新填充柱时重置控制图之后。该问题的一种解决方案是使用levey jennings控制图,该控制图使用来自“代表性”柱批次的长期标准偏差计算,其考虑了归因于新柱填充的启动的特殊变化。数据是否被视为代表性的可以
通过不具有一个批次的各种性能评估数据集的异常读数来确定。这些集可以用于计算标准偏差,有时要特别注意+/-3标准偏差(sd)线。可以在柱上运行几个批次以确定柱的大部分或整个有效期间是否为“典型的”。在一个方面中,可以对levey jennings控制图执行可行柱动力学的全建模,这产生了解释了柱重新填充的特殊原因变化的回归模型。然而,levey jennings控制图需要更长期的数据,因此其使用将受到数据聚合速率的限制。
[0113]
额外地,由于已知转换分析具有由于柱的重新填充事件而导致的变化,因此i-mr-r图可以考虑填充和重新填充柱,例如,在重新填充柱之后第一批次的运行将不具有mr值,该值基于在重新填充柱之前与最后一个批次的运行相比的改变。在一些方面中,控制策略可以被配置为仅考虑排除了在监测趋势偏移时由于重新填充事实而引起的已知变化的某些违规。
[0114]
可以通过,例如,计算装置110中的分析模块或别处的另一个分析模块来执行i-mr-r图的生成。也可以通过,例如,控制图模块在计算装置110中执行i-mr-r图的生成。例如,图14-21示出了用于21个和100个色谱批次之间的i-mr-r数据且在下面进行进一步地讨论。
[0115]
返回参考图6,根据步骤660,还可以将一种或多种多变量统计分析方法应用于i-mr-r数据。替代地,可以将一种或多种多变量统计分析方法应用于转换分析数据。除了步骤650之外或作为步骤650的替代,可以执行该步骤,并且像根据步骤650生成图一样,考虑先前的色谱数据的转换分析。多变量统计分析采用多个变量并将其简化为成分向量。这允许整体查看大数据集。优点包括多个性能的多个微妙变化,当查看奇异数据集时,这些变化可能是不明显的,而在图形化其成分向量时则可能变得明显。该数据的波动可能是由材料、设备、周围大气条件等的差异引起的,并且可能因操作者或人类观察者的感觉而变小。多变量统计分析方法的示例可以包括主成分分析(pca)、偏最小二乘法(pls)、正交偏最小二乘法(opls)、多变量回归、典型相关、因子分析、聚类分析、图形程序等。可以使用例如,专用计算机软件来执行这种多变量统计分析。
[0116]
使用多变量分析的通用目的是将大量数据转化成可解释信息。通过使得能够搜索多维变量中的相关性和模式并从大量的原始数据提取统计上显著的值,多变量分析使得能够解释,例如,对类似批次的色谱数据的转换分析之间的变化的任何显著性。
[0117]
例如,pca是多变量统计方法,其中包含许多变量的数据集(例如,包含几个参数的转换分析)被缩减成称为分数(scores)(t)的几个变量。例如,可以将包含许多变量的数据集缩减成由两个t-分数表示的每个观察(例如,每个转换分析)。t-分数包含关于数据集中的每个变量的变化以及每个变量与数据集中的每个其他变量的相关性的信息。就这点而言,t-分数描述了数据集中每个观察(例如,每个转换分析)与数据集中的每个其他观察的变化和相关性的结构。pca的图形输出通常是pca图。pca图是每个观察的一个t-分数与另一个的图。通常,pca图是显示如何为数据集中的所有观察比较变化和相关性的结构的分布。因此,该图可以用于将类似的观察聚集在一起。
[0118]
作为另一个示例,pls回归分析是用于分析独立和响应变量的系统的技术。pls是一种预测技术,其可以处理许多自变量,即使当变量显示出多重共线性时。pls还可以将该组自变量与一组多个因(响应)变量关联起来。通常,在pls中,可以为该组显自变量提取一组潜变量,且可以为该组显响应(或因)变量提取另一组潜变量。该提取处理可以基于涉及
自变量和响应变量的叉积矩阵的分解。潜自变量的分数或x值用于预测潜响应变量的分数或y值。然后,使用预测的y值来预测额外的显响应变量。选择x和y分数,使得连续的x和y变量对的关系尽可能强。pls的优点包括能够对多个自变量和因变量进行建模,能够处理自变量之间的多重共线性,面对数据噪声时的鲁棒性以及(取决于所使用的软件的)缺失数据,以及直接基于涉及响应变量交叉乘积创建自潜变量以进行更强的预测。
[0119]
在一些实施例中,可以在i-mr-r图上执行多变量统计分析,以便确定在i-mr-r图中所示的变化的进一步的统计显著性。
[0120]
除了上面描述的分析之外,可以通过计算允许缓冲变化以保持在控制限制内的非固定范围来创建转换分析的趋势,同时可以将柱性能的急剧转变标记为潜在的超趋势。定义控制限制的基本方法包括移动平均、加权移动平均和各种程度的指数平滑。可以采用一种这样的计算趋势限制的方法,其被称为holt winters方法或三次指数平滑方法以获得高效率。holt winters方法采用被定义为离散柱填充事件的用于预测适当限制的季节性来直接应用于色谱监测。回归建模(例如,在levey jennings控制图中所使用的)构成了用于建立趋势限制的一种额外的方法。一旦已获得足够的经验数据,则可以关于累积柱的填充使用执行柱完整性的回归建模。这可以基于模型中包括的历史柱性能提供准确且适当范围的柱性能。
[0121]
返回参考图6,根据步骤670,可以基于性能数据执行动作。在一些实施例中,这可能是由于将识别的转换分析作为处理中控制(ipc)导致的。通常,根据步骤670的动作可以包括生成报告、生成对操作员或显示器(例如,计算装置110的显示器)的警报和/或将警报传输到操作员或显示器,或终止色谱处理。根据步骤660的动作还可以包括,例如,将在本文公开的系统和方法期间获取的所有数据存储在数据库中,以进行进一步的分析。
[0122]
对转换数据执行多变量分析和/或i-mr-r图分析的结果可以被称为性能评估数据。性能评估数据可以指包括转换分析结果的任何处理数据,其在评估处理(例如,色谱处理)的再现性和成功时可能具有意义。
[0123]
在一个方面中,步骤670可以包括生成一个或多个报告。例如,所公开的方法和系统可以生成使用给定的配置文件分析的任何结果的表格格式的报告。可以基于特定时间范围和/或特定批次的所需数量的先前的批次生成报告。数据集可以完全提取为多种格式且如果需要进一步分析的话,可以输入至外部应用中。
[0124]
图24描绘了根据本发明的一些方面的示例性报告2400。示例性报告2400包括报告透视表,其包括来自一个制造批次的四个色谱循环的结果。四个循环中的每一个均按其批次和循环编号列出且包括其运行所在的日期和时间的列表。转换分析结果以列报告,包括ng-hetp、高斯hetp、斜度、不对称性、峰度、非高斯n和高斯n。还提供了数据源的快照,其指示了数据所来自的色谱系统的名称,其中所记录的日志,以及获取数据所用于的块。在用于循环中的每一个的数据下方,报告分析结果中的每一个的趋势数据。应该理解,该报告是示例性报告,并且许多变化都是可能的。例如,可以在一个或多个趋势数据图中列出和/或包括所需数量的色谱循环。
[0125]
在一些方面中,这里公开的系统和方法可以用于连续监测柱和处理的完整性。就这点而言,本文公开的系统和方法可以关于特定柱和/或处理分析数据。在一个方面中,可以基于数据分析生成一个或多个警报。在另一个方面中,可以基于数据分析终止色谱处理。
例如,可以向操作员提供或显示一个或多个通知(例如,事件通知、事件评估或偏差通知表)以采取纠正动作。例如,在分析完成时,一个或多个屏幕叠加可以显示在,例如计算装置110的屏幕上,和/或可以向操作员发送消息,建议是继续还是停止色谱处理。
[0126]
在一个方面中,源于所公开的方法和系统的结果可能趋向于在制造中使用柱之前告知在评估柱填充质量中的当前趋势的信息。在另一个方面中,来自所公开的方法和系统的结果可以用于实时(或离线地)评估柱性能,并且可以在下一个产品使用周期之前确认柱的完整性(例如,如果建立了趋势图中的可接受的范围和控制限制的话)。
[0127]
在另一个方面中,在昂贵且耗时的调查和测试之前,结果可与统计信息一起使用以基于使用多变量统计分析的处理建模来预测处理结果。
[0128]
例如,用于统计分析图的一个评估标准特别地可以包括,在使用pca生成用于数据集的分数时,可以将超出与平均值的阈值数量的标准偏差的批次标识为柱完整性的问题,且可以导致生成关于批次变化的警报或指令。
[0129]
特别地,用于i-mr-r图的一个评估标准可以包括在用于一个或多个图类型的控制上限或控制下限之外的任何点可以是警报的基础。因此,根据步骤670执行的动作可以是如果批次显示出在控制限制之外的点,则从例如,计算装置110发出警报。这种警报可以包括例如要提供给操作员或数据库的事件通知、事件评估和/或偏差通知表。
[0130]
在一些方面中,本文公开的系统和方法可以实现为处理中控制系统的一部分,其可以在组织的质量系统的框架内操作以确保一致性和遵守安全要求。作为这种程序的一部分,来自本文公开的系统和方法的数据可以用于确定要在处理中控制程序中监测的关键处理参数(cpp)和关键质量属性(cqa)。额外地,作为这种程序的一部分,可以实时或接近实时地(例如,与柱的运行同时或与其并行地)检测信号转换和柱的完整性转变,从而允许响应于性能数据采取预防和纠正动作。
[0131]
图23描绘了根据本发明的一些方面的示例性用户界面2300。用户界面2300描绘了转换分析配置文件的创建/编辑屏幕,用户可以利用该屏幕生成或编辑新的转换分析配置文件。在创建配置文件期间选择的参数可用于基于色谱处理的独特特性来调整转换分析并优化每个柱和程序的输出的鲁棒性。示例性用户界面2300中列出的参数包括例如,配置文件名称、备注、历史数据和/或测试位置、文件模式、最终值、关键指示符、硬重置、移动平均的窗口大小、第一滤波器(例如,sg滤波器)的值、第二滤波器的值、将信号登记为零的第一vmax的百分比、用于保留峰的最大宽度的百分比、色谱柱的高度、开始日期、结束日期和数据库名称。
[0132]
本文公开的方法和系统可以用于相对连续地监测柱的完整性。例如,本文公开的方法和系统可以监测柱的完整性,而不需要中断常规的色谱处理以在色谱系统上执行诊断。此外,本文公开的系统的方法可以关于特定柱和特定处理分析数据。如所讨论的,可以基于随时间的数据分析生成一个或多个警报。在另一个方面中,可以基于数据分析终止色谱处理。例如,可以向操作员显示一个或多个通知,以便在发现柱的完整性受到损害的情况下采取纠正动作。例如,可以显示一个或多个屏幕叠加,且可以在分析完成时向操作员显示消息窗口,从而建议继续或停止色谱处理,或建议其他动作。
[0133]
在一些方面中,源于所公开的方法和系统的结果可能趋向于在制造中使用柱之前告知在评估柱填充质量中的当前趋势的信息。在其他方面中,来自所公开的方法和系统的
hetp降低,这表明改善的柱行为。填充2经历了ng-hetp的持续增加,这可能与降低的柱效力相关。
[0143]
图18示出了用于程序b中产生的所有批次的ng-hetp的移动范围图。可以在包1和2中注意到异常值。这识别了显示单值之间的巨大转变的几个点。
[0144]
图19示出了用于程序b中产生的所有批次的ng-hetp的r图。填充2示出了一致地升高的范围值,对其进行研究并确定具有在批次的第三周期内的改变流动方向的根本原因。这导致第三周期显示出不同于其他周期的值。
[0145]
示例3
[0146]
为给定的“程序a”的两组色谱批次的转换分析绘制单值(i)图。
[0147]
图20示出了用于程序a中产生的46个批次的ng-hetp的i图。数据显示是在为了处理的一致性而建立的限制内执行柱的。
[0148]
图21示出了用于程度a中产生的21个额外批次的ng-hetp的i图。数据显示两个批次(56和58)超过了控制上限。
[0149]
示例4
[0150]
使用来自27个色谱批次,包括图4中所示的三个批次的转换分析数据进行多变量分析。针对来自27个批次,包括图4中所示的三个批次的七个参数计算加载值。七个参数包括用于各批次的i图、mr图和r图中的每一个的ng-hetp,用于各批次的i图、mr图和r图中的每一个的斜度,以及用于i图的峰度。图10显示了七个参数中的每一个的加载图。每个条的大小对应于参数对主成分的影响。误差条表示加载值中的相对误差。
[0151]
图11示出了27个批次的示例性得分图。对来自27个批次的七个参数,包括对图4中所示的批次(主成分1)以及主成分2计算的加载值计算得分图。聚集具有类似参数值的批次。大多数标绘点周围的椭圆排除了95%置信度的异常值。
[0152]
示例5
[0153]
对i-mr-r数据进行多变量分析,以用于46个色谱批次的转换分析,如下所述。为46个批次中的每一个收集i-mr-r数据。从分析中去除基于i-mr-r数据认为是非典型或不适合的批次,且将用于剩余批次的数据收集至下表1中。将包含多个转变的值的批次平均化并作为单独的测量进行报告。按批次内转换的最大值减去最小值来计算范围值。
[0154]
使用来自表1的数据,通过创建显示每个输入参数的系数的加载图来计算主成分。每行数据都被转化为单个值。通过pca模型的r2和q2值表示对模型的准确度和与物理系统的相关性的评估,其中r2是如何使数据的测试集接近拟合回归线的统计量度,且q2是数据的测试集将如何接近回归线的统计量度。r2和q2一起表示模型将如何良好地描述被分析的系统,其中1为完美建模,且0表示完全缺乏相关性。
[0155]
图12示出了模型的加载图。模型的r2值为0.798,q2值为0.591,表示可以接受模型进行使用,并且所有的输入值均对模型的主成分具有影响,这是因为其不在中心线的附近。在图12中,每个点的y坐标的大小对应于参数对主成分的影响(例如,对平均ng-hetp、ng-hetp的范围、斜度范围和平均斜度的影响)。每个点的y坐标对应于每个点的输入数。
[0156]
对主成分值进行趋势化并关于相应的批次进行线性图形化。图13描绘了数据集的得分图。得分图显示了用于所使用的每个批次的pc1值(对最高方差的方向有贡献的值)。从图13可以看出一个批次(批次6)在三个标准的偏差限制之外,且几个点接近于超过两个标准偏差,这表明系统正在经历那些批次的变化。
[0157]
如本领域的技术人员将理解的,本文公开的方法和系统可以采用完全硬件的实施例,完全软件的实施例或组合软件和硬件方面的实施例的形式。此外,根据本发明的方法和系统可以采用计算机可读存储介质上的计算机程序产品的形式,该计算机可读存储介质具有在存储介质中具体化的计算机可读指令(例如,计算机软件)。合适的计算机可读存储介质可以包括硬盘、cd-rom、光存储装置或磁存储装置。更特别地,本方法和系统可以采用网络实现的计算机软件的形式。
[0158]
参考示出方法、系统、设备和计算机程序产品的方框图和流程图来描述本发明的实施例。将理解的是,方框图和流程图的一个或多个方框可以分别由计算机程序指令实施。这些计算机程序指令可以加载到通用计算机、专用计算机或用于产生机器的其他可编程数据处理设备上,以使得在计算机或其他可编程数据处理设备上执行的指令创建了用于实施在流程图方框或多个方框中指定的功能的方式。
[0159]
这些计算机程序指令还可以被存储在计算机可读存储器中,该存储器能够指导计算机或其他可编程数据处理设备以特定方式运行,以使得被存储在计算机可读介质中的指令产生包括实施在流程方框或多个方框中指定的功能的计算机可读指令的制品。计算机程序指令还可以被加载到计算机或其他可编程数据处理设备上,以使得要在计算机或其他可编程设备上执行的一系列操作步骤产生计算机实施的处理,以使得在计算机或其他可编程设备上执行的指令提供用于实施在流程方框或多个方框中指定的功能的步骤。
[0160]
因此,方框图和流程图的方框支持用于执行指定功能的方式的组合,用于执行指定功能的步骤的组合和用于执行指定功能的程序指令。还将理解的是,方框图和流程图的每个方框以及在方框图和流程图中的方框的组合能够由执行指定功能或步骤的基于硬件的计算机系统或硬件(例如,专用色谱硬件)和计算机指令的组合实施。
[0161]
图22描绘了操作环境2200,其中可以实现根据本发明的一些系统和方法。作为示例,图1的处理控制器108和计算机装置110(或其组件)可以是计算机2201,如图22中所示。计算机2201能够包括一个或多个组件,诸如一个或多个处理器2203、系统存储器2212以及将包括一个或多个处理器2203的计算机2201的各种组件联接到系统存储器2212的总线2213。在多处理器2203的情况下,系统能够使用并行计算。
[0162]
总线2213能够包括几种可能类型的总线结构中的一个或多个,诸如存储器总线、存储器控制器、外围总线、加速图形端口以及使用各种总线架构中的任一种的处理器或本地总线。总线2213和本说明书中指定的所有总线也能够通过有线或无线网络连接实现。
[0163]
计算机2201通常包括各种计算机可读介质。示例性可读介质能够是计算机2201可访问的任何可用介质,且包括,例如但不意味着限制,易失性和非易失性介质、可移动和不可移动介质。系统存储器2212能够包括计算机可读介质,其采用下列形式:易失性存储器,诸如随机存取存储器(ram)和/或非易失性存储器,诸如只读存储器(rom)。系统存储器2212通常能够包括数据,诸如色谱数据2207和/或程序模块,诸如操作系统2205和色谱软件2206,其可由一个或多个处理器2203访问和/或操作。根据具体实施方式,本发明的许多特
征和优点是显而易见的,且因此其旨在由所附权利要求涵盖落在本发明的真实精神和范围内的本发明的所有这样的特征和优点。此外,由于本领域的技术人员将容易想到许多修改和变型,因此不希望将本发明限制为所示和所述的确切构造和操作,且相应地,可以采用落在本发明的范围内的所有合适的修改和等同物。
[0164]
在另一个方面中,计算机2201还能够包括其他可移动/不可移动、易失性/非易失性计算机存储介质。大容量存储装置2204能够为计算机2201提供计算机代码、计算机可读指令、数据结构、程序模块和其他数据的非易失性存储。例如,大容量存储装置2204能够是硬盘、可移动磁盘、可移动光盘、磁带盒或其他磁存储装置、闪存卡、cd-rom、数字通用盘(dvd)或其他光存储装置、随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)等。
[0165]
本领域的技术人员将理解,本发明所基于的构思可以容易地用作设计用于实现本发明的若干目的的其他结构,方法和系统的基础。因此,权利要求不应被视为受之前描述的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1