使用质谱法对低丰度多肽进行绝对定量的方法与流程

文档序号:19667093发布日期:2020-01-10 21:50阅读:791来源:国知局
使用质谱法对低丰度多肽进行绝对定量的方法与流程

相关申请的交叉引用

本申请要求2017年6月2日提交的美国临时申请号62/514,587的优先权,将其公开内容通过引用以其整体并入本文。

本发明提供了用于通过对从简单或复杂的多肽混合物中获得的肽产物的液相色谱/质谱(lc/ms)分析对低丰度多肽进行绝对定量的方法。



背景技术:

用于多肽定量的各种基于质谱(ms)的技术在本领域中是已知的。例如,可以使用基于代谢的技术(例如,使用细胞培养物中的氨基酸的稳定的同位素标记(silac))、基于肽标准品的技术(例如,选择反应监测(srm)和多反应监测(mrm))和基于标记的技术(例如,串联质量标签(tmt))对多肽进行定量。这些方法具有充分证明的缺点,例如用于silac的有限样品来源、srm和mrm的大量开发和成本、以及基于标记的技术的另外的样品处理和相对丰度产生。

开发了基于ms的无标记定量技术,以简化基于ms的多肽定量方法并且规避一些上述局限性。然而,当前的无标记定量技术可能遭受低准确性和高变异性的困扰,并且大多数无标记技术可能仅提供两个或更多个样品之间的相对定量比率(例如,光谱计数)。

用于对蛋白质进行基于ms的无标记绝对定量的一种方法涉及使用蛋白质标准品来创建单点校准测量值,所述测量值应用于后续质谱分析中以对其他蛋白质进行绝对定量。j.c.silva等,molcellproteomics,5,144-56,2006;美国专利号8,271,207。然而,单点校准的使用以及由样品和蛋白质标准品的单独酶促消化产生的差异可能是此方法定量变异性的主要来源。

因此,本领域中需要灵敏、准确和精确的并且能以高通量的方式应用于各种多肽样品的改进的基于ms的无标记绝对定量技术。

本文引用的所有参考文献(包括专利申请和出版物)均通过引用以其整体并入。



技术实现要素:

本发明提供了用于在包含另一种相对高丰度的多肽的样品中对低丰度多肽进行无标记绝对定量的方法。例如,本发明提供了用于对培养系统中的低丰度宿主细胞蛋白或其下游产物进行定量的方法,所述培养系统包含能够产生重组多肽(例如治疗性多肽)的宿主细胞。所述方法使用高丰度多肽的浓度和肽产物ms信号以及低丰度多肽的肽产物ms信号来计算低丰度多肽的绝对量。

在一方面,本发明提供了对样品中的第一多肽进行绝对定量的方法,所述样品包含含有第一多肽和第二多肽的多种多肽,其中所述第一多肽的丰度比所述第二多肽的丰度低至少10倍,所述方法包括:(a)使用液相色谱/质谱(lc/ms)技术在多个样品加载量下分析所述多种多肽的肽产物,以获得在多个样品加载量的每一个下的所述多种多肽的肽产物的离子的ms信号,其中所述多个样品加载量包含第一样品加载量和第二样品加载量,并且其中所述第一样品加载量大于所述第二样品加载量;(b)计算以下各项的ms信号的平均值或总和:(i)在第一样品加载量下具有最高ms信号的第一多肽的肽产物的n种合格离子的前组(a);(ii)在第二样品加载量下具有最高ms信号的第二多肽的肽产物的n种合格离子的前组(b);(iii)在第一样品加载量下第二多肽的肽产物的m种合格离子的中间组(c);和(iv)在第二样品加载量下第二多肽的肽产物的合格离子的中间组(d),其中,a、b、c和d全部使用ms信号的平均值计算,或全部使用ms信号的总和计算;并且(c)基于下式确定在第一样品加载量下第一多肽的绝对量:

[(a)/(c)]*(在第一加载量下第二多肽的摩尔数)*[(d)/(b)],

或其数学等效式。

在另一方面,本发明提供了用于对样品中的第一多肽进行绝对定量的方法,所述样品包含含有第一多肽和第二多肽的多种多肽,其中所述第一多肽的丰度比所述第二多肽的丰度低至少10倍,所述方法包括:(a)获得所述多种多肽的肽产物的离子的ms信号,其中通过使用液相色谱/质谱(lc/ms)技术分析所述多种多肽的肽产物获得所述肽产物的离子的所述ms信号,其中对于包含第一样品加载量和第二样品加载量的多个样品加载量的每一个获得肽产物的ms信号,并且其中所述第一样品加载量大于所述第二样品加载量;(b)计算以下各项的ms信号的平均值或总和:(i)在第一样品加载量下具有最高ms信号的第一多肽的肽产物的n种合格离子的前组(a);(ii)在第二样品加载量下具有最高ms信号的第二多肽的肽产物的n种合格离子的前组(b);(iii)在第一样品加载量下第二多肽的肽产物的m种合格离子的中间组(c);和(iv)在第二样品加载量下第二多肽的肽产物的合格离子的中间组(d),其中,a、b、c和d全部使用ms信号的平均值计算,或全部使用ms信号的总和计算;并且(c)基于下式确定在第一样品加载量下第一多肽的绝对量:

[(a)/(c)]*(在所述第一加载量下所述第二多肽的摩尔数)*[(d)/(b)],

或其数学等效式。

在一些实施方案中,将ms信号的平均值用于确定第一多肽的绝对量。

在一些实施方案中,将ms信号的总和用于确定第一多肽的绝对量。

在一些实施方案中,基于来自所述多个样品加载量、或者所述第一样品加载量和/或所述第二样品加载量的第二多肽肽产物合格离子的定量误差,选择第二多肽的肽产物的合格离子的中间组。

在另一方面,本发明提供了用于选择用于对样品中第一多肽进行绝对定量的肽产物的合格离子组的方法,所述样品包含含有第一多肽和第二多肽的多种多肽,其中所述第一多肽的丰度比所述第二多肽的丰度低至少10倍,所述方法包括:(a)使用液相色谱/质谱(lc/ms)技术在多个样品加载量下分析所述多种多肽的肽产物,以获得在所述多个样品加载量的每一个下所述多种多肽的肽产物的离子的ms信号,其中所述多个样品加载量包含第一样品加载量和第二样品加载量,并且其中所述第一样品加载量大于所述第二样品加载量;并且(b)选择第二多肽的肽产物的m种合格离子的中间组,其中基于来自所述多个样品加载量或者所述第一样品加载量和/或所述第二样品加载量的第二多肽的肽产物的合格离子的定量误差,选择第二多肽的肽产物的合格离子的中间组。在一些实施方案中,所述方法进一步包括选择在第二样品加载量下具有最高ms信号的第二多肽的肽产物的n种合格离子的前组;

在一些实施方案中,肽产物的合格离子的前组的每一种与合格离子的中间组的每一种不同。

在一些实施方案中,ms信号是电离强度或峰高度或峰面积或峰体积。

在一些实施方案中,所述方法进一步包括获得样品。

在一些实施方案中,样品已经被纯化或富集。在一些实施方案中,所述方法进一步包括处理样品中的所述多种多肽以产生肽产物。在一些实施方案中,对样品进行处理包括以下中的一项或多项:(a)离心样品以分离所述多种多肽;(b)纯化样品中的所述多种多肽;(c)从样品中除去与后续处理和质谱分析不兼容的组分;(d)消化所述多种多肽以产生肽产物;以及(e)纯化肽产物。

在一些实施方案中,lc/ms技术包括经由液相色谱技术分离肽产物。

在一些实施方案中,lc/ms技术包括处理获得的肽产物的ms信号。

在一些实施方案中,lc/ms技术进一步包括以下中的一项或多项:(a)通过氨基酸序列鉴定肽产物;(b)通过蛋白质标识符鉴定第一多肽;以及(c)通过蛋白质标识符鉴定所述多种多肽中的一种或多种。

在一些实施方案中,所述方法进一步包括确定第二多肽的绝对量。

在一些实施方案中,所述第一多肽是宿主细胞蛋白或生物标记。在一些实施方案中,所述第一多肽的丰度比所述第二多肽的丰度低至少100倍。

在一些实施方案中,所述第二多肽是由宿主细胞产生的重组多肽或治疗性多肽或血清白蛋白。在一些实施方案中,所述第二多肽从转染到宿主细胞(例如哺乳动物宿主细胞,例如中国仓鼠卵巢(cho)细胞)中的载体表达。

在一些实施方案中,所述样品是细胞培养样品或血液或血清样品或药物产物或其中间体。

在一些实施方案中,在使用lc/ms技术分析肽产物之前,经由样品消化获得样品中的所述多种多肽的肽产物。在一些实施方案中,肽产物是所述多种多肽的胰蛋白酶肽产物。

在一些实施方案中,所述多个样品加载量包括在约0.1-25μg总蛋白质范围内的样品加载量。在一些实施方案中,所述第一样品加载量是约10μg总蛋白质。在一些实施方案中,所述第二样品加载量是约0.5μg至10μg、或3μg至6μg、或1μg、2μg、3μg、4μg、5μg或6μg总蛋白质。

在一些实施方案中,所述方法进一步包括基于第二组肽产物的ms信号选择第二样品加载量。

在一些实施方案中,所述方法进一步包括基于第一组肽产物的ms信号选择第一样品加载量。

在一些实施方案中,所述多个样品加载量中的每一个都具有相同的总体积。

在一些实施方案中,n是1或更大或n是3。

在一些实施方案中,m是1或更大或m是3。

在一些实施方案中,基于每个肽产物的序列选择第二多肽的肽产物的合格离子的中间组。

在另一方面,本发明提供了用于在生产治疗性多肽中检测污染多肽的方法,所述方法包括:(a)获得包含治疗性多肽的样品;(b)确定在样品中是否存在所述污染多肽;其中所述污染多肽的存在是基于使用本文提供的定量方法对样品中的所述污染多肽的绝对定量。

在另一方面,本发明提供了对样品中的第一多肽进行绝对定量的系统,所述样品包含第一多肽和第二多肽,所述系统包含:(a)质谱仪;(b)计算机,其包含;(c)非暂时性计算机可读介质,其包括存储于其上的指令,所述指令在执行时进行如下处理,所述处理包括计算以下各项的ms信号的平均值或总和:(i)在第一样品加载量下具有最高ms信号的第一多肽的肽产物的n种合格离子的前组(a);(ii)在第二样品加载量下具有最高ms信号的第二多肽的肽产物的n种合格离子的前组(b);(iii)在第一样品加载量下第二多肽的肽产物的m种合格离子的中间组(c);和(iv)在第二样品加载量下第二多肽的肽产物的合格离子的中间组(d),其中,a、b、c和d全部使用ms信号的平均值计算,或全部使用ms信号的总和计算;并且基于下式确定在第一样品加载量下第一多肽的绝对量:

[(a)/(c)]*(在所述第一加载量下所述第二多肽的摩尔数)*[(d)/(b)],

或其数学等效式。在一些实施方案中,所述系统进一步包含液相色谱仪。

在另一方面,本发明提供了非暂时性计算机可读介质,其包括存储于其上的指令,所述指令在执行时进行用于对包含第一多肽和第二多肽的样品中的第一多肽进行绝对定量的处理,所述处理包括:计算以下各项的ms信号的平均值或总和:(i)在第一样品加载量下具有最高ms信号的第一多肽的肽产物的n种合格离子的前组(a);(ii)在第二样品加载量下具有最高ms信号的第二多肽的肽产物的n种合格离子的前组(b);(iii)在第一样品加载量下第二多肽的肽产物的m种合格离子的中间组(c);和(iv)在第二样品加载量下第二多肽的肽产物的合格离子的中间组(d),其中,a、b、c和d全部使用ms信号的平均值计算,或全部使用ms信号的总和计算;并且基于下式确定在第一样品加载量下第一多肽的绝对量:

[(a)/(c)]*(在所述第一加载量下所述第二多肽的摩尔数)*[(d)/(b)],

或其数学等效式。

从随后的详细描述和所附权利要求书中,本发明的这些和其他方面与优点将变得清楚。应当理解,本文中所描述的各种实施方案的一种、一些或全部特性都可以组合以形成本发明的其他实施方案。

附图说明

图1示出了在不同的样品加载量下从包含鞘磷脂磷酸二酯酶(asm)的样品的lc/ms分析中观察到的四十种丰度最高的肽产物离子的ms峰面积的直方图(每个lc/ms分析的样品加载量排序为1μg、2.5μg、5μg、7.5μg、10μg、12.5μg、15μg、18μg和20μg(对于每个肽产物条组而言从左到右))。肽产物条组上方示出了在样品加载量上每种肽产物离子的平均百分比误差。

图2示出了在六个浓度点上的三种肽产物的中间组(中间3种;正方形)和三种肽产物的前组(前3种;菱形)的峰面积总和。中间3种肽产物线性回归的r2是0.98,并且前3种肽产物线性回归的r2是0.87。

图3a-3b示出了在四个不同的测定场合(场合a、场合b、场合c、场合d),对于四个样品(批次1、批次2、批次3、批次4,对于每个条组而言从左到右)的hi-3(图3a)和mid-3(图3b)定量方法的对比。对于hi-3方法,相对标准差是82%(图3a),并且对于mid-3方法,相对标准差是16%(图3b)。

图4示出了在多种治疗性蛋白质生产批次中前8种鉴定的宿主细胞蛋白的相对丰度。

图5示出了在用于治疗性蛋白质纯化过程的阶段中的鉴定的宿主细胞蛋白的相对丰度。

具体实施方式

本发明提供了对样品中的第一多肽进行绝对定量的方法,所述样品包含含有第一多肽和第二多肽的多种多肽,所述方法包括基于以下各项的ms信号的平均值或总和确定样品中的第一多肽的绝对量:在第一样品加载量下具有最高ms信号的第一多肽的肽产物的n种合格离子的前组(a);在第二样品加载量下具有最高ms信号的第二多肽的肽产物的n种合格离子的前组(b);在第一样品加载量下第二多肽的肽产物的m种合格离子的中间组(c);和在第二样品加载量下第二多肽的肽产物的合格离子的中间组(d),其中,a、b、c和d全部使用ms信号的平均值计算,或全部使用ms信号的总和计算。在一些实施方案中,在样品中所述第一多肽的丰度比所述第二多肽低。在一些实施方案中,通过下式确定第一多肽的绝对量:

[(a)/(c)]*(在第一加载量下第二多肽的摩尔数)*[(d)/(b)]。

本发明的方法在本文中也称为mid-3。如本文所用,如关于离子所使用的“合格”是指适用于本文所述的定量方法的肽产物离子。在一些实施方案中,合格的肽产物离子排除非胰蛋白酶的肽产物离子或具有翻译后修饰的肽产物离子。

与本领域中已知的无标记绝对定量方法相比,本文所述的本发明的方法提供了例如在样品中在较大多肽浓度动态范围内的多肽定量的改进的准确性和再现性(例如,hi-3;j.c.silva等,同上)。不希望受理论束缚,无标记绝对定量方法是基于以下发现:假设样品中等摩尔量的每种的所述多种多肽、来自多肽的肽产物的前n种丰度最高的离子的平均ms检测器响应在所述多种多肽的每一种中相似(即,肽产物浓度与检测器响应相关)。因此,未知浓度的多肽的量可以通过与已知浓度的标准多肽进行对比来确定。然而,将多肽标准品的肽产物的最高丰度离子用于绝对定量可能导致准确性和再现性差。例如,由于观察到因为ms检测器饱和导致的前几种电离肽产物的非线性行为,可能引起定量不准确。此外,此类方法可能依赖于掺入已知量的标准多肽或分析在lc/ms分析中与含有未知浓度多肽的样品分开的已知量的标准蛋白质样品。两种方法都可能导致定量准确性降低和变异性增加。例如,重复性地将已知量的标准多肽等分为任意数量的样品可能具有挑战性,并且基于在与含有未知多肽的样品分开的酶促反应中消化的标准多肽校准定量计算可能产生以消化完成程度为基础的另外的变异。

本发明提供了定量方法,所述定量方法整合了实现多肽定量的改进的准确性和再现性的元素。第一,本发明的绝对定量方法利用了包含具有已知浓度并且相对于样品中的其他多肽(例如,在制造样品中的治疗性蛋白质或在血清样品中的白蛋白)具有高丰度的多肽的多肽样品系统,并且不需要与掺入或单独分析的标准多肽对比。第二,本发明的绝对定量方法使用在两个浓度下的ms测量值,以避免高丰度多肽的前n种肽产物离子的ms检测器饱和。第三,本发明的绝对定量方法进一步利用了与前几种肽相比定量误差减少的肽产物离子的中间组,以减少总体定量误差。与本领域中已知的无标记绝对定量方法(即hi-3)直接对比证明了本发明方法的优点。例如,如实施例2中所示,在一系列测定和样品中,本发明公开的方法实现了16%的相对标准差,然而hi-3方法具有82%的相对标准差。

如下面更详细地讨论的,本发明提供了使用来自具有已知浓度并且相对丰度高于低丰度多肽的另一种多肽(例如,第二多肽)的信息用于对低丰度多肽(例如,第一多肽)进行基于ms的无标记绝对定量的方法,所述方法包括以下中的任何一项或多项:(a)进行加载研究以确定获得和/或分析数据以定量低丰度多肽的两个样品加载浓度(例如,第一样品加载量和第二样品加载量);(b)选择用于多肽定量的合格肽产物离子(例如,第一多肽的肽产物的n种合格离子的前组、第二多肽的肽产物的n种合格离子的前组和第二多肽的肽产物的m种合格离子的中间组;并且(c)使用ms信号(例如,来自第一多肽和第二多肽的肽产物的ms信号)确定低丰度多肽的绝对多肽量。

进行加载研究以确定第一样品加载量和第二样品加载量

本发明提供了在所需的测定动态范围内进行样品加载研究的方法。从加载研究获得的ms信号信息允许,例如,选择第一样品加载量(其中所述第一多肽的肽产物是可检测的(相对于所述第二多肽,所述第一多肽处于低的丰度))、选择第二样品加载量(其中所述第二多肽的前n种合格的最高丰度肽产物离子不使ms检测器饱和)以及选择第一样品加载量和第二样品加载量(其中所述第二多肽的肽产物的m种合格离子的中间组展示出降低的定量误差(即,相对于丰度最高的肽产物离子的线性行为增加))。

在一些实施方案中,所述方法包括使用液相色谱/质谱(lc/ms)技术分析在多个样品加载量下多种多肽的肽产物,以获得在所述多个样品加载量的每一个下的所述多种多肽的肽产物离子的ms信号,其中所述多个样品加载量包含第一样品加载量和第二样品加载量,并且其中所述第一样品加载量大于所述第二样品加载量。在一些实施方案中,ms信号是电离强度。在一些实施方案中,ms信号是峰高度。在一些实施方案中,ms信号是峰面积。在一些实施方案中,ms信号是峰体积。

在一些实施方案中,可将从加载研究获得的信息应用于后续样品分析以定量多肽(例如,经由lc/ms技术选择2个样品加载量用于另外的样品分析)。

在一些实施方案中,所述多个样品加载量包含至少2个样品加载量。在一些实施方案中,所述多个样品加载量包含2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个或15个样品加载量。

样品加载量可能根据所使用的lc/ms仪器而变化(例如,基于色谱柱的加载容量)。在一些实施方案中,所述多个样品加载量包含在约0.1μg至约100μg、约0.1μg至约75μg、约0.1μg至约50μg、约0.1μg至约40μg、约0.1μg至约30μg、约0.1μg至约20μg、约0.1μg至约15μg、约0.1μg至约10μg、约1μg至约30μg、约1μg至约20μg、约1μg至约15μg或约1μg至约10μg范围内的样品加载量。

在一些实施方案中,所述样品加载量为约0.5μg、约1μg、约1.5μg、约2μg、约2.5μg、约3μg、约3.5μg、约4μg、约4.5μg、约5μg、约5.5μg、约6μg、约6.5μg、约7μg、约7.5μg、约8μg、约8.5μg、约9μg、约9.5μg、约10μg、约10.5μg、约11μg、约11.5μg、约12μg、约12.5μg、约13μg、约13.5μg、约14μg、约14.5μg、约15μg、约16μg、约17μg、约18μg、约19μg、约20μg、约21μg、约22μg、约23μg、约24μg、约25μg、约26μg、约27μg、约28μg、约29μg或约30μg。

在一些实施方案中,所述多个样品加载量包含第一样品加载量和第二样品加载量,其中所述第一样品加载量为约10μg,并且其中所述第二样品加载量为约0.5μg至10μg、或3μg至6μg、或1μg、2μg、3μg、4μg、5μg或6μg。

在一些实施方案中,第一样品加载量是基于第一多肽的肽产物的ms信号选择的。在一些实施方案中,第一样品加载量是基于第二多肽的肽产物的ms信号选择的。在一些实施方案中,第一样品加载量是基于第一多肽的肽产物的ms信号和第二多肽的肽产物的ms信号选择的。

在一些实施方案中,第二样品加载量是基于第二多肽的肽产物的ms信号选择的。

在一些实施方案中,在加载研究中分析的后续样品加载量是基于先前分析的样品加载量的数据。

每个样品加载量的体积可能根据所使用的lc/ms仪器而变化(例如,基于样品环的尺寸)。在一些实施方案中,所述多个样品加载量中的每一个都具有相同的总体积。在一些实施方案中,多个样品加载量的每一个的体积为约1μl至约60μl、约10μl至约60μl、约20μl至约50μl或约30μl至约50μl。在一些实施方案中,多个样品加载量的每一个的体积是相同的并且为约1μl至约60μl、约10μl至约60μl、约20μl至约50μl或约30μl至约50μl。在一些实施方案中,多个样品加载量的每一个的体积为约5μl、10μl、15μl、20μl、25μl、30μl、35μl、40μl、45μl、50μl、55μl或60μl。

选择第一多肽和第二多肽的合格肽产物离子

本发明提供了用于选择用于对样品中的第一多肽进行绝对定量的肽产物的合格离子组的方法,所述样品包含含有第一多肽和第二多肽的多种多肽,其中所述第一多肽相对于所述第二多肽丰度较低。例如,本发明提供了用于选择以下中的任一项的方法:第一多肽的肽产物的n种合格离子的前组、第二多肽的肽产物的n种合格离子的前组和第二多肽的肽产物的m种合格离子的中间组。

在一些实施方案中,本发明的方法包括选择在第一样品加载量下具有最高ms信号的第一多肽的肽产物的n种合格离子的前组。

在一些实施方案中,本发明的方法包括选择在第二样品加载量下具有最高ms信号的第二多肽的肽产物的n种合格离子的前组。

多肽的ms鉴定的肽产物的数量可能根据多肽的浓度和特征而变化。在一些实施方案中,第一多肽的浓度和特征可能导致在第一样品加载量下鉴定出有限数量的肽产物。在一些实施方案中,n是1或更大,其中n是整数。在一些实施方案中,n是3。在一些实施方案中,n是1、2、3、4、5、6、7、8、9或10。

在一些实施方案中,具有最高ms信号的肽产物的合格离子可能排除具有某些特征的肽产物离子,所述特征包括例如漏掉的酶促切割、翻译后修饰、以及重叠的lc洗脱曲线和同位素分布。例如,如果将样品用胰蛋白酶消化并且具有最高ms信号的肽产物是非胰蛋白酶肽产物,则此肽产物可能被排除在第一多肽的肽产物的n种合格离子的前组或第二多肽的肽产物的n种合格离子的前组的选择之外。在一些实施方案中,具有最高ms信号的肽产物的合格离子可能排除源自不作为起始多肽的一部分可再现地存在的多肽部分的肽产物离子(例如,肽产物源自多肽的切割产物,并且因此可能不以与原始多肽相同的浓度存在于样品中)。

在一些实施方案中,本发明的方法包括选择第二多肽的肽产物的m种合格离子的中间组,其中基于来自所述多个样品加载量、或者所述第一样品加载量和/或所述第二样品加载量的第二多肽肽产物合格离子的定量误差来选择第二多肽的肽产物的合格离子的中间组。通常,基于相对于第二多肽的肽产物的总离子组具有最低定量误差来选择第二多肽的肽产物的m种合格离子的中间组的每种肽产物离子。在一些实施方案中,第二多肽的肽产物的m种合格离子的中间组的每个肽产物离子具有比第二多肽丰度最高的肽产物离子更低的定量误差。在一些实施方案中,第二多肽的肽产物的m种合格离子的中间组的肽产物离子具有比具有最高ms信号的第二多肽的肽产物的n种合格离子的前组更低的定量误差。

在一些实施方案中,具有最低定量误差的肽产物的合格离子可能排除具有某些特征的肽产物离子,所述特征包括例如漏掉的酶促切割、翻译后修饰、以及重叠的lc洗脱曲线和同位素分布。例如,在一些实施方案中,如果将样品用胰蛋白酶消化并且具有最低定量误差的肽产物是非胰蛋白酶肽产物,则此肽产物可能被排除在第二多肽的肽产物的m种合格离子的中间组的选择之外。在一些实施方案中,具有最高ms信号的肽产物的合格离子可能排除源自不作为起始多肽的一部分可再现地存在的多肽部分的肽产物离子(例如,肽产物源自多肽的切割产物,并且因此可能不以与原始多肽相同的浓度存在于样品中)。

在一些实施方案中,第二多肽的肽产物的m种合格离子的中间组的选择是基于从加载研究获得的定量误差。在一些实施方案中,第二多肽的肽产物的m种合格离子的中间组的选择是基于从多个样品加载量获得的定量误差。在一些实施方案中,定量误差是多个样品加载量的平均百分比误差。在一些实施方案中,第二多肽的肽产物的m种合格离子的中间组的选择是基于从第一样品加载量获得的定量误差。在一些实施方案中,第二多肽的肽产物的m种合格离子的中间组的选择是基于从第二样品加载量获得的定量误差。在一些实施方案中,第二多肽的肽产物的m种合格离子的中间组的选择是基于从第一样品加载量和第二样品加载量获得的定量误差。

在一些实施方案中,m是1或更大,其中m是整数。在一些实施方案中,m是3。在一些实施方案中,m是1、2、3、4、5、6、7、8、9或10。

在一些实施方案中,n等于m。在一些实施方案中,n不等于m。在一些实施方案中,n和m是2或更大,其中n和m是整数。在一些实施方案中,n和m是3。

在一些实施方案中,第二多肽的肽产物的合格离子的前组中的每一种与第二多肽的肽产物的合格离子的中间组中的每一种不同。在一些实施方案中,合格的肽产物离子是第二多肽的肽产物的合格离子的前组和第二多肽的肽产物的合格离子的中间组的成员。

在一些实施方案中,合格的肽产物离子包含脲基甲基化的半胱氨酸。在一些实施方案中,合格的肽产物离子包含羧基甲基化的半胱氨酸。

确定低丰度多肽的绝对多肽量

本发明提供了用于计算样品中第一多肽的绝对多肽量的方法,所述样品包含含有第一多肽和第二多肽的多种多肽,所述方法包括基于以下各项的ms信号的平均值或总和确定样品中的第一多肽的绝对量:在第一样品加载量下具有最高ms信号的第一多肽的肽产物的n种合格离子的前组(a);在第二样品加载量下具有最高ms信号的第二多肽的肽产物的n种合格离子的前组(b);在第一样品加载量下第二多肽的肽产物的m种合格离子的中间组(c);和在第二样品加载量下第二多肽的肽产物的合格离子的中间组(d),其中,a、b、c和d全部使用ms信号的平均值计算,或全部使用ms信号的总和计算。

在一些实施方案中,第一多肽的绝对量基于下式确定:

[(a)/(c)]*(在所述第一加载量下所述第二多肽的摩尔数)*[(d)/(b)],

或其数学等效式。

在一些实施方案中,a、b、c和d全部使用ms信号的平均值计算。在一些实施方案中,a、b、c和d全部使用ms信号的总和计算。

在一些实施方案中,ms信号是电离强度。在一些实施方案中,ms信号是峰高度。在一些实施方案中,ms信号是峰面积。在一些实施方案中,ms信号是峰体积。

在一些实施方案中,预先确定具有最高ms信号的第一多肽的肽产物的n种合格离子的前组。在一些实施方案中,预先确定具有最高ms信号的第二多肽的肽产物的n种合格离子的前组。在一些实施方案中,预先确定第二多肽的肽产物的m种合格离子的中间组。在一些实施方案中,预先确定在第二样品加载量下具有最高ms信号的第二多肽的肽产物的n种合格离子的前组(b)与在第二样品加载量下第二多肽的肽产物的合格离子的中间组(d)的比率。

在一些实施方案中,从样品的2个lc/ms分析来确定以下各项的ms信号的平均值或总和:在第一样品加载量下具有最高ms信号的第一多肽的肽产物的n种合格离子的前组(a);在第二样品加载量下具有最高ms信号的第二多肽的肽产物的n种合格离子的前组(b);在第一样品加载量下第二多肽的肽产物的m种合格离子的中间组(c);和在第二样品加载量下第二多肽的肽产物的合格离子的中间组(d)。在一些实施方案中,进行2个lc/ms分析的另外的重复分析。

在一些实施方案中,从样品的2个lc/ms分析来确定以下各项的ms信号的平均值或总和(其中lc/ms分析不是加载研究的一部分):在第一样品加载量下具有最高ms信号的第一多肽的肽产物的n种合格离子的前组(a);在第二样品加载量下具有最高ms信号的第二多肽的肽产物的n种合格离子的前组(b);在第一样品加载量下第二多肽的肽产物的m种合格离子的中间组(c);和在第二样品加载量下第二多肽的肽产物的合格离子的中间组(d)。在一些实施方案中,进行2个lc/ms分析的另外的重复分析。

在一些实施方案中,定量方法包括来自两种或更多种已知量的多肽的ms信号。

在一些实施方案中,方法进一步包括确定第二多肽的绝对量。用于确定第二多肽的蛋白质量的方法包括例如elisa和western印迹。

预期可以使用本发明的方法鉴定和定量每个测定中多于一种的未知浓度的多肽。例如,从上文公开的等式,可以将在第一样品加载量下具有最高ms信号的第一多肽的肽产物的n种合格离子的前组(a)用在第一样品加载量下具有最高ms信号的另一种多肽的肽产物的n种合格离子的前组替代,以计算所述另一种多肽的量。

样品和样品制备

本发明的方法用于样品中第一多肽的绝对定量,样品包含含有所述第一多肽和第二多肽的多种多肽,其中所述第一多肽的丰度低于所述第二多肽。

在一些实施方案中,第一多肽的丰度比第二多肽的丰度低至少约10倍。在一些实施方案中,第一多肽的丰度比第二多肽的丰度低至少约100倍。在一些实施方案中,第一多肽的丰度比第二多肽的丰度低至少约1000倍。在一些实施方案中,第一多肽的丰度比第二多肽的丰度低至少约2倍至约1x109倍。例如,第一多肽的量测量为十亿分之一。

在一些实施方案中,第二多肽的丰度比第一多肽的丰度高至少约10倍。在一些实施方案中,第二多肽的丰度比第一多肽的丰度高至少约100倍。在一些实施方案中,第二多肽的丰度比第一多肽高至少约1000倍或1x109倍。在一些实施方案中,第二多肽的丰度比第一多肽的丰度高至少约2倍至约1x109倍。

产生用于经由lc/ms技术分析的样品中多种多肽的肽产物所必需的样品制备技术是本领域已知的。

在一些实施方案中,在使用lc/ms技术分析肽产物之前,经由样品消化获得样品中多种多肽的肽产物。在一些实施方案中,样品消化包括使用蛋白酶的酶促消化。在一些实施方案中,酶促消化使用胰蛋白酶、lys-c、ides、idez、pngasef、嗜热菌蛋白酶、胃蛋白酶、弹性蛋白酶、arg-c、tev、glu-c、asp-n和因子xa中的一种或多种进行。在一些实施方案中,样品中多种多肽的肽产物是胰蛋白酶肽产物。

在一些实施方案中,样品消化包括化学消化,如酸水解。

在一些实施方案中,方法包括获得样品。获得用于lc/ms分析的样品的技术在本领域中是已知的,并且包括例如组织(例如血液、血浆)收集和细胞培养。

在一些实施方案中,样品已经被纯化或富集。在一些实施方案中,方法包括处理样品中多种多肽以产生肽产物。在一些实施方案中,处理样品中多种多肽包括以下各项中的一种或多种:(a)离心样品以分离所述多种多肽;(b)纯化样品中所述多种多肽;(c)从样品去除与后续处理和lc/ms分析不兼容的组分;(d)消化所述多种多肽以产生所述肽产物;以及(e)在lc/ms分析前纯化所述肽产物。

在一些实施方案中,第一多肽是宿主细胞蛋白质。在一些实施方案中,第二多肽是宿主细胞产生的重组多肽。在一些实施方案中,第二多肽是治疗性多肽(如抗体(例如重组抗体)或酶(例如重组酶))或肽(例如胰岛素)。在一些实施方案中,第二多肽是病毒蛋白质,如病毒颗粒的衣壳(例如,用于基因疗法的)。在一些实施方案中,样品是细胞培养物样品。在一些实施方案中,样品是药物产物或其中间体。

在一些实施方案中,第一多肽是生物标记,如循环生物标记。在一些实施方案中,第二多肽是血清白蛋白。在某些实施方案中,样品是血液或血清样品。

液相色谱/质谱(lc/ms)技术

本发明考虑了多种lc/ms技术,其用于产生包含含有所述第一多肽和第二多肽的多种多肽的样品的串联质谱。

在一些实施方案中,lc/ms技术包括经由液相色谱技术分离肽产物。本申请考虑的液相色谱技术包括分离多肽的方法和与质谱技术兼容的液相色谱技术。在一些实施方案中,液相色谱技术包括高效液相色谱技术。因此,在一些实施方案中,液相色谱技术包括超高效液相色谱技术。在一些实施方案中,液相色谱技术包括高流(high-flow)液相色谱技术。在一些实施方案中,液相色谱技术包括低流(low-flow)液相色谱技术,如微流(micro-flow)液相色谱技术或纳流(nano-flow)液相色谱技术。在一些实施方案中,液相色谱技术包括与质谱仪耦合的在线液相色谱技术。在一些实施方案中,在线液相色谱技术是高效液相色谱技术。在一些实施方案中,在线液相色谱技术是超高效液相色谱技术。

在一些实施方案中,可以使用毛细管电泳(ce)技术或电喷雾或maldi技术将样品引入质谱仪。

在一些实施方案中,质谱技术包括电离技术。本申请考虑的电离技术包括能够使多肽和肽产物带电的技术。因此,在一些实施方案中,电离技术是电喷雾电离。在一些实施方案中,电离技术是纳米电喷雾电离。在一些实施方案中,电离技术是大气压化学电离。在一些实施方案中,电离技术是大气压光电离。在某些实施方案中,电离技术是基质辅助激光解吸电离(maldi)。在一些实施方案中,质谱技术包括电喷雾电离、纳米电喷雾电离或基质辅助激光解吸电离(maldi)技术。

在一些实施方案中,lc/ms技术包括经由质谱技术分析肽产物。与在线液相色谱技术耦合的本发明考虑的质谱仪包括高分辨质谱仪和低分辨质谱仪。因此,在一些实施方案中,质谱仪是飞行时间(tof)质谱仪。在一些实施方案中,质谱仪是四极杆飞行时间(q-tof)质谱仪。在一些实施方案中,质谱仪是四极离子阱飞行时间(qit-tof)质谱仪。在一些实施方案中,质谱仪是离子阱。在一些实施方案中,质谱仪是单个四极杆。在一些实施方案中,质谱仪是三重四极杆(qqq)。在一些实施方案中,质谱仪是轨道阱(orbitrap)。在一些实施方案中,质谱仪是四级杆轨道阱。在一些实施方案中,质谱仪是傅立叶变换离子回旋共振(ft)质谱仪。在一些实施方案中,质谱仪是四极杆傅立叶变换离子回旋共振(q-ft)质谱仪。在一些实施方案中,质谱技术包括正离子模式。在一些实施方案中,质谱技术包括负离子模式。在一些实施方案中,质谱技术包括飞行时间(tof)质谱技术。在一些实施方案中,质谱技术包括四极杆飞行时间(q-tof)质谱技术。在一些实施方案中,质谱技术包括离子迁移质谱技术。在一些实施方案中,低分辨质谱技术(如离子阱或单个四极杆或三重四极杆方法)是合适的。

在一些实施方案中,lc/ms技术包括处理获得的肽产物的ms信号。在一些实施方案中,lc/ms技术包括峰值检测。在一些实施方案中,lc/ms技术包括确定肽产物的电离强度。在一些实施方案中,lc/ms技术包括确定肽产物的峰高。在一些实施方案中,lc/ms技术包括确定肽产物的峰面积。在一些实施方案中,lc/ms技术包括确定肽产物的峰体积。在一些实施方案中,lc/ms技术包括通过氨基酸序列鉴定肽产物。在一些实施方案中,lc/ms技术包括手动验证肽产物氨基酸序列分配。在一些实施方案中,lc/ms技术包括通过蛋白质标识符鉴定第一多肽。在一些实施方案中,lc/ms技术包括通过蛋白质标识符鉴定多种多肽中的一种或多种,所述蛋白质标识符可以在数据库检索或库检索中被鉴定出。

在一些实施方案中,可以使用光谱库实现多肽的肽产物的鉴定。通常,光谱库的使用允许填补(imputation)获得的有关多肽系统的知识,并且导致数据分析速度提高和误差减少。

绝对定量方法的使用

本文公开的基于ms的无标记的绝对定量方法尤其适用于如下用途,所述用途包括包含低丰度多肽和另一种相对高丰度多肽的样品中的低丰度多肽的定量。本文公开的基于ms的无标记的绝对定量方法可以,例如,构成多步骤过程中的单个步骤,如在治疗性蛋白质的纯化过程中低丰度蛋白质的定量。

在一些实施方案中,本发明提供了在生产治疗性多肽的过程中检测污染多肽的方法,所述方法包括:(a)获得包含治疗性多肽的样品;(b)确定样品中是否存在污染多肽;其中污染多肽的存在是基于使用本文公开的方法的样品中污染多肽的绝对定量。在一些实施方案中,污染多肽是宿主细胞蛋白质。在一些实施方案中,污染多肽是病毒蛋白质,如衣壳蛋白质。在一些实施方案中,第二多肽是治疗性多肽。在一些实施方案中,在样品中检测到多于一种污染多肽(例如,并且对样品中的污染多肽的总量进行了定量)。在一个实施方案中,在重组多肽(例如,治疗性多肽)的生产过程中的各个步骤中采集样品,以测定各个步骤中重组多肽的纯度。鉴定的污染多肽(例如,宿主细胞多肽)的量越低,将表明重组多肽的纯度越高。

在一些实施方案中,本发明提供了生产治疗性多肽的方法,所述方法包括:(a)从生产过程的一个阶段(例如细胞培养物收获或纯化步骤)获得包含治疗性多肽的样品;(b)鉴定样品中的污染多肽;(c)确定样品中污染多肽的水平,其中污染多肽的水平是基于使用本文公开的方法的样品中污染多肽的绝对定量。在一些实施方案中,污染多肽是宿主细胞蛋白质。在一些实施方案中,污染多肽是病毒蛋白质,如衣壳蛋白质。在一些实施方案中,第二多肽是治疗性多肽。在一些实施方案中,在样品中检测到多于一种污染多肽(例如,并且对样品中的污染多肽的总量进行了定量)。在一个实施方案中,在重组多肽(例如,治疗性多肽)的生产过程中的各个步骤中采集样品,以测定各个步骤中重组多肽的纯度。鉴定的污染多肽(例如,宿主细胞多肽)的量越低,将表明重组多肽的纯度越高。

在一些实施方案中,本发明提供了纯化治疗性多肽的方法,所述方法包括:(a)从纯化过程的一个或多个阶段(例如细胞培养物收获或纯化步骤)获得包含治疗性多肽的样品;(b)鉴定样品中的污染多肽;(c)确定纯化过程的一个或多个阶段的样品中污染多肽的水平,其中污染多肽的水平是基于使用本文公开的方法的样品中污染多肽的绝对定量。在一些实施方案中,污染多肽是宿主细胞蛋白质。在一些实施方案中,污染多肽是病毒蛋白质,如衣壳蛋白质。在一些实施方案中,第二多肽是治疗性多肽。在一些实施方案中,在样品中检测到多于一种污染多肽(例如,并且对样品中的污染多肽的总量进行了定量)。在一个实施方案中,在重组多肽(例如,治疗性多肽)的生产过程中的各个步骤中采集样品,以测定各个步骤中重组多肽的纯度。鉴定的污染多肽(例如,宿主细胞多肽)的量越低,将表明重组多肽的纯度越高。

在一些实施方案中,本发明提供了检测基因治疗产物中污染多肽的方法。所述方法包括例如,(a)从纯化过程的一个或多个阶段(例如细胞培养物收获或纯化步骤)获得包含基因治疗载体的样品;(b)鉴定样品中的污染多肽;(c)确定纯化过程的一个或多个阶段的样品中污染多肽的水平,其中污染多肽的水平是基于使用本文公开的方法的样品中污染多肽的绝对定量。在一些实施方案中,基因治疗产物与病毒蛋白质(如衣壳)相关。在一些实施方案中,基因治疗产物包含病毒蛋白质(如衣壳)。在一些实施方案中,基因治疗载体与病毒蛋白质(如衣壳)相关。在一些实施方案中,基因治疗载体是包含病毒蛋白质(如衣壳)的病毒颗粒的一部分。在一些实施方案中,污染多肽是宿主细胞蛋白质。在一些实施方案中,污染多肽是病毒蛋白质,如衣壳蛋白质。在一些实施方案中,污染多肽是与基因治疗产物无关的病毒蛋白质。在一些实施方案中,污染多肽是病毒蛋白质,所述病毒蛋白质不是基因治疗产物的一部分。在一些实施方案中,污染多肽是辅助病毒蛋白质。在一些实施方案中,第二多肽是病毒蛋白质(如衣壳蛋白质)。在一些实施方案中,在样品中检测到多于一种污染多肽(例如,并且对样品中的污染多肽的总量进行了定量)。在一个实施方案中,在基因治疗产物的生产过程中的各个步骤中采集样品,以测定各个步骤中基因治疗产物的纯度。鉴定的污染多肽(例如,宿主细胞多肽)的量越低,将表明基因治疗产物的纯度越高。

在一些实施方案中,本发明提供了生产基因治疗产物的方法。所述方法包括例如,(a)从纯化过程的一个或多个阶段(例如细胞培养物收获或纯化步骤)获得包含基因治疗载体的样品;(b)鉴定样品中的污染多肽;(c)确定纯化过程的一个或多个阶段的样品中污染多肽的水平,其中污染多肽的水平是基于使用本文公开的方法的样品中污染多肽的绝对定量。在一些实施方案中,基因治疗产物与病毒蛋白质(如衣壳)相关。在一些实施方案中,基因治疗产物包含病毒蛋白质(如衣壳)。在一些实施方案中,基因治疗载体与病毒蛋白质(如衣壳)相关。在一些实施方案中,基因治疗载体是包含病毒蛋白质(如衣壳)的病毒颗粒的一部分。在一些实施方案中,污染多肽是宿主细胞蛋白质。在一些实施方案中,污染多肽是病毒蛋白质,如衣壳蛋白质。在一些实施方案中,污染多肽是与基因治疗产物无关的病毒蛋白质。在一些实施方案中,污染多肽是病毒蛋白质,所述病毒蛋白质不是基因治疗产物的一部分。在一些实施方案中,污染多肽是辅助病毒蛋白质。在一些实施方案中,第二多肽是病毒蛋白质(如衣壳蛋白质)。在一些实施方案中,在样品中检测到多于一种污染多肽(例如,并且对样品中的污染多肽的总量进行了定量)。在一个实施方案中,在基因治疗产物的生产过程中的各个步骤中采集样品,以测定各个步骤中基因治疗产物的纯度。鉴定的污染多肽(例如,宿主细胞多肽)的量越低,将表明基因治疗产物的纯度越高。

在一些实施方案中,本发明提供了纯化基因治疗产物的方法。所述方法包括例如,(a)从纯化过程的一个或多个阶段(例如细胞培养物收获或纯化步骤)获得包含基因治疗载体的样品;(b)鉴定样品中的污染多肽;(c)确定纯化过程的一个或多个阶段的样品中污染多肽的水平,其中污染多肽的水平是基于使用本文公开的方法的样品中污染多肽的绝对定量。在一些实施方案中,基因治疗产物与病毒蛋白质(如衣壳)相关。在一些实施方案中,基因治疗产物包含病毒蛋白质(如衣壳)。在一些实施方案中,基因治疗载体与病毒蛋白质(如衣壳)相关。在一些实施方案中,基因治疗载体是包含病毒蛋白质(如衣壳)的病毒颗粒的一部分。在一些实施方案中,污染多肽是宿主细胞蛋白质。在一些实施方案中,污染多肽是病毒蛋白质,如衣壳蛋白质。在一些实施方案中,污染多肽是与基因治疗产物无关的病毒蛋白质。在一些实施方案中,污染多肽是病毒蛋白质,所述病毒蛋白质不是基因治疗产物的一部分。在一些实施方案中,污染多肽是辅助病毒蛋白质。在一些实施方案中,第二多肽是病毒蛋白质(如衣壳蛋白质)。在一些实施方案中,在样品中检测到多于一种污染多肽(例如,并且对样品中的污染多肽的总量进行了定量)。在一个实施方案中,在基因治疗产物的生产过程中的各个步骤中采集样品,以测定各个步骤中基因治疗产物的纯度。鉴定的污染多肽(例如,宿主细胞多肽)的量越低,将表明基因治疗产物的纯度越高。

在一些实施方案中,本文公开的方法进一步包括基于污染多肽的存在调整方案。例如,可以基于鉴定的和定量的污染多肽的存在调整纯化过程。此类调整提供了用于提高目标多肽(如治疗性多肽)的纯度的方法。

在一些实施方案中,本发明提供了治疗个体中疾病的方法,其中所述个体是基于个体中生物标记的量而被选择进行治疗。在一些实施方案中,在血清样品中对生物标记进行定量。在一些实施方案中,第一多肽是生物标记。在一些实施方案中,第二多肽是血清白蛋白。

在一些实施方案中,本发明提供了评估个体中疾病的方法,其中所述个体是基于个体中生物标记的量进行评估。在一些实施方案中,在血清样品中对生物标记的量进行定量。在一些实施方案中,第一多肽是生物标记。在一些实施方案中,第二多肽是血清白蛋白。

在一些实施方案中,本发明提供了诊断个体中疾病的方法,其中所述个体是基于个体中生物标记的量而被诊断为患有疾病。在一些实施方案中,在血清样品中对生物标记的量进行定量。在一些实施方案中,第一多肽是生物标记。在一些实施方案中,第二多肽是血清白蛋白。

系统

本发明提供了用于确定样品中第一多肽的绝对多肽量的系统和非暂时性计算机可读介质,所述样品包含含有所述第一多肽和第二多肽的多种多肽。

在一些实施方案中,本发明提供了对样品中的第一多肽进行绝对定量的系统,所述样品包含第一多肽和第二多肽,所述系统包含:(a)质谱仪;(b)计算机,其包含;(c)非暂时性计算机可读介质,其包括存储于其上的指令,所述指令在执行时进行如下处理,所述处理包括计算以下各项的ms信号的平均值或总和:(i)在第一样品加载量下具有最高ms信号的第一多肽的肽产物的n种合格离子的前组(a);(ii)在第二样品加载量下具有最高ms信号的第二多肽的肽产物的n种合格离子的前组(b);(iii)在第一样品加载量下第二多肽的肽产物的m种合格离子的中间组(c);和(iv)在第二样品加载量下第二多肽的肽产物的合格离子的中间组(d),其中,a、b、c和d全部使用ms信号的平均值计算,或全部使用ms信号的总和计算;并且基于下式确定在第一样品加载量下第一多肽的绝对量:

[(a)/(c)]*(在所述第一加载量下所述第二多肽的摩尔数)*[(d)/(b)],

或其数学等效式。在一些实施方案中,系统进一步包括液相色谱仪。

在一些实施方案中,本发明提供了非暂时性计算机可读介质,其包括存储于其上的指令,所述指令在执行时进行用于对包含第一多肽和第二多肽的样品中的第一多肽进行绝对定量的处理,所述处理包括:计算以下各项的ms信号的平均值或总和:(i)在第一样品加载量下具有最高ms信号的第一多肽的肽产物的n种合格离子的前组(a);(ii)在第二样品加载量下具有最高ms信号的第二多肽的肽产物的n种合格离子的前组(b);(iii)在第一样品加载量下第二多肽的肽产物的m种合格离子的中间组(c);和(iv)在第二样品加载量下第二多肽的肽产物的合格离子的中间组(d),其中,a、b、c和d全部使用ms信号的平均值计算,或全部使用ms信号的总和计算;并且基于下式确定在第一样品加载量下第一多肽的绝对量:

[(a)/(c)]*(在所述第一加载量下所述第二多肽的摩尔数)*[(d)/(b)],

或其数学等效式。

本领域技术人员将认识到,在本发明的范围和精神内可以有若干种实施方案。本发明现在将通过引用以下非限制性实施例进行更加详细的描述。以下实施例进一步说明了本发明,但是当然不应该解释为以任何方式限制其范围。

如本文所用,术语“多肽”是指包含经由肽键共价连接的氨基酸的聚合物。在一些实施方案中,多肽是蛋白质。在一些情况下,蛋白质包含两种或更多种多肽(例如,多聚体蛋白质、同聚体蛋白质、多蛋白复合体)。可以将多肽用非氨基酸部分进一步修饰。例如,多肽可以进一步包含酶促介导的修饰和/或化学修饰(例如,乙酰化、磷酸化、泛素化、甲酰化、糖基化、氧化)。此类修饰可以,例如在基于细胞环境中发生或由于样品处理和/或分析技术而发生。

如本文所用,术语“肽产物”是指在多肽的分解处理之后获得的包含两个或更多个经由肽键共价连接的氨基酸的聚合物。例如,肽产物是在多肽的分解处理之后获得,所述分解处理包括化学消化(例如,酸水解)或酶促消化(例如,胰蛋白酶消化)。在一些实施方案中,肽产物是胰蛋白酶肽。在一些实施方案中,肽产物是较大多肽的末端片段。在一些实施方案中,肽产物是多肽的内部片段。

本文使用的术语“包含”意指其他组分、成分、步骤等是任选存在的。例如,“包含”组分a、b和c的物品可以由(即仅含有)组分a、b和c组成,或者可以不仅含有组分a、b和c,而且可以含有一种或多种其他组分。应当理解,“包含”及其语法等同词包括“由……组成”或“基本上由……组成”。

在提供值范围的情况下,应当理解的是,除非上下文另有明确规定,否则在该范围的上限值和下限值之间的为下限值的单位的十分之一的每个中间值以及所述的范围内的任何其他所述的或中间值涵盖在本公开文本内,受限于在所述的范围中的任何具体排除的限制。在所陈述的范围包括一个或两个限值的情况下,排除了那些被包括的任一个或两个限值的范围也被包括在本公开文本之内。

本文对“约”某个值或参数的提及包括(并且描述)针对所述值或参数本身的变化。例如,提及“约x”的描述包括对“x”的描述。

如本文和所附的权利要求中所用,单数形式“一个/种”、“或”和“所述”包括复数指代物,除非上下文另有明确规定。

实施例

实施例1

asm的加载研究证明了asm的肽产物离子的中间组改善的线性ms信号响应

本实施例说明了使用包含鞘磷脂磷酸二酯酶(asm)的样品用于选择第一样品加载量和第二加载量的加载研究。此外,本实施例证明了与asm的最高丰度肽产物离子的前组相比,asm的肽产物离子的中间组改善的线性ms信号响应。

一式三份地,在用lysc和胰蛋白酶消化前,将asm样品变性、还原和烷基化。对消化的样品以1μg、2.5μg、5μg、7.5μg、10μg、12.5μg、15μg、18μg和20μg进行lc/ms分析。用具备装有csh130c181.7μm材料的2.1×150mm柱的acquityuplc进行色谱分析。在xevoq-tofg2-xs上使用低和升高的碰撞能量的交替扫描获取数据,以生成前体和碎片离子信息。在asm的前40种丰度最高的肽产物离子的样品量范围内,计算了每种肽产物离子的ms峰面积和平均误差百分比。

图1示出了从在不同的样品加载量下包含鞘磷脂磷酸二酯酶(asm)的样品的lc/ms分析观察到的四十种丰度最高的肽产物离子的ms峰面积的直方图(对于每个肽条组,每个lc/ms分析的样品加载量从左到右排序为1μg、2.5μg、5μg、7.5μg、10μg、12.5μg、15μg、18μg和20μg)。肽条组上方示出了每种肽产物离子在样品加载量之间的平均误差百分比。

如图1所示,asm的最强的肽产物相对于所有肽产物离子具有更高的误差,尤其是随着总样品量增加而如此。在肽产物离子分布中间的肽相对于所有肽产物离子表现得更线性,并且具有更低的误差,甚至在高达20μg的总样品加载量的情况下如此。

使用加载研究中的数据,可以选择第二多肽的肽产物的n种合格离子的前组和第二多肽的肽产物的m种合格离子的中间组。例如,asm的肽产物的n种(例如3种)合格离子的前组可以包括选自肽a(z=4)、肽b(z=3)和肽c(z=4)的肽产物离子。asm的肽产物的m种(例如3种)合格离子的中间组可以包括选自肽d(z=2)、肽m(z=4)、肽o(z=1)、肽m(z=3)、肽b(z=2)、肽l(z=2)、肽p(z=1)和肽q(z=1)的肽产物离子。

此外,使用从asm加载研究收集的数据,使用3种丰度最高的肽产物离子的前组(前3种)和3种肽产物离子的中间组(中间3种)绘制对于每个样品加载量的总峰面积与柱上加载的样品(μg)的曲线(图2)。在低于最佳样品加载量(10μg)时可以良好地观察到top-3肽产物组的非线性行为。中间3种肽产物组在加载研究的样品加载量上表现为线性,因此证明中间3种肽产物离子适用于本发明的定量技术。使用中间3种肽产物组也改善了线性回归的r2(与前3种肽产物组的0.87相比,中间3种肽产物组为0.98)。

表1提供了每种肽产物组在每种浓度下相对于2.5μg加载量的误差百分比。对于所有样品加载量,中间3种肽产物组的预期比率与观察到的比率之间的误差百分比低于前3种肽产物组。

表1.在每个样品加载量下前3种肽产物组和中间3种肽产物组相对于2.5μg加载量肽产物组的误差百分比。

实施例2

确定多肽量的方法

本实施例证明了使用在四种不同场合下测定的治疗性蛋白质产物的四个蛋白质生产批次,mid-3方法与hi-3方法相比的定量再现性的改善。

如实施例1中所公开的,制备并且分析了蛋白质x的四个蛋白质生产批次(批次1、批次2、批次3、批次4)。对于hi-3方法,将200fmol的clpb标准品(大肠杆菌伴侣clpb)肽产物掺入每个样品中作为内标物。

如通过hi-3方法测量的,针对每个蛋白质生产批次绘制了相对于掺入的clpb肽产物的宿主细胞蛋白质的总ppm(图3a)。hi-3方法的定量测量具有82%的相对标准差。

如通过mid-3方法测量的,针对每个蛋白质生产批次绘制了宿主细胞蛋白质(hcp)的总ppm(图3b)。mid-3方法的定量测量具有16%的相对标准差。

用于计算mid-3方法的多肽量的方程式如下:

[(在高样品量加载下hcp的前3种肽产物离子的峰面积总和)/(在高样品量加载下治疗性蛋白质产物的中间3种肽产物离子的峰面积总和)]*(在高样品量加载下治疗性蛋白质产物的fmol量)*[(低样品量加载下治疗性蛋白质产物的中间3种肽产物离子的峰面积总和)/(在低样品量加载下治疗性蛋白质产物的前3种肽产物离子的峰面积总和)]。

与mid-3方法相比,使用以200fmol的clpb肽作为内标物的hi-3方法产生更高的误差。使用mid-3方法,绝对定量的再现性高得多。尽管酶促消化的差异也可能发生,但最大的可变性是由于掺入内标物。在柱上10μg的情况下,由于肽产物的中间组表现为线性,因此更适合用于定量分析。

实施例3

将mid-3定量方法应用于在纯化治疗性蛋白质过程中检测和追踪宿主细胞蛋白质

本实施例说明了将本文公开的mid-3定量方法应用于在治疗性蛋白质纯化过程中的多个阶段的污染宿主细胞蛋白质(hcp)的高通量检测和追踪,所述治疗性蛋白质包括从细胞培养收获物收集的样品至在最终脱盐方案后收集的样品。本实施例进一步说明了通过保留时间和m/z追踪hcp的肽的软件用于后期纯化样品中hcp的无标记定量的用途,以及基于光谱库的检索用于进一步改善通量和优化绝对定量的用途。

方法:

在治疗性蛋白质(蛋白质x)的基于细胞培养的生产后,从细胞培养收获物并在蛋白质纯化过程的5个阶段收集样品,包括最终药物物质样品。使用一式三份提供下游测量的统计能力,包括再现性和产量数据。收集样品后,根据制造商的说明通过3kmwcoamiconultra-15过滤器(emdmillipore)过滤收获物样品,以在变性并且与剩余样品一起消化之前浓缩和去除阻碍质谱分析的添加剂。简言之,完成amicon装置的水冲洗步骤,然后添加每个样品400μg总蛋白质或治疗性蛋白质,同时在顶部添加50mm碳酸氢铵(ambic)至15ml的总体积。随后,在最终离心步骤之前,完成15ml的50mmambic的洗涤。终浓度测量为在1.4与1.7mg/ml的总蛋白质或治疗性蛋白质之间。将来自每个样品的一式三份等分试样(来自过滤通过amicon的收获物的药物物质(ds),以及空白消化物)在50mmambic中稀释至1mg/ml,并且与rapigest(waters,用50mmambic重构至0.1%的浓度)1:1混合,产生在0.05%rapigest,50mmambic中0.5mg/ml蛋白质的最终溶液。将样品在60℃下温育15分钟,以确保蛋白质变性。在60℃下,用在50mmambic中的10mm1,4-二硫苏糖醇(dtt)(pierce)进行二硫化物的还原1小时。将样品冷却至室温,然后用在50mmambic中的20mm的2-碘乙酰胺(iaa)(pierce)烷基化并在室温下在黑暗中温育30分钟。将lys-c(promega,15μg/瓶)在50mmambic中以0.125μg/μl的浓度重构,并且以酶:底物1:50的比例添加到每个样品中。将样品在37℃下温育过夜。第二天早上,在50mmambic中以0.4μg/μl制备胰蛋白酶(promega,100μg/瓶)溶液,并且以1:25的比例添加到样品中并且在37℃下温育3小时。通过添加2.05%甲酸(emdmillipore)进行酸切割以去除rapigest。在以12,000rpm离心15分钟以沉淀切割的rapigest和任何未消化的蛋白质之前,将样品在37℃下温育30分钟。每个自动进样器小瓶均用20μg消化的样品、400fmol的hi3大肠杆菌标准品(waters)制备,并且用0.1%甲酸稀释至最终体积60μl,以用于在lc-ms上进样。

将消化的样品(在柱上30μl或10μg)注射至使用1.7μmcshc18柱(2.1mmx150,waters)的与watersxevog2-xsqtof质谱仪连接的watersacquityh-classuplc系统上进行lc-ms分析。将质谱仪设置为以灵敏度模式在50至2000的质量范围内并进行0.3秒扫描收集mse数据。所有的样品均在清洁阶段以随机顺序运行(即空白和药物物质被一起随机化并且首先运行;中间过程的柱洗脱液样品被随机化并且随后运行;以及细胞培养收获物被随机化并且最后运行)。uplc使用具有0.1%甲酸的水和乙腈(acn)作为添加剂,并且使用在30分钟内5%至40%acn的梯度,在5分钟内升至85%acn,保持2分钟,并且在3分钟内回到初始状态,并且以250μl/min的流速保持5分钟以及45分钟的总梯度时间。

在使用mse检索算法(waters)在序列数据库中进行检索之前,将ms数据文件导入到蛋白质组学软件progenesisqi(非线性动力学)中进行峰选择和前体/产物离子比对。数据库结合了治疗性蛋白质产物序列、常见的污染蛋白质、中国仓鼠uniprot数据库和每个的反向版本(共69,916个序列)。用每个肽3个片段、每个蛋白质7个片段和每个蛋白质至少2个肽的要求来鉴定具有4%或更少的fdr。使用肽评分>5和肽质量误差<10ppm进一步过滤以获得<1%的fdr。通常,肽鉴定是在最上游的过程样品,例如收获物样品中进行的,但是这并非总是如此。与蛋白质趋势不匹配的肽不包括在定量中。基于与clpb的前三种肽(hi-3)或产物的线性表现的肽(mid-3)相比的每个蛋白质的前三种肽的丰度(在所有三个注射上)来定量蛋白质,以确定在每个样品中存在的蛋白质的相对含量。

结果与讨论:

使用蛋白质组学发现软件工具对治疗性蛋白质生产混合物中相对低丰度的hcp进行分析的一个风险是,来自治疗性蛋白质的丰富离子可能被错误地鉴定为hcp。最近已经显示,丰富的蛋白质上的伪影可以以远高于诱饵率(decoyrate)的速率被错误地鉴定为其他的蛋白质(kong等,naturemethods.2017;14(5):513-520)。也有可能在蛋白质水平上正确鉴定了hcp,但是那些hcp的一些肽可能是不正确的或可能受到其他离子的干扰,因此不应将其用于定量。

本文公开的方法在整个纯化过程中都使用强度模式的正交理化特性,以过滤掉此类假阳性鉴定以及具有干扰的肽。在蛋白质组学的progenesisqi中,列出了每种肽以及鉴定评分和质量准确性,以及在整个实验中肽趋势的可视化。还显示了以m/z和保留时间显示每种肽的检测的图像,以便可以观察到其他干扰离子。具有例如观察到的干扰的肽不用于定量。

用于分析来自整个纯化过程的样品的lc-ms分析时间在约两天内完成(用于单个样品的lc-ms分析时间是约45分钟)。手动验证所有肽(包括来自hcp的肽)的鉴定需要约两周。验证后,对从治疗性蛋白质生产样品鉴定出的hcp的最终列表进行定量。如图4所示,在七个生产批次之间鉴定出常见的hcp。进行统计分析(例如主成分分析(pca))以了解纯化过程,所述统计分析提供了在纯化过程的每个步骤中去除hcp的说明。对hcp的进一步分析包括分层聚类,其对纯化过程中表现相似的蛋白质进行分组。分层聚类允许对节点进行研究,以发现在纯化过程的每个步骤中要去除的蛋白质。这些数据用于了解和优化纯化过程,以确保从最终的治疗性蛋白质产物中消除特定的hcp。通过基于例如hcp的理化特性(包括pi、分子量、疏水性、活性和免疫原性)优化纯化过程,以从治疗性蛋白质去除未充分纯化的hcp。所述软件还用于在纯化过程中自动监测hcp的存在。

在测定场合之间的hcp绝对定量的差异性最大来源是对hcp掺入的内标物的量或肽水平内标物的量,所述肽水平内标物是消化的蛋白质。掺入的内标物通常是hi-3clpb肽,其意在用于绝对定量。溶解,等分和储存标准品时要格外小心,但是由于例如操作员之间的移液差异或测定场合之间酶促消化的变化,可能会发生差异性。如本文所示,可以使用治疗性蛋白质的肽来代替使用掺入的内标物,然而,来自治疗性蛋白质的丰度最高的肽通常具有超出质谱仪动态范围的丰度,即治疗性蛋白质的丰度最高的肽可能会使质谱仪的检测器过饱和。使用丰度最高的肽方法(hi-3方法),观察到丰度最高的肽由于例如检测器饱和而具有非线性行为。相比之下,观察到称为mid-3肽的在电离分布中间的肽具有基于丰度的信号的线性行为。如本文所示,并入了mid-3肽的数据的mid-3肽方法产生较低的误差,并且在柱上高达18μg的情况下显示出线性行为。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1