用于校准质谱仪(ms)与其它仪器系统和用于处理ms与其它数据的方法

文档序号:426842阅读:747来源:国知局
专利名称:用于校准质谱仪(ms)与其它仪器系统和用于处理ms与其它数据的方法
本专利申请是2003年10月20日提交的美国专利申请序列号No.10/689,313的部分继续申请,以及要求来自该专利申请的优先权,该专利申请的整个内容在此引用以供参考。
背景技术
发明领域本发明总的涉及分析仪器领域和质谱仪(MS),更具体地,本发明涉及用于校准这样的仪器与MS仪器系统以及用于处理相应的数据的方法。
背景技术
质谱仪(MS)是有100年历史的技术,它依赖于分子的电离和分裂,分裂离子因它们的质量的扩散、以及在适当的检测器上离子裂片的正确检测。有许多方法达到这三个关键的MS处理过程中每个过程,它们产生具有不同特性的不同类型的MS仪器。
四种主要类型的电离技术通常用来把较大的分子分裂成许多较小的分子并同时电离它们,以使得它们在质量扩散之前被适当地带电。这些电离方案包括电喷射电离(ESI)、通过高能电子撞击的电子撞击电离(EI)、通过使用其它反应化合物的化学电离(CI)、和基体辅助激光解吸附和电离(MALDI)。ESI和MALDI两者也可兼用于样品引入的装置。
一旦样品中的分子通过电离被分裂和成为带电后,每个裂片将具有相应的质荷(m/z)比,它将成为质量扩散的基础。根据所使用的物理原理,有许多不同的方法来达到质量扩散,导致性质上类似的、但细节不同的质谱数据。几种通常看到的结构包括磁扇区;四极子;飞行时间(TOF);和傅立叶变换离子-回旋共振(FT ICR)。
磁扇区结构是最直截了当的技术,其中具有不同m/z比的离子在磁场中分离,并以空间上分开的各个位置离开这个场,其中它们将由一个固定的阵列的检测器单元或由一个可移动的小型检测器组来检测,该小型检测器组可以根据应用被调节来检测不同的离子。这是一种同时的结构,其中来自样品的所有的离子在空间上同时地而不是在时间上顺序地被分离。
四极子结构或许是最通用的MS结构,其中不同m/z值的离子将由一组(通常4根)平行棒通过操纵加到这些棒对上的RF/DC比值而被滤掉,只有某一m/z值的离子才能经过这些处在给定RF/DC比的棒的旅程而存活下来,导致分裂离子的顺序分离和检测。由于它的顺序特性,只需要一个检测器单元用于检测。使用离子陷阱的另一个结构可被看作为四极子MS的一个特例。
飞行时间(TOF)结构是另一个顺序扩散和检测方案,它让分裂离子在电场下加速,然后在检测前移动通过一个高真空飞行管。不同m/z值的离子在不同的时间到达检测器,而该到达时间可以通过校准标准与m/z值相关联。
在傅立叶变换离子-回旋共振(FT ICR)中,在分裂和电离后,所有的离子可被引入到离子回旋加速器,其中不同m/z值的离子被捕获并在不同的频率下共振。这些离子可以通过施加射频(RF)信号而用脉冲送出,以及离子强度作为时间的函数而在检测器上测量。在测量到时域数据的傅立叶变换后,可得到频域数据,其中频率可以通过使用校准标准而与m/z值反向关联。
离子可以直接通过使用法拉第杯检测或可以间接通过使用电子倍增管(EMT)/板(EMP)或在把离子变换成光的变换器后通过使用光子倍增管(PMT)而被检测。图5A,5B和5C是显示按照现有技术的、分别以不同的离子强度尺度110,120和130画出的典型的质谱数据轨迹作为m/z比值的函数的图。
过去100年已见证了在MS仪器方面作出的巨大的成绩,许多不同的风格的仪器得以设计和制造,用于高通过量、高分辨率和高灵敏度的工作。仪器已发展到一个阶段,其中单个离子检测可以在大多数市场上买到的、具有单位质量分辨率的MS系统上常规地完成,该分辨率允许观察来自不同的同位素的离子分裂。与硬件的精巧性成明显的反差,在系统地和有效地分析由现代MS仪器产生的大量MS数据方面进展甚微。
在典型的质谱仪上,通常要用户被要求或被提供具有覆盖感兴趣的质谱m/z范围的几种分裂离子的标准材料。受到基线影响,同位素干扰,质量分辨率,和分辨率对于质量的依赖性,几种离子裂片的峰位置或是根据质心或是通过在峰顶上拟合的低阶多项式的峰最大值而确定的。这些峰位置然后通过一阶或其它高阶多项式拟合到对于这些离子的已知的峰位置,以便校准质量(m/z)轴。
在质量轴校准后,典型的质谱数据轨迹然后要进行峰分析,其中峰(离子)被识别。这个峰检测的例行程序是高度经验性的和复合的处理过程,其中要考虑峰肩部、数据轨迹中的噪声、由于化学背景或污染引起的基线、同位素峰干扰等等。
对于识别的峰,典型地施加被称为求重心的处理过程,其中试图计算合并的峰面积和峰位置。由于上述的许多干扰因素以及在存在其它峰和/或基线时确定峰面积时的固有的困难,这是一种受到许多可调节的参数困扰的处理过程,它可以使得同位素峰出现或消失,对求重心的质量没有客观的度量。现在将给出传统的处理质谱数据方法的许多缺点的某些方面的说明。
一个缺点是缺乏质量精度。当前所使用的质量校准通常在传统的具有单位质量分辨率(观察到主要的同位素峰存在与否的能力)的MS系统上不提供优于0.1amu(m/z单位)的质量确定精度。为了达到更高的质量精度和减小在诸如用于蛋白质识别的肽映射那样的分子独特标志方面的模糊性,必须转换到以高得多的成本得到的、具有更高分辨率的MS系统,诸如四极子TOF(qTOF)或FT ICR MS。
另一个缺点是大的峰积分误差。由于质谱峰形状、它的可变性、同位素峰、基线和其它背景信号和随机噪声的影响,当前的峰面积积分不论对强的或弱的质谱峰都具有大的误差(系统误差和随机误差两者都有)。
再一个缺点包括在同位素峰方面的困难。当前的方案没有分离来自各种同位素的影响的良好的方法,这些同位素在传统的、具有单位质量分辨率的MS系统上会给出局部重叠的质谱峰。所使用的经验性方法或者忽略来自相邻的同位素峰的贡献,或者过分估计它们,导致对于占优势同位素峰的误差和对于弱同位素峰的大的偏差或甚至完全忽略较弱的峰。当涉及到多电荷的离子时,由于这时在相邻的同位素峰之间的m/z质量单位方面减小了的分离,情形甚至变得更坏。
又一个缺点是非线性运算。当前的方案使用在每阶段期间具有许多按经验而调节的参数的多阶段不连贯的处理过程。系统误差(偏差)在每个阶段都生成,并且以不可控制的、不可预测的、和非线性的方式向下传播到后一阶段,使得算法不可能报告有意义的统计结果作为数据处理质量和可靠度的度量。
再一个缺点是处于支配地位的系统误差。在大多数MS应用中,其范围从工业处理控制和环境监视延伸到识别蛋白质或发现生物标记,仪器灵敏度或检测极限一直是焦点,并且在许多仪器系统中花费很大力气来减小仪器误差或信号中噪声的影响。不幸地,当前使用的峰处理方案常常产生甚至大于原始数据中的随机噪声的系统误差源,因此变为仪器灵敏度的限制因素。
另外的缺点是数学和统计上的不一致性。当前使用的许多经验方法使得整个质谱峰处理在数学上或统计上不一致。峰处理的结果在不具有任何随机噪声的稍微不同的数据或在具有稍微不同的噪声的相同的合成数据上会有极大的改变。换句话说,峰处理的结果是不鲁棒的,以及根据特定的实验或数据收集而可以是不稳定的。
而且,另一个缺点是随各个仪器不同而带来的变化。由于机械的、电磁的、或环境偏差的变化,通常很难直接比较来自不同MS仪器的原始质谱数据。通过被施加到原始数据的当前的特定的峰处理,它只是对在不同测量时间来自不同MS仪器或相同仪器的结果进行定量比较时增加了困难。另一方面,对于直接的连续质谱数据或来自仪器在不同的时间、不同的仪器、或不同的类型的仪器的峰处理结果进行比较的要求,在杂质检测和通过在建立的MS库中的计算机搜索进行蛋白质识别方面变得越来越高。对于在蛋白质、代谢物或脂肪中发现生物标记(在那里,来自不同样品组的质谱数据要互相进行比较以供差异性分析),则存在甚至更大的需要。
因此,克服现有技术的上述的缺陷和缺点的、用于校准质谱(MS)仪系统和用于处理MS数据的方法是理想的和高度有利的。
发明概要上述的问题以及现有技术的其它有关的问题通过本发明的用于校准质谱仪(MS)和其它仪器系统以及用于处理MS和其它数据的方法而被解决。
按照本发明的一个方面,提供了为了得到用于质谱(MS)仪系统的至少一个校准滤波器的方法。对于给定的校准标准,得到在质谱范围中测量的同位素峰集群数据。对于给定的校准标准,计算相对同位素丰度和相应于该丰度的同位素的实际的质量位置。规定其中心处在相应的质谱范围内的质谱目标峰形状函数。在计算的相对同位素丰度与质谱目标峰形状函数之间执行卷积运算,以形成计算出的同位素峰集群数据。在测量的同位素峰集群数据与在卷积运算后计算出的同位素峰集群数据之间执行去卷积运算,以得到至少一个校准滤波器。
按照本发明的另一个方面,提供了一种处理原始质谱数据的方法。把一个总的滤波矩阵施加到原始质谱数据,以得到校准的质谱数据。总的滤波矩阵是通过在质谱范围中为给定的校准标准所得到的测量的同位素峰集群数据而形成的。总的滤波矩阵是还通过为相同的校准标准所计算的相对同位素丰度和相应于该丰度的同位素的实际的质量位置而形成的。总的滤波矩阵是还通过其中心处在质谱范围内的、被规定的质谱目标峰形状函数而形成的。总的滤波矩阵是还通过在计算的相对同位素丰度与质谱目标峰形状函数之间执行卷积运算以形成计算出的同位素峰集群数据而形成的。总的滤波矩阵是还通过在测量的同位素峰集群数据与在卷积运算后计算出的同位素峰集群数据之间执行去卷积运算以得到用于总的滤波矩阵的至少一个校准滤波器而形成的。
按照本发明的又一个方面,提供一种用于分析相应于从质谱(MS)仪系统得到的质谱数据的质谱峰的方法。加权的回归运算被施加到处在质谱范围内的质谱峰。回归系数被报告作为积分的峰面积和相应于标称质量和估计的实际的质量之一的质量偏差中的一项。
按照本发明的再一个方面,提供一种用于计算用于质谱(MS)仪系统的校准滤波器的方法。从给定的校准标准得到至少一个质谱峰形状函数。规定其中心处在各个质谱范围内各中间点的质谱目标峰形状函数。在得到的至少一个质谱峰形状函数与质谱目标峰形状函数之间执行去卷积运算。根据去卷积运算的结果计算至少一个校准滤波器。
按照本发明的再一个方面,提供一种处理原始质谱数据的方法。把总的滤波矩阵施加到原始质谱数据,以得到校准的质谱数据。总的滤波矩阵是通过从给定的校准标准得到至少一个质谱峰形状函数而形成的。总的滤波矩阵是另外通过规定其中心处在各个质谱范围内的各中间点的质谱目标峰形状函数而被形成的。总的滤波矩阵是另外通过在得到的至少一个质谱峰形状函数与质谱目标峰形状函数之间执行去卷积运算而被形成。总的滤波矩阵是另外通过从去卷积运算的结果计算至少一个校准滤波器而被形成的。
按照本发明的再一个方面,提供一种更新总的滤波矩阵的方法。把总的滤波矩阵施加到包含至少一个内部标准的原始质谱数据,以得到校准的质谱数据。通过应用前述的校准过程使用校准的质谱数据作为输入和其中所包含的至少一个内部标准作为标准而形成新的总的滤波矩阵。通过把两个总的滤波矩阵相乘或通过卷积两个滤波器而形成更新的总的滤波矩阵,并且将其施加到这个和其它原始质谱数据,以得到外部和内部校准的质谱数据。
该方法还包括通过在检测之前使用在线和离线混合之一,引入要被测量的内部校准标准与样品。内部校准标准可以是样品的预先存在的成分。内部校准过程可以包括执行以上阐述的方法的各个步骤。
本发明还是对在各个位置范围内包含峰的数据轨迹中的峰宽度进行归一化的方法,该方法的步骤包括测量峰宽度作为一个峰位置的函数以得到峰宽度的测量值;对测量值进行最小二乘拟合,以确定函数;以及在该范围内对函数的数学的逆进行积分以得到能用于对峰宽度进行归一化的变换函数。峰宽度的测量是基于对已知标准进行的测量。函数被使用来归一化峰宽度。函数的逆可以是函数的倒数。在积分时定义的常数在得到变换函数时被丢弃。如果谱是来自液体色谱法四极子飞行时间质谱仪的质谱,则函数可以包含至少一个对数运算。如果谱是来自傅立叶变换的质谱,则函数可以是对数函数。如果谱是来自飞行时间质谱仪的质谱,则函数可以是平方根函数。如果谱是来自气体色谱法质谱仪的质谱,则函数可以包含对数函数。如果谱是来自基体辅助的激光解吸附和电离飞行时间质谱仪的质谱,则函数可以是倒数函数。
按照本发明的再一个方面,本发明是一种针对用于校准来自包含多个成分的样品的数据而不用给样品施加上内部标准的方法,该方法的步骤包括选择数据中至少一个峰以作为标准;根据该至少一个选择的峰导出校准滤波器;和使用校准滤波器来分析数据中的其它峰,以便产生校准的数据。该选择可包括选择一个以上的峰,以及该导出可包括导出用于每个选择的峰的校准滤波器,和进行内插以产生至少一个附加校准滤波器和在选择的峰之间的位置处用于分析的峰之一。在产生校准滤波器时,至少一个选择的峰可以用比起原先的峰相对不重要的宽度的已知的函数进行卷积。校准的数据可以被统计分析,以便对测试样品进行定量、识别和分类中的至少一项。上述的各种方法可以结合本发明的这个方面一起使用。
本发明也是针对用于实践以上阐述的方法的某些方面的分析仪器系统的,以及具体地,针对许多各种各样的所有的类型的质谱仪,它们被配置成利用至少一项这里阐述的方法。
按照本发明的再一个实施例,数据存储媒体可在其上包含计算机可执行的指令,用于使得与分析仪器系统相关联的计算机执行以上阐述的方法的某些方面,以及特别地,使得许多各种各样的所有的类型的质谱仪中的一个或多个质谱仪执行至少一项这里阐述的方法。
通过结合附图阅读的以下的优选实施例的详细说明,将明白本发明的这些和其它方面、特性和优点。
附图简述

图1是按照本发明的包括质谱仪的分析系统的框图。
图2是具有一维样品分离的系统和多通道检测器的框图。
图3是具有二维样品分离的系统和单通道检测器的框图。
图4是执行仪器校准的方式的非常高级别流程图。
图5A,5B和5C是显示按照现有技术分别以不同的离子强度尺度110,120和130作为m/z比值的函数而画出的典型的质谱数据轨迹的图。
图6A和6B是显示在两个不同的强度标度上对于离子裂片C3F3的质谱峰数据的图。
图7A和7B是分别显示按照本发明的说明性实施例在预卷积之前和之后测量的同位素集群310的图。
图7C和7D是分别显示按照本发明的说明性实施例的、在预卷积之前和之后计算的同位素集群320的图。
图7E和7F是分别显示按照本发明的说明性实施例的、如此计算而得到的峰形状函数330和相应的去卷积残差340的图。
图8是显示按照本发明的说明性实施例的、示例性的去卷积的峰形状函数410的图。
图9是显示按照本发明的说明性实施例的、基于图8的去卷积的峰形状函数410的示例性内插峰形状函数510的图。
图10是显示按照本发明的说明性实施例的、对于质谱仪校准是优选的两个示例性目标610,620的图。
图11是显示按照本发明的说明性实施例的、对于一组质量的计算的校准滤波器的集合710的图。
图12是显示按照本发明的说明性实施例的、与内插和质量预对准相组合的滤波器矩阵应用的图形表示800的图。
图13是可执行外部和内部仪器校准的方式的非常高级别流程图。
图14A,14B和14C是显示按照本发明的说明性实施例的、在完全校准之前和之后质谱仪(MS)质谱的第一分段910和第二分段920(图14A和14B)与方差谱930(图14C)的图。
图15A是包含来自不同于质谱仪的仪器的含噪声的数据轨迹;图15B显示在把校准滤波器施加到图15A的数据轨迹后的校准的数据轨迹;图15C显示图15B的数据的峰分析的部分结果,其中用竖线表示所有的峰位置和峰面积。
图16A是显示按照本发明的说明性实施例的、反映t统计作为对于在质量范围内可能的质谱峰(根据图5确定的原始质谱)的精确质量位置的函数(公式10)的竖线质谱1010的图。
图16B和16C是显示按照本发明的说明性实施例的、原始MS谱分段的重叠1020和它的充分校准的版本1030的图。
图16D是显示按照本发明的说明性实施例的、相应的t统计1040和具有在12处的关键t值的水平截止线1050的图。
图17是显示按照本发明的说明性实施例的、用于操作质谱(MS)仪系统的方法的图。
图18是进一步显示按照本发明的说明性实施例的、图17的方法的步骤110H的图。
图19是显示按照本发明的说明性实施例的、用于分析在完全的质谱校准后从MS仪系统得到的质谱仪(MS)质谱的方法的图。
图20是显示按照本发明的说明性实施例的、用于分析在确定峰形状函数后从MS仪系统得到的质谱仪(MS)质谱的方法的图。
图21是进一步显示按照本发明的说明性实施例的、包括用于校准质谱仪(MS)系统的任选的步骤的图17的方法的图;以及图22是显示按照本发明的说明性实施例的、用于处理从MS仪系统得到的质谱仪(MS)质谱的方法的图。
发明详细说明本发明在主要针对用于校准质谱(MS)仪系统和用于处理MS数据的方法。正如下面指出的,本发明的某些方面在校准其它类型的仪器可以是非常有用的。
应当看到,本发明可以以各种不同的形式的硬件、软件、固件、专用处理器、和它们的组合被实施。优选地,本发明以硬件和软件的组合被实施。而且,软件优选地被实施为明确地体现在程序存储装置上的应用程序。应用程序可被上载到包括适当结构的机器和被该机器执行。优选地,机器在具有诸如一个或多个中央处理单元(CPU)、随机存取存储器(RAM)和输入/输出(I/O)接口的硬件的计算机平台上被实施。计算机平台还包括操作系统和微指令代码。这里描述的各种不同的处理和功能可以是微指令代码的一部分或是经由操作系统执行的应用程序的一部分(或它们的组合)。另外,各种其它的外围设备可被连接到计算机平台,诸如附加数据存储装置和打印装置。
还应当指出,因为在附图上描绘的某些构成系统的部件和方法步骤优选地以软件来实施,在系统部件(或处理步骤)之间的实际的连接可能是不同的,这要取决于本发明被编程的方式。在给出了这里的教导后,本领域技术人员将能够设想本发明的这些和类似的实施方案和结构。
现在参照图1、图2和图3描述其中可以使用本发明的典型的系统。
参照图1,图上显示如上所述的、可用来分析蛋白质或其它分子的、引用本发明的特性的分析系统10的框图。虽然本发明是参照如图所示的单个实施例描述的,但应当看到,本发明可以以实施例的许多替换的形式被实施。另外,可以使用任何适当类型的部件。分析系统10具有样品准备部分12、质谱仪部分14、数据分析系统16、和计算机系统18。样品准备部分12可包括用来引入包含感兴趣的分子的样品到系统10的样品引入单元20,诸如由美国,Waltham,MA的ThermoElectron Corporation制造的Finnegan LCQ Deca XP Max。样品准备部分12还可包括分析物分离单元22,它被使用来执行要被系统10分析的、诸如蛋白质那样的分析物的初步分离。分析物分离单元22可以是用于液体或气体色谱分离的色谱塔的任一项,诸如由Bio-RadLabolatories,Inc.,Hercules,CA制造的凝胶分离单元,这在技术上是熟知的。通常,把电压或PH梯度加到凝胶上,使得诸如蛋白质的分子被分离为一个变量的函数,诸如通过毛细管的迁移速度(分子量,MW)和用于一维分离的等电位聚焦点(Hannesh,S.M.,Electrophoresis 21,1202-1209(2000)),或通过一个以上的这些变量,诸如通过等电位聚焦和通过MW(二维分离)。后者的例子被称为SDS-PAGE。
质谱仪部分14可以是传统的质谱仪以及可以是任何一个可得到的质谱仪,但优选地是MALDI-TOF、四极子MS、离子阱MS、或FTICR-MS的任一种、或某些组合,诸如qTOF或三阶段四极子(TSQ)。如果它具有MALDI或电喷雾电离离子源,则这样的离子源也可以提供样品输入到质谱仪部分14。通常,质谱仪部分14可包括离子源24;质谱分析仪26,用于分离由离子源24通过质量-电荷比(或简单地称为质量)生成的离子;离子检测部分28,用于检测来自质谱分析仪26的离子;以及真空系统30,用于保持使质谱仪部分14有效操作的足够的真空。如果质谱仪部分14是离子迁移率谱仪,则通常不需要真空系统。
数据分析系统16包括数据采集部分32,它可包括一个或一系列模拟-数字转换器(未示出),用于把来自离子检测器部分28的信号转换成数字数据。这个数字数据被提供到实时数据处理部分34,它通过诸如相加和/或取平均那样的操作来处理数字数据。后处理部分36可用来进行来自实时数据处理部分34的数据的附加处理,包括数据库搜索、数据存储、和数据报告。
计算机系统18提供按下面描述的方式对样品准备部分12、质谱仪部分14、和数据分析系统16的控制。计算机系统18可具有传统的计算机监视器40,允许在适当的显示屏幕上输入数据和显示所执行的分析的结果。计算机系统18可以是用例如Windows或UNIX操作系统或任何其它适当的操作系统操作的基于任何适当的个人计算机。计算机系统18典型地具有硬盘驱动器42,在其上存储着操作系统和在下面描述的用于执行数据分析的程序。用于接受CD或软盘的驱动器44用来把按照本发明的程序装载到计算机系统18。用于控制样品准备部分12和质谱仪部分14的程序典型地被下载作为用于系统10的这些部分的固件。数据分析系统16可以是以诸如C++,JAVA或Visual Basic的几种编程语言书写的、用来实施下面讨论的处理步骤的程序。
图2是分析系统50的框图,其中样品准备部分12包括样品引入单元20和一维样品分离设备52。作为例子,设备52可以是一维电泳设备。分离样品成分由诸如,例如一系列紫外线传感器或质谱仪那样的多通道检测设备54分析。下面讨论进行数据分析的方式。
图3是分析系统60的框图,其中样品准备部分12包括样品引入单元20、第一维样品分离设备62和第二维样品分离设备64。作为例子,第一维样品分离设备62和第二维样品分离设备64可以是两个接连的和不同的液体色谱单元,或可以被合并为二维电泳设备。分离的样品成分由诸如,例如具有245nm带通滤波器的紫外线(UV)传感器或灰度凝胶成像器那样的单通道检测设备66分析。再次地,下面讨论进行数据分析的方式。
参照图4,通常按照本发明,在70处,获取原始数据。在72处,执行成为更适当的坐标系统的前向变换,以便补偿作为峰位置的函数的峰宽度的变化。然后,按照本发明执行分布和峰位置校准74,正如下面详细阐述的。在76处,执行数据的后向变换,把数据变换回原先的坐标系统,结果是在78处的经校准的数据。
现在描述处理质谱仪数据的新颖的方法,它把质谱仪校准和质谱峰分析组合成一个完全校准处理过程,以解决以上讨论的所有的问题。在质量和峰形状两方面的适当的和精确的质谱仪校准将提供用于在下一个阶段的质谱数据分析期间的精确的峰识别、分析物定量、和样品分类的坚实的基础。
现在描述按照本发明的说明性实施例的质谱校准。质谱校准的说明将包括以下有关内容的说明质谱校准标准;相对同位素丰度的计算;质量预对准;质谱峰形状函数;峰形状函数内插;校准滤波器和它们的内插;校准滤波器的应用;和通过校准滤波器的误差传播。
不是在不考虑质谱峰形状和梯度质量依赖性的情况下只校准质量,而是将执行包括所有的这些项的全面的校准作为总的处理过程的一部分。在这个全面的校准处理过程中有几个关键的步骤,将在下面详细地讨论。
现在描述按照本发明的说明性实施例的质谱校准。把质量裂片分布在整个质量范围的校准标准被选择来提供质量校准和质谱峰形状两方面信息。由于在形成标准分子的元素中存在自然出现的同位素,典型地,对于同一个离子裂片可以观察到以不同丰度的多个同位素峰。
在气体色谱-质谱中通常使用的标准是全氟三丁胺(分子式C12F27N,分子量671)。它具有在69,100,119,131,169,219,264,364、414,464,502等处的EI裂片(对于示例的谱,见图5)。这个标准典型地被嵌入市面上销售的GC/MS仪器,以使得在校准时分子可以容易地蒸发和通过计算机控制的阀门扩散到MS系统。
在各种各样的电离方案下的其它标准包括聚合物和合成肽,它们可被分裂成覆盖感兴趣的质量范围的、多个被很好地表征的离子裂片。在其中实行第二分裂的级联的MS系统中,例如,由于在这个二次分裂期间(这是用于肽排序的熟知的处理过程)接连的氨基酸的损失,可以得到具有来自母本肽离子的有规则地间隔的质谱峰的质谱。在ESI模式中许多完整无缺的肽将载送多个电荷(z),有时从1到10个或更多,它们将生成覆盖高达一个数量级大小的或更多的质量(m/z)范围的质谱峰。
现在描述按照本发明的说明性实施例的相对同位素丰度的计算。对于不提供在不同的同位素峰之间的完全质量分离的质谱仪,必须首先计算相对同位素丰度和它们的精确的质量位置。图6A和6B显示在同位素峰之间的这种受限的质量分离。几种公布的方法可用来根据元素组成、包含在离子分离中的元素的已知的相对丰度、和电荷进行这种理论计算。这些方法的某些方法由Alan Rockwood,in Anal.Chem.,1995,67,2699和由James Yergey,Int.J.Mass Spec. & Ion.Physics,1983,52,237描述,这两个文献的公开内容在此引用以供参考。
对于具有AaBbCcDd......形式的离子裂片,同位素分布被给出为
(∑aiAi)a(∑biBi)b(∑ciCi)c(∑diDi)d...
其中a,b,c,d...分别是原子A,B,C,D...的数目,以及其中ai,bi,ci,di,...分别是同位素Ai,Bi,Ci,Di,...的自然丰度。这个表示式可被展开和被重新组织以给出所有的预期的同位素的质量位置和丰度。例如,对于图2A和2B上的离子裂片,已经知道,它具有为1的电荷和为C3F5的元素组分,C和F的自然丰度由下式给出C12=12.000000,c12=0.9893C13=13.003354,c13=0.0107F19=18.998403,f19=1.0000因此,这个离子裂片的同位素质量(m)和相对丰度(y)可被计算为m=3C12+5F192C12+C13+5F19C12+2C13+5F193C13+5F19=130.992015131.995369132.998723134.002077]]>y=c1233c13c1223c132c12c133=9.6824×10-13.1417×10-23.3979×10-41.2250×10-6]]>这样的峰信息(质量位置和相对丰度)以后将用于质谱数据的精确的和完全的校准。
现在描述按照本发明的说明性实施例的质量预对准。为了在下一个步骤进行更精确的峰形状内插,首先必须根据在谱上的可识别的同位素峰集群来预对准或预校准质量标准谱。对于所识别的每个同位素峰集群,质心被计算为如下
m0=y0Tm0y0Tl]]>其中y0是对于所考虑的同位素集群的、包含实际上测量的质谱连续谱数据的列向量,以及上标T表示转置,即包含与列版本相同的元素的行向量,m0是相应于在其上测量同位素集群的质量轴的列向量(可以具有质量单位或时间单位),以及l是具有与m0或y0相同长度的全一的列向量。类似地,另一个质心根据算出的同位素分布被计算为如下m=yTmyTl]]>因此,通过在测得的质心与使用在质量范围内可提供的所有的明显可识别的同位素集群所算出的重心之间的最小二乘线性或非线性拟合,可以建立以下形式的校准关系式m=f(m0)(公式1)请再次注意,m0不一定必须以质量单位计,而可以是任何物理单位,其离子强度被测量为它的函数。在FTMS和TOF中,m0自然以时间单位计,以及在多项式拟合中一阶和二阶的项对于FTMS和TOF分别成为主要的。
在由于存在化学噪声或其它粒子(诸如中性粒子),在包含很大的背景信号的MS系统中,只使用在感兴趣的质谱峰之前和之后所收集的数据来拟合较低阶基线和从y0中减去这个基线的影响以便更精确地确定重心m0可能是有利的。然而,后面将会看到,由于改进是通过完全校准滤波器达到的,在这个阶段进行绝对质量校准不是关键的。
现在描述按照本发明的说明性实施例的质谱峰形状函数。对于诸如图6A和6B所示的那样所识别的每个质谱峰集群(包括所有的重要的同位素峰),在这个质量下的质谱峰形状函数可以通过以下的去卷积而得出
y0=yp其中y0是实际测量的同位素峰集群,y是对于围绕这个质量的特定的离子分离的理论计算的同位素分布,以及p是要计算的峰形状函数。虽然y0是在给定的质量窗口上连续采样的实际测量的质谱并且可以通过内插容易地变换到等间隔的质量间隔,但理论计算的同位素分布只被定义在离散的和不规则间隔的质量上,诸如以上显示的(m,y)。
使得这种去卷积成为可能的关键步骤是在去卷积之前对于y0和y进行窄高斯峰的数字卷积,即,(gy0)=(gy)p或y0′=y′p(公式2)这种预卷积允许在同样的相等间隔的质量间隔上连续采样y0和y。为了使得通过这种预卷积的噪声传播最小化,重要的是使用高斯峰,其峰宽度比起单独的同位素峰的FWHM小几倍(例如4倍)。图7A和7B是分别显示按照本发明的示例性实施例的、在预卷积之前和之后测量的同位素集群310。图7C和7D是分别显示按照本发明的示例性实施例的、在预卷积之前和之后计算的同位素集群320。预卷积可以通过矩阵乘法或具有零填充的快速傅立叶变换(FFT)完成,它们在公开的文献中有很好地描述,例如,William Press等,“Numerical Recipesin C”(用C的数值方法),2ndEd,1992,Cambridge UniversityPress,p.537,它的整个公开内容在此引用以供参考。
类似于预卷积,从y0’的对y’的去卷积以得到峰函数p可以通过矩阵求逆或FFT除法而完成。由于矩阵的结合(banded)的特性,有效的计算算法从用于矩阵求逆的公开的文献是可得到的。这样的算法由Gene Golub等在Matrix Computations(矩阵计算),1989,JohnsHopkins University Press,p.149中进一步描述,它的整个公开内容在此引用以供参考。替换地,有效的去卷积也可通过FFT除法实行。在任一情形下,在该处要具有适当的噪声滤波以便在去卷积期间控制噪声传播是关键的。这可以通过以下方法完成在求逆之前在矩阵方法中丢弃小的奇异值,或每当遇到要用很小的数作除法时用内插值替代FFT除法的实部和虚部。小的奇异值的丢弃由Yongdong Wang等在anal.Chem.,1991,63,2750中和由Bruce Kowalski等在J.Chemometries,1991,5,129中进一步描述,二者的公开内容在此引用以供参考。图7E和7F是分别显示按照本发明的示例性实施例的、这样计算而得到的峰形状函数330和相应的去卷积残数340。希望在去卷积期间进行适当的噪声滤波,以使得在去卷积后的残差具有随机特性,其幅度与在测量的数据y0中预期的噪声电平是可相比较的。
在由于存在化学噪声或其它粒子,诸如中性粒子,因而包含很大的背景信号的MS系统中,只使用在感兴趣的质谱峰之前和之后的收集的数据来拟合较低阶基线和在预卷积之前从y0中减去这个基线的影响可能是有利的。这种基线校正的目的是保证来自实际测量的基线与理论计算的基线相匹配。
现在描述按照本发明的说明性实施例的峰形状函数的内插。几个其它峰形状函数可以从在来自相同的标准样品的质谱的质谱峰范围内其它很好表征的离子裂片类似地被计算。图8是显示按照本发明的说明性实施例的、示例性去卷积的峰形状函数410的图。为了得到对于在质谱范围内的感兴趣的所有的其它质量的峰形状函数,需要在几个计算的峰形状函数的内插。设计了也允许进行噪声滤波的、有效的内插算法。代替在原先的质谱空间上的内插,这几个可得到的质量峰形状函数将收集在首先通过奇异值分解(SVD)被分解的矩阵P中,P=USVT其中P是其峰形状函数排列成行的峰形状函数矩阵,U在它的列中含有左奇异向量,S是在其对角线上有递减的奇异值的对角线矩阵,以及V在它的列中包含右奇异向量。SVD算法由Gene Golub等在MatrixComputations(矩阵运算),1989,Johns Hopkins University Press,p.427中进一步描述,它的整个公开内容在此引用以供参考。通常,仅仅几个(诸如3到4)奇异值/向量是重要的,这取决于作为质量函数的峰形状函数的一致性。例如,如果所有的峰形状函数是完全相同的且它们之间只有很少的质量偏移,则可以预期只有两个重要的奇异值/向量。如果所有的峰形状函数是互相完全相同且没有质量偏移,则可以预期只有一个奇异值/向量。这说明为什么以上需要预对准步骤以便导致牵涉到最小数目的奇异值/向量的更经济的分解和内插。
当左奇异向量的元素对于质量作图时,预期要对质量有平滑的相关性,对于精确的内插有可修正的功能的相关性。三次样条内插可以容易地施加到矩阵U的头几列,以便得到具有更多行数的扩展矩阵U,它们覆盖全部质谱范围。包含内插峰形状函数的扩展的峰形状函数矩阵P可以经由下式容易地构建P=USVT其中在P中的每行包含在任何内插的质量质心处的一个峰形状函数。图9是显示按照本发明的说明性实施例的、基于图8的去卷积的峰形状函数410的示例性内插峰形状函数510的图。
应当指出,这里的SVD分解可以用诸如小波分解这样的其它分解替代,以不同的计算花费达到类似的结果。
现在描述按照本发明的说明性实施例的校准滤波器和它们的内插。根据得到的峰形状函数,MS仪器系统现在完全是用它的质量轴和它的峰形状函数来表征的。根据这种表征,现在可以执行完全的质谱校准。这种校准可以以单个操作来实行,其中在不同的质量处的峰形状函数将被变换成以精确的质量位置为中心的更理想的峰形状函数(目标峰形状函数)。虽然在原理上任何以分析或以数字计算的峰形状函数可以用作为目标峰形状函数,但希望具有以下特性的目标平滑的峰函数和导数(为了数值稳定性);可分析地计算的函数和导数(为了计算有效性);对称的非峰形状(为了在以后的峰检测中精确的质量确定);与真实的质谱峰形状相像(为了简化的校准滤波器);峰宽度(FWHM)稍微大于实际测量的峰宽度(为了计算稳定性和信号平均)。
图10是显示按照本发明的说明性实施例的、满足对于质谱仪校准的优选的要求的两个示例性目标610,620的图。两个示例性目标610,620满足以上描述的要求。两个示例性目标610,620分别是高斯函数以及高斯函数与矩形函数的卷积。
对于在给定的质心质量处的每个峰形状函数p,校准滤波器f可被找到以使得
t=pf (公式3)其中t是以这个给定的质量为中心的目标峰形状函数。这个卷积实际上把数字计算的峰形状函数p变换成以这个精确的质量位置为中心的、数学上确定的峰形状函数,在一次卷积运算中同时完成质量和峰形状两者的校准。校准滤波器f的计算可以通过矩阵求逆或具有适当地内置的噪声滤波的FFT除法,以与峰形状函数的去卷积类似的方式实行。图11是显示按照本发明的说明性实施例的、为一组质量而计算的校准滤波器的集合710的图。
可以看到,校准滤波器随质量平滑地变化,类似于峰形状函数。由于内插比起去卷积运算在计算上通常是更有效的,所以在整个范围以粗间隔的质量计算校准滤波器(例如,以每1-5amu间隔),然后把校准滤波器内插到细间隔的网格(例如,1/8或1/16amu),在计算上是有利的。对于峰形状函数的内插,可以应用上述的相同的方法。
替换地,可以全部回避公式2中峰形状函数的计算,而把公式2和3组合成单个步骤的处理过程(ty)=y0f其中在多个标准质量处的卷积滤波器f可以用矩阵求逆或FFT除法直接计算。这些卷积滤波器的内插将产生在特定的质量处的想要的滤波器(图11)。
应当指出,这里计算的校准滤波器同时有两个用途质谱峰形状和质谱峰位置的校准。由于质量轴已在上面被预校准,滤波器函数的质量校准部分在这种情形下被缩减以达到质量校准的进一步改进,即计及在由公式1给出的最小二乘拟合后的任何残余质量误差。
这种完全校准处理过程对于包括离子阱的四极子型MS很适用,其中质谱峰宽度(在半最大值处的全部宽度或FWHM)在工作的质量范围内预期会大体一致。对于诸如磁扇形、TOF、或FTMS的其它类型的质谱仪系统,质谱峰形状预期将按照由工作原理和/或特定的仪器设计所规定的关系随质量而变化。虽然至今描述的同一个依赖于质量的校准程序过程仍旧是可用的,但最好是在峰宽度与质量/位置之间的给定关系是一致的变换的数据空间中执行完全校准。
在TOF的情形下,可以知道质谱峰宽度(FWHM)Δm与质量(m)之间存在以下关系Δm=am]]>其中a是已知的校准系数。换句话说,在质量范围内测量的峰宽度随质量的平方根而增加。通过平方根变换,把质量轴变换成新的函数如下m′=m]]>其中在变换的质量轴上测量的峰宽度(FWHM)被给出为Δm2m=a2]]>它在质谱范围内保持不变。
对于FT MS仪器,另一方面,峰宽度(FWHM)Δm正比于质量m,所以,需要对数变换m′=ln(m)其中在变换的对数空间中测量的峰宽度(FWHM)被给出为ln(m+Δmm)=ln(1+Δmm)≈Δmm]]>它是固定的,与质量无关。典型地在FTMS中,Δm/m可以以10-5的量级被处理,即对于分辨能力m/Δm为105。
对于磁扇仪器,取决于具体的设计,质谱峰宽度和质量采样间隔通常遵循对质量的已知的数学关系,这可以适用于变换的特定形式,通过该变换,预期的质谱峰宽度变为与质量无关,很像对TOF和TFMS进行的平方根和对数变换的方式。
虽然以上讨论的变换对提供增强的校准大大有助,但希望具有更普遍的变换形式以便用于所有的仪器。这是因为例如平方根变换只有有限的可应用性,而为了执行有效的计算,对数变换往往使得在低质量处的峰变得太宽,而在高质量处的峰变得太窄。
按照包括上述更具体方法的这个更一般的技术,第一步骤是通过测量标准或标准混合物而测量峰宽度作为质量的函数,根据它们可以在感兴趣的质量范围上观察到多个明确定位的峰。这个标准可以与在质谱仪校准中所用的标准是相同的。在诸如单位质量分辨率或更低分辨率这样的中等分辨率质谱仪的情形下,必须进行上述的去卷积处理过程,在测量峰宽度之前使用同位素丰度计算来达到峰形状函数。
标准的例子可包括肽混合物;蛋白质混合物;或聚合物,诸如PPG或PEG或聚丙氨酸(氨基酸),它们根据多个单体组合形成在高达2000amu的非常大的质量范围上具有71amu间隔的峰范围。在高分辨率系统上,同位素的分布比起仪器峰形状函数变得更重要。例如,在qTOF质谱仪系统上,在单一同位素峰与来自其它同位素的峰之间的可以有足够的间隔,这样,可以直接读出在测量的单一同位素峰以外的仪器峰形状函数而不用进行牵涉到同位素分布的去卷积处理过程。在具有低质量分辨率MS系统,诸如来自Fremont,CA的Ciphegen Biosystems的SELDI PBSII系统,标称地以一个质量单位间隔(单电荷)或1/z质量单位间隔(多电荷z)出现的同位素分布,在高的质量处变为如此不重要,以致可以把观察的质谱峰作为仅仅来自仪器峰形状函数来处理,因此消除了上述的去卷积步骤。
在质谱仪上观察到的峰宽度由质量分析仪(诸如在TOF MS中的飞行管)本身对电离源(进到TOF MS的管道的离子能量的变化导致离开管道的时间变化,或在四极子MS中,进到四极子的离子能量的变化导致离开四极子的离子的空间和/或时间分布)、气体或液体样品进到电离源的流速率等等施加影响。在TOF MS的情形下,当考虑到所有的影响因素时,由飞行管道单独引起的峰宽度的平方根相关性被转为在原始数据中观察到的更一般的二次关系。
对观察到的峰宽度(Δm)对质量(m)的最小二乘拟合可得出峰宽度作为质量的函数Δm(m)的分析表示式。当峰宽度对质量有强烈依赖性时,最好通过某个函数f(m)变换质量轴,以使得在变换轴f(m)上观察的峰宽度(例如,在半最大值处的全部宽度或FWHM)变为在整个质量范围内是恒定的,f(m1)-f(m0)=f(m0+Δm)-f(m0)=常数通过台劳级数展开和其它导数,以上的关系可被变换成 dfdmΔm=d]]>dfdm=dΔm]]>f(m)=∫dΔm(m)dm∝∫1Δm(m)dm]]>其中积分是在质量的整个范围上进行的,以及其中常数d和积分常数被忽略而不影响变换的用途。
在LC qTOF MS仪器的情形下,存在以下形式的二次关系式Δm=am2+bm+c按照以上的积分的变换被给出为f(m)∝ln|m-r1m-r2|]]>其中r1和r2是以上给出的二次方程式形式的两个根。在例如由Waters MicroMass制造的qTOF II仪器的更具体的情形下,发现了峰宽度与质量有以下的关系Δm=3.53e-8m2+1.35e-4m+1.32e-2这里r1,2=[-100-3724]
所以,具有以下形式的变换f(m)∝ln(m+100m+3724)]]>变换的某些其它例子FTMSΔm∝m,f(m)∝ln(m)TOF分析仪部分(没有考虑流和样品情形)Δm∝m,f(m)∝m]]>低能量电离GC/TOFΔm∝bm+c,f(m)∝ln(bm+c)高能量电离MALDI TOFΔm∝m2,f(m)∝1m]]>在每种情形下,取适当的积分,以及以以上说明的方式得出表达式。例如,在某些LC TOF MS仪器中,二次项可能是不重要的,所以有Δm=bm+c这种形式的基本上线性的关系式,这产生变换ln(bm+c)。在峰宽度正比于质量的平方的仪器中,使用与如上所述的质量的倒数有关的变换可能是适当的。
当预期的质谱峰宽度变为与质量无关时,或者由于适当的变换,诸如在FTMS上的对数变换和在TOF-MS上的平方根变换,或者由于诸如很好地设计和适当地调谐的四极子或离子阱MS的特定仪器的固有特性,通过可应用于全部质谱范围的单个校准滤波器,将能达到计算时间的极大的节省。这也简化了对于质谱校准标准的要求为了校准只需要单独一个质谱峰,而另外的峰(如果存在的话)可以只用作为检验或确认,从而为根据在它测量之前加入的或混合入样品的内部标准对每次扫描的质谱数据实现完整的质谱校准铺平道路。
现在描述按照本发明的说明性实施例的校准滤波器的应用。
以上计算的校准滤波器可以被排列成以下的结合的对角线滤波器矩阵
F=f1···fi···fn]]>其中在对角线上的每个短的列向量fi是从以上对于相应的中心质量计算的卷积滤波器取得的。fi中的元素是从卷积滤波器的元素以颠倒的次序取得的,即,fi=fi,mfi,m-1···fi,1]]>这个校准矩阵对于以1/8amu数据间隔质量范围高达1000amu的四极子MS具有8000×8000的大小。然而,由于它的稀疏的特性,典型的存储要求仅仅约为40×8000,40个元素的有效滤波器长度覆盖5amu质量范围。
图12是显示按照本发明的说明性实施例的、与内插和质量预对准相组合的滤波器矩阵应用的图形表示800的图。完全校准有三个分量预校准矩阵A;校准矩阵F;和后校准矩阵B。
预校准矩阵A取结合的对角线形式,沿对角线的每个非零列执行主要的内插功能。这个内插功能可包括(a)从非均匀间隔的原始MS数据变换成均匀间隔的MS数据;(b)质量轴的预对准;以及(c)对于TOF、FTMS、磁扇区仪器,或按需要对其它仪器的适当的变换。
校准矩阵F是用于执行峰形状和质量轴校准的结合的对角线矩阵。
类似于预校准矩阵A,后校准矩阵B取结合的对角线形式,沿对角线的每个非零列执行另一个内插功能。这个内插功能可包括(a)从内部均匀间隔变换成均匀或非均匀的输出间隔;(b)为TOF、FTMS、磁扇区仪器或按需要为其它仪器,变换返回到线性质量空间。
图12所示的因子分解通过Lagrange内插而成为可能,其中内插可被构建为与在其上进行内插的与y轴无关的滤波操作。Lagrange内插算法在William Press等,“Numerical Recipes in C”(C的数字方法),2ndEd,1992,Cambridge University Press,p.537中描述,它的整个公开内容在此引用以供参考。对于输出以预定质量间隔的原始质谱的仪器,全部三个矩阵可以作为校准过程的一部分被预先计算,以及事先相乘到总的滤波矩阵中F1=AFB它具有类似于F的结合的结构,但具有不同的元素。在对于所需要的每个质谱运行时,只需要一次稀疏矩阵乘法s0=sF1其中s是包含原始MS数据的行向量以及s0是包含以想要的输出间隔的完全校准的数据的另一个行向量。这个运算的实时部分预期为是计算上高效的,因为它基本上把原始的未校准的数据滤波成用于输出的完全校准的MS数据。在某些MS仪器上,每个质谱是以不同的和非均匀的质量间隔被采集的。在这种情形下,预校准矩阵A对每次采集是不同的,仅仅F和B矩阵是固定的,直至下一次执行校准为止。这两个矩阵可以通过以下的实时运算被预先相乘,s0=sA(FB)它由于对每次采集要额外内插或乘法步骤在计算上是更昂贵的。替换地,可以选择通过便宜的线性内插对每个扫描在预先规定的质量间隔上进行内插,因此通过从扫描到扫描保持完全校准滤波矩阵F1=AFB不变而提高计算效率。
应当指出,在某些仪器系统中,有可能对在进行的每次单独的采集实行完全质谱校准。例如,在FTMS或TOF上,在对数或平方根变换后,对于MS峰(内部标准峰),为了通过公式2和3去构建具有沿对角线包含的相同非零元素的新的结合的对角线矩阵F而同时A和B可保持不变,只需要一个去卷积序列。这样得出的完全校准然后可被应用到相同的原先的MS谱,以便对所有的峰(包括内部标准峰和要被分析的其它未知的峰)实行完全校准。相同的正在进行的校准可用到其它MS系统,其中峰形状函数实际上是与进行变换或未进行变换的质量无关的,需要位于质量范围内任何地方的一个MS峰的最小值作为内部标准,在这个标准上得出沿它的对角线具有相同的非零元素的滤波器矩阵F。内部标准是一个选定的具有明确特征的同位素集群的化合物,它可以事先在样品准备步骤期间成为样品或流,实时地在线灌注和混合,诸如在LC/MS实验中经由T接头在柱上或后柱上注入利血平。为了减小由内部标准造成的离子抑制,可以在混合之前使得内部标准在分开的电离源中从样品流不断地电离成离子,诸如来自WatersCorporation,Waltham,MA的多路复用的ESI扩散源或来自AgilentTechnologies,Palo Alto,CA的双ESI锁定扩散源。
通过一个更新的算法可以执行这种完全校准的某些部分,以便以计算上有效的方式把外部标准(通过不同的MS获取)与内部标准(在同一个MS获取内)相组合。例如,可以根据最近测量的外部标准把上次可用的完全校准应用到包含内部标准峰的未知的样品。通过在校准后检验内部标准的精确质量位置和峰形状(见下一节,对于峰分析),可以发现峰形状没有改变而只存在最小质量位移。结果,FB保持为相同的而只需要矩阵A的小的更新,它完全能够补偿偏移。
通过外部和内部校准的组合的更全面的更新将牵涉到应用外部校准和使用至少一个内部标准通过另一个完全校准程序过程来更新它。对于把外部校准和内部校准两者组合起来的一个原因是处理固有的仪器漂移。例如,由于温度改变所造成的尺寸改变、加到质谱仪的各个不同部分的电压的改变、和各种材料在离子源上的积累,可能发生相对于外部标准的仪器校准方面的变化。校准的这种漂移是按时间的函数而发生的,而且对于不同的物质通常是不同的。这种漂移由于离子计数噪声可能会大于仪器的理论精度的量级,因此大大地降低了实际的仪器精度,有时达十倍以上。
在数学上,使用外部校准与内部校准的组合的校准可被表示为YEI=(YFE)FIY是其上施加外部校准滤波器FE(具有与来自上面的完全校准滤波器F1相同的形式)的原始数据,内部校准滤波器FI(同样地具有与来自上面的F1相同的形式)被施加到该结果上,以产生经外部和内部校准的数据YEI。
在运算时,包含至少一个内部标准的样品数据经受一次外部校准FE,它把原始样品数据变换成外部校准的数据。这个外部校准的数据轨迹然后被处理为外部标准数据轨迹,经受必须的变换,与内部标准的同位素分布去卷积,以达到实时的和更新的峰形状函数,内插或仅仅复制以覆盖整个质谱范围,另外的去卷积则计算附加的滤波器(FI),以便校正对于外部校准FE规定的目标峰形状函数的任何偏差,如果必要在滤波器上内插,以及如果必要则变换回到原先的空间。换句话说,整个校准处理过程通过使用外部校准的数据轨迹作为输入或原始数据再一次被重复,成为这里公开的校准程序过程以达到FI。
图13类似于图14,但在图14上的一般步骤用下标“A”再表示。不同点在于,在70A使用从包含内部标准的样品获取的数据(诸如上述的化合物之一)。这个数据经受步骤72A,74A,76A,以便在78A产生外部校准的数据。其结果在70B被用作为输入,输入到在72B,74B和76B的内部校准处理过程,其中产生附加校准滤波器,当它与外部校准滤波器相组合时,它把外部和内部校准都考虑在内。在78B,可得到被外部和内部校准的数据,以供使用。
按照本发明的这个方面,变换通过在相同的变换空间中有利地使用相同的关系来实施,就像上述的在确定峰位置和峰形状中使用的关系一样。
将会看到,有效地使用这个方法的一种方式是进行外部校准,例如,一天一次(在开始仪器测量之前),或每几小时一次,取决于仪器漂移的特性。按照内部标准的校准可以更经常完成,在极限情况下,可以在每个样品运行期间对于每个质谱扫描都执行。
以上公开的方法的优点在于,为实行校准所需的一切只是单独一个内部标准,因此可以最小程度地引入不是起源于感兴趣的样品的材料。然而,如果在特定的应用中是必要或想要的,则可以使用一个以上的内部校准标准。在某些应用中,内部标准作为样品的一部分是容易得到的,例如当在LC/MS运行期间分析药品代谢物时作为内部标准的药品,其中已知的药品(或已知的代谢物)和未知的代谢物在停留时间内可以共同淘洗或相互淘洗以作为自然出现的内部标准。
现在按照本发明的说明性实施例描述误差通过校准滤波器的传播。
为了适当地识别和定量分析质谱峰,重要的是估计校准的MS数据中的方差。对于大多数MS仪器,在离子强度测量中的随机误差是由离子计数发射噪声占优势,即,在原始MS数据中的变化正比于离子信号本身。因此校准的MS谱s0的方差谱被给出为σ2∝sF2(公式4)其中F2与F1的尺寸相同,F1中所有的相应的元素被平方。这使得对同一个原始数据进行一次以上的滤波,其中所有的滤波器元素被平方。
图14A,14B和14C是显示按照本发明的说明性实施例的、在完全校准之前和之后质谱仪(MS)质谱的第一分段910和第二分段920(图14A和14B)与方差谱930(图14C)的图。
现在按照本发明的说明性实施例描述质谱峰分析。质谱峰分析的说明将包括涉及到以下项目的说明峰矩阵构建;加权多重线性回归(WMLR);重要峰的检测;和对于峰分析的改进。
在上述的完全校准后的MS谱理想地适用于有效的、可靠的、和高度灵敏的峰检测。正如在这一节后面将会看到的,虽然峰分析可以以自然质量单位或以变换的单位来实行(对于FTMS或TOF或其它仪器),但在变换过的空间(这里也称为“校准的空间”)中执行质谱峰分析,可以达到重大的计算节省,其中峰形状函数在整个质量范围内具有相同的宽度。
本发明对于以下操作是特别有用的大范围质谱校准;以及峰检测、精确的质量测定(mass assignment)、峰面积积分、和对峰存在的概率、质量精度和峰面积置信度间隔的统计测量。
本发明的两个方面的原理、特别是本发明处理峰确定或峰检测(它是在LC、GC、CE、和甚至核磁共振(NMR)中的挑战性问题)的方面,都可以应用到其它仪器中。
在存在测量噪声的情形下,可以观察到以图15A的形式的数据轨迹。这个数据轨迹可以来自例如用于检测从液体色谱分离柱分离的蛋白质或肽的以245nm工作的单通道UV检测器,附着在其上的折射率检测器,附着在气体色谱分离柱的火焰离子检测器,在分离附着有荧光染料的DNA裂片后附着到电泳通道的末端的荧光质检测器,等等。非常希望在这些应用中具有鲁棒的和有效的峰检测算法,这样,诸如DNA分段或特定的肽的某些分析物的存在与否可以连同诸如每一个分析物的数量这样的定量信息,和诸如每个分析物到达检测器的时间这样的定性信息一起被评估。X轴不一定必须是时间,作为例子,x轴是谐振频率的ppm漂移的NMR同样是可应用的。
图15A上的固有的峰形状是不对称的,它可以随诸如时间或频率的x轴变量而变化,就好像在质谱轨迹中质谱峰形状函数那样,是不对称的和随质量(m/z)而改变。可以优选地把峰形状函数校准成具以下特性的已知的数学函数,以便利用这里公开的所有精确的计算特性对经由偏移快速计算的对称峰形状函数;在整个范围上均匀的峰形状函数,用于数字稳定性和最小的误差传播。
校准牵涉到运行一个很好地间隔的和很好地区别的化合物的混合物,以便在感兴趣的整个范围内建立一组测得的峰形状函数,从这组测量的峰形状函数可以通过使用Lagrange内插、SVD内插、小波内插、或这里提到的所有的任何其它明确地建立的内插方法的内插用数字来计算在任何给定的点的峰形状函数。这些测得的峰形状函数然后可以通过这里公开的校准滤波器被变换成想要的目标峰形状函数,诸如高斯函数或高斯函数与具有每个适当的宽度的矩形函数的卷积。
图15B显示在把校准滤波器施加到图15的数据轨迹后的经校准的数据轨迹。正如可以看到的,通过施加校准滤波器,出现很大程度的噪声滤波,它也把峰形状函数变换成在整个范围内具有相等宽度的对称峰形状函数。目标峰形状宽度的选择应当是使得目标峰形状宽度稍微大于测得的峰宽度,以保证良好程度的噪声滤波与取信号均值,但不应比测得的峰宽度宽得多而造成分辨率明显恶化。
通过不论是从标准混合物直接测得的、或是在施加校准滤波器后从数学函数算出的峰形状函数,接着就可以构建峰分量矩阵和如果必要的话以迭代方式应用WMLR(加权多线性回归),以便对于以后到来的许多未知的样品进行峰分析,直至下一次通过系统进行校准标准混合物为止。这样的峰分析的结果是列出以下参数的一个表检测到的峰、峰位置、峰面积、和有关峰存在或不存在的概率与对于每个峰的置信度间隔的所有的相应的统计量。图15C显示峰分析的部分结果,被表示为具有所有的峰位置和峰面积的竖线。
在上述的质谱校准的情形下,可以优选地在执行确定峰形状和变换之前把时间或频率轴变换成新的空间,并且可能想对每个样品加上内部峰标准以允许外部和内部标准达到可能的最高精度。
现在描述按照本发明的说明性实施例的峰矩阵构建。峰分析问题被说明为如下质谱轨迹是标称地以1/z质量单位隔开的已知的峰形状的许多峰的线性组合,其峰中心偏差反映质量缺陷。对于带单个电荷的离子(z=1),标称间隔相隔1个质量单位,其在正的或负的方向上具有的某些偏差反映物质缺陷。质谱峰分析问题然后用公式表示为多元线性回归(MLR)s0=cP+e (公式5)其中s0是包含完全校准的MS谱,P是在它的行中包含标称地间隔的已知的峰函数(每个具有按分析地积分的单位面积)的峰分量矩阵,c是包含对于所有的标称间隔的峰的、积分的峰强度的行向量,以及e是拟合的残数。为了计及基线的影响,可以把基线分量,诸如偏移、一阶线性项或其它高阶非线性函数形式,添加到P矩阵的各行上,它的相应的行向量c被相应的系数所扩增,以表示这些基线分量的影响(如果有的话)。
应当指出,以上描述的完全质谱校准允许分析地计算峰分量矩阵P,其中所有的峰按分析地积分成单位面积,导致c的相应的估值自动报告按分析地积分的面积,通过自动噪声滤波和信号平均(留在e中的)不受来自位于附近的其它峰(诸如其它同位素峰)的干扰。由于完全相同的原因,也有可能在邻近的同位素峰之间执行未偏置的同位素比值测量。
而且,峰分量矩阵P的结构可以通过执行以上的总的MS校准,在标称质量间隔的精确的分数部分(例如在1amu的1/4,1/5,1/8,1/10,1/12,1/16处)输出校准的MS数据而变成在计算上更加有效。这样,峰形状函数对于P中的一行只需要被估计一次,其它的行通过简单地向前或向后移位这个行就可形成。应当指出,结合本发明的讨论所提到的标称质量间隔对于带单个电荷的离子是指1个质量单位间隔或对于带z电荷的离子是指1/z个质量单位间隔。
现在描述按照本发明的说明性实施例的加权多元线性回归(WMLR)。由于误差项e在校准部分中表示的质谱范围内没有统一的方差,需要执行加权多元线性回归(WMLR)而不是通常的MLR。
s0diag(w)=cPdiag(w)+e (公式6)其中diag(w)是具有由公式4给出的、沿对角线的权因子的对角线矩阵,w=1/σ2=1/(sF2)其中在所有的质量之间共用的比例常数被丢弃而不影响回归。
公式6的最小二乘解是c=s0diag(w)PT[Pdiag(w)PT]-1(公式7)以及它的方差被估计为s2{c}=e2diag{[Pdiag(w)PT]-1} (公式8)其中e2是基于加权平方的偏差e2=ediag(w)eT/df其中e由公式5中的拟合残数给出的,以及df是自由度,被定义为在独立的质谱数据点的数目与被包括在矩阵P中的行的数目(要被估计的c中的系数的个数)之间的差值。公式6的最小二乘解由JohnNeter等在Applied Linear Regression(应用线性回归),2ndEd.,Irwin,1989,p.418中进一步描述,该文献的公开内容在此引用以供参考。
对于具有1/8amu的质量间隔的、达到1000amu的质量范围的MS仪器,峰分量矩阵P典型地是1000×8000,但它是非常稀疏的,在每个峰行中(基线分量具有在相应的行中所有的非零)有不大于40个非零元素(覆盖5amu质量范围)。数据存储效率可以利用以下事实来加索引(indexing)而得到显著提高当以标称质量间隔的确切的分数部分来采样时峰分量是仅仅互相移位的版本。在计算上,通过稀疏矩阵运算中分开地预先计算s0diag(w)PT和[Pdiag(w)PT],可以得到增益。后一项的预先计算应当导致1000×1000大小的另一个稀疏对称矩阵,但在以上的例子中具有约120的对角线带宽(在每行中的非零元素)和约60的半带宽(考虑对称性)。
在整个质量范围内不存在相同的和对称峰形状函数的基线分量的情形下,以上的运算导致一个稀疏矩阵[Pdiag(w)PT],它具有可修改用于通过块循环减小而在计算上有效地求逆得到[Pdiag(w)PT]-1的块的循环结构。块的循环减小由Gene Golub等在MatrixComputations(矩阵计算),1989,Johns Hopkins University Press,p.71中进一步描述,它的整个公开内容在此引用以供参考。
即使在存在具有在质量范围内变化的和非对称峰形状函数的基线分量的情形下,稀疏矩阵[Pdiag(w)PT]将具有以下的专门的形式(例如,假设来自偏移、一阶、到二阶的三个基线分量)×××××××××××××××××××××××××××××××××××××××××××]]>它可以作为块对角线系统被有效地求解。块对角线系统由GeneGolub等在Matrix Computations(矩阵计算),1989,Johns HopkinsUniversity Press,p.170中进一步描述,它的整个公开内容在此引用以供参考。
当真实的质谱峰没有与标称质量精确相重合时,可以有以下的线性组合方程(这里为了简化起见,忽略任何基线分量而不失一般性),s0=∑cipi+e=∑cipi(mi)+e其中具有中心质量mi的峰形状函数pi可通过台劳级数被展开为一阶导数pi(mi)=pi(mi0+Δmi)≈pi(mi0)+Δmidpi(mi0)dm]]>其中pi(mi)是以真实质量位置mi为中心的峰形状函数,pi(mi0)是以接近于mi的标称质量位置mi0为中心的峰形状函数,Δmi是真实的与标称的质量位置之间的差值(质量缺陷或由于多个电荷造成的离标称质量的偏差),以及dpi(mi0)/dm是以标称质量位置mi0为中心的峰形状函数的分析地计算的一阶导数。
考虑到质量缺陷,具有以下的修改的公式s0=Σcipi+e=Σcipi(mi0)+Σ(ciΔmi)dpi(mi0)dm+e=Σcipi(mi0)+Σcn+idpi(mi0)dm+e]]>其中cn+i=ciΔmi和n是所考虑的标称质量的数目。通过写回到矩阵形式,可以有s0=cP+e (公式9)其中c和P现在通过在导数项前面的系数和导数项本身被增扩。重要的是指出,因为峰形状函数被选择为是对称的(所以,正交于峰形状函数本身),把它们的导数包括进来对于峰分量矩阵P的条件没有有害的影响,而导致可得到的最精确的质量确定和最可重复的峰积分。
上述的相同的WMLR可被应用来求解方程9,以及达到积分的峰面积c1,c2,cn。此外,公式8可用来计算对于这样得到的每个峰面积的标准偏差,导致对于这些峰面积的精巧的统计测量值。
实际的质量位置的改进的确定可得出如下mi=mi0+Δmi=mi0+cn+i/ci(公式10)其中在Δmi的确定中的相对误差被给出为|s(Δmi)/Δmi|=|s(ci)/ci|+|s(cn+i)/cn+i|对于ci和ci+n的标准偏差可直接从公式8得出。换句话说,对于移位估值的标准误差是s(Δmi)=[|s(ci)/ci|+|s(cn+i)/cn+i|]|Δmi|它也是对于在公式10中给出的实际的质量的标准误差。
现在描述按照本发明的实施例的重要的峰的检测。根据来自上一节的峰面积估值(公式7)和它的标准偏差计算(公式8),可以计算t-统计值ti=ci/s(ci)fori=1,2,...,n它可以与自由度(df)相组合以统计地检测浓度估值ci是否明显地大于零,即质谱峰是否存在。典型地,df是足够大以致可被认为是无穷大,以及大于3.0的t-统计值或其它用户选择的截止值表明在统计上明显地存在质谱峰。应当指出,考虑到这样的事实在图12所示的完全校准后单独的质谱点在统计上不再是无关的而变为与它的噪声相关的,因而可能需要高于通常的3.0的数值的t-统计截止值。通过计算机模拟或实际经验可以建立实际的截止值。
图16A是显示按照本发明的说明性实施例的、反映t统计作为对整个质量范围内可能的质谱峰(从图5取的原始质谱)的精确质量位置的函数(公式10)的竖线质谱1010的图。图16B和16C是显示按照本发明的说明性实施例的、原始MS谱分段的重叠1020和它的完全校准的版本1030的图。图16D是显示按照本发明的说明性实施例的、相应的t统计1040和2其临界t值设置在12的水平截止线1050的图。同时的噪声滤波/信号平均和峰形状校准的高度可以在图16B上清楚地看到,这可以大大方便于实行具有图16D所示的高度敏感的结果的峰分析,其中检测将仅仅受制于数据中的随机噪声而没有人工产物或其它系统误差源。
然后具有大于截止值的t-统计的质谱峰被报告为是统计上显著的,而低于截止值的这些峰则被报告为是不显著的。对于具有相应的离子裂片的特定的分子的识别和定量分析,也可以连同t统计一起报告精确的质量位置和积分的峰面积。虽然F统计可能在这里得到更严密的应用,但可以相信,由于在峰分量之间的最小互动(小的协方差),临界的t统计将是足够的。F-统计在多元共线性上的应用由JohnNeter等在Applied Linear Regression(应用线性回归),2ndEd.,Irwin,1989,p.300中进一步描述,该文献的公开内容在此引用以供参考。
现在描述按照本发明的说明性实施例的峰分析的改进。当希望有高的质量精确度时,可以通过处理以上得到的结果作为初始估值而构建迭代峰分析过程,以及通过使用从公式10新计算的实际质量位置来更新峰分量矩阵P。由于更新的质量位置互相将没有间隔开一个标称质量单位,在P中每个峰分量和它的导数形式对于所有的重要的峰将需要分开地分析计算(根据上述的t-测试)。通过构建的新的P矩阵,可以算出对c的新的估值,给出实际的质量位置的另一个更新mi(k)=mi(k-1)+Δmi(k)=mi(k-1)+cn+i(k)/ci(k)其中k=1,2...以及mi(0)=mi0(标称质量位置)。当增量的更新cn+1(k)变得与从公式8预测的标准偏差可比拟时,这种迭代改进就将完成。通过实施的这样的改进,由于对于这样的峰可得到的高的信号-噪声比,对于强的质谱峰,可以达到极高的质量精度,例如对于图5上质量69处的峰的2ppm质量精度。当峰强度下降时,由于可用于检测的离子数目减小,质量精度将恶化。换句话说,质量精度仅仅由数据中的随机噪声限制,而不受限于其它人工产物或系统误差源,诸如化学噪声的存在,来自同位素峰的干扰,不规则的峰形状,或未知的基线,因为这些人工产物已由这里采取的校准和峰分析方法而完全补偿。
现在描述本发明的许多附加的优点和特性的某些部分。本发明提供数学上精确的、统计上完整的和基于物理的、用于处理质谱仪数据的方法。有利地,本发明把噪声的存在和同位素峰认为是总的方案中附加的有用的信息。本发明把噪声、同位素分布、多个电荷、基线、峰识别、峰定位、和峰定量分析都全部同时在一个合并的过程中处理。本发明组合偶尔的MS校准与常规的MS数据分析,并可以极大地改进高或低分辨率MS系统的质量精度。在具有单位质量分辨率(FWHM=0.5-0.7amu)的传统的MS系统中,可以达到1-5ppm级别的质量精度。本发明包括内置的基线确定、噪声滤波/信号平均、和峰积分。本发明是计算上高效的,这样,它可被利用来在GC/MS或LC/MS或其它时间有关的MS检测系统上正在进行的(on-the-fly)数据缩减。本发明具有用于仪器诊断和数据质量控制的输出统计值。而且,本发明牵涉到具有对于噪声和其它人工产物的可预测的特性的所有的线性算子。本发明对于强的峰达到高的质量精度和对于弱的峰达到高的灵敏度,具有高的动态范围。本发明允许所有不同类型的MS仪器的标准化和通用的高度精确的库搜索。这允许在复杂的基体中以大大地减小的成本作分子印记,即使因可达到的高的质量精度而对于分离没有需要的话。
虽然以上的质谱校准和峰分析是对于具有至少单位质量分辨率的典型的质谱仪系统而描述的,但应当看到,即使对于不能区分位于单位质量内的峰或1/z质量差值的、低分辨率质谱仪系统而言,以上的质谱校准仍会带来重大的和固有的优点。在低分辨率质谱仪系统中,由于缺乏谱分辨率,明确的峰识别是不可行的。代替包括峰识别和定量分析的传统的峰分析,完全的质谱轨迹被用作为多变元统计分析的输入,以用于通过多变元校准的分析物定量分析或通过集群分析或模式识别的样品分类。这些多变元统计方法包括主要分量分析(PCA)或主要分量回归(PCR),正如由Bruse Kowalski等在J.Chemometries,1991,5,129中所描述的,它的公开内容在此引用以供参考。用于这些多变元统计方法的成功的应用的一个关键的因素是高的质量精度和在样品与仪器之间的一致的峰形状函数,正如在Yongdong Wang等在anal.Chem.,1991,63,2750中所描述的,它的整个公开内容在此引用以供参考。由本发明引入的完整的质谱校准应当正确地对准在不同的样品或仪器之间的质量轴和质谱峰形状函数,从而允许进行高度精确的多变元谱比较,以用于分析物定量分析或样品分类(正如在生物标记发现中使用的)。
图17是显示按照本发明的说明性实施例的、用于操作质谱(MS)仪系统的方法的图。MS仪系统至少在峰形状和质量轴方面被校准(步骤1110)。应当看到,步骤1110可被分割成下面的步骤1110A-1110G。
还应当看到,步骤1110E-1110H是任选的。如果执行步骤1110E-1110H,则可以在图17的方法以后执行图19的方法。然而,如果省略步骤1110E-1110H,则可以在图17的方法以后执行图20的方法。
在步骤1110A,对于给定的校准方法,计算同位素的相对丰度和精确的质量位置。
在步骤1110B,根据算出的同位素峰集群和相应于校准标准而测量的同位素峰集群,预对准同位素质量,以便校准MS仪器系统的质量轴。
在步骤1110C,得出相应于计算的和测量的同位素峰集群的峰形状函数。
在步骤1110D,对相应于得出的峰形状函数的数据进行内插,得出在想要的质量范围内的其它的峰形状函数。每个得出的峰形状函数和其它峰形状函数相应于实际测量的质量位置。
在步骤1110E,峰形状函数和其它峰形状函数被变换成以想要的质量范围内确切的中点为中心的目标峰形状函数。
在步骤1110F,从目标峰形状函数和计算的峰形状函数计算校准滤波器。
在步骤1110G,把校准滤波器内插为更细的网格。
在步骤1110H,应用校准滤波器以便校准MS仪器系统。
图18是进一步显示按照本发明的说明性实施例的图17的方法的步骤1110H的图。步骤1110H包括下面的步骤1210A-1210C。
在步骤1210A,计算预校准矩阵。预校准矩阵的计算包括把非均匀间隔的数据变换成均匀间隔的数据,所述变换包括质量轴的预对准以及任选地包括用于TOF、FTMS、或其它仪器的变换。
在步骤1210B,计算校准矩阵。校准矩阵的计算包括创建一个结合的对角线矩阵,其中在每列中的非零元素取自在移位后以颠倒的次序的卷积滤波器的元素。
在步骤1210C,计算后校准矩阵。后校准矩阵的计算包括从内部间隔到输出或想要的间隔进行内插,以及把变换过的空间变回原先的质量空间。
图19是显示按照本发明的说明性实施例的、用于分析从MS仪系统得到的质谱仪(MS)质谱的方法的图。
在完全校准后分析MS谱中的峰(步骤1310)。优选地,但不是必须的,在全部质谱范围内峰形状函数是相同的。
接收校准的MS数据,该数据具有优选地等于标称质量间隔(例如,1amu或1/z)的整数的分数部分(例如,1/4,1/5,1/8,1/10,1/12,1/16)的质量间隔(步骤1310A)。
计算全部峰分量矩阵的一对矩阵行,这样,该对的一行存储被归一化到单位峰面积的目标峰形状函数,而该对的另一行存储被存储在该对的该行中的目标峰形状函数的一阶导数,这样,目标峰形状函数和它的一阶导数两者都以标称质量间隔的整数的分数部分被采样(步骤1310B)。
通过给矩阵加下标以使得行的残余部分中的峰分量被安排为相应于在全部质谱范围内的每个标称质量的互相移位的版本,从而完成该全部峰分量的矩阵(步骤1310C)。
使用质谱方差的倒数作为权因子来计算在全部质谱范围内所有的标称质量处的积分的峰面积和质量偏差,从而执行加权多线性回归(WMLR)运算(步骤1310D)。
对于所有的峰面积和质量偏差计算标准偏差(步骤1310E)。
通过加入计算的质量偏差把标称质量从相应的标称质量更新到实际的质量(步骤1310F)。
执行(步骤1310D)、计算(步骤1310E)、和更新(步骤1310F)步骤被重复进行,直至在峰面积或质量偏差中任何递增的改进量小于相应的标准偏差或其它预置的准则(步骤1310G)。如果在峰面积或质量偏差中的递增的改进量不小于相应的标准偏差或其它预置的准则,则使用实际的质量来重建全部峰分量矩阵(步骤1310H),以及方法返回到步骤1310D。否则,方法进到步骤1310I。
对于所有的峰面积计算t-统计值(步骤1310I),以得到质谱峰表,它包括峰面积和对于统计上显著的质量峰的精确的质量(步骤1310J)。
图20是显示按照本发明的说明性实施例的、用于分析质谱仪(MS)质谱的方法的图。
在确定覆盖全部质谱范围的峰形状函数后分析MS谱中的峰(步骤1410)。进行峰形状内插,以得到在每个标称质量处一个峰形状函数(步骤1410A)。
对所有的标称质量计算峰形状函数的一阶导数(步骤1410B)。把峰形状函数和相应的一阶导数组合成全部峰分量矩阵(步骤1410C)。
使用质谱方差的倒数作为权因子来执行加权多元线性回归(WMLR)操纵以计算在全部质谱范围内所有的标称质量处的积分的峰面积和质量偏差(步骤1410D)。
对所有的峰面积和质量偏差计算标准偏差(步骤1410E)。
通过加入计算的质量偏差而把标称质量从相应的标称质量更新为实际的质量(步骤1410F)。
执行(步骤1410D)、计算(步骤1410E)、和更新(步骤1410F)步骤被重复进行,直至在峰面积或质量偏差中任何递增的改进量小于相应的标准偏差或其它预置的准则(步骤1410G)。如果在峰面积或质量偏差中的递增的改进量不小于相应的标准偏差或其它预置的准则,则通过使用实际的质量重建全部峰分量矩阵(步骤1410H),以及方法返回到步骤1410D。否则,方法进到步骤1410I。
对所有的峰面积计算t-统计值(步骤1410I),得到质谱峰表,它包括峰面积和对于统计上显著的质量峰的精确的质量(步骤1410J)。
图21是显示按照本发明的说明性实施例的、用于创建用于质谱仪(MS)系统的校准滤波器的方法的流程图。
选择一个或多个化合物作为质谱仪(MS)标准(1510)。在MS标准上获取MS分布数据(步骤1510A)。识别每个离子裂片集群(步骤1510B)。
在步骤1510B后,确定是否存在重要的同位素(步骤1510N)。如果是的话,按精确的质量计算相对同位素丰度(步骤1510C)。执行预校准步骤(步骤1510D)。预校准步骤可包括对原始数据执行与预校准仪器有关的变换,执行预校准质量间隔调节,和/或预校准质谱同位素峰。
然后确定是否想要得到峰形状函数(步骤1510E)。如果是的话,通过使用具有窄峰宽度的同一个连续函数对算出的相对同位素丰度和测量的同位素峰集群都执行卷积运算,然后在卷积运算后在测量的同位素峰集群与最终得到的测量的同位素峰集群之间执行去卷积运算(步骤1510T),以得到至少一个峰形状函数(步骤1510P),以及方法进到步骤1510Q。否则,在算出的相对同位素丰度与目标峰形状函数之间执行卷积运算(步骤1510F),然后在测量的同位素峰集群与在卷积运算后最终得到的同位素峰集群之间执行去卷积运算(步骤1510G),以得到至少一个校准滤波器(步骤1510H)。
还是在步骤1510B后,确定是否存在重要的同位素(步骤1510N)。如果不是的话,执行预校准步骤(步骤1510O)。预校准步骤可包括对原始数据执行与预校准仪器有关的变换,执行预校准质量间隔调节,和/或预校准质谱同位素峰。
这样得到的峰形状函数(步骤1510P)在与特定的目标峰形状函数(步骤1510R)进行去卷积运算(步骤1510S)之前进行内插(步骤1510Q)。
在步骤1510S,在质谱目标峰形状函数与测量的质谱峰形状函数和计算的质谱峰形状函数这两个函数中的一个函数之间执行去卷积,以把质谱峰形状函数和至少一个其它质谱峰形状函数变换成以在由该质谱峰形状函数和该至少一个其它质谱峰形状函数覆盖的各个质量范围内的中点为中心的质谱目标峰形状函数。从以在由该质谱峰形状函数和该至少一个其它质谱峰形状函数覆盖的各个质量范围内的中点为中心的质谱目标峰形状函数,计算至少一个校准滤波器(步骤1510H)。
在两个校准滤波器之间执行内插运算,得到在想要的质量范围内的至少一个其它校准滤波器(步骤1510I)。
从步骤1510H的校准滤波器和从步骤1510I的内插得到的任何校准滤波器,得到完全的校准滤波器组(步骤1510J)。执行后校准步骤(步骤1510K)。后校准步骤可包括执行与后校准仪器有关的变换和/或后校准质量间隔调节。
数据相应于预校准步骤1510O、步骤1510J的完全的校准滤波器组、和后校准步骤1510K而被组合(步骤1510L),以得到完全的校准滤波器组F1和方差滤波器组F2(步骤1510M)。
图22是显示按照本发明的说明性实施例的、用于处理质谱仪(MS)数据的方法的框图。
在测试样品上获取MS分布数据(步骤1610)。如果必要,分布数据要进行内插(步骤1610A)。对完全的校准滤波器组F1和/或方差滤波器组F2执行稀疏矩阵乘法(步骤1610B)。然后,如果必要的话,把校准的数据内插到所报告的质量间隔(步骤1610C)。
在每个质量采样点处报告质谱方差(步骤1610G),以及该方法进到步骤1610H。另外,在步骤1610C后,对质量和峰形状校准质谱数据(步骤1610D),以及方法进到步骤1610E。
在步骤1610E,确定所使用的MS仪器系统是否具有足够高的分辨率以便允许质谱峰识别。如果是的话,方法进到步骤1610H,用于质谱峰识别。否则,方法进到步骤1610F,用于直接比较全部质谱数据而不进行显然的峰识别。
在步骤1610H,执行质谱峰定量分析和精确的质量确定步骤。在步骤1610F,通过多变元校准而执行定量分析或通过使全部质谱响应曲线作为输入而不进行显然的质谱峰识别作模式识别/集群分析,从而执行定性分析。
本发明的原理也可用到分析诸如在活体组织或血液中的那样的非常复杂的蛋白质混合物的情形。在这些情形下,为了研究或诊断,所分析的化合物不一定是纯的。即使存在纯的化合物,化学分子式或本性也可能是未知的。而且,在这些具有非常复杂的质谱的非常复杂的样品中,添加标准的校准化合物可能是不利的,这使得复杂的情形甚至更难解译。最后,有时可能发生错误在进行样品操作之前遗漏放置标准校准化合物。很难或不可能重新放置样品以重复进行操作。
尽管如此,通过进行相对校准,有可能利用本发明的原理。复杂的生物样品常常包含提供共同背景的某些化合物。例如,血液通常包含血红素和BSA(血清白蛋白)。按照本发明的一般性原理,在具有与被分析的样品相同的一般特性的测试样品中测得的特定的峰可被选择为“金标准”。然后在金标准中选定的峰作为被分析样品中的目标来对待。这些选择的峰任选地可以与其宽度比起原先的峰是很小的已知函数(诸如高斯函数)进行卷积而形成目标。以上详细地讨论过的变换、滤波、卷积和去卷积都可以执行。卷积滤波器用来作用在被分析的样品的峰上(就好像它们是计算的峰形状函数那样对待),以使得它们可以与金标准进行比较。这可以只用一个峰作为具有被复制的或扩展的卷积滤波器的金标准以便覆盖范围内的所有的峰位置而完成。如果选择金标准的一个以上的峰,则可以对在峰之间的位置执行在峰之间的内插。这些过程对被分析的每个样品都有利地遵循。
一旦完成这些步骤,就可以对最终得到的数据就进行各种不同的形式的差异分析。可以使用模式识别、判别式分析、集群分析、主要成分分析、局部最小二乘分析、和各种多变元回归分析。虽然绝对精度不一定得到保证,但这些结果对于预筛选、筛选或医学诊断是极其有用的。这对于医学研究或诊断,特别是在诊断可以通过其它的、或许更为侵入式技术被独立地确认的情形下,可能是特别有价值的。
虽然说明性实施例在这里是参照附图描述的,但应当看到,本发明不限于这些精确的实施例,以及本领域技术人员可以作出各种其它改变和修改而不背离本发明的范围或精神。所有的这样的改变和修改打算被包括在由所附权利要求规定的、本发明的范围内。
权利要求
1.一种为了得到用于校准质谱(MS)仪系统的至少一个校准滤波器的方法,包括以下步骤对于给定的校准标准,得到在质谱范围中测量的同位素峰集群数据;对于给定的校准标准,计算相对同位素丰度和相应于该丰度的同位素的实际的质量位置;规定质谱目标峰形状函数;在计算的相对同位素丰度与质谱目标峰形状函数之间执行卷积运算,以形成计算出的同位素峰集群数据;以及在测量的同位素峰集群数据与在卷积运算后计算出的同位素峰集群数据之间执行去卷积运算,以得到至少一个校准滤波器。
2.权利要求1的方法,其中所述执行卷积运算和执行去卷积运算的步骤的任一项步骤利用傅立叶变换、矩阵乘法、和矩阵求逆的至少一项。
3.权利要求1的方法,在所述计算步骤以后执行的预校准步骤中,还包括根据在计算的相对同位素丰度的质心质量与测量的同位素峰集群的质心质量之间的最小二乘拟合,来预对准测量的质谱同位素峰的步骤。
4.权利要求1的方法,还包括以下步骤对原始质谱数据执行预校准与仪器有关的变换;以及对相应于测试样品的计算出的数据组执行后校准与仪器有关的变换。
5.权利要求4的方法,其中所述执行预校准与仪器有关的变换和执行后校准与仪器有关的变换的步骤分别涉及到创建预校准结合的对角线矩阵和后校准结合的对角线矩阵,沿着各个矩阵中的每个矩阵的结合的对角线的每个非零元素用于分别执行相应于与预校准仪器有关的变换和与后校准仪器有关的变换的内插功能,以及所述方法还包括从该至少一个校准滤波器创建用于执行峰形状和质量轴校准的校准结合的对角线矩阵的步骤。
6.权利要求5的方法,还包括在校准测试样品之前把预校准结合的对角线矩阵、校准结合的对角线矩阵和后校准结合的对角线矩阵相乘成一个总的滤波矩阵。
7.权利要求6的方法,其中峰形状和质量轴校准是通过在总的滤波矩阵与原始质谱数据之间的矩阵乘法而实现的,以及所述方法还包括创建另一个结合的对角线矩阵以估计校准的信号的质谱方差的步骤,该另一个结合的对角线矩阵对角上的每个非零元素等于在总的滤波矩阵中的相应的元素的平方。
8.权利要求7的方法,还包括下列步骤对校准的质谱数据施加加权回归运算,以得到对于质谱峰的积分峰面积、实际的质量和其它质谱峰数据中的至少一项。
9.权利要求8的方法,其中加权回归运算的权因子正比于质谱方差的倒数。
10.权利要求7的方法,还包括下列步骤对校准的质谱数据施加多元统计分析,以便对测试样品进行定量、识别和分类中至少一项。
11.权利要求1的方法,还包括以下步骤执行从非均匀间隔的质量采集间隔到均匀间隔的质量间隔的预校准质量间隔调节;以及执行从均匀的间隔的质量间隔到报告的间隔的后校准质量间隔调节。
12.权利要求11的方法,其中所述执行预校准质量间隔调节和后校准质量间隔调节的步骤分别涉及到创建预校准结合的对角线矩阵和后校准结合的对角线矩阵,沿着各个矩阵中的每个矩阵的结合的对角线的每个非零元素用于分别执行相应于预校准质量间隔调节和后校准质量间隔调节的内插功能,以及所述方法还包括从该至少一个校准滤波器创建用于执行峰形状和质量轴校准的校准结合的对角线矩阵的步骤。
13.权利要求12的方法,还包括下列步骤在校准测试样品之前把预校准结合的对角线矩阵、校准结合的对角线矩阵和后校准结合的对角线矩阵相乘成总的滤波矩阵。
14.权利要求13的方法,其中峰形状和质量轴校准是通过在总的滤波矩阵与原始质谱数据之间的矩阵乘法而执行的,以及所述方法还包括创建另一个结合的对角线矩阵以估计校准的信号的质谱方差的步骤,该另一个结合的对角线矩阵的对角上的每个非零元素等于在总的滤波矩阵中的相应的元素的平方。
15.权利要求14的方法,还包括下列步骤对校准的质谱数据施加加权回归运算,以得到对于质谱峰的积分的峰面积、实际的质量和其它质谱峰数据中的至少一项。
16.权利要求15的方法,其中加权回归运算的权因子正比于质谱方差的倒数。
17.权利要求14的方法,还包括下列步骤对校准的质谱数据施加多元统计分析,以便对测试样品执行定量、识别和分类中的至少一项。
18.权利要求1的方法,其中该至少一个校准滤波器包括至少两个校准滤波器,以及所述方法还包括在至少两个校准滤波器之间进一步内插以得到在想要的质量范围内至少一个另外的校准滤波器的步骤。
19.权利要求18的方法,其中所述内插步骤包括以下步骤收集供分解用的该至少两个校准滤波器作为矩阵中的向量;分解包括该至少两个校准滤波器的矩阵;在矩阵的分解的向量之间进行内插,以得到内插的向量;以及使用内插的向量重建该至少一个另外的校准滤波器。
20.权利要求19的方法,其中所述分解步骤是通过使用奇异值分解(SVD)和小波分解的至少一项执行的。
21.权利要求1的方法,还包括下列步骤通过连续灌注和在线混合中的至少一项在事先或实时把校准标准加到测试样品,以便在单独一次质谱采集中获取校准数据和测试数据。
22.一种处理原始质谱数据的方法,包括以下步骤把一个总的滤波矩阵施加到原始质谱数据,以得到校准的质谱数据,其中总的滤波矩阵通过以下各项而形成对于在质谱范围中的给定的校准标准所得到的测量到的同位素峰集群数据;为同一校准标准计算的相对同位素丰度和相应于该丰度的同位素的实际的质量位置;规定的质谱目标峰形状函数;在计算的相对同位素丰度与质谱目标峰形状函数之间执行的用于形成计算出的同位素峰集群数据的卷积运算;以及在测量的同位素峰集群数据与在卷积运算后计算出的同位素峰集群数据之间执行去卷积运算以得到用于总的滤波矩阵的至少一个校准滤波器。
23.权利要求22的方法,其中所述施加步骤还包括把原始的质谱数据内插到与由总的滤波矩阵所需要的相同的质量轴的步骤。
24.权利要求22的方法,其中所述施加步骤还包括把校准的质谱数据内插到与由总的滤波矩阵所给出的不同的任何想要的质量轴的步骤。
25.权利要求22的方法,还包括下列步骤对校准的质谱数据施加加权回归运算,以得到积分的峰面积、实际的质量和用于质谱峰的其它质谱峰数据中的至少一项。
26.权利要求25的方法,其中加权回归运算的权因子正比于质谱方差的倒数。
27.权利要求22的方法,还包括对校准的质谱数据施加多元统计分析,以便对测试样品执行定量、识别和分类中的至少一项。
28.一种用于分析相应于从用于执行分析物的分离与分析这两项中至少一项的仪器系统中所得到的数据的峰的方法,该方法包括以下步骤对在一个范围内的峰施加加权的回归运算;以及报告回归系数作为积分的峰面积和峰位置偏差中的一项,所述峰位置偏差相应于标称峰位置与估计的实际峰位置这两者之一。
29.权利要求28的方法,其中所述方法在仪器系统被校准后执行,以使得峰形状函数由目标峰形状函数给出。
30.权利要求28的方法,其中加权回归运算的权因子正比于峰强度方差的倒数。
31.权利要求28的方法,其中所述施加步骤和报告步骤重复进行,直至在积分的峰面积与峰位置偏差的至少一项中的递增的改进满足预置的准则。
32.权利要求28的方法,其中所述分析步骤还包括下列步骤根据加权回归的加权因子计算积分的峰面积与峰位置偏差中的至少一项的标准偏差。
33.权利要求32的方法,其中所述计算步骤还包括下列步骤计算积分的峰面积与峰位置偏差中的至少一项的t-统计值,t-统计值适配于检验和报告计算的峰面积与峰位置中的至少一项的统计显著性,其中统计显著性表明峰是否存在。
34.权利要求28的方法,还包括创建峰分量矩阵的步骤,包括计算一对矩阵行,该对矩阵行的第一行用于存储峰形状函数,以及该对矩阵行的第二行用于存储被存储在第一行中的峰形状函数的一阶导数。
35.权利要求34的方法,其中峰形状函数另外还包括用来考虑到基线分量的线性和非线性函数中的至少一个函数。
36.权利要求34的方法,其中峰形状函数是目标峰形状函数与已知仪器的峰形状函数这两者之一。
37.权利要求36的方法,其中峰形状函数和它的一阶导数在一个范围内是相同的,它们都是以标称峰间隔的同一个整数的分数部分被采样的。
38.权利要求37的方法,还包括下列步骤完成峰分量矩阵以使得在任何其余的矩阵行中的任何峰形状函数被安排为相应于在一个位置范围内的每个标称位置的互相移位的版本。
39.权利要求34的方法,还包括以下步骤之一通过把报告的偏差加到标称位置而把在峰分量矩阵中的标称位置更新为估计的实际位置;以及通过把报告的偏差加到估计的实际位置而把在峰分量矩阵中的估计的实际位置更新为经进一步改进的估计的实际位置。
40.权利要求28的方法,还包括下列步骤对相应于峰形状函数的数据进行内插,以得到在每个标称位置处一个另外的峰形状函数。
41.权利要求40的方法,其中所述内插步骤包括以下步骤收集供分解用的该峰形状函数作为矩阵中的向量;分解被包括在矩阵中的峰形状函数;在分解的向量之间进行内插,以得到经内插的向量;以及使用经内插的向量重建在每个标称位置处的一个另外的峰形状函数。
42.权利要求41的方法,其中所述分解步骤是通过使用奇异值分解(SVD)和小波分解中的至少一种执行的。
43.权利要求40的方法,还包括计算在每个标称位置处峰形状函数的一阶导数的步骤。
44.权利要求43的方法,还包括通过组合峰形状和相应于峰形状函数的一阶导数而创建峰分量矩阵的步骤。
45.权利要求44的方法,还包括以下步骤之一通过把报告的偏差加到标称位置而把在峰分量矩阵中的标称位置更新为估计的实际位置;以及通过把报告的偏差加到估计的实际位置而把在峰分量矩阵中的估计的实际位置更新为经进一步改进的估计的实际位置。
46.权利要求44的方法,其中峰分量矩阵另外还包括用来考虑到基线分量的线性和非线性函数中的至少一个函数。
47.权利要求28的方法,其中所述施加步骤还包括执行矩阵求逆和矩阵分解中的至少一项的步骤。
48.权利要求47的方法,其中矩阵求逆和矩阵分解中的至少一项是基于峰分量矩阵的带状特性、对称特性、和循环特性中的至少一项。
49.权利要求47的方法,其中矩阵求逆和矩阵分解中的至少一项的结果在分析测试样品数据之前被计算和存储。
50.权利要求28到49的任一项的方法,其中所述仪器系统包括质谱仪和分离设备中的至少一个设备,以及所述在范围内的位置相应于质量。
51.权利要求28到49的任一项的方法,其中所述仪器系统包括液相色谱和气相色谱中的至少一项,以及所述在范围内的位置相应于色峰出现的时间。
52.权利要求28到49的任一项的方法,其中所述仪器系统包括光谱系统,以及所述在范围内的位置相应于频率、移位、和波长之一。
53.一种用于计算用于质谱(MS)仪系统的校准滤波器的方法,包括以下步骤从给定的校准标准得到至少一个质谱峰形状函数,规定质谱目标峰形状函数,在得到的至少一个质谱峰形状函数与质谱目标峰形状函数之间执行去卷积运算,以及根据去卷积运算的结果计算至少一个校准滤波器。
54.权利要求53的方法,其中至少一个质谱峰形状函数可以从包含来自在所述校准标准中的已知分子的许多同位素中的至少一个同位素的一部分质谱而得到。
55.权利要求53的方法,其中所述得到步骤包括以下步骤对于给定的校准标准,计算相对同位素丰度和相应于该丰度的同位素的实际的质量位置;使用具有窄峰宽度的相同的连续函数来对计算出的相对同位素丰度与测量到的同位素峰集群执行卷积运算;以及在所述卷积运算后,在测量的同位素峰集群与计算的同位素峰集群之间执行去卷积运算,以得到至少一个质谱峰形状函数。
56.权利要求53的方法,其中该至少一个校准滤波器包括至少两个校准滤波器,以及所述方法还包括在至少两个校准滤波器之间进一步内插以得到在想要的质量范围内至少一个另外的校准滤波器的步骤。
57.权利要求56的方法,其中所述内插步骤包括以下步骤收集供分解用的该至少两个校准滤波器作为矩阵中的向量;分解包括该至少两个校准滤波器的矩阵;在矩阵的分解的向量之间进行内插,以得到经内插的向量;以及使用经内插的向量重建该至少一个另外校准滤波器。
58.权利要求57的方法,其中所述分解步骤是通过使用奇异值分解(SVD)和小波分解中的至少一项执行的。
59.权利要求53的方法,其中任何所述执行去卷积运算的步骤利用傅立叶变换和矩阵求逆中的至少一项。
60.权利要求55的方法,其中任何所述执行卷积和去卷积运算的步骤利用傅立叶变换、矩阵乘法、和矩阵求逆中的至少一项。
61.权利要求53的方法,其中所述得到步骤还包括对相应于质谱峰形状函数的数据进行内插,以得到在想要的质量范围内至少一个另外的质谱峰形状函数的步骤。
62.权利要求61的方法,其中所述内插步骤包括以下步骤收集供分解用的质谱峰形状函数作为矩阵中的向量;分解包括质谱峰形状函数的矩阵;在矩阵的分解的向量之间进行内插,以得到经内插的向量;以及使用经内插的向量重建该至少一个另外的质谱峰形状函数。
63.权利要求62的方法,其中所述分解步骤是通过使用奇异值分解(SVD)和小波分解中的至少一项而执行的。
64.权利要求61的方法,其中所述执行步骤包括下列步骤在质谱目标峰形状函数与测量的质谱峰形状函数和计算出的质谱峰形状函数中之一之间执行去卷积运算,以便把测量的质谱峰形状函数和至少一个另外的质谱峰形状函数变换成质谱目标峰形状函数;以及其中所述计算步骤包括从去卷积运算中计算至少一个校准滤波器的步骤。
65.权利要求64的方法,其中该至少一个校准滤波器包括至少两个校准滤波器,以及所述方法还包括下列步骤在至少两个校准滤波器之间进一步进行内插,以得到在想要的质量范围内至少一个另外的校准滤波器。
66.权利要求65的方法,其中所述进一步进行内插的步骤包括以下步骤收集供解用该至少两个校准滤波器作为矩阵中的向量;分解包括该至少两个校准滤波器的矩阵;在矩阵的分解的向量之间进行内插,以得到经内插的向量;以及使用经内插的向量重建该至少一个另外的校准滤波器。
67.权利要求66的方法,其中所述分解步骤是通过使用奇异值分解(SVD)和小波分解中的至少一项而执行的。
68.权利要求64的方法,其中所述在质谱目标峰形状函数与测量的质谱峰形状函数和计算出的质谱峰形状函数中之一之间执行去卷积运算的所述步骤要利用傅立叶变换和矩阵求逆中的至少一项。
69.权利要求53的方法,在所述计算步骤以后执行的预校准步骤中,还包括以下步骤根据在计算出的相对同位素丰度的质心质量与测量的同位素峰集群的质心质量之间的最小二乘拟合,对质谱同位素峰进行预对准。
70.权利要求53的方法,还包括以下步骤对原始质谱数据执行与预校准仪器有关的变换;以及对相应于测试样品的计算出的数据组执行与后校准仪器有关的变换。
71.权利要求70的方法,其中所述执行与预校准仪器有关的变换和执行与后校准仪器有关的变换的步骤分别涉及到创建预校准结合的对角线矩阵和后校准结合的对角线矩阵,沿着各个矩阵中每个矩阵的结合的对角线的每个非零元素用于分别执行相应于与预校准仪器有关的变换和与后校准仪器有关的变换的内插功能,以及所述方法还包括以下步骤从该至少一个校准滤波器创建用于执行峰形状和质量轴校准的校准结合的对角线矩阵的步骤。
72.权利要求71的方法,还包括下列步骤在校准测试样品之前把预校准结合的对角线矩阵、校准结合的对角线矩阵和后校准结合的对角线矩阵相乘成总的滤波矩阵。
73.权利要求72的方法,其中峰形状和质量轴校准是通过在总的滤波矩阵与原始质谱数据之间的矩阵乘法而实现的,以及所述方法还包括创建另一个结合的对角线矩阵以估计校准的信号的质谱方差的步骤,该另一个结合的对角线矩阵对角上的每个非零元素等于在总的滤波矩阵中的相应的元素的平方。
74.权利要求73的方法,还包括下列步骤对校准的质谱数据施加加权回归运算,以得到对于该质谱峰的积分的峰面积、实际的质量和其它质谱峰数据中的至少一项。
75.权利要求74的方法,其中加权回归运算的权因子正比于质谱方差的倒数。
76.权利要求73的方法,还包括以下步骤对校准的质谱数据施加多元统计分析,以便对测试样品进行定量、识别和分类中的至少一项。
77.权利要求53的方法,还包括以下步骤执行从非均匀间隔的质量采集间隔到均匀间隔的质量间隔的预校准质量间隔调节;以及执行从均匀间隔的质量区间隔到报告的间隔的后校准质量间隔调节。
78.权利要求77的方法,其中所述执行预校准质量间隔调节和后校准质量间隔调节的步骤分别涉及到创建预校准结合的对角线矩阵和后校准结合的对角线矩阵,沿着各个矩阵中每个矩阵的结合的对角线的每个非零元素用于分别执行相应于预校准质量间隔调节和后校准质量间隔调节的内插功能,以及所述方法还包括下列步骤从该至少一个校准滤波器创建用于执行峰形状和质量轴校准的校准结合的对角线矩阵。
79.权利要求78的方法,还包括下列步骤在校准测试样品之前把预校准结合的对角线矩阵、校准结合的对角线矩阵和后校准结合的对角线矩阵相乘成总的滤波矩阵。
80.权利要求79的方法,其中峰形状和质量轴校准是通过在总的滤波矩阵与原始质谱数据之间的矩阵乘法而实现的,以及所述方法还包括下列步骤创建另一个结合的对角线矩阵以估计校准的信号的质谱方差,该另一个结合的对角线矩阵对角上的每个非零元素等于在总的滤波矩阵中的相应的元素的平方。
81.权利要求80的方法,还包括下列步骤对校准的质谱数据施加加权回归运算,以得到对于质谱峰的积分的峰面积、实际的质量和其它质谱峰数据中的至少一项。
82.权利要求81的方法,其中加权回归运算的权因子正比于质谱方差的倒数。
83.权利要求80的方法,还包括以下步骤对校准的质谱数据施加多元统计分析,以便对测试样品进行定量、识别和分类中的至少一项。
84.权利要求53的方法,还包括下列步骤通过连续灌注和在线混合的至少一项在事先或实时地把校准标准加到测试样品,以便在单独一次质谱采集中获取校准数据和测试数据。
85.一种处理原始质谱数据的方法,包括以下步骤把总的滤波矩阵施加到原始质谱数据,以得到校准的质谱数据,其中总的滤波矩阵通过以下步骤被形成从给定的校准标准,得到至少一个质谱峰形状函数;规定质谱目标峰形状函数;在得到的至少一个质谱峰形状函数与质谱目标峰形状函数之间执行去卷积运算;以及从去卷积运算的结果计算至少一个校准滤波器。
86.权利要求85的方法,其中所述施加步骤还包括把原始的质谱数据在与被总的滤波矩阵所需要的相同的质量轴上进行内插的步骤。
87.权利要求85的方法,其中所述施加步骤还包括把校准的质谱数据内插到与由总的滤波矩阵所给出要的不同的任何想要的质量轴的步骤。
88.权利要求85的方法,还包括以下步骤对校准的质谱数据施加加权回归运算,以得到对于质谱峰的积分的峰面积、实际的质量和其它质谱峰数据中的至少一项。
89.权利要求88的方法,其中加权回归运算的权因子正比于质谱方差的倒数。
90.权利要求85的方法,还包括对校准的质谱数据施加多元统计分析,以便对测试样品进行定量、识别和分类中至少一项的步骤。
91.一种用于对包含在位置范围内的峰的数据轨迹中的峰宽度进行归一化的方法,包括测量峰宽度作为峰位置的函数,以得到峰宽度的测量值;对测量值进行最小二乘拟合,以确定函数;以及在该范围内对该函数的数学的逆进行积分,以得到能用于使峰宽度归一化的变换函数。
92.权利要求91的方法,其中峰宽度的测量是基于相对于已知的标准进行的测量。
93.权利要求91的方法,还包括使用该函数来归一化峰宽度。
94.权利要求91的方法,其中该函数的逆函数是该函数的倒数。
95.权利要求91的方法,其中在积分时出现的积分常数当获得变换函数时被丢弃。
96.权利要求91的方法,其中该谱是来自液相色谱四极子飞行时间质谱仪的谱,以及该函数包含至少一个对数运算。
97.权利要求91的方法,其中该谱是来自傅立叶变换质谱仪的谱,以及该函数是对数函数。
98.权利要求91的方法,其中该谱是来自飞行时间质谱仪的谱,以及该函数是平方根函数。
99.权利要求91的方法,其中该谱是来自气相色谱质谱仪的谱,以及该函数包含对数函数。
100.权利要求91的方法,其中该谱是来自基体辅助的激光解吸附和电离飞行时间质谱仪的谱,以及该函数是倒数函数。
101.一种校准由仪器产生的数据的方法,包括对包含至少一个内部校准标准的数据执行外部校准,以提供外部校准的数据;以及使用外部校准的数据作为用于内部数据校准程序过程的输入数据。
102.权利要求101的方法,还包括通过在检测之前使用在线和离线混合之一来引入要测量的内部校准标准与样品。
103.权利要求101的方法,其中内部校准标准是样品中预先存在的成分。
104.权利要求101的方法,其中内部校准过程包括执行权利要求1-100的至少一项的步骤。
105.一种用于校准来自包含多个成分的样品的数据而不用把内部标准加到样品的方法,包括选择数据中至少一个峰用作为标准;根据该至少一个选中的峰导出校准滤波器;以及使用校准滤波器来分析数据中的其它峰,以便产生校准的数据。
106.权利要求105的方法,其中所述选择包括选择一个以上的峰,以及所述导出包括为每个选择的峰导出校准滤波器,该方法还包括内插,以产生至少一个在选择的峰之间的位置处的附加校准滤波器。
107.权利要求105的方法,还包括在产生校准滤波器时,把至少一个选择的峰同一个其宽度与原先的峰相比较是不重要的已知的函数进行卷积。
108.权利要求105的方法,还包括使得校准的数据被统计分析,以对测试样品进行定量、识别和分类中的至少一项。
109.权利要求105的方法,还包括执行权利要求1-100的至少一项的步骤。
110.一种计算机可读媒体,用于一个具有与其相关联的计算机的质谱仪中,该计算机执行对质谱仪产生的数据的数据分析功能,该媒体具有被置于其上的计算机可读的程序指令,用于执行权利要求1-27,53-103,或105-108中的任一项所要求的方法。
111.一种计算机可读媒体,用于一个具有与其相关联的计算机的仪器系统中,该计算机执行对仪器系统产生的数据的数据分析功能,该媒体具有被置于在其上的计算机可读的程序指令,用于执行权利要求28-49,或91-108中的任一项所要求的方法。
112.一种质谱仪,具有一个与其相关联的计算机,该计算机执行由质谱仪产生的数据的数据分析功能,该计算机执行权利要求1-27,53-103,或105-108中的任一项的方法。
113.一种仪器系统,具有一个与其相关联的计算机,该计算机执行由仪器系统产生的数据的数据分析功能,该计算机执行权利要求28-49或91-108中的任一项的方法。
全文摘要
一种用于得到用于校准质谱(MS)仪系统的至少一个校准滤波器的方法。对于给定的校准标准,得到在质谱范围中的测量的同位素峰集群数据。对于给定的校准标准计算出相对同位素丰度和相应于该丰度的同位素的实际的质量位置。规定处在各个质谱范围内的中心的质谱目标峰形状函数。在计算出的相对同位素丰度与质谱目标峰形状函数之间执行卷积运算,以形成计算的同位素峰集群数据。在测量的同位素峰集群数据与在卷积运算后计算的同位素峰集群数据之间执行去卷积运算,以得到该至少一个校准滤波器。为归一化峰宽度、组合内部和外部校准、以及使用选择的测量峰作为标准采取措施。该方法的各个方面适用于其它分析仪器。
文档编号G01R35/00GK1898674SQ200480038243
公开日2007年1月17日 申请日期2004年10月20日 优先权日2003年10月20日
发明者Y·王, M·古 申请人:瑟诺生物科学有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1