用于改进的质谱分析法定量作用的方法和装置制造方法

文档序号:2866547阅读:191来源:国知局
用于改进的质谱分析法定量作用的方法和装置制造方法【专利摘要】在此披露一种从质谱数据量化一种或多种分析物的方法,该方法包括:从自一个色谱柱洗脱的一个第一分析物组获得一个第一质谱数据组;从自一个色谱柱洗脱的一个第二分析物组获得一个第二质谱数据组;其中每个数据组中的大多数分析物是两个数据组所共有的;确定每个数据组中至少一些分析物的表观丰度;选择一种分析物作为一种目标分析物,并且依据多种分析物就保留时间而言与该目标分析物的局部性来为该目标分析物确定多种局部化相邻分析物;基于该第一数据组与该第二数据组之间在这些所确定的局部化相邻分析物的表观丰度方面的差异来确定该目标分析物的一个局部校正后丰度;并且基于该目标分析物的校正后丰度来对其进行量化。这些相邻分析物中的大多数的实际丰度在该第一数据组与该第二数据组之间典型地是大致不变的,并且可以用于比对这些数据组之间的丰度。【专利说明】用于改进的质谱分析法定量作用的方法和装置发明领域[0001]本发明涉及质谱分析法,更具体地说,涉及定量质谱分析法。该方法可以用于对例如从液相色谱质谱分析(LC/MS)获得的质谱数据进行分析。【
背景技术
】[0002]质谱分析法不仅越来越多地用于鉴定样品,而且用于确定这些样品的绝对量或相对量。对如蛋白质的生物分子的丰度中与疾病相关和/或治疗相关变化的鉴定和定量是一个重要的研究领域。例如多种特定蛋白质或其变型的丰度的变化可以表明一个有机体健康与患病之间的差异。此外,集中于蛋白质差异鉴定的蛋白质组学技术的发展可以提高我们对疾病的理解和治疗性干预的有效性。在此领域中,基于质谱分析法的蛋白质组学现在是广泛使用的技术。[0003]典型地,这种借助质谱分析法的定量作用是通过用一个参考样品(S卩,一个已知量的样品)的峰对一个样品的质谱峰进行校准来完成。当仅要求相对定量时,这可以通过将两个样品峰进行比较或将一个样品峰与典型地被同位素标记的一个参考峰进行比较来完成。在称为细胞培养中氨基酸稳定同位素标记(SILAC)的这样一种标记实验中,两个细胞群被供以一种氨基酸,该氨基酸在不同情况下被以不同方式进行同位素标记,这样使得含有这种肽的蛋白质将会由于同位素的已知质量差而在质谱中被容易地鉴定出来。来自这两个细胞群的蛋白质可以结合起来并且通过质谱分析法一起分析,并且所鉴定的它们的峰强度的比反映它们的丰度。利用同位素标记的方法的多个实例例如在以下文献中进行了描述:堀井.Y.等人,“部署在倒塌后的世界贸易中心的工人的血浆中的多氯化二苯并-P-二英、多氯化二苯并呋喃、多氯化联苯以及多氯化萘”,环境科学与技术,美国化学学会,2010,44,5188-5194(Horii,Y.etal,“PolychlorinatedDibenzo-p-d1xins,Dibenzofurans,Biphenyls,andNaphthalenesinPlasmaofWorkersDeployedattheWorldTradeCenteraftertheCollapse,,,EnvironmentalScience&Technology,AmericanChemicalSociety,2010,44,5188-5194);阿门塔.J.M.等人,“使用稳定同位素标记和PQD线性离子阱MS技术的蛋白质差异表达分析”,美国质谱学会杂志,2009年,20,1287-1302(Armenta,J.M.etal,“DifferentialProteinExpress1nAnalysisUsingStableIsotopeLabellingandPQDLinear1nTrapMSTechnology,,,J.Am.Soc.MassSpectrom.,2009,20,1287-1302);以及康坦*G.T.等人,“结合基于蛋白质的IMAC、基于肽的IMAC以及MudPIT用于高效磷酸蛋白质组分析”,蛋白质组研究杂志,2008,7,1346-1351(Cantin,G.T.etal,“CombiningProtein-BasedIMACjPeptide-BasedIMACjandMudPITforEfficientPhosphoproteomicAnalysis”,JournalofProteomeResearch,2008,7,1346-1351)。[0004]为了便于使用标记进行量化,德国的马克斯.普朗克生物化学研究所(MPI)的“MaxQuant”包目前处在数据处理的最前沿,如在以下文献中所描述的:考克斯.J.和曼.Μ.,“MaxQuant”实现了高的肽鉴定率、个体化ppb_范围质量准确度以及蛋白质组范围内的蛋白质量化,“自然生物技术”,26,1367-1372(2008)(Cox,J.&Mann,Μ.,“MaxQuantenableshighpeptideidentificat1nrates,individualizedppb—rangemassaccuraciesandproteome-wideproteinquantificat1n”,NatureB1technology26,1367-1372(2008));以及考克斯.J.和曼.Μ.,“确定和改进轨道阱中的蛋白质组测量的质量精度和准确度的计算原理”,美国质谱学会杂志,2009,20,1477-148(Cox,J.&Mann,Μ.,“Computat1nalPrinciplesofDeterminingandImprovingMassPrecis1nandAccuracyforProteomeMeasurementsinanOrbitrap,,,JournaloftheAmericanSocietyforMassSpectrometry,2009,20,1477-148)。[0005]在美国2008/091359中以及在马尔科森思-阿霍等人:“使用多种内标物优选的用于代谢组学数据的归一化方法”,BMC生物信息学,生物医学中心,伦敦,英国,卷8,第I期,2OO7年3月I5日(2OO7-O3-15),第93页(MarkoSys1-Ahoetal:"Normalizat1nmethodformetabolomicsdatausingoptimalselect1nofmultipleinternalstandards",BMCB1INFORMATICS,B1medCentral,London,GB,vol.8,n0.1,15March2007(2007-03-15),page93)中,描述了一种用于代谢物的定量方法,其中在样品中有意掺入多种内标物。这些标准物可以具有与某些分析物相同的化学结构,但它们都使用同位素标记来合成。在该方法中,归一化值是基于有限数目的有意掺入的标准物的已知和测得的丰度来计算。使用同一组标准用于归一化所有代谢物,并且在用作标准物的分子与作为分析物的那些分子之间存在明显的区别。它通过测量标准物和分析物在一组LC-MS运行内的协变性来估计标准物与目标分析物之间的化学相似性,并且从这一协变性推断内标物的重量。总体而言,该算法解决了在一组LC-MS运行内,即从一次运行到另一次运行,仪器响应经历变化的问题,并且不考虑单次LC-MS运行期间出现的变化。[0006]然而,实验中对同位素标记的需要增加了复杂性和成本。此外,在一些实验中,将峰强度与存在于数据组内的校准物进行比较是不可行的,并且因此所谓的无标记定量是必要的。[0007]—种无标记方法在维纳.M.等人,差分质谱分析法:一种用于发现复合肽与蛋白质混合物中的显著差异的无标记LC-MS方法,分析化学,2004,76,6085-6096(Wiener,Μ.etal,DifferentialMassSpectrometry:ALabel-FreeLC-MSMethodforFindingSignificantDifferencesinComplexPeptideandProteinMixturesAnalyticalChemistry,2004,76,6085-6096)中进行了描述。在这种方法中,一种算法被用来发现从两个样品取得的质谱分析法数据中的差异。该算法使用质荷比(m/z)、保留时间以及强度以每种(m/z,时间)组合对来自这些样品的该数据进行比较。使用随时间(即,在一个足够长的时间范围内)保持不变的基于t检验的统计学上显著的差异来进行定量。[0008]用于蛋白质、肽以及代谢物的无标记、半定量的差异表达分析的被称为SIEVE的商业软件可以从赛默飞世尔(ThermoScientific)购得,该软件减小了样品之间色谱可变性的影响。[0009]在美国2003-111596(贝克尔(Becker)等人)中,一种定量方法利用数据的归一化(缩放),但缩放对象是整个质谱,即,在一个单一质谱中出现的所有离子信号。因此,贝克尔等人使他们的“峰”归一化而不考虑它们的保留时间,即,在整个LC-MS实验中一致地进行。由于贝克尔等人针对整个LC-MS运行使用相同的归一化值,他们补偿了不同LC/MS运行之间仪器响应的平均差异,但他们无法补偿诸如发生在同一LC-MS运行内的电喷雾流、电离效率以及仪器灵敏度的波动之类的时间相关的可变性来源。[0010]然而,无标记方法使定量数据更容易变化。这类实验典型地是采用电喷雾离子化(ESI)的液相色谱质谱分析法(LC/MS)实验。除了样品制备和色谱分析中的变化(可以被最小化)之外,在无标记LC/MS实验中引起肽丰度变化的一个主要因素是ESI流的波动。这些波动在所有时间尺度上发生,从几毫秒到几分钟和几小时。虽然总ESI流可以通过仪器来监测并且记录在数据组中,目前将它考虑在内导致质量改进有限或根本没有改进。这大概是因为造成ESI流的主要因素是背景离子,这些背景离子的组成对于LC梯度、环境空气或雾化气体质量以及喷雾条件非常敏感。[0011]鉴于以述现有技术,存在提高LC/MS中量化准确度的需要。所希望的是使无标记量化的准确度更接近标记实验(例如,iTRAQ、TMT以及SILAC)的准确度或与其相似。在此背景下做出本发明。【
发明内容】[0012]根据本发明的一个方面,提供了一种从质谱数据对一种或多种分析物进行量化的方法,该方法包括:[0013]从自一个色谱柱洗脱的一个第一分析物组获得一个第一质谱数据组;[0014]从自一个色谱柱洗脱的一个第二分析物组获得一个第二质谱数据组;其中每个数据组中的大多数分析物是两个数据组所共有的;[0015]确定每个数据组中至少一些分析物的表观丰度;[0016]选择一种分析物作为一种目标分析物,并且依据多种分析物就保留时间而言与该目标分析物的局部性(locality)来为该目标分析物确定多种局部化相邻分析物;并且[0017]基于在该第一数据组与第二数据组之间在这些所确定的局部化相邻分析物的表观丰度方面的差异来确定该目标分析物的一个局部校正后丰度。[0018]本发明进一步提供了基于该目标分析物的校正后丰度来对其进行量化。量化该目标分析物可以是量化该目标分析物的一个相对量或一个绝对量。[0019]优选地,该方法进一步包括选择一种或多种另外的分析物作为目标分析物,并且对于作为一种目标分析物的每种这样的另外的分析物:[0020]依据多种分析物就保留时间而言与这种另外的分析物的局部性来为这种另外的分析物确定多种局部化相邻分析物;[0021]基于在该第一数据组与该第二数据组之间在这些所确定的局部化相邻分析物的表观丰度方面的差异来确定这种另外的分析物的一个局部校正后丰度;并且[0022]任选地,基于这种另外的分析物的校正后丰度来量化这种另外的分析物;其中该多种所确定的局部化相邻分析物对于至少一些不同的目标分析物而言是不同的。[0023]该方法优选(虽然并非必要地)至少部分地在计算机软件中实施。质谱数据可以在一台质谱仪上获得,并且该数据的处理可以在诸如计算机的一个数据处理系统中实施。该质谱仪可以包括该数据处理系统。[0024]根据本发明的另一个方面,提供了一种具有用于实施本发明的方法,更确切地说这些数据处理步骤的程序代码元素的计算机程序。[0025]根据本发明的再一个方面,提供了一种携载该具有用于实施本发明的方法,更确切地说这些数据处理步骤的程序代码元素的计算机程序的计算机可读介质。[0026]根据本发明的又一个方面,提供了一种包括用于实施本发明的方法的一个数据处理系统的质谱仪。该数据处理系统优选是被编程用于实施本发明的方法的一个计算机。[0027]根据本发明的另外一个方面,提供了一种处于一个控制器的控制下的质谱仪,其中该控制器被配置成使得该质谱仪可操作用于执行根据本发明的方法的步骤。该控制器优选被编程为具有根据本发明的计算机程序。[0028]本发明可以显著改进对质谱数据,特别是色谱质谱数据的处理,以提高分析物,特别是生物分子诸如蛋白质、肽、脂质以及其他实体的定量的准确度。[0029]本发明通过比对复杂质谱(特别是LC/MS蛋白质组学)数据组之间的离子丰度(即,峰强度)实现了无标记量化的准确度的提高。这种比对减少了例如电喷雾(ESI)流的波动的影响,这种影响是无标记定量蛋白质组学中的一个主要误差来源。已经发现,在至少一些情况下,本发明所提供的定量准确度可以接近SILAC实验的定量准确度。[0030]作为通过执行本发明的方法实现的数据质量提高的结果,可以使用更小数量的重复实验来实现统计学上显著的结果。相反,对于给定数量的重复测量结果,数据的统计数据得到改进,从而例如在诊断应用中得到更大的结果可靠性。[0031]本发明在采用快速和超快色谱的LC/MS实验中可以是有用的。[0032]有利地,本发明所提供的改进是通过数据处理提供的,而不需要在样品制备、硬件或LC/MS实验工作流程方面进行改变。[0033]本发明优选是部分通过计算机实施的,特别是这些数据处理步骤,并且因此优选包括一种自动数据分析方法。该方法在计算上是高效的。[0034]与现有技术相比,本发明不仅考虑了色谱图至色谱图间的丰度变化(例如,由于多种因素,如不精确稀释),而且对一次色谱运行内可能较显著的仪器响应变化(例如,由于ESI流波动)作出校正。[0035]与上面引用的维纳.Μ.等人相比,本发明实施对目标分析物丰度的校正,该校正是基于对处于该目标分析物的保留时间(即,在液相色谱柱中的保留时间)相近局部的多种相邻分析物的丰度的比对。与美国2008/091359相比,并未向样品中掺入标准物,并且因此没有浓度是先验已知的。代替掺入的标准物,这些相邻分析物被用作“标准物”。也就是说,对于一个归一化步骤,本发明利用(在一个局部保留时间内)天然存在于样品中的所有可获得分子的测得值,而没有对这类组分的数量或选择的任何其他特殊限制。[0036]本发明不同于贝克尔等人,在贝克尔等人的方法中,同一归一化值被计算用于整个MS实验,无论它是一次LC-MS运行或一个单独MS谱。然而与现有技术的全局归一化方法(单个归一化值用于整个LC-MS实验)相比,在本发明的方法中,采用了对同一LC-MS运行的不同部分以不同方式缩放的一种局部归一化法。[0037]本发明利用了以下事实:每个数据组中的大多数分析物是两个数据组所共有的,即,它们存在于两个数据组中;并且典型情况是,在例如蛋白质组学实验中,这些共有分析物中的大部分均具有在多个样品之间大致不变的实际丰度(即,真实丰度)。在一个典型的蛋白质组学实验中,所有肽中的大部分具有小于实验不确定度(>10%)的一个实际丰度变化,即被认为是大致不变的。因此,该第一分析物组与该第二分析物组典型地在它们的特性方面密切相关,其中这些分析物中的大多数的实际丰度在该第一组与该第二组之间大致不变。在本发明中使用这些不变的分析物(即,它们在这两个不同样品中具有加权的丰度)用于丰度比对或配合。换句话说,在保留时间方面邻近一种目标分析物的多种不变分析物可以用作参考物来校正例如该目标分析物在这一保留时间时在数据组之间的丰度,因为例如电喷雾流的波动和其他因素以相同程度影响所有同时洗脱的分析物。在复杂混合物例如全蛋白质组消化物中,分析物密度是非常高的,例如,成千上万的肽经约100分钟的一个LC梯度洗脱,形成每分钟>10肽的平均密度,因此在整个洗脱时间内存在足够的分析物用于代表性统计分析。[0038]本发明借以提供多种优点的手段的进一步细节在下面给出。[0039]发明详细说明[0040]该第一分析物组典型地是来自一个第一样品或第一样品组。该第二分析物组典型地是来自一个第二样品或第二样品组。该第一样品和第二样品或第一样品组和第二样品组可以分别为案例样品和对照样品。该第一分析物组因此可以是一个案例分析物组。该第二分析物组因此可以是一个对照分析物组。这样,一种或多种分析物的绝对量或相对量可以在该案例组与该对照组之间进行比较。该第二或对照样品可以是包含已知丰度或浓度的一种或多种分析物的一个参考样品,从而允许确定该第一或案例样品中一种或多种分析物的绝对丰度。可替代地,该第二或对照样品可以具有未知丰度或浓度的分析物,从而仅允许确定该第一或案例样品中分析物的相对丰度(即,相对于该第二或对照样品中的丰度)。例如在差异表达实验中所要求的常常仅是相对丰度。这些样品可以是例如一个蛋白质差异表达实验中的两个不同样品。应了解,本发明可以应用于多于两个样品的情况,并且因此,虽然为简单起见,在此主要关于第一样品和第二样品或第一样品组和第二样品组(从其分别产生第一数据组和第二数据组)对本发明进行描述,但本发明的范围(包括如权利要求书中所限定的)意在包括具有至少两个样品的实施例,即,不排除具有任何另外数量的样品的实施例。[0041]该第一样品和/或第二样品各自可以是通过汇集多个其他样品而制成的样品。以这种方式汇集可以例如减小样品之间基质变化所带来的影响。血液样品汇集就是一个例子。[0042]本发明典型地可以应用于例如像血液、尿液、血清、细胞裂解物等的生物样品中分析物的分析。[0043]该第一样品和第二样品(案例和对照)在它们所包含的分析物的特性方面典型地是相似的,并且在一些实施例中,就它们所包含的分析物的特性而言可以是近乎相同的(可能甚至是相同的)。[0044]在本发明中,一个特征是:每个数据组中的大多数分析物(即,大于50%)是两个数据组所共有的,优选每个数据组中至少60%、至少70%、至少80%或至少90%(按优选性渐增顺序)的分析物是两个数据组所共有的。更优选地,每个数据组中超过95%的分析物是两个数据组所共有的。在一些情况下,每个数据组中的分析物的高达98%,或者在某种情况下更多可以是两个数据组共有的。[0045]本发明通过以下方式利用了该第一分析物组和第二分析物组的组成的这种相似性:基于数据组之间分析物的表观丰度的差异,执行处于每种目标分析物的保留时间局部的分析物丰度(即,质谱峰强度)的局部比对。由此可以针对每个目标分析物获得比使用现有技术无标记定量分析方法可能实现的丰度校正更准确的一种丰度校正。分析物丰度局部比对能够考虑到ESI流波动,这种ESI流波动可能在很短的时间尺度上发生并且无法仅仅通过总数据组的彼此缩放或归一化而得到充分考虑。[0046]这些样品可以包含例如,蛋白质、肽、脂质和其他生物分析物,以及非生物分析物。本发明可以应用于血液、尿液、血清、细胞裂解物或其他样品类型中的一种药物的代谢物的分析。因此,这些分析物可以是任何上述分析物,但不限于任何上述分析物,即蛋白质、肽、脂类、药物和/或代谢物。在蛋白质的情况下,从色谱柱洗脱并且经受质谱分析的分析物将是来自蛋白质消化的更小的肽。然而,从通过本发明的方法对这些肽进行的定量分析,可以获得蛋白质的定量。本发明在其中分析物是来自蛋白质混合物的消化的肽的蛋白质组学中尤其有用。[0047]有利地,本发明可用于无标记分析物,S卩,非同位素标记的分析物和非化学标记的分析物。然而,应了解,本发明还可以应用于标记分析物的测量。[0048]质谱数据优选是液相色谱质谱数据。质谱数据可以是洗脱分析物种类(即,母分析物)的质谱数据。任选地,质谱数据可以包括MS/MS或MSn数据,S卩,其中在MS的一个第一阶段后,依据这些洗脱分析物的质荷比(m/z)对它们进行选择并且然后使其成碎片,这样使得在MS的一个第二阶段中测量它们的碎片(B卩,MS/MS分析)。还可以执行MS的又一些另外的阶段以获得MSn数据。在事先未知这些分析物的特性所以有必要使用质谱数据鉴定这些分析物的情况下,可能希望使用MS/MS或MSn测量结果。因此,获得这些质谱数据数据组中的一个或两者的一个或多个步骤可以包括从自一个色谱柱洗脱的分析物组获得一个MS/MS或MSn质谱数据组。确切地说,该方法可以包括如下两个数据采集步骤之一:从自一个色谱柱上洗脱的该第一分析物组获得一个第一MS/MS或MSn质谱数据组;以及从自一个色谱柱上洗脱的该第二分析物组获得一个第二MS/MS或MSn质谱数据组。[0049]如本领域所已知的,MS/MS或MSn数据可以用于数据库搜索,或用于从头开始方法,以鉴定这些分析物。这种方法可以应用于多种分析物的复杂混合物,例如像来自蛋白质消化的多种肽的情况。这种分析物鉴定可以在后处理中执行或者在数据采集期间即时执行。然而,在这些分析物的特性例如在LC/MS实验之前已经已知的情况下,可以不要求MS/MS或MSn采集。[0050]该第一质谱数据组和/或该第二质谱数据组可以各自独立地是从单次色谱洗脱获得的数据或从若干次色谱洗脱获得的数据(例如,技术性重复数据或再次测量结果)。该第一组和/或第二组各自甚至可以是来自不同的(但密切相关的)样品的若干次色谱洗脱的数据(即,非技术性重复数据)。[0051]本发明最优选是计算机实施的。本发明包括处理所获得的质谱数据组,该处理优选是使用一个计算机执行的(即,是计算机实施的)。[0052]对这些质谱数据组的处理包括:确定每个数据组中至少一些分析物的表观丰度;选择一种分析物作为目标分析物并且确定就保留时间而言该目标分析物的多种局部化相邻分析物;并且基于该第一数据组与第二数据组之间这些相邻分析物的表观丰度的差异确定该目标分析物的局部校正后丰度。进一步的处理步骤可以如下所述执行,这些处理步骤优选是计算机实施的。[0053]在例如其中这些数据组中的一些或所有分析物的化学特性不是已知的或不是完全已知的或不是完全确定的实施例中,该方法可以进一步包括以下一个步骤:在该局部丰度缩放步骤(见下文)之前并且优选在该表观丰度确定之前,优选使用MS/MS或MSn数据鉴定这些分析物(例如,肽)中的一些或全部。这些分析物可以使用一种数据库搜索以(例如)将所获得的MS/MS(这里还包括MSn)峰图案与已知分析物的峰图案或该数据库中所包含的理论图案进行匹配来鉴定,或者通过从头开始方法来鉴定。该搜索可以包括将所测得的MS/MS碎片谱与假设或可能包含在该样品中的分析物的理论碎片或存储库碎片进行比较。因此,这些MS/MS测量结果可以使得能够从一种分析物的碎片质谱数据鉴定该分析物。作为一个例子,如果该样品是酵母,可以使用一种计算机算法将一个酵母蛋白质数据库“消化”成多种肽,并且使用另一种算法使这些肽“成碎片”,以便给出每种肽的预测质量数和每种蛋白质的预测肽数。这典型地被存储在一个导出数据库中,该导出数据库典型地通过肽质量来索引。这一操作的实施方式可以发生变化,例如,MS/MS模拟可以即时完成。因此,在该搜索中,可以使用一种前体离子的质量来鉴定接近这个质量的多种候选肽,并且将为这种肽计算出的MS/MS碎片与该前体离子的测得MS/MS谱进行比较以发现最接近的候选匹配。这对这种MS/MS谱解释存在各种程序,流行的一些是Sequest和Mascot。[0054]在其他情况下,这些分析物中的一些或全部可以是已知的,即预先鉴定的,这样使得它们的化学特性是已知的,并且因此它们也可以被称为已鉴定分析物,尽管不需要或执行一个数据处理步骤来鉴定它们。因此,在此术语已鉴定分析物意指例如如已描述的通过使用MS/MS或MSn数据或者在实验开始前,或者在数据处理前,或者在鉴定步骤后已得知其化学特性的一种分析物。[0055]在一些情况下,MS/MS或MSn鉴定可以在一个单独实验中有可能对具有更高可获得性的一个相关样品(例如,对更便宜的一个样品,特别是在样品量非常有限的情况下)执行。[0056]任选地,可以使这些分析物的表观丰度经受一种所谓的全局缩放或归一化。这包括调整一个或两个数据组中的表观丰度,这样使得每个数据组的总分析物丰度是大致相同的。[0057]该全局缩放或归一化可以包括缩放该第一质谱数据组和/或该第二质谱数据组以使得在缩放后它们具有相同的集成总离子流(TIC)的一个步骤(全局缩放)。优选地,该第一质谱数据组和/或该第二质谱数据组的这种缩放包括对一个组中的所有数据应用一个共同缩放,这样使得在缩放后,该第一组和第二组具有相同的积分总离子流(TIC)。因此,在这种缩放后,该第一质谱数据组中所有分析物的总丰度(如从质谱数据中这些分析物的离子峰强度确定的)变得与该第二质谱数据组中所有分析物的总丰度相同。例如,这种所谓的数据全局缩放可以这样执行以使得每个数据组的TIC在缩放后给出一个共同积分值,例如1,或100,或IX16或IX19任意单位(a.u.)。然后,后续步骤仅使用这些全局缩放的数据组,其中每个数据组的总分析物丰度已变得大致相同。该任选的全局缩放步骤(缩放该第一质谱数据组和/或该第二质谱数据组以使得它们具有相同的积分总离子流(TIC))可以在该任选的鉴定分析物的步骤之后或之前执行。这样一种任选全局缩放步骤形式在使用时,优选在该局部缩放或峰比对步骤或表观丰度确定之前执行,或者甚至在该分析物鉴定步骤之前执行。[0058]在另一个实施例中,该全局缩放或归一化可以包括调整所确定的在一个或两个数据组中这些分析物的表观丰度(即,在这些分析物丰度已被确定之后),以便使得每个数据组的总(表观)分析物丰度变得相同。[0059]每个质谱数据组中已鉴定分析物的表观丰度可以按照各种方式来确定,该表观丰度是从该质谱数据(在根据本发明确定校正后丰度之前)确定的丰度。在一个优选实施例中,在每个数据组中,针对每种已鉴定分析物将MS数据中来自一种已鉴定分析物的离子的所有峰集合在一起并且确定集合在一起的这些峰下方的面积。应了解,来自同一分析物的离子的不同峰的存在可能是由于例如不同的电荷状态和不同的同位素。由此确定的面积因此表示该分析物在相应数据组中的丰度。还应了解,在其他实施例中,有可能使用少于所有的来自每种分析物的离子的峰来表示该分析物丰度。例如,有可能使用每种分析物的指定多个峰,或仅使用每种分析物的基峰或最强峰。可替代地,定量信息可以这样导出:基于对该分析物的同位素分布的一个拟合,例如,使用用于该物质类别的一个一般模型分布(例如,“求平均值”)或一种已鉴定分析物的理论同位素分布。[0060]在一个任选步骤中,该方法可以进一步包括创建这些分析物的一个提取离子色谱图(XIC),g卩,用于每个数据组的一个XIC。这优选涉及将来自单种分析物的多种例如所有离子(即,所有这类离子的峰)集合在一起,对所有已鉴定分析物执行这种集合,并且相对保留时间标绘这些所集合的离子。这提供了这些已鉴定分析物的一个Xic,S卩,包含每种分析物相对于保留时间的峰。该质谱数据中的峰(m/z峰)由于该同一分析物的不同离子应具有与彼此相同的保留时间内的峰。通过将各单种分析物的多种例如所有离子集合在一起,统计数据可以得到改进。单种分析物的不同类型的离子(峰)优选包括所有的电荷状态和同位素。然而,作为将单种分析物的所有离子集合在一起的替代方案,有可能使用少于所有的每种分析物的离子来执行该方法。例如,可以仅将每种分析物的一些离子(即,仅一些峰)集合在一起,而例如忽略最弱离子中的一种或多种。在一些情况下,仅使用单种离子,例如最强离子或基峰可能就足够了。因此,该XIC可以通过相对保留时间标绘代表每种分析物的这类代表性离子来提供。用于色谱峰检测和形成该XIC的方法是本领域中已知的。可以与本发明一起使用的一种优选的这样的方法在EP2322922中进行了描述。当结合使用诸如在EP2322922中所描述的一种方法与一种良好的色谱(B卩,保留时间)比对方法时,鉴定步骤可以是不必要的。这在其中“基质”经常不能被很好地理解的无标记差异代谢组学或毒理学实验中是有帮助的。[0061]可以对该XIC执行多个任选处理步骤,包括色谱峰形状的平滑化或峰拟合以提高数据质量。[0062]该XIC可以用于针对每个分析物峰确定峰面积(或高度)来表示表观丰度以及保留时间。优选使用峰的质心来确定一个保留时间。质心方法是众所周知的。可以使用其他已知的峰位置确定方法,例如使用一个模型峰或抛物线的峰拟合。[0063]当比较两个或更多个XIC时,如下文所描述,可以发现这些色谱图在形状方面显著不同。如果是这样,它们可能仍然具有形状对应的一个共同部分(例如,在最坏情况下,其中仅三个最高时间点对应)。在这种情况下,为了确定色谱图之间的丰度变化,可能优选仅使用该提取离子色谱图的该“共同的”或“一致的”部分用于计算一个丰度比。[0064]该XIC优选在确定就保留时间而言每种目标分析物的η种相邻分析物之前执行。因此,这η种相邻分析物可以从该XIC确定。然而,有可能通过直接挖掘该质谱数据组来得到这η种相邻肽的个体分析物丰度和保留时间数据,而无需创建一个单独的XIC。[0065]这些已鉴定分析物在两个数据组中被比对,S卩,源自每种已鉴定分析物的多个峰在每个数据组中被定位并且因属于同一分析物而彼此相关联。[0066]如果任何分析物在一个数据组中具有零丰度,优选在进一步处理中将它忽略。可以例如通过针对每种分析物将该分析物在该第一数据组和第二数据组中的丰度相乘来检测零丰度的存在,这样使得任何零值指示该分析物将不被用于进一步处理(即,不用于丰度校正)。在其他实施例中,有可能使用在一个数据组中具有良好信噪比但在另一个数据组中具有零丰度的一种分析物的丰度。在这类情况下,该分析物的相对丰度可以被称为该第二数据组中的噪声级。[0067]如果该第一数据组和该第二数据组各自包括来自若干重复实验的多个数据组(这是常有的情况),那么应将这些重复数据组相互比对。也就是说,每种分析物的色谱峰应在这些重复数据组中进行比对。这适宜地是通过选中这些重复数据组中的一个并且和将一个或多个其他重复数据组与所选中的一个进行比对来完成。可替代地,如果针对该第一数据组和该第二数据组各组使用大量的重复数据组,那么可以优选针对每组使用作为所有这些重复实验的平均值的一个平均数据组。这些(优选保留时间比对的)重复组可以加在一起,例如以便形成该第一数据组抑或第二数据组。[0068]如现在更详细地描述的执行基于在一种目标分析物局部的多种相邻分析物的一种局部丰度校正或缩放。[0069]在选择一种分析物即一种已鉴定分析物作为目标分析物的步骤中,优选该步骤包括从该第一质谱数据组中选择一种分析物。在选择一种已鉴定分析物的步骤中,该已鉴定分析物是典型地(但非必须地)在第一数据组和第二数据组中均出现的一种分析物。该目标分析物典型地是需要进行量化的一种分析物。[0070]这些局部化相邻分析物是两个数据组所共有的在保留时间方面与该目标分析物近邻的已鉴定分析物。优选地,使用在跨越该目标分析物的保留时间的一个合适时间间隔(局部时间间隔)内尽可能多的分析物作为相邻分析物,优选包括该目标分析物本身作为这些相邻分析物之一用于丰度比对。优选地,用于限定相邻分析物的这种局部时间间隔是至少与该目标分析物的色谱峰宽度(在峰基处测得)一样宽,并且可以典型地近似为该目标分析物的色谱峰宽度。用于限定相邻分析物的该局部时间间隔可以小于该目标分析物的色谱峰宽度的两倍。这种局部时间间隔是例如最长达0.5分钟、或最长达I分钟或最长达2分钟或最长达3分钟,例如0.5分钟至2分钟的一个时间间隔。然而,如果需要的话,该时间间隔可以比这个更长。该时间间隔跨越该目标分析物的保留时间。优选地,该目标时间的保留时间被定位在用于限定相邻分析物的时间间隔的中间处或中间附近(即,大致在中间处)。这样,典型地,将从该目标分析物的保留时间的任一侧选择相邻分析物,并且该目标分析物的保留时间的任一侧的相邻分析物的数量相似,或理想地相等。[0071]局部化相邻分析物的数量η可以取决于样品中存在的种类的数量。相邻分析物的数量η可以从只有几种如3或5种到7种。相邻分析物的数量η可以是例如多达约15种分析物、或多达约25种、或多达约50种,或多达约100种分析物。因此,相邻分析物的数量η可以是在3至100、或3至50、或3至25,或3至15种这些范围中的一个范围之内。相邻分析物的数量η可以是在3至15、或15至25、或25至50、或50至100,或甚至多于100种这些特定范围中的一个范围之内。然而,η〈分析物总数量,并且典型地η〈〈分析物总数量,即,η远少于分析物总数量,该总数量可能是几百或几千,如在蛋白质组学实验中的那样。该η种相邻分析物组优选包括该目标分析物本身。多达约15种相邻分析物是统计学上有效的同时是在计算上高效的。更多数量的相邻分析物可能不会进一步显著改进统计数据,但总是使用更多数量的分析物会增大计算要求。数量η优选是至少3、或4或5,特别是至少5。因此,一个有效数量η典型地是从5至25,更优选5至15,例如6、7、8、9或10。这些相邻分析物应优选是就保留时间而言大致位于最接近该目标分析物处的那些η种分析物,其中该目标分析物本身优选包括在η中。典型地,这η种相邻分析物中的一些分析物将具有比该目标分析物更长的保留时间而一些具有更短的保留时间,即,这些相邻分析物就保留时间而言典型地将位于该目标分析物的任一侧。相邻分析物组可以跨越例如最长达0.5分钟、或最长达I分钟或最长达2分钟或最长达3分钟的一个保留时间范围。[0072]对于这些相邻分析物,如果任一种具有一个“可疑的”峰形状,例如像一个“尾巴”,那么可以将该可疑部分排除在考虑之外,或者可以在后序处理中放弃将该分析物作为一种相邻分析物一起考虑。[0073]确定该目标分析物的局部校正后丰度的步骤可以涉及确定该目标分析物在该第一数据组和第二数据组中的至少一个中的校正后丰度。该校正后丰度可以是一个校正后绝对丰度或相对丰度,例如在该第一数据组与第二数据组之间的一个校正后丰度比。基于在该第一数据组与第二数据组之间这些相邻分析物的丰度差异来确定对该目标分析物的丰度的一个校正的过程优选包括:基于在该第一数据组与第二数据组之间这些相邻分析物的丰度差异来确定一个或多个校正因子,并且将该一个或多个校正因子应用于该目标分析物的丰度以提供该校正后丰度。[0074]优选是一个或多个缩放因子的该一个或多个校正因子优选可以应用于该第一质谱数据组或第二质谱数据组或两者,以便改进在该第一数据组与第二数据组中这些相邻分析物的表观丰度之间的相关性。也就是说,将该一个或多个校正因子应用于这些相邻分析物的丰度改进了在该第一数据组与第二数据组中相邻分析物的表观丰度之间的相关性。由于实验的性质(例如,在蛋白质组学中),这些相邻分析物中的大多数在它们的实际丰度方面在该第一数据组与第二数据组之间应是大致不变的,这样使得改进的相关性表示定量数据值的改进。可以使用例如一个线性相关因子来显示在该第一数据组与第二数据组中这些相邻分析物的丰度之间的一种改进的相关性。[0075]基于在该第一数据组与第二数据组之间这些相邻分析物的丰度的差异的该丰度校正因此优选是基于在该第一数据组与第二数据组之间在实际丰度方面大致不变的那些相邻分析物。大多数相邻分析物优选在该第一数据组与第二数据组之间在实际丰度方面大致不变。更优选地,这些相邻分析物中的至少60%、或70%、或80%、或90%(按优选性增加顺序)在该第一数据组与第二数据组之间在实际丰度方面大致不变。[0076]可能是有利的是,当任何分析物在这些数据组之间的丰度比通过一次先前计算已被确定为显著改变时,不将这些分析物作为相邻分析物考虑。相反,已确定的显著改变的相邻分析物,例如强且高可信度的相邻分析物,可以用于校正,不过使用它们的所确定的丰度t匕。如果“不变”相邻分析物的数量变得太小,那么后者可能是必要的。如果要采用这些类型的“程序”,可能明智的是使用至少一种两遍(two-pass)校正方法。换句话说,执行第一遍该校正方法,其中确定所有丰度比(即,针对这些数据组中已鉴定的所有分析物)并且应用这些校正,接着是使用来自该第一遍的“标志”进行第二遍该方法,其中标志可以是例如将一种分析物排除在考虑之外,或者针对一种分析物使用一个所确定的比率或丰度的一个指示。[0077]该一个或多个校正因子可以应用于在该第一数据组或该第二数据组中任一组或两组中该目标分析物的丰度。基于在该第一数据组与第二数据组之间这些相邻分析物的丰度差异来确定对该目标分析物的丰度的一个校正的过程优选包括以下步骤:从这些相邻分析物确定一个值!(^^形式的一个校正因子,表示一个比率K的一个集中趋势值,其中对于每种相邻分析物,K为在该第一质谱数据组中它的丰度与在该第二质谱数据组中它的丰度的一个比率;并且基于该丰度比K的集中趋势值,确定该目标分析物的一个校正后丰度。的确定在以下进行更详细地描述。可以是比率K的使用或不使用加权的一个均值或中值。[0078]在这类实施例中,一旦这些相邻分析物已被确定,对于每种相邻分析物,该方法优选包括计算在该第一质谱数据组中它的丰度与在该第二质谱数据组中它的丰度的一个比率K。为了计算每种相邻分析物的丰度比,有可能例如使用在该第一质谱数据组中该分析物的丰度A1与在该第二质谱数据组中该分析物的丰度A2的比率K,S卩,K=A1;/A2。在这种情况下,为了计算该目标分析物的一个校正后丰度,将在该第一数据组中该目标分析物的丰度除以平均比率可替代地,为了计算该目标分析物的一个校正后丰度,将在该第二数据组中该目标分析物的丰度乘以平均比率K。例如,如果与在该第二数据组中这些相邻分析物的丰度(A2)相比,在该第一数据组中这些相邻分析物的丰度(A1)是大约两倍大,从而使得2,那么将在该第一数据组中该目标分析物的丰度除以?2的!(^^给出该校正后目标分析物丰度。可替代地,在该第二数据组中的丰度可以通过将它乘以?2的来校正。[0079]比率K可以是在不同数据组中一种分析物的丰度的一个简单比率,S卩,不使用加权(也称为加权值为I)。然而,假设更强峰(即,具有良好S/N的那些)具有较小误差,优选地,给予每个比率K一个加权,这是例如通过采用上述丰度比并且将其乘以一个加权因子,或者以其他方式将一个加权因子W与每个比率K相关联而实现的。这种加权因子因此相对于更强峰应优选减小更小强度的峰的影响。一个合适的加权因子可以是在这些数据组之一(例如,该第二(对照)数据组)中该分析物的丰度(例如,A2)的平方根(sqrt)。因此,该比率K可以是例如,K=(A1A2).W,其中例如W=Sqrt(A2)。一个平方根加权例如良好地反映了TOF仪器中的离子统计数据影响,而对于FTMS仪器,使用S形函数的一个加权可以是优选的。因此,一个加权均值i可以被确定并且用作该加权均值通过以下公式给出:_Zs,農ΓI;1=1II[0080]K=-1r'IV.1=tI[0081]其中η是如前文的相邻分析物数量,并且Wi是用于第i种分析物的加权,并且Ki是第i种分析物的比率K。[0082]比该均值或一个加权均值更好的是使用用于!(^^的中值或最优选地用于的一个加权中值,如下面更详细地描述的。[0083]在此,是指表示这些相邻分析物的K值(丰度比)的集中趋势的一个值。当确定平均K值时,离群K值对的作用或影响优选被减小,更优选被排除。因此,本发明优选有效地确定所谓的“不变”相邻分析物(即,在这些数据组之间在实际丰度方面未发生显著变化的相邻分析物)的一个平均值对于这些不变分析物,比率K应因此是相似的,并且典型地可能各自相对接近一致,例如,从0.5至2.0。然而,在丰度方面“变化”的分析物将典型地具有显著不同于大部分其他分析物的K值(假设其中大部分分析物不变的典型情况)。这些值可以被认为是该K值组中的离群值。换句话说,κ+Μλ选是大致来自不变分析物的比率K的一个平均值。因此,有效地忽略离群值的一个平均值!(^^应仅反映在数据组之间丰度的系统变化。[0084]当通过选择中间K值作SKto来确定1(_时,离群值(离群K值)的影响可以被有效且适宜地减小。由于典型地大部分K值(即,来自不变分析物)是相似的并且落在一个相对窄的范围内,并且至多仅少数K值是显著落在该范围之外的,因此,该中值将是来自该相对窄范围内的一个值并且因此良好地表示一种不变分析物在与该目标分析物近似相同的保留时间时的K值(因为它是从相邻分析物确定的)。因此,该中值比算术均值(甚至是如上描述的一个加权算术均值)更优选。可以使用该算术均值,但它是次优选的,因为在它是所有K值的均值的情况下它不能排除离群值的影响。另一种优选的集中趋势将是温塞均值(Winsorizedmean)。[0085]用作!(^^的一种更优选的均值是一个加权中值,但也可以使用一个未加权的或常规的中值并且具有良好的效果。一种用于确定一个加权中值的方法包括对计算出的多个比率K按照它们的大小(即,大小渐增或渐减)进行排序。针对每个K(即,针对每种分析物)计算出一个加权W。已经发现,用于每个K值的优选加权的一个例子是在这些数据组之一中该分析物的丰度的平方根。在所有这些相邻分析物的多个比率K按大小顺序排列并且每个K具有与它相关联的一个加权的情况下,K的加权中值通过具有以下特征的K值给出:用于在这个K值下方的多个K值的加权W的加和大致等于用于在这个K值上方的多个K值的加权W的加和。[0086]加权中值可以例如使用在Α.1..奥尔洛夫:计量经济学课程,出版商:“Examen,,(A.1.0rlov:Econometricscourse,publisher:〃Examen〃)(俄语)中描述的方法,或如在http://www.stat.ucl.ac.be/ISdidactigue/Rhelp/library/R.basic/html/weiRhted.median,html(英语)中所描述的方法来计算。优选加权是丰度平方根,但可以使用一个对数加权。使用S形函数的加权也起到很好的作用。减小离群值对确定值的影响的其他方法可以是使用大多数但不是所有的K值来确定平均值在减小离群值影响的另一种方法中,例如,仅使用这些K值中的X%,其中X是至多80%、或至多70%、或至多60%、或至多50%。由于这些K值大部分是来自不变分析物,因此限制用于计算平均值K^^的K值的数量应该会减小在计算中包括来自一个离群值的一个K值的可能性。更优选的将是,使用这样的X%的K值:它们是最接近这些K值的算术均值的多个K值或处于分布的中间的多个K值。[0087]从名义上不变的分析物有效地确定的K^^值,特别是在取一个中值作为K^^时,表示这些质谱峰强度(并且因此分析物丰度)在该第一数据组与第二数据组之间已变化的程度。由于该集中趋势!(^^是从在保留时间方面与该目标分析物相邻的不变分析物确定的,因此这提供了在这一局部保留时间在数据组之间的强度和丰度变化的一个量度(并且因此提供了局部丰度缩放),并且因此比在现有技术中所实现的更精确地表示在数据组之间强度或丰度的波动。因此,值可以用于校正该目标分析物在它从其中被选择出来的该第一数据组中的丰度,并且校正后丰度可以用于改进该目标分析物的量化。[0088]计算该目标分析物的一个校正后丰度优选包括基于比率计算在该第一质谱数据组中该目标分析物的丰度相对于在该第二质谱数据组中它的丰度的一个校正后丰度比Κκ。例如,Kk=(A1A2)/Ktoο然而,应了解,一个校正后比率可以反方向表达(即,其中该比率反方向(A2A1)表达,即表达为Kk=(A2ZA1)/K平均。因此,它可以被写成Ke正=K_/K〒iS,其中是在该第一质谱数据组中该目标分析物的丰度(A1)相对于在该第二质谱数据组中它的丰度(A2)的比率,表达SA1A2抑或A2A115这提供了在该第一样品和第二样品(数据组)中该目标分析物的一个校正后相对丰度。该目标分析物的一个绝对校正后丰度或量Aei可以从Aei=A2.ΚβΙ获得。因此,如果丰度A2是一个已知绝对值,例如如果该第二样品是具有一个已知参考量的该目标分析物的一个对照样品,那么可以获得该目标分析物的一个校正后绝对量Atffi。[0089]因此,该目标分析物的量化是确定该目标分析物的一个相对量(例如,在该第一分析物组(第一样品)中该目标分析物的量相对于在该第二分析物组(第二样品)中它的量,该相对量可以表达为一个比率K),或者基于使用该在该第二分析物组(第二或对照样品)中目标分析物的已知绝对量确定该目标分析物的一个绝对量。[0090]目标分析物是从丰度已被确定的那些分析物中选择的。该方法可以针对所需要那么多的目标分析物进行重复。也就是说,该方法典型地将包括重复选择一种目标分析物并且针对一种或多种另外的分析物确定它的丰度校正的步骤。例如,可以选择一种第二目标分析物并确定它的η种相邻分析物,接着进行上述其余步骤来得到该另外的目标分析物的一个校正后丰度。对于不同的目标分析物,可以改变相邻分析物的数量η,但典型地将使用同一η。[0091]目标分析物可以例如在蛋白质组学实验中基于预先确定的标准进行选择,目标分析物可以是从所希望测量的量的一种蛋白质的消化所得的多种肽。目标分析物还可以基于该质谱数据进行选择,例如通过确定所有已鉴定分析物的丰度比K,并且使用选择具有足够高的K值的那些分析物作为其丰度在这些样品之间已发生显著变化的候选分析物的阈值标准。可替代地,反过来每种分析物可以被选择作为一种目标分析物。[0092]在例如针对该第一数据组和该第二数据组中各组产生多个重复数据组(不论是技术性重复数据组还是非技术性重复数据组)的情况(优选是通过改进的统计数据来改进测量结果可靠性的情况)下,每个重复数据组可以用于如根据本发明所述的确定用于校正或比对该目标分析物丰度的一个校正因子。例如,可以将一个数据组中的每个重复数据组与另一数据组中的多个重复数据组成对地进行比较,并且接收多个成对的丰度比对值,即,校正因子如对于每种目标分析物,该校正因子(例如,因此可以被确定为这些校正因子的一个平均值(例如,中值)。这具有不存在唯一“参考”数据组,而是所有数据组实际上都变成参考的优点。结果是,统计数据更为稳健,并且结果更为准确。[0093]确定如多个重复数据组的多个样品中一种分析物的一个表达因子或比率(表示两个样品之间的丰度差异)可以通过利用一个“参考矩阵”来直接完成。这包括构造所有成对比率K的一个矩阵(即,来自所有的不同样品组合)。计算出该矩阵每一列的几何均值,该几何均值是通过该列乘积的η次方根给出。这些列的几何均值表示在这些样品中该分析物的表达因子。两个样品之间的一个表达比是通过表不其中一个样品的列的几何均值与表示另一个样品的列的几何均值的比率给出。例如,考虑四个样品。因此,一个示例参考矩阵可以这样构造:/1122\1122[0094].5.5IIV5.5II/[0095]列I和列2的几何均值(表达因子)通过4--.Π..5..5=%给出。%%[0096]列3和列4的几何均值(表达因子)通过,I1IL.1-2-2=~丨2给出。Λ--[0097]与样品I比较,样品3的表达因子是通过相应列的几何均值的比率=V2/V.5=2给出。[0098]从所确定的该目标分析物的量有可能确定该目标分析物从其衍生的一种次级分析物的相对量或绝对量。例如,在蛋白质组学中,一种蛋白质,典型地一种蛋白质混合物被消化并且所得的多种肽在LC/MS实验中被洗脱。这些肽因此是本方法的目标分析物,但所确定的该肽(分析物)的量是指示它从其衍生的蛋白质(次级分析物)的量。优选地,在这类情况下,将从一种特定的次级分析物(例如,蛋白质)衍生的所有分析物(例如,肽)集合在一起并且在该第一数据组和第二数据组中比较它们的校正后丰度。[0099]可以利用一个参考矩阵来确定蛋白表达因子。一个矩阵是使用多个元素构造而成,a,j是在样品i与j之间测得的蛋白质丰度的比率。对于一种特定蛋白质,蛋白质丰度被估算为在两个样品中所发现的肽的丰度的一个中值。因此,它正比于在第i个样品中该蛋白质的“真实”丰度,准确度在误差Su内。蛋白质丰度比因此可以取为它的肽丰度的中值。这些元素像这样被插入到一个矩阵中:[0100]沒U-1flrZ1I…^i,!…?it,laIJI'an,2*IaLjjIII_气IIU2n…】_[0101]可以从以下这些列中形成蛋白表达因子的一个矢量:【权利要求】1.一种从质谱数据量化一种或多种分析物的方法,该方法包括:从自一个色谱柱洗脱的一个第一分析物组获得一个第一质谱数据组;从自一个色谱柱洗脱的一个第二分析物组获得一个第二质谱数据组;其中每个数据组中的大多数分析物是两个数据组所共有的;确定每个数据组中至少一些分析物的表观丰度;选择一种分析物作为一种目标分析物,并且依据多种分析物就保留时间而言与该目标分析物的局部性来为该目标分析物确定多种局部化相邻分析物;基于在该第一数据组与第二数据组之间在这些所确定的局部化相邻分析物的表观丰度方面的差异来确定该目标分析物的一个局部校正后丰度;并且基于该目标分析物的校正后丰度来对其进行量化。2.如权利要求1所述的方法,进一步包括选择一种或多种另外的分析物作为目标分析物,并且对于作为一种目标分析物的每种这样的另外的分析物:依据多种分析物就保留时间而言与这种另外的分析物的局部性来为这种另外的分析物确定多种局部化相邻分析物;基于在该第一数据组与该第二数据组之间在这些所确定的局部化相邻分析物的表观丰度方面的差异来确定这种另外的分析物的一个局部校正后丰度;并且基于这种另外的分析物的校正后丰度来量化这种另外的分析物;其中该多种所确定的局部化相邻分析物对于至少一些不同的目标分析物而言是不同的。3.如权利要求1或2所述的方法,其中每个数据组中的这些分析物的至少80%是两个数据组所共有的。4.如权利要求1、2或3所述的方法,包括将该多种局部化相邻分析物确定为具有跨越该目标分析物的该保留时间的一个给定时间间隔内的一个保留时间的分析物。5.如权利要求4所述的方法,其中该时间间隔的宽度与该目标分析物的色谱峰宽度大致相同。6.如权利要求4所述的方法,其中该时间间隔的该宽度最长达2分钟。7.如以上任一项权利要求所述的方法,其中这些所确定的局部化相邻分析物的数量η为从5至100。8.如以上权利要求中任一项所述的方法,其中这些局部化相邻分析物中的大多数的实际丰度在该第一数据组与该第二数据组之间大致不变。9.如以上任一项权利要求所述的方法,其中确定该目标分析物的该局部校正后丰度包括:基于在该第一数据组与该第二数据组之间在这些所确定的局部化相邻分析物的丰度方面的所述差异确定一个或多个校正因子,并且将该一个或多个校正因子应用于该目标分析物的该丰度来确定该校正后丰度。10.如权利要求9所述的方法,其中确定该一个或多个校正因子包括:从具有一个比率K的这些所确定的局部化相邻分析物来确定表示一个集中趋势值的一个值,其中对于每种相邻分析物,K为在该第一质谱数据组中其丰度与在该第二质谱数据组中其丰度的一个比率。11.如权利要求10所述的方法,其中离群K值被从确定该值1(^^中排除。12.如权利要求11所述的方法,其中一个中值K值被选择作为13.如权利要求12所述的方法,其中该中值K值是一个加权中值。14.如权利要求10至13中任一项所述的方法,其中该比率K是该第一质谱数据组和该第二质谱数据组中的丰度的一个加权比率。15.如以上任一项权利要求所述的方法,进一步包括比对由所获得的第一质谱数据组和所获得的第二质谱数据组构成的多个质量色谱图。16.如权利要求10至15中任一项所述的方法,其中该方法包括根据Kei=Kge/K确定一个校正后丰度比Kei,其中K目#是在该第一质谱数据组中该目标分析物的丰度与在该第二质谱数据组中其丰度的比率。17.如以上权利要求中任一项所述的方法,包括针对每个数据组创建这些分析物的一个提取离子色谱图(XIC),并且从该XIC确定这些表观分析物丰度。18.如以上权利要求中任一项所述的方法,进一步包括在确定这些表观分析物丰度之前,鉴定这些分析物。19.如以上权利要求中任一项所述的方法,其中电喷雾流波动在获得不同数据组之间的影响被减小。20.如以上权利要求中任一项所述的方法,其中这些分析物是选自下组,该组由以下各项组成:蛋白质、肽、脂质、药物和/或代谢物。21.—种如以上任一项权利要求所述的方法用于发现一种疾病的标志物的用途。22.—种携载计算机程序的计算机可读介质,该计算机程序具有用于实施如以上任一项权利要求所述的方法的多个程序代码元素。【文档编号】H01J49/00GK104170052SQ201380015675【公开日】2014年11月26日申请日期:2013年3月28日优先权日:2012年4月2日【发明者】R·佐巴瑞夫,Y·硫特维斯基申请人:塞莫费雪科学(不来梅)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1