对色谱峰进行处理和分组的系统和方法

文档序号:6532705阅读:430来源:国知局
对色谱峰进行处理和分组的系统和方法
【专利摘要】一种用于处理色谱系统内色谱峰的方法包含比较第一峰与第二峰(S110);并且确定第一峰和第二峰是否应当被分组在一起(180)。
【专利说明】对色谱峰进行处理和分组的系统和方法

【技术领域】
[0001 ] 本公开涉及用于色谱质谱系统内所获数据的数据处理技术。

【背景技术】
[0002]已知色谱质谱仪产生大量数据。已经预先引入系统和方法来分析这种数据以便将相关信息与噪声区分开,诸如美国临时专利申请号61/451,952中所描述的那些系统。


【发明内容】

[0003]描述了一种用于处理色谱系统内色谱峰的系统和方法。在一种实施方式中,该系统和方法包括比较第一峰与第二峰并且确定第一峰和第二峰是否应当被分组在一起。

【专利附图】

【附图说明】
[0004]图1描述根据本公开中所描述实施方式的涉及峰分组的一般过程;
[0005]图2描述根据一种实施方式的用于确定峰平均值和峰标准偏差的一种不例性方法;
[0006]图3描述根据一种实施方式的用于确定第一峰和第二峰的平均保留时间是否大致相同的示例性方法;和
[0007]图4描述根据一种实施方式的用于确定第一峰和第二峰的方差是否大致相同的示例性方法。
[0008]在不同附图中类似的附图标记指示类似的元素。

【具体实施方式】
[0009]可以意识到,本方法可以用于包括液体和气体的所有类型色谱系统。在一种实施方式中,提供数据以便通过与质谱仪相关联的数据获取系统进行分析。出于本公开的目的,要理解的是,数据获取可以是如U.S.7,501,621、U.S.7,825,373及U.S.7,884,319所述的系统。
[0010]此外,在经受这种分析前,来自数据获取系统的数据可以被调整,如美国临时专利申请系列N0.61/445,674所提出的。前述及所有其它参考专利和申请通过引入完整地并入本文。在所并入参考中术语的定义或使用与本文所提供术语的定义不一致或相反的情况下,应用本文所提供的那个术语的定义,而不应用参考中的那个术语的定义。
[0011]参考图1,图中公开了示例性方法,用于峰分组和识别,即识别数据集内的离散峰并且识别每个识别出的离散峰的频谱。正如可以意识到的,对这种峰的适当识别可以促进后期数据分析步骤中的更高效过程。
[0012]在使用公开的方法和过程的一种实施方式中,离子统计是信号中方差的基源。通过使用一般抑制来自信号内电噪声的超高分辨率质谱仪可以促进完成离子统计作为基源。通常,基于该系统,由于仪器高分辨率特性的缘故,能够自动分辨这种系统内的多数质谱干扰。继而,这可以显著避免外部质谱干扰,并且如果存在共享质量(shared mass),则这种系统可以进行去卷积。
[0013]为了利用本文所讨论方法的实施例,出现在分析信号内的离子数量是已知的。在本文所讨论的实例中,分析信号内的离子量是已知的并且获取方法适合于去除多数电噪声。并且例如,在其它可能性当中,使用美国专利号U.S.7,501,621、U.S.7,825,373及U.S.7,884,319中所描述的数据获取系统去除来自信号的噪声。
[0014]出于本公开的目的,将讨论使用第一峰(X)和第二峰(y)的例示,每个具有的尺寸(m)都为I。本文中的术语将下列变量归属于第一和第二峰(x,y)。
[0015]X:基峰的色谱峰的列向量;
[0016]x1:x的第i元素的标量;
[0017]y:用于检查与X合并的色谱峰的列向量;
[0018]y1:y的第i元素的标量;
[0019]t1:第i位置的保留时间的标量;
[0020]m: X和y的长度的标量;
[0021]npx:峰X内离子数量的标量;
[0022]npy:峰y内离子数量的标量;
[0023]α:显著性水平的标量;
[0024]meanpx:峰x平均值的标量;
[0025]meanpy:峰y平均值的标量;
[0026]σ px:峰X标准偏差的标量;
[0027]σ py:峰y标准偏差的标量;
[0028]Spx:峰X标准偏差的估算的标量;
[0029]Spy:峰y标准偏差的估算的标量;和
[0030]rxy:矢量X和y的相关系数的标量。
[0031]参考图1,在一种实施方式中,对峰进行分组和识别的方法包括在SllO处比较第一峰(X)与第二峰并且在S160处确定第一峰和第二峰(X,y)是否应当被分组在一起。
[0032]出于本公开的目的,可以意识到,参考峰被视为具有平均值的离子概率分布,因为作为离子统计的标准偏差是相当主要的,噪声一般被消除,而且离子容量是已知的。在一种实施方式中,比较步骤SllO可以包括在120处比较第一峰(X)的平均保留时间与第二峰(y)的平均保留时间,在S160处比较第一峰(X)的方差与第二峰(y)的方差,并且在S180处基于两个比较步骤的情况,将第一峰和第二峰(x,y)分类为相关的或无关的。此外,在一种实施方式中,如果(a)第一峰和第二峰的平均保留时间大致相同并且(b)第一峰和第二峰的方差大致相同,则第一和第二峰(x,y)被分类为有关的。
[0033]图2描述用于确定峰平均值和峰标准偏差的示例性方法,其可以在后面使用。如所示,在S210处确定第一峰(X)的平均值和第二峰(y)的平均值。在一种实施方式中,根据下列方程式确定平均值:.Xtti
[0034]

【权利要求】
1.一种用于处理色谱系统内色谱峰的方法,包含: 基于第一峰与第二峰之间的一个或多个情况比较第一峰与第二峰(Sl1);并且基于所述一个或多个情况,将所述第一峰和第二峰分类为相关的或无关的,其中比较步骤比较下列步骤中的一个或两个(i)比较所述第一峰的方差与所述第二峰的方差(S120);和(ii)比较所述第一峰的平均保留时间与所述第二峰的平均保留时间(S160)。
2.根据权利要求1所述的用于处理色谱系统内色谱峰的方法,其中所述比较步骤比较所述第一峰的方差与所述第二峰的方差和所述第一峰的平均保留时间与所述第二峰的平均保留时间二者(S120,S160)。
3.根据权利要求2所述的用于处理色谱系统内色谱峰的方法,其中比较所述第一峰的方差与所述第二峰的方差的步骤包含子步骤: 确定所述第一峰和所述第二峰之间的F-统计(S164); 分配与所述t-统计相关的F-统计置信区间(S168); 比较所述F-统计置信区间与预定t-统计参数(S172); 基于比较所述F-统计置信区间与预定F-统计参数的步骤,将所述第一峰和所述第二峰特征化为相关的或 无关的(S180)。
4.根据权利要求2所述的用于处理色谱系统内色谱峰的方法,其中比较所述第一峰的平均保留时间与所述第二峰的平均保留时间的步骤包含子步骤: 确定所述第一峰和所述第二峰之间的t-统计(S124); 分配与所述F-统计相关的t-统计置信区间(S128); 比较所述t-统计置信区间与预定F-统计参数(S132); 基于比较所述t-统计置信区间与预定t-统计参数的步骤,将所述第一峰和所述第二峰特征化为相关的或无关的(S180)。
5.根据权利要求2所述的用于处理色谱系统内色谱峰的方法,其中比较所述第一峰的平均保留时间与所述第二峰的平均保留时间的步骤包含子步骤: 确定所述第一峰和所述第二峰之间的t-统计(S124); 分配与所述F-统计相关的t-统计置信区间(S128); 比较所述t-统计置信区间与预定F-统计参数(S132); 并且其中比较所述第一峰的方差与所述第二峰的方差的步骤包含子步骤: 确定所述第一峰和所述第二峰之间的F-统计(S164); 分配与所述t-统计相关的F-统计置信区间(S168); 比较所述F-统计置信区间与预定t-统计参数(S172); 基于(i)比较所述t-统计置信区间与预定t-统计参数的步骤和(ii)比较所述F-统计置信区间与预定F-统计参数的步骤,将所述第一峰和所述第二峰特征化为相关的或无关的(S180)。
6.根据权利要求2所述的用于处理色谱系统内色谱峰的方法,其中所述色谱系统包括具有F-统计查找表的存储器,并且其中确定F-统计的步骤包括在所述查找表上查找所述F-统计的步骤。
7.根据权利要求6所述的用于处理色谱系统内色谱峰的方法,其中所述F-统计查找表包括使用奇异值分解来计算出并且储存在所述系统的存储器内的预定F-统计值。
8.根据权利要求5所述的用于处理色谱系统内色谱峰的方法,其中所述色谱系统包括具有F-统计查找表的存储器,并且其中确定F-统计的步骤包括在所述查找表上查找所述F-统计的步骤。
9.根据权利要求8所述的用于处理色谱系统内色谱峰的方法,其中所述F-统计查找表包括使用奇异值分解计 算出并且储存在所述系统的存储器内的预定F-统计值。
【文档编号】G06F17/18GK104053989SQ201380005597
【公开日】2014年9月17日 申请日期:2013年1月16日 优先权日:2012年1月16日
【发明者】王纪红, P·M·威利斯 申请人:莱克公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1