处理色谱系统中数据的系统及方法

文档序号:2852483阅读:317来源:国知局
处理色谱系统中数据的系统及方法
【专利摘要】描述了用于处理色谱系统中的数据的系统及方法。在实现中,系统及方法包括处理由色谱系统生成的数据,以生成处理后的数据,分析处理后的数据,并且基于处理后的数据准备和提供结果。
【专利说明】处理色谱系统中数据的系统及方法
[0001] 优先权声明
[0002] 本申请要求于2012年3月12日提交的国际申请NO.PCT/US2012/028754和于2012 年1月16日提交的美国临时申请序列No. 61/587, 041的优先权。以上提到的每个申请的 全部内容都通过引用被结合于此。

【技术领域】
[0003] 本公开内容涉及用于在色谱质谱分析系统中所获得的数据的数据处理技术。

【背景技术】
[0004] 已知色谱质谱仪产生大量数据并且许多数据包括噪声或不想要的信息。期望高效 并精确地区分相关信息和噪声并且以高效和高分辨率方式处理其的系统及方法。


【发明内容】

[0005] 描述了用于处理色谱系统中的数据的系统及方法。在实现中,该系统及方法包括 处理由色谱系统生成的数据以生成处理后的数据,分析处理后的数据,并且基于处理后的 数据准备和提供结果。

【专利附图】

【附图说明】
[0006] 图1绘出了根据本公开内容中所描述的实现的、涉及识别并去卷积色谱峰的因子 分析技术的一般过程;
[0007] 图2是气相色谱、质谱系统的一般框图;
[0008] 图3说明了根据实现的技术的特征;
[0009] 图4代表根据实现的、用于预先处理来自数据获取系统的数据的示例性方法; [0010] 图5代表根据实现的基线校正的示例性方法;
[0011] 图6识别过滤过程的示例性实现;
[0012] 图7绘出了根据本公开内容中所讨论的原理的、识别基本上优化的系数的代表性 过程;
[0013] 图8说明了根据实施例的、可以用来证明子簇峰形状的资格(限制,qualify)的 代表性过程;
[0014] 图9陈述了根据实现的、通常无关数据可以从子簇除去以便精炼数据的方法;
[0015] 图10绘出了识别共享质量的代表性过程;
[0016] 图11绘出了根据这里所述实现的各方面的引种(seeding)方法;
[0017] 图12说明了根据所述实施例的、用于因子识别的过程;
[0018] 图13绘出了示例性系统中Μ相对于峰相关性阈值的比较;
[0019] 图14用图形方式证明了实现中Μ与峰相关性阈值的关系曲线;
[0020] 图15提供了防止因子分裂的方法;
[0021] 图16绘出了根据本公开内容中所描述的实现的、涉及峰分组的一般过程;
[0022] 图17绘出了根据实现的、用于确定峰均值(mean)和峰标准差的示例性方法;
[0023] 图18绘出了根据实现的、用于确定第一峰和第二峰的均值保留时间是否基本相 同的示例性方法;以及
[0024] 图19绘出了根据实现的、用于确定第一峰和第二峰的方差是否基本相同的示例 性方法。
[0025] 相同的标号在各个图中指相同的元件。

【具体实施方式】
[0026] 参考图1,公开了用于因子分子技术的示例性方法,该技术从色谱、质谱系统识别 并去卷积色谱峰。应当理解,这种方法可以在所有类型的色谱系统中使用,包括液相和气 相。在实施例中,并且如所说明的,该方法包括步骤(i)预处理由分析系统接收到的数据 (S200),(ii)分析预处理后的数据(S300),(iii)处理与被相信在所述数据中表示的任何 同位素或加合物关联的数据(S400);以及(v)准备并提供关联的结果(S500)。
[0027] 在实现中,由与质谱仪关联的数据获取系统提供要分析的数据。对于本公开内容, 应当理解,数据获取系统可以是如在美国7, 501,621、美国7, 825, 373和美国7, 884, 319中 所阐述的系统。
[0028] 另外,在进行这种分析之前,来自数据获取系统的数据可以被调整,如在美国临时 专利申请序列No. 61/445, 674中所阐述的。以上所述的以及所有其它引用的专利和申请的 全部内容都通过引用被结合于此。当所结合的参考文件中的术语的定义或使用与本文所提 供的那个术语的定义不一致或相反时,应用本文所提供的那个术语的定义并且不应用参考 文件中那个术语的定义。
[0029] 总而言之,上述数据获取系统通常把来自质谱仪系统的原始数据转换成称为"棒 (stick) "的质心质谱,每个棒都代表一个离子峰并且由强度、确切的质量值和质量分辨率 值组成。在棒的构造过程中,来自模数转换器的原始数据已经经历了大约1〇 4或1〇5:1的压 缩并且大部分获取噪声和冗余信息已经被除去了。结果是非常稀疏的两维数据,但是化学 背景噪声仍然可以存在,因为这种数据获取系统的目标是把所有离子信息转发到后续的处 理阶段。接下来,棒在相邻的保留时间扫描中被漂移校正并收集到统计相似质量的簇中。
[0030] 在实现中,具有相似强度分布的簇被认为代表来自从色谱柱洗脱的分子化合物的 各种同位素、加合物及碎片离子。此外,还有来自于诸如柱流失(column bleed)、移动相污 染、环境污染等各种来源的、不具有色谱结构的背景离子的簇。簇过滤器可以被应用来去除 具有小于期望的最小信噪比水平的簇,并且其余的簇之后被送到处理系统,用于继续分析。
[0031] 应当理解,基于本公开的内容,如图3所示,在数据处理的每个阶段,通常优选地 是以保留一些残差噪声为代价来保留好的信息。一般地,所描述的系统具有经优化的保留 噪声量,以保持数据的完整性。
[0032] 图4代表用于预处理由处理系统从数据获取系统接收到的数据的示例性方法。在 实现中,处理(S200)包括步骤:分离长簇与短簇并且对长簇进行基线校正(S210)、过滤数 据以平滑数据(S220)、将过滤后的簇划分为子簇(S230)以及证明子簇的资格(S240)。在 实施例中,如下文中更具体讨论的,子簇的资格证明可以包括证明峰形状的资格和证明信 噪比的资格中至少一个。
[0033] 已经发现,长簇可以具有与整个分析的长度接近的持续时间并且大部分长簇是如 果不被适当处理就可能使结果实际上偏移的背景离子。而且,长簇常常相对强并且通常具 有与其相关联的高噪声。但是,因为,由于来自于洗脱化合物的共享质量的贡献,一些这种 数据也可能包括期望的色谱数据,所以优选地对长簇提供进一步分析,而不是将它们全部 提取出来。由于它们提升的强度,因此,在实现中,这种长簇可以首先经受基线校正。
[0034] 现在将公开这种基线校正的方法。在实现中并且如图5所示,对数据执行基线校 正的步骤可以包括以下过程:将数据分离成块,每个块的长度被确定为色谱数据的期望全 宽半高的倍数(S211)、基于那个块的下四分位中的基线强度估计在块的中心的基线强度 (S212)、在前述等距四分位点之间进行线性内插,以产生基线估计(S213)、把基线之上的数 据剪切到基线水平,并且保留基线以下的数据(S214)、平滑所剪切的数据的曲线,以产生基 线的改善版本(S215)以及重复步骤(S214)和(S215),直到全部或基本全部数据降到平滑 后基线之上的最小公差内。上述基线校正可以对每个期望的分离后的块进行,在实现中,块 可以包括全部或基本全部分离后的块。类似地,校正可以应用到每个长簇,在实现中,长簇 可以包括全部或基本全部长簇。
[0035] 在实现中,在步骤(S211)期间块的长度被估计为色谱数据的期望全宽半高的五 (5)倍,但应当理解,基于本公开内容,该长度可以大于或小于五(5)倍。
[0036] 如所讨论的,剪切数据(S214)涉及平滑剪切后的数据的曲线。在实现中,实现 Savitzky-Golay平滑算法,以提供平滑步骤。其它平滑算法也可以采用并且本发明不应当 由此受到限制。
[0037] 继续参照图4,数据可以接下来被过滤,以去除噪声(S220)。这种过滤过程的实现 在图6中说明。在实现中并且如所讨论的,无限脉冲响应滤波器被用来执行这个步骤,但应 当理解,基于这里的内容,其它类型的滤波器也可以代替使用,诸如有限脉冲响应滤波器。 继续参照图6,识别数据内的最大峰并且估计该峰的全宽半高(S221)。这个估计的值接下 来对照预定义的查找表进行匹配,以便基于它们的全宽半高识别一组前向和反向二级无限 脉冲响应滤波器系数,这些系数都被优化以平滑色谱峰(S222)。使用在步骤(S222)中得出 的识别出的、经优化的系数,数据被平滑(S223)。接下来,平滑后的数据与原始数据相比较, 以识别每个簇的噪声图(S224)。在实现中,每个簇的噪声图作为平滑数据与原始数据之间 的残差的标准差来计算。为了基于本公开内容将变得明显的目的,噪声图被保留,因为其将 会被分配到根据(S230)从簇得出的每个子簇。这种方法提供了最大似然最小二乘法估计, 其有助于没有受到高强度数据过度影响的分析,并且允许低强度数据被充分表示。
[0038] 如所讨论的,在实施例中,通过在(S222)使用查找表来识别经优化的系数。在实 现中,在进行任何处理之前,对于若干期望的全宽半高值,优化后的系数被预先计算并保存 在系统中。图7说明了可以预先计算系数的一种方式。
[0039] 在(S225),在每个期望的全宽半高,形成若干纯高斯峰。在实现中,这些峰的宽度 基本在目标全宽半高的约三分之一(1/3)到全宽半高的三(3)倍之间或者在这二者处,并 且它们被存储为基准峰。接下来在(S226)将噪声添加到全部或选定的基准峰。在实现中, 噪声可以是白噪声并且可以根据高斯分布添加到每个峰。之后,在(S227),以将经平滑的噪 声峰与基准峰之间的残差基本最小化的方式,每一个或选定的峰峰被优化,以调整滤波器 系数。可以使用非线性Levenburg-Marquardt法来提供优化(S227)。在优化期间,系数可 以被约束,以产生稳定的脉冲响应。对于每个或选定的基准全宽半高重复这个过程(S228) 并且优化后的系数值存储在查找表中(S229)。在实现中,示例性结果平滑滤波器的脉冲响 应类似于正弦滤波器的脉冲响应,其中滤波器的原瓣的宽度近似为目标全宽半高的一半。 使用这种实现,峰形状和结构可以基本被保留并且所检测到的错误正峰的数目可以基本被 最小化。
[0040] 返回去参照图4,过滤后的簇可以被划分为子簇(S230)。在实现中,过滤后的簇数 据被检查,以识别(位于两个峰或顶点之间的)谷中的最小点小于最近峰的限定强度的每 个实例。作为例子,峰强度可以被选择为处于一个或两个最近峰的强度的二分之一(1/2) 或大约二分之一。一旦被识别出,该谷就被认为是簇切割点,由此将簇分离为一个或多个子 簇。如将会理解的,划分后的子簇的数目将取决于给定簇的簇切割点的量。
[0041] 图8说明了可以被用来证明子簇峰形状的资格的代表性过程(S240)。这个过程 可以帮助确保相关子簇包括色谱信息。在实践中,一些子簇可以包括不含色谱信息的数据, 下文中将其称作为离群值(异常值,outlier)。优选的是从数据中提取并免除在实践可能 的情况下尽可能多的离群值,而不去除相关数据。在实现中,可以使用以下一种或多种技术 来从离群值中分离期望的子簇:(i)选择具有比最小信噪比更大的信噪比的子簇(S242); (ii)选择具有比最小质量更高的峰形状的子簇(S244);以及(iii)选择具有最小簇长度的 子族(S246)。在实现中,在3-8棒之间、在4-7棒之间、在3-7棒之间、在4-8棒之间、在4-6 棒之间、在5棒处或者在以上范围的边界处选择最小簇长度。可以使用其它的最小簇长度。 在实现中,可以使用每种分离过程。为了便于公开,本公开内容将讨论如图8所述使用全部 过程的实施例。此外,无论使用哪种分离过程,本公开内容都不应当局限于它们被处理的顺 序。
[0042] 提供了用于选择具有比最小或阈值信噪比更大的信噪比的子簇的示例性过程 (S241)。在实现中,阈值比率可以被选择为硬编码值与用户限定值之间的较小者。作为例 子,阈值可以为十(10)或约为十。在其它技术中,噪声可以被测量为四分之一(1/4)离子 面积的预定义获取噪声或者原始簇数据与平滑后的簇数据之间的残差的标准差。但是,应 当理解,如果具有阈值之下的比率的子簇是合格的峰的同位素或加合物,则它们仍可以被 用在因子分析中。
[0043] 因为具有比阈值更大的信噪比的子簇仍然可能包含冗余的数据或噪声,所以可能 期望进一步修剪该子簇。一种修剪方法涉及从峰的左侧和右侧都修剪这种子簇的基线。在 实现中,子簇内的原始数据被从两端或一端向中心扫描-强度(左/右)上升到阈值以上 的位置变为子簇的新的末端并且基线数据被丢弃。在实现中,阈值强度是子簇噪声的标准 差的四(4)倍。
[0044] 如前所述,识别期望子簇并消除离群值的另一种技术是选择具有比最小或阈值质 量更高的峰形状的子簇(S244)。在实现中,阈值质量可以基于色谱峰具有可以优选地使用 双高斯曲线合理建模的一般形状的假设,但是本发明不应当被局限于此。双高斯曲线相对 于诸如Pearson IV的其它峰形状更优的地方在于拟合的速度和稳定性。因此,在实施例中 并如图9所示,每个子簇首先被拟合到双高斯峰(S247)。识别子簇与拟合峰之间的相关性 (S248)。选择具有比阈值相关性更大或基本在阈值相关性处的相关性的峰,具有比阈值相 关性更小的相关性的峰被识别为离群值(S249)。在实现中,阈值相关性可以是0.6,优选地 为 0· 8。
[0045] 因为每个子簇可以被认为包括单个色谱峰,所以可以理解,由于来自两个或更多 个共洗脱化合物的组合信息,因此每个子簇可以是共享的质量成分峰。因此,在实现中,去 卷积方法及系统可以可选地被采用,以确定峰是否包括共享的质量并且进一步识别可以关 联到单个成分的峰的组。在识别这种峰的组时,去卷积过程可以对一个、一些或全部色谱峰 实现,以解密每个分析过的峰可以属于的分组。
[0046] 如将理解的,耦合到质谱仪的色谱系统既可以产生质量峰,又可以产生色谱峰。质 量峰可以非常像高斯形状并且,当与色谱峰比较时,通常不显著变形或者包括噪声。因此, 高斯模型常常在与质量峰的去卷积关联的去卷积过程中实现。例如,已知跨这种质量峰采 用期望最大化(EM)算法。
[0047] 不像质量峰,色谱峰常常不非常像高斯形状并且会在噪声处包括显著的变形。因 此,由于峰的歪斜,高斯和双高斯模型常常不很好地拟合色谱峰并且EM算法具有差的汇 聚。非线性迭代方法也已经介绍过,以估计峰参数,但是这种方法在系统中会慢并且迟钝。
[0048] 本发明人已经开发出新的曲线类型来建模峰,诸如以上讨论的色谱峰。对于本公 开内容,所讨论的模型和曲线类型将在这里被称为双指数模型或者双指数曲线。按照惯例, 并且如以上所讨论的,高斯、双高斯或一般指数曲线和模型已经被采用。新的双指数模型在 顶点分离峰并且利用独立的指数曲线建模峰的每一侧。
[0049] 在实现中,双指数模型可以如下表示:
[0050]

【权利要求】
1. 一种处理来自色谱、质谱系统中数据获取系统的数据的方法,包括: 处理数据,以生成处理后的数据; 分析处理后的数据,以从中提取噪声;以及 准备并提供关于处理后的数据的结果。
2. 如权利要求1所述的方法,其中数据包括长簇和短簇并且处理步骤包括: 分离长簇与短簇; 过滤数据以平滑数据,由此产生过滤后的簇; 把过滤后的簇分成子簇;以及 证明子簇的资格,以便从其中提取不期望的子簇。
3. 如权利要求2所述的方法,其中分离步骤还包括: 把数据分离成块; 估计每块中心基线的强度; 在每块的等距四分位点之间线性内插,以产生基线估计; 剪切基线水平之上的数据并且保留该基线以下的数据;以及 平滑剪切后的数据,以产生基线的改进版本。
4. 如权利要求3所述的方法,其中每块的长度是数据的预期全宽半高的倍数。
5. 如权利要求3所述的方法,其中每块的长度被估计为是数据的预期全宽半高的五 倍。
6. 如权利要求3所述的方法,其中平滑步骤涉及Savitzky-Golay平滑算法的应用。
7. 如权利要求3所述的方法,其中块中心基线的强度的估计是基于该块下四分位中基 线的强度。
8. 如权利要求2所述的方法,其中资格证明步骤包括以下至少一个: 选择具有大于阈值信噪比的信噪比的子簇; 选择具有大于阈值质量的峰形状的子簇;以及 选择具有最小簇长度的子簇。
9. 如权利要求8所述的方法,其中阈值信噪比是10。
10. 如权利要求8所述的方法,其中噪声是四分之一(1/4)离子面积的预定义获取噪 声。
11. 如权利要求8所述的方法,其中噪声是原始簇数据和平滑后的簇数据之间残差的 标准差。
12. 如权利要求8所述的方法,其中,如果具有小于阈值信噪比的信噪比的子簇是同位 素或加合物,则它们仍然在因子分析中使用。
13. 如权利要求8所述的方法,还包括步骤: 从峰的左和右侧修剪子簇的基线。
14. 如权利要求13所述的方法,其中修剪步骤还包括: 从末端到中心扫描子簇中的原始数据; 识别在每个末端强度上升到高于阈值的地方为新的端点; 丢弃新端点之外的数据。
15. 如权利要求14所述的方法,其中阈值是子簇的标准差的四倍。
16. 如权利要求8所述的方法,其中阈值质量是基于子簇的拟合和预定义曲线之间的 相关性。
17. 如权利要求16所述的方法,其中预定义的曲线是双-高斯曲线。
18. 如权利要求16所述的方法,其中阈值相关性是0. 6。
19. 如权利要求17所述的方法,其中阈值相关性是0. 8。
20. 如权利要求2所述的方法,其中过滤步骤使用无限脉冲响应滤波器。
21. 如权利要求2所述的方法,其中过滤步骤包括: 识别数据中的最大峰; 估计所识别出的峰的全宽半高; 对照查找表匹配估计出的全宽半高,以识别一个或多个优化的滤波器系数; 基于优化的滤波器系数平滑数据;以及 为每个簇识别噪声图。
22. 如权利要求21所述的方法,其中优化的滤波器系数是一组正向和反向二级无限脉 冲响应滤波器系数。
23. 如权利要求22所述的方法,其中噪声图是平滑数据和原始数据之间残差的标准 差。
24. 如权利要求23所述的方法,其中噪声图分配给偏离簇的每个子簇。
25. 如权利要求22所述的方法,其中优化的系数是根据以下步骤计算的: 在每个预期的全宽半高形成高斯峰; 向高斯峰添加噪声,由此产生带噪声的高斯峰;以及 优化高斯峰,以便以基本上最小化噪声高斯峰和高斯峰之间残差的方式调整滤波器系 数。
26. 如权利要求25所述的方法,其中优化步骤使用非线性Levenberg-Marquardt过程。
27. 如权利要求2所述的方法,其中簇具有峰和谷并且划分步骤还包括: 识别过滤后的簇中的每个实例,其中位于两个峰之间的谷具有小于两个峰的定义的强 度的最小值点;以及 如果有,基于每个识别出的实例把簇分离成子簇。
28. 如权利要求19所述的方法,其中定义的强度是或者大约是两个峰之一或二者的强 度的一半。
29. 如权利要求2所述的方法,其中分析步骤还包括: 确定用于因子分析的显著性因子;以及 提供那些因子的初始种子估计。
30. 如权利要求29所述的方法,还包括: 消除较低质量的峰。
31. 如权利要求2所述的方法,其中分析步骤还包括: 在数据中选择基础峰; 评估并关联所有局部数据与该基础峰; 组合具有预定最小相关值的局部数据与该基础峰,以创建因子;以及 为该因子估计频谱。
32. 如权利要求31所述的方法,其中基础峰是手动选择的。
33. 如权利要求31所述的方法,其中数据集中的最强子簇峰被选作基础峰。
34. 如权利要求31所述的方法,其中最小相关性值是0. 6。
35. 如权利要求34所述的方法,还包括: A) -旦识别出基础峰,就在其余数据中选择下一个最强的峰作为下一个因子; B) 在完成步骤(A)之后,选择其余数据中下一个最强的峰作为下一个因子;以及 C) 重复步骤(B),直到为所有子簇都分配了因子。
36. 如权利要求31所述的方法,还包括: 比较相关性阈值和相关置信区间之一或者二者都比较,以便把在组合步骤中组合但不 应当被组合的局部数据分离成分离因子。
37. 如权利要求36所述的方法,其中比较步骤还包括: 选择因子中最强的子簇; 确定基本子簇和该因子中至少一个其它子簇之间的相关性; 为这至少一个子簇确定顶点位置置信区间; 把具有以下条件的子簇分组到一起:(i)重叠基础峰;以及(ii)与大于定义的相关性 阈值的基础峰相关,其中每个分组都是因子。
38. 如权利要求36所述的方法,还包括: 为每个因子计算平均浓度分布。
39. 如权利要求38所述的方法,其中计算步骤利用多元曲线分辨率方法来为每个因子 确定平均浓度分布。
40. 如权利要求39所述的方法,其中计算出的平均浓度分布用作每个因子的估计的峰 形状。
41. 如权利要求38所述的方法,还包括: 测量平均浓度分布的峰质量;以及 除去具有小于阈值峰质量的峰质量的数据。
42. 如权利要求41所述的方法,其中测量步骤是通过确定每个浓度分布的拟合的残差 的偏差来计算的。
43. 如权利要求42所述的方法,其中偏差是双-1?斯系统中的标准差。
44. 如权利要求41所述的方法,其中阈值峰质量是0. 5。
45. 如权利要求44所述的方法,其中输入相关性参数是手动录入的。
46. 如权利要求40所述的方法,还包括: 比较估计的峰形状与至少一个预先选择的曲线。
47. 如权利要求46所述的方法,还包括: 在比较步骤之前归一化估计出的峰形状,以确定归一化的估计的峰形状。
48. 如权利要求47所述的方法,其中归一化步骤包括通过重新采样过程拉伸或收缩中 至少一个,然后使估计出的峰形状居中,以匹配至少一个预先选择的曲线的宽度和中心。
49. 如权利要求47所述的方法,还包括: 计算归一化的峰形状和至少一个预先选定的曲线之间的相关性。
50. 如权利要求49所述的方法,其中用于最佳匹配的偏度和峰度值被选择作为用于优 化的种子。
51. 如权利要求46所述的方法,其中至少一个预先选定的曲线是从Pearson IV函数生 成的。
52. 如权利要求51所述的方法,其中至少一个预先选定的曲线是偏度和峰度中至少一 个的排列,而其余的参数保持恒定,使得峰形状其后为每个排列记录并保存。
53. 如权利要求1所述的方法,还包括: 检查用于与同位素和加合物之一或二者关联的信息的数据; 选择该关联的数据; 证明该关联数据的资格;以及 如果该关联数据有资格,就把其分配给因子。
54. 如权利要求53所述的方法,其中资格证明步骤包括: 对照因子计算数据的相关性;以及 如果相关性大于最小相关性,就把其分配给因子。
55. 如权利要求54所述的方法,其中最小相关性是0. 9。
56. 如权利要求36所述的方法,还包括: 识别利用因子被不正确地分组的同位素/加合物;以及 把这样识别出的同位素/加合物重新分配给正确的因子。
57. 如权利要求56所述的方法,其中识别步骤包括: 比较因子的浓度分布与相邻因子的浓度分布,以识别相关性; 如果第一因子的浓度分布与相邻因子的浓度分布之间的相关性大于阈值相关性,就检 查该相邻因子,以便从第一因子定位同位素/加合物;以及 基于检查步骤把同位素/加合物重新分配给第一因子。
58. 如权利要求57所述的方法,其中阈值相关性是0. 9。
59. 如权利要求36所述的方法,其中相关性参数是用户定义的。
60. 如权利要求36所述的方法,还包括: 防止因子分裂。
61. 如权利要求60所述的方法,其中防止步骤包括: 确定基于因子内基础同位素/加合物子簇和该因子内其它子簇之间的平均相关性的 局部相关性阈值; 关联该因子和最近因子的浓度分布;以及 如果相关性大于局部相关性阈值,则合并该因子与所述最近因子。
62. 如权利要求61所述的方法,还包括: 如果因子被合并,则关联该因子与下一个最近因子的浓度分布。
63. 如权利要求61所述的方法,其中阈值相关性是0. 9。
64. 如权利要求8所述的方法,其中最小簇长度是5个棒。
65. 如权利要求60所述的方法,其中防止步骤包括: 基于其间的一个或多个条件比较第一峰和第二峰;以及 基于所述一个或多个条件把第一和第二峰归类为相关或不相关,其中比较步骤包括以 下一个或两个步骤:(i)比较第一峰的方差和第二峰的方差;以及(ii)比较第一峰的均值 保留时间和第二峰的均值保留时间。
66. 如权利要求65所述的用于处理色谱系统中色谱峰的方法,其中比较步骤既比较第 一峰的方差和第二峰的方差,又比较第一峰的均值保留时间和第二峰的均值保留时间。
67. 如权利要求66所述的用于处理色谱系统中色谱峰的方法,其中比较第一峰的方差 和第二峰的方差的步骤包括子步骤: 确定第一峰和第二峰之间的F-统计; 分配与t-统计相关的F-统计置信区间; 比较F-统计置信区间与预定的t-统计参数; 基于比较F-统计置信区间与预定F-统计参数的步骤,把第一峰和第二峰特征化为相 关或不相关。
68. 如权利要求66所述的用于处理色谱系统中色谱峰的方法,其中比较第一峰的均值 保留时间和第二峰的均值保留时间的步骤包括子步骤: 确定第一峰和第二峰之间的t-统计; 分配与F-统计相关的t-统计置信区间; 比较t-统计置信区间与预定的F-统计参数; 基于比较t-统计置信区间与预定的F-统计参数的步骤,把第一峰和第二峰特征化为 相关或不相关。
69. 如权利要求66所述的用于处理色谱系统中色谱峰的方法,其中比较第一峰的均值 保留时间和第二峰的均值保留时间的步骤包括子步骤: 确定第一峰和第二峰之间的t-统计; 分配与F-统计相关的t-统计置信区间; 比较t-统计置信区间与预定的F-统计参数; 并且其中比较第一峰的方差和第二峰的方差的步骤包括子步骤: 确定第一峰和第二峰之间的F-统计; 分配与t-统计相关的F-统计置信区间; 比较F-统计置信区间与预定的t-统计参数; 基于(i)比较t-统计置信区间与预定的F-统计参数的步骤和(ii)比较F-统计置信 区间与预定的t-统计参数的步骤,把第一峰和第二峰特征化为相关或不相关。
70. 如权利要求66所述的用于处理色谱系统中色谱峰的方法,其中色谱系统包括具有 F-统计查找表的存储器并且其中确定F-统计的步骤包括在查找表上查找F-统计的步骤。
71. 如权利要求70所述的用于处理色谱系统中色谱峰的方法,其中F-统计查找表包括 利用单值分解计算出并且存储在系统存储器中的预定F-统计值。
72. 如权利要求69所述的用于处理色谱系统中色谱峰的方法,其中色谱系统包括具有 F-统计查找表的存储器并且其中确定F-统计的步骤包括在查找表上查找F-统计的步骤。
73. 如权利要求72所述的用于处理色谱系统中色谱峰的方法,其中F-统计查找表包括 利用单值分解计算出并且存储在系统存储器中的预定F-统计值。
74. 如权利要求35所述的用于处理色谱系统中色谱峰的方法,其中因子包括一个或多 个峰并且al、σ 1、a2和σ 2 -般对多个峰中每一个受约束,该方法还包括: 利用双指数模型建模一个或多个色谱峰并且识别一个或多个色谱峰和双指数模型之 间的残差拟合;以及 如果残差拟合不满足残差拟合的预定条件,则迭代地增加信号再多一个峰,直到迭代 的残差满足迭代残差拟合的预定条件。
75. 如权利要求74所述的处理数据的方法,其中迭代增加的步骤涉及优化信号。
76. 如权利要求75所述的处理数据的方法,其中信号是通过使用 Levenberg-Marquardt (LM)算法优化的。
77. 如权利要求76所述的处理数据的方法,其中LM算法是利用解析表达式计算的。
78. 如权利要求36所述的用于处理色谱系统中色谱峰的方法,其中因子包括一个或多 个峰并且al、〇l、a2和σ 2-般对多个峰中每一个受约束,该方法还包括: 利用双指数模型建模一个或多个色谱峰并且识别一个或多个色谱峰和双指数模型之 间的残差拟合;以及 如果残差拟合不满足残差拟合的预定条件,则迭代地增加信号再多一个峰,直到迭代 的残差满足迭代残差拟合的预定条件。
79. 如权利要求78所述的处理数据的方法,其中迭代增加的步骤涉及优化信号。
80. 如权利要求79所述的处理数据的方法,其中信号是通过使用 Levenberg-Marquardt (LM)算法优化的。
81. 如权利要求80所述的处理数据的方法,其中LM算法是利用解析表达式计算的。
【文档编号】H01J49/00GK104126119SQ201280069812
【公开日】2014年10月29日 申请日期:2012年9月11日 优先权日:2012年1月16日
【发明者】王纪红, P·M·威利斯 申请人:莱克公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1