用于执行串联质谱法的系统和方法与流程

文档序号:30623354发布日期:2022-07-02 05:24阅读:383来源:国知局
用于执行串联质谱法的系统和方法与流程
用于执行串联质谱法的系统和方法


背景技术:

1.质谱仪是可以用于基于分子的质荷比(m/z)来检测、标识和/或量化分子的灵敏仪器。质谱仪通常包含用于从包含在样品中的组分生成离子的离子源、用于基于其m/z分离离子的质量分析器以及用于检测分离离子的离子检测器。质谱仪可以连接到基于计算机的软件平台,所述基于计算机的软件平台使用来自离子检测器的数据来构建质谱,所述质谱示出了检测到的离子中的每个离子随m/z而变化的相对丰度。离子的m/z可以用于检测和量化简单和复杂混合物中的分子。例如液相色谱仪、气相色谱仪或毛细管电泳装置之类的分离装置可以耦合到质谱仪以在将组分引导到质谱仪之前分离包含在样品中的组分。
2.串联质谱法是分析由在两个或更多个连续阶段中的组分产生的离子以获取前体离子和/或产物离子(例如,在中间解离阶段期间通过前体离子的解离产生的离子)的质谱的技术。两级串联质谱法通常被称为质谱/质谱(ms/ms)。在数据相关获取(dda)过程中,使用预定规则为串联质谱法(例如,ms/ms)选择固定数目个前体离子,其m/z值记录在测量获取(例如,全谱ms扫描)中,其中选定前体离子经受质量分析的一个或多个额外阶段以生成产物离子质谱。
3.仅当通过测量获取确认存在从分离装置洗脱的所关注的组分时,dda过程才通过对选定m/z执行昂贵的ms/ms分析来有效地利用质谱仪的资源。在许多典型分析中,可以在基本上相同的时间从分离装置洗脱数百个组分。为了能够对从分离装置洗脱的最大数目的组分进行ms/ms分析,应用了动态排除窗口,以便在一段时间内对每个选定m/z仅执行一次串联质谱法。然而,当对应强度值刚好上升到高于最小阈值并且当强度值相对较弱时,预定规则通常会针对每个选定m/z触发ms/ms。因此,需要更长的离子累积时间来获得选定m/z的可接受质量的ms/ms谱。然而,较长的累积时间会增加每次ms/ms获取所需的时间量,并且因此ms/ms可以分析的组分较少。


技术实现要素:

4.以下描述呈现了本文所描述的方法和系统的一个或多个方面的简化概述,以便提供对此类方面的基本理解。此概述不是所有所涵盖方面的广泛综述,并且既不希望标识所有方面的关键或决定性要素,也不希望划定任何或所有方面的范围。其唯一目的是以简化形式呈现本文所描述的方法和系统的一个或多个方面的一些概念,作为下文呈现的更详细描述的序言。
5.在一些示意性实施例中,一种执行串联质谱法的示意性方法包括:将样品供应到色谱柱;将包含在所述样品中并且从所述色谱柱洗脱的组分引导到质谱仪;获取一系列质谱,所述一系列质谱包含随离子的m/z而变化的由所述组分产生的离子强度值;从所述一系列质谱中提取多个检测点,所述多个检测点表示随选定m/z的时间而变化的强度;基于从所述一系列质谱提取的所述多个检测点估计包含在所述多个检测点中的选定检测点的相对位置,所述选定检测点的所述相对位置表示所述选定检测点相对于预期参考点的位置;以及在所述质谱仪处并且基于所估计的相对位置对所述选定m/z执行相关获取。
6.在一些示意性实施例中,所述选定检测点的所述相对位置包括所述选定检测点的归一化强度值,所述归一化强度值表示所述选定检测点的检测到的强度值与所述选定m/z的预期最大强度值之比。
7.在一些示意性实施例中,从所述一系列质谱中提取的所述多个检测点包含在滑动窗中,所述滑动窗包含当前检测点。
8.在一些示意性实施例中,所述选定检测点包括当前检测点。
9.在一些示意性实施例中,所述方法进一步包括确定所述归一化强度值超出阈值,其中响应于所述确定所述归一化强度值超出所述阈值而执行所述相关获取。
10.在一些示意性实施例中,所述阈值在约0.5与约1.0之间。
11.在一些示意性实施例中,所述阈值在约0.8与约1.0之间。
12.在一些示意性实施例中,所述选定检测点的所述相对位置包括所述选定检测点到所述选定m/z的预期时间点的时间距离。
13.在一些示意性实施例中,所述选定检测点的所述相对位置包括所述选定m/z的预期洗脱曲线的区域,并且所述选定检测点位于所述区域中。
14.在一些示意性实施例中,所述选定m/z的所述相关获取包括ms/ms获取。
15.在一些示意性实施例中,所述执行所述相关获取包括基于所述选定检测点的所述相对位置针对未来时间安排所述相关获取,以及在所述未来时间执行所述相关获取。
16.在一些示意性实施例中,所述安排所述相关获取包括基于所述所估计的相对位置估计所述选定m/z的最大强度值的预期时间,其中所述未来时间包括所述选定m/z的所述最大强度值的所估计的预期时间。
17.在一些示意性实施例中,一种用于执行串联质谱法的设备包括:质谱仪,其被配置成接收包含在样品中并且从色谱柱洗脱的组分并且分析由所述组分产生的离子;以及计算装置,其被配置成:从所述质谱仪获取一系列质谱,所述一系列质谱包含随所述离子的m/z而变化的由所述组分产生的离子强度值;针对多个不同的选定m/z中的每一个,从所述一系列质谱提取由所述质谱仪随时间检测到的多个检测点;基于每个相应选定m/z的所述多个检测点估计分别包含在多个检测点中的选定检测点的相对位置,每个相对位置表示所述选定检测点相对于所述相应选定m/z的预期参考点的位置;并且基于所估计的相对位置控制所述质谱仪以执行多个相关获取。
18.在一些示意性实施例中,每个所估计的相对位置包括所述相应选定检测点的归一化强度值,所述归一化强度值表示所述选定检测点的检测到的强度值与所述选定m/z的预期最大强度值之比,并且所述计算装置被配置成基于所估计的归一化强度值的数字次序控制所述质谱仪以执行所述多个相关获取。
19.在一些示意性实施例中,所述多个相关获取包括针对每个选定m/z的相关获取,其中对应选定检测点具有超出阈值的归一化强度值。
20.在一些示意性实施例中,所述控制所述质谱仪以执行所述多个相关获取包括基于所述归一化强度值的数字次序针对不同的未来时间安排所述多个相关获取中的每一个,以及控制所述质谱仪以在相应未来时间执行所述多个相关获取中的每一个。
21.在一些示意性实施例中,所述安排所述多个相关获取中的每一个包括基于所述所估计的归一化强度值估计每个选定m/z的最大强度值的预期时间,其中每个相应未来时间
包括所述相应选定m/z的所述最大强度值的所估计的预期时间。
22.在一些示意性实施例中,一种存储指令的非暂时性计算机可读介质,所述指令在被执行时使得计算装置的处理器:获取第一数据集,所述第一数据集包括一系列质谱,所述一系列质谱包含随离子的m/z而变化的由从色谱柱洗脱的分析物产生的离子强度值;从所述第一数据集提取第二数据集,所述第二数据集包含表示随选定质荷比(m/z)的时间而变化的强度的多个检测点;基于所述第二数据集估计包含在所述第二数据集中的选定检测点的相对位置,所述选定检测点的所述相对位置表示所述选定检测点相对于所述选定m/z的预期参考点的位置;以及基于所估计的相对位置控制所述质谱仪以执行数据相关动作。
23.在一些示意性实施例中,所述数据相关动作包括执行串联质谱法。
24.在一些示意性实施例中,所述控制所述质谱仪以执行所述数据相关动作包括安排所述质谱仪以在未来时间针对所述选定m/z执行串联质谱法。
25.在一些示意性实施例中,所述安排所述质谱仪以在所述未来时间针对所述选定m/z执行串联质谱法包括:基于所述选定检测点的所述所估计的相对位置估计所述选定m/z的最大强度值的预期时间;其中所述未来时间包括所述选定m/z的所述最大强度值的所估计的预期时间。
26.在一些示意性实施例中,一种系统包括:色谱柱,其被配置成接收样品并且分离包含在所述样品中的组分;质谱仪,其被配置成接收从所述色谱柱洗脱的所述组分并且分析由所述组分产生的离子;以及计算装置,其被配置成:获取一系列质谱,所述一系列质谱包含随离子的m/z而变化的由所述组分产生的离子强度值;从所述一系列质谱中提取多个检测点,所述多个检测点表示随选定m/z的时间而变化的强度;基于从所述一系列质谱提取的所述多个检测点估计包含在所述多个检测点中的选定检测点的相对位置,所述选定检测点的所述相对位置表示所述选定检测点相对于预期参考点的位置;以及基于所估计的相对位置控制所述质谱仪以对所述选定m/z执行相关获取。
附图说明
27.附图示出了各种实施例,并且是说明书的一部分。所示出的实施例仅是实例,并且不限制本公开的范围。贯穿本附图,相同或相似的附图标记表示相同或相似的元件。
28.图1示出包含液相色谱仪和质谱仪的示意性液相色谱-质谱系统。
29.图2示出图1的质谱仪的示意性实施方案。
30.图3示出与由包含在样品中并且从图1的液相色谱仪洗脱的组分产生的离子相关联的选定m/z的示意性质量色谱图(例如,提取离子色谱图(xic))。
31.图4示出示意性质谱控制系统。
32.图5示出使用图1的液相色谱-质谱系统和图4的质谱控制系统执行串联质谱法的示意性方法。
33.图6示出示意性xic,所述xic可以由图1的液相色谱-质谱系统在多个测量获取期间获取的数据生成或表示所述数据。
34.图7示出在获取两个额外测量获取之后的图6的示意性xic。
35.图8示出将图7所示的xic的洗脱曲线划分为不同区域的示意性划分。
36.图9示出将图7所示的xic的洗脱曲线划分为不同区域的另一示意性划分。
37.图10示出使用图1的液相色谱-质谱系统和图4的质谱控制系统执行串联质谱法的另一示意性方法。
38.图11示出用于训练可以实施估计模型的机器学习模型的示意性方法。
39.图12示出示意性xic,所述xic可以由可用于训练图11的机器学习模型的训练数据生成或表示所述训练数据。
40.图13示出示意性计算装置。
具体实施方式
41.本文描述了用于执行串联质谱法的方法和系统。在一些示意性实施例中,一种执行串联质谱法的方法包含将样品供应到色谱柱,将包含在样品中并且从色谱柱洗脱的组分引导到质谱仪,以及获取一系列质谱。所述一系列质谱包含随离子的m/z而变化的由组分产生的离子强度值。从一系列质谱提取多个检测点。多个检测点表示随选定m/z的时间(保留时间)而变化的强度。基于从一系列质谱中提取的多个检测点,估计包含在多个检测点中的选定检测点的归一化强度值。归一化强度值表示选定检测点的检测到的强度值与参照强度值(例如,选定m/z的预期最大强度值)之比。基于所估计的归一化强度值,对选定m/z执行相关获取。例如,可以响应于确定选定检测点的所估计的归一化强度值超出阈值(例如,0.7)而执行串联质谱法(例如,ms/ms)。
42.本文所描述的系统和方法可以提供各种益处,所述益处可以包含优于用于执行串联质谱法的常规系统和方法的一个或多个优点。例如,当特定组分的当前信号强度处于或接近组分的预期洗脱曲线的最大强度水平(例如,最大强度水平的约70%或更高)时,可以触发相关获取或其它数据相关动作。因此,可以以高质量(例如,高信噪比)获取相关获取。此外,高质量相关获取信号允许质量分析器和/或离子阱累积时间短于相关获取信号质量较低时的时间,从而减少了执行相关获取所需的时间,并且允许通过串联质谱法分析更多数目的共洗脱组分。
43.现在将参考图式更详细地描述各种实施例。本文所描述的系统和方法可以提供上述益处中的一个或多个和/或本文将使各种额外的和/或替代性的益处显而易见。
44.在一些实施方案中,用于执行串联质谱法的方法和系统可以与例如液相色谱-质谱(lc-ms)系统之类的组合的分离质谱系统结合使用。因而,现在将描述示例性lc-ms系统。所描述的lc-ms系统是示意性的而非限制性的。本文所描述的方法和系统可作为本文所描述的lc-ms系统和/或与任何其它合适的分离质谱系统的部分操作或与其一起操作,所述分离质谱系统包含高性能液相色谱-质谱(hplc-ms)系统、气相色谱-质谱(gc-ms)系统或毛细管电泳-质谱(ce-ms)系统。
45.图1示出示意性的lc-ms系统100。lc-ms系统100包含液相色谱仪102、质谱仪104和控制器106。液相色谱仪102被配置成随着时间的推移分离注入液相色谱仪102的样品108内的组分(例如,分析物)。样品108可以包含例如用于通过lc-ms系统100检测和分析的化学组分(例如,分子、离子等)和/或生物组分(例如,代谢物、蛋白质、脂质等)。液相色谱仪102可以由例如可符合特定实施方案的任何液相色谱仪来实施。在液相色谱仪102中,可以将样品108注入流动相(例如,溶剂)中,所述流动相将样品108运载通过含有固定相(例如,吸附剂填充材料)的柱110。当流动相穿过柱110时,样品108内的组分基于例如其大小、其对固定相
的亲和力、其极性和/或其疏水性在不同时间从柱110中洗脱出来。检测器(例如,分光光度计)可以测量由来自柱110的洗脱液112中的每个分离组分调制的信号的相对强度。由检测器生成的数据可以表示为色谱图,所述色谱图在x轴上标绘保留时间并且在y轴上标绘表示相对强度的信号。组分的保留时间通常被测量为将样品108注入流动相中与色谱分离之后出现相对强度最大峰之间的时间段。在一些实例中,相对强度可以与分离的组分的相对丰度相关或表示所述分离的组分的所述相对丰度。液相色谱仪102生成的数据可以输出到控制器106。
46.在一些情况下,具体地说在复杂混合物的分析中,样品108中的多个不同组分可能在大致相同时间从柱110中共洗脱出来,并且因此可能具有相同或类似的保留时间。因此,确定样品108内各个组分的相对强度需要进一步分离各个组分。为此目的,液相色谱仪102将包含在洗脱液112中的组分引导到质谱仪104。
47.质谱仪104被配置成使从液相色谱仪102接收的组分电离并且基于离子的m/z对产生的离子进行分类或分离。质谱仪104中的检测器测量由离子产生的信号的强度。如本文所使用,“强度”或“信号强度”可以指任何合适的度量,例如丰度、相对丰度、离子计数、强度、相对强度等。由检测器生成的数据可以由质谱表示,其标绘随离子的m/z而变化的观测信号强度。通过质谱仪104获取的数据可以输出到控制器106。
48.质谱仪104可以由任何合适的质谱仪实施,例如被配置成执行串联质谱法(例如,ms/ms)的串联质谱仪、被配置成执行多级质谱(还表示为msn)的多级质谱仪、混合质谱仪等。图2示出质谱仪104的示意性实施方案。如图所示,质谱仪104是空间串联的(例如,具有多个质量分析器),并且具有用于执行ms/ms的两个级。然而,质谱仪104不限于此配置,但可以具有任何其它合适的配置。例如,质谱仪104可以具有单个质量分析器并且可以是时间串联的。另外或替代地,质谱仪104可以是多级质谱仪,并且可以具有用于执行多级串联质谱法(例如,ms/ms/ms)的任何合适数目个级(例如,三个或更多个)。
49.如图所示,质谱仪104包含离子源202、第一质量分析器204-1、碰撞室204-2、第二质量分析器204-3和控制器206。质谱仪104可以进一步包含可以适合于特定实施方案(例如,离子光学器件、滤光器、自动取样器、检测器等)的未示出的任何另外的或替代性组件。
50.离子源202被配置成从组分产生离子流208并且将离子递送到第一质量分析器204-1。离子源202可以使用任何合适的电离技术,包含但不限于电子电离、化学电离、基质辅助激光解吸/电离、电喷雾电离、大气压化学电离、大气压光电离、电感耦合等离子体等。离子源202可以包含用于从包含在样品108中的组分产生离子并且将离子递送到第一质量分析器204-1的各种组件。
51.第一质量分析器204-1被配置成接收离子流208并且将离子束210(例如,前体离子)引导到碰撞室204-2。碰撞室204-2被配置成接收离子束210并且经由受控解离过程产生产物离子(例如,碎片离子)。碰撞室204-2进一步被配置成将产物离子束212引导到第二质量分析器204-3。第二质量分析器204-3被配置成过滤和/或执行产物离子的质量分析。
52.质量分析器204-1和204-3被配置成根据每个离子的m/z来分离离子。质量分析器204-1和204-3可以由任何合适的质量分析器来实施,例如四极杆滤质器、离子阱(例如,三维四极杆离子阱、圆柱形离子阱、线性四极杆离子阱、环形离子阱等)、飞行时间(tof)质量分析器、静电阱质量分析器(例如,轨道静电阱,例如轨道阱(orbitrap)质量分析器、
kingdon阱等)、傅立叶变换离子回旋共振(ft-icr)质量分析器、扇形质量分析器等。质量分析器204不需要由相同类型的质量分析器来实施。
53.碰撞室204-2可以由任何合适的碰撞室来实施。如本文所使用,术语“碰撞室”可以涵盖被配置成经由受控解离过程产生产物离子的任何结构或装置,并且不限于用于碰撞激活解离的装置。例如,碰撞室204-2可以被配置成使用碰撞诱导解离、电子转移解离、电子捕获解离、光诱导解离、表面诱导解离、离子/分子反应等使前体离子碎片化。
54.离子检测器(未示出)被配置成以各种不同m/z中的每一个检测离子并且响应性地生成表示离子强度的电信号。电信号被传输到控制器206以进行处理,以便构造样品的质谱。例如,质量分析器204-3可以将分离的离子的发射束发射到离子检测器,所述离子检测器被配置成检测发射束中的离子并且生成或提供可以由控制器206用于构造样品的质谱的数据。离子检测器可以由包含但不限于电子倍增器、法拉第杯等的任何合适的检测装置来实施。
55.控制器206可以与质谱仪104以通信方式耦合,并且被配置成控制所述质谱仪的操作。例如,控制器206可以被配置成控制离子源104和/或质量分析器204-1和204-3中包含的各种硬件组件的操作。为了说明,控制器206可以被配置成控制离子源202和/或质量分析器204的累积时间,控制振荡电压电源和/或dc电源以向质量分析器204供应rf电压和/或dc电压,调整rf电压和dc电压的值以选择用于分析的有效m/z(包含质量容差窗口),并且调整离子检测器的灵敏度(例如,通过调整检测器增益)。
56.控制器206还可以包含和/或提供用户界面,所述用户界面被配置成实现质谱仪104的用户与控制器206之间的交互。用户可以通过触觉、视觉、听觉和/或其它感觉类型的通信,经由用户界面与控制器206交互。例如,用户界面可以包含用于向用户显示信息(例如,质谱、通知等)的显示装置(例如,液晶显示器(lcd)显示屏、触摸屏等)。用户界面还可以包含允许用户向控制器206提供输入的输入装置(例如,键盘、鼠标、触摸屏装置等)。在其它实例中,显示装置和/或输入装置可以与控制器206分离但以通信方式耦合到所述控制器。例如,显示装置和输入装置可以包含在通过有线连接(例如,通过一根或多根电缆)和/或无线连接以通信方式连接到控制器206的计算机(例如,桌上型计算机、膝上型计算机等)中。
57.控制器206可以包含如可以服务于特定实施方案的任何合适的硬件(例如,处理器、电路系统等)和/或软件。尽管图2示出控制器206包含在质谱仪104中,但是控制器206可以可替代地以与质谱仪104完全或部分地分离的方式,例如通过计算装置来实施,所述计算装置通过有线连接(例如,电缆)和/或网络(例如,局域网、无线网络(例如,wi-fi)、广域网、因特网、蜂窝数据网络等)以通信方式耦合到质谱仪104。在一些实例中,控制器206可以全部或部分地由控制器106实施。
58.再次参考图1,控制器106可以与lc-ms系统100(例如,液相色谱仪102和质谱仪104)以通信方式耦合,并且被配置成控制所述lc-ms系统的操作。控制器106可以包含任何合适的硬件(例如,处理器、电路系统等)和/或被配置成控制lc-ms系统100的各种组件(例如,液相色谱仪102或质谱仪104)的操作和/或与其介接的软件。
59.例如,控制器106可以被配置成从质谱仪104获取包括通过液相色谱仪102和质谱仪104随时间获取的数据的第一数据集。第一数据集可以包含一系列质谱,所述一系列质谱包含随离子的m/z而变化的由样品108的组分产生的离子强度值。第一数据集可表示在三维
图中,其中沿x轴标绘时间(例如,保留时间),沿y轴标绘m/z,并且沿z轴标绘强度。图上的谱特征(例如,强度的峰)表示由lc-ms系统100对包含在样品108中的各种组分产生的离子的检测。图的x轴和z轴可用于生成标绘随时间而变化的强度的质量色谱图。图的y轴和z轴表示标绘随m/z而变化的强度的质谱。
60.图3示出与由包含在样品108中并且从液相色谱仪102洗脱的组分产生的离子相关联的选定m/z的示意性质量色谱图300(例如,提取离子色谱图(xic))。如本文所使用,“选定m/z”可以包含具有或不具有质量容差窗口或较窄范围的m/z的特定m/z。在dda过程的第一阶段期间根据由质谱仪104获取的数据生成质量色谱图300,所述第一阶段例如多个测量获取(例如,ms全谱扫描)或质谱获取。质量色谱图300标绘随保留时间(以分钟计)而变化的强度(任意单位)。如图所示,质量色谱图300包含多个检测点,每个检测点从不同的获取中获取,其一起形成组分的洗脱曲线302(如虚线曲线所指示)。当组分从柱110洗脱时,检测到的离子强度产生具有大致高斯分布的峰304。
61.在常规的dda实验中,当检测到组分的洗脱时触发相关获取(例如,ms/ms扫描)。如图3所示,当检测到的强度值刚好上升到高于预定最小阈值强度值(由虚线306所指示)时,在时间t1检测到组分的洗脱,这通常在峰304的开始处并且当强度值相对较弱时发生。在时间窗口308期间(例如,从时间t1到时间t2或峰的持续时间)应用动态排除,使得在时间窗口308期间不针对选定m/z执行相关获取。为了在峰304的早期触发相关获取时将ms/ms谱与已知组分匹配的概率最大化,在质量分析器处需要更长的离子累积时间以产生用于每个选定m/z的更强的ms/ms信号。然而,更长的离子累积时间使得ms/ms获取较慢。因此,可以通过ms/ms分析不同选定m/z的较少组分。
62.当检测到的强度值处于峰304的顶点310处或附近时,可以通过触发选定m/z的相关获取(例如,ms/ms扫描)来解决这些问题。然而,确定选定m/z是否在峰304的顶点310处或附近是具有挑战性的信号处理问题。先前解决所述问题的尝试将每个选定m/z的测量获取信号视为正弦波。通过此技术,对所述数据执行傅立叶分析,使得为每个点指定频率和相位值。当相位处于与洗脱曲线峰的顶点相对应的值的某个范围时,可以采取数据相关动作。此过程在理论上运行良好,但会产生带有真实、有噪声的数据的随机结果。需要更好的方法来在选定m/z的洗脱曲线峰的顶点处或附近启动数据相关动作。
63.如下文将更详细地描述,执行串联质谱法的改进方法包含基于当前获取的质谱估计洗脱曲线中的选定检测点的相对位置,并且基于选定检测点的所估计的相对位置执行数据相关动作。选定检测点的相对位置可以是选定检测点在时间或强度上相对于洗脱曲线中的参考点(例如,顶点)的位置。另外或替代地,相对位置可以是洗脱曲线的区域(例如,基线区域、上升区域、顶点区域、下降区域等),所述选定检测点位于所述区域中,并且指示组分的洗脱状态。可以相对于洗脱曲线中的参考点(例如,顶点)限定区域。
64.对选定检测点的相对位置的估计基于选定检测点的相对位置随选定检测点周围(例如,在选定检测点前面和/或后面)的多个检测点的检测到的强度值而变化的原理。因此,可以实时估计选定检测点相对于洗脱曲线峰的预期或预测顶点的位置,并且所述位置可用于执行数据相关动作。
65.与执行串联质谱法的改进方法相关联的一个或多个操作可以由质谱控制系统执行。图4示出示意性质谱控制系统400(“系统400”)。系统400可完全或部分地由lc-ms系统
100(例如,由控制器106和/或控制器206)来实施。替代地,系统400可以与lc-ms系统100分开实施。
66.系统400可以包含但不限于选择性地并且以通信方式耦合到彼此的存储设施402和处理设施404。设施402和404可以各自包含硬件和/或软件组件(例如,处理器、存储器、通信接口、存储在存储器中以由处理器执行的指令等)或由所述硬件和/或软件组件实施。在一些实例中,设施402和404可以分布在如可以服务于实施方案的多个装置和/或多个位置之间。
67.存储设施402可以维护(例如,存储)由处理设施404用来执行本文所描述的操作中的任何操作的可执行数据。例如,存储设施402可以存储可以由处理设施404执行以执行本文所描述的操作中的任何操作的指令406。指令406可以由任何合适的应用、软件、代码和/或其它可执行数据实例来实施。
68.存储设施402还可以维护由处理设施404获取、接收、生成、管理、使用和/或传输的任何数据。例如,存储设施402可以维护lc-ms数据(例如,所获取的色谱图数据和/或质谱数据)和/或估计数据。估计数据可以包含表示一个或多个模型(例如,机器学习模型)或由处理设施404维护的算法的数据、由所述一个或多个模型或所述算法使用的数据或与所述一个或多个模型或所述算法相关联的数据,以用于估计包含在lc-ms数据中的选定检测点的相对位置。
69.处理设施404可以被配置成执行(例如,执行存储在存储设施402中的指令406以执行)本文所描述的各种处理操作。将认识到,本文所描述的操作和实例仅说明可由处理设施404执行的许多不同类型的操作。在下面描述中,对由系统400执行的操作的任何引用均可以理解为由系统400的处理设施404执行。此外,在本文的描述中,由系统400执行的任何操作可以理解为包含引导或指示另一系统或装置执行操作的系统400。
70.图5示出执行串联质谱法的示意性方法。尽管图5示出根据一个实施例的示意性操作,但其它实施例可以省略、添加、重新排序和/或修改图5所示的操作中的任何操作。图5所示的操作中的一个或多个操作可以由lc-ms系统100和/或系统400、包含在其中的任何组件和/或其任何实施方案来执行。
71.在操作502和504中,液相色谱仪102将样品108供应到柱110并且将包含在样品108中并且从柱110洗脱的组分引导到质谱仪104。在操作506中,随着组分从柱110洗脱出来,质谱仪104执行dda过程的第一阶段(例如,全谱质谱获取、ms测量扫描等)并且获取包含一系列质谱的第一数据集508(例如,lc-ms数据),所述一系列质谱包含随离子的m/z而变化的由组分产生的离子强度值。
72.在操作510中,系统400从lc-ms系统100(例如,质谱仪104)获取第一数据集508。
73.在操作512中,系统400从第一数据集508提取第二数据集514。第二数据集514包含多个检测点,每个检测点来自不同获取并且表示由质谱仪104检测到的随选定m/z的时间而变化的强度。选定m/z可以是从包含在样品108中的所关注特定组分产生的离子的m/z,并且可以基于存在于第一数据集508中的质量峰而被选择。在一些实例中,第二数据集514包括可用于生成选定m/z的xic的xic或源数据。
74.在操作516中,系统400基于第二数据集514和估计模型518估计包含在第二数据集中的选定检测点的相对位置。选定检测点的相对位置可以是选定检测点的归一化强度值、
选定检测点距参考点的预期时间的时间距离,或选定检测点所位于的洗脱曲线的区域(例如,基线区域、上升区域、顶点区域、下降区域等),其中所述区域是相对于洗脱曲线中的参考点(例如,顶点)限定的。操作516可以按任何合适的方式执行。现在将参考图6-9描述操作516的示意性实施例。
75.图6示出可以从第二数据集514生成或表示所述第二数据集的示意性xic 600。xic 600将有助于操作516的描述,但可以在没有生成xic 600的情况下用原始源数据执行操作516。如图所示,xic 600标绘多个检测点602,每个检测点表示选定m/z的随保留时间(以分钟计)而变化的检测到的强度值(任意单位),如在dda过程的第一阶段期间(例如,在操作506期间)由质谱仪104检测到的。由质谱仪104获取的每个连续质谱将新的检测点602添加到xic 600。如xic 600上所示,最右边的检测点602-1是在当前时间tc获取并且具有如虚线604所指示的当前强度值ic的当前(最近的)检测点602。如图6所示,检测点602一起形成与选定m/z相关联的组分的洗脱曲线。检测点602的强度值的上升轨线指示预期(例如,估计或预测)洗脱曲线中的峰606的开始。在图6中,预期洗脱曲线由虚线曲线表示。
76.在一些实例中,系统400被配置成相对于参考强度值估计选定检测点602的归一化强度值。在以下实例中,选定检测点602是当前检测点602-1。在替代实例中,选定检测点可以是在dda过程期间获取的任何历史检测点602(例如,在当前时间tc之前获取的任何检测点602,例如,第二或第三最近的检测点602)。
77.在一些实例中,参考强度值是选定m/z的峰606的顶点608处的预期最大强度值i
max
,如虚线610所指示。然而,由于尚未在当前时间tc检测到峰606的最大强度值i
max
,因此将多个检测点602的不同集合612的强度值作为输入应用到估计模型518,所述估计模型被配置成估计选定检测点602-1的归一化强度值。在一些实例中,集合612包括预定数目(例如,6个、24个、48个、100个等)的检测点602。在替代实例中,集合612仅包括在滑动时间窗口内出现的检测点602。例如,滑动时间窗口可以涵盖0.1秒、0.5秒、3秒等的周期。在任一配置中,选定检测点602包含在集合612中。
78.在一些实例中,检测点602可以不沿着时间轴均匀地间隔开。为了简化第二数据集514的处理,可以将检测点602校正(例如,通过内插)到固定且均匀的时间间隔(例如,1秒)。
79.估计模型518被配置成执行可由系统400进行或执行以估计选定检测点602-1的归一化强度值的任何合适的探索性步骤、过程和/或操作。在一些实例中,估计模型518可以由例如系统400的存储设施402(例如,估计数据)和/或处理设施404之类的硬件和/或软件组件(例如,处理器、存储器、通信接口、存储在存储器中以由处理器执行的指令等)来实施。估计模型518可以包含被配置成基于一组历史检测点的强度值估计选定检测点的归一化强度值的任何合适的算法和/或机器学习模型。估计模型518可以按任何合适方式估计归一化强度值。在一些实例中,估计模型518包括机器学习模型。下文将更详细地描述示意性机器学习模型和训练机器学习模型的方法。
80.当参考强度值是峰606的预期最大强度值i
max
时,选定检测点602-1的归一化强度值将通常在0到1的范围内。在图6的实例中,系统400可以将选定检测点602-1的归一化强度值估计为0.15,因此指示选定检测点602-1的当前强度值ic是顶点608处的预期强度值i
max
的约15%。图7示出来自两个额外获取的数据之后的xic 600。在图7中,系统400现在将当前检测点602-1的归一化强度值估计为0.65。
81.在上文所描述的实例中,参考强度值是峰606的顶点608处的预期最大强度值i
max
。然而,可以使用任何其它归一化方案,并且参考强度值可以是任何其它合适的参考值,例如选定m/z的已知运行平均强度值、多个不同m/z的整体最大强度值、选定m/z的最近最大强度值等。
82.在刚刚描述的实例中,选定检测点602-1的相对位置是选定检测点602-1的归一化强度值。然而,如上文所提及,在其它实例中,选定检测点602-1的相对位置可以是选定检测点602-1到参考点的时间距离。
83.在一些实例中,如图6和7所示,参考点可能在预期时间t
max
出现,在所述t
max
预期峰606的强度值在顶点608处达到最大强度值i
max
。系统400可以按任何合适方式估计选定检测点602-1到参考点的时间距离(例如,t
max
与tc之间的差)。在一些实例中,以类似于估计选定检测点602-1的归一化强度值的方式估计时间距离。例如,将检测点602的集合612和/或所估计的归一化强度值作为输入应用到估计模型518,所述估计模型另外或替代地被配置成基于一组历史检测点估计预期时间t
max
。如图6所示,系统400可以基于集合612将选定检测点602-1的时间距离估计为0.05分钟(例如,3秒)。如图7所示,系统400可以基于集合612将选定检测点602-1的时间距离估计为0.02分钟(例如,1.2秒)。
84.在另外的其它实例中,选定检测点602-1的相对位置是预期洗脱曲线的区域,所述选定检测点602-1位于所述区域中。图8示出将图7所示的xic 600的洗脱曲线划分为不同区域802(例如,区域802-1到802-3)的示意性划分。尽管图8示出三个不同的区域802,但可以使用任何其它合适数目的区域。
85.如图8所示,基于归一化强度值和相对于洗脱曲线中的参考强度点(例如,顶点608)划分区域802。例如,第一区域802-1(“基线区域”)位于第一阈值归一化强度值804-1(例如,0.1)之下。第二区域802-2(“变化区域”)位于第一阈值归一化强度值804-1与第二阈值归一化强度值804-2(例如,0.8)之间。第三区域802-3(“顶点区域”)位于第二阈值归一化强度值804-2之上。图8所示的区域802的配置仅是示意性的,因为可以使用任何其它配置。例如,可以基于归一化强度值的变化方向进一步限定区域802。例如,顶点608的左侧上的区域802-2的一部分(或在预期时间t
max
之前)可以是“上升区域”,并且顶点608的右侧上的区域802-2的一部分(或在预期时间t
max
之后)可以是“下降区域”。
86.在额外或替代实例中,洗脱曲线可以基于时间并且相对于洗脱曲线中的参考点(例如,预期时间t
max
)而划分成区域。图9示出将图7所示的xic 600的洗脱曲线划分为不同区域902(例如,区域902-1到902-5)的示意性划分。尽管图9示出五个不同的区域902,但可以使用任何其它合适数目的区域。如图所示,在预期时间t
max
(例如,0.6分钟)之前,第一区域902-1(“基线区域”)位于第一阈值时间距离904-1之前。在预期时间t
max
(例如,0.2分钟)之前,第二区域902-2(“上升区域”)位于第一阈值时间距离904-1与第二阈值时间距离904-2之间。在预期时间t
max
(例如,0.2分钟)之后,第三区域902-3(“顶点区域”)位于第二阈值时间距离904-2与第三阈值时间距离904-3之间。通常,顶点区域涵盖顶点608。在预期时间t
max
(例如,1.4分钟)之后,第四区域902-4(“下降区域”)位于第三阈值时间距离904-3与第四阈值时间距离904-4之间。第五区域902-5(“基线区域”)位于第四阈值时间距离904-4之后。图9所示的区域902的配置仅是示意性的,因为可以使用任何其它配置。例如,可以相对于例如预期强度值达到最小值i
min
的预期时间t
min
之类的另一参考点限定任何一个或多个区域
902。
87.系统400可以估计选定检测点602-1按任何合适方式定位的区域802或902。在一些实例中,系统将集合612应用于估计模型518,所述估计模型被配置成根据选定检测点602-1所位于的区域对所述选定检测点进行分类。在图8的实例中,系统400可以基于集合612和估计模型518估计选定检测点602-1位于区域802-2内。在图9的实例中,系统400可以基于集合612和估计模型518估计选定检测点602-1位于区域902-2内。
88.再次参考图5,在操作520中,基于选定检测点(例如,选定检测点602-1)的所估计的相对位置执行数据相关动作。操作520可以按任何合适的方式执行。
89.在一些实例中,数据相关动作包括执行相关获取。例如,质谱仪104可以执行相关获取(例如,串联质谱法,例如ms/ms扫描)。相关获取可以按任何合适方式基于所估计的相对位置。
90.在一些实例中,系统400可以将所估计的归一化强度值与阈值进行比较。阈值可以是任何合适的值,例如在约0.5与约1.0之间的值、在约0.8与约1.0之间的值和/或任何其它合适的值。质谱仪104可以响应于确定选定m/z的所估计的归一化强度值超出阈值而执行相关获取。
91.现在将参考图6和7对基于所估计的归一化强度值触发相关获取进行解释。如果将阈值设置为0.6,则图6中的当前检测点602-1具有0.15的归一化强度值并且因此不会触发执行相关获取。在图7中,当前检测点602-1的归一化强度值现在为0.65并且因此触发相关获取。
92.可以基于一个或多个所估计的归一化强度值使用各种替代触发方案。例如,可以通过确定由系统400估计的连续归一化强度值遵循特定顺序而触发相关获取。例如,特定顺序可以包含小于的归一化强度值、接着为接近1的归一化强度值(例如,在1的预定容差内,例如高于0.8),接着再次为小于1的归一化强度值。另一替代触发方案可以基于选定m/z的所估计的归一化强度值的变化率。例如,当所估计的归一化强度值的变化率(例如,当所估计的归一化强度值标绘为随时间而变化时的曲线的斜率)低于阈值时,可以触发相关获取。
93.触发相关获取还可以基于所估计的时间距离。例如,系统400可以将选定检测点的所估计的时间距离与阈值进行比较。阈值可以是任何合适的值,例如在约0.1分钟与约1分钟之间的值、在约0.1分钟与约0.5分钟之间的值和/或任何其它合适的值。质谱仪104可以响应于确定选定检测点的所估计的时间距离小于阈值而执行相关获取。
94.触发相关获取还可以基于选定检测点所位于的估计区域。例如,质谱仪104可以响应于确定选定检测点位于上升区域、顶点区域和/或下降区域内而执行相关获取。
95.通过上文所描述的触发方案,当从所关注的组分产生的离子的强度处于或接近组分的洗脱曲线的顶点时执行相关获取。因此,可以针对相关获取设置相对较短的离子累积时间,并且可以获取更多数目的相关获取。也就是说,对包含在样品中的组分的检测极限得到了改进,因为积累用于分析的离子可能花费的时间量最大,上限受到洗脱峰的宽度和离子存储装置的容量的限制。如果当离子的通量较高时获取ms/ms质谱,则将在较短时间量内获取具有较高信噪比的较高质量的质谱。
96.在其它实例中,数据相关动作包括针对选定m/z安排相关获取的未来执行。例如,系统400可以在所估计的预期时间t
max
或在任何其它合适的时间安排待执行的相关获取。以
此方式,当检测到的离子的强度值处于或接近最大强度值时,可以安排并且随后执行相关获取。
97.在一些实例中,安排动作可以基于相对位置准则。例如,系统400可以响应于确定所估计的归一化强度值小于阈值、所估计的时间距离大于阈值时间值和/或选定检测点并不位于特定区域中而安排相关获取的未来执行。系统400还可以确定响应于所估计的归一化强度值超出阈值、所估计的时间距离小于阈值时间值和/或选定检测点位于特定区域中而启动即时相关获取。在一些实例中,系统400可以响应于确定所估计的归一化强度值超出最小阈值(例如,0.3)但小于最大阈值(例如,0.7)而安排相关获取的未来执行。类似地,系统400可以响应于确定所估计的时间距离小于最大阈值(例如,0.5分钟)但大于最小阈值(例如,0.2分钟)而安排相关获取的未来执行。类似地,系统400可以响应于确定选定检测点位于上升区域中但不位于基线区域或顶点区域中而安排相关获取的未来执行。
98.在一些分析中,包含在样品108中的多个不同组分可以在基本上同时从液相色谱仪102共洗脱。因此,可以针对多个不同的选定m/z执行操作512、516和520。
99.图10示出使用lc-ms系统100和系统400执行串联质谱法以有效地分析多个所关注的组分(对应于多个不同的m/z)的示意性方法。尽管图10示出根据一个实施例的示意性操作,但其它实施例可以省略、添加、重新排序和/或修改图10所示的操作中的任何操作。图10类似于图5,不同之处在于图10中的操作512、516和520被操作1002、1004和1006替换。因此,将仅描述操作1002、1004和1006。
100.在操作1002中,系统400从第一数据集508提取多个第二数据集514。每个第二数据集514对应于不同的选定m/z并且包含表示由质谱仪104检测到的随相应选定m/z的保留时间而变化的强度的多个检测点。
101.在操作1004中,系统400基于每个相应第二数据集514和估计模型518估计包含在每个相应第二数据集514中的选定检测点的相对位置。每个相对位置表示选定检测点到相应选定m/z的参考点的位置。因此,系统400估计多个不同的选定m/z的多个相对位置。操作1004可以按任何合适方式执行,包含本文所描述的任何方式。
102.在操作1006中,基于多个所估计的相对位置执行数据相关动作。操作1006可以按任何合适方式执行,包含本文所描述的任何方式。
103.在一些实例中,数据相关动作包括基于多个所估计的相对位置的次序或排名对选定m/z进行排序,并且基于所述排序执行数据相关动作。例如,排序规则可以指定将按归一化强度值(例如,从高到低)和/或时间距离的次序执行多个选定m/z的相关获取。为了说明,第一选定m/z可以具有0.52的归一化强度值,第二m/z可以具有0.72的归一化强度值,并且第三m/z可以具有0.61的归一化强度值。因此,第一次执行(或安排执行)第二m/z的相关获取,第二次执行(或安排执行)第三m/z的相关获取,第三次执行(或安排执行)第一m/z的相关获取。在一些实例中,仅针对具有高于(或低于)阈值的所估计的归一化强度值的选定m/z执行(或安排执行)相关获取。
104.在一些实例中,数据相关动作包括为每个选定m/z安排未来相关获取。例如,系统400可以基于每个所估计的归一化强度值估计每个选定m/z的强度值将达到其最大强度值或将位于特定区域(例如,顶点区域)内时的预期时间。系统400可以在所估计的预期时间安排待执行的相关获取。以此方式,可以优化执行多个相关获取的次序。
105.在一些实例中,数据相关动作可以包括滤光操作。例如,系统400可以针对具有小于阈值的所估计的归一化强度值、具有超出阈值的所估计的时间距离或位于特定区域之外的选定m/z执行(或不执行)数据相关动作。为了说明,系统400可以仅针对具有小于阈值的所估计的归一化强度值、具有大于阈值时间值的所估计的时间距离或位于特定区域(例如,基线区域)中的那些选定m/z安排相关获取的未来执行。作为另一说明,可以仅针对具有超出阈值(例如,0.6)的所估计的归一化强度值、具有小于阈值时间值的所估计的时间距离或位于特定区域(例如,上升区域)中的选定m/z触发相关获取。
106.在一些实例中,可以在相关获取期间应用动态排除。因此,估计模型518可以被配置成确定用于动态排除的动态排除窗口。再次参考图6和7,还可以基于检测点602的集合612和估计模型518估计峰606的宽度和/或峰606的强度值预期达到如虚线614所指示的最小值i
min
时的预期时间t
min
。在图6和7的实例中,i
min
示出为大于零,但在一些实施例中,i
min
可被设置为零。所估计的峰宽度和/或预期时间t
min
可用于设置动态排除窗口。例如,可以将动态排除窗口从预期时间t
max
设置为预期时间t
min
,以排除在峰606的后半部分触发相关动作。
107.如所提及,在一些实例中,估计模型518包括被配置成估计选定m/z的选定检测点的相对位置的机器学习模型。现在将描述训练机器学习模型的示意性方法。图11示出用于训练可实施估计模型518的机器学习模型的方法1100。如图所示,可以将训练数据1102提供到模型训练设施1104,所述模型训练设施可以使用训练数据1102训练估计模型1106。以下实例描述训练估计模型1106,以估计选定m/z的选定检测点的归一化强度值。然而,相同原理可以应用于训练估计模型以根据参考点估计选定检测点的时间距离和/或估计选定检测点所位于的洗脱曲线区域。
108.模型训练设施1104可以执行可被配置成训练机器学习模型的任何合适的探索性步骤、过程和/或操作。在一些实例中,模型训练设施1104可以由例如系统400的存储设施402和/或处理设施404之类的硬件和/或软件组件(例如,处理器、存储器、通信接口、存储在存储器中以由处理器执行的指令等)来实施。
109.估计模型1106可以是任何合适类型的机器学习模型,例如神经网络模型(例如,卷积神经网络(cnn))、增强的决策树(boosted decision tree)回归模型、决策森林(decision forest)回归模型、快速森林分位(fast forest quantile)回归模型和有序回归模型。
110.可以从表示一个或多个选定m/z的一个或多个洗脱曲线(例如,一组lc-ms检测点)的数据中获取或提取训练数据1102。图12示出可以包含在训练数据1102中的数据集。图12示出选定m/z的示意性xic 1200,所述xic可以由从组合的分离质谱系统(例如,lc-ms系统120)获取的数据生成或表示所述数据。将认识到,可以在没有生成xic 1200的情况下基于xic 1200源数据训练估计模型1106。如图所示,xic 1200标绘多个检测点1202,每个检测点表示选定m/z的检测到的强度值,如在全谱获取和保留时间(分钟)期间由质谱仪检测到的。每个连续获取将新的检测点1202添加到xic 1200。检测点1202一起形成与选定m/z相关的组分的洗脱曲线1204。洗脱曲线1204包含具有顶点1208的峰1206,在所述顶点处检测到的强度处于最大强度值i
max
,如虚线1210所指示。
111.估计模型1106的训练基于选定检测点1202的归一化强度值(或时间距离或指定区
域)(例如,选定检测点1202的检测到的强度值与例如i
max
之类的已知参考强度值之比)随来自同一实验的一个或多个历史检测点1202的检测到的强度水平而变化的原理。因此,应用于模型训练设施1104的训练数据1102包括用于选定m/z的一系列输入向量,每个输入向量具有检测点1202的不同集合的检测到的强度值。每个输入向量可以包括可服务于特定实施方案的检测点1202的任何不同集合。例如,第一输入向量可以包括检测点1202的第一集合1212-1的检测到的强度值,第二输入向量可以包括检测点1202的第二集合1212-2的强度值,第三输入向量可以包括检测点1202的第三集合1212-3的强度值等。
112.在图12的实例中,每个输入向量包含十个检测点1202的强度值。然而,每个输入向量可以包含任何其它合适数目(例如,6个、12个、24个等)的检测点1202的强度值。替代地,每个输入向量可以包含所有检测点1202的强度值,所述所有检测点包含在一个或多个先前输入向量中。
113.在一些实例中,检测点1202可以不沿着时间轴均匀地间隔开。为了简化估计模型1106的训练,可以将检测点1202校正(例如,通过内插)到固定且均匀的时间间隔(例如,1秒)。
114.可以将选定m/z的任何数目的输入向量应用于模型训练设施1104。在一些实例中,选择输入向量的数目以便至少涵盖峰1206的全半宽度。在图12的实例中,具有十个检测点的强度值的五个输入向量各自将至少涵盖峰1206的全半宽度。替代地,可以选择输入向量的数目以便涵盖峰1206的全宽度。涵盖峰1206的全宽度的输入向量可用于训练估计模型1106以估计预期峰的强度值达到最小值时的预期时间t
min
,所述预期时间可用于设置动态排除窗口。
115.为每个输入向量选择特定检测点1202作为选定检测点。可以选择包含在每个相应输入向量内的任何检测点1202。在以下实例中,用于每个输入向量的选定检测点1202是包含在相应输入向量中的最右边(最近)的检测点1202。例如,第一输入向量包含检测点1202-1作为选定检测点,第二输入向量包含检测点1202-2作为选定检测点,并且第三输入向量包含检测点1202-3作为选定检测点。在替代性实例中,选定检测点1202不是最右边的检测点,但可以是任何其它合适的检测点(例如,检测点1202-1是由集合1212-2限定的第二输入向量的选定检测点,检测点1202-2是由集合1212-3限定的第三输入向量的选定检测点等)。
116.训练数据1102还包含来自估计模型1106的已知期望输出值。已知期望输出值包括用于每个输入向量的每个选定检测点1202的归一化强度值(或用于每个输入向量的每个选定检测点1202的时间距离值或每个选定检测点1202所位于的洗脱曲线1204的区域)。归一化强度值是已知的,因为参考强度值(例如,i
max
)是已知的。已知输出值可用于估计模型1106的监督训练。
117.为了简化估计模型1106的训练,可以在一些实例中基于已知的参考强度值校正检测点1202。也就是说,可以基于已知的参考值对每个检测点1202的检测到的强度值进行归一化。
118.在上文所描述的实例中,参考强度值是峰1206的顶点1208处的预期最大强度值i
max
。然而,可以使用任何其它归一化方案,并且参考强度值可以是任何其它合适的参考值,例如选定m/z的已知运行平均强度值、多个不同m/z的整体最大强度值、选定m/z的最近最大强度值等。
119.在一些实例中,训练数据1102可以拆分成两个数据集合,使得训练数据的第一集合可用于训练估计模型1106,并且训练数据的第二集合可用于对估计模型1106进行评分。例如,训练数据1102可以拆分成使得输入向量的第一百分比(例如,75%)可以用作训练估计模型1106的训练集合,并且输入向量的第二百分比(例如,25%)可以用作评分集合以生成估计模型1106的准确性评分。
120.在训练阶段期间,模型训练设施1104可以基于训练数据1102运行一个或多个会话以训练估计模型1106,以估计选定检测点1202的归一化强度值。模型训练设施1104还可以基于训练数据1102运行一个或多个会话以训练估计模型1106,以估计选定检测点到参考时间的时间距离,例如预期洗脱曲线的强度值达到最大强度值(例如,洗脱曲线的顶点)时的预期时间t
max
和/或预期洗脱曲线的强度值达到最小强度值时的预期时间t
min
。模型训练设施1104还可以基于训练数据1102运行一个或多个会话以训练估计模型1106,以估计选定检测点所位于的区域。模型训练设施1104可以使用任何合适的机器学习技术或算法来执行操作以促进通过机器学习模型学习如何使机器学习模型适合于训练数据1102的第一集合内检测到的强度值。
121.通过模型训练设施1104完成训练阶段可以产生经过训练的估计模型1106,所述经过训练的估计模型被配置成估计选定检测点的相对位置。经过训练的估计模型1106可以存储在例如存储设施402之类的数据存储区中,并且可以在运行时间期间由包含处理设施404的任何合适的计算组件执行。
122.如所提及,训练数据1102可以包含多个不同的选定m/z的数据。如果多个不同的选定m/z的和/或在不同色谱条件下的数据是从测量获取中获取的,所述测量获取具有足够短的时段来描述色谱峰(奈奎斯特(nyquist)极限),则经过训练的估计模型1106可适用于可使用不同色谱条件并且具有不同的峰宽度的实验数据集。高斯曲线的奈奎斯特极限是六个点。因此,如果训练数据1102包含跨越色谱峰的六个检测点,则对取样点之间的固定时间间隔的内插可以是稳固的。
123.在替代性实例中,可以基于被配置成用于例如特定m/z、特定色谱条件、特定样品类型等的特定应用的训练数据1102训练估计模型1106。在此类实例中,可以在获取初始启动实验的数据之后训练估计模型1106,并且估计模型1106可在其后仅针对所述特定实验的后续迭代使用。
124.在一些实例中,例如在发现所估计的归一化强度值或所估计的时间距离与实际值(其可随后在实验进行时被检测到)显著偏离(例如,偏离预定量)的情况下,可以实时地(例如,在实验期间)优化或进一步训练估计模型1106。
125.在不脱离本文所描述的概念的范围和原理的情况下,可以对本文所描述的系统和方法作出各种修改。例如,在上文所描述的实例中,对估计模型的训练和对选定检测点的相对位置的估计基于选定m/z的多个检测点(例如,xic)。在一些修改中,对估计模型的训练和对选定检测点的相对位置的估计可以基于多个m/z值或所有m/z值的信号(例如,总离子流(tic)色谱图)。
126.在额外修改中,分离装置(例如,液相色谱仪、气相色谱仪、毛细管电泳装置等)和/或质谱仪(例如,质谱仪124)可以包含或可以与离子迁移率分析器耦合,并且由离子迁移率分析器获取的数据可用于训练估计模型并且以与上文所描述的用于质谱仪获取的数据的
方法类似的方式估计选定检测点的相对位置。例如,使用离子迁移率分析器和质量分析器获取的数据的第一集合可以包含一系列质谱,所述一系列质谱包含随离子的m/z和/或离子迁移率(例如,离子的碰撞截面(ccs))而变化的由样品组件产生的离子强度值。可以从数据的第一集合提取数据的第二集合。所提取的数据的第二集合可以包含表示由质量分析器检测到的随选定m/z的时间和/或选定ccs或ccs的范围而变化的强度的多个检测点。数据的第二集合可以按本文所描述的任何方式使用,以便训练估计模型并且在dda过程期间估计选定ccs或ccs的范围的选定检测点的相对位置。
127.在某些实施例中,本文所描述的系统、组件和/或过程中的一个或多个可以由一个或多个适当配置的计算装置来实施和/或执行。为此,上述系统和/或组件中的一个或多个可以包含在至少一个被配置成执行本文所描述的过程中的一个或多个过程的非暂时性计算机可读介质上体现的任何计算机硬件和/或计算机实施指令(例如,软件)或由其实施。具体地说,系统组件可以在一个物理计算装置上实施,或者可以在多于一个物理计算装置上实施。因此,系统组件可以包含任何数量的计算装置,并且可以采用任何数量的计算机操作系统。
128.在某些实施例中,本文所描述的过程中的一个或多个过程可以至少部分地实施为体现在非暂时性计算机可读介质中并且可由一个或多个计算装置执行的指令。通常,处理器(例如,微处理器)从非暂时性计算机可读介质(例如,存储器等)接收指令,并且执行那些指令,从而执行包含本文所描述的过程中的一个或多个过程的一个或多个过程。可以使用各种已知的计算机可读介质中的任一种计算机可读介质来存储和/或传输此类指令。
129.计算机可读介质(也称为处理器可读介质)包含参与提供可以由计算机(例如,由计算机的处理器)读取的数据(例如,指令)的任何非暂时性介质。这种介质可以采取许多形式,包含但不限于非易失性介质和/或易失性介质。非易失性介质可以包含例如光盘或磁盘以及其它永久存储器。易失性介质可以包含例如通常构成主存储器的动态随机存取存储器(“dram”)。计算机可读介质的常见形式包含,例如磁盘、硬盘、磁带、任何其它磁介质、光盘只读存储器(“cd-rom”)、数字视频盘(“dvd”)、任何其它光学介质、随机存取存储器(“ram”)、可编程只读存储器(“prom”)、电可擦可编程只读存储器(“eprom”)、flash-eeprom、任何其它存储器芯片或盒式磁盘或计算机可以读取的任何其它有形介质。
130.图13示出示意性计算装置1300,所述计算装置可以被具体配置成执行本文所描述的过程中的一个或多个过程。如图13所示,计算装置1300可以包含通过通信基础设施1310彼此通信地连接的通信接口1302、处理器1304、存储装置1306和输入/输出(“i/o”)模块1308。尽管图13中示出了示意性计算装置1300,但是图13中示出的组件并不旨在是限制性的。在其它实施例中可以使用另外的或替代性组件。现在将另外详细地描述图13中所示的计算装置1300的组件。
131.通信接口1302可以被配置成与一个或多个计算装置通信。通信接口1302的实例包含但不限于有线网络接口(如网络接口卡)、无线网络接口(如无线网络接口卡)、调制解调器、音频/视频连接以及任何其它合适的接口。
132.处理器1304通常表示能够处理数据和/或解释、执行和/或引导本文所描述的指令、过程和/或操作中的一个或多个的执行的任何类型或形式的处理单元。处理器1304可以通过执行存储在存储装置1306中的计算机可执行指令1312(例如,应用、软件、代码和/或其
它可执行数据实例)来执行操作。
133.存储装置1306可以包含一个或多个数据存储介质、装置或配置,并且可以采用任何类型、形式和组合的数据存储介质和/或装置。例如,存储装置1306可以包含但不限于本文所描述的非易失性介质和/或易失性介质的任何组合。包含本文所描述的数据的电子数据可以临时和/或永久地存储在存储装置1306中。例如,表示被配置成引导处理器1304执行本文所描述的操作中的任何操作的计算机可执行指令1312的数据可以存储在存储装置1306内。在一些实例中,数据可以布置在驻留于存储装置1306内的一个或多个数据库中。
134.i/o模块1308可以包含被配置成接收用户输入并且提供用户输出的一个或多个i/o模块。可以使用一个或多个i/o模块来接收针对单个虚拟体验的输入。i/o模块1308可以包含支持输入和输出能力的任何硬件、固件、软件或其组合。例如,i/o模块1308可以包含用于捕获用户输入的硬件和/或软件,包含但不限于键盘或小键盘、触摸屏组件(例如,触摸屏显示器)、接收器(例如,rf或红外接收器)、运动传感器和/或一个或多个输入按钮。
135.i/o模块1308可以包含用于向用户呈现输出的一个或多个装置,包含但不限于图形引擎、显示器(例如,显示屏)、一个或多个输出驱动器(例如,显示驱动器)、一个或多个音频扬声器以及一个或多个音频驱动器。在某些实施例中,i/o模块1308被配置成向显示器提供图形数据以呈现给用户。图形数据可以表示如可以服务于特定实施方案的一个或多个图形用户界面和/或任何其它图形内容。
136.在一些实例中,本文所描述的系统、计算装置和/或其它组件中的任何系统、计算装置和/或其它组件可以由计算装置1300实施。例如,存储设施202可以由存储装置1306实施,并且处理设施204可以由处理器1304实施。
137.本领域普通技术人员将认识到,尽管在前面的描述中,已经参考附图描述了各种示意性实施例。然而,将显而易见的是,在不脱离如在所附权利要求中所阐述的本发明的范围的情况下,可以对其做出各种修改和改变,并且可以实施另外的实施例。例如,本文所描述的一个实施例的某些特征可以与本文所描述的另一个实施例的特征组合或对其进行取代。因此,描述和附图应被视为说明性的而非限制性的。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1