干扰检测及所关注峰值解卷积的制作方法

文档序号:11287403阅读:419来源:国知局
干扰检测及所关注峰值解卷积的制造方法与工艺

相关申请案的交叉参考

本申请案主张2015年2月5日提出申请的序列号为62/112,213的美国临时专利申请案的权益,所述临时专利申请案的内容以全文引用的方式并入本文中。



背景技术:

导论

从化合物的线性组合(也称作混合物)的集合提取纯化合物受到关注。对存在于混合物中的化合物的量化及识别是核磁共振(nmr)、红外(ir)、紫外(uv)、电子顺磁共振(epr)与拉曼光谱学、质谱法等中的传统问题。对混合物的光谱的识别在大多数情形中是通过将混合物的光谱与参考化合物的库进行匹配而进行。此方法在很大程度上是低效的,其准确度强烈地取决于纯分量光谱的库的内容。另外,针对从天然源中分离或在蛋白质组学及代谢组学相关的研究中获得的若干种化合物,尚不存在可用的纯分量的库。

与先前基于库的方法相比,在过去的十年已重复地论证,可能采用仅使用混合物的光谱的测量的方法(称为盲源分离(bss)、盲提取或盲解卷积)来将混合物的光谱分离成纯分量光谱。此领域中的两种方法是独立分量分析(ica)及非负矩阵因式分解(nmf)。ica属于用于解决盲线性求反问题的统计方法的群组。构建ica算法所基于的假设包含假设未知纯分量在统计上是独立的且是非高斯的,及假设线性独立混合物的数目大于或等于纯分量的数目。nmf属于用于解决线性求反问题的代数方法的群组。其也要求线性独立混合物的数目大于或等于纯分量的数目,并且纯分量是非负的且稀疏的。在大多数光谱应用中,非负要求及稀疏要求不能被同时满足。

举例来说,第8,165,373号美国专利的背景技术章节描述盲解卷积算法的技术领域的当前技术水平。按惯例,这些盲解卷积算法旨在解决在光谱及质谱的许多领域中发生的识别来自混合物的化合物并对其进行定量的一般问题。光谱及质谱的一些领域包含可受益于较狭义定制的算法的较狭义定义的问题。

较狭义定义的问题的一个非限制性实例在多反应监测(mrm)质谱中发生。mrm是串联质谱方法。定性及定量信息两者均可从串联质谱仪获得。在此仪器中,在质量过滤器中选择前体离子、进行碎裂且在质量分析器中分析产物离子。选择前体离子、将其碎裂及通过质量与电荷比(m/z)分析所得产物离子的整个过程称为质谱/质谱(ms/ms)或ms/ms扫描。从ms/ms产生的产物离子光谱可用于识别样本中的化合物(前体离子),且一或多个产物离子的强度可用于对存在于样本中的化合物的量进行定量。

信息相依分析(ida)是一种其中在将样本引入到串联质谱仪中时用户可规定用于执行ms/ms的准则的灵活串联质谱方法。举例来说,在ida方法中,执行前体离子或质谱(ms)调查扫描以产生前体离子峰值列表。用户可选择在峰值列表上筛选前体离子的子组的峰值列表的准则。接着,对前体离子的子组中的每一前体离子执行ms/ms。产生每一前体的产物离子光谱。对引入到串联质谱仪中的样本的前体离子的子组中的前体离子重复地执行ms/ms。举例来说,样本是通过注射或色谱运行而引入。

一般来说,在ida方法期间执行两种类型的ms/ms。在第一类型中,选择单个前体离子并进行碎裂,且对产物离子的整个质量范围进行质量分析。此类型的ms/ms扫描称为全扫描ms/ms或全产物离子ms/ms扫描。全扫描ms/ms通常用于定性分析。换句话说,全扫描ms/ms通常用于从产物离子的图案识别前体离子。

在第二类型的ms/ms中,选择单个前体离子并进行碎裂,接着从所得产物离子选择一或多个产物离子,且仅对选定产物离子进行质量分析。此类型的ms/ms称为多反应监测(mrm)或选定反应监测(srm)或者称为mrm或srm扫描或跃迁。mrm通常用于定量分析。换句话说,mrm通常用于从一或多个产物离子的强度量化样本中的前体离子的量。

在涉及样本混合物的mrm实验(或其等效形式)的情形中,与在一般光谱或质谱情形中相比,沿着时间维度存在较少m/z值来解卷积。并且,可依据从mrm实验产生的所提取离子色谱图(xic)获得额外信息。特定来说,已知若干个xic可与单个保持时间、形状及/或离子分布函数相关。换句话说,对应于所关注化合物的若干个产物离子的xic应全部具有相同保持时间、形状及/或离子分布函数。

除ida之外,还可使用串联质谱仪来执行其它类型的实验方法或工作流。另一类型的实验方法或工作流称作数据独立采集(dia)。

举例来说,在蛋白质组及许多其它样本类型中,化合物的复杂性及动态范围非常大。这对传统ida工作流提出挑战,要求非常高速度的ms/ms采集以深度地探寻样本以便识别并量化分析物的宽广范围。因此,已使用dia工作流来增加数据收集的再现性及综合性。

在传统dia工作流中,基于在前一扫描中采集的数据,串联质谱仪的动作在各扫描间无变化。替代地,选择前体离子质量范围。接着,对所述质量范围中的所有前体离子进行碎裂,且对所有前体离子的所有产物离子进行质量分析。此前体离子质量范围可非常狭窄,其中多个前体在窗内的可能性较小。或者,此窗可较大,且多个前体在此窗内的可能性较高。

dia的其它名称可包含但不限于ms/msall或非特定碎裂方法。swathtm采集也是一种类型的dia工作流。在swathtm采集中,前体离子质量隔离窗跨过整个质量范围。对每一质量隔离窗中的所有前体离子进行碎裂,且对每一质量隔离窗中的所有前体离子的所有产物离子进行质量分析。

然而,dia工作流并非不具有限制。举例来说,在常规swathtm采集中,难以将在同一前体质量隔离窗中发生的共洗脱产物离子解卷积。dia工作流的非特定性质不提供帮助解卷积的足够前体离子信息。

理论上,如上文所提及的那些的一般盲解卷积算法可用于mrm或mrm类实验,其中仅几个m/z值是可用的。然而,这些盲解卷积算法中的任一者是否具体用于进行定量是未知的。通常,使用这些算法来识别所关注化合物的正确保持时间。然而,每一xic通常被视为单独独立信号,且在针对每一信号使用峰值寻找-解卷积算法的情况下,峰值通过拟合或“各种掠过”算法被分段或解卷积且报告经分段或经拟合面积。

另外,一些质谱定量软件具有以叠加模式使相关xic可视化的能力。然而,此主要用于帮助用户检视结果及识别干扰。此软件中的一些使用一些现有知识(如跃迁面积的预期比率)来自动地标记离群峰值。举例来说,离群峰值是已对干扰求积分的峰值或未完成的峰值。换句话说,相关xic通常用于定性分析-在正确位置找到正确峰值。相关xic通常未用于准确地对峰值求积分。

在标题为“多迹线定量(multi-tracequantitation)”的第61/985,335号美国临时申请案中,提出用于从一或多个相关峰值分布曲线计算峰值分布曲线的面积的较狭义定制的盲解卷积方法。举例来说,此方法可应用于从mrm实验获得的xic峰值分布曲线。可通过采取处于来自随时间收集的一系列质谱扫描的单个离散m/z值或m/z范围的强度值而形成所测量xic。所测量xic指示给定m/z或m/z范围随时间而变(即,随保持时间而变)的行为。接着,可使用从所测量xic导出的xic峰值分布曲线高度或峰值分布曲线面积(举例来说)来量化所关注化合物。

举例来说,通过使用峰值检测算法而从所测量xic找到xic峰值分布曲线的初始位置。使用此初始位置及所关注化合物的峰值模型,确定xic峰值分布曲线的初始形状。举例来说,所述形状可包含宽度及强度。从分布曲线形状,通过对峰值形状求积分而确定xic峰值分布曲线面积。注意,峰值形状不限于经拟合分布曲线。替代地,借助于可涉及拟合但还可以其它方式执行的解卷积而获得峰值形状。

在具有多个碎裂或产物离子的所关注化合物的情形中,可从多个产物离子的所测量xic获得额外信息。举例来说,通过计算在特定时间周期内多个产物离子中的每一者的xic峰值分布曲线而获得此额外信息。接着将这些多个相关xic峰值分布曲线进行比较。举例来说,可使用所述比较来识别xic峰值分布曲线中的一者中的错误或者优化xic峰值分布曲线的位置或面积。

然而,不幸的是,来自其它化合物的产物离子可干扰所关注化合物的多个产物离子中的一些。当此发生时,所关注化合物的多个产物离子的相关xic峰值分布曲线可受到影响。因此,这些相关xic峰值分布曲线的比较可提供包含误否定检测的不正确结果。

因此,在质谱工业中需要额外狭义定制的盲解卷积方法来计算基础相关峰值分布曲线或相关但包含来自源于不同母离子的离子的干扰的分布曲线的面积。



技术实现要素:

本发明揭示一种用于从来自强度分布的两个或多于两个强度测量计算共同分量分布曲线的系统。所述系统包含质谱仪及处理器。所述质谱仪分析一或多种化合物,从而产生所述一或多种化合物的多个强度测量。

所述处理器接收所述多个强度测量。所述处理器针对所测量维度的范围从所述多个强度测量计算多个强度迹线。所述处理器选择所述多个强度迹线的强度值。

针对跨越所测量维度的所述范围的多个测量点中的每一测量点,所述处理器将所述多个强度迹线中的每一强度迹线缩放为在所述每一测量点处具有所述强度值。所述处理器接着计算所述每一测量点的共同分量分布曲线,所述共同分量分布曲线为跨越所述多个测量点的所述多个经缩放强度迹线的一或多个参数的函数。所述处理器接着计算所述共同分量分布曲线的得分,所述得分为所述共同分量分布曲线的一或多个参数及所述多个经缩放强度迹线的一或多个参数的函数。

所述处理器基于所述多个所计算共同分量分布曲线的所述得分而从所述多个所计算共同分量分布曲线选择最优共同分量分布曲线。

本发明揭示一种用于从来自强度分布的两个或多于两个强度测量计算共同分量分布曲线的方法。使用处理器从质谱仪接收多个强度测量。所述多个强度测量是由所述质谱仪通过分析来自混合物的一或多种化合物而产生。使用所述处理器针对所测量维度的范围从所述多个强度测量计算多个强度迹线。使用所述处理器选择所述多个强度迹线的强度值。

针对跨越所测量维度的所述范围的多个测量点中的每一测量点,将所述多个强度迹线中的每一强度迹线缩放为在所述每一测量点处具有所述强度值。计算所述每一测量点的共同分量分布曲线,所述共同分量分布曲线为跨越所述多个测量点的所述多个经缩放强度迹线的一或多个参数的函数。使用所述处理器计算所述共同分量分布曲线的得分,所述得分为所述共同分量分布曲线的一或多个参数及所述多个经缩放强度迹线的一或多个参数的函数。

使用所述处理器基于所述多个所计算共同分量分布曲线的所述得分而从所述多个所计算共同分量分布曲线选择最优共同分量分布曲线。

本发明揭示一种计算机程序产品,其包含非暂时性且有形计算机可读存储媒体,所述非暂时性且有形计算机可读存储媒体的内容包含具有在处理器上执行以便执行用于从来自强度分布的两个或多于两个强度测量计算共同分量分布曲线的方法的指令的程序。所述方法包含:提供一系统,其中所述系统包括一或多个相异软件模块,且其中所述相异软件模块包括测量模块及分析模块。

所述测量模块从质谱仪接收多个强度测量。所述多个强度测量是由所述质谱仪通过分析来自混合物的一或多种化合物而产生。

所述分析模块针对所测量维度的范围从所述多个强度测量计算多个强度迹线。所述分析模块选择所述多个强度迹线的强度值。

针对跨越所测量维度的所述范围的多个测量点中的每一测量点,所述分析模块将所述多个强度迹线中的每一强度迹线缩放为在所述每一测量点处具有所述强度值。所述分析模块计算所述每一测量点的共同分量分布曲线,所述共同分量分布曲线为跨越所述多个测量点的所述多个经缩放强度迹线的一或多个参数的函数。所述分析模块计算所述共同分量分布曲线的得分,所述得分为所述共同分量分布曲线的一或多个参数及所述多个经缩放强度迹线的一或多个参数的函数。

所述分析模块基于所述多个所计算共同分量分布曲线的所述得分而从所述多个所计算共同分量分布曲线选择最优共同分量分布曲线。

在本文中陈述申请人的教示的这些特征及其它特征。

附图说明

所属领域的技术人员将理解,下文所描述的图式仅用于图解说明目的。所述图式并非打算以任何方式限制本发明教示的范围。

图1是图解说明可在其上实施本发明教示的实施例的计算机系统的框图。

图2是展示根据各种实施例的在同一时间周期内所关注化合物的两种产物离子的经测量所提取离子色谱图(xic)的示范性曲线图。

图3是展示根据各种实施例的针对在第一时间处图2的所测量xic计算的共同分量分布曲线的示范性曲线图。

图4是展示根据各种实施例的针对在第二时间处图2的所测量xic计算的共同分量分布曲线的示范性曲线图。

图5是展示根据各种实施例的针对在第三时间处图2的所测量xic计算的共同分量分布曲线的示范性曲线图。

图6是展示根据各种实施例的针对第一所测量xic从针对在第三时间处图2的所测量xic计算的共同分量分布曲线计算的残余面积的示范性曲线图。

图7是展示根据各种实施例的针对第二所测量xic从针对在第三时间处图2的所测量xic计算的共同分量分布曲线的计算的残余面积的示范性曲线图。

图8是展示根据各种实施例的从叠加于图4的曲线图上的方程式(1)计算的评分函数的示范性曲线图。

图9是展示根据各种实施例的依据从经缩放所测量xic减去共同分量分布曲线而找到的干扰峰值的示范性曲线图。

图10是展示根据各种实施例的针对图2的所测量xic经缩放为产物离子峰值的共同分量分布曲线的示范性曲线图。

图11是展示根据各种实施例的用于从来自强度分布的两个或多于两个强度测量计算共同分量分布曲线的系统的示意图。

图12是展示根据各种实施例的用于从来自强度分布的两个或多于两个强度测量计算共同分量分布曲线的方法的流程图。

图13是根据各种实施例的包含执行用于从来自强度分布的两个或多于两个强度测量计算共同分量分布曲线的方法的一或多个相异软件模块的系统的示意图。

在详细描述本发明教示的一或多个实施例之前,所属领域的技术人员将了解,本发明教示在其应用方面并不限于以下详细描述中所陈述或图式中所图解说明的构造细节、组件布置及步骤安排。并且,应理解,本文中所使用的措辞及术语用于描述目的且不应视为具有限制性。

具体实施方式

计算机实施的系统

图1是图解说明可在其上实施本发明教示的实施例的计算机系统100的框图。计算机系统100包含用于传达信息的总线102或其它通信机构,及与总线102耦合以用于处理信息的处理器104。计算机系统100还包含存储器106,其可为耦合到总线102以用于存储待由处理器104执行的指令的随机存取存储器(ram)或其它动态存储装置。存储器106还可用于在待由处理器104执行的指令的执行期间存储暂时变量或其它中间信息。计算机系统100进一步包含耦合到总线102以用于存储用于处理器104的静态信息及指令的只读存储器(rom)108或其它静态存储装置。提供例如磁盘或光盘等存储装置110且存储装置110耦合到总线102以用于存储信息及指令。

计算机系统100可经由总线102耦合到用于向计算机用户显示信息的显示器112,例如阴极射线管(crt)或液晶显示器(lcd)。包含字母数字键及其它键的输入装置114耦合到总线102以用于将信息及命令选择传达到处理器104。另一类型的用户输入装置为用于将方向信息及命令选择传达到处理器104且用于控制显示器112上的光标移动的光标控制件116,例如鼠标、轨迹球或光标方向键。此输入装置通常具有在两个轴(第一轴(即,x)及第二轴(即,y))上的两个自由度,这允许所述装置规定在一平面中的位置。

计算机系统100可执行本发明教示。依照本发明教示的某些实施方案,由计算机系统100响应于处理器104执行存储器106中所含有的一或多个指令的一或多个序列而提供结果。可将此类指令从例如存储装置110的另一计算机可读媒体读取到存储器106中。存储器106中所含有的指令序列的执行致使处理器104执行本文中所描述的过程。或者,硬连线电路可取代软件指令或与软件指令组合使用以实施本发明教示。因此,本发明教示的实施方案并不限于硬件电路与软件的任何特定组合。

如本文中所使用的术语“计算机可读媒体”是指参与将指令提供到处理器104以供执行的任何媒体。此媒体可采取许多形式,包含但不限于非易失性媒体、易失性媒体及传输媒体。举例来说,非易失性媒体包含光盘或磁盘,例如存储装置110。易失性媒体包含动态存储器,例如存储器106。传输媒体包含同轴电缆、铜线及光纤,包含包括总线102的导线。

举例来说,常见形式的计算机可读媒体包含软盘、柔性磁盘、硬盘、磁带或任何其它磁性媒体、cd-rom、数字视频光盘(dvd)、蓝光光盘、任何其它光学媒体、拇指驱动器、存储器卡、ram、prom及eprom、快闪eprom、任何其它存储器芯片或盒式磁盘,或者计算机可从其读取的任何其它有形媒体。

在将一或多个指令的一或多个序列载运到处理器104以供执行中可涉及各种形式的计算机可读媒体。举例来说,可最初在远程计算机的磁盘上载运所述指令。所述远程计算机可将指令加载到其动态存储器中并使用调制解调器经由电话线发送指令。在计算机系统100本地的调制解调器可接收电话线上的数据并使用红外发射器将数据转换为红外信号。耦合到总线102的红外检测器可接收在红外信号中载运的数据并将数据置于总线102上。总线102将数据载运到存储器106,处理器104从存储器106检索并执行指令。可任选地在由处理器104执行之前或之后将由存储器106接收的指令存储于存储装置110上。

根据各种实施例,经配置以由处理器执行以执行一方法的指令存储于计算机可读媒体上。所述计算机可读媒体可为存储数字信息的装置。举例来说,计算机可读媒体包含此项技术中已知的用于存储软件的光盘只读存储器(cd-rom)。所述计算机可读媒体由适合用于执行经配置以执行的指令的处理器存取。

已出于图解说明及描述的目的而呈现本发明教示的各种实施方案的以下描述。其并非穷尽性的且不将本发明教示限制于所揭示的精确形式。修改及变化鉴于以上教示而可能存在或可从本发明教示的实践获得。另外,所描述的实施方案包含软件,但本发明教示可实施为硬件与软件的组合或单独以硬件实施。可用面向对象的编程系统及非面向对象的编程系统两者来实施本发明教示。

共同分量分布曲线

如上文所描述,在光谱及质谱中识别及量化来自混合物的所关注化合物是困难问题。最初,通过将混合物的光谱与参考化合物的库进行匹配而解决此问题。最近,可能采用仅使用混合物的光谱的测量的方法(称为盲解卷积)将混合物的光谱分离成纯分量光谱。

光谱及质谱的一些领域包含可受益于较狭义定制的盲解卷积算法的较狭义定义的问题。在较窄程度上定义的问题的一个非限制性实例在多反应监测(mrm)质谱中发生。在mrm的情形中,与在一般光谱或质谱情形中相比,沿着时间维度存在较少m/z值来解卷积。并且,可依据从mrm实验产生的所提取离子色谱图(xic)获得额外信息。

理论上,一般盲解卷积算法可用于mrm或mrm类实验,其中仅几个m/z值是可用的。然而,这些盲解卷积算法中的任一者是否具体用于进行定量是未知的。另外,一些质谱定量软件具有以叠加模式使相关xic可视化的能力。然而,此主要用于帮助用户检视结果及识别干扰。一般来说,相关xic通常用于定性分析-在正确位置找到正确峰值。相关xic通常未用于准确地对峰值求积分。

在标题为“多迹线定量(multi-tracequantitation)”的第61/985,335号美国临时申请案中,提出用于从一或多个相关峰值分布曲线计算峰值分布曲线的面积的较狭义定制的盲解卷积方法。当应用于从mrm实验获得的xic峰值分布曲线时,此方法涉及计算所关注化合物的若干个产物离子中的每一者的xic峰值分布曲线并将这些xic峰值分布曲线进行比较。举例来说,可使用所述比较来识别xic峰值分布曲线中的一者中的错误或者优化xic峰值分布曲线的位置或面积。

然而,不幸的是,来自其它化合物的产物离子可干扰所关注化合物的多个产物离子中的一些。当此发生时,所关注化合物的多个产物离子的相关xic峰值分布曲线可受到影响。因此,这些相关xic峰值分布曲线的比较可提供包含误否定检测的不正确结果。

因此,在质谱工业中需要额外狭义定制的盲解卷积方法来计算基础相关峰值分布曲线或相关但包含来自源于不同母离子的离子的干扰的分布曲线的面积。

这些狭义定制的盲解卷积也可用于定性分析。举例来说,在各种实施例中,可使用较狭义定制的盲解卷积方法来识别xic是否具有干扰。举例来说,可使用较狭义定制的盲解卷积方法来选择xic的未被干扰部分用于后续分析(如在处理来自光谱的同位素时,选择受干扰程度最低的xic提取的质量与电荷比(m/z)范围)。

在各种实施例中,可使用较狭义定制的盲解卷积方法来评估在特定时间间隔内两个或多于两个迹线或xic是否类似于共同离子分布,或找出那些迹线类似于共同离子分布的所有时间点或保持时间(rt)。举例来说,在ida方法(例如swathtm)中,一个目标是(举例来说)确定是否存在特定肽。此通过提取目标离子xic(目标离子是所关注肽的预期碎片)而完成。接着,相对于几个准则对那些xic进行分析。重要准则中的一者是那些xic分布曲线的相关性。通常,当目标xic被干扰时,其具有低相关性得分且其导致误否定检测。其它方法使用rt类似性,但可由于rt相同而xic的形状基本上不同而导致误否定检测。一些方法首先使用rt类似性且接着使用形状来筛除具有不同形状的那些,但接着在其中一些碎片具有干扰的情形中可再次发生误否定。在各种实施例中,使用较狭义定制的盲解卷积方法来测试共同离子分布的存在或不存在。

在各种实施例中,使用较狭义定制的盲解卷积方法来在不需要首先计算多个产物离子中的每一者的xic峰值分布曲线的情况下执行定量或定性分析。替代地,直接从所关注化合物的多个产物离子的所测量xic找到最优共同分量分布曲线。

一般来说,两个或多于两个产物离子xic可由至少一个相关分量(第一独立分量)及可能更多其它独立分量(干扰)组成,其中干扰的数目可大于所测量xic的数目。此问题可不具有唯一一般盲解卷积解决方案,这是因为观察值(混合物)的数目小于独立分量的数目。目标是准确地提取仅一个独立分量-所关注的独立分量。然而,不必将其它分量(干扰)解卷积。通过计算最优共同分量分布曲线,在不需要将其它独立干扰分量解卷积的情况下直接从每一事物将所关注分量解卷积。

图2是展示根据各种实施例的在同一时间周期内所关注化合物的两种产物离子的所测量xic的示范性曲线图200。在曲线图200中所展示的时间周期内,所关注化合物的第一产物离子的xic210比同一所关注化合物的第二产物离子的xic220具有更大最大强度。虽然xic210与xic220有重叠,但其并不很好地相关。换句话说,其并不呈现为具有相同形状或甚至相同顶点。此可归因于来自其它化合物的一或多个产物离子的干扰。举例来说,xic220具有在与xic210的重叠区域之外的强度值,这可归因于干扰产物离子。

如上文所描述,按惯例,针对xic210计算第一xic峰值分布曲线(未展示)且针对xic220计算第二xic峰值分布曲线(未展示)。接着,将这两个峰值分布曲线进行比较。

替代地,根据各种实施例,在曲线图200中的两个或多于两个时间点中的每一者处从xic210及xic220两者计算共同分量分布曲线。曲线图200展示三个时间点201、202及203。举例来说,可针对时间点201、202及203计算共同分量分布曲线。接着,将所计算共同分量分布曲线中的每一者评分。将得分最佳的共同分量分布曲线视为表示所关注化合物。虽然图2及后续图中仅参考两个所测量xic描述对共同分量分布曲线的计算,但计算共同分量分布曲线的方法不限于来自所关注化合物的两个产物离子的仅两个所测量xic,而是可适用于来自所关注化合物的两个或多于两个产物离子的两个或多于两个所测量xic。

共同分量分布曲线是所有所测量xic的所有峰值面积的相交点被缩放为所述点处跨越所有所测量xic的最小强度的轮廓。为了使共同分量分布曲线易于沿着时间维度进行比较且针对任何数据集合使用相同阈值,将所有跃迁缩放为将小于任何强度测量的最小可行强度值是方便的。举例来说,可使用的最小强度值是1。为了简化,假设所讨论的所测量xic具有零基线。举例来说,可使用用于基线/峰值区域检测的可靠算法作为预处理步骤移除基线。并且,可进行按最小值函数减小噪声假影或在估计共同分量时在最小值函数中包含噪声模型的一些预处理。

在各种实施例中,在每一时间点处,将所有所测量xic缩放为具有同一强度(在此实例中,1)。接着,将共同分量分布曲线计算为每一时间点的所有强度的最小值。并且,可进行按最小值函数减小噪声假影或在估计共同分量时在最小值函数中包含噪声模型的一些预处理。接着,将每一时间点的每一共同分量分布曲线评分。

图3是展示根据各种实施例的针对在第一时间201处图2的所测量xic计算的共同分量分布曲线的示范性曲线图300。在曲线图300中,所测量xic210及所测量xic220经缩放使得其在第一时间201处的强度均等于1。换句话说,所测量xic210及所测量xic220经缩放以相交且在相交点310处具有强度1。将共同分量分布曲线330作为每一时间点的所有强度的最小值进行计算。由于经缩放所测量xic210在多数时间点处大部分包含最小强度,因此共同分量分布曲线330大部分沿循经缩放所测量xic210的形状。

图4是展示根据各种实施例的针对在第二时间202处图2的所测量xic计算的共同分量分布曲线的示范性曲线图400。在曲线图400中,所测量xic210及所测量xic220经缩放使得其在第二时间202处的强度均等于1。换句话说,所测量xic210及所测量xic220经缩放以相交且在相交点410处具有强度1。将共同分量分布曲线430作为每一时间点的所有强度的最小值进行计算。再次,由于经缩放所测量xic210在多数时间点处大部分包含最小强度,因此共同分量分布曲线430也大部分沿循经缩放所测量xic210的形状。

图5是展示根据各种实施例的针对在第三时间203处图2的所测量xic计算的共同分量分布曲线的示范性曲线图500。在曲线图500中,所测量xic210及所测量xic220经缩放使得其在第三时间203处的强度均等于1。换句话说,所测量xic210及所测量xic220经缩放以相交且在相交点510处具有强度1。将共同分量分布曲线530作为每一时间点的所有强度的最小值进行计算。与图3及4相比,经缩放所测量xic220比经缩放所测量xic210在更多时间点处具有更多最小强度。因此,共同分量分布曲线530相比于沿循经缩放所测量xic210在更多时间点处沿循经缩放所测量xic220的形状。

在各种实施例中,针对每一共同分量分布曲线,从共同分量最大值的位置、共同分量的面积及所测量xic残余的面积计算得分。针对每一所测量xic,通过从所测量xic减去共同分量分布曲线而计算残余。在最大化共同分量分布曲线面积、最小化残余面积且对应于共同分量分布曲线的顶点的时间点处找到具有最佳得分的共同分量分布曲线。选择具有最佳得分的共同分量分布曲线的时间点作为真实前体离子时间(或保持时间)。

图6是展示根据各种实施例的针对第一所测量xic210从针对在第三时间203处图2的所测量xic计算的共同分量分布曲线530计算的残余面积610的示范性曲线图600。通过从经缩放第一所测量xic210减去共同分量分布曲线530而计算经缩放第一所测量xic210的残余。对所述残余求积分会产生残余面积610。

图7是展示根据各种实施例的针对第二所测量xic220从针对在第三时间203处图2的所测量xic计算的共同分量分布曲线530计算的残余面积710的示范性曲线图700。通过从经缩放所测量xic220减去共同分量分布曲线530而计算经缩放第二所测量xic220的残余。对所述残余求积分会产生残余面积710。

使用图6的残余面积610及图7的残余面积710来计算共同分量分布曲线530的得分。另外,得分计算还包含共同分量分布曲线530的面积720及共同分量分布曲线530的最大值540相对于相交点510的位置。

在各种实施例中,根据下文所展示的方程式(1)计算共同分量分布曲线530的得分:

score(x)=median(residue_area(x,t)/explained_area(x)(1)

其中

c是其处满足特定条件的时间点的子集。举例来说,一个条件是共同分量强度<=1。多数时间,所有点均满足所述条件,或者无论是否应用所述条件结果均相同。然而,通常在共同分量具有多个峰值时,存在其中所述条件是重要的情形。所述条件还在所关注离子具有经卷积同分异构体的情况下是重要的。

图8是展示根据各种实施例的从叠加于图4的曲线图上的方程式(1)计算的评分函数810的示范性曲线图800。从方程式(1)计算的评分函数810包含得分801、802及803,其对应于针对时间点201、202及203处的共同共同分布曲线计算的得分。曲线图800展示评分函数810在时间点201处具有最小值。因此,根据方程式(1),发现在时间点202处计算的共同分量分布曲线430具有最佳(最小)得分。

可使用最优共同分量分布曲线来检测干扰峰值。举例来说,可使用图4中的共同分量分布曲线430来识别图4的经缩放所测量xic220中的干扰峰值。如果从图4的经缩放所测量xic220减去共同分量分布曲线430,那么找到干扰峰值。

图9是展示根据各种实施例的依据从经缩放所测量xic减去共同分量分布曲线430而找到的干扰峰值910的示范性曲线图900。举例来说,从图4中的经缩放所测量xic220减去共同分量分布曲线430会产生图9的干扰峰值910。

另外,可从具有最低得分的共同分量分布曲线重构每一所测量xic的每一产物离子峰值。在计算具有最低得分的共同分量分布曲线时用于缩放每一所测量xic的反缩放因子反过来用于将共同分量分布曲线缩放为产物离子峰值。

图10是展示根据各种实施例的针对图2的所测量xic经缩放为产物离子峰值的共同分量分布曲线的示范性曲线图1000。在图10中再次画出所测量xic210。在图4中,找到最优共同分量分布曲线430。此最优共同分量分布曲线430是通过按缩放因子缩放图2及图10中所展示的所测量xic210而找到。如果将此缩放因子的倒数应用于图4的最优共同分量分布曲线430,那么产生产物离子峰值1030。产物离子峰值1030是所测量xic210的经重构xic,且应具有非常接近于基础产物离子的面积及高度。举例来说,经重构产物离子峰值1030可用于对基础产物离子进行定量。

与尝试找到xic峰值分布曲线之间的最佳类似性得分的常规方法相比,各种实施例在所关注区域内找到最佳共同分量分布曲线得分。因此,具有各种干扰的xic峰值分布曲线可具有不良类似性得分,但在前体离子的保持时间处具有高共同分量分布曲线得分。因此,各种实施例实现检测且接近于所关注峰值的最优提取(解卷积)。举例来说,高共同分量分布曲线得分可为评分函数的最小值。

上文关于xic峰值而描述计算共同分量分布曲线。然而,本文中所描述的方法可适用于沿着任何维度的相关信号的任何集合。另外,所述维度可并非被直接测量而是在所测量维度的某一变换之后获得。举例来说,可针对光谱峰值解卷积使用来自任何相关离子(同位素离子(m/z移位维度)、中性丢失离子、同位素标记离子等)的峰值来计算共同分量分布曲线。

用于计算共同分量分布曲线的系统

图11是展示根据各种实施例的用于从来自强度分布的两个或多于两个强度测量计算共同分量分布曲线的系统1100的示意图。系统1100包含质谱仪1120及处理器1130。在各种实施例中,系统1100还可包含样本引入装置1110。样本引入装置1110可使用各种技术中的一者来将样本提供到质谱仪1120。这些技术包含但不限于气相色谱法(gc)、液相色谱法(lc)、毛细管电泳(ce)或流动注射分析(fia)。

样本引入装置1110可执行包含但不限于液相色谱法、气相色谱法、毛细管电泳或离子迁移等分离技术。样本引入装置1110随时间从混合物分离一或多种化合物。

举例来说,质谱仪1120是串联质谱仪且可包含一或多个物理质量过滤器及一或多个物理质量分析器。质谱仪1120的质量分析器可包含但不限于飞行时间(time-of-flight,tof)质量分析器、四极质量分析器、离子陷阱质量分析器、线性离子陷阱质量分析器、轨道陷阱质量分析器或傅里叶变换质量分析器。

处理器1130可为但不限于计算机、微处理器或能够发送控制信号及数据且从质谱仪1120接收控制信号及数据并且处理数据的任何装置。举例来说,处理器1130可为图1的计算机系统100。在各种实施例中,处理器1130与质谱仪1120及样本引入装置1110进行通信。

处理器1130接收多个强度测量。处理器1130针对所测量维度的范围从所述多个强度测量计算多个强度迹线。在各种实施例中,所述多个强度迹线包含多个强度迹线,所述所测量维度包含时间周期,且已知化合物的强度是已知化合物的产物离子的强度。

处理器1130选择多个强度迹线的最小强度值。举例来说,所述强度值可为最小非零强度、与噪声振幅成比例的值或在质谱术语中单离子冲击强度。举例来说,选择此值会确保噪声不被放大。特定来说,此值与评分函数计算相关。其使得能够使用恒定评分阈值。

举例来说,处理器1130选择强度值1。针对跨越所测量维度的范围的多个测量点中的每一测量点,处理器1130执行三个步骤。第一,处理器1130将多个强度迹线中的每一强度迹线缩放为在每一测量点处具有所述强度值。第二,处理器1130计算每一测量点的共同分量分布曲线,所述共同分量分布曲线为跨越多个测量点的多个经缩放强度迹线的一或多个参数的函数。第三,处理器1130计算共同分量分布曲线的得分,所述得分为共同分量分布曲线的一或多个参数及多个经缩放强度迹线的一或多个参数的函数。

处理器1130基于多个所计算共同分量分布曲线的得分而从多个所计算共同分量分布曲线选择最优共同分量分布曲线。

在各种实施例中,处理器1130将每一测量点的共同分量分布曲线作为跨越多个测量点的多个经缩放强度迹线的最小强度的轮廓进行计算。处理器1130计算每一测量点处的共同分量分布曲线的得分,所述得分为共同分量分布曲线的最大值与每一测量点之间的距离、共同分量分布曲线的面积及从多个经缩放强度迹线减去共同分量分布曲线所得的面积的函数。处理器1130从多个所计算共同分量分布曲线选择最优共同分量分布曲线,与其它共同分量分布曲线的得分相比,所述最优共同分量分布曲线的得分最优地最小化共同分量分布曲线的最大值与每一测量点之间的距离、最大化共同分量分布曲线的面积且最小化从多个经缩放强度迹线减去共同分量分布曲线所得的面积。

在各种实施例中,根据上文所展示的方程式(1)而计算每一测量点的共同分量分布曲线的得分,其中共同分量分布曲线=common_profilex且从经缩放强度迹线减去共同分量分布曲线=residue_profilex。

在各种实施例中,处理器1130进一步将多个强度迹线中的一强度迹线缩放为在测量点处具有用于计算最优共同分量分布曲线的强度值,从而产生经最优缩放强度迹线。处理器1130接着通过从至少一个经最优缩放强度迹线减去最优共同分量分布曲线而检测经最优缩放强度迹线中的至少一个干扰峰值。减法仅是检测经最优缩放强度迹线中的至少一个干扰峰值的一种方式。举例来说,可通过按照比率、差或相对于预期“噪声”分析最优共同分量分布曲线及至少一个经最优缩放强度迹线而检测经最优缩放强度迹线中的至少一个干扰峰值。

检测所有迹线共同的干扰的另一实例是将共同分量分布曲线与预期单分量分布曲线进行比较。由于单分量分布曲线是合成信号且其保持时间(rt)未被定义,因此其可‘滑动’跨越共同分量,且可在每一滑动rt位置处计算如上文所描述的相同得分。实际上,此意味着可对所测量迹线执行多迹线分析,或可将模拟迹线添加到所测量迹线的集合以进一步细化得分函数计算。

在各种实施例中,处理器1130通过根据用于将强度迹线缩放为经最优缩放强度迹线的缩放因子的倒数来缩放最优共同分量分布曲线而重构对应于经最优缩放强度迹线的所关注化合物强度迹线。处理器1130接着使用经重构所关注化合物强度迹线(举例来说)来对产物离子进行定量。

用于计算共同分量分布曲线的方法

图12是展示根据各种实施例的用于从来自强度分布的两个或多于两个强度测量计算共同分量分布曲线的方法1200的流程图。

在方法1200的步骤1210中,使用处理器从质谱仪接收多个强度测量。所述多个强度测量是由所述质谱仪通过分析来自混合物的一或多种化合物而产生。

在步骤1220中,使用处理器针对被已知包含已知所关注化合物的强度的所测量维度的范围计算多个强度迹线。

在步骤1230中,使用处理器选择多个强度迹线的强度值。

使用处理器针对跨越所测量维度的范围的多个测量点中的每一测量点执行步骤1240、1250及1260。

在步骤1240中,将多个强度迹线中的每一强度迹线缩放为在每一测量点处具有所述强度值。

在步骤1250中,将每一测量点的共同分量分布曲线作为跨越多个测量点的多个经缩放强度迹线的一或多个参数的函数进行计算。在各种实施例中,通过计算跨越多个测量点的多个经缩放强度迹线的最小强度的轮廓而计算每一测量点的共同分量分布曲线。

在步骤1260中,使用处理器计算共同分量分布曲线的得分,所述得分为共同分量分布曲线的一或多个参数及多个经缩放强度迹线的一或多个参数的函数。在各种实施例中,计算共同分量分布曲线的得分,所述得分为共同分量分布曲线的最大值与每一测量点之间的距离、共同分量分布曲线的面积及从多个经缩放强度迹线减去共同分量分布曲线所得的面积的函数。

在步骤1270中,使用处理器基于多个所计算共同分量分布曲线的得分而从多个所计算共同分量分布曲线选择最优共同分量分布曲线。在各种实施例中,选择最优共同分量分布曲线,与其它共同分量分布曲线的得分相比,所述最优共同分量分布曲线的得分最优地最小化共同分量分布曲线的最大值与每一测量点之间的距离、最大化共同分量分布曲线的面积且最小化从多个经缩放强度迹线减去共同分量分布曲线所得的面积。

用于计算共同分量分布曲线的计算机程序产品

在各种实施例中,计算机程序产品包含有形计算机可读存储媒体,所述有形计算机可读存储媒体的内容包含具有在处理器上执行以便执行用于从来自强度分布的两个或多于两个强度测量计算共同分量分布曲线的方法的指令的程序。此方法由包含一或多个相异软件模块的系统执行。

图13是根据各种实施例的包含执行用于从来自强度分布的两个或多于两个强度测量计算共同分量分布曲线的方法的一或多个相异软件模块的系统1300的示意图。系统1300包含测量模块1310及分析模块1320。

测量模块1310接收多个强度测量。所述多个强度测量是由质谱仪通过分析来自混合物的一或多种化合物而产生。

分析模块1320针对所测量维度的范围从多个强度测量计算多个强度迹线。分析模块1320选择多个强度迹线的强度值。

分析模块1320针对跨越所测量维度的范围的多个测量点中的每一测量点执行三个步骤。第一,分析模块1320将多个强度迹线中的每一强度迹线缩放为在每一测量点处具有所述强度值。

第二,分析模块1320将每一测量点的共同分量分布曲线作为跨越多个测量点的多个经缩放强度迹线的一或多个参数的函数进行计算。在各种实施例中,通过计算跨越多个测量点的多个经缩放强度迹线的最小强度的轮廓而计算每一测量点的共同分量分布曲线。

第三,分析模块1320计算共同分量分布曲线的得分,所述得分为共同分量分布曲线的一或多个参数及多个经缩放强度迹线的一或多个参数的函数。在各种实施例中,计算共同分量分布曲线的得分,所述得分为共同分量分布曲线的最大值与每一测量点之间的距离、共同分量分布曲线的面积及从多个经缩放强度迹线减去共同分量分布曲线所得的面积的函数。

分析模块1320基于多个所计算共同分量分布曲线的得分而从多个所计算共同分量分布曲线选择最优共同分量分布曲线。在各种实施例中,选择最优共同分量分布曲线,与其它共同分量分布曲线的得分相比,所述最优共同分量分布曲线的得分最优地最小化共同分量分布曲线的最大值与每一测量点之间的距离、最大化共同分量分布曲线的面积且最小化从多个经缩放强度迹线减去共同分量分布曲线所得的面积。

尽管联合各种实施例一起描述了本发明教示,但并不打算将本发明教示限制于此类实施例。相反,本发明教示涵盖所属领域的技术人员将了解的各种替代、修改及等效形式,举例来说,来自任何相关离子(同位素离子(m/z移位维度)、中性丢失离子、同位素标记离子等)的峰值。

此外,在描述各种实施例时,说明书可能已将方法及/或过程呈现为特定步骤序列。然而,在所述方法或过程不依赖于本文中所陈述的特定步骤次序的前提下,所述方法或过程不应限制于所描述的特定步骤序列。如所属领域的一般技术人员将了解,可能有其它步骤序列。因此,说明书中所陈述的特定步骤次序不应理解为对权利要求书的限制。另外,针对于所述方法及/或过程的技术方案不应限制于其步骤以所写的次序的执行,且所属领域的技术人员可容易了解,所述序列可变化且仍保持在各种实施例的精神及范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1