基于概率的库搜索算法(PROLS)的制作方法

文档序号:13810440阅读:197来源:国知局

相关申请案的交叉参考

本申请案主张2015年6月18日提出申请的序列号为62/181,624的美国临时专利申请案的权益,所述临时专利申请案的内容以全文引用的方式并入本文中。

导论

各种实施例大体来说涉及串联质谱法。更特定来说,各种实施例涉及用于对实验产物离子谱与已知库产物离子谱进行比较以便在实验样本中识别化合物或确认化合物的存在的系统及方法。

在许多质谱法应用中,使用库搜索来识别未知化合物或确认疑似化合物的存在。此通过以二级质谱法(ms/ms)对产物离子的纯标准质谱(‘库’频谱)与实验质谱(“未知”频谱)进行比较来完成。

已公布在两个频谱之间产生相似性得分的若干种不同算法,最常见的是点积方法。此点积方法将每一产物离子谱看作多维空间(维度是频谱中所呈现的m/z值)中的向量且取其之间的角度的余弦。

此方法十分有效,至少对于低分辨率质谱来说是如此。然而,为了适用,必须“对准”产物离子质谱使得频谱之间的共同m/z值被视为相同特征或“维度”。举例来说,如果一个频谱在m/z100.2da处具有峰值且另一频谱在m/z100.4da处具有峰值,那么这两个峰值是表示相同特征(具有0.2da的测量误差)还是两个不同特征?这些算法最初是针对四极仪器而开发的且所采取的通用方法是在标称质量下工作,从而允许精准地比较整数m/z。为了得到准确质谱,必须引入质量容差,质量容差取决于仪器类型及校准品质。如果两个m/z值在此质量容差内,那么认为其表示相同特征,反之则不是。

使用特定质量容差(以da或ppm为单位)的一个问题是正确地设定所述容差至关重要。如果乐观地设定(通常是这样),那么无法适当对准恰在容差之外的相同特征;如果悲观地设定,那么实际上不同的特征会被视为相同特征。

使用传统的点积算法,当计算余弦(可能在变换之后,例如取平方根或以m/z加权)时直接使用峰值强度。这些算法最初是针对具有极易再现的强度模式的电子轰击(ei)电离源而开发的。由于相对强度与电喷雾电离(esi)不一致,因此可引入“乏晰因子(fudgefactor)”,其将一个频谱中的峰值的相对强度调整成与另一频谱中的对应峰值的强度相同,条件是所述两个相对强度最初在彼此的某一因子内(即,一者是另一者的5倍或1/5)。

此方法的一个严重问题是所记录库得分可因甚至频谱的小改变而显著改变。举例来说,考虑具有强度为1且容差因子为5x的峰值的库频谱。如果未知频谱的对应峰值的强度是4.9,那么其强度被重设为1且获得良好匹配(至少对于此一个峰值来说);如果强度是5.1(小差),那么所述强度将保持不变且将获得十分不良匹配。

因此,在对实验产物离子质谱与库产物离子质谱进行比较时,当前质谱法行业(1)缺少用于优化地设定比较中所使用的质量容差的系统及方法,且(2)缺少用于优化地调整比较中所使用的实验产物离子峰值的相对强度的系统及方法。



技术实现要素:

揭示一种用于使用具有介于1与0之间的值的质荷比(m/z)容差概率函数来确定实验产物离子频谱与库产物离子频谱的对应质量峰值的系统。所述系统包含离子源、串联质谱仪及处理器。

所述离子源将样本的一或多种已知化合物离子化,从而产生前驱物离子的离子束。所述串联质谱仪从所述离子源接收所述离子束。所述串联质谱仪从所述离子束选择对应于所述一或多种已知化合物中的至少一种化合物的至少一个前驱物离子,且将所述至少一个前驱物离子碎裂,从而产生所述至少一个前驱物离子的产物离子质谱。

所述处理器执行若干个步骤。所述处理器从所述串联质谱仪接收所述产物离子质谱。所述处理器接收m/z容差概率函数,所述m/z容差概率函数随着两个质量峰值之间的m/z差的值增大而从1到0变化且包含介于1与0之间的一或多个值。所述处理器从存储器检索所述至少一种化合物的库产物离子质谱。所述处理器计算所述产物离子质谱中的至少一个实验产物离子质量峰值与所述库产物离子质谱中的至少一个库产物离子质量峰值之间的m/z差。所述处理器使用所述m/z容差概率函数依据所述m/z差来计算m/z容差概率(pm/z)1。所述处理器基于所述m/z容差概率(pm/z)1而确定所述至少一个实验产物离子质量峰值与所述至少一个库产物离子质量峰值是否为对应峰值。

揭示一种用于使用具有介于1与0之间的值的质荷比m/z容差概率函数来确定实验产物离子频谱与库产物离子频谱中的对应质量峰值的方法。使用离子源将样本的一或多种已知化合物离子化,从而产生前驱物离子的离子束。使用串联质谱仪从所述离子源接收所述离子束,从所述离子束选择对应于所述一或多种已知化合物中的至少一种化合物的至少一个前驱物离子,且将所述至少一个前驱物离子碎裂,从而产生所述至少一个前驱物离子的产物离子质谱。

使用处理器从所述串联质谱仪接收所述产物离子质谱。使用所述处理器接收m/z容差概率函数,所述m/z容差概率函数随着两个质量峰值之间的m/z差的值增大而从1到0变化且包含介于1与0之间的一或多个值。使用所述处理器从存储器检索所述至少一种化合物的库产物离子质谱。使用所述处理器计算所述产物离子质谱中的至少一个实验产物离子质量峰值与所述库产物离子质谱中的至少一个库产物离子质量峰值之间的m/z差。使用所述处理器使用所述m/z容差概率函数依据所述m/z差来计算m/z容差概率(pm/z)1。使用所述处理器基于所述m/z容差概率(pm/z)1而确定所述至少一个实验产物离子质量峰值与所述至少一个库产物离子质量峰值是否为对应峰值。

揭示一种计算机程序产品,其包含非暂时性且有形的计算机可读存储媒体,所述计算机可读存储媒体的内容包含具有指令的程序,所述指令在处理器上执行以便执行用于使用具有介于1与0之间的值的m/z容差概率函数来确定实验产物离子频谱与库产物离子频谱中的对应质量峰值的方法。在各种实施例中,所述方法包含提供系统,其中所述系统包括一或多个相异软件模块,且其中所述相异软件模块包括测量模块及分析模块。

所述测量模块从串联质谱仪接收产物离子质谱。使用离子源将样本的一或多种已知化合物离子化,从而产生前驱物离子的离子束。所述串联质谱仪从所述离子源接收所述离子束,从所述离子束选择对应于所述一或多种已知化合物中的至少一种化合物的至少一个前驱物离子,且将所述至少一个前驱物离子碎裂,从而产生所述至少一个前驱物离子的产物离子质谱。

所述分析模块接收m/z容差概率函数,所述m/z容差概率函数随着两个质量峰值之间的m/z差的值增大而从1到0变化且包含介于1与0之间的一或多个值。所述分析模块从存储器检索所述至少一种化合物的库产物离子质谱。所述分析模块计算所述产物离子质谱中的至少一个实验产物离子质量峰值与所述库产物离子质谱中的至少一个库产物离子质量峰值之间的m/z差。所述分析模块使用所述m/z容差概率函数依据所述m/z差来计算m/z容差概率(pm/z)1。所述分析模块基于所述m/z容差概率(pm/z)1而确定所述至少一个实验产物离子质量峰值与所述至少一个库产物离子质量峰值是否为对应峰值。

本文中陈述申请人的教示的这些及其它特征。

附图说明

所属领域的技术人员将理解,下文所描述的图式仅出于图解说明目的。所述图式并不打算以任何方式限制本发明教示的范围。

图1是图解说明可在其上实施本发明教示的实施例的计算机系统的框图。

图2是根据各种实施例以实验方法产生的产物离子质谱与库产物离子质谱的示范性对准。

图3是具有截止值0.2m/z的常规质荷比(m/z)容差函数的示范性图表。

图4是如何依据图2的频谱及图3的m/z容差函数以图形方式产生点积的示范性图式。

图5是具有截止值0.4m/z的常规m/z容差函数的示范性图表。

图6是如何依据图2的频谱及图5的m/z容差函数以图形方式产生点积的示范性图式。

图7是具有截止值3的常规强度比阈值函数的示范性图表。

图8是根据各种实施例具有介于1与0之间的值的m/z容差概率函数的示范性图表。

图9是根据各种实施例具有介于1与0之间的值的强度比阈值概率函数的示范性图表。

图10是当使用常规m/z容差截止值及常规强度比阈值截止值时化合物的数目对化合物的库得分的示范性图表。

图11是根据各种实施例当使用具有1与0之间的值的m/z容差概率函数(例如图8的函数)及具有介于1与0之间的值的强度比阈值概率函数(例如图9的函数)时化合物的数目对化合物的库得分的示范性图表。

图12是根据各种实施例用于使用具有介于1与0之间的值的m/z容差概率函数来确定实验产物离子频谱与库产物离子频谱中的对应质量峰值的系统的示意图。

图13是根据各种实施例展示使用具有介于1与0之间的值的m/z容差概率函数来确定实验产物离子频谱与库产物离子频谱中的对应质量峰值的方法的流程图。

图14是根据各种实施例包含一或多个相异软件模块的系统的示意图,所述模块执行用于使用具有介于1与0之间的值的m/z容差概率函数来确定实验产物离子频谱与库产物离子频谱中的对应质量峰值的方法。

在详细描述本发明教示的一或多个实施例之前,所属领域的技术人员将了解,本发明教示在其应用方面并不限于以下详细描述中所陈述或图式中所图解说明的构造细节、组件布置及步骤安排。而且,应理解,本文中所使用的措辞及术语出于描述目的且不被应视为具有限制性。

具体实施方式

计算机实施的系统

图1是图解说明计算机系统100的框图,可在计算机系统100上实施本发明教示的实施例。计算机系统100包含用于传达信息的总线102或其它通信机构,及与总线102耦合以用于处理信息的处理器104。计算机系统100还包含存储器106,其可为随机存取存储器(ram)或其它动态存储装置,存储器106耦合到总线102以用于存储待由处理器104执行的指令。存储器106还可用于在待由处理器104执行的指令的执行期间存储临时变量或其它中间信息。计算机系统100进一步包含只读存储器(rom)108或其它静态存储装置,只读存储器(rom)108或其它静态存储装置耦合到总线102以用于存储用于处理器104的静态信息及指令。提供例如磁盘或光盘等存储装置110且将其耦合到总线102以用于存储信息及指令。

计算机系统100可经由总线102耦合到显示器112(例如阴极射线管(crt)或液晶显示器(lcd))以向计算机用户显示信息。包含字母数字键及其它键的输入装置114耦合到总线102以用于将信息及命令选择传达到处理器104。另一类型的用户输入装置是用于将方向信息及命令选择传达到处理器104且用于控制显示器112上的光标移动的光标控制件116,例如鼠标、轨迹球或光标方向键。此输入装置通常具有在两个轴(第一轴(即,x)及第二轴(即,y))上的两个自由度,此允许所述装置规定在一平面中的位置。

计算机系统100可执行本发明教示。依照本发明教示的某些实施方案,由计算机系统100响应于处理器104执行存储器106中所含有的一或多个指令的一或多个序列而提供结果。可将此些指令从例如存储装置110等另一计算机可读媒体读取到存储器106中。对存储器106中所含有的指令序列的执行致使处理器104执行本文中所描述的过程。另一选择为,硬连线电路可取代软件指令或与软件指令组合使用以实施本发明教示。因此,本发明教示的实施方案并不限于硬件电路与软件的任何特定组合。

在各种实施例中,计算机系统100可跨越网络连接到一或多个其它计算机系统(如计算机系统100)以形成网络化系统。所述网络可包含专用网络或公用网络,例如因特网。在网络化系统中,一或多个计算机系统可存储数据且将数据供应给其它计算机系统。在云计算情景中,存储且供应数据的一或多个计算机系统可被称为服务器或云。所述一或多个计算机系统可包含一或多个web服务器,举例来说。将数据发送到服务器或云且从服务器或云接收数据的其它计算机系统可称为客户端或云装置,举例来说。

如本文中所使用的术语“计算机可读媒体”是指参与将指令提供到处理器104以供执行的任何媒体。此媒体可呈许多形式,包含但不限于非易失性媒体、易失性媒体及传输媒体。举例来说,非易失性媒体包含光盘或磁盘,例如存储装置110。易失性媒体包含动态存储器,例如存储器106。传输媒体包含同轴电缆、铜线及光纤,包含包括总线102的导线。

举例来说,常见形式的计算机可读媒体或计算机程序产品包含软盘、柔性盘、硬盘、磁带或任何其它磁性媒体、cd-rom、数字视盘(dvd)、蓝光盘、任何其它光学媒体、拇指驱动器、存储器卡、ram、prom及eprom、flash-eprom、任何其它存储器芯片或盒式磁盘,或者计算机可从其读取的任何其它有形媒体。

在将一或多个指令的一或多个序列载运到处理器104以供执行时可涉及各种形式的计算机可读媒体。举例来说,可最初在远程计算机的磁盘上载运指令。所述远程计算机可将指令加载到其动态存储器中并使用调制解调器经由电话线发送指令。在计算机系统100本地的调制解调器可经由电话线接收数据并使用红外发射器将数据转换为红外信号。耦合到总线102的红外检测器可接收在红外信号中载运的数据并将数据置于总线102上。总线102将数据载运到存储器106,处理器104从存储器106检索并执行指令。可任选地在由处理器104执行之前或之后将由存储器106接收到的指令存储于存储装置110上。

根据各种实施例,经配置以由处理器执行以执行方法的指令存储于计算机可读媒体上。所述计算机可读媒体可为存储数字信息的装置。举例来说,计算机可读媒体包含此项技术中已知的用于存储软件的光盘只读存储器(cd-rom)。所述计算机可读媒体由适合用于执行经配置以被执行的指令的处理器存取。

已出于图解说明及描述目的而呈现对本发明教示的各种实施方案的以下描述。其并非穷尽性的且不将本发明教示限制于所揭示的精确形式。修改及变化鉴于以上教示而可能存在或可从对本发明教示的实践获取。另外,所描述的实施方案包含软件,但本发明教示可实施为硬件与软件的组合或单独以硬件实施。可利用面向对象的程序设计系统及非面向对象的程序设计系统两者来实施本发明教示。

具有介于1与0之间的值的概率函数

如上文所描述,在对实验产物离子质谱与库产物离子质谱进行比较时,当前质谱法行业(1)缺少用于优化地设定比较中所使用的质量容差的系统及方法,且(2)缺少用于优化地调整比较中所使用的实验产物离子峰值的相对强度的系统及方法。

图2是根据各种实施例以实验方法产生的产物离子质谱210与库产物离子质谱220的示范性对准200。仅出于说明目的,以实验方法产生的产物离子质谱210及库产物离子质谱220各自包含仅两个质量峰值。通常,以实验方法产生的产物离子质谱及库产物离子质谱包含更多产物离子质量峰值。

对以实验方法产生的产物离子质谱210及库产物离子质谱220的质量峰值的比较取决于所使用的特定质荷比(m/z)容差。举例来说,如果m/z容差是0.2,那么质量峰值211(m/z=100.0)与221(m/z=100.1)被视为相同特征或维度,且质量峰值212(m/z=102.2)与222(m/z=102.5)被视为不同特征或维度。然而,如果m/z容差是0.4,那么质量峰值211(m/z=100.0)与221(m/z=100.1)被视为相同特征或维度,且质量峰值212(m/z=102.2)与222(m/z=102.5)也被视为相同特征或维度。注意,所属领域的技术人员可了解,在论述质谱时,质量与m/z可互换地使用,将质量转换成m/z是质量除以电荷(z)的问题,且将m/z转换成质量是m/z乘以电荷(z)的问题。

常规m/z容差

常规地,m/z容差是截止值,其是不连续函数或阶跃函数。举例来说,具有在截止内的m/z值的所有质量峰值均是相同特征或维度。具有在截止外的m/z值的所有质量峰值均是不同特征或维度。

图3是具有截止值0.2m/z的常规m/z容差函数310的示范性图表300。m/z容差函数310的图表300表明当以实验方法产生的产物离子质谱中的质量峰值与库产物离子质谱中的质量峰值之间的m/z差介于0与0.2m/z之间时,不同频谱的质量峰值被视为相同特征或维度或被视为对应峰值。另外,m/z容差函数310表明当以实验方法产生的产物离子质谱中的质量峰值与库产物离子质谱中的质量峰值之间的m/z差大于0.2m/z时,不同频谱的质量峰值被视为不同特征或维度。

返回图2,使用点积算法对以实验方法产生的产物离子质谱(例如频谱210)与库产物离子质谱(例如频谱220)进行对比。点积算法高度取决于两个频谱的单独特征或维度的数目。因此,点积算法高度取决于选定m/z容差。

图4是如何依据图2的频谱及图3的m/z容差函数以图形方式产生点积的示范性图式400。图3的m/z容差函数具有m/z截止值0.2m/z。如上文所描述,当m/z容差是0.2m/z时,图2的频谱被视为具有三个单独的特征或维度。图4的第一维度411表示包含以下两项的特征:图2的以实验方法产生的产物离子质谱210的质量峰值211及图2的库产物离子质谱220的质量峰值221。第二维度412表示包含图2的以实验方法产生的产物离子质谱210的质量峰值212的特征。第三维度422表示包含图2的库产物离子质谱220的质量峰值222的特征。

图4中的向量410表示图2的以实验方法产生的产物离子质谱210。注意,向量410仅存在于由第一维度411与第二维度412形成的平面中。这是因为当m/z容差是0.2时,图2的以实验方法产生的产物离子质谱210无与图2的库产物离子质谱220的质量峰值22对应的质量峰值。

图4中的向量420表示图2的库产物离子质谱220。注意,向量420仅存在于由第一维度411与第三维度422形成的平面中。这是因为当m/z容差是0.2时,图2的库产物离子质谱220无与图2的以实验方法产生的产物离子质谱210的质量峰值212对应的质量峰值。

注意,图4的向量410及420是直接依据图2的以实验方法产生的产物离子质谱210及库产物离子质谱220的峰值强度而标绘。如上文所描述,此对于电子电离(ei)来说十分有效,但对于电喷雾电离(esi)来说并非如此。

向量410及420的点积是其量值或长度乘以角度430的余弦的积。常规地,使用以下公式针对两个频谱的点积计算库得分或纯得分:

其中ui是第i未知峰值或实验峰值的强度且li是第i库峰值的强度。注意,如上文所描述,对于esi来说,库强度是在使用“乏晰因子”或加权进行任何调整之后。uili求和在仅使用两个频谱之间共同的峰值时发生。库得分方程式的另一求和分别使用未知峰值及库峰值。

返回图2,如果m/z容差是0.2,那么质量峰值211(m/z=100.0)与221(m/z=100.1)被视为相同特征或维度,且质量峰值212(m/z=102.2)与222(m/z=102.5)被视为不同特征或维度。质量峰值211的强度是4.8,质量峰值212的强度是4.0,质量峰值221的强度是2.0,且质量峰值222的强度是1.2。那么,库得分计算为:

此库得分使用实际峰值强度。此外,对于esi来说,通常在计算库得分之前修改峰值强度。

图5是具有截止值0.4m/z的常规m/z容差函数的示范性图表500。m/z容差函数510的图表500表明当以实验方法产生的产物离子质谱中的质量峰值与库产物离子质谱中的质量峰值之间的m/z差介于0与0.4m/z之间时,不同频谱的质量峰值被视为相同特征或维度或被视为对应峰值。另外,m/z容差函数510表明当以实验方法产生的产物离子质谱中的质量峰值与库产物离子质谱中的质量峰值之间的m/z差大于0.4m/z时,不同频谱的质量峰值被视为不同特征或维度。

图6是如何依据图2的频谱及图5的m/z容差函数以图形方式产生点积的示范性图式600。图5的m/z容差函数具有m/z截止值0.4m/z。如上文所描述,当m/z容差是0.4m/z时,图2的频谱被视为仅具有两个单独特征或维度。图6的第一维度611表示包含以下两项的特征:图2的以实验方法产生的产物离子质谱210的质量峰值211及图2的库产物离子质谱220的质量峰值221。第二维度612表示包含以下两项的特征:图2的以实验方法产生的产物离子质谱的质量峰值212及库产物离子质谱220的质量峰值222。

图6的向量610表示图2的以实验方法产生的产物离子质谱210。图6的向量620表示图2的库产物离子质谱220。注意,向量610及向量620存在于同一平面中。

返回图2,如果m/z容差是0.4,那么质量峰值211(m/z=100.0)与221(m/z=100.1)被视为相同特征或维度,且质量峰值212(m/z=102.2)与222(m/z=102.5)也被视为相同特征或维度。质量峰值211的强度是4.8,质量峰值212的强度是4.0,质量峰值221的强度是2.0,且质量峰值222的强度是1.2。那么,库得分计算为:

还要注意,图6的向量610及620直接依据图2的以实验方法产生的产物离子质谱210及库产物离子质谱220的峰值强度而标绘。如上文所描述,此对于电子电离(ei)来说十分有效,但对于电喷雾电离(esi)来说并非如此。

图4与6的比较表明如何以不同方式针对图2的频谱计算点积取决于所使用的m/z容差。在图4中,在三维度空间中计算点积。在图6中,在二维度空间中计算点积。库得分也如上文所展示地有所不同。

常规强度比阈值

当使用例如esi等离子化方法时,点积计算还取决于强度比调整。如上文所描述,与例如ei等技术相比,esi提供跨越实验的不一致峰值强度。通常,所有强度均是相对的。换句话说,产物离子谱的最大峰值通常被视为100%(或一些其它恒定值)。观点是比较不应受库中存在的或未知的化合物或分析物的总量影响,这仅是一般模式。因此,一些点积计算基于强度比容差或阈值而执行对所比较频谱中的一者的强度的调整。

举例来说,如果未知峰值的强度是4.9且对应库峰值的强度是1,那么未知峰值与库峰值的强度比是4.9。如果强度比阈值是5,那么强度比4.9在此阈值内。当对应峰值的强度比在强度比阈值内,两个峰值的强度被认为是相同的。此为上文所描述的调整或“乏晰因子”。举例来说,具有强度4.9的未知峰值被视为具有强度1,强度1是对应库峰值的强度。当对应峰值的强度比不在强度比阈值内时,对应峰值的强度保持不变。如果对应峰值的强度变化很大且保持改变,那么得分会显著减小。

因此,此强度比阈值通过允许对应峰值强度存在差异或不允许对应峰值强度存在差异而影响针对频谱比较计算的点积。因此,强度比阈值可发挥与上文所描述的m/z容差十分相似的作用。由于不允许对应峰值强度存在差异,因此强度比阈值是截止值。而且,其还是不连续函数或阶跃函数。

图7是具有截止值3的常规强度比阈值函数710的示范性图表700。强度比阈值函数710的图表700表明当以实验方法产生的产物离子质谱中的质量峰值的强度与库产物离子质谱中的对应质量峰值的强度之比介于1与3之间时,不同频谱的两个质量峰值被视为具有相同强度。另外,强度比阈值函数710表明当以实验方法产生的产物离子质谱中的质量峰值的强度与库产物离子质谱中的对应质量峰值的强度之比大于3时,不同频谱的两个质量峰值的强度保持不变。

返回图2,以实验方法产生的产物离子质谱210的质量峰值211具有强度4.8。库产物离子质谱220的对应质量峰值221具有强度2。那么,两个质量峰值的强度比是2.4。如果使用图7的强度比阈值函数710,那么比率2.4小于截止比率3,因此对于所使用的比较算法来说,质量峰值211与质量峰值221被视为具有相同强度。可使质量峰值211具有质量峰值221的强度,或可使质量峰值221具有质量峰值211的强度,此取决于所使用的算法。

在图2中类似地,以实验方法产生的产物离子质谱210的质量峰值212具有强度4.0。库产物离子质谱220的对应质量峰值222具有强度1.2。那么,两个质量峰值的强度比是3.33。如果使用图7的强度比阈值函数710,比率3.33大于截止比率3,因此质量峰值212及质量峰值222的强度保持不变。

具有介于1与0之间的值的m/z容差概率函数

在各种实施例中,在实验产物离子质谱与库产物离子质谱的比较中所使用的m/z容差是具有介于1与0之间的值的概率函数pm/z。概率函数从1(良好匹配)平滑地进展到0(不匹配)。此与上文所描述的具有硬性或突然截止m/z容差且仅具有值1或0的常规方法形成对照。概率函数可具有许多不同形式。然而,重要的是随着两个频谱的峰值之间的m/z差增大,概率具有介于1到0之间的至少一个值。

图8是根据各种实施例具有介于1与0之间的值的m/z容差概率函数810的示范性图表800。m/z容差函数810的图表800表明当以实验方法产生的产物离子质谱中的质量峰值与库产物离子质谱中的质量峰值之间的m/z差介于某一m/z差值820与另一m/z差值830之间时,概率从1到0连续变化。换句话说,在此区域中,概率具有介于1与0之间的许多值。举例来说,m/z差值820是常规方法中所使用的m/z容差值。举例来说,m/z差值830是常规方法中所使用的m/z容差值的倍数,例如是常规方法中所使用的m/z容差值的3倍。

在各种实施例中,概率函数810包含其中在m/z差0与m/z差值820之间概率是1的区域。此区域被包含以解释质谱仪测量中的已知误差。举例来说,如果测量同一离子两次,那么在大多数情形中不会得到相同的m/z值。在m/z测量中存在某种误差。

概率函数810是连续函数。然而,在各种实施例中,具有介于1与0之间的值的概率函数也可以是不连续的。

概率函数810取决于m/z差值820,m/z差值820是常规方法中的截止容差值。由于概率函数810包含介于1与0之间的值,因此其对经准确设定的m/z差值820的敏感性远不如常规方法。然而,对m/z差值820的正确设定仍是重要的且不可能完全不正确。因此,在各种实施例中,m/z差值820随预期测量误差而变化。预期测量误差可以是基于关于质谱仪器的先前经验的单个值或其可涉及更多值。举例来说,预期测量误差可以是依据例如分辨率等参数计算的概率分布函数或是依据校准峰值估计的预期准确性。

具有介于1与0之间的值的强度比阈值概率函数

在各种实施例中,在实验产物离子质谱与库产物离子质谱的比较中所使用的强度比阈值也是具有介于1与0之间的值的概率函数pratio。概率函数pratio从1(使强度完全相同)平滑地进展到0(不改变强度)。此也与上文所描述的具有硬性或突然截止强度比阈值的常规方法形成对照。概率函数pratio可具有许多不同形式。然而,重要的是随着两个频谱的峰值的强度比增大,概率具有介于1到0之间的至少一个值。如果强度相当接近,那么强度比概率pratio是1。假设比率是较大强度除以较小强度,由于强度差增大且比率变得更大,因此pratio最后下降到0。

图9是根据各种实施例的具有介于1与0之间的值的强度比阈值概率函数910的示范性图表900。强度比阈值910的图表900表明当以实验方法产生的产物离子质谱中的峰值与库产物离子质谱中的峰值的强度比介于某一比率920与另一比率930之间时,概率从1到0连续变化。换句话说,在此区域中,概率具有介于1与0之间的值。举例来说,比率920是常规方法中所使用的强度比阈值。举例来说,m/z差值930是常规方法中所使用的强度比阈值的倍数,例如是常规方法中所使用的强度比阈值的10倍。

在各种实施例中,概率函数910还包含其中在比率0与比率920之间概率是1的区域。此区域被包含以解释质谱仪测量中的已知误差。举例来说,如果测量同一离子两次,那么在大多数情形中不会得到相同的强度值。强度测量中存在某种误差。

频谱比较中所使用的概率

在各种实施例中,依据m/z容差概率pm/z及强度比阈值概率pratio计算两个峰值相匹配的总概率pmatch。可通过以任何方式组合m/z容差概率pm/z与强度比阈值概率pratio来计算总概率pmatch。举例来说,pmatch可是pm/z与pratio的积,或

pmatch=pm/z×pratio。

在各种实施例中,m/z容差概率pm/z及强度比阈值概率pratio还可用于点积算法的修改形式中。根据以下方程式用针对点积算法的此修改形式来计算库得分或纯得分:

其中ui是第i未知峰值或实验峰值的强度,li是第i库峰值的强度,且(pm/z)i是具有强度ui及li的两个峰值表示相同特征的概率。

在各种实施例中,库得分或纯得分进一步被修改以包含强度比阈值概率pratio。在库得分中,第i库峰值li的强度计算为

li=li+(pratio)i×(ui-li)

(举例来说)。因此,当(pratio)i是1时,使用未知强度或实验强度,且当(pratio)i是0时,使用库强度。注意,也可并入其它加权,例如取平方根或乘以m/z。

实验结果

使用串联质谱仪来以实验方法分析若干种化合物,且对化合物的实验产物离子频谱与库产物离子频谱进行比较。执行两次单独比较。在第一比较中,使用常规m/z容差截止值及常规强度比阈值截止值。在第二比较中,使用具有介于1与0之间的值的m/z容差概率函数(例如图8的函数810)及具有介于1与0之间的值的强度比阈值概率函数(例如图9的函数910)。

图10是当使用常规m/z容差截止值及常规强度比阈值截止值时化合物的数目对化合物的库得分的示范性图表1000。x轴是库得分(从0%到100%),且y轴表示具有对应得分的化合物的数目。黑色条块是已知的负性化合物(其理想地将具有得分0)。白色条块是已知的正性化合物(其理想地将具有得分100)。图10展示存在从80%到90%的重叠区域1010,其中不可能区分真正性化合物与假正性化合物。

图11是根据各种实施例当使用具有1与0之间的值的m/z容差概率函数(例如,图8的函数810)及具有介于1与0之间的值的强度比阈值概率函数(例如,图9的函数910)时化合物的数目对化合物的库得分的示范性图表1100。此外,x轴是库得分(从0%到100%),且y轴表示具有对应得分的化合物的数目。黑色条块是已知负性化合物(其理想地将具有得分0)。白色条块是已知正性化合物(其理想地将具有得分100)。

图11表明当使用概率时,很少有得分靠近100%的真正性化学物。然而,也很少有得分靠近真负性化合物的假负性化合物。对图10与图11进行比较表明通过使用概率真正性化合物与假负性化合物被完全分离,至少对于此数据设定来说是如此。除了在极有限的情形中(即小的库)之外,此是质谱法行业先前不能获得的结果。

用于确定对应峰值的系统

图12是根据各种实施例用于使用具有介于1与0之间的值的m/z容差概率函数来确定实验产物离子频谱与库产物离子频谱中的对应质量峰值的系统的示意图1200。系统1200包含离子源1210、串联质谱仪1220及处理器1230。在各种实施例中系统1200还可包含分离装置(未展示)。举例来说,分离装置可使用各种技术随时间从样本分离一或多种已知化合物。这些技术包含但不限于离子迁移、气相色谱法(gc)、液相色谱法(lc)、毛细管电泳(ce)或流动注射分析法(fia)。

离子源1210可以是串联质谱仪1220的一部分,或可以是分离装置。离子源1210将样本的一或多种已知化合物离子化,从而产生前驱物离子的离子束。

串联质谱仪1220可包含(举例来说)一或多个物理质量滤波器以及一或多个物理质量分析器。串联质谱仪1220的质量分析器可包含但不限于飞行时间(time-of-flight,tof)质量分析器、四极质量分析器、离子阱质量分析器、线性离子阱质量分析器、轨道阱质量分析器或傅里叶变换质量分析器。

串联质谱仪1220从离子源1210接收离子束。串联质谱仪1220从离子束选择对应于一或多种已知化合物中的至少一种化合物的至少一个前驱物离子且将所述至少一个前驱物离子碎裂,从而产生至少一个前驱物离子的产物离子质谱。

处理器1230可是但不限于计算机、微处理器或能够发送控制信号及数据且从串联质谱仪1220接收控制信号及数据并处理数据的任何装置。举例来说,处理器1230可为图1的计算机系统100。在各种实施例中,处理器1230与串联质谱仪1220进行通信。

处理器1230执行若干个步骤。处理器1230从串联质谱仪1220接收产物离子质谱。处理器1230接收m/z容差概率函数,所述m/z容差概率函数随着两个质量峰值之间的m/z差的值增大而从1到0变化且包含介于1与0之间的一或多个值。举例来说,处理器1230可直接从用户接收m/z容差概率函数,或处理器1230可从存储器或数据库检索m/z容差概率函数。举例来说,m/z容差概率函数是预定的。

处理器1230从存储器检索至少一种化合物的库产物离子质谱。存储器可以是电子存储器或磁性存储器。在各种实施例中,存储器可以是数据库的一部分。处理器1230计算产物离子质谱中的至少一个实验产物离子质量峰值与库产物离子质谱中的至少一个库产物离子质量峰值之间的m/z差。

处理器1230使用m/z容差概率函数依据m/z差来计算m/z容差概率(pm/z)1。最后,处理器1230基于m/z容差概率(pm/z)1而确定至少一个实验产物离子质量峰值与至少一个库产物离子质量峰值是否为对应峰值。由于m/z容差概率(pm/z)1从1到0变化,因此任何非0的概率值指示对应水平。

在各种实施例中,处理器1230进一步计算产物离子质谱与库产物离子质谱的比较得分。计算得分包含计算m/z容差概率(pm/z)1、至少一个实验产物离子质量峰值的强度u1与至少一个库产物离子质量峰值的强度l1的积。

在各种实施例中,处理器1230使用(pm/z)1、u1及l1以及任何其它的(pm/z)i、ui及li根据以下方程式计算得分:

其中ui是第i未知峰值或实验峰值的强度,li是第i库峰值的强度,且(pm/z)i是具有强度ui及li的两个峰值是对应峰值的概率。对应峰值是表示相同特征的峰值。

在各种实施例中,ui及li包含加权因子或是以数学方法从由质谱仪测量的原始值变换得出。举例来说,可通过将所测量的原始强度值乘以m/z值而给其加权。此外,举例来说,可通过取这些值的平方根变换所测量的原始强度值。

在各种实施例中,处理器1230进一步接收强度比阈值概率函数,所述强度比阈值概率函数随着两个质量峰值的强度比的值增大而从1到0变化且包含介于1与0之间的一或多个值。此外,举例来说,处理器1230可直接从用户接收强度比阈值概率函数,或处理器1230可从存储器或数据库检索强度比阈值概率函数。举例来说,强度比阈值概率函数是预定的。

处理器1230依据至少一个实验产物离子质量峰值的强度及至少一个库产物离子质量峰值的强度而计算强度比。处理器1230使用强度比阈值概率函数依据强度比来计算强度阈值概率(pratio)1。最后,处理器1230基于强度阈值概率(pratio)1而修改至少一个实验产物离子质量峰值的强度u1或至少一个库产物离子质量峰值的强度l1。举例来说,处理器1230可根据以下方程式修改至少一个库产物离子质量峰值的强度l1:

已修改l1=l1+(pratio)1×(u1-l1)

在各种实施例中,处理器1230进一步使用已修改l1及任何其它已修改li来计算产物离子质谱与库产物离子质谱的比较得分。根据以下方程式计算得分:

其中ui是第i未知峰值或实验峰值的强度,(pm/z)i是具有强度ui及li的两个峰值是对应峰值的概率,且根据以下方程式计算已修改li

已修改li=li+(pratio)i×(ui-li)

其中li是第i库峰值的强度。

在各种实施例中,处理器1230进一步计算至少一个实验产物离子质量峰值与至少一个库产物离子质量峰值相匹配的总概率(pmatch)1。通过组合m/z容差概率(pm/z)1与强度阈值概率(pratio)1计算总概率(pmatch)1。举例来说,(pmatch)1可计算为(pm/z)1与(pratio)1的积。

用于确定对应峰值的方法

图13是根据各种实施例展示使用具有介于1与0之间的值的m/z容差概率函数来确定实验产物离子频谱与库产物离子频谱中的对应质量峰值的方法的流程图1300。

在方法1300的步骤1310中,使用离子源将样本的一或多种已知化合物离子化,从而产生前驱物离子的离子束。

在步骤1320中,使用串联质谱仪从离子源接收离子束,从离子束选择对应于一或多种已知化合物中的至少一种化合物的至少一个前驱物离子,且将至少一个前驱物离子碎裂,从而产生至少一个前驱物离子的产物离子质谱。

在步骤1330中,使用处理器从串联质谱仪接收产物离子质谱。

在步骤1340中,使用处理器接收m/z容差概率函数,所述m/z容差概率函数随着两个质量峰值之间的m/z差的值增大而从1到0变化且包含介于1与0之间的一或多个值。

在步骤1350中,使用处理器从存储器检索至少一种化合物的库产物离子质谱。

在步骤1360中,使用处理器计算产物离子质谱中的至少一个实验产物离子质量峰值与库产物离子质谱中的至少一个库产物离子质量峰值之间的m/z差。

在步骤1370中,使用处理器使用m/z容差概率函数依据m/z差来计算m/z容差概率(pm/z)1。

最后,在步骤1380中,使用处理器基于m/z容差概率(pm/z)1而确定至少一个实验产物离子质量峰值与至少一个库产物离子质量峰值是否为对应峰值。

用于确定对应峰值的计算机程序产品

在各种实施例中,计算机程序产品包含有形计算机可读存储媒体,所述有形计算机可读存储媒体的内容包含具有指令的程序,所述指令在处理器上执行以便执行使用具有介于1与0之间的值的m/z容差概率函数来确定实验产物离子频谱与库产物离子频谱中的对应质量峰值的方法。此方法由包含一或多个相异软件模块的系统执行。

图14是根据各种实施例包含一或多个相异软件模块的系统1400的示意图,所述模块执行用于使用具有介于1与0之间的值的m/z容差概率函数来确定实验产物离子频谱与库产物离子频谱中的对应质量峰值的方法。系统1400包含测量模块1410及分析模块1420。

测量模块1410从串联质谱仪接收产物离子质谱。使用离子源将样本的一或多种已知化合物离子化,从而产生前驱物离子的离子束。串联质谱仪从离子源接收所述离子束,从所述离子束选择对应于一或多种已知化合物中的至少一种化合物的至少一个前驱物离子,且将所述至少一个前驱物离子碎裂,从而产生至少一个前驱物离子的产物离子质谱。

分析模块1420接收m/z容差概率函数,所述m/z容差概率函数随着两个质量峰值之间的m/z差的值增大而从1到0变化且包含介于1与0之间的一或多个值。分析模块1420从存储器检索至少一种化合物的库产物离子质谱。分析模块1420计算产物离子质谱中的至少一个实验产物离子质量峰值与库产物离子质谱中的至少一个库产物离子质量峰值之间的m/z差。分析模块1420使用m/z容差概率函数依据m/z差来计算m/z容差概率(pm/z)1。最后,分析模块1420基于m/z容差概率(pm/z)1而确定至少一个实验产物离子质量峰值与至少一个库产物离子质量峰值是否为对应峰值。

虽然结合各种实施例描述了本发明教示,但并不打算将本发明教示限制于此类实施例。相反,如所属领域的技术人员将了解,本发明教示涵盖各种替代方案、修改及等效形式。

此外,在描述各种实施例时,本说明书可已将方法及/或过程呈现为特定步骤顺序。然而,在所述方法或过程不依赖于本文中所陈述的特定步骤次序的前提下,所述方法或过程不应限制于所描述的特定步骤顺序。如所属领域的技术人员将了解,可能有其它步骤顺序。因此,说明书中所陈述的步骤的特定次序不应理解为对权利要求书的限制。另外,针对于所述方法及/或过程的权利要求不应限制于其步骤以所写的次序的执行,且所属领域的技术人员可容易了解,所述序列可变化且仍保持在各种实施例的精神及范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1