用于从质谱法输出识别聚合物物种的方法及设备的制造方法

文档序号:8491730阅读:305来源:国知局
用于从质谱法输出识别聚合物物种的方法及设备的制造方法
【专利说明】用于从质谱法输出识别聚合物物种的方法及设备
[0001] 相关申请案
[0002] 本申请案主张标题是"用于从质谱法输出识别聚合物物种的方法及设备(Methods andApparatusforIdentificationofPolymericSpeciesfromMassSpectrometry Output)"且申请于2012年8月9日的第61/681,575号美国临时专利申请案及标题 是"用于从质谱法输出识别聚合物物种的方法及设备(MethodsandApparatusfor IdentificationofPolymericSpeciesfromMassSpectrometryOutput) ''且申请于 2012年8月31日的第61/696,071号美国临时专利申请案的优先权及权利,所述申请案中 的每一者的内容全部是以引用方式并入本文中。
【背景技术】
[0003] 质谱法(MS)是测量带电粒子的质量-电荷比的分析工具且广泛用于化合物的定 性及定量分析,包含化合物识别以及化合物结构、选择反应性、稳定性等等的询问。商用现 代质谱仪不但采用离子分离的不同方法,而且蒸发/离子化技术以及检测方案不断改变。 此导致基于或关于质谱测量的科学应用的范围越来越广。
[0004] 用于分析化学性质的第一代商用质谱仪使用电子撞击离子化技术,所述技术在其 70eV电子能量的最优模式中通常过度激发分析物分子,因而导致大部分母体离子进行快速 气相单分子分解。此产生典型的分析物"签名"频谱-母体离子的峰值及其碎片的混合物。 这些频谱被快速记录且被组织到所谓的MS库中,所述MS库直到今天一直用作质谱法的识 别工具。然而,电子撞击、气相离子化技术依赖于样本的前期蒸发,这只对于易失性低-中 等质量范围分析物分子来说容易实现。对于300Da以上的分析物,不但蒸发成问题,而且电 子撞击诱导的碎片化也变得更加复杂。
[0005] 产生"冷"分析物分子离子的现代"软"离子化技术(开始于化学离子化)的发现 解决了后离子化离解及即时频谱的复杂性的问题,但是也增加了母体离子同一性指派的不 确定性。在无背景解离的情况下,分析物分子离子的"签名"特征消失。但是化学离子化的 唯一真正发展是消除了后离子化解离。因为其是软技术的开始,所以科学家大致上用了十 年去寻找重新引入解离到质谱法中的方式-希望恢复"签名"特征作为解决分析物识别的 问题的工具。其呈现商业开发的串联质谱分析仪的形式:其中分析物分子离子的产生(在 空间或时间上)与其碎片化的事件分离的装置。
[0006] 在新的离子化技术的优点开创分析质谱法的新纪元之前的1975年与1985年之间 的大约十年中见证了化学(电荷转移)离子化的复兴。快速原子轰击(FAB)、电喷射离子 化(ESI)及基质辅助激光解吸离子化(MALDI)已结合质谱法分析中涉及的两个基本步骤: 蒸发及离子化,因此允许大分子的质谱分析。科学界用了大约十年来赶上所述技术,以分析 合成化学、药物学、生态学、生物学、食品科学等等中的基于质谱法的应用的当前剧增达到 巅峰。
[0007] 无论具有最终科学兴趣的化合物的物理或化学性质为何,质谱法的首要目标是建 立化合物的同一性。在最基本级别的识别下,需要确定离子的分子式(元素组合物成分)。 通过多阶段质谱法实验中的气相化学过程及/或结合"正交"技术(例如色谱法、电泳、离子 迀移、光谱学等等)可显示更高阶信息(分子结构、构造、稳定性等等)。对于相对较小的分 子,对同位素的确切质量及相对丰度的了解可能足以显示分子式信息,即使缺少背景碎片 化也是如此。在任何情况下,需要从先前建立的列表(数据库)参考潜在候选分子式或由 嵌套循环加法产生潜在候选分子式,因而实现不同类型的原子数的可能组合(碳、氧、氢等 等)以尝试匹配实验观察的质量与所需精确度。从历史观点来看,产生作为原子组合的公 式的后一种方法是唯一可用的方法。虽然所谓的"已知的未知"目标分析的前一种方法随着 已知化合物的数据库可为公众使用且继续增长而越来越流行,但是直到今天,在例如大的 聚合物合成的特殊应用中,由公共数据库提供的信息可能仍然不足以提供研宄人员需要的 识别基础。在此类情况下,质谱法专家仍然需要重新访问旧的公式生成方法以尝试将分子 式指派给实验观察的质谱峰值。不幸的是,当前公式生成器算法是基于嵌套循环且固有地 具有计算成本对以下项的指数相依性:(a)被假设包括潜在公式的原子类型的数目,及(b) 目标离子的质量。
[0008] 分子式生成模型的算法改善直到今天仍然极为相关,所述分子式生成模型作为一 种潜在方式来改善质谱调查的第一步骤:离子物种的原子成分的识别。

【发明内容】

[0009] 本发明提供一种软件工具,其用于从对应于未识别化合物的质谱法数据识别一或 多个候选化学式。通过以规定限制将候选公式的生成约束为具有重复单元及/或末端单 元的公式,所述软件工具可更加有效地反复搜索具有阈值容差内的匹配质谱法输出的化学 式。在另一方面中,提供一种软件工具,其用于至少部分基于中性丢失从质谱法数据识别一 或多个候选化学式。
[0010] 为辅助从质谱法数据识别未知聚合物化合物的速度及准确度,当未知化合物包含 重复单元及一或多个末端单元时,提供一种用于化学式识别的软件工具,所述软件工具根 据质谱法数据及额外数据识别一或多个候选结构,所述识别包含:(i) 一或多个候选重复 单元的识别;(ii)所述一或多个末端单元中的化学元素的集合的识别;及/或(iii)所述 一或多个末端单元中的最大数目的化学元素的识别(例如,每一化学元素的最大值或最大 总数的化学元素)。在一些实施方案中,软件工具提供一种用于执行以上识别的图形用户接 口。在一些实施方案中,软件工具用于识别具有重复至少三次的重复单元的未知聚合物物 种。通过以规定限制将候选公式的生成约束成具有重复单元及/或末端单元的公式,所述 软件工具可更加有效地反复搜索包含匹配阈值容差内的质谱法输出的重复单元加末端单 元结构的化学式。
[0011] 在一些实施方案中,软件工具接受重复单元结构(或其确切质量)及对一个或两 个末端单元的结构或成分的限制两者。例如,用户可将构成一个或两个末端单元的元素数 目限制为元素的最大数目(例如10)。在另一实例中,用户可将元素类型(例如元素物种) 限制为特定集合。
[0012] 在另一实施方案中,提供一种用于化学式识别的软件工具,其用于至少部分基于 中性丢失(两个质谱峰值之间归因于例如导致分子式丢失的前端化学过程或气相碎片化 的处理而出现的质量差)从质谱法数据识别化学式。此软件工具可增加准确度或关于以下 实例缩减化学式的潜在候选库:TOF质谱仪的毛细管-分离器区域中的碰撞诱导解离;成块 代谢物;前端化学反应(例如,质谱法之前的样本中的反应);及关于重复单元的确切质量 的聚合物同一性。在一些实施方案中,软件工具提供一种用于执行以上识别的图形用户接
[0013] 在另一实施方案中,提供一种用于化学式识别的软件工具,其用于通过以规定限 制将候选公式的生成约束成具有重复单元及/或末端单元的公式及通过识别和使用中性 丢失的测量缩减化学式的潜在候选库来从质谱法数据识别聚合物化合物。
[0014] 在一个方面中,本发明是针对一种识别包含两个或两个以上重复结构单元的未识 别化合物的物种的方法,所述方法包含存取质谱法数据的至少一部分,其中质谱法数据的 所述部分与包含所述未识别化合物的样本有关,其中所述未识别化合物包含(a)所述两个 或两个以上重复结构单元,及(b)至少一个末端单元。所述方法可包含确定以下项中的至 少一者:(a)所述重复结构单元的化学式,及(b)所述两个或两个以上重复结构单元的估计 分子量;及由计算装置的处理器至少部分基于所述质谱法数据且进一步部分基于以下项中 的至少一者识别所述未识别化合物的一或多个候选化学式:(a)所述重复结构单元的所述 化学式,及(b)所述估计分子量。
[0015] 在某些实施例中,所述两个或两个以上重复结构单元中的每一重复结构单元具有 相同化学式,且所述至少一个末端单元具有不同于所述两个或两个以上重复结构单元的所 述化学式的化学式。
[0016] 在某些实施例中,所述方法包含确定候选化学元素的集合,其中所述至少一个末 端单元中的任何末端单元的所述化学式是由候选化学元素的所述集合中的一或多个元素 组成。所述方法可包含确定候选化学元素的所述集合中的每一化学元素的最大数目,其中 所述至少一个末端单元中的任何末端单元的所述化学式是由不超过候选化学元素的所述 集合中的每一化学元素的最大数目的化学元素组成。识别用于所述未识别化合物的所述一 或多个候选化学式可包含进一步部分基于候选化学元素的所述集合识别用于未识别化合 物的所述一或多个候选化学式。
[0017] 在某些实施例中,所述方法包含从所述质谱法数据的所述部分识别所述未识别化 合物的估计分子量,其中识别用于所述未识别化合物的所述一或多个候选化学式包含进一 步部分基于所述未识别化合物的所述估计分子量识别用于所述未识别化合物的所述一或 多个候选化学式。识别用于所述未识别化合物的所述一或多个候选化学式可包含反复地添 加可能元素类型的组合以识别用于所述一或多个末端单元的多个潜在元素组合,其中所述 多个潜在元素组合中的每一潜在元素组合的计算分子量在与所述两个或两个以上重复单 元的所述估计分子量相加之后是在所述未识别化合物的所述估计分子量的阈值分子量内。 所述方法可进一步包含计算所述两个或两个以上重复单元的所述估计分子量。计算所述估 计分子量可包含计算所述一或多个候选化学式中的第一候选化学式的分子量及使所述第 一候选化学式的所述分子量乘以最大潜在的重复次数。
[0018] 在某些实施例中,所述方法包含在识别所述未识别化合物的所述一或多个候选化 学式之后,对于所述一或多个候选化学式中的每一候选化学式:获得用于所述相应候选化 学式的质谱法数据;及比较用于所述相应候选化学式的所述质谱法数据的理论频谱数据与 质谱法数据的所述部分的实验频谱数据。所述方法可进一步包含部分基于比较所述一或 多个候选化学式中的每一候选化学式的所述质谱法数据的所述理论频谱数据与质谱法数 据的所述部分的所述理论频谱数据的至少一个相应结果,排序所述一或多个候选化学式。 所述方法可进一步包含对于所述一或多个候选化学式中的至少一个候选化学式,部分基于 比较所述至少一个候选化学式的所述质谱法数据的所述理论频谱数据与质谱法数据的所 述部分的所述实验频谱数据的相应结果,丢弃所述至少一个候选化学式中的第一候选化学 式。
[0019] 在某些实施例中,所述方法进一步包含在图形用户接口内向用户呈现所述一或多 个候选化学式。
[0020] 在一个方面中,本发明是针对一种系统,其包含处理器;及存储器,其上存储指令, 其中所述指令在执行时使得所述处理器存取质谱法数据的至少一部分,其中质谱法数据的 所述部分与包含未识别化合物的样本有关,其中所述未识别化合物包含(a)两个或两个以 上重复结构单元,及(b)至少一个末端单元。所述指令可使得处理器确定以下项中的至少 一者:(a)所述重复结构单元的化学式,及(b)所述两个或两个以上重复结构单元的估计分 子量。所述指令可使得处理器至少部分基于所述质谱法数据且进一步部分基于以下项中的 至少一者识别所述未识别化合物的一或多个候选化学式:(a)所述重复结构单元的所述化 学式,及(b)所述估计分子量。
[0021] 在某些实施例中,所述两个或两个以上重复结构单元中的每一重复结构单元具有 相同化学式,且所述至少一个末端单元具有不同于所述两个或两个以上重复结构单元的所 述化学式的化学式。
[0022] 在某些实施例中,所述指令进一步使得所述处理器确定所述一或多个候选化学式 中的第一候选化学式是到所述未识别化合物的中性丢失匹配,所述中性丢失匹配的所述确 定包含存取用于所述第一候选化学式的频谱数据,且对于所述频谱数据的多个频谱峰值中 的每一者来说:计算所述第一候选化学式的理论质量与对应于所述频谱峰值的相应实验质 量之间的相应质量差,及比较所述相应质量差与一或多个对应中性分子成分中的每一者的 质量以识别对应于所述频谱峰值的一或多个候选中性分子成分。所述频谱数据可包含碰撞 诱导解离(CID)质谱。识别至少所述第一候选化学式可包含识别第二候选化学式,所述指 令进一步使得所述处理器:确定所述第二候选化学式是到所述未识别化合物的中性丢失匹 配;及部分基于中性丢失匹配的类似度按到未知化合物的匹配排序所述第一候选化学式及 所述第二候选化学式。识别所述一或多个候选中性分子成分可包含识别所述一或多个候选 中性分子成分中的每一候选中性分子成分包含所述频谱峰值的所述相应实验质量的质量 测量准确度的范围内的相应质量。
[0023] 在某些实施例中,确定所述第一候选化学式是到所述未识别化合物的中性丢失匹 配可包含识别所述第一候选化学式的理想配比法允许所述一或多个候选中性分子成分中 的至少第一候选中性分子成分。识别所述第一候选化学式的理想配比法允许所述第一候选 中性分子成分可包含对于所述第一候选中性分子成分确定所述第一候选化学式中的每一 类型的原子数目大于所述候选中性丢失成分中的每一对应类型的原子数目。
[0024] 在一个方面中,本发明是针对一种其上存储指令的非暂时性计算机可读媒体,所 述指令在由处理器执行时使得所述处理器执行包含存取质谱法数据的至少一部分的操作, 其中质谱法数据的所述部分与包含未识别化合物的样本有关,其中所述未识别化合物包含 (a)两个或两个以上重复结构单元,及(b)至少一个末端单元。所述指令可使得处理器确定 以下项中的至少一者:(a)所述重复结构单元的化学式,及(b)所述两个或两个以上重复结 构单元的估计分子量。所述指令可使得处理器至少部分基于所述质谱法数据且进一步部分 基于以下项中的至少一者识别所述未识别化合物的一或多个候选化学式:(a)所述一或多 个候选化学式,及(b)所述估计分子量。
[0025] 在一个方面中,本发明是针对一种用于识别未识别化合物的物种的方法,所述方 法包含由计算装置的处理器存取包含所述未识别化合物的样本的质谱法数据、由所述处理 器至少部分基于所述质谱法数据识别用于所述未识别化合物的至少第一候选化学式、由所 述处理器存取用于所述第一候选化学式的频谱数据;及由所述处理器确定所述第一候选化 学式是到所述未识别化合物的中性丢失匹配。所述中性丢失匹配的所述确定对于所述频谱 数据的多个频谱峰值中的每一者来说可包含:计算所述第一候选化学式的理论质量与对应 于所述频谱峰值的相应实验质量之间的相应质量差,及比较所述相应质量差与一或多个对 应中性分子成分中的每一者的质量以识别对应于所述频谱峰值的一或多个候选中性分子 成分。
[0026] 在某些实施例中,所述频谱数据包含碰撞诱导解离(CID)质谱。识别至少所述第 一候选化学式可包含识别第二候选化学式。所述方法可进一步包含由所述处理器确定所述 第二候选化学式是到所述未识别化合物的中性丢失匹配;及由所述处理器部分基于中性丢 失匹配的类似度按到所述未知化合物的匹配排序所述第一候选化学式及所述第二候选化 学式。
[0027] 在某些实施例中,识别所述一或多个候选中性分子成分包含识别
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1