用于从质谱法输出识别聚合物物种的方法及设备的制造方法_4

文档序号:8491730阅读:来源:国知局
控制314的选择可导 致呈现周期表的图形表示。通过选择个别元素,用户可允许及/或不允许来自包含在候选 化学式内的特定元素。
[0110] 使用实验化合物的质量及K个元素的预定集合,例如候选分子的质量%可被计算 为K个元素的子集的原子质量个别地乘以每一类型的元素(例如,C、H、F、0、N、Si等等) 的数目nk的和。在一些实施方案中,嵌套循环加法(例如,n= 0、1……N,k= 0、1…… K)用于反复通过元素的所有可能组合以识别具有质量M6xpOTiMtal的阈值距离内的质量的组 合。在一些实例中,各种算法实施方案可涉及确定反复结构之前的硬循环、递归及/或按原 子类型质量排序。
[0111] 在一些实施方案中,算法可涉及例如基于一般化学过程的多种规则及/或限制以 约束候选化学式选择中涉及的反复次数。例如,K个元素的集合可被约束成某些元素或元 素类型。在另一实例中,一个元素类型可与另一元素类型有关(例如,如果使用元素X,那么 不考虑涉及元素Y的化学式,或反之亦然)。
[0112] 无论化学式候选识别算法的特定实施方案如何,基于实验化合物的质量Mexpe,imental 及K个元素的预定集合识别候选的反复方法均固有地具有所涉及计算步骤对以下项的相 依性的指数本质:(1)目标离子,及(2)允许考虑的原子类型的数目。图3A内说明的所得 候选公式说明此方法对候选公式识别的限制。候选化学式302的第一集合(例如,其中选 自"化合物(PC) "数据库),如在化学式数据库下拉菜单312内选择。候选化学式302的第 一集合含有C40H32CIN0S的第一候选化学式302a及C38H25N5Ni的第二候选化学式302b。 如由第一候选化学式302的第一集合可知,第一候选化学式302均不含有聚合物的重复单 元(例如C2H6SiO)。因此,图3A说明当尝试使用严格意义上的反复匹配解决方案确定大质 量聚合物时出现误差的可能。
[0113] 在一些实施方案中,候选化学式302可以所排序的次序显示,例如所述次序是基 于频谱图案、质量及实验化学式的质谱法数据内的其它信息以及关于每一候选化学式的数 据(例如由下拉菜单312内选择的数据库供应)之间的最接近类似度。如说明,每一候选 化学式302与相应分数303及相应百万分率误差(ppM-误差)305相关。例如,ppM-误差 305可基于单同位素峰值的用户规定的实验观察质量与候选化学式质量数据(例如,如获 自化学式数据库)的比较而确定。在一些实施方案中,PPM-误差305在计算之后接着可即 刻由系统(例如,关于图1描述的质谱法数据分析仪112)使用以缩减所得候选。例如,可 从结果列表丢弃具有在ppM误差截止307以外的ppM-误差305的每一候选化学式。
[0114] 在一些实施方案中,以某种方式计算相应分数303以分离候选的价值与对由特定 数据库提供的数据的相依性。例如,相应分数303最初可基于根据以缩放成单位一的质量 误差分布函数中的质量准确度截止(例如,如由系统默认设置或如由用户提供,例如在主 窗口 300的ppM误差截止栏307内)的单同位素峰值的实验观察质量。换句话来说,相应 分数303将具有值1以指示实验数据与候选化学式之间的完全匹配。具有除了零以外的质 量残差的候选化学式在此实例中将被给予小于1的相应分数303。
[0115] 在一些实施方案中,相应分数303进一步通过相对于同位素丰度构造第二分数值 而完善。例如,累加绝对误差截止(例如,由系统提供的默认值或由用户在同位素累加西格 玛(sigma)数据栏309内规定的值)可用作单侧缩放为单位1的以零为中心的正态分布的 西格玛参数。根据所述分布取得的相对同位素丰度的差可提供候选分子式的理论计算相对 同位素丰度与实验相对同位素丰度之间的相对测量匹配。结合基于质量的分数值及基于同 位素丰度的分数值两者,在一些实施方案中,获得相应分数303。例如,所述两个值可被视为 正交坐标以依据缩放为单位1的欧几里得(Euclidian)距离计算最终分数。
[0116] 在一些实施方案中,默认控制313的选择可导致设置默认电荷载子、默认ppM误差 截止307及/或默认同位素累加西格玛百分数309中的一或多者。
[0117] 在图形比较窗格308中,实验频谱图案310a被候选图案310b覆盖。例如,候选图 案310b说明C40H32CIN0S的第一候选化学式302a的频谱图案(例如,在候选化学式302 的列表内上方以高亮显示说明)。
[0118] 在一些实施方案中,实验频谱图案310a的值与图形比较窗格308上方说明的同位 素丰度311的集合有关。在一些实施方案中,同位素丰度311可例如基于被提供给系统的 质谱法数据而自动识别。例如,对于所提供频谱内的每一同位素峰值,系统(例如,如关于 图1描述的质谱法分析仪112)可导入相应同位素丰度311。在一些实施方案中,用户可被 提供机会来手动输入或手动调整同位素丰度311。
[0119] 除了图形比较窗格308内提供的图形说明以外,在一些实施方案中,还提供关于 C40H32CIN0S的实验频谱图案310a与候选图案310b的比较的详细信息。例如,参考图3B, 紧邻主窗口 300呈现公式统计窗口 316。公式统计窗口 316提供绝对误差距离图表318、 PPM-分数图表320及同位素-分数图表322。如上文关于图3A的分数303讨论,在一些实 施方案中,分数303说明质量误差分数及同位素丰度误差分数的组合。例如,绝对误差距 离图表318可说明分数303a的第一部分(例如,同位素误差)的相对值,而ppM-分数图表 320可说明分数303a的第二部分(例如,质量误差)的相对值。在此实例中,同位素-分数 图表322可说明分数303a(例如,0. 655)的图形表示。
[0120] 参考图3C,在一些实施方案中,公式生成器窗口 330用于供应关于涉及重复单元 加末端单元的化学式的设置数据。例如,公式生成器窗口 300可用于将设置数据116提供 给如关于图1描述的公式生成器112b。公式生成器窗口 330包含用于选择重复单元的下拉 菜单332。例如,下拉菜单332的内容可部分基于重复单元的目标质量(例如下拉菜单332 上说明的目标质量334)而选择。在一些实施方案中,目标质量334是源自于关于实验化学 式的质谱法数据。虽然被说明为下拉菜单332,但是在一些实施方案中,用户具有手动输入 重复单元的化学式的选择权。
[0121] 在下拉菜单332下方,说明一系列化学元素334,包含最小数目338、最大数目340 及TypMax342。最小数目338及最大数目340可经设置以规定实验化学式的末端单元可 含有的每一元素的数目的范围。例如,用户已选择末端单元可含有以下元素中的每一者的 0个元素与2个元素之间:碳336a、氟336b、氢336c、氮336d、氧336e、硫336f、氯336g、溴 336h、碘336i、磷336j及硅336k。没有选择以下元素且因此以下元素可能不会包含在任一 末端单元内:钠3361、钾336m及钙336n。在一些实施方案中,TypMax342列内说明的值识 别每一化学元素的典型最大值,最大值是例如通过基于化学过程的约束而推导(例如,经 由关于已知聚合物化合物的末端单元的成分的化学文献推导出的限制)。例如,在识别关于 每一化学元素的最大数目时,TypMax342值可被用户用作指南。
[0122] 如说明,基于公式生成器窗口 330内的设置,主窗口 300含有候选化学式302的新 集合,包含(C2H60Si)8H101的第一候选化学式302a及(C2H60Si)7C2F2HlN2的第二候选化 学式302b。如上文关于图3A讨论,每一候选化学式302与相应分数303及相应ppM-误差 305相关。不幸的是,每一分数303及ppM-误差305如果没有比关于图3A呈现的候选化学 式更糟糕,那么便与所述候选化学式一样具有缺陷。在此情形中,用户可重新访问设置数据 以继续与所述程序交互以识别具有高匹配可能性的候选化学式。
[0123] 因为候选化学式302仍然不在取得"匹配"资格的范围内,所以参考图3D,用户可 倾向于单独确定关于重复单元的统计数据以更好地识别适当末端单元的化学式。用户可运 行关于实验化学式的多个重复单元的比较。如公式生成器窗口 330中说明,化学式输入栏 350含有(C2H6SiO) 8的化学式。换句话来说,用户确定8次重复的重复单元是否接近实验 化学式的质量。例如,用户可选择"检查"控制352以获得关于(C2H6SiO)8的化学式的结 果。如图形比较窗格308上方说明,响应于激活"检查"控制352,8次重复的重复单元结构 的质量354被计算为592. 1503Da。基于此信息,用户可推理:胺基(NH4+)的电荷载子可比 质子(H+)的先前尝试的电荷载子更加合适。在典型的情形中,电荷载子是样本化学性质 (例如,盐度、酸度等等)、离子化技术类型及模式的特性。当作用于已知分析物时,例如立 即显示电荷载子。在图3D中说明的特定实例中,用户可能已进行文献搜索以识别NH4+作 为电荷载子的可能性。
[0124] 参考图3E,电荷载子304已变为胺基(NH4+)。如主窗口 300内说明,候选化学式 302的列表包含氨化八聚物(C2H60Si)8的排名第一的候选化学式302a。
[0125] 在一些实施方案中,在选择候选化学式302中的一者后,即刻显示化学结构选择 器370,因而提供一或多个候选化学结构372。参考图3F,基于氨化八聚物(C2H60Si) 8的候 选化学式302a,说明两个候选化学结构372。在一些实施方案中,化学结构选择器370呈现 在单独浏览单元内。例如,当主窗口 300、公式统计窗口 316及公式生成器窗口 330可由质 谱法数据分析仪112呈现时,化学结构选择器370可由凭借化学结构数据存储区106 (例如 商用数据库系统、政府数据库系统或标准组织数据库系统)提供的引擎呈现。候选化学结 构372无需以特定次序排序。例如,除非候选化学结构372之间的相异(例如缺少碎片化 或保留时间)可用来推导候选化学结构372之间的优先级,否则候选化学结构372可被视 为各自同等可行。例如,用户可就关于实验化合物的额外信息(例如在一些实例中,气相化 学性质、色谱及离子迀移)查看关于候选化合物的结构的其它类型的信息。
[0126] 在一些实施方案中,候选化学结构是至少部分基于中性丢失估计。中性丢失实用 程序基于匹配于数据库的母体离子的单同位素质量及同位素图案输出母体离子的候选分 子式的列表。用户可设置测量的质量准确度的容差以及同位素比测量中的置信度。这些容 差使得用户能够筛选出所提出分子式。在选择候选分子式中的一者后,中性丢失实用程序 搜索频谱的峰值列表,因而计算所提出公式的理论质量与多个频谱峰值中的每一者的实验 质量之间的质量差。对于每一频谱峰值,比较所观察质量差与数据库中的分子成分的质量。 报告潜在中性丢失匹配,前提是(i)分子的实验中性丢失与理论质量之间的差小于由用户 设置的质量测量准确度,及(2)选定母体离子候选分子的理想配比法允许所提出中性丢失 候选,即,包括中性丢失候选的每一类型的原子的数目在当前母体离子候选中是相等或更 大的。
[0127] 图4A及4B说明用于部分基于中性丢失识别化学式的实例方法400的流程图。
[0128] 在一些实施方案中,方法400开始于获得候选化学式(402)。
[0129] 在一些实施方案中,获得实验化合物的质谱法数据(402)。
[0130] 在一些实施方案中,识别用于候选化学式的理论质谱数据(406)。
[0131] 在一些实施方案中,计算候选化学式的单同位素峰值的理论质量与所有其它频谱 峰值的实验质量之间的质量差(408)。
[0132] 在一些实施方案中,对于每一频谱峰值,比较所计算质量差与多个中性分子成分 的质量(410)。
[0133] 如果在比较期间确定关于特定中性分子成分的质量差小于质量测量准确度设置 (412)且进一步确定中性分子成分的理想配比法与候选化学式匹配(414),那么在一些实 施方案中,特定中性分子成分被识别为中性丢失匹配(416)。在一些实施方案中,两个或两 个以上中性分子成分可被识别为与特定候选化学式的中性丢失匹配。
[0134] 在一些实施方案中,如果关于两个或两个以上候选化学式执行方法400(418),那 么对于每一候选化学式,可重复步骤406到416。
[0135] 参考图4B,在推论出识别所述一或多个中性丢失匹配后,在一些实施方案中,可即 刻部分基于中性丢失匹配的结果排序候选化学式(420)。并非部分基于中性匹配结果排序 或除了部分基于中性匹配结果排序以外,在一些实施方案中,可基于没有识别中性丢失匹 配而从候选化学式丢弃一或多个候选化学式。
[0136] 在一些实施方案中,可向用户呈现候选化学式(422)。在一些实施方案中,中性丢 失匹配信息可包含在所述呈现内。
[0137] 虽然方法400被说明为特定步骤系列,但是在一些实施方案中,可包含更多或更 少步骤。此外,在一些实施方案中,可以不同于上述次序的次序执行步骤中的一或多者。在 不违背方法400的精神及范围的情况下,其它修改是可能的。
[0138]图5A及5B是用于使用中性丢失方法识别化合物的系统的实例用户接口的屏幕截 图。在一些实施方案中,屏幕截图可由关于图1描述的质谱法数据分析仪112产生。例如, 屏幕截图中呈现的信息的一部分可由关于图1描述的中性丢失计算器112c产生。
[0139] 参考图5A,主窗口 500说明用于基于质谱法数据的分析识别一或多个候选化学式 的实例用户接口。在一些实施方案中,候选化学式的识别包含例如如关于图1的化学式识 别器112a描述的直接反复分析。在一些实施方案中,候选化学式的识别包含基于重复单元 部分的质量的分析及潜在末端单元成分(例如如关于就图1描述的公式生成器112b描述) 的识别。在选择主窗口 500内的"找出公式"控制502时,例如,可识别一或多个候选化学 式。如说明,识别一个候选公式504。
[0140] 在右上角中,已激活CID(碰撞诱导解离)复选框506。归因于CID复选框506的 激活,在一些实施方案中,中性丢失匹配过程可关于质谱法数据分析候选化学式504。例如, 所述分析可包含类似于关于图4A描述的方法400的一部分的过程。
[0141] 基于潜在中性丢失匹配的识别,在一些实施方案中,向用户呈现频谱接口。参考 图5B,中性丢失频谱分析屏幕520包含一系列峰值522。关于峰值522,可以相应中性丢失 公式524识别匹配中性分子成分的任何所识别碎片。注意,峰值522g与3个中性丢失公式 (即,524d到524f)相关。
[0142] 以下实例检查TOF(飞行时间)质谱的毛细管-分离器区域中的碰撞诱导解离。获 得具有CID碎片化的未知化合物的质谱。使用上文关于图2A到2C描述的设施,识别未知 化合物的候选。呈现选定候选的碰撞诱发解离(CID)质谱(例如,理论质谱数据)。通过搜 索数据库预测并显示质谱中的每一峰值的中性丢失的元素成分。通过从母体(候选)元素 成分减去中性丢失所提出的元素成分,可指派测量的质谱峰值中的每一者
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1