用于从质谱法输出识别聚合物物种的方法及设备的制造方法_3

文档序号:8491730阅读:来源:国知局
T)维护的分子频谱数据库。在一些实施方案中,质谱法数据分析仪112可 设置默认化学式数据库(例如,内置数据库或特定公共数据库)。
[0067] 在一些实施方案中,阈值方差设置限制候选化学式的数目。在一些实施方案中,用 户可设置百万分率(PPM)误差截止。在一些实例中,ppM误差截止可被设置成20ppM、10ppM、 5ppM或3ppM。在一些实施方案中,ppM截止是基于所执行的质谱法分析的类型而选择。例 如,对于飞行时间质谱仪,可输入3ppM的合理ppM截止。在一些实施方案中,化学式识别器 112a例如基于质谱法数据110内含有的信息确定ppM截止。在其它实施方案中,用户可设 置ppM截止误差。
[0068]在一些实施方案中,化学式识别器112a反复地搜索化学式以识别包含类似于质 谱法数据110的数据(例如,相对原子质量、类似同位素总数、类似同位素的相对强度等) 的结构。例如,被提供给化学式识别器112a的设置数据可包含元素子集,其中任何候选化 学式被限制成由所述元素子集构成的化学式。代替元素子集或除了元素子集以外,在另一 实例中,设置数据116可包含元素的最大数目,其中候选化学式被限制成由小于或等于元 素的最大数目的总数个元素构成的化学式。在另一实例中,设置数据116可包含用于化学 式的候选电荷载子。
[0069]在一些实施方案中,化学式识别器112a基于实验化合物的质量(例如,如从质谱 法数据110确定)及元素(例如,C、H、F、0、N、Si等等)的预定集合识别一或多个候选化 学式。例如,使用此信息,候选化学式的质量可被计算为预定集合元素的子集的原子质量的 和,其中元素子集中的每一者可一或多次包含在候选化学式内。在一些实施方案中,使用嵌 套循环加法来反复访问元素的所有可能组合以识别具有实验化合物的质量的阈值距离内 的质量的组合。
[0070]在一些实施方案中,设置数据116可包含候选部分。在一些实施方案中,候选部分 是由用户选自例如源自于从化学式数据存储区106检索的化学式数据118的候选部分120 的集合。例如,化学式数据存储区106可包含例如由国家生物技术信息中心(NCBI)维护的 PubChem化合物数据库的数据库,所述数据库含有约2600万种化合物及130万个独特分子 式。在另一实例中,化学式数据存储区106可包含例如由国家标准技术局(NIST)维护的分 子频谱数据库的数据库。在其它实施方案中,用户输入(例如,键入、绘制化学式、拖放化学 式等等)候选化学部分。
[0071] 在一些实施方案中,候选部分是由用户指定为用于由重复单元加末端单元构成的 化学式的重复单元。例如,重复单元可为已知聚合物的重复单元。响应于识别质谱法数据 110为包含重复单元(例如,在设置数据116或由计算装置108的用户提供的先前数据中), 在一些实施方案中,可基于重复单元的估计分子量推导出候选部分120。例如,已知样本包 含具有重复单元的聚合物物种,可从质谱法数据估计聚合物物种的重复单元部分的相对质 量。在特定实例中,质谱仪输出包含具有具备近似76道尔顿(Da)的分子质量的重复单元 的聚合物的频谱图案特性。手动或部分自动识别方法可用来匹配76Da的分子质量与聚二 甲基硅氧烷(例如C2H6Si0)的候选重复单元。
[0072]在识别重复单元的候选部分的情形中,在一些实施方案中,可调用公式生成器 112b以确定包含候选重复单元加末端单元结构的一或多个匹配化学式。在一些实施方案 中,用户被提供机会来限制末端单元的化学式以(例如)增加由软件工具识别化学式的速 度及/或准确度。在一个实例中,用户将末端单元限制为最大数目的化学元素(例如,如由 设置数据116指定)。在一些实施方案中,公式生成器112b假设每一末端单元具有相似化 学成分。在其它实施方案中,每一末端单元的化学成分可不断改变。
[0073]公式生成器112b部分基于候选部分120确定一或多个候选化学式122 (例如,候 选聚合物结构)。类似于化学式识别器112a的功能,公式生成器112b在一些实施方案中基 于实验化合物的质量(例如,如从质谱法数据110确定)及元素(例如,C、H、F、0、N、Si等 等)的预定集合识别一或多个候选化学式。然而,因为立即基于候选部分120解释大部分 实验化合物的质量,所以只需要确定实验化学式的末端基团中的每一者的成分。在一些实 施方案中,用户识别包含在实验化合物内的候选部分120的估计反复次数。在其它实施方 案中,公式生成器112b确定候选部分120的默认反复次数(例如,不超过实验化合物的质 量的候选部分120的质量的最大反复次数,如经由质谱法数据110确定)。在一些实施方案 中,公式生成器112b被提供重复单元的估计质量或重复单元的总质量(例如,包含实验化 合物内涉及的所有反复),而不是识别候选部分。以任一方式,基于所提供信息,公式生成器 112b可以已知质量的"超级原子"开始识别过程。
[0074] 此外,因为公式生成器112b识别建置在候选部分120上的潜在末端基团组合,所 以与由化学式识别器112a使用的算法相比,可大幅减小元素的预定集合中的元素的每一 类型的最大数目。例如,大的生物分子(例如聚合物)的末端基团可被假设化学元素的预 定集合中的每一者含有的元素不超过X个,其中X可基于已知化学性质而在不同元素之间 有所变化。在一些实施方案中,用户被提供机会来设置包含在候选化学式的末端基团内的 每一化学元素的最大数目。在一些实施方案中,元素的预定集合的每一元素的最大数目可 被识别为公式生成器112b内的默认设置。
[0075] 在一些实施方案中,除了基于重复单元确定候选化学式以外或代替基于重复单元 确定候选化学式的是,质谱法数据分析仪112经配置以基于中性丢失估计来识别一或多个 候选化学式。在一些实施方案中,中性丢失计算器112c可根据质谱法数据110分析候选化 学式以基于中性丢失理论识别潜在匹配。在本文中,中性丢失是指两个质谱峰值之间归因 于例如导致分子式丢失的前期化学过程或气相碎片化的处理而出现的质量差。分子式丢 失可归属于至少一个现有且已报告的中性稳定分子。在一些实施方案中,中性丢失计算器 112c从化学式识别器112a或公式生成器112b接收一或多个候选化学式。例如,中性丢失 计算器112c可用来完善所得候选化学式。在基于中性丢失计算分析候选化学式时,例如, 候选化学式的初始列表可经缩减以提供更准确结果及/或经重新排定优先级以促进候选 化学式关于中性丢失概念最佳地匹配质谱法数据110。
[0076]中性丢失计算器112c原则上可基于任何两个质谱峰值之间的质量差针对与质谱 法数据110的潜在匹配而分析候选化学式。在一些实施方案中,中性丢失计算器从化学式 识别器112a或公式生成器112b接收一或多个候选化学式。在一些实施方案中,用户选择 候选化学式以用于中性丢失计算。在一些实例中,可从经由化学式识别器112a或公式生成 器112b提供的结果列表、通过从数据库选择化学式及/或通过手动输入候选化学式来选择 候选化学式。
[0077] 开始于实验化合物(例如,如质谱法数据110内识别)及特定候选化学式,在一些 实施方案中,中性丢失计算器112c识别与候选化学式相关的频谱数据。例如,频谱数据可 通过化学结构数据118而获得。在一些实施方案中,中性丢失计算器112c搜索包含在质谱 法数据110内的频谱的峰值列表,因而计算候选化学式频谱的理论质量与获自质谱法数据 110的所有其它频谱峰值的实验质量之间的质量差。对于每一频谱峰值,例如,中性丢失计 算器112c可比较(例如,候选分子式频谱与获自质谱法数据110的所观察质量之间计算 的)差与已知分子成分的质量。例如,分子成分可被识别为中性分子成分。在一些实施方 案中,分子成分是获自数据库,例如由NCBI维护的PubChem化合物数据库或由NIST维护的 分子频谱数据库。在一些实施方案中,用户提供中性分子成分的列表或缩减中性分子成分 的初始列表。
[0078] 在一些实施方案中,由于中性丢失计算器112c实施的比较,可识别一或多个潜在 中性丢失匹配。例如,可基于特定分子成分的实验中性丢失与理论质量之间的差小于质量 测量准确度阈值来识别中性丢失匹配。例如,质量测量准确度阈值可包含默认设置或由用 户供应的设置。此外,在一些实施方案中,中性丢失计算器112c可确定特定分子成分的理 想配比法允许所提出的中性丢失候选。例如,此确定可基于构成特定分子成分的元素的每 一类型的元素数目小于或等于发生在候选化学式中的此类型元素的原子数目。
[0079] 在一些实施例中,代替尝试指派化学式候选给峰值列表中的所有频谱峰值的是, 中性丢失计算器112c尝试指派中性丢失给特定分子成分与所观察(潜在)碎片之间的质 量差。
[0080] 在识别一或多个候选化学式122之后,在一些实施方案中,质谱法数据分析仪112 即刻向用户呈现候选化学式122。例如,用户可在计算装置108的图形用户接口内被提供一 系列可选择化学式,例如第一聚合物结构122a。除了化学式的列表以外,在一些实施方案 中,质谱法数据分析仪112提供质谱法数据与候选化学式的质谱法值的数值及/或图形比 较。在选择候选化学式中的一者后,例如,关于选定化学式的数据可覆盖在质谱法数据的图 形分析上。在另一实例中,度量可被呈现给用户,说明质谱法数据110及候选化学式122的 频谱特征之间的误差的裕度。关于图3A到3F说明用于提供设置数据116且查看候选化学 式122的实例用户接口。
[0081] 图2A到2C是用于从质谱法输出识别聚合物物种的实例方法的流程图。在一些实 施方案中,实例方法可由关于图1描述的公式生成器112b执行。
[0082] 参考图2A,用于从质谱法输出识别聚合物物种的第一方法200涉及部分基于实验 聚合物化合物的重复单元部分的质量确定一或多个候选化合物。
[0083] 在一些实施方案中,方法200开始于获得实验化合物的质谱法数据(202)。
[0084] 在一些实施方案中,识别实验化合物的质量(204)。
[0085] 在一些实施方案中,确定重复单元的质量(206)。
[0086] 在一些实施方案中,识别一或多个候选化合物(208)。
[0087] 在一些实施方案中,提供所述一或多个候选化合物以显示于用户(210)。
[0088] 虽然方法200被说明为特定步骤系列,但是在一些实施方案中,可包含更多或更 少步骤。此外,在一些实施方案中,可以不同于上述次序的次序执行步骤中的一或多者。在 不违背方法200的精神及范围的情况下,其它修改是可能的。
[0089] 参考图2B及2C,用于从质谱法输出识别聚合物物种的第二方法220涉及识别聚合 物的末端单元的可能原子类型及计算原子组合以识别实验化合物的实验质量的阈值距离 内的候选聚合物公式。
[0090] 在一些实施方案中,方法220开始于接收设置数据(222)。
[0091] 在一些实施方案中,识别包含于候选化学式的末端单元中的可能原子类型的集合 (224) 〇
[0092] 在一些实施方案中,识别与可能原子类型的集合的每一原子类型相关的最大数目 (226)〇
[0093] 在一些实施方案中,识别实验化合物的目标质量(228)。
[0094]如果重复单元的化学式被提供作为方法220的输入(230),那么在一些实施方案 中,计算重复单元部分的理论质量(232)。在一些实施方案中,所述计算可涉及使重复单元 的质量乘以重复单元的反复次数。如果重复次数没有被规定作为输入,那么在一些实施方 案中,方法220可识别初始重复次数。
[0095] 如果没有提供重复单元的化学式(230),那么识别重复单元部分的质量(234)。在 此情形中,重复单元部分的质量识别重复单元的总质量,包含重复单元的所有重复。
[0096] 在一些实施方案中,可能原子类型的组合反复相加以识别实验化合物的目标质量 的阈值内的具有总质量(包含重复单元部分的质量)的末端类型的所有潜在组合(236)。
[0097] 在一些实施方案中,如果最初基于所提供化学式计算重复单元的估计质量(238) 且在反复的一或多者中超过实验化合物的目标质量(240),那么使重复单元的目标化学式 的重复次数递减(242)。
[0098] 此时,方法220返回到使用减小的重复次数计算重复单元部分的理论质量(232)。 例如,如果在第一循环中,使用重复单元化学式质量的7个实例计算重复单元部分的理论 质量,那么第二循环将涉及基于重复单元化学式质量的6个实例计算理论质量。
[0099] 参考图2C,在完成所有反复后,在一些实施方案中,从潜在组合的集合识别候选化 学式(244)。
[0100] 在一些实施方案中,获得实验化合物的质谱法数据(246)。
[0101] 在一些实施方案中,识别候选化学式的理论质谱数据(248)。
[0102] 在一些实施方案中,比较候选化学式的理论质谱数据与质谱法数据(250)。
[0103] 如果识别额外候选化合物(252),那么对于每一候选化合物重复步骤(248)及 (250)〇
[0104] 在一些实施方案中,至少部分基于所述比较排序候选化学式(254)。
[0105] 在一些实施方案中,向用户呈现候选化学式(256)。
[0106] 虽然方法220被说明为特定步骤系列,但是在一些实施方案中,可包含更多或更 少步骤。此外,在一些实施方案中,可以不同于上述次序的次序执行步骤中的一或多者。在 不违背方法220的精神及范围的情况下,其它修改是可能的。
[0107]图3A到3F是用于从质谱法输出识别聚合物物种的系统的实例用户接口的屏幕截 图。所述屏幕截图描绘一系列用户交互,涉及匹配已知含有重复单元C2H6SiO的聚合物的实 验化学式。
[0108] 在一些实例中,重复单元C2H6SiO可由用户选择(例如,选自由所述程序提供以供 选择的常见化学式的列表或先前由用户输入到系统中的用户专用化学式的列表等等)、由 用户从单独模块拖放或由用户输入(例如,在文本输入控制中)。在一些实施方案中,用户 具有输入重复单元的质量的选择权,而不是具有输入重复单元的化学式的选择权。重复单 元的输入方法可取决于情形而改变。例如,在例如合成产物的分析研宄的许多情况下,研宄 人员足够了解样本历史(例如,合成设计)以仅仅使用所述程序来验证已建置预期聚合物 或确定已知(或疑似)聚合物重复单元的末端单元的成分。
[0109] 参考图3A,主窗口 300说明候选化学式302的第一集合。候选化学式302的第一 集合最初是通过设置质子(H+)的电荷载子304及选择"找出公式"控制306而选择。例如, 候选化学式302的第一集合可能已使用如关于图1描述的化学式识别器112a而推导。在 一些实施方案中,候选化学式302的第一集合中的每一候选公式302是基于实验化合物的 质量札!£1)__ 1及1(个元素(例如,(:、1^、0、队51等等)的预定集合而识别。在一些实施 方案中,用户可规定K个元素的预定集合。例如,通过选择元素控制314,可向用户呈现元素 选择接口以识别包含在候选化学式中的化学元素的子集。例如,元素
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1