用于确定混合物谱中的谱成分存在的系统和方法

文档序号:6214452阅读:219来源:国知局
用于确定混合物谱中的谱成分存在的系统和方法
【专利摘要】本发明公开了一种系统和方法,用于检测一种混合物的谱中未知成分的谱和/或用于验证一种混合物的谱中疑似成分的存在。该系统和方法涉及使用算法执行一个包含混合中的这些目标谱和已知谱的回归分析,计算当该目标谱的系数为零时的一个残差,被称为提取谱,并且对比该提取谱和该目标谱。该系统和方法可以与化学计量学算法、多个已知谱、和/或多个目标谱一起使用。
【专利说明】用于确定混合物谱中的谱成分存在的系统和方法
[0001] 相关申请的交叉引用
[0002] 本申请要求于2012年5月31日提交的标题为"用于确定混合物的谱中的谱成分 存在的算法和方法"的共同未决的美国临时专利申请序列号61/653743的优先权,其披露内 容通过引用以其整体结合在此。
[0003] 所引用的专利和参考资料:
[0004] 以下文件和参考资料通过引用以其整体结合在此,霍尔特(Hoult)(美国专利 第5, 023, 804号)、伊瓦尔迪(Ivaldi)等人(美国专利第5, 308, 982号)、里特(Ritter) 等人(美国专利第7, 698, 098号)、博通吉奇-塞希奇(Botonjic-Sehic)等人(美国专 利申请第2011/0213746号)、K.田边(K. Tanabe)等人,分析化学47,118(1975),、彼得 R.格里菲思(Peter R. Griffiths)等人的"自加权相关系数以及它们对于测量谱相似性的 应用(Self-Weighted Correlation Coefficients and Their Application to Measure Spectral Similarity) ",应用波谱学(Appl. Spec.),第 63 卷,第 916 至 919 页(2009)、 "为使用一种谱搜索算法鉴别的混合物成分估计概率置信度(Estimating Probabilistic Confidence for Mixture Components Identified Using a Spectral Search Algorithm),', 应用波谱学,第66卷,第334-340页(2012)。

【技术领域】
[0005] 本发明涉及数据分析,并且更具体地是一种用于确定混合物的谱成分的系统和方 法。

【背景技术】
[0006] 将一种样品的谱与一个参考谱进行对比以验证或鉴别该样品在分析化学中是一 种常规做法。用于这个目的的这些类谱的实例包括但不限于红外谱、近红外谱、拉曼谱、质 谱、紫外-可见谱、以及核磁共振(NMR)谱。有很多用于这种谱对比的度量(metrics),包含 欧氏(Euclidian)距离、最大距离、以及相关系数。
[0007] 当对比纯样或成分的谱、或混合物的谱,其中该样品谱和参考谱包含相似浓度的 相同成分时,这些度量效果良好。当将一种混合物的样品谱与包含在该混合物中的一种纯 成分的参考谱进行对比时,或者与一种与该样品谱中成分相同但浓度不同的混合物的参考 谱进行对比时,它们却表现不佳,并且事实上可能表现非常糟糕。在本文中应该注意的是 "混合物"并不必定是指这些成分是物理混合的,而是它们都对该谱有贡献。
[0008] 当使用该术语谱(或这些谱)时,我们指的是如所测量原样的这些数据和/或是 所述数据的任何的后续数学转换,包含导数(包含一阶、二阶、三阶以及任何后续导数)、平 滑处理、基线校正等。
[0009] 本发明是一种改进的对比系统及方法,用于当一个样品谱为多种成分的混合物 时。这样一种混合物可包含已知存在的成分、疑似存在但其存在需确定的成分、需鉴别的未 知成分、或其任何组合。已知存在的这些成分可能已经通过任何方法得以鉴别,包含通过应 用以上提到的那些简单对比度量、或通过应用此处描述的对比方法。
[0010] 当要被鉴别或确认的成分的浓度相比其他成分的浓度较小时,与其他对比度量相 比本发明表现特别好。在某些情况下,当该样品谱中的两个或更多个成分为未知时,它也表 现良好。


【发明内容】

[0011] 这部分的目的是总结本发明的一些方面并且简略介绍一些优选实施方式。为避免 模糊这部分的目的可能进行了简化或省略。这样的简化或省略不是有意限制本发明的范 围。
[0012] 所有的参考资料,包含在本说明书中所引用的任何专利或专利申请都通过引用结 合在此。不承认任何参考资料构成现有技术。对这些参考资料的讨论陈述了其作者的主张, 并且诸位 申请人:保留怀疑所引用文件的准确性和针对性的权利。将会清楚理解的是,尽管 多个现有技术公开物被引用在此,但是此引用不承认这些文件中的任一个形成在现有技术 中的公知常识。
[0013] 确认的是术语"包括"可以(在不同的法律管辖范围内)被归为一种封闭性的或 开放性的意思。对于本发明的目的,并且除非另有注明,术语"包括"应有包含的意思-即, 将用来指包含不仅它直接引用的这些所列成分,还有其他非指定的成分或元素。当术语"包 括了"或"包括有"与一种方法或工艺中的一个或多个步骤相关地使用时,也将使用此理论。
[0014] 在一个方面,本发明是关于一种用于确定在一种混合物中的谱成分存在的方法, 所述方法包括执行一种回归分析,该回归分析包含目标谱以及一种混合物中存在的一个或 多个已知的其他成分谱,计算提取谱,其中所述提取谱为该目标谱的系数被设为零的情况 下的残差(residual),并且使用一种对比度量对比所述提取谱与所述目标谱。在另一个 方面,所述对比度量为一个相关系数、加权相关系数、欧氏距离和/或最大距离中的至少一 个。又另一个方面,所述加权相关系数中的这些权重不都相同。
[0015] 在另一个方面,它是关于对比所述提取谱与残差谱。在一个方面,所述方法以一种 迭代方式使用。在另一个方面,所述回归分析包括一个基线谱或其他成分的谱。在一个方 面,所述回归分析谱包括导数谱或乘以一个包络函数的导数谱。又另一个方面,它是关于使 用一个或多个回归系数来计算浓度。在一个方面,该方法进一步包括一种目标成分的多个 谱以及一种已知成分的多个谱中的至少一个。
[0016] 在另一个方面,在所述混合物中存在多个目标并且对于每个不同目标使用不同的 谱区。在一个方面,使用多个谱区。又另一个方面,一种鉴别的或目标成分的多个谱被因子 化,并且这些因子的一个子集包含在所述回归分析中。在另一个方面,对不同目标成分执行 两次或更多次回归分析。
[0017] 在一个方面,本发明关于该方法进一步包括将多个目标谱因子化,将这些要被分 析的谱和这些已知成分的谱投影到因子空间中,在该因子空间中执行所述回归分析,并且 在该因子空间中对比该提取谱和这些目标谱,或者将该提取谱投影回到该原始谱空间并且 在该原始谱空间中执行在该提取谱与这些目标谱之间的对比。
[0018] 在一个方面,该方面进一步包括对于数个成分中的每一个将数个目标谱分组成 簇,使用这些目标谱的平均值、全部目标谱或者使用在每个簇中这些目标谱的这些因子的 一个子集对每个簇中的这些目标谱执行所述回归分析,为每个簇计算提取谱并且对比这些 提取谱与目标谱的这些簇来确定该目标谱属于哪一个(如果有的话)簇。又另一个方面, 这些回归分析中包含一种已知成分的多个谱,或者这些回归分析中包含一种已知成分的多 个谱的因子载荷(factor loadings)的一个子集。在一个方面,使用一个相关系数、一个加 权的相关系数、一个欧氏距离、或最大距离执行这些对比。又另一个方面,它进一步包含对 比这些提取谱与这些残差谱。在另一个方面,这些回归分析包含一个基线谱或其他成分谱。 在一个方面,使用多个谱区。在另一个方面,该方法使用一个或多个回归系数来计算浓度。
[0019] 在一个发明,该方面包括对于数个目标成分中的每一个将数个目标谱因子化,将 这些因子分组成簇,将这些要被分析的谱和这些已知成分的谱投影到因子空间中;使用这 些目标谱的这些因子的平均值、或这些目标谱的全部这些因子,在该因子空间中对每个簇 的这些目标谱执行所述回归分析,为每个簇计算该提取谱,并且在该因子空间中对比这些 提取谱和目标谱,或者将这些提取谱投影回该原始谱空间并且在该原始谱空间中在这些提 取谱与这些目标谱之间执行对比,以确定该目标谱属于哪一个(如果有的话)簇。
[0020] 在另一个方面,该回归分析中包含一种已知成分的多个谱。又另一个方面,使用一 个相关系数、一个加权的相关系数、一个欧氏距离、或一个最大距离。在一个方面,它进一步 包括对比这些提取谱与这些残差谱。又另一个方面,这些回归分析包含一个基线谱或其他 成分谱。在另一个方面,使用多个谱区。在另一个方面,该方法包括使用一个或多个回归系 数来计算浓度。
[0021] 在一个方面,本发明是关于一种用于存储计算机代码的非瞬时性计算机可读存储 介质,该计算机代码用于一种用于确定混合物中谱成分的存在的方法,所述方法包括执行 一种回归分析,该回归分析包括目标谱以及在一种混合物中存在的一个或多个已知的其他 成分谱;计算所述提取谱,其中所述提取谱为该目标谱的系数被设为零的情况下的残差; 以及使用一种对比度量来对比所述提取谱与所述目标谱。
[0022] 通过结合附图对以下一个本发明实施方式的详细说明的查看,本发明的其他特征 和优点将变得清晰。

【专利附图】

【附图说明】
[0023] 图1根据本发明的一个示例性实施方式展示了在水蒸气的存在下IOOppm的氧化 亚氮(NO)的谱(虚线)以及水蒸气的谱(实线)的图示。
[0024] 图2根据本发明的一个示例性实施方式展示了在水蒸气的存在下IOOppm的NO的 谱(实线)以及该残差谱(虚线)的图示。
[0025] 图3根据本发明的一个示例性实施方式展示了 NO的目标谱(虚线)以及提取谱 (实线)的图示。
[0026] 图4展示了用于计算NO的部分相关系数的这些残差谱的图示。
[0027] 图5A-5C展示了来自在IOOppm的NO样品谱中一氧化碳和一氧化二氮的分析的这 些谱的图示。图5A为一氧化二氮的目标谱(虚线)以及来自第二次分析的提取谱(实线)。 图5B为一氧化碳的目标谱(虚线)以及来自第一次分析的提取谱(实线)。图5C为样品 谱。以上均为根据本发明的示例性实施方式。
[0028] 图6根据本发明的一个示例性实施方式展示了使用拉曼谱仪采集到的一个瓶内 的药品的水溶液的谱(实线)、该瓶的谱(虚线)、水的谱(点虚线)、以及该药品的目标谱 (点线)的图示。
[0029] 图7A-7C展示了来自一个瓶中的药品的水溶液的拉曼谱的分析的这些目标谱 (7A)、提取谱(7B)以及残差谱(7C)的图示。以上均为根据本发明的示例性实施方式。
[0030] 图8根据本发明的一个示例性实施方式展示了来自于未转换的数据(底)的该药 品(顶)目标谱以及该提取谱的图示。
[0031] 图9-10展示了混合物谱的实例簇,图9,以及目标成分的谱,图10。
[0032] 从以下详细说明、附图、以及所附权利要求书中,本领域的普通技术人员将会领会 和理解上述以及其他特征。

【具体实施方式】
[0033] 为提供对本发明的全面理解,现在将说明某些说明性实施方式和实例。然而,本领 域的普通技术人员将会理解的是相同或等价的功能和顺序可以通过不同的实施方式完成, 这些实施方式也旨在包含于本披露的精神和范围内。这里描述的这些组合物、仪器、系统和 /或方法可以被适配并修改为对于试图解决的应用而言是适当的,并且这里描述的那些可 以用于其他合适的应用,并且这样的其他的添加和修改将不背离本发明范围。
[0034] 在一个实施方式中,使S为一种样品的谱,该样品由具有谱K1. .. Kn的η个成分组 成。假设服从比尔-朗伯定律,该样品谱可被建模为:

【权利要求】
1. 一种用于确定混合物中谱成分的存在的方法,所述方法包括: 执行一种回归分析,该回归分析包括目标谱以及在一种混合物中存在的一个或多个已 知其他成分谱; 计算提取谱,其中所述提取谱为在该目标谱的系数被设为零的情况下的残差;以及 使用一种对比度量来对比所述提取谱与所述目标谱。
2. 如权利要求1所述的方法,其中: 所述对比度量为相关系数、加权的相关系数、欧氏距离或绝对最大距离中的至少一个。
3. 如权利要求2所述的方法,其中: 在所述加权的相关系数中的这些权重不都相同。
4. 权利要求1所述的方法,进一步包括: 对比所述提取谱与残差谱。
5. 权利要求1所述的方法,其中: 其中所述方法以一种迭代的方式使用。
6. 权利要求1所述的方法,其中: 所述回归分析包含一个基线谱或多个其他成分谱。
7. 权利要求6所述的方法,其中: 所述回归分析谱包含导数谱或者乘以一个包络函数的导数谱。
8. 权利要求1所述的方法,进一步包括: 使用一个或多个回归系数来计算浓度。
9. 权利要求1所述的方法,其中所述回归分析包括: 一种目标成分的多个谱中的至少一个,以及 一种已知成分的多个谱。
10. 权利要求1所述的方法,其中: 使用多个谱区。
11. 权利要求1所述的方法,其中: 将一种被鉴别的或目标成分的多个谱因子化,并且这些因子载荷的一个子集被包含在 所述回归分析中。
12. 权利要求1所述的方法,其中: 对不同的目标成分执行两次或更多次回归分析。
13. 权利要求12所述的方法,其中: 所述混合物内存在多个目标成分并且对于每个不同的目标成分使用不同的谱区。
14. 权利要求1所述的方法,进一步包括: 对于数个目标成分中的每一个,将数个目标谱分组成为簇; 使用这些目标谱的平均值、全部这些目标谱、或者每一个簇中的这些目标谱的这些因 子的一个子集,对于每个簇中的这些目标谱执行所述回归分析; 对于每一个簇计算该提取谱;以及 对比这些提取谱与目标谱的这些簇以确定该目标谱属于哪一个,如果有的话,簇。
15. 权利要求14所述的方法,其中: 一种已知成分的多个谱被包含在这些回归分析中,或者一种已知成分的多个谱的因子 载荷的一个子集被包含在这些回归分析中。
16. 权利要求14所述的方法,其中: 使用相关系数、加权的相关系数、欧氏距离、或最大绝对距离执行这些对比。
17. 权利要求16所述的方法,其中: 对比这些提取谱与残差谱。
18. 权利要求14所述的方法,其中: 这些回归分析包含一个基线谱或其他成分谱。
19. 权利要求14所述的方法,其中: 使用多个谱区。
20. 权利要求14所述的方法,进一步包括 使用一个或多个回归系数来计算浓度。
21. 权利要求1所述的方法,进一步包括: 对于数个目标成分中的每一个,将多个目标谱因子化; 将这些因子分组成簇; 将要分析的这些谱以及这些已知成分的谱投影到因子空间中; 使用这些目标谱的这些因子载荷的平均值、或者这些目标谱的全部因子载荷,对于该 因子空间中的每一个簇中的这些目标谱执行所述回归分析; 对于每个簇计算该提取谱;以及 在该因子空间中对比这些提取谱和这些目标谱,或者将这些提取谱投影回该原始谱空 间并且在该原始谱空间中执行这些提取谱与这些目标谱之间的对比,以确定该目标谱属于 哪一个,如果有的话,簇。
22. 权利要求21所述的方法,其中: 一种已知成分的多个谱被包含在该回归分析中。
23. 权利要求21所述的方法,其中: 使用相关系数、加权的相关系数、欧氏距离、或最大绝对距离执行这些对比。
24. 权利要求23所述的方法,进一步包括: 对比这些提取谱与残差谱。
25. 权利要求21所述的方法,其中: 这些回归分析包含一个基线谱或其他成分谱。
26. 权利要求21所述的方法,其中: 使用多个谱区。
27. 如权利要求21所述的方法,其中: 使用一个或多个回归系数来计算浓度。
28. -种用于存储计算机代码的非瞬时性计算机可读存储介质,该计算机代码用于一 种用于确定混合物中谱成分的存在的方法,所述方法包括: 执行一种回归分析,该回归分析包括目标谱以及在一种混合物中存在的一个或多个已 知其他成分谱; 计算提取谱,其中所述提取谱为在该目标谱的系数被设为零的情况下的残差;以及 使用一种对比度量来对比所述提取谱与所述目标谱。
【文档编号】G01J3/00GK104364624SQ201380027527
【公开日】2015年2月18日 申请日期:2013年5月30日 优先权日:2012年5月31日
【发明者】理查德·杰克逊, 王茜 申请人:理查德·杰克逊, 王茜
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1