用于化学分析的光谱数据处理的制作方法

文档序号:35270704发布日期:2023-08-30 14:34阅读:31来源:国知局
用于化学分析的光谱数据处理的制作方法

本发明涉及用于化学分析的光谱数据的处理。所述处理至少部分地基于(多种)基于机器学习的方法。


背景技术:

1、化学分析涉及对化学样品中的物质的化学成分和结构进行分析,并且它可能涉及使用化学分析设备进行定性分析和/或定量分析。

2、气相色谱-质谱仪是已知的化学分析设备。它将气相色谱仪和质谱仪相结合,并且用于鉴定针对不同应用(药物测试、食品安全相关测试、环境相关测试等)获得的化学样品中的不同物质。

3、当前可用的气相色谱-质谱仪通常与分析器(例如,计算系统)连接,所述分析器被布置成分析由气相色谱-质谱仪生成的光谱信号。分析器可以运行软件包或应用程序,诸如现有的amdis-nist软件,其使得用户能够分析、查看、调整或编辑光谱数据,以用于对样品执行定性和/或定量分析。在该过程中,输出的质量、定性和/或定量分析结果在很大程度上取决于用户在解释或以其他方式处理数据方面的专业知识和经验。而且,由于实验是独立执行的,因此习惯做法或偏好是独立处理相关联的数据处理。


技术实现思路

1、在第一方面,提供了一种用于操作光谱数据处理系统的方法。所述方法包括:接收与至少部分地使用机器学习处理模型处理化学样品的光谱数据相关联的用户输入;以及存储所述用户输入,以用于基于所述接收到的用户输入来训练所述机器学习处理模型。所述机器学习处理模型被布置在所述光谱数据处理系统的机器学习控制器中。对所述光谱数据的处理可以完全基于所述机器学习处理模型,或者可替代地,部分地基于所述机器学习处理模型并且部分地基于以下中的一个或多个:其它机器学习处理模型或非机器学习处理。所述机器学习控制器可以由一个或多个处理器形成,可选地具有一个或多个存储器或存储设备。所述方法是一种计算机实现的方法。所述机器学习处理模型可以被充分地预训练以适合于特定任务(例如,所述模型可以为该特定任务提供一定的准确性)。或者,所述机器学习处理模型可以是用于基线回测的未经训练的或训练不足的模型。非机器学习处理可以包括对光谱数据的各种信号处理,诸如滤波、分割、阈值化、求平均、平滑化、填充、变换、缩放等。

2、在一个实施方案中,所述方法进一步包括基于所述接收到的用户输入来训练所述机器学习处理模型。在一个例子中,所述接收到的用户输入被直接用于训练所述机器学习处理模型。在另一个例子中,与所述接收到的用户输入相关联的数据用于训练所述机器学习处理模型。

3、在一个实施方案中,所述方法进一步包括:在接收所述用户输入之前:至少部分地使用所述机器学习处理模型来处理所述光谱数据以提供处理结果。所述处理可以包括使用所述机器学习处理模型执行以下中的一个或多个或全部:光谱信号分割;光谱峰值检测;光谱峰值去卷积;以及化学组分相关信息确定。可以基于所述光谱信号分割、光谱峰值检测和/或光谱峰值去卷积来执行所述化学组分相关信息确定。所述化学组分相关信息确定可以确定所述化学样品中的仅一种、仅一些或所有化学组分。在一个例子中,基于所述机器学习处理模型来执行所有四个示例性操作。在一个例子中,基于所述机器学习处理模型来执行这些示例性操作中的仅一个或仅一些。所述化学组分相关信息确定可以包括以下中的一个或多个:化学组分类别鉴定;化学组分类型鉴定;化学组分鉴定;以及化学组分浓度确定。

4、在一个实施方案中,所述方法进一步包括:在接收所述用户输入之前:提供对所述光谱数据的处理的处理结果。在一个例子中,所述处理结果可以被提供给输出设备,诸如显示器,以呈现给用户。在一个实施方案中,提供所述处理结果包括提供以下中的至少一个:所述光谱数据的至少一部分的图形表示;以及与所述化学样品中包含的至少一种(一种或一些或所有)化学组分相关联的信息。所述图形表示可以是绘图、光谱、表格、热图等的形式。与所述化学组分相关联的信息可以包括所述至少一种化学组分的身份和/或所述至少一种化学组分中的每一种组分的浓度。

5、在一个实施方案中,所述方法进一步包括:在所述处理之前:从多个机器学习处理模型中选择所述机器学习处理模型。所述多个机器学习处理模型可以全部布置在所述机器学习控制器中。所述多个机器学习处理模型中的相应一个中的每个可以与相应类型或类别的化学样品、相应的化学分析系统、相应的地理位置、相应的用户(公司、个人等)相关联,并且所述选择可以是基于这些特性。

6、在一个实施方案中,所述用户输入表示对所述处理结果的正反馈。在一个例子中,基于所述接收到的用户输入(表示正反馈)对所述机器学习处理模型的训练包括基于所述光谱数据和所述处理结果对所述机器学习处理模型进行训练。在一个例子中,与所述接收到的用户输入(表示正反馈)相关联的数据被保留、加权或以其他方式用于所述机器学习处理模型的后续训练中。以这种方式,可以通过学习如用户所指示的正确的内容来增强所述机器学习处理模型。

7、在一个实施方案中,所述用户输入表示对所述处理结果的负反馈。在一个例子中,所述用户输入与对所述光谱数据的调整和/或对所述处理结果的调整相关联。例如,所述用户输入可以包括以下中的一个或多个:调整后的峰值开始时间;调整后的峰值结束时间;调整后的峰值基线;调整后的背景去除;调整后的保留时间;所述化学样品中化学组分的调整后的身份;以及所述化学样品中化学组分的调整后的浓度。在所述用户输入与对所述光谱数据的调整相关联的一个例子中,所述方法进一步包括至少部分地使用所述机器学习处理模型来处理所述调整后的光谱数据以确定更新的处理结果。基于所述接收到的用户输入(表示负反馈)来训练所述机器学习处理模型可以包括:基于所述调整后的光谱数据和所述更新的处理结果来训练所述机器学习处理模型;基于所述光谱数据(例如,如果没有调整的话)和所述调整后的身份或浓度来训练所述机器学习处理模型。以这种方式,可以通过学习最初是不正确的并且随后由用户调整为正确的内容来改进所述机器学习处理模型。

8、在一个实施方案中,所述机器学习处理模型包括人工神经网络,诸如深度神经网络。可以使用其他基于机器学习的模型、递归模型或非递归模型。这些可以包括例如递归神经网络、长短期记忆模型、马尔可夫过程、强化学习、门控递归单元模型、深度神经网络、卷积神经网络(例如,unet)、支持向量机、主成分分析、逻辑回归、决策树/森林,集成方法(组合模型)、回归(贝叶斯/多项式/回归)、随机梯度下降、线性判别分析、最近邻分类或回归、朴素贝叶斯,仅举几例。

9、在一个实施方案中,所述方法进一步包括:在所述处理之前:确定所述光谱数据的格式,并且如果确定所述光谱数据的格式是专有格式,则将所述光谱数据的格式从所述专有格式转换为开放格式。确定所述光谱数据的格式可以包括确定所述光谱数据的格式是否为可识别的。可以预先确定可接受的或可识别的专有格式。

10、在一个实施方案中,所述方法进一步包括:接收一个或多个另外的用户输入,每个用户输入与使用所述机器学习处理模型对相应化学样品的相应光谱数据的相应处理相关联;以及存储所述一个或多个接收到的另外的用户输入,以用于基于所述一个或多个接收到的另外的用户输入来训练所述机器学习处理模型。

11、在一个实施方案中,所述方法进一步包括基于所述一个或多个接收到的另外的用户输入来训练所述机器学习处理模型。在已经接收到预定数量的用户输入之后,根据用户请求,可以连续/递归地等周期性地执行训练。

12、在一个实施方案中,所述化学样品可以包括邻苯二甲酸酯,或者所述机器学习处理模型可以特别地被适配用于处理与邻苯二甲酸酯相关联的光谱数据。

13、在一个实施方案中,所述光谱数据是色谱图或质谱的数据。

14、在一个实施方案中,所述光谱数据处理系统与化学分析系统相关联。所述光谱数据处理系统可以例如经由有线通信连接与所述化学分析系统本地连接。可替代地,所述光谱数据处理系统可以远程连接所述化学分析系统,例如经由无线通信网络。

15、在一个实施方案中,所述化学分析系统包括气相色谱仪或液相色谱仪,并且所述光谱数据包括化学样品的色谱图的数据。在另一个例子中,所述化学分析系统包括质谱仪,并且所述光谱数据包括化学样品的质谱的数据。所述质谱仪可以是气相色谱-质谱仪或液相色谱-质谱仪。

16、在第二方面,提供了一种光谱数据处理系统,其包括一个或多个处理器,所述一个或多个处理器被布置成:至少部分地使用机器学习处理模型来接收与化学样品的光谱数据的处理相关联的用户输入;以及基于所述接收到的用户输入来训练所述机器学习处理模型。所述光谱数据处理系统还可以包括一个或多个存储器或存储设备,用于存储所述用户输入和/或所述机器学习处理模型。在一个例子中,所述光谱数据处理系统包括机器学习控制器,并且所述一个或多个处理器和所述一个或多个存储器可以是所述机器学习控制器的一部分。在另一个例子中,所述机器学习控制器可以不包括所述一个或多个处理器,而是可以包括与所述一个或多个处理器可操作地联接的一个或多个其他处理器。在又一例子中,所述一个或多个处理器包括多个处理器,其中至少一个处理器被布置成执行训练并且其中至少一个处理器被布置成执行对光谱数据的处理。

17、在一个实施方案中,所述一个或多个处理器进一步被布置成:至少部分地使用所述机器学习处理模型来处理所述光谱数据以提供处理结果。

18、在一个实施方案中,所述一个或多个处理器进一步被布置成使用所述机器学习处理模型来执行以下中的一个或多个或全部:光谱信号分割;光谱峰值检测;光谱峰值去卷积;以及化学组分相关信息确定。所述化学组分相关信息确定可以包括以下中的一个或多个:化学组分类别鉴定;化学组分类型鉴定;化学组分鉴定;以及化学组分浓度确定。

19、在一个实施方案中,所述光谱数据处理系统还包括被布置成提供对所述光谱数据的处理的处理结果的输出设备。所述输出设备可以包括被布置成显示所述处理结果的显示器。在一个例子中,所述处理结果可以是以下中的至少一个的形式:所述光谱数据的至少一部分的图形表示(例如,绘图/光谱/表格/热图);以及与所述化学样品中包含的至少一种化学组分相关联的信息。与所述化学组分相关联的信息包括:所述至少一种化学组分的身份和/或所述至少一种化学组分中的每一种组分的浓度。

20、在一个实施方案中,所述一个或多个处理器进一步被布置成:从多个机器学习处理模型中选择所述机器学习处理模型或接收对所述机器学习处理模型的选择。所述多个机器学习处理模型可以全部布置在所述机器学习控制器中。所述多个机器学习处理模型中的相应一个中的每个可以与相应类型或类别的化学样品、相应的化学分析系统、相应的地理位置、相应的用户(公司、个人等)相关联,并且所述选择可以是基于这些特性。

21、在一个实施方案中,所述用户输入表示对所述处理结果的正反馈。在一个例子中,在接收到表示正反馈的用户输入时,所述一个或多个处理器被布置成:例如至少通过基于所述光谱数据和所述处理结果来训练所述机器学习处理模型,基于所述接收到的用户输入来训练所述机器学习处理模型。

22、在一个实施方案中,所述用户输入表示对所述处理结果的负反馈。在一个例子中,所述用户输入与对所述光谱数据的调整和/或对所述处理结果的调整相关联。例如,所述用户输入可以包括以下中的一个或多个:调整后的峰值开始时间;调整后的峰值结束时间;调整后的峰值基线;调整后的背景去除;调整后的保留时间;所述化学样品中化学组分的调整后的身份;以及所述化学样品中化学组分的调整后的浓度。在所述用户输入与对所述光谱数据的调整相关联的一个例子中,所述一个或多个处理器被布置成至少部分地使用所述机器学习处理模型来处理所述调整后的光谱数据以确定更新的处理结果。被布置成基于所述接收到的用户输入(表示负反馈)来训练所述机器学习处理模型的所述一个或多个处理器可以基于所述调整后的光谱数据和所述更新的处理结果来训练所述机器学习处理模型;基于所述光谱数据(例如,如果没有调整的话)和所述调整后的身份或浓度来训练所述机器学习处理模型。以这种方式,可以通过学习最初是不正确的并且随后由用户调整为正确的内容来改进所述机器学习处理模型。

23、在一个实施方案中,所述机器学习处理模型包括人工神经网络,诸如深度神经网络。可以使用其他基于机器学习的模型、递归模型或非递归模型。这些可以包括例如递归神经网络、长短期记忆模型、马尔可夫过程、强化学习、门控递归单元模型、深度神经网络、卷积神经网络(例如,unet)、支持向量机、主成分分析、逻辑回归、决策树/森林,集成方法(组合模型)、回归(贝叶斯/多项式/回归)、随机梯度下降、线性判别分析、最近邻分类或回归、朴素贝叶斯,仅举几例。

24、在一个实施方案中,所述一个或多个处理器被布置成:确定所述光谱数据的格式;以及果确定所述光谱数据的格式为专有格式,则将所述光谱数据的格式从所述专有格式转换为开放格式。所述一个或多个处理器可以被布置成确定所述光谱数据的格式是否是可识别的,以便确定所述光谱数据的格式。可以预先确定可接受的或可识别的专有格式。

25、在一个实施方案中,所述一个或多个处理器被布置成:接收一个或多个另外的用户输入,每个用户输入与使用所述机器学习处理模型对相应化学样品的相应光谱数据的相应处理相关联;并且基于所述一个或多个接收到的另外的用户输入来训练所述机器学习处理模型。所述一个或多个另外的输入可以存储在所述光谱数据处理系统的一个或多个存储器或存储设备中。

26、在一个实施方案中,所述一个或多个处理器可以在已经接收到预定数量的用户输入之后、根据用户请求、连续地/递归地等周期性地执行训练。

27、在一个实施方案中,所述化学样品可以包括邻苯二甲酸酯,或者所述机器学习处理模型可以特别地被适配用于处理与邻苯二甲酸酯相关联的光谱数据。

28、在一个实施方案中,所述光谱数据是色谱图或质谱的数据。

29、在一个实施方案中,所述光谱数据处理系统与化学分析系统相关联。所述光谱数据处理系统可以例如经由有线通信连接与所述化学分析系统本地连接。可替代地,所述光谱数据处理系统可以远程连接所述化学分析系统,例如经由无线通信网络。

30、在一个实施方案中,所述化学分析系统包括气相色谱仪或液相色谱仪,并且所述光谱数据包括化学样品的色谱图的数据。在另一个例子中,所述化学分析系统包括质谱仪,并且所述光谱数据包括化学样品的质谱的数据。所述质谱仪可以是气相色谱-质谱仪或液相色谱-质谱仪。

31、在第三方面,提供了一种系统,所述系统包括:一个或多个化学分析系统;以及第一方面的与所述一个或多个化学分析系统可操作地连接的光谱数据处理系统。所述一个或多个化学分析系统包括:一个或多个气相色谱仪;一个或多个液相色谱仪;一个或多个气相色谱-质谱仪;和/或一个或多个液相色谱-质谱仪。所述系统还可以包括与所述光谱数据处理系统(例如经由通信网络或链路本地或远程地)可操作地连接的一个或多个数据库。所述一个或多个数据库可以包括存储参考光谱数据的数据库,所述数据库可以被所述光谱数据处理系统用来处理光谱数据。所述一个或多个数据库可以包括存储用户输入、训练数据、光谱数据、机器学习处理模型等的另一数据库。

32、在第四方面中,提供了第一或第二方面中的一个或多个机器学习处理模型。

33、在第五方面,提供了一种计算机程序产品,其包含第四方面的所述一个或多个机器学习处理模型。

34、在第六方面,提供了一种具有硬件和/或软件部件的计算机系统,其提供了用于执行第一方面的方法的各种装置。

35、通过考虑详细的描述和附图,本发明的其他特征和方面将变得显而易见。在适当和适用的情况下,本文中关于一个方面或实施方案描述的任何特征可以与本文中关于任何其他方面或实施方案描述的任何其他特征组合。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1