数据分析系统、数据分析方法及其程序的记录媒体与流程

文档序号:33453387发布日期:2023-03-15 01:33阅读:25来源:国知局
数据分析系统、数据分析方法及其程序的记录媒体与流程

1.本发明涉及一种用于对通过在多个分析条件下执行液相色谱分析等分析而获得的分析结果与分析条件的关系性进行分析的数据分析系统、数据分析方法及其程序的记录媒体。


背景技术:

2.在制药领域等中,为了确认在制造时等混入的杂质而利用液相色谱分析等分析方法。此时,由于需要尽可能多地检测出对象物质中所含的成分,因此需要探索在色谱图中出现更多的成分的峰的“最佳分析条件”。为了探索“最佳分析条件”,需要将使流动相的流量、分离柱的温度、流动相的组成(构成流动相的溶剂的混合比)等多个参数发生变化的所有分析条件作为研究对象,但若在所有的分析条件下进行分析而取得数据,则需要大量的时间。因此,有时采用如下方法:利用回归分析将分析条件与分析结果的关系性进行近似,并利用其近似结果来探索“最佳分析条件”。


技术实现要素:

3.[发明所要解决的问题]
[0004]
在利用回归分析的方法中,将分析条件的各参数设为因子,将各分析条件下的分析结果(色谱图中的峰的分离度、峰数、各峰的保持时间等)设为响应,生成对因子相对于响应的关系性进行近似的近似式。为了生成近似式,最初需要准备作为近似式的基础的模型公式,只要设定了模型公式,则构成模型公式的各项的系数通过利用了最小二乘法等的回归分析来决定。
[0005]
在此前的分析系统中,以规定的模型公式为基础,利用最小二乘法等决定各运算项的系数,由此生成近似式。但是,在近年来的研究中判明,根据分析条件参数的种类,也存在与分析结果之间具有在规定的模型公式中未表现出的关系性的参数。因此,在以规定的模型公式为基础的回归分析中,无法导出表示包含此种参数的分析条件与分析结果的关系性的正确的近似式。
[0006]
本发明是鉴于所述问题而完成,目的在于提高作为回归分析的基础的模型公式的构筑的自由度,提高所导出的近似式的精度。
[0007]
[解决问题的技术手段]
[0008]
本发明的数据分析系统包括:数据存储部,将通过在多个分析条件下执行的多个分析而分别获得的多个分析结果分别设为响应,将所述分析条件中包括的多个参数分别设为因子,将所述响应与所述因子相互关联地存储;数据处理部,构成为将所述因子中的至少一个作为变量,生成表示所述变量相对于所述响应的关系性的近似式;以及信息输入装置,用于由用户对所述数据处理部输入信息,且所述数据处理部构成为执行以下步骤:变量设定步骤,由用户设定应作为所述变量的至少一个所述因子;结构设定步骤,由用户任意设定作为使用了在所述变量设定步骤中设定的所述变量的所述近似式的基础的模型公式的结
构;模型公式决定步骤,基于在所述结构设定步骤中由用户设定的结构来决定所述模型公式;以及近似式决定步骤,通过回归分析来决定构成所述模型公式决定步骤中所决定的所述模型公式的各项的系数,由此来决定所述近似式。
[0009]
本发明的数据分析方法包括:分析数据准备步骤,将通过在多个分析条件下执行的多个分析而分别获得的多个分析结果分别设为响应,将所述分析条件中包括的多个参数分别设为因子,在将所述响应与所述因子相互关联的状态下进行准备;变量设定步骤,任意设定作为变量的至少一个所述因子;结构设定步骤,使用在所述变量设定步骤中设定的所述变量,任意设定作为表示所述变量相对于所述响应的关系性的近似式的基础的模型公式的结构;模型公式决定步骤,基于在所述结构设定步骤中设定的结构来决定所述模型公式;以及近似式决定步骤,通过回归分析来决定构成所述模型公式决定步骤中所决定的所述模型公式的各项的系数,由此来决定所述近似式。
[0010]
[发明的效果]
[0011]
在本发明的数据分析系统中,构成为由用户设定分析条件中包括的多个参数中作为变量的至少一个参数,由用户任意设定作为使用了所设定的所述变量的近似式的基础的模型公式的结构,因此作为回归分析的基础的模型公式的构筑的自由度提高,导出的近似式的精度提高。
[0012]
在本发明的数据分析方法中,任意设定分析条件中包括的多个参数中作为变量的至少一个参数,使用所设定的所述变量,将所述分析结果作为响应,任意设定作为近似式的基础的模型公式的结构,因此作为回归分析的基础的模型公式的构筑的自由度提高,导出的近似式的精度提高。
附图说明
[0013]
图1是表示数据分析方法的一实施例的流程图。
[0014]
图2是表示执行所述数据分析方法的数据分析系统的结构的一例的框图。
[0015]
图3是模型公式的设定画面的一例。
[0016]
图4是模型公式的详细设定画面的一例。
[0017]
[符号的说明]
[0018]
1:数据分析系统
[0019]
2:数据存储部
[0020]
4:数据处理部
[0021]
6:信息输入装置
[0022]
8:显示器
具体实施方式
[0023]
以下,参照附图对数据分析系统及数据分析方法的一实施例进行说明。
[0024]
首先,使用图1的流程图对本实施例的数据分析方法进行说明。
[0025]
最初准备回归分析中应使用的分析数据(步骤101)。分析数据是指,对于同一试样,通过将在每次分析时变更分析条件的多个参数(例如,流动相的流量、管柱烘箱的温度、流动相溶剂的组成、流动相溶剂的混合比、梯度方法、试样注入量等)来实施分析而获得的
分析结果(例如,色谱图中的峰的分离度、峰个数、各峰的保持时间等)与各个分析条件的各参数建立对应的分析数据。在回归分析中,将通过分析而获得的分析结果定义为“响应”,将分析条件的各参数定义为“因子”。
[0026]
其次,基于所准备的分析数据,从分析条件的各参数中选择并设定在生成的近似式中应作为变量的因子(步骤102)。在变量的设定中,可将分析条件中包括的多个参数中的任意一个以上的参数设定为变量。在设定了变量之后,设定作为表示变量相对于响应的关系性的近似式的基础的模型公式的结构(步骤103)。模型公式的结构也可任意设定。例如,也可采用仅使用一次式、二次式等四则运算的现有结构作为模型公式的结构,也可采用并入了平方根、变量的乘方、指数函数、对数函数等任意运算的新颖的结构作为模型公式的结构。
[0027]
在设定了模型公式的结构之后,基于所设定的结构来决定模型公式(步骤104)。模型公式是包含使用了变量的系数不定的项的和的公式。在决定了模型公式之后,通过回归分析来决定模型公式中的各项的系数,由此决定近似式(步骤105及步骤106)。作为用于决定各项的系数的回归分析,除了最小二乘法以外,还可以使用贝叶斯推断等。回归分析的方法可由用户任意设定。在通过回归分析决定了近似式之后,可执行近似曲线的描绘等处理。
[0028]
图2中示出用于执行所述数据分析方法的数据分析系统的结构的一例。
[0029]
数据分析系统1由安装有用于实施所述数据分析方法的计算机程序的电子计算机来实现,包括数据存储部2、数据处理部4、信息输入装置6及显示器8。
[0030]
数据存储部2是用于存储由分析装置100获得的分析数据的存储区域,由硬盘驱动器等信息存储元件的一部分区域来实现。分析装置100例如是液相色谱仪。数据处理部4对存储在数据存储部2中的分析数据执行基于所述数据分析方法的分析。在数据处理部4,连接有信息输入装置6及显示器8。信息输入装置6由键盘、鼠标等来实现,用户可通过信息输入装置6向数据处理部4输入信息。对于显示器8,根据需要从数据处理部4输出应对用户提示的信息,并显示在显示器8上。
[0031]
在使用所述的数据分析系统1执行回归分析时,用户从存储在数据存储部2中的数据中确定作为回归分析的对象的分析数据(分析数据的准备)。当确定作为回归分析的对象的分析数据时,数据处理部4在显示器8上显示用于设定模型公式的模型公式设定画面,并在此模型公式设定画面上显示模型公式的设定所需的信息。
[0032]
图3是模型公式设定画面的一例。在此例中,在模型公式设定画面内设定有变量设定栏、模型公式类型设定栏、预览栏。
[0033]
在变量设定栏一览显示能够设定为变量的因子(分析条件中包括的参数)。用户可任意选择在近似式中要作为变量的一个以上的因子。在此例中,选择两个因子,并且设定为各个因子为变量x1、变量x2。
[0034]
在模型公式类型设定栏中,可设定模型公式的结构。在此例中,可选择简易设定与详细设定。在简易设定中,准备模型公式的最大次数1及最大次数2作为模型公式的结构的选择项,用户可通过选择任一最大次数而容易地设定一次式或二次式的模型公式的结构。进而,在简易设定中,可选择是否在模型公式中并入相互作用项,用户可容易地设定使用相互作用项的模型公式的结构。
[0035]
当用户在模型公式类型设定栏中选择详细设定时,数据处理部4执行模型公式任
意设定模式,并且在显示器8上显示如图4所示的模型公式详细设定画面。在模型公式详细设定画面中,除了四则运算以外,还准备有平方根、系数的乘方、指数函数、对数函数等运算项的选择项,用户可从这些选择项中使用任意的运算项来设定任意的模型公式的结构。
[0036]
数据处理部4生成通过简易设定或详细设定而设定的结构的模型公式,并构成为显示在预览栏中。在图3的例子中,显示了在简易设定中设定为最大次数为2、使用相互作用项的情况下的模型公式“y=ax12+bx2+cx1+dx2+f”。模型公式中的x1、x2是变量(因子),y是响应,a~f是各项的系数。
[0037]
在用户确认在预览栏中显示的模型公式,并利用此模型公式执行回归分析的情况下,将决定模型公式的指示输入到数据处理部4。由此,决定作为回归分析的基础的模型公式。在图3的例子中,在右下方配置有“决定”按钮,通过按下此“决定”按钮(例如,利用鼠标将光标对准决定按钮并进行点击),决定模型公式的指示被输入到数据处理部4。
[0038]
当决定模型公式时,数据处理部4使用最小二乘法等回归分析方法来决定构成模型公式的各项的系数(图3及图4中的a、b、c、d、f)。在回归分析中,反复进行系数的微调整,使得对模型公式的各变量应用各因子而计算出的响应的值y接近实际的响应的值,而求出响应的计算值y最近似实际的响应的值时的系数。通过决定模型公式的各项的系数,来决定对因子相对于响应的关系性进行近似的近似式。
[0039]
数据处理部4可具备在决定了近似式之后,描绘基于此近似式的近似线等并显示在显示器8上的功能。用户可基于显示器8上显示的近似线等信息,进行决定对象试样的最佳分析条件等处理。
[0040]
此外,以上说明的实施例只不过是本发明的数据分析系统、数据分析方法及计算机程序的实施方式的一例。本发明的数据分析系统、数据分析方法及计算机程序的实施方式如下所述。
[0041]
在本发明的数据分析系统的一实施方式中,包括:数据存储部,将通过在多个分析条件下执行的多个分析而分别获得的多个分析结果分别设为响应,将所述分析条件中包括的多个参数分别设为因子,将所述响应与所述因子相互关联地存储;数据处理部,构成为将所述因子中的至少一个作为变量,生成表示所述变量相对于所述响应的关系性的近似式;以及信息输入装置,用于由用户对所述数据处理部输入信息,且所述数据处理部构成为执行以下步骤:变量设定步骤,由用户设定应作为所述变量的至少一个所述因子;结构设定步骤,由用户任意设定作为使用了在所述变量设定步骤中设定的所述变量的所述近似式的基础的模型公式的结构;模型公式决定步骤,基于在所述结构设定步骤中由用户设定的结构来决定所述模型公式;以及近似式决定步骤,通过回归分析来决定构成所述模型公式决定步骤中所决定的所述模型公式的各项的系数,由此来决定所述近似式。
[0042]
在数据分析系统的所述一实施方式的第一形态中,包括与所述数据处理部电连接的显示器,且所述数据处理部构成为,在所述结构设定步骤中,在所述显示器上显示所述模型公式的结构的选择项、和/或应并入到所述模型公式中的项的选择项,由用户任意选择,由此,由用户设定所述模型公式的结构。通过此种形态,用户可容易地设定任意结构的模型公式。
[0043]
在所述第一形态中,所述数据处理部构成为,在所述结构设定步骤中,能够执行用于由用户输入任意的所述模型公式结构的模型公式任意设定模式。由此,模型公式的结构
并无限制,即使在判明了因子相对于响应的新的关系性的情况下,也能够生成考虑了此种关系性的近似式。
[0044]
另外,在所述第一形态中,所述数据处理部构成为,在所述结构设定步骤中,在所述显示器上显示由用户设定的结构的模型公式的预览。通过此种形态,用户可确认自身设定的结构的模型公式,从而可防止生成错误的结构的模型公式。
[0045]
在数据分析系统的所述一实施方式的第二形态中,所述分析为液相色谱分析,所述分析结果为色谱图中的峰个数、所述色谱图中的峰的分离度、以及所述色谱图中出现的峰的保持时间中的任意一个,所述分析条件包括构成流动相的一种以上的溶剂的种类、所述一种以上的溶剂各自的流量、分离柱的温度、及试样注入量中的至少一种作为所述参数。所述第二形态可与所述第一形态组合。
[0046]
在数据分析系统的所述一实施方式的第三形态中,所述回归分析为最小二乘法。所述第三形态可与所述第一形态和/或第二形态组合。
[0047]
在数据分析系统的所述一实施方式的第四形态中,所述回归分析为贝叶斯推断。所述第四形态可与所述第一形态和/或第二形态组合。
[0048]
本发明的数据分析方法的一实施方式中,包括:分析数据准备步骤,将通过在多个分析条件下执行的多个分析而分别获得的多个分析结果分别设为响应,将所述分析条件中包括的多个参数分别设为因子,在将所述响应与所述因子相互关联的状态下进行准备;变量设定步骤,任意设定作为变量的至少一个所述因子;结构设定步骤,使用在所述变量设定步骤中设定的所述变量,任意设定作为表示所述变量相对于所述响应的关系性的近似式的基础的模型公式的结构;模型公式决定步骤,基于在所述结构设定步骤中设定的结构来决定所述模型公式;以及近似式决定步骤,通过回归分析来决定构成所述模型公式决定步骤中所决定的所述模型公式的各项的系数,由此来决定所述近似式。
[0049]
在数据分析方法的所述一实施方式的第一形态中,在所述结构设定步骤中,使用从预先准备的关于所述模型公式的结构的多个选择项、和/或预先准备的关于应并入到所述模型公式中的项的多个选择项中选择的结构和/或项,设定所述模型公式的结构。通过此种形态,可容易地设定任意结构的模型公式。
[0050]
在所述第一形态中,在所述结构设定步骤中生成任意的所述模型公式的结构。由此,模型公式的结构并无限制,即使在判明了因子相对于响应的新的关系性的情况下,也能够生成考虑了此种关系性的近似式。
[0051]
在数据分析方法的所述一实施方式的第二形态中,所述分析为液相色谱分析,所述分析结果为色谱图中的峰个数、所述色谱图中的峰的分离度、以及所述色谱图中出现的峰的保持时间中的任意一个,所述分析条件包括构成流动相的一种以上的溶剂的种类、所述一种以上的溶剂各自的流量、分离柱的温度、及试样注入量中的至少一种作为所述参数。此第二形态可与所述第一形态组合。
[0052]
在数据分析方法的所述一实施方式的第三形态中,所述回归分析为最小二乘法。此第三形态可与所述第一形态和/或第二形态组合。
[0053]
在数据分析方法的所述一实施方式的第四形态中,所述回归分析为贝叶斯推断。此第四形态可与所述第一形态和/或第二形态组合。
[0054]
在本发明的计算机程序的一实施方式中,构成为在计算机上执行,由此来执行所
述的数据分析方法。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1