分析数据处理方法以及装置制造方法

文档序号:6159240阅读:271来源:国知局
分析数据处理方法以及装置制造方法
【专利摘要】将用LC/MS、GC/MS等收集到的针对多个样本的数据以无信息缺失且负荷轻的方式转换为二维表的形式,使得能够进行准确的比较分析。如果获取多个样本的LC/MS测量数据并分别制作出提取离子色谱图(XIC)(S1、S2),则进行时间轴调整以校正保持时间偏差(S3),之后,通过时间轴调整来进行校正在数据开头部、末尾部产生的数据缺失的处理(S5)。具体地说,针对存在数据缺失的保持时间范围删除全部样本的数据,使数据开头和末尾一致。之后,针对每个XIC制作排列信号强度值而得到的一维表,然后将一个样本的多个XIC的一维表按m/z的顺序相连接来制作长的一维表(S6),通过将多个样本的一维表在其它维度方向上进行排列来制作二维表(S7)。
【专利说明】分析数据处理方法以及装置
【技术领域】
[0001]本发明涉及一种对利用广义的色谱分析装置收集到的数据进行处理的数据处理方法以及装置,该色谱分析装置将液相色谱、气相色谱、毛细管电泳等样本成分在时间方向上进行分离,特别是涉及一种适于对利用结合以下两种方法的分析装置收集到的数据进行处理的数据处理方法以及装置,即在以时间为分离要素的一维方向上分离样本中的成分的方法,以及质量分析、红外光谱测量、紫外可视光谱测量等获取针对样本通过时间以外的分离要素在一维以上的方向上分离得到的信号强度的检测方法。
【背景技术】
[0002]在将液相色谱(LC)、气相色谱(GC)、毛细管电泳(CE)等成分分离方法与质量分析(MS)方法相结合的LC/MS、GC/MS、CE/MS等所进行的分析中,能够在对样本中包含的多种成分在时间上进行分离之后按每种成分获取质量分析数据。因此,能够高效地分析混合有各种化合物的样本,近年来被应用于广泛的领域。另一方面,测量得到的数据的量相当多。特别是在进行如比较多个相似的样本的分析结果这样的评价的情况下,每个样本都能够获得大量的质量分析数据,因此处理对象整体的数据量庞大,难以进行全面的分析。作为解决该难题的一种分析方法,以往使用了能够比较简便地分析大量数据的判别分析、主成分分析以及聚类分析等多变量分析。
[0003]例如在非专利文献1、专利文献I等中公开了对针对多个样本所得到的质谱数据进行主成分分析并用评分图(score plot)和负荷图(loading plot)示出其结果的例子。另外,作为用于如上述那样对质量分析数据进行多变量分析的通用的软件,例如众所周知的有瑞典的Umetrics公司开发的SIMCA-P+、美国Infometrix公司开发的Pirouette等,这些软件能够容易地得到。但是,需要预先将分析对象的测量数据(如果是LC/MS,则为质谱数据、色谱数据)整理成表格形式、即一维或者二维(纵X横)配置的数值数据,以将测量数据读入上述那样的多变量分析用的软件来进行处理。
[0004]以往,一般在使用了红外光谱测量装置(IR)、核磁共振装置(NMR)等的分析中,经常对从多个样本收集到的数据进行多变量分析并进行评价。这是由于与LC/MS、GC/MS相比在IR、NMR中通过对样本进行测量而得到的数据简单。即,利用IR、NMR得到的简单的分析结果是一个图表,也就是说,能够表示为针对某个物理量(如果在IR中则为波长,如果在NMR中则为化学位移)的信号强度这样的一维上的数值数据。因而,在对多个样本的分析结果进行比较的情况下,能够将分配给各样本的序号等数值设为一个维度方向的变量,将上述物理量设为其它维度方向的变量,以在该二维表中用数值记载信号强度的形式将测量数据整理到一个表中。
[0005]与此相对地,利用LC/MS、GC/MS等得到的测量数据是分别在时间和质量电荷比(m/z)这两个独立的分离要素的方向上分离得到的信号强度,其自身为二维上的数据。因而,在对多个样本的分析结果进行比较的情况下,需要将上述二维上的数据一维化,将针对多个样本的测量数据整理到一个表中。[0006]用于将时间方向和质量电荷比方向这样的二维上的数据一维化的最简单的方法是以下方法:从多个质量电荷比中选择特定的一个质量电荷比、或者在质量电荷比方向上对所有的信号强度进行累计。这意味着将质量电荷比方向的变量实质固定为一个、即去除质量电荷比方向这一维度。另外,从多个质量电荷比中选择特定的一个质量电荷比相当于从LC/MS(或者GC/MS)的数据中选择一个提取离子色谱图(Extracted1n Chromatogram=XIC),在整个质量电荷比范围内在质量电荷比方向上对信号强度进行累计相当于根据LC/MS的数据求出一个总离子电流色谱图(Total 1n CurrentChromatogram=TIC)。通过这样的方法,能够减轻取决于后述那样的用于一维化的数据处理运算时的内部参数的不确定性,处理也简单,因此硬件的负荷变轻,处理所需的时间也变短,因此吞吐量高。
[0007]然而,在TIC中质量电荷比方向的信息全部丢失,在XIC中虽然保存了一个质量电荷比信息,但是针对其它质量电荷比的信息全部丢失,可以说所有质量电荷比方向的一维信息实质上均已缺失。这样,在二维上的数据的其中一个维度方向上的信息缺失的情况下,存在以下问题:如果缺失的该信息中包含附加有多个样本间的差异这一特征的重要信息,则即使进行多变量分析也不能得到用于评价多个样本的相似性、差异性的恰当的结果,不能准确地进行样本的比较。
[0008]对此,在非专利文献2、3中公开了以下例子:对通过LC/MS收集到的数据执行峰值检测和选择、噪声去除、强度计算(标准化(normalize)等)等复杂的数据处理运算来删除或者合并不需要的数据,由此将二维上的数据一维化,将针对多个样本分别得到的测量数据导入二维表中,对其进行主成分分析。另外,在由加拿大的Phenomenome DiscoveriesInc.提供的作为代谢学(metabolomics)分析软件的Profiler?中搭载有如下功能:通过进行包括峰值提取(peak picking)、平滑化、校正(calibration)等的数据转换处理,将利用能够进行MSn分析的LC/MS收集到的数据整理成二维表的形式。
[0009]然而,如果想要进行像这样复杂的数据处理运算,则硬件的负荷加重,因此需要准备高性能的CPU、大容量的RAM,处理的吞吐量也下降。另外,当进行上述那样的数据处理运算时使用预先准备的运算参数,但有时由于该参数导致多变量分析结果产生大的差异。另夕卜,在进行了峰值提取等的情况下,由于在该处理过程中发生原始信息的丢失,因此有时不能将样本的差异准确地反映到多变量分析结果中。由此,存在尽管进行了复杂的数据处理也不能够准确地进行样本的比较的情况。
[0010]另外,在LC、GC之类的成分分离方法中,同一物质的洗脱时间易于随着测量条件(分离条件)、装置状态发生变动。即使使测量条件完全相同,当实际执行多次测量时也经常发生同一物质的洗脱时间变动这样的情况。当比较针对不同的样本的测量结果时,如果存在上述那样的洗脱时间的偏差则不能进行恰当的比较处理,因此一般进行色谱数据的时间轴调整以使同一物质的洗脱时间一致。通过使调整对象的色谱数据在时间轴方向上移动或者将时间轴放大和缩小来进行时间轴调整。当伴随这样的调整而色谱数据开头部分、末端部分发生偏移时,数据发生缺失。
[0011]图9是示意性地示出该数据缺失的示意图。图9的(a)是A1、A2这两个色谱数据的开头部和末端部一致的状态,在这种情况下不存在数据缺失。图9的(b)是由于使其中一个数据移动而在开头部不存在与Al对应的A2、在末端部不存在与A2对应的Al的状态。图9的(c)是由于将其中一个数据的时间轴放大、将另一个数据的时间轴缩小而在开头部、末端部均不存在与Al对应的A2的状态。如果在发生这种数据缺失的状态下仍执行多变量分析处理等,则有可能误识别为在数据的开头部、末尾部样本间存在差异。
[0012]专利文献1:日本特开2009-25056号公报
[0013]非专利文献1:米久保、其他两位、《最新的飞行时间质谱仪LCT PremierTM的特征和对食品代谢的应用(最新Q飛行時間型質量分析計LCT PremierTM Q特徴i食品^夕口一 Λ~Q佑用)》、色谱法(Chromatography)、色谱法科学会、第27卷、第2号(2006年)
[0014]非专利文献2:桑斯特(Tim P.Sangster)、其他四位、((Investigation ofanalytical variation in metabonomic analysis using liquid chromatography/massspectrometry))> (Rapid Commun.Mass Spectrom.)、2007、21、p.2965-2970
[0015]非专利文献3:李夏阳(Li Xiayan)、其他一名、((Advances in separationscience applied to metabonomics〉〉、 电泳 疗法(Electrophoresis)、2008、29、ρ.3724-3736

【发明内容】

[0016]发明要解决的问题
[0017]本发明是鉴于上述问题而完成的,其主要目的在于提供一种能够一边有效地利用使用LC/MS、GC/MS等分析装置针对多个样本收集到的测量数据所具有的信息一边获得与样本间的比较、即相似性、差异性等有关的正确的信息的分析数据处理方法以及装置。
[0018]用于解决问题的方案
[0019]为了解决上述问题而完成的第一发明是一种分析数据处理方法,用于处理针对一个样本得到的多个色谱数据或者针对多个样本分别得到的多个色谱数据,其特征在于,包括以下步骤:
[0020]a)时间轴调整步骤,针对上述多个色谱数据中的作为比较分析对象的多个色谱数据调整时间轴,使得同一成分的出现时间一致;
[0021]b)数据整形步骤,在完成时间轴调整的作为比较分析对象的多个色谱数据的开头部以及末尾部存在对应于同一时间的数据缺失的色谱数据的情况下,针对该作为比较分析对象的多个色谱数据删除存在数据缺失的时间范围的数据;以及
[0022]c)表制作步骤,针对通过上述数据整形步骤实施了开头部以及末尾部的处理后的作为比较分析对象的多个色谱数据以如下方式制作二维表:使各色谱数据的数据值按时间顺序纵向或者横向地排列,在与该时间顺序方向正交的横向或者纵向上排列比较分析对象的色谱数据。
[0023]另外,为了解决上述问题而完成的第二发明的特征在于,代替上述第一发明所涉及的分析数据处理方法中的数据整形步骤,而具有如下的数据整形步骤:在完成时间轴调整的作为比较分析对象的多个色谱数据的开头部以及末尾部存在对应于同一时间的数据缺失的色谱数据的情况下,针对该作为比较分析对象的多个色谱数据使存在数据缺失的时间范围的数据无效。
[0024]在此所说的“无效”例如意味着事先附加表示数据无效的标志等标记,即使在表中存在数值也不在分析等有效处理中使用该数值。因而,该“无效”在分析等有效处理上与数据的删除相同。
[0025]另外,为了解决上述问题而完成第三发明的特征在于,代替上述第一发明所涉及的分析数据处理方法中的数据整形步骤,而具有如下数据整形步骤:在完成时间轴调整的作为比较分析对象的多个色谱数据的开头部以及末尾部存在对应于同一时间的数据缺失的色谱数据的情况下,执行以下处理:利用与数据缺失部相同的时间范围且数据没有缺失的其它色谱数据来补充上述缺失部的数据。
[0026]在第三发明所涉及的分析数据处理方法中,数据整形步骤例如只要使用数据没有缺失的作为比较分析对象的其它样本的色谱数据的平均值来补充缺失部的数据即可。但是,像这样补充的数据不是通过分析获取到的数据,因此优选事先附加另外的标志等标记以能够识别该意思。
[0027]第四发明所涉及的分析数据处理装置是用于实现第一发明所涉及的分析数据处理方法的装置,用于处理针对一个样本得到的多个色谱数据或者针对多个样本分别得到的多个色谱数据,其特征在于,具备:
[0028]a)时间轴调整单元,其针对上述多个色谱数据中的作为比较分析对象的多个色谱数据调整时间轴,使得同一成分的出现时间一致;
[0029]b)数据整形单元,其在完成时间轴调整的作为比较分析对象的多个色谱数据的开头部以及末尾部存在对应于同一时间的数据缺失的色谱数据的情况下,针对该作为比较分析对象的多个色谱数据删除存在数据缺失的时间范围的数据;以及
[0030]c)表制作单元,其针对通过上述数据整形单元实施了开头部以及末尾部的处理后的作为比较分析对象的多个色谱数据以如下方式制作二维表:使各色谱数据的数据值按时间顺序纵向或者横向地排列,在与该时间顺序方向正交的横向或者纵向上排列比较分析对象的色谱数据。
[0031]第五发明所涉及的分析数据处理装置是用于实现第二发明所涉及的分析数据处理方法的装置,其特征在于,代替上述第四发明所涉及的分析数据处理装置中的数据整形单元而具备如下的数据整形单元:在完成时间轴调整的作为比较分析对象的多个色谱数据的开头部以及末尾部存在对应于同一时间的数据缺失的色谱数据的情况下,针对该作为比较分析对象的多个色谱数据使存在数据缺失的时间范围的数据无效。
[0032]第六发明所涉及的分析数据处理装置是用于实现第三发明所涉及的分析数据处理方法的装置,其特征在于,代替上述第四发明所涉及的分析数据处理装置中的数据整形单元而具备如下数据整形单元:在完成时间轴调整的作为比较分析对象的多个色谱数据的开头部以及末尾部存在对应于同一时间的数据缺失的色谱数据的情况下,执行以下处理:利用与数据缺失部相同的时间范围内的数据没有缺失的其它色谱数据来补充上述缺失部的数据。
[0033]在第一至第六发明中,色谱数据例如是从如下的分析装置得到的数据:使液相色谱、气相色谱、薄膜色谱、毛细管电泳等分离单元与质量分析装置、紫外可视光谱仪、光电二极管阵列光谱仪、红外光谱测量装置、核磁共振装置、示差折光率计等检测器相结合而构成的。例如在检测器为质量分析装置的情况下,关于色谱图,除了考虑与质量电荷比无关的总离子色谱图、特定的质量电荷比的提取离子色谱图之外,还能够考虑基峰色谱图(BasePeak C hromatogram)、质量缺陷色谱图(Mass Defect Chromatogram)、同位素过滤色谱图(Isotopic Filterd Chromatogram)以及中性丢失色谱图(Neutral-loss Chro matogram)
坐寸O
[0034]例如当对从多个样本分别得到的色谱数据进行比较分析时,在第一至第三发明所涉及的分析数据处理方法中,在时间轴调整步骤中针对各样本的色谱数据调整时间轴使得同一成分的出现时间(保持时间)尽量一致。该时间轴调整是时间轴的移动、放大和缩小,因此即使原始的色谱数据的开头和末尾的时间是一致的,时间轴调整后的色谱数据的开头和末尾的时间也会产生偏差。由于该偏差而成为在一部分色谱数据的开头部和/或末尾部不存在某一时间的数据,即缺失某一时间的数据的状态。在数据整形步骤中,为了减轻这种缺失部的影响,针对作为比较分析对象的全部样本的色谱数据,将存在数据缺失那样的时间范围的数据删除或者使其无效来从实质上删除存在数据缺失的时间范围的数据。或者代替删除数据而利用有效的其它数据补充缺失的数据。
[0035]在表制作步骤中,使比较分析对象的各色谱数据的数据值例如按时间顺序纵向地排列来制作一维表,通过在与该时间顺序方向正交的横向上排列比较分析对象的色谱数据即上述一维表来制作二维表。
[0036]在第一至第三发明所涉及的分析数据处理方法中,优选的是,该分析数据处理方法用于处理使用具备色谱分离单元和检测器的分析装置收集到的针对多个样本的色谱数据,其中,该色谱分离单元将样本中含有的多个成分在时间方向上进行分离,该检测器针对被该色谱分离单元在时间方向上进行了成分分离的样本分别获取除时间以外的其它参数的维度方向的信号强度,在该数据处理方法中,
[0037]针对不同的样本,将同一参数下的色谱数据作为比较分析对象实施上述时间轴调整步骤以及上述数据整形步骤的处理,
[0038]上述表制作步骤包括:一维表制作步骤,针对每个样本,将通过上述数据整形步骤实施了开头部以及末尾部的处理后的色谱数据,按照上述参数相同来进行整理并在时间方向上相连接来制作一维表,该二维表制作步骤是在与时间方向正交的方向上配置在该一维表制作步骤中制作出的针对各不相同的样本的一维表,由此制作二维表。
[0039]上述“参数”取决于检测器的种类,例如在质量分析装置中质量电荷比成为参数,在紫外可视光谱仪、光电二极管阵列光谱仪中波长成为参数,在核磁共振装置中化学位移成为参数。根据上述优选的方法,例如针对一个样本与多个质量电荷比分别对应地获取到的提取离子色谱数据被整理到一维表中,针对多个样本的提取离子色谱数据被整理到二维表中。
[0040]通过以上的处理,例如在分析装置为LC/MS、GC/MS的情况下,将针对多个样本的质谱数据、色谱数据转换为二维表的形式。这样,使多变量分析软件读入被整理到二维表的数值来进行数据处理,由此能够获得同时反映时间方向的信息和质量电荷比方向的信息的全面的分析结果。当然,通过将利用普通的多变量分析软件实现的功能引入本发明,能够从将数据转换至二维表的数据转换处理连续地进行到多变量分析处理。
[0041]发明的效果
[0042]根据本发明所涉及的分析数据处理方法以及装置,即使在对想要进行比较分析的多个色谱数据进行时间轴调整之后在数据的开头部、末尾部产生缺失的情况下,也能够避免在进行用于求出样本间的差异、相似性或者针对同一样本的不同检测器的结果的差异、相似性的分析处理时导出由一部分数据缺失引起的异常的结果。由此,能够高精度地实施多个色谱图的比较分析。
【专利附图】

【附图说明】
[0043]图1是具备本发明所涉及的分析数据处理装置的LC-MS分析系统的一个实施例的概要模块结构图。
[0044]图2是在本实施例的LC-MS分析系统中收集的色谱数据的说明图。
[0045]图3是表示本实施例的LC-MS分析系统中的特有的数据处理过程的流程图。
[0046]图4是表示图3所示的数据处理的具体例的示意图。
[0047]图5是表示图3所示的数据处理的具体例的示意图。
[0048]图6是表示图3所示的数据处理的具体例的示意图。
[0049]图7是表示图3所示的数据处理的具体例的示意图。
[0050]图8是表示图3所示的数据处理的具体例的示意图。
[0051]图9是示意性地表示色谱图的时间轴调整所伴有的数据缺失的示意图。
【具体实施方式】
[0052]关于本发明所涉及的分析数据处理方法以及实施该方法的分析数据处理装置的一个方式,以具备该分析数据处理装置的LC-MS分析系统为例进行说明。图1是该LC-MS分析系统的概要模块结构图。
[0053]在图1中,样本转换器(Changer) I在控制部4的控制下依次选择预先准备的多个样本并导入到液相色谱(LC)部2。LC部2包括分离用的柱,将从样本转换器I提供的样本导入到柱中,在通过柱的期间使样本中的各种成分在时间上分离并依次送到质量分析(MS)部3。
[0054]虽然未图示,但MS部3例如是具备电喷射离子源等大气压离子源、离子阱、飞行时间质量分析器以及离子检测器的离子阱飞行时间质量分析装置(IT-TOFMS)。在该MS部3中,从LC部2导入的洗脱液中的样本成分被离子化,所生成的离子被暂时保持在离子阱中。所保持的离子在离子阱中被赋予固定的动能并被送到飞行时间质量分析器,在飞行于飞行空间的期间离子与质量电荷比相应地进行分离,在离子检测器中依次进行检测。
[0055]将用MS部3得到的检测信号输入到数据处理部7来转换为数字数据,并将这些数据全部保存到包括数据存储部的数据收集部71。之后,在控制部4的指示下,从数据收集部71读出规定的数据,在色谱图制作部72中制作提取离子色谱图(以下简称为“XIC”)等各种色谱图,在色谱图校正部73中进行时间轴校正以及伴随该校正产生的数据缺失的校正。并且,利用表制作处理部74将针对多个样本获取到的质谱数据、色谱数据整理成一个表(二维上的数据)。经由控制部4将该表显示在显示部6的显示画面上,并且导入到分析处理部75,通过执行差异分析等数据处理来获得分析结果,经由控制部4将该结果显示在显示部6的显示画面上。
[0056]控制部4控制样本转换器1、LC部2、MS部3以及数据处理部7的动作,并且通过作为用户接口的操作部5、显示部6接受分析人员的操作,另一方面,输出上述评分图等分析结果。此外,能够通过安装有规定的控制/处理软件的个人计算机实现控制部4以及数据处理部7的大部分的功能。
[0057]在本实施例的LC-MS系统中,作为测量对象的多个样本是包含大致相同成分的类似的样本。另外,所包含的成分的种类基本上是已知的。质量电荷比是不受分析条件等影响的物质固有的信息,因此所含成分的种类已知意味着观测对象的质量电荷比也是已知的。因此,分析人员在预先从操作部5输入多个测量对象的质量电荷比来作为测量条件之一之后,指示执行测量。在此,作为测量对象的质量电荷比,设定m/z为100、101、120、130、…。由此,在控制部4的控制下,在MS部3中反复执行m/z为100、101、120、130、…的SIM(选择离子监视)测量。
[0058]当开始测量时,样本转换器I按照已决定的顺序选择样本,将该样本送到LC部2。LC部2对样本中的成分在时间上进行分离,MS部3针对所设定的上述多个质量电荷比反复进行SIM测量。如果针对一个样本的LC/MS测量结束,则样本转换器I选择下一个样本并将其输送到LC部2,LC部2和MS部3与上述同样地执行测量。这样,对多个样本全部执行LC/MS测量,数据收集部71暂时存储这些数据(步骤SI)。
[0059]接着,色谱图制作部72按每个样本制作与观测对象的质量电荷比对应的XIC(步骤S2)。例如,如果观测对象的质量电荷比的数量为8,则一个样本制作8张XIC(参照图2)。色谱图校正部73比较在针对不同样本的同一质量电荷比的XIC中表现的峰值波形,根据其相似性来识别来源于同一成分的峰值。然后,计算出同一成分的保持时间偏差,以校正该偏差的方式校正XIC的时间轴(步骤S3)。该保持时间偏差是由LC部2中的流动相的流速偏差、柱的温度偏差等对成分分离特性造成影响的因素的偏差产生的,将针对任意一个样本的XIC作为基准使其它XIC的时间轴移动或者进行放大和缩小,由此使色谱图上表现的各成分的保持时间大致一致。
[0060]在色谱图校正部73中继续对各样本的多个XIC执行与测量目的等相应的波形处理。例如求出XIC的基线并去除该基线,或者,将XIC上的信号强度标准化(步骤S4)。在进行标准化的情况下,例如 在各XIC中求出信号强度的最大值、色散、标准偏差等,以此为基准将各信号强度值标准化(规格化)即可。
[0061]在上述XIC的时间轴校正之后,如图9的(b)、(c)所示,有时各色谱数据的开头、末尾不一致。在这种情况下,在色谱数据的开头部、末尾部中的一方或者双方,在所对应的时间产生不存在其它色谱数据的数据缺失。因此,在色谱图校正部73中实施对色谱数据的开头部以及末尾部的数据缺失进行校正的处理(步骤S5)。关于具体的处理方法后文叙述。
[0062]接着,表制作处理部74将针对多个样本的时间轴校正和XIC数据整理成二维表形式。具体地以如下过程进行处理。
[0063]如图4的(a)所示那样的、构成某一个样本的一个质量电荷比所对应的XIC的数据是表示时间轴上的各时间(每个保持时间)的信号强度值的数据。因此,在一个样本中,按每个XIC制作针对时间的变化在一维方向上排列数据值(信号强度值)而得到的一维表。图4的(b)是针对m/z为100的XIC制作一维表的例子。
[0064]针对其它质量电荷比(m/z为101、120、130、…)的XIC也制作相同的一维表,因此在表中的信号强度值的排列方向(即时间轴方向)上按照质量电荷比从大到小的顺序(或者从小到大的顺序)将这些多个一维表相连接(步骤S6)。图4的(c)是将有关样本I的针对不同质量电荷比的一维表相连接的例子。此时,在一维方向(图4的(c)的纵向)上,信号强度值不是按照能够根据测量条件等发生变动的信息即保持时间来收集的,而是按照物质所固有的信息即每个质量电荷比来收集的。
[0065]同样地,对每个样本分别制作在一维方向上配置构成多个XIC的信号强度值而得到的一维表。然后,针对全部样本,按照对样本附加的序号的顺序在其它维度方向上排列上述一维表,由此整理成如图4的(d)所示的二维表的形式(步骤S7)。S卩,图4的(d)所示的二维表中的纵向的一列是一个样本的所有XIC的信号强度数据。另外,在这一列中,针对相同的质量电荷比的信号强度值被邻接保存。另一方面,横向的一行是某个质量电荷比且某一个时间内的全部样本的信号强度数据。
[0066]在此,对在上述步骤S5中实施的数据缺失校正处理进行具体地说明。如果设为当前不进行数据缺失校正处理而执行步骤S6、S7的表制作处理,则二维表如图5所示。在图5中,对于样本1,保持时间为1.1?1.4的时间范围的数据(信号强度值)存在,但对于样本2,保持时间为1.1?1.4的时间范围的数据缺失,为了补充该缺失而权宜地插入数据“O”。另外,对于样本3,保持时间为1.1?1.2的时间范围的数据缺失,为了补充该缺失而权宜地插入数据“O”。即,在图5中用粗虚线围成的范围是数据缺失部分。这是色谱数据的开头部,但对于末尾部也可能同样产生数据缺失。
[0067]因此,在步骤S5中进行以下三个处理中的某个处理,由此来校正数据缺失部以避免对后述的差异分析等的结果造成影响。
[0068](I)在全部样本的色谱数据中删除存在数据缺失的时间范围的数据。
[0069]如果用图5所示的例子进行说明,则对于样本2,保持时间为1.1?1.4的时间范围的数据缺失,因此在全部样本的色谱数据中删除保持时间为1.1?1.4的时间范围的数据。即,数据的开头的保持时间不是1.1而成为1.5。图6是表示针对在步骤S5中进行上述(I)的数据缺失部校正处理而得到的XIC制作二维表的结果的图。根据图6可知,在这种情况下存在数据缺失部其本身并没有表现在二维表上。
[0070](2)在全部样本的色谱数据中使存在数据缺失的时间范围的数据无效。具体地说,虽然没有作为数据被删除,但通过插入实际上无法产生的数值、特殊符号代替普通的数值,或者附加表示是无效数据的标志,由此使得在自动分析或者由分析人员进行的分析中无法使用它们。
[0071]如果用图5所示的例子进行说明,则对于样本2,保持时间为1.1?1.4的时间范围的数据缺失,因此在全部样本的色谱数据中将保持时间为1.1?1.4的时间范围的数据如图7所示那样变更为特殊符号*。如根据图7可知,在这种情况下能够基于二维表掌握存在数据缺失部这一情况。
[0072](3)将缺失的部分的数据(在图5中用粗虚线围成的部分的数据)替换为根据没有缺失的数据通过计算等所求出的数据。例如,求出同一保持时间的针对其它样本的数据的平均值,插入该平均值数据来代替所缺失的部分的数据“O”。
[0073]如果用图5所示的例子进行说明,对于样本2,保持时间为1.1?1.4的时间范围的数据缺失,因此如图8所示,根据保持时间为1.1?1.4的时间范围的数据没有缺失的其它样本的色谱数据求出平均值,插入该平均值来代替缺失的数据。此外,为了能够辨别这样求出的数据和原始数据,对前者附加特定的标志即可。在图8中对数据附加特殊符号*。
[0074]当在表制作处理部74中将被整理为如上所述的二维表形式的信号强度数据输入到分析处理部75时,分析处理部75执行预先决定的差异分析、多变量分析,将表示样本的相似性、差异性的结果输出到显示部6 (步骤S8)。在分析处理部75进行主成分分析的情况下,基于所读入的信号强度数据针对每个样本求出评分和负荷,制作各自的色散图并进行输出。由此,分析人员能够对多个样本的相似性、差异性进行评价。
[0075]当在分析处理部75中进行差异分析时,利用针对不同样本的同一保持时间的数据之间的差,但在图6、图7所示的例子中,不针对存在数据缺失的时间范围进行差异分析,因此数据缺失不会对分析结果造成影响。另外,在图8所示的例子中,虽然也针对存在数据缺失的时间范围进行差异分析,但缺失部不是数据O而是接近针对其它样本的数据的值,因此能够抑制对分析结果造成的影响。
[0076]此外,在上述实施例中,图4的(b)所示的色谱数据是对应于某一个质量电荷比的Xic的信号强度数据,通过使用对应于多个质量电荷比的XIC的信号强度数据来制作图4的(c)所示的一维表,但能够将该色谱图的一部分或者全部替换为非XIC的其它形式的色谱图。
[0077]例如,可以设为获取对应于多个质量电荷比的XIC的差而得到的差分色谱图、将对应于多个质量电荷比的XIC相加而得到的或者将整个规定的质量电荷比范围内的所有Xic相加而得到的加法色谱图等。例如,在图4的(C)的例子中,可以代替表示m/z为100、m/z为101这两个XIC的数据,而设为表示将两个XIC相加得到的、即对应于m/z=100+101的色谱图的数据。即使进行这样的转换,质量电荷比这个维度的信息也不会缺失。
[0078]另外,作为在质量分析装置中制作的色谱图,一般为TIC、XIC,但是除此之外还能制作各种形式的色谱图,因此在图4的(C)所示的一维表中也可以包含构成这样的色谱图的数据。作为这样的色谱图,例如包括收集离子量最大的峰值而得到的基峰色谱图、质量缺陷色谱图、同位素过滤色谱图以及中性丢失色谱图等。此外,当然这些色谱图中的一部分是基于通过在MS部3中对使离子裂解而生成的前体离子进行质量分析所收集到的数据而得到的。
[0079]另外,上述实施例是将本发明应用于LC-MS分析系统的实施例,但是显然也可以使用同样能够在时间方向上进行成分分离的GC、CE来代替LC。
[0080]另外,也显然可以使用除MS以外的各种分析装置作为获取针对样本的测量数据的检测器。例如,在使用了紫外可视光谱仪、光电二极管阵列检测器作为检测器的情况下,能够按多个波长中的每个波长测量信号强度随时间的变化,因此能够按每个波长制作色谱图,能够使用与上述相同的方法将针对多个样本的多个波长的色谱数据二维表化。
[0081]另外,在上述说明中,为了比较针对多个样本的色谱数据,将针对不同样本的色谱数据沿表的横向进行排列,但也能够使用本发明以比较利用不同的检测器针对同一样本分别获取到的色谱图。具体地说,例如为了将利用质量分析装置针对同一样本获取到的TIC与利用紫外可视光谱仪针对同一样本获取到的各波长的色谱图进行比较,也可以将排列这些色谱数据而得到的一维表横向地排列来进行二维化。这样,用户能够任意选择比较对象的色谱图的种类,但不论在选择了何种色谱图的情况下,根据本发明,都能够进行消除时间轴调整后产生的数据缺失的影响的处理,能够进行准确的色谱图比较。
[0082]另外,上述实施例只不过是本发明的一例,除了上述记述以外,即使在本发明的宗旨范围内进行适当地变更、校正以及追加也当然包含在本申请的权利要求书中。[0083]附图标记说明
[0084]1:样本转换器;2:液相色谱(LC)部;3:质量分析(MS)部;4:控制部;5:操作部;6:显示部;7:数据处理部;71:数据收集部;72:色谱图制作部;73:色谱图校正部;74:表制作处理部;75:分析处理部。
【权利要求】
1.一种分析数据处理方法,用于处理针对一个样本得到的多个色谱数据或者针对多个样本分别得到的多个色谱数据,其特征在于,包括以下步骤: a)时间轴调整步骤,针对上述多个色谱数据中的作为比较分析对象的多个色谱数据调整时间轴,使得同一成分的出现时间一致; b)数据整形步骤,在完成时间轴调整的作为比较分析对象的多个色谱数据的开头部以及末尾部存在对应于同一时间的数据缺失的色谱数据的情况下,针对该作为比较分析对象的多个色谱数据删除存在数据缺失的时间范围的数据;以及 c)表制作步骤,针对通过上述数据整形步骤实施了开头部以及末尾部的处理后的作为比较分析对象的多个色谱数据以如下方式制作二维表:使各色谱数据的数据值按时间顺序纵向或者横向地排列,在与该时间顺序方向正交的横向或者纵向上排列比较分析对象的色谱数据。
2.一种分析数据处理方法,用于处理针对一个样本得到的多个色谱数据或者针对多个样本分别得到的多个色谱数据,其特征在于,包括以下步骤: a)时间轴调整步骤,针对上述多个色谱数据中的作为比较分析对象的多个色谱数据调整时间轴,使得同一成分的出现时间一致; b)数据整形步骤,在完成时间轴调整的作为比较分析对象的多个色谱数据的开头部以及末尾部存在对应于同一时间的数据缺失的色谱数据的情况下,针对该作为比较分析对象的多个色谱数据使存在数据缺失的时间范围的数据无效;以及 c)表制作步骤,针对通过上述数据整形步骤实施了开头部以及末尾部的处理后的作为比较分析对象的多个色谱数据以如下方式制作二维表:使各色谱数据的数据值按时间顺序纵向或者横向地排列,在与该时间顺序方向正交的横向或者纵向上排列比较分析对象的色谱数据。
3.一种分析数据处理方法,用于处理针对一个样本得到的多个色谱数据或者针对多个样本分别得到的多个色谱数据,其特征在于,包括以下步骤: a)时间轴调整步骤,针对上述多个色谱数据中的作为比较分析对象的多个色谱数据调整时间轴,使得同一成分的出现时间一致; b)数据整形步骤,在完成时间轴调整的作为比较分析对象的多个色谱数据的开头部以及末尾部存在对应于同一时间的数据缺失的色谱数据的情况下,执行以下处理:利用与数据缺失部相同的时间范围且数据没有缺失的其它色谱数据来补充上述缺失部的数据;以及 c)表制作步骤,针对通过上述数据整形步骤实施了开头部以及末尾部的处理后的作为比较分析对象的多个色谱数据以如下方式制作二维表:使各色谱数据的数据值按时间顺序纵向或者横向地排列,在与该时间顺序方向正交的横向或者纵向上排列比较分析对象的色谱数据。
4.根据权利要求1至3中的任一项所述的分析数据处理方法,其特征在于, 该分析数据处理方法用于处理使用分析装置收集到的针对多个样本的色谱数据,该分析装置具备色谱分离单元和检测器,其中,该色谱分离单元将样本中含有的多个成分在时间方向上进行分离,该检测器针对被该色谱分离单元在时间方向上进行了成分分离的样本分别获取除时间以外的其它参数的维度方向的信号强度,在该数据处理方法中, 针对不同的样本,将同一参数下的色谱数据作为比较分析对象实施上述时间轴调整步骤以及上述数据整形步骤的处理, 上述表制作步骤包括如下步骤: 一维表制作步骤,针对每个样本将通过上述数据整形步骤实施了开头部以及末尾部的处理后的色谱数据,按照上述参数相同来进行整理并在时间方向上相连接来制作一维表,以及 二维表制作步骤,在与时间方向正交的方向上配置在该一维表制作步骤中制作出的针对各不相同的样本的一维表,由此制作二维表。
5.根据权利要求4所述的分析数据处理方法,其特征在于, 上述检测器是质量分析装置,上述参数是质量电荷比。
6.一种分析数据处理装置,用于处理针对一个样本得到的多个色谱数据或者针对多个样本分别得到的多个色谱数据,其特征在于,具备: a)时间轴调整单元,其针对上述多个色谱数据中的作为比较分析对象的多个色谱数据调整时间轴,使得同一成分的出现时间一致; b)数据整形单元,其在完成时间轴调整的作为比较分析对象的多个色谱数据的开头部以及末尾部存在对应于同一时间的数据缺失的色谱数据的情况下,针对该作为比较分析对象的多个色谱数据删除存在数据缺失的时间范围的数据;以及 c)表制作单元,其针对通过上述数据整形单元实施了开头部以及末尾部的处理后的作为比较分析对象的多个色谱数据以如下方式制作二维表:使各色谱数据的数据值按时间顺序纵向或者横向地排列,在与该时间顺序方向正交的横向或者纵向上排列比较分析对象的色谱数据。
7.一种分析数据处理装置,用于处理针对一个样本得到的多个色谱数据或者针对多个样本分别得到的多个色谱数据,其特征在于,具备: a)时间轴调整单元,其针对上述多个色谱数据中的作为比较分析对象的多个色谱数据调整时间轴,使得同一成分的出现时间一致; b)数据整形单元,其在完成时间轴调整的作为比较分析对象的多个色谱数据的开头部以及末尾部存在对应于同一时间的数据缺失的色谱数据的情况下,针对该作为比较分析对象的多个色谱数据使存在数据缺失的时间范围的数据无效;以及 c)表制作单元,其针对通过上述数据整形单元实施了开头部以及末尾部的处理后的作为比较分析对象的多个色谱数据以如下方式制作二维表:使各色谱数据的数据值按时间顺序纵向或者横向地排列,在与该时间顺序方向正交的横向或者纵向上排列比较分析对象的色谱数据。
8.一种分析数据处理装置,用于处理针对一个样本得到的多个色谱数据或者针对多个样本分别得到的多个色谱数据,其特征在于,具备: a)时间轴调整单元,其针对上述多个色谱数据中的作为比较分析对象的多个色谱数据调整时间轴,使得同一成分的出现时间一致; b)数据整形单元,其在完成时间轴调整的作为比较分析对象的多个色谱数据的开头部以及末尾部存在对应于同一时间的数据缺失的色谱数据的情况下,执行以下处理:利用与数据缺失部相同的时间范围且数据没有缺失的其它色谱数据来补充上述缺失部的数据;以及c)表制作单元,其针对通过上述数据整形单元实施了开头部以及末尾部的处理后的作为比较分析对象的多个色谱数据以如下方式制作二维表:使各色谱数据的数据值按时间顺序纵向或者横向地排列,在与该时间顺序方向正交的横向或者纵向上排列比较分析对象的色 谱数据。
【文档编号】G01N30/86GK103620401SQ201180071984
【公开日】2014年3月5日 申请日期:2011年6月29日 优先权日:2011年6月29日
【发明者】山口真一 申请人:株式会社岛津制作所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1