设备分析用数据处理方法以及装置与流程

文档序号:23554241发布日期:2021-01-05 21:15阅读:168来源:国知局
设备分析用数据处理方法以及装置与流程

本发明涉及一种对由质谱分析装置、色谱装置、电子探针显微分析仪(epma)、拉曼光谱成像装置、傅立叶变换红外分光光度测定(ftir)成像装置之类的各种分析装置收集到的测定数据进行处理的设备分析用数据处理方法以及装置,更详细地说,涉及一种用于对由分析装置得到的测定数据进行压缩或者对压缩后的数据进行处理并取出目标信息的方法以及装置。



背景技术:

近年来,用于设备分析的分析装置的高性能化、高功能化显著,随之,通过分析装置的测定而得到的数据的量日益增加。特别是在成像质谱分析装置、ftir成像装置等分析装置中,由于在试样上的二维区域内的多个测定点的每个测定点处得到规定的质荷比范围或波长范围的谱数据,因此从一个试样得到庞大的量的测定数据。

一般用计算机(通常是通用的个人计算机)来处理由分析装置得到的测定数据,但如果测定数据的量庞大,则无法将全部的测定数据取入主存储器(ram)中来进行处理,处理速度降低。另外,如果测定数据的量多,则为了保存测定数据也需要确保大的存储器容量。并且,最近,经由网络传送测定数据并通过云计算机或远程放置的计算机来解析数据的情况也在增加,如果测定数据的量多,则还存在数据传送时的时间、成本变高这样的问题。

为了解决这样的问题,近年来提出了压缩测定数据的各种方法。

例如,在专利文献1中公开了一种对由飞行时间质谱分析装置(tofms)得到的高时间分辨率的质谱数据进行压缩的方法。在该压缩方法中,将在质谱中按质荷比(m/z)值的顺序排列强度值而得到的数据数组划分为可视为噪声水平的数据数组和除此以外的数据数组。然后,对去除了视为噪声水平的数据后的数据数组(也就是说,有用的可能性高的数据数组)进行行程长度编码,另一方面,对视为噪声水平的部分进行静态霍夫曼编码,所述静态霍夫曼编码为熵编码的一种。在该压缩方法中,能够在提高压缩率的同时进行可逆压缩。

另外,在上述压缩方法中还知晓以下一种方法(严格地说,该方法不是压缩方法,但在此设为广义的压缩方法之一):可视为噪声水平的数据也反映在压缩数据中,但通过从质谱数据中删除强度值为某水平以下的数据来削减数据。

然而,在上述专利文献1的压缩方法中存在如下问题。

表示质谱的数据数组由分别存储有作为质谱的横轴的m/z值的信息的m/z值的数组以及数据数与该m/z值的数组的数据数相同的强度值的数组构成。例如,在保存由成像质谱分析装置得到的多个测定点的每个测定点的质谱数据的情况下或者在保存由相同的质谱分析装置得到的针对多个试样的质谱数据的情况下,压缩前的数据数组大多为多个质谱共用的一个m/z值的数组以及与多个质谱分别对应的强度值的数组。

例如,在基于由成像质谱分析装置得到的数据制作表示特定m/z值下的二维强度分布的成像图像的情况下,如果是非压缩的数据,则从与目标m/z值对应的强度值的数组编号(将数据数组上的开头的数据设为“1”而对各数据附加的连续编号)分别获取强度值即可。另外,在利用专利文献1所记载的方法进行压缩后的数据的情况下,需要在实施解压缩处理并进行m/z值的数组与强度值的数组的关联之后,基于与目标m/z值对应的数组编号获取强度值。如果像这样进行解压缩处理,则处理速度当然会降低,如果解压缩后的数据无法完全存储在主存储器中,则处理速度进一步降低。

另一方面,在通过从质谱数据中删除强度值为特定水平以下的数据来进行压缩的方法的情况下,需要按每个质谱准备m/z值的数组信息。在该情况下,为了从多个质谱数据中获取目标m/z值下的强度值,需要进行按每个所述质谱从不同的m/z值的数组找到与目标m/z值对应的数组编号的处理。因此,m/z范围越大的数据的处理越花费时间,或者质谱的数量越多则处理越花费时间。

作为用于提高在各质谱中获取与目标m/z值对应的强度值的处理速度的一个方法,已知一种利用存储有表示原质谱的数据数组上的位置(数组编号)与压缩数据的数据数组上的位置(数组编号)的对应关系的信息的索引的方法。例如,在专利文献2所记载的数据压缩方法中,另外制作保存有将质谱的强度值的数组中的噪声水平以上的有效的强度值连续的部分的压缩后的数组内的开头的数组编号与压缩前的数组编号建立关联的信息的索引,使得在读出数据时参照该索引。

然而,在专利文献2所记载的压缩方法中,有时由于索引的数据量变多而无法得到充分的数据压缩效果。例如,在maldi-tofms的可测定的m/z范围非常宽且测定了蛋白质等生物体试样的情况下,在质谱中遍及宽阔的m/z范围观测到多个峰。如果利用专利文献2所记载的方法对这样的质谱数据进行压缩,则为了针对质谱上的每个峰部分生成索引的信息,索引的数据量自身变得相当大。如果索引的数据量多,则在索引上检索与目标m/z值对应的压缩数据的位置需要花费时间,用于读出目标强度值的处理速度降低。另外,如果索引的数据量大,则还存在数据的压缩效率差的问题。

此外,上述问题不限于由质谱分析装置得到的质谱,在对构成由色谱装置得到的色谱、由电子探针显微分析仪得到的x射线强度谱、由拉曼光谱成像装置或ftir成像装置得到的分光光谱等的数据进行处理的情况下,特别是在对多个光谱或色谱进行处理的情况下也同样存在上述问题。

现有技术文献

专利文献

专利文献1:国际公开2009/069225号刊

专利文献2:日本特开2012-169979号公报



技术实现要素:

发明要解决的问题

本发明是鉴于上述问题而完成的,其目的之一在于提供一种能够在例如由质谱分析装置得到的质谱数据等被压缩后的数据中高速地读出与任意的m/z值对应的强度值的设备分析用数据处理方法以及装置。

另外,本发明的另一个目的在于提供一种能够在确保高的数据压缩效率的同时、例如以使得高速地读出与任意的m/z值对应的强度值的方式压缩质谱数据的设备分析用数据处理方法以及装置。

用于解决问题的方案

为了解决上述问题而完成的第一发明是一种设备分析用数据处理方法,用于处理以如下方式得到的压缩数据并根据该压缩数据求出特定参数值下的强度值:对于通过设备分析得到的与规定参数下的多个值对应的强度值的一维数组即测定数据,在预先决定的无效水平的强度值按照该测定数据的排列顺序连续一个以上的情况下,将该强度值汇总在一起置换为强度值的连续数,另一方面,在出现了除所述无效水平以外的有效水平的强度值的情况下,进行交换行程长度编码,由此进行压缩,所述设备分析用数据处理方法的特征在于,包括以下步骤:

a)连续数确定步骤,从作为处理对象的压缩数据的数组的开头起依次获取有效水平的强度值的连续数以及无效水平的强度值的连续数的信息并逐次地相加,确定其相加结果与对应于作为目标的特定参数值的数组编号一致时的连续数或要超过该数组编号时的连续数;以及

b)强度值搜索步骤,在所述连续数确定步骤中确定的连续数是无效水平的强度值的连续数的情况下,输出表示无效水平的信息或与其相关联的特定强度值,来作为所述特定参数值下的强度值,在已确定的所述连续数是有效水平的强度值的连续数的情况下,在压缩数据的数组上从表示该连续数的数据与表示接下来出现的连续数的数据之间的强度值中找到相应顺序的强度值,将该强度值作为所述特定参数值下的强度值进行输出。

另外,第二发明是用于实施上述第一发明所涉及的数据处理方法的装置,用于处理以如下方式得到的压缩数据并根据该压缩数据求出特定参数值下的强度值:对于通过设备分析得到的与规定参数下的多个值对应的强度值的一维数组即测定数据,在预先决定的无效水平的强度值按照该测定数据的排列顺序连续一个以上的情况下,将该强度值汇总在一起置换为强度值的连续数,另一方面,在出现了除所述无效水平以外的有效水平的强度值的情况下,进行交换行程长度编码,由此进行压缩,所述设备分析用数据处理装置的特征在于,具备:

a)连续数确定部,其从作为处理对象的压缩数据的数组的开头起依次获取有效水平的强度值的连续数以及无效水平的强度值的连续数的信息并逐次地相加,确定其相加结果与对应于作为目标的特定参数值的数组编号一致时的连续数或要超过该数组编号时的连续数;以及

b)强度值搜索部,在由所述连续数确定部确定的连续数是无效水平的强度值的连续数的情况下,所述强度值搜索部输出表示无效水平的信息或与其相关联的特定强度值,来作为所述特定参数值下的强度值,在已确定的所述连续数是有效水平的强度值的连续数的情况下,所述强度值搜索部在压缩数据的数组上从表示该连续数的数据与表示接下来出现的连续数的数据之间的强度值中找到相应顺序的强度值,将该强度值作为所述特定参数值下的强度值进行输出。

此外,上述第一发明和第二发明中的数据压缩方法本身是以往已知的方法。

在用于设备分析的分析装置是包括液相色谱质谱联用仪(lc-ms)或气相色谱质谱联用仪(gc-ms)的质谱分析装置的情况下,规定参数是m/z值,测定数据是质谱数据。

在分析装置是lc或gc等色谱装置的情况下,规定参数是时间,测定数据是色谱数据。

在分析装置是拉曼分光分析装置或ftir的情况下,规定参数是波长(或波数),测定数据是分光光谱数据。在分析装置是epma的情况下,规定参数是x射线的波长或能量,测定数据是x射线谱数据。

当前,作为一例,设为测定数据是质谱数据。在实施第一发明的数据处理方法的第二发明所涉及的数据处理装置中,当例如由用户指定想要获知强度值的特定m/z值时,连续数确定部从作为处理对象的压缩数据的数组的开头起依次获取表示有效水平的强度值的连续数以及无效水平的强度值的连续数的数据并逐次地相加。然后,每当加上连续数时,判定其相加结果是与作为目标的特定m/z值的数组编号(数组上的元素编号)一致还是超过该数组编号。如果相加结果与作为目标的特定m/z值的数组编号一致或超过该数组编号,则将此时的连续数确定为目标连续数。此时,从压缩数据的数组的开头起依次选择性地仅观察表示连续数的数据即可,忽略表示有效水平的强度值的数据即可。

接着,在上述已确定的连续数是无效水平的强度值的连续数的情况下,强度值选择部输出无效水平或与其相关联的特定强度值。另一方面,在上述已确定的连续数是有效水平的强度值的连续数的情况下,由于在强度值的数组中的继表示该连续数的数据之后的部分中存在目标强度值,因此通过从该数组的开头起将数据依次数到基于连续数的相加结果和目标数组编号的数,来找到相应的数组编号的强度值并输出。此外,在此,“无效水平或与其相关联的特定强度值”例如设为包含“0”的特定值或不可能是实际的强度值的规定值。例如,在将“4”以下的强度值视为无效水平的情况下,只要将包含“0”的“4”以下的值中的任一个值确定为无效水平或与其相关联的特定强度值即可。

这样,在第一发明和第二发明中,无需对压缩数据进行解压缩而恢复为原始的测定数据,通过在压缩后的数组中找到表示连续数的数据并进行加上该连续数这样的简单的处理,就能够迅速地求出与作为目标的特定参数值、例如m/z值对应的强度值。

此外,基于数据的一部分比特的信息(0或1)来识别某一个数据是表示有效水平的强度值的连续数还是表示无效水平的强度值的连续数即可。例如,在将一个数据的比特长度设为2字节(16比特)的情况下,将该msb用于识别是表示无效水平的强度值的连续数还是表示除此以外的水平(表示有效水平的强度值的连续数的数据以及表示该强度值的数据)的连续数,用剩余的15比特来表示连续数或强度值的数值即可。

另外,在连续数超过用15比特表示的最大数(32767)的情况下,优选在写入了直到该最大数为止的连续数之后,将超过该数的部分的剩余的连续数写入下一个数据中。

如上所述,在第一发明和第二发明中,从压缩后的数组的开头起依次找到表示连续数的数据,通过进行加上该连续数这样的简单的处理,无需对压缩数据进行解压缩而恢复为原始的测定数据,就能够迅速地求出与作为目标的特定参数值、例如m/z值对应的强度值。这对于进行多个强度值数组的所有元素的加法或减法或者数组内的所有元素的值的加法处理等、使用整个强度值数组的处理是有效的。另一方面,在获取元素数大的强度值数组的末尾附近的特定元素的强度值信息的情况下,仅为了获取一个元素的强度值,就需要许多连续数的加法处理,从而耗费处理时间。

为了解决这样的问题而完成的第三发明是一种设备分析用数据处理方法,用于压缩测定数据,所述测定数据是通过设备分析得到的与规定参数下的多个值对应的强度值的一维数组,所述设备分析用数据处理方法的特征在于,包括以下步骤:

a)数据分割步骤,按每规定个数的数据将测定数据的数组划分为块;

b)数组变换步骤,针对每个块,在预先决定的无效水平的强度值按照该块中包含的测定数据的排列顺序连续一个以上的情况下,将该强度值汇总在一起置换为强度值的连续数,另一方面,在出现了除所述无效水平以外的有效水平的强度值的情况下,进行交换行程长度编码,由此求出各块中的压缩后的数据数组;以及

c)索引制作步骤,收集表示各块的开头的数据在由所述压缩后的各块的数据排列而成的一维数组上的位置的数组编号的信息,来制作索引,并与在所述数组变换步骤中得到的各块的压缩后的数据数组相关联地保存。

另外,第四发明是用于实施上述第三发明所涉及的数据处理方法的装置,用于压缩测定数据,所述测定数据是通过设备分析得到的与规定参数下的多个值对应的强度值的一维数组,所述设备分析用数据处理装置的特征在于,具备:

a)数据分割部,其按每规定个数的数据将测定数据的数组划分为块;

b)数组变换部,针对每个块,在预先决定的无效水平的强度值按照该块中包含的测定数据的排列顺序连续一个以上的情况下,所述数组变换部将该强度值汇总在一起置换为强度值的连续数,另一方面,在出现了除所述无效水平以外的有效水平的强度值的情况下,所述数组变换部进行交换行程长度编码,由此求出各块中的压缩后的数据数组;以及

c)索引制作部,其收集表示各块的开头的数据在由所述压缩后的各块的数据排列而成的一维数组上的位置的数组编号的信息,来制作索引,并与由所述数组变换部得到的各块的压缩后的数据数组相关联地保存。

在该第三发明和第四发明中,与第一发明及第二发明不同,数据压缩方法本身以往是没有的。即,在第三发明所涉及的设备分析用数据处理方法中,首先,在数据分割步骤中,将测定数据的数组划分为包含规定个数的数据的块。然后,在数组变换步骤中,针对每个块,在预先决定的无效水平的强度值按照该数据的排列顺序连续一个以上的情况下,将该强度值一并置换为强度值的连续数,另一方面,在出现了有效水平的强度值的情况下,通过进行交换行程长度编码来求出压缩后的数组。即,对每个块独立地实施与第一发明及第二发明中使用的压缩处理相同的压缩处理即可。由于以限定了数据数的块为单位实施压缩处理,因此与不划分为块的情况(也就是,数据数没有限制的情况)相比,压缩效率稍微降低,但实际上其影响小。

如上所述,由于对每个块独立地进行压缩处理,因此一个块中包含的测定数据的数量是固定的,但与一个块对应的压缩后的数据数不是固定的。因此,在索引制作步骤中,收集表示各块的开头的数据在压缩后的数组中的位置的识别信息,具体地说,收集将压缩后的数据全部排列而成的一维数组上的数组编号,来制作索引。在该情况下,由于针对一个块得到一个索引信息,因此索引信息的量与压缩前的测定数据的强度值的排列或压缩后的数组完全无关。因此,例如在对质谱数据进行压缩时,左右数据点数的m/z范围的宽度与索引的数据量有关,但观测到的峰的个数或其密度等与索引的数据量无关。因此,在第三发明和第四发明中,索引的数据量不会极端地变大,能够抑制包含索引的压缩数据的量。

在第三发明中,优选的是提供一种设备分析用数据处理方法,用于对通过所述数据分割步骤、所述数组变换步骤以及所述索引制作步骤各步骤中的处理进行压缩而得到的压缩数据进行处理,所述设备分析用数据处理方法的特征在于,

为了根据该压缩数据求出特定参数值下的强度值,还包括以下步骤:

d)块确定步骤,参照所述索引来确定包含将与作为目标的特定参数值下的数据的数组编号对应的压缩前的数据进行压缩所得到的信息的块,并求出该块的开头的数据位置的信息;

e)连续数确定步骤,从与已确定的所述块对应的压缩数据的数组的开头起依次获取有效水平的强度值的连续数以及无效水平的强度值的连续数的信息并逐次地相加,确定其相加结果与对应于作为目标的特定参数值的数组编号一致时的连续数或即将超过该数组编号的连续数;以及

f)强度值搜索步骤,在所述连续数确定步骤中确定的连续数是无效水平的强度值的连续数的情况下,输出表示无效水平的信息或与其相关联的特定强度值,来作为所述特定参数值下的强度值,在已确定的所述连续数是有效水平的强度值的连续数的情况下,在压缩数据的数组上从表示该连续数的数据与表示接下来出现的连续数的数据之间的强度值中找到相应顺序的强度值,将该强度值作为所述特定参数值下的强度值进行输出。

另外,同样地,在第四发明中,优选的是提供一种设备分析用数据处理装置,用于对通过所述数据分割部、所述数组变换部以及所述索引制作部各部中的处理进行压缩而得到的压缩数据进行处理,所述设备分析用数据处理装置的特征在于,

为了根据该压缩数据求出特定参数值下的强度值,还具备:

d)块确定部,其参照所述索引来确定包含将与作为目标的特定参数值下的数据的数组编号对应的压缩前的数据进行压缩所得到的信息的块,并求出该块的开头的数据位置的信息;

e)连续数确定部,其从与已确定的所述块对应的压缩数据的数组的开头起依次获取有效水平的强度值的连续数以及无效水平的强度值的连续数的信息并逐次地相加,确定其相加结果与对应于作为目标的特定参数值的数组编号一致时的连续数或要超过该数组编号时的连续数;以及

f)强度值搜索部,在由所述连续数确定部确定的连续数是无效水平的强度值的连续数的情况下,所述强度值搜索部输出表示无效水平的信息或与其相关联的特定强度值,来作为所述特定参数值下的强度值,在已确定的所述连续数是有效水平的强度值的连续数的情况下,所述强度值搜索部在压缩数据的数组上从表示该连续数的数据与表示接下来出现的连续数的数据之间的强度值中找到相应顺序的强度值,将该强度值作为所述特定参数值下的强度值进行输出。

即,在上述优选的数据分析方法以及装置中,首先使用索引来搜索在多个块中的哪一个块中存在与目标m/z值对应的强度值的信息。然后,如果确定了块,则以与第一发明及第二发明类似的过程,来获取例如与目标m/z值对应的强度值。在第一发明和第二发明中,需要始终从数据数组的开头起依次找到连续数的信息并相加,与此相对地,在该第三发明和第四发明所涉及的优选的方法以及装置中,只要从包含在一个块中的数据数组的开头起依次找到连续数的信息并相加即可。因此,虽然取决于一个块中包含的数据数,但通过在某种程度上限定划分为块时的数据数,能够缩短搜索与目标m/z值对应的强度值的时间。即,与第一发明及第二发明相比,能够以较短的处理时间求出目标强度值。

在上述第一发明至第四发明中使用的信号的压缩方法是基于微小强度值的信号不重要或者即使不使用也没有问题这个前提,将强度值为规定水平以下的信号置换为连续数的不可逆的压缩方法。因此,不可能从压缩数据完全恢复为原始的测定数据。根据分析的种类或分析的目的,有时也需要在上述压缩方法中被置换为连续数的微小的强度值的信号。对于这样的目的,专利文献1中记载的可逆的压缩方法是有效的。

即,为了解决上述问题而完成的第五发明的第一方式是对通过专利文献1中记载的压缩方法被压缩后的数据应用了上述第一发明的数据处理方法的设备分析用数据处理方法,用于对以如下方式得到的由多个压缩数据数组构成的压缩数据进行处理并根据该压缩数据求出特定参数值下的强度值:将通过设备分析得到的与规定参数下的多个值对应的强度值的一维数组即测定数据的比特串分割为规定水平以下的低位的比特串和除此以外的高位的比特串,由此将所述测定数据的比特串划分为多个数据数组,对包含高位的比特串的数据数组至少进行基于交换行程长度编码的压缩,另一方面,对包含低位的比特串的数据数组不进行压缩,所述设备分析用数据处理方法的特征在于,包括以下步骤:

a)连续数确定步骤,在作为处理对象的多个压缩数据数组中,从与所述高位的比特串对应的压缩数据数组的开头起依次获取表示不为“0”的值的比特串的连续数以及表示“0”的比特串的连续数的信息并逐次地相加,确定其相加结果与对应于作为目标的特定参数值的数组编号一致时的连续数或即将超过该数组编号的连续数;

b)高位比特信息搜索步骤,在已确定的所述连续数是表示“0”的比特串的连续数的情况下,输出“0”的值来作为所述特定参数值下的高位的比特串,在已确定的所述连续数是表示不为“0”的值的比特串的连续数的情况下,在压缩数据的数组上从表示该连续数的数据与表示接下来出现的连续数的数据之间的比特串中找到相应顺序的比特串,将该比特串作为所述特定参数值下的高位的比特串进行输出;以及

c)强度值获取步骤,在与所述低位的比特串对应的压缩数据数组中,从与特定参数值对应的数组编号获取低位的比特串的信息,连同通过所述高位比特信息搜索步骤输出的比特串的信息一起获取与特定参数值对应的强度值信息。

另外,为了解决上述课题而完成的第五发明的第二方式与上述第一方式同样地,是对通过专利文献1中记载的压缩方法被压缩后的数据应用了上述第一发明的数据处理方法的设备分析用数据处理方法,用于对以如下方式得到的由多个压缩数据数组构成的压缩数据进行处理并根据该压缩数据求出特定参数值下的强度值:将通过设备分析得到的与规定参数下的多个值对应的强度值的一维数组即测定数据的比特串分割为规定水平以下的低位的比特串和除此以外的高位的比特串,由此将所述测定数据的比特串划分为多个数据数组,对包含高位的比特串的数据数组至少进行基于交换行程长度编码的压缩,另一方面,对包含低位的比特串的数据数组进行基于静态霍夫曼编码的压缩,所述设备分析用数据处理方法的特征在于,包括以下步骤:

a)连续数确定步骤,在作为处理对象的多个压缩数据数组中,从与所述高位的比特串对应的压缩数据数组的开头起依次获取表示不为“0”的值的比特串的连续数以及表示“0”的比特串的连续数的信息并逐次地相加,确定其相加结果与对应于作为目标的特定参数值的数组编号一致时的连续数或即将超过该数组编号的连续数;

b)高位比特信息搜索步骤,在已确定的所述连续数是表示“0”的比特串的连续数的情况下,输出“0”的值来作为所述特定参数值下的高位的比特串,在已确定的所述连续数是表示不为“0”的值的比特串的连续数的情况下,在压缩数据的数组上从表示该连续数的数据与表示接下来出现的连续数的数据之间的比特串中找到相应顺序的比特串,将该比特串作为所述特定参数值下的高位的比特串进行输出;以及

c)强度值获取步骤,在作为处理对象的多个压缩数据数组中,对与所述低位的比特串对应的压缩数据数组全部进行解压缩,从该解压缩后的数据数组获取与特定参数值对应的低位的比特串的信息,连同通过所述高位比特信息搜索步骤输出的比特串的信息一起获取与特定参数值对应的强度值信息。

在该情况下,通过静态霍夫曼编码对低位比特进行了压缩,因此与在第一方式中使用的压缩方法相比,压缩效率提高。另一方面,由于需要在通过解压缩处理将所有的低位比特数组复原后搜索与作为目标的特定参数值对应的低位比特的值,因此在处理时间方面是不利的。

另外,为了解决上述课题而完成的第六发明是一种由专利文献1中记载的压缩方法和上述第三发明的数据处理方法中的压缩方法组合而成的设备分析用数据处理方法,用于压缩测定数据,所述测定数据是通过设备分析得到的与规定参数下的多个值对应的强度值的一维数组,所述设备分析用数据处理方法的特征在于,包括以下步骤:

a)数据分割步骤,按每规定个数的数据将测定数据的数组划分为块;

b)数组变换步骤,针对每个块将该块中包含的测定数据的比特串分别分割为规定水平以下的低位的比特串和除此以外的高位的比特串,由此将所述测定数据的比特串划分为多个数据数组,在每个所述块中,对包含高位的比特串的数据数组至少进行交换行程长度编码,另一方面,对于包含低位的比特串的数据数组,直接求出或通过进行静态霍夫曼编码求出各块中的压缩后的多个数据数组;以及

c)索引制作步骤,针对所述压缩后的各块的多个数据数组,收集表示各块的开头的数据在由数据排列而成的一维数组上的位置的数组编号的信息,来制作索引,并与在所述数组变换步骤中得到的各块的压缩后的多个数据数组相关联地保存。

另外,第七发明是用于实施上述第六发明所涉及的数据处理方法的装置,用于压缩测定数据,所述测定数据是通过设备分析得到的与规定参数下的多个值对应的强度值的一维数组,所述设备分析用数据处理装置的特征在于,具备:

a)数据分割部,其按每规定个数的数据将测定数据的数组划分为块;

b)数组变换部,其针对每个块将该块中包含的测定数据的比特串分别分割为规定水平以下的低位的比特串和除此以外的高位的比特串,由此将所述测定数据的比特串划分为多个数据数组,在每个所述块中,对包含高位的比特串的数据数组至少进行交换行程长度编码,另一方面,对于包含低位的比特串的数据数组,直接求出或通过进行静态霍夫曼编码求出各块中的压缩后的多个数据数组;以及

c)索引制作部,其针对所述压缩后的各块的多个数据数组,收集表示各块的开头的数据在由数据排列而成的一维数组上的位置的数组编号的信息,来制作索引,并与由所述数组变换部得到的各块的压缩后的多个数据数组相关联地保存。

在该第六发明和第七发明中,也能够实现与第三发明及第四发明相同的效果。

另外,在上述第六发明中,优选的是提供一种设备分析用数据处理方法,用于对通过所述数据分割步骤、所述数组变换步骤以及所述索引制作步骤各步骤中的处理进行压缩而得到的压缩数据中的、在所述数组变换步骤中没有对低位的比特串进行压缩的压缩数据进行处理,所述设备分析用数据处理方法的特征在于,

为了根据该压缩数据求出特定参数值下的强度值,还包括以下步骤:

d)第一块确定步骤,参照所述索引中的与高位的比特串对应的索引,来确定包含将与作为目标的特定参数值下的数据的数组编号对应的压缩前的高位的比特串进行压缩所得到的信息的块,并求出该块的开头的数据位置的信息;

e)连续数确定步骤,从与在所述第一块确定步骤中确定的块对应的压缩数据的数组的开头起依次获取表示不为“0”的值的比特串的连续数以及表示“0”的比特串的连续数的信息并逐次地相加,确定其相加结果与对应于作为目标的特定参数值的数组编号一致时的连续数或即将超过该数组编号的连续数;

f)高位比特信息搜索步骤,在所述连续数确定步骤中确定的连续数是表示“0”的比特串的连续数的情况下,输出“0”的值来作为所述特定参数值下的高位的比特串,在已确定的所述连续数是表示不为“0”的值的比特串的连续数的情况下,在压缩数据的数组上从表示该连续数的数据与表示接下来出现的连续数的数据之间的比特串中找到相应顺序的比特串,将该比特串作为所述特定参数值下的高位的比特串进行输出;以及

g)强度值获取步骤,从与特定参数值对应的数组编号获取低位的比特串的信息,连同通过所述高位比特信息搜索步骤输出的比特串的信息一起获取与特定参数值对应的强度值信息。

另一方面,提供一种设备分析用数据处理方法,在低位比特的数据数组被进行了霍夫曼编码的情况下,对通过所述数据分割步骤、所述数组变换步骤以及所述索引制作步骤各步骤中的处理进行压缩而得到的压缩数据中的、在所述数组变换步骤中对低位的比特串进行了静态霍夫曼编码的压缩数据进行处理,所述设备分析用数据处理方法为了根据该压缩数据求出特定参数值下的强度值,包括以下步骤即可:

d)第一块确定步骤,参照所述索引中的与高位的比特串对应的索引,来确定包含将与作为目标的特定参数值下的数据的数组编号对应的压缩前的高位的比特串进行压缩所得到的信息的块,并求出该块的开头的数据位置的信息;

e)连续数确定步骤,从与在所述第一块确定步骤中确定的块对应的压缩数据的数组的开头起依次获取表示不为“0”的值的比特串的连续数以及表示“0”的比特串的连续数的信息并逐次地相加,确定其相加结果与对应于作为目标的特定参数值的数组编号一致时的连续数或者即将超过该数组编号的连续数;

f)高位比特信息搜索步骤,在所述连续数确定步骤中确定的连续数是表示“0”的比特串的连续数的情况下,输出“0”的值来作为所述特定参数值下的高位的比特串,在已确定的所述连续数是表示不为“0”的值的比特串的连续数的情况下,在压缩数据的数组上从表示该连续数的数据与表示接下来出现的连续数的数据之间的比特串中找到相应顺序的比特串,将该比特串作为所述特定参数值下的高位的比特串进行输出;

g)第二块确定步骤,参照所述索引中的与低位的比特串对应的索引,来确定包含与作为目标的特定参数值下的数据的数组编号对应的压缩前的低位的比特串的块,并求出该块的开头的数据位置的信息;以及

h)强度值获取步骤,对源自与在所述第二块确定步骤中确定的块对应的低位比特的压缩数据数组全部进行解压缩,之后根据对应于特定参数值的数组编号与该块的开头的数组编号之差,从解压缩后的数据数组获取与特定参数值对应的低位的比特串的信息,连同通过所述高位比特信息搜索步骤输出的比特串的信息一起获取与特定参数值对应的强度值信息。

发明的效果

根据第一发明、第二发明以及第五发明,能够从质谱数据等测定数据被压缩的状态的压缩数据中高速地获取与任意的m/z值等任意的参数值对应的强度值。因此,例如能够基于由成像质谱分析装置收集到的多个测定点中的每个测定点的质谱数据,在短时间内制作任意的m/z值的成像图像并进行显示。

另外,根据第三发明、第四发明以及第六发明,能够在确保高的数据压缩效率的同时,以比第一发明、第二发明以及第五发明更高速、也就是更短的处理时间获取与任意的m/z值等对应的强度值。

附图说明

图1是使用了本发明所涉及的设备分析用数据处理装置的一个实施例的成像质谱分析系统的概要结构图。

图2是使用了本发明所涉及的设备分析用数据处理装置的其它实施例的成像质谱分析系统的概要结构图。

图3是第一数据压缩方法的原理说明图。

图4是根据第一数据压缩方法中的压缩数据求出特定m/z位置的强度值时的处理过程的说明图。

图5是第二数据压缩方法的原理说明图。

图6是根据第二数据压缩方法中的压缩数据求出特定m/z位置的强度值时的处理过程的说明图。

图7是示出根据第一数据压缩方法中的压缩数据求出特定m/z位置的强度值时的处理流程的流程图。

图8是示出根据第一数据压缩方法中的压缩数据求出特定m/z范围的累计强度值时的处理流程的流程图。

图9是示出根据第二数据压缩方法中的压缩数据求出特定m/z位置的强度值时的处理流程的流程图。

图10是示出根据第二数据压缩方法中的压缩数据求出特定m/z范围的累计强度值时的处理流程的流程图。

图11是示出根据第二数据压缩方法中的压缩数据制作用于多变量解析等的数据数组时的处理流程的流程图。

图12是示出根据第二数据压缩方法中的压缩数据制作在m/z轴上进行了分箱的数据数组时的处理流程的流程图。

图13是示出根据第二数据压缩方法中的压缩数据制作在m/z轴上进行了分箱的数据数组时的处理流程的流程图(继图11的流程图之后)。

图14是第三数据压缩方法的原理说明图。

图15是第四数据压缩方法的原理说明图。

具体实施方式

以下,参照附图对本发明所涉及的设备分析用数据处理方法以及装置的实施例进行说明。

在以下的例子中,实施设备分析的分析装置是质谱分析装置,得到的测定数据是质谱数据。此外,在飞行时间质谱分析装置的情况下,通过执行分析,首先得到飞行时间谱,通过将飞行时间换算为质荷比来得到质谱。因而,构成将飞行时间换算为质荷比之前的飞行时间谱的数据也能够视为质谱数据。但是,如后所述,能够应用本发明的分析装置不限于此。

[第一压缩方法]

参照图3对与本发明相关联的第一压缩方法的原理进行说明。

图3的(c)是根据质谱数据制作的质谱的一例。横轴是m/z值,纵轴是强度值,构成该质谱的质谱数据能够用与离散的m/z值分别对应的强度值的一维数组来表示。即,例如当设为m/z范围是1~2000时,得到(m/z1,m/z2,m/z3,…,m/z1999,m/z2000)这样的m/z值的一维数组以及与之对应的(0,123,3,…,13,0)等强度值的一维数组,来作为质谱数据。

如众所周知的那样,在质谱上叠加由各种因素引起的噪声,该噪声被观测为微小的峰。例如在化合物的鉴定或定量或者在成像质谱分析装置中掌握特定化合物的二维强度分布等时,该微小的峰是不需要的,反而成为障碍。因此,作为压缩处理前的一种噪声去除处理,将规定的水平以下的强度值置换为无效数据。在图3的(a)中,用“*”表示被置换后的该无效数据。例如,如果将“4”以下的强度值定义为无效,则在图3的(a)中用“*”表示的数据的原始的强度值为“0”~“4”中的任一个。另外,在向质谱分析装置的检测器的输入(离子量)过大而检测器输出有可能饱和那样的情况下,在强度值为预先决定的上限值时,将该强度值也作为无效数据来处理即可。即,不仅在强度值小到可视为噪声的程度的情况下而且在强度值为超过检测器的动态范围那样的过大的状态的情况下将强度值设为无效数据即可。

如图3的(a)所示,在对一维地排列的强度值进行压缩时,从该数组的开头起依次检查各强度值,在有效的强度值连续了一个以上的情况下,在该开头记录该有效的强度值连续的连续数的信息,紧接其后直接记录该有效的强度值的数组。因而,当有效的强度值连续n个时,该n个强度值置换为n+1个数据数组。在图3的(a)的例子中,由于在数组的开头仅存在一个有效的强度值,因此通过压缩,在开头记录“1”来作为连续数,紧接其后直接记录有效的强度值“15”。另外,“11”、“57”、“15”这三个强度值连续的数组置换为“3”、“11”、“57”、“15”这四个数据。

另一方面,在无效的强度值连续的情况下,无论该强度值是多少个,都将该无效的强度值整体置换为无效的强度值的连续数的一个值。在图3的(a)的例子中,从第2个到第14个的数组编号的数据全部是无效数据,因此该13个数据被汇总地置换为表示一个连续数“13”的数据。即,由此大幅地削减了数据量。

但是,仅通过进行如上所述的处理,无法识别无效数据的连续数和有效数据的连续数。因此,在用2字节(2×8比特=16比特)的比特长度表示一个数据的情况下,用该16比特中的低位15比特表示连续数的数值,将最高位的比特(msb)作为用于识别是有效的强度值的连续数还是无效的强度值的连续数的识别符来使用即可。具体地说,当msb为“1”时,低位15比特数据表示有效的强度值的连续数或紧接该连续数之后的强度值,当msb为“0”时,定义为低位15比特数据表示无效的强度值的连续数即可。在图3的(b)中,在msb为“0”的数据之上记载了“0”。

此外,代替以上述顺序进行压缩,即使利用专利文献1所记载的方法的一部分,结果也能够生成相同的数组的压缩后数据。

此外,期望如上所述那样的压缩后的数据数组中的各数据的尺寸(比特长度)相等。另一方面,强度值的最大比特长度由该强度值的上限或动态范围决定,与此相对地,连续数的值由m/z范围或m/z值轴上的m/z值间隔决定,与强度值的最大比特长度相比有可能变得相当大。因此,如果在压缩数据数组中考虑连续数的最大比特长度来决定一个数据尺寸,则有可能产生极大的浪费。因此,例如,压缩数据数组上的一个元素的数据尺寸可以设为8比特(1字节),表示有可能纳入不了其中的连续数的值可以使用多个(例如,2个)元素。如后述那样,在根据通过本压缩方法压缩后的数据求出特定m/z值下的强度值时,从压缩后的数据数组的开头起依次一边确认数据一边读取连续数。因此,能够确定在某一个连续数之后存储有连续数的位置。由此,能够明确地区分存储有有效的强度值本身的元素和存储有连续数的值的元素。因此,在与数据的开头及连续数的存储位置相应的部分,能够将连续的两个元素中存储的数据各自的比特串作为高位比特和低位比特进行组合,来作为16比特的表示连续数的信息进行处理。

另外,质谱的强度值也可以不是整数型数据而是浮点型数据。例如,在强度值以32比特的浮点型数据进行存储的情况下,压缩后的数组的数据尺寸也设为32比特,而只有存储有连续数的元素设为32比特的整数型来处理即可。

[从通过第一压缩方法得到的压缩数据获取与特定m/z值对应的强度值的方法]

图4是说明了根据通过上述第一数据压缩方法压缩后的数据求出与特定m/z值对应的强度值时的概要过程的图。

当指定了想要求出强度值的特定m/z值时,根据上述m/z值的数组的信息来明确特定m/z值下的强度值在非压缩数据数组上的位置,即数组编号。当前,在本例中,如在图4的(a)中用箭头所示那样,表示目标强度值在非压缩数组数据上的位置的数组编号为“16”。

在图4的(b)所示的压缩数据的数组上,从开头起依次找到表示连续数的值,并将该连续数逐次相加。具体地说,由于开头的数据一定是连续数,因此根据该连续数的值“1”可知表示下一个连续数的数据位于第3个。因此,对最初的连续数“1”加上用第3个数据表示的连续数“13”。由于该连续数是无效数据的连续数,因此接下来的第4个数据表示有效数据的连续数。因此,如果再加上用该第4个数据表示的连续数“3”,则相加结果为“17”,超过在非压缩数据数组上存在目标强度值的数组编号“16”。因此,紧接在存储着在该时刻最后加上的连续数的位置之后的三个强度值中存在目标强度值。

由于在此之前的连续数的相加值是“14”,因此可知继有效的强度值的连续数“3”之后的三个强度值在非压缩数据数组上的数组编号为“15”、“16”以及“17”。因此,在其中选择位于数组编号为“16”的位置(图4的(b)中的下划线箭头所示)的强度值“57”,并将其作为与作为目标的特定m/z值对应的强度值进行输出即可。

这样,能够从压缩数据的数组的开头起依次找到连续数并相加,根据其相加结果和非压缩数据数组上的数组编号,找到目标强度值。因而,无需对压缩数据进行解压缩而恢复为原始的数据,就能够迅速地找到与作为目标的特定m/z值对应的强度值。

[采用了第一压缩方法的第一实施例的成像质谱分析系统的结构]

图1是在数据保存中利用了上述第一压缩方法的第一实施例的成像质谱分析系统的概要结构图。

该成像质谱分析系统具备:成像质谱分析部1,其对试样上的二维区域内的多个测定点分别执行质谱分析并获取质谱数据;数据处理部2,其实施数据压缩处理等数据处理;数据保存部3,其保存由该数据处理部2进行压缩后的数据;操作部4,其由用户操作;以及显示部5,其显示分析结果等。数据处理部2的实体是个人计算机,作为功能块,包括谱数据收集部20、主存储器21、数据压缩处理部22、数据解压缩处理部23、数据读出处理部25、成像图像制作处理部26等。另外,数据保存部3具有压缩数据存储区域30。

谱数据收集部20读入在成像质谱分析部1中按每个测定点得到的质谱数据,并暂时存储在主存储器21或未图示的外部硬盘等辅助存储装置、或者数据保存部3中图示的存储区域30以外的区域中。数据压缩处理部22通过上述第一压缩方法分别压缩针对各测定点的质谱数据,并将压缩后的数据存储在数据保存部3的压缩数据存储区域30中。例如,在根据特定的测定点处的压缩数据再现地显示质谱的情况下,数据解压缩处理部23从数据保存部3读出与通过操作部4指定的测定点对应的压缩数据,实施与压缩时相反的解压缩处理,来再现质谱并显示在显示部5的画面上。但是,由于在上述压缩方法中去除了无效水平的信号,因此通过解压缩处理再现的质谱并不是通过测定得到的质谱本身。

例如,当通过操作部4指示显示特定m/z值下的成像图像时,数据读出处理部25从数据保存部3读出压缩数据,并获取与在各测定点处指定的m/z值对应的强度值。此时,在上述以及后述的过程中,不实施解压缩处理就能够读出目标强度值。成像图像制作处理部26基于各测定点处的强度值来制作成像图像,并显示在显示部5的画面上。由于m/z值的一维数组对于所有测定点是共用的,因此在未压缩数据数组上与特定m/z值对应的数组编号是相同的。因此,能够按每个测定点迅速地读出目标强度值,也能够在短时间内制作特定m/z值下的成像图像。

[获取与特定m/z值对应的强度值时的详细处理]

图7是示出在第一实施例的成像质谱分析系统中求出特定m/z位置的强度值时由数据读出处理部25实施的详细处理的流程图。在此,s是想要获取强度值的数据在非压缩数据数组上所在的数组编号。根据m/z值的一维数组的信息,s是已知的。u是表示当前关注的非压缩数据数组上的数组编号的变量。另外,p是表示当前关注的压缩数据数组上的数组编号的变量。

此外,除了说明了压缩原理等的上述图3、图4之外,在后述的图5、图6、图14以及图15中,为了容易理解地表示数据数组上的数据的顺序,从该数组的开头起将数组编号设为1、2、…。然而,如众所周知的那样,在使用了计算机等的数字信号处理领域中,在对附加有如上述那样的连续编号的数据进行处理时,一般将其开头的数据编号设为0来实施处理。在本实施例的装置中,也在装置的内部或软件中将位于数据数组上的开头位置的数据的数组编号设为0来实施处理。因此,在以下的图7~图12所示的流程图中,对应于实际的装置的内部处理,以位于数据数组的开头位置的数据的数组编号为0的情况为前提。因而,这些流程图中的数组编号为从图3~图6、图14以及图15中的数组编号中减去1而得到的。

首先,作为初始设定,将变量u设定为初始值0(步骤s101)。另外,将变量p设定在压缩数据数组的开头位置(也就是“1”)(步骤s102)。接着,获取位于变量p的位置的数据的值v(步骤s103),判定该值v的msb是否为“1”(步骤s104)。如果msb为“1”,则值v表示有效的强度值的连续数。因此,如果msb为“1”(在s104中为“是”),则将从值v中去除msb后的剩余的比特所表示的值与该时刻的变量u的值相加(步骤s105)。另一方面,在步骤s104中判定为“否”的情况下,值v的msb为“0”,这意味着值v是无效的强度值的连续数。因此,将该值v直接与该时刻的变量u的值相加(步骤s109)。但是,实际上即使在步骤s109中去除msb后进行加法运算,结果也是相同的。

由于在步骤s101中变量u被设定为0,因此在初次执行步骤s105或s109中的处理时,在该步骤s105或s109中被加上的值直接变为变量u的值。如果用图4所示的例子进行说明,则在初次实施步骤s104时,在s104中判定为“是”,在接下来的步骤s105的处理中,变量u的值从“0”变为“1”。

在执行步骤s105之后,将对用从值v中去除msb后的剩余的比特表示的值加1而得到的值与变量p的值相加。由此,在压缩数据数组上关注的数据的当前位置前进(步骤s106)。在图4所示的例子中,由于用从值v中去除msb后的剩余的比特表示的值是“1”,因此在压缩数据数组上关注的数据的位置以对该比特表示的值加1而得到的“2”前进到第3个位置。这意味着跳过也就是不观测表示有效的强度值的数据。然后,判定变量u的值是否大于目标数组编号s(步骤s107),如果为“否”,则从步骤s107返回到s103。

另一方面,表示无效数据的连续数的数据的下一个数据是表示有效的强度值的连续数的数据,因此在执行步骤s109之后,使变量p的值增加1。由此,在压缩数据数组上关注的数据的当前位置前进1(步骤s110)。之后,与步骤s107同样地,判定变量u的值是否大于目标数组编号s(步骤s111),如果为“否”,则从步骤s111返回到s103。在从步骤s107或s111返回到s103的情况下,重复进行上述步骤s103~s107、s109~s111的处理。由此,能够一边在压缩数据数组上仅选择表示连续数的数据,一边搜索目标数组编号的数据的位置。

在步骤s107中判定为“是”时,此时的连续数是有效的强度值的连续数。此时,在压缩数据数组上,获取位于从用该时刻的变量p表示的位置返回了[变量u的值-目标数组编号s]后的位置的数据的值。即,从在步骤s107中判定为“是”时的连续数之后记录的有效的强度值的数组中获取与目标数组编号相当的位置的强度值。然后,输出获取到的该值,来作为与目标m/z值对应的强度值(步骤s108)。

另一方面,在步骤s111中判定为“是”时,此时的连续数是无效的强度值的连续数。此时,无条件地输出被定义为无效值的值,来作为与目标m/z值对应的强度值(步骤s112)。

如上所述,不对压缩数据进行解压缩就能够获取与作为目标的特定m/z值对应的强度值。

[获取与特定m/z范围对应的强度累计值时的处理]

在显示成像图像时,存在希望制作强度累计值的成像图像的情况,该强度累计值不是对特定的一个m/z值进行累计而是对特定m/z范围内包含的多个强度值进行累计而得到的。图8是示出在获取对特定m/z范围内包含的多个强度值进行累计而得到的强度累计值时由数据读出处理部25实施的详细处理的流程图。

在此,ss是与作为累计对象的m/z范围的下限对应的强度值的数据在非压缩数据数组上所在的数组编号,se是与同样作为累计对象的m/z范围的上限对应的强度值的数据所在的数组编号。根据m/z值的一维数组的信息,ss和se是已知的。另外,c是对累计数据点数进行计数的计数器的计数值。另外,u、p是表示当前关注的非压缩数据数组上的数组编号的变量和表示当前关注的压缩数据数组上的数组编号的变量。

首先,将计数器的计数值c设定为下限的数组编号ss,并且将变量u设定为0(步骤s201)。之后的步骤s202~s207、s212~s214各步骤的处理与图7中的步骤s102~s107、s109~s111各步骤的处理相同(但是,在步骤s207、s214中与变量u进行比较的对象被变更为计数器c的计数值),因此省略说明。

在步骤s207中判定为“是”时,在压缩数据数组上,获取位于从用该时刻的变量p表示的位置返回了[变量u的值-目标数组编号s]后的位置的数据的值。即,从在步骤s207中判定为“是”时的连续数之后记录的有效的强度值的数组中获取相当于目标数组编号的位置的强度值。然后,将获取到的该值与强度累计值相加(步骤s208)。之后,使计数器的计数值c递增1(步骤s209)。然后,判定该计数值c是否为变量u的值以上(步骤s210),如果为“是”,则从步骤s210返回到s203。如果在步骤s210中为“否”,则判定计数值c是否超过上限的数组编号se(步骤s211),如果为“否”,则返回到步骤s208。如果在步骤s211中为“是”,则应进行累计的强度值全部被累计,因此结束处理。

另一方面,在步骤s214中判定为“是”时,直接、也就是不进行累计就使计数器的计数值c递增1(步骤s215)。然后,判定该计数值c是否为变量u的值以上(步骤s216),如果为“是”,则从步骤s216返回到s203。如果在步骤s216中为“否”,则判定计数值c是否超过上限的数组编号se(步骤s217),如果为“否”,则返回到步骤s215。如果在步骤s217中为“是”,则应进行累计的强度值全部被累计,因此结束处理。

如上所述,无需对压缩数据进行解压缩,就能够获取对与作为目标的特定m/z范围对应的多个强度值进行累计得到的强度累计值。

为了制作并显示特定m/z值或特定m/z范围的成像图像,利用m/z值的一维数组的信息来求出与特定m/z值对应的数组编号或与特定m/z范围的下限和上限分别对应的数组编号。然后,按照上述过程从对各测定点处的质谱数据分别进行压缩得到的压缩数据数组中获取与作为目标的特定m/z值对应的强度值或与作为目标的特定m/z范围对应的强度累计值。然后,基于多个测定点处的强度值或强度累计值制作成像图像,并将其显示在显示部5的画面上。

[第二压缩方法]

接着,参照图5对与本发明相关联的第二压缩方法的原理进行说明。

上述第一压缩方法是不使用索引的压缩方法,因此有利于削减数据量,但在获取与特定m/z值对应的强度值时,必须从压缩数据数组的开头起依次加上连续数,在m/z范围宽的质谱数据中获取高m/z区域的强度值时有时会花费时间。第二压缩方法改善了这一点。

在原始的质谱数据的强度值的数组中进行将该强度值的水平为规定以下的数据设为无效数据的预处理这一点与第一压缩方法相同。图5的(a)是这样的预处理后的非压缩数据数组的一例。其特征点在于,并非直接对该非压缩数据数组进行压缩处理,而是划分为包含固定的数据数的块,对每个块独立地进行压缩。在图5的例子中,以各块包含1000个数据的方式对数据数组进行了划分。

以与第一压缩方法同样的过程对如上所述那样划分出的每个块独立地进行压缩。即,如果从各块的开头的数据起,有效的强度值依次连续,则将该连续数配置在开头,在此之后配置强度值的数组。由此,n个连续的有效的强度值置换为n+1个数据数组。另一方面,如果无效的强度值是连续的,则与其数量无关地将该连续的无效强度值置换为表示1个连续数的数据。由此,例如由图5的(a)所示的1个块中包含的1000个数据构成的数组置换为7个数据。

另外,在压缩数据的数组上收集作为各块的开头的数据位置的数组编号来制作一维数组,并将其作为索引信息与压缩数据的数组一起保存。在图5的例子中,各块的开头的数据的数组编号为“1”、“8”,因此它们成为索引信息。在该压缩方法中,由于将非压缩的数据数组划分为块,因此例如连续的无效强度值被分成两个块,与第一压缩方法相比,压缩效率可能会相应地降低。另外,由于制作索引,因此数据量也相应地增加,在这一点上也有可能降低压缩效率。然而,如后述那样,与第一压缩方法相比,实际的数据量的增加并不那么多,是能够充分容许的程度。

[从通过第二压缩方法得到的压缩数据获取与特定m/z值对应的强度值的方法]

图6是说明了根据通过上述第二数据压缩方法进行压缩后的数据求出与特定m/z值对应的强度值时的概要过程的图。

当指定了想要求出强度值的特定m/z值时,根据上述m/z值的数组的信息来明确特定m/z值下的强度值在非压缩数据数组上的位置,即数组编号。当前,在该例中,如在图6的(a)中用箭头所示那样,表示目标强度值在非压缩数组数据上的位置的数组编号为“1003”。

当在图6的(b)所示的压缩数据的数组上搜索非压缩数组数据上的数组编号为“1003”的强度值时,首先使用索引。即,在索引中存储有各块的开头在压缩数据数组上的位置的信息。因此,如果从索引的一维数组上的数组编号减去1、而且在乘以每个块的非压缩时的数据数(在此为1000)后加上1,则求出各块的开头在非压缩数据数组上的数组编号。在图6的例子中,在索引的一维数组上数组编号为“2”的位置处存储有“8”来作为索引信息,但如果从该数组编号“2”减去1后乘以1000再加上1,则求出“1001”。因而,可知压缩数据数组上的数组编号“8”与非压缩数据数组上的数组编号“1001”对应。因此,使压缩数据数组上的数组编号“8”的数据与相当于非压缩数据数组上的数组编号“1001”的数据对应,并通过在第一压缩方法中利用的读出方法来搜索与目标m/z值对应的强度值即可。

在图6的例子中可知,由于压缩数据数组上的数组编号“8”的数据的msb为“0”,因此表示无效数据的连续数。由于该连续数为“4”,因此非压缩数据数组上的数组编号“1003”包含于其中。因此,可知非压缩数据数组上的数组编号“1003”的数据是无效的强度值。这样,通过利用索引找到各块的开头的位置来读取无效的强度值的连续数和有效的强度值的连续数的信息并相加的作业只要从包含与目标m/z值对应的数据的块的开头开始做起即可。即,在该情况下,仅对最大相当于非压缩的1000个数据的、压缩后的数组进行上述作业即可,与从整个压缩数据数组的开头起依次进行上述作业的情况相比,能够缩短搜索时间。

在第二压缩方法中附加了索引,在上述处理中在搜索目标强度值时利用了索引,但即使不使用索引,也能够通过与针对通过第一压缩方法得到的压缩数据的数据处理同样的方法,来读出目标强度值。这样,在仅使用了除索引以外的压缩数据部分的情况下,虽然不能通过利用了索引的必要最低限度的块内的处理来实现高速化,但具有能够确保与进行了通常的解压缩处理后的数据处理、针对通过第一压缩方法得到的压缩数据的数据处理之间的处理互换性的优点。由此,例如即使是仅搭载了用于针对通过第一压缩方法得到的压缩数据进行数据处理的软件的装置,也能够从通过第二压缩方法得到的压缩数据中获取与目标m/z值对应的强度值等、例如实施成像质谱分析数据的解析所需的最低限度的处理。另外,即使在所保存的索引信息损坏而无法读出的状况下,也能够进行必要的数据处理。

[第二实施例的成像质谱分析系统的结构]

图2是在数据保存中利用了上述第二压缩方法的第二实施例的成像质谱分析系统的概要结构图。

在该成像质谱分析系统中,对与上述第一实施例的成像质谱分析装置中的构成要素相同或相当的构成要素标注相同的附图标记并省略说明。在该成像质谱分析系统中,在数据处理部2中附加索引制作处理部24,在数据保存部3中设置有索引存储区域31。

谱数据收集部20读入在成像质谱分析部1中按每个测定点得到的质谱数据,并暂时存储在主存储器21或未图示的外部硬盘等辅助存储装置、或者数据保存部3中图示的存储区域30以外的区域中。数据压缩处理部22通过上述第二压缩方法将针对各测定点的质谱数据划分为包含规定数量的数据的多个块之后,对每个块分别进行压缩并将压缩后的数据存储在数据保存部3的压缩数据存储区域30中。另外,每当由数据压缩处理部22以块为单位进行压缩时,索引制作处理部24如上所述那样收集块开头的位置信息来制作索引。然后,将制作出的索引存储在数据保存部3的索引存储区域31中。

例如,在根据特定的测定点处的压缩数据再现质谱并进行显示的情况下,数据解压缩处理部23从数据保存部3读出与通过操作部4指定的测定点对应的压缩数据以及与压缩数据对应的索引,实施与压缩时相反的解压缩处理,来再现质谱并显示在显示部5的画面上。另外,例如,当通过操作部4指示显示特定m/z值的成像图像时,数据读出处理部25从数据保存部3读出压缩数据以及与压缩数据对应的索引,从而获得与在每个测定点处指定的m/z值对应的强度值。此时,在上述以及后述的过程中,不实施解压缩处理就能够读出目标强度值。成像图像制作处理部26基于各测定点处的强度值来制作成像图像,并显示在显示部5的画面上。

[获取与特定m/z值对应的强度值时的详细处理]

图9是示出在第二实施例的成像质谱分析系统中求出特定m/z位置的强度值时由数据读出处理部25实施的详细处理的流程图。在此,s、u、p与已经在图7中说明的定义相同。另外,n是压缩前的1个块的数据数。在图5、图6的例子中n=1000。

首先,利用与想要确认强度值的m/z值对应的非压缩数据数组上的数组编号s和索引,找到数组编号比数组编号s小的、块的开头的数组编号。然后,将从该数组编号减去1得到的值设定为变量u的初始值(步骤s301)。如上所述,在目标m/z值的数组编号为“1003”的情况下,变量u的值为1000。接着,在索引的数组上从第(u/n)+1个数据获取上述块的开头在压缩数据数组中的数组编号(在图5、图6的例子中为“8”)(步骤s302)。然后,将获取到的该值设定为变量p(步骤s303)。通过步骤s301~s303的处理,来决定在压缩数据数组上开始读出连续数的开头的位置。

步骤s304~s313的各处理与图7所示的步骤s103~s112的各处理基本相同,因此省略详细的说明。即,与针对通过第一压缩方法得到的压缩数据的处理的不同点仅在于,搜索与作为目标的特定m/z值对应的强度值的数组编号时的初始值是压缩数据的所有数组的开头,还是包含与该m/z值对应的强度值的块的开头。在该情况下,由于搜索范围被限定在一个块内,因此能够在短时间内获取目标强度值。

[获取与特定m/z范围对应的强度累计值时的处理]

图10是示出在第二实施例的成像质谱分析系统中获取对特定m/z范围内包含的多个强度值进行累计而得到的强度累计值时由数据读出处理部25实施的详细处理的流程图。ss、se、n、c、u、p的定义与在此之前的说明相同。另外,在图10中用q表示的部分与在图8中用q表示的步骤相同。

首先,利用与想要确认强度值的m/z范围的下限对应的非压缩数据数组上的数组编号ss和索引,找到数组编号比数组编号ss小的、块的开头的数组编号。然后,将从该数组编号减去1得到的值设定为变量u的初始值(步骤s401)。将计数器的计数值c设定为下限的数组编号ss(步骤s402)。接着,在索引的数组上从第(u/n)+1个数据获取上述块的开头在压缩数据数组中的数组编号(步骤s403)。然后,将获取到的该值设定为变量p(步骤s404)。通过步骤s401~s404的处理,来决定在压缩数据数组上开始读出连续数的开头的位置。

之后的步骤s405~s411、s414~s417以及q中包含的各步骤的处理与图8中的步骤s203~s217各步骤的处理相同,因此省略说明。在该情况下,搜索与目标m/z范围对应的强度值的块也被限制,因此能够在短时间内获取目标强度累计值。

为了制作并显示特定m/z值或特定m/z范围的成像图像,利用m/z值的一维数组的信息来求出与特定m/z值对应的数组编号或者与特定m/z范围的下限和上限分别对应的数组编号。然后,按照上述过程从对各测定点处的质谱数据分别进行压缩得到的压缩数据数组中获取与作为目标的特定m/z值对应的强度值或与作为目标的特定m/z范围对应的强度累计值。然后,基于多个测定点处的强度值或强度累计值制作成像图像,并将其显示在显示部5的画面上。

[在多变量解析等中利用的数据数组的制作处理]

一般来说,在对多个质谱数据进行主成分分析等多变量解析的情况下,大多并非将全部文件数据用于解析,而是对从文件数据中抽出有效峰的信息(m/z值和强度)而制作出的峰强度信息进行解析。例如,质谱上的峰由多个数据点构成,但通常对从峰的中心(重心)起特定的容许幅度的范围内包含的数据点的强度值进行累计、或者计算考虑了横轴的m/z值的面积值(积分值)、或者求出将面积值除以峰的幅度而得到的平均强度值等,由此用一个强度值来表现一个峰,并对将该强度值配置成数组状而得到的数据数组执行多变量解析。作为代表峰的一个强度值,也有时仅使用峰顶的强度值。

在任何情况下,在根据压缩数据数组制作如上述那样的数据数组时,以如下过程来进行制作即可。

(1)m/z值列表的制作

首先,针对将作为解析对象的多个质谱的全部或一部分进行平均而求出的平均谱或多个质谱,求出按每个m/z值抽出最大强度的信号而制作出的最大强度谱。然后,调查在该谱上观测到的各峰的m/z范围,并制作与各峰的起点及终点对应的m/z值的列表。峰的m/z范围例如设为在构成质谱上的峰的多个数据中强度值超过规定的阈值的m/z范围即可。或者,也可以在峰顶或重心位置的前后设置容许幅度,将该容许幅度的范围视为峰的m/z范围来决定峰的起点和终点。另外,为了削减在解析中使用的数据量,也可以在如上述那样制作出的虚拟的峰列表中仅抽出在质谱上强度值为规定值以上的峰,来制作最终的m/z值的列表。另外,也可以基于多种化合物的质量的理论值或过去的实测值来制作m/z值的列表。

(2)数据数组的强度值信息的计算

作为数据数组的各元素即强度值,能够使用以下的累计强度值、峰顶强度值、质心强度值中的任一个。

(a)累计(平均)强度值

以如上所述那样制作出的m/z范围的列表为基础,根据与作为解析对象的多个质谱有关的压缩数据数组,来求出与列表中列举的各m/z范围对应的累计强度值。在根据各质谱计算列表中列举的各m/z范围的累计强度值时,重复实施上述的强度值累计处理即可。另外,在对强度值进行累计的过程中,也可以将在m/z值轴上邻接的数据点之间的m/z值的差乘以强度值来作为面积值。另外,也可以将用进行了累计的数据点数除累计后的值所得到的平均值作为代表各峰的一个强度值。

(b)峰顶强度值

在使用峰顶的强度值作为代表峰的一个强度值的情况下,按各质谱的列表中列举的每个m/z范围实施如下的最大值计算处理,来获取各m/z范围内包含的峰的峰顶的强度值即可。图11是示出在第二实施例的成像质谱分析系统中获取m/z范围内包含的一个峰的峰顶的强度值时由数据读出处理部25实施的详细处理的流程图。ss、se、n、c、u、p的定义与在此之前的说明相同。但是,在此,ss、se不是对强度值进行累计的m/z范围的上限、下限,而是用于搜索最大强度的m/z范围的上限、下限。另外,i是最大强度值。此外,在图11中用q表示的部分与在图8中用q汇总地表示的步骤相同。

基本上,图11中的各步骤的处理与图10中的各步骤的处理几乎相同。不同点在于,在图10的步骤s410中对所获取到的强度值进行累计,而与此相对地,在图11的步骤s510中将所获取到的强度值与在此之前求出的最大强度值i进行比较,如果新获取到的强度值较大,则将最大强度值i置换为新的强度值。因而,在图11所示的处理中,获取在应搜索的m/z范围中最大的强度值、即峰顶的强度值。

(c)质心强度值

在制作数据数组时,事先求出将峰的重心的m/z值和面积值设为一组、或者将峰顶的m/z值和该峰顶的强度值设为一组的质心数据,来作为各质谱的全部的峰信息。而且,也可以基于各质心数据,将作为数据数组的制作对象的m/z值列表中列举的m/z范围内包含的质心的强度值作为数据数组的强度值。

(3)基于分箱的数据数组的制作

上述数据数组是一个强度值与一个峰对应的数据数组,但也可以不以峰为单位,而是与峰的有无无关地将质谱的m/z轴划分为连续的多个箱,对每个该箱关联一个强度值来制作数据数组。将这样的处理称为分箱(严格地说是m/z上的分箱)。在分箱中,由于各箱的m/z值范围也可以不相等,因此例如也可以在存在有效峰的部分使箱变窄,在不存在有效峰的部分使箱变宽。与一个箱对应的一个强度值能够使用该箱范围内的强度值的累计值。

图12和图13是示出在第二实施例的成像质谱分析系统中在为了制作分箱的数据数组而获取各箱的强度值时由数据读出处理部25实施的详细处理的流程图。ss、se、n、c、u、p的定义与在此之前的说明相同。但是,在此ss、se是对强度值进行累计的一个箱的m/z范围的上限、下限。另外,j是每个箱的累计强度值。

首先,将与最初的箱、也就是m/z值最小的箱的起点对应的非压缩数据数组上的数组编号设定为ss,将与终点对应的非压缩数据数组上的数组编号设定为se,将计数器的计数值c设定为该数组编号ss(步骤s601)。然后,利用数组编号ss和索引,找到数组编号比数组编号ss小的、块的开头的数组编号,将从该数组编号减去1得到的值设定为变量u的初始值(步骤s602)。接着,在索引的数组上从第(u/n)+1个数据获取压缩数据数组中的上述块的开头的数组编号(步骤s603)。然后,将获取到的该值设定为变量p(步骤s604)。通过步骤s601~s604中的处理,来针对最初的箱决定开始在压缩数据数组上读出连续数的开头的位置。

之后的步骤s605~s613、s617~s622中包括的各步骤的处理与图8中的步骤s203~s217各步骤的处理相同,因此省略说明。在步骤s613或s622中判定为“是”时,由于针对该箱的处理结束,因此将强度累计值j转移到输出用数组,重置强度累计值j来进行针对下一个箱的处理的准备(步骤614、s623)。然后,如果到达分箱范围的终点(在步骤s615或s624中为“是”),则结束全部的处理,如果在步骤s615或s624中为“否”,则将下一个箱的终点设定为se(步骤s616、s625),分别返回到步骤s610、s620。

此外,在此将与一个箱对应的一个强度值设为累计强度值,但也可以是箱内的强度值的平均、有效的强度值的平均值、或者面积值、最大强度值。

另外,通过对上述处理适当进行变形,也能够基于分别压缩多个质谱而得到的数据来计算对该多个质谱进行平均而得到的平均谱。在该情况下,也能够计算仅限于特定m/z范围的平均谱,而不计算整个质谱的m/z范围的平均谱。在根据由成像质谱分析装置得到的数据求出试样上的关心区域(roi)中包含的多个测定点的质谱的平均时等,这样的平均谱的计算是有用的。

另外,在如上述那样制作作为用于制作数据数组的对象的m/z值列表时,在为了削减数据量而去除强度值小的峰的情况下,如果使用成为对象的多个质谱的平均值,则有时会从m/z值列表漏掉仅在少数的质谱中出现的强度值比较大的峰。为了避免这种情况,有时在制作m/z值列表时使用针对各m/z值从各质谱中选出最大的强度值并将其作为质谱的强度值的最大强度谱。通过对上述处理适当进行变形,也能够根据分别压缩多个质谱而得到的数据来求出此时需要的最大强度谱。

此外,如图2所示,m/z值的数组、多个强度值的数组以及索引信息一般作为数据文件被保存在计算机的hdd或ssd中,但在进行上述处理时,将全部信息暂时读入主存储器21后进行处理即可。

另外,也可以重复进行以下处理:将处理所需的一个强度值的数组和索引信息读入主存储器21,每当针对其中一个强度值数组完成计算处理时,从主存储器21废弃该数据,将与下一个强度值数组有关的数据新读入主存储器21。另外,在进行成像质谱分析数据的计算处理等仅需要规定的m/z范围的强度值信息的情况下,也可以参照索引信息,从压缩数据中仅选择性地将包含规定的m/z范围的强度值信息的块读入主存储器21,来进行强度值计算处理。当然,这种处理的过程并不是用于限定本发明的要素。

上述第一、第二压缩方法是将强度值为规定水平以下的信号置换为连续数的不可逆的压缩方法,是对微小的强度值的信号也重要的分析装置不合适的压缩方法。以下的第三、第四压缩方法改进了这一点。

[第三压缩方法]

参照图14对与本发明相关联的第三压缩方法的原理进行说明。

在此,设为一个强度值用2进制数、8比特来表示。如图14所示,将表示信号的强度值的8比特的比特串分割为低位2比特和高位6比特,低位的比特串直接处理或进行静态霍夫曼编码(statichuffmancoding),对高位6比特的比特串进行与第一压缩方法相同的交换行程长度编码(srle;switchedrunlengthencoding)来进行数据压缩。在对压缩数据进行解压缩时,针对低位的比特串、高位的比特串分别利用与压缩时使用的方法对应的解压缩算法来恢复原始的比特串,通过将它们相结合来恢复原始的数据。这样,能够进行可逆的压缩、解压缩。此外,也可以对进行了交换行程长度编码的比特串进一步进行静态霍夫曼编码。

[从通过第三压缩方法得到的压缩数据获取与特定m/z值对应的强度值的方法]

针对用上述第三压缩方法压缩后的数据中的被进行交换行程长度编码后的高位6比特的比特串进行与针对用第一压缩方法压缩后的数据的处理相同的处理,由此获取与特定m/z值对应的数据数组上的比特串。另一方面,在直接保存了低位2比特的情况下,在该数据数组中从与特定m/z值对应的数组编号读出比特串,通过将这些比特信息相结合来获取与特定m/z值对应的强度值。在对低位2比特的比特串进行了静态霍夫曼编码的情况下,无法从与交换行程长度编码的情况同样地被压缩后的数据中取出与特定的数组编号对应的值,因此暂时对全部数据进行解压缩来取出与特定m/z值对应的比特串,通过与从被进行交换行程长度编码后的比特串取出的比特信息结合,来获取与特定m/z值对应的强度值。

另外,在对被进行交换行程长度编码后的高位6比特的比特串进一步进行了静态霍夫曼编码的情况下,在针对静态霍夫曼编码进行了解压缩之后,通过与针对用第一压缩方法压缩后的数据的处理相同的处理,来获取与特定m/z值对应的高位6比特的比特串的值即可。

[第四压缩方法]

接着,参照图15对与本发明相关联的第四压缩方法的原理进行说明。该压缩方法是由在第三压缩方法中使用的可逆压缩的方法以及在第二压缩方法中使用的块分割和索引制作的方法组合而成的方法。

如图15所示,首先,将非压缩数据数组划分为包含规定的数据数的块。在该例中,按每50个数据对图14所示的强度值的数组进行划分,通过第三压缩方法对划分出的每个块独立地进行压缩。另外,收集压缩后的低位2比特的比特串和高位6比特的比特串各比特串的压缩后的各块的开头的位置信息,来制作索引,并与各块的压缩后的数据数组相关联地进行保存。索引分别与低位2比特的比特串和高位6比特的比特串的压缩后的数组相关联。此外,在对低位2比特进行静态霍夫曼编码的情况下,对每个块使用不同的霍夫曼树,对每个块分配不同的代码。或者,也可以对所有的块使用共用的霍夫曼树,对所有的块分配共用的代码。当然,如在第三压缩方法的原理中所述的那样,低位2比特也可以不压缩。

[从通过第四压缩方法得到的压缩数据获取与特定m/z值对应的强度值的方法]

对于如上所述那样被进行了可逆压缩的信息中的被进行交换行程长度编码后的比特串,为了根据该压缩数据求出特定m/z值下的强度值,与针对用第二压缩方法压缩后的数据的处理同样地,参照索引信息来获取与特定m/z值对应的比特串的值。另外,在没有压缩低位2比特的比特串的情况下,从与特定m/z值对应的数组编号读出比特串,通过将这些比特信息相结合来取出与特定m/z对应的强度值。在对低位2比特的比特串进行了静态霍夫曼编码的情况下,参照索引信息来确定包含与特定m/z值对应的数据的块。然后,对该块中包含的全部数据进行解压缩,根据对应于特定m/z值的数组编号与块的开头的数组编号之差,从解压缩后的数组中获取与特定m/z值对应的比特串,与从被进行上述交换行程长度编码后的比特串中获取到的与特定m/z值对应的比特串相结合,来获取强度值信息即可。

对通过上述第一和第二压缩方法得到的压缩数据进行的各种数据处理也能够应用于通过上述第三和第四压缩方法得到的压缩数据,这是显而易见的。

在表1中示出通过第一压缩方法得到的压缩数据、通过第二压缩方法得到的压缩数据以及未压缩数据各数据的数据尺寸的比较和处理速度的比较结果。在此,设想了试样上的二维区域内的测定点的点数为365×552、m/z范围为m/z1~m/z2000的成像质谱分析数据。此外,在数据数组制作处理和分箱处理的所需时间中不包括读出压缩数据等文件的时间,在roi平均谱制作处理的所需时间中包括读出压缩数据等文件的时间。

[表1]

根据上述比较可知,通过数据压缩,数据尺寸被削减为1/6左右。另外,如上所述,在第二压缩方法中,将非压缩数据数组划分为块来执行压缩处理,并且附加索引。因此,在数据量削减这点上,与第一压缩方法相比是不利的。然而,实际上这两者的数据尺寸的差非常小(2%以内),即使用第二压缩方法也能够使数据削减效果足够大。

另一方面,当观察通过第一压缩方法得到的压缩数据和通过第二压缩方法得到的压缩数据的处理速度的比较结果时可知,在roi平均谱制作处理或分箱处理中没有显著差异,但在数据数组制作处理中,针对通过第二压缩方法得到的压缩数据的处理的速度格外短。如上所述,数据数组制作处理是对多个质谱进行主成分分析等多变量解析时所必须的处理,在对成像质谱分析数据进行解析时频繁使用多变量解析。因此,缩短数据数组制作处理的所需时间在提高成像质谱分析数据的解析效率方面是相当有效的。

另一方面,在使用遍及质谱的整个m/z范围的数据进行计算的roi平均谱制作处理或分箱处理中,几乎没有显著差异。因此,在需要频繁地获取特定m/z值的强度值那样的成像质谱分析数据的解析以外的情况下,有时第一压缩方法(或第三压缩方法)和使用了该方法的数据处理方法就足够了。

如上所述,在将本发明所涉及的数据处理方法以及装置应用于成像质谱分析装置的例子中,具体具有如下效果。

(1)通过用共用的一个m/z值的数组和被压缩后的多个强度值的数组来表示多个质谱,与压缩前相比能够削减数据容量。

(2)在成像质谱分析装置中显示成像图像或者在为了对多个质谱数据进行多变量解析而制作数据数组时求出与特定m/z值对应的强度值或与m/z范围对应的强度累计值、平均值、最大值等的情况下,一般需要在将压缩数据进行解压缩而恢复为质谱数据之后进行强度值的选定或计算处理。当对压缩数据进行解压缩时,数据的数组的长度不同,因此需要制作与原始的压缩数据不同的数组并在其中存储解压缩后的数据。此时,需要执行从压缩数据将保存有有效的强度值的部分的数组复制到解压缩后的数据的数组中的处理。与此相对地,上述方法能够从被压缩后的强度值的数组直接获取目标强度值,且不需要进行数据的复制,处理速度提高。

(3)在本发明所涉及的数据处理方法以及装置中,在获取与目标m/z值或目标m/z范围对应的强度值时,不需要暂时对压缩数据进行解压缩,因此不需要在主存储器上确保用于存储解压缩后的数据的存储区域。通常,强度值的计算处理在计算机的主存储器上进行,但在计算的过程中使用的存储器的容量与存储解压缩后的数据的存储器容量相比非常少即可。这样,在本发明中,能够节约主存储器的使用容量。

(4)由于通过maldi-tofms得到的质谱数据的m/z范围宽,因此也存在与一个质谱对应的非压缩数据的数据数超过100万的情况。即使在像这样非压缩数据的数组非常长的情况下,在本发明所涉及的第二压缩方法中,只要从最接近目标m/z值或目标m/z范围的块的开头起搜索目标强度值即可,因此能够缩短处理速度而在短时间内输出结果。

此外,上述实施例是将本发明应用于成像质谱分析装置的例子,但应用本发明的分析装置不限于此。例如,在傅立叶变换红外分光光度测定(ftir)成像装置、拉曼光谱成像装置、电子探针显微分析仪(epma)、色谱装置等中也能够应用本发明。即,本发明能够应用于代替m/z值而按照波数或波长、x射线的能量(x射线的波长)、时间等参数得到强度值的一维数组的所有分析装置。

另外,上述实施例只不过是本发明的一例,在上述记载以外的方面,即使在本发明的宗旨的范围内适当进行变更、修正、追加,当然也包含在本申请的权利要求书中。

附图标记说明

1:成像质谱分析部;2:数据处理部;20:谱数据收集部;21:主存储器;22:数据压缩处理部;23:数据解压缩处理部;24:索引制作处理部;25:数据读出处理部;26:成像图像制作处理部;3:数据保存部;30:压缩数据存储区域;31:索引存储区域;4:操作部;5:显示部。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1