数据处理装置以及数据处理方法

文档序号:9291481阅读:362来源:国知局
数据处理装置以及数据处理方法
【技术领域】
[0001]本发明涉及一种分别求出表示由质量分析装置得到的未知化合物的1^质谱与大多数的已知化合物的MSn质谱的类似性的分数,基于该分数识别未知化合物的数据处理方法以及采用该数据处理方法的数据处理装置。
【背景技术】
[0002]在采用离子阱型质量分析装置等的质量分析中,已知有MS/MS分析(MS2分析)这样的手法。在一般的MS2分析中,首先从分析对象的未知化合物中选择具有目标的特定的质荷比(m/z)的离子作为前体离子(母离子),通过CID (Collis1n Induced Dissociat1n:碰撞诱导解离)使该选择的前体离子碎裂,生成碎裂离子。由于碎裂形式依存于化学结构,所以可以通过对由碎裂生成的碎片离子进行质量分析,来取得未知化合物的MS2质谱(化学结构的信息)。
[0003]近年来,在识别医药品、农药、蛋白质等未知化合物的情况下,未知化合物的分子量变大,化学结构也变得复杂。因此,根据未知化合物的种类的不同,有时存在仅通过一阶段的碎裂操作离子碎裂不到充分小的质量的情况。在这样的情况下,进行多次反复碎裂操作以对所生成的碎片离子进行质量分析的MSn分析。
[0004]作为根据通过这样的MSn分析得到的MS n质谱推定未知化合物的化学结构的解析处理,进行的是采用数据库的模式匹配(/《夕一 W、y于 >夕' )处理(例如,参照专利文献1、非专利文献I)。在数据库中,包含有多个化合物名以及化学结构(已知化合物)、该已知化合物的MSn质谱。而且,在模式匹配处理中,通过对已知化合物的MS n质谱和未知化合物的MSn质谱进行比较,采用加权内积、峰值的出现概率等分别求出表示未知化合物的MS "质谱与多个已知化合物的1<质谱的类似性的分数。其结果,测定者通过按照分数从高到低的顺序排列已知化合物,来识别未知化合物。
[0005]现有技术文献
[0006]专利文献
[0007]专利文献1:日本特开2005-201835号公报
[0008]非专利文献
[0009]非专利文献1:Stephen E.Stein, and Donald R.Scott^Optimizat1nand Testing of Mas Spectral Library Search Algorithms for CompoundIdentif icat1n,, 1994,American Society for Mass Spectrometry, 859-866.

【发明内容】

[0010]发明要解决的问题
[0011]然而,即使在对同一化合物进行MSn分析的情况下,所得到的MS I谱有时也会不同。即,在MSn质谱中,峰值的离子强度1、峰值的位置(m/z)、峰值的有无等容易发生变化。因此,采用上述那样的模式匹配处理的话,存在离子强度I改变大、峰值的位置偏移、应该有的峰值没有出现的情况,分数降低,其结果,存在不能正确评价未知化合物的MSn质谱与多个已知化合物的1<质谱的类似性的情况。
[0012]用于解决问题的手段
[0013]本申请的发明者为了解决上述课题,对正确评价未知化合物的MSn质谱与多个已知化合物的MSn质谱的类似性的检索方法进行了研究。已知采用上述那样的模式匹配处理的话,没有考虑MSn质谱中的峰值的离子强度1、峰值的位置(m/z)、峰值的有无等容易变化的情况,分数会降低。因此,找出了在对未知化合物的MSn质谱和多个已知化合物的MS nM谱的类似性进行评价之时,对MSn质谱中的峰值的离子强度1、峰值的位置(m/z)、峰值的有无等变化的情况加以考虑了的检索方法。
[0014]S卩,本发明的数据处理装置包括:预先存储有多个已知化合物的MSn质谱的数据库存储区域、取得未知化合物的1^质谱的取得部、以及分别求出表示未知化合物的MS n质谱与多个已知化合物的MSn质谱的类似性的分数的分数计算部,所述数据处理装置包括:强度分数计算部,其根据离子强度的大小分别将未知化合物的MSn质谱中的各峰值以及已知化合物的MSn质谱中的各峰值分类为数个阶段的强度分数;中性丢失计算部,其求出未知化合物的MSn质谱中的中性丢失的峰值;以及位置分数计算部,其基于已知化合物的MS n质谱中的包含所述中性丢失的峰值的峰值的质荷比与相对应的未知化合物的15"质谱中的峰值的质荷比之差,对于各峰值分别求出表示质荷比的误差的位置分数,所述分数计算部对于各峰值,将已知化合物的MSn质谱中的峰值的强度分数、未知化合物的MS n质谱中的峰值的强度分数以及位置分数相乘,计算出关于所有峰值的乘积的总和作为分数。
[0015]在此,“未知化合物的MSn质谱”是指在对未知化合物进行MS n分析时得到的质谱,
“已知化合物的MSn质谱”可以是以与未知化合物同样的条件(离子化法、碎裂方法等)对已知化合物进行MSn分析时得到的质谱,也可以是以与未知化合物不同的条件对已知化合物进行MSn分析时得到的质谱,也可以是根据已知化合物的化学结构计算出来的质谱。
[0016]根据本发明的数据处理装置,首先,< I >对峰值的离子强度I进行如下处理。峰值的离子强度I容易变化,但大的离子强度I的峰值被认为是容易从对象化合物得到的碎片离子的峰值。因此,对于未知化合物的MSn质谱,根据离子强度I的大小分别将各峰值分类为数个阶段(例如,上位、中位、下位),且对于数据库的已知化合物的MSn质谱,也根据离子强度I的大小分别将各峰值分类为数个阶段(例如,上位、中位、下位)。由此,即使离子强度I不同,也能够找到类似的峰值。
[0017]又,由于峰值的有无容易变化,所以具有如下情况:即使未知化合物的MSn质谱和已知化合物的1<质谱的峰值不存在于同一位置(质荷比),但存在相互间具有中性丢失的关系的峰值。因此,中性丢失计算部对于未知化合物的MSn质谱,根据峰值的位置和前体离子的质量求出中性丢失的峰值。由此,即使在未知化合物的MSn质谱中应该有的峰值没有出现,也能够使峰值相对应。另外,关于添加于]\^"质谱中的中性丢失的峰值的离子强度I,例如,设为与原来的峰值相同的离子强度I。
[0018]接下来,< 2 >对峰值的位置(m/z)进行如下处理。未知化合物的13。质谱中的峰值的位置发生某程度的偏差。因此,以已知化合物的MSn质谱中的峰值的位置为基准,在质量分析装置的峰值的位置的精度范围(例如,质量分析装置的话为-1.0?1.0,TOF的话为-0.005?0.005、串联四级杆的话为-0.5?0.5)内对应位置分数“1.0”,在该精度范围外对应渐近于位置分数“0.0”的位置分数,由此即使峰值的位置不同,也能够找到类似的峰值。
[0019]然后,如上所述,对于被对应的各峰值,将已知化合物的MSn质谱中的峰值的强度分数、未知化合物的1<质谱中的峰值的强度分数以及位置分数相乘,计算出关于所有峰值的乘积的总和作为分数。
[0020]发明的效果
[0021]如上所述,根据本发明的数据处理装置,即使未知化合物的MSn质谱中的峰值的离子强度1、峰值的位置(m/z)、峰值的有无等发生变化,也能够正确地评价未知化合物的MSn质谱与多个已知化合物的MSl谱的类似性。
[0022](用于解决其他课题的手段以及效果)
[0023]又,在本发明的数据处理装置中,可以具有峰值分数计算部,该峰值分数计算部基于一致度,求得表示一致度的峰值分数,所述一致度根据在已知化合物的MSn质谱中的峰值的质荷比和未知化合物的1<质谱中的峰值的质荷比中一致的成对数求出,所述分数计算部将所述分数与所述峰值分数相加。
[0024]根据本发明的数据处理装置,< 3 >对于峰值.中性丢失对的一致度进行如下处理。根据已知化合物的MSn质谱中的峰值的质荷比和未知化合物的MSn质谱中的峰值(也包含中性丢失的峰值)的质荷比中一致的成对数,求出表示一致度的峰值分数(例如,(一致的峰值数/已知化合物的13。质谱中的峰值数)X 100)。
[0025]又,在本发明的数据处理装置中,所述强度分数计算部可以根据离子强度或者该离子强度的log的转换值的大小,分别将未知化合物的13"质谱中的各峰值以及已知化合物的1<质谱中的各峰值分类为3个阶段、或者数个阶段的强度分数。
[0026]又,在本发明的数据处理装置中,所述强度分数计算部可以根据离子强度的大小、峰值的质荷比的大小,分别将未知化合物的MSn质谱中的各峰值以及已知化合物的1^质谱中的各峰值分类为数个阶段的强度分数。
[0027]根据本发明的数据处理装置,在MSn质谱中,峰值的独特(二二一夕)程度与质荷比成正比地变大,但有时会存在质荷比大的峰值的离子强度变小的情况,所以通过与质荷
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1