峰检测方法以及数据处理装置与流程

文档序号:16636948发布日期:2019-01-16 07:06阅读:349来源:国知局
峰检测方法以及数据处理装置与流程

本发明涉及一种从例如由色谱仪得到的色谱、由质谱分析装置或分光装置等得到的谱检测峰的方法以及执行该方法的数据处理装置。



背景技术:

关于对试样含有的成分进行分析的装置之一,存在一种色谱仪。在色谱仪的情况下,使试样随着流动相的流动而导入柱,在柱内将试样中的各成分在时间上分离之后,用检测器进行检测并制作色谱。然后,从色谱检测峰,根据峰位置来鉴定各成分,并且根据峰高度或面积来决定该成分的浓度(例如专利文献1)。为了这些操作,进行了利用软件从色谱自动检测峰的处理。关于谱,也同样地进行了峰的自动检测。

在非专利文献1中记载了使用小波变换来检测质谱的峰的情况。此外,该方法并不限于质谱,也能够应用于波长谱、色谱等。一般地,在小波变换中使用被称为母小波ψ(t)的函数,该函数是表示孤立的(在时间上局部存在的)波的变量t的函数,该函数具有表示横轴方向的放大缩小的被称为尺度(scale)的常数和表示横轴方向的平行移动的被称为平移量(translation)的常数。在将测定数据设为变换对象的情况下,变量t是测定变量,在质谱的情况下,变量t相当于质荷比,在光谱的情况下,变量t相当于波长,在色谱的情况下,变量t相当于时间。在小波变换中,计算用将变量t设为横轴的图表表示的、作为对象数据x(t)与母小波ψ(t)的内积的评价函数d。

【数1】

(上式中,在ψ(t)上标注有横线的是函数ψ(t)的复共轭)。该评价函数d是以尺度和平移量为参数的函数。而且,一边使尺度和平移量变化一边计算d的值。针对这样通过小波变换得到的评价函数d,求出其值为极大值的尺度以及平移量。具有该尺度和平移量来作为参数的母小波ψ(t)与对象数据x(t)的一致度最高。

作为母小波ψ(t)的一例,能够列举墨西哥帽函数。

[数2]

在此,a是尺度,b是平移量。在非专利文献1中,通过使用墨西哥帽函数进行小波变换来求出评价函数d。之后,关于评价函数d,针对多个尺度a的值进行以下操作:在将尺度a固定为某一个值并使测定变量t变化时求出成为极大值的点。当在将测定变量t设为横轴、将尺度a设为纵轴的图表上表示这样求出的点时,成为沿着尺度a的方向延伸的一个或多个线状。将像这样线状地表示的数据称为“脊线(ridgeline)”。而且,将在脊线上评价函数d具有极大值的部位的测定变量t的值决定为对象数据(质谱)中的峰的位置(t的值)。根据该方法,能够与对象数据中的峰的强弱等无关地检测峰。

专利文献1:日本特开平07-098270号公报

非专利文献1:pandu其他两位,“improvedpeakdetectioninmassspectrumbyincorporatingcontinuouswavelettransform-basedpatternmatching(通过结合基于连续小波变换的模式匹配得到的质谱中的改进后的峰检测)”,bioinformatics,(英国),牛津大学出版,2006年7月4日,第22卷第17号2059~2065页



技术实现要素:

发明要解决的问题

在色谱中,有时除了叠加源自成分的本来的峰以外,还叠加宽度窄的峰状的噪声、缓慢地上升且宽度宽的峰状的背景。在非专利文献1所记载的方法中,这些峰状的噪声、背景也被检测为峰,无法判别所检测到的峰是真正的峰还是噪声、背景。在谱的情况下也同样。

本发明所要解决的课题在于,提供如下一种峰检测方法以及数据处理装置:能够与峰的强弱等无关地检测峰,并且能够判别所检测到的峰是否为真正的峰。

用于解决问题的方案

为了解决上述课题而完成的本发明所涉及的数据处理方法是根据表示测定值相对于测定变量的变化的图表的数据来检测峰的方法,包括以下步骤:

a)小波变换步骤,通过使用仅具有一个极大值的母小波对所述数据进行小波变换,来求出以该母小波的尺度和平移量为参数的评价函数;以及

b)峰候选信息获取步骤,基于所述评价函数具有极大值的部位的平移量来求出所述数据中的峰候选的位置,并且基于与该峰候选对应的尺度来决定该峰候选的宽度。

在此,测定变量例如是指色谱的情况下的时间、光谱的情况下的波长、质荷比谱的情况下的质荷比,通常,在图表中将测定变量表现为横轴,将测定值表现为纵轴。

在本发明中,使用仅具有一个极大值的母小波进行小波变换,基于评价函数具有极大值的部位的平移量来求出所述数据中的峰候选的位置,并且基于与该峰候选对应的尺度来决定该峰候选的宽度。这样决定的峰候选的宽度成为用于判别该峰候选是源自试样中的成分的本来的峰还是与本来的峰不同的成分(噪声、背景等)的指标。

尺度虽然不是与峰候选的宽度相同的值,但在母小波仅具有一个极大值的情况下,尺度与该宽度之间存在相关关系。此外,在母小波具有两个以上的极大值的情况下,有可能意味着该母小波与所述数据中的多个峰的一致度高,因此无法将尺度与数据的峰对应。因此,在本发明中使用仅具有一个极大值的母小波。

对于所述母小波,典型地列举墨西哥帽函数。或者,也能够将被称为高斯差分的、取宽度不同的两个高斯函数的差的函数用作所述母小波。以下,以将墨西哥帽函数用作母小波的情况为例,来说明决定峰候选的宽度的方法。在此,将仅存在一个具有高斯分布的峰的数据假定为模型,将该模型的峰的宽度设为未知的值σp。另外,当对该模型的数据进行小波变换时,将尺度设为σf,内积dtop表示为下式。

[数3]

在此,

[数4]

在此,导入对内积dtop乘以尺度得到的评价函数

s(σp,σf,m)=σfmdtop(σp,σf)…(5)。

当该评价函数s作为σf的函数取极大值时、即时,

σf=((5+2m)/(1-2m))1/2σp…(6)。

如果在式(5)的评价函数s中设为m=0,则内积dtop本身为评价函数s。在该情况下,当将评价函数s的极大值下的尺度设为σfmax时,σp=5-/2σfmax。另外,如果在式(5)中设为m=-1,则σp=σfmax。即使在将m的值设为这些0以及-1以外的值的情况下,也同样能够求出σfmax与σp的关系。

因此,根据通过对实际的数据进行小波变换所得到的内积d来求出评价函数s,根据得到的评价函数s来制作脊线,求出在该脊线中评价函数s为极大值的尺度σfmax,由此能够决定峰候选的宽度σp。

此外,即使在使用墨西哥帽函数以外的小波函数的情况下,也能够使用与上述同样的方法来决定峰候选的宽度。

本发明所涉及的峰检测方法也能够进行以下处理:

通过从多个所述峰候选中的所述尺度的值小的一个峰候选起依次将一个或多个峰候选从所述数据中去除,来制作宽幅峰候选检测用数据,

将所述数据置换为所述宽幅峰候选检测用数据,来进行所述小波变换步骤以及所述峰候选信息获取步骤。

一般地,宽度越宽的峰候选,峰强度越小,因此难以检测,但根据使用了该宽幅峰候选检测用数据的处理,在去除了宽度窄的峰候选的影响之后,进行小波变换步骤、峰候选位置决定步骤以及峰候选宽度决定步骤,因此易于检测宽度宽的峰候选。此外,在制作宽幅峰候选检测用数据时去除一部分峰候选并非意味着将该峰候选判别为伪峰。关于这些峰候选,基于在从所述数据去除之前决定的宽度来判别真伪即可。

本发明所涉及的数据处理装置是进行根据表示测定值相对于测定变量的变化的图表的数据来检测峰的数据处理的装置,具备:

a)小波变换部,通过使用仅具有一个极大值的母小波对所述数据进行小波变换,来求出以该母小波的尺度和平移量为变量的评价函数;以及

b)峰候选信息获取部,基于所述评价函数具有极大值的部位的平移量来求出所述数据中的峰候选的位置,并且基于与该峰候选对应的尺度来决定该峰候选的宽度。

发明的效果

根据本发明,能够通过进行小波变换来与峰的强弱等无关地检测峰候选,并且能够决定所检测出的峰候选的宽度。能够基于这样决定的峰候选的宽度来判别该峰候选是否为真正的峰。

附图说明

图1是表示本发明所涉及的数据处理装置的第一实施方式的概要结构图。

图2是表示本发明所涉及的数据处理方法的第一实施方式的流程图。

图3是表示进行了基于第一实施方式的数据处理方法的处理的实施例1的处理对象的数据的图表。

图4是表示在实施例1中根据通过小波变换得到的评价函数来求出脊线以及该脊线上的评价函数的极大值的位置的例子的图表。

图5是表示本发明所涉及的数据处理装置的第二实施方式的概要结构图。

图6是表示本发明所涉及的数据处理方法的第二实施方式的流程图。

图7是表示在进行了基于第二实施方式的数据处理方法的处理的实施例2中,基于通过小波变换决定的宽度来从原始数据去除了宽度窄的峰的例子的图表。

图8是表示根据通过对去除了宽度窄的峰后的数据进行小波变换而得到的评价函数来求出与宽度宽的峰对应的脊线以及该脊线上的评价函数的极大值的位置的例子的图表。

具体实施方式

使用图1~图8来说明本发明所涉及的峰检测方法以及数据处理装置的实施方式。

第一实施方式的数据处理装置10与数据记录部1,显示装置2以及输入装置3一起使用。数据记录部1是记录由液相色谱仪或气相色谱仪等具有的检测器进行测定时所得到的数据的装置,包括硬盘、存储器等。数据记录部1在图1示出的例子中设置在数据处理装置10的外部,但也可以设置在数据处理装置10内。显示装置2是显示由数据处理装置10进行的数据处理中的信息和数据处理的结果的显示器。输入装置3是用于用户将必要信息输入到数据处理装置10的装置,包括键盘、鼠标等。

数据处理装置10具有色谱制作部11、小波变换部12、峰候选信息获取部13以及峰决定部14。峰候选信息获取部13具有峰候选位置决定部131和峰候选宽度决定部132。这些各部实际上通过计算机的cpu、存储器等硬件以及软件来具体实现。以下,使用图2的流程图来说明本发明所涉及的数据处理方法的第一实施方式,并且说明第一实施方式的数据处理装置10的各部的功能。

首先,色谱制作部11从数据记录部1获取数据,通过与以往相同的方法来制作色谱c(t)(步骤s1)。该色谱c(t)相当于上述的“表示测定值的变化的图表的数据”,t是时间,相当于上述的测定变量。在对谱进行处理的情况下,不需要制作色谱的操作,从数据记录部1获取数据即可。

接着,小波变换部12通过对色谱c(t)进行小波变换来求出评价函数(步骤s2)。在小波变换中,将上述式(1)中的对象数据x(t)设为色谱c(t),将墨西哥帽函数或高斯差分等仅具有一个极大值的函数用作母小波ψ(t)来求出内积。既可以将这样求出的内积本身设为评价函数,也可以如式(5)示出的那样将对内积乘以σfm(在此σf是尺度)得到的函数设为评价函数。该评价函数是以尺度和平移量为参数的函数。

接着,峰候选信息获取部13根据在步骤s2中求出的评价函数来制作脊线(步骤s3),求出在所得到的脊线上评价函数的值为极大值的点。针对多个尺度σf的值进行在将尺度σf固定为某一个值而使测定变量t变化时求出成为极大值的点的操作,由此制作脊线。在此获得的脊线并不限于一个,在大多情况下存在多个脊线,因此针对这些极大值分别求出在脊线上评价函数的值为极大值的点。峰候选位置决定部131求出这样得到的极大值下的测定变量的值,来作为在色谱c(t)中峰候选所在的位置(时间)(步骤s4),峰候选宽度决定部132针对各个峰候选基于尺度来决定峰候选的宽度(步骤s5)。这些步骤s3~s5相当于上述的峰候选信息获取步骤。此外,步骤s4和s5既可以同时并行地进行,也可以先进行步骤s5。例如当使用式(5)和式(6)时,在m=0(内积为评价函数)的情况下,峰候选的宽度为极大值下的尺度的5-1/2倍的值,在m=-1的情况下,峰候选的宽度为与极大值下的尺度相同的值。

之后,峰决定部27根据所得到的宽度的值来判别所对应的峰候选是真正的峰,还是噪声、背景等非真正的峰的成分(步骤s6),结束处理。关于是否为真正的峰,典型的是,预先决定宽度的上限值和下限值,如果所得到的宽度处于上限值与下限值之间,则判别为峰候选是真正的峰,如果所得到的宽度不在上限值与下限值之间,则判别为峰候选不是真正的峰。或者,也可以将位置(时间)分为多个区间,按每个区间决定宽度的上限值和下限值。在本实施方式中,峰决定部14自动进行该判别,但也可以取而代之地,在将宽度的值显示于显示装置2之后由人进行判别。

接着,说明通过第一实施方式的数据处理方法进行了峰检测的例子(实施例1)。在实施例1中,将图3的图表示出的数据设为处理对象。在该数据中能够看到十个峰(p01~p10)以及宽度比这些峰的宽度宽的一个峰状曲线pb1。

在本实施例中,通过针对该数据进行将墨西哥帽函数设为母小波的小波变换来求出内积,将对该内积乘以σf-1(在式(5)中m=-1)得到的函数设为评价函数。在该例子中,将评价函数具有极大值的部位的尺度的值直接决定为原始数据的峰候选的宽度。

图4表示求出脊线所得到的结果。在图4中,二维图表的横轴取时间(测定变量。与原始数据的横轴相同。),纵轴取尺度σf(σf的下角标设为2的对数),如以下那样示出数据。首先,将尺度σf固定为一个值而使测定变量变化,由此求出该尺度σf的值下的评价函数为极大值的点。一边一点点地改变尺度σf的值一边重复进行该操作。于是,图4的图表中,针对一个峰候选出现一列沿纵轴方向延伸的点列。这些点列是脊线。然后,针对各脊线分别求出评价函数为极大值的尺度σf,由此能够在图4的二维图表上确定成为极大值的位置。

从图4的图表得到评价函数为极大值的十个点(图中的×标记)。这十个点与峰p01~p10对应,均为σf、即为原始数据的宽度大致相同的值。在该图表中看到标注有附图标记n的多个点列,但这些点列是噪声。

另一方面,在图4的图表中也看到与峰状曲线pb1对应的点列,但在σf大的部位,由与p05及p06叠加造成的影响大,因此根据本实施例1无法估计与峰状曲线pb1对应的峰候选的宽度。接着,对即使在像这样与其它峰叠加的情况下也能够估计峰候选的宽度的方法、即本发明所涉及的第二实施方式进行说明。

图5表示第二实施方式所涉及的数据处理装置20的概要结构。该数据处理装置20具有对第一实施方式的数据处理装置10添加宽幅峰候选检测用数据制作部21的结构。以下,使用图6的流程图来说明本发明所涉及的数据处理方法的第二实施方式,并且说明宽幅峰候选检测用数据制作部21的功能。

首先,在步骤s11~s15中,通过进行与第一实施方式的峰处理方法的步骤s1~s5同样的操作,来决定峰候选所在的位置(时间)以及峰候选的宽度。

接着,宽幅峰候选检测用数据制作部21从峰候选中的所决定的宽度的值小的峰候选起依次选择一个或多个峰候选(步骤s16)。接着,在步骤s17中判定是否执行宽幅峰的检测操作。作为该判定的方法,例如能够列举以下等方法:如上所述,在如峰状曲线pb1那样无法求出极大值的情况下设为“是”,或者直到与数据的内容无关地执行规定次数的步骤s17为止设为“是”。

在步骤s17中为“是”的情况下,判别所选择出的峰候选是否为真正的峰(步骤s18)。然后,从色谱c(t)去除与所选择出的峰候选的位置及宽度对应的范围内的数据,通过在直线或曲线上对该范围内的数据进行插值,来制作宽幅峰候选检测用数据(步骤s19)。之后,返回到步骤s12,基于宽幅峰候选检测用数据重复进行步骤s12~s16的操作。此时,在宽幅峰候选检测用数据中,与原始数据相比,峰或者峰状曲线的数量少,因此易于检测宽度宽的峰。重复执行这些步骤s12~s16的操作,直到在步骤s17中变为“否”为止。

另一方面,在步骤s17中为“否”的情况下,峰决定部判别在该时间点残留的所有峰候选是否为真正的峰(步骤s20),使处理结束。

以下,说明通过第二实施方式的数据处理方法进行了峰检测的例子(实施例2)。在实施例2中,与实施例1同样地将图3的图表中示出的数据设为处理对象。首先,通过与实施例1相同的方法来检测十个峰p01~p10。然后,基于针对检测到的峰p01~p10求出的位置及宽度,从原来的图3的数据去除峰p01~p10的部分的数据,通过对所去除的部分进行插值来制作出宽幅峰候选检测用数据。图7表示制作出的宽幅峰候选检测用数据的图表。然后,基于该宽幅峰候选检测用数据制作出脊线。图8表示该脊线。与峰状曲线pb1对应地形成一列沿纵轴方向延伸的点列,确定评价函数为极大值的位置。在该列的附近不存在其它点列,能够不受其它峰等的影响地决定峰状曲线pb1的位置和宽度。此外,与峰状曲线pb1对应的点列以外的点列是由在数据的插值时发生的不连续性等引起的噪声。

附图标记说明

1:数据记录部;2:显示装置;3:输入装置;10、20:数据处理装置;11:色谱制作部;12:小波变换部;13:峰候选信息获取部;131:峰候选位置决定部;132:峰候选宽度决定部;14:峰决定部;21:宽幅峰候选检测用数据制作部。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1