校准曲线创建方法及装置、目标成分校准方法及装置的制造方法_5

文档序号:9706669阅读:来源:国知局
每100克)的目标成分质量。在步骤S350的处理中,CPU10作为图13的目标成分量 计算部540而发挥作用。其后,进入到"返回"而结束该目标成分校准处理。
[0169] 此外,在本实施方式中,虽然将通过步骤S350求出的含量C作为被检测体的目标 成分的含量,但代替它,也可以用在步骤S330的标准化中使用的标准化系数修正通过步骤 S350求出的含量C,并将该修正后的值作为应该求出的含量。具体而言,可以通过将标准偏 差与含量C相乘,求出含量的绝对值(克)。根据该结构,可以根据目标成分的种类不同,将 含量C设置得精度更高。
[0170] 根据以上的校准方法,能够根据作为被检测体的实测值的一个光谱高精度地求出 目标成分的含量。
[0171] E.各种算法及其影响
[0172] 下面,对图8中示出的第一预处理部450、第二预处理部460以及独立成分分析处 理部470中所利用的各种算法依次进行说明。
[0173] E - 1.第一预处理(利用了 SNV/PNS的标准化处理):
[0174] 作为第一预处理部450所执行的第一预处理,可以利用SNV (标准正态变量变换) 和PNS(零空间投影法)。
[0175] SNV由下面的公式得出:
[0176] 公式 18
[0177]
[0178] 在此,z为处理后的数据、X为处理对象数据(在本实施方式中吸光度光谱)、xaTC 为处理对象数据X的平均值、σ为处理对象数据X的标准偏差。标准正态变量变换的结果 得到平均值为〇、标准偏差为1的已被标准化的数据ζ。
[0179] 如果进行PNS,则就能减少处理对象数据中所含有的基线波动。在处理对象数据 (在本实施方式中吸光度光谱)的测量中,由于各种各样的原因,产生每个测量数据都在数 据的平均值上进行摆动等的称为基线波动的数据间偏差。因此,优选在进行ICA(独立成分 分析)之前消除该波动的主要原因。PNS可以作为能够减少处理对象数据的基线波动的预 处理而使用。尤其是对于包括红外区域的吸收光光谱或反射光光谱的测量数据,由于这种 基线波动多,因而适用PNS的优点大。下面,对通过PNS消除由测量得到的数据(也仅称作 "测量数据")中所含有的基线波动的原理进行说明。另外,作为代表性的例子,对测量数据 为包括红外区域的吸收光光谱或反射光光谱的情况进行说明。但是,对其他种类的测量数 据(例如声音数据等)也可以同样地适用PNS。
[0180] -般而言,在理想体系中,测量数据x(处理对象数据X)使用m个(m为2以上的 整数)独立成分&(1 = 1~m)和各自的混合比例例(^而由下面的公式表示。
[0181] 公式 19
[0182]
[0183] 在此,A为由混合比例例Cl形成的矩阵(混合矩阵)。
[0184] 在ICA(独立成分分析)中,也以该模型为前提而执行处理。但是,在实际的测量 数据中存在有各种各样的波动因素(样品状态和测量环境的变化等)。因此,作为考虑了那 些因素的模型,考虑通过下面的公式来表达测量数据X的模型。
[0185] 公式 20
[0186]
[0187] 在此,b是表示光谱的振幅方向的波动量的参数、a是表示常数基线波动E (也称 为"平均值波动")的量的参数、lV"bg是表示依赖于波长的g个(g为1以上的整数)的波 动A ( λ )~fg( λ )的量的参数、ε是其他波动成分。另外,常数基线波动E由E = {1,1, 1,…1}τ(右上标的Τ表示倒置)给出,是其数据长度与测量数据X的数据长度Ν(波长区 域的段数)相等的常数向量。作为表示波长的变量λ,使用1至Ν的Ν个整数。即,该变 量λ相当于测量数据X的数据长度Ν(Ν为2以上的整数)的序数。此时,依赖于波长的波 动 AQ)~fg(x)由 fjx)=出⑴,:^⑵,…Π (Ν)}Τ,…,fg(A) = {fg(l),fj2),… fg (Ν)}τ给出。这些波动成为ICA和校准中的误差主要原因,因此优选事前消除。
[0188] 作为函数f( λ),优选使用函数f( λ)的值在λ的值为1至N的范围内随λ的增 加而单调地增加的单变量函数。在零空间投影法中,通过使用指数α为整数的λ的取幂 函数λ °以外的其他函数,从而能够更加地减少测量数据中所含有的波动。
[0189] 作为决定优选的函数f( λ)的函数类型及其个数g的方法,可以采用实验性的试 错法(卜74 7 y卜''工7 -),或者可以使用现有的参数估计算法(例如EM(期望值最大化 法)算法)。
[0190] 在PNS中,考虑由上述的各个基线波动成分Ε,?^λ)~fg(A)组成的空间,通过 将测量数据X投影到未含有那些波动成分的空间(零空间)中,从而能够得到减少了基线 波动成分Ε,?\(λ)~fgU)的数据。作为具体的运算,PNS处理后的数据z用下面的公 式计算:
[0191] 公式 21
[0192]
[0193] P = {1,( λ ),f2( λ )…fk( λ )}
[0194] 在此,P+是P的伪逆矩阵。k 1是将公式(20)的构成成分s i投影到不含有波动成 分的零空间后的量。另外,ε*是将公式(20)的波动成分ε投影到零空间后的量。
[0195] 此外,如果在PNS的处理后进行标准化(例如SNV),则就也能够消除式(20)中的 光谱的振幅方向的波动量b的影响。
[0196] 如果对进行了这种PNS预处理的数据进行ICA,则所得到的独立成分成为公式 (21)的成分1^的估计值,成为与真正的构成成分\不同的值。但是,由于混合比例(^没有 从原来的公式(20)中的值变化,因此对使用了混合比例Cl的校准处理(图2、图14)没有影 响。这样,如果执行PNS作为ICA的预处理,则就不能够通过ICA得到真正的构成成分 Sl, 因此通常不可能产生将PNS适用于ICA的预处理这样的想法。相反,在本实施方式中,由于 即使进行PNS作为ICA的预处理也不影响校准处理,因此如果执行PNS作为预处理,则就能 更高精度地进行校准。
[0197] 此外,关于 PNS 的细节,例如在 Zeng-Ping Chen, Julian Morris, and Elaine Martin,"Extracting Chemical Information from Spectral Data with Multiplicative Light Scattering Effects by Optical Path-Length Estimation and Correction',, 2006 中已进行说明。
[0198] E - 2.第二预处理(利用了 PCA/FA的白化处理):
[0199] 作为第二预处理部460所执行的第二预处理,能利用PCA (主成分分析)和FA (因 子分析)。
[0200] 在一般的ICA方法中,作为预处理,进行处理对象数据的维数压缩和去相关化。 由于通过该预处理而使应该利用ICA求出的变换矩阵限定为正交变换矩阵,因此能够削 减ICA的计算量。将这种预处理称为"白化",在大多数情况下采用PCA。有关采用了 PCA 的白化,例如在 Aapo Hyvarinen, Juha Karhumen, Erkki Oja, ''Independent Comonent Analysis' 2001,John Wiley&Sons, Inc.( "独立成分分析",2005年2月,东京电气大学出 版部发行)的第6章中已有详述。
[0201] 然而,在PCA中,在处理对象数据中含有随机噪声的情况下,有时受到该随机噪声 的影响而在处理结果上产生误差。因此,为了减少随机噪声的影响,优选采用具有对噪声的 鲁棒性的FA(因子分析)来代替PCA进行白化。在以下,说明基于FA的白化的原理。
[0202] 如上所述,一般而言,在ICA中,假设将处理对象数据X表示为构成成分Sl的线性 和的线性混合模型(上述公式(19)),求出混合比例 Cl和构成成分Sl。但是,在实际的数据 中,大多都附加有构成成分81以外的随机噪声。因此,作为考虑了随机噪声的模型,考虑通 过下面的公式来表达测量数据X的模型。
[0203] 公式 22
[0204] X = A · s+ P …(22)
[0205] 在此,P为随机噪声。
[0206] 于是,进行考虑了该噪声混合模型的白化,其后,能够进行ICA而得到混合矩阵A 和独立成分估计。
[0207] 在本实施方式的FA中,假设独立成分Si和随机噪声P分别符合正态分布N(0, Im),N(0, Σ)。此外,正如普遍所知的,正态分布N(xl,x2)的第一参数xl表示期望值,第 二参数x2表示标准偏差。此时,由于处理对象数据X成为符合正态分布的变量的线性和, 因此处理对象数据X也仍然符合正态分布。在此,如果将处理对象数据X的协方差矩阵设 为V[x],则处理对象数据X所符合的正态分布能够表达为N(0, V[x])。此时,能够按下述的 程序计算有关处理对象数据X的协方差矩阵V[x]的似然函数。
[0208] 首先,如果假设独立成分81彼此正交,则处理对象数据X的协方差矩阵V[x]由下 面的公式计算:
[0209] 公式 23
[0210]
[0211] 在此,Σ为噪声p的协方差矩阵。
[0212] 这样,协方差矩阵V[x]能够用混合矩阵A和噪声的协方差矩阵Σ表示。此时,对 数似然函数L(A,Σ)由下面的公式给出:
[0213] 公式 Μ
[0214]
[0215] 在此,η为数据X的数据个数、m为独立成分的个数、运算符tr表示矩阵的迹(卜 b -只)(对角成分之和),运算符det表示行列式。另外,C是通过样本计算而由数据X求 出的样本协方差矩阵,由下面的公式计算:
[0216] 公式 25
[0217]
[0218] 通过使用了上述式(24)的对数似然函数L(A,Σ)的最大似然法,能够求出混合矩 阵A和噪声的协方差矩阵Σ。作为该混合矩阵A,可以得到几乎没有上述式(22)的随机噪 声P的影响的矩阵。这是FA的基本原理。此外,作为FA的算法,存在利用了最大似然法 以外的算法的各种算法。在本实施方式中,也能利用这样的各种FA。
[0219] 可是,通过FA得到的估计值终归只是AAT的值,虽然在决定了适合于该值的混合 矩阵A的情况下能降低随机噪声的影响并使数据去相关化,但为了保留旋转的自由度而不 能够唯一地决定多个构成成分 Sl。另一方面,ICA是以多个构成成分Sl彼此正交的方式减 少多个构成成分Si的旋转的自由度的处理。因此,在本实施方式中,将通过FA求出的混合 矩阵A的值用作为白化矩阵(已白化的矩阵),由ICA指定任意保持旋转。由此,能够通过 在进行了针对随机噪声的鲁棒性的白化处理之后执行ICA而决定彼此正交的、独立的构成 成分 Sl。另外,这种处理的结果能够降低随机噪声的影响,使有关构成成分Sl的校准精度 提尚。
[0220] E - 3. ICA (作为独立性指标的峰度和β散度):
[0221] 作为用于独立成分的分离的指标,ICA(独立成分分析)一般将表示分离后的 数据之间的独立性的高阶统计量用作为独立性指标。峰度是典型的独立性指标。有 关使用了峰度作为独立性指标的ICA,例如在Aapo Hyvarinen, Juha Karhumen, Erkki Oja,''Independent Comonent Analysis",2001,John Wiley&Sons, Inc.("独立成分分析", 2005年2月,东京电气大学出版部发行)的第8章中已有详述。
[0222] 但是,在处理对象数据中混入有尖峰噪声这样的离群值的情况下,导致将该离群 值也包括在内的统计量计算作为独立性指标。因此,有时在有关处理对象数据的原本的统 计量与已计算的统计量之间产生误差,引起分离精度的下降。因此,优选使用难以受到来自 处理对象数据中的离群值的影响的独立性指标。作为具有这种特性的独立性指标,能使用 β散度。在以下,说明作为ICA中的独立性指标的β散度的原理。
[0223] 如上所述,一般而言,在ICA中,假设将处理对象数据X表示为构成成分Sl的线性 和的线性混合模型(上述公式(19)),求出混合比例 Cl和构成成分Sl。通过ICA求出的构 成成分s的估计值y使用分离矩阵W而表达
当前第5页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1