具有增强的灵敏度和质量分辨能力的四极质谱仪的制作方法_5

文档序号:9351466阅读:来源:国知局
b均假定为具有J个分量的向量。
[0115] 使用方程3-5,可以将方程2改写成方程6中所示那样。
[0116] e(I) = A (I) ? A (I) (6)
[0117] 用I*表示I的最优值,即,将e最小化的强度向量I* = (14,12*,???〗#)。那么, e相对于I的一阶导数在I*处估算为零,如方程7表示的。
[0118]
(?)
[0119] 方程7是对N个方程的简写,每个强度L、12、…IN-个。
[0120] 可以使用链式法则来估算方程6的右侧:其中误差e是差向量A的函数;A是模 型向量S的函数;并且S是强度向量I的函数,强度向量包含L、I2、???Ip
[0121] 然后考虑e相对于强度之一 1"在(未知的)I*处估算的导数,其中m是[1..N]中 的一个任意的指标。
dA {
[0125] 现在可以使用方程9-10代替方程8右边的?yl/ j、、
[0126]
[0127] 然后可以使用方程4代替方程11右边的A (I*)。
[0128]
[0129] 将方程12的右边设为零,如方程7中所示的最优化准则所指明的,得到了方程13。
[0130] Un ? S(I*) = Uk ? X (13)
[0131] 现在可以使用方程1代替方程13左边的S(I*)。
[0132]
[0133] 注意,方程14将未知的强度{In*}与已知的数据向量X和已知的信号{UJ相关 联。剩下的全部是代数的重整,得到了 {In*}的值的表达式。
[0134] 使用内积的线性,将在方程14左边出现的和的内积改写为内积的和。
[0135]
[0136] 方程15的左边可以写为一个行向量与一个列向量的积,如方程16中所示。
[0137]
[0138] 定义行向量A" (方程17)和标量ani(方程18)。这两个量都依赖于指标m。
[0139] A"= …比%] (17)
[0140] am=Um*X (18)
[0141] 使用方程16-18可以简洁地改写方程15。
[0142] Anr=an (19)
[0143] 方程19对[1..N]中的每个m都有效。我们可以将全部N个方程(以方程15的 形式)写入具有N个分量的列中。
[0144]
[0145] 方程20左边的列向量包含N个行向量,每个具有大小N。这一个多行的列代表一 个NXN的矩阵,将用A表示。通过在方程17中用1替代m并替代方程20左边的列向量 的第一行的Ai,形成了矩阵A。对指标2-N重复这个过程,由此构建一个NXN的矩阵,其 元由方程21给出。
[0146]
[0147] 如方程21指出的,在矩阵A的m行、n列的矩阵元是第m个信号和第n个信号的 内积。用a表示方程20右边的列向量。
[0148] 综合起来,这N个方程整合为单一的矩阵方程:
[0149] AI=a(22)
[0150] 其中在方程22右边出现的向量a的分量是由方程18定义的。
[0151] 在没有信号重叠、即无论是否m辛n都有0的平凡情形下,A是一个对角矩 阵。在此情况下,对于[1..N]中的每个n,最优强度的解由In* =an/Ann给出。另一种特殊 情况是这些信号可以分成K个簇,使得只要m和n属于不同的簇就有六""= 0。在此情况下, A是一个分块对角矩阵;所得的矩阵方程可以分成K个(子)矩阵方程,每个簇(或子矩阵 块)一个。这种分块对角的情况仍是〇 (N3)、但涉及比一般情况更少的计算。
[0152] -般,求解方程22形式的方程具有0(N3)的复杂性。即,确定N个未知强度所要 求的计算次数随着未知强度个数的立方而扩大。
[0153] 1)特殊情况:这N个信号可通过单位时间偏移叠加。
[0154] 在这个部分中,对这个问题附加了一些额外的限制条件以便在求解(方程22)的 一般情况的复杂性方面提供显著的减少。
[0155] 限制条件1 :任何一对信号1]"和Un可以通过时间偏移而叠加。
[0156] 限制条件2 :相邻信号U,Un+1之间的时间偏移对于[1..N-1]中的所有n都是相 同的。
[0157] 限制条件(1)的等效陈述是,所有信号都可以用一个标准信号U的时间偏移来表 示。这个限制条件适用于高质量分辨能力的四极杆问题。第二个限制条件得到了容易确定 的解,用于检测信号并提供对其位置的初始估算,尽管在信号之间存在显著的重叠。这两个 限制条件将方程22的解从0(N3)问题减少到0(N2)问题,如以下讨论的。
[0158] 以上的限制条件(1)可以用方程23符号式地表示。
[0159] Un[v,q] =Um[v,q+n-m] (23)
[0160] 其中v是一组代表所有除时间外的独立变量的值的指标(即,在此情况下是离开 截面中的位置以及初始的RF相)并且q是时间指标。由于这些信号与时间偏移相关,则必 须在时间与影响观察结果的其他独立变量之间进行区分。
[0161]为了明确限定方程23,在任何时间点m获得的测量结果的集合必须包括与在任何 其他时间点n获得的相同的v值的集合。将这种特性考虑在内,对内积的定义(方程5)在 时间值和其他独立变量的意义上进行改写。
[0162]
[0163] 其中测量总次数J=QV,q是时间指标,并且v是剩余值的指标(即,其他独立变 量的值的有限个数的组合通过一个一维指标v枚举)。
[0164] 此外,由于在整个区间[1..N]上必须限定UjPUm二者,所以在[1..N]之外也必 须限定这两个信号。区间[1..N]或任何其他有限区间的时间偏移不包含在同一个区间内。 因此,必须对所有整数时间点定义所有信号;假定在有限范围的某个支持区域之外,将信号 值定义为零。
[0165] 这些限制条件所强加的特殊特性通过考虑矩阵元而揭示出。以下的短求 导显示,可以将A (m+k) (n+k) 写成Am项加上一个在许多情况下小到可忽略的项。
[0166]
(25)
[0167] 在以上方程25中,第一个等号右边表达式来自对矩阵元的定义(方程22);下一 个表达式来自新的内积定义,其中将时间与其他独立变量区分开(方程24);下一个表达式 是将时间偏移方程(方程23)应用至每个因子而得到的,从而将它们分别写成UdPUn的项。 方程25的第二行的表达式涉及将总和指标q用q+k替换。方程25的第三行的表达式是将 时间指标上的总和拆成三个部分的结果:小于1的q值、从1到Q的q值、然后从Q-k+1至 Q减去额外的项。这三个和中的第二个是,并且这个量被再次标记在最后的表达式中被 提到前面。
[0168] 为了使任意k值的元A(ni+k)(n+k)与Am相等,认为在方程25的最后一个表达式中在 括号中出现的项是一个误差项。该误差项包含两个被称为"左"和"右"的项。
[0169] 当信号1]_或1]_在到达时间窗口的左边缘(在此已经收集了数据)之前降低 至零时,"左"项为零;同样地,当两个信号之一在到达数据窗口的右边缘之前降低至零时, "右"项为零。
[0170] 当方程25的"误差"项近似成零时,可以将六^^形式的每个元近似成Am。通 过定义,满足这个特性的矩阵A是Toeplitz形式,其意义在下面进行说明。
[0171] 假定矩阵A是Toeplitz形式。则沿着该矩阵的对角带的这些元是相等的。例如, A12=A23=A34…。一般,矩阵中的任何元,例如Amn,仅依赖于行指标与列指标之差m-n。因 此,该NXN的矩阵仅包含2N-1个不同的值,对应于范围从-N到N的m-n值。
[0172] 可以通过指定这2N-1个不同值、将前N个值以倒序(即,从下到上)放在矩阵的 第一列中并且然后从左到右填充该第一列的剩余N-1个元来构造矩阵A。该矩阵的剩余部 分是如下填充的:填充平行于主对角线的2N-1个带中的每个,这是通过从该矩阵的左边缘 或上边缘向下地将值复制到右侧,直到分别到达下边缘或左边缘。当A是一个Toeplitz矩 阵时,方程22可以通过莱文森递推(例如,见NumericalRecipesinC)来求解,仅要求 〇(N2)次计算。这种Toeplitz特性导致了对N个强度值的初始估算值的较快速的计算。
[0173] Toeplitz近似(A(m+kHn+w近似为Amn)所引起的误差在考虑特殊情况时是最容易理 解的。首先,考虑一个对角矩阵A。假定信号仏完全位于时间区间[1..Q]内,此时观察到 了数据,即无截断。现在,考虑信号Un,将其偏移(n-1)个时间单位到&的右侧。假定信号 Un延伸超出时间Q,并且因此该信号的右尾被数据窗口截断。那么1]"与其自身的内积,即矩 阵元Ann,由于这种截断而小于An。然而,在To印litz近似过程中,使Ann等于An。Ann的所 得过高估算值导致了对应强度In*的过低估算值。类似地,在分块对角情况下,在被窗口边 缘截断的分块内的信号强度还被过低估计。在一个分块内,如果截断将所有的项都减小了 相似的比例因子,其结果将把所有强度放大同一因子的倒数。
[0174] 以规则的时间间隔估算的N个值的集合(或同等地m/z) {In*}可以解释为从所观 察的数据向量X"重构的质谱。
[0175] 2)存在的信号数及其位置的估计
[0176] 最后,考虑如何使用从对To印litz系统求解而得到的初始估计值。不希望的是, 这些数据事实上是N个均匀间隔开的信号的实现。而是希望这些数据是较少数量的、位于 任意时间值处的信号(例如k<<N)的实现。在本文中,希望N个强度中大部分结果都是 零。不为零的估计值可以表示信号的存在、但也可能是由于数据中的噪声、存在的信号的位 置误差、信号模型的误差、以及截断效应所导致的。
[0177] 对强度值应用一个阈值,仅保留k个信号,对应于超出阈值的不同离子物种并且 将剩下的强度设定为零。该阈值模型将数据近似为k个信号的叠加。作为本发明的应用目 的的有益结构,Toeplitz系统的解产生了一组强度值,这些强度值导致辨别出了存在的信 号数目(k)以及这些信号的近似位置。
[0178] 对数据处理的一般讨论
[0179] 因此,本发明被设计用于将观察到的信号表示为一个参考信号混合体的线性组 合。在此情况下,观察到的"信号"是离开四极杆的离子的采集图像的时间序列。这些参考 信号是来自不同m/z值的离子的观察信号的贡献因素。该线性组合中的系数对应于质谱。
[0180] 参考信号:为了构造用于本发明的质谱,有益的是对每个m/z值指定信号,即具有 该m/z值的单一离子物种可以产生的离子图像的时间序列。该途径在此是用于通过观察一 个测试样品而构造一个标准的参考信号,离线时作为校准步骤,并且接着在该标准的参考 信号的意义上表达一系列的以m/z值为索引的参考信号。
[0181] 在给定时刻,观察到的离开云图像取决于三个参数:离子在进入四极杆时的a和q 还以及RF相位。该离开云还取决于离子速度的分布以及径向位移,其中假定这种分布除了 强度缩放之外是随时间不变的。
[0182] 构造这一系列用于本发明的参考信号提出了挑战。三个参数中决定该信号的两 个,a和q,依赖于比率V(m/z),但第三个参数仅依赖于t而不依赖于m/z。因此,没有简单 的方法来将一对离子的时间序列准确地与任意的不同m/z值相关联。
[0183] 幸运的是,可以从标准参考信号通过RF周期的整数倍的时间偏移来构造可计数 的(而非连续的)一系列参考信号。这些信号是不同离子物种的预期信号的近似值,尤其 是当同标准信号的m/z差很小时。
[0184] 为了了解为什么时间偏移的近似化可以起作用并且研究其限制,考虑了分别集中 在1^和t2并且分别具有宽度七和d2的两个脉冲的情况下,其中t2=ktpdfkt2,并且h >>山。进一步,假定k近似为1。第二个脉冲可以通过将时间轴正好扩大一个因子k而由 第一脉冲产生。然而,对第一脉冲应用t2-h的时间偏移将产生集中在12并且宽度为d:的 脉冲,当k近似为1时山近似等于d2。对于低到中的稳定性极限(例如,10Da或更小),这 些离子信号就像以上脉冲信号一样是窄的且从时刻零开始集中了许多峰宽度。
[0185] 由于通过固定的RF周期调制了离子图像,该标准参考信号不能与来自任意m/z值 的信号通过时间偏移来相关;相反,它仅能与信号通过是RF周期的整数倍的时间偏移而相 关。即,RF相位在RF周期的整数倍处是对齐的。
[0186] 我们仅能考虑离散的时间偏移这个限制因素表示本发明的严重限制。即使在傅里 叶变换质谱法(FTMS)中,其中这一系列参考信号在频率连续上是有用的,所观察的信号实 际上是以频率为1/T整数倍的正弦曲线的可计数个数来表示的,其中T是所观察的信号的 持续时间。在FTMS和本发明两者中,表达一个不准确位于整数倍处的信号(其中限定了参 考信号)在构造的质谱中产生小误差。然而,这些误差总体上是小到可接受的。在FTMS和 本发明两者中,参考信号的m/z间隔可以通过减小扫描速率来减小。不同于FTMS,在本发明 中减小的扫描速率不一定意味着更长的扫描;相反,可以快速对准该质量范围的一个小区 域以便在更小的扫描速率下更近地观察。
[0187] 回到上述去卷积问题,假定所观察到的信号是参考信号的线性组合,并且还假定 在RF周期的整数倍处存在一个参考信号,对应于规则隔开的m/z间隔。对应于RF周期的 m/z间隔是由扫描速率决定的。
[0188] 矩阵方程:通过本发明来构造质谱在概念上与在FTMS中相同。在FTMS以及在此 使用的那些之中,质谱的样本值是解开线性矩阵方程Ax=b的一个向量的分量,如以上详 细讨论的。矩阵A是由多对参考信号之间的重叠加总和的集合形成的。向量b是由每个参 考信号与所观察的信号之间的重加总和的集合形成的。向量x包含(估算的)相对丰度的 集合。
[0189] 矩阵方程的解:在FTMS中,矩阵A是恒等矩阵,使x=b,其中b是信号的傅里叶 变换。该傅里叶变换仅是与具有变化频率的正弦波的叠加总和的集合。在本发明中,矩阵A 通常为Toeplitz形式,如以上讨论的,意味着任何平行于主对角线的带中的所有元素都是 相同的。只要展开的参考信号是彼此的偏移形式,就会出现Toeplitz形式。
[0190] 计算复
...
当前第5页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1