串扰补偿的制作方法

文档序号:17981261发布日期:2019-06-22 00:07阅读:356来源:国知局
串扰补偿的制作方法

生物技术、医学和相关技术领域以分子的分析为基础。电子装置可以以高精密度和特异性分析分子。特别是在最近几年中,已开发了通过常规方法分析大量样品的自动化电子装置。例如,现代dna测序装置被用于大量dna探针的常规分析。蛋白质样品可以通过高通量筛选和相关方法进行分析。通常,这些电子装置检测从样品探针发射的荧光信号。这在分子例如核酸或蛋白质已用荧光化合物例如染料标记时是可能的。

可商购的测序装置能够对用荧光染料标记的大量样品并行测序。最近开发的被称为“下一代测序”ngs的方法,已对测序进行了革新。例如,ngs允许对一致的dna分子的局部簇进行大规模并行测序。这些簇的形成通过模板dna分子在流动池上的克隆dna扩增(ofca,流动池上扩增)或将带有通过乳液pcr(聚合酶链反应)扩增的克隆dna分子的珠子固定化来实现。ngs允许同时进行数千个或甚至数百万至数十亿个测序反应。

在ngs中,测序通过聚合酶介导的核苷酸延伸的重复循环或通过寡核苷酸连接的迭代循环来进行。作为大规模并行方法,取决于平台,ngs在单次仪器运行中产生数百个数兆碱基至数千兆碱基的核苷酸序列输出。与其他方法相比,ngs可以允许i)廉价地产生大量序列数据,ii)可以对起始材料的量具有低的要求,并且iii)至少在理论上可以允许对样品中的所有dna分子进行定量。因此,它可以代替常规测序方法用于许多应用。

ngs技术的ngs平台和常见应用/领域综述在例如voelkerding等,clinicalchemistry55:4641-658,2009和metzker,naturereviews/geneticsvolume11,january2010,第31-46页中。

在ngs中,将各种不同的感兴趣的寡核苷酸共价附连到支持物。随后,将用荧光染料标记的核苷酸用dna聚合酶附连到所述生长的寡核苷酸链。当四种核苷酸用不同的荧光染料标记时,可以检测从探针发射的荧光信号并且可以鉴定附连到所述寡核苷酸的核苷酸的类型。在检测后,将所述荧光染料切掉并进行下一个合成循环,其中将新的标记的核苷酸附连到所述生长的链。通过进行多个循环,可以以逐步的方式确定生长的寡核苷酸链的序列。所述工作步骤在自动化测序装置中进行。

us2010/0323350a1和wo2009/117119a1涉及使用例如从通过合成方法测序获得的数据来确定核苷酸序列中核酸的身份的方法和组合物。

wo2008/097455a1涉及一种用于激发并测量包含荧光材料例如荧光标记物、染料或颜料的样品上或样品中的荧光,特别是用于检测核酸上的荧光标记物的成像系统。此外,还公开了一种装置,其被配置成使得多个不同dna模板中的荧光标记物被同时检测。

wo2014/020137a1涉及一种用于从测序文库富集靶序列以提供富集靶的测序文库的方法,其中所述测序文库适用于大规模并行测序并包含多个双链核酸分子。

从带有标记的分子的样品探针发射的荧光信号是弱的,但所述信号必须以高精密度和特异性被检测。因此,这种方法需要精密的光学设备、特别是照相机和扫描技术。

此外,为了获得精密可靠的测序结果,例如在fastq中,通过测序装置的光学成像系统捕获的数字图像的详尽评估是必需的。

通道强度可用作潜在的荧光标记分子的浓度的代用指标。理想情况下,通道特异性强度可能同等分布并彼此独立(独立同分布)。然而,通常情况并不如此:每个通道不同的成像性能可能引起不同的强度分布。a)不同的荧光染料在它们的发射频率上可能具有交叠。这可能在不存在荧光团的荧光团特异性通道中产生高于背景的强度水平。珠子强度值的这种相互依赖性可以被称为串扰或交叉相关。b)通道特异性背景荧光可能产生不同水平的最小观察值(噪音偏移)。c)对于相同的潜在荧光团浓度来说通道特异性亮度可能在不同通道中产生不同的强度值(通道标度变换(channelscaling))。三种现象都可以引起从强度值与荧光团浓度的简单(线性)关系的偏离,并且需要进行校正以用于ngs应用。

因此,本发明的目的是提供一种尤其是克服了现有技术的上述问题的方法和系统。具体来说,一个目的可以是鉴定并解决横跨不同颜色通道的珠子强度的相互依赖性,另一个目的可以是鉴定并解决噪音偏移,另一个目的可以是鉴定并解决通道标度变换。

这些目的通过独立权利要求项的特点得以实现。从属权利要求项涉及本发明的其他方面。

本发明的方法是计算机可执行的。然而,专业技术人员应该理解,也存在执行本发明的方法的其他方式。

本发明涉及一种在多个数字图像中进行强度偏倚补偿的方法。优选地,所述方法涉及一种多个数字图像中不同荧光化合物之间的强度偏倚补偿的方法。所述多个数字图像中的每个数字图像含有多个对象,即含有关于多个对象的图像信息,其中所述多个对象中的每一个被配置成接收包含遗传信息的至少一个分子。所述至少一个分子被配置成接收至少第一荧光化合物和第二荧光化合物中的一者。例如,所述至少一个分子可以具有可切割的荧光化合物。所述多个数字图像中的第一数字图像在所述第一荧光化合物的电磁辐射发射期间通过光学成像系统获取,并且所述多个数字图像的第二数字图像在所述第二荧光化合物的电磁辐射发射期间通过所述光学成像系统获取。所述方法包括优选地采取下述顺序的下述步骤:

a)从所述第一数字图像为每个对象确定第一强度值;

b)从所述第二数字图像为每个对象确定第二强度值,所述第一和第二强度值定义了数据点,每个数据点包含第一强度值和第二强度值;

c)指定所述数据点的子集;

d)在仅仅所述数据点的子集的基础上确定所述的第一与第二强度值之间的关系,即由此确定相应的第一与第二强度值之间的交叉相关;以及

e)在所述第一强度值、第二强度值和相应的第一强度值与第二强度值之间的关系的基础上确定补偿过的第一强度值,即交叉相关校正过的第一强度值。

为简单起见,本发明针对两种强度值进行描述。然而,同样的方法也适用于任意数目的强度值,其也应该被本发明所涵盖。可以理解,所述第一图像和第二图像含有所述多个对象的图像信息。所述第一图像可以被获取以使它含有第一频率范围内的图像信息,并且所述第二图像可以被获取以使它含有第二频率范围内的图像信息。例如,所述第一图像可以用第一滤色器获取,并且所述第二图像可以用第二滤色器获取。所述第一强度和第二强度可以交叉相关,即在所述第一强度与第二强度之间可能存在偏倚。换句话说,所述第一和第二频率范围可能交叠。这种交叉相关或串扰可以通过选择由所述第一和第二强度值所定义的数据点的子集来补偿。在所述数据点子集的基础上,可以确定所述第一与第二强度值之间的关系;这种给出的关系可用于补偿所述交叉相关。换句话说,所述方法可以适用于在由所述光学成像系统确定的(例如测量的)强度值的基础上确定由所述至少一个对象发射的原始强度值。所述交叉相关校正过的强度值可以具有滤色器特异性分布。这些分布可以通过不同的背景水平和荧光团对强度值的映射函数来确定。这些分布可以通过选择数据点的子集或通过使用整个集来表征。所述强度分布的表征允许进行校正或归一化,使得所有颜色特异性分布是匹配的。

所述至少一个对象可以是或可以包含单个dna/rna链或一组(几乎)一致的链。所述dna/rna链也可以是单链dna/rna片段。因此,所述对象接收的分子中包含的遗传信息可以与核苷酸和/或核苷碱基中包含的遗传信息相关。换句话说,所述分子可以是或可以包含核苷酸和/或核苷碱基。单个dna/rna链或成组的链可以被直接地或通过可商购的珠子例如thermofisher固定化到成像对象载玻片。然而,至少一个对象也可以不含dna/rna链。

每个dna链可以被配置成接收分子、优选为核苷酸。所述核苷酸可以包含一个可切割的荧光化合物和可切割的封端。此外,所述分子可以是多个四种不同分子,其各自具有对所述四种不同分子中的每一者特异的荧光化合物。

所述光学成像系统优选地包含照明装置例如led,以激活/刺激所述荧光化合物来激发电磁辐射,以及检测系统例如ccd检测器,以检测所述荧光化合物的发射波谱(电磁辐射)。

所述方法可以进行多个循环并且可以实施确定的循环范围。所述多个循环中的每一个的特征可以在于所述四种分子之一被附连到所述dna链之一,其中所述可切割的封端确保了每个循环只有一个分子被附连到每个dna链。在每一个循环后,可以除去所述可切割的封端,以便另一个分子可以在下一个循环中附连到所述dna链。同时,可以从所述至少一个分子除去所述荧光化合物。

对于每个循环来说,可以获取多个、优选为四个数字图像、即照片,附连到所述分子的四种荧光化合物中的每一种各一个数字图像。例如,所述多个数字图像中的每一个可以使用不同滤色器来获取。此外,所述四种荧光化合物中的每一种可以具有红色、蓝色、黄色或绿色光谱体系中的主要发射光谱之一。

所述第一与第二强度值之间的关系可以是数学函数。例如,所述数学函数可以是所确定的第一和第二强度值(即测量到的强度值)的函数,并且可以得到第一和第二原始(即发射的)强度值。所述数学函数可以例如书写为串扰矩阵形式。

例如,在所有荧光团的发射光谱完美分开使得不存在串扰的假设下,在给定通道中/为给定通道检测的强度值(i0)将由匹配的荧光团的浓度(c0)决定(i0=g(c0))。荧光团强度通常线性依赖于浓度,这将上述函数简化为i0∝c0,使得所测量到的强度可以用作荧光团浓度的代用指标。然而,如果在通道之间存在串扰,则为通道c测量到的强度值ic受到不匹配的荧光团的浓度影响(ic=g(i0,i1...in))。通常,贡献可能是累加且线性的,这可以允许将所有通道强度对感兴趣的通道的贡献书写为ic=βc,0(i0)+βc,1(c1)+···+βc,n(cn),其中βc,i表示通道i对感兴趣的通道(c)的贡献。n个类似方程的集合可以描述所有n个通道的串扰影响。所述贡献参数可以方便地描述在nxn串扰矩阵中:

通过使用所描述的方法,可以补偿确定的强度值的串扰,并且可以确定无偏倚的强度值。

优选地,所述方法还包括下述步骤:

f)在所述第一和第二强度值的基础上确定噪音偏移;和

g)从所述第一和第二强度值中减去所确定的噪音偏移。

换句话说,可以在背景强度信号的基础上确定所述噪音偏移。因此,所述方法也可以适用于补偿通道特异性强度偏倚。例如,可以在所述第一强度值的基础上确定第一噪音偏移,并且可以在所述第二强度值的基础上确定第二噪音偏移。换句话说,可以在通道特异性背景强度信号的基础上确定通道特异性噪音偏移。通过这种方式,可以补偿噪音偏移、优选为通道特异性噪音偏移。可以从所述步骤a)和b)中确定的第一和第二强度值和/或从所述步骤e)中确定的补偿过的强度值中减去所确定的噪音偏移值。

给定通道c的检测到的强度值ic可以被理解为有贡献的荧光团的浓度(参见上文)与附加的通道特异性噪音的卷积信号ic=βc,0(i0)+βc,1(c1)+…+βc,n(cn)+εc,其中εc表示噪音分量。给定通道的所有测量到的强度的噪音分量可以通过随机变量来建模。这种随机变量的第一众值(firstmode)可以是通道特异性的,并且可以是非零的。为了校正/补偿所观察到的强度,通过变换这些强度以使所述噪音分量的众值可以具有特定值例如零,可以是优选的。

为了定量所述噪音分量的众值,可以测量不具有预期信号分量的对象。它们是没有附连dna/rna链的对象(空珠子)或附连有dna/rna的对象。在后一种情况下,对通道c的噪音估算可以在不同于通道c的通道k中发射的对象上进行。潜在的串扰可以通过上文描述的校正或通过选择c和k使得观察不到串扰来消除。所述噪音偏移校正可以被方便地整合在(n+1xn+1)串扰矩阵中,其中n等于通道的数目,并且ε′n是通道特异性噪音偏移:

优选地,所述方法还包括下述步骤:

h)确定所述第一强度值的第一强度分布和所述第二强度值的第二强度分布;

i)确定所述第一强度分布与第二强度分布之间的标度变换函数(scalingfunction);

j)使用所述标度变换函数对所述第一和/或第二强度值进行标度调整(rescaling)。

所述标度变换函数可以包括标度变换因子(scalingfactor)或可以由标度变换因子构成。

换句话说,可以理解通道特异性强度分布被确定。因此,所述方法也可以适用于补偿通道特异性强度偏倚。通过这种方式,可以补偿通道特异性强度分布,即通道标度变换。在步骤j)中,在步骤a)和b)中确定的所述第一和/或第二强度值、在步骤e)中确定的补偿过的强度值和/或包括在步骤g)中确定的减去的噪音分量的强度值,可以进行标度调整。

检测到的强度值对于不同的通道可能具有不同的分布。这可能是由于荧光团特异性的发射性质或可能是由于不同的检测能力。通道特异性强度分布可以在给定通道发射中的对象的子集上测量。分布可以通过确定概括性统计量(例如平均值、中值等)或通过将概率模型拟合到所述数据来表征。不同的通道特异性分布可以被折叠(collapse)成普通分布,由此校正这种偏倚。如果这种折叠方法可以通过线性因子来进行,则这种因子可以被储存作为所述串扰矩阵的对角线分量。

优选地,所述方法还包括在所述第一强度值、第二强度值和所述第一强度值与第二强度值之间的关系的基础上确定补偿过的第一强度值和补偿过的第二强度值。

换句话说,所述方法可以包括在所确定的强度值的基础上确定原始或发射的强度值。

优选地,指定所述数据点的子集通过在所述第一和第二数字图像中选择感兴趣的区域来进行。换句话说,可以在所述第一和第二数字图像中选择相应的感兴趣的区域,例如中央区域。

通过这种方式,不必处理所有对象的所有强度值。因此,可以节省计算能力。此外,所述感兴趣的区域可以例如在所述数字图像的最亮区域中选择。通过这种方式,可以更精确地确定所述关系。

优选地,所述方法在多个循环中重复地执行,其中指定所述数据点的子集通过选择所述多个循环中的一个或多个循环来进行。换句话说,可以指定所述多个循环中的一定数目的循环。因此,所述数据点的子集可以只包含所选循环的强度值。

通过这种方式,可以例如首先在所选循环中确定所述第一与第二强度值之间的关系,然后可以将其用于后续循环中的交叉补偿。

优选地,所述方法还优选地在步骤c)之后、更优选地在步骤c)与d)之间包括下述步骤:

k)将所述数据点的子集分组成多个组,其中所述多个组中的每个组包含一个代表性数据点。

此外,确定所述第一与第二强度值之间的关系在仅仅所述代表性数据点的基础上进行。

换句话说,所述数据点的子集可以被分组在箱子(bins)中,即所述数据点的子集可以被拣选(binned)。每个箱子可以含有多个数据点。通过这种方式,可以减少用于确定所述第一与第二强度值之间的关系的数据点的数目,由此减少执行所述方法所必需的计算能力。此外,将所述数据点分组到箱子中也可以补偿所述数据点子集中的异常值。

优选地,所述第一和第二强度值的子集的分组通过将所述第一和第二强度值的子集分开放到具有固定边界的箱子中来进行。换句话说,每个箱子可以含有位于强度值的预定范围内的强度值。因此,所述箱子的边界可以是预定的,并且由一个箱子所代表的的数据点的数目可以取决于所预定的边界。通过这种方式,所述方法可以变得更加稳健。

优选地,所述第一和第二强度值的子集的分组通过将所述第一和第二强度值的子集分开放到具有固定数目的数据点的箱子中来进行。换句话说,可以为每个箱子指定数据点的数目,并且所述箱子的边界可以被动态调整。通过这种方式,可以确保在每个箱子中存在足够的数据点。

优选地,确定所述第一与第二强度值之间的关系使用多项式拟合方法来进行。优选地,所述多项式拟合方法可以只具有1阶。

优选地,确定所述第一与第二强度值之间的关系使用随机样本一致性算法来进行。所述随机样本一致性算法也可以被称为ransac算法。所述ransac算法可以对所述数据点的子集中的异常值不太敏感。因此,可以获得更可靠的第一与第二强度值之间的关系。

优选地,所述方法优选地在步骤d)和e)之间还包括下述步骤:

l)在所述第一与第二强度值之间的关系的基础上确定串扰矩阵。

串扰矩阵a可以是描述所述发射的强度值e与确定的(即测量到的)强度值d之间的线性关系的矩阵。长度n的矢量e和d可以含有所有通道n的强度值。例如,所述确定的强度值可以根据所述发射的强度值书写如下:

d=e*a

di是第i个确定的强度值,ej是第j个发射的强度值,并且aij是描述di与ej之间的关系的矩阵元。因此,所述发射的强度值(即所述补偿过的强度值)可以利用反转矩阵a-1来确定:

e=d*a-1

例如,如果主要交叠在蓝色(i=0)与红色(i=1)荧光光谱之间,则所述串扰矩阵可以以相应的被确定的串扰的大小接收蓝色光谱(例如使用绿色滤光器获取的数字图像)的强度值与红色光谱(例如使用黄色滤光器获取的数字图像)的强度值之间的关系的元(例如a0,1=0.4)。所述矩阵的其他非对角线元可能明显更小。然而,这取决于所使用的滤光器设置。

优选地,所述数据点的子集只包含已接收包含遗传信息的分子的对象的强度值。换句话说,所述数据点的子集可以只包含活珠子的强度值。通过这种方式,结果可以以信号强度而不是背景强度为主。

本发明的另一方面涉及一种系统,其被配置成执行任一上述方法。

本发明的另一方面涉及一种用于在至少第一数字图像和第二数字图像中进行串扰补偿的系统,其中所述至少第一和第二数字图像中的每个数字图像含有关于多个对象的图像信息。此外,所述多个对象中的每一个被配置成接收包含遗传信息的至少一个分子。所述至少一个分子被配置成接收至少第一荧光化合物和第二荧光化合物中的一者。所述第一数字图像在所述第一荧光化合物的电磁辐射发射期间通过光学成像系统来获取,并且所述第二数字图像在所述第二荧光化合物的电磁辐射发射期间通过所述光学成像系统来获取。所述系统包含:

i)强度确定单元,其被配置成用于从所述第一数字图像为每个对象确定第一强度值并从所述第二数字图像为每个对象确定第二强度值,所述第一和第二强度值定义了数据点,每个数据点包含第一强度值和第二强度值;

ii)子集确定单元,其被配置成用于指定所述数据点的子集;

iii)串扰补偿单元,其被配置成用于在仅仅所述数据点的子集的基础上确定相应的第一与第二强度值之间的关系,即由此确定相应的第一与第二强度值之间的交叉相关,并用于在所述第一强度值、第二强度值和所述第一强度值与第二强度值之间的关系的基础上确定补偿过的第一强度值,即交叉相关校正过的第一强度值。

优选地,所述系统还包含:

iv)噪音偏移补偿单元,其被配置成用于在所述第一和第二强度值的基础上确定噪音偏移,并从所述第一和第二强度值中减去所确定的噪音偏移。

优选地,所述系统还包含:

v)强度标度变换补偿单元,其被配置成用于确定所述第一强度值的第一强度分布和所述第二强度值的第二强度分布,确定所述第一强度分布与第二强度分布之间的标度变换函数,并使用所述标度变换函数对所述第一和/或第二强度值进行标度调整。

应该理解,本文中公开的与方法相关的实施方式,也与包含适用于执行相应的方法步骤的手段的系统相关。因此,针对所述方法给出的定义、解释、效果和实例也描述了相应的系统。

本发明的另一方面涉及一种计算机程序产品,其包含一种或多种计算机可读介质,所述计算机可读介质具有用于执行在本发明的上下文中描述的方法的步骤的计算机可执行指令。

现在将参考附图描述一些示例性实施方式。出于解释的目的阐述了各种不同的特定细节,其不背离要求保护的本发明的范围。

附图简述

图1示出了本发明的示例性实施方式的方法。

图2示出了本发明的示例性实施方式的系统。

图3示出了不同通道的理想信号。

图4示出了不同通道之间的串扰效应。

图5示出了两个不同通道之间强度值的相互依赖性。

图6示出了按照本发明的实施方式在不同循环中获取的图像。

图7示出了本发明的实施方式的噪音偏移效应和它们的校正。

图8示出了本发明的实施方式的通道标度变换效应和它们的校正。

示例性实施方式的详细描述

图1示出了本发明的示例性实施方式的方法。所述方法适用于补偿多个数字图像中的强度偏倚以及特别是串扰效应。所述多个数字图像中的每个数字图像含有多个对象,其中所述多个对象中的每一个被配置成接收包含遗传信息的至少一个分子。所述至少一个分子被配置成接收至少第一荧光化合物和第二荧光化合物中的一者。所述多个数字图像中的第一数字图像在所述第一荧光化合物的电磁辐射发射期间通过光学成像系统获取,并且所述多个数字图像中的第二数字图像在所述第二荧光化合物的电磁辐射发射期间通过所述光学成像系统获取。所述方法包括优选地采取下述顺序的下述步骤:

s1:从所述第一数字图像为每个对象确定第一强度值;

s2:从所述第二数字图像为每个对象确定第二强度值,所述第一和第二强度值定义了数据点,每个数据点包含第一强度值和第二强度值;

s3:指定所述数据点的子集;

s4:在仅仅所述数据点的子集的基础上确定相应的第一与第二强度值之间的关系;以及

s5:在所述第一强度值、第二强度值和所述第一强度值与第二强度值之间的关系的基础上确定补偿过的第一强度值。

根据本发明的示例性实施方式,所述方法还可以包括下述步骤:

s6:在所述第一和第二强度值的基础上确定噪音偏移;和

s7:从所述第一和第二强度值中减去所确定的噪音偏移。

根据本发明的示例性实施方式,所述方法还可以包括下述步骤:

s8:确定所述第一强度值的第一强度分布和所述第二强度值的第二强度分布;

s9:确定所述第一强度分布与第二强度分布之间的标度变换函数;

s10:使用所述标度变换函数对所述第一和/或第二强度值进行标度调整。

根据本发明的示例性实施方式,通过在所述第一和第二数字图像中选择感兴趣的区域来指定所述数据点的子集(步骤s3)。然而,所述子集也可以可替选地或附加性地通过选择所述多个循环中的一个或多个循环来指定,如针对图6更详细描述的。

根据本发明的示例性实施方式,所述第一与第二强度值之间的关系和所述噪音偏移以串扰矩阵的形式表达,即在所述第一与第二强度值之间的关系的基础上确定所述串扰矩阵。如前所述,(n+1xn+1)串扰矩阵a,其中n等于通道的数目,可以书写为:

长度为n的发射强度值的矢量(e)可以通过用串扰矩阵a乘以长度为n+1的所确定的强度值的矢量(d)(dn+1=1)来获得:

d=e*a

因此,所述发射强度值(即补偿过的强度值)可以利用反转矩阵a-1来确定:

e=d*a-1

根据本发明的另一个示例性实施方式,所述方法进一步适用于在所述第一和第二强度值以及所述第一与第二强度值之间的关系的基础上确定补偿过的第一和第二强度值。

此外,在所述方法中,可以只选择已接收具有遗传信息的分子的对象,即所述数据点的子集可以只包含已接收这种分子的对象的强度值。

图2示出了本发明的系统。所述系统包含强度确定单元201、子集确定单元202和串扰补偿单元203。

根据示例性实施方式,所述系统还可以包含噪音偏移补偿单元204。根据另一个示例性实施方式,所述系统还可以包含强度标度变换补偿单元205。所有这些单元被配置成用于执行本发明的一个或多个步骤。尽管使用独立的单元201、202、203、204、205描述本发明,但显然所述独立的单元也可以是单一单元的一部分,只要本发明的步骤得以执行即可。

强度确定单元201被配置成用于从所述第一数字图像为每个对象确定第一强度值并从所述第二数字图像为每个对象确定第二强度值。因此,对于每个对象来说,可以确定第一和第二强度值。然而,可能可以不为某些对象确定第一和/或第二强度值,例如因为丢失了一个对象。

子集确定单元202接收所确定的第一和第二强度值。可以理解,所述第一和第二强度值成对出现,并且每对第一和第二强度值定义了数据点。此外,子集确定单元202被配置成用于指定所述数据点的子集。这可以如本发明的上下文中所描述的来进行。

串扰补偿单元203接收所述强度值的子集。在所述子集的基础上,串扰补偿单元203确定所述第一与第二强度值之间的关系。这可以例如如本发明的上下文中所描述的来进行。此外,串扰补偿单元203被配置成用于在所述第一强度值、第二强度值和所述第一强度值与第二强度值之间的关系的基础上确定补偿过的第一强度值。

根据本发明的示例性实施方式,串扰补偿单元203还接收所确定的第一和第二强度值,并在所述第一强度值、第二强度值和所述第一与第二强度值之间的关系的基础上确定补偿过的第一强度值。

噪音偏移补偿单元204接收所述强度值的子集。所述强度值可以从强度确定单元201或串扰补偿单元203接收。所述子集可以是与所述串扰补偿单元接收的子集相同或不同的子集。所述噪音偏移补偿单元被配置成用于确定所述通道特异性噪音偏移值并补偿这种偏移。

通道标度变换补偿单元205接收强度值的子集。所述强度值可以从强度确定单元201、串扰补偿单元203或噪音偏移补偿单元204接收。所述通道标度变换补偿单元被配置成用于确定所述通道特异性强度值的分布并补偿不同的分布。

强度确定单元201、子集确定单元202、串扰补偿单元203、噪音偏移补偿单元204和通道标度变换补偿单元205的功能,在本发明的示例性实施方式中的方法步骤方面进一步描述。对于本领域技术人员来说,显然下面的方法步骤的描述带来了强度确定单元201、子集确定单元202、串扰补偿单元203、噪音偏移补偿单元204和通道标度变换补偿单元205或其他单元的相应功能。

图3示出了从四个循环为一个珠子确定的信号强度。每个所述循环包含4个图像,其中图3示出了相应通道g、c、a、t,即该特定循环需要的碱基的信号强度。也就是说,在理想情况下每个通道将提供关于每个通道的单一信号。然而,由于不同的寄生效应如自荧光效应和不同通道之间的串扰效应,所述不同通道的信号极可能不同于所述理想情况。

图4示出了示例性的串扰效应。与图3所示的理想情况相比,由于荧光光谱的交叠,不仅主信号具有不同于零的值,而且其他通道也显示出非零值。也就是说,由于染料(荧光化合物)发射频率的交叠,可以观察到成对颜色通道之间的相互依赖性(串扰)。因此,珠子的强度固有地偏倚。不同通道之间的这种串扰使用在本发明的上下文中描述的方法和系统来补偿。

图5也示出了示例性的串扰效应。在图5的图中,将所述第一强度值针对所述第二强度值作图。在这个实例中,所述第一强度值对应于黄色通道的强度,所述第二强度值对应于绿色通道的强度。图中的每个点500对应于数据点,即一对第一和第二强度值。所述第一与第二强度值之间的关系用虚线501示例性地示出。根据示例性实施方式,这种关系使用多项式拟合方法或ransac算法来确定。为此目的,可以将所述数据点分组成多个组,其中每个组用一个数据点代表。即所述数据点可以被分组成箱子502。然后将这些箱子用于确定所述第一与第二强度值之间的关系。根据本发明的示例性实施方式,箱子502是具有固定边界的箱子或具有固定数目的数据点的箱子。

图6示出了在所述方法的多个循环10-50中获取的图像11-14、21-24、31-34、41-44、51-54。这个图示不应被解释为限制在相应的循环中获取的图像的量或所述循环的量。正如可以在图6中看到的,在这个实例中,在每个循环10-50中有四个图像11-14、21-24、31-34、41-44、51-54被获得,即获取、捕获等。具体来说,在一个循环10-50中,所述四个图像11-14、21-24、31-34、41-44、51-54中的每一者对应于所述光学成像系统的一个通道,即红色、绿色、黄色和蓝色。例如,每个第一图像可以使用第一滤色器获取,每个第二图像使用第二滤色器获取,每个第三图像使用第三滤色器获取,并且每个第四图像使用第四滤色器获取。不同的颜色由附连到所述对象(珠子)的dna链所接收的不同分子携带的荧光化合物发射。更具体来说,每种不同的荧光化合物代表了特定dna碱基即胸腺嘧啶(t)、腺嘌呤(a)、胞嘧啶(c)和鸟嘌呤(g)之一。例如,所述荧光化合物如下所述与dna碱基相关联:t=绿色;a=黄色;c=蓝色;g=红色。

在每个循环10-50中,第一图像11、21、31、41、51对应于四个通道t、a、c、g之一,例如g。第二图像12、22、32、42、52则对应于剩余的三个通道t、a、c之一,例如c。第三图像13、23、33、43、53则对应于剩余的两个通道t、a之一,例如a。第四图像14、24、34、44、54则对应于剩余的第四个通道,例如t。

根据本发明的示例性实施方式,可以指定所述子集,其中只选择给定的循环数目例如循环10-30的第一和第二强度值。

图7示出了本发明的示例性实施方式的噪音偏移效应和它们的校正。图700示出了检测到的强度701的分布以及所述检测到的强度的贡献者(噪音:702,信号:703)。对于多个测量的对象,将分布可视化为计数对强度的图,其中x-轴指示强度,y-轴指示给定强度下的对象数目。所述噪音偏移校正方法在输入强度分布(图700)中鉴定到所述噪音信号的第一众值并校正所述检测到的强度,使得该众值与指定值对齐(图704)。对于这种可视化来说,将所述指定的值设定到0。对每个通道单个地进行噪音偏移校正允许为所有通道指定共同的噪音偏移。所述噪音信号的第一众值可以通过数据驱动方法或通过噪音的概率建模或通过另一种方法来检测。

图8示出了本发明的示例性实施方式的通道标度变换效应和它们的校正。图800示出了为两个通道检测到的强度的贡献(通道1:801,通道2:802)。对于多个测量对象,将分布可视化为计数相对于强度的图,其中x-轴指示强度,y-轴指示在给定强度下的对象数目。正如在左图800中所示,不同的通道可能具有不同的信号强度分布。所述通道标度变换校正表征了所述通道特异性强度分布并校正它们,使得所有通道强度分布折叠成共同的分布(右图803)。所述强度分布表征可以通过概率模型或通过另一种方法来进行。如果所述校正可以通过线性变换来进行,则所述通道标度变换校正可以通过本文中描述的串扰矩阵的对角线分量来进行。非线性变换可以通过另一种方法来校正。

上述示例性实施方式的方法步骤和系统按照与dna/rna测序相关联进行描述。然而,正如对于本领域技术人员显而易见的,本发明不限于这个技术领域。显然,本发明的解决方案可以应用于大量其他技术领域,其中分析包含不同类型对象的荧光图像。也就是说,所述对象不必是珠子,而是可以是任何类型的发射荧光的对象。

由于本发明可以以几种形式体现而不背离其范围和本质特征,因此应该理解,除非另有规定,否则上面描述的实施方式不受上述描述的任何细节限制,而是应该在随附的权利要求书中所定义的范围之内广泛地解释,并且因此落于本发明之内的所有改变和修改旨在被随附的权利要求书涵盖。

此外,在权利要求书中,短语“包含”不排除其他要素或步骤,并且没有具体数目的指称包括复数形式。单一单元可以完成权利要求书中叙述的几个特征的功能。术语“基本上”、“约”、“大约”等与属性或特别是值相结合时也分别定义了所述精确的属性或精确的值。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1