一种流式细胞分析仪及其多维数据分类方法、装置与流程

文档序号:12703667阅读:292来源:国知局
一种流式细胞分析仪及其多维数据分类方法、装置与流程
本申请涉及细胞分析领域,具体涉及一种流式细胞分析仪及其多维数据自动分类方法、装置。

背景技术:
流式细胞分析仪通过接收激光照射后液流内细胞的各种光信号对细胞进行分类分析和识别,流式光信号通常包括前散射光(FSC)、侧散射光(SSC)、各种荧光(FL1、FL2、......),这些信号构成了流式数据的不同参数,或者称为通道,或者称为维度。这些光信号可反映细胞或者微球的物理化学特征,如大小,颗粒度和标记的荧光素情况等。流式细胞分析仪收集各通道的光信号,利用设门技术分析细胞,设门需要在某些维度中指定某一范围的目标细胞群,对其进行分析。手动设门是根据人的主观判断,不同的人做出的结果具有一定的差异,难以达到结果的一致性。计算机技术为流式细胞术的数据分析提供了便利,对于许多临床上的流式检测项目,商业厂商提供了自动设门的功能,该功能的重要优势在于不仅可以降低人的工作量,而且可以减少人工手动设门的主观判断过程引起的误差,提高分析结果的一致性。自动设门的另一个优势是可以同时分析多个参数,从而获得更多信息,有效提升设门的准确性。但无论是自动设门还是手动设门来说,一个共同的难点是:对于细胞群分布相互重叠或不易确定目的细胞群的情况,难以得到准确的判断。例如,在划分一定范围的细胞群时,如果在划分的细胞群内存在大量干扰细胞,或者干扰细胞距离目标细胞群较近,都会干扰到设门。另一方面,由于电压或补偿等仪器设置的改变,或者试剂中抗体浓度发生变化,或者由于血液样本的异常,或者由于样本制备操作中的失误,散点图中各群细胞的位置都可能偏离预期位置。

技术实现要素:
依据本申请的第一方面,本申请提供一种流式多维数据自动分类方法,包括:获取用于表征细胞粒子的粒子特征数据,所述粒子特征数据为通过流式细胞分析仪的多个通道收集的数据集合;根据检测项目确定至少一个辅助参数,所述每个辅助参数为粒子特征数据中的一维;对粒子特征数据基于辅助参数进行统计;从辅助参数的统计结果中提取感兴趣细胞群;对粒子特征数据基于主参数进行统计,所述主参数为最终通过设门的方式在基于该参数的统计结果中圈出目标细胞群的参数,其为粒子特征数据中不同于辅助参数的维度;将提取的感兴趣细胞群映射到主参数的统计结果中;利用感兴趣细胞群的分布位置和边缘,并结合主参数设门,求出目标细胞群。依据本申请的第二方面,本申请提供一种流式多维数据自动分类装置,包括:数据获取单元,用于获取用于表征细胞粒子的粒子特征数据,所述粒子特征数据为通过流式细胞分析仪的多个通道收集的数据集合;辅助参数确定单元,用于根据检测项目确定至少一个辅助参数,所述每个辅助参数为粒子特征数据中的一维;辅助参数统计单元,用于对粒子特征数据基于辅助参数进行统计;第一提取单元,用于从辅助参数的统计结果中提取感兴趣细胞群;主参数统计单元,用于对粒子特征数据基于主参数进行统计,所述主参数为最终通过设门的方式在基于该参数的统计结果中圈出目标细胞群的参数,其为粒子特征数据中不同于辅助参数的维度;映射单元,用于将提取的感兴趣细胞群映射到主参数的统计结果中;第二提取单元,用于利用感兴趣细胞群的分布位置和边缘,并结合主参数设门,求出目标细胞群。依据本申请的第三方面,本申请提供一种流式细胞分析仪,包括:光学检测设备,用于对被测样本进行光照射,收集粒子因光照射所产生的光信息,并输出与粒子光信息对应的粒子特征数据;数据处理装置,用于接收粒子特征数据,对粒子特征数据进行处理,所述处理设备包括上述的流式多维数据自动分类装置。附图说明图1是流式细胞分析仪的原理示意图;图2是对粒子的特征数据进行处理的一种流程图;图3是提取感兴趣细胞群的流程图;图4是利用感兴趣细胞群的分布位置和边缘求出目标细胞群的流程图;图5是一种流式多维数据自动分类装置的结构示意图;图6a-图6k是一种多维数据分类方法的各处理结果图;图7是一种提取感兴趣细胞群的处理结果图;图8是一种提取感兴趣细胞群的处理结果图;图9a是一种提取感兴趣细胞群的处理结果图;图9b是一种基于多维数据自动分类方法的设门的处理结果图。具体实施方式本申请实施例提供了一种流式细胞分析仪,请参考图1,为流式细胞分析仪的原理示意图,流式细胞分析仪包括光学检测设备20、输送设备30和数据处理装置40。输送设备30用于将样本液输送到光学检测设备20中。输送设备30通常包括输送管路和控制阀,样本液通过输送管路和控制阀输送到光学检测设备20中。光学检测设备20用于对流经其检测区域的样本液进行光照射,通过多个通道收集细胞(细胞是非常小的颗粒,因此细胞也称为粒子)因光照射所产生的各种光信息(例如散射光信息和/或荧光信息),并转换成对应的电信号,这些信息与粒子的特征对应,成为粒子特征数据,即每个细胞粒子由多个维度的参数组成的集合表征,该数据的集合可表示成一个数组,例如粒子A由数组A(A1,A2,...,Ai)表征。具体地,光学检测设备20可包括光源1025、作为检测区域的流动室1022、设置在光轴上和/或光轴侧边的光收集装置1023和光电感应器1024。样本液在鞘液的裹挟下通过提供检测区域的流动室1022,光源1025发射的光束照射到检测区域1021,样本液中的各细胞粒子经光束照射后发出散射光(或者散射光和荧光),光收集装置1023对散射光(或者散射光和荧光)进行收集整形,经收集整形后的光照射到光电感应器1024,光电感应器1024将光信号转换成对应的电信号输出。数据处理装置40用于对接收的粒子的特征数据进行分析处理。请参考图2,图2为对粒子的特征数据进行处理的一种流程图,包括以下步骤:步骤101、获取粒子特征数据。其中,粒子特征数据用于表征细胞粒子。粒子特征数据为通过流式细胞分析仪的多个通道收集的数据集合。步骤102、确定辅助参数。辅助参数是相对主参数定义的,主参数是指最终用设门的方法圈出目标细胞群的参数,主参数通常根据检测项目确定,即对粒子特征数据基于选择的参数进行统计,例如生成直方图或散点图,在统计结果中通过设门的方法确定出目标细胞群,该参数成为该目标细胞群的主参数。辅助参数是指能够帮助主参数定位目标细胞群或者区分干扰细胞群的参数。辅助参数可根据该检测项目所采用的抗体和经验选择,例如,可预先确定检测项目与辅助参数的对照表,一个优选的实施例中,在确定辅助参数时,可以根据检测项目,通过查表获得。为突出辅助参数的作用,选择目标细胞或干扰细胞有特异性表达的参数作为辅助参数,例如目标细胞或干扰细胞在该参数项的参数值与其它细胞在该参数项的参数值有明显区别或具有明显的特点。每个主参数是粒子特征数据中的一维,每个辅助参数是粒子特征数据中不同于主参数的一维。辅助参数可以是一个,也可以是多个,具体可以根据检测项目确定辅助参数。步骤103、对粒子特征数据基于辅助参数进行统计。一个实施例中,对粒子特征数据基于辅助参数进行统计可以基于单个辅助参数进行统计,例如,辅助参数为A1,A2,...,Ai中第n维数据,则对所有细胞粒子第n维数据A(An)进行统计,形成一维的统计图,例如直方图。在另一个实施例中,对粒子特征数据基于辅助参数进行统计可以基于辅助参数和其它参数的联合进行统计,或者,基于多个辅助参数的联合进行统计。例如对第n维数据和联合使用的第1维数据进行统计,则所有细胞粒子第1维和第n维数据A(A1,An)进行统计,形成二维的统计图,例如散点图。步骤104、从辅助参数的统计结果中提取感兴趣细胞群。其中,可以根据检测项目和目标细胞群或干扰细胞群在该辅助参数上的特异性从辅助参数的统计结果中提取感兴趣细胞群。感兴趣细胞群用于辅助定位目标细胞群的位置和边缘,感兴趣细胞群可以是最终的目标细胞群或其一部分,也可以是干扰细胞。由于在选择辅助参数时已经考虑到感兴趣细胞群在辅助参数上的特异性,因此可以先在辅助参数的统计结果中划分出细胞群落,然后根据检测项目和感兴趣细胞群在辅助参数上的分布特点将符合该特异性的细胞群确定为感兴趣细胞群,例如,将辅助参数值最大、最小或处于设定范围内的细胞群落确定为感兴趣细胞群。一个优选的实施例中,提取感兴趣细胞群的流程如图3所示,包括以下步骤:步骤1041,对粒子特征数据基于辅助参数的统计图进行阈值处理,阈值处理的作用是去除图像中灰度值小于阈值的点,以便去除干扰,还可通过阈值处理后将图像变为二值图,以方便后续处理。步骤1042,对阈值处理后的图像进行联通区域标记,将标记为一个联通区域的细胞作为一个细胞群落。步骤1043,求出各联通区域的中心,将该联通区域的中心处的辅助参数值作为该细胞群落的辅助参数值。步骤1044,确定感兴趣细胞群。根据感兴趣细胞群在辅助参数上的分布特点和各细胞群落的辅助参数值,将符合特异性表达的细胞群落确定为感兴趣细胞群。步骤105、对粒子特征数据基于主参数进行统计。同样,在对所有细胞粒子基于主参数进行统计时,可以基于单个主参数进行统计,形成直方图,也可以基于主参数和其它参数的联合进行统计,形成二维或更多维的散点图。步骤106、将感兴趣细胞群映射到主参数的统计结果中。在主参数的统计结果中,将属于感兴趣细胞群的细胞粒子标记出来。当有多个感兴趣细胞群时,将每个感兴趣细胞群一一映射到主参数的统计结果中。步骤107、求目标细胞群。利用感兴趣细胞群的分布位置和边缘,并结合主参数设门,求出目标细胞群。可采用分水岭算法、聚类算法、等高线法和/或梯度法找到目标细胞群和其它细胞的边界,从而通过设门的方法得到目标细胞群。一个优选的实施例中,如图4所示,主参数的统计结果为散点图,感兴趣细胞群属于目标细胞群中的一部分,利用感兴趣细胞群的分布位置和边缘求出目标细胞群包括以下步骤:1071、将感兴趣细胞群的分布区域作为前景。1072、将前景外围设定区域以外的区域作为背景。1073、对前景和背景进行区域分割,找到前景和背景之间的边界,将边界以内的部分作为目标细胞群分布区域。其中,对前景和背景进行区域分割的方法包括分水岭算法、activecontour算法或randomwalk算法。一个优选的实施例中,在找到前景和背景之间的边界后还可以包括:对边界进行多边形近似处理,得到多边形门,将门内的细胞作为目标细胞群。本实施例中,上述步骤105也可以先于辅助参数进行统计或与辅助参数同步进行。本申请实施例中,选定每个检测项目的目标细胞群的辅助参数和主参数,分别将细胞的粒子特征数据基于辅助参数和主参数进行统计,从辅助参数的统计结果中得到感兴趣细胞群,然后将感兴趣细胞群映射到基于主参数的统计结果中,最后利用感兴趣细胞群的分布位置和边缘,结合主参数设门,得到目标细胞群。根据选择的辅助参数和感兴趣细胞群,一种情况是:感兴趣细胞群属于目标细胞群中的一部分,感兴趣细胞群在主参数统计结果中的分布情况对目标细胞群的定位和边缘确定具有参考价值,如上述实施例,可根据感兴趣细胞群的分布位置和边缘确定目标细胞群的分布位置和边缘。另一种情况是:感兴趣细胞群是对目标细胞群造成干扰的细胞,这种情况下,当在主参数统计结果中利用设门的方式求出候选目标细胞群后,根据感兴趣细胞群在主参数统计结果中的分布情况,从候选目标细胞群中剔除感兴趣细胞群即可得到目标细胞群。本申请实施例一方面利用多维参数进行细胞分析,充分发挥了计算机在多参数分析上的优势。另一方面,本申请实施例充分注意到了检测项目中各参数的实际临床意义,利用各参数对应的荧光标记添加的目的和功能,突破细胞从大群(例如淋巴细胞)到亚群(例如淋巴亚群)的分析方式,而采用先识别出大群中的亚群或干扰细胞,再由亚群或干扰细胞来辅助确定大群的分析方式,从而采用反向设门的思路辅助确定出目标细胞群的位置和分布边缘,更准确确定出目标细胞群的位置,并将干扰细胞与目标细胞群区分开来,提高细胞分类的准确性,尤其对细胞群分布相互重叠或不易确定目的细胞群的情况下效果更明显。基于上述方法,数据处理装置40包括一种流式多维数据自动分类装置,如图5所示,该装置可以包括:数据获取单元420、辅助参数确定单元421、辅助参数统计单元422、第一提取单元423、主参数统计单元424、映射单元425和第二提取单元426。数据获取单元420用于获取用于表征细胞粒子的粒子特征数据,所述粒子特征数据为通过流式细胞分析仪的多个通道收集的数据集合。辅助参数确定单元421用于根据检测项目确定至少一个辅助参数,所述每个辅助参数为粒子特征数据中的一维。辅助参数统计单元422用于对粒子特征数据基于辅助参数进行统计。第一提取单元423用于从辅助参数的统计结果中提取感兴趣细胞群。主参数统计单元424用于对粒子特征数据基于主参数进行统计,所述主参数为最终通过设门的方式在基于该参数的统计结果中圈出目标细胞群的参数,其为粒子特征数据中不同于辅助参数的一维。映射单元425用于将提取的感兴趣细胞群映射到主参数的统计结果中。第二提取单元426用于利用感兴趣细胞群的分布位置和边缘,并结合主参数设门,求出目标细胞群。对粒子特征数据基于辅助参数进行统计包括以下任一种:基于单个辅助参数进行统计。基于辅助参数和其它参数的联合进行统计。基于多个辅助参数的联合进行统计。一个优选的实施例中,辅助参数确定单元421在确定辅助参数时根据检测项目通过查表获得。一个优选的实施例中,第一提取单元423根据检测项目和目标细胞群或干扰细胞群在该辅助参数上的特点从辅助参数的统计结果中提取感兴趣细胞群。一个优选的实施例中,第一提取单元423包括:细胞群落划分子单元4230和感兴趣细胞群确定子单元4231。细胞群落划分子单元4230用于在辅助参数的统计结果中划分细胞群落。一个优选的实施例中,细胞群落划分子单元4230用于对粒子特征数据基于辅助参数的统计图进行阈值处理,对阈值处理后的图像进行联通区域标记,将标记为一个联通区域的细胞作为一个细胞群落。细胞群落划分子单元4230还用于求出各联通区域的中心,将该联通区域的中心处的辅助参数值作为该细胞群落的辅助参数值。感兴趣细胞群确定子单元4231用于将辅助参数值最大、最小或处于设定范围内的细胞群落确定为感兴趣细胞群。一个优选的实施例中,感兴趣细胞群属于目标细胞群中的一部分,主参数的统计结果为散点图,第二提取单元426在利用感兴趣细胞群的分布位置和边缘求出目标细胞群时将感兴趣细胞群的分布区域作为前景,将散点图中距前景中设定区域的以外的区域作为背景,对前景和背景进行区域分割,找到前景和背景之间的边界,将边界以内的部分作为目标细胞群分别区域。在进一步优选的实施例中,第二提取单元426在找到前景和背景之间的边界后还对边界进行多边形近似处理,得到多边形门,将门内的细胞作为目标细胞群。下面以外周血淋巴细胞亚群检测项目中通过设门圈出淋巴细胞为例进一步说明。淋巴细胞亚群是检测机体免疫功能的重要指标,临床主要用于免疫系统疾病及免疫相关疾病的诊断和临床治疗。用于淋巴细胞亚群检测的常见单标抗体包括CD45、CD3、CD4、CD8、CD19、CD16、CD56,因此淋巴细胞亚群检测项目中,检测的数据通常包括前散射光、侧散射光和CD45、CD3、CD4、CD8、CD19、CD16、CD56多个荧光通道的数据。CD45表达于所有白细胞;CD3表达于T淋巴细胞;CD4表达于T辅助/诱导淋巴细胞(CD4+T细胞)和单核细胞;CD8表达于细胞毒T细胞(CD8+T细胞)和NK细胞;CD19表达于B淋巴细胞;CD16表达于NK细胞、单核巨噬细胞、粒细胞和树突状细胞等;CD56表达于NK细胞和细胞毒T细胞。通常采用CD45作为设门抗体,先识别出淋巴细胞,然后在淋巴细胞的基础上,利用CD3、CD4、CD8、CD19、CD16、CD56在各淋巴亚群的特异性表达,对淋巴细胞进行分类。淋巴细胞检测的设门主参数为SSC、CD45,图6a为SSC/CD45散点图,多边形为设门,多边形圈出的部分为淋巴细胞。但当异常的淋巴、幼稚细胞、有核红细胞、嗜碱粒细胞以及单核细胞大量存在或者距离淋巴细胞群较近时,都可能干扰到淋巴设门,或者由于电压、补偿等仪器设置的改变,或者试剂中抗体浓度发生变化,或者由于血液样本的异常,或者由于样本制备操作中的失误,散点图中各群细胞的位置可能偏离预期位置。此时仅依靠设门主参数SSC、CD45确定的淋巴细胞可能不准确,从而使得在此淋巴细胞基础上进行的淋巴细胞亚群分析结果也不准确。在这种情况下,本申请注意到CD3、CD4、CD8、CD19、CD16、CD56等抗体对识别淋巴细胞的参考意义,但它们不是特异性标记淋巴细胞的,所以不能够直接利用这些抗体对淋巴进行聚类分析。因此,本申请实施例中根据被标记细胞的荧光参数的特点,在其他更易识别的荧光参数下截取细胞群,然后根据截取的细胞群,在设门目标散点图上找到该细胞群,做进一步分析。具体包括以下步骤:S1、确定辅助参数。辅助设门参数可以较好地分离目标细胞群和干扰细胞群。本例中CD3和CD19具有这种特征,它们在各自的荧光中都是强阳性,和相邻细胞分离较远,所以可选CD3和CD19为辅助参数。CD3表达于T淋巴细胞,CD19表达于B淋巴细胞。S2、对粒子特征数据基于辅助参数进行统计并提取感兴趣细胞群。图6b和图6c是基于辅助参数和其它参数联合进行统计的统计结果图。图6b为CD3联合SSC的统计结果图,图6c是CD19联合SSC的统计结果图。如图6b所示,图中标注为R1的区域是T淋巴细胞亚群,即为感兴趣细胞群。如图6c所示,图中标注为R2的区域是B淋巴细胞亚群即为感兴趣细胞群。图6b的SSC/CD3散点图中自动提取R1的方法如下:1)平滑SSC/CD3散点图,平滑方法可以是高斯平滑,均值滤波,中值滤波等线性或者非线性的平滑滤波器。2)对散点图进行阈值处理,得到图6d。阈值处理的作用是去除图像中灰度值小于阈值的点。设原图为I(x,y),(x,y)表示像素点的坐标,处理后的图像为Ithresh(x,y),其中,3)对阈值处理后的图像进行联通区域标记。对图6d进行联通区域标记,求出个联通区域的中心,如图6e中“*”所标位置。本例使用的是blob分析的方法,提取联通区域的中心,相当于提取位置信息,类似的还可以利用各联通区域的大小、形状、方向、数量等信息进行检测。4)比较各联通区域的中心位置,选取中心在CD3方向最大的一个区域,如图6f中区域R1,即所提取的第一个感兴趣细胞群R1。5)对于处理SSC/CD19也使用同样的方法,即可得到第二个感兴趣辅助细胞群,即图6c中的R2标出的区域。6)对粒子特征数据基于主参数进行统计并将感兴趣细胞群映射到基于主参数进行统计的统计结果中。本例中检测外周血淋巴细胞亚群,利用SSC和CD45作为主参数。将提取的感兴趣细胞群R1和R2分别映射到基于主参数SSC和CD45统计的统计结果图中,如图6g和图6h所示。本例中感兴趣细胞群只是淋巴细胞中的一部分,但是将感兴趣细胞群映射到SSC/CD45散点图中,可以指示淋巴细胞的分布位置和边缘。7)利用辅助细胞群,结合主设门参数,求出目标细胞群。本例中使用分水岭算法,在SSC/CD45散点图中,感兴趣细胞群是一个已经确定的区域,将这些感兴趣细胞群的分布区域内部标记为前景,如图6i。将图6i中距内部标记的区域的外接矩形距离大于r位置的标记为背景,其中r为预设的值,本领域技术人员可以理解,并不一定是外接矩形,还可以是其它形状的几何图形。如图6j中横线纹理区域,使用分水岭算法可以找到前景和背景之间的边界,将边界以内的部分作为目标细胞群分布区域,如图6j中曲线包围的区域R3,即为目标细胞群的区域。本例中使用分水岭算法对前景和背景进行区域分割,在另一种实施方式中,还可以使用activecontour算法或randomwalk算法对前景和背景进行区域分割。本例中,可以对6j的区域R3进行多边形近似处理,即可得到多边形门,即6k中的多边形门(图中圈出部分)。上述实施例详细说明了辅助参数与其他参数联合使用的情况,如上述实施例中使用了SSC;本领域技术人员应当理解,辅助参数也可以单独使用,如分别处理CD3和CD19的直方图,如图7所示,11为提取的感兴趣细胞群。也可以分别处理各辅助参数,上述实施例中分别处理了SSC/CD3、SSC/CD19散点图,或者联合处理辅助参数,如处理CD3/CD19散点图,如图8所示,图中R1、R2圈出的细胞群为提取的感兴趣细胞群。这种利用多维数据进行自动分类的实例包括淋巴亚群的2色、3色、4色、6色抗体组合方案的应用。在2色抗体组合方案进行淋巴亚群分析方案中,淋巴门是在FSC/SSC散点图上设的,FSC、SSC是设门主参数,淋巴细胞群和周围的其他细胞群位置靠近或者有重叠,为了使淋巴门更可靠,可以利用CD14和CD45作为辅助参数,辅助设门,淋巴细胞CD45呈强阳性,CD14呈阴性,如图9a所示,将散点图中左上部分的区域,即R1圈出的区域确定为感兴趣的辅助细胞群,将感兴趣的辅助细胞群映射到SSC/FSC散点图上,并进行标记,例如采用不同颜色进行标记,根据该标记的散点的分布,可以进一步在SSC/FSC自动设门,如图9b中的P1门。白血病免疫表型分析中,需要在CD45/SSC散点图上对有核细胞进行分类,此时,主设门参数是SSC、CD45,比如急性B淋巴细胞白血病患者的幼稚细胞经常出现在有核红细胞的位置,CD19、CD34、CD10可作为辅助设门参数,提取CD19、CD34、CD10三个参数均为阳性的细胞,映射到CD45/SSC散点图上,可用以确定幼稚细胞的位置,再使用相应的算法圈出幼稚细胞群。对于多发性骨髓瘤患者,正常骨髓标本中,需要在CD45/SSC散点图对浆细胞进行设门,浆细胞可能和有核红细胞或者幼稚细胞的位置比较近或者有重叠,可用CD38(或CD138)作为辅助参数,CD38(或CD138)强表达的细胞为浆细胞,将此类浆细胞映射到CD45/SSC散点图上,再使用相应的算法圈出浆细胞群,浆细胞群内包含表达CD38(或CD138)的浆细胞和不表达CD38(或CD138)的浆细胞。辅助参数不仅可以用于标出目标细胞,也可以用于排除干扰细胞。这种情况下在辅助参数的统计结果中提取出的感兴趣辅助细胞群必定不在目标细胞群中,通过其他的方法在主设门参数中找到目标细胞群,同样也将感兴趣辅助细胞群映射到主参数的统计结果中,可使用辅助细胞群验证找的对不对,然后做出处理,比如在目标细胞群中减去要排除的细胞,或者输出提示信息请用户审核结果。本领域技术人员可以理解,上述实施方式中各种方法的全部或部分步骤可以通过程序来指令相关硬件完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘或光盘等。以上应用了具体个例对本申请进行阐述,只是用于帮助理解本申请并不用以限制本申请。对于本领域的一般技术人员,依据本申请的思想,可以对上述具体实施方式进行变化。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1