信息处理设备、信息处理方法和程序与流程

文档序号:26008865发布日期:2021-07-23 21:28阅读:77来源:国知局
信息处理设备、信息处理方法和程序与流程

本公开涉及信息处理设备、信息处理方法和程序。



背景技术:

本公开涉及信息处理设备、信息处理方法和程序。

在诸如医学和生物化学的领域中,为了快速地测量大量细胞的特性,使用流式细胞仪正变得普遍。流式细胞仪是通过用光照射流过流动室的细胞并且检测从细胞发射的荧光、散射光等来光学地测量细胞的特性的设备。

最近,对于流式细胞仪,一次可以测量的荧光的数目正在增加。利用这种布置,由于测量数据的维度的增加导致组合爆炸发生,因此用流式细胞仪手动分析测量的数据变得困难。

因此,正在通过机器学习聚类分析流式细胞仪测量的多维数据,如el-addavidamir,etal,“visneenablesvisualizationofhighdimensionalsingle-celldataandrevealsphenotypicheterogeneityofleukemia”,naturebiotechnology,2013jun,31(6),545-552中公开。

然而,在每个维度中的噪声量相同的情况下,对于高维度的数据,聚类性能下降。为此,在对流式细胞仪的测量数据进行聚类的情况下,通常通过对测量数据进行荧光分离等来降低维度,并且对维度压缩的数据进行聚类。

现有技术文献

非专利文献

非专利文献1:el-addavidamir,etal,“visneenablesvisualizationofhighdimensionalsingle-celldataandrevealsphenotypicheterogeneityofleukemia”,naturebiotechnology,2013jun,31(6),545-552



技术实现要素:

然而,在对多维数据执行维度压缩的情况下,在测量数据中包括的信息的一部分由于维度压缩而丢失。为此,例如,在多维数据的聚类结果不适当的情况下,用户难以返回流式细胞仪的测量数据并且验证聚类结果的有效性。

因而,本公开提出了一种新型和改进的信息处理设备、信息处理方法和程序,其能够使用三维压缩的数据对测量数据进行聚类,同时还能够验证返回到测量数据的聚类结果。

据本公开的实施方式,提供了一种信息处理设备,包括:信息存储单元,将来自细胞的光的感测结果即第一数据和将第一数据分离成多个荧光的结果即第二数据彼此相关联地存储;聚类单元,基于第二数据将细胞聚类成多个簇;以及输出单元,输出来自聚类单元的聚类结果。输出单元附加地输出与包括在由用户从多个簇当中选择的簇中的细胞有关的第一数据和第二数据中的至少一者或多者。

此外,根据本公开的实施方式,提供了一种信息处理方法,包括:将来自细胞的光的感测结果即第一数据和将第一数据分离成多个荧光的结果即第二数据彼此相关联地存储;基于第二数据将细胞聚类成多个簇;以及输出来自聚类单元的聚类结果;以及附加地输出与包括在由用户从多个簇当中选择的簇中的细胞有关的第一数据和第二数据中的至少一者或多者。

此外,根据本发明的实施方式,提供一种使计算机作为作用如下的程序:信息存储单元,将来自细胞的光的感测结果即第一数据和将第一数据分离成多个荧光的结果即第二数据彼此相关联地存储;聚类单元,基于第二数据将细胞聚类成多个簇;以及输出单元,输出来自聚类单元的聚类结果。输出单元用于附加地输出与包括在由用户从多个簇当中选择的簇中的细胞的第一数据和第二数据中的至少一者或多者。

根据本发明的实施方式,测量数据和通过维度压缩测量数据获得的数据可以彼此相关联地存储。

根据如上所描述的本公开的实施方式,可以使用维度压缩的数据对测量数据进行聚类,同时还能够验证返回至测量数据的聚类结果。

注意,上述效果不必须是限制性的。利用或代替上述效果,可以实现本说明书中描述的任何一种效果或可以从本说明书中理解的其他效果。

附图说明

图1是示意性地示出根据本公开的一个实施方式的包括信息处理设备的系统的示例性配置的示意图。

图2是示出根据本实施方式的信息处理设备的示例性配置的框图。

图3a是说明测量设备的第一检测机构的说明图。

图3b是说明测量设备的第二检测机构的说明图。

图4a是说明校正每个波段的荧光溢出并且导出每种荧光物质的表达水平的方法的说明图。

图4b是说明校正每个波段的荧光溢出并且导出每种荧光物质的表达水平的方法的说明图。

图5a是说明从荧光光谱导出每种荧光物质的表达水平的方法的说明图。

图5b是说明从荧光光谱导出每种荧光物质的表达水平的方法的说明图。

图6是示出由信息存储单元存储的数据的一个示例的说明图。

图7a是示出指示由信息处理设备的聚类结果的图像显示的一个示例的说明图;

图7b是示出指示由信息处理设备的聚类结果的图像显示的一个示例的说明图;

图8a是示出指示第一数据(即,荧光相关信息)的图像显示的一个示例的说明图;

图8b是示出指示第二数据(即,与每种荧光物质的表达水平相关的信息)的图像显示的一个示例的说明图;

图9是示出根据实施方式的信息处理设备的操作的示例的流程图;

图10是示意性地示出根据第一实施方式的信息处理设备的示例性配置的框图。

图11是说明根据第一变形例的信息处理设备的操作的概况的说明图;

图12是示出根据第一变形例的信息处理设备的操作的示例的流程图;

图13是示出根据第一变形例的信息处理设备的操作的另一示例的流程图;

图14是示意性地示出根据第二实施方式的信息处理设备的示例性配置的框图。

图15是说明根据第二变形例的信息处理设备的操作的概况的说明图;

图16是示出根据第二变形例的信息处理设备的操作的示例的流程图;以及

图17是示出根据实施方式的信息处理设备的示例性硬件配置的框图。

具体实施方式

在下文中,将参考附图详细描述本公开的优选实施方式。注意,在本说明书和附图中,具有基本相同的功能和结构的结构元件用相同的标号表示,并且省略对这些结构元件的重复说明。

1.整体系统的示例性配置

2.信息处理设备的示例件配置

3.信息处理设备的操作的示例

4.变形例

4.1.第一变形例

4.2.第二变形例

5.示例性硬件配置

<1.整体系统的示例性配置>

首先,将参考图1描述包括根据本公开的一个实施方式的信息处理设备的系统100的配置。图1是示意性地示出包括根据本实施方式的信息处理设备的系统100的示例性配置的示意图。

如图1所示,根据本实施方式的系统100设置有测量设备10、信息处理设备20以及终端设备30和终端设备40。测量设备10、信息处理设备20以及终端设备30和终端设备40通过网络n可通信地互连。网络n例如可以是信息通信网络(诸如,移动通信网络、互联网、或局域网、或这些多种类型的网络的组合)。

测量设备10是能够检测来自作为测量目标的细胞等的每种颜色的荧光的测量设备。例如,测量设备10可以是流式细胞仪,该流式细胞仪使经荧光染色的细胞以高速流过流动室,并且通过用光线照射流动的细胞,来检测来自细胞的每种颜色的光的荧光。

信息处理设备20基于与由测量设备10测量的细胞的荧光相关的信息,对测量目标的每个细胞进行聚类。利用该配置,信息处理设备20能够将由测量设备10测量的每个细胞划分为多个组(即,聚类)。此外,信息处理设备20将由测量设备10测量的测量数据与通过执行维度压缩等而获得的聚类数据相关联地存储,以使测量数据适合于聚类。利用该配置,在判断分析结果的有效性时,信息处理设备20能够参考来自维度压缩之前的测量数据,同时还通过对测量数据执行维度压缩等来减少聚类所花费的时间和成本。例如,信息处理设备20可以是能够快速处理大量数据的服务器等。

终端设备30和终端设备40例如是输出来自信息处理设备20的聚类结果的显示设备等。例如,终端设备30和终端设备40中的每一个可以是设置有显示单元的计算机、膝上型计算机、智能电话、平板计算机等,该显示单元利用图像、文本等显示从信息处理设备20接收的分析结果。

在包括根据本实施方式的信息处理设备20的系统100中,首先,信息处理设备20经由网络n获取通过设置在医院、诊所或者实验室中的每一个的测量设备10测量的测量数据。之后,信息处理设备20将所获取的测量数据进行聚类,并且将聚类结果输出至终端设备30和终端设备40。由于聚类施加了沉重的信息处理负荷,因此通过在包括专用服务器等的信息处理设备20上集中地执行这样的处理,可以提高系统100整体的效率。此外,基于用户选择,信息处理设备20控制测量数据和通过处理测量数据获得的聚类数据的输出。利用该配置,信息处理设备20能够根据用户的需求适当地切换并输出信息。

注意,在上文中,测量设备10、信息处理设备20以及终端设备30和终端设备40被描述为通过网络n互连,但是根据本公开的技术不限于这样的示例。例如,也可以直接连接测量设备10、信息处理设备20以及终端设备30和终端设备40。

<2.信息处理设备的示例性配置>

接下来,将参考图2描述根据本实施方式的信息处理设备20的示例性配置。图2是示出根据本实施方式的信息处理设备20的示例性配置的框图。

如图2所示,信息处理设备20设置有输入单元201、荧光分离单元203、信息存储单元205、聚类单元207和输出单元209。此外,信息处理设备20的功能的一部分也可以设置在测量设备10中(例如,后述的荧光分离单元203的功能)。

输入单元201从测量设备10获取测量目标的细胞的测量结果。具体地,输入单元201从测量设备10获取与测量目标的细胞的荧光相关的信息。输入单元201设置有外部输入接口,该外部输入接口包括用于通过例如网络n从测量设备10获取信息的连接端口、通信设备等。

这里,由输入单元201获取的荧光相关信息的内容根据测量设备10中的荧光检测机构而不同。与图3a和图3b所示的测量设备10中的荧光检测机构一起描述荧光相关信息的具体内容。图3a是说明测量设备10的第一检测机构的说明图,而图3b是说明测量设备10的第二检测机构的说明图。

如图3a所示,在第一检测机构中,通过使用二向色镜15对通过用来自光源11的光线照射样本13而获得的荧光进行光谱分离,通过光电检测器17针对每个预定波段测量荧光的强度。

二向色镜15是反射特定波段的光、同时透射另一波段的光的镜。光电检测器17例如是光电倍增管、光电二极管等。在第一测量方法中,通过在来自样本13的荧光的光路上设置反射不同波段的光的二向色镜15,来自样本13的荧光可以光谱分离成每个波段。例如,在第一检测机构中,通过光从样品13入射的一侧以以下的顺序设置反射与红色相对应的波段的光的二向色镜15、反射与绿色相对应的波段的光的二向色镜15、以及反射与蓝色相对应的波段的光的二向色镜15中的每一个,来自样品13的荧光可以光谱分离成每个波段。

在测量设备10用这种第一检测机构检测荧光的情况下,由输入单元201获取的荧光相关信息变为与每个波段中的荧光的强度相关的信息。

此外,如图3b所示,在第二检测机构中,通过使用棱镜16对通过用来自光源11的光线照射样本13而获得的荧光进行光谱分离,由光电检测器阵列18测量连续的荧光光谱。

棱镜16是分散入射光的光学构件,并且光电检测器阵列18是多个光电检测器(光电倍增器或光电二极管)布置在阵列中的传感器。在第二检测机构中,通过利用棱镜16分散来自样本13的荧光并且用光电检测器阵列18检测所分散的光,来自样本13的荧光可以作为连续光谱被检测。

在测量设备10利用这种第二检测机构检测荧光的情况下,由输入单元201获取的荧光相关信息变为与荧光的光谱相关的信息。

荧光分离单元203分离包括在由测量设备10测量的荧光中的每个荧光,由此导出与每个荧光相对应的荧光物质的表达水平。测量目标的细胞由多种荧光物质标记,并且从每种荧光物质发射的荧光的波长分布彼此叠加。因此,通过校正从每种荧光物质发出的荧光的波长分布的叠加并且导出每个荧光中的净光量,荧光分离单元203能够导出每种荧光物质的表达水平和由每种荧光物质标记的生物分子等的表达水平。

更具体地,在由输入单元201获取的荧光相关信息是与每个波段的荧光的强度相关的信息的情况下,荧光分离单元203能够通过参考图4a和图4b说明的方法来导出每种荧光物质的表达水平。图4a和图4b是说明校正每个波段的荧光溢出并且导出每种荧光物质的表达水平的方法的说明图。

如图4a所示,在荧光相关信息是在每个波段中检测的荧光的强度的情况下,来自检测每个波段的光的光检测器fl1、光检测器fl2和光检测器fl3的信号与荧光物质染料1、荧光物质染料2和荧光物质染料3的荧光相对应。然而,由于来自荧光物质染料1、荧光物质染料2和荧光物质染料3的荧光具有波长分布,因此由光检测器fl1、光检测器fl2和光检测器fl3检测的信号还包括从其他荧光物质溢出的荧光。

因此,如图4b所示,首先,荧光分离部203获取表示来自荧光物质染料1、荧光物质染料2、荧光物质染料3的荧光有多少向光检测器fl1、光检测器fl2、光检测器fl3的每个波段溢出的溢出基质。接着,荧光分离单元203根据溢出基质,将由光检测器fl1、光检测器fl2、光检测器fl3检测出的信号分离成来自荧光物质染料1、荧光物质染料2、荧光物质染料3中的每一个的荧光。由此,荧光分离单元203能够从荧光物质染料1、荧光物质染料2、荧光物质染料3导出荧光的净量,从而能够导出荧光物质染料1、荧光物质染料2、荧光物质染料3的表达水平。

此外,在由输入单元201获取的荧光相关信息是与荧光的光谱关联的信息的情况下,荧光分离单元203能够通过参考图5a和图5b说明的方法导出每种荧光物质的表达水平。图5a和图5b是说明从荧光的光谱导出每种荧光物质的表达水平的方法的说明图。

如图5a所示,在荧光相关信息是荧光的光谱的情况下,由光检测器阵列中的多个光检测器通道1、2、3等检测的信号是来自荧光物质染料1、荧光物质染料2和荧光物质染料3中的每一种的荧光的叠加。

因此,如图5b所示,首先,荧光分离单元203获取荧光物质染料1、荧光物质染料2、荧光物质染料3中的每一种的参考光谱进行检测。参考光谱分别知识荧光物质染料1、荧光物质染料2、荧光物质染料3中的每一种的荧光的光谱。接着,通过估计所检测的荧光的光谱中的荧光物质染料1、荧光物质染料2、荧光物质染料3中的每一种的参考光谱的叠加,荧光分离单元203能够导出荧光物质染料1、荧光物质染料2、荧光物质染料3中的每一种的表达水平。

利用该布置,即使由输入单元201获取的荧光相关信息的内容为上述任一种,荧光分离单元203也能够导出与细胞所表现的每个荧光相对应的荧光物质的表达水平。

信息存储单元205将由输入单元201获取的荧光相关信息与由荧光分离单元203导出的每种荧光物质的表达水平相关联起来进行存储。具体地,信息存储单元205存储与通过测量设备10感测样本而获得的来自细胞的荧光相关的信息作为第一数据,并且存储与通过将来自细胞的荧光分离成多个荧光而获得的每种荧光物质的表达水平相关的信息作为第二数据。此时,信息存储单元205通过将第一数据和从第一数据导出的第二数据相关联地存储,来将该数据存储为合并数据。

例如,信息存储单元205能够以图6所示的格式存储合并了第一数据与第二数据的数据。图6是示出由信息存储单元205存储的数据的一个示例的说明图。

如图6所示,在由信息存储单元205存储的数据中,向每个细胞分配识别信息(即“细胞id”)。此外,针对每个细胞存储由每个光电检测器检测到的荧光强度“pmt1”到“pmtn”作为第一数据。此外,针对每个细胞存储每种荧光物质的表达水平“色素1”到“色素m”作为第二数据。

这里,第一数据是包括关于n个荧光强度“pmt1”到“pmtn”的信息的n维数据,并且第二数据是包括关于m个表达水平“色素1”到“色素m”的信息的m维数据。由于荧光分离单元203的荧光分离,第二数据的维度m小于第一数据的维度。

此时,由于聚类的效率和准确度随着维度变得更小而升高,所以在稍后描述的聚类单元207中,使用第二数据来聚类单元。然而,由于第二数据在荧光分离单元203进行的荧光分离中被维度压缩,因此可能存在发生信息丢失等的可能性。为此,通过将两种类型的数据彼此相关联地存储,信息存储单元205可以容易地验证或确认返回到测量设备10的测量数据的聚类,同时还提高了聚类的效率和准确度。

注意,在信息存储单元205中彼此相关联地存储的第一数据和第二数据不必是从输入单元201和荧光分离单元203输出的信息。例如,在测量设备10设置有荧光分离单元203的情况下,信息处理设备20可以从测量设备10获取与细胞的荧光相关的信息和与细胞中的每种荧光物质的表达水平相关的信息,并且信息存储单元205也可以将获取的信息相关联地存储为第一数据和第二数据。可替代地,信息处理设备20可以获取存储在外部存储设备中的与细胞的荧光相关的信息和与细胞中的每种荧光物质的表达水平相关的信息,并且信息存储单元205可以将获取的信息彼此相关联地存储为第一数据和第二数据。

聚类单元207基于由荧光分离单元203获得的细胞中的每种荧光物质的表达水平,将细胞聚类。换句话说,聚类单元207基于由信息存储单元205存储的第二数据对细胞进行聚类。由于指示细胞的每种荧光物质的表达水平的第二数据是多维数据,因此信息处理设备20能够使用基于机器学习的聚类技术以比手动更快地将细胞分成多个组(簇)。

由聚类单元207使用的聚类技术不受特别限制,并且可以是公开可用的聚类技术。例如,聚类单元207可以使用通常的聚类技术(诸如,沃德(ward)方法、组平均方法、单链路方法或k均值方法)来执行聚类,或者还可以使用自组织映射方法来执行聚类。

输出单元209将由聚类单元207聚类的结果输出至终端设备30和终端设备40等。例如,在终端设备30和终端设备40中,可以将输出聚类结果作为图像显示呈现给用户。

例如,可以通过图7a和图7b中示出的图像显示来显示由聚类单元207聚类的结果。图7a和图7b是示出指示信息处理设备20的聚类结果的图像显示的示例的说明图。

例如,如图7a所示,聚类单元207的聚类结果可以以在表格形式中的显示来显示。

在图7a所示的显示中,100个细胞的组被划分为10个簇,并且通过分配给每个簇和每个细胞的识别号来指示每个细胞所属的簇。具体地,在图7a所示的显示中,具有识别号“1”和识别号“2”的细胞属于具有识别号“1”的簇,具有识别号“3”到识别号“6”的细胞属于具有识别号“2”的簇,并且识别号“100”的细胞属于具有识别号“10”的簇。根据这种在表格形式中的显示,可以简单地指示每个细胞如何属于每个簇。

例如,如图7b所示,聚类单元207的聚类结果可以通过最小生成树显示来显示。

在图7b所示的显示中,通过多种颜色的底纹区分的雷达图以相互连接的树形布置。每个雷达图表示每个细胞。具体地,每个雷达图的分布和大小示出与细胞中每种荧光物质的表达水平相对应的向量。在本文中,由每种颜色的底纹不同的区域指示每个细胞所属的每个簇。例如,由相同颜色的底纹的雷达图(在图7b中,相同的阴影线)指示的细胞示出这些细胞属于相同的簇。

此外,在图7b所示的显示中,雷达图之间的显示上的距离与雷达图中所示的细胞之间的相似性相对应。换句话说,由彼此靠近的雷达图表示出的细胞彼此类似,而由彼此远离的雷达图表示出的细胞彼此不类似。根据这样的最小生成树显示,除了示出了每个细胞如何属于每个簇之外,还可以示出细胞当中的相似性关系。

此外,对于由用户选择的簇,输出单元209附加地向终端设备30和终端设备40等输出关于簇中包括的细胞的数据。具体地,输出单元209将第一数据和第二数据中的一个或两个附加地输出至终端设备30和终端设备40等,作为关于包括在由用户选择作为显示目标的簇中的细胞的数据。例如,可以由用户选择输出单元209将第一数据、第二数据或者第一数据和第二数据两者输出至终端设备30和终端设备40。

例如,作为图8a所示的图像显示,输出单元209可以将第一数据输出至终端设备30和终端设备40。图8a是示出指示第一数据即荧光相关信息的图像显示的示例的说明图。

如图8a所示,输出单元209可以叠加每个细胞的荧光光谱数据,并且向终端设备30和终端设备40输出表示为位图的图像显示。通过参考图8a所示的图像显示,用户能够容易地判断测量本身等中是否存在故障。

输出单元209还可以将第二数据输出至终端设备30和终端设备40,作为图8b中示出的图像显示。图8b是示出指示第二数据(即,与每种荧光物质的表达水平相关的信息)的图像显示的一个示例的说明图。

如图8b所示,输出单元209可以将细胞的荧光物质中的每一种之中的两种荧光物质的表达水平当作垂直轴线和水平轴线,并且向终端设备30和终端设备40输出表示为散点图的图像显示。通过参考图8b所示的图像显示,用户能够容易地判断聚类是否有效等。

根据具有上述配置的信息处理设备20,用户变得能够从聚类结果中参考返回到未经历荧光分离的测量数据等的信息,并且因此能够更容易地判断聚类的可靠性和测量结果的可靠性。结果,根据本实施方式的信息处理设备20能够改善关于聚类结果的信息的可追溯性。

<3.信息处理设备的操作的示例>

接下来,参考图9描述根据本实施方式的信息处理设备20的示例性配置。图9是示出根据本实施方式的信息处理设备20的操作的示例的流程图。

如图9所示,首先,输入单元201从测量设备10获取第一数据(s101)。具体地,第一数据是与测量目标的细胞的荧光相关的信息,并且例如可以是来自细胞的荧光的光谱数据。接着,荧光分离单元203通过对第一数据进行荧光分离,生成第二数据(s103)。

具体地,第二数据是与细胞中的荧光物质的表达水平相关的信息,荧光分离单元203能够通过从第一数据的光谱分离每个荧光来生成第二数据。

接着,信息存储单元205与根据第一数据生成的第二数据相关联地存储第一数据(s105)。接下来,聚类单元207基于第二数据对细胞进行聚类(s107)。具体地,聚类单元207基于细胞中的每种荧光物质的表达水平对细胞进行聚类。由聚类单元207进行的聚类的技术不受特别限制,并且可以使用公开可用的技术。

之后,输出单元209向终端设备30、终端设备40等输出聚类单元207的聚类结果(s109)。此时,假设根据检查了聚类结果输出到图像显示器等的终端设备30和终端设备40的用户,选择用于附加地输出的目标簇(s111),并且选择待输出第一数据和第二数据中的哪一个(s113)。利用该配置,输出单元209确认根据用户选择输出的数据是否是第一数据(s113),病情呢在所选择的数据是第一数据的情况下(s113/是),输出部209将属于所选择的簇的每个细胞的第一数据向终端设备30、终端设备40等输出(s121)。另一方面,在所选择的数据是第二数据的情况下(s113/否),输出单元209使用户选择第二数据中的荧光物质的组合(s117),并且将关于第二数据中选择的荧光物质的组合的表达水平的数据输出到终端设备30和终端设备40等(s119)。

根据以上操作,信息处理设备20能够从聚类结果返回第一数据和第二数据并向用户呈现信息。结果,根据本实施方式的信息处理设备20能够改善关于聚类结果的信息的可追溯性。

<4.变形例>

(4.1.第一变形例)

接下来,将参考图10至图13来描述根据本实施方式的信息处理设备20的第一变形例。图10是示意性地示出根据第一变形例的信息处理设备21的示例性配置的框图。

如图10所示,根据第一变形例的信息处理设备21与图2所示的信息处理设备20的不同之处在于附加地设置有样本比较单元211。在下文中,将描述作为第一变形例的特征的样本比较单元211,而对于与图2中示出的信息处理设备20基本相似的配置的其余部分,将省略描述。

样本比较单元211比较多个样本的聚类结果,并且指定在所比较的多个样本之间存在差异的簇。具体地,在比较第一样本与第二样本的情况下,首先,样本比较单元211将第二样本中的每个细胞映射到由聚类单元207对第一样本进行的聚类的结果上。接下来,样本比较单元211将第一样本的聚类结果与第二样本的映射结果进行比较,并且将第一样本的聚类结果与第二样本的映射结果之间的变化为阈值或更大的值的簇指定为不同的簇。例如,可以由输出单元209将所指定的不同簇的第一数据或第二数据输出至终端设备30和终端设备40。应当注意,例如,第一样品是从健康个体收集的样品,而第二样品例如是从患病个体收集的样品。

此时,将参考图11和图12更具体地描述样本比较单元211的操作。图11是说明根据第一变形例的信息处理设备21的操作的概况的说明图。图12是示出根据第一变形例的信息处理设备21的操作的示例的流程图。

如图11和图12所示,首先,由聚类单元207基于第二数据对每个第一样本进行聚类(s201)。

接下来,在聚类每个第一样品中的每个聚类中,样品比较单元211计算属于每个簇的细胞的第二数据的代表值(s203)。例如,样品比较单元211可以将第二数据中的每种荧光物质的每个表达水平的平均值、模式或中值作为代表值进行处理。

接下来,样本比较单元211基于第二样本的第二数据,将第二样本的每个细胞映射到第一样本的聚类结果中的簇当中具有最短距离的簇上(s205)。具体地,样本比较单元211计算第二样本的每个细胞的第二数据的向量与作为第一样本的聚类结果的簇的代表值之间的欧几里德距离或曼哈顿距离。

接下来,样本比较单元211比较第一样本的聚类结果与第二样本的映射结果,并且确定在第一样本与第二样本之间的所属细胞的数量已经改变了阈值或更大的值的簇的存在或不存在(s207)。在不存在第一样本与第二样本之间所属细胞的数量已经改变了阈值或更大的值的簇的情况下(s207/否),信息处理设备21结束操作。

另一方面,在存在第一样本与第二样本之间所属细胞的数量已经改变了阈值或更大的值的簇的情况下(s207/是),样本比较单元211将该指定为不同的簇(s209)。例如,样本比较单元211可以将在第一样本的聚类结果与第二样本的映射结果之间所属细胞的数量已经改变了阈值(例如,诸如2)或更大的值的簇指定为不同的簇。可替代地,样本比较单元211可以将在第一样本的聚类结果与第二样本的映射结果之间所属细胞的数量相对于整体的样本的比例已经改变了阈值或更大的值的簇指定为不同的簇。

由样本比较单元211指定的不同簇的第一数据和/或第二数据由输出单元209作为图像显示等输出至终端设备30和终端设备40,从而呈现给用户。通过该配置,用户能够检查与荧光相关的信息、以及与在第一样品与第二样品之间存在差异的细胞组中的每种荧光物质的表达水平相关的信息。

接下来,将参考图13描述根据第一变形例的信息处理设备21的操作的另一示例。图13是示出根据第一变形例的信息处理设备21的操作的另一示例的流程图。

例如,在根据图12中示出的流程图的操作的示例中,在仅存在包括在第二样本中的细胞群的情况下,由于细胞组不在第一样本中形成簇,因此存在细胞组将映射到第一样本的整个聚类结果的可能性。因此,在图13中示出的操作的另一示例中,聚类的样本和映射的样本的组合互换,并且每个被聚类和映射。通过该配置,在图13所示的操作的其他示例中,即使在存在包括在第一样本或第二样本中的仅一个中的细胞组的情况下,也可以指定具有第一样本与第二样本之间的差异的细胞组。

如图13所示,首先,由聚类单元207基于第二数据对每个第一样本进行聚类(s201)。接下来,在对每个第一样本进行聚类的每个聚类中,样本比较单元211计算属于每个簇的细胞的第二数据的代表值(s203)。接下来,样本比较单元211基于第二样本的第二数据,将第二样本的每个细胞映射到第一样本的聚类结果中的簇当中具有最短距离的簇上(s205)。在本文中,还将指定s201至s205中的聚类样本(第一样本)和映射样本(第二样本)的组合作为第一组合。

接下来,将第一样本和第二样本的聚类与映射的关系互换,并且执行上述s201至s205的操作(s211)。

具体地,由聚类单元207基于第二数据对每个第二样本进行聚类。接下来,在对每个第二样本进行聚类的每个聚类中,样本比较单元211计算属于每个簇的细胞的第二数据的代表值。接下来,样本比较单元211基于第一样本的第二数据,将第一样本的每个细胞映射到第二样本的聚类结果中的簇当中具有最短距离的簇上。这里,还将指定s211中的聚类样本(第二样本)和映射样本(第一样本)的组合为第二组合。

接下来,样本比较单元211确定针对将第二样本映射到第一样本(第一组合)的聚类结果的情况下的每个簇的改变量是否大于针对将第一样本映射到第二样本(第二组合)的聚类结果的情况下的每个簇的改变量(s213)。在第一组合的每个簇的改变量更大的情况下(s213/是),样本比较单元211选择第一组合(s217),而在第二组合的每个簇的改变量更大的情况下(s213/否),样本比较单元211选择第二组合(s215)。第一组合的各个簇的改变量与第二组合的各个簇的改变量的比较可以根据所有簇的改变量的最大值来进行、或者例如根据改变量为阈值或更大的值的簇的个数。

之后,样本比较单元211在所选择的组合中比较聚类结果与映射结果,并且确定聚类结果与映射结果之间存在或不存在所属细胞的数量已经改变了阈值或更大的值的簇(s207)。在聚类结果与映射结果之间不存在所属细胞的数量已经改变了阈值或更大的簇的情况下(s207/否),信息处理设备21结束操作。

另一方面,在存在聚类结果与映射结果之间的所属细胞的数量已经改变了阈值或更大的簇的情况下(s207/是),样本比较单元211将该簇指定为不同的簇(s209)。

由样本比较单元211指定的不同簇的第一数据和/或第二数据作为图像显示由输出单元209等输出至终端设备30和终端设备40,从而呈现给用户。通过该配置,用户能够检查与荧光相关的信息、以及与在第一样品与第二样品之间存在差异的细胞组中的每种荧光物质的表达水平相关的信息。

(4.2.第二变形例)

接下来,将参考图14至图16来描述根据本实施方式的信息处理设备20的第二变形例。图14是示意性示出根据第二变形例的信息处理设备22的示例性配置的框图。

如图14所示,除了根据第一变形例的信息处理设备21之外,根据第二变形例的信息处理设备22还设置有细胞查询单元213。在下文中,将描述作为第二变形例的特征的细胞查询单元213,而对于与图10中示出的信息处理设备21基本上相似的配置的剩余部分,将省略描述。

细胞查询单元213查询外部数据库以指定由样品比较单元211指定的不同簇在生物学上与哪种细胞类型相对应。具体地,细胞查询单元213从由样本比较单元211指定的不同簇的第二数据生成与包括在不同簇中的细胞的表达模式相关的信息。接下来,通过将与所生成的表达模式相关的信息输入到外部本体数据库中,细胞查询单元213指定不同的簇与哪个细胞组相对应。例如,关于指定的细胞组的信息可以通过由输出单元209输出到终端设备30和终端设备40来呈现给用户。

对于外部本体数据库,可以使用公用数据库(诸如,“细胞本体数据库(https://bioportal.bioontology.org/ontologies/cl)”)、或例如,“flowcl(https://bioconductor.org/packages/release/bioc/html/fiowcl.html)”数据库。

此时,将参考图15和图16来更具体地描述细胞查询单元213的操作。图15是说明根据第二变形例的信息处理设备22的操作的概况的说明图。图16是示出根据第二变形例的信息处理设备22的操作的示例的流程图。

如图15和图16所示,首先,如根据第一变形例的信息处理设备21的操作的示例中所描述,执行第一样本和第二样本的聚类和映射。假定通过该配置,指定在第一样本与第二样本之间存在差异的不同的簇(s301)。

此时,细胞查询单元213根据包括在该不同簇中的细胞的第二数据,计算不同簇中的每种荧光物质的表达水平的代表值(s303)。例如,细胞查询单元213可以将包括在不同簇中的每个细胞中的每种荧光物质的表达水平的平均值、模式或中值视为不同簇中的每种荧光物质的表达水平的代表值。

接下来,细胞查询单元213基于所计算的不同簇中的每种荧光物质的表达水平生成,可输入到外部数据库中的信息(s305)。例如,在使用“flowcl”作为外部数据库的情况下,细胞查询单元213可以生成指定细胞中每个标记分子表达的阳性或阴性的信息(例如cd3+;cd8-;cd20+)。

每个标记分子的表达的阳性或阴性可以通过设定适当的阈值以使得所有簇中的荧光物质的表达水平被二分、以及确定不同簇中的每种荧光物质的表达水平的代表值是否超过阈值来相对决定。可替代地,每个标记物分子的阳性或阴性可以基于不同簇中每种荧光物质的表达水平的代表值是否超过预定阈值来绝对地决定。

接下来,通过将生成的信息输入到外部数据库中,细胞查询单元213查询包括在不同的簇中的细胞的细胞类型(s307)。之后,细胞查询单元213基于查询结果指定属于不同簇的细胞的细胞类型(s309)。

由细胞查询单元213指定的不同簇的细胞类型由输出单元209输出到终端设备30和终端设备40,并且作为图像显示等呈现给用户。附加地,输出单元209也可以向终端设备30和终端设备40输出不同的簇的第一数据或第二数据。通过该配置,用户能够检查在第一样本与第二样本之间存在差异的细胞组的生物细胞类型的种类。

<5.示例性硬件配置>

接下来,将参考图17描述根据本实施方式的信息处理设备20的硬件配置。图17是示出根据本实施方式的信息处理设备20的硬件配置的示例的框图。

如图17所示,信息处理设备20设置有中央处理单元(cpu)901、只读存储器(rom)902、随机存取存储器(ram)903、桥907、内部总线905和906、接口908、输入设备911、输出设备912、存储设备913、驱动器914、连接端口915、以及通信设备916。

cpu901用作计算处理设备和控制设备,并且通过遵循在rom902等中存储的各种程序来控制信息处理设备20的总体操作。rom902存储由cpu901使用的程序和计算参数,而ram903存储在由cpu901执行期间使用的程序和在执行期间适当改变的参数。例如,cpu901可以执行荧光分离单元203、聚类单元207、样本比较单元211和细胞查询单元213的功能。

cpu901、rom902和ram903通过桥907、内部总线905和906等互连。附加地,cpu901、rom902和ram903还通过接口908连接至输入设备911、输出设备912、存储设备913、驱动器914、连接端口915、以及通信设备916。例如,ram903可以执行信息存储单元205的功能。

输入设备911包括接受信息的输入的输入设备,诸如,触摸面板、键盘、鼠标、按钮、麦克风、开关、或杆。此外,输入设备911还包括基于输入信息生成输入信号并且将所生成的输入信号输出到cpu901的输入控制电路等。例如,输入设备911可以执行输入单元201的功能。

例如,输出设备912包括显示装置,诸如,阴极射线管(crt)显示装置、液晶显示装置、或有机电致发光(el)显示装置。附加地,输出设备912还可以包含音频输出设备,诸如,扬声器或头戴式耳机。例如,输出设备912可以执行输出单元209的功能。

存储设备913是用于信息处理设备20中的数据存储的存储装置。存储设备913可以包括存储介质、在存储介质中存储数据的存储装置、从存储介质读出数据的读出装置、以及删除在存储媒质中存储的数据的删除装置。

驱动器914是用于存储介质的读写器,并且内部容纳在信息处理设备20内部或外部附接至信息处理设备20。例如,驱动器914读出在可移除存储介质中(诸如,插入的磁盘、光盘、磁光盘或半导体存储器)存储的信息,并且将信息输出至ram903。驱动器914还可以将信息写入可移除存储介质。

连接端口915是包括用于与外部连接的设备连接的连接端口的连接接口,诸如,通用串行总线(usb)端口、以太网(注册商标)端口、ieee802.11标准端口、以及光音频终端。

例如,通信设备916是包括连接至网络n的通信装置等的通信接口。此外,通信设备916可以是支持有线或无线lan的通信设备,并且还可以是通过有线电缆通信的电缆通信设备。例如,通信设备916和连接端口915可以执行输入单元201和输出单元209的功能。

注意,还可以创建计算机程序,该计算机程序用于使内置于信息处理设备20中的硬件(诸如,cpu、rom和ram)表现出与根据上述本实施方式的信息处理设备的各个部件相似的功能。此外,可以提供存储有这样的计算机程序的存储介质。

本领域技术人员应理解,只要在所附权利要求或其等同物的范围内,根据设计需求和其他因素可以做出各种变形、组合、子组合以及更改。

此外,本说明书中描述的效果仅仅是说明性的或示例性的效果,并不是限制性的。即,具有或代替上述效果,根据本公开的技术可以实现本领域技术人员从本说明书的描述中清楚的其他效果。

此外,还可以如下配置本技术。

(1)一种信息处理设备,包括:

信息存储单元,将来自细胞的光的感测结果即第一数据和将第一数据分离成多个荧光的结果即第二数据彼此相关联地存储;

聚类单元,基于第二数据将细胞聚类成多个簇;以及

输出单元,输出来自聚类单元的聚类结果,其中,

输出单元附加地输出与包括在由用户从多个簇当中选择的簇中包括的细胞有关的第一数据和第二数据中的至少一者或多者。

(2)根据(1)的信息处理设备,其中,

第一数据的维度大于第二数据的维度。

(3)根据(1)或(2)的信息处理设备,其中,

第一数据是来自细胞的光的光谱数据。

(4)根据(1)至(3)中任一项的信息处理设备,其中,

第二数据作为从多个荧光当中选择的荧光的组合输出。

(5)根据(1)至(4)中任一项的信息处理设备,其中,

聚类结果作为图像显示输出。

(6)根据(1)至(5)中任一项的信息处理设备,还包括:

样本比较单元,将第一样本与第二样本彼此进行比较,针对所述第一样本,第一数据和第二数据已存储在信息存储单元中。

(7)根据(6)的信息处理设备,其中,

样本比较单元将第一样本的细胞聚类成多个簇,并且基于第一样本的聚类结果将第二样本的细胞映射到该多个簇上。

(8)根据(7)的信息处理设备,其中,

样本比较单元将第一样本的聚类结果与第二样本的映射结果进行比较,并且从而指定第一样本与第二样本之间的改变量为阈值或更大的值的簇,并且

输出单元附加地输出与包括在所指定的簇中的细胞有关的第一数据和第二数据中的至少一者或多者。

(9)根据(6)的信息处理设备,其中,

样本比较单元执行基于第一样本的聚类结果将第二样本映射到多个簇的第一聚类、以及基于第二样本的聚类结果将第一样本映射到多个簇的第二聚类中的每者。

(10)根据(9)的信息处理设备,其中,

在第一聚类和第二聚类中的每者中,样本比较单元将聚类结果以及第一样本和第二样本的映射结果中的每者进行比较,并且从而指定第一样本与第二样本之间的改变量为阈值或更大的值的簇,并且

输出单元附加地输出与包括在所指定的簇中的细胞有关的第一数据和第二数据中的至少一者或多者。

(11)根据(8)或(10)的信息处理设备,还包括:

细胞查询单元,将与包括在由样本比较单元指定的簇中的细胞相关的信息输入到数据库中以用于指定细胞。

(12)根据(11)中的信息处理设备,其中,

细胞查询单元基于查询数据库的结果,来指定包括在簇中的细胞的细胞类型,并且

输出单元附加地输出与具有所指定的细胞类型的细胞有关的第一数据和第二数据中的至少一者或多者。

(13)根据(11)或(12)的信息处理设备,其中,

输入到数据库中的与细胞相关的信息基于第二数据生成。

(14)根据(13)的信息处理设备,其中,

输入到数据库中的与细胞相关的信息是与标记分子的表达水平相关的信息,该标记分子与多个荧光中的每个相对应。

(15)一种信息处理方法,包括:

将感测来自细胞的光的结果即第一数据和将第一数据分离成多个荧光的结果即第二数据彼此相关联地存储;

基于第二数据将细胞聚类成多个簇;并且

输出来自聚类单元的聚类结果;并且

附加地输出与包括在由用户从多个簇当中选择的簇中的细胞有关的第一数据和第二数据中的至少一者或多者。

(16)一种使计算机作用如下的程序:

信息存储单元,将感测来自细胞的光的结果即第一数据和将第一数据分离成多个荧光的结果即第二数据彼此相关联地存储;

聚类单元,基于第二数据将细胞聚类成多个簇;以及

输出单元,输出来自聚类单元的聚类结果,其中,

输出单元用于附加地输出与包括在由用户从多个簇当中选择的簇中的细胞有关的第一数据和第二数据中的至少一者或多者。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1