一种细胞分割方法、装置、计算机设备以及可读存储介质与流程

文档序号:34169205发布日期:2023-05-15 02:26阅读:136来源:国知局
一种细胞分割方法、装置、计算机设备以及可读存储介质与流程

本文涉及细胞分析,尤其涉及一种细胞分割方法、装置、计算机设备以及可读存储介质。


背景技术:

1、分析组织的细胞成分对于认识组织的性质、判断组织的状态具有重要意义。对于空间组学中的细胞分割,旨在结合空间组学实验测得的标记物(如mrna,蛋白等等)的空间位置信息,对标记物进行分类,以确定细胞边界,从而实现细胞分割的过程。对标记物实现细胞分割后可以进一步用于各种生物学机制的探索,如细胞间通信,肿瘤免疫微环境等等。

2、通过本案发明人的研究发现,目前存在一些已知的细胞分割技术,这些方法主要存在以下不足:

3、需要特定的细胞形状假设:目前的方法基本需要假设细胞是椭圆形或凸多边形,以此为基础进行细胞分割。而实际上细胞形状不规则且不同细胞千差万别,并非均为椭圆形或凸多边形;

4、需要细胞核、细胞膜的定位信息:目前算法一般需要针对空间组学样本进行细胞核、细胞膜的定位实验(通过染色等),以得到用于细胞分割的先验信息。对于不能同时进行细胞核、细胞膜染色的空间组学样本,需进行额外的生物学实验以满足算法的需求。因此,需消耗大量的人力、物力和财力。

5、未充分利用标记物的生物学信息:目前算法对空间组数据的细胞分割往往仅依赖细胞的形态学特征,例如细胞核定位、细胞膜定位、mrna分布密度等,空间组数据中捕获到的几十种、几百种标记物及其组合所蕴含的生物信息未能充分利用,影响了细胞分割的成功率和准确性。

6、未能充分刻画细胞的完整特征:空间组数据往往只能同时测量几十、几百种细胞标记物或特征,如mrna或蛋白,不能充分刻画细胞的全转录组特征或全蛋白质组特征,限制了细胞类型、细胞状态的精确识别。

7、计算效率低下:对于视野大、分辨率高、标记物总量大的样本无法高效处理甚至无法处理。

8、因此,现在亟需一种更加准确、高效、功能全面的细胞分割方法的技术方案。


技术实现思路

1、为解决现有技术中的问题,本文实施例提供了一种细胞分割方法、装置、计算机设备以及可读存储介质,用于解决现有技术中细胞分割不准确的问题。

2、本文实施例提供了一种细胞分割方法,包括,

3、获取空间组学样本以及单细胞样本;

4、获取所述空间组学样本的候选细胞中心;

5、根据所述空间组学样本中每一标记物以及所述候选细胞中心的分布,得到所述空间组学样本中的初始细胞分割结果;

6、根据所述初始细胞分割结果的标记物与所述单细胞样本的标记物的相似度,以及空间组学样本中标记物的距离得分,反复迭代优化所述标记物所属的候选细胞中心,得到最终细胞分割结果。

7、作为本文实施例的一个方面,在获取空间组学样本以及单细胞样本中进一步包括,

8、对空间组学样本中所含标记物和单细胞样本中所含标记物进行编码匹配映射,形成所述空间组学样本以及所述单细胞样本的细胞分割所需标记物。

9、作为本文实施例的一个方面,所述获取所述空间组学样本的候选细胞中心进一步包括,

10、根据所述空间组学样本中每一标记物的空间位置,计算所述标记物的密度;

11、计算所述标记物的覆盖度得分;

12、根据所述标记物的密度和覆盖度得分,得到所述标记物的第一回报;

13、根据所述标记物的第一回报和所述标记物为候选细胞中心的采样概率,生成第一损失函数;

14、训练所述第一损失函数得到所述空间组学样本的候选细胞中心。

15、作为本文实施例的一个方面,所述根据所述空间组学样本中每一标记物的空间位置,计算所述标记物的密度进一步包括,

16、根据所述空间组学样本中每一标记物的空间位置,生成所述标记物邻域或k邻接图;

17、根据所述标记物的邻域或k邻接图来计算所述标记物或k邻接图内标记物的密度。

18、作为本文实施例的一个方面,所述根据所述空间组学样本中每一标记物以及所述候选细胞中心的分布,得到所述空间组学样本中的初始细胞分割结果进一步包括,

19、寻找与所述标记物距离最近的复数个候选细胞中心;

20、确定所述标记物属于所述复数个候选细胞中心概率,并按照该概率对标记物所属候选细胞中心进行采样,以此确定标记物对应的细胞中心;

21、针对每一标记物执行上述步骤,得到所述空间组学样本中的初始细胞分割结果。

22、作为本文实施例的一个方面,所述根据所述空间组学样本中每一标记物以及所述候选细胞中心的分布,得到所述空间组学样本中的初始细胞分割结果进一步包括,

23、判断所述空间组学样本中的标记物是否为噪声,如果该标记物不为噪声则参与所述空间组学样本的初始细胞分割,否则,不参与所述空间组学样本的初始细胞分割。

24、作为本文实施例的一个方面,所述噪声包括至少包括以下之一:胞外基质标记物、胞内冗余标记物和实验误差所产生标记物。

25、作为本文实施例的一个方面,所述根据所述初始细胞分割结果的标记物与所述单细胞样本的标记物的相似度,以及空间组学样本中标记物的距离得分,反复迭代优化所述标记物所属的候选细胞中心,得到最终细胞分割结果进一步包括,

26、计算所述空间组学样本的初步细胞分割结果中的第一标记物特征矩阵与由所述单细胞样本得到的第二标记物特征矩阵的相似度,以及所述第二标记物特征矩阵和所述第一标记物特征矩阵的差值;

27、根据所述相似度、空间组学样本中标记物的距离得分以及差值生成第二损失函数;

28、训练所述第二损失函数得到所述空间组学样本的最终细胞分割结果。

29、作为本文实施例的一个方面,在计算所述空间组学样本的初步细胞分割结果中的第一标记物特征矩阵与由所述单细胞样本得到的第二标记物特征矩阵的相似度,以及所述第二标记物特征矩阵和所述第一标记物特征矩阵的差值中还包括,

30、计算每一候选细胞中心的权重熵;

31、根据所述权重熵以及所述相似度,生成第三损失函数;

32、训练所述第三损失函数使得空间组学样本的标记物特征矩阵与单细胞样本的标记物特征矩阵更加接近。

33、作为本文实施例的一个方面,所述根据所述相似度、空间组学样本中标记物的距离得分以及差值生成第二损失函数中进一步包括,

34、根据空间组学样本中标记物的距离得分得到所述标记物的噪声概率;

35、根据所述空间组学样本中标记物的距离得分、所述相似度和差值生成所述标记物的第二回报;

36、根据所述标记物的第二回报、当前选择的候选细胞中心的概率以及该标记物属于噪声的概率生成所述第二损失函数。

37、作为本文实施例的一个方面,训练所述第二损失函数得到所述空间组学样本的最终细胞分割结果之后进一步包括,

38、对所述最终细胞分割结果构建细胞边界多边形区域。

39、作为本文实施例的一个方面,在得到空间组学样本的最终细胞分割结果后进一步包括,

40、将单细胞样本的标记物特有的性状、特征映射到最终分割细胞相应的空间位置。

41、作为本文实施例的一个方面,将单细胞样本的标记物特有的性状、特征映射到最终分割细胞相应的空间位置进一步包括,

42、根据空间组学样本最终分割细胞的标记物矩阵和单细胞样本的标记物特征矩阵,计算两两配对相似度;

43、根据所述两两配对相似度,对每个所述空间组学样本最终分割细胞找到k邻接单细胞;

44、根据k邻接单细胞和所述两两配对相似度大小,计算空间组学样本中最终分割细胞对应位置处由单细胞样本标记物映射所得标记物特征。

45、作为本文实施例的一个方面,在将单细胞样本的标记物特有的性状、特征映射到最终分割细胞相应的空间位置之后进一步包括,

46、绘制空间组学样本中空间基因表达图谱。

47、作为本文实施例的一个方面,在绘制空间组学样本中空间基因表达图谱之后还包括,

48、根据所述空间基因表达图谱,对受配体对间相互作用进行分析。

49、本文实施例还提供了一种候选细胞中心确定方法,包括,

50、根据空间组学样本中每一标记物的空间位置,计算所述标记物的密度;

51、计算所述标记物的覆盖度得分;

52、根据所述标记物的密度和覆盖度得分,得到所述标记物的第一回报;

53、根据所述标记物的第一回报和所述标记物为细胞中心的采样概率,生成第一损失函数;

54、训练所述第一损失函数得到所述空间组学样本的细胞中心。

55、本文实施例还提供了一种细胞分割装置,包括,

56、第一获取单元,用于获取空间组学样本以及单细胞样本;

57、第二获取单元,用于获取所述空间组学样本的候选细胞中心;

58、强化学习单元,用于根据所述空间组学样本中每一标记物以及所述候选细胞中心的分布,得到所述空间组学样本中的初始细胞分割结果;根据所述初始细胞分割结果的标记物与所述单细胞样本的标记物的相似度,以及空间组学样本中标记物的距离得分,反复迭代优化所述标记物所属的候选细胞中心,得到最终细胞分割结果。

59、本文实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法。

60、本文实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,该计算机指令被处理器执行时实现上述的方法。

61、利用本文实施例,基于单细胞样本信息实现空间组学样本中的细胞分割,可以更加准确的对细胞进行分割,并且细胞分割得到的单细胞特征与已知单细胞样本特征相似度高,而且不需要复杂的生物学实验作为先验,仅依靠公共可获得的单细胞样本作为参考,细胞分割的成本较低。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1