细胞数据注释方法、装置、设备及介质与流程

文档序号:31669405发布日期:2022-09-28 00:37阅读:来源:国知局

技术特征:
1.一种细胞数据注释方法,其特征在于,包括:获取待预测转录组的细胞数据;所述细胞数据包括所述待预测转录组中多个测序点的基因表达信息以及所述多个测序点的空间信息;确定与所述待预测转录组对应的已注释细胞对象,根据所述细胞对象以及所述基因表达信息确定所述待预测转录组的初始细胞注释结果;将所述细胞数据输入第一预测模型,根据所述第一预测模型的输出与所述初始细胞注释结果之间的损失对所述初始细胞注释结果进行修正,获得所述待预测转录组的细胞注释结果。2.根据权利要求1所述的方法,其特征在于,所述细胞对象以及所述基因表达信息确定所述待预测转录组的初始细胞注释结果,包括:确定与所述细胞对象匹配的第二预测模型;所述第二预测模型是待预测转录组的基于所述细胞对象的历史基因表达信息以及所述历史基因表达信息对应的历史细胞注释结果进行训练获得的;将所述基因表达信息输入所述第二预测模型,获得所述待预测转录组的初始细胞注释结果。3.根据权利要求1或2所述的方法,其特征在于,所述细胞对象为所述待预测转录组对应的基因测序对象包括的单细胞或细胞组。4.根据权利要求1所述的方法,其特征在于,所述将所述细胞数据输入第一预测模型,根据所述第一预测模型的输出与所述初始细胞注释结果之间的损失对所述初始细胞注释结果进行修正,获得所述待预测转录组的细胞注释结果,包括:将所述细胞数据输入所述第一预测模型进行编码处理得到融合编码信息,将所述融合编码信息输入所述第一预测模型的分类模块,获得所述第一预测模型的输出结果;根据所述第一预测模型的损失函数确定所述输出结果和所述初始细胞注释结果之间的损失,根据所述损失迭代训练所述分类模块,在所述损失函数最小化时获得调整后的所述第一预测模型;将所述细胞数据输入调整后的所述第一预测模型,获得所述待预测转录组的细胞注释结果。5.根据权利要求4所述的方法,其特征在于,所述将所述细胞数据输入所述第一预测模型进行编码处理包括:将所述基因表达信息输入所述第一预测模型的第一编码模块,获得第一编码信息;根据所述空间信息确定邻接矩阵;所述邻接矩阵用于表征所述待预测转录组中各个测序点的邻近测序点;将所述邻接矩阵和所述第一编码信息输入所述第一预测模型的第二编码模块进行处理,获得第二编码信息;将所述第一编码信息和所述第二编码信息进行融合处理,得到所述融合编码信息。6.根据权利要求5所述的方法,其特征在于,在得到所述融合编码信息之后,所述方法还包括:对所述融合编码信息进行解码处理,获得重构的基因表达信息;根据所述损失函数确定所述重构的基因表达信息与所述基因表达信息之间的损失,根
据所述损失调整所述第一编码模块的参数,使得所述重构的基因表达信息接近所述基因表达信息。7.根据权利要求6所述的方法,其特征在于,对所述融合编码信息进行解码处理,获得重构的解码信息,包括:对所述融合编码信息进行线性特征提取处理,得到中间特征信息;将所述中间特征信息输入第一解码器进行特征还原处理,获得所述重构的基因表达信息。8.根据权利要求4-7任一项所述的方法,其特征在于,在得到所述融合编码信息之后,所述方法还包括:对所述融合编码信息进行解码处理,获得重构的空间信息;根据所述损失函数确定所述重构的空间信息与所述空间信息之间的损失,根据所述损失调整所述第二编码模块的参数,使得所述重构的空间信息接近所述空间信息。9.根据权利要求5所述的方法,其特征在于,所述损失函数包括第一分量、第二分量以及第三分量;所述第一分量用于表征所述初始细胞注释结果与所述第一预测模型的输出之间的损失;所述第二分量用于表征所述第一预测模型的输入中的基因表达信息与重构的基因表达信息之间的损失;所述重构的基因表达信息是对所述融合编码信息进行解码处理后获得的;所述第三分量用于表征所述第一预测模型的输入中的空间信息与所述重构的空间信息之间的损失;所述重构的空间信息是对所述融合编码信息进行解码处理后获得的。10.根据权利要求9所述的方法,其特征在于,所述方法还包括:确定所述第一分量、所述第二分量以及所述第三分量的权重系数;根据所述第一分量、所述第二分量、所述第三分量的权重系数、所述第一分量、所述第二分量以及所述第三分量确定所述损失函数;其中,所述第一分量的权重系数与转录组细胞注释结果的重要程度相关;第二分量的权重系数与转录组基因表达信息的重要程度相关;所述第三分量的权重系数与所述转录组空间信息的重要程度相关。11.根据权利要求5所述的方法,其特征在于,所述根据所述空间信息确定邻接矩阵包括:根据所述空间信息确定所述多个测序点中每一测序点的邻近测序点;根据所述待预测转录组中所有测序点的邻近测序点所对应的空间距离生成所述邻接矩阵;所述邻接矩阵为n*n矩阵,所述n为所述待预测转录组中测序点的数量。12.根据权利要求11所述的方法,其特征在于,根据所述空间信息确定所述多个测序点中每一测序点的邻近测序点,包括:针对所述多个测序点中的每一测序点,根据所述空间信息确定所述测序点的位置信息,根据所述测序点的位置信息计算所述测序点与所述待预测转录组中其余测序点之间的距离;将与所述测序点之间距离小于预设阈值的测序点,确定为所述测序点的邻近测序点。
13.根据权利要求11或12所述的方法,其特征在于,根据所述待预测转录组中所有测序点的邻近测序点所对应的空间距离生成所述邻接矩阵,包括:针对所述多个测序点中的每一测序点,根据所述测序点与邻近测序点对应的空间距离,确定所述邻接矩阵中与所述测序点对应的元素;将所述邻接矩阵中的其余元素置为零。14.一种细胞数据注释装置,其特征在于,所述装置包括:获取模块,用于获取待预测转录组的细胞数据;所述细胞数据包括所述待预测转录组中多个测序点的基因表达信息以及所述多个测序点的空间信息;处理模块,用于确定与所述待预测转录组对应的已注释细胞对象,根据所述细胞对象以及所述基因表达信息确定所述待预测转录组的初始细胞注释结果;细胞注释模块,用于将所述细胞数据输入第一预测模型,根据所述第一预测模型的输出与所述初始细胞注释结果之间的损失对所述初始细胞注释结果进行修正,获得所述待预测转录组的细胞注释结果。15.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器用于执行所述程序时实现如权利要求1-13任一项所述的细胞数据注释方法。16.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序用于实现如权利要求1-13任一项所述的细胞数据注释方法。17.一种计算机程序产品,其特征在于,所述计算机程序产品中包括指令,当所述指令被执行时实现如权利要求1-13任一项所述的细胞数据注释方法。

技术总结
本申请公开了一种细胞数据注释方法、装置、设备及存储介质,该方法包括:获取待预测转录组的细胞数据;细胞数据包括待预测转录组中多个测序点的基因表达信息以及多个测序点的空间信息;确定与待预测转录组对应的已注释细胞对象,根据细胞对象以及基因表达信息确定待预测转录组的初始细胞注释结果;将细胞数据输入第一预测模型,根据第一预测模型的输出与初始细胞注释结果之间的损失对初始细胞注释结果进行修正,获得待预测转录组的细胞注释结果。该技术方案能够基于特征较为全面的细胞数据获得待预测转录组的细胞注释结果,从而提高了空间转录组的细胞注释结果的准确性。了空间转录组的细胞注释结果的准确性。了空间转录组的细胞注释结果的准确性。


技术研发人员:吴子涵 姚建华
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2022.04.25
技术公布日:2022/9/27
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1