本说明书涉及医疗辅助检查,尤其是涉及一种影像分类模型建立方法及装置、分类方法、装置及系统。
背景技术:
1、影像检查是一种让医生查看患者身体内部状况的辅助医疗手段,从原理上来说,影像检查通过发射不同形式的能量(比如x光、声波、放射性微粒或者磁场)并使其穿过人的身体,基于身体的组织对能量模式的改变得到医学影像,以用于展示身体内部结构以及功能情况,随着人工智能技术的发展,目前人工智能技术能够根据医学影像自动进行分类识别,以实现对医学影像的自动筛查检测,但是常规的利用人工智能进行医学影像分类仅仅利用医学影像建立影像标志物标签进行有监督模型训练,未考虑到肿瘤细胞的高度异质性及基因组数据与影像标志物的内在关联性,导致医学影像存在分类难度大、分类精度低的问题,因此亟需一种影像分类模型建立方法,建立起有效的影像分类模型,该影像分类模型能够为医学影像匹配合适的肿瘤细胞基因组数据,并将医学影像及其对应的基因组数据共同用于获取医学影像中影像标志物的分类识别信息,以降低医学影像的分类难度以及提高对医学影像中影像标志物的分类精度,从而为医务人员提供更丰富完善的影像检查参考信息。
技术实现思路
1、鉴于目前医学影像的影像标志物的分类识别仅基于单维度的图像特征实现,而忽略了医学影像与基因组数据的内在联系,导致判断医学影像中影像标志物的数量、种类及概率值存在误差,提出了本方案以便克服上述问题或者至少部分地解决上述问题。
2、一方面,本说明书的一些实施例的目的在于提供一种影像分类模型建立方法,所述方法包括:
3、接收单细胞转录组测序标准数据集、第一医学影像数据集及其对应的第一bulk转录组测序数据集,以及第二医学影像数据集;
4、根据所述第一bulk转录组测序数据集及单细胞转录组测序标准数据集生成第一bulk单细胞转录组测序数据;
5、基于所述第一bulk单细胞转录组测序数据,对所述第一bulk转录组测序数据集进行自监督聚类,得到聚类结果;
6、根据所述第一医学影像数据集、第一bulk单细胞转录组测序数据以及所述聚类结果建立第一训练样本集;
7、利用第一训练样本集训练第一神经网络,得到第一神经网络模型;
8、根据所述第一神经网络模型中的特征权重参数进行迁移学习,确定所述第二医学影像数据集对应的第二bulk单细胞转录组测序数据;
9、根据所述第二医学影像数据集及第二bulk单细胞转录组测序数据建立第二训练样本集;
10、利用第二训练样本集训练第二神经网络,得到第二神经网络模型,将训练完成的第二神经网络模型作为影像分类模型,以用于预测医学影像数据中目标影像标志物的数量、种类及概率值。
11、进一步地,根据第一bulk转录组测序数据集及单细胞转录组测序标准数据集生成第一bulk单细胞转录组测序数据,包括:
12、将所述第一bulk转录组测序数据集输入至预训练的自适应反卷积模型中,得到目标转录组特征;其中,所述自适应反卷积模型基于所述单细胞转录组测序标准数据集及第二bulk转录组测序数据集训练得到;
13、根据所述目标转录组特征生成第一bulk单细胞转录组测序数据。
14、进一步地,所述目标转录组特征包括细胞类型信息以及不同细胞类型之间的比例信息。
15、进一步地,基于所述第一bulk单细胞转录组测序数据,对所述第一bulk转录组测序数据集进行自监督聚类,得到聚类结果,包括:
16、根据所述第一bulk单细胞转录组测序数据建立对应的图网络;
17、利用所述图网络对所述第一bulk转录组测序数据集进行自监督聚类,得到聚类结果。
18、进一步地,根据所述第一医学影像数据集、第一bulk单细胞转录组测序数据以及所述聚类结果建立第一训练样本集,包括:
19、以所述第一医学影像数据集、第一bulk单细胞转录组测序数据及聚类结果为输入,以所述第一医学影像数据集对应的影像标志物作为目标输出,建立第一训练样本集。
20、进一步地,根据所述第一神经网络模型中的特征权重参数进行迁移学习,确定所述第二医学影像数据集对应的第二bulk单细胞转录组测序数据,包括:
21、利用所述特征权重参数,建立所述第一医学影像数据集与第一bulk单细胞转录组测序数据之间的迁移映射函数;
22、根据所述迁移映射函数,确定所述第二医学影像数据集对应的第二bulk单细胞转录组测序数据。
23、进一步地,根据所述第二医学影像数据集及第二bulk单细胞转录组测序数据建立第二训练样本集,包括:
24、以所述第二医学影像数据集、第二bulk单细胞转录组测序数据为输入,以所述第二医学影像数据集对应的影像标志物作为目标输出,建立第二训练样本集。
25、进一步地,第二医学影像数据集对应的影像标志物为所述第一医学影像数据集对应的影像标志物的子集。
26、另一方面,本说明书的一些实施例还提供一种影像分类模型建立装置,所述装置包括:
27、接收模块,用于接收单细胞转录组测序标准数据集、第一医学影像数据集及其对应的第一bulk转录组测序数据集,以及第二医学影像数据集;
28、生成模块,用于根据所述第一bulk转录组测序数据集及单细胞转录组测序标准数据集生成第一bulk单细胞转录组测序数据;
29、聚类模块,用于基于所述第一bulk单细胞转录组测序数据,对所述第一bulk转录组测序数据集进行自监督聚类,得到聚类结果;
30、第一样本建立模块,用于根据所述第一医学影像数据集、第一bulk单细胞转录组测序数据以及所述聚类结果建立第一训练样本集;
31、训练模块,用于利用第一训练样本集训练第一神经网络,得到第一神经网络模型;
32、迁移模块,用于根据所述第一神经网络模型中的特征权重参数进行迁移学习,确定所述第二医学影像数据集对应的第二bulk单细胞转录组测序数据;
33、第二样本建立模块,用于根据所述第二医学影像数据集及第二bulk单细胞转录组测序数据建立第二训练样本集;
34、建模模块,用于利用第二训练样本集训练第二神经网络,得到第二神经网络模型,将训练完成的第二神经网络模型作为影像分类模型,以用于预测医学影像数据中目标影像标志物的数量、种类及概率值。
35、基于同一发明构思,本说明书的一些实施例的目的在于提供一种影像分类方法,所述方法包括:
36、接收待分类的医学影像数据;
37、将所述待分类的医学影像数据输入至利用前述任一实施例所述方法训练得到的影像分类模型中,以得到所述待分类的医学影像数据对应的医学影像分类结果;其中,所述医学影像分类结果包括所述待分类的医学影像数据中存在目标影像标志物的数量、种类及概率值。
38、基于同一发明构思,另一方面,本说明书的一些实施例还提供一种影像分类装置,所述装置包括:
39、获取模块,用于接收待分类的医学影像数据;
40、分类模块,用于将所述待分类的医学影像数据输入至利用前述任一实施例所述方法训练得到的影像分类模型中,以得到所述待分类的医学影像数据对应的医学影像分类结果;其中,所述医学影像分类结果包括所述待分类的医学影像数据中存在目标影像标志物的数量、种类及概率值。
41、另一方面,本说明书的一些实施例还提供了一种影像分类系统,所述系统包括:影像分类器、医学影像成像设备及显示器;
42、所述影像分类器分别与所述医学影像成像设备及显示器连接,用于根据所述医学影像成像设备生成的医学影像执行如前述任一实施例所述的影像分类方法,以进行影像分类,得到当前医学影像中影像标志物的数量、种类及概率值;
43、所述显示器用于显示所述医学影像成像设备生成的医学影像及影像分类器的影像分类结果。
44、另一方面,本说明书的一些实施例还提供了一种计算机设备,包括存储器、处理器、以及存储在所述存储器上的计算机程序,所述计算机程序被所述处理器运行时,执行上述方法的指令。
45、另一方面,本说明书的一些实施例还提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被计算机设备的处理器运行时,执行上述方法的指令。
46、本说明书的一些实施例提供的一个或者多个技术方案,至少具有如下的技术效果:
47、本说明书的实施例首先自动接收单细胞转录组测序标准数据集、第一医学影像数据集及其对应的第一bulk转录组测序数据集,以及第二医学影像数据集,根据单细胞转录组测序标准数据集和第一bulk转录组测序数据集生成第一bulk单细胞转录组测序数据,以预测第一bulk中的单细胞基因表达及构成信息,之后利用第一bulk单细胞转录组测序数据提高聚类精度,对第一bulk转录组测序数据集进行自监督聚类,得到聚类结果,将第一医学影像数据集、第一bulk单细胞转录组测序数据以及聚类结果均用于构建第一训练样本集,从多个维度构建第一神经网络模型的输入,利用第一训练样本集训练得到第一神经网络模型,在此基础上,根据第一神经网络模型的特征权重参数进行迁移学习,得到第二医学影像数据集对应的第二bulk单细胞转录组测序数据,从而根据第二医学影像数据集及第二bulk单细胞转录组测序数据建立第二训练样本集,建立了第二医学影像数据集与第二bulk单细胞转录组测序数据的内在联系,以训练第二神经网络,得到第二神经网络模型,以提高医学影像数据中第二医学影像数据集对应的影像标志物的数量、种类及概率值的预测精度。
48、上述说明仅是本说明书的一些实施例技术方案的概述,为了能够更清楚了解本说明书的一些实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本说明书的一些实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本说明书的一些实施例的具体实施方式。