本申请涉及机器学习,特别涉及一种标签的校准方法、装置、设备及存储介质。
背景技术:
1、随着机器学习技术的发展,在医疗场景中开始出现不同的医疗机构通过利用各自的样本医疗图像数据进行合作学习。但不同医疗机构的样本医疗图像数据中通常会存在大量的标签噪声(标注错误)。
2、相关技术中,通过对样本医疗图像数据进行误差判定,实现对标签噪声的过滤。
3、但是上述方法在实现过滤标签噪声的时候,会存在将一些困难样本医疗图像数据(例如罕见病样本)误识别为标签噪声的可能性。
技术实现思路
1、本申请提供了一种标签的校准方法、装置、设备及存储介质。所述技术方案如下:
2、根据本申请的一方面,提供了一种标签的校准方法,所述方法包括:
3、获取样本医疗图像数据组,所述样本医疗图像数据组中包括至少两个样本医疗图像数据,所述至少两个样本医疗图像数据中包括第一样本医疗图像数据,和除所述第一样本医疗图像数据之外的其它样本医疗图像数据;
4、基于所述第一样本医疗图像数据和每个所述其他样本医疗图像数据之间的特征差距值,将所述其它样本医疗图像数据中的第二样本医疗图像数据纳入所述第一样本医疗图像数据的特征邻域,所述第二样本医疗图像数据是所述其他样本医疗图像数据中的一个或多个样本医疗图像数据;
5、在所述第一样本医疗图像数据对应的医疗标签和所述第一样本医疗图像数据的特征邻域内的所述样本医疗图像数据对应的医疗标签存在不同的情况下,对所述第一样本医疗图像数据对应的医疗标签进行校准。
6、根据本申请的另一方面,提供了一种标签的校准装置,所述装置包括:
7、获取模块,用于获取样本医疗图像数据组,所述样本医疗图像数据组中包括至少两个样本医疗图像数据,所述至少两个样本医疗图像数据中包括第一样本医疗图像数据,和除所述第一样本医疗图像数据之外的其它样本医疗图像数据;
8、确定模块,用于基于所述第一样本医疗图像数据和每个所述其他样本医疗图像数据之间的特征差距值,将所述其它样本医疗图像数据中的第二样本医疗图像数据纳入所述第一样本医疗图像数据的特征邻域,所述第二样本医疗图像数据是所述其他样本医疗图像数据中的一个或多个样本医疗图像数据;
9、校准模块,用于在所述第一样本医疗图像数据对应的医疗标签和所述第一样本医疗图像数据的特征邻域内的所述样本医疗图像数据对应的医疗标签存在不同的情况下,对所述第一样本医疗图像数据对应的医疗标签进行校准。
10、根据本申请的另一方面,提供了一种计算机设备,所述计算机设备包括:处理器和存储器,所述存储器中存储有至少一段程序,所述至少一段程序由所述处理器加载并执行,以实现如上方面所述的标签的校准方法。
11、根据本申请的另一方面,提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一段程序,所述至少一段程序由处理器加载并执行以实现如上方面所述的标签的校准方法。
12、根据本申请的另一方面,提供了一种计算机程序产品,该计算机程序产品包括至少一段程序,所述至少一段程序存储在计算机可读存储介质中;计算机设备的处理器从所述计算机可读存储介质中读取所述至少一段程序,所述处理器执行所述至少一段程序,使得所述计算机设备执行如上方面所述的标签的校准方法。
13、本申请提供的技术方案带来的有益效果至少包括:
14、通过计算样本医疗图像数据组中的第一样本医疗图像数据和每个其他样本医疗图像数据之间的特征差距值,将其他样本医疗图像数据中的第二样本医疗图像数据纳入第一样本医疗图像数据的特征邻域中,基于第一样本医疗图像数据的特征邻域中的样本医疗图像数据对应的医疗标签,对第一样本医疗图像数据对应的医疗标签进行校准,通过利用第一样本医疗图像数据和特征邻域中的其他样本医疗图像数据之间的相似性,能够帮助有效减少样本医疗图像数据组中的标签噪声,从而提升样本医疗图像数据的准确性。
1.一种标签的校准方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述在所述第一样本医疗图像数据对应的医疗标签和所述第一样本医疗图像数据的特征邻域内的所述样本医疗图像数据对应的医疗标签存在不同的情况下,对所述第一样本医疗图像数据对应的医疗标签进行校准,包括:
3.根据权利要求2所述的方法,其特征在于,所述计算所述第一样本医疗图像数据的特征邻域内的各个所述样本医疗图像数据对应的医疗标签的平均值,包括:
4.根据权利要求1至3任一所述的方法,其特征在于,所述样本医疗图像数据分别来自不同医疗机构的医疗图像数据集,所述医疗图像数据集中包括至少两个所述样本医疗图像数据;
5.根据权利要求4所述的方法,其特征在于,所述医疗图像数据集包括第一医疗图像数据集和第二医疗图像数据集;
6.根据权利要求5所述的方法,其特征在于,所述基于所述数据相似度和所述噪声相似度,将所述第一医疗图像数据集和所述第二医疗图像数据集进行合并,得到所述样本医疗图像数据组,包括:
7.根据权利要求5所述的方法,其特征在于,所述基于所述样本医疗图像数据的特征,计算所述第一医疗图像数据集和所述第二医疗图像数据集的数据相似度,包括:
8.根据权利要求7所述的方法,其特征在于,所述基于所述第一特征向量和所述第二特征向量,计算所述第一医疗图像数据集和所述第二医疗图像数据集的数据相似度,包括:
9.根据权利要求5所述的方法,其特征在于,所述计算所述第一医疗图像数据集和所述第二医疗图像数据集的噪声相似度,包括:
10.根据权利要求9所述的方法,其特征在于,所述计算所述第一医疗图像数据集对应的第一误差平均值和所述第二医疗图像数据集对应的第二误差平均值,包括:
11.根据权利要求9所述的方法,其特征在于,所述基于所述第一误差平均值和所述第二误差平均值,计算所述第一医疗图像数据集和所述第二医疗图像数据集的噪声相似度,包括:
12.一种标签的校准装置,其特征在于,所述装置包括:
13.一种计算机设备,其特征在于,所述计算机设备包括:处理器和存储器,所述存储器中存储有至少一段程序,所述至少一段程序由所述处理器加载并执行,以实现如权利要求1至11任一项所述的标签的校准方法。
14.一种计算机可读存储介质,其特征在于,所述可读存储介质中存储有至少一段程序,所述至少一段程序由处理器加载并执行以实现如权利要求1至11任一所述的标签的校准方法。
15.一种计算机程序产品,其特征在于,所述计算机程序产品包括至少一段程序,所述至少一段程序存储在计算机可读存储介质中;通信设备的处理器从所述计算机可读存储介质中读取所述至少一段程序,所述处理器执行所述至少一段程序,使得所述通信设备执行如权利要求1至11任一所述的标签的校准方法。