AI模型训练标签生成方法、训练方法、使用方法及设备

文档序号:30384106发布日期:2022-06-11 06:00阅读:401来源:国知局
AI模型训练标签生成方法、训练方法、使用方法及设备
ai模型训练标签生成方法、训练方法、使用方法及设备
技术领域
1.本发明涉及人工智能技术领域,尤其涉及医学分析人工智能技术,特别涉及ai模型训练标签生成方法、训练方法、使用方法及设备,


背景技术:

2.准确(不带噪声)的训练标签是当前构建稳健的人工智能模型的核心基础,然而生成准确的训练标签往往需要极大的人力物力。尤其是在医学分析领域,准确的训练标签往往是不存在的,因为即使是医学专家,有时也并不能对目标进行准确的标注。带噪声(不准确)的训练标签由于只需要对目标进行粗略的标注,能够大幅度有效降低生成训练人工智能模型所需标签的人力物力。然而其显而易见的缺点则,由于带噪声的训练标签中的不准确性,降低了人工智能模型的预测鲁棒性。


技术实现要素:

3.本发明的目的是提供ai模型训练标签生成方法、训练方法、使用方法及设备,基于带噪声的训练标签和样本生成更好的训练标签,从而提高ai模型预测性能。
4.根据本技术的第一个方面,提供了一种ai模型训练标签生成方法,所述ai模型用于接收输入图像并预测所述输入图像中的目标区域然后发出用特定像素值来显示所预测出的目标区域的输出图像,其包括:获得第一原始样本ns1,所述第一原始样本ns1包含第一原始样本图像is1和与所述第一原始样本图像is1对应的第一原始标签图像nls1,所述第一原始标签图像nls1上显示有第一多边形,所述第一多边形可映射到所述第一原始样本图像is1中而将所述第一原始样本图像is1划分为位于所述第一多边形内且含有噪声的第一原始样本图像目标区域和位于所述第一多边形外且含有噪声的第一原始样本图像目标外区域;获得第二原始样本ns2,所述第二原始样本ns2包含第二原始样本图像is2和与所述第二原始样本图像is2对应的第二原始标签图像nls2,所述第二原始标签图像nls2上显示有第二多边形,所述第二多边形可映射到所述第二原始样本图像is2中而将所述第二原始样本图像is2划分为位于所述第二多边形内且含有噪声的第二原始样本图像目标区域和位于所述第二多边形外且含有噪声的第二原始样本图像目标外区域;根据所述第一原始样本ns1建立第一原始样本第一新标签图像t1,所述第一原始样本第一新标签图像t1是通过将所述第一原始样本图像目标区域的像素值设为第一定值并将所述第一原始样本图像目标外区域的像素值设为第二定值而获得的;并且,根据第二原始样本ns2建立第二原始样本第一新标签图像t2,所述第二原始样本第一新标签图像t2是通过将所述第二原始样本图像目标区域的像素值设为第一定值并将所述第二原始样本图像目标外区域的像素值设为第二定值而获得的;所述第一定值与所述第二定值不同;根据所述第一原始样本ns1建立第一原始样本第二新标签图像t3,所述第一原始样本第二新标签图像t3是通过将所述第一原始样本图像is1输入经训练的第二fcn卷积神经网络后将所述第二fcn卷积神经网络输出的中间图像中像素值大于0.5的像素点的像素值调整为所述第一定值并将该中间图像中像素值小于0.5的像
素点的像素值调整为所述第二定值后获得的,所述第二fcn卷积神经网络用于以所述第二原始样本图像is2为输入且输出与所述第二原始样本图像is2尺度一致的中间图像,所述中间图像中各像素点的像素值在0-1之间,可表示趋近于所述第一定值的概率;根据所述第二原始样本ns2建立第二原始样本第二新标签图像t4,所述第二原始样本第二新标签图像t4是通过将所述第一原始样本图像is2输入经训练的第一fcn卷积神经网络然后将所述第一fcn卷积神经网络输出的中间图像中像素值大于0.5的像素点的像素值调整为所述第一定值并将该中间图像中像素值小于0.5的像素点的像素值调整为所述第二定值后获得的,所述第一fcn卷积神经网络用于以所述第一原始样本图像is1为输入且输出与所述第一原始样本图像is1尺度一致的中间图像,所述中间图像中各像素点的像素值在0-1之间,可表示趋近于所述第一定值的概率。
5.可选的,所述第一定值取值为255;所述第二定值取值为0。
6.可选的,所述输入图像为人体组织照片,所述目标区域为肿瘤阳性区域,所述输出图像为肿瘤阳性区域预测分布图。
7.可选的,所述输入图像为乳腺组织照片,所述目标区域为乳腺肿瘤阳性区域,所述输出图像为乳腺肿瘤阳性区域预测分布图。
8.可选的,所述第二fcn卷积神经网络是以所述第二原始样本图像is2为输入且以所述第二原始样本第一新标签图像t2为目标输出训练得到的,训练时,将所述第二fcn卷积神经网络的实际输出与所述目标输出构建交叉熵损失函数,采用随机梯度下降方法最小化交叉熵损失函数值,进而优化所述第二fcn卷积神经网络的参数,得到经训练的第二fcn卷积神经网络。
9.可选的,所述第一fcn卷积神经网络是以所述第一原始样本图像is1为输入且以所述第一原始样本第一新标签图像t1为目标输出训练得到的,训练时,将所述第一fcn卷积神经网络的实际输出与所述目标输出构建交叉熵损失函数,采用随机梯度下降方法最小化交叉熵损失函数值,进而优化所述第一fcn卷积神经网络的参数,得到经训练的第一fcn卷积神经网络。
10.根据本技术的第二个方面,提供了一种ai模型训练方法,所述ai模型用于接收输入图像并预测所述输入图像中的目标区域然后发出用特定像素值来显示所预测出的目标区域的输出图像,其包括:获得上述第一个方面的ai模型训练标签生成方法建立的第一原始样本第一新标签图像t1、第二原始样本第一新标签图像t2、第一原始样本第二新标签图像t3和第二原始样本第二新标签图像t4,然后构建第一训练样本和第二训练样本,所述第一训练样本包含所述第一原始样本图像is1以及与所述第一原始样本图像is1对应的所述第一原始样本第一新标签图像t1和所述第一原始样本第二新标签图像t3,所述第二训练样本包含所述第二原始样本图像is2以及与所述第二原始样本图像is2对应的所述第二原始样本第一新标签图像t2和所述第二原始样本第二新标签图像t4;使用所述第一训练样本和第二训练样本对预设fcn卷积神经网络进行多目标学习迭代训练,直至所述预设fcn卷积神经网络的训练达到设定阈值,得到所述ai模型。
11.根据本技术的第三个方面,提供了一种ai模型使用方法,应用于一种计算机设备,所述计算机设备部署有所述ai模型,所述ai模型为采用上述第二个方面的ai模型训练方法训练得到的ai模型,并且该方法包括:接收输入图像并通过所述ai模型预测所述输入图像
中的目标区域然后发出用特定像素值来显示所预测出的目标区域的输出图像。
12.根据本技术的第四个方面,提供了一种计算机设备,包括处理器,所述处理器与存储器耦合,所述存储器用于存储计算机程序或指令,所述处理器用于执行存储器中的该计算机程序或指令,使得该控制装置执行上述第一个方面的ai模型训练标签生成方法。
13.根据本技术的第五个方面,提供了一种计算机设备,包括处理器,所述处理器与存储器耦合,所述存储器用于存储计算机程序或指令,所述处理器用于执行存储器中的该计算机程序或指令,使得该控制装置执行上述第二个方面的ai模型训练方法。
14.根据本技术的第六个方面,提供了一种计算机设备,包括处理器,所述处理器与存储器耦合,所述存储器用于存储计算机程序或指令,所述处理器用于执行存储器中的该计算机程序或指令,使得该控制装置执行上述第三个方面的ai模型使用方法。
15.上述ai模型训练标签生成方法、训练方法、使用方法及设备,能够基于带噪声的训练标签和样本生成更好的训练标签,从而提高ai模型预测性能。
16.下面结合附图和具体实施方式对本技术做进一步的说明。本技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实践了解到。
附图说明
17.构成本说明书的一部分的附图用来辅助对本技术的理解,附图中所提供的内容及其在本说明书中有关的说明可用于解释本技术,但不构成对本技术的实施例的不当限定。在附图中:
18.图1为本技术实施例的一种计算机设备的结构示意图。
19.图2为本技术实施例的一种ai模型训练标签生成方法的原理示意图。
20.图3为本技术实施例的一种ai模型训练标签生成方法的流程示意图。
具体实施方式
21.下面结合附图对本技术进行清楚、完整的说明。本领域普通技术人员在基于这些说明的情况下将能够实现本技术技术方案。在结合附图对本技术进行说明前,需要特别指出的是:
22.本说明书中在包括下述说明在内的各部分中所提供的技术方案、技术特征,在不冲突的情况下,这些技术方案、技术特征可以相互组合。
23.下述说明中涉及到的内容通常仅涉及本技术的一部分实施例而不是全部实施例,因此,基于本技术的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
24.本说明书和权利要求书及有关的部分中的术语“包括”、“包含”、“具有”以及它们的任何变形,意图在于覆盖不排他的包含。
25.图1申请实施例的一种计算机设备的结构示意图。该计算机设备用于实施本技术实施例的ai模型训练标签生成方法以及ai模型训练方法。如图1所示,该计算机设备包括至少一个处理器11,至少一个存储器12和至少一个网络接口13。处理器11与存储器12与网络接口13相连,例如通过各类接口、传输线或总线相连。可选的,计算机设备还可以包括输入
设备14和输出设备15。
26.处理器11可以包括中央处理器(cpu)、数字信号处理器(dsp)、微处理器、特定集成电路(application special integrated circuit,asic)、微控制器(mcu)、现场可编程门阵列(fpga)或者用于实现逻辑运算的一个或多个集成电路。优选的,处理器11可以采用人工智能(ai)专用处理芯片,以便在下文提供的实施中提高处理速度。
27.处理器11可以用于为计算机设备实现所需的功能,例如用于对整个计算机设备进行控制、执行软件程序、处理软件程序的数据等。所述软件可以是用于实施本技术实施例的ai模型训练标签生成方法、ai模型训练方法、ai模型使用方法的软件。
28.存储器12可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器12可包括硬盘驱动器(hard disk drive,hdd)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(universal serial bus,usb)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器12可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器12可在处理器11的内部或外部。在特定实施例中,存储器12是非易失性固态存储器。在特定实施例中,存储器12包括只读存储器(rom);在合适的情况下,该rom可以是掩模编程的rom、可编程rom(prom)、可擦除prom(eprom)、电可擦除prom(eeprom)、电可改写rom(earom)或闪存或者两个或更多个以上这些组合。
29.网络接口13用于使计算机设备通过通信链路与原始样本的获取设备相连。这里的通信链路既可以是有线通信链路,也可以是无线通信链路。这里的无线通信链路可以通过支持zig-bee、蓝牙(bluetooth)、无线宽带(wi-fi)、超宽带(uwb)、通用无线分组业务(gprs)、码分多址(cdma)、长期演进(lte)或新无线(nr)等无线通信技术的无线传输网络来实现。
30.原始样本的获取设备可以通过对原始样本获取、编辑等处理获得尽可能多的原始样本,每一个原始样本应包括原始样本图像和与原始样本图像对应的原始标签图像,所述原始标签图像上显示有多边形,所述多边形可映射到所述原始样本图像中而将所述原始样本图像划分为位于所述多边形内且含有噪声的原始样本图像目标区域和位于所述多边形外且含有噪声的原始样本图像目标外区域。
31.输入设备14与处理器11通信,可以以多种方式接受用户的输入。例如,输入设备14可以是鼠标、键盘、触摸屏设备或传感器。输出设备15与处理器11通信,可以以多种方式来显示信息。例如,输出设备15可以是液晶显示器、发光二极管显示设备、阴极射线管显示设备或投影仪等。
32.图2为本技术实施例的一种ai模型训练标签生成方法的原理示意图。图3为本技术实施例的一种ai模型训练标签生成方法的流程示意图。下面结合图2-3,对本技术实施例的一种ai模型训练标签生成方法进行详细说明。
33.如图2-3所示,一种ai模型训练标签生成方法,所述ai模型用于接收输入图像并预测所述输入图像中的目标区域然后发出用特定像素值来显示所预测出的目标区域的输出图像,其包括:
34.步骤s1:获得第一原始样本ns1,所述第一原始样本ns1包含第一原始样本图像is1和与所述第一原始样本图像is1对应的第一原始标签图像nls1,所述第一原始标签图像nls1上显示有第一多边形(参见图2中第一原始标签图像nls1上的多边形),所述第一多边形可
映射到所述第一原始样本图像is1中(参见图2中第一原始样本ns1)而将所述第一原始样本图像is1划分为位于所述第一多边形内且含有噪声的第一原始样本图像目标区域和位于所述第一多边形外且含有噪声的第一原始样本图像目标外区域。
35.步骤s2:获得第二原始样本ns2,所述第二原始样本ns2包含第二原始样本图像is2和与所述第二原始样本图像is2对应的第二原始标签图像nls2,所述第二原始标签图像nls2上显示有第二多边形(参见图2中第二原始标签图像nls2上的多边形),所述第二多边形可映射到所述第二原始样本图像is2中(参见图2中第二原始样本ns2)而将所述第二原始样本图像is2划分为位于所述第二多边形内且含有噪声的第二原始样本图像目标区域和位于所述第二多边形外且含有噪声的第二原始样本图像目标外区域。
36.步骤s3:根据所述第一原始样本ns1建立第一原始样本第一新标签图像t1,所述第一原始样本第一新标签图像t1是通过将所述第一原始样本图像目标区域的像素值设为第一定值并将所述第一原始样本图像目标外区域的像素值设为第二定值而获得的;并且,根据第二原始样本ns2建立第二原始样本第一新标签图像t2,所述第二原始样本第一新标签图像t2是通过将所述第二原始样本图像目标区域的像素值设为第一定值并将所述第二原始样本图像目标外区域的像素值设为第二定值而获得的;所述第一定值与所述第二定值不同;所述第一定值建议取值为255,所述第二定值建议取值为0。
37.步骤s4:根据所述第一原始样本ns1建立第一原始样本第二新标签图像t3,所述第一原始样本第二新标签图像t3是通过将所述第一原始样本图像is1输入经训练的第二fcn卷积神经网络后将所述第二fcn卷积神经网络输出的中间图像中像素值大于0.5的像素点的像素值调整为所述第一定值并将该中间图像中像素值小于0.5的像素点的像素值调整为所述第二定值后获得的,所述第二fcn卷积神经网络用于以所述第二原始样本图像is2为输入且输出与所述第二原始样本图像is2尺度一致的中间图像,所述中间图像中各像素点的像素值在0-1之间,可表示趋近于所述第一定值的概率。
38.步骤s5:根据所述第二原始样本ns2建立第二原始样本第二新标签图像t4,所述第二原始样本第二新标签图像t4是通过将所述第一原始样本图像is2输入经训练的第一fcn卷积神经网络然后将所述第一fcn卷积神经网络输出的中间图像中像素值大于0.5的像素点的像素值调整为所述第一定值并将该中间图像中像素值小于0.5的像素点的像素值调整为所述第二定值后获得的,所述第一fcn卷积神经网络用于以所述第一原始样本图像is1为输入且输出与所述第一原始样本图像is1尺度一致的中间图像,所述中间图像中各像素点的像素值在0-1之间,可表示趋近于所述第一定值的概率。
39.其中,所述输入图像可以为人体组织照片,则:所述目标区域为肿瘤阳性区域,所述输出图像为肿瘤阳性区域预测分布图。具体的,所述输入图像可以为乳腺组织照片,则:所述目标区域为乳腺肿瘤阳性区域,所述输出图像为乳腺肿瘤阳性区域预测分布图。
40.下面以第一原始样本ns1和第二原始样本ns2为乳腺组织照片为例,对本技术实施例的上述ai模型训练标签生成方法进行进一步说明。
41.基于在医学分析领域准确的训练标签往往是不存在的客观事实,可对第一原始样本ns1和第二原始样本ns2得出如下逻辑推理结论(参见图2):
42.rg1(gr
1,1
):=g
1,1
:is1中在nls1多边形外的像素为肿瘤阴性;
43.rg2(gr
1,2
):=g
1,2
:is1中在nls1多边形内的像素为肿瘤阳性;
44.rg3(gr
1,3
):is1中在nls1多边形外的像素不全是真肿瘤阴性;
45.rg4(gr
1,4
):is1中在nls1多边形内的像素没有完全覆盖真肿瘤阳性;
46.rg5(gr
2,1
):=g
2,1
:is2中在nls2多边形内的像素为肿瘤阳性;
47.rg6(gr
2,2
):=g
2,2
:is2中在nls2多边形外的像素为肿瘤阴性;
48.rg7(gr
2,3
):is2中在nls2多边形内的像素不全是真肿瘤阳性;
49.rg8(gr
2,4
):is2中在nls2多边形外的像素没有完全覆盖真肿瘤阴性。
50.基于上述逻辑推理结论,可建立第一原始样本第一新标签图像t1、第二原始样本第一新标签图像t2、第一原始样本第二新标签图像t3和第二原始样本第二新标签图像t4。
51.第一原始样本第一新标签图像t152.1)基于逻辑推理结论rg1和rg2,保持rg1和rg2能够使得标签对真实目标具有高召回率。
53.2)于是建立了一个与is1像素长宽一致的随机二维矩阵,将t1中与nls1中标注的多边形内的区域对应的像素赋值为255,并将t1中与nls1中标注的多边形外的区域对应的像素赋值为0。
54.第二原始样本第一新标签图像t255.1)基于逻辑推理结论rg5和rg6,保持rg5和rg6能够是的标签对真实目标具有高准确率。
56.2)于是建立了一个与is2像素长宽一致的随机二维矩阵,基于逻辑推理结论rg5和rg6,将t2中与nls2中标注的多边形内的区域对应的像素赋值为255,并将t2中与nls2中标注的多边形外的区域对应的像素赋值为0。
57.基于fcn卷积神经网络建立一个图像语义分割模型,命名为ts-fcn。ts-fcn的输入为和is1或is2尺度一致的图像,输出为与其输入图像的像素长宽一致的矩阵且矩阵内的像素点的取值范围为[0,1]。
[0058]
第一原始样本第二新标签图像t3[0059]
1)基于t1和逻辑推理结论rg3和rg4,t1能够使得标签对真实目标具有高召回率但精准率较低;为此采用了如下2)-5)来弥补t1的缺点。
[0060]
2)以is2为ts-fcn的输入,并以t2为ts-fcn的目标输出;基于ts2作为ts-fcn的输入对应的ts-fcn的输出和ts-fcn的目标输出t2构建交叉熵损失函数l2;采用随机梯度下降方法最小化l2,进而优化ts-fcn的参数,得到模型ts-fcn2(即所述第二fcn卷积神经网络)。
[0061]
3)以is1为ts-fcn2的输入,并在ts-fcn2中进行前向传递,输出得到与一个is1像素长宽一致的矩阵且矩阵内的像素点的取值范围为[0,1]。
[0062]
4)对以is1为输入的ts-fcn2所对应的输出矩阵进行二值化,将大于0.5的像素点赋值为255,小于等于0.5的像素点赋值为0;
[0063]
5)最后二值化后的矩阵即为t3标签,t3弥补了t1精准率低的缺点。
[0064]
第二原始样本第二新标签图像t4[0065]
1)基于t2和逻辑推理结论rg7和rg8,t2能够使得标签对真实目标具有高精准率但召回率较低;为此采用了如下2)-5)来弥补t2的缺点。
[0066]
2)以is1为ts-fcn的输入,并以t1为ts-fcn的目标输出;基于ts1作为ts-fcn的输入对应的ts-fcn的输出和ts-fcn的目标输出t1构建交叉熵损失函数l1;采用随机梯度下降方
法最小化l1,进而优化ts-fcn的参数,得到模型ts-fcn1(即所述第一fcn卷积神经网络)。
[0067]
3)以is2为ts-fcn1的输入,并在ts-fcn1中进行前向传递,输出得到与一个is2像素长宽一致的矩阵且矩阵内的像素点的取值范围为[0,1]。
[0068]
4)对以is2为输入的ts-fcn1所对应的输出矩阵进行二值化,将大于0.5的像素点赋值为255,小于等于0.5的像素点赋值为0;
[0069]
5)最后二值化后的矩阵即为t4标签,t4弥补了t2召回率低的缺点。
[0070]
本技术实施例还提供了一种ai模型训练方法,所述ai模型用于接收输入图像并预测所述输入图像中的目标区域然后发出用特定像素值来显示所预测出的目标区域的输出图像,其包括:获得上述ai模型训练标签生成方法建立的第一原始样本第一新标签图像t1、第二原始样本第一新标签图像t2、第一原始样本第二新标签图像t3和第二原始样本第二新标签图像t4,然后构建第一训练样本和第二训练样本,所述第一训练样本包含所述第一原始样本图像is1以及与所述第一原始样本图像is1对应的所述第一原始样本第一新标签图像t1和所述第一原始样本第二新标签图像t3,所述第二训练样本包含所述第二原始样本图像is2以及与所述第二原始样本图像is2对应的所述第二原始样本第一新标签图像t2和所述第二原始样本第二新标签图像t4;使用所述第一训练样本和第二训练样本对预设fcn卷积神经网络进行多目标学习迭代训练,直至所述预设fcn卷积神经网络的训练达到设定阈值,得到所述ai模型。
[0071]
具体而言,构建第一训练样本和第二训练样本涉及对第一原始样本第一新标签图像t1、第二原始样本第一新标签图像t2、第一原始样本第二新标签图像t3和第二原始样本第二新标签图像t4的重新排列,排列方式可表达为:其中与is1对应为其目标标签组,与is2对应为其目标标签组。
[0072]
联合损失构建:其中n为样本数量,α1+α2=1,ce为交叉熵函数。
[0073]
最后,采用随机梯度下降方法最小化ul,进而优化ts-fcn的参数,得到人工智能预测模型ts-fcn-u(即所述ai模型);给定一个与is尺度一致的图像作为输入,在is-fcn-u中进行前向传递可得到一个与is像素长宽一致的矩阵且矩阵内的像素点的取值范围为[0,1],表征了is图像中对应像素预测为目标的概率。
[0074]
本技术实施例还提供了一种ai模型使用方法,应用于一种计算机设备,所述计算机设备部署有所述ai模型,所述ai模型为采用上述第二个方面的ai模型训练方法训练得到的ai模型,并且该方法包括:接收输入图像并通过所述ai模型预测所述输入图像中的目标区域然后发出用特定像素值来显示所预测出的目标区域的输出图像。
[0075]
ai模型评估策略
[0076]
通过对比当前水平的各种处理噪声样本的算法和将基于我们新生成的训练标签(t)的人工智能模型训练方法引入当前水平的各种处理噪声样本的算法,分析两种情况下在病理图像的乳腺癌分割任务上的表现,进而评估新生成的训练标签(t)对处理噪声样本的贡献。当前水平的各种处理噪声样本的算法包括baseline(直接学习),forward
(g.patrini,a.rozza,a.k.menon,r.nock,l.qu,making deep neural networks robust to label noise:a loss correction approach,in:proc.-30th ieee conf.comput.vis.pattern recognition,cvpr 2017,2017.doi:10.1109/cvpr.2017.240),boost-hard,boost-soft(s.e.reed,h.lee,d.anguelov,c.szegedy,d.erhan,a.rabinovich,training deep neural networks on noisy labels with bootstrapping,in:3rd int.conf.learn.represent.iclr 2015-work.track proc.,2015.;e.arazo,d.ortego,p.albert,n.e.o’connor,k.mcguinness,unsupervised label noise modeling and loss correction,in:36th int.conf.mach.learn.icml 2019,2019),d2l(x.ma,y.wang,m.e.houle,s.zhou,s.m.erfani,s.t.xia,s.wijewickrema,j.bailey,dimensionality-driven learning with noisy labels,in:35th int.conf.mach.learn.icml 2018,2018),sce(y.wang,x.ma,z.chen,y.luo,j.yi,j.bailey,symmetric cross entropy for robust learning with noisy labels,in:proc.ieee int.conf.comput.vis.,2019.doi:10.1109/iccv.2019.00041.),peer(y.liu,h.guo,peer loss functions:learning from noisy labels without knowing noise rates,in:37th int.conf.mach.learn.icml 2020,2020.),dt-forward(y.yao,t.liu,b.han,m.gong,j.deng,g.niu,m.sugiyama,dual t:reducing estimation error for transition matrix in label-noise learning,in:adv.neural inf.process.syst.,2020.),和nce-sce(x.ma,h.huang,y.wang,s.r.s.erfani,j.bailey,normalized loss functions for deep learning with noisy labels,in:37th int.conf.mach.learn.icml 2020,2020.)。上述引用都是已经发表的论文,根据这些引用都可以查到这些文章。
[0077]
评估数据准备
[0078]
对于基于术后切除样本的乳腺癌分割,总共收集了126个wsi(whole slide image,全数字切片图像)。在收集到的wsi中,病理学专家使用94个wsi产生噪声样本一,病理学专家使用20个wsi产生噪声样本二,其余12个wsi由病理学专家用于生成无噪声样本(nfs)。ns1和ns2都用于训练,nfs用于进行验证和测试。ns1包含2944对图像和相应的噪声标签,ns2包含1431对图像和相应的噪声标签。nfs包含242对图像和相应的准确标签,其中121对用于验证,121对用于测试。
[0079]
量化评估结果
[0080]
当前水平的各种算法的表现如表1所示,将基于不同噪声样本的一步式反绎多目标学习方法引入对应当前水平的各种算法的表现如表2所示,基于不同噪声样本的一步式反绎多目标学习方法在基于术后切除样本的乳腺癌分割上对处理噪声样本的贡献评估(表2的量化评估减去表1的量化评估)如表3所示。
[0081]
表1:
[0082]
当前水平的各种算法在基于术后切除样本的乳腺癌分割任务上的评估
[0083][0084]
表2:
[0085]
基于不同噪声样本的一步式反绎多目标学习方法引入对应当前水平的各种算法在基于术后切除样本的乳腺癌分割任务上的评估
[0086][0087]
表3:
[0088]
基于不同噪声样本的一步式反绎多目标学习方法在基于术后切除样本的乳腺癌分割任务上对处理噪声样本的贡献评估(表2的量化评估减去表1的量化评估)
[0089][0090]
本领域普通技术人员在基于上述这些说明的情况下将能够实现本技术的实施例。基于本说明书提供的上述内容,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1