切片分割模型训练方法及装置、切片分割方法及装置

文档序号:32435541发布日期:2022-12-06 18:37阅读:49来源:国知局
切片分割模型训练方法及装置、切片分割方法及装置

1.本发明涉及计算机技术领域,尤其涉及一种切片分割模型训练方法及装置、切片分割方法及装置。


背景技术:

2.连续切片显微成像方式易于多台显微设备并行工作,被广泛应用于对样本在微观和介观尺度上的研究中。随着显微成像技术的不断发展和研究的逐渐深入,研究人员对微介观结构的观测需求越来越大,观测样本切片的体量也越来越大,切片数量已经达到上万张。对观测样本切片进行自动且精确的分割,能够有效的加速显微设备拍摄过程,节省人力和时间。
3.相关技术中,基于深度学习的切片分割模型大多是依靠数据驱动,依赖于其针对应用领域的庞大数据集的支持。然而在连续切片显微成像过程中,由于不同的样本制成的连续切片在形态上差异较大,基于已有的连续切片数据集训练的切片分割模型可能无法适用于新的连续切片分割任务。当面对新的连续切片分割任务时,直接使用现有的切片分割模型进行切片分割很难达到满意的效果,极有可能需要重新制作训练集,进而带来了人力物力的消耗。
4.因此针对切片分割模型,如何在仅使用少量样本训练的情况下,使切片分割模型达到预期性能是目前亟待解决的问题。


技术实现要素:

5.针对现有技术存在的问题,本发明提供一种切片分割模型训练方法及装置、切片分割方法及装置。
6.本发明提供一种切片分割模型训练方法,包括:
7.将第一样本集中的原始切片图像输入至初始切片分割模型,得到所述初始切片分割模型输出的与所述原始切片图像对应的至少一个中间特征图及推理值,所述推理值用于表征所述初始切片分割模型输出的分割结果属于真值的概率;所述真值用于表征所述分割结果正确;
8.基于所述推理值、所述真值及各所述中间特征图,确定所述原始切片图像针对所述初始切片分割模型的第一损失值;
9.基于所述第一损失值,从所述第一样本集中确定目标原始切片图像;利用所述目标原始切片图像对所述初始切片分割模型进行迭代训练,直至所述初始切片分割模型收敛;
10.将第二样本集中每一个切片图像输入收敛后的初始切片分割模型,得到所述收敛后的初始切片分割模型输出的各分割结果;基于各所述切片分割结果,确定各所述切片图像对应的价值量;
11.基于各所述价值量,从所述第二样本集中确定新增切片图像并添加至所述第一样
本集;利用更新后的第一样本集对所述收敛后的初始切片分割模型进行迭代训练,直至达到训练停止条件,得到目标切片分割模型。
12.可选地,所述初始切片分割模型包括全局平均池化层和全连接层;
13.所述基于所述推理值、所述真值及各所述中间特征图,确定所述原始切片图像针对所述初始切片分割模型的第一损失值,包括:
14.基于所述推理值及所述真值,确定所述原始切片图像针对所述初始切片分割模型的第二损失值;
15.将各所述中间特征图输入所述全局平均池化层,得到各所述中间特征图对应的特征向量;
16.将各所述特征向量输入所述全连接层,得到所述原始切片图像针对所述初始切片分割模型的预测损失值;
17.基于所述预测损失值及所述第二损失值,确定所述第一损失值。
18.可选地,所述基于所述预测损失值及所述第二损失值,确定所述第一损失值,包括:
19.基于所述预测损失值及所述第二损失值,利用第一损失函数计算所述第一损失值;
20.所述第一损失函数通过以下公式(1)表示:
[0021][0022]
其中,为所述第一损失值;为所述预测损失值;l为所述第二损失值。
[0023]
可选地,所述切片分割结果包括n个分割子切片、各所述分割子切片属于目标类别的后验概率及各所述分割子切片的分割掩码,所述分割掩码为二值图,所述二值图中每个像素点的像素值表示所述像素点属于所述目标类别的后验概率;
[0024]
所述基于各所述切片分割结果,确定各所述切片图像对应的价值量,包括:
[0025]
针对每一个所述切片图像,基于所述分割掩码,确定所述分割掩码的不确定度;
[0026]
基于所述分割掩码的不确定度及所述后验概率,确定所述切片图像针对所述初始切片分割模型的不确定度;
[0027]
基于所述初始切片分割模型的不确定度及所述预测损失值,确定所述价值量。
[0028]
可选地,所述基于各所述价值量,从所述第二样本集中确定新增切片图像并添加至所述第一样本集,包括:
[0029]
将所述价值量大于第一阈值的切片图像确定为所述新增切片图像;
[0030]
将所述新增切片图像添加至所述第一样本集。
[0031]
可选地,所述训练停止条件为所述初始切片分割模型的第三损失值达到第二阈值,和/或确定所述新增切片图像的数量达到第三阈值;所述第三损失值通过以下公式(2)计算得到:
[0032][0033]
其中,l为所述第三损失值;为所述第二损失值;为所述推理值;y为所述
真值;λ为超参数;为所述第一损失值。
[0034]
本发明还提供一种切片分割方法,包括:
[0035]
获取待分割切片图像;
[0036]
将所述待分割切片图像输入目标切片分割模型,得到所述目标切片分割模型输出的切片分割结果;
[0037]
其中,所述目标切片分割模型是通过所述切片分割模型训练方法训练得到的。
[0038]
本发明还提供一种切片分割模型训练装置,包括:
[0039]
第一输入模块,用于将第一样本集中的原始切片图像输入至初始切片分割模型,得到所述初始切片分割模型输出的与所述原始切片图像对应的至少一个中间特征图及推理值,所述推理值用于表征所述初始切片分割模型输出的分割结果属于真值的概率;所述真值用于表征所述分割结果正确;
[0040]
确定模块,用于基于所述推理值、所述真值及各所述中间特征图,确定所述原始切片图像针对所述初始切片分割模型的第一损失值;
[0041]
第一训练模块,用于基于所述第一损失值,从所述第一样本集中确定目标原始切片图像;利用所述目标原始切片图像对所述初始切片分割模型进行迭代训练,直至所述初始切片分割模型收敛;
[0042]
第二确定模块,用于将第二样本集中每一个切片图像输入收敛后的初始切片分割模型,得到所述收敛后的初始切片分割模型输出的各分割结果;基于各所述切片分割结果,确定各所述切片图像对应的价值量;
[0043]
第二训练模块,用于基于各所述价值量,从所述第二样本集中确定新增切片图像并添加至所述第一样本集;利用更新后的第一样本集对所述收敛后的初始切片分割模型进行迭代训练,直至达到训练停止条件,得到目标切片分割模型。
[0044]
本发明还提供一种切片分割装置,包括:
[0045]
获取模块,用于获取待分割切片图像;
[0046]
第二输入模块,用于将所述待分割切片图像输入目标切片分割模型,得到所述目标切片分割模型输出的切片分割结果;
[0047]
其中,所述目标切片分割模型是所述切片分割模型训练方法训练得到的。
[0048]
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述切片分割模型训练方法或切片分割方法。
[0049]
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述切片分割模型训练方法或切片分割方法。
[0050]
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述切片分割模型训练方法或切片分割方法。
[0051]
本发明提供的切片分割模型训练方法,通过将第一样本集中的原始切片图像输入至初始切片分割模型,得到初始切片分割模型输出的与原始切片图像对应的至少一个中间特征图及推理值,基于推理值、真值及各中间特征图,确定原始切片图像针对初始切片分割模型的第一损失值;基于第一损失值,可以从第一样本集中确定出当前初始切片分割模型还未充分学习的目标原始切片图像,即利用目标原始切片图像对初始切片分割模型进行迭
代训练,直至初始切片分割模型收敛,可以使初始切片分割模型对第一样本集中的原始切片图像进行充分学习;同时,将第二样本集中每一个切片图像输入收敛后的初始切片分割模型,得到初始切片分割模型输出的各分割结果;基于各切片分割结果,确定各切片图像对应的价值量;基于各切片图像对应的价值量,可以从第二样本集中选取对当前收敛后的初始切片分割模型具有更大价值的样本,并将其加入到第一样本集中进行迭代训练,得到目标切片分割模型,从而实现仅使用少量样本训练的情况下,使目标切片分割模型达到预期性能,降低了人力物力消耗。
附图说明
[0052]
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0053]
图1是本发明提供的切片分割模型训练方法的流程示意图之一;
[0054]
图2是本发明提供的第一损失值的确定过程示意图;
[0055]
图3是本发明提供的切片分割模型训练方法的流程示意图之二;
[0056]
图4是本发明提供的切片分割方法的流程示意图;
[0057]
图5是本发明提供的切片分割模型训练装置的结构示意图;
[0058]
图6是本发明提供的切片分割装置的结构示意图;
[0059]
图7是本发明提供的电子设备的结构示意图。
具体实施方式
[0060]
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0061]
在本发明一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明一个或多个实施例。在本发明一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本发明一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0062]
应当理解,尽管在本发明一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
[0063]
为了便于更加清晰地理解本发明各实施例,首先对一些相关的背景知识进行如下介绍。
[0064]
连续切片显微成像方式易于多台显微设备并行工作,被广泛应用于对样本在微观
和介观尺度上的研究中。连续切片显微成像方法首先将收集到的切片粘贴到晶圆上,以用于后续显微成像设备自动拍摄成像,每个晶圆可带有几百张序列切片。在显微成像过程中,首先对带有切片的晶圆拍摄,得到该晶圆的导航图。然后在该导航图上标注出每张切片的位置,通过关键点计算晶圆导航图像素坐标和显微成像设备载物台物理坐标之间的映射关系,建立导航图像素点和载物台物理坐标系之间的对应关系,便得到了晶圆上每张切片在载物台上的真实坐标。在得到每张切片的真实坐标之后,显微成像设备便可以对每张切片进行拍摄成像。
[0065]
晶圆导航图上切片的精确标注是后续显微成像设备进行拍摄成像的基础。晶圆的尺寸在分米级,而显微设备拍摄切片时的坐标精确到纳米或微米级,所以准确的切片标注将提高显微设备拍摄的速率和效果。随着显微成像技术的不断发展和研究的逐渐深入,研究人员对微介观结构的观测需求越来越大,观测样本的体量也越来越大,切片数量已经达到上万张。对晶圆导航图上的切片进行自动且精确的分割,能够有效的加速显微设备拍摄过程,节省人力和时间。
[0066]
近年来随着深度学习的迅猛发展,分割方法有了很大的进步,但是相关技术中的算法主要面向自然场景下的实例分割问题,在对连续切片分割过程中,由于切片之间具有高度的相似性,即使是褶皱、破损等异常切片与正常切片之间也会有较高的相似性,这给算法对序列切片进行正常与异常切片的识别带来了困难。另外,由于切片之间高度相似,在粘连情况下切片边界难以区分,给算法区分不同切片带来了困难。
[0067]
基于深度学习的切片分割神经网络大多是是依靠数据驱动,依赖于其针对应用领域的庞大数据集的支持。而这也为深度学习神经网络的广泛应用带来了局限性:一是庞大数据集的制作需要耗费大量的人力、物力和时间,成本非常昂贵;二是神经网络的泛化性非常受训练数据集的限制,一旦面对数据集中未曾包含的数据,网络的性能会大打折扣。在连续切片显微成像过程中,由于不同的样本制成的连续切片在形态上差异较大,在已有的连续切片数据集中训练的切片分割网络可能无法适用于新的样本的连续切片分割。当面对新的连续切片自动检测任务时,直接使用现有的神经分割网络进行切片分割很难达到满意的效果,极有可能需要重新制作数据集,这又带来了人力物力的消耗。
[0068]
因此,针对上述存在的技术问题,在对切片分割模型进行训练时,为了避免重新制作训练集,降低人力物力消耗的同时,实现仅使用少量样本训练的情况下,使切片分割模型达到预期性能,本发明提供一种切片分割模型训练方法及装置、切片分割方法及装置。
[0069]
下面结合图1对本发明提供的切片分割模型训练方法进行具体描述。图1是本发明提供的切片分割模型训练方法的流程示意图之一,参见图1所示,该方法包括步骤101-步骤105,其中:
[0070]
步骤101、将第一样本集中的原始切片图像输入至初始切片分割模型,得到所述初始切片分割模型输出的与所述原始切片图像对应的至少一个中间特征图及推理值,所述推理值用于表征所述初始切片分割模型输出的分割结果属于真值的概率;所述真值用于表征所述分割结果正确。
[0071]
需要说明的是,本发明的执行主体可以是具有对切片分割模型进行训练功能的任何电子设备,例如可以为智能手机、智能手表、台式电脑、手提电脑等任何一种。本发明实施例可应用于对切片分割模型进行训练的场景中。
[0072]
其中,切片分割模型用于对连续切片进行分割,其类型可以是对连续切片具有分割功能的任何网络模型,例如可以是卷积神经网络模型(convolutional neural networks,cnn)、循环神经网络模型(rerrent neural network,rnn)、长短期记忆网络模型(long short term memory,lstm)等等。
[0073]
在本实施例中,第一样本集中包括原始切片图像以及与原始切片图像对应的真值,其中,真值用于表征将原始切片图像输入初始切片分割模型后,初始切片分割模型理论上应输出的正确的分割结果。
[0074]
具体地,首先需要将第一样本集中的原始切片图像输入至初始切片分割模型,得到初始切片分割模型输出的与原始切片图像对应的至少一个中间特征图及推理值,其中,推理值用于表征初始切片分割模型输出的分割结果属于真值的概率,推理值与真值越接近,表示切片分割模型输出的结果越准确;需要说明的是,中间特征图是将原始切片图像输入至初始切片分割模型后,初始切片分割模型对原始切片图像进行处理后生成的。
[0075]
步骤102、基于所述推理值、所述真值及各所述中间特征图,确定所述原始切片图像针对所述初始切片分割模型的第一损失值。
[0076]
在得到初始切片分割模型输出的与原始切片图像对应的至少一个中间特征图及推理值之后,需要基于推理值、第一样本集合中原始切片图像对应的真值及各中间特征图,确定原始切片图像针对初始切片分割模型的第一损失值;
[0077]
其中,第一损失值是针对当前初始切片分割模型的最终预测损失值,用于从第一样本集中筛选当前初始切片分割模型未充分学习的目标原始切片图像。
[0078]
步骤103、基于所述第一损失值,从所述第一样本集中确定目标原始切片图像;利用所述目标原始切片图像对所述初始切片分割模型进行迭代训练,直至所述初始切片分割模型收敛。
[0079]
在本实施例中,在确定出原始切片图像针对初始切片分割模型的第一损失值之后,需要基于第一损失值,从第一样本集中确定目标原始切片图像,其中,目标原始切片图像为第一样本集中当前初始切片分割模型未充分学习的原始切片图像;
[0080]
利用目标原始切片图像对初始切片分割模型进行迭代训练,直至初始切片分割模型收敛,可以使初始切片分割模型对第一样本集中的原始切片图像进行充分学习。
[0081]
步骤104、将第二样本集中每一个切片图像输入收敛后的初始切片分割模型,得到所述收敛后的初始切片分割模型输出的各分割结果;基于各所述切片分割结果,确定各所述切片图像对应的价值量。
[0082]
在本实施例中,在得到收敛后的初始切片分割模型之后,还需要将第二样本集中每一个切片图像输入收敛后的初始切片分割模型,得到收敛后的初始切片分割模型输出的各分割结果,并基于各切片分割结果,确定各切片图像对应的价值量。
[0083]
其中,价值量用于表征第二样本集中的切片图像样本是否被收敛后的初始切片分割模型充分学习,价值量越高表示当前收敛后的初始切片分割模型对该价值量对应的切片图像样本的学习并不充分。
[0084]
步骤105、基于各所述价值量,从所述第二样本集中确定新增切片图像并添加至所述第一样本集;利用更新后的第一样本集对所述收敛后的初始切片分割模型进行迭代训练,直至达到训练停止条件,得到目标切片分割模型。
[0085]
在本实施例中,在确定出第二样本集中各切片图像对应的价值量之后,便基于各价值量,从第二样本集中确定新增切片图像并添加至第一样本集;然后利用更新后的第一样本集对收敛后的初始切片分割模型进行迭代训练,直至达到训练停止条件,得到目标切片分割模型。
[0086]
利用更新后的第一样本集对收敛后的初始切片分割模型进行迭代训练的过程如下:
[0087]
将更新后的第一样本集输入收敛后的初始切片分割模型进行第一轮训练,以使收敛后的初始切片分割模型对更新后的第一样本集进行学习;
[0088]
然后将更新后的第一样本集输入经过第一轮训练的初始切片分割模型进行第二轮训练;循环上述方法,直至迭代训练n轮之后达到训练停止条件,得到目标切片分割模型。
[0089]
需要说明的是,第二样本集中的各新增切片图像可以是未标注标签的切片图像,也可以是已标注标签的切片图像;在新增切片图像是未标注标签的切片图像的情况下,在将新增切片图像添加至第一样本集之前,需要对新增切片图像进行标注。
[0090]
本发明提供的切片分割模型训练方法,通过将第一样本集中的原始切片图像输入至初始切片分割模型,得到初始切片分割模型输出的与原始切片图像对应的至少一个中间特征图及推理值,基于推理值、真值及各中间特征图,确定原始切片图像针对初始切片分割模型的第一损失值;基于第一损失值,可以从第一样本集中确定出当前初始切片分割模型还未充分学习的目标原始切片图像,即利用目标原始切片图像对初始切片分割模型进行迭代训练,直至初始切片分割模型收敛,可以使初始切片分割模型对第一样本集中的原始切片图像进行充分学习;同时,将第二样本集中每一个切片图像输入收敛后的初始切片分割模型,得到初始切片分割模型输出的各分割结果;基于各切片分割结果,确定各切片图像对应的价值量;基于各切片图像对应的价值量,可以从第二样本集中选取对当前收敛后的初始切片分割模型具有更大价值的样本,并将其加入到第一样本集中进行迭代训练,得到目标切片分割模型,从而实现仅使用少量样本训练的情况下,使目标切片分割模型达到预期性能,降低了人力物力消耗。
[0091]
可选地,在本发明实施例一种可能的实现方式中,所述初始切片分割模型包括全局平均池化层和全连接层;
[0092]
所述基于所述推理值、所述真值及各所述中间特征图,确定所述原始切片图像针对所述初始切片分割模型的第一损失值,可以通过以下方式实现,具体包括步骤1)-步骤4):
[0093]
步骤1)、基于所述推理值及所述真值,确定所述原始切片图像针对所述初始切片分割模型的第二损失值;
[0094]
步骤2)、将各所述中间特征图输入所述全局平均池化层,得到各所述中间特征图对应的特征向量;
[0095]
步骤3)、将各所述特征向量输入所述全连接层,得到所述原始切片图像针对所述初始切片分割模型的预测损失值;
[0096]
步骤4)、基于所述预测损失值及所述第二损失值,确定所述第一损失值。
[0097]
在本实施例中,需要将推理值以及真值代入初始切片分割模型对应的损失函数中进行计算,进而得到第二损失值,即原始切片图像针对初始切片分割模型的真实损失值。
[0098]
需要说明的是,初始切片分割模型不同,其对应的损失函数也不同,例如可以是对数似然损失函数、交叉熵损失函数、本发明不对初始切片分割模型对应的损失函数进行限定。
[0099]
在实际应用中,全局平均池化层和全连接层附加在初始切片分割模型中,在实际应用中,可以将全局平均池化层和全连接层视为损失预测模块,用于对初始切片分割模型的损失值进行预测。
[0100]
首先将各中间特征图输入至全局平均池化层进行全局平均池化操作,得到每一个中间特征图对应的一维向量(即特征向量);
[0101]
将所有的一维向量输入至共享的全连接层之后,串联到一起,得到总的特征向量(即预测损失值),具体可以通过以下公式(3)表示:
[0102][0103]
其中,为预测损失值;θ
loss
为损失预测模块;h为中间特征图。
[0104]
最后,基于预测损失值及第二损失值,确定第一损失值(即针对当前初始切片分割模型的最终预测损失值)。
[0105]
可选地,所述基于所述预测损失值及所述第二损失值,确定所述第一损失值,具体可以通过以下方式实现:
[0106]
基于所述预测损失值及所述第二损失值,利用第一损失函数计算所述第一损失值;
[0107]
所述第一损失函数通过以下公式(1)表示:
[0108][0109]
其中,为所述第一损失值;为所述预测损失值;l为所述第二损失值。
[0110]
下面结合图2,对确定第一损失值的过程进行进一步说明,图2是本发明提供的第一损失值的确定过程示意图。
[0111]
如图2所示,首先将第一样本集中的原始切片图像输入至初始切片分割模型,得到初始切片分割模型输出的与原始切片图像对应的至少一个中间特征图及推理值;
[0112]
其次,将推理值以及真值代入与初始切片分割模型对应的损失函数中(即主网络损失函数),得到主网络损失值(即第二损失值);将多个中间特征图输入损失预测模块,得到预测损失值;将预测损失值及主网络损失值代入与损失预测模块对应的损失函数中(即第一损失函数),得到模块损失值(即第一损失值)。
[0113]
此处需要说明的是,在基于第一损失值,从第一样本集中确定目标原始切片图像,然后利用目标原始切片图像对初始切片分割模型进行迭代训练的同时,还需要利用目标原始切片图像对损失预测模块进行迭代训练,直至初始切片分割模型及损失预测模块收敛。
[0114]
也就是说,在初始切片分割模型包括全局平均池化层和全连接层的情况下,需要利用目标原始切片图像对包括有全局平均池化层和全连接层的初始切片分割模型进行迭代训练,直至初始切片分割模型收敛。
[0115]
在上述实施方式中,基于推理值及真值,确定原始切片图像针对初始切片分割模型的第二损失值,将各中间特征图输入全局平均池化层,得到各中间特征图对应的特征向
量,然后将各特征向量输入全连接层,得到原始切片图像针对初始切片分割模型的预测损失值,最后基于预测损失值及第二损失值,确定第一损失值;通过上述方法,能够针对当前初始切片分割模型的损失值进行预测,基于第一损失值,可以从第一样本集中判断出当前初始切片分割模型未充分学习的目标原始切片图像,从而能够确定出对当前初始切片分割模型具有更大帮助的样本,进而实现仅使用少量样本训练的情况下,使目标切片分割模型达到预期性能,降低了人力物力消耗。
[0116]
可选地,在本发明实施例一种可能的实现方式中,所述切片分割结果包括n个分割子切片、各所述分割子切片属于目标类别的后验概率及各所述分割子切片的分割掩码,所述分割掩码为二值图,所述二值图中每个像素点的像素值表示所述像素点属于所述目标类别的后验概率;
[0117]
所述基于各所述切片分割结果,确定各所述切片图像对应的价值量,可以通过以下方式实现,具体包括步骤a)-步骤c):
[0118]
步骤a)、针对每一个所述切片图像,基于所述分割掩码,确定所述分割掩码的不确定度;
[0119]
步骤b)、基于所述分割掩码的不确定度及所述后验概率,确定所述切片图像针对所述初始切片分割模型的不确定度;
[0120]
步骤c)、基于所述初始切片分割模型的不确定度及所述预测损失值,确定所述价值量。
[0121]
在本实施例中,由于初始切片分割模型对第二样本集中各切片图像的学习程度还体现在初始切片分割模型针对第二样本集中各切片图像的价值量上。
[0122]
其中,价值量是基于初始切片分割模型输出的切片分割结果的不确定度来反映的,不确定度用于表征初始切片分割模型对第二样本集中切片图像的学习程度;不确定度越高,表示初始切片分割模型对该切片图像还没有充分学习。
[0123]
在实际应用中,给定第二样本集中的切片图像x,初始切片分割模型输出的切片分割结果可以通过以下公式(4):
[0124][0125]
其中,n为初始切片分割模型共检测出切片图像x中n个分割子切片;y'为切片分割结果;为第i个分割子切片所述的类别,例如分割子切片属于完整、残缺、褶皱或污染等;为第i个分割子切片属于目标类别的后验概率;为第i个分割子切片的边界框;为第i个分割子切片的分割掩码,需要说明的是,分割掩码为一张所有像素值都在0-1之间的二值图,二值图中每个像素点的像素值表示像素点属于目标类别的后验概率;为了后续表述方便,将用pi代替;将用mi代替。
[0126]
针对第二样本集中每一个切片图像,首先需要基于该切片图像的分割掩码,确定分割掩码的不确定度,具体可以通过以下公式(5)计算得到:
[0127][0128]
其中,ui为第i个分割子切片对应的分割掩码mi的不确定度;h,w分别为第i个分割
子切片对应的分割掩码mi的高和宽;为第i个分割子切片对应的分割掩码mi在坐标(u,v)上的像素值;函数h为熵计算公式,以p代替则熵计算公式可以表示为:h(p)=-p log p-(1-p)log(1-p)。
[0129]
在确定出分割掩码的不确定度之后,需要基于分割掩码的不确定度及后验概率,确定切片图像针对初始切片分割模型的不确定度,具体可以通过以下公式(6)计算得到:
[0130][0131]
其中,uy为切片图像针对初始切片分割模型的不确定度;pi为第i个分割子切片属于目标类别的后验概率;ui为第i个分割子切片对应的分割掩码的不确定度。
[0132]
然后基于初始切片分割模型的不确定度及预测损失值,确定价值量,具体可以通过以下公式(7)计算得到:
[0133][0134]
其中,v
x
为切片图像对应的价值量;为预测损失值;η为平衡损失预测模块与分割掩码的不确定度的超参数,一般为正数。
[0135]
在上述实施方式中,针对每一个切片图像,通过基于切片分割结果中的分割掩码,确定分割掩码的不确定度,然后基于分割掩码的不确定度及后验概率,确定切片图像针对初始切片分割模型的不确定度,基于初始切片分割模型的不确定度及预测损失值,确定价值量;通过上述方法,基于各切片图像对应的价值量,可以从第二样本集中选取对当前初始切片分割模型具有更大价值的样本;即,基于价值量可以从第二样本集中确定出当前初始切片分割模型还未充分学习的样本并将其加入到第一样本集中进行迭代训练,得到目标切片分割模型,从而实现仅使用少量样本训练的情况下,使目标切片分割模型达到预期性能,降低了人力物力消耗。
[0136]
可选地,在本发明实施例一种可能的实现方式中,所述基于各所述价值量,从所述第二样本集中确定新增切片图像并添加至所述第一样本集,可以通过以下方式实现,具体包括步骤[1]-步骤[2]:
[0137]
步骤[1]、将所述价值量大于第一阈值的切片图像确定为所述新增切片图像;
[0138]
步骤[2]、将所述新增切片图像添加至所述第一样本集。
[0139]
具体地,在确定出第二样本集中各切片图像对应的价值量之后,将第二样本集中价值量大于第一阈值的切片图像确定为新增切片图像,将新增切片图像添加至第一样本集训练初始切片分割模型。
[0140]
在上述实施方式中,基于各切片图像对应的价值量,可以从第二样本集中选取对当前收敛后的初始切片分割模型具有更大价值的样本,并将其加入到第一样本集中进行训练,得到目标切片分割模型,从而实现仅使用少量样本训练的情况下,使目标切片分割模型达到预期性能,降低了人力物力消耗。
[0141]
可选地,在本发明实施例一种可能的实现方式中,所述训练停止条件为所述初始切片分割模型的第三损失值达到第二阈值,和/或确定所述新增切片图像的数量达到第三阈值;所述第三损失值通过以下公式(2)计算得到:
[0142][0143]
其中,l为所述第三损失值;为所述第二损失值;为所述推理值;y为所述真值;λ为超参数;为所述第一损失值。
[0144]
在实际应用中,在第二样本集中的切片图像未标注标签的情况下,在确定出新增切片图像的同时,还需要对新增切片图像进行标注,在对新增切片图像进行标注的成本达到预算时,即新增切片图像的数量达到第三阈值时,训练停止。
[0145]
图3是本发明提供的切片分割模型训练方法的流程示意图之二,参见图3所示,该方法包括步骤301-步骤311,其中:
[0146]
步骤301、将第一样本集中的原始切片图像输入至初始切片分割模型,得到初始切片分割模型输出的与原始切片图像对应的至少一个中间特征图及推理值。
[0147]
具体地,推理值用于表征初始切片分割模型输出的分割结果属于真值的概率;真值用于表征分割结果正确。
[0148]
步骤302、基于推理值及真值,确定原始切片图像针对初始切片分割模型的第二损失值。
[0149]
步骤303、将各中间特征图输入初始切片分割模型中的全局平均池化层,得到各中间特征图对应的特征向量。
[0150]
步骤304、将各特征向量输入初始切片分割模型中的全连接层,得到原始切片图像针对初始切片分割模型的预测损失值。
[0151]
步骤305、基于预测损失值及第二损失值,确定原始切片图像针对初始切片分割模型的第一损失值。
[0152]
步骤306、基于第一损失值,从第一样本集中确定目标原始切片图像;利用目标原始切片图像对初始切片分割模型进行迭代训练,直至初始切片分割模型收敛。
[0153]
步骤307、将第二样本集中每一个切片图像输入收敛后的初始切片分割模型,得到收敛后的初始切片分割模型输出的各分割结果;针对每一个切片图像,基于分割结果中的分割掩码,确定分割掩码的不确定度。
[0154]
步骤308、基于分割掩码的不确定度及后验概率,确定切片图像针对收敛后的初始切片分割模型的不确定度。
[0155]
步骤309、基于收敛后的初始切片分割模型的不确定度及预测损失值,确定切片图像对应的价值量。
[0156]
步骤310、将价值量大于第一阈值的切片图像确定为新增切片图像。
[0157]
步骤311、将新增切片图像添加至第一样本集,利用更新后的第一样本集对收敛后的初始切片分割模型进行迭代训练,直至达到训练停止条件,得到目标切片分割模型。
[0158]
图4是本发明提供的切片分割方法的流程示意图,参见图4所示,该方法包括步骤401-步骤402,其中:
[0159]
步骤401、获取待分割切片图像。
[0160]
步骤402、将所述待分割切片图像输入目标切片分割模型,得到所述目标切片分割模型输出的切片分割结果;
[0161]
其中,所述目标切片分割模型是通过所述切片分割模型训练方法训练得到的。
[0162]
本发明提供的切片分割方法,将待分割切片图像输入目标切片分割模型,能够实现连续切片图像的自动分割,保证了分割准确率,达到精确的连续切片图像自动分割效果。
[0163]
下面对本发明提供的切片分割模型训练装置进行描述,下文描述的切片分割模型训练装置与上文描述的切片分割模型训练方法可相互对应参照。图5是本发明提供的切片分割模型训练装置的结构示意图,如图5所示,该切片分割模型训练装置500包括:第一输入模块501、第一确定模块502、第一训练模块503、第二确定模块504及第二训练模块505,其中:
[0164]
第一输入模块501,用于将第一样本集中的原始切片图像输入至初始切片分割模型,得到所述初始切片分割模型输出的与所述原始切片图像对应的至少一个中间特征图及推理值,所述推理值用于表征所述初始切片分割模型输出的分割结果属于真值的概率;所述真值用于表征所述分割结果正确;
[0165]
第一确定模块502,用于基于所述推理值、所述真值及各所述中间特征图,确定所述原始切片图像针对所述初始切片分割模型的第一损失值;
[0166]
第一训练模块503,用于基于所述第一损失值,从所述第一样本集中确定目标原始切片图像;利用所述目标原始切片图像对所述初始切片分割模型进行训练,直至所述初始切片分割模型收敛;
[0167]
第二确定模块504,用于将第二样本集中每一个切片图像输入收敛后的初始切片分割模型,得到所述收敛后的初始切片分割模型输出的各分割结果;基于各所述切片分割结果,确定各所述切片图像对应的价值量;
[0168]
第二训练模块505,用于基于各所述价值量,从所述第二样本集中确定新增切片图像并添加至所述第一样本集;利用更新后的第一样本集对所述收敛后的初始切片分割模型进行迭代训练,直至达到训练停止条件,得到目标切片分割模型。
[0169]
本发明提供的切片分割模型训练装置,通过将第一样本集中的原始切片图像输入至初始切片分割模型,得到初始切片分割模型输出的与原始切片图像对应的至少一个中间特征图及推理值,基于推理值、真值及各中间特征图,确定原始切片图像针对初始切片分割模型的第一损失值;基于第一损失值,可以从第一样本集中确定出当前初始切片分割模型还未充分学习的目标原始切片图像,即利用目标原始切片图像对初始切片分割模型进行训练,直至初始切片分割模型收敛,可以使初始切片分割模型对第一样本集中的原始切片图像进行充分学习;同时,将第二样本集中每一个切片图像输入收敛后的初始切片分割模型,得到初始切片分割模型输出的各分割结果;基于各切片分割结果,确定各切片图像对应的价值量;基于各切片图像对应的价值量,可以从第二样本集中选取对当前收敛后的初始切片分割模型具有更大价值的样本,并将其加入到第一样本集中进行训练,得到目标切片分割模型,从而实现仅使用少量样本训练的情况下,使目标切片分割模型达到预期性能,降低了人力物力消耗。
[0170]
可选地,所述初始切片分割模型包括全局平均池化层和全连接层;
[0171]
第一确定模块502,进一步用于:
[0172]
基于所述推理值及所述真值,确定所述原始切片图像针对所述初始切片分割模型的第二损失值;
[0173]
将各所述中间特征图输入所述全局平均池化层,得到各所述中间特征图对应的特征向量;
[0174]
将各所述特征向量输入所述全连接层,得到所述原始切片图像针对所述初始切片分割模型的预测损失值;
[0175]
基于所述预测损失值及所述第二损失值,确定所述第一损失值。
[0176]
可选地,第一确定模块502,进一步用于:
[0177]
基于所述预测损失值及所述第二损失值,利用第一损失函数计算所述第一损失值;
[0178]
所述第一损失函数通过以下公式(1)表示:
[0179][0180]
其中,为所述第一损失值;为所述预测损失值;l为所述第二损失值。
[0181]
可选地,所述切片分割结果包括n个分割子切片、各所述分割子切片属于目标类别的后验概率及各所述分割子切片的分割掩码,所述分割掩码为二值图,所述二值图中每个像素点的像素值表示所述像素点属于所述目标类别的后验概率;
[0182]
第二确定模块504,进一步用于:
[0183]
针对每一个所述切片图像,基于所述分割掩码,确定所述分割掩码的不确定度;
[0184]
基于所述分割掩码的不确定度及所述后验概率,确定所述切片图像针对所述初始切片分割模型的不确定度;
[0185]
基于所述初始切片分割模型的不确定度及所述预测损失值,确定所述价值量。
[0186]
可选地,第二训练模块505,进一步用于:
[0187]
将所述价值量大于第一阈值的切片图像确定为所述新增切片图像;
[0188]
将所述新增切片图像添加至所述第一样本集。
[0189]
可选地,所述训练停止条件为所述初始切片分割模型的第三损失值达到第二阈值,和/或确定所述新增切片图像的数量达到第三阈值;所述第三损失值通过以下公式(2)计算得到:
[0190][0191]
其中,l为所述第三损失值;为所述第二损失值;为所述推理值;y为所述真值;λ为超参数;为所述第一损失值。
[0192]
下面对本发明提供的切片分割装置进行描述,下文描述的切片分割装置与上文描述的切片分割方法可相互对应参照。图6是本发明提供的切片分割装置的结构示意图,如图6所示,该切片分割装置600包括:获取模块601及输入模块602,其中:
[0193]
获取模块601,用于获取待分割切片图像;
[0194]
第二输入模块602,用于将所述待分割切片图像输入目标切片分割模型,得到所述目标切片分割模型输出的切片分割结果;
[0195]
其中,所述目标切片分割模型是通过所述切片分割模型训练方法训练得到的。
[0196]
本发明提供的切片分割装置,将待分割切片图像输入目标切片分割模型,能够实现连续切片图像的自动分割,保证了分割准确率,达到精确的连续切片图像自动分割效果。
[0197]
图7示例了一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(communications interface)720、存储器(memory)730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行切片分割模型训练方法,该方法包括:将第一样本集中的原始切片图像输入至初始切片分割模型,得到所述初始切片分割模型输出的与所述原始切片图像对应的至少一个中间特征图及推理值,所述推理值用于表征所述初始切片分割模型输出的分割结果属于真值的概率;所述真值用于表征所述分割结果正确;基于所述推理值、所述真值及各所述中间特征图,确定所述原始切片图像针对所述初始切片分割模型的第一损失值;基于所述第一损失值,从所述第一样本集中确定目标原始切片图像;利用所述目标原始切片图像对所述初始切片分割模型进行迭代训练,直至所述初始切片分割模型收敛;将第二样本集中每一个切片图像输入收敛后的初始切片分割模型,得到所述收敛后的初始切片分割模型输出的各分割结果;基于各所述切片分割结果,确定各所述切片图像对应的价值量;基于各所述价值量,从所述第二样本集中确定新增切片图像并添加至所述第一样本集;利用更新后的第一样本集对所述收敛后的初始切片分割模型进行训练,直至达到训练停止条件,得到目标切片分割模型;
[0198]
或者执行切片分割方法,该方法包括:
[0199]
获取待分割切片图像;将所述待分割切片图像输入目标切片分割模型,得到所述目标切片分割模型输出的切片分割结果;其中,所述目标切片分割模型是通过所述切片分割模型训练方法训练得到的。
[0200]
此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0201]
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的切片分割模型训练方法,该方法包括:将第一样本集中的原始切片图像输入至初始切片分割模型,得到所述初始切片分割模型输出的与所述原始切片图像对应的至少一个中间特征图及推理值,所述推理值用于表征所述初始切片分割模型输出的分割结果属于真值的概率;所述真值用于表征所述分割结果正确;基于所述推理值、所述真值及各所述中间特征图,确定所述原始切片图像针对所述初始切片分割模型的第一损失值;基于所述第一损失值,从所述第一样本集中确定目标原始切片图像;利用所述目标原始切片图像对所述初始切片分割模型进行训练,直至所述初始切片分割模型收敛;将第二样本集中每一个切片图像输入收敛后的初始切片分割模型,得到所述收敛后的
初始切片分割模型输出的各分割结果;基于各所述切片分割结果,确定各所述切片图像对应的价值量;基于各所述价值量,从所述第二样本集中确定新增切片图像并添加至所述第一样本集;利用更新后的第一样本集对所述收敛后的初始切片分割模型进行迭代训练,直至达到训练停止条件,得到目标切片分割模型;
[0202]
或者执行切片分割方法,该方法包括:
[0203]
获取待分割切片图像;将所述待分割切片图像输入目标切片分割模型,得到所述目标切片分割模型输出的切片分割结果;其中,所述目标切片分割模型是通过所述切片分割模型训练方法训练得到的。
[0204]
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的切片分割模型训练方法,该方法包括:将第一样本集中的原始切片图像输入至初始切片分割模型,得到所述初始切片分割模型输出的与所述原始切片图像对应的至少一个中间特征图及推理值,所述推理值用于表征所述初始切片分割模型输出的分割结果属于真值的概率;所述真值用于表征所述分割结果正确;基于所述推理值、所述真值及各所述中间特征图,确定所述原始切片图像针对所述初始切片分割模型的第一损失值;基于所述第一损失值,从所述第一样本集中确定目标原始切片图像;利用所述目标原始切片图像对所述初始切片分割模型进行迭代训练,直至所述初始切片分割模型收敛;将第二样本集中每一个切片图像输入收敛后的初始切片分割模型,得到所述收敛后的初始切片分割模型输出的各分割结果;基于各所述切片分割结果,确定各所述切片图像对应的价值量;基于各所述价值量,从所述第二样本集中确定新增切片图像并添加至所述第一样本集;利用更新后的第一样本集对所述收敛后的初始切片分割模型进行迭代训练,直至达到训练停止条件,得到目标切片分割模型;
[0205]
或者执行切片分割方法,该方法包括:
[0206]
获取待分割切片图像;将所述待分割切片图像输入目标切片分割模型,得到所述目标切片分割模型输出的切片分割结果;其中,所述目标切片分割模型是通过所述切片分割模型训练方法训练得到的。
[0207]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0208]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0209]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;
而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1