图像分割模型的训练方法、装置、设备及可读存储介质

文档序号:33183284发布日期:2023-02-04 05:34阅读:26来源:国知局
图像分割模型的训练方法、装置、设备及可读存储介质

1.本技术涉及图像处理领域,特别涉及一种图像分割模型的训练方法、装置、设备及可读存储介质。


背景技术:

2.图像分割是一种从图像中分割出感兴趣目标的图像处理方法,可以应用于医学图像处理、遥感图像处理等领域。随着硬件计算能力的进步和人工智能理论的发展,基于深度学习的图像分割模型逐渐成为主流的图像分割方法。
3.现有技术中,基于深度学习的图像分割模型,可以根据已标注的训练数据和交叉熵损失函数,对待训练图像分割模型进行训练后得到。其中,训练数据包括多幅样本图像和每幅样本图像中各个像素的标签值,标签值用于指示对应像素是否为样本图像中的目标物体(感兴趣目标)所在像素。图像分割模型用于确定图像中各个像素的预测值,根据各个像素的预测值对各个像素进行分类,根据各个像素的分类结果从图像中分割出目标物体,预测值用于指示对应像素为目标物体所在像素的概率。交叉熵损失函数用于根据待训练图像分割模型确定的多幅样本图像中各个像素的预测值和标签值之间的差异,确定待训练图像分割模型的预测误差,确定的预测误差用于在模型训练过程中对待训练图像分割模型的模型参数进行更新。
4.但是,现有技术在图像分割模型的训练过程中所使用的训练数据可能存在正负样本不均衡的问题,使得训练时侧重对训练数据中正像素和负像素中某一类像素的训练而忽视另一类像素,导致训练的图像分割模型的图像分割精度较低。其中,正负样本不均衡是指训练数据包括的多幅样本图像中目标物体所在像素的数量(正像素的数量)和背景所在像素的数量(负像素的数量)之间相差较大。


技术实现要素:

5.本技术提供了一种图像分割模型的训练方法、装置、设备及可读存储介质,可以解决在图像分割模型的训练过程中所使用的训练数据的正负样本不均衡,而导致训练的图像分割模型的图像分割精度较低的问题。所述技术方案如下:
6.第一方面,提供了一种图像分割模型的训练方法,所述方法包括:
7.获取训练数据,所述训练数据包括多幅样本图像;
8.确定所述训练数据的正负样本平衡系数,所述正负样本平衡系数用于指示所述多幅样本图像中正像素的数量和负像素的数量之间的差异程度,所述正像素为所述多幅样本图像中目标物体所在像素,所述负像素为所述多幅样本图像中除所述正像素之外的其它像素;
9.根据所述训练数据和所述正负样本平衡系数对待训练图像分割模型进行训练,得到目标图像分割模型。
10.作为一个示例,所述训练数据还包括所述多幅样本图像包括的每幅样本图像中各
个像素的标签值,所述标签值用于指示对应像素是否为所述目标物体所在像素;
11.所述根据所述训练数据和所述正负样本平衡系数对待训练图像分割模型进行训练,得到目标图像分割模型,包括:
12.通过所述待训练图像分割模型,确定所述多幅样本图像包括的每幅样本图像中各个像素的预测值,所述预测值用于指示对应像素为所述目标物体所在像素的概率;
13.采用预设的损失函数,根据所述正负样本平衡系数、所述多幅样本图像包括的每幅样本图像中各个像素的标签值和预测值,确定所述待训练图像分割模型的预测误差;
14.根据所述预测误差,更新所述待训练图像分割模型的模型参数,所述目标图像分割模型为模型参数更新后的待训练图像分割模型。
15.作为一个示例,所述根据所述预测误差,更新所述待训练图像分割模型的模型参数,包括:
16.根据反向传播算法对所述预测误差进行反向传播,以更新所述待训练图像分割模型的模型参数,所述反向传播算法为随机梯度下降算法、动量优化算法或自适应矩估计算法。
17.作为一个示例,所述预设的损失函数通过如下公式表示:
[0018][0019]
其中,l为所述预设的损失函数,n为所述多幅样本图像中像素的总数量,i为所述多幅样本图像中的第i个像素,为所述正负样本平衡系数,xi为所述第i个像素的像素值,p(xi)为所述第i个像素的预测值,且p(xi)∈[0,1],yi为所述第i个像素的标签值,yi=1或yi=0。
[0020]
作为一个示例,所述获取训练数据之前,所述方法还包括:
[0021]
获取多幅原始图像;
[0022]
对所述多幅原始图像中的至少一幅第一原始图像进行预处理,得到每幅所述第一原始图像的预处理图像,所述预处理用于增强所述至少一幅第一原始图像中目标所在像素与背景所在像素的对比度;
[0023]
根据所述多幅原始图像和每幅所述第一原始图像的预处理图像,获取所述多幅样本图像。
[0024]
作为一个示例,所述对所述多幅原始图像中的至少一幅第一原始图像进行预处理,得到每幅所述第一原始图像的预处理图像,包括:
[0025]
采用sigmoid函数,对所述多幅原始图像中的每幅所述第一原始图像中的各个像素的像素值分别进行转换,得到每幅所述第一原始图像的所述预处理图像。
[0026]
作为一个示例,所述确定所述训练数据的正负样本平衡系数,包括:
[0027]
采用随机抽样方法,从所述多幅样本图像中确定抽样图像;
[0028]
根据所述抽样图像中负像素的数量与全部像素的总数量之间的比值,确定所述正负样本平衡系数。
[0029]
第二方面,提供了一种图像分割模型的训练装置,所述装置包括:
[0030]
第一获取模块,用于获取训练数据,所述训练数据包括多幅样本图像;
[0031]
确定模块,用于确定所述训练数据的正负样本平衡系数,所述正负样本平衡系数
用于指示所述多幅样本图像中正像素的数量和负像素的数量之间的差异程度,所述正像素为所述多幅样本图像中目标物体所在像素,所述负像素为所述多幅样本图像中除所述正像素之外的其它像素;
[0032]
训练模块,用于根据所述训练数据和所述正负样本平衡系数对待训练图像分割模型进行训练,得到目标图像分割模型。
[0033]
作为一个示例,训练数据还包括所述多幅样本图像包括的每幅样本图像中各个像素的标签值,所述标签值用于指示对应像素是否为所述目标物体所在像素;
[0034]
所述训练模块,还用于通过所述待训练图像分割模型,确定所述多幅样本图像包括的每幅样本图像中各个像素的预测值,所述预测值用于指示对应像素为所述目标物体所在像素的概率;
[0035]
采用预设的损失函数,根据所述正负样本平衡系数、所述多幅样本图像包括的每幅样本图像中各个像素的标签值和预测值,确定所述待训练图像分割模型的预测误差;
[0036]
根据所述预测误差,更新所述待训练图像分割模型的模型参数,所述目标图像分割模型为模型参数更新后的待训练图像分割模型。
[0037]
作为一个示例,所述图像分割模型的训练装置还包括第二获取模块、预处理模块和第三获取模块:
[0038]
所述第二获取模块,用于获取多幅原始图像;
[0039]
所述预处理模块,用于对所述多幅原始图像中的至少一幅第一原始图像进行预处理,得到每幅所述第一原始图像的预处理图像,所述预处理用于增强所述至少一幅第一原始图像中目标所在像素与背景所在像素的对比度;
[0040]
所述第三获取模块,用于根据所述多幅原始图像和每幅所述第一原始图像的预处理图像,获取所述多幅样本图像。
[0041]
作为一个示例,所述预处理模块,还用于采用sigmoid函数,对所述多幅原始图像中的每幅所述第一原始图像中的各个像素的像素值分别进行转换,得到每幅所述第一原始图像的所述预处理图像。
[0042]
作为一个示例,所述确定模块,还用于采用随机抽样方法,从所述多幅样本图像中确定抽样图像;
[0043]
根据所述抽样图像中负像素的数量与全部像素的总数量之间的比值,确定所述正负样本平衡系数。
[0044]
第三方面,提供了一种计算机设备,所述计算机设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述的图像分割模型的训练方法。
[0045]
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的图像分割模型的训练方法。
[0046]
本技术实施例提供的技术方案带来的有益效果是:
[0047]
本技术实施例中,先获取包括多幅样本图像的训练数据,再确定训练数据的正负样本平衡系数,根据训练数据和正负样本平衡系数对待训练图像分割模型进行训练,得到目标图像分割模型。其中,正负样本平衡系数用于指示多幅样本图像中正像素的数量和负像素的数量之间的差异程度。如此,在图像分割模型的训练过程中,可以根据正负样本平衡
系数平衡多幅样本图像中正像素和负像素之间的数量差异,避免训练时侧重对正像素和负像素中某一类像素的训练而忽视另一类像素的问题,提高训练后得到的图像分割模型的图像分割精度。
附图说明
[0048]
为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0049]
图1是本技术实施例提供的一种图像分割模型的训练方法的流程图;
[0050]
图2是本技术实施例提供的一种预处理前后的图像的像素分布的示意图;
[0051]
图3是本技术实施例提供的一种通过目标图像分割模型对图像进行分割后得到的目标分割图像的示意图;
[0052]
图4是本技术实施例提供的一种图像分割模型的训练装置的结构示意图;
[0053]
图5为本技术实施例提供的一种计算机设备的结构示意图。
具体实施方式
[0054]
为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施方式作进一步地详细描述。
[0055]
应当理解的是,本技术提及的“多个”是指两个或两个以上。在本技术的描述中,除非另有说明,“/”表示或的意思,比如,a/b可以表示a或b;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,比如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,为了便于清楚描述本技术的技术方案,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。
[0056]
在对本技术实施例进行详细地解释说明之前,先对本技术实施例的应用场景予以说明。
[0057]
本技术实施例提供的图像分割模型的训练方法用于训练得到目标图像分割模型。目标图像分割模型用于从图像中分割出感兴趣目标,可以应用于医学图像处理、遥感图像处理等场景。比如,目标图像分割模型可以确定一幅图像中各个像素的预测值,根据各个像素的预测值对各个像素进行分类,根据各个像素的分类结果将一幅图像划分成背景区域和目标区域,目标区域为待分割目标物体所在的区域。比如,在医学图像处理的场景中,可以利用目标图像分割模型从医学图像中分割出感兴趣目标物体所在的目标区域,以辅助确定病人的身体状况。
[0058]
作为一个示例,心脑血管疾病是心脏血管和脑血管疾病的统称,是一种严重威胁人类,特别是中老年人健康的常见疾病。为了快速地评估心脑血管,可以通过目标图像分割模型对医学图像中的心脑血管(目标物体)进行图像分割,以辅助医生作出诊断,提高医生的工作效率,快速确定病人的身体状况。
[0059]
现有技术中,可以根据已标注的训练数据和交叉熵损失函数,对待训练图像分割模型进行训练后得到目标图像分割模型。但是,由于训练数据可能存在正负样本不均衡的问题,使得训练时侧重对训练数据中正像素和负像素中某一类像素的训练而忽视另一类像素,因此可能导致训练后得到的图像分割模型的图像分割精度较低。其中,正负样本不均衡是指训练数据包括的多幅样本图像中目标物体所在像素的数量(正像素的数量)和背景所在像素的数量(负像素的数量)之间相差较大,即可以是指单幅样本图像中正像素和负像素之间的数量的差异性,或者是指不同样本图像之间正像素或负像素的数量的差异性。
[0060]
基于此,本技术实施例提出一种图像分割模型的训练方法,可以先确定训练数据的正负样本平衡系数,根据训练数据和正负样本平衡系数对待训练图像分割模型进行训练,得到目标图像分割模型。如此,在图像分割模型的训练过程中,可以通过正负样本平衡系数平衡训练数据包括的多幅样本图像中正像素和负像素之间的数量差异,避免训练时侧重对正像素和负像素中某一类像素的训练而忽视另一类像素的问题,提高训练的图像分割模型的图像分割精度。
[0061]
请参考图1,图1是本技术实施例提供的一种图像分割模型的训练方法的流程图。该方法可以应用于计算机设备中,计算机设备可以为终端、服务器或嵌入式设备等,终端可以为台式机或平板电脑等。该方法包括如下步骤:
[0062]
步骤101,计算机设备获取训练数据,训练数据包括多幅样本图像。
[0063]
其中,训练数据是指用于对待训练图像分割模型进行训练的数据,每幅样本图像包括对应的目标物体,目标物体为期望从对应样本图像中分割出来的待分割物体,
[0064]
其中,训练数据还包括多幅样本图像包括的每幅样本图像中各个像素的标签值,标签值用于指示对应像素是否为目标物体所在像素,标签值可以为0或1。比如,标签值指示对应像素的期望分类结果,对于一幅样本图像中标签值为1的像素,该像素为目标物体所在的像素,即将该像素分类为目标物体所在的像素;对于一幅样本图像中标签值为0的像素,该像素不为目标物体所在像素,该像素为该样本图像中除目标物体所在像素之外的其它像素,即为该样本图像中背景所在的像素。
[0065]
比如,样本图像可以为医学图像处理场景中的医学图像,如ct(computed tomography,计算机断层扫描)图像、超声图像或mr(magnetic resonance,核磁共振)图像等,目标物体可以为心脑血管、结节、瘤等,从样本图像中分割出目标物体即为从样本图像中的分割出心脑血管、结节、瘤等区域(目标区域)。
[0066]
作为一个示例,训练数据可以为从网络等渠道采集的已经构建好的第一数据集,已经构建好的第一数据集包括多幅样本图像和每幅样本图像中各个像素的标签值。
[0067]
作为另一个示例,计算机设备获取训练数据之前,计算机设备可以先获取多幅原始图像,对多幅原始图像中的至少一幅第一原始图像进行预处理,得到每幅第一原始图像的预处理图像,即得到与至少一幅第一原始图像一一对应的至少一幅预处理图像,根据多幅原始图像和每幅第一原始图像的预处理图像,获取多幅样本图像。其中,至少一幅第一原始图像为多幅原始图像中的全部或部分图像,预处理用于对至少一幅第一原始图像进行图像校正,增强至少一幅第一原始图像中目标所在像素与背景所在像素的对比度。比如,相对于每幅第一原始图像,每幅第一原始图像的预处理图像中目标物体所在像素和背景所在像素之间的像素值的差异较大,具有分布更加广阔的像素值区间,使得将预处理图像作为待
训练图像分割模型的输入时,模型的预测值更加准确,有利于待训练图像分割模型对像素进行分类,进而可以提高模型的图像分割精度。
[0068]
比如,对多幅原始图像中的至少一幅第一原始图像进行预处理之前,计算机设备根据预设规则,从多幅原始图像中确定预设数量的原始图像,确定的预设数量的原始图像为至少一幅第一原始图像。比如,预设规则为预先设置的抽取图像的条件,预设数量为预先设置的数值。譬如,预设规则为从多幅原始图像中随机抽取预设数量的原始图像。
[0069]
比如,计算机设备采用sigmoid函数,对多幅原始图像中的每幅第一原始图像中的各个像素的像素值分别进行转换,得到每幅第一原始图像的预处理图像。其中,预处理图像为对对应第一原始图像的各个像素的像素值进行转换后得到的图像。譬如,计算机设备采用sigmoid函数,通过如下公式(1)对每幅第一原始图像中的各个像素的像素值分别进行转换:
[0070][0071]
其中,x为每幅第一原始图像中的任一像素的像素值,s(x)为采用sigmoid函数对像素值为x的像素进行像素值转换后的对应像素的像素值。
[0072]
作为一个示例,请参考图2,图2是本技术实施例提供的一种预处理前后的图像的像素分布的示意图。如图2所示,图2中的(a)图是至少一幅第一原始图像中的任一第一原始图像,该任一第一原始图像为冠脉图像(医学图像),目标物体为血管。图2中的(b)图是该任一第一原始图像的像素分布图。图2中的(c)图是采用sigmoid函数,对该任一第一原始图像中的各个像素值分别进行转换后得到的与该任一第一原始图像对应的预处理图像。图2中的(d)图是与该任一第一原始图像对应的预处理图像的像素分布图。在图2中的(b)图和图2中的(d)图中,横坐标为像素值,纵坐标为对应图像中像素值为横坐标对应像素值的像素数量与对应图像中像素的总数量之间的比值。
[0073]
从图2中的(b)图可以得出,该任一第一原始图像的像素值分布区间狭小,区间紧凑,像素值衔接紧密,即该任一第一原始图像中血管所在像素(目标区域)和非血管所在像素(背景区域)之间的像素值的差异较小。从图2中的(d)图中可以得出,与该任一第一原始图像对应的预处理图像的像素值区间分布更为广阔,不同像素值之间间隔明显,即预处理图像中血管所在像素和非血管所在像素之间的像素值差异增大,这有利于待训练图像分割模型对像素进行分类,进而可以提高模型的图像分割精度。
[0074]
比如,计算机设备获取多幅原始图像之后,还获取多幅原始图像包括的每幅原始图像中各个像素的标签值,标签值为对每幅原始图像分别进行标注后得到的数值。譬如,多幅原始图像为通过医院的医学图像库等渠道获取的图像,原始图像中各个像素的标签值可以为人为和/或计算机设备对原始图像进行标注后得到,即获取多幅原始图像包括的每幅原始图像中各个像素的标签值之前,人为和/或计算机设备先确定每幅原始图像中各个像素的标签值;或者,多幅原始图像为通过网络等渠道采集的已经构建好的第二数据集中包括的图像,已经构建好的第二数据集包括多幅原始图像和每幅原始图像中各个像素的标签值,计算机设备可以从第二数据集中获取每幅原始图像中各个像素的标签值。
[0075]
作为一个示例,根据每幅原始图像中各个像素的位置,可以确定对应像素的标签值。比如,人为先通过人眼从每幅原始图像中观测、标注出目标物体所在区域的边界像素
点;然后计算机设备获取包括边界像素点的每幅原始图像,根据每幅原始图像中各个像素的位置,确定每幅原始图像中边界像素点的像素位置,即确定每幅原始图像中与目标区域对应的像素位置,将每幅原始图像中与目标区域对应的像素位置指示的像素(目标区域所在像素)的像素值设置为255,将每幅原始图像中除目标区域对应的像素位置指示的像素之外的其他像素(背景区域所在像素)的像素值位置为0,设置像素值后的原始图像为标签图像;之后计算机设备对标签图像中各个像素的像素值除以255,得到标签图像中各个像素的标签值,即得到每幅原始图像中各个像素的标签值,标签值为0或1。
[0076]
比如,计算机设备对多幅原始图像中的至少一幅第一原始图像进行预处理,得到每幅第一原始图像的预处理图像之后,还获取每幅第一原始图像的预处理图像中各个像素的标签值。其中,每幅预处理图像中各个像素的标签值可以为对应第一原始图像中对应像素的标签值;或者,标签值为对每幅预处理图像分别进行标注后得到的数值。
[0077]
作为一个示例,对于至少一幅第一原始图像包括的任一第一原始图像,采用sigmoid函数,对该任一第一原始图像中的第一像素的像素值y进行转换后得到对应预处理图像中第二像素的像素值s(y),第一像素在该任一第一原始图像中的像素位置等于第二像素在对应预处理图像中的像素位置,则对应预处理图像中与第一像素对应的第二像素的标签值可以为该任一第一原始图像中第一像素的标签值;或者,第二像素的标签值为对对应预处理图像进行标注后得到的数值,即计算机设备获取每幅第一原始图像的预处理图像中各个像素的标签值之前,人为和/或计算机设备先确定对应预处理图像中各个像素的标签值。其中,第一像素为该任一第一原始图像中的任一像素。
[0078]
比如,计算机设备将多幅原始图像、每幅第一原始图像的预处理图像中的全部或部分图像确定为多幅样本图像,本技术实施例对此不做限定。另外,每幅原始图像中各个像素的标签值或每幅预处理图像中各个像素的标签值为对应样本图像的标签值。
[0079]
步骤102,计算机设备确定训练数据的正负样本平衡系数,正负样本平衡系数用于指示多幅样本图像中正像素的数量和负像素的数量之间的差异程度。
[0080]
其中,正像素为多幅样本图像中目标物体所在像素,负像素为多幅样本图像中除正像素之外的其它像素,即负像素为多幅样本图像中背景所在像素。
[0081]
比如,计算机设备采用随机抽样方法,确定训练数据的正负样本平衡系数。譬如,计算机设备先采用随机抽样方法,从多幅样本图像中确定抽样图像,再根据抽样图像中负像素的数量与全部像素的总数量之间的比值,确定正负样本平衡系数。其中,抽样图像可以为多幅样本图像中的一幅样本图像或预设抽样数量的样本图像,预设抽样数量为预先设置的数值,随机抽样方法为等距随机抽样方法、简单随机抽样方法和分层随机抽样方法中的一种或多种,本技术实施例对此不做限定。如此,由于抽样图像的随机性,确定的正负样本平衡系数可以较为真实且具有代表性的指示多幅样本图像中正像素和负像素的数量的差异或分布,避免训练时侧重对正像素和负像素中某一类像素的训练而忽视另一类像素。
[0082]
比如,正负样本平衡系数等于抽样图像中负像素的数量与全部像素的总数量之间的比值。
[0083]
比如,随机抽样方法为等距随机抽样方法,计算机设备可以先根据多幅样本图像的图像数量和预设抽样数量确定抽样间隔,再以抽样间隔为单位,将多幅样本图像划分为多个单元,多个单元中的每个单元包括至少一幅样本图像,之后从多个单元中的每个单元
中,随机抽取一幅样本图像作为抽样图像。
[0084]
步骤103,计算机设备根据训练数据和正负样本平衡系数对待训练图像分割模型进行训练,得到目标图像分割模型。
[0085]
其中,目标图像分割模型用于确定图像中各个像素的预测值,根据各个像素的预测值对各个像素进行分类,根据各个像素的分类结果从图像中分割出目标物体。
[0086]
比如,计算机设备根据训练数据和正负样本平衡系数对待训练图像分割模型进行训练,得到目标图像分割模型的具体实现过程可以包括如下步骤:
[0087]
步骤1031,计算机设备通过待训练图像分割模型,确定多幅样本图像包括的每幅样本图像中各个像素的预测值。
[0088]
其中,预测值用于指示对应像素为目标物体所在像素的概率,预测值指示对应像素的预测分类结果。比如,预测值大于或等于概率阈值的像素为目标物体所在的像素,预测值小于概率阈值的像素为背景所在的像素,概率阈值为预先设置的数值。
[0089]
其中,预测值是与待训练图像分割模型的模型参数有关的参数,也即是,预测值是根据待训练图像分割模型的模型参数确定的,待训练图像分割模型的模型参数不同,通过待训练图像分割模型确定的预测值不同。对待训练图像分割模型进行训练,即为确定较优的模型参数,从而确定每幅样本图像中各个像素的较为准确的预测值,进而得到各个像素较为准确的分类结果,根据各个像素较为准确的分类结果从每幅样本图像中较为精确地分割出目标物体。
[0090]
比如,将多幅样本图像和每幅样本图像中各个像素的标签值作为待训练图像分割模型的输入,通过待训练图像分割模型的模型参数确定每幅样本图像中各个像素的预测值,进而根据各个像素的预测值对各个像素进行分类。
[0091]
比如,对于多幅样本图像包括的第一样本图像中的第i个像素,第一样本图像为多幅样本图像中的任一幅,第i个像素为第一样本图像中的任一个像素,若第i个像素的标签值yi等于1,则第i个像素的预测值p(xi)可以通过如下公式(2)确定:
[0092][0093]
其中,yi=1指示第i个像素的标签值为1,xi为第i个像素的像素值,p(xi)为第i个像素的预测值,(w,b)为待训练图像分割模型的模型参数,w为待训练图像分割模型中对应层网络的权重参数,b为待训练图像分割模型中对应层网络的偏置参数。
[0094]
比如,对于多幅样本图像包括的第一样本图像中的第i个像素,若第i个像素的标签值yi等于0,则第i个像素的预测值p(xi)可以通过如下公式(3)确定:
[0095][0096]
其中,yi=0指示第i个像素的标签值为0,xi为第i个像素的像素值,p(xi)为第i个像素的预测值,(w,b)为待训练图像分割模型的模型参数。
[0097]
需要说明的是,上述公式(2)和公式(3)中的(w,b)仅指示模型参数,而不作为对模型参数的数量的限定。比如,待训练图像分割模型包括多层网络,且多层网络中的至少一层网络均存在对应的模型参数(w,b),而对待训练图像分割模型的模型参数进行更新,即为对待训练图像分割模型包括的至少一层网络中每一层网络的模型参数(w,b)分别进行更新。
[0098]
另外,上述公式(2)中的为第一样本图像中标签值等于1的第i个像素的像素值xi进行逻辑回归的过程,上述公式(3)中的为第一样本图像中标签值等于0的第i个像素的像素值xi进行逻辑回归的过程。
[0099]
作为一个示例,将上述公式(2)和公式(3)进行合并,可以确定多幅样本图像包括的每幅样本图像中各个像素的预测值。其中,多幅样本图像包括的每幅样本图像中各个像素的预测值可以通过如下公式(4)确定:
[0100]
p(y|x)=p(x)y(1-p(x))
1-y
(4)
[0101]
其中,y为多幅样本图像包括的每幅样本图像中各个像素的标签值,标签值为0或1,且y={y1,y2,

,yn},y1、y2、

、yn为多幅样本图像包括的每幅样本图像中各个像素的标签值,n为多幅样本图像中像素的总数量,x为多幅样本图像包括的每幅样本图像中任一像素的像素值,y中存在与像素值为x的像素的标签值,p(x)为像素值为x的像素的预测值。
[0102]
作为一个示例,待训练图像分割模型可以为采用深度学习方法进行图像分割的模型。比如,待训练图像分割模型可以为采用u-net网络、segnet网络或deeplab网络等的模型,本技术实施例对此不做限定。
[0103]
譬如,待训练图像分割模型为采用u-net网络的模型,u-net网络由卷积层、最大池化层(下采样)和反卷积层(上采样)等不同层网络组成。其中,经过多次下采样后的低分辨率信息,能够提供目标物体在整个图像中上下文的语义信息,可反映目标物体所在像素和背景所在像素之间的特征,有助于对像素进行分类,进而有利于从图像中分割出目标物体;而经过上采样的拼接操作可以得到高分辨率信息,即图像的局部信息,能够为图像分割提供更加精细的特征,如梯度等信息,有助于对局部像素进行分类,以确定目标所在像素和背景所在像素之间的边界,进而有利于从图像中分割出目标物体。
[0104]
步骤1032,计算机设备采用预设的损失函数,根据正负样本平衡系数、多幅样本图像包括的每幅样本图像中各个像素的标签值和预测值,确定待训练图像分割模型的预测误差。
[0105]
其中,预设的损失函数为预先设计好的函数,比如为改进后的交叉熵损失函数,且本技术实施例中预设的损失函数(改进后的交叉熵损失函数)包括正负样本平衡系数,确定的待训练图像分割模型的预测误差是指在预设的损失函数中带入正负样本平衡系数、多幅样本图像包括的每幅样本图像中各个像素的标签值和预测值后,得到的数值。
[0106]
需要说明是,由于本技术实施例中的预设的损失函数包括正负样本平衡系数,因此在图像分割模型的训练过程中,可以根据预设的损失函数包括的正负样本平衡系数平衡多幅样本图像中正像素和负像素之间的数量差异,避免预设的损失函数侧重根据正像素或负像素确定模型的预测误差,提高根据损失函数确定的预测误差的准确性,进而避免侧重根据正像素和负像素中某一类像素的预测误差更新待训练图像分割模型的模型参数,即避免训练时侧重对正像素和负像素中某一类像素的训练而忽视另一类像素的问题,提高训练后得到的图像分割模型的图像分割精度。
[0107]
比如,预设的损失函数可以通过如下公式(5)表示:
[0108][0109]
其中,l为预设的损失函数,n为多幅样本图像中像素的总数量,i为多幅样本图像中的第i个像素,为正负样本平衡系数,xi为第i个像素的像素值,p(xi)为第i个像素的预测值,且p(xi)∈[0,1],yi为第i个像素的标签值,yi=1或yi=0,p(xi)与yi相对应,p(xi)与待训练图像分割模型的模型参数(w,b)有关,p(xi)可以通过上述公式(2)-公式(4)确定。
[0110]
如此,计算机设备可以根据上述公式(5),得到待训练图像分割模型的预测误差。
[0111]
通过上述公式(5)可以得出,预设的损失函数包括正负样本平衡系数,若多幅样本图像中第i个像素的标签值为1(正像素),则将第i个像素的预测值p(xi)乘以(正负样本平衡系数),得到多幅样本图像中正像素的损失函数若多幅样本图像中第i个像素的标签值为0(负像素),则将第i个像素的预测值1-p(xi)乘以(1减去正负样本平衡系数),得到多幅样本图像中负像素的损失函数如此,在使用损失函数确定预测误差时,可以根据损失函数包括的正负样本平衡系数平衡多幅样本图像中正像素和负像素之间的数量差异,避免损失函数侧重根据正像素或负像素确定模型的预测误差。
[0112]
步骤1033,计算机设备根据预测误差,更新待训练图像分割模型的模型参数,目标图像分割模型为模型参数更新后的待训练图像分割模型。
[0113]
需要说明的是,由于预设的损失函数包括的正负样本平衡系数可以平衡多幅样本图像中正像素和负像素之间的数量差异,即通过本技术实施例提供的损失函数确定的预测误差较为准确,因此根据预测误差更新待训练图像分割模型的模型参数后,得到的目标图像分割模型的图像分割精度较高。
[0114]
比如,计算机设备根据反向传播算法对预测误差进行反向传播,以更新待训练图像分割模型的模型参数,反向传播算法用于根据预测误差对待训练图像分割模型的模型参数进行反向梯度优化,反向传播算法可以为随机梯度下降算法、动量优化算法或自适应矩估计算法等,本技术实施例对此不做限定。
[0115]
作为一个示例,反向传播算法为随机梯度下降算法,预设的损失函数为待训练图像分割模型的优化目标,更新待训练图像分割模型的模型参数即为对损失函数进行关于模型参数的求导。比如,计算机设备确定预测误差是否大于或等于误差阈值,若确定预测误差大于或等于误差阈值,则根据待训练图像分割模型的各层网络之间的顺序,对公式(5)的损失函数分别进行关于每层网络内的模型参数(w和b)的迭代求导,分别得到每层网络的模型参数的梯度最优值,将得到的梯度最优值作为待训练图像分割模型的每层网络的模型参数,得到模型参数更新后的待训练图像分割模型。然后跳转至步骤1031,通过模型参数更新后的待训练图像分割模型,确定预测值,进而确定新的预测误差,并确定新的预测误差是否大于或等于误差阈值。若确定新的预测误差大于或等于误差阈值,则再次对公式(5)分别进行关于每层网络内的模型参数的迭代求导,分别得到每层网络的模型参数的梯度最优值,再次跳转至步骤1031,如此循环往复,直至预测误差小于误差阈值,将该情况下的待训练图
像分割模型确定为目标图像分割模型,目标图像分割模型的模型参数可以称为目标模型参数。其中,误差阈值为预先设置的数值。
[0116]
当然,也可以在满足其他训练结束条件时停止训练,本技术实施例对此不作限定。比如,根据训练次数确定是否停止训练,若步骤1031-步骤1033的执行次数大于最大次数,则停止训练,将这种情况下的待训练图像分割模型确定为目标图像分割模型,最大次数为预先设置的数值;或者,确定本次得到的每层网络的模型参数(比如权重参数w)的梯度最优值,与上一次得到的对应层网络的模型参数的梯度最优值之间的差值小于更新阈值的层数,若确定的层数小于层数阈值,则确定损失函数收敛,停止训练,将这种情况下的待训练图像分割模型确定为目标图像分割模型,更新阈值和层数阈值为预先设置的数值。
[0117]
作为一个示例,对公式(5)的损失函数分别进行关于每层网络内的模型参数的迭代求导,分别得到每层网络的模型参数的梯度最优值具有一定顺序。比如,待训练图像分割模型包括第一层网络和第二层网络,第一层网络对应的模型参数为第一模型参数,第二层网络对应的模型参数为第二模型参数,步骤102通过待训练图像分割模型得到预测值时,先在第一层网络对多幅样本图像分别进行处理,然后将第一层网络的输出作为第二层网络的输入,并将第二层网络的输出确定为预测值。这种情况下,对公式(5)分别进行关于每层网络的模型参数的求导是指对公式(5)先进行关于第二层网络模型参数的求导,得到第二层网络的模型参数的梯度最优值,然后将第二层网络的模型参数的梯度最优值带入公式(5),对带入第二层网络的模型参数的梯度最优值的公式(5)进行关于第一层网络模型参数的求导,得到第一层网络的模型参数的梯度最优值。
[0118]
作为一个示例,计算机设备也可以从多幅样本图像中依次抽取部分样本图像,依次根据抽取的部分样本图像和正负样本平衡系数对待训练图像分割模型进行训练,得到目标图像分割模型。
[0119]
作为一个示例,计算机设备根据训练数据和正负样本平衡系数对待训练图像分割模型进行训练,得到目标图像分割模型之后,还获取验证数据,通过验证数据验证目标图像分割模型,即对目标图像分割模型进行评估,评估目标图像分割模型的图像分割精度。若评估的图像分割精度较低时,则再次进行训练。其中,验证数据包括多幅验证图像和每幅验证图像中各个像素的标签值,验证数据包括的验证图像和训练数据包括的样本图像,为在不同条件下采集的包括相同目标物体的图像,比如为不同时间或不同病人等条件下采集的血管的图像。
[0120]
比如,计算机设备根据训练数据和正负样本平衡系数对待训练图像分割模型进行训练,得到目标图像分割模型之后,可以通过目标图像分割模型确定待分割图像中各个像素的预测值,根据各个像素的预测值对各个像素进行分类,根据各个像素的分类结果从待分割图像中分割出目标物体,得到目标分割图像。比如,计算机设备将预测值大于或等于概率阈值的像素确定为目标物体所在的像素,预测值小于概率阈值的像素确定为背景所在的像素,之后将目标物体所在像素的像素值设置为1,将背景所在像素的像素值设置为0,设置像素值后的待分割图像为目标分割图像。
[0121]
作为一个示例,请参考图3,图3是本技术实施例提供的一种通过目标图像分割模型对图像进行分割后得到的目标分割图像的示意图。如图3所示,图3中的(a)图是第一待分割图像,第一待分割图像为冠脉图像(医学图像),目标物体为血管,图3中的(b)图是通过目
标图像分割模型对第一待分割图像进行分割后得到的目标分割图像,图3中的(c)图是第二待分割图像,图3中的(d)图是通过目标图像分割模型对第二待分割图像进行分割后得到的目标分割图像。另外,由图3可知,目标图像分割模型可以较为准确地从待分割图像中分割出目标物体。
[0122]
本技术实施例中,先获取包括多幅样本图像的训练数据,再确定训练数据的正负样本平衡系数,根据训练数据和正负样本平衡系数对待训练图像分割模型进行训练,得到目标图像分割模型。其中,正负样本平衡系数用于指示多幅样本图像中正像素的数量和负像素的数量之间的差异程度。如此,在图像分割模型的训练过程中,可以根据正负样本平衡系数平衡多幅样本图像中正像素和负像素之间的数量差异,避免训练时侧重对正像素和负像素中某一类像素的训练而忽视另一类像素的问题,提高训练后得到的图像分割模型的图像分割精度。
[0123]
请参考图4,图4是本技术实施例提供的一种图像分割模型的训练装置的结构示意图。该图像分割模型的训练装置可以由软件、硬件或者两者的结合实现成为计算机设备的部分或者全部,该计算机设备可以为下文图5所示的计算机设备。参见图4,该图像分割模型的训练装置包括:第一获取模块401、确定模块402和训练模块403:
[0124]
第一获取模块401,用于获取训练数据,训练数据包括多幅样本图像;
[0125]
确定模块402,用于确定训练数据的正负样本平衡系数,正负样本平衡系数用于指示多幅样本图像中正像素的数量和负像素的数量之间的差异程度,正像素为多幅样本图像中目标物体所在像素,负像素为多幅样本图像中除正像素之外的其它像素;
[0126]
训练模块403,用于根据训练数据和正负样本平衡系数对待训练图像分割模型进行训练,得到目标图像分割模型。
[0127]
作为一个示例,训练数据还包括多幅样本图像包括的每幅样本图像中各个像素的标签值,标签值用于指示对应像素是否为目标物体所在像素;
[0128]
训练模块403,还用于通过待训练图像分割模型,确定多幅样本图像包括的每幅样本图像中各个像素的预测值,预测值用于指示对应像素为目标物体所在像素的概率;
[0129]
采用预设的损失函数,根据正负样本平衡系数、多幅样本图像包括的每幅样本图像中各个像素的标签值和预测值,确定待训练图像分割模型的预测误差;
[0130]
根据预测误差,更新待训练图像分割模型的模型参数,目标图像分割模型为模型参数更新后的待训练图像分割模型。
[0131]
作为一个示例,图像分割模型的训练装置还包括第二获取模块、预处理模块和第三获取模块:
[0132]
第二获取模块,用于获取多幅原始图像;
[0133]
预处理模块,用于对多幅原始图像中的至少一幅第一原始图像进行预处理,得到每幅第一原始图像的预处理图像,预处理用于增强至少一幅第一原始图像中目标所在像素与背景所在像素的对比度;
[0134]
第三获取模块,用于根据多幅原始图像和每幅第一原始图像的预处理图像,获取多幅样本图像。
[0135]
作为一个示例,预处理模块,还用于采用sigmoid函数,对多幅原始图像中的每幅第一原始图像中的各个像素的像素值分别进行转换,得到每幅第一原始图像的预处理图
像。
[0136]
作为一个示例,确定模块402,还用于采用随机抽样方法,从多幅样本图像中确定抽样图像;
[0137]
根据抽样图像中负像素的数量与全部像素的总数量之间的比值,确定正负样本平衡系数。
[0138]
作为一个示例,图像分割模型的训练装置还包括第三确定模块和第四确定模块:
[0139]
第三确定模块,用于采用随机抽样方法,从多幅样本图像中确定抽样图像;
[0140]
第四确定模块,用于根据抽样图像中负像素的数量与全部像素的总数量之间的比值,确定正负样本平衡系数。
[0141]
作为一个示例,图像分割模型的训练装置还包括第二获取模块、和第四确定模块、预处理模块和第三获取模块:
[0142]
第二获取模块,用于获取多幅原始图像;
[0143]
预处理模块,用于对多幅原始图像中的至少一幅原始图像进行预处理,得到与至少一幅原始图像一一对应的至少一幅预处理图像;
[0144]
第三获取模块,用于根据多幅原始图像和至少一幅预处理图像,获取多幅样本图像。
[0145]
作为一个示例,至少一幅原始图像包括第一原始图像;
[0146]
预处理模块,还用于采用sigmoid函数,对第一原始图像中的各个像素的像素值分别进行转换,像素值转换后的第一原始图像为与第一原始图像对应的预处理图像。
[0147]
作为一个示例,更新模块404,还用于根据反向传播算法对预测误差进行反向传播,以更新待训练图像分割模型的模型参数,反向传播算法为随机梯度下降算法、动量优化算法或自适应矩估计算法。
[0148]
需要说明的是:上述实施例提供的图像分割模型的训练装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
[0149]
上述实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术实施例的保护范围。
[0150]
上述实施例提供的图像分割模型的训练装置与图像分割模型的训练方法实施例属于同一构思,上述实施例中单元、模块的具体工作过程及带来的技术效果,可参见方法实施例部分,此处不再赘述。
[0151]
请参考图5,图5是本技术实施例提供的一种计算机设备的结构示意图。如图5所示,计算机设备包括:处理器501、存储器502以及存储在存储器502中并可在处理器501上运行的计算机程序503,处理器501执行计算机程序503时实现上述实施例中的图像分割模型的训练方法中的步骤。
[0152]
计算机设备可以是上述图1实施例中的计算机设备。计算机设备可以是台式机、便携式电脑、网络服务器、掌上电脑、移动手机、平板电脑、无线终端设备、通信设备或嵌入式设备,本技术实施例不限定计算机设备的类型。本领域技术人员可以理解,图5仅仅是计算
机设备的举例,并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,比如还可以包括输入输出设备、网络接入设备等。
[0153]
处理器501可以是中央处理单元(central processing unit,cpu),处理器501还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者也可以是任何常规的处理器。
[0154]
存储器502在一些实施例中可以是计算机设备的片内存储器或片外存储器,比如计算机设备的高速缓冲存储器、sram(static random-access memory,静态随机存取存储器)、dram(dynamic static random-access memory,动态随机存取存储器)或软盘等。存储器502在另一些实施例中也可以是计算机设备上配备的插接式硬盘、智能存储卡(smart media card,smc)、安全数字(secure digital,sd)卡、闪存卡(flash card)等。进一步地,存储器502还可以既包括计算机设备的片内存储器、片外存储器内部存储单元,也包括外部存储设备。存储器502用于存储操作系统、应用程序、引导装载程序(boot loader)、数据以及其他程序等。存储器502还可以用于暂时地存储已经输出或者将要输出的数据。
[0155]
本技术实施例还提供了一种计算机设备,该计算机设备包括:至少一个处理器、存储器以及存储在该存储器中并可在该至少一个处理器上运行的计算机程序,该处理器执行该计算机程序时实现上述任意各个方法实施例中的步骤。
[0156]
本技术实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时可实现上述各个方法实施例中的步骤。
[0157]
本技术实施例提供了一种计算机程序产品,当其在计算机上运行时,使得计算机执行上述各个方法实施例中的步骤。
[0158]
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实现上述方法实施例中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,该计算机程序包括计算机程序代码,该计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。该计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、rom(read-only memory,只读存储器)、ram(random access memory,随机存取存储器)、cd-rom(compact disc read-only memory,只读光盘)、磁带、软盘和光数据存储设备等。本技术提到的计算机可读存储介质可以为非易失性存储介质,换句话说,可以是非瞬时性存储介质。
[0159]
应当理解的是,实现上述实施例的全部或部分步骤可以通过软件、硬件、固件或者其任意结合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。该计算机指令可以存储在上述计算机可读存储介质中。
[0160]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0161]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0162]
在本技术所提供的实施例中,应该理解到,所揭露的装置/计算机设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/计算机设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
[0163]
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0164]
以上所述实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围,均应包含在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1