图像处理模型的训练方法和装置、存储介质及电子设备与流程

文档序号:29632759发布日期:2022-04-13 16:23阅读:62来源:国知局
图像处理模型的训练方法和装置、存储介质及电子设备与流程

1.本发明涉及计算机领域,具体而言,涉及一种图像处理模型的训练方法和装置、存储介质及电子设备。


背景技术:

2.目前,图像处理模型在数据处理中应用的越来越普及。而图像处理模型在应用中对数据处理的准确性,通常与模型训练相关。而在模型训练阶段中,训练数据对模型性能的影响很大。
3.而在模型训练过程中,通常只是分别利用正样本和负样本对模型进行训练,并没有对样本图像进行进一步的分类。而对于不同训练难度的样本图像进行相同的训练,在模型训练后期,会因为噪声的影响而造成模型的过拟合,从而降低训练得到的图像处理模型的性能。
4.针对上述的问题,目前尚未提出有效的解决方案。


技术实现要素:

5.本发明实施例提供了一种图像处理模型的训练方法和装置、存储介质及电子设备,以至少解决模型训练不当导致的图像处理模型性能不佳的技术问题。
6.根据本发明实施例的一个方面,提供了一种图像处理模型的训练方法,包括:获取每个训练样本在每个迭代周期内进行模拟训练后得到的样本损失值,其中,上述模拟训练为利用上述训练样本对原始模型进行多次迭代训练,直至上述原始模型的模型损失值达到第一收敛条件;根据获取到的上述训练样本在多个上述迭代周期内得到的多个样本损失值,确定上述训练样本所属的样本类型,其中,上述样本类型用于指示上述训练样本在模拟训练中达到收敛条件的收敛程度;为目标样本类型的目标训练样本添加关注标记,并利用上述目标训练样本对上述原始模型进行模型训练,直至得到达到与上述目标样本类型相匹配的第二收敛条件的目标模型,其中,上述关注标记用于指示增加上述目标训练样本在每个迭代周期内的模型训练中的训练权重。
7.根据本发明实施例的另一方面,还提供了一种图像处理模型的训练装置,包括:获取单元,用于获取每个训练样本在每个迭代周期内进行模拟训练后得到的样本损失值,其中,上述模拟训练为利用上述训练样本对原始模型进行多次迭代训练,直至上述原始模型的模型损失值达到第一收敛条件;确定单元,用于根据获取到的上述训练样本在多个上述迭代周期内得到的多个样本损失值,确定上述训练样本所属的样本类型,其中,上述样本类型用于指示上述训练样本在模拟训练中达到收敛条件的收敛程度;训练单元,用于为目标样本类型的目标训练样本添加关注标记,并利用上述目标训练样本对上述原始模型进行模型训练,直至得到达到与上述目标样本类型相匹配的第二收敛条件的目标模型,其中,上述关注标记用于指示增加上述目标训练样本在每个迭代周期内的模型训练中的训练权重。
8.根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机
可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述模型训练方法。
9.根据本发明实施例的又一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过所述计算机程序执行上述的模型训练方法。
10.在本发明实施例中,采用获取每个训练样本在模拟训练的每个迭代周期内进行模拟训练后得到的样本损失值,根据获取到的训练样本在多个迭代周期内得到的多个样本损失值,确定训练样本所属的样本类型,为目标样本类型的目标训练样本添加关注标记,关注标记用于指示增加目标训练样本在每个迭代周期内的模型训练中的训练权重,并利用目标训练样本对原始模型进行模型训练,直至得到达到与目标样本类型相匹配的第二收敛条件的目标模型的方式,通过利用模型的模拟训练的每个迭代周期内的样本损失值确定训练样本的样本类型,从而通过添加关注标记的方式增加目标样本类型的目标训练样本在模型训练过程中的训练权重,达到了增加目标样本类型的目标训练样本在模型训练中的训练权重,以确定模型训练方向,避免模型在训练过程中偏移训练方向的目的,从而实现了利用训练样本的分类实现对模型针对性训练,以提高训练得到的模型性能的技术效果,进而解决了模型训练不当导致的图像处理模型性能不佳的技术问题。
附图说明
11.此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
12.图1是根据本发明实施例的一种可选的图像处理模型的训练方法的应用环境的示意图;
13.图2是根据本发明实施例的一种可选的图像处理模型的训练方法的流程示意图;
14.图3是根据本发明实施例的一种可选的图像处理模型的训练方法的流程示意图;
15.图4是根据本发明实施例的一种可选的图像处理模型的训练方法的流程示意图;
16.图5是根据本发明实施例的一种可选的图像处理模型的训练方法的训练样本示意图;
17.图6是根据本发明实施例的一种可选的图像处理模型的训练装置的结构示意图;
18.图7是根据本发明实施例的一种可选的电子设备的结构示意图。
具体实施方式
19.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
20.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或
描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
21.根据本发明实施例的一个方面,提供了一种图像处理模型的训练方法,可选地,上述图像处理模型的训练方法可以但不限于应用于如图1所示的环境中。终端设备100通过网络110与服务器120进行数据交互,服务器120不限用于终端设备100所需模型的训练,并通过网络110将训练好的目标模型发送给终端设备100,终端设备100不限于将模型运行数据通过网络110反馈给服务器120。
22.服务器120中不限于运行有数据库122和处理引擎124。数据库122用于存储训练样本的样本数据,以及训练过程中的各个数据,还可以用于存储训练好的目标模型数据以及终端设备100反馈的模型运行数据。处理引擎124用于根据数据库122中存储的训练样本的样本数据和模型参数实现模型的训练。服务器120进行模型训练不限于通过依次执行s102至s106实现。s102,获取每个训练样本的样本损失值。获取每个训练样本在每个迭代周期内进行模拟训练后得到的样本损失值,模拟训练为利用训练样本对原始模型进行多次迭代训练,直至原始模型的模型损失值达到第一收敛条件。s104,确定训练样本所属的样本类型。根据获取到的训练样本在多个迭代周期内得到的多个样本损失值,确定训练样本所属的样本类型,样本类型用于指示训练样本在模拟训练中达到收敛条件的收敛程度。s106,为目标样本类型的目标训练样本添加关注标记,并利用目标训练样本对原始模型进行模型训练。直至得到达到与目标样本类型相匹配的第二收敛条件的目标模型,关注标记用于指示增加目标训练样本在每个迭代周期内的模型训练中的训练权重。
23.可选地,在本实施例中,上述终端设备100可以是配置有目标客户端的终端设备,可以包括但不限于以下至少之一:手机(如android手机、ios手机等)、笔记本电脑、平板电脑、掌上电脑、mid(mobile internet devices,移动互联网设备)、pad、台式电脑、智能电视等。目标客户端是运行目标模型的客户端,具体不限于是音频客户端、视频客户端、即时通信客户端、浏览器客户端、教育客户端等。上述网络110可以包括但不限于:有线网络,无线网络,其中,该有线网络包括:局域网、城域网和广域网,该无线网络包括:蓝牙、wifi及其他实现无线通信的网络。上述服务器120可以是单一服务器,也可以是由多个服务器组成的服务器集群,或者是云服务器。上述仅是一种示例,本实施例中对此不作任何限定。
24.作为一种可选的实施方式,如图2所示,上述图像处理模型的训练方法包括:
25.s202,获取每个训练样本在每个迭代周期内进行模拟训练后得到的样本损失值,其中,模拟训练为利用训练样本对原始模型进行多次迭代训练,直至原始模型的模型损失值达到第一收敛条件;
26.s204,根据获取到的训练样本在多个迭代周期内得到的多个样本损失值,确定训练样本所属的样本类型,其中,样本类型用于指示训练样本在模拟训练中达到收敛条件的收敛程度;
27.s206,为目标样本类型的目标训练样本添加关注标记,并利用目标训练样本对原始模型进行模型训练,直至得到达到与目标样本类型相匹配的第二收敛条件的目标模型,其中,关注标记用于指示增加目标训练样本在每个迭代周期内的模型训练中的训练权重。
28.模拟训练不限于是利用属于同一类别的多个训练样本对原始模型进行训练,以得到模型损失值达到收敛条件的原始模型。同一类别不限于是训练样本本身的分类类别,比如正样本类别,负样本类别。在模型为识别模型的情况下,类别还可以是识别对应的类别,例如类型识别中属于同一类型的训练样本,对象识别模型中同属于同一对象的训练样本。
29.收敛条件不限于指示模型的模拟训练的损失值小于预设收敛阈值,在模型损失值小于预设收敛阈值的情况下,认定当前训练后的原始模型达到收敛条件,不限于基于模型达到收敛条件确定模型训练结束,所得到的模型可以被应用。
30.模拟训练不限于通过多次迭代以使得每一次迭代周期后的模型损失值逐渐向收敛阈值靠近,以实现模型的模拟训练。每一个迭代周期可以包括多次模型训练,每个迭代周期的模型训练次数不限于相同或者不同。迭代周期的周期数可以是预设的周期数,也可以是根据模型损失值确定得到,也就是在模型损失值达到第一收敛条件的情况下,将当前的迭代周期数确定为模拟训练的周期数。
31.每个训练样本在每个迭代周期训练得到的样本损失值确定出每个样本所属的样本类型,样本类型不限于是根据每个训练样本的样本损失值进行预设样本类型的匹配,从而确定每个训练样本的样本类型。
32.在得到全部训练样本的样本类型确定后,为属于目标样本类型的每个目标训练样本添加关注标记,从而利用包括添加了关注标记的目标训练样本的全部训练样本对原始模型进行模型训练,直至得到达到收敛条件的目标模型。关注标记用于增加模型在训练过程中的训练权重,在训练样本中未存在关注标记的情况下,模型在训练过程中对每个训练样本的训练权重不限于相同,直至训练样本的损失值达到收敛阈值。在训练样本的损失值达到收敛阈值的情况下,模型在下一次迭代周期中不限于不再对训练样本进行关注。在训练样本添加了关注标记的情况下,不限于增加训练样本在样本损失值未达到收敛阈值的模型训练中的训练权重。训练权重具体的增加程度在此不做限定。
33.第一收敛条件和第二收敛条件所指示的收敛阈值可以相同,也可以不相同,不限于根据样本类型的分类精度以及目标模型的模型精度确定。
34.在本技术实施例中,采用获取每个训练样本在模拟训练的每个迭代周期内进行模拟训练后得到的样本损失值,根据获取到的训练样本在多个迭代周期内得到的多个样本损失值,确定训练样本所属的样本类型,为目标样本类型的目标训练样本添加关注标记,关注标记用于指示增加目标训练样本在每个迭代周期内的模型训练中的训练权重,并利用目标训练样本对原始模型进行模型训练,直至得到达到与目标样本类型相匹配的第二收敛条件的目标模型的方式,通过利用模型的模拟训练的每个迭代周期内的样本损失值确定训练样本的样本类型,从而通过添加关注标记的方式增加目标样本类型的目标训练样本在模型训练过程中的训练权重,达到了增加目标样本类型的目标训练样本在模型训练中的训练权重,以确定模型训练方向,避免模型在训练过程中偏移训练方向的目的,从而实现了利用训练样本的分类实现对模型针对性训练,以提高训练得到的图像处理模型性能的技术效果,进而解决了模型训练不当导致的图像处理模型性能不佳的技术问题。
35.作为一种可选的实施方式,根据获取到的训练样本在多个迭代周期内得到的多个样本损失值,确定训练样本所属的样本类型包括:
36.s1,根据每个训练样本在模拟训练的每个迭代周期的样本损失值,绘制每个训练
样本的迭代损失图,其中,迭代损失图用于指示训练样本的样本损失值与模拟训练的迭代周期的对应关系;
37.s2,根据每个训练样本的迭代损失图所指示的样本模拟损失值,确定训练样本的样本类型。
38.迭代损失图不限于将训练样本在每个迭代周期的样本损失值和迭代周期的周期数分别作为横纵坐标,以构建训练样本的迭代损失图。样本模拟损失值不限于是迭代损失图所指示的样本损失值的收敛值。收敛值不限于是在模型达到收敛阈值阶段的样本损失值的均值,或者其他基于迭代损失图确定出的样本收敛值,例如迭代损失图尾端的样本损失值。
39.根据样本模拟损失值所指示的收敛程度与预设样本类型指示的损失值阈值确定出样本类型。
40.作为一种可选的实施方式,根据每个训练样本的迭代损失图所指示的样本模拟损失值,确定训练样本的样本类型包括:
41.在训练样本的样本模拟损失值小于第一阈值的情况下,确定训练样本属于第一样本类型,其中,第一样本类型在模拟训练中完成收敛;
42.在训练样本的样本模拟损失值大于第二阈值的情况下,确定训练样本属于噪声样本类型,其中,第二阈值大于第一阈值;
43.在训练样本的样本模拟损失值大于等于第一阈值且小于等于第二阈值的情况下,确定训练样本属于关注样本类型,其中,关注样本类型在模拟训练中未完成收敛。
44.第一阈值和第二阈值不限于是用于指示训练样本中完全收敛的第一样本类型和完全未收敛的噪声样本类型。第一样本类型的第一样本在模拟训练中完全收敛,不限于是不影响模型训练方向的样本。
45.噪声样本类型不限于是训练样本中掺杂的噪声样本,噪声样本的样本损失值在训练过程中不限于始终大于第二阈值,通过第二阈值从训练样本中确定出噪声样本。
46.作为一种可选的实施方式,根据每个训练样本的迭代损失图所指示的样本模拟损失值,确定训练样本的样本类型包括:
47.s1,计算关注样本类型的训练样本的收敛损失均值,其中,收敛损失均值为训练样本在达到收敛条件下的样本损失值的均值;
48.s2,根据关注样本类型的训练样本的收敛损失均值确定目标分割阈值;
49.s3,将关注样本类型中样本模拟损失值小于目标分割阈值的训练样本,确定为目标样本类型的目标训练样本。
50.目标样本类型不限于是将样本模拟损失值处于第一阈值至第二阈值之前的关注样本类型中确定出的部分训练样本。例如靠向第一样本类型的部分,或者靠向噪声样本类型的部分,或者处于预设范围的部分。目标分割阈值用于从关注样本类型中确定出目标样本类型。
51.模型训练不限于如图3所示。s302,对原始模型进行模拟训练。在训练得到收敛条件的模型的情况下,停止模拟训练。s304,获取每一个训练样本在模拟训练的每一次迭代的样本损失值。不限于是在每一次迭代中记录每一个训练样本的样本损失值。s306,对每个训练样本绘制迭代损失曲线图。根据迭代次数和样本损失值的对应关系绘制迭代损失曲线
图。根据每个训练样本的迭代损失曲线图,通过第一阈值确定出第一样本类型,再通过第二阈值确定出噪声样本类型,从而确定出训练样本中介于第一阈值和第二阈值期间的关注样本类型。s308,确定出属于关注样本类型中的目标样本类型的目标训练样本。在确定出目标训练样本的情况下,s310,标记目标训练样本,对原始模型进行模型训练。利用包括了添加关注标记的目标训练样本的全部训练样本对原始模型进行模型训练,从而在模型训练过程中,增加对目标训练样本的训练权重,以确定模型训练的方向,从而基于模型训练得到性能更好的目标模型。
52.作为一种可选的实施方式,根据每个训练样本的迭代损失图所指示的样本模拟损失值,确定训练样本的样本类型包括:
53.s1,按照样本模拟损失值,对关注样本类型的训练样本进行排序,得到关注样本序列;
54.s2,将关注样本序列中位于目标序位的训练样本作为目标样本类型的初始目标训练样本。
55.从关注样本类型中确定出目标样本类型还可以是基于样本损失值对样本进行排序得到的样本序列确定出。目标序位不限于是位于预设序位范围内的多个序位。在确定出目标训练样本的情况下,不限于是将目标训练样本作为模型训练的多次迭代周期的目标训练样本,还可以是基于每次迭代周期的样本损失值对目标训练样本进行更新,对更新后的目标训练样本进行重新标记,利用重新标记的目标训练样本进行下一次迭代训练。
56.作为一种可选的实施方式,如图4所示,为目标样本类型的目标训练样本添加关注标记,并利用目标训练样本对原始模型进行模型训练包括:
57.s402,为初始目标训练样本添加关注标记,并利用添加关注标记的初始目标训练样本对原始模型进行第一迭代训练;
58.s404,获取关注样本类型的训练样本基于第一迭代模型训练得到的第一迭代样本损失值;
59.s406,将关注样本类型的训练样本按照第一迭代样本损失值进行排序得到的第一关注样本序列中,位于目标序位的训练样本作为第二目标训练样本;
60.s408,为第二目标训练样本添加关注标记,并利用添加关注标记的第二目标训练样本对原始模型进行第二迭代训练。
61.不限于在模型训练的每一次迭代训练中,将当前迭代训练得到的样本损失值,进行关注样本类型的训练样本排序,从而确定出下一次迭代训练中的目标训练样本,并重新为目标训练样本添加关注标记。通过每一次迭代训练中目标训练样本的更新,实现目标样本类型的动态确定,从而在模型训练中通过动态的调整目标训练样本以动态的调整模型训练方向,提高训练得到的模型的性能。
62.作为一种可选的实施方式,在为目标样本类型的目标训练样本添加关注标记,并利用目标训练样本对原始模型进行模型训练,直至得到达到与目标样本类型相匹配的第二收敛条件的目标模型之后,还包括:为关注样本类型的训练样本中的目标数据添加加强标记,并利用添加加强标记的训练样本,对目标模型进行加强训练,其中,加强训练用于提高目标模型识别目标数据的成功率达到识别阈值。
63.在从训练样本中确定出关注样本类型的关注训练样本之后,还可以为关注训练样
本中的目标数据添加加强标记,用于对目标模型针对目标数据进行加强数据,进一步提高目标模型的模型性能。
64.以模型为人脸识别模型为例,属于同一类别的训练样本不限于如图5(1)所示。9个训练样本为同一个对象的不同角度、不同动作以及不同清晰度的人脸图像和混淆其中的干扰样本,干扰样本是位于右下角的女性对象的人脸图像,在性别上不同,因此是该对象的干扰训练样本。
65.以按照类型阈值确定训练样本的样本类型不限于如图5(2)至图5(5)所示。根据在模型的模拟训练的每次迭代的损失值绘制出的迭代损失曲线图,确定训练样本的样本收敛值,在训练样本收敛的情况下,例如图5(2)所示的曲线图,在模拟训练结束前损失值趋于0的,确定为简单样本类型。在训练样本未收敛的情况下,将曲线图确定出的收敛值确定为训练样本的样本收敛值,从而先确定出指示噪声样本类型的噪声样本,如图5(5)所示。在剩余的训练样本中确定出目标样本类型的目标训练样本,将小于分割阈值的训练样本确定目标训练样本类型—半难样本类型,如图5(3)所示。关注样本类型的训练样本中的目标数据不限于是图5(4)中的墨镜对应的数据。从而对目标模型加强对目标数据的针对性训练。
66.需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
67.根据本发明实施例的另一个方面,还提供了一种用于实施上述图像处理模型的训练方法的图像处理模型的训练装置。如图6所示,该装置包括:
68.获取单元602,用于获取每个训练样本在每个迭代周期内进行模拟训练后得到的样本损失值,其中,模拟训练为利用训练样本对原始模型进行多次迭代训练,直至原始模型的模型损失值达到第一收敛条件;
69.确定单元604,用于根据获取到的训练样本在多个迭代周期内得到的多个样本损失值,确定训练样本所属的样本类型,其中,样本类型用于指示训练样本在模拟训练中达到收敛条件的收敛程度;
70.训练单元606,用于为目标样本类型的目标训练样本添加关注标记,并利用目标训练样本对原始模型进行模型训练,直至得到达到与目标样本类型相匹配的第二收敛条件的目标模型,其中,关注标记用于指示增加目标训练样本在每个迭代周期内的模型训练中的训练权重。
71.可选地,确定单元604还包括:
72.绘制模块,用于根据每个训练样本在模拟训练的每个迭代周期的样本损失值,绘制每个训练样本的迭代损失图,其中,迭代损失图用于指示训练样本的样本损失值与模拟训练的迭代周期的对应关系;
73.确定模块,用于根据每个训练样本的迭代损失图所指示的样本模拟损失值,确定训练样本的样本类型。
74.可选地,上述确定模块还用于在训练样本的样本模拟损失值小于第一阈值的情况下,确定训练样本属于第一样本类型,其中,第一样本类型在模拟训练中完成收敛;在训练
样本的样本模拟损失值大于第二阈值的情况下,确定训练样本属于噪声样本类型,其中,第二阈值大于第一阈值;在训练样本的样本模拟损失值大于等于第一阈值且小于等于第二阈值的情况下,确定训练样本属于关注样本类型,其中,关注样本类型在模拟训练中未完成收敛。
75.可选地,上述确定模块还用于计算关注样本类型的训练样本的收敛损失均值,其中,收敛损失均值为训练样本在达到收敛条件下的样本损失值的均值;根据关注样本类型的训练样本的收敛损失均值确定目标分割阈值;将关注样本类型中样本模拟损失值小于目标分割阈值的训练样本,确定为目标样本类型的目标训练样本。
76.可选地,上述确定模块还用于按照样本模拟损失值,对关注样本类型的训练样本进行排序,得到关注样本序列;将关注样本序列中位于目标序位的训练样本作为目标样本类型的初始目标训练样本。
77.可选地,上述训练单元606还包括训练模块,用于为初始目标训练样本添加关注标记,并利用添加关注标记的初始目标训练样本对原始模型进行第一迭代训练;获取关注样本类型的训练样本基于第一迭代模型训练得到的第一迭代样本损失值;将关注样本类型的训练样本按照第一迭代样本损失值进行排序得到的第一关注样本序列中,位于目标序位的训练样本作为第二目标训练样本;为第二目标训练样本添加关注标记,并利用添加关注标记的第二目标训练样本对原始模型进行第二迭代训练。
78.可选地,上述图像处理模型的训练装置还包括加强训练单元,用于在为目标样本类型的目标训练样本添加关注标记,并利用目标训练样本对原始模型进行模型训练,直至得到达到与目标样本类型相匹配的第二收敛条件的目标模型之后,为关注样本类型的训练样本中的目标数据添加加强标记,并利用添加加强标记的训练样本,对目标模型进行加强训练,其中,加强训练用于提高目标模型识别目标数据的成功率达到识别阈值。
79.在本技术实施例中,采用获取每个训练样本在模拟训练的每个迭代周期内进行模拟训练后得到的样本损失值,根据获取到的训练样本在多个迭代周期内得到的多个样本损失值,确定训练样本所属的样本类型,为目标样本类型的目标训练样本添加关注标记,关注标记用于指示增加目标训练样本在每个迭代周期内的模型训练中的训练权重,并利用目标训练样本对原始模型进行模型训练,直至得到达到与目标样本类型相匹配的第二收敛条件的目标模型的方式,通过利用模型的模拟训练的每个迭代周期内的样本损失值确定训练样本的样本类型,从而通过添加关注标记的方式增加目标样本类型的目标训练样本在模型训练过程中的训练权重,达到了增加目标样本类型的目标训练样本在模型训练中的训练权重,以确定模型训练方向,避免模型在训练过程中偏移训练方向的目的,从而实现了利用训练样本的分类实现对模型针对性训练,以提高训练得到的图像处理模型性能的技术效果,进而解决了模型训练不当导致的图像处理模型性能不佳的技术问题。
80.根据本发明实施例的又一个方面,还提供了一种用于实施上述图像处理模型的训练方法的电子设备,该电子设备可以是图1所示的终端设备或服务器。本实施例以该电子设备为服务器为例来说明。如图7所示,该电子设备包括存储器702和处理器704,该存储器702中存储有计算机程序,该处理器704被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
81.可选地,在本实施例中,上述电子设备可以位于计算机网络的多个网络设备中的
至少一个网络设备。
82.可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
83.s1,获取每个训练样本在每个迭代周期内进行模拟训练后得到的样本损失值,其中,模拟训练为利用训练样本对原始模型进行多次迭代训练,直至原始模型的模型损失值达到第一收敛条件;
84.s2,根据获取到的训练样本在多个迭代周期内得到的多个样本损失值,确定训练样本所属的样本类型,其中,样本类型用于指示训练样本在模拟训练中达到收敛条件的收敛程度;
85.s3,为目标样本类型的目标训练样本添加关注标记,并利用目标训练样本对原始模型进行模型训练,直至得到达到与目标样本类型相匹配的第二收敛条件的目标模型,其中,关注标记用于指示增加目标训练样本在每个迭代周期内的模型训练中的训练权重。
86.可选地,本领域普通技术人员可以理解,图7所示的结构仅为示意,电子设备也可以是智能手机(如android手机、ios手机等)、平板电脑、掌上电脑以及移动互联网设备(mobile internet devices,mid)、pad等终端设备。图7其并不对上述电子设备的结构造成限定。例如,电子设备还可包括比图7中所示更多或者更少的组件(如网络接口等),或者具有与图7所示不同的配置。
87.其中,存储器702可用于存储软件程序以及模块,如本发明实施例中的模型训练方法和装置对应的程序指令/模块,处理器704通过运行存储在存储器702内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的模型训练方法。存储器702可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器702可进一步包括相对于处理器704远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器702具体可以但不限于用于存储训练样本以训练样本类型、原始模型的模型数据、目标模型的模型数据等信息。作为一种示例,如图7所示,上述存储器702中可以但不限于包括上述模型训练装置中的获取单元602,确定单元604和训练单元606。此外,还可以包括但不限于上述模型训练装置中的其他模块单元,本示例中不再赘述。
88.可选地,上述的传输装置706用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置706包括一个网络适配器(network interface controller,nic),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置706为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
89.此外,上述电子设备还包括:显示器708,用于显示上述训练样本、关注标记;和连接总线710,用于连接上述电子设备中的各个模块部件。
90.在其他实施例中,上述终端设备或者服务器可以是一个分布式系统中的一个节点,其中,该分布式系统可以为区块链系统,该区块链系统可以是由该多个节点通过网络通信的形式连接形成的分布式系统。其中,节点之间可以组成点对点(p2p,peer to peer)网络,任意形式的计算设备,比如服务器、终端等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点。
91.根据本技术的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述图像处理模型的训练方面的各种可选实现方式中提供的方法。其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
92.可选地,在本实施例中,上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序:
93.s1,获取每个训练样本在每个迭代周期内进行模拟训练后得到的样本损失值,其中,模拟训练为利用训练样本对原始模型进行多次迭代训练,直至原始模型的模型损失值达到第一收敛条件;
94.s2,根据获取到的训练样本在多个迭代周期内得到的多个样本损失值,确定训练样本所属的样本类型,其中,样本类型用于指示训练样本在模拟训练中达到收敛条件的收敛程度;
95.s3,为目标样本类型的目标训练样本添加关注标记,并利用目标训练样本对原始模型进行模型训练,直至得到达到与目标样本类型相匹配的第二收敛条件的目标模型,其中,关注标记用于指示增加目标训练样本在每个迭代周期内的模型训练中的训练权重。
96.可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(read-only memory,rom)、随机存取器(random access memory,ram)、磁盘或光盘等。
97.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
98.上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
99.在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
100.在本技术所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
101.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
102.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
103.以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1