深度学习网络的训练方法、装置、计算机设备和存储介质与流程

文档序号:21203387发布日期:2020-06-23 19:35阅读:142来源:国知局
深度学习网络的训练方法、装置、计算机设备和存储介质与流程

本申请涉及图像处理技术领域,特别是涉及一种深度学习网络的训练方法、装置、计算机设备和存储介质。



背景技术:

在农牧行业,可以使用深度学习网络来识别动物,以计算动物的数量或者分析动物的行为。但是在深度学习网络的训练过程中,采集到动物的图像后,在将多个图像作为训练样本进行模型训练时,图像的尺寸有所不同,比如2000*3000*3、3000*2000*3或者1000*600*3等,不仅长宽尺寸不接近,而且长宽比例也可能相差很大。由于深度学习回归模型中全连接层的存在,需要对批量输入的训练样本的尺寸大小进行限制,以保证加载到的训练样本有一致的尺寸(比如896*896*3),这个过程可以理解为尺寸归一化。但是尺寸归一化损失了图像的清晰度,甚至可能将图像上的小目标完全给损失掉,也就是说,会影响后期深度学习训练中特征局部提取的精度,导致识别结果的准确性降低。虽然为保证识别结果准确性,可以利用传统图像分割区域的方法进行训练,但是却需要分别对分割后得到的图像区域进行归一化处理,使得训练速度的降低。可见,在进行深度学习网络训练时,如何在保证识别结果准确性的情况下,能提高训练效率,是有必要解决的问题。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种能够在保证识别结果准确性的情况下,能提高训练效率的深度学习网络的训练方法、装置、计算机设备和存储介质。

第一方面,提供一种深度学习网络的训练方法,所述方法包括:

加载训练图像和标记图像;所述标记图像为对所述训练图像中的特征物进行标记后得到的;

按照预先设定的块尺寸,对所述训练图像进行块分割,得到多个图像块;

在对所述多个图像块进行特征提取处理之后,对处理后的多个图像块和所述标记图像进行映射处理;

对映射处理后的图像块和标记图像进行参数调整学习,得到所述深度学习网络的参数。

在一个实施例中,所述训练图像为多张时,各张训练图像对应不同的图像块集合,各个图像块集合包括的图像块个数相同。

在一个实施例中,所述按照预先设定的块尺寸,对所述训练图像进行块分割,得到多个图像块的步骤,包括:

获取预设的滑动步长和所述块尺寸;

按照所述滑动步长和所述块尺寸,对所述训练图像进行滑动分割处理,得到多个图像块。

在一个实施例中,当所述训练图像为多张时,各张训练图像对应不同的图像块集合,各个图像块集合中的图像块进行拼接后得到的拼接尺寸和分割前的训练图像的尺寸相同。

在一个实施例中,在所述加载训练图像之前,还包括:

获取多张训练图像;

利用shuffle模块对多张训练图像进行随机排序处理;

对随机排序处理后的训练图像进行批次分类,得到多批训练图像;

分批次加载训练图像进行训练。

在一个实施例中,还包括:

若加载完各个批次的训练图像进行训练后,确定完成一轮训练;

利用shuffle模块对所述多张训练图像的索引进行随机排序处理,进行下一轮训练。

在一个实施例中,在所述确定完成一轮训练的步骤之后,还包括:

更新训练轮数;

若所述训练轮数未达到预设轮数,则利用shuffle模块对多张训练图像的索引进行随机排序处理,进行下一轮训练。

第二方面,提供一种深度学习网络的训练装置,所述装置包括:

图像加载模块,用于加载训练图像和标记图像;所述标记图像为对所述训练图像中的特征进行标记后得到的;

块分割模块,用于按照预先设定的分割尺寸,对所述训练图像进行块分割,得到多个图像块;

映射处理模块,用于在对所述多个图像块进行特征提取处理之后,对处理后的多个图像块和所述标记图像进行映射处理;

参数调整学习模块,用于对映射处理后的图像块和标记图像进行参数调整学习,得到所述深度学习网络的参数。

第三方面,提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

加载训练图像和标记图像;所述标记图像为对所述训练图像中的特征物进行标记后得到的;

按照预先设定的块尺寸,对所述训练图像进行块分割,得到多个图像块;

在对所述多个图像块进行特征提取处理之后,对处理后的多个图像块和所述标记图像进行映射处理;

对映射处理后的图像块和标记图像进行参数调整学习,得到所述深度学习网络的参数。

第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

加载训练图像和标记图像;所述标记图像为对所述训练图像中的特征物进行标记后得到的;

按照预先设定的块尺寸,对所述训练图像进行块分割,得到多个图像块;

在对所述多个图像块进行特征提取处理之后,对处理后的多个图像块和所述标记图像进行映射处理;

对映射处理后的图像块和标记图像进行参数调整学习,得到所述深度学习网络的参数。

上述深度学习网络的训练方法、装置、计算机设备和存储介质,先加载训练图像和标记图像,然后按照预先设定的块尺寸对训练图像进行块分割得到图像块,在对图像块进行特征提取处理后,对特征提取处理后的图像块和标记图像进行映射处理,对映射处理后的图像块和标记图像进行参数调整学习,得到深度学习网络的参数避免了图像信息的损失,保证了识别结果的准确性,并且先加载训练图像和标记图像,然后进行块分割处理,从而不需加载分割后得到的图像块,并且避免了对标记图像进行对应的块分割的情况,节约了深度学习网络加载时间和块分割时间,提高训练效率。

附图说明

图1为一个实施例中计算机设备的内部结构图;

图2为一个实施例中深度学习网络的训练方法的流程示意图;

图3为另一个实施例中深度学习网络的训练方法的流程示意图;

图4为一个实施例中深度学习网络的训练装置的结构框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本申请所描述的实施例可以与其它实施例相结合。

本申请提供的深度学习网络的训练方法,可以应用于如图1所示的计算机设备中。该计算机设备可以是服务器,其内部结构图可以如图1所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储深度学习网络的训练数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种深度学习网络的训练方法。

本领域技术人员可以理解,图1中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在农牧行业,可以采集动物的图像,利用这些图像对深度学习网络进行训练,训练后的深度学习网络可以用来识别动物,进而计算动物的数量或者分析动物的行为,但是在深度学习网络训练的过程中,难以在保证识别结果的准确性情况下,提高训练效率。本申请提供的深度学习网络的训练方法,在深度学习网络获取训练图像和标记图像后,按照预先设定的分割尺寸进行块分割处理得到图像块,以及对特征提取处理后的多个图像块和标记图像进行映射处理,进而得到深度学习网络的参数,在保证识别结果准确性的情况下,提升深度学习网络的训练效率。

训练图像可以理解为用来对深度学习网络进行训练的图像,对应地,与训练图像对应的参数可以称为训练参数;标记图像可以理解为训练过程中用于参照的标准图像,对应地,与标记图像对应的参数可以称为标准参数;在深度网络进行特征学习的过程中,对训练参数不断进行调整,以趋近于标准参数。

可以理解的是,本申请提供的深度学习网络的训练方法可以用在识别汽车等方面,识别动物并不构成对本申请的深度学习网络的训练方法的限定。

在一个实施例中,如图2所示,提供了一种深度学习网络的训练方法,本实施例以该方法应用于服务器,还可以应用于包括终端和服务器的系统,由终端和服务器的交互实现,交互实现的具体方式可以是:由终端将训练图像和标记图像发送至服务器中,进而服务器的深度学习网络可以通过加载训练图像和标记图像的方式进行训练。本实施例中,该方法包括以下步骤:

步骤s202,加载训练图像和标记图像。

其中,标记图像(又可以称为groundtruth)可以为对训练图像中的特征物进行标记后得到的图像,对应不同用途的深度学习网络,特征物可以不同,例如,用于识别动物的深度学习网络中,特征物可以是猪、牛等,又例如,用于识别汽车的深度学习网络中,特征物可以是越野车、巴士、卡车等。对训练图像中的特征物进行标记的方式可以是:对训练图像中的特征物进行画框、划线等处理方式实现标记,以用于识别汽车的深度学习网络为例,对训练图像中的汽车进行画框处理,进而实现标记,将画框处理后的训练图像作为标记图像

在本步骤中,深度学习网络加载训练图像和其对应的标记图像;可以理解的是,由于每张训练图像有其对应的标记图像,深度学习网络在加载的训练图像的时候,加载的标记图像的数量是和训练图像一致的,例如,训练图像有16张,对应的标记图像也有16张,那么深度学习网络需要加载16张训练图像和16张标记图像。

步骤s204,按照预先设定的块尺寸,对训练图像进行块分割,得到多个图像块。

在深度学习网络加载完训练图像后,训练图像位于深度学习网络中,此时,服务器获取预先设定的块尺寸,对训练图像进行块分割,得到多个图像块。

其中,块尺寸可以是根据深度学习网络中全卷积模块可处理的尺寸大小确定,例如全卷积模块可处理的最大尺寸为a*b,那么块尺寸为位于a*b范围内中的任一个尺寸;进一步地,为进一步提升训练速度,可以将全卷积模块可处理的最大尺寸作为块尺寸,以全卷积模块可处理的最大尺寸为a*b为例,此时,可以将a*b作为块尺寸。

由于一张图像可以看成是由多个像素组成的,因此,对训练图像进行分割后得到的图像块可以理解为是介于像素级别和图像级别之间的图像区域;其中,对训练图像进行块分割的方式可以是基于像素级别方法(如patch方法,对应得到的图像块可以称为patch图像)实现的。需要说明的是,当基于像素级别方法进行块分割时,块尺寸可以理解为块分割得到的每个图像块包括的像素个数。

为了保证识别结果准确性,本申请的一个实施例中利用多张训练图像进行训练,具体地,深度学习网络加载多张训练图像后,按照预设的块尺寸分别对各张训练图像进行分割,得到对应的图像块集合,其中,由于是按照预设的块尺寸对各张训练图像进行块分割,因此各个图像块集合包括的图像块个数相同;需要说明的是,深度学习网络可以同时加载与训练图像对应的标记图像。以利用16张训练图像进行训练,并且按照预设的块尺寸分割一张训练图像可以得到4个图像块为例介绍,由于对一张训练图像进行块分割可以得到4个图像块,因此,可以将这4个图像块看作是一个图像块集合;深度学习网络加载16张训练图像和16张标记图像后,对每张训练图像进行块分割,可以得到16个图像块集合,也就是64个图像块;需要说明的是,此时,深度学习网络不需要对标记图像进行块分割。

步骤s206,在对多个图像块进行特征提取处理之后,对处理后的多个图像块和标记图像进行映射处理。

在对训练图像进行块分割之前,每张标记图像有其对应的训练图像,在而在经过步骤s204的块分割处理后,训练图像被分割为多个图像块,然后对多个图像块进行特征提取处理,此时,服务器需要对特征提取处理后的多个图像块和对应的标记图像进行映射处理,也就是说,将特征提取处理后的图像块和对应的标记图像关联起来。如果存在多张训练图像的图像块集合,那么,服务器对特征提取处理后的多个图像块和对应的标记图像进行映射处理可以是,先对图像块集合中的图像块进行特征提取处理,得到特征提取处理后的图像块集合,将特征提取处理后的图像块集合和标记图像进行映射,使得图像块集合中的图像块和标记图像之间形成映射关系。以16个图像块集合,每个图像块集合包括4个图像块为例介绍,服务器对16张训练图像进行分割后,得到16个图像块集合,然后对16个图像块集合中的各个图像块进行特征提取处理,得到16个特征提取处理后的图像块集合,此时,服务器分别将每个特征提取处理后的图像块集合和对应的标记图像进行映射,使得每个图像块集合中的4个图像块和同一张标记图像形成映射关系。

步骤s208,对映射处理后的图像块和标记图像进行参数调整学习,得到深度学习网络的参数。

深度学习网络对图像块处理可以得到对应的训练参数,对标记图像进行处理可以得到标准参数,因此,参数调整学习可以理解为对训练参数进行调整,以趋近标准参数的过程。在对图像块和标记图像进行映射处理后,服务器利用映射处理后的图像块和标记图像进行参数调整学习,使得训练参数趋近标准参数,确定深度学习网络的参数。

在一种可能的情况中,可以先对训练图像进行块分割处理,再将得到的图像块加载至深度学习网络中,进行深度学习网络的训练,例如对16张训练图像进行块分割处理(每张训练图像分割为4个图像块),得到64个图像块,将64个图像块加载至深度学习网络中,可见,这样的方式增加了深度学习网络加载图像的时间,进而降低了训练的速度;另外,这种方式还增加了深度网络学习训练的空间,因为深度学习网络在训练的过程中,加载的每张图像都要有其对应的标记图像才可以进行参数调整学习,如果先对训练图像进行块分割处理,将图像块加载至深度学习网络中,那么每个图像块要有其对应的标记块,也就是说,需要对标记图像进行同样的块分割处理,得到标记块,然后将图像块和标记块共同加载至深度学习网络中,以16张训练图像并对每张训练图像分割为4个图像块为例介绍:分别对16张训练图像和16张标记图像进行块分割处理,得到64个图像块和64个标记块,将64个图像块和64个标记块加载至深度学习网络中,也就是说,此时训练空间需要足够容纳64个图像块和64个标记块。由此可见,先对训练图像进行块分割处理,将得到的图像块加载至深度学习网络中,进行深度学习网络的训练的方式,虽然可以避免图像信息的损失,保证图像精度,但是却加载的图像增多,导致加载时间增加,进而降低训练速度,并且还增加了训练所需的空间。

相较于上述先块分割后加载的方法,本申请提出的深度学习网络的训练方法,先加载训练图像和标记图像,然后按照预先设定的块尺寸对训练图像进行块分割得到图像块,在对图像块进行特征提取处理后,对特征提取处理后的图像块和标记图像进行映射处理,对映射处理后的图像块和标记图像进行参数调整学习,得到深度学习网络的参数避免了图像信息的损失,保证了识别结果的准确性,并且先加载训练图像和标记图像,然后进行块分割处理,从而不需加载分割后得到的图像块,并且避免了对标记图像进行对应的块分割的情况,节约了深度学习网络加载时间和块分割时间,提高训练效率,由于不需要对标记图像进行块分割,节约训练过程中所需的空间。

需要说明的是,在步骤s204中,服务器可以预先设定块尺寸,可以提升训练速度并且保证识别结果准确性。在一种可能的情况中,如果服务器按照任意尺寸对训练图像进行块分割,由于全卷积网络对可处理尺寸大小有要求,因此,服务器还需要对任意尺寸的图像块进行归一化处理,导致训练时间的增加,使得训练速度降低,并且由于归一化处理会损失部分图像信息,难以保证识别结果的准确性。

在一种可能的情况中,如果只根据块尺寸,对训练图像进行分割,在进行分割的时候,可能会出现部分图像区域不能被包含在分割块中的情况,也就是说,存在相邻的图像块并不连续的问题,导致训练图像的全部信息不能被图像块囊括,降低保证识别结果的准确性。本申请的一个实施例采用利用滑动步长和块尺寸进行块分割的方法,使得分割后得到的多个图像块可以囊括整张训练图像的信息;具体地,服务器获取预先设定的滑动步长和块尺寸,按照滑动步长和块尺寸,对训练图像进行滑动分割处理,得到多个图像块;可以理解的是,此时可以直接对图像块进行拼接处理,得到原来的训练图像,也就是说,各个图像块进行拼接后得到的拼接尺寸和分割前的训练图像的尺寸相同;进一步地,还可以理解的是,当存在多张训练图像时,各张训练图像对应不同的图像块集合,各个图像块集合中的图像块进行拼接后得到的拼接尺寸和分割前的训练图像的尺寸相同。

当利用多张训练图像(可以看作是图像训练集)进行深度学习网络的训练时,此时深度学习网络可以分为多个批次加载训练图像,实现分批训练;如果全部训练图像都被加载完,即深度学习网络加载完各个批次的训练图像进行训练后,可以确定完成一轮训练,此时服务器可以进行下一轮训练。

在一个实例中,服务器进行分批训练具体可以包括:服务器先获取多种训练图像,利用shuffle模块对多种训练图像进行随机排序处理,然后对随机排序处理后的训练图像进行批次分类,得到多批训练图像,分批次加载训练训练图像进行训练,其中进行随机排序的过程可以理解为shuffle过程,对应地,实现shuffle过程的模块可以称为shuffle模块。

在一种可能的情况中,为了避免服务器持续不停地进行训练的情况,服务器可以根据预设轮数,在训练轮数达到预设轮数的时候停止训练。具体地,在完成一轮训练后,服务器更新训练轮数,如果训练轮数没有达到预设轮数,则继续下一轮训练,其中,服务器更新训练轮数的方式可以是对epoch加1处理,其中,epoch用于表征训练轮数。

进一步地,为了进一步保证识别结果的准确性,在进行下一轮训练之前,服务器可以对已训练过的多张训练图像进行随机排序处理,利用随机排序处理后的训练图像进行下一轮训练,也就是说,服务器在加载完各个批次的训练图像进行训练后,确定完成一轮训练,然后对多种训练图像进行随机排序处理,利用随机排序处理后的训练图像进行下一轮训练;其中,对多种训练图像进行随机排序处理的方式可以是先获取训练图像的索引(index),然后利用shuffle模块对索引进行随机排序处理。

图3示出了本申请深度学习网络的训练方法的另外一个实施例,以下以识别动物的应用场景为例,结合图3对该实施例进行介绍:

动物的图像训练集,包括训练图像和标记图像,标记图像可以是对训练图像中的猪(在本实施例中以猪为特征物)进行画框标记后得到的;服务器在得到动物的图像训练集后,将训练图像和标记图像分批加载至深度学习网络中,并进行训练,其中,利用每批训练图像进行训练的过程包括步骤s302至s308,具体地,步骤s302至s308为:

步骤s302,加载训练图像和对应的标记图像;

步骤s304,按照预先设定的滑动步长和块尺寸,对训练图像进行patch分割,得到多个图像块集合,各个图像块集合包括的图像块个数相同;

步骤s306,在对图像块集合中的图像块进行特征提取处理之后,对处理后的图像块集合中的图像块和标记图像进行映射处理;

步骤s308,对映射处理后的图像块和标记图像进行参数调整学习,得到深度学习网络的参数;

在加载完全部批次的训练图像后,确定完成一轮训练,更新训练轮数,即对epoch加1处理(即步骤s310);

步骤s312,获取训练图像的索引,利用shuffle模块对索引进行随机排序处理;

步骤s314,在随机排序处理后,得到对应的训练图像集,对该图像训练集进行分批处理,得到多批训练图像。

在本实施例中,按照预设的滑动步长和块尺寸进行patch分割,解决了需要对图像块进行尺寸归一化导致的像素损失、精度降低的问题,保证了深度学习训练中特征局部提取的精度,保证识别结果的准确性;并且先加载训练图像后进行patch分割,避免了需要对标记图像进行对应的patch分割的情况,减少了基于patch的训练集的重构、离线存储和预处理等时间,提高训练的效率以及节约训练所需的空间。

应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图4所示,提供了一种深度学习网络的训练装置400,包括:图像加载模块402、块分割模块404、映射处理模块406和参数调整学习模块408,其中:

图像加载模块402,用于加载训练图像和标记图像;标记图像为对训练图像中的特征进行标记后得到的;

块分割模块404,用于按照预先设定的分割尺寸,对训练图像进行块分割,得到多个图像块;

映射处理模块406,用于在对多个图像块进行特征提取处理之后,对处理后的多个图像块和所述标记图像进行映射处理;

参数调整学习模块408,用于对映射处理后的图像块和标记图像进行参数调整学习,得到深度学习网络的参数。

在一个实施例中,当训练图像为多张时,各张训练图像对应不同的图像块集合,各个图像块集合包括的图像块个数相同。

在一个实施例中,块分割模块404,还用于获取预设的滑动步长和块尺寸;按照滑动步长和块尺寸,对训练图像进行滑动分割处理,得到多个图像块。

在一个实施例中,当训练图像为多张时,各张训练图像对应不同的图像块集合,各个图像块集合中的图像块进行拼接后得到的拼接尺寸和分割前的训练图像的尺寸相同。

在一个实施例中,深度学习网络的训练装置400,还包括:排序处理第一模块,用于获取多张训练图像;利用shuffle模块对多张训练图像进行随机排序处理;批次分类模块,用于对随机排序处理后的训练图像进行批次分类,得到多批训练图像;图像加载模块,用于分批次加载训练图像进行训练。

在一个实施例中,深度学习网络的训练装置400,还包括:训练轮数确定模块,用于若加载完各个批次的训练图像进行训练后,确定完成一轮训练;排序处理第二模块,用于利用shuffle模块对多张训练图像的索引进行随机排序处理,进行下一轮训练。

在一个实施例中,训练轮数确定模块,还用于更新训练轮数;排序处理第三模块,用于若训练轮数未达到预设轮数,利用shuffle模块对多张训练图像的索引进行随机排序处理,进行下一轮训练。

关于深度学习网络的训练装置的具体限定可以参见上文中对于深度学习网络的训练方法的限定,在此不再赘述。上述深度学习网络的训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:

加载训练图像和标记图像;标记图像为对训练图像中的特征物进行标记后得到的;

按照预先设定的块尺寸,对训练图像进行块分割,得到多个图像块;

在对多个图像块进行特征提取处理之后,对处理后的多个图像块和所述标记图像进行映射处理;

对映射处理后的图像块和标记图像进行参数调整学习,得到深度学习网络的参数。

在一个实施例中,当训练图像为多张时,各张训练图像对应不同的图像块集合,各个图像块集合包括的图像块个数相同。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取预设的滑动步长和块尺寸;按照滑动步长和块尺寸,对训练图像进行滑动分割处理,得到多个图像块。

在一个实施例中,当训练图像为多张时,各张训练图像对应不同的图像块集合,各个图像块集合中的图像块进行拼接后得到的拼接尺寸和分割前的训练图像的尺寸相同。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取多张训练图像;利用shuffle模块对多张训练图像进行随机排序处理;对随机排序处理后的训练图像进行批次分类,得到多批训练图像;分批次加载训练图像进行训练。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:若加载完各个批次的训练图像进行训练后,确定完成一轮训练;利用shuffle模块对多张训练图像的索引进行随机排序处理,进行下一轮训练。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:更新训练轮数;若训练轮数未达到预设轮数,则利用shuffle模块对多张训练图像的索引进行随机排序处理,进行下一轮训练。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

加载训练图像和标记图像;标记图像为对训练图像中的特征物进行标记后得到的;

按照预先设定的块尺寸,对训练图像进行块分割,得到多个图像块;

在对多个图像块进行特征提取处理之后,对处理后的多个图像块和所述标记图像进行映射处理;

对映射处理后的图像块和标记图像进行参数调整学习,得到深度学习网络的参数。

在一个实施例中,当训练图像为多张时,各张训练图像对应不同的图像块集合,各个图像块集合包括的图像块个数相同。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取预设的滑动步长和块尺寸;按照滑动步长和块尺寸,对训练图像进行滑动分割处理,得到多个图像块。

在一个实施例中,当训练图像为多张时,各张训练图像对应不同的图像块集合,各个图像块集合中的图像块进行拼接后得到的拼接尺寸和分割前的训练图像的尺寸相同。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取多张训练图像;利用shuffle模块对多张训练图像进行随机排序处理;对随机排序处理后的训练图像进行批次分类,得到多批训练图像;分批次加载训练图像进行训练。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:若加载完各个批次的训练图像进行训练后,确定完成一轮训练;利用shuffle模块对多张训练图像的索引进行随机排序处理,进行下一轮训练。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:更新训练轮数;若训练轮数未达到预设轮数,则利用shuffle模块对多张训练图像的索引进行随机排序处理,进行下一轮训练。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-onlymemory,rom)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(randomaccessmemory,ram)或外部高速缓冲存储器。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(staticrandomaccessmemory,sram)或动态随机存取存储器(dynamicrandomaccessmemory,dram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1