一种图像分类模型的优化方法及装置与流程

文档序号:25950848发布日期:2021-07-20 17:07阅读:69来源:国知局
一种图像分类模型的优化方法及装置与流程

本申请属于图像处理技术领域,尤其涉及一种图像分类模型的优化方法及装置。



背景技术:

针对已经完成训练的图像分类模型来讲,当应用于不同的场景时,图像分类模型的效果可能不同。在有的场景中,图像分类模型的准确率较低。因此,为了提高图像分类模型在不同场景下的准确率,往往会利用新场景的新增图像,对图像分类模型进行优化。一种常见的优化方式未基于增量学习方法实现对图像分类模型的优化。

然而,现有增量学习方法往往是在图像分类模型的历史图像中,按照与新增图像的比例,选择一部分历史图像。然后基于选择的历史图像和新增图像对图像分类模型进行训练。这导致没有被选中的历史图像可能被遗忘,出现模型偏移(该图像分类模型在历史图像集上的性能下降)问题。



技术实现要素:

本申请实施例提供了一种图像分类模型的优化方法及装置,可以解决现有技术中,利用增量学习方法对图像分类模型进行优化的过程中造成的模型偏移的问题。

第一方面,本申请提供一种图像分类模型的优化方法,包括:

获取新增图像集,所述新增图像中的新增图像为目标监控区域中监控图像,所述监控图像被标记有图像类别;

利用所述新增图像集和图像分类模型的历史图像集对所述图像分类模型进行n轮训练;其中,所述n轮中的第i轮训练过程包括:

从所述历史图像集中的第一剩余图像中选择m个历史图像,m与所述新增图像集中的新增图像个数p满足预设比例,所述第一剩余图像为在本轮训练之前未被选中的历史图像;

利用所述m个历史图像和所述新增图像集对所述图像分类模型进行迭代训练;其中,p、n、m以及i均为大于1的整数。

采用本申请提供的图像分类模型的优化方法,在对图像分类模型进行训练时,在每轮一训练过程中,都从历史图像集中进行一次图像采集。且每一次采集的图像都不一样。因此,相比于现有的增量学习方法,采用本申请中能够使得图像分类模型学习到更多的历史图像,从而降低图像分类模型在优化的过程中,出现模型偏移的可能性。

第二方面,本申请提供一种图像分类模型的优化装置,包括:

获取单元,用于获取新增图像集,所述新增图像中的新增图像为目标监控区域中监控图像,所述监控图像被标记有图像类别;

训练单元,用于利用所述新增图像集和图像分类模型的历史图像集对所述图像分类模型进行n轮训练;其中,所述n轮中的第i轮训练过程包括:

从所述历史图像集中的第一剩余图像中选择m个历史图像,m与所述新增图像集中的新增图像个数满足预设比例,所述第一剩余图像为在本轮训练之前未被选中的历史图像;

利用所述m个历史图像和所述新增图像集对所述图像分类模型进行迭代训练;其中,n、m以及i均为大于1的整数。

第三方面,本发明实施例提供一种终端设备,包括处理器、存储器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如第一方面或者第一方面的任一可选方式所述的图像分类模型的优化方法。

第四方面,本发明实施例提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,其特征在于,计算机程序被处理器执行时实现如第一方面或者第一方面的任一可选方式所述的图像分类模型的优化方法。

第五方面,本发明实施例提供一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面或者第一方面的任一可选方式所述的图像分类模型的优化方法。

可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种图像分类模型的优化方法的一个实施例的流程图;

图2为本申请提供的一种数据采集的示意图;

图3为本发明实施例提供的另一种图像分类模型的优化方法的一个实施例的流程图;

图4是本申请提供的一种图像分类模型的优化装置的结构示意图;

图5是本申请提供的一种终端设备的结构示意图。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。

应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。

本申请实施例提供一种目标网络的优化方法,基于本申请提供的新的增量学习法,能够在保证图像分类模型不发生偏移的情况下,实现对目标网络的优化。

下面结合具体实施例,对本申请提供的一种图像分类模型的优化方法进行示例性的说明。

参见图1,为本发明实施例提供的一种图像分类模型的优化方法的一个实施例的流程图。主要描述了基于本申请提供的新的增量学习方法对图像分类模型进行优化的过程。本实施例中的图像分类模型的优化方法执行主体为终端设备。参见图1,本申请提供的图像分类模型的优化方法包括:

s101,获取新增图像集,所述新增图像中的新增图像为目标监控区域中监控图像,所述监控图像被标记有图像类别。

其中,新增图像集中的新增图像可以是终端设备在目标监控区域中收集到的监控图像。

例如,目标监控区域可以是商场、公园、办公楼等,新增图像可以是在该监控区域内收集到的监控图像,且每个监控图像均被标记(即标记监控图像的类别)。

s102,利用所述新增图像集和待优化的图像分类模型的历史图像集对所述图像分类模型进行n轮(即epoch=n)训练。其中,所述n轮中的第i轮训练过程包括:从所述历史图像集中的第一剩余图像中选择m个历史图像,m与所述新增图像集中的新增图像个数p满足预设比例,所述第一剩余图像为在本轮训练之前未被选中的历史图像;利用所述m个历史图像和所述新增图像集对所述图像分类模型进行迭代训练;其中,p、n、m以及i均为大于1的整数。

其中,图像分类模型对图像进行分类识别,历史图像集中的历史图像为该图像分类模型的历史训练数据。

示例性的,以目标监控区域为公园为例,公园中的监控终端中设置有该图像分类模型,用于对该公园的监控图像进行分类识别,确定异常图像,以便于监控公园内发生的异常事件。为了提高图像分类模型对该公园内的监控图像的分类识别的正确率,采用该公园内已经完成分类标记的监控图像作为新增图像集,基于上述步骤s101-s102,对该图像分类模型进行训练,以使得图像分类模型基于新增图像集的数据特点,对图像分类模型的网络参数进行修改,从而提高图像分类模型对该公园内监控图像的分类识别的正确率。

其中,预设比例可以是新增图像个数p和历史图像个数m的比。例如该预设比例可以是0.5:0.5,也可以是0.9:0.1,还可以是0.6:0.4。对此,本申请不做限制。

终端设备可以基于新增图像个数和预设比例,确定历史图像个数m。

可以理解的是,利用目标监控区域的新增图像和历史图像对图像分类模型进行迭代训练,当训练收敛后,即可得到优化后的图像分类模型,提高了图像分类模型在目标监控区域下的准确率。

值得说明的是,上述s102为本申请提供给的一种新的增量学习方法,即在每轮一训练过程中,都从历史图像集中进行一次图像采集。且每一次采集的图像都不一样。也就是说,当n大于1时,相比于现有的增量学习方法,采用本申请提供的增量学习方法,能够使得图像分类模型学习到更多的历史图像,从而降低图像分类模型在优化的过程中,出现模型偏移的可能性。

在一种可能的场景中,假设历史图像集中包括x个历史图像,那么当n≥x/m时,图像分类模型则可以学习到所有的历史图像,从而避免图像分类模型在优化过程中,出现模型偏移的问题。

在一个示例中,终端设备执行上述s102中利用所述新增图像集和图像分类模型的历史图像集对所述图像分类模型进行n轮训练之前,可以先对所述新增图像集和所述历史图像集中的图像排列顺序进行随机调整。以降低在一轮训练中选择到数据特征类似的新增图像和历史图像的概率,进而降低图像分类模型进行优化的过程中,出现模型偏移的可能性。

示例性的,当终端设备从所述历史图像集中的第一剩余图像中选择m个历史图像时,可以按照所述第一剩余图像在所述历史图像集中的图像排列顺序选择m个历史图像。即从第一剩余图像中的第一个历史图像开始,依次选择m个历史图像,从而降低图像采集的复杂度,提高效率。

或者,也可以从第一剩余图像中随机选择m个历史图像。

示例性的,每一轮训练中,m个历史图像和新增图像集的采集方式可以如图2所示,在每一轮训练中,采集的m个历史图像都不相同。

可选的,在每一轮训练中,终端设备利用所述m个历史图像和所述新增图像集对所述图像分类模型进行迭代训练时,将m个历史图像和p个新增图像划分为k次(batch),利用所述m个历史图像和所述新增图像集对所述图像分类模型进行k次迭代训练。

示例性的,所述k次中的第j次训练过程可以包括:从所述m个历史图像中的第二剩余图像中选择m/k个历史图像,所述第二剩余图像为在本次训练之前未被选中的历史图像,k以及j均为大于1的整数;从所述新增图像集中按照顺序选择p/k个新增图像;利用所述m/k个历史图像和所述p/k个新增图像对所述图像分类模型进行训练。

其中,p/k和m/k之间的比例也满足预设比例。

在本申请实施例中,终端设备在每一轮的每一次训练过程中,都选择不同的m/k个历史图像。从而保证每一轮训练过程中,选择的m个历史图像都能参与图像分类模型的训练。相比于现有技术中每一轮的每一次训练过程中,从历史图像中随机选择参与训练的历史图像,避免出现部分历史图像多次被选择,而部分历史图像被漏掉的问题,选择进一步保证了图像分类模型在优化过程中,出现模型偏移的可能性。

示例性的,终端设备从所述m个历史图像中的第二剩余图像中选择m/k个历史图像时,可以按照所述m个历史图像的排列顺序从所述第二剩余图像中选择m/k个历史图像。即从第二剩余图像中的第1个历史图像开始,选择m/k个历史图像。

参见图3,为本发明实施例提供的另一种图像分类模型的优化方法的一个实施例的流程图。主要描述了通过将主动学习和增量学习结合,实现对图像分类模型进行优化的过程,其中,增量学习为本申请提供的新的增量学习方法。

如图3所示,该方法包括:

s301,获取所述目标监控区域的原始图像集。

其中,原始图像集为目标监控区域中收集到的未被标记的监控图像。

s302,基于主动学习(activelearning)方法,从所述原始图像集中选择不确定性最高的部分图像,构成所述新增图像集。

由于原始图像集中的监控图像的数量往往非常大,若使用所有的监控图像对图像分类模型进行优化训练,则需要耗费大量的人力物力进行人工标记,得到每个监控图像的类别。

因此,在本申请实施例中,基于主动学习法,从原始图像集中选择一部分图像,并对这一部分图像进行人工标记,得到标记有图像类别的监控图像,构成新增图像集。

其中,主动学习法往往基于数据的不确定性或者多样性挑选出不确定性高的监控图像。

例如,终端设备可以利用熵(entropy)值来衡量一个监控图像的不确定性,熵值越大,不确定性就越大,不确定性越大,该监控图像对图像分类模型的优化效果就更好。示例性的,计算熵值的一种可能方式可以如下公式所示:

其中,h(li)表示原始图像集中第i个监控图像xi的熵值;j表示类别索引数,j=1,2,……,c。cj表示第j个类别,p(cj|xi)表示监控图像xi属于类别cj的概率。

可以理解的是,通过主动学习方法,可以大大降低监控图像的标记数量,减少后续图像分类模型在优化过程中的数据计算量,挑选出对图像分类模型的优化效率更高的监控图像,进而得到图像分类模型的优化效率更高的新增图像集。

s303,利用所述新增图像集和图像分类模型的历史图像集对所述图像分类模型进行n轮训练。其中,所述n轮中的第i轮训练过程包括:从所述历史图像集中的第一剩余图像中选择m个历史图像,m与所述新增图像集中的新增图像个数p满足预设比例,所述第一剩余图像为在本轮训练之前未被选中的历史图像;利用所述m个历史图像和所述新增图像集对所述图像分类模型进行迭代训练。

当利用主动学习方法获得数据量较小但优化效率高的新增图像集后,利用增量学习方法提高对目标网路模型进行训练的迭代效率,从而提高了图像分类模型的优化效率。且在该示例中,采用本申请提供的增量学习方法,能够保证图像分类模型在优化过程中学习到更多的历史图像,降低了图像分类模型在优化过程发生模型偏移的问题。

对应于上文实施例所述的图像分类模型的优化方法,图4示出了本发明实施例提供的图像分类模型的优化装置的结构框图,为了便于说明,仅示出了与本发明实施例相关的部分。

参照图4,该一种图像分类模型的优化装置,包括:

获取单元401,用于获取新增图像集,所述新增图像中的新增图像为目标监控区域中监控图像,所述监控图像被标记有图像类别。

训练单元402,用于利用所述新增图像集和图像分类模型的历史图像集对所述图像分类模型进行n轮训练;其中,所述n轮中的第i轮训练过程包括:

从所述历史图像集中的第一剩余图像中选择m个历史图像,m与所述新增图像集中的新增图像个数p满足预设比例,所述第一剩余图像为在本轮训练之前未被选中的历史图像;

利用所述m个历史图像和所述新增图像集对所述图像分类模型进行迭代训练;其中,p、n、m以及i均为大于1的整数。

可选的,所述训练单元402利用所述新增图像集和图像分类模型的历史图像集对所述图像分类模型进行n轮训练之前,所述方法还包括:

对所述新增图像集和所述历史图像集中的图像排列顺序进行随机调整。

可选的,所述训练单元402从所述历史图像集中的第一剩余图像中选择m个历史图像,包括:按照所述第一剩余图像在所述历史图像集中的图像排列顺序选择m个历史图像。

可选的,所述训练单元402利用所述m个历史图像和所述新增图像集对所述图像分类模型进行迭代训练,包括:利用所述m个历史图像和所述新增图像集对所述图像分类模型进行k次迭代训练;其中,所述k次中的第j次训练过程包括:从所述m个历史图像中的第二剩余图像中选择m/k个历史图像,所述第二剩余图像为在本次训练之前未被选中的历史图像,k以及j均为大于1的整数;从所述新增图像集中按照顺序选择p/k个新增图像;利用所述m/k个历史图像和所述p/k个新增图像对所述图像分类模型进行训练。

可选的,所述训练单元402从所述m个历史图像中的第二剩余图像中选择m/k个历史图像,包括:按照所述m个历史图像的排列顺序从所述第二剩余图像中选择m/k个历史图像。

可选的,所述获取单元401获取目标监控区域的新增图像集,包括:获取所述目标监控区域的原始图像集;基于主动学习法,从所述原始图像集中选择不确定性最高的部分数据,构成所述新增图像集。

在本发明实施例中,该图像分类模型的优化装置可以是终端设备,或者是终端设备中的芯片,或者是集成在终端设备中的功能模块。其中,该芯片或者该功能模块可以位于终端设备中,控制终端设备实现本发明实施例提供的用图像分类模型的优化方法。

参见图5,为本发明实施例提供的一种终端设备,包括:至少一个处理器50(图5中仅示出一个)处理器、存储器51以及存储在存储器51中并可在至少一个处理器50上运行的计算机程序52,处理器50执行计算机程序52时实现上述图像分类模型的优化方法实施例中的步骤。

所称处理器50可以是中央处理单元(centralprocessingunit,cpu),该处理器50还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器51在一些实施例中可以是终端设备的内部存储单元,例如终端设备的硬盘或内存。存储器51在另一些实施例中也可以是终端设备的外部存储设备,例如终端设备上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,存储器51还可以既包括终端设备的内部存储单元也包括外部存储设备。存储器51用于存储操作系统、应用程序、引导装载程序(bootloader)、数据以及其他程序等,例如计算机程序52的程序代码等。存储器51还可以用于暂时地存储已经输出或者将要输出的数据。

本领域技术人员可以理解,图5仅仅是终端设备的举例,并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备、扫描仪等。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本发明实施例的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。

相应的,本发明实施例提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如本发明实施例提供的图像分类模型的优化方法。

本发明实施例还提供一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行本发明实施例提供的图像分类模型的优化方法。

其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1