图片分割方法、装置和系统与流程

文档序号:19895968发布日期:2020-02-11 13:16阅读:221来源:国知局
图片分割方法、装置和系统与流程

本发明涉及图像处理领域,具体而言,涉及一种图片分割方法、装置和系统。



背景技术:

电商平台广告、店铺装修等图片需求量巨大,将目标商品从图像中按照边缘单独抠出是其它相关操作或进一步设计的前提,对于设计人员的业务需求增多,相关工作人员工作量巨大,图像设计智能化是缓解这一问题的有效方法。

目前,在图片处理的业务中,对图像进行分割的方式通常包括:(1)语义分割方法,对于电商平台数千上万种商品在平面广告等图像载体中的分割问题来说,如果使用语义分割,则需要大量的样本来训练分割网络,但商品类目繁多,各类目可收集样本数量相差较大,且部分类目内图像特征差异也较大,而语义分割的方案目前需要每个类目大量的样本数据对网络进行训练,因此导致很多图片无法使用语义分割。(2)显著性分割,如果使用显著性分割,由于显著性分割时缺乏语义信息,不利于后期处理,且当图像中目标的显著性不强时,分割效果较差。

针对现有技术中图像分割效果不佳的问题,目前尚未提出有效的解决方案。



技术实现要素:

本发明实施例提供了一种图片分割方法、装置和系统,以至少解决现有技术中图像分割效果不佳的技术问题。

根据本发明实施例的一个方面,提供了一种图片分割方法,包括:通过对图片进行特征提取,从候选分割算法中选择与图片对应的目标分割算法,其中,候选分割算法包括:显著性分割算法和语义分割算法;使用目标分割算法对图片进行粗分割,得到第一分割结果,其中,粗分割用于初步确定图片中的目标对象;对第一分割结果进行细分割,得到图片中的目标对象。

根据本发明实施例的另一方面,还提供了一种图片分割方法,包括:通过分割模型的主干网络对图片进行特征提取,以从候选分割算法中选择与图片对应的目标分割算法,其中,候选分割算法包括:显著性分割算法和语义分割算法;通过分割模型中与目标分割算法对应的分割网络,根据特征提取得到的特征层,对图片进行第一分割处理,其中,分割网络包括:语义分割网络和显著性分割网络,显著性分割网络用于对图片进行显著性分割,语义分割网络用于对图片进行语义分割。

根据本发明实施例的另一方面,还提供了一种图片分割装置,包括:选择模块,用于通过对图片进行特征提取,从候选分割算法中选择与图片对应的目标分割算法,其中,候选分割算法包括:显著性分割算法和语义分割算法;第一分割模块,用于使用目标分割算法对图片进行粗分割,得到第一分割结果,其中,粗分割用于初步确定图片中的目标对象;第二分割模块,用于对第一分割结果进行细分割,得到图片中的目标对象。

根据本发明实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行如下步骤:通过对图片进行特征提取,从候选分割算法中选择与图片对应的目标分割算法,其中,候选分割算法包括:显著性分割算法和语义分割算法;使用目标分割算法对图片进行粗分割,得到第一分割结果,其中,粗分割用于初步确定图片中的目标对象;对第一分割结果进行细分割,得到图片中的目标对象。

根据本发明实施例的另一方面,还提供了一种处理器,其特征在于,处理器用于运行程序,其中,程序运行时执行如下步骤:通过对图片进行特征提取,从候选分割算法中选择与图片对应的目标分割算法,其中,候选分割算法包括:显著性分割算法和语义分割算法;使用目标分割算法对图片进行粗分割,得到第一分割结果,其中,粗分割用于初步确定图片中的目标对象;对第一分割结果进行细分割,得到图片中的目标对象。

根据本发明实施例的另一方面,还提供了一种图片分割系统,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:通过对图片进行特征提取,从候选分割算法中选择与图片对应的目标分割算法,其中,候选分割算法包括:显著性分割算法和语义分割算法;使用目标分割算法对图片进行粗分割,得到第一分割结果,其中,粗分割用于初步确定图片中的目标对象;对第一分割结果进行细分割,得到图片中的目标对象。

在本发明实施例中,通过对图片进行特征提取,从候选分割算法中选择与图片对应的目标分割算法,其中,候选分割算法包括:显著性分割算法和语义分割算法;使用目标分割算法对图片进行粗分割,得到第一分割结果,其中,粗分割用于初步确定图片中的目标对象;对第一分割结果进行细分割,得到图片中的目标对象。上述方案通过对图片进行特征提取以确定图片对应的目标分割算法,从而可以应对电商领域中商品类目的开放和繁杂,解决了现有技术中图像分割效果不佳的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1示出了一种用于实现图片分割方法的计算机终端(或移动设备)的硬件结构框图;

图2是根据本发明实施例1的图片分割方法的流程图;

图3是根据本申请实施例1的一种主干网络参数的示意图;

图4是根据本申请实施例1的一种分割模型的示意图;

图5是根据本申请实施例2的一种图片分割方法的流程图;

图6是根据实施例3的图片分割装置的示意图;

图7是根据实施例4的图片分割装置的示意图;以及

图8是根据本发明实施例6的一种计算机终端的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:

语义分割:在像素层面上,从图像中分割出指定类目范围内的物体。

显著性分割:在像素层面上,从图像中分割出最具显著性的主体物体,与物体所属类目无关。

深度卷积神经网络:神经网络的一种,通常具有较多隐含层及大量参数,隐含层通常以卷积、池化、全连接等结构实现,是当前图像处理领域中的主要方法。

实施例1

根据本发明实施例,还提供了一种图片分割方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现图片分割方法的计算机终端(或移动设备)的硬件结构框图。如图1所示,计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。除此以外,还可以包括:显示器、输入/输出接口(i/o接口)、通用串行总线(usb)端口(可以作为i/o接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。

应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。

存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的图片分割方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的图片分割方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(networkinterfacecontroller,nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(radiofrequency,rf)模块,其用于通过无线方式与互联网进行通讯。

显示器可以例如触摸屏式的液晶显示器(lcd),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。

此处需要说明的是,在一些可选实施例中,上述图1所示的计算机设备(或移动设备)可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图1仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算机设备(或移动设备)中的部件的类型。

在上述运行环境下,本申请提供了如图2所示的图片分割方法。图2是根据本发明实施例1的图片分割方法的流程图。

步骤s21,通过对图片进行特征提取,从候选分割算法中选择与图片对应的目标分割算法,其中,候选分割算法包括:显著性分割算法和语义分割算法。具体的,显著性分割算法通常没有类目限制,对图像中相对显著的前景目标进行分割,不关心具体所属类目,但是由于缺乏语义信息,因此缺乏对类目共性特征的理解,难以达到准确分割的效果。语义分割算法是在图片中分割出指定类目范围内的目标,常用的pascalvoc数据集即包含20类常见目标,包括人、鸟、飞机、瓶子等,其他的东西均视为背景,无需区分,但在训练模型时需要大量的样本数据,否则难以得到准确的分割结果。

在上述方案中,对图片进行特征提取的方式可以是,通过神经网络模型中的卷积层,对图片进行卷积和最大池化处理,得到图片在多种尺寸下的特征层,特征层用于记录图片特征。在得到对图片的特征提取结果后,可以通过多种方式确定目标分割算法。

在一种可选的实施例中,可以通过分割模型实现本方案,分割模型为卷积神经网络模型,包括用于确定算法的主干网络、用于进行显著性分割的显著性分割网络和用于进行语义分割的语义分割网络。图片从主干网络输入,主干网络用于提取图片的特征,如果主干网络能够根据图片的特征层确定图片所属的类目,则说明分割模型通过主干网络能够确定图片中的显著区域具体是什么,因此可以通过语义分割算法对图片进行粗分割;如果主干网络根据图片的特征层无法确定图片属于何种类目,则说明分割模型通过主干网络无法确定图片中显著区域的是何物,因此可以通过显著性分割算法对图片进行粗分割。

在另一种可选的实施例中,仍以上述分割模型为例,可以在对图片进行分割前,预设需要进行语义分割的类目,以及需要进行显著性分割的类目,当主干网络通过特征提取确定图片所属的类目之后,根据类目与分割算法的对应关系,确定图片对应的目标分割算法。更具体的,上述预设需要进行语义分割的类目,可以是样本图片的数量大于预设值的类目,需要进行显著性分割的类目可以是样本小于或等于预设值的类目。

上述方案对于分割模型来说,接收从主干网络输入的图片,主干网络对图片进行特征提取结果,根据特征提取结果,将图片输入至目标算法对应的分割网络,即显著性分割网络或语义分割网络。

步骤s25,使用目标分割算法对图片进行粗分割,得到第一分割结果,其中,粗分割用于初步确定图片中的目标对象。

具体的,上述粗分割用于对图像进行像素级分割,从而确定图片中的目标对象(即显著区域),相比于细分割,得到的结果较粗糙。经过粗分割得到的第一分割结果实际上是图片对应的掩膜,该掩膜用于区分图片的前景颜色和背景颜色,其中,掩膜中的前景颜色用于指示目标对象所处的区域。在第一分割结果中,前景颜色可以全部置0,背景颜色可以全部置1,从而能够对前景颜色和背景颜色进行区分。

在一种可选的实施例中,可以使用分类器,根据图片所属的类目,对图片进行分类。具体的,在确定图片所属的类目后,使用分类器将其分类至与类目相对应的算法模块中,该算法模块可以是用于对图片进行粗分割的分割网络,从而实现了对图片进行分割的第一步,即对图片进行粗分割。

步骤s27,对第一分割结果进行细分割,得到图片中的目标对象。

具体的,上述目标对象为图片中的显著区域,即为需要从图片中分割出来的部分。上述细分割用于在第一分割结果的基础上,对图片中目标对象的边缘进行细化,从而真正的从图片中分割出目标对象。

在通过粗分割初步确定图片中的目标对象后,可以通过细分割来确定目标对象更细致的边界,更具体的,细分割可以是通过对结果中前景及背景像素颜色进行统计建模,可以获得各像素从属于前/背景的先验概率分布,再基于颜色距离信息及位置距离信息,使用最大流/最小割算法对图像商品主体进行二次分割,可以有效提高初次分割的准确率。

在一种可选的实施例中,可以使用grabcut算法对第一分割结果进行细分割。grabcut算法主要包括如下几个步骤(1)首先在初始化时通过聚类算法为整张图片第一分割结果中的背景颜色和前景颜色分别进行混合高斯分布模型建模,(2)为针对全局像素的期望最大化算法,修正(1)中所获得的混合高斯分布模型,(3)通过最大流最小割算法对图片进行进一步分割,并在(2)和(3)中进行迭代,直至循环至指定次数。

本申请上述实施例通过对图片进行特征提取,从候选分割算法中选择与图片对应的目标分割算法,其中,候选分割算法包括:显著性分割算法和语义分割算法;使用目标分割算法对图片进行粗分割,得到第一分割结果,其中,粗分割用于初步确定图片中的目标对象;对第一分割结果进行细分割,得到图片中的目标对象。上述方案通过对图片进行特征提取以确定图片对应的目标分割算法,从而可以应对电商领域中商品类目的开放和繁杂,解决了现有技术中图像分割效果不佳的技术问题。

进一步地,在上述方案中,语义分割算法和显著性分割算法都可以直接获取到图片特征提取得到的图片特征,进行分割处理,从而还能够达到节省gpu显存,加快计算速度的效果。

作为一种可选的实施例,通过对图片进行特征提取,从候选分割算法中选择与图片对应的目标分割算法,包括:将图片输入至分割模型中的主干网络,由主干网络通过对图片进行特征提取,将图片分配至对应的节点,其中,节点包括:分别与样本图片的数量超过预设值的每个类目对应的第一节点,和与样本图片小于或等于预设值的所有类目对应的一个第二节点;如果将图片分配至第一节点,确定目标分割算法为语义分割算法;如果将图片分配至第二节点,确定目标分割算法为显著性分割算法。

具体的,类目用于指类别,上述图片所属的类目可以用于表示图片中目标对象所属的类别。以电商领域的图片为例,图片的类目可以是:服装、化妆品、食品等,该示例对类目的划分较粗,还可以继续进行划分,例如:服装可以包括:连衣裙、半身裙、毛衣、开衫等。

仍在电商领域中,如果需要处理的图片为多种类型的图片,既有服装的图片,也有化妆品、食品等物品的图片,可以使用划分较粗的类目;如果已知需要处理的图片都属于服装,则可以服装对应的划分较细的类目。

上述分割模型可以是卷积神经网络模型,在一种可选的实施例中,主干网络可以是vgg网络(visualgeomrtrygroupnetwork,神经网络),包括多个卷积层,每个卷积层根据对应的参数,对图片进行卷积和最大池化处理(con+maxpool)。图3是根据本申请实施例1的一种主干网络的参数的示意图,图4是根据本申请实施例1的一种分割模型的示意图,如图3和图4所示,该主干网络具有五个卷积层,每个特征提取曾具有对应的参数包括:层类型、核大小以及通道数量,每个卷积层都能够输出对应的特征层。

自然图像具有其固有特征,也就是说,图像的一部分的统计特征与其他部分是一样的,这也就意味着,在一部分的学习特征可以用在其他部分,也即,对这个图像上的所有位置,都能使用同样的学习特征。更具体的说,当从一个大尺寸图像中随机选取一小块,比如以3*3作为样本,并且从这个小块样本上学写了一些特征,这是可以把从这个3*3样本中学习的特征作为探测器,上述主干网络的参数中,卷积层的核大小即为作为探测器的小块样本的大小,将小块样本应用到这个图像的任意位置,可以用从这个3*3样本中学习到的特征跟原本的大尺寸图像进行卷积,从而对这个大尺寸图像上的任意位置获得一个不同特征的激活值。而最大池化处理用于对邻域内特征点取最大,maxpool能够减小卷积层参数误差造成估计均值的偏移,从而保留更多的纹理信息。

在上述节点中,包括第一节点和第二节点,第一节点可以是多个,即每个样本图片的数量大于预设值的类目对应一个第一节点,第二节点为一个,包括所有本图片的数量小于或等于预设值的类目。在一种可选的实施例中,仍在电商的图像处理场景中,对于样本图像的数量大于预设值的类目,对应第一类,对于样本数量小于等于预设值的所有类目,对应第二类。

在一种可选的实施例中,在分割模型的主干网络底层有多个节点,其中,每个样本图像的数量大于预设值的类目对应一个第一节点,第一节点属于上述第一类,样本数量小于等于预设值的所有类目对应一个第二节点,第二节点属于上述第二类。主干网络对图片进行完最后一层特征提取后,分配至对应的节点,从而对图片进行对应的运算。仍结合图4所示,在主干网络下方具有全连接层(fullconnection),全连接层下方具有四个黑色圆点和两个白色圆点,每个圆点表示对一个图片的分类结果,四个黑色圆点对应的图片属于用于进行语义分割的类目,两个白色圆点对应的图片属于进行显著性分割的类目。

需要说明的是,由于语义分割可以分割出图片中的指定内容,因此语义分割容易得到更准确的分割结果,但语义分割需要大量的样本来训练模型,因此对于样本较少的类目,无法进行语义分割,因此在上述方案中,对于样本数量较多的,能够训练语义分割模型的类目,使用语义分割算法进行分割。而对于样本数量较少,无法进行语义分割的类目,使用显著性分割算法完成对图片的分割,从而既保证了样本数量较多的类目分割的准确性,又能够对样本数量较少的类目的粗分割。

还需要说明的是,随着样本总数的不断增加,样本数量小于或等于预设值的类目的样本数量也在增加,从而使得原本样本数量超过了预设值,在这种情况下,可以调整类目与分割算法的对应关系,将类目与显著性分割算法的关系更改为类目与语义分割算法的对应关系。

上述方案中,两种不同的分割网络可以直接获取到主干网络输出的特征参数,还能够达到节省gpu显存,加快计算速度的效果。

下面,对主干网络如何根据特征提取对图片分类进行说明:在一种可选的实施例中,根据特征提取的结果确定图片中每个像素属于每个节点的概率,确定每个像素位置上激活值最大的节点为像素所属的节点。

具体的,上述每个像素属于每个类目的概率,可以通过softmax映射的方法确定,即通过softmax将神经元的输出值映射到(0,1)之间,从而得到每个像素属于每个节点的概率。上述激活值用于表示神经网络中每一个神经元的计算结果,可以通过现有参数和输入值可以直接计算得到的。

作为一种可选的实施例,分割模型还包括分割网络,分割网络包括:语义分割网络和显著性分割网络,使用目标分割算法对图片进行粗分割,得到第一分割结果,包括:

步骤s231,主干网络输出的第一特征层输入至目标分割算法对应的分割网络。

步骤s233,通过分割网络对图片进行粗分割。

仍结合图4所示,主干网络左侧为语义分割网络,显著性分割网络,对于黑色圆点所表示的目标算法为语义分割算法的图片,主干网络将其特征层发送至语义分割网络进行粗分割,对于黑色圆点所表示的目标算法为显著性分割的图片,主干网络将其特征层发送至显著性分割网络进行粗分割。

由此可知,上述主干网络不仅用于对图片进行分类,确定图片对应的目标分割算法,还用于输出特征层,作为分割网络所需要的图像特征。

作为一种可选的实施例,在目标分割算法为显著性分割算法的情况下,通过分割网络对图片进行粗分割,包括:

步骤s251,按照预设的跳层规则将多个第二特征层进行堆叠,得到多个单通道预测掩膜,其中,第二特征层通过对主干网络输出的第一特征层进行卷积和反卷积的处理得到。

在上述步骤s251中,跳层规则中的层用于指的是,对主干网络的不同卷积层输出的第一特征层进行卷积和反卷积处理(conv+deconv)后得到的第二特征层。预设的跳层规则指的是,将哪些层的第二特征层进行叠加。将特征层叠加的目的在于,对不同图片尺度下获得的图像特征进行融合。在一种可选的实施例中,特征层的堆叠可以通过concat函数实现,concat函数用于连接两个或多个数组,从而返回一个新的数字。

在得到特征层堆叠结果或,在一种可选的实施例中,可以通过对叠加后的特征层进行1*1卷积,得到上述单通道预测掩膜。

以图3为例说明上述的特征层堆叠,为了便于说明,六个conv+deconv输出的第二特征层由上之下标记为10、11、12、13、14、15,虚线的指向用于表示跳层规则,再图3中,l5、l4-->l3、l2、l1、l0和l3、l2-->l1、l0。

步骤s252,获取多个单通道预测掩膜的第一线性均值。

步骤s253,确定第一线性均值为图片对应的第一分割结果。

具体的,上述第一分割结果用于区别图片中前景颜色和背景颜色,从而便于进行细分割,确定图片中目标对象的边界。

在一种可选的实施例中,结合图4所示,图4中主干网络右侧部分表示用于进行显著性分割算法(salientobjectdetect,显著性分割检测)的显著性分割网络,其中,conv用于表示卷积,deconv用于表示反卷积,图4中右侧6个标有conv+deconv的方格,层间的虚线概指层与层之间的跳层链接,在链接之前需要对应倍数的转置卷积使它们的维度相同,再通过concat函数堆叠特征层,再使用1*1卷积得到对应的单通道预测掩膜(mask)。

通过上述运算能够得到6个预测掩膜,即上述第一线性均值,对这6个预测掩膜求线性均值可以得到融合掩膜,并将这6个预测掩膜的线性均值作为第一分割结果。

作为一种可选的实施例,在目标分割算法为显著性分割算法的情况下,通过分割网络对图片进行粗分割,包括:

步骤s254,按照预设的跳层规则将多个第二特征层进行堆叠,得到多个单通道预测掩膜,其中,第二特征层通过对主干网络输出的第一特征层进行卷积和反卷积的处理得到。

具体的,上述步骤s254与步骤s251相同,此处不再赘述。

步骤s255,从多个单通道预测掩膜中提取n个单通道预测掩膜,其中,n为小于单通道预测掩膜数量的正整数。

在图4的示例中,在将多个第二特征层进行堆叠后,得到6个单通道预测掩膜,即单通道预测掩膜的数量为6因此上述n可以为小于6的正整数。

步骤s256,获取n个单通道预测掩膜的第二线性均值。

步骤s257,确定第二线性均值为图片对应的第一分割结果。

具体的,上述第一分割结果用于区别图片中前景颜色和背景颜色,从而便于进行细分割,确定图片中目标对象的边界。

在一种可选的实施例中,结合图4所示,图4中主干网络右侧部分表示用于进行显著性分割算法(salientobjectdetect,显著性分割检测)的显著性分割网络,其中,conv用于表示卷积,deconv用于表示反卷积,图4中右侧6个标有conv+deconv的方格,层间的虚线概指层与层之间的跳层链接,在链接之前需要对应倍数的转置卷积使它们的维度相同,再通过concat函数堆叠特征层,再使用1*1卷积得到对应的单通道预测掩膜(mask)。

通过上述运算能够得到6个预测掩膜,对这6个预测掩膜求线性均值可以得到融合掩膜,但如果将这6个预测掩膜的线性均值作为第一分割结果,效果并不是最佳的,因此可以根据上述方案,选择其中的部分预测掩膜的线性均值,作为第一分割结果,例如,可以选择最后三层的预测掩膜的线性均值作为第一分割结果。

作为一种可选的实施例,在目标算法为语义分割算法的情况下,通过分割网络对图片进行粗分割,包括:

步骤s258,选择主干网络中的多个卷积层。

在上述步骤中,如果选择的卷积层的数量较多,则运算消耗的时间较多,但如果选择的卷积层较少,分割的准确度较低,因此可以根据实验结果选择合适的卷积层,在本申请的上述实施例中,可以选择主干网络的最后三层卷积层进行语义分割的运算。

步骤s259,按照由下到上的顺序,将卷积层输出的第一特征层进行上采样后,与上一个卷积层输出的第一特征层进行特征叠加,得到最后一个卷积层对应的目标特征层。

在一种可选的实施例中,结合图4所示,图4中主干网络左侧部分表示用于进行语义分割算法(semanticsegmentation,语义分割)的语义分割网络,将最后三个卷积层由下至上记为s32,s16,s8。先使用转置卷积方法对s32特征层进行2倍上采样,然后与s16的特征层通过concat堆叠,将结果再次进行2倍上采样,与s8特征层通过concat进行堆叠,可获得一个特征图边长为输入图像边长1/8的特征图,该特征图即为上述目标特征层。

步骤s261,对目标特征层进行卷积,使目标特征层的通道数量为第一节点的数量。

步骤s263,通过对卷积后的目标特征层进行上采样,将卷积后的目标特征层的大小调整至与图片的大小一致。

在一种可选的实施例中,如图4所示,在该示例中,语义分割网络仅针对主干网络的最后三个卷积层进行处理,即对最后三个卷积层输出的特征层进行叠加,得到目标特征层,对目标特征层进行1*1卷积,使目标特征层的通道数量为待分类的类目数量,最后通过n倍上采样使特征图的大小与输入图像的大小一致。仍在上述实施例中,由于目标特征层为输入图像边长的1/8,因此可以对目标特征层进行8倍上采样,从而使目标特征层的大小与输入图片一致。

作为一种可选的实施例,对第一分割结果进行细分割,得到图片中的目标对象,包括:

步骤s271,将图片缩小至第一预设尺寸。

上述步骤将图片缩小,目的在于减小后续的运算处理所花费的时间,但对图片进行缩小的代价是,会牺牲分割的精度,因此上述第一预设尺寸需要在能够节省较多的运算时间的情况下,损失较小的分割精度。

步骤s273,通过聚类算法为第一分割结果中的前景颜色和背景颜色进行高斯建模,得到混合高斯分布模型,其中,混合高斯分布模型用于表征图片中每个像素点为前景颜色或背景颜色的概率。

第一分割结果给出了预测掩膜,预测掩膜指示了前景颜色和背景颜色,在上述步骤中,通过对前景颜色和背景颜色进行高斯建模,得到图片中每个像素点属于前景颜色或属于背景颜色的概率。在进行分割时候,按照预定的准则,根据每个像素属于前景颜色或属于背景颜色概率,确定属于前景颜色的像素,从而能够得到图片中的目标对象。

步骤s275,通过针对全局像素的期望最大化算法,修正混合高斯分布模型。

具体的,修正混合高斯分布模型用于对每个像素属于前景颜色或背景颜色的概率进行修正,从而得到更加准确的概率。

步骤s277,通过最大流最小割算法根据第一分割结果进行重新分割,得到第二分割结果。

具体的,上述步骤则按照预定的分割准则,根据修正后的混合高斯分布模型进行分割。在一种可选的实施例中,混合高斯分布模型给出了图片中每个像素属于前景颜色的概率,预定的分割准则可以是,像素属于前景颜色的概率超过预定概率值,确定像素属于前景颜色。根据该分割准则,即可以从图片中分割出前景图像,即目标对象。

步骤s279,对第二分割结果按照第二预设尺寸进行放大,并重新进入通过针对全局像素的期望最大化算法,修正混合高斯分布模型的步骤,直至将第二分割结果放大至图片缩小前的尺寸。

由于在步骤271中对图片进行了虽小,因此在进行了一次迭代之后,需要将图片进行放大,再执行修正高斯分布模型的步骤,从而使得进行多次迭代之后,最终得到的图片能够与输入图片的大小相同。

仍结合图4,分割网络和显著性分割网络将输出的结果输入至grabcut算法模块,grabcut算法用于实施上述改进的grabcut算法,从而得到细分割的掩膜(mask),进而能够根据该掩膜确定图片中的目标对象。

本申请上述方案基于图像的适当缩小不会改变图像中各种颜色的概率分布的假设,在初始化及初次迭代时,将图像缩小至合适尺寸,从而达到了减少算法时间的目的,并在随后的迭代中,等间隔逐渐增大图像的尺寸,直到最后一次迭代时使图像的尺寸达到正常尺寸。该方案在较少的精度损失下,可以极大的减少算法的时间消耗,该精度的损失在可接受范围内。

作为一种可选的实施例,在通过对图片进行特征提取,确定图片所属的类目之前,方法还包括:获取分割模型,其中,获取分割模型的步骤包括:

步骤s30,获取已知目标对象的样本图片。

具体的,已知目标对象的样本图像指的是用于进行分割模型训练的样本图像,例如,以服装图片为例,已经该图片所属的类目为服装,且已知该图片中服装所在的区域,因此可以将该图片作为样本图片来训练分割模型。

步骤s33,获取初始网络,初始网络包括主干网络和分割网络,分割网络包括语义分割网络和显著性分割网络,其中,主干网络用于对样本图片进行特征提取,显著性分割网络用于对样本图片进行显著性分割,语义分割网络用于对样本图片进行语义分割。

具体的,上述初始网络为初始vgg网络,上述主干网络用于对图片进行特征提取,一方面能够用于分类图像主体,以确定应该使用具体哪种分割网络进行粗分割,另一方面也是提供分割网络必要的图像特征,以供下一步进入相关分割网络再使用。

步骤s35,通过主干网络对样本图片进行分类后输入至对应的分割网络,得到预测结果。

在上述步骤中,根据类目与分割算法的对应关系,确定样本图片的目标分割算法,从而将样本图片输入至对应的分割网络。。

步骤s37,根据样本图片的目标对象确定预测结果的损失值。

具体的,上述损失值用于表示样本图像中已知的目标对象和预测结果的差距,用于对调节分割网络的网络参数。

步骤s39,根据损失值调整分割网络的网络参数。

在一种可选的实施例中,结合图4所示,样本图片首先输入至初始网络的主干网络,由主干网络对样本图片进行分类,确定对样本图片进行粗分割的分割网络,当主干网络将样本图片的特征图输出至显著性分割网络时,以右侧的显著性分割网络为例,gt用于表示样本图片中已知的目标对象的真实值,cross-entroy用于表示互熵损失值,即上述损失值,在训练阶段,将每一层获得的预测mask,及最后的融合mask(每一层的预测mask的线性均值),分别与标注真实数据进行逐像素的比较,从而可以得到7个平均互熵损失值,将它们相加求和,即为图片的显著性分割网络部分的损失值。基于该损失值调整显著性分割的网络参数,直至损失值开始收敛。

当主干网络将样本图片的特征图输出至语音分割网络时,以左侧的语义分割网络为例,gt用于表示样本图片中已知的目标对象的真实值,cross-entroy用于表示互熵损失值,即上述损失值,在训练阶段,针对最后特征图的每个像素位置,在各类目间使用softmax方法获得本像素属于每个类目的概率,根据真实标注数据在该像素上的标注类目,结合特征图在该像素位置的预测概率计算互熵损失值,最后在整张图片所有像素上取均值即为本张图片的损失值。基于该损失值调整显著性分割的网络参数,直至损失值开始收敛。

上述实施例中,将显著性分割模型和语义分割模型结合至同一个模型中,连同分类网络共用主干网络,共同训练参数,不仅节省gpu显存,还能够达到加快计算速度的目的。

作为一种可选的实施例,获取初始网络,包括:获取卷积神经网络作为初始网络的主干网络,其中,卷积神经网络的最后一层包括:与样本图片的数量超过预设值的每个类目对应的第一节点,和与样本图片小于或等于预设值的所有类目对应的一个第二节点。

在一种可选的实施例,仍结合图3所示,主干网络下面的全连接层,前两层分别包含4096个节点,最后一层的节点数量由实际情况而定,包含:(1)为每种可进行语义分割的类目分别设计一个节点;2)一个“其它”节点,包含所有因为样本数量较少而不能进行语义分割的类目。

作为一种可选的实施例,对于样本数量小于或等于预设值的类目,如果样本图片增加,使样本图片的数量超过预设值,在主干网络的最后一层为类目建立一个对应的第一节点。

在上述方案中,随着样本的持续收集,具有大量数量样本的类目逐渐增多,某些类目可以经由语义分割模型进行训练和分割,于是该类目将在vgg的分类器中引入一个新的第一节点,即在最后一个全连接层中增加一个新节点。其它样本数量仍然较少的类目(经由显著性分割)将作为独立分支,保留在第二节点中。

作为一种可选的实施例,在通过主干网络确定样本图片的目标分割算法后,将特征提取得到的样本图片的特征层输入至对应的分割网络,得到预测结果之前,方法还包括:训练主干网络,其中,训练主干网络:获取样本图片中每个像素属于每个类目的预测概率;获取样本图片在每个像素上的真实类目;根据每个像素属于每个类目的预测概率和每个像素上的真实类目,确定每个像素的损失值;确定每个像素的损失值的均值为样本图片的损失值;根据样本图片的损失值调整主干网络的网络参数。

在上述方案中,在分割网络的训练过程中,除了需要训练两个分割网络,还需要对主干网络进行训练,初始模型中主干网络的参数使用基于imagenet数据库的预训练网络模型参数,并在实际训练过程中,根据预测的结果与真实值进行比对,从而对主干网络的网络参数进行调整。

在一种可选的实施例中,分类器基于新的商品样本集进行微调(finetuning),语义分割网络和显著性分割网络交替进行训练,直到网络损失值收敛。参数优化算法可以使用随机梯度下降法。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。

实施例2

根据本发明实施例,还提供了一种图片分割方法,图5是根据本申请实施例2的一种图片分割方法的流程图,如图5所示,该方法包括:

步骤s51,通过分割模型的主干网络对图片进行特征提取,以从候选分割算法中选择与图片对应的目标分割算法,其中,候选分割算法包括:显著性分割算法和语义分割算法。

具体的,上述主干网络可以包括多个卷积层,每个卷积层根据对应的参数,对图片进行卷积和最大池化处理(con+maxpool)。图3是根据本申请实施例1的一种主干网络参数的示意图;图4是根据本申请实施例1的一种分割模型的示意图,如图3和图4所示,该主干网络具有五个卷积层,每个特征提取曾具有对应的参数包括:层类型、核大小以及通道数量,每个卷积层都能够输出对应的特征图像。

在一种可选的实施例中,在分割模型的主干网络底层有多个节点,其中,每个样本图像的数量大于预设值的类目对应一个节点,样本数量小于等于预设值的所有类目对应一个节点,主干网络对图片进行完最后一层特征提取后,分配至对应的节点,从而对图片进行对应的运算。仍结合图4所示,在主干网络下方具有全连接层(fullconnection),全连接层下方具有四个黑色圆点和两个白色圆点,每个圆点表示对一个图片的分类结果,四个黑色圆点对应的图片属于用于进行语义分割的类目,两个白色圆点对应的图片属于进行显著性分割的类目。

在上述方案中,主干网络接收输入的图片,主干网络对图片进行特征提取结果,根据特征提取结果,将图片输入至目标算法对应的分割网络,即显著性分割网络或语义分割网络。

步骤s53,通过分割模型中与目标分割算法对应的分割网络,根据特征提取得到的特征层,对图片进行第一分割处理,其中,分割网络包括:语义分割网络和显著性分割网络,显著性分割网络用于对图片进行显著性分割,语义分割网络用于对图片进行语义分割。

在上述方案中,主干网络不仅用于对图片进行分类,确定图片对应的目标分割算法,还用于输出特征层,作为分割网络所需要的图像特征。主干网络在确定图片对应的目标分割算法后,会将图片的图像特征输出至对应的分割网络,以使对应的分割网络对图片进行粗分割。

需要说明的是,由于语义分割可以分割出图片中的指定内容,因此语义分割容易得到更准确的分割结果,但语义分割需要大量的样本来训练模型,因此对于样本较少的类目,无法进行语义分割。在上述方案中,对于样本数量较多的,能够训练语义分割模型的类目,使用语义分割算法进行分割。而对于样本数量较少,无法进行语义分割的类目,用显著性分割算法完成对图片的分割,从而既保证了样本数量较多的类目分割的准确性,又能够对样本数量较少的类目的粗分割,进而可以应对电商领域中商品类目的开放和繁杂,解决了现有技术中图像分割效果不佳的技术问题。

作为一种可选的实施例,在通过分割模型中与目标分割算法对应的分割网络,根据特征提取得到的特征层,对图片进行分割之后,上述方法还包括:通过分割模型中的细分割模块对第一分割处理得到的结果进行第二分割处理,其中,细分割模块用于将图片缩小至第一预设尺寸,通过聚类算法为第一分割处理的结果中的前景颜色和背景颜色进行高斯建模,得到混合高斯分布模型,其中,混合高斯分布模型用于表征图片中每个像素点为前景颜色或背景颜色的概率,通过针对全局像素的期望最大化算法,修正混合高斯分布模型,通过最大流最小割算法根据第一分割结果进行重新分割,得到第二分割结果,对第二分割结果按照第二预设尺寸进行放大,并重新进入通过针对全局像素的期望最大化算法,修正混合高斯分布模型的步骤,直至将第二分割结果放大至图片缩小前的尺寸。

上述细分割模块将图片缩小,目的在于减小后续的运算处理所花费的时间,但对图片进行缩小的代价是,会牺牲分割的精度,因此上述第一预设尺寸需要在能够节省较多的运算时间的情况下,损失较小的分割精度。

具体的,第一分割结果给出了预测掩膜,预测掩膜指示了前景颜色和背景颜色,在上述步骤中,通过对前景颜色和背景颜色进行高斯建模,得到图片中每个像素点属于前景颜色或属于背景颜色的概率。在进行分割时候,按照预定的准确,根据每个像素属于前景颜色或属于背景颜色概率,确定属于前景颜色的像素,从而能够得到图片中的目标对象,具体的,修正混合高斯分布模型用于对每个像素属于前景颜色或背景颜色的概率进行修正,从而得到更加准确的概率。

由于在初始阶段对图片进行了虽小,因此在进行了一次迭代之后,需要将图片进行放大,再执行修正高斯分布模型的步骤,从而使得进行多次迭代之后,最终得到的图片能够与输入图片的大小相同。

本申请上述方案基于图像的适当缩小不会改变图像中各种颜色的概率分布的假设,在初始化及初次迭代时,将图像缩小至合适尺寸,从而达到了减少算法时间的目的,并在随后的迭代中,等间隔逐渐增大图像的尺寸,直到最后一次迭代时使图像的尺寸达到正常尺寸。该方案在较少的精度损失下,可以极大的减少算法的时间消耗,该精度的损失在可接受范围内。

实施例3

根据本发明实施例,还提供了一种用于实施上述实施例1中的图片分割方法的图片分割装置,图6是根据实施例3的图片分割装置的示意图,如图6所示,该装置600包括:

选择模块602,用于通过对图片进行特征提取,从候选分割算法中选择与图片对应的目标分割算法,其中,候选分割算法包括:显著性分割算法和语义分割算法。

第一分割模块604,用于使用目标分割算法对图片进行粗分割,得到第一分割结果,其中,粗分割用于初步确定图片中的目标对象。

第二分割模块606,用于对第一分割结果进行细分割,得到图片中的目标对象。

此处需要说明的是,上述选择模块602、第一分割模块604和第二分割模块606对应于实施例1中的步骤s21至步骤s23,两个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。

作为一种可选的实施例,选择模块包括:第一确定子模块,用于将图片输入至分割模型中的主干网络,由主干网络通过对图片进行特征提取,将图片分配至对应的节点,其中,节点包括:分别与样本图片的数量超过预设值的每个类目对应的第一节点,和与样本图片小于或等于预设值的所有类目对应的一个第二节点;第二确定子模块,用于如果将图片分配至第一节点,确定目标分割算法为语义分割算法;第三确定子模块,用于如果将图片分配至第二节点,确定目标分割算法为显著性分割算法。

作为一种可选的实施例,分割模型还包括分割网络,分割网络包括:语义分割网络和显著性分割网络,第一分割模块包括:输出子模块,用于主干网络输出的第一特征层输入至目标分割算法对应的分割网络;第一分割子模块,用于通过分割网络对图片进行粗分割。

作为一种可选的实施例,在目标分割算法为显著性分割算法的情况下,第一分割子模块包括:第一堆叠单元,用于按照预设的跳层规则将多个第二特征层进行堆叠,得到多个单通道预测掩膜,其中,第二特征层通过对主干网络输出的第一特征层进行卷积和反卷积的处理得到;第一获取单元,用于获取多个单通道预测掩膜的第一线性均值;第一确定单元,用于确定第一线性均值为图片对应的第一分割结果。

作为一种可选的实施例,在目标分割算法为显著性分割算法的情况下,第一分割子模块包括:第二堆叠单元,用于按照预设的跳层规则将多个第二特征层进行堆叠,得到多个单通道预测掩膜,其中,第二特征层通过对主干网络输出的第一特征层进行卷积和反卷积的处理得到;提取单元,用于从多个单通道预测掩膜中提取n个单通道预测掩膜,其中,n为小于单通道预测掩膜数量的正整数;第二获取单元,用于获取n个单通道预测掩膜的第二线性均值;第二确定单元,用于确定第二线性均值为图片对应的第一分割结果。

作为一种可选的实施例,在分割算法为语义分割算法的情况下,第一分割子模块包括:选择单元,用于选择主干网络中的多个卷积层;采样单元,用于按照由下到上的顺序,将卷积层输出的第一特征层进行上采样后,与上一个卷积层输出的第一特征层进行特征叠加,得到最后一个卷积层对应的目标特征层;卷积单元,用于对目标特征层进行卷积,使目标特征层的通道数量为第一节点的数量;第一调整单元,用于通过对卷积后的目标特征层进行上采样,将卷积后的目标特征层的大小调整至与图片的大小一致。

作为一种可选的实施例,第二分割模块,包括:缩小子模块,用于将图片缩小至第一预设尺寸;聚类子模块,用于通过聚类算法为第一分割结果中的前景颜色和背景颜色进行高斯建模,得到混合高斯分布模型,其中,混合高斯分布模型用于表征图片中每个像素点为前景颜色或背景颜色的概率;修正子模块,用于通过针对全局像素的期望最大化算法,修正混合高斯分布模型;第二分割子模块,用于通过最大流最小割算法根据第一分割结果进行重新分割,得到第二分割结果;放大子模块,用于对第二分割结果按照第二预设尺寸进行放大,并重新进入通过针对全局像素的期望最大化算法,修正混合高斯分布模型的步骤,直至将第二分割结果放大至图片缩小前的尺寸。

作为一种可选的实施例,装置还包括:获取模块,用于在通过对图片进行特征提取,确定图片所属的类目之前,获取分割模型,其中,获取模块包括:第一获取子模块,用于获取已知目标对象的样本图片;第二获取子模块,用于获取初始网络,初始网络包括主干网络和分割网络,分割网络包括语义分割网络和显著性分割网络,其中,主干网络用于对样本图片进行特征提取,显著性分割网络用于对样本图片进行显著性分割,语义分割网络用于对样本图片进行语义分割;输入子模块,用于通过主干网络对样本图片进行分类后输入至对应的分割网络,得到预测结果;第四确定子模块,用于根据样本图片的目标对象确定预测结果的损失值;调整子模块,用于根据损失值调整分割网络的网络参数。

作为一种可选的实施例,第一获取子模块包括:第三获取子模块,用于获取卷积神经网络作为初始网络的主干网络,其中,卷积神经网络的最后一层包括:与样本图片的数量超过预设值的每个类目对应的第一节点,和与样本图片小于或等于预设值的所有类目对应的一个第二节点。

作为一种可选的实施例,对于样本数量小于或等于预设值的类目,如果样本图片增加,使样本图片的数量超过预设值,在主干网络的最后一层为类目建立一个对应的第一节点。

作为一种可选的实施例,获取模块还包括:训练子模块,用于在通过主干网络确定样本图片的目标分割算法后,将特征提取得到的样本图片的特征层输入至对应的分割网络,得到预测结果之前,训练主干网络,其中,训练子模块包括:第一获取单元,用于获取样本图片中每个像素属于每个类目的预测概率;第二获取单元,用于获取样本图片在每个像素上的真实类目;第三确定单元,用于根据每个像素属于每个类目的预测概率和每个像素上的真实类目,确定每个像素的损失值;第三确定单元,用于确定每个像素的损失值的均值为样本图片的损失值;第二调整单元,用于根据样本图片的损失值调整主干网络的网络参数。

实施例4

根据本发明实施例,还提供了一种用于实施上述实施例2中的图片分割方法的图片分割装置,图7是根据实施例4的图片分割装置的示意图,如图7所示,该装置700包括:

提取模块700,用于通过分割模型的主干网络对图片进行特征提取,以从候选分割算法中选择与图片对应的目标分割算法,其中,候选分割算法包括:显著性分割算法和语义分割算法。

粗分割处理模块702,用于通过分割模型中与目标分割算法对应的分割网络,根据特征提取得到的特征层,对图片进行第一分割处理,其中,分割网络包括:语义分割网络和显著性分割网络,显著性分割网络用于对图片进行显著性分割,语义分割网络用于对图片进行语义分割。

此处需要说明的是,上述提取模块700和粗分割处理模块702对应于实施例2中的步骤s51至步骤s53,两个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。

作为一种可选的实施例,上述装置还包括:细分割处理模块,用于在通过分割模型中与目标分割算法对应的分割网络,根据特征提取得到的特征层,对图片进行分割之后,通过分割模型中的细分割模块对第一分割处理得到的结果进行第二分割处理,其中,细分割模块用于将图片缩小至第一预设尺寸,通过聚类算法为第一分割处理的结果中的前景颜色和背景颜色进行高斯建模,得到混合高斯分布模型,其中,混合高斯分布模型用于表征图片中每个像素点为前景颜色或背景颜色的概率,通过针对全局像素的期望最大化算法,修正混合高斯分布模型,通过最大流最小割算法根据第一分割结果进行重新分割,得到第二分割结果,对第二分割结果按照第二预设尺寸进行放大,并重新进入通过针对全局像素的期望最大化算法,修正混合高斯分布模型的步骤,直至将第二分割结果放大至图片缩小前的尺寸。

实施例5

本发明的实施例可以提供一种图片分割系统,包括:

处理器;以及

存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:

通过对图片进行特征提取,从候选分割算法中选择与图片对应的目标分割算法,其中,候选分割算法包括:显著性分割算法和语义分割算法;

使用目标分割算法对图片进行粗分割,得到第一分割结果,其中,粗分割用于初步确定图片中的目标对象;

对第一分割结果进行细分割,得到图片中的目标对象。

进一步地,上述存储器还为处理器提供了处理实施例1中的其他步骤的指令,此处不再赘述。

实施例6

本发明的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。

可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。

在本实施例中,上述计算机终端可以执行图片分割方法中以下步骤的程序代码:通过对图片进行特征提取,从候选分割算法中选择与图片对应的目标分割算法,其中,候选分割算法包括:显著性分割算法和语义分割算法;使用目标分割算法对图片进行粗分割,得到第一分割结果,其中,粗分割用于初步确定图片中的目标对象;对第一分割结果进行细分割,得到图片中的目标对象。

可选地,图8是根据本发明实施例6的一种计算机终端的结构框图。如图8所示,该计算机终端a可以包括:一个或多个(图中仅示出一个)处理器802、存储器804、以及传输装置806。

其中,存储器可用于存储软件程序以及模块,如本发明实施例中的图片分割方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的图片分割方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端a。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:通过对图片进行特征提取,从候选分割算法中选择与图片对应的目标分割算法,其中,候选分割算法包括:显著性分割算法和语义分割算法;使用目标分割算法对图片进行粗分割,得到第一分割结果,其中,粗分割用于初步确定图片中的目标对象;对第一分割结果进行细分割,得到图片中的目标对象。

可选的,上述处理器还可以执行如下步骤的程序代码:将图片输入至分割模型中的主干网络,由主干网络通过对图片进行特征提取,将图片分配至对应的节点,其中,节点包括:分别与样本图片的数量超过预设值的每个类目对应的第一节点,和与样本图片小于或等于预设值的所有类目对应的一个第二节点;如果将图片分配至第一节点,确定目标分割算法为语义分割算法;如果将图片分配至第二节点,确定目标分割算法为显著性分割算法。

可选的,分割模型还包括分割网络,分割网络包括:语义分割网络和显著性分割网络,上述处理器还可以执行如下步骤的程序代码:主干网络输出的第一特征层输入至目标分割算法对应的分割网络;通过分割网络对图片进行粗分割。

可选的,上述处理器还可以执行如下步骤的程序代码:在目标分割算法为显著性分割算法的情况下,按照预设的跳层规则将多个第二特征层进行堆叠,得到多个单通道预测掩膜,其中,第二特征层通过对主干网络输出的第一特征层进行卷积和反卷积的处理得到;获取多个单通道预测掩膜的线性均值;确定线性均值为图片对应的第一分割结果。

可选的,上述处理器还可以执行如下步骤的程序代码:按照预设的跳层规则将多个第二特征层进行堆叠,得到多个单通道预测掩膜,其中,第二特征层通过对主干网络输出的第一特征层进行卷积和反卷积的处理得到;从多个单通道预测掩膜中提取n个单通道预测掩膜,其中,n为小于单通道预测掩膜数量的正整数;获取n个单通道预测掩膜的线性均值;确定线性均值为图片对应的第一分割结果。

可选的,上述处理器还可以执行如下步骤的程序代码:在分割算法为语义分割算法的情况下,选择主干网络中的多个卷积层;按照由下到上的顺序,将卷积层输出的第一特征层进行上采样后,与上一个卷积层输出的第一特征层进行特征叠加,得到最后一个卷积层对应的目标特征层;对目标特征层进行卷积,使目标特征层的通道数量为第一节点的数量;通过对卷积后的目标特征层进行上采样,将卷积后的目标特征层的大小调整至与图片的大小一致。

可选的,上述处理器还可以执行如下步骤的程序代码:将图片缩小至第一预设尺寸;通过聚类算法为第一分割结果中的前景颜色和背景颜色进行高斯建模,得到混合高斯分布模型,其中,混合高斯分布模型用于表征图片中每个像素点为前景颜色或背景颜色的概率;通过针对全局像素的期望最大化算法,修正混合高斯分布模型;通过最大流最小割算法根据第一分割结果进行重新分割,得到第二分割结果;对第二分割结果按照第二预设尺寸进行放大,并重新进入通过针对全局像素的期望最大化算法,修正混合高斯分布模型的步骤,直至将第二分割结果放大至图片缩小前的尺寸。

可选的,上述处理器还可以执行如下步骤的程序代码:在通过对图片进行特征提取,确定图片所属的类目之前,获取已知目标对象的样本图片;获取初始网络,初始网络包括主干网络和分割网络,分割网络包括语义分割网络和显著性分割网络,其中,主干网络用于对样本图片进行特征提取,显著性分割网络用于对样本图片进行显著性分割,语义分割网络用于对样本图片进行语义分割;通过主干网络确定样本图片的目标分割算法后,将特征提取得到的样本图片的特征层输入至对应的分割网络,得到预测结果;根据样本图片的目标对象确定预测结果的损失值;根据损失值调整分割网络的网络参数。

可选的,上述处理器还可以执行如下步骤的程序代码:获取卷积神经网络作为初始网络的主干网络,其中,卷积神经网络的最后一层包括:与样本图片的数量超过预设值的每个类目对应的第一节点,和与样本图片小于或等于预设值的所有类目对应的一个第二节点。

可选的,上述处理器还可以执行如下步骤的程序代码:对于样本数量小于或等于预设值的类目,如果样本图片增加,使样本图片的数量超过预设值,在主干网络的最后一层为类目建立一个对应的第一节点。

可选的,上述处理器还可以执行如下步骤的程序代码:在通过主干网络确定样本图片的目标分割算法后,将特征提取得到的样本图片的特征层输入至对应的分割网络,得到预测结果之前,获取样本图片中每个像素属于每个类目的预测概率;获取样本图片在每个像素上的真实类目;根据每个像素属于每个类目的预测概率和每个像素上的真实类目,确定每个像素的损失值;确定每个像素的损失值的均值为样本图片的损失值;根据样本图片的损失值调整主干网络的网络参数。

采用本发明实施例,提供了一种图片分割的方案。通过对图片进行特征提取,从候选分割算法中选择与图片对应的目标分割算法,其中,候选分割算法包括:显著性分割算法和语义分割算法;使用目标分割算法对图片进行粗分割,得到第一分割结果,其中,粗分割用于初步确定图片中的目标对象;对第一分割结果进行细分割,得到图片中的目标对象。上述方案通过对图片进行特征提取以确定图片对应的目标分割算法,从而可以应对电商领域中商品类目的开放和繁杂,解决了现有技术中图像分割效果不佳的技术问题。

本领域普通技术人员可以理解,图8所示的结构仅为示意,计算机终端也可以是智能手机(如android手机、ios手机等)、平板电脑、掌声电脑以及移动互联网设备(mobileinternetdevices,mid)、pad等终端设备。图8其并不对上述电子装置的结构造成限定。例如,计算机终端8还可包括比图8中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图8所示不同的配置。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(read-onlymemory,rom)、随机存取器(randomaccessmemory,ram)、磁盘或光盘等。

实施例7

本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的图片分割方法所执行的程序代码。

可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。

可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:通过对图片进行特征提取,从候选分割算法中选择与图片对应的目标分割算法,其中,候选分割算法包括:显著性分割算法和语义分割算法;使用目标分割算法对图片进行粗分割,得到第一分割结果,其中,粗分割用于初步确定图片中的目标对象;对第一分割结果进行细分割,得到图片中的目标对象。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1