一种图像处理方法及装置与流程

文档序号:23502654发布日期:2021-01-01 18:09阅读:107来源:国知局
一种图像处理方法及装置与流程

本申请涉及图像处理技术领域,尤其涉及一种图像处理方法及装置。



背景技术:

随着深度学习的发展,图像美学质量评估(imageaestheticqualityassessment)也成为研究的热门方向。通过对图像进行美学质量评估的方式,确定各图像的美学质量,以在向用户展示图像时,优先展示美学质量较高的图像。

现有技术在确定图像的美学质量时,具体过程如下:首先,将待评估的图像输入预先训练的美学评估模型的卷积神经网络层(convolutionalneuralnetworks,cnn)中,对该图像进行特征提取,之后将提取出的图像特征输入该美学评估模型的若干全连接层中,确定该图像的美学质量评分。其中,cnn层中包含多层卷积层。

但是,通过cnn层中的多层卷积层对该图像进行特征提取后,提取出的图像特征对图像进行了高度凝结,减少了图像中的色彩、纹理等特征信息,而图像的色彩、纹理是确定图像美学质量的重要因素。因此,通过多层卷积层提取出的图像特征,对图像进行美学质量评估往往不够准确。



技术实现要素:

本说明书实施例提供一种图像处理方法及装置,用于部分解决现有技术中存在的上述问题。

本说明书实施例采用下述技术方案:

本说明书提供的一种图像处理方法,包括:

获取若干待评估的图像;

针对每个待评估的图像,将该图像输入预先训练的特征提取模型,确定所述特征提取模型中至少两层卷积层输出的图像特征;

将确定出的各卷积层输出图像特征分别输入预设的各卷积层对应的池化层,得到各图像特征的特征向量;

根据确定出的各图像特征的特征向量,确定该图像的特征向量;

将该图像的特征向量输入预先训练的质量评价模型,确定所述质量评价模型输出的该图像的质量评分;

根据各图像的质量评分,进行图像处理。

可选地,特征提取模型的训练过程如下:

获取若干图像,作为第一训练样本;

针对每个第一训练样本,将该第一训练样本的真实类别作为该第一训练样本的标注;

将该第一训练样本输入待训练的卷积神经网络模型,输出该第一训练样本的预测类别,所述卷积神经网络模型至少包含卷积神经网络层以及全连接层;

以最小化所述预测类别与该第一训练样本标注的真实类别之间的差异为目标,调整所述卷积神经网络模型中的模型参数;

将训练完成的所述卷积神经网络模型中除全连接层外的卷积神经网络模型,作为训练完成的特征提取模型。

可选地,质量评价模型的训练过程如下:

获取若干图像;

针对每个图像,将该图像输入预先训练的特征提取模型,确定所述特征提取模型中至少两层卷积层输出的图像特征;

将各卷积层输出图像特征分别输入预设的各卷积层的对应池化层,确定各图像特征的特征向量;

根据确定出的各图像特征的特征向量,确定该图像的特征向量;

将各图像的特征向量作为第二训练样本,并确定各图像的质量评分作为各第二训练样本的标注;

针对每个第二训练样本,将该第二训练样本输入待训练的全连接神经网络模型,确定所述全连接神经网络模型输出的该第二训练样本的质量评分;

以最小化输出的质量评分与该第二训练样本标注的质量评分之间的差异为目标,调整所述全连接神经网络模型中的模型参数;

将训练完成的全连接神经网络模型作为质量评价模型,所述质量评价模型用于评价图像的质量。

可选地,根据确定出的各图像特征的特征向量,确定该图像的特征向量,具体包括:

根据确定出的各图像特征的特征向量以及各图像特征对应的卷积层在所述特征提取模型中的顺序,确定该图像的特征向量。

可选地,所述质量评价模型为多个,每个质量评价模型分别由不同的图像数据集训练得到;

所述方法还包括:

针对每个质量评价模型,将该图像输入该质量评价模型,确定该质量评价模型输出的质量评分;

根据各质量评价模型输出的质量评分,确定该图像的质量评分。

可选地,根据各质量评价模型输出的质量评分,确定该图像的质量评分,具体包括:

对各质量评价模型输出的质量评分进行归一化;

根据预设的各质量评价模型的权重以及归一化后的各质量评价模型输出的质量评分,确定该图像的质量评分。

可选地,根据各图像的质量评分,进行图像处理,具体包括:

根据各图像的质量评分,确定各图像的排序;

根据各图像的排序,从各图像中确定目标图像,并进行展示。

本说明书提供一种图像处理装置,包括:

获取模块,获取若干待评估的图像;

特征提取模块,针对每个待评估的图像,将该图像输入预先训练的特征提取模型,确定所述特征提取模型中至少两层卷积层输出的图像特征;

池化模块,将确定出的各卷积层输出图像特征分别输入预设的各卷积层对应的池化层,得到各图像特征的特征向量;

特征向量确定模块,根据确定出的各图像特征的特征向量,确定该图像的特征向量;

评分模块,将该图像的特征向量输入预先训练的质量评价模型,确定所述质量评价模型输出的该图像的质量评分;

处理模块,根据各图像的质量评分,进行图像处理。

本说明书提供的一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述图像处理方法。

本说明书提供的一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述图像处理方法。

本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:

在进行图像处理时,可先获取待评估的各图像,并针对每个待评估的图像,将该图像输入特征提取模型,确定该特征提取模型中至少两层卷积层输出的图像特征。之后,将确定出的各卷积层输出图像特征分别输入预设的各卷积层对应的池化层,得到各图像特征的特征向量,并根据确定出的各图像特征的特征向量,确定该图像的特征向量。最后将该图像的特征向量输入质量评价模型,确定该图像的质量评分,以根据确定出的各图像的质量评分,进行图像处理。通过确定至少两层卷积层输出的图像特征,并根据输出的各图像特征对图像进行质量评估,避免了现有仅根据最后一层卷积层输出的图像特征对图像进行质量评估,由于图像特征高度凝结,图像的色彩、纹理等信息丢失,导致评估不准确的问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1为现有的美学质量评估模型的结构示意图;

图2为本说明书实施例提供的一种图像处理方法的流程示意图;

图3为本说明书实施例提供的特征提取模型的结构示意图;

图4为本说明书实施例提供的池化过程的示意图;

图5为本说明书实施例提供的图像处理的流程示意图;

图6为本说明书实施例提供的多模型评分融合的示意图;

图7为本说明书实施例提供的一种图像处理装置的结构示意图;

图8为本说明书实施例提供的实现图像处理方法的电子设备示意图。

具体实施方式

为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。

目前,在确定图像的美学质量时,所采用的美学评估模型通常由cnn层以及全连接层组成,其中,该cnn层包含若干卷积层,如图1所示。在确定图像的美学质量时,可先将该图像输入该美学评估模型中,依次通过该美学评估模型中cnn层包含的若干卷积层,提取到该图像的图像特征,之后,再将该图像的图像特征输入该美学评估模型中的全连接层中,依次通过若干全连接层,得到该图像的美学质量评分。

但是,上述依次通过若干卷积层得到的图像特征往往对该图像进行了高度凝结,包含的色彩、纹理等特征信息较少,因此通过上述美学评估模型确定出的图像的美学质量评分往往不够准确。

以下结合附图,详细说明本说明书各实施例提供的技术方案。

图2为本说明书实施例提供的一种图像处理过程,具体可包括以下步骤:

s100:获取若干待评估的图像。

为了解决现有技术中通过若干卷积层提取的图像特征过于高度凝结,图像的色彩、纹理等信息丢失导致评分不够准确的问题,本说明书提供的图像处理方法,通过各卷积层提取图像特征,并将至少两层卷积层提取出的图像特征相结合的方式,使确定出的图像特征能够包含图像中更多的色彩、纹理等信息,根据该包含更多信息的图像特征对该图像进行质量评估时,能够得到更准确的质量评分,以根据各图像的质量评分,更准确的进行图像处理。

本说明书提供的图像处理的方法,可应用于各种依据图像质量进行图像处理的场景中。例如:当确定新闻封面图像时,可分别确定该新闻中各配图的质量评分,并将质量评分最高的配图,作为新闻的封面图像。在点评平台中确定各商家的展示图像时,可对该商家中各菜品的图像进行质量评估,确定各菜品图像的质量评分,并将质量评分最高的菜品图像,作为该商家的展示图像,以提高用户的购买体验。于是,在本说明书中进行图像处理时,可先获取各待评估的图像,以通过后续步骤确定各待评估的图像的质量评分,并根据各图像的质量评分进行图像处理。

具体的,服务器可先获取若干待评估的图像。当根据新闻中各配图确定封面图像时,则该待评估的图像为新闻中的各配图,当根据商家的各菜品图像确定商家的展示图像时,则该待评估的图像为商家的各菜品图像。该待评估的图像可以是实时采集的,也可以是预先存储的,本说明书对待评估的图像的尺寸、来源以及内容不做限制,可根据场景需要设置。

需要说明的是,本说明书提供的图像处理方法可由进行图像处理的服务器执行,该服务器可以是一个单独的服务器,也可以是多个服务器组成的系统,例如:分布式服务器等,本说明书对此不做限制,具体可根据需要设置。

s102:针对每个待评估的图像,将该图像输入预先训练的特征提取模型,确定所述特征提取模型中至少两层卷积层输出的图像特征。

在本说明书实施例中,当通过步骤s100获取到各待评估的图像后,便可通过若干卷积层对各图像进行特征提取,并确定至少两层卷积层输出的图像特征,以后续根据该至少两层卷积层输出的图像特征,确定各图像的质量评分,并进行图像处理。

具体的,该服务器可针对每个待评估的图像,将该图像输入预先训练的特征提取模型中,依次通过该特征提取模型的若干卷积层,确定各卷积层输出的图像特征,并从各卷积层输出的图像特征中确定至少两层卷积层输出的图像特征,以便后续进行特征结合。其中,从各卷积层输出的图像特征中确定哪几层卷积层输出的图像特征具体可根据需要设置,本说明书对此不做限制。

如图3所示,图3为该特征提取模型的模型结构图,该特征提取模型中包含cnn层,该cnn层中包含若干卷积层。将该图像输入该特征提取模型中后,可依次通过若干卷积层,分别确定各卷积层输出的图像特征,并从各卷积层输出的图像特征中确定至少两层卷积层输出的图像特征。假设该cnn层中包含三层卷积层,通过第一卷积层可得到图像特征a1,依次通过第一、第二、第三卷积层可得到图像特征a3,如图3所示,a1为4×4×3维的图像特征,a3为2×2×8维的图像特征。

需要说明的是,本说明书提供的图像处理方法,在评估图像的质量时,先通过特征提取模型提取图像的图像特征,再通过预设的各卷积层对应的池化层确定图像的特征向量,最后通过质量评价模型确定该图像的质量评分。因此本说明书中用于提取图像特征的特征提取模型,可以是其它图像处理模型中用于提取图像特征的部分。通常图像处理模型中至少包含卷积神经网络层以及全连接层,则在训练该特征提取模型时,可先训练图像处理模型,再将训练完成的图像处理模型中用于提取图像特征的部分,即,cnn层,作为该特征提取模型。其中,为了减少模型训练的工作量,该图像处理模型也可以是开源的image-net模型,例如:残差网络(residualnetwork-50,resnet-50)、超分辨率测试模型(visualgeometrygroup-16,vgg-16)等。其中,该特征提取模型中的卷积神经网络层中也可能包含有池化层,但是该池化层与预设的各卷积层对应的池化层不同。

具体的,在训练该特征提取模型时,可先训练图像处理模型,假设该图像处理模型是用于对图像进行分类的cnn模型,则可先获取若干图像,并确定各图像的真实类别。其中,图像的真实类别指的是图像中包含的物体的类别,例如:图像为包含建筑物的图像,则该图像的真实类别为建筑物图像。之后,将各图像作为第一训练样本,并将各图像的真实类别作为各第一训练样本的标注。然后,针对每个第一训练样本,将该第一训练样本输入待训练的cnn模型,输出该第一训练样本的预测类别,最后以最小化该预测类别与该第一训练样本标注的真实类别之间的差异为目标,调整该cnn中的模型参数。当训练次数达到预设的训练次数阈值,或图像分类的准确率达到预设的准确率阈值时,可确定该cnn模型训练完成,并将该训练完成的cnn模型中除全连接层外的cnn模型,作为训练完成的特征提取模型。

s104:将确定出的各卷积层输出图像特征分别输入预设的各卷积层对应的池化层,得到各图像特征的特征向量。

在本说明书实施例中,由于各待评估的图像的图像尺寸不完全相同,因此各待评估的图像分别通过各卷积层提取出的图像特征的特征维度也不完全相同。而后续进行质量评估的质量评价模型为全连接神经网络模型,该全连接神经网络模型中全连接层的参数是固定不变的,因此需要保证输入该全连接神经网络模型的数据维度相同。于是,在向质量评价模型输入该图像的图像特征之前,还需对各图像的图像特征进行池化,以将各图像的图像特征变化为相同的特征维度,方便后续输入。

在本说明书实施例中,具体的,该服务器可针对确定出的每层卷积层输出的图像特征,将该图像特征输入预设的该卷积层对应的池化层,通过该池化层对该图像特征进行全局平均池化,确定该图像特征的特征向量。需要说明的是,该进行全局平均池化的池化层不是穿插在各卷积层之间,而是经过若干卷积层提取图像特征后,再经过该池化层进行全局平均池化。

如图4所示,当通过步骤s102确定出的图像特征a1、a3之后,可将图像特征a1输入预设的第一卷积层对应的池化层中进行全局平均池化,得到图像特征a1的特征向量a1’,将图像特征a3输入预设的第三卷积层对应的池化层中进行全局平均池化,得到图像特征a3的特征向量a3’。

s106:根据确定出的各图像特征的特征向量,确定该图像的特征向量。

在本说明书实施例中,当通过步骤s104确定出至少两层卷积层输出的图像特征的特征向量后,便可对至少两层卷积层输出的图像特征进行特征结合,以后续可根据结合后的图像特征,确定该图像的美学质量,并进行图像处理。

具体的,该服务器可先确定各图像特征对应的卷积层在该特征提取模型中的顺序,之后按照确定出的顺序,对各图像特征的特征向量进行排序,最后将排序后的各图像特征的特征向量,作为该图像的特征向量。其中,该特征向量至少包含两层卷积层输出的图像特征的特征信息。

s108:将该图像的特征向量输入预先训练的质量评价模型,确定所述质量评价模型输出的该图像的质量评分。

在本说明书实施例中,当确定出该图像的特征向量后,便可通过质量评价模型,确定该图像的质量评分,以根据该图像的质量评分进行图像处理。

具体的,该服务器可将该图像的特征向量输入预先训练的质量评价模型中,确定该质量评价模型输出的该图像的质量评分。其中,该质量评价模型为全连接神经网络模型。

进一步的,在训练质量评价模型时,需要基于公认的包含各种图像以及对图像质量进行评分的图像数据集进行训练,而各种图像数据集的评分标准不完全相同,因此训练的质量评价模型只能基于一种图像数据集进行训练。具体的,在训练该质量评价模型时,可先选择一种图像数据集,并从该选择的图像数据集中选取若干图像。之后,分别针对选取的每张图像,将该图像输入通过步骤s102预先训练的特征提取模型中,确定该特征提取模型中至少两层卷积层输出的图像特征。之后,将各卷积层输出图像特征分别输入预设的各卷积层对应的池化层,确定各图像特征的特征向量,并根据确定出的各图像特征的特征向量,确定该图像的特征向量。

当确定出选取的各图像的特征向量后,可分别将各图像的特征向量作为第二训练样本,并将该图像数据集中对选取的各图像的评分,作为各第二训练样本的标注。然后,针对每个第二训练样本,将该第二训练样本输入待训练的全连接神经网络模型,确定该全连接神经网络模型输出的该第二训练样本的质量评分,最后以最小化输出的质量评分与该第二训练样本标注的质量评分之间的差异为目标,调整该全连接神经网络模型中的模型参数,并将训练完成的全连接神经网络模型作为质量评价模型。

s110:根据各图像的质量评分,进行图像处理。

在本说明书实施例中,当通过质量评价模型确定出各图像的质量评分后,可根据各图像的质量评分,从中确定目标图像进行展示。

具体的,该服务器可根据各图像的质量评分,确定各图像的排序,并根据各图像的排序,从各图像中排序最高的作为目标图像,并展示该目标图像。例如:当按照新闻中各配图的质量评分,对新闻中各配图进行排序,并将排序中质量评分最高的配图,作为新闻的封面图像。当按照商家的各菜品图像的质量评分,对商家的各菜品图像进行排序,则可将排序中质量评分最高的菜品图像,作为商家的展示图像。

其中,按照各图像的质量评分对各图像进行排序,可以是正向排序,也可以是反向排序。则对应的目标图像可以是排序中质量评分最高的,也可以是排序中质量评分最低的,本说明书对排序方式以及目标图像的选择不做限制,具体可根据需要设置。

基于图2所示的图像处理方法,在进行图像处理时,可先获取待评估的各图像,并针对每个待评估的图像,将该图像输入特征提取模型,确定该特征提取模型中至少两层卷积层输出的图像特征。之后,将确定出的各卷积层输出图像特征分别输入预设的各卷积层对应的池化层,得到各图像特征的特征向量,并根据确定出的各图像特征的特征向量,确定该图像的特征向量。最后将该图像的特征向量输入质量评价模型,确定该图像的质量评分,以根据确定出的各图像的质量评分,进行图像处理。通过确定至少两层卷积层输出的图像特征,并根据输出的各图像特征对图像进行质量评估,避免了现有仅根据最后一层卷积层输出的图像特征对图像进行质量评估,由于图像特征高度凝结,图像的色彩、纹理等信息丢失,导致评估不准确的问题。

图5为确定图像的质量评分的整体流程示意图,在确定图像的质量评分时,可先将图像输入预先训练的特征提取模型中进行特征提取,确定依次通过若干卷积层输出的图像特征。之后,将各图像特征输入预设的各卷积层对应的池化层中,确定图像的特征向量,最后,将图像的特征向量输入预先训练的质量评价模型中,得到图像的质量评分,以进行图像处理。

目前,用于训练质量评价模型的图像数据集多种多样,常见的图像数据集有:图像质量评价数据集(aestheticvisualanalysis,ava)、photo.net数据集等,图像数据集中包含各种类的图像以及对各图像的图像质量的评分,但是不同的图像数据集中对图像质量的评分标准不完全相同。例如:一些图像数据集以图像的色彩作为主要的评分标准,而一些图像数据集以图像的纹理作为主要的评分标准。因此在训练质量评价模型时,只能基于一个图像数据集进行训练,而训练出的质量评价模型也与作为训练样本的图像数据集有相同的评分标准。

在使用质量评价模型对图像进行质量评分时,单一的质量评价模型往往只能评估该图像在某一评分标准下的质量,较为片面。于是,本说明书提供的图像处理方法,可通过多个质量评价模型综合决策,确定图像的质量评分,每个质量评价模型分别由不同评分标准的图像数据集训练得到。

具体的,该服务器可针对每个质量评价模型,将该图像输入该质量评价模型,确定该质量评价模型输出的质量评分,之后,由于各图像数据集的评分标准不完全相同,因此还需对各质量评价模型输出的质量评分进行归一化处理,确定归一化后的各质量评价模型的质量评分。最后,根据预设的各质量评价模型的权重以及归一化后的各质量评价模型的质量评分,确定该图像的质量评分。

进一步的,由于各质量评价模型是基于不同的评分标准对该图像进行的质量评估,各质量评价模型输出的质量评分表征各质量评价模型对该图像的图像质量的认可程度,而各质量评价模型输出的质量评分与质量总分之间的差值表征各质量评价模型对该图像的图像质量的否决程度。当任一质量评价模型判断该图像的图像质量较差时,则表明该图像中存在质量较差的因素,该质量评价模型对该图像的图像质量的否决程度越高,则综合对该图像进行评分时,该图像的质量评分较低。

于是,本说明书提供一种质量评分的融合方法,可通过公式s=1-(1-s1)α1(1-s2)α2...(1-sn)αn确定各质量评价模型输出的质量评分的综合质量评分。其中,s表示该图像的综合质量评分,s1表示第一个质量评价模型对该图像的质量评分,α1表示第一个质量评价模型的权重,s2表示第二个质量评价模型对该图像的质量评分,α2表示第一个质量评价模型的权重,sn表示第n个质量评价模型对该图像的质量评分,αn表示第n个质量评价模型的权重。当任一质量评价模型输出的质量评分越低时,则该图像综合的质量评分越低。

如图6所示,将图像输入特征提取模型进行特征提取,确定出该图像的特征向量后,可分别将该图像的特征向量输入各质量评价模型中,分别确定各质量评价模型输出的质量评分s1、s2、s3、s4……sn,最后通过公式s=1-(1-s1)α1(1-s2)α2...(1-sn)αn确定该图像的综合质量评分。

更进一步的,各质量评价模型的权重可以是人为根据经验预先设置的,也可以是通过实验得到的,本说明书对确定各质量评价模型的权重的方式不做限制,可根据需要设置。

当然,由于各图像数据集的评分标准不完全相同,例如:一些图像数据集中对图像质量评分的范围是0~10,一些图像数据集中对图像质量评分的范围是0~100,一些图像数据集采用星级的方式对图像质量进行评分,评分的范围是0星~5星。因此也可在根据各图像数据集,训练各图像数据集对应的质量评价模型时,对各图像数据集中的各图像质量评分进行归一化处理,则基于归一化后的图像数据集进行训练时,训练出的质量评价模型的评分也是归一化的。其中,以星级为评分范围的可对应换算为0~1中的分数。

在本说明书步骤s102中,确定特征提取模型中至少两层卷积层输出的图像特征的目的,是为了在评估图像质量时,可根据包含图像中更多特征信息的图像特征进行评估。而经过较多卷积层后输出的图像特征,往往为深层图像特征,包含图像中局部关键特征的特征信息。经过较少卷积层后输出的图像特征,往往为浅层图像特征,包含图像的全局特征的特征信息。为了使质量评估的效果更好,使该图像特征中既包含图像的局部关键特征,也包含图像的全局特征,在本说明书实施例中,在确定至少两层卷积层输出的图像特征时,可从各卷积层输出的图像特征中,选择深层图像特征以及浅层图像特征。其中,深层图像特征与浅层图像特征是相对的概念,可以将经过卷积层数大于第一预设阈值的图像特征,作为深层图像特征,将经过卷积层数小于第二预设阈值的图像特征,作为浅层图像特征,该第一预设阈值大于该第二预设阈值,具体可根据场景设置,本说明书对此不做限制。

此外,现有技术在进行图像质量评估时,所使用的美学质量评估模型由若干卷积神经网络层以及全连接层组成。由于全连接层的参数是固定的,与输入全连接层的图像特征的特征维度相关,因此在训练该美学质量评估模型时,输入该美学质量评估模型的图像的尺寸大小应该保持一致,才能保证输入全连接层的图像特征的维度相同。于是,目前在向美学质量评估模型输入图像之前,还需要对该图像进行预处理操作,将该图像统一压缩或裁剪为224×224的尺寸大小。

但是,将图像尺寸进行压缩往往会损失部分图像信息,而该损失的图像信息对于图像的美学质量评估也有一定的影响,因此将图像压缩后输入,导致评判的图像的美学质量不够准确。

在本说明书实施例中,在对图像进行美学质量评估时,各待评估的图像的尺寸可以不完全相同,也就是说,本方案无需对输入的图像进行预处理,可直接将图像以原始的图像尺寸输入,先通过特征提取模型中的卷积层提取不同尺寸图像的图像特征,不同尺寸图像通过相同的卷积层提取出的图像特征的特征维度也不相同。之后,再将不同特征维度的图像特征输入预设的各卷积层对应的池化层,通过全局平均池化,提取各不同特征维度的图像特征的特征向量,因此可将各不同特征维度的图像特征转化为相同维度的特征向量。以使后续输入到包含全连接层的质量评价模型时,各图像的特征向量的维度相同。

在本说明书一个或多个实施例中,基于卷积核大小的限制,本说明书中图像尺寸最大为800×800,当输入的待评估图像超过最大的图像尺寸时,可按照图像的长宽比例,压缩至最大图像尺寸,以最大保留原始图像信息。

当然,本说明书提供图像处理方法,也可对图像尺寸相同的图像进行质量评估。当待评估的图像的图像尺寸相同时,可确定特征提取模型中至少两层卷积层输出的图像特征,该图像特征中包含图像的深层图像特征以及浅层图像特征。之后通过预设的各卷积层对应的池化层确定图像的特征向量,并将图像的特征向量输入质量评价模型,确定出该图像的质量评分,以进行图像处理。

基于图2所示的图像处理方法,本说明书实施例还对应提供一种图像处理装置的结构示意图,如图7所示。

图7为本说明书实施例提供的一种图像处理装置的结构示意图,所述装置包括:

获取模块200,获取若干待评估的图像;

特征提取模块202,针对每个待评估的图像,将该图像输入预先训练的特征提取模型,确定所述特征提取模型中至少两层卷积层输出的图像特征;

池化模块204,将确定出的各卷积层输出图像特征分别输入预设的各卷积层对应的池化层,得到各图像特征的特征向量;

特征向量确定模块206,根据确定出的各图像特征的特征向量,确定该图像的特征向量;

评分模块208,将该图像的特征向量输入预先训练的质量评价模型,确定所述质量评价模型输出的该图像的质量评分;

处理模块210,根据各图像的质量评分,进行图像处理。

可选地,所述特征提取模块202具体用于,获取若干图像,作为第一训练样本,针对每个第一训练样本,将该第一训练样本的真实类别作为该第一训练样本的标注,将该第一训练样本输入待训练的卷积神经网络模型,输出该第一训练样本的预测类别,所述卷积神经网络模型至少包含卷积神经网络层以及全连接层,以最小化所述预测类别与该第一训练样本标注的真实类别之间的差异为目标,调整所述卷积神经网络模型中的模型参数,将训练完成的卷积神经网络模型中除全连接层外的卷积神经网络模型,作为训练完成的特征提取模型。

可选地,所述评分模块208具体用于,获取若干图像,针对每个图像,将该图像输入预先训练的特征提取模型,确定所述特征提取模型中至少两层卷积层输出的图像特征,将各卷积层输出图像特征分别输入预设的各卷积层对应的池化层,确定各图像特征的特征向量,根据确定出的各图像特征的特征向量,确定该图像的特征向量,将各图像的特征向量作为第二训练样本,并确定各图像的质量评分作为各第二训练样本的标注,针对每个第二训练样本,将该第二训练样本输入待训练的全连接神经网络模型,确定所述全连接神经网络模型输出的该第二训练样本的质量评分,以最小化输出的质量评分与该第二训练样本标注的质量评分之间的差异为目标,调整所述全连接神经网络模型中的模型参数,将训练完成的全连接神经网络模型作为质量评价模型,所述质量评价模型用于评价图像的质量。

可选地,所述特征向量确定模块206具体用于,根据确定出的各图像特征的特征向量以及各图像特征对应的卷积层在所述特征提取模型中的顺序,确定该图像的特征向量。

可选地,所述质量评价模型为多个,每个质量评价模型分别由不同的图像数据集训练得到,所述评分模块208还用于,针对每个质量评价模型,将该图像输入该质量评价模型,确定该质量评价模型输出的质量评分,根据各质量评价模型输出的质量评分,确定该图像的质量评分。

可选地,所述评分模块208具体用于,对各质量评价模型输出的质量评分进行归一化,根据预设的各质量评价模型的权重以及归一化后的各质量评价模型输出的质量评分,确定该图像的质量评分。

可选地,所述处理模块210具体用于,根据各图像的质量评分,确定各图像的排序,根据各图像的排序,从各图像中确定目标图像,并进行展示。

本说明书实施例还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图2提供的图像处理方法。

基于图2所示的图像处理方法,本说明书实施例还提出了图8所示的电子设备的示意结构图。如图8,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图2所示的图像处理方法。

当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。

在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(programmablelogicdevice,pld)(例如现场可编程门阵列(fieldprogrammablegatearray,fpga))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片pld上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logiccompiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(hardwaredescriptionlanguage,hdl),而hdl也并非仅有一种,而是有许多种,如abel(advancedbooleanexpressionlanguage)、ahdl(alterahardwaredescriptionlanguage)、confluence、cupl(cornelluniversityprogramminglanguage)、hdcal、jhdl(javahardwaredescriptionlanguage)、lava、lola、myhdl、palasm、rhdl(rubyhardwaredescriptionlanguage)等,目前最普遍使用的是vhdl(very-high-speedintegratedcircuithardwaredescriptionlanguage)与verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(applicationspecificintegratedcircuit,asic)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:arc625d、atmelat91sam、microchippic18f26k20以及siliconelabsc8051f320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1