一种图像处理方法、图像处理装置及移动终端与流程

文档序号:16538847发布日期:2019-01-08 20:09阅读:181来源:国知局
一种图像处理方法、图像处理装置及移动终端与流程

本申请属于图像处理技术领域,尤其涉及一种图像处理方法、图像处理装置、移动终端及计算机可读存储介质。



背景技术:

目前的图像处理过程中,通过对图像进行目标检测可以为图像后续的后期处理提供较好的基础,从而提升图像的显示效果。

现有的目标检测方法主要是采用深度学习方法(例如fasterr-cnn模型、yolo模型、ssd模型等)对图像中的目标进行检测,虽然深度学习方法可以达到较高的检测精度,但计算量较大,对设备的性能要求较高,难以在计算能力较为受限的移动设备如手机上采用。



技术实现要素:

有鉴于此,本申请提供了一种图像处理方法、图像处理装置、移动终端及计算机可读存储介质,可以减少通过卷积神经网络模型进行目标检测时的计算量。

本申请的第一方面提供了一种图像处理方法,包括:

获取待处理图像;

对上述待处理图像进行检测,获得第一检测结果,上述第一检测结果用于指示上述待处理图像中是否存在第一目标,以及在存在第一目标时用于指示各个第一目标在上述待处理图像中的第一目标区域的尺寸;

根据上述第一目标区域的尺寸调整卷积神经网络模型的参数;

通过调整后的卷积神经网络模型对上述待处理图像进行检测,获得第二检测结果,上述第二检测结果用于指示上述待处理图像中是否存在第二目标,以及在存在第二目标时用于指示各个第二目标的类别和/或各个第二目标在上述待处理图像中的第二目标区域。

本申请的第二方面提供了一种图像处理装置,包括:

获取模块,用于获取待处理图像;

第一检测模块,用于对上述待处理图像进行检测,获得第一检测结果,上述第一检测结果用于指示上述待处理图像中是否存在第一目标,以及在存在第一目标时用于指示各个第一目标在上述待处理图像中的第一目标区域的尺寸;

调整模块,用于根据上述第一目标区域的尺寸调整卷积神经网络模型的参数;

第二检测模块,用于通过调整后的卷积神经网络模型对上述待处理图像进行检测,获得第二检测结果,上述第二检测结果用于指示上述待处理图像中是否存在第二目标,以及在存在第二目标时用于指示各个第二目标的类别和/或各个第二目标在上述待处理图像中的第二目标区域。

本申请的第三方面提供了一种移动终端,上述移动终端包括存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现如上第一方面的方法的步骤。

本申请的第四方面提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现如上第一方面的方法的步骤。

本申请的第五方面提供了一种计算机程序产品,上述计算机程序产品包括计算机程序,上述计算机程序被一个或多个处理器执行时实现如上述第一方面的方法的步骤。

由上可见,本申请获取待处理图像;对上述待处理图像进行检测,获得第一检测结果,上述第一检测结果用于指示上述待处理图像中是否存在第一目标,以及在存在第一目标时用于指示各个第一目标在上述待处理图像中的第一目标区域的尺寸;根据上述第一目标区域的尺寸调整卷积神经网络模型的参数;通过调整后的卷积神经网络模型对上述待处理图像进行检测,获得第二检测结果,上述第二检测结果用于指示上述待处理图像中是否存在第二目标,以及在存在第二目标时用于指示各个第二目标的类别和/或各个第二目标在上述待处理图像中的第二目标区域。本申请通过获取上述第一目标区域的尺寸,可以获得上述待处理图像中的目标所在的区域的大致尺寸,从而根据上述第一目标区域的尺寸来调整上述卷积神经网络的参数,以使得上述卷积神经网络模型无需对与上述目标所在的区域的大致尺寸差距过大的区域进行检测,从而减少计算量。通过本申请,可以减少通过卷积神经网络模型进行目标检测时的计算量,提高目标检测速度,具有较强的易用性和实用性。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的图像处理方法的一种实现流程示意图;

图2是本申请实施例提供的步骤s102的一种实现流程示意图

图3是本申请实施例提供的图像处理方法的另一种实现流程示意图;

图4是本申请实施例提供的图像处理方法的再一种实现流程示意图;

图5是本申请实施例提供的图像处理装置的结构示意图;

图6是本申请实施例提供的移动终端的结构示意图。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。

应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。

如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

具体实现中,本申请实施例中描述的移动终端包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型计算机或平板计算机之类的其它便携式设备。还应当理解的是,在某些实施例中,上述设备并非便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。

在接下来的讨论中,描述了包括显示器和触摸敏感表面的移动终端。然而,应当理解的是,移动终端可以包括诸如物理键盘、鼠标和/或控制杆的一个或多个其它物理用户接口设备。

移动终端支持各种应用程序,例如以下中的一个或多个:绘图应用程序、演示应用程序、文字处理应用程序、网站创建应用程序、盘刻录应用程序、电子表格应用程序、游戏应用程序、电话应用程序、视频会议应用程序、电子邮件应用程序、即时消息收发应用程序、锻炼支持应用程序、照片管理应用程序、数码相机应用程序、数字摄影机应用程序、web浏览应用程序、数字音乐播放器应用程序和/或数字视频播放器应用程序。

可以在移动终端上执行的各种应用程序可以使用诸如触摸敏感表面的至少一个公共物理用户接口设备。可以在应用程序之间和/或相应应用程序内调整和/或改变触摸敏感表面的一个或多个功能以及终端上显示的相应信息。这样,终端的公共物理架构(例如,触摸敏感表面)可以支持具有对用户而言直观且透明的用户界面的各种应用程序。

另外,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

为了说明本申请上述的技术方案,下面通过具体实施例来进行说明。

实施例一

参见图1,是本申请实施例提供的图像处理方法的实现流程示意图,该图像处理方法可以包括以下步骤:

步骤s101,获取待处理图像。

示例性的,上述待处理图像可以是移动终端启动相机后的预览画面中的图像、移动终端拍照得到的图像、移动终端中存储的图像、传输至移动终端的图像,也可以是从预先存储的视频或者用户输入的视频中获取的至少一帧图像等等,在此不作限定。

步骤s102,对上述待处理图像进行检测,获得第一检测结果,上述第一检测结果用于指示上述待处理图像中是否存在第一目标,以及在存在第一目标时用于指示各个第一目标在上述待处理图像中的第一目标区域的尺寸。

本申请实施例中,上述第一检测结果中可以包括上述待处理图像中是否存在第一目标的判断结果、上述第一目标的类别信息、上述第一目标区域的尺寸的信息等等。其中,上述第一目标为上述第一检测结果中检测得到的上述待处理图像的目标,上述第一目标可以有一个或多个。示例性的,上述第一目标可以指示在通过摄像头拍摄上述待处理图像时,上述待处理图像中距离上述摄像头较近的景物。此外,上述第一目标也可以是用户预先设置的物体尺寸,例如人、动物、植物、食物等等。上述第一目标区域为包含上述第一目标的区域,其中,上述第一目标区域可以规则区域(如矩形区域、圆形区域等边缘成一定规则排布的区域),也可以是不规则区域。上述尺寸可以是长、宽、长宽比、直径、面积等等指示上述区域的大小或者比例的信息。

示例性的,本申请实施例中,可以通过预设的深度学习算法或者不包括深度学习算法的预设检测方式对上述待处理图像进行检测。

例如,可以通过预设的深度学习算法对上述待处理图像进行检测,以获得第一检测结果。其中,上述深度学习算法可以区别于步骤s103中的卷积神经网络模型,且可选的,预设的上述深度学习算法的卷积层数可以小于上述卷积神经网络模型,从而可以对上述待处理图像实现快速检测。示例性的,上述预设的深度学习算法可以是alexnet模型、zfnet模型等。此外,还可以通过预设的边缘提取算法获取上述待处理图像中的边缘信息,并根据上述边缘信息判断上述待处理图像中是否包含第一目标以及识别第一目标在上述待处理图像中的第一目标区域。例如,可以根据上述边缘信息判断是否存在构成了封闭的图像区域的边缘;若存在构成了封闭的图像区域的边缘,则确定上述待处理图像中封闭的图像区域所对应的图像为第一目标,并将上述封闭的图像区域作为第一目标区域。此外,当上述待处理图像为连续多帧图像(例如预览画面、视频、连续拍照等)中的一帧图像时,也可以通过滑动窗口检测、帧间差分法、背景差分法、vibe算法等方法识别上述待处理图像中的第一目标,并结合边缘提取算法得到上述第一目标区域的尺寸。

可选的,上述步骤s102的一种具体实现流程图如图2所示。上述步骤s102可以包括以下步骤:

步骤s201,检测上述待处理图像中是否存在第一目标。

其中,示例性的,可以通过卷积层小于预设值的深度学习算法检测上述待处理图像中是否存在第一目标,也可以通过不包括深度学习算法的检测方式(如滑动窗口检测等)来检测上述待处理图像中是否存在第一目标,从而对上述待处理图像进行一个初步的目标识别。

步骤s202,若上述待处理图像中存在第一目标,则获取上述第一目标的轮廓,将包含上述轮廓的矩形区域作为第一目标区域。

本申请实施例中,可以通过预设的边缘提取算法获取上述第一目标的轮廓。其中,上述边缘提取算法可以包括sobel算子、laplacian算子或者canny算子等算法。上述第一目标区域可以是包含上述轮廓的最小矩形区域,也可以是矩形边缘与上述轮廓的最小距离为预设距离的矩形区域。

步骤s203,获得第一检测结果,上述第一检测结果用于指示上述待处理图像中是否存在第一目标,以及在存在第一目标时用于指示各个第一目标在上述待处理图像中的第一目标区域的尺寸。

本申请实施例中,通过获取上述第一目标区域的尺寸,可以对上述待处理图像中的准确的目标区域的尺寸做一个初步估计,使得在后续的目标检测中,可以根据上述第一目标区域的尺寸对后续的目标检测中的参数所对应的检测区间做一定的限制。

步骤s103,根据上述第一目标区域的尺寸调整卷积神经网络模型的参数。

本申请实施例中,上述卷积神经网络用于对上述待处理图像进行目标检测以识别上述待处理图像中是否存在目标,以及在存在目标时用于指示各个目标的类别和/或各个目标在上述待处理图像中的目标区域。其中,可选的,上述卷积神经网络模型中可以预先设置预选框,在对上述待处理图像进行检测时,可以对上述待处理图像中的局部区域进行目标检测,其中,上述局部区域可以与上述预选框相对应。示例性的,上述卷积神经网络模型可以是r-cnn系列卷积神经网络模型(例如r-cnn模型、sppnet模型、fastr-cnn模型以及fasterr-cnn模型等等)、yolo模型、ssd(singleshotmultiboxdetector)模型等等。

示例性的,卷积神经网络模型的参数可以包括每个卷积层的权重、回归函数的系数,还可以包括每个卷积层对应的预选框的尺寸等等。其中,上述卷积神经网络模型的不同卷积层的卷积核可以不同,因此不同卷积层通过卷积核获得的特征图所对应的特征类型也不同,因此,上述卷积神经网络模型对不同特征图进行特征识别时,所采用的预选框的尺寸也可以不同。

此外,需要说明的是,在实际应用中,所调整的参数会根据所选择的卷积神经网络模型的类型不同而不同。例如,若上述卷积神经网络模型为yolo模型,则可以根据上述第一目标区域的尺寸调整上述yolo模型中的格子(box)以及边界框(boundingbox)的参数,其中,上述格子为上述yolo模型中用于划分上述待处理图像的边框,上述边界框为上述yolo模型中用于在上述格子中预测目标区域的边框;若上述卷积神经网络模型为ssd模型,则可以根据上述第一目标区域的尺寸来调整上述ssd模型中默认框(defaultbox)的尺寸,其中,上述defaultbox为ssd模型中用于预测上述目标区域的边框。因此,本申请实施例中,所调整的卷积神经网络模型的参数可以根据实际应用来确定,在此不作限定。

可选的,上述第一目标区域的尺寸包括上述第一目标区域的长宽比、长、宽、面积中至少一种。

本申请实施例中,在获得第一检测结果后,再根据上述第一检测结果中的第一目标区域的尺寸来调整上述卷积神经网络的参数,可以调整上述卷积神经网络中的参数的取值或者在检测时上述参数所需要遍历的区间,从而减少计算量。

步骤s104,通过调整后的卷积神经网络模型对上述待处理图像进行检测,获得第二检测结果,上述第二检测结果用于指示上述待处理图像中是否存在第二目标,以及在存在第二目标时用于指示各个第二目标的类别和/或各个第二目标在上述待处理图像中的第二目标区域。

本申请实施例中,其中,上述第二检测结果中可以包括上述待处理图像中是否存在第二目标的判断结果、上述第二目标的类别、上述第二目标区域的位置信息等等。上述第二目标为上述第二检测结果中检测得到的上述待处理图像的目标,上述第一目标可以有一个或多个。示例性的,上述第二目标可以指示在通过摄像头拍摄上述待处理图像时,上述待处理图像中距离上述摄像头较近的景物。此外,上述第二目标也可以是用户预先设置的物体尺寸,例如人、动物、植物、食物等等。上述目标的类别可以是预先设置的,所述类别可以有多种,示例性的,所述目标的类别可以包括人、动物、植物等等。上述第二目标区域为包含上述第二目标的区域,其中,上述第二目标区域可以规则区域,也可以是不规则区域。需要说明的是,上述第二目标可以与上述第一目标相同,也可以与上述第一目标不同;上述第二目标区域可以与上述第一目标区域相同,也可以不同,在此不作限定。

本申请实施例中,在根据上述第一目标区域的尺寸调整卷积神经网络模型的参数之前,还可以包括上述卷积神经网络模型的训练步骤。

可选的,上述卷积神经网络模型的训练步骤可以包括:

获取训练集图像,上述训练集图像中包含预设目标、上述预设目标的预设类别以及上述预设目标在上述训练集图像中的预设区域的信息;

利用卷积神经网络模型对上述训练集图像进行检测,获得检测结果;

根据检测结果调整上述卷积神经网络模型的参数,直到该调整后的上述卷积神经网络模型检测出上述训练集图像中包含的目标的类别与上述预设类别相比的准确率不低于第一预设值,且该调整后的上述卷积神经网络模型检测出上述训练集图像中所包含的目标所在的区域与预设区域相比的准确率不低于第二预设值,并将该调整后的卷积神经网络模型作为训练后的卷积神经网络模型。

其中,上述训练集图像可以是预先存储的样本图像,也可以是用户输入的样本图像等。需要说明的是,上述训练集图像的形式可以是多样化的。上述卷积神经网络模型的参数可以包括每个卷积层的权重、偏差、回归函数的系数、学习速率、迭代次数、每层神经元的个数等。本申请实施例可以通过卷积神经网络模型的代价函数来评估训练中的卷积神经网络模型的准确率是否达到上述要求。通过代价函数可以评估卷积神经网络模型的检测结果与真实结果的差距。示例性的,代价函数可以是关于卷积神经网络模型的均方误差的函数,或者是关于卷积神经网络模型的交叉熵的函数等等。本申请实施例中,上述卷积神经网络的代价函数可以有两个,分别用于判断上述卷积神经网络模型检测出上述训练集图像中包含的目标的类别与上述预设类别相比的准确率,以及上述卷积神经网络模型检测出上述训练集图像中所包含的目标所在的区域与预设区域相比的准确率。

本申请实施例中,通过获取上述第一目标区域的尺寸,可以获得上述待处理图像中的目标所在的区域的大致尺寸,从而根据上述第一目标区域的尺寸来调整上述卷积神经网络的参数,以使得上述卷积神经网络模型无需对与上述目标所在的区域的大致尺寸差距过大的区域进行检测,从而减少通过卷积神经网络模型进行目标检测时的计算量,提高目标检测速度,具有较强的易用性和实用性。

实施例二

参见图3,是本申请实施例提供的图像处理方法的另一种实现流程示意图,该图像处理方法可以包括以下步骤:

步骤s301,获取待处理图像。

步骤s302,对上述待处理图像进行检测,获得第一检测结果,上述第一检测结果用于指示上述待处理图像中是否存在第一目标,以及在存在第一目标时用于指示各个第一目标在上述待处理图像中的第一目标区域的尺寸。

步骤s303,根据上述第一目标区域的尺寸获得上述卷积神经网络模型中需要遍历的预选框的尺寸,其中,上述预选框用于预测上述第二目标区域。

本申请实施例中,上述预选框可以是上述卷积神经网络模型中确定对上述待处理图像进行检测的检测区域的尺寸的边框。在实际应用中,对于不同的卷积神经网络模型,上述预选框可以对应不同的名称。例如,若上述卷积神经网络模型为yolo模型,则上述预选框可以为yolo模型中的格子(box)和/或边界框(boundingbox)等;若上述卷积神经网络模型为ssd模型,则上述预选框可以为上述ssd模型中的默认框(defaultbox)等;若上述卷积神经网络模型为fasterr-cnn模型,则上述预选框可以为fasterr-cnn模型中的建议窗口(regionproposal)等。

本申请实施例中,上述卷积神经网络模型中需要遍历的预选框的尺寸与上述第一目标区域的尺寸的对应关系可以根据具体应用场景进行设置。示例性的,若上述第一目标区域的尺寸包括上述第一目标区域的长宽比,此时上述第一目标区域的长宽比为1:1时,可以设置上述卷积神经网络模型中需要遍历的预选框的长宽比为1:1,或者可以设置上述卷积神经网络模型中需要遍历的预选框的长宽比为[1:0.9,1:2]。

步骤s304,根据上述预选框的尺寸调整上述卷积神经网络模型的参数。

在获得上述卷积神经网络模型中需要遍历的预选框的尺寸之后,可以根据上述预选框的尺寸调整上述卷积神经网络模型中与上述预选框尺寸相关联的参数。例如,若上述卷积神经网络模型为ssd模型,则上述预选框的尺寸所对应的参数可以是上述ssd模型中的默认框(defaultbox)的大小(scale)和/或长宽比(aspectratio)。

步骤s305,通过调整后的卷积神经网络模型对上述待处理图像进行检测,获得第二检测结果,上述第二检测结果用于指示上述待处理图像中是否存在第二目标,以及在存在第二目标时用于指示各个第二目标的类别和/或各个第二目标在上述待处理图像中的第二目标区域。

在本申请实施例中,上述步骤s301、s302、s305分别与上述步骤s101、s102、s104相同,具体可参见上述步骤s101、s102、s104的相关描述,在此不再赘述。

本申请实施例中,可选的,上述通过调整后的卷积神经网络模型对上述待处理图像进行检测可以包括:

逐一根据上述预选框的尺寸通过调整后的上述卷积神经网络模型对上述待处理图像中与上述预选框相对应的区域进行目标检测,以获取该区域中包含的第二目标的类别的置信度以及该区域与上述第二目标区域的偏移估计值,直到遍历所有的预选框;

根据遍历所有的预选框后获取到的上述置信度和上述偏移估计值确定上述待处理图像中是否存在第二目标,以及若上述待处理图像中存在第二目标,则确定上述第二目标的类别和/或上述第二目标所在的第二目标区域。

其中,与上述预选框相对应的区域可以是尺寸与上述预选框相对应。对于一个固定尺寸的预选框,上述预选框可以以预设步长在上述待处理图像上移动,以对获得的多个与上述预选框相对应的区域进行目标检测。上述第二目标的类别可以是预选设置的。

上述置信度可以表示该区域包含属于该类别的第二目标的概率。通过对与上述区域进行特征比对,获得该区域的特征与上述类别的预设特征的特征比对结果,可以获得该区域中包含的第二目标的类别的置信度。上述偏移估计值可以表示该区域与上述第二目标区域的不重合区域占该区域的比值的估计值。

本申请实施例中,对于遍历所有的预选框后获取到的上述置信度和上述偏移估计值,可以设置第二目标的每种类别所对应的置信度阈值,根据获取到的上述置信度与上述置信度阈值的比对结果判断上述确定上述待处理图像中是否存在第二目标,以及判断上述第二目标的类别;对于每一个第二目标,还可以获取该第二目标所对应的偏移估计值中,最小值所对应的区域作为第二目标区域。

本申请实施例中,通过根据上述第一目标区域的尺寸获得上述卷积神经网络模型中需要遍历的预选框的尺寸类型,再根据上述预选框的尺寸调整上述卷积神经网络模型的参数,可以调整上述卷积神经网络中的参数的取值或者在检测时上述参数所需要遍历的区间,从而减少计算量,提高上述卷积神经网络的检测速度。

实施例三

参见图4,是本申请实施例提供的图像处理方法的再一种实现流程示意图,该图像处理方法可以包括以下步骤:

步骤s401,获取待处理图像。

步骤s402,对上述待处理图像进行检测,获得第一检测结果,上述第一检测结果用于指示上述待处理图像中是否存在第一目标,以及在存在第一目标时用于指示各个第一目标在上述待处理图像中的第一目标区域的尺寸。

步骤s403,根据上述第一目标区域的尺寸调整卷积神经网络模型的参数。

步骤s404,通过调整后的卷积神经网络模型对上述待处理图像进行检测,获得第二检测结果,上述第二检测结果用于指示上述待处理图像中是否存在第二目标,以及在存在第二目标时用于指示各个第二目标的类别和/或各个第二目标在上述待处理图像中的第二目标区域。

在本申请实施例中,上述步骤s401、s402、s403、s404分别与上述步骤s101、s102、s103、s104相同,具体可参见上述步骤s101、s102、s103、s104的相关描述,在此不再赘述。

步骤s405,若上述第二检测结果指示上述待处理图像中存在第二目标,则根据上述第二目标的类别和上述第二目标区域,通过预设的选定框在上述待处理图像中对上述第二目标进行框选并显示。

本申请实施例中,上述选定框可以是矩形框、圆形框等表示形式,可以通过不同的颜色、不同形状等不同表示形式来区分不同第二目标的选定框,在此不作限定。该选定框可以依据上述第二目标的类别和上述第二目标区域来进行框选和显示。上述选定框的表示形式可以是预先系统设置的,也可以是用户设置的。

通过将上述第二目标在上述待处理图像中采用对应的选定框进行框选并显示,可以便于用户直观的分辨上述第二目标,并可以方便地对框选的第二目标进行处理,例如可以对上述第二目标进行对焦。

应理解,上述实施例一、二和三中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。

实施例四

参见图5,是本申请实施例提供的图像处理装置的结构示意图,为了便于说明,仅示出了与本申请实施例相关的部分。该图像处理装置可以用于各种具备图像处理功能的终端,例如笔记本电脑、口袋计算机(pocketpersonalcomputer,ppc)、个人数字助理(personaldigitalassistant,pda)等中,可以为内置于这些终端内的软件单元、硬件单元或者软硬件结合单元等。本申请实施例中的图像处理装置500包括:

获取模块501,用于获取待处理图像;

第一检测模块502,用于对上述待处理图像进行检测,获得第一检测结果,上述第一检测结果用于指示上述待处理图像中是否存在第一目标,以及在存在第一目标时用于指示各个第一目标在上述待处理图像中的第一目标区域的尺寸;

调整模块503,用于根据上述第一目标区域的尺寸调整卷积神经网络模型的参数;

第二检测模块504,用于通过调整后的卷积神经网络模型对上述待处理图像进行检测,获得第二检测结果,上述第二检测结果用于指示上述待处理图像中是否存在第二目标,以及在存在第二目标时用于指示各个第二目标的类别和/或各个第二目标在上述待处理图像中的第二目标区域。

可选的,上述第一检测模块502具体包括:

第一检测单元,用于检测上述待处理图像中是否存在第一目标;

获取单元,用于若上述待处理图像中存在第一目标,则获取上述第一目标的轮廓,将包含上述轮廓的矩形区域作为第一目标区域。

可选的,上述调整模块503具体包括:

获得单元,用于根据上述第一目标区域的尺寸获得上述卷积神经网络模型中需要遍历的预选框的尺寸类型,其中,上述预选框用于预测上述第二目标区域;

调整单元,用于根据上述预选框的尺寸调整上述卷积神经网络模型的参数。

可选的,上述第二检测模块504具体包括:

第二检测单元,用于逐一根据上述预选框的尺寸通过调整后的上述卷积神经网络模型对上述待处理图像中与上述预选框相对应的区域进行目标检测,以获取该区域中包含的第二目标的类别的置信度以及该区域与上述第二目标区域的偏移估计值,直到遍历所有的预选框;

确定单元,用于根据遍历所有的预选框后获取到的上述置信度和上述偏移估计值确定上述待处理图像中是否存在第二目标,以及若上述待处理图像中存在第二目标,则确定上述第二目标的类别和/或上述第二目标所在的第二目标区域。

可选的,上述图像处理装置500中,上述第一目标区域的尺寸包括上述第一目标区域的长宽比、长、宽、面积中至少一种。

可选的,上述图像处理装置500还包括:

显示模块,用于若上述第二检测结果指示上述待处理图像中存在第二目标,则根据上述第二目标的类别和上述第二目标区域,通过预设的选定框在上述待处理图像中对上述第二目标进行框选并显示。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将上述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

实施例五

本申请实施例提供了一种移动终端,请参阅图6,本申请实施例中的移动终端包括:存储器601,一个或多个处理器602(图6中仅示出一个)及存储在存储器601上并可在处理器上运行的计算机程序。其中:存储器601用于存储软件程序以及模块,处理器602通过运行存储在存储器601的软件程序以及单元,从而执行各种功能应用以及数据处理。具体地,处理器602通过运行存储在存储器601的上述计算机程序时实现以下步骤:

获取待处理图像;

对上述待处理图像进行检测,获得第一检测结果,上述第一检测结果用于指示上述待处理图像中是否存在第一目标,以及在存在第一目标时用于指示各个第一目标在上述待处理图像中的第一目标区域的尺寸;

根据上述第一目标区域的尺寸调整卷积神经网络模型的参数;

通过调整后的卷积神经网络模型对上述待处理图像进行检测,获得第二检测结果,上述第二检测结果用于指示上述待处理图像中是否存在第二目标,以及在存在第二目标时用于指示各个第二目标的类别和/或各个第二目标在上述待处理图像中的第二目标区域。

假设上述为第一种可能的实施方式,则在上述第一种可能的实施方式作为基础而提供的第二种可能的实施方式中,上述对上述待处理图像进行检测包括:

检测上述待处理图像中是否存在第一目标;

若上述待处理图像中存在第一目标,则获取上述第一目标的轮廓,将包含上述轮廓的矩形区域作为第一目标区域。

在第一种可能的实施方式作为基础,或者上述第二种可能的实施方式作为基础而提供的第三种可能的实施方式中,上述根据上述第一目标区域的尺寸调整卷积神经网络模型的参数包括:

根据上述第一目标区域的尺寸获得上述卷积神经网络模型中需要遍历的预选框的尺寸类型,其中,上述预选框用于预测上述第二目标区域;

根据上述预选框的尺寸调整上述卷积神经网络模型的参数。

在第一种可能的实施方式作为基础,或者上述第二种可能的实施方式作为基础、或者上述第三种可能的实施方式作为基础而提供的第四种可能的实施方式中,上述通过调整后的卷积神经网络模型对上述待处理图像进行检测包括:

逐一根据上述预选框的尺寸通过调整后的上述卷积神经网络模型对上述待处理图像中与上述预选框相对应的区域进行目标检测,以获取该区域中包含的第二目标的类别的置信度以及该区域与上述第二目标区域的偏移估计值,直到遍历所有的预选框;

根据遍历所有的预选框后获取到的上述置信度和上述偏移估计值确定上述待处理图像中是否存在第二目标,以及若上述待处理图像中存在第二目标,则确定上述第二目标的类别和/或上述第二目标所在的第二目标区域。

在上述第一种可能的实施方式作为基础而提供的第五种可能的实施方式中,上述第一目标区域的尺寸包括上述第一目标区域的长宽比、长、宽、面积中至少一种。

在第一种可能的实施方式作为基础,或者上述第二种可能的实施方式作为基础,或者上述第三种可能的实施方式作为基础,或者上述第四种可能的实施方式作为基础,或者上述第五种可能的实施方式作为基础而提供的第六种可能的实施方式中,处理器602通过运行存储在存储器601的上述计算机程序时还实现以下步骤:

若上述第二检测结果指示上述待处理图像中存在第二目标,则根据上述第二目标的类别和上述第二目标区域,通过预设的选定框在上述待处理图像中对上述第二目标进行框选并显示。

进一步,如图6所示,上述移动终端还可包括:一个或多个输入设备603(图6中仅示出一个)和一个或多个输出设备604(图6中仅示出一个)。存储器601、处理器602、输入设备603和输出设备604通过总线605连接。

应当理解,在本申请实施例中,所称处理器602可以是中央处理单元(centralprocessingunit,cpu),该处理器还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

输入设备603可以包括键盘、触控板、指纹采集传感器(用于采集用户的指纹信息和指纹的方向信息)、麦克风、摄像头等,输出设备604可以包括显示器、扬声器等。

存储器601可以包括只读存储器和随机存取存储器,并向处理器602提供指令和数据。存储器601的一部分或全部还可以包括非易失性随机存取存储器。例如,存储器601还可以存储设备尺寸的信息。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者外部设备软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,上述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

上述集成的单元、模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,上述计算机程序包括计算机程序代码,上述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。上述计算机可读存储介质可以包括:能够携带上述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机可读存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,上述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读存储介质不包括是电载波信号和电信信号。

以上上述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1