基于YOLO的轻量级目标检测网络、方法及电子设备

文档序号:32763701发布日期:2022-12-31 10:27阅读:32来源:国知局
基于YOLO的轻量级目标检测网络、方法及电子设备
基于yolo的轻量级目标检测网络、方法及电子设备
技术领域
1.本技术涉及图像处理技术领域,具体地涉及一种基于yolo的轻量级目标检测网络、方法及电子设备。


背景技术:

2.基于图像的自动目标检测(以下简称目标检测)是计算机视觉中的一项基本任务,通常为后续视觉任务提供基础。通常,目标检测器预测图像中每个目标的位置、大小和类别。近年来,在深度学习技术快速发展的支持下,目标检测取得了显著的成绩,并越来越多地用于机器人视觉、自动驾驶、智能交通、工业质量检测、目标跟踪和人脸检测等众多用途。
3.虽然无数的目标检测器都实现了卓越的检测精度,但它们可能对计算配置提出了很高的要求,而这些配置在许多应用场景中是无法负担或无法获得的。因此,针对这些场景迫切需要实现轻量化目标检测,并受到越来越多的研究关注。在许多嵌入式应用中,轻量化目标检测对于智能场景分析和定位非常重要,甚至采用软硬件联合设计的方法来设计它。
4.目前基于深度学习的目标检测器可以分为基于锚框的和无锚框的方法,以及两阶段和一阶段的方法,但是,目前大量基于锚框的单阶段目标检测器仍然可能需要大量的计算资源,这超出了移动或边缘设备等中端或低端平台的能力。因此,如何在保持较高的检测精度的同时,减少基于锚框的单阶段目标检测神经网络的体量成为了一个亟待解决的问题。


技术实现要素:

5.鉴于此,本技术提供一种基于yolo的轻量级目标检测网络、方法及电子设备,以解决现有技术中基于锚框的目标检测神经网络体量大的问题。
6.第一方面,本技术实施例提供了一种基于yolo的轻量级目标检测网络,包括:骨干网络、检测颈部和检测头部,所述骨干网络选择轻量级网络mobilenetv2作为基线骨干结构,靠近mobilenetv2结构前端的位置设置简化的非局部simplified nl块,在mobilenetv2骨干上设置多个3
×
3卷积分支conv,每个分支平行于一个瓶颈模块序列,所述骨干网络接收端引入原始图像的高频小波信息;所述检测颈部采用特征金字塔网络fpn的骨架结构,将所述fpn中的每个3
×
3卷积替换为一个由3
×
3深度可分离卷积depthsepconv和一个挤压激励se块融合而成的简洁块;所述检测头部采用原始的yolov3检测头部,所述检测头部中的一个3
×
3卷积替换为一个由3
×
3深度可分离卷积depthsepconv和一个挤压激励se块融合而成的简洁块。
7.一种可能的实现方式,所述骨干网络包括:卷积块conv,与所述conv连接的梯度网络,所述梯度网络由多个瓶颈层bottleneck块组成,每个所述bottleneck块平行设置一个3
×
3conv,所述bottleneck块与所述3
×
3conv通道拼接后输入相邻的bottleneck块。
8.一种可能的实现方式,所述梯度网络按照数据输入流向依次包括第一bottleneck块、第二bottleneck块、第三bottleneck块、第四bottleneck块、第五bottleneck块、第六
bottleneck块和第七bottleneck块,所述第一bottleneck块和第七bottleneck块包括一个bottleneck,所述第二bottleneck块包括两个bottleneck,所述第三bottleneck块、所述第五bottleneck块和所述第六bottleneck块包括三个bottleneck,所述第四bottleneck块包括四个bottleneck,其中所述第二bottleneck块之后设置所述simplified nl块,所述第二bottleneck块与所述simplified nl块串联然后与对应的3
×
3conv通道拼接后输出到第三bottleneck块。
9.一种可能的实现方式,所述bottleneck包括一个1
×
1conv和与所述1
×
1conv连接的3
×
3深度可分离卷积depthsepconv,所述depthsepconv由深度卷积和逐点卷积组成。
10.一种可能的实现方式,所述simplified nl块包括平行设置的1
×
1conv第一分支和1
×
1conv与softmax函数组合的第二分支,所述第一分支和第二分支矩阵相乘后输出到一个1
×
1conv。
11.一种可能的实现方式,所述检测颈部包括与所述梯度网络中的三组simplified neck conv block,所述simplified neck conv block之间设置1
×
1conv+上采样upsample组合块,第一组合块的输出端与第一simplified neck conv block的输入端通道拼接,第一组合块的输入端与第二simplified neck conv block的输出端相连接;第二组合块的输出端与第二simplified neck conv block的输入端通道拼接,第二组合块的输入端与第三simplified neck conv block的输出端相连接。
12.一种可能的实现方式,所述simplified neck conv block包括三个1
×
1conv和两组3
×
3depthsepconv+挤压-激励se融合块,所述3
×
3depthsepconv+se融合块设置在所述1
×
1conv之间。
13.一种可能的实现方式,所述3
×
3depthsepconv+se融合块中3
×
3depthsepconv与se块通道相乘。
14.一种可能的实现方式,所述检测头部包括与simplified neck conv block一一对应连接的simplified head conv block,所述simplified head conv block包括相连接的3
×
3depthsepconv+se融合块和1
×
1conv。
15.第二方面,本技术实施例提供了一种基于第一方面任一可能实现方式所述的yolo的轻量级目标检测网络的目标检测方法,包括:将原始图像增加高频信息后输入骨干网络,经过检测颈部和检测头部后对所述原始图像中的小目标进行目标检测,其中所述将原始图像增加高频信息后输入所述骨干网络,包括:对原始图像进行小波变换wt,对三个高频波段进行逆小波变换iwt,并将iwt的结果作为一个额外的通道与原始图像一起送入所述骨干网络。
16.第三方面,本技术实施例提供了一种电子设备,包括:
17.处理器;
18.存储器;
19.以及计算机程序,其中所述计算机程序被存储在所述存储器中,所述计算机程序包括指令,当所述指令被所述处理器执行时,使得所述电子设备调用第一方面任一可能实现方式所述的基于yolo的轻量级目标检测网络对原始图像小目标进行目标检测。
20.在本技术实施例中,使用原始图像的高频小波信息来增强输入,为神经网络提供目标定位和表征的初始指导。此外还简化了基线yolov3网络的主干、检测颈和检测头,在保
证图像小目标检测精度的前提下,减小了网络的规模。
附图说明
21.为了更清楚地说明本技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
22.图1为本技术实施例提供的一种基于yolo的轻量级目标检测网络的结构示意图;
23.图2为本技术实施例提供的一种bottleneck的结构示意图;
24.图3为本技术实施例提供的simplified nl块的结构示意图
25.图4为本技术实施例提供的simplified neck conv block的结构示意图;
26.图5为本技术实施例提供的3
×
3depthsepconv+se融合块的结构示意图;
27.图6为本技术实施例提供的simplified head conv block的结构示意图;
28.图7为本技术实施例提供的图像进行目标检测的可视化结果示意图;
29.图8为本技术实施例提供的自注意力在小目标检测中的示意图;
30.图9为本技术实施例提供的一种电子设备的示意图。
具体实施方式
31.为了更好的理解本技术的技术方案,下面结合附图对本技术实施例进行详细描述。
32.应当明确,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本技术保护的范围。
33.在本技术实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本技术。在本技术实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
34.应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,甲和/或乙,可以表示:单独存在甲,同时存在甲和乙,单独存在乙这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
35.对于一般的轻量化处理方法,目前有各种类型的方法。一些方法压缩已经训练好的模型。这类方法包括知识蒸馏、权重量化、剪枝等。一些方法专门设计轻量化的模型,其中包括用于分类任务的mobilenet系列模型和shufflenet系列模型。一些方法致力于加速卷积运算的数值计算。也有一些方法通过特殊的硬件部署来实现轻量化神经网络。在这项工作中,我们采用了专门模型设计的方法,因为它可以提供更大的算法探索空间。
36.具体来说,我们在这项工作中提出了一种轻量级的神经网络,用于基于锚框的单阶段目标检测,它是基于现有的原始目标检测器(即yolov3),在网络的输入和网络架构方面都引入了创新。这项工作的主要贡献包括以下方面。
37.将原始图像的高频小波信息(通过小波变换和逆小波变换)引入到神经网络的输入中,为神经网络对图像中的目标进行定位和表征提供了初始指导。
38.优化了yolov3的基线网络架构,通过增强的mobilenet结构重构骨干网络,并将检测颈部和头部的每个3
×
3卷积替换为深度可分离的3
×
3卷积与挤压激励块的融合。
39.在ms-coco 2017基准数据集上的实验表明,所提出的检测器大幅减少了yolov3模型的体量,并在参数数量(params)、浮点运算数(flops)和/或平均精度(map)方面和其他相关的最先进的轻量级模型相比,取得了更好的结果。特别地,该检测器擅长于检测小目标。
40.目前基于深度学习的目标检测器也可以分为两级检测器和一级检测器。前者通常先提出感兴趣区域,然后进行细粒度的目标检测,而后者则是一个整体的步骤进行目标检测。虽然两级检测器在某些情况下可能达到更好的精度,但它们往往较慢,可能无法满足自动驾驶等应用程序的实时要求。单级检测器能够很好地平衡目标检测的效率和精度。
41.在轻量化目标检测领域,精度和效率一直是人们追求的目标。yolov3-tiny基于yolov3,去掉了一些特征层,只保留了两个独立的预测分支。yolov4-tiny的设计考虑了内存带宽、内存访问成本和dram流量等因素。yolobile通过压缩-编译协同设计,主要针对yolov4实现移动设备上的实时目标检测。以mobilenetv3为骨干,采用tinyfpn结构为颈部,实现了轻量化目标检测器pp-yolo-tiny。为了使网络模型更轻量化,nanodet采用了shufflenetv2作为骨干网,并使用和gfl和atss来提高精度。yolox-nano和yolox-tiny是无锚框yolox系列中的轻量级目标检测模型,其中yolox-nano是最轻的模型。yolov5系列中的轻量模型分别为yolov5n和yolov5s,根据不同的宽度和深度比值对网络模型进行缩小,其中最轻的模型为yolov5n。在无锚框的pp-picodet实时目标检测系列中,pp-picodet-s是最轻的检测器。为了适应实际应用中的不同场景,单级无锚框pp-yoloe提供了不同尺寸的模型s/m/l/x,其中pp-yoloe-s是最小尺寸的模型。无锚框yolov6系列由硬件友好设计的主干和颈部,高效解耦的头带siou损耗,其中最轻的型号是yolov6-nano。
42.在上述介绍的轻量化目标检测器中,yolobile、pp-yolo-tiny、yolov5n和yolov5s与本技术属于同一类轻量级基于锚框的单阶段目标检测器。
43.下面结合附图对本技术实施例进行阐述:
44.图1为本技术实施例提供的一种基于yolo的轻量级目标检测网络的结构示意图,参见图1,本技术实施例中的轻量级目标检测网络,包括:骨干网络、检测颈部和检测头部,所述骨干网络选择轻量级网络mobilenetv2作为基线骨干结构,靠近mobilenetv2结构前端的位置设置简化的非局部simplified nl块,在mobilenetv2骨干上设置多个3
×
3卷积分支conv,每个分支平行于一个瓶颈模块序列,所述骨干网络接收端引入原始图像的高频小波信息;所述检测颈部采用特征金字塔网络fpn的骨架结构,将所述fpn中的每个3
×
3卷积替换为一个由3
×
3深度可分离卷积depthsepconv和一个挤压激励se块融合而成的简洁块;所述检测头部采用原始的yolov3检测头部,所述检测头部中的一个3
×
3卷积替换为一个由3
×
3深度可分离卷积depthsepconv和一个挤压激励se块融合而成的简洁块。
45.观察到图像的高频信息包含了关于目标边缘和边界的重要线索,本技术利用其高频信息增强原始图像输入。虽然高频信息可能被卷积层捕获,但明确地将其作为输入输入网络,以帮助在降低网络复杂度的情况下得到好的检测效果。具体来说,对原始图像进行小波变换(wt),对三个高频波段进行逆小波变换(iwt),并将iwt的结果作为一个额外的通道与原始图像一起送入网络。
46.原始的yolov3使用darknet53作为骨干结构,这是相当沉重的,因此,我们有动力
寻找一个轻量级的替代品。现有技术中图像轻量级分类问题已经得到了深入的研究,设计了许多轻量级网络结构。mobilenetv2就是其中一个取得了巨大成功的轻量级网络。因此,我们选择mobilenetv2作为我们轻量级目标检测器的基线骨干结构,并在此基础上进行进一步的优化。
47.图1中,所述骨干网络包括:卷积块conv,与所述conv连接的梯度网络,所述梯度网络由多个瓶颈层bottleneck块组成,每个所述bottleneck块平行设置一个3
×
3conv,所述bottleneck块与所述3
×
3conv以及相邻的bottleneck块通道拼接。
48.所述梯度网络包括依次通道拼接的第一bottleneck块、第二bottleneck块、第三bottleneck块、第四bottleneck块、第五bottleneck块、第六bottleneck块和第七bottleneck块,所述第一bottleneck块和第七bottleneck块包括一个bottleneck,所述第二bottleneck块包括两个bottleneck,所述第三bottleneck块、所述第五bottleneck块和所述第六bottleneck块包括三个bottleneck,所述第四bottleneck块包括四个bottleneck,其中所述第二bottleneck块之后设置所述simplified nl块,所述第二bottleneck块与所述simplified nl块串联然后与对应的3
×
3conv通道拼接后输出到第三bottleneck块。
49.参见图2,所述bottleneck包括一个1
×
1conv和与所述1
×
1conv连接的3
×
3深度可分离卷积depthsepconv,所述depthsepconv由深度卷积和逐点卷积组成。
50.远距离像素依赖提供了大范围的上下文信息,对精确的目标检测非常重要。它通常被基线卷积神经网络的深层捕获。为了在早期利用远距离像素依赖,我们在靠近mobilenetv2结构前端的位置添加了一个简化的非局部simplified nl块,如图1所示。简化后的非局部块结构如图4所示,实质上实现了一种轻量级的自注意力机制,图3中,所述simplified nl块包括平行设置的1
×
1conv第一分支和1
×
1conv与softmax函数组合的第二分支,所述第一分支和第二分支矩阵相乘后输出到一个1
×
1conv。
51.部分受到跨阶段部分网络(cspnet)的启发,进一步在骨干上增加了若干局部3
×
3的卷积分支,每个分支平行于一个瓶颈模块序列(甚至加上一个simplified nl块),如图1所示。这使得主干能够实现更丰富的梯度组合。这些增加的3
×
3个卷积分支也类似于长跨越残差连接,因此,有助于解决梯度消失的问题,加快训练。
52.进一步参见图1,所述检测颈部包括与所述梯度网络中的三组simplified neck conv block,所述simplified neck conv block之间设置1
×
1conv+上采样upsample组合块,第一组合块的输出端与第一simplified neck conv block的输入端通道拼接,第一组合块的输入端与第二simplified neck conv block的输出端相连接;第二组合块的输出端与第二simplified neck conv block的输入端通道拼接,第二组合块的输入端与第三simplified neck conv block的输出端相连接。
53.本实施例中,仍然使用yolov3中使用的特征金字塔网络(fpn)的骨架结构进行检测颈部的多尺度特征融合。然而,检测颈部应该减轻,以匹配体量已经减小了的骨干网络。否则,骨干网络和检测颈部之间的体量不平衡会导致模型体量大、计算冗余,甚至容易出现过拟合。
54.为了压缩检测颈部的大小,将fpn中的每个3
×
3卷积替换为一个由3
×
3深度可分离卷积(depthsepconv)和一个挤压激励(se)块融合而成的简洁块(3
×
3depthsepconv+
se)。如图4所示,所述simplified neck conv block包括三个1
×
1conv和两组3
×
3depthsepconv+挤压-激励se融合块,所述3
×
3depthsepconv+se融合块设置在所述1
×
1conv之间。参见图5,所述3
×
3depthsepconv+se融合块中3
×
3depthsepconv与se块通道相乘。
55.进一步地,本实施例为了减少检测头部的尺寸,我们也将原始的yolov3检测头部中的一个3
×
3卷积替换为一个由3
×
3深度可分离卷积depthsepconv和一个挤压激励se块融合而成的简洁块。如图1所示,所述检测头部包括与simplified neck conv block一一对应连接的simplified head conv block,参见图6,所述simplified head conv block包括相连接的3
×
3depthsepconv+se融合块和1
×
1conv。
56.为了验证本技术实施例提供的基于yolo的轻量级目标检测网络的效果,本实施例使用ms-coco 2017目标检测数据集对模型进行训练和验证。训练集由118k幅图像组成,包含80类目标。验证集包含5k自然图像,用于评估模型。不使用预训练权重,模型是从头开始训练的。我们使用重量衰减为5e-4的adam优化器。我们使用等步学习率调整策略,gamma设置为0.94,初始调整步长设置为3,初始学习率设置为0.001。当学习率低于0.0001时,调整步长变为1。实验所使用的模型在32gb ram、intel(r)core(tm)cpu和两个geforce rtx 3090显卡的linux系统上训练,批大小设置为128,总epoch数设置为500。
57.将我们提出的轻量级目标检测器与基线yolov3、其他最先进的基于锚框的轻量级单阶段目标检测器进行比较。在ms-coco 2017验证集(coco val)上对所有检测器进行评估,性能统计结果见表1。所有基准方法的数值结果(除带“+”符号的之外)均取自已发表的论文或官方发布代码的网站。表中带“+”的结果是我们自己在coco val上测试官方发布的代码和模型权重得到的。注意,加粗字体表示我们的方法在相应的性能指标上优于相应的基准方法。
58.表1多种基于锚框的轻型单阶段目标检测器检测效果对比
[0059][0060]
如表1所示,和基线yolov3相比,虽然由map(0.5:0.95)、map(0.5)和maps所代表的检测精度下降了1.4~1.9倍,但我们的检测器将模型的参数量(params)和浮点运算数量(flops)减少了大约一个数量级甚至更多。与yolov3-tiny相比,我们的方法在所有性能指标上都超出很多。与yolov4-tiny相比,我们的方法有略大一些的params,但减少了超过一半的flops;我们的方法有略低的map(0.5:0.95)和map(0.5),但对于maps提高了12%。yolobile在params、map(0.5:0.95)和map(0.5)中更胜一筹,而我们的方法在flops和maps中更胜一筹。pp-yolo-tiny比我们的网络更紧凑,params和flops更少。在320的图像大小上,我们的方法在map(0.5)和maps上获胜,这表明我们的方法在小图像上的召回率和小目
标检测方面具有潜在的优势。yolov5n在params,flops,map(0.5:0.95)和map(0.5)中获胜。但对于小目标的检测,我们的方法仍然达到了较高的精度。与yolov5s相比,我们的方法模型尺寸明显变小,尽管检测精度也有所下降。这不足为奇,因为yolov5s的尺寸是所有基准轻量级模型中最大的,因此可以获得较高的检测精度。
[0061]
参见图7,对图像进行目标检测的可视化结果。第一行从左到右显示本技术中的基于yolo的轻量级目标检测网络、yolov5n和pp-yolo-tiny的结果。第二行从左至右分别为yolobile、yolov4-tiny和yolov3-tiny的结果。实验结果表明,本技术中基于yolo的轻量级目标检测网络具有较好的检测精度,特别是对小目标的检测。
[0062]
总而言之,本实施例提供的轻量级目标检测网络在params、flops和平均精度(map)的一个或多个方面优于基准方法。特别地,擅长于小目标检测。图8给出了一个图像上的检测结果,可以清楚地表明本实施例提供的轻量级目标检测网络在小目标检测上比其他方法有更好的精度。在小目标检测方面的优势主要是由于基于小波的输入增强和自注意力机制(通过simplified nl块)。进一步,用图8来解释自注意力在小目标检测中的帮助。图9中的图像包含一个小的飞鸟的目标。如果把飞鸟周围的小块区域放大,由于分辨率低,即使是人类也不容易识别出此目标。但如果观察离目标较远的区域,我们会发现天空、山脉、树木等。有了这些背景信息,就不难识别出这个小目标是一只飞鸟。类似地,我们的神经网络中引入的自注意力机制捕捉图像中的远距离像素关系,从而提供上下文信息,帮助识别小目标。
[0063]
本实施例还进行了消融实验,这项工作的主要贡献体现在一套算法组件:基于小波的输入增强(wl),基线mobilenet v2(mv2)为骨干,局部3
×
3卷积分支(local 3
×
3conv)添加到骨干,简化非局部块(simplified nl)添加到骨干,并将融合的深度可分离卷积和se块(dsconv+se)替换到检测颈和头部。
[0064]
表2不同算法分量组合对coco val的结果
[0065][0066]
如表2所示,基本的轻量化模型由mv2简化的骨干和dsconv+se简化的检测颈和头部组成,其结果列在第1行。然后加入wl,对应结果列在第2行。比较第1行和第2行,我们观察到在params没有改变的情况下,map(0.5:0.95)和maps都有增加,表明wl在提高目标检测精度特别是小目标检测精度方面具有较好的效果。进一步,在骨干网中添加了local 3
×
3conv和simplified nl,相应的结果列在第3行。对比第2行和第3行,我们观察到params略有增加,map(0.5:0.95)略有降低,但maps显著上升,说明local 3
×
3conv和simplified nl结合在一起对于提高小目标检测精度的有效性。最后,我们从完整的轻量级检测器中去掉dsconv+se,相应结果列在第4行。对比第3行和第4行,我们观察到params急剧增加,表明dsconv+se对于网络简化的有效性;我们还观察到检测精度略有下降,这可能是由于骨干网络和检测颈部和头部的模型大小不匹配。
[0067]
与上述实施例相对应,本技术实施例还提供了一种目标检测方法,本实施例中的
检测方法基于上述实施例所述的yolo的轻量级目标检测网络,包括:将原始图像增加高频信息后输入骨干网络,经过检测颈部和检测头部后对所述原始图像中的小目标进行检测。
[0068]
其中所述将原始图像增加高频信息后输入所述骨干网络,包括:对原始图像进行小波变换wt,对三个高频波段进行逆小波变换iwt,并将iwt的结果作为一个额外的通道与原始图像一起送入所述骨干网络。
[0069]
需要指出的是,本技术实施例涉及的基于yolo的轻量级目标检测网络具体内容可以参见上述实施例的描述,为了表述简洁,在此不再赘述。
[0070]
与上述实施例相对应,本技术实施例还提供了一种电子设备。
[0071]
参见图9,为本技术实施例提供的一种电子设备的结构示意图。如图8所示,该电子设备300可以包括:处理器301、存储器302及通信单元303。这些组件通过一条或多条总线进行通信,本领域技术人员可以理解,图中示出的电子设备结构并不构成对本技术实施例的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[0072]
其中,通信单元303,用于建立通信信道,从而使电子设备可以与其它设备进行通信。
[0073]
处理器301,为电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器302内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子设备的各种功能和/或处理数据。所述处理器可以由集成电路(integrated circuit,ic)组成,例如可以由单颗封装的ic所组成,也可以由连接多颗相同功能或不同功能的封装ic而组成。举例来说,处理器301可以仅包括中央处理器(central processing unit,cpu)。在本技术实施方式中,cpu可以是单运算核心,也可以包括多运算核心。
[0074]
存储器302,用于存储处理器301的执行指令,存储器302可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。
[0075]
当存储器302中的执行指令由处理器301执行时,使得电子设备300能够被调用上述实施例所述的基于yolo的轻量级目标检测网络对原始图像小目标进行检测。
[0076]
本技术实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示单独存在a、同时存在a和b、单独存在b的情况。其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项”及其类似表达,是指的这些项中的任意组合,包括单项或复数项的任意组合。例如,a,b和c中的至少一项可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中a,b,c可以是单个,也可以是多个。
[0077]
本领域普通技术人员可以意识到,本文中公开的实施例中描述的各单元及算法步骤,能够以电子硬件、计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0078]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、
装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0079]
在本技术所提供的几个实施例中,任一功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0080]
以上所述,仅为本技术的具体实施方式,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。本技术的保护范围应以所述权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1