一种基于单阶深度神经网络的动物目标检测方法

文档序号：26644759发布日期：2021-09-15 01:58阅读：126来源：国知局

1.本发明涉及一种基于单阶深度神经网络的动物目标检测方法。

背景技术：

2.随着图像处理技术的快速发展、计算机硬件成本的不断下降以及计算机运算速度的不断提升，计算机视觉技术己经成为现代畜牧养殖业的一个重要应用技术。近几年，越来越多的智能化畜牧管理方案被提出，来帮助政府实现科学管理，帮助牧民实现更好的放牧管理。“智慧牧场”的应用研究己经成为关注重点，牧场管理逐渐向信息化、智慧化的方向发展。牧场的管理人员通过智慧牧场管理平台可以提高牧场的信息化水平。应用智慧牧场管理系统可以真正实现牧场管理过程的公开化，透明化以及规范化，降低人工劳动成本，增加管理效率。
3.畜牧养殖的产业链条相当长，一只动物从出生到出栏需要半年多的时间，而在这段养殖时间里，往往会遇到各种各样的问题，有些甚至会威胁死亡。以疾病为例，如果动物生病，而动物数量过多，很难及时找到哪些动物生病的现象；动物群的放牧的过程中，由于放牧管理不当造成动物只发生死亡或丢失的情况难免发生，这就需要牧民每天在放牧或归牧前对动物群数量进行统计，由于动物群数量较多，导致传统的人工计数方法工作量大，耗时长，且容易存在计数失误的情况。针对这些问题，传统养殖投入人力比较大，以及投入人力也有可能效率不高，因此智慧牧场的出现具有重要意义，可以减少人工劳动成本，增加管理效率，实时监控管理。而动物的目标检测则是智能化养殖的重要前期工作，动物防控疫情、动物体尺测量、动物数量的统计、动物运动跟踪、动物行为分析等都离不开动物目标检测[9]。同时很多动物的几何特征都比较相似，比如猪、狗、动物、驴、马、牛等动物相似，研究结果很容易推广到相关养殖业上。
[0004]
目标检测是指在视频或者图像中把感兴趣的(多个)目标与背景分离开来，需要判断是否存在目标，并确定目标的位置和范围。目标检测的任务是将这些目标识别出来，确定其类别、位置和边框范围。目标检测是机器视觉领域的重要研究方向，传统的目标检测方法取得了一定的积极进展，但在现实场景中，由于目标和目标所处场景的复杂性和多样性变化，传统的目标检测方法并不能满足实际应用的需求。当下，基于图像的各种机器视觉技术在各个领域都有了十足的发展和应用，因此基于计算机视觉的动物目标检测具有重要的研究意义。

技术实现要素：

[0005]
本发明的目的是为了解决现有的动物养殖过程中，采用的人工计数方法，工作量大，耗时长，且易计数失误的问题，而提出一种基于单阶深度神经网络的动物目标检测方法。
[0006]
一种基于单阶深度神经网络的动物目标检测方法，所述方法通过以下步骤实现：
[0007]
步骤一、动物数据样本采集；
[0008]
动物数据样本的来源主要途径包括网上图片搜寻、视频的裁剪，以及项目提供；
[0009]
步骤二、动物数据样本标注；
[0010]
动物数据样本标注利用labelimg标注工具进行人工标记，标记目标在原始图像中的位置并注明所属类别，并为每个图像生成一个相应的xml文件；
[0011]
步骤三、制作voc数据集；
[0012]
将标注后的数据处理成检测模型能够使用的voc数据集的格式，以在之后的模型训练过程中使用；
[0013]
步骤四、动物样本数据集的训练；
[0014]
采用yolo系列或ssdo算法训练动物的数据集；
[0015]
yolov4的网络结构由cspdarknet53作为骨干网络，spp作为neck的附加模块，panet作为neck的特征融合模块，yolov3作为head；
[0016]
其中，darknet53包含了5个残差块，这5个残差块包含的残差单元个数分别为1、2、8、8、4；cspdarknet53在darknet53的每个大残差块上加上了cspnet，通过梯度的变化集成到特征图中，将特征图分为两部分，一部分进行卷积操作，另一部分与上一次的卷积结果进行结合，在目标检测过程中，csp提升cnn的学习能力，同时减少计算量；panet利用特征融合，yolov4中将融合的方法由加法改为乘法；
[0017]
步骤五、构建检测模型；
[0018]
将定位和分类2个过程合二为一，建立一套模型实现在一个阶段里寻找物体出现的位置与预测动物类别；
[0019]
步骤六、调整模型性能以及性能评估；所述的模型性能包括平均准确率、对象类别分割问题的标准性能度量、非极大值抑制、画面每秒传输帧数；
[0020]
步骤七、利用调整好的模型在图片中检测动物个体目标。
[0021]
优选地，所述的方法还包括实时进行动物个体目标的检测的步骤。
[0022]
优选地，所述的步骤一的动物数据样本采集的过程中，还包括通过数据增强的方式来将数据样本增加3或4倍的步骤。
[0023]
优选地，步骤六所述的调整模型性能以及性能评估的具体内容包括：
[0024]
(1)调整平均准确率，average precision，简称为ap；
[0025]
true positive是指被正确识别出的目标；false positive是指假阳性，图片背景被识别成目标；precision是指准确率，所有的识别返回结果中真实目标所占的比例；recall是指召回率，被识别出的目标在该类目标中所占的比例；用pr曲线所围成的面积来计算衡量模型的好坏，ap值所覆盖的区域面积越大则模型算法越好，ap衡量的是经过训练得到的模型在每个类别上的好坏，map值为学出来的模型在所有类别上的好坏；基于选择不同的阈值，绘制一条precision
‑
recall曲线，求取这条曲线下方的面积，得到ap；
[0026]
(2)调整对象类别分割问题的标准性能度量，简称iou分数；
[0027]
iou分数是对象类别分割问题的标准性能度量，给定一组图像，iou测量给出了在该组图像中存在的对象的预测区域和地面实况区域之间的相似性，对于具体的某个物体来讲，从预测框与真实框的贴合程度来判断检测的质量，通常使用iou来量化贴合程度，使用两个边框的交集与并集的比值，得到iou；iou越高，则两个框的重叠度越大，检测结果越好；a和b两个框之间贴合程度iou分数的计算公式如下：
[0028][0029]
(3)调整非极大值抑制，简称为nms；
[0030]
非极大值抑制是抑制不是极大值的元素，为局部最大搜索；这个局部代表的是一个邻域，邻域有两个参数可变，一是邻域的维数，二是邻域的大小；
[0031]
(4)调整画面每秒传输帧数，简称为fps；
[0032]
fps是图像领域中的定义，是指画面每秒传输帧数，也称为动画或视频的画面数；fps是测量用于保存、显示动态视频的信息数量；每秒钟帧数越多，所显示的动作就会越流畅。
[0033]
本发明的有益效果为：
[0034]
本发明对于动物目标检测算法的研究，对现有的目标检测方法进行改进，得到针对动物检测更为有效的方法。通过对动物个体特征的分析，给出了一种用于动物个体检测的改进深度神经网络模型，能克服环境影响，提高动物个体检测的准确率，将图片中的动物准确的检测出来。在改进目标检测算法的应用中，提高动物只计数的准确度。
[0035]
本发明提出的改进的动物目标检测算法，在保证检测速度的同时，能够将因牧场中环境影响、动物遮挡而导致的识别精度不高的问题有效地解决，使得动物个体能够准确的检测。也可以为智慧牧场后续的更多项目打下基础，所以，牧民每天在放牧或归牧前都需要对动物只数量进行统计，将改进的目标检测算法用于动物群计数的问题，并体现计数准确的优点。
附图说明
[0036]
图1为本发明方法的流程图；
[0037]
图2为本发明实施例1涉及的数据样本图片。
具体实施方式
[0038]
具体实施方式一：
[0039]
本实施方式的一种基于单阶深度神经网络的动物目标检测方法，如图1所示，所述方法通过以下步骤实现：
[0040]
步骤一、动物数据样本采集；
[0041]
数据样本的大小影响着模型训练的效果，数据样本越大目标检测的模型训练效果会越好，动物数据样本的来源主要途径包括网上图片搜寻、视频的裁剪，以及项目提供；
[0042]
步骤二、动物数据样本标注；
[0043]
动物数据样本的标注是可执行文件生成的重要前提，动物数据样本标注的越准确，模型的准确度也会大大提高，动物数据样本标注利用labelimg标注工具进行人工标记，标记目标在原始图像中的位置并注明所属类别，并为每个图像生成一个相应的xml文件；
[0044]
步骤三、制作voc数据集；
[0045]
在训练模型的过程中，只采集数据和对数据进行标注是不够的，需要将标注后的数据处理成检测模型能够使用的voc数据集的格式，以在之后的模型训练过程中使用；
[0046]
步骤四、动物样本数据集的训练；
[0047]
训练的数据集数量太大，使用普通笔记本电脑的cpu没有办法达到预期的效果，所以需要搭建一个服务器，在台式电脑上安装显卡，用gpu来训练数据集；采用yolo系列或ssdo算法训练动物的数据集；
[0048]
yolov4的网络结构由cspdarknet53作为骨干网络，spp作为neck的附加模块，panet作为neck的特征融合模块，yolov3作为head；
[0049]
其中，darknet53包含了5个残差块，这5个残差块包含的残差单元个数分别为1、2、8、8、4；cspdarknet53在darknet53的每个大残差块上加上了cspnet，通过梯度的变化集成到特征图中，将特征图分为两部分，一部分进行卷积操作，另一部分与上一次的卷积结果进行结合，在目标检测过程中，csp提升cnn的学习能力，同时减少计算量；panet利用特征融合，yolov4中将融合的方法由加法改为乘法，使该网络能够得到更加精确的目标检测能力；
[0050]
步骤五、构建检测模型；
[0051]
在目标检测的任务中，需要做的任务主要包括物体的定位和物体的分类，定位也就是常常看见的边缘框，分类是将物体判断出来。在发明中需要做的任务为检测动物个体位置，并且能够成功的对动物个体进行分类。由于本发明研究的是单阶深度神经网络，单阶的算法是将定位和分类2个过程合二为一，建立一套模型实现在一个阶段里寻找物体出现的位置与预测动物类别；
[0052]
主要是在对比多种单阶深度神经网络运用在动物数据集上的效果后，分析问题，再基于较好的目标检测算法的基础上，针对动物个体的特征，对算法进行改进，在结构上精简网络，在方法上引入一些调优方法，实现算法的精度速度最优平衡。
[0053]
步骤六、调整模型性能以及性能评估；所述的模型性能包括平均准确率、对象类别分割问题的标准性能度量、非极大值抑制、画面每秒传输帧数；
[0054]
步骤七、利用调整好的模型在图片中检测动物个体目标。
[0055]
具体实施方式二：
[0056]
与具体实施方式一不同的是，本实施方式的一种基于单阶深度神经网络的动物目标检测方法，所述的方法还包括实时进行动物个体目标的检测的步骤。
[0057]
具体实施方式三：
[0058]
与具体实施方式一或二不同的是，本实施方式的一种基于单阶深度神经网络的动物目标检测方法，所述的步骤一的动物数据样本采集的过程中，还包括通过数据增强的方式来将数据样本增加3或4倍的步骤，进而增加数据集的数量。
[0059]
具体实施方式四：
[0060]
与具体实施方式三不同的是，本实施方式的一种基于单阶深度神经网络的动物目标检测方法，步骤六所述的调整模型性能以及性能评估的具体内容包括：
[0061]
(1)调整平均准确率，average precision，简称为ap；
[0062]
true positive是指被正确识别出的目标；false positive是指假阳性，图片背景被识别成目标；precision是指准确率，所有的识别返回结果中真实目标所占的比例；recall是指召回率，被识别出的目标在该类目标中所占的比例；用pr曲线所围成的面积来计算衡量模型的好坏，ap值所覆盖的区域面积越大则模型算法越好，ap衡量的是经过训练得到的模型在每个类别上的好坏，map值为学出来的模型在所有类别上的好坏；基于选择不同的阈值，绘制一条precision
‑
recall曲线，求取这条曲线下方的面积，得到ap；
[0063]
(2)调整对象类别分割问题的标准性能度量，intersection over union，简称iou分数；
[0064]
iou分数是对象类别分割问题的标准性能度量，给定一组图像，iou测量给出了在该组图像中存在的对象的预测区域和地面实况区域之间的相似性，对于具体的某个物体来讲，可以从预测框与真实框的贴合程度来判断检测的质量，通常使用iou来量化贴合程度，使用两个边框的交集与并集的比值，得到iou；iou越高，则两个框的重叠度越大，检测结果越好；a和b两个框之间贴合程度iou分数的计算公式如下：
[0065][0066]
(3)调整非极大值抑制，non maximum suppression，简称为nms；
[0067]
非极大值抑制(non
‑
maximum suppression，nms)，顾名思义就是抑制不是极大值的元素，可以理解为局部最大搜索；这个局部代表的是一个邻域，邻域有两个参数可变，一是邻域的维数，二是邻域的大小；
[0068]
(4)调整画面每秒传输帧数，frame pre second，简称为fps；
[0069]
fps是图像领域中的定义，是指画面每秒传输帧数，也称为动画或视频的画面数；fps是测量用于保存、显示动态视频的信息数量；每秒钟帧数越多，所显示的动作就会越流畅。
[0070]
实施例1：
[0071]
1、数据集的制作
[0072]
数据集是模型训练过程中不可或缺的一部分。数据样本的好坏直接影响模型的结果。在课题中所使用的动物数据集，主要选择了羊的数据。下面主要为创建数据集的方法以及过程。
[0073]
(1)数据样本采集
[0074]
数据样本的大小影响着模型训练的效果，数据样本越大目标检测的模型训练效果会越好，数据集的来源主要途径包括网上图片搜寻、视频的裁剪，以及项目提供。数据样本图片如图2所示；
[0075]
(2)数据样本标注
[0076]
数据样本的标注是可执行文件生成的重要前提，数据样本标注的越准确，模型的准确度也会大大提高，数据样本标注利用labelimg标注工具进行人工标记，标记目标在原始图像中的位置并注明所属类别，并为每个图像生成一个相应的xml文件。
[0077]
(3)制作voc数据集
[0078]
在训练模型的过程中，只采集数据和对数据进行标注是不够的，需要将数据标注后的数据处理成模型能够使用的形式，在课题中使用voc数据集的格式，以便在之后的模型训练中能够使用。
[0079]
2、利用构建并进行性能调优后的模型进行羊只的检测，本发明能够将图片中的羊准确的检测出来。在改进目标检测算法的应用中，提高羊只计数的准确度和速度。
[0080]
以上仅为本发明的优选实施方式而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：房国志;张智铃
技术所有人：哈尔滨理工大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。