针对目标检测的少样本数据扩增方法与流程

文档序号：24410434发布日期：2021-03-26 19:08阅读：842来源：国知局

1.本发明涉及目标检测技术领域，尤其涉及针对目标检测的少样本数据扩增方法。

背景技术：

2.数据扩增也叫数据增强，意思是在不实质性的增加数据的情况下，让有限的数据产生等价于更多数据的价值，是目标检测领域内常用的数据处理方法。数据扩增对提高模型精度、提高模型泛化能力具有非常重要的作用。一般来说数据增强可以分为，有监督的数据增强和无监督的数据增强方法。
3.一、有监督数据增强，即采用预设的数据变换规则，在已有数据的基础上进行数据的扩增，包括几何操作类，颜色变换类。
4.（1）几何变换类即对图像进行几何变换，包括翻转，旋转，裁剪，变形，缩放等各类操作，下面展示其中的若干个操作。水平翻转和垂直翻转、随机旋转随机裁剪变形缩放翻转操作和旋转操作，对于那些对方向不敏感的任务，比如图像分类，都是很常见的操作，在caffe等框架中翻转对应的就是mirror操作。翻转和旋转不改变图像的大小，而裁剪会改变图像的大小。
5.(2) 颜色变换类上面的几何变换类操作，没有改变图像本身的内容，它可能是选择了图像的一部分或者对像素进行了重分布。如果要改变图像本身的内容，就属于颜色变换类的数据增强了，常见的包括噪声、模糊、颜色变换、擦除、填充等等。
6.二、无监督的数据增强方法包括两类：(1) 通过模型学习数据的分布，随机生成与训练数据集分布一致的图片，代表方法有gan。
7.(2) 通过模型，学习出适合当前任务的数据增强方法，代表方法有auto augment。
8.在目前的深度学习领域，有监督的数据扩增应用较广，如旋转、裁剪、变形、缩放、增加噪声、模糊、颜色变换，但是这些数据扩增技巧并不能改变目标样本的前景和背景的相对结构，同时也改变不了不同目标样本数量间的关系。而单纯增加少样本目标的数据样本，如复制等方法又不能改变目标样本数据的多样性，同时还增加了大量无效样本，白白增加了大量的学习时间。
9.而利用gan网络等的无监督的数据增强方法可以极大的增加少样本的数据，提高样本的丰富性，但是缺点也非常明显：需要训练一对生成对抗网络或者其他的学习模型，而生成对抗网络或其他的学习模型本身需要大量样本的训练，这直接增加了算法的难度，使得算法难以实现。

技术实现要素：

10.本发明为了解决上述问题，提供一种针对目标检测的少样本数据扩增方法，包括以下步骤：s1，定性分析目标样本可能出现的场景以及场景的风格；
s2，提取目标样本的场景特征、风格特征；s3，利用机器学习算法对场景特征和风格特征进行聚类分析；s4，根据聚类分析结果从开源数据集中搜索具有相似场景或风格的图片；s5，将目标样本与从开源数据集中找出的相似图片进行融合，制作出假样本。
11.进一步的，针对目标检测的少样本数据扩增方法它还包括s6，利用高斯滤波对假样本进行滤波，一定程度上消除图片融合过程中出现的边缘特征。
12.进一步的，所述s2中，利用场景检测算法和风格提取算法提取目标样本的场景特征、风格特征。
13.优选地，所述s3中，利用kmeans算法对场景特征和风格特征进行聚类分析。
14.优选地，所述的开源数据集包括imagenet和/或coco数据集。
15.其中，所述s5中，采用mixup或替换相应区域的方式将目标样本与找出的相似图片进行融合。
16.与现有技术相比，本发明具有以下有益效果：现有的颜色变换或者几何变换等数据增强方法，只是单纯改变目标样本的空间信息以及颜色信息。本发明方法可以改变目标样本的场景（背景），能生成更多的风格相似的假样本，以弥补部分样本在样本数量上的不均衡问题，同时还能规避基于gan网络需要训练等问题。本发明不仅提高了数据扩增的效率，同时也提高了就样本的数据质量。
附图说明
17.此处所说明的附图用来提供对本发明实施例的进一步理解，构成本申请的一部分，并不构成对本发明实施例的限定。
18.图1是本发明的流程图。
具体实施方式
19.为使本发明的目的、技术方案和优点更加清楚明白，下面结合实施例和附图，对本发明作进一步的详细说明，本发明的示意性实施方式及其说明仅用于解释本发明，并不作为对本发明的限定。
20.如图1所示，本发明公开的针对目标检测的少样本数据扩增方法，包括以下步骤：s1，定性分析目标样本可能出现的场景以及场景的风格；s2，利用场景检测算法和风格提取算法提取目标样本的场景特征、风格特征；s3，利用机器学习算法对场景特征和风格特征进行聚类分析；s4，根据聚类分析结果从开源数据集中搜索具有相似场景或风格的图片；s5，将目标样本与从开源数据集中找出的相似图片进行融合，制作出假样本。
21.基于上述方法，本发明提供一实施例。本实施例主要分为以下六步：第一步，定性分析目标样本可能出现的场景以及风格，尽可能的包含目标样本可能出现的场景，并补充可能出现的场景图片；第二步，利用场景分类算法或者风格提取算法（如改造分割迁移算法）提取目标可能出现的场景特征和风格体征，形成一个高维的特征向量；第三步，利用kmeans等算法对高维的场景或者风格特征进行聚类，并根据定性分
析的场景或风格的类别数量确定聚类中心点的数目；第四步，根据聚类的中心点的数目确定场景或风格的类别数目，并在imagenet和coco数据集中利用场景分类算法和风格提取算法搜索具有相似场景风格的图片，在搜索的过程中尽量确保每一类场景或者风格具有相同的数量；第五步，裁剪原图像中的目标，然后利用scale系数调整目标尺寸，并利用mixup或者替换的方式将调整过后的目标与找出的图片进行融合，制造出假样本；第六步，利用高斯滤波对假样本进行滤波，一定程度上消除图片融合过程中出现的边缘特征。
22.本发明利用场景分类算法和风格提取算法分析样本目标的场景特征和风格特征，然后从第三方数据集中的数据寻找具有相似场景的图片并和目标样本进行融合，产生一定数量的假样本用于目标检测算法的训练，平衡了不同目标样本的数量，同时避免了训练gan网络生成假数据，降低了数据获取的难度。
23.以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李学生;李晨;牟春
技术所有人：德鲁动力科技（成都）有限公司
我是此专利的发明人

上一篇：一种液压密封综合实验台及实验方法与流程
上一篇：一种具有负热膨胀特性的保险装置及其设计方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。