本发明公开一种深度学习训练样本优化方法,涉及数据处理领域。
背景技术:
在诸如自动驾驶等应用场景中,为实现物体检测精准性,深度学习模型对大量且具有高质量的输入数据集进行学习训练,这个数据集一般足够大、具有代表性以及拥有相对清楚的标签。而深度学习具有较强的学习能力或拟合能力,网络模型越复杂,其能力越强,也就需要更多的训练数据,否则容易产生过拟合。
目前高质量的训练数据集一般由人工输出,截取大量的摄像头数据,对包含的元素进行人工标注。在标注过程中,很难保证所有标注出的图像边线紧贴目标物体,被标注物超出边框或离边框距离太远都将增大深度学习模型训练时精确度和复杂度的难度。并且有时元素经常出现交叠情况,标注时只能将前景图像算入被遮挡物体,致使标注数据质量大受影响。
而本发明公开了一种深度学习训练样本优化方法,通过边缘检测处理,对原始标注图像进行压缩剪裁,消除标注过程中人为标注导致的样本元素边界的误差,提升标注图像质量,提高训练样本生成效率,进而缩短深度学习模型训练有效用时,通过对原始标注图像交叠部分进行分割补全处理,消除遮挡对样本元素影响,提高训练样本品质,提升训练效率,加速深度学习模型的优化、部署与应用。
技术实现要素:
本发明针对现有技术的问题,提供一种深度学习训练样本优化方法,具有通用性强、实施简便等特点,具有广阔的应用前景。
本发明提出的具体方案是:
一种深度学习训练样本优化方法:
获取训练样本原图像及原始样本标注信息,根据原始样本标注信息,得到训练样本的子图像信息,其中子图像信息包括单一的子图像信息和交叠的子图像信息;
对单一的子图像信息和交叠的子图像信息分别进行预处理,
对预处理后的单一的子图像信息和交叠的子图像信息分别进行边缘检测,得到单一的子图像轮廓信息和交叠的子图像轮廓信息,
根据单一的子图像轮廓信息对单一的子图像信息进行压缩剪裁处理,得到压缩剪裁优化的子图像标注信息,
根据交叠的子图像轮廓信息对交叠的子图像信息中交叠的图像分别进行分割补全处理,得到优化的子图像标注信息。
所述的方法中若为多个样本图像交叠的子图像信息,则根据交叠的子图像轮廓信息划分出与交叠的样本图像数量相等的各个图像,进行分割补全处理,得到优化的子图像标注信息。
所述的方法中对各个图像进行分割补全处理时,将各个图像中交叠的部分分成两部分,分别求出各部分像素平均值,保留本部分图像,使用另一部分的像素平均值作为背景色补全交叠图像,并根据交叠子图像标注信息的相对位置信息,补全子图像,得到优化后的样本标注信息。
所述的方法中根据单一的子图像轮廓信息对单一的子图像信息进行压缩剪裁处理,保留图像上下左右四个方向距离轮廓极值一定像素值范围内的原图像像素数据,丢弃剩余像素数据,得到压缩剪裁优化的子图像标注信息。
所述的方法中对预处理后的单一的子图像信息和交叠的子图像信息分别进行边缘检测,边缘检测判定为图像轮廓时选取边缘连续处,且坐标位于水平、竖直、左上右下、左下右上方向极值为边缘,得到单一的子图像轮廓信息和交叠的子图像轮廓信息。
所述的方法中对单一的子图像信息和交叠的子图像信息分别进行平滑滤波预处理,消除局部噪声。
本发明的有益之处是:
本发明公开了一种深度学习训练样本优化方法,对子图像信息进行预处理,通过边缘检测处理,对子图像信息进行压缩剪裁,消除标注过程中人为标注导致的样本元素边界的误差,提升标注图像质量,提高训练样本生成效率,进而缩短深度学习模型训练有效用时,并且通过对子图像信息交叠部分进行分割补全处理,消除遮挡对样本元素影响,提高训练样本品质,提升训练效率,加速深度学习模型的优化、部署与应用。
附图说明
图1是本发明方法流程示意图;
图2是带有原始样本标注信息的训练样本原图像;
图3是从单一的子图像信息获得优化的子图像标注信息的图片展示;
图4是从交叠的子图像信息获得优化的子图像标注信息的图片展示。
具体实施方式
本发明提供一种深度学习训练样本优化方法:
获取训练样本原图像及原始样本标注信息,根据原始样本标注信息,得到训练样本的子图像信息,其中子图像信息包括单一的子图像信息和交叠的子图像信息;
对单一的子图像信息和交叠的子图像信息分别进行预处理,
对预处理后的单一的子图像信息和交叠的子图像信息分别进行边缘检测,得到单一的子图像轮廓信息和交叠的子图像轮廓信息,
根据单一的子图像轮廓信息对单一的子图像信息进行压缩剪裁处理,得到压缩剪裁优化的子图像标注信息,
根据交叠的子图像轮廓信息对交叠的子图像信息中交叠的图像分别进行分割补全处理,得到优化的子图像标注信息。
结合附图和具体实施,对本发明做进一步说明。
利用本发明方法,具体步骤为:
获取用于深度学习的训练样本原图像及原始样本标注信息,根据标注信息,得到包含待学习训练元素的子图像信息;其中子图像信息包括单一的子图像信息和交叠的子图像信息;交叠的子图像信息即子图像存在交叠,得到的交叠部分的图像信息;
对包含待学习训练元素的单一的子图像,参考图3中汽车图像就为单一汽车图像,进行平滑滤波预处理,消除局部噪声;同时对交叠的子图像信息进行平滑滤波预处理,消除局部噪声,参考图4即为交叠的子图像,交叠的汽车图像;
使用边缘检测算子对经过了平滑滤波的包含待学习训练元素的单一子图像和交叠子图像分别进行边缘检测,边缘检测判定为图像轮廓时选取边缘连续处,且坐标位于水平、竖直、左上右下、左下右上方向极值为边缘,得到单一的子图像轮廓信息和交叠的子图像轮廓信息;
根据单一子图像轮廓信息对单一的子图像进行压缩剪裁处理,保留图像上下左右四个方向距离轮廓极值3个像素值范围内的原图像像素数据,丢弃剩余像素数据,得到压缩剪裁优化的子图像标注信息;
根据交叠子图像轮廓信息对交叠部分的图像进行分割补全处理,参考图4,是2个样本图像交叠的子图像信息,则根据交叠的子图像轮廓信息划分出2个图像,进行分割补全处理:将2个图像中交叠的部分都分成两部分,此两部分分别求出各部分像素平均值,得到两组内容为交叠元素彼此分离的图像像素数据,根据交叠子图像原始样本标注信息的相对位置信息,补全子图像,则在图中右侧车保留车前窗和车头图像,使用另一部分的像素平均值作为背景色补全交叠图像,即补充到左侧车的车窗位置,得到优化后的右侧车的样本标注信息;同理,在图中左侧车保留右车窗图像,使用另一部分的像素平均值作为背景色补全交叠图像,即补充到右侧车的车前窗和车头位置,得到优化后的左侧车的样本标注信息;
则根据整幅训练样本原图像,图2获得了优化的样本标注信息。