基于验证图片的多目标数据训练集生成方法

文档序号：34026371发布日期：2023-05-05 09:16阅读：31来源：国知局

本申请属于神经网络训练，尤其涉及一种基于验证图片的多目标数据训练集生成方法。

背景技术：

1、近年来，随着机器学习、人工智能技术的广泛应用与发展，自动化图像识别也随之兴起，越来越多的行业运用图像识别技术代替传统的人工识别模式，包括人脸识别、物体识别、文字识别等，精准、可靠、高效的识别模型正被大众所认可，逐步取代人力成为大势所趋。神经网络模型能够通过学习图片的局部特征，能在图片内包含有多个目标时精确的定位其在图片中的位置，实现目标检测功能。在目标检测模型训练过程中数据集是研究与验证的基础，足量的数据集能够提升模型的识别能力，提取并分析更多的图像特征。然而现在公开的深度学习数据集类别较少，例如mnist、imagenet、open images、svhn、cifar-10等深度学习开放数据集，虽拥有数量足够多的训练图片，但所涵盖的类别仅为文字提取、物品检测等，通用性较强但泛化能力较差，且图片内大多只包含单一目标，无法训练出多目标的检测模型，对于目标检测模型的训练难以起到足够的数据支撑作用。因此，在众多其他领域内的研究人员仍需花费大量的时间制作相关数据集来满足模型训练的需求。人工标注数据标签不仅工作量巨大，且工作效率较为低下，一定程度上影响了人工智能在交叉领域内的发展。

技术实现思路

1、本申请的目的是提供一种基于验证图片的多目标数据训练集生成方法，以克服多目标检测模型训练集标注工作低效，数据无法大规模泛化的问题。

2、为了实现上述目的，本申请技术方案如下：

3、一种基于验证图片的多目标数据训练集生成方法，包括：

4、将未标注图片进行预处理，剔除掉图片中的背景噪声；

5、采用经过预训练的目标检测网络模型，对预处理后的未标注图片进行识别，按照识别结果分割出待检测目标区域，对于未标注图片的其余部分根据预设分割策略进行分割，得到分割后的未知分割图片；

6、获取登录用户的用户特征信息，计算得到用户的可信度，根据用户的可信度，选择对应的图片推送策略；

7、将根据图片推送策略推送的未知分割图片和已知分割图片进行拼接，生成向用户推送的验证图片；

8、在获得用户对验证图片中未知分割图片和已知分割图片的标注结果后，若用户对已知分割图片的标注结果可信，则认为用户对未知分割图片的标注结果可信，实现对未标注图片的标注，放入训练集。

9、进一步的，所述将未标注图片进行预处理，剔除掉图片中的背景噪声，包括：

10、将未标注的数据集图片进行灰度化后进行高斯滤波；

11、计算梯度值和方向；

12、根据梯度值和方向，对未标注的数据集图片进行非极大值抑制处理；

13、根据选取的双阈值，区分出强边缘点和弱边缘点；

14、通过滞后边界跟踪处理，得到准确边缘，然后进行图片裁剪，得到去除背景噪声后的图片。

15、进一步的，所述基于验证图片的多目标数据训练集生成方法，还包括：

16、对未标注图片中分割的每个未知分割图片的标注结果进行遍历，确定包括待检测目标的感兴趣区域；

17、对每一个感兴趣区域，将感兴趣区域内原先未知分割图片分割框分别向上下左右四个方向进行偏移，重新分割后再次推送给用户标注，若重新标注后的标注结果未发生跳变，则继续向相同方向偏移，否则向相反方向偏移，直到达到最大调整次数，得到调整后的分割框位置，形成对未标注图片的标注。

18、进一步的，所述基于验证图片的多目标数据训练集生成方法，还包括：

19、在对第一个感兴趣区域内未知分割图片分割框分别向上下左右四个方向进行偏移时，同样对其他感兴趣区域内未知分割图片分割框进行偏移，重新分割后再次推送给用户标注；

20、若其他感兴趣区域内未知分割图片的标注结果发生跳变，则记录之前未发生跳变的调整次数以及分割框位置；

21、在对其他感兴趣区域内未知分割图片分割框分别向上下左右四个方向进行偏移时，直接从记录的调整次数以及分割框位置开始进行偏移。

22、进一步的，所述基于验证图片的多目标数据训练集生成方法，还包括：

23、对未标注图片中分割的每个未知分割图片的标注结果进行遍历，若未发现相同标注结果的相邻未知分割图片，则按照预设比例缩小当前未知分割图片的分割框，再次分割未标注图片后将未知分割图片推送给用户标注；

24、直到出现相同标注结果的相邻未知分割图片时，记录上一次分割框位置作为最终未标注图片的标注结果。

25、进一步的，在对未标注图片中分割的每个未知分割图片的标注结果进行遍历，确定包括待检测目标的感兴趣区域之后，还包括：

26、若确定的感兴趣区域相邻，则将感兴趣区域重新划分为更小的未知分割图片，重新推送给用户标注，直到确定的感兴趣区域得到分离。

27、本申请提出的一种基于验证图片的多目标数据训练集生成方法，在生成验证图片过程中将信息全部已知的图片(模型已正确识别的图片)与包含未知信息的图片(模型未正确识别的图片)相结合，要求用户利用验证图片利用前者对用户的打标签的可信度度进行衡量，并实现对后者的标签化。利用庞大的系统登录行为，以众包方式大规模生成标签化图片数据，达到自动化生成训练集的效果。

技术特征：

1.一种基于验证图片的多目标数据训练集生成方法，其特征在于，所述基于验证图片的多目标数据训练集生成方法，包括：

2.根据权利要求1所述的基于验证图片的多目标数据训练集生成方法，其特征在于，所述将未标注图片进行预处理，剔除掉图片中的背景噪声，包括：

3.根据权利要求1所述的基于验证图片的多目标数据训练集生成方法，其特征在于，所述基于验证图片的多目标数据训练集生成方法，还包括：

4.根据权利要求3所述的基于验证图片的多目标数据训练集生成方法，其特征在于，所述基于验证图片的多目标数据训练集生成方法，还包括：

5.根据权利要求1所述的基于验证图片的多目标数据训练集生成方法，其特征在于，所述基于验证图片的多目标数据训练集生成方法，还包括：

6.根据权利要求3所述的基于验证图片的多目标数据训练集生成方法，其特征在于，在对未标注图片中分割的每个未知分割图片的标注结果进行遍历，确定包括待检测目标的感兴趣区域之后，还包括：

技术总结
本发明公开了基于验证图片的多目标数据训练集生成方法，采用经过预训练的目标检测网络模型，对预处理后的未标注图片进行识别，按照识别结果分割出待检测目标区域，对于未标注图片的其余部分根据预设分割策略进行分割，得到分割后的未知分割图片；将根据图片推送策略推送的未知分割图片和已知分割图片进行拼接，生成向用户推送的验证图片；最后在获得用户对验证图片中未知分割图片和已知分割图片的标注结果后，实现对未标注图片的标注，放入训练集。本发明可以解决训练集人工制作过程中的低效、工作量大的困难，能为模型训练更快速的提供相应的训练集，为人工智能、机器学习领域的进一步发展提供了帮助。

技术研发人员：邱杰凡,贾逸哲,丰泽辉,张坤,张锦鸿
受保护的技术使用者：浙江工业大学
技术研发日：
技术公布日：2024/1/12

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：邱杰凡贾逸哲丰泽辉张坤张锦鸿
技术所有人：浙江工业大学
我是此专利的发明人

上一篇：一种喷播绿化用机械臂的制作方法
上一篇：显示屏亮度的补偿方法、装置、电子设备及存储介质与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。