一种类别平衡的人体关键点训练集验证集划分方法

文档序号:37076824发布日期:2024-02-20 21:31阅读:18来源:国知局
一种类别平衡的人体关键点训练集验证集划分方法

本发明适用于计算机视觉的人体姿态估计领域,尤其涉及一种类别平衡的人体关键点训练集验证集划分方法。


背景技术:

1、人体关键点数据集是指包含人体主要关键点信息的数据集合。这些关键点通常包括头部、肩部、肘部、膝部、踝部等人体的主要关节和特征点,关键点检测提供的人体的各个关键点类别及空间位置信息,使得广泛应用于行为分析、交互设计、增强现实、体育科学等领域的姿态估计能够根据这些点构建出完整的人体姿势。人体关键点数据集为训练和开发人体姿态估计模型提供了必要的数据基础。这些数据集通常包含大量带有人体关键点标注的图像或视频,使得机器学习模型能够学习识别和定位人体各部位。数据集允许研究人员和开发者评估和比较不同人体姿态估计方法的效果。通过在标准数据集上评估模型,可以客观地了解模型的准确性、鲁棒性和泛化能力。

2、人体关键点数据集,通常要被划分为训练集和验证集。训练集是用于构建和训练模型的数据集,训练集包含大量带有标注的图像,这些图像展示了不同的人体姿势和关键点位置,通过训练集,模型学习识别不同的人体关键点和姿势。一个多样化和全面的训练集有助于模型学习如何处理多种不同的情况,从而提高其泛化能力各自承担着重要的角色,对于开发和评估人体姿态估计模型尤为关键。验证集由未参与训练的数据组成,提供了对模型性能的独立评估;通过比较模型在训练集和验证集上的表现,可以检测模型是否出现过拟合。如果模型在训练集上表现良好但在验证集上表现不佳,则可能存在过拟合问题;同时,通过在验证集上测试不同的参数设置,验证集帮助确定最佳的模型参数和配置。

3、在现有的数据集中,训练集和验证集的划分方法可以依据不同的标准和策略进行。主要包括以下五类方法:(1)随机划分法:最简单的方法是随机选择一定比例的数据作为训练集,其余作为验证集。例如,常见的比例是80%的数据用于训练,20%用于验证,这种方法简单易行,但会导致数据分布在训练集和验证集之间不均衡;(2)分层抽样法:在分层抽样中,数据首先根据关键标签(如不同类型的人体姿势)分层,然后从每层中按比例随机选择数据,这种方法对于多种类别同时存在于单张照片的情况,会加剧训练集和验证集在关键特征上的分布不均衡;(3)时间序列划分法:对于连续拍摄的运动视频,可以使用前70%的数据作为训练集,后30%作为验证集,但这种方法仅适用于数据具有明显时间依赖性的情况;(4)交叉验证法:在交叉验证中,数据集被分成几个小组,每一次,一个小组被用作验证集,其余用作训练集,尽管这种方法更全面地利用了数据,但适合于数据量较小的数据集;(5)留一法:每次模型训练时,留下一个样本作为验证集,其余所有样本作为训练集,这种方法仅在数据量非常有限时有用。


技术实现思路

1、训练集和验证集在人体关键点检测模型的开发和优化过程中起着至关重要的作用。训练集用于模型的学习和特征提取,验证集用于模型的评估、优化和防止过拟合。所谓类别平衡是指在训练集和验证集中,保持各个类别出现次数的比例相同。这种做法确保了数据集中的每个类别都得到了均衡的表示,从而避免了模型在学习过程中对某些类别过度适应而忽视其他类别。这对于提高模型的泛化能力至关重要,尤其是在复杂或多变的应用环境中,能够确保模型对各种不同情况都有良好的响应和识别能力。本发明提供了一种类别平衡的人体关键点训练集验证集划分方法,该方法针对统计排序后的数据集照片,对于那些每类关键点只出现一次的照片,使用设定的平衡系数随机分配至训练集和验证集;将未分配的照片放入训练集或验证集后,计算关键点出现频率的平均比值;设计就近划分原则,将照片分配到训练集或验证集;按照未分配照片既定排序和就近划分原则,确保所有照片被分配到训练集或验证集中。类别总数降序、相同类别总数下关键点出现次数升序的顺序,继续对照片进行就近划分。通过这种详细的分配方法,可以确保人体关键点数据集在训练集和验证集中的类别平衡,这对于提高人体姿态估计模型的泛化能力和准确性至关重要。本专利的技术方案:

2、本发明提供了一种类别平衡的人体关键点训练集验证集划分方法,包括以下步骤:

3、s1、对数据集中每张照片出现的关键点类别数进行统计,包括该张照片所有类关键点出现的总次数;

4、s2、根据每张照片中的关键点类别总数进行降序排列,对于关键点总数相同的照片,根据所有类别关键点出现的总次数进行升序排列;

5、s3、对于那些每类关键点只出现一次的照片,使用平衡系数随机分配到训练集和验证集;s4、在随机分配后,统计训练集和验证集中每类关键点的出现总数;

6、s5、根据未分配的照片放入训练集或验证集后,计算关键点出现频率的平均比值,然后根据该比值与预定平衡系数的接近程度,决定将照片分配到训练集或验证集;

7、s6、按照关键点类别总数降序、相同类别总数下关键点出现次数升序的顺序,继续对照片进行就近划分;

8、s7、重复s5-s6这一过程,直到所有照片根据平衡系数被分配到训练集或验证集中。



技术特征:

1.一种类别平衡的人体关键点训练集验证集划分方法,其特征在于:本发明包括下述步骤:

2.根据权利要求1所述的类别平衡的人体关键点训练集验证集划分方法,其特征是:所述的步骤s3中的针对那些所有关键点类别均出现且每类关键点只出现一次的照片,使用预先设定好的平衡系数随机分配到训练集和验证集,包括如下过程:

3.根据权利要求1所述的类别平衡的人体关键点训练集验证集划分方法,其特征是:所述步骤s5中的数据集平衡划分优化方法,包括如下过程:

4.根据权利要求3所述的类别平衡的人体关键点训练集验证集划分方法,其特征是:所述的步骤s6根据关键点类别数降序及关键点类别数一致时类别总数升序排列的顺序,继续将未划分照片进行权利要求3所述的s51-s55执行,这一步骤确保了所有照片都按照既定的排序和类别平衡原则进行训练集/验证集划分。


技术总结
本发明的一种类别平衡的人体关键点训练集验证集划分方法,属于计算机视觉领域。本发明包括以下步骤:1)统计每张照片中关键点类别数量及类别出现总数;2)根据关键点类别数量降序、关键点总数升序对照片进行排列;3)将所有类别均包含且每类仅出现一次的照片随机分配至训练集和验证集;4)统计随机分配后训练集与验证集类别总数平均比值;5)将未划分照片分别放置训练集和验证集,根据类别总数平均比值与平衡系数的差值绝对值大小,判定划分结果;6)循环执行步骤5,直至所有照片被划分。本发明的优势在于:减少关键点学习偏差,提高模型在复杂环境下的鲁棒性,对提升人体姿态估计的泛化性及正确率具有重要应用价值。

技术研发人员:李静,王政浩,杨欣
受保护的技术使用者:安阳工学院
技术研发日:
技术公布日:2024/2/19
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1