一种驾驶状态图像数据集的增广方法、增广装置与流程

文档序号：35666512发布日期：2023-10-06 22:09阅读：来源：国知局

技术特征：

1.一种驾驶状态图像数据集的增广方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的驾驶状态图像数据集的增广方法，其特征在于，在生成所述第二合成驾驶状态图像之后，还包括：

3.根据权利要求2所述的驾驶状态图像数据集的增广方法，其特征在于，对所述第二合成驾驶状态图像进行和谐化处理，具体包括：

4.根据权利要求1所述的驾驶状态图像数据集的增广方法，其特征在于，采用预训练的第一语言-视觉模型的图像编辑算法生成保持所述人脸图像的特征且表情符合所述关键词的描述的面部图像，具体包括：

5.根据权利要求1所述的驾驶状态图像数据集的增广方法，其特征在于，采用预训练的第二语言-视觉模型的图像编辑算法生成包含该驾驶员且衣着符合所述短语的描述的第一合成驾驶状态图像，具体包括：

6.根据权利要求1所述的驾驶状态图像数据集的增广方法，其特征在于，具体采用以下步骤生成所述第二合成驾驶状态图像：

7.一种驾驶状态图像数据集的增广装置，其特征在于，包括：

8.根据权利要求7所述的驾驶状态图像数据集的增广装置，其特征在于，还包括：

9.根据权利要求8所述的驾驶状态图像数据集的增广装置，其特征在于，所述和谐模块具体用于：

10.根据权利要求7所述的驾驶状态图像数据集的增广装置，其特征在于，所述第一生成模块具体用于：

11.根据权利要求7所述的驾驶状态图像数据集的增广装置，其特征在于，所述第二生成模块具体用于：

12.根据权利要求7所述的驾驶状态图像数据集的增广装置，其特征在于，所述第四生成模块具体用于：

13.一种计算机设备，其特征在于，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时，实现根据权利要求1-6中任一项所述的驾驶状态图像数据集的增广方法。

14.一种非临时性计算机可读存储介质，其特征在于，其上存储有计算机程序，该程序被处理器执行时实现根据权利要求1-6中任一项所述的驾驶状态图像数据集的增广方法。

技术总结
本发明涉及机器视觉技术领域，提供了一种驾驶状态图像数据集的增广方法、增广装置，所述方法包括：采用图像编辑算法生成保持人脸图像的特征且表情符合关键词描述的面部图像，以及生成包含驾驶员且衣着符合目标服饰的短语描述的第一合成驾驶状态图像；将面部图像的面部更换到第一合成驾驶状态图像的面部上，以生成驾驶员状态图像前景；将驾驶员状态图像前景粘贴到车内背景图像上，以生成第二合成驾驶状态图像；根据第二合成驾驶状态图像对驾驶状态图像数据集进行增广。本发明能够生成真实性、多样性均较好的驾驶员驾驶状态图像，从而实现驾驶状态图像数据集的有效增广，且由于采用分步对图像的不同部分做增广的总体构思，能够降低数据增广的难度。

技术研发人员：邹捷,牛力,段宇轩,洪燕,马千里,王云龙,邹永宁
受保护的技术使用者：南通嘉骏信息科技有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

当前第2页1 2