视觉媒体中的人类型的分类的制作方法

文档序号：34090383发布日期：2023-05-07 02:27阅读：38来源：国知局

所描述的方面涉及图像分类系统。

背景技术：

1、本公开的各方面总体上涉及图像分类系统，并且更具体地，涉及对视觉媒体中的人类型进行分类。

2、现代图像分类系统能够区分各种对象。例如，经训练以区分猫和狗的机器学习模型在提供足够的图像训练数据库时可能会成功地做到这一点。然而，对于普通用户，设置自定义图像分类系统的可访问性是有限的——尤其是在利基情况下。

3、例如，在工作场所的背景下，假设一家百货公司的所有者试图评估员工绩效。所有者可以设置相机以检测员工何时进入框架并且监测员工的活动。鉴于百货公司可能也有若干位顾客，区分员工和非员工就变得很重要。在这种情况下，所有者不能简单地使用任意的员工图像分类系统，因为所述系统可能会在一组非常不同的训练图像上进行训练和/或可能需要特定类型的输入图像。在设置他/她自身的图像分类系统方面，在不知道需要多少图像、模型的兼容性和要捕获的场景类型的情况下生成训练数据库，即使对于了解机器学习的人来说也很麻烦，更不用说对于不了解机器学习的人了。

4、因此，需要改进图像分类系统。

技术实现思路

1、以下呈现了一个或多个方面的简化概述，以便提供对此类方面的基本理解。本
技术实现要素：
不是对所有预期方面的广泛综述，并且既不旨在标识所有方面的关键或重要元素，也不旨在描绘任何或所有方面的范围。其唯一目的是以简化形式呈现一个或多个方面的一些概念，作为稍后呈现的更详细描述的序言。

2、示例实施方案包含一种用于对视觉媒体中的人类型进行分类的方法，所述方法包括使用图像分类识别图像中的人。所述方法进一步包含在所述图像上生成所识别的人周围的视觉边界。另外，所述方法进一步包含将所述图像划分成多个图像部分，使得多个图像部分部分地描绘所述视觉边界内部的所述所识别的人。另外，所述方法进一步包含在用户接口上生成所述多个图像部分以供显示，所述用户接口提示用户选择所述多个图像部分中的至少部分地描绘预定类型的人的每个部分。另外，所述方法进一步包含通过所述用户接口接收对所划分的图像中的至少一部分的选择。另外，所述方法进一步包含针对机器学习模型并且响应于确定所述选择包括所述视觉边界内部的所述所识别的人，生成训练输入，所述训练输入包括描绘所述视觉边界内部的内容的训练图像和指示所述视觉边界内部的所述所识别的人属于所述预定类型的标签。另外，所述方法进一步包含将所述训练输入存储在存储器中。

3、另一个示例实施方案包含一种用于对视觉媒体中的人类型进行分类的设备，所述设备包括存储器和与所述存储器通信的处理器。处理器被配置成使用图像分类识别图像中的人。所述处理器被进一步配置成在所述图像上生成所识别的人周围的视觉边界。另外，所述处理器被进一步配置成将所述图像划分成多个图像部分，使得多个图像部分部分地描绘所述视觉边界内部的所述所识别的人。另外，所述处理器被进一步配置成在用户接口上生成所述多个图像部分以供显示，所述用户接口提示用户选择所述多个图像部分中的至少部分地描绘预定类型的人的每个部分。另外，所述处理器被进一步配置成通过所述用户接口接收对所划分的图像中的至少一部分的选择。另外，所述处理器被进一步配置成针对机器学习模型并且响应于确定所述选择包括所述视觉边界内部的所述所识别的人，生成训练输入，所述训练输入包括描绘所述视觉边界内部的内容的训练图像和指示所述视觉边界内部的所述所识别的人属于所述预定类型的标签。另外，所述处理器被进一步配置成将训练输入存储在存储器中。

4、另一个示例实施方案包含一种用于对视觉媒体中的人类型进行分类的设备，所述设备包括用于使用图像分类识别图像中的人的装置。所述设备进一步包含用于在所述图像上生成所识别的人周围的视觉边界的装置。另外，所述设备进一步包含用于将所述图像划分成多个图像部分，使得多个图像部分部分地描绘所述视觉边界内部的所述所识别的人的装置。另外，所述设备进一步包含用于在用户接口上生成所述多个图像部分以供显示的装置，所述用户接口提示用户选择所述多个图像部分中的至少部分地描绘预定类型的人的每个部分。另外，所述设备进一步包含用于通过所述用户接口接收对所划分的图像中的至少一部分的选择的装置。另外，所述设备进一步包含用于针对机器学习模型并且响应于确定所述选择包括所述视觉边界内部的所述所识别的人，生成训练输入的装置，所述训练输入包括描绘所述视觉边界内部的内容的训练图像和指示所述视觉边界内部的所述所识别的人属于所述预定类型的标签。另外，所述设备进一步包含用于将所述训练输入存储在存储器中的装置。

5、另一个示例实施方案包含一种用于对视觉媒体中的人类型进行分类的计算机可读介质，所述计算机可读介质能够由处理器执行以使用图像分类识别图像中的人。能够进一步执行指令以在所述图像上生成所识别的人周围的视觉边界。另外，能够进一步执行指令以将所述图像划分成多个图像部分，使得多个图像部分部分地描绘所述视觉边界内部的所述所识别的人。另外，能够进一步执行指令以在用户接口上生成所述多个图像部分以供显示，所述用户接口提示用户选择所述多个图像部分中的至少部分地描绘预定类型的人的每个部分。另外，能够进一步执行指令以通过所述用户接口接收对所划分的图像中的至少一部分的选择。另外，能够进一步执行指令以针对机器学习模型并且响应于确定所述选择包括所述视觉边界内部的所述所识别的人，生成训练输入，所述训练输入包括描绘所述视觉边界内部的内容的训练图像和指示所述视觉边界内部的所述所识别的人属于所述预定类型的标签。另外，能够进一步执行指令以将训练输入存储在存储器中。

6、为了实现前述和相关目的，一个或多个方面包括下文充分描述并在权利要求中特别指出的特征。以下描述和附图详细阐述了一个或多个方面的某些说明性特征。然而，这些特征仅指示可采用各个方面的原理的各种方式中的少数几种，且此描述旨在包含所有此类方面及其等效物。

技术特征：

1.一种用于对视觉媒体中的人类型进行分类的方法，所述方法包括：

2.根据权利要求1所述的方法，其中所述机器学习模型是一类支持向量机。

3.根据权利要求1所述的方法，其进一步包括：

4.根据权利要求3所述的方法，其进一步包括：

5.根据权利要求4所述的方法，其中所述不同的图像由相机捕获，所述方法进一步包括：

6.根据权利要求4所述的方法，其进一步包括：

7.根据权利要求6所述的方法，其中所述机器学习模型进一步输出指示所述输出是正确的概率的置信度评分，并且其中所述验证是响应于确定所述置信度评分低于阈值置信度评分而执行的。

8.根据权利要求3所述的方法，其中所述预定类型是员工，并且其中使所存储的训练输入向量化以创建所述训练向量进一步包括：

9.根据权利要求1所述的方法，其进一步包括：

10.一种用于对视觉媒体中的人类型进行分类的设备，所述设备包括：

11.根据权利要求10所述的设备，其中所述机器学习模型是一类支持向量机。

12.根据权利要求10所述的设备，其中所述处理器被进一步配置成：

13.根据权利要求12所述的设备，其中所述处理器被进一步配置成：

14.根据权利要求13所述的设备，其中所述不同的图像由相机捕获，其中所述处理器被进一步配置成：

15.根据权利要求13所述的设备，其中所述处理器被进一步配置成：

16.根据权利要求15所述的设备，其中所述机器学习模型进一步输出指示所述输出是正确的概率的置信度评分，并且其中所述验证是响应于确定所述置信度评分低于阈值置信度评分而执行的。

17.根据权利要求12所述的设备，其中所述预定类型是员工，并且其中使所存储的训练输入向量化以创建所述训练向量，所述处理器被进一步配置成：

18.根据权利要求10所述的设备，其中所述处理器被进一步配置成：

19.一种用于对视觉媒体中的人类型进行分类的计算机可读介质，所述计算机可读介质能够由处理器执行以：

技术总结
本文公开了用于对视觉媒体中的人类型进行分类的设备和方法。实施方案包含：识别图像中的人；生成所识别的人周围的视觉边界；以及将所述图像划分成多个图像部分，使得多个图像部分部分地描绘所述视觉边界内部的所述所识别的人。所述实施方案包含在用户接口上生成所划分的图像，所述用户接口提示用户选择至少部分地描绘预定类型的人的每个部分。所述实施方案包含接收对至少一部分的选择。所述实施方案包含针对机器学习模型并且响应于确定所述选择包括所述所识别的人，生成训练输入，所述训练输入包括训练图像和指示所述所识别的人属于所述预定类型的标签。另外，所述实施方案包含将所述训练输入存储在存储器中。

技术研发人员：迈克尔·C·斯图尔特,约瑟夫·塞利,戈比·苏布拉曼尼
受保护的技术使用者：先讯美资电子有限责任公司
技术研发日：
技术公布日：2024/1/12

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：迈克尔
技术所有人：先讯美资电子有限责任公司
我是此专利的发明人

上一篇：一种免模板超大规模UHPC-CSW-NC组合盖梁及施工方法与流程
上一篇：便携式胰岛素多功能箱的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。