机器学习模型的环境特定训练的制作方法

文档序号:36397715发布日期:2023-12-15 21:36阅读:66来源:国知局
机器学习模型的环境特定训练的制作方法


背景技术:

1、强大的机器学习模型可以被用来执行诸如图像分析、语音识别、自然语言处理、数据分析之类的任务。在给予足够的时间和计算资源来执行这种任务的情况下,经训练的机器学习模型可以提供准确、可复现的分析。对于期望实时分析的场景和/或当本地计算资源有限时,来自大型机器学习模型的知识可以被蒸馏成小型模型以用于本地部署,而不牺牲有效性。


技术实现思路

1、一种用于机器学习模型的环境特定训练的方法,包括:接收针对本地环境的、包括多个顺序数据片段的数据流。使用学生版机器学习模型为每个数据片段生成编程标记。选择用于由教师版机器学习模型进行评估的数据片段的一部分和相关联的编程标记并将其上传到服务器侧计算设备。从服务器侧计算设备接收环境特定训练更新。该训练更新是基于对所选编程标记与由教师版为数据片段的所选部分生成的伪标记的比较。将环境特定训练更新应用于学生版以生成更新的学生版。然后,更新的学生版机器学习模型被用来为新接收数据片段生成编程标记。

2、提供本
技术实现要素:
是为了以简化的形式介绍概念的选择,这些概念将在下面的具体实施方式中被进一步描述。本发明内容并不旨在识别所要求保护的主题的关键特征或基本特征,也不旨在被用来限制所要求保护主题的范围。此外,所要求保护主题不限于解决了本公开的任何部分中所指出的任何或所有缺点的实现。



技术特征:

1.一种用于机器学习模型的环境特定训练的方法,所述方法包括:

2.根据权利要求1所述的方法,还包括:

3.根据权利要求1所述的方法,其中,所述环境特定训练更新包括一个或多个选择参数,所述一个或多个选择参数能够用于确定新接收数据片段的一部分以选择用于供所述教师版机器学习模型进行评估。

4.根据权利要求3所述的方法,其中,在所述训练更新中包括的所述一个或多个选择参数包括选择频率。

5.根据权利要求1所述的方法,其中,被选择用于评估的数据片段的所述部分是被随机选择的。

6.根据权利要求1所述的方法,其中,被选择用于评估的数据片段的所述部分至少部分地基于所述编程标记被选择。

7.根据权利要求6所述的方法,其中,被选择用于评估的数据片段的所述部分至少部分地基于被分配给一个或多个编程标记的置信度评级被选择。

8.一种用于在本地环境中部署机器学习模型的系统,所述系统包括:

9.根据权利要求8所述的系统,其中,所述客户端侧计算设备还包括一个或多个传感器,所述一个或多个传感器被配置为生成所述本地环境内的所述数据流。

10.根据权利要求8所述的系统,其中,所述数据流包括一个或多个2d图像流,并且其中,每个数据片段包括一个或多个图像帧。

11.根据权利要求8所述的系统,其中,所述数据流包括一个或多个3d图像流,并且其中,每个数据片段包括一个或多个图像帧。

12.根据权利要求8所述的系统,其中,所述数据流包括一个或多个音频流,并且其中,每个数据片段包括有限的音频数据分块。

13.根据权利要求8所述的系统,其中,所述学生版机器学习模型还被配置为将所述顺序数据片段和相关联的编程标记中的至少一些提供到本地输出。

14.根据权利要求8所述的系统,其中,所述教师版机器学习模型最初至少部分地通过人类监督来训练。

15.根据权利要求8所述的系统,其中,所述客户端侧网络接口还被配置为:


技术总结
一种用于机器学习模型的环境特定训练的方法,包括:接收针对本地环境的、包括多个顺序数据片段的数据流。使用学生版机器学习模型为每个数据片段生成编程标记。选择用于由教师版机器学习模型进行评估的数据片段的一部分和相关联的编程标记并将其上传到服务器侧计算设备。从服务器侧计算设备接收环境特定训练更新。该训练更新是基于对所选编程标记和由教师版为数据片段的所选部分生成的伪标记的比较。将环境特定训练更新应用于学生版以生成更新的学生版。然后,更新的学生版机器学习模型被用来为新接收数据片段生成编程标记。

技术研发人员:于沛,刘自成,金赢,陈寅鹏,罗琨
受保护的技术使用者:微软技术许可有限责任公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1