机器学习模型的训练方法和训练装置的制造方法

文档序号：9787871阅读：753来源：国知局

机器学习模型的训练方法和训练装置的制造方法
【技术领域】
[0001] 本发明涉及机器学习领域，具体涉及一种机器学习模型的训练方法和训练装置。
【背景技术】
[0002] 机器学习是一门研究机器获取新知识和新技能，并识别现有知识的学问。这里所说的"机器"包括计算机，例如：电子计算机、中子计算机、光子计算机或神经计算机等等。随着科学技术的进步，很多机器学习模型应运而生，例如:遗传算法、进化算法、神经网络、支持向量机等。
[0003] 目前的机器学习模型一般按如下方式进行训练。首先，接收用户预先准备好的训练数据和系统目标。然后，利用训练数据对一种可能的机器学习模型进行训练。训练产生新的模型后，用户评估该新的模型是否满足系统目标。如不满足则由用户修改模型，基于用户所修改的模型再次进行训练。直至最后用户获得满意的机器学习模型。
[0004]在以上训练过程中，假设训练数据不变，则修改模型的操作对用户要求最高。这需要用户有根据系统目标修改模型的能力，即要求用户熟知模型的各种变体并有丰富的模型调优经验。这样增加了用户负担并且产生了只有少数专家才能有效进行机器学习模型训练的问题。

【发明内容】

[0005] 鉴于上述问题，提出了本发明以便提供一种至少部分地解决上述问题的机器学习模型的训练方法和训练装置。
[0006] 根据本发明一个方面，提供了一种机器学习模型的训练方法，包括：
[0007] 步骤S110,接收训练数据和机器学习模型的属性指标；
[0008] 步骤S130,根据所述属性指标中的至少一部分、利用模型数据库确定训练模型，其中所述模型数据库包括机器学习模型及其属性数据；
[0009] 步骤S150,利用所述训练数据对所述训练模型进行训练，以获得经训练的模型及其属性数据；
[0010] 步骤S170,根据所述经训练的模型的属性数据确定所述经训练的模型是否满足所述属性指标，对于所述经训练的模型不满足所述属性指标的情况，转所述步骤S130,直至获得满足所述属性指标的模型。
[0011] 根据本发明另一个方面，还提供了一种机器学习模型的训练装置，包括：
[0012] 输入模块，用于接收训练数据和机器学习模型的属性指标；
[0013] 初定模块，用于根据所述属性指标中的至少一部分、利用模型数据库确定训练模型，其中所述模型数据库包括机器学习模型及其属性数据；
[0014] 训练模块，用于利用所述训练数据对所述训练模型进行训练，以获得经训练的模型及其属性数据；以及
[0015] 确定模块，用于根据所述经训练的模型的属性数据确定所述经训练的模型是否满足所述属性指标，对于所述经训练的模型不满足所述属性指标的情况，启动所述初定模块，直至获得满足所述属性指标的模型。
[0016]本发明所提供的上述机器学习模型的训练方法和训练装置，在训练过程中无需用户修改模型，不要求用户具有模型调优的相关经验。从而，节约了用户的时间和精力，并且显著地扩大了机器学习模型的可能用户群。
[0017]上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的【具体实施方式】。
【附图说明】
[0018] 通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：
[0019] 图1示出了根据本发明一个实施例的机器学习模型的训练方法的流程图；
[0020]图2示出了根据本发明另一个实施例的机器学习模型的训练方法的流程图；
[0021] 图3示出了根据本发明一个实施例的机器学习模型的训练装置的示意性框图；以及
[0022] 图4示出了根据本发明另一个实施例的机器学习模型的训练装置的示意性框图。
【具体实施方式】
[0023] 下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。
[0024] 为了避免机器学习模型的训练过程必须由用户参与，导致浪费用户时间和精力并且仅可由相关领域专家才能完成的问题，本发明提供了一种机器学习模型的训练方法。如上所述，机器学习模型可以包括神经网络、支持向量机、遗传算法等任何能够通过经验学习改善运行性能的模型。在以下实施例中，以神经网络为例来进行说明，神经网络仅为示例而非对本发明的限制。
[0025] 图1示出了根据本发明一个实施例的机器学习模型的训练方法100的流程图。如图 1所示，该方法1 〇〇包括步骤SI 10、步骤S130、步骤S150和步骤S170。
[0026] 在步骤S110中，接收训练数据和机器学习模型的属性指标。
[0027]机器学习模型可以应用到各种场景中，例如分类场景、问题求解场景等。训练数据与机器学习模型在应用中的输入数据类型一致。假设机器学习模型用于对图像中的前景进行人脸识别，那么训练数据可以包括多个图像，这些图像已经标记了是否具有人脸，甚至标记了人脸的位置。本领域普通技术人员可以理解，训练数据可以包括各种类型的数据，例如：图像数据、语音数据、文本数据等等。
[0028]机器学习模型可能划分为很多不同的构型。每个构型可以包括很多具体的模型。同一构型的机器学习模型是具有相同拓扑结构的模型。例如，对于神经网络来说，构型相同意味着神经网络的神经元(节点)类型以及神经元之间的连接关系均相同。模型是指已经确定了全部参数的值的构型。形象地说，构型决定了神经网络的结构，例如几层，每层有多少节点，都是哪种类型的节点以及节点之间如何连接。模型是具体的某一个特定的神经网络。对于训练过程来说，训练不改变神经网络的构型，仅改变神经网络的模型。
[0029] 模型的属性指标是模型的属性数据的用户所期待的指标。每个模型有其独有的属性数据。属性指标限定了模型的属性数据的范围，也就一定程度上限定了模型。
[0030] 可选地，模型的属性数据包括以下项中的至少一项:模型的输入数据的属性、模型的参数的个数、模型针对输入数据和运行平台的计算速度以及模型针对输入数据和运行平台的计算精度。
[0031] 输入数据的属性包括模型的输入数据的类型和维度数。每个模型对于输入数据可能有限制，特别是输入

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周舒畅;姚聪;周昕宇;吴文昊;倪泽堃;曹志敏;印奇;
技术所有人：北京旷视科技有限公司;北京小孔科技有限公司;
我是此专利的发明人

上一篇：一种新型卷积神经网络的样本训练方法
上一篇：基于主动学习的madaline神经网络样本选择方法及系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。