机器学习模型训练方法和装置与流程

文档序号：15020781发布日期：2018-07-25 00:39阅读：来源：国知局

技术特征：

1.一种机器学习模型训练方法，包括：

获取在本轮清洗脏样本数据前已有的纯净样本数据；

根据所述已有的纯净样本数据和机器学习模型的当前模型参数，确定所述机器学习模型的损失函数的第一二阶平均梯度；

获取本轮从脏样本数据中取部分脏样本数据清洗后得到的纯净样本数据；

根据本轮清洗得到的所述纯净样本数据和所述当前模型参数，确定所述损失函数的第二二阶平均梯度；

根据所述第一二阶平均梯度和所述第二二阶平均梯度，获得所述损失函数的整体二阶平均梯度；

根据所述整体二阶平均梯度调整所述当前模型参数；

当调整后的模型参数不满足训练结束条件时，将下一轮作为本轮，返回所述获取在本轮清洗脏样本数据前已有的纯净样本数据的步骤以继续训练，直至调整后的模型参数满足训练结束条件。

2.根据权利要求1所述的方法，其特征在于，所述根据所述已有的纯净样本数据和机器学习模型的当前模型参数，确定所述机器学习模型的损失函数的第一二阶平均梯度，包括：

将所述已有的纯净样本数据和机器学习模型的当前模型参数代入所述损失函数；

求取代入所述已有的纯净样本数据和所述当前模型参数的所述损失函数的第一一阶偏导数和第一二阶偏导矩阵；

根据所述第一二阶偏导矩阵的逆矩阵和所述第一一阶偏导数，确定所述机器学习模型的损失函数的第一二阶平均梯度。

3.根据权利要求2所述的方法，其特征在于，所述根据所述第一二阶偏导矩阵的逆矩阵和所述第一一阶偏导数，确定所述机器学习模型的损失函数的第一二阶平均梯度，包括：

按照以下公式计算所述机器学习模型的损失函数的第一二阶平均梯度：

其中，gc(θ)为第一二阶平均梯度；c是clean的缩写，表示用于计算所述第一二阶平均梯度的样本数据为纯净的数据；Rclean为所述已有的纯净样本数据；φ()表示损失函数；H(φ())表示所述损失函数的二阶偏导矩阵；为所述已有的纯净样本数据中第i个输入数据；为所述已有的纯净样本数据中第i个输出数据；θ为当前模型参数；为所述损失函数的第一二阶偏导矩阵的逆矩阵；为所述损失函数的第一一阶偏导数。

4.根据权利要求1所述的方法，其特征在于，所述根据本轮清洗得到的所述纯净样本数据和所述当前模型参数，确定所述损失函数的第二二阶平均梯度，包括：

将本轮清洗得到的所述纯净样本数据和所述当前模型参数代入所述损失函数；

求取代入本轮清洗得到的所述纯净样本数据和所述当前模型参数的所述损失函数的第二一阶偏导数和第二二阶偏导矩阵；

根据所述第二二阶偏导矩阵的逆矩阵和所述第二一阶偏导数，确定所述损失函数的第二二阶平均梯度。

5.根据权利要求4所述的方法，其特征在于，所述根据所述第二二阶偏导矩阵的逆矩阵和所述第二一阶偏导数，确定所述损失函数的第二二阶平均梯度，包括：

获取本轮清洗得到的各所述纯净样本数据对应的脏样本数据的抽样概率；

对于本轮清洗得到的每条所述纯净样本数据，求取对应的所述第二二阶偏导矩阵的逆矩阵和所述第二一阶偏导数的乘积与对应的脏样本数据的抽样概率的比值；

求各所述比值的平均值，得到所述损失函数的第二二阶平均梯度。

6.根据权利要求5所述的方法，其特征在于，所述求各所述比值的平均值，得到所述损失函数的第二二阶平均梯度，包括：

按照以下公式计算所述损失函数的第二二阶平均梯度：

其中，gs(θ)为第二二阶平均梯度；s为本轮清洗得到的纯净样本数据；c是clean的缩写，表示用于计算第二二阶平均梯度的样本数据为纯净的数据；p(i)为本轮抽取的第i个脏样本数据的抽样概率；φ()表示损失函数；H(φ())表示损失函数的二阶偏导矩阵；为本轮清洗得到的纯净样本数据中第i个输入数据；为本轮清洗得到的纯净样本数据中第i个输出数据；θ为当前模型参数；为损失函数的第二二阶偏导矩阵的逆矩阵；为损失函数的第二一阶偏导数。

7.根据权利要求1所述的方法，其特征在于，所述根据所述第一二阶平均梯度和所述第二二阶平均梯度，获得所述损失函数的整体二阶平均梯度，包括：

将所述第一二阶平均梯度和所述第二二阶平均梯度，分别按照相应的第一权重和第二权重加权求和，得到所述损失函数的整体二阶平均梯度；

其中，所述第一权重，为本轮清洗脏样本数据前已有的纯净样本数据占全部样本数据的占比；

所述第二权重，为本轮清洗脏样本数据前的脏样本数据占全部样本数据的占比。

8.根据权利要求1至7中任一项所述的方法，其特征在于，所述脏样本数据包括用户特征样本数据和相应标定的用户画像标签；所述方法还包括：

当调整后的模型参数满足训练结束条件后，则

获取用户特征数据，将所述用户特征数据输入已调整模型参数的所述机器学习模型，输出用户画像标签。

9.一种机器学习模型训练装置，其特征在于，所述装置包括：

样本数据获取模块，用于获取在本轮清洗脏样本数据前已有的纯净样本数据；

二阶平均梯度确定模块，用于根据所述已有的纯净样本数据和机器学习模型的当前模型参数，确定所述机器学习模型的损失函数的第一二阶平均梯度；

所述样本数据获取模块还用于获取本轮从脏样本数据中取部分脏样本数据清洗后得到的纯净样本数据；

所述二阶平均梯度确定模块还用于根据本轮清洗得到的所述纯净样本数据和所述当前模型参数，确定所述损失函数的第二二阶平均梯度；根据所述第一二阶平均梯度和所述第二二阶平均梯度，获得所述损失函数的整体二阶平均梯度；

模型参数调整模块，用于根据所述整体二阶平均梯度调整所述当前模型参数；当调整后的模型参数不满足训练结束条件时，将下一轮作为本轮，通知所述样本数据获取模块工作，直至调整后的模型参数满足训练结束条件。

10.根据权利要求9所述的装置，其特征在于，所述二阶平均梯度确定模块还用于将所述已有的纯净样本数据和机器学习模型的当前模型参数代入所述损失函数；求取代入所述已有的纯净样本数据和所述当前模型参数的所述损失函数的第一一阶偏导数和第一二阶偏导矩阵；根据所述第一二阶偏导矩阵的逆矩阵和所述第一一阶偏导数，确定所述机器学习模型的损失函数的第一二阶平均梯度。

11.根据权利要求10所述的装置，其特征在于，所述二阶平均梯度确定模块还用于按照以下公式计算所述机器学习模型的损失函数的第一二阶平均梯度：

12.根据权利要求9所述的装置，其特征在于，所述二阶平均梯度确定模块还用于将本轮清洗得到的所述纯净样本数据和所述当前模型参数代入所述损失函数；求取代入本轮清洗得到的所述纯净样本数据和所述当前模型参数的所述损失函数的第二一阶偏导数和第二二阶偏导矩阵；根据所述第二二阶偏导矩阵的逆矩阵和所述第二一阶偏导数，确定所述损失函数的第二二阶平均梯度。

13.根据权利要求12所述的装置，其特征在于，所述二阶平均梯度确定模块还用于获取本轮清洗得到的各所述纯净样本数据对应的脏样本数据的抽样概率；对于本轮清洗得到的每条所述纯净样本数据，求取对应的所述第二二阶偏导矩阵的逆矩阵和所述第二一阶偏导数的乘积与对应的脏样本数据的抽样概率的比值；求各所述比值的平均值，得到所述损失函数的第二二阶平均梯度。

14.根据权利要求13所述的装置，其特征在于，所述二阶平均梯度确定模块还用于按照以下公式计算所述损失函数的第二二阶平均梯度：

15.根据权利要求9至14中任一项所述的装置，其特征在于，所述脏样本数据包括用户特征样本数据和相应标定的用户画像标签；所述装置还包括：

用户画像标签输出模块，用于当调整后的模型参数满足训练结束条件后，则获取用户特征数据，将所述用户特征数据输入已调整模型参数的所述机器学习模型，输出用户画像标签。

完整全部详细技术资料下载

当前第2页1 2 3