模型训练方法及装置的制造方法_3

文档序号：9327539阅读：来源：国知局

，每个测试样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值；
[0080]参数获取单元442，用于对于每个候选模型，将样本集获取单元441得到的测试样本集中的每个测试样本的用户特征和内容特征输入候选模型，根据候选模型的每个输出值和对应的操作值计算模型质量参数；
[0081 ] 预估模型确定单元443，用于根据参数获取单元442得到的η个模型质量参数选择质量最好的候选模型，将候选模型确定为本次训练得到的预估模型。
[0082]可选的，预估模型确定单元443，包括:
[0083]第一确定子单元4431，用于当模型质量参数是受试者工作特征曲线下面积AUC时，选择数值最大的AUC所对应的候选模型；
[0084]第二确定子单元4432，用于当模型质量参数是代价函数的函数值时，选择数值最小的函数值所对应的候选模型。
[0085]可选的，本实施例提供的模型训练装置，还包括:
[0086]时间获取模块450，用于获取构造的模型的上线时间；
[0087]测试样本集生成模块460，用于根据在上线时间之前的预定时段内的样本生成测试样本集，预定时段的结束时间与上线时间之间的差值小于预定阈值；
[0088]训练样本集生成模块470，用于根据在预定时段外的样本生成训练样本集。
[0089]综上所述，本发明实施例提供的模型训练装置，通过构造代价函数为非凸函数的模型；获取训练样本集，该训练样本集包括用于训练模型的各个训练样本，每个训练样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值；根据训练样本集对模型进行训练，得到η个候选模型；将η个候选模型中质量最好的候选模型确定为本次训练得到的预估模型，解决了代价函数是非凸函数的预估模型的模型质量波动大，最终训练得到的预估模型的模型质量不稳定的问题，达到了提高最终训练得到的预估模型的模型质量的效果。
[0090]另外，通过获取构造的模型的上线时间；根据在上线时间之前的预定时段内的样本生成测试样本集，该预定时段的结束时间与上线时间之间的差值小于预定阈值，由于离上线时间较近的测试样本集与上线后的实际的样本特征较接近，因此，当使用测试样本集对该预估模型的测试通过时，预估模型对上线后的样本特征的预估的准确性较高。
[0091]需要说明的是:上述实施例提供的模型训练装置在进行模型训练时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将模型训练装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的模型训练装置与模型训练方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。
[0092]上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。
[0093]本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。
[0094]以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。
【主权项】
1.一种模型训练方法，其特征在于，所述方法包括: 构造代价函数为非凸函数的模型；获取训练样本集，所述训练样本集包括用于训练所述模型的各个训练样本，每个训练样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值；根据所述训练样本集对所述模型进行训练，得到η个候选模型，η为大于I的正整数；将所述η个候选模型中质量最好的候选模型确定为本次训练得到的预估模型。2.根据权利要求1所述的方法，其特征在于，所述根据所述训练样本集对所述模型进行训练，得到η个候选模型，包括: 将所述训练样本集在所述模型中迭代m轮，m > η且m为正整数；将其中最后η轮迭代得到的η个模型确定为所述η个候选模型。3.根据权利要求1所述的方法，其特征在于，所述将所述η个候选模型中质量最好的候选模型确定为本次训练得到的预估模型，包括: 获取测试样本集，所述测试样本集包括用于测试所述候选模型的各个测试样本，每个测试样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值；对于每个候选模型，将所述测试样本集中的每个测试样本的用户特征和内容特征输入所述候选模型，根据所述候选模型的每个输出值和对应的操作值计算模型质量参数；根据得到的η个模型质量参数选择质量最好的候选模型，将所述候选模型确定为本次训练得到的预估模型。4.根据权利要求3所述的方法，其特征在于，所述根据得到的η个模型质量参数选择质量最好的候选模型，包括: 当所述模型质量参数是受试者工作特征曲线下面积AUC时，选择数值最大的AUC所对应的候选模型；当所述模型质量参数是代价函数的函数值时，选择数值最小的函数值所对应的候选模型。5.根据权利要求1至4任一所述的方法，其特征在于，所述方法，还包括: 获取构造的所述模型的上线时间；根据在所述上线时间之前的预定时段内的样本生成测试样本集，所述预定时段的结束时间与所述上线时间之间的差值小于预定阈值；根据在所述预定时段外的样本生成所述训练样本集。6.一种模型训练装置，其特征在于，所述装置包括: 模型构造模块，用于构造代价函数为非凸函数的模型；样本集获取模块，用于获取训练样本集，所述训练样本集包括用于训练所述模型构造模块构造的所述模型的各个训练样本，每个训练样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值；候选模型获取模块，用于根据所述样本集获取模块得到的所述训练样本集对所述模型进行训练，得到η个候选模型，η为大于I的正整数；预估模型确定模块，用于将所述候选模型获取模块得到的所述η个候选模型中质量最好的候选模型确定为本次训练得到的预估模型。7.根据权利要求6所述的装置，其特征在于，所述候选模型获取模块，包括: 样本集迭代单元，用于将所述训练样本集在所述模型中迭代m轮，m > η且m为正整数；候选模型确定单元，用于将其中最后η轮迭代得到的η个模型确定为所述η个候选模型。8.根据权利要求6所述的装置，其特征在于，所述预估模型确定模块，包括: 样本集获取单元，用于获取测试样本集，所述测试样本集包括用于测试所述候选模型的各个测试样本，每个测试样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值；参数获取单元，用于对于每个候选模型，将所述样本集获取单元得到的所述测试样本集中的每个测试样本的用户特征和内容特征输入所述候选模型，根据所述候选模型的每个输出值和对应的操作值计算模型质量参数；预估模型确定单元，用于根据所述参数获取单元得到的η个模型质量参数选择质量最好的候选模型，将所述候选模型确定为本次训练得到的预估模型。9.根据权利要求8所述的装置，其特征在于，所述预估模型确定单元，包括: 第一确定子单元，用于当所述模型质量参数是受试者工作特征曲线下面积AUC时，选择数值最大的AUC所对应的候选模型；第二确定子单元，用于当所述模型质量参数是代价函数的函数值时，选择数值最小的函数值所对应的候选模型。10.根据权利要求6至9任一所述的装置，其特征在于，所述装置，还包括: 时间获取模块，用于获取构造的所述模型的上线时间；测试样本集生成模块，用于根据在所述上线时间之前的预定时段内的样本生成测试样本集，所述预定时段的结束时间与所述上线时间之间的差值小于预定阈值；训练样本集生成模块，用于根据在所述预定时段外的样本生成所述训练样本集。
【专利摘要】本发明公开了一种模型训练方法及装置，属于计算机技术领域。所述方法包括：构造代价函数为非凸函数的模型；获取训练样本集，所述训练样本集包括用于训练所述模型的各个训练样本，每个训练样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值；根据所述训练样本集对所述模型进行训练，得到n个候选模型，n为大于1的正整数；将所述n个候选模型中质量最好的候选模型确定为本次训练得到的预估模型。本发明解决了代价函数为非凸函数的预估模型的模型质量波动大的问题，达到了提高最终训练得到的预估模型的模型质量的效果。
【IPC分类】G06N3/08, G06Q10/04
【公开号】CN105046366
【申请号】CN201510456763
【发明人】金涬, 李毅, 邹永强, 郭志懋, 薛伟, 肖磊
【申请人】腾讯科技（深圳）有限公司
【公开日】2015年11月11日
【申请日】2015年7月29日

完整全部详细技术资料下载

当前第3页1 2 3