一种基于众包技术的分类模型训练方法与流程

文档序号:11323822阅读:来源:国知局

技术特征:

技术总结
本发明提供了一种基于众包技术的分类模型训练方法。在少量样本对应的众包标注信息上对用户提供标注信息的水平进行估计;利用所观察到的标注者水平作为先验知识来确定训练样本所使用的标注信息;在训练样本及其标注信息上训练分类模型;利用该分类模型选择能使该模型期望误差最小的训练样本,并预测该样本所属类别;将所选样本及在该类别上标注水平最高的用户为其提供的标注信息加入训练集;在更新后的训练集上,迭代执行上述步骤,直至分类模型的精度或者训练样本的数量达到预设标准为止。本发明的效果在于,避免了标注水平低的用户提供的低质量标注信息对分类模型训练的不利影响,保证了众包环境下训练高泛化能力分类模型的效果。

技术研发人员:吴伟宁
受保护的技术使用者:哈尔滨工程大学
技术研发日:2017.06.29
技术公布日:2017.10.13
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1