不平衡小样本下多层级标签分类判别方法及装置与流程

文档序号:37339469发布日期:2024-03-18 18:07阅读:来源:国知局

技术特征:

1.一种不平衡小样本下多层级标签分类判别方法,其特征在于,包括:

2.根据权利要求1所述的一种不平衡小样本下多层级标签分类判别方法,其特征在于,所述通过关键词库对所述第一数据集进行分类,得到第一预测标签的步骤,包括:

3.根据权利要求1所述的一种不平衡小样本下多层级标签分类判别方法,其特征在于,所述通过分类模型对所述第二数据集进行分类,得到第二预测标签的步骤,包括:

4.根据权利要求1所述的一种不平衡小样本下多层级标签分类判别方法,其特征在于,所述对第一预测标签和第二预测标签进行融合处理,将融合处理后的标签作为最终预测出的当前标签的步骤,包括:

5.根据权利要求1所述的一种不平衡小样本下多层级标签分类判别方法,其特征在于,通过如下方式获取所述关键词库:

6.一种不平衡小样本下多层级标签分类判别装置,其特征在于,包括:

7.根据权利要求6所述的一种不平衡小样本下多层级标签分类判别装置,其特征在于,所述分类模块被进一步配置为:

8.根据权利要求6所述的一种不平衡小样本下多层级标签分类判别装置,其特征在于,所述分类模块被进一步配置为:

9.根据权利要求6所述的一种不平衡小样本下多层级标签分类判别装置,其特征在于,所述融合模块被进一步配置为:

10.根据权利要求6所述的一种不平衡小样本下多层级标签分类判别装置,其特征在于,还包括关键词库获取模块,被配置为:


技术总结
本发明公开了一种不平衡小样本下多层级标签分类判别方法及装置,涉及文本分类技术领域,方法包括:获取样本数据集;统计样本数据集在多层级标签的每级标签下的样本数,对每级标签分别设置样本数阈值;将样本数小于等于样本数阈值的每级标签下的样本数据作为第一数据集,将其余标签下的样本数据作为第二数据集;通过关键词库对第一数据集进行分类,得到第一预测标签,通过分类模型对第二数据集进行分类,得到第二预测标签;对第一预测标签和第二预测标签进行融合处理;按照从上级标签到下级标签的顺序,依次预测每个食物名称对应的多层级标签。本发明有效的提高了机器学习的F1值,大大降低了维护成本。

技术研发人员:李宇欣,段兴涛
受保护的技术使用者:北京健康有益科技有限公司
技术研发日:
技术公布日:2024/3/17
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1