商品分类方法、商品分类模型构建方法及装置

文档序号:37557739发布日期:2024-04-09 17:49阅读:12来源:国知局
商品分类方法、商品分类模型构建方法及装置

本技术涉及商品类目预测,具体涉及一种商品分类方法、商品分类模型构建方法及装置。


背景技术:

1、随着互联网的飞速发展,电子商务和在线购物已经成为了人们购买商品的主流渠道。在电商场景下,每一个商品都会属于某一个类目,同时该类目往往属于一个树状的类目体系,其包含父类目和子类目。商品分类的主要目标是将商品归入不同的类别或类目,以便购物网站能够更好地组织和展示商品,帮助用户快速找到他们感兴趣的商品。然而随着商品的数量急剧增加,如何高效且精准地进行商品的自动化分类仍为学术界与工业界的共同难题。

2、相关技术中,主流的商品分类方法包括两类:(1)传统的商品分类方法通常依赖于手工制定的规则和关键字,这种方法效率低下且不够灵活,无法应对快速增长的商品数量和多样性;(2)近年来,随着神经网络和深度学习的迅速发展,许多工作提出利用预训练语言模型来自动学习并提取商品文本特征,例如使用bert及其变体模型来将输入文本映射到高维向量,从而获得更丰富的特征表示,但由于此类模型在预训练与微调阶段存在不一致性问题,以致其对于特征的表达能力以及信息的理解能力较弱,进而影响了商品分类的准确性。由此可见,如何在确保商品分类效率的基础上,有效提升商品分类的准确性是当前亟需解决的问题。


技术实现思路

1、本技术提供一种商品分类方法、商品分类模型构建方法及装置,可在确保商品分类效率的基础上,有效提升商品分类的准确性。

2、第一方面,本技术实施例提供一种商品分类方法,所述商品分类方法包括:

3、获取待分类商品文本和预设的商品类目编码,并基于预设的因果增强学习模板对待分类商品文本进行拼接处理,得到目标序列,所述因果增强学习模板包括上下文特征对象、因果词以及商品文本因果推理特征对象;

4、将目标序列和商品类目编码输入至预设的商品分类模型,以供商品分类模型对目标序列进行特征提取和动态加权融合,得到融合特征;对融合特征进行多层级语义和层次特征映射,并基于商品类目编码进行商品类目依赖和层次特征映射,基于映射结果计算出欧式空间距离和双曲空间距离;对欧式空间距离和双曲空间距离进行动态加权处理,得到与待分类商品文本对应的分类结果。

5、结合第一方面,在一种实施方式中,所述对目标序列进行特征提取和动态加权融合,得到融合特征,包括:

6、基于上下文特征对象、因果词以及商品文本因果推理特征对象对目标序列进行特征提取,得到目标上下文特征以及目标因果推理特征;

7、对目标上下文特征进行最大池化处理,得到池化结果;

8、对池化结果和目标因果推理特征进行动态加权融合,得到融合特征。

9、结合第一方面,在一种实施方式中,所述对融合特征进行多层级语义和层次特征映射,并基于商品类目编码进行商品类目依赖和层次特征映射,包括:

10、对融合特征进行线性变换,得到商品语义特征;

11、对商品语义特征进行双曲空间映射,得到商品层次特征;

12、基于图注意力网络以及商品类目编码进行类目间的依赖特征提取,得到类目依赖特征;

13、对类目依赖特征进行双曲空间映射,得到类目层次特征;

14、将商品语义特征、商品层次特征、类目依赖特征和类目层次特征作为映射结果。

15、结合第一方面,在一种实施方式中,所述基于映射结果计算出欧式空间距离和双曲空间距离,包括:

16、基于商品语义特征和类目依赖特征计算出欧式空间距离;

17、基于商品层次特征和类目层次特征计算出双曲空间映射。

18、第二方面,本技术实施例提供了一种商品分类装置,所述商品分类装置包括:

19、处理单元,其用于获取待分类商品文本和预设的商品类目编码,并基于预设的因果增强学习模板对待分类商品文本进行拼接处理,得到目标序列,所述因果增强学习模板包括上下文特征对象、因果词以及商品文本因果推理特征对象;

20、分类单元,其用于将目标序列和商品类目编码输入至预设的商品分类模型,以供商品分类模型对目标序列进行特征提取和动态加权融合,得到融合特征;对融合特征进行多层级语义和层次特征映射,并基于商品类目编码进行商品类目依赖和层次特征映射,基于映射结果计算出欧式空间距离和双曲空间距离;对欧式空间距离和双曲空间距离进行动态加权处理,得到与待分类商品文本对应的分类结果。

21、结合第二方面,在一种实施方式中,所述对输入序列进行特征提取和动态加权融合,得到融合特征,包括:

22、基于上下文特征对象、因果词以及商品文本因果推理特征对象对输入序列进行特征提取,得到目标上下文特征以及目标因果推理特征;

23、对目标上下文特征进行最大池化处理,得到池化结果;

24、对池化结果和目标因果推理特征进行动态加权融合,得到融合特征。

25、结合第二方面,在一种实施方式中,所述对融合特征进行多层级语义和层次特征映射,并基于历史商品类目编码进行商品类目依赖和层次特征映射,包括:

26、对融合特征进行线性变换,得到商品语义特征;

27、对商品语义特征进行双曲空间映射,得到商品层次特征;

28、基于图注意力网络以及历史商品类目编码进行类目间的依赖特征提取,得到类目依赖特征;

29、对类目依赖特征进行双曲空间映射,得到类目层次特征;

30、将商品语义特征、商品层次特征、类目依赖特征和类目层次特征作为映射结果。

31、结合第二方面,在一种实施方式中,所述基于映射结果计算出欧式空间距离和双曲空间距离,包括:

32、基于商品语义特征和类目依赖特征计算出欧式空间距离;

33、基于商品层次特征和类目层次特征计算出双曲空间映射。

34、第三方面,本技术实施例提供了一种商品分类模型构建方法,所述商品分类模型构建方法包括:

35、获取历史商品文本和历史商品类目,基于预设的因果增强学习模板对历史商品文本进行拼接处理,得到输入序列,所述因果增强学习模板包括上下文特征对象、因果词以及商品文本因果推理特征对象,对历史商品类目进行编码,得到历史商品类目编码,所述输入序列和历史商品类目编码构成数据集;

36、构建神经网络模型,所述神经网络模型包括特征提取模块、特征映射模块和分类预测模块,特征提取模块用于对输入序列进行特征提取和动态加权融合,得到融合特征;特征映射模块用于对融合特征进行多层级语义和层次特征映射,并基于历史商品类目编码进行商品类目依赖和层次特征映射;分类预测模块用于基于映射结果计算出欧式空间距离和双曲空间距离,对欧式空间距离和双曲空间距离进行动态加权处理,得到与历史商品文本对应的分类结果;

37、基于所述数据集对所述神经网络模型进行训练,得到商品分类模型,以通过所述商品分类模型实现商品分类。

38、第四方面,本技术实施例提供了一种商品分类模型构建装置,所述商品分类模型构建装置包括:

39、数据获取单元,其用于获取历史商品文本和历史商品类目,基于预设的因果增强学习模板对历史商品文本进行拼接处理,得到输入序列,所述因果增强学习模板包括上下文特征对象、因果词以及商品文本因果推理特征对象,对历史商品类目进行编码,得到历史商品类目编码,所述输入序列和历史商品类目编码构成数据集;

40、构建训练单元,其用于构建神经网络模型,所述神经网络模型包括特征提取模块、特征映射模块和分类预测模块,特征提取模块用于对输入序列进行特征提取和动态加权融合,得到融合特征;特征映射模块用于对融合特征进行多层级语义和层次特征映射,并基于历史商品类目编码进行商品类目依赖和层次特征映射;分类预测模块用于基于映射结果计算出欧式空间距离和双曲空间距离,对欧式空间距离和双曲空间距离进行动态加权处理,得到与历史商品文本对应的分类结果;基于所述数据集对所述神经网络模型进行训练,得到商品分类模型,以通过所述商品分类模型实现商品分类。

41、本技术实施例提供的技术方案带来的有益效果包括:

42、通过包括上下文特征对象、因果词以及商品文本因果推理特征对象的因果增强学习模板对待分类商品文本进行拼接处理,以使商品分类模型能够充分理解预测目标,且通过对目标序列进行动态加权来实现上下文层面与因果推理层面的动态语义融合;同时通过引入欧式空间和双曲空间的距离加权,以充分利用商品标签的语义和层次结构信息,进而能够准确实现商品类目的自动分类,而无需人工进行商品类目分类,其不仅有效确保了商品分类效率,且有效提高了商品类目预测准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1