一种商品分类推荐方法、装置及电子设备与流程

文档序号:37595224发布日期:2024-04-18 12:31阅读:3来源:国知局
一种商品分类推荐方法、装置及电子设备与流程

本技术涉及数据处理,特别涉及一种商品分类推荐方法、装置及电子设备。


背景技术:

1、商品税收分类编码是指在增值税发票开具中,发票的票面上的商品应与相关部门核定的税收编码进行关联,并按分类编码上注明的税率和征收率开具发票。商品税收分类编码有利于相关部门统计、筛选、分析、比对数据,从而加强管理。

2、现阶段商品税收分类编码,需要相关人员在开票时根据开票商品进行选择,选择后确定商品的征收税率。但由于现在商品分类有4600多种,相关人员很容易出现选择错误的问题,这就增加错误开票的风险。

3、相关技术中,商品分类推荐方法大多基于历史开票数据根据机器学习方法进行推荐,这就导致历史开票数据中不存在的商品还是很容易出现选择错误的问题。并且在历史开票数据量较少的情况下,相关技术中的商品分类推荐方法还存在准确率较低的问题。


技术实现思路

1、本技术实施例提供了一种商品分类推荐方法、装置及电子设备,用以解决相关技术中的商品分类推荐方法存在的准确率较低的问题。

2、第一方面,本技术实施例提供了一种商品分类推荐方法,包括:

3、获取待分类商品所属的目标对象的经营范围信息和所述待分类商品的商品名称;所述目标对象的经营范围信息表征所述目标对象的业务类别;

4、基于预先划分的多个对象集合,以及所述目标对象的经营范围信息,确定所述目标对象所属的目标对象集合;所述多个对象集合是基于聚类算法对多个对象的经营范围信息进行聚类得到的;

5、基于预设的对象集合与商品分类模型之间的映射关系,确定所述目标对象集合对应的目标商品分类模型;

6、基于所述待分类商品的商品名称,通过所述目标商品分类模型,得到所述待分类商品的至少一个推荐分类。

7、一种可能的实现方式中,所述多个对象集合是通过以下方法划分的:针对所述多个对象中的任意一个对象,分别执行以下操作,得到多个词向量集:获取所述任意一个对象的经营范围信息;基于所述任意一个对象的经营范围信息,确定所述任意一个对象的词向量集;基于确定的各对象的所述词向量集,通过聚类算法将所述多个对象划分为多个对象集合。

8、一种可能的实现方式中,所述基于确定的各对象的所述词向量集,通过聚类算法将所述多个对象划分为多个对象集合,包括:在所述多个对象各自的词向量集中随机选择k个词向量集作为初始的簇中心;k为大于1的整数;重复执行基于每两个对象的词向量集之间的距离,将所述多个对象各自的词向量集分别分配至k个簇中,并重新计算簇中心的操作,直至簇中心的变化幅度小于预设幅度阈值时,将所述多个对象划分为k个簇;其中,一个簇为一个对象集合。

9、一种可能的实现方式中,所述基于所述任意一个对象的经营范围信息,确定所述任意一个对象的词向量集,包括:对所述任意一个对象的经营范围信息,进行分词处理,得到多个经营范围关键词;针对所述多个经营范围关键词中的任意一个经营范围关键词,分别基于所述任意一个经营范围关键词在所述多个对象各自对应的经营范围关键词中的词频和所述任意一个经营范围关键词的预设权重,确定所述任意一个经营范围关键词的词向量;将确定的所述多个经营范围关键词各自的词向量组合为所述任意一个对象的词向量集。

10、一种可能的实现方式中,所述基于预先划分的多个对象集合,以及所述目标对象的经营范围信息,确定所述目标对象所属的目标对象集合,包括:基于所述目标对象的经营范围信息,确定所述目标对象的词向量集;基于所述目标对象的词向量集,确定所述目标对象与所述k个簇各自的簇中心的距离,得到k个距离;将所述k个距离中最小值对应的目标簇,作为所述目标对象所属的目标对象集合。

11、一种可能的实现方式中,基于预设的对象集合与商品分类模型之间的映射关系,确定所述目标对象集合对应的目标商品分类模型,包括:基于预设的对象集合与对象类别之间的映射关系,确定所述目标对象集合对应的目标对象类别;基于预设的对象类别与商品分类模型之间的映射关系,确定所述目标对象类别对应的目标商品分类模型。

12、一种可能的实现方式中,所述商品分类模型是通过以下方法训练的:针对所述k个对象集合中任意一个对象集合对应的商品分类模型,分别执行以下操作:获取所述任意一个对象集合对应的参考商品分类模型的样本集,并将所述样本集包括的多个样本分为训练集和验证集;所述样本集包括多个样本和每个样本对应的商品分类,所述多个样本分别为属于所述任意一个对象集合的至少一个对象各自经营的各个商品的商品信息;所述验证集和所述训练集包括的样本不完全相同;针对所述训练集中的任意一个样本,分别执行以下操作,得到候选商品分类模型:利用所述参考商品分类模型包括的至少一个学习器,对所述任意一个样本进行特征提取,得到所述任意一个训练样本对应的参考特征向量;其中,不同学习器的结构不同;利用多个串联的transformer层和softmax层,确定所述参考特征向量的预测分类;根据所述预测分类和所述任意一个样本对应的商品分类之间的比较结果,对所述参考商品分类模型的参数进行调整;通过所述验证集中包括的多个样本对所述候选商品分类模型进行评估,并根据评估结果,对所述候选商品分类模型的参数进行调整,直至满足预设条件时,得到训练后的参考商品分类模型。

13、一种可能的实现方式中,所述多个样本是通过以下方法得到的:在所述k个簇中,确定所述任意一个对象集合对应的簇,并确定所述任意一个对象集合对应的簇包括的各个对象;针对所述任意一个对象集合对应的簇包括的各个对象中的任意一个对象,分别执行以下操作,得到多个样本:基于所述任意一个对象的历史开票数据,得到所述任意一个对象经营的至少一个商品的商品信息;所述商品信息包括商品名称和商品分类;将所述至少一个商品中的每个商品的商品信息,均作为一个样本,得到至少一个样本。

14、一种可能的实现方式中,所述通过所述验证集中包括的多个样本对所述候选商品分类模型进行评估,并根据评估结果,对所述候选商品分类模型的参数进行调整,直至满足预设条件时,得到训练后的参考商品分类模型,包括:重复执行以下操作,直至精确度不低于预设精确度阈值,得到训练后的参考商品分类模型:将所述验证集包括的多个样本分别输入所述候选商品分类模型,得到每个样本的预测推荐分类;基于各个样本的商品分类和得到的各个样本的预测推荐分类,确定所述候选商品分类模型的精确度,并在所述精确度低于预设精确度阈值时,调整所述候选商品分类模型的模型参数。

15、第二方面,本技术实施例提供了一种商品分类推荐装置,包括:

16、获取单元,用于获取待分类商品所属的目标对象的经营范围信息和所述待分类商品的商品名称;所述目标对象的经营范围信息表征所述目标对象的业务类别;

17、处理单元,用于执行以下操作:基于预先划分的多个对象集合,以及所述目标对象的经营范围信息,确定所述目标对象所属的目标对象集合;所述多个对象集合是基于聚类算法对多个对象的经营范围信息进行聚类得到的;基于预设的对象集合与商品分类模型之间的映射关系,确定所述目标对象集合对应的目标商品分类模型;基于所述待分类商品的商品名称,通过所述目标商品分类模型,得到所述待分类商品的至少一个推荐分类。

18、一种可能的实现方式中,所述多个对象集合是处理单元通过以下方法划分的:针对所述多个对象中的任意一个对象,分别执行以下操作,得到多个词向量集:获取所述任意一个对象的经营范围信息;基于所述任意一个对象的经营范围信息,确定所述任意一个对象的词向量集;基于确定的各对象的所述词向量集,通过聚类算法将所述多个对象划分为多个对象集合。

19、一种可能的实现方式中,所述处理单元基于确定的各对象的所述词向量集,通过聚类算法将所述多个对象划分为多个对象集合时,具体用于:在所述多个对象各自的词向量集中随机选择k个词向量集作为初始的簇中心;k为大于1的整数;重复执行基于每两个对象的词向量集之间的距离,将所述多个对象各自的词向量集分别分配至k个簇中,并重新计算簇中心的操作,直至簇中心的变化幅度小于预设幅度阈值时,将所述多个对象划分为k个簇;其中,一个簇为一个对象集合。

20、一种可能的实现方式中,所述处理单元基于所述任意一个对象的经营范围信息,确定所述任意一个对象的词向量集时,具体用于:对所述任意一个对象的经营范围信息,进行分词处理,得到多个经营范围关键词;针对所述多个经营范围关键词中的任意一个经营范围关键词,分别基于所述任意一个经营范围关键词在所述多个对象各自对应的经营范围关键词中的词频和所述任意一个经营范围关键词的预设权重,确定所述任意一个经营范围关键词的词向量;将确定的所述多个经营范围关键词各自的词向量组合为所述任意一个对象的词向量集。

21、一种可能的实现方式中,所述处理单元基于预先划分的多个对象集合,以及所述目标对象的经营范围信息,确定所述目标对象所属的目标对象集合时,具体用于:基于所述目标对象的经营范围信息,确定所述目标对象的词向量集;基于所述目标对象的词向量集,确定所述目标对象与所述k个簇各自的簇中心的距离,得到k个距离;将所述k个距离中最小值对应的目标簇,作为所述目标对象所属的目标对象集合。

22、一种可能的实现方式中,所述处理单元基于预设的对象集合与商品分类模型之间的映射关系,确定所述目标对象集合对应的目标商品分类模型时,具体用于:基于预设的对象集合与对象类别之间的映射关系,确定所述目标对象集合对应的目标对象类别;基于预设的对象类别与商品分类模型之间的映射关系,确定所述目标对象类别对应的目标商品分类模型。

23、一种可能的实现方式中,所述商品分类模型是处理单元通过以下方法训练的:针对所述k个对象集合中任意一个对象集合对应的商品分类模型,分别执行以下操作:获取所述任意一个对象集合对应的参考商品分类模型的样本集,并将所述样本集包括的多个样本分为训练集和验证集;所述样本集包括多个样本和每个样本对应的商品分类,所述多个样本分别为属于所述任意一个对象集合的至少一个对象各自经营的各个商品的商品信息;所述验证集和所述训练集包括的样本不完全相同;针对所述训练集中的任意一个样本,分别执行以下操作,得到候选商品分类模型:利用所述参考商品分类模型包括的至少一个学习器,对所述任意一个样本进行特征提取,得到所述任意一个训练样本对应的参考特征向量;其中,不同学习器的结构不同;利用多个串联的transformer层和softmax层,确定所述参考特征向量的预测分类;根据所述预测分类和所述任意一个样本对应的商品分类之间的比较结果,对所述参考商品分类模型的参数进行调整;通过所述验证集中包括的多个样本对所述候选商品分类模型进行评估,并根据评估结果,对所述候选商品分类模型的参数进行调整,直至满足预设条件时,得到训练后的参考商品分类模型。

24、一种可能的实现方式中,所述多个样本是处理单元通过以下方法得到的:在所述k个簇中,确定所述任意一个对象集合对应的簇,并确定所述任意一个对象集合对应的簇包括的各个对象;针对所述任意一个对象集合对应的簇包括的各个对象中的任意一个对象,分别执行以下操作,得到多个样本:基于所述任意一个对象的历史开票数据,得到所述任意一个对象经营的至少一个商品的商品信息;所述商品信息包括商品名称和商品分类;将所述至少一个商品中的每个商品的商品信息,均作为一个样本,得到至少一个样本。

25、一种可能的实现方式中,所述处理单元通过所述验证集中包括的多个样本对所述候选商品分类模型进行评估,并根据评估结果,对所述候选商品分类模型的参数进行调整,直至满足预设条件时,得到训练后的参考商品分类模型时,具体用于:重复执行以下操作,直至精确度不低于预设精确度阈值,得到训练后的参考商品分类模型:将所述验证集包括的多个样本分别输入所述候选商品分类模型,得到每个样本的预测推荐分类;基于各个样本的商品分类和得到的各个样本的预测推荐分类,确定所述候选商品分类模型的精确度,并在所述精确度低于预设精确度阈值时,调整所述候选商品分类模型的模型参数。

26、第三方面,本技术实施例提供了一种电子设备,包括:

27、存储器,用于存储计算机指令;

28、处理器,与所述存储器连接,用于执行所述存储器中的计算机指令,且在执行所述计算机指令时实现如第一方面中任一项所述的方法。

29、第四方面,本技术实施例提供了一种计算机可读存储介质,包括:

30、所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如第一方面中任一项所述的方法。

31、本技术有益效果如下:

32、本技术实施例提供了一种商品分类推荐方法、装置、设备及存储介质,该方法包括:获取待分类商品所属的目标对象的经营范围信息和所述待分类商品的商品名称。基于预先划分的多个对象集合,以及所述目标对象的经营范围信息,确定所述目标对象所属的目标对象集合;基于预设的对象集合与商品分类模型之间的映射关系,确定所述目标对象集合对应的目标商品分类模型;基于所述待分类商品的商品名称,通过所述目标商品分类模型,得到所述待分类商品的至少一个推荐分类。

33、本技术实施例中,多个对象集合是在训练时利用了各个对象经营范围信息,通过聚类来划分的。然后在进行商品分类推荐时,先确定目标对象所属的目标对象集合,再利用目标对象集合对应的目标商品分类模型得到待分类商品的至少一个推荐分类。由于结合了商品名称和对象的经营范围信息,因此相较于相关技术中仅使用已有的发票数据,通过不同技术方法构建商品名称分类模型,实现对待分类商品名称进行分类的方案而言,提高了准确率。

34、本技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本技术而了解。本技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1