类目分类方法、装置、电子设备和存储介质与流程

文档序号:29913605发布日期:2022-05-06 02:45阅读:136来源:国知局
类目分类方法、装置、电子设备和存储介质与流程

1.本公开涉及计算机技术领域,尤其涉及一种类目分类方法、装置、电子设备和存储介质。


背景技术:

2.电商商品库是电商售卖的核心基石。现有的各大互联网电商平台,都需要建立自己的电商商品库,每日通过平台对外发布可销售的商品信息,由用户进入平台进行选择交易。其中,在商品审核发布阶段,平台需要对商家发布的商品进行审核,包括识别商家发布的商品信息中类目是否挂载正确。
3.相关技术中,平台通过人工审核的方式识别商家发布的商品信息中类目,但是人工审核的方式效率低且准确率不高。


技术实现要素:

4.本公开提供一种类目分类方法、装置、电子设备和存储介质,以至少解决相关技术中电商平台人工审核效率低且正确率不高的问题。本公开的技术方案如下:
5.根据本公开实施例的第一方面,提供一种类目分类方法,包括:获取视频数据;其中,视频数据中包括商品信息;对视频数据进行处理,生成商品信息的商品特征向量;根据商品特征向量和多个目标类目预测表,确定商品信息对应的目标层级类目;其中,每个目标类目预测表中包括多个类目向量,每个目标类目预测表对应一个类目层级,不同目标类目预测表中的类目向量之间具有树状关系。由此,能够提高类目分类的准确率。
6.根据本公开实施例的第二方面,提供一种类目分类装置,包括:数据采集单元,用于获取视频数据;其中,所述视频数据中包括商品信息;数据处理单元,用于对所述视频数据进行处理,生成所述商品信息的商品特征向量;类目确定单元,用于根据所述商品特征向量和多个目标类目预测表,确定所述商品信息对应的目标层级类目;其中,每个所述目标类目预测表中包括多个类目向量,每个所述目标类目预测表对应一个类目层级,不同所述目标类目预测表中的所述类目向量之间具有树状关系。
7.根据本公开实施例的第三方面,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如上述第一方面所述的类目分类方法。
8.根据本公开实施例的第四方面,提供一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如上述第一方面所述的类目分类方法。
9.根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上面第一方面所述的类目分类方法。
10.本公开的实施例提供的技术方案至少带来以下有益效果:
11.本公开实施例中提供的类目分类方法,通过实施本公开实施例提供的类目分类方法,获取视频数据;其中,视频数据中包括商品信息;对视频数据进行处理,生成商品信息的
商品特征向量;根据商品特征向量和多个目标类目预测表,确定商品信息对应的目标层级类目;其中,每个目标类目预测表中包括多个类目向量,每个目标类目预测表对应一个类目层级,不同目标类目预测表中的类目向量之间具有树状关系。由此,能够提高类目分类的准确率。
12.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
13.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
14.图1是根据一示例性实施例示出的一种类目分类方法的流程图;
15.图2是根据一示例性实施例示出的另一种类目分类方法的流程图;
16.图3是根据一示例性实施例示出的又一种类目分类方法的流程图;
17.图4是根据一示例性实施例示出的又一种类目分类方法的流程图;
18.图5是根据一示例性实施例示出的又一种类目分类方法的流程图;
19.图6是根据一示例性实施例示出的一种类目分类装置的结构图;
20.图7是根据一示例性实施例示出的一种类目分类装置的类目确定单元的结构图;
21.图8是根据一示例性实施例示出的一种类目分类装置的数据处理单元的结构图;
22.图9是根据一示例性实施例示出的另一种类目分类装置的数据处理单元的结构图;
23.图10是根据一示例性实施例示出的另一种类目分类装置的结构图;
24.图11是根据一示例性实施例示出的又一种类目分类装置的结构图;
25.图12是根据一示例性实施例示出的一种类目分类装置的更新单元的结构图;
26.图13是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
27.为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
28.除非上下文另有要求,否则,在整个说明书和权利要求书中,术语“包括”被解释为开放、包含的意思,即为“包含,但不限于”。在说明书的描述中,术语“一些实施例”等旨在表明与该实施例或示例相关的特定特征、结构、材料或特性包括在本公开的至少一个实施例或示例中。上述术语的示意性表示不一定是指同一实施例或示例。此外,所述的特定特征、结构、材料或特点可以以任何适当方式包括在任何一个或多个实施例或示例中。
29.需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
30.以下,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
31.需要说明的是,本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
32.需要说明的是,本公开实施例的类目分类方法可以由本公开实施例的类目分类装置执行,该类目分类装置可以由软件和/或硬件的方式实现,该类目分类装置可配置在电子设备中,其中,电子设备可以安装并运行类目分类程序。其中,电子设备可以包括但不限于智能手机、平板电脑等具有各种操作系统的硬件设备。
33.图1是根据一示例性实施例示出的一种类目分类方法的流程图。
34.如图1所示,包括但不限于以下步骤:
35.s1:获取视频数据;其中,视频数据中包括商品信息。
36.随着互联网技术的不断发展,越来越多的电商平台提供网络直播进行商品售卖,其利用视讯方式进行网上现场直播,将产品展示等内容发布到互联网上,利用互联网的直观、快速,表现形式好、内容丰富、交互性强、地域不受限制等特点,加强商品推广效果。并且在直播完成后,还可以随时提供重播、点播,有效延长了直播的时间和空间,发挥直播内容的最大价值。但是,随着入驻电商平台的商家越来越多,不同直播、重播等视频所展示的商品繁多,为了方便用户能够快速访问对应商品的视频,需要根据视频所展示的商品依照类目进行分类。
37.本公开实施例中,获取视频数据,可以是获取正在直播或者重播的视频数据,也可以是获取正在直播或者重播的特定时间段内的视频数据。
38.可以理解的是,视频数据包括目标图像和/或目标文本,目标图像中可以包括商品信心,例如:图像、文字说明等,目标文本可以包括商品信息,例如:语音介绍商品的音频信息等。
39.s2:对视频数据进行处理,生成商品信息的商品特征向量。
40.本公开实施例中对获取的视频数据进行处理,生成商品信息的商品特征向量。
41.其中,对视频数据进行处理可以为通过任意深度学习模型处理,编码为特定长度的商品特征向量。
42.s3:根据商品特征向量和多个目标类目预测表,确定商品信息对应的目标层级类目;其中,每个目标类目预测表中包括多个类目向量,每个目标类目预测表对应一个类目层级,不同目标类目预测表中的类目向量之间具有树状关系。
43.可以理解的是,多个目标类目预测表对应的多个类目层级,可以包括两个类目层级或者两个以上类目层级,本公开对此不做具体限制。示例性的:多个类目层级包括三个层级,例如:一级类目包括“服饰”等,二级类目包括“男装”等,三级类目包括“牛仔裤”等。
44.其中,不同类目层级之间具有层级的树状关系,例如:一级类目为“服饰”,一级类目“服饰”对应的二级类目可以有“男装”、“女装”等,一级类目可以对应一个或多个二级类目,二级类目也可以对应一个或多个三级类目,以此类推,具有层级的树状关系。
45.本公开实施例中,预先将类目层级中的类目进行处理,生成类目向量,之后将生成
的类目向量汇总生成对应层级的目标类目预测表,本公开实施例中对类目进行处理生成类目向量的方法可以与对视频数据进行处理,生成商品信息的商品特征向量的方法相同。
46.示例性的,将一级类目中的至少一个类目生成类目向量,之后汇总生成一级类目对应的目标类目预测表;将二级类目中的至少一个类目生成类目向量,之后汇总生成二级类目对应的目标类目预测表等。
47.可以理解的是,本公开实施例中,根据商品特征向量和多个目标类目预测表,确定商品信息对应的目标层级类目,其中,目标层级类目可以包括全部层级的类目信息,示例性的,在类目层级包括四个层级的情况下,确定商品信息对应的目标层级类目,包括对应的一级类目、二级类目、三级类目和四级类目。
48.通过实施本公开实施例提供的类目分类方法,获取视频数据;其中,视频数据中包括商品信息;对视频数据进行处理,生成商品信息的商品特征向量;根据商品特征向量和多个目标类目预测表,确定商品信息对应的目标层级类目;其中,每个目标类目预测表中包括多个类目向量,每个目标类目预测表对应一个类目层级,不同目标类目预测表中的类目向量之间具有树状关系。由此,利用层级类目的树状关系,借鉴排序召回的方法实现类目分类,能够提高类目分类的准确率。
49.图2是根据一示例性实施例示出的另一种类目分类方法的流程图。
50.如图2所示,包括但不限于以下步骤:
51.s21:获取视频数据;其中,视频数据中包括商品信息。
52.本公开实施例中s21的描述说明可以参见上述实施例中的s1中的描述,此处不再赘述。
53.s22:对视频数据进行处理,生成商品信息的商品特征向量。
54.在一些实施例中,对视频数据进行处理,生成商品信息的商品特征向量,包括:对视频数据进行视频抽帧,获取目标图像;其中,目标图像中包括商品信息;将目标图像输入至训练好的图像处理模型,生成商品信息的商品特征向量。
55.可以理解的是,对于达人直播带货的场景中,其直播的视频数据或录制的直播视频数据,在对商品进行介绍时,视频的图像中会包含商品的外观图像、商品的简介等信息,且可以想到的是,在对商品进行介绍时,在同一时间只会对同一商品进行介绍,对视频数据进行视频抽帧,其在某一帧图像中,只会包含一种商品的商品信息。
56.本公开实施例中,在获取到目标图像之后,将目标图像输入至训练好的图像处理模型,图像处理模型可以为残差网络和视觉变换vision transformer网络模型,从而可以得到目标图像中包括的商品信息的商品特征向量。
57.在另一些实施例中,对视频数据进行处理,生成商品信息的商品特征向量,包括:对视频数据进行语音识别,获取目标文本;其中,目标文本中包括商品信息;将目标文本输入至训练好的深度语言表示模型,生成商品信息的商品特征向量。
58.可以理解的是,对于达人直播带货的场景中,其直播的视频数据或录制的直播视频数据,商家会对商品进行介绍,以及答复用户询问的关于产品的相关问题,目标文本中包括商品的商品信息等。
59.本公开实施例中,对视频数据进行语音识别,获取目标文本;其中,目标文本中包括商品信息;将目标文本输入至训练好的深度语言表示模型,生成商品信息的商品特征向
量,从而可以得到目标图像中包括的商品信息的商品特征向量。
60.在又一些实施例中,对视频数据进行处理,生成商品信息的商品特征向量,包括:对视频数据进行视频抽帧,获取目标图像;其中,目标图像中包括商品信息;对视频数据进行语音识别,获取目标文本;其中,目标文本中包括商品信息;将目标图像输入至训练好的图像处理模型,生成图像特征向量;将目标文本输入至训练好的深度语言表示模型,生成文本特征向量;将图像特征向量和文本特征向量进行连接,生成商品信息的商品特征向量。
61.本公开实施例中,在对视频数据进行视频抽帧得到目标图像,在视频数据进行语音识别得到目标文本的情况下,将视频数据中的目标图像输入至残差网络和视觉变换vision transformer网络,生成图像特征向量;将视频数据中的目标文本输入至深度语言表示模型,生成文本特征向量;将图像特征向量和文本特征向量进行连接,生成商品特征向量;其中,输入目标图像在目标文本对应位置添加占位符,共同生成商品特征向量。
62.本公开实施例中,目标图像和目标文本之间存在语义关联关系,目标图像与目标文本是成对存在的。
63.本公开实施例中,分别对目标图像和目标文本进行不同的处理,生成图像特征向量和文本特征向量,进一步,通过连接两个或多个数组concat()的方法,将图像特征向量和文本特征向量进行连接,生成商品特征向量。
64.s23:分别计算商品特征向量与第一个类目层级的目标类目预测表中的多个一级类目向量之间的相似度,确定商品特征向量对应的多个目标一级类目向量。
65.本公开实施例中,计算商品特征向量与第一个类目层级的目标类目预测表中的多个一级类目向量之间的相似度,可以为计算商品特征向量与第一个类目层级的目标类目预测表中的多个一级类目向量之间的余弦距离。
66.s24:根据目标一级类目向量获取第二个类目层级的目标类目预测表中的多个二级类目向量,并基于商品特征向量与确定的多个二级类目向量之间的相似度,确定商品特征向量对应的多个目标二级类目向量。
67.s25:以此类推,直至分别计算商品特征向量与确定的多个n级类目向量的相似度,确定商品特征向量对应的一个目标n级类目向量;其中,n为目标类目预测表的个数。
68.s26:根据目标n级类目向量,确定商品信息的目标层级类目。
69.本公开实施例中,根据商品特征向量和多个目标类目预测表,确定商品信息对应的目标层级类目,依次逐层对比商品特征向量和不同类目层级对应的目标类目预测表,根据不同目标类目预测表中的类目向量之间的树状关系,对应树的每一层,采用beam search的方法,依次确定商品特征向量对应的不同类目层级的多个类目向量,beam search包含一个参数束宽,表示每一时刻均保留得分最高的束宽个序列,然后下一时刻用这束宽个序列继续生成,束宽取值大于等于2。
70.其中,依次确定商品特征向量对应的不同类目层级的多个目标类目向量,确定的目标类目向量的个数为beam search的束宽。本公开实施例中,采用beam search的方法,能够结合类目层级之间具有层级的树状关系确定目标类目,提高类目分类的准确率。
71.为了方便理解,本公开实施例提供如下实施例:
72.商品的类目层级包括四个层级,其中,第一层级包括10个一级类目,第二层级包括50个二级类目,第三层级包括500个三级类目,第四层级包括1000个四级类目。第一层级的
10个一级类目生成对应个数的一级类目向量,存储在第一类目层级的目标类目预测表中,第二层级的50个二级类目生成对应个数的二级类目向量,存储在第二类目层级的目标类目预测表中,第三层级的500个三级类目生成对应个数的三级类目向量,存储在第三类目层级的目标类目预测表中。
73.首先需要获取商品特征向量和四个目标类目预测表,其获取的方法具体可参见上述示例的描述,此处不再赘述。本公开实施例中,采用beam search的方法,beam search的束宽可以为2。
74.本公开实施例中,根据商品特征向量和多个目标类目预测表,确定商品信息对应的目标层级类目的方法,如下:
75.第一步:分别计算商品特征向量与第一个类目层级的目标类目预测表中的10个一级类目向量之间的相似度,确定商品特征向量对应的2个目标一级类目向量。
76.第二步:本公开实施例中,根据2个目标一级类目向量获取第二个类目层级的目标类目预测表中的多个二级类目向量,并基于商品特征向量与确定的多个二级类目向量之间的相似度,确定商品特征向量对应的2个目标二级类目向量。
77.可以理解的是,不同目标类目预测表中的类目向量之间具有树状关系。一级类目与二级类目存在树状关系,能够根据确定的2个目标一级类目向量,确定多个二级类目向量,其中,二级类目向量的个数,与确定的目标一级类目存在多少个树状关系的二级类目向量。
78.第三步:本公开实施例中,根据2个目标二级类目向量获取第三个类目层级的目标类目预测表中的多个三级类目向量,并基于商品特征向量与确定的多个三级类目向量之间的相似度,确定商品特征向量对应的2个目标三级类目向量。
79.第四步:本公开实施例中,根据2个目标三级类目向量获取第四个类目层级的目标类目预测表中的多个四级类目向量,并基于商品特征向量与确定的多个四级类目向量之间的相似度,确定商品特征向量对应的1个目标四级类目向量。
80.可以理解的是,在本公开的示例中,商品的类目层级包括四个层级,在最后一个类目层级的相似度计算时,最终确定一个类目向量。
81.第四步:根据目标四级类目向量,确定商品信息的目标层级类目。
82.可以理解的是,目标四级类目向量对应的四级类目,由于不同目标类目预测表中的类目向量之间具有树状关系,可根据目标四级类目向量依次确定目标三级类目向量、目标二级类目向量和目标一级类目向量,从而得到商品信息对应的目标层级类目。本公开实施例中,采用beam search的方法,能够结合类目层级之间具有层级的树状关系确定目标类目,类目分类的准确率高。
83.如图3所示,在一些实施例中,本公开实施例提供的类目分类方法,还包括:
84.s31:随机初始化多个样本类目预测表;其中,样本类目预测表中包括多个样本类目向量,每个样本类目预测表对应一个类目层级,不同样本类目预测表中的样本类目向量之间具有树状关系。
85.本公开实施例中,随机初始化多个样本类目预测表,样本类目预测表中包括多个样本类目向量,样本类目向量的长度为特定长度,每个样本类目预测表对应一个类目层级,不同样本类目预测表中的样本类目向量之间具有树状关系。
86.s32:获取训练样本集;训练样本集包括多个样本商品信息和样本商品信息对应的样本层级类目。
87.其中,训练样本集中包括至少一组标注有样本层级类目的样本商品信息,在样本商品信息为样本图文对,样本图文对包括样本图像和样本文本,样本图像和样本文本是成对存在的,二者之间存在语义关联。或者,样本商品信息为样本图像,训练样本集中包括至少一组标注有样本层级类目的样本图像;或者,样本商品信息为样本文本,训练样本集中包括至少一组标注有样本层级类目的样本文本。
88.本公开实施例中,对样本图像和/或样本文本标注样本层级类目可以采用人工标注的方式,或者其他任意可以实现的方式,本公开实施例对此不作具体限制。
89.s33:对样本商品信息进行处理,生成样本商品信息的样本商品特征向量。
90.可以理解的是,样本商品信息可以为样本图文对或者样本图像或者样本文本,本公开实施例中,对样本商品信息进行处理,生成样本商品信息的样本商品特征向量的方法,可以参见上述示例中的对视频数据进行处理,生成商品信息的商品特征向量的方法,对于样本商品信息和视频数据中的数据格式相同的情况,采用相同的处理方法,从而得到样本商品信息的样本商品特征向量,此处不再赘述。
91.s34:根据样本商品特征向量和多个样本类目预测表,确定样本商品信息对应的预测目标层级类目。
92.本公开实施例中,根据样本商品特征向量和多个样本类目预测表,确定样本商品信息对应的预测目标层级类目的方法,可以参见上述示例中的根据商品特征向量和多个目标类目预测表,确定商品信息对应的目标层级类目的方法的相关描述,此处不再赘述。
93.s35:根据预测目标层级类目和样本层级类目,计算样本损失值。
94.可以理解的是,本公开实施例中,在确定样本商品信息对应的预测目标层级类目之后,根据预测目标层级类目和预先标注的样本层级类目,计算样本损失值。
95.s36:根据样本损失值更新样本类目预测表,生成目标类目预测表。
96.本公开实施例中,依次根据训练数据集中的每组样本特征向量和标注的样本层级类目,执行根据样本商品特征向量和多个样本类目预测表,确定样本商品信息对应的预测目标层级类目,根据预测目标层级类目和样本层级类目,计算样本损失值;根据样本损失值更新样本类目预测表,生成目标类目预测表的过程,其中,将根据前一组样本特征向量和标注的样本层级类目执行上述过程,得到的目标类目预测表作为下一组样本特征向量和标注的样本层级类目使用的样本类目预测表。从而,使用训练数据集中的多组样本特征向量和标注的样本层级类目,生成目标类目预测表,且生成的目标类目预测表,用于对商品信息进行类目分类的准确度较高。
97.在一些实施例中,在将样本商品信息输入至图像处理模型,生成样本商品信息的样本商品特征向量的情况下,根据样本损失值更新图像处理模型,生成训练好的图像处理模型;
98.或者,在将样本商品信息输入至深度语言表示模型,生成样本商品信息的样本商品特征向量的情况下,根据样本损失值更新深度语言表示模型,生成训练好的深度语言表示模型;
99.或者,在将样本商品信息输入至图像处理模型和深度语言表示模型,生成样本商
品信息的样本商品特征向量的情况下,根据样本损失值更新图像处理模型和深度语言表示模型,生成训练好的图像处理模型和训练好的深度语言表示模型。
100.本公开实施例中,对于不同格式的样本商品信息,使用不同的向量生成模型,在根据样本损失值更新样本类目预测表的同时,对不同格式的样本商品信息使用的不同向量生成模型同步进行更新,从而能够得到训练好的针对不同格式的样本商品信息使用的向量生成模型,从而能够应用于后续根据视频数据生成商品特征向量的过程中,使得能够准确得到视频数据中的商品信息对应的目标层级类目。
101.需要说明的是,本公开实施例的上述示例的描述说明,可参见上述示例中的相关描述,此处不再赘述。
102.如图4所示,在一些实施例中,本公开实施例提供的类目分类方法,还包括:
103.s4:根据新增类目和/或减少类目,对目标类目预测表进行更新。
104.本公开实施例中,在存在新增类目和/减少类目的情况下,对目标类目预测表进行更新,从而能够得到更新后的目标类目预测表,以使更新后的目标类目预测表应用于根据商品特征向量确定对应的目标层级类目时,确定的目标层级类目更加准确;且在存在新增类目和/减少类目时,能够快速更新,本公开实施例提供的类目分类方法可扩展性强。
105.如图5所示,在一些实施例中,s41包括:
106.s41:随机初始化多个新增样本类目预测表;其中,新增样本类目预测表中包括多个新增样本类目向量,每个新增样本类目预测表对应一个类目层级,不同新增样本类目预测表中的新增样本类目向量之间具有树状关系。
107.本公开实施例中,本公开实施例中,随机初始化多个新增样本类目预测表,新增样本类目预测表中包括多个新增样本类目向量,新增样本类目向量的长度为特定长度,每个新增样本类目预测表对应一个类目层级,不同新增样本类目预测表中的新增样本类目向量之间具有树状关系。
108.s42:获取新增类目的新增训练样本集;新增训练样本集包括多个新增样本商品信息和新增样本商品信息对应的新增样本层级类目。
109.其中,新增训练样本集中包括至少一组标注有新增样本层级类目的新增样本商品信息,在新增样本商品信息为新增样本图文对,新增样本图文对包括新增样本图像和新增样本文本,新增样本图像和新增样本文本是成对存在的,二者之间存在语义关联。或者,新增样本商品信息为新增样本图像,新增训练样本集中包括至少一组标注有新增样本层级类目的新增样本图像;或者,新增样本商品信息为新增样本文本,新增训练样本集中包括至少一组标注有新增样本层级类目的新增样本文本。
110.本公开实施例中,对新增样本图像和/或新增样本文本标注新增样本层级类目可以采用人工标注的方式,或者其他任意可以实现的方式,本公开实施例对此不作具体限制。
111.s43:对新增样本商品信息进行处理,生成新增样本商品信息的新增样本商品特征向量。
112.可以理解的是,新增样本商品信息可以为新增样本图文对或者新增样本图像或者新增样本文本,本公开实施例中,对新增样本商品信息进行处理,生成新增样本商品信息的新增样本商品特征向量的方法,可以参见上述示例中的对视频数据进行处理,生成商品信息的商品特征向量的方法,对于新增样本商品信息和视频数据中的数据格式相同的情况,
采用相同的处理方法,从而得到新增样本商品信息的新增样本商品特征向量,此处不再赘述。
113.s44:根据新增样本商品特征向量和多个新增样本类目预测表,确定新增样本商品信息对应的新增预测目标层级类目。
114.本公开实施例中,根据新增样本商品特征向量和多个新增样本类目预测表,确定新增样本商品信息对应的新增预测目标层级类目的方法,可以参见上述示例中的根据商品特征向量和多个目标类目预测表,确定商品信息对应的目标层级类目的方法的相关描述,此处不再赘述。
115.s45:根据新增预测目标层级类目和新增样本层级类目,计算新增样本损失值。
116.可以理解的是,本公开实施例中,在确定新增样本商品信息对应的新增预测目标层级类目之后,根据新增预测目标层级类目和预先标注的新增样本层级类目,计算新增样本损失值。
117.s46:根据新增样本损失值更新新增样本类目预测表,生成新增目标类目预测表。
118.在一些实施例中,新增目标类目预测表中包括至少一个新增类目向量,根据新增目标类目预测表,对目标类目预测表进行更新,包括:将新增目标类目预测表中的新增类目向量,更新至目标类目预测表中,对目标类目预测表进行更新。本公开实施例中,依次根据新增训练数据集中的每组新增样本特征向量和标注的新增样本层级类目,执行根据新增样本商品特征向量和多个新增样本类目预测表,确定新增样本商品信息对应的新增预测目标层级类目,根据新增预测目标层级类目和新增样本层级类目,计算新增样本损失值;根据新增样本损失值更新新增样本类目预测表,生成新增目标类目预测表的过程,其中,将根据前一组新增样本特征向量和标注的新增样本层级类目执行上述过程,得到的新增目标类目预测表作为下一组新增样本特征向量和标注的新增样本层级类目使用的新增样本类目预测表。从而,使用新增训练数据集中的多组新增样本特征向量和标注的新增样本层级类目,生成新增目标类目预测表。
119.本公开实施例中,在获取到新增目标类目预测表之后,能将新增目标类目预测表与目标类目预测表直接相加,之后得到新的目标类目预测表,就能够完成新增类目对目标类目预测表进行更新,使得到的新的目标类目预测表能够用于对新增类目的目标层级类目的分类,更新速度快,且不会对类目识别精度造成影响。
120.在一些实施例中,根据减少类目,对目标类目预测表进行更新,包括:将减少类目对应的类目向量从目标类目预测表中删除,对目标类目预测表进行更新。
121.在一些实施例中,将减少类目对应的类目向量从目标类目预测表中删除,包括:将减少类目所在的第一目标类目预测表中,减少类目对应的类目向量进行删除;以及根据不同目标类目预测表中类目向量之间的树状关系,将第一目标类目预测表对应的类目层级之后的至少一个第二目标类目预测表中,与第一目标类目向量存在树状关系的类目向量进行删除。
122.示例性实施例中,商品的类目层级包括三个层级,三个层级的类目存在树状的层级关系,第一层级类目包括“服饰”,第一层级类目“服饰”对应的第二层级类目包括“男装”、“女装”,第二层级类目“男装”对应的第三层级类目包括“牛仔裤”、“卫衣”、“外套”,第二层级类目“女装”对应的第三层级类目包括“牛仔裤”、“连衣裙”、“半身裙”,可以理解的是,上
述示例仅作为示意,不作为对本公开实施例的限制。
123.基于上述示例,在减少类目为“男装”的情况下,将第二层级的目标类目预测表中“男装”对应的类目向量进行删除,并且第二级类目“男装”对应的第三层级类目包括“牛仔裤”、“卫衣”、“外套”,在删除第二级类目“男装”对应的类目向量的同时,可以将与其关联的第三层级类目“牛仔裤”、“卫衣”、“外套”对应的类目向量进行删除。
124.可以理解的是,在删除第二层级类目“男装”的情况下,此时,训练好的类目分类模型最终不需要分类获得“男装”,可以简单理解为,此时训练好的类目分类模型只需要对“女装”类目进行分类,而第三层级类目“牛仔裤”、“卫衣”、“外套”对应的第二层级类目均为“男装”,由于不需要对“男装”类目进行分类,此处可以同时将删除的第二层级类目“男装”对应的第三类目“牛仔裤”、“卫衣”、“外套”,能够快速完成减少类目对目标类目预测表的更新。
125.本公开实施例中,对于减少类目,只需要将目标类目预测表中对应的类目向量删除即可,不需要重新获取目标类目预测表,更新速度快,且不会对类目识别精度造成影响,实现目标类目预测表可扩展的目的。
126.图6是根据一示例性实施例示出的一种类目分类装置1框图。参照图6,该装置1包括:数据采集单元11、数据处理单元12和类目确定单元13。
127.数据采集单元11,用于获取视频数据;其中,视频数据中包括商品信息。
128.数据处理单元12,用于对视频数据进行处理,生成商品信息的商品特征向量。
129.类目确定单元13,用于根据商品特征向量和多个目标类目预测表,确定商品信息对应的目标层级类目;其中,每个目标类目预测表中包括多个类目向量,每个目标类目预测表对应一个类目层级,不同目标类目预测表中的类目向量之间具有树状关系。
130.如图7所示,在一些实施例中,类目确定单元13,包括:
131.第一向量确定模块131,用于分别计算商品特征向量与第一个类目层级的目标类目预测表中的多个一级类目向量之间的相似度,确定商品特征向量对应的多个目标一级类目向量。
132.第二向量确定模块132,用于根据目标一级类目向量获取第二个类目层级的目标类目预测表中的多个二级类目向量,并基于商品特征向量与确定的多个二级类目向量之间的相似度,确定商品特征向量对应的多个目标二级类目向量。
133.第三向量确定模块133,用于以此类推,直至分别计算商品特征向量与确定的多个n级类目向量的相似度,确定商品特征向量对应的一个目标n级类目向量;其中,n为目标类目预测表的个数。
134.第一类目确定模块134,用于根据目标n级类目向量,确定商品信息的目标层级类目。
135.如图8所示,在一些实施例中,数据处理单元12,包括:
136.第一处理模块121,用于对视频数据进行视频抽帧,获取目标图像;其中,目标图像中包括商品信息。
137.第二处理模块122,用于将目标图像输入至训练好的图像处理模型,生成商品信息的商品特征向量。
138.请参见图8,在另一些实施例中,数据处理单元12,包括:
139.第一处理模块121,用于对视频数据进行语音识别,获取目标文本;其中,目标文本
中包括商品信息。
140.第二处理模块122,用于将目标文本输入至训练好的深度语言表示模型,生成商品信息的商品特征向量。
141.如图9所示,在又一些实施例中,数据处理单元12,包括:
142.第一处理模块121,用于对视频数据进行视频抽帧,获取目标图像;其中,目标图像中包括商品信息。
143.第二处理模块122,用于对视频数据进行语音识别,获取目标文本;其中,目标文本中包括商品信息。
144.第三处理模块123,用于将目标图像输入至训练好的图像处理模型,生成图像特征向量。
145.第四处理模块124,用于将目标文本输入至训练好的深度语言表示模型,生成文本特征向量;
146.第五处理模块125,用于将图像特征向量和文本特征向量进行连接,生成商品信息的商品特征向量。
147.请参见图10,在一些实施例中,类目分类装置1,还包括:
148.初始化单元14,用于随机初始化多个样本类目预测表;其中,样本类目预测表中包括多个样本类目向量,每个样本类目预测表对应一个类目层级,不同样本类目预测表中的样本类目向量之间具有树状关系。
149.数据集获取单元15,用于获取训练样本集;训练样本集包括多个样本商品信息和样本商品信息对应的样本层级类目。
150.样本处理单元16,用于对样本商品信息进行处理,生成样本商品信息的样本商品特征向量。
151.预测单元17,用于根据样本商品特征向量和多个样本类目预测表,确定样本商品信息对应的预测目标层级类目。
152.计算单元18,用于根据预测目标层级类目和样本层级类目,计算样本损失值。
153.目标生成单元19,用于根据样本损失值更新样本类目预测表,生成目标类目预测表。
154.请参见图11,在一些实施例中,类目分类装置1,还包括:
155.第一模型更新单元20,用于在将样本商品信息输入至图像处理模型,生成样本商品信息的样本商品特征向量的情况下,根据样本损失值更新图像处理模型,生成训练好的图像处理模型;
156.或者,在将样本商品信息输入至深度语言表示模型,生成样本商品信息的样本商品特征向量的情况下,根据样本损失值更新深度语言表示模型,生成训练好的深度语言表示模型;
157.或者,在将样本商品信息输入至图像处理模型和深度语言表示模型,生成样本商品信息的样本商品特征向量的情况下,根据样本损失值更新图像处理模型和深度语言表示模型,生成训练好的图像处理模型和训练好的深度语言表示模型。
158.请再次参见图11,在一些实施例中,类目分类装置1,还包括:
159.更新单元21,用于根据新增类目和/或减少类目,对目标类目预测表进行更新。
160.请参见图12,在一些实施例中,更新单元21,包括:
161.新增初始化模块211,用于随机初始化多个新增样本类目预测表;其中,新增样本类目预测表中包括多个新增样本类目向量,每个新增样本类目预测表对应一个类目层级,不同新增样本类目预测表中的新增样本类目向量之间具有树状关系。
162.新增数据集获取模块212,用于获取新增类目的新增训练样本集;新增训练样本集包括多个新增样本商品信息和新增样本商品信息对应的新增样本层级类目。
163.新增样本处理模块213,用于对新增样本商品信息进行处理,生成新增样本商品信息的新增样本商品特征向量。
164.新增预测模块214,用于根据新增样本商品特征向量和多个新增样本类目预测表,确定新增样本商品信息对应的新增预测目标层级类目。
165.新增计算模块215,用根据新增预测目标层级类目和新增样本层级类目,计算新增样本损失值。
166.新增目标生成模块216,用于根据新增样本损失值更新新增样本类目预测表,生成新增目标类目预测表。
167.请再次参见图12,在一些实施例中,更新单元21,包括:
168.新增目标更新模块217,用于将新增目标类目预测表中的新增类目向量,更新至目标类目预测表中,对目标类目预测表进行更新;其中,新增目标类目预测表中包括至少一个新增类目向量。
169.请再次参见图12,在一些实施例中,更新单元21,包括:
170.第一删除模块218,用于将减少类目对应的类目向量从目标类目预测表中删除,对目标类目预测表进行更新。
171.在一些实施例中,第一删除模块218,具体用于将减少类目所在的第一目标类目预测表中,减少类目对应的类目向量进行删除;以及根据不同目标类目预测表中类目向量之间的树状关系,将第一目标类目预测表对应的类目层级之后的至少一个第二目标类目预测表中,与第一目标类目向量存在树状关系的类目向量进行删除。
172.关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
173.通过实施本公开实施例提供的类目分类方法,数据采集单元11用于获取视频数据;其中,视频数据中包括商品信息;数据处理单元12用于对视频数据进行处理,生成商品信息的商品特征向量;类目确定单元13用于根据商品特征向量和多个目标类目预测表,确定商品信息对应的目标层级类目;其中,每个目标类目预测表中包括多个类目向量,每个目标类目预测表对应一个类目层级,不同目标类目预测表中的类目向量之间具有树状关系。由此,能够提高类目分类的准确率。
174.图13是根据一示例性实施例示出的一种用于类目分类方法或者类目分类模型训练方法的电子设备100的框图。
175.示例性地,电子设备100可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
176.如图13所示,电子设备100可以包括以下一个或多个组件:处理组件101,存储器102,电源组件103,多媒体组件104,音频组件105,输入/输出(i/o)的接口106,传感器组件
107,以及通信组件108。
177.处理组件101通常控制电子设备100的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件101可以包括一个或多个处理器1011来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件101可以包括一个或多个模块,便于处理组件101和其他组件之间的交互。例如,处理组件101可以包括多媒体模块,以方便多媒体组件104和处理组件101之间的交互。
178.存储器102被配置为存储各种类型的数据以支持在电子设备100的操作。这些数据的示例包括用于在电子设备100上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器102可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如sram(static random-access memory,静态随机存取存储器),eeprom(electrically erasable programmable read only memory,带电可擦可编程只读存储器),eprom(erasable programmable read-only memory,可擦除可编程只读存储器),prom(programmable read-only memory,可编程只读存储器),rom(read-only memory,只读存储器),磁存储器,快闪存储器,磁盘或光盘。
179.电源组件103为电子设备100的各种组件提供电力。电源组件103可以包括电源管理系统,一个或多个电源,及其他与为电子设备100生成、管理和分配电力相关联的组件。
180.多媒体组件104包括在所述电子设备100和用户之间的提供一个输出接口的触控显示屏。在一些实施例中,触控显示屏可以包括lcd(liquid crystal display,液晶显示器)和tp(touch panel,触摸面板)。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件104包括一个前置摄像头和/或后置摄像头。当电子设备100处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
181.音频组件105被配置为输出和/或输入音频信号。例如,音频组件105包括一个mic(microphone,麦克风),当电子设备100处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器102或经由通信组件108发送。在一些实施例中,音频组件105还包括一个扬声器,用于输出音频信号。
182.i/o接口2112为处理组件101和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
183.传感器组件107包括一个或多个传感器,用于为电子设备100提供各个方面的状态评估。例如,传感器组件107可以检测到电子设备100的打开/关闭状态,组件的相对定位,例如所述组件为电子设备100的显示器和小键盘,传感器组件107还可以检测电子设备100或电子设备100一个组件的位置改变,用户与电子设备100接触的存在或不存在,电子设备100方位或加速/减速和电子设备100的温度变化。传感器组件107可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件107还可以包括光传感器,如cmos(complementary metal oxide semiconductor,互补金属氧化物半导体)或ccd
(charge-coupled device,电荷耦合元件)图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件107还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
184.通信组件108被配置为便于电子设备100和其他设备之间有线或无线方式的通信。电子设备100可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信组件108经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件108还包括nfc(near field communication,近场通信)模块,以促进短程通信。例如,在nfc模块可基于rfid(radio frequency identification,射频识别)技术,irda(infrared data association,红外数据协会)技术,uwb(ultra wide band,超宽带)技术,bt(bluetooth,蓝牙)技术和其他技术来实现。
185.在示例性实施例中,电子设备100可以被一个或多个asic(application specific integrated circuit,专用集成电路)、dsp(digital signal processor,数字信号处理器)、数字信号处理设备(dspd)、pld(programmable logic device,可编程逻辑器件)、fpga(field programmable gate array,现场可编程逻辑门阵列)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述类目分类方法。需要说明的是,本实施例的电子设备的实施过程和技术原理参见前述对本公开实施例的类目分类方法的解释说明,此处不再赘述。
186.本公开实施例提供的电子设备,可以执行如上面一些实施例所述的类目分类方法,其有益效果与上述的类目分类方法的有益效果相同,此处不再赘述。
187.为了实现上述实施例,本公开还提出一种存储介质。
188.其中,该存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如前所述的类目分类方法。例如,所述存储介质可以是rom(read only memory image,只读存储器)、ram(random access memory,随机存取存储器)、cd-rom(compact disc read-only memory,紧凑型光盘只读存储器)、磁带、软盘和光数据存储设备等。
189.为了实现上述实施例,本公开还提供一种计算机程序产品,该计算机程序由电子设备的处理器执行时,使得电子设备能够执行如前所述的类目分类方法。
190.本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
191.应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1