商品类目分类方法及其装置、设备、介质、产品与流程

文档序号：28064316发布日期：2021-12-17 23:32阅读：208来源：国知局

1.本技术涉及电商信息技术领域，尤其涉及一种商品类目分类方法及其相应的装置、计算机设备、计算机可读存储介质，以及计算机程序产品。

背景技术：

2.电商平台内涉及的商品繁多，商品数量往往达到千位级、万位级以上，通常需借助多级类目才能对其进行高效的组织。多级类目之间，子类目通常隶属于父类目，逐层展开，构成“类目树”。考虑类目树的层级越深，流失量越大，因此，类目树通常包括三级、四级，一般不超过五级。在数据层面，类目树以其多层次分类结构实现对电商平台中海量商品对象的组织，方便新增、查询、更新等维护。
3.商品的标题文本可以用做分类的依据，借助基于自然语言处理技术的深层语义模型，可以实现对标题文本的深层语义特征信息的提取，根据这一特征信息可以实现对相应的商品对象的分类。但是，随着类目树中层次的增加，叶子类目几何级增长，其中部分叶子类目所对应的商品对象较多，而部分叶子类目所对应的商品对象较少，也就是说，商品对象在叶子类目中的分布并不均匀。这就为基于深层语义的神经网络模型的训练带来了困难。众所周知，神经网络模型的训练需要依赖大量的标注训练样本进行训练，如果单纯针对从类目树顶层到达叶子类目的路径，利用商品对象的标题文本进行训练，由于部分叶子类目训练样本较少的原因，最终容易导致模型出现过拟合，预测结果不准确，模型也就不可用。
4.因此，针对这种情况，需要改进用于依据商品标题文本进行类目树分类的深层语义模型的训练过程，以确保由其训练而成的模型能够更准确预测分类结果，而服务于电商平台的商品对象智能分类服务。

技术实现要素：

5.本技术的首要目的在于解决上述问题至少之一而提供一种商品类目分类方法及其相应的装置、计算机设备、计算机可读存储介质、计算机程序产品，以实现辅助音乐创作。
6.为满足本技术的各个目的，本技术采用如下技术方案：
7.适应本技术的目的之一而提供的一种商品类目分类方法，包括如下步骤：
8.获取商品对象相对应的标题文本；
9.调用文本特征提取模型从所述标题文本中提取出文本特征信息；其中，所述文本特征提取模型的训练过程中，以同一训练样本对商品分类相对应的类目树的层次结构逐层训练，每一层训练时以当前层的实际损失值修正该文本特征提取模型的权重参数直至该文本特征提取模型被训练至收敛状态，所述实际损失值由当前层的损失函数值融合先训练层的实际损失值获得；
10.基于所述文本特征信息进行分类，以分类结果标记所述商品对象的分类属性，所述分类结果包括所述类目树中具有层次隶属关系的各层次的类目标签。
11.深化的实施例中，所述文本特征提取模型的训练过程中，包括如下步骤：
12.创建多个训练任务以实施针对所述类目树中各个层的训练；
13.为各个训练任务输入同一训练样本以启动训练；
14.控制各个训练任务依照类目树的层次结构自顶层至底层传递各先训练层的实际损失值，以使相应层融合该实际损失值而实现对相应的训练任务中的文本特征模型进行权重参数修正。
15.深化的实施例中，所述文本特征提取模型的训练过程，包括针对类目树的分类结构中每一层训练的步骤：
16.从所述训练样本中提取出文本特征信息；
17.将所述文本特征信息输入分类模型进行分类，获得与当前层相对应的分类结果；
18.将当前层的损失函数值与所有先训练层各自的实际损失值进行加权求和获得当前层的实际损失值；
19.利用当前层的实际损失值反向传播修正文本特征提取模型的权重参数实现梯度更新。
20.深化的实施例中，调用文本特征提取模型从所述标题文本中提取出文本特征信息，包括如下步骤：
21.构造所述标题文本中各个分词相对应的嵌入向量；
22.为每个嵌入向量拼接表征其上下文语义的左侧向量和右侧向量，构造出中间特征向量；
23.对所述中间特征向量执行池化操作，获得表征该标题文本的语义的向量，作为所述的文本特征信息。
24.深化的实施例中，以分类结果标记所述商品对象的分类属性，包括如下步骤：
25.根据分类结果确定多个类目标签；
26.查询预设的词典获得与所述多个类目标签相对应的类目文本；
27.将所述类目文本赋值为所述商品对象的分类属性。
28.较佳的实施例中，所述文本特征提取模型的训练过程中，各层次的训练过程以多任务触发运行。
29.适应本技术的目的之一而提供的一种商品类目分类装置，包括：标题获取模块、特征提取模块，以及分类标记模块；其中，所述标题获取模块，用于获取商品对象相对应的标题文本；所述特征提取模块，用于调用文本特征提取模型从所述标题文本中提取出文本特征信息；其中，所述文本特征提取模型的训练过程中，以同一训练样本对商品分类相对应的类目树的层次结构逐层训练，每一层训练时以当前层的实际损失值修正该文本特征提取模型的权重参数直至该文本特征提取模型被训练至收敛状态，所述实际损失值由当前层的损失函数值融合先训练层的实际损失值获得；所述分类标记模块，用于基于所述文本特征信息进行分类，以分类结果标记所述商品对象的分类属性，所述分类结果包括所述类目树中具有层次隶属关系的各层次的类目标签。
30.深化的实施例中，所述文本特征提取模型的训练过程中，运行于如下结构：任务创建模块，用于创建多个训练任务以实施针对所述类目树中各个层的训练；训练启动模块，为各个训练任务输入同一训练样本以启动训练；传播控制模块，用于控制各个训练任务依照类目树的层次结构自顶层至底层传递各先训练层的实际损失值，以使相应层融合该实际损
失值而实现对相应的训练任务中的文本特征模型进行权重参数修正。
31.深化的实施例中，所述文本特征提取模型的训练过程，包括针对类目树的分类结构中每一层训练的运行结构：特征提取实例模块，用于从所述训练样本中提取出文本特征信息；分类实例模块，用于将所述文本特征信息输入分类模型进行分类，获得与当前层相对应的分类结果；损失叠加实例模块，用于将当前层的损失函数值与所有先训练层各自的实际损失值进行加权求和获得当前层的实际损失值；修正模块，用于利用当前层的实际损失值反向传播修正文本特征提取模型的权重参数实现梯度更新。
32.深化的实施例中，所述特征提取模块，调用文本特征提取模型从所述标题文本中提取出文本特征信息，包括：向量构造子模块，用于构造所述标题文本中各个分词相对应的嵌入向量；语义引用子模块，用于为每个嵌入向量拼接表征其上下文语义的左侧向量和右侧向量，构造出中间特征向量；池化抽象子模块，用于对所述中间特征向量执行池化操作，获得表征该标题文本的语义的向量，作为所述的文本特征信息。
33.深化的实施例中，所述分类标记模块包括：标签转换子模块，用于根据分类结果确定多个类目标签；词典查询子模块，用于查询预设的词典获得与所述多个类目标签相对应的类目文本；对象赋值子模块，用于将所述类目文本赋值为所述商品对象的分类属性。
34.较佳的实施例中，所述文本特征提取模型的训练过程中，各层次的训练过程以多任务触发运行。
35.适应本技术的目的之一而提供的一种计算机设备，包括中央处理器和存储器，所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本技术所述的商品类目分类方法的步骤。
36.适应本技术的另一目的而提供的一种计算机可读存储介质，其以计算机可读指令的形式存储有依据所述的商品类目分类方法所实现的计算机程序，该计算机程序被计算机调用运行时，执行该方法所包括的步骤。
37.适应本技术的另一目的而提供的一种计算机程序产品，包括计算机程序/指令，该计算机程序/指令被处理器执行时实现本技术任意一种实施例中所述方法的步骤。
38.相对于现有技术，本技术的优势如下：
39.本技术的文本特征提取模型，由于其训练阶段针对类目树的层次结构逐层训练，在文本特征提取模型针对次一层的类目树进行训练时，在当前层的损失函数值的基础上融合了类目树的先训练层所获得的用于梯度更新的实际损失值进行参数修正，通过引用所有先训练层的实际损失值，使文本特征提取模型先后继承类目树各层相对应的损失信息，最终使其获得针对整个类目树的层次结构进行统一表示学习实现分类的能力。
40.在训练过程中，可以理解，同一训练样本的监督标签是一个由类目树中各层次的各一个类目标签构成的路径，这些类目标签之间具有层次上的隶属关系，因此，采用逐层训练的方式，相当于不断缩小下一层的数据分布的范围，使得针对最后一层即叶子类目训练时，即使为该叶子类目的训练样本较少，也能够使损失函数快速收敛，训练出具有较高表示学习能力的模型，以服务于商品对象的正确分类，训练效率高，训练成本低，训练效果好。
41.据此，当本技术的文本特征提取模型完成训练之后，便可根据商品对象相对应的标题文本进行分类。
附图说明
42.本技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：
43.图1为本技术的商品类目分类方法的典型实施例的流程示意图；
44.图2为用于实施本技术的商品类目分类方法的网络结构示意图；
45.图3为本技术实施例中文本特征提取模型训练过程的流程示意图；
46.图4为本技术实施例中单个训练任务的工作过程的流程示意图；
47.图5为本技术实施例中基于textrcnn模型的文本特征提取模型的工作流程示意图；
48.图6为本技术实施例中所采用textrcnn的网络结构示意图；
49.图7为本技术的根据分类结果完成分类标记的过程的流程示意图；
50.图8为本技术的商品类目分类装置的原理框图；
51.图9为本技术所采用的一种计算机设备的结构示意图。
具体实施方式
52.下面详细描述本技术的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本技术，而不能解释为对本技术的限制。
53.本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
54.本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)，具有与本技术所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语，应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样被特定定义，否则不会用理想化或过于正式的含义来解释。
55.本技术领域技术人员可以理解，这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备，其仅具备无发射能力的无线信号接收器的设备，又包括接收和发射硬件的设备，其具有能够在双向通信链路上，进行双向通信的接收和发射硬件的设备。这种设备可以包括：蜂窝或其他诸如个人计算机、平板电脑之类的通信设备，其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备；pcs(personal communications service，个人通信系统)，其可以组合语音、数据处理、传真和/或数据通信能力；pda(personal digital assistant，个人数字助理)，其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或gps(global positioning system，全球定位系统)接收器；常规膝上型和/或掌上型计算机或其他设备，其具有和/或
包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的，或者适合于和/或配置为在本地运行，和/或以分布形式，运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端，例如可以是pda、mid(mobile internet device，移动互联网设备)和/或具有音乐/视频播放功能的移动电话，也可以是智能电视、机顶盒等设备。
56.本技术所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件，本质上是具备个人计算机等效能力的电子设备，为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置，计算机程序存储于其存储器中，中央处理器将存储在外存中的程序调入内存中运行，执行程序中的指令，与输入输出设备交互，借此完成特定的功能。
57.需要指出的是，本技术所称的“服务器”这一概念，同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理，所述各服务器应是逻辑上的划分，在物理空间上，这些服务器既可以是互相独立但可通过接口调用的，也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通，而不应以此约束本技术的网络部署方式的实施方式。
58.本技术的一个或数个技术特征，除非明文指定，既可部署于服务器实施而由客户端远程调用获取服务器提供的在线服务接口来实施访问，也可直接部署并运行于客户端来实施访问。
59.本技术中所引用或可能引用到的神经网络模型，除非明文指定，既可部署于远程服务器且在客户端实施远程调用，也可部署于设备能力胜任的客户端直接调用，某些实施例中，当其运行于客户端时，其相应的智能可通过迁移学习来获得，以便降低对客户端硬件运行资源的要求，避免过度占用客户端硬件运行资源。
60.本技术所涉及的各种数据，除非明文指定，既可远程存储于服务器，也可存储于本地终端设备，只要其适于被本技术的技术方案所调用即可。
61.本领域技术人员对此应当知晓：本技术的各种方法，虽然基于相同的概念而进行描述而使其彼此间呈现共通性，但是，除非特别说明，否则这些方法都是可以独立执行的。同理，对于本技术所揭示的各个实施例而言，均基于同一发明构思而提出，因此，对于相同表述的概念，以及尽管概念表述不同但仅是为了方便而适当变换的概念，应被等同理解。
62.本技术即将揭示的各个实施例，除非明文指出彼此之间的相互排斥关系，否则，各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例，只要这种结合不背离本技术的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通，本领域技术人员应当知晓。
63.本技术的一种商品类目分类方法，可被编程为计算机程序产品，部署于客户端和/或服务器中运行而实现，藉此，客户端可以网页程序或应用程序的形式访问该计算机程序产品运行后开放的接口，通过图形用户界面与该计算机程序产品的进程实现人机交互。
64.请参阅图1和图2，在其典型实施例中，该方法通过图2所示的网络架构实施，包括如下步骤：
65.步骤s1100、获取商品对象相对应的标题文本：
66.本技术的一个应用场景，是基于独立站的电商平台中的应用，每个独立站即为电商平台的一个商户实例，拥有独立的访问域名，由其实际拥有者负责进行商品的发布和更新。
67.独立站的商户实例将每个商品进行上线，电商平台获取与该商品相关的信息之后，构造出相对应的商品对象进行数据存储。商品对象的信息主要包括文本信息和图片信息，其中，文本信息包括商品对象的用于显要显示的标题信息、用于介绍商品详情的内容信息、用于描述商品特征的属性信息等。
68.为了实施本技术的技术方案，可以采集商品对象的摘要文本，摘要文本主要采用商品对象中的标题信息，必要时可增强其一项或多项属性信息构成。一般而言，可以按照预设的数量和内容需求获取摘要文本，例如摘要文本可以规定为包含商品对象的标题信息及其所有属性项的属性信息。当然，本领域技术人员可以在此基础上灵活变通调整处理。
69.最后，将所述的摘要文本作为本技术用于实施对商品对象进行分类判断的所述标题文本。
70.步骤s1200、调用文本特征提取模型从所述标题文本中提取出文本特征信息；其中，所述文本特征提取模型的训练过程中，以同一训练样本对商品分类相对应的类目树的层次结构逐层训练，每一层训练时以当前层的实际损失值修正该文本特征提取模型的权重参数直至该文本特征提取模型被训练至收敛状态，所述实际损失值由当前层的损失函数值融合先训练层的实际损失值获得：
71.如图2所示的文本特征提取模型，其将所述标题文本进行向量化，然后进行深层语义特征提取，获得相应的文本特征信息。所述文本特征提取模型事先经过训练达致收敛状态。所述文本特征提取模型无需特指，包括但不限于时下较为流行的bert、textrcnn等常见的用于提取文本特征信息的基于深层语义学习的网络模型。尽管本技术将以textrcnn进行示例性介绍，但不应以此为局限来理解本技术的创造精神所应涵盖的范围。
72.可以理解，所述的文本特征提取模型实现对商品对象进行基于类目树的多层次结构的分类能力，是通过如图2所示的网络架构的训练来实现的，对于该网络架构而来，其中的关键，在于训练所述文本特征提取模型习得对标题文本进行分类所需的表示学习的能力。因此，对该网络架构的训练的重点，在于训练所述文本特征提取模型以使其习得相应的能力。
73.为了使所述文本特征提取模型习得所述的表示学习的能力，可以采取针对所述类目树的层次结构进行逐层训练的方式来实施。
74.本实施例中，对文本特征提取模型实施训练的基本原理，在于采用同一训练样本作为该文本特征提取模型的输入数据，从所述类目树的层次结构中的顶层开始，实施逐层训练，提取出相应的文本特征信息，然后由分类模型根据文本特征信息进行分类，获得分类结果。
75.对于类目树每一层相对应的训练任务而言，先根据分类结果计算出当前层相应的损失函数值。分类模型应用交叉商损失函数进行计算即可获得当前层的损失函数值，为本领域技术人员所知晓，其公式形如：
76.77.由于本领域技术人员知晓该交叉熵函数，故对其解释从略。
78.自类目树的顶层相对应的训练任务开始，向层次结构中的底层的方向组织所述训练任务的层次顺序，由此可以将各个训练任务看成每一层相应的训练任务。可以理解，每一层均基于该同一训练样本进行训练，并相应计算获得其自身的交叉熵损失函数值。
79.对于训练过程的每一层而言，其用于实施梯度更新的实际损失值是在当前层的交叉熵损失函数值的基础上融合了所有先训练层的实际损失值的总损失值，每一当前层的用于反向传播所需的实际损失值的计算公式为：
[0080][0081]
其中，w
t
为每一层相对应的权重参数，l
i
为每一层相对应的参与计算的实际损失值，其中，当前层的实际损失值并未计得，故在此处采用当前层的交叉熵损失函数值替换计算，使当前层损失函数值与所有先于当前层训练的其他层相对应的实际损失值实现融合。
[0082]
根据该公式可以看出，当前层在计算梯度更新所需的实际损失值时，引用先于其训练的其他层的实际损失值进行加权求和，例如，当前层为第三层时，则引用第一层(顶层)相对应的实际损失值以及第二层相对应的实际损失值，以及第三层自身的交叉熵损失函数值。对于第一层的实际损失值的计算，由于缺少在先训练层，故其实际损失值即为其交叉熵损失函数值。对于第二层、第四层或者其他第n层而言，则与第三层同理。
[0083]
由此可见，随着训练的逐层深入，对应类目树层次结构，次一层的实际损失值总是受制于其所有在先训练层的实际损失值，由此，在反向传播修正文本特征提取模型的权重参数时，实际是综合了整个层次结构自顶层至底层的实际损失值进行的。据此不断迭代训练，使该网络架构达致收敛状态，便可完成训练，获得本技术所需的文本特征提取模型，使其具备对进行分类所需的标题文本进行深层语义表示学习的能力。从而可以利用该文本特征提取模型从标题文本中提取出分类所需的文本特征信息。
[0084]
步骤s1300、基于所述文本特征信息进行分类，以分类结果标记所述商品对象的分类属性，所述分类结果包括所述类目树中具有层次隶属关系的各层次的类目标签：
[0085]
被训练至收敛状态的网络架构，在其文本特征提取模型从标题文本中获得相应的文本特征信息后，便可利用分类模型对文本特征信息进行分类，获得相应的分类结果。分类结果中包括所述映射文本映射到类目树的层次结构的各个层次的类目标签的概率评分，每个层次对应的多个类目标签中均有最大值，将各层次相应的最大值提取出，便获得了具有层次隶属关系的一条分类路径，完成分类。
[0086]
该分类路径包括构成了层次隶属关系的多个类目标签，至此，便可以这些类目标签相对应的类目文本标记所述标题文本相对应的商品对象的分类属性，完成分类标记过程。
[0087]
本技术的文本特征提取模型，由于其训练阶段针对类目树的层次结构逐层训练，在文本特征提取模型针对次一层的类目树进行训练时，在当前层的损失函数值的基础上融合了类目树的先训练层所获得的用于梯度更新的实际损失值进行参数修正，通过引用所有先训练层的实际损失值，使文本特征提取模型先后继承类目树各层相对应的损失信息，最终使其获得针对整个类目树的层次结构进行统一表示学习实现分类的能力。
[0088]
在训练过程中，可以理解，同一训练样本的监督标签是一个由类目树中各层次的
各一个类目标签构成的路径，这些类目标签之间具有层次上的隶属关系，因此，采用逐层训练的方式，相当于不断缩小下一层的数据分布的范围，使得针对最后一层即叶子类目训练时，即使为该叶子类目的训练样本较少，也能够使损失函数快速收敛，训练出具有较高表示学习能力的模型，以服务于商品对象的正确分类，训练效率高，训练成本低，训练效果好。
[0089]
据此，当本技术的文本特征提取模型完成训练之后，便可根据商品对象相对应的标题文本进行分类。
[0090]
请参阅图3，深化的实施例中，所述文本特征提取模型的训练过程中，包括如下步骤：
[0091]
步骤s2100、创建多个训练任务以实施针对所述类目树中各个层的训练：
[0092]
类目树的层数一般适宜为三、四、五层，适应这一层数，可以多任务训练的方式，创建对应多个训练任务，以便由每个训练任务负责一个对应的层的训练。
[0093]
步骤s2200、为各个训练任务输入同一训练样本以启动训练：
[0094]
为使多个训练任务均基于同一训练样本进行训练，因此，对于训练过程中的每一迭代过程，从训练数据集中调用同一训练样本，同时传输给多个训练任务，以便使每个训练任务都基于同一训练样本进行训练。
[0095]
步骤s2300、控制各个训练任务依照类目树的层次结构自顶层至底层传递各先训练层的实际损失值，以使相应层融合该实际损失值而实现对相应的训练任务中的文本特征模型进行权重参数修正：
[0096]
尽管本实施例以多任务进行训练，但各任务的文本特征提取模型的实例，却依其层次隶属关系，需要获取其在先训练层次用于实施梯度更新的实际损失值，因此，本质上，多个训练任务之间存在串行关系，故在训练过程中，控制对应类目树自顶层至底层相对应的各个训练任务逐层训练，且当前层利用本层的交叉熵损失函数值与先于其训练的其他各层的实际损失值进行加权求和，获得总损失值作为当前层的实际损失值，对网络架构进行梯度更新，并将当前层自身的实际损失值向其以下各层次相应的训练任务传播，使其以下各层次的训练任务又能引用其实际损失值，如此嵌套，使每一层用于实现梯度更新的实际损失值都受其各个上级层次的实际损失值的制约，在此基础上实现文本特征提取模型的权重修正，达成当前层的训练。
[0097]
本实施例中，通过构造多任务训练机制，基于同一训练样本，在各个层次对应的训练任务中对文本特征提取模型进行相应层次的训练，然后以串行关系在不同训练任务之间传播供当前层的下属各层引用的实际损失值，实现了一种多任务协同训练机制，能够大幅提升训练效率，使模型更快收敛。
[0098]
请参阅图4，深化的实施例中，主要用于揭示每一训练任务中，所述文本特征提取模型的训练过程，因此，针对类目树的分类结构中每一层训练的步骤，包括：
[0099]
步骤s3100、从所述训练样本中提取出文本特征信息：
[0100]
对于每一训练任务而言，先利用所述文本特征提取模型从所述训练样本中提取出其相应的文本特征信息。
[0101]
步骤s3200、将所述文本特征信息输入分类模型进行分类，获得与当前层相对应的分类结果：
[0102]
至此可以看出，每一训练任务中，实际是图2所示的网络架构的一个实例性的引
用，因此，同理可以由分类模型根据从训练样本中提取的文本特征信息进行分类，获得相应的分类结果。所述分类结果的内容，请参照前文示例说明。
[0103]
步骤s3300、将当前层的损失函数值与所有先训练层各自的实际损失值进行加权求和获得当前层的实际损失值：
[0104]
所述的先训练层，是相对于当前层而言的。先训练层也是类目树中相对当前层更高的层，因此先经过其对应的训练任务进行训练而获得其相应的实际损失值。而当前层经分类模型分类后，根据交叉熵函数便可计算获得当前层的损失函数值。据此，应用前文各实施例所述，可以将当前层的损失函数值与先于当前层训练所有在先训练层的实际损失值进行加权求和，获得当前层的实际损失值。
[0105]
步骤s3400、利用当前层的实际损失值反向传播修正文本特征提取模型的权重参数实现梯度更新：
[0106]
如前所述，当前层的实际损失值用于对所述网络架构进行梯度更新，反向传播修正文本特征模型的权重参数，以便通常这样的多次迭代，使整个网络慢慢达致收敛。
[0107]
本实施例对每一训练任务中的具体执行过程进行揭示，由于可以看出，多个训练任务可以由同一业务逻辑来实现，故其实现原理简单，开发成本较低，易于实现。
[0108]
请参阅图5，深化的实施例中，以采用textrcnn作为文本特征提取模型进行示例说明，所述步骤s1200、调用文本特征提取模型从所述标题文本中提取出文本特征信息，包括如下步骤：
[0109]
步骤s1210、构造所述标题文本中各个分词相对应的嵌入向量：
[0110]
如图6所示，基于textrcnn构造的文本特征提取模型，其包括一个用于编码的卷积层，后接一个池化层，然后输出。
[0111]
对于一个标题文本而言，首先可以进行格式预处理，进行分词后将其向量化，获得各个分词相应的嵌入向量e(w
i
)。该嵌入向量为相应的分词的表示，可以结合预设的词典的映射关系来确定，将分词从文本转换为向量。
[0112]
步骤s1220、为每个嵌入向量拼接表征其上下文语义的左侧向量和右侧向量，构造出中间特征向量：
[0113]
根据textrcnn的原理，针对每个分词的嵌入向量进行编码时，需要根据上下文为其拼接左侧向量c
l
(w
i
)和右侧向量c
r
(w
i
)，其中，左侧向量为该分词的前一分词的语义引用信息，右侧向量为该分词的后一分词的语义引用信息，左侧向量、嵌入向量、右侧向量被拼接后，拼接后的结果被进一步做线性变换，便得到各个分词相应的中间特征信息。
[0114]
步骤s1230、对所述中间特征向量执行池化操作，获得表征该标题文本的语义的向量，作为所述的文本特征信息：
[0115]
进一步，在所述中间特征向量的基础上执行池化操作，将其映射为一个表征该标题文本的语义的向量，完成编码，该向量即可作为所述的文本特征信息。
[0116]
本实施例通过进一步提供一个实用性的文本特征提取模型的网络结构及其编码过程，以使读者更易加深对本技术的创造性的理解。
[0117]
请参阅图7，深化的实施例中，所述步骤s1300中，以分类结果标记所述商品对象的分类属性，包括如下步骤：
[0118]
步骤s1310、根据分类结果确定多个类目标签：
[0119]
如前所述，本技术的网络架构用于生产阶段时，其分类模型分类而得的分类结果中包含映射到类目树的层次结构中各个分类标签的概率评分，并且，通过这一概率评分可以确定一个分类路径，也即在每个层次中确定一个相应的分类标签，并且这些分类标签具有层次隶属关系。因此，根据分类结果中的概率评分便可确定其相应的分类标签。
[0120]
步骤s1320、查询预设的词典获得与所述多个类目标签相对应的类目文本；
[0121]
可以预先构造一个词典，该词典用于存储类目树层次结构中各个类目标签到数值之间的映射，而这些数值即是分类模型分类结果中的分类标签，据此，各个类目标签到分类标签之间的映射关系在词典中便得以确定。因此，利用这一词典，可以在其中查询到所述分类路径的各个分类标签相对应的类目文本。
[0122]
步骤s1330、将所述类目文本赋值为所述商品对象的分类属性：
[0123]
每个商品对象均关联一个分类属性，将已经查询获得的多个类目文本赋值给本技术的标题文本相对应的商品对象的分类属性，即可完成对该商品对象的分类。
[0124]
本实施例给出根据分类结果对商品对象进行标记分类的过程，可以看出，这一过程可以自动化实现，对于提升电商平台的自动分类效率而言，能起到大大的提高作用。
[0125]
请参阅图8，适应本技术的目的之一而提供的一种商品类目分类装置，是对本技术的商品类目分类方法的功能化体现，该装置包括：标题获取模块1100、特征提取模块1200，以及分类标记模块1300；其中，所述标题获取模块1100，用于获取商品对象相对应的标题文本；所述特征提取模块1200，用于调用文本特征提取模型从所述标题文本中提取出文本特征信息；其中，所述文本特征提取模型的训练过程中，以同一训练样本对商品分类相对应的类目树的层次结构逐层训练，每一层训练时以当前层的实际损失值修正该文本特征提取模型的权重参数直至该文本特征提取模型被训练至收敛状态，所述实际损失值由当前层的损失函数值融合先训练层的实际损失值获得；所述分类标记模块1300，用于基于所述文本特征信息进行分类，以分类结果标记所述商品对象的分类属性，所述分类结果包括所述类目树中具有层次隶属关系的各层次的类目标签。
[0126]
深化的实施例中，所述文本特征提取模型的训练过程中，运行于如下结构：任务创建模块，用于创建多个训练任务以实施针对所述类目树中各个层的训练；训练启动模块，为各个训练任务输入同一训练样本以启动训练；传播控制模块，用于控制各个训练任务依照类目树的层次结构自顶层至底层传递各先训练层的实际损失值，以使相应层融合该实际损失值而实现对相应的训练任务中的文本特征模型进行权重参数修正。
[0127]
深化的实施例中，所述文本特征提取模型的训练过程，包括针对类目树的分类结构中每一层训练的运行结构：特征提取实例模块，用于从所述训练样本中提取出文本特征信息；分类实例模块，用于将所述文本特征信息输入分类模型进行分类，获得与当前层相对应的分类结果；损失叠加实例模块，用于将当前层的损失函数值与所有先训练层各自的实际损失值进行加权求和获得当前层的实际损失值；修正模块，用于利用当前层的实际损失值反向传播修正文本特征提取模型的权重参数实现梯度更新。
[0128]
深化的实施例中，所述特征提取模块1200，调用文本特征提取模型从所述标题文本中提取出文本特征信息，包括：向量构造子模块，用于构造所述标题文本中各个分词相对应的嵌入向量；语义引用子模块，用于为每个嵌入向量拼接表征其上下文语义的左侧向量和右侧向量，构造出中间特征向量；池化抽象子模块，用于对所述中间特征向量执行池化操
作，获得表征该标题文本的语义的向量，作为所述的文本特征信息。
[0129]
深化的实施例中，所述分类标记模块1300包括：标签转换子模块，用于根据分类结果确定多个类目标签；词典查询子模块，用于查询预设的词典获得与所述多个类目标签相对应的类目文本；对象赋值子模块，用于将所述类目文本赋值为所述商品对象的分类属性。
[0130]
较佳的实施例中，所述文本特征提取模型的训练过程中，各层次的训练过程以多任务触发运行。
[0131]
为解决上述技术问题，本技术实施例还提供计算机设备。如图9所示，计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、计算机可读存储介质、存储器和网络接口。其中，该计算机设备的计算机可读存储介质存储有操作系统、数据库和计算机可读指令，数据库中可存储有控件信息序列，该计算机可读指令被处理器执行时，可使得处理器实现一种商品类目分类方法。该计算机设备的处理器用于提供计算和控制能力，支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令，该计算机可读指令被处理器执行时，可使得处理器执行本技术的商品类目分类方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解，图9中示出的结构，仅仅是与本技术方案相关的部分结构的框图，并不构成对本技术方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。
[0132]
本实施方式中处理器用于执行图8中的各个模块及其子模块的具体功能，存储器存储有执行上述模块或子模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有本技术的商品类目分类装置中执行所有模块/子模块所需的程序代码及数据，服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
[0133]
本技术还提供一种存储有计算机可读指令的存储介质，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行本技术任一实施例的商品类目分类方法的步骤。
[0134]
本技术还提供一种计算机程序产品，包括计算机程序/指令，该计算机程序/指令被一个或多个处理器执行时实现本技术任一实施例所述方法的步骤。
[0135]
本领域普通技术人员可以理解实现本技术上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(read
‑
only memory，rom)等计算机可读存储介质，或随机存储记忆体(random access memory，ram)等。
[0136]
综上所述，本技术采用针对类目树的多层次结构进行逐层训练的方式来降低文本特征提取模型表示学习能力所需的训练样本的数量，降低了训练成本，提升训练效率，提升文本特征提取模型针对商品类目进行分类所需的表示学习的能力。
[0137]
本技术领域技术人员可以理解，本技术中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地，具有本技术中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地，现有技术中的具有与本技术中公开的各种操作、方法、流程中的步骤、措施、方案
也可以被交替、更改、重排、分解、组合或删除。
[0138]
以上所述仅是本技术的部分实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本技术原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本技术的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：叶朝鹏
技术所有人：广州华多网络科技有限公司
我是此专利的发明人

上一篇：一种可正反印刷的凹印装置的制作方法
上一篇：一种圆管类工件的大推力快速气动夹紧装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。