文本分类方法、装置、计算机设备及存储介质与流程

文档序号：35865786发布日期：2023-10-27 00:48阅读：23来源：国知局

本申请涉及自然语言处理，更具体地，涉及一种文本分类方法、装置、计算机设备及存储介质。

背景技术：

1、文本分类(text classification)是自然语言处理(natural languageprocessing，nlp)领域中最常见也是最重要的任务类型之一。文本分类可通过计算机对文本集(或其他实体或物件)按照一定的分类体系/标准进行自动分类标记。随着网络应用产品多样性和用户基数的不断增大，服务商在提供业务服务的过程中获取的客服交互数据也急剧增长。

2、例如，用户在产品使用过程中反馈的大量意见信息，为了能够及时处理业务中出现的商业问题，现阶段，大多数公司将文本分类应用到客服交互数据的分类场景中，主要借助有关文本分类算法模型来对用户以及客服之间的客服交互数据进行分类，从而对不同的分类结果进行针对性地业务处理。

3、然而，目前许多有关文本分类算法的模型，因为受类目/标签体系具有多层级以及层级间依赖关系复杂等因素的影响，导致分类算法无法满足业务系统进行准确地多层级分类的需求。

技术实现思路

1、本申请实施例提供一种文本分类方法、装置、计算机设备以及存储介质。旨在提升对客服交互数据进行多层级分类的准确性。

2、一方面，本申请实施例提供一种文本分类的训练方法，该方法包括：获取客服交互样本数据；获取预设分类网络，所述预设分类网络包括语义编码训练网络以及至少两个分类训练网络，所述语义编码训练网络用于生成所述客服交互样本数据对应的分词语义表示，所述分类训练网络用于生成所述客服交互样本数据对应层级的分类结果；将所述客服交互样本数据输入所述预设分类网络，对所述至少两个分类训练网络进行多任务训练，直至所述预设分类网络满足预设条件，得到训练后的目标分类网络作为交互文本分类模型。

3、可以看出，在本申请实施例中，能够获取客服交互样本数据，并获取预设分类网络，其中，预设分类网络包括语义编码训练网络以及至少两个分类训练网络，语义编码训练网络用于生成客服交互样本数据对应的分词语义表示，分类训练网络用于生成客服交互样本数据对应层级的分类结果，进一步地，将客服交互样本数据输入预设分类网络，对至少两个分类训练网络进行多任务训练，直至预设分类网络满足预设条件，得到训练后的目标分类网络作为交互文本分类模型。如此，基于客服交互样本数据，可以对至少两个分类训练网络进行多任务训练，以此将所有分类训练网络的训练任务进行融合，使得各个训练任务之间能够保持平衡，从而避免因某个训练任务的偏差，而影响到整个分类结果的准确性。

4、另一方面，本申请实施例还提供一种文本分类方法，该方法包括：获取客服交互数据；对所述客服交互数据进行数据处理得到分词序列向量；将所述分词序列向量输入至预先训练得到的交互文本分类模型，所述交互文本分类模型包括语义编码网络以及至少两个分类网络，所述交互文本分类模型为基于多任务训练得到；通过所述至少两个分类训练网络，输出所述客服交互数据的多层级分类结果。

5、可以看出，在本申请实施例中，能够获取客服交互数据，并对客服交互数据进行数据处理得到分词序列向量，进一步地，将分词序列向量输入至预先训练得到的交互文本分类模型，该交互文本分类模型包括语义编码网络以及至少两个分类网络，该交互文本分类模型为基于多任务训练得到，进而通过至少两个分类训练网络，输出客服交互数据的多层级分类结果。由此，基于交互文本分类模型可以利用自身的至少两个分类网络对客服交互数据进行多层级分类，同时，因为基于多任务训练生成的交互文本分类模型使得分类结果得准确性得到有效提高，从而极大地满足了业务系统能够准确对客服交互数据进行多层级分类的需求。

6、另一方面，本申请实施例还提供一种文本分类的训练装置，该装置包括：样本获取模块，用于获取客服交互样本数据；网络获取模块，用于获取预设分类网络，所述预设分类网络包括语义编码训练网络以及至少两个分类训练网络，所述语义编码训练网络用于生成所述客服交互样本数据对应的分词语义表示，所述分类训练网络用于生成所述客服交互样本数据对应层级的分类结果；网络训练模块，用于将所述客服交互样本数据输入所述预设分类网络，对所述至少两个分类训练网络进行多任务训练，直至所述预设分类网络满足预设条件，得到训练后的目标分类网络作为交互文本分类模型

7、另一方面，本申请实施例还提供一种文本分类装置，该装置包括：数据获取模块，用于获取客服交互数据；数据处理模块，用于对所述客服交互数据进行数据处理得到分词序列向量；向量输入模块，用于将所述分词序列向量输入至预先训练得到的交互文本分类模型，所述交互文本分类模型包括语义编码网络以及至少两个分类网络，所述交互文本分类模型为基于多任务训练得到；分类输出模块，用于通过所述至少两个分类训练网络，输出所述客服交互数据的多层级分类结果。

8、另一方面，本申请实施例还提供一种计算机设备，该计算机设备包括处理器以及存储器，存储器存储有计算机程序指令，计算机程序指令被处理器调用时执行上述的文本分类的训练方法以及文本分类方法。

9、另一方面，本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质存储有程序代码，其中，在程序代码被处理器运行时执行上述的文本分类的训练方法以及文本分类方法。

10、另一方面，本申请实施例还提供一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，所述计算机指令存储在存储介质中。计算机设备的处理器从存储介质读取所述计算机指令，处理器执行所述计算机指令，使得所述计算机执行上述的文本分类的训练方法以及文本分类方法中的步骤。

技术特征：

1.一种文本分类的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述预设分类网络包括第一分类训练网络以及第二分类训练网络，所述将所述客服交互样本数据输入所述预设分类网络，对所述至少两个分类训练网络进行多任务训练，直至所述预设分类网络满足预设条件，包括：

3.根据权利要求2所述的方法，其特征在于，所述客服交互样本数据关联有对应的第一层级类目标签以及第二层级类目标签，所述根据所述客服交互样本数据、所述第一层级分类结果以及所述第二层级分类结果，利用多任务损失函数计算出总损失值，包括：

4.根据权利要求2所述的方法，其特征在于，所述对所述客服交互样本数据进行数据处理得到分词序列向量，包括：

5.根据权利要求1～4任一项所述的方法，其特征在于，所述获取客服交互样本数据，包括：

6.一种文本分类方法，其特征在于，所述方法包括：

7.根据权利要求6所述的方法，其特征在于，所述分类网络，包括：三个全连接层，其中，所述全连接层的输入层以及输出层的神经元个数分别由分类网络的输入和输出的向量长度决定。

8.一种文本分类的训练装置，其特征在于，所述装置包括：

9.一种文本分类装置，其特征在于，所述装置包括：

10.一种计算机设备，其特征在于，包括：

11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有程序代码，所述程序代码可被处理器调用执行如权利要求1～7任一项所述的方法。

技术总结
本申请公开了一种文本分类的训练方法，该方法包括：获取客服交互样本数据；获取预设分类网络，预设分类网络包括语义编码训练网络以及至少两个分类训练网络，语义编码训练网络用于生成客服交互样本数据对应的分词语义表示，分类训练网络用于生成客服交互样本数据对应层级的分类结果；将客服交互样本数据输入预设分类网络，对至少两个分类训练网络进行多任务训练，直至预设分类网络满足预设条件，得到训练后的目标分类网络作为交互文本分类模型。本方法基于对预设分类网络中至少两个分类训练网络进行多任务训练，使得生成的交互文本分类模型进行每个层级的分类任务时能够互不影响，进而得到多个不同层级的分类结果，从而提高分类的准确度。

技术研发人员：唐懋,吴海英,王思远,鹿凌华,张永辉
受保护的技术使用者：马上消费金融股份有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：唐懋吴海英王思远鹿凌华张永辉
技术所有人：马上消费金融股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。