一种训练分类模型、对文本分类的方法及装置与流程

文档序号：35858292发布日期：2023-10-26 07:41阅读：29来源：国知局

本技术涉及计算机领域，特别涉及一种训练分类模型、对文本分类的方法及装置。

背景技术：

1、当前，网络上出现了越来越多的服务平台，服务平台可以为用户提供服务，例如，购物平台为广大购物者提供购物服务，游戏平台为广大玩家提供游戏服务以及聊天平台为广大聊天者提供聊天服务等，为了更好地为用户提供服务以提高服务平台的竞争力，可以搜集用户的偏好分类，以根据用户的偏好分类针对性地为用户提供服务，以实现在为用户提供服务的情况下尽可能地满足用户的核心需求，以增加用户对服务平台的粘性。

2、目前，可以是使用模型获取用户的偏好分类。但是，目前使用模型获取的用户的偏好分类的准确率低。另外，事先需要训练模型，训练模型之前需要对数据标注，标注工作量大，人工成本高。其次，目前使用模型获取用户的偏好分类的效率低。

技术实现思路

1、本技术示出了一种训练分类模型、对文本分类的方法及装置。

2、第一方面，示出了一种训练分类模型的方法，包括：获取预训练的语言模型；获取第一训练文本，第一训练文本中至少包括第一样本分类文本、第一样本问题、多个第一样本分类标签以及各个第一样本分类标签分别对应的预测概率填写位；第一样本问题用于提示预测第一样本分类文本针对第一样本问题的答案分别属于各个第一样本分类标签的预测概率；获取第一样本分类文本的第一标注分类标签，第一标注分类标签为多个第一样本分类标签中的其中一个；至少使用第一训练文本以及第一标注分类标签，对预训练的语言模型进行针对各个第一样本分类标签分别对应的预测概率填写位的概率预测任务的优化学习，得到分类模型，概率预测任务包括预测第一样本分类文本针对第一样本问题的答案分别属于各个第一样本分类标签的预测概率的任务。

3、第二方面，示出了一种对文本分类的方法，包括：获取第一待处理文本，第一待处理文本中至少包括第一线上分类文本、第一线上问题、多个第一线上分类标签以及各个第一线上分类标签分别对应的预测概率填写位；第一线上问题用于提示预测第一线上分类文本针对第一线上问题的答案分别属于各个第一线上分类标签的预测概率；基于已训练的分类模型，预测用于在第一待处理文本中的各个第一线上分类标签分别对应的预测概率填写位上填写的预测概率，预测概率包括第一线上分类文本针对第一线上问题的答案分别属于各个第一线上分类标签的概率；其中，已训练的分类模型是至少使用第一训练文本以及第一标注分类标签，对预训练的语言模型进行针对各个第一样本分类标签分别对应的预测概率填写位的概率预测任务的优化学习后得到的，概率预测任务包括预测第一样本分类文本针对第一样本问题的答案分别属于各个第一样本分类标签的预测概率的任务；第一训练文本中至少包括第一样本分类文本、第一样本问题、多个第一样本分类标签以及各个第一样本分类标签分别对应的预测概率填写位；第一样本问题用于提示预测第一样本分类文本针对第一样本问题的答案分别属于各个第一样本分类标签的预测概率；第一标注分类标签为多个第一样本分类标签中的其中一个。

4、第三方面，示出了一种训练分类模型的装置，包括：第一获取模块，用于获取预训练的语言模型；第二获取模块，用于获取第一训练文本，第一训练文本中至少包括第一样本分类文本、第一样本问题、多个第一样本分类标签以及各个第一样本分类标签分别对应的预测概率填写位；第一样本问题用于提示预测第一样本分类文本针对第一样本问题的答案分别属于各个第一样本分类标签的预测概率；第三获取模块，用于获取第一样本分类文本的第一标注分类标签，第一标注分类标签为多个第一样本分类标签中的其中一个；优化学习模块，用于至少使用第一训练文本以及第一标注分类标签，对预训练的语言模型进行针对各个第一样本分类标签分别对应的预测概率填写位的概率预测任务的优化学习，得到分类模型，概率预测任务包括预测第一样本分类文本针对第一样本问题的答案分别属于各个第一样本分类标签的预测概率的任务。

5、第四方面，示出了一种对文本分类的装置，包括：第四获取模块，用于获取第一待处理文本，第一待处理文本中至少包括第一线上分类文本、第一线上问题、多个第一线上分类标签以及各个第一线上分类标签分别对应的预测概率填写位；第一线上问题用于提示预测第一线上分类文本针对第一线上问题的答案分别属于各个第一线上分类标签的预测概率；预测模块，用于基于已训练的分类模型，预测用于在第一待处理文本中的各个第一线上分类标签分别对应的预测概率填写位上填写的预测概率，预测概率包括第一线上分类文本针对第一线上问题的答案分别属于各个第一线上分类标签的概率；其中，已训练的分类模型是至少使用第一训练文本以及第一标注分类标签，对预训练的语言模型进行针对各个第一样本分类标签分别对应的预测概率填写位的概率预测任务的优化学习后得到的，概率预测任务包括预测第一样本分类文本针对第一样本问题的答案分别属于各个第一样本分类标签的预测概率的任务；第一训练文本中至少包括第一样本分类文本、第一样本问题、多个第一样本分类标签以及各个第一样本分类标签分别对应的预测概率填写位；第一样本问题用于提示预测第一样本分类文本针对第一样本问题的答案分别属于各个第一样本分类标签的预测概率；第一标注分类标签为多个第一样本分类标签中的其中一个。

6、第五方面，示出了一种电子设备，包括：处理器；用于存储处理器可执行指令的存储器；其中，处理器被配置为执行如前述的任一方面所示的方法。

7、第六方面，示出了一种非临时性计算机可读存储介质，当存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如前述的任一方面所示的方法。

8、第七方面，示出了一种计算机程序产品，当计算机程序产品中的指令由电子设备的处理器执行时，使得电子设备能够执行如前述的任一方面所示的方法。

9、在本技术中，可以将样本分类文本、样本问题、多个样本分类标签以及各个样本分类标签分别对应的预测概率填写位组合以得到训练文本，并使用样本分类文本的标注分类标签，对“根据样本问题在各个样本分类标签分别对应的预测概率填写位上填写的预测概率”进行监督训练，以实现对预训练的语言模型进行针对各个样本分类标签分别对应的预测概率填写位的概率预测任务的优化学习，从而得到分类模型，以使分类模型在预测文本针对问题的答案分别属于各个分类标签的预测概率的预测任务上的性能更好(例如预测准确率更高等)。

10、另外，输入本技术的分类模型的待处理文本中至少包括线上分类文本、线上问题、多个线上分类标签以及各个线上分类标签分别对应的预测概率填写位，也即，分类模型会获知本次针对需要分类的线上分类文本进行哪些分类标签的分类，分类模型可以获知本次对线上分类文本的分类范围，例如，是在待处理文本中的多个线上分类标签的范围内分类，而不是在其他分类标签的范围内分类，且分类模型具有“预测线上分类文本针对线上问题的答案分别属于各个线上分类标签的预测概率”的能力，即使分类模型之前未曾感知到过待处理文本中的多个线上分类标签，但是，由于待处理文本中具有多个线上分类标签，且各个线上分类标签分别对应的预测概率填写位可以引导分类模型预测线上分类文本针对线上问题的答案分别属于各个线上分类标签的预测概率，而并非引导分类模型生成分类标签，从而可以克服对zero-shot场景的分类准确率低的问题，如此使得本技术的分类模型对zero-shot场景的分类准确率更高。

11、其次，本技术的分类模型可以对多个服务平台共享使用，各个服务平台可以不再根据自己的实际需求继续对分类模型训练，各个服务平台可以不掌握对分类模型的训练技术，降低了技术门槛。例如，即使各个服务平台的分类需求不同，即使各个服务平台需要对文本分类的分类标签也不同，各个服务平台可以直接部署本技术的分类模型，在其需要对线上分类文本分类时，其向分类模型输入的待处理文本中包括“线上分类文本、线上问题、多个线上分类标签以及各个线上分类标签分别对应的预测概率填写位”即可使得分类模型预测线上分类文本针对线上问题的答案分别属于各个线上分类标签的预测概率，对各个服务平台可以实现分类模型的冷启动使用。由于各个服务平台均可以不再训练分类模型，也就可以不获取样本分类文本，也可以不对样本分类文本标注，降低了各个服务平台的标注工作量，降低了人工成本。

12、以及，本技术的分类模型是预测线上分类文本针对线上问题的答案分别属于已知的各个线上分类标签的预测概率，不生成分类标签(也即，不执行生成文本的任务)，所以本技术的分类模型可以没有分类层，简化了分类模型的结构，例如，减少了分类模型中的网络参数，使得加载以及运行分类模型所需耗费的系统资源更少，且可以提高运算速度，进而提高分类效率。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朱杰郭立帆曾海峰陈风
技术所有人：阿里云计算有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。