多任务文本纠错模型的训练与多任务文本纠错方法、设备与流程

文档序号：34617830发布日期：2023-06-29 12:01阅读：37来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本技术涉及人工智能，尤其涉及一种多任务文本纠错模型的训练与多任务文本纠错方法、设备。

背景技术：

1、文本纠错是指对文本中出现错误的内容进行纠正的过程，利用深度学习模型是实现中文语句错误检测、自动纠正的一项关键研究内容，该任务在文字编辑和校对行业，作为单独的一项功能，可提高语言正确性的同时减少人工校验成本。

2、目前，互联网上存在大量的文本信息传播，为了防止敏感信息以及不良信息的无限制传播，基于文本的敏感信息检测是实现对不良言论进行管控和监督的重要手段。

3、在现有技术中，文本纠错与敏感信息检测通常都是分开进行的，文本纠错和敏感词的信息无法相互辅助，特征无法共享，从而导致检测效率较低。

技术实现思路

1、本技术提供了一种多任务文本纠错模型的训练与多任务文本纠错方法、设备，可以解决现有技术中文本纠错与敏感信息检测的效率较低的技术问题。

2、第一方面，本技术提供了一种多任务文本纠错模型的训练方法，该方法包括：

3、获取训练数据，所述训练数据包括多种不同错误类型的错误文本样本以及多种不同敏感信息类型的敏感信息文本样本；

4、确定所述训练数据对应的输入向量，所述输入向量包括字特征表示向量、段特征表示向量及位置特征表示向量；

5、基于所述输入向量对预训练语言模型进行训练，得到多任务文本纠错模型；其中，所述预训练语言模型包括文本错误检测网络、文本错误纠正网络、文本错误类型分类网络、敏感信息检测网络以及敏感信息类型分类网络。

6、在一些实施方式中，还包括：

7、构建所述预训练语言模型；

8、所述构建所述预训练语言模型，包括：

9、构建bert模型；

10、在所述bert模型的输出端增加第一全连接层作为所述文本错误检测网络；

11、在所述bert模型的输出端增加卷积神经网络(convolutional neural network，cnn)层作为所述文本错误类型分类网络；

12、将所述bert模型的掩码语言模型(masked language model，mlm)网络作为所述文本错误纠正网络；

13、在所述bert模型的输出端增加第二全连接层作为所述敏感信息检测网络；

14、在所述bert模型的输出端增加sigmoid层作为所述敏感信息类型分类网络。

15、在一些实施方式中，所述预训练语言模型的损失函数为所述文本错误检测网络、所述文本错误纠正网络、所述文本错误类型分类网络、所述敏感信息检测网络以及所述敏感信息类型分类网络对应的损失函数的加权和。

16、第二方面，本技术提供了一种多任务文本纠错方法，该方法包括：

17、获取待纠错文本对应的输入向量，所述输入向量包括字特征表示向量、段特征表示向量及位置特征表示向量；

18、基于所述输入向量与多任务文本纠错模型，得到多个任务的检测结果向量，所述多个任务的检测结果向量包括文本错误检测结果向量、文本错误纠正结果向量、文本错误类型分类结果向量、敏感信息检测结果向量以及敏感信息类型分类结果向量；所述多任务文本纠错模型是根据第一方面提供的多任务文本纠错模型的训练方法获得的；

19、根据所述多个任务的检测结果向量，输出所述多个任务的输出结果。

20、在一些实施方式中，所述根据所述多个任务的检测结果向量，输出所述多个任务的输出结果，包括：

21、根据所述文本错误检测结果向量，输出所述待纠错文本对应的文本错误检测结果；

22、根据所述文本错误纠正结果向量，输出所述待纠错文本纠错后的目标文本；

23、根据所述文本错误类型分类结果向量，输出所述待纠错文本的文本错误类型；

24、根据所述敏感信息检测结果向量，输出所述待纠错文本对应的敏感信息检测结果；

25、根据所述敏感信息类型分类结果向量，输出所述待纠错文本对应的敏感信息类型。

26、第三方面，本技术提供了一种多任务文本纠错模型的训练装置，该装置包括：

27、初始化模块，用于获取训练数据，所述训练数据包括多种不同错误类型的错误文本样本以及多种不同敏感信息类型的敏感信息文本样本；

28、特征抽取模块，用于确定所述训练数据对应的输入向量，所述输入向量包括字特征表示向量、段特征表示向量及位置特征表示向量；

29、训练模块，用于基于所述输入向量对预训练语言模型进行训练，得到多任务文本纠错模型；其中，所述预训练语言模型包括文本错误检测网络、文本错误纠正网络、文本错误类型分类网络、敏感信息检测网络以及敏感信息类型分类网络。

30、在一些实施方式中，还包括模型构建模块，用于构建所述预训练语言模型；

31、所述构建所述预训练语言模型，包括：

32、构建bert模型；

33、在所述bert模型的输出端增加第一全连接层作为所述文本错误检测网络；

34、在所述bert模型的输出端增加cnn层作为所述文本错误类型分类网络；

35、将所述bert模型的mlm网络作为所述文本错误纠正网络；

36、在所述bert模型的输出端增加第二全连接层作为所述敏感信息检测网络；

37、在所述bert模型的输出端增加sigmoid层作为所述敏感信息类型分类网络。

38、第四方面，本技术提供了一种多任务文本纠错装置，该装置包括：

39、特征抽取模块，用于获取待纠错文本对应的输入向量，所述输入向量包括字特征表示向量、段特征表示向量及位置特征表示向量；

40、处理模块，用于基于所述输入向量与多任务文本纠错模型，得到多个任务的检测结果向量，所述多个任务的检测结果向量包括文本错误检测结果向量、文本错误纠正结果向量、文本错误类型分类结果向量、敏感信息检测结果向量以及敏感信息类型分类结果向量；所述多任务文本纠错模型是根据第三方面提供的多任务文本纠错模型的训练装置获得的；

41、输出模块，用于根据所述多个任务的检测结果向量，输出所述多个任务的输出结果。

42、第五方面，本技术提供了一种电子设备，包括：至少一个处理器和存储器；

43、所述存储器存储计算机执行指令；

44、所述至少一个处理器用于执行所述存储器存储的计算机执行指令，以实现如第一方面提供的多任务文本纠错模型的训练方法，或者实现如第二方面提供的多任务文本纠错方法。

45、第六方面，本技术提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当计算机执行所述计算机执行指令时，实现如第一方面提供的多任务文本纠错模型的训练方法，或者实现如第二方面提供的多任务文本纠错方法。

46、本技术提供的多任务文本纠错模型的训练与多任务文本纠错方法、设备，可以实现多任务文本纠错模型的联合训练，且该多任务文本纠错模型能够同时对待测文本进行文本纠错和敏感信息检测，从而能够提升文本纠错与敏感信息检测的效率。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：邓慧桑海岩刘文廉士国
技术所有人：联通数字科技有限公司
我是此专利的发明人

上一篇：一种单晶硅拉制装置的制作方法
上一篇：一种电压转换器中的负载切换调节电路及方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。