一种基于CNN与BERT模型的英文语法纠错方法与流程

文档序号：21781555发布日期：2020-08-07 20:08阅读：817来源：国知局

本发明是自然语言处理领域中的一项任务，主要是一种基于cnn（convolutionalneuralnetworks，卷积神经网络）与bert（bidirectionalencoderrepresentationsfromtransformers）模型的英文语法纠错方法。

背景技术：

对于国内英语学习者来说，语法往往是他们在英语学习中的难点，由于教学资源有限，学习者们遇到的语法问题往往不能及时得到正确的修改意见与范例。如果能有一种语法纠错系统，使得学习者们在学习和使用英语的过程中出现的语法错误能够被及时地指出，并给出相应的反馈建议，则可以极大地降低学习者们学习的难度，并显著地提高他们的英语水平。传统的英文纠错系统大多是单纯基于统计机器翻译原理或是基于某种语法规则而实现的纠错系统，准确度不高，训练模型效率低，能够查出的语法错误类型也有限。针对这些问题，本文提出了一种基于cnn与bert模型的英文语法纠错方法。利用cnn+attention（注意力机制）有效地提取句子特征；同时通过对bert模型进行fine-tuning（参数微调），训练新的语言模型，为神经网络的输出结果评分，选出最佳的纠错结果。

技术实现要素：

本发明提出一种基于cnn与bert模型的英文语法纠错方法，将语法纠错视为一种从错误的“坏英语”到对应正确的“好英语”的翻译类任务，使用encoder–decoder（编码-解码）框架。模型采用了cnn+attention+bert结构。通过大量的平行语料，训练cnn模型，使其学习从错误句子到正确句子的映射；同时，在decoder层添加attention模块，为单词增加权重，以提高模型的精确度；利用大量平行语料对bert模型进行fine-tuning，实现（0,1）分类的效果，当输入一个句子时，可以返回将该句子判断为正确的概率值。将cnn模型的纠错结果输入bert模型中，得到相应的得分，结合二者的评分，即可选出最佳的纠错结果。

附图说明：

图1英语语法纠错系统流程图

图2多层卷积模型体系结构图

图3bert评分流程图

具体实施步骤：

本发明实现的方法流程如图1所示，整体主要包含以下三个步骤：数据收集，模型训练，模型运用。

数据收集：在互联网上收集大量的“错误-正确”的英语平行语料，分别存放在两个文件中，存放顺序一致。

模型训练：对于神经网络模型，将平行语料输入到encoder–decoder框架中，模型框架如图2所示（其中，s1表示传入第一个编码层中的词向量，f1表示s1经过卷积操作后得到的张量，o1表示f1经过全连接层后得到的张量，d1表示第一个解码层解码后得到的张量）。通过设置学习率等参数，让模型进行迭代训练，直至生成理想的模型；对于bert评分模型，将平行语料输入到预训练好的bert模型中进行fine-tuning，为其添加（0,1）分类任务，对错误的句子添加“0”标签，正确的句子添加“1”标签，fine-tuning完成后，模型即可为输入的句子给出判断其为“0”或“1”的概率，这里我们取正确（判断为“1”）的概率。

模型运用：得到训练好的cnn模型和bert模型后，我们将有语法错误的句子输入cnn模型，会得到5个修改结果，再将这5个修改结果输入bert模型，分别得到它们是正确句子的概率，取概率值最高的句子，即为最终的纠错结果。

结合一个具体的实例方法，语法纠错操作流程步骤如下：

1)搜集大量的“错误-正确”平行语料；

2)利用卷积神经网络训练纠错模型；

3)利用bert训练评分模型；

4)将待纠错的句子输入步骤2中的模型，得到纠错结果后输入步骤3中的模型，得到相应的分数，取得分最高的句子为最终的纠错结果。

技术特征：

1.一种基于cnn与bert模型的英文语法纠错方法，利用基于encoder-decoder框架的cnn+attention模型对英文句子进行纠错。

2.一种基于cnn与bert模型的英文语法纠错方法，利用bert模型为英文句子评分。

技术总结
英文语法纠错是自然语言处理领域中的一个重要研究方向。传统的语法纠错系统多基于规则判断，能够检测出的错误种类有限，扩展能力差。现有的基于循环神经网络的语法纠错系统在面对长句子时，容易丢失头尾的信息，且由于无法并行提取特征，致使训练周期长。本发明提供了一种基于CNN与BERT模型的英文语法纠错方法。模型采用了CNN+Attention+BERT结构，实现方式采用了Encoder‑Decoder框架。通过卷积，能够高效并准确地提取上下文的特征；Attention层为不同的单词增加的权重，使得模型可以学到更重要的特征；BERT采用了Masked Language Model的方式来训练语言模型，通过fine‑tuning可以为其添加（0,1）分类任务，用于为纠错系统输出的句子评分，提高系统准确度。

技术研发人员：马士成;贾艳明
受保护的技术使用者：北京博智天下信息技术有限公司
技术研发日：2019.01.29
技术公布日：2020.08.07

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：马士成;贾艳明
技术所有人：北京博智天下信息技术有限公司
我是此专利的发明人

上一篇：网络配置方法、装置、设备和系统与流程
上一篇：一种氢燃料电池用的离心式压缩机的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。