基于神经网络模型的翻译方法及装置的制造方法

文档序号：9349932阅读：364来源：国知局

基于神经网络模型的翻译方法及装置的制造方法
【技术领域】
[0001] 本发明涉及机器翻译技术领域，尤其涉及一种基于神经网络模型的翻译方法及装置。
【背景技术】
[0002] 近年来，循环神经网络（Recurrent Neural Network，RNN)技术被广泛应用于机器翻译领域。与传统的统计机器翻译系统相比，基于循环神经网络的机器翻译系统能够充分利用全局语义信息，翻译质量显著提升。
[0003] 然而，基于循环神经网络的机器翻译技术也存在着明显的不足之处：
[0004] -、词表受限。
[0005] 通常，RNN翻译模型仅能使用一个数量有限的单词词表（通常三万单词以内），导致词表外单词（0ut-〇f-vocabulary，00V)无法翻译。
[0006] 二、RNN翻译模型仅支持双语语句对进行训练，难以利用可有效提高翻译结果流利度的目标语言单语语料进行训练。
[0007] 三、无法增加或丰富更多的特征。
[0008] 具体来说，传统的统计机器翻译方法是基于多种特征执行翻译处理的，对于每一个翻译单元（单词、短语、翻译规则等）均计算每个特征的得分，最终结合多个特征的得分来确定最优翻译结果。然而，这些能够提高翻译质量的特征无法直接为RNN翻译模型所用。
[0009] 四、漏词现象严重，易生成较短翻译结果，影响翻译结果的可读性。

【发明内容】

[0010] 本发明实施例的目的在于，提供一种基于神经网络模型的翻译方法及装置，结合多种翻译特征执行翻译，以提高翻译结果的翻译准确性。
[0011] 为实现上述发明目的，本发明的实施例提供了一种基于神经网络模型的翻译方法，包括：获取源语言的语句；将所述源语言的语句进行编码，得到向量序列；基于所述向量序列逐词地预测目标语言中相应的候选词；根据预测得到的候选词生成目标语言的语句，其中，在任一所述候选词的预测处理中，从预设的翻译词表中获取多个初选词，并且基于对数线性模型计算每个所述初选词的翻译概率，以根据所述翻译概率从所述多个初选词选取所述候选词，所述对数线性模型根据神经网络翻译模型的翻译特征和统计机器翻译模型的翻译特征建立的。
[0012] 优选地，所述从预设的翻译词表中获取多个初选词，并且基于对数线性模型计算每个所述初选词的翻译概率，以根据所述翻译概率从所述多个初选词选取所述候选词的处理包括：从预设的翻译词表中获取M个词语作为初选词，M为正整数；根据所述向量序列和在获取M个初选词之前预测出的候选词，计算每个所述初选词的神经网络翻译模型的翻译特征；计算每个所述初选词的统计机器翻译模型的翻译特征；根据计算得到的神经网络翻译模型的翻译特征和统计机器翻译模型的翻译特征，结合所述对数线性模型计算每个所述初选词的翻译概率值；对计算得到的M个翻译概率值进行排序，并将与前N位的翻译概率值相应的初选词选取为所述候选词，N为正整数，且N < M。
[0013] 优选地，所述基于所述向量序列逐词地预测目标语言中相应的候选词的处理还包括：依据所述神经网络翻译模型的翻译特征标记所述候选词之间的关联关系，所述根据预测得到的候选词生成目标语言的语句的处理包括：根据具有关联关系的所有候选词生成目标语言的语句。
[0014] 优选地，所述统计机器翻译模型的翻译特征包括双向单词翻译模型特征。
[0015] 优选地，所述统计机器翻译模型的翻译特征还包括N元语言模型特征和/或词惩罚特征。
[0016] 优选地，所述将所述源语言的语句进行编码得到向量序列的处理包括：对源语言的语句进行分词，将分得的多个分词分别转换成与每个所述分词对应的词向量，由多个分词各自对应的词向量得到所述向量序列。
[0017] 优选地，所述获取源语言的语句的处理包括以下处理之一：接收文本数据，并将所述文本数据作为所述源语言的语句；接收语音数据，对所述语音数据进行语音识别得到经语音识别的文本数据，并将所述经语音识别的文本数据作为所述源语言的语句；接收图片数据，对所述图片数据进行光学字符识别OCR得到经OCR识别的文本数据，并将所述经OCR 识别的文本数据作为所述源语言的语句。
[0018] 本发明的实施例还提供了一种基于神经网络模型的翻译装置，包括：语句获取模块，用于获取源语言的语句；语句编码模块，用于将所述源语言的语句进行编码得到向量序列；候选词预测模块，用于基于所述向量序列逐词地预测目标语言中相应的候选词；语句生成模块，用于根据预测得到的候选词生成目标语言的语句，其中，在任一所述候选词的预测处理中，从预设的翻译词表中获取多个初选词，并且基于对数线性模型计算每个所述初选词的翻译概率，以根据所述翻译概率从所述多个初选词选取所述候选词，所述对数线性模型根据神经网络翻译模型的翻译特征和统计机器翻译模型的翻译特征建立的。
[0019] 优选地，所述候选词预测模块包括：初选词获取单元，用于从预设的翻译词表中获取M个词语作为初选词，M为正整数；神经网络模型特征计算单元，用于根据所述向量序列和在获取M个初选词之前预测出的候选词，计算每个所述初选词的神经网络翻译模型的翻译特征；统计机器模型特征计算单元，用于计算每个所述初选词的统计机器翻译模型的翻译特征；翻译概率计算单元，用于根据计算得到的神经网络翻译模型的翻译特征和统计机器翻译模型的翻译特征，结合所述对数线性模型计算每个所述初选词的翻译概率值；候选词选取单元，用于对计算得到的M个翻译概率值进行排序，并将与前N位的翻译概率值相应的初选词选取为所述候选词，N为正整数，且N < M。
[0020] 优选地，所述候选词预测模块还包括：候选词关联单元，用于依据所述神经网络翻译模型的翻译特征标记所述候选词之间的关联关系，所述语句生成模块，用于根据具有关联关系的所有候选词生成目标语言的语句。
[0021] 优选地，所述统计机器翻译模型的翻译特征包括双向单词翻译模型特征。
[0022] 优选地，所述统计机器翻译模型的翻译特征还包括N元语言模型特征和/或词惩罚特征。
[0023] 优选地，所述语句编码模块用于对源语言的语句进行分词，将分得的多个分词分别转换成与每个所述分词对应的词向量，由多个分词各自对应的词向量得到所述向量序列。
[0024] 优选地，所述语句获取模块包括以下单元之一：文本数据接收单元，用于接收文本数据，并将所述文本数据作为所述源语言的语句；语音数据接收及识别单元，用于接收语音数据，对所述语音数据进行语音识别得到经语音识别的文本数据，并将所述经语音识别的文本数据作为所述源语言的语句；图片数据接收及识别单元，用于接收图片数据，对所述图片数据进行光学字符识别OCR得到经OCR识别的文本数据，并将所述经OCR识别的文本数据作为所述源语言的语句。
[0025] 本发明实施例提供的基于神经网络模型的翻译方法及装置，对获取到的源语言的语句进行编码得到向量序列，再基于向量序列逐词地预测目标语言中相应的候选词，在任一所述候选词的预测处理过程中，利用对数线性模型，将统计机器翻译模型的翻译特征引入神经网络翻译模型，从而计算从预设的翻译词表中获取的每个初选词的翻译概率，由此基于翻译概率计算结果从多个初选词中选取候选词，最终根据预测的候选词自动地生成目标语言的语句，极大地提高了翻译的准确性、可读性及流畅性。同时，生成的翻译结果长度适宜，降低了漏词率。
【附图说明】
[0026] 图1是示出本发明实施例一的基于神经网络模型的翻译方法的流程图；
[0027] 图2是示出本发明实施例一的基于神经网络模型的翻译方法中神经网络翻译模型的应用场景示例性示意图；
[0028] 图3是示出本发明实施例一的基于神经

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：何中军;和为;吴华;王海峰;
技术所有人：百度在线网络技术（北京）有限公司;
我是此专利的发明人

上一篇：一种修正实体词识别的方法和装置的制造方法
上一篇：平行语料的构建方法及装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。