基于神经网络模型的翻译方法及装置的制造方法_4

文档序号:9349932阅读:来源:国知局
读性和流畅性,降低了漏词率。
[0091 ] 在本发明所提供的几个实施例中,应该理解到,所公开的装置和方法,可以通过其 它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅 仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0092] 另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以 是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模 块既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
[0093] 上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存 储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算 机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发 明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器 (Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘 等各种可以存储程序代码的介质。
[0094] 以上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何 熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵 盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
【主权项】
1. 一种基于神经网络模型的翻译方法,其特征在于,所述方法包括: 获取源语言的语句; 将所述源语言的语句进行编码,得到向量序列; 基于所述向量序列逐词地预测目标语言中相应的候选词; 根据预测得到的候选词生成目标语言的语句, 其中,在任一所述候选词的预测处理中,从预设的翻译词表中获取多个初选词,并且基 于对数线性模型计算每个所述初选词的翻译概率,以根据所述翻译概率从所述多个初选词 选取所述候选词,所述对数线性模型根据神经网络翻译模型的翻译特征和统计机器翻译模 型的翻译特征建立的。2. 根据权利要求1所述的方法,其特征在于,所述从预设的翻译词表中获取多个初选 词,并且基于对数线性模型计算每个所述初选词的翻译概率,以根据所述翻译概率从所述 多个初选词选取所述候选词的处理包括: 从预设的翻译词表中获取M个词语作为初选词,M为正整数, 根据所述向量序列和在获取M个初选词之前预测出的候选词,计算每个所述初选词的 神经网络翻译模型的翻译特征, 计算每个所述初选词的统计机器翻译模型的翻译特征, 根据计算得到的神经网络翻译模型的翻译特征和统计机器翻译模型的翻译特征,结合 所述对数线性模型计算每个所述初选词的翻译概率值, 对计算得到的M个翻译概率值进行排序,并将与前N位的翻译概率值相应的初选词选 取为所述候选词,N为正整数,且N < M。3. 根据权利要求2所述的方法,其特征在于,所述基于所述向量序列逐词地预测目标 语言中相应的候选词的处理还包括:依据所述神经网络翻译模型的翻译特征标记所述候选 词之间的关联关系, 所述根据预测得到的候选词生成目标语言的语句的处理包括: 根据具有关联关系的所有候选词生成目标语言的语句。4. 根据权利要求3所述的方法,其特征在于,所述统计机器翻译模型的翻译特征包括 双向单词翻译模型特征。5. 根据权利要求4所述的方法,其特征在于,所述统计机器翻译模型的翻译特征还包 括N元语言模型特征和/或词惩罚特征。6. 根据权利要求1~5中任一项所述的方法,其特征在于,所述将所述源语言的语句进 行编码得到向量序列的处理包括: 对源语言的语句进行分词, 将分得的多个分词分别转换成与每个所述分词对应的词向量, 由多个分词各自对应的词向量得到所述向量序列。7. 根据权利要求6所述的方法,其特征在于,所述获取源语言的语句的处理包括以下 处理之一: 接收文本数据,并将所述文本数据作为所述源语言的语句, 接收语音数据,对所述语音数据进行语音识别得到经语音识别的文本数据,并将所述 经语音识别的文本数据作为所述源语言的语句, 接收图片数据,对所述图片数据进行光学字符识别OCR得到经OCR识别的文本数据,并 将所述经OCR识别的文本数据作为所述源语言的语句。8. -种基于神经网络模型的翻译装置,其特征在于,所述装置包括: 语句获取模块,用于获取源语言的语句; 语句编码模块,用于将所述源语言的语句进行编码得到向量序列; 候选词预测模块,用于基于所述向量序列逐词地预测目标语言中相应的候选词; 语句生成模块,用于根据预测得到的候选词生成目标语言的语句, 其中,在任一所述候选词的预测处理中,从预设的翻译词表中获取多个初选词,并且基 于对数线性模型计算每个所述初选词的翻译概率,以根据所述翻译概率从所述多个初选词 选取所述候选词,所述对数线性模型根据神经网络翻译模型的翻译特征和统计机器翻译模 型的翻译特征建立的。9. 根据权利要求8所述的装置,其特征在于,所述候选词预测模块包括: 初选词获取单元,用于从预设的翻译词表中获取M个词语作为初选词,M为正整数, 神经网络模型特征计算单元,用于根据所述向量序列和在获取M个初选词之前预测出 的候选词,计算每个所述初选词的神经网络翻译模型的翻译特征, 统计机器模型特征计算单元,用于计算每个所述初选词的统计机器翻译模型的翻译特 征, 翻译概率计算单元,用于根据计算得到的神经网络翻译模型的翻译特征和统计机器翻 译模型的翻译特征,结合所述对数线性模型计算每个所述初选词的翻译概率值, 候选词选取单元,用于对计算得到的M个翻译概率值进行排序,并将与前N位的翻译概 率值相应的初选词选取为所述候选词,N为正整数,且N < M。10. 根据权利要求9所述的装置,其特征在于,所述候选词预测模块还包括:候选词关 联单元,用于依据所述神经网络翻译模型的翻译特征标记所述候选词之间的关联关系, 所述语句生成模块,用于根据具有关联关系的所有候选词生成目标语言的语句。11. 根据权利要求10所述的装置,其特征在于,所述统计机器翻译模型的翻译特征包 括双向单词翻译模型特征。12. 根据权利要求11所述的装置,其特征在于,所述统计机器翻译模型的翻译特征还 包括N元语言模型特征和/或词惩罚特征。13. 根据权利要求8~12中任一项所述的装置,其特征在于,所述语句编码模块用于对 源语言的语句进行分词,将分得的多个分词分别转换成与每个所述分词对应的词向量,由 多个分词各自对应的词向量得到所述向量序列。14. 根据权利要求13所述的装置,其特征在于,所述语句获取模块包括以下单元之一: 文本数据接收单元,用于接收文本数据,并将所述文本数据作为所述源语言的语句, 语音数据接收及识别单元,用于接收语音数据,对所述语音数据进行语音识别得到经 语音识别的文本数据,并将所述经语音识别的文本数据作为所述源语言的语句, 图片数据接收及识别单元,用于接收图片数据,对所述图片数据进行光学字符识别OCR 得到经OCR识别的文本数据,并将所述经OCR识别的文本数据作为所述源语言的语句。
【专利摘要】本发明实施例提供了一种基于神经网络模型的翻译方法及装置。其中,基于神经网络模型的翻译方法包括:获取源语言的语句;将所述源语言的语句进行编码得到向量序列;基于所述向量序列逐词地预测目标语言中相应的候选词;根据预测得到的候选词生成目标语言的语句。本发明实施例的基于神经网络模型的翻译方法及装置,能够结合多种翻译特征执行翻译,提高了翻译结果的翻译质量、流利程度以及可读性。
【IPC分类】G06N3/02, G06F17/28
【公开号】CN105068998
【申请号】CN201510455270
【发明人】何中军, 和为, 吴华, 王海峰
【申请人】百度在线网络技术(北京)有限公司
【公开日】2015年11月18日
【申请日】2015年7月29日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1