一种神经机器翻译NMT模型的创建方法及系统与流程

文档序号:18060293发布日期:2019-07-03 03:02阅读:来源:国知局

技术特征:

技术总结
本发明公开的神经机器翻译NMT模型的创建方法及系统,利用爬虫技术,从网络资源中获取一定数量的通用中英文对照语句,生成通用语料库,利用爬虫技术,从多套中英对照信息学科类电子书籍中获取一定数量的学科类中英文对照文本并将中英文本序列化,并对长度不一的学科类中英文对照语句依次进行调节,对调节后的序列进行翻译,将得到的翻译结果与对应的中文或英文做相似度匹配,将相似度大于设定阈值的句子设为专业语料库,生成专业语料库,利用通用语料库及专业语料库对序列到序列Seq2Seq模型进行训练,建立NMT模型,实现了专业领域文本的精确翻译,提高了翻译质量、满足了人们对专业领域文本的翻译需求。

技术研发人员:李涵;张东生;韩昊天;刘纯燕
受保护的技术使用者:河南大学
技术研发日:2019.03.27
技术公布日:2019.07.02
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1