一种提高多语言互译准确度的方法与流程

文档序号:16134703发布日期:2018-12-01 00:47阅读:139来源:国知局

本发明涉及一种多语言互译的方法,尤其是涉及一种提高多语言互译准确度的方法,涉及语言翻译技术领域。



背景技术:

双语是在一个国家或地区里用两种语言上课。这两种语言一种是学生的本族语/母语,另一种是学生所在地区的通用语言(第二语言)或学生所学习的目的语(外语)。双语教育是通过双语教学去实施的。我们发现翻译引擎因为数据量的质量和大小,导致它对不同语言的翻译效果是不一样的。在部分小语种的翻译上,某些翻译引擎的翻译质量比较好,有些则一般。



技术实现要素:

本发明要解决的技术问题是克服现有多语言互译技术准确度不高的缺陷,提供一种提高多语言互译准确度的方法,从而解决上述问题。

为实现上述目的,本发明提供如下技术方案:一种提高多语言互译准确度的方法,包括训练数据系统、多引擎翻译系统、评分系统和引擎调用规则;包括以下步骤:

步骤一:制定训练数据系统;具体为,收集大量标准的双语数据导入训练数据系统,该系统包括源语言模块、标准翻译模块和标准翻译导出模块。

步骤二:制定多引擎翻译系统;具体为,将多种翻译引擎导入该系统;多引擎翻译系统由采集模块、存储模块、翻译模块、翻译结果导出模块组成;其中存储模块汇集多种翻译引擎。

步骤三:制定评分系统;具体为,评分系统由翻译结果采集模块、标准翻译采集模块、评分模块和翻译结果导出模块组成;其中翻译结果采集模块和步骤二中的翻译结果导出模块连接,标准翻译采集模块和步骤一中的标准翻译导出模块连接;采集到的多种翻译结果和标准翻译对比并评分,评分高的翻译结果通过翻译结果导出模块导出。

步骤四:制定引擎调用规则;确定评分高的翻译结果对应的翻译引擎,从而制定引擎调用规则。

作为本发明的一种优选技术方案,所述步骤一中的标准翻译导出模块为单通道导出。

作为本发明的一种优选技术方案,所述步骤二中的翻译结果导出模块为多通道导出。

作为本发明的一种优选技术方案,所述步骤三中的翻译结果采集模块为多通道采集,标准翻译采集模块为单通道采集。

作为本发明的一种优选技术方案,所述步骤三中的评分模块为一个标注翻译模块对比多个翻译结果采集模块。

与现有技术相比,本发明的有益效果是:本发明通过构建多引擎翻译系统,通过大量标准的双语翻译数据作为训练数据系统,然后通过评分系统,确定多引擎调用规则,从而提供多语言互译的准确度。

附图说明

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:

图1为本发明系统结构图;

图2为本发明方法原理图;

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1

如图1-2所示,本发明提供一种提高多语言互译准确度的方法,包括训练数据系统、多引擎翻译系统、评分系统和引擎调用规则;包括以下步骤:

步骤一:制定训练数据系统;具体为,收集大量标准的双语数据导入训练数据系统,该系统包括源语言模块、标准翻译模块和标准翻译导出模块。

步骤二:制定多引擎翻译系统;具体为,将多种翻译引擎导入该系统;多引擎翻译系统由采集模块、存储模块、翻译模块、翻译结果导出模块组成;其中存储模块汇集多种翻译引擎。

步骤三:制定评分系统;具体为,评分系统由翻译结果采集模块、标准翻译采集模块、评分模块和翻译结果导出模块组成;其中翻译结果采集模块和步骤二中的翻译结果导出模块连接,标准翻译采集模块和步骤一中的标准翻译导出模块连接;采集到的多种翻译结果和标准翻译对比并评分,评分高的翻译结果通过翻译结果导出模块导出。

步骤四:制定引擎调用规则;确定评分高的翻译结果对应的翻译引擎,从而制定引擎调用规则。

具体的,步骤一中的标准翻译导出模块为单通道导出,步骤二中的翻译结果导出模块为多通道导出,步骤三中的翻译结果采集模块为多通道采集,标准翻译采集模块为单通道采集,步骤三中的评分模块为一个标注翻译模块对比多个翻译结果采集模块。

具体原理:本发明在工作时,步骤一:制定训练数据系统作为标准;步骤二:制定多引擎翻译系统;步骤三:制定评分系统,将训练数据系统中的标准翻译模块和多引擎翻译系统中的翻译结果导出模块中数据相比较并对比;步骤四:制定引擎调用规则;将较高得分的翻译引擎调出并制定引擎调用规则。

本发明通过构建多引擎翻译系统,通过大量标准的双语翻译数据作为训练数据系统,然后通过评分系统,确定多引擎调用规则,从而提供多语言互译的准确度。

最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。



技术特征:

技术总结
本发明公开了一种提高多语言互译准确度的方法,包括训练数据系统、多引擎翻译系统、评分系统和引擎调用规则;方法包括以下步骤:一:制定训练数据系统;该系统包括源语言模块、标准翻译模块和标准翻译导出模块;二:制定多引擎翻译系统;该系统由采集模块、存储模块、翻译模块、翻译结果导出模块组成;三:制定评分系统;该系统由翻译结果采集模块、标准翻译采集模块、评分模块和翻译结果导出模块组成;四:制定引擎调用规则;确定评分高的翻译引擎,从而制定引擎调用规则;本发明通过构建多引擎翻译系统,通过大量标准的双语翻译数据作为训练数据系统,通过评分系统,确定多引擎调用规则,从而提供多语言互译的准确度。

技术研发人员:张岩;林彦;熊涛
受保护的技术使用者:深圳市合言信息科技有限公司
技术研发日:2018.06.12
技术公布日:2018.11.30
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1