翻译方法、装置、非易失性存储介质及电子设备与流程

文档序号:37634288发布日期:2024-04-18 17:49阅读:10来源:国知局
翻译方法、装置、非易失性存储介质及电子设备与流程

本发明涉及自然语言处理领域,具体而言,涉及一种翻译方法、装置、非易失性存储介质及电子设备。


背景技术:

1、目前,化工领域对于中文化翻译的需求增加显著,准确的传达和理解技术、安全、操作等重要信息成为中文化翻译的关键需求。

2、一方面,以石化行业为例,大型炼化项目智能仪表多达3w台,种类达上百种,需要中文化的仪表参数和仪表报警条目多达4万条;协调仪表厂商翻译术语也存在一定困难。而需要中文化的仪表参数和仪表报警总条目高达百万。通常智能仪表软件自行或依靠协调客户与厂商翻译实现完全中文化,需要5年左右,并需要大量的资源投入。

3、另一方面,现有的翻译工具在化工领域存在一些不足之处,例如对于特定报警名称、技术术语和仪表参数的理解可能不够准确,导致翻译结果的可靠性受到影响。这就为本发明的技术创新提供了机遇和优势。

4、针对上述现有翻译工具的翻译结果不准确的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本发明实施例提供了一种翻译方法、装置、非易失性存储介质及电子设备,以至少解决现有翻译工具的翻译结果不准确的技术问题。

2、根据本发明实施例的一个方面,提供了一种翻译方法,包括:获取待翻译语料;确定所述待翻译语料基于第一翻译模型的目标置信度,其中,所述目标置信度用于表示所述第一翻译模型对所述待翻译语料的翻译质量,所述第一翻译模型预先使用第一预设语料库训练得到,所述第一预设语料库用于使用平行的第一语言和第二语言记录多个第一样本语料,所述第一样本语料与所述待翻译语料同属于目标业务领域,所述第一语言与所述第二语言不同;根据所述目标置信度与预设置信度阈值的目标比对结果,选择目标翻译模型,其中,在所述目标比对结果表示所述目标置信度大于所述预设置信度阈值的情况下,所述目标翻译模型为所述第一翻译模型,在所述目标比对结果表示所述目标置信度不大于所述预设置信度阈值的情况下,所述目标翻译模型为第二翻译模型,所述第二翻译模型预先使用第二预设语料库训练得到,所述第二预设语料库用于使用平行的所述第一语言和所述第二语言记录多个第二样本语料,所述第二样本语料为自然语言语料;使用所述目标翻译模型对所述待翻译语料进行翻译,得到翻译结果。

3、可选地,确定所述待翻译语料基于第一翻译模型的目标置信度包括:确定所述待翻译语料基于第三翻译模型的第一置信度,其中,所述第一翻译模型包括:所述第三翻译模型,所述第三翻译模型对所述待翻译语料中的特殊字符的翻译具有高准确性,所述目标置信度包括:所述第一置信度。

4、可选地,在确定所述待翻译语料基于第三翻译模型的第一置信度之后,所述方法还包括:检测所述第一置信度是否大于预设置信度阈值;在所述第一置信度不大于所述预设置信度阈值的情况下,确定所述待翻译语料基于第四翻译模型的第二置信度,其中,所述第四翻译模型对所述待翻译语料中不同句子结构、上下文和语义具有高理解能力,所述第一翻译模型还包括:所述第四翻译模型,所述目标置信度还包括:所述第二置信度。

5、可选地,所述方法还包括:在所述第一置信度大于所述预设置信度阈值的情况下,将第一比较结果确定为所述目标比对结果,其中,所述第一比较结果表示所述第一置信度大于所述预设置信度阈值。

6、可选地,在在所述第一置信度不大于所述预设置信度阈值的情况下,确定所述待翻译语料基于第四翻译模型的第二置信度之后,所述方法还包括:检测所述第二置信度是否大于所述预设置信度阈值;在所述第二置信度大于所述预设置信度阈值的情况下,将第二比较结果确定为所述目标比对结果,其中,所述第二比较结果表示所述第二置信度大于所述预设置信度阈值;在所述第二置信度不大于所述预设置信度阈值的情况下,将第三比较结果确定为所述目标比对结果,其中,所述第三比较结果表示所述第二置信度不大于所述预设置信度阈值。

7、可选地,确定所述待翻译语料基于第一翻译模型的目标置信度包括:使用所述第一翻译模型对所述待翻译语料进行翻译,得到所述待翻译语料中每个单词的翻译预测概率,其中,所述待翻译语料中包括多个所述单词;确定多个所述翻译预测概率的平均值,得到平均翻译预测概率;根据所述平均翻译预测概率所属的预设概率区间,确定所述目标置信度,其中,所述预设概率区间为多个,每个所述预设概率区间存在对应的预设置信度,所述目标置信度为目标概率区间对应的所述预设置信度,所述目标概率区间包括所述平均翻译预测概率。

8、可选地,在确定所述待翻译语料基于第一翻译模型的目标置信度之前,所述方法还包括:获取所述目标业务领域的语料文本,其中,所述语料文本包括:中文文本和英文文本,所述中文文本为基于第一语言记录的第一字符串,所述英文文本为基于第二语言记录的第二字符串;对所述第一字符串进行第一预处理,得到第一处理语料,其中,所述第一预处理,用于去除所述第一字符串中使用非第一语言记录的第一目标字符,得到第一目标字符串,将所述第一目标字符串拆分为单个字符,并为每个所述单个字符添加第一标记;对所述第二字符串进行第二预处理,得到第二处理语料,其中,所述第二预处理,用于将所述第二字符串中的每个字符转换为目标格式,得到第二目标字符串,去除所述第二目标字符串中使用非第一语言记录的第二目标字符,得到第三字符串,在所述第三字符串的开头和结尾添加第二标记;将所述第一处理语料和所述第一处理语料,确定为第一预设语料库中的第一样本语料。

9、根据本发明实施例的另一方面,还提供了一种翻译装置,包括:获取模块,用于获取待翻译语料;确定模块,用于确定所述待翻译语料基于第一翻译模型的目标置信度,其中,所述目标置信度用于表示所述第一翻译模型对所述待翻译语料的翻译质量,所述第一翻译模型预先使用第一预设语料库训练得到,所述第一预设语料库用于使用平行的第一语言和第二语言记录多个第一样本语料,所述第一样本语料与所述待翻译语料同属于目标业务领域,所述第一语言与所述第二语言不同;选择模块,用于根据所述目标置信度与预设置信度阈值的目标比对结果,选择目标翻译模型,其中,在所述目标比对结果表示所述目标置信度大于所述预设置信度阈值的情况下,所述目标翻译模型为所述第一翻译模型,在所述目标比对结果表示所述目标置信度不大于所述预设置信度阈值的情况下,所述目标翻译模型为第二翻译模型,所述第二翻译模型预先使用第二预设语料库训练得到,所述第二预设语料库用于使用平行的所述第一语言和所述第二语言记录多个第二样本语料,所述第二样本语料为自然语言语料;翻译模块,用于使用所述目标翻译模型对所述待翻译语料进行翻译,得到翻译结果。

10、根据本发明实施例的另一方面,还提供了一种非易失性存储介质,所述非易失性存储介质用于存储程序,其中,在所述程序运行时控制所述非易失性存储介质所在设备执行上述翻译方法。

11、根据本发明实施例的另一方面,还提供了一种电子设备,包括:存储器和处理器,所述处理器用于运行存储在所述处理器中的程序,其中,所述程序运行时执行上述翻译方法。

12、在本发明实施例中,优先使用基于目标业务领域的第一样本语料训练的第一翻译模型进行翻译,可以对待翻译语料进行准确翻译,并且在第一翻译模型的目标置信度不满足使用需求的情况下,还可以使用基于自然语言的第二样本语料训练的第二翻译模型进行翻译,可以确保对待翻译语料的成功翻译,达到了提高翻译准确性的目的,从而实现了确保翻译结果的准确性的技术效果,进而解决了现有翻译工具的翻译结果不准确技术问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1