文本翻译方法、设备、系统及存储介质与流程

文档序号:34117120发布日期:2023-05-11 00:56阅读:31来源:国知局
文本翻译方法、设备、系统及存储介质与流程

本技术涉及人工智能领域,尤其涉及一种文本翻译方法、设备、系统及存储介质。


背景技术:

1、目前,在很多应用场景中,直接应用现有的机器翻译模型很难达到令人满意的翻译结果,尤其是在某一特定领域,如金融、医疗、法律、科技等领域内。在这些特定领域中,可能存在大量的专业术语,机器翻译模型很难准确翻译。


技术实现思路

1、本技术实施例提供一种文本翻译方法、设备、系统及存储介质,提升对术语的翻译效果。

2、本技术实施例的第一方面提供一种文本翻译方法,该方法包括:获取目标文本,目标文本包括多个文本元素;若多个文本元素中的第一文本元素包含在术语表,根据第一文本元素、术语表、目标文本以及预训练的神经网络翻译模型,确定第一文本元素的翻译文本的第一预测分布数据;根据第一预测分布数据确定第一文本元素的翻译文本。

3、一种可选的实施例中,根据第一文本元素、术语表、目标文本以及预训练的神经网络翻译模型,确定第一文本元素的翻译文本的第一预测分布数据,包括:根据目标文本以及神经网络翻译模型,获取目标文本中第一文本元素的翻译文本的第一特征向量,以及目标文本中第一文本元素的翻译文本的第二预测分布数据;根据目标文本中第一文本元素的翻译文本的第一特征向量、第一文本元素、术语表以及神经网络翻译模型,获取第一文本元素的翻译文本的第三预测分布数据;根据第二预测分布数据以及第三预测分布数据,生成第一预测分布数据。

4、一种可选的实施例中,根据目标文本中第一文本元素的翻译文本的第一特征向量、第一文本元素、术语表以及神经网络翻译模型,获取第一文本元素的翻译文本的第三预测分布数据,包括:从术语表中获取第一文本元素对应的至少一组语句对;根据至少一组语句对、第一文本元素以及神经网络翻译模型,获取至少一组语句对中第一文本元素的m个预测文本的特征向量;m为大于2的正整数;根据第一特征向量以及m个预测文本的特征向量,生成第三预测分布数据。

5、一种可选的实施例中,至少一组语句对包括第一源语句和与第一源语句对应的第一目标语句,第一源语句中包括第一文本元素;根据至少一组语句对、第一文本元素以及神经网络翻译模型,获取至少一组语句对中第一文本元素的m个预测文本的特征向量,包括:将第一源语句输入神经网络翻译模型的编码器,获取编码器输出的第一源语句的上下文特征向量;从第一目标语句中获取第一源语句中与第一文本元素关联的文本元素对应的第二目标语句;获取第二目标语句的特征向量;根据第一源语句的上下文特征向量以及第二目标语句的特征向量,获取第一源语句中第一文本元素的m个预测文本的特征向量。

6、一种可选的实施例中,根据第一特征向量以及m个预测文本的特征向量,生成第三预测分布数据,包括:获取第一特征向量分别与m个预测文本的特征向量的距离值;获取距离值从小到大的前k个预测文本;k为小于m的正整数;生成第三预测分布数据,第三预测分布数据包括前k个预测文本,以及第一特征向量分别与前k个预测文本的特征向量的距离值。

7、一种可选的实施例中,根据目标文本以及神经网络翻译模型,获取目标文本中第一文本元素的翻译文本的第二预测分布数据,包括:将目标文本输入神经网络翻译模型的编码器,获取编码器输出的目标文本的上下文特征向量;获取目标文本中与第一文本元素关联的文本元素对应的翻译文本的第二特征向量;根据目标文本的上下文特征向量以及第二特征向量,获取第二预测分布数据。

8、一种可选的实施例中,根据第二预测分布数据以及第三预测分布数据,生成第一预测分布数据,包括:若第三预测分布数据中的最小距离值小于或等于预设阈值,则根据第二预测分布数据以及第三预测分布数据,生成第一预测分布数据;若第三预测分布数据中的最小距离值大于预设阈值,则将第二预测分布数据作为第一预测分布数据。

9、一种可选的实施例中,根据第二预测分布数据以及第三预测分布数据,生成第一预测分布数据,包括:对第三预测分布数据中的距离值做转换和归一化处理;根据处理后的第三预测分布数据以及第二预测分布数据,生成第一预测分布数据。

10、本技术实施例的第二方面提供一种文本翻译方法,该方法包括:接收来自客户端的文本翻译请求,文本翻译请求包括目标文本,目标文本包括多个文本元素;若多个文本元素中的第一文本元素包含在术语表,根据第一文本元素、术语表、目标文本以及预训练的神经网络翻译模型,确定第一文本元素的翻译文本的第一预测分布数据;根据第一预测分布数据确定第一文本元素的翻译文本;获取目标文本中的多个文本元素的翻译文本;向客户端发送文本翻译响应,文本翻译响应包括目标文本中的多个文本元素的翻译文本。

11、本技术实施例的第三方面提供一种文本翻译设备,包括:获取单元,用于获取目标文本,目标文本包括多个文本元素;处理单元,用于若多个文本元素中的第一文本元素包含在术语表,根据第一文本元素、术语表、目标文本以及预训练的神经网络翻译模型,确定第一文本元素的翻译文本的第一预测分布数据;根据第一预测分布数据确定第一文本元素的翻译文本。

12、本技术实施例的第四方面提供一种文本翻译设备,包括:接收单元,用于接收来自客户端的文本翻译请求,文本翻译请求包括目标文本,目标文本包括多个文本元素;处理单元,用于若多个文本元素中的第一文本元素包含在术语表,根据第一文本元素、术语表、目标文本以及预训练的神经网络翻译模型,确定第一文本元素的翻译文本的第一预测分布数据;根据第一预测分布数据确定第一文本元素的翻译文本;获取目标文本中的多个文本元素的翻译文本;发送单元,用于向客户端发送文本翻译响应,文本翻译响应包括目标文本中的多个文本元素的翻译文本。

13、本技术实施例的第五方面提供一种文本翻译系统,包括:端侧设备和云侧设备。端侧设备,用于向云侧设备发送文本翻译请求,文本翻译请求包括目标文本,目标文本包括多个文本元素;云侧设备,用于若多个文本元素中的第一文本元素包含在术语表,根据第一文本元素、术语表、目标文本以及预训练的神经网络翻译模型,确定第一文本元素的翻译文本的第一预测分布数据;根据第一预测分布数据确定第一文本元素的翻译文本;获取目标文本中的多个文本元素的翻译文本;向端侧设备发送文本翻译响应,文本翻译响应包括目标文本中的多个文本元素的翻译文本。

14、本技术实施例的第六方面提供一种电子设备,包括:存储器,处理器以及计算机程序;所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如本技术第一方面任一项所述的方法,或者如本技术第二方面所述的方法。

15、本技术实施例的第七方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现如本技术第一方面任一项所述的方法,或者如本技术第二方面所述的方法。

16、本技术实施例的第八方面提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现本技术第一方面任一项所述的方法,或者如本技术第二方面所述的方法。

17、本技术实施例的第九方面提供一种芯片,芯片包括处理器,处理器用于调用存储器中的计算机程序,以执行如本技术第一方面任一项所述的方法,或者如本技术第二方面所述的方法。

18、本技术实施例提供一种文本翻译方法、设备、系统及存储介质,该方法包括:获取包括多个文本元素的目标文本,通过查询术语表,确定目标文本中第一文本元素是否是术语,若确定第一文本元素是术语,则根据文本元素、术语表、目标文本以及预训练的神经网络翻译模型,确定第一文本元素的翻译文本的第一预测分布数据,通过该第一预测分布数据确定第一文本元素的翻译文本。上述方案中第一文本元素为某一特定领域的术语,基于神经网络翻译模型,结合从术语表中学习到的与该术语的相关信息,预测术语的翻译文本,可提升对术语的翻译效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1