基于机器翻译的日语语音翻译方法、终端及存储介质

文档序号：37911090发布日期：2024-05-10 23:50阅读：11来源：国知局

本申请属于自然语言处理与转化，尤其涉及一种基于机器翻译的日语语音翻译方法、终端及存储介质。

背景技术：

1、随着科技的不断发展，语言识别技术已经越来越成熟。日语语音翻译是指通过语音识别技术将日语语音转换为非日语文本。近年来，随着人工智能技术的不断提升，日语语音翻译技术也得到了迅猛的发展。现在，越来越多的场景需要用到日语语音翻译技术。

2、日语语音翻译相对于其他语言来说，具有一些难点。首先，日语中存在大量的音节和发音，这使得日语语音翻译变得更加困难。此外，日语中的发音和语调之间存在很多相似之处，很容易出现混淆。另外，日语中还存在大量的口语变形和模糊表达，这也会对日语语音翻译造成一定的干扰。因此通用的语音识别模型通常对日语语音的翻译准确率较低。

技术实现思路

1、有鉴于此，本发明提供了一种基于机器翻译的日语语音翻译方法、终端及存储介质，旨在解决通用的语音识别模型通常对日语语音的翻译准确率较低的问题。

2、本发明实施例的第一方面提供了一种基于机器翻译的日语语音翻译方法，包括：

3、获取待翻译日语语音；

4、对待翻译日语语音进行特征提取，得到mfcc特征；

5、对待翻译日语语音进行声纹识别，确定待翻译日语语音的身份信息；

6、将mfcc特征和身份信息对应的第一特征输入到解码器中，得到第一翻译结果；

7、其中，第一特征根据历史时段内识别的mfcc特征以及历史时段内的第一翻译结果对应的标准mfcc特征确定；身份信息与第一特征一一对应。

8、本发明实施例的第二方面提供了一种基于机器翻译的日语语音翻译装置，包括：

9、获取模块，用于获取待翻译日语语音；

10、提取模块，用于对待翻译日语语音进行特征提取，得到mfcc特征；

11、确定模块，用于对待翻译日语语音进行声纹识别，确定待翻译日语语音的身份信息；

12、翻译模块，用于将mfcc特征和身份信息对应的第一特征输入到解码器中，得到第一翻译结果；

13、其中，第一特征根据历史时段内识别的mfcc特征以及历史时段内的第一翻译结果对应的标准mfcc特征确定；身份信息与第一特征一一对应。

14、本发明实施例的第三方面提供了一种终端，包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序，处理器执行计算机程序时实现如上第一方面的基于机器翻译的日语语音翻译方法的步骤。

15、本发明实施例的第四方面提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序被处理器执行时实现如上第一方面的基于机器翻译的日语语音翻译方法的步骤。

16、本发明与现有技术相比存在的有益效果是：

17、本发明实施例提供的基于机器翻译的日语语音翻译方法、终端及存储介质，获取待翻译日语语音；对待翻译日语语音进行特征提取，得到mfcc特征；对待翻译日语语音进行声纹识别，确定待翻译日语语音的身份信息；将mfcc特征和身份信息对应的第一特征输入到解码器中，得到第一翻译结果；其中，第一特征根据历史时段内识别的mfcc特征以及历史时段内的第一翻译结果对应的标准mfcc特征确定；身份信息与第一特征一一对应。通过在语音识别中加入说话者的第一特征来反映说话者的重读、连读和语音语调等差异，同时利用梅尔频率倒谱系数来提取语音中的有效信息，即mfcc特征，将这两个特征输入到解码器中，实现日语语音的高效翻译。

技术特征：

1.一种基于机器翻译的日语语音翻译方法，其特征在于，包括：

2.根据权利要求1所述的基于机器翻译的日语语音翻译方法，其特征在于，所述方法还包括：

3.根据权利要求2所述的基于机器翻译的日语语音翻译方法，其特征在于，根据所述第一差值特征和所述第二差值特征，确定所述身份信息对应的第一特征，包括：

4.根据权利要求2所述的基于机器翻译的日语语音翻译方法，其特征在于，所述第一特征包括习惯特征、语调特征、表达特征；根据所述第一差值特征和所述第二差值特征，确定所述身份信息对应的第一特征，包括：

5.根据权利要求2所述的基于机器翻译的日语语音翻译方法，其特征在于，所述方法还包括：

6.根据权利要求1所述的基于机器翻译的日语语音翻译方法，其特征在于，对所述待翻译日语语音进行特征提取，得到mfcc特征，包括：

7.根据权利要求1所述的基于机器翻译的日语语音翻译方法，其特征在于，对所述待翻译日语语音进行声纹识别，确定所述待翻译日语语音的身份信息，包括：

8.根据权利要求1-7任一项所述的基于机器翻译的日语语音翻译方法，其特征在于，在获取待翻译日语语音之后，所述方法还包括：对所述待翻译日语语音进行预处理，以去除所述待翻译日语语音中的噪音。

9.一种终端，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如上的权利要求1至8中任一项所述基于机器翻译的日语语音翻译方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如上的权利要求1至8中任一项所述基于机器翻译的日语语音翻译方法的步骤。

技术总结
本发明提供了一种基于机器翻译的日语语音翻译方法、终端及存储介质，获取待翻译日语语音；对待翻译日语语音进行特征提取，得到MFCC特征；对待翻译日语语音进行声纹识别，确定待翻译日语语音的身份信息；将MFCC特征和身份信息对应的第一特征输入到解码器中，得到第一翻译结果；其中，第一特征根据历史时段内识别的MFCC特征以及历史时段内的第一翻译结果对应的标准MFCC特征确定；身份信息与第一特征一一对应。通过在语音识别中加入说话者的第一特征来反映说话者的重读、连读和语音语调等差异，同时利用梅尔频率倒谱系数来提取语音中的有效信息，即MFCC特征，将这两个特征输入到解码器中，实现日语语音的高效翻译。

技术研发人员：卢志伟,张晋,刘慧,马晓娜,李清林
受保护的技术使用者：石家庄学院
技术研发日：
技术公布日：2024/5/9

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：卢志伟,张晋,刘慧,马晓娜,李清林
技术所有人：石家庄学院
我是此专利的发明人

上一篇：一种垃圾处理器入料安装结构的制作方法
上一篇：一种LED隧道灯壳体的制作方法