频响均衡模型的训练方法、语音合成方法和可读存储介质与流程

文档序号：34612638发布日期：2023-06-29 08:27阅读：89来源：国知局

技术简介：
本专利针对音质较差的播放设备导致语音播放后音质损失和噪声增大的问题，提出通过原始音频与播放音频联合训练频响均衡模型，补偿音质细节并消除噪声的解决方案。进一步结合频响均衡模型优化语音合成训练数据，提升合成语音的频响特性和音频质量，实现音质增强与噪声抑制的双重目标。
关键词：频响均衡,语音合成

本发明涉及语音合成，具体而言，涉及一种频响均衡模型的训练方法、语音合成方法和可读存储介质。

背景技术：

1、频响均衡模型为均衡语音中频响特性的模型，而市面上存在大量音质较差的播放器，如耳机、音箱等，原始语音在经过音质较差的播放器播放后，会出现音质细节损失，某些频段噪声较大等情况，针对上述情况，现阶段的频响均衡模型存在无法补偿音质损失，无法消除噪声等问题。

技术实现思路

1、本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。

2、为此，本发明的第一个方面在于提出一种频响均衡模型的训练方法。

3、本发明的第二个方面在于提出一种语音合成方法。

4、本发明的第三个方面在于提出另一种语音合成方法。

5、本发明的第四个方面在于提出一种可读存储介质。

6、本发明的第五个方面在于提出一种计算机程序产品。

7、本发明的第六个方面在于提出一种电子设备。

8、本发明的第七个方面在于提出一种家电设备。

9、有鉴于此，根据本发明的第一个方面，提出了一种频响均衡模型的训练方法，包括：获取原始音频和音频播放设备的播放音频，其中，播放音频为原始音频经过音频播放设备播放输出的音频；对原始音频和播放音频进行数据训练，以得到频响均衡模型。

10、本技术方案中的频响均衡模型的训练方法通过对原始音频和播放音频进行数据训练，确定频响均衡模型，提升了频响均衡模型的音质增强能力，对于音质较差播放器播放的语音，通过频响均衡模型补偿了语音中的音质细节，并消除了语音中的噪声。

11、根据本发明的第二个方面，提出了一种语音合成方法，包括：获取第一训练数据，通过频响均衡模型，对第一训练数据进行数据增强，以得到第二训练数据；对第二训练数据进行数据训练，以得到语音合成模型；根据语音合成模型，对输入语音进行语音合成，以得到第一合成语音。

12、本技术方案中的语音合成方法通过频响均衡模型优化第一训练数据，得到第二训练数，并基于第二训练数据进行数据训练，生成语音合成模型，再通过语音合成模型，将输入语音合成为第一合成语音，保证了第二训练数据的数据准确性，进而保证了语音合成模型的数据准确性，提升了第一合成语音的频响特性，同时提升了第一合成语音的音频质量。

13、根据本发明的第三个方面，提出了一种语音合成方法，包括：获取第一训练数据，对第一训练数据进行数据训练，以得到语音合成模型；根据语音合成模型，对输入语音进行语音合成，以得到第一合成语音；通过频响均衡模型，对第一合成语音进行数据增强，以得到第二合成语音。

14、本实施例中的语音合成方法对第一训练数据进行数据训练，得到语音合成模型，并通过语音合成模型，对输入的输入语音进行语音合成，确定输入语音对应第一合成语音，在通过频响均衡模型增强第一合成语音，确定第二合成语音，提升了第一合成语音的音频质量，保证了第二合成语音的频响特性。

15、根据本发明的第四个方面，提出了一种可读存储介质，其上存储有程序或指令，程序或指令被处理器执行时实现如上述任一技术方案中的频响均衡模型的训练方法或上述任一技术方案中的语音合成方法。因此，该可读存储介质具备上述任一技术方案中的频响均衡模型的训练方法或上述任一技术方案中的语音合成方法的全部有益效果，在此不再赘述。

16、根据本发明的第五个方面，提出了一种计算机程序产品，包括计算机指令，该计算机指令被处理器执行时实现如上述任一技术方案中的频响均衡模型的训练方法或上述任一技术方案中的语音合成方法。因此，该计算机程序产品具备上述任一技术方案中的频响均衡模型的训练方法或上述任一技术方案中的语音合成方法的全部有益效果，在此不再赘述。

17、根据本发明的第六个方面，提出了一种电子设备，包括：上述第四方面中限定的可读存储介质，和/或上述第五方面中限定的计算机程序产品，因而具有上述第四方面中限定的可读存储介质，和/或上述第五方面中限定的计算机程序产品的全部有益技术效果，在此不再做过多赘述。

18、根据本发明的第七个方面，提出了一种家电设备，包括：如上述第六方面中限定的电子设备，因而具有上述第六方面中限定的电子设备的全部有益技术效果，在此不再做过多赘述，家电设备可以为音箱、空调或冰箱中的任一种。

19、本发明的附加方面和优点将在下面的描述部分中变得明显，或通过本发明的实践了解到。

技术特征：

1.一种频响均衡模型的训练方法，其特征在于，所述频响均衡模型的训练方法包括：

2.根据权利要求1所述的频响均衡模型的训练方法，其特征在于，所述对所述原始音频和所述播放音频进行数据训练，以得到所述频响均衡模型，具体包括：

3.根据权利要求1所述的频响均衡模型的训练方法，其特征在于，所述对所述原始音频和所述播放音频进行数据训练，以得到所述频响均衡模型，具体包括：

4.根据权利要求3所述的频响均衡模型的训练方法，其特征在于，所述根据所述播放音频对应的第一分贝值，确定目标权重参数，具体包括：

5.根据权利要求3所述的频响均衡模型的训练方法，其特征在于，所述频响均衡模型的训练方法，还包括：

6.根据权利要求1所述的频响均衡模型的训练方法，其特征在于，所述对所述原始音频和所述播放音频进行数据训练，以得到所述频响均衡模型，具体包括：

7.根据权利要求6所述的频响均衡模型的训练方法，其特征在于，所述根据所述播放音频，确定第一幅度相位数据，根据所述原始音频，确定第二幅度相位数据，具体包括：

8.根据权利要求6所述的频响均衡模型的训练方法，其特征在于，所述对所述第一幅度相位数据和所述第二幅度相位数据进行数据训练，以得到所述频响均衡模型，具体包括：

9.一种语音合成方法，其特征在于，所述语音合成方法包括：

10.根据权利要求9所述的语音合成方法，其特征在于，所述通过所述频响均衡模型，对所述第一训练数据进行数据增强，以得到第二训练数据，具体包括：

11.一种语音合成方法，其特征在于，所述语音合成方法包括：

12.根据权利要求11所述的语音合成方法，其特征在于，所述通过频响均衡模型，对所述第一合成语音进行数据增强，以得到第二合成语音，具体包括：

13.一种可读存储介质，其特征在于，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如权利要求1至8中任一项所述的频响均衡模型的训练方法或权利要求9至12中任一项所述的语音合成方法的步骤。

14.一种计算机程序产品，包括计算机指令，其特征在于，该计算机指令被处理器执行时实现权利要求1至8中任一项所述的频响均衡模型的训练方法或权利要求9至12中任一项所述语音合成方法的步骤。

15.一种电子设备，其特征在于，包括：

16.一种家电设备，其特征在于，包括如权利要求15所述的电子设备，所述家电设备可以为音箱、空调或冰箱中的任一种。

技术总结
本发明提出了一种频响均衡模型的训练方法、语音合成方法和可读存储介质。频响均衡模型的训练方法包括：获取原始音频和音频播放设备的播放音频，其中，播放音频为原始音频经过音频播放设备播放输出的音频；对原始音频和播放音频进行数据训练，以得到频响均衡模型。

技术研发人员：朱宁焱,高羽,王添翼,脱立恒
受保护的技术使用者：美的集团（上海）有限公司
技术研发日：
技术公布日：2024/1/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朱宁焱高羽王添翼脱立恒
技术所有人：美的集团股份有限公司
我是此专利的发明人

上一篇：一种基于大数据的日语教学交互方法和装置
下一篇：螺线管、衰减力调整机构以及衰减力调整式缓冲器的制作方法

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！