用于生成远场语音数据的方法、装置、计算设备以及计算机可读存储介质与流程

文档序号：14912850发布日期：2018-07-10 23:53阅读：来源：国知局

技术特征：

1.一种用于生成远场语音数据的方法，包括：

获得真实环境中的环境噪声；

基于所述环境噪声，调整近场语音数据集中的近场语音数据；以及

基于经调整的所述近场语音数据和所述环境噪声，生成远场语音数据。

2.根据权利要求1所述的方法，其中调整所述近场语音数据包括：

确定所述近场语音数据与所述环境噪声之间的第一信噪比；

获得与所述真实环境相关联的第二信噪比；以及

基于所述第一信噪比和所述第二信噪比，调整所述近场语音数据。

3.根据权利要求2所述的方法，其中获得与所述真实环境相关联的第二信噪比包括：

获得与所述真实环境的场景类型相关联的远场语音数据集；

确定所述远场语音数据集的信噪比范围；以及

从所述信噪比范围内确定所述第二信噪比。

4.根据权利要求3所述的方法，还包括：

确定经调整的所述近场语音数据与所述环境噪声之间的第三信噪比；

响应于所述第三信噪比在所述信噪比范围之内，保留所生成的所述远场语音数据；以及

响应于所述第三信噪比在所述信噪比范围之外，丢弃所生成的所述远场语音数据。

5.根据权利要求2所述的方法，其中调整所述近场语音数据还包括：

基于所述第一信噪比与所述第二信噪比之间的比率，调整所述近场语音数据的信号幅值。

6.根据权利要求1所述的方法，其中获得所述环境噪声包括：

收集所述环境噪声；

确定所述环境噪声的信号幅值的均值和方差；以及

基于所确定的均值和方差，调整所述环境噪声的所述信号幅值。

7.根据权利要求1所述的方法，其中生成所述远场语音数据包括：

利用所述环境噪声对经调整的所述近场语音数据执行加噪处理。

8.根据权利要求1所述的方法，还包括：

使用所生成的所述远场语音数据来训练远场语音识别模型。

9.一种用于生成远场语音数据的装置，包括：

获得模块，被配置为获得真实环境中的环境噪声；

调整模块，被配置为基于所述环境噪声来调整近场语音数据集中的近场语音数据；以及

生成模块，被配置为基于经调整的所述近场语音数据和所述环境噪声来生成远场语音数据。

10.根据权利要求9所述的装置，其中所述调整模块包括：

第一信噪比确定模块，被配置为确定所述近场语音数据与所述环境噪声之间的第一信噪比；

第二信噪比获得模块，被配置为获得与所述真实环境相关联的第二信噪比；以及

第二调整模块，被配置为基于所述第一信噪比和所述第二信噪比来调整所述近场语音数据。

11.根据权利要求10所述的装置，其中所述第二信噪比获得模块包括：

第二获得模块，被配置为获得与所述真实环境的场景类型相关联的远场语音数据集；

信噪比范围确定模块，被配置为确定所述远场语音数据集的信噪比范围；以及

第二信噪比确定模块，被配置为从所述信噪比范围内确定所述第二信噪比。

12.根据权利要求11所述的装置，还包括：

第三信噪比确定模块，被配置为确定经调整的所述近场语音数据与所述环境噪声之间的第三信噪比；

保留模块，被配置为响应于所述第三信噪比在所述信噪比范围之内，保留所生成的所述远场语音数据；以及

丢弃模块，被配置为响应于所述第三信噪比在所述信噪比范围之外，丢弃所生成的所述远场语音数据。

13.根据权利要求10所述的装置，其中所述调整模块包括：

第三调整模块，被配置为基于所述第一信噪比与所述第二信噪比之间的比率来调整所述近场语音数据的信号幅值。

14.根据权利要求9所述的装置，其中所述获得模块包括：

收集模块，被配置为收集所述环境噪声；

确定模块，被配置为确定所述环境噪声的信号幅值的均值和方差；以及

第四调整模块，被配置为基于所确定的均值和方差来调整所述环境噪声的所述信号幅值。

15.根据权利要求9所述的装置，其中所述生成模块包括：

加噪模块，被配置为利用所述环境噪声对经调整的所述近场语音数据执行加噪处理。

16.根据权利要求9所述的装置，还包括：

训练模块，被配置为使用所生成的所述远场语音数据来训练远场语音识别模型。

17.一种计算设备，所述计算设备包括：

一个或多个处理器；以及

存储装置，用于存储一个或多个程序，所述一个或多个程序当被所述一个或多个处理器执行，使得所述计算设备实现根据权利要求1-8中任一项所述的方法。

18.一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现根据权利要求1-8中任一项所述的方法。

完整全部详细技术资料下载

当前第2页1 2 3