基于生成对抗网络的语音唤醒方法、装置及存储介质与流程

文档序号：37312397发布日期：2024-03-13 21:02阅读：来源：国知局

技术特征：

1.一种基于生成对抗网络的语音唤醒方法，其特征在于，包括：

2.根据权利要求1所述的基于生成对抗网络的语音唤醒方法，其特征在于，所述根据所述第一判别结果和所述解码分数，进行语音系统的唤醒操作，包括：

3.根据权利要求1所述的基于生成对抗网络的语音唤醒方法，其特征在于，所述生成器包括至少一个特征提取模块，所述特征提取模块包括顺序连接的多头自注意力机制层、第一归一化层、深度分离卷积、第二归一化层和前馈神经网络，所述第一归一化层的输入数据为所述多头自注意力机制层的输出数据和所述多头自注意力机制层的输入数据之和，所述第二归一化层的输入数据为所述深度分离卷积的输出数据和所述多头自注意力机制层的输入数据之和，所述特征提取模块的输出数据为所述前馈神经网络的输出数据和所述多头自注意力机制层的输入数据之和。

4.根据权利要求1-3中任一项所述的基于生成对抗网络的语音唤醒方法，其特征在于，所述生成对抗网络还包括第二判别器，所述方法还包括：

5.根据权利要求4所述的基于生成对抗网络的语音唤醒方法，其特征在于，所述生成器和所述第二判别器采用交替训练方式，所述根据预设的损失函数、所述声学特征样本和所述标注标签，对所述生成对抗网络进行训练，包括：

6.根据权利要求4所述的基于生成对抗网络的语音唤醒方法，其特征在于，还包括：

7.根据权利要求6所述的基于生成对抗网络的语音唤醒方法，其特征在于，所述根据所述冲击响应函数、所述第一语音数据和所述第二语音数据生成所述语音样本集，包括：

8.一种基于生成对抗网络的语音唤醒装置，其特征在于，包括：

9.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的基于生成对抗网络的语音唤醒方法。

10.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-7中任一项所述的基于生成对抗网络的语音唤醒方法。

11.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的基于生成对抗网络的语音唤醒方法。

技术总结
本申请公开了一种基于生成对抗网络的语音唤醒方法、装置、存储介质、电子设备及计算机程序产品，该方法包括：获取待识别的目标语音数据；对目标语音数据进行声学特征提取，得到目标声学特征；将目标声学特征输入语音识别模型中进行处理，语音识别模型包括解码器和已训练的生成对抗网络，生成对抗网络包括生成器和第一判别器，生成器用于根据目标声学特征生成目标编码特征；第一判别器用于根据目标编码特征输出第一判别结果；解码器用于根据预设唤醒词对目标编码特征进行解码，并输出解码分数；根据第一判别结果和解码分数，进行车载语音系统的唤醒操作，从而无需用户手动操作即可唤醒车载语音系统，简化了唤醒流程，用户体验感好。

技术研发人员：孙俊,申凯,万根顺,潘嘉,刘聪,高建清,熊世富
受保护的技术使用者：科大讯飞股份有限公司
技术研发日：
技术公布日：2024/3/12

完整全部详细技术资料下载

当前第2页1 2