基于模型压缩的语音识别方法、装置、设备及存储介质与流程

文档序号：29128150发布日期：2022-03-05 00:43阅读：来源：国知局

技术特征：
1.一种基于模型压缩的语音识别方法，其特征在于，所述方法包括：获取训练语音数据，将所述训练语音数据输入至由编码器、预测网络和联合网络构建的语音识别模型中，得到初始识别结果；将所述初始识别结果与预设的标准结果进行比对，并根据得到的比对结果对所述语音识别模型进行优化，得到标准语音识别模型；对所述标准语音识别模型进行模型压缩处理，得到标准压缩模型；获取待识别语音，将所述待识别语音输入至所述标准压缩模型中，得到语音识别结果。2.根据权利要求1所述的基于模型压缩的语音识别方法，其特征在于，所述将所述训练语音数据输入至由编码器、预测网络和联合网络构建的语音识别模型中，得到初始识别结果，包括：将所述训练语音数据输入至所述语音识别模型中的编码器中，得到训练声学表示；获取预设的非空白标签，将所述非空白标签输入所述语音识别模型中的预测网络中，得到上下文向量；将所述训练声学表示和所述上下文向量作为所述语音识别模型中的联合网络的输入，得到联合逻辑向量；利用所述全连接层中的激活函数对所述联合逻辑向量进行激活处理，得到初始识别结果。3.根据权利要求2所述的基于模型压缩的语音识别方法，其特征在于，所述将所述训练语音数据输入至所述语音识别模型中的编码器中，得到训练声学表示，包括：通过所述编码器中的输入门计算所述训练语音数据的状态值；通过所述编码器中的遗忘门计算所述训练语音数据的激活值；根据所述编码器中的状态值和所述激活值计算所述训练语音数据的状态更新值；利用所述编码器中的输出门计算所述状态更新值对应的训练声学表示。4.根据权利要求1所述的基于模型压缩的语音识别方法，其特征在于，所述对所述标准语音识别模型进行模型压缩处理，得到标准压缩模型，包括：对所述标准语音识别模型中结构相同的层进行参数共享，得到初始压缩模型；基于所述训练语音数据及所述训练语音数据对应的训练识别结果更新所述初始压缩模型中共享的参数，得到标准压缩模型。5.根据权利要求4所述的基于模型压缩的语音识别方法，其特征在于，所述对所述标准语音识别模型中结构相同的层进行参数共享，得到初始压缩模型，包括：将所述标准语音识别模型中结构相同的多个层中的任意一个层确定为参照层，将多个层中除去所述参照层后的其它层确定为共享层；将所述参考层的参数作为初始参数赋值给所述共享层，得到初始压缩模型。6.根据权利要求1所述的基于模型压缩的语音识别方法，其特征在于，所述将所述初始识别结果与预设的标准结果进行比对，并根据得到的比对结果对所述语音识别模型进行优化，包括：将所述初始识别结果与预设的标准结果进行比对；当所述初始识别结果与所述标准结果一致时，将所述语音识别模型作为所述标准语音识别模型；
当所述初始识别结果与所述标准结果不一致时，对所述语音识别模型进行模型参数调整，并返回获取训练语音数据，将所述训练语音数据输入至由编码器、预测网络和联合网络构建的语音识别模型中，得到初始识别结果的步骤。7.根据权利要求1至4中任一项所述的基于模型压缩的语音识别方法，其特征在于，所述获取训练语音数据之后，所述方法还包括：将所述编码器和所述预测网络分别连接在所述联合网络的左端和右端，得到初始模块；在所述初始模块后添加全连接层，得到语音识别模型。8.一种基于模型压缩的语音识别装置，其特征在于，所述装置包括：初始识别模块，用于获取训练语音数据，将所述训练语音数据输入至由编码器、预测网络和联合网络构建的语音识别模型中，得到初始识别结果；模型优化模块，用于将所述初始识别结果与预设的标准结果进行比对，并根据得到的比对结果对所述语音识别模型进行优化，得到标准语音识别模型；模型压缩模块，用于对所述标准语音识别模型进行模型压缩处理，得到标准压缩模型；语音识别模块，用于获取待识别语音，将所述待识别语音输入至所述标准压缩模型中，得到语音识别结果。9.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器、通信接口、存储器通过通信总线完成相互间的通信；存储器，用于存放计算机程序；处理器，用于执行存储器上所存放的程序时，实现权利要求1-7任一项所述的基于模型压缩的语音识别方法的步骤。10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的基于模型压缩的语音识别方法的步骤。

技术总结
本申请涉及一种基于模型压缩的语音识别方法，所述方法包括：获取训练语音数据，将训练语音数据输入至由编码器、预测网络和联合网络构建的语音识别模型中，得到初始识别结果；将初始识别结果与预设的标准结果进行比对，并根据得到的比对结果对语音识别模型进行优化，得到标准语音识别模型；对标准语音识别模型进行模型压缩处理，得到标准压缩模型；获取待识别语音，将待识别语音输入至标准压缩模型中，得到语音识别结果。此外，本申请还涉及一种基于模型压缩的语音识别方法、装置、设备及存储介质。本申请可解决语音识别的准确度不高的问题。题。题。

技术研发人员：黄石磊陈诚吕少岭廖晨
受保护的技术使用者：深圳市北科瑞声科技股份有限公司
技术研发日：2021.12.02
技术公布日：2022/3/4

完整全部详细技术资料下载

当前第2页1 2