一种关于音频数据的意图识别方法及装置与流程

文档序号：32046259发布日期：2022-11-03 07:16阅读：来源：国知局

技术特征：
1.一种关于音频数据的意图识别方法，其特征在于，包括：获取包含目标语音的音频数据；将所述包含目标语音的音频数据输入预先训练的联合模型，得到目标语音的指令意图；其中，所述联合模型是基于样本音频数据训练得到的，包括语义槽填充层、意图预测层和指令意图获取层；其中，所述语义槽填充层用于根据所述包含目标语音的音频数据，获取语义文字向量；所述意图预测层用于根据所述包含目标语音的音频数据，获取语义预测向量；所述指令意图获取层用于根据所述语义文字向量和所述语义预测向量，获取联合目标函数，并基于所述联合目标函数得到目标语音的指令意图。2.根据权利要求1所述的关于音频数据的意图识别方法，其特征在于，所述根据所述包含目标语音的音频数据，获取语义文字向量，包括：将所述包含目标语音的音频数据转化为初始向量；将所述初始向量映射成语义文字向量。3.根据权利要求2所述的关于音频数据的意图识别方法，其特征在于，所述将所述初始向量映射成语义文字向量，包括：基于所述初始向量，求得隐层向量和槽上下文向量；基于所述隐层向量和所述槽上下文向量，通过softmax函数，求得所述语义文字向量。4.根据权利要求3所述的关于音频数据的意图识别方法，其特征在于，所述槽上下文向量包括注意得分参数，所述注意得分参数用于表示音频数据中的单个字词本身对应的多个具体含义中每个具体含义符合单个字词在上下文中实际含义的概率。5.根据权利要求3所述的关于音频数据的意图识别方法，其特征在于，所述根据所述包含目标语音的音频数据，获取语义预测向量，包括：根据所述包含目标语音的音频数据，获取意图上下文向量；基于所述意图上下文向量，获取语义预测向量。6.根据权利要求5所述的关于音频数据的意图识别方法，其特征在于，还包括：基于所述槽上下文向量和所述意图上下文向量，获取加权特征参数；其中，所述加权特征参数用于提高所述语义槽填充层的性能。7.根据权利要求1所述的关于音频数据的意图识别方法，其特征在于，方法还包括：获取样本音频数据，其中，样本音频数据包括非目标用户音频数据和目标用户音频数据；基于所述非目标用户音频数据，对混合高斯-通用背景模型gmm-ubm进行训练，得到先验模型；基于所述目标用户音频数据，对所述先验模型进行训练，得到联合模型。8.一种关于音频数据的意图识别装置，其特征在于，包括：音频数据获取模块，用于获取包含目标语音的音频数据；音频数据处理模块，用于将所述包含目标语音的音频数据输入预先训练的联合模型，得到目标语音的指令意图；其中，所述联合模型是基于样本音频数据训练得到的，包括语义槽填充层、意图预测层
和指令意图获取层；其中，所述语义槽填充层用于根据所述包含目标语音的音频数据，获取语义文字向量；所述意图预测层用于根据所述包含目标语音的音频数据，获取语义预测向量；所述指令意图获取层用于根据所述语义文字向量和所述语义预测向量，获取联合目标函数，并由所述联合目标函数得到目标语音的指令意图。9.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至7任一项所述关于音频数据的意图识别方法的步骤。10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述关于音频数据的意图识别方法的步骤。

技术总结
本发明提供一种关于音频数据的意图识别方法及装置，方法包括：获取包含目标语音的音频数据；将包含目标语音的音频数据输入预先训练的联合模型，得到目标语音的指令意图；其中，联合模型是基于样本音频数据训练得到的，包括语义槽填充层、意图预测层和指令意图获取层；其中，语义槽填充层用于根据包含目标语音的音频数据，获取语义文字向量；意图预测层用于根据包含目标语音的音频数据，获取语义预测向量；指令意图获取层用于根据语义文字向量和语义预测向量，获取联合目标函数，并基于联合目标函数得到目标语音的指令意图。本发明通过联合模型深层次的理解用户意图，对目标语音的多种意图进行精确高效识别，得到目标语音的指令意图。意图。意图。

技术研发人员：蒋宇徐敏李鑫豪任纪良
受保护的技术使用者：北京宝兰德软件股份有限公司
技术研发日：2022.09.27
技术公布日：2022/11/2

完整全部详细技术资料下载

当前第2页1 2