音频数据风险检测方法、装置、计算机设备及存储介质与流程

文档序号：34898740发布日期：2023-07-26 06:13阅读：69来源：国知局

本发明涉及语音处理，尤其涉及一种音频数据风险检测方法、装置、计算机设备及存储介质。

背景技术：

1、随着科学技术不断的发展，语音处理技术也逐渐应用在不同的领域当中。比如，在风险检测场景下，通过将语音数据转换为文本信息，并对文本信息进行意图检测，以便针对意图检测结果采取相应的风险应对措施。

2、现有技术中，风险检测技术往往是通过风险信号标记、风险预测建模和文本风险挖掘进行风险预测，以及通过语音数据中的声纹特征与历史标记数据进行匹配，从而判断语音数据是否有违规、诈骗或刷单等风险。但是风险预测建模并不能覆盖所有场景，适用性差。只基于文本内容的风险检测结果的准确率不高，效果也不理想，也不能充分利用文本信息中的情感信息。而且通过声纹特征与历史标记数据进行匹配，也不能充分利于语音数据中的情感信息进行风险检测。

技术实现思路

1、本发明实施例提供一种音频数据风险检测方法、装置、计算机设备及存储介质，以解决现有技术中文本检测准确率低以及语音数据无法充分利用的问题。

2、一种音频数据风险检测方法，包括：

3、获取音频数据，通过预设声纹分析模型对所述音频数据进行音频识别，得到音频识别结果；

4、根据预设语音识别模型对所述音频数据进行语音识别，得到音频文本；

5、基于预设文本识别模型对所述音频文本进行文本情绪识别，得到文本情绪识别结果；

6、对所述音频数据进行语音特征提取，得到语音特征，并对所述语音特征进行语音情绪识别，确定语音情绪识别结果；

7、根据所述音频识别结果、所述文本情绪识别结果和所述语音情绪识别结果，确定风险检测结果。

8、一种音频数据风险检测装置，包括：

9、音频识别模块，用于获取音频数据，通过预设声纹分析模型对所述音频数据进行音频识别，得到音频识别结果；

10、语音识别模块，用于根据预设语音识别模型对所述音频数据进行语音识别，得到音频文本；

11、文本情绪识别模块，用于基于预设文本识别模型对所述音频文本进行文本情绪识别，得到文本情绪识别结果；

12、语音情绪识别模块，用于对所述音频数据进行语音特征提取，得到语音特征，并对所述语音特征进行语音情绪识别，确定语音情绪识别结果；

13、结果确定模块，用于根据所述音频识别结果、所述文本情绪识别结果和所述语音情绪识别结果，确定风险检测结果。

14、一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述音频数据风险检测方法。

15、一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述音频数据风险检测方法。

16、本发明提供一种音频数据风险检测方法、装置、计算机设备及存储介质，该方法通过预设声纹分析模型对音频数据进行音频识别，充分利用音频数据中包含的语音信息，从而实现了对音频识别结果的确定，进而提高了对音频数据风险检测的准确率。通过预设语音识别模型对音频数据进行语音识别，从而实现了对音频文本的获取，进而提高了音频文本内容识别的准确率。通过预设文本识别模型对音频文本进行文本情绪识别，充分抽取了音频文本中的语义信息，从而实现了对文本情绪识别结果的提取，进而提高了文本情绪识别结果的准确率。通过提取的语音情绪识别结果、文本情绪识别结果和音频识别结果对音频数据进行风险检测，从而提高了风险检测结果准确率，确保了对音频数据风险检测的准确性。

技术特征：

1.一种音频数据风险检测方法，其特征在于，包括：

2.如权利要求1所述的音频数据风险检测方法，其特征在于，所述获取音频数据，包括：

3.如权利要求1所述的音频数据风险检测方法，其特征在于，所述预设声学分析模型包括第一卷积层、多个残差网络层、卷积池化层和全连接层；所述卷积池化层第二卷积层和注意力池化层；

4.如权利要求3所述的音频数据风险检测方法，其特征在于，所述残差网络层包括第一残差网络层、第二残差网络层和第三残差网络层；

5.如权利要求1所述的音频数据风险检测方法，其特征在于，所述预设语音识别模型包括编码器、时序分类解码器和注意力解码器；

6.如权利要求1所述的音频数据风险检测方法，其特征在于，所述基于预设文本识别模型对所述音频文本进行文本情绪识别，得到文本情绪识别结果，包括：

7.一种音频数据风险检测装置，其特征在于，包括：

8.如权利要求7所述的音频数据风险检测装置，其特征在于，所述预设声学分析模型包括第一卷积层、多个残差网络层、卷积池化层和全连接层；所述卷积池化层第二卷积层和注意力池化层；

9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述音频数据风险检测方法。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述音频数据风险检测方法。

技术总结
本发明公开了一种音频数据风险检测方法，该方法包括获取音频数据，对音频数据进行音频识别，得到音频识别结果；对音频数据进行语音识别，得到音频文本；对音频文本进行文本情绪识别，得到文本情绪识别结果；对音频数据进行特征提取，得到语音特征，并对语音特征进行语音情绪识别，确定语音情绪识别结果；根据音频识别结果、文本情绪识别结果和语音情绪识别结果，确定风险检测结果。本发明通过文本情绪识别结果和语音情绪识别结果对音频数据中的情绪进行识别，提高了情绪识别结果的准确率。通过文本情绪识别结果、语音情绪识别结果和音频识别结果对音频数据进行风险检测，充分利用了音频数据中的声纹信息，从而提高了风险检测结果的准确率<subgt;。</subgt;

技术研发人员：曹子豪,王健宗,黄章成
受保护的技术使用者：平安科技（深圳）有限公司
技术研发日：
技术公布日：2024/1/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：曹子豪王健宗黄章成
技术所有人：平安科技（深圳）有限公司
我是此专利的发明人