一种异常音频检测方法、装置及应用与流程

文档序号：43742277发布日期：2025-11-14 21:50阅读：29来源：国知局

技术简介：
本发明针对传统音频异常检测存在人工效率低、误报漏报率高及无法精确定位问题，提出基于深度学习的多分类识别方法，通过时序分割与特征提取实现异常精准定位，结合时间戳与置信度排序提升检测效率与准确性。
关键词：异常音频检测,深度学习,时间戳定位

本发明涉及音频信号处理，特别是涉及一种异常音频检测方法、装置及应用。

背景技术：

1、在音频设备的生产制造过程中，音频质量检测是确保产品合格的重要环节。目前，音频设备出厂前需要对扬声器、听筒等多种音频通路进行质量检验，以识别各种可能的音频异常。

2、常见的音频异常包括爆破音、电磁干扰噪声、卡顿、破音和啸叫等。这些异常会严重影响用户的音频体验，必须在产品出厂前被准确识别和处理。

3、现有的音频异常检测方案主要依赖人工听音检测或基于单一声学特征阈值的自动检测方法。人工听音检测方法虽然能够识别各种类型的音频异常，但存在检测成本高、主观性强、测试一致性差的问题。随着生产规模的扩大，人工检测的效率瓶颈愈发明显。

4、基于单一声学特征阈值的自动检测方法通常采用峰值能量、信噪比、总谐波失真等参数进行判断。这类方法虽然检测速度快，但对复杂场景的适应性不足，难以准确识别多种不同类型的音频异常，特别是在面对复合噪声环境时，误报率和漏报率较高。

5、此外，现有的检测方法通常只能给出整体的异常判断结果，无法精确定位异常发生的具体时间段，这使得后续的问题分析和处理变得困难。当检测到音频异常时，技术人员仍需要通过人工方式逐段播放音频文件来定位具体的异常位置，这大大降低了问题处理的效率。

6、随着音频技术的不断发展和用户对音频质量要求的提高，传统的检测方法已经难以满足现代音频设备质量检测的需求。

技术实现思路

1、本发明的目的在于，提供一种异常音频检测方法、装置及应用，以解决现有技术中音频异常检测效率低、检测一致性差的技术问题。

2、为解决上述技术问题，本发明提供一种异常音频检测方法，包括：

3、获取待测设备的音频信号，对所述音频信号进行预处理；

4、分割所述音频信号为音频片段；

5、提取所述音频片段的音频特征；

6、基于所述音频特征进行多分类异常识别，输出包含正常类别和多种异常类别的概率分布；

7、根据预设阈值判断所述音频片段是否为异常片段，并确定异常类型。

8、可选的，所述分割的过程采用滑窗方式进行，并为每个所述音频片段分配时间戳，所述音频片段的时长为预设固定值。

9、可选的，还包括：

10、基于所述时间戳记录异常片段的时间位置信息。

11、可选的，还包括：

12、根据异常类别的概率值计算异常置信度，并基于所述异常置信度对异常片段进行优先级排序；

13、将排序后的异常片段提供给质检人员进行验证。

14、可选的，还包括：

15、生成包含异常片段的时间位置信息、异常类型和验证结果的检测报告。

16、可选的，所述提取所述音频片段的音频特征通过深度学习模型实现，所述深度学习模型采用基于transformer架构的预训练音频模型。

17、可选的，所述预处理包括幅度归一化处理和/或数字滤波处理。

18、本发明还提供了一种异常音频检测装置，包括：

19、音频获取模块，用于获取待测设备的音频信号并进行预处理；

20、分割模块，用于分割所述音频信号为音频片段；

21、特征提取模块，用于提取所述音频片段的音频特征；

22、异常识别模块，用于基于所述音频特征进行多分类异常识别，输出包含正常类别和多种异常类别的概率分布；

23、判别模块，用于根据预设阈值判断所述音频片段是否为异常片段，并确定异常类型。

24、可选的，还包括：

25、报告生成模块，用于生成包含异常片段的时间位置信息、异常类型和验证结果的检测报告。

26、本发明还提供了上述方法在音频设备质量检测或问题定位中的应用。

27、相比于现有技术，本发明至少具有以下有益效果：

28、本发明通过将音频信号分割为音频片段并基于深度学习技术进行多分类异常识别，能够自动准确地识别多种类型的音频异常，显著提高了异常检测的准确性和效率。相比传统的人工听音检测方式，本发明能够避免了人工检测的主观性和一致性差的问题，同时大幅降低了检测成本和时间消耗。

29、本发明通过为音频片段分配时间戳并记录异常片段的精确时间位置信息，实现了异常音频的精准定位，使得质检人员能够快速定位到具体的异常时段进行验证，从而将传统的全程音频审听转变为定向异常验证，检测效率可提升10-20倍。同时，通过异常置信度计算和优先级排序，能够帮助质检人员优先处理高置信度的异常片段，进一步提高了质检工作的针对性和效率。

技术特征：

1.一种异常音频检测方法，其特征在于，包括：

2.根据权利要求1所述的异常音频检测方法，其特征在于，所述分割的过程采用滑窗方式进行，并为每个所述音频片段分配时间戳，所述音频片段的时长为预设固定值。

3.根据权利要求2所述的异常音频检测方法，其特征在于，还包括：

4.根据权利要求3所述的异常音频检测方法，其特征在于，还包括：

5.根据权利要求4所述的异常音频检测方法，其特征在于，还包括：

6.根据权利要求1所述的异常音频检测方法，其特征在于，所述提取所述音频片段的音频特征通过深度学习模型实现，所述深度学习模型采用基于transformer架构的预训练音频模型。

7.根据权利要求1所述的异常音频检测方法，其特征在于，所述预处理包括幅度归一化处理和/或数字滤波处理。

8.一种异常音频检测装置，其特征在于，包括：

9.根据权利要求8所述的异常音频检测装置，其特征在于，还包括：

10.权利要求1-7任一项所述的方法在音频设备质量检测或问题定位中的应用。

技术总结
本发明涉及音频信号处理技术领域，揭示了一种异常音频检测方法、装置及应用，该方法包括：获取待测设备的音频信号，对所述音频信号进行预处理；分割所述音频信号为音频片段；提取所述音频片段的音频特征；基于所述音频特征进行多分类异常识别，输出包含正常类别和多种异常类别的概率分布；根据预设阈值判断所述音频片段是否为异常片段，并确定异常类型。本发明通过时序分段异常定位和深度学习多分类识别相结合，实现从全量人工审听到定向异常验证的转换，解决了传统音频质量检测中效率低、成本高、一致性差的技术问题，广泛应用于手机等音频设备的质量检测或问题定位。

技术研发人员：李宗飞,陈秋凤,沈兵,程黎辉,关亚东
受保护的技术使用者：上海龙旗智能科技有限公司
技术研发日：
技术公布日：2025/11/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李宗飞,陈秋凤,沈兵,程黎辉,关亚东
技术所有人：上海龙旗智能科技有限公司
我是此专利的发明人

上一篇：一种带材用边部处理装置的制作方法
下一篇：基于增材制造的风洞模型表面流场显示装置的制作方法

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！