异常音频识别方法、装置及电子设备与流程

文档序号：42295796发布日期：2025-06-27 18:33阅读：70来源：国知局

本技术涉及计算机应用，特别是涉及一种异常音频识别方法、装置及电子设备。

背景技术：

1、随着工业自动化和智能化的发展，巡检机器人在工业设备巡检中得到了广泛应用。控制巡检机器人在复杂和恶劣的环境，如高温、高湿、强噪声等环境中采集音频数据，根据巡检机器人采集的音频数据可以判断设备运行状态，从而完成设备运行状态检测任务，巡检效率和安全性较高。

2、目前主要通过深度神经网络对巡检机器人采集的音频数据进行分析识别。深度神经网络需要大量正负样本数据进行训练。但在实际应用中，异常样本数量较少，导致深度神经网络训练时偏向于正常样本分类，难以准确识别异常音频数据。

技术实现思路

1、本技术的目的是提供一种异常音频识别方法、装置及电子设备，以准确进行异常音频的识别。

2、为解决上述技术问题，本技术提供如下技术方案：

3、第一方面，提供了一种异常音频识别方法，包括：

4、获取按照目标路线巡检的巡检机器人实时采集的第一音频数据，所述目标路线包括多个路段，每个路段对应有各自的音频频率阈值；

5、在当前所采集的所述第一音频数据对应的音频频率大于或等于当前路段对应的音频频率阈值的情况下，获取当前第一音频数据对应的第一特征图；

6、将所述第一特征图与所述当前路段的背景图进行比较，获得所述第一特征图相对于所述背景图的第一差异图；

7、基于所述第一差异图，确定所述当前第一音频数据包含的音频是否为异常音频；

8、其中，所述背景图是基于所述当前路段的正常音频数据集中正常音频数据对应的特征图之间的差异预先生成的。

9、可选地，所述获取当前第一音频数据对应的第一特征图，包括：

10、计算当前第一音频数据的能量谱密度信号；

11、根据所述当前第一音频数据的能量谱密度信号，在所述当前第一音频数据中去除背景噪声，得到第二音频数据；

12、对所述第二音频数据进行特征提取和后处理，得到所述当前第一音频数据对应的第一特征图。

13、可选地，所述对所述第二音频数据进行特征提取和后处理，得到所述当前第一音频数据对应的第一特征图，包括：

14、对所述第二音频数据进行特征提取，得到第一特征；

15、对所述第一特征依次进行概率分布估计、归一化处理、可视化处理，得到所述当前第一音频数据对应的第一特征图。

16、可选地，所述将所述第一特征图与所述当前路段的背景图进行比较，获得所述第一特征图相对于所述背景图的第一差异图，包括：

17、将所述第一特征图与所述当前路段的背景图进行比较，生成二值化图片；

18、对所述二值化图片进行降维处理，获得所述第一特征图相对于所述背景图的第一差异图。

19、可选地，所述基于所述第一差异图，确定所述当前第一音频数据包含的音频是否为异常音频，包括：

20、确定所述第一差异图中每两个差异点之间的余弦距离；

21、基于所述第一差异图中每两个差异点之间的余弦距离，确定所述第一特征图与所述背景图之间的差异值；

22、根据所述差异值与预设的差异阈值的大小关系，确定所述当前第一音频数据包含的音频是否为异常音频。

23、可选地，所述根据所述差异值与预设的差异阈值的大小关系，确定所述当前第一音频数据包含的音频是否为异常音频，包括：

24、在所述差异值大于或等于预设的差异阈值的情况下，确定所述当前第一音频数据包含的音频为可疑音频；

25、根据对所述可疑音频的确认信息，确定所述当前第一音频数据包含的音频是否为异常音频；

26、在所述差异值小于所述差异阈值的情况下，确定所述当前第一音频数据包含的音频为正常音频。

27、可选地，所述方法还包括：

28、在确定所述当前第一音频数据包含的音频为异常音频的情况下，将所述当前第一音频数据加入到异常音频数据集中，以基于所述异常音频数据集中的异常音频数据进行异常处理；

29、在确定所述当前第一音频数据包含的音频为正常音频的情况下，将所述当前第一音频数据加入到所述当前路段的正常音频数据集中，以基于所述正常音频数据集中正常音频数据对应的特征图之间的差异重新生成所述当前路段的背景图。

30、可选地，通过以下步骤获取每个路段对应的音频频率阈值：

31、在确定所有设备均正常运行的情况下，获取所述巡检机器人按照所述目标路线实时采集的第三音频数据；

32、针对每个路段，在当前路段存在音频频率大于或等于预设的所述当前路段对应的音频频率初始阈值的第三音频数据的情况下，将所述当前路段的第三音频数据对应的最大音频频率确定为所述当前路段对应的音频频率阈值；

33、在当前路段不存在音频频率大于或等于所述音频频率初始阈值的第三音频数据的情况下，将所述音频频率初始阈值确定为所述当前路段对应的音频频率阈值。

34、可选地，通过以下步骤生成所述当前路段的背景图：

35、将在所述当前路段采集的第三音频数据构成的集合确定为所述当前路段的正常音频数据集；

36、针对所述正常音频数据集中每个正常音频数据，计算当前正常音频数据的能量谱密度信号；

37、根据所述当前正常音频数据的能量谱密度信号，在所述当前正常音频数据中去除背景噪声，得到第四音频数据；

38、对所述第四音频数据进行特征提取和后处理，得到所述当前第四音频数据对应的第二特征图；

39、基于每个第四音频数据对应的第二特征图之间的差异，生成所述当前路段的背景图。

40、第二方面，提供了一种异常音频识别装置，包括：

41、第一获取模块，用于获取按照目标路线巡检的巡检机器人实时采集的第一音频数据，所述目标路线包括多个路段，每个路段对应有各自的音频频率阈值；

42、第二获取模块，用于在当前所采集的所述第一音频数据对应的音频频率大于或等于当前路段对应的音频频率阈值的情况下，获取当前第一音频数据对应的第一特征图；

43、获得模块，用于将所述第一特征图与所述当前路段的背景图进行比较，获得所述第一特征图相对于所述背景图的第一差异图；

44、确定模块，用于基于所述第一差异图，确定所述当前第一音频数据包含的音频是否为异常音频；

45、其中，所述背景图是基于所述当前路段的正常音频数据集中正常音频数据对应的特征图之间的差异预先生成的。

46、第三方面，提供了一种电子设备，包括：

47、存储器，用于存储计算机程序；

48、处理器，用于执行所述计算机程序时实现如第一方面所述的异常音频识别方法的步骤。

49、第四方面，提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面所述的异常音频识别方法的步骤。

50、第五方面，提供了一种计算机程序产品，所述计算机程序产品包括计算机指令，所述计算机指令存储在计算机可读存储介质中，且适于由处理器读取并执行，以使得具有所述处理器的计算机设备执行如第一方面所述的异常音频识别方法的步骤。

51、应用本技术实施例所提供的技术方案，每个路段的背景图是基于相应路段的正常音频数据集中正常音频数据对应的特征图之间的差异预先生成的，使得每个路段的背景图能够准确反映相应路段的正常音频数据的特征，进而针对每个路段，根据巡检机器人实时采集的当前路段的音频频率较大的第一音频数据对应的第一特征图相对于当前路段的背景图的第一差异图，能够准确确定出第一音频数据包含的音频是否为异常音频。正常音频数据数量较多，基于正常音频数据很容易生成每个路段的背景图，不需要进行深度神经网络的训练，可以有效避免因异常样本数量较少导致深度神经网络训练时偏向于正常样本分类，难以准确识别异常音频数据的问题。

52、应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本技术。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：石巍
技术所有人：西安龙行智巡科技有限公司
我是此专利的发明人

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！