本发明属于音频信号处理和异常检测,涉及音频信号异常检测方法,具体是一种基于时空特征融合的异常检测模型构建及异常检测方法。
背景技术:
1、随着音频数据的广泛应用和传感器技术的发展,音频信号的处理与分析日益受到重视。音频信号中可能存在的异常现象,如噪声、故障或其他干扰,往往会影响系统的正常运行,并可能导致严重的安全隐患或经济损失。因此,及时检测和识别音频信号中的异常具有重要的应用价值。
2、近年来,深度学习技术的快速发展为音频信号异常检测带来了新的机遇,因此,亟需一种基于时空特征融合的音频信号异常检测方法,通过整合音频信号的时域特征与频域特征,能够更全面地捕捉到音频信号中的异常信息,从而提高检测的准确性与鲁棒性。结合多层次的特征融合,能够有效提升对复杂音频场景的适应能力,为音频信号的异常检测提供更为可靠的解决方案。
技术实现思路
1、针对现有技术存在的不足,本发明的目的在于,提供一种基于时空特征融合的异常检测模型构建及异常检测方法,以解决现有技术中的音频信号异常检测方法的准确度不高的技术问题。
2、为了解决上述技术问题,本发明采用如下技术方案予以实现:
3、一种基于时空特征融合的异常检测模型构建方法,具体包括以下步骤:
4、步骤1,获取原始音频数据,根据原始音频数据的文件名称划分类别,得到多个类别,并对原始音频数据进行预处理,得到梅尔频谱图;
5、步骤2,构建异常检测模型;
6、所述异常检测模型包括并列的多尺度特征提取模块和空间特征提取模块、特征连接模块和分类器;
7、所述多尺度特征提取模块用于对原始音频数据的不同尺度特征进行提取和融合,得到长短时特征;
8、空间特征提取模块用于对梅尔频谱图的空间特征进行提取,得到空间特征;
9、所述特征连接模块用于拼接长短时特征和空间特征,得到时空特征;
10、所述分类器用于对时空特征进行分类,得到原始音频数据在每个在类别上的概率,选出最大概率,并将最大概率作为分类器的输出结果;
11、步骤3,将步骤1得到的原始音频数据和梅尔频谱图作为输入,将原始音频数据在每个在类别上的概率中的最大概率作为输出,对步骤2构建的异常检测模型进行训练,得到训练好的异常检测模型。
12、本发明还包括以下技术特征:
13、所述多尺度特征提取模块包括依次设置的卷积模块、三个并列设置的特征提取模块、特征连接模块、特征融合模块和整形模块;
14、三个所述特征提取模块的卷积核大小不同。
15、所述空间特征提取模块包括编码器、中间层和解码器;
16、所述编码器包括三级特征压缩模块,每级所述特征压缩模块包括依次相连的卷积、激活函数和最大池化;
17、所述中间层包括卷积和激活函数;
18、所述解码器包括三级特征恢复模块,每级所述特征恢复模块包括依次相连的上采样、残差连接模块、卷积和激活函数。
19、所述预处理为短时傅里叶变换和滤波器处理。
20、一种基于时空特征融合的音频信号异常检测方法,具体包括以下步骤:
21、步骤一,获取待检测音频数据;
22、步骤二,步骤一得到的待检测音频信号数据输入至基于时空特征融合的异常检测模型构建方法中得到的训练好的异常检测模型中,得到待检测音频数据在每个类别上的概率,选出最大概率,并对该最大概率取负对数,得到异常分数;
23、步骤三,根据异常分数判定待检测音频数据是否异常。
24、本发明与现有技术相比,有益的技术效果是:
25、本发明中,将多尺度特征提取模块、空间特征提取模块和分类器结合,形成一个完整的异常检测模型(mtsgram-mfn),多尺度特征提取模块增强了网络对复杂音频模式的敏感度,空间特征提取模块提高了对梅尔频谱图中关键区域的关注能力,保持了上下文信息的完整性,提升了特征提取的准确性,解决现有技术中的音频信号异常检测方法的准确度不高的技术问题。
1.一种基于时空特征融合的异常检测模型构建方法,其特征在于,具体包括以下步骤:
2.如权利要求1所述基于时空特征融合的异常检测模型构建方法,其特征在于,所述多尺度特征提取模块包括依次设置的卷积模块、三个并列设置的特征提取模块、特征连接模块、特征融合模块和整形模块;
3.如权利要求1所述基于时空特征融合的异常检测模型构建方法,其特征在于,所述空间特征提取模块包括编码器、中间层和解码器;
4.如权利要求1所述基于时空特征融合的异常检测模型构建方法,其特征在于,所述预处理为短时傅里叶变换和滤波器处理。
5.一种基于时空特征融合的音频信号异常检测方法,其特征在于,具体包括以下步骤: