本申请涉及信号处理,特别涉及一种报警音识别的方法、装置、电子设备及存储介质。
背景技术:
1、汽车报警提示音是确保汽车驾驶安全及确认车辆状态的重要交互手段。道路驾驶环境千变万化,汽车座舱内语音交互系统也快速变化。随着座舱智能化的发展,娱乐主机需要通过不同报警音来提示各种信息,因此需要判断报警音是否被正确播放。现有的技术手段通过音频采集卡对车辆报警音进行分析很难区分出报警音的种类,一般只能通过人耳进行识别。但是由于车载ecu报警音种类繁多,依靠人耳进行验证识别难度较大,时间成本较高,正确率低下。
技术实现思路
1、有鉴于此,本申请实施例提供了一种报警音识别的方法、装置、电子设备及存储介质,旨在提高报警音识别的效率及准确性,避免人力资源的浪费。
2、第一方面,本申请实施例提供了一种报警音识别的方法,所述方法包括:
3、对采样后的报警音频进行预处理得到第一音频;
4、在所述第一音频的目标位置处进行剪切得到第二音频,所述目标位置为所述第一音频与标准音频符合相似度阈值的音频段位置;
5、计算所述第二音频与所述标准音频的相关系数,基于所述相关系数进行报警音的识别,所述相关系数用于确定所述第二音频与所述标准音频之间的关联程度。
6、可选的,所述对采样后的报警音频进行预处理得到第一音频,包括:
7、对所述报警音频进行分帧处理,得到单帧音频数据;
8、设置幅度阈值;
9、计算所述单帧音频数据的幅度平均值;
10、基于所述幅度阈值与所述单帧音频数据的幅度平均值进行比较,确定出所述第一音频的起始位置及末端位置,得到所述第一音频。
11、可选的,所述基于所述幅度阈值与所述单帧音频数据的幅度平均值进行比较,确定出所述第一音频的起始位置及末端位置,包括:
12、从所述报警音频的起始端位置开始,向后将每帧音频数据的幅度平均值与所述幅度阈值进行比较,当出现单帧音频数据的幅度平均值大于所述幅度阈值时,确认为所述第一音频的起始位置;
13、从所述报警音频的末端位置开始,向前将每帧音频数据的幅度平均值与所述幅度阈值进行比较,当出现单帧音频数据的幅度平均值大于所述幅度阈值时,确认为所述第一音频的末端位置。
14、可选的,所述在所述第一音频的目标位置处进行剪切得到第二音频,包括:
15、计算所述第一音频与所述标准音频的互相关函数;
16、判断所述第一音频的音频长度与所述标准音频的音频长度的大小关系;
17、在所述互相关函数最大处对所述第一音频与所述标准音频中较长的音频进行剪切得到所述第二音频。
18、可选的,所述计算所述第二音频与所述标准音频的相关系数,基于所述相关系数进行报警音的识别,包括:
19、计算所述第二音频与所述标准音频的相关系数;
20、将计算结果进行排序,取相关系数最大的音频作为最佳匹配结果,取相关系数第二大的音频作为次佳匹配结果;
21、根据所述匹配结果进行所述报警音的识别。
22、可选的,所述在所述第一音频的目标位置处进行剪切得到第二音频之前,还包括:
23、设置空白音频幅度阈值;
24、判断所述第一音频的幅度是否大于所述空白音频幅度阈值;
25、若否,则确定所述第一音频为空白音频,直接返回无效识别的结果。
26、第二方面,本申请实施例提供了一种报警音识别的装置,所述装置包括:处理模块、剪切模块及计算模块;
27、所述处理模块用于,对采样后的报警音频进行预处理得到第一音频;
28、所述剪切模块用于,在所述第一音频的目标位置处进行剪切得到第二音频,所述目标位置为所述第一音频与标准音频符合相似度阈值的音频段位置;
29、所述计算模块用于,计算所述第二音频与所述标准音频的相关系数,基于所述相关系数进行报警音的识别,所述相关系数用于确定所述第二音频与所述标准音频之间的关联程度。
30、第三方面,本申请提供了一种电子设备,所述设备包括:处理器、存储器、系统总线;
31、所述处理器以及所述存储器通过所述系统总线相连;
32、所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行实现第一方面所述方法。
33、第四方面,本申请实施例提供了一种计算机存储介质,所述计算机存储介质中存储有代码,当所述代码被运行时,运行所述代码的设备实现前述第一方面任一项所述方法。
34、本申请提供了一种报警音识别的方法、装置、电子设备及存储介质。在执行所述方法时,首先对采样后的报警音频进行预处理得到第一音频。然后在所述第一音频的目标位置处进行剪切得到第二音频,所述目标位置为所述第一音频与标准音频符合相似度阈值的音频段位置。最后计算所述第二音频与所述标准音频的相关系数,基于所述相关系数进行报警音的识别,所述相关系数用于确定所述第二音频与所述标准音频之间的关联程度。如此,通过对采样后的音频进行预处理可以获取采样音频中的有效音频数据,利用互相关函数可以计算出上述有效音频数据与标准音频数据间的卷积计算结果,进而取出没有边缘的卷积部分,即截断卷积计算结果,获取其最大值的索引,即待匹配音频和标准音频最为相似的地方。最后利用相关系数计算有效音频数据与标准音频数据的相关系数确定出两者的相关性,根据相关性对采样音频进行匹配识别。具体过程可以依据程序自动处理:筛选出音频类型文件,对音频数据依据幅值大小进行裁切,提取出有效语音片段,节省计算资源,提高匹配效率,同时提高报警音识别的效率及准确性,避免人力资源的浪费。
1.一种报警音识别的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,对采样后的报警音频进行预处理得到第一音频的步骤包括:
3.根据权利要求2所述的方法,其特征在于,基于所述幅度阈值与所述单帧音频数据的幅度平均值进行比较,确定出所述第一音频的起始位置及末端位置的步骤包括:
4.根据权利要求1所述的方法,其特征在于,在所述第一音频的目标位置处进行剪切得到第二音频的步骤包括:
5.根据权利要求1所述的方法,其特征在于,计算所述第二音频与所述标准音频的相关系数,基于所述相关系数进行报警音的识别的步骤包括:
6.根据权利要求1所述的方法,其特征在于,在所述第一音频的目标位置处进行剪切得到第二音频的步骤之前,还包括:
7.一种报警音识别的装置,其特征在于,所述系统包括:处理模块、剪切模块及计算模块;
8.根据权利要求7所述的装置,其特征在于,所述处理模块,具体用于:
9.一种电子设备,其特征在于,所述设备包括:处理器、存储器、系统总线;
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有实现报警音识别的方法的实现程序,所述实现报警音识别的方法的实现程序被处理器执行时实现如权利要求1-6任意一项所述方法的步骤。