异常声音检测方法及系统的制作方法_2

文档序号:8224548阅读:来源:国知局
警。
【附图说明】
[0054] 图1为本发明一个具体实施例的异常声音检测方法的流程示意图;
[0055] 图2为本发明具体某一帖的异常声音检测方法流程示意图;
[0056] 图3为本发明一种使用自学习阔值的异常声音检测方法的流程示意图;
[0057] 图4为本发明的自学习阔值方法的流程示意图;
[005引图5为本发明自学习阔值的短时能量的直方图;
[0化9] 图6为另一种自学习阔值的短时能量的动态直方图;
[0060] 图7为本发明的一个具体实施例的异常声音检测系统的模块图;
[0061] 图8的本发明的异常声音检测系统的自学习模块的结构示意图。
【具体实施方式】
[0062] 为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中 给出了本发明的较佳的实施例。但是,本发明可许多不同的形式来实现,并不限于本文 所描述的实施例。相反地,提供该些实施例的目的是使对本发明的公开内容的理解更加透 彻全面。
[0063] 除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的 技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具 体的实施例的目的,不是旨在于限制本发明。本文所使用的术语"和/或"包括一个或多个 相关的所列项目的任意的和所有的组合。
[0064] 如图1所示,异常声音检测的方法包括W下步骤。
[0065] S100 ;实时采集音频信号。
[0066] 获取音频信号实时采集的音频信号,并分帖。在本实施例中,采样频率为8000监, 一帖音频长为160个采样值。
[0067] S101 ;计算采集的音频信号的每一帖的短时能量和/或过零率。
[0068] 从整体来看,音频信号的特征是随时间变化的,但是在一个短时间范围内,通常认 为在10?30ms的短时内,其特征基本保持不变,相对稳定,具有短时平稳性。所W可W将 音频信号分割成一帖一帖的短时信号来进行分析。
[0069] 短时能量反映的是音频信号的能量情况,如果计算的某一帖的短时能量较高,贝U 说明该帖的音频信号的能量较高。
[0070] 短时能量STEi (Shod Time Energy);表示第i帖音频信号的短时能量。计算公式 如下:
[0071]
【主权项】
1. 一种异常声音检测方法,包括步骤: 实时采集音频信号; 计算采集的音频信号的每一帖的短时能量和/或过零率; 获取第一短时能量阔值; 依次比较所述音频信号的每一帖的短时能量与所述第一短时能量阔值的大小; 若当前帖的短时能量大于第一短时能量阔值,则将所述当前帖记为第一等级帖; 若当前帖的短时能量小于第一短时能量阔值,则获取第二短时能量阔值和/或过零率 阔值,根据第二短时能量阔值或过零率阔值确认是否将所述前帖记为第二等级帖,所述确 认是否将所述前帖记为第二等级帖的步骤包括: 若当前帖的短时能量大于所述第二短时能量阔值或当前帖的过零率大于所述过零率 阔值,则将所述当前帖记为第二等级帖; 计录连续为第一等级帖或第二等级帖的帖数量; 判断连续为第一等级帖或第二等级帖的帖数量是否大于N且当前帖是否为第一等级 帖,其中,N为预定数量,N为正整数; 若是,则判断声音异常。
2. 根据权利要求1所述的异常声音检测方法,其特征在于,若比较当前帖的短时能量 小于第二短时能量阔值或若当前帖的过零率小于所述过零率阔值,则将所记录的连续为第 一等级帖或第二等级帖的帖数量初始化为0。
3. 根据权利要求1所述的异常声音检测方法,其特征在于,在所述获取第一短时能量 阔值的步骤之前还包括: 自学习音频阔值,计算并保存第一短时能量阔值、第二短时能量阔值和过零率阔值。
4. 根据权利要求3所述的异常声音检测方法,其特征在于,所述自学习音频的步骤,具 体包括: 采集用于自学习的音频信号; 计算所采集的音频信号的每一帖的短时能量和过零率; 使用直方图分别统计所述音频信号的短时能量和过零率; 判断本次自学习时间是否大于预定的学习时间; 若判断本次自学习时间大于预定的学习时间,则根据直方图计算本次学习正常声音的 短时能量和过零率,所述正常声音的短时能量为短时能量直方图中数值最大的组对应的取 值范围的中值;所述正常声音过零率为过零率直方图中数值最大的组对应的取值范围的中 值; 判断本次学习是否为初次学习; 若判断本次学习为初次学习,根据所述正常声音的短时能量和所述正常声音的过零率 计算第一短时能量阔值、第二短时能量阔值和过零率阔值。
5. 根据权利要求4所述的异常声音检测方法,其特征在于,所述根据正常声音的短 时能量和所述正常常声音的过零率计算第一短时能量阔值STCthl、第二短时能量阔值 STCth2和过零率阔值Z邸th的公式分别为; STCthl = a*STE;back STCth2 = 0. 5巧TCthl ZCR 化=b*ZCRback 其中,STEback和ZC化ack是本次学习的正常声音的短时能量和过零率,a和b是一个 常量参数。
6. 根据权利要求5所述的异常声音检测方法,其特征在于,若判断本次学习为非初次 学习,则根据上次学习得到的正常声音的短时能量和过零率与本次学习得到的正常声音的 短时能量和过零率得到更新的正常声音的短时能量和过零率,并根据更新的正常声音的短 时能量和过零率更新第一短时能量阔值、第二短时能量阔值和过零率阔值。
7. 根据权利要求6所述的异常声音检测方法,其特征在于,若判断本次学习为非初次 学习,则根据上次学习得到的正常声音的短时能量和过零率与本次学习得到的正常声音的 短时能量和过零率得到更新的正常声音的短时能量STCback和过零率Z邸back的公式为; STEback = (1-a )*STE;back_last+a 巧1663〇1^_州1' ; ZCI^back = (1-a )*ZCI?back_last+a *2〔化3〇1^_州1' ; 其中,STCback_last为上次学习的正常声音短时能量;STCback_cur为本次学习的 正常声音的短时能量;a为阔值更新速度;ZC化ack_last为上次学习的正常声音过零率; Z邸back_cur为本次学习正常声音的过零率。
8. -种异常声音检测系统,其特征在于,包括: 采集模块,用于实时采集音频信号; 计算模块,用于计算采集的音频信号的每一帖的短时能量和/或过零率; 获取模块,获取第一短时能量阔值; 第一比较模块,用于依次比较所述音频信号的每一帖的短时能量与所述第一短时能量 阔值的大小; 标记模块,用于当第一比较模块比较当前帖的短时能量大于第一短时能量阔值时,将 所述当前帖记为第一等级帖; 所述获取模块,还用于当第一比较模块比较当前帖的短时能量小于第一短时能量阔值 时,获取第二短时能量阔值和/或获取过零率阔值; 第二比较模块,用于根据第二短时能量阔值或过零率阔值确认是否将所述前帖记为第 二等级帖,具体用于比较当前帖的短时能量与第二短时能量阔值的大小或当前帖的过零率 与所述过零率阔值的大小; 所述标记模块,还用于当第二比较模块比较当前帖的短时能量大于所述第二短时能量 阔值时或若当前帖的过零率大于所述过零率阔值,将所述当前帖记为第二等级帖; 记录模块,用于计录连续为第一等级帖或第二等级帖的帖数量; 判断模块,用于判断连续为第一等级帖或第二等级帖的帖数量是否大于N且当前帖是 否为第一等级帖;其中,N为预定数量,N为正整数; 异常判断模块,用于判断模块判断连续为第一等级帖或第二等级帖的帖数量大于N且 当前帖为第一等级帖时,判断声音异常。
9. 根据权利要求8所述的异常声音检测系统,其特征在于,所述记录模块还用于,在第 二比较模块比较当前帖的短时能量小于所述第二短时能量阔值或当前帖的过零率小于所 述过零率阔值时,将记录的连续为第一等级帖或第二等级帖的帖数量初始化为0。
10. 根据权利要求8所述的异常声音检测系统,其特征在于,还包括: 自学习模块,所述自学习模块用于自学习音频阔值,计算并保存第一短时能量阔值、第 二短时能量阔值和过零率阔值。
【专利摘要】本发明公开了一种异常声音检测方法和系统,通过比较采集的音频信号的每一帧的短时能量与第一短时能量阈值的大小,若大于第一短时能量阈值,则该帧记为第一等级帧,若小于第一短时能量阈值,则比较其短时能量与第二阈值的大小或其过零率与过零率阈值的大小,将短时能量大于第二短时能量阈值或过零率大于过零率阈值的帧记为第二等级帧,若连续为第一等级帧或第二等级帧的帧数量大于N且当前帧为第一等级帧时,则判断声音异常。该方法通过计算短时能量和过零率判断异常声音,由于短时能量和过零率属于时域特征,不涉及频域变换和特征参数的计算,能够降低计算的复杂度。同时,通过对实时采集的音频信息进行处理,能够实时处理分析,及时判断异常。
【IPC分类】G10L25-21, G10L25-51
【公开号】CN104538041
【申请号】CN201410765322
【发明人】杨闯, 周蕾蕾
【申请人】深圳市智美达科技有限公司
【公开日】2015年4月22日
【申请日】2014年12月11日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1