行车噪声环境下的快速声学事件检测系统的制作方法

文档序号:2828037阅读:201来源:国知局
行车噪声环境下的快速声学事件检测系统的制作方法
【专利摘要】行车噪声环境下的快速声学事件检测系统,涉及快速声学事件检测系统。本发明为了解决现有的声学事件检测系统在行车环境下系统识别率较低的问题。行车噪声环境下的快速声学事件检测系统包括:声学事件模型训练模块、风噪模型训练模块和识别检测模块;所述的识别检测模块包括声音采集和预处理子模块、去噪子模块、AWeighting加权子模块、特征提取子模块及SVM模型识别子模块;该系统对于行车环境下不可避免的风噪具有较好的抗噪能力,在各种风噪条件下检测性能具有鲁棒性;在相同的风噪条件下,本发明比现有的声学事件检测系统的识别率提高20%-30%。本发明适用于快速声学事件的检测。
【专利说明】
行车噪声环境下的快速声学事件检测系统

【技术领域】
[0001]本发明涉及快速声学事件检测系统,属于多媒体信息处理【技术领域】。

【背景技术】
[0002]无人车研究的核心内容之一即是智能行为决策,而智能行为决策的前提则是其行驶过程中对周边环境的自动感知。感知环境信息的手段可以有多种,其中视听觉信息的自动感知在无人车的行驶中起着重要的作用,但是外部世界与无人车间的很多交互信息还有很多是基于声音的,而这些及行车环境下的声学事件,具体如警车和救护车的警笛声、铁路道口的警笛声、各种车辆提示避让的鸣笛声等,感知周围这些基于声音的交互信息,并做出正确的智能决策对无人车而言至关重要。
[0003]无人车在投入实际应用之前,存在两个无可避免的问题:风噪和实时性。首先,行车环境属于开放噪声环境,车辆行驶中与气流摩擦形成较风噪,并且车速越快风噪越强;风噪变化无规律,经常覆盖目标声学事件,导致信号信噪比降低。过滤信号中的风噪,提高目标声学事件的强度,是声学事件检测至关重要的一步。其次在行车环境下,无人车高速行驶,如果无人车处理紧急声学事件有较大延时,反映迟钝,或者处理错误,没有正确相应,就会酿造交通事故,造成重大损失。所以,无人车需要对发生的特定声学事件做出正确、实时的响应,同时兼顾性能和速度两方面需求。此行车噪声环境下的快速声学事件检测系统,应用过滤风噪和快速识别声学事件的算法,很好的解决了这两个问题,为无人车实验平台的控制和管理提供有益的帮助信息,推动无人车投入实用。


【发明内容】

[0004]本发明为了解决现有的声学事件检测系统在行车环境下系统识别率较低的问题。进而提出了一种行车噪声环境下的快速声学事件检测系统。
[0005]行车噪声环境下的快速声学事件检测系统,包括:声学事件模型训练模块、风噪模型训练模块和识别检测模块;所述的识别检测模块包括声音采集和预处理子模块、去噪子模块、Affeighting加权子模块、特征提取子模块及SVM模型识别子模块;
[0006]所述的声学事件模型训练模块,用于支持在识别检测模块实现声学事件的检测;
[0007]该模块用于读取用户提交的声音语料训练该声学事件的SVM模型,输出为该事件的声学事件模板文件和声学事件SVM模型文件;声学事件模板文件用于与特征提取子模块的对比,声学事件SVM模型文件用做SVM模型识别子模块的识别依据;
[0008]所述的风噪模型训练模块,用于依据用户提交的风噪语料训练得到风噪RBF模型,该模块的输出为特定格式的风噪模型文件,在指定路径下用此模型文件替换去噪子模块中的历史风噪模型文件,使去噪子模块支持新的风噪模型;
[0009]所述的声音采集和预处理子模块,用于控制声卡和麦克风实现声音采集,得到和缓冲音频数据,对数据分帧、加窗,再进行频谱变换和梅尔子带划分,最后对数据进行规格化,并以帧为单位将各帧的梅尔子带能量传送给去噪子模块;
[0010]所述的去噪子模块,根据待识别音频数据中的低频子带能量,用风噪RBF模型估计高频子带中的噪声能量,然后用谱减法去除梅尔子带能量中的风噪成分,并将去噪后梅尔子带能量逐巾贞传送到AWeighting加权子模块;
[0011]所述的AWeighting加权子模块,根据人耳在感知声音响度方面的听觉机理,用Affeighting加权方法对梅尔子带能量进行加权,达到把音频信号映射到真实的人耳听觉领域,加权后的梅尔子带能量被传送到特征提取子模块;
[0012]所述的特征提取子模块,用于对分析窗内的音频进行分析和特征提取,分析窗由若干帧数据组成,对不同的声学事件,用相应的声学事件模板定位其主要活动频带和时长,然后提取其上升/下降单元,并计算此段信号与声学事件模板的相似度,把这特征拼接起来作为特征向量;分析窗不断向前滑动,每一窗提取一个特征向量并送SVM模型识别子模块进行识别判决;
[0013]所述的SVM模型识别子模块,用于根据相应的声学事件SVM模型,基于特征向量判定是否为目标声学事件,并在一定时间尺度上对识别结果进行平滑和整合,然后作为检测结果输出。
[0014]本发明提出了一种目标声学事件检测系统,该系统对于行车环境下不可避免的风噪具有较好的抗噪能力,在各种风噪条件下检测性能具有鲁棒性;在相同的风噪条件下,本发明比现有的声学事件检测系统的识别率提高20% -30%。

【专利附图】

【附图说明】
[0015]图1为本发明中行车噪声环境下的快速声学事件检测系统的组成结构图。

【具体实施方式】
[0016]【具体实施方式】一:结合图1说明本实施方式,行车噪声环境下的快速声学事件检测系统包括:声学事件模型训练模块、风噪模型训练模块和识别检测模块;所述的识别检测模块包括声音采集和预处理子模块、去噪子模块、AWeighting加权子模块、特征提取子模块及SVM模型识别子模块;
[0017]所述的声学事件模型训练模块,用于支持在识别检测模块实现声学事件的检测;
[0018]该模块用于读取用户提交的声音语料训练该声学事件的SVM模型,输出为该事件的声学事件模板文件和声学事件SVM模型文件;声学事件模板文件用于与特征提取子模块的对比,声学事件SVM模型文件用做SVM模型识别子模块的识别依据;
[0019]所述的风噪模型训练模块,用于依据用户提交的风噪语料训练得到风噪RBF模型,该模块的输出为特定格式的风噪模型文件,在指定路径下用此模型文件替换去噪子模块中的历史风噪模型文件,使去噪子模块支持新的风噪模型;
[0020]所述的声音采集和预处理子模块,用于控制声卡和麦克风实现声音采集,得到和缓冲音频数据,对数据分帧、加窗,再进行频谱变换和梅尔子带划分,最后对数据进行规格化,并以帧为单位将各帧的梅尔子带能量传送给去噪子模块;
[0021]所述的去噪子模块,根据待识别音频数据中的低频子带能量,用风噪RBF模型估计高频子带中的噪声能量,然后用谱减法去除梅尔子带能量中的风噪成分,并将去噪后梅尔子带能量逐巾贞传送到AWeighting加权子模块;
[0022]所述的AWeighting加权子模块,根据人耳在感知声音响度方面的听觉机理,用Affeighting加权方法对梅尔子带能量进行加权,达到把音频信号映射到真实的人耳听觉领域,加权后的梅尔子带能量被传送到特征提取子模块;
[0023]所述的特征提取子模块,用于对分析窗内的音频进行分析和特征提取,分析窗由若干帧数据组成,对不同的声学事件,用相应的声学事件模板定位其主要活动频带和时长,然后提取其上升/下降单元,并计算此段信号与声学事件模板的相似度,把这特征拼接起来作为特征向量;分析窗不断向前滑动,每一窗提取一个特征向量并送SVM模型识别子模块进行识别判决;
[0024]所述的SVM模型识别子模块,用于根据相应的声学事件SVM模型,基于特征向量判定是否为目标声学事件,并在一定时间尺度上对识别结果进行平滑和整合,然后作为检测结果输出。
[0025]针对本发明行车噪声环境下的快速声学事件检测系统的各个功能模块的运行进一步阐述如下:
[0026]在声音采集和预处理子模块中,采用梅尔子带能量来刻画声音的频谱轮廓;去噪子模块利用信号频谱的低频部分主要与风噪有关的特性,以及高频部分中的噪声成分随着低频能量的增强而增强的这种相关性,采用径向基函数神经网络做为风噪的预测模型,用高斯函数作为隐藏层节点的映射函数,用声音信号的低频子带向量作为输入,风噪的高频子带向量作为输出,即用信号的低频子带能量去预测噪声的高频子带能量;然后采用谱减的方法,在信号的高频子带能量中减除预测得到的风噪的对应子带能量;而风噪预测所采用的径向基函数神经网络模型由风噪模型训练模块训练给出,依据用户给出的风噪数据通过梯度训练算法训练得到;AWeighting加权子模块采用一种基于人耳等响度曲线A加权滤波器对去噪处理后的声音的频谱轮廓进行加权,即用事先存储的人耳等响度曲线A加权滤波器曲线去修正各子带能量,使识别器的输入尽量与人类听觉系统的输入相一致,从而使识别器的识别结果与人类判别结果更加一致;
[0027]声学事件模型训练模块依据用户提交的声音语料,同时生成了声学事件模板和声学事件SVM模型两套识别模型,声学事件模板是通过一个自动聚类分析算法得到,该算法的聚类准则是在保证聚类结果中的每个聚类对其它聚类具有较好的可区分性的条件下,保证其对背景数据也具有最好可区分性;然后每个聚类产生一个声学事件模板;声学事件SVM模型则利用用户提交的声学事件的声音语料作为正例,用提交的背景数据作为反例,采用高斯径向基核函数,通过SVM训练算法训练得到;在特征提取子模块中,首先利用声学事件模板限定特征提取时的分析窗尺寸和子带范围,然后通过显著性分析手段提取待识别声音频谱和声学事件模板频谱上的主要变化轨迹,并计算两者的相似性,并依据变化轨迹信息和相似性信息来构造识别特征;在SVM模型识别子模块中,将特征提取子模块中得到的声学统计特征输入到声学事件SVM模型进行识别判决,最后得到识别结果作为检测结果输出。
[0028]【具体实施方式】二:所述声音语料包括声学事件语料、反例语料和背景语料。
[0029]其它步骤及参数与【具体实施方式】一相同。
【权利要求】
1.行车噪声环境下的快速声学事件检测系统,其特征在于该系统包括:声学事件模型训练模块、风噪模型训练模块和识别检测模块;所述的识别检测模块包括声音采集和预处理子模块、去噪子模块、AWeighting加权子模块、特征提取子模块及SVM模型识别子模块; 所述的声学事件模型训练模块,用于支持在识别检测模块实现声学事件的检测;该模块用于读取用户提交的声音语料训练该声学事件的SVM模型,输出为该事件的声学事件模板文件和声学事件SVM模型文件;声学事件模板文件用于与特征提取子模块的对t匕,声学事件SVM模型文件用做SVM模型识别子模块的识别依据; 所述的风噪模型训练模块,用于依据用户提交的风噪语料训练得到风噪RBF模型,该模块的输出为特定格式的风噪模型文件,在指定路径下用此模型文件替换去噪子模块中的历史风噪模型文件,使去噪子模块支持新的风噪模型; 所述的声音采集和预处理子模块,用于控制声卡和麦克风实现声音采集,得到和缓冲音频数据,对数据分帧、加窗,再进行频谱变换和梅尔子带划分,最后对数据进行规格化,并以帧为单位将各帧的梅尔子带能量传送给去噪子模块; 所述的去噪子模块,根据待识别音频数据中的低频子带能量,用风噪RBF模型估计高频子带中的噪声能量,然后用谱减法去除梅尔子带能量中的风噪成分,并将去噪后梅尔子带能量逐巾贞传送到AWeighting加权子模块; 所述的AWeighting加权子模块,根据人耳在感知声音响度方面的听觉机理,用Affeighting加权方法对梅尔子带能量进行加权,达到把音频信号映射到真实的人耳听觉领域,加权后的梅尔子带能量被传送到特征提取子模块; 所述的特征提取子模块,用于对分析窗内的音频进行分析和特征提取,分析窗由若干帧数据组成,对不同的声学事件,用相应的声学事件模板定位其主要活动频带和时长,然后提取其上升/下降单元,并计算此段信号与声学事件模板的相似度,把这特征拼接起来作为特征向量;分析窗不断向前滑动,每一窗提取一个特征向量并送SVM模型识别子模块进行识别判决; 所述的SVM模型识别子模块,用于根据相应的声学事件SVM模型,基于特征向量判定是否为目标声学事件,并在一定时间尺度上对识别结果进行平滑和整合,然后作为检测结果输出。
2.根据权利要求1所述行车噪声环境下的快速声学事件检测系统,其特征在于:所述声音语料包括声学事件语料、反例语料和背景语料。
【文档编号】G10L15/02GK104361887SQ201410668501
【公开日】2015年2月18日 申请日期:2014年11月20日 优先权日:2014年11月20日
【发明者】郑铁然, 韩纪庆, 朱强华 申请人:哈尔滨工业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1