一种基于隐马尔可夫模型的汽车声音识别方法

文档序号:2830199阅读:432来源:国知局
专利名称:一种基于隐马尔可夫模型的汽车声音识别方法
一种基于隐马尔可夫模型的汽车声音识别方法
技术领域
本发明涉及一种音频处理和模式识别技术领域,尤其涉及一种基于隐马尔可夫模 型的汽车声音识别方法。
背景技术
HMM(隐马尔可夫模型)是马尔可夫链的一种,它的状态不能直接观察到,但能通 过观测向量序列观察到,每个观测向量都是通过某些概率密度分布表现为各种状态,每一 个观测向量是由一个具有响应概率密度分布的状态序列产生。所以,隐马尔可夫模型是一 个双重随机过程具有一定状态数的隐马尔可夫链和显示随机函数集。自20世纪80 年代以来,HMM被应用于语音识别,取得重大成功。到了 90年代,HMM还被引入计算机文字 识别和移动通信核心技术“多用户的检测”。近年来,HMM在生物信息科学、故障诊断等领域 也开始得到应用。随着人们生活水平的不断提高,车辆在不断的增多,很多小区和单位对车辆的管 理都不是很有条理,现有技术一般都是人为的对车辆进行管理,在此提出利用识别车辆声 音的方法来更好的管理车辆,该方法嵌入到门禁系统中,可以统计识别不同车辆进出数据。 车辆音频信号与语音信号一样都是随时间变化的,即使是同一辆车在不同时刻不同地点产 生的音频信号都是不同的,这表明车辆音频信号的不确定性,它只具有统计的确定性,为描 述这种音频信号随时间变化的特性,采用状态的概念是比较恰当的,音频信号特征的变化 表现为从一个状态到另一个状态的转移,特征从一个状态到另一个状态只是以一定的概率 转移。因此,用隐马尔可夫模型可以很好的表示这一转移过程。车辆声音识别的过程首先 用美尔倒谱(MFCC)算法提取车辆声音的特征参数,其中MFCC是在Mel度频率域提取出来 的倒谱参数。Mel标度描述了人耳对频率感知的非线性特征,它与频率的关系可近似表示为 Mel (f) = 2595*log(l+f/700)其中f为频率,单位是Hz。同时MFCC分析着眼于人耳的听 觉机理,依据听觉实验的结果来分析声音的频谱,获得了较高的识别率和较好的噪声鲁棒 性。MFCC的计算是先把信号变换到频域得到线性频谱,再经过一组的Mel滤波器组,得到 能够模拟人耳听觉特性的非线性频谱,然后取对数变换,压缩音谱的动态范围,最后作DCT 变换。

发明内容本发明要解决的技术问题,在于提供一种基于隐马尔可夫模型的汽车声音识别方 法,通过车辆声音识别方法准确识别不同车辆,便于车辆管理,可应用于小区或单位的门禁 系统等场景,具有极好的应用前景。本发明是这样实现的一种基于隐马尔可夫模型的汽车声音识别方法,其特征在 于包括以下步骤步骤10、基本预处理将采集的车辆音频信号进行归一化,再将音频信号中的数 据划分成N个帧,并对每个帧进行加海明窗滤波;
权利要求
一种基于隐马尔可夫模型的汽车声音识别方法,其特征在于包括以下步骤步骤10、基本预处理将采集的车辆音频信号进行归一化,再将音频信号中的数据划分成N个帧,并对每个帧进行加海明窗滤波;步骤20、去噪处理将音频信号在频域中根据公式 <mrow><mo>|</mo><msub> <mover><mi>S</mi><mo>^</mo> </mover> <mi>w</mi></msub><mrow> <mo>(</mo> <mi>&omega;</mi> <mo>)</mo></mrow><mo>|</mo><mo>=</mo><msup> <mrow><mo>[</mo><msup> <mrow><mo>|</mo><msub> <mi>Y</mi> <mi>w</mi></msub><mrow> <mo>(</mo> <mi>&omega;</mi> <mo>)</mo></mrow><mo>|</mo> </mrow> <mi>a</mi></msup><mo>-</mo><msup> <mrow><mi>b</mi><mo>|</mo><msub> <mover><mi>N</mi><mo>^</mo> </mover> <mi>w</mi></msub><mrow> <mo>(</mo> <mi>&omega;</mi> <mo>)</mo></mrow><mo>|</mo> </mrow> <mi>a</mi></msup><mo>]</mo> </mrow> <mfrac><mn>1</mn><mi>a</mi> </mfrac></msup> </mrow>算出纯净信号的功率谱,其中Yw(ω)表示带噪信号功率,表示噪声功率,表示纯净信号的功率谱,其中w是下标表示经过加窗处理后的信号,a为谱减功率修正系数,b为谱减噪声系数,获得纯净信号的功率谱通过相位恢复后再采用逆傅里叶变换来恢复时域信号;步骤30、对每个帧计算MFCC系数,获得车辆声音12维特征参数,再根据公式 <mrow><mi>d</mi><mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo></mrow><mo>=</mo><mfrac> <mn>1</mn> <msqrt><munderover> <mi>&Sigma;</mi> <mrow><mi>i</mi><mo>=</mo><mo>-</mo><mi>k</mi> </mrow> <mi>k</mi></munderover><msup> <mi>i</mi> <mn>2</mn></msup> </msqrt></mfrac><munderover> <mi>&Sigma;</mi> <mrow><mi>i</mi><mo>=</mo><mo>-</mo><mi>k</mi> </mrow> <mi>k</mi></munderover><mi>i</mi><mo>&CenterDot;</mo><mi>c</mi><mrow> <mo>(</mo> <mi>n</mi> <mo>+</mo> <mi>i</mi> <mo>)</mo></mrow><mo>,</mo><mrow> <mo>(</mo> <mi>n</mi> <mo>=</mo> <mn>3,4</mn> <mo>,</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mi>T</mi> <mo>-</mo> <mn>2</mn> <mo>)</mo></mrow> </mrow>计算帧间差分系数,其中c和d都表示一帧声音参数,T表示总帧数;k为常数,将差分系数追加至原12维的MFCC系数末尾,并去除所有帧的首两帧和末两帧系数,得到24维的车辆声音特征参数;步骤40、用HMM模型对所有的汽车声音样本一一进行建模,将HMM模型参数(N,π,A,B)初始化,其中状态数N取整数1到4,初始概率π为[1 0 0 0],状态转移概率A取为根据混合高斯函数求出参数B,B是状态输出观测值的概率,其中N是高斯概率密度函数,O是声音的特征系数帧即观察序列,μ、U、c、分别是均值、方差、以及权重系数,M是每个状态包含的高斯混元个数,先对观察序列的参数分成N段,然后用K均值聚类算法初始化各状态的混合高斯概率密度函数中的均值、方差和权系数;步骤50、初始化模型参数后,并设置迭代次数,用Viterbi算法计算HMM输出所有训练声音观测序列的概率P(O/λ),并累加得到∑1中,再用Baum Welch算法对模型参数进行重估,得到再用Viterbi算法计算HMM输出所有训练声音观测序列的概率并累加得到∑2,将∑1和∑2结果进行比较,判断差值是否小于预设阈值?是,则无需进行重估计算,将作为计算结果输出,否则将作为新的初值代入P(O/λ)中的λ做新一轮运算,将所有汽车声音的样本进行如上处理后导入到参考模板库中;步骤60、进行识别先对待测车辆音频信号进行预处理,求出24维MFCC特征参数,即所述的观察值序列,然后利用viterbi算法求参考模板库中各个HMM模型输出该观测序列的概率P(O/λ),其中P(O/λ)最大的HMM模型所对应的汽车声音样本即为识别结果。FDA0000028643560000012.tif,FDA0000028643560000013.tif,FDA0000028643560000014.tif,FDA0000028643560000016.tif,FDA0000028643560000017.tif,FDA0000028643560000021.tif,FDA0000028643560000022.tif,FDA0000028643560000023.tif,FDA0000028643560000024.tif
2.根据权利要求1所述的一种基于隐马尔可夫模型的汽车声音识别方法,其特征在 于所述的步骤40中分段,其分段方法包括如下步骤 步骤401、根据公式
全文摘要
本发明提供一种基于隐马尔可夫模型的汽车声音识别方法,先对车辆声音数据进行归一化、分帧、加窗、去噪等预处理,然后利用美尔倒谱(MFCC)算法提取车辆声音的特征参数;再利用隐马尔科夫模型算法(HMM)对每一部车辆声音样本进行训练,并建立相应的模型,加入模板库;将待识别车辆声音经预处理、求取MFCC特征系数后,与模板库中的所有样本一一匹配,得到最佳匹配值所对应的样本即为识别结果。本发明通过车辆声音识别方法准确识别不同车辆,便于车辆管理,可应用于小区或单位的门禁系统等场景,具有极好的应用前景。
文档编号G10L21/02GK101980336SQ201010510428
公开日2011年2月23日 申请日期2010年10月18日 优先权日2010年10月18日
发明者王子亮, 陈铮 申请人:福州星网视易信息系统有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1