基于动态累积量估计的语音信号端点检测方法

文档序号:8488601阅读:314来源:国知局
基于动态累积量估计的语音信号端点检测方法
【技术领域】
[0001] 本发明涉及数据统计分析和信号处理领域,尤其涉及一种基于动态累积量估计的 语音信号端点检测方法。
【背景技术】
[0002] 随着人-机交互技术的日益发展,语音识别已经成为当前人工智能与模式识别领 域研宄的重点。语音是人类最重要和最方便的信息传递方式,也是实现人_机交互的最直 接途径之一。让机器能够准确地识别出语音命令并执行相应的操作,具有重大的实际意义, 相关研宄在医学、军事和工业等诸多领域有着广阔的应用前景。作为语音识别的前端处理, 语音端点检测的目标是为了区分语音信号的有声段和无声段。高效准确的端点检测能够大 幅减轻语音信号识别系统的负荷,降低系统响应时间,增强系统鲁棒性。四阶累积量即峭度 常被用来度量信号的非高斯性。在语音信号处理中,通常假设噪声近似满足高斯分布,其高 阶累积量相对较小(理想高斯分布的高阶累积量为零)。因此,基于高阶累积量的语音信号 处理方法往往具有更好的抗干扰性能。但是由于峭度等高阶累积量的计算量较大,且数值 计算的稳定性也较差,因此在实际应用中受到了一定的限制。
[0003] 经典累积量估计算法是批处理算法,运算量和数据存储量都很大,不适合动态数 据的在线处理,并且算法对观察数据中的"野值(outlier)"也比较敏感。为了解决上述问 题,累积量的在线估计算法被提出,有效改善了其动态估计性能。不过现有的在线算法是基 于全部历史数据而建立的,而在实际应用中,近期数据段数据的统计特性往往更具参考价 值。并且由于数据的非平稳性存在,早期的历史数据与近期的数据之间一般不存在大的相 关性。因此采用全部历史数据进行统计分析不仅不能提高估计精度,相反可能还会掩盖真 实的数据统计特性。另外,在真实环境下的数据采集过程中,随机出现的大幅度野值干扰会 给统计分析结果造成很大误差。由于传统的在线算法依赖全部信号数据,因此野值引起的 误差具有很强的传递性。

【发明内容】

[0004] 本发明的目的在于克服现有技术的不足,提供了一种基于动态累积量估计的语音 信号端点检测方法。
[0005] 本发明是通过以下技术方案实现的:一种基于动态累积量估计的语音信号端点检 测方法,包括如下步骤:
[0006] (1)、基于滑动窗的高阶累积量递推估算:对原始样本数据进行加窗操作,对窗内 数据进行累积量的估计,并且每次滑动一个样本点对窗内数据进行更新,实现累积量的动 态估计;
[0007] (2)、基于滑动窗峭度的端点检测:结合步骤(1)的基于滑动窗的高阶累积量递推 估算,估算出滑动窗峭度和能量特征,基于滑动窗峭度和能量特征进行语音信号的端点检 测。
[0008] 作为上述方案的进一步优化,所述步骤(1)的基于滑动窗的高阶累积量递推估算 包括如下步骤:
[0009] (11)、滑动窗化:对原始样本数据进行加窗,实现对窗内所有样本点的高阶累积量 递推估计;
[0010] (12)、递推估计:在滑动窗内通过对步骤(11)推导出的高阶累积量递推计算公 式,实现对滑动窗内所有样本点数据高阶累积量的递推估计。
[0011] 作为上述方案的进一步优化,步骤(11)滑动窗化是通过矩形窗对原始样本数据 进行截取,每滑动一个样本点对矩形窗内数据进行更新,实现对窗内所有样本点的高阶累 积量递推估计。
[0012] 作为上述方案的进一步优化,步骤(12)的高阶累积量递推计算公式为如下:
[0013] 数据集X,xb,对应样本数分别为na,nb;结合数据集x,xb的新数据集x= {xa,xb},对应样本长度为n=na+nb,的均值为y,kth平方和为Sk;
[0014] 数据集x= {xa,xb}基于滑动窗的2-4阶累积量递推计算公式
【主权项】
1. 一种基于动态累积量估计的语音信号端点检测方法,其特征在于,包括如下步骤: (1) 、基于滑动窗的高阶累积量递推估算:对原始样本数据进行加窗操作,对窗内数据 进行累积量的估计,并且每次滑动一个样本点对窗内数据进行更新,实现累积量的动态估 计; (2) 、基于滑动窗峭度的端点检测:结合步骤(1)的基于滑动窗的高阶累积量递推估 算,估算出滑动窗峭度和能量特征,基于滑动窗峭度和能量特征进行语音信号的端点检测。
2. 根据权利要求1所述的基于动态累积量估计的语音信号端点检测方法,其特征在 于,所述步骤(1)的基于滑动窗的高阶累积量递推估算包括如下步骤: (11) 、滑动窗化:对原始样本数据进行加窗,实现对窗内所有样本点的高阶累积量递推 估计; (12) 、递推估计:在滑动窗内通过对步骤(11)推导出的高阶累积量递推计算公式,实 现对滑动窗内所有样本点数据高阶累积量的递推估计。
3. 根据权利要求2所述的基于动态累积量估计的语音信号端点检测方法,其特征在 于,步骤(11)滑动窗化是通过矩形窗对原始样本数据进行截取,每滑动一个样本点对矩形 窗内数据进行更新,实现对窗内所有样本点的高阶累积量递推估计。
4. 根据权利要求2所述的基于动态累积量估计的语音信号端点检测方法,其特征在 于:步骤(12)的高阶累积量递推计算公式为如下: 数据集xjPxb,对应样本数分别为na,nb;结合数据集x3和xb的新数据集x= {xa,xb}, 对应样本长度为n=na+nb,的均值为y,kth平方和为Sk; 数据集x= {xa,xb}基于滑动窗的2-4阶累积量递推计算公式 Cf>⑷、〇)、Cf>⑷表示如下:
其中,取滑动窗的窗长为L,n时刻滑动窗内L个数据的均值为yw(n),kth平方和为
其中,y(n)和Sk(n)分别为n时刻前所有历史数据的方差和kth平方和,y(ru)和Sk(r〇分别为%时刻前所有历史数据的方差和kth平方和。
5.根据权利要求4所述的基于动态累积量估计的语音信号端点检测方法,其特征在 于:高阶累积量递推计算公式的递推估计方法如下: (51) 开辟动态存储单元 对数据集X = {xa, xb}的均值为y,kth平方和为Sk,计算样本点X(1)~X(L)所对应 的均值y,kth平方和Sk,开辟4L大小的存储单元存放该组
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1