基于动态累积量估计的语音信号端点检测方法

文档序号：8488601阅读：314来源：国知局

基于动态累积量估计的语音信号端点检测方法
【技术领域】
[0001] 本发明涉及数据统计分析和信号处理领域，尤其涉及一种基于动态累积量估计的语音信号端点检测方法。
【背景技术】
[0002] 随着人-机交互技术的日益发展，语音识别已经成为当前人工智能与模式识别领域研宄的重点。语音是人类最重要和最方便的信息传递方式，也是实现人_机交互的最直接途径之一。让机器能够准确地识别出语音命令并执行相应的操作，具有重大的实际意义，相关研宄在医学、军事和工业等诸多领域有着广阔的应用前景。作为语音识别的前端处理，语音端点检测的目标是为了区分语音信号的有声段和无声段。高效准确的端点检测能够大幅减轻语音信号识别系统的负荷，降低系统响应时间，增强系统鲁棒性。四阶累积量即峭度常被用来度量信号的非高斯性。在语音信号处理中，通常假设噪声近似满足高斯分布，其高阶累积量相对较小（理想高斯分布的高阶累积量为零）。因此，基于高阶累积量的语音信号处理方法往往具有更好的抗干扰性能。但是由于峭度等高阶累积量的计算量较大，且数值计算的稳定性也较差，因此在实际应用中受到了一定的限制。
[0003] 经典累积量估计算法是批处理算法，运算量和数据存储量都很大，不适合动态数据的在线处理，并且算法对观察数据中的"野值（outlier)"也比较敏感。为了解决上述问题，累积量的在线估计算法被提出，有效改善了其动态估计性能。不过现有的在线算法是基于全部历史数据而建立的，而在实际应用中，近期数据段数据的统计特性往往更具参考价值。并且由于数据的非平稳性存在，早期的历史数据与近期的数据之间一般不存在大的相关性。因此采用全部历史数据进行统计分析不仅不能提高估计精度，相反可能还会掩盖真实的数据统计特性。另外，在真实环境下的数据采集过程中，随机出现的大幅度野值干扰会给统计分析结果造成很大误差。由于传统的在线算法依赖全部信号数据，因此野值引起的误差具有很强的传递性。

【发明内容】

[0004] 本发明的目的在于克服现有技术的不足，提供了一种基于动态累积量估计的语音信号端点检测方法。
[0005] 本发明是通过以下技术方案实现的：一种基于动态累积量估计的语音信号端点检测方法，包括如下步骤：
[0006] (1)、基于滑动窗的高阶累积量递推估算：对原始样本数据进行加窗操作，对窗内数据进行累积量的估计，并且每次滑动一个样本点对窗内数据进行更新，实现累积量的动态估计；
[0007] (2)、基于滑动窗峭度的端点检测：结合步骤（1)的基于滑动窗的高阶累积量递推估算，估算出滑动窗峭度和能量特征，基于滑动窗峭度和能量特征进行语音信号的端点检测。
[0008] 作为上述方案的进一步优化，所述步骤（1)的基于滑动窗的高阶累积量递推估算包括如下步骤：
[0009] (11)、滑动窗化：对原始样本数据进行加窗，实现对窗内所有样本点的高阶累积量递推估计；
[0010] (12)、递推估计：在滑动窗内通过对步骤（11)推导出的高阶累积量递推计算公式，实现对滑动窗内所有样本点数据高阶累积量的递推估计。
[0011] 作为上述方案的进一步优化，步骤（11)滑动窗化是通过矩形窗对原始样本数据进行截取，每滑动一个样本点对矩形窗内数据进行更新，实现对窗内所有样本点的高阶累积量递推估计。
[0012] 作为上述方案的进一步优化，步骤（12)的高阶累积量递推计算公式为如下：
[0013] 数据集X,xb，对应样本数分别为na，nb;结合数据集x,xb的新数据集x= {xa,xb}，对应样本长度为n=na+nb，的均值为y，kth平方和为Sk;
[0014] 数据集x= {xa，xb}基于滑动窗的2-4阶累积量递推计算公式
【主权项】
1. 一种基于动态累积量估计的语音信号端点检测方法，其特征在于，包括如下步骤： (1) 、基于滑动窗的高阶累积量递推估算：对原始样本数据进行加窗操作，对窗内数据进行累积量的估计，并且每次滑动一个样本点对窗内数据进行更新，实现累积量的动态估计； (2) 、基于滑动窗峭度的端点检测：结合步骤（1)的基于滑动窗的高阶累积量递推估算，估算出滑动窗峭度和能量特征，基于滑动窗峭度和能量特征进行语音信号的端点检测。
2. 根据权利要求1所述的基于动态累积量估计的语音信号端点检测方法，其特征在于，所述步骤（1)的基于滑动窗的高阶累积量递推估算包括如下步骤： (11) 、滑动窗化：对原始样本数据进行加窗，实现对窗内所有样本点的高阶累积量递推估计； (12) 、递推估计：在滑动窗内通过对步骤（11)推导出的高阶累积量递推计算公式，实现对滑动窗内所有样本点数据高阶累积量的递推估计。
3. 根据权利要求2所述的基于动态累积量估计的语音信号端点检测方法，其特征在于，步骤（11)滑动窗化是通过矩形窗对原始样本数据进行截取，每滑动一个样本点对矩形窗内数据进行更新，实现对窗内所有样本点的高阶累积量递推估计。
4. 根据权利要求2所述的基于动态累积量估计的语音信号端点检测方法，其特征在于：步骤（12)的高阶累积量递推计算公式为如下：数据集xjPxb，对应样本数分别为na,nb;结合数据集x3和xb的新数据集x= {xa,xb}，对应样本长度为n=na+nb，的均值为y，kth平方和为Sk; 数据集x= {xa，xb}基于滑动窗的2-4阶累积量递推计算公式 Cf>⑷、〇)、Cf>⑷表示如下：
其中，取滑动窗的窗长为L，n时刻滑动窗内L个数据的均值为yw(n)，kth平方和为
其中，y(n)和Sk(n)分别为n时刻前所有历史数据的方差和kth平方和，y(ru)和Sk(r〇分别为％时刻前所有历史数据的方差和kth平方和。
5.根据权利要求4所述的基于动态累积量估计的语音信号端点检测方法，其特征在于：高阶累积量递推计算公式的递推估计方法如下： (51) 开辟动态存储单元对数据集X = {xa, xb}的均值为y，kth平方和为Sk，计算样本点X(1)~X(L)所对应的均值y，kth平方和Sk，开辟4L大小的存储单元存放该组

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴小培;吕钊;罗雅琴;张超;周蚌艳;张磊;郭晓静;高湘萍;
技术所有人：安徽大学;
我是此专利的发明人

上一篇：利用上下文信息调节语音识别的制作方法
上一篇：基于语义分析的口语评测方法和系统的制作方法