基于多分辨率KL散度和投票机制的带噪语音端点检测方法与流程

文档序号:31168431发布日期:2022-08-17 09:03阅读:149来源:国知局
技术特征:
1.基于多分辨率kl散度和投票机制的带噪语音端点检测方法,其特征在于,包括:对采样的语音信号样点按时间顺序进行分帧;对当前帧按不同颗粒度进行频带划分,在每种颗粒度下得到多个子带;分别计算不同颗粒度下子带能量分布的kl散度,将每种颗粒度的kl散度与第一阈值比较后,得到每种颗粒度的判别值;根据不同颗粒度的判决值采用投票机制得到综合值,根据综合值与第二阈值的比较,得到语音和噪声的判别结果。2.如权利要求1所述的基于多分辨率kl散度和投票机制的带噪语音端点检测方法,其特征在于,设定前n帧语音信号样点为噪声段,若当前帧号小于n,则根据当前帧的频谱更新噪声段的频谱,具体为:其中,为待估计噪声第k种颗粒度下第j个子带的能量;为当前帧i第k种颗粒度下第j个子带的能量。3.如权利要求1所述的基于多分辨率kl散度和投票机制的带噪语音端点检测方法,其特征在于,kl散度为:其中,kl
k
为第k种颗粒度下子带能量分布的kl散度,l为第k种颗粒度下的子带数量;为待估计噪声第k种颗粒度下第m个子带的能量;为待估计噪声第k种颗粒度下第j个子带的能量;为当前帧号i第k种颗粒度下第m个子带的能量;为当前帧号i第k种颗粒度下第j个子带的能量。4.如权利要求1所述的基于多分辨率kl散度和投票机制的带噪语音端点检测方法,其特征在于,将每种颗粒度的kl散度与第一阈值进行比较,若kl散度大于第一阈值,则当前帧为语音帧,判别值为1;否则,当前帧为噪声,判别值为零。5.如权利要求1所述的基于多分辨率kl散度和投票机制的带噪语音端点检测方法,其特征在于,根据不同颗粒度的判决值采用投票机制得到综合值,具体为:其中,sn
total
为综合值,w
k
为k种颗粒度下的子带数量,sn
k
(i)为判别值,kn为颗粒度类别总数量。
6.如权利要求1所述的基于多分辨率kl散度和投票机制的带噪语音端点检测方法,其特征在于,根据综合值与第二阈值的比较,若综合值大于第二阈值,则当前帧为语音帧,否则为噪声帧。7.如权利要求1所述的基于多分辨率kl散度和投票机制的带噪语音端点检测方法,其特征在于,对当前帧进行快速傅里叶变换后,按照不同颗粒度进行频带划分。8.基于多分辨率kl散度和投票机制的带噪语音端点检测系统,其特征在于,包括:分帧模块,被配置为对采样的语音信号样点按时间顺序进行分帧;子带划分模块,被配置为对当前帧按不同颗粒度进行频带划分,在每种颗粒度下得到多个子带;第一判别模块,被配置为分别计算不同颗粒度下子带能量分布的kl散度,将每种颗粒度的kl散度与第一阈值比较后,得到每种颗粒度的判别值;第二判别模块,被配置为根据不同颗粒度的判决值采用投票机制得到综合值,根据综合值与第二阈值的比较,得到语音和噪声的判别结果。9.一种电子设备,其特征在于,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7任一项所述的方法。10.一种计算机可读存储介质,其特征在于,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项所述的方法。

技术总结
本发明公开一种基于多分辨率KL散度和投票机制的带噪语音端点检测方法,包括:对采样的语音信号样点按时间顺序进行分帧;对当前帧按不同颗粒度进行频带划分,在每种颗粒度下得到多个子带;分别计算不同颗粒度下子带能量分布的KL散度,将每种颗粒度的KL散度与第一阈值比较后,得到每种颗粒度的判别值;根据不同颗粒度的判决值得到综合值,根据综合值与第二阈值的比较,得到语音和噪声的判别结果。有效解决噪声频谱在临近子带起伏而导致的噪声被误判为语音的问题,从而有效提高语音端点检测的准确率。准确率。准确率。


技术研发人员:李晔 沈自强 白全民 张存阳 王金颖
受保护的技术使用者:山东省科技发展战略研究所
技术研发日:2022.05.11
技术公布日:2022/8/16
当前第2页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!