用于语音活动性检测的方法和设备的制造方法_4

文档序号:8287966阅读:来源:国知局
br>[0068] 附加 VAD(VAD 2)还基于W02009/000073 A1,但是通过使用针对背景噪声估计和 基于SNR的SAD的修改来实现。图7示出了针对第二VAD的框图。框图示出了:预处理器 701、谱分析器702、"基于SNR的SAD"模块703、噪声估计器704、可选噪声消减器705、LP 分析器和音高跟踪器706、噪声能量估计更新模块707、信号分类器708和声音编码器709。
[0069] 框图还示出了针对VAD 2的初级VAD判决和最终VAD判决(分别是IocalVADJie 710和vad_flag_he 711)。在VAD 1的初级语音检测器中使用IocalVADJie 710和vad_ flag_he 711 以产生 localVAD。
[0070] 对于本实施例,将以下变量添加到编码器状态(Encoder_State):
【主权项】
1. 一种用于语音活动性检测VAD的方法,所述方法包括: -创建(310)指示初级VAD判决的信号; -确定(320)是否要执行所述初级VAD判决的尾响添加; -至少部分根据尾响添加确定,创建(330)指示最终VAD判决的信号; 其中确定尾响添加基于以下至少一项:短期活动性测量和长期活动性测量。
2. 根据权利要求1所述的方法,其中,所述短期活动性测量是根据N_st个最新的初级 VAD判决来推导的。
3. 根据权利要求1或2所述的方法,其中,所述长期活动性测量是根据N_lt个最新的 初级VAD判决或根据N_lt个最新的最终VAD判决来推导的。
4. 根据权利要求2和3所述的方法,其中,N_lt大于N_st。
5. 根据前述权利要求中任一项所述的方法,其中,创建所述指示所述最终VAD判决的 信号包括创建以下两个版本的最终判决:第一最终VAD判决和第二最终VAD判决。
6. 根据权利要求5所述的方法,其中,所述第二最终VAD判决是不使用所述短期活动性 测量或所述长期活动性测量而作出的。
7. 根据权利要求5或6所述的方法,其中,所述长期活动性测量是根据N_lt个最新的 第二最终VAD判决来推导的。
8. 根据权利要求5至7中任一项所述的方法,其中,所述第一最终VAD判决对应于vad_ flag_dtx,并且所述第二最终VAD判决对应于vad_flag。
9. 根据权利要求2所述的方法,其中,所述短期活动性测量基于最新的初级VAD判决的 存储器中活动帧的数量。
10. 根据权利要求3所述的方法,其中,所述长期活动性测量基于最新的最终VAD判决 的存储器中或最新的初级VAD判决的存储器中活动帧的数量。
11. 根据权利要求9或10所述的方法,其中,根据最新的VAD判决的存储器中所述活动 帧的生存期,对所述活动帧进行加权。
12. 根据前述权利要求中任一项所述的方法,包括:如果所述短期活动性测量达到第 一预定阈值并且所述长期活动性测量达到第二预定阈值,则添加预定数量的尾响帧。
13. 根据前述权利要求中任一项所述的方法,其中,如果确定要执行所述尾响添加,则 所述最终VAD判决等于语音活动性判决。
14. 根据前述权利要求中任一项所述的方法,其中,如果确定不要执行所述尾响添加, 则所述最终VAD判决等于所述初级VAD判决。
15. -种用于语音活动性检测VAD的设备,所述设备包括: -输入部(412),用于接收输入信号; -初级语音检测器装置(401),连接到所述输入部(412),所述初级语音检测器装置 (401) 被配置为:检测所接收的输入信号中的语音活动性,并创建指示与所接收的输入信 号相关联的初级VAD判决的信号; -尾响添加单元(402),连接到所述初级语音检测器装置(401),所述尾响添加单元 (402) 被配置为:确定是否要执行所述初级VAD判决的尾响添加,并且至少部分根据尾响添 加确定,创建指示最终VAD判决的信号;以及 -以下至少一项: 短期活动性估计器(403),连接到所述尾响添加单元(402)的输入,以及 长期活动性估计器(404),连接到所述尾响添加单元(402)的输出; 其中,所述尾响添加单元(402)还连接到所述短期活动性估计器(403)和所述长期活 动性估计器(404)中的至少一个的输出,并且所述尾响添加单元(402)还被配置为:根据短 期活动性测量和长期活动性测量中的至少一个,执行所述尾响确定。
16. 根据权利要求15所述的设备,其中,所述短期活动性估计器(403)被配置为:根据 N_st个最新的初级VAD判决,推导短期活动性测量。
17. 根据权利要求15或16所述的设备,其中,所述长期活动性估计器(404)被配置为: 根据N_lt个最新的初级VAD判决或根据N_lt个最新的最终VAD判决,推导长期活动性测 量。
18. 根据权利要求15至17中任一项所述的设备,其中,所述尾响添加单元(402)被配 置为创建以下两个版本的最终判决:第一最终VAD判决和第二最终VAD判决。
19. 根据权利要求18所述的设备,其中,所述第二最终VAD判决是不使用所述短期活动 性测量或所述长期活动性测量而作出的。
20. 根据权利要求18或19所述的设备,其中,所述长期活动性估计器(404)被配置为: 根据N_lt个最新的第二最终VAD判决,推导长期活动性测量。
21. 根据权利要求15至20中任一项所述的设备,包括初级VAD判决和最终VAD判决的 存储器,所述设备还包括:所述初级VAD判决和最终VAD判决的存储器中活动帧的计数器。
22. 根据权利要求21所述的设备,其中,所述短期活动性测量和所述长期活动性测量 中的至少一个基于所述初级VAD判决和最终VAD判决的存储器中活动帧的数量。
23. 根据权利要求15至22中任一项所述的设备,其中,所述尾响添加单元(402)还被 配置为:如果所述短期活动性测量达到第一预定阈值并且所述长期活动性测量达到第二预 定阈值,则添加预定数量的尾响帧。
24. 根据权利要求15至23中任一项所述的设备,其中,如果确定要执行所述尾响添加, 则所述最终VAD判决等于语音活动性判决,并且如果确定不要执行所述尾响添加,则所述 最终VAD判决等于所述初级VAD判决。
25. -种用于对语音或声音进行编码的编解码器,所述编解码器包括根据权利要求15 至24中至少一项所述的设备。
26. -种计算机程序,包括计算机可读代码单元,当所述计算机可读代码单元在设备上 运行时,使所述设备: -创建(310)指示初级VAD判决的信号; -确定(320)是否要执行所述初级VAD判决的尾响添加; -至少部分根据尾响添加确定,创建(330)指示最终VAD判决的信号; 其中确定尾响添加基于以下至少一项:短期活动性测量和长期活动性测量。
27. -种计算机程序产品,包括计算机可读介质和存储在所述计算机可读介质上的根 据权利要求26所述的计算机程序。
28. -种设备(500),包括: 处理器(510);以及 存储器(520),所述存储器(520)存储软件组件(501、502、503、504、505),其中,所述处 理器(510)被配置为执行: -用于创建指示初级VAD判决的信号的软件组件(501); -用于确定是否要执行初级VAD判决的尾响添加的软件组件(502); -用于至少部分根据尾响添加确定来创建指示最终VAD判决的信号的软件组件 (503); -用于根据1^个最新的初级VAD判决来推导短期活动性测量的软件组件(504)和/ 或用于根据N_lt个最新的最终VAD判决来推导长期活动性测量的软件组件(505)。
【专利摘要】根据本发明的示例性实施例,公开了一种用于语音活动性检测(VAD)的方法和设备。VAD包括:创建指示初级VAD判决的信号;以及确定尾响添加。尾响添加的确定是根据短期活动性测量和/或长期活动性测量作出的。然后,创建指示最终VAD判决的信号。
【IPC分类】G10L25-78
【公开号】CN104603874
【申请号】CN201380044957
【发明人】马丁·绍尔斯戴德
【申请人】瑞典爱立信有限公司
【公开日】2015年5月6日
【申请日】2013年8月30日
【公告号】EP2891151A1, US20150243299, WO2014035328A1
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1