低复杂度音调自适应音频信号量化的制作方法_4

文档序号:9383156阅读:来源:国知局
n Proc. DAFXj 2002.
[0138] [3]R. J. McAulay and T. F. Quatieri,"Speech Analysis/Synthesis Based on a Sinusoidal Representation," IEEE Trans. Acoustics,Speech,and Sig. Processing,Vol .34, No. 4, Aug. 1986.
[0139] [4]M. Neuendorf et al.,"MPEG Unified Speech and Audio Coding - The IS0/MPEG Standard for High-Efficiency Audio Coding of All Content Types," in Proc. 132nd Convention of the AESj Budapest, Hungary, Apr. 2012. Also to appear in the Journal of the AESj 2013.
[0140] [5]M. Oger et al.,"Model-Based Deadzone Optimization for Stack-Run Audio Coding with Uniform Scalar Quantization," in Proc. ICASSP 2008,Las Vegas, USA, Apr. 2008.
[0141] [6]M. Schug,EP2122615,"Apparatus and method for encoding an information signal",2007.
【主权项】
1. 一种音频编码器,用于对音频信号(AS)进行编码,以便从中产生编码信号(ES),所 述音频编码器(1)包括: 帧装置(2),其被配置成从所述音频信号(AS)提取帧(F); 量化器(3),其被配置成将从所述音频信号(AS)的帧(F)得到的频谱信号(SPS)的频 谱线(SL132)映射至量化索引(I。,L),其中,所述量化器(3)具有死区(DZ),在所述死区 (DZ)中所述频谱线(SL132)被映射至量化索引零(I。);以及 控制装置(4),其被配置成修改所述死区(DZ); 其中,所述控制装置(4)包括音调计算装置(5),其被配置成计算用于至少一个频谱线 (SL132)或者用于至少一组频谱线(SL132)的至少一个音调指示值(TI5 32), 其中,所述控制装置(4)被配置成取决于各个音调指示值(TI5 32)来修改用于所述至少 一个频谱线(SQ32)或者所述至少一组频谱线(SQ32)的死区(DZ)。2. 根据在先权利要求所述的音频编码器,其中,所述控制装置(4)被配置成用以下方 式来修改所述死区(DZ):在所述频谱线(SL132)中的一个处的死区(DZ)大于在具有较大音 调的所述频谱线(SL132)中的一个处的死区(DZ),或者在多组频谱线(SL132)中的一组处的 死区(DZ)大于在具有较大音调的多组频谱线(SL132)中的一组处的死区(DZ)。3. 根据在先权利要求中的一项所述的音频编码器,其中,所述控制装置(4)包括功率 频谱计算装置(6),其被配置成计算所述音频信号(AS)的帧(F)的功率频谱(PS),其中,所 述功率频谱(PS)包括频谱线(SL132)或者多组频谱线(SL132)的功率值(PS5 32),其中,所 述音调计算装置(4)被配置成取决于所述功率频谱(PS)来计算所述至少一个音调指示值 (丁5 32)。4. 根据在先权利要求所述的音频编码器,其中,用于所述频谱线(SL132)中的一个的所 述音调指示值(TI5 32)基于用于各个频谱线(SQ32)的功率值(PS5 32)与所述功率频谱(PS) 的各个频谱线(SL132)周围的预定数目的功率值(P5 32)之和的比较,或者其中,用于多组频 谱线(SL132)中的一组的音调指示值(TI5 32)基于用于各个组的频谱线(SL132)的功率值 (PS5 32)与所述功率频谱(PS)的各个组的频谱线(SL132)周围的预定数目的功率值(PS5 32) 之和的比较。5. 根据在先权利要求中的一项所述的音频编码器,其中,用于所述频谱线(SL132)中的 一个的所述音调指示值(TI5 32)基于所述音频信号(AS)的在先帧(F)的频谱线的音调指示 值(TI5 32),或者其中,用于多组频谱线(SL132)中的一组的音调指示值(TI5 32)基于用于所 述音频信号(AS)的在先帧(F)的所述组的频谱线(SQ32)的音调指示值(TI5 32)。6. 根据权利要求3至5中的一项所述的音频编码器,其中,通过以下公式来计算所述音 调指示值(TI5 32):其中,i为指示所述音频信号(AS)的特定帧(F)的索引,k为指示特定频谱线的索引,Tkil为第i帧(F)的第k频谱线的音调指示值(TI5 32),Pkil为第i帧(F)的第k频谱线的 功率值(PS5 32),或者其中,通过以下公式来计算所述音调指示值(TI5 32):其中,i为指示所述音频信号(AS)的特定帧(F)的索引,m为指示特定组频谱线(SQ32) 的索引,为第i帧的第m组频谱线(SLi32)的功率值。7. 根据在先权利要求中的一项所述的音频编码器,其中,所述音频编码器(1)包括起 始频率计算装置(7),其被配置成计算用于修改所述死区(DZ)的起始频率(SF),其中,仅针 对表示高于或等于所述起始频率(SF)的频率的频谱线(SL)来修改所述死区(DZ)。8. 根据在先权利要求所述的音频编码器,其中,起始频率计算装置(7)被配置成基于 所述音频信号(AS)的样本率和/或基于针对从所述编码信号(ES)产生的比特流预见的最 大比特率来计算所述起始频率(SF)。9. 根据权利要求3至8中的一项所述的音频编码器,其中,所述音频编码器(1)包括: 修改离散余弦变换计算装置(8),其被配置成根据所述音频信号(AS)的帧(F)来计算修改 的离散余弦变换(CT);以及修改离散正弦变换计算装置(9),其被配置成根据所述音频信 号(AS)的帧(F)来计算修改的离散正弦变换(ST),其中,所述功率频谱计算装置(6)被配 置成基于所述修改的离散余弦变换(CT)以及基于所述修改的离散正弦(ST)变换来计算所 述功率频谱(PS)。10. 根据权利要求3至9中的一项所述的音频编码器,其中,功率频谱计算装置(6)被 配置成根据公式Pk,, =(MDCTk,J2+(MDSTk,J2来计算所述功率值(PS5 32),其中,i为指示所 述音频信号的特定帧的索引,k为指示特定频谱线的索引,MDCTkil为在第i帧的第k频谱线 处的修改的离散余弦变换(CT)的值,MDSTkil为在第i帧的第k频谱线处的修改的离散正弦 变换(ST)的值,以及Pkil为第i帧的第k频谱线的功率值(PS5 32)。11. 根据在先权利要求中的一项所述的音频编码器,其中,所述音频编码器(1)包括频 谱信号计算装置(10),其被配置成产生所述频谱信号(SPS),其中,所述频谱信号计算装置 (10)包括振幅设定装置(11),其被配置成以补偿由于对所述死区(DZ)的修改造成的能量 损失的方式来设置所述频谱信号(SPS)的频谱线(SQ32)的振幅。12. 根据在先权利要求所述的音频编码器,其中,所述振幅设定装置(11)被配置成取 决于在各个频谱线处的死区(DZ)的修改来设置所述频谱信号(SPS)的振幅。13. 根据权利要求11或12中所述的音频编码器,其中,所述频谱信号计算装置(10)包 括标准化装置(12)。14. 根据权利要求11至13中的一项所述的音频编码器,其中,所述修改离散余弦变换 计算装置(8)计算的根据所述音频信号(AS)的帧(F)的修改的离散余弦变换(CT)被馈送 至所述频谱信号计算装置(10)。15. -种系统,包括编码器(1)和解码器,其中,根据权利要求1至14中的一项来设计 所述编码器(1)。16. -种用于对音频信号(AS)进行编码以便从中产生编码信号(ES)的方法,所述方法 包括以下步骤: 从所述音频信号(AS)提取帧(F); 将从所述音频信号(AS)的帧(F)得到的频谱信号(SPS)的频谱线(SQ32)映射至量化 索引(Ic,Ii),其中,使用死区(DZ),在所述死区(DZ)中将输入的频谱线(SL132)映射至量 化索引零(I。);以及 修改所述死区(DZ); 其中,计算用于至少一个频谱线或者用于至少一组频谱线(SL132)的至少一个音调指 示值(TI5 32), 其中,取决于各个音调指示值(TI5 32)来修改用于所述至少一个频谱线或者所述至少 一组频谱线(SQ32)的所述死区(DZ)。17. -种计算机程序,用于当在计算机或者处理器上运行时执行根据权利要求16所述 的方法。
【专利摘要】本发明提供一种音频编码器,其用于对音频信号(AS)进行编码,以便从中产生编码信号(ES),该音频编码器(1)包括:帧装置(2),其被配置成从该音频信号(AS)提取帧(F);量化器(3),其被配置成将从该音频信号(AS)的帧(F)得到的频谱信号(SPS)的频谱线(SL1-32)映射至量化索引(I0,I1),其中,该量化器(3)具有死区(DZ),在该死区(DZ)中将该输入频谱线(SL)映射至量化索引零(I0);以及控制装置(4),其被配置成修改死区(DZ);其中,控制装置(4)包括音调计算装置(5),其被配置成计算用于至少一个频谱线(SL1-32)或用于至少一组频谱线(SL1-32)的至少一个音调指示值(TI5-32),其中,控制装置(4)被配置成取决于各个音调指示值(TI5-32)来修改用于至少一个频谱线(SL1-32)或至少一组频谱线(SL1-32)的死区(DZ)。
【IPC分类】G10L19/02, G10L19/035, G10L25/03
【公开号】CN105103226
【申请号】CN201480006396
【发明人】马丁·迪策尔, 纪尧姆·富克斯, 克里斯蒂安·黑尔姆里希, 戈兰·马尔科维奇
【申请人】弗劳恩霍夫应用研究促进协会
【公开日】2015年11月25日
【申请日】2014年1月28日
【公告号】CA2898789A1, EP2939235A1, WO2014118171A1
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1