音频信号的频谱的频谱系数的编码的制作方法_5

文档序号：9932714阅读：来源：国知局

] 因此，上述实施例尤其掲示了例如用于音调信号的赌(例如，算数)编码的基于音高的上下文映射。
[01%] 虽然已经在装置的上下文中描述了一些方面，但是应当清楚的是，运些方面也表示对相应方法的描述，其中，框或设备对应于方法步骤或方法步骤的特征。类似地，在方法步骤的上下文中所述的方面也表示对相应框或项目或者相应装置的特征的描述。方法步骤中的一些或全部可W由（或使用)硬件装置来执行，例如，微处理器、可编程计算机或电子电路。在一些实施例中，最重要的方法步骤中的某一个或多个可W由运种装置来执行。
[0127] 创造性的编码音频信号可W存储在数字存储介质上，或者可W在诸如无线传输介质或有线传输介质(例如，互联网）等的传输介质上传输。
[0128] 根据特定实现需要，可W在硬件中或在软件中实现本发明的实施例。可W使用其上存储有电子可读控制信号的数字存储介质（例如，软盘、DVD、蓝光、CD、R0M、PR0M、EPR0M、邸PROM或闪存)来执行实现，该电子可读控制信号与可编程计算机系统协作(或者能够与之协作)从而执行相应方法。因此，数字存储介质可W是计算机可读的。
[0129] 根据本发明的一些实施例包括具有电子可读控制信号的数据载体，该电子可读控制信号能够与可编程计算机系统协作从而执行本文所述的方法之一。
[0130] 通常，本发明的实施例可W实现为具有程序代码的计算机程序产品，程序代码可操作W在计算机程序产品在计算机上运行时执行方法之一。程序代码可W例如存储在机器可读载体上。
[0131] 其他实施例包括存储在机器可读载体上的计算机程序，该计算机程序用于执行本文所述的方法之一。
[0132] 换言之，本发明方法的实施例因此是具有程序代码的计算机程序，程序代码用于在计算机程序在计算机上运行时执行本文所述的方法之一。
[0133] 本发明方法的另一实施例因此是其上记录有计算机程序的数据载体(或者数字存储介质或计算机可读介质），计算机程序用于执行本文所述的方法之一。数据载体、数字存储介质或记录介质通常是有形的和/或非瞬时性的。
[0134] 因此，本发明方法的另一实施例是表示计算机程序的数据流或信号序列，所述计算机程序用于执行本文所述的方法之一。数据流或信号序列可W例如被配置为经由数据通信连接(例如，经由互联网）传递。
[0135] 另一实施例包括处理装置，例如，计算机或可编程逻辑器件，所述处理装置被配置为或适于执行本文所述的方法之一。
[0136] 另一实施例包括其上安装有计算机程序的计算机，所述计算机程序用于执行本文所述的方法之一。
[0137] 根据本发明的另一实施例包括被配置为向接收机传递(例如，电子地或光学地)计算机程序的装置或系统，所述计算机程序用于执行本文所述的方法之一。接收机可W是例如计算机、移动设备、存储设备等。装置或系统可W例如包括用于向接收机传递计算机程序的文件服务器。
[0138] 在一些实施例中，可编程逻辑器件(例如，现场可编程口阵列）可W用于执行本文所述的方法的功能中的一些或全部。在一些实施例中，现场可编程口阵列可W与微处理器协作W执行本文所述的方法之一。通常，方法优选地由任意硬件装置来执行。
[0139] 上述实施例仅说明本发明的原理。应当理解的是，本文所述的布置和细节的修改和变形对于本领域其他技术人员将是显而易见的。因此，旨在仅由所附专利权利要求的范围而不由通过描述和解释本文的实施例的方式给出的具体细节来限制本发明。
[0140] 参考文献
[0141] [l]Fuchs，G.;Subbaraman，V.;Multrus，M./'Efficient context adaptive entropy coding for real-time applications /^Acoustics, Speech and Signal Processing(ICASSP),2011IEEE InternationalConferenee on，vol.，no.，pp.493,496， 22-27M ay 2011
[0142] [2]IS0/IEC 13818,Part 7,MPEG-2AAC
[0143] [3]Juin-Hwey Chen;Don邑mei Wan邑，"Transform predictive codin邑 of wideband speech signals/^Acoustics,Speech,and S ignal Processing,1996.ICASSP-96)Conference Proceedings .，1996IEEE Internstionsl Conference on，vol. I，no.， pp.275,278vol.I,7-lOMay 1996
【主权项】
1. 一种解码器(40)，被配置为对音频信号（18)的频谱（12)的频谱系数（14)进行解码，所述解码器被配置为通过以上下文自适应的方式根据先前解码的频谱系数(〇)进行熵解码、并且根据关于所述频谱的形状的信息对所述先前解码的频谱系数(〇)与当前要解码的频谱系数(X)之间的相对频谱距离(28)进行调整，来对所述当前要解码的频谱系数(X)进行解码。2. 根据权利要求1所述的解码器，其中，关于所述频谱的形状的信息包括以下至少一项：所述音频信号（18)的音高或周期的度量(60); 所述音频信号的频谱（12)的谐波间距离的度量；所述频谱的频谱包络的共振峰(70)和/或谷(72)的相对位置。3. 根据权利要求1或2所述的解码器，其中，所述解码器(40)被配置为通过显式信号作用来导出关于所述频谱的形状的信息。4. 根据权利要求1或2所述的解码器，其中，所述解码器(40)被配置为根据所述频谱的先前解码的频谱系数(〇)或先前解码的基于LPC的频谱包络来导出关于所述频谱的形状的信息。5. 根据前述权利要求中任一项所述的解码器，其中，所述解码器(40)被配置为使得对所述熵解码的依赖性涉及多个先前解码的频谱系数(〇)，所述多个先前解码的频谱系数(〇) 的频谱位置的频谱扩展是根据关于所述频谱的形状的信息来调整的。6. 根据前述权利要求中任一项所述的解码器，其中，所述解码器(40)被配置为使得关于所述频谱的形状的信息是所述音频信号的音高的度量(60)，并且所述解码器被配置为根据所述音高的度量来调整所述先前解码的频谱系数(〇)与所述当前要解码的频谱系数(X)之间的相对频谱距离(28)，使得所述相对频谱距离随着音高的增加而增加，或者关于所述频谱的形状的信息是所述音频信号的周期的度量(60)，并且所述解码器被配置为根据所述周期的度量来调整所述先前解码的频谱系数(〇)与所述当前要解码的频谱系数(X)之间的相对频谱距离(28)，使得所述相对频谱距离随着周期的增加而减小，或者关于所述频谱的形状的信息是所述音频信号的频谱（12)的谐波间距离的度量，并且所述解码器(40)被配置为根据所述谐波间距离的度量来调整所述先前解码的频谱系数(〇)与所述当前要解码的频谱系数(X)之间的相对频谱距离，使得所述相对频谱距离随着谐波间距离的增加而增加，或者关于所述频谱的形状的信息包括所述频谱的频谱包络的共振峰(70)和/或谷(72)的相对位置，并且所述解码器被配置为根据所述位置来调整所述先前解码的频谱系数与所述当前要解码的频谱系数之间的相对频谱距离，使得所述相对频谱距离随着所述频谱包络中的谷之间和/或所述频谱包括中的共振峰之间的频谱距离(74)的增加而增加。7. 根据前述权利要求中任一项所述的解码器，其中，所述解码器被配置为:在通过熵解码对所述当前要解码的频谱系数进行解码时，通过使所述先前解码的频谱系数经历标量函数(82)来导出针对所述当前要解码的频谱系数的概率分布估计(56)并且使用所述概率分布估计来进行所述熵解码。8. 根据前述权利要求中任一项所述的解码器，其中，所述解码器被配置为使用算数解码作为熵解码。9. 根据前述权利要求中任一项所述的解码器，其中，所述解码器被配置为通过对所述当前要解码的频谱系数进行频谱和/或时间预测并且通过经由所述熵解码获得的预测残差对所述频谱和/或时间预测进行校正来对所述当前要解码的频谱系数进行解码。10. -种基于变换的音频解码器，包括根据前述权利要求中任一项所述的、被配置为对音频信号的频谱的频谱系数进行解码的解码器。11. 根据权利要求10所述的基于变换的音频解码器，其中，所述解码器被配置为通过使用比例因子(114)对所述频谱进行缩放来对所述频谱进行频谱成形。12. 根据权利要求11所述的基于变换的音频解码器，被配置为基于线性预测系数信息来确定所述比例因子（114)，使得所述比例因子表示取决于由所述线性预测系数信息定义的线性预测合成滤波器的传递函数。13. 根据权利要求12所述的基于变换的音频解码器，其中，所述传递函数对由所述线性预测系数信息定义的所述线性预测合成滤波器的依赖性使得对所述传递函数进行感知加权。14. 根据权利要求13所述的基于变换的音频解码器，其中，所述传递函数对由所述线性预测信息定义的所述线性预测合成滤波器1/A(z)的依赖性使得所述传递函数是传递函数 1/A(k · z)，其中k是常数。15. 根据权利要求10至14中任一项所述的基于变换的音频解码器，其中，所述基于变换的音频解码器支持经由显式发信号通知的长期预测参数控制的长期预测谐波或后置滤波，其中所述基于变换的音频解码器被配置为根据所述显式发信号通知的长期预测参数来导出关于所述频谱的形状的信息。16. -种编码器(10)，被配置为对音频信号（18)的频谱（12)的频谱系数（14)进行编码，所述编码器被配置为通过以上下文自适应的方式根据先前编码的频谱系数(〇)进行熵编码、并且根据关于所述频谱的形状的信息对所述先前编码的频谱系数与当前编码的频谱系数之间的相对频谱距离(28)进行调整，来对所述当前要编码的频谱系数(X)进行编码。17. -种用于对音频信号（18)的频谱（12)的频谱系数（14)进行解码的方法，所述方法包括:通过以上下文自适应的方式根据先前解码的频谱系数(〇)进行熵解码、并且根据关于所述频谱的形状的信息对所述先前解码的频谱系数(〇)与当前要解码的频谱系数(X)之间的相对频谱距离(28)进行调整，来对所述当前要解码的频谱系数(X)进行解码。18. -种用于对音频信号（18)的频谱（12)的频谱系数（14)进行编码的方法，所述方法包括:通过以上下文自适应的方式根据先前编码的频谱系数(〇)进行熵编码、并且根据关于所述频谱的形状的信息对所述先前编码的频谱系数与当前编码的频谱系数之间的相对频谱距离(28)进行调整，来对所述当前要编码的频谱系数(X)进行编码。19. 一种具有程序代码的计算机程序，所述程序代码用于当在计算机上运行时执行根据权利要求16或17所述的方法。
【专利摘要】通过以熵编/解码同时根据关于频谱的形状的信息对先前编/解码的频谱系数与当前编/解码的频谱系数之间的相对频谱距离进行调整的方式对当前要编/解码的频谱系数进行编/解码来提高对音频信号的频谱的频谱系数进行编码的编码效率，其中，在进行熵编/解码时，以上下文自适应方式根据先前编/解码的频谱系数执行熵编/解码。关于频谱的形状的信息可以包括：音频信号的音高或周期的度量、音频信号的频谱的谐波间距离的度量和/或频谱的频谱包络的共振峰和/或谷的相对位置，并且基于该知识，为了形成当前要编/解码的频谱系数的上下文所采用的频谱邻居可以被调整为由此确定的频谱的形状，从而增强熵编码效率。
【IPC分类】G10L19/032, G10L19/00
【公开号】CN105723452
【申请号】CN201480056910
【发明人】纪尧姆·福克斯, 马蒂亚斯·诺伊辛格, 马库斯·马特拉斯, 史蒂芬·道尔拉
【申请人】弗劳恩霍夫应用研究促进协会
【公开日】2016年6月29日
【申请日】2014年10月17日
【公告号】CA2925734A1, WO2015055800A1

完整全部详细技术资料下载

当前第5页1 2 3 4 5