用于通过应用分布量化和编码建模累积和表示的音频信号包络编码、处理和解码的装置...的制作方法_6

文档序号：9673127阅读：来源：国知局

迭代通过三次乘法运算和一次除法运算可以计算用于减法/加法运算（在解码器的步骤2b和2c中以及在编码器的步骤4a中）的逐项。
[0397] 回到图1，可选的实施例以不同的方式实现图1的用于解码以获得重建的音频信号包络的装置。在此实施例中，正如之前已解释的，该装置包括：用于依据一个或多个分裂点生成重建的音频信号包络的信号包络重建器110 ;以及用于输出重建的音频信号包络的输出接口 120。
[0398] 此外，信号包络重建器110用于生成重建的音频信号包络，以使得一个或多个分裂点将重建的音频信号包络分成两个或更多个音频信号包络部分，其中预定义的分配规则为两个或更多个信号包络部分中的每个信号包络部分，依据该信号包络部分，定义信号包络部分值。
[0399] 在可选的实施例中，然而，预定义的包络部分值被分配给两个或更多个信号包络部分中的每个。
[0400] 在此实施例中，信号包络重建器110用于生成重建的音频信号包络，以使得对于两个或更多个信号包络部分中的每个信号包络部分，该信号包络部分的信号包络部分值的绝对值大于被分配给该信号包络部分的预定义的包络部分值的绝对值的90%，并使得该信号包络部分的信号包络部分值的绝对值小于被分配给该信号包络部分的预定义的包络部分值的绝对值的110%。这允许与预定义的包络部分值的一定偏差。
[0401] 在特定的实施例中，然而，信号包络重建器110用于生成重建的音频信号包络，以使得两个或更多个信号包络部分中的每个的信号包络部分值等于被分配给该信号包络部分的预定义的包络部分值。
[0402] 例如，可以接收将音频信号包络分成四个音频信号包络部分的三个分裂点。分配规则可以指定，第一信号包络部分的预定义的包络部分值为0. 15,第二信号包络部分的预定义的包络部分值为0. 25,第三信号包络部分的预定义的包络部分值为0. 25,以及第四信号包络部分的预定义的包络部分值为0. 35。
[0403] 当接收到三个分裂点时，信号包络重建器110根据上述构思重建信号包络。
[0404] 在另一实施例中，可以接收将音频信号包络分成两个音频信号包络部分的一个分裂点。分配规则可以指定，第一信号包络部分的预定义的包络部分值为P，第二信号包络部分的预定义的包络部分值为Ι-p。例如，如果P= 〇. 4,则Ι-p= 0. 6。此外，当接收到三个分裂点时，信号包络重建器110根据上述构思重建信号包络。
[0405] 应用预定义的包络部分值的此可选的实施例可以应用上述构思中的每个。
[0406] 在一实施例中，至少两个信号包络部分的预定义的包络部分值彼此不同。
[0407] 在另一实施例中，信号包络部分中的每个的预定义的包络部分值与其他信号包络部分中的每个的预定义的包络部分值不同。
[0408] 虽然已在装置的上下文中描述了一些方面，但显然，这些方面还表示对应的方法的描述，其中块或装置对应于方法步骤或方法步骤的特征。类似地，在方法步骤的上下文中描述的方面还表示对应的块或对应的装置的项目或特征的描述。
[0409] 本发明的分解信号可存储于数字存储介质上，或可在如无线传输介质或有线传输介质（如，因特网）的传输介质上传输。
[0410] 根据某些实施要求，本发明的实施例可以以硬件或软件实施。可使用具有存储于其上的电子可读控制信号的数字存储介质，例如软盘、DVD、CD、ROM、PROM、EPROM、EEPR0M或闪存，执行实施方案，电子可读控制信号与（或能够与）可编程计算机系统协作，从而执行各个方法。
[0411] 根据本发明的一些实施例包括具有电子可读控制信号的非暂时性数据载体，电子可读控制信号能够与可编程计算机系统协作，从而执行本文中描述的方法中的一个。
[0412] 一般地，本发明的实施例可被实施为具有程序代码的计算机程序产品，程序代码可操作用于当计算机程序产品在计算机上执行时执行所述方法中的一个。程序代码可例如存储于机器可读载体上。
[0413] 其他实施例包括存储于机器可读载体上的用于执行本文中描述的方法中的一个的计算机程序。
[0414] 换言之，本发明的方法的实施例因此为具有程序代码的计算机程序，该程序代码用于当计算机程序在计算机上执行时执行本文中描述的方法中的一个。
[0415]本发明的进一步实施例因此为数据载体（或数字存储介质或计算机可读介质），其包括记录于其上的用于执行本文中描述的方法中的一个的计算机程序。
[0416] 本发明的进一步实施例因此为数据流或信号序列，其表示用于执行本文中描述的方法中的一个的计算机程序。数据流或信号序列可例如被配置为通过数据通信连接（例如，通过因特网）进行传送。
[0417] 进一步实施例包括处理装置（例如，计算机或可编程逻辑装置），其被配置为或适于执行本文中描述的方法中的一个。
[0418] 进一步实施例包括一种计算机，其具有安装于其上用于执行本文中描述的方法中的一个的计算机程序。
[0419] 在一些实施例中，可使用可编程逻辑装置（例如，现场可编程门阵列）执行本文中描述的方法的一些或全部功能。在一些实施例中，现场可编程门阵列可与微处理器协作以执行本文中描述的方法中的一个。通常，方法优选地被任何硬件装置执行。
[0420] 上述实施例仅为说明本发明的原理。应理解的是，本文中描述的配置及细节的修改及变化对于本领域的其他技术人员是显而易见的。因此，其仅受到所附的专利权利要求的范围的限制，而不受本文中以实施例的描述及解释的方式而呈现的特定细节的限制。
[0421] 参考文献
[0422] [l]Makhoul，John."Linearprediction:Atutorialreview."IEEE63. 4论文集 (1975):561-580.
[0423] [2]Soong,Frank,和B.Juang."Linespectrumpair(LSP)andspeechdata compression. 〃声学、语音和信号处理，IEEE国际会议，ICASSP' 84. ·卷 9.IEEE, 1984.
[0424] [3]Pan，Davis."AtutorialonMPEG/Audiocompression. "Multimedia,IEEE 2. 2(1995) :60-74.
[0425] [4]M.Neuendorf,P.Gournay,M.Multrus,J.Lecomte,B.Bessette,R.Geiger,S. Bayer,G.Fuchs,J.Hilpert,N.Rettelbach,R.Salami,G.Schuller,R.Lefebvre,B. Grill."Unifiedspeechandaudiocodingschemeforhighqualityatlow bitrates〃·声学、语音和信号处理，2009.ICASSP2009.IEEE国际会议，（pp. 1-4). IEEE. 2009 年 4 月.
[0426] [5]Kuntz,A. ,Disch,S. ,Backstrom,T. , &Robilliard,J.^TheTransient SteeringDecorrelatorToolintheUpcomingMPEGUnifiedSpeechandAudioCoding Standard〃.音频工程学会大会131，2011年10月.
[0427] [6]Herre,Jilrgen,和JamesD.Johnston.''Enhancingtheperformanceof perceptualaudiocodersbyusingtemporalnoiseshaping(TNS) ·' 音步页工程学会大会 101. 1996.
【主权项】
1. 一种用于从一个或多个编码值生成音频信号包络的装置，包括：输入接口（1610)，用于接收所述一个或多个编码值；以及包络生成器（1620)，用于依据所述一个或多个编码值生成所述音频信号包络；其中所述包络生成器（1620)用于依据所述一个或多个编码值生成聚合函数，其中所述聚合函数包括多个聚合点，其中所述聚合点中的每个包括参数值和聚合值，其中所述聚合函数单调递增，并且其中所述一个或多个编码值中的每个指示所述聚合函数的所述聚合点中的一个的所述参数值和所述聚合值中的至少一个，其中所述包络生成器（1620)用于生成所述音频信号包络，以使得所述音频信号包络包括多个包络点，其中所述包络点中的每个包括参数值和包络值，并且其中对于所述聚合函数的所述聚合点中的每个，所述音频信号包络的所述包络点中的一个被分配给所述聚合点，以使得所述包络点的所述参数值等于所述聚合点的所述参数值，并且其中所述包络生成器（1620)用于生成所述音频信号包络，以使得所述音频信号包络的所述包络点中的每个的所述包络值取决于所述聚合函数的至少一个聚合点的所述聚合值。2. 根据权利要求1所述的装置，其中所述包络生成器（1620)用于通过为所述一个或多个编码值中的每个依据所述编码值确定所述聚合点中的一个，以及通过依据所述一个或多个编码值中的每个的所述聚合点应用插值以获得所述聚合函数，以确定所述聚合函数。3. 根据权利要求1或2所述的装置，其中所述包络生成器（1620)用于确定所述聚合函数在所述聚合函数的多个聚合点处的一阶导数。4. 根据前述权利要求中任一项所述的装置，其中所述包络生成器（1620)用于依据所述编码值生成所述聚合函数，以便所述聚合函数具有连续的一阶导数。5. 根据前述权利要求中任一项所述的装置，其中所述包络生成器（1620)用于通过确定第一差值和第二差值的比值以确定所述音频信号包络，所述第一差值为所述聚合函数的所述聚合点中的第一聚合点的第一聚合值（c(k+l))和所述聚合函数的所述聚合点中的第二聚合点的第二聚合值（c(k-l) ;c(k))之间的差值，以及所述第二差值为所述聚合函数的所述聚合点中的所述第一聚合点的第一参数值（f(k+l))和所述聚合函数的所述聚合点中的所述第二聚合点的第二参数值（f(k-l) ;f(k))之间的差值。6. 根据权利要求5所述的装置，其中所述包络生成器（1620)通过应用丨以确定所述音频信号包络；其中tilt (k)指示所述聚合函数在第k个编码值处的导数，其中c (k+Ι)为所述第一聚合值，其中f (k+Ι)为所述第一参数值，其中c (k-Ι)为所述第二聚合值，其中f (k-Ι)为所述第二参数值，其中k为指示所述一个或多个编码值中的一个的索引的整数，其中c (k)为所述第一聚合值，其中c(k+l)-c(k-l)为所述两个聚合值c(k+l)和c(k-l)的所述第一差值，以及其中f(k+l)-f(k_l)为所述两个参数值f(k+l)和f(k_l)的所述第二差值。7. 根据权利要求5所述的装置，其中所述包络生成器（1620)用于通过应用以确定所述音频信号包络，其中tilt (k)指示所述聚合函数在所述第k个编码值处的导数，其中c (k+Ι)为所述第一聚合值，其中f (k+Ι)为所述第一参数值，其中c (k)为所述第二聚合值，其中f(k)为所述第二参数值，其中c(k-l)为所述聚合函数的所述聚合点中的第三聚合点的第三聚合值，其中f(k-l)为所述聚合函数的所述聚合点中的所述第三聚合点的第三参数值，其中k为指示所述一个或多个编码值中的一个的索引的整数，其中c (k+1)-C (k)为所述两个聚合值c (k+Ι)和c (k)的所述第一差值，以及其中f(k+l)-f (k)为所述两个参数值f (k+Ι)和f (k)的所述第二差值。8. 根据前述权利要求中任一项所述的装置，其中所述输入接口（1610)用于接收一个或多个分裂值作为所述一个或多个编码值，其中所述包络生成器（1620)用于依据所述一个或多个分裂值生成所述聚合函数，其中所述一个或多个分裂值中的每个指示所述聚合函数的所述聚合点中的一个的所述聚合值，其中所述包络生成器（1620)用于生成所述重建的音频信号包络，以使得所述一个或多个分裂点将所述重建的音频信号包络划分成两个或更多个音频信号包络部分，其中预定义的分配规则为所述两个或更多个信号包络部分中的每个信号包络部分，依据所述信号包络部分，定义信号包络部分值，并且其中所述包络生成器（1620)用于生成所述重建的音频信号包络，以使得对于所述两个或更多个信号包络部分中的每个，其信号包络部分值的绝对值大于其他信号包络部分中的每个的所述信号包络部分值的绝对值的一半。9. 一种用于确定用于对音频信号包络进行编码的一个或多个编码值的装置，包括：聚合器（1710)，用于为多个参数值中的每个确定聚合值，其中对所述多个参数值排序，以使得当所述多个参数值中的第二参数值与所述多个参数值中的第一参数值不同时，所述第一参数值在所述第二参数值之前或之后，其中包络值被分配给所述参数值中的每个，其中所述参数值中的每个的所述包络值取决于所述音频信号包络，并且其中所述聚合器 (1710)用于为所述多个参数值中的每个参数值，依据所述参数值的所述包络值并依据在所述参数值之前的多个参数值中的每个的所述包络值，确定所述聚合值；以及编码单元（1720)，用于依据所述多个参数值的聚合值中的一个或多个确定一个或多个编码值。10. 根据权利要求9所述的装置，其中所述聚合器（1710)用于为所述多个参数值中的每个参数值，通过对所述参数值的所述包络值和在所述参数值之前的所述参数值的所述包络值进行相加以确定所述聚合值。11. 根据权利要求9或10所述的装置，其中所述参数值中的每个的所述包络值指示以所述音频信号包络作为信号包络的音频信号包络的谱值的η次幂，其中η为大于O的偶数。12. 根据权利要求9或10所述的装置，其中所述参数值中的每个的所述包络值指示时域中表示的并以所述音频信号包络作为信号包络的音频信号包络的幅值的η次幂，其中η 为大于〇的偶数。13. 根据权利要求9-12中任一项所述的装置，其中所述编码单元（1720)用于依据所述参数值的所述聚合值中的一个或多个并依据指示多少个值将被所述编码单元（1720)确定作为所述一个或多个编码值的编码值数，确定所述一个或多个编码值。14. 根据权利要求13所述的装置，其中所述编码单元用于根据确定所述一个或多个编码值，其中c (k)指示待被所述编码单元确定的第k个编码值，其中j指示所述多个参数值中的第j个参数值，其中a(j)指示被分配给所述第j个参数值的所述聚合值，其中max(a)指示作为被分配给所述参数值中的一个的所述聚合值中的一个的最大值，其中被分配给所述参数值中的一个的所述聚合值均不大于所述最大值，并且其中指示作为所述参数值中的一个的最小值，为此为最小。15. -种用于从一个或多个编码值生成音频信号包络的方法，包括：：接收所述一个或多个编码值；以及依据所述一个或多个编码值生成所述音频信号包络，其中通过依据所述一个或多个编码值生成聚合函数，进行生成所述音频信号包络，其中所述聚合函数包括多个聚合点，其中所述聚合点中的每个包括参数值和聚合值，其中所述聚合函数单调递增，并且其中所述一个或多个编码值中的每个指示所述聚合函数的所述聚合点中的一个的所述参数值和所述聚合值中的至少一个，其中生成所述音频信号包络被进行，以使得所述音频信号包络包括多个包络点，其中所述包络点中的每个包括参数值和包络值，并且其中对于所述聚合函数的所述聚合点中的每个，所述音频信号包络的所述包络点中的一个被分配给所述聚合点，以使得所述包络点的所述参数值等于所述聚合点的所述参数值，并且其中生成所述音频信号包络被进行，以使得所述音频信号包络的所述包络点中的每个的所述包络值取决于所述聚合函数的至少一个聚合点的所述聚合值。16. -种用于确定用于对音频信号包络进行编码的一个或多个编码值的方法，包括：为多个参数值中的每个确定聚合值，其中对所述多个参数值排序，以使得当所述多个参数值中的第一参数值与所述多个参数值中的第二参数值不同时，所述第一参数值在所述二参数值之前或之后，其中包络值被分配给所述参数值中的每个，其中所述参数值中的每个的所述包络值取决于所述音频信号包络，并且其中所述聚合器（1710)用于为所述多个参数值中的每个参数值，依据所述参数值的所述包络值并依据在所述参数值之前的多个参数值中的每个的所述包络值，确定所述聚合值；以及依据所述多个参数值的聚合值中的一个或多个确定一个或多个编码值。17. -种计算机程序，当被在计算机或信号处理器上执行时，用于实现权利要求15或 16所述的方法。
【专利摘要】提供用于从一个或多个编码值生成音频信号包络的装置。该装置包括：用于接收一个或多个编码值的输入接口(1610)；以及用于依据一个或多个编码值生成音频信号包络的包络生成器(1620)。包络生成器(1620)用于依据一个或多个编码值生成聚合函数，其中聚合函数包括多个聚合点，其中聚合点中的每个包括参数值和聚合值，其中聚合函数单调递增，并且其中一个或多个编码值中的每个指示聚合函数的聚合点中的一个的参数值和聚合值中的至少一个。此外，包络生成器(1620)用于生成音频信号包络，以使得音频信号包络包括多个包络点，其中包络点中的每个包括参数值和包络值，并且其中音频信号包络的包络点被分配给聚合函数的聚合点中的每个，以使得该包络点的参数值等于该聚合点的参数值。此外，包络生成器(1620)用于生成音频信号包络，以使得音频信号包络的包络点中的每个的包络值取决于聚合函数的至少一个聚合点的聚合值。
【IPC分类】G10L19/032, G10L19/06
【公开号】CN105431902
【申请号】CN201480033295
【发明人】汤姆·贝克斯特伦, 本杰明·舒伯特, 马库斯·马特拉斯, 萨沙·迪施, 康斯坦丁·施密特, 格莱泽格尔兹·皮耶奇克
【申请人】弗朗霍夫应用科学研究促进协会
【公开日】2016年3月23日
【申请日】2014年6月10日
【公告号】CA2914771A1, EP3008726A1, US20160155451, WO2014198726A1

完整全部详细技术资料下载

当前第6页1 2 3 4 5 6