编码装置和方法、解码装置和方法以及程序的制作方法

文档序号：2825795阅读：202来源：国知局

编码装置和方法、解码装置和方法以及程序的制作方法
【专利摘要】本技术涉及能够以较低代码量获得高质量音频的编码装置和方法、解码装置和方法以及程序。基于构成输入信号的多个子带的子带信号，区间数确定特征量计算电路计算用于确定将要处理的区间分割成连续帧区间的分割数的区间数确定特征量，所述连续帧区间包括已选择相同估计系数的帧。准高频子带功率差计算电路基于区间数确定特征量来确定要处理的区间中的连续帧区间的数目，针对每个连续帧区间选择用于通过估计确定输入信号的高频分量的估计系数，并生成包含用于获得估计系数的系数索引的数据。高频编码电路对获得的数据进行编码，并且生成高频编码数据。本技术可应用于编码装置。
【专利说明】编码装置和方法、解码装置和方法以及程序
【技术领域】
[0001]本技术涉及一种编码装置和编码方法、解码装置和解码方法以及程序，更具体地涉及被配置成以较少编码量获得高质量音频的编码装置和编码方法、解码装置和解码方法以及程序。
【背景技术】
[0002]一种对音频信号进行编码的方法包括HE-AAC (高效MPEG (运动图像专家组)4AAC(高级音频编码)(ISO 标准 /IEC 14496-3)、AAC (MPEG2AAC) (ISO 标准 /IEC13818-7)等。
[0003]例如，作为对音频信号进行编码的方法，已经提出了如下方法:其中，输出通过对低频分量进行编码而获得的低频编码信息以及根据低频分量和高频分量生成的用于获得高频分量的估计值的高频编码信息，作为通过对音频信号进行编码而获得的代码(例如参见专利文献I)。在该方法中，高频编码信息包含计算高频分量的估计值所需要的信息，诸如标定因子、幅值调节系数和谱残差，以用于获得高频分量。
[0004]当对代码进行解码时，对低频编码信息进行解码而获得的低频分量和通过基于对高频编码信息进行解码而获得的信息来估计高频分量获得的高频分量被组合，以再现音频信号。
[0005]在这类编码方法中，仅用于获得高频分量的估计值的信息被编码作为关于高频信号分量的信息，因此可以改善编码效率同时抑制声音质量的退化。
[0006]引用列表
[0007]专利文献
[0008]专利文献1:W0 2006/049205A
【发明内容】

[0009]本发明要解决的问题
[0010]然而，在上述技术中，虽然可以获得高质量音频作为对代码进行解码的结果，但是应该针对音频信号的每个处理单位生成用于计算高频分量的估计值的信息，这不能确定高频编码信息的编码量充分小。
[0011]鉴于以上方面实现了本技术，以使得能够以较少编码量获得高质量音频。
[0012]问题的解决方案
[0013]根据本技术的第一方面的编码装置包括:子带分割单元，被配置成生成输入信号的低频侧的子带的低频子带信号和输入信号的高频侧的子带的高频子带信号；准高频子带功率计算单元，被配置成基于低频子带信号和预定估计系数来计算准高频子带功率，所述准高频子带功率是高频子带信号的高频子带功率的估计值；特征量计算单元，被配置成基于低频子带信号或高频子带信号中的至少之一来计算区间数确定特征量；确定单元，被配置成基于区间数确定特征量来确定在包括输入信号的多个帧的处理目标区间中的连续帧区间的数目，所述连续帧区间包括这样的帧，针对所述帧，选择相同的估计系数；选择单元，被配置成在通过基于所确定的连续帧区间的数目分割处理目标区间而获得的每个连续帧区间中，基于准高频子带功率和高频子带功率来从多个估计系数中选择构成连续帧区间的帧的估计系数；生成单元，被配置成生成下述数据:所述数据用于获得在构成处理目标区间的每个连续帧区间的帧中选择的估计系数；低频编码单元，被配置成对输入信号的低频信号进行编码以生成低频编码数据；以及复用单元，被配置成对所述数据和低频编码数据进行复用以生成输出代码串。
[0014]区间数确定特征量可以被定义为指示高频子带功率之和的特征量。
[0015]区间数确定特征量可以被定义为指示高频子带功率之和的时间变化的特征量。
[0016]区间数确定特征量可以被定义为指示所述输入信号的频率概况(frequencyprofile)的特征量。
[0017]区间数确定特征量可以被定义为多个特征量的线性和或非线性和。
[0018]编码装置还包括评估值和计算单元，该评估值和计算单元被配置成基于指示针对每个估计系数计算的、帧中的准高频子带功率与高频子带功率之间的误差的评估值，针对每个估计系数来计算构成连续帧区间的每个帧的评估值之和。选择单元可以基于针对每个估计系数计算的评估值之和来选择连续帧区间的帧的估计系数。
[0019]通过用所确定的连续帧区间的数目来均等地分割处理目标区间而获得的每个区间可以被定义为连续帧区间。
[0020]选择单元可以基于针对在用所确定的连续帧区间的数目分割处理目标区间时能够取得的处理目标区间的分割的每个组合的评估值之和，来选择连续帧区间的帧的估计系数；从组合之中识别使得构成处理目标区间的所有帧的所选择的估计系数的评估值之和最小化的组合；以及将每个帧中选择的估计系数定义为所识别的组合中的对应帧的估计系数。
[0021]编码装置还包括被配置成对所述数据进行编码以生成高频编码数据的高频编码单元。复用单元可以通过将高频编码数据和低频编码数据进行复用而生成输出代码串。
[0022]确定单元还可以基于所确定的连续帧区间的数目来计算处理目标区间的高频编码数据的编码量，并且低频编码单元可以以下述编码量对低频信号进行编码:所述编码量是根据预先针对处理目标区间确定的编码量和所计算的高频编码数据的编码量而确定的。
[0023]根据本技术的第一方面的编码方法或程序包括步骤:生成输入信号的低频侧的子带的低频子带信号和输入信号的高频侧的子带的高频子带信号；基于低频子带信号和预定估计系数来计算准高频子带功率，所述准高频子带功率是高频子带信号的高频子带功率的估计值；基于低频子带信号或高频子带信号中的至少之一来计算区间数确定特征量；基于区间数确定特征量来确定在包括所述输入信号的多个帧的处理目标区间中的连续帧区间的数目，所述连续帧区间包括这样的帧，针对所述帧，选择相同的估计系数；在通过基于所确定的连续帧区间的数目分割处理目标区间而获得的每个连续帧区间中，基于所述准高频子带功率和所述高频子带功率来从多个估计系数中选择构成所述连续帧区间的帧的估计系数；生成下述数据:所述数据用于获得在构成处理目标区间的每个连续帧区间的帧中选择的估计系数；通过对输入信号的低频信号进行编码来生成低频编码数据；以及通过对所述数据和低频编码数据进行复用来生成输出代码串。[0024]根据本技术的第一方面，生成输入信号的低频侧的子带的低频子带信号和输入信号的高频侧的子带的高频子带信号，基于低频子带信号和预定估计系数来计算准高频子带功率，所述准高频子带功率是高频子带信号的高频子带功率的估计值，基于低频子带信号或高频子带信号中的至少之一来计算区间数确定特征量，基于区间数确定特征量来确定在包括输入信号的多个帧的处理目标区间中的连续帧区间的数目，所述连续帧区间包括这样的帧，针对所述帧，选择相同的估计系数，在通过基于所确定的连续帧区间的数目分割处理目标区间而获得的每个连续帧区间中，基于准高频子带功率和高频子带功率来从多个估计系数中选择构成连续帧区间的帧的估计系数，生成用于获得在构成处理目标区间的每个连续帧区间的帧中选择的估计系数的数据，通过对输入信号的低频信号进行编码来生成低频编码数据，并通过对所述数据和低频编码数据进行复用来生成输出代码串。
[0025]根据本技术的第二方面的解码装置包括:解复用单元，被配置成将输入代码串解复用成用于获得在构成处理目标区间的每个连续帧区间的帧中选择的估计系数的数据、以及通过对输入信号的低频信号进行编码而获得的低频编码数据，所述数据是基于下述操作的结果而生成的:基于输入信号的低频子带信号和预定估计系数来计算输入信号的高频子带信号的高频子带功率的估计值；基于从输入信号中提取的区间数确定特征量来确定在包括输入信号的多个帧的处理目标区间中的连续帧区间的数目，所述连续帧区间包括这样的帧，针对所述帧，选择相同的估计系数；以及在通过基于所确定的连续帧区间的数目分割处理目标区间而获得的每个连续帧区间中，基于估计值和高频子带功率来从多个估计系数中选择构成连续帧区间的帧的估计系数；低频解码单元，被配置成对低频编码数据进行解码以生成低频信号；高频信号生成单元，被配置成基于从所述数据获得的估计系数和根据解码获得的低频信号来生成高频信号；以及组合单元，被配置成基于高频信号和根据解码获得的低频信号来生成输出信号。
[0026]解码装置还包括:高频解码单元，被配置成对所述数据进行解码以获得估计系数。
[0027]基于指示针对每个估计系数计算的、帧中的估计值与高频子带功率之间的误差的评估值，可以针对每个估计系数来计算构成连续帧区间的每个帧的评估值之和，并且基于针对每个估计系数计算的评估值之和，可以选择连续帧区间的帧的估计系数。
[0028]通过用所确定的连续帧区间的数目均等地分割处理目标区间而获得的每个区间可以被定义为连续帧区间。
[0029]基于针对在用所确定的连续帧区间的数目分割处理目标区间时能够取得的处理目标区间的分割的每个组合的评估值之和，可以选择连续帧区间的帧的估计系数；从组合之中可以识别使得构成处理目标区间的所有帧的所选择的估计系数的评估值之和最小化的组合；以及将每个帧中选择的估计系数可以被定义为所识别的组合中的对应帧的估计系数。
[0030]根据本技术的第二方面的解码方法或程序包括步骤:将输入代码串解复用成用于获得在构成处理目标区间的每个连续帧区间的帧中选择的估计系数的数据、以及通过对输入信号的低频信号进行编码而获得的低频编码数据，所述数据是基于下述操作的结果而生成的:基于输入信号的低频子带信号和预定估计系数来计算输入信号的高频子带信号的高频子带功率的估计值；基于从输入信号中提取的区间数确定特征量来确定在包括输入信号的多个帧的处理目标区间中的连续帧区间的数目，所述连续帧区间包括这样的帧，针对所述帧，选择相同的估计系数；以及在通过基于所确定的连续帧区间的数目分割处理目标区间而获得的每个连续帧区间中，基于估计值和高频子带功率来从多个估计系数中选择构成连续帧区间的帧的估计系数；通过对低频编码数据进行解码来生成低频信号；基于从所述数据获得的估计系数和根据解码获得的低频信号来生成高频信号；以及基于高频信号和根据解码获得的低频信号来生成输出信号。
[0031]根据本技术的第二方面，将输入代码串解复用成用于获得在构成处理目标区间的每个连续帧区间的帧中选择的估计系数的数据、以及通过对输入信号的低频信号进行编码而获得的低频编码数据，所述数据是基于下述操作的结果而生成的:基于输入信号的低频子带信号和预定估计系数来计算输入信号的高频子带信号的高频子带功率的估计值；基于从输入信号中提取的区间数确定特征量来确定在包括所述输入信号的多个帧的处理目标区间中的连续帧区间的数目，所述连续帧区间包括这样的帧，针对所述帧，选择相同的估计系数；以及在通过基于所确定的连续帧区间的数目分割处理目标区间而获得的每个连续帧区间中，基于估计值和高频子带功率来从多个估计系数中选择构成连续帧区间的帧的估计系数；通过对低频编码数据进行解码来生成低频信号；基于从所述数据获得的估计系数和根据解码获得的低频信号来生成高频信号；以及基于高频信号和根据解码获得的低频信号来生成输出信号。
[0032]本发明的效果
[0033]根据本技术的第一和第二方面，能够以较少编码量获得高质量音频。
【专利附图】

【附图说明】
[0034]图1是示出输入信号的子带的示意图。
[0035]图2是示出通过可变长度系统进行高频分量的编码的示意图。
[0036]图3是示出通过固定长度系统进行高频分量的编码的示意图。
[0037]图4是示出根据本技术的编码装置的配置示例的框图。
[0038]图5是编码处理的流程图。
[0039]图6是示出解码装置的配置示例的框图。
[0040]图7是编码处理的流程图。
[0041]图8是编码处理的流程图。
[0042]图9是编码处理的流程图。
[0043]图10是编码处理的流程图。
[0044]图11是编码处理的流程图。
[0045]图12是示出编码装置的另一配置示例的框图。
[0046]图13是编码处理的流程图。
[0047]图14是示出计算机的配置示例的框图。
【具体实施方式】
[0048]下面参照附图详细描述本技术的示例性实施例。
[0049]<本技术的概述>
[0050][关于输入信号的编码][0051]本技术是通过接收例如音频信号(诸如音乐信号)作为输入信号来执行输入信号的编码。
[0052]在执行输入信号的编码的编码装置中，如图1所示，输入信号在编码时被分割成均具有预定带宽的多个频带(下文中为“子带”)的子带信号。在图1中，竖轴表示输入信号的每个频率的功率，而横轴表示输入信号的频率。在该图中，曲线Cll表示输入信号的每个频率分量的功率，而竖直方向上的虚线表示每个子带的边界位置。
[0053]当输入信号被分割成子带的子带信号时，通过预定编码系统对输入信号的频率分量当中的等于或低于预设频率的低频侧的分量进行编码，以生成低频编码数据。
[0054]在图1所示的示例中，具有等于或低于具有用于识别每个子带的索引Sb的子带Sb的上限频率的频率的子带被定义为输入信号的低频分量，具有高于子带Sb的上限频率的频率的子带被定义为输入信号的高频分量。
[0055]当获得低频编码数据时，基于输入信号的低频分量和高频分量生成用于再现高频分量的每个子带的子带信号的信息，并且通过预定编码系统以适当方式对信息进行编码以生成高频编码数据。
[0056]具体地，根据包括在低频侧具有最高频率且在频率方向上连续布置的子带sb-3至子带Sb的四个子带的分量、以及包括在高频侧连续布置的子带sb+1至子带eb的(eb- (sb+1) +1)个子带的分量，来生成高频编码数据。
[0057]子带sb+1是与子带sb邻接的位于最低频侧的高频子带,而子带eb是在连续布置的子带sb+1至子带eb中具有最高频率的子带。
[0058]通过对高频分量进行编码而获得的高频编码数据是用于通过估计生成高频侧的子带ib (其中sb+1 ^ ib^ eb)的子带信号的信息，并且高频编码数据包括用于获得用于估计每个子带信号的估计系数的系数索引。
[0059]也就是,在子带ib的子带信号的估计中，采用与低频侧的每个子带kb(其中sb -3^kb^sb)的子带的功率相乘的系数Aib(kb)以及包括作为常数项的系数Bib的估计系数。高频编码数据中包括的系数索引是用于获得包含每个子带ib的系数Aib (kb)的估计系数和系数Bib的集合的信息，例如，用于识别估计系数的集合的信息。
[0060]当以上述方式获得低频编码数据和高频编码数据时，将低频编码数据和高频编码数据复用以生成输出代码串，然后输出该输出代码串。
[0061]以此方式，通过将用于获得估计系数的系数索引包括在高频编码数据中，与包括标度因子(scale factor)、幅值调节系数等以计算每个帧的高频分量的情况相比,可以大大减少高频编码数据的编码量。
[0062]此外，接收输出代码串的解码装置通过对低频编码数据进行解码而获得包括低频侧的每个子带的子带信号的解码低频信号，并通过估计从解码低频信号以及通过对高频编码数据进行解码而获得的信息来生成高频侧的每个子带的子带信号。以这种方式获得的输出信号是通过对编码输入信号进行解码而获得的信号。
[0063][关于输出代码串]
[0064]在输入信号的编码中，针对要处理的帧，从针对输入信号的对应于预定时间长度的每个区间(即针对每个帧)预先准备的多个估计系数之中选择适当的估计系数。
[0065]在编码装置中，通过将系数索引在时间方向上改变的时间信息和改变的系数索引的值包括在高频编码数据中，而不将每个帧的系数索引按原样包括在高频编码数据中，来实现编码量的进一步减少。
[0066]具体地，当输入信号是不存在每个频率分量在时间方向上的改变的稳态信号时，所选择的估计系数(即其系数索引)通常在时间方向上连续继续下去。因此，为了减少高频编码数据中包括的系数索引在时间方向上的信息量，当执行输入信号的较高频率分量的编码时，适当地切换可变长度系统和固定长度系统。
[0067][关于可变长度系统]
[0068]下面描述通过可变长度系统和固定长度系统进行的高频分量的编码。
[0069]当对高频分量进行编码时，针对预先确定的预定帧长度的区间在可变长度系统与固定长度系统之间执行切换。例如，在以下描述中，每隔16帧在可变长度系统与固定长度系统之间执行切换，并且输入信号的16帧的区间可以被称作处理目标区间。也就是，在编码装置中，以作为处理目标区间的16帧为单位将输出代码串输出。
[0070]首先，描述可变长度系统。在通过可变长度系统进行的高频分量的编码中，包括系统标志、系数索引、区间信息和数目信息的数据被编码并作为高频编码数据输出。
[0071]系统标志是指示用于生成高频编码数据的系统的信息，即指示在对高频分量进行编码时在可变长度系统与固定长度系统之间选择哪个系统的信息。
[0072]区间信息是指示包括处理目标区间中所包括的连续帧并针对其选择相同系数索引的区间(下文中为“连续帧区间”)的长度的信息。数目信息是指示处理目标区间中所包括的连续帧区间的数目的信息。
[0073]例如，在可变长度系统中，如图2所示，从位置FSTl到位置FSEl的16帧的区间被定义为一个处理目标区间。在图2中，水平方向表示时间，而一个方块表示一帧。此外，指示帧的方块中的数值表示用于识别为帧选择的估计系数的系数索引的值。
[0074]在通过可变长度系统进行高频分量的编码时，首先，处理目标区间被分割成连续帧区间，每个连续帧区间包括选择相同系数索引的连续帧。也就是，分别选择不同系数索引的彼此邻接的帧之间的边界位置被定义为连续帧区间之间的边界位置。
[0075]在本示例中，处理目标区间被分割成三个区间，包括从位置FSTl到位置FCl的区间、从位置FCl到位置FC2的区间以及从位置FC2到位置FSEl的区间。例如，在从位置FSTl到位置FCl的连续帧区间中，在每个帧中选择相同系数索引“2”。
[0076]当处理目标区间以上述方式被分割成连续帧区间时，生成下述数据:该数据包括指示连续帧区间的数目的数目信息、在每个连续帧区间中选择的系数索引、指示每个连续帧区间的长度的区间信息以及处理目标区间中的系统标志。
[0077]在这种情况下，处理目标区间被分割成三个连续帧区间，指示连续帧区间的数目“3”的信息被定义为数目信息。在图2中，数目信息被表示为“num_length=3”。
[0078]例如，处理目标区间中的第一连续帧区间的区间信息被表示为以连续帧区间中的帧为单位的长度“5”，并且在图2中被表示为“length0=5”。此外，每条区间信息被配置成识别从处理目标区间的头开始的连续帧区间的顺序。换言之，在区间信息中，还包括用于识别处理目标区间中的连续帧区间的位置的信息。
[0079]当生成包括用于处理目标区间的数目信息、系数索引、区间信息和系统标志的数据时，该数据被编码并输出作为高频编码数据。在这种情况下，当针对多个帧连续选择相同系数索引时，不需要针对每个帧传送系数索引，减少要传送的输出代码串的数据量，结果，可以更高效地执行编码和解码。
[0080][关于固定长度系统]
[0081]下面描述通过固定长度系统进行的高频分量的编码。
[0082]在固定长度系统中，如图3所示，包括16个帧的处理目标区间被均等地分割成具有预定数目的帧的区间(下文中为“固定长度区间”)。在图3中，水平方向表示时间，而一个方块表示一帧。此外，指示帧的方块中的数值表示用于识别为帧选择的估计系数的系数索引的值。此外，在图3中，对与图2所示的部分相对应的部分赋予相同的附图标记，并且省略其描述。
[0083]在固定长度系统中，处理目标区间被分割成多个固定长度区间。在这种情况下，确定固定长度区间的长度以使得在固定长度区间中的每个帧中选择的系数索引相同并且使固定长度区间的长度最大化。
[0084]在图3所示的示例中，固定长度区间的长度(下文中简化为“固定长度”)为4帧，并且处理目标区间被均等地分割成四个固定长度区间。也就是，处理目标区间被分割成从位置FSTl到位置FC21的区间、从位置FC21到位置FC22的区间、从位置FC22到位置FC23的区间以及从位置FC23到位置FSEl的区间。这些固定长度区间中的系数索引在处理目标区间的头处从固定长度区间开始按顺序被表示为“ I ”、“ 2 ”、“ 2 ”和“ 3 ”。
[0085]当处理目标区间以上述方式被分割成多个固定长度区间时，生成包括处理目标区间中的指示固定长度区间的固定长度的固定长度索引、系数索引、切换标志和系统标志的数据。
[0086]切换标志是指示固定长度区间之间的边界位置的信息，即在预定固定长度区间的最后一帧与紧挨着该预定固定长度区间的固定长度区间的第一帧之间是否改变系数索引。例如，当在从处理目标区间的头开始的第(i+1)固定长度区间与第(i+2)固定长度区间之间的边界位置处改变系数索引时，第i (i=0, I, 2,...)个切换标志81^(1?18_;[被设置为“I”，当不改变系数索引时，第i (i=0, 1,2,...)个切换标志gridflg_i被设置为“O”。
[0087]在图3所示的示例中，因为第一固定长度区间的系数索引“I”与第二固定长度区间的系数索引“2”不同，所以在处理目标区间的第一固定长度区间的边界位置(位置FC21)处的切换标志gridflg_0被设置为“I”。此外，因为第二固定长度区间的系数索引“2”与第三固定长度区间的系数索引“2”相同，所以在位置FC22处的切换标志gridflg_l被设置为“O”。
[0088]此外，固定长度索引的值被设置为根据固定长度而获得的值。具体地，例如，固定长度索引Iengthjd被设置为满足固定长度fixed_length=16/2length-1d的值。在图3所示的示例中，因为固定长度fixed_length=4,所以固定长度索引length_id=2。
[0089]当处理目标区间被分割成固定长度区间并且生成包括固定长度索引、系数索引、切换标志和系统标志的数据时，该数据被编码并输出作为高频编码数据。
[0090]在图3所示的示例中，包括位置FC21至位置FC23处的切换标志gridflg_0=l、gridflg_l=0和gridflg_2=l,固定长度索引length_id=2,固定长度区间的系数索引“I”、“2”和“3”以及指示固定长度系统的系统标志的数据被编码并输出作为高频编码数据。
[0091]固定长度区间之间的边界位置处的切换标志被配置成识别从处理目标区间的头开始边界位置处的切换标志的顺序。换言之，在切换标志中，包括用于识别处理目标区间中的固定长度区间的边界位置的信息。
[0092]此外，按照选择系数索引的顺序，即按照布置固定长度区间的顺序来布置高频编码数据中所包括的系数索引。例如，在图3所示的示例中，按照系数索引和“3”的顺序布置固定长度区间，并且这些系数索引包括在该数据中。
[0093]虽然在图3所示的示例中从处理目标区间的头开始第二固定长度区间和第三固定长度区间的系数索引为“2”，但是构成了仅一个系数索引“2”包括在处理目标区间中。当连续固定长度区间的系数索引相同时，即当连续固定长度区间之间的边界位置处的切换标志为“0”时，仅一个系数索引包括在高频编码数据中，而不是将针对相应的固定长度区间的数目的相同的系数索引包括在高频编码数据中。
[0094]以这种方式，当根据包括固定长度索引、系数索引、切换标志和系统标志的数据生成高频编码数据时，不需要针对每个帧传送系数索引，因此可以减少要传送的输出代码串的数据量。结果，可以更高效地执行编码和解码。
[0095][关于连续帧区间的数目]
[0096]在对输入信号进行编码时，基于输入信号的每个子带的子带信号来确定构成处理目标区间的连续帧区间的最优数目，基于所确定的连续帧区间的数目来选择每个帧的系数索引(估计系数)。例如，基于根据高频侧的子带的子带功率而确定的特征量(在下文中为“区间数确定特征量”)来确定构成处理目标区间的连续帧区间的最优数目。
[0097]以这种方式，通过基于指示高频分量的特征的区间数确定特征量来确定构成处理目标区间的连续帧区间的数目，可以防止为每个帧选择的系数索引在时间方向上多于必要地变化。
[0098]结果，处理目标区间的高频编码数据中所包括的系数索引的数目等可以被抑制为必要最低限度，因此可以进一步减少高频编码数据的编码量。
[0099]此外，由于诸如估计误差的高频分量的特征取决于估计系数，因此，如果系数索引在时间方向上多于必要地变化，则在通过解码获得的音频信号中生成解码前输入信号中不存在的非自然频率包络的时间变化，其在听觉上使声音质量退化。这种声音质量的退化在具有高频分量的较少时间变化的稳态音频信号中是显著的。
[0100]然而，如果在适当地确定构成处理目标区间的连续帧区间的数目之后选择每个帧的系数索引，则可以防止系数索引多于必要地变化。结果，可以抑制通过解码获得的音频的高频分量的非自然时间变化，因此可以提高声音质量。
[0101]〈第一实施例〉
[0102][编码装置的示例结构]
[0103]下面描述上述用于对输入信号进行编码的编码技术的示例性实施例。首先，描述用于执行输入信号的编码的编码装置的配置。图4是示出了编码装置的配置示例的框图。
[0104]编码装置11包括低通滤波器31、低频编码电路32、子带分割电路33、特征量计算电路34、准高频子带功率计算电路35、区间数确定特征量计算电路36、准高频子带功率差计算电路37、高频编码电路38、以及复用电路39。在编码装置11中，要编码的输入信号被提供给低通滤波器31和子带分割电路33。
[0105]低通滤波器31利用预定截止频率对提供的输入信号进行滤波，并且将处于比截止频率更低的频率区域的所获得的信号(下文中为“低频信号”)提供给低频编码电路32和子带分割电路33。
[0106]低频编码电路32对从低通滤波器31提供的低频信号进行编码，并将所获得的低频编码数据提供给复用电路39。
[0107]子带分割电路33将从低通滤波器31提供的低频信号均等地分割成多个子带的子带信号(下文中为“低频子带信号”)，并将所获得的低频子带信号提供给特征量计算电路34和区间数确定特征量计算电路36。低频子带信号是在输入信号的低频侧的子带的信号。
[0108]此外，子带分割电路33将所提供的输入信号均等地分割成多个子带的子带信号，并将通过分割获得的子带信号之中的高频侧的预定频带中所包括的子带的子带信号提供给区间数确定特征量计算电路36和准高频子带功率差计算电路37。在下文中，从子带分割电路33提供给区间数确定特征量计算电路36和准高频子带功率差计算电路37的子带的子带信号还被称作高频子带信号。
[0109]特征量计算电路34基于从子带分割电路33提供的低频子带信号来计算特征量，并将所计算的特征量提供给准高频子带功率计算电路35。
[0110]准高频子带功率计算电路35基于从特征量计算电路34提供的特征量来计算高频子带信号的功率的估计值(下文中还被称为“准高频子带功率”)，并将所计算的准高频子带功率提供给准高频子带功率差计算电路37。通过统计学习获得的估计系数的多个集合被记录在准高频子带功率计算电路35中，并且基于估计系数和特征量来计算准高频子带功率。
[0111]区间数确定特征量计算电路36基于从子带分割电路33提供的低频子带信号和高频子带信号来计算区间数确定特征量，并将所计算的区间数确定特征量提供给准高频子带功率差计算电路37。
[0112]准高频子带功率差计算电路37针对每个帧选择指示适于估计帧的高频分量的估计系数的系数索引。准高频子带功率差计算电路37包括确定单元51、评估值和计算单元52、选择单元53和生成单元54。
[0113]确定单元51基于从区间数确定特征量计算电路36提供的区间数确定特征量来确定构成处理目标区间的连续帧区间的数目。
[0114]准高频子带功率差计算电路37基于从子带分割电路33提供的高频子带信号的功率(下文中还被称作“高频子带功率”)以及从准高频子带功率计算电路35提供的准高频子带功率来针对每个帧计算每个估计系数的评估值。该评估值是指示输入信号的实际高频分量与通过使用估计系数估计的高频分量之间的误差的值。
[0115]评估值和计算单元52基于确定单元51所确定的连续帧区间的数目和每个帧的评估值来计算连续帧的评估值之和。选择单元53基于评估值和计算单元52所计算的评估值之和来选择每个帧的系数索引。
[0116]生成单元54基于输入信号的处理目标区间的每个帧中的系数索引的选择结果来在可变长度系统与固定长度系统之间执行切换，通过所选择的系统生成用于获得高频编码数据的数据，并且将所生成的数据提供给高频编码电路38。
[0117]高频编码电路38对从准高频子带功率差计算电路37提供的数据进行编码，并将所获得的高频编码数据提供给复用电路39。复用电路39将来自低频编码电路32的低频编码数据和来自高频编码电路38的高频编码数据复用，并输出复用的数据作为输出代码串。
[0118][编码处理的描述]
[0119]图4所示的编码装置11被提供输入信号，在被指示对输入信号进行编码时执行编码处理，并将输出代码串输出到解码装置。下面参照图5所示的流程图描述通过编码装置11进行的编码处理。针对每个预设数目的帧，即每个处理目标区间，执行该编码处理。
[0120]在步骤S11，低通滤波器31通过使用低通滤波器利用预定截止频率对所提供的要处理的帧的输入信号进行滤波，并且将所获得的低频信号提供给低频编码电路32和子带分割电路33。
[0121]在步骤S12，低频编码电路32对从低通滤波器31提供的低频信号进行编码，并且将所获得的低频编码数据提供给复用电路39。
[0122]在步骤S13，子带分割电路33将输入信号和低频信号均等地分割成均具有预定带宽的多个子带信号。
[0123]也就是，子带分割电路33将输入信号分割成多个子带的子带信号，并将通过分割获得的高频侧的子带sb+Ι至子带eb的子带信号提供给区间数确定特征量计算电路36和准高频子带功率差计算电路37。
[0124]此外，子带分割电路33将来自低通滤波器31的低频信号分割成多个子带的子带信号，并将通过分割获得的低频侧的子带sb-3至子带Sb的子带信号提供给特征量计算电路34和区间数确定特征量计算电路36。
[0125]在步骤S14，区间数确定特征量计算电路36基于从子带分割电路33提供的低频子带信号和高频子带信号来计算区间数确定特征量，并将所计算的区间数确定特征量提供给准高频子带功率差计算电路37。
[0126]例如，区间数确定特征量计算电路36通过计算以下等式(I)来计算作为要处理的中贞J的估计带宽的子带功率和powerhigh(J),即高频侧的子带的子带信号的功率的和。
[0127][数学公式I]
[0128]
【权利要求】
1.一种编码装置，包括: 子带分割单元，被配置成生成输入信号的低频侧的子带的低频子带信号和所述输入信号的高频侧的子带的高频子带信号；准高频子带功率计算单元，被配置成基于所述低频子带信号和预定估计系数来计算准高频子带功率，所述准高频子带功率是所述高频子带信号的高频子带功率的估计值；特征量计算单元，被配置成基于所述低频子带信号或所述高频子带信号中的至少之一来计算区间数确定特征量；确定单元，被配置成基于所述区间数确定特征量来确定在包括所述输入信号的多个帧的处理目标区间中的连续帧区间的数目，所述连续帧区间包括下述帧:针对所述帧，选择相同的估计系数；选择单元，被配置成在通过基于所确定的连续帧区间的数目分割所述处理目标区间而获得的每个连续帧区间中，基于所述准高频子带功率和所述高频子带功率来从多个估计系数中选择构成所述连续帧区间的帧的估计系数；生成单元，被配置成生成下述数据:所述数据用于获得在构成所述处理目标区间的每个所述连续帧区间的帧中选择的所述估计系数；低频编码单元，被配置成对所述输入信号的低频信号进行编码以生成低频编码数据；以及复用单元，被配置成对所述数据和所述低频编码数据进行复用以生成输出代码串。
2.根据权利要求1所述的编码装置，其中所述区间数确定特征量包括指示所述高频子带功率之和的特征量。
3.根据权利要求1所述的编码装置，其中所述区间数确定特征量包括指示所述高频子带功率之和的时间变化的特征量。
4.根据权利要求1所述的编码装置，其中所述区间数确定特征量包括指示所述输入信号的频率概况的特征量。
5.根据权利要求1所述的编码装置，其中所述区间数确定特征量包括多个特征量的线性和或非线性和。
6.根据权利要求1所述的编码装置，还包括:评估值和计算单元，被配置成基于指示针对每个所述估计系数计算的、帧中的所述准高频子带功率与所述高频子带功率之间的误差的评估值，针对每个所述估计系数来计算构成所述连续帧区间的每个帧的所述评估值之和，其中所述选择单元被配置成基于针对每个所述估计系数计算的所述评估值之和来选择所述连续帧区间的帧的估计系数。
7.根据权利要求6所述的编码装置，其中通过用所确定的连续帧区间的数目来均等地分割所述处理目标区间而获得的每个区间被定义为所述连续帧区间。
8.根据权利要求6所述的编码装置，其中，所述选择单元被配置成:基于针对在用所确定的连续帧区间的数目分割所述处理目标区间时能够取得的所述处理目标区间的分割的每个组合的所述评估值之和，来选择所述连续帧区间的帧的估计系数；从所述组合之中识别使得构成所述处理目标区间的所有帧的所选择的估计系数的所述评估值之和最小化的组合；以及将每个帧中选择的所述估计系数定义为所识别的组合中的对应帧的估计系数。
9.根据权利要求1所述的编码装置，还包括:高频编码单元，被配置成对所述数据进行编码以生成高频编码数据，其中所述复用单元被配置成通过将所述高频编码数据和所述低频编码数据进行复用而生成所述输出代码串。
10.根据权利要求9所述的编码装置，其中所述确定单元被配置成还基于所确定的连续帧区间的数目来计算所述处理目标区间的高频编码数据的编码量，并且所述低频编码单元被配置成以下述编码量对所述低频信号进行编码:所述编码量是根据预先针对所述处理目标区间确定的编码量和所计算的高频编码数据的编码量而确定的。
11.一种编码方法，包括步骤: 生成输入信号的低频侧的子带的低频子带信号和所述输入信号的高频侧的子带的高频子带信号；基于所述低频子带信号和预定估计系数来计算准高频子带功率，所述准高频子带功率是所述高频子带信号的高频子带功率的估计值；基于所述低频子带信号或所述高频子带信号中的至少之一来计算区间数确定特征量; 基于所述区间数确定特征量来确定在包括所述输入信号的多个帧的处理目标区间中的连续帧区间的数目，所述连续帧区间包括下述帧:针对所述帧，选择相同的估计系数；在通过基于所确定的连续帧区间的数目分割所述处理目标区间而获得的每个连续帧区间中，基于所述准高频子带功率和所述高频子带功率来从多个估计系数中选择构成所述连续帧区间的帧的估计系数；` 生成下述数据:所述数据用于获得在构成所述处理目标区间的每个所述连续帧区间的帧中选择的所述估计系数；通过对所述输入信号的低频信号进行编码来生成低频编码数据；以及通过对所述数据和所述低频编码数据进行复用来生成输出代码串。
12.—种程序，被配置成使计算机执行步骤: 生成输入信号的低频侧的子带的低频子带信号和所述输入信号的高频侧的子带的高频子带信号；基于所述低频子带信号和预定估计系数来计算准高频子带功率，所述准高频子带功率是所述高频子带信号的高频子带功率的估计值；基于所述低频子带信号或所述高频子带信号中的至少之一来计算区间数确定特征量; 基于所述区间数确定特征量来确定在包括所述输入信号的多个帧的处理目标区间中的连续帧区间的数目，所述连续帧区间包括下述帧:针对所述帧，选择相同的估计系数；在通过基于所确定的连续帧区间的数目分割所述处理目标区间而获得的每个连续帧区间中，基于所述准高频子带功率和所述高频子带功率来从多个估计系数中选择构成所述连续帧区间的帧的估计系数；生成下述数据:所述数据用于获得在构成所述处理目标区间的每个所述连续帧区间的帧中选择的所述估计系数；通过对所述输入信号的低频信号进行编码来生成低频编码数据；以及通过对所述数据和所述低频编码数据进行复用来生成输出代码串。
13.一种解码装置，包括: 解复用单元，被配置成将输入代码串解复用成用于获得在构成处理目标区间的每个连续帧区间的帧中选择的估计系数的数据、以及通过对输入信号的低频信号进行编码而获得的低频编码数据，所述数据是基于下述操作的结果而生成的:基于输入信号的低频子带信号和预定估计系数来计算所述输入信号的高频子带信号的高频子带功率的估计值；基于从所述输入信号中提取的区间数确定特征量来确定在包括所述输入信号的多个帧的处理目标区间中的连续帧区间的数目，所述连续帧区间包括这样的帧，针对所述帧，选择相同的估计系数；以及在通过基于所确定的连续帧区间的数目分割所述处理目标区间而获得的每个所述连续帧区间中，基于所述估计值和所述高频子带功率来从多个估计系数中选择构成所述连续帧区间的帧的估计系数；低频解码单元，被配置成对所述低频编码数据进行解码以生成低频信号；高频信号生成单元，被配置成基于从所述数据获得的所述估计系数和从所述解码获得的所述低频信号来生成高频信号；以及组合单元，被配置成基于所述高频信号和从所述解码获得的所述低频信号来生成输出信号。
14.根据权利要求13 所述的解码装置，还包括:高频解码单元，被配置成对所述数据进行解码以获得所述估计系数。
15.根据权利要求14所述的解码装置，其中基于指示针对每个所述估计系数计算的、所述帧中的所述估计值与所述高频子带功率之间的误差的评估值，针对每个所述估计系数来计算构成所述连续帧区间的每个帧的所述评估值之和，并且基于针对每个所述估计系数计算的所述评估值之和，选择所述连续帧区间的帧的估计系数。
16.根据权利要求15所述的解码装置，其中，通过用所确定的连续帧区间的数目均等地分割所述处理目标区间而获得的每个区间被定义为所述连续帧区间。
17.根据权利要求15所述的解码装置，其中基于针对在用所确定的连续帧区间的数目分割所述处理目标区间时能够取得的所述处理目标区间的分割的每个组合的所述评估值之和，来选择所述连续帧区间的帧的估计系数；从所述组合之中识别使得构成所述处理目标区间的所有帧的所选择的估计系数的所述评估值之和最小化的组合；以及将每个帧中选择的所述估计系数定义为所识别的组合中的对应帧的估计系数。
18.一种解码方法，包括步骤: 将输入代码串解复用成用于获得在构成处理目标区间的每个连续帧区间的帧中选择的估计系数的数据、以及通过对输入信号的低频信号进行编码而获得的低频编码数据，所述数据是基于下述操作的结果而生成的:基于输入信号的低频子带信号和预定估计系数来计算所述输入信号的高频子带信号的高频子带功率的估计值；基于从所述输入信号中提取的区间数确定特征量来确定在包括所述输入信号的多个帧的处理目标区间中的连续帧区间的数目，所述连续帧区间包括这样的帧，针对所述帧，选择相同的估计系数；以及在通过基于所确定的连续帧区间的数目分割所述处理目标区间而获得的每个所述连续帧区间中，基于所述估计值和所述高频子带功率来从多个估计系数中选择构成所述连续帧区间的帧的估计系数；通过对所述低频编码数据进行解码来生成低频信号；基于从所述数据获得的所述估计系数和从所述解码获得的所述低频信号来生成高频信号；以及基于所述高频信号和从所述解码获得的所述低频信号来生成输出信号。
19.一种程序，被配置成使计算机执行步骤: 将输入代码串解复用成用于获得在构成处理目标区间的每个连续帧区间的帧中选择的估计系数的数据、以及通过对输入信号的低频信号进行编码而获得的低频编码数据，所述数据是基于下述操作的结果而生成的:基于输入信号的低频子带信号和预定估计系数来计算所述输入信号的高频子带信号的高频子带功率的估计值；基于从所述输入信号中提取的区间数确定特征量来确定在包括所述输入信号的多个帧的处理目标区间中的连续帧区间的数目，所述连续帧区间包括这样的帧，针对所述帧，选择相同的估计系数；以及在通过基于所确定的连续帧区间的数目分割所述处理目标区间而获得的每个所述连续帧区间中，基于所述估计值和所述高频子带功率来从多个估计系数中选择构成所述连续帧区间的帧的估计系数；通过对所述低频编码数据进行解码来生成低频信号；基于从所述数据获得的所述估计系数和从所述解码获得的所述低频信号来生成高频信号；以及基于所述高频信号和从所述解码获得的所述低频信号来生成输出信号。
【文档编号】G10L19/02GK103765510SQ201280040029
【公开日】2014年4月30日申请日期:2012年8月14日优先权日:2011年8月24日
【发明者】山本优树, 知念彻申请人:索尼公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：山本优树;知念彻
技术所有人：索尼公司
我是此专利的发明人