编码设备和解码设备的制作方法

文档序号:2820991阅读:204来源:国知局
专利名称:编码设备和解码设备的制作方法
技术领域
本发明涉及采用一个诸如正交变换的方法通过用一个较少量的编码数据流对通过将时域中的音频信号、例如声音和音乐信号变换成频域内的信号所获得的信号进行编码来压缩数据的编码方法,以及用于在接收到编码数据流时扩展数据并获得音频信号的解码方法。
背景技术
目前已经开发出了几种对音频信号进行编码和解码的方法。特别地,近来,在ISO/IEC中被在国际上标准化的IS13818-7被公知并被高度评价为是一个具有高效率的再现高质量声音的编码方法。这个编码方法被称为高级音频编码(AAC)。近年来,AAC被采用在被称为MPEG4的标准中,并且已经开发出一个具有添加到IS13818-7的一些扩展功能的被称为MPEG-4 AAC的系统。在MPEG-4AAC的介绍部分描述了编码过程的一个例子。
下面是参考图1对于一个采用常规编码方法的音频编码设备的解释。图1是显示一个常规编码设备100的结构的方框图。编码设备100包括时间—频率变换单元101、频谱放大单元102、频谱量化单元103、霍夫曼编码单元104和编码数据流传输单元105。以预定时间间隔将一个通过以预定频率对一个模拟音频信号采样而获得的在时间轴上的数字音频信号分成各个预定数目的样本,并通过时间—频率变换单元101变换成频率轴上的数据,然后作为到编码设备100的输入信号送给频谱放大单元102。频谱放大单元102以一个特定增益放大在各个预定波带中包括的频谱。频谱量化单元103用一个预定的变换表达式对放大的频谱进行量化。在AAC方法的情况下,量化是通过将以浮点表示的频谱数据舍入成一个整数值来进行的。霍夫曼编码单元104根据霍夫曼编码对其一组特定条中的量化的频谱数据进行编码,并根据霍夫曼编码对频谱放大单元102中的各个预定频带中的增益以及指定用于量化的变换表达式的数据进行编码,然后将其代码发送到编码数据流传输单元105。将霍夫曼编码的数据流从编码数据流传输单元105通过一个传输信道或一个记录介质传输到一个解码设备,并由解码设备重构为时间轴上的音频信号。常规的编码设备的操作即如上所述。
然而,在常规的编码设备100中,压缩数据量的能力取决于霍夫曼编码单元104或类似单元的性能,因此在以高压缩率、即以少量数据进行编码时,需要充分提高频谱放大单元102中的增益,并对由频谱量化单元103获得的量化的频谱流编码,以使其是霍夫曼编码单元104中的一个较少量的数据。依据这个方法,如果编码是为了使数据量更少而进行的,则用于再现的声音和音乐的频率带宽实际上变得很窄。因此,不能否定,声音和音乐对于人的听觉来说将是沙哑的。其结果是,不可能保持声音质量。这是一个问题。
并且,在常规的编码设备100内,在时间—频率变换单元101中以每个预定间隔(样本数)将在时间轴上表示的输入信号变换成频率轴上表示的频谱。因此,在这个后一阶段用于编码的量化的信号是频率轴上的频谱。对一个量化过程来说,通过例如将频谱数据中的小数点值舍入成一个整数值的处理而具有一些量化误差是不可避免的。与在频率轴上容易估计在信号中产生的量化误差这个事实相反的是,在时间轴上则是困难的。由于这一点,不容易通过估计在时间轴上反映的量化误差来提高编码设备的时间分辨能力。并且,如果可分配给编码的数据量足够多,则有可能提高频率分辨能力和时间分辨能力。但如果分配用于编码的数据量较小,则在这两方面提高都是非常困难的。
考虑到上述问题,本发明的目的在于提供一种能够以高级别的时间分辨能力以高压缩比对一个音频信号编码的编码设备,以及一种能够对宽频带上的频谱数据解码的解码设备。

发明内容
依据本发明的编码设备是一个对通过依据时间—频率变换来变换一个输入初始信号而获得的在频域中的信号进行编码、并产生一个输出信号的编码设备,包括第一频带指定单元,可用于基于输入初始信号的特性为一部分频谱指定一个频带;时间变换单元,可用于根据频率—时间变换将指定频带中的一个信号变换成一个信号;以及,编码单元,可用于对由时间变换单元获得的信号和至少一部分频谱进行编码,并从编码信号和编码频谱产生一个输出信号。
并且,本发明的解码设备是一个对通过对一个输入初始信号编码而获得的编码数据流进行解码、并输出一个频谱的解码设备,包括解码单元,可用于提取在输入编码数据流中包含的编码数据流的一部分,并对提取出的编码数据流解码;频率变换单元,可用于将通过对提取出的编码数据流解码而获得的信号变换成一个频谱;以及,合成单元,可用于在频率轴上合成通过对从输入编码数据流的其他部分提取出的编码数据流解码而获得的一个频谱和由频率变换单元获得的频谱。
如上所述,依据本发明的编码设备和解码设备,通过在时域中的编码之外还增加时域中的编码,变得能够以较高的编码效率选择一个域中的编码并减少所输出的编码数据流的比特量。此外,通过增加时域中的编码,变得容易提高时间分辨能力以及频率分辨能力。
并且,依据本发明的编码设备和解码设备可以以低比特率提供一个宽频带的编码音频数据流。对于较低频率区域中的一个分量,其频率的微观结构通过采用一个诸如霍夫曼编码的压缩技术来编码。对于较高频率区域中的一个分量,只对通过用较低频率区域中的频谱替代较高频率区域中的频谱而再现的主要数据进行编码,而不对其微观结构编码,以使得由高频中的分量的编码所使用的数据量可以最少。
依据本发明的解码设备,由于高频区域中的分量是通过在再现音频信号时在解码过程中处理较低频率区域中的频谱的再现而产生的,所以可以容易地由低比特率来实现,并且可以在比由常规解码设备以同一比率再现的更宽的频带中再现声音。


图1是显示常规编码设备的结构的方框图。
图2是显示依据本发明的第一实施例的解码设备的结构的方框图。
图3是显示由图2所示的时间—频率变换单元进行的时间—频率变换的一个例子的示意图。
图4A是显示输入到时间—频率变换单元中的时域中的一个音频信号的示意图。在该示意图中,假定根据频率变换在某一时刻要变换一个在等效于第N帧的一部分中的信号。
图4B是显示对图4A所示的第N帧中的音频信号在某一时刻执行时间—频率变换而获得的一个频谱。
图5A是显示与图4A在同一时间轴上的音频信号的第N帧是如何被分成用于其第一半的子帧1和用于其第二半的子帧2的示意图。
图5B是显示通过将图5A所示的子帧1中的时域中的音频信号变换成频域中的一个信号而获得的频谱的示意图。
图5C是显示通过将图5A所示的子帧2中的时域中的音频信号变换成频域中的一个信号而获得的频谱的示意图。
图6A是显示与图4A相同的时域中的音频信号(第N帧)是如何被分成(M+1)段子帧的示意图。
图6B是显示通过将一帧中的音频输入信号分成(M+1)段子帧并由每个子帧执行时间—频率变换而获得的频谱的示意图。
图7A是显示通过对一帧中的音频信号在某一时刻执行时间—频率变换而获得的频谱上的频带BandA中包含的样本的示意图。
图7B是显示通过将一帧中的音频输入信号分成(M+1)段并由每个子帧对其执行时间—频率变换而获得的频谱上的频带BandB中包含的样本的示意图。
图8A是显示通过对一帧中的音频信号在某一时刻执行时间—频率变换而获得的频谱上的频带BandC中的样本的示意图。
图8B是显示通过将一帧中的音频输入信号分成(M+1)段子帧并由每个子帧对其执行时间—频率变换而获得的频谱上的频带BandD中的样本的示意图。
图9A是显示通过对一帧中的音频信号在某一时刻执行时间—频率变换而获得的频谱上的频带BandC中的样本的示意图。
图9B是采用水平轴上的时间和垂直轴上的频谱系数为图8B所示的每个样本(频谱系数)重绘的示意图。
图10是显示由图2所示的编码数据流产生单元对一个时间—频率信号编码的示意图。
图11是显示时间—频率变换单元的一个输出信号是如何对应于指示由一个时间变换单元依据时间变换而变换的频带的数据的示意图。
图12是显示依据本发明的第一实施例的解码设备的结构的方框图。
图13是显示依据本发明的第二实施例的编码设备的结构的方框图。
图14是显示参考其他频带在一个目标频带中产生一个编码数据流的方法的一个例子的示意图。
图15是显示参考其他频带在目标频带中产生编码数据流的方法的另一个例子的示意图。
图16是显示参考其他频带在目标频带中产生编码数据流的方法的其他例子的示意图。
图17是显示通过采用一个参考频带中的已经被量化和编码的编码数据流将一个目标域中的频谱在频域中合成的方法的一个例子的示意图。
图18是显示通过采用一个参考频带中的已经被量化和编码的编码数据流将一个目标域中的频谱在时域中合成的方法的一个例子的示意图。
图19A是显示一个指示通过将一个作为参考频带的频带A的频域中的一个信号变换成时域中的信号而获得的一个信号的向量Ta的示意图。
图19B是显示一个指示通过将一个作为参考频带的频带B的频域中的一个信号变换成时域中的信号而获得的一个信号的向量Tb的示意图。
图19C是对于通过在向量Ta上施加一个增益控制来指示一个近似于向量Tb的向量的情况,显示一个近似向量Tb’的示意图。
图20是显示依据第二实施例的解码设备的结构的方框图。
图21A是显示由图2所示的编码数据流产生单元产生的编码数据流的数据结构的一个例子的示意图。
图21B是显示由图13所示的编码数据流产生单元产生的编码数据流的数据结构的一个例子的示意图。
具体实施例方式
下面将参考附图(图2~图20)解释依据本发明的实施例的编码设备和解码设备。
(第一实施例)图2是显示依据本发明的第一实施例的编码设备200的结构的方框图。编码设备200是一个提取出在时间轴上表示的音频输入信号的时间特性并在基于提取出的时间特性将一个频谱的一部分部分地变换成时域中的一个频率信号之后编码的编码设备,包括时间—频率变换单元201、频率特性提取单元202、时间特性提取单元203、时间变换单元204和编码数据流产生单元205。
时间—频率变换单元201将音频输入信号从时间轴上的一个离散信号变换成具有规则间隔的频谱数据。更具体地,时间—频率变换单元201例如基于作为一单位的一帧(1024个样本)变换在时域中的某一时刻的音频信号,并作为变换结果为1024个样本或类似产生一个频谱系数。MDCT变换或类似被用作时间—频率变换,并作为变换结果产生一个MDCT系数或类似。从其向时间变换单元204输出由时间特性提取单元203指定的频带中的多个频谱系数,并向频率特性提取单元202输出频带中的其他频谱系数。
频率特性提取单元202提取出频谱的频率特性,基于提取出的特性对于频域中的量化和编码的情况选择一个带有较差的编码效率的频带,将其从由时间—频率变换单元201输出的频谱划分出来,并将其输出到时间变换单元204。将除此之外的频带的频谱输入到编码数据流产生单元205。
时间特性提取单元203分析音频输入信号的时间特性,判定当在编码数据流产生单元205进行量化时是时间分辨能力优先还是频率分辨能力优先,并指定一个其中判定时间分辨能力优先的频带。时间变换单元204采用一个全部可逆的变换表达式将在其中判定时间分辨能力优先的频带中的频谱和由频率特性提取单元202选择的频带中的频谱变换成一个被指示为频谱系数中的时间改变的时间—频率信号。在因而量化了从时间—频率变换单元201输入的频谱以及从时间变换单元204输入的时间—频率信号之后,编码数据流产生单元205对其进行编码。此外,编码数据流产生单元205将诸如标题的附加数据附在编码数据上,并根据一个预定格式产生一个编码数据流,将产生的编码数据流输出到编码设备200的外部。
图3是显示由图2所示的时间—频率变换单元201进行的时间—频率变换的一个例子的示意图。例如,如图3所示,时间—频率变换单元201以允许一些重叠的规则的时间间隔在时间轴上划分离散信号,并执行变换。与第N帧(N是一个正整数)形成对比,图3显示了通过允许第(N+1)帧的一半与第N帧重叠来提取出第(N+1)帧并对其进行变换的情况。一般来说,时间—频率变换单元201通过改进的离散余弦变换(MDCT)来变换数据。然而,时间—频率变换单元201的变换方法并不限于MDCT。它可以是多相滤波器或傅立叶变换。由于相关领域技术人员熟悉MDCT、多相滤波器和傅立叶变换中的任何一种,因此这里省略对它们的解释。
图4A是显示输入到时间—频率变换单元201的时域中的音频信号的示意图。假设在同一图中在某一时刻对在等效于第N帧的部分中的信号进行了频率变换。图4B是显示通过对图4A所示的第N帧中的音频信号在某一时刻执行时间—频率变换而获得的一个频谱的示意图。这个示意图是采用垂直轴上的频率和水平轴上的用于该频率的频谱系数值而绘出的。如图所示,对于第N帧的时域中的信号被变换成频域中的信号。图4B所示频谱指示在图4A所示的一帧持续时间内在音频信号中包含的一个频率分量的特性。当在时间—频率变换单元201中采用MDCT时,时域中的信号和频域中的信号具有相同数目的有效样本。关于有效样本的数目,在MDCT的情况下,如果图4A所示的第N帧中的样本数目是2048个样本,则图4B所示的独立频率系数(MDCT系数)的数目是1024个样本。然而,因为MDCT是一种如图3所示各帧由其他帧的一半覆盖的算法,因此在图4A中新输入的样本数目是1024个样本。因此,图4A和图4B中的样本数目在每个数据量方面被认为是相同的,因此基于这一点将有效样本的数目看作是1024。第N帧中的有效样本的数目可以如上所述是1024,但也可以是128或其他任何任意值。这个值是在本发明的编码设备200和解码设备之间预先确定的。
另一方面,除了时间—频率变换单元201之外,音频输入信号还被输入到时间特性提取单元203。时间特性提取单元203分析一个给定音频输入信号的时间改变,并在音频输入信号被量化时判定是时间分辨能力应该被优先还是频率分辨能力应该被优先。也就是说,时间特性提取单元203判定音频输入信号应该在频域还是在时域中被量化。这意味着当量化发生在时域中时,音频输入信号的时间改变由时域中的信号通知给解码设备。这进一步基于下面的事实a)量化带有一些量化误差;以及b)虽然当量化发生在频域时,误差可以存在于频域中的一特定值范围内,但难以掌握误差分布在时域中的哪一值范围内。这是由于当量化在频域中进行时可以执行高频率分辨能力、而当量化发生在时域中时可以执行高时间分辨能力的原因。并且,当一帧给定音频输入信号被分成多个时间子帧时,在属于每个子帧的信号的平均能量与其相邻子帧的平均能量相比有大的改变的情况下,假设在音频输入信号的音量上已经有一个迅速的改变,例如一个冲击。在这种情况下,量化误差在时域上散布不是更可取的。由于这一点,时间特性提取单元203判定在这样的频带上的量化上给予时间分辨能力比频率分辨能力高的优先权。根据编码设备的实施方法定义时间特性提取单元203在判定平均能量中的改变大时所使用的阈值(例如,对于在相邻子帧之间的平均能量差的阈值)。然后,时间特性提取单元203为音频输入信号指定一个应该在时域中对其完成量化的频带。频带和带宽的选择不限于上面的情况。关于指定频带的方法,首先,指定在时域中的一个包含一个给出最大振幅的样本的信号(峰值信号),并计算峰值信号的频率。此外,时间特性提取单元203例如根据峰值信号的大小确定一个带宽,并指定具有所确定的带宽的一个频带,包括作为计算结果而获得的频率或一个与其接近的频率。在时间特性提取单元203中,将对于时间分辨能力被优先还是频率分辨能力被优先的判定结果以及指示指定频带的数据输出到时间—频率变换单元201和编码数据流产生单元205。
频率特性提取单元202分析作为时间—频率变换单元201的输出信号的频谱的特性,并指定一个最好在时域中被量化的频带。例如,考虑编码数据流产生单元205中的编码效率,有编码效率在一个其中相邻频谱系数在频谱中广泛散布的频带或一个其中相邻频谱系数的正负代码被频繁切换或类似的频带中未被提高的多个情况。因此,频率特性提取单元202从输入的频谱对一个可用于这些的频带采样,将其输出到时间变换单元204,并且还将一个不可应用于这些的频带象现在这样输出到编码数据流产生单元205。同时,将指定输出到时间变换单元204的频带的数据输出到编码数据流产生单元205。
在编码数据流产生单元205,合并频率特性提取单元202的输出信号(指定频谱和频带的数据)、时间特性提取单元203的判定结果和指定频带的数据以及时间变换单元204的输出信号(一个频率—时间信号),并产生编码数据流。
图5A是显示在与图4A中的一个相同的时间轴上的音频信号中如何将一个第N帧分成用于其第一半的子帧1和用于其第二半的子帧2的示意图。虽然示意图显示了子帧1和子帧2具有相同长度的情况,但其长度不必是相同的,或者可以彼此重叠。此后,恰如图5所示,采用子帧1和子帧2具有相同长度的情况来简化解释。
图5B是显示通过将图5A所示的子帧1的时域中的音频信号变换成频域中的一个信号而获得的频谱的示意图。图5C是显示通过将图5A所示的子帧2的时域中的音频信号变换成频域中的一个信号而获得的频谱的示意图。从时域到频域的变换是仅仅采用每个子帧中的音频信号来进行的,并假定由变换获得的频域中的信号(频谱)通过执行其逆变换(频率—时间变换)将被完全恢复成时域中的初始信号。有离散傅立叶变换和离散余弦变换可用作这种频率变换方法。由于它们与相关领域技术人员所熟悉的类似,所以这里省略其说明。前面提到的MDCT变换是将具有时间上的一些相互重叠的一帧中的时域中的信号变换成频域中的一个信号。然而,这引起用于重构时域中的信号的延迟,使得它不能用于导出图5B和图5C中的频谱的情况。由于引起一个延迟的同样的原因,不使用多相滤波器或类似方法。
由于图5B和图5C中的第N帧中的频谱被分成帧的第一半和第二半,在子帧1和子帧2中分别包含的样本数等于该帧中的样本数量的一半。图5A和图5B中的频谱的样本数分别等于帧中的样本数量的一半,因此这些图在频率轴方向以样本的双倍间隔显示了与图4B所示频带相同频带中的频率分量的比率中的改变。如图4B所示,当在某一时刻对该帧中的音频输入信号执行时间—频率变换时,获得了显示出在该帧中的整个音频输入信号中包含的频率分量的一个比率的频谱。但如图5B和5C所示,如果该帧中的音频输入信号被分成根据时间—频率变换将其分别变换成的第一半和第二半,则显然在每部分音频信号中包含的频率分量的比率在音频输入信号的第N帧的第一半和第二半之间是不同的。也就是说,图5B和图5C所示的频谱表明了在第N帧的第一半和第二半中的音频信号的频率分量的比率中的时间改变。
上述的图5B和图5C显示了在将第N帧分成两个子帧并对每个子帧执行时间—频率变换的情况下的频谱的例子。下面参考图6A和图6B描述将第N帧进一步分成(M+1)段更小的子帧的情况。图6A是显示如何将与图4A相同的时域中的音频信号(第N帧)分成(M+1)段子帧的示意图。图6B是显示通过将一帧中的音频输入信号分成(M+1)段子帧并对每个子帧执行时间—频率变换而获得的频谱的示意图。在图6A和图6B中,将在任意位置(例如,第P个位置(P是一个整数))的子帧的时域中的一个信号SubP变换成一个由至少相同数目的样本或更多样本组成的频谱系数Spect_SubP。下面假设将其变换成包含相同数目的样本的频谱以简化解释。以与此类似的方式,当图6B所示的(M+1)段频谱(频谱系数Spect_Sub0~频谱系数Spect_SubM)与图5B和图5C所示的频谱相比较,虽然样本间隔在频率轴方向上变得更宽,但在时间轴方向上更详细地指示了第N帧的频率分量中的时间改变。
接着,下面采用图7A和图7B描述通过对一帧中的音频输入信号执行时间—频率变换而获得的频谱如何对应于通过由每个子帧执行时间—频率变换而获得的频谱。图7A是显示在通过对该帧中的音频信号在某一时刻执行时间—频率变换而获得的频谱上的频带BandA中包含的一个样本的示意图。图7A的频谱与图4B所示的频谱相同。并且,图7B是显示在通过将该帧中的音频输入信号分成(M+1)段子帧并由每个子帧执行时间—频率变换而获得的频谱上的频带BandB中包含的一个样本的示意图。也就是说,图7B中的频谱与图6B中所示的频谱相同。图7A中的频谱的频带BandA和图7B中的频谱的频带BandB指示相同的频带区域。也就是说,在整个帧中,在频带BandA中包含的样本数等于在频带BandB中包含的样本数。这表明图7A的频带BandA中的频谱系数的数据(图中的黑菱形)等效于图7B的频带BandB中的所有子帧中的频谱系数中的一个(图中的黑菱形)。这里,不需要通过以一个变换表达式对频带BandA中的频谱系数执行时间变换来获得与频带BandB中的频谱系数完全一致的频谱系数。频带BandA中的频谱系数等效于频带BandB中的频谱系数是重要的。因此,可以考虑用表达在频带BandB中的所有子频带中的样本(频谱系数)来替代对频带BandA中的每个样本(频谱系数)的描述。也就是说,在依据本发明的第一实施例的编码设备200中,对于其中判定时间分辨能力被优先的频带BandA,频带BandB中的频谱系数被量化和编码,而不是对频带BandA中的频谱系数量化和编码。也就是说,时间变换单元204例如对由时间—频率变换单元201获得的频谱中的其中判定时间分辨能力被优先的频带BandA执行一个等效于DCT变换的逆变换(频率—时间变换)的变换表达式,并输出一个等效于图7B所示的频带BandB中的所有样本(频谱系数)的频谱系数。
依据图7A和图7B所指示的频带BandA和频带BandB的带宽,为了更好地理解对于时间变换单元204的时间变换方法的解释,下面利用图8A和图8B描述当将频带BandD的带宽选择为在每个子频带中刚好具有属于频带BandD的一段样本时的情况。图8A是显示通过对一帧中的音频信号执行时间—频率变换而获得的频谱上的频带BandC中的一个样本的示意图。图8B是显示通过将一帧中的音频输入信号分成(M+1)段子帧并由每个子帧对其执行时间—频率变换而获得的频谱上的频带BandD中的一个样本的示意图。图8A中的频谱与图4B中所示的频谱相同,图8B中的频谱与图6B中所示的频谱相同。并且,图8A中的频谱中的频带BandC和图8B中的频谱中的频带BandD显示了相同的频带。在图8B中,当将频带BandD的带宽选择为在每个(M+1)段子频带中具有属于频带BandD的一段样本(频谱系数)时,与图8A所示的频谱中的频带是同一频带的频带BandC中的样本数是(M+1)段。因为属于图8B所示的频带BandD的每个样本是从每个(M+1)段子帧选择出的,如果采用水平轴上的时间和垂直轴上的频谱系数绘出每个样本,则可以说它指示了在音频信号的一帧中的属于频带BandC中的频谱系数中的时间改变。
与图8A类似,图9A是显示通过对一帧中的音频信号在某一时刻执行时间—频率变换而获得的频谱上的频带BandC中的一个样本的示意图。图9B是采用水平轴上的时间和垂直轴上的频谱系数值为图8B所示的每个样本(频谱系数)重绘的示意图。已经解释过,如图9B所示的重绘的、通过在同一频带BandD中的(M+1)段子帧的每一个提取出一个样本而组成的信号等效于由时间变换单元204获得的时间—频率信号,并且是指示有关频带BandD的频谱系数的时间改变的时间—频率信号。如上所述,图9A所示的频带BandC中的每个样本(频谱系数)可以被看待为与图9B中的时间—频率信号(频带BandD)几乎相同的数据。因此,在下面的解释中,将量化图9A中的频谱系数指示为“执行Qf”,将量化图9B中的时间—频率信号指示为“执行Qt”。
在依据本发明的第一实施例的编码设备200内的图2所示的时间变换单元204中,由时间—频率变换单元201获得的频谱的频谱系数的一部分、即在图9A中的频带BandC中包含的频谱系数流被变换成图9B中的时域中的时间—频率信号。经过这个变换等效于从图8A中的频带BandC中包含的频谱系数流到图8B中的频带BandD中包含的频谱系数流的变换,这已经在前面解释过了。或者,等效于从图7A中的频带BandA中的频谱系数流到图7B 中的频带BandB中的频谱系数流的变换。
图2所示的编码数据流产生单元205对经过如上变换的来自时间—频率变换单元201的输出和来自时间变换单元204的输出进行量化和编码,并输出编码数据流。关于编码数据流产生单元205中的量化和编码的具体方法,使用诸如霍夫曼编码和向量量化的公知技术。
并且,编码数据流产生单元205可以将位于具有较小振幅波动的一部分中的时间—频率信号的几段样本分成组,然后对每组的平均增益进行量化和编码。图10是显示由图2所示的编码数据流产生单元205对时间—频率信号的编码的示意图。如图10所示,编码数据流产生单元205例如分别为一个从频谱系数Spec_Sub_0到频谱系数Spec_Sub_2的样本组和一个从频谱系数Spec_Sub_3到频谱系数Spec_Sub_M的样本组找到平均增益Gt1和平均增益Gt2,并对指定每个样本组和每个组中的平均增益的数据进行量化和编码,而不是对从频谱系数Spec_Sub_0到频谱系数Spec_Sub_M的时间—频率信号本身进行量化和编码。在这种情况下,如果时间—频率信号在编码设备200和对从编码设备200输出的编码数据流解码的解码设备之间被预先限定为例如表达为“样本组中的第一样本号,样本组中的最后一个样本号,样本组中的平均增益”,则图10所示的时间—频率信号可以表达为两个数据组(0,2,Gt1)和(3,M,Gt2)。并且,在这种情况下,不需要为时间—频率信号将全部每个样本都聚集起来。可以只将在具有较小振幅波动的部分中的样本聚集起来。对于具有极端(radical)振幅波动的部分,每个样本中的频谱系数值本身可以被量化和编码。
此外,在编码数据流产生单元205中,指示哪个频带被进行时间变换的数据与时间—频率变换单元201的输出中的编码数据流一起输出。图11是显示时间—频率变换单元201的一个输出信号是如何对应于指示由时间变换单元204进行了时间变换的频带的数据的示意图。在同一图中,垂直轴显示频率,水平轴显示对应于垂直轴上的频率的频谱系数。在时间—频率变换单元201中采用MDCT变换的情况下,频谱系数在同一图中指示MDCT系数。并且,在作为时间—频率变换单元201的输出信号的频谱中,虚线所示部分是未被编码数据流产生单元205量化和编码的部分。相反,在编码数据流产生单元205中,对应于这个频带的时间—频率信号被量化和编码。同一图描述了对于将频率轴方向分成5个频带、并从其低频开始按照Qf、Qt、Qf、Qt和Qf的顺序进行量化的情况的一个例子。这样,从编码数据流产生单元205输出的编码数据流至少包括指示每个频带是在时域中还是在频域中被量化和编码的数据以及在每个频带中被编码和量化的数据。频带划分的数目和在编码设备200中的用于每个频带的量化方法(即,是Qf还是Qt)不是固定的,并不限于这个例子。
图12是显示依据本发明的第一实施例的解码设备1200的结构的方框图。这个解码设备1200是一个对编码设备200输出的编码数据流解码、并输出一个具有高级别的时间分辨能力的音频信号的解码设备,包括编码数据流分离单元1201、时间—频率信号产生单元1202、频率变换单元1 203、频谱产生单元1204和频率—时间变换单元1205。编码数据流分离单元1201从作为输入信号的编码数据流分离出在指示为“Qf”的频带中的编码数据和在指示为“Qt”的频带中的编码数据,将在指示为“Qf”的频带中的编码数据输出到频谱产生单元1204,将在指示为“Qt”的频带中的编码数据输出到时间—频率信号产生单元1202。在指示为“Qf”的频带中的编码数据是在编码设备200中在频域量化和编码的数据。在指示为“Qt”的频带中的编码数据是在编码设备200中在时域量化和编码的数据。
频谱产生单元1204对输入的编码数据解码,进一步对其反量化,并产生频率轴上的一个频谱。另一方面,时间—频率信号产生单元1202对输入的编码数据解码,对其反量化,并在时间上产生时间轴上的一个时间—频率信号。在时间上产生的时间—频率信号被输入到频率变换单元1203。频率变换单元1203通过采用一个等效于由编码设备200的时间变换单元204所采用的变换表达式的逆变换的变换表达式以数目小于一帧中的样本数的多个样本为单位将输入的时间—频率信号从时域中的频谱系数变换到频域中的频谱系数。将指示时间—频率信号中所表达出的时间改变的数据反映在作为依据上面的描述对该帧的部分变换的结果而获得的频谱系数上,并将这个频谱系数输出到频率—时间变换单元1205。在频率—时间变换单元1205中,将作为频谱产生单元1204和频率变换单元1203的输出信号的频域中的频谱在频率轴上合成,并变换成在时间轴上的一个音频信号。这样,由时间—频率信号表达的时间分量可以反映在从频谱产生单元1204输出的频谱上,并且可以获得一个具有高时间分辨能力的音频信号。在频率—时间变换单元1205,使用一种是在编码设备200进行的时间—频率变换单元201的逆过程的变换方法。例如,如果在编码设备200中的时间—频率变换单元201中使用MDCT变换,则在频率—时间变换单元1205中使用逆MDCT变换。以这种方式获得的频率—时间变换单元1205的输出例如是一个由电压上的离散时间改变所表达的一个音频输出信号。
如上所述,依据本发明的第一实施例中的编码设备200和解码设备1200,可以选择是在时域还是在频域中对一个任意频带的一特定时间帧中的音频信号进行编码。因此,这个方法提供了比仅仅在频域中的编码方法或仅仅在时域中的编码方法更灵活和更有效的数据编码的可能性。其结果是,使得能够在一给定量的数据内对许多数据编码,并实现高质量的再现音频信号。
虽然在第一实施例中时间特性提取单元203判定当子帧之间的平均能量的改变(即,相邻子帧之间的差)大于预先限定的阈值时时间分辨能力应该被优先,但时间特性提取单元203判定是时间分辨能力被优先还是频率分辨能力被优先的判决标准并不限于上述方法。并且,在上面的实施例中,虽然频率特性提取单元202判定对于其中邻接频谱系数在频谱上广泛散布的频带或其中正负代码被频繁切换的频带应该实现时域中的量化,但对这个判决的判决标准也不限于上述方法。
(第二实施例)下面描述本发明的第二实施例。第二实施例中的量化和编码方法与第一实施例中的不同。在第一实施例中,对于由每帧变换到频域中的音频输入信号,该帧中的一特定频带中的信号象现在这样被量化,但另一个频带中的信号被重新变换到时域中,然后量化时域中的信号。在本发明的第二实施例中,不是仅仅用选定频带中的信号实现量化和编码,而是由其他频带中的信号执行量化和编码。
图13是显示依据本发明的第二实施例的编码设备1300的结构的方框图。编码设备1300包括时间—频率变换单元1301、频率特性提取单元1302、时间特性提取单元1303、量化和编码单元1304、参考频带判定单元1305、时间变换单元1306、时间合成和编码单元1307、频率合成和编码单元1308和编码数据流产生单元1309。在同一图中,时间—频率变换单元1301、频率特性提取单元1302、时间特性提取单元1303和时间变换单元1306分别与图2所示的编码设备200中的时间—频率变换单元201、频率特性提取单元202、时间特性提取单元203和时间变换单元204几乎是相同的。
音频输入信号以一特定时间长度的每一帧被输入到时间—频率变换单元1301和时间特性提取单元1303。时间—频率变换单元1301将时域中的输入信号变换成频域中的一个信号。时间—频率变换单元1301例如采用MDCT变换来获得一个MDCT系数。
频率特性提取单元1302分析作为时间—频率变换单元201的输出的由每帧变换的频谱系数的频率特性,并以与图2中的频率特性提取单元202相同的方式指定一个最好以给予时间分辨能力优先权来量化的频带。
以与图2中的时间特性提取单元203相同的方式,时间特性提取单元1303判定是时间分辨能力应该被优先还是频率分辨能力应该被优先来在每帧量化音频信号输入。在时间特性提取单元1303,因为不需要以相同的时间分辨能力或相同的频率分辨能力对输入信号的所有频带量化和编码,所以可以由每个子帧或每个频带来作出判决。
对于由时间—频率变换单元1301获得的频域中的信号(频谱系数),量化和编码单元1304由每个预先限定的频带对信号量化和编码。这个量化和编码单元1304采用相关领域的技术人员所熟悉的公知技术、例如向量量化和霍夫曼编码对数据量化和编码。量化和编码单元1304在内部包含一个在图中未显示的存储器,将已经被编码的编码数据流和编码之前的频谱保存在其存储器中,并将在由参考频带判定单元1305判定的频带中的编码数据流或编码之前的频谱输出到参考频带判定单元1305。
依据频率特性提取单元1302和时间特性提取单元1303的判决结果,参考频带判定单元1305判定在作为量化和编码单元1304的输出的编码数据流中的应该为由频率特性提取单元1302和时间特性提取单元1303指定的频带而参考的一个频带。具体地,对于由时间特性提取单元1301指定的频带,参考频带判定单元1305只在时域中对第一个指定频带量化和编码,而不参考其他频带,并参考频带中的频谱在时域中对剩余频带进行编码。此外,对于由频率特性提取单元1302指定的频带,如果等效于一个整数的倍数(即,谐音的关系)的信号分量的频谱系数被包含在由频率特性提取单元1302指定的频带中,则参考频带判定单元1305在频域中例如仅仅对包括频谱系数的频带中的包含一个最低频率的分量(频谱系数)的频带进行量化和编码。例如,如果8kHz、16kHz和24kHz的频率分量分别被包含在由频率特性提取单元1302指定的频带中,则只对包含8kHz的频率分量的频带进行量化和编码。对于除此之外的任何频带,例如包含16kHz的频率分量的频带和包含24kHz的频率分量的频带,判定将参考作为参考频带的包含最低频率(8kHz)的分量(频谱系数)的频带来在频域中对其编码。如果未包含等效于由频率特性提取单元1302指定的频带中的谐音的频谱系数,则频率特性提取单元1302判定不参考其他频带在时域中对这些频带量化和编码。
接着,参考图14到16描述参考频带判定单元1305的行为。图14是显示用于参考其他频带产生一个目标频带的编码数据流的方法的一个例子的示意图。垂直轴显示频率,水平轴显示图中的频率的频谱系数值。在图14中,频带Base1和频带Base2都是其频域信号(频谱)的系数已经被量化和编码单元1304量化和编码的频带的一部分。另一方面,在指示为“Qt1”和“Qt2”的频带中的信号的含义是分别采用频带Base1和频带Base2的频谱系数进行量化和编码的信号。例如,“Qt1”意味着采用频带Base1的信号根据时域变换被量化和编码,“Qf2”意味着采用Base2的信号在频域被量化和编码。此外,采用Base1的频带信号来表达“Qt1”的参数被定义为参数Gt1,采用频带Base2的频带信号来表达“Qf2”的参数被定义为参数Gf2。这意味着频带“Qt1”中的信号由在时域中表达的频带Base1的频带中的信号用参数Gt1所指示的参数来量化和编码,频带“Qf2”中的信号由在频域中表达的频带Base2的频带中的信号(但不需要变换,因为它已经被在频域中表达)用参数Gf2所指示的参数来量化和编码。然而,用于划分频带的方法、其顺序和数量并不限于这些。
图15是显示用于参考其他频带产生目标频带的编码数据流的方法的另一个例子的示意图。与在图15中的情况一样,信号“Qt”可以通过采用已经分别用参数Gt1和参数Gt2在量化和编码单元1304中量化和编码的频带Base1和频带Base2这两个频带(在时域中表达)由加法之和来表达。图16是显示用于参考其他频带产生目标频带的编码数据流的方法的其他例子的示意图。与在图16中的情况一样,信号“Qf”可以通过采用已经分别用参数Gf1和参数Gf2在量化和编码单元1304中量化和编码的频带Base1和频带Base2这两个频带(在频域中表达)由加法之和来表达。图15和图16中的任一种情况显示了采用已经被量化和编码的两个频带中的信号来对一特定频带量化和编码的情况,但频带数并不限于两个。在参考频带判定单元1305中,一帧中的频谱系数中的由时间特性提取单元203指定的要进行量化和编码的频带(目标频带)通过采用由量化和编码单元1304量化和编码的任一个频带(参考频带)来表达,并判定是否要对其进行量化和编码。
接着,参考图17解释频率合成和编码单元1308。图17是显示通过采用一个被参考频带中的已经被量化和编码的编码数据流将一个目标域中的频谱在频域中合成的方法的一个例子的示意图。如上所述,假设参考频带和目标频带中的信号已经被参考频带判定单元1305选择。在图17中,频带A是参考频带,频带B是目标频带。为了简化解释,频带A中的信号和频带B中的信号分别由相同数目的元素组成,并分别被描述为向量Fa和向量Fb。另外,将每个向量分成两个,即,向量Fa=(Fa0,Fa1),向量Fb=(Fb0,Fb1)。Fa0、Fa1、Fb0和Fb1是向量。Fa0的元素数与Fb0的元素数相同,Fa1的元素数与Fb1的元素数相同。Fa0的元素数可以与Fa1的元素数相同也可以不同。定义一个参数Gb=(Gb0,Gb1)。参数Gb是一个向量,但Gb0和Gb1是标量值。采用向量Fa和参数Gb将作为向量Fb的近似的向量Fb’定义为下面的公式 Fb’=Gb*Fa=(Gb0*Fa0,Gb1*Fa1)以这种方式,通过从目标频带A的频域中的信号乘以控制合成比的参数Gb获得一个乘积来合成频带B的频域中的信号。此外,频率合成和编码单元1308对显示哪一参考频带表达一特定目标频带的数据以及用于在所参考频带上的增益控制的参数Gb进行量化和编码。为了简化解释,已经描述了目标频带和参考频带被分成两个向量的情况。但它们也可以被分成少于两个或多于两个。并且,对频带的划分可以是均匀的或不均匀的。
下面参考图18描述时间合成和编码单元1307。图18是显示通过采用参考频带中的已经被量化和编码的编码数据流将目标域中的频谱在时域中合成的方法的一个例子的示意图。如上所述,假设参考频带中的一个信号和目标频带中的一个信号已经由参考频带判定单元1305选择。在图18中,假设频带A是参考频带,频带B是目标频带。为了简化解释,频带A中的信号和频带B中的信号分别由相同数目的元素组成。时间变换单元1306以与第一实施例的时间变换单元204相同的方式将频带A和频带B中的频域中的信号变换成时域中的信号(Tt)。这里,假设通过变换频带A和频带B的频域中的信号而获得的信号分别是向量Ta和向量Tb。另外,向量Ta和向量Tb可以被划分如下Ta=(Ta0,Ta1);Tb=(Tb0,Tb1)。Ta0、Ta1、Tb0、Tb1是向量。Ta0的元素数与Tb0的元素数相同,Ta1的元素数与Tb1的元素数相同。然而,Ta0的元素数与Ta1的元素数可以相同也可以不相同。并且,这里定义参数Gb=(Gb0,Gb1)。Gb0和Gb1分别是标量值。图19A、图19B和图19C是显示通过采用向量Ta作为频带A的时域中的信号来将向量Tb近似为频带B的时域中的信号的方法的一个例子的示意图。图19A是显示表达通过将作为参考频带的频带A的频域中的信号变换成时域中的信号而获得的信号的向量Ta的示意图。图19B是显示表达通过将作为目标频带的频带B的频域中的信号变换成时域中的信号而获得的信号的向量Tb的示意图。图19C是对于通过在向量Ta上执行一个增益控制来表达一个近似于向量Tb的向量的情况显示一个近似向量Tb’的示意图。如图19A、图19B和图19C所示,参数Gb的值被确定为使得向量Ta乘以Gb近似于向量Tb。
例如,采用向量Ta和参数Gb将近似向量Tb’定义为下面的公式[公式2]Tb’=Gb*Ta=(Gb0*Ta0,Gb1*Ta1)以这种方式,由参考频带A的时域中的信号与执行增益控制的参数Gb来合成目标频带B的时域中的信号。因此,在时间合成和编码单元1307中,对显示哪一参考频带被用于表达一特定目标频带的数据以及用于在所参考频带上的增益控制的参数Gb进行量化和编码。为了简化解释,已经描述了目标频带和参考频带被分成两个向量的情况。但它们也可以被分成少于两个或多于两个。并且,对频带的划分可以是均匀的或不均匀的。
在编码数据流产生单元1309中,根据一个预定格式将量化和编码单元1304、频率合成和编码单元1308、时间合成和编码单元1307、频率特性提取单元1302和时间特性提取单元1303的输出打包,并与其一起产生编码数据流。因此,作为编码设备1300的输出信号的编码数据流包含下面的数据1.通过对一个参考频带和一个既不是参考频带也不是目标频带的频带中的信号进行量化和编码而获得的数据;2.指示参考频带和目标频带之间的关系的数据;3.指示如何采用参考频带中的信号对目标频带进行量化和编码的数据;4.指示在哪个域、时域或频域中参考频带、目标频带和一个被分类为不是这两个中的任一种的频带被量化和编码的数据;等等。并且,参考频带和目标频带中的样本数和与每个频带相关的频率被直接或间接包含在编码数据流中。
下面参考图20描述依据本发明的第二实施例的解码设备2000。图20是显示依据第二实施例的解码设备2000的结构的方框图。这个解码设备2000是一个对编码设备1300产生的编码数据流解码并输出一个音频输出信号的解码设备,包括编码数据流分离单元2001、参考频率信号产生单元2002、时间变换单元2003、时间合成单元2004、频率变换单元2005、频率合成单元2006和频率—时间变换单元2007。解码设备2000中的频率—时间变换单元2007、时间变换单元2003和频率变换单元2005与第一实施例中的频率—时间变换单元1205、时间变换单元1306和频率变换单元1203分别具有相同的结构。编码数据流分离单元2001读取输入编码数据流中的一个标题等,并分离出在编码数据流中包含的下列数据1.通过对一个参考频带和一个既不是参考频带也不是目标频带的频带中的信号进行量化和编码而获得的数据;2.指示参考频带和目标频带之间的关系的数据;3.指示如何采用参考频带中的信号对目标频带进行量化和编码的数据;4.指示在哪个域、时域或频域中参考频带和目标频带被量化和编码,并将其输出到每个对应单元中的数据。参考频率信号产生单元2002使用相关领域的技术人员所熟悉的公知的解码方法、例如霍夫曼解码,并对频域中的信号编码。这意味着图14到图16中的Base1和Base2的信号被解码。并且,这意味着图17和图18中的频带A的频域中的信号被解码。
下面参考图17解释频率合成单元2006的行动。如图17所示,被表达为频带A中的向量Fa的频域中的信号(频谱)是通过在参考频率信号产生单元2002中对从编码数据流分离单元2001输入到参考频率信号产生单元2002的参考频率中的数据进行解码和反量化而获得的。另一方面,被表达为频带B中的向量Fb的频域中的信号(频谱)由依据公式1采用向量Fa和参数Gb合成的近似向量Fb’来近似。用于增益控制的参数Gb是通过在编码数据流分离单元2001中从编码数据流分离出来而获得的,指示频带A是频带B的参考频带的数据也是通过在编码数据流分离单元2001中从编码数据流分离出来而获得的。这样,在频率合成单元2006,通过产生近似向量Fb’来产生作为参考频带的频带B的频域中的信号Fb。
接着,参考图18解释时间合成单元2004的行动。在图18中,由向量Ta所指示的频带A的时域中的信号(时间—频率信号)是通过由时间变换单元2003对由参考频率信号产生单元2002获得的向量Fa所指示的频谱执行时间变换(图18中的过程Tf)而获得的。并且,在作为目标频带的频带B中的由向量Tb所指示的时域中的信号(时间—频率信号)由近似向量Tb’来近似。这个近似向量Tb’根据公式2由向量Ta和参数Gb组成。这样,在时间合成单元2004中,通过产生近似向量Tb’来产生作为目标频带的频带B的时域中的信号Tb。用于增益控制的参数Gb和指示频带A是频带B的参考频带的数据是从编码数据流分离单元2001获得的。由时间合成单元2004获得的表示为近似向量Tb’的时域中的信号被频率变换单元2005变换成频域中的一个信号。在频率—时间变换单元2007中,将参考频率信号产生单元2002、频率合成单元2006和频率变换单元2005的输出合成为频率轴上的一个信号分量。此外,频率—时间变换单元2007对所合成的频谱执行编码设备1300的时间—频率变换单元1301的时间—频率变换的逆变换,并获得时域中的音频输出信号。频率—时间变换单元2007中的频率—时间变换(例如,逆MDCT变换)可以用相关领域的技术人员所熟悉的公知技术来容易地实现。
图21A是显示由图2中的编码数据流产生单元205产生的编码数据流的数据结构的一个例子的示意图。图21B是显示由图13中的编码数据流产生单元1309产生的编码数据流的数据结构的一个例子的示意图。在图21A和21B中所示的每个频带的带宽可以是也可以不是固定带宽。在第一实施例的编码设备200中,由频率特性提取单元202和时间特性提取单元203指定的频带中的频谱在由时间变换单元204进一步变换成一个时间—频率信号之后被量化和编码。除此之外的任何频带在作为该频谱时被量化和编码。例如,图21A显示了由频率特性提取单元202和时间特性提取单元203指定的频带是频带1和频带4的情况。如图21A和21B所示,在每个频带前面描述一个标题。在图21A中,在每个标题中描述一个标志,显示出在哪个域、是时域还是频域中对频带中的编码数据流进行量化和编码的。例如,在频带1和频带4的标题中分别描述了标志qm=t,显示出频带1和频带4中的编码数据流t_quantize在时域中被量化和编码。并且,在频带2和频带3的标题中描述了标志qm=f,显示出频带2和频带3中的编码数据流f_quantize在频域中被量化和编码。这里,编码数据流f_quantize和编码数据流t_quantize是通过分别在频域和时域中对频谱进行量化和编码而获得的编码数据流。
并且,在第二实施例的编码设备1300中,由下面四种类型的编码方法对由频率特性提取单元1302和时间特性提取单元1303指定的频带中的频谱进行编码1.不参考其他频带在频域中量化和编码。
2.参考其他频带在频域中编码。
3.不参考其他频带在时域中量化和编码。
4.参考其他频带在时域中编码。
因此,在编码数据流中的每个频带的标题中描述了一个显示该频带是否参考其他频带的标志、一个显示如果参考的话参考哪个频带的频带号、一个控制参考频带的增益的参数等等。如图21B所示,例如,在频带1的标题中描述了一个显示频带1中的编码数据流t_quantize在时域中被量化和编码的标志qm=t。在频带2的标题中描述了一个显示频带2中的编码数据流f_quantize在频域中被量化和编码的标志qm=f。此外,在频带3中描述了下面的元素标志qm=ref,显示出实际上不包含通过在时域中对频谱进行量化和编码而获得的编码数据流,并参考其他频带产生频带3;频带号ref=1,显示出频带1是频带3的参考频带;参数Gain_info,控制参考频带频带1的增益;等等。并且,以与频带3相同的方式,在频带4中描述了如下元素标志qm=ref,显示出实际上不包含通过对频谱进行量化和编码而获得的编码数据流,并参考其他频带产生频带4;频带号ref=2,显示出频带2是频带4的参考频带;参数Gain_info,控制参考频带频带2的增益;等等。在频带3中,因为频带号ref=1显示出参考在频域中量化和编码的频带1,这隐含着频带3是在频域中编码的。在频带4中,因为频带号ref=2表明参考在时域中量化和编码的频带2,这隐含着频带4是在时域中编码的。
在图21A中,在编码数据流中的每个频带的标题中描述了一个显示在哪个域、是时域还是频域中对频带中的编码数据流进行量化和编码的标志。但如果预先确定了在哪个域中对哪一频带进行量化和编码,则不需要这个标志。并且,在图21B中,在每个编码数据流中的每个频带的标题中描述了一个显示该频带是否参考其他频带的标志以及一个指定用于该频带的参考频带的频带号。但如果预先确定了哪一频带参考哪一频带,则不需要这些数据。
在依据本发明的第二实施例的编码设备1300和解码设备2000中,如果将参考频带选择为一个带有较低频率分量的频带,将目标频带选择为一个带有比参考频带高的频率分量的频带,用一个现有的编码方法对参考频带编码,并将产生目标频带中的分量的代码编码为补充数据,则进一步可以使用现有的编码方法和少量的补充数据来再现一个宽频带中的声音。当将AAC方法用作一个现有的音频编码方法时,只要产生目标频带中的分量的编码数据被包括在AAC方法的Fill_element中,甚至在与AAC方法兼容的解码方法中,也可以在不发出噪声的情况下对编码数据流解码。当使用依据本发明的第二实施例的解码方法时,还可以从相对较小量的数据再现一个更宽频带上的声音。
当使用结构如上所述的本发明的编码设备和解码设备时,除了可以实现频域中的数据编码之外,还可以实现时域中的数据编码。因此,通过选择一种具有更高编码效率的编码方法,对于再现的被解码的声音可以高效率地提高频率分辨能力和时间分辨能力。并且,因为通过重新使用已经被编码的频带中的信号可以用较小数据量来构造编码音频数据流,所以可以将编码音频数据流的比特率保持在较低水平。另外,如果使用相同的比特率,可以提供一个能够获得具有高级别声音质量的音频信号的编码音频数据流。此外,如果为时间变换单元1306、时间变换单元2003和频率变换单元2005选择一个不需要用于划分信号的时间重叠的分析合成类型的正交变换方法,则可以去除编码设备和解码设备中的任何附加算术延迟,使得这在编码和解码过程中需要考虑延迟的应用上具有一个优点。
在上面的第二实施例中,参考频带判定单元1305为频率特性提取单元1302和时间特性提取单元1303指定的频带判定四种类型的编码方法,但其实际的判决方法并不限于上面这些。
工业实用性依据本发明的编码设备可用作为位于用于包括BS和CS的卫星广播的广播基站中的音频编码设备,作为用于通过诸如因特网的通信网络来分布内容的内容分布服务器的音频编码设备,以及进一步作为由通用计算机执行的用于对音频信号编码的程序。
另外,依据本发明的解码设备不仅可用作为位于家庭中的STB中的音频解码设备,还作为一个由通用计算机、PDA、移动电话等执行的用于对音频信号解码的程序、以及在STB或通用计算机中包括的仅用于对音频信号解码的电路板、LSI等,并进一步作为插入到STB或通用计算机中的IC卡。
权利要求
1.一种对通过根据时间—频率变换来变换一个输入初始信号而获得的频域中的一个信号进行编码并产生一个输出信号的编码设备,包括第一频带指定单元,可用于基于输入初始信号的特性为一部分频谱指定一个频带;时间变换单元,可用于根据频率—时间变换将指定频带中的一个信号变换成一个信号;以及,编码单元,可用于对由时间变换单元获得的信号和至少一部分频谱进行编码,并从编码信号和编码频谱产生一个输出信号。
2.依据权利要求1的编码设备,其中,时间变换单元根据频率—时间变换将指定频带中的信号变换成一个指示一个在与频谱相同的时间上的频率分量的时间改变的信号。
3.依据权利要求2的编码设备,其中,编码设备进一步包括时域近似单元,可用于指定频谱的两个或多个频带,并采用一个指示在一个指定频带中包含的频率分量的时间改变的信号来近似一个指示在另一个指定频带中的频率分量的时间改变的信号,以及编码单元对用于由时域近似单元指定的频带的近似的信号进行编码。
4.依据权利要求3的编码设备,其中,时域近似单元产生指定在频谱中用于近似的频带和被近似的频带的数据。
5.依据权利要求4的编码设备,其中,时域近似单元进一步产生指示用于被近似的信号的近似的信号的增益的数据。
6.依据权利要求5的编码设备,其中,编码单元不对被近似的信号进行编码,而是对由时域近似单元产生的指定用于近似的频带的数据和指示增益的数据进行编码。
7.依据权利要求1的编码设备,其中,第一频带指定单元为一个在输入初始信号的平均能量上具有一个大的改变的部分指定一个频带。
8.依据权利要求1的编码设备,其中,编码设备进一步包括第二频带指定单元,可用于基于频谱特性为一部分频谱指定一个频带,以及时间变换单元根据频率—时间变换将指定频带的一个信号变换成一个信号。
9.依据权利要求8的编码设备,其中,编码设备进一步包括频域近似单元,可用于指定在频谱中包含的两个或多个频带,并采用指定频带中的一个的频谱来近似另一个频带的频谱,以及编码单元对用于由频域近似单元指定的频带的近似的频谱进行编码。
10.依据权利要求9的编码设备,其中,频域近似单元产生指定在频谱中用于近似的频带和被近似的频带的数据。
11.依据权利要求10的编码设备,其中,频域近似单元进一步产生指示用于被近似的频谱的近似的频谱的增益的数据。
12.依据权利要求11的编码设备,其中,编码单元不对被近似的频谱进行编码,而是对由频域近似单元产生的指定用于近似的频带的数据和指示增益的数据进行编码。
13.依据权利要求8的编码设备,其中,第二频带指定单元指定一个在频谱中具有广泛散布的频谱系数的频带。
14.一种对通过对一个输入初始信号编码而获得的编码数据流进行解码、并输出一个频谱的解码设备,包括解码单元,可用于提取在输入编码数据流中包含的编码数据流的一部分,并对提取出的编码数据流解码;频率变换单元,可用于将通过对提取出的编码数据流解码而获得的信号变换成一个频谱以及,合成单元,可用于在频率轴上合成通过对从输入编码数据流的其他部分提取出的编码数据流解码而获得的一个频谱和由频率变换单元获得的频谱。
15.依据权利要求14的解码设备,其中,由频率变换单元获得的频谱和通过对从编码数据流的其他部分提取出的编码数据流解码而获得的频谱是指示对于相同输入初始信号的在同一时间的一个信号的频谱。
16.依据权利要求15的解码设备,其中,解码设备进一步包括时间近似单元,可用于用一个从其他频带中的编码数据流解码出的信号来近似由提取出的编码数据流指示的频带,以及频率变换单元将被近似的信号变换成一个频谱。
17.依据权利要求16的解码设备,其中,时间近似单元根据在提取出的编码数据流中包含的数据指定被用于由编码数据流所指示的频带的近似的信号的一个频带,并采用所指定频带的信号执行近似。
18.依据权利要求17的解码设备,其中,时间近似单元进一步通过从提取出的编码数据流中包含的数据读取用于被近似的信号的近似的信号的增益,并通过采用所读取的增益调节指定频带中的信号的振幅来近似频带。
19.依据权利要求17的编码设备,其中,时间近似单元指定一个已经变换成频谱的频带,根据频率—时间变换将指定频带的频谱变换成一个信号,并采用变换所获得的信号来近似一个由提取出的编码数据流所指示的频带。
20.依据权利要求16的编码设备,其中,解码设备进一步包括频率近似单元,可用于用从其他频带中的编码数据流解码出的频谱来近似由提取出的编码数据流所指示的频带,以及,除了通过对从输入编码数据流的其他部分提取出的编码数据流解码而获得的频谱以及由频率变换单元获得的频谱之外,合成单元进一步在频率轴上合成由频率近似单元近似的频谱。
21.依据权利要求20的解码设备,其中,频率近似单元根据在提取出的编码数据流中包含的数据指定被用于由编码数据流所指示的频带的近似的频谱的一个频带,并采用所指定频带的频谱执行近似。
22.依据权利要求21的解码设备,其中,频率近似单元进一步通过从提取出的编码数据流中包含的数据读取用于被近似的频谱的近似的频谱的增益,并通过采用所读取的增益调节指定频带中的频谱的振幅来近似频带。
23.一种对通过根据时间—频率变换来变换一个输入初始信号而获得的频域中的一个信号进行编码并产生一个输出信号的编码方法,包括第一频带指定步骤,用于基于输入初始信号的特性为一部分频谱指定一个频带;时间变换步骤,用于根据频率—时间变换将指定频带中的一个信号变换成一个信号;以及,编码步骤,用于对由时间变换步骤获得的信号和至少一部分频谱进行编码,并从编码信号和编码频谱产生一个输出信号。
24.一种对通过对一个输入初始信号编码而获得的编码数据流进行解码、并输出一个频谱的解码方法,包括解码步骤,用于提取在输入编码数据流中包含的编码数据流的一部分,并对提取出的编码数据流解码;频率变换步骤,用于将通过对提取出的编码数据流解码而获得的信号变换成一个频谱;以及,合成步骤,用于在频率轴上合成通过对从输入编码数据流的其他部分提取出的编码数据流解码而获得的一个频谱和由频率变换步骤获得的频谱。
25.一种对通过根据时间—频率变换来变换一个输入初始信号而获得的频域中的一个信号进行编码并产生一个输出信号的程序,所述程序使计算机执行第一频带指定步骤,用于基于输入初始信号的特性为一部分频谱指定一个频带;时间变换步骤,用于根据频率—时间变换将指定频带中的一个信号变换成一个信号;以及,编码步骤,用于对由时间变换步骤获得的信号和至少一部分频谱进行编码,并从编码信号和编码频谱产生一个输出信号。
26.一种对通过对一个输入初始信号编码而获得的编码数据流进行解码、并输出一个频谱的程序,所述程序使计算机执行解码步骤,用于提取在输入编码数据流中包含的编码数据流的一部分,并对提取出的编码数据流解码;频率变换步骤,用于将通过对提取出的编码数据流解码而获得的信号变换成一个频谱;以及,合成步骤,用于在频率轴上合成通过对从输入编码数据流的其他部分提取出的编码数据流解码而获得的一个频谱和由频率变换步骤获得的频谱。
全文摘要
一种编码设备(200)包括时间特性提取单元(203),基于时域中的一个音频输入信号的特性为一部分频谱指定一个频带;时间变换单元(204),根据频率一时间变换将指定频带中的一个信号变换成一个信号;以及,编码数据流产生单元(205),对由时间变换单元(204)获得的信号和至少一部分频谱进行编码,并从编码信号和编码频谱产生一个输出编码数据流。
文档编号G10L19/02GK1516865SQ0380041
公开日2004年7月28日 申请日期2003年4月7日 优先权日2002年4月11日
发明者津岛峰生, 则松武志, 志, 也, 田中直也 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1