量化装置、量化方法、高效率编码装置、高效率编码方法、解码装置、高效率解码装置和记...的制作方法

文档序号:7564959阅读:301来源:国知局
专利名称:量化装置、量化方法、高效率编码装置、高效率编码方法、解码装置、高效率解码装置和记 ...的制作方法
技术领域
本发明涉及降低在电影放映机、录像机、视盘放像机等的立体声和所谓多路环绕声系统中所使用的比特率的高效率编码装置和高效率编码方法;在这些装置和方法中所使用的量化装置和量化方法;记录着借助量化装置和高效率编码装置已进行量化的信号的记录媒体;把从该记录媒体重放的已量化信号解码的高效率解码装置以及这些装置中所用的解码装置。
背景技术
已有各种各样的音频或声音等信号的高效率编码方法和装置。能够举出来的例如有所谓变换编码方法,即,把时域内的音频信号等按单位时间分成块、把每个块的时间轴信号变换成频率轴上的信号(正交变换)从而分割成多个频带、对每个频带进行编码的块化频带分割方式;频带分割编码方式(子带编码,SBC),即,不把时域内的音频信号按单位时间分块、而是把它分割成多个频带进行编码的非块化频带分割方式。还可以考虑把上述频带分割编码方式与变换编码方式组合起来的高效率编码方法和装置,在这种情况下,例如,利用上述频带分割编码方式进行频带分割以后,把每个频带的信号利用上述变换编码方式正交变换成频域信号,对已正交变换的每个频带进行编码。
在这里,作为在上述频带分割编码中使用的频带分割用的滤波器,例如有QMF(正交镜像滤波器)等滤波器,对此,1976年,R.E.Crochiere在“Digital coding of speech in subbands(语言在子带中的数字编码)”,Bell Syst.Tech.J.Vol.55,No.8,1976中作了描述。还有,在1983年BOSTON ICASSP会议上,JosephH.Rothweilev发表的“Polyphase Quadrature filters-A newsubband coding technique(多级正交滤波器—一种新的子带编码技术)”中,描述了多极正交滤波器等的等带宽的滤波器分割方法和装置。
作为上述正交变换,例如有把输入音频信号按给定单位时间(帧)分块、通过对每个块进行快速付里叶变换(FFT)、离散余弦变换(DCT)、改进DCT变换(MDCT)等、把时间轴变换成频率轴那样的正交变换。有关上述MDCT,在1987年ICASSP会议上,Surrey Royal Melbourne技术学院J.P.Princen A.B.Bradley发表的“Subband/Transform Coding Using Filter Bank DesignsBased on Time Domain Aliasing Cancellation(利用基于时域混淆隐匿的滤波器存储体设计的子带和变换编码)”中作了描述。
作为对已频带分割的各频率分量进行量化时的频率分割宽度,有例如考虑了人类听觉特性的频带分割。即,一般以称为临界频带的越是高频、带宽就越宽的带宽,把音频信号分割成多个(例如,25个)频带。当把这时的每个频带的数据编码时,对每个频带进行给定的比特分配、或者对每个频带进行自适应的比特分配而进行编码。例如,当把上述MDCT处理得到的MDCT系数数据通过上述比特分配进行编码时,对借助于上述每个块的MDCT处理得到的每个频带的MDCT系数数据,以自适应分配的比特数进行编码。
作为上述比特分配方法和所用的装置,已知有下面两种方法和装置。在IEEE Transactions of Accoustics,Speech and SignalProcessing,Vol.ASSP-2S,No.4,August 1977中,描述了以每个频带的信号大小为基础进行比特分配。还有,在1980年ICASSP会议上,MIT的M.A.Kransner发表的“The critical band coder-digltal encoding of the perceptual requirements of the auditorysystem(临界频带编码器—听觉系统知觉要求的数字编码)”中,描述了利用听觉掩蔽,使每个频带得到所需信噪比,进行固定比特分配的方法和装置。
但是,这些比特分配技术在重放(解码)那一侧期待着以某一恒定的比特率进行重放(解码),因此,当以低于该恒定比特率的比特率进行解码时,将形成显著的音质劣化。
即,在为了使解码时使用的比特率低于编码时所使用的比特率、例如在编码器那一侧把编码处理以后的一部分比特挪用于传输其它数据的情况下,由于在解码那一侧以低于编码时的比特率的比特率进行解码,所以在上述解码那一侧期待着以编码时的比特率进行解码的上述先有的比特分配技术中,重放(解码)时将形成显著的音质劣化。
还有,例如在使用已经是以低比特率进行重放的重放装置的情况下,即使想引入使用较高比特率的、音质良好的系统,使用上述以已经使用的低比特率进行重放的重放装置,也不能进行良好的重放。
即,在先有的比特分配技术中,无后向互换性。
在把已编码的声音、音频等信号的信息记录到例如使用了所谓IC卡那样的存储器件的存储媒体上那样的情况下,因为该存储器件较贵,所以,希望存储时间长一些,还希望音质劣化最小。
发明的公开本发明的目的是提供由能够把上述那样的音质劣化限制到最小并具有后向互换性的高效率编码装置和高效率编码方法、在这些装置和方法中所用的量化装置和量化方法、与这些装置和方法对应的高效率解码装置、解码装置和记录媒体构成的系统。
本发明的目的是,在使用了较贵的存储器件的存储媒体上进行记录的情况下,为使记录时间长,例如为了把记录时间从起始设定值延长,提供能够把记录完了的或者记录中的编码信息的比特率适当降低以延长记录时间、并能使这时的音质劣化最小的高效率编码装置和高效率编码方法;在这些装置和方法中所用的量化装置和量化方法;与这些装置和方法对应的高效率解码装置、解码装置和记录媒体。
本发明的目的是,在构成已通过本发明的量化装置或高效率编码装置量化了的信号的重放装置(从记录媒体上把信号重放和解码的解码装置或高效率解码装置)的情况下,提供一种廉价解码装置或高效率解码装置,该装置能够以多个廉价的、常用的、使用固定值以下的比特率进行比特分配的解码器来构成,因而不需要作成新解码器用的大规模集成电路(LSI),就能够控制成本。
本发明是为了达到上述目的而提出的,本发明量化装置在把已利用滤波器对音频、声音或图像时间信号进行了频率分解的时域取样;或者,对已频率分解的时域取样进行了正交变换后、或对直接输入的时间信号进行了正交变换后的频域取样量化以后,至少借助于由对各个取样单独地对前级的量化误差重新进行量化那样的一种量化功能,把时域取样或频域取样至少分解成两个字。这时,通过预先确定各字的字长,使得没有必要把字长信息从编码器(量化装置)传送到解码器(解码装置)上,这在降低比特率方面是有效的。当然,也可以把字长信息作为自适应的字长来传送。在这些量化中,进行四舍五入操作,减小量化误差。
在本发明量化装置中,至少把一种量化功能的输出比特率在某一恒定时间单位内作为恒定的比特率以及把全部上述量化功能的输出比特率在某一恒定时间单位内作为恒定的比特率。在这些情况下,使时域取样或频域取样按每多个取样进行块浮动,用于把上述前级的量化误差已重新量化了的取样数据的比例因子至少从用于该前级量化输出的比例因子中求出。
在本发明量化装置中,使时域取样或频域取样按每多个取样进行块浮动,用于把上述前级的量化误差已重新量化了的取样数据的比例因子至少从用于上述前级量化输出的比例因子和字长中求出。
在以上情况下,对有关时间和频率已细分了的小块中的取样数据,在上述小块内进行具有同一块浮动和字长的量化。为了得到上述有关时间和频率的已细分了的小块中的取样,在进行了滤波等不分块的频率分析以后,对上述滤波等不分块频率分析的输出进行正交变换等分块频率分析。这时,上述不分块频率分析的带宽至少在最低频段的两个频带是相同的,这在降低成本方面有用。上述不分块频率分析的带宽至少在最高频段是越是高频、频带就越宽,这在利用以临界频带为基础的听觉效果方面是重要的。在上述分块频率分析中,借助于输入信号的时间特性自适应地变更块的大小,借此,使与输入信号时间特性对应的最佳处理成为可能。在这里,上述块大小的变更至少在两个上述不分块频率分析的输出频带的每一个频带中独立地进行,这在防止各频率分量间的相互干扰和各频带分量独立地进行最佳处理方面是有效的。
因为在借助于各声道的比例因子或取样最大值确定给各声道的比特分配量时,是基于简单的运算,所以,这在减少运算方面是有效的。此外,根据由各声道比例因子代表的幅度信息随时间的变化来改变给各声道的比特分配量,这在降低比特率方面也是有益的。
本发明量化装置在把时域取样或频域取样量化以后,至少借助于由各个取样单独地对前级的量化误差重新进行量化那样的一种量化功能,分解成至少两个字,把一个同步块中的每一个量化输出都分离开来。此后,把该量化输出记录到本发明记录媒体上,把该记录媒体通过本发明解码装置进行解码重放。
本发明的其它量化装置在把时域取样或频域取样量化以后,至少借助于由各个取样单独地对前级的量化误差重新进行量化那样的一种量化功能,分解成至少两个字。此后,对本发明记录媒体,把一个同步块中的各量化输出按频率或时间顺序交错地记录下来,此后,利用本发明解码装置,从其时域取样或频域取样中解码重放。
还有,在本发明量化方法中,把输入信号的时域或频域的给定取样量化,生成第1量化值,运算上述给定取样与上述第1量化值的量化误差,由各个取样单独地对上述量化误差进行量化,生成第2量化值。
在本发明量化方法中,借助于根据四舍五入操作的量化,至少生成上述第1量化值和上述第2量化值中的一个。
在本发明量化方法中,以恒定的比特率把上述第1量化值和上述第2量化值的至少一个输出。
在本发明量化方法中,以成为恒定比特率那样地输出上述第1量化值和上述第2量化值的总和。
在本发明量化方法中,利用第1比例因子对上述给定取样按每个由多个取样构成的块进行块浮动处理,利用根据上述第1比例因子求出的第2比例因子把上述量化误差归一化。
在本发明量化方法中,根据上述第1比例因子和生成上述第1量化值时的字长求出上述第2比例因子。
在本发明量化方法中,对在时间和频率上已细分了的小块中的取样数据,在该小块内以同一比例因子和字长进行归一化和量化。
本发明高效率编码装置在把已利用滤波器对音频、声音或图缘时间信号进行了频率分解的时域取样;或者对已频率分解的时域取样进行正交变换或对直接输入的时间信号进行了正交变换后的频域取样量化以后,至少借助于由各个取样单独地对前级的量化误差重新进行量化那样的一种量化功能,把时域取样或频域取样至少分解成两个字。这时,通过预先确定各字的字长,使得没有必要把字长信息从编码器(量化装置)传送到解码器(解码装置)上,这在降低比特率方面是有效的。当然,也可以把字长信息作为自适应的字长来传送。在这些量化中,进行四舍五入操作,减小量化误差。
在本发明高效率编码装置中,至少把一种量化功能的输出比特率在某一恒定时间单位内作为恒定的比特率,以及,把全部上述量化功能的输出比特率在某一恒定时间单位内作为恒定的比特率。在这些情况下,使时域取样或频域取样接每多个取样进行块浮动,用于把上述前级的量化误差已重新量化了的取样数据的比例因子至少从用于该前级量化输出的比例因子中求出。
在本发明高效率编码装置中,使时域取样或频域取样按每多个取样进行块浮动,用于把上述前级的量化误差已重新量化了的取样数据的比例因子至少从用于上述前级量化输出的比例因子和字长中求出。
在以上情况下,对有关时间和频率已细分了的小块中的取样数据,在上述小块内进行具有同一块浮动和字长的量化。为了得到上述有关时间和频率的已细分了的小块中的取样,在进行了滤波等不分块的频率分析以后,对上述滤波等不分块频率分析的输出进行正交变换等分块频率分析。这时,上述不分块频率分析的带宽至少在最低频段的两个频带是相同的,这在降低成本方面有用。上述不分块频率分析的带宽至少在最高频段是越是高频、频带就越宽,这在利用以临界频带为基础的听觉效果方面是重要的。在上述分块频率分析中,借助于输入信号的时间特性自适应地变更块的大小,借此,使与输入信号时间特性对应的最佳处理成为可能。在这里,上述块大小的变更至少在两个上述不分块频率分析的输出频带的每一个频带中独立地进行,这在防止各频率分量间的相互干扰和各频带分量独立地进行最佳处理方面是有效的。
因为在借助于各声道的比例因子或取样最大值确定给各声道的比特分配量时,是基于简单的运算,所以,这在减少运算方面是有效的。此外,根据由各声道比例因子代表的幅度信息随时间的变化来改变给各声道的比特分配量,这在降低比特率方面也是有益的。
本发明高效率编码装置在把时域取样或频域取样量化以后,至少借助于由各个取样单独地对前级的量化误差重新进行量化那样的一种量化功能,分解成至少两个字,把一个同步块中的每一个量化输出都分离开来,记录到本发明记录媒体上,把该记录媒体通过本发明高效率解码装置进行解码重放。
本发明的其它高效率编码装置在把时域取样或频域取样量化以后,至少借助于由各个取样单独地对前级的量化误差重新进行量化那样的一种量化功能,分解成至少两个字。此后,对本发明记录媒体,把一个同步块中的各量化输出按频率或时间顺序交错地记录下来,此后,利用本发明高效率解码装置,从其时域取样或频域取样中解码重放。
在本发明高效率编码方法中,把总比特分配分割成基本比特分配和附加比特分配,以根据上述基本比特分配的字长把上述输入信号的时域或频域的给定取样量化,生成第1量化值,运算上述给定取样和上述第1量化值的量化误差,由各个取样单独地对上述量化误差进行量化,作为上述附加比特分配生成第2量化值。
在本发明高效率编码方法中,借助于根据四舍五入操作的量化,至少生成上述第1量化值和上述第2量化值的一个。
在本发明高效率编码方法中,以恒定的比特率把上述第1量化值和上述第2量化值的至少一个输出。
在本发明高效率编码方法中,以成为恒定比特率那样地输出上述第1量化值和上述第2量化值的总和。
在本发明高效率编码方法中,利用第1比例因子对上述给定取样按每个由多个取样构成的块进行块浮动处理,利用根据上述第1比例因子求出的第2比例因子把上述量化误差归一化。
在本发明高效率编码方法中,根据上述第1比例因子和生成上述第1量化值时的字长求出上述第2比例因子。
在本发明高效率编码方法中,对在时间和频率上已细分了的小块中的取样数据,在该小块内以同一比例因子和字长进行归一化和量化。
而且,如根据本发明,在把时域取样或频域取样量化以后,至少借助于由各个取样单独地对前级的量化误差重新进行量化那样的一种量化功能,把时域取样或频域取样至少分解成两个字。这时,通过预先确定已量化了的各字的字长,使得没有必要把字长信息从编码器传送到解码器上,这在降低比特率方面是有效的。当然,也可以把字长信息作为自适应的字长来传送。在这些量化中,进行四舍五入操作,这在减小量化误差方面是有效的。
还有,至少把一种量化功能的输出比特率在某一恒定时间单位内作为恒定的比特率,或者,把全部上述量化功能的输出比特率在某一恒定时间单位内作为恒定的比特率,这些在简化对于磁盘、磁带等记录媒体的记录方式方面是有效的。
在以上情况下,对在时间和频率上已细分了的小块中的取样数据,在上述小块内进行具有同一块浮动和字长的量化,这在实现高效率编码方面是有效的。在这些情况下,使时域取样或频域取样按每多个取样进行块浮动,用于把上述前级的量化误差已重新量化了的取样数据的比例因子至少从用于上述前级量化输出的比例因子中求出,以及,用于把上述前级的量化误差已重新量化了的取样数据的比例因子至少从用于上述前级量化输出的比例因子和字长中求出,这些在提高高效率编码的效率方面是有效的。
又,为了得到在时间和频率上已细分了的小块中的取样,在进行了滤波等不分块的频率分析以后,借助于对该滤波等不分块频率分析的输出进行正交变换等分块频率分析,使得在时域、频域中考虑了听觉掩蔽的量化噪声的产生成为可能,并使得到在听觉上令人满意的频率分析成为可能。这时,上述不分块频率分析的频带宽度至少在最低频段的两个频带是相同的,这在降低成本方面有用。借助于该不分块频率分析的频带宽度在最高频段至少是越是高频、频带就越宽,使有效地利用以临界频带为基础的听觉效果成为可能。该分块频率分析借助于输入信号的时间特性自适应地变更块的大小,借此,使与输入信号时间特性对应的最佳处理成为可能。还有,块大小的变更至少在两个上述不分块频率分析的输出频带的每一个频带中独立地进行,这在防止各频率分量间的相互干扰和各频带分量独立地进行最佳处理方面是有效的。
借助于通过各声道的比例因子计算声道的比特分配,可以谋求简化比特分配的计算。在把时域取样或频域取样量化以后,至少借助于由各个取样单独地对前级的量化误差重新进行量化那样的一种量化功能,分解成至少两个字,把一个同步块中的每一个量化输出部分离开来、记录后进行解码重放,这在降低比特率进行重放的情况下,在能够把必须去掉的比特串汇总去掉方面是有效的。
在把时域取样或频域取样量化以后,至少借助于由一个一个取样单独地对前级的量化误差重新进行量化那样的一种量化功能,分解成至少两个字,把一个同步块中的各量化输出按频率或时间顺序交错地记录下来,从时域取样或频域取样中解码重放,这在降低比特率进行重放的情况下,在能够把因受频带限制而必须去掉的比特串汇总去掉方面是有效的。
附图的简单说明图1为示出本发明实施例量化装置中应用的高效率编码装置构成例的方框电路图;图2为示出本实施例装置中信号的频率和时间分割的图;图3为示出本实施例比特分配方案的图;图4为用于说明从比例因子计算音调的方法的图;图5为用于说明从音调求出比特分配(1)的比特分配量的方法的图;
图6为示出比特分配(2)中均匀分配时的噪声频谱的图;图7示出用来得到对比特分配(2)中信息信号频谱和电平具有依赖性听觉效果的因比特分配引起的噪声频谱的例子;图8为示出比特分配(2)中均匀分配的图;图9为示出使用了用于得到对比特分配(2)中信息信号频谱和电平具有依赖性的听觉效果的比特分配的比特分配方法的图;图10为示出本发明实施例基本比特分配功能构成例的方框电路图;图11为示出本发明实施例听觉掩蔽门限值计算功能构成例的方框电路图;图12为示出依据各临界频带信号进行掩蔽的图;图13为示出依据各临界频带信号进行掩蔽的门限值的图;图14为示出信息频谱、掩蔽门限值、最小可听限度的图;图15为示出对于信号频谱中平坦信息信号依赖于信号电平和依赖于听觉允许的噪声电平的比特分配的图;图16为示出对于信号频谱中音调高的信息信号依赖于信号电平和依赖于听觉允许的噪声电平的比特分配的图;图17为示出对信号频谱中平坦信息信号的量化噪声电平的图;图18为示出对音调高的信息信号的量化噪声电平的图;图19为示出进行基本比特分配与附加比特分配的分割的具体构成的方框电路图;图20为示出本发明实施例解码装置构成例的方框电路图;图21为示出在本发明实施例记录媒体上的比特排列构成例的图。
用于实施发明的最佳形态下面,参照


本发明实施例。
本实施例为,在应用频带分割编码(SBC)、自适应变换编码(ATC)、和自适应比特分配(APC-AB)等技术对音频PCM信号等输入数字信号进行高效率编码的高效率编码装置中,应用了本发明的情况。图1为示出应用了该本发明的高效率编码装置具体构成的图。
在图1所示高效率编码装置中,借助于滤波器等把输入数字信号分割成多个频带,同时,在每个频带内进行正交变换,对得到的频率轴上的频谱数据在考虑了后述人类听觉特性的每一个所谓临界带宽(critical band)内进行自适应的比特分配和编码。这时,在高频段,使用把临界带宽进一步分割了的频带。当然,也可以把依靠滤波器等的不分块频率分割宽度作为等分割宽度。
在该高效率编码装置中,在正交变换之前根据输入信号自适应地改变块大小(块长)的同时,以临界带宽为单位、或者以在高频段把临界带宽进一步细分了的块为单位进行浮动处理。该所谓临界频带是考虑到人类听觉特性分割而成的频带,即,当因某一纯音频率附近的相同强度的窄频带噪声把该纯音掩蔽掉时,该噪声所占据的频带。当频段越高时,这种临界频带的带宽就越宽,所以,可以把例如0~22KHz的整个频带例如分割成25个临界频带。
即,在图1中,例如,把0~22KHz的音频PCM信号送到输入端子10上。例如,借助于所谓QMF滤波器等频带分割滤波器11把该输入信号分割成0~11KHz频带和11KHz~22KHz频带,同样地借助于所谓QMF等频带分割滤波器12把0~11KHz频带的信号分割成0~5.5KHz频带和5.5~11KHz频带。
把来自上述频带分割滤波器11的11KHz~22KHz频带的信号送到正交变换电路之一例的MDCT(Modified DiscreteCosine Transform,即;改进的离散余弦变换)电路13上,把来自上述频带分割滤波器12的5.5KHz~11KHz频带的信号送到MDCT电路14上,把来自上述频带分割滤波器12的0~5.5KHz频带的信号送到MDCT电路15上。于是,这些信号在这里分别进行MDCT处理。在MDCT电路13、14、15中,根据借助于设置在每个块上的块判定电路19、20、21判定的块尺寸进行MDCT处理。
图2A和2B示出借助于上述块尺寸判定电路19、20、21判定的各MDCT电路13、14、15中块尺寸的具体例。图2A示出正交变换块尺寸为长的情况(在长方式下的正交变换块尺寸),图2B示出正交变换块尺寸为短的情况(在短方式下的正交变换块尺寸)。
在该图2的具体例中,对3个滤波器的输出分别使用2个正交变换块尺寸。即,对于低频0~5.5KHz频带的信号和中段5.5KHz~11KHz频带的信号,在长的块长的情况下(图2A),一个块内的取样数为128个取样;在选定短块的情况下(图2B),一个块内的取样数为32个取样。与此相对,对于高频段11KHz~22KHz频带的信号,在长的块长的情况下(图2A),一个块内的取样数为256个取样,在选定短块的情况下(图2B),一个块内的取样数为32个取样。这样,在选定短块的情况下,各频带正交变换块的取样数相同,频段越高,越能提高时间分辨率,而且,还能减少分块时使用的窗口种类。
把表示利用上述块判定电路19、20、21判定的块尺寸的信息送到后述自适应比特分配编码电路16、17、18上,同时,从输出端子23、25、27输出。
再一次看图1,把在各MDCT电路13、14、15中进行MDCT处理以后得到的频域的频谱数据或者MDCT的系数数据,在每个所谓临界频带内、或者在高频段在把临界频带进一步分割了的每个频带内汇总起来,送到自适应比特分配编码电路16、17、18上。
在自适应比特分配编码电路16、17、18中,根据上述块尺寸的信息、和在每个临界频带内、或者在高频段、在把临界频带重新分割了的每个频带内分配的比特数把各频谱数据(或者,MDCT的系数数据)重新量化(归一化以后,进行量化)。
由这些自适应比特分配编码电路16、17、18已编码的数据通过输出端子22、24、26输出。此外,在该自适应比特分配编码电路16、17、18中求出表示进行与什么样的信号大小有关的归一化的比例因子、和表示以什么样的比特长度进行量化的比特长度信息,还同时把这些信息从输出端子22、24、26输出。
对于上述临界频带、或者在高频段把临界频带重新分割了的每个频带的能量,借助于例如计算在该频带内各幅度值的均方根值从图1中各MDCT电路13、14、15的输出中求出。当然,也可以把上述比例因子本身用于以后的比特分配。在这种情况下,因为不需要计算新的能量的运算了,所以,可以节省硬件的规模。利用幅度值的峰值、平均值等来代替每个频带的能量,也是可能的。
下面,利用图3所示的比特分配方案说明用于进行上述比特分配的自适应比特分配编码电路13、14、15中的具体的比特分配方法。
在本实施例中,从步骤ST1的总比特分配求出下列两项第一,每个声道128kb/s的基本比特分配(步骤ST2)和第二,64kb/s的附加比特分配。(步骤ST3)其中,把基本比特分配进一步分割成比特分配(1)(步骤ST4)和比特分配(2)(步骤ST5)。
首先,说明从步骤ST1向步骤ST2的上述基本比特分配的方法。在这里,根据比例因子的频域分布自适应地进行比特分配。
最初,确定比特分配(1)中应该使用的比特量。为此,使用信号信息的频谱信息中的音调信息。作为这里的音调指标采用以信号频谱数除信号频谱相邻值之差的绝对值之和所得的值。作为更简单的指标,如图4所示那样地,可以采用用于所谓块浮动的每一个块的比例因子中相邻比例因子指标之差的平均值。该比例因子指标概略地对应于比例因子的对数值。
在实施例中,使比特分配(1)中应该使用的比特量对应于表示该音调的值,设定为最大80kb/s、最小10kb/s。
该音调的计算,按下式那样地进行。
T=(1/(WLmax*(N-1))(∑ABS(SFn-SFn-1)
WLmax字长的最大值=16SFn比例因子指标,概略地对应于峰值的对数n块浮动频带的序号N块浮动频带的个数这样求出的音调指标T和比特分配(1)的分配量,如图5所示那样地对应起来。
这里的比特分配(1)成为依赖于比例因子的频域和时域上的分配。
如果这样地确定了比特分配(1)中使用的比特量,下面转到有关比特分配(1)中不使用的比特的分配,即,比特分配(2)。
在这里,虽然可以进行多种比特分配,但是,下面示出两个例子。
第一,对全部取样值进行均匀分配。图6示出对应于这种情况下比特分配的量化噪声频谱(比特分配(2)中均匀分配的噪声频谱)。如果根据这种方法,就能降低整个频带内均匀的噪声电平。
第二,进行用于得到对信号信息频谱和电平具有依赖性的听觉效果的比特分配。图7示出这种情况下比特分配的量化噪声频谱(依靠用于得到对信号信息频谱和电平具有依赖性的听觉效果的比特分配的噪声频谱)之一例。在这个例子中,进行依赖于信息信号频谱的比特分配,特别是进行在信息信号频谱的低频段加了权的比特分配以后,补偿了低频段的掩蔽效果相对于高频段的减少。这是基于考虑到相邻临界频带间的掩蔽、重视了频谱低频段的掩蔽曲线的非对称性。
图8为示出比特分配(2)中均匀分配时的比特分配的图,表示对应于图6的比特分配。图9为示出用于得到具有对应于信号信息频谱和电平的依赖性的听觉效果的比特分配的图,表示对应于图7的比特分配。图6、图7中,S表示信号频谱,NL1表示由比特分配(1)引起的噪声电平,NL2表示由比特分配(2)引起的噪声电平。图8、图9中,AQ1表示比特分配(1)的比特量,AQ2表示比特分配(2)的比特量。
下面,说明基本比特分配的其它方法。
用图10说明在这种情况下自适应比特分配电路的操作,对每一个块求出MDCT系数的大小,把该MDCT系数送到输入端子801上。把送到该输入端子801上的MDCT系数送到每个频带的能量计算电路803上。在每个频带的能量计算电路803中,计算与临界频带、或者在高频段把临界频带进一步分割了的各个频带有关的信号能量。把与每个频带的能量计算电路803中计算的各个频带有关的能量,送到依赖于能量的比特分配电路804上。
在依赖于能量的比特分配电路804中,使用来自可以使用的总比特发生电路802的可以使用的总比特(在本实施例中,为128kb/s)内的某一比例,进行产生白色量化噪声那样的比特分配。这时,输入信号的音调越高,即输入信号频谱的凸凹越大,该比特量在上述128kb/s中占据的比例就越大。为了检出输入信号频谱的凸凹,把相邻块的块浮动系数之差的绝对值之和作为指标使用。对于已求出的可以使用的比特量,进行与各频带能量的对数值成比例的比特分配。
依赖于听觉允许噪声电平的比特分配计算电路805,首先以上述按每一个临界频带分割了的频谱数据为基础求出考虑到所谓掩蔽效果的每一个临界频带的容许噪声量。接着,对从可以使用的总比特中把依赖于能量的比特减掉以后的比特进行分配以便给出听觉允许噪声频谱,把这样求出的依赖于能量的比特与依赖于听觉允许噪声电平的比特相加,通过图1的自适应比特分配编码电路16、17、18,根据在每一个临界频带中、或者在高频段把临界频带进一步分割成多个频带的频带中分配的比特数,把各频谱数据(或者,MDCT的系数数据)重新量化。把这样编码的数据通过图1的输出端子22、24、26取出。
下面,更详细地说明关于上述依赖于听觉允许噪声频谱的比特分配计算电路805中的听觉允许噪声频谱计算电路,把MDCT电路13、14、15中得到的MDCT系数送到该比特分配计算电路805中的允许噪声频谱计算电路上。
图11用于汇总说明上述允许噪声频谱计算电路,图11为示出该允许噪声频谱计算电路具体概略构成的方框电路图。图11中,把来自MDCT电路13、14、15的频域频谱数据送到输入端子521上。
把该频域输入数据送到每个频带的能量计算电路522上,在这里,例如借助于计算在该频带内的各幅度值平方的总和等求出上述每个临界频带的能量。也有利用幅度值的峰值、平均值等来代替每个频道的能量的。作为来自该能量计算电路522的输出的、例如各频带总和值的频谱,一般称为巴克(bark)频谱。图12示出这样的每个临界频带的巴克频谱SB。但是,为了简化图示,图12中,以12个频带(B1~B12)来表示上述临界频带的频带数。
在这里,为了考虑巴克频谱SB在所谓掩蔽方面的影响,进行如将该巴克频谱SB乘以给定的加权函数再相加那样的卷积(conrolution)处理。为此,把每个上述频带的能量计算电路522的输出,即该巴克频谱的各个值,送到卷积滤波电路523上。该卷积滤波电路523例如由下列构成把输入数据顺序延时的多个延时单元;对这些延时单元的输出乘以滤波系数(加权函数)的多个乘法器(例如,对应于各频带的25个乘法器);以及求各乘法器输出总和的总和加法器。
上述所谓掩蔽是借助于人类听觉上的特性通过某一信号把其它信号掩蔽掉使之听不到的现象,这种掩蔽效果有依赖时域音频信号的时间轴掩蔽效果和依靠频域信号的同一时刻掩蔽效果。借助于这些掩蔽效果,假定即使被掩蔽的部分上有噪声,该噪声也听不到了。为此,在实际的音频信号中,这种在掩蔽范围内的噪声,被当作为可以允许的噪声。
示出上述卷积滤波电路523中各乘法器相乘系数(滤波系数)的一个具体例,在假定与任一频带对应的乘法器M的系数为1时,乘法器M-1、M-2、M-3、M+1、M+2、M+3的各系数为0.15、0.0019、0.0000086、0.4、0.06、0.007,在该卷积滤波电路523中,借助于在乘法器M-1中把系数0.15、在乘法器M-2中把系数0.0019、在乘法器M-3中把系数0.0000086、在乘法器M+1中把系数0.4、在乘法器M+2中把系数0.06、在乘法器M+3中把系数0.007乘到各延迟单元的输出上,进行上述巴克频谱SB的卷积处理。其中,M为1~25中的任一整数。
接着,把上述卷积滤波电路523的输出送到减法器524上。该减法器524为求出电平α的装置,该电平α对应于上述卷积领域中的后述可以容许的噪声电平。对应于该可以容许的噪声电平(允许噪声电平)的电平α,像后述那样地,通过进行反卷积处理变成为临界频带中每个频带的允许噪声电平。
把用于求出上述电平α的允许函数(表示掩蔽电平的函数)送到上述减法器524上。通过增大/减小该允许函数对上述电平α进行控制。该允许函数由下面将要说明那样的(n-ai)函数发生电路525提供。
即,如果假定了从低频段顺序给定的临界频带的频带序号i,则对应于允许噪声电平的电平α可用下式求出α=s(n-ai)上式中,n、a为常数,a>0,s为已卷积处理了的巴克频谱的强度,式中(n-ai)为允许函数。例如,假定n=38,则可用a=-0.5。
这样,求出上述电平α,把该数据送到除法器526上。该除法器526为用于对上述卷积领域中的上述电平α进行反卷积处理的装置。因此,借助于进行该反卷积处理,从上述电平α得到掩蔽门限值。即,该掩蔽门限值变成为允许的噪声频谱。上述反卷积处理虽然需要复杂的运算,但是,在本实施例中,利用简化了的除法器526来进行反卷积。
接着,把上述掩蔽门限值通过合成电路527送到减法器528上。在这里,把上述每个频带的能量检出电路522的输出(即,前述巴克频谱SB)通过延时电路529送到该减法器528上。因此,通过在该减法器528中进行上述掩蔽门限值与巴克频谱SB的减法运算,如图13所示那样地,上述巴克频谱SB在用该掩蔽门限值MS的电平表示的电平以下的部分则被掩蔽掉。考虑到上述合成电路527以前各电路中的延时量,为了把来自能量检出电路522的巴克频谱SB延时,设置了上述延时电路529。
该减法器528的输出经过允许噪声校正电路530通过输出端子531取出,送到例如预先存储着分配比特数信息的ROM等(图中未示出)上。该ROM等与从上述减法器528通过允许噪声校正电路530得到的输出(上述延时器529的输出,即各频带的能量与上述除法器526的输出之差的电平)对应地输出每个频带的分配比特数信息。
这样,通过把依赖于能量的比特与依赖于听觉允许噪声电平的比特数相加、把该分配比特数信息送到上述自适应比特分配编码电路16、17、18上,把来自MDCT电路13、14、15的频域内的各频谱数据分别以每个频带分配的比特数量化。
即,如果加以归纳就是,在上述自适应比特分配编码电路16、17、18中,以与上述临界频带中的每个频带(每个临界频带)、或者在高频段把该临界频带进一步分割成多个频带的频带的能量或者峰值和上述除法器526输出之差分的电平对应而分配的比特数,把上述每个频带的频谱数据量化。
可是,在上述合成电路527中,能够把从最小可听曲线发生电路532送来的、表示图14所示那样的人类听觉特性即所谓最小可听曲线RC的数据与上述掩蔽门限值MS合成。对该最小可听曲线RC来说,如果噪声绝对电平在该最小可听曲线RC以下则听不到该噪声。即使编码相同,但因重放时的重放音量不同,该最小可听曲线RC也就不同了,但是,由于在实际的数据系统中,例如,对于面向16比特动态范围的音乐的听众,并不那么不同,所以例如,如果在人耳最容易听到的4KHz附近频带的量化噪声听不到了,就可以认为在其它频带中该最小可听曲线RC电平以下的量化噪声也是听不到的。因此这一来,例如,如果假定使系统具有的动态范围在4KHz附近的噪声听不到,并且假定通过把该最小可听曲线RC与掩蔽门限值MS一起合成,来得到允许噪声电平,则在这种情况下的噪声电平可以是图14中用斜线表示的部分。在本实施例中,使上述最小可听曲线RC在4KHz的电平例如与20比特相当的最低电平一致。图14中,还同时示出信号频谱SS。
在上述允许噪声校正电路530中,根据从校正信息输出电路533送来的例如等响度曲线的信息校正上述减法器528输出中的允许噪声电平。在这里,所谓等响度曲线是与人类听觉特性有关的特性曲线,例如,就是求出可以听到与1KHz纯音有相同大小的各频率下的音声的声压并将其连接成曲线,称为响度的等灵敏曲线。该等响度曲线所描绘的曲线与图14所示最小可听曲线RC基本相同。在该等响度曲线上,例如,在4KHz附近,与1KHz的点相比即使声压降低8~10dB听着也与1KHz的大小相同,反之,在50Hz附近,如果不比1KHz的声压高15dB就听不到相同大小的声音。为此,可知超过上述最小可听曲线RC电平的噪声(允许的噪声电平)还是具有由与该等响度曲线对应的曲线给出的频率特性为好。由此可知,考虑到上述等向度曲线校正上述允许噪声电平是适合于人类听觉特性的。
上面,在可以使用的总比特128kb/s内,用某一比例进行比特分配从而产生依赖于所述听觉允许噪声电平的频谱形状。输入信号的音调越高,该比例就越小。
接着,说明关于两种比特分配方法之间的比特量分割的方法。
返回图10,把来自提供了MDCT电路13、14、15的输出的输入端子801的信号还送到频谱平滑度计算电路808上,在这里,计算频谱的平滑度。在本实施例中,计算信号频谱绝对值相邻值之差的绝对值之和除以信号频谱绝对值之和所得之值,作为上述频谱的平滑度。
把上述频谱平滑度计算电路808的输出送到比特分割率判定电路809上,在这里,判定依赖于能量的比特分配与依靠听觉允许噪声频谱的比特分配之间的比特分割率。考虑频谱平滑度计算电路808的输出值越大频谱越没有平滑度,进行把以依靠听觉允许噪声频谱的比特分配作为重点而不是把以依赖于能量的比特分配作为重点的比特分配。比特分割判定电路809把控制输出送到乘法器811和812上,乘法器811和812分别控制依赖于能量的比特分配和依靠听觉允许噪声频谱的比特分配的大小。在这里,假定频谱是平滑的,如同将分配重点放在依赖于能量的比特分配那样,当比特分配率判定电路809向乘法器811输出的值取为0.8时,比特分配率判定电路809向乘法器812输出的值则为1-0.8=0.2。用加法器806把这两个乘法器811、812的输出相加,成为最终的比特分配信息,从输出端子807输出。
图15、图16示出这时的比特分配情况。图17、图18示出与之对应的量化噪声的情况。图15示出信号频谱为比较平坦的情况,图16示出信号频谱为高音调的情况。此外,图15和图16中QS表示依赖于信号电平那一部分的比特分配的比特量,QN表示依赖于听觉允许噪声那一部分的比特分配的比特量。图17和图18中L表示信号电平,NS表示根据依赖于信号电平那部分的噪声降低部分,NN表示根据依赖于听觉允许噪声电平那部分的比特分配的噪声降低部分。
首先,在示出信号频谱为比较平坦的情况下的图15中,依赖于听觉允许噪声电平的比特分配在得到遍及全频带的大信噪比时有用。但是,在低频段和高频段所占用的比特分配较少。这是因为听觉对这种频带的噪声的灵敏度小。虽然作为依赖于信号能量级的比特分配部分所占用的量少了,但是,在这种情况下,分配的重点放在中、低频段信号电平的高频领域以便产生加权的噪声频谱。
与此相反,如图16所示那样地,在表示信号频谱为高音调的情况下,依赖于信号能量级的比特分配量变多了,量化噪声的降低用于降低频带极窄的噪声。依赖于听觉允许噪声电平的比特分配并未由此明显地集中起来。
如图16所示那样地,借助于这两种比特分配之和,实现孤立频谱输入信号特性的提高。
在上面那样得到的基本比特分配上,附加下面那样的上述附加比特分配(步骤ST3)部分。
接着,利用图19,说明关于基本比特分配和附加比特分配部分的分离和重放时的结合。
首先,假定,把图1中MDCT电路13、14、15的输出即MDCT系数送到图19的输入端子900上。即,图1的自适应比特分配编码电路16、17、18中包括着图19中编码电路。
在图19中,通过归一化电路905对送到上述输入端子900上的MDCT系数(MDCT取样)的每多个取样按块进行归一化处理、即块浮动。这时,得到比例因子,作为表示进行了什么程度的块浮动的系数。
下一级的第1量化器(quantizer)901以上述基本比特分配给出的各取样字长进行量化。这时,为了减小量化噪声进行根据四舍五入的量化。
把上述归一化电路905的输出和上述量化器901的输出送到差分器902上。即,在该差分器902中,得到量化器901输入与输出之差(量化误差)。把该差分器902的输出通过归一化电路906送到第2量化器903上。
在该第2量化器903中,例如,每一个取样使用2比特。归一化电路906中的比例因子从第1量化器901中用的比例因子和字长中自动地判定。
即,在图19的编码器中,第1量化器901中用的字长例如为N比特时,可以得到在归一化电路906中用的比例因子为(2**N)。
上述用于附加比特分配的第二量化器903中,进行与上述用于基本比特分配的第1量化器901同样地包括四舍五入处理的比特分配。这样,借助于两种量化,可以分成两种比特分配。
在这里,如果用于附加比特分配的字长是不固定的,如前述那样因为根据附加比特分配成分的大小可以从基本比特分配的比例因子和字长算出附加比特分配的比例因子,所以,在解码器中只需要字长。在本实施例中,因为附加比特分配的字长固定为2比特,所以,甚至连用于附加比特分配的字长也不需要了。这样便实现了量化器901和903的输出为已分别四舍五入了的高效率量化。
如果量化器901和903的输出比特率都是固定的,就能够使得在磁盘、磁带等媒体上记录时系统变得简单。也可以假定二者的比特率可变但总比特率恒定。当然,也可以假定仅一个量化器的输出比特率恒定。
与图19的构成(编码器)对应的构成(解码器)中,设置进行与上述归一化电路905、906对应的反归一化处理的反归一化电路908、907,反归一化电路908、907的输出在加法器904中相加。该相加后的输出从输出端子901取出。
图20示出用于把已这样高效率编码了的信号重新解码的基本的本发明实施例的解码装置。
图20中,把各频带已量化了的MDCT系数送到解码装置输入端子122、124、126上,把所使用的块尺寸信息送到输入端子123、125、127上。解码电路116、117、118利用由与已量化的MDCT系数同时送来的比例因子和字长变成的自适应比特分配信息来解除比特分配。
接着,在IMDCT电路113、114、115中,把频域信号变换成时域信号。借助于IQMF电路112、111把这些部分频带的时域信号解码成为全频带信号。
即,上述基本比特分配的128kb/s的比特分配和上述附加比特分配的64kb/s分别在上述解码电路116、117、118中解码。而且,在这两个解码部分分别解码以后,把时间轴上的取样分别相加,形成高精度取样。
当然,在图20中,也可以就IMDCT电路113、114、115的各个输出分别计算基本比特分配输出和附加比特分配输出,然后,把它们合成,送到IQMF电路112、111上。
在解码电路116、117、118中,还可以把基本比特分配和附加比特分配在解除了归一化处理以后进行相加,对相加的结果进行IMDCT和IQMF处理,得到最终输出。
本发明实施例的记录媒体是把借助于应用了上述那样的本发明实施例的量化装置的高效率编码装置已量化和编码了的信号记录下来的装置,作为记录媒体能够举出来的有例如在光盘、磁光盘、磁盘等盘状记录媒体上记录了上述编码信号的装置;在磁带等带状记录媒体上记录了上述编码信号的装置;或者,记录了编码信号的半导体存储器,即所谓IC卡等。
关于在本发明实施例记录媒体上的数据排列方式,如图21所示。即,假定一个同步块由同步信息、子信息(比例因子、字长)、基本比特分配和附加比特分配形成。
在这种情况下,在把时域取样或频域取样量化以后,至少借助于由各个取样单独地对前级的量化误差重新进行量化那样的一种量化功能,分解成至少两个字,在一个同步块中按每个量化输出分离开来并记录下来或传送出来之后进行解码、重放,这在能够把在降低比特率重放的情况下必须去掉的一部分比特串汇总去掉方面是有效的。
作为其它方法,在把时域取样或频域取样量化以后,至少借助于由各个取样单独地对前级的量化误差重新进行量化那样的一种量化功能,分解成至少两个字,在一个同步块中把各量化输出按频率或时间顺序交错地记录下来或传送出去,从时域取样或频域取样中解码重放,这在能够在降低比特率重放的情况下把因受频带限制而必须去掉的部分比特串汇总去掉方面是有效的。
以上那样的比特排列,可用于特别是例如利用磁光盘和光盘的所谓小型盘(Mini Disc)、磁带媒体、通信媒体等。
正如通过上面的说明可以了解到的那样,在本发明中,能够得到以下效果。即,(1)当解码时使用的比特率低于编码时所使作的比特率(例如,在编码器那一侧,把编码处理以后的一部分比特挪用于传输其它数据)时,能使音质劣化为最小。
(2)在使用以往以低的比特率进行重放的重放设备时,当引入使用较高比特率的、音质良好的系统时,能够提供与以以往使用的低比特率进行重放的重放设备有后向互换性的系统。
(3)在使用了较贵的存储器件(例如IC卡)的存储媒体上进行记录时,为了把记录时间从起始设定值延长时,能够把记录完了的、或者记录中的编码信息的比特率适当降低以延长记录时间,并能使这时的音质劣化为最小。
(4)能够使用多个廉价的、常用的、以较低比特率进行比特分配的解码器来构成高音质解码器,借此,不需要作成新解码器使用的大规模集成电路(LSI),就能够达到廉价的目的。
权利要求
1.一种把输入信号的时域取样或频域取样量化的量化装置,其特征是,在这种装置中,在把所述时域取样或频域取样量化以后,至少借助于具有由对各个取样单独地对前级量化中的量化误差重新进行量化的一种量化装置,把时域取样或频域取样至少分解成两个字。
2.根据权利要求1中所述的一种量化装置,其特征是,所述量化装置进行四舍五入操作。
3.根据权利要求1或2中所述的一种量化装置,其特征是,至少把一种所述量化装置的输出比特率在恒定时间单位内作为恒定的比特率。
4.根据权利要求3中所述的一种量化装置,其特征是,把全部所述量化装置的输出比特率在恒定时间单位内作为恒定的比特率。
5.根据权利要求1中所述的一种量化装置,其特征是,对时域取样或频域取样按每多个取样为一个块进行块浮动处理,用于把所述前级量化的量化误差重新量化的取样数据的比例因子至少从用于所述前级量化的量化输出的比例因子中求出。
6.根据权利要求5中所述的一种量化装置,其特征是,用于把所述前级量化的量化误差重新量化的取样数据的比例因子至少从用于所述前级量化的量化输出的比例因子和字长中求出。
7.根据权利要求5中所述的一种量化装置,其特征是,对有关时间和频率已细分了的小块中的取样数据,在该小块内进行具有同一块浮动和字长的量化。
8.一种把已把时域取样或频域取样量化了的信号解码的解码装置,其特征是,对所述时域取样或频域取样,具有把与同一时域或同一频域的取样有关的至少两个部分取样合成为一个取样的合成装置。
9.一种把已知时域取样或频域取样量化了的信号解码的解码装置,其特征是,对所述时域取样或频域取样,具有把与同一时域或同一频域的取样有关的至少两个部分取样分别个别地作为全频带宽度的时域取样以后合成为一个取样的合成装置。
10.一种把已把时域取样或频域取样量化了的信号解码的解码装置,其特征是,对所述时域取样或频域取样,具有把与同一时域或同一频域的取样有关的至少两个部分取样分别个别地作为部分频带宽度的时域取样以后在分别的部分频带内合成为一个取样、进而合成全频带宽度的时域取样的合成装置。
11.根据权利8、9或10中所述的一种解码装置,其特征是,在所述量化时,在把所述时域取样或频域取样量化以后,至少借助于由各个取样单独地对前级量化中的量化误差重新进行量化的一种量化装置,把时域取样或频域取样至少分解成两个字,至少把一种所述量化装置的输出比特率在恒定时间单位内作为恒定的比特率。
12.根据权利要求11中所述的一种解码装置,其特征是,在所述量化时,在把所述时域取样或频域取样量化以后,至少借助于由各个取样单独地对前级量化中的量化误差重新进行量化的一种量化装置,把时域取样或频域取样至少分解成两个字,把全部所述量化装置的输出比特率在恒定时间单位内作为恒定的比特率。
13.根据权利要求12中所述的一种解码装置,其特征是,在所述量化时,对时域取样或频域取样按每多个取样为一个块进行块浮动处理,用于把所述前级量化的量化误差重新量化的取样数据的比例因子至少从用于前级量化的量化输出的比例因子中求出。
14.一种记录媒体,其特征是,该记录媒体是这样构成的在把时域取样或频域取样量化以后,借助于由各个取样单独地对前级量化中的量化误差至少重新进行一次量化,把时域取样或频域取样至少分解成两个量化值,至少把所述两个量化值记录下来。
15.一种把输入信号的时域或频域的给定取样量化的量化方法,其特征是,在这种方法中,把所述给定取样量化,生成第1量化值,运算所述给定取样与所述第1量化值的量化误差,由各个取样单独地对所述量化误差进行量化,生成第2量化值。
16.根据权利要求15中所述的一种量化方法,其特征是,借助于根据四舍五入操作的量化,至少生成所述第1量化值和所述第2量化值中的一个。
17.根据权利要求15中所述的一种量化方法,其特征是,以恒定的比特率把所述第1量化值和所述第2量化值中的至少一个输出。
18.根据权利要求15中所述的一种量化方法,其特征是,以成为恒定比特率那样地输出所述第1量化值和所述第2量化值的总和。
19.根据权利要求15中所述的一种量化方法,其特征是,利用第1比例因子对所述给定取样按每个由多个取样构成的块进行块浮动处理,利用根据所述第1比例因子求出的第2比例因子把所述量化误差归一化。
20.根据权利要求15中所述的一种量化方法,其特征是,根据所述第1比例因子和生成所述第1量化值时的字长求出所述第2比例因子。
21.根据权利要求15中所述的一种量化方法,其特征是,对在时间和频率上已细分了的小块中的取样数据,在该小块内以同一比例因子和字长进行归一化和量化。
22.一种对输入信号的时域取样或频域取样进行比特分配的高效率编码装置,其特征是,在这种装置中,在把所述时域取样或频域取样量化以后,至少借助于具有由各个取样单独地对前级量化的量化误差重新进行量化的一种量化装置,把时域取样或频域取样至少分解成两个字。
23.根据权利要求22中所述的一种高效率编码装置,其特征是,所述量化装置进行四舍五入操作。
24.根据权利要求22或23中所述的一种高效率编码装置,其特征是,至少把一种所述量化装置的输出比特率在恒定时间单位内作为恒定的比特率。
25.根据权利要求24中所述的一种高效率编码装置,其特征是,把全部所述量化装置的输出比特率在恒定时间单位内作为恒定的比特率。
26.根据权利要求22中所述的一种高效率编码装置,其特征是,对时域取样或频域取样按每多个取样为一个块进行块浮动处理,用于把所述前级量化的量化误差重新量化的取样数据的比例因子至少从用于前级量化的量化输出的比例因子中求出。
27.根据权利要求26中所述的一种高效率编码装置,其特征是,用于把所述前级量化的量化误差重新量化的取样数据的比例因子至少从用于所述前级量化的量化输出的比例因子和字长中求出。
28.根据权利要求22中所述的一种高效率编码装置,其特征是,对在时间和频率上已细分了的小块中的取样数据,进行在小块内具有同一块浮动、或同一块浮动和字长的量化。
29.一种对输入信号的时域取样或频域取样进行比特分配以后把该输入信号编码、把该已编码的信号记录到记录媒体上的高效率编码装置,其特征是,在这种装置中,在把所述时域取样或频域取样量化以后,至少借助于具有由各个取样单独地对前级量化的量化误差重新进行量化的一种量化装置,把时域取样或频域取样至少分解成两个字,同时,在一个同步块中,把全部所述量化装置的输出取样分别分离,以恒定时间单位进行记录。
30.一种对输入信号的对域取样或频域取样进行比特分配以后把该输入信号编码、把该已编码的信号记录到记录媒体上的高效率编码装置,其特征是,在这种装置中,在把所述时域取样或频域取样量化以后,至少借助于具有由一个一个取样单独地对前级量化的量化误差重新进行量化的一种量化装置,把时域取样或频域取样至少分解成两个字,同时,在一个同步块中,把所述量化装置各自的输出取样按所述每个量化装置以时间顺序或频率顺序交错地进行记录。
31.一种对时域取样或频域取样进行比特分配、把已编码的信号解码的高效率解码装置,其特征是,在这种装置中,对所述时域取样或频域取样,具有把与同一时域或同一频域的取样有关的至少两个部分取样合成为一个取样的合成装置。
32.一种对时域取样或频域取样进行比特分配、把已编码的信号解码的高效率解码装置,其特征是,在这种装置中,对所述时域取样或频域取样,具有把与同一时域或同一频域的取样有关的至少两个部分取样分别个别地作为全频带宽度的时域取样以后合成为一个取样的合成装置。
33.一种对时域取样或频域取样进行比特分配、把已编码的信号解码的高效率解码装置,其特征是,在这种装置中,对所述时域取样或频域取样,具有把与同一时域或同一频域的取样有关的至少两个部分取样分别个别地作为部分频带宽度的时域取样以后在各自的部分频带中把所述部分取样合成为一个取样、进而合成全频带宽度的时域取样的合成装置。
34.根据权利要求31、32或33中所述的一种高效率解码装置,其特征是,至少把一种所述已编码信号的比特率在恒定时间单位内作为恒定的比特率。
35.根据权利要求34中所述的一种高效率解码装置,其特征是,全部所述已编码信号的比特率在恒定时间单位内为恒定的比特率。
36.根据权利要求35中所述的一种高效率解码装置,其特征是,对所述已编码信号中时域取样或频域取样按每多个取样为一个块进行块浮动处理,用于把前级量化误差重新量化的取样数据的比例因子至少从用于把所述时域取样或频域取样量化了的量化输出的比例因子中求出。
37.根据权利要求31中所述的一种高效率解码装置,其特征是,对在时间和频率上已细分了的小块内进行了具有同一块浮动、或同一块浮动和字长的量化的取样数据进行解码。
38.一种把输入信号编码的高效率编码方法,其特征是,在这种方法中,把总比特分配分割成基本比特分配和附加比特分配,把所述输入信号的时域或频域的给定取样以基于所述基本比特分配的字长量化,生成第1量化值,运算所述给定取样与所述第1量化值的量化误差,由各个取样单独地对所述量化误差进行量化,作为所述附加比特分配生成第2量化值。
39.根据权利要求38中所述的一种高效率编码方法,其特征是,借助于根据由四舍五入操作的量化至少生成所述第1量化值和所述第2量化值中的一个。
40.根据权利要求38中所述的一种高效率编码方法,其特征是,以恒定的比特率至少把所述第1量化值和所述第2量化值中的一个输出。
41.根据权利要求38中所述的一种高效率编码方法,其特征是,以成为恒定比特率那样地输出所述第1量化值和所述第2量化值的总合。
42.根据权利要求38中所述的一种高效率编码方法,其特征是,利用第1比例因子对所述给定取样按每个由多个取样构成的块进行块浮动处理,利用根据所述第1比例因子求出的第2比例因子把所述量化误差归一化。
43.根据权利要求38中所述的一种高效率编码方法,其特征是,根据所述第1比例因子和生成所述第1量化值时的字长求出所述第2比例因子。
44.根据权利要求38中所述的一种高效率编码方法,其特征是,对在时间和频率上已细分了的小块中的取样数据,在该小块内,以同一比例因子和字长进行归一化和量化。
45.一种记录编码信号的记录媒体,其特征是,该媒体是这样构成的把总比特分配分割成基本比特分配和附加比特分配,把所述输入信号的时域或频域的给定取样以基于所述基本比特分配的字长量化,生成第1量化值,运算所述给定取样与所述第1量化值的量化误差,由各个取样单独地对所述量化误差进行量化,作为所述附加比特分配生成第2量化值,把所述第1量化值和所述第2量化值记录下来。
全文摘要
在本发明中,在把例如音频信号等输入信号的时域取样或频域取样量化时,所采用的方法允许例如把MDCT系数作为频域取样进行块浮动处理,此后,将其量化,产生第一量化值;计算在第一量化值与MDCT系数之间的量化误差,由一个取样单独地产生每一个量化误差以产生第二量化值;由此,至少把MDCT系数分解成两个字。这样,根据本发明可使音质的劣化保持为最低限度,并能确保后向兼容性。
文档编号H04B14/04GK1117776SQ94191140
公开日1996年2月28日 申请日期1994年11月9日 优先权日1993年11月9日
发明者赤桐健三 申请人:索尼公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1