信息编码方法和设备、信息解码方法和设备、信息传输方法以及信息记录媒体的制作方法

文档序号:2819772阅读:252来源:国知局
专利名称:信息编码方法和设备、信息解码方法和设备、信息传输方法以及信息记录媒体的制作方法
技术领域
本发明涉及通过高效率编码用来把信息(例如,输入数字数据)编码的信息编码方法和设备、用来把已编码信息解码的信息解码方法和设备、用来传输已编码信息的信息传输方法以及记录着已编码信息的信息记录媒体。
背景技术
存在着各种音频或语言信号的高效率编码技术。这些技术的例子包括变换编码,其中,通过正交变换把在时间轴上表示音频信号的一帧数字信号变换成在频率轴上表示该音频信号的一组频谱系数;以及,子带编码(SBC),其中,通过滤波器组把音频信号的频带分割成多个子带,而不是在编码以前使信号沿着时间轴形成帧。还已知子带编码与变换编码的组合,其中,通过频带分割把在时间轴上表示音频信号的信号分割成频带,然后,通过频谱变换变换成频率轴上的信号,把通过频谱变换得到的频率分量每个频带地编码。
在用来把频谱分割成多个等宽频率范围的滤波器中,包括正交镜像滤波器(QMF),正如R.E.Crochiere在55 BellSyst.Tech.J.No.8(1976)“Digital Coding of Speech inSub-bands(语言在子带中的数字编码)”中所讨论的那样。利用QMF滤波器,把信号频谱分割成两个等宽频带。利用QMF,当接着把从分割所形成的频带组合在一起时,并不产生混淆。
在1983年Boston(波士顿)ICASSP会议上,JosephH.Rothweiler发表的“Polyphase Quadrature Filters-A NewSubbaud Coding Technique(多相正交滤波器—一种新的子带编码技术)”中,描述了把信号频谱分割成等宽频带的技术。利用当前的多相QMF,一次就可以把信号频谱分割成多个等宽频带。
还已知一种正交变换技术,这种技术包括把数字输入音频信号分割成已预定持续时间的帧;以及,利用用来把信号从时间轴变换成频率轴的离散富里叶变换(DFT)、离散余弦变换(DCT)和改进的DCT,处理所形成的帧。在1987年ICASSP会议上,J.P.Princen和A.B.Bradley发表的“Subband Transform CodingUsing Filter Bank Based on Time Domain Aliasing Cancellation(利用基于时域混淆抵消的滤波器组的子带变换编码)”中,可以找到关于MDCT的讨论。
通过把以频带为基础利用滤波器或频谱变换已分割的信号量化,就能够控制受到量化噪声干扰的频带,通过利用所谓掩码效果,可以实现音质上更有效的编码。如果以信号分量绝对值的最大值把信号分量一个频带一个频带地归一化,就能够进行更有效的编码。
在量化从正交变换所形成的频谱系数的技术中,利用运用人类听觉系统音质特性的子带是已知的。即,可以把在频率轴上表示音频信号的频谱系数分割成多个临界频带,例如25个临界频带。临界频带的宽度随频率的提高而增大。在这样的量化系统中,把比特自适应地在各种临界频带中分配。例如,当把自适应的比特分配用于从MDCT形成的频谱系数数据时,利用自适应分配的比特数把每一个临界频带中由MDCT产生的频谱系数数据量化。
当前已知的有下列两种比特分配技术。例如,在IEEE声学、语言和信号处理议事录,1977年8月,vol.ASSP-2S,No.4中的在每一个临界频带中以信号幅度为基础执行比特分配。这种技术产生平坦的量化噪声频谱,并且,噪声能量最小,但是,听众察觉的噪声电平并非最佳,因为这种技术没有有效地利用音质掩码效果。
在1980年ICASSP会议上,M.A.Krassner描述的比特分配技术“The Critical Band Encoder-Digital Encoding of thePerceptual Requirament of the Auditory System(临界频带编码器—听觉系统感觉要求的数字编码)”中,利用音质掩码机制对每个临界频带决定产生所需信噪比的、固定的比特分配。然而,如果利用正弦波测量这一系统的信噪比,则得到非最佳结果,这是因为在临界频带中为固定的比特分配。
为了克服这些不便之处,提出了一种高效率编码设备,其中,把可用于比特分配的比特总数在为每个小块预定的固定比特分配结构、与以块为基础信号大小决定的比特分配之间分割,而且,分割比取决于与输入信号相关的信号来设定,使得信号频谱越平滑,对固定比特分配结构的分割比就变得越大。
在这种设备中,如果能量集中于特定频谱分量上,正如在正弦波输入的情况下那样,就把较多的比特数分配给包括该频谱分量的块,以便显著改善整体的信噪比特性。因为人类听觉系统对具有尖锐频谱分量的信号很敏感,所以,这种技术可用来改善信噪比,不仅改善测量值,还改善人耳察觉的音质。
除了上述技术以外,还提出了其它多种技术,模拟人类听觉系统的模型也精确了,使得如果改善编码设备的能力,就可以按照人类听觉系统以较高效率进行编码。


图1示出用来编码作为时间轴上波形信号的声音信号的传统编码设备的基本构成。
参看图1,变换电路101把送到端子100上的音频信号波形变换成音频信号的频率分量,接着,利用信号分量编码电路102将其编码。代码串发生电路103把代码排列成代码串,从端子104输出。
图2示出图1所示变换电路101说明性的构成。
参看图2,频谱分割电路201把送到相当于图2所示端子100的端子200上的音频信号分割成4个频带,分割电路201可以是上述多相正交滤波器。用来实现正交变换的正交变换电路211~214,例如MDCT电路,把通过频谱分割滤波器201得到的相应频带的音频信号变换成频谱分量。即,输入到频谱变换电路211~214上的每个音频信号的带宽等于送到端子200上的信号带宽的四分之一,使得通过端子200送来的音频信号以速率1~4倍次取样。频谱变换电路211~214的输出通过端子221~224馈到图1所示信号分量编码电路102上。
当然,图1所示变换电路101可以以所需方式变型。例如,可以利用MDCT把输入音频信号直接变换成频谱分量,而MDCT可以被DFT或DCT取代。
图3示出图1所示信号分量编码电路102说明性的构成。
参看图3,在传送到量化电路303以前,归一化电路301把送到端子300上的、信号分量编码电路102的输出以频带为基础归一化。到端子300的输入信号还馈到量化步长决定电路302上。量化电路303基于量化步长决定电路303根据通过端子300送来频谱分量计算的量化步长,把来自归一化电路301已归一化的频谱分量量化。来自量化电路303的已量化频谱分量通过端子304,馈到图1中代码串发生电路103上。通过端子304输出的信号除了来自量化电路303的已量化频谱分量之外,还包含归一化电路301中的归一化系数信息和决定电路302中的量化步长信息。
图4示出用来从图1所示编码设备产生的代码串中解码音频信号,并且,输出已解码音频信号的信号解码设备的基本构成。
参看图4,信号串分解电路401从图1所示构成产生的、并且,通过端子400送来的代码串中,提取相应信号分量的代码。信号分量解码电路402根据这些代码恢复信号分量。反变换电路403通过反变换处理已解码的信号分量,该反变换为图1中变换电路101所执行操作的反操作。反变换产生音频波形信号,从端子404输出。
图5示出图4所示反变换电路403说明性的构成。
图5示出图2所示变换电路的配对电路说明性的构成。执行反频谱变换的反频谱变换电路511~514处理从信号分量解码电路402通过端子501~504送来的信号,该反频谱变换为图2所示频谱变换的反变换。频带合成滤波器515把反正交变换电路511~514产生相应频带的信号合成,频带合成滤波器515执行图2所示频谱分割滤波器201所执行频谱分割的反操作。频带合成滤波器515的输出从相应于图4所示端子404的端子521输出。
图6示出传统编码方法的一个例子。在图6所示例子中,频谱分量信号是图2所示变换电路产生的那些信号。图6中,频谱信号绝对值的电平表示为通过MDCT变换成相应dB值。
图6中,从一个预定的时间块到另一个时间块,把输入信号变换成64个频谱信号。把这64个频谱信号分组,成为5个预定的频带,这里称之为编码单元,即图6中b1~b5,以便以编码组为基础,归一化和量化。向着低频段时,使相应编码单元b1~b5的带宽较窄;向着高频段时,使其较宽,以便允许与人类听觉系统的特性一致地控制量化噪声的产生。
然而,正如从图6可以看出的那样,如果对每个预定的频带实现归一化,则包含音调型分量的编码单元b3中的信号归一化以由音调型分量决定的、较大的归一化系数值为基础来进行。利用这一归一化系数值,把编码单元b3中包含的全部频谱分量归一化。音调型音频信号中包含的噪声成为耳朵的障碍。此外,如果音调型分量没有以较高精度量化,当把音调型分量与相邻时间块的波形合成时,就会产生显著的连接失真。为此,需要以足够的比特数把音调型分量量化。然而,如果基于预定的频带决定量化步长,就需要对包含音调型分量的编码单元中大量的频谱分量分配较多的比特数,这样,降低了编码效率。
利用上述传统方法,以同一量化步长量化频率分量的频带是固定的。为此,如果频谱分量集中于几个特定频率附近,并且,如果这些频谱分量要以足够精确的量化步长来量化,就需要对与那些频谱分量属于同一频带的大量频谱分量分配较多的比特数。
一般,频谱能量集中于特定频率上的音调型音频信号中包含的噪声比能量平缓地分布在宽频率范围内音频信号中包含的噪声更使耳朵讨厌。另一方面,如果具有较大能量的频谱分量,即音调型分量,没有以足够精确的量化步长量化,当把这种频谱分量恢复成时间轴上的波形信号,并且,把所形成的波形信号与在时间上相邻的块合成时,块到块的失真就变得较大。换句话说,当把所形成的波形信号与相邻时间块的波形信号合成时,产生较大的连接失真,这样,对人类听觉系统又出现了干扰。这样,利用传统的方法,提高音调型音频信号的编码效率而不劣化信号质量,是很困难的。
为了避免这样的不便之处,本受让人在No.PCT/JP94/00880国际申请(国际
公开日期1994年12月8日,No.WO 94/28633国际出版物)中,提出通过把输入信号分成信号能量集中于特定频率上的音调型分量、和信号能量平缓地分布在宽频率范围内的非音调型分量,用来实现高编码效率的方法。
与上述基于固定频带量化频率分量的方法相比,利用以前提出的方法,通过在频率轴上极窄范围内、以精确的量化步长量化音调型分量;并且,通过在记录媒体上、与在频率轴上的位置一起记录所形成的数据,可以实现更有效的编码。作为一个高效率编码说明性的例子,提出了用来把中心在每个音调型分量的能量最大频谱分量附近的、预定个数的频谱信号归一化和量化,并且,把所形成频谱信号编码的方法。
然而,PCT/JP94/00880中提出的方法包括,有关每个音调型分量量化地、用来量化各音调型分量的量化步长的信息,或者以同一量化步长量化全部音调型分量。如果采用前一种方法,就需要把大量的比特数用于编码有关同样的量化步长信息,这对实现高效率编码来说,是不合乎理想的。另一方面,如果采用后一种方法,就不能对各个音调型分量都把量化步长设定为最佳值。
因此,本发明的主要目标是,提供一种信息编码的方法和设备、一种信息解码的方法和设备、一种信息传输的方法以及一种信息记录媒体,借此,首先是,能够有效地编码音调型音频信号,并且,能够对各个音调型分量最佳地设定量化步长。
本发明的公开本发明提供一种用来编码输入信号的信息编码方法,这种方法包括下列步骤把该输入信号变换成频率分量;把该频率分量分离成为由音调型分量组成的第一信号和由非音调型分量组成的第二信号;用第一编码方法编码所述第一信号,用第二编码方法编码第二信号;基于由第一编码和第二编码产生的已编码信号产生代码串,以便传输或记录。该代码串包含在至少一个与信号分离有关的基准参数和一个与第一编码有关的参数的基础上分组的、以便有公共值的部分信息串。
本发明还提供一种用来传输已编码信号的信息传输方法,该已编码信号是通过把该输入信号变换成频率分量;把该频率分量分离成为由音调型分量组成的第一信号和由非音调型分量组成的第二信号;把该第一信号和该第二信号编码而产生的。这种传输方法包括下列步骤传输相应于第一信号的第一代码串;传输相应于第二信号的第二代码串。第一代码串包含在至少一个与信号分离有关的基准参数和一个与第一编码有关的参数的基础上分组的、以便有公共值的部分信息串。
本发明还提供一种用来解码由已编码信号组成的代码串的信息解码方法。这种解码方法包括下列步骤用第一解码方法,把相应于由音调型分量构成的第一信号的已编码信号解码,以便产生第一已解码信号;用第二解码方法,把相应于由非音调型分量构成的第二信号的已编码信号解码,以便产生第二已解码信号;把该第一和第二已解码信号合成,以便恢复原始信号。第一解码或恢复利用唯一的用于解码或恢复的参数。
本发明还提供一种用来编码输入信号的信息编码设备,这种设备具有用来把该输入信号变换成频率分量的装置;用来把该频率分量分离成为由音调型分量组成的第一信号和由非音调型分量组成的第二信号的装置;用来用第一编码方法编码第一信号,用第二编码方法编码第二信号的装置;基于由第一编码和第二编码产生的已编码信号,用来产生代码串以便传输或记录的装置。该代码串包括在至少一个与信号分离有关的基准参数和一个与第一编码有关的参数的基础上分组的、以便有公共值的部分信息串。
本发明提供一种信息记录媒体,在其上记录着通过传输一个已编码信号而产生的已编码信号,前面那个已编码信号是通过把该输入信号变换成频率分量,把该频率分量分离成为由音调型分量组成的第一信号和由非音调型分量组成第二信号,并把该第一信号和该第二信号编码而产生的。相应于第一信号的第一代码串和相应于第二信号的第二代码串互相分开地记录着。代码串包括在至少一个与信号分离有关的基准参数和一个与第一编码有关的参数的基础上分组的、以便有公共值的部分信息串。
本发明进而提供一种用来解码由已编码信号组成的代码串的信息解码设备。这种解码设备具有用来用第一解码方法,把相应于由音调型分量构成的第一信号的已编码信号解码,以便产生第一已解码信号的装置;用来用第二解码方法,把相应于由非音调型分量构成的第二信号的已编码信号解码,以便产生第二已解码信号的装置;用来把该第一和第二已解码信号合成,以便恢复原始信号的装置。第一解码或恢复利用唯一的用于解码或恢复的参数。
利用根据本发明的信息编码方法和设备,通过把第一信号作为音调型分量根据公共信息分类成部分信息串,不编码那些空白的部分信息串;并且,通过共同编码指示已编码部分信息串的信息,即,通过把音调型分量分成组,不编码那些不包含音调型分量的组,并且,编码已编码的组的个数,就可以实现高效率编码。
利用根据本发明的信息传输方法和信息记录媒体,通过传输利用根据本发明的信息编码方法和设备已编码的信息,就可以实现有效的传输。
利用根据本发明的解码方法和设备,把除了那些未编码的空白部分信息串以外的、指示已编码部分信息串的信息解码,并且,基于该解码结果,对根据公共信息分类为音调型分量的第一信号中包括的部分信息串进行解码。
附图的简要描述图1为示出传统编码设备基本配置的方框图;图2为示出传统编码设备的变换电路说明性配置的方框图;图3为示出传统信号分量编码电路说明性配置的方框图;图4为示出传统解码电路基本配置的方框电路图;图5为示出传统解码电路中反变换电路说明性配置的方框电路图;图6示出通过与本发明比较,根据传统技术的编码方法;图7为示出实施本发明信息编码设备一种配置的方框图;图8为示出实施本发明信息解码设备一种配置的方框图;图9示出包含音调型分量的频谱信号;图10示出除去了音调型分量的频谱信号;图11为示出分离音调型分量的处理流程的流程图;图12为示出决定构成登记的音调型分量的频谱信号个数的处理流程的流程图;图13示出示范性代码串;图14示出利用本发明编码方法产生的代码串;图15示出另一示范性代码串;图16示出再一示范性代码串;图17为示出根据本发明恢复单元另一例子的方框电路图;图18为示出在把音调型分量分组的期间内处理流程的流程图;图19为示出根据本发明信息解码方法处理流程的流程图。
用来执行本发明的最佳方式下面,将参看附图详细说明本发明优选的说明性实施例。
图7示出实施本发明信息编码设备的一种配置。
参看图7,把音频波形信号送到端子600上。变换电路601把音频波形信号变换成信号频率分量,然后,把信号频率分量送到信号分量分离电路602上。在信号分量分离电路602中,把变换电路601产生的信号频率分量分离成为具有陡峭频谱分布的音调型分量、和其余信号频率分量,即具有平坦频谱分布的噪声型分量。音调型分量编码电路603把所形成频率分量的表示陡峭频谱分布的音调型分量编码,噪声型分量编码电路604把其余信号频率分量,即噪声型分量编码。代码串发生电路605把音调型分量编码电路603和噪声型分量编码电路604的输出形成代码串,把该代码串输出到ECC编码器606上。
ECC编码器606把误差校正码加到代码串发生电路605输出的代码串上。在传输到录音磁头608上以前,EFM电路607调制ECC编码器606的输出。录音磁头608把EFM电路607的输出代码串记录到磁盘609上。信号分量分离电路602把音调型分量信息数据的个数、位置信息和有关频谱分量的个数信息输出到代码串发生电路605上。
变换电路601可以采用类似于图2所示的配置。
当然,变换电路601可以采用与图2所示不同的构成。例如,可以利用MDCT把输入信号直接变换成频谱信号,或者采用DFT或DCT(而不采用MDCT)变换成频谱信号。音调型分量编码电路603和噪声型分量编码电路604可以采用与图3所示基本相同的配置来实现。
图8示出用来把从图7所示编码电路得到代码串解码的解码电路的构成。
参看图8,把利用重放磁头708从磁盘609再生的代码串送到EFM电路709上,EFM电路709把输入代码串解调。把已解调的代码串送到ECC解码器710上,进行误差校正。代码串分解电路701基于有关在误差校正代码串中所包含音调型分量的信息数据的个数,识别该代码串的哪一部分是音调型分量码,并且,把输入代码串分离成为音调型分量码和噪声型分量码。另一方面,代码串分离电路701从输入代码串把音调型分量的位置信息和频谱分量的个数信息分离出来,并且,把已分离的信息输出到下行那一边的合成电路704上。把音调型分量码和噪声型分量码分别送到音调型分量解码电路702和噪声型分量解码电路703上,在这里,将其反量化和去归一化,以便解码。把已解码信号从电路702和703送到合成电路704上,合成电路704执行图7所示信号分量分离电路602所执行分离的反操作,即合成。
合成电路704基于从分离电路701送来的位置信息和频谱分量的个数信息,把已解码的音调型分量信号加到已解码的噪声型分量信号的预定位置上,以便在频率轴上合成噪声型和音调型分量。反变换电路705对已合成已解码的信号进行反变换,反变换电路705执行图7所示变换电路601所执行变换的反操作,即反变换,使得信号从频率轴上的信号恢复成时间轴上的音频波形信号。来自反变换电路705的输出波形信号从端子707输出。反变换和合成的操作可以颠倒,在此情况下,图8所示恢复电路711具有图17所示的构成。反变换电路712把来自解码电路703、在频率轴上的已解码噪声型分量信号反变换成在时间轴上的噪声型分量信号。反变换电路713把来自音调型分量解码电路702的已解码音调型分量信号,排列到由从代码串分离电路701传输的音调型分量的频谱个数信息和位置信息规定的、在频率轴上的位置上;并且,对所形成的信号进行反变换,以便产生在时间轴上的音调型分量信号。合成电路714把来自反变换电路712的在时间轴上的噪声型分量信号、与来自反变换电路713的在时间轴上的音调型分量信号合成,以便恢复原始的音频波形信号。
下面,说明信息编码方法和信息解码方法如何用于图7所示编码设备和图8所示解码设备的构成的基础知识。
从频率分量把音调型分量分离出来的方法示于图9,其中,提取四个音调型分量TCA、TCB、TCC和TCD。音调型分量以频谱分量中的很少几个分布着,正如图9例子所示那样。因此,如果以较精确的量化步长量化这些分量,则整体的量化比特数并未增加过甚。虽然为了提高编码效率可以把音调型分量归一化,接着进行量化,但是,为了简化设备,也可以把归一化和量化处理省略掉,因为构成音调型分量的频谱信号个数很少。此外,根据图9所示的例子,构成音调型分量的频谱信号的个数在3、5和7当中可变,这样,音调型分量TCA由3个频谱信号构成、音调型分量TCB由7个频谱信号构成、音调型分量TCC和TCD分别由3个频谱信号构成,而这些频谱信号的中心就在最大频谱信号附近,即,最大频谱信号为具有局部最大值的频谱信号。在这种情况下,可以在下述假设下进行编码,即,各个音调型分量由3、5或7个频谱信号构成。应该指出,在所示例子中,没有由5个频谱信号构成的音调型分量。
图10示出一个例子,其中,为了只示出噪声型分量,把音调型分量从图9所示原始频谱信号中去掉。在图10中,因为已把音调型分量从各个编码单元(频带)b1~b5的原始频谱信号中去掉,所以,在b1~b5的每个编码单元中归一化系数的数值较小,使得甚至在使用较小的量化比特数时,都可以减小量化噪声。
图11示出利用信号分量分离电路602分离音调型分量的处理流程。
图11中,I表示频谱信号的序号,N表示频谱信号的总数,P、R表示预定的系数。至于音调型分量,如果频谱信号的绝对值在局部大于其余频谱信号的值,而且,比在该频谱信号时间块中的频谱信号绝对值的最大值大到超过预定值,并且如果频谱信号的能量与相邻频谱信号(例如,两个直接相邻的频谱信号)的能量之和与在包含该频谱信号的预定频带内总能量的关系大于预定的比值,就可以认为该频谱信号以及例如,那两个直接相邻的信号都是音调型分量。向着低频段和高频段,可以例如与临界带宽一致地把作为比较能量分布比值的基础的预定频带选择成较窄和较宽,以便考虑人类听觉系统的音质特性。
在图11中,在步骤S1中,以频谱信号的最大绝对值代替变量A0。在步骤S2中,把频谱信号的序号I设定为1。在步骤S3中,以时间块中频谱信号的绝对值(下面,称为频谱绝对值)代替变量A。
在步骤S4中,判断上述频谱信号的绝对值在局部是否大于其它频谱信号之值,即该频谱信号是否是具有局部最大绝对值的频谱信号。如果结果是“否”,即如果上述绝对频谱值不是具有局部最大绝对值的频谱分量,程序就转移到步骤S10。否则,程序转移到步骤S5。
在步骤S5中,把在包含具有局部最大绝对值的频谱信号的时间块中、具有局部最大值的频谱信号的变量A,对频谱信号的最大绝对值的变量A0的比值的大小与表示预定大小的系数P的大小相比较(AA0>P]]>)。如果(AA0>P]]>),程序就转移到步骤S6,否则,即如果(AA0≤P]]>),程序就转移到步骤S10。
在步骤S6中,以与具有局部最大绝对值的频谱分量相邻的频谱分量的能量值,例如两个相邻频谱分量的能量之和,代替变量X。在紧接在后面的步骤S7中,以在包含具有局部最大绝对值的频谱分量和相邻频谱分量的预定频带中的总能量值,代替变量Y。
在紧接在后面的步骤S8中,把用于能量值的变量X、对在预定带宽中能量值的变量Y的比值,与表示预定值的系数R相比较(XY>R]]>)。如果结果是“是”,即如果(XY>R]]>),程序就转移到步骤S9。如果结果是“否”,即如果XY≤R]]>,程序就转移到步骤S10。
在步骤S9中,如果具有局部最大绝对值的频谱信号和相邻频谱信号的能量、对在包含这些频谱信号的预定频带中的能量的比值不小于预定值,就可以认为具有局部最大绝对值的频谱信号和相邻频谱信号都是音调型分量,并且,把这样的结果登记下来。
在紧接在后面的步骤S10中,判断在步骤9中登记的频谱信号的个数I是否等于频谱信号的总数N(I=N)。如果结果是“是”,程序就结束。如果结果是“否”,即如果I不等于N,程序就转移到步骤S11,此处,把I增大(I=I+1),即对每个步骤把频谱信号的个数增大1,以便返回到步骤S3,重复上述处理步骤。
图12示出决定作为图9例子中音调型分量登记的构成音调型分量的频谱信号个数的处理流程。
在图12中,把构成音调型分量的频谱信号的最大个数设定为7。如果中心在具有局部最大绝对值的频谱信号附近的3个或5个频谱信号的能量、对中心在具有局部最大绝对值的频谱信号附近的7个频谱信号的能量的比值超过预定比值P,就把构成音调型分量的频谱信号的个数分别设定为3或5。虽然在当前的例子中,登记的音调型分量是以前分类的,但是,这样的分类当然可以与利用具有局部最大绝对值的频谱信号的个数提取音调型分量同时进行,正如在步骤S9中找出作为登记的音调型分量的个数那样地。
在图12中,在步骤S21中,把登记的音调型分量的个数设定为变量M。在步骤S22中,把音调型分量的个数设定为1。在步骤S23中,以与局部最大频谱分量相邻的7个频谱信号的能量值,代替变量Y。在步骤S24中,以与局部最大频谱分量相邻的3个频谱信号的能量值,代替变量X。
在步骤S25中,判断上述7个相邻频谱信号的能量值、对3个频谱信号的能量值的比值( )是否超过预定比值P(XY>P]]>)。如果结果是“是”,即如果该比值超过P,程序就转移到步骤S26。如果结果是“否”,即如果该比值不超过P,程序就转移到步骤S27。
在步骤S26,把音调型分量的频谱信号的个数设定为3,把该音调型分量作为3个频谱的音调型分量登记。然后,程序就转移到步骤S31。
在步骤S27中,以中心在局部最大频谱信号附近的5个相邻频谱信号的能量值,代替变量X。在紧接在后面的步骤S28中,判断7个相邻频谱信号的能量值、对5个频谱信号的能量值的比值 是否超过预定比值P(XY>P]]>)。如果结果是“是”,即如果该比值超过P,程序就转移到步骤S29。如果结果是“否”,即如果该比值不超过P,程序就转移到步骤S30。
在步骤S29中,把音调型分量的频谱信号的个数定为5,把该音调型分量作为5个频谱的音调型分量登记。然后,程序就转移到步骤S31。
在步骤S30中,把音调型分量的频谱信号的个数定为7,该音调型分量作为7个频谱的音调型分量登记。然后,程序就转移到步骤S31。
在步骤S31中,决定在步骤S21中设定的音调型分量的个数M是否等于音调型分量的个数I(I=M)。如果结果是“是”,即如果I=M,程序就结束。如果结果是“否”,即如果I不等于M,程序就转移到步骤S32。
在步骤S32中,对每个步骤把I增大1(I=I+1),以便返回到步骤S23,重复上述处理步骤。
图13示出信息数据的排列,当把该信息数据如上述那样地分离成音调型分量和噪声型分量时,根据本受让人提出(提交日期,1995年9月15日)、在美国专利申请书SN 08/306659中描述的编码方法,进行编码,以便记录或传输。因为可以把记录媒体视为传输通路,所以,在这里,“传输”这个术语包括把信息记录到记录媒体上。
在图13中,把音调型分量分组传输,每个组包括相同个数的频谱分量。即,在当前的例子中,把指示构成全部各音调型分量的频谱信号的个数等于3的信息,音调型分量的个数(对3个频谱的音调型分量,STC3=3),和音调型分量TCA、TCC、TCD的内容,即音调型分量的信息数据tcA、tcC、tcD作为部分音调型分量信息串传输。把指示构成全部各音调型分量的频谱信号的个数等于5的信息、和指示构成全部各音调型分量的频谱信号的个数等于7的信息,以类似方式,作为部分音调型分量信息串LTC2、和部分音调型分量信息串LTC3,连同音调型分量TCB的内容,即音调型分量的信息数据tcB,接着传输。如果把音调型分量分组传输,每个组具有相同个数的构成频谱信号,就不需要传输有关构成构成频谱信号的频谱信号个数的信息了,使得在存在着大量音调型分量的情况下,也能够有效地编码。
有关音调型分量tc的信息包括,指示音调型分量的频谱位置中心的中心位置信息CP,例如对于音调型分量TCC,CP=31;有关指示量化比特数的量化步长的信息QP(例如,QP=6);有关归一化系数的信息NP;和有关指示构成音调型分量的其余频谱信号的归一化值和量化值的相应信号分量的信息,例如信息SC1、SC2、……SC3。
有关噪声型分量的信息以与图10中频带b1~b5分别有关的nC1、nC2、nC3、nC4和nC5的顺序记录或传输。有关噪声型分量的信息nC包括,有关量化步长的信息QP(在信息nC1的情况下,QP=3);有关归一化系数的信息NP;和有关分别已归一化和已量化的信号分量的信息,例如信息SC1、SC2、……SC3。
然而,在当前例子的代码串中,任凭没有由5个频谱信号构成的音调型分量,需要传输频谱信号的个数。在该说明性的例子中,只允许频谱信号以三种不同的个数构成音调型分量。然而,在需要以相同的编码方法对信息数据进行编码,而且,该编码方法取决于可变压缩比和所要求的音质等级的那种编码设计说明中,需要准备大量的、构成音调型分量的频谱信号;而为未使用的音调型分量数据的部分串传输有关音调型分量信息数据的个数,是没有效率的。
图14示出,在把图9所示频谱信号根据考虑了上述要求的本发明传输方法编码的情况下代码串的构成的一个例子。
在图14中,首先传输有关音调型分量的信息部分串的个数nLTC(在图9和14的例子中,nLTC=2),后面是一些有关音调型分量的信息部分串LTC11和LTC12,正如在这里规定的那样。在图14的例子中,在部分串LTC11中指示音调型分量信息数据tc的个数的个数N11(在当前的例子中,N11=3);指示构成音调型分量的频谱信号的个数的构成频谱分量的频谱信号个数nSP(在当前的例子中,nSP=3);有关音调型分量tcA、tcC和tcD的真正信息,作为部分串LCT11传输。因为在当前的例子中,构成音调型分量的频谱信号的任一个数都不等于5,所以,不编码这样的部分信息串。在部分串LCT12中指示音调型分量信息数据tc的个数的个数N12(在当前的例子中,N12=3);指示构成音调型分量的频谱信号的个数的构成音调型分量的频谱信号个数nSP(在当前的例子中,nSP=7);有关音调型分量tcB的真正信息,作为部分串LCT12传输。因为没有必要传输有关音调型分量空白部分信息串的信息,所以,可以实现有效的编码,尤其是,如果由于前面讨论的原因必须允许种类不同的部分信息串的话。
在图4的例子中,通过分组而产生有关音调型分量的部分信息串,分组时,基于构成音调型分量的频谱信号的个数。然而,本发明的方法可用于这样的情况,通过把有关音调型分量的信息分组而构成音调型分量的部分信息串,但是,分组时,不是基于构成音调型分量的频谱信号的个数,而是基于其它属性。
具体地说,分组可以基于有关量化步长的信息而进行。参看图9、15、17和18,说明基于有关量化步长的信息进行分组的说明性例子。
假定,信号分量分离电路602从频率分量中把音调型分量分离出来,如图9所示。在当前的例子中,正如以前所说明那样地提取4个音调型分量TCA、TCB、TCC和TCD。如果允许以相应于有关量化步长QP=6的信息的量化步长,或者,以相应于量化步长QP=4的信息的量化步长量化频谱分量,音调型分量编码电路603中的量化步长决定电路就以下列方式决定各个音调型分量的量化步长。
图18示出利用音调型分量编码电路603,取决于量化步长,把音调型分量分组的说明性处理流程。在图18中,对于以前通过图11处理而提取和登记的音调型分量进行分组。在当前的例子中,如果中心在音调型分量中心频谱信号附近的5个频谱信号的能量值、对预定频带中的能量值的比值超过数值P,就把该音调型分量分组为以有关量化步长QP=6的信息量化的音调型分量。否则,就把该音调型分量分组为以有关量化步长QP=4的信息量化的音调型分量。
参看图18,在步骤S21中,以音调型分量已登记的个数代替变量M。在步骤S22中,把音调型分量的个数设定为1。在紧接在后面的步骤S23中,以预定频带的能量值,代替变量Y。在步骤S24中,以相邻5个频谱信号的能量值,代替变量X。
在步骤S25中,判断5个相邻频谱信号能量值的变量X对预定频带的能量值的变量Y的比值是否大于数值P(XY>P]]>)。如果结果是“是”,即如果 大于P,程序就转移到步骤S26。如果结果是“否”,即如果 小于P,程序就转移到步骤S27。
在步骤S26中,把音调型分量作为是带有量化步长信息QP=6的音调型分量分组或登记。在步骤S27中,把音调型分量作为是带有量化步长信息QP=4的音调型分量分组或登记。然后,程序转移到步骤S28。
在步骤S28中,判断音调型分量的个数I是否等于登记的音调型分量个数的变量M。如果结果是“是”,程序就结束。如果结果是“否”,程序就转移到步骤S29,此处,把音调型分量的个数I增大(I=I+1),以便返回到步骤S23,重复上述处理步骤。
音调型分量编码电路603以这一方式决定每个音调型分量的量化步长。例如,以相应于有关量化步长QP=6的信息的量化步长把TCA、TCC和TCD量化,给出tcA、tcC和tcD。除了有关频谱信号个数的信息以外,还把以上述方式量化了的有关音调型分量的信息、有关量化步长的信息、和有关分组的信息送到代码串发生电路605上,然后,该代码串发生电路605基于上述数据,产生并且输出图15所示的代码串。
图15示出基于有关量化步长的信息,构成部分信息串的例子。在当前的例子中,假定,对全部音调型分量来说,构成音调型分量的频谱信号的个数是相同的。当然可以把构成音调型分量的频谱信号的个数编码,作为是有关各个音调型分量的信息的一部分。
在图15当前的例子中,首先传输音调型分量的部分信息串的个数nLTC(在图15的例子中,nLTC=2),后面是一些这里规定的部分信息串LTC21和LTC22。在图15的例子中,在部分信息串LTC21中指示音调型分量tc的个数的个数N21即以相应于有关量化步长QP=6的信息的量化步长量化的音调型分量的个数(在这里,N21=3);有关量化步长的信息QP(在这里,QP=6);和有关实际已量化音调型分量tcA、tcC和tcD的信息,以此顺序,作为音调型分量的部分信息串LTC21传输。另一方面,在部分信息串LTC22中指示音调型分量tc的个数的个数N22,即以相应于有关量化步长QP=4的信息的量化步长量化的音调型分量的个数(在这里,N22=1);有关量化步长的信息QP(在这里,QP=4);和有关实际已量化音调型分量tcB的信息,以此顺序,作为音调型分量的部分信息串LTC22传输。
这消除了使有关量化步长的信息随着各个音调型分量而不同的必要性。例如,有关图15中音调型分量tcC的信息可以仅由中心位置信息CP、归一化系数信息NP和有关各个信号分量的信息SC构成。这样,在图15的例子中,可以改善编码效率,特别是,如果有大量音调型分量的话。
各个信息数据的传输顺序当然可从上述加以改变。例如,可以把有关量化步长QP=6的信息、有关音调型分量的信息数据的相应个数N21=3、有关量化步长QP=4的信息和有关音调型分量的信息数据的相应个数N22=1作为一个块,首先传输,接着,可以传输指示音调型分量tcn的内容的、有关音调型分量的信息。
图18以流程图形式示出,把相应于图15所示代码串的、音调型分量的信息串解码的处理流程。在图18的流程图中,顺序地把相应组中包括的音调型分量的个数和根据信息已编码的音调型分量解码。
参看图18,在步骤S31中,以有关带有有关量化步长QP=6的音调型分量的信息数据的个数,代替变量M1。在紧接在后面的步骤S32中,把该组中包含的音调型分量解码,以便构成M1个有关音调型分量的信息数据。
在步骤S33中,以有关带有有关量化步长QP=4的音调型分量的信息数据的个数,代替变量M2。在紧接在后面的步骤S34中,把该组中包含的音调型分量解码,以便构成M2个有关音调型分量的信息数据。
图16示出通过根据本发明方法编码产生的代码串的另一例子。在当前例子中,基于有关音调型分量的频谱信号的个数的信息和有关量化步长的信息,把有关音调型分量的信息分组。在这种情况下,提高了编码效率,因为不论有关构成音调型分量的频谱信号个数的信息、还是有关量化步长的信息都不是有关音调型分量的信息,而且,只要从一个有关音调型分量的信息部分串到另一个有关音调型分量的信息部分串把音调型分量编码,就足够了。在图13所示方法中,对于频谱分量的个数、与有关量化步长信息的全部组合,都需要把有关音调型分量的部分信息串编码。在本发明方法中,因为把那些不是空白串的、有关音调型分量的部分信息串编码就足够了,所以,可以显著改善编码效率。
虽然在上述例子中,把有关音调型分量的部分信息串的个数编了码;但是,利用指示是否要把有关各个音调型分量的部分信息串编码的标志信息,还是可能的。这样的安排可以包括在本发明的范围内。然而,把已编码部分信息串的个数编码是更有效的,正如在上述实施例中所表明的那样。
在上面的描述中,把中心位置信息CP作为音调型分量的位置信息传输。然而,也可以对每个音调型分量,传输其最低频谱信号的位置(例如,对于音调型分量TCC为30),来代替传输其中心位置的信息。
为了提高编码效率,虽然把具有集中于作为音调型分量而特定的频率附近的频谱能量的频谱分量分离和编码是合乎理想的;但是,信号分离未必需要基于频谱能量,而且,那些在特定范围内、以其在频率轴上的位置信息编码的频谱分量可能就包括在根据本发明的音调型分量中。
此外,在以上说明中,记录媒体为磁盘609,但是,该记录媒体也可以是光盘、磁光盘、或相位转换盘。记录媒体还可以是音频带盒或视频带盒中采用的带状记录媒体;诸如硬磁盘或软磁盘的盘状记录媒体;或者,诸如IC存储卡的半导体记录媒体。
以上所作的描述主要与音频信号有关。然而,本发明也可用于一般波形信号的编码上。然而,本发明用于音频信号上最有效,因为有关音调型分量的信息在人类听觉系统方面具有重要的意义。
为了编码音调型分量,虽然把各个音调型分量归一化、接着,量化了,但是,本发明也可用于量化而不归一化的音调型分量上。然而,提高编码效率首先要归一化,接着把那些音调型分量量化,正如上述实施例中那样。
本发明对于噪声型分量的编码方法并不局限于后面是编码的重新量化,而是也可用于后面是编码的归一化。
本发明提供一种有效地实现在我们的共同未决的PCT/JP94/00880和美国专利申请书SN 08/306659中所描述方法的说明性方法,而且,本发明可用于这些共同未决的申请书中提出的各种方法。
利用根据本发明的信息编码方法和设备,通过把第一信号作为音调型分量根据公共信息分类成部分信息串,不编码那些空白的部分信息串;并且,通过共同编码指示已编码部分信息串的信息,即,通过把音调型分量分成组,不编码那些不包含音调型分量的组,并且,编码已编码的组的个数,就可以实现高效率编码。
利用根据本发明的信息传输方法和信息记录媒体,通过传输利用根据本发明的信息编码方法和设备已编码的信息,就可以实现有效的传输。
利用根据本发明的解码方法和设备,把除了那些末编码的空白部分信息串以外的、指示已编码部分信息串的信息解码,并且,基于该解码结果,对根据公共信息分类为音调型分量的第一信号中包括的部分信息串进行解码。
利用本发明的方法,可以把音调型信号有效地编码,因此,总的来说,可以实现高效率编码。当遇到不同的压缩比和音质等级、要求根据同一标准实现编码时,本发明可取的效果可以非常明显地体现出来。
权利要求
1.一种用来编码输入信号的方法,包括把该输入信号变换成频率分量;把该频率分量分离成为由音调型分量组成的第一信号和由其它分量组成的第二信号;用第一编码方法编码所述第一信号;用第二编码方法编码所述第二信号;以及基于由所述第一编码和第二编码产生的已编码信号产生代码串,以便传输或记录;所述代码串包括在至少一个与信号分离有关的基准参数和一个与第一编码有关的参数的基础上分组的、以便有公共值的部分信息串。
2.根据权利要求1中所述的方法,其中,代码串只包含相应于实际上在所述第一编码中已编码的信号的部分信息串,还包含指示该部分信息串的构成的信息。
3.根据权利要求1中所述的方法,其中,基准参数是指示构成通过信号分离分离出来的音调型分量的频谱信号的个数的信息。
4.根据权利要求1中所述的方法,其中,第一编码包括量化所述第一信号的量化;所述基准参数是有关该量化的量化步长的信息。
5.根据权利要求1中所述的方法,其中,第一编码包括量化所述第一信号的量化;所述基准参数是指示构成通过所述信号分离分离出来的各个音调型分量的频谱信号的个数的信息和有关该量化的量化步长的信息。
6.根据权利要求2中所述的方法,其中,指示部分信息串的构成的信息指示部分信息串的个数。
7.一种用来传输通过把该输入信号变换成频率分量,把该频率分量分离成为由音调型分量组成的第一信号和由其它分量组成的第二信号,把所述第一信号和第二信号编码而产生的已编码信号的方法,包括传输相应于所述第一信号的第一代码串;以及传输相应于所述第二信号的第二代码串;所述第一代码串包括在至少一个与信号分离有关的基准参数和一个与第一编码有关的参数的基础上分组的、以便有公共值的部分信息串。
8.根据权利要求7中所述的方法,其中,代码串只包含相应于实际上在所述第一编码中已编码的信号的部分信息串,还包含指示该部分信息串的构成的信息。
9.根据权利要求7中所述的方法,其中,基准参数是指示构成通过信号分离分离出来的音调型分量的频谱信号的个数的信息。
10.根据权利要求7中所述的方法,其中,第一编码包括量化所述第一信号的量化;所述基准参数是有关该量化的量化步长的信息。
11.根据权利要求7中所述的方法,其中,第一编码包括量化所述第一信号的量化;所述基准参数是指示构成通过所述信号分离分离出来的各个音调型分量的频谱信号的个数的信息和有关该量化的量化步长的信息。
12.根据权利要求7中所述的方法,其中,指示部分信息串的构成的信息指示部分信息串的个数。
13.一种用来解码由已编码信号组成的代码串的方法,包括用第一解码方法,把相应于由音调型分量构成的第一信号的已编码信号解码,以便产生第一已解码信号;用第二解码方法,把相应于由其它分量构成的第二信号的已编码信号解码,以便产生第二已解码信号;以及把所述第一和第二已解码信号合成,以便恢复原始信号;所述第一解码或所述恢复利用唯一的用于解码或恢复的参数。
14.根据权利要求13中所述的方法,其中,代码串只包含相应于实际上在所述第一编码中已编码的信号的部分信息串,还包含指示该部分信息串的构成的信息。
15.根据权利要求13中所述的方法,其中,唯一的参数是指示构成每个音调型分量的频谱信号的个数的信息。
16.根据权利要求13中所述的方法,其中,第一解码包括反量化所述第一信号的反量化;所述基准参数是有关量化的量化步长的信息。
17.根据权利要求13中所述的方法,其中,第一解码包括反量化所述已编码信号的反量化;所述基准参数是指示构成各个音调型分量的频谱信号的个数的信息和有关该反量化的量化步长的信息。
18.根据权利要求14中所述的方法,其中,指示部分信息串的构成的信息指示部分信息串的个数。
19.一种用来编码输入信号的设备,包括用来把该输入信号变换成频率分量的装置;用来把该频率分量分离成为由音调型分量组成的第一信号和由其它分量组成的第二信号的分离装置;用来用第一编码方法编码所述第一信号的第一编码装置;用来用第二编码方法编码所述第二信号的第二编码装置;以及基于由所述第一和第二编码装置产生的已编码信号,用来产生代码串以便传输或记录的装置,所述代码串包括在至少一个与通过分离装置的信号分离有关的基准参数和一个与通过第一编码装置的编码有关的参数的基础上分组的、以便有公共值的部分信息串。
20.根据权利要求19中所述的设备,其中,代码串只包含相应于实际上在所述第一编码装置中已编码的信号的部分信息串,还包含指示部分信息串的构成的信息。
21.根据权利要求19中所述的设备,其中,基准参数是指示构成通过信息分离分离出来的音调型分量的频谱信号的个数的信息。
22.根据权利要求19中所述的设备,其中,第一编码装置包括用来量化所述第一信号的量化装置;所述基准参数是有关该量化的量化步长的信息。
23.根据权利要求19中所述的设备,其中,第一编码装置包括用来量化所述第一信号的量化装置;所述基准参数是指示构成通过所述信号分离分离出来的各个音调型分量的频谱信号的个数的信息和有关该量化的量化步长的信息。
24.根据权利要求20中所述的设备,其中,指示部分信息串的构成的信息指示部分信息串的个数。
25.一种信息记录媒体,在其上记录着通过传输一个已编码信号而产生的已编码信号,前面那个已编码信号是通过把该输入信号变换成频率分量、把该频率分量分离成为由音调型分量组成的第一信号和由其它分量组成的第二信号、把所述第一和第二信号编码而产生的,其中,相应于第一信号的第一代码串和相应于第二信号的第二代码串互相分开地记录着;所述第一代码串包括在至少一个与信号分离有关的基准参数和一个与第一信号的编码有关的参数的基础上分组的、以便有公共值的部分信息串。
26.根据权利要求25中所述的信息记录媒体,其中,代码串只包含相应于实际上在所述第一编码中已编码的信号的部分信息串,还包含指示部分信息串的构成的信息。
27.根据权利要求25中所述的信息记录媒体,其中,代码串只包含相应于实际上在所述第一编码中已编码的信号的部分信息串,还包含指示部分信息串的构成的信息。
28.根据权利要求25中所述的信息记录媒体,其中,第一编码包括量化所述第一信号的量化;所述基准参数是有关该量化的量化步长的信息。
29.根据权利要求25中所述的信息记录媒体,其中,第一编码包括量化所述第一信号的量化;所述基准参数是指示构成通过所述分离分离出来的各个音调型分量的频谱信号的个数的信息和有关该量化的量化步长的信息。
30.根据权利要求25中所述的信息记录媒体,其中,指示部分信息串的构成的信息指示部分信息串的个数。
31.一种用来解码由已编码信号组成的代码串的设备,包括用来用第一解码方法,把相应于由音调型分量构成的第一信号的已编码信号解码,以便产生第一已解码信号的第一解码装置;用来用第二解码方法,把相应于由其它分量构成的第二信号的已编码信号解码,以便产生第二已解码信号的第二解码装置;用来把所述第一和第二已解码信号合成,以便恢复原始信号的恢复装置;所述第一解码装置或所述恢复装置利用唯一的用于解码或恢复的参数。
32.根据权利要求31中所述的设备,其中,代码串只包含相应于实际上在所述第一编码中已编码的信号的部分信息串,还包含指示部分信息串的构成的信息。
33.根据权利要求31中所述的设备,其中,唯一的参数是指示构成每个音调型分量的频谱信号的个数的信息。
34.根据权利要求31中所述的设备,其中,第一解码装置包括反量化所述第一信号的反量化装置;所述基准参数是有关通过该反量化装置反量化的量化步长的信息。
35.根据权利要求31中所述的设备,其中,第一解码装置包括反量化所述已编码信号的反量化装置;所述基准参数是指示构成各个音调型分量的频谱信号的个数的信息和有关通过该反量化装置反量化的量化步长的信息。
36.根据权利要求32中所述的装置,其中,指示部分信息串的构成的信息指示部分信息串的个数。
全文摘要
根据本发明,为了编码输入信号,把该输入信号变换成频率分量;把该频率分量分离成为由音调型分量组成的第一信号和由其它分量组成的第二信号。把第一和第二信号分别编码,基于由第一和第二编码产生的已编码信号产生代码串,以便传输或记录。例如,只把第一信号编码,并使代码串包括在至少一个与信号分离有关的基准参数和一个与第一编码有关的参数的基础上分组的以便有公共值的部分信息串。这样,可以实现比传统技术更有效的编码。
文档编号G10L25/93GK1126004SQ9519025
公开日1996年7月3日 申请日期1995年3月31日 优先权日1994年4月1日
发明者筒井京弥, 下吉修, 园原美冬 申请人:索尼公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1