编码装置和方法、解码装置和方法以及程序与流程

文档序号:11161298阅读:682来源:国知局
编码装置和方法、解码装置和方法以及程序与制造工艺

本技术涉及编码装置和方法、解码装置和方法以及程序。更具体地,本技术涉及能够在资源贫乏的设置中获取高质量的声音的编码装置和方法、解码装置和方法以及程序。



背景技术:

存在利用音频信号的频段扩展的概念的已知编码技术(例如,参见专利文献1和专利文献2)。

通过这样的编码技术,作为音频信号输入的时间序列信号被划分为低频段成分和高频段成分。对低频段信号执行常规编码,并且低频段信号与高频段信号之间的关系、高频段信号的特征等作为附加信息被传输。

此外,在解码时,在恢复低频段信号之后,使用低频段信号和附加信息生成扩展频段信号。然后,组合低频段信号和扩展频段信号以实现频段扩展。

更具体地,在恢复低频段信号之后,通过频段划分滤波器将低频段信号划分为频段,并且使用经划分的低频段信号和附加信息来生成扩展频段信号。然后,通过频段组合滤波器来组合低频段信号和扩展频段信号,并且获得频段扩展时间序列信号。

然而,在如上所述使用频段划分滤波器和频段组合滤波器的情况下,由于滤波处理诸如频段划分处理和频段组合处理,信号编码与解码之间的基本延迟增加。因此,音频信号的输入与输出之间的响应速度变低。

此外,除了常规的解码处理以外,还需要由滤波器组等执行的滤波处理如频段划分处理和频段组合处理。因此,吞吐量和存储器使用量大大增加,这使得难以在资源贫乏的设置诸如嵌入式装置中安装解码装置。

为了改进这样的编码技术,存在用于在频率区域中实现频段扩展的技术(例如,参见专利文献3)。

通过该技术,通过改进型离散余弦变换(MDCT)获得的频谱在编码时被划分为低频段侧(基本频段)和高频段侧(扩展频段)。对基本频段信号执行常规编码,并且基本频段的频谱与扩展频段的频谱之间的关系、扩展频段的频谱的特征等作为附加信息被传输。

此外,在解码时,使用基本频段的频谱和附加信息来生成扩展频段的频谱,然后组合基本频段的频谱和扩展频段的频谱。以此方式,生成整个频段的频谱。此外,对所获得的整个频段的频谱执行改进型离散余弦逆变换(IMDCT)。因此,整个频段的频谱被变换成时间序列信号(时间信号)。

引用列表

专利文献

专利文献1:日本专利第5329714号

专利文献2:日本专利第5325293号

专利文献3:日本专利申请特许公开第2011-215198号



技术实现要素:

本发明要解决的问题

然而,在通过MDCT获得的频谱(该频谱在下文中也被称为MDCT频谱)中,振幅分量和相位分量两者都被考虑到每个频率区的值中。因此,根据涉及频率区域中的频段扩展的技术,在解码时使用MDCT频谱来精密调整扩展频段的频谱的振幅的情况下,每个频谱的相位分量以及频谱之间的相互相位关系受到严重干扰。

在这种情况下,如果要编码或解码的当前音频信号是具有高噪声性质的音乐声音或人类语音的信号,则在音频信号中不会引起人耳可察觉的音质劣化。

然而,在音频信号是能量集中在效果声音或乐器的特定频率的音频信号的情况下,或者在音频信号是具有高有调度的信号的情况下,通常集中在某些频率的能量由于解码而分散在相邻频率的频谱中。因此,通过解码最终获得的音频信号具有噪声性质,并且对人耳而言音质劣化。

在涉及如上所述的频率区域中的频段扩展的技术中,不需要对时间序列信号执行频段划分处理和频段组合处理。因此,即使在资源贫乏的设置中也可以在没有任何延迟的情况下执行声音编码和解码。然而,在某些情况下不能获得高质量的声音。

鉴于这样的情况提出了本技术,并且本技术旨在即使在资源贫乏的设置中也能够获取高质量的声音。

问题的解决方案

本技术的第一方面的解码装置包括:获取单元,其获取低频段频谱以及扩展频段的单个扩展系数或者构成扩展频段的各频段的扩展系数,扩展频段不同于低频段,单个扩展系数或者扩展系数用于获得扩展频段的扩展频谱;生成单元,其根据单个扩展系数或者各频段的扩展系数来生成扩展频谱;以及组合单元,其组合低频段频谱和扩展频谱。

生成单元可以根据低频段频谱和扩展系数来生成扩展频谱。

生成单元可以通过根据扩展系数对从低频段频谱获得的频谱的水平进行调整来生成扩展频谱。

当扩展频谱是根据单个扩展系数生成的时,生成单元可以根据扩展系数对频谱的整个扩展频段的水平进行调整。当扩展频谱是根据各频段的扩展系数生成的时,生成单元可以根据频段的扩展系数来对频谱中的频段的水平进行调整。

生成单元可以通过根据扩展系数对预定噪声的水平进行调整来生成扩展频谱。

低频段频谱的值可以由原始时间序列信号的振幅分量和相位分量确定。

低频段频谱可以是MDCT频谱。

本技术的第一方面的解码方法或程序包括下述步骤:获取低频段频谱以及扩展频段的单个扩展系数或者构成扩展频段的各频段的扩展系数,扩展频段不同于低频段,单个扩展系数或者扩展系数用于获得扩展频段的扩展频谱;根据单个扩展系数或者各频段的扩展系数来生成扩展频谱;以及组合低频段频谱和扩展频谱。

在本技术的第一方面中,获取低频段频谱以及扩展频段的单个扩展系数或者构成扩展频段的各频段的扩展系数,扩展频段不同于低频段,单个扩展系数或者扩展系数用于获得扩展频段的扩展频谱。根据单个扩展系数或者各频段的扩展系数生成扩展频谱,以及组合低频段频谱和扩展频谱。

本技术的第二方面的编码装置包括:特征量提取单元,其从通过对时间序列信号执行正交变换而获得的频谱中提取特征量;计算单元,其基于特征量,根据频谱来计算扩展频段的单个扩展系数或者构成扩展频段的各频段的扩展系数,扩展频段不同于频谱的低频段,单个扩展系数或者扩展系数用于获得扩展频段的扩展频谱;以及多路复用器,其通过对作为频谱的低频段成分的低频段频谱和扩展系数进行多路复用来生成代码串。

特征量可以是指示频谱的有调度的信息。

当频谱的有调度高时,计算单元可以计算单个扩展系数。当频谱的有调度低时,计算单元可以计算各频段的扩展系数。

计算单元可以计算频谱的扩展频段的平均振幅与低频段频谱的平均振幅之间的比率,并且将该比率设置为扩展系数。

当频谱的低频段的有调度高而频谱的扩展频段的有调度低时,计算单元可以计算关于频谱的扩展频段的包络信息作为扩展系数。

频谱的值可以由时间序列信号的振幅分量和相位分量确定。

正交变换可以是MDCT。

本技术的第二方面的编码方法或程序包括下述步骤:从通过对时间序列信号执行正交变换而获得的频谱中提取特征量;基于特征量,根据频谱来计算扩展频段的单个扩展系数或者构成扩展频段的各频段的扩展系数,扩展频段不同于频谱的低频段,单个扩展系数或者扩展系数用于获得扩展频段的扩展频谱;以及通过对作为频谱的低频段成分的低频段频谱和扩展系数进行多路复用来生成代码串。

在本技术的第二方面中,从通过对时间序列信号执行正交变换而获得的频谱中提取特征量。基于特征量,根据频谱来计算扩展频段的单个扩展系数或者构成的扩展频段的各频段的扩展系数,扩展频段不同于频谱的低频段,单个扩展系数或者扩展系数用于获得扩展频段的扩展频谱。通过对作为频谱的低频段成分的低频段频谱和扩展系数进行多路复用来生成代码串。

本发明的效果

根据本技术的第一方面和第二方面,即使在资源贫乏的设置中也能够获得高质量的声音。

应当注意,本技术的效果不限于这里描述的效果,并且可以包括本公开中描述的任何效果。

附图说明

图1是示出编码装置的示例配置的图示。

图2是用于说明频谱区域和边界的曲线图。

图3是用于说明低频段倒转(reverse)伪振幅频谱的曲线图。

图4是用于说明高频段频谱的划分的曲线图。

图5是用于说明编码处理的流程图。

图6是示出解码装置的示例配置的图示。

图7是用于说明解码处理的流程图。

图8是用于说明高有调度信号的曲线图。

图9是用于说明高频段伪振幅频谱的平均值的曲线图。

图10是用于说明扩展频谱水平调整的曲线图。

图11是用于说明由于水平调整而被干扰的有调度的曲线图。

图12是用于说明扩展频谱水平调整的曲线图。

图13是示出在低频段中具有高有调度以及在高频段中具有低有调度的示例信号的曲线图。

图14是用于说明扩展频谱生成和音质劣化的曲线图。

图15是用于说明包络系数和扩展频谱生成的曲线图。

图16是用于说明编码处理的流程图。

图17是用于说明解码处理的流程图。

图18是示出计算机的示例配置的图示。

具体实施方式

下面参照附图描述应用本技术的实施方式。

<第一实施方式>

<编码装置的示例配置>

图1是示出应用本技术的编码装置的实施方式的示例配置的图示。

图1所示编码装置11包括MDCT单元21、频谱量化单元22、低频段特征量提取单元23、高频段特征量提取单元24、频谱特性确定单元25、扩展系数计算单元26、扩展系数量化单元27以及多路复用器28。

将作为采样频率Fs[kHz]的时间序列信号的输入信号作为要编码的当前音频信号提供给MDCT单元21。

例如,MDCT单元21对所提供的输入信号执行作为正交变换的MDCT,并且获得从作为DC成分的频率Dc[kHz]到作为采样频率Fs的一半的频率Fs/2的频谱。

应当注意,在下面描述的示例情况下,执行MDCT作为正交变换。然而,只要振幅分量和相位分量两者都被考虑到通过正交变换获得的频谱的值中,则可以执行除MDCT之外的任何变换。

此外,为了提高本示例中的编码效率,通过正交变换获得的频谱中的实际上要编码的成分是从频率Dc到听觉敏感的频率Fc[kHz]的成分,其余的频谱被丢弃。也就是说,要丢弃频谱中从频率Fc到频率Fs/2的部分。

为了进一步提高编码效率,在解码侧执行频段扩展。

如图2所示,例如,通过在MDCT单元21处执行的正交变换获得的频谱被划分为低频段频谱、高频段频谱和丢弃频谱。应当注意,图2中的纵轴表示频谱值或水平,横轴表示频率。

在该示例中,在整个频谱中从作为DC成分的频率Dc到上限频率Fb[kHz]的成分是低频段频谱,并且当输入信号被编码时,对低频段频谱执行常规编码。

同时,在整个频谱中从上限频率Fb到频率Fc的成分是高频段频谱。当对输入信号编码时,不对该高频段频谱执行编码。然而,在解码时,使用低频段频谱和作为稍后描述的附加信息的扩展系数来生成伪高频段频谱(以下也称为扩展频谱),并且因此,实现频段扩展。也就是说,在解码时,从上限频率Fb到频率Fc的频率频段是作为要扩展的当前频段的扩展频段。

此外,在整个频谱中从频率Fc到频率Fs/2的部分是丢弃频谱,并且被丢弃。

应当注意,从频率Dc到上限频率Fb的频段在下文中被称为低频段,从上限频率Fb到频率Fc的频段被称为高频段。此外,从频率Fc到频率Fs/2的频段在下文中被称为丢弃频段。

因此,在该示例中,对输入信号的仅低频段成分进行编码,并且在解码时通过频段扩展来生成高频段成分。

返回参照图1,MDCT单元21对输入信号执行MDCT。MDCT单元21然后向频谱量化单元22和低频段特征量提取单元23提供整个频段的所得频谱的低频段频谱,并且向高频段特征量提取单元24提供高频段频谱。

频谱量化单元22对从MDCT单元21提供的低频段频谱进行量化,并将所得的经量化的低频段频谱提供给多路复用器28。

低频段特征量提取单元23从由MDCT单元21提供的低频段频谱中提取特征量(该特征量在下文中也被称为低频段频谱特征量),以及然后将特征量提供给频谱特性确定单元25。低频段特征量提取单元23还向扩展系数计算单元26提供低频段频谱振幅信息。

高频段特征量提取单元24从由MDCT单元21提供的高频段频谱中提取特征量(该特征量在下文中也被称为高频段频谱特征量),以及然后将特征量提供给频谱特性确定单元25。高频段特征量提取单元24还向扩展系数计算单元26提供高频段频谱振幅信息。

现在描述低频段频谱特征量和高频段频谱特征量。

为了从在MDCT单元21处获得的频谱中提取特征量如低频段频谱特征量和高频段频谱特征量,需要观察频谱振幅的特性。然而,在MDCT单元21处获得的频谱是例如通过MDCT获得的MDCT频谱,并且具有与通过离散傅立叶变换(DFT)获得的DFT频谱的特性不同的特性。应当注意,MDCT频谱也被称为MDCT系数。

具体地,DFT频谱包括彼此独立的振幅分量和相位分量。另一方面,振幅分量和相位分量两者都被考虑到MDCT频谱的值或者MDCT频谱中各频率区的值中。也就是说,由输入信号的振幅分量和相位分量来确定MDCT频谱的值,并且仅振幅分量或相位分量的值不能根据MDCT频谱的值得知。

因此,在使用DFT频谱的情况下,可以使用振幅频谱或功率频谱来观察信号的振幅。然而,在MDCT频谱的情况下,难以根据未被改变的MDCT频谱观察信号的振幅。

鉴于此,可以对MDCT频谱执行作为MDCT的逆变换的IMDCT,使得输入信号返回到时间序列信号。然后可以对时间序列信号执行DFT以提取特征量。

然而,在这种情况下,需要向编码装置11进一步添加用于IMDCT和DFT的处理块,并且存储器诸如只读存储器(ROM)和随机存取存储器(RAM)的计算量和使用量将大大增加。这将给在低资源环境诸如仅有有限操作资源的便携式装置中对输入信号进行编码带来困难。

为了解决这个问题,应用本技术的编码装置11基于MDCT频谱根据等式(1)来计算伪振幅频谱Sk,并且在提取特征量时使用伪振幅频谱Sk

[数学式1]

应当注意,在等式(1)中,伪振幅频谱Sk表示与MDCT频谱中的第k个频率区对应的伪振幅频谱,以及yk表示与第k个频率区对应的MDCT频谱值。因此,基于等式(1),根据与三个连续频率区对应的MDCT频谱值来计算与一个频率区相关的伪振幅频谱Sk

以此方式获得的伪振幅频谱Sk的值是与振幅频谱类似的值。也就是说,伪振幅频谱Sk的值是与DFT频谱的振幅频谱具有高相关性的值,并且因此,可以这样说,伪振幅频谱Sk的值指示MDCT频谱中每个频率的伪振幅值。

应当注意,在下文中,针对低频段频谱确定的伪振幅频谱也具体被称为低频段伪振幅频谱,针对高频段频谱确定的伪振幅频谱也具体被称为高频段伪振幅频谱。

低频段特征量提取单元23和高频段特征量提取单元24针对低频段频谱和高频段频谱中的各频率根据等式(1)来计算伪振幅频谱Sk,并且计算来自所获得的各频率区的伪振幅频谱Sk的特征量。

例如,低频段特征量提取单元23和高频段特征量提取单元24根据下面所示的等式(2)计算频谱的平坦程度(在下文中也称为SF)作为低频段频谱特征量和高频段频谱特征量。频谱平坦度用作频谱的噪声性质的指示。

[数学式2]

应当注意,在等式(2)中,N表示当前频谱的数量或者频率区的数量。同时,Si表示第i个频率区的伪振幅频谱的值。

因此,例如,在针对高频段频谱确定SF的情况下,SF是针对高频段频谱中的所有频率区确定的伪振幅频谱Sk的算术平均值与针对高频段频谱中的所有频率区确定的伪振幅频谱Sk的几何平均值的比率。

以此方式计算的SF指示频谱的平坦程度,并且具有落在0.0至1.0的范围内的值。

例如,在SF的值较大或者SF的值较接近1.0的情况下,频谱的上升和下降较小,并且频谱较平坦,这指示较高的噪声性质。另一方面,在SF的值较小或者SF的值较接近0.0的情况下,频谱的有调度较高(噪声性质较低)。

应当注意,尽管在上述示例中计算SF作为特征量,但是可以计算任何其他合适的量作为特征量。

除了SF以外,例如,存在指示频谱的噪声特性的指标或者指示有调度程度的指标。因此,可以根据所需的特征量准确程度和编码装置11中允许的计算量来计算指示噪声性质的一些其他指标作为特征量。

作为与SF不同的特征量的示例,可以计算下面所示的等式(3)中的频谱集中程度D作为低频段频谱特征量或高频段频谱特征量。

[数学式3]

应当注意,在等式(3)中,N表示当前频谱的数量或者频率区的数量。同时,Si表示与第i个频率区对应的伪振幅频谱的值,Max(Si)表示与各频率区对应的伪振幅频谱Si中的最大值。

因此,在由等式(3)表示的示例中,伪振幅频谱Sk的算术平均值与伪振幅频谱Sk中的最大值的比率是频谱集中程度D。

在MDCT频谱中频谱集中程度D较高的情况下,频谱分布趋于偏斜并且具有高有调度。另一方面,在MDCT频谱中频谱集中程度D较低的情况下,频谱分布趋于平坦并且具有高噪声性质。

尽管可以以此方式计算任何合适的量作为特征量,但是在下面的描述中,计算SF作为特征量。

具体地,在低频段特征量提取单元23计算低频段频谱特征量的情况下,关于低频段倒转伪振幅频谱来计算上述SF,低频段倒转伪振幅频谱是通过以上限频率Fb为边界对关于低频段频谱计算的低频段伪振幅频谱在高频段侧进行倒转而获得的,如图3所示。

应当注意,图3中的纵轴指示频谱值或水平,横轴指示频率。

在该示例中,由曲线C11表示的低频段伪振幅频谱在上限频率Fb处在高频段侧被倒转,并且变成由曲线C12表示的低频段倒转伪振幅频谱。因此,低频段伪振幅频谱和低频段倒转伪振幅频谱形成对称波形。

返回参照图1,低频段特征量提取单元23关于在通过倒转处理获得的低频段倒转伪振幅频谱中从上限频率Fb到频率Fc的频段中的每个频率区根据等式(2)计算SF作为低频段频谱特征量。应当注意,在下文中,被计算为低频段频谱特征量的SF也具体被称为SFL。

低频段特征量提取单元23向频谱特性确定单元25提供如上获得的作为低频段频谱特征量的SFL,并且还向扩展系数计算单元26提供低频段倒转伪振幅频谱作为振幅信息。此时,例如,低频段倒转伪振幅频谱中从上限频率Fb到频率Fc的部分被提供给扩展系数计算单元26。

同时,高频段特征量提取单元24关于从高频段频谱获得的高频段伪振幅频谱中的每个频率区根据等式(2)计算SF作为高频段频谱特征量。应当注意,在下文中,计算为高频段频谱特征量的SF也具体被称为SFH。

高频段特征量提取单元24向频谱特性确定单元25提供如上获得的作为高频段频谱特征量的SFH,并且还向扩展系数计算单元26提供高频段伪振幅频谱作为振幅信息。

根据由低频段特征量提取单元23提供的低频段频谱特征量和由高频段特征量提取单元24提供的高频段频谱特征量,频谱特性确定单元25生成指示要编码的当前输入信号的频谱特性的频谱特性代码。

例如,在低频段频谱特征量SFL和高频段频谱特征量SFH两者都小于预定阈值的情况下,频谱特性代码是指示高有调度的代码。也就是说,输入信号(MDCT频谱)具有有调度高的频谱特性。这里,指示高有调度的频谱特性代码的值为“1”。

此外,在低频段频谱特征量SFL和/或高频段频谱特征量SFH等于或大于阈值的情况下,频谱特性代码是不指示高有调度的代码。也就是说,输入信号的频谱特性的有调度不高或者噪声性质高。这里,不指示高有调度的频谱特性代码的值为“0”。

如上所述,在MDCT频谱的低频段成分和高频段成分两者都有调度高的情况下,频谱特性代码是“1”,在MDCT频谱的低频段成分和/或高频段成分噪声性质高的情况下,频谱特性代码是“0”。

频谱特性确定单元25将以此方式获得的频谱特性代码提供给扩展系数计算单元26、扩展系数量化单元27以及多路复用器28。

扩展系数计算单元26根据由低频段特征量提取单元23提供的低频段倒转伪振幅频谱、由高频段特征量提取单元24提供的高频段伪振幅频谱以及由频谱特性确定单元25提供的频谱特性代码来计算扩展系数。然后,扩展系数计算单元26将扩展系数提供给扩展系数量化单元27。

这里,扩展系数是用于在解码时在频率区域中执行高频段水平调整的信息,并且扩展系数指示高频段伪振幅频谱与低频段倒转伪振幅频谱之间的比率。换言之,扩展系数指示高频段频谱的平均振幅与低频段频谱的平均振幅之间的比率。

具体地,在频谱特性代码为“1”的情况下,扩展系数计算单元26计算高频段范围或者从上限频率Fb到频率Fc的频段中的各频率区的高频段伪振幅频谱的平均值。扩展系数计算单元26还计算从上限频率Fb到频率Fc的频段中的各频率区的低频段倒转伪振幅频谱的平均值,并且通过将高频段伪振幅频谱的平均值除以低频段倒转伪振幅频谱的平均值来来计算扩展系数。在这种情况下,针对整个高频段或整个扩展频段获得一个扩展系数。

另一方面,在频谱特性代码为“0”的情况下,例如,在考虑到人的听觉特性的情况下,扩展系数计算单元26将高频段划分为频段,使得划分的频段宽度沿从低频段侧朝向高频段侧的方向变大,如图4所示。

应当注意,图4中的纵轴指示频谱值或水平,横轴指示频率。

在该示例中,高频段频谱的频带或者作为从上限频率Fb到频率Fc的高频段的频带被划分为五个频段B1到B5。此外,通过划分获得的频段的宽度在更靠近频率Fc的部分处较大。

对于构成高频段的频段B1至频段B5中的每个,扩展系数计算单元26通过将高频段伪振幅频谱的平均值除以低频段倒转伪振幅频谱的平均值来计算值,并且将该值设置为每个相应频段的扩展系数。

例如,通过将频段B1中的各频率区中的高频段伪振幅频谱的平均值除以频段B1中的各频率区中的低频段倒转伪振幅频谱的平均值而获得的值被设置为频段B1的扩展系数。

因此,根据下面示出的等式(4)来计算通过划分高频段而获得的第i个频段(区域)的扩展系数Ci

[数学式4]

应当注意,在等式(4)中,Sk表示第i个频段中的第k个频率区的高频段伪振幅频谱的值,Lk表示第i个频段中的第k个频率区的低频段倒转伪振幅频谱的值。同时,M表示第i个频段中的频率区的数量或频谱的数量。

根据由频谱特性确定单元25提供的频谱特性代码,扩展系数量化单元27对由扩展系数计算单元26提供的扩展系数进行量化。然后,扩展系数量化单元27将所得的经量化的扩展系数提供给多路复用器28。

例如,在频谱特性代码为“1”的情况下,对针对整个高频段计算的单个扩展系数进行标量量化。另一方面,在频谱特性代码为“0”的情况下,对针对经划分的高频段中的各频段(区域)计算的扩展系数进行标量量化或矢量量化。

多路复用器28对由频谱量化单元22提供的经量化的低频段频谱,由频谱特性确定单元25提供的频谱特性代码以及由扩展系数量化单元27提供的经量化的扩展系数进行多路复用,并且输出所得的代码串。在这种情况下,多路复用器28对经量化的低频段频谱执行熵编码,并且还对经量化的扩展系数进行编码。

<编码处理的说明>

接下来,描述编码装置11的操作。

当从外部提供要编码的当前输入信号时,例如,编码装置11开始编码处理,以对输入信号进行编码。现在参照图5的流程图,描述要由编码装置11执行的编码处理。

在步骤S11中,MDCT单元21对所提供的输入信号执行MDCT。然后,MDCT单元21向频谱量化单元22和低频段特征量提取单元23提供低频段频谱以及向高频段特征量提取单元24提供高频段频谱,低频段频谱是通过MDCT获得的MDCT频谱的低频段部分,高频段频谱是MDCT频谱的高频段部分。

在步骤S12中,频谱量化单元22对由MDCT单元21提供的低频段频谱进行量化,并且将所得的经量化的低频段频谱提供给多路复用器28。

在步骤S13中,低频段特征量提取单元23从由MDCT单元21提供的低频段频谱中提取低频段频谱特征量。

例如,低频段特征量提取单元23根据上述等式(1)针对低频段频谱中的各频率区执行计算,以计算低频段伪振幅频谱。

低频段特征量提取单元23还在上限频率Fb处对所获得的低频段伪振幅频谱在高频段侧进行倒转,以获得低频段倒转伪振幅频谱。在这种情况下,低频段特征量提取单元23丢弃经倒转的低频段伪振幅频谱中的频率高于频率Fc处的部分,并且生成低频段倒转伪振幅频谱。

低频段特征量提取单元23然后根据上述等式(2)针对低频段倒转伪振幅频谱中的各频率区执行计算,以计算SFL作为低频段频谱特征量。

低频段特征量提取单元23向频谱特性确定单元25提供被计算作为低频段频谱特征量的SFL,并且还向扩展系数计算单元26提供低频段倒转伪振幅频谱。

在步骤S14中,高频段特征量提取单元24从由MDCT单元21提供的高频段频谱中提取高频段频谱特征量。

例如,高频段特征量提取单元24根据上述等式(1)针对高频段频谱中的各频率区执行计算,以计算高频段伪振幅频谱。高频段特征量提取单元24还根据等式(2)针对高频段伪振幅频谱中的各频率区执行计算,以计算SFH作为高频段频谱特征量。

高频段特征量提取单元24向频谱特性确定单元25提供被计算作为高频段频谱特征量的SFH,并且还向扩展系数计算单元26提供高频段伪振幅频谱。

在步骤S15中,根据由低频段特征量提取单元23提供的低频段频谱特征量和由高频段特征量提取单元24提供的高频段频谱特征量,频谱特性确定单元25生成指示频谱特性的频谱特性代码。

具体地,在低频段频谱特征量SFL和高频段频谱特征量SFH两者都小于阈值的情况下,频谱特性确定单元25生成“1”作为频谱特性代码的值。

另一方面,在低频段频谱特征量SFL和/或高频段频谱特征量SFH等于或大于阈值的情况下,频谱特性确定单元25生成“0”作为频谱特性代码的值。

频谱特性确定单元25将生成的频谱特性代码提供给扩展系数计算单元26、扩展系数量化单元27以及多路复用器28。

在步骤S16中,根据由频谱特性确定单元25提供的频谱特性代码,扩展系数计算单元26和扩展系数量化单元27确定频谱特性是否展现高有调度。

例如,在频谱特性代码的值为“1”的情况下,确定频谱特性展现高有调度。

如果在步骤S16中确定频谱特性展现高有调度,则处理行进到步骤S17。

在步骤S17中,扩展系数计算单元26根据由低频段特征量提取单元23提供的低频段倒转伪振幅频谱和由高频段特征量提取单元24提供的高频段伪振幅频谱来计算整个高频段的单个(一个)扩展系数。然后,扩展系数计算单元26然后将单个扩展系数提供给扩展系数量化单元27。

具体地,扩展系数计算单元26通过将从上限频率Fb到频率Fc的频段中的各频率区中的高频段伪振幅频谱的平均值除以各频率区中的低频段倒转伪振幅频谱的平均值来计算扩展系数。

在计算扩展系数之后,处理行进到步骤S19。

另一方面,如果在步骤S16中确定频谱特性不展现高有调度,则处理行进到步骤S18。

在步骤S18中,扩展系数计算单元26根据由低频段特征量提取单元23提供的低频段倒转伪振幅频谱和由高频段特征量提取单元24提供的高频段伪振幅频谱来计算经划分的高频段中的各频段的扩展系数。然后,扩展系数计算单元26将扩展系数提供给扩展系数量化单元27。

具体地,例如,扩展系数计算单元26将整个高频段划分为如图4所示的五个频段B1至B5,并且根据上述等式(4)针对各频段执行计算,以计算各频段的扩展系数。在这种情况下,针对频段B1至频段B5中的每个频段计算一个扩展系数。

在计算扩展系数之后,处理行进到步骤S19。

在步骤S17或步骤S18中计算扩展系数之后,在步骤S19中,扩展系数量化单元27对由扩展系数计算单元26提供的扩展系数进行量化,以及然后将所得的经量化的扩展系数提供给多路复用器28。

在步骤S20中,多路复用器28对由频谱量化单元22提供的经量化的低频段频谱、由频谱特性确定单元25提供的频谱特性代码以及由扩展系数量化单元27提供的经量化的扩展系数进行多路复用,并且生成代码串。在这种情况下,多路复用器28对经量化的低频段频谱和经量化的扩展系数进行编码,以及然后对经编码的经量化的低频段频谱和经量化的扩展系数以及频谱特性代码进行多路复用。

多路复用器28输出通过多路复用获得的代码串,以及然后编码处理结束。

以上述方式,编码装置11根据低频段频谱特征量和高频段频谱特征量来确定输入信号的频谱特性。然后,编码装置11计算随频谱特性变化的扩展系数。扩展系数被用于在解码时调整频率区域中的高频段水平。

因此,在解码时可以利用扩展系数来调整频率区域中的高频段的水平,并且可以根据频谱特性来执行高频段水平调整。因此,即使在资源贫乏的设置中也可以在基本延迟没有任何增加的情况下获得高质量的声音。

也就是说,由于可以在频率区域中执行高频段水平调整,所以能够减少由于解码时的频段扩展导致的时间延迟,并且能够抑制解码侧的资源的增加。此外,由于可以根据频谱特性来执行高频段水平调整,所以在高有调度信号的情况下和在低有调度信号的情况下都能够抑制对人耳而言的音质劣化。因此,能够获得高质量的声音。

<解码装置的示例配置>

接下来,描述对从编码装置11输出的代码串进行解码的解码装置。

图6是示出应用本技术的解码装置的实施方式的示例配置的图示。

图6所示的解码装置81包括解复用器91、频谱逆量化单元92、扩展系数逆量化单元93、扩展频谱生成单元94以及IMDCT单元95。

从编码装置11的多路复用器28输出的代码串被提供给解复用器91。解复用器91对所提供的代码串进行解复用,以根据代码串来获得经量化的低频段频谱、频谱特性代码以及经量化的扩展系数。解复用器91还对经量化的低频段频谱和经量化的扩展系数进行解码。

解复用器91将根据代码串获得的经量化的低频段谱提供给频谱逆量化单元92,并且将根据代码串获得的频谱特性代码提供给扩展系数逆量化单元93和扩展频谱生成单元94。解复用器91还将根据代码串获得的经量化的扩展系数提供给扩展系数逆量化单元93。

频谱逆量化单元92对由解复用器91提供的经量化的低频段频谱进行逆量化,并将获得的低频段频谱提供给扩展频谱生成单元94和IMDCT单元95。根据由解复用器91提供的频谱特性代码,扩展系数逆量化单元93对由解复用器91提供的经量化的扩展系数进行逆量化,并且然后将获得的扩展系数提供给扩展频谱生成单元94。

根据由解复用器91提供的频谱特性代码,扩展频谱生成单元94根据由扩展系数逆量化单元93提供的扩展系数和由频谱逆量化单元92提供的低频段频谱来生成扩展频谱。扩展频谱生成单元94然后将扩展频谱提供给IMDCT单元95。

IMDCT单元95将由频谱逆量化单元92提供的低频段频谱视为低频段的频谱,并且将由扩展频谱生成单元94提供的扩展频谱视为高频段(扩展频段)的频谱。IMDCT单元95将低频段频谱和扩展频谱彼此结合(组合)。IMDCT单元95还通过IMDCT对通过将低频段谱和扩展频谱彼此结合而获得的频谱执行正交变换,并且输出所得的时间序列信号作为通过解码获得的音频信号。

<解码处理的说明>

接下来,描述解码装置81的操作。

当提供了代码串时,解码装置81开始解码处理,并且对代码串进行解码,以输出音频信号。现在参照图7的流程图,描述要由解码装置81执行的解码处理。

在步骤S51中,解复用器91解复用所提供的代码串,以根据代码串获得经量化的低频段频谱、频谱特性代码以及经量化的扩展系数。

解复用器91将获得的经量化的低频段频谱提供给频谱逆量化单元92,并将频谱特性代码提供给扩展系数逆量化单元93和扩展频谱生成单元94。解复用器91还将经量化的扩展系数提供给扩展系数逆量化单元93。更具体地,解复用器91对经量化的低频段频谱和经量化的扩展系数进行解码,并且将经解码的经量化低频段频谱和经量化扩展系数提供给频谱逆量化单元92和扩展系数逆量化单元93。

在步骤S52中,频谱逆量化单元92对由解复用器91提供的经量化的低频段频谱进行逆量化,并将获得的低频段频谱提供给扩展频谱生成单元94和IMDCT单元95。

在步骤S53中,根据由解复用器91提供的频谱特性代码,扩展系数逆量化单元93和扩展频谱生成单元94确定谱特性是否展现高有调度。

例如,在频谱特性代码的值为“1”的情况下,确定频谱特性展现高有调度。在这种情况下,代码串包括用于获得针对整个高频段计算的一个(单个)扩展系数的经量化的扩展系数。因此,一个经量化的扩展系数被从解复用器91提供给扩展系数逆量化单元93。

另一方面,在频谱特性代码的值为“0”的情况下,确定频谱特性不展现高有调度,或者确定频谱特性展现高噪声性质。在这种情况下,代码串包括用于获得针对构成高频段的各频段计算的扩展系数的经量化的扩展系数。因此,与经划分的高频段中的频段数量相同数量的经量化的扩展系数被从解复用器91提供给扩展系数逆量化单元93。

如果在步骤S53中确定频谱特性展现高有调度,则在步骤S54中,扩展系数逆量化单元93对由解复用器91提供的单个经量化的扩展系数进行逆量化,并将获得的扩展系数提供给扩展频谱生成单元94。

在步骤S55中,根据由扩展系数逆量化单元93提供的单个扩展系数和由频谱逆量化单元92提供的低频段谱,扩展频谱生成单元94生成扩展频谱,以及然后将扩展频谱提供给IMDCT单元95。

具体地,如上面参照图3所述的示例中那样,扩展频谱生成单元94以上限频率Fb为边界将低频段频谱在高频段侧进行倒转。作为结果获得的倒转频谱用作用于获得扩展频谱的种子频谱。

扩展频谱生成单元94将所获得的整个种子频谱或各频率区中的种子频谱的值乘以单个扩展系数,以获得扩展频谱。也就是说,使用扩展系数将种子频谱的水平调整到原始高频段频谱的预编码水平,并且获得扩展频谱。

如上获得的扩展频谱是原始输入信号的高频段频谱,其是根据通过解码获得的扩展系数和低频段频谱来估计的。

在获得扩展频谱之后,处理行进到步骤S58。

另一方面,如果在步骤S53中确定频谱特性不展现高有调度或者确定频谱特性显示高噪声特性,则处理行进到步骤S56。

在步骤S56中,扩展系数逆量化单元93对构成高频段的各频段的并且由解复用器91提供的经量化的扩展系数进行逆量化。然后,扩展系数逆量化单元93将所获得的扩展系数提供给扩展频谱生成单元94。因此,例如,获得图4所示的各频段(区域)B1至B5的扩展系数。

在步骤S57中,根据由扩展系数逆量化单元93提供的各频段的扩展系数和由频谱逆量化单元92提供的低频段谱,扩展频谱生成单元94生成扩展频谱,以及然后将扩展频谱提供给IMDCT单元95。

具体地,扩展频谱生成单元94通过执行与步骤S55类似的过程来生成种子频谱,并且将所获得的种子频谱中的各频段(区域)乘以这些频段的扩展系数,以获得扩展频谱。

例如,在高频段被划分为如图4所示的五个频段B1至B5的情况下,频段B1在种子频谱中的部分,或者更具体地,频段B1中的各频率区中的种子频谱的值乘以频段B1的扩展系数,生成频段B1在扩展频谱中的部分。对于其他频段B2至B5,以类似于上述的方式将种子频谱中的这些频段乘以各频段的扩展系数,并且因此,生成各频段在扩展频谱中的部分。

在获得扩展频谱之后,处理行进到步骤S58。

应当注意,尽管在步骤S55和步骤S57中低频段频谱在高频段侧被倒转并且变为种子频谱,但不是必须以上述方式生成种子频谱,并且可以以任何适当的方式生成种子频谱。例如,频带在低频段频谱中的部分可以被复制(拷贝),并且被粘贴到高频段。以此方式获得的频谱可以用作种子频谱。

当在步骤S55或步骤S57中生成扩展频谱之后,在步骤S58中,IMDCT单元95根据由频谱逆量化单元92提供的低频段频谱和由扩展频谱生成单元94提供的扩展频谱生成时间序列信号。

具体地,IMDCT单元95将低频段频谱和扩展频谱彼此结合(组合),以生成包括低频段和高频段(扩展频段)的所有频段成分的频谱。IMDCT单元95还对通过结合获得的频谱执行IMDCT,并且因此获得时间序列信号。以此方式,获得通过频段扩展而添加有高频段成分的时间序列信号。

IMDCT单元95输出所获得的时间序列信号作为通过解码获得的音频信号,然后解码处理结束。

以上述方式,解码装置81通过执行解码和逆量化来获得与频谱特性对应的扩展系数,以及然后根据所获得的扩展系数和通过将低频段频谱在高频段侧倒转而获得的种子频谱来生成扩展频谱。

以此方式,使用与频谱特性对应的扩展系数来调整作为高频段成分的种子频谱的水平,并且获得扩展频谱。因此,可以调整频率区域中的高频段的水平,并且可以根据频谱特性来执行高频段水平调整。

因此,即使在资源贫乏的设置中也能够在基本延迟没有任何增加的情况下获得高质量的声音。也就是说,由于在频率区域中执行水平调整,所以能够减少由于在解码时频段扩展导致的时间延迟,并且还能够抑制资源的增加。此外,在高有调度信号的情况下和在低有调度信号的情况下都能够抑制由于频段扩展导致的对人耳而言的音质劣化,并且因此,能够获得更高质量的声音。

<扩展频谱生成>

现在更详细地描述通过解码装置81的扩展频谱生成单元94进行的扩展频谱生成。

如上所述,扩展频谱生成单元94根据谱特性代码确定编码之前的原始信号是否是具有高有调度的信号或者原始信号是否是具有高噪声性质的正常信号。扩展频谱生成单元94然后生成扩展频谱。

例如,如图8所示,具有高有调度的信号和具有高噪声特性的正常信号在信号频谱形状方面不同。应当注意,图8中的纵轴表示频谱值或水平,横轴表示频率。

在图8中,曲线C21表示具有高噪声性质的信号或正常信号的频谱,曲线C22表示具有高有调度的信号的频谱。

由曲线C21表示的具有高噪声特性的信号在整个频段中不具有水平过高的任何部分,并且该频谱的波形具有平缓弯曲的山形形状的部分。也就是说,具有高噪声性质的信号不具有任何能量集中的部分。

另一方面,由曲线C22表示的具有高有调度的信号的能量集中在某些频率处,并且这些部分处的波形的形状犹如尖锐山峰。也就是说,具有高有调度的信号的频谱的波形在能量集中的频率处急剧地突出,并且信号的频谱不具有平缓弯曲的波形。

此外,当生成扩展频谱时,从低频段频谱获得的频谱诸如通过在上限频率Fb处对低频段频谱进行倒转而生成的频谱或者通过部分地复制低频段频谱并将副本粘贴到高频段而生成的频谱被用作种子频谱。然后,对该种子频谱进行使用扩展系数的水平调整或者振幅调整。以此方式,种子频谱变成扩展频谱。

这里,在具有高噪声性质的信号中,对人耳而言,相邻频谱之间的相位关系不是那么重要。对人耳而言真正重要的是振幅水平。因此,当调整种子频谱的水平时,优选地以分钟为单位来执行水平调整,使得种子频谱的水平(振幅)变得更接近于编码之前的原始信号的高频段频谱的水平。

也就是说,在编码时,例如,高频段被划分为如图9所示的四个频段,并且针对各频段计算扩展系数。应当注意,图9中的纵轴表示频谱值或水平,横轴表示频率。

在该示例中,高频段频谱的频段或者作为从上限频率Fb到频率Fc的高频段的频段被划分为四个频段(区域)B11至B14。此外,通过划分获得的频段的宽度在更靠近频率Fc的部分处较大。

在这种情况下,当输入信号被编码时,计算频段B11至频段B14中的每个频段中的高频段伪振幅频谱的平均值。在该示例中,直线L11至直线L14分别表示频段B11至频段B14中的高频段伪振幅频谱的平均值,或者表示高频段频谱的平均振幅。

此外,将针对各频段计算的高频段伪振幅频谱的平均值除以相应频段中的低频段倒转伪振幅频谱的平均值,并将获得的值作为扩展系数存储到然后被传输到解码装置81的代码串中。

在解码装置81中,然后使用扩展系数对从低频段频谱获得的种子频谱进行水平调整,如图10所示。应当注意,图10中的纵轴表示频谱值或水平,横轴表示频率。另外,图10中,与图9中所示的部件等同的部件使用与图9相同的附图标记,并且不再不必要地重复对其说明。

在图10中,曲线C31表示通过对代码串进行解码获得的低频段频谱,以及曲线C32表示从低频段频谱获得的种子频谱。

在该示例中,由曲线C31表示的低频段频谱在上限频率Fb处在高频段侧倒转,并且变为由曲线C32表示的种子频谱。

这样的种子频谱中的各频段B11至B14乘以针对各频段计算的扩展系数。以此方式,在各频段B11至B14中调整种子频谱的水平,使得种子频谱中的各频段的水平,或者更具体地,各频段的平均振幅变得更接近原始信号的高频段频谱的平均振幅,如箭头所示。

然而,在低频段频谱是具有高有调度的信号的情况下,如果种子频谱中的各频段乘以不同的扩展系数,则扩展频谱中的各频段的水平或平均振幅变得更接近编码之前的原始高频段频谱的平均振幅,但是频谱之间的相位关系在各频段中被大大干扰。

因此,例如,如图11所示,扩展频谱的有调度丢失。应当注意,图11中的纵轴表示频谱值或水平,横轴表示频率。

在该示例中,曲线C41表示当前编码输入信号的MDCT频谱,曲线C42表示通过组合在对当前编码输入信号进行解码时生成的扩展频谱和低频段频谱而获得的频谱。因此,在本示例中由曲线C42表示的频谱中,从频率Dc到上限频率Fb的部分是低频段频谱,从上限频率Fb到频率Fc的部分是扩展频谱。

在该示例中,原始输入信号是在低频段和高频段两者中具有高有调度的信号。如果在解码这种输入信号时在高频段中的各频段间使用不同的扩展系数来调整种子频谱的水平,则如曲线C42所示,频谱相位关系被大大干扰,并且扩展频段的有调度丢失。

在由曲线C42表示的频谱中,扩展频谱的波形或高频段部分被干扰,并且丢失原始MDCT频谱的有调度。具体地,在经划分的高频段中的频段之间的边界处,波形容易被干扰,并且很可能丢失有调度。

当通过将低频段频谱倒转而获得的种子频谱处于正常状态或者处于使用扩展系数进行水平调整之前的状态时,保持频谱相位关系,并且因此也保持有调度。

然而,除非对种子频谱的水平(振幅)进行调整,否则不能使扩展频谱反映原始输入信号的高频段频谱的振幅水平。在这种情况下,高频段或扩展频段中的声音的音量与原始高频段中的声音的音量不同。因此,不能实现适当的频段扩展。换言之,不能获得具有更高质量的声音。

鉴于此,根据本技术对具有高有调度的信号执行通过最小可能单位的种子频谱水平调整,以保持扩展频谱中的有调度并且使扩展频谱反映振幅水平。

具体地,在编码时,扩展系数计算单元26将整个高频段(扩展频段)中的高频段伪振幅频谱的平均值除以整个高频段中的低频段倒转伪振幅频谱的平均值,以计算扩展频段的单个扩展系数。

同时,在解码时,扩展频谱生成单元94将整个种子频谱乘以单个扩展系数,以获得扩展频谱。也就是说,以整个扩展频段(高频段)为单位执行种子频谱水平调整,并获得扩展频谱。

由于以上述方式在扩展频段基础上执行水平调整,所以能够在保持输入信号的有调度的情况下,使扩展频谱的整个高频段的振幅水平更接近原始输入信号的高频段的振幅水平,例如如图12所示。应当注意,图12中的纵轴表示频谱值或水平,横轴表示频率。

在图12中,曲线C51至曲线C53分别表示原始输入信号的MDCT频谱、通过解码时的逆量化获得的低频段频谱、以及种子频谱。

在该示例中,由曲线C51表示的MDCT频谱的低频段部分和高频段部分或者低频段频谱和高频段频谱各自具有能量集中在某些频率处的部分,并且保持具有高有调度的信号。此外,在由曲线C51表示的MDCT频谱中,低频段频谱的平均振幅高于高频段频谱的平均振幅。

对于这种MDCT频谱的高频段频谱,确定高频段频谱的整个频段中的高频段伪振幅频谱的平均值,并且在编码时计算信号扩展系数。在图12中,直线L21表示高频段(扩展频段)中的高频段伪振幅频谱的平均值或高频段频谱的平均振幅。

同时,在解码时,由曲线C52表示的低频段频谱被倒转,以获得由曲线C53表示的种子频谱。使用如图中箭头所示的扩展系数对该种子频谱进行水平调节,并变成扩展频谱。

此时,借助于单个扩展系数,使扩展频谱的整个高频段的平均振幅更接近由直线L21表示的高频段伪振幅频谱的平均值。以此方式,种子频谱中的各频率的水平被调整相同的量,并且相位关系不受干扰。也就是说,能够在保持有调度的情况下适当地调整振幅水平。因此,能够获得具有更高质量的声音。

此外,由于使用单个扩展系数,能够减少被存储在要从编码装置11输出的代码串中并且对于频段扩展必要的附加信息的量。因此,能够将等量的信息分配给低频段频谱的量化,并且能够预期整个音质的增加。

<第二实施方式>

<使用随机噪声的扩展频谱生成>

在输入信号的低频段的有调度高的情况下,输入信号的高频段的有调度通常很可能也高。因此,在上述编码处理中,当低频段频谱特征量和高频段频谱特征量两者都小于阈值时,要编码的当前输入信号的频谱特性展现高有调度。

然而,如图13所示,例如,存在频谱特性在低频段频谱中展现高有调度并且在高频段频谱中展现低有调度的输入信号,尽管不经常生成这种输入信号。应当注意,图13中的纵轴表示频谱值或水平,横轴表示频率。

在图13中,曲线C61表示要编码的当前输入信号的MDCT频谱。具体地,在该MDCT频谱中,从频率Dc到上限频率Fb的部分是低频段频谱,以及从上限频率Fb到频率Fc的部分是高频段频谱。

例如,低频段频谱具有能量集中在某些频率处的部分,并且信号在低频段频谱中具有高有调度。另一方面,高频段频谱不具有任何能量集中在某一频率处的部分,并且信号在高频段频谱中具有低有调度或高噪声性质。

在低频段中具有高有调度但在高频段中具有低有调度的这种输入信号被编码,并且在解码时执行频段扩展。然后通过倒转或部分复制低频段频谱来生成种子频谱,并且从种子频谱生成扩展频谱。在这种情况下,例如如图14所示,扩展频谱具有高有调度,而不是预期的噪声性质。应当注意,图14中的纵轴表示频谱值或水平,横轴表示频率。

在该示例中,曲线C71表示通过对经量化的低频段频谱进行逆量化而获得的低频段频谱,曲线C72表示扩展频谱。

在该示例中,在原始时间序列信号的高频段频谱中有调度低,但是在低频段频谱中有调度高。因此,在通过倒转低频段频谱并使用扩展系数执行水平调整而获得的扩展频谱中,有调度高。也就是说,由于频段扩展,在高频段中观察到与预期信号的特性不同的特性。

当在高频段中出现非预期的高有调度时,通过解码处理获得的时间序列信号(音频信号)有时对于人耳而言有金属声音,从而导致不适的感觉。

鉴于此,在低频段频谱中有调度高而在高频段频谱中有调度低的情况下,不使用通过倒转低频段频谱获得的种子频谱,并且可以使用随机噪声来生成扩展频谱,例如如图15所示。应当注意,图15中的纵轴表示频谱值或水平,横轴表示频率。

在图15中,曲线C81至曲线C83分别表示MDCT频谱、通过对经量化的低频段频谱执行逆量化而获得的低频段频谱、以及扩展频谱。

在该示例中,MDCT频谱的高频段被划分为三个频段B31至B33,并且具有较高频率的频段具有较大的带宽。当高频段被划分为频段B31至频段B33时,计算包络系数作为指示编码时各频段的包络的包络信息。例如,包络系数是要进行计算的当前频段中的各频率区中的高频段伪振幅频谱的平均值。

在图15中,直线L31至直线L33分别表示针对频段B31至频段B33计算的包络系数。

包络系数是用于在扩展频谱生成时调整作为噪声信号的随机噪声的水平的扩展系数信息。然而,在该示例中,扩展系数信息被称为包络系数,以与根据低频段倒转伪振幅频谱和高频段伪振幅频谱计算的扩展系数区分开。应当注意,在包络系数计算时经划分的高频段中的划分频段的数量可以等于或不同于在扩展系数计算时经划分的高频段中的划分频段的数量。

在计算包络系数之后,对包络系数进行量化和编码,并且与经量化的低频段频谱和频谱特性代码多路复用。因此,生成代码串。

同时,在接收了代码串供应的解码侧,使用从代码串获得的随机噪声和包络系数来生成扩展频谱。

具体地,在解码时,针对扩展频段中的频段B31至频段B33中的各频率区生成被正规化在-1.0至1.0的范围内的值的随机数,并且将使用各频率区的随机数形成的噪声信号视为随机噪声。然后,随机噪声乘以包络系数,并且因此生成扩展频谱。

根据通过对随机数进行规范化而获得的随机噪声来生成以此方式获得的扩展频谱。因此,能量不会集中在某些频率处,如曲线C83所示,并且保持具有高噪声性质的频谱。此外,通过使用包络系数对随机噪声执行水平调整来获得扩展频谱。因此,扩展频谱的包络与原始MDCT频谱的高频段的包络相似。

因此,通过解码获得的时间序列信号在低频段频谱中具有高有调度,并且在高频段频谱中具有低有调度,如同经编码的原始输入信号。

<编码处理的说明>

接下来,描述当生成上述包络系数时要由编码装置11执行的编码处理。

现在参照图16的流程图,描述要由编码装置11执行的编码处理。应当注意,步骤S91至步骤S94中的过程类似于图5中的步骤S11至步骤S14中的过程。因此,这里不再重复对其说明。

在步骤S95中,根据由低频段特征量提取单元23提供的低频段频谱特征量和由高频段特征量提取单元24提供的高频段频谱特征量,频谱特性确定单元25生成指示频谱特性的频谱特性代码。

具体地,在低频段频谱特征量SFL和高频段频谱特征量SFH两者都小于阈值的情况下,频谱特性确定单元25生成“1”作为频谱特性代码的值。频谱特性代码“1”指示输入信号(MDCT频谱)的低频段和高频段两者都具有高有调度作为频谱特性。

此外,在低频段频谱特征量SFL小于阈值而高频段频谱特征量SFH等于或大于阈值的情况下,频谱特性确定单元25生成“2”作为频谱特性代码的值。频谱特性代码“2”指示输入信号的低频段(低频段频谱)具有高有调度,并且输入信号的高频段(高频段频谱)具有低有调度或高噪声性质。

此外,在低频段频谱特征量SFL等于或大于阈值的情况下,频谱特性确定单元25生成“0”作为频谱特性代码的值。频谱特性代码“0”指示输入信号具有低有调度作为频谱特性。

频谱特性确定单元25将生成的频谱特性代码提供给扩展系数计算单元26、扩展系数量化单元27以及多路复用器28。

在步骤S96中,根据由频谱特性确定单元25提供的频谱特性代码,扩展系数计算单元26和扩展系数量化单元27确定低频段和高频段两者的频谱特性是否展现高有调度。

例如,在频谱特性代码的值为“1”的情况下,确定低频段和高频段的频谱特性展现高有调度。

如果在步骤S96中确定低频段和高频段的频谱特性展现高有调度,则处理行进到步骤S97。

在步骤S97中,扩展系数计算单元26根据由低频段特征量提取单元23提供的低频段倒转伪振幅频谱和由高频段特征量提取单元24提供的高频段伪振幅频谱来计算整个高频段的单个扩展系数。然后,扩展系数计算单元26将单个扩展系数提供给扩展系数量化单元27。

应当注意,在步骤S97中,执行与图5中的步骤S17中的过程类似的过程。在步骤S97中计算扩展系数之后,处理行进到步骤S101。

另一方面,如果在步骤S96中确定低频段和高频段的频谱特性不展现高有调度,则处理行进到步骤S98。

在步骤S98中,根据频谱特性代码,扩展系数计算单元26和扩展系数量化单元27确定是否低频段的频谱特性展现高有调度而高频段的频谱特性展现低有调度。

例如,在频谱特性代码的值为“2”的情况下,确定低频段的频谱特性展现高有调度,并且确定高频段的频谱特性展现低有调度。

如果在步骤S98中确定低频段的频谱特性展现高有调度并且确定高频段的频谱特性展现低有调度,则处理行进到步骤S99。

在步骤S99中,扩展系数计算单元26根据由高频段特征量提取单元24提供的高频段伪振幅频谱来计算经划分的高频段中的各频段的包络系数。扩展系数计算单元26然后将包络系数提供给扩展系数量化单元27。

具体地,扩展系数计算单元26将整个高频段划分为如图15所示的三个频段B31至B33,并且计算各频段中的频率区中的高频段伪振幅频谱的平均值作为各频段的包络系数。

在计算包络系数之后,处理行进到步骤S101。

另一方面,如果在步骤S98中确定低频段的频谱特性不展现高有调度并且确定高频段的频谱特性不展现低有调度,则处理行进到步骤S100。

在步骤S100中,扩展系数计算单元26根据由低频段特征量提取单元23提供的低频段倒转伪振幅频谱和由高频段特征量提取单元24提供的高频段伪振幅频谱来计算经划分的高频段中的各频段的扩展系数。扩展系数计算单元26然后将扩展系数提供给扩展系数量化单元27。应当注意,在步骤S100中,执行与图5中的步骤S18的过程类似的过程。在步骤S100中计算扩展系数之后,处理行进到步骤S101。

在步骤S97或步骤S100中计算扩展系数之后,或者在步骤S99中计算包络系数之后,在步骤S101中,扩展系数量化单元27对由扩展系数计算单元26提供的包络系数或者扩展系数进行量化。

具体地,在执行步骤S97或步骤S100中的过程并且提供扩展系数的情况下,扩展系数量化单元27对扩展系数进行量化,并且将所得的经量化的扩展系数提供给多路复用器28。另外,在执行步骤S99中的过程并且提供包络系数的情况下,扩展系数量化单元27对包络系数进行量化,并将所得的经量化的包络系数提供给多路复用器28。在该步骤中,例如对包络系数或者扩展系数执行标量量化或矢量量化。

在步骤S102中,多路复用器28对由频谱量化单元22提供的经量化的低频段频谱、由频谱特性确定单元25提供的频谱特性代码、以及由扩展系数量化单元27提供的经量化的包络系数或者经量化的扩展系数进行多路复用,并且生成代码串。在该步骤中,多路复用器28在对经量化的低频段频谱以及经量化的扩展系数或经量化的包络系数进行编码之后执行多路复用。

多路复用器28输出通过多路复用获得的代码串,然后编码处理结束。

以上述方式,编码装置11根据低频段频谱特征量和高频段频谱特征量来确定输入信号的频谱特性。根据频谱特性,编码装置11计算包络系数或扩展系数作为用于在解码时获得扩展频谱的信息。

以此方式,能够在解码时使用包络系数或扩展系数来获得适当的扩展频谱,并且即使在资源贫乏的设置中也能够在基本延迟没有任何增加的情况下获得高质量的声音。具体地,在使用包络系数生成扩展频谱的情况下,能够获得即使在低频段频谱中有调度高时也具有低有调度的扩展频谱。

<解码处理的说明>

现在参照图17的流程图,描述在已经由编码装置11执行了上面参照图16描述的编码处理的情况下要由解码装置81执行的解码处理。

应当注意,步骤S141和步骤S142中的过程类似于图7中的步骤S51和步骤S52中的过程,并且因此这里不再重复对其说明。然而,在步骤S141中,将通过对代码串进行解复用而获得的经量化的包络系数或者经量化的扩展系数从解复用器91提供给扩展系数逆量化单元93。

在步骤S143中,根据由解复用器91提供的频谱特性代码,扩展系数逆量化单元93和扩展频谱生成单元94确定低频段和高频段的频谱特性是否展现高有调度。

例如,在频谱特性代码的值为“1”的情况下,确定低频段和高频段的频谱特性展现高有调度。在这种情况下,代码串包括单个经量化的扩展系数,经量化的扩展系数从解复用器91提供给扩展系数逆量化单元93。

如果在步骤S143中确定低频段和高频段的频谱特性展现高有调度,则执行步骤S144和步骤S145中的过程以生成扩展频谱,并且将扩展频谱提供给IMDCT单元95。

应当注意,步骤S144和步骤S145中的过程类似于图7中的步骤S54和步骤S55中的过程,并且因此这里不再重复对其说明。在执行步骤S145中的过程之后,处理行进到步骤S151。

另一方面,如果在步骤S143中确定低频段和高频段的频谱特性不展现高有调度,则处理行进到步骤S146。

在步骤S146中,根据频谱特性代码,扩展系数逆量化单元93和扩展频谱生成单元94确定是否低频段的频谱特性显示高有调度而高频段的频谱特性展现低有调度。例如,在频谱特性代码的值为“2”的情况下,确定低频段的频谱特性展现高有调度,并且确定高频段的频谱特性展现低有调度。

如果在步骤S146中确定低频段的频谱特性展现高有调度并且确定高频段的频谱特性展现低有调度,则处理行进到步骤S147。在这种情况下,高频段中的各频段的经量化的包络系数从解复用器91提供给扩展系数逆量化单元93。

在步骤S147中,扩展系数逆量化单元93对构成高频段的各频段的并且从解复用器91提供的经量化的包络系数进行逆量化。然后,扩展系数逆量化单元93将所获得的包络系数提供给扩展频谱生成单元94。因此,例如,获得图15所示的各频段B31至B33的包络系数L31至L33。

在步骤S148中,根据从扩展系数逆量化单元93提供的各频段的包络系数,扩展频谱生成单元94生成扩展频谱,以及然后将扩展频谱提供给IMDCT单元95。

具体地,扩展频谱生成单元94通过将被规范化在-1.0至1.0的范围内的值的随机数分配给扩展频段中的各频率区来生成随机噪声,并且将各频段中的频率区中的随机噪声的值乘以各频段的包络系数来获得扩展频谱。

在生成扩展频谱之后,处理行进到步骤S151。

此外,如果在步骤S146中确定低频段的频谱特性不展现高有调度并且确定高频段的频谱特性不展现低有调度,则执行步骤S149和步骤S150中的过程。

在这种情况下,高频段中的各频段的经量化的扩展系数从解复用器91提供给扩展系数逆量化单元93,并被逆量化。然后,根据所得的扩展系数和低频段频谱生成扩展频谱。应当注意,步骤S149和步骤S150中的过程类似于图7中的步骤S56和步骤S57中的过程,并且因此这里不再重复对其说明。

在以此方式生成扩展频谱之后,处理行进到步骤S151。

在通过步骤S145、步骤S148或步骤S150中的过程生成扩展频谱之后,执行步骤S151中的过程以生成时间序列信号。然而,步骤S151中的过程类似于图7中的步骤S58中的过程,并且因此这里不再重复说明。

输出在步骤S151中获得的时间序列信号作为通过解码获得的音频信号,然后解码处理结束。

以上述方式,解码装置81通过执行解码和逆量化来获得与频谱特性对应的包络系数或者扩展系数,以及然后使用所获得的包络系数或者扩展系数来生成扩展频谱。

以此方式,使用与频谱特性对应的包络系数或者扩展系数来调整随机噪声或种子频谱的水平,并且获得扩展频谱。因此,可以调整频率区域中的高频段的水平,并且可以根据频谱特性来执行高频段水平调整。因此,可以减少由于解码时的频段扩展导致的延迟时间,并且即使在资源贫乏的设置中也可以获得高质量的声音。

可以由硬件或者可以由软件执行上述一系列处理。在通过软件执行一系列处理的情况下,将形成软件的程序安装到计算机中。这里,计算机可以是并入专用硬件的计算机,或者可以是其中安装有各种程序的执行各种类型的功能的通用个人计算机。

图18是示出根据程序执行上述一系列处理的计算机的硬件的示例配置的框图。

在计算机中,中央处理单元(CPU)501、ROM 502和RAM 503通过总线504彼此连接。

输入/输出接口505还连接到总线504。输入单元506、输出单元507、记录单元508、通信单元509和驱动器510连接到输入/输出接口505。

输入单元506由键盘、鼠标、麦克风、成像装置等形成。输出单元507由显示器、扬声器等形成。记录单元508由硬盘、非易失性存储器等形成。通信单元509由网络接口等形成。驱动器510驱动可移除介质511如磁盘、光盘、磁光盘或半导体存储器。

在具有上述配置的计算机中,例如,CPU 501经由输入/输出接口505和总线504将记录在记录单元508上的程序加载到RAM 503中,并且执行该程序,使得执行上述一系列处理。

例如,要由计算机(CPU 501)执行的程序可以被记录在可移除介质511上作为要提供的封装介质。可替代地,可以经由有线或无线传输介质如局域网、因特网或数字卫星广播来提供程序。

在计算机中,当可移动介质511被安装在驱动器510上时,程序可以经由输入/输出接口505被安装到记录单元508中。程序还可以通过通信单元509经由有线或无线传输介质接收,并且被安装到记录单元508中。可替代地,程序可以被预先安装到ROM 502或记录单元508中。

应当注意,要由计算机执行的程序可以是用于根据本说明书中描述的顺序按时间顺序执行处理的程序,或者可以是用于并行执行处理或在必要时如当存在调用时执行处理的程序。

应当注意,本技术的实施方式不限于上述实施方式,并且在不脱离本技术的范围的情况下可以对其进行各种修改。

例如,本技术可以实现为云计算配置,在云计算配置中经由网络在装置之间共享一个功能,并且通过彼此协作的装置执行处理。

此外,参照上述流程图描述的各步骤可以由一个装置执行或者可以在装置之间共享。

在一个步骤中包括多于一个处理的情况下,该步骤中包括的处理可以由一个装置执行或者可以在装置之间共享。

此外,本技术还可以以下面描述的配置来实现。

[1]一种解码装置,包括:

获取单元,被配置成获取低频段频谱,以及扩展频段的单个扩展系数或者构成所述扩展频段的各频段的多个扩展系数,所述扩展频段不同于低频段,所述单个扩展系数或所述多个扩展系数用于获得所述扩展频段的扩展频谱;

生成单元,被配置成根据所述单个扩展系数或者所述各频段的所述扩展系数来生成所述扩展频谱;以及

组合单元,被配置成组合所述低频段频谱和所述扩展频谱。

[2]根据[1]所述的解码装置,其中,所述生成单元根据所述低频段频谱和所述扩展系数来生成所述扩展频谱。

[3]根据[2]所述的解码装置,其中,所述生成单元通过根据所述扩展系数对从所述低频段频谱获得的频谱的水平进行调整来生成所述扩展频谱。

[4]根据[3]所述的解码装置,其中:

当根据所述单个扩展系数生成所述扩展频谱时,所述生成单元根据所述扩展系数来调整所述频谱的整个扩展频段的水平;以及

当根据所述各频段的所述扩展系数生成所述扩展频谱时,所述生成单元根据所述各频段的所述扩展系数来调整所述频谱中的所述频段的水平。

[5]根据[1]所述的解码装置,其中,所述生成单元通过根据所述扩展系数对预定噪声的水平进行调整来生成所述扩展频谱。

[6]根据[1]至[5]中任一项所述的解码装置,其中,所述低频段频谱的值由原始时间序列信号的振幅分量和相位分量确定。

[7]根据[6]所述的解码装置,其中,所述低频段频谱是MDCT频谱。

[8]一种解码方法,包括以下步骤:

获取低频段频谱,以及扩展频段的单个扩展系数或者构成所述扩展频段的各频段的多个扩展系数,所述扩展频段不同于低频段,所述单个扩展系数或所述多个扩展系数用于获得所述扩展频段的扩展频谱;

根据所述单个扩展系数或者所述各频段的所述扩展系数来生成所述扩展频谱;以及

组合所述低频段频谱和所述扩展频谱。

[9]一种程序,所述程序用于使计算机执行处理,所述处理包括以下步骤:

获取低频段频谱,以及扩展频段的单个扩展系数或者构成所述扩展频段的各频段的多个扩展系数,所述扩展频段不同于低频段,所述单个扩展系数或所述多个扩展系数用于获得所述扩展频段的扩展频谱;

根据所述单个扩展系数或者所述各频段的所述扩展系数来生成所述扩展频谱;以及

组合所述低频段频谱和所述扩展频谱。

[10]一种编码装置,包括:

特征量提取单元,被配置成从通过对时间序列信号执行正交变换而获得的频谱中提取特征量;

计算单元,被配置成基于所述特征量,根据所述频谱来计算扩展频段的单个扩展系数或者构成所述扩展频段的各频段的多个扩展系数,所述扩展频段不同于所述频谱的低频段,所述单个扩展系数或所述多个扩展系数用于获得所述扩展频段的扩展频谱;以及

多路复用器,被配置成通过对作为所述频谱的低频段成分的低频段频谱和所述扩展系数进行多路复用来生成代码串。

[11]根据[10]所述的编码装置,其中,所述特征量是指示所述频谱的有调度的信息。

[12]根据[11]所述的编码装置,其中:

当所述频谱的有调度高时,所述计算单元计算所述单个扩展系数;以及

当所述频谱的有调度时,所述计算单元计算所述各频段的所述扩展系数。

[13]根据[10]至[12]中任一项所述的编码装置,其中,所述计算单元计算所述频谱的所述扩展频段的平均振幅与所述低频段频谱的平均振幅之间的比率,并且将所述比率设置为所述扩展系数。

[14]根据[11]所述的编码装置,其中,当所述频谱的所述低频段的有调度而所述频谱的所述扩展频段的有调度低时,所述计算单元计算关于所述频谱的所述扩展频段的包络信息作为所述扩展系数。

[15]根据[10]至[14]中任一项所述的编码装置,其中,所述频谱的值由所述时间序列信号的振幅分量和相位分量确定。

[16]根据[15]所述的编码装置,其中,所述正交变换是MDCT。

[17]一种编码方法,包括以下步骤:

从通过对时间序列信号执行正交变换而获得的频谱中提取特征量;

根据所述特征量来根据所述频谱计算扩展频段的单个扩展系数或者构成所述扩展频段的各频段的多个扩展系数,所述扩展频段不同于所述频谱的低频段,所述单个扩展系数或所述多个扩展系数用于获得所述扩展频段的扩展频谱;以及

通过对作为所述频谱的低频段成分的低频段频谱和所述扩展系数进行多路复用来生成代码串。

[18]一种程序,所述程序用于使计算机执行处理,所述处理包括以下步骤:

从通过对时间序列信号执行正交变换而获得的频谱中提取特征量;

根据所述特征量来根据所述频谱计算扩展频段的单个扩展系数或者构成所述扩展频段的各频段的多个扩展系数,所述扩展频段不同于所述频谱的低频段,所述单个扩展系数或所述多个扩展系数用于获得所述扩展频段的扩展频谱;以及

通过对作为所述频谱的低频段成分的低频段频谱和所述扩展系数进行多路复用来生成代码串。

附图标记列表

11 编码装置

21 MDCT单元

22 频谱量化单元

23 低频段特征量提取单元

24 高频段特征量提取单元

25 频谱特性确定单元

26 扩展系数计算单元

27 扩展系数量化单元

28 多路复用器

81 解码装置

91 解复用器

92 频谱逆量化单元

93 扩展系数逆量化单元

94 扩展频谱生成单元

95 IMDCT单元

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1