解码装置、解码方法及程序的制作方法

文档序号:2830626阅读:311来源:国知局
专利名称:解码装置、解码方法及程序的制作方法
技术领域
本发明涉及将声音及音乐等的音频信号压縮/解压縮的音频编码/解 码技术。特别涉及在将音频信号的编码数据解码时,校正量化误差的技 术。
背景技术
作为将音频信号变换为频域的信号来进行编码的方式的一例,公知
有ISO/IEC 13818-7 MPEG-2 AAC(Advanced Audio Coding)方式。AAC方
式作为单波段广播或数字AV设备等的声音编码方式来采用。
图1表示了采用AAC方式的编码装置1的结构例。图1所示的编码
装置1具有MDCT (modified discrete cosine transform)部11、心理听觉
分析部12、量化部13以及霍夫曼编码部14。
在该编码装置1中,MDCT部11通过MDCT变换将输入音变换为
频域数据即MDCT系数。并且,心理听觉分析部12对输入音进行心理
听觉分析,并求出用于区别听觉上重要的频率和听觉上不重要的频率的
掩蔽阈值。
量化部13根据掩蔽阈值减少听觉上不重要的频域的数据的量化位 数,向听觉上重要的频域的数据分配多个量化位,进行频域数据的量化。 从量化部13输出作为被量化的频谱值的量化值和比例(scale)值,这些 数据被霍夫曼编码部14进行霍夫曼编码后作为编码数据从编码装置1输 出。另外,比例值是表示音频信号向频域变换后的频谱波形的倍率的数 字,相当于用浮动小数点形式表示MDCT系数时的指数部。并且,频谱 值相当于用浮动小数点形式表示MDCT系数时的尾数部,且相当于上述 频谱的波形。即、MDCT系数可以表现为频谱值x2比例值。
图2表示AAC方式的解码装置2的结构例。图2所示的解码装置2具有霍夫曼解码部21、逆量化部22以及逆MDCT部23。该解码装置2 接收通过图1所示的编码装置1编码后的编码数据,并由霍夫曼解码部 21将编码数据变换为量化值和比例值。并且,逆量化部22将量化值和比 例值变换为逆量化值(MDCT系数),并由逆MDCT部23将MDCT系 数变换为时域的信号,输出解码音。
另外,作为有关量化误差校正的现有技术,有下述的专利文献1 4。
专利文献1:日本特开2006-60341号公报
专利文献2:日本特开2001-102930号公报
专利文献3:日本特开2002-290243号公报
专利文献4:日本特开平11-4449号公报
在通过图1所示的编码装置1中的量化部13量化MDCT系数时, 例如如图3所示发生量化误差。图3表示了量化后的MDCT系数相比于 量化前的MDCT系数变大的情形,但也存在量化后的MDCT系数相比于 量化前的MDCT系数变小的情形。
通常,即使发生量化误差,对解码后的音质也没有太大影响。但是, 在输入音为大振幅(0dB附近)的情形下,在量化后的MDCT系数相比 于量化前的MDCT系数变大时,如果通过现有的解码装置2解码压縮数 据,则解码音的振幅也变大,有时解码音振幅超过PCM (Pulse Code Modulation)数据的字长(例如16bit)。此时,由于超过PCM数据的字 长的部分不能表现为数据,因此发生益出,其结果存在听到异常音(削 波音)的问题。例如,对图4所示的大振幅的输入音进行编码,而解码 后的解码音超过图5所示的PCM数据的字长时,发生削波。
特别是,在低位率(高压縮)条件下,由于量化误差容易变大,因 此容易发生上述削波音。由于引起削波音的量化误差发生在编码装置侧, 因此在现有的解码装置中很难解决上述削波音的问题。

发明内容
本发明是鉴于上述问题而提出的,其目的在于提供一种在解码装置 将编码数据解码后输出音频信号时,削减由于量化误差发生的异常音的技术。
为了解决上述课题,根据本发明的一实施方式,提供一种解码装置, 该解码装置对编码数据进行解码而输出音频信号,其中,所述编码数据 是通过分别对音频信号的频域数据的比例值和频谱值进行编码而得到 的。该解码装置包括频域数据取得单元,其对所述编码数据进行解码
和逆量化,并取得所述音频信号的频域数据;位数算出单元,其根据所
述编码数据算出比例位数或频谱位数,其中,该比例位数是所述比例值
的编码数据的位数,该频谱位数是所述频谱值的编码数据的位数;量化 误差估计单元,其根据所述比例位数或所述频谱位数,估计所述频域数 据的量化误差;校正单元,其根据所述量化误差算出校正量,使用该校 正量校正由所述频域数据取得单元取得的所述频域数据;以及变换单元, 其将通过所述校正单元校正后的所述频域数据变换为所述音频信号。
在所述解码装置中,所述位数算出单元也可以算出所述比例位数或 所述频谱位数相对于所述比例位数和所述频谱位数的合计的比例,所述 量化误差估计单元根据该比例估计所述量化误差。
并且,所述量化误差估计单元也可以使用所述比例位数或所述频谱 位数与所述量化误差之间的预先确定的对应关系来估计所述量化误差。 并且所述量化误差估计单元也可以取得由所述频域数据取得单元取得的 所述频域数据,根据所述频域数据的值的大小,选择所述比例位数或所 述频谱位数与所述量化误差之间的预先确定的多个对应关系中的一个对 应关系,使用所选择的对应关系来估计所述量化误差。
并且,在所述解码装置中,所述校正单元也可以取得由所述频域数 据取得单元取得的所述频域数据,根据该频域数据的值的大小,选择所 述量化误差与所述校正量之间的预先确定的多个对应关系中的一个对应 关系,使用所选择的对应关系来算出所述校正量。通过该结构,可以根 据频域数据的值的大小算出适当的校正量。
并且,所述解码装置还可以包括根据所述编码数据算出位率的位率 算出单元,此时,所述量化误差估计单元也可以根据所述位率,选择所 述比例位数或所述频谱位数与所述量化误差之间的预先确定的多个对应关系中的一个对应关系,使用所选择的对应关系来估计所述量化误差。 并且此时,所述校正单元也可以根据所述位率,选择所述量化误差与所 述校正量之间的预先确定的多个对应关系中的一个对应关系,使用所选 择的对应关系来算出所述校正量。由此,可以根据位率算出适当的校正
根据本发明,根据由编码数据算出的比例位数或频谱位数来估计量 化误差,并使用根据该量化误差算出的校正量来校正逆量化数据,因此 在解码装置将编码数据解码后输出音频信号时,削减由于量化误差发生 的异常音。


图1是表示现有的编码装置的结构例的图。
图2是表示现有的解码装置的结构例的图。
图3是用于说明量化误差的图。
图4是表示输入音的例子的图。
图5是表示对应于图4所示的输入音的解码音的图。
图6是表示本发明实施方式的解码装置的基本结构的图。
图7是用于说明频谱位数和比例位数的关系的图。
图8是表示MDCT系数的校正的图。
图9是本发明第1实施方式的解码装置的结构图。
图IO是用于说明第1实施方式的解码装置的动作的流程图。
图IIA是表示频谱值的霍夫曼码本的例子的图。
图11B是表示比例值的霍夫曼码本的例子的图。
图12是表示比例位数和量化误差的对应关系的例子的图。
图13是表示频谱位数和量化误差的对应关系的例子的图。
图14是表示比例位数和量化误差的对应关系的例子的图。
图15是表示频谱位数和量化误差的对应关系的例子的图。
图16是表示量化误差和校正量之间的对应关系的例子的图。
图17是表示第2实施方式的解码装置的结构的图。图18是表示准备多个比例位数和量化误差之间的对应关系时的例 子的图。
图19是表示准备多个频谱位数和量化误差之间的对应关系时的例 子的图。
图20是表示第3实施方式的解码装置的结构的图。 图21是表示准备多个量化误差和校正量之间的对应关系时的例子 的图。
图22是表示第4实施方式的解码装置的结构的图。 图23是表示准备多个比例位数和量化误差之间的对应关系时的例 子的图。
图24是表示准备多个频谱位数和量化误差之间的对应关系时的例 子的图。
图25是表示第5实施方式的解码装置的结构的图。
图26是表示准备多个量化误差和校正量的对应关系时的例子的图。
图27是用于说明第6实施方式的解码装置的动作的流程图。
图28是表示包含本发明实施方式的解码装置的接收机的例子的图。
图29是表示计算机的结构的一例的图。

1:编码装置
11:励CT部
12:心理听觉分析部
13:量化部
14:霍夫曼编码部
2 '9:賴F码装置
21、31、40、 50、60、70、90:霍夫曼解码部
22、32、41、 51、61、71、91:逆量化部
23、33、42、 52、62、72、92:逆MDCT部
34、45、55、 65、75、95:位数算出部
35、46、56、 66、77、97:量化误差估计部36、 47、 57、 67、 78、 98:校正量算出部
37、 48、 58、 68、 79、 99:频谱校正部
43、 53、 63、 73、 93:叠加加算部
44、 54、 64、 74、 94:缓存
49、 59、 69、 80、 100:数据存储部 76、 96:位率算出部 '
110:接收机 111:天线 112:解调部 113:解码部 114:扬声器 115:显示部 120:计算机系统
121: CPU 122:存储器 123:通信装置 124:输入输出装置 125:存储装置 126:读取装置
具体实施例方式
以下,参照

本发明的实施方式。另外,以下说明的各实施
方式中举出对应于AAC方式的解码装置作为例子,但本发明不限于AAC 方式,而只要是将音频信号变换为频域数据,对频谱值和比例值进行编 码,并对这些频谱值和比例值进行解码的音频编码/解码方式,则任何方 式中都可以适用。
(实施方式的基本结构)
图6表示本发明实施方式的解码装置3的基本结构。该解码装置3 具有霍夫曼解码部31、逆量化部32、逆MDCT部33、位数算出部34、量化误差估计部35、校正量算出部36以及频谱校正部37。该解码装置3 与现有的解码装置的不同点在于,该解码装置3具有位数算出部34、量 化误差估计部35、校正量算出部36以及频谱校正部37。以下,说明该 解码装置的动作。
在解码装置3中,由霍夫曼解码部31算出通过分别解码并量化包含 在所输入的编码数据中的、被量化的频谱值的霍夫曼码字和比例值的霍 夫曼码字而获得的量化值和比例值。并且,逆量化部32将量化值逆量化 而算出频谱值,并根据频谱值和比例值算出校正前MDCT系数。
另一方面,霍夫曼解码部31将包含在编码数据中的被量化的频谱值 的霍夫曼码字和比例值的霍夫曼码字输入到位数算出部34。并且,位数 算出部34算出频谱值的霍夫曼码字和比例值的霍夫曼码字各自的位数, 并将这些输入到量化误差估计部35。另外,以下将频谱值的霍夫曼码字 的位数称为频谱位数,将比例值的霍夫曼码字的位数称为比例位数。
量化误差估计部35利用频谱位数或比例位数、或者利用频谱位数和 比例位数这两者估计量化误差,并将所估计的量化误差输入到校正量算 出部36。校正量算出部36根据由量化误差估计部35估计的量化误差算 出校正量,并将其输入到频谱校正部37。频谱校正部37利用该校正量对 校正前MDCT系数进行校正,并将校正后MDCT系数输出到逆MDCT 部33。并且,逆MDCT部33对校正后MDCT系数执行逆MDCT,并输 出解码音。
接着,说明通过上述的位数算出部34、量化误差估计部35、校正量 算出部36以及频谱校正部37进行的MDCT系数的校正的基本概念。
在如AAC方式的变换编码方式中, 一般根据位率来预先确定1帧内 MDCT系数的编码数据(频谱值的码字和比例值的码字)可以使用的位 数。因此,在1帧内,比例位数越多频谱位数越少;频谱位数越多比例 位数越少。例如,如图7所示,在频谱值的码字和比例值的码字合计可 以使用100位时,如果频谱位数是30位则比例位数为70位;如果频谱 位数是70位则比例位数为30位。并且,每1频带中可以使用的位数也 被预先确定,并且比例位数越多则频谱位数越少、频谱位数越多则比例位数越少的关系对每个频带是成立的。另外,帧是指可以单独解码为音 频信号的单位,包含一定的样本数。
此处,如图7所示,频谱位数少是指,分配到频谱值的码量少,频 谱值被粗略地表现,可估计为量化误差大。并且,比例位数多则频谱位 数变少,与上述相同,可估计为量化误差大。并且,在比例位数大时, 意味着波形的倍率的绝对值大,因此此时可以估计波形被粗略地表现。 从该观点也可以估计如果比例位数多则量化误差大。相反地,当比例位 数少时可以估计为量化误差小。同样地,当频谱位数大时也可估计为量 化误差小。
从上述观点出发,量化误差估计部35根据由位数算出部34算出的 位数来估计量化误差的大小。当频谱位数和比例位数的合计一定时,只 要知道频谱位数和比例位数中的任何一方就可以估计量化误差。
并且,例如按照1帧单位或1频带单位,频谱位数和比例位数的合 计随时间变化的情形下,由于在1帧或1频带内可以使用的位数有限, 因此比例位数越多则频谱位数越少、频谱位数越多则比例位数越少的关 系是成立的。因此,在该情形下,可以根据频谱位数或比例位数相对于 频谱位数和比例位数的合计的比例来估计量化误差。
并且,校正量算出部36与量化误差大的情况相应地将MDCT系数 的校正量确定得大,并且由频谱校正部37如图8那样校正MDCT系数。 (第1实施方式)
图9是本发明第1实施方式的解码装置4的结构图。如图9所示, 本实施方式的解码装置4具有霍夫曼解码部40、逆量化部41、逆MDCT 部42、叠加加算部43、缓存44、位数算出部45、量化误差估计部46、 校正量算出部47、频谱校正部48以及数据存储部49。图9是更详细地 表示图8所示的解码装置的图,图9中的霍夫曼解码部40、逆量化部41、 逆MDCT部42、位数算出部45、量化误差估计部46、校正量算出部47、 频谱校正部48分别具有与图8所示的对应的功能部相同的功能。并且, 数据存储部49存储处理中所需的表等数据。AAC方式中,由于在编码装 置中将1帧的块相隔一定间隔进行叠加并进行编码处理,因此在解码装置中,将通过逆MDCT处理得到的帧的时间信号和前一帧的时间信号进 行叠加来进行加算,并输出解码音。由此可知,图9的解码装置4具有 叠加加算部43和缓存44。
接着,参照图10的流程图说明解码装置4的动作。
解码装置4接收某一帧(以下称为当前帧)的编码数据。霍夫曼解 码部40对接收到的编码数据进行霍夫曼解码,算出各频带中的MDCT 系数的频谱值(量化值)和比例值(步骤l)。另外,在AAC方式中,1 帧内的频带数根据采样频率而不同,但例如在釆样频率为48kHz时1帧 内的频带数最大为49个。
并且,霍夫曼解码部40将1个频带的量化值和比例值输入到逆量化 部41,并由逆量化部41算出校正前MDCT系数(步骤2)。另一方面, 霍夫曼解码部40将上述的频带的量化值的霍夫曼码字及其比例值的霍夫 曼码字、以及各自对应的码本号输入到位数算出部45,位数算出部45算 出作为各自的霍夫曼码字的位数的频谱位数和比例位数(步骤3)。
并且,位数算出部45将所算出的频谱位数和比例位数输入到量化误 差估计部46,量化误差估计部46利用频谱位数或比例位数、或者利用频 谱位数和比例位数这两者算出量化误差(步骤4)。另外,在仅利用频谱 位数、或者仅利用比例位数来估计量化误差时,位数算出部45也可以仅 算出频谱位数、或者仅算出比例位数。
由量化误差估计部46算出的量化误差被输入到校正量算出部47, 校正量算出部47根据量化误差算出对校正前MDCT系数的校正量(步 骤5)。
校正量算出部47将所算出的校正量输入到频谱校正部48,频谱校 正部48根据该校正量校正从逆量化部41接收到的校正前MDCT系数, 并算出校正后MDCT系数(称为校正后MDCT部)(步骤6)。
并且,解码装置4对当前帧的所有频带进行步骤2 步骤6的处理 (步骤7、步骤2 6)。当在频谱校正部48中求出总频带的校正后MDCT 系数时,其被输入到逆MDCT部42。
逆MDCT部42对总频带的校正后MDCT系数进行逆MDCT变换,输出当前帧的时间信号(步骤8)。从逆MDCT部42输出的时间信号被 输入到叠加加算部43,同时存储到缓存44内(步骤9)。
并且,在叠加加算部43中,对从逆MDCT部42供给的当前帧的时 间信号和存储在缓存44内的前一帧的时间信号进行叠加而进行加算,输 出解码音(步骤IO)。
接着,详细说明位数计算部45、量化误差算出部46、校正量算出部 47以及频谱校正部48的处理。首先,对位数算出部45进行说明。
位数算出部45求出频谱位数和比例位数。这些可以通过直接数出频 谱值(量化值)和比例值各自的霍夫曼码字的位数来求出。并且,如下 所述,也可以利用霍夫曼码本求出。
本实施方式中的ISO的AAC标准(13818-7 Part7)中,用于霍夫曼 编码的码本(表)已标准化。具体地讲,对比例值确定了一种码本,对 频谱值确定了ll种码本。另外,根据包含在编码数据的码本信息来确定 要使用哪个码本。
图IIA表示频谱值的霍夫曼码本的例子,图IIB表示比例值的霍夫 曼码本的例子。如图llA、 11B所示,霍夫曼码本包含霍夫曼码字、其 位数以及频谱值(量化值)。因此,解码装置4的数据存储部49存储码 本,位数算出部45可以根据包含在编码数据中的霍夫曼码字并参照霍夫 曼码本,根据霍夫曼码本算出频谱位数及比例位数。
例如,当频谱值的霍夫曼码字为1F1时,根据图IIA,可以算出频谱 位数为9位、且量化值为l。当比例值的霍夫曼码字为7FFF3时,根据图 IIB,可以算出比例值位数为19位、且比例值为+60。并且,在AAC方 式中,对前一个频带(f一l)和当前频带(f)的比例值的差分进行霍夫曼 编码。因此,从频带f一l的比例值减去如上所述算出的差分(+60)的值 成为当前频带f中的比例值。
接着,说明量化误差估计部46。如上所述,可以估计比例位数相对 于频谱位数和比例位数的合计的比例越大量化误差越大;比例位数相对 于频谱位数和比例位数的合计的比例越小量化误差越小。并且同样地, 可以估计频谱位数相对于频谱位数和比例位数的合计的比例越小量化误差越大;频谱位数相对于频谱位数和比例位数的合计的比例越大量化误 差越小。并且,当频谱位数和比例位数的合计一定时,仅根据频谱位数 的大小或仅根据比例位数的大小来估计量化误差。
在各频带中频谱位数和比例位数的合计一定时,例如可以使用图12 所示的右上扬的曲线,根据频谱位数(Bscale)求出量化误差(Err)。 并且,也可以代替曲线而使用直线。解码装置4可以将图12所示的曲线 图数据作为表示比例位数和量化误差的对应关系的表来存储在数据存储 部49,也可以将图12所示的曲线图数据作为近似地表示图12的曲线的 式来保存。作为这样的式有如下所示的式。在下述式中,x为比例位数、 y为量化误差、a、 b、 c为常数。
y=a.x2+bx+c
同样地,可以通过使用图13所示的右下陷的曲线图,根据频谱位数 求出量化误差。
在将比例位数或频谱位数相对于频谱位数和比例位数的合计的比例 用于量化误差估计时,首先根据下式求出该比例。并且,使用与图12及 图13所示的对应关系相同的对应关系来求出量化误差。
比例=比例位^/ (比例位数+频谱位数)或,
比例=频谱位数/ (比例位数+频谱位数)。
关注比例位数时,在比例位数或比例位数相对于总位数的比例为一 定值以上时,也可以用预先确定量化误差的上限值来进行削波。即、使 用图14所示的形状的曲线来求出量化误差。关注频谱位数时,在频谱位 数或频谱位数相对于总位数的比例为一定值以下时,使用预先确定了量 化误差的上限值来进行削波。即、使用图15所示的形状的曲线来求出量 化误差。通过进行这样的削波处理,可以防止量化误差估计值变得过大。
接着说明校正量算出部47。校正量算出部47基本上是以量化误差 越大校正量越大的方式来算出校正量。但是,也可以设置校正量的上限 值,以使校正量不会变得过大。进而,也可以设置校正量的下限值。
图16表示设置了校正量的上限值和下限值时的量化误差和校正量 的对应关系的例子。校正量算出部47使用表示图16的对应关系的表或式,根据量化误差算出校正量。在图16中,在某一频带中的量化误差为 Err时算出校正量"。并且,在量化误差为上限值ErrH以上时,校正量 与量化误差的值无关而成为aH。并且,在量化误差为下限值ErrL以下 时,校正量与量化误差的值无关而成为"L。即、在使用图16所示的对 应关系时,校正量表示为下述的式子。例如,可以使"H-1、 "L = 0。 这表示在量化误差为ErrL以下时不进行MDCT系数的校正。 式l
aH(Err》En^) 校正量=< A(Err^Er^时) a(上述情形以外)
接着说明频谱校正部48。当某一频率f中的校正前的MDCT系数为 MDCT(f)、校正量为a、校正后的MDCT系数为MDCT,(f)时,频谱校正 部根据下式算出作为校正后的MDCT系数的MDCT'(f)。
MDCT,(f)=(l — a ) MDCT⑦
例如,当《=0 (校正量为0)时,校正前和校正后的MDCT系数成 为相同的值。上述式是仅对某一个频带进行校正的情形,但也可以如下 式所示在邻接频带之间进行插值。
MDCT,(f)=k'MDCT(f-l)+(l—k) (l — a)MDCT(f) (0sksl) 如以上说明,在本实施方式中根据频谱位数或比例位数来估计量化 误差,并根据量化误差校正MDCT系数。由此,可以减小编码装置发生 的量化误差。因此,可以解决现有技术中的、当输入振幅大的音频信号 或扫频信号等时,解码装置的解码音中发生削波音的问题。 (第2实施方式)
图17表示第2实施方式中的解码装置5的结构。第2实施方式中的 解码装置5具有与第1实施方式的解码装置4相同的功能部。但是,量 化误差估计部56的处理与量化误差估计部46的处理不同。并且,如图 17所示,在解码装置5中,逆量化部51算出的校正前MDCT系数被输 入到量化误差估计部56。这一点也与第1实施方式不同。其他的功能, 第1实施方式和第2实施方式相同。一般,在作为校正前的MDCT系数的逆量化值的绝对值大时,可以 认为与作为校正前的MDCT系数的逆量化值的绝对值小时相比,频谱值 的量化幅度大、且量化误差也大。因此,当在逆量化值的绝对值大时和 小时,如果比例位数相同或频谱位数相同,则可以认为逆量化值大时的 量化误差大。即、比例位数或频谱位数对量化误差的贡献的程度根据逆 量化值的大小变化。
第2实施方式中,考虑了此点。即、在关注比例位数时,如图18所 示,准备多个比例位数和量化误差之间的对应关系,并由数据存储部59 存储这些对应关系。或者,将这些对应关系作为式来进行保存。并且, 量化误差估计部56代替根据逆量化值的大小使用的对应关系,而根据比 例位数来算出量化误差。即、在图18的情形中,量化误差估计部56在 逆量化值的大小为预先决定的阈值以上时使用对应关系A;在逆量化值 不足于该阈值时使用对应关系B。
如图18所示,某一频带中的比例位数为Bscale时,使用对应关系A 时的量化误差成为Errl ,使用对应关系B时的量化误差成为Err2。
在使用比例位数相对于总位数的比例时,也可以使用与图18所示的 多个对应关系相同的对应关系。并且,在关注频谱位数来估计量化误差 时,可以使用图19所示的多个对应关系。在使用频谱位数相对于总位数 的比例时的情形也相同。 (第3实施方式)
第3实施方式是基于与第2实施方式相同的观点作出的。图20表示 第3实施方式中的解码装置6的结构图。图20的结构在作为逆量化值的 校正前MDCT系数被供给到校正量算出部67这一点上,与第1实施方 式不同,并且校正量算出部67的处理与第1实施方式不同。其他点与第 1实施方式相同。
如图21所示,第3实施方式的解码装置6保存多个量化误差和校正量 的对应关系,校正量算出部67根据逆量化值的大小来切换对应关系。例如, 在逆量化值不足于规定的阈值时,校正量算出部67选择对应关系D。此时, 如果量化误差为Err则校正量算出部67将校正量设为"。并且,在逆量化值为规定阈值以上时,校正量算出部67选择对应关系C。此时,如果 量化误差为Err则校正量算出部67将校正量设为"'。 (第4实施方式)
接着,说明本发明第4实施方式。图22表示第4实施方式中的解码 装置7的结构。与第1实施方式的解码装置4相比,第4实施方式中的 解码装置7在包含位率算出部76这一点、和量化误差估计部77的处理 与量化误差估计部46的处理不同这一点上,与第1实施方式的解码装置 4不同。关于其他的功能,第1实施方式和第4实施方式相同。
一般,在编码中的位率小时,与位率大时相比,可以认为频谱值的 量化幅度大、且量化误差也大。即、比例位数或频谱位数对量化误差贡 献的程度根据位率变化。另外,位率是在用于将单位时间(例如l秒) 的音频信号表现为编码数据的位数。
在第4实施方式中,考虑此点,在关注比例位数时,准备多个如图 23所示的比例位数和量化误差之间的对应关系,并由解码装置7的数据 存储部80存储这些对应关系。或者将这些对应关系作为式来保存。
在图22的结构中,由位率算出部76算出编码数据的位率,并将这 些输入到量化误差估计部77。另外,可以根据编码数据的位数算出位率, 也可以根据帧的头信息取得位率。在使用图23的对应关系的情形中,量 化误差估计部77选择与从位率算出部76输入的位率对应的对应关系, 并使用该对应关系根据比例位数算出量化误差。即、在位率为预先确定 的阈值以上时,量化误差估计部77使用图23所示的对应关系E。并且, 在位率不足于阈值时,量化误差估计部77使用对应关系F。
如图23所示,在某一频带中的比例位数为Bscale时,使用对应关系 F时的量化误差成为Errl,使用对应关系E时的量化误差成为Err2。
在使用比例位数相对于总位数的比例时,也可以使用与图23所示的 多个对应关系相同的对应关系。并且,关注频谱位数来估计量化误差时, 可以使用图24所示的多个对应关系。在使用频谱位数相对于总位数的比 例时也相同。
(第5实施方式)第5实施方式是基于与第4实施方式相同的观点而作出的。图25表 示第5实施方式的解码装置9的结构。图25的结构在位率算出部96将 位率输入到校正量算出部98的这一点和在校正量算出部98、而不是在量 化误差估计部97中从多个对应关系选择1个对应关系这一点上,与第4 实施方式不同。
如图26所示,第5实施方式的解码装置9保存多个量化误差和校正 量的对应关系,并且校正量算出部98根据位率的大小切换对应关系。例 如,在位率是规定阈值以上时,校正量算出部98算出对应关系H。在该 情形中,如果量化误差为Err,则校正量算出部98将校正量设为"。并 且,在位率不足于规定阈值时,校正量算出部98选择对应关系G。此时, 如果量化误差为Err则校正量算出部98将校正量设为"'。 (第6实施方式)
接着说明本发明的第6实施方式。第6实施方式的整体的装置结构 与第1实施方式中的图9所示的装置结构相同,以下根据图9的结构进 行说明。第6实施方式和第1实施方式中,处理动作不同。以下,参照 图27的流程图说明第6实施方式的解码装置4的动作。
解码装置4接收当前帧的编码数据。霍夫曼解码部40对接收到的编 码数据进行霍夫曼解码,算出各频带中的MDCT系数的频谱值(量化值) 和比例值(步骤21)。并且,霍夫曼解码部40将1个频带的量化值和比 例值输入到逆量化部41,逆量化部41根据量化值和比例值算出校正前 MDCT系数(步骤22)。另一方面,霍夫曼解码部40将上述频带的量 化值的霍夫曼码字及其比例值的霍夫曼码字、以及各自对应的码本号输 入到位数算出部45,并由位数算出部45算出频谱位数和比例位数。并且, 位数算出部45求出对到当前为止求出的频谱位数的合计上加上此次求出 的频谱位数的频谱位数的合计,求出对到当前为止求出的比例位数的合 计上加上此次求出的比例位数的比例位数的合计(步骤23)。
解码装置4反复进行步骤22 步骤23的步骤,位数算出部45算出
当前帧中的总频带的频谱位数的合计和总频带的比例位数的合计。并且, 逆量化部41算出总频带的校正前MDCT系数。并且,位数算出部45将所算出的频谱位数的合计和比例位数的合计输入到量化误差估计部46,量化误差估计部46使用频谱位数的合计或比例位数的合计、或者使用频谱位数的合计和比例位数的合计这两者,算出与总频带相关的量化误差(步骤25)。此处,使用与在第1实施方式中说明的对应关系相同的对应关系来算出量化误差。
根据量化误差估计部46算出的量化误差被输入到校正量算出部47,校正量算出部47根据量化误差算出对总频带的校正前MDCT系数的校正量(步骤26),并且将所算出的校正量输入到频谱校正部48。校正量的求出方法与第1实施方式相同。
频谱校正部48根据由校正量算出部47获得的校正量,校正从逆量化部41输入的校正前MDCT系数,并算出校正后MDCT系数(步骤27)。本实施方式中的频谱校正部48对总频带一律使用相同的校正量来校正校正前MDCT系数,并将校正后的总频带的MDCT系数输入到逆MDCT部42。
逆MDCT部42对总频带的校正后MDCT系数进行逆MDCT变换并输出当前帧的时间信号(步骤28)。从逆MDCT部42输出的时间信号被输入到叠加加算部43,同时存储在缓存44内(步骤29)。
并且,叠加加算部43将从逆MDCT部42供给的当前帧的时间信号和存储在缓存44内的当前帧的时间信号叠加而进行加算,并输出解码音(步骤30)。
在本实施方式中,求出帧的总频带的校正量,并校正总频带的MDCT系数。代替于此,也可以根据总频带的一部分的多个频带的频谱位数的合计或比例位数的合计算出校正量,并进行将该多个频带的MDCT系数校正为一致的处理,直到达到总频带。
并且,也可以组合第2 第5实施方式中说明的处理和本实施方式的处理。
第1 第6实施方式中的解码装置适用于播放接收用设备、通信设备、音频再现设备等的各种设备。作为一例,图28表示了用于接收地上数字电视播放的接收机110的结构。该接收机110具有用于接收播放电波的天线111、用于对被DFDM调制的信号进行解调的解调部112、用于对由解调部112取得的编码数据进行解码的解码部113、用于输出声音的扬声器114以及用于输出图像的显示部115。解码部113内具备图像解码器和声音解码器,声音解码器具有本实施方式中说明的解码装置的功能。
并且,第1 第6实施方式的解码装置的各功能部可以作为硬件来实现,也可以通过在计算机系统中执行程序来实现。图29表示了这样的计算机系统120的结构。如图29所示,该计算机系统120具有CPU121、存储器122、通信装置123、包含声音输出部的输入输出装置124、硬盘驱动器等的存储装置125以及CD-ROM等的存储介质的读取装置126。
进行本实施方式说明的解码处理的程序是由读取装置126从CD-ROM等的存储介质读取,并安装到计算机系统120。并且,也可以从网络上的服务器下载该程序。通过在计算机系统120中执行该程序,例如读出存储在存储装置125中的编码数据并解码,作为解码音输出。并且,也可以通过通信装置123从网络接收编码数据,并将其解码,作为解码音输出。
本发明不限定于上述实施例,可在权利要求的范围内进行各种变更及应用。
权利要求
1.一种解码装置,该解码装置对编码数据进行解码并输出音频信号,其中,所述编码数据是通过分别对音频信号的频域数据的比例值和频谱值进行编码而得到的,该解码装置的特征在于,所述解码装置包括频域数据取得单元,其对所述编码数据进行解码和逆量化,取得所述音频信号的频域数据;位数算出单元,其根据所述编码数据算出比例位数或频谱位数,其中,该比例位数是所述比例值的编码数据的位数,该频谱位数是所述频谱值的编码数据的位数;量化误差估计单元,其根据所述比例位数或所述频谱位数,估计所述频域数据的量化误差;校正单元,其根据所述量化误差算出校正量,使用该校正量校正由所述频域数据取得单元取得的所述频域数据;以及变换单元,其将通过所述校正单元校正后的所述频域数据变换为所述音频信号。
2. 根据权利要求1所述的解码装置,其中,所述位数算出单元算出所述比例位数或所述频谱位数相对于所述比 例位数和所述频谱位数的合计的比例,所述量化误差估计单元根据该比例估计所述量化误差。
3. 根据权利要求1所述的解码装置,其中,所述量化误差估计单元使用所述比例位数或所述频谱位数与所述量 化误差之间的预先确定的对应关系来估计所述量化误差。
4. 根据权利要求1所述的解码装置,其中,所述量化误差估计单元取得由所述频域数据取得单元取得的所述频 域数据,根据所述频域数据的值的大小,选择所述比例位数或所述频谱 位数与所述量化误差之间的预先确定的多个对应关系中的一个对应关 系,使用所选择的对应关系来估计所述量化误差。
5. 根据权利要求1所述的解码装置,其中,所述校正单元取得由所述频域数据取得单元取得的所述频域数据, 根据该频域数据的值的大小,选择所述量化误差与所述校正量之间的预 先确定的多个对应关系中的一个对应关系,使用所选择的对应关系来算 出所述校正量。
6. 根据权利要求1所述的解码装置,其中,所述解码装置还包括根据所述编码数据算出位率的位率算出单元, 所述量化误差估计单元根据所述位率,选择所述比例位数或所述频谱位数与所述量化误差之间的预先确定的多个对应关系中的一个对应关系,使用所选择的对应关系来估计所述量化误差。
7. 根据权利要求1所述的解码装置,其中,所述解码装置还包括根据所述编码数据算出位率的位率算出单元, 所述校正单元根据所述位率,选择所述量化误差与所述校正量之间的预先确定的多个对应关系中的一个对应关系,使用所选择的对应关系来算出所述校正量。
8. 根据权利要求1至7中的任一项所述的解码装置,其中, 所述位数算出单元算出多个频带的比例位数或频谱位数的合计,作为所述比例位数或所述频谱位数,所述校正单元使用所述校正量校正所述多个频带各自的频域数据。
9. 一种解码方法,该解码方法对编码数据进行解码并输出音频信号, 其中,所述编码数据是通过分别对音频信号的频域数据的比例值和频谱 值进行编码而得到的,该解码方法的特征在于,所述解码方法包括位数算出步骤,根据所述编码数据算出比例位数或频谱位数,其中, 该比例位数是所述比例值的编码数据的位数,该频谱位数是所述频谱值 的编码数据的位数;量化误差估计步骤,根据所述比例位数或所述频谱位数,估计所述 频域数据的量化误差;校正量算出步骤,根据所述量化误差算出校正量;校正步骤,使用所述校正量校正通过对所述编码数据进行解码及逆 量化而得到的频域数据;以及变换步骤,将通过所述校正步骤校正后的所述频域数据变换为所述 音频信号。
10. 根据权利要求9所述的解码方法,其中,所述位数算出步骤包括算出所述比例位数或所述频谱位数相对于所 述比例位数和所述频谱位数的合计的比例的步骤,所述量化误差估计步骤包括根据该比例估计所述量化误差的步骤。
11. 根据权利要求9所述的解码方法,其中,所述量化误差估计步骤包括使用所述比例位数或所述频谱位数与所 述量化误差之间的预先确定的对应关系来估计所述量化误差的步骤。
12. 根据权利要求9所述的解码方法,其中,所述量化误差估计步骤包括如下步骤取得通过对所述编码数据进 行解码及逆量化而得到的所述频域数据,根据所述频域数据的值的大小, 选择所述比例位数或所述频谱位数与所述量化误差之间的预先确定的多 个对应关系中的一个对应关系,使用所选择的对应关系来估计所述量化 误差。
13. 根据权利要求9所述的解码方法,其中,所述校正量算出步骤包括如下步骤取得通过对所述编码数据进行 解码及逆量化而得到的所述频域数据,根据该频域数据的值的大小,选 择所述量化误差与所述校正量之间的预先确定的多个对应关系中的一个 对应关系,使用所选择的对应关系来算出所述校正量。
14. 根据权利要求9所述的解码方法,其中,所述解码方法还包括根据所述编码数据算出位率的位率算出步骤, 所述量化误差估计步骤包括如下步骤根据所述位率,选择所述比 例位数或所述频谱位数与所述量化误差之间的预先确定的多个对应关系 中的一个对应关系,使用所选择的对应关系来估计所述量化误差。
15. 根据权利要求9所述的解码方法,其中,所述解码方法还包括根据所述编码数据算出位率的位率算出步骤, 所述校正量算出步骤包括如下步骤根据所述位率,选择所述量化误差与所述校正量之间的预先确定的多个对应关系中的一个对应关系,使用所选择的对应关系来算出所述校正量。
16. 根据权利要求9至15中的任一项所述的解码装置,其中, 所述位数算出步骤包括算出多个频带的比例位数或频谱位数的合计而作为所述比例位数或所述频谱位数的步骤,所述校正步骤包括使用所述校正量校正所述多个频带各自的频域数 据的步骤。
17. —种程序,该程序使计算机作为解码装置来进行工作,该解码装 置对编码数据进行解码并输出音频信号,其中,所述编码数据是通过分 别对音频信号的频域数据的比例值和频谱值进行编码而得到的,该程序 的特征在于,所述程序使所述计算机作为如下单元来进行工作频域数据取得单元,其对所述编码数据进行解码和逆量化,取得所 述音频信号的频域数据;位数算出单元,其根据所述编码数据算出比例位数或频谱位数,其 中,该比例位数是所述比例值的编码数据的位数,该频谱位数是所述频 谱值的编码数据的位数;量化误差估计单元,其根据所述比例位数或所述频谱位数,估计所 述频域数据的量化误差;校正单元,其根据所述量化误差算出校正量,使用该校正量校正由 所述频域数据取得单元取得的所述频域数据;以及变换单元,其将通过所述校正单元校正后的所述频域数据变换为所 述音频信号。
全文摘要
本发明提供一种解码装置、解码方法及计算机可读取的记录介质。该解码装置对编码数据进行解码并输出音频信号,其中,所述编码数据是通过分别对音频信号的频域数据的比例值和频谱值进行编码而得到的。该解码装置包括如下单元对所述编码数据进行解码和逆量化,并取得所述音频信号的频域数据;根据所述编码数据算出作为所述比例值的编码数据的位数的比例位数、或作为所述频谱值的编码数据的位数的频谱位数;根据所述比例位数或所述频谱位数,估计所述频域数据的量化误差;根据所述量化误差算出校正量,并使用该校正量校正所述频域数据;以及将所述频域数据变换为所述音频信号。
文档编号G10L19/00GK101681626SQ20078005340
公开日2010年3月24日 申请日期2007年6月20日 优先权日2007年6月20日
发明者土永义照, 田中正清, 白川美由纪, 铃木政直 申请人:富士通株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1