编码方法、解码方法、编码装置、解码装置、程序及记录介质的制作方法

文档序号：2832803阅读：140来源：国知局

专利名称：编码方法、解码方法、编码装置、解码装置、程序及记录介质的制作方法
技术领域：
本发明涉及将例如语音及音乐等音响、视频等信号序列通过矢量量化进行编码或解码的技术。
背景技术：
在专利文献I记载的编码装置中，输入信号首先除以归一化值进行归一化。归一化值进行量化，生成量化索引。归一化的输入信号进行矢量量化，生成量化代表矢量的索弓I。生成的量化索引及量化代表矢量输出至解码装置中。在解码装置中，解码量化索引，生成归一化值。另外，解码量化代表矢量的索引，生成样本列。生成的样本列的每个样本乘以归一化值而得到的值的列成为解码信号样本列。另一方面，作为量化噪声少的高效率的矢量量化方法，广泛利用例如SVQ法·(Spherical Vector Quantization,例如参照非专利文献I)等,在预先设定的量化比特数的范围内，汇总多个输入信号进行量化的矢量量化方法。在SVQ法中，使用量化归一化值归一化MDCT (Modified DisCreteCosineTransform)系数等输入信号的各样本,归一化的各样本按每个子带进行汇总量化。此时，根据每个子带的听觉的重要性，动态地分配与各子带对应的码比特数(量化比特数)。另外，在SVQ法中，假定输入信号的稀疏性，优先量化输入信号的主要分量。因此，可高精度量化高次谐波及元音那样频域中的仅存在少量能量的输入信号(稀疏信号)。但是，在以SVQ法量化能量分布于许多频率的输入信号的各样本的情况下，在应存在于输入信号的频率分量不存在于从量化值恢复的解码信号中的(频率分量从解码信号缺损)频率变高。这样，在频率分量从解码信号中缺损的情况下，解码信号的某个频率分量的有无随着时间不连续变化的频率变高。人们对这种频率分量的有无随着时间不连续的变化是敏感的。在输入信号为例如音响信号的情况下，这种变化有时作为称为音乐噪声的噪声而被察觉。另外，在输入信号为视频信号的情况下，有时产生相当于音响信号中的音乐噪声那样的块状噪声。下面，将音乐噪声及块状噪声统称为“音乐噪声等”。与此相对，与SVQ法相比，具有频率分量从解码信号缺损的频率较低的AVQ法(Algebraic Vector Quantization,例如参照非专利文献2)的矢量量化方法。与SVQ法一样，AVQ法是假定信号的稀疏性的方法，但能够得到可恢复比SVQ法更多的频率分量的量化值。现有技术文献专利文献专利文献I :日本特开平7 - 261800非专利文献非专利文献I :Recommendation ITU -TG. 729. 1，SERIES G: TRANSMISSIONSYSTEMS AND MEDIA, DIGITAL SYSTEMS ANDNETffORKS, Digital terminal equipments —Coding of analogue signals bymethods other than PCM, G. 729 — based embeddedvariable bit — rate coder:An 8 — 32kbit/s scalable wideband coder bitstreaminteroperable with G. 729.非专利文献2 :Recommendation ITU —T G. 718, SERIES G: TRANSMISSION SYSTEMSAND MEDIA, DIGITAL SYSTEMS ANDNETffORKS, Digital terminal equipments — Coding ofvoice and audiosignals, Frame error robust narrow — band and wideband embeddedvariable bit —rate coding of speech and audio from 8 — 32kbit/s.

发明内容
发明要解决的课题但是，AVQ法幅度的量化精度比SVQ法粗糙。例如，即使频率分量从解码信号缺损的频率低，如果幅度的量化精度粗糙，则也会发生音乐噪声等。这种问题不限于AVQ法，与基于量化精度发生音乐噪声等的情况相同。另外，这种问题不仅可以在输入信号为频域的信号的情况下产生，而且，也可以在输入信号为时域的信号的情况下产生。本发明中，提供一种基于降低量化精度发生的音乐噪声等的技术。用于解决课题的手段在编码时，汇总多个样本进行矢量量化，求得矢量量化索引和多个样本各自的量化值，从被分配用于与矢量量化索引对应的码的比特数减去与矢量量化索引对应的码所使用的比特数，将得到的数以下的比特数根据基于听觉特性的规定的优先顺序分配给分别由多个样本位置构成且被赋予了基于听觉特性的优先顺序的多个样本位置集合中的I个以上的样本位置集合，对于被分配了比特数的样本位置集合分别输出索引信息，该索引信息表示多组的与每个样本的位置对应的预定的系数的组中、使属于该样本位置集合的样本的值、与将属于该样本位置集合的样本的量化值和与每个样本的位置对应的系数相乘的值之间的误差的有关属于该样本位置集合的全部样本位置之和最小的系数的组。在解码时，求与输入的矢量量化索引对应的多个值作为与多个样本位置分别对应的解码值，在构成样本位置的多个样本位置集合中，将根据基于听觉特性的规定的优先顺序而被分配了比特数的样本位置的集合作为处理对象，使用输入的索引信息所表示的与多个样本位置对应的预定的系数的组，输出将与处理对象的样本位置集合所包含的各样本位置对应的解码值和系数相乘的值。发明效果在编码中，为了修正多个样本各自的量化值，输出表示多个斜率系数的组的索引信息，因此，能够降低解码时的量化误差，并降低音乐噪声等。在解码中，使用索引信息表示的多个斜率系数的组，修正多个解码值，因此，能够降低量化误差，并降低音乐噪声等。

图I是编码装置及解码装置的例子的功能方块图；图2是编码方法的例子的流程图；图3是步骤E4的例子的流程图；图4是步骤E4的例子的流程图5是解码方法的例子的流程图；图6是步骤D3的例子的流程图；图7是步骤D3的例子的流程图；图8是示例输入信号、量化值和斜率系数(倾斜校正增益)的关系的图。
具体实施例方式下面，详细说明本发明的一个实施方式。(构成)如图I中所示例，实施方式的编码装置11包含例如归一化值计算部112、归一化值量化部113、矢量量化部115及斜率计算部116。斜率计算部116相当于“比特分配部”及“系数组选择部”。如图I中所示例，实施方式的解码装置12包含例如归一化值解码部121、矢量解码部122及斜率修正部124。根据需要，编码装置11也可以包含例如频域变换部111。解码装置12也可以包含例如时域变换部125、平滑化部126。(编码处理)编码装置11执行图2中示例的编码方法的各步骤。输入信号X (k)输入于归一化值计算部112、矢量量化部115及斜率计算部116。该例子的输入信号X (k)是将音响信号等时间序列信号即时域信号X (η)变换为频域而得到的频域信号。频域的输入信号X (k)也可以直接输入编码装置11，也可以由频域变换部111将时域的输入信号X (η)变换为频域而生成频域的输入信号X (k)。在频域变换部111生成频域的输入信号X (k)的情况下，频域变换部111将输入的时域的输入信号X (η)通过例如MDCT (Modified Discrete Cosine Transform)变换成频域的输入信号X (k)进行输出。η是时域中的信号编号(离散时间编号)，k是频域中的信号(样本)的编号(离散频率编号)。η的值越大，对应越晚的时间。k的值越大，对应越高的频率。作为I帧由L个样本构成，时域信号X (η)在频域中每帧进行变换，生成L个构成频率分量的频域的输入信号X(k) (k = 0、l、…、L—l)。L是规定的正数，例如为64或80等比I更大的整数。另外，在使用MDCT的情况下，作为输入的时序信号的由L个样本构成的帧逐一向频域变换，成为该变换对象的帧每I/2帧即每L/2个样本进行移位。归一化值计算部112在每帧计算代表输入的输入信号X (k)的L个样本中的规定个数Ctl的样本的值即归一化值(步骤El)。，XcT是指，Xtl的上标横杠。在此，τ设为对利用I帧中L个样本中的规定个数Cci样本构成的各子带唯一分配的O以上的整数。Ctl是L或I及L以外的L的公约数。另外，将Ctl设为L是指对每L个样本求得归一化值。使Ctl设为I及L以外的L的公约数是指将L个样本分割为子带(相当于“样本位置集合”)，对构成各子带的每Ctl个样本求得归一化值。例如，在L = 64、以8个频率分量构成子带的情况下，构成8个子带，计算各子带的归一化值。另外，在Ctl SL的情况下，τ =0，归一化值，XcT是代表L个样本的值。即，在Ctl为L的情况下，对每帧计算I个归一化值τΧο —。另一方面，在Ctl为I及L以外的L的公约数的情况下，τ是与I帧中的各子带对应的整数τ =Or^(IVCtl) - 1，归一化值，XcT是代表属于与τ对应的子帧的Ctl个样本的值。即，在Ctl为I及L以外的L的公约数的情况下，每帧计算(IVCtl)个归一化值，XcT ( τ=0、...、(L/C。)一 I)。另外，不管 C。的值如何，都是 k = τ .C。、…、(τ +D-C0-Io在归一化值计算部112计算的，XcT发送至归一化值量化部113。[归一化值τΧ。—的具体例]归一化值τΧ(!—是代表Ctl个样本的值。换言之,归一化值τΧ(!—是与Ctl个样本对应的值。归一化值τΧο —的例子是相对于下面那样的Ctl个样本的幂平均值的平方根。[数I]
权利要求
1.一种编码方法，其具有矢量量化步骤，汇总多个样本进行矢量量化，求得矢量量化索引和所述多个样本各自的量化值；比特分配步骤，从被分配用于与矢量量化索引对应的码的比特数减去与所述矢量量化索引对应的码所使用的比特数，将得到的数以下的比特数按照基于听觉特性的规定的优先顺序分配给分别由多个样本位置构成且被赋予了基于所述听觉特性的优先顺序的多个样本位置集合中的I个以上的样本位置集合；以及系数组选择步骤，对于在所述比特分配步骤中被分配了比特数的样本位置集合，分别输出索引信息，所述索引信息表示多组的与每个所述样本的位置对应的预定的系数的组中、使属于该样本位置集合的样本的值、与将属于该样本位置集合的样本的量化值和与每个所述样本的位置对应的系数相乘的值之间的误差的有关属于该样本位置集合的全部样本位置之和最小的系数的组。
2.如权利要求I所述的编码方法，其中，对作为所述样本位置集合的其中一个的第一样本位置集合分配的比特数是对作为所述优先顺序比该第一样本位置集合更低的所述样本位置集合的其中一个的第二样本位置集合分配的比特数以上。
3.如权利要求I所述的编码方法，其中，所述比特分配步骤包含与所述矢量量化索引对应的码未使用的比特数中没有分配给任何所述样本位置集合的剩余比特数不大于所述多个样本位置集合中未进行比特数分配的样本位置集合的个数的情况下，对未进行比特数的分配的所述样本位置集合中所述优先顺序最高的集合分配第一比特数，在所述剩余比特数大于所述多个样本位置集合中未进行比特数的分配的样本位置集合的个数的情况下，对未进行比特数的分配的所述样本位置集合中所述优先顺序最高的集合分配比所述第一比特数更大的第二比特数的步骤。
4.如权利要求I 3中任一项所述的编码方法，其中，所述系数的组由处于以与所述系数对应的样本位置对应的时间或频率的值为第一轴、以所述系数的值为第二轴的平面上的直线上的系数构成。
5.如权利要求I 3中任一项所述的编码方法，其中，所述系数的组由偏向以与所述系数对应的样本位置对应的时间或频率的值为第一轴、以所述系数的值为第二轴的平面上的直线或特定曲线而分布的系数构成。
6.一种解码方法，其具有矢量解码步骤，求与输入的矢量量化索引对应的多个值作为分别与多个样本位置对应的解码值；以及系数相乘步骤，在构成所述样本位置的多个样本位置集合中，将根据基于听觉特性的规定的优先顺序而被分配了比特数的样本位置的集合作为处理对象，使用与输入的索引信息所表示的多个样本位置对应的预定的系数的组，输出与所述处理对象的样本位置集合所包含的各样本位置对应的所述解码值和所述系数相乘的值。
7.如权利要求6所述的解码方法，其中，所述系数的组由处于以与所述系数对应的样本位置对应的时间或频率的值为第一轴、以所述系数的值为第二轴的平面上的直线上的系数构成。
8.如权利要求6所述的解码方法，其中，所述系数的组由偏向以与所述系数对应的样本位置对应的时间或频率的值为第一轴、以所述系数的值为第二轴的平面上的直线或特定曲线而分布的系数构成。
9.一种编码装置，其具有矢量量化部，汇总多个样本进行矢量量化，求得矢量量化索引和所述多个样本各自的量化值；比特分配部，从被分配用于与矢量量化索引对应的码的比特数减去与所述矢量量化索引对应的码所使用的比特数，将得到的数以下的比特数按照基于听觉特性的规定的优先顺序分配给分别由多个样本位置构成且被赋予了基于所述听觉特性的优先顺序的多个样本位置集合中的I个以上的样本位置集合；以及系数组选择部，对于在所述比特分配部中被分配了比特数的样本位置集合，分别输出索引信息，所述索引信息表示多组的与每个所述样本的位置对应的预定的系数的组中、使属于该样本位置集合的样本的值、与将属于该样本位置集合的样本的量化值和与每个所述样本的位置对应的系数相乘的值之间的误差的有关属于该样本位置集合的全部样本位置之和最小的系数的组。
10.如权利要求9所述的编码装置，其中，对作为所述样本位置集合的其中一个的第一样本位置集合分配的比特数是对作为所述优先顺序比该第一样本位置集合更低的所述样本位置集合的其中一个的第二样本位置集合分配的比特数以上。
11.如权利要求9所述的编码装置，其中，所述比特分配部以如下方式构成，即，与所述矢量量化索引对应的码未使用的比特数中没有分配给任何所述样本位置集合的剩余比特数不大于所述多个样本位置集合中未进行比特数分配的样本位置集合的个数的情况下，对未进行比特数的分配的所述样本位置集合中所述优先顺序最高的集合分配第一比特数，在所述剩余比特数大于所述多个样本位置集合中未进行比特数的分配的样本位置集合的个数的情况下，对未进行比特数的分配的所述样本位置集合中所述优先顺序最高的集合分配比所述第一比特数更大的第二比特数。
12.如权利要求9 11中任一项所述的编码装置，其中，所述系数的组由处于以与所述系数对应的样本位置对应的时间或频率的值为第一轴、以所述系数的值为第二轴的平面上的直线上的系数构成。
13.如权利要求9 11中任一项所述的编码装置，其中，所述系数的组由偏向以与所述系数对应的样本位置对应的时间或频率的值为第一轴、以所述系数的值为第二轴的平面上的直线或特定曲线而分布的系数构成。
14.一种解码装置，其具有矢量解码部，求与输入的矢量量化索引对应的多个值作为分别与多个样本位置对应的解码值；以及系数相乘部，在构成所述样本位置的多个样本位置集合中，将根据基于听觉特性的规定的优先顺序而被分配了比特数的样本位置的集合作为处理对象，使用与输入的索引信息所表示的多个样本位置对应的预定的系数的组，输出与所述处理对象的样本位置集合所包含的各样本位置对应的所述解码值和所述系数相乘的值。
15.如权利要求14所述的解码装置，其中，所述系数的组由处于以与所述系数对应的样本位置对应的时间或频率的值为第一轴、以所述系数的值为第二轴的平面上的直线上的系数构成。
16.如权利要求14所述的解码装置，其中，所述系数的组由偏向以与所述系数对应的样本位置对应的时间或频率的值为第一轴、以所述系数的值为第二轴的平面上的直线或特定曲线而分布的系数构成。
17.一种程序，其用于使权利要求I的编码方法的各步骤在计算机执行。
18.—种程序，其用于使权利要求6的解码方法的各步骤在计算机执行。
19.一种计算机可读取的记录介质，其存储用于使权利要求I的编码方法的各步骤在计算机执行的程序。
20.一种计算机可读取的记录介质，其存储用于使权利要求6的解码方法的各步骤在计算机执行的程序。
全文摘要
将多个样本进行矢量量化，求得矢量量化索引和量化值，从被分配用于与矢量量化索引对应的码的比特数减去与矢量量化索引对应的码所使用的比特数，将得到的数以下的比特数按照基于听觉特性的规定的优先顺序分配给分别由多个样本位置构成且被赋予了基于听觉特性的优先顺序的多个样本位置集合中的1个以上的样本位置集合，对于被分配了比特数的样本位置集合的每个，输出表示使属于该样本位置集合的样本的值、与将属于该样本位置集合的样本的量化值和与每个样本的位置对应的系数相乘的值之间的误差的有关属于该样本位置集合的全部样本位置之和最小的系数的组的索引信息。
文档编号G10L19/02GK102959623SQ20118003163
公开日2013年3月6日申请日期2011年7月4日优先权日2010年7月5日
发明者福井胜宏, 佐佐木茂明, 日和崎佑介, 小山翔一, 堤公孝申请人:日本电信电话株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：福井胜宏;佐佐木茂明;日和崎佑介;小山翔一;堤公孝
技术所有人：日本电信电话株式会社
我是此专利的发明人