编码装置、解码装置及它们的方法

文档序号：2825312阅读：130来源：国知局

专利名称：编码装置、解码装置及它们的方法
技术领域：
本发明涉及对宽带的语音信号和音频信号等的频谱进行编码的编码装置、解码装置、它们的方法。
背景技术：
在语音编码的领域中，作为将50Hz 7kHz的宽带信号编码的具代表性的方法，有 ITU-T 的标准 G722、G722. 1，或者 3GPP (The 3rd Generation Partnership Project)提倡的AMR-WB等。根据这些编码方式，能够对比特率为6. 6kbit/s 641ibit/S的宽带的语音信号进行编码。可是，该宽带信号的音质虽然比窄带信号好，但在以音频信号为对象时以及对语音信号进一步要求如亲临现场般的高质量时，并不充分。一般而言，如果能够将信号的最大频率宽带化到10 15kHz的程度，能够获得相当于FM收音机的亲临现场感，如果能够宽带化到20kHz的程度的话，能够获得相当于CD的质量。对于这样的宽带信号的编码，以MPEG (Moving Picture Expert Group)标准化的第3 层(Layer 3)方式和AAC(Advanced audio coding)方式等为代表的对音频信号的编码方式较适合。可是，这些音频编码方式，由于编码对象的频带较宽，所以编码参数的比特率变大。在专利文献1中，公开了以下技术作为以低比特率高质量地对宽带信号的频谱进行编码的技术在宽带频谱中，以低频率域的频谱的复制置换高频部分的频谱后，进行包络线调整，由此在抑制质量恶化的同时降低整体的比特率。而在专利文献2中公开了以下技术将频谱分隔为多个子带，对每个子带计算增益并生成增益向量，对该增益向量进行向量量化，由此降低比特率。[专利文献1]特表2001-521648号公报(第15页、图1、图2)[专利文献2]特开平546M87号公报

发明内容
本发明需要解决的问题图IA 图ID是表示将专利文献1公开的技术适用于频带0彡k < ra的原有信号时的各个频谱的图。图IA表示原有信号的频谱，图IB表示将原有信号的频谱的高频部分(FL
< FH)删除后的低频频谱，图IC表示通过将图IB的低频频谱的复制插入高频部分而获得的全频带的频谱，图ID表示进行高频部分的包络线调整之后的频谱。这样，以低频频谱的复制置换高频频谱后进行包络线调整的理由是，因为知道新生成的高频频谱(复制频谱)的轮廓与原有信号的高频频谱的轮廓差异大时，会产生较大的质量恶化。因此，通过调整新生成的高频频谱的轮廓，来提高原有信号的高频频谱和新生成的频谱的相似程度是非常重要的。作为调整高频频谱的轮廓的方法，例如可以考虑对复制频谱乘以调整系数(增益)，以使复制频谱的功率与原有信号的高频频谱的功率相一致。图2A、B是表示通过对该复制频谱乘以增益的处理而获得的频谱的轮廓的一个例子的图。图2A是表示原有信号的频谱的轮廓的图，图2B是表示轮廓调整后的频谱的轮廓的图。从图可得知，进行上述的频谱轮廓调整的话，所获得的频谱有下述的不适状况。即，在低频频谱和高频频谱的连接部分发生不连续的现象，成为产生奇怪的噪声的原因。这是因为对高频频谱全体一律乘以相同增益，虽然高频频谱的功率与原有信号的相一致，但不见得能保持低频频谱和高频频谱之间的连续性。并且，在低频频谱的轮廓具有某种特征性的形状时，如果仅一律地乘以相同增益，该具特征性的形状仍会不适宜地留在高频部分，而这也将成为音质恶化的原因之一。例如，也可以考虑通过将专利文献2的技术应用在上述的频谱的轮廓调整，S卩，通过在子带分割后对每个子带调整增益来进行轮廓调整。图3A、B是表示通过该处理而获得的频谱的轮廓的一个例子的图。图3A是表示原有信号的频谱的轮廓的图，图:3B是表示在子带分割后调整各个子带的增益时的频谱的轮廓的图。从该图可知，在应用专利文献2的技术时，有可能发生高频频谱形状的不正确(不能高精度地再现原本的原有信号的形状)。这是由于下述原因而产生在对每个子带调整增益的方法，为了高精度地进行编码而增加子带的数量，在原本需要较多的比特数时却不能分配到充分的比特数。由于在一开始以低频频谱的复制置换高频频谱就是以低比特率化为目的，所以理所当然会产生这个状况。如上述说明，在现有的方法中，将宽带信号的频谱编码时，难以在实现低比特率化的同时提高原有信号的高频频谱与新生成的频谱之间的相似程度。因此，本发明的目的在于提供一种能够在将宽带信号的频谱编码时，在实现低比特率化的同时，提高原有信号的高频频谱与新生成的频谱之间的相似性的编码装置和编码方法。用于解决所述问题的手段本发明的编码装置所采取的结构包括获得单元，获得至少被分成低频和高频的频谱；第一编码单元，将所述低频的频谱编码；第二编码单元，将所述高频的频谱的形状编码；第三编码单元，仅将所述高频的频谱的特定位置的增益编码；以及输出单元，输出由所述第一、第二、以及第三编码单元获得的编码信息。本发明的编码装置所采取的结构包括获得单元，获得至少被分为低频和高频的频谱；第一编码单元，将所述低频的频谱编码，以生成第一编码信息；第一解码单元，对所述第一编码信息进行解码，以生成解码低频频谱；生成单元，对所生成的所述解码低频频谱进行复制，以生成高频的频谱的形状；增益计算单元，将所述高频的频谱分割为多个子带，计算各个子带的增益；第二编码单元，仅将特定的子带的增益编码，所述特定的子带至少包括在所述高频的频谱的子带中、与所述低频的频谱相邻的所述高频的频谱的子带；插值单元，对所述特定的子带的增益进行插值，以求所述特定的子带以外的子带的增益；以及输出单元，输出由所述第一编码单元获得的编码信息和所述第二编码单元获得的编码信息。本发明的解码装置对有关至少被分为低频和高频的频谱的编码信息进行解码，所采取的结构包括第一解码单元，对有关所述低频的频谱的编码信息进行解码，以生成解码低频频谱；第二解码单元，对有关所述高频的频谱的编码信息进行解码，以生成特定的子带的增益，所述特定的子带至少包括在被分割为多个子带的所述高频的频谱中、与所述低频的频谱相邻的所述高频的频谱的子带；插值单元，对所述特定的子带的增益进行插值，以求所述特定的子带以外的子带的增益；以及第三解码单元，使用由所述第一解码单元获得的低频频谱、以及由所述第二解码单元和所述插值单元获得的增益，对所述高频的频谱进行解码。本发明的编码方法包括获得步骤，获得至少被分为低频和高频的频谱；第一编码步骤，将所述低频的频谱编码，以生成第一编码信息；第一解码步骤，对所述第一编码信息进行解码，以生成解码低频频谱；生成步骤，对所生成的所述解码低频频谱进行复制，以生成高频的频谱的形状；增益计算步骤，将所述高频的频谱分割为多个子带，计算各个子带的增益；第二编码步骤，仅将特定的子带的增益编码，所述特定的子带至少包括在所述高频的频谱的子带中、与所述低频的频谱相邻的所述高频的频谱的子带；插值步骤，对所述特定的子带的增益进行插值，以求所述特定的子带以外的子带的增益；以及输出步骤，输出在所述第一编码步骤中获得的编码信息和在所述第二编码步骤中获得的编码信息。本发明的解码方法包括第一解码步骤，对有关所述低频的频谱的编码信息进行解码，以生成解码低频频谱；第二解码步骤，对有关所述高频的频谱的编码信息进行解码，以生成特定的子带的增益，所述特定的子带至少包括在被分割为多个子带的所述高频的频谱中、与所述低频的频谱相邻的所述高频的频谱的子带；插值步骤，对所述特定的子带的增益进行插值，以求所述特定的子带以外的子带的增益；以及第三解码步骤，使用在所述第一解码步骤中获得的低频频谱、以及在所述第二解码步骤和所述插值步骤中获得的增益，对所述高频的频谱进行解码。本发明的有益效果根据本发明，在将宽带信号的频谱编码时，能够在实现低比特率化的同时提高原有信号的高频频谱与新生成的频谱之间的相似程度。

图IA是表示原有信号的频谱的图。图IB是表示将原有信号的频谱的高频部分删除之后的低频频谱的图。图IC表示通过将低频频谱的复制插入高频部分而获得的全频带的频谱的图。图ID是表示进行高频部分的包络线调整之后的频谱的图。图2A是表示原有信号的频谱的轮廓的图。图2B是表示轮廓调整后的频谱的轮廓的图。图3A是表示原有信号的频谱的轮廓的图。图;3B是表示在子带分割后对每个子带的增益进行调整时的频谱的轮廓的图。图4是表示实施方式1的无线发送装置的主要结构的方框图。
图5是表示实施方式1的编码装置内部的主要结构的方框图。图6是表示实施方式1的高频编码单元内部的主要结构的方框图。图7是表示实施方式1的增益编码单元内部的主要结构的方框图。图8A是用于说明实施方式1的插值运算相关的一连串的处理的图。图8B是用于说明实施方式1的插值运算相关的一连串的处理的图。图9是表示量化点仅为gl (j)的1点的情况的图。图IOA是表示量化点为3点的情况的图。图IOB是表示量化点为3点的情况的图。图11是表示实施方式1的编码装置的其他变化形式的方框图。图12是表示实施方式1的高频编码单元的主要结构的方框图。图13是表示实施方式1的无线接收装置的主要结构的方框图。图14是表示实施方式1的解码装置内部的主要结构的方框图。图15是表示实施方式1的高频解码单元内部的主要结构的方框图。图16是表示实施方式1的解码装置的结构的图。图17是表示实施方式1的高频解码单元的主要结构的方框图。图18A是表示实施方式1的编码装置适用于有线通信系统时的发送端的主要结构的方框图。图18B是表示实施方式1的解码装置适用于有线通信系统时的接收端的主要结构的方框图。图19是表示实施方式2的分层编码装置的主要结构的方框图。图20是表示实施方式2的频谱编码单元内部的主要结构的方框图。图21是表示实施方式2的扩展频带增益编码单元内部的主要结构的方框图。图22A是用于说明实施方式2的扩展频带增益编码单元的处理概要的图。图22B是用于说明实施方式2的扩展频带增益编码单元的处理概要的图。图23是表示实施方式2的分层解码装置的内部结构的方框图。图M是表示实施方式2的频谱解码单元的内部结构的方框图。图25是表示实施方式2的扩展频带增益解码单元内部的主要结构的方框图。图沈是表示实施方式3的扩展频带增益编码单元的主要结构的方框图。图27是用于说明基准振幅值的计算方法的图。图观是用于说明实施方式3的插值单元的插值处理的图。图四是用于说明实施方式3的解码装置的结构的图。图30是表示实施方式4的扩展频带增益编码单元的主要结构的方框图。图31是用于说明实施方式4的插值单元的增益候选的配置方法的图。图32是用于说明实施方式4的扩展频带增益解码单元的图。
具体实施例方式以下，参照附图详细说明本发明的实施方式。然而，在此以编码/解码对象为音频信号或语音信号的情况为例进行说明。另外，本发明可大致考虑为适用于一般的编码(非可扩展的编码)的第一情况和适用于可扩展编码的第二情况。因此，在实施方式1中说明第一情况，并在实施方式2中说明第二情况。(实施方式1)图4是表示本发明实施方式1的编码装置被安装在无线通信系统的发送端时的无线发送装置130的主要结构的方框图。该无线发送装置130包括编码装置100、输入装置131、A/D变换装置132、RF调制装置133以及天线134。输入装置131将人耳朵可听见的声波Wll变换为作为电信号的模拟信号，并输出到A/D变换装置132。A/D变换装置132将此模拟信号变换为数字信号，并输出到编码装置100。编码装置100对输入的数字信号进行编码而生成编码信号，并输出到RF调制装置 133。RF调制装置133调制编码信号并生成调制编码信号后，输出到天线134。天线134将调制编码信号作为电波W12进行发送。图5是表示上述编码装置100内部的主要结构的方框图。这里，以时域的数字信号被输入，将该信号变换为频域的信号后进行编码的情况为例进行说明。编码装置100包括输入端子101、频域变换单元102、分割单元103、低频编码单元 104、高频编码单元105、复用单元106以及输出端子107。频域变换单元102将从输入端子101输入的时域的数字信号变换到频域，生成作为频域的信号的频谱。另外，使该频谱的有效频带为o<k<ra。变换到频域的方法使用离散傅立叶变换、离散余弦变换、变形离散余弦变换以及小波变换等。分割单元103将在频域变换单元102获得的频谱分割为低频频谱和高频频谱的两个频带(band)的频谱，将分割后的频谱提供给低频编码单元104和高频编码单元105。具体地说，分割单元103将从频域变换单元102输出的频谱分割为有效频带0 < k < FL的低频频谱和有效频带FL < k < ra的高频频谱，分别将获得的低频频谱提供给低频编码单元 104，将高频频谱提供给高频编码单元105。低频编码单元104对从分割单元103输出的低频频谱进行编码，将获得的编码信息输出到复用单元106。另外，在音频数据或语音数据的情况，由于低频的数据比高频的数据重要，对低频编码单元104分配比高频编码单元105多的比特，以高质量执行编码。作为具体的编码方法，可利用MPEG层3方式、AAC方式、TwinVQCTransform domain Weighted Interleave Vector Quantization)方式等。高频编码单元105对从分割单元103输出的高频频谱进行后述的编码处理，将获得的编码信息(增益信息)输出到复用单元106。高频编码单元105的编码方法的细节将后述。有关低频频谱的信息从低频编码单元104输入到复用单元106，另一方面，为获得高频频谱的轮廓所需要的增益信息从高频编码单元105输入复用单元106。复用单元106 对这些信息进行复用后，从输出端子107输出。图6是表示上述高频编码单元105内部的主要结构的方框图。输入信号的有效频率FL ≤k < FH的频谱S(k)通过输入端子111被提供给频谱形状编码单元112，频谱形状编码单元112进行此频谱的形状的编码。具体地说，频谱形状编码单元112对频谱形状进行编码，以使听觉失真变得最小，并将有关该频谱形状的编码信息提供给复用单元114和频谱形状解码单元116。
另外，作为频谱形状的编码方法，例如求使以(式1)表示的平方失真E为最小时的代码向量C(i，k)，输出此代码向量C(i，k)。
权利要求
1.一种编码装置，包括获得单元，获得至少被分为低频和高频的频谱；第一编码单元，将所述低频的频谱编码，以生成第一编码信息；第一解码单元，对所述第一编码信息进行解码，以生成解码低频频谱；生成单元，对所生成的所述解码低频频谱进行复制，以生成高频的频谱的形状；增益计算单元，将所述高频的频谱分割为多个子带，计算各个子带的增益；第二编码单元，仅将特定的子带的增益编码，所述特定的子带至少包括在所述高频的频谱的子带中、与所述低频的频谱相邻的所述高频的频谱的子带；插值单元，对所述特定的子带的增益进行插值，以求所述特定的子带以外的子带的增益；以及输出单元，输出由所述第一编码单元获得的编码信息和所述第二编码单元获得的编码 fn息ο
2.如权利要求1所述的编码装置，其中所述第二编码单元包括变更单元，对由所述插值单元求出的增益所表示的频谱与所述高频的频谱进行比较，基于这些频谱的相似程度而变更所述特定的子带的增益，所述第二编码单元将由所述变更单元变更后的增益编码。
3.如权利要求1所述的编码装置，其中所述第二编码单元将所述高频的频谱的最高频率的子带的增益编码。
4.如权利要求1所述的编码装置，其中所述第二编码单元将包括所述高频的频谱的极小点的子带的增益编码、或将包括所述高频的频谱的极大点的子带的增益编码。
5.如权利要求1所述的编码装置，其中，还包括第三编码单元，对有关在所述第二编码单元使用的所述特定的子带中至少一个子带的信息进行编码，所述输出单元还同时输出由所述第三编码单元获得的编码信息。
6.一种生成在频率轴方向具有扩展性的编码信息的分层编码装置，将权利要求1所述的编码装置使用于增强层的编码。
7.一种通信终端装置，包括如权利要求1所述的编码装置。
8.一种基站装置，包括如权利要求1所述的编码装置。
9.一种对有关至少被分为低频和高频的频谱的编码信息进行解码的解码装置，包括第一解码单元，对有关所述低频的频谱的编码信息进行解码，以生成解码低频频谱；第二解码单元，对有关所述高频的频谱的编码信息进行解码，以生成特定的子带的增益，所述特定的子带至少包括在被分割为多个子带的所述高频的频谱中、与所述低频的频谱相邻的所述高频的频谱的子带；插值单元，对所述特定的子带的增益进行插值，以求所述特定的子带以外的子带的增益；以及第三解码单元，使用由所述第一解码单元获得的低频频谱、以及由所述第二解码单元和所述插值单元获得的增益，对所述高频的频谱进行解码。
10.一种通信终端装置，包括如权利要求9所述的解码装置。
11.一种基站装置，包括如权利要求9所述的解码装置。
12.—种编码方法，包括获得步骤，获得至少被分为低频和高频的频谱；第一编码步骤，将所述低频的频谱编码，以生成第一编码信息；第一解码步骤，对所述第一编码信息进行解码，以生成解码低频频谱；生成步骤，对所生成的所述解码低频频谱进行复制，以生成高频的频谱的形状；增益计算步骤，将所述高频的频谱分割为多个子带，计算各个子带的增益；第二编码步骤，仅将特定的子带的增益编码，所述特定的子带至少包括在所述高频的频谱的子带中、与所述低频的频谱相邻的所述高频的频谱的子带；插值步骤，对所述特定的子带的增益进行插值，以求所述特定的子带以外的子带的增益；以及输出步骤，输出在所述第一编码步骤中获得的编码信息和在所述第二编码步骤中获得的编码信息。
13.一种对有关至少被分为低频和高频的频谱的编码信息进行解码的解码方法，包括第一解码步骤，对有关所述低频的频谱的编码信息进行解码，以生成解码低频频谱；第二解码步骤，对有关所述高频的频谱的编码信息进行解码，以生成特定的子带的增益，所述特定的子带至少包括在被分割为多个子带的所述高频的频谱中、与所述低频的频谱相邻的所述高频的频谱的子带；插值步骤，对所述特定的子带的增益进行插值，以求所述特定的子带以外的子带的增益；以及第三解码步骤，使用在所述第一解码步骤中获得的低频频谱、以及在所述第二解码步骤和所述插值步骤中获得的增益，对所述高频的频谱进行解码。
全文摘要
本发明的编码装置包括获得单元，获得至少被分为低频和高频的频谱；第一编码单元，将低频的频谱编码，以生成第一编码信息；第一解码单元，对第一编码信息进行解码，以生成解码低频频谱；生成单元，对所生成的解码低频频谱进行复制，以生成高频的频谱的形状；增益计算单元，将高频的频谱分割为多个子带，计算各个子带的增益；第二编码单元，仅将特定的子带的增益编码，特定的子带至少包括在高频的频谱的子带中、与低频的频谱相邻的高频的频谱的子带；插值单元，对特定的子带的增益进行插值，以求特定的子带以外的子带的增益；以及输出单元，输出由第一编码单元获得的编码信息和第二编码单元获得的编码信息。
文档编号G10L19/00GK102280109SQ20111022492
公开日2011年12月14日申请日期2005年5月17日优先权日2004年5月19日
发明者押切正浩申请人:松下电器产业株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：押切正浩
技术所有人：松下电器产业株式会社
我是此专利的发明人