音频解码装置、音频解码方法、音频编码装置、音频编码方法

文档序号：8513344阅读：481来源：国知局

音频解码装置、音频解码方法、音频编码装置、音频编码方法
【专利说明】音频解码装置、音频解码方法、音频编码装置、音频编码方法
[0001]本申请是申请号为201180038817.2 (国际申请号为PCT/JP2011/068388)、发明名称为“音频解码装置、音频解码方法、音频解码程序、音频编码装置、音频编码方法以及音频编码程序”、申请日为2011年08月11日的发明专利申请的分案申请。
技术领域
[0002]本发明的各侧面涉及音频解码装置、音频解码方法、音频解码程序、音频编码装置、音频编码方法以及音频编码程序。
【背景技术】
[0003]为了高效地对声音信号和音乐信号双方进行编码，有效的是切换适合声音信号的编码处理和适合音乐信号的编码处理来利用的复合型音频编码方式。
[0004]在下述专利文献I中记载有如上所述的复合型音频编码方式。在记载于专利文献I的音频编码方式中，对每个帧附加表示在该帧中的码序列生成中使用的编码处理的信息。
[0005]另外，在MPEG USAC(Unified Speech and Aud1 Coding，联合语音和音频编码)中的音频编码中，使用三个编码处理、即FD(Modified AAC(Advanced Aud1 Coding，高级音频编码)，变更后AAC)、TCX(transform coded excitat1n,变换码激励)、ACELP (Algebraic Code Excited Linear Predict1n，代数码激励线性预测)。在 MPEGUSAC中，将TCX和ACELP总括成一组来定义为LPD。在MPEG USAC中，为了表示是使用了 FD还是使用了 LPD而在各帧上附加I比特的信息。另外，在MPEG USAC中，在使用LPD时，为了规定组合利用TCX与ACELP的过程而在各帧上附加4比特的信息。
[0006]另外，在第3代便携电话系统(3GPP)的AMR-WB+(ExtendedAdaptive Mult1-RateWideband，扩展自适应多速率宽带)中，使用两个编码处理、即TCX和ACELP。在AMR-WB+中，为了规定TCX或ACELP的使用而在各帧上附加2比特的信息。
[0007]现有技术文献
[0008]专利文献
[0009]专利文献1:日本特开2000-267699号公报

【发明内容】

[0010]发明所要解决的问题
[0011]关于音频信号，存在以基于人的发声的信号即声音信号为中心的信号，也存在以音乐信号为中心的信号。当对这种音频信号进行编码时，能够对多个帧利用共同的编码处理。对于这样的音频信号，要求能够更高效地从编码侧向解码侧传输信息的方法。
[0012]本发明的各侧面的目的在于，提供能够生成尺寸小的流的音频编码装置、音频编码方法以及音频编码程序，以及能够使用尺寸小的流的音频解码装置、音频解码方法以及音频解码程序。
[0013]用于解决问题的手段
[0014]本发明的一侧面涉及音频编码，能够包含以下的音频编码装置、音频编码方法以及音频编码程序。
[0015]本发明的一侧面的音频编码装置具有多个编码部、选择部、生成部、以及输出部。多个编码部执行彼此不同的音频编码处理而由音频信号生成码序列。选择部选择多个编码部中的、在多个帧的音频信号的编码中共同使用的编码部，或者，选择在分别包含多个帧的多个超级帧的音频信号的编码中共同使用的一组编码部。生成部生成长时期编码处理信息。长时期编码处理信息对于多个帧是单一的信息，是表示在该多个帧的码序列的生成中使用了共同的音频编码处理的信息。或者，长时期编码处理信息对于多个超级帧是单一的信息，是表示在该多个超级帧的码序列的生成中使用了共同的一组音频编码处理的信息。输出部输出包含由通过选择部而选择的编码部来生成的上述多个帧的码序列、或者由通过选择部而选择的一组编码部来生成的上述多个超级帧的码序列、以及长时期编码处理信息的流。
[0016]本发明的一侧面的音频编码方法，包括:(a)选择彼此不同的多个音频编码处理中的、在多个帧的音频信号的编码中共同使用的音频编码处理，或者，选择该多个音频编码处理中的、在分别包含多个帧的多个超级帧的音频信号的编码中共同使用的一组音频编码处理的步骤；(b)使用所选择的音频编码处理对上述多个帧的音频信号进行编码而生成该多个帧的码序列，或者，使用所选择的一组音频编码处理对上述多个超级帧的音频信号进行编码而生成该多个超级帧的码序列的步骤；(C)生成长时期编码处理信息的步骤，该长时期编码处理信息对于所述多个帧是单一的长时期编码处理信息、且表示在该多个帧的码序列的生成中使用了共同的音频编码处理或者，该长时期编码处理信息对于所述多个超级帧是单一的长时期编码处理信息、且表示在该多个超级帧的码序列的生成中使用了共同的一组音频编码处理；(d)输出包含上述多个帧的码序列、或者上述多个超级帧的码序列、以及上述长时期编码处理信息的流的步骤。
[0017]本发明的一侧面的音频编码程序使计算机作为多个编码部、选择部、生成部以及输出部来发挥功能。
[0018]根据本发明的一侧面的音频编码装置、音频编码方法以及音频编码程序，通过长时期编码处理信息，在编码侧，能够通知在多个帧的码序列的生成中使用了共同的音频编码处理，或者，在多个超级帧的码序列的生成中使用了共同的一组音频编码处理的情况。通过该长时期编码处理信息的通知，在解码侧，能够选择共同的音频解码处理，或者，选择共同的一组音频解码处理。因此，能够减少用于确定在流内包含的音频编码处理的信息的量。
[0019]在一实施方式中，在流中，也可以至少在多个帧中的开头的帧之后的帧中不包含用于确定在该之后的帧的码序列的生成中使用的音频编码处理的信息。
[0020]在一实施方式中，也可以对上述多个帧，选择多个编码部(或者多个音频编码处理)中的预定的编码部(或者预定的音频编码处理)，也可以在流中不包含用于确定在上述多个帧的码序列的生成中使用的音频编码处理的信息。根据该方式，能够进一步减少流的信息量。另外，在一实施方式中，长时期编码处理信息也可以是I比特的信息。根据该方式，能够进一步减少流的信息量。
[0021]本发明的另一侧面是涉及音频解码，能够包含音频解码装置、音频解码方法以及音频解码程序。
[0022]本发明的另一侧面的音频解码装置具有多个解码部、提取部以及选择部。多个解码部执行彼此不同的音频解码处理而由码序列生成音频信号。提取部从流提取长时期编码处理信息。流具有分别包含音频信号的码序列的多个帧及/或分别包含多个帧的多个超级帧。长时期编码处理信息对于多个帧是单一的长时期编码处理信息、且表示在该多个帧的码序列的生成中使用了共同的音频编码处理。或者，长时期编码处理信息对于多个超级帧是单一的长时期编码处理信息、且表示在该多个超级帧的码序列的生成中使用了共同的一组音频编码处理。选择部根据提取出长时期编码处理信息的情况，选择多个解码部中的、在多个帧的码序列的解码中共同使用的解码部。或者，选择部选择多个解码部中的、在多个超级帧的码序列的解码中共同使用的一组解码部。
[0023]本发明的另一侧面的音频解码方法，包括:(a)从具有分别包含音频信号的码序列的多个帧及/或分别包含多个帧的多个超级帧的流，提取长时期编码处理信息的步骤，该长时期编码处理信息对于该多个帧是单一的长时期编码处理信息、且表示在该多个帧的码序列的生成中使用了共同的音频编码处理，或者，该长时期编码处理信息对于该多个超级帧是单一的长时期编码处理信息、且表示在该多个超级帧的码序列的生成中使用了共同的一组音频编码处理；(b)根据提取出长时期编码处理信息的情况，选择彼此不同的多个音频解码处理中的、在上述多个帧的码序列的解码中共同使用的音频解码处理，或者，选择该多个音频解码处理中的、在上述多个超级帧的码序列的解码中共同使用的一组音频解码处理的步骤；(C)使用所选择的音频解码处理来对上述多个帧的码序列进行解码，或者，使用所选择的上述一组音频解码处理来对上述多个超级帧的码序列进行解码的步骤。
[0024]本发明的另一侧面的音频解码程序，使计算机作为多个解码部、提取部以及选择部来发挥功能。
[0025]根据本发明的另一侧面的音频解码装置、音频解码方法以及音频解码程序，能够由根据与上述的编码有关的本发明的一侧面所生成的流来生成音频信号。
[0026]在一实施方式中，在流中，也可以至少在多个帧中的开头的帧之后的帧中不包含用于确定在该之后的帧的码序列的生成中使用的音频编码处理的信息。
[0027]在一实施方式中，对于上述多个帧，可以选择多个解码部(或者多个音频解码处理)中的预定的解码部(或者预定的音频解码处理)，也可以在流中不包含用于确定在上述多个帧的码序列的生成中使用的音频编码处理的信息。根据该方式，能够进一步减少流中的信息的量。另外，在一实施方式中，长时期编码处理信息也可以是I比特的信息。根据该方式，能够进一步减少流中的信息的量。
[0028]发明效果
[0029]如以上说明，根据本发明的各侧面，提供能够生成尺寸小的流的音频编码装置、音频编码方法以及音频编码程序，以及能够使用尺寸小的流的音频解码装置、音频解码方法以及音频解码程序。
【附图说明】
[0030]图1是示出一实施方式的音频编码装置的图。
[0031]图2是示出通过一实施方式的音频编码装置而生成的流的图。
[0032]图3是示出一实施方式的音频编码方法的流程图。
[0033]图4是示出一实施方式的音频编码程序的图。
[0034]图5是示出一实施方式的计算机的硬件结构的图。
[0035]图6是示出一实施方式的计算机的立体图。
[0036]图7是示出变形方式的音频编码装置的图。
[0037]图8是示出一实施方式的音频解码装置的图。
[0038]图9是示出一实施方式的音频解码方法的流程图。
[0039]图10是示出一实施方式的音频解码程序的图。
[0040]图11是示出另一实施方式的音频编码装置的图。
[0041]图12是示出通过以往的MPEG USAC来生成的流和通过图11所示的音频编码装置来生成的流的图。
[0042]图13是另一实施方式的音频编码方法的流程图。
[0043]图14是示出另一实施方式的音频编码程序的图。
[0044]图15是示出另一实施方式的音频解码装置的图。
[0045]图16是另一实施方式的音频解码方法的流程图。
[0046]图17是示出mod[k]与a(mod[k])的关系的图。
[0047]图18是示出另一实施方式的音频解码程序的图。
[0048]图19是示出又一实施方式的音频编码装置的图。
[0049]图20是示出通过以往的AMR WB+来生成的流和通过图19所示的音频编码装置来生成的流的图。
[0050]图21是又一实施方式的音频编码方法的流程图。
[0051]图22是示出又一实施方式的音频编码程序的图。
[0052]图23是示出又一实施方式的音频解码装置的图。
[0053]图24是又一实施方式的音频解码方法的流程图。
[0054]图25是示出又一实施方式的音频解码程序的图。
[0055]图26是示出又一实施方式的音频编码装置的图。
[0056]图27是示出通过图26所示的音频编码装置来生成的流的图。
[0057]图28是又一实施方式的音频编码方法的流程图。
[0058]图29是示出又一实施方式的音频编码程序的图。
[0059]图30是示出又一实施方式的音频解码装置的图。
[0060]图31是又一实施方式的音频解码方法的流程图。
[0061]图32是示出又一实施方式的音频解码程序的图。
[0062]图33是示出又一实施方式的音频编码装置的图。
[0063]图34是示出通过以往的MPEG USAC来生成的流和通过图33所示的音频编码装置来生成的流的图。
[0064]图35是又一实施方式的音频编码方法的流程图。
[0065]图36是示出又一实施方式的音频编码程序的图。
[0066]图37是示出又一实施方式的音频解码装置的图。
[0067]图38是又一实施方式的音频解码方法的流程图。
[0068]图39是示出又一实施方式的音频解码程序的图。
[0069]图40是示出又一实施方式的音频编码装置的图。
[0070]图41是示出通过图40所示的音频编码装置来生成的流的图。
[0071]图42是又一实施方式的音频编码方法的流程图。
[0072]图43是示出又一实施方式的音频编码程序的图。
[0073]图44是示出又一实施方式的音频解码装置的图。
[0074]图45是又一实施方式的音频解码方法的流程图。
[0075]图46是示出又一实施方式的音频解码程序的图。
[0076]图47是示出又一实施方式的音频编码装置的图。
[0077]图48是示出通过以往的AMR WB+来生成的流和通过图47所示的音频编码装置来生成的流的图。
[0078]图49是又一实施方式的音频编码方法的流程图。
[0079]图50是示出又一实施方式的音频编码程序的图。
[0080]图51是示出又一实施方式的音频解码装置的图。
[0081]图52是又一实施方式的音频解码方法的流程图。
[0082]图53是示出又一实施方式的音频解码程序的图。
【具体实施方式】
[0083]以下，参照附图对各实施方式进行详细说明。另外，在各附图中对相同或相当的部分附上相同的标号。
[0084]图1是示出一实施方式的音频编码装置的图。图1所示的音频编码装置10能够使用共同的音频编码处理对输入到输入端子Inl的多个帧的音频信号进行编码。如图1所示，音频编码装置10具有多个编码部10&1?1an、选择部10b、生成部1c以及输出部10d。此处，η为2以上的整数。
[0085]编码部10ai? 1ajA行彼此不同的音频编码处理而由音频信号生成码序列。对于这些音频编码处理能够采用任意的音频编码处理。例如，作为音频编码处理，能够使用称为变更后AAC(Modified AAC)编码处理、ACELP编码处理以及TCX编码处理的处理。
[0086]选择部1b根据输入到输入端子In2的输入信息，选择编码部10&1?1an中的一个编码部。输入信息是例如由用户输入的信息。在一实施方式中，该输入信息可以是确定在多个帧的音频信号中共同使用的音频编码处理的信息。选择部1b对开关SW进行控制，从而能够将编码部10ai?1a ?中的执行由输入信息确定的音频编码处理的编码部与输入端子Inl结合起来。
[0087]生成部1c根据输入信息生成长时期编码处理信息。长时期编码处理信息是表示在多个帧的码序列的生成中使用共同的音频编码处理的信息。另外，长时期编码处理信息也可以是能够在解码侧识别的唯一字。另外，在一实施方式中，也可以是能够在解码侧确定在多个帧的码序列的生成中共同使用的音频编码处理的信息。
[0088]输出部1d输出包含通过所选择的编码部而生成的多个帧的码序列、以及通过生成部1c而生成的长时期编码处理信息的流。
[0089]图2是示出通过一实施方式的音频编码装置而生成的流的图。图2所示的流包含第I?第m多个帧。此处，m为2以上的整数。以下，有时将流中的帧称为输出帧。在各输出帧中包含根据输入音频信号中与该输出帧对应的帧的音频信号生成的码序列。另外，在流的第I帧中，作为参数信息，能够附加长时期编码处理信息。
[0090]以下，对音频编码装置10的动作、和一实施方式的音频编码方法进行说明。图3是示出一实施方式的音频编码方法的流程图。如图3所示，在一实施方式中，在步骤S10-1中，选择部1b根据输入信息来选择编码部10&1?1an中的一个编码部。
[0091]接着，在步骤S10-2中，生成部1c根据输入信息生成长时期编码处理信息。在接下来的步骤S10-3中，输出部1d在第I帧上附加长时期编码处理信息作为参数信息。
[0092]接着，在步骤S10-4中，由选择部1b选择的编码部对当前的编码对象的帧的音频信号进行编码，生成码序列。在接下来的步骤S10-5中，输出部1d使与编码对象的帧对应的流内的输出帧中包含通过编码部而生成的码序列，输出该输出帧。
[0093]在接下来的步骤S10-5中，进行是否存在还没有进行编码的帧的判定。在不存在没有进行过编码的帧时，结束处理。另一方面，在还存在应编码的帧时，以没有进行编码过的帧为对象继续进行从步骤S10-4开始的一系列的处理。
[0094]根据以上说明的音频编码装置10和一实施方式的音频编码方法，仅在流的第I帧中包含长时期编码处理信息。即，从流中的第2帧起的之后的帧中，不包含用于确定所使用的音频编码处理的信息。因此，能够生成尺寸小的高效的流。
[0095]以下，对使计算机作为音频编码装置10来动作的程序进行说明。图4是示出一实施方式的音频编码程序的图。图5是示出一实施方式的计算机的硬件结构的图。图6是示出一实施方式的计算机的立体图。图4所示的音频编码程序PlO能够使图5所示的计算机ClO作为音频编码装置10来动作。另外，在本说明书中说明的程序不限于如图5所示的计算机，能够使称为便携电话、便携信息终端的任意的装置根据该程序来动作。
[0096]音频编码程序PlO能够存储在记录介质SM中来提供。另外，作为记录介质SM,例示了软盘、CD-ROM、DVD或ROM等记录介质，或者半导体存储器等。
[0097]如图5所示，计算机ClO具有:软盘驱动装置、⑶-ROM驱动装置、DVD驱动装置等读取装置C12 ;使操作系统常驻的作业用存储器(RAM)CH ;对存储在记录介质SM中的程序进行存储的存储器C16 ;称为显示器的显示装置C18 ;作为输入装置的鼠标C20和键盘C22 ;用于进行数据等的收发的通信装置C24 ;以及控制程序的执行的CPU C26。
[0098]当将记录介质SM插入到读取装置C

完整全部详细技术资料下载

当前第1页1 2 3 4 5 6

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：菊入圭;文仲丞;
技术所有人：株式会社NTT都科摩;
我是此专利的发明人

上一篇：音频信号处理方法、装置及电子设备的制造方法
上一篇：一种音频信息获取的方法及其装置的制造方法