编码设备和方法、解码设备和方法、以及程序的制作方法

文档序号：9818459阅读：451来源：国知局

编码设备和方法、解码设备和方法、以及程序的制作方法
【技术领域】
[0001] 本技术涉及一种编码设备和方法、解码设备和方法、以及程序，且具体地涉及一种可以较少的传输代码数量得到高质量音频的编码设备和方法、解码设备和方法、以及程序。
【背景技术】
[0002] 在多声道音频的重放中，期望在重放侧上的扬声器布置和待重放的音频信号的声源位置完全相同。然而事实上，在重放侧上的扬声器布置在大多数情况下与声源位置不是相同的。
[0003] 由于在重放侧上的扬声器布置和声源位置之间的差异，有不存在于扬声器的位置上的声源，且因此如何重放这种声源吸引了极大的关注。
[0004] 为了得到对应于在重放侧上的扬声器布置的音频信号，通常，通过使用混合方程来混合相应声源位置即相应声道的音频信号，并产生对应于重放侧上的扬声器的新声道的音频信号。
[0005]在这种情况下，照惯例，从预先提供的多种模式选择适当的模式作为在预先设置的混合方程中的参数，并计算乘以在混合方程中的相应声道的音频信号的混合系数（即，见非专利文献1)。
[0006]例如，非专利文献1公开了下面的方程（1)被计算为在无线电产业和企业协会 (ARIB)的标准ARIB STD-B32版本2.2[ 1 ]中的22.2声道布置到5.1声道布置的向下混合。

[0016] 在方程（1)中，通过使用混合系数来使在22.2声道布置中的声道例如FL、FR和FC的音频信号相加以计算在向下混合之后的声道L、R、C、LS和LFE的音频信号。在方程（1)中，两个值之一可被选择为参数a，而四个值之一可被选择为参数k。
[0017] 在方程（1)中乘以在向下混合之前的声道得到在向下混合之后的相应声道的音频信号的系数是混合系数。例如，在方程（1)中，乘以FL声道得到L声道的混合系数是参数a的值，而乘以FLc声道得到L声道的混合系数是a/(2 1/2)。注意，在下文中，声道也将被简单地称为 "ch，，。
[0018] 引用列表 [0019]非专利文献
[0020]非专利文献 1:VIDEO CODING,AUDIO CODING AND MULTIPLEXING SPECIFICATIONS FOR DIGITAL BROADCASTING[在线]，2009年6月29日，无线电产业与企业协会，[于2013年9 月 30 日搜索到]，互联网〈http: //www · arib · or · jp/english/html/overview/doc/2-STD-B32v2_2.pdf〉
[0021] 发明概述
[0022] 技术问题
[0023] 然而，在通过使用方程（1)执行向下混合的方法中，预先准备混合方程和在待选择的方程中的参数，且因此可以只使用基于参数和混合方程而计算得到的混合系数。
[0024] 为了向观看者提供高质量音频，混合系数需要根据声源的内容的各种场景自由地改变。
[0025] 然而，为了传输完全自由的混合系数，必须将所有混合系数从输入声源独立地传输到输出扬声器。
[0026] 因此，在输入声源的数量是Μ个声道且输出扬声器的数量是N的情况下，混合系数的数量是ΜΧΝ。在传递混合系数而每个混合系数为Q位的情况下，混合系数的集合的数据量是Μ X Ν X Q位。例如，在输入声源是22ch，输出扬声器是5ch声道，且5位对每个混合系数是必须的情况下，总共550位是必须的。
[0027] 此外，在一些情况下，必须根据扬声器布置的多种模式来多个集合的传输混合系数，因为传输侧不知道在重放侧上的实际扬声器布置。例如，在输出侧上的扬声器布置可以是7ch、5ch或2ch的情况下，必须传输三个集合的混合系数，即用于从22ch到5ch、从22ch到 7ch、以及从22ch到2ch的向下混合的混合系数。在传递上述混合系数本身的情况下，产生巨大数量的信息。因此，如何传递自由混合系数很重要。
[0028] 如上所述，在上述技术中，很难以较少的代码数量传递自由混合系数以得到在重放侧上的高质量音频。
[0029] 本技术鉴于上述情况而被构造，并可以较少的代码数量得到高质量音频。
[0030] 对问题的解决方案
[0031]根据本技术的第一方面的编码设备包括:配置成产生显示基于在多个输入扬声器和多个输出扬声器之间的距离而确定的混合系数的布置顺序的顺序表的顺序表产生单元，混合系数是为多个相应的输出扬声器准备的多个输入扬声器的混合系数并且用在用于将对应于多个输入扬声器的布置的多个声道的音频信号转换成对应于多个输出扬声器的布置的多个声道的音频信号的混合处理中；配置成以在顺序表中所示的顺序重新布置多个混合系数的重新布置单元;配置成计算在以该顺序重新布置的混合系数当中的两个连续混合系数之间的差值的差值计算单元；以及配置成对针对每个混合系数计算的差值编码的编码单元。
[0032]编码单元还可包括:配置成产生显示在混合系数之间的位置关系的对称性的对称表的对称表产生单元；以及配置成基于对称表确定在混合系数和具有与该混合系数对称的位置关系的另一混合系数具有相同值的情况下该混合系数和另一混合系数是对称的对称性确定单元。编码单元可配置成不对被确定为与另一混合系数对称的混合系数的差值编码。
[0033] 对称性确定单元还可确定具有与另一混合系数对称的位置关系的所有混合系数中的每一个是否与具有对称位置关系的对应的另一混合系数是对称的。编码单元可基于所有混合系数是否都与另一混合系数是对称的确定的结果来对差值编码。
[0034] 编码单元可关于差值执行熵编码。
[0035] 在混合系数的输入扬声器和另一混合系数的输入扬声器定位成具有左右对称性且混合系数的输出扬声器和另一混合系数的输出扬声器定位成具有左右对称性的情况下，在该混合系数和另一混合系数之间的位置关系可以是对称的。
[0036] 差值计算单元可计算在该混合系数和具有不是-~的值并且具有与该混合系数的顺序最接近的顺序的混合系数之间的差值。
[0037] 顺序表产生单元可通过以下操作来产生顺序表:将混合系数分类成多个类别，使得在输入扬声器的数量大于输出扬声器的数量的情况下相同输出扬声器的混合系数属于相同的类别，同时将混合系数分类成多个类别，使得在输出扬声器的数量大于输入扬声器的数量的情况下相同输入扬声器的混合系数属于相同的类别，并且确定在每个类别中的混合系数的布置顺序。差值计算单元可计算在属于同一类别的混合系数之间的差值。
[0038] 根据本技术的第一方面的编码方法或程序包括以下步骤:产生显示基于在多个输入扬声器和多个输出扬声器之间的距离而确定的混合系数的布置顺序的顺序表，混合系数是为多个相应的输出扬声器准备的多个输入扬声器的混合系数并且用在用于将对应于多个输入扬声器的布置的多个声道的音频信号转换成对应于多个输出扬声器的布置的多个声道的音频信号的混合处理中；以在顺序表中所示的顺序重新布置多个混合系数;计算在以该顺序重新布置的混合系数当中的两个连续混合系数之间的差值；以及对针对每个混合系数计算的差值编码。
[0039]根据本技术的第一方面，产生显不基于在多个输入扬声器和多个输出扬声器之间的距离而确定的混合系数的布置顺序的顺序表，混合系数是为多个相应的输出扬声器准备的多个输入扬声器的混合系数并且用在用于将对应于多个输入扬声器的布置的多个声道的音频信号转换成对应于多个输出扬声器的布置的多个声道的音频信号的混合处理中；以在顺序表中所示的顺序重新布置多个混合系数;计算在以该顺序重新布置的混合系数当中的两个连续混合系数之间的差值;以及对针对每个混合系数计算的差值编码。
[0040] 根据本技术的第二方面的解码单元可包括:配置成产生显示基于在多个输入扬声器和多个输出扬声器之间的距离而确定的混合系数的布置顺序的顺序表的顺序表产生单元，混合系数是为多个相应的输出扬声器准备的多个输入扬声器的混合系数并且用在用于将对应于多个输入扬声器的布置的多个声道的音频信号转换成对应于多个输出扬声器的布置的多个声道的音频信号的混合处理中；配置成获取通过计算在以顺序表中所示的顺序布置的两个连续混合系数之间的差值并对针对每个混合系数计算的差值编码而得到的代码串并对代码串解码的解码单元;配置成基于顺序表将通过该解码得到的差值加到用于计算差值的混合系数之一以计算用于计算差值的混合系数中的另一个的相加单元；以及配置成基于顺序表重新布置混合系数并输出混合系数的重新布置单元。
[0041] 在该混合系数和具有与该混合系数对称的位置关系的另一混合系数具有相同值的情况下，该混合系数和另一混合系数可以是对称的，并且不对混合系数的差值编码。解码设备还可包括配置成产生显示在混合系数之间的位置关系的对称表的对称表产生单元。在该混合系数和另一混合系数是对称的情况下，相加单元可基于对称表复制另一混合系数并可将另一混合系数设置为该混合系数。
[0042] 可基于具有与另一混合系数对称的位置关系的所有混合系数中的每一个是否与具有对称位置关系的对应的另一混合系数是对称的确定的结果来对差值编码。解码单元可基于指示所有混合系数是否都与另一混合系数是对称的确定的结果的信息来对差值编码，该信息包含在代码串中。
[0043] 在混合系数的输入扬声器和另一混合系数的输入扬声器定位成具有左右对称性且混合系数的输出扬声器和另一混合系数的输出扬声器定位成具有左右对称性的情况下，在该混合系数和另一混合系数之间的位置关系可以是对称的。
[0044] 根据本技术的第二方面的解码方法或程序可包括以下步骤:产生显示基于在多个输入扬声器和多个输出扬声器之间的距离而确定的混合系数的布置顺序的顺序表，混合系数是为多个相应的输出扬声器准备的多个输入扬声器的混合系数并且用在用于将对应于多个输入扬声器的布置的多个声道的音频信号转换成对应于多个输出扬声器的布置的多个声道的音频信号的混合处理中；获取通过计算在以顺序表中所示的顺序布置的两个连续混合系数之间的差值并对针对每个混合系数计算的差值编码而得到的代码串并对代码串解码;基于顺序表将通过该解码得到的差值加到用于计算差值的混合系数之一以计算用于计算差值的混合系数中的另一个;以及基于顺序表重新布置混合系数并输出混合系数。 [0045]根据第二方面，产生显示基于在多个输入扬声器和多个输出扬声器之间的距离而确定的混合系数的布置顺序的顺序表，混合系数是为多个相应的输出扬声器准备的多个输入扬声器的混合系数并且用在用于将对应于多个输入扬声器的布置的多个声道的音频信号转换成对应于多个输出扬声器的布置的多个声道的音频信号的混合处理中；获取通过计算在以顺序表中所示的顺序布置的两个连续混合系数之间的差值并对针对每个混合系数计算的差值编码而得到的代码串并对代码串解码;基于顺序表将通过该解码得到的差值加到用于计算差值的混合系数之一以计算用于计算差值的混合系数中的另一个；以及基于顺序表重新布置混合系数并输出混合系数。
[0046]发明的有益效果
[0047] 根据本技术的第一方面和第二方面，可以较少的代码数量得到高质量音频。
[0048] 注意，有利效果并不限于本文所述的有利效果，且可以是在本公开中所述的任何有利效果。
[0049] 附图的简要说明
[0050] 图1示出了扬声器布置的示例。
[0051] 图2示出了扬声器布置的示例。
[0052]图3示出了混合系数的示例。
[0053]图4是用于解释在声源位置和扬声器位置之间的距离的图。
[0054]图5示出了传递顺序表的示例。
[0055] 图6示出了对称表的示例。
[0056] 图7是用于解释差值的计算的示例。
[0057] 图8示出了绳字的示例。
[0058]图9示出了报头的语法。
[0059] 图10示出了系数代码串的语法。
[0060] 图11示出了编码设备的配置示例。
[0061] 图12示出了系数编码单元的配置示例。
[0062] 图13是示出了编码过程的流程图。
[0063] 图14是示出了系数编码过程的流程图。
[0064] 图15是示出了系数编码过程的流程图。
[0065]图16示出了解码设备的配置示例。
[0066]图17示出了系数解码单元的配置示例。
[0067] 图18是示出了解码过程的流程图。
[0068]图19是示出了系数解码过程的流程图。
[0069]图20是示出了系数解码过程的流程图。
[0070]图21是计算机的配置示例。
[0071]实施例的描述
[0072]在下文中，将参考附图描述应用本技术的实施例。
[0073]〈实施例1>
[0074]〈本技术的概述〉
[0075]将描述本技术的概述。
[0076]本技术涉及能够以少量位传输任意混合系数的编码和解码技术。
[0077]注意，在下文中，音频信号的声源位置和扬声器的布置位置由水平角θ(-180° < +18〇°)和垂直角 γ (_9〇° < γ < +9〇°)表示。
[0078] 例如，扬声器布置成在重放侧上围绕用户，且直接在用户前方的位置是在水平角Θ =0和垂直角γ =0处的位置。水平角θ指示从用户角度看的横向角，而垂直角γ指示从用户角度看的纵向角。具体地，例如从用户角度看的左方向是水平角θ的正方向，且从用户角度看的向上方向是垂直角γ的正方向。
[0079] 在下文中，将通过使用示例视情况提供描述，在该示例中，在通过使用22ch扬声器布置的5ch扬声器布置中和通过从由22.2多声道声音系统[2]所定义的22.2ch移除LFE并从由国际标准ITU-R BS.775-1[3]所定义的5.1ch移除LFE而得到的5ch扬声器布置中重放被假设在22ch扬声器布置中重放的声源。注意，在[2]Kimio Hamasaki的"Tendency of standardization of 22.2multichannel sound system"（NHK Science&Technology Research Laboratories,R&D,No.126,2011.3.< http://www.nhk.or.jp/strl/publica/ 1(1八(1126/^^/1304-13 4(^>)中详细公开了22.2多声道声音系统[2]。在[3]11'1]-1?85.775-1"Multichannel Stereophonic Sound System with and without accompanying Picture"（Rec·, International Telecommunications Union,Geneva,Switzerland(1992-1994))中详细公开了国际标准ITU-R BS. 775-1 [3]。
[0080] 在本文中，作为基于22.2多声道声音系统[2]和国际标准ITU-R BS.775-1[3]的扬声器布设置置(声源位置)的示例，22ch的相应声道的扬声器布设置置(声源位置)是图1所示的位置，且5ch的相应声道的扬声器布设置置是图2所示的位置。
[0081] 注意，在图1和图2中，源(m)指示识别相应声道的编号，且标签指示相应声道的名称。此外，在图1和图2中，方位角指示相应声道的扬声器位置(声源位置)的水平角Θ，且高度指示相应声道的扬声器位置(声源位置)的垂直角γ。
[0082] 图 1 示出了声道FC、FLc、FRc、FL、FR、SiL、SiR、BL、BR、BC、TpFC、TpFL、TpFR、TpSiL、 TpSiR、TpBL、TpBR、TpBC、TpC、BtFC、BtFL和BtFR的扬声器布设置置。图2示出了声道L、R、C、 LS和RS的扬声器布设置置。
[0083] 例如，由图1中的源(m) = 1规定的FC声道的扬声器的布设置置是在水平角Θ = 〇和垂直角γ =0处的位置。这意味着直接布置在用户前方的扬声器是重放FC声道的音频信号的扬声器。
[0084] 在下文中，将特别描述通过使用本技术对混合系数的编码。
[0085] 主要在混合系数的编码过程中执行下面的过程STP1到过程STP6。注意，过程STP1 和过程STP2作为所谓的预备工作被执行。
[0086](过程STP1):基于在声源和重放侧上的扬声器之间的距离来产生传递顺序表。 [0087](过程STP2):产生显示在声源和重放侧上的扬声器对之间的对称性的对称表。 [0088](过程STP3):基于传递顺序表改变混合系数的传递顺序，并接着计算在混合系数之间的差值。
[0089](过程STP4):确定在混合系数之间的对称性。
[0090](过程STP5):执行基于在混合系数之间的对称性的编码。
[0091 ](过程STP6):对在混合系数之间的差值编码。
[0092]在本文中，将描述混合系数。
[0093] 例如，假设执行用于将对应于Μ个扬声器的布置的Μ个声道的音频信号，即，重放Μ 个声源位置的Μ个声道的音频信号，转换成由Ν个扬声器重放的Ν个声道的音频信号的混合处理。在这种情况下，为Ν个扬声器中的每一个预先准备相应的Μ个扬声器(声源位置）的混合系数。
[0094] 在本文中，关于预先准备的ΜΧΝ个混合系数，用于得到第η个扬声器的音频信号的第m个声源位置的混合系数被定义为MixGain(m，n)。假设混合系数MixGain(m，n)是在例如量化分辨率是ldB且混合系数落在3dB到-27dB和-%dB的范围内的情况下通过分辨率集合预先量化的离散值，每个混合系数可以用Q

完整全部详细技术资料下载

当前第1页1 2 3 4 5 6

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：史润宇;知念徹;本间弘幸;畠中光行;
技术所有人：索尼公司;
我是此专利的发明人

上一篇：用于改善高频带时间特性跟踪的增益形状估计的制作方法
上一篇：引擎谐波消除系统余辉减轻的制作方法