信息处理装置和方法、再现装置和方法、以及程序与流程

文档序号:27328136发布日期:2021-11-10 01:28阅读:63来源:国知局
1.本技术涉及信息处理装置和方法、再现装置和方法以及程序,特别涉及能够更容易地执行增益校正的信息处理装置和方法、再现装置和方法以及程序。
背景技术
::2.传统上,运动图像专家组(mpeg)‑h3d音频标准是已知的(例如,参见非专利文献1和非专利文献2)。3.通过mpeg‑h3d音频标准等处理的3d音频,可以再现三维声音方向、距离、扩展等,并且可以执行与传统立体声再现相比具有更真实感的音频再现。4.现有技术文献5.非专利文献6.非专利文献1:iso/iec23008‑3,mpeg‑h3daudio7.非专利文献2:iso/iec23008‑3:2015/amendment3,mpeg‑h3daudiophase2技术实现要素:8.技术问题9.然而,使用3d音频,内容(3d音频内容)的生产时间成本增加。10.例如,在3d音频中,对象的位置信息(即声源的位置信息)的维数要高于立体声(3d音频是三维的,而立体声是二维的)。因此,使用3d音频,特别地,在决定构成每个对象的元数据的参数(诸如指示对象的位置的水平角和垂直角、距离、以及对象的增益)的工作中,时间成本增加。11.此外,与立体声内容相比,3d音频内容在内容和创建者方面的数量都少得多。因此,目前高质量的3d音频内容的数量较少。12.另一方面,作为听觉特性,对声音响度的感知取决于声音的到达方向。即,即使是同一对象的声音,声音在听觉感知中的响度在对象位于收听者前面的情况和对象位于收听者侧面的情况下、以及在对象位于收听者上方的情况和对象位于收听者下方的情况下发生变化。因此,需要根据这种听觉特性进行增益校正。13.由此,期望更容易地执行增益校正,并且因此,能够在短时间内生成足够质量的3d音频内容。14.本技术是考虑到这种情况而提出,并且能够更容易地执行增益校正。15.问题的解决方案16.本技术的第一方面的信息处理装置包括:增益校正值决定单元,该增益校正值决定单元根据从收听者观看音频对象的方向,决定用于对音频对象的音频信号执行增益校正的增益值的校正值。17.本技术的第一方面的信息处理方法或程序包括:根据从收听者观看音频对象的方向,决定用于对音频对象的音频信号执行增益校正的增益值的校正值的步骤。18.在本技术的第一方面,根据从收听者观看音频对象的方向来决定用于对音频对象的音频信号执行增益校正的增益值的校正值。19.本技术的第二方面的再现装置包括:增益校正单元,该增益校正单元基于指示音频对象的位置的位置信息,决定用于对音频对象的音频信号执行增益校正的增益值的校正值,该校正值取决于从收听者观看音频对象的方向,并且基于由校正值校正的增益值对音频信号执行增益校正;以及渲染器处理单元,该渲染器处理单元基于通过增益校正获得的音频信号执行渲染处理,并且生成用于再现音频对象的声音的多个声道的再现信号。20.本技术的第二方面的再现方法或程序包括:基于指示音频对象的位置的位置信息,决定用于对音频对象的音频信号执行增益校正的增益值的校正值的步骤,该校正值取决于从收听者观看音频对象的方向;基于由校正值校正的增益值对音频信号执行增益校正的步骤;基于通过增益校正获得的音频信号执行渲染处理的步骤;以及生成用于再现音频对象的声音的多个声道的再现信号的步骤。21.在目前技术的第二个方面,基于指示音频对象的位置的位置信息,决定用于对音频对象的音频信号执行增益校正的增益值的校正值,该校正值取决于从收听者观看音频对象的方向;基于由校正值校正后的增益值对音频信号执行增益校正;基于通过增益校正获得的音频信号执行渲染处理,并且生成用于再现音频对象的声音的多个声道的再现信号。附图说明22.图1是说明关于声音的到达方向的听觉特性的视图。23.图2是说明关于声音的到达方向的听觉特性的视图。24.图3是说明关于声音的到达方向的听觉特性的视图。25.图4是示出信息处理装置的配置示例的视图。26.图5是示出听觉特性表的示例的视图。27.图6是示出听觉特性表的示例的视图。28.图7是说明增益值决定处理的流程图。29.图8是示出内容创建工具的显示画面示例的视图。30.图9是示出内容创建工具的显示画面示例的视图。31.图10是示出内容创建工具的显示画面示例的视图。32.图11是示出内容创建工具的显示画面示例的视图。33.图12是示出信息处理装置的配置示例的视图。34.图13是说明表生成处理的流程图。35.图14是示出语音处理装置的配置示例的视图。36.图15是说明再现信号生成处理的流程图。37.图16是示出听觉特性表的示例的视图。38.图17是示出增益听觉特性信息的语法示例的视图。39.图18是示出语音处理装置的配置示例的视图。40.图19是示出计算机的配置示例的视图。具体实施方式41.下面将参考附图来说明应用本技术的实施例。42.<第一实施例>43.<关于本技术>44.本技术通过根据从收听者观看的对象的方向确定增益校正值,使得能够更容易地执行增益校正,并且因此使得能够更容易地,即在短时间内创建足够高质量的3d音频内容。45.特别地,本技术具有以下特征(f1)到(f5)。46.特征(f1):根据关于声像的定位位置的三维听觉特性来决定对象的增益校正值。47.特征(f2):在通过表格等给出听觉特性的情况下,基于相邻位置的增益校正值,通过插值处理等计算关于无数据的定位位置的增益校正值。48.特征(f3):在自动混合中,增益信息从单独决定的位置信息决定。49.特征(f4):提供了设置和调整关于对象位置的增益校正值的用户界面。50.特征(f5):与相对于收听位置的对象位置的变化相关联地应用与三维听觉特性对应的增益校正值。51.首先,将解释基于人的三维听觉特性的增益参数的决定。52.图1示出了当执行粉红噪声的增益校正时的增益校正量,使得当从不同方向再现相同的粉红噪声时,收听者感觉到在听觉上的声音的响度是相同的,参考的是当某一粉红噪声正好在收听者前面再现时在听觉上的声音的响度。换句话说,图1示出了关于人所具有的水平方向的听觉特性。53.注意,在图1中,纵轴表示增益校正量,并且横轴表示方位角值(水平角),该方位角是在水平方向上的角度,指示从收听者观察的声源位置。54.例如,指示从收听者观看的前面方向的方位角值为0度,指示从收听者观看的旁边,即侧面方向的方位角值为±90度,以及指示向后,即后面方向的方位角值为180度。特别地,从收听者观看的左方向是方位角值的正方向。55.此外,在图1中,在再现粉红噪声时在垂直方向上的位置与收听者的高度相同。即,将从收听者观看的表示声源在垂直方向(仰角方向)上的位置的垂直角设为仰角值,图1是仰角值为0度的情况的示例。注意,从收听者观看的向上方向是仰角值的正方向。56.本示例示出了从对多个收听者进行的实验结果获得的关于每个方位角值的增益校正量的平均值,并且特别地,每个方位角值中由虚线表示的范围指示95%的置信区间。57.例如,在横向(方位角值=±90度,仰角值=0度)再现粉红噪声时,已知通过稍微降低增益,收听者感觉他听到的声音与在前面方向再现粉红噪声时的声音响度相同。58.此外,例如,当在后面再现粉红噪声时(方位角值=180度,仰角值=0度),已知通过稍微提高增益,收听者感觉他听到的声音与在前面方向再现粉红噪声时的声音响度相同。59.即,对于某一对象声源,当对象声源的定位位置位于收听者的侧面时,通过略微降低对象声源的声音增益,并且当对象声源的定位位置位于收听者的后面时,通过略微提高对象声源的声音增益,能够使收听者感觉他听到了具有相同响度的声音。60.此外,例如,如图2和图3所示,即使方位角值相同,如果仰角值改变,则收听者听到的也改变。61.注意,在图2和图3中,纵轴表示增益校正量,并且横轴表示指示从收听者观看的声源位置的方位角值(水平角)。此外,在图2和图3中,每个方位角值中由虚线表示的范围指示95%的置信区间。62.图2示出了在仰角值为30度的情况下在每个方位角值处的增益校正量。63.图2示出,在声源位于高于收听者的位置的情况下,当声源位于收听者的前面、后面或对角线后面时,声音是无声的,而当声源位于收听者的对角线正面时,声音是略微响亮的。64.类似地,图3示出了在仰角值为‑30度的情况下在每个方位角值处的增益校正量。65.图3表示,在声源存在于低于收听者的位置的情况下,当声源存在于收听者的前面或对角线前面时,声音被响亮的听到,而当声源存在于收听者的后面或对角线后面时,声音是无声的。66.已知,如果如上所述,根据表示对象声源的位置的位置信息和来自相对于声音到来方向的听觉特性的收听者的听觉特性来决定相对于对象声源的增益校正量,则可以更容易地执行适当的增益校正。67.<信息处理装置配置示例>68.图4是示出应用了本技术的信息处理装置的实施例的配置示例的视图。69.图4所示的信息处理装置11起到增益决定装置的作用,该增益决定装置决定用于再现构成3d音频内容的音频对象(在下文中,简称为对象)的声音的音频信号的增益校正的增益值。70.这样的信息处理装置11例如被提供在执行构成3d音频内容的音频信号的混合的编辑装置等中。71.信息处理装置11具有增益校正值决定单元21和听觉特性表保持单元22。72.位置信息和增益初始值作为构成3d音频内容的对象的元数据被提供给增益校正值决定单元21。73.这里,对象的位置信息是表示从三维空间中的基准位置观看的对象的位置的信息,并且这里,位置信息包括方位角值、仰角值、以及半径值。注意,在本例中,收听者的位置就是参考位置。74.方位角值和仰角值是表示从存在于参考位置的收听者(用户)观看的对象的水平方向和垂直方向上的每个位置的角度,并且方位角值和仰角值类似于图1至图3的情况下的那些。75.此外,半径值是从存在于三维空间中的参考位置的收听者到对象的距离(半径)。76.可以说,包括方位角值、仰角值、以及半径值的位置信息指示对象的声音的声像的定位位置。77.此外,包括在提供给增益校正值决定单元21的元数据中的增益初始值是用于对对象的音频信号进行增益校正的增益值,即,增益信息的初始值,并且该增益初始值由如3d音频内容的创建者等决定。注意,为了简化解释,增益初值假定为1.0。78.增益校正值决定单元21基于作为提供的元数据的位置信息和保留在听觉特性表保持单元22中的听觉特性表,决定指示用于校正对象的增益初始值的增益校正量的增益校正值。79.此外,增益校正值决定单元21基于所决定的增益校正值来校正所提供的增益初始值,并且将所得增益值设置为指示用于对对象的音频信号执行增益校正的最终增益校正量的信息。80.换言之,增益校正值决定单元21根据由位置信息指示的从收听者观看的对象的方向(声音到来方向)来决定增益校正值,从而决定音频信号的增益值。这样确定的增益值和提供的位置信息作为对象的最终元数据被输出到后续级。81.听觉特性表保持单元22保持听觉特性表,并且根据需要向增益校正值决定单元21提供由听觉特性表指示的增益校正值。82.这里,听觉特性表是这样的表,在该表中,从作为声源的对象到收听者的声音的到达方向,即,从收听者观看的声源的方向与根据该方向的增益校正值相关联。83.即,更具体地说,听觉特性表是在该表中根据位置关系将声源和收听者之间的相对位置关系与增益校正值相关联的表。84.例如,如图1至图3所示,由听觉特性表指示的增益校正值根据关于声音到来方向的人的听觉特性来决定,并且是增益校正量,使得不管声音到来的方向,声音在听觉上的响度变得恒定。85.即,如果使用通过将增益初始值校正为由听觉特性表指示的增益校正值而获得的增益值对对象的音频信号执行增益校正,则无论对象的位置如何,都以相同的响度听到相同对象的声音。86.这里,图5示出了听觉特性表的示例。87.在图5所示的示例中,增益校正值与由方位角值、仰角值、以及半径值决定的对象的位置(即对象的方向)相关联。88.特别地,这个例子假设所有的仰角值和半径值都是0和1.0,对象在垂直方向上的位置与收听者在相同的高度,并且收听者到对象的距离总是恒定的。89.在图5的示例中,例如,在作为声源的对象存在于收听者后面的情况下,诸如在方位角值为180度的情况下,增益校正值变得大于在对象存在于收听者前面的情况下,诸如在方位角值为0度或30度的情况下的增益校正值。90.另一方面,例如,在作为声源的对象存在于收听者的侧面的情况下,诸如在方位角值为90度的情况下,增益校正值变得小于在对象存在于收听者的前面的情况下的增益校正值。91.此外,将描述在听觉特性表保持单元22保持图5所示的听觉特性表的情况下,增益校正值决定单元21对增益初始值的校正的具体示例。92.例如,假设表示对象位置的方位角值、仰角值、以及半径值为90度、0度、以及1.0m,则从图5中对应于对象位置的增益校正值为‑0.52db。93.因此,增益校正值决定单元21基于从听觉特性表读取的增益校正值“‑0.52db”和增益初始值“1.0”执行以下表达式(1)的计算,并且给出增益值“0.94”。94.[表达式1][0095][0096]类似地,例如,在假设指示对象位置的方位角值、仰角值、以及半径值为‑150度、0度、以及1.0m的情况下,则从图5中对应于对象位置的增益校正值为0.51db。[0097]因此,增益校正值决定单元21基于从听觉特性表读取的增益校正值“0.51db”和增益初始值“1.0”执行以下表达式(2)的计算,并且给出增益值“1.06”。[0098][表达式2][0099][0100]注意,在图5中,已经描述了使用基于在二维听觉特性中仅考虑水平方向的二维听觉特性决定的增益校正值的示例。即,描述了使用基于二维听觉特性生成的听觉特性表(在下文中,也称为二维听觉特性表)的示例。[0101]然而,可以使用基于三维听觉特性决定的增益校正值来校正增益初始值,在该三维听觉特性中不仅考虑水平方向的特性,还考虑垂直方向的特性。[0102]在这种情况下,例如,可以使用图6所示的听觉特性表。[0103]在图6所示的示例中,增益校正值与由方位角值、仰角值、以及半径值决定的对象的位置(即对象的方向)相关联。[0104]特别地,在本例中,在方位角值和仰角值的所有组合中,半径值都是1.0。[0105]在下文中,根据图6所示的关于声音到来方向的三维听觉特性生成的听觉特性表也被特别地称为三维听觉特性表。[0106]这里,将描述在听觉特性表保持单元22保持图6所示的听觉特性表的情况下,增益校正值决定单元21对增益初始值的校正的具体示例。[0107]例如,假设表示对象位置的方位角值、仰角值以及半径值为60度、30度、以及1.0m,则从图6中对应于对象位置的增益校正值为‑0.07db。[0108]因此,增益校正值决定单元21基于从听觉特性表读取的增益校正值“‑0.07db”和增益初始值“1.0”执行以下表达式(3)的计算,并且给出增益值“0.99”。[0109][表达式3][0110][0111]注意,在上述增益值计算的特定示例中,预先准备基于关于对象的位置(方向)确定的听觉特性的增益校正值。即,描述了将与对象的位置信息对应的增益校正值存储在听觉特性表中的示例。[0112]然而,对象的位置不一定存在于对应的增益校正值存储在听觉特性表中的位置。[0113]具体地说,例如,假设在听觉特性表保持单元22中保持图6所示的听觉特性表,并且作为位置信息的方位角值、仰角值、以及半径值是‑120度、15度、以及1.0m。[0114]在这种情况下,对应于方位角值“‑120”、仰角值“15”、以及半径值“1.0”的增益校正值不存储在图6的听觉特性表中。[0115]因此,在存在对应于由位置信息指示的位置的增益校正值不存在于听觉特性表中的情况下,增益校正值决定单元21可以使用存在与由位置信息指示的位置相邻的对应增益校正值的多个位置处的数据(增益校正值),通过插值处理等计算期望位置处的增益校正值。[0116]换句话说,在与从收听者观看的对象的方向(位置)相对应的增益校正值没有存储在听觉特性表中的情况下,可以基于与从收听者观看的对象的另一方向相对应的增益校正值通过插值处理等来获得增益校正值。[0117]例如,增益校正值插值方法包括矢量基幅平移(vbap)。[0118]vbap是用于来自针对每个对象的对象的元数据中获得再现环境中的多个扬声器的增益值。[0119]这里,可以通过用多个增益校正值替换再现环境中的多个扬声器来计算期望位置处的增益校正值。[0120]具体地,在三维空间中准备了增益校正值的多个位置处划分网格。即,例如,在三维空间中三个位置中的每一个的增益校正值都被准备好的假设下,具有这三个位置作为顶点的一个三角形区域是一个网格。[0121]当这样将三维空间划分为多个网格时,以用于获得增益校正值的期望位置作为关注位置来指定包括关注位置的网格。[0122]此外,当指示关注位置的位置向量由指示构成指定网格的三个顶点位置的位置向量的乘法和加法表示时,获得要与指示三个顶点位置中的每一个的位置向量相乘的系数。[0123]然后,将这样获得的三个系数中的每一个与包括关注位置的网格的三个顶点位置的相应增益校正值相乘,并且计算增益校正值乘以系数的总和作为关注位置的增益校正值。[0124]具体地说,假设表示包括关注位置的网格的三个顶点位置的位置向量为p1至p3,并且顶点位置的增益校正值为g1至g3。[0125]此时,假定指示关注位置的位置向量由g1p1+g2p2+g3p3表示。在这种情况下,关注位置的增益校正值为g1g1+g2g2+g3g3。[0126]注意,增益校正值的插值方法不限于通过vbap的插值,并且可以使用任何其他方法。[0127]例如,在听觉特性表中存在增益校正值的位置中,在关注位置附近的n(例如,n=5)个位置处的增益校正值的平均值可以用作关注位置的增益校正值。[0128]此外,例如,可以将听觉特性表中存在增益校正值的位置中最接近关注位置的位置处的增益校正值用作关注位置的增益校正值。[0129]此外,虽然这里已经描述了在示例中以分贝值获得增益校正值的示例,但是可以以线性值获得增益校正值。在这种情况下,例如,即使当通过使用vbap的插值获得线性值中的增益校正值时,也可以通过与上述分贝值的情况类似的计算来获得任意位置处的增益校正值。[0130]此外,本技术还可以应用于位置信息作为对象的元数据的情况,即,基于对象的类型、优先级、声压、音高等来决定方位角值、仰角值、以及半径值。[0131]在这种情况下,增益校正值基于例如基于对象类型、优先级等决定的位置信息和预先准备的三维听觉特性表来决定。[0132]<增益值决定处理说明>[0133]随后,将描述信息处理装置11的操作。即,下面将参考图7的流程图来描述由信息处理装置11执行的增益值决定处理。[0134]在步骤s11中,增益校正值决定单元21从外部获取元数据。[0135]即,增益校正值决定单元21获取包括方位角值、仰角值和半径值的位置信息和增益初始值作为元数据。[0136]在步骤s12中,增益校正值决定单元21基于在步骤s11中获取的位置信息和在听觉特性表保持单元22中保持的听觉特性表来决定增益校正值。[0137]即,增益校正值决定单元21从听觉特性表中读取与构成所获取的位置信息的方位角值、仰角值、以及半径值相关联的增益校正值,并且将读取的增益校正值设置为决定的增益校正值。[0138]在步骤s13中,增益校正值决定单元21基于在步骤s11中获取的增益初始值和在步骤s12中决定的增益校正值来决定增益值。[0139]即,增益校正值决定单元21通过基于增益初始值和增益校正值执行类似于表达式(1)的计算并且用增益校正值校正增益初始值来获得增益值。[0140]当这样决定增益值时,增益校正值决定单元21将决定的增益值输出到后续级,并且增益值决定处理结束。已经输出的增益值用于在后续级中对音频信号进行增益校正(增益调整)。[0141]如上所述,信息处理装置11使用听觉特性表来决定增益校正值,并且通过用增益校正值校正增益初始值来决定增益值。[0142]这使得可以更容易地执行增益校正。因此,例如,可以更容易地,即在短时间内创建足够高质量的3d音频内容。[0143]<第二实施例>[0144]<关于用户界面>[0145]此外,根据本技术,可以提供用于设置和调整上述增益校正值的用户界面。[0146]例如,本技术可以应用于通过用户输入或自动决定对象的位置等的3d音频内容创建工具。[0147]具体地,在3d音频内容创建工具中,例如,通过图8所示的用户界面(显示画面),可以基于相对于从收听者观看的对象的方向的听觉特性来执行增益校正值(增益值)的设置或调整。[0148]在图8所示的示例中,3d音频内容创建工具的显示画面设置有下拉框bx11,用于从彼此不同的多个预设听觉特性中选择期望的听觉特性。[0149]在本例中,预先准备多个二维听觉特性,诸如男性的听觉特性、女性的听觉特性和单个用户的听觉特性,并且用户可以通过操作下拉框bx11来选择期望的听觉特性。[0150]当用户选择了听觉特性时,在图8中的下拉框bx11下方提供的增益校正值显示区域r11中显示与用户选择的听觉特性对应的每个方位角值处的增益校正值。[0151]特别地,在增益校正值显示区域r11中,纵轴表示增益校正值,并且横轴表示方位角值。[0152]此外,曲线l11表示方位角值为负值的每个方位角值处的增益校正值,即,从收听者观察右侧方向处的增益校正值,曲线l12表示从收听者观察左侧方向处的每个方位角值处的增益校正值。[0153]通过观看这样的增益校正值显示区域r11,用户可以直观地瞬时地掌握每个方位角值处的增益校正值。[0154]此外,在图中的增益校正值显示区域r11的下侧设置有显示用于调整在增益校正值显示区域r11上显示的增益校正值的滑块等的滑块显示区域r12。[0155]在滑块显示区域r12中,对于用户可以调整增益校正值的每个方位角值,显示指示方位角值的数字、指示增益校正值的刻度、以及用于调整增益校正值的滑块。[0156]例如,滑块sd11用于当方位角值为30度时调整增益校正值,并且用户可以通过上下移动滑块sd11来指定期望的值作为调整后的增益校正值。[0157]当利用滑块sd11调整增益校正值时,根据该调整更新增益校正值显示区域r11的显示。即,这里,曲线l12根据对滑块sd11的操作而改变。[0158]因此,在图8所示的示例中,可以独立地调节从收听者观察的右侧的每个方向上的增益校正值和从收听者观察的左侧的每个方向上的增益校正值。[0159]具体地,在该示例中,通过从预先准备的多个听觉特性中选择任意一个,就可以根据期望的听觉特性,即听觉特性表指定增益校正值。然后,通过操作滑块,可以根据所选择的听觉特性进一步调整增益校正值。[0160]例如,由于预先准备的听觉特性是平均特性,通过操作滑块,用户可以根据单个用户的听觉特性调整增益校正值。此外,通过操作滑块来调整增益校正值,还可以根据用户的意图执行调整,诸如通过执行大增益校正来增强在后面的对象。[0161]当这样设置和调整每个方位角值中的增益校正值,例如操作未示出的保存按钮等时,生成在二维听觉特性表中的增益校正值显示区域r11上显示的增益校正值和每个方位角值相互关联的二维听觉特性表。[0162]注意,在图8中,已经描述了在示例中增益校正值在从收听者观看的右侧和左侧的每个方向上不同的示例,即,在该示例中增益校正值双边不对称的示例。然而,增益校正值可以是双边对称的。[0163]在这种情况下,例如,如图9所示,设置和调整增益校正值。注意,在图9中,与图8中的部分对应的部分被给予相同的附图标记,并且适当地省略其说明。[0164]图9示出了3d音频内容创建工具的显示画面,并且在该示例中,在显示画面上显示下拉框bx11、增益校正值显示区域r21、以及滑块显示区域r22。[0165]在增益校正值显示区域r21中,与图8中的增益校正值显示区域r11类似地显示每个方位角值处的增益校正值。然而,这里,由于左侧和右侧的每个方向上的增益校正值是公共的,所以只显示一条指示增益校正值的曲线。[0166]例如,在左侧和右侧的每个方向上的增益校正值的平均值可以是在左侧和右侧公共的增益校正值。在这种情况下,例如,将图8的示例中具有90度方位角值和‑90度方位角值的增益校正值的平均值设置为图9的示例中具有±90度方位角值的公共增益校正值。[0167]此外,用于调整在增益校正值显示区域r21中显示的增益校正值的滑块等显示在滑块显示区域r22中。[0168]例如,在本示例中,通过上和下移动滑块sd21,用户可以调整具有±30度的方位角值的公共增益校正值。[0169]此外,例如,如图10所示,可以针对每个仰角值调整每个方位角值处的增益校正值。注意,在图10中,与图8中的部分对应的部分被给予相同的附图标记,并且适当地省略其说明。[0170]图10示出了3d音频内容创建工具的显示画面,并且在该示例中,在显示画面上显示下拉框bx11、增益校正值显示区域r31至增益校正值显示区域r33、以及滑块显示区域r34至滑块显示区域r36。[0171]在图10所示的示例中,增益校正值与图9所示的示例类似地是双边对称的。[0172]在增益校正值显示区域r31中显示仰角值为30度时的每个方位角值处的增益校正值,并且用户可以通过操作在滑块显示区域r34中显示的滑块等来调整增益校正值。[0173]类似地,在增益校正值显示区域r32中显示当仰角值为0度时在每个方位角值处的增益校正值,并且用户可以通过操作在滑块显示区域r35中显示的滑块等来调整增益校正值。[0174]此外,在增益校正值显示区域r33中显示当仰角值为‑30度时的每个方位角值处的增益校正值,并且用户可以通过操作在滑块显示区域r36中显示的滑块等来调整增益校正值。[0175]当这样设置和调整每个方位角值中的增益校正值,例如操作未示出的保存按钮等时,生成在三维听觉特性表中增益校正值、仰角值、以及方位角值相互关联的三维听觉特性表。[0176]此外,如图11所示,作为3d音频内容创建工具的显示画面的另一示例,可以提供雷达图类型的增益校正值显示区域。注意,在图11中,与图10中的部分相对应的部分被给予相同的附图标记,并且适当地省略其说明。[0177]在图11的示例中,在显示画面上显示下拉框bx11、增益校正值显示区域r41至增益校正值显示区域r43、以及滑块显示区域r34至滑块显示区域r36。在该示例中,增益校正值类似于图10所示的示例是双边对称的。[0178]在增益校正值显示区域r41中显示仰角值为30度时的各方位角值处的增益校正值,用户可以通过操作在滑块显示区域r34中显示的滑块等来调整增益校正值。[0179]具体地,在增益校正值显示区域r41中,由于雷达图的每个项目都是方位角值,因此用户不仅可以瞬时地掌握每个方向(方位角值)和这些方向上的增益校正值,而且还可以掌握各方向之间的增益校正值的相对差。[0180]与增益校正值显示区域r41类似,在增益校正值显示区域r42中显示当仰角值为0度时在每个方位角值处的增益校正值。此外,在增益校正值显示区域r43中显示当仰角值为‑30度时在每个方位角值处的增益校正值。[0181]<信息处理装置配置示例>[0182]接下来,将描述通过参照图8等描述的3d音频内容创建工具生成听觉特性表的信息处理装置。[0183]例如,这样的信息处理装置被配置为如图12所示。[0184]图12所示的信息处理装置51实现内容创建工具,并且使显示装置52显示内容创建工具的显示画面。[0185]信息处理装置51具有输入单元61、听觉特性表生成单元62、听觉特性表保持单元63、以及显示控制单元64。[0186]输入单元61包括:例如鼠标、键盘、开关、按钮、以及触摸屏,并且将与用户操作相对应的输入信号提供给听觉特性表生成单元62。[0187]听觉特性表生成单元62基于从输入单元61提供的输入信号和在听觉特性表保持单元63中保持的预设听觉特性的听觉特性表生成新的听觉特性表,并且将新的听觉特性表提供给听觉特性表保持单元63。[0188]此外,听觉特性表生成单元62例如适当地指示显示控制单元64在生成听觉特性表时更新显示装置52中的显示画面的显示。[0189]听觉特性表保持单元63保持预先预设的听觉特性的听觉特性表,适当地将该听觉特性表提供给听觉特性表生成单元62,并且保持从听觉特性表生成单元62提供的听觉特性表。[0190]显示控制单元64根据来自听觉特性表生成单元62的指示控制显示装置52对显示画面的显示。[0191]注意,图12所示的输入单元61、听觉特性表生成单元62、以及显示控制单元64可以设置在图4所示的信息处理装置11中。[0192]<表生成处理说明>[0193]随后,将描述信息处理装置51的操作。[0194]即,下面将参考图13的流程图来描述由信息处理装置51执行的表生成处理。[0195]在步骤s41中,显示控制单元64响应于听觉特性表生成单元62的指示,使显示装置52显示内容创建工具的显示画面。[0196]具体地,例如,显示控制单元64使显示装置52显示图8、图9、图10、图11等所示的显示画面。[0197]此时,例如,在用户操作输入单元61并且选择预设听觉特性的情况下,听觉特性表生成单元62响应于从输入单元61提供的输入信号,从听觉特性表保持单元63读取与用户选择的听觉特性对应的听觉特性表。[0198]听觉特性表生成单元62指示显示控制单元64显示增益校正值显示区域,以便在显示装置52上显示由已经读取的听觉特性表指示的每个方位角值的增益校正值。响应于听觉特性表生成单元62的指示,显示控制单元64使显示装置52的显示画面显示增益校正值显示区域。[0199]当内容创建工具的显示画面显示在显示装置52上时,用户适当地操作输入单元61,并且操作显示在滑块显示区域中的滑块等,从而指示增益校正值的改变(调整)。[0200]然后,在步骤s42中,听觉特性表生成单元62根据从输入单元61提供的输入信号生成听觉特性表。[0201]即,听觉特性表生成单元62根据从输入单元61提供的输入信号,改变从听觉特性表保持单元63读取的听觉特性表,从而生成新的听觉特性表。即,根据在滑块显示区域中显示的滑块等的操作来改变(更新)预设的听觉特性表。[0202]因此,当根据滑块等的操作调整(改变)每个方位角值的增益校正值并且生成新的听觉特性表时,听觉特性表生成单元62指示显示控制单元64根据新的听觉特性表更新增益校正值显示区域的显示。[0203]在步骤s43中,显示控制单元64根据听觉特性表生成单元62的指令控制显示装置52,并且根据新生成的听觉特性表执行显示。[0204]具体地,显示控制单元64根据新生成的听觉特性表更新显示装置52的显示画面上的增益校正值显示区域的显示。[0205]在步骤s44中,听觉特性表生成单元62基于从输入单元61提供的输入信号来确定是否结束处理。[0206]例如,当用户操作输入单元61并且操作显示在显示装置52上的保存按钮等时,在表示指示保存听觉特性表的信号被提供作为输入信号的情况下,听觉特性表生成单元62确定结束处理。[0207]在步骤s44中确定未结束处理的情况下,处理返回到步骤s42,并且重复执行上述处理。[0208]另一方面,在步骤s44中确定结束处理的情况下,处理进行到步骤s45。[0209]在步骤s45中,听觉特性表生成单元62将在最近执行的步骤s42中获得的听觉特性表作为新生成的听觉特性表提供给听觉特性表保持单元63,并且使听觉特性表保持单元63保持新生成的听觉特性表。[0210]当听觉特性表被保留在听觉特性表保持单元63中时,表生成处理结束。[0211]如上所述,信息处理装置51使显示装置52显示内容创建工具的显示画面,并且根据用户操作调整增益校正值,从而生成新的听觉特性表。[0212]这允许用户容易且直观地获得对应于所需听觉特性的听觉特性表。因此,用户可以更容易地、即在短时间内创建足够高质量的3d音频内容。[0213]<第三个实施例>[0214]<语音处理装置配置示例>[0215]此外,例如,在自由视点内容中,由于收听者在三维空间中的位置可以自由移动,因此三维空间中的对象与收听者之间的相对位置关系也随着收听者的移动而改变。[0216]一种技术,在该技术中,在如上所述可以自由移动收听者的位置的情况下,根据收听者的位置的变化来校正声源位置,并且基于得到的校正位置信息来执行渲染处理(例如,参见wo2015/107926)。[0217]本技术也适用于再现这种自由视点的内容的再现装置。在这种情况下,不仅使用校正位置信息,而且使用上述三维听觉特性来执行增益校正。[0218]图14是示出用作再现应用了本技术的自由视点的内容的再现装置的语音处理装置的实施例的配置示例的视图。注意,在图14中,与图4中的部分对应的部分被给予相同的附图标记,并且适当地省略其说明。[0219]图14所示的语音处理装置91具有输入单元121、位置信息校正单元122、增益/频率特性校正单元123、听觉特性表保持单元22、空间声学特性添加单元124、渲染器处理单元125、以及卷积处理单元126。[0220]向语音处理装置91提供对象的音频信号和每个对象的音频信号的元数据,作为要再现的内容的音频信息。注意,在图14中,将描述在该示例中两个对象的音频信号和元数据被提供给信息处理装置91的示例,但本发明不限于此,对象的数量可以是任意数量。[0221]这里,提供给语音处理装置91的元数据是对象的位置信息和增益初始值。[0222]此外,位置信息包括上述方位角值、仰角值、以及半径值,并且是指示从三维空间中的基准位置观看的对象的位置,即对象声音的定位位置的信息。注意,在下文中,三维空间中的基准位置也特别地被称为标准收听位置。[0223]输入单元121包括鼠标、按钮、触摸屏等,并且当由用户操作时,根据操作输出信号。例如,输入单元121接受用户的假定收听位置的输入,并且将指示用户输入的假定收听位置的假定收听位置信息提供给位置信息校正单元122和空间声学特性添加单元124。[0224]这里,假定的收听位置是构成想要再现的虚拟声场中的内容的声音的收听位置。因此,可以说,假设的收听位置指示当预定的标准收听位置被改变(校正)时改变后的位置。[0225]根据从输入单元121提供的假定收听位置信息和从外部提供的指示收听者的朝向的方向信息,位置信息校正单元122校正作为从外部提供的对象的元数据的位置信息。[0226]位置信息校正单元122将通过位置信息的校正而获得的校正位置信息提供给增益/频率特性校正单元123和渲染器处理单元125。[0227]注意,例如,可以从设置在用户(收听者)头部的陀螺仪传感器等获得方向信息。此外,校正位置信息是指示从出现在假定的收听位置并且面向由方向信息指示的方向的收听者观看的对象的位置的信息,即对象声音的定位位置。[0228]增益/频率特性校正单元123基于从位置信息校正单元122提供的校正位置信息,在听觉特性表保持单元22中保持的听觉特性表和从外部提供的元数据,对从外部提供的对象的音频信号执行增益校正和频率特性校正。[0229]增益/频率特性校正单元123将通过增益校正和频率特性校正获得的音频信号提供给空间声学特性添加单元124。[0230]基于从输入单元121提供的假定收听位置信息和从外部提供的对象的位置信息,空间声学特性添加单元124将空间声学特性添加到从增益/频率特性校正单元123提供的音频信号,并且将该音频信号提供给渲染器处理单元125。[0231]基于从位置信息校正单元122提供的校正位置信息,渲染器处理单元125对从空间声学特性添加单元124提供的音频信号执行渲染处理,即映射处理,并且生成2个或更多的m声道的再现信号。[0232]即,从每个对象的音频信号生成m声道再现信号。渲染器处理单元125将生成的m信道再现信号提供给卷积处理单元126。[0233]由此获得的m声道再现信号是再现从每个对象输出的声音的音频信号,声音被列出在期望通过用虚拟m扬声器(m声道扬声器)再现所需要再现的虚拟声场的假定收听位置。[0234]卷积处理单元126对从渲染器处理单元125提供的m声道再现信号执行卷积处理,并且生成和输出2声道再现信号。[0235]即,在本示例中,内容的再现侧的装置是耳机,并且卷积处理单元126生成并且输出要由设置在耳机中的两个扬声器(驱动器)再现的再现信号。[0236]<再现信号生成处理说明>[0237]随后,将描述语音处理装置91的操作。[0238]即,下面将参考图15的流程图来描述由语音处理装置91执行的再现信号生成处理。[0239]在步骤s71中,输入单元121接受假设收听位置的输入。[0240]当用户操作输入单元121并且输入假定收听位置时,输入单元121向位置信息校正单元122和空间声学特性添加单元124提供指示假定收听位置的假定收听位置信息。[0241]根据从输入单元121提供的假定收听位置信息和从外部提供的对象的位置信息和方向信息,位置信息校正单元122在步骤s72中计算校正位置信息。[0242]位置信息校正单元122将针对每个对象获得的校正位置信息提供给增益/频率特性校正单元123和渲染器处理单元125。[0243]基于从位置信息校正单元122提供的校正位置信息、从外部提供的元数据、以及在听觉特性表保持单元22中保持的听觉特性表,增益/频率特性校正单元123在步骤s73中对从外部提供的对象的音频信号执行增益校正和频率特性校正。[0244]具体地,例如,增益/频率特性校正单元123从听觉特性表中读取与构成校正位置信息的方位角值、仰角值、以及半径值相关联的增益校正值。[0245]此外,增益/频率特性校正单元123通过将增益校正值乘以作为元数据提供的位置信息的半径值与校正位置信息的半径值之间的比值来校正增益校正值,并且通过将所得增益值校正增益初值来获得增益值。[0246]因此,通过具有增益值的增益校正来实现根据从假定收听位置观看的对象的方向的增益校正和根据从假定收听位置到对象的距离的增益校正。[0247]此外,增益/频率特性校正单元123基于作为元数据提供的位置信息的半径值和校正位置信息的半径值来选择滤波器系数。[0248]这样选择的滤波器系数用于滤波器处理,以实现期望的频率特性校正。更具体地说,例如,滤波器系数用于再现性质,在该性质中,根据从假定的收听位置到对象的距离,来自对象的声音的高频分量被期望再现的虚拟声场的墙或天花板衰减。[0249]增益/频率特性校正单元123通过基于如上所述获得的滤波器系数和增益值对对象的音频信号执行增益校正和滤波处理来实现增益校正和频率特性校正。[0250]增益/频率特性校正单元123将通过增益校正和频率特性校正获得的每个对象的音频信号提供给空间声学特性添加单元124。[0251]基于从输入单元121提供的假定收听位置信息和从外部提供的对象的位置信息,空间声学特性添加单元124在步骤s74中将空间声学特性添加到从增益/频率特性校正单元123提供的音频信号,并且将该音频信号提供给渲染器处理单元125。[0252]例如,空间声学特性添加单元124基于从对象的位置信息和假定的收听位置信息确定的延迟量和增益量,通过对音频信号执行多抽头延迟处理、梳状滤波器处理、以及全通滤波器处理来添加空间声学特性。因此,例如,初始反射、混响特性等作为空间声学特性被添加到音频信号中。[0253]在步骤s75中,渲染器处理单元125基于从位置信息校正单元122提供的校正位置信息,对从空间声学特性添加单元124提供的音频信号执行映射处理,从而生成m声道再现信号并且将该再现信号提供给卷积处理单元126。[0254]例如,在步骤s75的处理中,通过vbap生成再现信号,但是可以通过任何方法生成m信道再现信号。[0255]在步骤s76中,卷积处理单元126对从渲染器处理单元125提供的m声道再现信号执行卷积处理,从而生成并输出2声道再现信号。例如,将双耳室脉冲响应(brir)处理作为卷积处理来执行。[0256]当生成并且输出2通道再现信号时,再现信号生成处理结束。[0257]如上所述,语音处理装置91基于假定收听位置信息计算校正位置信息,基于获得的校正位置信息和假定收听位置信息对每个对象的音频信号执行增益校正和频率特性校正,并且增加空间声学特性。[0258]这使得可以更容易地执行适当的增益校正和频率特性校正。此外,可以真实地再现收听者如何在任意假定的收听位置处听到从每个对象输出的声音。因此,用户在再现内容时能够根据自己的喜好自由地指定收听位置,并且能够以更高的自由度实现音频再现。[0259]注意,在步骤s73中,除了基于校正位置信息根据从假定收听位置到对象的距离执行增益校正和频率特性校正之外,还使用听觉特性表执行基于三维听觉特性的增益校正。[0260]此时,在步骤s73中使用的听觉特性表,例如是图16所示的听觉特性表。[0261]图16所示的听觉特性表是通过将图6所示的听觉特性表中的增益校正值的符号反转而获得的。[0262]通过使用这样的听觉特性表校正增益初始值,就有可能通过增益校正再现这样一种现象:即使来自相同对象(声源)的声音,声音在听觉上的响度会根据声音到来的方向而改变。这使得实现具有更高真实感的声场再现成为可能。[0263]另一方面,取决于再现条件,有时通过使用图6所示的听觉特性表而不是图16所示的听觉特性表来实现更合适的增益校正。[0264]即,例如,将考虑使用布置在三维空间中的实际扬声器而不是使用用于内容再现的耳机来执行扬声器再现的情况。[0265]在这种情况下,在语音处理装置91中,将由渲染器处理单元125获得的m声道再现信号提供给与m声道中的每一个相对应的扬声器,并且再现内容的声音。[0266]在使用这种实际扬声器的内容再现中,实际上在从假定的收听位置观看的对象的位置处再现声源,即对象的声音。[0267]因此,不需要执行增益校正来再现听觉上的声音的响度取决于声音的到达方向而改变的现象,而不是,有时不希望改变听觉上的声音的响度以不改变音量平衡。[0268]在这种情况下,在步骤s73中,仅要求使用图6所示的听觉特性表来确定增益校正值,并且仅要求使用增益校正值来校正增益初始值。因此,执行增益校正,使得听觉上的声音响度变得恒定,而不管对象存在的方向如何。[0269]<第三实施例的变型例1>[0270]<增益听觉特性信息的编码发送>[0271]顺便提一下,音频信号、元数据等有时被编码并且通过编码比特流发送。[0272]在这种情况下,例如,增益/频率特性校正单元123可以通过编码比特流发送增益听觉特性信息,该增益听觉特性信息包括关于是否使用听觉特性表执行增益校正的标志信息等。[0273]此时,增益听觉特性信息不仅包括标志信息,还包括听觉特性表、指示多个听觉特性表中用于增益校正的听觉特性表的索引信息等。[0274]用于这种增益听觉特性信息的语法可以是,例如图17所示的语法。[0275]在图17的示例中,字符“numgainauditorypropertytables”表示由编码比特流发送的听觉特性表的数量,即,包括在增益听觉特性信息中的听觉特性表的数量。[0276]此外,字符“numelements[i]”表示构成包括在增益听觉特性信息中的第i听觉特性表的元素的数量。[0277]这里提到的元素是相互关联的方位角值、仰角值、半径值、以及增益校正值。[0278]此外,字符“azimuth[i][n]”、“elevation[i][n]”、以及“radius[i][n]”表示构成第i听觉特性表的第n元素的方位角值、仰角值、以及半径值。[0279]换句话说,azimuth[i][n]、elevation[i][n]、以及radius[i][n]表示作为声源的对象的声音到达的方向,即水平角、垂直角和表示对象位置的距离(半径)。[0280]此外,字符“gaincompensvalue[i][n]”表示构成第i听觉特性表的第n元素的增益校正值,即关于由azimuth[i][n]、elevation[i][n]、以及radius[i][n]表示的位置(方向)的增益校正值。[0281]此外,字符“hasgaincompensobjects”是指示是否存在要对执行使用听觉特性表的增益校正的对象的标志信息。[0282]此外,字符“num_objects”表示构成内容的对象的数量(对象数量),并且该对象数量num_objects与增益听觉特性信息分开地被发送到内容的再现侧的装置,即语音处理装置。[0283]在标志信息hasgaincompensobjects的值是表示要对执行使用听觉特性表的增益校正的对象的存在的值的情况下,增益听觉特性信息包括由字符“isgaincompensobject[o]”由对象数量num_objects指示的标志信息。[0284]标志信息isgaincompensobject[o]指示是否使用相对于第o个对象的听觉特性表执行增益校正。[0285]此外,在标志信息的值isgaincompensobject[o]是表示使用听觉特性表执行增益校正的值的情况下,增益听觉特性信息包括由字符“applytableindex[o]”指示的索引。[0286]该索引applytableindex[o]是指示当相对于第o个对象执行增益校正时使用的听觉特性表的信息。[0287]例如,在听觉特性表的编号numgainauditorypropertytables为0的情况下,不发送听觉特性表,并且增益听觉特性信息不包括索引applytableindex[o]。即,索引applytableindex[o]不被发送。[0288]在这种情况下,例如,可以使用保留在听觉特性表保持单元22中的听觉特性表来执行增益校正,或者可以不执行增益校正。[0289]<语音处理装置配置示例>[0290]在通过编码比特流发送如上所述的增益听觉特性信息的情况下,例如,如图18所示配置语音处理装置。注意,在图18中,与图14中的部分对应的部分被给予相同的附图标记,并且适当地省略其说明。[0291]图18所示的语音处理装置151具有输入单元121、位置信息校正单元122、增益/频率特性校正单元123、听觉特性表保持单元22、空间声学特性添加单元124、渲染器处理单元125、以及卷积处理单元126。[0292]语音处理装置151的配置与图14所示的语音处理装置91的配置相同,但与语音处理装置91的不同之处在于,从编码比特流提取的增益听觉特性信息中读取的听觉特性表等被提供给增益/频率特性校正单元123。[0293]即,在语音处理装置151中,将从增益听觉特性信息读取的听觉特性表、标志信息hasgaincompensobjects、标志信息isgaincompensobject[o]、索引applytableindex[o]等提供给增益/频率特性校正单元123。[0294]语音处理装置151基本上执行参照图15描述的再现信号生成处理。[0295]然而,在听觉特性表的数量numgainauditorypropertytables为0的情况下,即,在没有从外部提供听觉特性表的情况下,增益/频率特性校正单元123在步骤s73中使用保留在听觉特性表保持单元22中的听觉特性表执行增益校正。[0296]另一方面,在从外部提供听觉特性表的情况下,增益/频率特性校正单元123使用提供的听觉特性表执行增益校正。[0297]具体地说,增益/频率特性校正单元123使用由从外部提供的多个听觉特性表中的索引applytableindex[o]指示的听觉特性表,相对于第o个对象执行增益校正。[0298]然而,对于标志信息isgaincompensobject[o]的值是表示未使用听觉特性表执行增益校正的值的对象,增益/频率特性校正单元123未使用听觉特性表执行增益校正。[0299]即,在提供了表示使用听觉特性表执行增益校正的值的标志信息为isgaincompensobject[o]的情况下,增益/频率特性校正单元123使用由索引applytableindex[o]指示的听觉特性表执行增益校正。[0300]此外,例如,在标志信息hasgaincompensobjects的值是表示不存在要对执行使用听觉特性表的增益校正的对象的值的情况下,增益/频率特性校正单元123未对对象执行使用听觉特性表的增益校正。[0301]如上所述,根据本技术,可以容易地决定每个对象的增益信息,即对象音频的3d混合、自由视点的内容的再现等中的增益值。因此,可以更容易地执行增益校正。[0302]此外,根据本技术,当收听位置改变时,可以适当地校正伴随着收听者和对象(声源)之间的相对位置关系的改变的听觉上的音量变化。[0303]<计算机的配置示例>[0304]顺便提一下,上面描述的一系列处理可以由硬件执行,或者可以由软件执行。在通过软件执行该系列处理的情况下,将构成该软件的程序安装到计算机中。这里,计算机包括一个集成在专用硬件中的计算机,以及例如能够通过安装各种程序来执行各种功能的通用个人计算机。[0305]图19是示出通过程序执行上述一系列处理的计算机的硬件的配置示例的框图。[0306]在计算机中,中央处理单元(cpu)501、只读存储器(rom)502、以及随机存取存储器(ram)503通过总线504互连。[0307]输入/输出接口505进一步连接到总线504。输入单元506、输出单元507、记录单元508、通信单元509、以及驱动器510连接到输入/输出接口505。[0308]输入单元506包括键盘、鼠标、麦克风、成像元件等。输出单元507包括显示器、扬声器等。记录单元508包括硬盘、非易失性存储器等。通信单元509包括网络接口等。驱动器510驱动诸如磁盘、光盘、磁光盘或半导体存储器的可移动记录介质511。[0309]当cpu501经由输入/输出接口505和总线504将记录在记录单元508中的程序,例如加载到ram503并且执行该程序时,如上所述配置的计算机执行如上所述的一系列处理。[0310]例如,可以将计算机(cpu501)执行的程序作为封装介质记录并且提供在可移动记录介质511中。此外,该程序可以通过有线或无线发送介质提供,诸如局域网、因特网、以及数字卫星广播。[0311]通过将可移动记录介质511安装到驱动器510,计算机可以通过输入/输出接口505将程序安装到记录单元508中。此外,该程序可以由通信单元509经由有线或无线发送介质接收,并且安装在记录单元508中。除此之外,程序可以预先安装在rom502或记录单元508中。[0312]注意,由计算机执行的程序可以是沿着本说明书中说明的顺序在时间序列中执行处理的程序,或者可以是并行地或在诸如进行调用的必要定时执行处理的程序。[0313]此外,本技术的实施例不限于上述实施例,并且可以在不脱离本技术的要旨的范围内进行各种修改。[0314]例如,本技术可以具有云计算的配置,在该配置中一个功能通过网络由多个装置共享,并且协同处理。[0315]此外,上述流程图中说明的每个步骤可以由一个装置执行或由多个装置以共享的方式执行。[0316]此外,在一个步骤包括多个处理的情况下,一个步骤中包括的多个处理可以由一个装置执行,或者由多个装置以共享的方式执行。[0317]此外,本技术可以具有以下配置。[0318](1)一种信息处理装置,包括[0319]增益校正值决定单元,根据从收听者观看音频对象的方向,决定用于对音频对象的音频信号执行增益校正的增益值的校正值。[0320](2)根据(1)的信息处理装置,其中[0321]增益校正值决定单元基于收听者关于声音到来方向的三维听觉特性来决定校正值。[0322](3)根据(1)或(2)的信息处理装置,其中[0323]增益校正值决定单元基于收听者的朝向决定校正值。[0324](4)根据(1)至(3)中任一项的信息处理装置,其中[0325]增益校正值决定单元决定校正值,使得与音频对象存在于收听者前面的情况相比,在音频对象存在于收听者后面的情况下校正值变大。[0326](5)根据(1)至(4)中任一项的信息处理装置,其中[0327]增益校正值决定单元决定校正值,使得与音频对象存在于收听者前面的情况相比,在音频对象存在于收听者侧面的情况下校正值变小。[0328](6)根据(1)至(5)中任一项的信息处理装置,其中[0329]增益校正值决定单元通过基于与另一方向对应的校正值的插值处理获得与预定方向对应的校正值,来决定与该预定方向对应的校正值。[0330](7)根据(6)的信息处理装置,其中[0331]增益校正值决定单元执行矢量基幅平移vbap作为插值处理。[0332](8)根据(7)的信息处理装置,其中[0333]增益校正值决定单元以线性值或者分贝值获得校正值。[0334](9)一种信息处理方法,其中[0335]信息处理装置,根据从收听者观看音频对象的方向,决定用于对音频对象的音频信号执行增益校正的增益值的校正值。[0336](10)一种程序,使计算机执行包括以下步骤的处理:[0337]根据从收听者观看音频对象的方向,决定用于对音频对象的音频信号执行增益校正的增益值的校正值。[0338](11)一种再现装置,包括:[0339]增益校正单元,基于指示音频对象的位置的位置信息,决定用于对音频对象的音频信号执行增益校正的增益值的校正值,该校正值取决于从收听者观看音频对象的方向,并且基于由校正值校正后的增益值对音频信号执行增益校正,以及[0340]渲染器处理单元,基于通过增益校正获得的音频信号执行渲染处理,并且生成用于再现音频对象的声音的多个声道的再现信号。[0341](12)根据(11)的再现装置,其中[0342]增益校正单元,通过校正值校正音频信号的元数据中包括的增益值。[0343](13)根据(11)或(12)的再现装置,其中[0344]在提供指示执行增益值的校正的标志的情况下,增益校正单元通过该校正值校正增益值。[0345](14)根据(13)的再现装置,其中[0346]增益校正单元通过使用多个表中由提供的索引指示的表来决定校正值,在该多个表中从收听者观看音频对象的方向与校正值相关联。[0347](15)根据(11)至(14)中任一项的再现装置,还包括:[0348]位置信息校正单元,基于指示收听者的位置的信息来校正在音频信号的元数据中包括的位置信息,其中[0349]增益校正单元基于已经被校正的位置信息来决定校正值。[0350](16)根据(15)的再现装置,其中[0351]位置信息校正单元基于指示收听者的位置的信息和指示收听者的朝向的方向信息来校正位置信息。[0352](17)一种再现方法,其中,[0353]再现装置:[0354]基于指示音频对象的位置的位置信息,决定用于对音频对象的音频信号执行增益校正的增益值的校正值,该校正值取决于从收听者观看音频对象的方向,[0355]基于由校正值校正的增益值对音频信号执行增益校正,[0356]基于通过增益校正获得的音频信号执行渲染处理,以及[0357]生成多个声道的再现信号,用于再现音频对象的声音。[0358](18)一种程序,使计算机执行包括以下步骤的处理:[0359]基于指示音频对象的位置的位置信息,决定用于对音频对象的音频信号执行增益校正的增益值的校正值,该校正值取决于从收听者观看音频对象的方向,[0360]基于由校正值校正的增益值对音频信号执行增益校正,[0361]基于通过增益校正获得的音频信号执行渲染处理,以及[0362]生成多个声道的再现信号,用于再现音频对象的声音。[0363]附图标记列表[0364]11信息处理装置[0365]21增益校正值决定单元[0366]22听觉特性表保持单元[0367]62听觉特性表生成单元[0368]64显示控制单元[0369]122位置信息校正单元[0370]123增益/频率特性校正单元。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1