音频再生装置以及方法与流程

文档序号:11710269阅读:151来源:国知局
音频再生装置以及方法与流程

本申请是申请日为2014年2月19日、申请号为201480032404.7、发明名称为“音频再生装置以及方法”的发明专利申请的分案。

本发明涉及利用扬声器阵列来对音频对象进行再生的装置及其方法。尤其涉及对含有示出使声像定位在三维空间中的位置的再生位置信息的音频对象进行再生的装置及其方法。



背景技术:

近些年,以数码电视广播接收机或dvd播放机来再生5.1ch的音频内容的装置被不断地开发且被商品化。5.1ch是指,被配置了前置左右声道、前方中央声道、以及左右环绕声道的声道设定。而且,在近些年的蓝光(blu-ray(注册商标))播放器中,在后声场增加了左右声道,而构成了7.1ch(声道)。

并且,随着图像的更大画面化以及高精细化的进展,音频的立体声研究也在不断地发展。例如,正在研究以22.2ch(声道)的扬声器设置为前提的立体声。图14示出了目前nhk(日本广播协会)正在研究开发的22.2ch的音频再生中的扬声器设置。其与以往的仅在二维平面上(图14的中段部分)设置扬声器不同,是在脚下(下段)以及天花板(上段)也设置扬声器的三维的构成(非专利文献1)。

并且,也在试行以三维音响作为特征而设置在电影院(非专利文献2)。在这种情况下也是同样,将扬声器也设置在天花板的3d(三维)的构成。并且,内容作为音频对象而被编码。音频对象是指,伴随有示出使声像定位在三维空间中的位置的再生位置信息的音频信号。例如是将以(x、y、z)这三轴表示的声源(声像)应该定位在哪个位置的再生位置信息、与该声源的音频信号作为一组来进行编码的信号。

例如,在将子弹、飞机或飞行中的鸟的叫声等作为音频对象的情况下,再生位置信息所示的位置则会随着时间不停地迁移。在这种情况下,再生位置信息也可以是表示迁移方向的向量信息。当然,在某特定的位置发生了爆炸声等情况下,再生位置信息则是固定不变的。

这样,以将扬声器设置成三维为前提,进行了对伴随有再生位置信息的音频信号进行再生的研究开发,但是在实际的家庭应用或个人应用中,不能将扬声器设置成三维的情况较多。

另外,在不能对扬声器进行自由设置的环境中,作为尽可能地实现临场感高的音频再生技术,而研究开发了hrtf(头相关传递函数;headrelatedtransferfunction)、波阵面合成、波束成形等。

hrtf是模拟在人的头部周边的声音的传播特性的传递函数。听起来声音是从哪个方向传来的这种知觉会受到hrtf的影响,如图15所示,主要受到两耳间的声压差、到达两耳间的声波的时间差的影响。相反而言,通过信号处理对此进行人工控制,从而能够控制听起来的声音方向。非专利文献3已有详细说明。并且,有关前后以及上下方向的定位的启示,包含在hrtf的振幅谱中。专利文献1已有详细说明。

关于波阵面合成的基本的工作原理由图16的(a)示出。本来,声波是在以声源为中心的同心圆上扩散的(只要不将扬声器设置在声源的位置上),因此,自然的声波虽然不能在空间上生成,但是能够将多个扬声器排列设置(即,形成扬声器阵列),通过恰当地控制声压以及相位,就仿佛声波从声源扩散开的同心圆状的波形的一部分在空间上被生成。非专利文献4已有详细说明。

波束成形的基本的工作原理如图16的(b)所示。与波阵面合成同样,对于波束成形也采用扬声器阵列,并通过对声压以及相位进行恰当地控制,从而能够使特定的位置的声压级比其周围高。据此,能够再现出声源仿佛就存在于该位置的状态。非专利文献5已有详细说明。

(现有技术文献)

(专利文献)

专利文献1:日本国際公开第2006/030692号

(非专利文献)

非专利文献1:firstpublishedinsmptetechnicalconferencepublicationinoctober2007

非专利文献2:dolbyatmoscinematechnicalguidelines

非专利文献3:audioengsoc,vol49,no4,2001aprilintroductiontohead-relatedtransferfunctions(hrtfs):representationsofhrtfsintime,frequency,andspace

非专利文献4:audiosignalprocessingfornext-generationmultimediacommunicationsystems,pp.323-342,y.a.huang,j.benesty,kluwer,jan.2004

非专利文献5:aes127thconvention,newyorkny,usa,2009october9-12physicalandperceptualpropertiesoffocusedsourcesinwavefieldsynthesis



技术实现要素:

发明要解决的问题

然而出现的课题是,若要将以上所示的22.2ch这种将扬声器也设置在天花板上的构成,以实际上的家庭用或个人用来实现是比较困难的。

作为即使在不能自由地设置扬声器的情况下也能够提高声音的临场感的方法,已经公开了hrtf(头相关传递函数)、波阵面合成、波束成形。hrtf作为控制声音的听起来的方向的方法是非常有效的,但是只是在知觉上控制这种听上去的感觉,并非是在物理上实际再现波面,因此不能再现受听者与声源之间的距离感。与此相比,波阵面合成以及波束成形由于能够再现实际上的物理波面,从而能够再现受听者与声源的距离感,但是不能在受听者的后方生成声源。这是因为从扬声器阵列输出的声波在结成声像之前,声波先到达了受听者的听觉的缘故。

并且,上述的任一个以往的技术均为扬声器被设置在二维平面上来进行声音控制的技术,因此,在音频对象中所包含的再生位置信息作为三维的空间信息而被表现的情况下,则不能进行反映了再生位置信息的信号处理。

本发明鉴于以往的课题,目的在于提供一种音频再生装置及其方法,即使在不能自由设置扬声器的空间,也能够以良好的临场感来再生包含有三维的再生位置信息的音频对象。

用于解决问题的手段

为了解决上述的课题,其中一个实施方式所涉及的音频再生装对包含有音频信号以及再生位置信息的音频对象进行再生,所述再生位置信息示出使所述音频信号的声像定位的三维空间中的位置,所述音频再生装置包括:至少一列的扬声器阵列,将声信号转换为声学振动;转换部,将所述再生位置信息转换为校正再生位置信息,所述校正再生位置信息是以所述扬声器阵列的位置为基准的二维坐标轴上的位置信息;以及信号处理部,按照所述校正再生位置信息,进行使所述音频对象中所包含的所述音频信号的声像定位的处理,在将构成所述扬声器阵列的扬声器元件的排列方向设为x轴,将与所述x轴正交、且与设置有所述扬声器阵列的面即设置面平行的方向设为y轴,将与所述x轴正交、且与所述设置面垂直的方向设为z轴时,所述校正再生位置信息示出由所述x轴与所述y轴构成的坐标轴上的位置,在以所述再生位置信息确定的位置为(x、y、z)时,所述校正再生位置信息是与所述x、y对应的值,在所述二维坐标的y坐标上,所述扬声器阵列的背面方向为负坐标、所述扬声器阵列的正面方向为正坐标,在所述二维坐标的x坐标上,从所述扬声器阵列的中央向左右两侧分别为负坐标和正坐标时,所述校正再生位置信息的值为将规定的值与所述x、y的至少一方相乘而得到的值。

据此,音频对象中包含的三维的再生位置信息被转换为以扬声器阵列的位置为基准的二维坐标轴上的校正再生位置信息,且能够按照校正后的校正再生位置信息来使声像定位,因此,即使在扬声器设置受到限制的情况下,也能够以高临场感来再生音频对象。

并且,在以再生位置信息确定的位置为(x、y、z)时,校正再生位置信息则成为与所述x、y对应的值,因此,即使在不能将扬声器设置成三维的空间中,也能够以高临场感来再生含有三维的再生位置信息的音频对象。

并且,校正再生位置信息的值成为以规定的值与所述x、y相乘而得到的值,因此能够虚拟地改变感受到的空间大小。

并且也可以是,所述校正再生位置信息的x坐标值受到所述扬声器阵列的宽度的限制。

据此,由于校正再生位置信息的x坐标值受到所述扬声器阵列的宽度的限制,因此能够进行适合于扬声器阵列的性能的信号处理。

并且也可以是,所述信号处理部是将声像构成到所述二维坐标轴上的位置的波束成形部。

据此,能够通过波束成形部,在目标的位置上生成较强的声学振动,因此,能够生成声源仿佛就存在于该位置的声场。

并且也可以是,在所述二维坐标的y坐标上,所述扬声器阵列的背面方向为负坐标,所述扬声器阵列的正面方向为正坐标,所述信号处理部,在所述校正再生位置信息的y坐标值为负值的情况下,以利用了惠更斯(huygens)原理的信号处理来进行波阵面合成。

据此,在校正再生位置信息的y坐标值为负值的情况下,以利用了惠更斯原理的信号处理来进行波阵面合成,因此,即使在使声像定位的目标位置为扬声器的背面的情况下,也能够生成声源仿佛就存在于该位置的声场。

并且也可以是,所述校正再生位置信息,通过方向角、以及从接受由所述扬声器阵列输出的声音的受听者的位置到所述再生位置信息所示的位置的距离,来示出所述二维坐标轴上的位置,所述方向角是指,由所述受听者的位置观察时朝向所述再生位置信息所示的位置的方向。

据此,校正再生位置信息能够通过由受听者的位置观察时朝向再生位置信息所示的位置的方向角、以及从受听者的位置到再生位置信息所示的位置的距离,来示出二维坐标轴上的位置,从而能够对受听者听起来的声源存在于哪个方向以及距离进行控制。

并且也可以是,所述信号处理部利用头相关传递函数,来进行使所述声像定位的处理,所述头相关传递函数被设定成,能够从所述校正再生位置信息所示的位置方向听到声音。

据此,由于设定成可以从校正再生位置信息所示的位置的方向听到声音,进行利用hrtf来使声像定位的处理,因此能够进行的再生反映了从受听者听到的声源的方向。

并且也可以是,所述信号处理部按照所述受听者的位置与所述校正再生位置信息所示的位置的距离,来调整音量。

据此,由于能够按照受听者的位置与校正再生位置信息所示的位置的距离来调整音量,因此能够进行反映了从受听者听到的声源距离的再生。

并且也可以是,所述信号处理部按照所述校正再生位置信息所示的位置,来变更信号处理方式。

据此,由于能够按照校正再生位置信息所示的位置来变更信号处理方式,因此能够选择最适应于目标再生位置的信号处理方式。

并且也可以是,将构成所述扬声器阵列的扬声器元件的排列方向设为x轴,将与所述x轴正交、且与设置有所述扬声器阵列的面的设置面平行的方向设为y轴,将与所述x轴正交、且与所述设置面垂直的方向设为z轴,在示出所述y轴上的位置的y坐标中,所述扬声器阵列的背面方向为负坐标,所述扬声器阵列的正面方向为正坐标,所述信号处理部,在所述校正再生位置信息的y坐标值为负值的情况下,以利用了惠更斯原理的信号处理来进行波阵面合成,在所述校正再生位置信息的y坐标值是在受听者的位置之前的正值的情况下,以利用了波束成形的信号处理来生成声像,在所述校正再生位置信息的y坐标值是在受听者的位置之后的正值的情况下,以利用了头相关传递函数的信号处理来使声像定位。

据此,在校正再生位置信息的y坐标值为负值的情况下,以利用了惠更斯原理的信号处理来进行波阵面合成,在校正再生位置信息的y坐标值为受听者的位置之前的正值的情况下,以利用了波束成形的信号处理来生成声像,在校正再生位置信息的y坐标值为受听者的位置之后的正值的情况下,以利用了hrtf的信号处理来使声像定位,这样,针对受听者的位置的前方,能够生成就像声源在目标位置上的声学振动,针对受听者的位置的后方,能够再现出在就像从该方向听到了声音的感觉。

并且也可以是,所述音频再生装置包括至少两列的扬声器阵列,所述至少两列的扬声器阵列,至少构成两个二维坐标,在将构成所述至少两列的扬声器阵列中的一列扬声器阵列的扬声器元件的排列方向设为x轴,将与所述x轴正交、且与设置有所述一列扬声器阵列的面的设置面平行的方向设为y轴,将与所述x轴正交、且与所述设置面垂直的方向设为z轴,并且,以所述再生位置信息确定的位置为(x、y、z)时,所述信号处理部按照所述z的值,来对所述至少两列的扬声器阵列进行控制。在所述两个二维坐标平行时,所述信号处理部,在所述z的值比预先规定的值大的情况下,使构成相对于所述设置面为上侧的二维坐标的扬声器阵列的音量增大,在所述z的值比预先规定的值小的情况下,使构成相对于所述设置面为下侧的二维坐标的扬声器阵列的音量增大。在所述两个二维坐标正交时,所述信号处理部,在所述z的值比预先规定的值大的情况下,使构成相对于所述设置面为垂直的二维坐标的扬声器阵列的扬声器元件之中、在预先规定的位置的上方的扬声器元件的音量增大,在所述z的值比预先规定的值小的情况下,使构成相对于所述设置面为垂直的二维坐标的扬声器阵列的扬声器元件之中、在预先规定的位置的下方的扬声器元件的音量增大。

据此,音频再生装置中具备至少两列的扬声器阵列,按照以再生位置信息确定的位置(x、y、z)的z的值,至少两列的扬声器阵列被控制,因此再生位置信息的高度信息也能够被控制,从而能够以高临场感来再生含有三维的再生位置信息的音频对象。

并且也可以是,音频再生装置,对包含有音频信号以及再生位置信息的音频对象进行再生,所述再生位置信息示出使所述音频信号的声像定位的三维空间中的位置,所述音频对象由具有规定的时间间隔的音频帧构成,该音频帧包含有所述音频信号以及所述再生位置信息,所述音频再生装置,在所述再生位置信息缺失的情况下,将过去再生的音频帧中包含的再生位置信息,作为缺失了所述再生位置信息的音频帧的再生位置信息来使用,从而对所述音频对象中包含的音频帧进行再生。

据此,在再生位置信息缺失了的情况下,能够将过去再生的音频帧中包含的再生位置信息作为音频帧的再生位置信息来利用,因此,即使在再生位置信息缺失了的情况下,也能够进行自然的声场再生,或者在音频对象没有发生移动的情况下,能够减少对该音频对象进行记录或传送时的信息量。

并且,作为达成上述课题的其他的实施方式,不仅可以作为上述这种音频再生装置来实现,而且可以作为音频再生方法、执行音频再生方法的程序、以及记录有这些程序的dvd等计算机可读取的记录介质来实现。

发明效果

通过本实施方式所涉及的音频再生装置及其方法,即使在不能自由地设置扬声器的空间,也能够以高临场感来再生包含有三维的再生位置信息的音频对象。

附图说明

图1是示出实施方式中的音频再生装置的构成的图。

图2是示出音频对象的构成的图。

图3是示出扬声器阵列的形状的一个例子的图。

图4a示出了扬声器阵列与二维坐标轴的关系。

图4b示出了其他的方式的扬声器阵列与二维坐标轴的关系。

图5示出了三维的再生位置信息与校正再生位置信息(x,y)的关系。

图6示出了三维的再生位置信息与校正再生位置信息(方向,距离)的关系。

图7示出了校正再生位置信息与信号处理方式的关系。

图8是示出本实施方式的音频再生装置的主要的工作的流程图。

图9是示出本实施方式的音频再生装置的工作中的、与音频帧所包含的再生位置信息的处理有关的工作的流程图。

图10示出了音频对象的位置与信号处理方式的关系。

图11示出了音频对象从头上方通过的情况下的信号处理方式。

图12示出了采用两个扬声器阵列的实施方式的变化例。

图13示出了采用三个扬声器阵列的实施方式的变化例。

图14示出了以往技术中的22.2ch的扬声器设置的一个例子。

图15示出了以往技术中的hrtf原理。

图16示出了以往技术中的波阵面合成以及波束成形的原理。

具体实施方式

以下参照附图对音频再生装置及其方法的实施方式进行说明。

并且,以下将要说明的实施方式均为一个优选的具体例子。以下的实施方式所示的数值、形状、构成要素、构成要素的配置位置以及连接方式、工作顺序等均为一个例子,主旨并非是对本发明进行限定。并且,对于以下的实施方式中的构成要素中的示出本发明的最上位概念的独立权利要求中所没有记载的构成要素,作为构成一个较优选的形态的任意的构成要素来进行说明。

图1是示出本实施方式中的音频再生装置110的构成的图。该音频再生装置110是对包含有音频信号(在此为音频编码信号)以及再生位置信息的音频对象进行再生的音频再生装置,所述再生位置信息示出使所述音频信号的声像定位的三维空间中的位置,所述音频再生装置110包括:音频对象分离部100、设定部101、转换部102、选择部103、解码部104、信号处理部105、以及扬声器阵列106。

在图1中,音频对象分离部100是从由再生位置信息和音频编码信号构成的音频对象中,对再生位置信息与音频编码信号进行分离的处理部。

设定部101是按照设置有扬声器阵列106的位置,来设定假想的二维坐标轴(即,以扬声器阵列106的位置为基准的二维坐标轴)的处理部。

转换部102是将音频对象分离部100所分离的再生位置信息,转换为校正再生位置信息的处理部,该校正再生位置信息是设定部101所设定的二维坐标轴上的位置信息(二维信息)。

选择部103是根据在转换部102生成的校正再生位置信息、设定部101所设定的二维坐标轴、以及接受从扬声器阵列106输出的声音的受听者的位置(或者,该音频再生装置110预定的受听位置),来选择信号处理部105应该选用的信号处理方式的处理部。

解码部104是对音频对象分离部100所分离的音频编码信号进行解码,并生成音频信号(声信号)的处理部。

信号处理部105是按照在转换部102进行转换而得到的校正再生位置,来进行使解码部104通过解码而得到的音频信号的声像定位的处理的处理部,在此,以选择部103所选择的信号处理方式来进行处理。

扬声器阵列106是将所述信号处理部的输出信号(声信号)转换为声学振动的至少一列的扬声器阵列(被排列成列状的多个扬声器元件的组合)。

并且,音频对象分离部100、设定部101、转换部102、选择部103、解码部104、信号处理部105典型地可以通过半导体集成电路等电子电路而在硬件上来实现,也可以通过具备cpu、rom以及ram等的计算机执行程序而在软件上来实现。

以下,对具有以上这种构成的本实施方式中的音频再生装置110的工作进行说明。

首先,音频对象分离部100从由再生位置信息和音频编码信号构成的音频对象中,对再生位置信息与音频编码信号进行分离。音频对象例如具有图2所示的构成。即,音频对象是音频编码信号与再生位置信息的组合,该再生位置信息示出使该音频编码信号的声像定位的三维空间中的位置。通过对这些信息(音频编码信号以及再生位置信息)以具有规定的时间间隔的音频帧为单位进行编码,从而构成音频对象。在此的再生位置信息是三维信息(示出三维空间中的位置的信息),其以扬声器也被设置在天花板作为前提。并且,再生位置信息未必全部以音频帧为单位而被插入,在发生了缺失的音频帧中,通过音频对象分离部100,而采用过去被再生的音频帧中所包含的再生位置信息。这种再生位置信息的再利用能够通过使用音频再生装置110所具备的存储部来实现。

接着,如图2所示,在音频对象分离部100从音频对象中取出再生位置信息和音频编码信号。

并且,设定部101按照被设置有扬声器阵列106的位置,来设定假想的二维坐标轴。扬声器阵列106的概观如图3所示。即,排列有多个扬声器元件。设定部101如图4a所示,按照设置有扬声器阵列106的位置,来设定假想的二维坐标轴(以扬声器阵列的位置为基准的二维坐标轴)。在此,设定部101将构成扬声器阵列106的扬声器元件的排列方向设为x轴,将与x轴正交、且与设置有扬声器阵列106的面的设置面平行的方向设为y轴,将这种xy面作为二维坐标轴来设定。并且,在示出y轴中的位置的y坐标上,扬声器阵列106的背面方向为负坐标,扬声器阵列106的正面方向为正坐标,在x轴中的x坐标上,从扬声器阵列106的中央朝向左右分别被设定为负坐标和正坐标。并且,扬声器阵列也可以不必被设置成直线状,例如图4b所示,也可以被设置成拱形。在图4b中所描绘的每个扬声器单元(扬声器元件)均朝向正面,不过并非必需要这样设置,各个扬声器单元(扬声器元件)的朝向也可以被调整角度而呈放射状设置。

接着,转换部102将上述的三维的再生位置信息转换为作为二维信息的校正再生位置信息。在本实施方式中被设定成图4a以及图4b所示的由x轴以及y轴构成的二维坐标,然而,再生位置信息与具有z轴的三维坐标上的位置相匹配,该z轴与由该x轴以及y轴构成的二维坐标(即设置面)正交。将匹配后的该再生位置信息所示的位置设为(x1,y1,z1)。转换部102将该位置信息转换为二维的位置信息,并生成校正再生位置信息。

将三维的再生位置信息转换为二维的校正再生位置信息,例如以图5所示的方法来进行。在此,如音频对象1所示,在将音频对象1的再生位置信息所示的位置设为(x1,y1,z1),则与其对应的校正再生位置信息所示的位置为(x1,y1)。另外,关于校正再生位置信息所示的位置,如音频对象2所示,虽然与再生位置信息所示的位置(x2,y2,z2)对应,但也可以不必是与x坐标值以及y坐标值相同的位置(x2,y2)。例如,图5中的校正再生位置信息2示出的位置(x2,y2×α)所示,可以通过将1以上的值α(规定值)与x坐标值以及y坐标值的至少一方相乘,来使实际上的再生位置信息所指示的值成为一个大的值,从而再现出宽广的音响空间。在此例中,由于y轴方向的值被夸张,因此能够期待得到纵深方向的空间被扩大的音响效果。相反,x轴坐标也可以按照扬声器阵列106的宽度限制而乘以一个比1小的值β(规定值)(图5中未图示)。即,x坐标值可以受到扬声器阵列106的宽度的限制(也可以是扬声器阵列106的宽度范围内的值)。

作为将三维的再生位置信息转换为二维的校正再生位置信息的其他的方法,可以是图6所示的方法。即,作为校正再生位置信息,可以被转换为从受听者的角度来观察到的音频对象(再生位置信息所示的位置)的方向和距离的信息。即,校正再生位置信息可以是极坐标,该极坐标是指,示出从接受扬声器阵列106输出的声音的受听者的位置来观察到的再生位置信息所示的位置的方向角、以及从受听者的位置到再生位置信息所示的位置的距离。在音频对象1的例子中,当音频对象1的再生位置信息为(x1、y1、z1)时,将从受听者的位置来观察时的位置(x1、y1、z1)的方向角设为θ1、将从受听者的位置到位置(x1、y1、z1)的距离设为r1时,与其对应的校正再生位置信息1由(θ1、r1’)来表示。在此,r1’是依存于r1而被确定的值。并且,在音频对象2的例子中,当音频对象2的再生位置信息为(x2、y2、z2)时,将从受听者的位置来观察时的位置(x2、y2、z2)的方向角设为θ2、将从受听者的位置到位置(x2、y2、z2)的距离设为r2,与其对应的校正再生位置信息2则由(θ2、r2’)来表示。在此,r2’是依存于r2而被确定的值。这是在由校正再生位置信息的极坐标来进行表示时,在将hrtf用作声像定位的方法的情况下,hrtf的滤波系数以针对受听者的方位的信息作为线索而被设定,这能够使信号处理变得简单。

并且,在图6中也可以进行如下的控制,r1’虽然是按照r1而被决定的,但是当θ1越接近于0°时,则使r1’的值越接近于r1,在θ1接近于90°时,则使r1’成为比r1小的值。

并且,信号处理部105也可以以仿佛从校正再生位置信息所示的位置的方向能够听到声音的方式来进行设定,并采用hrtf来进行使声像定位的处理。据此,能够对从受听者来听时声源存在于哪个方向以及相距的距离进行控制。并且,信号处理部105也可以按照受听者的位置与校正再生位置信息所示的位置的距离(r1’、r2’等)来调整音量。据此,能够进行反映了从受听者来听时的与声源的距离的再生。

接着,选择部103根据在转换部102生成的校正再生位置信息、设定部101所设定的二维坐标轴、受听者的位置(或者,该音频再生装置110预先规定的受听位置),来选择在信号处理部105应该选用的信号处理方式。图7示出了其中的一个例子。例如,针对音频对象1(在校正再生位置信息的y坐标值为,受听者的位置之前的正值的情况下),通过波束成形而将声像合成到校正再生位置信息1的位置。这是在声源的再生位置为扬声器阵列106的前方、且受听者的前方的情况下,能够通过波束成形来结成声像的缘故。并且,例如针对音频对象2(在校正再生位置信息的y坐标值为负值的情况下),根据将校正再生位置信息2的位置作为声源的惠更斯(huygens)原理,来进行波阵面合成。这是因为在声源的再生位置为扬声器阵列106的后方的情况下,能够通过波阵面合成,来制作出仿佛声源就存在于此处的音响效果。并且,例如针对音频对象3(在校正再生位置信息的y坐标值为,受听者的位置之后的正值的情况下),通过利用头相关函数(hrft)来进行仿佛能够从校正再生位置信息3所示的方向(θ1)听到声音的声像定位。这是因为在声源的再生位置为受听者的后方的情况下,波束成形或波阵面合成不能发挥效果,所以选择头相关函数(hrft)的方法。在采用hrtf的情况下,虽然能够高精度地再现方向,但不能再现距离感,因此可以按照到声源的距离r1来进行音量的控制等。

并且,音频对象分离部100所分离的音频编码信号,由解码部104被解码为音频pcm信号。这可以使用音频编码信号的编解码方式中的解码器。

这样被解码的音频pcm信号,在信号处理部105中以由选择部103选择的信号处理方式而被处理。即,信号处理部105在校正再生位置信息的y坐标值为负值的情况下,以利用了惠更斯原理的信号处理来进行波阵面合成,在校正再生位置信息的y坐标值为受听者的位置之前的正值的情况下,以利用了波束成形的信号处理来生成声像,在校正再生位置信息的y坐标值为受听者的位置之后的正值的情况下,以利用了hrtf的信号处理来使声像定位。

并且,在本实施方式中,信号处理方式虽然采用了波束成形、波阵面合成、以及hrtf的任一个,不论是哪个信号处理方式,作为更具体的实现方法,可以采用以往的信号处理方式。

最后,扬声器阵列106将从信号处理部105的输出信号(声信号)转换为声学振动。

图8是示出本实施方式的音频再生装置110的主要的工作的流程图。

首先,音频对象分离部100从音频对象中,对三维的再生位置信息与音频编码信号进行分离(s10)。

接着,转换部102将音频对象分离部100所分离的三维的再生位置信息,转换为校正再生位置信息,该校正再生位置信息是以扬声器阵列106的位置为基准的二维坐标轴上的位置信息(二维信息)(s11)。

接着,选择部103根据在转换部102生成的校正再生位置信息、设定部101所设定的二维坐标轴、以及接受从扬声器阵列106输出的声音的受听者的位置(或者,该音频再生装置110预定的受听位置),选择在信号处理部105应该选用的信号处理方式(s12)。

最后,信号处理部105按照在转换部102的转换而得到的校正再生位置,进行使在音频对象分离部100被分离、且在解码部104被解码的音频信号的声像定位的处理(s13)。此时,信号处理部105以选择部103所选择的信号处理方式来进行处理。

据此,由于音频对象中所包含的三维的再生位置信息被转换为以扬声器阵列的位置为基准的二维坐标轴上的校正再生位置信息,并能够按照校正后的校正再生位置信息来使声像定位,因此,即使在扬声器设置受到限制的情况下,也能够以高临场感来再生音频对象。

并且,在图8中作为主要的工作步骤示出了四个步骤s10~s13,作为最低限的步骤,只要转换步骤s11和信号处理步骤s13被执行即可。通过这两个步骤,由于三维的再生位置信息被转换为二维坐标轴上的校正再生位置信息,因此,即使在不能自由地设置扬声器的空间中,也能够以高临场感来再生包含有三维的再生位置信息的音频对象。

并且,相反而言,作为本实施方式的音频再生装置110的工作,除了图8所示的步骤s10~s13之外,还可以添加设定部101的工作、以及解码部104的工作。

图9是示出本实施方式的音频再生装置110的工作之中的、与音频帧中所包含的再生位置信息的处理有关的工作的流程图。在此,示出了按照每个音频对象所包含的音频帧来进行与再生位置信息有关的工作。

音频对象分离部100判断处理对象的音频帧中是否缺失再生位置信息(s20)。

当判断结果为再生位置信息缺失了的情况下(s20的“是”),通过音频对象分离部100,将过去再生的音频帧中包含的再生位置信息作为处理对象的音频帧的再生位置信息来使用,并按照该再生位置信息(进行了向二维的校正再生位置信息的转换等之后),在信号处理部105进行信号处理(s21)。

另外,在判断为再生位置信息没有缺失的情况下(s20的“否”),通过音频对象分离部100,处理对象的音频帧中所包含的再生位置信息被分离,按照该再生位置信息(进行了向二维的校正再生位置信息的转换等之后),在信号处理部105进行信号处理(s22)。

据此,即使在再生位置信息发生了缺失的情况下,也能够利用过去再生的音频帧中包含的再生位置信息来进行自然的声场再现,或者在音频对象没有变动时能够减少对该音频对象进行记录或传输时的信息量。

并且,关于图8以及图9的流程图及其变形例所涉及的顺序,能够作为描述该顺序的程序来实现,并能够通过处理器来执行。

并且,在本实施方式中,按照校正再生位置信息,从三个信号处理方式中选择了一个方法。图10的(a)是对其进行了整理的图。当校正再生位置信息为扬声器阵列的后方的情况下,通过惠更斯(huygens)原理来进行波阵面合成,在位于扬声器阵列的前方且受听者的前方的情况下,采用波束成形的方法,在受听者的后方的情况下采用头相关传递函数(hrtf)的方法。图10的(b)示出了在音频对象(音频对象中包含的再生位置信息所示的位置)随着时间移动的情况下,在各自的边界线附近的信号处理方式。例如,在校正再生位置信息位于扬声器阵列的排列附近的情况下,信号处理部105来生成以规定的比例对利用了波阵面合成的方法的输出信号与利用了波束成形的方法的输出信号进行混合了的信号。同样,在受听者附近,信号处理部105生成以规定的比例对利用了波束成形的方法的输出信号与利用了hrtf的方法的输出信号进行混合了的信号。

并且,在本实施方式中,虽然按照校正再生位置信息,从三个信号处理方式中选择了一个方法,不过对于hrtf的方法而言,不论校正再生位置信息处于哪个位置都可以选择。这是因为,在通过惠更斯(huygens)原理来进行波阵面合成中,不能将声像定位到扬声器的前方,而在波束成形中,不能将声像定位到扬声器的后方或听者的后方,而头相关传递函数(hrtf)能够利用两耳间的相位差信息或声压差信息,而且能够模拟头部周围的声音传递特性,因此不论哪种控制都能够进行。图11示出了在音频对象(音频对象中包含的再生位置信息所示的位置)从听者的头上方通过的情况下,通过hrtf算出的位置信息的轨迹。而且,在音频对象(音频对象所包含的再生位置信息示出的位置)逼近听者的头上方时,则控制成能够在头部的周围环绕。据此,能够提高头上方周边的临场感。

并且,在实施方式中虽然没有对z轴方向的控制进行说明,通过有关上下方向的定位启示,活用头部周边的声音传递函数的振幅谱中所包含的研究成果(专利文献1),也可以将该要素添加到hrtf中。

并且,关于z轴方向的控制,也可以通过采用多个扬声器阵列来构成多个平面,从而对z轴方向进行控制。图12示出了利用两个扬声器阵列106a以及106b的变形例,图13示出了利用三个扬声器阵列106a~106c的变形例。

在图12以及图13所示的例子中,音频再生装置具备至少两列的扬声器阵列,这些至少两列的扬声器阵列至少构成两个二维坐标,在以再生位置信息确定的位置为(x、y、z)时,信号处理部105按照上述的z的值,来对至少两列的扬声器阵列进行控制。具体而言,在上述两个二维坐标平行时,信号处理部105在上述z的值比预先规定的值大(或者以上)的情况下,使构成了相对于xy面(设置面)为上侧的二维坐标的扬声器阵列的音量增大,在上述z的值比预先规定的值小(或者以下)的情况下,使构成了相对于xy面(设置面)为下侧的二维坐标的扬声器阵列的音量增大。

另外,在上述两个二维坐标正交时,信号处理部105在上述z的值比预先规定的值大(或者以上)的情况下,使构成了相对于xy面(设置面)为垂直的二维坐标的扬声器阵列的扬声器元件之中的、位于预先规定的位置的上方的扬声器元件的音量增大,在上述z的值比预先规定的值小(或者以下)的情况下,使构成了相对于xy面(设置面)为垂直的二维坐标的扬声器阵列的扬声器元件之中的、位于预先规定的位置下方的扬声器元件的音量增大。

这样,在音频再生装置110具备至少两列的扬声器阵列的情况下,通过按照以再生位置信息确定的位置(x、y、z)的z的值,来控制这至少两列的扬声器阵列,从而能够控制再生位置信息的高度信息,因此能够以高临场感来再生包含有三维的再生位置信息的音频对象。

如以上所述,本实施方式中的音频再生装置110具备:将声信号转换为声学振动的至少一列的扬声器阵列106、将三维的再生位置信息转换为以扬声器阵列106的位置为基准的二维坐标轴上的位置信息(校正再生位置信息)的转换部102、以及按照校正再生位置来进行使音频对象的声像定位的处理的信号处理部105,通过具备这些功能部,即使在不能将扬声器设置到天花板等不能自由地设置扬声器的环境中,也能够针对伴随有三维的再生位置信息的音频对象,以尽可能的良好的临场感来进行再生。

以上基于实施方式对本发明所涉及的音频再生装置进行了说明,不过,本发明所涉及的音频再生装置并非受这些实施方式所限。在不脱离本发明的主旨的范围内,也可以将本领域技术人员所能够想到的各种变形执行于本实施方式,或者可以对不同的实施方式中的构成要素进行组合来构成。

并且,在本实施方式虽然具备设定部101,当扬声器阵列的设置位置以预先被确定的情况下,当然也可以不需要设定部101。

并且,在本实施方式虽然将受听者位置信息输入到了选择部103,在受听者的位置被预先确定、或者作为受听者的位置而预先设定的本装置的位置以被固定的情况下,当然可以不进行受听者位置信息的输入。

或者,在信号处理方式被固定的情况下(例如,决定为通常以hrtf来进行处理的情况下),当然也可以不具备选择部103。

并且,在本实施方式中虽然具备了解码部104,在音频编码信号为单纯的pcm信号的情况下,即,音频对象中包含的音频信号没有被编码的情况下,当然也可以不具备解码部104。

并且,在本实施方式中虽然具备了音频对象分离部100,在被输入到音频再生装置110的音频对象为音频信号与再生位置信息已被分离的结构的情况下,当然可以不具备音频对象分离部100。

并且,扬声器阵列的扬声器元件也可以不设置成直线状,例如可以设置成拱形。并且,扬声器元件的间隔也可以是不均等的。在本发明中不对扬声器阵列的形状进行限定。

工业实用性

本发明所涉及的音频再生装置作为具备扬声器阵列的音频再生装置,由于即使在不能将扬声器设置成三维的空间中,也能够以高临场感来再生包含有三维的位置信息的音频对象,因此能够广泛地利用到对音频信号进行再生的设备中。

符号说明

100音频对象分离部

101设定部

102转换部

103选择部

104解码部

105信号处理部

106、106a~106c扬声器阵列

110音频再生装置

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1