一种3d混音方法及装置的制造方法

文档序号:9814933阅读:863来源:国知局
一种3d混音方法及装置的制造方法
【技术领域】
[0001 ]本发明涉及3D混音技术领域,尤其涉及一种3D混音方法及装置。
【背景技术】
[0002]在多人参与的电话会议中,每个人经电话麦克风采集到的信号都是单声道的。简单的将所有人的声音混合,会有一些问题:首先,在多个人同时讲话的场景下,互相叠加的声音会对听音者造成听觉和理解上的困难;其次,没有个方位信息的混音会缺乏临场感。但是如果引入3D混音,这些问题就会得到解决。HRTF卷积是一种适应性很好的3D混音方法,将单声道音频信号与指定的HRTF函数卷积,就可以获得能够用耳机重放的立体声,混音让听音者通过耳机重放,听音者才能感觉到每一个说话人都在自己身边的不同位置上。在现有技术中,对于处理有N个人参加会议的3D混音方法,对于每一个人来说,其他N-1个人都是说话人,而自己是唯一的听音者,为了让每一个人听到3D混音后的效果,必须指定N-1对HRTF并且用它们与其他每一个人的声音信号卷积。由于对每一个人来说,其他所有人都分布在不同的位置,因此,为了让所有人听到3D效果,就要有N*(N-1)对HRTF卷积。也就是现有技术中HRTF卷积方法的计算量需要N的平方的数量级,计算复杂。

【发明内容】

[0003]本发明的目的在于提供一种3D混音方法,旨在解决现有的3D混音中HRTF卷积时,计算量复杂的问题。
[0004]本发明提供的一种3D混音方法,方法包括以下步骤:
[0005]设置公共听音位置;
[0006]确定声源到达公共听音位置的传输路径;
[0007]将声源对应的音频信号与传输路径对应的头相关传输函数HRTF进行卷积;
[0008]将所有卷积后的结果叠加得到3D混音信号。
[0009]进一步的,确定所有发声位置达到所述公共听音位置的传输路径,包括:
[0010]根据声源到达公共听音位置的直达路径和反射路径确定所有传输路径。
[0011]进一步的,将所有卷积后的结果叠加得到3D混音信号,之前还包括:
[0012]将卷积后的结果做衰减和延时处理。
[0013]进一步的,将所有卷积后的结果叠加得到3D混音信号,具体为:
[0014]将所有做衰减和延时处理后的卷积结果叠加得到3D混音信号。
[0015]进一步的,将所有卷积后的结果做衰减和延时处理,具体为将卷积后的结果乘以衰减系数,并根据延迟时间对卷积后的结果进行延时处理,所述衰减系数decay = 0.5*log2(L/Ld),所述延迟时间delay= (Ld-L)/v,其中所述L表示反射路径的路径总长,所述Ld表示直达路径的路径总长,所述V表示声音速度。
[0016]本发明还提供了一种3D混音装置,该装置包括:
[0017]设置模块,用于设置公共听音位置;
[0018]确定模块,用于确定声源到达所述公共听音位置的传输路径;
[0019]卷积模块,用于将声源对应的音频信号与传输路径对应的头相关传输函数HRTF进行卷积;
[0020]叠加模块,用于将所有卷积后的结果叠加得到3D混音信号。
[0021]进一步的,确定模块,还具体用于:
[0022]根据声源到达公共听音位置的直达路径和反射路径确定所有传输路径。
[0023]进一步的,3D混音装置还包括:
[0024]衰减和延迟模块,用于将卷积后的结果做衰减和延时处理。
[0025]进一步的,卷积模块,还用于:
[0026]将所有做衰减和延时处理后的卷积结果叠加得到3D混音信号。
[0027]进一步的,衰减和延时模块,还用于将卷积后的结果乘以衰减系数,并根据延迟时间对卷积后的结果进行延时处理;
[0028]所述衰减系数decay = 0.5*log2(L/Ld),所述延迟时间(^137=(1^(1-1^)八,其中所述L表示反射路径的路径总长,所述Ld表示直达路径的路径总长,所述V表示声音速度。
[0029]本发明的3D混音方法及装置有益效果:本发明的3D混音方法设置公共听音位置,让3D混音中将声源对应的音频信号与传输路径对应的头相关传输函数HRTF进行卷积时,HRTF卷积方法的计算量为N的数量级,大大减少了运算量。
【附图说明】
[0030]图1是本发明一实施例提供的一种3D混音方法的流程示意图;
[0031]图2是本发明一实施例提供的声源A到达公共听音位置T处的几条主要传输路径示意图;
[0032]图3是本发明又一实施例提供的3D混音方法的流程示意图;
[0033]图4是本发明一实施例提供的一种3D混音装置。
【具体实施方式】
[0034]为了使本发明的目的、技术方案及优点更加清楚明白,下面结合附图和【具体实施方式】对本发明作进一步详细说明。
[0035]图1是本发明一实施例提供的一种3D混音方法的流程示意图,参考图1,本发明实施例的3D混音方法,包括以下步骤:
[0036]步骤SlOl,设置公共听音位置。
[0037]在3D混音技术中,由于是虚拟混音,每一个人说话和听音在不同的位置进行,这样的设定是可行的。例如,对于参会者A,他在As处说话而在Al处听音;对于参会者B,他在Bs处说话在BI处听音,等等。现在取所有人的听音位置相同,假设在T处,也就是A1,B1以及其他人的听音位置都是同一个地方T处,那么不管是参会者A,还是参会者B,在听音的时候,说话人相对于T处位置都是相同的。
[0038]步骤S102,确定声源到达公共听音位置的传输路径。
[0039]包括:根据声源到达公共听音位置的直达路径和反射路径确定所有传输路径。
[0040]图2是本发明一实施例提供的声源A处到达公共听音位置T处的几条主要传输路径示意图。参考图2,参会者A实际上说话时,声音达到公共听音位置T处的传输路径有无数条,先确定几条主要的承载绝大部分声音能量的传输路径,比如在一个长方体的房间里,长方体有六个面:U1U2U3U4、U5U6U7U8、U1U2U7U8、U3U4U5U6、U1U4U6U7、U2U3U5U8。假设参会者 A(也即说话者)位置为U1U2U3U4对应的中心为位置,公共听音位置T设置在面U5U6U7U8的中心,K、M、Q、P分别为面U1U2U7U8、U3U4U5U6、U1U4U6U7、U2U3U5U8的中心。则参会者A说话的声音从A处传输到公共听音位置T处,有5条主要的路径,声源A处到达公共听音位置T处的直达路径AT,声源到达公共听音位置的反射路径有:从左侧面反射的路径AKT、从右侧面反射的路径AMT、从下面反射的路径APT、从上面反射的路径AQT。依此方法,还可以测出其他的一些路径,比如从A处经过左侧面反射到右侧面、再从右侧面反射到达T处的路径,或声音从A处经过下面反射到上面、再从上面反射到达T处的路径,或声音从A处经过左侧面反射到右侧面、再从右侧面反射到左侧面、再从左侧面反射到达T处,等等,其他的路径就不一一列举。但是,由于直达路径AT、反射的路径AKT、AMT、APT、AQT这5条传声路径承载了绝大部分的声音能量,因此,考虑房间混音是只需要考虑他们就可以了。
[0041]刚才列举的例子,是一个有规则的长方体的环境中,在其他的环境中也同样可以确定声源到达公共听音位置的传输路径。包括:根据声源到达公共听音位置的直达路径和反射路径确定所有传输路径。
[0042]依上面的实施例也可以确定其他参会者(说话者)到公共听音位置的传输路径,包括:根据声源到达公共听音位置的直达路径和反射路径确定所有传输路径,也不限于只是在长方体的环境中的所有从声源到达公共听音位置的传输路径。
[0043]步骤S103,将声源对应的音频信号与传输路径对应的头相关传输函数HRTF进行卷积。
[0044]从步骤S102中确定了每个声源到达公共听音位置的传输路径,也就能找到相应的传输路径对应的头相关传输函数HRTF,本发明实施例的3D混音方法将声源对应的音频信号与传输路径对应的头相关传输函数HRTF进行卷积,从而得到相应的3D虚拟混音信号。
[0045]本发明实施例中,HRTF函数是通过查找HRIR表,HRIR表示根据声源位置相对于听音者的正前方方向的角度来查找的。HRTF表征的是声源相对于听音者正前方方向的角度。这个角度表述为一个2维向量<x,y>其中X指水平角度,y指俯仰角度,取值范围都是0-360度。例如〈30,60>指的是声源位置在听音者正前方偏左30度,偏上60。注意偏左90度是正左方,180是后方,270是正右。同理偏上90度是正上,270度是正下。而HRIR表的获取方法可以通过实验用人工头耳内录音获取。例如在距离人工头单位长度的远近,角度为〈X,y>的地方发出一个脉冲声音,记录下左右耳的响应,得到HRIR表的第m行k列的HRTF。依次测完所有需要的〈X,y>,做成了一个表,就是HRIR表。例如,以一度为单位来测量,就得到360行360列的表,那么对应角度〈X,y>的HRTF就在表的X行y列(当然实际上不需要这么多)。查表时,就只需要知道角度<x,y>,直接找到对应表中相应位置的HRTF就可以了。实际中,如果表中没有〈x,y>的HRTF,则需要用
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1