一种5-2通道音频转换优化方法与流程

文档序号:14281803阅读:682来源:国知局
一种5-2通道音频转换优化方法与流程

本发明涉及音频处理技术领域;特别涉及一种5-2通道音频转换优化方法,该方法采用相关性抑制和空间信息校正处理减少下降混合之后的音色失真和空间信息损失,以保持原音频良好的听音感受。



背景技术:

随着数字信号处理技术和高性能计算机的快速发展,虚拟现实(vr)技术已成为目前被广泛研究的热门课题,其中的3d音频技术也吸引了越来越多的研究。尽管3d音频有多种创建方法(例如,多通道的方法和基于对象的方法),目前在vr中最常用的还是用耳机进行重放。要在现有的vr设备环境中重现3d音频内容,一种多通道到双声道下降混合的技术就亟需解决。

目前,一些多通道到双声道的下降混合方法已经被提出(见参考文献[1]:kubalopatka,etal.:novel5.1downmixalgorithmwithimproveddialogueintelligibility.audioengineeringsociety.(2013));如itu推荐的方法(见参考文献[2]:itu:itu-rrecommendationbs.775-1,multichannelstereophonicsoundsystemwithandwithoutaccompanyingpicture.(1994))、杜比定向逻辑(见参考文献[3]:digitalaudiocompressionstandard(ac-3,e-ac-3).(2010));以及矩阵下降混合的方法(见参考文献[4]:c.fallerandp.schillebeeckx:improvedituandmatrixsurrounddownmixing.audioengineeringsociety.(2011))等。

在这些传统的方法中,通常利用固定的公式将不同的通道进行组合,这种处理方式会导致下降混合后的声音的音色失真和空间信息缺失。例如矩阵下降混合方法的实现过程可以由下式给出:

l=fl+0.7071·c+j·(cosα·ls+sinα·rs)(1)

r=fr+0·7071·c-j·(sinα·ls+cosα·rs)(2)

其中j代表90度相移、α通常为30-35度。

在传统的下降混合方法中,频谱和音色的变化主要由以下原因引起:下降混合公式的前两项(即,公式(1)中的fl和c,公式(2)中的fr和c)可能具有内容相似但具有相移的信号成分,这就会导致在下降混合之后的信号中产生梳状滤波现象,由此导致了频谱和音色的失真。另一方面传统的下降混合方法采用固定系数和混合公式将五个通道的信号混合到两个输出通道中,原信号中的空间位置信息就会体现在下降混合之后信号的振幅和相位特性中,由于忽视了原有信号的中的已经存在的空间位置关系,就可能导致下降之后的信号中的空间信息内容受损。



技术实现要素:

本发明的目的在于为了解决现有技术中多通道到双声道下降混合方法中存在的上述问题,基于相关性抑制和空间信息校正,提出了一种5-2通道音频转换优化方法;该方法在相关性抑制处理部分,通过抑制前方两个通道混合时两者的相关部分达到减少梳状滤波从而减少音色失真的目的;在空间校正处理中,将五通道的声场和两通道的声场进行归一化的映射,通过比较两者的差异对两通道声场的通道间幅度差(inter-channelleveldifference,icld)和通道间相位差(inter-channelphasedifference,icpd)特性进行修正,使其声场更接近与五通道声场,从而保持原有的良好空间听觉感受。通过观察下降混合信号的频谱图和非正式的测听实验可以证明该方法非常有效。

为了实现上述目的,本发明提供了一种5-2通道音频转换优化方法,所述方法包括:

步骤1)将五通道音频下降混合到两通道;

步骤2)在频域上将五通道音频以及两通道音频的声场进行归一化映射,得到两者声场的方向向量表示;

步骤3)利用归一化之后两个方向向量的差值对两通道音频的幅度和相角进行校正;

步骤4)将校正之后的双通道信号的幅度和相角重新组合形成每个频带内的复数值,然后再转换成时域信号,得到处理后两通道音频。

上述技术方案中,所述步骤2)具体包括:

步骤2-1)将原始5.1通道信号映射到了归一化的二维平面上;

其中,后方左通道坐标(xls,yls)被分配到原点,后方右通道坐标(xrs,yrs)被分配到(0,1),前方右通道坐标(xr,yr)被分配给(1,1),前方左通道坐标(xl,yl)被分配到(0,1),中间通道坐标(xc,yc)被分配到(0.5,1);二维平面的声像位置矢量p(f)用下列矢量方程表示:

p(f)=ml(f)*(xl,yl)+mr(f)*(xr,yr)+mc(f)*(xc,yc)

+mls(f)*(xls,yls)+mrs(f)*(xrs,yrs)(6)

其中,ml(f)、mr(f)、mc(f)、mls(f)和mrs(f)分别为前方左通道、前方右通道、中间通道、后方左通道和后方右通道的归一化幅度值;

步骤2-2)将下降混合的双通道信号映射到了归一化的二维平面上;

下降混合之后的双通道信号的映射坐标计算公式为:

其中,xd(f)和yd(f)分别为双通道信号映射到二维平面上的x轴和y轴坐标值,|dl(f)|和|dr(f)|分别为左通道和右通道的各频带的幅值,arg(dl(f))和arg(dr(f))分别为左通道和右通道的各频带的相角。

上述技术方案中,所述步骤3)的具体实现过程为:

其中,|dl‘(f)|、|dr‘(f)|和arg(dl‘(f))、arg(dr‘(f))分别是校正之后左右通道的幅值和相位,px(f)和py(f)为p(f)的x坐标和y坐标。

上述技术方案中,所述步骤4)的具体实现过程为:

其中,j2=-1,表示校正之后的双通道信号的左右通道信号频域值;

转换成时域信号,得到处理后的双通道音频。

本发明的优势在于:

1、通过本发明的方法得到的双声道的声场更接近五通道声场,从而保持原有的良好空间听觉感受;

2、经过本发明的方法处理得到的下降混合后的两通道音频在音色以及空间信息准确性方面优于传统的方法。

附图说明

图1为本发明的5-2通道音频转换优化方法的流程图;

图2为5.1通道信号映射的二维平面;

图3为双通道信号映射的二维平面。

具体实施方式

下面结合附图和具体实施例对本发明做进一步详细的说明。

如图1所示,一种5-2通道音频转换优化方法,所述方法包括:

步骤1)将五通道音频下降混合到两通道;

在本实施例中,采用增加相关性抑制处理的矩阵下降混合方法将五通道音频下降混合到两通道,该方法属于现有技术;相关性抑制处理部分主要用于使下降混合后信号的频谱和音色失真最小。由于在公式(1)中的前两项具有一定的相关性的,在其相加的时候应该进一步处理,来减少频谱和音色的失真。相关性抑制处理的基本思想是抑制两个通道中的相关部分,通过一个滤波器分离出两者的相关部分和不相关部分,然后在混合处理中去除其中一个通道中的两者相关部分,同时为了保持整体能量不变,需要一个均衡因子对整体能量进行控制。

步骤2)在频域上将五通道音频以及两通道音频的声场进行归一化映射,得到两者声场的方向向量表示;

空间信息校正处理部分主要用于检测每个频带在下降混合中出现的空间信息错误。通过修改下降混合之后信号的每个频带中icld和icpd特征,可以使下降混合信号的空间信息与原始信号一致。为了比较原始5.1通道信号和下降混合的双通道信号的空间信息特征,可以将这两个信号映射到的归一化的二维平面上。

步骤2)具体包括:

步骤2-1)将原始5.1通道信号映射到了归一化的二维平面上;

5.1通道信号表示为一个归一化的位置矢量,其映射平面可表示为以左右位置为横轴以前后位置为纵轴的二维平面。如图2所示,后方左通道坐标(xls,yls)被分配到原点,后方右通道坐标(xrs,yrs)被分配到(0,1),前方右通道坐标(xr,yr)被分配给(1,1),前方左通道坐标(xl,yl)被分配到(0,1),中间通道坐标(xc,yc)被分配到(0.5,1)。这些坐标都是由扬声器在物理空间中的位置确定的。

二维平面上的声像的位置矢量p(f)可以在每个频带中进行计算,可以用下列矢量方程表示:

p(f)=ml(f)*(xl,yl)+mr(f)*(xr,yr)+mc(f)*(xc,yc)

+mls(f)*(xls,yls)+mrs(f)*(xrs,yrs)(6)

其中,即ml(f)、mr(f)、mc(f)、mls(f)和mrs(f)分别为前方左通道、前方右通道、中间通道、后方左通道和后方右通道的归一化幅度值。因此,在每个频带中可以用位置矢量p(f)来表示声像的位置。

步骤2-2)将下降混合的双通道信号映射到了归一化的二维平面上;

对于下降混合之后的双通道信号,icld和icpd的特征常用于对声场的表示。如图3中,下降混合之后的声场可以映射到归一化的二维平面,其中icld特性被映射到x轴,icpd特性被映射到y轴。

下降混合之后的双通道信号的映射坐标计算可以用下面的公式计算得出:

其中,xd(f)和yd(f)分别为双通道信号映射到二维平面上的x轴和y轴坐标值,|dl(f)|和|dr(f)|分别为左通道和右通道的各频带的幅值,arg(dl(f))和arg(dr(f))分别为左通道和右通道的各频带的相角。

步骤3)利用归一化之后两个方向向量的差值对两通道音频的icld和icpd特性进行校正;

通过xd(f)与p(f)的x坐标的每个频带的偏差对icld的进行校正,通过yd(f)与p(f)的y坐标的每个频带的偏差对icpd的进行校正。如下式:

其中,|dl‘(f)|、|dr‘(f)|和arg(dl‘(f))、arg(dr‘(f))分别是校正之后左右通道的幅值和相位,px(f)和py(f)为p(f)的x坐标和y坐标。

步骤4)将校正之后的双通道信号的幅度和相角重新组合形成每个频带内的复数值,如下式:

其中,j2=-1,表示校正之后的双通道信号的左右通道信号频域值,然后再转换成时域信号,得到处理后的两通道音频。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1