双通路立体声信号模拟5.1通路环绕声的信号处理方法

文档序号:7623869阅读:305来源:国知局
专利名称:双通路立体声信号模拟5.1通路环绕声的信号处理方法
技术领域
本发明涉及立体声和环绕声技术领域,尤其是涉及一种从双通路立体声节目信号模拟5.1通路环绕声的信号处理方法。
背景技术
目前5.1通路系统已被推荐为环绕声的国际标准,并已被广泛应用于DVD、家庭影院等声重发。它采用前方左L、中C、右R以及左环绕LS、右环绕RS共五个独立的全频带通路及扬声器,再加上一路可选择的低频效果通路LFE。与普通双通路立体声比较,5.1通路环绕声在前方添加一个中置扬声器,可以达到改善前方声像的稳定性,扩大听音区域的目的;而两个环绕通路除了提供一定的侧向与后方声像之外,更重要的是提供环境声学信息(主观包围感觉)。
虽然5.1通路环绕声的重发效果较传统的双通路立体声有较大的改善,但5.1通路环绕声需要专门为其录制的声音节目源。尽管现在已有大量专为5.1通路环绕声录制的节目,但现存的许多声音节目源是原先为普通双通路立体声录制的,这些双通路立体声节目具有非常重要的艺术和历史价值,它们是不可重录的。如果将它们直接在5.1通路环绕声设备上重发,则浪费了硬件设备的资源。因此将现有的双通路立体声节目源转换为5.1通路环绕声节目是一个非常有现实意义的问题。
双通路立体声节目源转换为5.1通路环绕声节目可在节目制作阶段进行,也可在声音重发阶段进行。通常的双通路立体声信号包含有前方的声像(如乐器)的定位信息,并同时混合有环境声(如反射声)的空间信息。
在现有的将双通路立体声信号转换为5.1通路环绕声信号的转换技术以及上世纪70年代所研究的将双通路立体声节目转换为四通路立体声节目的技术中,环绕通路的环境声学信息信号模拟通常是有以下几种方法1)利用人工混响的方法产生环境声学信息,给倾听者带来在“人工产生”的环境声学的空间听觉感受。但这种方法可能会使得虚拟出来的环境信息与实际的录音条件不相符,且可能会受听音环境影响。
2)考虑到原始双通路立体声信号中,左、右通路信号之差(S=L0-R0)含有较多的环境声学信息,可作为环绕通路的信号。但为了获得良好的主观包围感觉,并且不影响前方的声像定位,需要对环绕通路的信号进行进一步的处理。
3)有研究提出采用自适应信号处理和盲信号分离的方法,通过计算原始双通路信号之间的相关性,取相关性较小的部分信号作为环境声学信息信号。这类方法的效果较好,但算法较为复杂。

发明内容
本发明的目的就是为解决上述现有技术中存在的缺陷,提供一种从双通路立体声节目信号模拟5.1通路环绕声的信号处理方法。该方法的信号处理较为简单,可在重发中获得好的主观包围感。
本发明的目的通过如下技术方案实现一种从双通路立体声节目信号模拟5.1通路环绕声的信号处理方法,包括如下步骤第一步输入原始的双通路左、右立体声频域信号L0、R0;第二步对第一步输入的原始的双通路左、右立体声信号L0、R0处理,产生5.1通路环绕声的前方三通路信号L、R、C;第三步环境声学信息信号的提取;将原始的双通路左、右立体声信号L0、R0之差(L0-R0)经传输函数为Band(ω)可调的带通滤波处理,得到信号SB=(L0-R0)Band(ω),然后对信号SB进行的延时处理,得到代表环境声学信息的信号SW;第四步环境声学信息信号的去相关处理;将第三步所得到的SW信号分别经过355Hz的低通滤波器、中心频率分别为500Hz、1000Hz、2000Hz、4000Hz倍频程带通滤波器、5600Hz的高通滤波器,分解为六个子带的信号S1、S2、S3、S4、S5、S6;分别对所述六个子带信号进行随机延时处理,将每个子带信号分解为不同随机延时的一对信号,包括(S1L,S1R)、(S2L,S2R)、(S3L,S3R)、(S4L,S4R)、(S5L,S5R)、(S6L,S6R)六对信号;再分别将S1L、S2L、S3L、S4L、S5L、S6L信号混合相加,将S1R、S2R、S3R、S4R、S5R、S6R信号混合相加,得到一对去相关环绕声信号LS和RS,并分别馈给左、右环绕扬声器重发。
所述第三步中对原始的双通路左、右立体声信号L0、R0之差(L0-R0)经传输函数为Band(ω)可调的带通滤波处理,就是将(L0-R0)信号经过100Hz到2000Hz的带通滤波,从而衰减100Hz以下和2000Hz以上高频信号的处理。所述第三步对信号SB进行的延时处理,就是对信号SB进行20ms的延时处理。所述第四步对六个子带信号进行随机延时处理,就是对六个子带信号进行0-15ms范围的随机延时处理。
所述第二步产生5.1通路环绕声的前方三通路信号L、R、C的方法为现有技术,包括徐勇、谢菠荪提出的界外立体声处理方法、J.Bauck的提出虚拟声处理方法等。
本发明的原理原始的双通路左、右立体声信号之差S=(L0-R0)含有较多的环境反射声信息,可提取作为环绕声信号。但由于S=(L0-R0)信号的高频成份较多,利用可调的带通滤波可对高频(以及极低频)信号进行一定的衰减,从而得到听觉上自然的环境声学信号SB。而为了不影响前方的声像定位的效果,利用优先效应,对环境声学信号SB进行20ms左右延时(在实际应用中,设为可调)得到SW。将SW用带通滤波器分为六个子带的信号后,通过对每个子带的信号进行不同的随机延时处理,并将处理后的信号混合,可得到两路相关性低的环绕声信号LS、RS,将它们馈给一对扬声器重发,可在倾听者双耳处产生相关性低的双耳声压,从而产生良好的主观包围感觉,达到模拟环绕声的目的。
本发明与现有技术相比,具有如下优点和有益效果(1)本发明对来自CD等的双通路立体声信号进行处理后,转换为5.1通路环绕声信号,并用五个全频带扬声器(加上一个可选择的低频效果扬声器重发),达到将双通路立体声信号转换为5.1环绕声信号的目的。
(2)本发明从原始双通路立体声信号提取出环境反射声信号,并采用子带随机延时的方法产生两路相关性低的环绕声信号。该方法信号处理简单可行,且可产生良好、自然的主观包围感效果。
(3)本发明可采用通用DSP硬件电路或专用的集成电路实现,也可采用算法语言(如VC++)编制的软件在多媒体计算机上实现。
(4)本发明可作为软件用于环绕声音乐节目源的制作(如DVD光盘)。也可作为专用硬件电路而用在家用电声系统、电视(包括DTV和HDTV)、家庭影院等方面的声音重发。


图1是将双通路立体声信号转换为5.1通路环绕声信号的原理方块图。
图2是本发明环绕通路信号处理原理的方框3是带通滤波器幅频特性4是本发明的等效时域信号处理方块5是环绕通路产生的双耳压示意6是本发明软件实施的信号处理流程图具体实施方式
下面结合实施例及附图对本发明作进一步说明,但本发明要求保护的范围并不局限于实施例所描述的范围。
图1是将双通路立体声信号转换为5.1通路环绕声信号的原理方框图。如图1所示,将双通路立体声信号转换为5.1通路环绕声信号技术关键主要包括(1)前方三通路信号(L、C、R)的产生由于前方主要含的是声像定位信息,因而需要将双通路立体声的定位信息保存下来,转换为前方三通路的信号重发,即原始双通路立体声信号L0和R0,转换为前左通路信号L、前右通路信号R和中心通路信号C,再利用布置在正前方(0°)和左右30°的左中右三个扬声器进行重发。转换后的信号必须保证在中心倾听位置的声像定位不变,并能扩大听音区域。国际上已提出了几种产生前方三通路信号的方法,如J.Bauck的提出虚拟声的方法就可以达到较理想的效果。
(2)环绕通路信号(LS、RS)的模拟5.1通路环绕声的两路环绕通路主要是重发环境声学信息。因而将双通路立体声信号转换为5.1通路环绕声信号需要将双通路立体声信号的环境声学信息提取出来,并作适当处理,以获得适合两个环绕通路的重发信号(LS、RS)。其目的是增加主观听觉上的包围感,同时必须注意保证所提取的环境声学信息对前方声像定位无明显影响。
图2是本发明环绕通路信号处理原理的方框图。如图2所示,将原始的双通路左、右立体声信号L0、R0进行信号相减,得到信号之差S=(L0-R0),它含有较多的环境反射声信息,可提取作为环绕声信号;S经传输函数为Band(ω)可调的带通滤波处理,得到信号SB=(L0-R0)Band(ω),然后对信号SB进行的20ms延时处理,得到代表环境声学信息的信号SW。SW信号再分别经过355Hz的低通滤波器、中心频率分别为500Hz、1000Hz、2000Hz、4000Hz倍频程带通滤波器、5600Hz的高通滤波器,分解为六个子带的信号S1、S2、S3、S4、S5、S6;分别对所述六个子带信号进行0-15ms范围的随机延时处理;将每个子带信号分解为不同随机延时的一对信号,包括(S1L,S1R)、(S2L,S2R)、(S3L,S3R)、(S4L,S4R)、(S5L,S5R)、(S6L,S6R)六对信号;再分别将S1L、S2L、S3L、S4L、S5L、S6L信号混合相加,将S1R、S2R、S3R、S4R、S5R、S6R信号混合相加,得到一对去相关环绕声信号LS和RS,并分别馈给左、右环绕扬声器重发。
将双通路立体声信号转换为5.1通路环绕声信号的一个技术关键是环绕通路信号的模拟。由于环绕通路主要是重发环境声学信息,产生类似于扩散场的主观听觉效果(包围感),因而环绕通路信号必须满足两个条件1)环绕通路信号所产生的双耳的声压大小应大致相等,也就是双耳声级差接近于零。
2)环绕通路信号所产生的双耳声信号应尽可能不相关(相位随机),所以必须使得双耳听觉互相关系数(IACC)尽量小。
实际的双通路立体声信号录音可分为录音室录音和现场录音两种类型。在录音室录音中,前方声像定位信息是将单通路信号通过全景电位器(pan-pot)而人工产生的,环境声学信息是通过效果器添加人工混响以及延时实现的。而在现场录音中,是采用不同指向性的重合传声器捡拾技术获得前方声像定位信息,通过在远场放置一对传声器以拾取扩散的环境声学信息。无论那一种信号录音方法,产生声像定位的左、右通路信号之间的相关性较大,有关环境声学信息的左、右通路信号之间的相关性较小。因此可以利用原始立体声左、右通路信号之差S=L0-R0将相关性相对较小的信号部分提取出来。并且由于在通常的双通路立体声节目中,语言信号是录制在正前方(L0=R0)。给语言信号加上环境声学信息(混响)会影响语言的清晰度,上述方法可避免将正前方声像的信号进入环绕通路。
但是对于高频信号(特别是现场录音,当一对捡拾传声器之间的距离大于声波的波长时),左、右通路信号之间的相关性将更小,因而S=L0-R0含有较多的高频成份。而在实际的厅堂中,环境声学信息主要是中、低频反射声。另外过多的100Hz以下的反射声信号也会造成不自然的主观听觉效果。所以环境声学信息的中、中低频成分应该比高频以及100Hz以下信号成分多。因而本发明提出对S=(L0-R0)增加一带通滤波处理,即取SB=(L0-R0)Band(ω) (1)其中,Band(ω)是一可调的带通滤波器的传输函数,其频率特性与原始双通路立体声信号的类型有关,图3是带通滤波器幅频特性图,如图所示,该滤波器可衰减100Hz以下和2000Hz以上的高频信号,使得根据(1)所提取的环境声学信息能满足自然听觉效果的要求。
为了使(1)式提取的环境声学信息SB在重发中不影响前方的声像定位效果,可利用优先效应,对其进行一定的延时(20ms左右,在实际应用中,设为可调),得到代表环境声学信息的信号SW。
对SW作去相关信号处理,就是利用信号处理的方法将SW变换为两个相关性小的信号,作为左、右环绕声信号LS、RS,以产生包围感,并避免在重发时环绕通路信号产生声像。而为了保证环绕通路信号重发时不产生音色改变,要求去相关信号处理不改变信号SW的功率谱,即去相关的环绕声信号是通过两个不同相位特性的全通滤波器产生的。
本发明提出一种采用子带随机延时的全通滤波实现方法。首先采用一个低通滤波器、四个1/1倍频程带通滤波器、一个高通滤波器将SW分为六个子带的信号,滤波器的频率特性如表1所示,六个滤波器覆盖了20Hz-20kHz的频带范围。为了保证线性相位,滤波器为采用Hamming窗的有限脉冲响应滤波器(FIR)形式,下降斜率55dB/oct;在计算机生成两组每组6个的随机数组作为对各子带信号的延时时间,记为(TL1,TL2,TL3,TL4,TL5,TL6)、(TR1,TR2,TR3,TR4,TR5,TR6),然后对各子带信号分别按两组随机数进行延时,最后将利用同一组延时时间延时后的各子带信号相加,得到两路环绕通路信号LS、RS。由于从SW到LS、RS信号的转换过程可以看成是线性全通过程,可以用两个不同的线性全通传输函数(两个不同相位特性的全通滤波器)AL(ω)、AR(ω)表示,因而LS=AL(ω)SWRS=AR(ω)SW(2)
所以SW经过(2)式的两个全通滤波器处理后,就可得到两个相关性较低的环绕通路信号。(2)式还可写成时域卷积的形式ls(t)=aL(t)*sW(t) rs(t)=aR(t)*sW(t) (3)式中,各小写字母表示时域的信号,aL(t)、aR(t)是全通滤波器的脉冲响应,它们与相应的频域物理量互为傅立叶变换。
图4是与(3)式对应的时域信号处理方块图,它与图2是完全等价的。
至于各子带信号随机延时时间范围的选取问题,考虑到延迟声与直达声到达倾听者双耳的时间相差超过40-50ms,听觉系统可以区分两个声源。因此总信号延时不应超过40ms。如前所述,为了避免环绕通路的信号影响前方声像定位,已对(1)式的信号SB进行了20ms的延时而得到SW,因而去相关信号处理所用的随机延时必须少于20ms。
为了更精确地确定去相关信号处理所采用的随机延时时间范围,分别在0-5ms、0-10ms以及0-15ms的范围内取两组每组各6个随机数,作为6个子带的随机延时时间,见表1(没有选20ms作为随机延时时间范围是因为其已经到了超过优先效应的边缘,可能会因此而产生回声)。采用六种不同的信号源,(1)8.0KHz低通粉红噪声;(2)3.0KHz低通粉红噪声;(3)1.5KHz低通粉红噪声;(4)8.0KHz低通白噪声;(5)3.0KHz低通白噪声;(6)1.5KHz低通白噪声。
表1 去相关信号处理的随机延时时间

为了检验取不同随机延时时间范围的效果,将每一种信号按图2做去相关信号处理之后得到LS、RS两信号,再将其馈给5.1通路环绕声的两个环绕通路。如图5所示,这时候双耳的频域声压信号为PL=HLLSLS+HLRSRSPR=HRLSLS+HRRSRS (4)其中HLLS、HLRS、HRLS、HRRS为布置在水平面±110°的一对环绕扬声器到双耳的传输函数(HRTF,计算采用MIT媒体实验室给出的在KEMAR人工头测量所得的数据)。再利用下式ψLR(τ)=limT→∞∫-T+TpL(t)pR*(t+τ)dt∫-T+TpL(t)pL*(t)dt∫-T+TpR(t)pR*(t)dt---(5)]]>IACC=max|ψLR(τ)||τ|≤1ms可算出双耳听觉(归一化)互相关函数以及相应的双耳听觉互相关系数IACC,其中pl(t)、pr(t)是双耳声压的时域形式,与(4)式的PL、PR互为傅立叶变换。与较低的IACC相对应的随机延时时间可产生良好的主观包围感。
两个环绕通路信号除了必须满足IACC要尽量小外,还必须使下式的双耳声级差接近于零ΔP=10lg∫|PL(ω)|2|f(ω)|2dω∫|PR(ω)|2|f(ω)|2dω---(6)]]>其中|f(ω)|2是指声信号的功率谱。
对六种不同的信号源和表1所示的随机延时时间,IACC和双耳声级差的计算结果如表2所示。可以看出,若采用0-15ms的随机延时时间范围,对于上面所述的六种信号类型,经去相关信号处理后所得到双耳声压的IACC以及双耳声级差都很低,可得到较为理想的效果。因而本发明就取用0-15ms作为随机延时时间范围。
本发明可以设计成软件在计算机实现,用于环绕声节目源的制作。也可利用通用的信号处理芯片所做成的硬件电路实现,也可以设计成专用的集成电路芯片实现。本发明可用于环绕声音乐节目源的制作(如DVD光盘)。也可作为专用硬件电路而用在家用电声系统、电视(包括DTV和HDTV)、家庭影院等方面的声音重发。
实施例一 环绕声节目源的制作由计算机的CD-ROM读取CD或硬盘上的双通路立体声信号,然后用计算机软件实行图6的从双通路立体声信号模拟5.1通路环绕声的信号处理,得到五通路环绕声信号L、R、C、LS、RS,然后记录在硬盘或DVD光盘上,作为5.1通路环绕声的节目信号。
表2 环绕声信号产生的IACC和双耳声级差

实施例二 家庭影院的应用将CD机输出的双通路立体声(数字)信号馈给家庭影院的放大器,图2或图4的信号处理是作为放大器内的一部分功能电路。得到五通路环绕声信号L、R、C、LS、RS,然后分别馈给外接的五个扬声器进行重发。
本发明具体介绍用软件在多媒体计算机上的实现。图6是软件实现本发明的信号处理流程图。信号处理过程就是(从CD-ROM或硬盘)读入原始的双通路立体声信号,在对它进行处理后,转换为5.1通路环绕声信号,并记录在DVD或硬盘上。
第一步在CD-ROM中读入原始的双通路立体声时域信号,记为l0、r0。
第二步利用现有的算法(如J.Bauck的提出虚拟声的方法)将双通路立体声时域信号转换成5.1通路环绕声的前方左l、右r、中心c通路信号,并存入缓存器。
第三步将双通路立体声时域信号l0、r0相减,得到它们的差信号s=(l0-r0),再将差信号与带通滤波器的脉冲响应hBand(t)卷积和延时20ms,得到代表环境声信息的时域信号SW。
第四步将信号sW分别与aL(t)、aR(t)两个全通脉冲响应卷积,得到去相关的5.1通路环绕声的左、右环绕通路信号ls、rs,并存入缓存器。
第五步将缓存器内的左l、右r、中c通路信号和左、右环绕通路信号ls、rs写入硬盘,作为5.1通路环绕声的节目源信号。
如上所述,即可较好地实现本发明。
客观测量实验验证了本发明的效果,证明了本发明提出产生环绕通路信号的方法在倾听者双耳处产生的低的IACC以及双耳声级差。
利用计算机软件产生最大长度序列(MLS)信号(44.1KHz采样,16bit量化,16384点),对其按图2进行随机延时的去相关信号处理生成两路环绕声信号,经声卡(Echo Layla24)D/A变换和功放后,馈给扬声器重发。扬声器布置在一半径为2.0m的园周上,方位角与5.1通路环绕声的标准布置中的两个环绕扬声器位置一致。将人工头(KEMAR人工头,DB60/61耳壳)放置在中心倾听位置,微缩传声器(Core Sound 4060)放置在人工头耳道入口处捡拾双耳声信号(封闭耳道法测量),其输出经适调放大器放大后(B&K 2690A-0S4)通过声卡的A/D变换器输入到计算机。对捡拾得到的双耳声信号进行解卷积,可得到双耳脉冲响应,对它们加上时间窗后,可消除房间反射的影响。将双耳脉冲响应分别与1.5KHz和3.0KHz的低通粉红噪声卷积,可得到相应的双耳声压,并由(5))式计算出双耳听觉互相关系数(IACC)。实验结果表明,1.5KHz低通的粉红噪声信号的IACC为0.339,双耳声级差为1.1dB。3.0KHz低通的粉红噪声信号的IACC为0.256,双耳声级差为0.7dB。,所以两种信号的IACC都较低,且双耳声级差也较低,可以取得良好的环绕感。
主观实验验证了本发明所产生的主观听觉效果。
实验采用的原始双通路立体声节目源是(1)贝多芬的D大调小提琴协奏曲第三乐章片段;(2)管弦乐,罗西尼的威廉退尔序曲片段;(3)钢琴独奏贝多芬的热情奏鸣曲片段;(4)歌剧男女声二重唱,威尔弟的茶花女片段。
利用上述的方法,从双通路立体声节目源生成5.1通路环绕声信号(其中3个前方扬声器的定位信号,2个后方环绕扬声器的环绕信号)馈给5.1通路环绕声系统重发。并与原始的双通路立体声节目比较。
实验是在一间混响时间0.15s的听音室内进行,五个扬声器布置在半径为2.0m的圆周上,方位角布置参照图1。倾听者位于圆心,共8个倾听者,四男四女。
非正式的主观实验结果表明对于各种信号,对于双通路立体声节目源生成5.1通路环绕声信号重发中,环绕声道信号不会影响前方声像的定位;与原始的双通路立体声比较,生成5.1通路环绕声信号重发时有较好包围感。
本发明的研究得到《广州市科技计划项目,编号2005Z3-D0071》资助。
权利要求
1.双通路立体声模拟5.1通路环绕声的信号处理方法,其特征在于包括如下步骤第一步输入原始的双通路左、右立体声频域信号L0、R0;第二步对第一步输入的原始的双通路左、右立体声信号L0、R0处理,产生5.1通路环绕声的前方三通路信号L、R、C;第三步环境声学信息信号的提取;将原始的双通路左、右立体声信号L0、R0之差(L0-R0)经传输函数为Band(ω)可调的带通滤波处理,得到信号SB=(L0-R0)Band(ω),然后对信号SB进行的延时处理,得到代表环境声学信息的信号SW;第四步环境声学信息信号的去相关处理; 将第三步所得到的SW信号分别经过355 Hz的低通滤波器、中心频率分别为500Hz、1000Hz、2000Hz、4000Hz倍频程带通滤波器、5600Hz的高通滤波器,分解为六个子带的信号S1、S2、S3、S4、S5、S6;分别对所述六个子带信号进行随机延时处理,将每个子带信号分解为不同随机延时的一对信号,包括(S1L,S1R)、(S2L,S2R)、(S3L,S3R)、(S4L,S4R)、(S5L,S5R)、(S6L,S6R)六对信号;再分别将S1L、S2L、S3L、S4L、S5L、S6L信号混合相加,将S1R、S2R、S3R、S4R、S5R、S6R信号混合相加,得到一对去相关环绕声信号LS和RS,并分别馈给左、右环绕扬声器重发。
2.根据权利要求1所述的双通路立体声模拟5.1通路环绕声的信号处理方法,其特征在于,所述第三步中对原始的双通路左、右立体声信号L0、R0之差(L0-R0)经传输函数为Band(ω)可调的带通滤波处理,就是将(L0-R0)信号经过100 Hz到2000Hz的带通滤波,从而衰减100Hz以下和2000Hz以上高频信号的处理。
3.根据权利要求1所述的双通路立体声模拟5.1通路环绕声的信号处理方法,其特征在于,所述第三步对信号SB进行的延时处理,就是对信号SB进行20ms的延时处理。
4.根据权利要求3所述的双通路立体声模拟5.1通路环绕声的信号处理方法,其特征在于,所述第四步对六个子带信号进行随机延时处理,就是对六个子带信号进行0-15ms范围的随机延时处理。
5.根据权利要求1所述的双通路立体声模拟5.1通路环绕声的信号处理方法,其特征在于,所述第二步产生5.1通路环绕声的前方三通路信号L、R、C的方法包括界外立体声处理方法或虚拟声处理方法。
全文摘要
本发明公开了双通路立体声模拟5.1通路环绕声的信号处理方法,它首先输入原始的双通路左、右立体声信号L
文档编号H04S5/00GK1791285SQ200510102200
公开日2006年6月21日 申请日期2005年12月9日 优先权日2005年12月9日
发明者蔡阳生, 谢菠荪, 饶丹 申请人:华南理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1