一种基于频域自适应均衡的音频处理方法与流程

文档序号:15701699发布日期:2018-10-19 19:57阅读:472来源:国知局

本发明属于音频信号处理领域,涉及一种频域自适应均衡的音频处理方法。



背景技术:

随着社会生产力的发展,大家的休闲生活日益丰富。听演唱会、看电影、观看电视广播节目逐渐成为大众喜欢的休闲方式。人们为了得到更好的听觉体验,对音质的要求也越来越高。并且它在日常工作和生活中也有着广泛的应用,比如会议室、国际机场、交通枢纽站等场地。科技的日益进步,视音频行业与IT 行业越来越紧密的结合在一起。在过去的20年中,数字音频处理技术已经取得了长足的进步。数字音频处理器在提升音质方面发挥着重要作用。

音频处理器就是对音频信号进行处理的设备,它最初是以模拟音频处理器的形式出现的,使用的是模拟设备,精度不高且受距离的限制,并且设备体积较大,元件易老化出故障,使用很不方便。此外,在模拟音频技术中,对音频信号的处理手段和方法都直接影响到模拟音频系统的回放质量。数字音频处理就是对音频信息进行采样,并使用二进制序列存放,通过对采集到的数据进行均衡等处理,达到改变声音听觉效果的目的。

随着消费者对音质的要求越来越高,数字音频特效技术在音频后处理模块中就显得越来越重要,应用也越来越普遍。音频特效种类很多,基本种类有:equalizer(均衡器),chorus(和音),delay(延时), reverb(混响),Wah-Wah(铜管乐),harmonizer(谐音)等。作为音频设备的后处理单元,可以包含上面所列举的一种或多种。均衡器是最基本的音频特效之一,它往往可以单独或与其他特效组合成一模块集成到终端设备中。均衡器往往按产生的效果来分类,如流行乐风格的均衡器,要求兼顾人声和器乐,组合比较平均,EQ曲线的波动不是很大;摇滚乐风格的均衡器,其高低两端提升很大,低音让音乐强劲有力,节奏感很强,高音部分清晰甚至刺耳。由于每个人对不同频率的声音感觉不一样,音响回放设备的频率响应也不同,人的听阈曲线也只是根据统计数据画出,所以别人听起来很自然的声音自己可能会觉得不舒服,均衡器的调节需要根据自己的听感特点和所使用的播放设备进行个性化的调整。

许多音频均衡算法的应用只涉及增强或衰减只有一小部分的信号的频谱,而留下的其余部分的频谱不受影响。通常在音频应用中采用二阶滤波器具有频率响应的特点是增加或减少一个指定的中心频率大约是这个效果。在数字音频均衡中,任何期望的频率响应都可以通过级联具有不同中心频率的滤波器来实现,然后通常称为参数均衡器滤波器。除了中心频率,参数均衡器滤波器的特点是其带宽。具有相对于中心频率小的滤波器带宽(即具有更高的Q值,称为品质因数),更好地称为Notch和峰值(或共振)滤波器。

音频均衡算法的设计最常见的做法,是从模拟滤波器的设计开始,后跟一个双线性变换映射模拟频率轴上的数字频率轴,随着采样频率的弧度。许多参数均衡器的设计技术,使用这种方法与数字设计变量和“prewarped(预处理)”模拟变量,。这些包括直接I型(或直接II型)滤波器,并与前馈形式的归一化滤波器,这些方法都受到相同的滤波器系数提供的相同的带宽的设计约束。因此,过滤器的性能,如系数量化的敏感性或极限周期的敏感性,是依赖于实施架构,但不是参数均衡器的系数的推导。

广义参数均衡器和参数均衡器与指定奈奎斯特频率增益尝试引入新的参数控制,以补偿非对称翘曲,但这两种方法继续使用模拟设计技术,以确定目标频率响应。

作为一种替代的模拟滤波器设计的改变,用于音频均衡的滤波器可以直接设计在数字信号域。例如,数字巴特沃斯滤波器的设计,而不需要一个模拟原型的实现。为了实现这一目标,参数均衡器滤波器的设计可以使用极点配置技术。然而,许多解决方案不指定带宽,因此不考虑参数,还有一些是有限的,只有理想的陷波滤波器的设计,其中增益设置为零。目前仅存的全数字参数均衡器的设计技术,在这种方法中所采取的近似意味着约束并不完全满意。特别是,该方法将两个极点和零点的角度,从而确保一个近似为高带宽的极点和零点,和差的零高增益近似。

综上所述,数字音频均衡算法为了调节各频段的频率响应,从而产生不同效果,如重低音,收音机,高音等;为了能补偿各种节目信号中欠缺的频率成份,又能抑制过重的频率成份。有的音频均衡算法采用了shelving滤波器,由放大或衰减,带宽,中心频率三个参数是最直观的指标。由这三个参数得出滤波器的传递函数是很方便的。实现方法是时域滤波,方法是运用一系列的带通滤波器对输入的音频数据滤波,每个滤波器作用后得到不同步频率带,形成分频段均衡的效果,时域滤波器处理快但效果差一点。



技术实现要素:

本发明提供了提供了一种基于频域自适应均衡的音频处理方法。用于解决广播电视的音频处理效果存在差异的问题,改善传统的基于双二阶滤波器的音频均衡器存在音频细节处理缺乏,放大噪声和背景音的缺点,且控制器方案延时过长,不能应用于实时播出的不足,以满足用户对于音频信号处理的越来越高的需求和听感体验。

一种基于频域自适应均衡的音频处理方法,是一种根据输入信号自适应动态调整音频信号的频率响应的机制。频域自适应均衡处理是根据等响曲线计算出不同频率段对应的最佳电平值,然后将输入的音频信号进行加窗FFT之后输入之后,根据最佳电平值自适应动态控制音频的频率特性,最后经IFFT变换成时域音频信号后输出。

所述频域自适应均衡算法是在输入音频信号之后,为了减小输入信号的频谱泄露以及满足实时性的要求,要求先进行加窗处理,然后对信号分频段求功率平均值,并求得该平均值与最佳电平值的比值,乘以到原频域数据上,最后经过IFFT变换到时域输出。

其中,所述加窗就是对原始信号进行调制。不同的窗函数对信号频谱的影响是不一样的,比如矩形窗,实际上就是对信号不做任何处理,简单的按照时间片段截取一定长度的信号进行分析处理。本发明做频谱计算时选用的是汉宁窗(hanning window),汉宁窗的作用是分析带宽加宽,但是降低了频率分辨率。

其中,所述FFT就是对输入的时域信号进行快速离散傅里叶变换,将时域信号变换到频域,得到信号的幅频特性,以便后续的音频的频域均衡。

所述分频段计算功率平均值,分为两步,第一步是计算分频段的最佳电平值,第二步是计算每个频段的功率平均值。

其中,所述计算分频段的最佳电平值是根据中央电视台制定的《电视节目声音制作的响度规范》中建议将目标响度值定为-24LKFS,然后根据国际标准的响度测量建议书,利用一个满屏的信号,得到了不同频率下的响度变化曲线图,其中,每一条线对应相同的频率,横轴表示数字音频满刻度电平值,最大值满刻度为0dBFS,低于满刻度20dB的信号便是-20dBFS,以此类推。纵轴表示响度值,每一条线即表示频率相同时的不同电平值对应的响度值。当频率在20Hz到20kHz变化时,同一频率下不同声压值的信号的响度是线性变化的,随着电平值的增加呈现变大的趋势;当响度相同时,随着频率的逐渐变大声压值呈现递减的趋势,即可得到最佳响度值-24LKFS对应的不同频率的电平值。

其中,所述计算每个频段的功率平均值为了得到每个频段的自适应均衡的增益值,还要尽可能的不改变原频段数据的变化趋势,计算每个频段的加权平均功率值Pavg,加权的标准是该频段内每个频率对这个频段功率的贡献率r,用每个频段的平均功率值Pavg比最佳功率值P得到该频段的增益值gain,将增益值乘以到这个频段的每一个功率值后得到该频段每个频率控制后的频域数据。

有益效果

本发明提出了一种基于频率自适应均衡的音频处理方法。为了解决广播电视行业对音频处理器效果越来越高的要求,并且克服以往解决方案的不足。改善了以往基于双二阶滤波器的均衡算法处理效果不佳的问题,增加了可处理的频段,以便处理更多的音频细节。对于一些频率响应不是很理想的音频,经过频域自适应算法的处理后,音频的响度变化趋势更加柔和,响度的变化没有了在某个时间突然增高或降低,响度仍然控制在了-24LKFS左右。对比频率均衡前后的功率谱,可以发现音频的低频音段和高频音段都有了相应的提升,对于听感,可以明显的感受到均衡后的音频较于均衡前的音频,低频段的提升使得低音的混响也更加分明,高频段的提升使得音频的混响更加分明,空间感也得到了了一定的提升,高频的亮度和高亢度也得到了改善。

附图说明

图1是频域自适应均衡算法框图

图2是频域自适应均衡仿真图

具体实施方式

下面将结合附图和实施例对本发明做进一步的说明。

本发明的实例是利用MATLAB对算法进行仿真,在仿真中输入一段非专业歌手录制的音频,并对其进行频域自适应音频均衡处理。

根据图1所示频域自适应算法处理框图,具体实施步骤如下:

步骤A:加窗处理

为了改善上述的情况,我们引入了窗函数。窗函数w(t)是频带无限长的函数,所以即使原始信号是有限带宽信号,被窗函数截取后得到的片段也会变成无线带宽。经过窗函数处理,在频域的能量与分布都被扩展了,有效地减少了能量的泄露。

加窗函数处理,相当于对原始信号进行调制。

不同的窗函数对信号频谱的影响是不一样的,比如矩形窗,实际上就是对信号不做任何处理,简单的按照时间片段截取一定长度的信号进行分析处理。本文做频谱计算时选用的是汉宁窗(hanning window),汉宁窗的作用是分析带宽加宽,但是降低了频率分辨率。汉宁窗的数学定义如下:

其中,x(n)是原始信号,n的范围是0≤n≤N-1,对于其他范围的值,w(n)=0。

步骤B:FFT变换

根据连续非周期信号的傅里叶变换公式:

公式中的i是虚数单位,即i2=-1,然后对连续傅里叶变换进行离散化,在x(t)的某一段连续区间上以周期T进行采样,得到N个采样点,则每个采样点的DFT变换公式为:

积分变成了求级数的和,这就是离散化的结果。可以通过计算x(nT)的值来得到这段区间上的x(t)的傅里叶转换结果。由公式2可知,e的指数项是个与采样点N有关的常量,令则上述公式可以变换为如下公式:

由于DFT算法的计算量巨大,限制了DFT的应用范围,于是提出了快速傅里叶变换(FFT)算法,根据自然对数e的指数项WN的周期性和对称性,WN的周期性可表示为:

WN的对称性可表示为:

根据上述的周期新和对称性,将N个点的DFT分解为n个N/n点的DFT,从而显著减少了运算量。 FFT算法的实现以分治法为策略,递归的将长度为N的DFT分解为两个长度为N/2的DFT,当采样点数 N是2的整数次幂时,可表示为N=2M,则算法需要进行M阶迭代分解,每一阶都有N/2个蝶形运算。每次蝶形运算都要乘以因子每次蝶形运算都会使得两个原始数据的结果像被扭转了一样变换位置,因此,这个印子有成为旋转因子,整个FFT算法的每一阶迭代分解中,旋转因子的个数是不一样的。第一阶分解为两个N/2的DFT,有一个旋转因子,将复数乘法的运算量减少为N2/2,第二阶的分解有四个 N/4的DFT,有两个旋转因子,复数乘法的计算量进一步减少为N2/4,以此类推。分解的过程是以迭代进行,直到不能分解为止,则第L阶迭代运算的旋转因子指数n的计算方法是:

n=j·2M-L(j是第L阶的第j个旋转因子)

旋转因子是个复指数,在算法实现时通常要分解成正弦和余弦函数的分解形式可表示为:

一个N点的DFT变换的前N/2个周期数据的转换关系是:

其后N/2个周期数据的转换关系是:

根据公式6中的对称性可知,代入上式得到后N/2周期数据的转换关系是:

由公式可知,N点的DFT变换X(n)分解的X1(n)和X2(n)表,通过蝶形运算关系,建立X(n)的每个点的映射关系。

步骤C:频域自适应均衡

(1)确定每一个频段的最佳功率值

根据目前最新的ITU-RBS.1770-3国际响度测量的通用算法的建议书中所述,响度测量时基于时域信号的处理,为了得到频率的最佳功率值,就首先要找到时域的最佳响度值,再根据需求分频段求时域最佳响度值对应到频域,得到频域的最佳功率值。

第一步:确定的最佳响度值;

考虑到原来录制保存的模拟电视节目和年代比较久的节目素材等特殊节目的节目响度值本来就比较偏低,加上各个电视的设备更新速度总体较慢,目标响度值定为-24LKFS更为适合我国电视行业。而经过对容忍区和舒适区的研究显示,必要而且适合的节目动态也是需要有一定规定的。所以,考虑到现实状况下,有些节目的播出可能无法达到-24LKFS的,即规定有正负2LU的响度动态,而单节目内的动态范围则为8LU。最后,中央电视台制定的《电视节目声音制作的响度规范》中建议将目标响度值定为-24LKFS。

第二步:分频段求最佳功率值:

根据不同频段对音频的贡献不同,利用一个满屏的信号,得到了不同频率下的响度变化曲线图。选取了从20Hz到20kHz的14个不同的频率值得到了如表1所示的不同频率对应的最佳电平值。

表1

(2)计算每个频段的增益和衰减

离散傅里叶变换得到的频域数据是复数,因此可以计算出输入信号的信号功率值:

为了得到每个频段的自适应均衡的增益值,还要尽可能的不改变原频段数据的变化趋势,论文计算了每个频段的平均功率值Pavg,并用每个频段的平均功率值Pavg比最佳功率值P得到该频段的增益值gain 为:

将增益值乘以到这个频段的每一个功率值后得到该频段每个频率控制后的频域数据:

Xnew(n)=gain×X(n)

步骤D:IFFT变换并输出

根据步骤B所述方法进行逆变换即可。

经过频域自适应处理之后,如图2所示,可以发现经过频域自适应算法的处理后,音频的响度变化趋势更加柔和,响度的变化没有了在某个时间突然增高或降低,响度仍然控制在了-24LKFS左右。对比频率均衡前后的功率谱,可以发现音频的低频音段和高频音段都有了相应的提升,对于听感,可以明显的感受到均衡后的音频较于均衡前的音频,低频段的提升使得低音的混响也更加分明,高频段的提升使得音频的混响更加分明,空间感也得到了了一定的提升,高频的亮度和高亢度也得到了改善。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1