一种基于瞬稳态信号分离混合虚拟低音增强处理方法与流程

文档序号:18137261发布日期:2019-07-10 10:43阅读:375来源:国知局
一种基于瞬稳态信号分离混合虚拟低音增强处理方法与流程

本发明涉及音频处理技术领域,具体涉及一种基于瞬稳态信号分离混合虚拟低音增强处理方法。



背景技术:

在当前小型化、轻便化的多媒体设备中,嵌入其中的扬声器在尺寸上有很严格的限制,这种物理上的限制使得小型扬声器的低频重放能力很差,但是音频中的低频成分对听音感受起着很重要的作用,直接影响声音的洪亮度、丰满度、浑厚感和空间感。如何改善小型扬声器的低频表现是音频设计领域亟待解决的问题。

虚拟低音增强技术是一种较为有效的解决方法。现有的虚拟低音增强算法主要是基于非线性器件的和基于相位声码器的还有基于两者结合的混合虚拟低音增强算法。其中,基于非线性器件的方法处理速度较快,对于瞬态信号所产生的低音效果较好,比如鼓声等,但是对于稳态信号会产生非线性畸变;基于相位声码器算法是通过短时傅理叶变换得到音频信号的时频信息,然后通过增加信号低频成分相位变化率的方式产生谐波,这种方法比较灵活,有效地控制了信号畸变,但是处理速度较慢,而且相位声码器为了得到更高的低频分辨率,必须在时域中有一个很大的分析窗口,这样会对瞬态信号产生一定的失真,所以基于相位声码器的低音增强算法处理稳态信号有较好的表现。



技术实现要素:

针对现有技术存在的缺陷,本发明的目的是提出一种基于瞬稳态信号分离混合虚拟低音增强处理方法。该方法在传统的虚拟低音增强技术的基础上,首先利用滤波器提取出音频中的低频信号部分用于低音增强;其次使用hpss声源分离算法,将低频信号中的瞬态和稳态信号分离并分别处理:针对低音瞬态信号采用非线性器件进行虚拟低音生成,针对低音稳态信号采用相位声码器进行虚拟低音生成;经谐波幅度控制后可以合成完整的虚拟低音信号;最后与原始的高频信号部分经过延时等一系列处理后即可以得到完整的低音增强音频信号。

为达到上述目的,本发明采用如下技术方案:

一种基于瞬稳态信号分离混合虚拟低音增强处理方法,具体过程如下:

1)将原始音频输入信号xori(t)分成两路,其中一路信号通过起始频率为fc的高通滤波模块,得到高于高通滤波模块起始频率fc的信号部分,并经过延时处理模块得到高频信号xh(t),另一路信号通过截止频率为fc的低通滤波模块处理得到低频信号xl(t);将低频信号xl(t)经过瞬态/稳态信号分离处理模块处理后得到低音信号的谐波信号x′l(t);将所述高频信号xh(t)与虚拟低音信号x′l(t)进行合成,得到虚拟低音增强后的音频信号xbass(t)输出。

2)其中瞬态/稳态信号分离处理模块的具体处理部分如下:

a)将所述低频信号xl(t)通过hpss瞬态\稳态信号分离处理模块进行信号分离处理,得到低频音频信号的稳态信号xl_h(t)和瞬态信号xl_p(t);

b)对所述低频信号的稳态信号xl_h(t)和瞬态信号xl_p(t)分别进行虚拟低音谐波生成处理;其中,将所述瞬态信号xl_p(t)输入到由乘法器元件和反馈回路组成的基于非线性器件的瞬态信号虚拟低音生成模块,得到瞬态信号的谐波信号x′l_p(t);将所述稳态信号xl_h(t)输入到基于相位声码器的稳态低音信号虚拟低音生成模块,得到稳态信号的谐波信号x′l_h(t);

c)将所述瞬态信号的谐波信号x′l_p(t)和稳态信号的谐波信号x′l_h(t)通过谐波幅度控制模块处理,得到虚拟低音信号x′l(t);

所述步骤2a)中的信号分离处理过程包括以下步骤:

(i)对所述低频信号xl(t)进行短时傅里叶变换,得到低频信号的时频谱

(ii)对所述低频信号时频谱进行取模运算,得到低频信号时频谱的幅度谱

(iii)设置稳态信号时频谱和瞬态信号时频谱的初始值都为其中γ为衰减因子;

(iv)利用如下公式进行迭代处理:

其中,n代表的时频谱时间索引;k为时频谱频率索引;

(v)将得到的稳态信号幅度谱h和瞬态信号幅度谱p用如下公式得到维纳滤波器;

(vi)将所述的低频信号时频谱乘以维纳滤波器,得到稳态信号时频谱和瞬态信号时频谱计算公式如下;

(vii)对得到的稳态信号时频谱和瞬态信号时频谱进行逆短时傅里叶变换,得到时

域的稳态信号xl_h(t)和时域的瞬态信号xl_p(t)。

所述步骤2c)中的处理过程为:根据等响度曲线,对所述瞬态谐波信号x′l_p(t)和稳态谐波信号x′l_h(t)进行谐波幅度调整,使其达到理想的低音效果,然后合成为一路,得到虚拟低音信号x′l(t)。

本发明方法与现有技术相比较,具有如下优势:

本发明考虑了音频信号中普遍具有瞬态成分和稳态成分,首先利用瞬态/稳态信号分离算法将原始音频中的瞬态成分和稳态成分分离开来,再利用传统的基于非线性器件的虚拟低音生成模块和基于相位声码器的虚拟低音生成模块进行虚拟低音处理,大大减少了虚拟低音处理的稳态失真和瞬态失真,使虚拟低音处理后的音频信号在保留原始品质的同时增强了低音效果,增强了音频的洪亮度、丰满度、浑厚感和空间感。

附图说明

图1为本发明基于瞬稳态信号分离混合虚拟低音增强处理方法总流程框架示意图。

图2是图1中瞬态/稳态信号分离处理模块示意图。

具体实施方式

下面结合实施例及附图对本发明作进一步的详细描述,但本发明的实施方式不限于此。

本发明的基于瞬稳态信号分离混合虚拟低音增强处理方法,音频信号中包含着瞬态成分和稳态成分,利用瞬态/稳态信号分离算法将原始音频信号中的瞬态成分和稳态成分分离开来,然后分别通过基于非线性器件的虚拟低音生成模块和基于相位声码器的虚拟低音生成模块进行虚拟低音处理,然后将得到的两路虚拟低音信号经过谐波幅度控制使其满足等响度曲线并合成为一路,最后将得到的虚拟低音信号与原始音频信号经高通滤波和延时处理后得到的高频信号进行叠加,得到混合虚拟低音增强处理后的音频信号。如图1、图2所示,具体实施步骤如下:

1)将原始音频输入信号xori(t)分成两路,其中一路信号通过起始频率为fc的高通滤波模块1,得到高于高通滤波模块1起始频率fc的信号部分,并经过延时处理模块2得到高频信号xh(t),另一路信号通过截止频率为fc的低通滤波模块3处理得到低频信号xl(t);

2)将所述低频信号xl(t)通过hpss瞬态\稳态信号分离处理模块5进行信号分离处理,得到低频音频信号的稳态信号xl_h(t)和瞬态信号xl_p(t);信号分离处理过程包括以下步骤:

a.将低频信号xl(t)进行短时傅里叶变换(stft),得到低频信号的时频谱矩阵,记为是一个n×k的复数矩阵,其中n表示时频谱总共的时间样点数,k表示每个时间样点所拥有的频率样点数。

b.对低频信号时频谱进行取模运算,得到其幅度谱y,y是一个n×k的实数矩阵,yn,k表示时频谱幅度谱中的某一个时频点,n和k都是整数,代表着该时频点的时间索引和频率索引;

c.设置稳态信号幅度谱h和瞬态信号幅度谱p的初始值都为其中γ为衰减因子,在本实施例中γ=0.5;

d.利用如下公式进行迭代处理:

其中,

e.将得到的稳态信号幅度谱h和瞬态信号幅度谱p用如下公式得到维纳滤波器;

f.将低频信号时频谱乘以维纳滤波器,得到稳态信号时频谱和瞬态信号时频谱计算公式如下;

g.对得到的稳态信号时频谱和瞬态信号时频谱进行逆短时傅里叶变换(istft),得到时域的稳态信号xl_h(t)和时域的瞬态信号xl_p(t)。

3)对所述低频信号的稳态信号xl_h(t)和瞬态信号xl_p(t)分别进行虚拟低音谐波生成处理;其中,将所述瞬态信号xl_p(t)输入到由乘法器元件和反馈回路组成的基于非线性器件的瞬态信号虚拟低音生成模块6,得到瞬态信号的谐波信号x′l_p(t);将所述稳态信号xl_h(t)输入到基于相位声码器的稳态信号虚拟低音生成模块7,得到稳态信号的谐波信号x′l_h(t);

基于非线性器件的瞬态信号虚拟低音生成模块是利用乘法器元件来产生低频成分的高次谐波,若乘法器两端输入信号都是频率为f0的纯音信号:

则乘法器的输出信号是频率为2f0的纯音信号:

同理,若输入信号是频率分别为f0与2f0的纯音,则输出信号的频率为3f0。

基于相位声码器的稳态信号虚拟低音生成模块是利用相位声码器来控制谐波,相位声码器算法是基于短时傅里叶变换利用相位信息来实现信号的音调变换的方法,可以应用于音频的时间拉伸和压缩。基于相位声码器的稳态信号虚拟低音生成模块首先对输入稳态信号xl_h(t)进行短时傅里叶变换,短时傅里叶变换会通过加窗处理将信号分段,对每段信号进行快速傅里叶变换,得到的信号可由一组正弦信号组合而成,改变正弦信号的相位变化率,其频率就会发生改变,从而生成高次谐波,然后再对每段信号进行逆快速傅里叶变换操作,还原成时域信号,再将每段信号相加,得到稳态信号的谐波信号x′l_h(t)。

4)将所述瞬态信号的谐波信号x′l_p(t)和稳态信号的谐波信号x′l_h(t)通过谐波幅度控制模块8处理,并合成为一路。由于不同频率的纯音信号和具有不同频率组分的复音信号,即使声压级相同,响度可不相同,需要根据等响度曲线对生成的谐波成分进行谐波幅度控制,使其达到理想的低音效果,然后合成为一路,得到虚拟低音信号x′l(t)。

5)将所述高频信号xh(t)与虚拟低音信号x′l(t)进行合成,得到虚拟低音增强后的音频信号xbass(t)输出。

综上所述,本发明提供了一种基于瞬稳态信号分离混合虚拟低音增强处理方法,该方法首先利用hpss声源分离算法,将原始低频信号分离成瞬态和稳态两部分,再针对每一部分信号的特征对其进行相应的虚拟低音生成处理,在保证原始音频音质的同时,有效降低了虚拟低音增强处理后的失真,增强了音频信号的低音效果。

本发明得到上海市科委重点支撑项目(16010500100)支持。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1