一种多分辨率音频信号处理方法及装置与流程

文档序号:11867420阅读:316来源:国知局
一种多分辨率音频信号处理方法及装置与流程

本发明涉及图像信息处理技术领域,特别涉及一种多分辨率音频信号处理方法及装置。



背景技术:

随时信息技术的不断发展,拍摄技术、摄影技术可以非常细致的捕捉到事物的细节,图像视频的内容种类会日益爆炸式的增长,其频谱信息也会随着扩展,人们对图像视频的传输质量和服务要求越来越高。线性非自适应信息分层提取技术,如小波技术和树型滤波器组已逐渐不能满足人们对信息细节信息提取的要求。并且,在图片视频目标检测中,特征细节信息对分类的准确度具有重要的影响。因此,我们需要一种分层更多,提取信息更有效且对信息损坏更小的信息分析提取方法。

在普遍技术中,信号的全局有效信息可以从一些带宽较大的分量的中提取,如图片视频中人物背景的大体轮廓,医学图片中的器官形状,局部细节信息可以将带宽较大的分量信号继续分解成窄带信号进行提取,这一过程直接影响着信号的质量,如图片视频的清晰度,并且这一过程也是信号去噪很关键的步骤。

这种从全局层次到细节层次,层层迭代的信息提取技术广泛应用工程领域中,如可伸缩的图像编码,图像的边缘提取等,并且分层多分辨率信号分析技术提供了一种金字塔框架式的信号分析模式,为信号处理分析技术提供了一个强有力的工具。

现有技术中最常用的分层多分辨率信号分析技术是小波分析和树型结构的滤波器组。以音频信号分离为例:信号分解过程中,分解的第一层和第二层占据信号的绝大部分能量,但是每一层次中,子信号的带宽比较宽,背景音依旧会混杂在分解的信号中,这是因为小波分析和树型滤波器组是线性且非自适应的,而信号的能量又主要落在一个较窄的频带中。因此,需要对信号进行多层分解,但小波分析和树型滤波器组是非理想的且分解的层次和能量存在一定的折中关系,即:分解的层数越多,子带信号的带宽越窄,但能量损失也会增多。并且,在小波分析和树型结构的滤波器组的设计中,计算操作是线性的和小波核的预先设定性导致无法对于一些非线性自适应的信号进行有效的处理分析。



技术实现要素:

有鉴于此,本发明提供一种多分辨率音频信号处理方法及装置,用以解决现有技术对图像信号处理过程中存在的分层多,对信息损坏大的问题。

本发明通过以下技术手段解决上述问题:

一方面,本发明提供一种多分辨率音频信号处理方法,包括:

对子信号进行离散傅里叶变换,得到第一级DFT序列;

在所述第一级DFT序列中插入零点,得到插入零点后的第一级序列;

对所述插入零点后的第一级序列进行离散傅里叶反变换得到离散傅里叶反变换后的第一级序列;

对所述离散傅立叶反变换后的第一级序列进行分解,得到多个第二级的本征模特函数;

对每个第二级的本征模特函数进行离散傅立叶变换,得到第二级的本征模特函数的DFT序列;

对每个第二级的本征模特函数的DFT序列移除所述第二级的本征模特函数在零点插入处的系数,得到变短的第二级本征模特函数的DFT序列;

对每一个变短的第二级本征模特函数的DFT序列进行离散傅立叶反变换,得到最终的第二级的本征模特函数。

进一步的,所述插入零点后的第一级序列中元素个数是共轭对称的。

进一步的,所述对子信号进行离散傅里叶变换之前还包括:将原始信号分解为多个子信号。

另一方面,本发明提供一种多分辨率音频信号处理装置,包括:

第一变换模块,用于对分解后的子信号进行离散傅立叶变换;

插入模块,用于对离散傅立叶变换后的子信号插入零点;

第一反变换模块,用于对插入零点的子信号进行离散傅立叶反变换;

第一分解模块,用于对离散傅立叶反变换的子信号进行第二级分解;

第二变换模块,用于对第二级分解后的子信号进行离散傅立叶变换;

移除模块,用于移除离散傅立叶变换后的第二级子信号在零点插入处的系数,得到变短的第二级子信号;

第二反变换模块,用于对变短的第二级子信号进行离散傅立叶反变换。

进一步的,所述插入模块,对离散傅立叶变换后的子信号插入零点后的序列中,插入零点后的序列中元素个数是共轭对称的。

进一步的,所述多分辨率音频信号处理装置,还包括:

第二分解模块,用于将上级信号进行分解。

相较于现有技术,本发明的多分辨率音频信号处理方法及装置具有如下有益效果:

1、可针对非线性进行自适应的信号处理分析,应用范围更广。

2、无需事先设定小波核,不存在小波的最优基搜索问题,对于非稳态信号具有稳定的分析效果。

3、对于同等级的小波达到的效果,本方法分解次数少,能量损失少。

附图说明

下面结合附图和实施例对本发明作进一步描述。

图1是本发明实施例一提供的多分辨率音频信号处理方法的流程图;

图2是本发明实施例一提供的多分辨率音频信号处理方法的处理流程图;

图3是本发明实施例一采用的混合鸟声和流水声的输入音频信号分布图;

图4是通过本发明的多分辨率音频信号处理方法对图3中的输入音频信号进行一次分解处理后的时域分析图;

图5是通过本发明的多分辨率音频信号处理方法对图3中的输入音频信号进行一次分解处理后的各个频带能量分布图;

图6是通过本发明的多分辨率音频信号处理方法对图3中的输入音频信号进行二次分解处理后的时域分析图;

图7是通过本发明的多分辨率音频信号处理方法对图3中的输入音频信号进行二次分解处理后的各个频带能量分布图;

图8是通过现有小波分析对图3中的输入音频信号处理后的时域分析图;

图9是通过现有小波分析对图3中的输入音频信号处理后的各频带能量分布图;

图10是本发明实施例二提供的一种多分辨率音频信号处理装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例一

以下将结合附图1和附图2对本发明进行详细说明,本实施例提供一种多分辨率音频信号处理方法,如图1和图2所示,该方法包括:

101、将原始信号分解为多个子信号。

102、对子信号本征模特函数进行离散傅立叶变换(Discrete Fourier Transform,缩写为DFT),得到第一级的DFT序列

其中,本征模特函数,全称为Intrinsic Mode Function,简称IMF,中n是上级IMF在频率域的系数索引,ζ是第ζ个上级IMF,是用来进行再分解的IMF。中n是上级IMF在频率域的系数索引,ζ是第ζ个上级IMF。

103、在DFT序列中插入零点得到插入零点后的第一级序列

其中,插入零点后的元素个数是共轭对称的,与插入的零点个数及零点插入的位置无关。中k’是第二级插入零点后的IMF在频率域的系数索引,IS指inserted sequence,是插入零点后的DFT序列。

104、对插入零点后的序列进行离散傅立叶反变换(缩写为IDFT),得到离散傅立叶反变换后的第一级序列

其中,中IS指inserted sequence,是插入零点后的DFT序列,n’是离散傅立叶反变换后离散信号的信号长度

105、对离散傅立叶反变换后的第一级序列进行分解,得到第二级的本征模特函数其中,m1=0,1,2…M1-1。M1为第二级分解的总个数

本实施例进行的分解指经验模态分解方法(Empirical Mode Decomposition,简称EMD),该方法是依据数据自身的时间尺度特征来进行信号分解,无须预先设定任何基函数。这一点与建立在先验性的谐波基函数和小波基函数上的傅里叶分解与小波分解方法具有本质性的差别。正是由于这样的特点,EMD方法在理论上可以应用于任何类型的信号的分解,因而在处理非平稳及非线性数据上,具有非常明显的优势,适合于分析非线性、非平稳信号序列,具有很高的信噪比。所以,EMD方法一经提出就在不同的工程领域得到了迅速有效的应用,例如用在海洋、大气、天体观测资料与地震记录分析、机械故障诊断、密频动力系统的阻尼识别以及大型土木工程结构的模态参数识别方面。该方法的关键是经验模式分解,它能使复杂信号分解为有限个本征模函数(Intrinsic Mode Function,简称IMF),所分解出来的各IMF分量包含了原信号的不同时间尺度的局部特征信号。经验模态分解法能使非平稳数据进行平稳化处理,然后进行希尔伯特变换获得时频谱图,得到有物理意义的频率。与短时傅立叶变换、小波分解等方法相比,这种方法是直观的、直接的、后验的和自适应的,因为基函数是由数据本身所分解得到。由于分解是基于信号序列时间尺度的局部特性,因此具有自适应性。

其中,中的m1是再分解后的下级IMF的总个数,n’是下级IMF(没有去掉零点)的信号长度。

106、对每一个第二级的本征模特函数进行离散傅立叶变换DFT,得到其DFT序列第二级本征模特函数其中,m1=0,1,2…M1-1。M1为第二级分解的总个数

其中,中m1是再分解后的下级IMF的总个数,k’是下级插入零点后的IMF在频率域的系数索引。

107、对每一个第二级的本征模特函数的DFT序列,移除在零点插入处的系数,得到变短的第二级本征模特函数的DFT序列。

其中,中m1是再分解后的下级IMF的总个数,k是移除零点后的IMF在频率域的系数索引。

108、对每一个变短的DFT序列进行IDFT,得到最终的第二级的本征模特函数

其中,中m1是再分解后的下级IMF的总个数,n是傅立叶反变换后的IMF在频率域的系数索引。

需要说明的是,本实施例仅对原始信号进行了一次处理,根据对信号处理精细度的要求,可多次对采用上述方案对原始信号进行处理。

以图3中混合鸟声和流水声的输入音频信号为例,若把背景流水声视为噪声的话,该信号的噪声是非常明显的。

图4和图5分别是通过本发明的多分辨率音频信号处理方法对图3中的输入音频信号进行一次分解处理后的时域分析图和各个频带能量分布图。

图6和图7分别是通过本发明的多分辨率音频信号处理方法对图3中的输入音频信号进行二次分解处理后的时域分析图和各个频带能量分布图。

图8和图9分别是通过小波分析处理后的时域分析图和各频带能量分布图。

很明显,通过本发明的多分辨率音频信号处理方法对输入音频信号进行一次或多次处理后噪声明显下降,能量损失较小。而经过现有小波分析处理后的去噪效果很差,能量损失很严重。

本发明的多分辨率音频信号处理方法提出一种新的非线性自适应的信号处理算法,在保证检验模式分解算法收敛的前提下,结合离散傅里叶变换,由于经验模式分解算法的可迭代过滤性,使得分解出的分量与其下一层分量并无直接相关性,使得信号提取时,大部分频谱能量处于不同的频带,当达到与小波分析相同的带宽时,所需要的分解层数变少,从而使得能量的损失降到最低。

相较于现有技术,本发明的多分辨率音频信号处理方法具有如下有益效果:

1、可针对非线性进行自适应的信号处理分析,应用范围更广。

2、无需事先设定小波核,不存在小波的最优基搜索问题,对于非稳态信号具有稳定的分析效果。

3、对于同等级的小波达到的效果,本方法分解次数少,能量损失少。

实施例二

在实施例一提供的多分辨率音频信号处理方法的基础上,本发明实施例二提供一种多分辨率音频信号处理装置,如图10所示:该多分辨率音频信号处理装置包括:

第一变换模块10,用于对分解后的子信号进行离散傅立叶变换;

插入模块11,用于对离散傅立叶变换后的子信号插入零点;

第一反变换模块12,用于对插入零点的子信号进行离散傅立叶反变换;

第一分解模块13,用于对离散傅立叶反变换的子信号进行第二级分解;

第二变换模块14,用于对第二级分解后的子信号进行离散傅立叶变换;

移除模块15,用于移除离散傅立叶变换后的第二级子信号在零点插入处的系数,得到变短的第二级子信号。

第二反变换模块16,用于对变短的第二级子信号进行离散傅立叶反变换。

其中,所述插入模块11,对离散傅立叶变换后的子信号插入零点后的序列中,插入零点后的序列个数是共轭对称的。

进一步的,所述多分辨率音频信号处理装置,还包括:

第二分解模块17,用于将上级信号进行分解。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。

以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1