基于原子预选择的音频匹配追踪方法与系统的制作方法

文档序号:9788625阅读:413来源:国知局
基于原子预选择的音频匹配追踪方法与系统的制作方法【
技术领域
】[0001]本发明属于音频编码
技术领域
,尤其涉及一种基于原子预选择的音频匹配追踪方法与系统。【
背景技术
】[0002]稀疏表示一般指用尽量少的基函数来准确地表示原始信号,从而抓住信号的主要特征,进而从本质上降低信号处理成本。匹配追踪(MP,Matchingpursuit)作为使用较广的稀疏表示算法之一,其基本思路是在迭代过程中依次从过完备字典中选择最优原子,使得信号的逼近更为优化。由于MP算法用来表示信号的过完备字典基可以自适应根据信号本身的特点来灵活地选取;并且其在原子选择过程中采取的是一种重复迭代逼近的贪婪算法,保证了最终得到的原子系数个数较少,MP算法被广泛应用于信号分析的各个领域,如图像处理,生物医学信号处理,音频处理等。[0003]随着人们对流媒体质量要求的提高以及移动终端用户数量的不断增加,音视频编码效率的要求也日渐提高。传统匹配追踪算法因其计算复杂度较高,不适应于实时处理。目前已提出多种快速匹配追踪算法,如文献1的联合字典方法,文献2的算法改进优化方法,然而这些算法都涉及耗时的优化,或是牺牲稀疏表示效率为补偿,计算速度也难以满足大规模问题的需要,文献3Krstulovid等人提出一种基于短时Gabor原子的遍历型算法,利用非完备的定长原子从信号起始端至终端遍历,多次迭代选择最优匹配原子得到最终稀疏系数。这一算法字典的数据量非常小,在降低计算复杂度的同时有效减少了存储计算负担。[0004]虽然该方法相较于其他稀疏表示算法而言,计算复杂度略有降低,但仍然难以在实时应用中使用。匹配追踪算法中降低计算复杂度的主要途径之一为减少其迭代次数,当所使用稀疏字典为短时字典时,对长时信号局部进行MP算法的耗时必将远远小于遍历型MP算法。[0005]文中涉及如下参考文献:[0006][l]RavelliE,RichardG,DaudetL.UnionofMDCTbasesforaudiocoding[J].Audio,Speech,andLanguageProcessing,IEEETransactionson,2008,16(8):1361-1372.[0007][2]Gharavi-AlkhansariM,HuangTS.Afastorthogonalmatchingpursuitalgorithm[C]//Acoustics,SpeechandSignalProcessing,1998.Proceedingsofthe1998IEEEInternationalConferenceon.IEEE,1998,3:1389-1392.[0008][3]KrstulDviGS,GribonvalR.MPTK:Matchingpursuitmadetractable[C]//Acoustics,SpeechandSignalProcessing,2006.ICASSP2006Proceedings.2006IEEEInternationalConferenceon.IEEE,2006,3:111-111.【
发明内容】[0009]针对现有技术存在的不足,本发明根据能量对听觉感知的影响,提供了一种基于原子预选择的音频匹配追踪方法与系统,本发明通过依次迭代对信号能量值较高的部分进行匹配跟踪,在不影响信号最终重构效果的同时缩短了遍历过程所耗时间。[0010]本发明采用的技术方案如下:[0011]-种基于原子预选择的音频匹配追踪方法,包括:[0012]信号分解和信号重构,其中,信号分解包括步骤:[0013]S1根据原始信号类型选择短时字典,并以短时字典为稀疏字典;[0014]S2逐一计算原始信号中连续样本{Si,Si+1,...Si+^丨的能量,i依次取1、2、~length(S)-N+1,提取能量最高的连续样本,记为Smaxenergy;N为短时字典原子长度;length(S)为原始信号长度;[0015]S3获得稀疏字典各原子在Smaxe3ne3rgy上的原子权重,原子权重绝对值的最大值为[0016]S4计算彳目号残差-''SmaxOT啤为~:?对应的原子;冋时,将记录于当前稀疏系数矩阵的第ioptmax行第joptmax列,ioptmax为&_腿的原子标号,j〇ptmax为的原子中心位置,当前稀疏系数矩阵初始值为零矩阵;[0017]S5当信号残差达到目标SNR或迭代次数达到预设值时,结束信号分解,输出当前稀疏系数矩阵;否则,将当前信号残差flato作为原始信号重复步骤2~5;[0018]信号重构包括:[0019]S7提取当前稀疏系数矩阵中原子权重及其对应的行号、列号;[0020]S8将原子权重分别与对应的原子做乘积得恢复信号,将各恢复信号分别赋值给与步骤1中原始信号长度相同的零向量Mi,以零向量Mi第jc>ptmax个点为恢复信号的中心点,j〇ptmax为当前恢复信号对应原子权重的列号;赋值后的向量依次累加得重构信号。[0021]步骤S2中,原始信号中连续样本{Si,Si+1,..义+^丨的能量即该连续样本中所有样本幅度的平方和。[0022]步骤S2中,原始信号中连续样本{Si,Si+1,..义+^丨的能量即该连续样本中所有样本幅度的绝对值之和。[0023]步骤S2中,原始信号中连续样本{Si,Si+1,..义+^丨的能量即该连续样本中所有样本幅度的最大值。[0024]上述基于原子预选择的音频匹配追踪方法对应的系统,包括:[0025]信号分解单元和信号重构单元,其中,信号分解单元进一步包括:[0026]字典建立模块101,用来根据原始信号类型选择短时字典,并以短时字典为稀疏字血.,、,[0027]预处理模块102,用来逐一计算原始信号中连续样本的能量,i依次取1、2、…length(S)-N+l,提取能量最高的连续样本,记为Smaxenergy;N为短时字典原子长度;length(S)为原始信号长度;[0028]权值比较模块103,用来获得稀疏字典各原子在Smaxenergy上的原子权重,原子权重绝对值的最大值为\<_;[0029]残差计算模块104,用来计算信号残差*^=^_^胃为对应的原子;同时,将记录于当前稀疏系数矩阵的第i〇Ptmax行第j〇ptmax列,i〇ptmax为Apmax的原子标号,joptmax为的原子中心位置,当前稀疏系数矩阵初始值为零矩阵;[0030]阈值控制模块105,用来当信号残差flater达到目标SNR或迭代次数达到预设值时,结束信号分解,输出当前稀疏系数矩阵;否则,将当前信号残差S'latCT作为原始信号输入预处理模块102;[0031]信号重构单元进一步包括:[0032]重构系数提取模块201,用来提取当前稀疏系数矩阵中原子权重及其对应的行号、列号;[0033]信号合成模块202,用来将原子权重分别与对应的原子做乘积得恢复信号,将各恢复信号分别赋值给与原始信号长度相同的零向量姐,以零向量姐第」_max个点为恢复信号的中心点,j〇Ptmax为当前恢复信号对应原子权重的列号;赋值后的向量依次累加得重构信号。[0034]和现有技术相比,本发明具有如下特点:[0035]本发明通过对信号中短时能量较高的部分进行非完备字典的MP算法,减少了遍历计算的次数,降低了计算复杂度。在字典构建中,增大了原子的频率跨度,减少了字典对频率成分的约束。该稀疏表达算法不受待处理信号长度的限制,字典数据量较小。该发明生成的重构信号相比于其他匹配追踪快速算法(如KrStiil0:vi6^?法)在音质无下降的同时可以获得较快的计算速度。【附图说明】[0036]图1是本发明实施例信号分解部分的具体流程图;[0037]图2是本发明实施例信号重构部分的具体流程图;[0038]图3是本发明实施例信号分解子系统结构框图;[0039]图4是本发明实施例的信号重构子系统结构框图;[0040]图5是原子中心位置示意图。【具体实施方式】[0041]为了便于本领域技术人员理解和实施,下面结合附图及实施例对本发明技术方案作进一步详细描述,应当理解,此处所描述的实施例仅用于说明和解释本发明,并不用于限定本发明。[0042]图1~2为本发明方法的具体流程,包括信号分解和信号重构两大部分。[0043]信号分解的具体实现包括以下步骤:[0044]步骤1,根据原始信号类型选择短时字典。[0045]本步骤为音频匹配跟踪方法中常规步骤。对于语音处理系统,选择具有语音特性的短时字典;对于瞬变信号处理系统,选择相对瞬态的短时字典。对于一些特征并不明显或是同时需要处理多种类型信号的系统,选择普适性较强的短时字典。[0046]本实施例中,测试样本包含语言信号、音乐信号等类型,短时字典选择伸缩性较强的Gabor字典。Gabor字典中原子构建方式如下:[0048]式(1)中,w表示频率尺度;μ表示时间偏移量;σ表示时间尺度;Aw,μ,。表示w、μ、σ下的原子能量;η表示Gabor原子的时域样点;gw,μ,σ(η)表示在时域样点η下原子幅度。[0049]传统基于Gabor字典的匹配追踪法在时间偏移量μ取值时,会在字典中原子数目允许的范围内尽可能多的得到各种尺度的时间偏移量μ。本实施例中μ=0,使得字典中所有原子与预处理中选取的能量值较高的部分信号对应,能量均位于其中心位置。假设η的变化范围是1~Ν,频率尺度w、时间尺度〇、原子能量λ共有Μ个组合形式,则字典大小为ΜΧΝ。本实施例中,Μ取20,Ν取1001。[0050]步骤2,原始信号进行预处理,逐一计算原始信号中连续样本能量,将能量值最高的连续样本记为Sm_ne3rgy,连续样本长度即步骤1选择的短时字典的原子长度N。[0051]下面将提供几种能量计算方法。[0052](1)根据能量定义计算连续样本的能量值Energy,如下:[0054]式(1)中,Si为原始信号S的第i个样本,也用来表示原始信号S第i个样本的幅度;m为尺度平移量,m依次取0、1、-_16即也(5)4,16即也(5)为原始信号5的长度。[0055](2)由于样本的幅度平方和与信号的幅度绝对值之和存在类正比关系,另外,样本幅度绝对值之和的计算量远小于样本的幅度平方和的计算量。因此,可采用公式(3)近似计算连续样本的能量值Energy:[0057]式(3)中,Si为原始信号S的第i个样本,也用来表示原始信号S第i个样本的幅度;m为尺度平移量,m依次取0、1、-_当前第1页1 2 
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1