一种通过快速声音波形修复实现声音还原的方法

文档序号：2824961阅读：2740来源：国知局

专利名称：一种通过快速声音波形修复实现声音还原的方法
技术领域：
本发明涉及音频处理方法，准确地说是一种用于进行声波修复的方法。
背景技术：
音频数据实际上就是由很多频率的正弦波叠加在一起而形成的波。音频数据还原成曲线的时候看上去好像是没有规律的。我们把低码率的音频文件或者压缩后有文件损伤的音频文件还原成曲线，发现曲线会有不同程度的毛刺和比较大的抖动。这些毛刺和抖动会造成声音的失真、不连续，严重影响到声音的传输质量。针对上述问题，通常的处理方式是利用傅立叶变换进行计算，如专利申请 CN200910071941. 3的方法，以得到平滑曲线的音频信号，但是由于音频中包含大量的音频文件，并不是一个单纯的音频曲线，通过傅立叶变换需要大量的资源才能实现处理，而且处理是时间成本很高，无法得到满意的处理结果。

发明内容
基于此，本发明的目的是提供一种通过快速声音波形修复实现声音还原的方法，该方法通过平滑音频波形，去除毛刺，修复不连续和补偿抖动来实现音频曲线的还原。本发明在另一个目的是提供一种通过快速声音波形修复实现声音还原的方法，该方法容易实现、占用资源少，实现成本低廉。为达到上述目的，本发明是这样实现的
一种通过快速声音波形修复实现声音还原的方法，该方法包括如下步骤
1、滤波处理，将音频信号先进行滤波处理，去掉音频信号中的低频分量和高频分量；
2、平滑处理，将滤波后的音频信号进行平滑运算，按照音频曲线的插值和趋势进行平滑处理；
3、音频能量分析及趋势处理，通过对插值、趋势平滑处理后的音频曲线音频进行能量分析，把插值、趋势平滑处理后的音频曲线能量分别进行压制，削弱能量最大值并增强能量最小值。4、输出。所述的步骤1中，滤波是通过低通滤波器去除音频信号中的高频分量，通过高通滤波器去除音频信号中的低频分量，且滤波后生成2路音频信号。所述的步骤2中，插值平滑是先对音频信号进行分段处理，每段长度取为1024，最后一段不够补零，再利用每段分析的主要峰值来重构音频曲线，最后使用线性插值算法来平滑波形。峰值重构音频曲线是先获取本段信号的所有峰值，然后对非峰值部分进行滑动平滑，即2个峰值之间有N个点和N点对应的值1 (η=ΓΝ),通过!^n和N计算出调整变量 Ft = (Fl+…+Fn)/N，然后在2个峰值之间通过变量Ft和2个峰值重建一个波谷。所述的步骤2中，趋势平滑，是对音频曲线取5点，进行五点直线滑动平均算法进行平滑。上述的音频曲线，是所选中音频信号中的部分曲线。滤波后生成的2路音频信号，一路进行插值平滑处理，一路进行趋势平滑处理。所述的步骤3中，对插值、趋势平滑处理后的音频曲线音频分2路进行能量分析，一路对插值平滑处理的音频信号进行能量分析，一路对趋势平滑处理的音频信号进行能量分析，且把2路音频信号能量分析后的能量曲线分别进行2头压制，削弱能量最大值并增强能量最小值。音频信号的能量谱既包含幅度也包含有相位信息。调整相应的幅度，能对能量进行压制或增强。而单一的调整会造成信号的损失。因此，对选取的音频信号做5帧3段移动平均处理。即帧间对5帧信号的幅度进行移动平均处理求得其平均幅度值F，然后对最后1帧的幅度削弱或者增强F/5，这样可得到帧间的平滑，补偿信号的损失。帧内对信号进行3段平滑处理，把一帧的信号分成3段，计算这3段的平均幅度值为Fl，然后对本帧的幅度削弱或者增强F1/3，这样可以进一步平滑本帧信号。上述步骤3中，对2路能量曲线压制后，再分别还原进行趋势平滑，然后把2路趋势平滑处理后的音频曲线并合成1路音频曲线进行输出。所述的方法中，还包括频率调整步骤，在音频能量分析及趋势处理后，音频的低频部分和高频部分受到了一定的压制，此时进行频率调整，适当的提升一下低频和高频，音频会更逼近真实曲线。上述步骤中，进一步包括增益处理，音频处理后某些局部的音频信号会越限，通过自动增益处理模块会把越限部分的音频进行适当的增益调整，使其满足输出要求。本发明通过上述方法，平滑处理能够有效地对音频曲线进行还原，只去除音频曲线中的毛刺及抖动，避免了通过傅立叶变换所带来的庞大运算量，通过修复不连续和补偿抖动来实现音频曲线的还原。本发明还具有实现方便，节约资源，成本低的特点。

图1为本发明实施的原理图。图2为本发明实施的软件控制流程图。
具体实施例方式下面，结合附图所示，对本发明的具体实施做详细说明。图1所示，为本发明实现的一种原理图，结合图2所示，本发明的具体实现步骤包括
1、信号增益调整。对输入的音频数据，先进行傅立叶变换，再进行增益调整，以满足下面处理的要求。2、滤波处理。滤波处理包含2方面的处理
1)、低通滤波去除高频分量，便于以后进行趋势平滑。
2)、高通滤波去除低频分量，便于以后进行插值平滑。滤波可以一部分去除毛刺。在分别进行高低通滤波之后进行不同的平滑，能生成高低2路音频数据。在以后的能量分析和趋势处理中合成以后会得到更加平滑的曲线。3、音频平滑处理。音频平滑处理主要是通过平滑算法对音频曲线进行平滑整理，从而达到去毛刺的目的。平滑处理分为以下2个平滑模块
1)、插值平滑。高通滤波去除低频分量后，曲线的趋势范围比起原始音频曲线要小，即平滑些。这样做趋势平滑时计算量会有所减小。插值平滑是先对音频进行分段处理，每段长度为1024，最后一段不够补零，再利用每段分析的主要峰值来重构声波，峰值重构信号算法是先获取本段信号的所有峰值，然后对非峰值部分进行滑动平滑，音频信号包括若干个峰值，先获取这些峰值，其中相邻峰值之间有N个点，然后将相邻2个峰值之间N个点和N点对应的值1 (η=广N)通过1 (傅立叶变换)和N计算出调整变量Ft = (Fl+…+Fn) /N,然后在2个峰值之间通过变量Ft (t 一般取N的中间值)和2个峰值重建一个波谷。这样处理的效果是声音听起来挺刺耳的，但已经可以感觉到声音的变化。最后使用线性插值算法来平滑波形。2)、趋势平滑。低通滤波去除高频分量后，选取要处理的局部音频曲线上的5个点，对音频曲线进行五点直线滑动平均算法进行平滑。趋势平滑后的音频曲线会消除抖动，更加平滑。4、音频能量分析及趋势处理。音频能量分析及趋势处理即通过对2路曲线(插值、趋势平滑后音频曲线)音频进行能量分析。把2路音频曲线能量分别进行2头压制，即削弱能量最大值并增强能量最小值。对选取的音频信号做5帧3段移动平均处理。即帧间对5帧信号的幅度进行移动平均处理求得其平均幅度值F，然后对最后1帧的幅度削弱或者增强F/5，这样可得到帧间的平滑，补偿信号的损失。帧内对信号进行3段平滑处理，把一帧的信号分成3段，计算这3 段的平均幅度值为F1，然后对本帧的幅度削弱或者增强F1/3，这样可以进一步平滑本帧信号。然后对2路音频曲线分别进行插值平滑和趋势平滑处理，把2路音频曲线平滑后，插值平滑和趋势平滑后，经过能量分析和趋势处理两路的信号增益均降低50%，这时候再将两路信号并合成1路音频曲线。5、频率调整。进行了前面处理以后，音频的低频部分和高频部分受到了一定的压制。适当的提升一下低频和高频，音频会进一步接近真实曲线。低频部分的提升，主要是对100HZ附近部分的增益增加3db。高频部分的提升，主要是对8000HZ附近部分的增益增加3db。频率调整后，再通过傅立叶反变换，恢复音频数据。6、自动增益调节。为了防止音频处理后越限，通过自动增益处理模块会把越限部分的音频增益进行适当的调整。以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。
权利要求
1.一种通过快速声音波形修复实现声音还原的方法，其特征在于该方法包括如下步骤1)、滤波处理，将音频信号先进行滤波处理，去掉音频信号中的低频分量和高频分量；2)、平滑处理，将滤波后的音频信号进行平滑运算，按照音频曲线的插值和趋势进行平滑处理；3)、音频能量分析及趋势处理，通过对插值、趋势平滑处理后的音频曲线音频进行能量分析，把插值、趋势平滑处理后的音频曲线能量分别进行压制，削弱能量最大值并增强能量最小值；4、输出。
2.如权利要求1所述的通过快速声音波形修复实现声音还原的方法，其特征在于所述的步骤1中，滤波是通过低通滤波器去除音频信号中的低频分量，通过高通滤波器去除音频信号中的高频分量。
3.如权利要求1所述的通过快速声音波形修复实现声音还原的方法，其特征在于所述的步骤2中，插值平滑是先对音频信号进行分段处理，每段长度取为1024，最后一段不够补零，再利用每段分析的主要峰值来重构音频曲线，峰值重构信号是先获取本段信号的所有峰值，然后对非峰值部分进行滑动平滑，最后使用线性插值算法来平滑波形。
4.如权利要求1所述的通过快速声音波形修复实现声音还原的方法，其特征在于所述的步骤2中，趋势平滑，是对音频曲线取5点，进行五点直线滑动平均算法进行平滑。
5.如权利要求4所述的通过快速声音波形修复实现声音还原的方法，其特征在于上述的音频曲线，是所选中音频信号中的部分曲线。
6.如权利要求1所述的通过快速声音波形修复实现声音还原的方法，其特征在于所述步骤2中，将2路音频信号，一路进行插值平滑处理，一路进行趋势平滑处理。
7.如权利要求1所述的通过快速声音波形修复实现声音还原的方法，其特征在于所述的步骤3中，对插值、趋势平滑处理后的音频曲线音频分2路进行能量分析，一路对插值平滑处理的音频信号进行能量分析，一路对趋势平滑处理的音频信号进行能量分析，且把 2路音频信号能量分析后的能量曲线分别进行2头压制，削弱能量最大值并增强能量最小值。
8.如权利要求7所述的通过快速声音波形修复实现声音还原的方法，其特征在于所述的能量分析，是将音频信号做5帧3段移动平均处理，帧间对5帧信号的幅度进行移动平均处理求得其平均幅度值F，然后对最后1帧的幅度削弱或者增强F/5，得到帧间的平滑；帧内对信号进行3段平滑处理，把一帧的信号分成3段，计算这3段的平均幅度值为Fl，然后对本帧的幅度削弱或者增强F1/3 ；对2路能量曲线压制后，再分别还原进行趋势平滑，然后把 2路趋势平滑处理后的音频曲线并合成1路音频曲线进行输出。
9.如权利要求1所述的通过快速声音波形修复实现声音还原的方法，其特征在于所述的方法中，还包括频率调整步骤，在音频能量分析及趋势处理后，音频的低频部分和高频部分受到了一定的压制，此时进行频率调整，适当的提升一下低频和高频。
10.如权利要求9所述的通过快速声音波形修复实现声音还原的方法，其特征在于上述步骤中，进一步包括增益处理，音频处理后某些局部的音频信号会越限，通过自动增益处理模块会把越限部分的音频进行适当的增益调整。
全文摘要
本发明是一种通过快速声音波形修复实现声音还原的方法，该方法包括滤波处理、平滑处理、音频能量分析及趋势处理和输出步骤，本发明通过平滑处理能够有效地对音频曲线进行还原，只去除音频曲线中的毛刺及抖动，避免了通过傅立叶变换所带来的庞大运算量，通过修复不连续和补偿抖动来实现音频曲线的还原。
文档编号G10L19/00GK102074241SQ201110002360
公开日2011年5月25日申请日期2011年1月7日优先权日2011年1月7日
发明者蔡镇滨, 马平申请人:蔡镇滨, 马平

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：蔡镇滨;马平
技术所有人：蔡镇滨;马平
我是此专利的发明人

上一篇：管乐器音孔盖调整装置的制作方法
上一篇：一种通过加噪音来降低稳态噪音的装置及方法