数字音频变速处理方法及其设备的制作方法

文档序号：2830164阅读：420来源：国知局

专利名称：数字音频变速处理方法及其设备的制作方法
技术领域：
本发明涉及音频信号处理技术，特别涉及音频信号处理技术中的音频变速处理。
背景技术：
在各种多媒体应用中，录制好的数字音频的重放速度调整具有广泛的需求。比如降低语音重放的音速，可以有助于有听力或理解力障碍的人群以及外语初学者提高听音的可懂度；而提高音速，则可帮助听者节省从录音中获取信息的时间。此外，对音乐重放音速的调整还可以改变音乐的节奏，获得独特的效果；对于视频中的伴音，音频重放的音速调整，可以使得视频在加快或放慢回放速度的同时，使观众可以听到同步的，没有发生畸变的伴音。但是，直接对音频进行播放速度调整而不做任何处理，会因为声音中频率成分的线性迁徙而带来音调和音色的变化。比如说，在降低音速时，声音会变低沉，语音则变现为如沉睡中发出的鼻音；在提高音速时，声音会变得尖锐，语音则表现为如幼童快速讲话。因此，为了保证音频仅仅发生了音速变化，而音调和音色均不发生变换，没有明显畸变，需要对数字音频进行处理。目前，大都采用基于重叠相加技术的算法或者基于时频变换和频谱处理的算法进行音频的变速处理。关于音频变速处理的技术也可参见专利号为“5952596” 的美国专利。然而，本发明的发明人发现，在基于重叠相加(overlap add)技术实现的算法中，需要通过检测波形的相似程度(waveform similarity)来确定重叠窗的时延，这类方法只能处理具有明显基音周期的语音，它使用时域或频域的互相关检测技术取得相似波形的时延，以此作为重叠窗的时延，因此计算消耗较大且处理音质一般；而基于时频变换和频谱处理的算法可以处理包括语音和音乐的通用音频(general audio)，它对原始数字音频进行重采样以变换采样率，然后将改变了采样率的数字音频转换到频域获得音频的频谱，随后对频谱进行频谱搬移(frequency shift)，将处理后的频谱变换回时域，这个算法一般使用可完美重构的短时傅里叶变换(short time Fourier transform)实现，为能获得较高的处理音质，短时傅里叶变换需要一次处理较长的音频，这类方法虽然能获得比较好的处理音质，但是它的计算量和存储量较大，在手持和移动设备上，因为计算能力和功耗的约束，该算法几乎无法实现。

发明内容
本发明的目的在于提供一种数字音频变速处理方法及其设备，对通用数字音频的变速处理可以以更低的计算量实现，并且得到较高的处理音质。为解决上述技术问题，本发明的实施方式提供了一种数字音频变速处理方法，包含以下步骤A将待进行音频变速处理的音频信号数据填充到缓冲区，直至所述缓冲区的已填充长度达到数据处理长度Lp ；
B将所述缓冲区中待处理的音频信号数据通过以下方式进行加窗处理，得到输出
信号Xout 如果所述音频变速处理为加快速度的处理，则将所述缓冲区中长度为Lp的音频信号数据与长度为Lw的窗函数I左端对齐后逐点乘上I得到&，将所述缓冲区中长度为Lp 的音频信号数据与长度为Lw的窗函数Wk右端对齐后逐点乘上Wk得到&，将得到的^和& 相加，得到Lw个所述输出信号x。ut ；如果所述音频变速处理为放慢速度的处理，则将所述缓冲区中长度为Lp的音频信号数据与长度为Lw的窗函数I右端对齐后逐点乘上I得到^，将所述缓冲区中长度为Lp 的音频信号数据与长度为Lw的窗函数Wk左端对齐后逐点乘上Wk得到&，将得到的^和& 相加，得到Lw个所述输出信号x。ut ；C将已完成加窗处理的Ld个信号移出缓冲区，在缓冲区尾部继续填充待处理的音频信号数据，直至所述缓冲区的已填充长度达到数据处理长度Lp ；重复执行所述步骤B和步骤C，直至完成所有的音频信号数据的音频变速处理；其中，所述I为具有幅度衰减特性的窗函数，所述Wk为具有幅度增加特性的窗函数，Wk各有Lw个点的数据，所对应的点相加等于1或近似于1。本发明的实施方式还提供了一种数字音频变速处理设备，包含填充模块，用于将待进行音频变速处理的音频信号数据填充到缓冲区，直至所述缓冲区的已填充长度达到数据处理长度Lp ；加窗处理模块，用于将所述缓冲区中待处理的音频信号数据进行加窗处理，得到输出信号x。ut ；所述加窗处理模块在所述音频变速处理为加快速度的处理时，将所述缓冲区中长度为Lp的音频信号数据与长度为Lw的窗函数\左端对齐后逐点乘上\得到&，将所述缓冲区中长度为Lp的音频信号数据与长度为Lw的窗函数^右端对齐后逐点乘上Wk得到 Xr,将得到的^和&相加，得到Lw个所述输出信号X。ut ；在所述音频变速处理为放慢速度的处理时，将所述缓冲区中长度为Lp的音频信号数据与长度为Lff的窗函数I右端对齐后逐点乘上I得到^，将所述缓冲区中长度为Lp的音频信号数据与长度为Lw的窗函数Wk左端对齐后逐点乘上Wk得到χκ，将得到的&和&相加，得到Lw个所述输出信号x。ut ；移位模块，用于将已完成加窗处理的Ld个信号移出缓冲区，并指示所述填充模块在缓冲区尾部继续填充待处理的音频信号数据，直至所述缓冲区的已填充长度达到数据处理长度Lp ；当所述缓冲区的已填充长度达到数据处理长度Lp时，触发所述加窗处理模块的处理；当所述加窗处理模块得到Lw个所述输出信号x。ut时，触发所述移位模块的处理，直至完成所有的音频信号数据的音频变速处理；其中，所述I为具有幅度衰减特性的窗函数，所述Wk为具有幅度增加特性的窗函数，Wk各有Lw个点的数据，所对应的点相加等于1或近似于1。本发明实施方式与现有技术相比，主要区别及其效果在于使用具有幅度衰减、增加特性的一对完美重构窗函数I和Wk，按不同的时延作用于原始数字音频获得一对加窗数据，利用加窗数据重构音频波形，获得变速处理后的音频。由于不需要对音频的基音周期和相关性进行检测，也不需要进行时频变换，因此计算量极低。而且，由于利用了音频信号自身波形的压缩和引入来实现播放内容的时间增减，不对音频波形本身做改动，因此能更多地保持原有音质。进一步地，在对缓冲区中待处理的音频信号数据进行加窗处理时，W^和Wk为所对应的点相加等于1的初始重构窗函数；或者，W^和Wk为根据音频信号数据的回声类型所选择的不同权值分布的重构窗函数；不同权值分布的重构窗函数分别单独生成，或者通过对初始重构窗的变换得到。由于音频压缩(加快速度)是将时间被压缩掉的音频信息平滑地分散在处理后的缩短的音频数据上；而音频扩展(放慢速度)则是通过引入过去和未来 (相对参照数据时间上较新)的音频信息进行平滑地交迭，获得更长的音频数据。这种交迭的过程都会把能量较大的信号引入或扩散到原来能量很小的部分，造成过回声(回声在信号发生后)和预回声(回声在信号发生前)，因此在进行加窗处理时，可以进一步地根据回声类型所选择适合的重构窗函数，以进一步保证变速后的音频质量。进一步地，音频信号数据的回声类型根据音频信号数据的块能量或块绝对值与预设门限的判断结果获取。由于如果过去的信号大于现在的信号，容易发生过回声；如果过去的信号小于现在的信号，容易发生预回声。因此以音频信号的块能量(或块绝对值)作为回声类型判断的依据，可有效保证判断结果的准确性。进一步地，初始重构窗Wl和Wk如下
权利要求
1.一种数字音频变速处理方法，其特征在于，包含以下步骤A将待进行音频变速处理的音频信号数据填充到缓冲区，直至所述缓冲区的已填充长度达到数据处理长度Lp ；B将所述缓冲区中待处理的音频信号数据通过以下方式进行加窗处理，得到输出信号Xout :如果所述音频变速处理为加快速度的处理，则将所述缓冲区中长度为Lp的音频信号数据与长度为Lw的窗函数I左端对齐后逐点乘上I得到&，将所述缓冲区中长度为Lp的音频信号数据与长度为Lw的窗函数^右端对齐后逐点乘上Wk得到&，将得到的^和&相加，得到Lw个所述输出信号x。ut;如果所述音频变速处理为放慢速度的处理，则将所述缓冲区中长度为Lp的音频信号数据与长度为Lw的窗函数I右端对齐后逐点乘上I得到^，将所述缓冲区中长度为Lp的音频信号数据与长度为Lw的窗函数^左端对齐后逐点乘上Wk得到&，将得到的^和&相加，得到Lw个所述输出信号x。ut;C将已完成加窗处理的Ld个信号移出缓冲区，在缓冲区尾部继续填充待处理的音频信号数据，直至所述缓冲区的已填充长度达到数据处理长度Lp ；重复执行所述步骤B和步骤C，直至完成所有的音频信号数据的音频变速处理；其中，所述I为具有幅度衰减特性的窗函数，所述Wk为具有幅度增加特性的窗函数，W^ 和Wk各有Lw个点的数据，所对应的点相加等于1或近似于1。
2.根据权利要求1所述的数字音频变速处理方法，其特征在于，在对所述缓冲区中待处理的音频信号数据进行加窗处理时，所述I和^为所对应的点相加等于1的初始重构窗函数；或者，所述\和Wk为根据音频信号数据的回声类型所选择的不同权值分布的重构窗函数；所述不同权值分布的重构窗函数分别单独生成，或者通过对所述初始重构窗的变换得到。
3.根据权利要求2所述的数字音频变速处理方法，其特征在于，所述音频信号数据的回声类型根据所述音频信号数据的块能量或块绝对值与预设门限的判断结果获取。
4.根据权利要求2所述的数字音频变速处理方法，其特征在于，所述通过对初始重构窗的变换，得到不同权值分布的重构窗函数的方式如下对所述初始重构窗进行整数比例地抽值，取得变换窗型的缓变部分，而两端的不变部分则分别用0或1进行填充，直至达到所述初始重构窗的原始长度。
5.根据权利要求2所述的数字音频变速处理方法，其特征在于，所述初始重构窗I和 We如下W ⑷ J(2"Lw"2A: = l，2,...，Lw/2{l-(2(Lw+l-)t)/Lw)72 Kw/2 + l,.",LwWl(k) = l-ffE(k), k = 1,2,…，Lff
6.根据权利要求1至5中任一项所述的数字音频变速处理方法，其特征在于，所述Lw 为预先设定的值，根据所述Lw和播放速率r得到所述Ld和Lp的值。
7.一种数字音频变速处理设备，其特征在于，包含填充模块，用于将待进行音频变速处理的音频信号数据填充到缓冲区，直至所述缓冲区的已填充长度达到数据处理长度Lp ；加窗处理模块，用于将所述缓冲区中待处理的音频信号数据进行加窗处理，得到输出信号x。ut ；所述加窗处理模块在所述音频变速处理为加快速度的处理时，将所述缓冲区中长度为Lp的音频信号数据与长度为Lw的窗函数\左端对齐后逐点乘上\得到&，将所述缓冲区中长度为Lp的音频信号数据与长度为Lw的窗函数Wk右端对齐后逐点乘上Wk得到χκ，将得到的^和^相加，得到Lw个所述输出信号x。ut ；在所述音频变速处理为放慢速度的处理时，将所述缓冲区中长度为Lp的音频信号数据与长度为Lw的窗函数I右端对齐后逐点乘上I得到^，将所述缓冲区中长度为Lp的音频信号数据与长度为Lw的窗函数Wk左端对齐后逐点乘上Wk得到χκ，将得到的&和&相加，得到Lw个所述输出信号x。ut ；移位模块，用于将已完成加窗处理的Ld个信号移出缓冲区，并指示所述填充模块在缓冲区尾部继续填充待处理的音频信号数据，直至所述缓冲区的已填充长度达到数据处理长度Lp ；当所述缓冲区的已填充长度达到数据处理长度Lp时，触发所述加窗处理模块的处理；当所述加窗处理模块得到Lw个所述输出信号x。ut时，触发所述移位模块的处理，直至完成所有的音频信号数据的音频变速处理；其中，所述I为具有幅度衰减特性的窗函数，所述Wk为具有幅度增加特性的窗函数，W^ 和Wk各有Lw个点的数据，所对应的点相加等于1或近似于1。
8.根据权利要求7所述的数字音频变速处理设备，其特征在于，所述用于进行加窗处理的窗函数I和Wk为所对应的点相加等于1的初始重构窗函数；或者，所述用于进行加窗处理的窗函数\和Wk为根据音频信号数据的回声类型所选择的不同权值分布的重构窗函数；所述不同权值分布的重构窗函数分别单独生成，或者通过对所述初始重构窗的变换得到。
9.根据权利要求8所述的数字音频变速处理设备，其特征在于，还包含窗函数选择模块，用于根据所述音频信号数据的块能量或块绝对值与预设门限的判断结果获取所述音频信号数据的回声类型，并将获取的回声类型输出给所述加窗处理模块。
10.根据权利要求8所述的数字音频变速处理设备，其特征在于，所述通过对初始重构窗的变换，得到不同权值分布的重构窗函数的方式如下对所述初始重构窗进行整数比例地抽值，取得变换窗型的缓变部分，而两端的不变部分则分别用0或1进行填充，直至达到所述初始重构窗的原始长度。
11.根据权利要求8所述的数字音频变速处理设备，其特征在于，所述初始重构窗I和 We如下
12.根据权利要求7至11中任一项所述的数字音频变速处理设备，其特征在于，所述Lw 为预先设定的值，根据所述Lw和播放速率r得到所述Ld和Lp的值。
全文摘要
本发明涉及音频信号处理技术，公开了一种数字音频变速处理方法及其设备。本发明中，使用具有幅度衰减、增加特性的一对完美重构窗函数WL和WR，按不同的时延作用于原始数字音频获得一对加窗数据，利用加窗数据重构音频波形，获得变速处理后的音频。由于不需要对音频的基音周期和相关性进行检测，也不需要进行时频变换，因此计算量极低。而且，利用了音频信号自身波形的压缩和引入来实现播放内容的时间增减，不对音频波形本身做改动，因此能更多地保持原有音质。
文档编号G10H7/12GK102117613SQ20091020216
公开日2011年7月6日申请日期2009年12月31日优先权日2009年12月31日
发明者吴晟, 张本好, 徐晶明, 李昙, 林福辉, 董树景申请人:展讯通信(上海)有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴晟;林福辉;张本好;董树景;李昙;徐晶明
技术所有人：展讯通信(上海)有限公司
我是此专利的发明人

上一篇：开孔Al-Cu吸声材料及其制备方法
上一篇：简谱变音调、变节奏辅助符号的标注方法