音频信号处理方法

文档序号：2830980阅读：608来源：国知局

专利名称：音频信号处理方法
技术领域：
本发明涉及一种音频信号处理方法，并且尤其一种可变速度音频信号处理方法。
背景技术：
时间缩放(time scaling)是在不影响声调(pitch)的情况下，改变音频信号数据流的长度(即改变其中的数据点数)，来改变其播放速度。
参照图1,时域谐波缩放(time domain harmonic scaling, TDHS )是一种常用的时间缩放技术，具有计算量低的优点。音频信号数据流包括多个音频信号区段(section),并且每一个音频信号区段包括多个点数据。如图l(a)所示，当以较慢速度播放时，从音频信号区段Sl及附属的音频信号数据中找出一段音频信号数据S2，衔接(splice)在音频信号区段SI之后，以增加音频信号区段S1的长度。如图l(b)所示，当以较快速度播放时，可从音频信号区段S3与音频信号区段S4进行部分的衔接，以缩短音频信号区段S3、 S4的总长度。
然而，在TDHS技术中，如果衔接点与衔接区段选取得不好，则会使声音听起来是不连续的，或会产生杂音，造成声音再现质量降低。另外，当音频信号与视频信号一起播放时，不管是以较快速度或较慢速度播放，二者都
必须同步，才不会使声音和图像无法配合，但TDHS技术可能无法使音频信号经改变后的长度达到目标长度，如此将造成音频信号与^L频信号不同步。

发明内容
因此，本发明之目的即在提供一种音频信号处理方法，可以快速处理，并且达到高质量的声音再现。
于是，本发明的音频信号处理方法包含以下步骤将音频信号数据流区分为多个选择区段；在该音频信号数据流中决定目标区段，该目标区段包含衔接点用以衔接衔接区段；根据该目标区段中的至少一个参数，从该选择区段中选择一个区段以作为该衔接区段；以及将该目标区段与该衔接区段进行
运算以将该衔接区段衔接至该衔接点，并输出处理区段。

图1 (a)、 (b)是示意图，说明TDHS技术；
图2是流程图，说明本发明音频信号处理方法的优选实施例；
图3 (a) - (d)是示意图，说明该优选实施例的各个步骤；
图4是流程图，说明该优选实施例的更多步骤；以及
图5 (a)、 (b)是示意图，说明该优选实施例所使用的曲线拟合法。
主要元件符号说明
2卜24 步骤
30 参考点
32 衔接点
34 结束点
36 起始点
38 中间点
41-44 步骤
AS 目标区段
AD处理区段
C1 CN选择区段
CR 衔接区段
f(x)多项式
具体实施例方式
有关本发明的前述及其他技术内容、特点与功效，在以下配合参考图的一个优选实施例的详细说明中，将可清楚地呈现。
参照图2和图3，其图示本发明音频信号处理方法的优选实施例，包含以下步骤
步骤21:将音频信号数据流区分为多个选择区段C1 CN; 步骤22:在该音频信号数据流中决定目标区段AS,该目标区段AS包含衔接点32用以衔接衔接区,爻CR;步骤23:根据该目标区段AS中的至少一个参数，从该选择区段C1 CN 中选择一个区段来作为该衔接区段CR;以及
步骤24:将该目标区段AS与该衔接区段CR进行运算以将该衔接区段 CR衔接至该衔接点32,并输出处理区段AD。
由上述步骤可了解，本发明的音频信号处理方法的一个实施例是先将音频信号数据流区分为多个选择区段C1 CN (步骤21),如图3(a)所示；并在音频信号数据流中找出目标区段AS以进行音频信号处理，其中，目标区段 AS包含衔接点32用以衔接衔接区段CR (步骤22 ),如图3(b)和3(c)所示。根据声音心理学的遮蔽效应，衔接点32可选择在振幅较大的参考点30之后，而根据实施例，参考点30的振幅值是大于音频信号数据流的振幅平均值。为了在选择区段C1 CN中找出最适当的衔接区段CR,本发明的实施例是先计算出目标区段AS中与每个选择区段C1 CN中的最大振幅、最小振幅及过零率(zero crossing rate),接着，再在选择区段C1 CN中，找出最大振幅、最小振幅及过零率与目标区段AS中的最大振幅、最小振幅及过零率最接近者，以作为衔接区段CR (步骤23)。而最大振幅及最小振幅用于判断音量，以避免目标区段AS及衔接区段CR的音量落差太大，过零率则用于判断频率，以避免目标区段AS是女声而衔接区段CR是男声，或目标区段AS是男声而衔接区段CR是女声，需注意者，参考最大振幅、最小振幅及过零率作为选择根据仅为实施例，本发明不限于此，也可由其他的参数作为选择的依据。找出衔接区段CR之后，本发明将目标区段AS的部分数据(从衔接点32到结束点34 )与衔接区段CR的部分数据(从起始点36到中间点38 )进行线性或非线性的迭加运算(overlapandadd， OLA)以输出处理区段AD (步骤24)，如图3(d)所示。
参照图4,为了使音频信号与视频信号同步，本发明的音频信号处理方法的优选实施例还包含以下步骤
步骤41:计算误差值=目标音频信号数据点数-处理区段AD的音频信号数据点数，并将该误差值以分数型式q/p来表示；
步骤42:判断q/p的大小，如果q/p>0,则跳到步骤43，如果q/p<0,则跳到步骤44，否则结束；
步骤43:在每连续p个处理区段AD中总共增加q点音频信号数据；以
及步骤44:在每连续p个处理区段AD中总共减少q点音频信号数据。举例来说，如果处理区段AD的音频信号数据点数-258，而目标音频信号数据点数=258.2，则误差值=0.2，可以选取p二5、 q=l,并在每连续5个处理区段AD中，使4个处理区段AD的音频信号数据点数-258、 1个处理区段的音频信号数据点数=259，如此一来，这5个处理区段的平均音频信号数据点数=258.2。
如何在处理区段AD中增加或减少音频信号数据的方法有二种 (l)曲线拟合法(curve fitting method )
当要在处理区段AD中增加u点音频信号数据时，先从处理区段AD中任意选取连续的v点音频信号数据，并求出可以表示这v点音频信号数据的 h阶多项式f(x),然后再根据此多项式f(x)求出等距的v+u点音频信号数据，来取代这v点音频信号数据，其中，v>u, fev。
参照图5(a)，举例来说，当要在处理区段AD中增加1点音频信号数据时，可以先从处理区段AD中任意选取连续的4点音频信号数据，并求出可以表示这4点音频信号数据的4阶多项式f(x"b4X^b3xS+b2X^bp+b(),然后再根据此多项式f(x)求出等距的5点音频信号数据，来取代这4点音频信号数据。
相似地，当要在处理区段AD中减少u点音频信号数据时，先从处理区段AD中任意选取连续的v点音频信号数据，并求出可以表示这v点音频信号数据的h阶多项式f(x)，然后再根据此多项式f(x)求出等距的v-u点音频信号数据，来取代这v点音频信号数据，其中，v〉u, h^v。
参照图5(b),举例来说，当要在处理区段AD中减少1点音频信号数据时，可以先从处理区段AD中任意选取连续的4点音频信号数据，并找出可以表示这4点音频信号数据的4阶多项式f(x一b4X、b3xVb2xVtux+b(),然后再根据此多项式f(x)求出等距的3点音频信号数据，来取代这4点音频信号数据。
P)TDHS法
当要在处理区段AD中增加u点音频信号数据时，可将紧邻衔接区段CR 之后的u点音频信号数据加在处理区段AD的最后面，而当要在处理区段AD 中减少u点音频信号数据时，将处理区段AD的最后u点音频信号数据舍弃。
优选地，在步骤43中，使前k个处理区段AD总共增加nint(kq/p)点音频信号数据，且在步骤44中，使前k个处理区段AD总共减少lnint(kq/p)l点音频信号数据，以使处理区段AD的平均音频信号数据点数达到最大精确度，其中，nint(x)表示最接近x的整数，且如果最接近x的整数有二个时，则任意选取其中之一。
在本实施例中，在步骤43中，在第i个处理区段中增加的音频信号数据点数Wj如下所示
<formula>formula see original document page 8</formula>
并且在步骤44中，在第i个处理区段中减少的音频信号数据点数Wi如下所示
间，/=
、i广.、
nint乂
、p,/>1
举例来说，当pApl/5、 2/5、 -1/5或-2/5时，在第i个处理区段中增加或
减少的音频信号数据点数Wi如下表所示。
p/q=l/5p/q=-l/5p/q=-l/5p/q=-l/5
0000
w20101
W31010
w40101
w50000
综上所述，本发明通过在振幅大的点(即参考点30)之后寻找衔接点32, 并且通过最大振幅、最小振幅及过零率来寻找衔接区段CR,使得处理速度较快，且声音再现质量较高，而且通过使处理区段AD的平均音频信号数据点数达到目标音频信号数据点数，可以使音频信号与视频信号达到同步。
上述内容仅为本发明的优选实施例而已，而不能以此限定本发明的范围，即根据本发明权利要求范围及发明说明内容所作的简单的等效变化与修饰，都仍属本发明的范围内。
8
权利要求
1.一种音频信号处理方法，包含有将音频信号数据区分为多个选择区段；在该音频信号数据中决定目标区段，该目标区段包含衔接点用以衔接衔接区段；根据该目标区段中的至少一个参数，从该选择区段中选择一个区段以作为该衔接区段；以及将该目标区段与该衔接区段进行运算以将该衔接区段衔接至该衔接点，并输出处理区段。
2. 根据权利要求1所述的音频信号处理方法，其中，选择该衔接区段的步骤还根据每一选择区段中的第二参数来决定该衔接区段。
3. 根据权利要求2所述的音频信号处理方法，其中，选择该衔接区段的步骤寻找该选择区段中的第二参数与该目标区段中的该参数最接近的，以决定该衔接区段。
4. 根据权利要求1所述的音频信号处理方法，其中，该参数为该目标区段的最大振幅、最小振幅与过零率中的至少一个。
5. 根据权利要求1所述的音频信号处理方法，其中，该衔接点位于参考点之后，并且该参考点的振幅值大于该音频信号数据流的振幅平均值。
6. 根据权利要求1所述的音频信号处理方法，其中，将该目标区段与该衔接区段进行运算为将该目标区段与该衔接区段进行迭加运算。
7. 根据权利要求1所述的音频信号处理方法，还包含以下步骤计算误差值，该误差值为目标音频信号数据点数减去该处理区段的音频信号数据点数，并将该误差值以分数型式q/p来表示；当q/p〉0时，在每连续p个处理区段中总共增加q点音频信号数据；以及当q/p<0时，在每连续p个处理区段中总共减少q点音频信号数据。
8. 根据权利要求7所述的音频信号处理方法，其中，使用曲线拟合法来改变该处理区段的音频信号数据点数。
9. 根据权利要求8所述的音频信号处理方法，其中，在该处理区段中增加u点音频信号数据的方式是从该处理区段中选取连续的v点音频信号数据；求出可以表示该v点音频信号数据的h阶多项式；以及根据该多项式求出等距的v+u点音频信号数据，以取代该v点音频信号数据；其中，v>u, h>v。
10. 根据权利要求8所述的音频信号处理方法，其中，在该处理区段中减少u点音频信号数据的方式是从该处理区段中选取连续的v点音频信号数据；求出可以表示该v点音频信号数据的h阶多项式；以及根据该多项式求出等距的v-u点音频信号数据，以取代该v点音频信号数据；其中，v>u, h^v。
11. 根据权利要求7所述的音频信号处理方法，其中，在该处理区段中增加u点音频信号数据的方式是将紧邻该衔接区段之后的u点音频信号数据加在该处理区段的最后面。
12. 根据权利要求7所述的音频信号处理方法，其中，在该处理区段中减少u点音频信号数据的方式是将该处理区段的最后u点音频信号数据舍
全文摘要
一种音频信号处理方法，包含以下步骤将音频信号数据流区分为多个选择区段；在该音频信号数据流中决定目标区段，该目标区段包含衔接点用以衔接衔接区段；根据该目标区段中的至少一个参数，从该些选择区段中选择一个区段以作为该衔接区段；以及将该目标区段与该衔接区段进行运算以将该衔接区段衔接至该衔接点，并输出处理区段。本发明可以快速处理，且达到高重量的声音再现。
文档编号G10L21/04GK101615397SQ20081012903
公开日2009年12月30日申请日期2008年6月24日优先权日2008年6月24日
发明者周开祥, 林怡君, 王文浩申请人:瑞昱半导体股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：林怡君;王文浩;周开祥
技术所有人：瑞昱半导体股份有限公司
我是此专利的发明人

上一篇：键盘装置的制作方法
上一篇：弦乐器的可调琴颈安装组件的制作方法