副歌提取装置和方法与流程

文档序号:11136041阅读:来源:国知局

技术特征:

1.一种副歌提取装置,其特征在于,包括:

预处理模块,用于对歌曲采样信号进行预滤波处理,得到预滤波处理后的信号;

子带获取模块,用于将预滤波处理后的信号划分为多个子带,并获取预定带宽的子带信号;

平滑处理模块,用于对所述子带信号进行平滑滤波处理,得到平滑处理后的子带信号;

包络提取模块,用于提取平滑处理后的子带信号的能量包络信号,其中,能量包络信号数据与子带信号数据之间的差值最小化;

副歌提取模块,用于采用最大类间方差法计算所述能量包络信号的动态阈值,并根据所述动态阈值确定副歌部分。

2.根据权利要求1所述的装置,其特征在于,所述预滤波处理模块用于,通过对采样信号X(n)中的不同的频率分量设置对应的权重,并通过以下公式进行加窗短时傅里叶变换计算得到预滤波处理后的信号:

其中w[n]为矩形窗,频率响应函数为f(x)=x/(x+c),c为常数;

预滤波处理后的第n帧的子带信号能量和为:

其中low~high对应于由低到高频谱的傅里叶系数,Xp(n,k)=f(X(n,k))=X(n,k)/[X(n,k)+c]。

3.根据权利要求2所述的装置,其特征在于,所述平滑处理模块通过以下公式进行平滑滤波处理:

<mrow> <msub> <mi>X</mi> <mi>s</mi> </msub> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>m</mi> <mo>=</mo> <mo>-</mo> <mi>M</mi> </mrow> <mi>M</mi> </munderover> <msub> <mi>X</mi> <mi>p</mi> </msub> <mrow> <mo>(</mo> <mi>n</mi> <mo>-</mo> <mi>m</mi> <mo>)</mo> </mrow> <mo>/</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>*</mo> <mi>M</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>,</mo> </mrow>其中M为样本点范围。

4.根据权利要求3所述的装置,其特征在于,所述包络提取模块用于,通过多次迭代计算提取所述子带信号的能量包络信号,当满足收敛条件或者达到最大迭代次数时停止迭代计算,其中:

初始的第n帧包络数据为V0(n)=-∞;

初始的子带能量计算公式为:A0(n)=log(|Xs(n)|);

第i次迭代计算公式为:Ai(n)=max(Ai-1(n),Vi-1(n))。

5.根据权利要求4所述的装置,其特征在于,所述副歌提取模块通过以下公式计算动态阈值:

使目标函数g(k)=w0w110)2最大化从而求解出动态阈值k,其中:

w0表示能量包络信号中小于k的数据出现的概率,

w1表示能量包络信号中大于k的数据出现的概率,

μ0表示能量包络信号中小于k的数据的均值,

μ1表示能量包络信号中大于k的数据的均值,

pi表示第i个离散值出现的概率。

6.根据权利要求1所述的装置,其特征在于,所述副歌提取模块用于,将大于所述动态阈值的子带信号所对应的歌曲部分确定为副歌部分。

7.根据权利要求6所述的装置,其特征在于,所述副歌提取模块还用于根据以下设置的至少之一对确定的副歌进行处理:

设置副歌在歌曲中的开始时间;

设置副歌的最小时间长度;

设置副歌之间的最小时间间隔。

8.一种副歌提取方法,其特征在于,包括:

对歌曲采样信号进行预滤波处理,得到预滤波处理后的信号;

将预滤波处理后的信号划分为多个子带,并获取预定带宽的子带信号;

对所述子带信号进行平滑滤波处理,得到平滑处理后的子带信号;

提取平滑处理后的子带信号的能量包络信号,其中,能量包络信号数据与子带信号数据之间的差值最小化;

采用最大类间方差法计算所述能量包络信号的动态阈值,并根据所述动态阈值确定副歌部分。

9.根据权利要求8所述的方法,其特征在于,所述对歌曲采样信号进行预滤波处理,包括:

通过对采样信号X(n)中的不同的频率分量设置对应的权重,并通过以下公式进行加窗短时傅里叶变换计算得到预滤波处理后的信号:

其中w[n]为矩形窗,频率响应函数为f(x)=x/(x+c),,c为常数;

预滤波处理后的第n帧的子带信号能量和为:

其中low~high对应于由低到高频谱的傅里叶系数,Xp(n,k)=f(X(n,k))=X(n,k)/[X(n,k)+c]。

10.根据权利要求9所述的方法,其特征在于,包括:

通过以下公式进行平滑滤波处理:其中M为样本点范围。

11.根据权利要求10所述的方法,其特征在于,所述提取平滑处理后的子带信号的能量包络信号,包括:

通过多次迭代计算提取所述子带信号的能量包络信号,当满足收敛条件 或者达到最大迭代次数时停止迭代计算,其中:

初始的第n帧包络数据为V0(n)=-∞;

初始的子带能量计算公式为:A0(n)=log(|Xs(n)|);

第i次迭代计算公式为:Ai(n)=max(Ai-1(n),Vi-1(n))。

12.根据权利要求11所述的方法,其特征在于,所述最大类间方差法通过以下公式计算动态阈值:

使目标函数g(k)=w0w110)2最大化从而求解出动态阈值k,其中:

w0表示能量包络信号中小于k的数据出现的概率,

w1表示能量包络信号中大于k的数据出现的概率,

μ0表示能量包络信号中小于k的数据的均值,

μ1表示能量包络信号中大于k的数据的均值,

pi表示第i个离散值出现的概率。

13.根据权利要求8所述的方法,其特征在于,所述根据所述动态阈值确定副歌部分,包括:

将大于所述动态阈值的子带信号所对应的歌曲部分确定为副歌部分。

14.根据权利要求13所述的方法,其特征在于,所述根据所述动态阈值确定副歌部分,还包括:根据以下设置的至少之一对确定的副歌进行处理:

设置副歌在歌曲中的开始时间;

设置副歌的最小时间长度;

设置副歌之间的最小时间间隔。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1