一种基于分层可靠度变化趋势的音频分割方法与流程

文档序号:11602464阅读:来源:国知局

技术特征:

1.一种基于分层可靠度变化趋势的音频分割方法,其特征在于,包括以下步骤:

1)定长分析窗内基于可靠度变化趋势的分层跳变点检测;

假设每次分析窗内只有一个跳变点,然后计算窗口内各帧的可靠度,根据可靠度的变化趋势来检测分析窗内是否有跳变点;

2)基于定长分析窗内跳变点检测的音频分割;

对整个音频信号特征序列从起始位置加定长分析窗W0,若没有检测到跳变点,窗口向后移动Δl距离,0<Δl<Nmin,Nmin为最小窗口Wm的长度;继续检测下一区域距离;若检测到跳变点,得到一个定长分析窗内以显著度排序的跳变点的序列;将分析窗W0移至具有最大时间上标的跳变点处,继续检测下一区域;当定长分析窗遍历整个歌曲音频流后,将会得到所有的跳变点的集合CP;然后再将跳变点的集合CP重新按照时间排序,完成对整个音频流的分割。

2.根据权利要求1所述的一种基于分层可靠度变化趋势的音频分割方法,其特征在于,可靠度的变化趋势是指:

在跳变点xk左侧,随着音频帧靠近跳变点xk时,可靠度值呈上升趋势,在跳变点xk右侧,随着音频帧远离跳变点xk时,可靠度值呈下降趋势,而在跳变点xk处,RE(xk)将取得极大值。

3.根据权利要求1所述的一种基于分层可靠度变化趋势的音频分割方法,其特征在于,检测分析窗内是否有跳变点具体步骤为:

若未检测到跳变点,表明该窗口中不含跳变点;若检测到跳变点SP1,则以SP1为界,将W0切分为两个子窗W1与W2,然后再按照上述流程检测子窗W1与W2中是否包含跳变点,若未检测到跳变点,则不再切分窗口,认为其中不包含跳变点;若检测到跳变点,则以跳变点为界将子窗一分为二继续检测下一层子窗,直至子窗长度小于最小窗口长度Nmin或子窗内不包含跳变点。

4.根据权利要求1所述的一种基于分层可靠度变化趋势的音频分割方法,其特征在于,步骤1)具体为:

(i)按帧提取音频特征,确定最大窗口W0的长度为Nmax、最小窗口Wm的长度为Nmin

(ii)计算分析窗内各帧的可靠度,选取可靠度最大的第k帧作为预选择跳变点,分析窗内始末段NM帧的可靠度不计算,0<NM<Nmin;根据预选择跳变点左右两侧可靠度的变化趋势来确定其是否为真实跳变点,即:

<mrow> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>IncNum</mi> <mi>L</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>&gt;</mo> <mi>&alpha;</mi> <mo>&CenterDot;</mo> <msub> <mi>Num</mi> <mi>L</mi> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>SumIncRE</mi> <mi>L</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>&gt;</mo> <msub> <mi>SumDecRE</mi> <mi>L</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>DecNum</mi> <mi>R</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>&gt;</mo> <mi>&alpha;</mi> <mo>&CenterDot;</mo> <msub> <mi>Num</mi> <mi>R</mi> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>SumDecRE</mi> <mi>R</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>&gt;</mo> <msub> <mi>SumIncRE</mi> <mi>R</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>

其中,IncNumL(k)是第k帧左侧可靠度上升的次数,NumL是第k帧左侧的帧数,SumIncREL(k)是第k帧左侧可靠度的增加量,SumDecREL(k)是第k帧左侧可靠度的减少量,DecNumR(k)是第k帧右侧可靠度下降的次数,NumR是第k帧右侧的帧数,SumIncRER(k)是第k帧右侧可靠度的增加量,SumDecRER(k)是第k帧右侧可靠度的减少量,α是音频帧数百分比;

(iii)若(2)不成立,则窗内不包含跳变点;

(iv)若(2)成立,则预选择跳变点第k帧为真实跳变点,并将跳变点放入跳变点集合,然后以跳变点为界,将窗口一分为二分割成两个子窗;判断子窗是否长度小于最小窗口长度,小于最小窗口长度的不予处理,大于最小窗口长度的子窗执行(ii)步骤,若(2)不成立,不再切分窗口;若(2)成立,跳到(iv)。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1