一种音频比对系统及其音频能量比对方法

文档序号:2832110阅读:668来源:国知局

专利名称::一种音频比对系统及其音频能量比对方法
技术领域
:本发明涉及语音识别领域,尤指一种音频识别系统及其音频比对方法。
背景技术
:传统的语音识别是从语音中识别一段特定内容并根据内容产生其它相关应用。现有的音频比对技术都是基于梅尔倒频i普系数(MelFrequencyCepstrumCoefficient,MFCC)算法,通过MFCC算法提耳又音频特征参数,再根据音频特征参数的欧氏距离来判定音频的相似性,而实际使用中表明这样的方法在音频质量较高情况下可正常工作,但在噪声较大、干扰较大的场合有一定的误报现象,对于音频内容为音乐的情况,误报尤为频繁。在实际的应用中,比对的应用通常是对通过不同的信号接收方法得到的相同节目进行比对,例如卫星节目与空收节目的比对,而不同的信号接收方法必然导致两路音频内容存在一定差异,空收的内容因外界因素干扰也与源内容存在差异,MFCC算法是根据人耳的听觉特性提取音频特征参数,因此音频内容的差异会导致算法产生误4艮。
发明内容针对现有技术存在的问题,本发明的目的之一在于提供一种受外界干扰小、能够准确识别音频相似性的音频比对系统。本发明的另一目的在于提供一种准确识别音频能量的比对方法。为实现上述目的,本发明的音频比对系统,包括音频序列确定单元、音频序列处理单元和音频相似性判定单元;音频帧、音频序列确定单元用于确定需要比对的音频序列的长度,以及其中音频帧的个数;音频序列处理单元用于处理需要比对的音频序列的各个音频帧的比值,根据比值的大小确定为正常音频帧或者异常音频帧,并根据正常音频帧进行平均值处理,得到待比对音频帧能量的平均比值k值,根据音频能量平均比值的区间,得到待比对音频中音频帧的比值在区间内的个凄t;音频相似性判定单元用于根据音频序列处理单元得到的待比对音频间能量比值在区间内的个数与音频帧总数的比值范围来确定待比对音频的相似性。进一步,所述音频序列处理单元中的音频序列由多个音频帧构成,音频帧为音频上选取的N个取样点集合,其涵盖的时间为50-100ms。进一步,所述N的值为512或1024。进一步,所述相邻音频帧之间有一段重迭区域,该重迭区域包含了M个取j羊点,且M为所述N值的一半。进一步,所述音频序列中的音频帧个数为100-200个。进一步,所述待比对音频帧能量的平均值K小于10,则表明两对比音频帧为正常音频帧,否则为异常音频帧。上述音频比对系统采用音频能量比对方法,具体步骤为l)确定音频帧、音频序列乂人待比对音频中选取N个耳又样点组成对应的音频帧,并选:f又100-200个音频帧构成对应的音频序列;2)计算音频帧的能量值得到每一个取样点的能量值,根据音频能量的对称特性,计算得出音频帧的能量值;3)计算待比对音频帧能量平均比值K值首先根据待比对音频中每一对应的音频帧的能量比值将音频帧分为正常音频帧或异常音频帧;其次通过对正常音频帧求和和平均的值相比后得到待比对音频能量的平均比值K值;4)计算待比对音频中超过音频能量平均比值K值的音频帧个数K值的取值范围为r,音频能量的比值区间为(K-r,K+r),计算得出待比对音频中对应音频帧能量之比在区间内的个数;5)判定待比对音频的相似性根据步骤4)中得出在音频能量比值区间内的音频帧个数与音频帧总数的比值大小s来判定二路音频的相似性。进一步,所述取样点的个ltN为512或1024。进一步,步骤l)中选取的相邻音频帧之间有一段重迭区域,该区域包含了M个耳又样点,且M为所述N值的一半。进一步,步骤2)中计算两路音频能量值时只需计算能量值为正值的采样点,将音频帧包含的采样点的能量值累加就得到音频帧的能量值。进一步,所述待比对音频中对应的音频帧能量之比小于10,则表明是正常音频帧,否则该音频帧为异常音频帧。进一步,所述KK3,所述0.1〈s〈0.2。本发明的音频比对系统是对待对比音频整体分割出多个音频帧,以音频帧之间能量对比而得出对比音频的相似度,此种对比方式受外界环境影响较小,即使在噪声较大、干扰较大的环境下也不会出现误报现象。该音频比对系统可以应用在音频传输上,在卫星与卫星间比对,可以实时发现比对卫星的传输节目是否正常;另外音频比对系统也可以进行卫星与AM/FM间进行比对,监测在转发卫星信号时节目内容是否发生变化,实时发现设备故障或非法内容的攻击;同样,该系统可以在光纤与AM/FM间进行比对,光纤信号是可靠的,因此可以以光纤信号为基准来监测其它信号源的合法性。图1为音频帧、音频序列划分方法的示意图2为本发明音频比对系统与中波台信号源间的链路图。具体实施例方式本发明的音频比对系统,包括包括音频序列确定单元、音频序列处理单元和音频相似性判定单元;音频帧、音频序列确定单元用于确定需要比对的音频序列的长度,以及其中音频帧的个数;音频序列处理单元用于处理需要比对的音频序列的各个音频帧的比值,根据比值的大小确定为正常音频帧或者异常音频帧,并根据正常音频帧进行平均值处理,得到待比对音频帧能量的平均比值k值,根据音频能量平均比值的区间,得到待比对音频中音频帧的比值在区间内的个数;音频相似性判定单元用于根据音频序列处理单元得到的待比对音频间能量比值在区间内的个数与音频帧总数的比值范围来确定待比对音频的相似性。该系统的具体工作步骤及原理如下1)音频序列是比对的最小单位,音频帧是计算音频序列能量值的最小单位。先选取N个取样点集合成一个观测单位,称为音频帧,通常N的值是512或1024,涵盖的时间约为50100ms左右。为了避免相邻两个音频帧的变化过大,所以两个相邻音频帧之间有一段重迭区域,此重迭区域包含了M个取样点,通常M的值约是N的一半。语音识别所用的音频的取样频率为8KHz或16KHz,以8KHz来说,若音频帧长度为512个取样点,则对应的时间长度是512/8000*1000=64mso才艮据音频帧确定音频序列,通常音频序列取>100-200个音频帧,若每个音频序列包含100个音频帧,则对应的音频序列长度为64*100=6400ms,具体划分方法如图1所示;2)计算音频帧的能量值根据音频能量对称的特性,计算两路音频能量值时只需计算能量值为正值的采样点,将音频帧包含的采样点的能量值累加就得到音频帧的能量值;3)计算待比对音频帧能量平均比值K值首先对音频帧分类,计算两路音频序列的各个音频帧的比值,分析音频帧的能量比值,若小于10,表明是正常音频帧,否则表明该帧为异常音频帧,计算平均能量比值时不再对该帧的能量值进行计算,这样可以消除大的比值对K值的影响;其次计算K值,通过对正常音频帧能量值求和平均计算得到两路音频的K值,先将正常音频值的能量值进行累加,再做平均值,得到两路音频的平均比值-K值;4)计算超过音频能量K值的音频帧个数,设定K值的取值范围,通常取为2,即音频能量比值的区间为(K-2,K+2),计算两路音频比值在区间内的个数,得出的个数包括在步骤3)中得出的异常音频帧;5)判定待比对音频的相似性,根据步骤4)中得出个数与总音频帧总数的比值来判定二路音频的相似性,比值通常取为0.15,若小于0.15表明是两路音频相似,否则表明两路音频不相似。总体上,若两路音频内容相同,则二者的整体趋势相同、音频帧能量比值在一个较小的区间内波动,若比对的两路音频不相同,则比值没有规律,且会出现比值较大的情况,因此该方法首先通过去除异常帧得到能量平均比值(K值),然后通过统计大于K值正常区间内的点数是判定二路音频的相似性。需要指出的是K的取值范围根据实际需要可以为1-3之间的任意数值,音频相似性判断处的音频能量比值区间内的音频帧个数与音频帧总数的比值大小可以根据需要在0.1-0.2之间任意选取。以下通过实际案例对本发明的音频能量比对方法进行实验测试通过音频录制软件录制两路音频素材,下面分别称为源素材与目标素材,素材长度为l小时,釆样率为8K,内容包含新闻、音乐和普通的谈话类节目。通过CoolEdit软件对目标素材进行多种效果处理后,使用音频能量比对法与源素材进行比对。首先对音频串台、替换情况进行测试,测试项中包括对多种类型的音频内容,以测试算法的适应性,测试项内容如"谈话被音乐替换"表示源素材是谈话类节目,对应的目标素材内容被替换为音乐,"谈话中串音乐"表示源素材是谈话类节目,对应的目标素材在源素材基础上进行音乐的串音处理,其它以此类推。测试结果如下表1所示,音频能量比对法准确的对比对中的异常进行了报警。<table>tableseeoriginaldocumentpage8</column></row><table><table>tableseeoriginaldocumentpage9</column></row><table>表l音频串台、替换测试表其次,对于不同节目,算法应该一直报警,不应该出现比对成功、比对失败反反复复的情况,下面使用两路完全不同的音频素材进行测试,测试结果如表2所示,算法可以对两路不同的音频一直报警。<table>tableseeoriginaldocumentpage9</column></row><table>表2不同节目的测试本发明的音频能量比对系统及方法可以应用在广播传输上,以某中波台为例说明该技术的应用。该中波台担负着转播中央广播和省广播节目的职责,转播信号源来自中星6B和亚太6号卫星接收,另有光纤到台信号源,形成较完整的信号链路。如图2所示。音频比对系统采用音频能量比对算法来实现两路音频的比对。音频比对系统就广播转播信号链路的特点,采用多个环节比对各类接收的用于转播的信号源和经发射后重新接收的信号,可以实现任意两个监测点间的比对,不改变原音频播控流程。以中央广播为例,中央广播有卫星来源(中星6B的l号天线、中星6B的2号天线、亚太6号)、AM/FM接收机、光纤三种类型信号源。音频比对系统可以在卫星与卫星间比对,可以实时发现比对卫星的传输节目是否正常,例如该系统成功的发现了2009年2月9日中星6B卫星发生故障事件;音频比对系统也可以卫星与AM/FM间进行比对,监测在转发卫星信号时节目内容是否发生变化,实时发现设备故障或非法内容的攻击;同样,该系统可以在光纤与AM/FM间进行比对,情形与卫星与AM/FM比对类似,从技术角度来说,光纤信号是可靠的,因此可以以光纤信号为基准来监测其它信号源的合法性。需要指出的是根据本发明具体实施方式所做出的任何变形,均不脱离本发明的精神以及权利要求所记载的范围。权利要求1.一种音频比对系统,其特征在于,包括音频序列确定单元、音频序列处理单元和音频相似性判定单元;音频帧、音频序列确定单元用于确定需要比对的音频序列的长度,以及其中音频帧的个数;音频序列处理单元用于处理需要比对的音频序列的各个音频帧的比值,根据比值的大小确定为正常音频帧或者异常音频帧,并根据正常音频帧进行平均值处理,得到待比对音频帧能量的平均比值k值,根据音频能量平均比值的区间,得到待比对音频中音频帧的比值在区间内的个数;音频相似性判定单元用于根据音频序列处理单元得到的待比对音频间能量比值在区间内的个数与音频帧总数的比值范围来确定待比对音频的相似性。2.如权利要求1所述的音频比对系统,其特征在于,所述音频序列处理单元中的音频序列由多个音频帧构成,音频帧为音频上选取的N个取样点集合。3.如权利要求1所述的音频比对系统,其特征在于,所述相邻音频帧之间有一段重迭区域,该重迭区域包含了M个取样点,且M为所述N值的一半。4.如权利要求1所述的音频比对系统,其特征在于,所述待比对音频帧能量的平均值K小于IO,则表明两对比音频帧为正常音频帧,否则为异常音频帧。5.如权利要求1所述的音频比对系统采用的音频能量比对方法,具体步骤为l)确定音频帧、音频序列从待比对音频中选取N个取样点组成对应的音频帧,并选取100-200个音频帧构成对应的音频序列;2)计算音频帧的能量值得到每一个取j羊点的能量值,根据音频能量的对称特性,计算得出音频帧的能量值;3)计算待比对音频帧能量平均比值K值首先根据待比对音频中每一对应的音频帧的能量比值将音频帧分为正常音频帧或异常音频帧;其次通过对正常音频帧求和和平均的值相比后得到待比对音频能量的平均比值K值;4)计算待比对音频中超过音频能量平均比值K值的音频帧个数K值的取值范围为r,音频能量的比值区间为(K-r,K+r),计算得出待比对音频中对应音频帧能量之比在区间内的个数;5)判定待比对音频的相似性根据步骤4)中得出在音频能量比值区间内的音频帧个数与音频帧总数的比值大小s来判定二路音频的相似性。6.如权利要求5所述的音频能量比对方法,其特征在于,所述取样点的个凄tN为512或1024。7.如权利要求5所述的音频能量比对方法,其特征在于,步骤l)中选取的相邻音频帧之间有一段重迭区域,该区域包含了M个取样点,且M为所述N值的一半。8.如权利要求5所述的音频能量比对方法,其特征在于,步骤2)中计算两路音频能量值时只需计算能量值为正值的采样点,将音频帧包含的采样点的能量值累加就得到音频帧的能量值。9.如权利要求5所述的音频能量比对方法,其特征在于,所述待比对音频中对应的音频帧能量之比小于10,则表明是正常音频帧,否则该音频帧为异常音频帧。10.如权利要求5所述的音频能量比对方法,其特征在于,所述KK3,所述0.KsO.2。全文摘要本发明公开了一种音频比对系统及其音频能量比对方法,该音频比对系统,包括音频序列确定单元、音频序列处理单元和音频相似性判定单元。该音频能量比对方法通过去除异常帧得到能量平均比值(K值),然后通过统计大于K值正常区间内的点数来判定二路音频的相似性。本发明的音频比对系统是对待对比音频整体分割出多个音频帧,以音频帧之间能量对比而得出对比音频的相似度,此种对比方式受外界环境影响较小,即使在噪声较大、干扰较大的环境下也不会出现误报现象,对广播上的音频传输有重大意义。文档编号G10L15/00GK101593517SQ20091008757公开日2009年12月2日申请日期2009年6月29日优先权日2009年6月29日发明者何永飞,陶元顺申请人:北京市博汇科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1