一种基于感知滤波的音频实时比对方法

文档序号:8923602阅读:369来源:国知局
一种基于感知滤波的音频实时比对方法
【技术领域】
[0001] 本发明属于数字音频处理技术领域,涉及对两音频信号进行比较的方法,具体为 一种基于感知滤波的音频实时比对方法,该方法可应用于广播音频的实时比对。
【背景技术】
[0002] 当前,音频广播已成为最为普及的大众宣传和娱乐媒体。广播电台的节目播出及 媒体资源管理等都涉及到音频比对方面的需求,即对两个音频进行比较,判断二者是否相 同或相似。例如在节目监播中,需要对实际发射播出的音频信号进行在线实时接收和查询, 涉及到将接听到的音频流与欲播出的原音频进行比对,从而判断整个开环播出通路是否正 常;又如在广告统计管理中,也需要对每日播出记录与原广告音频进行比对查找,统计各广 告实际播出的时间和次数,从而判断广告播出是否存在漏播、多播或错播等情况。
[0003] 音频比对一般包括音频提取特征和特征匹配两个环节。特征提取是用代表原始信 号的结构化数据来表达音频信号。常用的音频特征主要可以分为两大类:声学级特征和语 义级特征。声学特征是音频信号本身的特征(如时频域特征),是其它类型音频特征的基 础。常用的声学特征主要包括梅尔倒谱系数(MFCC)、基音频率、短时能量、过零率、LPC等 等;语义级特征则是对音频的概念级描述,它是在声学级特征的基础上,通过模型化处理, 抽取出来的更高级的感知特征,如音乐的旋律、音色和叙事感情等等。在提取特征之后,特 征匹配环节则是通过计算提取的两音频特征之间的距离来判断两音频是否相同或相似。该 过程相对简单,常用的特征距离有标准欧几里德距离、曼哈顿距离、汉明距离等等。
[0004] 传统的音频比对方法针对普通音频的比对,一般不太适用于广播音频,其原因主 要有如下两个方面:一方面,在比对容错性上,众多音频特征皆以准确描述音频为目标,追 求高的内容辨识度,故音频的细微变化,均能反应在特征上。这样,如果音频受到噪声干扰, 或经过一些常规音效处理,如均衡(EQ)调节,再将处理后的音频与原音频进行比较,传统 比对方法往往判断两音频不相似甚至完全不同,而噪声干扰、音效处理等在广播中是很常 见的。如在广播监测中,我们需要将播出原音频与接听到的音频进行比对,而接听到的音频 并非如原音频一般纯净,常常含有噪声;又如为了达到更好的播出主观收听效果,在广播发 射前,通常使用音频均衡器来对播出音频的频谱进行调节。这些处理,使得被处理音频相对 于原音频发生了较大的变化。在这种情况下,传统的比对方法往往不能适用,因为广播音频 比对需要判定播出的音频内容本身是否相同,而非听觉效果上是否一致,即某音频即使在 受到一定噪声干扰、频谱调节等处理后,算法仍应该判定该音频与其原音频是相似的(或 互为相似音频)。虽然文献中也出现了对音频变化不敏感的比对方法,如基于Philips音频 指纹的比对方法,但这些方法中,处理前后两音频间的距离与真正完全不同的两音频间的 距离相差不大,故判别上容易混淆,尤其是在强噪声干扰或音频处理的变化幅度较大时,会 出现判别错误;另一方面,在比对的计算效率上,现有方法的计算复杂度相对较高,比对所 需的时间相对较长,不利于实时处理。

【发明内容】

[0005] 本发明的目的在于针对【背景技术】存在的问题,采用新的音频提取特征和特征匹配 方法,提供一种适合广播音频的比对方法。
[0006] 本发明的技术方案是:一种基于感知滤波的音频实时比对方法,包括以下步骤:
[0007]S1.滤波器组设计:设定低频段的频率范围为0~F1,采用n个带宽相同的三角带 通滤波器;中频段的频率范围为F1~F2,采用一组m个带宽依次递增的三角带通滤波器; f?,f?,t分别表示第i个滤波器的上截止频率、中心频率和下截止频率,1彡i彡k,k= m+n,即k为0~F2频率范围内滤波器的总个数,
[0008] S11.低频段设计:设处于低频段的第i个滤波器的中心频率为iXFl/n,相邻滤波 器的截止频率满足以=f ?+1,以=f/+1,设置各滤波器中心频率处的滤波系数为1 ;
[0009] S12.中频段设计:设处于中频段的第i个滤波器的上截止频率为以,其中f\n+1 = F1,计算第i个三角带通滤波器的中心频率f/:
[0011] 其中
[0012] A= 12. 46X10_^/-9912, 78X10-4,B= 186. 78X10_3f/-1269. 25 ,
,计算第i个三角带通滤波器的下截止频率fhS
[0013]fh'=f^+12. 46X10_6fci+186. 78X10^/+57. 04 (2)
[0014] 对处于中频段的第i+1个滤波器,使其上截止频率等于第i个滤波器的中心频率, 即f\i+1=f/,且按(1)和(2)式依次计算其中心频率f;i+1和下截止频率fhi+1;当上截止频 率超过F2时终止,设置各滤波器中心频率处的滤波系数为1;
[0015]S13.高频段设计:对于高于F2频段,滤波器系数设为全0;
[0016]S14.滤波系数调整:设Q代表第i个滤波器的滤波系数矢量,对各滤波器系数矢 量进行如下调整:
[0017] Ci= u i ? Cj, 1 ^ i ^ k (3)
[0018] 其中h为第i个滤波器的调整系数,可通过下式计算:
[0020]S2.特征提取:对待比对的两个音频,分别进行如下操作:
[0021]S21.音频数据分帧:将音频数据按固定长度划分为各音频帧,相邻帧间有重叠; 将每一帧数据排列成一列矢量,并将矢量中各元素除以列矢量中元素绝对值的最大值进 行归一化,将归一化处理后的帧数据保存在数据矩阵A中;设总的音频帧数目为M,则A= [a^a2,a3,? ? ?,aM],其中A的每一列a」表不第j帧的数据;
[0022] S22.读取音频帧:取一帧音频aj设定初始值为0的帧计数器,每取一音频帧,帧 计数器加1 ;
[0023]S23.计算音频帧功率谱:对音频帧的数据进行加窗处理,进行短时傅里叶变 换,得到音频帧的频谱;对频谱幅度值求平方得到功率谱;
[0024]S24.计算音频帧特征:用步骤S1设计出的滤波器组(k个滤波器)对上步得到的 功率信号进行滤波处理;对每个滤波器,将其滤波输出的信号进行求和,得到该滤波器的输 出能量;将k个滤波器的输出能量数据排列成一列矢量,该矢量即为该帧信号的特征矢量, 记为
[0025]S25.若帧计数器的当前计数值小于M,则转至步骤S22;
[0026]S26.生成音频特征:将各音频帧的特征矢量Vj排列成一矩阵V= [Vpv2,v3, . . .,vM],该矩阵即为当前音频信号的特征矩阵;
[0027]S3?特征匹配:
[0028] 设待比对的两个音频信号的特征矩阵分别为V1和V2,将V1和V2的对应元素进行比 较,若两个元素的值都大于设定的阈值Tp (10彡Tp< 100),则记两个元素的距离为0 ;否则, 计算两个元素的值差的平方,作为其距离;对所有对应元素对的距离进行平均,将该平均值 作为待比对的两个音频信号的距离,记为d;
[0029]S4.相似度判定:将待比对两个音频信号的距离d除以单位距离得到相对距离比, 若该距离比小于设定的阈值Td(0. 3 <Td< 0. 5),则判定两个音频信号相似,否则不相似。
[0030] 本发明的有益效果:本发明提供一种音频实时比对方法,该方法具有较高的比对 容错性,在音频受到噪声干扰,或进行了音效处理的等情况下均能实现正确的比对;同时, 该方法算法简单、处理快速,能够广泛应用于广播电台的节目监播、广告监测和管理等。
【附图说明】:
[0031] 图1为EQ处理均衡器设置图,其中,(a)为流行风格均衡器设置、(b)为摇滚风格 均衡器设置、(c)为经典风格均衡器设置。
[0032] 图2为滤波器组频率响应图。
[0033] 图3为特征提取过程流程图。
[0034] 图4为音频比对流程图。
【具体实施方式】
[0035] 仿真实验共选择了 16个音频作为测试音频。其中前6个音频为未经处理的原广 播音频,均为单声道,48k采样率,包含广告、乐曲和歌曲各两个,其具体信息如表1描述;后 10个音频对歌曲1作均衡(EQ)、压缩、加噪等处理得到的音频,其音频具体信息如表2描 述,EQ处理的均衡器设置如图1所示。
[0036]表1原测试音频信息

[0039]表2歌曲1处理后的各音频信息
[0041] 本实施例以"歌曲1"及对其进行pop风格均衡处理后的"歌曲1-pop"这对音频 为例,对其进行比对,具体步骤如下:
[0042] S1?滤波器设计:
[0043] S11.低频段设计:设定低频段的频率范围为0~1000Hz ;在低频段采用8个带宽 相同的三角带通滤波器;设f?,f/,C分别表示第i个滤波器的上截止频率,中心频率和下 截止频率,则处于低频段第i个滤波器的中心频率为iX 125,相邻滤波器的截止频率满足 f/=f^+1,以=f/+1。设置各滤波器中心频率处的滤波系数为1 ;低频段各滤波器的上截 止频率,中心频率和下截止频率如表1所示:
[0044] 表1低频段滤波器组参数

[0047] S12.中频段设计:设定中频段的频率范围为1000~2000Hz;在中频段采用一组6 个带宽依次递增的三角带通滤波器;设处于中频段的第i个三角带通滤波器的上截止频率 为,其中,f?= 1000Hz,计算第i个三角带通滤波器的中心频率fV:
[0049] 其中
[0050] A = 12. 46 X 10_^/-9912, 78 X 10-4, B = 186. 78 X 10_3f/-1269. 25 ,
,计算第i个三角带通滤波器的下截止频率fhS
[0051] fh'= f ^+12. 46 X 10^+186. 78 X 10^+57. 04 (2)
[0052] 对处于中频段的第i+1个滤波器,使其上截止频率等于第i个滤波器的中心频率, 即f\i+1=f/,且按(1)和(2)式依次计算其中心频率f;i+1和下截止频率fhi+1;当上截止频 率超过2000Hz时终止。设置各滤波器中心频率处的滤波系数为1 ;中频段各滤波器的上截 止频率,中心频率和下截止频率如表2所示:
[0053] 表2中频段滤波器组参数
[0055]
[0056]S13.高频段设计:对于高于2000Hz频段,滤波器系数设为全0;
[0057]S14.滤波系数调整:设Q代表第i个滤波器
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1