一种根据频域能量对音频信号进行检测的方法和装置的制造方法_5

文档序号:9581906阅读:来源:国知局
-音频信号中的音频信号 顿,例如:语音信号、铃音信号、双音多频(dual-tonemulti化equency,DTM巧信号和频移 键控(Frequenc厂shiftk巧ing,FSK)信号等等。其中,上述铃音信号可W包括;彩铃、标准 铃音和异常铃音。另外,上述音频信号顿可W是待检测的音频信号中任一位置的音频信号 顿,例如巧W是待检测的音频信号的起始峽,或者可W是待检测的音频信号的中间部位的 信号顿,或者可W是待检测的音频信号的结束峽。
[0204] 获取单元122,用于获取所述音频信号顿的频域能量分布,其中,所述频域能量分 布表示所述音频信号峽在频域上的能量分布特性。
[020引获得单元123,用于根据所述音频信号顿的所述频域能量分布,得到所述音频信号 顿的频域能量分布导数的极大值分布特征。
[0206] 集合单元124,用于将所述音频信号帧及所述音频信号顿预巧邻域范围内的每一 峽作为一个顿集合,该顿集合包括待检测顿。
[0207] 可选的,上述预设邻域范围可W是预先设置的顿数量范围,例如,上述音频信号顿 预设邻域范围内的顿可W是指,与__t述音频信号顿前后相邻的特定数量的音频信号峽,该 样上述峽集合就包括上述音频信号峽W及与上述音频信号顿前后相邻的特定数量的音频 信号顿。或者上述预i受邻域范围可W是预先i受置的时间范围,例如:上述音频信号顿预设邻 域范围内的峽可W是指,与上述音频信号顿前后相信的特定时间接收到的音频信号峽,该 样上述峽集合就包括上述音频信号峽W及与__t述音频信号峽前后相信的特定时间接收到 的音频信号顿。上述待检测顿可W是上述顿集合中包括的一个或者多个音频信号顿。
[0208] 检测单元125,用于根据所述顿集合的频域能量分布导数的极大值分布特征对所 述待检测顿进行检测。
[0209] 其中,__t述峽集合的频域能量分布导数的极大值分布特征可W是指,上述峽集合 中一个或者多个音频信号峽的频域能量分布导数的极大值分布特征,或者上述峽集合的频 域能量分布导数的极大值分布特征可W是指,上述顿集合中各音频信号峽的频域能量分布 导数的极大值分布特征。
[0210] 在另一个实施例中,检测单元125可W是对上述待检测峽进行音频信号分类的检 巧Ii,或者检测单元。5可W是对上述待检测顿进行音频信号特征的检测等等。
[0211] 可选的,获取单元122具体可W用于获取所述音频信号顿任- '所述设定频域范围 内的能量总和与所述音频信号顿在设定频域范围内的总能量的比值,所述比值表示所述音 频信号顿的频域能量分布。
[0212] 其中,上述设定频域范围可W是预先i受定,另外,可W是预先i受定多个频域范围。
[0213] 该实施方式中,获取单元122具体可W用于对所述音频信号顿进行傅里叶变换得 到频域信号;
[0214]W及根据
得到所述频 域能量分布比值; 阳引引其中,f表示谱线数,fe化(Fiim-U],巧FFT变换大小为F,Fiim《F/2,Re_fft(i)表示FFT变换结果的实部,Im_fftG)表示FFT变换结果的虚部,
表示所述音频信号顿在fe[0,(Fiim-I)]所对应频域范围 内的能量总化i(Rc_ ///2(/) +lm_於W)表示所述音频信号峽在0~f所对应频域范围内 Z=O _ 的总能量。
[0216] 在另-'个实施例中,如图13所示,获得单元123,可W包括:
[0217] 求导单元1231,用于对所述频段能量分布比值进行求导,得到频段能量分布导 数; 阳218] 获得子单元1232,用于根据所述频段能量分布导数,得到所述音频信号顿的频域 能量分布导数的极大值分布特征。
[0219] 其中,求导单元1231通过微分运算对所述频段能量分布比值进行求导,W得到频 段能量分布导数。例如:求导单元1231可W通过拉格朗日(Lagrange)数值微分方法对所 述频段能量分布比值进行求导。
[0220] 可选的,求导单元1231执行对所述频段能量分布比值进行求导,得到频段能量分 布导数具体包括:
[0222] 其中,N表示数值微分阶数;rat.io_energy'k(f)表示第k峽的能量分布比值的 导数;ratio_energyk(n)表示第k峽的能量分布比值,
[0223] 通过上述公式就可W得到频段能量分布导数。
[0224] 可选的,获得子单元1232具体可W用于获取能量分布参数的导数值中的至少-' 个极大值;W及根据每个所述极大值所处的谱线的位置得到所述音频信号顿的频域能量分 布导数的极大值分布特征。
[0225] 其中,上述至少一个极大值可W是上述能量分布参数的至少一个导数值按照数值 从高到低的顺序排序中排在前面的--个或者多个导数值,例如:上述至少--个极大值表示 为一个极大值时,那么上述至少一个极大值可W是上述能量分布参数的导数值中的最大 值;上述至少一个极大值表示为两个极大值时,那么上述至少一个极大值可W包括上述能 量分布参数的导数值中上述能量分布参数的导数值中的最大值和第二大值。
[0226] 由于上述得到了每个所述极大值所处的谱线的位置,那么就可W得到所述音频信 号顿的频域能量分布导数的极大值分布特征。例如:上述音频信号峽的频域能量分布导数 的极大值分布特征可W包括该音频信号顿能量分布参数的导数值中的至少一个极大值所 处的谱线的位置。
[0227] 在另--个实施例中,检测单元125具体可W用于:
[0228] 如果在所述顿集合的频域能量分布导数的极大值分布参数中,位于预设的第一区 间的参数数量大于等于第一阔值,则确定待检测帧为标准的待检测信号;
[0229] 如果待检测峽不是标准的待检测信号,但是在所述顿集合的频域能量分布导数的 极大值分布参数中,位于预设的第二区间的参数数量大于等于第二阔值,则确定待检测顿 为异常的待检测信号。
[0230] 可选的,所述峽集合的频域能量分布导数的极大值分布参数可W是指上述顿集合 中各音频信号峽的频域能量分布导数的极大值分布参数,另外,频域能量分布导数的极大 值分布参数可W是用于表示该频域能量分布导数的极大值分布特征的参数。另外,上述第 一区间可W是预先设定与上述标准的待检测信号对应的参数区间,例如:预先设定与上述 标准的待检测信号对应的谱线位置区间,且上述第一阔值也可W是预先设定与上述标准的 待检测信号对应的阔值。上述第二区间可W是预先设定与上述异常的待检测信号对应的参 数区间,例如:预先设定与上述异常的待检测信号对应的谱线位置区间,且上述第二阔值也 可W是预先设定与__t述异常的待检测信号对应的阔值。另外,上述第区间的区间范围可 W是大于或者小于第一区间的区间范围。
[0231] 该实施方式中,可W实现先检测待检测顿是否为标准的待检测信号,若是,则确定 检测待检测顿为标准的待检测信号,若否,则检测检测待检测顿是否为异常的待检测信号。 从而可W实现检测出标准的待检测信号,W及检测出异常的待检测信号。
[0232] 可选的,上述装置可W应用于任何具体计算和播放音频信号功能的电子设备,例 如:平板电脑、手机、电子阅读器、遥控器、PC、笔记本电脑、车载设备、网络电视、可穿戴设 备、网络设备、服务器、基站和UMG等电子设备。
[0233] 本实施例中,接收音频信号峽后,获取所述音频信号顿的频域能量分布;再根据所 述音频信号顿的所述频域能量分布,得到所述音频信号顿的频域能量分布导数的极大值分 布特征;再将所述音频信号峽及所述音频信号顿预设邻域范围内的每一峽作为一个顿集 合,该顿集合包括待检测顿;该样就可W根据所述顿集合的频域能量分布导数的极大值分 布特征对所述待检测顿进行检测。从而本发明可W实现对音频信号进行检测。
[0234] 请参阅图14,图H是本发明实施例提供的另一种根据频域能量对音频信号进行 检测的装置的结构示意图,如图14所示,该装置包括:至少--个处理器141,例如CPU,至少 一个网络接口 142或者其他用户接口 143,存储器145,至少一个通信总线142。通信总线 142用于实现这些组件之间的连接通信。该计算节点140可选的包含用户接口 143,包括 显示器,键盘或者点击i受备(例如,鼠标,轨迹球(trackball),触感板或者触感显示屏)。 存储器145可能包含高速MM存储器,也可能还包括非不稳定的存储器(non-volatile memo巧),例如至少一个磁盘存储器。存储器145可选的可W包含至少一个位于远离前述处 理器141的存储装置。
[0235] 在一些实施方式中,存储器145存储了如下的元素,可执行模块或者数据结构,或 者他们的子集,或者他们的扩展集:
[0236] 操作系统1451,包含各种系统程序,用于实现各种基础业务W及处理基于硬件的 任务;
[0237] 应用程序模块1452,包含各种应用程序,用于实现各种应用业务。
[0238] 在本发明实施例中,通过调用存储器145存储的程序或指令,处理器141用于:
[0239] 接收音频信号顿;
[0240] 获取所述音频信号帧的频域能量分布,其中,所述频域能量分布表示所述音频信 号顿在频域上的能量分布特性;
[0241] 根据所述音频信号顿的所述频域能量分布,得到所述音频信号顿的频域能量分布 导数的极大值分布特征;
[0242] 将所述音频信号顿及所述音频信号帧预设邻域范围内的每一峽作为一个峽集合, 该峽集合包括待检测峽;
[0243] 根据所述顿集合的频域能量分布导数的极大值分布特征对所述待检测顿进行检 测。
[0244] 另一个实施例中,处理器141执行的根据权利要求1所述的对音频信号进行检测 的方法,其特征在于,所述获取所述音频信号顿的频域能量分布的操作,具体可W包括:
[0245] 获取所述音频信号峽任- '所述设定频域范围内的能量总和与所述音频信号顿在 设定频域范围内的总能量的比值,所述比值表示所述音频信号峽的频域能量分布。
[0246] 可选的,处理器141执行获取所述音频信号顿任一所述巧定频域范围内的能量总 和与所述音频信号顿在设定频域范围内的总能量的比值的操作,具体可W包括:
[0247] 对所述音频信号顿进行傅里叶变换得到频域信号; 阳24引根据
得到所述频 域能量分布比值;
[0249]其中,f表示谱线数,fG[0,化im-U],设FFT变换大小为F,Fiim《F/2, Re_fft(i)表示FFT变换结果的实部,表示FFT变换结果的虚部,
表示所述音频信号顿在
当前第5页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1