一种音频中人声突出处理的方法及装置的制造方法

文档序号:9201455阅读:831来源:国知局
一种音频中人声突出处理的方法及装置的制造方法
【技术领域】
[0001] 本发明涉及到多媒体信息领域,特别涉及到一种音频中人声突出处理的方法及装 置。
【背景技术】
[0002] 随着多媒体技术不断的发展,音视频信息在人们的工作、文体和娱乐生活中的作 用越来越重。然而,TV上的一些节目源,会出现背景声音较大导致节目中的人物对话听起来 不够清晰的情况,例如雨声中的人物对话,枪战背景的人物对话,新闻节目中的现场采访。 针对这类问题,现有的TV在"声音设置"中有"语音清晰"、"新闻"选项,用户在观看这类节 目时,可以手动打开这些选项,但是对于一些节目源调用该功能效果会更差,例如一些音乐 类的节目,用户需手动关闭该功能,这样用户为了达到比较好的声音效果,必须频繁手动开 关,这给用户来带来不少麻烦,以至于该功能形同摆设,并没有多少用户去频繁开它。
[0003] 另外传统的"语音清晰"、"新闻"算法是通过提升中频段(200Hz至8kHz)的增益, 或者降低该频段以外的频域增益,或者两种措施同时加入。但是实际的节目中的人声在某 个小时间段并未有这么宽的带宽,多数仅是该频段内的一小部分,因此并不能很好的达到 突出人声的效果。

【发明内容】

[0004] 本发明的主要目的为提供一种音频中人声突出处理的方法及装置,旨在方便准确 的识别人声并对识别出的人声进行突出。
[0005] 本发明提供一种音频中人声突出处理的方法,该方法包括:
[0006] 对音频信号进行分帧处理,以得到各个音频帧信号;
[0007] 对得到的音频帧信号进行分组,每N个音频帧信号分为一组,分析每一分组中音 频帧信号的频带范围、频带能量、低能量帧率及过零率的特性,并根据每一分组对应的分析 结果,确定每一分组音频帧信号中是否有人声,N取大于1的正整数;
[0008] 若有分组音频帧信号中有人声,则对该分组的音频帧信号进行带通滤波,以输出 滤波后的第一音频信号。
[0009] 优选地,所述对得到的音频帧信号进行分组,每N个音频帧信号分为一组,分析每 一分组中音频帧信号的频带范围、频带能量、低能量帧率及过零率的特性,并根据每一分组 对应的分析结果,确定每一分组音频帧信号中是否有人声频带范围步骤包括:
[0010] 对得到的音频帧信号进行分组,每N个音频帧信号分为一组;
[0011] 分析每一分组音频帧信号的频带范围是否与预设人声频带范围有交集;
[0012] 若所述分组音频帧信号的频带范围与预设人声频带范围有交集,则分析所述分组 音频帧信号在预设人声频带范围内的能量与所述分组音频帧信号在预设人声频带范围外 的能量的比例是否大于等于第一预设阀值;
[0013] 若所述分组音频帧信号在预设人声频带范围内的能量与所述分组音频帧信号在 预设人声频带范围外的能量的比例大于等于第一预设阀值,分析所述分组音频帧信号的低 能量帧率是否小于第二预设阀值;
[0014] 若所述分组音频帧信号的低能量帧率小于第二预设阀值,则分析所述分组音频帧 信号的每帧音频信号的过零率是否按照一预设规律交替变化;
[0015] 若所述分组音频帧信号的每帧音频信号的过零率按照一预设规律交替变化,则确 定所述分组音频帧信号中有人声。
[0016] 优选地,所述若有分组音频帧信号中有人声,则对该分组的音频帧信号进行带通 滤波,以输出滤波后的第一音频信号的步骤包括:
[0017] 若有分组音频帧信号中有人声,则将所述分组的音频帧信号在预设人声频带范围 的音频信号分成预设数量的频段,并计算各个频段的能量及找出最大能量;
[0018] 将分成预设数量的频段从低频段到高频段排序,获取与最大能量之差大于预设差 值的第一个频段的中心频点及获取与最大能量之差小于预设差值的第一个频段的中心频 占.
[0019] 调用截止频率范围包括与最大能量之差大于预设差值的该第一个频段的中心频 点的高通滤波器对所述分组的音频帧信号进行滤波,以输出第二音频信号;及并调用截止 频率范围包括与最大能量之差小于预设差值的该第一个频段的中心频点低通滤波器对所 述第二音频信号进行滤波,以输出第一音频信号。
[0020] 优选地,所述调用截止频率范围包括与最大能量之差大于预设差值的该第一个频 段的中心频点的高通滤波器对所述分组的音频帧信号进行滤波,以输出第二音频信号;及 并调用截止频率范围包括与最大能量之差小于预设差值的该第一个频段的中心频点低通 滤波器对所述第二音频信号进行滤波,以输出第一音频信号的步骤之后,该方法还包括:
[0021] 对输出的第一音频信号通过以下公式处理,以输出第三音频信号;
[0023] 其中:其中ω =2 π f,f是频率,X ( ω )是第一首频/[目号f对应的/[目号幅度。将预 设人声频带范围(fl_f5)分为四个频段,分别是(fl-f2)、(f2-f3)、(f3-f4)、(f4-f5)。
[0024] 优选地,所述若有分组音频帧信号中有人声,则对该分组的音频帧信号进行带通 滤波,以输出滤波后的第一音频信号的步骤之后,该方法还包括:
[0025] 将所述第一音频信号通过一预设截止频率的低通滤波器,以输出第四音频信号。
[0026] 本发明还提供一种音频中人声突出处理的装置,该装置包括:
[0027] 分帧处理模块,用于对音频信号进行分帧处理;
[0028] 分析确定模块,用于对得到的音频帧信号进行分组,每N个音频帧信号分为一组, 分析每一分组中音频帧信号的频带范围、频带能量、低能量帧率及过零率的特性,并根据每 一分组对应的分析结果,确定每一分组音频帧信号中是否有人声,N取大于1的正整数;
[0029] 第一处理模块,用于在若有分组音频帧信号中有人声,则对该分组的音频帧信号 进行带通滤波,以输出滤波后的第一音频信号。
[0030] 优选地,所述分析确定模块包括:
[0031] 分组单元,用于对得到的音频帧信号进行分组,每N个音频帧信号分为一组;
[0032] 第一分析单元,用于分析每一分组音频帧信号的频带范围是否与预设人声频带范 围有交集;
[0033] 第二分析单元,用于在分组音频帧信号的频带范围与预设人声频带范围有交集 时,分析所述分组音频帧信号在预设人声频带范围内的能量与所述分组音频帧信号在预设 人声频带范围外的能量的比例是否大于等于第一预设阀值;
[0034] 第三分析单元,用于在分组音频帧信号在预设人声频带范围内的能量与所述分组 音频帧信号在预设人声频带范围外的能量的比例大于等于第一预设阀值时,分析所述分组 音频帧信号的低能量帧率是否小于第二预设阀值;
[0035] 第四分析单元,用于在分组音频帧信号的低能量帧率小于第二预设阀值时,分析 所述分组音频帧信号的每帧音频信号的过零率是否按照一预设规律交替变化;
[0036] 确定单元,用于在所述分组音频帧信号的每帧音频信号的过零率按照一预设规律 交替变化时,确定所述分组音频帧信号中有人声。
[0037] 优选地,所述第一处理模块包括:
[0038] 第一处理单元,用于在若有分组音频帧信号中有人声时,将所述分组的音频帧信 号在预设人声频带范围的音频信号分成预设数量的频段,并计算各个频段的能量及找出最 大能量;
[0039] 获取单元,用于将分成预设数量的频段从低频段到高频段排序,获取与最大能量 之差大于预设差值的第一个频段的中心频点及获取与该最大能量之差小于预设差值的第 一个频段的中心频点;
[0040] 调用单元,用于调用截止频率范围包括与最大能量之差大于预设差值的该第一个 频段的中心频点的高通滤波器对所述分组的音频帧信号进行滤波,以输出第二音频信号; 及并调用截止频率范围包括与最大能量之差小于预设差值的该第一个频段的中心频点低 通滤波器对所述第二音频信号进行滤波,以输出第一音频信号。
[0041] 优选地,所述第一处理模块还包括:
[0042] 第二处理单元,用于对输出的第一音频信号通过以下公式处理,以输出第三音频 信号;
[0044] 其中:其中ω =2 π f,f是频率,X ( ω )是第一首频/[目号f对应的/[目号幅度。将预 设人声频带范围(fl_f5)分为四个频段,分别是(fl-f2)、(f2-f3)、(f3-f4)、(f4-f5)。
[0045] 优选地,所述装置还包括:
[0046] 第二处理模块,用于将所述第一音频信号通过一预设截止频率的低通滤波器,以 输出第四音频信号。
[0047] 采用本发明,对音频信号进行分帧处理,以得到
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1