一种音频处理方法及装置制造方法

文档序号:2826336阅读:284来源:国知局
一种音频处理方法及装置制造方法
【专利摘要】本发明实施例提供了一种音频处理方法及装置,其中的方法可包括:从待处理的音频文件中选取区间音频数据;构建所述区间音频数据的特征参数序列,所述特征参数序列包括能量序列和Pitch序列;根据所述区间音频数据的特征参数序列,定位所述音频文件的副歌。本发明可以对音频文件进行副歌定位,提升音频处理的智能性。
【专利说明】一种音频处理方法及装置

【技术领域】
[0001] 本发明涉及互联网【技术领域】,具体涉及音频处理【技术领域】,尤其涉及一种音频处 理方法及装置。

【背景技术】
[0002] 副歌,通常指音频文件(如歌曲、音乐等等)的高潮部分。以歌曲为例,一首歌曲通 常采用AA' BA' Form (音乐结构),A代表主歌,而B代表副歌;也即时说,通常一首歌曲由 "前奏+两段主歌+ -段副歌+过门音乐+ -段副歌+ -段主歌+结尾音乐"按顺序连接构 成。副歌定位对音频文件的分析和处理起着重要作用,因此,如何在音频文件中进行副歌定 位,成为音频处理领域的一个亟待解决的重要问题。


【发明内容】

[0003] 本发明实施例提供一种音频处理方法及装置,可以对音频文件进行副歌定位,提 升音频处理的智能性。
[0004] 本发明第一方面提供一种音频处理方法,可包括:
[0005] 从待处理的音频文件中选取区间音频数据;
[0006] 构建所述区间音频数据的特征参数序列,所述特征参数序列包括能量序列和 Pitch (音高)序列;
[0007] 根据所述区间音频数据的特征参数序列,定位所述音频文件的副歌。
[0008] 本发明第二方面提供一种音频处理装置,可包括:
[0009] 选取模块,用于从待处理的音频文件中选取区间音频数据;
[0010] 构建模块,用于构建所述区间音频数据的特征参数序列,所述特征参数序列包括 能量序列和Pitch序列;
[0011] 定位模块,用于根据所述区间音频数据的特征参数序列,定位所述音频文件的副 歌。
[0012] 实施本发明实施例,具有如下有益效果:
[0013] 本发明实施例可从待处理的音频文件中选取区间音频数据,构建区间音频数据的 特征参数序列,以实现音频文件的副歌定位,提升了音频处理的智能性;另外,由于仅需要 从音频文件中选取区间音频数据进行音频处理,可有效提升音频处理的效率,进一步提升 音频处理的智能性。

【专利附图】

【附图说明】
[0014] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的附图。
[0015] 图1为本发明实施例提供的一种音频处理方法的流程图;
[0016] 图2为本发明实施例提供的图1所示的步骤S101的实施例的流程图;
[0017] 图3为本发明实施例提供的图1所示的步骤S102的实施例的部分流程图;
[0018] 图4为本发明实施例提供的图1所示的步骤S102的实施例的另一部分流程图; [0019] 图5为本发明实施例提供的图1所示的步骤S103的实施例的流程图;
[0020] 图6为本发明实施例提供的一种音频处理装置的结构示意图;
[0021] 图7为本发明实施例提供的选取模块的实施例的结构示意图;
[0022] 图8为本发明实施例提供的构建模块的实施例的部分结构示意图;
[0023] 图9为本发明实施例提供的构建模块的实施例的另一部分结构示意图;
[0024] 图10为本发明实施例提供的预处理单元的实施例的结构示意图;
[0025] 图11为本发明实施例提供的定位模块的实施例的结构示意图。

【具体实施方式】
[0026] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
[0027] 本发明实施例中,音频文件可以包括但不限于:歌曲、歌曲片段、音乐、音乐片段、 演奏乐、演奏乐片段、哼唱歌曲、哼唱歌曲片段等文件。本发明实施例的音频处理方案可以 应用于互联网领域的多个场景中,例如:可以应用于对互联网音频库中的音频文件进行分 析处理的场景,包括:可应用于主音查找的场景中进行副歌的快速定位和准确提取,也可应 用于哼唱搜索的场景中进行副歌的快速定位和准确提取,还可应用于乐曲识别的场景中进 行副歌的快速定位和准确提取等等;或者,可以应用于对互联网音频库中的音频文件进行 试听的场景,包括:可提供副歌进行在线播放或音乐下载前的试听;或者,可以应用于彩铃 下载或试听场景,包括:快速定位和准确提取副歌,将副歌作为彩铃提供给用户进行下载或 试听,等等。
[0028] 下面将结合附图1-附图5,对本发明实施例提供的音频处理方法进行详细介绍。 需要说明的是,附图1-附图5所示的音频处理方法可以由本发明实施例提供的音频处理 装置所执行,该音频处理装置可运行于终端设备或服务器中,其中,终端设备可包括但不限 于:PC (Personal Computer,个人计算机)、PAD (平板电脑)、手机、智能手机、笔记本电脑等 设备。
[0029] 请参见图1,为本发明实施例提供的一种音频处理方法的流程图;该方法可包括 以下步骤S101-步骤S103。
[0030] S101,从待处理的音频文件中选取区间音频数据。
[0031] 本发明实施例中,区间音频数据指从音频文件中所选取的、某个时长区间范围所 确定的音频数据,例如:假设音频文件的时长为τ,[T/5,3T/5]的时长区间范围可确定一个 区间音频数据,[Τ/2,Τ]的时长区间范围又可确定另一个区间音频数据,等等。本步骤中, 可根据实际情况从音频文件中选取合理的区间音频数据,例如:根据对大量音频文件的统 计数据,从音频文件中选取区间音频数据;或者根据对音频文件进行分析处理获得的实验 数据,从音频文件中选取区间音频数据。
[0032] S102,构建所述区间音频数据的特征参数序列,所述特征参数序列包括能量序列 和Pitch序列。
[0033] Pitch指各种不同高低的声音,即音的高度,音的基本特征的一种。一个区间音频 数据可以表示为多帧音频帧信号组成的一个帧序列,该区间音频数据的每帧音频帧信号均 具备能量和Pitch值。本步骤中,可以对该区间音频数据的每一帧音频帧信号进行能量计 算,获得该区间音频数据的每一帧音频帧信号的能量,从而构建该区间音频数据的能量序 列;可以对该区间音频数据的每一帧音频帧信号进行Pitch检测,获得该区间音频数据的 每一巾贞音频巾贞信号的Pitch值,从而构建该区间音频数据的Pitch序列。
[0034] S103,根据所述区间音频数据的特征参数序列,定位所述音频文件的副歌。
[0035] 副歌,通常指音频文件的高潮部分。以歌曲为例,一首歌曲通常采用AA'BA'Form, A代表主歌,而B代表副歌;也即时说,通常一首歌曲由"前奏+两段主歌+ -段副歌+过门 音乐+ -段副歌+ -段主歌+结尾音乐"按顺序连接构成。本步骤可基于所选取的区间音 频数据的特征参数序列,定位音频文件的副歌。
[0036] 下面将结合附图2-附图5,对图1所示的音频处理方法中的各步骤进行详细介绍。
[0037] 请参见图2,为本发明实施例提供的图1所示的步骤S101的实施例的流程图;该 步骤S101可包括以下步骤sllOl-步骤sll03。
[0038] si 101,获取所述待处理的音频文件的时长。本实施例可假设音频文件的时长为T, 即所述音频文件的时长区间为[0, T]。
[0039] S1102,按照预设的时间比范围,计算所选取的时长区间。
[0040] 时间比范围可表示为[&,rh],其中&和rh分别代表时间占比,[&,r h]的取值为 [0,1],且&〈心。时间比范围[RpRj可以根据实际情况进行设定,例如:时间比范围可根据 对大量音频文件的统计数据进行设定;或者时间比范围可根据对音频文件进行分析处理获 得的实验数据进行设定。假设预设的时间比范围为[1/5, 3/5],即&=1/5, RH=3/5,本步骤计 算获得所选取的时长区间则为[T/5,3T/5]。
[0041] S1103,根据所述时长区间,从所述音频文件中选取区间音频数据。
[0042] 参照步骤S1102所示例子,本步骤可从音频文件中选取[Τ/5,3Τ/5]这一时长区间 所确定的区间音频数据。
[0043] 下面将结合图3-图4,对图1所示的步骤S102进行详细介绍。需要说明的是,该步 骤S102由两个构建过程组成,其中一个构建过程为"构建所述区间音频数据的能量序列" 的过程,该构建过程具体可参见下述图3所示实施例的描述;另一个构建过程为"构建所述 区间音频数据的Pitch序列"的过程,该构建过程具体可参见下述图4所示实施例的描述。
[0044] 请参见图3,为本发明实施例提供的图1所示的步骤S102的实施例的部分流程图; 该步骤S102可包括以下步骤sl201-步骤sl203。
[0045] S1201,对所述区间音频数据进行分帧处理,获得至少一帧音频帧信号。
[0046] -个区间音频数据可以表示为多帧音频帧信号组成的一个帧序列,本步骤中,假 设该区间音频数据包含的任一帧音频帧信号可表示为 Xi (η),每帧音频帧信号的帧长为Ts, 进行分帧处理可获得的音频帧信号的数量为FN。其中,i表示该区间音频数据中该帧音频 帧信号的顺序,i为正整数且i = 1,2,. . . FN-1 ;n为正整数且η = 0, 1,2, N-1,其中N为该

【权利要求】
1. 一种音频处理方法,其特征在于,包括: 从待处理的音频文件中选取区间音频数据; 构建所述区间音频数据的特征参数序列,所述特征参数序列包括能量序列和音高 Pitch序列; 根据所述区间音频数据的特征参数序列,定位所述音频文件的副歌。
2. 如权利要求1所述的方法,其特征在于,所述从待处理的音频文件中选取区间音频 数据,包括: 获取所述待处理的音频文件的时长; 按照预设的时间比范围,计算所选取的时长区间; 根据所述时长区间,从所述音频文件中选取区间音频数据。
3. 如权利要求2所述的方法,其特征在于,所述构建所述区间音频数据的特征参数序 列,包括: 对所述区间音频数据进行分帧处理,获得至少一帧音频帧信号; 计算所述至少一帧音频帧信号中的各帧音频帧信号的能量; 按照所述至少一帧音频帧信号中的各帧音频帧信号的顺序,对所述各帧音频帧信号的 能量进行排列,构建所述区间音频数据的能量序列。
4. 如权利要求3所述的方法,其特征在于,所述构建所述区间音频数据的特征参数序 列,还包括: 对所述至少一帧音频帧信号的各帧音频帧信号进行预处理; 对所述预处理后的各帧音频帧信号进行自相关计算,获得所述各帧音频帧信号的自相 关函数; 根据所述各帧音频帧信号的自相关函数,计算所述各帧音频帧信号的Pitch值; 按照所述至少一帧音频帧信号中的各帧音频帧信号的顺序,对所述各帧音频帧信号的 Pitch值进行排列,构建所述区间音频数据的Pitch序列。
5. 如权利要求4所述的方法,其特征在于,所述对所述至少一巾贞音频巾贞信号的各巾贞音 频帧信号进行预处理,包括: 对所述各巾贞音频巾贞信号进行加窗处理; 对所述加窗处理后的各帧音频帧信号进行带通滤波处理。
6. 如权利要求2-5任一项所述的方法,其特征在于,所述根据所述区间音频数据的特 征参数序列,定位所述音频文件的副歌,包括: 分别对所述区间音频数据的能量序列和Pitch序列进行归一化处理; 根据所述归一化后的能量序列、所述归一化后的Pitch序列以及预设的副歌时长,计 算副歌在所述区间音频数据中的位置; 根据所述副歌在所述区间音频数据中的位置,在所述音频文件中定位所述副歌。
7. -种音频处理装置,其特征在于,包括: 选取模块,用于从待处理的音频文件中选取区间音频数据; 构建模块,用于构建所述区间音频数据的特征参数序列,所述特征参数序列包括能量 序列和首1? Pitch序列; 定位模块,用于根据所述区间音频数据的特征参数序列,定位所述音频文件的副歌。
8. 如权利要求7所述的装置,其特征在于,所述选取模块包括: 时长获取单元,用于获取所述待处理的音频文件的时长; 区间计算单元,用于按照预设的时间比范围,计算所选取的时长区间; 选取单元,用于根据所述时长区间,从所述音频文件中选取区间音频数据。
9. 如权利要求8所述的装置,其特征在于,所述构建模块包括: 分帧处理单元,用于对所述区间音频数据进行分帧处理,获得至少一帧音频帧信号; 能量计算单元,用于计算所述至少一帧音频帧信号中的各帧音频帧信号的能量; 能量序列构建单元,用于按照所述至少一帧音频帧信号中的各帧音频帧信号的顺序, 对所述各帧音频帧信号的能量进行排列,构建所述区间音频数据的能量序列。
10. 如权利要求9所述的装置,其特征在于,所述构建模块还包括: 预处理单元,用于对所述至少一帧音频帧信号的各帧音频帧信号进行预处理; 自相关计算单元,用于对所述预处理后的各帧音频帧信号进行自相关计算,获得所述 各帧音频帧信号的自相关函数; 音高计算单元,用于根据所述各帧音频帧信号的自相关函数,计算所述各帧音频帧信 号的Pitch值; 音高序列构建单元,用于按照所述至少一帧音频帧信号中的各帧音频帧信号的顺序, 对所述各帧音频帧信号的Pitch值进行排列,构建所述区间音频数据的Pitch序列。
11. 如权利要求10所述的装置,其特征在于,所述预处理单元包括: 加窗处理子单元,用于对所述各帧音频帧信号进行加窗处理; 滤波处理子单元,用于对所述加窗处理后的各帧音频帧信号进行带通滤波处理。
12. 如权利要求8-11任一项所述的装置,其特征在于,所述定位模块包括: 归一化处理单元,用于分别对所述区间音频数据的能量序列和频谱滚降序列进行归一 化处理; 位置计算单元,用于根据所述归一化后的能量序列、所述归一化后的频谱滚降序列以 及预设的副歌时长,计算副歌在所述区间音频数据中的位置; 定位单元,用于根据所述副歌在所述区间音频数据中的位置,在所述音频文件中定位 所述副歌。
【文档编号】G10L15/04GK104091595SQ201310482804
【公开日】2014年10月8日 申请日期:2013年10月15日 优先权日:2013年10月15日
【发明者】赵伟峰, 李深远 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1