一种音频处理方法及装置的制造方法

文档序号：9261414阅读：380来源：国知局

一种音频处理方法及装置的制造方法
【技术领域】
[0001]本发明涉及互联网技术领域，尤其涉及音频技术领域，具体涉及一种音频处理方法及装置。
【背景技术】
[0002]副歌，通常指音频文件(如歌曲、音乐等等)的高潮部分。以歌曲为例，一首歌曲通常采用AA’BA’Form(音乐结构)，A代表主歌，而B代表副歌；也即时说，通常一首歌曲由“前奏+两段主歌+ —段副歌+过门音乐+ —段副歌+ —段主歌+结尾音乐”按顺序连接构成。副歌定位对音频文件的分析和处理起着重要作用，现有技术主要是基于对音频文件的分析处理定位副歌，但是，基于音频文件的分析处理计算量大，准确度低，从而降低了音频处理的智能性。

【发明内容】

[0003]本发明实施例提供一种音频处理方法及装置，可以基于音频文件对应的MIDI (Musical Instrument Digital Interface,乐器数字接口)文件对音频文件进行副歌定位，提升音频处理的准确度，提升音频处理的智能性。
[0004]本发明实施例第一方面提供一种音频处理方法，可包括:
[0005]获取音频文件对应的MIDI文件；
[0006]解析所述MIDI文件，获得至少一个音符，及所述至少一个音符的特征值与时间属性；
[0007]采用所述至少一个音符，及所述至少一个音符的特征值与时间属性，构建所述音频文件的参考序列；
[0008]采用所述至少一个音符的特征值，构建所述音频文件的特征序列；
[0009]对所述参考序列和所述特征序列进行分析处理，定位所述音频文件的副歌。
[0010]本发明实施例第二方面提供一种音频处理装置，可包括:
[0011]文件获取单元，用于获取音频文件对应的MIDI文件；
[0012]解析单元，用于解析所述MIDI文件，获得至少一个音符，及所述至少一个音符的特征值与时间属性；
[0013]参考序列构建单元，用于采用所述至少一个音符，及所述至少一个音符的特征值与时间属性，构建所述音频文件的参考序列；
[0014]特征序列构建单元，用于采用所述至少一个音符的特征值，构建所述音频文件的特征序列；
[0015]定位单元，用于对所述参考序列和所述特征序列进行分析处理，定位所述音频文件的副歌。
[0016]实施本发明实施例，具有如下有益效果:
[0017]本发明实施例中，可以基于音频文件对应的MIDI文件，构建所述音频文件的参考序列和特征序列，通过对所述参考序列和所述特征序列进行分析处理，可以定位所述音频文件的副歌，由于MIDI文件的数据量较小，基于MIDI文件的副歌定位可以减少计算负荷，提升音频处理的准确度，提升音频处理的智能性。
【附图说明】
[0018]为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0019]图1为本发明实施例提供的一种音频处理方法的流程图；
[0020]图2为图1所示的步骤S103的实施例的流程图；
[0021]图3为图1所示的步骤S104的实施例的流程图；
[0022]图4为图1所示的步骤S105的实施例的流程图；
[0023]图5为本发明实施例提供的一种音频处理装置的结构示意图；
[0024]图6为本发明实施例提供的一种参考序列构建单元的结构示意图；
[0025]图7为本发明实施例提供的一种特征序列构建单元的结构示意图；
[0026]图8为本发明实施例提供的一种定位单元的结构示意图；
[0027]图9为本发明实施例提供的一种副歌定位单元的结构示意图。
【具体实施方式】
[0028]下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0029]本发明实施例中，音频文件可以包括但不限于:歌曲、歌曲片段、音乐、音乐片段、演奏乐、演奏乐片段、哼唱歌曲、哼唱歌曲片段等文件。MIDI是一个工业标准的电子通信协议，MIDI传输诸如音符、控制参数等非声音信号的指令，用于指示MIDI设备的操作以及控制MIDI设备之间的交互。MIDI文件通常是以.mid为结尾的指令文件，这些指令可以包括某个音符的开始时间、结束时间、代表音符的音调特征的特征值等信息。
[0030]本发明实施例的音频处理方案主要是基于音频文件对应的MIDI文件，对音频文件的副歌进行快速定位。本发明实施例的音频处理方案可以应用于互联网领域的多个场景中，例如:可以应用于对互联网音频库中的音频文件进行分析处理的场景，包括:可应用于主音查找的场景中进行副歌的快速定位和准确提取，也可应用于哼唱搜索的场景中进行副歌的快速定位和准确提取，还可应用于乐曲识别的场景中进行副歌的快速定位和准确提取等等；再如:可以应用于对互联网音频库中的音频文件进行试听的场景，包括:可提供副歌进行在线播放或音乐下载前的试听；或者，可以应用于彩铃下载或试听场景，包括:快速定位和准确提取副歌，将副歌作为彩铃提供给用户进行下载或试听，等等。
[0031]下面将结合附图1-附图4，对本发明实施例提供的音频处理方法进行详细介绍。需要说明的是，附图1-附图4所示的音频处理方法可以由本发明实施例提供的音频处理装置所执行，该音频处理装置可运行于终端设备或服务器中，其中，终端设备可包括但不限于:PC(Personal Computer,个人计算机)、PAD (平板电脑)、手机、智能手机、笔记本电脑等设备。
[0032]请参见图1，为本发明实施例提供的一种音频处理方法的流程图；该方法可包括以下步骤SlOl-步骤S105。
[0033]S101，获取音频文件对应的MIDI文件。
[0034]一个音频文件通常对应一个MIDI文件，该MIDI文件可以由诸如音频文件的作曲者等音频制作人制作生成，也可以由具备MIDI制作功能的设备根据音频文件制作生成。音频文件对应的MIDI文件可以作为该音频文件的音准参考文件，当用户对音频文件进行重新演绎时，可以采用该音频文件对应的MIDI文件对重新演绎的内容进行音准比对，并可用于对重新演绎的内容进行评分。本步骤中，可以从互联网音频库中获取待处理的音频文件对应的MIDI文件。
[0035]S102,解析所述MIDI文件，获得至少一个音符，及所述至少一个音符的特征值与时间属性。
[0036]一个MIDI文件通常是以.mid为结尾的指令文件，这些指令可以包括某个音符的开始时间、结束时间、代表音符的音调特征的特征值等信息。本步骤中，根据MIDI文件的格式标准解析所述MIDI文件，可以获得至少一个音符，及所述至少一个音符的特征值与时间属性。
[0037]其中，音符是指用来记录长短音的符号。其中，音符的特征值可用于表示音符的音调特征，一般地，音符的特征值的取值范围为[21，108]，音符的特征值越大，表示该音符的音调越高；音符的特征值越小，表示该音符的音调越低。其中，音符的时间属性可用于描述音符的持续时间，音符的时间属性可包括:音符的开始时间和音符的结束时间。
[0038]S103，采用所述至少一个音符，及所述至少一个音符的特征值与时间属性，构建所述首频文件的参考序列。
[0039]所述参考序列包括:至少一个参考元素及所述至少一个参考元素的索引；其中，一个参考元素包含一个音符、所包含音符的特征值及所包含音符的时间属性。本步骤中，可以将一个音符、该音符的特征值及该音符的时间属性确定为一个参考元素的三要素，那么，所述至少一个音符，及所述至少一个音符的特征值与时间属性，则可以分别作为至少一个参考元素的三要素。将所述至少一个参考元素顺序排列，生成所述音频文件的参考序列。
[0040]S104，采用所述至少一个音符的特征值，构建所述音频文件的特征序列。
[0041]所述特征序列包括:至少一个特征元素及所述至少一个特征元素的索引；其中，一个特征元素包含一个音符的特征值。本步骤中，可以将一个音符的特征值确定为一个特征元素的要素，那么，所述至少一个音符的特征值，则可以分别作为至少一个特征元素的要素。将所述至少一个特征元素顺序排列，生成所述音频文件的特征序列。
[0042]S105，对所述参考序列和所述特征序列进行分析处理，定位所述音频文件的副歌。
[0043]副歌，通常指音频文件的高潮部分。以歌曲为例，一首歌曲通常采用AA’BA’Form，A代表主歌，而B代表副歌；也即时说，通常一首歌曲由“前奏+两段主歌+ —段副歌+过门音乐+ —段副歌+ —段主歌+结尾音乐”按顺序连接构成。本步骤中，通过对所述参考序列和所述特征序列进行分析处理，可以定位音频文件的至少一段副歌。
[0044]本发明实施例中，可以基于音频文件对应的MIDI文件，构建所述音频文件的参考序列和特征序列，通过对所述参考序列和所述特征序列进行分析处理，可以定位所述音频文件的副歌，由于MIDI文件的数据量较小，基于MIDI文件的副歌定位可以减少计算负荷，提升音频处理的准确度，提升音频处理的智能性。
[0045]请参见图2，为图1所示的步骤S103的实施例的流程图；该步骤S103可包括以下步骤s2001-步骤s2003。
[00

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵伟峰;
技术所有人：腾讯科技（深圳）有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。