一种音频处理方法及装置的制造方法_2

文档序号：9261414阅读：来源：国知局

46]S2001，根据所述至少一个音符，及所述至少一个音符的特征值与时间属性，确定至少一个参考元素，一个参考元素包含一个音符、所包含音符的特征值及所包含音符的时间属性。
[0047]假设所述至少一个音符的数量为N，N为正整数，本步骤中，可以确定所述至少一个参考元素的数量也为N ;该N个参考元素可分别表示为af-aN，每个参考元素均包含三要素，该三要素包括:音符、音符的特征值及音符的时间属性；例如:参考元素ai包括音符一、音符一的特征值及音符一的时间属性；以此类推，参考元素aN包括音符N、音符N的特征值及音符N的时间属性。
[0048]S2002，根据所述至少一个参考元素所包含音符的时间属性，确定所述各参考元素的索引。
[0049]一个音符的时间属性可用于描述音符的持续时间，音符的时间属性可包括:音符的开始时间和音符的结束时间。本步骤中，可以按照各参考元素所包含音符的开始时间的先后顺序，确定所述各参考元素的索引；例如:假设音符一至音符N中，音符一的开始时间最先，音符二的开始时间其次，以此类推，音符N的开始时间最末，则可确定参考元素B1的索引为1，参考元素a2的索引为2,以此类推,参考元素aN的索引为N。
[0050]S2003，按照所述至少一个参考元素的索引，顺序排列所述至少一个参考元素，获得所述音频文件的参考序列。
[0051]按照本实施例所示例子，所述音频文件的参考序列可表示为note(i)，该参考序列note(i)的长度为N，其中，i表示所述参考序列note (i)中各参考元素的索引，i为正整数且O < i彡N。
[0052]实际应用中，可以采用一个结构体来存储该参考序列note (i)，该结构体可表示如下:
[0053]tydef struct tag_note{
[0054]int start_ms ；
[0055]int end_ms ；
[0056]int note_value ；
[0057]} Tnote
[0058]Tnote note ；
[0059]本发明实施例中，可以基于音频文件对应的MIDI文件，构建所述音频文件的参考序列和特征序列，通过对所述参考序列和所述特征序列进行分析处理，可以定位所述音频文件的副歌，由于MIDI文件的数据量较小，基于MIDI文件的副歌定位可以减少计算负荷，提升音频处理的准确度，提升音频处理的智能性。
[0060]请参见图3，为图1所示的步骤S104的实施例的流程图；该步骤S104可包括以下步骤s3001-步骤s3003。
[0061]S3001，根据所述至少一个音符的特征值，确定至少一个特征元素，一个特征元素包含一个音符的特征值。
[0062]按照图2所示实施例中的例子，本步骤中，可以确定所述至少一个特征元素的数量也为N ;该N个特征元素可分别表示为lvbN，每个特征元素均包含一个音符的特征值；例如:特征元素K包括音符一的特征值；以此类推，特征元素bN包括音符N的特征值。
[0063]S3002，按照所述至少一个参考元素的索引，确定对应的所述至少一个特征元素的索引。
[0064]参考元素和特征元素通过所包含音符的特征值相互对应，例如:参考元素％包含音符一的特征值，特征元素匕也包含音符一的特征值，则参考元素B1与特征元素Id1相对应；以此类推，参考元素aN包含音符N的特征值，特征元素bN也包含音符N的特征值，则参考元素3,与特征元素％相对应。本步骤中，根据所述各参考元素的索引，可确定对应的所述各特征元素的索引，例如:假设参考元素B1的索引为1，则与所述参考元素％相对应特征元素匕的索引也为I ;以此类推，假设参考元素&,的索引为N，则与所述参考元素aN相对应特征元素bN的索引也为N。
[0065]S3003，按照所述至少一个特征元素的索引，顺序排列所述至少一个特征元素，获得所述音频文件的特征序列。
[0066]按照本实施例所示例子，所述音频文件的特征序列可表示为n0te_ValUe(i)，该特征序列note_value (i)的长度为N,其中，i表示所述特征序列note_value (i)中各特征元素的索弓I，i为正整数且O < i彡N。
[0067]本发明实施例中，可以基于音频文件对应的MIDI文件，构建所述音频文件的参考序列和特征序列，通过对所述参考序列和所述特征序列进行分析处理，可以定位所述音频文件的副歌，由于MIDI文件的数据量较小，基于MIDI文件的副歌定位可以减少计算负荷，提升音频处理的准确度，提升音频处理的智能性。
[0068]请参见图4，为图1所示的步骤S105的实施例的流程图；该步骤S105可包括以下步骤s4001-步骤s4005。
[0069]S4001，对所述特征序列进行最大值计算，获得所述特征序列的最大值及所述最大值对应的目标特征元素的索引。
[0070]本步骤中,可以采用下述公式(I),对所述特征序列note_value(i)进行最大值计算，该公式(I)可表示如下:
[0071][ind, dval] = max(note_value (i))(I)
[0072]上述公式(I)中，max()为求取最大值操作；dval表示最大值的取值；ind表示最大值对应的目标特征元素的索弓丨，即表示索引为ind的目标特征元素对应的note_value (ind)的值为最大值dval。
[0073]s4002，根据所述目标特征元素的索引，确定与所述目标特征元素的索引相对应的目标参考元素的索引。
[0074]所述目标特征元素的索引为ind，即所述目标特征元素在所述特征序列note_value (i)中的索引为ind，本步骤可确定与所述目标特征元素的索引相对应的目标参考元素的索引也为ind，即所述目标参考元素在所述参考序列note (i)中的索引也为ind。
[0075]s4003，根据所述目标参考元素的索引，从所述参考序列中获得所述目标参考元素所包含音符的时间属性。
[0076]本步骤中，可以首先从所述参考序列note(i)中定位索引为ind的目标参考元素aind，然后获取该目标参考元素aind所包含音符的时间属性。
[0077]S4004，采用所述目标参考元素所包含音符的时间属性，确定副歌的位置信息。
[0078]本步骤中，可以采用下述公式(2)，将所述目标参考元素aind所包含音符的开始时间，确定为副歌的位置信息；该公式(2)可表示如下:
[0079]Pos = note (ind).start_ms(2)
[0080]上述公式(2)中，Pos表示副歌在所述音频文件中的位置信息。
[0081]S4005，根据所述副歌的位置信息，在所述音频文件中定位副歌。
[0082]由于采用上述公式(2)可以获得副歌在所述音频文件中的位置信息，本步骤则可根据副歌的位置信息，在所述音频文件中查找到或定位出该副歌。
[0083]步骤s4005具体可包括以下步骤ss451_ss452:
[0084]ss451，对所述副歌的位置信息进行归一化处理。
[0085]本步骤ss451中，可以根据实际需要，设置用于归一化处理的时间参数，例如:可以根据歌曲的特点，在区间[ls，20s]内随机选取叫和叫设置为用于归一化处理的时间参数，其中，Hi1和HI2的取值可以相等，也可以不等。本步骤SS551中，对所述副歌的位置信息进行归一化处理可以包括:将公式(2)计算获得的副歌的位置信息Pos归一化为[Pos-Hi1, Pos+m2]。
[0086]ss452,按照副歌的归一化的位置信息，在所述音频文件中定位副歌。
[0087]本步骤中，可以将归一化的位置信息[Pos-m” Pos+m2]作为该段副歌在所述音频文件中的持续时间段，从所述音频文件中定位该段副歌。
[0088]需要说明的是，图4所示实施例阐述了在所述音频文件中定位一段副歌的过程，实际应用中，若所述音频文件存在多段副歌，则步骤s4001可以获得至少一个最大值及每个最大值对应的目标特征元素的索引，本发明实施例中，针对每个最大值及对应的目标特征元素的索引，可以分别按照图4所示实施例描述的过程，在所述音频文件中分别定位各段副歌。
[0089]本发明实施例中，可以基于音频文件对应的MIDI文件，构建所述音频文件的参考序列和特征序列，通过对所述参考序列和所述特征序列进行分析处理，可以定位所述音频文件的副歌，由于MIDI文件的数据量较小，基于MIDI文件的副歌定位可以减少计算负荷，提升音频处理的准确度，提升音频处理的智能性。
[0090]下面将结合附图5-附图9，对本发明实施例提供的音频处理装置进行详细介绍。需要说明的是，附图5-附图9所示的音频处理装置可运行于终端设备或服务器中，用于执行附图1-附图4所示的音频处理方法。其中，终端设备可包括但不限于:PC、PAD、手机、智能手机、笔记本电脑等设备。
[0091]请参见图5，为本发明实施例提供的一种音频处理装置的结构示意图；该装置可包括:文件获取单元101、解析单元102、参考序列构建单元103、特征序列构建单元104和定位单元105。
[0092]文件获取单元101，用于获取音频文件对应的MIDI文件。
[0093]一个音频文件通常对应一个MIDI文件，该MIDI文件可以由诸如音频文件的作曲者等音频制作人制作生成，也可以由具备MIDI制作功能的设备根据音频文件制作生成。音频文件对应的MIDI文件可以作为该音频文件的音准参考文件，当用户对音频文件进行重新

完整全部详细技术资料下载

当前第2页1 2 3 4