音频处理的方法和装置的制造方法_4

文档序号：8283479阅读：来源：国知局

作的指令。
[0146]相应地，本发明实施例还提供一种存储介质，所述存储介质用于存储上述计算机程序产品。
[0147]需要说明的是:上述实施例提供的音频处理的装置仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的音频处理的装置和音频处理的装置实施例属于同一构思，其具体实现过程详见装置实施例，这里不再赘述。
[0148]需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言，由于其与装置实施例基本相似，所以描述的比较简单，相关之处参见装置实施例的部分说明即可。
[0149]需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、装置、物品或者设备中还存在另外的相同要素。
[0150]本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。
[0151]以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。
【主权项】
1.一种音频处理的方法，其特征在于，所述方法包括: 根据音频文件的频谱图，自动确定所述音频文件的高潮部分的起点和终点；输出所述起点和所述终点之间的音频。
2.如权利要求1所述的方法，其特征在于，所述根据音频文件的频谱图，自动确定所述音频文件的高潮部分的起点和终点包括: 根据音频文件的频谱图，确定所述频谱图上振幅值大于振幅阈值的数据点，其中，所述频谱图上连续的所述数据点形成一簇数据点；确定每簇数据点在所述频谱图上对应的面积，并选取面积最大的一簇数据点的两端数据点对应的时间，作为所述音频文件的高潮部分的起点和终点。
3.如权利要求2所述的方法，其特征在于，所述方法还包括: 预先设置所述音频文件的高潮部分的最小时长；所述选取面积最大的一簇数据点的两端数据点对应的时间，作为所述音频文件的高潮部分的起点和终点包括: 确定面积最大的一簇数据点的两端数据点对应的时间之差；若差值大于或等于所述最小时长，则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点。
4.如权利要求3所述的方法，其特征在于，所述频谱图是利用频谱压缩比进行平滑处理后得到的频谱图，其中，所述频谱压缩比是指，在对所述音频文件的频谱进行平滑处理的过程中，在每个数据点的邻域内所选取的数据点数目；所述方法还包括: 若所述差值小于所述最小时长，则调高频谱压缩比，并执行以下步骤: a、重新根据所述音频文件的频谱图，确定所述频谱图上振幅值大于振幅阈值的数据点，其中，连续的数据点形成一簇数据点； b、确定每簇数据点在所述频谱图上对应的面积，确定面积最大的一簇数据点的两端数据点对应的时间之差； C、若差值大于或等于所述最小时长，则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点； d、若差值仍小于所述最小时长，则继续调高频谱压缩比，重复执行步骤a-c直至差值大于或等于所述最小时长。
5.如权利要求4所述的方法，其特征在于，所述方法还包括: 预先设置最大频谱压缩比；若使用的频谱压缩比大于所述最大频谱压缩比，则调低所述振幅阈值，并执行以下步骤； e、根据音频文件的频谱图，确定所述频谱图上大于调整后的振幅阈值的振幅值，其中，连续的数据点形成一簇数据点； f、确定每簇数据点在所述频谱图上对应的面积，确定面积最大的一簇数据点的两端数据点对应的时间之差； g、若差值大于或等于所述最小时长，则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点； h、若差值小于所述最小时长，则继续调低所述振幅阈值，并执行步骤e_g直至差值大于或等于所述最小时长。
6.如权利要求1-5任一所述的方法，其特征在于，在所述根据音频文件的频谱图，自动确定所述音频文件的高潮部分的起点和终点之前，所述方法还包括: 确定整个频谱图中的振幅平均值；根据所述振幅平均值，确定振幅阈值。
7.一种音频处理的装置，其特征在于，所述装置包括: 处理模块，用于根据音频文件的频谱图，自动确定所述音频文件的高潮部分的起点和终占.z、 V ，输出模块，用于输出所述起点和所述终点之间的音频。
8.如权利要求7所述的装置，其特征在于，所述处理模块具体用于: 根据音频文件的频谱图，确定所述频谱图上振幅值大于振幅阈值的数据点，其中，所述频谱图上连续的所述数据点形成一簇数据点；确定每簇数据点在所述频谱图上对应的面积，并选取面积最大的一簇数据点的两端数据点对应的时间，作为所述音频文件的高潮部分的起点和终点。
9.如权利要求8所述的装置，其特征在于，所述装置还包括: 设置模块，用于预先设置所述音频文件的高潮部分的最小时长；当选取面积最大的一簇数据点的两端数据点对应的时间，作为所述音频文件的高潮部分的起点和终点时，所述处理模块具体用于: 确定面积最大的一簇数据点的两端数据点对应的时间之差；若差值大于或等于所述设置模块设置的最小时长，则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点。
10.如权利要求9所述的装置，其特征在于，所述频谱图是利用频谱压缩比进行平滑处理后得到的频谱图，其中，所述频谱压缩比是指，在对所述音频文件的频谱进行平滑处理的过程中，在每个数据点的领域内所选取的数据点数目；所述处理模块，还用于若所述差值小于所述最小时长，则调高频谱压缩比，并执行以下步骤: a、重新根据所述音频文件的频谱图，确定所述频谱图上振幅值大于振幅阈值的数据点，其中，连续的数据点形成一簇数据点； b、确定每簇数据点在所述频谱图上对应的面积，确定面积最大的一簇数据点的两端数据点对应的时间之差； C、若差值大于或等于所述最小时长，则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点； d、若差值仍小于所述最小时长，则继续调高频谱压缩比，重复执行步骤a-c直至差值大于或等于所述最小时长。
11.如权利要求10所述的装置，其特征在于，所述设置模块，还用于预先设置最大频谱压缩比；所述处理模块，还用于若使用的频谱压缩比大于所述设置模块设置的最大频谱压缩比，则调低所述振幅阈值，并执行以下步骤: e、根据音频文件的频谱图，确定所述频谱图上大于调整后的振幅阈值的振幅值，其中，连续的数据点形成一簇数据点； f、确定每簇数据点在所述频谱图上对应的面积，确定面积最大的一簇数据点的两端数据点对应的时间之差； g、若差值大于或等于所述最小时长，则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点； h、若差值小于所述最小时长，则继续调低所述振幅阈值，并执行步骤e_g直至差值大于或等于所述最小时长。
12.如权利要求7-11任一所述的装置，其特征在于，所述处理模块还用于: 确定整个频谱图中的振幅平均值；根据所述振幅平均值，确定振幅阈值。
【专利摘要】本发明公开了一种音频处理的方法和装置，涉及计算机领域，能够自动地截取音频的高潮部分。所述方法包括：根据音频文件的频谱图，自动确定所述音频文件的高潮部分的起点和终点；输出所述起点和所述终点之间的音频。本发明用于制作音频。
【IPC分类】G10L25-78
【公开号】CN104599681
【申请号】CN201410855770
【发明人】夏伟涛
【申请人】广州酷狗计算机科技有限公司
【公开日】2015年5月6日
【申请日】2014年12月31日

完整全部详细技术资料下载

当前第4页1 2 3 4