音频处理的方法和装置的制造方法

文档序号：8283479阅读：289来源：国知局

音频处理的方法和装置的制造方法
【技术领域】
[0001]本发明涉及计算机领域，特别涉及一种音频处理的方法和装置。
【背景技术】
[0002]随着互联网的普及和不断发展，人们已经越来越多地通过互联网来下载自己喜欢的铃声。
[0003]当前互联网上的铃声主要是依赖人工通过手动截取音频的高潮部分的方式而制作的。但是，这种制作铃声的方式并不能准确地截取音频的高潮部分，且需要花费大量的人工成本。

【发明内容】

[0004]本发明实施例提供一种音频处理的方法和装置，能够自动地截取音频的高潮部分，节省人工成本。
[0005]第一方面，提供一种音频处理的方法，所述方法包括:
[0006]根据音频文件的频谱图，自动确定所述音频文件的高潮部分的起点和终点；
[0007]输出所述起点和所述终点之间的音频。
[0008]其中，可选地，所述根据音频文件的频谱图，自动确定所述音频文件的高潮部分的起点和终点可包括:
[0009]根据音频文件的频谱图，确定所述频谱图上振幅值大于振幅阈值的数据点，其中，连续的数据点形成一簇数据点；
[0010]确定每簇数据点在所述频谱图上对应的面积，并选取面积最大的一簇数据点的两端数据点对应的时间，作为所述音频文件的高潮部分的起点和终点。
[0011]可选地，在本发明的一个实施例中，所述方法还包括:
[0012]预先设置所述音频文件的高潮部分的最小时长；
[0013]所述选取面积最大的一簇数据点的两端数据点对应的时间，作为所述音频文件的高潮部分的起点和终点包括:
[0014]确定面积最大的一簇数据点的两端数据点对应的时间之差；
[0015]若差值大于或等于所述最小时长，则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点。
[0016]在本发明的另一个实施例中，进一步地，所述频谱图是利用频谱压缩比进行平滑处理后得到的频谱图，其中，所述频谱压缩比是指，在对所述音频文件的频谱进行平滑处理的过程中，在每个数据点的邻域内所选取的数据点数目；
[0017]所述方法还可包括:
[0018]若所述差值小于所述最小时长，则调高频谱压缩比，并执行以下步骤:
[0019]a、重新根据所述音频文件的频谱图，确定所述频谱图上振幅值大于振幅阈值的数据点，其中，连续的数据点形成一簇数据点；
[0020]b、确定每簇数据点在所述频谱图上对应的面积，确定面积最大的一簇数据点的两端数据点对应的时间之差；
[0021]C、若差值大于或等于所述最小时长，则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点；
[0022]d、若差值仍小于所述最小时长，则继续调高频谱压缩比，重复执行步骤a_c直至差值大于或等于所述最小时长。
[0023]在本发明的另一个实施例中，进一步地，所述方法还可包括:
[0024]预先设置最大频谱压缩比；
[0025]若使用的频谱压缩比大于所述最大频谱压缩比，则调低所述振幅阈值，并执行以下步骤；
[0026]e、根据音频文件的频谱图，确定所述频谱图上大于调整后的振幅阈值的振幅值，其中，连续的数据点形成一簇数据点；
[0027]f、确定每簇数据点在所述频谱图上对应的面积，确定面积最大的一簇数据点的两端数据点对应的时间之差；
[0028]g、若差值大于或等于所述最小时长，则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点；
[0029]h、若差值小于所述最小时长，则继续调低所述振幅阈值，并执行步骤e_g直至差值大于或等于所述最小时长。
[0030]其中，在本发明的一个实施例中，在所述根据音频文件的频谱图，自动确定所述音频文件的高潮部分的起点和终点之前，所述方法还可包括:
[0031]确定整个频谱图中的振幅平均值；
[0032]根据所述振幅平均值，确定振幅阈值。
[0033]第二方面，提供一种音频处理的装置，所述装置包括:
[0034]处理模块，用于根据音频文件的频谱图，自动确定所述音频文件的高潮部分的起占和终占.V、、、，I h z、 V、、、，
[0035]输出模块，用于输出所述起点和所述终点之间的音频。
[0036]其中，可选地，所述处理模块具体用于:
[0037]根据音频文件的频谱图，确定所述频谱图上振幅值大于振幅阈值的数据点，其中，连续的数据点形成一簇数据点；
[0038]确定每簇数据点在所述频谱图上对应的面积，并选取面积最大的一簇数据点的两端数据点对应的时间，作为所述音频文件的高潮部分的起点和终点。
[0039]可选地，在本发明的一个实施例中，所述装置还包括:
[0040]设置模块，用于预先设置所述音频文件的高潮部分的最小时长；
[0041]当选取面积最大的一簇数据点的两端数据点对应的时间，作为所述音频文件的高潮部分的起点和终点时，所述处理模块具体用于:
[0042]确定面积最大的一簇数据点的两端数据点对应的时间之差；
[0043]若差值大于或等于所述设置模块设置的最小时长，则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点。
[0044]在本发明的另一个实施例中，进一步地，所述频谱图是利用频谱压缩比进行平滑处理后得到的频谱图，其中，所述频谱压缩比是指，在对所述音频文件的频谱进行平滑处理的过程中，在每个数据点的领域内所选取的数据点数目；
[0045]所述处理模块，还用于若所述差值小于所述最小时长，则调高频谱压缩比，并执行以下步骤:
[0046]a、重新根据所述音频文件的频谱图，确定所述频谱图上振幅值大于振幅阈值的数据点，其中，连续的数据点形成一簇数据点；
[0047]b、确定每簇数据点在所述频谱图上对应的面积，确定面积最大的一簇数据点的两端数据点对应的时间之差；
[0048]C、若差值大于或等于所述最小时长，则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点；
[0049]d、若差值仍小于所述最小时长，则继续调高频谱压缩比，重复执行步骤a_c直至差值大于或等于所述最小时长。
[0050]在本发明的另一个实施例中，进一步地，所述设置模块，还用于预先设置最大频谱压缩比；
[0051]所述处理模块，还用于若使用的频谱压缩比大于所述设置模块设置的最大频谱压缩比，则调低所述振幅阈值，并执行以下步骤:
[0052]e、根据音频文件的频谱图，确定所述频谱图上大于调整后的振幅阈值的振幅值，其中，连续的数据点形成一簇数据点；
[0053]f、确定每簇数据点在所述频谱图上对应的面积，确定面积最大的一簇数据点的两端数据点对应的时间之差；
[0054]g、若差值大于或等于所述最小时长，则确定所述两端数据点对应的时间分别为所述音频文件的高潮部分的起点和终点；
[0055]h、若差值小于所述最小时长，则继续调低所述振幅阈值，并执行步骤e_g直至差值大于或等于所述最小时长。
[0056]其中，可选地在本发明的一个实施例中，所述处理模块还用于:
[0057]确定整个频谱图中的振幅平均值；
[0058]根据所述振幅平均值，确定振幅阈值。
[0059]本发明实施例提供的音频处理的方法和装置，根据音频文件的频谱图来确定所述音频文件的高潮部分的起点和终点，相比于相关技术手动确定高潮部分起点和终点的方式，提高了精确度，且能够自动地截取音频的高潮部分，节省人工成本。
【附图说明】
[0060]为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0061]图1是本发明实施例提供的一种音频处理的方法的流程图；
[0062]图2A是本发明实施例提供的另一种音频处理的方法的流程图；
[0063]图2

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：夏伟涛;
技术所有人：广州酷狗计算机科技有限公司;
我是此专利的发明人

上一篇：电话线质量语音的基音周期提取方法
上一篇：移动设备上的实时口语评价系统及方法