一种发送音频数据的方法和装置与流程

文档序号:12274019阅读:来源:国知局

技术特征:

1.一种发送音频数据的方法,其特征在于,所述方法包括:

在预先存储的原唱数据库中,确定与目标歌曲的伴奏音频数据相匹配的原唱音频数据;

对所述伴奏音频数据和所述原唱音频数据进行语音增强处理,得到所述原唱音频数据中的人声音频数据;

将所述伴奏音频数据和所述人声音频数据存储为所述目标歌曲对应的音频数据;

当接收到终端发送的对应所述目标歌曲的歌曲获取请求时,向所述终端发送所述目标歌曲对应的音频数据。

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

确定所述伴奏音频数据中的伴奏播放开始时刻与所述原唱音频数据中的伴奏播放开始时刻的时间偏移值;

根据所述时间偏移值,对A的播放时刻进行时间修正,得到伴奏播放开始时刻与B的伴奏播放开始时刻对齐的第一A,其中,当A为所述伴奏音频数据时,B为所述原唱音频数据,当A为所述原唱音频数据时,B为所述伴奏音频数据;

所述对所述伴奏音频数据和所述原唱音频数据进行语音增强处理,得到所述原唱音频数据中的人声音频数据,包括:

对所述第一A和所述B进行语音增强处理,得到所述原唱音频数据中的人声音频数据;

当A为伴奏音频数据时,所述将所述伴奏音频数据和所述人声音频数据存储为所述目标歌曲对应的音频数据,包括:

将所述第一伴奏音频数据和所述人声音频数据存储为所述目标歌曲对应的音频数据。

3.根据权利要求2所述的方法,其特征在于,所述确定所述伴奏音频数据中的伴奏播放开始时刻与所述原唱音频数据中的伴奏播放开始时刻的时间偏移值,包括:

基于预设的第一播放进度点和第二播放进度点,分别在所述伴奏音频数据中获取第一子音频数据和在所述原唱音频数据中获取第二子音频数据;

对所述第一子音频数据和所述第二子音频数据进行互相关处理,得到自变量为时间偏移、因变量为相关度的互相关函数;

将所述互相关函数中的因变量最大值对应的自变量值,确定为所述时间偏移值。

4.根据权利要求2所述的方法,其特征在于,所述根据所述时间偏移值,对A的播放时刻进行时间修正,得到伴奏播放开始时刻与B的伴奏播放开始时刻对齐的第一A,包括:

如果A的伴奏播放开始时刻延迟于B的伴奏播放开始时刻,则将所述A中所述时间偏移值对应的播放进度点之后的音频数据确定为第一A。

5.根据权利要求2或4所述的方法,其特征在于,所述方法还包括:

基于所述第一A,确定在所述第一A的播放时长内的每个预设时长的子时段对应的子音频数据,并基于所述B,确定在所述B的播放时长内的所述每个预设时长的子时段对应的子音频数据;

对于每个子时段,对所述第一A在所述子时段对应的子音频数据和所述B在所述子时段对应的子音频数据进行互相关处理,得到所述子时段对应的自变量为时间偏移、因变量为相关度的互相关函数;

在所有子时段中,确定对应的互相关函数中的因变量最大值未达到预设相关度阈值的第一类子时段的数量;

所述对所述第一A和所述B进行语音增强处理,得到所述原唱音频数据中的人声音频数据,包括:

如果所述数量未超过所述预设数量阈值,则对所述第一A和所述B进行语音增强处理,得到所述原唱音频数据中的人声音频数据。

6.根据权利要求5所述的方法,其特征在于,所述方法还包括:

在所述所有子时段中,确定对应的互相关函数中的因变量最大值达到所述预设相关度阈值的第二类子时段;

将每个第二类子时段对应的互相关函数中的因变量最大值对应的自变量值,确定为所述每个第二类子时段对应的时间偏移值;

计算各第二类子时段对应的时间偏移值中的最大时间偏移值与最小时间偏移值的时间差值;

所述如果所述数量未超过所述预设数量阈值,则对所述第一A和所述B进行语音增强处理,得到所述原唱音频数据中的人声音频数据,包括:

如果所述数量未超过所述预设数量阈值,且所述时间差值小于预设时差阈值,则对所述第一A和所述B进行语音增强处理,得到所述原唱音频数据中的人声音频数据。

7.一种发送音频数据的装置,其特征在于,所述装置包括:

第一确定模块,用于在预先存储的原唱数据库中,确定与目标歌曲的伴奏音频数据相匹配的原唱音频数据;

第一处理模块,用于对所述伴奏音频数据和所述原唱音频数据进行语音增强处理,得到所述原唱音频数据中的人声音频数据;

存储模块,用于将所述伴奏音频数据和所述人声音频数据存储为所述目标歌曲对应的音频数据;

发送模块,用于当接收到终端发送的对应所述目标歌曲的歌曲获取请求时,向所述终端发送所述目标歌曲对应的音频数据。

8.根据权利要求7所述的装置,其特征在于,所述第一确定模块,还用于:

确定所述伴奏音频数据中的伴奏播放开始时刻与所述原唱音频数据中的伴奏播放开始时刻的时间偏移值;

根据所述时间偏移值,对A的播放时刻进行时间修正,得到伴奏播放开始时刻与B的伴奏播放开始时刻对齐的第一A,其中,当A为所述伴奏音频数据时,B为所述原唱音频数据,当A为所述原唱音频数据时,B为所述伴奏音频数据;

所述第一处理模块,用于:

对所述第一A和所述B进行语音增强处理,得到所述原唱音频数据中的人声音频数据;

所述存储模块,用于:

当A为伴奏音频数据时,将所述第一伴奏音频数据和所述人声音频数据存储为所述目标歌曲对应的音频数据。

9.根据权利要求8所述的装置,其特征在于,所述第一确定模块,包括:

获取子模块,用于基于预设的第一播放进度点和第二播放进度点,分别在所述伴奏音频数据中获取第一子音频数据和在所述原唱音频数据中获取第二子音频数据;

处理子模块,用于对所述第一子音频数据和所述第二子音频数据进行互相关处理,得到自变量为时间偏移、因变量为相关度的互相关函数;

确定子模块,用于将所述互相关函数中的因变量最大值对应的自变量值,确定为所述时间偏移值。

10.根据权利要求8所述的装置,其特征在于,所述第一确定模块,用于:

如果A的伴奏播放开始时刻延迟于B的伴奏播放开始时刻,则将所述A中所述时间偏移值对应的播放进度点之后的音频数据确定为第一A。

11.根据权利要求8或10所述的装置,其特征在于,所述装置还包括:

划分模块,用于基于所述第一A,确定在所述第一A的播放时长内的每个预设时长的子时段对应的子音频数据,并基于所述B,确定在所述B的播放时长内的所述每个预设时长的子时段对应的子音频数据;

第二处理模块,用于对于每个子时段,对所述第一A在所述子时段对应的子音频数据和所述B在所述子时段对应的子音频数据进行互相关处理,得到所述子时段对应的自变量为时间偏移、因变量为相关度的互相关函数;

第二确定模块,用于在所有子时段中,确定对应的互相关函数中的因变量最大值未达到预设相关度阈值的第一类子时段的数量;

所述第一处理模块,用于:

如果所述数量未超过所述预设数量阈值,则对所述第一A和所述B进行语音增强处理,得到所述原唱音频数据中的人声音频数据。

12.根据权利要求11所述的装置,其特征在于,所述装置还包括:

第三确定模块,用于在所述所有子时段中,确定对应的互相关函数中的因变量最大值达到所述预设相关度阈值的第二类子时段;

第四确定模块,用于将每个第二类子时段对应的互相关函数中的因变量最大值对应的自变量值,确定为所述每个第二类子时段对应的时间偏移值;

计算模块,用于计算各第二类子时段对应的时间偏移值中的最大时间偏移值与最小时间偏移值的时间差值;

所述第一处理模块,用于:

如果所述数量未超过所述预设数量阈值,且所述时间差值小于预设时差阈值,则对所述第一A和所述B进行语音增强处理,得到所述原唱音频数据中的人声音频数据。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1