音频变速方法、装置、电子设备和计算机可读存储介质与流程

文档序号:22112482发布日期:2020-09-04 15:13阅读:267来源:国知局
音频变速方法、装置、电子设备和计算机可读存储介质与流程

本申请涉及音频处理技术领域,特别是涉及一种音频变速方法、装置、电子设备和计算机可读存储介质。



背景技术:

随着电子产品的发展,越来越多的电子产品可以播放各种音频。用户在播放音频时可以对音频进行变速处理,即快进或者慢放。然而,在传统的音频变速方法中,存在变速之后使得播放音频失真的问题。



技术实现要素:

本申请实施例提供了一种音频变速方法、装置、电子设备、计算机可读存储介质,可以使得音频在变速之后,保证音频在播放时的准确性。

一种音频变速方法,包括:

获取原始音频;

对所述原始音频进行节拍检测,得到所述原始音频的原始节拍频率;

获取节拍频率范围,以及获取目标节拍频率;所述节拍频率范围内的节拍频率对应的音频在播放时保真;

基于所述节拍频率范围和所述原始节拍频率,确定所述原始音频的倍速范围;

基于所述原始节拍频率和所述目标节拍频率,在所述倍速范围内确定所述原始音频的目标倍速。

一种音频变速装置,包括:

原始音频获取模块,用于获取原始音频;

节拍检测模块,用于对所述原始音频进行节拍检测,得到所述原始音频的原始节拍频率;

目标节拍频率获取模块,用于获取节拍频率范围,以及获取目标节拍频率;所述节拍频率范围内的节拍频率对应的音频在播放时保真;

倍速范围确定模块,用于基于所述节拍频率范围和所述原始节拍频率,确定所述原始音频的倍速范围;

目标倍速确定模块,用于基于所述原始节拍频率和所述目标节拍频率,在所述倍速范围内确定所述原始音频的目标倍速。

一种电子设备,包括存储器及处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上述的音频变速方法的步骤。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的方法的步骤。

上述音频变速方法、装置、电子设备和计算机可读存储介质,获取原始音频;对原始音频进行节拍检测,得到原始音频的原始节拍频率;获取节拍频率范围,以及获取目标节拍频率;基于节拍频率范围和原始节拍频率,确定原始音频的倍速范围;节拍频率范围内的节拍频率对应的音频在播放时保真,而倍速范围由该节拍频率范围所确定,则音频以该倍速范围内的倍速进行播放时也保真;基于原始节拍频率和目标节拍频率,在倍速范围内确定原始音频的目标倍速,可以保证该原始音频以目标倍速进行播放时声音不失真,也即保真。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为一个实施例中音频变速方法的流程图;

图2为一个实施例中节拍检测方法的示意图;

图3为一个实施例中步骤确定目标倍速的流程图;

图4为另一个实施例中步骤确定目标倍速的流程图;

图5为一个实施例中音频变速装置的结构框图;

图6为一个实施例中电子设备的内部结构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

图1为一个实施例中音频变速方法的流程图。如图1所示,音频变速方法包括步骤102至步骤110。

步骤102,获取原始音频。

原始音频可以是一段音乐、一段录音、一段视频中所包括的音频等,不限于此。原始音频的长度也不限定,可以是10秒长的音频,也可以是1小时长的音频。

在一种实施方式中,还包括对原始音频进行预处理。预处理可以包括滤波处理、差值处理、傅里叶变换等,滤除原始音频中的噪声。

步骤104,对原始音频进行节拍检测,得到原始音频的原始节拍频率。

原始节拍频率(beatperminute)即原始音频中每分钟的节拍数。原始节拍频率越大,表示原始音频的节奏越快;原始节拍频率越小,表示原始音频的节奏越慢。

在一个实施例中,如图2所示,电子设备获取原始音频信号,对原始音频信号进行预处理,得到预处理之后的音频信号。其中,预处理可以包括滤波处理、差值处理、傅里叶变换等,滤除原始音频中的噪声。电子设备对预处理之后的音频信号进行信号降低(reduction),再采用检测功能对信号降低之后的音频信号进行检测,可以检测到音频信号中的各个峰值,执行峰值选取,并将选取的峰值进行定位,可以检测出原始音频信号中的各个节拍的位置,统计原始音频信号中的各个节拍,可以得到原始音频信号的原始节拍频率。

步骤106,获取节拍频率范围,以及获取目标节拍频率;节拍频率范围内的节拍频率对应的音频在播放时保真。

可以理解的是,当音频的节拍频率过大或者过小,该音频在播放时会存在失真的问题。因此,获取节拍频率范围,该节拍频率范围内的节拍频率对应的音频在播放时保真。例如,节拍频率范围可以是[45,190],即音频的最小节拍频率为45,最大节拍频率为190;又如,节拍频率范围可以是[100,150],即音频的最小节拍频率为100,最大节拍频率为150。节拍频率范围可以根据用户需要进行设定。

目标节拍频率为该原始音频变速之后的节拍频率。当目标节拍频率大于原始节拍频率时,表示对该原始音频进行快进;当目标节拍频率小于原始节拍频率时,表示对该原始音频进行慢放。

在一个实施例中,从节拍频率范围内确定至少两个候选节拍频率;基于选取指令从至少两个候选节拍频率中确定目标节拍频率。

可以理解的是,音乐有固定的节拍频率,电子设备可以将这些固定的节拍频率设置为节拍频率范围内的候选节拍频率,如90,120,160。当用户从至少两个候选节拍频率中选择其中的一个时,生成选取指令,基于该选取指令将该选取的候选节拍频率作为目标节拍频率。

步骤108,基于节拍频率范围和原始节拍频率,确定原始音频的倍速范围。

具体地,节拍频率范围存在上限节拍频率和下限节拍频率,上限节拍频率即节拍频率范围的最大值,下限节拍频率即节拍频率范围的最小值。电子设备将上限节拍频率、下限节拍频率分别除以原始节拍频率,可以得到原始音频的倍速范围。

可以理解的是,当确定节拍频率范围之后,原始音频的原始节拍频率越接近该节拍频率范围的最大值,则该原始音频的倍速范围中的最大倍速越小,即原始音频可以快进的空间越小,可以慢放的空间越大;相应地,原始音频的原始节拍频率越接近该节拍频率范围的最小值,则该原始音频的倍速范围中的最小倍速越大,即原始音频可以慢放的空间越小,可以快进的空间越大。

例如,确定的节拍频率范围是[45,180],当原始音频的原始节拍频率是160时,则原始音频的倍速范围是[0.28125,1.125],则原始音频可以快进的空间为(1,1.125],可以慢放的空间为[0.28125,1);当原始音频的原始节拍频率是50时,则原始音频的倍速范围是[0.9,3.6],则原始音频可以快进的空间为(1,3.6],可以慢放的空间为[0.9,1)。

步骤110,基于原始节拍频率和目标节拍频率,在倍速范围内确定原始音频的目标倍速。

目标倍速指的是原始音频变速之后的目标音频相对于原始音频的速率。当目标倍速大于1时,表示对原始音频进行快进。当目标倍速小于1时,表示对原始音频进行慢放。当目标倍速等于1时,表示原始音频速度不变,则不对原始音频进行处理。

电子设备获取到原始音频的原始节拍频率,以及目标节拍频率之后,将目标节拍频率除以原始节拍频率,即可得到原始音频的倍速。然而,为了使得原始音频变速之后的目标音频在播放时仍能保真,则从倍速范围内确定原始音频的目标倍速。

上述音频变速方法,获取原始音频;对原始音频进行节拍检测,得到原始音频的原始节拍频率;获取节拍频率范围,以及获取目标节拍频率;基于节拍频率范围和原始节拍频率,确定原始音频的倍速范围;节拍频率范围内的节拍频率对应的音频在播放时保真,而倍速范围由该节拍频率范围所确定,则音频以该倍速范围内的倍速进行播放时也保真;基于原始节拍频率和目标节拍频率,在倍速范围内确定原始音频的目标倍速,可以保证该原始音频以目标倍速进行播放时声音不失真,也即保真。

并且,传统音频变速方法通常是用户手动拉动变速条进行调节,存在调节不准确的问题,而上述音频变速方法无需用户手动调节倍速,只需输入目标节拍频率即可,将音频变速从倍速的角度转变成节拍数的角度,避免了调节倍速时不够准确的问题,提高了音频变速的准确性。

在一个实施例中,节拍频率范围包括上限节拍频率至下限节拍频率之间的各个节拍频率;基于节拍频率范围和原始节拍频率,确定原始音频的倍速范围,包括:将上限节拍频率除以原始节拍频率,得到上限倍速;将下限节拍频率除以原始节拍频率,得到下限倍速;基于上限倍速和下限倍速生成原始音频的倍速范围。

节拍频率范围存在上限节拍频率和下限节拍频率,上限节拍频率即节拍频率范围的最大值,下限节拍频率即节拍频率范围的最小值。

电子设备将上限节拍频率除以原始节拍频率,可以得到上限倍速。电子设备将下限节拍频率除以原始节拍频率,可以得到下限倍速。上限倍速为倍速范围的最大值,下限倍速为倍速范围的最小值,倍速范围包括了上限倍速和下限倍速之间的各个倍速。

在本实施例中,将上限节拍频率除以原始节拍频率,得到上限倍速;将下限节拍频率除以原始节拍频率,得到下限倍速;基于上限倍速和下限倍速可以准确生成原始音频的倍速范围。

在一个实施例中,如图3所示,基于原始节拍频率和目标节拍频率,在倍速范围内确定原始音频的目标倍速,包括:

步骤302,将目标节拍频率除以原始节拍频率,得到参考倍速。

例如,目标节拍频率为150,原始节拍频率为100,则将目标节拍频率150除以原始节拍频率100,得到参考倍速为1.5。又如,目标节拍频率为50,原始节拍频率为100,则将目标节拍频率50除以原始节拍频率100,得到参考倍速为0.5。

步骤304,将参考倍速与倍速范围进行匹配,得到匹配结果。

可以理解的是,电子设备将参考倍速与倍速范围进行匹配,则得到的匹配结果可以是参考倍速处于倍速范围内,也可以参考倍速超出该倍速范围。

步骤306,基于匹配结果从倍速范围确定原始音频的目标倍速。

基于匹配结果,从倍速范围内确定原始音频的目标倍速,则确定的目标倍速可以使得原始音频进行变速之后得到的目标音频,在播放时声音不失真,也即保真。

在一个实施例中,倍速范围包括上限倍速至下限倍速之间的各个倍速。

上限倍速为倍速范围的最大值,下限倍速为倍速范围的最小值,倍速范围包括了上限倍速和下限倍速之间的各个倍速。

如图4所示,基于匹配结果从倍速范围确定原始音频的目标倍速,包括:

步骤402,当参考倍速处于倍速范围内时,将参考倍速作为原始音频的目标倍速。

当参考倍速处于倍速范围内时,则原始音频以该参考倍速进行播放时声音不失真,则可以将该参考倍速作为原始音频的目标倍速。

步骤404,当参考倍速大于倍速范围的上限倍速时,将上限倍速作为原始音频的目标倍速。

当参考倍速大于倍速范围的上限倍速时,表示该参考倍速过大,当原始音频以该参考倍速进行播放时声音失真。因此,电子设备可以将倍速范围的最大值,即上限倍速作为该原始音频的目标倍速。

在另一种实施方式中,当参考倍速大于倍速范围的上限倍速时,还可以将倍速范围内的其他倍速作为原始音频的目标倍速。

步骤406,当参考倍速小于倍速范围的下限倍速时,将下限倍速作为原始音频的目标倍速。

当参考倍速小于倍速范围的下限倍速时,表示该参考倍速过小,当原始音频以该参考倍速进行播放时声音失真。因此,电子设备可以将倍速范围的最小值,即下限倍速作为该原始音频的目标倍速。

在另一种实施方式中,当参考倍速小于倍速范围的下限倍速时,还可以将倍速范围内的其他倍速作为原始音频的目标倍速。

在本实施例中,不管参考倍速是否处于倍速范围内,均可以保证确定的原始音频的目标倍速处于倍速范围内,从而可以保证原始音频以目标倍速进行播放时声音保真。

在一个实施例中,上述方法还包括:采用目标倍速对原始音频进行调整,得到目标音频;获取对目标音频的播放指令,根据播放指令播放目标音频。

当目标倍速大于1时,表示对原始音频进行快进,则对原始音频进行删帧,得到目标音频。当目标倍速小于1时,表示对原始音频进行慢放,则对原始音频进行插帧,得到目标音频。当目标倍速等于1时,表示原始音频速度不变,则不对原始音频进行处理,目标音频即原始音频。

电子设备先对原始音频进行划分基音周期(声带每开启一次和闭合一次的时间),之后采用重叠相加算法对基音周期进行插帧或删帧,从而达到音频快进或慢放的目的。

在本实施例中,采用目标倍速对原始音频进行调整,得到目标音频,则目标音频在播放时声音不失真,也即保真。

在一个实施例中,上述方法还包括:基于目标节拍频率,确定马达的目标振动频率;在播放目标音频时,控制马达采用目标振动频率进行振动。

在一种实施方式中,马达的目标振动频率可以和目标节拍频率相同。在其他实施例中,马达的目标振动频率也可以和目标节拍频率不同,如马达的目标振动频率是目标节拍频率的一半,如马达的目标振动频率是目标节拍频率的两倍,等等。

电子设备在播放目标音频时,控制马达采用目标振动频率进行振动,不仅可以从声音这一维度播放目标音频,还可以从触感这一维度体现目标音频在播放时的节奏,并且可以更好地提醒用户电子设备此时正处于播放目标音频的状态。

例如,电子设备预先设置目标音频为来电铃声,当接收到来电呼叫时,电子设备播放该目标音频,并且同时控制马达采用目标振动频率进行振动,不仅可以从声音这一维度提醒用户接收到来电,还可以从触感这一维度提醒用户接受到来电。

在一个实施例中,上述方法还包括:当接收到呼叫请求时,播放目标音频,并执行在播放目标音频时,控制马达采用目标振动频率进行振动步骤;统计播放目标音频的时长;当时长达到时长阈值时,控制马达停止振动。

播放目标音频的时长,指的是从开始播放目标音频的时刻至当前时刻的之间的时长。时长阈值可以根据用户需要进行设定。

电子设备接收到呼叫请求时,播放目标音频,并且同时控制马达采用目标振动频率进行振动。当电子设备统计播放目标音频的时长达到时长阈值时,表示电子设备播放该目标音频的时长较长,用户可能不在电子设备旁边,或者用户不方便进行接听等,则可以控制马达停止振动,可以节约电子设备的处理资源。

在一个实施例中,在播放目标音频时,控制马达采用目标振动频率进行振动,包括:在播放目标音频时,检测目标音频的声音强度;基于目标音频的声音强度确定马达的目标振动强度;马达的目标振动强度与目标音频的声音强度成负相关;控制马达采用目标振动频率以及目标振动强度进行振动。

目标音频的声音强度指的是目标音频在播放时的声音大小,可以用分贝进行表示,分贝越大,声音强度越强,目标音频在播放时声音越大。目标振动强度指的是马达振动的强度。目标振动强度越强,表示马达振动的越剧烈,则用户越容易感知到马达的振动。

可以理解的是,当目标音频的声音强度越强,则马达的目标振动强度越弱,可以节约电子设备的处理资源;当目标音频的声音强度越弱,则马达的目标振动强度越强,可以更好地提醒用户电子设备正处于播放目标音频的状态。也就是说,马达的目标振动强度与目标音频的声音强度成负相关。

应该理解的是,虽然图1、图3和图4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1、图3和图4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

图5为一个实施例的音频变速装置的结构框图。如图5所示,提供了一种音频变速装置500,包括:原始音频获取模块502、节拍检测模块504、目标节拍频率获取模块506、倍速范围确定模块508和目标倍速确定模块510。其中:

原始音频获取模块502,用于获取原始音频。

节拍检测模块504,用于对所述原始音频进行节拍检测,得到所述原始音频的原始节拍频率。

目标节拍频率获取模块506,用于获取节拍频率范围,以及获取目标节拍频率;节拍频率范围内的节拍频率对应的音频在播放时保真;。

倍速范围确定模块508,用于基于所述节拍频率范围和所述原始节拍频率,确定所述原始音频的倍速范围。

目标倍速确定模块510,用于基于所述原始节拍频率和所述目标节拍频率,在所述倍速范围内确定所述原始音频的目标倍速。

上述音频变速装置,获取原始音频;对原始音频进行节拍检测,得到原始音频的原始节拍频率;获取节拍频率范围,以及获取目标节拍频率;基于节拍频率范围和原始节拍频率,确定原始音频的倍速范围;节拍频率范围内的节拍频率对应的音频在播放时保真,而倍速范围由该节拍频率范围所确定,则音频以该倍速范围内的倍速进行播放时也保真;基于原始节拍频率和目标节拍频率,在倍速范围内确定原始音频的目标倍速,可以保证该原始音频以目标倍速进行播放时声音不失真,也即保真。

在一个实施例中,节拍频率范围包括上限节拍频率至下限节拍频率之间的各个节拍频率;上述倍速范围确定模块508还用于将所述上限节拍频率除以所述原始节拍频率,得到上限倍速;将所述下限节拍频率除以所述原始节拍频率,得到下限倍速;基于所述上限倍速和所述下限倍速生成所述原始音频的倍速范围。

在一个实施例中,上述目标倍速确定模块510还用于将所述目标节拍频率除以所述原始节拍频率,得到参考倍速;将所述参考倍速与所述倍速范围进行匹配,得到匹配结果;基于所述匹配结果从所述倍速范围确定所述原始音频的目标倍速。

在一个实施例中,倍速范围包括上限倍速至下限倍速之间的各个倍速;上述目标倍速确定模块510还用于当所述参考倍速处于所述倍速范围内时,将所述参考倍速作为所述原始音频的目标倍速;当所述参考倍速大于所述倍速范围的上限倍速时,将所述上限倍速作为所述原始音频的目标倍速;当所述参考倍速小于所述倍速范围的下限倍速时,将所述下限倍速作为所述原始音频的目标倍速。

在一个实施例中,上述音频变速装置500还包括目标音频播放模块,用于采用所述目标倍速对所述原始音频进行调整,得到目标音频;获取对所述目标音频的播放指令,根据所述播放指令播放所述目标音频。

在一个实施例中,上述音频变速装置500还包括马达控制模块,用于基于所述目标节拍频率,确定马达的目标振动频率;在播放所述目标音频时,控制所述马达采用所述目标振动频率进行振动。

在一个实施例中,上述马达控制模块还用于当接收到呼叫请求时,播放所述目标音频,并执行在播放所述目标音频时,控制所述马达采用所述目标振动频率进行振动步骤;统计播放所述目标音频的时长;当所述时长达到时长阈值时,控制所述马达停止振动。

在一个实施例中,上述马达控制模块还用于在播放目标音频时,检测目标音频的声音强度;基于目标音频的声音强度确定马达的目标振动强度;马达的目标振动强度与目标音频的声音强度成负相关;控制马达采用目标振动频率以及目标振动强度进行振动。

上述音频变速装置中各个模块的划分仅仅用于举例说明,在其他实施例中,可将音频变速装置按照需要划分为不同的模块,以完成上述音频变速装置的全部或部分功能。

关于音频变速装置的具体限定可以参见上文中对于音频变速方法的限定,在此不再赘述。上述音频变速装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

图6为一个实施例中电子设备的内部结构示意图。如图6所示,该电子设备包括通过系统总线连接的处理器和存储器。其中,该处理器用于提供计算和控制能力,支撑整个电子设备的运行。存储器可包括非易失性存储介质及内存储器。非易失性存储介质存储有操作系统和计算机程序。该计算机程序可被处理器所执行,以用于实现以下各个实施例所提供的一种音频变速方法。内存储器为非易失性存储介质中的操作系统计算机程序提供高速缓存的运行环境。该电子设备可以是手机、平板电脑、pda(personaldigitalassistant,个人数字助理)、pos(pointofsales,销售终端)、车载电脑、穿戴式设备等任意终端设备。

本申请实施例中提供的音频变速装置中的各个模块的实现可为计算机程序的形式。该计算机程序可在终端或服务器上运行。该计算机程序构成的程序模块可存储在电子设备的存储器上。该计算机程序被处理器执行时,实现本申请实施例中所描述方法的步骤。

本申请实施例还提供了一种计算机可读存储介质。一个或多个包含计算机可执行指令的非易失性计算机可读存储介质,当所述计算机可执行指令被一个或多个处理器执行时,使得所述处理器执行音频变速方法的步骤。

一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行音频变速方法。

本申请所使用的对存储器、存储、数据库或其它介质的任何引用可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram),它用作外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1