一种音频编码方法和装置与流程

文档序号:12179719阅读:197来源:国知局
一种音频编码方法和装置与流程

本发明涉及通信领域,尤其涉及一种音频编码方法和装置。



背景技术:

随着技术的不断进步,用户对电子设备的音频质量的需求越来越高,其中提高音频的带宽是提高音频质量的主要方法,如果电子设备采用传统的编码方式对音频进行编码以增加音频的带宽,会大大提高音频的编码信息的码率,从而在两个电子设备之间传输音频的编码信息时会占用较多的网络传输带宽,由此提出的课题就是:要在音频编码信息的码率不变或者码率变化不大的情况下编码带宽更宽的音频。针对这个课题提出的解决方案是采用频带扩展技术,频带扩展技术分为时域频带扩展技术和频域频带扩展技术,本发明涉及时域频带扩展技术。

在时域频带扩展技术中,一般使用线性预测算法计算出音频中每一音频帧的线性预测参数,例如线性预测编码(LPC,Linear Predictive Coding)系数、线性频谱对(LSP,Linear Spectral Pairs)系数、电抗频谱对(ISP,Immittance Spectral Pairs)系数或者线性谱频率(LSF,Linear Spectral Frequency)系数等,在对音频进行编码传输时,根据音频中每一音频帧的线性预测参数对音频进行编码。但是,在编解码误差精度要求比较高的情况下,这种编码方式会造成音频帧间频谱的不连续。



技术实现要素:

本发明实施例中提供了一种音频编码方法和装置,能够在码率不变或者码率变化不大的情况下编码带宽更宽的音频,且音频帧间频谱更为平稳。

第一方面,本发明实施例提供一种音频编码方法,包括:

对于每一音频帧,确定所述音频帧与所述音频帧的前一音频帧的信号特性满足预设修正条件时,根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重;确定所述音频帧与所述音频帧的前一音频帧的信号特性不满足预设修正条件时,确定第二修正权重;所述预设修正条件用于确定所述音频帧与所述音频帧的前一音频帧的信号特性相近;

根据确定的所述第一修正权重或者所述第二修正权重对所述音频帧的线性预测参数进行修正;

根据所述音频帧修正后的线性预测参数对所述音频帧进行编码。

结合第一方面,在第一方面第一种可能的实现方式中,所述根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重,包括:

根据所述音频帧的LSF差值和所述前一音频帧的LSF差值使用以下公式确定所述第一修正权重:

其中,w[i]为所述第一修正权重,lsf_new_diff[i]为所述音频帧的LSF差值,lsf_old_diff[i]为所述音频帧的前一音频帧的LSF差值,i为LSF差值的阶数,i的取值为0~M-1,M为线性预测参数的阶数。

结合第一方面、或第一方面第一种可能的实现方式,在第一方面第二种可能的实现方式中,所述确定第二修正权重,包括:

将所述第二修正权重确定为预设修正权重值,所述预设修正权重值大于0,小于或等于1。

结合第一方面、或第一方面第一种可能的实现方式、或第一方面第二种可能的实现方式,在第一方面第三种可能的实现方式中,所述根据确定的所述第一修正权重对所述音频帧的线性预测参数进行修正,包括:

根据所述第一修正权重使用以下公式对所述音频帧的线性预测参数进行修正:

L[i]=(1-w[i])*L_old[i]+w[i]*L_new[i];

其中,w[i]为所述第一修正权重,L[i]为所述音频帧修正后的线性预测参数,L_new[i]为所述音频帧的线性预测参数,L_old[i]为所述音频帧的前一音频帧的线性预测参数,i为线性预测参数的阶数,i的取值为0~M-1,M为线性预测参数的阶数。

结合第一方面、或第一方面第一种可能的实现方式、或第一方面第二种可能的实现方式、或第一方面第三种可能的实现方式,在第一方面第四种可能的实现方式中,所述根据确定的所述第二修正权重对所述音频帧的线性预测参数进行修正,包括:

根据所述第二修正权重使用以下公式对所述音频帧的线性预测参数进行修正:

L[i]=(1-y)*L_old[i]+y*L_new[i];

其中,y为所述第二修正权重,L[i]为所述音频帧修正后的线性预测参数,L_new[i]为所述音频帧的线性预测参数,L_old[i]为所述音频帧的前一音频帧的线性预测参数,i为线性预测参数的阶数,i的取值为0~M-1,M为线性预测参数的阶数。

结合第一方面、或第一方面第一种可能的实现方式、或第一方面第二种可能的实现方式、或第一方面第三种可能的实现方式、或第一方面第四种可能的实现方式,在第一方面第五种可能的实现方式中,所述确定所述音频帧与所述音频帧的前一音频帧的信号特性满足预设修正条件,包括:确定所述音频帧不是过渡帧,所述过渡帧包括从非摩擦音到摩擦音的过渡帧、从摩擦音到非摩擦音的过渡帧;

所述确定所述音频帧与所述音频帧的前一音频帧的信号特性不满足预设修正条件,包括:确定所述音频帧是过渡帧。

结合第一方面第五种可能的实现方式,在第一方面第六种可能的实现方式中,确定所述音频帧是从摩擦音到非摩擦音的过渡帧,包括:确定所述前一音频帧的谱倾斜频率大于第一谱倾斜频率阈值,并且所述音频帧的编码类型为瞬态;

确定所述音频帧不是从摩擦音到非摩擦音的过渡帧,包括:确定所述前一音频帧的谱倾斜频率不大于所述第一谱倾斜频率阈值,和/或所述音频帧的编码类型不为瞬态;

结合第一方面第五种可能的实现方式,在第一方面第七种可能的实现方式中,确定所述音频帧是从摩擦音到非摩擦音的过渡帧,包括:确定所述前一音频帧的谱倾斜频率大于第一谱倾斜频率阈值,并且所述音频帧的谱倾斜频率小于第二谱倾斜频率阈值;

确定所述音频帧不是从摩擦音到非摩擦音的过渡帧,包括:确定所述前一音频帧的谱倾斜频率不大于所述第一谱倾斜频率阈值,和/或所述音频帧的谱倾斜频率不小于所述第二谱倾斜频率阈值。

结合第一方面第五种可能的实现方式,在第一方面第八种可能的实现方式中,确定所述音频帧是从非摩擦音到摩擦音的过渡帧,包括:确定所述前一音频帧的谱倾斜频率小于第三谱倾斜频率阈值,并且,所述前一音频帧的编码类型为浊音、一般、瞬态、音频四种类型之一,并且,所述音频帧的谱倾斜频率大于第四谱倾斜频率阈值;

确定所述音频帧不是从非摩擦音到摩擦音的过渡帧,包括:确定所述前一音频帧的谱倾斜频率不小于所述第三谱倾斜频率阈值,和/或所述前一音频帧的编码类型不为浊音、一般、瞬态、音频四种类型之一,和/或所述音频帧的谱倾斜频率不大于所述第四谱倾斜频率阈值。

结合第一方面第五种可能的实现方式,在第一方面第九种可能的实现方式中,确定所述音频帧是从摩擦音到非摩擦音的过渡帧,包括:确定所述前一音频帧的谱倾斜频率大于第一谱倾斜频率阈值,并且所述音频帧的编码类型为瞬态。

结合第一方面第五种可能的实现方式,在第一方面第十种可能的实现方式中,确定所述音频帧是从摩擦音到非摩擦音的过渡帧,包括:确定所述前一音频帧的谱倾斜频率大于第一谱倾斜频率阈值,并且所述音频帧的谱倾斜频率小于第二谱倾斜频率阈值。

结合第一方面第五种可能的实现方式,在第一方面第十一种可能的实现方式中确定所述音频帧是从非摩擦音到摩擦音的过渡帧,包括:确定所述前一音频帧的谱倾斜频率小于第三谱倾斜频率阈值,并且,所述前一音频帧的编码类型为浊音、一般、瞬态、音频四种类型之一,并且,所述音频帧的谱倾斜频率大于第四谱倾斜频率阈值。

第二方面,本发明实施例提供一种音频编码装置,包括确定单元、修正单元以及编码单元,其中,

所述确定单元,用于对于每一音频帧,确定所述音频帧与所述音频帧的前一音频帧的信号特性满足预设修正条件时,根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重;确定所述音频帧与所述音频帧的前一音频帧的信号特性不满足预设修正条件时,确定第二修正权重;所述预设修正条件用于确定所述音频帧与所述音频帧的前一音频帧的信号特性相近;

所述修正单元,用于根据所述确定单元确定的所述第一修正权重或者所述第二修正权重对所述音频帧的线性预测参数进行修正;

所述编码单元,用于根据所述修正单元修正得到的所述音频帧修正后的线性预测参数对所述音频帧进行编码。

结合第二方面,在第二方面第一种可能的实现方式中,所述确定单元具体用于:根据所述音频帧的LSF差值和所述前一音频帧的LSF差值使用以下公式确定所述第一修正权重:

其中,w[i]为所述第一修正权重,lsf_new_diff[i]为所述音频帧的LSF差值,lsf_old_diff[i]为所述音频帧的前一音频帧的LSF差值,i为LSF差值的阶数,i的取值为0~M-1,M为线性预测参数的阶数。

结合第二方面、或第二方面第一种可能的实现方式,在第二方面第二种可能的实现方式中,所述确定单元具体用于:将所述第二修正权重确定为预设修正权重值,所述预设修正权重值大于0,小于等于1。

结合第二方面、或第二方面第一种可能的实现方式、或第二方面第二种可能的实现方式,在第二方面第三种可能的实现方式中,所述修正单元具体用于:根据所述第一修正权重使用以下公式对所述音频帧的线性预测参数进行修正:

L[i]=(1-w[i])*L_old[i]+w[i]*L_new[i];

其中,w[i]为所述第一修正权重,L[i]为所述音频帧修正后的线性预测参数,L_new[i]为所述音频帧的线性预测参数,L_old[i]为所述音频帧的前一音频帧的线性预测参数,i为线性预测参数的阶数,i的取值为0~M-1,M为线性预测参数的阶数。

结合第二方面、或第二方面第一种可能的实现方式、或第二方面第二种可能的实现方式、或第二方面第三种可能的实现方式,在第二方面第四种可能的实现方式中,所述修正单元具体用于:根据所述第二修正权重使用以下公式对所述音频帧的线性预测参数进行修正:

L[i]=(1-y)*L_old[i]+y*L_new[i];

其中,y为所述第二修正权重,L[i]为所述音频帧修正后的线性预测参数,L_new[i]为所述音频帧的线性预测参数,L_old[i]为所述音频帧的前一音频帧的线性预测参数,i为线性预测参数的阶数,i的取值为0~M-1,M为线性预测参数的阶数。

结合第二方面、或第二方面第一种可能的实现方式、或第二方面第二种可能的实现方式、或第二方面第三种可能的实现方式、或第二方面第四种可能的实现方式,在第二方面第五种可能的实现方式中,所述确定单元具体用于:对于音频中的每一音频帧,确定所述音频帧不是过渡帧时,根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重;确定所述音频帧是过渡帧时,确定第二修正权重;所述过渡帧包括从非摩擦音到摩擦音的过渡帧、从摩擦音到非摩擦音的过渡帧。

结合第二方面第五种可能的实现方式,在第二方面第六种可能的实现方式中,所述确定单元具体用于:

对于音频中的每一音频帧,确定所述前一音频帧的谱倾斜频率不大于第一谱倾斜频率阈值、和/或所述音频帧的编码类型不为瞬态时,根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重;确定所述前一音频帧的谱倾斜频率大于所述第一谱倾斜频率阈值、并且所述音频帧的编码类型为瞬态时,确定第二修正权重。

结合第二方面第五种可能的实现方式,在第二方面第七种可能的实现方式中,所述确定单元具体用于:

对于音频中的每一音频帧,确定所述前一音频帧的谱倾斜频率不大于第一谱倾斜频率阈值、和/或所述音频帧的谱倾斜频率不小于第二谱倾斜频率阈值时,根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重;确定所述前一音频帧的谱倾斜频率大于所述第一谱倾斜频率阈值、并且所述音频帧的谱倾斜频率小于所述第二谱倾斜频率阈值时,确定第二修正权重。

结合第二方面第五种可能的实现方式,在第二方面第八种可能的实现方式中,所述确定单元具体用于:

对于音频中的每一音频帧,确定所述前一音频帧的谱倾斜频率不小于第三谱倾斜频率阈值,和/或所述前一音频帧的编码类型不为浊音、一般、瞬态、音频四种类型之一,和/或所述音频帧的谱倾斜不大于第四谱倾斜阈值时,根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重;确定所述前一音频帧的谱倾斜频率小于所述第三谱倾斜频率阈值,并且所述前一音频帧的编码类型为浊音、一般、瞬态、音频四种类型之一,并且所述音频帧的谱倾斜频率大于所述第四谱倾斜频率阈值时,确定第二修正权重。

本发明实施例中,对于音频中的每一音频帧,确定所述音频帧与所述音频帧的前一音频帧的信号特性满足预设修正条件时,根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重;确定所述音频帧与所述音频帧的前一音频帧的信号特性不满足预设修正条件时,确定第二修正权重;所述预设修正条件用于确定所述音频帧与所述音频帧的前一音频帧的信号特性相近;根据确定的所述第一修正权重或者所述第二修正权重对所述音频帧的线性预测参数进行修正;根据所述音频帧修正后的线性预测参数对所述音频帧进行编码。从而根据所述音频帧与所述音频帧的前一音频帧的信号特性是否相近来确定不同的修正权重,对音频帧的线性预测参数进行修正,使得音频帧间频谱更为平稳;而且,根据所述音频帧修正后的线性预测参数对所述音频帧进行编码,从而能够在保证码率不变的情况下使得解码恢复的频谱帧间连续增强,从而更加接近原始的频谱,提高了编码性能。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例音频编码方法流程示意图;

图1A为实际频谱和LSF差值对比关系图;

图2为本发明实施例音频编码方法应用场景举例;

图3为本发明实施例音频编码装置结构示意图;

图4为本发明实施例电子设备结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参见图1,为本发明实施例音频解码方法流程图,该方法包括:

步骤101:对于音频中的每一音频帧,电子设备确定所述音频帧与所述音频帧的前一音频帧的信号特性满足预设修正条件时,根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重;确定所述音频帧与所述音频帧的前一音频帧的信号特性不满足预设修正条件时,确定第二修正权重;所述预设修正条件用于确定所述音频帧与所述音频帧的前一音频帧的信号特性相近;

步骤102:电子设备根据确定的所述第一修正权重或者所述第二修正权重对所述音频帧的线性预测参数进行修正;

其中,所述线性预测参数可以包括:LPC、LSP、ISP或者LSF等。

步骤103:电子设备根据所述音频帧修正后的线性预测参数对所述音频帧进行编码。

本实施例中,对于音频中的每一音频帧,电子设备确定所述音频帧与所述音频帧的前一音频帧的信号特性满足预设修正条件时,根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重;确定所述音频帧与所述音频帧的前一音频帧的信号特性不满足预设修正条件时,确定第二修正权重;根据确定的所述第一修正权重或者所述第二修正权重对所述音频帧的线性预测参数进行修正;根据所述音频帧修正后的线性预测参数对所述音频帧进行编码。从而根据所述音频帧与所述音频帧的前一音频帧的信号特性是否相近来确定不同的修正权重,对音频帧的线性预测参数进行修正,使得音频帧间频谱更为平稳。另外,根据所述音频帧与所述音频帧的前一音频帧的信号特性是否相近来确定不同的修正权重,在信号特性不相近时确定的第二修正权重可以尽量接近1,从而在所述音频帧与所述音频帧的前一音频帧的信号特性不相近时,尽量保持音频帧的原始频谱特点,使得音频的编码信息被解码后得到的音频的听觉质量更好。

其中,对于步骤101中,电子设备如何确定所述音频帧与所述音频帧的前一音频帧的信号特性是否满足预设修正条件,其具体实现与修正条件的具体实现相关,以下举例说明:

在一种可能的实现方式中,所述修正条件可以包括:音频帧不是过渡帧,则,

电子设备确定所述音频帧与所述音频帧的前一音频帧的信号特性满足预设修正条件,可以包括:确定所述音频帧不是过渡帧,所述过渡帧包括从非摩擦音到摩擦音的过渡帧、从摩擦音到非摩擦音的过渡帧;

电子设备确定所述音频帧与所述音频帧的前一音频帧的信号特性不满足预设修正条件,可以包括:确定所述音频帧是所述过渡帧。

在一种可能的实现方式中,在确定所述音频帧是否是从摩擦音到非摩擦音的过渡帧时,可以通过确定所述前一音频帧的谱倾斜频率是否大于第一谱倾斜频率阈值,并且所述音频帧的编码类型是否为瞬态来实现,具体的,确定所述音频帧是从摩擦音到非摩擦音的过渡帧,可以包括:确定所述前一音频帧的谱倾斜频率大于第一谱倾斜频率阈值,并且所述音频帧的编码类型为瞬态;确定所述音频帧不是从摩擦音到非摩擦音的过渡帧,可以包括:确定所述前一音频帧的谱倾斜频率不大于第一谱倾斜频率阈值,和/或所述音频帧的编码类型不为瞬态;

在另一种可能的实现方式中,在确定所述音频帧是否是从摩擦音到非摩擦音的过渡帧时,可以通过确定所述前一音频帧的谱倾斜频率是否大于第一频率阈值,并且确定所述音频帧的谱倾斜频率是否小于第二频率阈值来实现,具体的,确定所述音频帧是从摩擦音到非摩擦音的过渡帧,可以包括:确定所述前一音频帧的谱倾斜频率大于第一谱倾斜频率阈值,并且所述音频帧的谱倾斜频率小于第二谱倾斜频率阈值;确定所述音频帧不是从摩擦音到非摩擦音的过渡帧,可以包括:确定所述前一音频帧的谱倾斜频率不大于第一谱倾斜频率阈值,和/或所述音频帧的谱倾斜频率不小于第二谱倾斜频率阈值。其中,本发明实施例对第一谱倾斜频率阈值和第二谱倾斜频率阈值的具体取值不限制,以及对第一谱倾斜频率阈值和第二谱倾斜频率阈值之间的大小关系不限制。可选的,在本发明一个实施例中,第一谱倾斜频率阈值的取值可以为5.0;在本发明另一个实施例中,第二谱倾斜频率阈值可以取值为1.0。

在一种可能的实现方式中,在确定所述音频帧是否是从非摩擦音到摩擦音的过渡帧时,可以通过确定所述前一音频帧的谱倾斜频率是否小于第三频率阈值,并且,确定所述前一音频帧的编码类型是否为浊音(Voiced)、一般(Generic)、瞬态(Transition)、音频(Audio)四种类型之一,并且,确定所述音频帧的谱倾斜频率是否大于第四频率阈值来实现,具体的,确定所述音频帧是从非摩擦音到摩擦音的过渡帧,可以包括:确定所述前一音频帧的谱倾斜频率小于第三谱倾斜频率阈值,并且,所述前一音频帧的编码类型为浊音、一般、瞬态、音频四种类型之一,并且,所述音频帧的谱倾斜大于第四谱倾斜阈值;确定所述音频帧不是从非摩擦音到摩擦音的过渡帧,可以包括:确定所述前一音频帧的谱倾斜频率不小于第三谱倾斜频率阈值,和/或所述前一音频帧的编码类型不为浊音、一般、瞬态、音频四种类型之一,和/或所述音频帧的谱倾斜频率不大于第四谱倾斜频率阈值。其中,本发明实施例对第三谱倾斜频率阈值和第四谱倾斜频率阈值的具体取值不限制,以及对第三谱倾斜频率阈值和第四谱倾斜频率阈值之间的大小关系不限制。在本发明一个实施例中,第三谱倾斜频率阈值的取值可以为3.0;在本发明另一个实施例中,第四谱倾斜频率阈值可以取值为5.0。

在步骤101中,电子设备根据所述音频帧的LSF差值和所述前一音频帧的LSF差值确定第一修正权重可以包括:

电子设备根据所述音频帧的LSF差值和所述前一音频帧的LSF差值使用以下公式确定所述第一修正权重:

其中,w[i]为所述第一修正权重;lsf_new_diff[i]为所述音频帧的LSF差值,lsf_new_diff[i]=lsf_new[i]-lsf_new[i-1],lsf_new[i]为所述音频帧的第i阶LSF参数,lsf_new[i-1]为所述音频帧的第i-1阶LSF参数;lsf_old_diff[i]为所述音频帧的前一音频帧的LSF差值,lsf_old_diff[i]=lsf_old[i]-lsf_old[i-1],lsf_old[i]为所述音频帧的前一音频帧的第i阶LSF参数,lsf_old[i-1]为所述音频帧的前一音频帧的第i-1阶LSF参数;i为LSF参数和LSF差值的阶数,i的取值为0~M-1,M为线性预测参数的阶数。

其中,上述公式的原理如下:

参见图1A为实际频谱和LSF差值对比关系图,由该图可以看到,音频帧内LSF差值lsf_new_diff[i]反映了音频帧的频谱能量趋势,lsf_new_diff[i]越小,相应频点的频谱能量越大;

如果w[i]=lsf_new_diff[i]/lsf_old_diff[i]越小,说明在lsf_new[i]对应的频点处,前后帧的频谱能量差别越大,而且所述音频帧的频谱能量比前一音频帧对应频点的频谱能量大的越多;

如果w[i]=lsf_old_diff[i]/lsf_new_diff[i]越小,说明在lsf_new[i]对应的频点处,前后帧的频谱能量差别越小,而且所述音频帧的频谱能量比前一音频帧对应频点的频谱能量小的越多;

所以,为了使得前后帧间的频谱能平稳,可以用w[i]作为所述音频帧lsf_new[i]的权重,1-w[i]作为前一音频帧相应频点的权重,详见公式2所示。

在步骤101中,电子设备确定第二修正权重可以包括:

电子设备将所述第二修正权重确定为预设修正权重值,所述预设修正权重值大于0,小于等于1。

优选地,所述预设修正权重值是一个接近1的数值。

在步骤102中,电子设备根据确定的所述第一修正权重对所述音频帧的线性预测参数进行修正可以包括:

根据所述第一修正权重使用以下公式对所述音频帧的线性预测参数进行修正:

L[i]=(1-w[i])*L_old[i]+w[i]*L_new[i]; 公式2

其中,w[i]为所述第一修正权重,L[i]为所述音频帧修正后的线性预测参数,L_new[i]为所述音频帧的线性预测参数,L_old[i]为所述音频帧的前一音频帧的线性预测参数,i为线性预测参数的阶数,i的取值为0~M-1,M为线性预测参数的阶数。

在步骤102中,电子设备根据确定的所述第二修正权重对所述音频帧的线性预测参数进行修正可以包括:

根据所述第二修正权重使用以下公式对所述音频帧的线性预测参数进行修正:

L[i]=(1-y)*L_old[i]+y*L_new[i]; 公式3

其中,y为所述第二修正权重,L[i]为所述音频帧修正后的线性预测参数,L_new[i]为所述音频帧的线性预测参数,L_old[i]为所述音频帧的前一音频帧的线性预测参数,i为线性预测参数的阶数,i的取值为0~M-1,M为线性预测参数的阶数。

在步骤103中,电子设备具体如何根据所述音频帧修正后的线性预测参数对所述音频帧进行编码,可以参考相关时域频带扩展技术,本发明不再赘述。

本发明实施例音频编码方法可以应用于图2所示的时域频带扩展方法中。其中,在该时域频带扩展方法中:

将原始的音频信号分解为低频带信号和高频带信号;

对于低频带信号,依次进行低频带信号编码、低频带激励信号预处理、LP合成、计算及量化时域包络等处理;

对于高频带信号,依次进行高频带信号预处理、LP分析、量化LPC等处理;

根据低频带信号编码的结果、量化LPC的结果以及计算及量化时域包络的结果对音频信号进行MUX。

其中,所述量化LPC即对应本发明实施例的步骤101和步骤102,而对音频信号进行MUX即对应本发明实施例的步骤103。

参见图3,为本发明实施例一种音频编码装置结构示意图,该装置可以设置于电子设备中,该装置300可以包括确定单元310、修正单元320以及编码单元330,其中,

所述确定单元310,用于对于音频中的每一音频帧,确定所述音频帧与所述音频帧的前一音频帧的信号特性满足预设修正条件时,根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重;确定所述音频帧与所述音频帧的前一音频帧的信号特性不满足预设修正条件时,确定第二修正权重;所述预设修正条件用于确定所述音频帧与所述音频帧的前一音频帧的信号特性相近;

所述修正单元320,用于根据所述确定单元310确定的所述第一修正权重或者所述第二修正权重对所述音频帧的线性预测参数进行修正;

所述编码单元330,用于根据所述修正单元320修正得到的所述音频帧修正后的线性预测参数对所述音频帧进行编码。

可选地,所述确定单元310具体可以用于:根据所述音频帧的LSF差值和所述前一音频帧的LSF差值使用以下公式确定所述第一修正权重:

其中,w[i]为所述第一修正权重,lsf_new_diff[i]为所述音频帧的LSF差值,lsf_old_diff[i]为所述音频帧的前一音频帧的LSF差值,i为LSF差值的阶数,i的取值为0~M-1,M为线性预测参数的阶数。

可选地,所述确定单元310具体可以用于:将所述第二修正权重确定为预设修正权重值,所述预设修正权重值大于0,小于等于1。

可选地,所述修正单元320具体可以用于:根据所述第一修正权重使用以下公式对所述音频帧的线性预测参数进行修正:

L[i]=(1-w[i])*L_old[i]+w[i]*L_new[i];

其中,w[i]为所述第一修正权重,L[i]为所述音频帧修正后的线性预测参数,L_new[i]为所述音频帧的线性预测参数,L_old[i]为所述音频帧的前一音频帧的线性预测参数,i为线性预测参数的阶数,i的取值为0~M-1,M为线性预测参数的阶数。

可选地,所述修正单元320具体可以用于:根据所述第二修正权重使用以下公式对所述音频帧的线性预测参数进行修正:

L[i]=(1-y)*L_old[i]+y*L_new[i];

其中,y为所述第二修正权重,L[i]为所述音频帧修正后的线性预测参数,L_new[i]为所述音频帧的线性预测参数,L_old[i]为所述音频帧的前一音频帧的线性预测参数,i为线性预测参数的阶数,i的取值为0~M-1,M为线性预测参数的阶数。

可选地,所述确定单元310具体可以用于:对于音频中的每一音频帧,确定所述音频帧不是过渡帧时,根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重;确定所述音频帧是过渡帧时,确定第二修正权重;所述过渡帧包括从非摩擦音到摩擦音的过渡帧、从摩擦音到非摩擦音的过渡帧。

可选地,所述确定单元310具体可以用于:对于音频中的每一音频帧,确定所述前一音频帧的谱倾斜频率不大于第一谱倾斜频率阈值、和/或所述音频帧的编码类型不为瞬态时,根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重;确定所述前一音频帧的谱倾斜频率大于第一谱倾斜频率阈值、并且所述音频帧的编码类型为瞬态时,确定第二修正权重。

可选地,所述确定单元310具体可以用于:对于音频中的每一音频帧,确定所述前一音频帧的谱倾斜频率不大于第一谱倾斜频率阈值、和/或所述音频帧的谱倾斜频率不小于第二谱倾斜频率阈值时,根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重;确定所述前一音频帧的谱倾斜频率大于第一谱倾斜频率阈值、并且所述音频帧的谱倾斜频率小于第二谱倾斜频率阈值时,确定第二修正权重。

可选地,所述确定单元310具体可以用于:对于音频中的每一音频帧,确定所述前一音频帧的谱倾斜频率不小于第三谱倾斜频率阈值,和/或所述前一音频帧的编码类型不为浊音、一般、瞬态、音频四种类型之一,和/或所述音频帧的谱倾斜不大于第四谱倾斜阈值时,根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重;确定所述前一音频帧的谱倾斜频率小于第三谱倾斜频率阈值,并且所述前一音频帧的编码类型为浊音、一般、瞬态、音频四种类型之一,并且所述音频帧的谱倾斜频率大于第四谱倾斜频率阈值时,确定第二修正权重。

本实施例中,对于音频中的每一音频帧,电子设备确定所述音频帧与所述音频帧的前一音频帧的信号特性满足预设修正条件时,根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重;确定所述音频帧与所述音频帧的前一音频帧的信号特性不满足预设修正条件时,确定第二修正权重;根据确定的所述第一修正权重或者所述第二修正权重对所述音频帧的线性预测参数进行修正;根据所述音频帧修正后的线性预测参数对所述音频帧进行编码。从而根据所述音频帧与所述音频帧的前一音频帧的信号特性是否满足预设修正条件来确定不同的修正权重,对音频帧的线性预测参数进行修正,使得音频帧间频谱更为平稳;而且,电子设备根据所述音频帧修正后的线性预测参数对所述音频帧进行编码,从而能够保证在码率不变或者码率变化不大的情况下编码带宽更宽的音频。

参见图4,为本发明实施例第一节点结构图,该第一节点400包括:处理器410、存储器420、收发器430和总线440;

处理器410、存储器420、收发器430通过总线440相互连接;总线440可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

存储器420,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器420可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。

收发器430用于连接其他设备,并与其他设备进行通信。

所述处理器410执行所述程序代码,用于对于音频中的每一音频帧,确定所述音频帧与所述音频帧的前一音频帧的信号特性满足预设修正条件时,根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重;确定所述音频帧与所述音频帧的前一音频帧的信号特性不满足预设修正条件时,确定第二修正权重;所述预设修正条件用于确定所述音频帧与所述音频帧的前一音频帧的信号特性相近;根据确定的所述第一修正权重或者所述第二修正权重对所述音频帧的线性预测参数进行修正;根据所述音频帧修正后的线性预测参数对所述音频帧进行编码。

可选地,所述处理器410具体可以用于:根据所述音频帧的LSF差值和所述前一音频帧的LSF差值使用以下公式确定所述第一修正权重:

其中,w[i]为所述第一修正权重,lsf_new_diff[i]为所述音频帧的LSF差值,lsf_old_diff[i]为所述音频帧的前一音频帧的LSF差值,i为LSF差值的阶数,i的取值为0~M-1,M为线性预测参数的阶数。

可选地,所述处理器410具体可以用于:将所述第二修正权重确定为1;或者,

将所述第二修正权重确定为预设修正权重值,所述预设修正权重值大于0,小于等于1。

可选地,所述处理器410具体可以用于:根据所述第一修正权重使用以下公式对所述音频帧的线性预测参数进行修正:

L[i]=(1-w[i])*L_old[i]+w[i]*L_new[i];

其中,w[i]为所述第一修正权重,L[i]为所述音频帧修正后的线性预测参数,L_new[i]为所述音频帧的线性预测参数,L_old[i]为所述音频帧的前一音频帧的线性预测参数,i为线性预测参数的阶数,i的取值为0~M-1,M为线性预测参数的阶数。

可选地,所述处理器410具体可以用于:根据所述第二修正权重使用以下公式对所述音频帧的线性预测参数进行修正:

L[i]=(1-y)*L_old[i]+y*L_new[i];

其中,y为所述第二修正权重,L[i]为所述音频帧修正后的线性预测参数,L_new[i]为所述音频帧的线性预测参数,L_old[i]为所述音频帧的前一音频帧的线性预测参数,i为线性预测参数的阶数,i的取值为0~M-1,M为线性预测参数的阶数。

可选地,所述处理器410具体可以用于:对于音频中的每一音频帧,确定所述音频帧不是过渡帧时,根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重;确定所述音频帧是过渡帧时,确定第二修正权重;所述过渡帧包括从非摩擦音到摩擦音的过渡帧、从摩擦音到非摩擦音的过渡帧。

可选地,所述处理器410具体可以用于:

对于音频中的每一音频帧,确定所述前一音频帧的谱倾斜频率不大于第一谱倾斜频率阈值、和/或所述音频帧的编码类型不为瞬态时,根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重;确定所述前一音频帧的谱倾斜频率大于第一谱倾斜频率阈值、并且所述音频帧的编码类型为瞬态时,确定第二修正权重;

或者,对于音频中的每一音频帧,确定所述前一音频帧的谱倾斜频率不大于第一谱倾斜频率阈值、和/或所述音频帧的谱倾斜频率不小于第二谱倾斜频率阈值时,根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重;确定所述前一音频帧的谱倾斜频率大于第一谱倾斜频率阈值、并且所述音频帧的谱倾斜频率小于第二谱倾斜频率阈值时,确定第二修正权重。

可选地,所述处理器410具体可以用于:

对于音频中的每一音频帧,确定所述前一音频帧的谱倾斜频率不小于第三谱倾斜频率阈值,和/或所述前一音频帧的编码类型不为浊音、一般、瞬态、音频四种类型之一,和/或所述音频帧的谱倾斜不大于第四谱倾斜阈值时,根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重;确定所述前一音频帧的谱倾斜频率小于第三谱倾斜频率阈值,并且所述前一音频帧的编码类型为浊音、一般、瞬态、音频四种类型之一,并且所述音频帧的谱倾斜频率大于第四谱倾斜频率阈值时,确定第二修正权重。

本实施例中,对于音频中的每一音频帧,电子设备确定所述音频帧与所述音频帧的前一音频帧的信号特性满足预设修正条件时,根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重;确定所述音频帧与所述音频帧的前一音频帧的信号特性不满足预设修正条件时,确定第二修正权重;根据确定的所述第一修正权重或者所述第二修正权重对所述音频帧的线性预测参数进行修正;根据所述音频帧修正后的线性预测参数对所述音频帧进行编码。从而根据所述音频帧与所述音频帧的前一音频帧的信号特性是否满足预设修正条件来确定不同的修正权重,对音频帧的线性预测参数进行修正,使得音频帧间频谱更为平稳;而且,电子设备根据所述音频帧修正后的线性预测参数对所述音频帧进行编码,从而能够保证在码率不变或者码率变化不大的情况下编码带宽更宽的音频。

本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述的本发明实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1