本技术实施例涉及计算机,尤其涉及一种音频编解码方法、装置、设备。
背景技术:
1、随着深度学习技术的快速发展,深度学习技术被广泛应用于不同维度的信号,例如音频,图像以及视频等的处理技术中。以音频信号为例,在基于深度学习的端到端的音频编解码方案中,编码器将音频信号经过编码网络映射为编码向量,进一步通过量化技术生成对应的二进制码流文件。解码端通过读取二进制码流文件获取量化结果,并通过反量化技术对量化结果进行反量化得到重建的编码向量,之后再将重建的编码向量作为解码网络的输入,解码得到最终的重建音频信号。
2、为了提高音频的编解码效果,则编码端在对音频数据进行编码之前先进行信号强度变换处理,例如进行响度归一化处理,对应的解码端的解码网络重建出音频数据后对音频数据的信号强度进行反变换,例如对重建的音频数据的响度进行反归一化处理。但是,目前信号强度变换方法,存在信号强度起伏的问题,进而使得音频编解码效果不理想。
技术实现思路
1、本技术提供一种音频编解码方法、装置、设备及存储介质,可以使得信号强度的变换更加平滑,进而提升音频编解码效果。
2、第一方面,本技术提供一种音频解码方法,包括:
3、解码码流,得到解码网络重建的当前音频块,所述当前音频块为对目标音频数据进行块划分所得到的m个音频块中的一个音频块,所述m为大于1的正整数,所述音频块包括2个或2个以上的音频帧;
4、对所述重建的当前音频块的信号强度进行反变换,得到所述当前音频块的重建值。
5、第二方面,本技术提供一种音频编码方法,包括:
6、对待编码的目标音频数据进行块划分,得到m个音频块,所述m为大于1的正整数,所述音频块包括2个或2个以上的音频帧;
7、对于所述m个音频块中的当前音频块,对所述当前音频块的信号强度进行反变换,得到变换后的当前音频块;
8、对所述变换后的当前音频块进行编码,得到码流。
9、第三方面,本技术提供一种音频解码装置,包括:
10、解码单元,用于解码单元,用于解码码流,得到解码网络重建的当前音频块,所述当前音频块为对目标音频数据进行块划分所得到的m个音频块中的一个音频块,所述m为大于1的正整数,所述音频块包括2个或2个以上的音频帧;
11、变换单元,用于对所述重建的当前音频块的信号强度进行反变换,得到所述当前音频块的重建值。
12、在一些实施例中,变换单元,具体用于确定所述当前音频块的信号强度的反变换值;基于所述反变换值,对所述重建的当前音频块的信号强度进行反变换,得到所述当前音频块。
13、在一些实施例中,变换单元,具体基于所述重建的当前音频块,确定所述当前音频块的信号强度的反变换值。
14、在一些实施例中,所述当前音频帧的信号强度包括所述当前音频块的幅值、能量和响度中的至少一个。
15、在一些实施例中,若所述当前音频帧的信号强度包括所述当前音频块的响度,且所述反变换值包括响度反增益值时,则变换单元具体用于解码所述码流,得到所述当前音频块的第一参考响度值,所述第一参考响度值是基于所述当前音频块的原始音频数据计算得到;基于所述重建的当前音频块,确定所述当前音频块的第二参考响度值;基于所述当前音频块的第一参考响度值和所述当前音频块的第二参考响度值,确定所述响度反增益值。
16、在一些实施例中,变换单元,具体用于对于所述当前音频块所包括的每一个音频帧,基于所述音频帧的响度归一化后的重建音频数据,确定所述音频帧的第二参考响度值;基于所述每一个音频帧的第二参考响度值,确定所述当前音频块的第二参考响度值。
17、在一些实施例中,变换单元,具体用于将所述当前音频块的第一参考响度值和所述当前音频块的第二参考响度值作差,得到第一差值;基于所述第一差值和第一预设数值,得到所述响度反增益值。
18、在一些实施例中,变换单元,具体用于将所述第一差值与所述第一预设数值相乘,得到第一乘积;对所述第一乘积进行预设运算,得到所述响度反增益值。
19、在一些实施例中,变换单元,具体用于将所述重建的当前音频块中的每一个元素分别与所述响度反增益值进行相乘,得到所述当前音频块的重建值。
20、在一些实施例中,变换单元,具体用于确定所述当前音频块的长度信息;基于所述当前音频块的长度信息,解码所述当前音频块对应的码流,得到所述响度归一化后的当前音频块。
21、在一些实施例中,变换单元,具体用于解码所述码流,得到所述当前音频帧的长度信息。
22、在一些实施例中,所述m个音频块是基于所述目标音频数据的长度所确定的音频块划分长度,对所述目标音频数据所包括的多个音频帧进行块划分得到。
23、第四方面,本技术提供一种音频编码装置,包括:
24、块划分单元,用于对待编码的目标音频数据进行块划分,得到m个音频块,所述m为大于1的正整数,所述音频块包括2个或2个以上的音频帧;
25、变换单元,用于对于所述m个音频块中的当前音频块,对所述当前音频块的信号强度进行变换,得到变换后的当前音频块;
26、编码单元,用于对所述变换后的当前音频块进行编码,得到码流。
27、在一些实施例中,变换单元,具体用于基于所述当前音频块的原始音频数据,确定所述当前音频块的信号强度的变换值;基于所述变换值,对所述当前音频块的信号强度进行变换,得到所述变换后的当前音频块。
28、在一些实施例中,所述当前音频块的信号强度包括所述当前音频块的幅值、能量和响度中的至少一个。
29、在一些实施例中,若所述当前音频块的信号强度包括所述当前音频块的响度,且所述变换值包括响度增益值时,则变换单元,具体用于基于所述当前音频块的原始音频数据,确定所述当前音频块的第一参考响度值;确定所述当前音频块对应的归一化目标响度值;基于所述归一化目标响度值和所述当前音频块的第一参考响度值,确定所述当前音频块的响度增益值。
30、在一些实施例中,变换单元,具体用于对于所述当前音频块所包括的每一个音频帧,基于所述音频帧的原始音频数据,确定所述音频帧的第一参考响度值;基于所述每一个音频帧的第一参考响度值,确定所述当前音频块的第一参考响度值。
31、在一些实施例中,变换单元,具体用于确定所述目标音频数据的响度值;基于所述目标音频数据的响度值,确定所述当前音频块对应的归一化目标响度值。
32、在一些实施例中,变换单元,具体用于将所述归一化目标响度值和所述当前音频块的第一参考响度值作差,得到第二差值;基于所述第二差值和第二预设数值,得到所述响度增益值。
33、在一些实施例中,变换单元,具体用于将所述第二差值与所述第二预设数值相乘,得到第二乘积;对所述第二乘积进行预设运算,得到所述响度增益值。
34、在一些实施例中,编码单元,还用于将所述当前音频块的第一参考响度值写入所述码流。
35、在一些实施例中,变换单元,具体用于将所述当前音频块的每一个元素的响度值与所述响度增益值进行相乘,得到所述变换后的当前音频块。
36、在一些实施例中,编码单元,还用于将所述当前音频块的长度信息写入所述码流。
37、第五方面,提供了一种电子设备,包括处理器和存储器。所述存储器用于存储计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序,以执行上述第一方面至第二方面中任一方面或其各实现方式中的方法。
38、在一些实施例中,块划分单元,具体用于基于所述目标音频数据的长度,确定的音频块划分长度;基于所述音频块划分长度,对所述目标音频数据所包括的多个音频帧进行块划分,得到所述m个音频块。
39、第六方面,提供了一种芯片,用于实现上述第一方面至第二方面中任一方面或其各实现方式中的方法。具体地,所述芯片包括:处理器,用于从存储器中调用并运行计算机程序,使得安装有所述芯片的设备执行如上述第一方面至第二方面中任一方面或其各实现方式中的方法。
40、第七方面,提供了一种计算机可读存储介质,用于存储计算机程序,所述计算机程序使得计算机执行上述第一方面至第二方面中任一方面或其各实现方式中的方法。
41、第八方面,提供了一种计算机程序产品,包括计算机程序指令,所述计算机程序指令使得计算机执行上述第一方面至第二方面中任一方面或其各实现方式中的方法。
42、第九方面,提供了一种计算机程序,当其在计算机上运行时,使得计算机执行上述第一方面至第二方面中任一方面或其各实现方式中的方法。
43、综上,本技术通过解码码流,得到解码网络重建的当前音频块,该当前音频块为对目标音频数据进行块划分所得到的m个音频块中的一个音频块,m为大于1的正整数,音频块包括2个或2个以上的音频帧,接着,对重建的当前音频块的信号强度进行反变换,得到当前音频块的重建值。也就是说,本技术实施例将2个或2个以上的音频帧划分为一个音频块,进而以音频块为单位进行信号强度进行变换处理,这样可以实现对音频信号强度的平滑处理,例如实现响度、幅值、能量等的平滑变换,进而提升音频数据的解码效果。