本公开涉及一种音频编码/解码设备和方法,并且更具体地,涉及一种与对过渡部分中的编码失真具有鲁棒性的音频编码/解码技术有关的设备和方法。
背景技术:
1、音频编码过程中过渡部分的出现可能导致编码效率的降低和音质失真。例如,在同时演奏钢琴和吉他的情况下对两个乐器的声音过渡或重叠的部分进行编码需要应用各种编码方案并且消耗大量比特。
2、当发生过渡部分时,传统的音频编码方法通过改变要解析的单位帧的长度或应用时间噪声整形技术来部分地抑制过渡部分,然而,这仍然需要高比特消耗并导致音质失真。
3、因此,需要一种最小化由过渡部分的出现引起的编码效率的降低和声音质量的损失的方法。
技术实现思路
1、技术目标
2、本公开提供了一种设备和方法,用于通过在相同框架中操作执行编码来提高编码效率并最小化声音质量的损失,而即使当发生过渡部分时也没有异常处理。
3、技术方案
4、根据一方面,提供了一种音频编码方法,包括:通过对输入信号进行时间到频率(t/f)变换来输出频域信号,输出通过对频域信号应用频域噪声整形(fdns)编码而从频域信号中去除了频率轴包络的频域残差信号,输出通过基于频域残差信号执行线性预测系数lpc解析去除了时间轴包络的时域残差信号,以及量化并发送时域残差信号。
5、输出频域残差信号可以包括从输入信号获得lpc信息,从lpc信息获得频率轴包络信息,以及通过从频域信号中去除频率轴包络信息来生成频域残差信号。
6、输出频域残差信号还可以包括将lpc信息变换为频域中的lpc频率信息,并且获得包络信息可以包括获得lpc频率信息的绝对值作为包络信息。
7、输出时域残差信号可以包括:从频域残差信号获得lpc,以及输出时域残差信号,在所述时域残差信号中,通过使用lpc对频域残差信号进行lpc解析去除了频率轴包络信息和时间轴包络信息。
8、根据一方面,提供了一种音频解码方法,包括:通过对接收信号进行反量化来输出时域残差信号,通过对时域残差信号进行lpc解析来输出频域残差信号,通过对频域残差信号执行fdns解码来输出频域信号,通过对频域信号进行频率到时间(f/t)变换来输出时域信号,以及通过对时域信号执行时域混叠消除(tdac)来恢复输入信号。
9、接收信号可以包括从输入到音频编码设备的输入信号提取的lpc信息、从输入信号的频域残差信号获得的lpc以及输入信号的时域残差信号在量化之后被变换成的比特流中的至少一个,并且输出时域残差信号可以包括通过对比特流进行反量化来恢复时域残差信号。
10、输出频域残差信号可以包括输出频域残差信号,在所述频域残差信号中,通过使用包括在接收信号中的lpc对时域残差信号进行lpc合成恢复了时间轴包络信息。
11、输出频域信号可以包括从包括在接收信号中的lpc频率信息获得频率轴包络信息,并且通过在频域残差信号中恢复频率轴包络信息来输出频域信号。
12、根据一方面,提供了一种音频编码方法,包括:通过对输入信号进行t/f变换来输出频域信号,通过对频域信号应用fdns编码来输出从频域信号中去除了频率轴包络的频域残差信号,通过对频域残差信号进行f/t变换来输出时域信号,对时域信号应用tdac,输出通过对应用了tdac的时域信号进行时间噪声整形(tns)-2编码而去除了时间轴包络的时域残差信号,并且量化并发送时域残差信号。
13、输出时域残差信号可以包括:通过希尔伯特变换将应用了tdac的时域信号变换为解析形式,通过对解析形式执行离散傅里叶变换(dft)来获得复合lpc,通过对复合lpc应用逆离散傅里叶变换(idft)和绝对值(abs)运算来获得时间轴包络信息,以及通过从应用了tdac的时域信号中去除时间轴包络信息来获得时域残差信号。
14、输出时域残差信号可以包括:通过希尔伯特变换将应用了tdac的时域信号变换为解析形式,通过对解析形式执行dft来获得复合lpc,通过对被应用了tdac的时域信号执行dft来输出第二频域残差信号,通过使用复合lpc对第二频域残差信号进行lpc解析来去除时间轴包络信息,以及通过对去除了时间轴包络信息的第二频域残差信号应用idft来获得时域残差信号。
15、根据一方面,提供了一种音频解码方法,包括:通过对接收信号进行反量化来输出时域残差信号,通过对时域残差信号进行tns-2解码来输出时域信号,通过对时域信号进行t/f变换来输出频域残差信号,通过对频域残差信号执行fdns解码来输出频域信号,通过对频域信号进行f/t变换来输出第二时域信号,以及通过对第二时域信号执行tdac来恢复输入信号。
16、接收信号可以包括从输入到音频编码设备的输入信号中提取的lpc信息、从输入信号的时域信号获得的复合lpc以及输入信号的时域残差信号在量化之后被变换成的比特流中的至少一个,并且时域残差信号的输出可以包括通过对比特流进行反量化来恢复时域残差信号。
17、输出时域信号可以包括:通过对复合lpc应用idft和abs运算来获得时间轴包络信息,并且通过在时域残差信号中恢复时间轴包络信息来输出时域信号。
18、输出时域信号可以包括:通过对时域残差信号执行dft来输出第二频域残差信号,通过使用复合lpc对第二频域残差信号进行lpc解析来恢复时间轴包络信息,以及通过对恢复了时间轴包络信息的第二频域残差信号应用idft来获得时域信号。
19、根据一方面,提供了一种音频编码方法,包括:输出通过对输入信号进行lpc解析去除了频率轴包络的时域信号,输出通过对时域信号进行tns-2编码去除了时间轴包络的时域残差信号,以及量化和发送时域残差信号。
20、时域残差信号的输出可以包括:通过希尔伯特变换将时域信号变换为解析形式,通过对解析形式执行dft来获得复合lpc,通过对复合lpc应用idft和abs运算来获得时间轴包络信息,以及通过从时域信号中去除时间轴包络信息来获得时域残差信号。
21、根据一方面,提供了一种音频解码方法,包括:通过对接收信号进行反量化来输出时域残差信号;通过对时域残差信号进行tns-2解码来输出时域信号;以及通过将时域信号与从音频编码设备接收的lpc信息进行合成来恢复输入信号。
22、接收信号可以包括从输入到音频编码设备的输入信号中提取的lpc信息、从输入信号的时域信号获得的复合lpc以及输入信号的时域残差信号在量化之后被变换成的比特流中的至少一个,并且输出时域残差信号可以包括通过对比特流进行反量化来恢复时域残差信号。
23、输出时域信号可以包括:通过对复合lpc应用idft和abs运算来获得时间轴包络信息,并且通过在时域残差信号中恢复时间轴包络信息来输出时域信号。
24、效果
25、根据本公开的示例实施例,可通过应用时间噪声整形(tns)技术来提高编码效率,该技术平滑通过应用频域噪声整形(fdns)编码输出的频域残差信号中的时间轴信息。
26、另外,根据本公开的示例实施例,可通过将去除了频率包络的频域残差信号变换为时域信号然后通过tns-2编码去除时间轴包络来提高编码效率。
27、此外,可以通过执行线性预测系数(lpc)解析来去除频率包络,将去除了频率包络的频域残差信号变换为时域信号,然后通过tns-2编码去除时间轴包络,从而提高编码效率。