以少量计算恢复高频分量的音频解码方法和装置的制作方法

文档序号:2822089阅读:211来源:国知局
专利名称:以少量计算恢复高频分量的音频解码方法和装置的制作方法
技术领域
本发明涉及一种方法和装置,它在音频后段处理中减少计算量,更特别地,涉及一种方法和装置,在把立体声模式分成两种模式之后,它使用在解码器中被检测到的立体声模式信息通过选择一种依赖于环境的模式恢复在MPEG-1层3音频中的高频分量第一种模式,其中唯一的一个通道的高频分量被恢复,并且当两个通道信号之间的差值小时,已恢复高频分量被用于恢复另一个通道的高频分量,和第二种模式,其中在每两帧中的唯一的一个中的高频分量在左通道和右通道中被交替地恢复,并且当两个通道信号之间的差值大时,每一个已跳过帧的高频分量基于前一个帧和后一个帧的高频分量被内插。
背景技术
在一种MPEG-1层3音频编码方法中,为了更有效地压缩数据,使用一种音质模型,其中较少比特被分配给人听不见的高频分量。在这种情况下,即使压缩比得到改善,高频分量也会损失。由于高频分量的损失,音调变化和声音的清晰度降低,以致输出被抑制的或者输出单调的声音。因此,为了再现原声的音调并且改善清晰度,需要一种用于恢复损失的高频分量的后处理声音质量改善方法。
然而,不管它们的高音质,传统的后处理声音质量改善方法需要过大的计算量来执行后处理方法。一种次频带复制(SBR)方法,它是一种广泛已知的后段处理声音质量改善方法,此方法在MPEG-1层3解码器中被执行,要求大约双倍的计算量。
在韩国专利公告号No.2000-75936中公开了一种后处理方法,通过此后处理方法,提供一种在一个时间域中被解码的声音信号,以便达到来自具有非高频分量和噪声组合的频谱的高频分辨率。
对于高频分辨率,此方法包括把一个时间域信号转换,也就是快速傅里叶变换(FFT)解码为一个频率域信号;分析能量分布,以便检测在频率域信号中的干扰频率分量;检测抑制干扰频率分量的数量;控制后置滤波;并且把通过后置滤波转换的数据反向转换。
然而,当声音和音频信号被解码时,此方法是用于在声音解码器中执行的后处理,以便改善被解码声音的感知质量。虽然改善高频分量的分辨率的目的相似,但是步骤不同于本发明,因为传统的后处理方法包括分析频谱、和使用分辨率滤波高频。另外,在现有技术方法中不能够达到减少在执行后处理方法中的计算量的作用。

发明内容
为了解决上述问题,本发明的一个目的是提供一种新的音频解码方法和装置,其中使用在MPEG-1层3音频中的表示在左通道信号和右通道信号之间相似度的模式信息,以便减少在现有技术后处理方法中必须的过多的计算量,在把立体声模式分成两个模式之后,通过选择一种依赖于环境的模式恢复高频分量第一种模式,其中唯一的一个通道的高频分量被恢复,并且当两个通道信号之间的差值小时,已恢复高频分量被用于恢复另一个通道的高频分量,和第二种模式,其中在每两帧中的唯一的一个中的高频分量在左通道和右通道中被交替地恢复,并且当两个通道信号之间的差值大时,基于前一个帧和后一个帧的高频分量内插每一个已跳过帧的高频分量。
根据本发明的一个方面,提供一种高频分量产生方法,通过此方法在解码音频数据中产生高频分量,此方法包括通过使用模式信息产生一个高频分量,此模式信息包括关于第一通道信号和第二通道信号之间相关性的信息。
根据本发明的另一个方面,提供一种恢复高频分量的音频解码方法,包括(a)接收编码音频数据、解码数据、产生第一通道音频信号和第二通道音频信号、并且输出音频信号;(b)从音频数据信号中获得模式信息,此模式信息存储关于第一个通道信号和第二通道信号之间关系的信息;(c)如果所获得模式信息是表示第一个通道信号和第二通道信号之间相关性很大的联合立体声模式值,那么选择第一通道和第二通道中的唯一一个,并且恢复所选择通道的高频分量,并且通过所选择通道的所产生高频分量的预定修改,恢复另一个通道的高频分量;和(d)合成所选择通道的已产生高频分量和所选择通道的已解码音频信号,并且经过所选择通道输出已合成信号,以及合成另一个通道的已产生高频分量和此通道的已解码音频信号,并且经过此通道输出已合成信号。
根据本发明的另一个方面,提供一种恢复高频分量的音频解码装置,包括一个音频解码器,它接收编码音频数据、解码数据、产生音频信号、并且输出信号;模式信息分析单元,它分析已接收编码音频数据并且发现模式信息值;高频分量产生单元,它根据模式信息值恢复每一个信道的高频分量;和音频合成单元,它合成已解码音频信号和已经产生的高频分量,并且输出已合成信号。


通过结合其中的附图详细描述一个最佳实施方案,本发明的上述发明目的和优点就会变得更加清楚,其中图1是后处理在MPEG-1层3解码器中被解码的脉冲编码调制(PCM)信号的装置图;图2是本发明后处理装置的示图;图3是表示MPEG-1层3音频流格式的示图;图4是表示在本发明后处理方法中执行的步骤的流程图;图5是表示一种恢复右通道高频分量方法的示图;和图6是表示当两个通道信号之间的差值很大时,一种恢复高频分量的方法的示图。
具体实施例方式
参见图1,如果输入按照MPEG-1层3格式被编码的音频数据(测试mp3),那么MPEG-1层3解码器110把数据分成左通道分量和右通道分量,并且产生各自的脉冲编码调制(PCM)信号(测试pcm)。如果如此所产生的脉冲编码调制数据被输入到高频分量恢复单元120,那么高频分量恢复单元120分别恢复左通道和右通路的高频分量,并且输出恢复脉冲编码调制音频数据(测试app.pcm)。
因此,在现有技术后处理方法中,高频域是通过分别后处理经过MPEG-1层3解码器输出的左通道信号和右通道信号来恢复的。
然而,在大部分的音频信号中,在左通道信号和右通道信号之间具有高度的冗余。因此,甚至在MPEG-1层3编码算法中,左通道信号和右通道信号在联合立体声模式下不会独立地被编码。
所以,由于左通道信号和右通道彼此相似,并且分享冗余信息,分别对左通道信号右通道信号进行后处理会引起不必要的计算。
图2是本发明后处理装置的示图。
MP3解码器210接收和解码MPEG-1层3音频信号,产生脉码调制信号,并且输出信号。MP3音频信号包含模式信息。模式信息分析单元220分析在接收的MP3音频信号中的模式信息,并且把数值传送到高频分量产生单元230。
高频分量产生单元230根据模式信息值为每一个信道产生高频分量。依靠模式信息是具有表示在左通道信号和右通道信号之间存在高相似度的联合立体声模式值,还是具有表示在两个通道信号之间存在低相似度的立体声模式值,高频分量产生单元230使用不同的方法产生高频分量。高频率分量产生过程与现有技术中的高频分量产生过程相同。
如果模式值是联合立体声模式(MODE1),那么表示左通道信号和右通道信号相似。因此,产生只有一个通道的高频分量,并且利用如此产生的通道高频分量,产生另一个通道的高频分量。例如,从左通道信号被恢复的高频分量与关于在两个通道之间的相似度的校正值相乘,并且结果被用作右通道信号的高频分量。因为在两个信号之间存在高相似度,所以此方法不会引起音质下降。
如果模式值是立体声模式(MODE2),那么表示在左通道信号和右通道信号之间的差值是很大的。因此,在两个通道之间不存在关系,并且两个通道中的每一个的高频分量是分别产生的。在这种情况下,在每两帧的仅有一个中的高频分量在左通道和右通道中被交替地恢复,并且每一个已跳过的帧的高频分量是通过基于分别在左通道和右通道中的前一帧和后一帧的高频分量的内插法来恢复的。随后将参见图5解释MODE2。
音频合成单元240合成已恢复高频分量和已解码PCM信号,并且输出已合成信号。
图3是表示MPEG-1层3音频流格式的示图。
MPEG-1层3音频流是由音频存取单元(AAUs)300形成的。AAU 300是一个最小单元,它能够单独地被解码,并且总是包含压缩数据采样的预定编号。AAU 300包括首标310、误差校验字段(循环冗余校验,CRC)320、音频数据字段330和辅助数据字段340。
首标310包含同步字、ID信息、保护比特存在信息、比特率索引信息、采样频率信息、填充比特存在信息、单个目的比特、模式信息、模式扩充信息、版权信息、表示原始或副本数据的信息、和强调信息。
CRC字段320是可选择的。此字段的存在在首标310中被定义。此字段的长度是16比特。
音频数据区330是由被压缩音频数据组成的。
当音频数据未到达一个AAU的末端时,辅助数据是保留在音频数据末端的数据。辅助数据字段340可以由除了MPEG音频数据以外的任意数据组成。
在本发明的后处理中,在这些信息项之间的模式信息和关于在左通道信号和右通道信号之间的差值的信息被用来确定通道之间的相关性,并且根据被确定的结果恢复高频分量。
图4是表示在本发明后处理方法中执行的步骤的流程图。
在新的后处理方法中,首先MPEG-1层3音频信号被解码,以便产生PCM信号,并且在步骤410中输出已产生PCM信号。利用此输出,在步骤420中获得模式信息。在步骤430中,确定模式信息是否包含表示在左通道信号和右通道信号之间存在高相似度的联合立体声模式值,还是包含表示在两个通道信号之间存在低相似度的立体声模式值。
如果确定的结果表示模式值是联合立体声模式(MODE1),那么表示左通道信号和右通道信号是相似的。因此,在步骤460中产生只有一个通道的高频分量,并且利用如此被产生的通道高频分量,在步骤470中产生另一个通道的高频分量。例如,在步骤470中,从左通道信号恢复的高频分量无变化地被用作右通道信号的高频分量,或者利用关于左通道信号和右通道信号之间差值的信息,在步骤470中通过将高频分量乘以一些修改值获得右通道信号高频分量。例如修改数值可以是一个常数。因为在两个信号之间的相似度高,所以此方法在声音质量方面引起很小的退化。最终,已恢复高频分量与被解码PCM信号合成,并且在步骤480中输出。
如果确定的结果表示模式值是立体声模式(MODE2),那么表示左通道信号和右通道信号之间的差大。因此,在两个通道之间不存在关系,并且在步骤440中两个通道中的每一个的高频分量被分别地产生。在这种情况下,在每两帧的仅有一个中的高频分量在左通道和右通道中被交替地恢复,并且每一个已跳过帧的高频分量是通过基于分别在左通道和右通道中的前一帧和后一帧的高频分量的内插法来恢复的。最终,已恢复高频分量与被解码PCM信号合成,并且在步骤450中输出。
通常,对于大部分的音频信号,应用联合立体声模式(MODE1)。也就是说,由于左通道信号和右通道信号相似,该方法被应用在许多情况下,以致计算量能够被减半。同时,当由于在具有128kbps或者更高的高传输率的音频信号中两个通道信号之间的差值大而使左通道信号和右通道信号应被分别地编码时,也就是说,当两个信号受到MODE2影响时,音频后处理将被分别地应用到各个通道。然而,甚至在MODE2下,MODE2方法能够被使用,以便能够减少计算量。
新的后处理方法通过利用在MPEG-1层3解码器中被检测到的模式信息,确定模式是否是表示两个通道信号之间的相似性大的联合立体声模式,还是表示两个通道信号之间的差值很大的立体声模式。
因此已恢复的高频分量被增加给左通道信号和右通道信号,并且输出。
图5是表示一种恢复右通道高频分量方法的示图。
首先,产生左通道的高频分量。如果模式信息表示联合立体声模式,那么已产生的左通道高频分量被用于产生右通道高频分量;否则,右通道的高频分量独立于左通道的高频分量而产生。
图6是表示当两个通道信号之间的差值很大时,一种恢复高频分量的方法的示图。也就是说,图6解释在图4中的用于分别地产生左通道和右通道的高频分量的步骤440。在这种情况下,每两帧的仅有一个中的高频分量在左通道和右通道中被交替地恢复,并且每一个已跳过帧的高频分量是基于前一帧和后一帧的高频分量被内插的。也就是说,左通道的高频分量在时间t1帧中被恢复,并且右通道的高频分量在时间t2帧中被恢复。对于时间t3,t4,t5,...,重复地执行相同的方法。
此时,在时间t1帧中的左通道的高频分量和右通道的高频分量被分别认为是Lt1和Rt1,并且同样地,在时间t2帧中的左通道的高频分量和右通道的高频分量被分别认为是Lt2和Rt2。
然后,已跳过帧的高频分量,也就是在时间t2处的左通道的高频分量通过基于在时间t1和时间t3处的左通道高频分量的内插法被恢复。也就是,Lt2=(Lt1+Lt3)/2。同时,在时间t3处的右通道的高频分量通过基于在时间t2和时间t4处的右通道高频分量的内插法被恢复。也就是,Rt3=(Rt2+Rt4)/2。最终,已恢复高频分量与被解码PCM信号合成,然后输出。
本发明可以被具体表现在能够通过计算机读取的计算机可读记录媒体上的代码中。计算机可读记录媒体包括在其上存储计算机可读数据的各种记录装置。
计算机可读记录媒体包括存储介质,例如磁存储介质(比如ROM、软盘、硬盘等)、光学可读媒介(比如CD、ROM、DVD等)和载波(比如在国际互联网络上的传输)。
在上面已经解释并且表示了最佳具体实施例。然而,本发明并不局限于上述优选实施例,并且很明显只要在本发明权利要求所规定的精神和范围之内,技术熟练的人可以进行各种改变。所以,本发明的范围不是由上述描述确定的,而是由所附权利要求确定的。
如上所述,不管声音质量改善作用如何,由于过多的计算量,现有技术的后处理方法很难应用到实际生产中时,在恢复高频分量中,本发明能够使计算量小于使用在现有技术中的计算量的一半。
权利要求
1.一种高频分量恢复方法,通过此方法在解码音频数据中产生高频分量,该方法包括下列步骤使用模式信息恢复高频分量,模式信息包括第一通道信号和第二通道信号之间相关性的信息。
2.根据权利要求1所述方法,其中如果模式信息是表示两个通道之间的差值大的值,那么该方法包括下列步骤(a)交替地在第一通道和第二通道中恢复每两帧中唯一帧的高频分量;和(b)通过基于分别在左通道和右通道中的前一帧和后一帧的高频分量的内插法恢复每一个已跳过帧的高频分量。
3.根据权利要求1所述方法,其中如果模式信息是表示两个通道之间的差值小的值,那么该方法包括下列步骤(a)恢复第一通道的高频分量;和(b)无改变地把第一通道的高频分量用作第二通道的高频分量,或者通过第一通道的高频分量的预定修改恢复第二通道的高频分量。
4.根据权利要求1所述的方法,其中编码音频数据是MPEG-1层3音频数据。
5.一种恢复高频分量的音频解码方法,该方法包括下列步骤(a)接收编码音频数据、解码该数据、产生第一通道音频信号和第二通道音频信号、以及输出音频信号;(b)从音频数据中获得包括关于第一个通道信号和音频数据之间相关性信息的模式信息;(c)如果所获得模式信息是表示第一个通道信号和第二通道信号之间相关性大的联合立体声模式值,那么仅选择第一通道和第二通道中的一个通道,并且恢复所选择通道的高频分量,并且通过所选择通道的已产生高频分量的预定修改,恢复另一个通道的高频分量;和(d)合成所选择通道的已产生高频分量与所选择通道的已解码音频信号,并且经过所选择通道输出已合成信号,以及合成另一个通道的已产生高频分量与另一个通道的已解码音频信号,并且经过另一个通道输出已合成信号。
6.根据权利要求5所述的方法,其中编码音频数据是MPEG-1层3音频数据。
7.根据权利要求5所述的方法,其中对于在步骤(c)中的另一个通道的高频分量,同样使用已产生通道的高频分量。
8.一种恢复高频分量的音频解码装置,包括音频解码器,它接收编码音频数据、解码该数据、产生音频信号、和输出该信号;模式信息分析单元,它分析已接收编码音频数据并且发现模式信息值;高频分量产生单元,它根据模式信息值恢复每一个通道的高频分量;和音频合成单元,它合成已解码音频信号与已经产生的高频分量,并且输出已合成信号。
9.根据权利要求8所述的装置,其中编码音频数据是MPEG-1层3音频数据。
10.根据权利要求8所述的装置,其中如果所发现模式信息值是表示第一个通道信号和第二通道信号之间没有关系的立体声模式值,那么高频分量产生单元通过交替地恢复第一通道和第二通道中的每两帧中的唯一帧的高频分量,并且通道由基于分别在第一通道和第二通道中的前一帧和后一帧中的高频分量的内插法恢复每一个已跳过帧的高频分量,产生第一通道信号和第二通道信号两个的高频分量,并且如果所发现模式信息值是表示两信号之间具有高相似度的联合立体声模式值,那么通过产生唯一的一个通道的高频分量和通过对已产生的高频分量的预定修改,产生另一个通道的高频分量。
11.一种计算机可读媒介,具有包含在上面的用于执行权利要求5的方法的计算机程序。
全文摘要
一种减少在音频后处理中的计算量的方法和装置,尤其提供一种通过使用在MPEG-1层3音频数据中的表示右通道信号和左通道信号之间相似度的模式信息,执行音频后处理的方法和装置。如果两个通道信号之间的差值小,那么使用第一种模式,其中唯一的一个通道的高频分量被恢复,并且已恢复高频分量被用于恢复另一个通道的高频分量,如果两个通道信号之间的差值大,那么选择第二种模式,其中在每两帧中的唯一帧的高频分量在左通道和右通道中被交替地恢复,并且基于前一个帧和后一个帧的高频分量内插每一个已跳过帧的高频分量。如此一来,新的音频解码方法和装置以少量计算恢复高频分量。在恢复高频分量中,此方法把计算量减少到使用在现有技术中的计算量的一半。
文档编号G10H1/12GK1467703SQ0314096
公开日2004年1月14日 申请日期2003年6月2日 优先权日2002年7月11日
发明者吴润学 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1