音频编码装置和方法、音频解码装置和方法以及程序的制作方法

文档序号:2833393阅读:261来源:国知局
专利名称:音频编码装置和方法、音频解码装置和方法以及程序的制作方法
技术领域
本技术涉及音频编码装置和音频编码方法、音频解码装置和音频解码方法以及程序。更具体而言,本技术涉及能够通过自适应地使用更适当的窗函数来对音频信号进行编码的音频编码装置和音频编码方法、音频解码装置和音频解码方法、以及程序。
背景技术
作为音频信号的编码方法,通常,众所周知的是MP3 (运动图像专家组音频层_3)、AAC (高级音频编码)、ATRAC (自适应变换声学编码)等作为转换编码方法。作为用于对音频信号进行编码的音频编码装置,已知将音频信号划分成多个带并接着以带为基础执行正交变换和量化(例如,参考第2906483号日本专利)。图1是示出对音频信号进行编码的音频编码装置的配置的示例的框图。图1所示的音频编码装置10被配置为包括加窗部11、频率转换部12、归一化系数确定部13、归一化系数编码部14、归一化部15、量化部16、编码部17和多路复用部18。音频编码装置10接收PCM (脉冲编码调制)信号的音频信号T,该音频信号是帧数据T[J]并被分段成多个特定段(section),特定段被称为帧。音频编码装置10对帧数据T[J]进行编码。这里,J是从首帧开始按顺序附于每帧的指数。音频编码装置10的加窗部11将输入的帧数据T[J]与窗函数WF相乘,并将所得到的相乘后数据WFT [J]提供给频率转换部12。频率转换部12对从加窗部12提供的相乘后数据WFT [J]执行频率转换,以获得频谱SP [J]。频率转换部12将频谱SP [J]提供给归一化系数确定部13和归一化部15。归一化系数确定部13基于从频率转换部12提供的频谱SP[J]来确定表示频谱SP[J]的轮廓(本文中,称为包络)的归一化系数SF[J],并将该归一化系数SF[J]提供给归一化系数编码部14和归一化部15。归一化系数编码部14计算对从归一化系数确定部13提供的归一化系数SF[J]进行编码所需的位数NSF[J],并且将该位数NSF[J]提供给量化部16。此外,归一化系数编码部14对归一化系数SF[J]执行编码,并且将所得到的编码后归一化系数HSF[J]提供给多路复用部18。归一化部15通过使用从归一化系数确定部13提供的归一化系数SF[J]来对从频率转换部12提供的频谱SP[J]进行归一化,并将所得到的归一化谱NSP[J]提供给量化部16。量化部15基于表示作为量化精度的量化位数的量化信息P[J]来对从归一化部15提供的归一化谱NSP [J]进行量化,并且将所得到的量化谱QSP [J]提供给编码部17。此时,量化部16获得从编码部17反馈的、对应于量化谱QSP [J]的位数NQSP [J],并且调整量化信息P[J],使得位数NQSP[J]变为预定值。量化部16将调整后的量化信息P[J]提供给多路复用部18。编码部17计算对从量化部16提供的量化谱QSP[J]进行编码所需的位数NQSP[J]。这里,当下文将描述的码串B[J]的位数NB[J]是预定的时,位数NQSP[J]必须是值NQ或更小,其中位数NB[J]减去与量化信息P[J]的位数NP[J]和归一化系数SF[J]的编码相关的位数NSF [J]。因此,编码部17将位数NQSP [J]反馈至量化部16,并且量化部16调整量化信息P[J],使得位数NQSP[J]为值NQ或更小。此外,编码部17对量化谱QSP[J]进行编码,并将所得到的编码频谱HSP[J]提供给多路复用部18。多路复用部18将来自归一化系数编码部14的编码后归一化系数HSF[J]、来自量化部16的量化信息P[J]和来自编码部17的编码频谱HSP[J]相乘,并且传送所得到的码串 B[J]。图2是示出用于对从图1所示的音频编码装置10传送的码串B[J]进行解码的音·频解码装置的配置的示例的框图。图2所示的音频解码装置30被配置为包括分解部31、解码部32、逆量化部33、归一化系数解码部34、逆归一化部35、逆频率转换部36、加窗部37和重叠部38。音频解码装置30中的分解部31将从图1所示的音频编码装置10传送的码串B [J]分解成编码频谱HSP [J]、量化信息P [J]和编码后归一化系数HSF [J]。分解部31将编码频谱HSP[J]提供给解码部32,将量化信息P [J]提供给逆量化部33,并且将编码后归一化系数HSF[J]提供给归一化系数解码部34。解码部32对从分解部31提供的编码频谱HSP [J]进行解码,并且将所得到的量化谱QSP[J]提供给逆量化部33。逆量化部33基于从解码部31提供的量化信息P [J]来对从解码部32提供的量化谱QSP [J]执行逆量化,以获得归一化谱NSP [J]。逆量化部33将归一化谱NSP [J]提供给逆归一化部35。归一化系数解码部34对从分解部31提供的编码后归一化系数HSF[J]进行解码,并将所得到的归一化系数SF[J]提供给逆归一化部35。逆归一化部35通过使用归一化谱NSP [J]和从归一化系数解码部34提供的归一化系数SF[J]来执行逆归一化,并将所得到的频谱SP [J]提供给逆频率转换部36。逆频率转换部36对从逆归一化部35提供的频谱SP[J]执行逆频率转换,并将所得到的时轴数据ST[J]提供给加窗部37。加窗部37将从逆频率转换部36提供的时轴数据ST[J]与窗函数WB相乘。图1所示的加窗部11中的窗函数WF与窗函数WB之间的关系具有如下的约束条件。S卩,当量化位数是无限大的(量化精度是无限大的)时,以下将描述的输入到音频编码装置10的帧数据T[J]和从音频解码装置30输出的帧数据T[J]彼此一致。加窗部37将作为乘法结果所获得的相乘后数据WBT [J]提供给重叠部38。重叠部38保存从加窗部37提供的相乘后数据WBT [J]。此外,重叠部38将所保存的指数为J-1的帧的相乘后数据WBT [J-1]与相乘后数据WBT [J]在彼此重叠例如一帧的一半的情况下相加。重叠部38将所得到的帧数据T[J]输出作为解码结果。应注意,为了简化描述,作为解码结果的帧数据以T[J]表示,其与编码前的帧数据相同。然而,实际上,解码结果和编码前的帧数据不是相同的。在图1所示的音频编码装置10中,当对归一化系数SF[J]的编码所需的位数NSF[J]相对于码串B[J]的位数NB[J]之比越大时,可用于频谱SP[J]的编码的位数NQSP[J]越小。结果,频谱SP[J]的量化精度可能减小,从而导致音质劣化。
因此,通过减少编码频谱SP[J]的数量,可以在不使频谱SP[J]的量化精度劣化的情况下减少位数NQSP [J],从而防止音质劣化。当减少编码频谱SP[J]的数量时,一般,主要减小了高通频谱SP[J]。在这种情况下,作为解码结果的声音会导致产生不具有高通成分的声音,即,所谓的像是从箱子里面发出的声音。此外,众所周知的是,当以帧为基础编码的频谱SP[J]的数量改变时,这种改变可能导致音质劣化。另一方面,公知的是,即使在相同的帧数据T[J]输入到音频编码装置10时,与归一化系数SF[J]的编码和量化误差相关的位数NSF[J]根据窗函数WF的配置而改变。

发明内容
因此,期望通过使用更适当的窗函数对音频信号进行编码来减少位数NSF[J]以及/或者提闻量化精度,从而减少首质劣化。鉴于上述情况而提出了本技术。本技术能够使用更适当的窗函数来自适应地对音频信号进行编码。根据本技术的第一实施例,提供了一种音频编码装置,包括第一加窗部,将音频信号与第一窗函数相乘;第二加窗部,将音频信号与第二窗函数相乘,第二窗函数的特征不同于第一窗函数的特征;窗选择部,基于经第一加窗部相乘后的音频信号和经第二加窗部相乘后的音频信号,选择第一窗函数或第二窗函数作为最佳窗函数;编码部,对与最佳窗函数相乘后的音频信号的频谱进行编码;以及传送部,传送经编码部编码后的频谱和表示最佳窗函数的窗函数信息。本技术的第一实施例的音频编码方法和程序对应于本技术的第一实施例的音频编码装置。在本技术的第一实施例中,将音频信号与第一窗函数相乘,将音频信号与特征与第一窗函数的特征不同的第二窗函数相乘,基于与第一窗函数相乘后的音频信号和与第二窗函数相乘后的音频信号来选择第一窗函数或第二窗函数作为最佳窗函数,对与最佳窗函数相乘后的音频信号的频谱进行编码,并且传送编码后的频谱和表示最佳窗函数的窗函数信息。根据本技术的第二实施例,提供了一种音频解码装置,包括接收部,接收编码频谱和表示作为最佳窗函数的第一窗函数或第二窗函数的窗函数信息,其中,编码频谱作为对与作为最佳窗函数的第一窗函数或第二窗函数相乘后的音频信号的频谱进行编码的结果而获得的,第二窗函数的特征不同于第一窗函数的特征;解码部,对接收部接收到的编码频谱进行解码;窗选择部,基于接收部接收到的窗函数信息来从第一窗函数和第二窗函数中选择最佳窗函数;以及加窗部,基于窗选择部选择的最佳窗函数,根据作为解码部执行解码的结果而获得的频谱的音频信号生成音频信号。本技术的第二实施例的音频解码方法和程序对应于本技术的第二实施例的音频解码装置。在本技术的第二实施例中,接收编码频谱和表示作为最佳窗函数的第一窗函数或第二窗函数的窗函数信息,其中,编码频谱作为与作为最佳窗函数的第一窗函数或第二窗函数相乘后的音频信号的频谱的编码结果而获得的,第一窗函数的特征不同于第一窗函数的特征;对所接收到的编码频谱进行解码;基于所接收到的窗函数信息来从第一窗函数和第二窗函数中选择最佳窗函数;基于所选择的最佳窗函数,根据作为解码结果而获得的频谱的音频信号生成音频信号。根据本技术的第一实施例,可以通过自适应地使用更适当的窗函数来对音频信号进行编码。根据本技术的第二实施例,可以通过自适应地使用更适当的窗函数来对编码后的音频信号进行解码。


图1是示出对音频信号进行编码的音频编码装置的配置的示例的框图;图2是示出已知的音频解码装置的配置的示例的框图;图3是示出应用了本技术的音频编码装置的第一实施例的配置示例的框图;图4示出窗函数WFl的示例;图5示出窗函数WF2的示例;图6示出频谱SPl [J]的示例;图7示出频谱SP2 [J]的示例;图8是说明图3所示的音频编码装置进行的编码处理的流程图;图9是示出与图3所示的音频编码装置对应的音频解码装置的配置示例的框图;图10是说明图9所示的音频解码装置的解码处理的流程图;图11是示出应用了本技术的音频编码装置的第二实施例的配置示例的框图;图12是说明图11所示的音频编码装置进行的编码处理的流程图;以及图13示出计算机的实施例的配置示例。
具体实施例方式下文中,将参照附图详细描述本公开的优选实施例。应注意,在本说明书和附图中,具有基本上相同的功能和结构的结构元件以相同的附图标记表示,并且省略了对这些结构元件的重复说明。<第一实施例>[音频编码装置的第一实施例的配置示例]图3是示出应用了本技术的音频编码装置的第一实施例的配置示例的框图。在图3所示的配置中,与图1所示的元件相同的元件被赋予了相同的标记。将适当地省略重复描述。图3所示的音频编码装置50的配置与图1所示的配置的不同之处在于,设置了加窗部51和55、频率转换部52和56、归一化系数确定部53和57、归一化系数编码部54和58以及多路复用部61来替代图1所示的配置中的加窗部11、频率转换部12、归一化系数确定部13、归一化系数编码部14和多路复用部18,并且不同之处还在于对其新设置了窗选择部59和频谱选择部60。音频编码装置50将帧数据T [J]与各自具有彼此不同特征的窗函数WFl和窗函数WF2相乘。而且,音频编码装置50基于对频谱的归一化系数进行编码所需的位数,选择获得归一化系数的最佳编码效率的窗函数作为最佳窗函数,其中,该频谱是通过对所得到的相乘后数据执行频率转换而获得的。具体而言,在音频编码装置50中,包括加窗部51、频率转换部52、归一化系数确定部53和归一化系数编码部54的路径I用于获得与窗函数WFl相乘的帧数据T[J]的频谱SPl [J]以及编码后归一化系数HSFl [J]。更具体而言,加窗部51将输入的帧数据T [J]与窗函数WFl相乘,并且将所得到的相乘后数据WFTl [J]提供给频率转换部52。频率转换部52对从加窗部51提供的相乘后数据WFTl [J]执行频率转换,以获得频谱SPl [J]。频率转换部52将频谱SPl [J]提供给归一化系数确定部53和频谱选择部60。归一化系数确定部53根据从频率转换部52提供的频谱SPl [J]确定频谱SPl [J]的归一化系数SFl [J],并且将其提供给归一化系数编码部54。归一化系数编码部54计算对从归一化系数确定部53提供的归一化系数SFl [J]的编码所需的位数NSFl [J],并且将其提供给窗选择部59。此外,归一化系数编码部54对归一化系数SFl [J]进行编码,并且将所得到的编码后归一化系数HSFl [J]和归一化系数SFl [J]提供给窗选择部59。包括加窗部55、频率转换部56、归一化系数确定部57和归一化系数编码部58的路径2被配置为与路径I相同以获得与窗函数WF2相乘的帧数据T[J]的频谱SP2[J]以及编码后归一化系数HSF2[J]。具体而言,加窗部55将输入的帧数据T [J]与窗函数WF2相乘,并将所得到的相乘后数据WFT2[J]提供给频率转换部56。频率转换部56对从加窗部55提供的相乘后数据WFT2 [J]执行频率转换以获得频谱SP2 [J]。频率转换部56将频谱SP2 [J]提供给归一化系数确定部57和频谱选择部60。归一化系数确定部57根据从频率转换部56提供的频谱SP2 [J]确定频谱SP2 [J]的归一化系数SF2[J],并将其提供给归一化系数编码部58。归一化系数编码部58计算对从归一化系数确定部57提供的归一化系数SF2[J]的编码所需的位数NSF2 [J],并将其提供给窗选择部59。此外,归一化系数编码部58对归一化系数SF2[J]进行编码,并将所得到的编码后归一化系数HSF2[J]和归一化系数SF2[J]提供给窗选择部59。窗选择部59将从归一化系数编码部54提供的位数NSFl [J]与从归一化系数编码部58提供的位数NSF2[J]进行比较,并选择与较小的位数对应的窗函数作为最佳窗函数。当位数NSF1[J]和位数NSF2[J]彼此相同时,窗选择部59选择窗函数WFl和窗函数WF2中的任一个。当选择了窗函数WFl时,窗选择部59将从归一化系数编码部54提供的编码后归一化系数HSFl [J]确定为编码后归一化系数HSF[J],将归一化系数SFl [J]确定为归一化系数SF [J],并将位数NSFl [J]确定为位数NSF [J]。窗选择部59生成表示被选择作为最佳窗函数的窗函数WFl的窗函数信息SW[J],并将其提供给频谱选择部60。另一方面,当选择了窗函数WF2时,窗选择部59将从归一化系数编码部58提供的编码后归一化系数HSF2[J]确定为编码后归一化系数HSF[J],将归一化系数SF2[J]确定为归一化系数SF [J],并将位数NSF2[J]确定为位数NSF [J]。此外,窗选择部59生成表示被选择作为最佳窗函数的窗函数WF2的窗函数信息SW[J],并将其提供给频谱选择部60。这里,假设表示窗函数WFl的窗函数信息SW[J]为0,并且表示窗函数WF2的窗函数信息SW[J]为I。窗选择部59将编码后归一化系数HSF[J]提供给多路复用部61,将归一化系数SF[J]提供给归一化部15,并将位数NSF[J]提供给量化部16。频谱选择部60基于从窗选择部59提供的窗函数信息SW[J],选择从频率转换部52提供的频谱SPl [J]或从频率转换部56提供的频谱SP2 [J]。频谱选择部60将所选的频谱SPl [J]或频谱SP2 [J]作为频谱SP [J]提供给归一化部15。此外,频谱选择部60将窗函数信息SW [J]提供给乘法部61。多路复用部61对来自窗选择部59的编码后归一化系数HSF[J]、来自频谱选择部60的窗函数信息SW[J]、来自量化部16的量化信息P[J]和来自编码部17的编码频谱HSP[J]进行多路复用。多路复用部61起到传送部的作用,以控制对作为乘法结果而获得的码串B[J]的传送并传送码串B[J]。[窗函数WFl的示例]图4示出窗函数WFl的示例。图4A表示样本数为N的窗函数WFl ;图4B表示样本数为N的窗函数WFl的频率特征。在图4A中,横轴表示对于每个样本的指数,以及纵轴表示窗函数WFl的幅度。在图4B中,横轴表示具有中心频率0的频率,其范围基于弧度为从-Ji到+ JI。纵轴表示频率特征的水平[dB]。如图4A所示的窗函数WFl的频率特征具有如图4B所示的、中心频率的水平尖锐地突出的特征。因此,窗函数WFl是具有较高频率分辨率的窗函数。[窗函数WF2的示例]图5示出窗函数WF2的示例。图5A表示样本数为N的窗函数WF2 ;图5B表示样本数为N的窗函数WF2的频率特征。在图5A中,横轴表示对于每个样本的指数,以及纵轴表示窗函数WF2的幅度。在图5B中,横轴表示具有中心频率0的频率,其范围基于弧度为从-Ji到+ JI。纵轴表示频率特征的水平[dB]。如图5A所示的窗函数WF2的频率特征具有如图5B所示的、与图4相比而言中心频率的水平没有尖锐地突出的特征。因此,窗函数WF2是具有较低频率分辨率的窗函数。[频谱的示例]图6示出频谱SPl [J]的示例。图7示出频谱SP2[J]的示例。在图6和图7中,横轴表示频率指数,以及纵轴表示频谱的水平。此外,在图6和图7中,每个黑色圆圈各表示每个频率指数的频谱的水平,以及虚线表示归一化系数。在图6和图7的示例中,为了简化描述的目的,针对频率指数的每个频谱确定归一化系数。然而,一般,针对几个频谱确定一个归一化系数。由于窗函数WFl是具有较高频率分辨率的窗函数,因此,当帧数据T[J]是具有较高音调的音频信号(在图6的示例中,具有频率Fn的正弦信号)时,频谱SPl [J]的能量收敛于如图6所示的频率指数Fn的频谱。即,在频谱SP1[J]的包络中,频率指数Fn的频谱尖锐地突出。因此,在表示频谱SPl [J]的包络的归一化系数SFl [J]中,频率指数Fn的归一化系数SFl [J]很大程度地突出。另一方面,由于窗函数WF2是具有较低频率分辨率的窗函数,因此,频谱SP2[J]整体分散,如图7所示。即,与频谱SP1[J]的包络相比,在频谱SP2[J]的包络中,频谱指数Fn的频谱的突出部分没有尖锐地突出。因此,与归一化系数SFl [J]比较,在频率指数Fn的归一化系数SF2[J]中,表示频谱SP2[J]的包络的归一化系数SF2[J]不是如此大。由于频谱的包络根据如上所述的窗函数的特征改变,所以归一化系数的包络也改变。因此,当归一化系数的编码方法相同时,可以通过改变窗函数的特征来改变对归一化系数进行编码所需的位数。例如,在图6和图7中,与归一化系数SF2[J]相比,在归一化系数SF1[J]中,邻间差(interproximal difference)较大。因此,当归一化系数编码部54和58对邻间差执行编码时,位数NSF2[J]相比于归一化系数SF2[J]变得较小的可能性高。因此,音频编码装置50通过使用彼此具有不同特征的两个不同的窗函数WFl和WF2来生成频谱,并选择对频谱的归一化系数进行编码所需的位数较小的窗函数作为最佳窗函数。于是,可能增加为了对频谱的编码而分配的位数。结果,能够减少音质劣化。[音频编码装置的处理的描述]图8是说明图3所示的音频编码装置50的编码处理的流程图。例如,当帧数据T[J]被输入作为编码对象时,编码处理开始。参照图8,在步骤Sll中,加窗部51将输入的帧数据T[J]与窗函数WFl相乘,并将所得到的相乘后数据WFTl [J]提供给频率转换部52。加窗部55还将输入的帧数据T[J]与窗函数WF2相乘,并将所得到的相乘后数据WFT2 [J]提供给频率转换部56。在步骤S12中,频率转换部52对从加窗部51提供的相乘后数据WFT1[J]执行频率转换,以获得频谱SPl [J]。频率转换部52将频谱SPl [J]提供给归一化系数确定部53和频谱选择部60。频率转换部56还对从加窗部55提供的相乘后数据WFT2[J]执行频率转换,以获得频谱SP2 [J]。频率转换部56将频谱SP2 [J]提供给归一化系数确定部57和频谱选择部60。在步骤S13中,归一化系数确定部53根据从频率转换部52提供的频谱SPl [J]确定频谱SPl [J]的归一化系数SFl [J],并将其提供给归一化系数编码部54。归一化系数确定部57还根据从频率转换部56提供的频谱SP2 [J]确定频谱SP2 [J]的归一化系数SF2 [J],并将其提供给归一化系数编码部58。在步骤S14中,归一化系数编码部54计算对从归一化系数确定部53提供的归一化系数SFl [J]的编码所需的位数NSFl [J],并将其提供给窗选择部59。归一化系数编码部58还计算对从归一化系数确定部57提供的归一化系数SF2[J]的编码所需的位数NSF2 [J],并将其提供给窗选择部59。在步骤S15中,归一化系数编码部54对归一化系数SFl [J]进行编码,并将所得到的编码后归一化系数HSFl [J]和归一化系数SFl [J]提供给窗选择部59。归一化系数编码部58还对归一化系数SF2[J]进行编码,并将所得到的编码后归一化系数HSF2[J]和归一化系数SF2[J]提供给窗选择部59。在步骤S16中,窗选择部59确定从归一化系数编码部54提供的位数NSFl [J]是否小于从归一化系数编码部58提供的位数NSF2[J]。
当在步骤S16中确定位数NSFl [J]小于位数NSF2[J]时,窗选择部59选择窗函数WFl作为最佳窗函数,并且处理进行到步骤S17。在步骤S17中,窗选择部59生成表示被选择作为最佳窗函数的窗函数WFl的窗函数信息SW [J],并将其提供给频谱选择部60。在步骤S18中,窗选择部59确定从归一化系数编码部54提供的编码后归一化系数HSFl [J]作为编码后归一化系数HSF[J],将归一化系数SFl [J]确定为归一化系数SF [J],并将位数NSFl [J]确定为位数NSF [J]。窗选择部59将编码后归一化系数HSF [J]提供给多路复用部61,将归一化系数SF[J]提供给归一化部15,并将位数NSF[J]提供给量化部16。在步骤S19中,频谱选择部60基于从窗选择部59提供的窗函数信息SW[J]来选择从频率转换部52提供的频谱SPl [J],并将其作为频谱SP[J]提供给归一化部15。此外,频谱选择部60将窗函数信息SW[J]提供给多路复用部61。然后,处理进行到步骤S23。另一方面,当在步骤S16中确定位数NSF1[J]不小于位数NSF2[J]时,窗选择部59选择窗函数WF2作为最佳窗函数,并且处理进行到步骤S20。在步骤S20中,窗选择部59生成表示被选择作为最佳窗函数的窗函数WF2的窗函数信息SW [J],并将其提供给频谱选择部60。在步骤S21中,窗选择部59将从归一化系数编码部58提供的编码后归一化系数HSF2[J]确定为编码后归一化系数HSF[J],将归一化系数SF2[J]确定为归一化系数SF[J],并将位数NSF2 [J]确定为位数NSF[J]。窗选择部59将编码后归一化系数HSF[J]提供给多路复用部61,将归一化系数SF[J]提供给归一化部15,并将位数NSF[J]提供给量化部16。在步骤S22中,频谱选择部60基于从窗选择部59提供的窗函数信息SW[J]来选择从频率转换部56提供的频谱SP2[J],并将其作为频谱SP[J]提供给归一化部15。此外,频谱选择部60将窗函数信息SW[J]提供给多路复用部61。然后,处理进行到步骤S23。在步骤S23中,归一化部15通过使用从窗选择部59提供的归一化系数SF[J]来对从频谱选择部60提供的频谱SP[J]进行归一化,并将所得到的归一化谱NSP[J]提供给量化部16。在步骤S24中,量化部16基于量化信息P[J]量化从归一化部15提供的归一化谱NSP [J],并将所得到的量化谱OSP [J]提供给编码部17。此时,编码部17计算对从量化部16提供的量化谱QSP [J]进行编码所需的位数NQSP[JJ0这里,当码串B[J]的位数NB[J]是预定的时,需要位数NQSP[J]为值NQ’或更小,其中,值NQ’作为位数NB[J]减去量化信息P[J]的位数NP[J]、对归一化系数SF[J]进行编码所需的位数NSF[J]和窗函数信息SW[J]的位数的结果。在该实施例中,由于存在两个不同的窗函数,因此,窗函数信息SW[J]的位数为I位。编码部17将位数NQSP[J]反馈到量化部16。量化部16调整量化信息P [J],使得位数NQSP [J]等于值NQ’或更小。量化部16将调整后的量化信息P[J]提供给多路复用部61。在步骤S25中,编码部17对从量化部16提供的量化谱QSP[J]进行编码,并将所得到的编码频谱HSP[J]提供给多路复用部61。在步骤S26中,多路复用部61对来自窗选择部59的编码后归一化系数HSF[J]、来自频谱选择部60的窗函数信息SW[J]、来自量化部16的量化信息P[J]和来自编码部17的编码频谱HSP[J]进行多路复用。多路复用部61传送所得到的码串B[J]并结束处理。如上所述,音频编码装置50将帧数据T [J]与各自具有不同特征的窗函数WFl和窗函数WF2相乘,基于所得到的相乘后数据来选择窗函数WFl或窗函数WF2作为最佳窗函数,并传送与最佳窗函数相乘后的相乘后数据的编码频谱作为编码结果。因此,音频编码装置60例如选择在对各自与窗函数WFl和窗函数WF2相乘后的帧数据T[J]的归一化系数进行编码所需的位数方面位数较小的窗函数,作为最佳窗函数。从而,可以通过使用最佳窗函数来对音频信号进行编码以减少音质劣化。[音频解码装置的配置示例]图9是示出对从图3所示的音频编码装置50传送的码串B[J]进行解码的音频解码装置的配置示例的框图。在图9所示的配置中,与图2中所示的部件相同的部件被赋予相同的标记,并将适当地省略重复描述。图9中的音频解码装置80的配置与图2所示的配置的不同之处在于设置了分解部81和加窗部83来替代分解部31和加窗部37,并且不同之处在于另外设置了窗选择部82。音频解码部80基于包括在音频编码装置50传送的码串B[J]中的窗函数信息Sff [J]来选择与窗函数WFl或窗函数WF2对应的窗函数,并将时轴数据ST [J]与该窗函数相乘。具体而言,音频解码装置80的分解部81起到用以接收从图3所示的音频编码装置50传送的码串B[J]的接收部的作用。分解部81将码串B[J]分解成编码频谱HSP[J]、量化信息P [J]、编码后归一化系数HSF [J]和窗函数信息SW [J]。分解部81将编码频谱HSP [J]提供给解码部32,将量化信息P[J]提供给逆量化部33,将编码后归一化系数HSF[J]提供给归一化系数解码部34,并将窗函数信息SW[J]提供给窗选择部82。窗选择部82基于从分解部81提供的窗函数信息SW[J]来选择与窗函数WFl对应的窗函数WBl或与窗函数WF2对应的窗函数WB2。窗函数WFl与窗函数WBl之间的关系以及窗函数WF2与窗函数WB2之间的关系具有如下约束条件当量化位数是无限大的时,输入到音频编码装置50中的帧数据T[J]和从音频解码装置80输出的帧数据T[J]彼此一致。窗选择部82将所选的窗函数作为窗函数WB提供给加窗部83。加窗部83将从逆频率转换部36提供的时轴数据ST[J]与从窗选择部82提供的窗函数WB相乘,并将作为乘法结果所获得的相乘后数据WBT [J]提供给重叠部38。[音频解码装置中的处理的描述]图10是说明图9所示的音频解码装置80进行的解码处理的流程图。例如当从音频编码装置50传送码串B[J]时,解码处理开始。参照图10,在步骤S41中,包括在音频解码装置80中的分解部81接收从图3所示的音频编码装置50传送的码串B[J],并将其分解成编码频谱HSP[J]、量化信息P[J]、编码后归一化系数HSF[J]和窗函数信息SW[J]。分解部81将编码频谱HSP[J]提供给解码部32,将量化信息P[J]提供给逆量化部33,将编码后归一化系数HSF[J]提供给归一化系数解码部34,并将窗函数信息SW[J]提供窗选择部82。在步骤S42中,解码部32对从分解部81提供的编码频谱HSP[J]进行解码,并将所得到的量化谱QSP[J]提供给逆量化部33。 在步骤S43中,逆量化部33基于从分解部81提供的量化信息P [J],对从解码部32提供的量化谱QSP [J]执行逆量化以获得归一化谱NSP [J]。逆量化部33将归一化谱NSP [J]提供给逆归一化部35。在步骤S44中,归一化系数解码部34对从分解部81提供的编码后归一化系数HSF[J]进行解码,并将所得到的归一化系数SF[J]提供给逆归一化部35。在步骤S45中,逆归一化部35通过使用从归一化系数解码部34提供的归一化系数SF[J]和归一化谱NSP [J]来执行逆归一化,并将所得到的频谱SP [J]提供给逆频率转换部36。在步骤S46中,逆频率转换部36对从逆归一化部35提供的频谱SP[J]执行逆频 率转换,并将所得到的时轴数据ST [J]提供给加窗部83。在步骤S47中,窗选择部82确定从分解部81提供的窗函数信息SW[J]是否为O。当在步骤S47中确定窗函数信息SW[J]为0时,在步骤S48中,窗选择部82选择与窗函数WFl对应的窗函数WBl,并将其作为窗函数WB提供给加窗部83。然后,处理进行到步骤S50。另一方面,当在步骤S47中确定窗函数信息SW[J]不为0时,S卩,当窗函数信息Sff [J]为I时,在步骤S49中,窗选择部82选择与窗函数WF2对应的窗函数WB2,并将其作为窗函数WB提供给加窗部83。然后,处理进行到步骤S50。在步骤S50中,加窗部83将从逆频率转换部36提供的时轴数据ST[J]与窗函数WB相乘,并将作为乘法结果所获得的相乘后数据WBT [J]提供给重叠部38。在步骤S51中,重叠部38保存从加窗部83提供的相乘后数据WBT [J]。在步骤S52中,重叠部38将所保存的具有帧指数J_1的相乘后数据WBT [J-1]与相乘后数据WBT[J]在彼此重叠例如一帧的一半的情况下相加。重叠部38输出所得到的帧数据T[J]作为解码结果,并结束处理。〈第二实施例〉[编码装置的配置示例]图11是示出应用了本技术的音频编码装置的第二实施例的配置示例的框图。在图11所示的配置中,与图3所示的部件相同的部件被赋予相同的标记,并且将适当地省略重复描述。图11所示的音频编码装置100的配置与图3所示的配置不同之处主要在于,设置了归一化部101和105、量化部102和106、编码部103和107、以及多路复用部104和108来替代归一化部15、量化部16、编码部17和多路复用部61,并且不同之处还在于另外设置了窗选择部109和切换部110。音频编码装置100被配置为基于量化误差选择最佳窗函数。具体而言,音频编码装置100中包括加窗部51、频率转换部52、归一化系数确定部53、归一化系数编码部54、归一化部101、量化部102、编码部103和多路复用部104的路径I’被配置为获得与窗函数WFl相乘后的巾贞数据T[J]的码串BI [J]。更具体而言,归一化部101通过使用归一化系数确定部53确定的归一化系数SFl [J]来对从频率转换部52提供的频谱SPl [J]进行归一化,并将所得到的谱NSPl [J]提供给量化部102和窗选择部109。量化部102基于量化信息Pl [J]对从归一化部101提供的谱NSPl [J]进行量化,并将所得到的量化谱QSPl [J]提供给编码部103和窗选择部109。此时,量化部102获得从编码部103反馈的与量化谱QSPl [J]对应的位数NQSP [J],并调整量化信息Pl [J],使得位数NQSPl [J]变为预定值。量化部102将调整后的量化信息Pl [J]提供给多路复用部104。编码部103计算对从量化部102提供的量化谱QSP1[J]进行编码所需的位数NQSPl [J]。这里,当码串B [J]的位数NB [J]是预定的时,需要位数NQSPl [J]是值NQl或更小,其中,值NQl作为位数NB[J]减去量化信息Pl [J]的位数NPl [J]、对归一化系数编码部54算出的归一化系数进行编码SFl [J]进行编码所需的位数NSFl [J]和窗函数信息SW[J]的位数的结果。因此,编码部103将位数NQSPl [J]提供给量化部102,并且量化部102调整量化信息Pl [J],使得位数NQSPl [J]是值NQl或更小。此外,编码部103对量化谱QSPl [J]进行编码,并将所得到的编码频谱HSPl [J]提供给多路复用部104。多路复用部104对来自归一化系数编码部54的编码后归一化系数HSFl [J]、来自量化部102的量化信息Pl [J]和来自编码部103的编码频谱HSPl [J]进行多路复用,并将所得到的码串B1[J]提供给切换部110。包括加窗部55、频率转换部56、归一化系数确定部57、归一化系数编码部58、归一化部105、量化部106、编码部107和多路复用部108的路径2’被配置为与路径I’中的各部相同,以获得与窗函数WF2相乘后的帧数据T[J]的码串B2[J]。具体而言,归一化部105通过使用从归一化系数确定部57提供的归一化系数SF2 [J]来对从频率转换部56提供的频谱SP2 [J]进行归一化,并将所得到的谱NSP2 [J]提供给量化部106和窗选择部109。量化部106基于量化信息P2 [J]对从归一化部105提供的谱NSP2 [J]进行量化,并将所得到的量化谱QSP2[J]提供给编码部107和窗选择部109。此时,量化部106获得从编码部107反馈的与量化部QSP2 [J]对应的位数NQSP2,并调整量化信息P2 [J],使得位数NQSP2变为预定值。量化部106将调整后的量化信息P2[J]提供给多路复用部108。编码部107计算对从量化部106提供的量化谱QSP2[J]进行编码所需的位数NQSP2[J]。这里,当码串B [J]的位数NB [J]是预定的时,需要位数NQSP2[J]是值NQ2或更小,其中,值NQ2作为位数NB [J]减去量化信息P2 [J]的位数NPl [J]、对归一化系数编码部58算出的归一化系数SF2[J]进行编码所需的位数NSF2[J]和窗函数信息SW[J]的位数的结果。因此,编码部107将位数NQSP2[J]提供给量化部106,并且量化部106调整量化信息P2 [J],使得位数NQSP2 [J]为值NQ2或更小。此外,编码部107对量化谱QSP2 [J]进行编码,并将所得到的编码频谱HSP2[J]提供给多路复用部108。多路复用部108将来自归一化系数编码部58的编码后归一化系数HSF2[J]、来自量化部106的量化信息P2[J]和来自编码部107的编码频谱HSP2[J]相乘,并将所得到的码串B2[J]提供给切换部110。与音频解码装置80的逆量化部33相同,窗选择部109对从量化部102提供的量化谱QSPl [J]执行逆量化,以生成谱NSP1’ [J]。因此,窗选择部109将谱NSP1’ [J]与从归一化部101提供的原始谱NSPl [J]进行比较,以获得量化误差Dl [J]。具体而言,窗选择部109针对在整个谱上的每个谱,将谱NSP1’ [J]与谱NSP1[J]之间的差相加,以获得量化误差 Dl[J]。同样,窗选择部109对从量化部106提供的量化谱QSP2[J]执行逆量化,并通过使用所得到的NSP2’ [J]和从归一化部105提供的原始谱NSP2 [J]来获得量化误差D2 [J]。窗选择部109将量化误差Dl [J]与量化误差D2[J]进行比较,并选择与较小的量化误差对应的窗函数作为最佳窗函数。然后,窗选择部109生成表不被选择作为最佳窗函数的窗函数WFl或窗函数WF2的窗函数信息SW[J],并将其提供给切换部110。切换部110基于从窗选择部109提供的窗函数信息SW[J],选择从多路复用部104提供的码串B[J]或从多路复用部108提供的码串B2[J]。切换部110在所选的码串上多路复用窗函数信息SW[J]。切换部110起到传送部的作用,并且控制作为多路复用结果所获得的码串B[J]的传送并传送该码串B[J]。[音频编码装置的处理的描述]图12是说明图11所示的音频编码装置100进行的编码处理的流程图。例如当帧数据T[J]作为编码对象被输入时,该编码处理开始。由于图12中从步骤S71到S75的处理与图8中从步骤Sll到S15的处理相同,因此,省略了对其的描述。在完成步骤S75中的处理之后,在步骤S76中,归一化部101通过使用从归一化系数确定部53提供的归一化系数SFl [J]来对从频率转换部52提供的频谱SPl [J]进行归一化。归一化部101将所得到的谱NSP1[J]提供给量化部102和窗选择部109。此外,归一化部105通过使用从频率转换部56提供的归一化系数SF2 [J]来对从归一化系数确定部47提供的频谱SP2[J]进行归一化,并将所得到的谱NSP2[J]提供给量化部106和窗选择部109。在步骤S77中,量化部102基于量化信息Pl [J]来量化从归一化部101提供的谱NSPl [J],并将所得到的量化谱QSPl [J]提供给编码部103和窗选择部109。此时,编码部103计算对从量化部102提供的量化谱QSPl [J]进行编码所需的位数NQSPl [J]。编码部103将位数NQSPl [J]提供给量化部102,并且量化部102调整量化信息Pl [J],使得位数NQSPl [J]变为值NQl或更小。量化部102将调整后的量化信息Pl [J]提供给多路复用部104。量化部106基于量化信息P2 [J]来量化从归一化系数105提供的谱NSP2 [J],并将所得到的量化谱QSP2[J]提供给编码部107和窗选择部109。此时,编码部107计算对从量化部106提供的量化谱QSP2[J]进行编码所需的位数NQSP2 [J]。编码部107将位数NQSP2 [J]提供给量化部106,并且量化部106调整量化信息P2 [J],使得位数NQSP2 [J]变为值NQ2或更小。量化部106将调整后的量化信息P2 [J]提供给多路复用部108。在步骤S78中,编码部103对量化谱QSPl [J]进行编码,并将所得到的编码频谱HSP1[J]提供给乘法部104。编码部107对量化谱QSP2[J]进行编码,并将所得到的编码频谱HSP2[J]提供给乘法部108。在步骤S79中,多路复用部104对来自归一化系数编码部54的编码后归一化系数HSFl [J]、来自量化部102的量化信息Pl [J]和来自编码部103的编码频谱HSPl [J]进行多路复用。多路复用部104将所得到的码串B1[J]提供给切换部110。多路复用部108对来自归一化系数编码部58的编码后归一化系数HSF2 [J]、来自量化部106的量化信息P2 [J]和来自编码部107的编码频谱HSP2[J]进行多路复用,并将所得到的码串B2[J]提供给切换部110。
在步骤S80中,与音频解码装置80中的逆量化部33相同,窗选择部109对从量化部102提供的量化谱QSPl [J]和从量化部106提供的量化谱QSP2 [J]执行逆量化。在步骤S81中,窗选择部109获得量化误差Dl [J]和量化误差D2[J]。具体而言,窗选择部109将作为对量化谱QSPl [J]的逆量化的结果所获得的谱NSP1’ [J]与从归一化部101提供的原始谱NSPl [J]的每个谱的差分在整个谱内相加,并确定为量化误差Dl [J]。此外,窗选择部109将作为对量化谱QSP2[J]的逆量化的结果而获得的谱NSP2’ [J]与从归一化部105提供的原始谱NSP2[J]的每个谱的差分在整个谱内相加,并确定为量化误差D2[J]。在步骤S82中,窗选择部109确定量化误差Dl [J]是否小于量化误差D2[J]。当在步骤S82中量化误差D1[J]小于量化误差D2[J]时,窗选择部108选择与量化误差Dl [J]对应的窗函数WFl作为最佳窗函数。在步骤S83中,窗选择部109生成表示被选择作为最佳窗函数的窗函数WFl的窗函数信息SW[J],并将其提供给切换部110。在步骤S84中,切换部110基于从窗选择部109提供的窗函数信息SW[J]来选择从多路复用部104提供的码串BI [J],并在所选的码串BI [J]上对窗函数信息SW[J]进行多路复用。切换部110传送所得到的码串B[J]并结束处理。另一方面,当在步骤S82中确定量化误差Dl [J]不小于量化误差D2[J]时,窗选择部109选择与量化误差D2 [J]对应的窗函数WF2作为最佳窗函数。在步骤S85中,窗选择部109生成表不被选择作为最佳窗函数的窗函数WF2的窗函数信息SW[J],并将其提供给切换部110。在步骤S86中,切换部110选择从多路复用部108提供的码串B2[J],并在所选的码串B2[J]上对窗函数信息SW[J]进行多路复用。切换部110传送所得到的码串B[J],并
结束处理。如上所述,音频编码装置100将帧数据T[J]分别与各自具有不同特征的窗函数WFl和窗函数WF2相乘,基于所得到的相乘后数据来选择窗函数WFl或窗函数WF2作为最佳窗函数,并传送与最佳窗函数相乘后的相乘后数据的编码频谱作为编码结果。因此,音频编码装置100可以通过选择例如具有与窗函数WFl和窗函数WF2相乘后的巾贞数据T[J]的较小量化误差的窗函数作为最佳窗函数,使用减少音质劣化的最佳窗函数来对音频信号进行编码。尽管音频编码装置100通过使用逆量化后的谱和量化前的谱来获得量化误差,但是可通过使用归一化前的频谱、逆量化后的谱和通过使用归一化系数所恢复的频谱来获得量化误差。在这种情况下,可以更精确地计算量化误差。由于用于对从音频编码装置100传送的码串B[J]进行解码的装置与图9所示的音频解码装置80相同,因此省略了对其的描述。〈第三实施例〉[应用了本技术的计算机的说明]接下来,可以通过硬件或软件来执行如上所述的一系列处理。当通过软件执行该系列处理时,构成软件的程序安装在通用计算机等中。因此,图13示出根据安装有执行上述系列处理的程序的计算机的一个实施例的构成示例。程序可以预先存储在存储部208或作为内置在计算机中的记录介质的ROM (只读存储器)202中。或者,程序可以存储(记录)在可移动介质211中。这样的可移动介质211可以被设置为所谓的封装软件。这里,作为可移动介质211,例如有软盘、CD-ROM(致密盘只读存储器)、M0 (磁光)盘、DVD (数字通用盘)、磁盘、半导体存储器等。另外,程序可以从如上所述的可移动介质211经由驱动器210安装在计算机中,或者可以经由通信网络或广播网络下载到计算机中以安装在内置的存储部208中。S卩,程序 可以从下载站点例如经由用于数字卫星广播的卫星、通过无线通信转移到计算机,或者可以经由诸如LAN (局域网)和因特网的网络、通过有线通信转移到计算机。计算机包括内部的CPU (中央处理单元)201,并且I/O接口 205经由总线204连接到 CPU 201。当CPU 201通过输入部206的操作而接收经由I/O接口 205从用户输入的命令时,根据命令,CPU 201执行存储在ROM 202中的程序。或者,CPU 201将存储在存储部208中的程序加载到RAM (随机存取存储器)203中以执行该程序。从而,CPU 201执行根据上述流程图的处理或者根据上述框图的配置所执行的处理。然后,CPU 201按照需要经由I/O接口 205输出例如来自输出部207的处理结果,或者从通信部209传送该处理结果,并且另外,将程序记录在存储部208等中。另外,输入部206被配置为包括键盘、鼠标、麦克风等。此外,输出部207被配置为包括IXD (液晶显示器)、扬声器等。这里,在本说明书中,不一定以流程图表示的顺序按时间顺序执行计算机根据程序执行的处理。即,计算机根据程序执行的处理还包括并行或独立地执行的处理(例如,并行处理或面向对象的处理)。此外,程序可由一台计算机(处理器)处理,或者可由多个计算机按分布式处理方式执行。另外,程序可被转移到远程计算机以执行。本领域技术人员应理解,在所附权利要求或其等同方案的范围内,根据设计要求和其它因素,可进行各种修改、组合、子组合和变更。另外,本技术可以如下进行配置。(I) 一种音频编码装置,包括第一加窗部,将音频信号与第一窗函数相乘;第二加窗部,将所述音频信号与第二窗函数相乘,其中所述第二窗函数的特征不同于所述第一窗函数的特征;窗选择部,基于经所述第一加窗部相乘后的所述音频信号和经所述第二加窗部相乘后的所述音频信号,选择所述第一窗函数或所述第二窗函数作为最佳窗函数;编码部,对与所述最佳窗函数相乘后的所述音频信号的频谱进行编码;以及传送部,传送经所述编码部编码后的所述频谱和表示所述最佳窗函数的窗函数信
肩、O(2)根据(I)所述的音频编码装置,还包括第一归一化系数确定部,确定经所述第一加窗部相乘后的所述音频信号的频谱的归一化系数,作为第一归一化系数;第二归一化系数确定部,确定经所述第二加窗部相乘后的所述音频信号的频谱的归一化系数,作为第二归一化系数;第一归一化系数编码部,对所述第一归一化系数确定部确定的所述第一归一化系数进行编码;第二归一化系数编码部,对所述第二归一化系数确定部确定的所述第二归一化系数进行编码;以及归一化部,通过使用与所述最佳窗函数对应的所述第一归一化系数或所述第二归一化系数来对与所述最佳窗函数相乘后的所述音频信号的频谱进行归一化,其中,所述窗选择部基于对所述第一归一化系数和所述第二归一化系数进行编码所需的位数来选择所述最佳窗函数,所述编码部对经所述归一化部归一化后的所述频谱进行编码,并且所述传送部传送编码后的频谱、与所述最佳窗函数对应的所述第一归一化系数或所述第二归一化系数的编码结果和表示所述最佳窗函数的窗函数信息。(3)根据(I)所述的音频编码装置,还包括第一量化部,对经所述第一加窗部相乘后的所述音频信号的频谱进行量化;第二量化部,对经所述第二加窗部相乘后的所述音频信号的频谱进行量化;其中,所述窗选择部基于第一量化误差和第二量化误差来选择所述最佳窗函数,其中所述第一量化误差是经所述第一加窗部相乘后的所述音频信号的频谱的量化误差,所述第二量化误差是经所述第二加窗部相乘后的所述音频信号的频谱的量化误差,并且所述编码部对与所述最佳窗函数相乘后的音频信号的量化频谱进行编码。(4)根据(3)所述的音频编码装置,其中,所述窗选择部基于量化前的与所述第一窗函数相乘后的所述音频信号的频谱以及经所述第一量化部量化、然后逆量化后的频谱而获得所述第一量化误差,并且基于量化前的与所述第二窗函数相乘后的所述音频信号的频谱以及经所述第二量化部量化、然后逆量化后的频谱而获得所述第二量化误差。(5) 一种由音频编码装置执行的音频编码方法,包括第一加窗步骤,将音频信号与第一窗函数相乘;第二加窗步骤,将所述音频信号与第二窗函数相乘,其中所述第二窗函数的特征不同于所述第一窗函数的特征;窗选择步骤,基于通过所述第一加窗步骤的处理相乘后的音频信号和通过所述第二加窗部的处理相乘后的所述音频信号,选择所述第一窗函数或所述第二窗函数作为最佳窗函数;编码步骤,对与所述最佳窗函数相乘后的音频信号的频谱进行编码;以及传送步骤,传送通过所述编码步骤的处理编码后的频谱和表示所述最佳窗函数的窗函数信息。(6) 一种程序,用于使计算机执行包括如下步骤的处理第一加窗步骤,将音频信号与第一窗函数相乘;
第二加窗步骤,将所述音频信号与第二窗函数相乘,其中所述第二窗函数的特征不同于所述第一窗函数的特征;窗选择步骤,基于通过所述第一加窗步骤的处理相乘后的所述音频信号和通过所述第二加窗部的处理相乘后的音频信号,选择所述第一窗函数或所述第二窗函数作为最佳窗函数;编码步骤,对与所述最佳窗函数相乘后的所述音频信号的频谱进行编码;以及传送控制步骤,控制对通过所述编码步骤的处理编码后的频谱和表示所述最佳窗函数的窗函数信息的传送。(7) 一种音频解码装置,包括接收部,接收编码频谱和表示作为最佳窗函数的第一窗函数或第二窗函数的窗函数信息,其中,所述编码频谱是通过对与作为所述最佳窗函数的所述第一窗函数或所述第二窗函数相乘后的音频信号的频谱进行编码的结果而获得的,所述第二窗函数的特征不同于所述第一窗函数的特征;解码部,对所述接收部接收到的所述编码频谱进行解码;窗选择部,基于所述接收部接收到的所述窗函数信息来从所述第一窗函数和所述第二窗函数中选择所述最佳窗函数;以及加窗部,基于所述窗选择部选择的所述最佳窗函数,根据作为所述解码部执行的解码的结果而获得的频谱来生成所述音频信号。(8)根据(7)所述的音频解码装置,还包括归一化系数解码部,对用于对与所述最佳窗函数相乘后的音频信号的频谱进行归一化的归一化系数的编码结果进行解码;以及逆归一化部,通过使用经所述归一化系数解码部解码后的归一化系数,对作为所述解码部执行的解码的结果所获得的频谱进行逆归一化,其中,所述接收部接收作为对通过使用所述归一化系数归一化的所述频谱进行编码的结果而获得的所述编码频谱、所述归一化系数的编码结果和所述窗函数信息,并且所述加窗部基于所述最佳窗函数,根据作为所述逆归一化部执行的逆归一化的结果而获得的频谱来生成所述音频信号。(9)根据(7)所述的音频解码装置,还包括逆量化部,对作为所述解码部执行的解码的结果所获得的频谱进行逆量化,其中,所述接收部接收作为对量化后的频谱进行编码的结果所获得的所述编码频谱和所述窗函数信息,并且所述加窗部基于所述最佳窗函数,根据作为所述逆量化部执行的逆量化的结果所获得的频谱来生成所述音频信号。(10) 一种由音频解码装置执行的音频解码方法,包括接收步骤,接收编码频谱和表示作为最佳窗函数的第一窗函数或第二窗函数的窗函数信息,其中,通过对与作为所述最佳窗函数的所述第一窗函数或所述第二窗函数相乘后的音频信号的频谱进行编码的结果而获得所述编码频谱,所述第二窗函数的特征不同于所述第一窗函数的特征;解码步骤,对通过所述接收步骤的处理接收到的所述编码频谱进行解码;窗选择步骤,基于通过所述接收步骤的处理接收到的所述窗函数信息来从所述第一窗函数和所述第二窗函数中选择所述最佳窗函数;以及加窗步骤,基于通过所述窗选择步骤的处理所选择的所述最佳窗函数,根据作为通过所述解码步骤的处理所执行的解码的结果而获得的频谱来生成所述音频信号。(11) 一种程序,用于使计算机执行包括以下步骤的处理接收控制步骤,控制对编码频谱和表示作为最佳窗函数的第一窗函数或第二窗函数的窗函数信息的接收,其中,通过对与作为所述最佳窗函数的所述第一窗函数或所述第二窗函数相乘后的音频信号的频谱进行编码的结果而获得所述编码频谱,所述第二窗函数的特征不同于所述第一窗函数的特征;解码步骤,对通过所述接收控制步骤的处理接收到的所述编码频谱进行解码;窗选择步骤,基于通过所述接收控制步骤的处理接收到的所述窗函数信息来从所述第一窗函数和所述第二窗函数中选择所述最佳窗函数;以及加窗步骤,基于通过所述窗选择步骤的处理所选择的所述最佳窗函数,根据作为通过所述解码步骤的处理所执行的解码的结果而获得的频谱的音频信号生成所述音频信号。本公开内容包含与2011年9月26日向日本专利局提交的日本优先权专利申请JP2011-209101中公开的主题内容相关的主题内容,其全部内容通过引用合并于此。
权利要求
1.一种音频编码装置,包括第一加窗部,将音频信号与第一窗函数相乘;第二加窗部,将所述音频信号与第二窗函数相乘,其中所述第二窗函数的特征不同于所述第一窗函数的特征;窗选择部,基于经所述第一加窗部相乘后的所述音频信号和经所述第二加窗部相乘后的所述音频信号,选择所述第一窗函数或所述第二窗函数作为最佳窗函数;编码部,对与所述最佳窗函数相乘后的所述音频信号的频谱进行编码;以及传送部,传送经所述编码部编码后的所述频谱和表示所述最佳窗函数的窗函数信息。
2.根据权利要求1所述的音频编码装置,还包括第一归一化系数确定部,确定经所述第一加窗部相乘后的所述音频信号的频谱的归一化系数,作为第一归一化系数;第二归一化系数确定部,确定经所述第二加窗部相乘后的所述音频信号的频谱的归一化系数,作为第二归一化系数;第一归一化系数编码部,对所述第一归一化系数确定部确定的所述第一归一化系数进行编码;第二归一化系数编码部,对所述第二归一化系数确定部确定的所述第二归一化系数进行编码;以及归一化部,通过使用与所述最佳窗函数对应的所述第一归一化系数或所述第二归一化系数来对与所述最佳窗函数相乘后的所述音频信号的频谱进行归一化,其中,所述窗选择部基于对所述第一归一化系数和所述第二归一化系数进行编码所需的位数来选择所述最佳窗函数,所述编码部对经所述归一化部归一化后的所述频谱进行编码,并且所述传送部传送编码后的频谱、与所述最佳窗函数对应的所述第一归一化系数或所述第二归一化系数的编码结果和表示所述最佳窗函数的窗函数信息。
3.根据权利要求1所述的音频编码装置,还包括第一量化部,对经所述第一加窗部相乘后的所述音频信号的频谱进行量化;第二量化部,对经所述第二加窗部相乘后的所述音频信号的频谱进行量化;其中,所述窗选择部基于第一量化误差和第二量化误差来选择所述最佳窗函数,其中所述第一量化误差是经所述第一加窗部相乘后的所述音频信号的频谱的量化误差,所述第二量化误差是经所述第二加窗部相乘后的所述音频信号的频谱的量化误差,并且所述编码部对与所述最佳窗函数相乘后的所述音频信号的量化频谱进行编码。
4.根据权利要求3所述的音频编码装置,其中,所述窗选择部基于量化前的与所述第一窗函数相乘后的所述音频信号的频谱以及经所述第一量化部量化、然后逆量化后的频谱而获得所述第一量化误差,并且基于量化前的与所述第二窗函数相乘后的所述音频信号的频谱以及经所述第二量化部量化、然后逆量化后的频谱而获得所述第二量化误差。
5.一种由音频编码装置执行的音频编码方法,包括第一加窗步骤,将音频信号与第一窗函数相乘;第二加窗步骤,将所述音频信号与第二窗函数相乘,其中所述第二窗函数的特征不同于所述第一窗函数的特征;窗选择步骤,基于通过所述第一加窗步骤的处理相乘后的所述音频信号和通过所述第二加窗部的处理相乘后的所述音频信号,选择所述第一窗函数或所述第二窗函数作为最佳窗函数;编码步骤,对与所述最佳窗函数相乘后的所述音频信号的频谱进行编码;以及传送步骤,传送通过所述编码步骤的处理编码后的频谱和表示所述最佳窗函数的窗函数信息。
6.一种程序,用于使计算机执行包括如下步骤的处理第一加窗步骤,将音频信号与第一窗函数相乘;第二加窗步骤,将所述音频信号与第二窗函数相乘,其中所述第二窗函数的特征不同于所述第一窗函数的特征;窗选择步骤,基于通过所述第一加窗步骤的处理相乘后的所述音频信号和通过所述第二加窗部的处理相乘后的所述音频信号,选择所述第一窗函数或所述第二窗函数作为最佳窗函数;编码步骤,对与所述最佳窗函数相乘后的所述音频信号的频谱进行编码;以及传送控制步骤,控制对通过所述编码步骤的处理编码后的频谱和表示所述最佳窗函数的窗函数信息的传送。
7.一种音频解码装置,包括接收部,接收编码频谱和表示作为最佳窗函数的第一窗函数或第二窗函数的窗函数信息,其中,所述编码频谱是通过对与作为所述最佳窗函数的所述第一窗函数或所述第二窗函数相乘后的音频信号的频谱进行编码的结果而获得的,所述第二窗函数的特征不同于所述第一窗函数的特征;解码部,对所述接收部接收到的所述编码频谱进行解码;窗选择部,基于所述接收部接收到的所述窗函数信息来从所述第一窗函数和所述第二窗函数中选择所述最佳窗函数;以及加窗部,基于所述窗选择部选择的所述最佳窗函数,根据作为所述解码部执行的解码的结果而获得的频谱来生成所述音频信号。
8.根据权利要求7所述的音频解码装置,还包括归一化系数解码部,对用于对与所述最佳窗函数相乘后的所述音频信号的频谱进行归一化的归一化系数的编码结果进行解码;以及逆归一化部,通过使用经所述归一化系数解码部解码后的归一化系数,对作为所述解码部执行的解码的结果所获得的频谱进行逆归一化,其中,所述接收部接收作为对通过使用所述归一化系数归一化的所述频谱进行编码的结果而获得的所述编码频谱、所述归一化系数的编码结果和所述窗函数信息,并且所述加窗部基于所述最佳窗函数,根据作为所述逆归一化部执行的逆归一化的结果而获得的频谱来生成所述音频信号。
9.根据权利要求7所述的音频解码装置,还包括逆量化部,对作为所述解码部执行的解码的结果而获得的频谱进行逆量化,其中,所述接收部接收作为对量化后的频谱进行编码的结果而获得的所述编码频谱和所述窗函数信息,并且所述加窗部基于所述最佳窗函数,根据作为所述逆量化部执行的逆量化的结果而获得的频谱来生成所述音频信号。
10.一种由音频解码装置执行的音频解码方法,包括接收步骤,接收编码频谱和表示作为最佳窗函数的第一窗函数或第二窗函数的窗函数信息,其中,通过对与作为所述最佳窗函数的所述第一窗函数或所述第二窗函数相乘后的音频信号的频谱进行编码的结果而获得所述编码频谱,所述第二窗函数的特征不同于所述第一窗函数的特征;解码步骤,对通过所述接收步骤的处理接收到的所述编码频谱进行解码;窗选择步骤,基于通过所述接收步骤的处理接收到的所述窗函数信息来从所述第一窗函数和所述第二窗函数中选择所述最佳窗函数;以及加窗步骤,基于通过所述窗选择步骤的处理所选择的所述最佳窗函数,根据作为通过所述解码步骤的处理所执行的解码的结果而获得的频谱生成所述音频信号。
11.一种程序,用于使计算机执行包括以下步骤的处理接收控制步骤,控制对编码频谱和表示作为最佳窗函数的第一窗函数或第二窗函数的窗函数信息的接收,其中,通过对与作为所述最佳窗函数的所述第一窗函数或所述第二窗函数相乘后的音频信号的频谱进行编码的结果而获得所述编码频谱,所述第二窗函数的特征不同于所述第一窗函数的特征;解码步骤,对通过所述接收控制步骤的处理接收到的所述编码频谱进行解码;窗选择步骤,基于通过所述接收控制步骤的处理接收到的所述窗函数信息来从所述第一窗函数和所述第二窗函数中选择所述最佳窗函数;以及加窗步骤,基于通过所述窗选择步骤的处理所选择的所述最佳窗函数,根据作为通过所述解码步骤的处理所执行的解码的结果而获得的频谱的音频信号生成所述音频信号。
全文摘要
本发明提供了音频编码装置和音频编码方法、音频解码装置和音频解码方法、以及程序,其中该音频编码装置包括第一加窗部,将音频信号与第一窗函数相乘;第二加窗部,将音频信号与第二窗函数相乘,第二窗函数的特征不同于第一窗函数的特征;窗选择部,基于经第一加窗部相乘后的音频信号和经第二加窗部相乘后的音频信号,选择第一窗函数或第二窗函数作为最佳窗函数;编码部,对与最佳窗函数相乘后的音频信号的频谱进行编码;以及传送部,传送经编码部编码后的频谱和表示最佳窗函数的窗函数信息。
文档编号G10L19/022GK103021416SQ20121035006
公开日2013年4月3日 申请日期2012年9月19日 优先权日2011年9月26日
发明者铃木志朗, 松村祐树, 户栗康裕, 前田祐儿, 松本淳 申请人:索尼公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1