编码装置和方法、解码装置和方法以及程序的制作方法

文档序号:2832861阅读:160来源:国知局
专利名称:编码装置和方法、解码装置和方法以及程序的制作方法
技术领域
本发明涉及一种编码装置和方法、解码装置和方法以及程序,并且具体地,涉及一种通过对频带进行扩展而能够以高声音质量播放音乐信号的编码装置和方法、解码装置和方法以及程序。
背景技术
近年来,经由因特网等分发音乐数据的音乐分发服务已经普及。采用此音乐分发服务,通过对音乐信号进行编码而获得的编码数据被分发作为音乐数据。作为音乐信号编码技术,其中在抑制编码数据的文件容量以使下载时不费时间的同时比特率降低的编码技术变为了主流。这样的音乐信号编码技术被粗略地划分为诸如MP3 (MPEG (运动图像专家组)音频层3)(国际标准IS0/IEC11172-3)等编码技术,以及诸如HE-AAC (高效率MPEG4AAC)(国际标准IS0/IEC14496-3)等编码技术。采用由MP3所代表的编码技术,删除音乐信号中的难以由人耳所感受的等于或大于大约15kHz的高频带(在下文中称为高频)中的信号分量,并且对剩余的低频带(在下文中称为低频)中的信号分量进行编码。这样的编码技术将被称为高频消除编码技术。采用此高频消除编码技术,可以抑制编码数据的文件容量。但是,高频声音可以由人耳轻微地感受至IJ,并且因此,在根据通过对编码数据进行解码所获得的解码之后的音乐信号生成并且输出声音时,可能存在声音质量的劣化(诸如原始声音所具有的现场感的损失、或声音可能是压抑的)。另一方面,采用由HE-AAC所代表的编码技术,从高频信号分量中提取特征信息,并且对特征信息和低频信号分量一起进行编码。在下文中,这样的编码技术将被称为高频特征编码技术。采用此高频特征编码技术,仅将高频信号分量的特征信息编码作为与高频信号分量相关的信息,并且因此,可以在抑制声音质量的劣化的同时改进编码效率。通过对由该高频特征编码技术编码的编码数据进行解码,对低频信号分量和特征信息进行解码,并且根据解码之后的低频信号分量和特征信息生成高频信号分量。因此,通过根据低频信号分量生成高频信号分量来对低频信号分量的频带进行扩展的技术将在下文中被称为频带扩展技术。作为频带扩展技术的一个应用,存在对经过上述高频消除编码技术编码的编码数据进行解码之后的后处理。采用此后处理,根据解码之后的低频信号分量来生成通过编码而损失的高频信号分量,由此对低频信号分量的频带进行扩展(参见PTL1)。注意,根据PTLl的频带扩展技术在下文中将被称为根据PTLl的频带扩展技术。通过根据PTLl的频带扩展技术,装置采用解码之后的低频信号分量作为输入信号,根据输入信号的功率谱来估计高频功率谱(在下文中,视情况称为高频频率包络线),以及根据低频信号分量生成具有高频频率包络线的高频信号分量。图1示出解码之后的低频功率谱(用作输入信号)以及所估计的高频频率包络线的示例。在图1中,垂直轴指示功率的对数,水平轴指示频率。装置根据与输入信号相关的编码方法的类型、采样率、比特率等的信息(在下文中称为边信息)来确定高频信号分量的低频端的频带(在下文中称为扩展起始频带)。接下来,装置将用作低频信号分量的输入信号分割成多个子带信号。装置获得每个群组关于分割之后的多个子带信号(即,在与扩展起始频带相比较低频侧的多个子带信号(在下文中,简单地称为低频侧))中的每个子带信号的功率的时域方向的平均值(在下文中,被称为群组功率)。如图1所示,装置采用下述点作为原点:该点以低频侧的多个子带信号中的每个子带信号的群组功率的平均值作为功率,并且还以扩展起始频带的较低端的频率作为频率。装置采用通过其原点的、具有预定倾斜度的一次直线作为在与扩展起始频带相比的较高频率侦仪在下文中,简单地称为高频侧)的频率包络线来执行估计。注意,用户可以对关于原点的功率方向的位置进行调整。装置根据低频侧的多个子带信号来生成在高频侧的多个子带信号中的每一个以获得高频侧的所估计的频率包络线。装置将所生成的高频侧的多个子带信号相加以获得高频信号分量,并且进一步将低频信号分量相加到其上并且将它们输出。从而,在对频带进行扩展之后的音乐信号近似于原始音乐信号。因此,可以以高声音质量的播放音乐信号。以上提及的根据PTLl的频带扩展技术具有下述特征:可以关于各种高频消除编码技术和具有各种比特率的编码数据,对关于对编码数据进行解码之后的音乐信号的频带进行扩展。引用列表专利文献PTLl:日本未经审查专利申请公布第2008-139844号

发明内容
技术问题但是,采用根据PTLl的频带扩展技术,由于所估计的高频侧的频率包络线变为具有预定的倾斜度的一次直线,即,频率包络线的形状是固定的,因此存在改进空间。具体地,音乐信号的功率谱具有各种形状,根据音乐信号的类型,存在很多极大地偏离由根据PTLl的频带扩展技术所估计的高频侧的频率包络线的情况。图2示出了伴随有时域快速改变(诸如猛击鼓一次)的打击性质的音乐信号(具有打击的音乐信号)的原始功率谱的示例。注意,图2还示出了由根据PTLl的频带扩展技术根据在用作输入信号的、具有打击的音乐信号的低频侧的信号分量所估计的高频侧的频率包络线。如图2所示,具有打击的音乐信号的高频侧的原始功率谱通常为平坦的。另一方面,所估计的高频侧的频率包络线具有预定的负倾斜度,并且因此,即使当调整原点处的功率接近于原始功率谱时,随着频率增加,与原始功率谱的差异仍增加。因此,采用根据PTLl的频带扩展技术,根据所估计的高频侧的频率包络线,不能以高精确度再生高频侧的原始频率包络线。作为其结果,在根据对频带进行扩展之后的音乐信号来生成并且输出声音时,就可听性而言,与原始声音相比,声音的清晰度受到损失。
另外,采用以上提及的高频特征编码技术(诸如HE-AAC等),尽管高频侧的频率包络线被用作要被编码的高频信号分量的特征信息,但是要求解码侧以高精确度再生高频侧的频率包络线。鉴于此情形而形成本发明,并且本发明通过对频带进行扩展而能够以高声音质量播放音乐信号。问题的解决方案根据本发明的第一方面的编码装置包括:子带分割部件,被配置成将输入信号分割成多个子带,并且生成由低频侧的多个子带构成的低频子带信号和由高频侧的多个子带构成的高频子带信号;特征量计算部件,被配置成基于所述低频子带信号和所述输入信号中的至少任意一个,计算代表所述输入信号的特征的特征量;平滑部件,被配置成对所述特征量进行平滑;拟似高频子带功率计算部件,被配置成基于平滑后的特征量和预定的系数来计算拟似高频子带功率,所述拟似高频子带功率是所述高频子带信号的功率的估计值;选择部件,被配置成根据所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并且将所述高频子带功率与所述拟似高频子带功率进行比较以选择多个所述系数中的任意一个;高频编码部件,被配置成对系数信息和平滑信息进行编码以生成高频编码数据,所述系数信息用于获得所选择的系数,所述平滑信息与所述平滑相关;低频编码部件,被配置成对低频信号进行编码以生成低频编码数据,所述低频信号是所述输入信号的低频信号;以及复用部件,被配置成对所述低频编码数据和所述高频编码数据进行复用以获得输出代码串。平滑部件可以通过对所述输入信号的预定数目的连续帧的特征量执行加权平均来对所述特征量进行平滑。平滑信息可以是指示用于所述加权平均的所述帧的数目和用于所述加权平均的权重中的至少一个的信息。编码装置可以包括参数确定部件,该参数确定部件被配置成基于所述高频子带信号来确定用于所述加权平均的所述帧的数目和用于所述加权平均的权重中的至少一个。以从宽带监视信号获得的所述特征量和所述高频子带功率作为解释变量和被解释变量,通过学习生成所述系数。宽带监视信号可以是通过依照编码方法和编码算法对预定的信号进行编码并且对编码后的预定信号进行解码而获得的信号;并且其中,对于多个不同的编码方法和编码算法中的每一个,使用所述宽带监视信号通过学习生成所述系数。根据本发明的第一方面的编码方法或程序包括下述步骤:将输入信号分割成多个子带,并且生成由低频侧的多个子带构成的低频子带信号和由高频侧的多个子带构成的高频子带信号;基于所述低频子带信号和所述输入信号中的至少任意一个,计算代表所述输入信号的特征的特征量;对所述特征量进行平滑;基于平滑后的特征量和预定的系数来计算拟似高频子带功率,所述拟似高频子带功率是所述高频子带信号的功率的估计值;根据所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并且将所述高频子带功率与所述拟似高频子带功率进行比较以选择多个所述系数中的任意一个;对系数信息和平滑信息进行编码以生成高频编码数据,所述系数信息用于获得所选择的系数,所述平滑信息与所述平滑相关;对低频信号进行编码以生成低频编码数据,所述低频信号是所述输入信号的低频信号;以及对所述低频编码数据和所述高频编码数据进行复用以获得输出代码串。采用本发明的第一方面,将输入信号分割成多个子带,并且生成由低频侧的多个子带构成的低频子带信号和由高频侧的多个子带构成的高频子带信号;基于所述低频子带信号和所述输入信号中的至少任意一个,计算代表所述输入信号的特征的特征量;对所述特征量进行平滑;基于平滑后的特征量和预定的系数来计算拟似高频子带功率,所述拟似高频子带功率是所述高频子带信号的功率的估计值;根据所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并且将所述高频子带功率与所述拟似高频子带功率进行比较以选择多个所述系数中的任意一个;对系数信息和平滑信息进行编码以生成高频编码数据,所述系数信息用于获得所选择的系数,所述平滑信息与所述平滑相关;对低频信号进行编码以生成低频编码数据,所述低频信号是所述输入信号的低频信号;以及对所述低频编码数据和所述高频编码数据进行复用以获得输出代码串。根据本发明的第二方面的解码装置包括:解复用部件,被配置成将输入编码数据解复用为低频编码数据、用于获得系数的系数信息以及与平滑相关的平滑信息;低频解码部件,被配置成对所述低频编码数据进行解码以生成低频信号;子带分割部件,被配置成将所述低频信号分割为多个子带以生成用于所述子带中的每个子带的低频子带信号;特征量计算部件,被配置成基于所述低频子带信号来计算特征量;平滑部件,被配置成基于所述平滑信息对所述特征量进行平滑;以及生成部件,被配置成基于从所述系数信息所获得的所述系数、平滑后的所述特征量以及所述低频子带信号来生成高频信号。平滑装置部件可以通过对所述低频信号的预定数目的连续帧的特征量执行加权平均来对所述特征量进行平滑。平滑信息可以是指示用于所述加权平均的所述帧的数目和用于所述加权平均的权重中的至少一个的信息。生成部件可以包括:解码高频子带功率计算部件,被配置成基于平滑后的特征量和所述系数来计算解码高频子带功率,所述解码高频子带功率是构成所述高频信号的子带功率的估计值,以及高频信号生成部件,被配置成基于所述解码高频子带功率和所述低频子带信号来生成所述高频信号。以从宽带监视信号获得的所述特征量和与构成所述宽带监视信号的高频信号的子带相同的子带的功率作为解释变量和被解释变量,通过学习生成所述系数。所述宽带监视信号是依照预定的编码方法和编码算法对预定的信号进行编码并且对编码后的预定信号进行解码而获得的信号;且其中,对于多个不同的编码方法和编码算法中的每一个,使用所述宽带监视信号通过学习生成所述系数。根据本发明的第二方面的解码方法或程序包括下述步骤:将输入编码数据解复用为低频编码数据、用于获得系数的系数信息以及与平滑相关的平滑信息;对所述低频编码数据进行解码以生成低频信号;将所述低频信号分割为多个子带以生成用于所述子带中的每个子带的低频子带信号;基于所述低频子带信号计算特征量;基于所述平滑信息对所述特征量进行平滑;以及基于从所述系数信息所获得的所述系数、平滑后的所述特征量以及所述低频子带信号来生成高频信号。采用本发明的第二方面,将输入编码数据解复用为低频编码数据、用于获得系数的系数信息以及与平滑相关的平滑信息;对所述低频编码数据进行解码以生成低频信号;将所述低频信号分割为多个子带以生成用于所述子带中的每个子带的低频子带信号;基于所述低频子带信号计算特征量;基于所述平滑信息对所述特征量进行平滑;以及基于从所述系数信息所获得的所述系数、平滑后的所述特征量以及所述低频子带信号来生成高频信号。本发明的有利效果根据本发明的第一方面和第二方面,通过对频带进行扩展可以以较高的声音质量播放音乐信号。


图1是示出用作输入信号的解码之后的低频功率谱和所估计的高频频率包络线的示例的图。图2是示出伴随有时域上快速改变的具有打击的音乐信号的原始功率谱的示例的图。图3是示出根据本发明的第一实施例的频带扩展装置的功能配置示例的框图。图4是用于描述通过图3中的频带扩展装置进行的频带扩展处理的流程图。图5是示出要被输入到图3中的频带扩展装置的信号的功率谱和带通滤波器在频率轴上的位置的图。图6是示出在声音部分中的频率特征和所估计的高频功率谱的示例。图7是示出要被输入到图3中的频带扩展装置的信号的功率谱的示例的图。图8是示出对图7中的输入信号进行滤波之后的功率谱的示例的图。图9是示出用于执行在图3中的频带扩展装置的高频信号生成电路处要被使用的系数的学习的系数学习装置功能配置示例的框图。图10是用于描述由图9中的系数学习装置进行的系数学习处理的示例的流程图。图11是示出根据本发明的第二实施例的编码装置的功能配置示例的框图。图12是用于描述由图11中的编码装置进行的编码处理的示例的流程图。图13是示出根据本发明的第二实施例的解码装置的功能配置示例的框图。图14是用于描述由图13中的解码装置进行的解码处理的示例的流程图。图15是示出用于执行在图11中的编码装置的高频编码电路处使用的典型的矢量和在图13中的解码装置的高频解码电路处使用的解码高频子带功率估计系数的学习的系数学习装置的功能配置示例。图16是用于描述由图15中的系数学习装置进行的系数学习处理的示例的流程图。图17是示出图11中的编码装置输出的代码串的示例的图。图18是示出编码装置的功能配置示例的框图。图19是用于描述解码处理的流程图。图20是示出解码装置的功能配置示例的框图。图21是用于描述解码处理的流程图。图22是用于描述编码处理的流程图。
图23是用于描述解码处理的流程图。图24是用于描述编码处理的流程图。图25是用于描述编码处理的流程图。图26是用于描述编码处理的流程图。图27是用于描述编码处理的流程图。图28是示出系数学习处理的配置示例的图。图29是用于描述系数学习处理的流程图。图30是示出编码装置的功能配置示例的框图。图31是用于描述解码处理的流程图。图32是示出解码装置的功能配置示例的框图。图33是用于描述解码处理的流程图。图34是示出使用程序执行本发明所应用至的处理的计算机硬件的配置示例的框图。
具体实施例方式在下文中,将参照附图描述本发明的实施例。注意,将按照以下顺序进行描述。1.第一实施例(将本发明应用至频带扩展装置的情况)2.第二实施例(将本发明应用至编码装置和解码装置的情况)3.第三实施例(高频编码数据中包括系数指标的情况)4.第四实施例(高频编码数据中包括系数指标和拟似高频子带功率差的情况)5.第五实施例(使用评估值来选择系数指标的情况)6.第六实施例(共享部分系数的情况)7.第七实施例(使特征量受到平滑处理的情况)〈1.第一实施例>采用第一实施例,通过对使用高频消除编码技术获得的编码数据进行解码而获得的解码之后的低频信号分量受到处理以扩展频带(在下文中称为频带扩展技术)。[频带扩展装置的功能配置示例]图3示出了应用了本发明的频带扩展装置的功能配置示例。频带扩展装置10采用解码之后的低频信号分量作为输入信号,并且使其输入信号受到频带扩展处理,以及输出作为频带扩展处理的结果而获得的、频带扩展处理之后的信号作为输出信号。频带扩展装置10由下述组件构成:低通滤波器11、延时电路12、带通滤波器13、特征量计算单元14、高频子带功率估计电路15、高频信号生成电路15、高频信号生成电路
16、高通滤波器17以及信号加法器18。低通滤波器11以预定的截止频率对输入信号执行滤波,并且将为低频的信号分量的低频信号分量提供至延时电路12作为滤波之后的信号。为了对将来自低通滤波器11的低频信号分量与稍后描述的高频信号分量相加的时间进行同步,延时电路12以固定的延时时间对低频信号分量进行延时以提供至信号加法器18。
带通滤波器13由各自具有不同通频带的带通滤波器13-1至13-N构成。带通滤波器13-1 (l^i^ N)使输入信号的预定的通频带信号通过,并且将该信号作为多个子带信号中的一个提供至特征量计算电路14和高频信号生成电路16。特征量计算电路14使用输入信号或来自带通滤波器13的多个子带信号中的至少一个来计算单个或多个特征量以提供至高频子带功率估计电路15。在此,特征量是代表作为输入信号的信号的特征的信息。高频子带功率估计电路15基于来自特征量计算电路14的单个或多个特征量来对每个高频子带计算作为高频子带信号的功率的高频子带功率的估计值,并且将这些估计值提供至高频信号生成电路16。高频信号生成电路16基于来自带通滤波器13的多个子带信号和来自高频子带功率估计电路15的多个高频子带功率估计值,生成高频信号分量以提供至高通滤波器17。高通滤波器17采用与低通滤波器11处的截止频率对应的截止频率使来自高频信号生成电路16的高频信号分量受到滤波以提供至信号加法器18。信号加法器18将来自延时电路12的低频信号分量和来自高通滤波器17的高频信号分量相加,并且将其作为输出信号输出。注意,采用图3的配置,为了获得子带信号而应用了带通滤波器13,但是不限于此,并且例如可以应用如PTLl中所描述的频带分割滤波器。另外,类似地,采用图3的配置,为了使子带信号同步而应用了信号加法器18,但是不限于此,可以应用如PTLl中所描述的频带同步滤波器。[频带扩展装置的频带扩展处理]接下来,将参照图4的流程图描述由图3中的频带扩展装置进行的频带扩展处理。在步骤SI,低通滤波器11采用预定的截止频率使输入信号受到滤波处理,并且将作为滤波之后的信号的低频信号分量提供至延时电路12。低通滤波器11可以将任意频率设置为截止频率,但是以本实施例,获取预定的频带作为下文描述的扩展起始频带,并且对应于其扩展起始频带的较低端频率来设置截止频率。因此,低通滤波器11将作为与扩展起始频带相比较低频率的信号分量的低频信号分量提供至延时电路12作为滤波之后的信号。另外,低通滤波器11还可以根据对输入信号的高频消除编码技术和编码参数(诸如比特率等)将最优频率设置为截止频率。作为编码参数,例如可以使用由根据PTLl的频带扩展技术所使用的边信息。在步骤S2中,延时电路12以预定的延时时间对来自低通滤波器11的低频信号分量进行延时,并且将其提供至加法器18。在步骤S3中,带通滤波器13 (带通滤波器13-1至13_N)将输入信号分割成多个子带信号,并且将分割之后的多个子带信号中的每一个提供至特征量计算电路14和高频信号生成电路16。注意,关于由带通滤波器13进行的输入信号分割处理,下文将对其细节进行描述。在步骤S4中, 特征量计算电路14使用输入信号和来自带通滤波器13的多个子带信号中的至少一个来计算单个或多个特征量以提供至高频子带功率估计电路15。注意,关于由特征量计算电路14进行的特征量计算处理,下文将对其细节进行描述。
在步骤S5中,高频子带功率估计电路15基于来自特征量计算电路14的单个或多个特征量来计算多个高频子带功率估计值,并且将这些估计值提供至高频信号生成电路16。注意,关于由高频子带功率估计电路15进行的用于计算高频子带功率估计值的处理,下文将对其细节进行描述。在步骤S6中,高频信号生成电路16基于来自带通滤波器13的多个子带信号和来自高频子带功率估计电路15的多个高频子带功率估计值来生成高频信号分量,并且将其提供至高通滤波器17。在此所提及的高频信号分量是与扩展起始频带相比较高频率的信号分量。注意,关于由高频信号生成电路16进行的高频信号分量生成处理,下文将对其细节进行描述。在步骤S7中,高通滤波器17使来自高频信号生成电路16的高频信号分量受到滤波,由此去除高频信号分量中所包括的噪声(诸如低频的混叠分量),并且将其高频信号分量提供至信号加法器18。在步骤S8中,信号加法器18将来自延时电路12的低频信号分量和来自高通滤波器17的高频信号分量相加以将其作为输出信号提供。根据以上提及的处理,可以对于解码之后的低频信号分量进行频带扩展。接下来,将描述在图4的流程图中的步骤S3至步骤S6中的每个处理的细节。[由带通滤波器进行的处理的细节]首先,将描述图4的流程图的步骤S3中由带通滤波器进行的处理的细节。注意,出于描述的方便,在下文中将带通滤波器13的数目N作为N=4。例如,将通过将输入信号的Nyquist频率相等地分割为16个而获得的16个子带中的一个作为扩展起始频带,将16个子带中频率低于扩展起始频带的4个子带分别作为带通滤波器13-1至13-4的通频带。图5分别示出带通滤波器13-1至13-4的通频带在频率轴上的位置。如图5所示,如果说其频带(子带)低于扩展起始频带,贝U从高频起,第一子带的指标为Sb,第二子带的指标为sb-1,以及第I子带的指标是Sb- (1-1),带通滤波器13-1至13-4分别地将具有比扩展起始频带低的频率、其指标为Sb至sb-3的子带指定为通频带。注意,采用本实施例,带通滤波器13-1至13-4的通频带分别是通过将输入信号的Nyquist频率相等地分割为16个而获得的16个子带中的预定的4个子带,但是不限于此,并且可以分别是通过将输入信号的Nyquist频率相等地分割为256个而获得的256个子带中的预定的4个子带。另外,带通滤波器13-1至13-4的带宽可以不同。[由特征量计算电路进行的处理的细节]接下来,将进行关于在图4的流程图的步骤S4中由特征量计算电路14进行的处理的细节的描述。特征量计算电路14使用来自带通滤波器13的多个子带信号和输入信号中的至少任意一个,计算要用于高频子带功率估计电路15的单个或多个特征量。更具体地,特征量计算电路14根据来自带通滤波器13的4个子带信号,计算用于每个子带的子带信号功率(子带功率(在下文中还称为低频子带功率))作为特征量以提供至高频子带功率估计电路15。具体地,特征量计算电路14使用下述表达式(I)根据由带通滤波器13所提供的4个子带信号X (ib, n)来获得在某一预定时间巾贞J中的低频子带功率power (ib,J)。在此,ib代表子带指标,并且n代表离散的时间指标。现在,假设在一个帧中的样本数目为FSIZE,并且用分贝来代表功率。[数学表达式I]
权利要求
1.一种编码装置,包括: 子带分割部件,被配置成将输入信号分割成多个子带,并且生成由低频侧的多个子带构成的低频子带信号和由高频侧的多个子带构成的高频子带信号; 特征量计算部件,被配置成基于所述低频子带信号和所述输入信号中的至少任意一个,计算代表所述输入信号的特征的特征量; 平滑部件,被配置成对所述特征量进行平滑; 拟似高频子带功率计算部件,被配置成基于平滑后的特征量和预定的系数来计算拟似高频子带功率,所述拟似高频子带功率是所述高频子带信号的功率的估计值; 选择部件,被配置成根据所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并且将所述高频子带功率与所述拟似高频子带功率进行比较以选择多个所述系数中的任意一个; 高频编码部件,被配置成对系数信息和平滑信息进行编码以生成高频编码数据,所述系数信息用于获得所选择的系数,所述平滑信息与所述平滑相关; 低频编码部件,被配置成对低频信号进行编码以生成低频编码数据,所述低频信号是所述输入信号的低频信号;以及 复用部件,被配置成对所述低频编码数据和所述高频编码数据进行复用以获得输出代码串。
2.根据权利要求1所述的编码装置,其中,所述平滑部件通过对所述输入信号的预定数目的连续帧的特征量执行加权平均来对所述特征量进行平滑。
3.根据权利要求2所述的编码装置,其中,所述平滑信息是指示用于所述加权平均的所述帧的数目和用于所述加权 平均的权重中的至少一个的信息。
4.根据权利要求3所述的编码装置,进一步包括: 参数确定部件,被配置成基于所述高频子带信号来确定用于所述加权平均的所述帧的数目和用于所述加权平均的权重中的至少一个。
5.根据权利要求1所述的编码装置,其中,以从宽带监视信号获得的所述特征量和所述高频子带功率作为解释变量和被解释变量,通过学习生成所述系数。
6.根据权利要求5所述的编码装置,其中,所述宽带监视信号是通过依照编码方法和编码算法对预定的信号进行编码并且对编码后的预定信号进行解码而获得的信号; 并且其中,对于多个不同的编码方法和编码算法中的每一个,使用所述宽带监视信号通过学习生成所述系数。
7.一种编码方法,包括如下步骤: 将输入信号分割成多个子带,并且生成由低频侧的多个子带构成的低频子带信号和由高频侧的多个子带构成的高频子带信号; 基于所述低频子带信号和所述输入信号中的至少任意一个,计算代表所述输入信号的特征的特征量; 对所述特征量进行平滑; 基于平滑后的特征量和预定的系数来计算拟似高频子带功率,所述拟似高频子带功率是所述高频子带信号的功率的估计值; 根据所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并且将所述高频子带功率与所述拟似高频子带功率进行比较以选择多个所述系数中的任意一个; 对系数信息和平滑信息进行编码以生成高频编码数据,所述系数信息用于获得所选择的系数,所述平滑信息与所述平滑相关; 对低频信号进行编码以生成低频编码数据,所述低频信号是所述输入信号的低频信号;以及 对所述低频编码数据和所述高频编码数据进行复用以获得输出代码串。
8.一种使计算机执行处理的程序,所述处理包括如下步骤: 将输入信号分割成多个子带,并且生成由低频侧的多个子带构成的低频子带信号和由高频侧的多个子带构成的高频子带信号; 基于所述低频子带信号和所述输入信号中的至少任意一个,计算代表所述输入信号的特征的特征量; 对所述特征量进行平滑; 基于平滑后的特征量和预定的系数来计算拟似高频子带功率,所述拟似高频子带功率是所述高频子带信号的功率的估计值; 根据所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并且将所述高频子带功率与所述拟似高频子带功率进行比较以选择多个所述系数中的任意一个; 对系数信息和平滑信息进行编码以生成高频编码数据,所述系数信息用于获得所选择的系数,所述平滑信息与所述平滑相关; 对低频信号进行编码以生成低频编码数据,所述低频信号是所述输入信号的低频信号;以及 对所述低频编码数据和所述高频编码数据进行复用以获得输出代码串。
9.一种解码装置,包括: 解复用部件,被配置成将输入编码数据解复用为低频编码数据、用于获得系数的系数信息以及与平滑相关的平滑信息; 低频解码部件,被配置成对所述低频编码数据进行解码以生成低频信号; 子带分割部件,被配置成将所述低频信号分割为多个子带以生成用于所述子带中的每个子带的低频子带信号; 特征量计算部件,被配置成基于所述低频子带信号来计算特征量; 平滑部件,被配置成基于所述平滑信息对所述特征量进行平滑;以及生成部件,被配置成基于从所述系数信息所获得的所述系数、平滑后的所述特征量以及所述低频子带信号来生成高频信号。
10.根据权利要求9所述的解码装置,其中,所述平滑部件通过对所述低频信号的预定数目的连续帧的特征量执行加权平均来对所述特征量进行平滑。
11.根据权利要求10所述的解码装置,其中,所述平滑信息是指示用于所述加权平均的所述帧的数目和用于所述加权平均的权重中的至少一个的信息。
12.根据权利要求9所述的解码装置,其中,所述生成部件包括: 解码高频子带功率计算部件,被配置成基于平滑后的特征量和所述系数来计算解码高频子带功率,所述解码高频子带功率是构成所述高频信号的子带功率的估计值,以及 高频信号生成部件,被配置成基于所述解码高频子带功率和所述低频子带信号来生成所述高频信号。
13.根据权利要求9所述的解码装置,其中,以从宽带监视信号获得的所述特征量和与构成所述宽带监视信号的高频信号的子带相同的子带的功率作为解释变量和被解释变量,通过学习生成所述系数。
14.根据权利要求13所述的解码装置,其中,所述宽带监视信号是依照预定的编码方法和编码算法对预定的信号进行编码并且对编码后的预定信号进行解码而获得的信号; 并且其中,对于多个不同的编码方法和编码算法中的每一个,使用所述宽带监视信号通过学习生成所述系数。
15.一种解码方法,包括如下步骤: 将输入编码数据解复用为低频编码数据、用于获得系数的系数信息以及与平滑相关的平滑信息; 对所述低频编码数据进行解码以生成低频信号; 将所述低频信号分割为多个子带以生成用于所述子带中的每个子带的低频子带信号; 基于所述低频子带信号计算特征量; 基于所述平滑信息对所述特征量进行平滑;以及 基于从所述系数信息所获得的所述系数、平滑后的所述特征量以及所述低频子带信号来生成高频信号。
16.一种使计算机执行处理的程序,所述处理包括如下步骤: 将输入编码数据解复用为低频编码数据、用于获得系数的系数信息以及与平滑相关的平滑信息; 对所述低频编码数据进行解码以生成低频信号; 将所述低频信号分割为多个子带以生成用于所述子带中的每个子带的低频子带信号; 基于所述低频子带信号计算特征量; 基于所述平滑信息对所述特征量进行平滑;以及 基于从所述系数信息所获得的所述系数、平滑后的所述特征量以及所述低频子带信号来生成高频信号。
全文摘要
本发明涉及一种通过对频带进行扩展而能够以较高的声音质量播放音乐信号的编码装置和方法、解码装置和方法以及程序。带通滤波器将输入信号分割成多个子带信号,特征量计算电路使用分割后的多个子带信号和输入信号中的至少任何一个来计算特征量,高频子带功率估计电路基于计算出的特征量来计算高频子带功率的估计值,以及高频信号生成电路基于由带通滤波器所分割的多个子带信号和有高频子带功率估计电路所计算的高频子带功率来生成高频信号分量。频带扩展装置使用由高频信号生成电路所生成的高频信号分量来对输入信号的频带进行扩展。本发明可以应用至例如频带扩展装置、编码装置、解码装置等。
文档编号G10L19/02GK103155031SQ201180048799
公开日2013年6月12日 申请日期2011年10月5日 优先权日2010年10月15日
发明者山本优树, 知念彻 申请人:索尼公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1