编码方法、解码方法、编码装置、解码装置以及程序的制作方法

文档序号：9616944阅读：484来源：国知局

编码方法、解码方法、编码装置、解码装置以及程序的制作方法
【专利说明】
[0001] 本发明是以下专利申请的分案申请：【申请号】201180005221. 2,申请日：2011年01 月07日，发明名称：编码方法、解码方法、编码装置、解码装置、程序以及记录介质。
技术领域
[0002] 本发明涉及编码技术，尤其涉及基音周期的编码技术。
【背景技术】
[0003] 将语音信号或者声响信号等时序信号以低比特进行编码的以往方式之一有以下方式：求出编码对象的基音周期（pitchperiod)后进行编码（例如，参照非专利文献1)。以下，以在移动电话等中利用的CELP(Code-ExcitedLinearPrediction:码激励线性预测）方式为例，例示求出基音周期后进行编码的以往方式。
[0004] 图1是用于说明以往的CELP方式的一例的方框图。
[0005] 对编码装置91输入以作为规定的时间区间的帧为单位分割的语音信号或者声响信号等的时序信号x(n) 〇! = 〇、……、L-1，L是2以上的整数）。线性预测分析单元911 进行属于当前帧的各时刻η= 0、......L-1中的时序信号χ(η)(η= 0、......、L_l)的线性预测分析，并生成用于确定在该当前帧中的全极型的合成滤波器915的线性预测信息LPC info。例如，线性预测分析单元911算出当前帧的时序信号χ(η)(η= 0、......、L_l)中的线性预测系数a(m)(m= 1、……、P，P是作为正整数的线性预测系数），并将线性预测系数a(m)(m= 1、......、P)变换为线谱对系数（linespectrumpaircoefficients)LSP，并作为线性预测信息LPCinfo而输出线谱对系数LSP的量化值。
[0006]固定码本914按照检索单元913的控制，输出信号分量c(n)(η= 0、......、L_1)，所述信号分量c(η)(η= 0、……、L-1)由具有由非零的单位脉冲与其正负的组合所组成的值的一个以上的信号、以及具有零值的一个以上的信号构成。此外，在自适应码本912中存储在过去的各个时刻生成的激励信号，自适应码本912输出利用根据在检索单元913中求出的基音周期T而延迟后的激励信号而获得的自适应信号分量ν(η)(η= 0、……、L-1)。与来自固定码本914的信号分量c(η)(η= 0、……、L_l)、以及来自自适应码本192的自适应信号分量v(η)(η= 0、......、L-1)对应的当前帧的激励信号可如下表现。
[0007] u(n) =gp ·v(n) +gc ·c(η)(η= 0, · · ·，L-1)…（1)
[0008] 另外，gp是提供给自适应分量ν(η)的基音增益，g。是提供给信号分量c(n)的固定码本增益。
[0009]检索单元913检索基音周期T、信号分量c(η)(η= 0、……、L_1)、基音增益gp与固定码本增益g。，使得对将由线性预测信息LPCinfo确定的全极型的合成滤波器915应用于激励信号u(η)(η= 0、……、L-1)而获得的合成信号X'（η)(η= 0、……、L_1)、与输入的时序信号X(η)(η= 0、……、L-1，将各个η称为采样点）之间的差，应用了听觉加权滤波器916的值成为最小。检索单元913输出激励参数，所述激励参数包含基音周期Τ、用于确定信号分量c(η)(η= 0、......、L-1)的码索引Cf、基音增益gp、固定码本增益g。。
[0010] 这里，线性预测信息LPCinfo在每一帧被更新，基音周期T、码索引Cf、基音增益 gp、固定码本增益g。在将一个帧进行分割后的每个子帧被更新。如果每一个帧的子帧数目是一个，则虽然激励参数等信息量少，但是无法跟随时序信号X(η)(η= 0、……、L-1)的时间变化，因此编码失真较大。如果每一个帧的子帧数目多，则起到相反的效果，但即使过多，质量的改善也会饱和，只会导致信息量增多。以下，表示将一个帧等分为4个子帧的例子。此外，将通过从帧的开头起数的第1、2、3、4个的各子帧（称为第1、2、3、4子帧）求出的码索引Cf分别表示为Cfl、Cf2、Cf3、Cf4。此外，将通过第1、2、3、4子帧求出的基音增益gp分别表示为gpl、gp2、gp；5、gP4,将固定码本增益g。分别表示为gel、gd、gd、grf，将基音增益与固定码本增益总称为激励增益。此外，将通过第1、2、3、4子帧求出的基音周期T分别表示为1\、 T2、T3、T4。此外，基音周期T不仅有仅通过采样点η的间隔的整数倍来表现的情况（整数精度），有时还利用采样点η的间隔的整数倍与小数值（分数值）来表现（小数精度）。例如，当以通过两个比特来表现小数值的小数精度表现周期Τ时，通过Tint-l/4、Tint、Tint+l/4、 Tint+l/2(Tint是整数）这四种来表现基音周期T。此外，当利用小数精度的基音周期T来表现自适应信号分量v(η)时，使用插补滤波器，所述插补滤波器对根据基音周期T而延迟的多个激励信号进行加权平均操作。
[0011] 基音周期Τ、码索引Cf、基音增益gp、以及固定码本增益g。等的激励参数被输入到参数编码单元917,参数编码单元917生成并输出与这些对应的码即比特流BS。有时通过用于对基音增益与固定码本增益的对选择最佳的码的矢量量化，对基音增益gp与固定码本增益gc进行编码。
[0012] 图2A是用于例示使用小数精度的基音周期T时的比特流BS的结构的图，图2B是用于说明与小数精度的基音周期T对应的码的图。图3是说明用于表现基音周期T的精度 (周期精度）的图。
[0013] 如图2A以及图2B所示，在使用小数精度的基音周期T时，生成与各基音周期T= ?\、T2、T3、T4的整数部与小数部对应的码。在图2A以及图2B的例子，在第1、第3子帧中，分别分配9个比特用于基音周期，且第1、第3子帧的基音周期?\、Τ3的值（从基音周期的最低值的差分）通过不依赖于其他的子帧的基音周期的编码方式分别独立地被编码（基音周期部）。将如上那样某子帧的基音周期通过不依赖于其他的子帧的基音周期的编码方式被独立编码的情况称为"对每个子帧单独"编码。一般，基音周期Τ越短，利用越小数精度表现较理想。在图3的例子中，当基音周期Τ的整数部是最小值Τ_以上且比ΤΑ小时，通过以两个比特来表现小数值的小数精度表现基音周期Τ(4倍小数精度），当基音周期Τ的整数部为从!\至ΤΒ时，通过以一个比特来表现小数值的小数精度表现基音周期Τ(2倍小数精度），当基音周期Τ的整数部为从ΤΒ至最大值Τ_时，仅通过采样点η的间隔的整数倍来表现基音周期Τ(整数精度）。
[0014] 另一方面，在第2、第4子帧（图2Α以及Β)中，分别通过四个比特对第2、第4子帧的基音周期τ2、Τ4的整数部分别与第1、第3子帧的基音周期Ti、Τ3的整数部之间的差分值进行编码（差分整数部），且与差分整数部的值无关地分别通过两个比特对基音周期Τ2、 Τ4的小数点以下的值（小数部）进行编码而（4倍小数精度）。另外，基音周期Τ2、Τ4是在能够将其各自的整数部与基音周期?\、Τ3各自的整数部的差分值通过四个比特进行编码的范围内检索的值。即，基音周期Τ2、1\是在其各自的整数部成为从基音周期Τρ1~3的整数部的值-8至基音周期?\、T3的整数部的值+7的范围的范围内检索的值。
[0015] 从编码装置91(图1)的参数编码单元917输出的比特流BS被输入到解码装置92 的参数解码单元927。参数解码单元927对比特流BS进行解码，并输出据此获得的码索引 Cf=Cfl、Cf2、Cf3、Cf4、基音增益gp' =gpl'、gp2'、gp3'、gp4'、固定码本增益g/ =g。/、gc2'、 &3'、&4'、基音周期！''=1' 1'、1'2'、1'3'、1'4'以及线性预测信息1^11^〇。
[0016]固定码本924输出通过码索引Cf来确定的信号分量c'（η)(n= 0、……、L_1)，自适应码本922输出通过基音周期Τ'确定的自适应信号分量ν'（η)(η= 0、……、L_1)。然后，将对信号分量c'（η)(η= 0、……、L-1)乘以固定码本增益g。'的值与对自适应信号分量ν'（η)(η= 0、……、L-1)乘以基音增益gp'的值之和即激励信号u'（η)(η= 0、……、 L-1)追加到自适应码本922。此外，对激励信号u'（η)(η= 0、……、L_l)应用通过线性预测信息LPCinfo确定的全极型的合成滤波器925,输出据此生成的合成信号X'（η)(η= 0、......、L-l)〇
[0017] 现有技术文献
[0018] 非专利文献
[0019] 非专利文献 1:3rdGenerationPartnershipProject(3GPP)，Technical Specification(TS)26. 090,"AMRspeechcodec；Transcodingfunctions"，Versi on4. 0. 0(2001-03)

【发明内容】

[0020] 发明要解决的课题
[0021] 在以往的CELP方式中，分配固定比特用于在各子帧的基音周期的编码而进行编码。这样的情况并不限定于CELP方式，求出编码对象的基音周期后进行编码的其他的现有方式也一样。
[0022] 在本发明中，通过对基音周期的编码方法下功夫从而提高压缩效率。
[0023] 用于解决课题的方法
[0024] 在本发明的编码处理中，算出与规定时间区间中包含的时序信号对应的基音周期，并输出与基音周期对应的码。此时，根据用于表示时序信号的周期性和/或稳态性的高低的指标是否满足用于表示周期性和/或稳态性高的条件、或者用于表示周期性和/或稳态性低的条件，切换用于表现基音周期的精度和/或基音周期的编码方式。
[0025] 在与此相对的解码处理中，输入与规定时间区间对应的码，根据码中包含的或者从码获得的用于表示周期性和/或稳态性的高低的指标是否满足用于表示周期性和/或稳态性高的条件、或者用于表示周期性和/或稳态性低的条件，切换在码中包含的与基音周期对应的码的解码方式，对与基音周期对应的码进行解码，从而获得与规定时间区间对应的基音周期。
[0026] 发明效果
[0027] 在本发明中，在求出编码对象的基音周期后进行编码的方式中，根据时序信号的周期性和稳态性，切换用于表现基音周期的精度和/或基音周期的编码方式，因此能够提高基音周期的压缩效率。
【附图说明】
[0028] 图1是用于说明以往的CELP方式的一例的方框图。
[0029] 图2A是用于例示在利用小数精度的基音周期T时的比特流BS的结构的图。图2B 是用于说明与小数精度的基音周期T对应的码的图。
[0030] 图3是用于说明基音周期的小数部的编码方法的图。
[0031] 图4是用于说明实施方式的编码装置以及解码装置的方框图。
[0032] 图5是用于说明实施方式的参数编码单元的方框图。
[0033] 图6是用于说明实施方式的参数解码单元的方框图。
[0034] 图7A是用于说明实施方式的编码方法的流程图。图7B是用于说明实施方式的解码方法的流程图。
[0035] 图8A以及图8B是用于说明与基音周期对应的码的结构例的图。
[0036] 图9A是用于说明与基音周期对应的码的结构例的图。图9B是用于说明与第2以及第4子帧的基音周期的整数部对应的可变长度码的图。
[0037] 图10A是用于例示在时序信号是稳态（周期性）时的、第3实施方式中的基音周期的编码方法的图。图10B以及图10C是用于例示第3子帧的基音周期的码X3的图。
[0038] 图11是例示了帧与超帧之间关系的图。
[0039] 图12A以及B是用于例示在时序信号是稳态（周期性）时的、第4实施方式中的基音周期的编码方法的图。
[0040] 图13是用于说明第5实施方式的编码方法的流程图。
[0041] 图14是用于说明第5实施方式的解码方法的流程图。
[0042] 图15A是用于说明基音周期的编码方法的变形例的图。图15B是用于说明与第2 以及第4子帧的基音周期的整数部对应的可变长度码的图。
[0043] 图16A~图16C是用于说明基音周期的编码方法的变形例的图。
[0044] 图17A是用于说明基音周期的编码方法的变形例的图。图17B是用于说明与第2 以及第4子帧的基音周期的整数部对应的可变长度码的图。
【具体实施方式】
[0045] 以下，参照【附图说明】本发明的实施方式。另外，虽然本发明能够应用于求出编码对象的基音周期后进行编码的全部方式，但以下举例说明对CELP方式应用本发明的情况。此外，以下表示将一个帧等分成四个子帧的例子，但这并不限定本发明。此外，以下着重说明与已经说明的事项之间的不同点，对于已经说明的事项省略重复说明。
[0046][第1实施方式]
[0047] 首先，说明本发明的第1实施方式。
[0048]在时序信号X(η)(η= 0、……、L_l)的稳态性低的（称为"非稳态"）帧，时序信号x(n)(η= 〇、……、L-1)的周期性也低（称为"非周期性"），周期性分量在码整体所占的贡献较少。因此，即使降低用于表现基音周期T的精度、编码频度（进行编码的帧的频度），编码质量（解码后的合成信号相对于编码前的时序信号的质量）并不那么下降。因此，在第1实施方式中，在非稳态（非周期性）的帧中，降低用于表现基音周期T的精度、编码频度。由此，减少每个帧的平均码量。其结果，例如，能够降低平均比特率，或者能够通过将能够节省的信息例如分配给来自固定码本的信号分量的码的码长度的增加而提高质量。
[0049] 〈结构〉
[0050] 图4是用于说明实施方式的编码装置以及解码装置的方框图。图5是用于说明实施方式的参数编码单元的方框图。此外，图6是用于说明实施方式的参数解码单元的方框图。
[0051] 如图4至图6例示那样，第1实施方式的编码装置11与以往的编码装置91的不同点在于，参数编码单元917被置换为参数编码单元117。此外，第1实施方式的解码装置 12与以往的解码装置92的不同点在于，参数解码单元927被置换为参数解码单元127。
[0052] 如图5例示那样，本方式的参数编码单元117具有增益量化单元117a、判定单元 117b、开关单元117c、117f、基音周期编码单元117d、117e、以及合成单元117g。此外，如图 6例示那样，本方式的参数解码单元127具有判定单元127b、开关单元127c、127f、增益周期解码单元127d、127e、以及分离单元127g。
[0053] 另外，本方式的编码装置11以及解码装置12是通过对例如具有CPU(中央处理单元）、RAM(随机存取存储器）、R0M(只读存储器）等的公知的计算机或者专用的计算机读入程序和数据而构成的特别的装置。此外，编码装置11以及解码装置12的处理单元的至少一部分也可以由集成电路等的硬件来构成。
[0054] 〈编码方法〉
[0055] 图7A是用于说明实施方式的编码方法的流程图。以下，着重说明与现有技术之间的不同点。
[0056] 线性预测分析单元911对当前帧生成的线性预测信息LPCinfo、检索单元913对属于当前帧的第1~第4子帧生成的码索引Cf=Cfl、Cf2、Cf3、Cf4、基音增益gp=gpl、gp2、 gP；5、gp4、固定码本增益gc=g。1、gd、gd、grf、基音周期T =VT2、T3、输入到参数编码单元 117(图 5)。
[0057] 参数编码单元117的增益量化单元117a对基音增益gp=gpl、gp2、gp3、gp4以及固定码本增益gc=gcl、gc2、gc3、gc4进行量化，并输出用于确定量化后的基音增益gp' =gpl'、 gp2'、gp3'、gp/的索引等的码以及用于确定量化后的固定码本增益=gcl'、&2'、&3'、grf' 的索引等的码。
[0058] 另外，基音增益gp=gpl、gp2、gp3、gp4与固定码本增益gc=gcl、gc2、gc3、gc4可以单独被量化，但也可以对基音增益与固定码本增益的组合进行矢量量化。当对基音增益与固定码本增益的组合进行矢量量化时，基音增益的量化值（已量化基音增益）与固定码本增益的量化值（已量化固定码本增益）的组合与索引等的码相关联。将通过这样的矢量量化获得的量化后的基音增益与量化后的固定码本增益的组称为"已量化增益矢量"，将通过矢量量化获得的码称为"已矢量量化增益码（VQ增益码）"。在这样的矢量量化中，例如可以对对应于相同的子帧的基音增益的量化值与固定码本增益的量化值的每个组合相关联一个 VQ增益码，也可以对对应于多个子帧的每个子帧的基音增益的量化值与固定码本增益的量化值的每个组合相关联一个VQ增益码，也可以对对应于相同的帧的基音增益的量化值与固定码本增益的量化值的每个组合相关联一个VQ增益码。
[0059] 在这样的矢量量化中，例如使用用于确定对应于基音增益的量化值与固定码本增益的量化值的组合的VQ增益码的表格（二维码本）。二维码本的例子是对基音增益的量化值以及固定码本增益的量化值的组合相关联VQ增益码的表格。二维码本的其他的例子是对基音增益的量化值以及固定码本增益对应值的量化值的组合相关联VQ增益码的表格。固定码本增益对应值的例子是用于表示以过去的子帧（或者帧）中的来自固定码本914的信号分量的能量为基础预测的当前的子帧（或者帧）中的固定码本增益的估计值、与当前的子帧（或者帧）中的固定码本增益之比的校正系数（correctionfactor)等。校正系数的例子是在参考文献 1《ITU-TRecommendationG. 729，"CodingofSpeechat8kbit/s usingConjugate-StructureAlgebraic-Code-ExcitedLinear-Prediction(CS-ACELP)'，〉〉的"3. 9Quantizationofthegains"的栏里记载的γ。例如，在子帧j= 1、......、4中的固定码本增益g<y、矫正系数γ、子帧j= 1、......、4中的固定码本增益的估计值pgq之间成立以下的关系。
[0060] gcj=γXpgcj
[0061] 二维码本可以由一个表格构成，也可以如参考文献1的两级的共辄结构码本 (two-stageconjugatestructuredcodebook)那样由多个表格构成。当二维码本由多个表格构成时，对应于基音增益的量化值与固定码本增益的量化值的组合的VQ增益码例如是对于基音增益的量化值与固定码本增益的量化值的组合，对构成该二维码本的每个表格决定的索引的组合等（步骤S111)。
[0062] 接着，判定单元117b判定当前帧的时序信号X(η)(η= 0、......、L_1)是否为稳态 (步骤S112)。步骤S112的判定根据表示时序信号χ(η)(η= 0、……、L_1)的稳态性的高低的指标是否满足认为时序信号的稳态性高的条件来进行。以下，例示具体的判断方法。
[0063] [步骤S112的具体例1]
[0064] 在步骤S112的具体例1中，作为用于表示时序信号χ(η)(η= 0、......、L_1)的稳态性的高低的指标，使用用于表示时序信号x(η)(η= 0、……、L-1)的大小相对于对该时序信号x(n)(η= 0、……、L-1)进行线性预测分析后获得的预测残差的大小的比的指标。此外，作为表示时序信号X(η)(η= 0、……、L-1)的稳态性高的条件，使用用于表示该时序信号χ(η)(η= 0、......、L-1)的大小相对于对该时序信号χ(η)(η= 0、......、L_1)进行线性预测分析后获得的预测残差的大小的比的指标比规定值大这样的条件。这一点基于在稳态的帧中能够进行效果较佳的线性预测，因此预测残差变小，时序信号x(n)(η= 0、……、 L-1)的大小相对于预测残差的大小的比变大。
[0065]用于表示时序信号χ(η)(η= 0、......、L_l)的大小相对于对该时序信号χ(η)(η =〇、……、L-1)进行线性预测分析后获得的预测残差的大小的比的指标的例子是该时序信号x(n)(n= 0、……、L-1)的能量相对于预测残差的能量的比即预测增益的估计值。
[0066] [数 1]
[0067]
[0068] 其中，式⑵的k"是根据线性预测信息LPCinfo确定的m次的PARC0R系数。此时，例如，对判定单元117b输

完整全部详细技术资料下载

当前第1页1 2 3 4 5 6

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：守谷健弘;原田登;鎌本优;
技术所有人：日本电信电话株式会社;
我是此专利的发明人

上一篇：音频信号编码方法和系统的制作方法
上一篇：交叉加性扩频音频水印嵌入方法、检测方法及系统的制作方法