码激励线性预测编码装置的制作方法

文档序号:2819927阅读:291来源:国知局
专利名称:码激励线性预测编码装置的制作方法
技术领域
本发明涉及码激励线性预测编码(CELP)装置,特别是,涉及考虑了非声音信号区间内的音响信号影响的装置。
当对声音进行编码和解码时,对声音区间和声音区间以外的无声或噪声区间进行了相同的处理。作为声音的编码方法例如有下述文献中所公开的。
文献PIEEE ICASSP,1990年,P.461-464,Gerson和Jasiuk著“Vector Sum Excited Linear Prediction(VSELP)Speech coding at8kbps[速率为8Kb/s时的矢量和激励的线性预测(VSELP)语音编码]”。
该文献描述了作为当前北美数字移动通信用声音编码方式的标准而确定下来的VSELP方式。日本数字移动通信用声音编码方式也采用了同样的方式。
但是,CELP系统编码器的构成注重声音区间的编码特性,而在对噪声编码、解码时,合成声音变得不自然,影响听觉。
在利用CELP系统编码器编码、以后又解码了的合成声音中的噪声区间内用于激励源的码簿是对声音部分最佳化的,由于从LPC分析(线性预测分析)得到的频谱估计误差每帧都不一样等缘故,所以,变成为偏离了编码前噪声的不自然的声音,从而变成为使通话质量劣化的原因了。
根据上述原因,要求提供特别是能够降低对非声音信号区间内的音响信号(噪声、转动声和振动声等)编码输出的影响、能够良好地进行声音再生的码激励线性预测编码装置。
因此,根据本发明的第一方面的码激励线性预测编码装置具有从输入音响信号求出自相关信息(例如,自相关矩阵或自相关系数等)的“自相关分析装置”;从上述自相关分析装置的分析结果求出声道预测系数的“声道预测系数分析装置”;从上述声道预测系数求出预测增益系数的“预测增益系数分析装置”;从上述输入音响信号、上述声道预测系数和上述预测增益系数检出输入音响信号的非声音信号区间、调节该非声音信号区间内的上述自相关信息的“自相关调节装置”;从上述调节后的自相关信息得到补偿了非声音信号区间内声道预测系数的补偿后声道预测系数的“声道预测系数补偿装置”;利用上述补偿后声道预测系数和自适应激励信号、对输入音响信号进行码激励线性预测编码的“编码装置”,解决了上述课题。
再者,上述声道预测系数分析装置的声道预测系数能够利用例如LPC(线性分析编码)求出。上述预测增益系数也能够例如作为声道反射系数求出。通过上述自相关调节装置,能够通过例如把以前判定为噪声区间的自相关信息与当前帧的自相关信息组合起来,得到使噪声降低那样地调节了的自相关信息。
通过从该调节了的自相关信息求出非声音信号区间内的声道预测系数,得到对非声音信号区间音响信号(例如,噪声)进行了补偿的补偿后声道预测系数。通过利用自适应于该补偿后声道预测系数的码薄的自适应激励信号、对输入音响信号进行码激励线性预测编码,与过去相比,能够特别适用于降低非声音信号区间内编码输出的噪声。
还有,根据本发明的第二方面的码激励线性预测编码装置具有从输入音响信号求出自相关信息的“自相关分析装置”;从上述自相关分析装置的分析结果求出声道预测系数的“声道预测系数分析装置”;从上述声道预测系数求出预测增益系数的“预测增益系数分析装置”;与从上述声道预测系数求出LSP(线状频谱对)系数同时从上述输入音响信号、上述声道预测系数和上述预测增益系数检出输入音响信号的非声音信号区间、调节该非声音信号区间内的上述LSP系数的“ LSP系数调节装置”;从上述调节后的LSP系数得到补偿了非声音信号区间内的声道预测系数的补偿后声道预测系数的“声道预测系数补偿装置”;利用上述补偿后声道预测系数和自适应激励信号、对输入音响信号进行码激励线性预测编码的“编码装置”,解决了上述课题。
再者,为了降低非声音信号区间内音响信号的影响,从声道预测系数变换成LSP系数,通过在该LSP系数的阶段中还参考以前帧的LSP系数来调节LSP系数,容易得到对声音区间内频谱变动抑制了频谱变动的LSP系数,最后,从LSP系数变换成声道预测系数,通过利用自适应码簿的自适应激励信号等、对输入音响信号进行码激励线性预测编码,与过去相比,能够特别适用于降低非声音信号区间内编码输出的噪声。
又,根据本发明的第三方面的码激励线性预测编码装置具有从输入音响信号求出自相关矩阵或自相关系数的“自相关分析装置”;从上述自相关分析装置的分析结果求出声道预测系数的“声道预测系数分析装置”;从上述声道预测系数求出预测增益系数的“预测增益系数分析装置”;从上述输入音响信号、上述预测增益系数和上述声道预测系数检出非声音信号区间、调节该非声音信号区间内的上述声道预测系数、得到调节后声道预测系数的“声道系数调制装置”;利用上述调节后声道预测系数和自适应激励信号对输入音响信号进行码激励线性预测编码的“编码装置”,解决了上述课题。
在这样的构成中,因为是利用以前非声音信号区间内的声道预测系数直接求出非声音信号区间内的上述声道预测系数的,所以,以非常小的运算量就能够降低非声音信号区间内音响信号的影响那样地进行编码。
进而还有,根据本发明第四方面的码激励线性预测编码装置具有从输入音响信号求出自相关信息的“自相关分析装置”;从上述自相关分析装置的分析结果求出声道预测系数的“声道预测系数分析装置”;从上述声道预测系数求出预测增益系数的“预测增益系数分析装置”;从对上述输入音响信号进行带通处理以后得到的带通处理信号和上述预测增益系数检出非声音信号区间、对该非声音信号区间进行信号分析产生用来消除噪声的滤波系数、利用上述滤波系数对上述输入音响信号进行噪声消除并产生用来产生合成声音信号的目标信号的“噪声消除装置”;利用上述声道预测系数产生上述合成声音信号的“合成声音发生装置”;利用上述声道预测系数和上述目标信号对输入音响信号进行码激励线性预测编码的“编码装置”,解决了上述课题。
再者,上述噪声消除装置由滤波器构成以便从输入音响信号中把非声音信号区间内的噪声消除,通过利用声道预测系数、预测增益系数和通带处理信号求出该滤波器的滤波系数,能够得到已消除了噪声的目标信号。从而,通过使用该消除了噪声后的目标信号进行码激励线性预测编码,能够得到消除了非声音信号区间内噪声影响的编码输出。


图1为本发明第一实施形态的CELP编码装置的功能构成图;图2为本发明第二实施形态的CELP编码装置的功能构成图;图3为本发明第三实施形态的CELP编码装置的功能构成图;图4为本发明第四实施形态的CELP编码装置的功能构成图。
符号的说明100…输入端子 101…帧功率计算单元102…自相关矩阵计算单元 103…LPC分析单元104…合成滤波器 105…自适应码簿106…噪声码簿 107…增益码簿108…加权距离计算单元 109…LSP量化器110…声音或噪声判定单元 111…自相关矩阵调节单元112…预测增益计算单元 113、114…乘法器115、116…加法器117…量化器下面,利用附图,说明本发明适用的实施形态。
在本发明的实施形态中,首先,(1)构成为在判定帧是声音还是噪声的基础上,利用自相关矩阵、或LSP系数、或直接预测系数来调节合成滤波系数从而削减在噪声区间内不自然的异常声音。
(2)进而构成为在判定帧是声音还是噪声的基础上,对用于选择最佳码矢量的目标信号进行滤波处理从而降低噪声。
第一实施形态(A)具体地讲这样来构成,在噪声区间异常声音抑制型的CELP系统声音编码器中,以帧为单位把输入信号分成声音和噪声,通过把当前噪声区间帧的自相关矩阵与相连的以前噪声区间帧的自相关矩阵组合起来计算新的自相关矩阵,利用新的自相关矩阵进行LPC分析,求出合成的滤波系数进行量化并发送到解码器上,利用上述合成滤波系数检索最佳码簿矢量。
其次,说明实现上述(A)的构成的详细结构。图1为CELP编码装置的功能构成图。图1中,CELP编码装置由帧功率计算单元101、自相关计算单元102、LPC分析单元103、合成滤波器104、自适应码簿105、噪声码簿106、增益码簿107、加权距离计算单元108、LSP量化器109、声音或噪声判定单元110、自相关矩阵调节单元111、预测增益计算单元112、乘法器113和114、加法器115、减法器116、量化器117、多路复用单元130构成。
图1的构成中具有特征的部分是这样的部分,这些部分特别地修正由自相关矩阵计算单元102、声音或噪声判定单元110、自相关矩阵调节单元111、LPC分析单元103得到的声道系数,从而消除过去通过对声音区间以外的噪声部分进行CELP编码而再生出刺耳声音的原因。
“帧功率计算单元101”一接受以帧为单位归纳的、作为原信号(原信号是作为矢量输入的)矢量的输入声音数字信号(声音矢量信号)S,就求出帧功率并将其作为帧功率信号P提供到多路复用单元130上。“自相关矩阵计算单元102”一接受上述以帧为单位的输入声音数字信号S,就求出用于求出声道系数的自相关矩阵R,将其提供到LPC分析单元103和自相关矩阵调节单元111上。
“LPC分析单元103”从自相关矩阵R求出声道预测系数a,将其提供到预测增益计算单元112上,同时,一接受来自自相关矩阵调节单元111的自相关矩阵Ra,就求出通过上述自相关矩阵Ra对上述声道预测系数a进行了修正的最佳声道预测系数aa,将其提供到合成滤波器104和LSP量化器109上。
“预测增益计算单元112”从上述声道预测系数a变换成反射系数,从该反射系数求出预测增益,将其作为预测增益信号Pg提供到声音或噪声判定单元110上。该“声音或噪声判定单元110”从自适应码簿105接受间距系数信号Ptch,同时,还根据以帧为单位的上述输入声音数字信号S、上述声道预测系数a和上述预测增益信号Pg,判定帧信号S是声音信号还是声音信号以外的噪声信号,把声音/噪声判定信号r提供到自相关矩阵调节单元111上。
“自相关矩阵调节单元111”是特别重要的功能部分,在只当判定为噪声时才进行的处理中,一接受上述自相关矩阵R、上述声音/噪声判定信号V和上述声道预测系数a,就通过“以前判定为噪声的区间自相关矩阵”与“当前噪声帧的自相关矩阵”的组合,求出新的自相关矩阵Ra,提供到LPC分析单元103上。
“自适应码簿105”是预先在其内部具有多个周期性的自适应激励矢量的码簿,在这些自适应激励矢量上分别提供一个索引号Ip,通过从加权距离计算单元108指定的最佳索引号Ip输出自适应激励信号矢量ea,将其提供到乘法器113上,同时,输出间距信号ptch(输入声音信号S与最佳自适应激励矢量信号ea的归一化互相关信号),将其提供到声音或噪声判定单元110上。还有,该自适应码簿105内部的自适应激励矢量信号通过来自加法器115的输出激励矢量信号ex中的最佳激励矢量信号exop来更新。
“噪声码簿106”是预先在其内部具有多个噪声性激励矢量信号的码簿,在这些噪声性激励矢量信号上分别提供一个索引号Is,通过由加权距离计算单元108指定的最佳索引号Is输出噪声性激励矢量信号es,将其提供到乘法器114上。
“增益码簿107”预先存储着对上述自适应激励矢量信号和噪声性激励矢量的增益(Gain)码,在这些增益码上分别提供一个索引号Ig,通过从加权距离计算单元108指定的最佳索引号Ig,对自适应激励矢量信号输出增益码信号ga并将其提供到乘法器113上,对噪声性激励矢量信号输出增益码信号gs并将其提供到乘法器114上。
“自适应码簿105一侧的乘法器113”把上述自适应激励矢量信号ea与增益码信号ga相乘,作为最佳增益(大小)的自适应激励矢量信号提供到加法器115上。“噪声码簿106一侧的乘法器114”把噪声激励矢量信号es与增益码信号gs相乘,作为最佳增益(大小)的噪声性激励矢量信号提供到加法器115上。“加法器115”把上述作为最佳增益的自适应激励矢量信号与上述作为最佳增益的噪声性激励矢量信号相加,把激励矢量信号ex提供到合成滤波器104上,同时,把利用加权距离计算单元108计算的使平方和E为最小的最佳激励矢量信号exOP反馈到自适应码簿105上,更新以后存储起来。
“合成滤波器104”可由IIR(无限脉冲响应,循环型)型数字滤波电路构成,从上述修正后的最佳声道预测系数aa和来自加法器115的激励矢量(激励信号)ex产生合成声音矢量信号sw(合成声音信号),将其提供到减法器116上。即,对于IIR型数字滤波器,把上述修正后的最佳声道预测系数aa作为滤波(抽头)系数、对激励矢量信号ex进行滤波处理,得到合成声音矢量信号sw。减法器116把输入声音数字信号S与合成声音矢量信号sw相减,把该相减结果作为误差矢量信号e提供到加权距离计算单元108上。
“加权距离计算单元108”一接受来自减法器116的误差矢量信号e,就对该误差矢量信号e进行频率变换和加权。求出加权以后矢量信号的平方和,求出适合于自适应激励矢量信号、噪声激励矢量信号和增益码信号的最佳索引号Ia、Is、Ig,使得通过该平方和得到矢量信号E为最小,将其提供到自适应码簿105、噪声码簿106和增益码簿107上。
“增益码用的量化器117”把增益码信号ga和gs量化,将其作为增益码量化信号提供到多路复用单元130上。“LSP量化器109”通过噪声消除处理,对最佳地修正了的声道预测系数aa进行LSP量化,把声道预测系数量化信号<aa>提供到多路复用单元130上。
“多路复用单元130”把上述帧功率信号P、增益码量化信号、声道预测系数量化信号<aa>、自适应激励矢量选择用的索引号Ip、增益码选择用的索引号Ig和噪声性激励矢量选择用的索引号Is多路复用,把通过该多路复用得到的多路复用数据作为CELP编码装置的编码数据输出。
(操作)在帧功率计算单元101中,求出提供到输入端子100上的输入声音数据信号S的以帧为单位的功率,将其作为帧功率信号P提供到多路复用单元130上。同时,把上述声音数字信号S提供到自相关矩阵单元102上,求出自相关矩阵R,又把该自相关矩阵R提供到自相关矩阵调节单元111上。还把上述输入声音矢量信号S提供到声音或噪声判定单元110上,在这里,虽然是判定输入声音数字信号S是声音还是声音以外的噪声,但是,在该判定中,还使用其它间距信号、声道预测系数a、预测增益信号Pg等。
在LPC分析单元103中,从在自相关矩阵计算单元102中求出的自相关矩阵R求出声道预测系数a,在预测增益计算单元112中,从该声道预测系数a求出预测增益信号Pg,将其与声道预测系数a一起提供到声音或噪声判定单元110上。使用从自适应码簿105提供的间距信号ptch、声道预测系数a、预测增益信号Pg和输入数字信号S,在声音或噪声判定单元110中判定输入声音数字信号S是声音信号还是噪声信号,把声音/噪声判定信号V提供到自相关矩阵调节单元111上。
在自相关矩阵调节单元111中,通过以前判定为噪声的区间的自相关矩阵与当前帧自相关矩阵的组合,从自相关矩阵R、声道预测系数a、声音/噪声判定信号V求出新的自相关矩阵Ra。由此,最佳地修正了对变成为刺耳原因的噪声部分的自相关矩阵。
把新的自相关矩阵Ra提供到LPC分析单元103上,在这里,求出新的最佳声道预测系数aa,将其提供到合成滤波器104上。把新的最佳声道预测系数aa作为对IIR型数字滤波器的滤波系数提供到合成滤波器104上,在这里,对激励矢量信号ex进行滤波处理,得到合成声音矢量信号sw。
在减法器中,求出该合成声音矢量信号sw与输入声音数字信号S之差,把该差信号作为误差矢量信号e提供到加权距离计算单元108上。在加权距离计算单元108中,对该误差矢量信号e进行频率变换和加权,求出使得平方和矢量信号E为最小那样的最佳的自适应激励矢量信号、噪声激励矢量信号和增益码信号的最佳索引号Ia、Is、Ig。把这些最佳索引号Ia、Is、Ig提供到多路复用单元130上,同时,为了得到最佳激励矢量ea、es和增益码信号ga、gs,还把它们提供到自适应码簿105、噪声码簿106、增益码簿107上。
把利用上述最佳索引号Ia读出的自适应激励矢量信号ea乘以利用索引号Ig读出的增益码信号ga以后,提供到加法器115上,同时,把利用上述最佳索引号Is读出的噪声性激励矢量信号es也乘以利用索引号Ig读出的增益码信号gs以后,提供到加法器115上。在加法器115中,把相乘后的两个信号相加,将其提供到激励矢量信号ex的合成滤波器104上,在这里,得到合成声音矢量信号sw。
这样,一直到合成声音矢量信号sw与输入声音数字信号S的误差不存在了,才使用了自适应码簿105、噪声码簿106和增益码簿107的声音矢量信号sw,还有,在声音以外的区间内,最佳地修正声道预测系数aa,产生合成声音矢量信号sw。
随时把通过上述那样的操作得到的帧功率信号P、增益码量化信号、声道预测系数量化信号<aa>、自适应激励矢量选择用的索引号Ip、增益码选择用的索引号Ig和噪声性激励矢量选择用的索引号Is多路复用以后,作为编码数据输出。
(声音或噪声判定单元110的详情)声音或噪声判定单元110“利用帧结构、分析参数等进行噪声区间的检出”。因此,首先,(1)把分析参数变换成反射系数r[i](i=i,…,NP,NP=滤波器的阶数)。再者,在这里,假定r[i]为-1.0<r[i]<1.0还有,(2)利用反射系数r[i],可以把预测增益RS表示为RS=∏(1.0-r[i]2) …(1)再者,在这里,i=1~NP。
反射系数r
表示分析帧信号频谱的斜率,|r
|越接近于0,可以说频谱越平。一般,噪声频谱比声音频谱的斜率小。还有,预测增益RS在有声区间内为接近于0的值,在无声或噪声区间内为接近于1.0的值。
还有,CELP编码装置在手持自适应电话装置等用途中,因为作为声源的人的嘴与作为信号输入单元的话筒之间的距离很近,所以,帧功率在声音区间内大,而在无声(噪声)区间内小。
因此,在声音或噪声的判定中,求出D=Pow·|r
|/RS…(2)对该值用Dth(阈值)进行判断,如果D>Dth,则判定为声音;如果D<Dth,则判定为噪声。
(自相关矩阵调节单元111的详情)其次,在以前若干帧、即m个帧连续判定为噪声时,才在上述自相关矩阵调节单元111中进行自相关矩阵尺的调节。假定,当前帧的自相关矩阵为R
,几个帧之前的噪声区间的自相关矩阵为R[n]时,则调节后噪声区间的自相关矩阵Radj可用下式表示Radj=∑(Wi·R[i]) …(3)i=0~m-1、∑Wi=1.0、Wi≥Wi+1≥0自相关矩阵调节单元111进行对应于上述计算的处理。调节单元111把通过该处理得到的自相关矩阵Radj提供到LPC分析单元103上。
(第一实施形态的效果)如果根据上述第一实施形态,在利用CELP系统编码装置把声音以外的输入信号编码的情况下,把输入信号以帧为单位分开,因受声道分析(频谱分析)的影响,分析结果与实际信号不同。还有,因为分析结果不同的程度每帧都有变动,所以,不但编码再解码以后的信号与原声音的频谱不同,而且,变成为刺耳的声音了。通过把用于进行频谱估计的自相关矩阵与以前噪声帧的矩阵组合起来,抑制帧间分析结果不同的程度,使防止刺耳合成声的产生成为可能。还有,因为人的听觉对变动部分的噪声比对恒定噪声区间敏感,所以,能够抑制噪声帧之间的频谱变动。
“第二实施形态”(B)在上述(A)的构成中进而构成为把噪声区间合成滤波系数变换成LSP(线状频谱对,Line Spectrum Pair),求出合成滤波器的频谱特性,通过把合成滤波器的频谱特性与以前的噪声区间合成滤波器的频谱特性相对照,求出抑制了频谱变动的新LSP系数,把新的LSP系数变换成合成滤波系数并量化以后,发送到解码器上,利用合成滤波系数检索最佳码簿矢量。
其次,说明实现上述(B)的构成的详细结构。图2为CELP编码装置的功能构成图。图2中,与上述图1不同的构成是特别用虚线围起来的部分。即,在“用虚线围起来的部分中”具有自相关矩阵计算单元102、LPC分析单元103A、声音或噪声判定单元110、预测增益计算单元112、声道系数/LSP变换单元119、LSP/声道系数变换单元120、LSP系数调节单元121。
因为上述用虚线围起来的部分以外为大致相同的构成,执行同样的操作,所以,“以上述用虚线围起来的部分为中心,对修正声道系数、消除过去因对声音期间以外的时间的噪声部分进行CELP编码而再生出刺耳声音的原因”进行描述。
因此,“声道系数/LSP变换单元119”从声道预测系数a变换成LSP系数I,将其提供到LSP系数调节单元121上。“LSP系数调节单元121”根据来自声音或噪声判定单元110的声音/噪声判定信号V和来自声道系数/LSP变换单元119的LSP系数I,进行LSP系数I的调节,降低噪声的影响,把已调节的LSP系数Ia提供到LSP/声道系数变换单元120上。
“LSP/声道系数变换单元120”把来自LSP系数调节单元121的“已调节的LSP系数Ia”变换成最佳声道预测系数aa,作为数字滤波系数提供到合成滤波器104上。
(LSP系数调节单元121的详情)在以前若干帧,即m个帧连续判定为噪声时,才进行上述LSP系数的调节。在这里,假定,当前帧的LSP系数为LSP-O[i],n个帧以前的噪声区间的LSP系数为LSP-n[i],并假定,i=1,…,NP,NP=滤波器的阶数时,则调节后的LSP系数可用下式表示LSPadj[i]=∑WK·LSP-k[i] …(4)在这里,K=0~m-1、∑WK=1.0、i=0~NP-1、WK≥WK+1≥0。
上述LSP系数为余弦领域的系数。进行对应于这样计算的处理。LSP系数调节单元121把通过该处理得到的LSP系数Ia提供到LSP/声道系数变换单元120上。
(操作)说明直到求出最佳声道预测系数aa的操作,有关依靠码簿的最佳激励矢量信号ex的产生,因为与上述第一实施形态相同,所以,省略其说明。因此,首先,把输入声音数字信号S提供到自相关矩阵单元102上,求出自相关矩阵R。把该自相关矩阵R提供到LRC分析单元103A上,求出声道预测系数a。把该声道预测系数a提供到预测增益计算单元112、声道系数/LSP变换单元119和声音或噪声判定单元110上。
由此,在预测增益计算单元112中,求出预测增益信号Pg,将其提供到声音或噪声判定单元110上。在声道系数/LSP变换单元119中,从声道预测系数a求出LSP系数I,将其提供到LSP系数调节单元121上。另一方面,声音或噪声判定部分110一接受声道预测系数a、输入声音矢量信号S、间距信号Ptch和预测增益信号Pg,就输出声音/噪声判定信号V,将其提供到LSP系数调节单元121上。利用该LSP系数调节单元121进行LSP系数I的调节,降低噪声的影响,把已调节的LSP系数Ia提供到LSP/声道系数变换单元120上。利用该LSP/声道系数变换单元120,把LSP系数Ia变换成最佳声道预测系数aa,将其提供到合成滤波器104上。
在这样构成的装置中,与过去相比,最佳地修正了噪声区间的声道预测系数,使得不产生成为刺耳声音源的编码信号。
(第二实施形态的效果)如果根据上述第二实施形态,通过调节与频谱直接有关的LSP系数,就能够得到与上述第一实施形态相同的效果,同时,因为不需要进行两次LPC分析,所以,可以减少运算量。
“第三实施形态”(c)在上述(A)的构成中进而构成为通过把噪声区间合成滤波系数内插到以前的噪声区间合成滤波系数中,直接求出当前噪声区间内新的合成滤波系数,把新的合成滤波系数量化以后,发送到解码器上,利用新的合成滤波系数检索最佳码簿矢量。
其次,说明实现上述(C)的构成的详细结构。图3为CELP编码装置的功能构成图。图3中,与上述图1不同的构成是特别用虚线围起来的部分。即,在“用虚线围起来的部分中”具有自相关矩阵计算单元102、LPC分析单元103A、声音或噪声判定单元110、预测增益计算单元112、声道系数调节单元126。
“声道系数调节单元126”从来自LPC分析单元103A的声道预测系数a和来自声音或噪声判定单元110的声音/噪声判定信号V中对声道预测系数进行调节使得能够降低噪声的影响,并把最佳的声道预测系数aa提供到合成滤波器104上。即,通过把声道预测系数a与以前噪声区间的声道预测系数组合起来,直接求出新的声道预测系数aa。
具体地讲,在以前若干帧,即m个帧连接判定为噪声时,才进行上述声道预测系数的调节。而且,假定,当前帧的合成滤波系数为a-0[i],n个帧以前的噪声区间合成滤波系数为a-n[i],并假定,i=1,…,NP,NP=滤波器的阶数时,则调节后的滤波系数可用下式表示aadj[i]=∑WK·(a-k)[i] …(5)再者,在这里,∑WK=1.0、WK=WK+1≥0、k=0~m-1、i=0~NP-1。
这时,必须确认利用了调节后系数的滤波器的稳定性,当判断为不稳定时最好控制成不进行调节。
(操作)说明直到求出最佳声道预测系数aa的操作,有关依靠码簿的最佳激励矢量信号ex的产生,因为与上述第一实施形态相同,所以,省略其说明。因此,首先,把输入声道矢量信号S提供到自相关矩阵单元102上,求出自相关矩阵R。把该自相关矩阵R提供到LPC分析单元103A上,求出声道预测系数a。把该声道预测系数a提供到预测增益计算单元112、声道系数调节单元126和声音或噪声判定单元110上。
在预测增益计算单元112中,从声道预测系数a求出预测增益系数Pg,将其提供到声音或噪声判定单元110上。在接受了输入声音数字信号S、预测增益系数Pg、声道预测系数a和间距信号Ptch的声音或噪声判定单元110中,进行声音/噪声区间的判定,求出声音/噪声判定信号V,将其提供到声道系数调节单元126上。在声道系数调节单元126中,从声音/噪声判定信号V和声道预测系数a求出使得噪声影响降低那样地调节了的最佳声道预测系数aa,将其提供到合成滤波器104上。
在这样构成的装置中,与过去相比,最佳地修正了噪声区间的声道预测系数,使得不产生成为刺耳声音源的编码信号。
(第三实施形态的效果)如果根据上述第三实施形态,通过把声道系数与紧接着的以前噪声区间的声道系数组合起来,就能够得到与上述第一实施形态相同的效果,同时,因为是直接计算出滤波系数的,所以,可以削减运算量。
“第四实施形态”(D)对每个子帧进行声音或噪声的判定,基于这种判定确定噪声减少量和噪声减少法,按照确定了的噪声减少法计算目标信号矢量,利用目标信号矢量来检索最佳码簿矢量,这样构成噪声减少型CELP系统的声音编码器。
其次,说明实现上述(D)的构成的详细结构。图4为CELP编码装置的功能构成图。图4中,与上述图1不同的构成是用虚线围起来的部分。即,在用虚线围起来的部分中具有声音或噪声判定单元110B、降低噪声滤波器122、预测增益计算单元112、滤波器组124、滤波器控制单元125。
“滤波器组124”由带通滤波器a~n构成,各个滤波器的通带为不同的频带,带通滤波器a对输入声音数字信号S输出通带信号Sbp1、…、带通滤波器n对输入声音数字信号S输出通带信号PbpN,将其提供到声音或噪声判定单元110B上。通过这样的滤波器组构成,降低阻带的噪声,输出信噪比增大了的通带信号,使声音或噪声判定部分110B中的声音区间或噪声区间的判定能够按每个通带容易地进行。
预测增益计算单元112从来自LPC分析单元103A的声道预测系数a求出预测增益系数Pg,将其提供到声音或噪声判定单元110B上。声音或噪声判定单元110B从来自滤波器组124的通带信号Sbp1~SbpN、间距信号Ptch和预测增益系数Pg中计算各频带噪声的评价函数,输出每个频带的声音或噪声判定信号V1~VN,将其提供到滤波器控制单元125上。
“滤波器控制单元125”从来自声音或噪声判定单元110B的声音或噪声判定信号V1~VN中,根据每个频带为声音或无声或噪声的判定、调节降低噪声的滤波系数,把调节了的降低噪声滤波系数nc提供到降低噪声滤波器122上。降低噪声滤波器122由IIR型或FIR型数字滤波器构成,设定来自滤波器控制单元125的降低噪声滤波系数nc,通过该滤波系数对输入声音数字信号S进行最佳处理,输出减小了噪声的目标信号t,将其提供到减法器116上。
(操作)说明直到求出目标信号t的操作,有关依靠码簿的最佳激励矢量信号ex的产生,因为与上述第一实施形态相同,所以,省略其说明。因此,首先,把输入声音数字信号S提供到自相关矩阵单元102上,求出自相关矩阵R。把该自相关矩阵R提供到LPC分析单元103A上,求出声道预测系数a。把该声道预测系数a提供到预测增益计算单元112和合成滤波器104上,利用预测增益计算单元112求出预测增益系数Pg,将其提供到声音或噪声判定单元110B上。
另一方面,把输入声音数字信号S提供到滤波器组124上,在这里,通过各带通滤波器a~n输出带通信号Sbp1~SbpN。把这些带通信号Sbp1~SbpN、间距信号Ptch和预测增益系数Pg提供到声音或噪声判定单元110B上,求出每个频带的声音或噪声判定信号V1~VN。在滤波器控制部分125中利用这些声音或噪声判定信号V1~VN。调节降低噪声滤波系数,作为降低噪声滤波系数nc提供到降低噪声滤波器122上。
降低噪声滤波器122可以根据该降低噪声滤波系数nc最佳地设定数字滤波器的滤波系数以便能够最佳地降低噪声。通过该设定,在降低噪声滤波器122中对输入声音数字信号S进行滤波处理,得到目标信号t。在减法器116中求出该目标信号t与来自合成滤波器104的合成声音信号SW之差e,在加权距离计算单元108中以该误差信号e为基础进行对最佳索引的探索。
在这样构成的装置中,与过去相比,降低了噪声区间的噪声,使得不产生成为刺耳声音源的编码信号。
(第四实施形态的效果)如果根据上述第四实施形态,在人类听觉上,与只听到声音区间中的背景噪声的情况相比,不愉快的程度降低了。因此,在编码时,通过区分声音区间、在噪声区间和声音区间中改变降低噪声的方法、在声音区间内不进行复杂的处理,可以提高听觉上的音质。
还有,通过只对CELP编码装置的目标信号降低噪声,可以以子帧为单位降低噪声,当声音或噪声误判定时,可以减小对声音的影响,同时,可以减小伴随着降低噪声而引起的频谱失真。
(其它实施形态)(1)再者,在上述实施形态中,进而还可以构成为具有脉冲码簿,把脉冲性激励矢量作为波形码矢量使用,产生合成声音矢量。
(2)还有,虽然所描述的上述图1的合成滤波器104是由IIR型数字滤波器构成的,但是,也可以由其它FIR(有限脉冲响应非循环型)型数字滤波器、IIR型和FIR型的混合型数字滤波器构成。
(3)又,在上述CELP编码装置中也可以使用统计码簿进行CELP编码。这样的统计码簿的构成和制作方法可以利用例如,文献特开平6-130995号公报“统计コ-ドブツク及びその作成方法(统计码簿及其制作方法)”中示出的构成和制作方法来实现。
(4)进而还有,在上述实施形态中,虽然说明了CELP编码装置的详情,但是,解码装置利用例如,文献特开平5-165497号公报“コ-ド”励振线形予测符号化器及び复号化器(码激励线性预测编码器和解码器)中示出的构成进行解码,也行。
(5)还有,在上述实施形态中,虽然示出了向CELP编码装置的应用,但是,此外,也能应用于VS(矢量和)ELP编码装置中。也能应用于LD(短延时)-CELP、CS(共轭结构)-CELP、PSI(间隔同步噪声)-CELP中。
(6)又,上述实施形态的CELP编码装置应用于手持电话机等中是有效的,这种结构应用于例如,文献特开平6-130998号公报“压缩音声复号化装置(压缩声音解码装置)”中所示的TDMA发送装置、接收装置中也是有效的。还有,把本发明应用于依靠VSELP的TDMA发送机中,也是令人满意的。
(7)进而还有,作为上述图4中的降低噪声滤波器122,除了利用IIR型、FIR型、IIR和FIR复合型的数字滤波器来实现以外,应用卡门(Karrnau)滤波器也是令人满意的。这种卡门滤波器如果接受信号及噪声的统计量,也能够应用,在随时间变化地接受信号及噪声统计量的情况下,也具有能够进行最佳操作的效果。
如果按照上述那样地根据本发明的第一方面,通过具有从输入音响信号求出自相关信息的自相关分析装置;从自相关分析装置的分析结果求出声道预测系数的声道预测系数分析装置;从声道预测系数求出预测增益系数的预测增益系数分析装置;从输入音响信号、声道预测系数和预测增益系数检出输入音响信号的非声音信号区间,调节该非声音信号区间内的自相关信息的自相关调节装置;从调节后的自相关信息得到补偿了非声音信号区间内的声道预测系数的补偿后声道预测系数的声道预测系数补偿装置;利用补偿后声道预测系数和自适应激励信号、对输入音响信号进行码激励线性预测编码的编码装置,由此来调节非声音信号区间音响信号的自相关信息,能够减小非声音信号区间音响信号的影响。
还有,如果根据本发明的第二方面,通过具有从输入音响信号求出自相关信息的自相关分析装置;从自相关分析装置的分析结果求出声道预测系数的声道预测系数分析装置;从声道预测系数求出预测增益系数的预测增益系统分析装置;与从声道预测系数求出LSP系数的同时、从输入音响信号、声道预测系数和预测增益系数检出输入音响信号的非声音信号区间、调节该非声音信号区间内的LSP系数的LSP系统调节装置;从调节后的LSP系数得到补偿了非声音信号区间内的声道预测系数的补偿后声道预测系数的声道预测系数补偿装置;利用补偿后声道预测系数和自适应激励信号、对输入音响信号进行码激励线性预测编码的编码装置,由此,因为在LSP系数的阶段中抑制了非声音信号区间内的频谱变动,所以,能够减小非声音信号区间音响信号的影响。
又,如果根据本发明的第三方面,通过具有从输入音响信号求出自相关信息的自相关分析装置;从自相关分析装置的分析结果求出声道预测系数的声道预测系数分析装置;从声道预测系数求出预测增益系数的预测增益系数分析装置;从输入音响信号、预测增益系数和声道预测系数检出非声音信号区间、调节该非声音信号区间内的声道预测系数、得到调节后声道预测系数的声道系数调节装置;利用调节后声道预测系数和自适应激励信号、对输入音响信号进行码激励线性预测编码的编码装置,由此,因为能够根据声道预测系数直接调节非声音信号区间的声道预测系数,所以,使运算量非常小,同时,能够减小非声音信号区间音响信号对编码输出的影响。
进而还有,如果根据本发明的第四方面,通过具有从输入音响信号求出自相关信息的自相关分析装置;从自相关分析装置的分析结果求出声道预测系数的声道预测系数分析装置;从声道预测系数求出预测增益系数的预测增益系数分析装置;从对输入音响信号进行带通处理以后得到的带通处理信号和预测增益系数中检出非声音信号区间、对该非声音信号区间进行信号分析、产生用来消除噪声的滤波系数、利用滤波系数对输入音响信号进行噪声消除、产生用来生成合成声音信号的目标信号的噪声消除装置;利用声道预测系数产生合成声音信号的合成声音发生装置;利用声道预测系数和目标信号对输入音响信号进行码激励线性预测编码的编码装置,由此,因为能够得到消除了噪声的目标信号,所以,对非声音信号区间的编码输出没有噪声的影响。
因而,能够实现能够减小非声音信号区间内音响信号(噪声、或转动声、或振动声,等等)对编码输出的影响,进行良好声音再生的码激励线性预测编码装置。
权利要求
1.一种码激励线性预测编码装置,其特征在于,具有从输入音响信号求出自相关矩阵信息的自相关分析装置;从所述自相关分析装置的分析结果求出声道预测系数的声道预测系数分析装置;从所述声道预测系数求出预测增益系数的预测增益系数分析装置;从所述输入音响信号、所述声道预测系数和所述预测增益系数检出输入音响信号的非声音信号区间、调节该非声音信号区间内的所述自相关信息的自相关调节装置;从所述调节后的自相关信息得到补偿了非声音信号区间内声道预测系数的补偿后声道预测系数的声道预测系数补偿装置;利用所述补偿后声道预测系数和自适应激励信号对输入音响信号进行码激励线性预测编码的编码装置。
2.一种码激励线性预测编码装置,其特征在于,具有从输入音响信号求出自相关信息的自相关分析装置;从所述自相关分析装置的分析结果求出声道预测系数的声道预测系数分析装置;从所述声道预测系数求出预测增益系数的预测增益系数分析装置;与从所述声道预测系数求出LSP系数的同时、从所述输入音响信号、所述声道预测系数和所述预测增益系数检出输入音响信号的非声音信号区间、调节该非声音信号区间内的所述LSP系数的LSP系数调节装置;从所述调节后的LSP系数得到补偿了非声音信号区间内声道预测系数的补偿后声道预测系数的声道预测系数补偿装置;利用所述补偿后声道预测系数和自适应激励信号、对输入音响信号进行码激励线性预测编码的编码装置。
3.一种码激励线性预测编码装置,其特征在于,具有从输入音响信号求出自相关信息的自相关分析装置;从所述自相关分析装置的分析结果求出声道预测系数的声道预测系数分析装置;从所述声道预测系数求出预测增益系数的预测增益系数分析装置;从所述输入音响信号、所述预测增益系数和所述声道预测系数检出非声音信号区间、调节该非声音信号区间内的所述声道预测系数,得到调节后声道预测系数的声道系数调节装置;利用所述调节后声道预测系数和自适应激励信号对输入音响信号进行码激励线性预测编码的编码装置。
4.一种码激励线性预测编码装置,其特征在于,具有从输入音响信号求出自相关信息的自相关分析装置;从所述自相关分析装置的分析结果求出声道预测系数的声道预测系数分析装置;从所述声道预测系数求出预测增益系数的预测增益系数分析装置;从对所述输入音响信号进行带通处理以后得到的带通处理信号和所述预测增益系数检出非声音信号区间、对该非声音信号区间进行信号分析、产生用来消除噪声的滤波系数、利用所述滤波系数对所述输入音响信号进行噪声消除,产生用来生成合成声音信号的目标信号的噪声消除装置;利用所述声道预测系数产生所述合成声音信号的合成声音发生装置;利用所述声道预测系数和所述目标信号对输入音响信号进行码激励线性预测编码的编码装置。
全文摘要
一种编码装置,减小了非声音信号区间内音响信号对编码输出的影响,进行良好的声音再生。调节单元111一接受自相关矩阵R、声音/噪声判定信号V、声道预测系数a,就求出新的自相关矩阵Ra。分析单元103从自相关矩阵R求出声道预测系数a,同时,一接受自相关矩阵Ra,就求出最佳声道预测系数aa,将其提供到合成滤波器104上。
文档编号G10L11/02GK1152164SQ9611148
公开日1997年6月18日 申请日期1996年8月23日 优先权日1995年8月23日
发明者伊东克俊 申请人:冲电气工业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1