语音编码装置、语音解码装置、通信装置及语音编码方法

文档序号:2829201阅读:354来源:国知局
专利名称:语音编码装置、语音解码装置、通信装置及语音编码方法
技术领域
本发明涉及将语音信号以可扩展CELP(Code Excited Linear Prediction,码激励线性预测)方式编码的语音编码装置等。
背景技术
在IP(Internet Protocol)网络上的语音数据通信的业务量控制和组播通信中,采用了具有可扩展功能(在接收端即使由部分的编码数据也能够进行解码的功能)的语音编码方式。CELP编码方式是能够以低比特率实现高音质的语音编码方式,通过采用可扩展编码方式,可进行与比特率对应的音质调节。
在语音信号的CELP编码中,自适应代码本(ACBAdaptive Code Book)搜索(时间上以前的驱动音源信号,即,使用了自适应代码本的音源搜索)对编码语音信号的音质和其传输上必要的比特率等产生极大的影响。特别是,在可扩展CELP编码中,这种影响的程度进一步增大。再有,在可扩展CELP编码中,存在对扩展层(也称为增强层)不使用自适应代码本的编码方式(例如参照非专利文献1的图3),但采用自适应代码本的方法,为了最佳化而能够有效利用被随时更新的以前的驱动音源信号,所以编码语音信号的音质基本良好(例如参照非专利文献1的图5)。
在图1中,表示在扩展层对每个子帧进行可扩展CELP编码的音源搜索时,编码对象子帧和用于生成该编码对象子帧的扩展层自适应音源候选矢量所搜索的自适应代码本的区间之间的时间关系。如图1所示,扩展层自适应音源候选矢量通过搜索自适应代码本的规定区间而取出,该自适应代码本为在扩展层中的编码对象子帧以前的驱动音源信号的累积。其中,扩展层中的自适应代码本按以下步骤被生成、更新。
(1)核心层的编码。
(2)使用核心层驱动音源、核心层的自适应音源延迟(音调周期T0)及扩展层的自适应代码本(辅助自适应代码本),在扩展层进行自适应代码本搜索(音调预测),由自适应代码本生成自适应音源。
(3)在扩展层实行固定音源搜索及增益编码。
(4)使用由所述(1)~(3)获得的编码后的扩展层驱动音源信号,更新扩展层的自适应代码本。
非专利文献1電子情報通信学会論文誌D-II,2003年3月,Vol.J86-D-II(NO.3),p.379-387发明内容但是,通过以往的可扩展CELP编码方式,将过渡的有声信号和有音的上升部分等的、时间性变化的区间的输入语音信号在扩展层进行自适应代码本搜索并编码时,由于自适应代码本是以前的驱动音源信号的累积而不能应对输入语音信号的时间性变化,因而存在编码语音信号的音质反而恶化的问题。
本发明的目的在于,提供语音编码装置等,即使将时间性变化的区间的语音信号进行可扩展CELP编码时,也能够改善编码语音信号的音质。
用于解决课题的手段本发明的语音编码装置,在语音信号的可扩展CELP编码中,对每个子帧进行扩展层的自适应代码本搜索,该语音编码装置采用以下结构,它包括核心层编码单元,对于核心层,从语音信号生成核心层驱动音源信号及核心层编码数据,该核心层编码数据表示CELP编码的编码结果;扩展层扩展型自适应代码本生成单元,对于扩展层,生成扩展型自适应代码本,该扩展型自适应代码本包含编码对象子帧以前的扩展层驱动音源信号和所述以前的扩展层驱动音源信号以后的所述核心层驱动音源信号;以及扩展层扩展型自适应代码本,通过搜索所生成的扩展型自适应代码本,生成用于表示所述编码对象子帧的自适应音源矢量的扩展层自适应音源代码。
此外,本发明的语音解码装置,对可扩展CELP编码的语音编码数据进行解码而生成解码语音,该语音解码装置采用以下结构,它包括核心层解码单元,对于核心层,对所述语音编码数据中所包含的核心层编码数据进行解码,生成核心层驱动音源信号及核心层解码语音信号;扩展层扩展型自适应代码本生成单元,对于扩展层,生成扩展型自适应代码本,该扩展型自适应代码本包含在解码对象子帧以前的扩展层驱动音源信号和在所述以前的扩展层驱动音源信号以后的所述核心层驱动音源信号;以及扩展层扩展型自适应代码本,从生成的扩展型自适应代码本中取出所述解码对象子帧的自适应音源矢量。
发明的效果根据本发明,将过渡的有声信号和有音的上升部分等的时间性变化的区间的语音信号对每个子帧在扩展层进行自适应代码本搜索并编码时,构成为该自适应代码本不仅是作为以前的扩展层的、驱动音源信号的累积的以往型的自适应代码本,还包含用于表示在编码对象子帧以后的语音信号变化的核心层驱动音源信号,所以能够正确地估计该编码对象子帧的驱动音源,其结果,能够改善编码语音信号的音质。


图1示意地表示以往型的自适应代码本的生成及更新的形态的图。
图2表示实施方式1的语音编码装置的主要结构的方框图。
图3表示实施方式1的语音解码装置的主要结构的方框图。
图4表示实施方式1的扩展型自适应代码本被生成、更新的流程的流程图。
图5示意地表示实施方式1的扩展性自适应代码本的生成或搜索的形态的图。
图6表示实施方式1的经可扩展CELP编码处理的语音编码数据从语音编码装置以帧为单位被分组发送为止的流程的流程图。
图7表示实施方式2的语音编码装置的主要结构的方框图。
具体实施例方式
以下,对于本发明的实施方式,参照对应的附图详细地说明。
(实施方式1)在本发明的实施方式1,说明以下形态语音信号经可扩展CELP编码处理,在扩展层被音源搜索的自适应代码本不仅包含累积了以前的扩展层的驱动音源信号的、以往型的自适应代码本,还包含表示了在编码对象子帧以后的语音信号的变化的核心层驱动音源信号而构成。再有,在本实施方式,假设在下述条件下进行语音信号的可扩展CELP编码。
(1)核心层和扩展层的二分层可扩展编码方式。
(2)核心层和扩展层中的采样频率相同(无二分层间的频带扩展)。
(3)在扩展层的音源搜索中,在自适应代码本搜索时,对由自适应代码本生成的自适应音源和核心层驱动音源信号间的差分进行编码。
(4)LPC参数在核心层和扩展层相同。
(5)核心层和扩展层的CELP编码都以子帧为单位而实行。
(6)扩展层的CELP编码中的音源搜索,在对于一个帧中的全部子帧完成了核心层的CELP编码后实行。
图2是表示本实施方式的语音编码装置100的主要结构的方框图。再有,假设语音编码装置100被装载并用于构成无线移动通信系统的移动台装置或基站装置。
语音编码装置100包括核心层CELP编码单元101;扩展层扩展型自适应代码本生成单元102;扩展层扩展型自适应代码本103;加法器104、106;增益计算单元105;LPC合成滤波单元107;减法器108;听觉加权单元109;失真最小化单元111;扩展层固定代码本112及扩展层增益代码本113。
核心层CELP编码单元101通过对输入的语音信号实施线性预测分析,计算作为频谱包络信息的LPC参数(LPC系数),并将算出的LPC参数进行量化后输出到LPC合成滤波单元107。此外,核心层CELP编码单元101对输入的语音信号的核心层的CELP进行编码,对于1帧内的全部子帧,生成核心层驱动音源信号exc_core[n](n=0,...,Nfr-1)(Nfr帧长度)和自适应音源延迟Tcore[is](is=0,...,ns-1)(ns子帧数),将该核心层驱动音源信号exc_core[n]输入到扩展层扩展型自适应代码本生成单元102、加法器104及增益乘法单元105中的乘法器G1,同时将自适应音源延迟Tcore[is]输入到扩展层扩展型自适应代码本103。此外,核心层CELP编码单元101通过进行核心层中的CELP编码,生成核心层编码数据,并将生成的核心层编码数据输入到未图示的复用单元等。
扩展层扩展型自适应代码本生成单元102根据从核心层CELP编码单元101输入的1帧的核心层驱动音源信号exc_core[n]和从加法器106输入的以前的扩展层驱动音源信号exc_ehn[n],生成扩展型自适应代码本d_enh_ext[i],并将生成的扩展型自适应代码本d_enh_ext[i]按每个子帧输入到扩展层扩展型自适应代码本103。即,扩展层扩展型自适应代码本生成单元102按每个子帧更新扩展型自适应代码本d_enh_ext[i]。再有,在这种每个子帧的更新中,只有对应于扩展层中的以往型的自适应代码本的以前的扩展层驱动音源信号被更新。关于扩展层扩展型自适应代码本生成单元102中的扩展型自适应代码本的生成形态,将在后面详细论述。
扩展层扩展型自适应代码本103使用从核心层CELP编码单元101输入的自适应音源延迟Tcore[is]和从扩展层扩展型自适应代码本生成单元102输入的扩展型自适应代码本d_enh_ext[i],根据来自失真最小化单元111的指示,以子帧为单位进行扩展层的CELP编码中的音源搜索。具体地说,扩展层扩展型自适应代码本103仅在从扩展层扩展型自适应代码本生成单元102输入的扩展型自适应代码本d_enh_ext[i]中的规定的区间,即基于从核心层CELP编码单元101输入的自适应音源延迟Tcore[is]的值或其累积值的时间间隔所决定的区间(自适应音源延迟候选),生成对应于由失真最小化单元111指示的索引的自适应音源,并将生成的自适应音源输入到加法器104。
加法器104计算从扩展层扩展型自适应代码本103输入的自适应音源和从核心层CELP编码单元101输入的对应的子帧的核心层驱动音源信号间的差分信号,并将算出的差分信号输入到增益乘法单元105中的乘法器G2。
扩展层固定代码本112预先存储多个规定形状的音源矢量(固定音源),将对应于由失真最小化单元111指示的索引的固定音源输入到增益乘法单元105中的乘法器G3。
扩展层增益代码本113根据来自失真最小化单元111的指示,生成对于核心层驱动音源信号exc_core[n]的增益、对于从加法器104输入的差分信号的增益及对于固定音源的增益,并将生成的增益分别输出到增益乘法单元105。
增益乘法单元105具有乘法器G1、G2、G3,在乘法器G1中对于从核心层CELP编码单元101输入的核心层驱动音源信号exc_core[n]乘以增益值g1,同样地,在乘法器G2中对于从加法器104输入的差分信号乘以增益值g2,在乘法器G3中对于从扩展层固定代码本112输入的固定音源乘以增益值g3,然后将这三个乘法结果全部输入到加法器106。
加法器106将从增益乘法单元105输入的三个经量化处理的乘法结果相加,将该相加结果,即扩展层驱动音源信号输入到LPC合成滤波单元107。
LPC合成滤波单元107通过将从核心层CELP编码单元101输入的经量化处理的LPC参数作为滤波系数的合成滤波,从加法器106输入的扩展层驱动音源信号而生成合成语音信号,并将生成的扩展层合成语音信号输入到减法器108。
减法器108通过从输入语音信号中减去从LPC合成滤波单元107输入的扩展层合成语音信号而生成误差信号,将该误差信号输入到听觉加权单元109。再有,该误差信号相当于编码失真。
听觉加权单元109对从减法器108输入的编码失真施以听觉加权,并将这种加权过的编码失真输入到失真最小化单元111。
失真最小化单元111对每个子帧求取使从听觉加权单元109输入的编码失真成为最小的扩展层扩展型自适应代码本103、扩展层固定代码本112及扩展层增益代码本113的各索引(index),将这些索引分别通知给扩展层扩展型自适应代码本103、扩展层固定代码本112及扩展层增益代码本113,经由这些代码本将对应的扩展层自适应音源代码、扩展层固定音源代码及扩展层增益代码作为语音编码数据输入到未图示的复用单元。
然后,未图示的复用单元及发送单元等以帧为单位对从核心层CELP编码单元101输入的核心层编码数据进行分组,而且以帧为单位对从扩展层扩展型自适应代码本103输入的扩展层自适应音源代码、从扩展层增益代码本113输入的扩展层增益代码和从扩展层固定代码本112输入的扩展层固定音源代码进行分组,并以分别的定时对包含所述核心层编码数据的分组和包含所述扩展层自适应音源代码的分组进行无线发送。
再有,编码失真最小时的扩展层驱动音源信号以每个子帧被反馈到扩展层扩展型代码本生成单元102。
再有,扩展层扩展型自适应代码本103用于表现如有语音那样周期性强的分量,另一方面,扩展层固定代码本112用于表现如白噪声那样周期性弱的分量。
图3是表示本实施方式的语音解码装置200中的主要结构的方框图。语音解码装置200是将语音信号从语音编码装置100的可扩展CELP编码的语音编码数据中解码的装置,与语音编码装置100同样,被装载用于构成移动无线通信系统的移动台和基站。
语音解码装置200包括核心层CELP解码单元210;扩展层扩展型自适应代码本生成单元202;扩展层扩展型自适应代码本203;加法单元204、207;扩展层固定代码本205;扩展层增益代码本209;增益乘法单元206及LPC合成滤波单元208。再有,语音解码装置200有对核心层的解码语音信号进行解码的情况和对扩展层的解码语音信号进行解码的情况。
首先,在对核心层的解码语音信号进行解码的情况下,在核心层CELP解码单元201中,从未图示的接收单元取出由语音编码装置100可扩展CELP编码处理过的语音编码数据中的核心层编码数据,基于取出的核心层编码数据,进行核心层中的CELP解码,生成并输出核心层的解码语音。
另一方面,在对扩展层的解码语音信号进行解码的情况下,在核心层CELP解码单元201中的CELP解码过程中,分别生成被量化的LPC参数、1帧的核心层驱动音源信号exc_core[n]和1帧的自适应音源延迟Tcore[is]。然后,核心层CELP解码单元201将该经量化处理的LPC参数输入到LPC合成滤波单元208。此外,核心层CELP解码单元201将该核心层驱动音源信号exc_core[n]输入到扩展层扩展型自适应代码本生成单元202、加法器204及增益乘法单元206中的乘法器G’1,同时将该自适应音源延迟Tcore[is]输入到扩展层扩展型自适应代码本203。
扩展层扩展型自适应代码本生成单元202生成从核心层CELP解码单元201输入的1帧的核心层驱动音源信号exc_core[n]、从加法器207对每个子帧输入的以前的扩展层驱动音源信号exc_enh[n]、以及每个子帧中扩展型自适应代码本d_enh_ext[i],将生成的扩展型自适应代码本d_enh_ext[i]输入到扩展层扩展型自适应代码本203。即,扩展层扩展型自适应代码本生成单元202将扩展型自适应代码本d_enh_ext[i]按每个子帧进行更新。
扩展层扩展型自适应代码本203从未图示的接收单元基于由语音编码装置100进行了可扩展CELP编码的语音编码数据中的扩展层自适应音源代码、从核心层CELP解码单元201输入的自适应音源延迟Tcore[is]、从扩展层扩展型自适应代码本生成单元202输入的扩展型自适应代码本d_enh_ext[i],生成自适应音源,将生成的自适应音源输入到加法器204。
加法器204将从扩展层扩展型自适应代码本203输入的自适应音源和从核心层CELP解码单元201输入的核心层驱动音源信号间的差分信号输入到增益乘法单元206中的乘法器G’2。
扩展层固定代码本205从未图示的接收单元取出由语音编码装置100进行了可扩展CELP编码处理的语音编码数据中的扩展层固定音源代码。此外,扩展层固定代码本205预先存储多个规定形状的音源矢量(固定音源),生成对应于取得的固定音源代码的固定音源,将生成的固定音源输入到增益乘法单元206中的乘法器G’3。
扩展层增益代码本209从未图示的接收单元根据由语音编码装置100进行了可扩展CELP编码处理的语音编码数据中的扩展层增益代码而生成增益乘法单元105使用的增益值g1、g2、g3,将生成的增益值g1、g2、g3通知给增益乘法单元206。
然后,增益乘法单元206将在所具备的乘法器G’1中取得的增益值g1乘以从核心层CELP解码单元201输入的核心层驱动音源信号exc_core[n],同样地,在乘法器G’2中将增益值g2乘以从加法器204输入的差分信号,将增益值g3乘以从扩展层固定代码本205输入的固定音源,并将这三个乘法结果输入到加法器207。
加法器207将从增益乘法单元206输入的三个乘法结果相加,将其加法结果、即扩展层驱动音源信号分别输入到扩展层扩展型自适应代码本生成单元202和LPC合成滤波单元208。
LPC合成滤波单元208根据从加法器206输入的扩展层驱动音源信号而生成合成解码语音,并将生成的扩展层解码语音信号输出。
接着,对于语音编码装置100的动作,用图4~图6说明。
图4是表示在语音编码装置100中,在扩展层扩展型自适应代码本生成单元102中生成扩展型自适应代码本,最终在扩展层扩展型自适应代码本生成单元102中扩展型自适应代码本被更新为止的、扩展层中的音源搜索的一周期(1子帧周期)的流程的流程图。而在图5中,示意地表示由核心层驱动音源信号和以往型的自适应代码本生成扩展型自适应代码本,进而从所生成的扩展型自适应代码本的规定区间起生成扩展层自适应音源候选矢量(相当于自适应音源)的状况。
在图4所示的步骤ST310,扩展层扩展型自适应代码本生成单元102基于以前的扩展层驱动音源信号和从核心层CELP编码单元101输入的1帧的核心层驱动音源信号,生成扩展型自适应代码本。这里,将对语音信号的子帧号is的编码对象子帧进行可扩展CELP编码中的音源搜索时被搜索的扩展型自适应代码本d_enh_ext[i]用下述(算式1)表示。
d_enh_ext[i]=d_enh[i](for-Nd≤i<0)
exc_core[is*+Nsub+i](for 0≤i<Nfr-is*Nsub)...(算式1)其中,d_enh[i]扩展层中的以往型的自适应代码本exc_core[i]核心层中的驱动音源信号Nsub子帧长度Nfr帧长度(Nfr=Nsub*ns、ns每帧的子帧数)此外,(算式1)的意义通过图5中的(a)核心层驱动音源信号、(b)扩展层自适应代码本及(c)扩展层扩展型自适应代码本的栏,示意性地表示出来。
然后,从步骤ST320至步骤ST340为止,以该顺序依次进行扩展型自适应代码本搜索、固定代码本搜索及增益量化。这里,子帧号is的编码对象子帧中的扩展层驱动音源信号exc_enh[n](n=0,...,Nsub-1)按下述(算式2)表示。
exc_enh[n]=g1*exc_core[is*Nsub+n]+g2*{d_enh_ext[n-Tenh]-exc_core[is*Nsub+n]}+g3*c_enh[n] ...(算式2)其中,g1、g2、g3增益值c_enh[n]固定音源Tenh扩展层中的自适应音源延迟值再有,在本实施方式,依次通过扩展型自适应代码本搜索而求Tenh,通过固定代码本搜索而求c_enh[n],并通过增益量化而求g1、g2、g3。
在步骤ST320,进行扩展型自适应代码本搜索。首先,在扩展层扩展型自适应代码本103中,输出对于从扩展层扩展型自适应代码本生成单元102输入的扩展型自适应代码本的规定区间的扩展层自适应音源候选矢量。然后,通过加法器104取得与从核心层CELP编码单元101输入的核心层驱动音源信号的差分的差分信号,将该差分信号和所述核心层驱动音源信号由各个增益乘法单元105相乘后,通过加法器106取得相加的信号(相当于(算式2)中的右边第1项及第2项之和),通过LPC合成滤波单元107取得LPC合成信号,将扩展层自适应音源候选矢量选择为自适应音源,以使该LPC合成信号和输入语音信号之间的编码失真成为最小,并输出对应于此时的自适应音源延迟值Tenh,同时将选择出的自适应音源和核心层驱动音源信号间的差分信号输入到增益乘法单元105。
这里,在Tenh的计算中,将利用核心层的自适应音源延迟Tcore[is]确定的、以扩展层自适应音源延迟候选基值Tcand[it]为中心的±ΔT的范围设定多个范围,通过限定在该范围内并进行搜索,能够降低表示扩展层自适应音源延迟的代码比特数(提高编码效率)和削减运算量。再有,对于Tenh的计算而言,也可以是小数精度。
Tenh=Tcand[it]-ΔT~Tcand[it]+ΔTit=0,1,2,3,... ...(算式3)此外,对于扩展层自适应音源延迟候选基值Tcand[it],利用对核心层的每个子帧算出的自适应音源延迟Tcore[j](j=is,...,ns-1)的值或在该累积值的时间性间隔中输入信号间的相关性强的特性,从扩展型自适应代码本d_enh_ext[i]的可取得的整体范围中,例如以下述(算式4)那样决定。
Tcand[it]=Tcore[is] it=00it=1-(Tcand[it-1]+Tcore[is0])it≥2...(算式4)其中,is0以满足is0*Nsub≤is*Nsub+Tcand[it-1]<(is0+1)*Nsub而决定。
此外,(算式2)~(算式4)的意思通过图5的(c)扩展层扩展型自适应代码本及(d)扩展层自适应音源候选矢量的栏而示意性地表示。
接着,在图4所示的步骤ST330,通过固定代码本搜索而生成固定音源。具体地说,在步骤ST330,扩展层固定代码本112生成对应于由失真最小化单元111指示的索引的固定音源候选矢量。然后,从所述固定音源候选矢量、核心层CELP编码单元101输入的核心层驱动音源信号、以及步骤ST320中选择的扩展层自适应音源和所述核心层驱动音源信号间的差分信号中,将使由减法器108生成的编码失真成为最小的固定音源候选矢量选择为固定音源c_enh[n],并将该固定音源输入到增益乘法单元105。
接着,在步骤ST340,为了进行增益量化处理,在增益乘法单元105中,对于从核心层CELP编码单元101输入的核心层驱动音源信号、从加法器104输入的使用通过步骤ST320选择出的扩展层自适应音源和所述核心层驱动音源信号的差分信号、从扩展层固定代码本112输入的通过步骤ST330选择出的固定音源,乘以了由失真最小化单元111指示的、并且与从扩展层增益代码本113输出的分别对应的增益值后,求增益值g1、g2、g3,以使与加法器106相加后的信号对应的LPC合成信号和输入语音信号之间的编码失真最小。
接着,在步骤ST350,通过加法器106将使用步骤ST340求出的增益值g1、g2、g3相乘后的三个相乘结果相加,然后将该相加结果反馈到扩展层扩展型自适应代码本生成单元102,从而更新扩展型自适应代码本。这里,使用在扩展层的音源搜索后决定的扩展层的驱动音源信号exc_enh[n],将用于下一个子帧中的搜索的扩展层的以往型的自适应代码本d_enh[i]根据下述(算式5)进行更新。
d_enh[i]=d_enh[i+Nsub](for-Nd≤i<-Nsub)exc_enh[i+Nsub] (for-Nsub≤i<0)...(算式5)图6是表示在语音编码装置100中,语音信号经可扩展CELP编码处理并无线发送为止的1周期(1帧周期)的流程的流程图。
在步骤ST510,核心层CELP编码单元101对于语音信号的核心层,对相当于1帧的语音信号进行CELP编码处理,同时将经编码处理而获得的核心层驱动音源信号输入到扩展层扩展型自适应代码本生成单元102。
接着,在步骤ST520,将编码对象子帧的子帧号is设定为0。
接着,在步骤ST530,判定是否is<ns(ns1帧中的全部子帧数)。在步骤ST530中,在被判定为is<ns时,随后执行步骤ST540,另一方面,在被判定为不是is<ns时,随后执行步骤ST560。
接着,在步骤ST540,对于子帧号is的编码对象子帧,依次执行从所述步骤ST310至步骤ST350为止的各步骤。
接着,在步骤ST550,作为下一个编码对象子帧的子帧号is,设定is+1。然后,接续步骤ST550,步骤ST530被执行。
此外,在步骤ST560,未图示的语音编码装置100中的发送单元等将经可扩展CELP编码处理的相当于1帧的语音编码数据的分组无线发送到语音解码装置200。
这样,根据本实施方式,在将过渡的有声信号和有音的上升部分等时间性变化的区间的语音信号,按每子帧在扩展层进行自适应代码本搜索并进行CELP编码的情况下,扩展层扩展型自适应代码本103不仅是作为以前的扩展层的驱动音源信号的累积的以往型的自适应代码本,还包含了表示在编码对象子帧以后的语音信号的变化的核心层驱动音源信号,所以能够正确地估计该编码对象子帧的驱动音源,其结果,能够改善编码语音信号的音质。
再有,对于本实施方式的语音编码装置100或语音解码装置200,也可以如以下那样应用或变形。
在本实施方式,说明了采用核心层和编码层的两分层的可扩展CELP编码方式的情况,但本发明不限于这种情况,例如,也可以采用三分层以上的可扩展CELP编码方式。其中,在N分层的可扩展CELP编码方式,在第2~第N分层中分别如用本实施方式的扩展层进行那样,使用一个低层的分层即第1~第N-1分层的核心层驱动音源信号或扩展层驱动音源信号生成扩展型自适应代码本即可。
此外,在本实施方式,说明了在核心层和扩展层中采样频率相同的情况,但本发明不限于这种情况,例如,根据可扩展编码的分层适当改变采样频率、即适用频带可扩展处理即可。顺便说明的是,就在语音编码装置100中采用可扩展频带来说,在核心层CELP编码单元101和扩展层扩展型自适应代码本生成单元102之间,追加设置上采样单元,对核心层驱动音源信号exc_core[n]进行上采样;以及低通滤波器(Low Pass FilterLPF),对经上采样处理的核心层驱动音源信号exc_core[n]进行频带限制,或者按照以下顺序设置即可核心层局部解码器,从核心层驱动音源信号exc_core[n]生成解码语音信号;上述上采样单元和LPF;以及反向滤波器,由通过了LPF的信号重新生成核心层驱动音源信号exc_core[n]。
此外,在本实施方式,说明了由失真最小化单元111指定增益乘法单元105中的乘法器G1的增益值g1、即与核心层驱动音源信号exc_core[n]相乘的增益值g1的情况,但本发明不限定于这种情况,例如也可以固定为增益值g1=1.0。
此外,在本实施方式,说明了加法器104将从扩展层扩展型自适应代码本103输入的自适应音源和核心层驱动音源信号间的差分信号输入到增益乘法单元105的情况,但本发明不限定于这种情况,输入到增益乘法单元105的,只要是表示从扩展层扩展型自适应代码本103输出的自适应音源特性的信号就可以。因此,例如也可以将从扩展层扩展型自适应代码本103输出的自适应音源直接输入到增益乘法单元105而取代上述差分信号。由此,能够从语音编码装置100中除去加法器104,能够简化语音编码装置100的结构。顺便说明是,这样的情况下,扩展层驱动音源信号exc_enh[n]变成以下式表示。
exc_enh[n]=g1*exc_core[is*Nsub+n]+g2*d_enh_ext[n-Tenh]+g3*c_enh[n]
此外,这样的情况下,也可以切换使用将增益乘法单元105中的增益值g1、g2限制为(g1,g2)=(1,0)或(0,1)的、即核心层驱动音源信号exc_core[n]和扩展层自适应音源信号d_enh_ext[n-Tenh]。
此外,在本实施方式,说明了LPC参数在核心层和扩展层为相同的情况,但本发明不限于这种情况,例如对于核心层的量化,将附加的量化在扩展层量化,而在扩展层使用由此获得的量化LPC参数就可以。这样的情况下,在语音编码装置100中,被输入核心层LPC参数及语音信号,并且,追加设置输出扩展层量化LPC参数及量化代码的扩展层LPC参数量化单元。而且,在采用可扩展频带的情况下,在语音编码装置100中追加设置LPC分析单元。
此外,也可以按下述(a)~(c)的方法进行本实施方式的扩展型自适应代码本的搜索时的自适应音源延迟决定方法。
(a)在与子帧号is的编码对象子帧对应的核心层驱动音源信号exc_core[n](n=is*Nsub,...,is*Nsub+Nsub-1)和扩展型自适应代码本d_enh_ext[i]之间取得相关,从该相关值为最大的相关值起依次选择多个延迟值,将它们作为自适应音源延迟候选基值Tcand[it],以后与本实施方式同样,进行自适应音源延迟搜索。
(b)从语音信号预先计算LPC预测残差信号或与它类似的信号,在与子帧号is的编码对象子帧对应的LPC预测信号res[n](n=is*Nsub,...,is*Nsub+Nsub-1)和扩展型自适应代码本d_enh_ext[i]之间取得相关,从该相关值为最大的相关值起依次选择多个延迟值,将它们作为自适应音源延迟候选基值Tcand[it],以后与本实施方式同样,进行自适应音源延迟搜索。
(c)事先不选择自适应音源延迟的候选值,从扩展型自适应代码本d_enh_ext[i]的全部区间中,通过全部搜索而计算最佳的自适应音源延迟。
此外,在本实施方式,说明了对于全部的编码对象子帧进行扩展型自适应代码本d_enh_ext[i]的搜索的情况,但本发明不限定于这种情况,例如也可以仅对1帧内的一部分编码对象子帧进行扩展型自适应代码本d_enh_ext[i]的搜索。具体地说,在ns=4时,也可以仅对is=0、2的编码对象子帧,进行扩展型自适应代码本d_enh_ext[i]的搜索。由此,能够某种程度地抑制扩展层自适应音源延迟的编码传输比特数的增加,同时改善可扩展CELP编码的语音信号的音质。
(实施方式2)
在本发明的实施方式2,说明以下状况在实施方式1中,对于包含了从语音编码装置100无线发送的核心层编码数据的分组和包含了扩展层自适应音源代码的分组,在语音解码装置200的分组丢失率上产生差的情况下,对与核心层驱动音源信号相乘的增益值和与作为来自扩展型自适应代码本的输出的自适应音源相乘的增益值间的比率进行调节。具体地说,在语音解码装置200中包含了核心层编码数据的分组的丢失率比包含了扩展层自适应音源代码的分组的丢失率足够小时,在生成语音编码装置100的扩展层驱动音源信号时,为了使核心层驱动音源信号的影响度比以前的扩展层驱动音源信号大,增大与核心层驱动音源信号相乘的增益值或缩小与扩展层中的自适应音源相乘的增益值。
图7是表示本实施方式的语音编码装置600的主要结构的方框图。语音编码装置600在实施方式1的语音编码装置100中还包括增益量化控制单元621。因此,语音编码装置600具备语音编码装置100的全部构成元素,所以对与语音编码装置100的构成元素相同的构成元素附加相同的参考标号,并省略其说明。此外,语音编码装置600被装载并用于构成无线移动通信系统的移动台和基站中,假设与装载了语音解码装置200的无线通信装置进行分组通信。
增益量化控制单元621首先对于包含了从语音编码装置600分组发送的核心层编码数据的分组和包含了扩展层自适应音源代码的分组,取得语音解码装置200生成的分组丢失信息,根据该分组丢失信息,将增益乘法单元105中的增益值g1、g2、g3自适应地控制。具体地说,增益量化控制单元621对于扩展层增益代码本113,在将包含了核心层编码数据的分组的丢失率设为PLRcore,将包含了核心层自适应音源代码的分组的丢失率设为PLRenh时,对于与核心层驱动音源信号对应的增益值g1、以及核心层驱动音源信号和作为来自扩展型自适应代码本的输出的自适应音源间的差分信号相乘的增益值g2,设定下述的限制,并在这种限制下进行增益量化。
if PLRcore<c*PLRenhthen将g1可取的下限值设定为THR1将g2可取的上限值设定为THR2else
不进行对g1、g2的上限值及下限值的设定其中,c是用于调整与分组丢失有关的判定条件的常数(但是,c<1.0),THR1、THR2是对于g1的下限值及对于g2的上限值的设定值常数。
这样,根据本实施方式的语音编码装置600,在包含了语音解码装置200的核心层编码数据的分组的丢失率比包含了扩展层自适应音源代码的分组的丢失率足够小的情况下,在生成语音编码装置100的扩展层驱动音源信号时,增大与核心层驱动音源信号相乘的增益值或缩小与作为扩展型自适应代码本103的输出的自适应音源相乘的增益值,所以对于可扩展CELP编码的语音信号,能够提高分组的丢失容错性。
再有,对于本实施方式的语音编码装置600,也可以如以下那样应用或变形。
在本实施方式,说明了增益量化控制单元621设定对增益乘法单元105的增益值g1、g2的限制的情况,但本发明不限定于这种情况,例如增益量化控制单元621也可以对于扩展层扩展型自适应代码本103进行控制,以在扩展型自适应代码本搜索时,与以往型的自适应代码本对应的区间相比,从与核心层驱动音源信号对应的区间优先地取出自适应音源。而且,增益量化控制单元621也可以组合进行对于所述扩展层增益代码本113的控制和对于所述扩展层扩展型自适应代码本103的控制。
此外,在本实施方式,假设并说明了分组丢失信息与语音编码数据从语音解码装置200被单独地发送到语音编码装置600的情况,但本发明不限定于这种情况,例如接收了从语音解码装置200无线发送的语音编码数据的分组的语音编码装置600,计算该接收分组中的分组丢失率,将自身算出的分组丢失率代用为语音解码装置200中的分组丢失率就可以。
另外,用于上述各实施方式的说明中的各功能块,典型地可作为集成电路的LSI来实现。这些功能块既可是每个块分别集成到一个芯片,或者可以是一部分或所有块集成到一个芯片。
这里,称为LSI,但根据集成程度,也可以被称为IC、系统LSI、超级LSI(Super LSI)、或特大LSI(Ultra LSI)。
另外,实现集成电路化的方法不仅限于LSI,也可使用专用电路或通用处理器实现之。在LSI制造后可利用可编程的FPGA(Field Programmable GateArray,现场可编程门阵列),或者可以使用可重构LSI内部的电路单元的连接和设定的可重构处理器(Reconfigurable Processor)。
再者,随着半导体的技术进步或随之派生的其它技术的出现,如果能够出现替代LSI集成电路化的新技术,当然可利用新技术进行功能块的集成化。还存在着适用生物技术等的可能性。
本说明书是根据2004年9月17日申请的日本专利申请2004-271886。其内容全部包含于此。
工业实用性本发明的语音编码装置能够正确地估计编码对象子帧的驱动音源,其结果,具有能够改善编码语音信号的音质的效果,作为构成无线移动通信系统的移动台和基站等的通信装置是有用的。
权利要求
1.一种语音编码装置,在语音信号的可扩展CELP编码中,对每个子帧进行扩展层的自适应代码本搜索,该语音编码装置包括核心层编码单元,对于核心层,从语音信号生成核心层驱动音源信号及核心层编码数据,该核心层编码数据表示CELP编码的编码结果;扩展层扩展型自适应代码本生成单元,对于扩展层,生成扩展型自适应代码本,该扩展型自适应代码本包含编码对象子帧以前的扩展层驱动音源信号和所述以前的扩展层驱动音源信号以后的所述核心层驱动音源信号;以及扩展层扩展型自适应代码本,通过搜索所生成的扩展型自适应代码本,生成用于表示所述编码对象子帧的自适应音源矢量的扩展层自适应音源代码。
2.如权利要求1所述的语音编码装置,其中,还包括发送单元,用单独的分组发送所述核心层编码数据和所述扩展层自适应音源代码;增益单元,分别对于所述核心层驱动音源信号和表示从所述扩展层扩展型自适应代码本输出的自适应音源特性的信号乘以增益;以及增益控制单元,对包含由所述发送单元发送的所述核心层编码数据的分组和包含所述扩展层自适应音源代码的分组的分组丢失状况进行监视,在包含所述核心层编码数据的分组丢失率比包含所述扩展层自适应音源代码的分组丢失率低时,对于所述增益单元进行控制,以增大乘以所述核心层驱动音源信号的增益,或缩小乘以表示所述自适应音源特性的信号的增益。
3.如权利要求2所述的语音编码装置,其中,表示所述自适应音源特性的信号是从所述扩展层扩展型自适应代码本输出的自适应音源和所述核心层驱动音源信号间的差分信号。
4.一种语音解码装置,对可扩展CELP编码的语音编码数据进行解码而生成解码语音,该语音解码装置包括核心层解码单元,对于核心层,对所述语音编码数据中所包含的核心层编码数据进行解码,生成核心层驱动音源信号及核心层解码语音信号;扩展层扩展型自适应代码本生成单元,对于扩展层,生成扩展型自适应代码本,该扩展型自适应代码本包含在解码对象子帧以前的扩展层驱动音源信号和在所述以前的扩展层驱动音源信号以后的所述核心层驱动音源信号;以及扩展层扩展型自适应代码本,从生成的扩展型自适应代码本中取出所述解码对象子帧的自适应音源矢量。
5.一种通信装置,包括权利要求1所述的语音编码装置。
6.一种通信装置,包括权利要求4所述的语音解码装置。
7.一种语音编码方法,在语音信号的可扩展CELP编码中,按每个子帧进行扩展层的自适应代码本搜索,该方法包括核心层编码步骤,对于核心层,从语音信号生成核心层驱动音源信号及核心层编码数据,该核心层编码数据表示CELP编码的编码结果;扩展层扩展型自适应代码本生成步骤,对于扩展层,生成扩展型自适应代码本,该扩展型自适应代码本包含在编码对象子帧以前的扩展层驱动音源信号和在所述以前的扩展层驱动音源信号以后的所述核心层驱动音源信号;以及扩展层扩展型自适应代码本搜索步骤,对于扩展层,利用搜索所生成的扩展型自适应代码本,生成用于表示所述编码对象子帧的自适应音源矢量的扩展层自适应音源代码。
全文摘要
本发明公开语音编码装置等,即使在对时间性变化的区间的语音信号进行可扩展CELP编码的情况下,也能够改善编码语音信号的音质。在该装置中,扩展层扩展型自适应代码本生成单元(102)根据从核心层CELP编码单元(101)输入的相当于1帧的核心层驱动音源信号exc_core[n]和从加法器(106)输入的以前的扩展层驱动音源信号exc_enh[n],生成扩展型自适应代码本d_enh_ext[i],并对每个子帧将生成出的扩展型自适应代码本d_enh_ext[i]输入到扩展层扩展型自适应代码本(103)。即,扩展层扩展型自适应代码本生成单元(102)按每个子帧更新扩展型自适应代码本d_enh_ext[i]。
文档编号G10L21/04GK101023470SQ20058003126
公开日2007年8月22日 申请日期2005年9月15日 优先权日2004年9月17日
发明者吉田幸司 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1