向量量化装置的制作方法

文档序号:2819728阅读:553来源:国知局
专利名称:向量量化装置的制作方法
技术领域
本发明涉及用于声音和图象等信息信号的编码的向量量化装置,特别是涉及有关CELP方式中的代码本查找技术。
在对电话频段的声音以4Kbps左右的传输率进行编码的技术中,CELP(Cade Excifed Linear Predicfion)方式是一种有效的方式。采用这种CELP方式的处理,与要求根据被分割为帧单位的输入语音进行声道模型化的语音合成滤波器的处理,在要求相当于这种滤波器的输入信号的驱动向量的处理上有很大不同。其中,后者必须将存贮在代码本中的多个驱动向量引入每一语音合成滤波器,将输入语音与所得到的合成声音进行比较,根据其误差进行由代码本查找驱动向量被称之为代码本查找的向量量化,这种处理通常需要多个计算量。本发明就是关于一种设置有多个代码本的CELP方式中的代码本查找技术。
有关CELP方式,例如在M.R.Schroeder和B.S.Atal的″代码活化线性予测(CELP)在很低位速率时的高质量话音″(Proc,ICASSP,pp.937-940,1985),TW.S.Kleijin,D.J.Krasinski等的″在CELP中完善话音质量和高效向量量化″(Proc.ICASSP,pp155-158,1988)中进行了详细描述,图23对之有概略说明。
图23中,向语音输入端960输入的声音经线性予测分析单元950分析,求取加权合成滤波器930的系数。输入的语音还被送至声响加权单元940,以得到加权输入语音。由加权输入语音中除去加权合成滤波器的零状态响应,就得到目标向量980。接着由加权合成滤波器930将适应编码本911中每一驱动向量加以合成以求取合成语音向量,评价单元970查找与目标向量980的差(偏差向量)更小的驱动向量,以最佳值作为第一驱动向量。接着考虑第一驱动向量的影响,由噪声编码本912同样地选择第二驱动向量。最后,在由放大电路921、922对第一和第二编码向量分别作最佳放大后,经补充混合生成驱动信号,以此驱动信号对适应编码本911进行更新,为下一帧作准备。
在上述流程中,由适应代码本911和噪声编码本912查找出偏差向量值更小的驱动向量的处理被称之为代码本查找。在进行这种代码本查找时,一般先查找适应代码本911,选择第一最佳驱动向量x1,然后考虑x1的影响查找噪声代码本912,以确定第二驱动向量x2,最后将二向量x1、x2分别放大再加以混合。
日本专利平5-506514中揭示的正交查找,广泛采用在求得x1的条件下求取最佳x2的方法。具体说是,针对将所给予的x1送入合成滤波器910所得到的合成语音向量x1、将查找中的向量x2引入合成滤波器910所得的合成语音向量x2按式(1)来求取作正交处理的向量X2v,再求取由此X2v与目标向量R所组成的式(2)的评价值E为最大时的向量x2。X2v=X2-(X2,X1)|X1|2X1----(1)]]>E=(R,X2v)2|X2v|2----(2)]]>但是,这一方法因为需要对噪声代码本912的所有驱动向量作X1正交处理进行查找,所以存在着代码本查找时要进行大量计算的问题。
鉴于上述情况,现有的正交查找是对由适应代码本所得到的最佳合成声音向量,将由噪声代码本所所得到的合成声音向量逐个作正交处理来进行噪声代码本的查找,就存在有在进行代码表的查找中所需计算量很大的缺点。
本发明的目的是要提出一种不进行代码向量正交处理,因而能以较之过去大大减少计算工作量来实现最佳代码向量查找的向量量化装置。
为解决上述课题,有关第一发明的向量量化装置的特征在于设置有取得残差向量的手段;由代码向量的集合中选择至少一个代码向量的手段;获得将由上述手段所选择的代码向量与构成第一基本向量集合的基本向量合并的向量伸展空间的基本向量作为第二基本向量集合的手段;由前述代码向量集合查找前述残差向量投影在前述第二基本向量集合的伸展空间上的映射向量的大小较大的代码向量组的查找手段;和将指定由此查找手段查找得的代码向量组的信息输出的手段。
有关第二发明的向量量化装置的特征在于设置有取得残差向量的手段,由代码向量集合中选择至少一个代码向量的手段;根据由该手段选择的代码向量与前述残差向量的内积值的大小由前述代码向量集合查找评价值较大的代码向量组的查找手段;和将指定该查找手段所查找得的代码向量组的信息输出的手段。
有关第三发明的向量量化装置的特征在于设置有取得残差向量的手段;由代码向量集合中选择至少一个代码向量的手段;根据对由该手段所选择的代码向量和前述残差向量的内积值的大小以基于前述代码向量的加权系数进行加权的值由前述代码向量集合查找评价值较大的代码向量组的查找手段;和将指定由该查找手段查找到的代码向量组的信息输出的手段。
有关第四发明的向量量化装置的特征在于设置有取得残差向量的手段;由代码向量集合中选择至少一个代码向量的手段;采用第二发明或第三发明中的查找手段从前述代码向量集合中选择多组代码向量作为备用选择候补的备用选择手段;由前述备用选择候补中利用第一发明中的查找手段选择至少一组代码向量作为最佳代码向量组的基本选择手段;和输出指定前述最佳代码向量组的信息的手段。
有关第五发明的向量量化装置的特征在于设置有取得残差向量的手段;由代码向量集合中选择至少一个代码向量的手段;采用第二或第三发明中的查找手段由前述代码向量集合选择多组代码向量作为备用选择候补的备用选择手段;由前述备用选择候补中选择前述备用选择手段中用的内积值的大小,按在前述第二基本向量集合的伸展平面中作正交处理的代码向量的大小分割的值较大的代码向量作为最佳向量组的基本选择手段;和输出指定前述最佳向量组的信息的手段。
有关第六发明的向量量化装置的特征在于装置有取得接近目标向量的近似向量的手段;利用前述目标向量与前述近似向量求得残差向量的手段;查找对于前述近似向量和多个代码向量集合的伸展空间的前述残差向量的映射向量的大小较大的代码向量的查找手段;和输出指定该查找手段所查找到的代码向量的信息的手段。
有关第七发明的向量量化装置的特征在于设置有取得接近目标向量的近似向量的手段;利用前述目标向量与前述近似向量取得残差向量的手段;查找代码向量与前述残差向量的内积值的大小较大的代码向量的查找手段;和输出指定该查找手段查找到的代码向量的信息的手段。
有关第八发明的向量量化装置的特征在于设置有取得接近目标向量的近似向量的手段;利用前述目标向量与前述近似向量求取残差向量的手段;查找将代码向量与前述残差向量的内积值的大小以基于前述代码向量的加权系数进行加权所得的值较大的代码向量的查找手段;和输出指定由该查找手段所查找到的代码向量的信息的手段。
有关第九发明的向量量化装置的特征在于设置有选择由第七发明或第八发明中的查找手段得到的多个代码向量作为备用选择候补的备用选择手段;由前述备用选择候补中利用第六发明中的查找手段选择至少一组代码向量作为最佳代码向量的候补的基本选择手段;和输出指定前述最佳代码向量的候补的信息的手段。
在第一至第九发明中,前述查找手段亦可作成输入以规定的加权系数加权的代码向量。
而在第二、三、七、八发明中,对前述内积值亦可由前述代码向量和前述残差向量作逆卷积运算的向量的内积来求取。
在第一发明中,当查找代码向量组时,首先取得代码向量组与第一基本向量合并的向量伸展的空间,求取在该空间映射残差向量的映射向量的大小作为评价值,查找该评价值较大的代码向量组作为最佳代码向量组。依靠这样的查找,由于查找中无须对代码向量组作正交处理,因而能以比现有的正交查找要少的计算工作量进行查找。
在第二发明中,求取代码向量与残差向量的内积值的大小作为评价值,查找该评价值较大的代码向量组作为最佳代码向量组,而在第三发明中则求取代码向量与残差向量的内积值的大小以基于代码向量的大小的加权系数进行加权的值作为评价值,查找该评价值较大的代码向量组作为最佳代码向量组,因而可能以更少的计算量进行查找。
在第四、五发明中,作为第一至第三发明的组合,能以较少的计算求取更高精度的查找结果作为最佳代码向量。
在第六发明中,在得到接近目标向量的近似向量后查找代码向量时,求取目标向量与近似向量的残差向量映射于近似向量和代码向量的伸展空间上的映射向量,将此映射向量的大小作为评价值,查找此评价值较大的代码向量作为最佳代码向量。这种情况,由于查找中无需对代码向量作正交处理,所以比同样的正交查找法能以较少的计算量进行查找。
在第七发明中,查找与残差向量的内积值的大小较大的前述向量,而在第八发明中则查找与残差向量的内积值以基于代码的加权系数进行加权的值较大的代码向量作为最佳代码向量。在此第七、第八发明中因为是查找将第六发明中表达评价值的分数式的分子的值或分子以代码向量进行加权的值较大的代码向量,所以能以更少的计算量进行查找。
第九发明中,作为第六至第八发明的组合,所以能以较少的计算量求取精度更高的查找结果作为最佳代码向量。
下面参照附图对本发明的实施例加以说明。


图1是说明有关实施例1的向量量化装置的结构方框图;图2是说明有关实施例2的向量量化装置的结构方框图;图3是说明有关实施例3的向量量化装置的结构方框图;图4是说明有关实施例4的向量量化装置的结构方框图;图5是说明有关实施例5的向量量化装置的结构方框图;图6是说明有关实施例6的向量量化装置的结构方框图;图7是说明有关实施例7的向量量化装置的结构方框图;图8是说明映射向量的图形;图9是说明有关实施例8的向量量化装置的结构方框图;图10是说明有关实施例9的向量量化装置的结构方框图;图11是说明有关实施例10的向量量化装置的结构方框图;图12是说明有关实施例11的向量量化装置的结构方框图;图13是说明有关实施例12的向量量化装置的结构方框图;图14是说明有关实施例13的向量量化装置的结构方框图;图15是说明有关实施例15的向量量化装置的结构方框图;图16是用于实施例1中作逆卷积运算的图形;图17是用于实施例3中作逆卷积运算的图形;图18是说明取得第二残差向量的结构的图形;
图19是说明取得第二残差向量的另一结构的图形;图20是说明有关实施例15的向量量化装置的变形结构的方框图;图21是说明有关实施例16的向量量化装置的结构方框图;图22是说明图21中的查找方框结构的示例图;图23是CELP编码方式的示意图;图24是说明实施例1中最佳代码向量的查找步骤的流程图;图25是说明实施例2中最佳代码向量的查找步骤的流程图。
图中标号说明111-代码本1 112-代码本N120-加权单元130-第一查找单元140-残差向量计算单元170-第二查找单元171-查找结果172-评价单元173-映射向量计算单元174-内积值计算单元175-加权系数计算单元176-加权单元180-目标向量输入端 211-适应代码本212-噪声代码本 221,222-放大电路230-加权合成滤波器 240-音响加权单元250-线性予测分析单元260-语音输入端270-逆卷积运算单元 370a备用选择单元370b-基本选择单元 371-备用选择候补372a-评价单元 372b-评价单元1001~1003-输入端 1010-代码本1020-组合单元 1030-加权单元
1040-残差向量计算单元1050-基本向量生成单元1070-查找单元1071-映射向量计算单元1072-评价单元1073-内积值计算单元1074-加权单元1075-加权系数计算单元1370a-查找单元(备用选择) 1070b-查找单元(基本选择)1380-备用选择信息1401~1403-输入端1410-音响加权单元1421~1423-查找方框1430-线性予测分析单元1501~1502-输入端1571-映射向量计算单元1630-逆卷积运算单元1910-近似向量计算单元2111~2113-代码本2130-加权合成滤波器 2121~2123-选择单元2201-代码向量输入端2202-经加权的代码向量输入端实施例1图1示出了实施例1的向量量化装置的结构。该向量量化装置由代码本1010、组合单元1020、加权单元1030、残差向量计算单元1040、基本向量生成单元1050和查找单元1070构成,而查找单元1070则由映射向量计算单元1071和评价单元1072构成。
在残差向量计算单元1040中求取成为查找的目标向量的残差向量R(k)。在本实施例中,作为示例是由前级的残差向量和前级所输出的基本向量的集合中求取残差向量R(k)的结构。更具体地说,残差向量计算单元1040利用端点1001所输入的前级的残差向量R(k-1)和端点1002所输入的第一基本向量的集合B(k-1),由R(k-1)中减去其映射在B(k-1)的伸展空间上的映射向量,来求出作为目标向量的残差向量R(k)。
在组合单元1020中由代码本1010选择的M个代码向量,在加权单元1030中经加权成为代码向量X(k1),X(k2),……,X(kM),被输入至基本向量生成单元1050。在基本向量生成单元1050中求取由代码向量X(k1),X(k2),……,X(kM)与构成由端点1002输入的第一基本向量集合的基本向量相合并的向量伸展空间,计算出其基本向量并作为第二基本向量集合B(k)输出。
这样求得的残差向量R(k)与第二基本向量的集合B(k)被输入至查找单元1070中的映射向量计算单元1071,在此计算出B(k)伸展空间上映射R(k)所得到的第二映射向量P(k)的大小,将其值输入至评价单元1072。
在评价单元1072中,由对组合单元1020的控制来查找映射向量计算单元1071输入的值,亦即第二映射向量P(k)的大小成为较大值的M个代码向量的组合作为最佳代码向量,并将指定此最佳代码向量的信息(指针)作为查找结果输出。
但是,在本实施例所示的由一个代码本1010查找M个代码向量的结构只不过是代码本构成方法中的一个示例,如同后面所述实施例七那样由N个代码本分别选择一个代码向量的方法则是另一个示例。通常,最好考虑由代码向量集合选择代码向量,例如在代码本中设置少量的基本向量,由对这些基本向量作简单计算(例如线性结合等)来构成的事实上包含多个代码向量的代码本的例子等,也包括在这种考虑方法之中。实际上由于计算量等的限制,因而很多情况均为M=1。这在以下的实施例中也是同样的。
可以举出在语音编码等中所使用的加权合成向量作为加权单元1030的例子。另外,当设加权单元1030的加权系数为1时,实际上也就可以构成设有加权的结构。亦即,也可以省略加权单元1030。这在以下的实施例中也是同样的。
在基本向量生成单元1050中,由第一基本向量集合B(k-1)与代码向量X(k-1)、X(k2)、……X(kM)产生第二基本向量集合B(k)。这一B(k)的生成方法虽然可考虑各种不同方法,但最简单的一个例子是直接求和方法。也就是,在B(k-1)由m个基本向量B1(k-1)、b2(k-1)、……bm(k-1)构成的情况下,B(k)={b1(k-1),b2(k-1),…,bm(k-1),X(k1),X(k2),…,X(kM)}其它的方法有递归地采用残差向量的映射向量构成B(k)的方法。
在查找单元1070中,查找作为输入值的第二映射向量P(k)的大小较大的代码向量组。通常虽然一次选择最佳组合,但由于在CELP编码中利用近年常采用的延迟停机等,也有多次选择最佳值的情况。这对以下的实施例也是同样的。
下面利用图24所示的流程图来说明本实施例中的编码向量查找过程。为简单起见,查找的代码向量为1个(代码向量组由一个代码向量组成),结束条件为代码本1010全部查找的情况,映射向量的大小限定为向量的长的二次方的情况。
步骤S11,进行初始化设置i=1,imax=1,|Pmax(k)|2=0。imax表示作为指定最佳代码向量的信息的索引,|Pmax(k)|2表示映射向量的大小的最大值。
步骤S12,计算残差向量R(k)。
步骤S13,计算经加权的代码向量Xi(k)。
步骤S14,产生基本向量Bi(k)。
步骤S15,计算映射向量的大小|Pi(k)|2。
步骤S16,判定步骤S15中算出的|Pi(k)|2与先前算出的映射向量的大小的最大值|Pmax(k)|2的大小关系。
步骤17,如果步骤S16的判定结果为|Pmax(k)|2<|Pi(k)|2,则将|Pi(k)|2更新为新的|Pmax(k)|2,同时将此时的i作成下标imax。
步骤18,在步骤S17的处理之后,或在步骤S16的判定结果为|Pmax(k)|2>|Pi(k)|2时,将i加1。
步骤S19,检验i是否达到设定值N。直到i=N时为止,重复进行由步骤S13至S18的处理,i=N时结束处理程序。
这样,在本实施例中,由于利用残差向量来查找最佳代码向量,无需像现有的正交化查找方法那样在查找循环中对代码向量作正交处理,从而能以很少的计算量进行查找。
实施例2图2示出了第2实施例的向量量化装置的结构。在本实施例中,查找单元1070的结构与图1中所示的实施例1不同。亦即,与实施例1中在查找部1070求取第二映射向量P(k)的大小相对的是,在本实施例的查找单元1070中,用内积值计算单元1073求取残差向量R(k)与由加权单元1030所加权的代码向量X(k)的内积值的大小,并将此值送至评价单元1072。
在评价单元1072中,按照基于该内积值的评价方法查找最佳代码向量。作为基于内积值的评价方法的例子可以是(1)在代码向量组由一个向量构成的情况下内积值的大小较大;(2)在代码向量组由多组构成的情况下内积值之和的大小较大。
图25是为说明本实施例中的代码向量查找处理过程的流程图。其中与图24作同样的限定,采用内积值的二次方作为基于内积值大小的评价值。
步骤S21,进行初始化,设定i=1,imax=1,Emax=0。imax表示作为指定最佳向量的信息的下标,Emax表示内积值的大小的最大值。
步骤S22,计算残差R(k)。
步骤S23,计算出对残差向量作逆卷积运算的向量R'(k)。
步骤S24,计算内积值的大小E=(xi(k),R'(k))2。
步骤S25,判定步骤S24计算出的内积值的大小E与先前计算出的内积值大小的最大值Emax之间的大小关系。
步骤S26,如果步骤S25的判定结果为Emax<E,则将E更新为新的Emax,同时将此时的i作成下标imacx。
步骤S27,在步骤S26的处理之后,或在步骤S25的判定结果为Emax的判定结果为Emax>E的情况时,增加i。
步骤S28,检验是否达到设定值N。在i=N之前重复进行步骤S24至S27的处理,当i=N时,结束处理程序。
在下面的实施例中,因为由图24和图25的适宜组合,修正的流程图表示代码向量查找的处理顺序,所以省略流程图。
本实施例中查找单元1070的内积值的计算,虽然在实施例1中为映射向量计算的近似计算,但具有计算量大幅度减少的优点。例如,采用现有的正交查找来进行同样的工作,就存在着在求内积值之前对代码向量作正交处理的必要,因而增加这部分的计算量。与此相反,本实施例中由于不必作正交处理,所以能以较现有的方法要少得多的计算量来进行代码向量查找。
而在采用多级向量量化装置进行多级量化的情况下,在第k级查找时必须对直至第k-1级的查找中所求得的全部代码向量作正交处理并计算内积值。与此相反,本实施例如求得残差向量,因为内积值的计算与查找级数无关而保持一定,所以级数越多较之现有方法减少计算量的效果就越大。本实施例中所得到的查找结果与现有方法的结果相同(其理由在下述的实施例7中叙述)。
实施例3图3示出了第3实施例的向量量化装置的结构。本实施例中的查找单元1070中,其内积值计算单元1073与评价单元1072之间插入有加权单元1074,以由加权系数计算单元1075根据代码向量求得的加权系数对由内积值计算单元1073求得的内积值的大小作加权处理,以基于此经加权的内积值的评价方法查找最佳代码向量。评价单元1072中的评价方法也可与实施例2中说明的方法相同。
按照本实施例,虽然因为对内积值的大小作加权处理而使计算量有所增加,但提高了查找精度。因此,随着无须进行现有方法中那样的正交处理,而能以很少的计算量进行精度高的查找。
实施例4图4示出了第4实施例的向量量化装置的结构。本实施例中的查找单元为由备用选择单元1370a与基本选择单元1370b组成的二级结构。备用选择单元1370a采用可能的查找方法以尽可能少的计算量进行代码向量查找,选择数个代码向量作为备用选择候补。在此例中,备用选择单元1370a与图3中所示的实施例3中的查找单元1070相同,由评价单元1072,内积值计算单元1073、加权单元1074和加权系数计算单元1075构成,但也可以是与图2中所示的实施例2的查找单元1070相同的结构。
备用选择单元1370a所选择的备用选择候补信息1380被传送给基本选择单元1370b。基本选择单元1370b以针对备用选择候补的高精度查找方法,例如和实施例1所示查找单元1370相同的结构,由备用选择候补中选择一个或多个代码向量作为最佳代码向量,并输出作为查找结果的作为指定最佳代码向量的信息的指针。
本实施例为兼备实施例1和3的优点的结构,具有能以很少的计算量选择更好的代码向量的候补的优点,亦即,备用选择单元1370a因为不进行正交处理来计算内积值,因而能大大减少计算量,而基本选择单元1370b依靠计算完整的评价状态而能使代码向量的查找精度得以提高。
而且可以将查找单元作成三级以上的结构,例如也可以将备用选择单元设置成二级,对第一级备用选择单元中所选择的候补在第二级备用选择单元中作进一步缩小候补,再对第二级备用选择单元所选择的候补进行基本选择。
实施例5图5示出了实施例5的向量量化装置的结构。本实施例改变了图4所示实施例4的基本选择单元1370b的结构。亦即,本实施例中的基本选择单元1370b,在正交化向量计算单元1076中求取将经加权单元1030加权的代码向量在第一基本向量伸展空间上作正交处理的向量。而在评价单元1072b中,则由将经过加权的代码向量按此作正交化的向量的大小进行分割,对由备用选择单元1370a所得的选择备用候补加以评价,以选择最佳代码向量。
实施例6图6示出了采用按照本发明的向量量化装置的向量编码/译码装置的一实施例的结构。编码装置3000对输入的目标向量R进行多级(M级)向量量化。M级量化装置3001~3003中至少一级采用上述实施例1~5中的任一个向量量化装置进行量化。用于指定量化装置3001~3003各自查找得的最佳代码向量的指针,和由增益计算单元3004所得的增益信息被传送至译码装置4000。
在译码装置4000中,按照由编码装置3000所传送的指针,由M级译码装置4001~4003对代码向量进行译码,根据这些值以及增益信号由合成单元4004取得目标向量的量化值。
像这样将实施例1~5用于多级向量量化装置,除了能实现减少计算量的效果之外,由于是递归地处理,所以不管由软件还是硬件来实现这种处理,均能容易地实现处理过程。
实施例7
图7示出了实施例7的向量量化装置的结构。此向量量化装置由代码本111~112、加权单元120、第一查找单元130、残差向量计算单元140和第二查找单元170构成。而第二查找单元170则由评价单元172和映射向量计算单元173组成。
第一查找单元130输出接近于输入端180所输入的目标向量的向量(以下称近似向量)X1。残差向量计算单元140计算近似向量X1与目标向量R的残差向量Rv。此残差向量Rv被输入到映射向量计算单元173。另一方面,分别由代码本111~112逐个选出的代码向量x2~xN经加权单元120加权,被作为经加权的向量组X2~XN输入至映射向量计算单元173。
在映射向量计算单元173中,计算残差向量Rv相对近似向量X1与向量组X2~XN的伸展空间的映射量的大小。评价单元172由代码本111~112中查找该映射向量Rv较大的代码向量,并输出指定该代码向量的信息作为查找结果171。而作为查找结果的表示代码向量自身的代码,也可以是间接地指定这些例如行距周期等的信息。
下面利用图8对按照本实施例的结构求取最佳代码向量的理由作几何上的说明。近似向量X1与向量组X2~XN的线性结合最接近目标向量R的情况是,在目标向量R对X1~XN伸展空间的映射向量作为Rp时,使得偏离向量的大小|R-Rp|为最小。如以近似向量接近目标向量时的残差向量作为Rv和其映射向量作为Rvp,则|R-Rp|=|Rv-Rvp|要使得|R-Rp|成为最小,即与使得|Rv-Rvp|成为最小一样。
这里,Rvp为映射向量,由Rv、Rvp作成的三角形为直角三角形,因此,按三平方定理得出|Rv|2=|Rvp|2+|Rv-Rvp|2在进行查找时,因近似向量X1与目标向量R为固定向量,所以相当于直角三角形的斜边的残差向量Rv也是固定的。因而,使|Rv-Rvp|成为最小,就看作是与使残差向量Rv的映射向量的大小|Rvp|成为最大是等效的。
现对以上所述用算式来进行详细说明。残差向量Rv如式(3)所示Rv=R-(R,X1)|X1|2X1----(3)]]>这里,Rvp为X1~XN所伸展平面上的向量,所表示为Rvp=a1*X1+a2*X2+……+aN*XN (4)系数a1~aN由使得|Rv-Rvp|为最小来确定。其确定方法的细节在日本专利申请平6-96655中予以介绍。将其代入|Rv-Rvp|2式中整理后得|Rv-Rvp|2=|Rv|2-|Rvp|2(5)|Rv|2为固定数,为使映射向量的长Rvp2为最大,即成为相当于使误差|Rv-Rvp|为最小。
这里,式(3)中第二项X1的系数(R,X1)/|X1|2即成为X1接近R时的最佳增益。在编码等情况中对此最佳增益进行量化或求取以最佳增益为依据的值时,也可能由此值来求取残差向量Rv来代替最佳增益(R,X1)/|X1|2。
对于经加权的向量组为一个时的详细计算结果如下。在将Rv的映射向量Rvp作为Rvp=a1*X1+a2*X2 (6)时,此映射向量Rvp的长|Rvp|2按照日本专利申请平6-96655所述的方法,为|Rvp|2={|X1|2*(Rv,X2)2-2*(Rv,X1)(X1,X2)(X2,Rv)+|X2|2*(Rv,X1)}/D…(7)其中D=|X1|2*|X2|2-(X1,X2)2(8)这里,如计算式(3)和X1的内积值,因为(X1,Rv)=0,所以式(7)的第二项、第三项成为0,得出|Rvp|2={|X1|2*(Rv,X2)2}/D(9)因为X1为固定值,所以最后,如下式所知,查找使评价值E为最小的X2即可。
E={(Rv,X2)2}/D(10)这里,对于经加权的向量组为一组的情况,虽然现有的方法广泛采用了正交查找法(平5-506514),而按本实施例则得到与之相同的结果。其理由是,在如式(11)那样利用式(1)将正交查找的式(2)展开并作变形时,即成为与本实施例的式(9)相等。而且由式(11)的第三行至第4行的分子变形即用到式(3)的关系。E=(R,X2v)2|X2v|2X1]]>={(R,X2)-(R,X1)(X1,X2)/|X1|2}2|X2-{(X2,X1)/|X1|2}X1|2]]>=(R-[(R,X1)/|X1|2]X1,X2)2|X2|2-(X2,X1)2/|X1|2]]>=|X1|2·(Rv,X2)2D…(11)]]>在现有的正交查找中,在查找回路内求取促使候补向量X2正交化的X2v来进行查找,与此相对的是在本实施例中,在查找回路外求取促使目标向量R正交化的Rv时,能够考虑在查找回路内不对候补向量X2作正交处理进行查找。从而,因在查找回路内不进行正交处理,因而与现有的正交查找相比,具有大大减少计算量并可获得完全相同结果的优点。
实施例8图9示出了实施例8的向量量化装置的结构。本实施例涉及高效率近似计算评价值的方法,本实施例的第二查找单元170的结构与实施例7不同。亦即,在本实施例中不是像实施例7那样求取映射向量的大小,而是由内积值计算单元174求出残差向量与目标向量I经加权的代码向量)的内积值大小,再由评价单元172求取其内积值较大的代码向量。仅利用内积值的大小,在假定式(10)的分母为恒定值时,就只要计算分子。虽然这是近似计算,常常不能求得最佳代码向量,但却具有能以比实施例7更少的计算量来求取最佳候补值的优点。
实施例9图10示出了实施例9的向量量化装置的结构。本实施例涉及实施例8中的近似计算的精度提高的方法。由加权系数计算单元175求取基于代码向量的加权系数,将此加权系数在加权单元176中与内积值计算单元174求得的内积值的大小相乘所得的值作为评价值。作为加权系数的具体例子,例如可以采用代码向量的乘方的倒数。
按照本实施例,与实施例8相比虽然稍稍增加了计算量,但却具有提高近似精度的优点。关于精度提高的依据以及其它加权系数的例子在日本专利申请平6-65265中有所介绍。
实施例10图11示出了实施例10的向量量化装置的结构。本实施例给出了具有适应代码本211和噪声代码本212的CELP编码方式中的代码本查找单元的处理。如已介绍的那样,通常由适应代码本211选择最佳代码向量,然后再进行噪声代码本212的查找。本实施例即为在此噪声代码本212查找中应用本发明的示例。
在图11中,加到输入端260的输入语音在音响加权单元240中作音响加权,去除前面帧的影响就成为目标向量R。之后,根据此目标向量由适应代码本211查找生成接近的合成语音向量的代码向量,将此代码向量作为x1,通过加权合成滤波器230得到合成语音向量作为X1。在残差向量计算单元140中,按式(12)由合成语音向量X1和目标向量R求取残差向量Rv。Rv=R-(R,X1)|X1|2X1…(12)]]>
在映射向量计算单元173,输出作为映射向量大小的E={(Rv,X2)2}/D (13)其中D=|X1|2*|X2|2-(X1,X2)2(14)X2为将噪声代码本212的候补x2,通过加权合成滤波器230得到的合成语音向量。
在评价单元172中,由噪声代码本212查找出使E值较大的x2,输出查找结果171。
在本实施例中,因为目标向量和适应代码本211的代码向量是在查找前确定的,开始查找前仅作一次残差向量Rv的计算,在噪声代码本212的查找中照原样使用X2,而可能以计算式(13)来进行查找,所以与对X2作正交处理进行查找的正交查找法相比,具有减少计算量的优点。
由放大电路221、222所给出的增益值,通常在求得代码向量后决定,所以在查找中也可以作为1。
而且,代码本的种类也不限于适应代码本和噪声代码本,还考虑二个噪声代码本的组合等。这样,本发明所描述的内容能适用于不依赖于代码本的种类、结构和个数。这在以下的实施例中也是同样的。
实施例11图12示出了实施例11的向量量化装置的结构。在本实施例中,与实施例10同样地求得的残差向量,经过逆卷积运算单元260而成为Rv′。在内积值计算单元174中,将Rv′和噪声代码本212的代码和量x2的内积的二次方值E=(Rv′,x2)2(15)作为评价值输出,评价单元172由噪声代码本212查找出E较大的代码向量,作为查找结果输出。E的值等于按式(16)的关系得到的式(13)的分子的值t t(Rv,X2)=Rv ·HX2=RvH·X2=(R′v,X2)(16)其中,H为加权合成滤波器的脉冲响应矩阵。RvH的计算称之为逆卷积运算,由将向量Rv项作逆序排列,并将加权合成滤波器进行卷积所得的结果再作逆序排列改变来实现。依靠在查找开始前对Rv作逆卷积处理,就不必再由加权合成滤波器在查找中对x2作卷积处理,因而能使计算量减少。
本实施例中,如将式(13)的分母看作不变地进行近似的评价计算,由于采用逆卷积运算就具有较之实施例4能进一步减少计算量的优点。但因为是近似计算,在通常要查找最佳候补时,很多场合下要采用下述的实施例13所述的那样作为备用选择手段。而逆卷积计算也可能是实施例10中的分子计算中所用的过程。
实施例12图13示出了实施例12的向量量化装置的结构。本实施例为提高近似的精度,对与实施例11同样地求得内积值的大小,例如以由加权系数计算单元175求得的代码向量x2的乘方的倒数作为加权系数在加权单元176加权得到的值
E=(Rv′,x2)2/|x2|2(17)以此作为评价值,进行噪声代码本412的查找。这一方法虽然比实施例5增加若干计算量,但具有提高近似计算的精度的优点。其依据以及其它加权系数的例子,在日本专利申请平6-65265中已有披露。
实施例13图14示出了实施例13的向量量化装置的结构。本实施例以实施例6的查找单元作备用选择单元370a、实施例10的查找单元作基本选择单元370b来构成。在实施例的评价公式中,分母的计算,特别是|X2|2的计算比较昂贵。这是因为X2有必要在查找循环内利用合成滤波器时对x2作卷积运算,而|X2|2的计算不使用逆卷积运算。
因此在本实施例中由备用选择单元370a的近似计算选择数个使评价式较大的x2,将其指针和备用选择中的评价式的分子的值作为备用选择候补371送至基本选择单元370b。在基本选择单元370b中,对送来的备用选择候补计算分母值,构成基本选择的评价式,查找使之较大的候补,将表明最佳候补x2的信息作为查找结果171输出。
本实施例为有效利用实施例12和10的优点的结构,具有以少量计算选择更佳候补的优点。而作为备用选择单元,除实施例12之外,也可利用实施例11及其它的结构。
实施例14
对于本实施例,在与图11中所示的实施例10中的噪声代码本212具有VSELP结构的情况下,根据本发明可不改变性能而降低计算量。历来,在将各基本向量经加权合成滤波器作卷积得到的合成语音向量对适应代码本的候补X1进行正交处理后,递归地对相当于式(2)的评价式进行计算,以决定基本向量的代码。
与此相反,本发明中不对基本向量的响应作正交处理,以求取对目标向量作正交处理的残差向量Rv,由递归地对相当于式(10)的评价式进行计算,因而具有以少量计算决定基本向量的代码的优点。而且,如利用实施例13中所述的备用选择与基本选择相结合,就具有以更少的计算量求得基本为最佳代码的优点。
实施例15图15示出了实施例15的向量量化装置的结构。本实施例为将本发明应用于CELP语音编码方式的情况,对输入语音在音响加权单元中作加权得到的目标向量R(0)进行多级向量量化。在第一级查找块1421中,作为初始化值,例如分别将P(0)给予零向量,B(0)给予空集合。这些初始化值是概念上的,也有时不加以明示。由端子1401输入的输入语音经音响加权单元1410处理,成为残差向量的初始化值R(0)。经线性予测分析单元1430分析过的参数被送至各查找块1421~1423的加权单元1030,构成加权合成滤波器。这些查找块1421~1423,由上述说明中的实施例1~14中的任一个的向量量化装置构成。
而在已谈过的CELP语音编码方式中,依靠采用逆卷积运算能相当程度地减少加权合成滤波器中的计算量。虽然作为举例如在图16和17中所示在实施例1、3中采用逆卷积运算的情况,但如作成设置加权合成滤波器的方式,在除实施例1、3外的实施例作同样的处理也能降低计算量。
逆卷积运算单元1630本身的结构大体上与加权合成滤波器相同,不同点在于将输入向量的顺序倒转后进行滤波,并将所得到的向量再次倒转输出的向量作为等价的向量输出。在采用逆卷积运算的情况中,查找单元块1421~1423所输入的线性予测分析单元的参数被送至逆卷积运算单元1630。
在求取残差向量方面,除到目前所述的方法外,还有求取目标向量与其近似向量之差的方法。现对这一方法加以说明。
图18示出了求取第二残差向量的部分的图示,图19则为图18的另一图示。亦即,取第一残差向量与其映射向量的差,等于取目标向量R(0)与其映射向量Q(k-1)的差。利用表明作二级查找的例子的图8对其理由已作了直观的说明。图8的虚线部分R-Rp为目标向量与其映射向量之差,而残差向量与其映射向量的差为Rv-Rvp,两者成为同一向量是十分明显的。
如将这一事实适用于本实施例中,就可能得到图20所示的结构。其中,查找块中所包含的图18的结构的部分替换为图19中所示的结构,输入参考即变成为目标向量R(0)和近似向量Q(k)。这在本质上与图15的结构相同,也可以有其它的结构方法。这并不限于CELP语音编码方式,多级向量量化一般也是同样的。
实施例16图21所示为实施例16的向量量化装置的结构。本实施例为CELP语音编码方式中最易使用的结构的一个示例。也就是,相当于加权单元的加权合成滤波器2130在一系列查找中是共同的,由多个代码本2111~2113的每一个中在各查找块1421~1423中逐个地查找一代码向量。
图22所示为本实施例的查找块的结构示例。采用逆卷积运算与备用选择法能有效地减少计算量。这一实施例除外加代码本和加权滤波器和查找的代码向量的数量为1之外,实质上与实施例2相同。采用同样的变更,其它的实施例也适用于本实施例的查找块。而在不采用逆卷积运算的情况下,亦可不将代码向量输入到直接查找块。
如上所述那样,按照本发明利用残差向量进行最佳代码向量的查找,由于在查找循环内无需对代码向量作正交处理,因而能以比现有的正交查找法少的计算量查找最佳代码向量,特别是在多级化的向量量化装置中计算量减少的效果更大。
权利要求
1.一种向量量化装置,其特征是设置有取得残差向量的手段;由代码向量的集合选择至少一个代码向量的手段;取得与构成由该手段所选择的代码向量和第一基本向量的集合的基本向量相合并的向量的伸展空间的基本向量作为第二基本向量的集合的手段;由所述代码向量的集合查找所述残差向量在所述第二基本向量的集合的伸展空间映射得的映射向量的大小较大的代码向量组的查找手段;和输出指定由该查找手段所查找得的向量组的信息的手段。
2.一种向量量化装置,其特征是设置有取得残差向量的手段;由代码向量的集合选择至少一个代码向量的手段;由所述代码向量的集合查找基于该手段所选择的代码向量与所述残差向量的内积值的大小的评价值较大的代码向量的查找手段;和输出指定由该查找手段查找得的代码向量组的信息的手段。
3.一种向量量化装置,其特征是设置有求取残差向量的手段;由代码向量集合选择至少一个代码向量的手段;由所述代码向量的集合查找根据以基于所述代码向量的加权系数对由该手段所选择的代码向量与所述残差向量的内积值的大小作加权所得的值进行评价的较大值的代码向量组的查找手段;和输出指定该查找手段查找得的向量组的信息的手段。
4.一种向量量化装置,其特征是设置有求取残差向量的手段;由代码向量的集合选择至少一个代码向量的手段;利用权利要求2或3中所述的查找手段由所述代码向量的集合选择多组代码作为备用选择候补的备用选择手段;由所述备用选择候补中利用权利要求1所述的查找手段选择至少一组代码向量作为最佳代码向量的基本选择手段;和输出指定所述最佳代码向量组的信息的手段。
5.一种向量量化装置,其特征是设置有求取残差向量的手段;由代码向量的集合选择至少一个代码向量的手段;采用权利要求2或3所述的查找手段由所述代码向量集合选择多组代码向量作为备用选择候补的备用选择手段;由所述后备选择候补选择使所述备用选择手段中所用的内积值的大小以所述第一基本向量的集合所伸展的平面上作正交化的代码向量的大小分割的值较大的代码向量作为最佳代码向量组的基本选择手段;和输出指定所述最佳代码向量组的信息的手段。
6.一种向量量化装置,其特征是设置有求取接近目标向量的近似向量的手段;利用所述目标向量与所述近似向量求取残差向量的手段;查找所述残差手段对所述近似向量与代码向量的集合的伸展空间的映射向量的大小较大的代码向量的查找手段;和输出指定由该查找手段查找得的代码向量的信息的手段。
7.一种向量量化装置,其特征是设置有求取接近目标向量与所述近似向量求取残差向量的手段;利用所述目标向量与所述近似向量求取残差向量的手段;查找代码向量与所述残差向量的内积值的大小较大的代码向量的查找手段;和输出指定由该查找手段查找得的代码向量的信息的手段。
8.一种向量量化装置,其特征是设置有求取接近目标向量的近似向量的手段;利用所述目标向量与所述近似向量取得残差向量的手段;查找将代码向量与所述残差向量的内积值的大小以基于所述代码向量的加权系数加权所得值较大的代码向量的查找手段;和输出指定由该查找手段查找得的代码向量的信息的手段。
9.一种向量量化装置,其特征是设置有以权利要求7或8所述查找手段选择多个代码向量作为备用选择候补的备用选择手段;由所述备用选择候补利用权利要求6所述的查找手段选择至少一组代码向量作为最佳代码向量候补的选择手段;和输出指定所述最佳代码向量候补的信息的手段。
10.如权利要求2,3,7,8中任一项所述向量量化装置,其特征是,以所述代码向量与将所述残差向量作逆卷积运算所得的向量的内积值来求取所述内积值。
全文摘要
本发明提出的一种向量量化装置,能减少主要用于语音偏码方式的代码本查找等的向量量化中的计算量,以较少的计算量查找最佳向量。其中具有求得接近目标向量R的近似向量X1的第一查找单元130;由目标向量R与近似向量X1求取残差向量Rυ的残差向量计算单元140;求得将向量x2~xN加权后的向量组X2~XN的加权单元120;和以残差向量Rυ对近似向量X1与经加权的向量组X2~XN的伸展空间的映射向量的大小作评价值、查找该评价值较大的代码向量的第二查找单元170。
文档编号G10L19/00GK1120268SQ9510715
公开日1996年4月10日 申请日期1995年5月25日 优先权日1994年5月27日
发明者天田皇, 三关公生, 赤岭政已, 押切正浩 申请人:株式会社东芝
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1