参数编码中的信号分量的连接的制作方法

文档序号:2822927阅读:268来源:国知局
专利名称:参数编码中的信号分量的连接的制作方法
技术领域
本发明涉及一种如权利要求1的前序部分中所述的连接单元。该连接单元用于产生连接信息,该信息指示连续(通常叠加)扩展部分sp和sc的分量,将它们连接到一起以形成一正弦曲线,该部分sp和sc近似于正弦音频或语音信号的连续部分。本发明还涉及一如权利要求8所述的前序部分的参数编码器,以及如权利要求9前序部分所述的用于产生所述连接信息的方法。
背景技术
在现有技术中,基本有两种不同的方法可以提供用于建立连续部分的正弦曲线的连接信息L。第一种方法如WO00/79519(PHN017502EP.P)中所述,根据包括前面或当前部分得到的幅度、频率和相位信息的正弦输入数据,对原始音频或语音信号的泛音信号进行重组。重组的泛音信号与原始的音频或语音信号进行比较。加权的均方错误信号建议作为选择相关连接的准则,即产生连接信息L的标准。
第一种方法不仅考虑到幅度和频率信息,以得到最好的连接连续部分,而且考虑到前面和当前部分的分量的相位信息。但是,第一种方法的缺点是它的计算量太大,以及需要原始信号才能产生连接信息。
根据现有技术中的第二种方法,产生连接信息只需要考虑当前和前面部分的正弦编码数据的幅度和频率信息,而不需相位信息。现在参照图5说明所述的第二种方法。
图5示出权利要求1所述的连接单元500。它包括一计算单元520,用于产生对应接收到的正弦编码数据Dp’、Dc’的相似矩阵S(m,n)。所述正弦编码数据包括扩展的前面部分sp的M个分量xm(m=1...M)和扩展的当前部分sc的N个分量yn(n=1-N)的幅度和频率信息。相似矩阵S(m,n)表示所述扩展的前面部分sp的第m个分量xm和所述扩展的当前分量sc的第n个分量之间的相似度,其中m=1..M、n=1...N。所述相似矩阵S(m,n)被输入到估计单元,该单元对所述相似矩阵进行估计,通过选择那些相似度最大的分量m\n对从而产生所述连接信息L。
因此,连接信息L指示那些连续的扩展部分的分量对,当在存储和传输后再次存储音频或语音信号时,这些部分可连接到一起,从而使其连续部分或分量之间的过渡变得尽量平滑。平滑的过渡提高了再次存储的信号的质量。
以下,即使各单独的分量有很小的变化,如幅度或频率变化,连续部分的连接的分量也称之为正弦轨迹。
第二种方法的申请已经被B.Edler,H.Ferekidis在1996年5月11-14日copenhagen、Preprint4179(F-6)100thAES Convention中的“对小位率的ASAC分析/综和编码”中说明。
在该文章中,作者假设频率和幅度中的相对距离的复数作为产生连接信息的附加标准。换句话说,连接信息指示是否和前面和当前的部分中的那个分量将作为属于同一正弦缝隙的局部估计。根据第二种方法,可不考虑原始音频和语音信号就产生连接信息;但是,由于第二种方法是只根据估计的正弦编码数据产生连接信息,因此产生的连接信息可能是错误的,且所提供的曲线也可能是不正确的。
发明概要从所述第二种方法开始,本发明的目的是改进现有的连接单元,提供用于产生连接信息的参数编码器和方法,从而使便于连接到一起的连续部分的分量的选择得以改进,产生正确的正弦曲线。
该目的可通过权利要求1的方案实现。根据权利要求1的特征部分,扩展的正弦编码数据应当不仅包括幅度和频率信息,而且包括M个分量xm中的至少一些和N个分量yn的至少一些的相位的信息。另外,连接单元的计算单元可通过考虑扩展的前面部分sp的第m个分量xm和当前部分sc的第n个分量yn之间的相位一致性,来计算相似度矩阵S(m,n)。
另外,所提的连接单元只使用了估计的包括相位信息的正弦编码数据,用于产生连接信息。通过另外考虑相位信息,不考虑原始的音频和语音信号,就可以实现与第二种方法相比更精确的相似度矩阵的判断和更可靠的连接信息的判断。
根据第一实施例,计算单元包括第一图案产生单元,用于产生所述的扩展的前面部分sp的M个复数分量xm(t);第二图案产生单元,用于产生扩展的当前部分sc的N个复数分量yn(t)。根据本发明,为了评价前面和当前部分的各分量之间的相位一致性,需要对这些复数和时基的分量进行精确计算。
另外,计算模块可计算相似度矩阵S(m,n),产生的第一相似度S1(m,n)表示m和n分量之间的形状相似度,第二相似度矩阵S2(m,n)表示幅度相似度。另外,本连接单元实施例的优点也在从属权利要求4-7中说明。
本发明的目的还可通过权利要求8的参数编码器和权利要求9的用于产生连接信息的方法而实现。参数编码器和方法的优点基本上对应于上述对连接单元所述的优点。
附图简介说明书中有五幅附图,图1示出本发明的连接单元;图2示出图1的连接单元中的计算单元;图3示出两个连续部分的两个分量之间的相似度;图4示出本发明的参数编码器;图5示出现有技术中的连接单元。
实施描述在参照


本发明最佳实施例之前,现提供一些关于信号部分的正弦模型的背景信息。
在正弦模型中,该模型通常具有这样的形式(或可改写如下) 其中,seg为接近或模拟正弦信号的一部分的部分。在这些模型中,部分seg由等式(1)的右半部分给出的式子表示,其中R表示一复变数的实数部分uk表示部分seg的K个正弦或类似正弦的部分分量。
特别是,对一完全的第一正弦模型(扩展),部分的分量为uk(t)=Akej(ωKt+μ)----(1)]]>其中Ak、ωk和uk(实数值)分别表示幅度、频率和相位,j=-1.]]>根据第二模型,该部分的分量被定义为uk(t)=Ake(σk+jωk)t+jμk----(2)]]>其中,Ak、ωk和μk用在完全的正弦模型中,并增加了一附加的参数σk。σk为一实数参数,它捕捉部分中的幅度变化。
一第三个更为详细的模型基于多项式,uk(t)={Σm=0Mbk,mtm}exp{jΣn=0Nφk,ntn}----(3)]]>={Σm=0MBk,mtm}exp{jΣn=0Nφk,ntn}]]>具有实数参数bk、m和k、n或复变数幅度Bk,m=bk,mejφk,0.]]>最后根据第四个模型,部分的分量被定义为uk(t)=Σm=0MCk,mtmexp{Σn=0Nθk,ntn}----(4)]]>具有实数参数θk,n和复变数参数Ck,m。
如果考虑两个连续信号部分sp和sc(分别为前面和当前部分),然后通常在它们的支撑处具有一重叠。下文中,前面部分中的uk由xm(m=1...M)表示,当前部分中的uk由yn(n=1...N)表示。为了建立有利的连接(以编码方式)最好xm(t)和yn(t)只有在重叠区域相似时,才考虑sp的分量m和sc的分量n之间的连接。
下面将参照图1-4说明本发明的实施例。
图1示出本发明的一连接单元100。它包括一用于产生相似度矩阵S(m,n)的计算单元120和一用于产生连接信息L的估计单元140。计算单元120的操作基本上对应于计算单元520的操作,估计单元140的操作基本上对应于估计单元540的操作,520和540都在参照图5的背景技术中进行说明。但是,本发明的连接单元100和现有技术的连接单元500之间仍然存在不同。
计算单元120不仅接收前面的幅度和频率形式的正弦编码数据,而且接收还包括关于前面部分sc的所有分量xm和当前部分sc的各N个分量yn的相位的扩展的正弦编码数据。
因此,计算单元120不仅要考虑幅度和频率数据,而且要考虑扩展的前面部分sp的第m个分量xm和扩展的当前部分sc的第n个分量yn之间的相位一致性,才能计算相似度矩阵S(m,n),其中m=1...M,n=1...N。估计单元140接收并估计所述计算单元120输出的相似度矩阵S(m,n),从而通过选择那些相似度较高的分量对(m,n),产生所述的连接信息。
图2示出本发明计算单元。可以看到,计算单元120包括一第一图形产生单元122,该单元用于根据前面部分的扩展的正弦编码数据(Dp)产生所述的扩展的前面部分sp的M个分量xm(t),m=1...M。另外,计算单元120包括一第二图案产生单元124,用于根据当前部分扩展的正弦编码数据(Dc),产生所述的扩展的当前部分sc的N个分量yn(t),n=1...N。最后,计算单元120包括一计算模块126,用于根据前述的相似度标准的所述接收的M个分量xm(t)和接收的N个分量yn(t),计算相似度矩阵S(m,n)。
分量xm(t)和yn(t)被产生并输入到计算模块126,从而确定两个分量m和n之间的相位一致性,利用该相位一致性信息计算相似度矩阵。
下面说明的本发明的两个实施例是用于执行相似度矩阵S(m,n)的计算。这两个实施例相同之处在于相似度矩阵最好但不是必需通过表示两个分量m和n的形状之间相似度的第一相似度矩阵S1(m,n)和表示所述分量m和n的幅度之间相似度的第二相似度矩阵S2(m,n)相乘来计算。然后,相似度矩阵根据下面公式来计算
S(m,n)=S1(m,n)S2(m,n),(5)S(m,n)=0意味着没有连接,S(m,n)越大,正弦编码方案中就越可能出现连接。
计算相似度矩阵S的第一实施例是基于对一完全重叠区域中的前面和当前的部分的相似度的考虑进行的。所述第一实施例的目的是识别相似的前面和当前部分的分量。这可通过相关方法实现。因此,根据第一实施例,相关系数ρm,n被定义为ρm,n=Σtw(t)xm(t)yn*(t)ExmEyn----(6)]]>其中xm(m=[1,M])表示前面部分Sp的一组分量Xm,yn(n=[1,N])表示当前部分Sc的一组分量yn。另外,w(t)表示窗口函数,Exm表示信号Xm中的能量Exm=Σtw(t)xm(t)xm*(t)----(7a)]]>类似的,Eyn表示分量yn中的能量Eyn=Σtw(t)yn(t)yn*(t)----(7b)]]>因此,ρm,n为一复数,对应一连接,近似于1。因此,第一相似度矩阵S1(m,n)通过下式,作为一(部分)相似度标准
其中1<D1<1。
另外,幅度中的等值(或者,特别是能量中)可通过下式,考虑进来Rm,n=min{ExmEyn,EynExm}.----(9)]]>一连接的增益R应当近似于1(相对于ρm,n,Rm,n为一实值)S2(m,n)作为相似度标准被定义为 其中1<D2<1。
如果前面部分sp由M个分量表示,当前分量sc由N个分量表示,第一矩阵S1和第二矩阵S2以及整个相似度矩阵S都为M×N矩阵。如果出现连接,则确定所述矩阵S的元素,如果这样,它们是最佳的部分。这些部分为那些相似度值最高的部分。在计算单元140中计算相似度矩阵S(m,n)。
用于计算相似度矩阵S的本发明第二实施例为第一实施例的简化。特别的,并不是考虑连续部分之间的全部重叠区域,而是所述区域的中间点。在该点,下文中表示为t0,为xm(t0)≈yn(t0) (11)在第二实施例中,在t0的附近,分量彼此相配。如果分量中的进度(大步的)(几乎)相同,则可实现。最好根据下面公式,通过两个连续部分Sp和Sc的分量的比率来进行估计xm(t0+1)xm(t0)≈yn(t0+1)yn(t0)----(12)]]>为了选择连接,第一(部分)相似度矩阵现在被定义为 其中0<D3<1这里,幅度相似度以相对的方式被包括。这符合心理声学相关性和距离标准。
第一部分相似度矩阵S2被定义为 其中0<D4<1用于计算整个相似度矩阵S的第二实施例与第一实施例不同之处在于分量Xm和Yn只需要以特定距离产生,即t0和t0+1。
图3示出本发明连接单元的操作。其中前面部分Sp的分量xm(t)至少与连续的当前部分Sc的分量yn(t)在重叠区域OR部分重叠。计算单元120和特别是计算模块126用于分析重叠区域两个分量之间的相似度。如果两个分量至少在图3所示的重叠区域中相同,则,相似度矩阵S(m,n)中的对应元素应被设为1或至少近似于1。幅度、频率和相位相似度可被识别,和由估计单元140估计,结果是所述图1中的估计单元140产生的连接信息可指示两个分量当前估计属于同一正弦轨迹。
图4示出本发明的参数编码器400。所述编码器用于将音频和/或语音信号编码为包括正弦编码数据和连接信息的数据流ds。编码器400包括一分割单元410,用于将所述信号s分割为至少一个前面部分sp’和一连续的当前部分sc’。编码器400还包括一正弦估计单元420,用于产生所述正弦编码数据,该数据的形式为近似于所述部分sp’的扩展的前面部分sp的M个分量xm(m=1...M)和近似于所述部分sc’的扩展的当前部分sc的N个分量yn(n=1...N)的频率、幅度和相位数据。所述从正弦估计单元420输出正弦编码数据被输入如参照图1所述的、用于产生连接信息L的连接单元100。所述连接信息被输入一安排单元430,用于通过近似的安排或合成,例如从正弦估计单元420输出的正弦编码数据和连接信息相成,产生数据流。该安排单元430最好为一乘法器。
对真正的音频信号,考虑相位信息将提高编码的原料的质量。但是,在编码器400中,相位信息只有当搜索到轨迹参数的连续才被使用。如果前一帧的数据的频率不具有一向后延续(即,不是一轨迹,而是在与当前帧数据连接后,变为轨迹的开始)然后,使用相位信息,但只根据频率和幅度数据执行前面连接程序。原因是在轨迹的开始处,相位通常并没有很好的限定。这意味着为了转向的目的,前一部分sp的连接信息被输入到图3中的计算模块126中。
除了察看复数值xm和ym之间的(相对)差别外,也可察看实数和虚数部分或幅度和相位,并将它们用于构造相似度标准。优点是除了两个控制上述给出的相似度标准的参数外,每一变量的一个或多个参数也被接收。因此,以实数参数而不是复数参数形式表达,通常具有两倍参数。如,将复数信号分为幅度和相位具有使相位的相似度标准更容易进行频率扩展的优点。
需要注意的是,上述实施例并不局限本发明,本领于技术人员可以在不脱离权利要求范围的情况下设计多种变化的实施例。在权利要求中,所有的括号中的附图标记只是用于解释权利要求。’包括’并不排除其它缺省的部件或步骤。本发明可通过包括多个独立元件的硬件装置和正确编程的计算机实现。在列举了多种装置的产品权利要求中,这些装置中的一些可通过硬件的一个和相同的部分实现。在多个从属权利要求中所述的特定标准并不指这些标准的合并不能更好的使用。
权利要求
1.连接单元(100),用于产生指示两个连续扩展部分sp和sc的分量的连接信息L,该两个部分彼此部分重叠,并能够彼此连接以形成一正弦轨迹,部分sp和sc近似于一正弦音频或语音信号s的连续部分,该连接单元包括一计算单元(120),用于根据接收到的正弦编码数据产生一相似度矩阵S(m,n),该正弦编码数据包括扩展的前面部分sp的M个分量xm,其中m=1...M,和扩展的当前部分sc的N个分量,其中n=1...N,的幅度和频率的信息,其中所述相似度矩阵的值表示所述扩展的前面部分sp的第m个分量xm和所述扩展的当前部分sc的第n个分量yn之间的相似度,其中,m=1...M,n=1...N;一估计单元(140),用于接收和估计所述相似度矩阵S(m,n),从而通过选择至少在重叠部分范围相似度最大的分量对(m,n),产生所述连接信息L,其特征在于正弦编码数据(Dp,Dc)通过还包括关于M个分量xm的至少一些和N个分量yn的至少一些的相位的信息,得以扩;计算单元(120)用于通过另外估计所述扩展的前面部分sp的第m个分量xm和所述扩展的当前部分sc的第n个分量yn之间的相位一致性,计算相似度矩阵S(m,n)。
2.如权利要求1所述的连接单元,其特征在于计算单元包括一第一图形产生单元(122),用于根据前面部分的扩展的正弦编码数据(Dp),产生所述扩展的前面部分sp的M个分量xm(t),m=1...M;一第二图案产生单元(124),用于根据当前部分的扩展的正弦编码数据(Dp),产生所述扩展的当前部分sc的N个分量yn(t),n=1...N;一计算模块(126)。用于根据利用前面相似度标准得到的所述接收的M分量xm(t)和接收的N个分量yn(t),计算相似度矩阵S(m,n)。
3.如权利要求2所述的连接单元,特征在于计算模块(126)用于计算整个相似度矩阵S(m,n),根据S(m,n)=S1(m,n)S2(m,n)其中第一相似度矩阵S1(m,n)表示形状的相似度,第二相似度矩阵S2(m,n)表示分量m和n之间的幅度或能量的相似度。
4.如权利要求3所述的连接单元,特征在于相似度S1(m,n)被定义为 式中0<D1<1和其中ρm,n=Σtw(t)xm(t)yn*(t)ExmEyn]]>其中ρm,n为作为交叉相关的系数的相似度标准,该系数表示分量xm(t)和yn(t)之间的形状的相似度w(t)为窗口函数y*m(t)为ym(t)的复数共厄分量;Exm为信号xm中的能量,Exm=Σtw(t)xm(t)xm*(t);]]>Eyn为信号yn中的能量,Eyn=Σtw(t)yn(t)yn*(t).]]>
5.如权利要求4所述的连接单元,特征在于第二相似度矩阵S2(m,n)被定义为 式中0<D2<1其中Rm,n=min{ExmEyn,EynExm}.]]>
6.如权利要求3所述的连接单元,特征在于计算模块(126)用于根据下式计算第一相似度矩阵S1(m,n) 式中0<D3<1。
7.如权利要求6所述的连接单元,特征在于计算模块(126)用于根据下式计算第二相似度矩阵S2(m,n) 式中0<D4<1。
8.参数编码器(400),用于将音频和/或语音信号编码为包括正弦编码数据和连接信息L的数据流,该编码器400包括一分割单元(410),用于将所述信号s分割为至少一个前面部分sp’和一连续的当前部分sc’;一正弦估计单元(420),用于产生所述正弦编码数据,该数据的形式为近似于所述部分sp’的扩展的前面部分sp的M个分量xm(m=1...M)和近似于所述部分sc’的扩展的当前部分sc的N个分量yn(n=1...N)的频率、幅度和相位数据;一计算单元(120),用于根据接收到的正弦编码数据产生一相似度矩阵S(m,n),其中所述相似度矩阵的值表示所述扩展的前面部分sp的第m个分量xm和所述扩展的当前部分sc的第n个分量yn之间的相似度,其中,m=1...M,n=1...N;一估计单元(140),用于接收和估计所述相似度矩阵S(m,n),从而产生所述指示相似度最大的分量对m,n的连接信息L;一安排单元(430),用于通过近似的安排所述幅度、频率和连接信息,产生表示原始音频或语音信号的数据流;其特征在于正弦编码数据估计单元(420)用于还产生一关于M个分量xm的至少一些和N个分量yn的至少一些的相位的信息;和计算单元(120)用于通过另外考虑扩展的前面部分sp的第m个分量xm和扩展的当前部分sc的第n个分量yn之间的相位一致性,计算相似度矩阵S(m,n)。
9.用于产生连接信息L的方法,该信息指示连续的部分重叠的附加部分sp和sc的分量,这两个部分应该连接在一起形成一正弦轨迹,部分sp和sc近似正弦音频或语音信号s的连续部分,该方法包括以下步骤提供正弦编码数据,该数据包括关于扩展的前面部分sp的M个分量,m=1...M和扩展的当前部分sc的N个分量yn,=1...N,的幅度和频率信息;根据特定的相似度标准计算相似度矩阵S(m,n),其中相似度矩阵表示所述扩展的前面部分sp的第m个分量xm和所述扩展的当前部分sc的第n个分量yn之间的相似度,其中,m=1...M,n=1...N;估计所述相似度矩阵S(m,n),从而通过选择相似度最大的分量对m,n,产生所述连接信息L;其特征在于提供正弦编码数据的步骤还包括提供关于M个分量xm的至少一些和N个分量yn的至少一些的相位的信息;和通过另外考虑所述扩展的前面部分sp的第n个分量yn和所述扩展的当前部分sc的第m个分量xm之间的相位一致性,计算相似度矩阵S(m,n)。
全文摘要
一种连接单元(100),参数编码器(400)和产生连接信息L的方法,该信息指示应当连接在一起形成正弦轨迹的连续的扩展的部分sp和sc的分量。该连接单元包括一计算单元(120),用于根据接收到的正弦编码数据产生一相似度矩阵S(m,n),一估计单元(140),用于接收和估计所述相似度矩阵S(m,n),从而通过选择相似度最大的分量对m,n,产生所述连接信息。根据本发明,计算单元(120)用于通过另外估计所述扩展的前面部分sp和所述扩展的当前部分sc的分量之间的相位一致性,计算相似度矩阵S。这样,可连接在一起的分量的选择就被提高,从而可以正确的定义轨迹。
文档编号G10L19/02GK1418362SQ01806626
公开日2003年5月14日 申请日期2001年12月20日 优先权日2001年1月16日
发明者A·C·登布林克, A·W·J·奥门, F·M·J·德帮特, E·G·P·舒伊耶尔斯 申请人:皇家菲利浦电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1