立体声编码和解码的方法及其设备的制作方法

文档序号:7746314阅读:150来源:国知局
专利名称:立体声编码和解码的方法及其设备的制作方法
技术领域
本发明涉及编码数据的方法,例如涉及一种利用可变的数据分量的角度旋转来编 码音频和/或图像数据的方法。此外,本发明还涉及使用这些方法的编码器,并涉及用于对 这些编码器所生成的数据进行解码的解码器。另外,本发明关注经由数据载体和/或通信 网络传递的编码数据,这种编码数据根据上述方法产生。
背景技术
已知许多用于编码音频和/或图像数据以便产生相应编码输出数据的当代方 法。一个编码音频的当代方法示例是公知为MP3的MPEG-ILayer III,其被记载于IS0/IEC JTC1/SC29/WG11 MPEG, ISl1172-3,Information Technology-Coding of Moving Picture and Associated Audiofor Digital Storage Media at up to about 1.5Mbit/s, Part 3 :Audio(信息技术-以直至约1. 5Mbit/s为数字存储介质编码移动图片和相关音频,第3 部分音频),MPEG-I,1992。这些当代方法中的某些方法用来改进编码效率,即通过使用 中/侧(M/S)立体声编码或和/差立体声编码提供增强的数据压缩,J. D. Johnston和A. J Ferreira 于 1992 年 3 月在加利福尼亚的旧金山 Proc. IEEE,Int. Conf. Acoust. ,Speech and Signal Proc. II :569_572 的"Sum-difference stereo transformcoding (禾口 -差立体声 转换编码)”中对和/差立体声编码进行了阐述。在M/S编码中,立体声信号分别包括左声道和右声道信号1 [η]、!"[η],例如通过应 用式1和2(Eq. 1和2)描述的处理将它们编码为一个和信号m[n]和一个差信号s[n]m[n] = r[n]+l[n]s [η] = r[n]-l[n]
当信号l[n]和r[n]几乎相同时,由于差信号s[n]接近零并因而输送相对少量 息而和信号有效包括了大部分信号信息内容,M/S编码能够提供有效的数据压缩。这种情 况下,表示和信号和差信号所要求的比特率接近独立编码信号l[n]和r[n]所要求的一半。式1和2容许以式3 (Eq. 3)中旋转矩阵的方式表示 其中c为通常用于防止限幅的恒定比例缩放系数。尽管式3有效对应信号1 [n]、r [η]旋转45°,但如式4(Eq.4)中所提供的那样, 其它旋转角度是可能的,其中α为应用到信号1 [η]、r[η]的旋转角度,产生此后分别被描述为主要信号和残留信号的相应编码信号m' [n]、s' [η] ,cos(a) sin(a)Y /["]、 、-sin(a) cos(a) 角度α被有利地为可变的,以通过减少残留信号s' [η]中出现的信息内容并集 中信息内容在主要信号m' [η]中(即最小化残留信号s' [η]中的能量并由此最大化主 要信号m' [η]中的能量)来为大范围的信号l[n]、r[n]提供增强的压缩。式1-4表示的编码技术通常不应用到宽带信号,而是应用到多个子信号,每个子 信号只表示用来输送音频信号的全带宽的一个较小部分。此外,式1-4的技术还通常应用 到信号l[n]、r[n]的频域表示。在公布的美国专利US 5621855中,其中阐述了一种对具有第一和第二信号分量 的数字信号进行子带编码的方法,该数字信号被子带编码,用以响应第一信号分量产生具 有第一q采样信号块的第一子带信号并响应第二信号分量产生具有第二q采样信号块的第 二子带信号,第一子带信号和第二子带信号处于相同的子带,且第一和第二信号块在时间 上等价。第一和第二信号块被处理,用以在时间等价采样的点表示之间获得一个最小距离 值。当最小距离值小于或等于阀值距离值时,在第一块的每个采样乘以cos( α)并将第二 信号块的每个采样乘以-sin(a)之后,通过将第一和第二信号块中的各个时间等价采样 对加到一起来获得一个包括q采样的合成块。尽管前述旋转角度α的应用容许减少其中只应用45°旋转的M/S编码的许多缺 点,但也会发现当这些方法应用到信号组时是有问题的,例如立体声信号对,当其中出现可 观的相对的相互相位或时间偏移时。本发明旨在解决这一问题。

发明内容
本发明的一个目的是提供一种编码数据的方法。根据本发明的第一方面,提供了一种编码多个输入信号(1,r)以产生相应编码数 据的方法,该方法包括步骤处理输入信号(l,r)以确定第一参数(灼),所述第一参数(朽)描述信号(l,r) 间相对相位差异和时间差异中的至少一个,并应用这些第一参数处理输入信号以产生相应 的中间信号;处理中间信号和/或输入信号(1,r)以确定第二参数,所述第二参数描述生成主 要信号(m)和残留信号(s)所需要的中间信号的旋转,所述主要信号(m)的幅值或能量大 于残留信号(s),并应用这些第二参数处理中间信号以产生主要信号(m)和残留信号(s);量化第一参数、第二参数,并编码至少部分主要信号(m)和残留信号(S)以产生相 应量化数据;以及多路复用量化数据以产生编码数据。本发明的优势在于能够提供更有效的数据编码。优选地,在该方法中,编码数据只包括残留信号(S)的一部分。部分包含残留信号 (S)能够增强编码数据中可达到的数据压缩。更优选地,在该方法中,编码数据还包括一个或多个指示包含在编码数据中的残
6留信号部分的参数。这些指示参数容许使编码数据的后续解码的复杂性降低。优选地,该方法的步骤(a)和(b)通过对频域(l[k],r[k])中表示的输入信号 (l[n],r[n])实施复旋转实现。实施复旋转能够更有效地处理多个输入信号之间出现的相 对时间和/或相位差异。更优选地,在频域或子带域执行步骤(a)和(b)。“子带”被理解 为小于一个信号所需完整频率带宽的频率区域。优选地,在包括输入信号(l、r)的完整频率范围的子部分中应用该方法。更优选 地,通过其它编码技术对该完整频率范围的其它子部分进行编码,例如前述的传统M/S编码。优选地,该方法包括在步骤(C)之后的附加步骤,该步骤无损耗地编码量化数据 以提供用于在步骤(d)中多路复用的数据以产生编码数据。更优选地,使用Huffman编码 来实现该无损耗编码。使用无损耗编码能够实现潜在地更高的音频质量。优选地,该方法包括通过删除残留信号(S)中出现的感知上无关的时频信息来对 残留信号(s)进行操作的步骤,所述操作后的残留信号(s)贡献到编码数据(100)中,并且 所述感知上无关的信息对应输入信号频谱_时间表示中的选定部分。删除感知上无关的信 息使本方法能够在编码数据中提供更高程度的数据压缩。优选地,在该方法的步骤(b)中,通过最小化残留信号(S)的幅值或能量导出第二 参数(α ;HD, P)。同其它导出参数的方法相比,这种方法生成第二参数在计算上是高效 的。优选地,在该方法中,通过信道间强度差参数和相干参数(UD,P )表示第二参数 (α ;UD,P)。该方法的这种实现能够提供对现有参数立体声编码和相关解码硬件或软件 的向后兼容。优选地,在该方法的步骤(C)和(d)中,编码数据被安排在多个重要层中,所述层 包括输送主要信号(m)的基层、包含对应多个立体声告知参数的第一和/或第二参数的第 一增强层、输送残留信号(s)的表示的第二增强层。更优选地,第二增强层还被再分为第一 子层和第二子层,第一子层用于输送残留信号(s)的主要相关(mostrelevant)时频信息, 第二子层用于输送残留信号(s)的次相关(lessrelevant)时频信息。这些层和子层按要求 表示输入信号能够增强编码信号传输错误的稳定性并使其对更简单的解码硬件向后兼容。根据本发明的第二方面,提供了一种编码器,用于编码多个输入信号(1,r)以产 生对应的编码数据,该编码器包括第一处理装置,用于处理输入信号(l,r)以确定描述信号(l,r)间相对相位差异 和时间差异中至少一个的第一参数(朽),所述第一处理装置可操作地应用这些第一参数 (灼)来处理输入信号以便产生对应的中间信号;第二处理装置,用于处理中间信号以确定描述产生主要信号(m)和残留信号(S) 所需要的中间信号的旋转,所述主要信号(m)的幅值或能量高于残留信号(s),第二处理装 置可操作地应用这些第二参数处理中间信号以产生至少主要信号(m)和残留信号(s);量化装置,用于量化第一参数(灼)、第二参数(α ;UD, P)以及至少部分主要 信号(m)和残留信号(s)来产生对应的量化数据;以及多路复用装置,用于多路复用量化数据以产生编码数据。该编码器的优点在于其能够提供有效的数据编码。
优选地,该编码器包括通过删除残留信号(S)中出现的感知上无关的时频信息来 操作残留信号(s)的处理装置,所述变换残留信号(s)贡献到编码数据(100)中,且所述感 知上无关的信息对应输入信号频谱_时间表示中的选定部分。删除感知上无关的信息使编 码器能够在编码数据中提供更高程度的数据压缩。根据本发明的第三方面,提供了一种解码编码数据以重新产生多个输入信号的相 应表示(Γ,r')的方法,所述输入信号(1,r)已被在先编码产生所述编码数据,该方法 包括步骤多路分解编码数据以产生相应的量化数据;处理量化数据以产生相应的第一参数(Vi )、第二参数以及至少一个主要信号 (m)和一个残留信号(s),所述主要信号(m)的幅值或能量高于残留信号(s);通过应用第二参数旋转该主要信号(m)和残留信号(s),以产生相应的中间信号; 以及通过应用第一参数(fPi )处理中间信号以重新产生所述输入信号的所述表示 (Γ,r'),第一参数(灼)描述信号(l,r)间相对相位差异和时间差异中的至少一个。该方法提供了能够对已使用根据本发明第一方面的方法有效编码的数据进行有 效解码的优点。优选地,该方法的步骤(b)还包括对残留信号(S)的丢失时频信息适当补充从主 要信号(m)中导出的合成残留信号的步骤。所述合成信号的产生能够导致有效解码编码数 据。优选地,在该方法中,编码数据包括多个指示残留信号(S)的哪些部分被编码到 编码数据中的参数。包括这些指示参数能够使编码要求高效和更少量的计算。根据本发明的第四方面,提供了一种解码器,用于解码编码数据以重新产生多个 输入信号的相应表示(Γ,r'),所述输入信号(l,r)已被在先编码产生编码数据,该解码 器包括多路分解装置,用于多路分解编码数据以产生相应的量化数据;第一处理装置,用于处理量化数据以产生相应的第一参数(钓)、第二参数以及 至少一个主要信号(m)和一个残留信号(s),所述主要信号(m)的幅值或能量高于残留信号 (s);第二处理装置,用于通过应用第二参数来旋转主要信号(m)和残留信号(s),以产 生相应的中间信号;以及第三处理装置,用于通过应用第一参数()来处理中间信号,以产生输入信号 (l,r)的所述表示,第一参数描述信号(l,r)间的相对相位差异和时间差异中的至少一个。优选地,第二处理装置可操作地产生从解码的主要信号(m)中导出的补充合成信 号,用以提供从解码的残留信号中丢失的信息。根据本发明的第五方面,提供了根据本发明第一方面的方法产生的编码数据,该 数据为记录在数据载体上的数据或可经由通信网络传递的数据中的一种。根据本发明的第六方面,提供了用于在计算硬件上执行本发明第一方面的方法的 软件。根据本发明的第七方面,提供了在计算硬件上执行本发明第三方面的方法的软件。根据本发明的第八方面,提供了记录在数据载波上的编码数据和可经由通信网络 传递的编码数据中的至少一种编码数据,所述数据包括量化第一参数、量化第二参数、和对 应至少部分主要信号(m)和残留信号(s)的量化数据的多路复用,其中主要信号(m)的幅 值或能量高于残留信号(s),所述主要信号(m)和所述残留信号(s)可通过根据第二参数旋 转中间信号导出,通过处理多个输入信号来产生所述中间信号以补偿第一参数所描述的在 多个输入信号间的相对相位和/或时间延迟。应该理解,在不背离所附权利要求规定的本发明范畴的前提下,本发明的特征容 许结合到任何组合当中。


现参考下列附图仅通过示例的方式对本发明实施例进行阐述,其中图1说明满足相对相互时间和相位延迟的信号1 [n]、r [η]的采样序列;图2对依照式1和2的传统M/S变换应用到图1的信号以产生相应的和信号与差 信号m [n]、s [η]进行说明;图3对依照式4的旋转变换应用到图1信号以产生相应主要信号m[n]和残留信 号s [η]进行说明;图4对应用根据本发明的依照式5至15的复旋转变换以产生相应的主要信号 m[n]和残留信号s[n]进行说明,其中尽管图1的信号具有相对相互相位和时间延迟,但残 留信号具有相对小的幅值;图5是根据本发明的编码器的示意图;图6是根据本发明的解码器的示意图,该解码器同图5的编码器兼容;图7是参数立体声解码器的示意图;图8是根据本发明的增强参数立体声编码器的示意图;以及图9是根据本发明的增强参数立体声解码器的示意图,该解码器同图9编码器兼容。
具体实施例方式总的说来,本发明涉及一种编码数据的方法,其相对前述使用可变旋转角度的M/ S编码方法表现出进步。发明者为了能够更好地编码同满足一定相位和/或时间偏移的信 号组相对应的数据而发明了该方法。此外,同传统编码技术相比,该方法通过使用当信号 l[n]、r[n]分别由其等价的复值频域表示1 [k]、r[k]表示时可用的旋转角度α值而提供 了优势。角度α被设置为实值并且是实值相位旋转,该实值相位旋转被应用于使信号 l[n]、r[n]相互“相干”,用以调节这些信号间的相互时间和/或相位延迟。但是,复值旋转 角度α的使用使本发明更容易实现。这种通过角度α实现旋转的替代方法可在本发明的 范畴内实施。前述时域信号l[n]、r[n]的频域表示优选通过应用式5和6 (Eq. 5和6)描述的时 间加窗过程来导出以提供加窗信号ljn]、!·』!!]
9 其中(!二帧指标,^ =。,^,…表示连续的信号帧;H =跳跃尺寸或更新尺寸;并且η =时间指标,具有取值范围0到L-1,其中参数L等价于窗h[n]的长度。可通过式7和8 (Eq. 7和8)中所描述的离散傅立叶变换(DFT)或功能上等价的变 换将加窗信号la[n]、ra[n]变换到频域 其中参数N表示DFT长度,因此N彡L。由于实值序列的DFT是对称的,因此只有 前N/2+1个点在转换后被保存下来。为了在实施DFT时保存信号能量,优选使用下面式9 和10 (Eq. 9和10)中描述的比例缩放 /
本发明方法执行式11 (Eq. 11)描述的信号处理操作来将式7和8中的频域信号表 示l[k]、r[k]转换为频域中的相应旋转和信号与差信号m" [k]、s" [k] 其中α =实值可变旋转角度;Ψχ =用来最大化信号在相关边界上的连续性的共用角度;并且
約=用来通过相位旋转右声道信号来最小化残留信号W]的 能量的角度。角度约的使用是可选的。此外,优选在逐帧的基础上即帧步骤上动态执行按照式 11的旋转。但是,这种逐帧旋转中的动态变化将潜在地导致和信号m" [k]中的间断,可通 过适当选择角度夠至少部分删除所述间断。另外,优选将式11的频率范围k = 0,…,Ν/2+1划分为子范围,即区。编码期间 对每个区来说,其相应的角度参数α、约和约被独立确定、编码并随后被发送或输送到解码 器用于后续解码。通过安排要再分的频率范围,可在编码期间更好地捕获信号特征,这潜在 地导致更高的压缩比。执行了按照式7到11的映射后,对信号m “ [k]、s “ [k]进行式12和13(Eq. 12&13)中描述的离散傅立叶逆变换
其中mq[n]=主要时域表示;并且Sq[η]=残留(差)时域表示。在该方法中,主要和残留表示随后被转换成窗基础上的表示,按式14和15 (Eq. 14 和15)描述的处理操作所提供那样对所述窗基础上的表示应用重叠m [n+qH] = m [n+qH] +2Re {mq [η] h [η]} Eq. 14s [n+qH] = s [n+qH]+2Re {sq [η] h [η]} Eq. 15或者,式5到15描述的本发明方法的处理操作容许至少部分通过使用复调制滤波 器组来实际实现。计算机处理硬件中应用的数字处理可用来执行本发明。为了说明本发明方法,将阐述本发明的一个信号处理示例。例如,将两个时间信号 用作需要使用本方法处理的初始信号,这两个信号由式16和17(Eq. 16和17)定义1 [η] = 0. 5cos (0. 32n+0. 4) +0. OSz1 [η] +0. 06ζ2 [η] Eq. 16r[n] = 0. 25cos(0. 32η+1. 8)+0. OSz1 [η]+0. 05ζ3[η] Eq. 17其中Zl[n]、ζ2[η]和ζ3[η]为相互独立的单位方差白噪声序列。为了更好地理解 本发明方法的操作,图1中示出了式16和17描述的信号1 [n]、r [η]的一些部分。图2中示出M/S变换信号m[n]和s[n],这些信号是从式16和17的信号1 [η]、 r[n]通过式1和2的传统处理导出的。由图2可以看出,从式16和17的信号产生信号 m[n]和s[n]的传统方法将导致残留信号s[n]的能量高于式17中输入信号r[n]的能量。 很明显,由于信号s [η]不具有可忽略的幅值,因此应用到式16和17信号上的传统M/S变 换信号处理在信号压缩方面是低效的。通过使用式4描述的旋转变换,使示例信号1 [n]、r[n]能够如图3所示那样降低 其相应残留信号s[n]中的残留能量并相应增强其主要信号m[n]。尽管式4的旋转方法能 够比图2中给出的传统M/S处理实现得更好,但发明者发现当信号1 [n]、r[n]满足相对相 互相位和/或时间偏移时式4的旋转方法并不令人满意。当式16和17的采样信号1 [n]、r [η]被转换到频域时,则其受到按照式5到15的 复优化旋转,将残留信号s[n]的能量降低到图4所示的较低幅值是可能的。下面阐述用来实现式5到15所描述的信号处理的编码器硬件的实施例。图5中,示出了根据本发明的一个编码器,通常由10表示。编码器10用来接收左 声道(1)和右声道(r)互补输入信号并编码这些信号以产生编码比特流(bs)lOO。此外,编 码器10包括相位旋转单元20、信号旋转单元30、时间/频率选择器40、第一编码器50、第 二编码器60、参数量化处理单元(Q) 70以及比特流多路复用器单元80。输入信号1、r耦合到相位旋转单元20的输入端,相位旋转单元20的相应输出端 连接到信号旋转单元30。信号旋转单元30的主要信号和残留信号分别由m、s表示。主要 信号m经由第一编码器50输送到多路复用器单元80。此外,残留信号s经由时间/频率选择器40耦合到第二编码器60并随后耦合到多路复用器单元80。来自相位旋转单元20的 角度参数输出约、约经由处理单元70耦合到多路复用器单元80。此外,角度参数输出α 从信号旋转单元30经由处理单元70耦合到多路复用器单元80。多路复用器单元80包括 前述的编码比特流输出(bs)lOO。操作中,相位旋转单元20对信号1、r应用处理以便对它们之间的相对相位差异做 出补偿,并由此产生参数A、其中参数約表示这种相对相位差异,参数灼、外被传递 到处理单元70进行量化,并由此作为相应的参数数据包含在编码比特流100中。被补偿了 相对相位差异的信号l、r传递到信号旋转单元30,信号旋转单元30为角度α确定一个优 化值用以将最大量的信号能量集中在主要信号m中并将最少量的信号能量集中在残留信 号s中。主要信号和残留信号m、s而后经由编码器50、60传递以便被转换成合适的格式包 含在比特流100中。处理单元70接收角度信号α、队、豹并将它们同编码器50、60的输 出一起多路复用,以便产生比特流输出(bs)lOO。因此,比特流(bs) 100包括包含主要信号 和残留信号m、s以及角度参数数据α、<f\、约的表示的数据流,其中参数釣是必需的,而参 数夠是可选的但有益的包含该参数。编码器50和60优选实现为两个单声道音频编码器,或实现为一个双声道编码器。 可选地,可在时间/频率选择器40中删除残留信号s没有在感知上贡献到比特流100中的 某些部分(例如在时频平面中表示时被识别),由此提供下面更详细阐述的可伸缩的数据 压缩。编码器10可选地能够用来在包括输入信号的完整频率范围的一部分上处理输入 信号(l、r)。输入信号(l、r)中没有被编码器10编码的那些部分随后被其它方法平行地 被编码,例如通过前面阐述的传统M/S编码。如果需要,可实现左声道(1)和右声道(r)输 入信号的单独编码。编码器10容许被实现在硬件中,例如实现为一种专用集成电路或此类电路组。或 者,编码器10可实现在执行于计算硬件上(例如在专有软件驱动信号处理集成电路或此类 电路组上)的软件中。图6中,总的由200表示同编码器10兼容的解码器。解码器200包括一个比特流 多路分解器210、第一和第二解码器220、230,用于去量化(de-quantizing)参数的处理单 元240、信号旋转解码器单元250以及提供同输入到编码器10中的输入信号l、r相对应的 解码输出Γ、r'的相位旋转解码单元260。多路分解器210被配置来接收由编码器10产 生的比特流(bs)lOO,该比特流(bs) 100例如通过数据载体(例如诸如⑶或DVD的光盘数 据载体)和/或经由诸如因特网的通信网络从编码器10输送到解码器200。多路分解器 210的多路分解输出被耦合到解码器220、230的输入端并被耦合到处理单元240。第一和 第二解码器220、230分别包括被耦合到旋转解码器单元250的主要和残留解码输出m'、 s'。此外,处理单元240包括同样被耦合到旋转解码器单元250的旋转角度输出α';角 度α ‘对应于针对编码器10的前述角度α的解码版本。角度输出灼’、朽’对应于针对编 码器10的前述角度夠、约的解码版本;这些角度输出同来自旋转解码器单元250的解码 主要信号和残留信号输出一起被输送到相位旋转解码单元260,相位旋转解码单元260正 如说明的那样包括解码输出Γ、r'。操作中,解码器200执行编码器10中所执行的编码步骤的逆步骤。因此,在解码
12器200中,在多路分解器210中多路分解比特流100以分离同主要信号和残留信号相对应 的数据,所述数据被解码器220、230重构以产生解码的主要信号和残留信号m'、s'。然 后根据角度α'旋转这些信号m'、s',并随后通过角度灼’、钓‘针对相对相位对它们进 行校正以便重新生成左声道信号和右声道信号Γ >r'。从多路分解器210中多路分解的 参数重新生成角度夠‘、钓’、 α',并在处理单元240中分离这些角度。编码器10和解码器200中,优选地在比特流100中传送一个U D值和一个相干值 P,而不是前述角度α。UD值被用来表示信道间差异,即表示左信道信号和右信道信号1、 r间频率和时间变量幅值差异。相干值P表示频率变量相干,即相位同步后左声道信号和 右声道信号l、r间的相似性。但是,例如在解码器200中,可容易地通过应用式18(Eq. 18) 从II D值和P值导出角度α 图7中,由400总的表示参数解码器,这个解码器400与根据本发明的编码器互为 补充。解码器400包括比特流多路分解器410、解码器420、解相关单元430、比例缩放单元 440、信号旋转单元450、相位旋转单元460以及去量化单元470。多路分解器410包括一个 用于接收比特流信号(bs)lOO的输入端和四个用于信号m、s数据、角度参数数据、U D数据 和相干数据P的相应输出端,这些输出端如图示那样连接到解码器420和去量化单元470。 解码器420的一个输出端经由解相关单元430耦合,以便重新产生输入到比例缩放功能440 的残留信号表示s'。此外,重新产生的主要信号表示m'从解码器单元420输送到比例缩 放单元440。同样从去量化单元470为比例缩放单元440提供U D'和相干数据P ‘。比 例缩放单元440的输出端被耦合到信号旋转单元450,用以产生中间输出信号。随后,在相 位旋转单元460中使用去量化单元470解码的角度灼’、约’来校正这些中间输出信号,以便 重新产生左声道信号和右声道信号表示Γ、r'。解码器400同图6解码器200的区别在于解码器400包括解相关单元430,该解 相关单元430通过解相关单元430内执行的解相关过程来根据主要信号m'估计残留信号 s'。此外,左和右输出信号Γ、r'间的相干量通过比例缩放操作确定。比例缩放操作在 比例缩放单元440中被执行并涉及主要信号m'和残留信号s'间的比率。参考图8,示出一个由500总的表示的增强编码器。编码器500包括分别接收左和 右输入信号l、r的相位旋转单元510、信号旋转单元520、时间/频率选择器530、各个第一 和第二编码器540、550、量化单元560以及包括比特流输出(bs) 100的多路复用器570。来 自相位旋转单元510的角度输出从相位旋转单元510耦合到量化单元560。此外,来自相 位旋转单元510的相位校正过的输出经由信号旋转单元520和时间/频率选择器530被连 接,用以分别产生主要信号和残留信号m、s以及UD和相干P数据/参数。UD和相干P 数据/参数耦合到量化单元560,而主要信号和残留信号m、s经由第一和第二编码器540、 550传递,用以为多路复用器570产生相应的数据。多路复用器570还用来接收描述角度 钓、朽、相干P和II D的数据。多路复用器570可操作地多路复用来自编码器540、550和 量化单元560的数据,用以产生比特流(bs)lOO。
13
编码器500中,直接将残留信号s编码为比特流100。可选地,时间/频率选择器 单元530可操作地确定残留信号s时间/频率平面的哪个部分被编码成比特流(bs) 100,由 此单元530确定残留信息包含在比特流100中的程度,并由此影响编码器500中可得到的 压缩同比特流100中包含信息的程度之间的折衷。在图9中,由600总的表示增强参数解码器,解码器600与图8所示编码器500互 为补充。解码器600包括多路分解器610、各个第一和第二解码器620、640、解相关单元630、 组合器单元650、比例缩放单元660、信号旋转单元670、相位旋转单元680以及去量化单元 690。多路分解器单元610被耦合来接收编码比特流(bs) 100并将相应的多路分解输出提 供到第一和第二解码器620、640,并且还提供到多路分解器单元690。同解相关单元630和 组合器单元650连接的解码器620、640分别可操作地重新产生主要信号和残留信号的表示 m'、s'。这些表示在比例缩放单元660中接受比例缩放过程并随后在信号旋转单元670 中接受旋转,以便产生中间信号,随后中间信号在旋转单元680中响应于去量化单元690所 产生的角度参数被相位旋转,用以重新产生左声道和右声道信号的表示Γ、r'。解码器600中,比特流100被多路分解成用于主要信号m'、残留信号s'和立体 声参数的独立流。随后,主要信号和残留信号m'、s'分别被解码器620、640解码。残留信 号s'中被编码到比特流100中的那些频谱/时间部分在比特流100中被隐含(即通过检 测时频平面中的“空白”区域)或明确(即通过从比特流100解码的表示信令参数)传递。 解相关单元630和组合器单元650可操作地利用合成残留信号有效填充所解码的残留信号 s'中的空白时频区域。这个合成信号通过使用所解码的主要信号m'来产生并从解相关 单元650输出。对于所有的其它时频区域,应用残留信号s构造解码残留信号s';对于这 些区域,不在比例缩放单元660应用比例缩放。可选地,对于这些区域,在编码器500中传 送前述角度α是有益的,而并非II D和相干P数据,因为输送单个角度参数α所需要的 数据速率比输送等价的II D和相干P参数数据所需要的数据速率低。但是,角度α参数 (而不是IID和相干P参数数据)在比特流100中的传输使编码器500和解码器600无法 同使用这种U D和相干P数据的常规传统参数立体声(PS)系统向后兼容。编码器10、500的各个选择器单元40、530在选择需要将残留信号s的哪个时频区 域编码到比特流100中时优选使用一种感知模型。通过编码编码器10、500中残留信号S的 不同时频方面,由此有可能实现比特率可缩放编码器和解码器。当比特流100中的多个层 相互依赖时,同感知上很相关的时频方面相对应的编码数据被包含在该多个层中包括的基 层中,感知上更不重要的数据被移动到该多个层中包括的精炼层或增强层中;“增强层”也 称为“精炼层”。这样的一种方案中,所述基层优选包括对应主要信号m的比特流、第一增强 层以及第二增强层,其中第一增强层包括同诸如前述角度α、灼、豹的立体声参数相对应 的比特流,第二增强层包括同残留信号s对应的比特流。比特流数据100中层的这种安排允许对残留信号s进行输送的第二增强层被可选 地丢失或删除;此外,图10中示出的解码器600能够如前面阐述的那样将解码的多个剩余 层同合成残留信号相组合,用以产生感知上有意义的残留信号以便用户欣赏。此外,如果例 如由于成本和/或复杂性限制而可选地没有为解码器600提供第二解码器640,即使以降低 的质量但仍能解码残留信号S。删除前述比特流(bs) 100中的编码角度参数灼、约可能导致前述比特流(bs) 100的比特率进一步降低。这种情况下,解码器600中的相位旋转单元680通过定值(例如 零值)的缺省旋转角度重建所重新产生的信号Γ >r';这种进一步的比特率降低利用 以下特性,即人类听觉系统在较高音频处是相对相位不灵敏的。作为一个示例,在比特流 (bs) 100中传输参数& ,且从那里删除参数仍以便降低比特率。前面阐述的根据本发明的编码器和互补解码器可潜在用于大范围的电子仪 器和系统中,例如至少下列之一中因特网收音机、因特网流传送、电子音乐分发(EMD electronic music distribution)、固态音频播放器和记录器以及通常的电视和音频产品。尽管上面阐述了一种编码输入信号(l、r)以产生比特流100的方法以及解码前述 比特流100的补充方法,但应该理解本发明容许用来编码多于两个的输入信号。例如本发 明能够适于为多信道音频(例如5信道家庭影院系统)提供数据编码和相应解码。在附加的权利要求书中,括号内包含的数字和其它符号用来辅助理解权利要求 书,而不以任何方式限制权利要求的范围。应该理解,在不背离附加的权利要求书规定的本发明范围的前提下容许对前述的 本发明实施例做出修改。在解释说明书及其权利要求书时,诸如“包括”、“包括”、“结合”、“含有”,“是”以及
“具有”的表述应该以非穷尽的方式理解,也就是说应该被理解为还可能存在没有清楚列出 的其它项目或者部件。参考为单数的也可理解成参考复数,反之亦然。
权利要求
一种编码和解码装置,用于将至少第一和第二宽带数字音频信号成分(L,R)编码成复合数据信号,以及用于将该复合数据信号解码成所述至少第一和第二数字音频信号成分的副本,所述编码装置包括-输入单元,用于分别接收所述至少第一和第二宽带数字音频信号成分;-时-频转换单元,用于将宽带第一和第二数字音频信号成分中的每个成分转换成多个窄带子信号,针对宽带数字音频信号成分的用于窄带的子信号表示所述窄带中的宽带音频信号成分,-信号旋转单元,用于在窄带中将所述窄带中的所述第一和第二数字音频信号成分的子信号转换成针对所述窄带的复合子信号,该信号旋转单元还适于可选地在窄带内将所述第一和第二数字音频信号成分的子信号转换成误差子信号,-信号组合单元,用于将复合子信号和误差子信号(如果存在的话)组合成复合数据信号,-输出单元,用于提供所述复合数据信号,所述解码装置包括-输入单元,用于接收所述复合数据信号,-解复用单元,用于从所述复合数据信号恢复复合子信号和误差子信号(如果存在的话),-解相关单元,用于将复合子信号解相关成解相关的子信号,-另一组合单元,用于在窄带内将所述窄带中的所述解相关的子信号与所述窄带中的误差子信号进行组合,使得当在窄带中存在误差子信号时,将该误差信号提供为另一组合单元的输出端的输出信号,以及当在窄带中不存在误差子信号时,将所述窄带中的所述解相关的子信号提供为所述另一组合单元的输出端的输出信号,-另一信号旋转单元,用于在窄带内将复合子信号和输出信号转换成所述窄带内针对第一和第二数字音频信号成分的子信号的副本,-频-时转换单元,用于将所述第一和第二数字音频信号成分的子信号的副本转换成所述第一和第二数字音频信号成分的副本。
2.如权利要求1所述的编码和解码装置,其特征在于,_所述信号旋转单元适于在后续的时间间隔内,在窄带内将所述窄带内的所述第一和 第二数字音频信号成分的子信号转换成在所述后续的时间间隔内针对所述窄带的复合子 信号,所述信号旋转单元还适于在特定时间间隔内,在所述窄带内可选地将所述第一和第 二数字音频信号成分的子信号转换成误差子信号,-所述另一组合单元适于在特定时间间隔内以及在窄带内,将所述特定时间间隔和所 述窄带内的解相关的子信号与所述特定时间间隔和所述窄带内的误差子信号进行组合,使 得当在特定时间间隔内和在窄带内存在误差子信号时,将该误差信号提供为所述另一组合 单元输出端的输出信号,当在所述特定时间间隔内和在所述窄带内不存在误差子信号时, 将所述特定时间间隔和所述窄带内的解相关的子信号提供为所述另一组合单元的输出端 的输出信号,2_所述另一信号旋转单元适于在后续的时间间隔内,在窄带内将复合子信号和输出信 号转换成在所述时间间隔的每个间隔内、所述窄带内针对第一和第二数字音频信号成分的 子信号的副本。
3.如权利要求1所述的编码和解码装置,其特征在于,所述信号旋转单元还适于产生 控制信号,该信号指示误差信号是否可用于窄带,所述信号组合单元还适于将控制信号组 合到所述复合数据信号中,所述解复用单元还适于从所述复合数据信号中恢复控制信号, 所述另一信号旋转单元适于根据控制信号向其输出端提供误差子信号或解相关的子信号。
4.如权利要求2所述的编码和解码装置,其特征在于,信号旋转单元还适于产生控制 信号,使得它指示在时间间隔内,误差信号是否可用于窄带,所述信号组合单元还适于将控 制信号组合到所述复合数据信号内所述解复用单元还适于从所述复合数据信号中恢复控制信号,所述另一信号旋转单元 适于根据该控制信号向其输出端提供误差子信号或解相关的子信号。
5.用于如权利要求1或3所述装置内的解码装置,所述解码装置包括-输入单元,用于接收复合数据信号,-解复用单元,用于从所述复合数据信号中恢复复合子信号和误差子信号(如果存在 的话),-解相关单元,用于将复合子信号解相关成解相关的子信号,_另一组合单元,用于在窄带内将所述窄带内的解相关的子信号与所述窄带内的误差 子信号进行组合,使得当窄带内存在误差子信号时,将该误差信号提供为所述另一组合单 元的输出端的输出信号,当窄带内不存在误差子信号时,将所述窄带内的解相关的子信号 提供为所述另一组合单元的输出端的输出信号,_另一信号旋转单元,用于在窄带内将复合子信号和输出信号转换成在所述窄带内针 对第一和第二数字音频信号成分的子信号的副本,_频-时转换单元,用于将所述第一和第二数字音频信号成分的子信号的副本转换成 第一和第二数字音频信号成分的副本。
6.用于如权利要求2或4所述装置内的解码装置,所述解码装置包括-输入单元,用于接收复合数据信号,-解复用单元,用于从所述复合数据信号中恢复复合子信号和误差子信号(如果存在 的话),-解相关单元,用于将复合子信号解相关成解相关的子信号,-另一组合单元,用于在特定时间间隔内以及在窄带内,将所述特定时间间隔和所述窄 带内的解相关的子信号与所述特定时间间隔和所述窄带内的误差子信号进行组合,使得当 在特定时间间隔内和在窄带内存在误差子信号时,将该误差信号提供为所述另一组合单元 的输出端的输出信号,当在所述特定时间间隔内和在所述窄带内不存在误差子信号时,将 所述特定时间间隔和所述窄带内的解相关的子信号提供为所述另一组合单元的输出端的 输出信号,-另一信号旋转单元,用于在后续的时间间隔内,在窄带内将复合子信号和输出信号转 换成在所述时间间隔的每个间隔内、所述窄带内针对第一和第二数字音频信号成分的子信 号的副本,“频_时转换单元,用于将所述第一和第二数字音频信号成分的子信号的副本转换成 第一和第二数字音频信号成分的副本。
7.如权利要求5所述的解码装置,用在如权利要求3所述的装置内,其特征在于,所述 解复用单元还适于从所述复合数据信号中恢复控制信号,所述另一信号旋转单元适于根据 所述控制信号将误差子信号或解相关的子信号提供给它的输出端。
全文摘要
提供一种编码输入信号(l、r)以产生编码数据(100)的方法。该方法包括处理输入信号(l、r)以确定描述信号(l、r)间相对相位差异和时间差异的第一参数并应用这些第一参数处理输入信号以产生中间信号。该方法包括处理中间信号以确定描述第一中间信号角度旋转的第二参数(α;IID,ρ),用以产生一个主要信号(m)和一个残留信号(s),该主要信号(m)的幅值或能量高于残留信号(s)。可应用这些第二参数处理中间信号以产生主要信号(m)和残留信号(s)。该方法还包括量化第一参数、第二参数以及主要信号和残留信号(m,s),用以产生相应的量化数据,用于后续多路复用以产生编码数据(100)。
文档编号H04S1/00GK101887726SQ20101014931
公开日2010年11月17日 申请日期2005年3月29日 优先权日2004年4月5日
发明者D·J·布里巴特, E·G·P·舒伊杰斯, F·P·迈伯格, L·M·范德克克霍夫 申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1