用于低比特率语音编码的方法和装置的制作方法

文档序号:2829255阅读:186来源:国知局
专利名称:用于低比特率语音编码的方法和装置的制作方法
技术领域
本发明涉及声音信号的数字编码,考虑到传送和合成此声音信号,尤其但不排它地是指语音信号。尤其是,本发明涉及一种用于基于码激励线性预测编码范例的声音信号的有效低比特率编码方法。
背景技术
在诸如远程电信会议、多媒体以及无线通信的各种应用领域中,对于在主观质量和比特率之间具有良好平衡的有效数字窄带和宽带语音编码技术的需求正在增加。直到最近,在语音编码应用中主要使用的是带宽限制在200-3400Hz范围之中的电话。然而在通信中,相对于传统电话带宽来说,宽带语音应用提供了增强的可理解性和自然性。已经发现,在50-7000Hz范围之内的带宽足够用于传递良好的质量,并给人以面对面沟通的印象。对于一般音频信号,此带宽给出可接受的主观质量,但是仍然低于分别在20-16000Hz操作的FM广播、或者在20-20000Hz操作的CD的质量。
语音编码器将语音信号转换成为数字比特流,其在通信信道之上传输或者存储在存储介质中。语音信号被数字化,即,通常以每个采样16-比特来采样和量化。语音编码器具有这样的功能,由较小数目的比特来表现这些数字采样,同时维持良好的主观语音质量。语音解码器或合成器在所传输的或存储的比特流上进行操作以将其转换回声音信号。
码激励线性预测(CELP)编码是公知的技术,其允许在主观质量和比特率之间获得良好的折衷。在无线应用和有线应用两者之中,这种编码技术是许多语音编码标准的基础。在CELP编码中,经采样的语音信号在通常称为帧的连续L次采样块中处理,在这里,L是通常对应于10-30ms的预定数字。在每帧计算和传输线性预测(LP)滤波器。LP滤波器的计算通常需要从后续帧超前语音段,例如5-15ms。L-采样帧被划分为称为子帧的较小块。通常子帧的数目是三或者四,导致了4-10ms的子帧。在每个子帧中,通常从两个部分(过去的激励以及创新的固定编码本激励)来获取激励信号。从过去的激励所形成的部分通常是指自适应编码本或者音高(pitch)激励。表征激励信号特征的参数被编码并传输到解码器,在解码器处经重构的激励信号被用作LP滤波器的输入。
在使用码分多址(CDMA)技术的无线系统中,使用源控制的可变比特率(VBR)语音编码显著改进了系统的能力。在源控制的VBR编码中,编码解码器在数个比特率操作,并且速率选择模块用于基于语音帧的特征(例如,发音的、不发音的、瞬间的、背景噪音)来确定用于编码每个语音帧的比特率。目标是在给定平均比特率,也被称为平均数据率(ADR)处获取最好的语音质量。编码解码器可通过调谐速率选择模块来在不同模式操作,以在不同模式获取不同ADR,其中在ADR增加时,编码解码器性能得到改进。根据信道条件,操作模式由系统所影响。这使得在语音质量和系统能力之间具有平衡机制的编码解码器成为可能。
通常,在用于CDMA系统的VBR编码中,八分之一速率用于没有语音行为(无声或者仅有噪音的帧)的编码帧。当该帧是固定发音或者固定不发音时,根据操作模式来使用半速率或者四分之一速率。如果使用半速率,则在不发音的情况下使用没有音高编码本的CELP模式,并且在发音的情况下使用信号修改以增大周期并且降低用于音高索引的比特数。如果操作模式限制为四分之一速率,则由于比特数不足通常不可能进行波形匹配,并且一般应用某些参数编码。全速率用于开始、瞬间帧以及混合发音帧(通常使用典型的CELP模式)。除了CDMA系统中源控制的编码解码器操作之外,系统可限制某些语音帧中的最大比特率,以便发送带内信令信息(被称为模糊与突发信令),或者在劣质信道条件下(诸如靠近蜂窝边界)以便改进编码解码器的鲁棒性。这被称为半速率最大。
如从上文说明可以看出,有效低比特率编码(在半速率)对于VBR编码十分重要,以使得平均数据速率降低,同时保持良好的声音质量,并且还用以在编码解码器被强制在最大半速率操作时维持良好的性能。

发明内容
本发明涉及一种用于低比特率CELP编码的方法。该方法适用于在源控制的可变速率语音编码系统中用于编码半速率模式(普通的和发音的)。根据目前描述的这些主旨的实施方式,克服了以上和其它问题、并且实现了其它优点。
根据一方面,本发明是一种用于编码语音信号的方法。在本方法中,语音信号被划分成为多个帧,并且这些帧的至少一个被划分成为至少两个子帧单元。针对子帧单元,执行搜索固定编码本贡献和自适应编码本贡献。将至少一个子帧单元选择为不使用固定编码本贡献来编码。
根据另一实施方式的是编码器。该编码器具有耦合到编码本的第一输入以及用于接收语音信号的第二输入。编码器操作,用以针对所接收的语音信号,在编码本中搜索固定编码本贡献和自适应编码本贡献,并且用以将语音信号作为包括至少两个子帧单元的帧而输出。编码器不使用固定编码本贡献来编码帧的至少一个子帧单元。
根据另一方面,本发明是机器可读指令的程序,其有形地具体化于信息承载介质上并且可由数字数据处理器执行,以实现针对编码语音帧的动作。该动作包括将语音信号划分成为多个帧,以及将多个帧的至少一个划分成为至少两个子帧单元。针对子帧单元,搜索固定编码本贡献和自适应编码本贡献。将至少一个子帧单元选择为不使用固定编码本贡献来编码。
根据另一方面,本发明是编码装置,具有这样的器件用于将语音信号划分成为多个帧的器件,以及用于将多个帧的至少一个划分成为至少两个子帧单元的器件。这可以是编码器。该装置进一步具有器件用于针对子帧单元来搜索固定编码本贡献和自适应编码本贡献,诸如耦合到编码器并且耦合到存储编码本的计算机可读存储器的处理器。该装置进一步包括器件用于将至少一个子帧单元选择为不使用固定编码本贡献来编码,优选地,选择器件也是该处理器。
根据另一方面的是一种具有编码器和解码器的通信系统。编码器包括第一输入,耦合到编码本;以及第二输入,用于接收将要传输的语音信号。编码器操作,用以针对所接收的语音信号,在所述编码本中搜索固定编码本贡献和自适应编码本贡献,并且用以将语音信号(或者至少其一部分)作为包括至少两个子帧单元的帧而输出。编码器进一步操作以不使用固定编码本贡献来编码帧的至少一个子帧单元。通信系统的解码器包括第一输入,耦合到编码本;以及第二输入,用于输入在信道上所接收的语音信号的被编码的帧。被编码的语音帧包括至少两个子帧单元。解码器操作,用以针对所接收的被编码的语音帧,在所述编码本中搜索固定编码本贡献和自适应编码本贡献,并且用以不使用固定编码本贡献来解码至少一个子帧单元。
在下文中将详细描述关于各种实施方式和实现的进一步细节。


当结合附示来阅读下文的详细说明书时,这些主旨的上述和其它方面将变得更为清晰,其中图1和图2分别是根据本发明实施方式的移动台和该移动台内部元件的框图。
图3是根据本发明第一实施方式的处理流程图。
图4是根据本发明第二实施方式的处理流程图。
具体实施例方式
源控制的VBR语音编码的使用显著改进了许多通信系统的能力,特别是使用CDMA技术的无线系统。在源控制的VBR编码中,编码解码器在数个比特率操作,并且基于语音帧的特征(例如,发音的、不发音的、瞬间的、背景噪音)使用速率选择模块以确定用于编码每个语音帧的比特率。在这一点上,在由Victor Stolpman于2003年6月26日提交的标题为“Low-Density Parity Check Codes forMultiple Code Rates”的共同拥有美国专利申请No.10/608,943中,可以找到参考,其内容在此通过参考引入。在VBR编码中,目标是在给定平均数据速率处获取最好的语音质量。编码解码器可通过调谐速率选择模块来在不同模式处操作,以在不同模式处获取不同ADR,其中在ADR增加时,编码解码器性能得到改进。在某些系统中,根据信道条件,操作模式由系统所限制。这使得在语音质量和系统能力之间具有平衡机制的编码解码器成为可能。
在cdma2000系统中,定义了两个比特率配置集。在速率集I中,比特率是在8.55kbit/s的全速率(FR)、在4kbit/s的半速率(HR)、在2kbit/s的四分之一速率(QR)、以及在0.8kbit/s的八分之一速率。在速率集II中,比特率是在13kbit/s的FR、在6.2kbit/s的HR、在2.7kbit/s的QR、以及在1kbit/s的ER。
在本发明的示例性实施方式中,所公布的用于低比特率编码的方法应用到速率集I操作中的半速率编码。尤其是,示出了一个实施方式,由此所公布的方法结合到可变比特率宽带语音编码解码器中,用于在4kbit/s编码普通HR帧和发音HR帧。这在图3开始处特别详细地讨论。
图1示出了其中具体化本发明的移动台MS 20的示例性示意图。本发明可以安置在具有可变速率编码器的任意主机计算机装置中,而无论该装置是否是移动的、无论该装置是否耦合到其它数据网络蜂窝。MS 20是能够无线访问通信网络的手持便携装置,该通信网络为诸如耦合到公用交换电话网络基站的移动电话网络。蜂窝电话、Blackberry装置、以及具有因特网或者其它双路通信能力的个人数字助理(PDA),这些都是MS 20的例子。便携无线装置包括移动台以及诸如步话机的其它手持装置、以及仅能访问诸如无线局域网(WLAN)或者WIFI网络的本地网络的装置。
在图1中示出的组件块是功能性的,并且下文所描述的功能可以或者不可以由如参考图1所描述的单一物理实体所执行。显示驱动器22(诸如用于驱动图形显示屏的电路板)、以及输入驱动器24(诸如用于将来自用户的开动按钮和/或游戏杆的阵列的输入转换至电信号)配备有用于与用户接口连接的显示屏和按钮/游戏杆阵列(未示出)。如现有技术已知,当此显示屏对触摸敏感的时候,输入驱动器24还可以转换在显示屏处的用户输入。MS 20进一步包括电源26,诸如在MS 20内部向控制功能的中央处理器28提供电功率的自包含电池。该处理器28内的功能诸如,数字采样、抽取、内插(interpolation)、编码和解码、调制和解调、加密和解密、扩频和去扩(用于CDMA兼容的MS 20)、以及现有技术已知的其它信号处理功能。
在麦克风30处接收到声音或者其它听觉输入,该麦克风30可以通过缓冲存储器32来耦合到处理器28。诸如用以调制、编码和解码的算法的计算机程序、诸如用于编码器/解码器(编码解码器)和查找表的数据阵列等存储在主存储器存储介质34中,其可以是如现有技术中已知的用于存储计算机可读指令和程序以及数据的电子的、光学的、或者磁的存储器存储介质。典型地,主存储器34划分为易失性和非易失性部分,并且通常分散在各种存储单元之中,有些是可移除的。MS 20经由一个或者多个天线36来在诸如移动电话链接的网络链接之上通信,该天线36经由T/R开关38、或者双重滤波器来选择性地耦合到发送器40和接收器42。MS 20可以另外具有第二发送器和接收器用于在其它网络,诸如WLAN、WIFI、篮牙之上进行通信、或者用以接收数字视频广播。已知天线类型包括单极天线、双极天线、平面倒置折叠天线(PIFA)及其它。各种天线可以首先安装在外部(例如,拉杆天线)或者如所示完全安装在MS 20外壳之内。来自MS 20的可闻输出在扬声器44处转换。上述组件的大多数、并且特别是处理器28布置在主线路板(未示出)上。典型地,主线路板包括接地平面,一个或多个天线36电耦合至该接地平面。
图2是根据本发明实施方式的、在例如图1的MS 20内部执行的处理和电路的示意性框图。从麦克风输出的语音信号在数字转换器处被数字化,并且在编码器48处使用存储在存储器34中的编码本50进行编码。编码本或者母代码具有用于可变速率编码的固定和自适应部分两者。采样器52和速率选择器54通过采样和内插/抽取、或者通过现有技术中的其它方式来获得编码速率。帧之间的速率可以如上所述地变化。数据在块56处解析为子帧,子帧通过类型来划分,并且由下文所公开的任意方法来组合成为帧。通常,处理器28将各种类型的子帧以这样的方式组合成为单一帧,以便最小化误差测量。在某些实施方式中,这是反复的,在这些实施方式中处理器仅使用编码本50的自适应部分来确定增益,将该增益应用至帧中的一个或者两个子帧、并且向其它帧应用从固定和自适应编码本部分两者所导出的增益。认为此结果是第一计算。第二计算是倒置的;仅来自自适应编码本部分的固定增益被应用到其它子帧,并且将从固定和自适应编码本导出的增益应用至原始子帧,其结果是第二计算。无论第一或者第二计算的哪一个最小化误差测量,它都是如何由线性预测滤波器58来激励子帧的一个代表。该激励来自处理器,其在一个子帧接一个子帧的基础上反复确定最优激励。下文公开了其它技术。在一些实施方式中,用于激励紧靠当前帧的前一帧的能量反馈60被用以确定应用到帧中的子帧之一的固定音高增益。能量的值可以仅存储在存储器34中并且由处理器28再次访问。可以如在此所述地那样来编译在语音信号上操作的各种其它硬件设置,而并不背离这些主旨。
使用所附文本来示出本发明实施方式的具体说明,所附文本对应于变化速率多模式宽带编码器的说明,当前该说明被提交用于3GPP2[3GPP2 C.S0052-A“Source-Controlled Variable RateMultimode Wideband Speed Codec(VMR-WB),Service Options 62 and63 for Spread Spectrum Systems”]中的标准化,在此将其通过参考引入。该标准的一个新的增强包括,使用被称作速率集1配置的操作模式,其为发音的HR以及在4kbps处的HR普通编码类型的设计所必需。为了能够降低比特率,同时保持相同编码解码器结构、并且有限地使用外部存储器,具体展现了下文所述的本发明的思想。
根据第一实施方式,语音编码系统使用线性预测编码技术。语音帧被划分为数个子帧单元或者子帧,由此在每个子帧中计算线性预测(LP)合成滤波器的激励。优选地,子帧单元可以是半帧或者四分之一帧。在传统线性预测编码器中,激励包括由它们相应的增益来衡量的自适应编码本和固定编码本。在本发明的实施方式中,为了在降低比特率的同时保持良好的性能,分组数个K子帧、并且针对K子帧计算一次音高滞后。然后,当在单独子帧中确定激励的时候,一些子帧使用非固定编码本贡献,并且对于那些成帧的音高增益被固定至特定值。其余的子帧使用固定和自适应编码本贡献两者。在优选实施方式中,执行数个反复,由此在所述反复中,不同地指定具有非固定编码本贡献的子帧以获取若干具有固定编码本贡献的子帧和具有非固定编码本贡献的子帧的结合;并且由此通过最小化误差测量来确定最佳结合。此外,在最小误差中得到的最佳结合的索引被编码。
在变形中,将具有非固定编码本贡献的子帧中的音高增益设置为一个值,该值由来自先前帧和当前帧的LP合成滤波器的能量之间的比率而给出。这在图3中示出。
在图3中,每个子帧被指定一种类型301。对于特定类型的所有子帧,音高增益被计算一次并被存储302。然后,处理器28使用所计算的音高增益来反复将不同类型子帧的各种结合计算成为帧304。对于仅使用一种贡献激励的那些第一类型的子帧形成自适应编码本,在块306处将音高增益设置为gf,如上所述与LP合成滤波器能量呈比例,并且在下文进一步详细描述。在块308处确定并存储针对特定合成的误差测量。计算处理重复310很少次反复,以便不延迟传输,优选地由子帧的数目或者时间约束来限制。一旦完成所有的反复,则确定312最小误差,并且根据获得最小误差测量的增益由线性预测滤波器来激励314独立子帧,并且传输316该独立子帧。注意,编码器可以执行图3的301至314的每个步骤,其中编码器被广泛地读取以包括由处理器进行的计算和由滤波器进行的激励,即使处理器和滤波器与编码电路分离。在所有实施方式中,图2的功能块并不意味着是分离组件;在一个编码器中可以合并许多这样的块。
根据本发明的解码器类似地操作,尽管其不必反复确定在帧中如何安排子帧单元,这是由于它已经通过信道接收了帧。解码器确定哪个子帧单元没有使用固定编码本贡献来编码,优选地,是从发送器处的帧中的比特集来确定。解码器具有耦合到编码本的第一输入和用于接收语音信号的经编码的帧的第二输入。对于发送器,经编码的帧包括至少两个子帧单元。与编码器类似,解码器在编码本中搜索固定编码本贡献和自适应编码本贡献。解码器不使用固定编码本贡献来解码子帧单元的至少一个。
根据在图4概要示出的第二实施方式,在两个子帧的帧中,子帧被分组。在两个子帧之上计算音高滞后402。然后,在第一或者第二子帧中通过强制使音高增益为特定值gf来在每个子帧计算激励。对于强制为gf的音高增益,使用非固定编码本(激励仅仅基于自适应编码本贡献)。在闭合循环402中通过尝试两种结合,并且选择最小化两个子帧之上的加权误差的那个来确定在哪个子帧中的音高增益被强制为gf。在第一反复406中,音高增益和自适应编码本激励和固定编码本激励和增益在第一子帧408a中计算,并且在第二子帧中,音高增益被强制为gf,并且使用非固定编码本贡献来计算410a自适应编码本激励。在第二反复412中,在第一子帧中,音高增益被强制为gf、并且使用非固定编码本贡献来计算自适应编码本激励410b,并且在第二子帧中,计算音高增益和自适应编码本激励和固定编码本激励和增益408b。针对反复412a、412b两者来计算加权的误差,并且保留最小化误差的那个414并且选择用于传输416。每两个子帧可以使用一个比特以确定使用固定编码本贡献的子帧索引。
在第三实施方式中,固定编码本贡献在两个子帧中的一个中使用。在具有非固定编码本贡献的子帧中,音高增益强制为特定值gf。该值确定为在先前帧和当前帧中的LP合成滤波器的能量之间的比率,其约束至小于或等于一。gf的值由以下给出gf=Σn=0127hLPold2(n)Σn=0127hLPnew2(n),]]>其中受到gf≤1的约束; (1)其中hLPold(n)和hLPnew(n)分别表示先前帧和当前帧的冲击响应。对于稳定发音段,gf的值接近一。在当前帧变得共振的时候,使用以上比率确定的gf强制音高增益为低值。这避免了能量中的不必要升高。处理类似于图4所示,但是特别如上所述给出音高增益。
通过尝试两种结合、并且选择最小化半帧之上加权误差的那一个来在闭合循环中确定哪个子帧中的音高增益被强制为gf。在两个反复中执行对每两个子帧中的激励的确定。在第一反复中,像通常一样在第一子帧中确定激励。自适应编码本激励和音高增益得以确定。然后,更新针对固定编码本搜索的目标信号,并且计算固定编码本激励和增益,并且共同量化自适应和固定编码本增益。在第二子帧中,使用来自第一子帧的总激励来更新自适应编码本存储器,然后强制音高增益为gf,并且由具有非固定编码本贡献来计算自适应编码本激励。由此,来自第一子帧中的第一反复的总激励由以下所给出usf1(1)(n)=g^p(1)vsf1(1)(n)+g^c(1)csf1(1)(n),n=0,...,63---(2)]]>并且在第二子帧中的总激励由以下给出
usf2(1)(n)=gf(1)vsf2(1)(n),n=0,...,63.---(3)]]>在开始第二反复之前,合成和加权滤波器的存储器和自适应编码本存储器被保存用于第二子帧。
在第二反复中,在第一子帧中,音高增益强制为gf并且使用非固定编码本贡献来计算自适应编码本激励。则在第一子帧中的总激励由以下给出usf1(2)(n)=gf(2)vsf1(2)(n),n=0,...,63.---(4)]]>则,自适应编码本的存储器和滤波器的存储器基于来自第一子帧的激励来更新。
在第二子帧中,计算目标信号,并且确定自适应编码本激励和音高增益。然后,更新目标信号并且计算固定编码本激励和增益。将自适应和固定编码本增益共同量化。由此,在第二子帧中的总激励由以下给出usf2(2)(n)=g^p(2)vsf2(2)(n)+g^c(2)csf2(2)(n),n=0,...,63---(5)]]>最后,为了决定选择哪个反复,在两个子帧之上针对两个反复计算经加权的误差,并且保留与导致较小均方加权误差的反复相对应的总激励。每半帧使用1比特以指示子帧的索引,其中使用了固定编码本贡献(或者反之亦然)。
在第一反复中针对两个子帧的加权的误差由以下所给出esf1(1)(n)=g^p(1)ysf1(1)(n)+g^c(1)zsf1(1)(n),n=0,...,63esf2(1)(n)=gf(1)ysf2(1)(n),n=0,...,63;---(6)]]>并且在第二反复中针对两个子帧的经加权的误差由以下给出esf1(2)(n)=gf(2)ysf2(2)(n),n=0,...,63esf2(2)(n)=g^p(2)ysf2(2)(n)+g^c(2)zsf2(2)(n),n=0,...,63;---(7)]]>其中y(n)和z(n)分别是经滤波的自适应编码本和经滤波的固定编码本贡献。
在保留第一反复的情况下,将所保存的存储器复制回滤波器存储器和自适应编码本缓存器之中,用于在接下来的两个子帧中使用(由于在执行两个反复之后,滤波器存储器和自适应编码本缓存器对应于第二反复)。
本发明的各种实施方式可以通过由移动台20或者其它主机装置的数据处理器(诸如处理器28)可执行的计算机软件来实现,或者通过硬件、或者通过软件和硬件的结合来实现。此外,在这一点上,应该理解,各种图中的块可以表示程序步骤、或者相互连接的逻辑电路、块和功能、或者程序步骤和逻辑电路、块和功能的结合。
存储器或者数个存储器34可以是适用于本地技术环境的任何类型,并且可以使用任何适合的数据存储技术来实现,诸如基于半导体的存储器装置、磁存储器装置和系统、光存储器装置和系统、固定存储器和可移除存储器。一个或多个数据处理器28可以是适合于本地技术环境的任何类型,并且作为非限定性例子可以包括通用目的计算机、特殊目的计算机、微处理器、数字信号处理器(DSP)和基于多核处理器架构的处理器的一个或者多个。
通常,在硬件或者特殊目的电路、软件、逻辑或者其任意结合中可以实现各种实施方式。例如,尽管本发明并不限制于此,可以在硬件中实现某些方面,而在可以由控制器、微处理器或者其它计算装置执行的固件或者软件中实现其它方面。虽然本发明的各种方面可以示出和描述为框图、流程图或者使用其它图示表示,应该理解,在此所描述的这些块、设备、系统、技术或者方法可以作为非限定性例子在硬件、软件、特殊目的电路或者逻辑、通用目的硬件或者控制器、或者其它计算装置、或者其某些结合中实现。
本发明的实施方式可以在诸如集成电路模块的各种组件中实践。集成电路的设计基本上是高度自动化的过程。复杂和强大的软件工具可以用于将逻辑级的设计转换成为准备就绪以在半导体基板上蚀刻和形成的半导体电路设计。
诸如由加利福尼亚州Mountain View的Synopsys,Inc.所提供的、以及由加利福尼亚州圣何塞的Cadence Design所提供的程序,使用完善建立的设计规则、以及预存储的设计模块库,可以在半导体芯片上自动导体布线并且定位组件。一旦已经完成针对半导体电路的设计,以标准化电子格式(Opus、GDSII等)的得到的设计可以被传输到半导体制造设施或者“fab”来用于制造。
尽管在特定实施方式的上下文中有所描述,对本领域技术人员显而易见的是,对于这些主旨可以进行许多修改和各种变化。由此,虽然已经就本发明的一个或者多个实施方式而特别示出和描述了本发明,本领域技术人员应理解,在这里可以执行特定的修改或者变化,而并不背离如上文所阐明的本发明的范围和精神、且不背离下文的权利要求书的范围,特别是当这些变化通过处理步骤的类似的集合或者类似或等效的硬件设置而实现相同效果的时候。
权利要求
1.一种用于编码语音信号的方法,所述方法包括将语音信号划分成为多个帧;将所述多个帧的至少一个划分为至少两个子帧单元;针对子帧单元搜索固定编码本贡献和自适应编码本贡献;以及将至少一个子帧单元选择为不使用所述固定编码本贡献来编码。
2.根据权利要求1所述的方法,其中将固定音高增益应用到不具有所述固定编码本贡献的所述子帧。
3.根据权利要求2所述的方法,其中基于当前帧和先前帧的能量来计算所述固定音高增益。
4.根据权利要求3所述的方法,其中所述固定音高增益由以下来计算gf=Σn=0127hLPold2(n)Σn=0127hLPnew2(n),]]>其中受到gf≤1的约束;其中hLPold(n)和hLPnew(n)分别表示所述先前帧和所述当前帧的冲击响应。
5.根据权利要求1所述的方法,进一步包括将具有所述固定编码本贡献的至少一个子帧单元以及不具有所述固定编码本贡献的至少一个子帧单元的第一结合进行组合,并且将不具有所述固定编码本贡献的至少一个子帧单元以及具有所述固定编码本贡献的至少一个子帧单元的第二结合进行组合;以及仅仅选择所述第一结合和第二结合中的一个用于传输。
6.根据权利要求5所述的方法,其中组合所述第一结合和第二结合包括,组合子帧单元以便最小化跨越所述帧的误差测量。
7.根据权利要求6所述的方法,其中组合子帧单元以便最小化所述误差测量包括反复地组合子帧单元的不同结合并且选择最小化跨越所述帧的所述误差测量的特定结合用于传输。
8.根据权利要求1所述的方法,其中选择是基于计算用于不同组合的标准,所述组合由具有所述固定编码本贡献所编码的子帧单元以及不具有所述固定编码本贡献所编码的子帧单元所构成。
9.根据权利要求8所述的方法,其中所述标准包括均方加权的误差。
10.根据权利要求1所述的方法,进一步包括在所述帧中设置至少一个比特以指示哪个至少一个子帧使用非固定编码本贡献来编码。
11.根据权利要求1所述的方法,其中所述子帧单元包括半帧。
12.根据权利要求1所述的方法,其中所述子帧单元包括四分之一帧。
13.一种编码器,包括第一输入,耦合到编码本;以及第二输入,用于接收语音信号;其中所述编码器操作,用以针对所述所接收的语音信号,在所述编码本中搜索固定编码本贡献和自适应编码本贡献,并且用以将所述语音信号作为包括至少两个子帧单元的帧输出,以及所述编码器进一步操作以不使用所述固定编码本贡献来编码所述帧的至少一个子帧单元。
14.根据权利要求13所述的编码器,其中所述编码器组合具有所述固定编码本贡献的至少一个子帧单元、以及不具有所述固定编码本贡献的至少一个子帧单元的第一结合,并且组合不具有所述固定编码本贡献的至少一个子帧单元、以及具有所述固定编码本贡献的至少一个子帧单元的第二结合;以及所述编码器仅仅输出所述第一结合和第二结合中的一个。
15.根据权利要求14所述的编码器,其中所述编码器组合所述第一结合和第二结合以便最小化跨越所述结合的误差测量。
16.根据权利要求15所述的编码器,其中组合子帧单元以便最小化所述误差测量包括反复组合子帧单元的不同结合并且选择最小化跨越所述帧的所述误差测量的特定结合用于传输。
17.根据权利要求13所述的编码器,其中所述编码器进一步操作用以编码具有所述固定编码本贡献的其他子帧单元的至少一个以便形成第一结合,并且用以编码具有所述固定编码本贡献的所述至少一个子帧单元以及不具有所述固定编码本贡献的所述至少一个另一子帧单元以形成第二结合,所述编码器基于标准仅仅输出所述第一结合和第二结合中的一个。
18.根据权利要求17所述的编码器,其中所述标准包括均方误差。
19.一种机器可读的指令程序,实际地包含在信息承载介质上并且可由数字数据处理器执行,以实现针对编码语音帧的动作,所述动作包括将语音信号划分成为多个帧;将所述多个帧的至少一个划分为至少两个子帧单元;针对子帧单元搜索固定编码本贡献和自适应编码本贡献;以及将至少一个子帧单元选择为不使用所述固定编码本贡献来编码。
20.根据权利要求19所述的程序,其中所述动作进一步包括组合具有所述固定编码本贡献的至少一个子帧单元以及不具有所述固定编码本贡献的至少一个子帧单元的第一结合,并且组合不具有所述固定编码本贡献的至少一个子帧单元以及具有所述固定编码本贡献的至少一个子帧单元的第二结合;以及仅仅选择所述第一结合和第二结合中的一个用于传输。
21.根据权利要求20所述的程序,其中组合所述第一结合和第二结合包括,组合子帧单元以便最小化跨越所述帧的误差测量。
22.根据权利要求21所述的程序,其中组合子帧单元以便最小化所述误差测量包括反复组合子帧单元的不同结合并且选择最小化跨越所述帧的所述误差测量的特定结合用于传输。
23.根据权利要求19所述的程序,其中选择是基于计算用于不同组合的标准,所述组合由具有所述固定编码本贡献所编码的子帧单元以及不具有所述固定编码本贡献所编码的子帧单元所构成。
24.根据权利要求23所述的程序,其中所述标准包括均方加权的误差。
25.一种编码装置,包括用于将语音信号划分成为多个帧的器件;用于将所述多个帧的至少一个划分为至少两个子帧单元的器件;用于针对子帧单元搜索固定编码本贡献和自适应编码本贡献的器件;以及用于将至少一个子帧单元选择为不使用所述固定编码本贡献来编码的器件。
26.根据权利要求25所述的编码装置,其中用于将语音信号划分成为多个帧的所述器件、以及用于将所述多个帧的至少一个划分为至少两个子帧单元的所述器件包括编码器;用于搜索的所述器件包括耦合到所述编码器、以及耦合到存储编码本的计算机可读存储器的处理器;以及用于选择的所述器件包括所述处理器。
27.根据权利要求25所述的编码装置,进一步包括增益器件,用于将固定音高增益应用到所述具有非固定编码本贡献的所述子帧。
28.根据权利要求27所述的编码装置,进一步包括处理器件,用于基于当前帧和先前帧的能量来计算所述固定音高增益。
29.根据权利要求28所述的编码装置,其中处理器件通过下式计算所述固定音高增益gfgf=Σn=0127hLPold2(n)Σn=0127hLPnew2(n),]]>其中受到gf≤1的约束;其中hLPold(n)和hLPnew(n)分别表示所述先前帧和所述当前帧的冲击响应。
30.根据权利要求25所述的编码装置,其中进一步包括,用于在所述帧中设置至少一个比特的器件,以指示哪个至少一个子帧使用非固定编码本贡献来编码。
31.根据权利要求25所述的编码装置,其中所述子帧单元包括半帧。
32.根据权利要求25所述的编码装置,其中所述子帧单元包括四分之一帧。
33.一种解码器,包括第一输入,耦合到编码本;以及第二输入,用于接收语音信号的被编码的帧,所述被编码的帧包括至少两个子帧单元;其中所述解码器操作,用以针对所述所接收的被编码的帧,在所述编码本中搜索固定编码本贡献和自适应编码本贡献,并且用以不使用所述固定编码本贡献来解码至少一个所述子帧单元。
34.根据权利要求33所述的解码器,其中所述解码器读取所述帧中的一个比特,并且基于所述比特来确定哪个子帧单元将不使用所述固定编码本贡献来解码。
35.根据权利要求33所述的解码器,其中所述子帧单元包括半帧。
36.根据权利要求33所述的解码器,其中所述子帧单元包括四分之一帧。
37.一种包括编码器和解码器的通信系统,其中所述编码器包括第一输入,耦合到编码本;以及第二输入,用于接收将要传输的语音信号;其中所述编码器操作,用以针对所述所接收的语音信号,在所述编码本中搜索固定编码本贡献和自适应编码本贡献,并且用以将所述语音信号作为包括至少两个子帧单元的帧输出,以及所述编码器进一步操作以不使用所述固定编码本贡献来编码所述帧的至少一个子帧单元。并且其中所述解码器包括第一输入,耦合到编码本;以及第二输入,用于在信道上所接收的语音信号的被编码的帧,所述被编码帧包括至少两个子帧单元;其中所述解码器操作,用以针对所述所接收的被编码的帧,在所述编码本中搜索固定编码本贡献和自适应编码本贡献,并且用以不使用所述固定编码本贡献来解码所述所编码的帧的所述子帧单元的至少一个。
38.根据权利要求37所述的通信系统,进一步包括放大器,用于将固定音高增益应用到不具有固定编码本贡献的所述子帧单元。
39.根据权利要求38所述的通信系统,其中所述固定音高增益基于当前帧和先前帧的能量来计算。
40.根据权利要求37所述的通信系统,其中所述编码器操作用以组合具有所述固定编码本贡献的至少一个子帧单元以及不具有所述固定编码本贡献的至少一个子帧单元的第一结合,并且用以组合不具有所述固定编码本贡献的至少一个子帧单元以及具有所述固定编码本贡献的至少一个子帧单元的第二结合;以及用以仅仅输出所述第一结合和第二结合中的一个。
41.根据权利要求40所述的通信系统,其中所述编码器操作以设置所述帧中的一个比特,所述比特指示哪个子帧单元将不使用所述固定编码本贡献来编码,并且此外,其中所述解码器基于所述比特来确定哪个子帧单元将不使用所述固定编码本贡献来解码。
42.根据权利要求40所述的通信系统,其中所述编码器基于跨越所述第一结合和第二结合的误差测量来将所述第一结合或者第二结合作为帧输出。
43.根据权利要求42所述的通信系统,其中所述误差测量包括均方误差测量。
44.根据权利要求37所述的通信系统,其中所述子帧单元包括半帧。
45.根据权利要求37所述的通信系统,其中所述子帧单元包括四分之一帧。
全文摘要
一种用于对语音或者其它普通信号进行编码的方法,包括将语音信号划分成为多个帧,以及将多个帧的至少一个划分成为至少两个子帧单元。针对子帧单元执行搜索固定编码本贡献和自适应编码本贡献。将至少一个子帧单元选择为不使用固定编码本贡献来编码。编码器可以针对相同帧来反复设置并且不同地编码子帧,并且选择最小化跨越帧的误差测量的设置用于传输。示出的各种实施方式具体表达为计算机程序、解码器以及通信系统。
文档编号G10L19/12GK101080767SQ200580043598
公开日2007年11月28日 申请日期2005年11月2日 优先权日2004年11月3日
发明者B·贝西特 申请人:诺基亚公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1