用于增强语音编解码器的质量的设备和方法

文档序号:2831747阅读:348来源:国知局
专利名称:用于增强语音编解码器的质量的设备和方法
技术领域
本发明涉及一种语音编解码器(speech codec),且更具体地,涉及一种 用于减少由语音编码时静默片段(silence segment)的量化中的误差导致的质 量劣化的设备和方法。
背景技术
用于压缩语音信号的模块称为编码器,而用于解压缩压缩后的语音信号 的模块称为解码器。最基本的语音编解码器是ITU-T G.711编解码器,该编解 码器以8 kHz来采样输入信号,并且将采样后的输入信号量化到8比特。其 中,为了增加量化效率,使用了如等式1所示的A-规则(law)对数量化器 或如等式2所示的u-规则对数量化器。
<formula>formula see original document page 4</formula>
如上所述的传统对数量化器根据输入信号的量值(magnitude)来应用不 同的量化间隔。例如,对于具有小量值的信号来设置相对宽的量化间隔,而 对于具有大量值的信号(也就是说,很可能要生成的信号)来设置相对窄的 量化间隔。相应地,增加了量化的效率。
公知的是,在整个带宽上均匀地分布量化噪声。然而,冲艮据人类听力的 特性,由于在具有大量值的信号片段中存在的量化误差被隐藏在该信号中, 所以无法清楚地听到该量化误差;并且容易将在具有小量值的信号片段中存在的量化误差听作噪声。相应地,因为静默片段的编码影响编解码器的整体 性能,所以不但需要有效地编码语音片段、而且需要有效地编码静默片段。 换言之,由静默片段中的量化误差导致的噪声可能影响整体的声音质量。
编解码器可能根据输入信号的量值而具有不同的性能。为了评估语音编
解码器的性能,通常评估具有不同量值的信号,例如,-16、 -26、和-36dBoV 的信号。换言之,编解码器评估其性能如何根据输入信号幅度的改变而变化。 在诸如G.711或G.722的编解码器中,由于针对-36 dBoV的输入信号的 量化误差而生成噪声。具体地,在输入信号的静默片段中生成的量化误差用 作减少编解码器的整体质量中的因素。主观听力测试的结果示出了针对-26 dBoV的输入信号的平均意见得分(MOS )高于-36 dBoV
发明内容
技术问题
本发明提供了一种用于增强语音编解码器的质量的设备和方法,通过所 述设备和方法,可以通过减少由语音编码期间静默片段中的量化误差导致的 噪声来增强声音质量,使得收听者听不到噪声。
技术方案
根据本发明的一方面,提供了一种语音编解码器质量改善设备,包括 第一能量计算单元,用于计算由核心编解码器解码的信号的第一能量;以及 缩放(scaling)单元,用于当第一能量小于第一阈值时、缩放解码信号的大 小。
根据本发明的另一方面,提供了一种语音编解码器质量改善方法,包才舌 计算由核心编解码器解码的信号的第一能量;以及当第一能量小于第一阈值 时,缩放解码信号的大小。
有益效果
根据本发明,可以通过减少由于针对静音部分的量化误差而生成的(1喿声, 来改善语音编解码器的质量。具体地,可以通过减少具有小尺寸的、在静音 部分(也就是说,编解码器的输入信号)中生成的量化误差来增强声音质量。


通过参考附图来详细描述本发明的示范实施例,本发明的上面以及其他特征和优点将变得更加明显,其中
图1图示了根据本发明实施例的使用窄带核心编解码器的宽带扩展 (extension)编解码器;
图2A和2B分别图示了使用G.711编解码器的编码器和解码器的输入信 号和输出信号的频语;
图3图示了根据本发明实施例的语音编解码器质量改善设备的结构;
图4图示了根据本发明实施例的语音编解码器质量改善方法的流程以及
图5A和5B图示了当应用了根据本发明的语音编解码器质量改善方法时 使用G.711编解码器的解码器的输出信号的频语、以及当没有应用根据本发 明的语音编解码器质量改善方法时使用G.711编解码器的解码器的输出信号 的频谱。
具体实施方式
最优模式
根据本发明的一方面,提供了一种语音编解码器质量改善设备,包括 第一能量计算单元,用于计算由核心编解码器解码的信号的第一能量;以及 缩放单元,用于当第一能量小于第一阈值时、缩放解码信号的大小。
根据本发明的另一方面,提供了一种语音编解码器质量改善方法,包括 计算由核心编解码器解码的信号的第一能量;以及当第一能量小于第一阈值 时,缩放解码信号的大小。
发明模式
现在,将参考附图来更全面地描述根据本发明的用于改善语音编解码器 的质量的设备和方法,其中示出了本发明的示范实施例。
图1图示了根据本发明实施例的使用窄带编解码器的宽带扩展编解码器。
参考图1,将宽带扩展编解码器划分为传送侧100和接收侧150。传送侧 100包括低通滤波器105、高通滤波器110、窄带核心编解码器115、孑氐频 带增强模式120、宽带扩展模式125、和MUX 130。接收侧150包括DEMUX 155、窄带核心编解码器160、低频带增强模式165、宽带扩展冲莫式170、低 通滤波器175和高通滤波器180。在通过低通滤波器105和高通滤波器110时,将输入到传送侧100的宽 带输入信号分别划分为低频带信号和高频带信号。通过窄带核心编解码器115 和低频带增强模式120来编码低频带信号。通过宽带扩展模式125来编码高 频带信号。经由MUX 130来将通过窄带核心编解码器115和低频带增强模式 120编码的低频带信号、和通过宽带扩展^f莫式125编码的高通信号输出为比 特流。
低频带增强模式120编码尚未通过窄带核心编解码器115来表达的一部 分低频带信号,由此改善窄带信号的质量。 一般地,低频带增强模式120根 据窄带核心编解码器115来确定操作的算法。然而,低频带增强模式120主 要使用在时域中操作的算法,而宽带扩展模式125使用在频域中操作的算法。
接收侧150的DEMUX 155从传送侧100接收比特流,并且向窄带4亥心 编解码器160、低频带增强模式165、和宽带扩展模式170输出比特流。根据 所接收的比特流来做出关于低频带增强模式165和宽带扩展模式170是否操 作的确定。
接收侧150可以根据宽带扩展模式170的操作或不操作来输出宽带4言号。 不管接收侧150的输出信号的带宽,窄带核心编解码器160总是操作。只要 窄带核心编解码器160操作,接收侧150就可以再生(reproduce)基本的窄 带信号。为了再生更好质量的窄带信号,低频带增强模式165以及窄带核心 编解码器160需要操作。另外,为了输出宽带信号,窄带核心编解码器160 和宽带扩展模式170两者都需要操作。换言之,为了使得接收侧150再生宽 带输出信号,将窄带核心编解码器160和宽带扩展模式170的输出信号加到 一起。当然,为了再生更好质量的宽带信号,接收侧150将窄带核心编解码 器160和低频带增强模式165的输出信号加到宽带扩展模式170的输出信号。
在国际电信联盟电信标准化部门(ITU-T)中,正在进行使用G.711编解 码器作为核心编解码器并且具有与图1的宽带扩展编解码器的结构类似的结 构的宽带扩展编解码器的标准化。换言之,基于由ITU-T推荐的G.711编解 码器的宽带扩展编解码器将G.711编解码器用作窄带核心编解码器115和 160,并且可以具有诸如图l所图示的结构。然而,在-36 dBoV信号的情况 下,G.711编解码器由于量化误差而生成噪声。
图2A和2B分别图示了使用G.711编解码器的编码器和解码器的l命入信 号和输出信号的频谱。图2A图示了语音信号的频谱,而图2B图示了静默信号的频谱。
参考图2A,在语音信号方面,编码器的输入信号200的频谱与解码器的 输出信号210的频谱几乎相同。然而,参考图2B,在静默信号方面,.编码器 的输入信号230的频谱与解码器的输出信号220的频谱不同。换言之,语音 片段具有小量化误差,而静默片段具有大量化误差。收听者将该大量化误差 听作噪声。
图3图示了根据本发明实施例的语音编解码器质量改善设备的结构。参 考图3,语音编解码器质量改善设备包括第一能量计算单元300、第二能量 计算单元310、和缩放单元320。
第一能量计算单元300计算由核心编解码器解码的信号的能量(以下, 称为核心编解码器的能量)。第一能量计算单元300.以帧为单位来计算核心编 解码器的能量。在其中将G.711编解码器用作核心编解码器的情况下,帧的 大小可以根据其中使用G.711编解码器的环境而变化。换言之,第一能量计 算单元300通过对采样的能量进行求和来计算一帧的能量。
当低频带增强模式正在操作时,第二能量计算单元310计算通过低频带 增强模式编解码器解码的信号的能量(以下,称为增强模式的能量)。
当核心编解码器的能量小于预定阈值Thrl时,缩放单元320缩放由核心 编解码器解码的信号的大小。当核心编解码器的能量小于增强模式的能量与 预定阈值Thr2的乘积时,缩放单元320缩放由核心编解码器解码的信号的大 小。缩放单元320可以通过小于1的常数"a,,来缩放解码信号的大小。可替 换地,缩放单元320可以通过将解码信号乘以小于1、并且与当前帧的能量 (即,核心编解码器或增强模式的能量)与前一帧的能量(即,核心编解码 器或增强模式的能量)之和成比例的增益来执行缩放,由此防止了由缩;故导 致的突然改变。在此情况下,缩放单元320可以在考虑前一缩放的大小的情 况下来计算当前缩放的大小。换言之,缩放单元320可以通过将基于当前帧 和先前帧的能量获得的增益的某一比率(rate)添加到先前缩放的大小的某一 比率,来计算当前缩放的大小。当然,可以以采样为单位来执行缩放。
当解码信号的大多数能量存在于高频带中时,缩放单元320可以不4丸行
缩放。例如,当通过宽带扩展模式解码的信号的能量比核心编解码器或增强 模式的能量大至少一预定值时,缩放单元320不执行缩放。
可以通过实验法来计算阈值Thrl和Thr2、用于缩放的缩放大小"a,,等。当然,这些值可以根据本发明的实施例而变化。
图4图示了根据本发明实施例的语音编解码器质量改善方法的流程图。 参考图4,在操作S400中,根据本发明的语音编解码器质量改善设备(以下, 称为设备)计算由核心编解码器解码的信号的能量(以下,称为核心编解码 器的能量)。帧的大小可以取决于编解码器的类型和其中应用编解码器的环 境。如图1所图示,当将本发明应用到使用窄带语音编解码器的宽带扩展编 解码器时,低频带增强模式可以存在。相应地,在搡作S410中,该设备确定 低频带增强模式是否正在操作。
如果在操作S410中确定了低频带增强模式正在操作,则该设备在才喿作 S430中计算通过低频带增强模式解码的信号的能量(以下,称为增强冲莫式的 能量)。当在操作S440中核心编解码器的能量小于增强模式的能量与预定阈 值Thrl的乘积、或小于预定阈值Thr2时,该设备在揭:作S450中通过小于1 的常数"a,,来缩放由核心编解码器解码的信号的大小。
另一方面,如果在操作S410中确定了低频带增强模式不处于操作,则在 操作S420中确定核心编解码器的能量是否小于预定阈值Thr2。如果在操作 S420中确定了核心编解码器的能量小于预定阈值Thr2,则该设备在操作S450 中缩放解码信号。通过将解码信号乘以小于1、并且与当前帧的能量(即, 核心编解码器或增强模式的能量)与前一帧的能量(即,核心编解码器或增 强模式的能量)之和成比例的增益来执行缩放,由此防止了由缩放导致的突 然改变。在此情况下,可以通过将基于当前帧和先前帧的能量而获得的增益 的某一比率添加到先前缩放的大小来计算当前缩放的大小。
如上所述,先前通过实验法来计算阈值Thrl和Thr2、缩放大小等。
图5A和5B图示了当应用了才艮据本发明的语音编解码器质量改善方法时 使用G711编解码器的解码器的输出信号的频谱、和当没有应用根据本发明 的语音编解码器质量改善方法时使用G.711编解码器的解码器的输出信号的 频谱。图5A图示了语音信号的频谱,而图5B图示了静音信号的频语。
参考图5A,在语音信号的情况下,在应用根据本发明的语音编解码器质 量改善方法之前的解码器的输出信号500的频谦与在应用根据本发明的语音 编解码器质量改善方法之后的解码器的输出信号510的频谱一致。
参考图5B,在静音信号的情况下,在应用根据本发明的语音编解码器质 量改善方法之前的解码器的输出信号520的大小小于在应用根据本发明的语音编解码器质量改善方法之后的解码器的输出信号530的大小。换言之,降 低了静音部分中解码器的输出信号的电平(level),导致了量化误差的减少。
根据本发明,可以通过减少由于针对静音部分的量化误差而生成的噪声, 来改善语音编解码器的质量。具体地,可以通过减少具有小尺寸的、在静音 部分(也就是说,编解码器的输入信号)中生成的量化误差来增强声音质量。
还可以在计算机可读记录介质上将本发明实现为计算机可读代码。计算 机可读记录介质是可存储其后可以由计算机系统读取的数据的任何数据存储 装置。计算机可读记录介质的示例包括只读存储器(ROM)、随机存取存 储器(RAM)、 CD-ROM、磁带、软盘、光数据存储装置、和载波(诸如, 经过因特网的数据传送)。也可以在网络耦接的计算机系统上分布计算才几可读 记录介质,使得以分布式方式来存储和执行计算机可读代码。
尽管已经参考本发明的示范实施例而具体示出并描述了本发明,但是本 领域的普通技术人员将理解,可以在其中做出形式和细节上的各种改变,而 不脱离由以下权利要求限定的本发明的精神和范围。
权利要求
1.一种语音编解码器质量改善设备,包括第一能量计算单元,用于计算由核心编解码器解码的信号的第一能量;以及缩放单元,用于当第一能量小于第一阈值时、缩放解码信号的大小。
2. 根据权利要求1所述的语音编解码器质量改善设备,还包括第二能 量计算单元,用于计算通过低频带增强模式解码的信号的第二能量,其中,当第一能量小于第二能量与第二阈值的乘积时,缩放单元缩放由 核心编解码器解码的信号的大小。
3. 根据权利要求1所述的语音编解码器质量改善设备,其中第一能量计 算单元以帧为单位来计算第一能量。
4. 根据权利要求1所述的语音编解码器质量改善设备,其中缩放单元通 过小于1的常数来缩放解码信号。
5. 根据权利要求1所述的语音编解码器质量改善设备,其中缩放单元将 小于1的增益乘以当前帧的信号,其中,该增益与由核心编解码器解码的信 号的当前帧与先前帧的能量之和成比例。
6. —种语音编解码器质量改善方法,包括 计算由核心编解码器解码的信号的第一能量;以及 当第一能量小于第一阈值时,缩放解码信号的大小。
7. 根据权利要求6所述的语音编解码器质量改善方法,还包括 计算通过低频带增强模式解码的信号的第二能量;以及 当第一能量小于第二能量与第二阈值的乘积时,缩放由核心编解码器解码的信号的大小。
8. 根据权利要求6所述的语音编解码器质量改善方法,其中以帧为单位 来计算第一能量。
9. 根据权利要求6所述的语音编解码器质量改善方法,其中所述缩放解 码信号的大小的步骤包括通过小于1的常数来缩放解码信号。
10. 根据权利要求6所述的语音编解码器质量改善方法,其中所述缩放 解码信号的大小的步骤包括将小于1的增益乘以当前帧的信号,其中,该 增益与由核心编解码器解码的信号的当前帧与先前帧的能量之和成比例。
11. 一种计算机可读记录介质,其上记录有用于执行语音编解码器质量改善方法的程序,该方法包括计算由核心编解码器解码的信号的第一能量;以及 当第一能量小于第一阈值时,缩放解码信号的大小。
12. —种计算机可读记录介质,其上记录有用于执行语音编解码器质量 改善方法的程序,该方法包括计算通过低频带增强模式解码的信号的第二能量;以及 当第一能量小于第二能量与第二阈值的乘积时,缩放由核心编解码器解 码的信号的大小。
全文摘要
提供了一种用于改善语音编解码器的质量的设备和方法。在该方法中,计算由核心编解码器解码的信号的第一能量;以及计算通过低频带增强模式解码的信号的第二能量。然后,当第一能量小于第一阈值或小于第二能量与第二阈值的乘积时,缩放解码信号的大小。相应地,减少了针对静默片段的量化误差的生成。
文档编号G10L19/00GK101636785SQ200880008984
公开日2010年1月27日 申请日期2008年11月28日 优先权日2007年12月6日
发明者李炳墡, 李美淑, 金度泳 申请人:韩国电子通信研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1