带宽扩展参数生成装置、编码装置、解码装置、带宽扩展参数生成方法、编码方法、以及解...的制作方法

文档序号:8269910阅读:348来源:国知局
带宽扩展参数生成装置、编码装置、解码装置、带宽扩展参数生成方法、编码方法、以及解 ...的制作方法
【技术领域】
[0001] 本发明涉及声音信号的编码装置及解码装置等,尤其涉及声音信号的编码及解码 中的带宽扩展(bandwidthextension)技术。
【背景技术】
[0002] 一般来说,在声音信号(语音信号及音频信号)的编码中,使用核心编码工具 (corecodingtool)和参量编码工具(parametriccodingtool)这两种工具。
[0003] 作为参量编码工具之一的带宽扩展工具(BWE工具),在MPEG USAC (非专利文献 2)等技术中,已知有上复制(copy - up)方法和谐波(harmonic)方法。
[0004] 现有技术文献
[0005] 非专利文献
[0006] 非专利文献 1 :Carot,Alexander,etal"NetworkedMusicPerformance:State oftheArt",AES30thInternationalConference,2007March15 - 17
[0007] 非专利文献 2 :Neuendorf,etal,"MPEGUnifiedSpeechandAudioCoding- TheISO/MPEGStandardforHigh-EfficiencyAudioCodingofallContentTypes'', AES132ndConvention? 2012April26 - 29.
[0008] 非专利文献3 :Sinha,etal,"ANovelIntegratedAudioBandwidthExtension Toolkit(ABET)",AES120thConvention,2006,May20 - 23.
[0009] 非专利文献 4:ShuixianChen,etal,"EstimatingSpatialCuesforAudio CodinginMDCTDomain'',IEEEInternationalConferenceonMultimediaandExpo, 2009,June28 -July3
[0010] 非专利文献 5 :Daudet,Sandler,"MDCTAnalysisofSinusoids:ExactResults andApplicationstoCodingArtifactsReduction'',IEEETransactionsonSpeechand AudioProcessing,Vol. 12,No. 3,May2004.

【发明内容】

[0011] 发明要解决的课题
[0012] 上复制方法是复制低频部分的频谱而生成高频部分的频谱的简单方法。在上复制 方法中,存在无法正确保持两个频谱间的谐波关系的课题。即,音质是课题。
[0013]另一方面,谐波方法是通过将低频部分的频谱谐波地拉伸(stretch),并且切割出 来,生成高频部分的频谱的方法。在谐波方法中,由于处理复杂,因此其课题在于延迟时间 长这一点和需要大容量存储器这一点上。
[0014] 于是,本发明提供使用了新的带宽扩展方法的带宽扩展参数生成装置等。
[0015] 用于解决课题的手段
[0016] 本发明的一个方式的带宽扩展参数生成装置具有:提取部,提取表示输入声音信 号的高频带部分的高频带信号;以及计算部,计算音调参数和基底参数,所述音调参数表示 所述高频带信号中的音调成分的能量的大小,所述基底参数表示所述高频带信号中的除了 所述音调成分之外的成分即基底成分的能量的大小。
[0017] 另外,这些概括性的或者具体的方式也可以以系统、方法、集成电路、计算机程序 或者计算机可读的CD-ROM等记录介质来实现,还可以以系统、方法、集成电路、计算机程 序及记录介质的任意组合来实现。
[0018] 发明效果
[0019] 根据本发明的带宽扩展参数生成装置等,能够抑制延迟时间及使用存储器,并且 使高音质的带宽扩展成为可能。
【附图说明】
[0020] 图1是用于说明上复制方法(图1的(a))和谐波方法(图1的(b))的示意图。
[0021] 图2是表示USAC的解码器中的两个BWE模式的框图。
[0022] 图3是表示实施方式1的编码装置的功能结构的框图。
[0023] 图4是实施方式1的编码装置的动作的流程图。
[0024] 图5是表示时间间隙(time slot)与参数间隙(parameter slot)的关系、以及子 带与参数频带的关系的图。
[0025] 图6是表示实施方式2的解码装置的功能结构的框图。
[0026] 图7是实施方式2的解码装置的动作的流程图。
[0027] 图8是表示实施方式3的编码装置的功能结构的框图。
[0028] 图9是实施方式3的编码装置的动作的流程图。
[0029] 图10是表示调帧器的成帧动作及窗处理动作的图。
[0030] 图11是表示MDCT区域、MDST区域、以及复数区域的各个区域中的纯粹的音调的 能量的图。
[0031] 图12是表示实施方式4的解码装置的功能结构的框图。
[0032] 图13是实施方式4的解码装置的动作的流程图。
【具体实施方式】
[0033] (作为本申请的基础的见解)
[0034] 在声音信号(语音信号及音频信号)的编码中,一般使用参量编码工具和核心编 码工具这至少两种工具。首先,对参量编码工具进行说明。
[0035] 参量编码工具进行以维持输入声音信号(以下,有时记载为输入信号、原信号或 编码对象的信号)的感知性特征来进行重构为目的的编码。通过该编码,输入信号的感知 性特征通过以低比特率编码得到的少数参数来表示。
[0036] 将由参量编码工具编码后的信号进行解码而得到的信号、即重构信号,虽然能够 在感知性上维持输入信号的品质,但重构信号的波形与输入信号的波形并不类似。作为参 量编码工具,例举如带宽扩展工具和多声道扩展工具。
[0037] 带宽扩展工具通过利用信号的高频部分与低频部分的谐波关系,将信号的高频部 分参量化地进行编码。作为通过带宽扩展工具的编码而生成的参数(带宽扩展参数)的例 子,例如子带能量和音调噪声比(tone-to-noise ratio)。
[0038] 带宽扩展参数在频谱地扩展后的高频部分的信号的振幅的形成中使用。通过在解 码器中修补或者拉伸而将低频部分扩展,由此形成高频部分的信号。另外,在解码器中,适 当校正基底噪声及音质等。虽然作为结果而得到的输出信号的波形与输入信号的波形不类 似,但输出信号在感知性方面与输入信号相似。
[0039] HE - AAC就是包含这样的带宽扩展工具及频谱频带复制(SBR)的编解码器。在 SBR中,在使用正交镜像滤波器组(QMF)而生成的时间频率混合区域中进行参数计算。 ITU - T G. 718也是具有带宽扩展工具的编解码器,但在ITU - T G. 718中,参数计算是在 改进离散余弦变换(MDCT,Modified Discrete Cosine Transform)区域中进行的。
[0040] 多声道扩展工具将多声道信号下混合(down mix)到编码用的声道子集。结果是, 各个声道间的关系被参量化地编码。作为通过多声道扩展工具的编码而生成的参数的例 子,例如声道间电平差、声道间时间差、以及声道间相关。在解码器中,通过将解码完成的下 混合声道和人工生成的"非相关"信号混合,来合成各个声道。混合的权重(weights)基于 上述参数计算出。MPEG环绕(MPS)是多声道扩展工具的应用例。
[0041] 接着,对核心编码工具进行说明。核心编码工具与参量编码工具相对照地,进行以 维持输入信号的波形特征来进行重构为目的的编码。核心编码工具通常适用于人类的耳朵 反应最敏感的频谱的低频部分。核心编码工具大致分为音频编解码器和语音编解码器这两 种。
[0042] 音频编解码器适用于对包含被局部化的频谱成分的稳定信号(例如,音调信号或 高次谐波信号)进行编码。在音频编解码器中,编码主要是在频率区域进行的。
[0043] 音频编解码器的编码使用时间/频率变换及MDCT将信号变换到频率(频谱)区 域。在MDCT时,部分重合的
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1