在摩擦音或破擦音的起始段或终止段的时间的接近处使用提高的时间分辨率的音频编码...的制作方法

文档序号:9439061阅读:235来源:国知局
在摩擦音或破擦音的起始段或终止段的时间的接近处使用提高的时间分辨率的音频编码 ...的制作方法
【技术领域】
[0001]根据本发明的实施例是关于一种基于输入音频信息提供编码音频信息的音频编码器。
[0002]根据本发明的其他实施例是关于一种基于编码音频信息提供解码音频信息的音频解码器。
[0003]根据本发明的其他实施例是关于一种包括音频编码器及音频解码器的系统。
[0004]根据本发明的其他实施例是关于一种基于输入音频信息提供编码音频信息的方法。
[0005]根据本发明的其他实施例是关于一种基于编码音频信息提供解码音频信息的方法。
[0006]根据本发明的其他实施例是关于一种执行所述方法中的一个的计算机程序。
[0007]根据本发明的其他实施例是关于一种用于语音的音频带宽扩展中摩擦音或破擦音的起始段或终止段建模。
【背景技术】
[0008]近年来,对音频信号,特定而言,对语音信号的数字储存及传输的需求愈来愈大。在某些类似例如行动通讯应用的情况下,要求获得相对低的比特率。
[0009]然而,为了在比特率与音频质量(或语音质量)之间获得良好的平衡,存在方法来使用相对高的精度编码音频信号的低频部分(例如,最高达近似6kHz的频率部分),且依赖于带宽扩展重构音频内容的高频部分(例如,高于近似6kHz或7kHz的频率部分)。举例而言,带宽扩展可基于使用相对少的参数重构音频内容的高频部分,其中参数可例如以粗略方式描述频谱包络。
[0010]带宽扩展的熟知实行方案为带宽复制(SBR),此实行方案已在MPEG (动画专家组)中进行标准化。
[0011]举例而言,国际标准IS0/IEC 14496-3:200X (E)第4子部分中第4.6.18及4.6.19章中描述了有关带宽复制的某些细节。
[0012]此外,亦参阅了专利申请第US 2011/0099018 Al号,所述专利描述一种使用频谱倾斜受控式定帧计算带宽扩展数据的设备及方法。所述专利申请描述一种计算带宽扩展系统中音频信号的带宽扩展数据的设备,其中第一带宽用第一数目个位编码,且不同于第一带宽的第二带宽用第二数目个位编码,第二数目个位少于第一数目个位。设备具有可控带宽扩展参数计算器,所述可控带宽扩展参数计算器针对音频信号的第一序列帧以逐帧方式计算第二带宽的带宽扩展参数。每一帧具有可控开始时间瞬时。设备额外包括频谱倾斜侦测器,所述侦测器侦测音频信号的时间部分中的频谱倾斜且取决于频谱倾斜而信号传递音频信号的个别帧的开始时间瞬时。
[0013]然而,已发现在带宽扩展的许多已知方法中,摩擦音或破擦音存在的情况下所获得的听觉效果实质上有所劣化。举例而言,已知带宽扩展技术可能引起前回声及后回声。此夕卜,在使用已知带宽扩展技术时,摩擦音或破擦音可能会听起来过于尖锐。
[0014]鉴于上述情形,需要创建允许改进的音频质量的带宽扩展概念。

【发明内容】

[0015]根据本发明的实施例创建一种基于输入音频信息提供编码音频信息的音频编码器。音频编码器包括配置为使用可变时间分辨率提供带宽扩展信息的带宽扩展信息提供器。音频编码器亦包括配置为侦测摩擦音或破擦音的起始段的侦测器。音频编码器配置为调整带宽扩展信息提供器所使用的时间分辨率,以使得至少针对侦测到摩擦音或破擦音的起始段的时间的之前的预定时间周期及针对侦测到摩擦音或破擦音的起始段的时间的之后的预定时间周期,以提高的时间分辨率提供带宽扩展信息。
[0016]根据本发明的此实施例基于如下发现,若针对侦测到摩擦音或破擦音的起始段的时间的整个环境,以高的时间分辨率提供带宽扩展信息,则可达成良好听觉质量。因此,以高的时间分辨率(至少关于带宽扩展信息)编码摩擦音或破擦音的整个起始段,所述整个起始段通常包括侦测到摩擦音或破擦音的起始段的时间的之前的特定时间扩展及实际侦测到摩擦音或破擦音的起始段的时间的之后的特定周期(时间扩展),从而有助于避免前回声且亦有助于避免不自然的听觉感觉。通常,无法非常精确地侦测到摩擦音或破擦音的起始段,因为摩擦音或破擦音的起始段的侦测常常基于临界交叉的侦测,而此交叉在摩擦音或破擦音的起始段的刚开始处显然并未出现。因此,(实际)侦测到摩擦音或破擦音的起始段的时间在时间上在摩擦音或破擦音的刚刚开始(或起始段)的后。因此,藉由确保至少针对(实际)侦测到摩擦音或破擦音的起始段的时间的前的预定时间周期,以提高的时间分辨率(与「正常的」时间分辨率相比)提供带宽扩展信息,可达成:亦可以良好分辨率重现摩擦音或破擦音的起始段刚刚开始处的细节,其中已发现,甚至在摩擦音或破擦音的起始段刚刚开始处的此类细节对于良好听觉感觉而言重要。因此,藉由至少针对侦测到摩擦音或破擦音的起始段的时间的前的预定时间周期,以提高的时间分辨率提供带宽扩展信息,不仅有助于避免前回声,亦使得能够重现摩擦音或破擦音的起始段的细节。类似地,藉由确保针对侦测到摩擦音或破擦音的起始段的时间的后的预定时间周期,以提高的时间分辨率提供带宽扩展信息,使得能够重现摩擦音或破擦音的起始段的细节,此类细节对于听力感觉而言重要。
[0017]因此,本文所描述的概念使得能够以高的时间分辨率重现摩擦音或破擦音的整个起始段,此有助于避免听力感觉的劣化,而此劣化例如由摩擦音或破擦音的起始段刚刚开始处或自摩擦音或破擦音的起始段至稳定信号部分的过渡处(带宽扩展信息的)过于粗略的时间分辨率引起。
[0018]在较佳实施例中,音频编码器配置为响应于侦测到摩擦音或破擦音的起始段,自用于提供带宽扩展信息的第一时间分辨率切换至用于提供带宽扩展信息的第二时间分辨率,其中第二时间分辨率高于第一时间分辨率。因此,执行用于提供带宽扩展信息的两个不同时间分辨率的间的切换,其中所述切换系由侦测到摩擦音或破擦音的起始段来控制。因此,创建一种简单控制方案,所述方案可容易地实施于音频编码器或音频解码器中。
[0019]在较佳实施例中,带宽扩展信息提供器配置为提供带宽扩展信息,以使得带宽扩展信息与具有相等时间长度的时间上规则的时间间隔(可形成用于提供带宽扩展信息的基础但可细分的时间网格)相关联。带宽扩展信息提供器配置为当使用第一时间分辨率(例如,相对较低的时间分辨率)时,针对具有给定时间长度的时间间隔提供带宽扩展信息的单个集合。此外,带宽扩展信息提供器可配置为当使用第二时间分辨率(例如,相对较高的时间分辨率)时,针对具有给定时间长度的时间间隔提供与子时间间隔相关联的带宽扩展信息的多个集合。
[0020]藉由将具有相等时间长度的时间上规则的时间间隔(例如,帧)用作用于提供带宽扩展信息的(基础)时间网格,音频编码器可得以容易地实施。举例而言,带宽扩展信息提供器仅需要在两个离散的时间分辨率的间切换,此切换可在无需过多工作量的情况下得以实施。举例而言,带宽扩展信息提供器可仅需实施以基于具有给定时间长度的时间间隔提供带宽扩展信息的单个集合,且基于具有给定时间长度的时间间隔的预定(及固定)数目个(具有相等长度)的子间隔提供带宽扩展信息的多个集合。因此,以下可例如为充分的:带宽扩展信息提供器配置为基于具有给定时间长度的时间间隔提供带宽扩展信息的单个集合,或基于四个子时间间隔提供带宽扩展信息的四个集合,所述等子时间间隔中的每一者的长度等于给定时间长度的四分的一。此外,藉由使用此类概念,提供带宽扩展信息的时间间隔期间信号传递可能要求的信号传递工作量可保持为小,因为仅需要在「粗略分辨率」(例如,针对具有给定时间长度的时间间隔的带宽扩展信息的单个集合)与「精细分辨率」(例如,与具有相等长度的η个子时间间隔相关联的带宽扩展信息的η个集合)的间进行选择。因此,提供用于提供带宽扩展信息的特定有效的概念。
[0021]在较佳实施例中,音频编码器配置为调整带宽扩展信息提供器所使用的时间分辨率,以使得与带宽扩展信息的一个集合相关联的至少一个子时间间隔紧接在另一子时间间隔的前,所述另一子时间间隔与带宽扩展信息的另一集合相关联且在所述另一子时间间隔期间侦测到摩擦音或破擦音的起始段,以使得在侦测到摩擦音或破擦音的起始段的子时间间隔的前的至少一个子时间间隔中使用提高的时间分辨率。因此,有可能甚至在摩擦音或破擦音的起始段刚刚开始处以高的时间分辨率提供带宽扩展信息,亦即,甚至在实际可侦测到摩擦音或破擦音的起始段的前以高的时间分辨率提供带宽扩展信息。
[0022]在较佳实施例中,音频编码器配置为若针对具有给定时间长度的给定时间间隔使用提高的时间分辨率提供带宽扩展信息,则将具有给定时间长度的给定时间间隔细分为具有相等长度的四个子时间间隔,以使得针对具有给定时间长度的给定时间间隔提供带宽扩展信息的四个集合(例如,带宽扩展参数的四个集合,每一集合与子时间间隔中的一者相关联)。因此,可达成带宽扩展信息的高的时间分辨率,因为带宽扩展信息的四个集合可例如针对四个子间隔独立地描述音频内容的高频信号部分的包络。因此,可考虑四个子时间间隔的高频信号部分的频谱包络的差异,因为带宽扩展信息的集合中的每一者可表示子时间间隔中的一者的高频部分的频率包络(或频谱包络)。
[0023]在较佳实施例中,音频编码器配置为若在第二时间间隔内侦测到摩擦音或破擦音的起始段且若侦测到摩擦音或破擦音的起始段的时间与第一时间间隔与第二时间间隔的间的边界的间的时间距离小于预定时间距离,则针对具有给定时间长度的第二时间间隔的前的具有给定时间长度的第一时间间隔,选择性地使用提高的时间分辨率提供带宽扩展信息。因此,甚至在侦测到摩擦音或破擦音的起始段的时间位于后续第二时间间隔(例如,后续第二帧)内的情况下,若假设摩擦音或破擦音的起始段刚刚开始处(通常位于实际侦测到摩擦音或破擦音的起始段的时间的前)位于第一时间间隔内,则以提高的时间分辨率(与「正常的」时间分辨率相比)提供第一时间间隔(例如,第一帧)的带宽扩展信息。因此,摩擦音或破擦音的整个起始段包括摩擦音或破擦音的起始段刚刚开始处及有可能甚至摩擦音或破擦音的起始段的前的一定时间量,经评估,针对所述整个起始段,提供带宽扩展信息时使用高的时间分辨率,从而形成良好语音重现。并非仅避免前回声,摩擦音或破擦音的起始段可得以精确重现而并无过量的尖锐度或其他实质假影。
[0024]在较佳实施例中,音频编码器配置为运行时间先行,以使得响应于在第二时间间隔内侦测到摩擦音或破擦音的起始段,针对具有给定时间长度的第二时间间隔的前的具有给定时间长度的第一时间间隔,使用提高的时间分辨率提供带宽扩展信息。因此,针对摩擦音或破擦音的整个起始段(及有可能甚至摩擦音或破擦音的起始段的前的较短时间周期),有可能以提高的时间分辨率提供带宽扩展信息,从而获得改进的音频质量。
[0025]在较佳实施例中,音频编码器配置为调整带宽扩展信息提供器所使用的时间分辨率,以使得至少针对侦测到摩擦音或破擦音的起始段的时间的前的预定时间周期及针对侦测到摩擦音或破擦音的起始段的时间的后的预定时间周期,以相同的提高的时间分辨率提供带宽扩展信息。藉由使用相等的时间分辨率,与在侦测到摩擦音或破擦音的起始段的时间的前及的后使用不同时间分辨率的情况相比,带宽扩展信息的提供有所简化。此外,藉由针对侦测到摩擦音或破擦音的起始段的时间的前的预定时间周期及针对侦测到摩擦音或破擦音的起始段的时间的后的预定时间周期,使用相同的提高的时间分辨率,信号传递工作量有所减少。
[0026]在较佳实施例中,音频编码器配置为调整带宽扩展信息提供器所使用的时间分辨率,以使得至少针对第一子时间间隔、第二子时间间隔及第三子时间间隔,以相同的提高的时间分辨率提供带宽扩展信息的集合,其中第一子时间间隔紧接在第二子时间间隔的前,其中在第二子时间间隔内侦测到摩擦音或破擦音的起始段,且其中第三子时间间隔紧跟在第二子时间间隔的后。因此,当提供带宽扩展信息的集合时,用相同的时间分辨率处理「嵌有」期间侦测到摩擦音或破擦音的起始段的第二子时间间隔的第一子时间间隔及第三子时间间隔。因此,当提供带宽扩展信息时,以高的时间分辨率处置摩擦音或破擦音的起始段的实质部分,或甚至摩擦音或破擦音的整个起始段。此外,藉由针对第一子时间间隔、第二子时间间隔及第三子时间间隔使用相同的(提高的,或「高的」)时间分辨率,编码及解码变简单,且信号传递管理负担(用于信号传递时间分辨率)变小。
[0027]在较佳实施例中,侦测器配置为侦测摩擦音或破擦音的终止段。在此种情况下,音频编码器配置为调整带宽扩展信息提供器所使用的时间分辨率,以使得至少针对侦测到摩擦音或破擦音的终止段的时间的前的预定时间周期及针对侦测到摩擦音或破擦音的终止段的时间的后的预定时间周期,以提高的时间分辨率提供带宽扩展信息。根据本发明的此实施例基于如下发现,针对摩擦音或破擦音的终止段,亦应以高的时间分辨率执行带宽扩展。已发现,人类听觉实际上对于摩擦音或破擦音的终止段亦敏感,因此值得耗费比特率管理负担以高的时间分辨率(关于带宽扩展信息)编码摩擦音或破擦音的终止段。此外,已发现,在摩擦音或破擦音的终止段期间以低的时间分辨率提供带宽扩展信息通常会导致摩擦音或破擦音的终止段期间不当的尖锐听觉感觉,此感觉被视为假影。
[0028]此外,应注意,关于响应于摩擦音或破擦
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1