弦波帧检测方法和设备以及音频编码方法和设备的制作方法

文档序号:2826099阅读:158来源:国知局
弦波帧检测方法和设备以及音频编码方法和设备的制作方法
【专利摘要】本发明公开了弦波帧检测方法和设备以及音频编码方法和设备。根据本发明的检测音频信号中的弦波帧的方法包括:对于所述音频信号中的给定的音频帧,获得其对应的频域数据;判断所述频域数据的峰值是否集中于少数频率处,并且判断所述频域数据的峰值是否足够大;以及将判断结果均为是的音频帧确定为弦波帧,其中,所述弦波帧为其频域能量集中于少数几处的音频帧。
【专利说明】弦波帧检测方法和设备以及音频编码方法和设备

【技术领域】
[0001] 本发明一般地涉及音频信号处理领域。具体而言,本发明涉及一种检测音频信号 中的弦波帧的方法和设备以及音频编码方法和设备。

【背景技术】
[0002] 近年来,随着音频相关应用的迅猛发展,对音频编码技术提出了越来越高的要求, 希望在尽可能少地利用系统资源的情况下,更快更好地对音频信号进行编码。
[0003] 音频信号的处理通常以音频帧为单位。有一种音频帧被称为弦波帧(tone frame)。弦波帧的特点是频域能量集中于少数几处,类似于正弦或余弦函数经时域-频域 转换后,频域能量只出现在少数几处一样。
[0004] 如果对弦波帧和非弦波帧分别进行不同的处理,例如,对弦波帧进行较大的压缩, 则可以提高编码效率。
[0005] 然而,存在如何从音频信号中快速、低功耗地检测出弦波帧的问题。
[0006] 这是因为对弦波帧和非弦波帧进行区别处理,本身就是为了提高编码效率。如果 弦波帧检测耗时,则会降低编码效率。如果弦波帧检测结果不准确,则会导致适得其反,将 非弦波帧按弦波帧处理,降低了音频信号的编码质量。如果弦波帧检测较大地增加了计算 量,并相应地消耗了较多的系统资源,则编码效率的提高可能得不偿失。
[0007] 因此,期望能够从音频信号中快速、低功耗地检测出弦波帧。


【发明内容】

[0008] 在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本 理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的 关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概 念,以此作为稍后论述的更详细描述的前序。
[0009] 本发明的目的是针对现有技术的上述问题,提出了一种能够从音频信号中快速、 低功耗地检测出弦波帧的方法和设备,并相应地提出了一种音频编码方法和音频编码设 备。
[0010] 为了实现上述目的,根据本发明的一个方面,提供了一种检测音频信号中的弦波 帧的方法,所述弦波帧为其频域能量集中于少数几处的音频帧,该方法包括:对于所述音频 信号中的给定的音频帧,获得其对应的频域数据;判断所述频域数据的峰值是否集中于少 数频率处,并且判断所述频域数据的峰值是否足够大;以及将判断结果均为是的音频帧确 定为弦波帧。
[0011] 根据本发明的另一个方面,提供了一种检测音频信号中的弦波帧的设备,所述弦 波帧为其频域能量集中于少数几处的音频帧,该设备包括:频域数据获得装置,其被配置 为:对于所述音频信号中的给定的音频帧,获得其对应的频域数据;以及判断装置,其包 括:集中判断单元,其被配置为:判断所述频域数据的峰值是否集中于少数频率处;大小判 断单元,其被配置为:判断所述频域数据的峰值是否足够大;以及结果确定单元,其被配置 为:将所述集中判断单元和所述大小判断单元的判断结果均为是的音频帧确定为弦波帧。
[0012] 根据本发明的又一个方面,提供了一种音频编码方法,该方法包括:利用如上所述 的弦波帧检测方法,检测待编码音频信号中的弦波帧;以及基于检测结果,对所述音频信号 进行编码。
[0013] 根据本发明的再一个方面,提供了一种音频编码设备,该设备包括:如上所述的检 测音频信号中的弦波帧的设备,用于检测待编码音频信号中的弦波帧;以及音频编码子单 元,用于基于所述检测音频信号中的弦波帧的设备的检测结果,对所述音频信号进行编码。
[0014] 另外,根据本发明的另一方面,还提供了 一种存储介质。所述存储介质包括机器可 读的程序代码,当在信息处理设备上执行所述程序代码时,所述程序代码使得所述信息处 理设备执行根据本发明的上述方法。
[0015] 此外,根据本发明的再一方面,还提供了 一种程序产品。所述程序产品包括机器可 执行的指令,当在信息处理设备上执行所述指令时,所述指令使得所述信息处理设备执行 根据本发明的上述方法。

【专利附图】

【附图说明】
[0016] 参照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其 它目的、特点和优点。附图中的部件只是为了示出本发明的原理。在附图中,相同的或类似 的技术特征或部件将采用相同或类似的附图标记来表示。附图中:
[0017] 图1示出了弦波帧的频域能量分布的示意图;
[0018] 图2示出了根据本发明的实施例的弦波帧检测方法的流程图;
[0019] 图3示出了根据本发明的实施例的弦波帧检测方法中步骤S2的判断子步骤之一 的具体流程图;
[0020] 图4示出了根据本发明的实施例的弦波帧检测方法的实现流程图;
[0021] 图5示出了根据本发明的实施例的音频编码方法;
[0022] 图6示出了根据本发明实施例的弦波帧检测设备的结构方框图;
[0023] 图7示出了根据本发明实施例的音频编码设备的结构方框图;以及
[0024] 图8示出了可用于实施根据本发明实施例的方法和设备的计算机的示意性框图。

【具体实施方式】
[0025] 在下文中将结合附图对本发明的示范性实施例进行详细描述。为了清楚和简明起 见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际 实施方式的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标, 例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的 不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益 于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。
[0026] 在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本发明,在附图中 仅仅示出了与根据本发明的方案密切相关的装置结构和/或处理步骤,而省略了与本发明 关系不大的其他细节。另外,还需要指出的是,在本发明的一个附图或一种实施方式中描述 的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。
[0027] 首先,以MPEG2-AAC标准为例,介绍本发明可以应用到其中的音频编码标准的相 关知识。
[0028] 应注意,本发明不仅限于应用到MPEG2-AAC标准,还可应用到其它音频编码标准。 例如,DRA 标准(Digital Rise Audio)。
[0029] 在音频编码标准中,一般都是将音频信号从时域转换到频域,在频域对音频信号 进行处理,然后将音频信号从频域转换为时域。
[0030] 在当前广泛使用的音频编码标准中,经常被用于执行时域-频域转换的方法是 MDCT (改进的离散余弦变换,Modified Discrete Cosine Transform)。
[0031] 在MPEG2-AAC标准中,一个音频帧包含1024个PCM采样数据。输入到MDCT模块 的是当前音频帧的1024个采样点、以及上一音频帧的1024个采样点。MDCT模块的输出 是1024个频域数据。频域数据被划分为多个分组,称为比例因子带(scalefactor band, 下文中简称为sfb),所有的后续编码操作都是在以比例因子带为单元的频域数据之上进行 的。以长窗、48kHz采样率的情况为例,1024个频域数据被分为如下表所示的48个比例因 子带:
[0032]

【权利要求】
1. 一种检测音频信号中的弦波峽的方法,所述弦波峽为其频域能量集中于少数几处的 音频峽,所述方法包括: 对于所述音频信号中的给定的音频峽,获得其对应的频域数据; 判断所述频域数据的峰值是否集中于少数频率处,并且判断所述频域数据的峰值是否 足够大;W及 将判断结果均为是的音频峽确定为弦波峽。
2. 如权利要求1所述的方法,其中 所述获得步骤包括: 将所述频域数据划分为多个频域数据处理单元; 所述判断峰值是否集中的步骤包括: 确定所述多个频域数据处理单元中的每一个是否包括峰值; 判定包括峰值的频域数据处理单元的数量是否等于作为小数量的预定数值; 如果上述判定结果为是,则判断为峰值集中。
3. 如权利要求2所述的方法,其中 所述确定频域数据处理单元是否包括峰值的步骤包括: 如果一个频域数据处理单元中的频域数据的最大值与整个音频峽的频域数据的平均 值之比大于第一阔值,则确定该频域数据处理单元包括峰值。
4. 如权利要求1所述的方法,其中 所述判断峰值是否足够大的步骤包括: 如果整个音频峽的频域数据的最大值与不包括峰值的各个频域数据处理单元中的频 域数据的最大值的平均值之比大于第二阔值,则判断为峰值足够大。
5. 如权利要求2所述的方法,其中所述预定数值为1或2。
6. 如权利要求1所述的方法,其中所述给定的音频峽要由MPEG-2AAC编码,所述频域数 据处理单元包括比例因子带。
7. 如权利要求6所述的方法,其中如果所述给定的音频峽为短窗数据,则直接确定该 音频峽不是弦波峽。
8. -种音频编码方法,包括: 利用如权利要求1-7之一所述的方法,检测待编码音频信号中的弦波峽;W及 基于检测结果,对所述音频信号进行编码。
9. 一种检测音频信号中的弦波峽的设备,所述弦波峽为其频域能量集中于少数几处的 音频峽,所述设备包括: 频域数据获得装置,其被配置为:对于所述音频信号中的给定的音频峽,获得其对应的 频域数据;W及 判断装置,其包括: 集中判断单元,其被配置为:判断所述频域数据的峰值是否集中于少数频率处; 大小判断单元,其被配置为:判断所述频域数据的峰值是否足够大;W及 结果确定单元,其被配置为:将所述集中判断单元和所述大小判断单元的判断结果均 为是的音频峽确定为弦波峽。
10. -种音频编码设备,包括: 如权利要求9所述的检测音频信号中的弦波峽的设备,用于检测待编码音频信号中的 弦波峽;W及 音频编码子单元,用于基于所述检测音频信号中的弦波峽的设备的检测结果,对所述 音频信号进行编码。
【文档编号】G10L25/78GK104347082SQ201310314218
【公开日】2015年2月11日 申请日期:2013年7月24日 优先权日:2013年7月24日
【发明者】徐张磊 申请人:富士通株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1