用于对音频信号进行编码的方法和装置的制造方法

文档序号:8460801阅读:464来源:国知局
用于对音频信号进行编码的方法和装置的制造方法
【技术领域】
[0001]本公开内容一般性地涉及音频处理,并且更具体地,涉及切换音频编码器模式。
【背景技术】
[0002]可听见的频率范围(对人耳可听见的周期性振动的频率)是从大约50Hz到大约22kHz,但是听力随着年龄而退化并且多数成年人发现难以听见大约14-15kHz以上的频率。人类语音信号的多数能量一般被限于从250Hz到3.4kHz的范围。因此,传统语音传输系统限于常称为“窄带”的该频率范围。然而,为了允许更好的声音质量、为了使听者更容易识别语音以及为了使得听者能够区分需要迫使空气经过窄信道的被称为“摩擦音”(‘s’和‘f’为示例)的那些语音元素,更新的系统已经将该范围延伸到50Hz到7kHz。该更大的频率范围通常被称为“宽带”(WB)或者有时被称为HD (高清晰度)语音。
[0003]高于WB范围的频率——从大约7kHz到大约15kHz——在此被称为带宽延伸(BWE)区域。从大约50Hz到大约15kHz的声音频率的全范围被称为“超宽带(SWB) ”。在BWE区域中,人耳对声音信号的相位并不特别地敏感。然而,它对声音谐波的规律性以及对能量的存在和分布是敏感的。因此,处理BWE声音有助于语音听上去更自然并且也提供了 “存在”的感知。
【附图说明】
[0004]图1描绘其中可以实现本发明的各种实施例的通信系统的示例。
[0005]图2示出描绘了根据本发明的实施例的通信设备的框图。
[0006]图3示出描绘了在本发明的实施例中的编码器的框图。
[0007]图4和5描绘根据本发明的各种实施例的间隙填充的示例。
【具体实施方式】
[0008]本发明的一个实施例涉及一种混合编码器。当由编码器接收到的音频输入从类音乐的声音(例如,音乐)改变成类语音的声音(例如,人类语音)时,编码器从第一模式(例如,音乐模式)切换成第二模式(例如,语音模式)。在本发明的一个实施例中,当编码器以第一模式操作时,它运用第一编码器(例如,频域编码器,诸如基于谐波的正弦型编码器)。当编码器切换到第二模式时,它运用第二编码器(例如,时域或者波形编码器,诸如CELP编码器)。从第一编码器向第二编码器的该切换可能引起在编码过程中的延迟,从而产生编码的信号中的间隙。为了补偿,编码器使用音频信号的在间隙之后出现的部分回填间隙。
[0009]在本发明的一个有关实施例中,第二编码器包括BWE编码部分和核心编码部分。核心编码部分可以根据编码器操作的比特速率以不同采样速率来操作。例如,使用较低采样速率(例如,当编码器以较低比特速率操作时)可以是有利的,以及使用较高采样速率(例如,在编码器以较高比特速率操作时)可以是有利的。核心部分的采样速率确定BWE编码部分的最低频率。然而,当从第一编码器到第二编码器的切换出现时,可能存在关于核心编码部分应当操作在的采样速率的不确定性。直到核心采样速率已知,BWE编码部分的处理链可能不能够被配置,从而引起在BWE编码部分的处理链中的延迟。作为该延迟的结果,在处理期间在信号的BWE区域(被称为“BWE目标信号”)中产生了间隙。为了补偿,编码器使用音频信号的在间隙之后出现的部分来回填BWE目标信号间隙。
[0010]在本发明的另一实施例中,音频信号从由第一编码器(诸如,频域编码器)编码的第一类型的信号(诸如,音乐或者类音乐的信号)切换成由第二编码器(诸如,时域或者波形编码器)处理的第二类型的信号(诸如,语音或者类语音的信号)。切换在第一时间处出现。在处理的音频信号中的间隙具有在第一时间处或者之后开始并且在第二时间处结束的时间跨度。处理的音频信号的在第二时间处或者之后出现的部分被复制并且可能在对复制的部分执行功能(诸如,时间反转、正弦加窗和/或余弦加窗)之后被插入到间隙中。
[0011]先前描述的实施例可以由一种通信设备执行,在该通信设备中输入接口(例如,麦克风)接收音频信号,语音-音乐检测器确定了从类音乐的音频到类语音的音频的切换已经出现,并且缺失信号发生器回填BWE目标信号中的间隙。各种操作可以由处理器(例如,数字信号处理器或者DSP)与存储器(例如,包括,先行缓冲器)组合来执行。
[0012]在以下描述中,将要注意,附图中所示的部件以及标注的路径旨在于指示在各种实施例中信号一般如何流动以及被处理。线连接不一定对应于离散的物理路径,而块不一定对应于离散的物理部件。部件可以被实现为硬件或者为软件。此外,术语“被耦合”的使用不一定意味着在部件之间的物理连接,而可以描述部件之间的其中存在中间部件的关系。它仅描述部件的用以物理地或者经由软件结构(例如,数据结构、对象等)相互通信的能力。
[0013]转向附图,现在将描述本发明的一个实施例在其中操作的网络的示例。图1图示包括网络102的通信系统100。网络102可以包括许多部件,诸如无线接入点、蜂窝基站、有线网络(光纤、同轴线缆等)。任何数目的通信设备和通信设备的许多种类可以经由网络102交换数据(语音、视频、网页等)。第一通信设备104和第二通信设备106在图1中被描绘为经由网络102通信。尽管第一通信设备104和第二通信设备106被示为智能电话,但是它们可以是任何类型的通信设备,包括膝上型计算机、具有无线局域网能力的设备、具有无线广域网能力的设备或者用户设备(UE)。除非另有指明,第一通信设备104被视为发射设备而第二通信设备106被视为接收设备。
[0014]图2图示根据本发明的实施例的通信设备104(来自图1)的框图。通信设备104可以能够访问在网络102中存储的信息或者数据并且经由网络102与第二通信设备106通信。在一些实施例中,通信设备104支持一个或者多个通信应用。也可以在第二通信设备106上执行在此描述的各种实施例。
[0015]通信设备104可以包括收发器240,该收发器240能够通过网络102发送和接收数据。通信设备可以包括控制器/处理器210,该控制器/处理器210执行存储的程序,诸如编码器222。本发明的各种实施例由编码器222执行。通信设备也可以包括由控制器/处理器210使用的存储器220。存储器220存储编码器222并且可以进一步包括先行缓冲器221,该先行缓冲器221的目的将在被更详细地描述。通信设备可以包括用户输入/输出接口 250,该用户输入/输出接口 250可以包括诸如键盘、显示器、触摸屏、麦克风、耳机和扬声器之类的单元。通信设备也可以包括附加单元可以附着到的网络接口 260,例如,通用串行总线(USB)接口。最后,通信设备可以包括数据库接口 230,该数据库接口 230允许通信设备访问与通信设备的配置有关的各种存储的数据结构。
[0016]根据本发明的一个实施例,输入/输出接口 250 (例如,其麦克风)检测音频信号。编码器222对音频信号进行编码。在这样做时,编码器运用称为“先行(look-ahead) ”的技术以对语音信号进行编码。使用先行,编码器222检查在其正在编码的当前语音帧的将来的少量语音,以便于确定在该帧之后什么将到来。编码器将将来语音信号的一部分存储在先行缓冲器221中。
[0017]参照图3的框图,现在将描述编码器222 (来自图2)的操作。编码器222包括语音/音乐检测器300和耦合到语音/音乐检测器300的开关320。在如图2中描绘的那些部件的右侧,存在第一编码器300a和第二编码器300b。在本发明的一个实施例中,第一编码器300a是频域编码器(其可以被实现为基于谐波的正弦编码器),并且第二部件集合构成时域或者波形编码器,诸如CELP编码器300b。第一和第二编码器300a和300b被耦合到开关320。
[0018]第二编码器300b的特征可以在于具有高频带部分和低频带部分,该高频带部分通过路径O和P输出BWE激励信号(从大约7kHz到大约16kHz),该低频带部分通过路径N输出WB激励信号(从大约50Hz到大约7kHz)。将会理解,该分组仅为了方便引用。如将讨论的那样,高频带部分和低频带部分相互交互。
[0019]高频带部分包括带通滤波器301、耦合到带通滤波器301的频谱翻转和降频混合器307
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1