Methodandapparatusforestimatinghigh-bandenergyinabandwidth...的制作方法

文档序号:2823062阅读:283来源:国知局
专利名称:Method and apparatus for estimating high-band energy in a bandwidth ...的制作方法
技术领域
本发明一般地涉及呈现可听内容,并且尤其涉及带宽扩展技术。
背景技术
从数字表示可听地呈现音频内容包括公知范围的努力。在一些应用设置中,数字 表示包括与原始音频采样相关的完整的对应带宽。在这样的情况下,可听呈现可以包括高 度准确和自然的发声输出。然而,这样的方式要求相当大的开销资源来提供对应的数据量。 在诸如无线通信设置的许多应用设置中,不能总是充分支持这样的信息量。为了适应这样的局限,所谓的窄带语音技术可以用于通过进一步将表示限制为 小于与原始音频采样相关的完整的对应带宽来限制信息量。仅作为关于这一点的示例, 虽然自然语音包括高达8kHz (或更高)的有效分量,但是窄带表示可以仅提供关于例如 300-3400HZ范围的信息。当得到的内容被呈现得可听时,得到的内容通常清晰得足以支持 基于语音的通信的功能需要。然而,遗憾的是,窄带语音处理也往往得到听起来压抑的语 音,并且与全频带语音相比甚至可能已经降低了清晰度。为了满足该需要,有时候采用带宽扩展技术。基于可用的窄带信息以及其他信息 人工生成较高和/或较低的频带中的丢失的信息来选择能够被添加到窄带内容中的信息, 从而合成伪宽带(或全带)信号。使用这样的技术,例如,能够将在300-3400HZ范围中的窄带语音转换为例如 100-8000HZ范围中的宽带语音。为此,所需要的一条关键信息是在高频带(3400-8000HZ) 中的频谱包络。如果估计了宽带频谱包络,那么通常可以容易地从宽带频谱包络中提取高 频带频谱包络。可以考虑由形状和增益(或者等同地,能量)构成的高频带频谱包络。例如,通过一种方式,借助于通过码书映射从窄带频谱包络估计宽带频谱包络来 估计高频带频谱包络形状。然后,通过调整在宽带频谱包络的窄带部分内的能量以匹配窄 带频谱包络的能量来估计高频带能量。在该方式中,高频带频谱包络形状确定高频带能量, 并且在估计形状中的任何错误也将相应地影响高频带能量的估计。在另一种方式中,分别估计高频带频谱包络形状和高频带能量,并且调整最后使 用的高频带频谱包络,以匹配估计的高频带能量。通过一种相关的方式,使用除了其他参数 之外的估计的高频带能量来确定高频带频谱包络形状。然而,未必保证得到的高频带频谱 包络具有适当的高频带能量。因此,需要附加的步骤来将高频带频谱包络的能量调整到估 计值。除非特别注意,该方式将在窄带和高频带之间的边界处产生在宽带频谱包络中的不 连续。虽然对于带宽扩展,并且特别是对于高频带包络估计的现有方式相当成功,但是在至 少一些应用设置中,这些方式未必产生适当质量的得到的语音。
为了生成可接受质量的带宽扩展的语音,应当最小化在这样的语音中的人工信号 (artifact)的数目。已知高频带能量的过度估计导致麻烦的人工信号。高频带频谱包络形 状的不正确的估计也可能引起人工信号,但是这些人工信号通常不太严重,并且容易被窄 带语音所掩盖。


通过提供下面详细说明中所述的在带宽扩展系统中用于估计高频带能量的方法 和设备来至少部分地满足上述需要。附图中相同的附图标记在各个视图中表示相同或功能 上类似的元素,并且附图与下面的详细说明一起并入本说明书中并且形成本说明书的一部 分,用于进一步图示各种实施例并且用于说明所有根据本发明的各种原理和优点。图1包括根据本发明的各种实施例配置的流程图;图2包括根据本发明的各种实施例配置的曲线图;图3包括根据本发明的各种实施例配置的框图;图4包括根据本发明的各种实施例配置的框图;图5包括根据本发明的各种实施例配置的框图;以及图6包括根据本发明的各种实施例配置的曲线图。本领域技术人员将认识到,在附图中的元素为了简单和清楚的目的而进行图示, 并且不必按照比例绘制。例如,在附图中的一些元素的尺寸和/或相对定位可以相对于其 他元素被夸大,以有助于促进对本发明的各种实施例的理解。而且,为了促进对于本发明的 这些各种实施例的不太混乱的查看,常常不描绘在商业上可行的实施例中实用或必要的常 见而公知的元素。应当进一步认识到,可以以特定的发生顺序来描述或描绘特定的动作和 /或步骤,而在本领域中的技术人员将理解,实际上不需要这样的关于顺序的指定。还应当 理解,这里所使用的术语和表达具有由如以上阐述的本领域的技术人员给予这样的术语和 表达的典型的技术含义,除非这里另外阐述了不同的特定的含义。
具体实施例方式这里讨论的教导针对一种用于人工带宽扩展的有成本效益的方法和系统。根据这 样的教导,接收窄带数字音频信号。例如,窄带数字音频信号可以是在蜂窝网络中经由移动 站接收到的信号,并且窄带数字音频信号可以包括300-3400HZ的频率范围中的语音。人工 带宽扩展技术被实现为将数字音频信号的频谱扩展为包括诸如100-300HZ的低频带频率 以及诸如3400-8000HZ的高频带频率。通过利用人工带宽扩展来将频谱扩展为包括低频带 频率和高频带频率,产生更自然发音的数字音频信号,该信号对实现该技术的移动站的用 户而言更令人愉快。在人工带宽扩展技术中,基于从语音数据库得到并存储的先验信息以及可用的窄 带信息,人工地生成较高频带(3400-8000HZ)和较低频带(100-300Hz)中的丢失的信息,并 将其添加到窄带信号,以合成伪宽带信号。因为要求对现有传输系统的最小的改变,所以这 样的解决方案很吸引人。例如,不需要额外的比特率。人工带宽扩展可以被并入在接收端 处的后处理元件中,并且因此独立于通信系统中使用的语音编码技术或者通信系统本身的 性质,例如模拟、数字、地上线或蜂窝。例如,可以通过接收窄带数字音频信号的移动站来实现人工带宽扩展技术,并且利用得到的宽带信号来生成向移动站的用户播放的音频。在确定高频带信息时,首先估计高频带中的能量。利用窄带信号的子集来估计高 频带能量。最接近高频带频率的窄带信号的子集通常具有与高频带信号最高的相关性。因 此,仅利用窄带的子集而不是整个窄带来估计高频带能量。所使用的子集称为“过渡带”,并 且可以包括诸如2500-3400HZ的频率。更特定地,这里将过渡带定义为包含在窄带中并且 接近高频带的频带,即,它用作到高频带的过渡。该方式与现有技术的带宽扩展系统不同, 现有技术的带宽扩展系统根据整个窄带中的能量来估计高频带能量,通常为比率。为了估计高频带能量,首先经由下面关于图4和图5讨论的技术来估计过渡带能 量。例如,可以首先通过对输入窄带信号进行上采样、计算上采样的窄带信号的频谱并且然 后将过渡带内的频谱分量的能量相加来计算出过渡带的过渡带能量。随后,将估计的过渡 带能量作为独立变量插入多项式等式中来估计高频带能量。选择多项式等式中的独立变量 的不同幂的系数或权重(包括零幂,即,常数项,的系数或权重)来在来自训练语音数据库 的大量帧上最小化高频带能量的实际值与估计值之间的均方差。如下面更详细讨论的,通 过调节对从窄带信号得到的参数以及从过渡带信号得到的参数的估计,可以进一步提高估 计准确度。在已经估计了高频带能量之后,基于高频带能量估计来估计高频带频谱。通过以该方式来利用过渡带,提供了一种坚固的带宽扩展技术,与在使用整个窄 带中的能量来估计高频带能量时可能的音频信号相比,该技术产生更高质量的相应的音频 信号。此外,因为带宽扩展技术适用于经由通信系统接收到的窄带信号,所以可以在不对现 有通信系统有过度不利影响的情况下利用该技术,即,可以利用现有通信系统来发送窄带 信号。图1图示了根据本发明的各种实施例的用于生成带宽扩展数字音频信号的过程 100。首先,在操作101处,接收窄带数字音频信号。在典型的应用设置中,该操作包括提供 这样的内容的多个帧。这些教导易于根据上述步骤来处理每个这样的帧。例如,通过一种 方式,每个这样的帧可以与原始音频内容的10-40毫秒相对应。这可以包括,例如,提供包括合成的有声内容的数字音频信号。例如,这是当结合 在便携式无线通信装置中接收到的声编码的语音内容来采用这些教导时的情况。然而,本 领域的技术人员可以理解,还存在其他可能性。例如,数字音频信号可能替代地包括原始语 音信号或者原始语音信号或合成的语音内容的重新采样的版本。现在参考图2,应当理解,该数字音频信号涉及某个原始音频信号201,其具有原 始的对应的信号带宽202。该原始的对应的信号带宽202通常大于前述的与数字音频信号 相对应的信号带宽。例如,当数字音频信号仅表示原始音频信号201的一部分203而原始 音频信号201的其他部分留在频带外时,这可能发生。在图示的说明性示例中,这包括低频 带部分204和高频带部分205。本领域技术人员将认识到,该示例仅用于说明性目的,并且 未表示的部分可以仅包括低频带部分或高频带部分。这些教导也适用于在其中未表示的部 分落在两个或多个表示的部分(未示出)的中频带的应用设置中进行使用。因此,容易理解,原始音频信号201的未表示的部分(多个)包括这些现有教导可 能合理地设法以一些合理并且可接受的方式来替换或以其他方式表示的内容。还应当理 解,该信号带宽仅占用由相关采样频率确定的尼奎斯特带宽的一部分。这进而被理解成进 一步提供了其中要实现期望的带宽扩展的频率区域。
返回参考图1,在操作102处对输入数字音频信号进行处理,以生成处理的数字音 频信号。通过一种方式,在操作102处的处理是上采样操作。通过另一种方式,它可以是简 单的单位增益系统,对该系统而言输出等于输入。在操作103处,基于窄带带宽的预定的上 限频率范围内的处理的数字音频信号的过渡带来估计与输入数字音频信号相对应的高频 带能量水平。通过使用过渡带分量作为估计的基础,获得比在共同使用所有窄带分量来估计高 频带分量的能量值时通常所得到的估计更准确的估计。通过一种方式,使用高频带能量值 来访问查找表,以确定高频带频谱包络,即正确的能量水平处的适当的高频带频谱包络形 状,所述查找表包含多个对应的候选高频带频谱包络形状。然后,该过程100可选地将数字音频信号和与估计的能量值和高频带分量的频谱 相对应的高频带内容进行合并104,以提供要呈现的窄带数字音频信号的带宽扩展版本。虽 然图1所示的过程仅图示了添加了估计的高频带分量,但是应当认识到,还可以估计低频 带分量并且将其与窄带数字音频信号进行合并,以生成带宽扩展的宽带信号。当以可听形式进行呈现时,与原始的窄带数字音频信号相比,得到的带宽扩展音 频信号(通过将输入数字音频信号与人工生成的信号带宽外内容进行合并所获得)具有改 善的音频质量。通过一种方式,这可以包括将关于其频谱内容相互不包括的两个项进行合 并。在这样的情况下,这样的合并可以采用例如将两个(或多个)分段简单地连结或以其 他方式联合在一起的形式。通过另一种方式,如果期望,高频带带宽内容和/或低频带带宽 内容可以具有在数字音频信号的对应信号带宽内的部分。通过将高频带带宽内容和/或低 频带带宽内容的重叠部分与数字音频信号的对应的带内部分进行合并,这样的重叠在至少 一些应用设置中可以用于将从一个部分到另一个部分的过渡进行平滑化和/和羽化。本领域技术人员将认识到,使用多种可用和/或容易配置的平台中的任何一个来 容易地实现上述过程,该平台包括本领域所公知的部分或整体可编程的平台或者可能期望 用于一些应用的专用平台。现在参考图3,现在将提供对于这样的平台的说明性方式。在该说明性示例中,在设备300中,选择的处理器301可操作地耦合到输入端302, 该输入端302被配置和布置成接收具有对应的信号带宽的数字音频信号。当设备300包 括无线双向通信装置时,可以由本领域公知的对应的接收器303来提供这样的数字音频信 号。在这样的情况下,例如,数字音频信号可以包括根据接收到的声编码的语音内容而形成 的合成有声内容。处理器301进而可以(当处理器301包括本领域所公知的部分或整体可编程的平 台时经由例如对应的程序)被配置和布置成执行这里阐述的步骤或者其他功能的一个或 多个。这可以包括,例如,从过渡带能量估计高频带能量值,并且然后使用高频带能量值和 能量索引的形状的集合来确定高频带频谱包络。如上所述,通过一种方式,前述高频带能量值可以用于便利访问包含多个对应的 候选频谱包络形状的查找表。为了支持这样的方法,如果期望,该设备还可以包括一个或多 个查找表304,该一个或多个查找表304可操作地耦合到处理器301。在如此配置的情况下, 处理器301可以在适当时容易地访问查找表304。本领域技术人员将认识和理解,这样的设备300可以由如图3中所示的图示建议 的多个物理上不同的元件构成。然而,还能够将该图示看作包括逻辑视图,在该情况下,可以经由共享平台来允许和实现这些元件中的一个或多个。还应当理解,这样的共享平台可 以包括如在本领域中公知的整体或至少部分可编程的平台。应当认识到,上述处理可以由与基站进行无线通信的移动站来执行。例如,基站可 以经由传统方式将窄带数字音频信号发射到移动站。一旦接收到该窄带数字音频信号,移 动站内的处理器(多个)就执行必要的操作来生成数字音频信号的带宽扩展版本,其对移 动站的用户而言更清楚并且在听觉上更令人愉快。现在参考图4,首先使用对应的上采样器401对以SkHz采样的输入窄带语音Snb 进行上采样两次,以获得以16kHz采样的上采样的窄带语音0nb。这可以包括执行1 2内 插(例如,通过在每对原始语音采样之间插入零值的采样),此后,使用例如具有在OHz到 3400Hz之间的通带的低通滤波器(LPF)来进行低通滤波。还使用线性预测(LP)分析器402来从Snb计算窄带线性预测(LP)参数Anb = {1, ai; a2,…,aP},其中,P是模型阶数,该LP分析器402采用公知的LP分析技术。(当然,存 在其他的可能性;例如,可以从、b的2 1抽样(decimated)版本来计算LP参数。)这些 LP参数将窄带输入语音的频谱包络建模为
权利要求
一种方法,包括接收包括窄带信号的输入数字音频信号;对所述输入数字音频信号进行处理以生成处理的数字音频信号;以及基于窄带带宽的预定上限频率范围内的所述处理的数字音频信号的过渡带,来估计与所述输入数字音频信号相对应的高频带能量水平。
2.根据权利要求1所述的方法,进一步包括至少部分地基于所述高频带能量水平以 及与所述高频带能量水平相对应的估计的高频带频谱包络来生成高频带数字音频信号。
3.根据权利要求2所述的方法,进一步包括将所述输入数字音频信号与所述高频带 数字音频信号进行合并,以生成具有扩展信号带宽的得到的数字音频信号。
4.根据权利要求1所述的方法,其中,所述处理包括对所述输入数字音频信号进行上 采样以生成所述处理的数字音频信号。
5.根据权利要求1所述的方法,其中,所述估计包括通过计算所述处理的数字音频信 号的频谱并且将所述过渡带内的频谱分量的能量相加来计算所述处理的数字音频信号的 能量水平。
6.根据权利要求1所述的方法,其中,所述估计进一步包括基于所述输入数字音频信 号利用至少一个预定的语音参数来生成参数空间。
7.根据权利要求6所述的方法,其中,所述预定的语音参数是零交叉参数、频谱平坦度 度量参数、过渡带频谱斜率参数以及过渡带频谱包络形状参数中的至少一个。
8.根据权利要求6所述的方法,其中,所述估计进一步包括将所述参数空间划分成区 域,并且为每个区域指配系数,以估计所述高频带能量水平。
9.根据权利要求1所述的方法,其中,所述窄带信号具有大约300-3400HZ的带宽。
10.一种设备,包括输入端,所述输入端被配置和布置成接收包括窄带信号的输入数字音频信号;处理器,所述处理器可操作地耦合到所述输入端,并且被配置和布置成对所述输入数字音频信号进行处理以生成处理的数字音频信号;以及基于窄带带宽的预定上限频率范围内的所述处理的数字音频信号的过渡带,来估计与 所述输入数字音频信号相对应的高频带能量水平。
全文摘要
文档编号G10L11/00GK101952889SQ20098010369
公开日2011年1月19日 申请日期2009年1月28日 优先权日2008年2月1日
发明者Mark A Jasiuk, Tenkasi V Ramabadran 申请人:Motorola Inc
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1