宽带信号传输系统的制作方法

文档序号:2835599阅读:227来源:国知局
专利名称:宽带信号传输系统的制作方法
技术领域
本发明涉及传输系统,它包括通过传输信道向接收机传送窄带音频信号的发射机,该接收机包括频域带宽扩展器,频域带宽扩展器通过用接收到的窄带音频信号的高频扩展对该信号进行补充,从而扩展接收到的窄带音频信号的带宽。带宽扩展器包括振幅扩展器,用于通过将窄带振幅映射到高频带振幅,从而扩展接收到的窄带音频信号的振幅频谱带宽;带宽扩展器还包括相位扩展器,用于扩展接收到的窄带信号的相位频谱带宽;以及组合器,用于将扩展振幅频谱和扩展相位频谱组合成带宽扩展音频信号。
本发明还涉及一种接收机,用于通过传输信道接收来自发射机的窄带音频信号;本发明还涉及一种通过传输信道接收窄带音频信号的方法。
根据前序部分的传输系统从Hynek Hermansky等人的论文“基于时间处理的语音增强”(proceedings of the 1995 IEEE InternationalConference on Acoustics,Speech,and Signal Processing,pp.405-408)中得知。
这种传输系统可用于,例如通过诸如无线信道、同轴电缆或者光纤的传输媒体传输音频信号,例如语音信号或者音乐信号。这种传输系统还可以用于在诸如磁带或者磁盘的记录媒体上记录这种音频信号。可能的应用有自动应答机、录音机、(移动)电话或者MP3播放机。
现有电话网中所用的窄带语音带宽为3100Hz(300-3400Hz)。如果带宽提高到约7kHz(50-7000Hz),则语音听起来会更自然。具有这种带宽的语音叫做宽带语音,它具有附加的低频带(50-300Hz)和高频带(3400-7000Hz)。从窄带语音信号有可能通过外插法产生高频带和低频带。所得的语音信号称之为伪宽带语音信号。例如,从论文″编码窄带语音的宽带增强新技术″(IEEE Speech CodingWorkshop 1999,June 20-23,1999,Porvoo,Finland)中,已经知道几种用于扩展窄带信号带宽的技术。这些技术用于改善诸如电话网的窄带网络中的语音质量,而不改变所述网络。在接收侧(例如移动电话或者电话应答机),可以将窄带语音扩展为伪宽带语音。
已知传输系统的接收机包括频域带宽扩展器,用于扩展接收到的窄带语音信号的带宽。这种带宽扩展器包括长度为128的FFT,用于将接收到的时域窄带语音信号变换成频域窄带语音信号。接着,分别扩展这种频域信号的振幅频谱和相位频谱的带宽,随后将得到的宽带振幅频谱和宽带相位频谱组合成频域宽带语音信号。通过将128点窄带振幅频谱映射到128点高频带振幅频谱来执行振幅频谱的带宽扩展。
已知传输系统中接收到的窄带信号的振幅频谱的带宽扩展相对复杂,因为它需要执行相当大量的计算,并因为它要求较大的存储器存储(中间)数据。
本发明的目的是提供开头段落中描述的传输系统,这种传输系统相对简单,所要求的计算较少,存储器较小。此目的于根据本发明的传输系统中实现,该传输系统的特征在于,所述振幅扩展器包括振幅映射器以及第一和第二频标变换器,第一频标变换器经配置,用于将振幅频谱的线性频标变换成对数频标,振幅映射器经配置,用于根据对数频标将窄带振幅映射到高频带振幅上,第二频标变换器经配置,用于将扩展振幅频谱的对数频标转换为线性频标。通过将振幅频谱的线性频标(它被划分成相对精细的大小相等的单位)转换成对数频标(它被划分成相对较粗的大小递增的单元),振幅频谱包括比原来的线性频标振幅频谱少得多的数据,结果窄带振幅到高频带振幅的映射要求的计算较少,且要求的存储器较小。最好选择所谓的Bark刻度的对数频标。或者,可以利用ERB对数频标。
图5显示宽带语音信号的Bark刻度频谱和线性频标频谱的例示。虚线表示线性频率频谱,实线表示根据Bark刻度的频率区。一个频率区中的各频率具有相同的振幅(即为所有振幅频标频谱的平均值)。当采用Bark刻度时,语音信号的窄带部分(即低于4000Hz)可以只用18个振幅表示,而语音信号的高频带部分(即高于4000Hz)可以用4个振幅表示。现在,不用将128点窄带振幅频谱映射到128点高频带振幅频谱上(如同已知传输系统中的做法),将18个窄带振幅映射到4个高频带振幅上就足够了,显然这样的计算效率高得多,而且要求的存储器较少。还发现,当把数量较大的窄带振幅映射到数量较小的高频带振幅上时,计算得到的高频带振幅非常精确。
根据本发明的传输系统的一个实施例的特征在于,所述振幅映射器还包括从多个映射矩阵中选择映射矩阵的矩阵选择器和用于将窄带振幅与选中的映射矩阵相乘以获得高频带振幅的矩阵乘法器。已经证明,使用映射矩阵是将窄带振幅映射到高频带振幅的有效途径。用于扩展振幅频谱的映射矩阵仅需要少量的数据ROM(只读存储器)。前面段落里描述的示例中的矩阵为18×4。常用的扩展方法是使用编码本,为了取得可比性能,它消耗较多的数据ROM。而且这种编码本方法的计算复杂度较高,因为必须搜索编码本各条目以得到最佳匹配。国际专利申请WO 01/35395(PCT/EP00/10761,PHF99607)中更详细地描述了用于宽带语音合成目的的映射矩阵应用。
根据本发明的另一传输系统实施例的特征在于,所述振幅映射器还包括用于将窄带振幅归一化的归一化装置和根据接收到的窄带信号的音量对高频带振幅定标的缩放装置。以这种方式,对不依赖于实际窄带语音信号音量的归一化窄带振幅执行实际的映射操作。在映射操作完成之后,通过对高频带振幅定标,从而再包含原来的音量信息。
根据本发明的传输系统的另一实施例的特征在于,振幅映射器还包括用于平滑高频带振幅的平滑装置。当前的高频带振幅最好使用之前帧的高频带振幅进行平滑处理,从而避免振幅的突变。
根据以下参照附图对最佳实施例的描述,本发明的以上目的和特性将变得显而易见,附图中

图1显示根据本发明的传输系统10的实施例的框图,图2显示根据本发明的传输系统10中所用的带宽扩展器18的在这些图中,相同的部分用相同的标号指示。
图1显示根据本发明的传输系统10的实施例的框图。传输系统10包括发射机12,用于通过传输信道16向接收机14传送窄带音频信号,例如窄带语音信号或者窄带音乐信号。传输系统10可以是电话通信系统,其中,发射机可以是(移动)电话,而接收机可以是(移动)电话或者应答机。接收机14包括频域带宽扩展器18,它利用接收到的窄带音频信号的高频带扩展对该信号进行补充,从而扩展接收到的窄带音频信号的带宽。
图2显示根据本发明的传输系统10所用的带宽扩展器18的实施例的框图。首先将接收到的窄带音频信号分段成10ms的帧(或采样频率为8000Hz的80个样本),这样每帧与其相邻帧有5ms的重叠。接着,每帧使用汉明窗20进行开窗处理。随后,对开窗处理过的信号应用长度为128的FFT 22(快速傅立叶变换),得到长度为128的复频谱S。将复频谱S变换为它的振幅频谱|S|和相位频谱,如下所示|S|=Sr2+Sl2-----(1)]]>以及 其中,Sr表示S的实数部分,而Sl表示S的虚数部分。修改振幅频谱|S|和相位频谱,以便实现带宽扩展。
带宽扩展器18包括振幅扩展器24,用于通过将窄带振幅映射到高频带振幅,从而扩展接收到的窄带音频信号的振幅频谱|S|的带宽。带宽扩展器18还包括用于扩展接收到的窄带信号的相位频谱带宽的相位扩展器26和将扩展的振幅频谱|Se|和扩展的相位频谱e组合成带宽扩展音频信号的组合器28。振幅频谱|Se|和相位频谱e通过下式转换成频谱Se 通过对Se应用长度为256的反FFT 30并取起始的160个样本获得时间信号Se。由于采样频率为16kHz,因此这对应10ms,这样。应用具有与前一帧和后一帧有5ms重叠的重叠相加(OLA)过程32。因为这些帧已经用汉明窗作了开窗处理,因此无需再作开窗处理。
相位频谱e可以通过对窄带频谱上采样而加以扩展。结果是4与8kHz之间的相位频谱为0到4kHz频带中的相位频谱的镜像型式。有可能这样简单地实现这种过程通过将128点相位频谱的镜像并取反的型式与原来的相位频谱合并,从而获得256点的用c表示的伪宽带频谱。此外,在无声语音情况下,随机序列可以在镜像之前加到高频带相位频谱中。对于这种目的,有声/无声检测器可能有用。
图3显示根据本发明的传输系统10所用的振幅扩展器24的实施例的框图。振幅扩展器24包括振幅映射器42以及第一和第二频标变换器40和44。第一频标变换器40经配置,用于将振幅频谱的线性频标变换成对数频标。振幅映射器42经配置,用于根据对数频标,将窄带振幅映射到高频带振幅上。第二频标变换器44经配置,用于将扩展的振幅频谱的对数频标变换成线性频标。
振幅频谱|S|的频率和振幅都是线性的。两种刻度上都采用非均匀变换。线性频标在第一频标变换器40中变换到属于所谓的Bark刻度的临界带宽,Bark刻度是具有临界带宽的对数刻度。频率f的相应临界带宽由下式给出w=25+75·(1+1.4·10-6·f2)0.69------(4)]]>针对每个临界频带中的一个频率对振幅频谱|S|采样。低于4kHz的频带中有18个采样点,而在高频带中有4个点。然后,采样频谱|Sw|的振幅通过下式变换到对数域An=20log10|Sw| (5)在振幅映射器42中用映射矩阵执行振幅扩展(即根据Bark频标将窄带振幅映射到高频带振幅上)。多映射矩阵的应用在国际专利申请WO 01/35395(PCT/EP00/10761,PHF99607)中描述,其中,对LPC参数应用多映射矩阵。在这种方法中,对18个窄带振幅An执行扩展将会得到4个高频带振幅Ah。
然后,在第二频标变换器44中,高频带振幅从对数Bark刻度转换到线性频标。这可用两种方式完成。一种方式是使全部临界频带的振幅恒定。也可能对振幅点作多项式拟合(即所谓的样条拟合)。这种更为复杂的方法导致更好的语音质量。同样将振幅变换到线性域。通过把该高频带振幅频谱和窄带振幅频谱合并,获得长度为256的伪宽带振幅频谱|Sc|。
图4显示根据本发明的传输系统10所用的振幅映射器42的实施例的框图。如前所述,对18个窄带振幅An执行映射或者扩展,将会得到4个高频带振幅Ah。这是根据如下步骤完成的首先,在归一化装置50中,通过从窄带振幅中减去平均值将窄带振幅归一化A=An-An‾---(6)]]>接着,在矩阵选择器52中,基于窄带振幅频谱|S|,从多个映射矩阵中选出一个映射矩阵。例如,多个映射矩阵可能包括10个矩阵5个用于有声语音,5个用于无声语音。有声/无声检测器可用于将频带0到1kHz中的能量与频带0到4kHz中的能量相比较。如果能量差高于某个门限,则该帧可分为有声类,否则分为无声类。为了从5个(有声或者无声)矩阵中选出一个,可以使用频带0到1kHz中的能量与频带1到2kHz之间的能量差。矩阵和用于选择矩阵的门限可以通过训练获得。
之后,在矩阵乘法器54中,将归一化窄带振幅A与选中的映射矩阵相乘,以获得高频带振幅A′A′=M·A, (7)其中,M是18×4的映射矩阵M=m[1,1]m[1,2]···m[1,18]m[2,1]m[2,2]···m[2,18]m[3,1]m[3,2]···m[3,18]m[4,1]m[4,2]···m[4,18]----(8)]]>接下来,将计算得到的高频带振幅通过缩放装置56缩放到适当水平(即根据接收到的窄带信号量)。这种定标是通过加入窄带振幅的平均值而完成的Ah=A′+An‾----(9)]]>最后,扩展了的频带振幅通过在当前振幅Ah中内插之前帧的振幅而加以平滑。
用于将窄带振幅映射到高频带振幅的矩阵数量可以改变。实验表明,在依然获得可接受语音质量的同时,有可能将矩阵数减少为4(而不是上述的10)。可以通过数字硬件或者由数字信号处理器执行的软件或者通过通用微处理器实现带宽扩展器18。
本发明的范围不限于这些明确公开的实施例。本发明实施在每个新特征和特征的每个组合中。任何标号并不限制所述权利要求的范围。单词“包括”不排除存在权利要求中所列举的以外的其它单元或步骤。在单元之前使用单词“一个”并不排除存在多个这样的单元。
权利要求
1.一种传输系统(10),包括发射机(12),它通过传输信道(16)向接收机(14)传送窄带音频信号;接收机(14),它包括频域带宽扩展器(18),用于利用接收到的窄带音频信号的高频带扩展对该信号作补充从而扩展所述接收到的窄带音频信号的带宽,所述带宽扩展器(18)包括振幅扩展器(24),用于将窄带振幅映射到高频带振幅从而扩展所述接收到的窄带音频信号的振幅频谱带宽,所述带宽扩展器(18)还包括相位扩展器(26),用于扩展所述接收到的窄带信号的相位频谱的带宽;以及组合器(28),用于将所述扩展振幅频谱和所述扩展相位频谱组合成带宽扩展音频信号,其特征在于所述振幅扩展器(24)包括振幅映射器(42)以及第一和第二频标变换器(40,44),所述第一频标变换器(40)经配置,用于将所述振幅频谱的线性频标变换成对数频标,所述振幅映射器(42)经配置,用于根据所述对数频标将所述窄带振幅映射到所述高频带振幅,所述第二频标变换器(44)经配置,用于将所述扩展振幅频谱的对数频标变换成所述线性频标。
2.如权利要求1所述的传输系统(10),其特征在于所述对数频标是Bark刻度。
3.如权利要求1或2所述的传输系统(10),其特征在于所述振幅映射器(42)还包括矩阵选择器(52),用于从多个映射矩阵中选择映射矩阵,以及矩阵乘法器(54),用于通过将所述窄带振幅与所述选中的映射矩阵相乘,从而获得所述高频带振幅。
4.如权利要求1至3中任何一项所述的传输系统(10),其特征在于所述振幅映射器(42)还包括归一化装置(50),用于将所述窄带振幅归一化,以及缩放装置(56),用于根据所述接收到的窄带信号的音量对所述高频带振幅进行缩放。
5.如权利要求1至4中任何一项所述的传输系统(10),其特征在于所述振幅扬声器(42)还包括平滑装置(58),用于平滑所述高频带振幅。
6.一种接收机(14),用于通过传输信道(16)从发射机(12)接收窄带音频信号,所述接收机(14)包括频域带宽扩展器(18),用于利用接收到的窄带音频信号的高频带扩展对该信号作补充从而扩展所述接收到的窄带音频信号的带宽,所述带宽扩展器(18)包括振幅扩展器(24),用于将窄带振幅映射到高频带振幅从而扩展所述接收到的窄带音频信号的振幅频谱带宽,所述带宽扩展器(18)还包括相位扩展器(26),用于扩展所述接收到的窄带信号的相位频谱的带宽;以及组合器(28),用于将所述扩展振幅频谱和所述扩展相位频谱组合成带宽扩展音频信号,其特征在于所述振幅扩展器(24)包括振幅映射器(42)以及第一和第二频标变换器(40,44),所述第一频标变换器(40)经配置,用于将所述振幅频谱的线性频标变换成对数频标,所述振幅映射器(42)经配置,用于根据所述对数频标将所述窄带振幅映射到所述高频带振幅,所述第二频标变换器(44)经配置,用于将所述扩展振幅频谱的对数频标变换成所述线性频标。
7.如权利要求6所述的接收机(14),其特征在于所述对数频标是Bark刻度。
8.如权利要求6或7所述的接收机(14),其特征在于所述振幅映射器(42)还包括矩阵选择器(52),用于从多个映射矩阵中选择映射矩阵,以及矩阵乘法器(54),用于通过将所述窄带振幅与所述选中的映射矩阵相乘,从而获得所述高频带振幅。
9.一种通过传输信道(16)接收窄带音频信号的方法,所述方法包括-将窄带振幅映射到高频带振幅,从而扩展所述接收到的窄带音频信号的振幅频谱的带宽,-扩展所述接收到的窄带信号的相位频谱的带宽,-将所述扩展的振幅频谱和扩展的相位频谱组合成带宽扩展音频信号,其特征在于所述方法还包括-将所述振幅频谱的线性频标变换成对数频标,-根据所述对数频标将所述窄带振幅映射到所述高频带振幅,-将所述扩展振幅频谱的对数频标变换成所述线性频标。
10.如权利要求9所述的通过所述传输信道(16)接收所述窄带音频信号的方法,其特征在于所述对数频标是Bark刻度。
11.如权利要求9或10所述的通过所述传输信道(16)接收所述窄带音频信号的方法,其特征在于所述方法还包括-从多个映射矩阵中选择映射矩阵,-将所述窄带振幅与所述选中的映射矩阵相乘,从而获得所述高频带振幅。
全文摘要
描述了一种传输系统(10),它包括通过传输信道(16)向接收机(14)发送窄带音频信号的发射机(12)。接收机(14)包括频域带宽扩展器(18),它利用接收到的窄带音频信号的高频带扩展对该信号作补充,从而扩展接收到的窄带音频信号的带宽。带宽扩展器(18)包括振幅扩展器(24),用于将窄带振幅映射到高频带振幅从而扩展接收到的窄带音频信号的振幅频谱带宽,带宽扩展器(18)还包括相位扩展器(26),用于扩展接收到的窄带信号的相位频谱带宽;和组合器(28),用于将扩展振幅频谱和扩展相位频谱组合成带宽扩展音频信号,传输系统的特征在于振幅扩展器(24)包括振幅映射器(42)以及第一和第二频标变换器(40,44),第一频标变换器(40)配置用于将所述振幅频谱的线性频标变换成对数频标,例如Bark刻度。振幅映射器(42)配置用于根据对数频标将窄带振幅映射到高频带振幅。第二频标变换器(44)配置用于将扩展振幅频谱的对数频标变换成线性频标。
文档编号G10L21/02GK1520590SQ02812738
公开日2004年8月11日 申请日期2002年6月20日 优先权日2001年6月28日
发明者R·J·斯瑞特, R J 斯瑞特, A·J·格尔里茨, 格尔里茨, S·陈诺克, 悼 申请人:皇家菲利浦电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1