用于在分组交换网上传输信令音的方法和装置的制作方法

文档序号:7857235阅读:196来源:国知局
专利名称:用于在分组交换网上传输信令音的方法和装置的制作方法
技术领域
本发明一般涉及音调信令领域。本发明尤其涉及在分组交换数据网上传输音调信号的领域。
背景技术
音调信令技术,如“双音多频”(“DTMF”)信令,是众所周知的,并且至少最近二十年来一直在电话网上使用。分组交换电话技术的出现和扩展应用已对音调信号的使用造成了某些障碍。在某些情况下,用来编码人声的编码器可能会改变音调的频率组成到了音调不能被信令所发往装置识别的程度。在另一情况下,编码器可能会改变音调,使得信令所发往装置将该音调误认作另一音调,或者将该音调误人作两种或多种音调。
为了克服此问题,引入DTMF中继。DTMF中继由DTMF音调检测器和DTMF音调发生器组成。检测器监视输入的音频信号,并且在检测到信令音时,产生一个控制信号,指示接收站里的发生器产生信令音。不幸的是,信令音的检测耗时,并且中继路径关于话音路径有时被延迟,使得在接收站会检测到两次信令音。这被称为双位检测。建议在检测到信令音之后对话音路径静噪,但是,由于检测过程的时间密集特性,对话音路径的静噪被延迟,并且某些残留的DTMF信令由话音路径携带到接收站,造成双位检测。

发明内容
作为本发明的一部分,可以存在一种频率估计器(frequencyestimator),它可以分析音频信号,找到信令音的频率分量,还可以在很短的时间段内向音调失真器提供有关可疑信令音的频率分量的信息。信令音可以是单音,或者是双音或多音的组合。音调失真器可以修改音频信号内的可疑信令音的频率组成。音调失真器对可疑信令音的频率组成的修正可以再现音调检测器不可识别的音调,音调检测器在功能上与该信令音所预定发送信号的装置相关。
根据本发明的一些方面,音调失真器对可疑信令音的频率组成的修正对语音信号会有最小的失真影响。
作为本发明的一部分,存在一种音调检测器(tone detector),它可以确定在音频信号中确实存在由频率估计器检测出的可疑信令音,因而它是真的信令音。响应于检测到真的信令音,音调检测器可以指示音调发生器产生被检测到的信令音。


本发明的主题在说明书的结束部分专门指出并作明确要求。然而,关于组织和运算方法,连同对象、特征,以及其中的优点,在浏览附图时参照下面的详述,会易于理解本发明,在附图中图1示出根据本发明的信令音传输系统的框图。
图2示出根据本发明的频率估计器的框图。
图3A示出根据本发明的一种音调失真器的一个实施例的框图。
图3B示出根据本发明的一种音调失真器的第二实施例的框图。
图4A示出可疑音调的频率分量降低的频率图。
图4B示出可疑音调的频率分量频移的频率图。
图4C示出可疑音调的频率分量伪装在相邻分量之间的频率图。
要理解为了图解的简化和明确起见,没必要按比例画图中所示的各部分。比如,为清楚起见,其中一些部分的尺度,相对于另一些部分可以放大。此外,在认为合适的地方,附图标记可以在这些图中重复使用,以指明相应的或类似部分。
具体实施例方式
众多特定细节将在以下详述中进行阐明,以便提供对发明的全面理解。然而,本领域的技术人员要理解的是,没有这些特定细节,还可以实施本发明。在其他实例中,对众所周知的方法、步骤、部分和电路没有进行详述,以免使本发明不明确。
除非另有特别声明,如以下讨论中表明的,要理解的是整个说明书中,利用诸如“处理”、“估计”、“计算”、“确定”等术语的讨论,指的是计算机或计算系统、或类似的电子计算装置的活动和/或处理,把在计算系统的寄存器和/或存储器中表示为诸如电子的物理量的数据处理和/或转换为在计算系统的存储器、寄存器或其他这样的信息存储器、传输或显示装置中类似地表示为物理量的其他数据。
这里,本发明的实施例可包含用于完成这些运算的设备。该设备可以是专为期望用途而造,或者它可以包括通用计算机,或由存储在计算机中的计算机程序选择性激活或重新配置的数字信号处理器(“DSP”)。这样的计算机程序可以存储在计算机可读存储介质里,如任一类型的磁盘,包括软盘、光盘、CD-ROM、磁光盘、只读存储器(ROM)、随机存取存储器(RAM)、电可编程只读存储器(EPROM)、电可擦可编程只读存储器(EEPROM)、磁或光卡、或者适于存储电子指令、并能够连接到计算机系统总线的任何其他类型的介质,但不受限于这些介质。
这里所给出的过程和显示本质上与任何特殊计算机或其他设备都无关。可与这里所教授内容一致的程序一起使用各种通用系统,或者它可以证明很方便构建更专门化的设备来完成所期望的方法。对于各种系统所期望的结构将在下面进行介绍。此外,本发明的实施例并不参照任何特定的程序设计语言进行说明。要理解的是各种程序设计语言可以用于完成此处所述的本发明的教授内容。
除非另有特别声明,如下面的讨论中表明的,要理解的是整个说明书中,利用诸如“音调”、“信令音”、“级别”、“频率”、“频率分量”等术语的说明,可以指上面各成分和元素的一个或多个单元。
作为本发明的一部分,可以存在一种频率估计器,它可以分析音频信号,找到信令音的频率分量,还可以向音调失真器提供有关可疑信令音的频率分量的信息。音调失真器可以修正音频信号内的可疑信令音的频率组成。音调失真器可以确定在音频信号中确实存在信令音,并且响应于信令音的存在,可以指示在接收站中的音调发生器产生被检测的信令音。
频率估计器可以与音调检测器组合使用,这样,在充足的时间里可以检测到信令音以失真该音调。频率估计器会比音调检测器精确度低,并且产生更多误检。然而,频率估计器会比音调检测器具有更快的响应时间,因而,可以在足够的时间段内检测到可疑信令音,以便失真可疑信令音的频率组成。
在频率估计器30误检信令音的情况下,也就是说,当音频信号中实际上不存在信令音时,它检测到可疑信令音,可以向音调失真器发信以失真所误检的音调。作为本发明的一部分,音调失真器可以失真其中误检到信令音的音频信号的频率组成,这样,音频信号中的语音仍能够可理解。在本发明的一个优选实施例中,音调失真器可以失真其中误检到信令音的音频信号的频率组成,这样,音频信号中的语音质量仅仅略为降低。
现在转到图1,这里示出根据本发明的一种信令音传输系统的框图。可包含信令音的音频信号可以从图1的左侧进入系统。具有信令音的音频信号可能产生于许多装置中的任何一个,包括但不受限于具有按键音拨号盘的电话。信号可以由音调失真器10和频率估计器30来接收,可以将它们配置为对音频信号的频率组成进行分析,尤其是查找一个或多个信令音所相关的一个或多个频率分量。语音编码器20可以编码音频信号,并将数据分组通过通信网发送到解码器50,在解码器50处这些分组可以被解码和音频信号被重构。可以将通信网配置为利用ATM、IP、TCP、UDP,或者RTP协议,其中的任何组合以及任何其他合适的方法来传送数据。
在频率估计器30检测音频信号中的信令音(无论是否真正存在信令音)的情况下,频率估计器30会产生并向失真器10提供可疑音调的频率分量的一个或多个频率值和振幅。失真器10可以失真音频信号中的可疑音调,这样,可疑音调不会被构成解码器50一部分的信令音检测器70所识别。既然频率估计器30会错检,失真是对音质影响最小的类型。根据本发明的一些实施例,在信令音传输系统中可以包含信令检测器70,然而,本发明的关于信令音传输系统的其他实施例可以不用信令音检测器70来实施。
信令音检测器40还可以接收未失真的音频信号,并可以检测音调。音调检测器40是众所周知的,并且比频率估计器30检测音频信号中的音调要慢。然而,音调检测器,如图1中的DTMF检测器40,在确定在音频信号中存在或不存在信令音方面比频率估计器30更为精确。如果音调检测器40在音频信号中检测到音调,它会向音调发生器60发送控制信号,指示音调发生器产生被检测的音调。音调发生器60可以与解码器50连接,这样,发生器60的输出重叠在来自解码器50的音频信号输出上。
语音编码器20(图1)可以将时域信号变换为适于在数据通信网上传输的数据分组。然后,语音编码器20可以将数据分组发送到网络上的目的地址。在目的地处的语音解码器50可以将编码器20所发送的数据分组变换回时域音频信号,该信号具有失真音调,该音调不会被该音调所预定发往的装置70所识别。
频率估计器可以利用许多方法的其中之一来构造,其中一个实例在图2中示出。信号可以通过时域-频域变换器32,如傅立叶(Fourier)变换引擎、线形预测性系数发生器,余弦变换引擎等等。还可以使用一组滤波器,或滤波器组,将每个滤波器都调谐到与所关心的音调相关的特定频率。每个滤波器的输出电平可以指明在音频信号中滤波器所调谐到的频率分量的级别或强度。变换器32的输出可以由频谱分析单元34来分析,该分析单元可以试图对音频信号中的其存在将指示信令音也存在的频率分量进行识别。既然每个信令音具有一个或多个与之相关的频率分量,音调的频率分量的强存在或半强存在会使频谱分析单元34确定在音频信号中存在有关音调。在频率估计器30确定音频信号中存在音调的情况下,频率估计器30会向失真器10发送信号,指明怀疑存在于音频信号中的音调的频率分量的频率和振幅。
现在转到图3A,这里示出根据本发明的音调失真器10的一个实施例的框图。失真器10可以包含一个开关或继电器12,其缺省设置是在失真器的其他元件附近的旁路路径上发送输入的源音频信号。在频率估计器30向失真器10提供音频信号里会含有音调的指示的情况下,继电器12会触发,使得输入的音频信号被传送到时域-频域变换器14,频谱修正单元16,以及频域-时域变换器18。时域-频域变换器14是为人所知的,并且可以包含但不受限于傅立叶变换引擎、线形预测性系数发生器、余弦变换引擎、或滤波器组。时域-频域变换器14的输出可以被称作为音频信号的频谱表示。
频谱修正单元16可以从频率估计器30接收可疑音调的频率分量的频率和振幅,并且可以修正或失真与该可疑音调有关的频率分量,这样,该音调不会被该音调所预定发往的装置70识别。可疑信令音的频率分量的失真可以通过减小其相关的频率分量的振幅来实现,其中一个实例在图4A中示出。图4A(在左侧)示出可疑信令音频率分量f8,其在所有其他频率分量中具有最高振幅。然而,图4A(在右侧)示出可疑信令音频率分量f8,其在经过失真后,具有较低的振幅。
可疑信令音的频率分量的失真还可以通过向上或向下移动可疑音调的频率分量的频率来实现。比如,如果可疑信令音在f8处可能会有频率分量(比如,与900Hz有关),频谱修正单元可以将频率分量下移,如图4B中所示。图4B(在右侧)示出下移两个离散频率值到f6的可疑信令音频率分量f8。在图4B中所示的实例中,f8和f6被交换。然而,在另一实例中,f8仅替换f6。
频谱修正单元还会将噪声引入或放大临近可疑音调的频率分量的频率的频段中的频率分量,其中一个实例在图4C中示出。图4C示出f8周围的频率分量被放大,这样,f8不再是支配的频率分量。
在音调信号由两个或多个音调(比如,DTMF)组成的情况下,所有这些分量会被失真,或者其中一些分量会被失真,或者仅其中一个分量会被失真。通常,最好是失真较低振幅分量。
这些和其他频谱修正技术可以用于改变可疑音调的频谱组成,这样,该可疑音调不会被该音调所要发往的装置识别成信令音。频域-时域变换器18(图3A)可以将修正后的音频信号的频谱表示变换回时域信号。
图3B示出根据本发明的音调失真器10的可选实施例。图3B的失真器10可以仅包含一个频谱修正单元16,它可以改变包含信令音的信号的频率组成,而不首先将信号转换到频域。作为图3B的实施例的一部分,频谱修正单元16可以是滤波器,上频移器或下频移器,或者具有适当的频域变换特征或频率响应的任何其他装置。
因此,这里给出关于可以如何实现如DTMF音调失真器的其他音调失真器的一个实例为了实现足够的失真,使得标准DTMF检测器不会把DTMF信号识别为有效的DTMF信号,可以利用如标准TIA-464B所定义的DTMF检测器的特征。比如,DTMF具有这样的限定,如扭曲(Twist)—为使DTMF信号被接受或识别,要求在DTMF信号中高频和低频分量之间的功率比在+4dB到-8dB之间;每分量的功率限制—为了能被接受,分量功率必须在0到-25dB之间;以及频率偏差—为了能被接受,分量的频率偏差必须低于1.5%。
除了TIA-464B标准外,还有其他一些特征是所有DTMF检测器共有的,并且可以用来欺骗DTMF检测器频率稳定性—为了区分DTMF和语音信号,DTMF检测器要求短期信号功率要恒定,以便信号会被接受为DTMF信号;功率集中性—为了区分DTMF和语音信号,DTMF检测器要求功率谱集中于DTMF频率周围,以便信号会被接受为DTMF信号。
考虑到以上所列举的关于DTMF检测器的特性或要求,DTMF检测器可以根据以下参数中的一个或多个来设计扭曲失真器(Twist distorter)—该失真器可以以最小的衰减来衰减具有较低电平的频率分量,这样,扭曲将会在所允许的DTMF范围之外。在该频率范围周围它可以使用陷波滤波器,以便只有DTMF分量得到衰减。陷波滤波器可以是有限脉冲响应(“FIR”)滤波器,或者是无限脉冲响应(“IIR”)滤波器。
可以使用具有以下传递函数的IIR滤波器H(z)=z2-2cosθ·z+1z2-2rcosθ·z+r2]]>Z代表Z变换的复变量,参数Theta控制陷波滤波器的中心频率,参数r控制音调的衰减,使得扭曲会在所接受的范围之外。应用到频率分量的15dB衰减会足以保证扭曲在所接受的范围之外。由于滤波器的频率响应的单调性低于和高于标称频率,在标称频率+/-1.5%处的衰减甚至可以高于15dB。
下表说明利用1陷波滤波器的扭曲失真器的设计(用于由频率估计器所估算的2 DTMF分量中的较弱分量),1陷波滤波器出自根据8个标称DTMF频率的一组8个可能的陷波滤波器。标称频率f0是陷波的中心。f0被用于计算滤波器的差分方程中的参数Theta。半径值r是从原点的滤波器的极的距离,在滤波器的差分方程中r用来控制在陷波频率处的衰减。

对于每个频率示出了在标称频率+/-2.5%的衰减。可以对r值进行计算,使得衰减将为至少15dB。这可以保证考虑到合理的检测器的带宽,滤波器会使扭曲变成非法检测。为了说明对于语音信号失真是最小的(当频率估计器将信号误检为DTMF时),我们示出衰减为3dB处的低频和高频,并计算代表被大大衰减的频带的频带delta。频带delta在最糟情况下是412Hz,在大约为13%的3KHz的话音频带内。
在时域中,陷波滤波器可以利用下面的差分方程来完成y[n]=2rcosθ·y[n-1]-r2y[n-2]+x[n]-2cosθ·x[n-1]+x[n-2]根据由频率估计器所估算的较弱的可疑DTMF频率分量,利用表中的参数r和Theta。这里x[n]是滤波器的第n个输入抽样的值。
y[n]是滤波器的第n个输出抽样的值。
频率调制失真器—该失真器可以通过将信号与具有固定调制频率的正弦或余弦调制器相乘来偏移频率分量。调制结果是向前偏频移一次和向后频移一次大小为调制频率的信号之和。调制频率可以是这样的,它将使至少一个DTMF分量具有大于3.5%的频率偏差,这将使音调被音调检测器70拒绝。
y[n]=x[n]·cos(w1n)这里x[n]是音频信号的抽样的第n个值的值y[n]是调制器的第n个输出抽样的值w1=2πf1/fsf1是频率偏移,fs是抽样频率。
频率偏移失真器—该失真器通过将信号与具有固定调制频率的余弦调制器的积(正弦/余弦调制器将信号与具有固定频率的正弦/余弦波相乘,结果将是源信号频谱偏移调制器的频率)与Hilbert变换信号与正弦调制器的积相减来偏移频率分量。结果是向前频移大小为调制频率。调制频率可以是这样的,它将使至少一个分量具有大于3.5%的频率偏差,所以,它将会被拒绝。
y[n]=x[n]·cos(w1n)-Hilbert{x[n]}·sin(w1n)这里Hilbert{x[n]}表示信号x[n]的Hilbert变换。
Hilbert变换可以利用适当的全通FIR滤波器来实现。
功率频谱集中失真器—该失真器通过将谐波分量加到源频率分量降低DTMF分量处的相对功率谱集中。这可以通过对信号进行非线性变换来实现。绝对值函数可以用作非线性变换。
y[n]=|x[n]|也可以使用其他的非线性变换。比如y[n]=x2[n]这里x[n]是音频信号的第n个抽样y[n]是失真器的输出的第n个抽样这些变换的结果可以是变换信号的频谱将包含源信号的频谱分量的谐波(整数倍)。这会使检测器70发现频谱不太集中于DTMF频率(因为它的一部分将集中于DTMF频率的倍数),因此,检测器70将拒绝该信号作为未检测到。
频谱集中失真器可以将信令音分量附近的一个或多个频率分量放大。这样做的影响是将信令音隐藏在音频信号中,由此使该音调对于音调检测器不可识别。
在频域中,音频信号以及其中包含的信令音的频率组成可以任意改变。利用时域-频域变换是众所周知的。可以对包含信令音的音频信号进行抽样,抽样可分为抽样的重叠或非重叠段或帧。每个段可以变换到频域或者该段的频谱表示。每帧内的特定频率分量可以是增加的、减少的、移动的或者改变的,可以将改变的频谱表示变回到时域。上述的每个失真方法,以及可以应用于本发明的任何其他方法,可以在频域中利用时域-频域变换来完成。
在本发明的一个实施例中,失真器10会对音频信号所表示的语音具有有限的影响。在频率估计器30通知可疑信令音存在的情况下,当实际上真的信令音不存在时,音调失真器对音频信号的修正不会严重降低音频信号内的语音质量。也就是说,由音调失真器10所产生的失真对音频信号的语音分量的影响可以忽略,使得语音信号对于收听者来说可理解。这可以通过利用其中一个上面列举的方法仅作有限的频谱修正来实现。
虽然这里图解介绍说明了本发明的某些特征,本领域的技术人员将会想起许多修改、替代、变更和等效。因此,要理解的是所附权利要求书是为了涵盖所有这些落入本发明的真正精神之内的修改和变更。
权利要求
1.一种方法,包括检测在一个音频信号内的与一个信令音相关的频率分量,以及将所述音频信号内的音调失真。
2.根据权利要求1的方法,其中所述失真包括偏移与所述音调相关的频率分量。
3.根据权利要求1的方法,其中所述失真包括改变与所述音调相关的频率分量的幅度。
4.根据权利要求1的方法,其中所述失真包括伪装与所述音调相关的频率分量。
5.根据权利要求1的方法,其中通过改变一个或多个音调的频率分量的一个或多个级别来失真所述音频信号内的音调。
6.根据权利要求1的方法,其中通过改变与所述音调相关的频率分量附近的频率分量的级别来失真所述音频信号内的音调。
7.根据权利要求1的方法,还包括将具有被失真的音调的所述音频信号发送到其目的地。
8.根据权利要求7的方法,还包括在将所述信号发送到其目的地之前,对所述音频信号进行编码。
9.根据权利要求8的方法,还包括检测所述音频信号内的音调,以及向音调发生器发送一个控制信号,指示所述发生器生成被检测的音调。
10.一种音调传输装置,包括一个频率估计器和一个音调失真器,所述频率估计器适于检测在一个音频信号中的与一个音调相关的频率分量,而所述音调失真器适于修改与所述音调相关的一个或多个频率分量,同时使所述音频信号中的语音失真最小。
11.根据权利要求10的音调传输装置,其中所述音调失真器是从包括扭曲失真器、频率调制失真器、频移失真器和功率集中失真器的组中选择的。
12.根据权利要求11的音调传输装置,还包括一个适于将所述音频信号转换为一个或多个数据分组的编码器。
13.根据权利要求12的音调传输装置,还包括一个音调检测单元,其适于检测所述音频信号中的音调,并产生一个指示音调发生器生成被检测的音调的控制信号。
14.一种传输系统,包括音调传输装置,包括一个频率检测器和一个音调失真器,所述频率检测器适于检测在一个音频信号中的与一个音调相关的频率分量,而所述音调失真器适于修改与所述音调相关的一个或多个频率分量,同时使所述音频信号中的语音失真最小;以及编码器,适于把所述音频信号编码并在数据通信网上传输。
15.根据权利要求14的系统,其中从包括ATM网络、TCP协议、IP网络、UDP协议和RTP协议的组中选择通信。
16.一种方法,包括检测在一个音频信号内的与一个信令音相关的频率分量;改变与所述信令音相关的频率分量,使得所述音频信号内的语音失真最小;以及利用所述被改变的频率分量编码所述音频信号。
17.根据权利要求16的方法,还包括检测所述信令音,以及发送一个控制信号到音调发生器。
18.一种音调传输装置,包括一个频率检测器,适于检测在一个音频信号中的与一个音调相关的频率分量;一个音调失真器,适于修改与所述音调相关的一个或多个频率分量;一个编码器,适于用所述被失真的音调编码所述音频信号;以及一个音调检测器,适于检测所述音调并产生一个指示音调发生器生成所述音调的控制信号。
19.根据权利要求18的音调传输装置,其中所述音调失真器仅最小化地失真所述音频信号内的语音。
全文摘要
作为用于在分组交换数据(或其他通信)网络上传输信令音的系统和方法的一部分,一种音频编码器可以具有一个语音编码单元(20)和一个音调失真器(10)。音调失真器可以将音频信号内的信令音的一个或多个分量失真,语音编码单元(20)可以对音频信号内的语音和失真的信令音进行编码。可以将控制信号传送到音调发生器(60),以再现被失真的音调。
文档编号H04M19/02GK1663223SQ03813851
公开日2005年8月31日 申请日期2003年4月14日 优先权日2002年4月15日
发明者埃莉·肖瓦尔, 马克·拉非尔, 莱昂·比亚利克 申请人:奥迪科德公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1