舒适噪声产生参数的匹配方法

文档序号:2823494阅读:286来源:国知局
专利名称:舒适噪声产生参数的匹配方法
技术领域
本发明涉及一种舒适噪声产生(CNG)参数的匹配方法,所述参数用于在电信系统中产生背景噪声信号,所述电信系统由一个面向分组的电信网络和在其上连接的至少一个第一和第二通信设备组成。CNG参数在第一通信设备中产生,并被插入到至少一个静音插入描述符(SID)传输帧中,经面向分组的电信网络向第二通信设备传输。
背景技术
由于日益增加全球范围的企业,使用传输语音和数据的电信业务不断增加。其结果使得电信业务引起的费用不断上升,构成了企业的一个巨大成本因素,从而寻找减少这一费用的可能性。全球和本地计算机网络,例如内部网或者因特网,提供了费用适宜并可以在世界范围内传输数据尤其是语音数据的可能性。在此,还有大量实时重要的数据,例如语音数据和视频数据,要通过本地和全球面向分组的电信系统进行传输。
在这种尤其是按照因特网协议(IP)上的话音技术或者码分多址(CDMA)技术实现的电信系统中,可以有利地使用例如在'电话交谈中出现的对话间歇或者交谈伙伴的听话期间,来减少在电信系统内要传输的数据量。为此,例如在一个交谈伙伴的交谈停歇期间,代替实际的背景噪声,在一个为此提供的传输帧内仅传输多个描述该背景噪声的参数,从这些参数在接收站中产生人工的舒适背景噪声信号(“Comfort Noise Signal”),从而给当时讲话的交谈伙伴造成在相反方向的电信连接继续存在的印象。
因此这些参数描述噪声信号强度以及它们的谱特性,在文献中称为“SilenceInsertion Descriptor(SID)Informaton(静音插入符信息)”或“Comfort NoiseGeneration(CNG)Parameter(舒适噪声产生参数)”。在接收单元中使用用于产生人工的舒适背景噪声(“Comfort Noise Generation”)的CNG参数。为此公知各种不同的用于产生CNG参数和随后重建背景噪声(“Comfort NoiseGeneration”)的方法,为交换CNG参数,需要既在接收单元中也在发送单元中实现和预先定义这些方法,以及至少部分把它们标准化。
关于要使用的传输帧或者在数据分组中传输的“Comfort Noise Payload(舒适噪声有效信号)”,这种CNG参数的一种无约束力的定义在ITUTelecommunication Standardization Section(ITU-T)(电信标准化部分)的Appendix(附录)II中的G.711标准中给出,它已经规定,“Comfort NoisePayload”必须包含一个给出噪声信号响度级的参数以及背景噪声的多个形式为滤波系数的谱特征。然而,通过ITU标准G..711附录II为“Interworking Scenarios(交互工作的场景)”例如在多个不同的网关计算机系统中没有规定关于构建SID传输帧的应用的任何有约束力的边界条件,使得可能在不同的电信系统中存在所用SID传输帧以及其中包含的参数不同的结构。
尤其是在按照IP上的话音或者CDMA技术工作的电信系统中,例如在一个这样的SID传输帧中,或者仅有响度参数(“Quantized Energy Level(量化的能量级)”)或者附加形式为滤波系数的谱特征(“Quantized Reflection Coefficients(量化的反射系数)”)被传输,因此在这件事情上滤波系数的数目在各种应用情况下会有很大差别。这导致SID传输帧具有1字节到15字节的不同长度。通过ITU标准G.711附录II也未给出确定参数数量级的明确说明,使得在SID传输帧中包含的参数或者更确切说它们所取的值也可能在一个宽的范围内变化。这种不同结构的CNG参数记录导致所产生的背景噪声的显著恶化,例如在极端的情况下它可能有这样高的响度级,使得超过实际的语音信号,至少会受到干扰。

发明内容
因此本发明所要解决的技术问题在于,给出一种匹配在至少一个SID传输帧中传输的、用于在面向分组的电信系统中产生背景噪声信号的CNG参数的方法,该方法支持不同结构的CNG参数或者产生这种CNG参数记录的方法,它们每一种都产生具有近似相同良好信号特征的背景噪声信号。
该技术问题着眼于根据权利要求1的前序部分并由权利要求特征部分表述的特征得到解决。
本发明方法的重要的优点在于,把传输的CNG参数与预先规定的CNG参数格式比较,在偏离预先规定的CNG参数格式时,通过舍弃单个CNG参数和/或通过用预先规定的额定CNG参数代替含有错误的、错误的或不兼容的CNG参数,与预先规定的额定CNG参数格式进行匹配。通过剔除多余的和/或用缺省参数代替错误的或者含有错误的CNG参数,可以有利地避免背景噪声信号中超过或者干扰实际语音信号的高的响度强度级。本方法也特别适合在具有不同“交互工作场景”的不同网关计算机系统内部使用。
此外,通过预先规定的CNG参数格式有利地把传输的CNG参数的数目限制在最大的11个参数,包括一个QEL参数和10个QRC系数。将参数数目限制在最大11个参数,其中10个参数被构造为谱参数,允许使用商业通用的滤波器单元,既减少硬件技术实现开销,也减少了在电信系统内的计算开销。
本发明有利的扩展在从属权利要求中给出。


下面根据示意框图详细说明本发明的一个实施例。
图1举例表示一个电信系统,尤其用于传输语音数据信号。
图2举例表示给出响度级的SID传输帧的第一字节。
图3举例表示SID传输帧的舒适噪声有效信号。
图4以流程图举例表示匹配CNG参数的单个的方法步骤。
具体实施例方式
图1根据一个示意结构图举例表示一个电信系统1,特别是一个面向分组的电信系统,它具有第一通信设备2和第二通信设备3,它们例如通过一个面向分组的或者面向IP的通信网络4彼此连接。在此,借助数据分组实现经面向IP的通信网络4的数据传输。例如可以把第一和第二通信设备2、3构建为拥有不同技术结构的网关计算机系统,并可再次连接到通信设备上,例如IP电话或者客户计算机系统(图中未示)。此外在第一通信设备2内例如设置一个发送单元5,在第二通信设备3内设置一个接收单元6,它们为通过面向IP的通信网络4例如按照ITU的G.711传输标准传输数据分组构造。另外可以选择的方案是也可以使用ITU的G.726传输标准。
为降低在面向IP的通信网络4内的传输速率,发送单元5具有一个“VoiceActivity Detection(VAD)(话音活动检测)”单元7,它通过连接线例如与第一通信设备2的输入端I2连接,且它支持所谓的“Voice Activity Detection(VAD)”功能。在输入端I2上接收的数据信号或者语音数据信号向VAD单元7传输,并在那里识别在数据信号内要发送的语音数据或者单独存在的背景噪声的错误。如果不存在任何语音数据,则通过VAD单元7产生一个所谓的“SilenceInsertion Descriptor(静音插入符)”(SID)传输帧,它在发送单元5中被继续处理,紧接着向第二通信设备3的接收单元6传输。这一过程一直继续,直到在发送单元5中出现新的语音数据。
此外,在发送单元5中设置一个“discontinuous Transmission(不连续传输)”(DTX)单元8,它同样通过连接线与第一通信设备2的输入端I2和VAD单元7连接。借助DTX单元8产生的SID传输帧SID在相关的语音间歇期间被计数,从而求得在该语音间歇期间产生或者传输SID传输帧SID的频度。
此外,VAD单元7通过连接线与“Comfort Noise Generation(舒适噪声产生)”(CNG)单元9连接,它同样通过另一连接线与输入端I2连接。在向第二通信设备3传输前,向该第一CNG单元9传输在VAD单元7中产生的SID传输帧SID,以便继续处理。在该第一CNG单元9中根据“Comfort NoiseGeneration”参数CNP采集在该语音间歇中存在的背景噪声,该参数特别根据“Quantized Energy Level”参数QEP描述背景噪声的响度强度,或者根据多个“Quantized Reflection Coefficients”系数QRC描述背景噪声的谱特征。求得的舒适噪声产生参数CNP或者“Quantized Energy Level”参数QEP和“QuantizedReflection Coefficients”系数QRC被插入SID传输帧SID中。
此外在发送单元5中例如把传输的语音数据封入一个有用数据传输帧VP中,该有用数据传输帧VP在文献中经常称为“Voice frames(话音帧)”,它再次被插入一个未图示的数据分组中,通过面向IP的电信网络4传输。为此在第一通信设备2的发送单元5内设置第一语音信号单元10,其与第一通信设备2的输入端I2连接。通过第一语音信号单元10对通过输入端I2接收的语音数据信号进行编码,并插入到一个有用数据传输帧VP中。如图1所示,产生的有用数据传输帧VP和产生的SID传输帧SID接着插入一个未图示的数据分组中,通过面向IP的电信网络4传输。
在第一语音信号单元10和第一CNG单元9上通过连接线连接多路复用器单元11,它把有用数据传输帧VP或者SID传输帧SID在此封入至少一个数据分组中,并为通过面向IP的电信网络4传输连接在第一通信设备2的输出端E2。
在第二通信设备3的输入I3上连接多路复用器单元12,它读出在接收的数据分组中包含的传输帧VP或者SID,或者向连接的第二语音信号单元13或者向第二“ComfortNoise Generation”(CNG)单元14转发。
根据第二CNG单元14,读出在SID传输帧SID中包含的信息,并为产生背景噪声进行分析。此外在接收单元6中举例设置一个控制单元15以及存储单元16,它们被设置用于控制CNG单元14和第二语音信号单元13以及用于存储数据特别是最后接收的“Comfort Noise Generation”参数CNG。
图2举例表示SID传输帧SID内给出“Quantized Energy Level”参数QEP的第一字节。在此噪声信号电平以-dBov给出,在此可以表示值0到127以及0到-127的-dBov。为表示所述“Quantized Energy Level”参数QEP的值范围,设置8个位,它们相应于SID传输帧SID的第一字节。在此,具有零位位置的位总存储值0,剩余的第一到第七位表示实际噪声信号级值,在此,在第一位位置提高“Most Significant Bit(最高位)”(MSB)。
“Quantized Reflection Coefficients”系数QRC根据SID传输帧SID内的第二到第M+1字节传输,在此根据第一QRC系数N1的第二字节、根据第二QRC系数N2的第二字节等传输。第M个QRC系数NM最后传输,在这件事情上由此通过QRC系数的数目M规定数字滤波器的级,通过这些滤波器从高斯形状的随机信号或者随机性的随机信号构成背景信号。通常使用数字滤波器,特别是级M=10到15的合成滤波器。
下面根据图4所示流程图详细说明匹配在至少一个SID传输帧SID中传输的、用于产生改善的背景噪声的“Comfort Noise Generation”参数CNG的方法。
如果通过第二CNG单元14接收一个其内包含“Comfort Noise Generation”参数CNP的SID传输帧SID,则在第一步骤17将其从SID传输帧SID中取出。如果在SID传输帧SID中不包含任何新的“Comfort Noise Generation”参数CNP,则使用在存储单元16最后存储的“Comfort Noise Generation”参数CNP用于产生背景噪声。
在第二步骤18,对取出的CNG参数CNP进行分析,更确切说,首先把它分为“Quantized Energy Level”参数QEP和“Quantized Reflection Coefficients”系数QRC,在此规定被传输的QRC系数N1-NM的数目M。此外,逐字节检验参数值,看其是否在超过预先规定的CNG参数格式CNPF或者预先规定的字节数的预定区域内存在。因此通过该预先规定的CNG参数格式CNPF确定滤波系数的一个预定值,在本实施例中为QRC参数N1-N10的M=10。研究得出,在使用M=10个滤波系数的情况下,可以得到关于产生的背景噪声的传输速率和质量的最好的结果。因此,仅把从SID传输帧中读出的满足这一要求的CNG参数CNP不加匹配直接用于滤波。
所有剩余的亦即不与该规定相符的CNG参数CNP在步骤19中首先向预定的CNG参数格式CNPF匹配。为此首先把所接收的SID传输帧的多余的滤波系数,亦即超过11字节数目(QEL参数QEP=第一字节;QRC系数N1-N10=第二到第十一字节)的第12到第N字节的滤波系数截断从而舍弃。因此优选使用标准滤波器来产生背景噪声信号,由此免去在发送和接收单元中设置的滤波器的滤波级的匹配。
在第四步骤20,检验现在由最大的十一字节组成的CNG参数CNP的内容,亦即更精确分析QEL参数QEP和剩余的QRC系数QRC,并例如用额定CNG参数SCNP代替错误的或者不完全的或者含有错误的或者不兼容的参数。额定CNG参数SCNP取自一个“Set of Gold parameters(黄金参数集)”SGP,它在存储单元16中存储。
在一个优选的实施例中,“Set of Gold parameters”SGP包括一个黄金QEL参数GQEP和10个黄金QRC系数GQRC,它们通过广泛分析大量测试文件求得,所述测试文件具有标准化了的、或者在研究领域获得的语音试样。为此,在给语音试样提供高通滤波、窗口滤波、以及自相关功能和列维荪·杜宾(Levison-Durbin)算法后,建立语音试样的一个谱分析,在此选择“Set of Goldparameters”SGP,使得所产生的背景噪声落入900到3400Hz的一个统一的频率范围内。在此所接收的信号能量在所述频率范围内近似均匀地分布在900到3400Hz之间。特别要注意,仅有很小的频率部分落入人听力感觉明显的300-900Hz频率范围内。
这样匹配后的CNG参数CNP*接着在第五步骤21关于背景噪声通过它可产生的信号电平被平滑。这例如类似在ITU标准G.711附录II中定义的方法执行。
在下面的第六步骤22,匹配后的QRC系数QRC*使用列维荪·杜宾算法变换为“Linear Prediction Coefficient(LPC)(线性预测系数)”系数LPC。在此为节省资源可以直接使用已经为黄金QRC系数GQRC计算的黄金LPC系数LPC,它同样存储在存储单元16中,这意味着,可以省略为从“Set of Goldparameters”SGP中取出的QRC系数QRC*求所属LPC系数LPC计算量繁重的步骤。
在第七步骤23,产生高斯形随机信号,对它进行校准。最后在第八步骤24把产生的高斯形随机信号通过一个设置有求得的LPC系数LPC的滤波单元进行滤波或者合成滤波,由此产生背景噪声信号,它叠加在语音数据信号上。
上面根据多个实施例对本发明进行了说明。应该理解,在不偏离本发明所基于的发明构思的情况下,可以进行各种修改和变换。
权利要求
1.舒适噪声产生(CNG)参数(CNP)的匹配方法,所述舒适噪声产生参数(CNP)用于在电信系统(1)中产生背景噪声信号,所述电信系统由一个面向分组的电信网络(4)和在其上连接的至少一个第一和第二通信设备(2,3)组成,其中,该CNG参数(CNP)至少在第一通信设备(2)中产生,并被插入到至少一个静音插入描述符(SID)传输帧(SID)中,经所述面向分组的电信网络(4)向第二通信设备(3)传输,其特征在于,-把传输的CNG参数(CNP)与预先规定的CNG参数格式(CNPF)进行比较,-该传输的CNG参数(CNP)在偏离预先规定的CNG参数格式(CNPF)的情况下,通过以下方式与预先规定的额定CNG参数格式(CNPF)进行匹配,即舍弃单个的CNG参数(CNP)和/或通过用预先规定的额定CNG参数(SCNP)代替含有错误的、错误的或不兼容的CNG参数(CNP)。
2.根据权利要求1的方法,其特征在于,传输的CNG参数(CNP)包括至少一个“Quantized Energy Level”(QEL)参数(QEP)和多个“Quantized Reflection Coefficients(QRC)”系数(QRC)。
3.根据权利要求1或2的方法,其特征在于,预先规定的额定CNG参数(SCNP)从一个符合预先规定的CNG参数格式(CNPF)的“Setof Gold parameters”(SGP)中选出。
4.根据权利要求3的方法,其特征在于,选择在“Set of Gold parameters”(SGP)中包含的额定CNG参数(SCNP),使得借助该额定CNG参数(SCNP)所产生的背景噪声信号的信号能量几乎均匀地分布在900到3400Hz的频率范围内。
5.根据权利要求2到4之一的方法,其特征在于,为使传输的CNG参数(CNP)与预先规定的CNG参数格式(CNPF)匹配,舍弃至少一个“Quantized Reflection Coefficients(QRC)”系数(QRC)。
6.根据权利要求1-5之一的方法,其特征在于,通过预先规定的CNG参数格式(CNPF)把传输的CNG参数(CNP)限制在最多11个参数,这些参数包括一个QEL参数(QEP)和10个QRC系数(QRC)。
7.根据权利要求2-6之一的方法,其特征在于,通过QEL参数(QEP)传输要产生的背景噪声信号的电平和通过QRC系数(QRC)传输要产生的背景噪声信号的谱信号能量的分布。
8.根据权利要求3到7之一的方法,其特征在于,在“Set of Gold parameters”(SGP)中包含的额定CNG参数(SCNP)借助测试数据信号的谱分析求取,在此,测试数据信号在300到3400Hz的频率范围内,尤其在900到3400Hz的频率范围内。
9.根据权利要求2-6之一的方法,其特征在于,为产生背景噪声信号,在接收侧产生一个高斯形随机信号,该随机信号借助滤波单元,尤其是合成滤波单元被滤波以产生背景噪声信号。
10.根据权利要求9的方法,其特征在于,所述经过匹配的QRC系数(QRC*)利用列维荪·杜宾算法变换为线性预测系数(LPC)系数(LPC)并被提供给滤波器单元,尤其是合成滤波器单元。
全文摘要
为匹配舒适噪声产生(CNG)参数,所述参数用于在电信系统1中产生背景噪声信号,所述电信系统由一个面向分组的电信网络4和在其上连接的至少一个第一和第二通信设备2、3组成,首先,至少在第一通信设备2中产生CNG参数CNP,并插入至少一个静音插入描述符(SID)传输帧SID中,通过面向分组的电信网络4向第二通信设备3传输。使传输的CNG参数CNP与预先规定的CNG参数格式CNPF比较,在从预先规定的CNG参数格式CNPF偏离时,通过舍弃单个的CNG参数CNP和/或通过用预先规定的额定CNG参数SCNP代替含有错误的、错误的或不兼容的CNG参数CNP,使向预先规定的额定CNG参数格式CNPF匹配。
文档编号G10L19/00GK1801327SQ200510107400
公开日2006年7月12日 申请日期2005年12月29日 优先权日2004年12月29日
发明者N·阿罗拉 申请人:西门子公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1