语音质量的评估方法及装置的制造方法

文档序号:9527817阅读:296来源:国知局
语音质量的评估方法及装置的制造方法
【技术领域】
[0001]本发明涉及通信领域,特别是指一种语音质量的评估方法及装置。
【背景技术】
[0002]随着通信技术的不断发展,TD-LTE(TimeDivis1n Long Term Evolut1n,分时长期演进)网络已经进入了人们的视野之中,在TD-LTE系统提供的众多业务中,语音业务是最基本最重要的业务,且语音业务的承载已不再是传统的电路域交换方式而是采用与数据业务相同的分组域交换方式,语音业务将通过IP网络实现。因此,相对于传统语音业务而言,IP网络层的参数将会成为影响TD-LTE系统中语音业务体验质量(Quality ofExperience, Q0E)的关键因素,因此,如何通过网络参数客观评估TD-LTE系统中的语音质量是当下研究的重点。
[0003]现阶段IP网络中的语音质量评估主要采用PESQ模型、E-MODEL模型以及PESQ/E-MODEL混合模型三种评估方案。
[0004]PESQ(Perceptual evaluat1n of speech quality)即感知语音质量评估,是ITU-T (国际电信联盟远程通信标准化组织)在P.862建议书中提供的客观MOS (MeanOpin1n Score,平均意见值)分评价方法,其主要原理如下所述:开始时两个信号都通过电平调整,再用输入滤波器模拟标准电话听筒进行滤波(FFT)。这两个信号要在时间上对准,并通过听觉变换,这个变换包括对系统中线性滤波和增益变化的补偿和均衡。提取出两个失真参数,在频率和时间上总和起来,映射到对MOS分的预测。在PESQ方案中,需要获得原始语音样本以及经过网络损伤后的退化语音样本,通过PESQ算法对两种样本进行对t匕,得到最终的MOS分数。PESQ算法对传统电路域交换方式的语音有很准确的评估,但对TD-LTE系统的语音而言,未考虑一些网络层参数如时延等对语音质量的影响,因此并不适合对基于IP网络的语音进行质量评估。
[0005]E-MODEL是ITU-T在G.107中提供的客观MOS分评价方法,也是目前应用最为广泛的非侵入式客观语音质量评价方法,此方法是一种基于参数计算的评估模型并且假定各类的损伤在传输性能等级系数R的标尺上是相叠加的。这些参数共同决定了基本信噪比艮、Iuff (有效设备损伤系数,由设备损伤系数IJ十算得出)、时延损伤Id以及同时损伤系数Is。这4个参数以及获益系数A(在有其他优势引入用户时使损伤系数得到补偿)共同决定了传输性能等级系数R,任何用E模型计算的第一步结果是传输性能等级系数R,它将与所考虑的连接相关的所有传输参数组合起来。传输性能等级系数R由下式构成:
[0006]R = R0-1e eff-1d_Is+A
[0007]最后通过ITU G.107中提供的转换公式将R值转换为MOS分。
[0008]图1为E-M0DEL/PESQ混合方案的实施结构图,其主要分为两个部分:一是通过网络丢包模拟算法对原始语音进行网络丢包模拟,并选用几种不同的编码方式,随后利用PESQ算法对原始语音以及退化语音进行对比,得到一个MOS分值,之后通过公式(I)和(2)得到与之对应的L:
[0009]R = 3.026M0S3-25.314M0S2+87.060M0S-57.336 (I)
[0010]Ie = R0-R(2)
[0011]在通过实验得到大量数据后,通过数据拟合得到编码方式、网络丢包到L的映射模型;二是通过对E-MODEL中Id参数的计算进行仿真,得到单向传输时延D到Id的映射模型,最后将Id,Ie两个参数作为输入加入到E-MODEL当中,得到最后的MOSc分结果,以该结果作为语音质量的客观评估分数。
[0012]可以看出,在现有的基于IP网络的语音质量客观评估方案中,并未考虑网络的抖动值以及客户端的抖动缓存大小对语音质量的影响。在实际网络中,不仅网络传输过程会造成数据包的丢失,在客户端内也会产生丢包现象,这种丢包现象是由网络的抖动值和客户端的抖动缓存大小共同造成的,因此通过单纯的网络丢包模拟无法准确的评估语音质量的损伤。

【发明内容】

[0013]本发明要解决的技术问题是提供一种语音质量的评估方法及装置,能够更加准确的评估基于IP网络的语音质量。
[0014]为解决上述技术问题,本发明的实施例提供技术方案如下:
[0015]一方面,提供一种语音质量的评估方法,包括:
[0016]设置语音通话所需的通话参数,所述通话参数至少包括有网络传输时延、客户端抖动缓存的最大值和网络抖动;
[0017]获取多组通话参数分别对应的退化语音样本,根据得到的多个退化语音样本和所述通话参数计算得到传输损伤系数R ;
[0018]根据所述传输损伤系数R得到语音质量的平均意见值M0S。
[0019]进一步地,所述获取多组通话参数分别对应的退化语音样本,根据得到的多个退化语音样本和所述通话参数计算得到传输损伤系数R包括:
[0020]在相同的通话参数下进行测试获取多个退化语音样本,将每个退化语音样本与参考语音样本进行对比,得到每个退化语音样本的语音质量评分MOSi,并将相同的通话参数下退化语音样本的平均MOSi分值作为该组通话参数对应的语音质量分值;
[0021]设置多组不同的通话参数,分别获取每组通话参数对应的语音质量分值,得到每个语音质量分值对应的U。值,并通过得到的多个U ^值确定设备损伤系数U ;
[0022]根据所述通话参数计算得到时延损伤Id ;
[0023]根据所述设备损伤系数U和所述时延损伤Id计算得到所述传输损伤系数R。
[0024]进一步地,具体通过以下公式得到每个语音质量分值对应的U ^值:
[0025]R1 = 3.026M0SZ-25.314M0SZ+87.060Μ05「57.336
[0026]Iej。= R0-L 29*?
[0027]其中,R。为基本信噪比,MOS1为所述语音质量分值。
[0028]进一步地,所述通过得到的多个U ^值确定设备损伤系数U包括:
[0029]对得到的多个U ^值进行多项式拟合,得到在固定客户端抖动缓存的最大值下网络丢包和网络抖动到设备损伤系数U的映射模型。
[0030]进一步地,所述根据所述通话参数计算得到时延损伤Id包括:
[0031]通过公式Id = Idte+Idie+Idd计算得到时延损伤Id ;
[0032]其中,Idta为扬声器回声引起的损伤,1-为受话器回声引起的损伤,Idd为端到端时延D,D = TA+H(Max-2J),Ta为网络传输时延,Max为客户端抖动缓存最大值,J为网络抖动,当(Max_2J) > O 时,H (Max-2J) = 2J,否则,H (Max-2J) = Max。
[0033]进一步地,具体通过以下公式计算得到所述传输损伤系数R:
[0034]R = R0-1d_Iej+A
[0035]其中,A为获益系数。
[0036]本发明实施例还提供了一种语音质量的评估装置,包括:
[0037]仿真模块,用于设置语音通话所需的通话参数,所述通话参数至少包括有网络传输时延、客户端抖动缓存的最大值和网络抖动;
[0038]处理模块,用于获取多组通话参数分别对应的退化语音样本,根据得到的多个退化语音样本和所述通话参数计算得到传输损伤系数R ;
[0039]计算模块,用于根据所述传输损伤系数R得到语音质量的平均意见值M0S。
[0040]进一步地,所述处理模块包括:
[0041]测试子模块,用于在相同的通话参数下进行测试获取多个退化语音样本,将每个退化语音样本与参考语音样本进行对比,得到每个退化语音样本的语音质量评分MOSi,并将相同的通话
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1