语音质量的评估方法及装置的制造方法_3

文档序号:9527817阅读:来源:国知局
质量分值对应的
Iej ο 值:
[0098]R1 = 3.026M0SZ-25.314M0SZ+87.060Μ05「57.336
[0099]Iej。= R0-L 29*?
[0100]其中,R。为基本信噪比,MOS1为所述语音质量分值。
[0101]进一步地,所述处理子模块具体用于对得到的多个Ie"值进行多项式拟合,得到在固定客户端抖动缓存的最大值下网络丢包和网络抖动到设备损伤系数U的映射模型。
[0102]进一步地,所述计算子模块具体用于通过公式Id = Idte+Idle+Idd计算得到时延损伤Id ;
[0103]其中,Idta为扬声器回声引起的损伤,1-为受话器回声引起的损伤,Idd为端到端时延D,D = TA+H(Max-2J),Ta为网络传输时延,Max为客户端抖动缓存最大值,J为网络抖动,当(Max_2J) > O 时,H (Max-2J) = 2J,否则,H (Max-2J) = Max。
[0104]进一步地,所述计算子模块具体用于通过以下公式计算得到所述传输损伤系数R:
[0105]R = R0-1d-1ej+A
[0106]其中,A为获益系数。
[0107]下面结合附图以及具体的实施例对本发明的语音质量的评估方法进行详细介绍:
[0108]在E-M0DEL/PESQ混合方案中只通过PESQ建立语音编码方式及网络传输丢包到Ie的映射模型,且在计算单向时延时,只将群时延(平均传输时延)作为时延损伤Id的唯一影响因素,没有考虑到客户端自适应抖动缓存的大小对时延损伤Id的影响。在实际网络中,不仅网络传输过程会造成数据包的丢失,在客户端内也会产生丢包现象,这种丢包是由网络的抖动值和客户端的抖动缓存大小共同造成的,因此通过单纯的网络模拟产生的传输丢包无法准确的评估语音质量的损伤。此外,客户端自适应抖动缓存的大小对时延损伤Id会有一定的影响,因此仅仅通过群时延的大小不能准确反映出在语音通话过程中用户对时延主观感受的影响。
[0109]本发明提出了一种能够全面评估网络参数和客户端参数对VoLTE(基于IP多媒体子系统的语音业务)语音质量影响的方法,本发明通过多项式拟合得到语音质量评估模型,模型训练所需数据通过仿真采集获得。本发明在对语音质量评估时不需要获取原始语音样本及退化语音样本,仅根据语音通话过程中的一些参数(丢包、时延、抖动、抖动缓存等)就可以对VoLTE语音质量进行预测,图4为本发明实施例语音质量的评估方法的整体框图。
[0110]本发明的语音质量的评估方法具体包括以下步骤:
[0111]步骤1:建立语音通话仿真平台,在建立通话前设置语音通话仿真平台所需的网络参数;
[0112]本发明旨在研究客户端参数及网络参数与语音质量之间的映射模型,建立的语音通话仿真平台如图3所示,包括客户端A、客户端B及网络模拟器三部分,语音通话仿真平台中的网络模拟器可以使用网络仿真软件WANem来实现。在建立通话前,通过WANem软件设置通话过程中的时延、丢包、网络抖动三个网络参数。
[0113]步骤2:设置语音通话仿真平台中的客户端参数;
[0114]在TD-LTE系统中,语音业务与数据业务相同,都是采用分组域交换方式,语音通话是与IP网络相结合的VoIP (Voice over Internet Protocol,模拟信号Voice数字化)方式,因此在客户端上使用VoIP通话软件(如Ekiga)来完成客户端A与客户端B之间的通话。在通话建立前,设置语音编码方式以及客户端抖动缓存的最大值。根据TD-LTE系统特性,本发明中使用的编码器可以是AMR-WB编码器,客户端抖动缓存最大值是指客户端上自适应抖动缓存所能达到的最大长度。
[0115]步骤3:采集退化语音样本及其对应的网络参数值;
[0116]在上述步骤完成之后,通过语音通话仿真平台对VoIP语音的实际传输进行模拟,获取退化语音样本并保存。进一步地,可以更改丢包、时延、网络抖动及抖动缓存值的设置并获取对应网络参数下的退化语音样本,通过在相同参数下的大量测试获取大量的退化语音样本,以保证训练模型的可靠性。
[0117]步骤4:根据采集到的数据建立语音质量的评估模型;
[0118]利用步骤3所得到的退化语音样本及其对应的网络参数值,对语音质量的评估模型进行训练,本步骤包含以下四步:
[0119](I)、利用PESQ算法将退化语音样本与参考语音样本进行对比,得到每条退化语音样本的语音质量评分MOSi,统计相同的网络参数及客户端参数下语音质量的平均MOS分值,获得不同网络参数及客户端参数下的多个不同的平均MOS分值,并通过转换公式(3)和
(4)得到各MOS分值对应的Iej。值,Iej。值是本发明中提出的一个新参数,与标准E-MODEL模型中的有效设备损伤系数L eff类似,不同的是本发明中的U。值是由网络传输中的丢包及网络中的抖动、客户端的抖动缓存共同决定的,如图6所示,而标准E-MODEL模型中的Ie eff仅考虑网络传输中的丢包。
[0120]R1 = 3.026M0SJ-25.314M0SJ+87.060Μ05「57.336 (3)
[0121]Iej 0 = R0-L 29*?(4)
[0122]其中,MOS1为所述平均MOS分值,设置的数值1.29参考ITU G.107.1widebandE-Model部分内容,针对AMR-WB编码,将R的系数值选取为1.29。
[0123](2)、将(I)中得到不同网络丢包及网络中的抖动、客户端的最大抖动缓存对应的U。值,通过多项式拟合的方法对U。值进行拟合,得到在固定最大抖动缓存情况下网络丢包和网络抖动到设备损伤系数U的映射模型= gTwD,),式中U与U ^所表示的含义相同,不同点在于U。是通过对原始采集的数据处理所得,Iej是通过多项式拟合的方法得到,目的是为了利用数学模型建立设备损伤系数与网络丢包、网络抖动及客户端抖动缓存最大值之间的映射关系。其中,Pn为网络拥塞造成的丢包,Dj为网络抖动造成的丢包,Dj是由网络抖动和客户端抖动缓存最大值决定的。图7为客户端抖动缓存最大值为10ms时,网络丢包和网络抖动与的映射模型。
[0124](3)、利用步骤2中采集的客户端抖动缓存、网络抖动、网络传输时延及端到端的时延D这几个参数的相关数据,通过数据分析可得到客户端抖动缓存、网络抖动、网络传输时延到D的映射模型,参数映射关系如图6所示,映射模型为:D = TA+H(Max-2J),其中Ta为网络传输时延,Max为客户端抖动缓存最大值(ms),J为网络抖动值(ms),当(Max_2J) >O时,H (Max-2J) = 2J,否则,H (Max-2J) = Max。将D值作为输入,可得到时延损伤Id的大小。
[0125]Id = Idte+Idie+Idd(5)
[0126]其中,Idta为扬声器回声引起的损伤,1-代表由于受话器回声引起的损伤,Idd等于端到端时延D。
[0127](4)、利用E-model算法加入抖动缓存及平均时延对语音质量的影响,并通过计算公式(6)计算传输损伤系数R
[0128]R = R0-1d-1ej+A(6)
[0129]式中Ro、A参数的计算均采用G.107.1中的标准模型,而Iej的计算则使用⑵中通过多项式拟合得到的映射模型。
[0130]依据G.107.1标准中提供的R到MOS分的转换公式得到客观评估分值,图8为时延为100ms,抖动缓存最大值为10ms时,网络丢包和网络抖动与MOS分的映射模型。
[0131]现有技术只建立了网络丢包到丢包损伤的映射模型,没有考虑网络抖动及客户端抖动缓存造成的客户端丢包,且现有技术中未考虑抖动缓存对语音传输时延的影响,因此现有的语音评估模型不能很好的评估基于IP网络
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1