基于QoS的交互音频体验质量评测平台及评测方法

文档序号:8002803阅读:263来源:国知局
基于QoS的交互音频体验质量评测平台及评测方法
【专利摘要】本发明提供一种基于QoS的交互音频体验质量评测平台及评测方法。根据本发明的方法,先基于所设置的相关网络参数来启动无损仿真网络及有损仿真网络,并对第一通信设备及第二通信设备的播放及录音相关的参数进行配置,使第一通信设备及第二通信设备的时间同步;随后,第一通信设备及第二通信设备通过仿真网络建立语音链接,并相互传送语音信息,双方各自将来自另一方的语音予以播放并录音;最后再基于第一通信设备及第二通信设备各自录制的来自无损仿真网络的语音及来自有损仿真网络的语音进行评测来确定经过网络传输后受到网络损伤的语音文件的用户体验质量。本发明的评测方法更具有真实性、稳定性、准确性和可重复性的优点。
【专利说明】基于QoS的交互音频体验质量评测平台及评测方法
【技术领域】
[0001]本发明涉及音频评测领域,特别是涉及一种基于QoS的交互音频体验质量评测平台及评测方法。
【背景技术】
[0002]VoIP的长足发展逐渐改变了人们通信的方式和习惯。与过去相比,人们越来越依赖于通过网络来进行通讯。网络电话、语音会议等交互音频应用逐渐成为人们的主要通讯方式。用户对交互音频应用的体验很大程度上受到网络性能的影响,用户总是期望得到即时、平滑、清晰、连续的交互会话服务,但IP网络是一种尽力而为的传输网络,IP网络的性能优劣决定了用户对交互音频应用的体验质量。
[0003]传统的网络服务质量研究重点以提高网络性能和整体资源利用率为目的,而这些研究忽视了用户这一最重要的评价要素,没有深入的了解网络性能参数对用户体验的影响变化情况,更无法为有针对性的优化网络从而进一步满足用户需求提供依据。如果将QoE模型运用到面向交互式音频应用用户体验的网络监测中,将会使传统的网络管理转变为以获取最优的用户体验为导向,从而使服务质量和用户满意度得到提升,同时也为判断当前网络是否支持业务的需求提供参考,为网络性能优化提供依据。通过研究QoS与QoE的关系,将QoE通过与QoS的映射关系引入到网络监测与控制中,一方面可以对流媒体的QoE进行实时评估,另一方面也为网络规划、传输协议、路由算法等研究提供新的度量指标和依据。因此探索QoS与QoE的关系是一个十分重要的研究课题。
[0004]现有的如NIST Net、NS2等网络仿真软件仅专注于网络本身特性的研究,此类软件中无语音传输和编码的设置,因此仅仅依靠这些仿真软件还无法满足对QoE进行研究的需求。而依托真实网络进行QoS对QoE影响的实验中,QoS参数难以进行精确的设制,不具备可重复性,且需要很多路由器、交换机等价格昂贵的设备以及相关软硬件支持。传统的实验环境均没有考虑对终端设备的波形、音量、录音方式进行精确控制,也未考虑时延对交互音频体验质量的影响,使实验平台缺乏稳定性以及实用性。

【发明内容】

[0005]鉴于以上所述现有技术的缺点,本发明的目的在于提供一种具有更好的真实性、稳定性、准确性和可重复性的基于QoS的交互音频体验质量评测平台及评测方法。
[0006]为实现上述目的及其他相关目的,本发明提供一种基于QoS的交互音频体验质量评测平台,其至少包括:
[0007]用于进行VoIP语音通信的第一通信设备及第二通信设备,所述第一通信设备及第二通信设备中均设置有:用于播放语音的语音播放模块、用于对所播放的接收语音进行录音的语音录音模块、以及用于将语音播放模块所播放的待发送语音编码后予以发送至仿真网络及将接收的来自仿真网络的语音解码后提供给语音播放模块的语音传输模块;
[0008]第一设备控制模块,用于对与第一通信设备的播放及录音相关的参数进行配置;[0009]第二设备控制模块,用于对与第二通信设备的播放及录音相关的参数进行配置;
[0010]网络仿真模块,用于基于所设置的相关网络参数来构建无损仿真网络及有损仿真网络;
[0011]时间同步模块,用于使第一通信设备及第二通信设备的时间同步;
[0012]交互音频质量评价模块,用于基于第一通信设备及第二通信设备各自的语音录音模块所录制的语音进行评测来确定经过网络传输后受到网络损伤的语音文件的用户体验
质量。
[0013]优选地,所述语音播放模炔基于Windows Media Player软件来构建。
[0014]优选地,所述网络仿真模炔基于NIST Net软件来构建。
[0015]优选地,所述第一设备控制模块及第二设备控制模块均基于PowerMixer软件来构建。
[0016]优选地,所述语音传输模炔基于Openphone软件来构建。
[0017]本发明还提供一种基于QoS的交互音频体验质量评测方法,其至少包括:
[0018]基于所设置的相关网络参数来启动无损仿真网络及有损仿真网络;
[0019]对第一通信设备及第二通信设备的播放及录音相关的参数进行配置,以达到无损条件下的语音质量的最优效果;
[0020]使第一通信设备及第二通信设备的时间同步;
[0021]A)第一通信设备及第二通信设备通过仿真网络建立语音链接,并相互传送语音信息,双方各自将来自另一方的语音予以播放并录音;
[0022]B)基于第一通信设备及第二通信设备各自录制的来自无损仿真网络的语音及来自有损仿真网络的语音进行评测来确定经过网络传输后受到网络损伤的语音文件的用户体验质量。
[0023]优选地,采用二分法对第一通信设备及第二通信设备的播放及录音相关的参数进行配置,以达到无损条件下的语音质量的最优效果。
[0024]优选地,在所述步骤A)中,一通信设备播放语音的同时,另一通信设备开始录音,并在播放结束后间隔预定时间再次播放,直至播放预定次数。
[0025]优选地,基于嵌套循环法来设置相关网络参数。
[0026]优选地,所述步骤B)包括:
[0027]BI)使用ITUT P.862PESQ来对第一通信设备及第二通信设备各自录制的来自无损仿真网络的语音及来自有损仿真网络的语音进行评测,以获得无时延损伤的PESQM0S值;
[0028]B2)将PESQM0S值转化为ITU-T P.800M0S值;更为优选地,基于以下公式来将PESQMOS 值转化为 ITU-T P.800M0S 值;
(1.0, λ- < 1.7
[0029]y —、丨 O 】5726g r; + 丨 386609.V- — 2.504699义 + 2.023345,.V > 1.7
kS
[0030]其中,X为 PESQMOS 值、y 为 MOS 值;
[0031]B3)通过E-model中时延模型,将时延对交互音频的损伤引入M0S,进而获得QoS参数与交互音频体验质量的关系;更为优选地,所述步骤B3)包括:[0032]B31)基于 R = 3.026M0S3_25.314M0S2+87.060M0S-57.336,将 MOS 转换为 R ;
[0033]B32)根据R = Rtl-1d-1p-1j,获得Id=O时抖动及丢包造成的网络损伤Ιρ+Ι」,其中R0=93.2 ;
[0034]B33)基于时延简化模型 Id = 0.024d+0.11 (d_177.3)H(d_177.3)、R = R0-1d-1p-1j以及M0S=l+0.035R+R(R-60) (100-R)*7*1(T6获得交互音频体验质量MOSCQO ;其中,d为时延,当 d>177.3 时,H(d-177.3)=1,否则,H(d_177.3)=0 ;
[0035]B34)基于MOSCQO值,分析不同的QoS参数设定情况下语音MOS值的变化情况。
[0036]如上所述,本发明的基于QoS的交互音频体验质量评测平台及评测方法,具有以下有益效果:与现有的传统模拟系统相比,本发明通过还原交互音频应用的通信过程来确保模拟系统的真实性,基于客观评价以确保其具有很好的稳定性及准确性、优秀的逻辑控制可确保模拟系统的可重复性及稳定性。
【专利附图】

【附图说明】
[0037]图1显示为本发明的基于QoS的交互音频体验质量评测平台示意图。
[0038]图2显示为本发明的本发明的基于NIST Net软件模拟延迟为100ms、抖动为IOms的效果图。
[0039]图3显示为本发明的基于QoS的交互音频体验质量评测平台的时间同步模块的时间同步示意图。
[0040]图4显示为本发明的基于QoS的交互音频体验质量评测方法的流程图。
[0041]图5显示为G711编码时抖动(Jitter)、丢包(Drop)对语音质量MOS值的影响示意图。
[0042]图6显示为G729a编码时抖动(Jitter)、丢包(Drop)对语音质量MOS值的影响示意图。
[0043]图7显示为G711编码时抖动(Jitter)、时延(Delay)对语音质量MOS值的影响示意图。
[0044]图8显示为G729a编码时抖动(Jitter)、时延(Delay)对语音质量MOS值的影响示意图。
[0045]图9显示为G711编码时丢包(Drop)、时延(Delay)对语音质量MOS值的影响示意图。
[0046]图10显示为G729a编码时丢包(Drop)、时延(Delay)对语音质量MOS值的影响示意图。
[0047]元件标号说明
[0048]I交互音频体验质量评测平台
II第一通信设备
12第二通信设备
13第一设备控制模块
14第设备控制模块
15网络仿真模块
16时间同步模块
17交互音频质量评价模块
S1-S14 步骤
【具体实施方式】
[0049]以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的【具体实施方式】加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
[0050]请参阅图1至图10。需要说明的是,本实施例中所提供的图示仅以示意方式说明本发明的基本构想, 遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
[0051]如图1所示,本发明提供一种基于QoS的交互音频体验质量评测平台。所述交互音频体验质量评测平台I至少包括:第一通信设备11、第二通信设备12、第一设备控制模块
13、第二设备控制模块14、网络仿真模块15、时间同步模块16、以及交互音频质量评价模块17。
[0052]所述第一通信设备11与第二通信设备12为用于进行VoIP语音通信的设备。其中,所述第一通信设备11及第二通信设备12中均设置有:语音播放模块、语音录音模块以及语音传输模块。
[0053]所述语音播放模块用于播放待发送的语音以及接收的语音。优选地,所述语音播放模炔基于Windows Media Player软件来构建。其中,Windows Media Player软件是微软公司的一款免费播放器,操作简单,可获得性极好,支持通过插件增强功能,可支持播放MP3、WMA、WAV等格式的文件。
[0054]所述语音录音模块用于对所播放的接收语音进行录音。
[0055]所述语音传输模块用于将语音播放模块所播放的待发送语音编码后予以发送至仿真网络及将接收的来自仿真网络的语音解码后提供给语音播放模块进行播放。优选地,所述语音传输模炔基于Open phone软件来构建。其中,Open phone软件主要用于网络传输语音数据,在该软件中,可以设置传输协议、分组大小、抗抖动缓冲、播放缓冲等参数,Openphone软件需安装于通信设备。[0056]所述第一设备控制模块13对与第一通信设备11的播放及录音相关的参数进行配置。优选地,所述第一设备控制模块13基于PowerMixer软件来构建。其中,Power mixer软件可对第一通信设备的波形、音量、录音方式进行精确控制。Power mixer软件是一款用于Windows操作系统的带有音量控制复位的音频混音器软件。该软件包括音频混音器、屏幕显示、命令行支持,通过鼠标或者系统范围热键存储和记忆设定功能。
[0057]所述第二设备控制模块14对与第二通信设备12的播放及录音相关的参数进行配置。优选地,所述第二设备控制模块14也基于PowerMixer软件来构建。其中,该Powermixer软件可对第二通信设备的波形、音量、录音方式进行精确控制。
[0058]所述网络仿真模块15基于所设置的相关网络参数来构建无损仿真网络及有损仿真网络,优选地,其基于NIST Net软件来构建。
[0059]具体地,先在NIST Net软件中设定QoS参数,并启动;随后通过调整NIST Net软件的各项参数,来实现对网络延迟、抖动和丢包特性变化情况的模拟。图2为NIST Net软件中设置的延迟为100ms、抖动为IOms后获得的模拟效果图。NIST Net软件是一款基于Linux系统能够动态实时仿真IP网络环境的开源工具,可实现端到端网络中那些关键性能,例如延迟、抖动、丢包等多种复杂的网络环境的模拟。
[0060]所述时间同步模块16使第一通信设备11及第二通信设备12的时间同步。
[0061]具体地,第一通信设备11及第二通信设备12在DOS命令行模式下进行时钟同步;如图3所示,第一通信设备11向第二通信设备12发送请求时间同步的请求,第二通信设备12确认并返回标准时间,随后,第一通信设备11调节时间来第二通信设备12进行时间同步,并返回完成时间同步的确认信号。
[0062]所述交互音频质量评价模块17基于第一通信设备及第二通信设备各自的语音录音模块所录制的语音进行评测来确定经过网络传输后受到网络损伤的语音文件的用户体
验质量。
[0063]上述交互音频体验质量评测平台I的工作过程如图4所示:
[0064]在步骤SI中,网络仿真模块15基于所设置的相关网络参数构建出无损仿真网络。
[0065]优选地,基于嵌套循环法来设置相关网络参数。
[0066]具体地,若每一种仿真网络环境下语音采样次数为n,所述预定间隔时间为Tl,则在η*Τ1时间间隔后,基于后一相关网络参数来启动相应的仿真网络。
[0067]例如,若在无损仿真网络,第一通信设备的语音录音模块录音次数为η,预定间隔时间为Tl,则在η*Τ1时间间隔后,网络仿真模块15基于所设置的相关网络参数构建出有损仿真网络。
[0068]在步骤S2中,第一设备控制模块13对第一通信设备11的波形、音量、录音音量进行精确控制,以达到无损条件下的语音质量的最优效果;第二设备控制模块14对第二通信设备12的波形、音量、录音音量进行精确控制,以达到无损条件下的语音质量的最优效果。
[0069]具体地,PowerMixer软件对波形、音量、录音音量这三个影响听音效果的参数做如下调试,先使其中两个参数为定值,调节另一参数,保存并评价录音,以确定该参数的最优值,随后再调节其他参数,由此来确定3个参数的最优值。由于录音质量在各参数上的分布模型均符合递增至最优值再递减的模型,故可采用二分法对第一通信设备11及第二通信设备12的播放及录音相关的参数进行配置,以达到无损条件下的语音质量的最优效果。[0070]在步骤S3中,时间同步模块16使第一通信设备11与第二通信设备12的时间同步,具体参见图3所示。
[0071]在步骤S4中,第一通信设备11的语音传输模块通过无损仿真网络向第二通信设备12发送请求建立语音通信的链接请求,并在第二通信设备12的语音传输模块回应后,形成第一通信设备11与第二通信设备12的语音链接。需要说明的是,建立语音通信的链接请求也可由第二通信设备12的语音传输模块发送。
[0072]在步骤S5中,第一通信设备11的语音播放模块定时播放音频源文件,产生模拟信号,模拟通话过程中的用户的发音行为。
[0073]具体地,第一通信设备11的语音播放模炔基于设置的起始播放时间T0、循环播放的时间间隔Tl以及循环播放次数n,在时间为TO时开始播放音频源文件,并在间隔时间Tl后再次播放,直至播放η次为止。
[0074]在步骤S6中,第一通信设备11的语音传输模块将每一次的模拟信号编码并打包成语音数据包通过所述无损仿真网络发送至第二通信设备12。
[0075]在步骤S7中,第二通信设备12的语音传输模块将每一次接收的语音数据包解码后送入第二通信设备12的语音播放模块播放,同时第二通信设备12的语音录音模块定时将每一次播放的音频信号均保存成参考文件。
[0076]具体地,由于经过时间同步模块的时间同步,故第二通信设备12的语音传输模块分别在时间TO、T0+T1、……TO+ (n-l)Tl接收到来自第一通信设备11的语音数据包,第二通信设备12的语音传输模块将每一次接收的语音数据包解码后送入第二通信设备12的语音播放模块播放,同时第二通信设备12的语音录音模块则分别在时间TO、T0+T1、……TO+ (n-l)Tl开始录音,并在语音播放模块每一次播放完毕后停止录音。
[0077]其中,第二通信设备12的语音录音模块通过直接访问媒体控制接口(MediaControl Interface,MCI)发送相应的命令来实现实时的录音程序的开启与关闭;主要录制过程是从声卡提取语音信号,形成录音文件。
[0078]在步骤S8中,网络仿真模块15基于所设置的相关网络参数构建出有损仿真网络。
[0079]在步骤S9中,时间同步模块16再次使第一通信设备11与第二通信设备12的时间同步。
[0080]在步骤SlO中,第二通信设备12的语音传输模块通过有损仿真网络向第一通信设备11发送请求建立语音通信的链接请求,并在第一通信设备11的语音传输模块回应后,形成第一通信设备11与第二通信设备12的语音链接。需要说明的是,建立语音通信的链接请求也可由第一通信设备11的语音传输模块发送。
[0081]在步骤Sll中,第二通信设备12的语音播放模块定时播放音频源文件,产生模拟信号,模拟通话过程中的用户的发音行为。
[0082]具体地,第二通信设备12的语音播放模炔基于设置的起始播放时间T0’、循环播放的时间间隔Tl’以及循环播放次数η’,在时间为Τ0’时开始播放音频源文件,并在间隔时间Tl’后再次播放,直至播放η’次为止。
[0083]在步骤S12中,第二通信设备12的语音传输模块将每一次的模拟信号编码并打包成语音数据包通过所述有损仿真网络发送至第一通信设备11。
[0084]在步骤S13中,第一通信设备11的语音传输模块将每一次接收的语音数据包解码后送入第一通信设备11的语音播放模块播放,同时第一通信设备11的语音录音模块定时将每一次播放的音频信号均保存成测试文件。
[0085]具体地,由于经过时间同步模块的时间同步,故第一通信设备11的语音传输模块分别在时间Τ0’、Τ0’ +Tl’、……ΤΟ’ + (η’-1) Tl’接收到来自第二通信设备12的语音数据包,第一通信设备11的语音传输模块将每一次接收的语音数据包解码后送入第一通信设备11的语音播放模块播放,同时第一通信设备11的语音录音模块则分别在时间Τ0’、TO’ +Tl’、……TO’ + (η’ -1) Tl’开始录音,并在语音播放模块每一次播放完毕后停止录
曰?
[0086]其中,第一通信设备11的语音录音模块通过直接访问媒体控制接口(MediaControl Interface,MCI)发送相应的命令来实现实时的录音程序的开启与关闭;主要录制过程是从声卡提取语音信号,形成录音文件。
[0087]在步骤S14中,交互音频质量评价模块17基于第一通信设备11及第二通信设备12各自录制的来自无损仿真网络的语音及来自有损仿真网络的语音进行评测来确定经过网络传输后受到网络损伤的语音文件的用户体验质量。
[0088]具体地,首先,使用ITUT P.862PESQ来对第一通信设备及第二通信设备的参考文件及测试文件进行评测,以获得无时延损伤的PESQM0S值。
[0089]接着,将PESQM0S 值转化为 ITU-T P.800M0S 值。
[0090]例如,可基于以下公式来将PESQM0S值转化为ITU-T P.800M0S值;
[0091]
【权利要求】
1.一种基于QoS的交互音频体验质量评测平台,其特征在于,所述基于QoS的交互音频体验质量评测平台至少包括: 用于进行VoIP语音通信的第一通信设备及第二通信设备,所述第一通信设备及第二通信设备中均设置有:用于播放语音的语音播放模块、用于对所播放的接收语音进行录音的语音录音模块、以及用于将语音播放模块所播放的待发送语音编码后予以发送至仿真网络及将接收的来自仿真网络的语音解码后提供给语音播放模块的语音传输模块; 第一设备控制模块,用于对与第一通信设备的播放及录音相关的参数进行配置; 第二设备控制模块,用于对与第二通信设备的播放及录音相关的参数进行配置; 网络仿真模块,用于基于所设置的相关网络参数来构建无损仿真网络及有损仿真网络; 时间同步模块,用于使第一通信设备及第二通信设备的时间同步; 交互音频质量评价模块,用于基于第一通信设备及第二通信设备各自的语音录音模块所录制的语音进行评测来确定经过网络传输后受到网络损伤的语音文件的用户体验质量。
2.根据权利要求1所述的基于QoS的交互音频体验质量评测平台,其特征在于:所述语音播放模炔基于Windows Media Player软件来构建。
3.根据权利要求1所述的基于QoS的交互音频体验质量评测平台,其特征在于:所述网络仿真模炔基于NIST Net软件来构建。
4.根据权利要求1所述的基于QoS的交互音频体验质量评测平台,其特征在于:所述第一设备控制模块及第二设备控制模块均基于PowerMixer软件来构建。
5.根据权利要求1所述的基于QoS的交互音频体验质量评测平台,其特征在于:所述语音传输模炔基于Openphone软件来构建。
6.一种基于QoS的交互音频体验质量评测方法,其特征在于,所述基于QoS的交互音频体验质量评测方法至少包括: 基于所设置的相关网络参数来启动无损仿真网络及有损仿真网络; 对第一通信设备及第二通信设备的播放及录音相关的参数进行配置,以达到无损条件下的语音质量的最优效果; 使第一通信设备及第二通信设备的时间同步; A)第一通信设备及第二通信设备通过仿真网络建立语音链接,并相互传送语音信息,双方各自将来自另一方的语音予以播放并录音; B)基于第一通信设备及第二通信设备各自录制的来自无损仿真网络的语音及来自有损仿真网络的语音进行评测来确定经过网络传输后受到网络损伤的语音文件的用户体验质量。
7.根据权利要求6所述的基于QoS的交互音频体验质量评测方法,其特征在于:采用二分法对第一通信设备及第二通信设备的播放及录音相关的参数进行配置,以达到无损条件下的语音质量的最优效果。
8.根据权利要求6所述的基于QoS的交互音频体验质量评测方法,其特征在于,在所述步骤A)中,一通信设备播放语音的同时,另一通信设备开始录音,并在播放结束后间隔预定时间再次播放,直至播放预定次数。
9.根据权利要求8所述的基于QoS的交互音频体验质量评测方法,其特征在于:基于嵌套循环法来设置相关网络参数。
10.根据权利要求6所述的基于QoS的交互音频体验质量评测方法,其特征在于,所述步骤B)包括: BI)使用ITUT P.862PESQ来对第一通信设备及第二通信设备各自录制的来自无损仿真网络的语音及来自有损仿真网络的语音进行评测,以获得无时延损伤的PESQM0S值; B2)将 PESQM0S 值转化为 ITU-T P.800M0S 值; B3)通过E-model中时延模型,将时延对交互音频的损伤引入M0S,进而获得QoS参数与交互音频体验质量的关系。
11.根据权利要求10所述的基于QoS的交互音频体验质量评测方法,其特征在于:基于以下公式来将PESQM0S值转化为ITU-T P.800M0S值;
12.根据权利要求10所述的基于QoS的交互音频体验质量评测方法,其特征在于,所述步骤B3)包括:
B31)基于 R = 3.026M0S3-25.314M0S2+87.060M0S-57.336,将 MOS 转换为 R ; B32)根据R = R0-1d-1p-1j,获得Id=O时抖动及丢包造成的网络损伤Ιρ+Ι」,其中R0=93.2 ;
B33)基于时延简化模型 Id = 0.024d+0.11 (d_177.3)H(d_177.3)、R = Rtl-1d-1p-1j 以及M0S=l+0.035R+R(R-60) (100-R) *7*10-6获得交互音频体验质量MOSCQO ;其中,d为时延,当 d>177.3 时,H(d-177.3)=1,否则,H(d_177.3)=0 ; B34)基于MOSCQO值,分析不同的QoS参数设定情况下语音MOS值的变化情况。
【文档编号】H04M7/00GK103841275SQ201310314980
【公开日】2014年6月4日 申请日期:2013年7月24日 优先权日:2013年7月24日
【发明者】张大陆, 陈志伟 申请人:同济大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1