流媒体直播系统启动时延方法

文档序号：7993264阅读：225来源：国知局

专利名称：流媒体直播系统启动时延方法
技术领域：
本发明主要涉及互联网的流媒体直播系统，主要考虑互联网流媒体直播系统客户端的启动时延问题。
背景技术：
本课题得到教育部新世纪优秀人才支持计划资助项目(项目号NCET-09-0709)、国家自然科学基金项目(项目号60970127)和教育部科学技术研究重点项目(项目号 109029)的支持。进入21世纪，互联网已经成为人们获取信息的主要媒介之一。由于网络本身架构、关键技术的欠缺，以及对多媒体内容处理技术的不成熟，早期的互联网大多只能传递文字、图片等静态信息，随着个人计算机性能的提升、多媒体技术的发展以及互联网的快速崛起，人们通过互联网提高学习、工作以及娱乐的质量的需求日益增大，因此获取网络上海量音视频等多媒体信息出现了新的模式——流媒体技术。简单而言，流媒体就是指用户通过网络一边下载并一边观看多媒体节目的一种服务方式。流媒体应用的一个最大的好处是用户不需要花费很长时间将视频文件完整下载到本地后才能播放，而仅需缓存空间数秒后就可以开始播放，后面收到的数据会源源不断输入到该缓存空间，从而维持播放的连续性。虽然流媒体技术的应用越来越广泛，目前的网络带宽和速度，还无法完全发挥流媒体技术优势，我们知道，流媒体在传输前，要将一个实时音视频源文件编码为许多的数据包，而数据包由于受网络状况影响可能会无法到达目标节点，形成网络层的丢包。目标节点由于缺少连贯的数据包从而播放出现中断。高质量的流媒体应用需要很小的丢包率，以尽可能的减少流媒体的播放中断次数，保护用户的感官体验，然而流媒体作为终端应用技术是无法达到降低网络丢包率的作用的，以至于较差的网络状况和其他因素会导致在终端的播放过程中频繁的发生中断。目前，市场上成熟的流媒体直播系统往往使用传统的启动时延策略，而这往往难以很好满足视频直播系统的内容实时性和时间同步性。传统流媒体启动时延策略是在缓存区中达到固定数量的数据包亦或是缓冲固定时间然后开始播放，这样在网络状况好的时候无法到达用户尽快播放的心理需求，在网络状况差的时候则会造成频繁的中断。由此可见，启动时延策略的好坏对于流媒体直播系统的播放质量有着很大的影响。本文通过向流媒体技术引入动态启动时延策略以达到在终端降低播放中断频率，尽量保证平滑播放，保护用户的感官体验的效果。本发明所提出的三种动态启动时延策略就属于以用户体验QoE为中心的容错控制策略。QoE即Quality of Experience是通信领域的概念。它可以理解为用户体验或者用户感知，即终端用户对移动网络提供的业务性能的主观感受。它可以通过接近量化的方法来表示终端用户对业务与网络的体验和感受，并反映当前业务和网络的质量与用户期望间的差距。QoE管理是衡量一个网络和业务品质的最根本的标准在于用户的体验质量，它主要指的是用户对于网络的满意度。它定义为一个应用或业务的总体可接受性，是终端用户的主观感受。

发明内容
本发明不考虑网络中的各种因素，通过根据终端的连接速率、中断情况等因素动态控制启动时延的大小，保证用户体验质量。传统的启动时延策略是当缓存中接收到预设数量的数据包时就开始进行播放，这样做的缺点是无法自适应不断变化的网络状况。本发明提出的三种启动时延策略如下1)根据播放中断密度动态启动时延策略中断密度定义为pi= n/T，n表示播放中断的次数，T表示整个媒体流的时间长度。由于直播系统媒体流的播放时间长度理论上是无限大的，即T里面包含了无限个时间长度为N的时段，所以整个媒体流的中断密度等价为一个时段内的中断密度pw = η/Ν。当在某个长度为N的时间段内，如果没有达到η次播放中断，则保持启动时延的最小值，但不动态增加；如果达到η次播放中断，则动态增加启动时延，动态增加启动时延到最大值；调整过启动时延后，如果在长度为N的时间段内没有再达到η次播放中断，就将启动时延恢复到最小值。上述最小值、最大值均为经验值。其中最小值为流媒体系统单位缓存值(因不同系统有不同的缓存值)的5至10倍；最大值为刘媒体系统单位缓存值的20 至30倍；2)根据网络状况动态启动时延策略此处网络状况的优劣，是通过比较长度为N的时段内播放终端的数据包接收速率 a与播放速率b的大小来衡量的；如果接收速率a持续大于等于播放速率b，就将启动时延调整为最小值；如果接收速率a持续小于播放速率b，则动态增加启动时延；增加启动时延到最大值；调整过启动时延后，如果在长度为N的时间段内如果接收速率a持续大于等于播放速率b，就将启动时延恢复到最小值。上述最小值、最大值均为经验值。其中最小值为流媒体系统单位缓存值(因不同系统有不同的缓存值)的5至10倍；最大值为刘媒体系统单位缓存值的20至30倍。3)混合型动态启动时延策略通过不断统计终端的接收速率，以判断下一时刻启动时延的大小。在长度为N的时段内，如果接收速率持续大于等于播放速率，则维持启动时延的最小值；当接收速率持续小于等于播放速率时，则判断长度为N的时段内的中断次数，如果未达到η次播放中断，则将启动时延固定在最小值；如果达到η次播放中断，则动态增加启动时延至最大值。上述最小值、最大值均为经验值。其中最小值为流媒体系统单位缓存值(因不同系统有不同的缓存值)的5至10倍；最大值为流媒体系统单位缓存值的20至30倍。一般的，最小值、最大值均为经验值，分别是163840Byte、3932160Byte。具体原理如下1)根据播放中断密度动态启动时延策略根据播放中断密度动态调整启动时延，以达到在终端减少播放中断次数的目的。流媒体播放需要维持较小中断频率以达到较好的播放效果。中断频率定义为Pi = η/τ，η表示播放中断的次数，T则代表整个媒体流的时间长度，T里面包含了 N个时段。由于直播系统所播放的媒体流的时间长度理论上是无限大的，所以中断频率可以等价为一个时段内中断的密度PW = η/Ν。当在时间段N内如果没有达到η次播放中断，则保持最小的启动时延以达到尽快播放；当发生第一次中断时，启动时延回复到初始值，但不动态增加，如果到达了 η次播放中断，则动态增加启动时延，以缓解由于网络问题无法缓冲足够数据包维持下一时刻播放而导致的频繁中断的情况，达到减少播放中断次数的目的；调整过启动时延后，如果较长一段时间内没有再次达到中断频率，说明网络状况已恢复到满足流媒体传输的状态，这时将启动时延恢复到最小预设状态，以达到尽快播放。2)根据网络状况动态启动时延策略根据在不同网络状况下到达中断的数据包的个数动态调整启动时延，已达到在中断减少播放中断次数的目的。在这里的根据网络状况并不是主动去探测网络带宽的行为，那样将违背以终端为中心的目的，这里所提到的网络状况是根据在单位时间内统计终端是否接收到足够数据包(接受速率a)满足播放速率b来动态调整启动时延，当网络状况差时接受速率可能会下降，当网络状况好时接受速率基本等于播放速率。当接受速率a近似等于播放速率b时，我们认为网络状况足够好以保证尽快播放，所以将启动时延动态调整为当前接受速率下的最小状态；当一段时间内，接受速率a—直小于播放速率b时，说明网络状况下降(一段时间内避免了网络抖动时计算出接收速率小的情况)，这时将极有可能在下一时刻发生中断，所以将启动时延进行调整以应对将要发生的中断。具体的调整策略实现为以秒为单位，每一秒都比对接收速率与播放速率的状态加以统计，当接收速率小于播放速率的状况维持一段时间时，则认为这段时间网络状况无法满足传输流媒体，将会在未来较近的时刻发生中断，这时将动态增加启动时延，以缓冲足够的数据包维持下一时刻的播放；当接收速率大于或等于播放速率的状况维持一段时间时，说明网络状况已恢复到足够满足流媒体传输的状态，则动态恢复启动时延为最小状态。在此策略中，启动时延始终根据接收速率主动进行调整，其与中断密度控制策略的主要区别是中断密度控制策略是被动的根据中断密度来调整启动时延，而该策略则是主动探测数据包的接受速率以自适应网络状况，并不一定在下一时刻会发生中断。3)混合型动态启动时延策略根据网络状况动态调整启动时延策略可以主动根据网络状况对下一时刻的缓冲时间进行调整，以应对未来将要发生的播放中断，他可以有效的使节点自适应网络条件，极大减少中断次数。但是这种策略也存在着一些不足，主要表现在当较长时间网络状况持续不佳的情况下，启动时延会累加到一个很大的值，用户必须等待很长一段时间才能进行播放，严重影响用户体验。因此，混合型动态启动时延策略营运而生，它是将以上两种策略在一定程度上相结合的产物。当发生播放中断时，将根据当前统计的接受速率以及这段时间所发生中断的密度加权计算出启动时延的大小并加以实施。具体策略实现为通过不断统计终端的接受速率，以判断下一时刻启动时延的大小，如果一段时间内接收速率近似等于播放速率，则维持最小的启动时延；当接收速率小于播放速率时，首先判断最近一段时间内的中断密度，如果小于预设值，则将启动时延变更为满足下一时刻播放的数据包个数；如果大于预设的中断密度值，则动态增加启动时延。这样就可以即主动对启动时延进行调整，对于频繁发生中断的情况作出相应，又可以避免无限制增长所造成的过长的启动时延。

附图1是实验一中在节点上运行部署根据中断密度调整启动时延的策略的客户端后，根据中断密度控制策略客户端启动时延包个数与中断间隔随时间变化部分曲线。附图Ia为根据中断密度控制策略客户端启动时延包个数，附图Ib为根据中断密度控制策略客户端中断间隔随时间变化部分曲线。从附图1中可以看到，当中断间隔小于10秒时，启动时延包个数Martup会不断增加，当中断间隔大于10秒时，则启动时延恢复到初始值。因此从统计结果我们可以看到，所编写的代码已经实现了根据中断密度调整启动时延客户端基本的功能。并且，在1030秒的实验时间内，部署了中断密度启动时延的客户端共出现了 112次中断，中断密度为0.11，符合设计预期。附图2是实验一中在节点上运行部署根据网络状况调整启动时延的策略的客户端后，根据网络状况控制策略客户端启动时延包个数与网络状况不佳累积时间随时间变化部分曲线。附图加是服务器端与客户端之间的网络状况图，附图2b是网络抖动图，附图2c 是根据网络状况控制策略客户端启动时延包个数。在图2中，网络抖动为接收速率与播放速率的差值。当网络状况好时，差值基本维持在0附近；当网络状况不佳时，差值会变为负值，启动时延包个数Martup会随着差值不断变化，由于持续的网络状况不佳，所以导致启动时延包个数Martup达到了设置的上限(上限设置为M0，以避免缓冲数据溢出缓存覆盖数据)，所以后面即使网络状况依然不好，Martup也不再增加。所以从统计结果我们可以看到，所编写的代码还是已经实现了根据网络状况调整启动时延客户端基本的功能。附图3是实验一中在节点上运行部署混合启动时延策略的客户端后的实验结果测量曲线。附图3a是服务器端到客户端的网络状况图，附图北是网络抖动图，附图3c是中断间隔随时间变化部分曲线，附图3d是混合控制策略客户端启动时延包个数。从图3中我们可以看到，当网络状况不佳时，会根据此时刻中断间隔的大小来判断是否增加启动时延包个数Martup，当中断间隔小于10秒时，Startup会不断增加；当中断间隔大于10秒时，则将Martup固定为20个包。由于持续的网络状况不佳，所以无法看到Martup由于网络状况变好而恢复默认值，但是通过中断间隔的判断，即使在网络状况持续不好的情况下也不会一直增加Martup，很好的改善了网络状况调整启动时延客户端始终保持较大启动时延的情况。因此从统计结果我们可以看到，所编写的代码已经实现了混合启动时延策略客户端基本的功能。附图4是实验二中不同启动时延策略下中断随时间变化曲线。从图中可以看出，三种启动时延策略相比没有使用策略的情况下，都很好的降低了中断的次数，其中，而四条曲线稳定的斜率很好的表现出在相同网络环境下不同策略的变化趋势，根据中断密度调整启动时延策略降低中断次数的程度相对较低，而根据网络状况调整启动时延策略总体中断次数最少，减少中断能力最强，混合启动时延策略则趋于另外两种策略之间，这些都符合我们设计的预期情况。附图5是实验二不同启动时延策略下启动时延随时间的变化。总体上，启动时延的大小大致呈现为根据网络状况调整启动时延策略>混合启动时延策略>根据中断密度调整启动时延策略 >不使用启动时延策略。由附图6(时间刻度缩小到100秒的局部数据) 以及附图7(平均启动时延)可以看出，由于没有部署任何启动时延策略客户端的启动时延始终保持在很低的时间，这样在网络状况好的情况下会表现出很好的实时性，但是当网络
6状况的持续不佳(如附图8所示，0. 5-2Mb切不断抖动的带宽状况已经无法满足4条编码率为^Slcbps的流媒体以及一条Iperf带宽监测流)，则会带来频繁的中断。而部署了启动时延的三个改进后的客户端则不同程度的动态调整了启动时延，其中根据中断密度调整启动时延策略的客户端由于是被动监测中断情况来调整启动时延，所以时延并未增加太大；由于网络状况的持续不佳，根据网络状况调整启动时延策略的客户端监测到的节点接收速率会持续不满足播放速率，所以会不断的增加启动时延，从而导致启动时延在某些时间段变的巨大；而混合启动时延策略由于融合了另外两种策略，即使在网络状况不佳的情况下，由于考虑到中断密度是否符合调整要求，所以启动时延的增加程度相对适中，大部分维持在另外两种策略的中间。附图6是实验二中不同启动时延策略下启动时延随时间变化的部分曲线。附图7是实验二中整段实验时间内各实验用客户端的平均启动时延。附图8是实验二中服务器到节点的带宽状况随时间的变化。附图9是实验二中不同启动时延策略下缓存中数据包个数随时间变化部分曲线。由于频繁的中断表示缓存中长时间的出现无数据包可读的情况，会导致长时间缓存利用率过低。附图9为缓存中数据包个数随时间变化的部分曲线，从中我们可以看到，由于没有部署启动时延策略，客户端的缓存中数据包个数始终维持在一个很低的状况，而部署了根据中断密度调整启动时延策略和混合启动时延策略的客户端缓存中数据包个数虽然有所增长，但大部分时间缓存利用率也未过半，而部署了根据网络状况调整启动时延策略的客户端在网络状况不佳的情况下，能够最大限度的利用缓存空间。附图10是实验二中不同启动时延策略下的平均缓存利用率。通过附图10我们进一步看到，在网络状况持续不佳时，根据网络状况调整启动时延策略的平均缓存利用率最高；根据中断密度和混合启动时延策略的平均缓存利用率则稍差些；而没有部署任何启动时延策略的原始客户端的平均缓存利用率最差。
具体实施例方式下面我们将通过实验来观察在流媒体直播系统中部署这三种启动时延算法的工作效果。在客户端上部署中断密度启动时延策略时，将中断密度控制阀值定位10秒，也就是说允许11秒钟内最多出现2次中断，中断密度控制为0. 18 ；在客户端上部署网络状况启动时延策略时，由于编码率随画面内容波动，所以我们将判断的播放速率锁定为每秒23个包，网络状况不佳持续时长设为2秒；在客户端上部署混合策略时，根据网络状况方面，播放速率锁定为每秒23个包，网络状况不佳持续时长设为1秒，而中断密度方面各项参数则与单独在客户端上部署中断密度启动时延策略时保持一致；所有实验用客户端默认的初始启动时延设为10个包，启动时延的增长步长也都设为10个包，而其他相关参数则如表1所示。我们将分别部署他们在实验所需的服务器与节点上。表4. 2. 1实验用各客户端所应用启动时延策略及缓存大小
权利要求
1.流媒体直播系统启动时延方法，其特征在于为以下三种启动时延策略之一1)根据播放中断密度动态启动时延策略中断密度定义为Pi = η/τ，η表示播放中断的次数，T表示整个媒体流的时间长度；由于直播系统媒体流的播放时间长度理论上是无限大的，即T里面包含了无限个时间长度为 N的时段，所以整个媒体流的中断密度等价为一个时段内的中断密度pw = η/Ν ；当在某个长度为N的时间段内，如果没有达到η次播放中断，则保持启动时延的最小值，但不动态增加；如果达到η次播放中断，则动态增加启动时延，动态增加启动时延到最大值；调整过启动时延后，如果在长度为N的时间段内没有再达到η次播放中断，就将启动时延恢复到最小值；其中最小值为流媒体系统单位缓存值的5至10倍；最大值为流媒体系统单位缓存值的20至30倍；2)根据网络状况动态启动时延策略此处网络状况的优劣，是通过比较长度为N的时段内播放终端的数据包接收速率a与播放速率b的大小来衡量的；如果接收速率a持续大于等于播放速率b，就将启动时延调整为最小值；如果接收速率 a持续小于播放速率b，则动态增加启动时延；增加启动时延到最大值；调整过启动时延后，如果在长度为N的时间段内如果接收速率a持续大于等于播放速率b，就将启动时延恢复到最小值；其中最小值为流媒体系统单位缓存值的5至10倍；最大值为流媒体系统单位缓存值的20至30倍；3)混合型动态启动时延策略通过不断统计终端的接收速率，以判断下一时刻启动时延的大小；在长度为N的时段内，如果接收速率持续大于等于播放速率，则维持启动时延的最小值；当接收速率持续小于等于播放速率时，则判断长度为N的时段内的中断次数，如果未达到η次播放中断，则将启动时延固定在最小值；如果达到η次播放中断，则动态增加启动时延至最大值；其中最小值为流媒体系统单位缓存值的5至10倍；最大值为流媒体系统单位缓存值的20至30倍。
全文摘要
流媒体直播系统启动时延算法涉及互联网的流媒体直播领域，关注于解决互联网流媒体直播系统客户端的启动时延问题。随着互联网多媒体技术的发展，互联网流媒体技术的应用越来越广泛，但是由于现在的网络带宽和速度的限制，流媒体技术的优势并不能完全发挥出来。本次发明提出了三种动态启动时延策略，分别是根据播放中断密度动态启动时延策略、根据网络状况动态启动时延策略和混合型动态启动时延策略。通过实验结果观察了在流媒体直播系统中部署这三种启动时延算法的工作效果及性能对比。本次发明通过向流媒体技术中加入动态启动时延策略达到在终端降低播放中断频率，保证平滑播放保护用户的感官体验的目的。
文档编号H04L29/06GK102413379SQ20111038911
公开日2012年4月11日申请日期2011年11月29日优先权日2011年11月29日
发明者楚晨, 颜金尧申请人:中国传媒大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：颜金尧;楚晨
技术所有人：中国传媒大学
我是此专利的发明人

上一篇：一种网络代理缓存加速的实现方法及其装置的制作方法
上一篇：无线网状网的接入认证方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。