在视频传输过程中动态优化视频质量的系统和方法与流程

文档序号:12600970阅读:199来源:国知局
在视频传输过程中动态优化视频质量的系统和方法与流程

本发明总体涉及通信网络,尤其涉及一种对经通信网络传输的视频的质量进行动态优化的系统和方法。



背景技术:

无线设备等移动数字设备在最近几年已变得无处不在,这些设备例如包括蜂窝电话、智能电话、膝上型电脑、笔记本电脑以及平板电脑。随着生活方式的演变、技术的提升以及社会经济行为的不断改变,人们正越来越多地随时随地使用此类数字设备实现相互间的语音和消息通信,消费各种数字内容,以及完成日常活动。这些功能已经成为我们日常生活中不可或缺的一部分。例如,在当今世界上,除了基本的语音传输之外,移动设备正越来越多地用于图像和视频的实时传输。人们通过视频电话/视频聊天工具与其最亲近的人保持联系。此外,其还用于其他多种多媒体服务,以实现多媒体内容串流等目的。

在实时视频传输中,视频质量起着至关重要的作用。在视频聊天、视频会议、板球比赛的实时串流等一些场景中,视频质量的下降令人极其厌烦。技术人员不断努力寻找新的方法来提高移动通信网络的速度和带宽,以保证视频等多媒体内容的高质量不间断串流。为了实现更快更好的移动宽带体验,移动通信技术从2G(速度可达15Kbps)快速逐代演化至2.5G(速度可达172Kbps)、3G(速度可达3.1Mbps)、3.5G(速度可达7.2Mbps)乃至最近的LTE或4G(速度可达21Mbps)。应当指出的是,频谱或频带是一种昂贵的资源,为了实现多服务多用户支持,此种资源必须得到有效利用。然而,在不牺牲服务质量的前提下,要想实现支持多种服务的可用带宽的最大化利用是 一项巨大的挑战。此外,虽然网络容量和速度正在不断增加且相关成本正在逐渐下降,但是网络上传递的数据量也在逐渐上升。



技术实现要素:

在一种实施方式中,本发明公开了一种对经通信网络传输的视频的质量进行动态优化的方法。在一个实施例中,所述方法包括:由一处理器获取所传输的视频的多个视频传输参数;由所述处理器利用元启发式和声搜索算法并根据所述视频的可接受质量的预设指标,推导出所述多个视频传输参数中的每个参数的最佳值;以及由所述处理器根据所述多个视频传输参数中的每个参数的最佳值,动态优化所述视频的质量。

在一种实施方式中,本发明还公开了一种对经通信网络传输的视频的质量进行动态优化的系统。在一个实施例中,所述系统包括:至少一个处理器;以及以可通信方式连接至所述至少一个处理器的存储器。所述存储器存有处理器可执行指令,所述指令在由所述至少一个处理器执行时使得该至少一个处理器执行操作,该操作包括:获取所传输的视频的多个视频传输参数;利用元启发式和声搜索算法并根据所述视频的可接受质量的预设指标,推导出所述多个视频传输参数中的每个参数的最佳值;以及根据所述多个视频传输参数中的每个参数的最佳值动态优化所述视频的质量。

应当理解的是,以上概略描述与以下详细描述均仅在于例示和说明,而不在于限制所要求保护的发明。

附图说明

所附各图并入本发明之内并构成本发明的一部分,用于对例示实施方式进行描述,并与说明书一道阐明所公开的原理。

图1为根据本发明一些实施方式对被传输视频的质量进行动态优化的例示广播系统的框图。

图2为根据本发明一些实施方式对被传输视频的质量进行动态优化的例 示单播系统的框图。

图3为根据本发明一些实施方式的视频处理单元的功能框图。

图4为根据本发明一些实施方式对经通信网络传输的视频的质量进行动态优化的例示方法的流程图。

图5A和图5B为根据本发明一些实施方式对被传输视频的质量进行动态优化的详细例示方法的流程图。

图6为用于实施符合本发明实施方式的例示计算机系统框图。

具体实施方式

以下,参考附图,对例示实施方式进行描述。在任何方便之处,各图中均采用相同附图标记指代相同或类似部件。虽然本文中描述了所公开原理的实施例和特征,但是在不脱离所公开实施方式的精神和范围的前提下,还可进行修改、调整以及做出其他实施方式。以下具体描述意在仅视作例示,而真正的范围及精神如下附权利要求书所述。

将视频流等多媒体流通过网络从源头传输至目的地的方法主要有两种:广播和单播。广播为源头与各目的地之间的“一对全部”通信。与此相反,单播为两个设备之间的一对一通信。所述两个设备中的每一个在发送多媒体流时作为所述源头,而在接收多媒体流时则成为所述目的地。现在参考图1和图2,该图所示为根据本发明一些实施方式的例示广播系统100和例示单播系统200。具体而言,广播系统100和单播系统200用于对实时传输视频的质量进行动态优化。

在广播系统100中,所述多媒体流从来源装置101经通信装置103广播至多个目的装置102。在一些实施方式中,来源装置101可以为具有摄像功能的装置,例如用于获取和发送原始视频的摄像机、数字相机、智能电话、膝上型电脑或平板电脑,或者用于发送原始视频的任何其他装置。类似地,目的装置102可以为用于接收广播视频的个人计算机、膝上型电脑、智能电话、平板电脑等监控站或记录服务器。在单播系统200中,装置201和202中的 每一个均通过通信装置203发送及接收所述多媒体流。装置201和202根据其是对原始视频进行发送或是对已发送视频进行接收,既可以为来源装置,也可以为目的装置。在一些实施方式中,装置201和202可以为摄像机、数字相机、智能电话、膝上型电脑、平板电脑、个人计算机或服务器。通信装置103和203可以为用于促进各种无线传输或接收技术的收发器。在一些实施方式中,所述各种无线传输或接收技术可以为2G、2.5G、3G、3.5G或4G通信技术。

此外,根据本发明的多个方面,广播系统100包括设于发送方一侧的视频处理单元104,该处理单元用于对实时传输视频的质量进行动态优化。视频处理单元104从来源装置101接收原始视频,根据可用带宽对该视频的质量进行优化,并将修改后的视频发送至通信装置103,以用于经网络进行后续传输。广播系统100还包括设于每个接收模块内的网络速度监测器105,该监测器用于对所述速度进行不间断监测以及向通信装置103提供发送方比特率(SBR)反馈。通信装置103将接收到的所述SBR反馈以及数据包错误率(PER)反馈一并提供至视频处理单元104。视频处理单元104利用所述SBR及PER反馈以及其他输入对所述原始视频进行修改。此外,根据本发明的多个方面,由于单播系统200的两端均可发送修改后的视频,因此单播系统200包括设于每一侧(即接收方一侧和发送方一侧)的视频处理单元204和网络速度监测器205。

正如以下将结合图3进一步详述的一样,视频处理单元104和204在对经所述通信网络实时传输过程中的视频质量进行优化的同时,还实现了该通信网络带宽的有效利用。本领域技术人员可以理解的是,视频的帧速率(FR)和发送方比特率(SBR)为表示该视频质量的主要参数。FR定义为视频播放时每一秒种所显示的帧数量或静止图像数量。换言之,每秒中所拍摄图像的数量称为视频的帧速率,表示为帧/秒(fps)。FR随运动画面中对象的运动速度而改变。FR的提高意味着运动图像中所捕获动作的增加,即所接收的视频质量的提高。降低帧速率往往会导致视频,尤其是快速运动镜头更加模糊。SBR定义为每一秒视频内所需显示的比特数。比特率为320kbps的视频比比 特率为150kbps的视频具有更小的压缩度和更高的质量。因此,增加SBR可提高视频质量。FR的升高可导致SBR的增大。因此,当FR和SBR增大时,视频质量即可提高。然而,当通过通信网络传输时,还需考虑数据包错误率(PER)。通常认为,视频中所考虑的所有数据包丢失均为按照均匀概率密度函数分布的随机丢失。这意味着所有数据包均具有相同的丢失概率。因此,当PER增加时,可导致接收端的视频质量下降。

为了优化视频质量,应该找出表示视频质量的指标或衡量参数。平均意见得分(mean opinion score,MOS)和峰值信噪比(peak signal to noise ratio,PSNR)为常用于定义或衡量视频质量的两个众所周知的参数。在本发明所描述的技术中,采用MOS作为视频质量的衡量参数或指标。然而,本领域技术人员可以理解的是,当采用任何其他参数(如PSNR)作为视频质量的衡量参数或指标时,上述技术仍同样可行。

上述技术采用MOS的目的在于根据FR、SBR和PER,保证待在接收端接收的视频质量在传输前处于可接受MOS标准(即可接受MOS范围)之内。所述可接受MOS范围可由网络运营商、接收视频的用户、发送视频的用户或者可使视频发送实现的第三方预先设定。所述MOS范围处于1(低质量)和5(高质量)之间,用于对视频质量进行评定。在一些实施方式中,所述可接受MOS范围为3~5。此外,在一些实施方式中,所述可接受MOS范围为3.5~4.5。MOS通过按视频的时空特性将视频分类为不同视频组(如轻微运动、慢步走动、快速运动等)的方式确定,表示为:

其中,如上所述,SBR为发送方比特率,FR为帧速率,PER为数据包错误率。此外,a1,a2,a3,a4和a5为MOS系数,表示视频与不同视频组的符合程度。如上式所示,MOS为FR、SBR和PER的函数。因此,增加FR可提高SBR,从而提高MOS。

视频处理单元104和204采用元启发式和声搜索算法(meta-heuristic harmony search algorithm)对所述视频质量进行优化,即对MOS以及SBR、FR和PER同时优化。所述和声搜索为一种在n阶方程的给定值范围内找出最大值或最小值的搜索技术。因此,通过调整不同参数,可以求出实现最佳质量所需的最佳视频比特率和帧速率值。视频处理单元104和204包括一个或多个处理器,以及计算机可读介质(如存储器)。所述计算机可读介质存有指令,该指令在由所述一个或多个处理器执行时使得该一个或多个处理器根据本发明的各个方面在实时传输过程中执行视频质量的动态优化。视频处理单元104和204可置于所述发送装置内,或者置于所述通信装置内,或者独立置于以可通信方式连接至所述通信装置的远隔装置上。

现在参考图3,该图为根据本发明一些实施方式与由图1广播网络100实现的视频处理单元104以及由图2广播网络200实现的视频处理单元204类似的视频处理单元300的功能框图。正如以下进一步详述的一样,视频处理单元300获取被传输视频的多个视频传输参数,利用元启发式和声搜索算法并根据所述视频的可接受质量的预设指标推导出所述多个视频传输参数中的每个参数的最佳值,并且根据所述多个视频传输参数中的每个参数的最佳值动态优化所述视频的质量。视频处理单元300包括各种用于优化视频质量的逻辑单元。在一些实施方式中,视频处理单元300包括帧速率(FR)及视频质量分析器301、帧速率(FR)比较器302、发送方比特率(SBR)比较器303、和声库(harmonic memory,HM)生成器304、和声库(HM)排序引擎305、HMCR及PAR调整模块306、新解模块307、改良和声库(HM)识别模块308以及视频转换器309。

FR及视频质量分析器301接收原始视频并提取该原始视频的FR(即初始FR)以及该原始视频的质量指标。在一些将MOS作为视频质量衡量参数或指标的实施方式中,FR及视频质量分析器301从所述原始视频中提取MOS系数(即a1,a2,a3,a4和a5)。FR比较器302将初始FR作为来自FR及视频质量分析器301的其中一个输入,并将已优化FR作为另一个输入,该已优化FR为反馈回的已优化FR的输出值。其后,FR比较器302对上述两个输入进行比较,并将较大值导入FRMax取值端,较小值导入FRMin取值端。随着系统 持续运行,上述两输入之间的差值以迭代方式递减,从而使得FRMax和FRMin(即和声库的FR范围)之间的差值也迭代递减。如此,便可从FR的可能取值范围中选出最佳或最优化FR。类似地,SBR比较器303将初始SBR作为来自所述网络速度监测器的其中一个输入,并将已优化SBR作为另一个输入,所述已优化SBR为反馈回的已优化SBR的输出值。其后,SBR比较器303对上述两个输入进行比较,并将较大值导入SBRMax取值端,较小值导入SBRMin取值端。同样地,随着系统持续运行,上述两输入之间的差值以迭代方式递减,从而使得SBRMax和SBRMin(即和声库的SBR范围)之间的差值也迭代递减。如此,便可从SBR的可能取值范围中选出最佳或最优化SBR。

在上述之外,还将可接受MOS范围(即MOSMax和MOSMin)提供至视频处理单元300,以用于视频质量优化。如上所述,所述可接受MOS范围可由网络运营商、或接收视频的用户、或发送视频的用户、或可使视频发送实现的第三方预先设定。类似地,还向视频处理单元300提供PER范围(即PERMax和PERMin)。所述PER范围可由网络运营商最初提供,并在后续根据所述网络的反馈而更新。此外,还可向视频处理单元300提供最大迭代次数,以用于视频质量优化。最终,进入优化器参与优化的为SBRMax、SBRMin、FRMax、FRMin、PERMax、PERMin、MOSMax、MOSMin以及最大迭代次数。

HM生成器304根据上述多个视频传输参数生成和声库(HM)。在一些实施方式中,所述HM导入为一个[5×HMS]矩阵,其中HMS表示HM的大小,数字5来自所述4个视频传输参数(即FR、SBR、PER和MOS)和1个适应度函数f(x)值的总个数。所述待优化适应度函数为所述4个视频传输参数的函数,且表示为:

f(x)=f(MOS,SBR,FR,PER)

具体而言,所述适应度函数f(x)表示为:

通过使用和声搜索算法对此适应度函数进行最小化,可求得SBR和FR 的最佳值,从而在使得用户体验到最佳视频质量的同时,还可实现信道带宽的最佳利用。如上所述,SBR和FR的增加可导致所述视频质量(即MOS)的提高。然而,实际期望的是,所求得的SBR和FR为可在不使视频质量受损的同时实现信道带宽高效利用的最佳组合。首先,使用均匀随机数对上述视频传输参数的最大和最小值进行随机调整。然后,使用逻辑子单元(即适应度函数计算器)对这些值进行处理,以获得上述f(x),从而获得完整的初始HM。

其后,使用HM排序引擎305对所述初始HM进行排序处理,以将所述HM按照适应度函数f(x)的值以最佳值至最差值的方式排序。所述最佳值表示最小f(x),而所述最差值表示最大f(x)。在将所述HM排序之后,使用HMCR及PAR调整模块306对已排序的HM进行调整,其中,通过和声库选择概率(harmony memory consideration rate,HMCR)和音调调节概率(pitch adjustment rate,PAR)中的至少一个对所述已排序HM进行调整。所述HMCR为从保存于所述HM中的历史值当中选择一个值的概率,而(1-HMCR)为随机选择一个不限于所述HM保存值的容许值的概率。例如,取值为0.95的HMCR表示所述和声搜索算法将以95%的概率从所述HM的历史保存值中选择所述设计变量值,而且以5%的概率从所述整个容许值范围内选择。此外,还对所述HM中的每个值进行检验,以确定是否应对其实施音调调节。只有已从所述HM中选择了某值之后,才实施所述音调调节处理。举例而言,取值为0.3的PAR表示上述算法将以30%×HMCR的概率选择相邻值。之后,以等于HMCR的概率以及经PAR概率微调后的值从HM中选择随机解,或者以等于(1-HMCR)的概率从所述各参数的值范围内处于HM之外的部分选择随机解。其中,由新解模块307根据来自HMCR及PAR调整模块306的已调整值找出上述新解。可以理解的是,所述新解即所述针对HMCR和PAR中的至少一个调整所选择的随机解。

改良HM识别模块308利用两个判定模块对所述新解进行检查,以判定其是否为更佳解。如果所述新解小于所述最佳(即第一)解,模块308则通过以该新解取代所述最佳解的方式更新HM。相反,如果所述新解大于所述最 差解,模块308则舍弃该新解,且不对HM进行更新。然而,如果所述新解处于所述最佳解和最差解之间,则由改良HM识别模块308找出符合下式的索引号i

fi-1(x)<fnew(x)<fi(x),

并通过以所述新解取代该第i解的方式更新HM。在一些实施方式中,上述寻找新解及对解进行改进的整个过程一直持续至达到所述最大迭代次数,而生成的所述最佳解为优化后的FR、SBR和MOS。应当指出的是,当增加所述迭代次数时,将相应推导FR和SBR最佳值以及最小适应度值,或者在视频传输完成之前一直持续上述迭代过程。

本领域技术人员可以理解的是,所述已排序或已更新HM中的最佳或第一解为具有已优化FR、SBR和MOS的解。如上所述,所述已优化FR和SBR为馈入相应比较器302和303的反馈输入。最后,视频转换器309将原始视频和已优化参数作为输入,按照该已优化参数对原始视频进行调整,并将调整后的视频作为用于后续传输的输出进行发送。在一些实施方式中,视频转换器309可以为根据所述已优化帧速率对原始视频进行调整的帧速率转换器。

应当注意的是,视频处理单元300可在可编程门阵列、可编程阵列逻辑、可编程逻辑器件等可编程硬件设备内实施。或者,视频处理单元300也可在由各种类型处理器执行的软件内实施。被认定的可执行代码引擎例如可包括计算机指令的一个或多个例如组织为对象、程序、功能、模块或其他构建体的物理或逻辑块。然而,在物理形式上,被认定引擎的可执行代码无需位于一处,而是可包括存于不同位置处的不同指令,当这些指令在逻辑上相互接合时,可构成所述引擎并实现该引擎的标称目的。实际上,可执行代码引擎可以为单个指令或多个指令,而且甚至可分布于不同应用程序的多个不同代码段上以及可分布于多个存储器装置上。

本领域技术人员可以理解的是,多种方法可用于对经通信网络传输的视频的质量进行动态优化。例如,例示系统100,200以及相关视频处理单元104,204,300可通过本文所述方法实现实时传输视频质量的动态优化。具体而言,正如本领域技术人员可以理解的,用于实施本文所述技术和步骤的控制逻辑 和/或自动化程序可由系统100,200以及相关视频处理单元104,204,300通过硬件、软件或硬件及软件的组合而实现。例如,视频处理单元104,204,300内的一个或多个处理器可对合适的代码进行访问和执行,以实现本文所述的部分或所有技术。类似地,视频处理单元104,204,300内的所述一个或多个处理器内还可纳入用于实施本文所述的部分或所有方法的专用集成电路(ASIC)。

例如,现在参考图4,该图通过根据本发明的一些实施方式的流程图展示了对利用系统100,200等系统对经通信网络传输的视频的质量进行动态优化的例示控制逻辑400。如该流程图所示,控制逻辑400包括如下步骤:在步骤401中,获取所述被传输视频的多个视频传输参数;以及在步骤402中,利用元启发式和声搜索算法并根据该视频的可接受质量的预设指标,推导出所述多个视频传输参数中每个参数的最佳值。控制逻辑400还包括,在步骤403中,根据所述多个视频传输参数中每个参数的最佳值对所述视频的质量进行动态优化的步骤。

如上所述,在一些实施方式中,所述多个视频传输参数包括所述被传输视频的帧速率(FR)、发送方比特率(SBR)和数据包错误率(PER)中的至少一个。在一些实施方式中,在步骤402中推导出所述多个视频传输参数中的每个参数的最佳值包括,求出所述视频的可接受质量的预设指标的最大帧速率、最大发送方比特率以及最小数据包错误率。

此外,如上所述,在一些实施方式中,所述视频的可接受质量的预设指标包括预设平均意见得分(MOS)。在一些实施方式中,在步骤402中推导出所述多个视频传输参数中的每个参数的最佳值包括如下步骤:获取所述视频的多个MOS系数,根据所述多个MOS系数和所述多个视频传输参数求出该视频的MOS;根据所述视频的MOS和所述预设MOS求出适应度函数;以及根据所述适应度函数推导出所述多个视频传输参数中的每个参数的最佳值。此外,在一些实施方式中,控制逻辑400包括求出所述多个视频传输参数中的每个参数以及所述预设MOS的最小值、最大值、以及该最小值和最大值之间的多个随机值的步骤。

在一些实施方式中,控制逻辑400还包括生成和声库矩阵,以及根据所述适应度函数对所述和声库矩阵进行排序的步骤。应当注意的是,所述和声库矩阵包括所述多个视频传输参数中每个参数的所述最小值、多个随机值和最大值,所述预设MOS的所述最小值、多个随机值和最大值,以及根据所述多个视频传输参数中的每个参数的所述最小值、多个随机值和最大值以及所述预设MOS的所述最小值、多个随机值和最大值求出的所述适应度函数的多个值。另外,还应当注意的是,所述多个视频传输参数中的每个参数的最佳值对应于具有所述最小值的适应度函数。

此外,在一些实施方式中,控制逻辑400包括如下步骤:通过和声库选择概率(MHCR)和音调调节概率(PAR)中的至少一个,对所述和声库矩阵进行调整;从调整后的和声库矩阵中识别出新的适应度函数;通过将所述新的适应度函数与所述最小值或最大值适应度函数进行比较,舍弃所述新的适应度函数或更新所述和声库矩阵;以及在预设周期间隔内,重复所述调整、识别以及舍弃或更新步骤,直至达到预设次数或者所述视频传输已完成。此外,在一些实施方式中,在步骤403中对所述视频的质量进行最优化包括根据最优帧速率和最优发送方比特率中的至少一个调整所述视频的步骤。

现在参考图5A和图5B,该图通过根据本发明一些实施方式的流程图进一步详细描述了对经通信网络传输的视频的质量进行动态优化的例示控制逻辑500。如该流程图所示,控制逻辑500包括,在步骤501中,由FR及视频质量分析器接收原始视频并从该原始视频中提取初始FR和MOS系数的步骤。控制逻辑500还包括,在步骤502中,由FR比较器接收上述所提取的初始FR以及作为所述输出的反馈值的已优化FR并通过对两者进行比较而求出FRMax和FRMin的步骤。类似地,控制逻辑500包括,在步骤503中,由SBR比较器接收来自网络速度监测器的初始SBR以及作为所述输出的反馈值的已优化SBR并通过对两者进行比较而求出SBRMax和SBRMin的步骤。此外,控制逻辑500包括从网络运营商接收MOSMax和MOSMin以及PERMax和PERMin的步骤。在一些实施方式中,控制逻辑500包括接收最大迭代次数的步骤。控制逻辑500还包括,在步骤504中,使用均匀随机数在所述视频传输参数 (如FR、SBR、PER和MOS)的最大和最小值中做出随机调整的步骤。

此外,控制逻辑500包括,在步骤505中,由HM生成器和适应度函数计算器根据所述多个视频传输参数和MOS系数生成初始HM矩阵的步骤。控制逻辑500还包括如下步骤:在步骤506中,由HM排序引擎根据适应度函数f(x)的值对所述初始HM进行排序,以生成已排序HM;以及在步骤508中,由HMCR及PAR调整模块利用和声库选择概率(HMCR)和音调调节概率(PAR)中的至少一个对所述已排序的HM 507进行调整。控制逻辑500包括,在步骤509中,根据已调整的参数找出新解的步骤。控制逻辑500包括,在步骤510和步骤511中,由改良HM识别模块对所述新解是否为更佳解实施检验的步骤。如果所述新解在步骤510中小于所述最佳解时,控制逻辑500则包括,在步骤512中,通过用所述新解取代所述最佳(即第一)解的方式更新HM的步骤。相反地,如果所述新解在步骤511中大于所述最差解时,控制逻辑500则包括,在步骤513中,舍弃所述新解并且不更新HM的步骤。然而,如果所述新解在步骤510和步骤511中处于所述最佳解和最差解之间时,控制逻辑500则包括,在步骤514中找出可使所述新解适应于HM的索引号i,以及在步骤515中通过用所述新解取代第i解的方式更新HM的步骤。控制逻辑500还包括,在步骤516中判断是否已达所述最大迭代次数,以及在步骤517中如果已达所述最大迭代次数则停止该过程的步骤。如果未达所述最大迭代次数,则一直持续所述寻找新解以及对解进行改进的过程,直至达到所述最大迭代次数。

此外,控制逻辑500包括,在步骤518中,从所述排序后HM中找出所述最佳解(即第一解)以及根据该最佳解确定已优化FR、SBR和MOS的步骤。其后,所述已优化FR和SBR作为反馈输入分别在步骤502和步骤503中提供至相应比较器。此外,控制逻辑500包括,在步骤519中由视频转换器根据所述已优化参数对所述原始视频进行调整,以及生成所述已调整视频以作为用于后续传输的输出的步骤。

还应理解的是,上述技术可采用如下形式:计算机或控制器实现的方法;以及用于实施这些方法的装置。本发明还可以以含有指令的计算机程序代码 的形式实施,所述指令包含于软盘、CD-ROM、硬盘驱动器或其他任何计算机可读存储介质等有形介质中,其中,当所述计算机程序代码载入计算机或控制器内并由该计算机或控制器执行时,所述计算机即成为一种用于实施本发明的装置。本发明还可以以计算机程序代码或信号的形式实施,所述计算机程序代码或信号例如存储于存储介质中,或者载入计算机或控制器内并由该计算机或控制器执行,或者经电线或电缆、光纤或电磁辐射等传输介质传输,其中,当所述计算机程序代码载入计算机内并由该计算机执行时,所述计算机即成为一种用于实施本发明的装置。当在通用微处理器中实施时,所述计算机程序代码的代码段对所述微处理器进行配置,以创建出特定的逻辑电路。

上述公开的方法和系统可在个人计算机(PC)或服务器计算机等常规或通用计算机系统内实施。现在参考图6,该图所示为用于实施符合本发明实施方式的例示计算机系统601的框图。计算机系统601的各种变形可用于实现对经通信网络实时传输的视频的质量进行动态优化的系统100,200以及视频处理单元104,204,300。计算机系统601可包括中央处理单元(“CPU”或“处理器”)602。处理器602可包括至少一个用于执行程序组件的数据处理器,所述程序组件用于执行用户或系统生成的请求。用户可包括使用设备(例如,本发明所述的设备)的个人或此类设备本身。所述处理器可包括专用处理单元,例如集成系统(总线)控制器、存储器管理控制单元、浮点单元、图形处理单元、数字信号处理单元等。所述处理器可包括微处理器,例如AMD速龙(Athlon)、毒龙(Duron)或皓龙(Opteron),ARM应用处理器,嵌入式或安全处理器,IBM PowerPC,Intel Core、安腾(Itanium)、至强(Xeon)、赛扬(Celeron)或其他处理器产品线等。处理器602可通过主机、分布式处理器、多核、并行、网格或其他架构实现。一些实施方式可使用专用集成电路(ASIC)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)等嵌入式技术。

处理器602可配置为通过输入/输出(I/O)接口603与一个或多个I/O设备进行通信。I/O接口603可采用通信协议/方法,例如但不限于,音频、模拟、 数字、单声道、RCA、立体声、IEEE-1394、串行总线、通用串行总线(USB)、红外、PS/2、BNC、同轴、组件、复合、数字视觉接口(DVI)、高清晰度多媒体接口(HDMI)、射频天线、S-视频,VGA、IEEE 802.n/b/g/n/x、蓝牙、蜂窝(例如码分多址(CDMA)、高速分组接入(HSPA+)、移动通信全球系统(GSM)、长期演进(LTE)、WiMax等)等。

通过使用I/O接口603,计算机系统601可与一个或多个I/O设备进行通信。举例而言,输入设备604可以为天线、键盘、鼠标、操纵杆、(红外)遥控、摄像头、读卡器、传真机、加密狗、生物计量阅读器、麦克风、触摸屏、触摸板、轨迹球、传感器(例如加速度计、光传感器、GPS、陀螺仪、接近传感器等)、触控笔、扫描仪、存储设备、收发器、视频设备/视频源、头戴式显示器等。输出设备605可以为打印机、传真机、视频显示器(例如阴极射线管(CRT)、液晶显示器(LCD)、发光二极管(LED)、等离子等)、音频扬声器等。在一些实施方式中,收发器606可与处理器602连接。所述收发器可促进各类无线传输或接收。例如,所述收发器可包括以可操作方式连接至收发器芯片(例如德州仪器(Texas Instruments)WiLink WL1283、博通(Broadcom)BCM4750IUB8、英飞凌科技(Infineon Technologies)X-Gold 618-PMB9800等)的天线,以实现IEEE 802.11a/b/g/n、蓝牙、频率调制(FM)、全球定位系统(GPS)、2G/3G HSDPA/HSUPA通信等。

在一些实施方式中,处理器602可配置为通过网络接口607与通信网络608进行通信。网络接口607可与通信网络608通信。所述网络接口可采用连接协议,包括但不限于,直接连接、以太网(例如双绞线10/100/1000BaseT)、传输控制协议/网际协议(TCP/IP)、令牌环、IEEE 802.11a/b/g/n/x等。通信网络608可包括,但不限于,直接互连、局域网(LAN)、广域网(WAN)、无线网络(例如使用无线应用协议)、因特网等。通过网络接口607和通信网络608,计算机系统601可与设备609、610和611通信。这些设备可包括,但不限于,个人计算机、服务器、传真机、打印机、扫描仪以及各种移动设备,例如手机、智能手机(例如苹果手机(AppleiPhone)、黑莓手机(Blackberry)、基于安卓(Android)系统的电话等)、平板电脑、电子书阅读器(亚马逊 (Amazon)Kindle,Nook等)、膝上型计算机、笔记本电脑、游戏机(微软(Microsoft)Xbox、任天堂(Nintendo)DS,索尼(Sony)PlayStation等)等。在一些实施方式中,计算机系统401可本身包含一个或多个上述设备。

在一些实施方式中,处理器602可配置为通过存储接口612与一个或多个存储设备(例如RAM 613、ROM 614等)进行通信。所述存储接口可采用串行高级技术连接(SATA)、集成驱动电子设备(IDE)、IEEE 1394、通用串行总线(USB)、光纤通道、小型计算机系统接口(SCSI)等连接协议连接至存储设备,该存储设备包括,但不限于,存储驱动器、可移除磁盘驱动器等。所述存储驱动器还可包括磁鼓、磁盘驱动器、磁光驱动器、光盘驱动器、独立磁盘冗余阵列(RAID)、固态存储设备、固态驱动器等。

所述存储设备可存储一系列程序或数据库组件,包括但不限于,操作系统616、用户界面617、网页浏览器618、邮件服务器619、邮件客户端620、用户/应用程序数据621(例如本发明中所述的任何数据变量或数据记录)等。操作系统616可促进计算机系统601的资源管理和运行。操作系统例如包括,但不限于,苹果Macintosh OS X、Unix、类Unix系统套件(例如伯克利软件套件(BSD)、FreeBSD、NetBSD、OpenBSD等)、Linux套件(如红帽(Red Hat)、Ubuntu、Kubuntu等)、IBM OS/2、微软Windows(XP,Vista/7/8等)、苹果iOS、谷歌(Google)安卓、黑莓操作系统等。用户界面617可利用文本或图形工具促进程序组件的显示、执行、互动、操控或操作。例如,用户界面可在以可操作方式连接至计算机系统601的显示系统上提供光标、图标、复选框、菜单、滚动条、窗口、窗口部件等计算机交互界面元件。还可采用图形用户界面(GUI),包括但不限于,苹果Macintosh操作系统的Aqua、IBM OS/2、微软Windows(例如Aero、Metro等)、Unix X-Windows、网页界面库(例如ActiveX、Java、Javascript、AJAX、HTML、Adobe Flash等)等。

在一些实施方式中,计算机系统601可执行网页浏览器618存储的程序组件。所述网页浏览器可以为超文本浏览应用程序,如微软网络探路者(Internet Explorer)、谷歌浏览器(Chrome)、谋智火狐(MozillaFirefox)、苹果浏览器(Safari)等。安全网页浏览可通过HTTPS(安全超文本传输协议)、 安全套接字层(SSL)、安全传输层(TLS)等实现。网页浏览器可使用AJAX、DHTML、Adobe Flash、JavaScript、Java、应用程序编程接口(API)等工具。在一些实施方式中,计算机系统601可执行邮件服务器619存储的程序组件。所述邮件服务器可以为微软Exchange等因特网邮件服务器。所述邮件服务器可使用ASP、ActiveX、ANSI C++/C#、微软.NET、CGI脚本、Java、JavaScript、PERL、PHP、Python、WebObjects等工具。所述邮件服务器还可使用因特网信息访问协议(IMAP)、邮件应用程序编程接口(MAPI)、微软Exchange、邮局协议(POP)、简单邮件传输协议(SMTP)等通信协议。在一些实施方式中,计算机系统601可执行邮件客户端620存储的程序组件。所述邮件客户端可为苹果Mail、微软Entourage、微软Outlook、谋智Thunderbird等邮件查看程序。

在一些实施方式中,计算机系统601可存储用户/应用程序数据621,例如本发明中所述数据、变量、记录等(例如,FR,SBR,MOS,PER,MOS系数,HM,已排序HM,最大迭代次数,适应度函数,已优化FR,已优化SBR,已优化MOS等)。此类数据库可以为容错、关系、可扩展、安全数据库,例如甲骨文(Oracle)或赛贝斯(Sybase)。或者,上述数据库可通过数组、散列、链表、结构、结构化文本文件(例如XML)、表格等标准化数据结构实现,或者实施为面向对象的数据库(例如通过ObjectStore、Poet、Zope等)。上述数据库可以为合并或分布数据库,有时分布于本发明所讨论的上述各种计算机系统之间。应该理解的是,可以以任何可工作的组合形式对上述任何计算机或数据库组件的结构及操作进行组合、合并或分布。

本领域技术人员可以理解的是,上述各实施方式中描述的技术可实现实时视频传输质量的改进以及信道带宽的优化。换言之,所述技术用于视频质量优化和信道带宽的高效利用。该技术通过采用元启发式和声搜索算法找出帧速率和传输比特率的最佳选择,从而实现实时视频传输的MOS的优化。例如,在一些情形中,上述技术可实现当以25fps和1046kbps传输视频时,用户可体验到满意的视频质量(即MOS>4)。如此,可大量节省传输带宽,而节省下的带宽可用于提供其他多媒体服务。由此可见,上述技术可实现以优 化的网络带宽和最佳的可能质量对实时视频进行传输。

此外,本领域技术人员可以理解的是,上述各实施方式中描述的技术可同等应用于其他多媒体流,例如高保真音频、流式文本、流式图像,或者其组合。类似地,MOS或其他合适参数可用于作为此类多媒体流的质量衡量参数或指标。

本说明书已对用于动态优化实时传输视频的质量的系统和方法进行了描述。所示步骤用于说明所述例示实施方式,并且应当预想到的是,随着技术的不断发展,特定功能的执行方式也将发生改变。本文所呈现的上述实施例用于说明而非限制目的。此外,为了描述的方便性,本文对各功能构建模块边界的定义为任意性的,只要其上述功能及其关系能够获得适当执行,也可按其他方式定义边界。根据本申请的启示内容,替代解(包括本申请所述解的等同解、扩展解、变形解、偏差解等)对于相关领域技术人员是容易理解的。这些替代解均落入所公开实施方式的范围和精神内。

此外,一个或多个计算机可读存储介质可用于实施本发明的实施方式。计算机可读存储介质是指可对处理器可读取的信息或数据进行存储的任何类型的物理存储器。因此,计算机可读存储介质可对由一个或多个处理器执行的指令进行存储,包括用于使处理器执行根据本申请实施方式的步骤或阶段的指令。“计算机可读介质”一词应理解为包括有形物件且不包括载波及瞬态信号,即为非临时性介质,例如随机存取存储器(RAM)、只读存储器(ROM)、易失性存储器、非易失性存储器、硬盘驱动器、只读光盘存储器(CD-ROM)、DVD、闪存驱动器、磁盘以及其他任何已知物理存储介质。

以上公开内容及实施例旨在于仅视为示例性内容及实施例,所公开实施方式的真正范围和精神由以下权利要求指出。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1