一种视频的评估方法及装置与流程

文档序号:16278117发布日期:2018-12-14 22:43阅读:265来源:国知局
一种视频的评估方法及装置与流程

本申请涉及计算机技术领域,尤其涉及一种视频的评估方法及装置。

背景技术

随着通信技术的发展,传统的语音通话逐渐被视频通话所代替,如,长期演进的语音(voiceoverlongtermevolution,volte)视频通话,微信视频通话。但是,由于视频画面存在的不清晰、卡顿以及延迟时间长等问题,影响了用户体验,因此,为确定接收端的视频的质量,对接收端的视频的用户体验进行评估也成为关注的焦点。

现有技术下,对接收端的视频的用户体验进行评估,通常采用以下几种方式:

第一种方式为:通过指定的测试人员,在特定的测试环境中,按照预设的测试标准对视频的质量进行打分,以及对获取的分数进行统计分析,从而获得视频的用户体验评分,作为视频的评估结果。

但是,采用这种方式,对测试环境、测试材料以及测试人员等都有严格的标准,耗时长,过程繁琐,并且容易受到外界条件的干扰,因此,很难在实际的视频评估中进行使用。

第二种方式为:分别获取发送端和接收端的视频数据,然后,将发送端和接收端的视频数据进行帧对帧的对比分析,从而获得视频的评估结果。

但是,采用这种方式,需要进行帧对帧的对比分析,计算的复杂度高,效率低,并且获取的评估结果实际为视频的保真程度,并不是真正意义上的用户体验评分。

第三种方式为:基于视频的编解码方式以及网络传输质量,采用相应的评估公式,确定视频的评估结果。其中,评估公式为a=1+i1*i2,a为视频的评估结果,i1为编解码方式对视频质量的损伤,i2为网络传输质量对视频质量的损伤。

但是,采用这种方式,仅考虑了编解码方式以及网络传输质量对视频的用户体验的影响,获得的视频的评估结果不精确。



技术实现要素:

本申请实施例提供一种视频的评估方法及装置,用于在评估视频质量的用户体验时,提高视频评估的精准度,简化评估计算的复杂度,提高评估计算的效率,降低时间成本。

本申请实施例提供的具体技术方案如下:

第一方面,一种视频感知评估模型的建立方法,包括:

分别获得每一个指定的样本视频的音视频参数、网络传输参数、屏幕配置参数,以及对应的视频评分集合;

基于bp神经网络算法,建立初始视频感知评估模型,其中,初始视频感知评估模型的输入参数为:样本视频的音视频参数、网络传输参数、屏幕配置参数;

分别针对每一个样本视频执行以下步骤;

基于一个样本视频的音视频参数、网络传输参数和对应的屏幕配置参数,采用相应的初始视频感知评估模型,获得一个样本视频的评分输出集合;

基于一个样本视频的评分输出集合的各个参数,分别与一个样本视频的视频评分集合相应的各个参数的差值的平方的和,获得一个样本视频的输出误差;

确定一个样本视频的输出误差低于预设门限值时,对初始视频感知评估模型中包含的各个权值进行调整,获得调整后的初始视频感知评估模型,其中,调整后的初始视频感知评估模型作为下一个样本视频相应的初始视频感知评估模型;

将调整后的初始视频感知评估模型,作为视频感知评估模型。

较佳的,基于bp神经网络算法,建立初始视频感知评估模型,具体包括:

基于bp神经网络算法,确定初始视频感知评估模型的隐含层的节点的输出表达式为:

基于bp神经网络算法,确定初始视频感知评估模型的输出层的节点的输出表达式为:

基于隐含层的节点的输出表达式,输出层的节点的输出表达式,确定初始视频感知评估模型;

其中,初始视频感知评估模型包括输入层、隐含层以及输出层,xi表示输入层的第i个节点的输入,hj表示隐含层的第j个节点的输出,yk表示输出层的第k个节点的输出,aij表示节点i与节点j之间的权值,h为隐含层的节点的总数目,akj表示节点k与节点j之间的权值,m表示输入层的节点的总数目0<k<n,,n表示输出层的节点的总数目,i,j,h,k,m,n为自然数。

较佳的,基于一个样本视频的音视频参数、网络传输参数、对应的屏幕配置参数,采用相应的初始视频感知评估模型,获得一个样本视频的评分输出集合,具体包括:

分别获取针对每一个参数预设的归一化系数;

基于一个样本视频的音视频参数、网络传输参数、对应的屏幕配置参数,与相应的归一化系数的比值,获得一个样本视频的归一化后的各个参数;

将归一化后的各个参数,输入相应的初始视频感知评估模型,获得一个样本视频的评分输出集合。

较佳的,屏幕配置参数包括以下参数中的一种或组合:屏幕的分辨率和屏幕的尺寸;

评分输出集合包括音频质量评分、视频质量评分以及音视频质量评分,用户体验评分;

视频评分集合包括音频质量参考评分、视频质量参考评分、音视频质量参考评分和用户体验参考评分;

其中,音视频参数和网络传输参数均用于确定音频质量评分和视频质量评分;音频质量评分、视频质量评分以及屏幕配置参数用于确定音视频质量评分,音视频质量评分和网络传输参数用于确定用户体验评分。

第二方面,一种视频的评估方法,采用第一方面中任一项的方法获得的视频感知评估模型,包括:

获取视频的音视频参数、网络传输参数和屏幕配置参数;

基于视频的音视频参数、网络传输参数和屏幕配置参数,采用视频感知评估模型,获得视频的评分输出集合;

获取评分输出集合中包含的用户体验评分,作为视频的评估结果。

第三方面,一种视频感知评估模型的建立装置,包括:

获取单元,用于分别获得每一个指定的样本视频的音视频参数、网络传输参数、屏幕配置参数,以及对应的视频评分集合;

建立单元,用于基于bp神经网络算法,建立初始视频感知评估模型,其中,初始视频感知评估模型的输入参数为:样本视频的音视频参数、网络传输参数、屏幕配置参数;

执行单元,用于分别针对每一个样本视频执行以下步骤;

基于一个样本视频的音视频参数、网络传输参数和对应的屏幕配置参数,采用相应的初始视频感知评估模型,获得一个样本视频的评分输出集合;

基于一个样本视频的评分输出集合的各个参数,分别与一个样本视频的视频评分集合相应的各个参数的差值的平方的和,获得一个样本视频的输出误差;

确定一个样本视频的输出误差低于预设门限值时,对初始视频感知评估模型中包含的各个权值进行调整,获得调整后的初始视频感知评估模型,其中,调整后的初始视频感知评估模型作为下一个样本视频相应的初始视频感知评估模型;

确定单元,用于将调整后的初始视频感知评估模型,作为视频感知评估模型。

第四方面,一种视频的评估装置,采用第二方面任一项的方法获得的视频感知评估模型,包括:

获取单元,用于获取视频的音视频参数、网络传输参数和屏幕配置参数;

输出单元,用于基于视频的音视频参数、网络传输参数和屏幕配置参数,采用视频感知评估模型,获得视频的评分输出集合;

确定单元,用于获取评分输出集合中包含的用户体验评分,作为视频的评估结果。

第五方面,一种电子设备,其特征在于,包括:一个或多个处理器;以及

一个或多个计算机可读介质,可读介质上存储有用于视频感知评估模型的建立的程序,其中,程序被一个或多个处理器执行时,实现上述第一方面中任一项的方法的步骤。

第六方面,一个或多个计算机可读介质,其特征在于,可读介质上存储有用于视频感知评估模型的建立的程序,其中,程序被一个或多个处理器执行时,使得通信设备执行上述第一方面中任一项的方法。

第七方面,一种电子设备,其特征在于,包括:一个或多个处理器;以及

一个或多个计算机可读介质,可读介质上存储有用于视频的评估的程序,其中,程序被一个或多个处理器执行时,实现上述第二方面中任一项的方法的步骤。

第八方面,一个或多个计算机可读介质,其特征在于,可读介质上存储有用于视频的评估的程序,其中,程序被一个或多个处理器执行时,使得通信设备执行上述第二方面中任一项的方法。

本申请实施例中,获取视频的音视频参数、网络传输参数和屏幕配置参数;基于视频的音视频参数、网络传输参数和屏幕配置参数,采用视频感知评估模型,获得视频的评分输出集合;获取评分输出集合中包含的用户体验评分,作为视频的评估结果。这样,基于视频的音视频参数、网络传输参数和屏幕配置参数,采用视频感知评估模型,获得用户体验评分,综合考虑了音视频、网络传输和采用的播放屏幕三个方面对视频的用户体验的影响,并且采用视频感知评估模型进行计算,简化了计算的复杂度,提高了视频评估的精准度和计算的效率,降低了时间成本。

附图说明

图1a为本申请实施例中视频感知评估模型的建立的方法的流程图;

图1b为bp神经网络的示意图;

图2为本申请实施例中视频的评估方法的流程图;

图3为本申请实施例中视频感知评估模型的建立的装置的示意图;

图4为本申请实施例中视频的评估装置的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,并不是全部的实施例。基于本申请实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

为了对视频的用户体验进行评估,提高视频评估的精准度,简化计算的复杂度,提高计算的效率,降低时间成本,本申请实施例中,设计了一种视频的评估方法,该方法为基于视频的音视频参数、网络传输参数和屏幕配置参数,采用视频感知评估模型,获得用户体验评分,作为视频的评估结果。

下面结合附图对本申请优选的实施方式进行详细说明。

参阅图1a所示,本申请实施例中,在对视频进行评估之前,视频感知评估模型的建立的具体流程如下:

步骤100:终端分别获得每一个指定的样本视频的音视频参数、网络传输参数、屏幕配置参数,以及对应的视频评分集合。

具体的,首先,终端分别获得每一个指定的样本视频的音视频参数,其中,音视频参数包括以下参数中的一种或任意组合:音频编码方式、音频编码率、音频采样率、音频带宽、视频编码方式、视频的分辨率、视频编码率、视频帧率以及视频内容复杂度。

接着,终端分别获得每一个指定的样本视频的网络传输参数,其中,网络传输参数包括以下参数中的一种或任意组合:往返时延、音视频异步时延、丢包率以及突发丢包占比。

然后,终端分别获得每一个指定的样本视频的屏幕配置参数,其中,屏幕配置参数包括以下参数中的一种或组合:屏幕的分辨率和屏幕的尺寸。

例如,终端11接收样本视频s,其中,终端11的屏幕的分辨率为854×480像素,尺寸为3.5英寸。

进一步地,终端分别获得每一个指定的样本视频的视频评分集合,其中,视频评分集合包括音频质量参考评分、视频质量参考评分、音视频质量参考评分和用户体验参考评分。用户体验参考评分是通过指定的测试人员在特定的测试环境中对视频的质量的评分获得的。

其中,音视频参数和网络传输参数均用于确定视频的音频质量和视频质量。音视频参数、网络传输参数和屏幕配置参数均用于确定视频的音视频质量以及用于获取用户体验的评估结果。

这样,终端就可以在后续的视频评估过程中,通过视频的语音方面,视频方面,网络方面,以及屏幕配置方面,对视频的用户体验进行综合评估,从而提高视频评估的精准度。

步骤110:终端基于反向传播(backpropagation,bp)神经网络算法,建立初始视频感知评估模型。

具体的,参阅图1b所示,bp神经网络的示意图。bp神经网络包括输入层,若干隐含层以及输出层。由于对于任何闭区间内的一个连续函数都可以用只含一个隐含层的bp神经网络就可以完成任意的m维到n维的映射,因此,本申请实施例中,采用仅包含一个隐含层的bp神经网络算法建立初始视频感知评估模型。

其中,建立初始视频感知评估模型时,可以采用以下步骤:

首先,终端基于bp神经网络算法,确定初始视频感知评估模型的隐含层的节点的输出表达式为:

然后,终端基于bp神经网络算法,确定初始视频感知评估模型的输出层的节点的输出表达式为:

其中,xi表示输入层的第i个节点的输入,hj表示隐含层的第j个节点的输出,yk表示输出层的第k个节点的输出,aij表示节点i与节点j之间的权值,h为隐含层的节点的总数目,akj表示节点k与节点j之间的权值,m表示输入层的节点的总数目,0<k<n,n表示输出层的节点的总数目,i,j,h,k,m,n为自然数,aij和akj初始值是随机确定的。

进一步地,终端基于隐含层的节点的输出表达式,输出层的节点的输出表达式,确定初始视频感知评估模型。

步骤120:终端分别将每一个样本视频的音视频参数、网络传输参数、屏幕配置参数进行归一化。

具体的,本申请实施例中,仅以一个样本视频的各个参数进行归一化为例进行说明。

首先,针对一个样本视频的音视频参数、网络传输参数、屏幕配置参数,终端分别获取针对每一个参数预设的归一化系数。其中,一个参数的归一化系数是基于该参数的取值范围设定的。归一化系数用于使归一化后的参数的取值范围在0-1之间。

然后,终端基于一个样本视频的音视频参数、网络传输参数、对应的屏幕配置参数,与相应的归一化系数的比值,获得一个样本视频的归一化后的各个参数。

例如,屏幕的尺寸的取值范围为0-5,则设定相应的归一化系数为5,则归一化后的屏幕的尺寸的取值范围为0-1。

这样,将每一个参数进行归一化,使各个参数的取值范围均在0-1,从而提高初始视频感知评估模型的速度和灵敏性。

步骤130:终端针对每一个样本视频执行以下步骤:将一个样本视频的归一化后的参数,输入相应的初始视频感知评估模型,并基于获得的评分输出集合,对初始感知评估模型中包含的各个权值进行调整。

具体的,本申请实施例中,以一个样本视频为例,对初始感知评估模型的调整进行说明。

首先,终端将一个样本的归一化后的各个参数,输入相应的初始视频感知评估模型,获得一个样本视频的评分输出集合。

其中,评分输出集合包括音频质量评分、视频质量评分以及音视频质量评分,用户体验评分。

然后,终端基于一个样本视频的评分输出集合的各个参数,分别与一个样本视频的视频评分集合相应的各个参数的差值的平方的和,获得一个样本视频的输出误差。

可选的,确定一个样本视频的输出误差时,可以采用以下公式:

其中,e为输出误差,dk为视频评分集合中第k个参数,yk为评分输出集合中第k个参数,n为输出集合中包含的参数的总数目,a,k,n为自然数,可选的,a=2。

例如,视频评分集合中的各个参数依次为:音频质量参考评分、视频质量参考评分、音视频质量参考评分和用户体验参考评分,对应的取值依次为d1=0.1,d2=0.2,d3=0.5,d4=0.4。评分输出集合中的各个参数依次为:音频质量评分、视频质量评分以及音视频质量评分,用户体验评分,对应的取值依次为y1=0.2,y2=0.3,y3=0.6,y4=0.5,y5=0.9,a=2,则终端获得输出误差

进一步地,终端确定一个样本视频的输出误差低于预设门限值时,对初始视频感知评估模型中包含的各个权值进行调整,获得调整后的初始视频感知评估模型,其中,调整后的初始视频感知评估模型作为下一个样本视频相应的初始视频感知评估模型。

本申请实施例中,仅一个样本视频为例,对初始视频感知评估模型的调整进行说明,基于相同的原理,可以实现通过其它各个样本视频的参数,对初始视频感知评估模型进行调整。

其中,终端在依次通过每一个样本视频的各个参数,对初始视频感知评估模型进行调整时,将基于一个样本视频,获得的调整后的初始视频感知评估模型,作为下一个样本视频相应的初始视频感知评估模型。

步骤140:终端将调整后的初始视频感知评估模型,作为视频感知评估模型。

这样,终端基于各个样本视频,对初始视频感知评估模型进行训练,从而对初始视频感知评估模型中包含的各个权值不断进行调整,获得最终的视频感知评估模型,进而可以在后续的步骤中,通过获得的视频感知评估模型对视频的用户体验进行评估。

参阅图2所示,本申请实施例中,视频的评估的具体流程如下:

步骤200:终端获取视频的音视频参数、网络传输参数和屏幕配置参数。

步骤210:终端对获取的视频的各个参数进行归一化。

具体的,终端获取针对每一个参数预设的归一化系数,并基于每一个参数与相应的归一化系数的比值,实现视频的各个参数的归一化,获得归一化后的各个参数。

步骤220:终端将归一化后的各个参数,输入视频感知评估模型,获得视频的评分输出集合。

步骤230:终端获取评分输出集合中包含的用户体验评分,作为视频的评估结果。

这样,就可以基于视频的音视频参数、网络传输参数和屏幕配置参数,采用通过bp神经网络算法建立的视频感知评估模型,获得用户体验评分,简化了计算的复杂度,提高了评估的精准度和计算的效率,降低了时间成本。

本申请实施例中,一种电子设备,包括:一个或多个处理器;以及

一个或多个计算机可读介质,可读介质上存储有用于视频感知评估模型的建立的程序,其中,程序被一个或多个处理器执行时,实现上述实施例中的各个步骤。

本申请实施例中,一个或多个计算机可读介质,可读介质上存储有用于视频感知评估模型的建立的程序,其中,程序被一个或多个处理器执行时,使得通信设备可以执行上述实施例中的各个步骤。

本申请实施例中,一种电子设备,包括:一个或多个处理器;以及

一个或多个计算机可读介质,可读介质上存储有用于视频的评估的程序,其中,程序被一个或多个处理器执行时,实现上述实施例中的各个步骤。

本申请实施例中,一个或多个计算机可读介质,可读介质上存储有用于视频的评估的程序,其中,程序被一个或多个处理器执行时,使得通信设备可以执行上述实施例中的各个步骤。

基于上述实施例,参阅图3所示,视频感知评估模型的建立装置的结构示意图,本申请实施例中,视频感知评估模型的建立装置具体包括:

获取单元30,用于分别获得每一个指定的样本视频的音视频参数、网络传输参数、屏幕配置参数,以及对应的视频评分集合;

建立单元31,用于基于bp神经网络算法,建立初始视频感知评估模型,其中,初始视频感知评估模型的输入参数为:样本视频的音视频参数、网络传输参数、屏幕配置参数;

执行单元32,用于分别针对每一个样本视频执行以下步骤;

基于一个样本视频的音视频参数、网络传输参数和对应的屏幕配置参数,采用相应的初始视频感知评估模型,获得一个样本视频的评分输出集合;

基于一个样本视频的评分输出集合的各个参数,分别与一个样本视频的视频评分集合相应的各个参数的差值的平方的和,获得一个样本视频的输出误差;

确定一个样本视频的输出误差低于预设门限值时,对初始视频感知评估模型中包含的各个权值进行调整,获得调整后的初始视频感知评估模型,其中,调整后的初始视频感知评估模型作为下一个样本视频相应的初始视频感知评估模型;

确定单元33,用于将调整后的初始视频感知评估模型,作为视频感知评估模型。

较佳的,在基于bp神经网络算法,建立初始视频感知评估模型时,建立单元31具体用于:

基于bp神经网络算法,确定初始视频感知评估模型的隐含层的节点的输出表达式为:

基于bp神经网络算法,确定初始视频感知评估模型的输出层的节点的输出表达式为:

基于隐含层的节点的输出表达式,输出层的节点的输出表达式,确定初始视频感知评估模型;

其中,初始视频感知评估模型包括输入层、隐含层以及输出层,xi表示输入层的第i个节点的输入,hj表示隐含层的第j个节点的输出,yk表示输出层的第k个节点的输出,aij表示节点i与节点j之间的权值,h为隐含层的节点的总数目,akj表示节点k与节点j之间的权值,m表示输入层的节点的总数目0<k<n,,n表示输出层的节点的总数目,i,j,h,k,m,n为自然数。

较佳的,在基于一个样本视频的音视频参数、网络传输参数、对应的屏幕配置参数,采用相应的初始视频感知评估模型,获得一个样本视频的评分输出集合时,执行单元32具体用于:

分别获取针对每一个参数预设的归一化系数;

基于一个样本视频的音视频参数、网络传输参数、对应的屏幕配置参数,与相应的归一化系数的比值,获得一个样本视频的归一化后的各个参数;

将归一化后的各个参数,输入相应的初始视频感知评估模型,获得一个样本视频的评分输出集合。

较佳的,屏幕配置参数包括以下参数中的一种或组合:屏幕的分辨率和屏幕的尺寸;

评分输出集合包括音频质量评分、视频质量评分以及音视频质量评分,用户体验评分;

视频评分集合包括音频质量参考评分、视频质量参考评分、音视频质量参考评分和用户体验参考评分;

其中,音视频参数和网络传输参数均用于确定音频质量评分和视频质量评分;音频质量评分、视频质量评分以及屏幕配置参数用于确定音视频质量评分,音视频质量评分和网络传输参数用于确定用户体验评分。

基于上述实施例,参阅图4所示,视频的评估装置的结构示意图,本申请实施例中,视频的评估装置具体包括:

获取单元40,用于获取视频的音视频参数、网络传输参数和屏幕配置参数;

输出单元41,用于基于视频的音视频参数、网络传输参数和屏幕配置参数,采用视频感知评估模型,获得视频的评分输出集合;

确定单元42,用于获取评分输出集合中包含的用户体验评分,作为视频的评估结果。

本申请实施例中,获取视频的音视频参数、网络传输参数和屏幕配置参数;基于视频的音视频参数、网络传输参数和屏幕配置参数,采用视频感知评估模型,获得视频的评分输出集合;获取评分输出集合中包含的用户体验评分,作为视频的评估结果。这样,基于视频的音视频参数、网络传输参数和屏幕配置参数,采用视频感知评估模型,获得用户体验评分,综合考虑了音视频、网络传输和采用的播放屏幕三个方面对视频的用户体验的影响,并且采用视频感知评估模型进行计算,简化了计算的复杂度,提高了视频评估的精准度和计算的效率,降低了时间成本。

本领域内的技术人员应明白,本申请实施例中的实施例可提供为方法、系统、或计算机程序产品。因此,本申请实施例中可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例中可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请实施例中是参照根据本申请实施例中实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请实施例中的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例中范围的所有变更和修改。

显然,本领域的技术人员可以对本申请实施例中实施例进行各种改动和变型而不脱离本申请实施例中实施例的精神和范围。这样,倘若本申请实施例中实施例的这些修改和变型属于本申请实施例中权利要求及其等同技术的范围之内,则本申请实施例中也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1