一种信息处理方法及装置与流程

文档序号:16776395发布日期:2019-02-01 18:45阅读:190来源:国知局
一种信息处理方法及装置与流程

本发明涉及多媒体技术领域,特别是涉及一种信息处理方法及装置。



背景技术:

随着社会的不断发展,通过终端观看视频的用户也越来越多,为了增强不同用户之间观看视频时的互动性,很多视频平台都提供了弹幕功能,即用户可以在视频播放过程中输入自己对视频节目的评价或者主观感受等信息,并且用户还可以看到其他用户发送的弹幕信息。

然而,发明人在实现本发明的过程中发现,现有技术至少存在如下问题:

现有技术在播放的视频画面上显示弹幕时,往往会遮挡住部分视频画面,使得用户在通过弹幕与其他用户互动的同时很可能不能很好的观看视频。



技术实现要素:

本发明实施例的目的在于提供了一种信息处理方法及装置,以提高用户观看视频的体验。具体技术方案如下:

第一方面,本发明实施例提供了一种信息处理方法,所述方法包括:

服务器接收终端发送的视频文件请求,其中,所述视频文件请求用于请求待播放的视频文件;

所述服务器获取所述视频文件及所述视频文件对应的蒙版文件,所述蒙版文件用于标识所述视频文件中视频帧的目标区域,所述目标区域用于表征所述视频帧中的目标对象;

所述服务器向所述终端发送所述视频文件、所述蒙版文件及所述视频文件对应的弹幕信息。

可选的,所述服务器获取所述视频文件对应的蒙版文件的步骤,包括:

所述服务器获取所述视频文件中的目标视频帧,所述目标视频帧的镜头类型为预设镜头类型;

所述服务器对所述目标视频帧中的目标对象进行分割,得到所述目标对象在所述目标视频帧中的区域位置;

所述服务器生成所述目标视频帧的蒙版信息和时间戳信息,所述蒙版信息用于标识所述目标对象在所述目标视频帧中的区域位置;

所述服务器生成所述视频文件对应的蒙版文件,所述蒙版文件包含所述视频文件中目标视频帧的蒙版信息及时间戳信息。

可选的,所述服务器获取所述视频文件中的目标视频帧的步骤,包括:

所述服务器检测所述视频文件中每一视频帧的镜头类型,所述镜头类型包括:特写镜头类型、近景镜头类型、中景镜头类型、全景镜头类型或远景镜头类型;

所述服务器将属于预设镜头类型的视频帧作为目标视频帧,所述预设镜头类型为所述特写镜头类型、近景镜头类型或中景镜头类型。

可选的,所述服务器确定所述视频文件中任一视频帧的镜头类型的过程,包括:

确定视频帧中包含的每一目标对象对应的目标面积比,其中,所述目标面积比为目标对象与所述目标视频帧的面积比;

判断所确定的各个目标面积比中是否存在大于预设面积比的面积比,若为是,将所述视频帧的镜头类型确定为预设镜头类型。

可选的,所述服务器对所述目标视频帧中的目标对象进行分割的步骤,包括:

采用deeplabv3+深度学习分割算法对所述目标视频帧中的目标对象进行分割。

可选的,所述服务器对所述目标视频帧中的目标对象进行分割的步骤,包括:

所述服务器获取所述目标视频帧中的前景图像,所述前景图像包括多个前景对象;

所述服务器将所述多个前景对象面积中大于预设面积的对象作为目标对象,并分割出所述目标对象。

可选的,所述服务器向所述终端发送所述蒙版文件之前,所述方法还包括:

所述服务器检测所述蒙版文件中的重复蒙版信息,所述重复蒙版信息为连续目标视频帧分别对应的信息内容一致的蒙版信息;

所述服务器保留所述重复蒙版信息中的首个蒙版信息,并将所述重复蒙版信息中的其余蒙版信息删除,所述首个蒙版信息表征所述重复蒙版信息中每个目标视频帧对应的蒙版信息。

第二方面,本发明实施例提供了一种信息处理方法,所述方法包括:

终端向服务器发送视频文件请求,所述视频文件请求用于请求待播放的视频文件;

所述终端接收所述服务器发送的所述视频文件、所述视频文件对应的蒙版文件及所述视频文件对应的弹幕信息,所述蒙版文件用于标识所述视频文件中视频帧的目标区域,所述目标区域用于表征所述视频帧中的目标对象;

所述终端播放所述视频文件,所述终端在播放视频文件的过程中按照所述蒙版文件加载所述弹幕信息,所述弹幕信息在视频帧中除所述目标区域之外的区域显示。

可选的,所述蒙版文件包括目标视频帧的蒙版信息和时间戳信息,所述目标视频帧的镜头类型为预设镜头类型。

可选的,所述终端在播放视频文件的过程中按照所述蒙版文件加载所述弹幕信息,包括:

所述终端在播放视频文件过程中检测所述蒙版文件中所述目标视频帧对应的蒙版信息是否缺失;

如果所述目标视频帧对应的蒙版信息缺失,所述终端将前一视频帧对应的蒙版信息作为所述目标视频帧对应的蒙版信息,所述前一视频帧为所述目标视频帧在所述时间戳信息上对应的上一个视频帧。

第三方面,本发明实施例提供了一种信息处理装置,所述信息处理装置应用于服务器,所述装置包括:

请求接收模块,用于接收终端发送的视频文件请求,其中,所述视频文件请求用于请求待播放的视频文件;

信息获取模块,用于获取所述视频文件及所述视频文件对应的蒙版文件,所述蒙版文件用于标识所述视频文件中视频帧的目标区域,所述目标区域用于表征所述视频帧中的目标对象;

信息发送模块,用于向所述终端发送所述视频文件、所述蒙版文件及所述视频文件对应的弹幕信息。

可选的,所述信息获取模块,包括:

目标视频帧获取子模块,用于获取所述视频文件中的目标视频帧,所述目标视频帧的镜头类型为预设镜头类型;

目标对象分割子模块,用于对所述目标视频帧中的目标对象进行分割,得到所述目标对象在所述目标视频帧中的区域位置;

信息生成子模块,用于生成所述目标视频帧的蒙版信息和时间戳信息,所述蒙版信息用于标识所述目标对象在所述目标视频帧中的区域位置;

蒙版文件生成子模块,用于生成所述视频文件对应的蒙版文件,所述蒙版文件包含所述视频文件中目标视频帧的蒙版信息及时间戳信息。

可选的,所述目标视频帧获取子模块,具体用于:

检测所述视频文件中每一视频帧的镜头类型,所述镜头类型包括:特写镜头类型、近景镜头类型、中景镜头类型、全景镜头类型或远景镜头类型;

将属于预设镜头类型的视频帧作为目标视频帧,所述预设镜头类型为所述特写镜头类型、近景镜头类型或中景镜头类型。

可选的,所述目标视频帧获取子模块,具体用于:

确定视频帧中包含的每一目标对象对应的目标面积比,其中,所述目标面积比为目标对象与所述目标视频帧的面积比;

判断所确定的各个目标面积比中是否存在大于预设面积比的面积比,若为是,将所述视频帧的镜头类型确定为预设镜头类型。

可选的,所述目标对象分割子模块,具体用于:

采用deeplabv3+深度学习分割算法对所述目标视频帧中的目标对象进行分割。

可选的,所述目标对象分割子模块,具体用于:

获取所述目标视频帧中的前景图像,所述前景图像包括多个前景对象;

将所述多个前景对象面积中大于预设面积的对象作为目标对象,并分割出所述目标对象。

可选的,所述装置还包括:

蒙版信息检测模块,用于在所述蒙版文件发送模块向所述终端发送所述蒙版文件之前,检测所述蒙版文件中的重复蒙版信息,所述重复蒙版信息为连续目标视频帧分别对应的信息内容一致的蒙版信息;

蒙版信息处理模块,用于保留所述重复蒙版信息中的首个蒙版信息,并将所述重复蒙版信息中的其余蒙版信息删除,所述首个蒙版信息表征所述重复蒙版信息中每个目标视频帧对应的蒙版信息。

第四方面,本发明实施例提供了一种信息处理装置,所述信息处理装置应用于终端,所述装置包括:

请求发送模块,用于向服务器发送视频文件请求,所述视频文件请求用于请求待播放的视频文件;

信息接收模块,用于接收所述服务器发送的所述视频文件、所述视频文件对应的蒙版文件及所述视频文件对应的弹幕信息,所述蒙版文件用于标识所述视频文件中视频帧的目标区域,所述目标区域用于表征所述视频帧中的目标对象;

视频文件播放模块,用于播放所述视频文件,所述终端在播放视频文件的过程中按照所述蒙版文件加载所述弹幕信息,所述弹幕信息在视频帧中除所述目标区域之外的区域显示。

可选的,所述蒙版文件包括目标视频帧的蒙版信息和时间戳信息,所述目标视频帧的镜头类型为预设镜头类型。

可选的,视频文件播放模块,具体用于:

所述终端在播放视频文件过程中检测所述蒙版文件中所述目标视频帧对应的蒙版信息是否缺失;

如果所述目标视频帧对应的蒙版信息缺失,所述终端将前一视频帧对应的蒙版信息作为所述目标视频帧对应的蒙版信息,所述前一视频帧为所述目标视频帧在所述时间戳信息上对应的上一个视频帧。

第五方面,本发明实施例还提供了一种服务器,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现第一方面所述的信息处理方法。

第六方面,本发明实施例还提供了一种终端,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现第二方面所述的信息处理方法。

第七方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行第一方面所述的信息处理方法。

第八方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行第二方面所述的信息处理方法。

第九方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行第一方面所述的信息处理方法。

第十方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行第二方面所述的信息处理方法。

本发明实施例提供的技术方案,终端向服务器请求视频文件时,向服务器发送视频文件请求,服务器接收到终端发送的视频文件请求后,获取视频文件及视频文件对应的蒙版文件,其中,蒙版文件用于标识视频文件中视频帧的目标区域,目标区域用于表征视频帧中的目标对象;并向终端发送视频文件、蒙版文件及视频文件对应的弹幕信息。终端接收到服务器发送的视频文件、蒙版文件及视频文件对应的弹幕信息后,播放视频文件,并且,终端在播放视频文件的过程中按照蒙版文件加载弹幕信息,并将弹幕信息显示在视频帧中除目标区域之外的区域。可见,通过本发明实施例提供的技术方案,弹幕信息不会遮挡视频帧中的目标对象,用户在观看弹幕信息的同时,还可以清楚地观看视频帧中的目标对象,提高了用户观看视频的体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例所提供的一种服务器与终端交互的示意图;

图2为本发明实施例所提供的一种应用于服务器的信息处理方法的流程图;

图3为本发明实施例所提供的一种显示弹幕信息的视频帧的示意图;

图4为本发明实施例所提供的一种服务器获取视频文件对应的蒙版文件的流程图;

图5为本发明实施例所提供的一种镜头类型为中景镜头类型的视频帧的示意图;

图6为本发明实施例所提供的一种镜头类型为远景镜头类型的视频帧的示意图;

图7为本发明实施例所提供的一种应用于终端的信息处理方法的流程图;

图8为本发明实施例所提供的一种应用于服务器的信息处理装置的示意图;

图9为本发明实施例所提供的一种应用于终端的信息处理装置的示意图;

图10为本发明实施例所提供的一种服务器的结构示意图;

图11为本发明实施例所提供的一种终端的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。

为了解决背景技术中记载的技术问题,本发明实施例提供了一种信息处理方法及装置,以提高用户观看视频的体验。

第一方面,下面首先对本发明实施例所提供的一种息处理方法进行介绍。

需要说明的是,本发明实施例所提供的一种信息处理方法的执行主体可以为一种信息处理装置,该信息处理装置可以运行于一种信息处理系统中用于信息处理的服务器中。

在实际应用中,如图1所示,该信息处理系统可以包括:服务器和终端,此时,服务器和终端的交互过程如图1所示。具体的,

s110,终端向服务器发送视频文件请求。

其中,视频文件请求用于请求待播放的视频文件。

s120,服务器在接收到终端发送的视频文件请求后,获取待播放的视频文件及待播放的视频文件对应的蒙版文件,该蒙版文件用于标识视频文件中视频帧的目标区域,该目标区域用于表征视频帧中的目标对象。

s130,服务器向终端发送待播放的视频文件、待播放的视频文件对应的蒙版文件及待播放的视频文件对应的弹幕信息。

s140,终端播放服务器向其发送的视频文件,终端在播放视频文件的过程中按照蒙版文件加载弹幕信息,弹幕信息在视频帧中除目标区域之外的区域显示。

下面将对本发明实施例提供的一种应用于服务器侧的信息处理方法进行详细阐述。

如图2所示,本发明实施例所提供的一种应用于服务器的信息处理方法,可以包括如下步骤:

s210,服务器接收终端发送的视频文件请求,其中,视频文件请求用于请求待播放的视频文件;

终端向服务器请求视频文件时,可以向服务器发送视频文件请求,该视频文件请求可以携带有视频文件的标识信息,这样,服务器在接收到服务器发送的视频文件请求后,可以根据视频文件请求中携带的标识信息确定终端向其请求的视频文件。

s220,服务器获取视频文件及视频文件对应的蒙版文件,蒙版文件用于标识视频文件中视频帧的目标区域,目标区域用于表征视频帧中的目标对象。

服务器确定了终端向其请求的视频文件后,可以获取视频文件以及视频文件对应的蒙版文件,该蒙版文件用于标识视频文件中视频帧的目标区域,目标区域用于表征视频帧中的目标对象,也就是说,蒙版文件用于标识目标对象在视频文件中的区域位置。

需要说明的是,目标对象通常为用户感兴趣的对象,因此,用户在观看视频文件的过程中,不希望弹幕信息遮挡目标对象,以清楚地观看目标对象。例如,用户在观看视频帧时,通常对人物的面部表情较为感兴趣,因此,目标对象可以为人物的脸部区域。当然,在实际应用中,目标对象还可以是整个人物图像、动物图像或植物图像等,本发明实施例对目标对象不做具体限定。

举例而言,若视频文件为关于人物的视频文件,此时,视频帧中的目标对象可以为人物图像,视频帧的目标区域可以为人物图像在视频帧中所占的区域。由于不同的视频帧中,所显示的画面可能相同,也可能不同,因此,不同视频帧中的人物图像可能相同,也可能不同。对于同一视频帧而言,目标对象可以是人物的脸部区域和身体区域,也可以是人物的脸部区域,还可以是人物的身体区域。

若视频文件为关于动物的视频,那么视频帧中的目标对象可以为动物图像,视频帧的目标区域为动物图像在视频帧中所占的区域。并且,对于同一视频帧而言,目标对象可以是动物的头部区域和身体区域,也可以是动物的头部区域,还可以是动物的身体区域。

为了方案完整和描述清楚,将在下面实施例中对服务器获取视频文件对应的蒙版文件的过程进行详细阐述。

s230,服务器向终端发送视频文件、蒙版文件及视频文件对应的弹幕信息。

服务器在获取到视频文件、视频文件对应的蒙版文件以及视频文件对应的弹幕信息后,可以将视频文件、视频文件对应的蒙版文件以及视频文件对应的弹幕信息发送至终端。

终端在接收到服务器发送的视频文件、视频文件对应的蒙版文件以及视频文件对应的弹幕信息后,可以播放视频文件,并在播放视频文件的过程中,按照蒙版文件加载弹幕信息,并将弹幕信息显示在视频帧中除目标区域之外的区域中。具体的,终端播放视频文件中的每一视频帧时,可以根据蒙版文件确定该视频帧的目标区域,并将该视频帧对应的弹幕信息显示在该视频帧中除目标区域之外的区域中;可以理解的是,如果终端根据蒙版文件未确定出该视频帧的目标区域,则可以将弹幕信息显示在该视频帧中的任一区域。

由于目标区域是目标对象在视频帧中的区域,且目标对象通常是用户比较感兴趣的对象,因此,通过将弹幕信息显示在视频帧中除目标区域之外的区域中,可以避免因弹幕信息显示在目标区域中而导致弹幕信息遮挡目标对象,从而用户在观看弹幕信息的同时,还可以清楚地观看视频帧中的目标对象,提高了用户观看视频的体验。

举例而言,如图3所示,视频帧中的目标对象为人物图像,视频帧中的目标区域为人物图像在视频帧中所占的区域,终端将弹幕信息显示在视频帧中除目标区域之外的区域中,从而用户在观看弹幕信息的同时,还能够清楚地观看视频帧中的人物图像。

本发明实施例提供的技术方案,终端向服务器请求视频文件时,向服务器发送视频文件请求,服务器接收到终端发送的视频文件请求后,获取视频文件及视频文件对应的蒙版文件,其中,蒙版文件用于标识视频文件中视频帧的目标区域,目标区域用于表征视频帧中的目标对象;并向终端发送视频文件、蒙版文件及视频文件对应的弹幕信息。终端接收到服务器发送的视频文件、蒙版文件及视频文件对应的弹幕信息后,播放视频文件,并且,终端在播放视频文件的过程中按照蒙版文件加载弹幕信息,并将弹幕信息显示在视频帧中除目标区域之外的区域。可见,通过本发明实施例提供的技术方案,弹幕信息不会遮挡视频帧中的目标对象,用户在观看弹幕信息的同时,还可以清楚地观看视频帧中的目标对象,提高了用户观看视频的体验。

为了方案完整及描述清楚,下面将对服务器获取视频文件对应的蒙版文件进行详细的阐述。

如图4所示,服务器获取视频文件对应的蒙版文件的步骤,可以包括:

s410,服务器获取视频文件中的目标视频帧,目标视频帧的镜头类型为预设镜头类型。

一个视频文件通常包括多个视频帧,且每个视频帧的镜头类型可能相同,也可能不同。在实际应用中,视频帧的镜头类型可以为特写镜头类型、近景镜头类型、中景镜头类型、全景镜头类型或远景镜头类型。

举例而言,假设目标对象为人物图像。

视频帧的镜头类型为特写镜头类型时,主体人物的面部区域与视频帧的面积比大于1/3,其中,主体人物为视频帧中的主角人物。需要说明的是,可以基于深度神经网络的mtcnn算法来定位主体人物的面部区域,mtcnn算法可以较为准确地定位画面中的人脸的关键位置,并计算人脸区域的面积区域与视频帧中的面积比。本领域技术人员可以理解mtcnn算法,在此不再对mtcnn算法进行赘述。

视频帧的镜头类型为近景镜头类型时,主体人物腰部以上肢体出现在视频帧中。

视频帧的镜头类型为中景镜头类型时,主体人物膝盖以上肢体出现在视频帧中,如图5所示。

视频帧的镜头类型为全景镜头类型时,主体人物全部出现在屏幕中,主体人物的高度大于视频帧高度的一半。

视频帧的镜头类型为远景镜头类型时,主体人物高度小于视频帧高度的一半,如图6所示。

当然,上述只是以举例的形式对视频帧的各个镜头类型进行了描述,本发明实施例对视频帧的各个视频帧的镜头类型不做具体限定。

在一种实施方式中,服务器获取视频文件中的目标视频帧,可以包括:

服务器检测视频文件中每一视频帧的镜头类型,镜头类型包括:特写镜头类型、近景镜头类型、中景镜头类型、全景镜头类型或远景镜头类型;

服务器将属于预设镜头类型的视频帧作为目标视频帧,预设镜头类型为特写镜头类型、近景镜头类型或中景镜头类型。

在该实施方式中,服务器检测视频文件中每一视频帧的镜头类型,并将属于预设镜头类型的视频帧作为目标视频帧,有利于后续步骤中服务器对目标视频帧中的目标对象进行分割。

在一种实施方式中,服务器确定视频文件中任一视频帧的镜头类型的过程,可以包括:

确定视频帧中包含的每一目标对象对应的目标面积比,其中,目标面积比为目标对象与目标视频帧的面积比;

判断所确定的各个目标面积比中是否存在大于预设面积比的面积比,若为是,将视频帧的镜头类型确定为预设镜头类型。

需要说明的是,确定目标对象的面积的方式可以有多种,本发明实施例对此不做具体限定。预设面积比可以根据实际情况进行设定,本发明实施例对预设面积比不做具体限定。

s420,服务器对目标视频帧中的目标对象进行分割,得到目标对象在目标视频帧中的区域位置。

由于目标视频帧的镜头类型为特写镜头类型、近景镜头类型或中景镜头类型,因此,在目标视频帧中存在占视频帧面积比较大的目标对象,这些目标对象通常为用户较为感兴趣的对象,因此,服务器对目标视频帧中的目标对象进行分割,以得到目标对象在视频帧中的区域位置。

在一种实施方式中,服务器对目标视频帧中的目标对象进行分割的步骤,可以包括:

采用deeplabv3+深度学习分割算法对目标视频帧中的目标对象进行分割。

其中,deeplabv3+深度学习分割算法是一种前景背景分割算法,通过deeplabv3+深度学习可以较为准确得到目标视频帧中的目标对象分割出来,目标对象所在的目标区域与视频帧除目标区域的其他区域可以用二值化图像来表示,值为1的像素点组成的区域可以为目标对象所在的目标区域,值为0的像素点组成的区域可以为视频帧中除目标区域的其他区域。

为了更加精确地确定出视频文件中的目标对象,在一种实施方式中,服务器对目标视频帧中的目标对象进行分割的步骤,可以包括:

服务器获取目标视频帧中的前景图像,前景图像包括多个前景对象;

服务器将多个前景对象中面积大于预设面积的对象作为目标对象,并分割出目标对象。

由于目标视频帧中的前景图像中可能多个前景对象,一部分前景对象的面积较大,该部分前景对象通常为用户较为感兴趣的对象;而另一部分前景对象的面积较小,该部分前景对象通常不是用户感兴趣的对象,因此,服务器在得到多个前景对象后,可以将前景对象中面积大于预设面积的对象作为目标对象。

需要说明的是,在得到目标对象后,可以利用“腐蚀”或“膨胀”等图像形态学处理算法对目标对象进行精细地裁剪,以更加准确地确定目标对象所在的目标区域。

s430,服务器生成目标视频帧的蒙版信息和时间戳信息,蒙版信息用于标识目标对象在目标视频帧中的区域位置。

服务器在得到目标对象在目标视频中的区域位置之后,可以生成目标视频帧的蒙版信息和时间戳信息。蒙版信息用于标识目标对象在目标视频帧中的区域位置。其中,蒙版信息的形式可以为矩阵,矩阵中的元素值可以为0或1,举例而言,目标视频帧的分辨率为640*480,那么,蒙版信息可以为640行,480列的矩阵,矩阵中的各个元素与视频帧中的各个像素点一一对应。其中,元素值为1组成的区域可以对应目标对象所在的目标区域;元素值0组成的区域可以对应视频帧中除目标区域之外的区域。

当然,蒙版信息的形式不限于矩阵形式,蒙版信息的内容也不限于0或1,本发明对蒙版信息不作具体限定。

s440,服务器生成视频文件对应的蒙版文件,蒙版文件包含视频文件中目标视频帧的蒙版信息及时间戳信息。

服务器生成目标视频帧的蒙版信息和时间戳信息后,可以生成视频文件对应的蒙版文件,其中,蒙版文件包含视频文件中目标视频帧的蒙版信息及时间戳信息。当然,蒙版文件中除了包含视频文件中目标视频帧的蒙版信息及时间戳信息,还可以包括其他辅助信息,如目标区域的宽度,高度,视频宽度,视频高度等,本发明实施例对蒙版文件所包含的信息内容不作具体限定。

需要强调的是,每一目标视频帧对应一个时间戳信息以及一个蒙版信息。在蒙版文件中,目标视频帧的时间戳信息与蒙版信息具有对应关系。

可以理解的是,一个视频文件中连续多帧目标视频帧的相似度可能较高,此时,这多帧目标视频帧对应的蒙版信息的信息内容相似度较高,即这多帧目标视频帧对应的蒙版信息的信息内容相一致。为了减少传输蒙版文件所需的网络流量,在一种实施方式中,服务器向终端发送蒙版文件之前,所述信息处理方法还可以包括:

服务器检测蒙版文件中的重复蒙版信息,重复蒙版信息为连续目标视频帧分别对应的信息内容一致的蒙版信息;

服务器保留重复蒙版信息中的首个蒙版信息,并将重复蒙版信息中的其余蒙版信息删除,首个蒙版信息表征重复蒙版信息中每个目标视频帧对应的蒙版信息。

在另一种实施方式中,服务器可以保留重复蒙版信息中的任一蒙版信息,并将重复蒙版信息中除该蒙版信息的其他蒙版信息删除,并且,将重复蒙版信息中的各个蒙版信息对应的时间戳信息与该蒙版信息关联起来,这样,该蒙版信息表征重复蒙版信息中每个目标视频帧对应的蒙版信息。

第二方面,本发明实施例提供了一种应用于终端侧的信息处理方法。

如图7所示,本发明实施例提供的一种应用于终端的信息处理方法,可以包括如下步骤:

s710,终端向服务器发送视频文件请求,视频文件请求用于请求待播放的视频文件。

终端向服务器请求视频文件时,可以向服务器发送视频文件请求,该视频文件请求可以携带有视频文件的标识信息,这样,服务器在接收到服务器发送的视频文件请求后,可以根据视频文件请求中携带的标识信息确定终端向其请求的视频文件。

s720,终端接收服务器发送的视频文件、视频文件对应的蒙版文件及视频文件对应的弹幕信息,蒙版文件用于标识视频文件中视频帧的目标区域,目标区域用于表征视频帧中的目标对象。

服务器确定了终端向其请求的视频文件后,可以获取视频文件以及视频文件对应的蒙版文件,该蒙版文件用于标识视频文件中视频帧的目标区域,目标区域用于表征视频帧中的目标对象,也就是说,蒙版文件用于标识目标对象在视频文件中的区域位置。

需要说明的是,目标对象通常为用户感兴趣的对象,因此,用户在观看视频文件的过程中,不希望弹幕信息遮挡目标对象,以清楚地观看目标对象。例如,用户在观看视频帧时,通常对人物的面部表情较为感兴趣,因此,目标对象可以为人物的脸部区域。当然,在实际应用中,目标对象还可以是整个人物图像、动物图像或植物图像等,本发明实施例对目标对象不做具体限定。

s730,终端播放视频文件,终端在播放视频文件的过程中按照蒙版文件加载弹幕信息,弹幕信息在视频帧中除目标区域之外的区域显示。

终端在接收到服务器发送的视频文件、视频文件对应的蒙版文件以及视频文件对应的弹幕信息后,可以播放视频文件,并在播放视频文件的过程中按照蒙版文件加载弹幕信息,并将弹幕信息显示在视频帧中除目标区域之外的区域中。具体的,终端播放视频文件中的每一视频帧时,可以根据蒙版文件确定该视频帧的目标区域,并将该视频帧对应的弹幕信息显示在该视频帧中除目标区域之外的区域中;可以理解的是,如果终端根据蒙版文件未确定出该视频帧的目标区域,则可以将弹幕信息显示在该视频帧中的任一区域。

由于目标区域是目标对象在视频帧中的区域,且目标对象通常是用户比较感兴趣的对象,因此,通过将弹幕信息显示在视频帧中除目标区域之外的区域中,可以避免因弹幕信息显示在目标区域中而导致弹幕信息遮挡目标对象,从而用户在观看弹幕信息的同时,还可以清楚地观看视频帧中的目标对象,提高了用户观看视频的体验。

在一种实施方式中,蒙版文件包括目标视频帧的蒙版信息和时间戳信息,目标视频帧的镜头类型为预设镜头类型。

在第一方面实施例已经对蒙版文件以及镜头类型进行了详细阐述,在此不再赘述。

作为本发明实施例的一种实现方式,终端在播放视频文件的过程中按照蒙版文件加载弹幕信息,可以包括:

终端在播放视频文件过程中检测蒙版文件中目标视频帧对应的蒙版信息是否缺失;

如果目标视频帧对应的蒙版信息缺失,终端将前一视频帧对应的蒙版信息作为目标视频帧对应的蒙版信息,前一视频帧为目标视频帧在时间戳信息上对应的上一个视频帧。

在该实现方式中,服务器为了减少传输蒙版文件所需的网络流量,检测蒙版文件中的重复蒙版信息,重复蒙版信息为连续目标视频帧分别对应的信息内容一致的蒙版信息;服务器保留重复蒙版信息中的首个蒙版信息,并将重复蒙版信息中的其余蒙版信息删除,首个蒙版信息表征重复蒙版信息中每个目标视频帧对应的蒙版信息。因此,终端在播放视频文件过程中检测蒙版文件中目标视频帧对应的蒙版信息是否缺失,如果目标视频帧对应的蒙版信息缺失,终端将前一视频帧对应的蒙版信息作为目标视频帧对应的蒙版信息,前一视频帧为目标视频帧在时间戳信息上对应的上一个视频帧。

本发明实施例提供的技术方案,终端向服务器请求视频文件时,向服务器发送视频文件请求,服务器接收到终端发送的视频文件请求后,获取视频文件及视频文件对应的蒙版文件,其中,蒙版文件用于标识视频文件中视频帧的目标区域,目标区域用于表征视频帧中的目标对象;并向终端发送视频文件、蒙版文件及视频文件对应的弹幕信息。终端接收到服务器发送的视频文件、蒙版文件及视频文件对应的弹幕信息后,播放视频文件,并且,终端在播放视频文件的过程中按照蒙版文件加载弹幕信息,并将弹幕信息显示在视频帧中除目标区域之外的区域。可见,通过本发明实施例提供的技术方案,弹幕信息不会遮挡视频帧中的目标对象,用户在观看弹幕信息的同时,还可以清楚地观看视频帧中的目标对象,提高了用户观看视频的体验。

第三方面,本发明实施例提供了一种信息处理装置,所述信息处理装置应用于服务器,如图8所示,所述装置包括:

请求接收模块810,用于接收终端发送的视频文件请求,其中,所述视频文件请求用于请求待播放的视频文件;

信息获取模块820,用于获取所述视频文件及所述视频文件对应的蒙版文件,所述蒙版文件用于标识所述视频文件中视频帧的目标区域,所述目标区域用于表征所述视频帧中的目标对象;

信息发送模块830,用于向所述终端发送所述视频文件、所述蒙版文件及所述视频文件对应的弹幕信息。

本发明实施例提供的技术方案,终端向服务器请求视频文件时,向服务器发送视频文件请求,服务器接收到终端发送的视频文件请求后,获取视频文件及视频文件对应的蒙版文件,其中,蒙版文件用于标识视频文件中视频帧的目标区域,目标区域用于表征视频帧中的目标对象;并向终端发送视频文件、蒙版文件及视频文件对应的弹幕信息。终端接收到服务器发送的视频文件、蒙版文件及视频文件对应的弹幕信息后,播放视频文件,并且,终端在播放视频文件的过程中按照蒙版文件加载弹幕信息,并将弹幕信息显示在视频帧中除目标区域之外的区域。可见,通过本发明实施例提供的技术方案,弹幕信息不会遮挡视频帧中的目标对象,用户在观看弹幕信息的同时,还可以清楚地观看视频帧中的目标对象,提高了用户观看视频的体验。

可选的,所述信息获取模块,包括:

目标视频帧获取子模块,用于获取所述视频文件中的目标视频帧,所述目标视频帧的镜头类型为预设镜头类型;

目标对象分割子模块,用于对所述目标视频帧中的目标对象进行分割,得到所述目标对象在所述目标视频帧中的区域位置;

信息生成子模块,用于生成所述目标视频帧的蒙版信息和时间戳信息,所述蒙版信息用于标识所述目标对象在所述目标视频帧中的区域位置;

蒙版文件生成子模块,用于生成所述视频文件对应的蒙版文件,所述蒙版文件包含所述视频文件中目标视频帧的蒙版信息及时间戳信息。

可选的,所述目标视频帧获取子模块,具体用于:

检测所述视频文件中每一视频帧的镜头类型,所述镜头类型包括:特写镜头类型、近景镜头类型、中景镜头类型、全景镜头类型或远景镜头类型;

将属于预设镜头类型的视频帧作为目标视频帧,所述预设镜头类型为所述特写镜头类型、近景镜头类型或中景镜头类型。

可选的,所述目标视频帧获取子模块,具体用于:

确定视频帧中包含的每一目标对象对应的目标面积比,其中,所述目标面积比为目标对象与所述目标视频帧的面积比;

判断所确定的各个目标面积比中是否存在大于预设面积比的面积比,若为是,将所述视频帧的镜头类型确定为预设镜头类型。

可选的,所述目标对象分割子模块,具体用于:

采用deeplabv3+深度学习分割算法对所述目标视频帧中的目标对象进行分割。

可选的,所述目标对象分割子模块,具体用于:

获取所述目标视频帧中的前景图像,所述前景图像包括多个前景对象;

将所述多个前景对象面积中大于预设面积的对象作为目标对象,并分割出所述目标对象。

可选的,所述装置还包括:

蒙版信息检测模块,用于在所述蒙版文件发送模块向所述终端发送所述蒙版文件之前,检测所述蒙版文件中的重复蒙版信息,所述重复蒙版信息为连续目标视频帧分别对应的信息内容一致的蒙版信息;

蒙版信息处理模块,用于保留所述重复蒙版信息中的首个蒙版信息,并将所述重复蒙版信息中的其余蒙版信息删除,所述首个蒙版信息表征所述重复蒙版信息中每个目标视频帧对应的蒙版信息。

第四方面,本发明实施例提供了一种信息处理装置,所述信息处理装置应用于终端,如图9所示,所述装置包括:

请求发送模块910,用于向服务器发送视频文件请求,所述视频文件请求用于请求待播放的视频文件;

信息接收模块920,用于接收所述服务器发送的所述视频文件、所述视频文件对应的蒙版文件及所述视频文件对应的弹幕信息,所述蒙版文件用于标识所述视频文件中视频帧的目标区域,所述目标区域用于表征所述视频帧中的目标对象;

视频文件播放模块930,用于播放所述视频文件,所述终端在播放视频文件的过程中按照所述蒙版文件加载所述弹幕信息,所述弹幕信息在视频帧中除所述目标区域之外的区域显示。

本发明实施例提供的技术方案,终端向服务器请求视频文件时,向服务器发送视频文件请求,服务器接收到终端发送的视频文件请求后,获取视频文件及视频文件对应的蒙版文件,其中,蒙版文件用于标识视频文件中视频帧的目标区域,目标区域用于表征视频帧中的目标对象;并向终端发送视频文件、蒙版文件及视频文件对应的弹幕信息。终端接收到服务器发送的视频文件、蒙版文件及视频文件对应的弹幕信息后,播放视频文件,并且,终端在播放视频文件的过程中按照蒙版文件加载弹幕信息,并将弹幕信息显示在视频帧中除目标区域之外的区域。可见,通过本发明实施例提供的技术方案,弹幕信息不会遮挡视频帧中的目标对象,用户在观看弹幕信息的同时,还可以清楚地观看视频帧中的目标对象,提高了用户观看视频的体验。

可选的,所述蒙版文件包括目标视频帧的蒙版信息和时间戳信息,所述目标视频帧的镜头类型为预设镜头类型。

可选的,视频文件播放模块,具体用于:

所述终端在播放视频文件过程中检测所述蒙版文件中所述目标视频帧对应的蒙版信息是否缺失;

如果所述目标视频帧对应的蒙版信息缺失,所述终端将前一视频帧对应的蒙版信息作为所述目标视频帧对应的蒙版信息,所述前一视频帧为所述目标视频帧在所述时间戳信息上对应的上一个视频帧。

第五方面,本发明实施例还提供了一种服务器,如图10所示,包括处理器1001、通信接口1002、存储器1003和通信总线1004,其中,处理器1001,通信接口1002,存储器1003通过通信总线1004完成相互间的通信,

存储器1003,用于存放计算机程序;

处理器1001,用于执行存储器1003上所存放的程序时,实现第一方面所述的信息处理方法。

本发明实施例提供的技术方案,终端向服务器请求视频文件时,向服务器发送视频文件请求,服务器接收到终端发送的视频文件请求后,获取视频文件及视频文件对应的蒙版文件,其中,蒙版文件用于标识视频文件中视频帧的目标区域,目标区域用于表征视频帧中的目标对象;并向终端发送视频文件、蒙版文件及视频文件对应的弹幕信息。终端接收到服务器发送的视频文件、蒙版文件及视频文件对应的弹幕信息后,播放视频文件,并且,终端在播放视频文件的过程中按照蒙版文件加载弹幕信息,并将弹幕信息显示在视频帧中除目标区域之外的区域。可见,通过本发明实施例提供的技术方案,弹幕信息不会遮挡视频帧中的目标对象,用户在观看弹幕信息的同时,还可以清楚地观看视频帧中的目标对象,提高了用户观看视频的体验。

上述服务器提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,简称pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,简称eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述服务器与其他设备之间的通信。

存储器可以包括随机存取存储器(randomaccessmemory,简称ram),也可以包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,简称np)等;还可以是数字信号处理器(digitalsignalprocessing,简称dsp)、专用集成电路(applicationspecificintegratedcircuit,简称asic)、现场可编程门阵列(field-programmablegatearray,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

第六方面,本发明实施例还提供了一种终端,如图11所示,包括处理器1101、通信接口1102、存储器1103和通信总线1104,其中,处理器1101,通信接口1102,存储器1103通过通信总线1104完成相互间的通信,

存储器1103,用于存放计算机程序;

处理器1101,用于执行存储器1103上所存放的程序时,实现第二方面所述的信息处理方法。

本发明实施例提供的技术方案,终端向服务器请求视频文件时,向服务器发送视频文件请求,服务器接收到终端发送的视频文件请求后,获取视频文件及视频文件对应的蒙版文件,其中,蒙版文件用于标识视频文件中视频帧的目标区域,目标区域用于表征视频帧中的目标对象;并向终端发送视频文件、蒙版文件及视频文件对应的弹幕信息。终端接收到服务器发送的视频文件、蒙版文件及视频文件对应的弹幕信息后,播放视频文件,并且,终端在播放视频文件的过程中按照蒙版文件加载弹幕信息,并将弹幕信息显示在视频帧中除目标区域之外的区域。可见,通过本发明实施例提供的技术方案,弹幕信息不会遮挡视频帧中的目标对象,用户在观看弹幕信息的同时,还可以清楚地观看视频帧中的目标对象,提高了用户观看视频的体验。

上述终端提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,简称pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,简称eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述终端与其他设备之间的通信。

存储器可以包括随机存取存储器(randomaccessmemory,简称ram),也可以包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,简称np)等;还可以是数字信号处理器(digitalsignalprocessing,简称dsp)、专用集成电路(applicationspecificintegratedcircuit,简称asic)、现场可编程门阵列(field-programmablegatearray,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

第七方面,在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中第一方面所示的信息处理方法。

本发明实施例提供的技术方案,终端向服务器请求视频文件时,向服务器发送视频文件请求,服务器接收到终端发送的视频文件请求后,获取视频文件及视频文件对应的蒙版文件,其中,蒙版文件用于标识视频文件中视频帧的目标区域,目标区域用于表征视频帧中的目标对象;并向终端发送视频文件、蒙版文件及视频文件对应的弹幕信息。终端接收到服务器发送的视频文件、蒙版文件及视频文件对应的弹幕信息后,播放视频文件,并且,终端在播放视频文件的过程中按照蒙版文件加载弹幕信息,并将弹幕信息显示在视频帧中除目标区域之外的区域。可见,通过本发明实施例提供的技术方案,弹幕信息不会遮挡视频帧中的目标对象,用户在观看弹幕信息的同时,还可以清楚地观看视频帧中的目标对象,提高了用户观看视频的体验。

第八方面,在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中第二方面所示的信息处理方法。

本发明实施例提供的技术方案,终端向服务器请求视频文件时,向服务器发送视频文件请求,服务器接收到终端发送的视频文件请求后,获取视频文件及视频文件对应的蒙版文件,其中,蒙版文件用于标识视频文件中视频帧的目标区域,目标区域用于表征视频帧中的目标对象;并向终端发送视频文件、蒙版文件及视频文件对应的弹幕信息。终端接收到服务器发送的视频文件、蒙版文件及视频文件对应的弹幕信息后,播放视频文件,并且,终端在播放视频文件的过程中按照蒙版文件加载弹幕信息,并将弹幕信息显示在视频帧中除目标区域之外的区域。可见,通过本发明实施例提供的技术方案,弹幕信息不会遮挡视频帧中的目标对象,用户在观看弹幕信息的同时,还可以清楚地观看视频帧中的目标对象,提高了用户观看视频的体验。

第九方面,在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中第一方面所示的信息处理方法。

本发明实施例提供的技术方案,终端向服务器请求视频文件时,向服务器发送视频文件请求,服务器接收到终端发送的视频文件请求后,获取视频文件及视频文件对应的蒙版文件,其中,蒙版文件用于标识视频文件中视频帧的目标区域,目标区域用于表征视频帧中的目标对象;并向终端发送视频文件、蒙版文件及视频文件对应的弹幕信息。终端接收到服务器发送的视频文件、蒙版文件及视频文件对应的弹幕信息后,播放视频文件,并且,终端在播放视频文件的过程中按照蒙版文件加载弹幕信息,并将弹幕信息显示在视频帧中除目标区域之外的区域。可见,通过本发明实施例提供的技术方案,弹幕信息不会遮挡视频帧中的目标对象,用户在观看弹幕信息的同时,还可以清楚地观看视频帧中的目标对象,提高了用户观看视频的体验。

第十方面,在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中第二方面所示的信息处理方法。

本发明实施例提供的技术方案,终端向服务器请求视频文件时,向服务器发送视频文件请求,服务器接收到终端发送的视频文件请求后,获取视频文件及视频文件对应的蒙版文件,其中,蒙版文件用于标识视频文件中视频帧的目标区域,目标区域用于表征视频帧中的目标对象;并向终端发送视频文件、蒙版文件及视频文件对应的弹幕信息。终端接收到服务器发送的视频文件、蒙版文件及视频文件对应的弹幕信息后,播放视频文件,并且,终端在播放视频文件的过程中按照蒙版文件加载弹幕信息,并将弹幕信息显示在视频帧中除目标区域之外的区域。可见,通过本发明实施例提供的技术方案,弹幕信息不会遮挡视频帧中的目标对象,用户在观看弹幕信息的同时,还可以清楚地观看视频帧中的目标对象,提高了用户观看视频的体验。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solidstatedisk(ssd))等。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、服务器、终端、存储介质及计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1