基于视频分析的景别划分的方法及系统与流程

文档序号:13095198阅读:544来源:国知局
基于视频分析的景别划分的方法及系统与流程

本发明涉及数据库技术领域,更具体地,涉及一种基于视频分析的景别划分的方法及系统。



背景技术:

伴随多媒体技术的快速发展,与视频相关的应用不断增多,要想获取视频中所包含的大量数据,需要对该视频进行数据分析。

其中,导演系的老师在教学时或者导演在研究一段视频拍摄方式时,首先通过视频分割的方式,将一个视频段分割成多个镜头,逐个分析每个镜头的展现形式,并进行景别的划分。其中关于景别的划分是尤为基础且重要的。

由于摄影机与被摄体的间离不同,使被摄体在视频画面中呈现出大小不同的显示效果,因此表现出不同的景别。其中,景别的划分,一般可分为五种,由近至远分别为:特写(指人体肩部以上)、近景(指人体胸部以上)、中景(指人体膝部以上)、全景(人体的全部和周围背景)和远景(被摄体所处环境)。

在视频中,如电影、广告、宣传片等,导演和摄影师利用复杂多变的场面调度和镜头调度,交替地使用各种不同的景别,可以使影片剧情的叙述、人物思想感情的表达以及人物关系的处理更具有表现力,从而增强影片的艺术感染力。

现有的景别划分方法多是将视频片段分割后,通过人工观察的方法对分割后的各个镜头信息进行分析,依据景别的类型主观的将各个镜头信息划分为:特写、近景、中景、全景及远景。通过观察的方法主观辨识景别,存在识别效率低、合格率低、耗时且人工成本巨大等问题。

因此,提供一种基于视频分析的景别划分的方法及系统,解决现有技术中人工主观的景别辨识中,存在的人工成本高且效率低的问题,是本领域亟待解决的问题。



技术实现要素:

有鉴于此,本发明提供了一种基于视频分析的景别划分的方法及系统,解决现有技术中人工主观的景别辨识中,存在人工成本高且效率低的问题。

为了解决上述技术问题,本发明提出一种基于视频分析的景别划分的方法及系统,包括:

读取并依次获取视频片段中包含的所有视频帧;

根据相邻所述视频帧的连续性,将所述视频片段进行分割,获取组成所述视频片段的所有镜头信息;

对每个所述镜头信息中的视频帧进行画面采样,获取相应的采样点,将所述采样点与人体样本特征库进行匹配,获取相匹配的采样点数值;

将相匹配的所述采样点数值与预定义的匹配阈值相比较;

当相匹配的所述采样点数值小于预定义的匹配阈值时,所述镜头信息不包含人物帧,则所述镜头的景别为远景;

当相匹配的所述采样点数值大于等于预定义的匹配阈值时,所述镜头信息包含人物帧,获取所述镜头信息中人体的头部面积与显示屏幕面积的比值;

当所述镜头信息中人体头部面积占屏幕比例大于等于1/6时,所述镜头的景别为特景,当所述镜头信息中人体头部面积占屏幕比例小于1/6且大于等于1/48时,所述镜头的景别为近景,当所述镜头信息中人体头部面积占屏幕比例小于1/48且大于等于1/85时,所述镜头的景别为中景,当所述镜头信息中人体头部面积占屏幕比例小于1/85时,所述镜头的景别为全景。

优选地,根据相邻视频帧的连续性,将所述视频片段进行分割,获取组成所述视频片段的所有镜头信息;进一步为:

获取每个所述视频帧的特征点,将当前所述视频帧的特征点与前一所述视频帧的特征点进行匹配,获取相邻两个所述视频帧特征点相匹配的数量,并将相邻两个所述视频帧特征点相匹配的数量与特征点匹配阈值相比较;

当相邻两个所述视频帧特征点相匹配的数量大于等于所述特征点匹配阈值时,当前所述视频帧与前一所述视频帧具有连续性,属于同一镜头;

当相邻两个所述视频帧特征点相匹配的数量小于所述特征点匹配阈值时,当前所述视频帧与前一所述视频帧不具有连续性,分属不同镜头,进行视频分割。

优选地,对每个所述镜头信息中的视频帧进行画面采样,获取相应的采样点,将所述采样点与人体样本特征库进行匹配,获取相匹配的采样点数值;进一步为:

读取不同场景中人体图像的视频画面,获取人体图像样本点,构成人体样本特征库;

对每个所述镜头信息中视频帧进行画面采集,获取相应的采样点;

将所述采样点与所述人体样本特征库进行匹配,获取相匹配的采样点数值。

优选地,当相匹配的所述采样点数值大于等于预定义的匹配阈值时,所述镜头信息包含人物帧,获取所述镜头信息中人体的头部面积与显示屏幕面积的比值;进一步为:

当相匹配的所述采样点数值大于等于预定义的匹配阈值时,所述镜头信息包含人物帧;

根据所述人物帧的采样点数据,提取人体头部边界点坐标数据;

获取所述人体头部的宽度和高度数据,得到所述人体头部的面积;

获取所述人体的头部面积与显示屏幕面积的比例数据。

进一步地,还包括,一种基于视频分析的景别划分的系统,包括:视频读取模块、镜头分割模块、匹配模块、比较模块、远景定义模块、计算模块和景别划分模块,其中:

所述视频读取模块,与所述镜头分割模块相连接,用于读取并依次获取视频片段中包含的所有视频帧,将获取的所述视频帧传送至所述镜头分割模块;

所述镜头分割模块,分别与所述视频读取模块和匹配模块相连接,用于根据相邻所述视频帧的连续性,将所述视频片段进行分割,获取组成所述视频片段的所有镜头信息,将获取的所述镜头信息传送至所述匹配模块;

所述匹配模块,分别与所述镜头分割模块和比较模块相连接,用于对每个所述镜头信息中的视频帧进行画面采样,获取相应的采样点,将所述采样点与人体样本特征库进行匹配,获取相匹配的采样点数值,将相匹配的所述采样点数值传送至所述比较模块;

所述比较模块,分别与所述匹配模块、远景定义模块和计算模块相连接,用于将相匹配的所述采样点数值与预定义的匹配阈值相比较,并将比较的数据结果分别传送至所述远景定义模块和计算模块;

所述远景定义模块,与所述比较模块相连接,用于当相匹配的所述采样点数值小于预定义的匹配阈值时,所述镜头信息不包含人物帧,则所述镜头的景别为远景;

所述计算模块,分别与所述比较模块和景别划分模块相连接,用于当相匹配的所述采样点数值大于等于预定义的匹配阈值时,所述镜头信息包含人物帧,获取所述镜头信息中人体的头部面积与显示屏幕面积的比值,将二者面积比值结果传送至所述景别划分模块;

所述景别划分模块,与所述计算模块相连接,用于当所述镜头信息中人体头部面积占屏幕比例大于等于1/6时,所述镜头的景别为特景,当所述镜头信息中人体头部面积占屏幕比例小于1/6且大于等于1/48时,所述镜头的景别为近景,当所述镜头信息中人体头部面积占屏幕比例小于1/48且大于等于1/85时,所述镜头的景别为中景,当所述镜头信息中人体头部面积占屏幕比例小于1/85时,所述镜头的景别为全景。

优选地,所述镜头分割模块,进一步地,包括:特征点匹配单元和视频分割单元,其中:

所述特征点匹配单元,分别与所述视频读取模块和视频分割单元相连接,用于获取每个所述视频帧的特征点,将当前所述视频帧的特征点与前一所述视频帧的特征点进行匹配,获取相邻两个所述视频帧特征点相匹配的数量,并将相邻两个所述视频帧特征点相匹配的数量与特征点匹配阈值相比较;将比较的结果传送至所述视频分割单元;

所述视频分割单元,分别与所述特征点匹配单元和匹配模块相连接,用于当相邻两个所述视频帧特征点相匹配的数量大于等于所述特征点匹配阈值时,当前所述视频帧与前一所述视频帧具有连续性,属于同一镜头;当相邻两个所述视频帧特征点相匹配的数量小于所述特征点匹配阈值时,当前所述视频帧与前一所述视频帧不具有连续性,分属不同镜头,进行视频分割;将分割后的所述镜头信息传送至所述匹配模块。

优选地,所述匹配模块,进一步地,包括:人体样本特征库获取单元、采样点获取单元和采样点匹配单元,其中:

所述人体样本特征库获取单元,与所述采样点匹配单元相连接,用于读取不同场景中人体图像的视频画面,获取人体图像样本点,构成人体样本特征库,将构成的所述人体样本特征库传送至所述采样点匹配单元;

所述采样点获取单元,分别与所述镜头分割模块和采样点匹配单元相连接,用于对每个所述镜头信息中视频帧进行画面采集,获取相应的采样点,将所述采样点数据传送至所述采样点匹配单元;

所述采样点匹配单元,分别与所述人体样本特征库获取单元、采样点获取单元和比较模块相连接,用于将所述采样点与所述人体样本特征库进行匹配,获取相匹配的采样点数值,并将相匹配的所述采样点数值传送至所述比较模块。

优选地,所述计算模块,进一步地,包括:人物帧判断单元、头部面积计算单元和面积比例获取单元,其中:

所述人物帧判断单元,分别与所述比较模块和头部面积计算单元相连接,用于当相匹配的所述采样点数值大于等于预定义的匹配阈值时,所述镜头信息包含人物帧;并将包含人物帧的所述镜头信息信息传送至所述头部面积计算单元;

所述头部面积计算单元,分别与所述人物帧判断单元和面积比例获取单元相连接,用于根据人物帧的采样点数据,提取人体头部边界点坐标数据,获取所述人体头部的宽度和高度数据,得到所述人体头部的面积,将所述人体头部面积数据传送至所述面积比例获取单元;

所述面积比例获取单元,分别与所述头部面积计算单元和景别划分模块相连接,用于将所述人体的头部面积与显示屏幕的面积进行比值计算,并将面积的比值结果传送至所述景别划分模块。

与现有技术相比,本发明的一种基于视频分析的景别划分的方法及系统,实现了如下的有益效果:

(1)本发明所述的一种基于视频分析的景别划分的方法及系统,根据镜头信息分割技术将视频分割成多个镜头信息片段,通过分析各镜头信息片段中是否含有人物帧,作为快速判断该镜头是否为远景的依据,进而对含有人物帧的镜头信息片段做进一步分析,实现最终的景别划分,为影视的拍摄手法提供了有益数据,并提高了对影视分析的效率,避免了人工景别划分方法中存在的人工成本高且处理效率低等问题。

(2)本发明所述的一种基于视频分析的景别划分的方法及系统,在对含有人物帧的镜头信息片段进行画面采集时,获取的采样点数据包含有人体的边界点坐标数据,根据人体头部的边界坐标数据,获取人体头部的面积数据,进而得到人体头部占显示屏的比例数值,通过计算各镜头信息中人体头像在显示屏中占有的面积比例,实现对镜头的景别划分,具有处理效率高、准确率高且易操作等特点。

当然,实施本发明的任一产品必不特定需要同时达到以上所述的所有技术效果。

通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。

附图说明

被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。

图1为本发明实施例1提供的基于视频分析的景别划分的方法的流程示意图;

图2为本发明实施例2提供的基于视频分析的景别划分的方法的流程示意图;

图3为本发明实施例2提供的视频片段分割的流程示意图;

图4为本发明实施例2提供的采样点数值获取方法的流程示意图;

图5为本发明实施例2提供的人体头部面积比例计算方法的流程示意图;

图6为本发明实施例3提供的基于视频分析的景别划分的系统的结构示意图。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。

在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。

实施例1

如图1所示,本实施例1所提供的基于视频分析的景别划分的方法,包括如下步骤:

步骤101、读取并依次获取视频片段中包含的所有视频帧。

具体地,我们通常看到的视频片段均是由拍摄的一个个镜头经拼接处理而成的,其中每个动态的镜头片段又均是由一幅幅静态的视频帧构成。根据视频段的播放顺序,获取构成该视频段的所有视频帧。

步骤102、根据相邻所述视频帧的连续性,将所述视频片段进行分割,获取组成所述视频片段的所有镜头信息。

具体地,视频段是由一个个镜头组成,其中,同一个镜头片段内的视频帧的画面图像是前后连续的,而前一镜头片段的结束帧与后一镜头片段的起始帧之间具有非常明显的切换。因此,可以将前一镜头片段的结束帧与后一镜头片段的起始帧作为前一镜头片段与后一镜头片段的分割依据。通过判断相邻视频帧之间的连续性,对视频片段进行分割,获取组成该视频片段的所有镜头信息。

步骤103、对每个所述镜头信息中的视频帧进行画面采样,获取相应的采样点,将采样点与人体样本特征库进行匹配,获取相匹配的采样点数值。

通过步骤102对视频片段进行分割后,获取组成该视频片段的所有镜头信息片段,本实施例中,以镜头信息片段为识别单位,对组成镜头信息片段的所有视频帧进行画面采样,只要出现一次可识别的人体画面,就可以判定该镜头中有人物帧,即便识别的人体画面是侧面或背面均不影响识别效果,从而提高了人体识别的精度。

步骤104、将相匹配的所述采样点数值与预定义的匹配阈值相比较。

假设,镜头信息中含有人物帧时,则相匹配的采样点数值应大于等于预定义的匹配阈值,当镜头信息中不含有人物帧时,则相匹配的采样点数值应小于预定义的匹配阈值。本实施例通过将步骤103获取的相匹配的采样点数值与预定义的匹配阈值进行比较,以判断镜头信息中是否含有人物帧。

步骤105、当相匹配的所述采样点数值小于预定义的匹配阈值时,所述镜头信息不包含人物帧,则所述镜头的景别为远景。

当判断镜头信息画面中不含有人物帧时,则判定该镜头的景别为远景,当然在一些可选的实施例中,当无人物帧时,也可能为插入性广告。

步骤106、当相匹配的所述采样点数值大于等于预定义的匹配阈值时,所述镜头信息包含人物帧,获取所述镜头信息中人体的头部面积与显示屏幕面积的比值。

当判断镜头信息画面中含有人物帧时,则根据人物在镜头信息中展现的形式,对该镜头的景别进行进一步的划分,常用的景别划分特征:特写(指人体肩部以上)、近景(指人体胸部以上)、中景(指人体膝部以上)和全景(人体的全部和周围背景)。通常情况下,人体头部高度占人体身高的1/8,人体头部宽度占人体肩宽的1/2。人体在镜头信息中出现的范围不同,导致人体头部在镜头信息中所占的比例不同。因此根据人体的头部面积与显示屏幕的面积比值,作为判别镜头景别的依据。

步骤107、当所述镜头信息中人体头部面积占屏幕比例大于等于1/6时,所述镜头的景别为特景,当所述镜头信息中人体头部面积占屏幕比例小于1/6且大于等于1/48时,所述镜头的景别为近景,当所述镜头信息中人体头部面积占屏幕比例小于1/48且大于等于1/85时,所述镜头的景别为中景,当所述镜头信息中人体头部面积占屏幕比例小于1/85时,所述镜头的景别为全景。

通过对视频的分析,可快速、准确地计算出视频片段中各镜头的景别,进一步的为视频拍摄手法的分析提供了有益数据,同时节省了大量的人力成本,提高了视频分析的效率。

实施例2

如图2所示,本实施例2所提供的基于视频分析的景别划分的方法,包括如下步骤:

步骤201、读取并依次获取视频片段中包含的所有视频帧。

具体地,我们通常看到的视频片段均是由拍摄的一个个镜头经拼接处理而成的,其中每个动态的镜头片段又均是由一幅幅静态的视频帧构成。根据视频段的播放顺序,获取构成该视频段的所有视频帧。

步骤202、根据相邻所述视频帧的连续性,将所述视频片段进行分割,获取组成所述视频片段的所有镜头信息。

具体地,视频段是由一个个镜头组成,其中,同一个镜头片段内的视频帧的画面图像是前后连续的,而前一镜头片段的结束帧与后一镜头片段的起始帧之间具有非常明显的切换。因此,可以将前一镜头片段的结束帧与后一镜头片段的起始帧作为前一镜头片段与后一镜头片段的分割依据。通过判断相邻视频帧之间的连续性,对视频片段进行分割,获取组成该视频片段的所有镜头信息。

在一些可选的实施例中,如图3所示,根据相邻视频帧的连续性,将所述视频片段进行分割,获取组成所述视频片段的所有镜头信息;具体包括如下步骤:

步骤2021、获取每个所述视频帧的特征点,将当前所述视频帧的特征点与前一所述视频帧的特征点进行匹配,获取相邻两个所述视频帧特征点相匹配的数量,并将相邻两个所述视频帧特征点相匹配的数量与特征点匹配阈值相比较。

本实施例中,通过判断当前所述视频帧与前一所述视频帧之间的连续性,将视频片段进行分割。首先,获取所有视频帧的特征点,将当前视频帧的特征点与前一视频帧的特征点进行匹配,获取相邻视频帧特征点相匹配的数量;其次,系统设定特征点匹配阈值;再者,将相邻两个视频帧特征点相匹配的数量与特征点匹配阈值相比较,作为相邻视频帧连续性的判断依据。

步骤2022、当相邻两个所述视频帧特征点相匹配的数量大于等于所述特征点匹配阈值时,当前所述视频帧与前一所述视频帧具有连续性,属于同一镜头。

具体地,假设当前视频帧为第i帧,当第i帧和第i-1帧画面具有连续性,如果第i-1帧画面被划分为第x镜头画面,则此时第i帧画面也同属于第x镜头画面,此时第x镜头画面的结束帧还没有确定,需要继续判断下一当前所述视频帧与前一所述视频帧的连续性。

步骤2023、当相邻两个所述视频帧特征点相匹配的数量小于所述特征点匹配阈值时,当前所述视频帧与前一所述视频帧不具有连续性,分属不同镜头。

在步骤2022假设的前提下,当前所述视频帧与前一所述视频帧之间不具有连续性,则前一视频帧为第x镜头画面的结束帧,当前视频帧为第x+1镜头画面的开始帧。继续寻找第x+1镜头片段的结束帧,直到视频的所有帧分割完成。

步骤203、对每个所述镜头信息中的视频帧进行画面采样,获取相应的采样点,将采样点与人体样本特征库进行匹配,获取相匹配的采样点数值。

通过步骤202对视频片段进行分割后,获取组成该视频片段的所有镜头信息片段,本实施例中,以镜头信息片段为识别单位,对组成镜头信息片段的所有视频帧进行画面采样,只要出现一次可识别的人体画面,就可以判定该镜头信息中有人物帧,即便识别的人体画面是侧面或背面均不影响识别效果,从而提高了人体识别的精度。

在一些可选的实施例中,如图4所示,对每个所述镜头信息中的视频帧进行画面采样,获取相应的采样点,将采样点与人体样本特征库进行匹配,获取相匹配的采样点数值;具体包括如下步骤:

步骤2031、读取不同场景中人体图像的视频画面,获取人体图像样本点,构成人体样本特征库。

读取不同场景中含有人体图像的视频画面,对视频图像中的人体图像进行边缘点的提取,获取不同条件下人体图像的样本点,所述样本点的集合构成人体样本特征库,该人体样本特征库中包含:人体的头部、肩部、腿部和肘部。由于大部分图片中的行人与背景间的互相遮挡,会造成身体某些部位的缺失,因此在样本点集合上只提取各标准部位的样本点。

步骤2032、对每个所述镜头信息中视频帧进行画面采集,获取相应的采样点。

具体的,对镜头信息片段中的每个视频帧进行画面的采集,提取画面中物体的边界信息及边界点坐标数据,形成物体的边界轮廓。在该边界轮廓的边界线上生成等间距的采样点。

步骤2033、将所述采样点与所述人体样本特征库进行匹配,获取相匹配的采样点数值。

根据画面采样点数据,在人体样本特征库中查找与之匹配的样本点,当二者的匹配程度大于匹配度阈值时,采样点与人体样本特征库的样本点相匹配,通过逐个比较后,获取相应的采样点中与人体样本特征库中样本点相匹配的采样点数量。

步骤204、将相匹配的所述采样点数值与预定义的匹配阈值相比较。

假设,镜头信息中含有人物帧时,则相匹配的采样点数值应大于等于预定义的匹配阈值,当镜头信息中不含有人物帧时,则相匹配的采样点数值应小于预定义的匹配阈值。本实施例通过将步骤203获取的相匹配的采样点数值与预定义的匹配阈值进行比较,以判断镜头信息中是否含有人物帧。

步骤205、当相匹配的所述采样点数值小于预定义的匹配阈值时,所述镜头信息不包含人物帧,则所述镜头的景别为远景。

当判断镜头信息画面中不含有人物帧时,则判定该镜头的景别为远景,当然在一些可选的实施例中,当无人物帧时,也可能为插入性广告。

步骤206、当相匹配的所述采样点数值大于等于预定义的匹配阈值时,所述镜头信息包含人物帧,获取所述镜头信息中人体的头部面积与显示屏幕面积的比值。

当判断镜头信息画面中含有人物帧时,则根据人物在镜头信息中展现的形式,对该镜头的景别进行进一步的划分,常用的景别划分特征:特写(指人体肩部以上)、近景(指人体胸部以上)、中景(指人体膝部以上)和全景(人体的全部和周围背景)。通常情况下,人体头部高度占人体身高的1/8,人体头部宽度占人体肩宽的1/2。人体在镜头信息中出现的范围不同,导致人体头部在镜头中所占的比例不同。因此根据人体的头部面积与显示屏幕的面积比值,作为判别镜头景别的依据。

在一些可选的实施例中,如图5所示,当相匹配的所述采样点数值大于等于预定义的匹配阈值时,所述镜头信息包含人物帧,获取所述镜头信息中人体的头部面积与显示屏幕面积的比值,具体包括如下步骤:

步骤2061、当相匹配的所述采样点数值大于等于预定义的匹配阈值时,所述镜头信息包含人物帧。

步骤2062、根据人物帧的采样点数据,提取人体头部边界点坐标数据。

在对镜头信息片段进行画面采集时,获取的人物帧的采样点数据,包含有人体的边界信息及边界点坐标数据,其中包含人物帧的镜头信息中,无论人体在屏幕中呈现的范围有多大,人体的头部均会呈现在屏幕中。因此从获取的采样点数据中,均可提取人体头部的边界点坐标数据。

步骤2063、获取所述人体头部的宽度和高度数据,得到所述人体头部的面积。

根据人体头部的边界点坐标数据,获取头部宽度方向和高度方向上坐标点数据,差值计算后,得到人体头部的宽度和高度数据,本实施例中,假设人体头部为长方形结构,通过将人体头部的宽度和高度数据相乘计算,得到人体头部的面积数据。

步骤2064、获取所述人体的头部面积与显示屏幕面积的比例数据。

通常显示屏幕的宽:高=3:4(9:16),根据视频分析时,所使用的显示屏的具体宽、高度数据,计算显示屏的面积。将步骤2063中计算得到的人体头部的面积与显示屏幕的面积进行比较,计算人体头部在显示屏幕中占有的比例。

步骤207、当所述镜头信息中人体头部占屏幕比例大于等于1/6时,所述镜头的景别为特景,当所述镜头信息中人体头部占屏幕比例小于1/6且大于等于1/48时,所述镜头的景别为近景,当所述镜头信息中人体头部占屏幕比例小于1/48且大于等于1/85时,所述镜头的景别为中景,当所述镜头信息中人体头部占屏幕比例的小于1/85时,所述镜头的景别为全景。

实施例3

如图6所示,本实施例3所提供的基于视频分析的景别划分的系统,包括:视频读取模块301、镜头分割模块302、匹配模块303、比较模块304、远景定义模块305、计算模块306和景别划分模块307,其中:

所述视频读取模块301,与所述镜头分割模块302相连接,用于读取并依次获取视频片段中包含的所有视频帧,将获取的所述视频帧传送至所述镜头分割模块302。

具体地,我们通常看到的视频片段均是由拍摄的一个个镜头经拼接处理而成的,其中每个动态的镜头片段又均是由一幅幅静态的视频帧构成。根据视频段的播放顺序,获取构成该视频段的所有视频帧。

所述镜头分割模块302,分别与所述视频读取模块301和匹配模块303相连接,用于根据相邻所述视频帧的连续性,将所述视频片段进行分割,获取组成所述视频片段的所有镜头信息,将获取的所述镜头信息传送至所述匹配模块303。

具体地,视频段是由一个个镜头组成,其中,同一个镜头片段内的视频帧的画面图像是前后连续的,而前一镜头片段的结束帧与后一镜头片段的起始帧之间具有非常明显的切换。因此,可以将前一镜头片段的结束帧与后一镜头片段的起始帧作为前一镜头片段与后一镜头片段的分割依据。通过判断相邻视频帧之间的连续性,对视频片段进行分割,获取组成该视频片段的所有镜头信息。

在一些可选的实施例中,所述镜头分割模块302,包括:特征点匹配单元321和视频分割单元322,其中:

所述特征点匹配单元321,分别与所述视频读取模块301和视频分割单元322相连接,用于获取每个所述视频帧的特征点,将当前所述视频帧的特征点与前一所述视频帧的特征点进行匹配,获取相邻两个所述视频帧特征点相匹配的数量,并将相邻两个所述视频帧特征点相匹配的数量与特征点匹配阈值相比较;将比较的结果传送至所述视频分割单元322。

本实施例中,通过判断当前所述视频帧与前一所述视频帧之间的连续性,将视频片段进行分割。首先,获取所有视频帧的特征点,将当前视频帧的特征点与前一视频帧的特征点进行匹配,获取相邻视频帧特征点相匹配的数量;其次,系统设定特征点匹配阈值;再者,将相邻两个视频帧特征点相匹配的数量与特征点匹配阈值相比较,作为相邻视频帧连续性的判断依据。

所述视频分割单元322,分别与所述特征点匹配单元321和匹配模块303相连接,用于当相邻两个所述视频帧特征点相匹配的数量大于等于所述特征点匹配阈值时,当前所述视频帧与前一所述视频帧具有连续性,属于同一镜头;当相邻两个所述视频帧特征点相匹配的数量小于所述特征点匹配阈值时,当前所述视频帧与前一所述视频帧不具有连续性,分属不同镜头,进行视频分割;将分割后的镜头信息传送至所述匹配模块303。

具体地,假设当前视频帧为第i帧,当第i帧和第i-1帧画面具有连续性,如果第i-1帧画面被划分为第x镜头画面,则此时第i帧画面也同属于第x镜头画面,此时第x镜头画面的结束帧还没有确定,需要继续判断下一当前所述视频帧与前一所述视频帧的连续性。如果,当前所述视频帧与前一所述视频帧之间不具有连续性,则前一视频帧为第x镜头画面的结束帧,当前视频帧为第x+1镜头画面的开始帧。继续寻找第x+1镜头片段的结束帧,直到视频的所有帧分割完成。

所述匹配模块303,分别与所述镜头分割模块302和比较模块304相连接,用于对每个所述镜头信息中的视频帧进行画面采样,获取相应的采样点,将采样点与人体样本特征库进行匹配,获取相匹配的采样点数值,将相匹配的采样点数值传送至所述比较模块304。

具体地,通过对视频片段进行分割后,获取组成该视频片段的所有镜头信息片段,以镜头信息片段为识别单位,对组成镜头信息片段的所有视频帧进行画面采样,只要出现一次可识别的人体画面,就可以判定该镜头信息中有人物帧,即便识别的人体画面是侧面或背面均不影响识别效果,从而提高了人体识别的精度。

在一些可选的实施例中,所述匹配模块303,包括:人体样本特征库获取单元331、采样点获取单元332和采样点匹配单元333,其中:

所述人体样本特征库获取单元331,与所述采样点匹配单元333相连接,用于读取不同场景中人体图像的视频画面,获取人体图像样本点,构成人体样本特征库,将构成的所述人体样本特征库传送至所述采样点匹配单元333。

读取不同场景中含有人体图像的视频画面,对视频图像中的人体图像进行边缘点的提取,获取不同条件下人体图像的样本点,所述样本点的集合构成人体样本特征库,该人体样本特征库中包含:人体的头部、肩部、腿部和肘部。由于大部分图片中的行人与背景间的互相遮挡,会造成身体某些部位的缺失,因此在样本点集合上只提取各标准部位的样本点。

所述采样点获取单元332,分别与所述视频分割单元322和采样点匹配单元333相连接,用于对每个所述镜头信息中视频帧进行画面采集,获取相应的采样点,将所述采样点数据传送至所述采样点匹配单元333。

具体的,对镜头信息片段中的每个视频帧进行画面的采集,提取画面中物体的边界信息及边界点坐标数据,形成物体的边界轮廓。在该边界轮廓的边界线上生成等间距的采样点。

所述采样点匹配单元333,分别与所述人体样本特征库获取单元331、采样点获取单元332和比较模块304相连接,用于将所述采样点与所述人体样本特征库进行匹配,获取相匹配的采样点数值,并将相匹配的采样点数值传送至所述比较模块304。

根据画面采样点数据,在人体样本特征库中查找与之匹配的样本点,当二者的匹配程度大于匹配度阈值时,采样点与人体样本特征库的样本点相匹配,通过逐个比较后,获取相应的采样点中与人体样本特征库中样本点相匹配的采样点数量。

所述比较模块304,分别与所述匹配模块303、远景定义模块305和计算模块306相连接,用于将相匹配的所述采样点数值与预定义的匹配阈值相比较,并将比较的数据结果分别传送至所述远景定义模块305和计算模块306。

假设,镜头信息中含有人物帧时,则相匹配的采样点数值应大于等于预定义的匹配阈值,当镜头信息中不含有人物帧时,则相匹配的采样点数值应小于预定义的匹配阈值。通过将相匹配的采样点数值与预定义的匹配阈值进行比较,以判断镜头信息中是否含有人物帧。

所述远景定义模块305,与所述比较模块304相连接,用于当相匹配的所述采样点数值小于预定义的匹配阈值时,所述镜头信息不包含人物帧,则所述镜头的景别为远景。

当判断镜头信息画面中不含有人物帧时,则判定该镜头的景别为远景,当然在一些可选的实施例中,当无人物帧时,也可能为插入性广告。

所述计算模块306,分别与所述比较模块304和景别划分模块307相连接,用于当相匹配的所述采样点数值大于等于预定义的匹配阈值时,所述镜头信息包含人物帧,获取所述镜头信息中人体的头部面积与显示屏幕面积的比值,将二者面积比值结果传送至所述景别划分模块307。

当判断镜头信息画面中含有人物帧时,则根据人物在镜头信息中展现的形式,对该镜头的景别进行进一步的划分,常用的景别划分特征:特写(指人体肩部以上)、近景(指人体胸部以上)、中景(指人体膝部以上)和全景(人体的全部和周围背景)。通常情况下,人体头部高度占人体身高的1/8,人体头部宽度占人体肩宽的1/2。人体在镜头中出现的范围不同,导致人体头部在镜头中所占的比例不同。因此根据人体的头部面积与显示屏幕的面积比值,作为判别镜头景别的依据。

在一些可选的实施例中,所述计算模块306,包括:人物帧判断单元361、头部面积计算单元362和面积比例获取单元363,其中:

所述人物帧判断单元361,分别与所述比较模块304和头部面积计算单元362相连接,用于当相匹配的所述采样点数值大于等于预定义的匹配阈值时,所述镜头信息包含人物帧;并将包含人物帧的镜头信息信息传送至所述头部面积计算单元362。

所述头部面积计算单元362,分别与所述人物帧判断单元361和面积比例获取单元363相连接,用于根据人物帧的采样点数据,提取人体头部边界点坐标数据,获取所述人体头部的宽度和高度数据,得到所述人体头部的面积,将所述人体头部面积数据传送至所述面积比例获取单元363。

在对镜头信息片段进行画面采集时,获取的人物帧的采样点数据,包含有人体的边界信息及边界点坐标数据,其中包含人物帧的镜头信息中,无论人体在屏幕中呈现的范围有多大,人体的头部均会呈现在屏幕中。因此从获取的采样点数据中,均可提取人体头部的边界点坐标数据。根据人体头部的边界点坐标数据,获取头部宽度方向和高度方向上坐标点数据,差值计算后,得到人体头部的宽度和高度数据,本实施例中,假设人体头部为长方形结构,通过将人体头部的宽度和高度数据相乘计算,得到人体头部的面积数据。

所述面积比例获取单元363,分别与所述头部面积计算单元362和景别划分模块307相连接,用于将所述人体的头部面积与显示屏幕的面积进行比值计算,并将面积的比值结果传送至所述景别划分模块307。

通常显示屏幕的宽:高=3:4(9:16),根据视频分析时,所使用的显示屏的具体宽、高度数据,计算显示屏的面积。将计算得到的人体头部的面积与显示屏幕的面积进行比较,计算人体头部在显示屏幕中占有的比例。

所述景别划分模块307,与所述计算模块306相连接,用于当所述镜头信息中人体头部占屏幕比例大于等于1/6时,所述镜头的景别为特景,当所述镜头信息中人体头部占屏幕比例小于1/6且大于等于1/48时,所述镜头的景别为近景,当所述镜头信息中人体头部占屏幕比例小于1/48且大于等于1/85时,所述镜头的景别为中景,当所述镜头信息中人体头部占屏幕比例的小于1/85时,所述镜头的景别为全景。

通过以上各个实施例可知,本发明的一种基于视频分析的景别划分的方法及系统,存在的有益效果是:

(1)本发明所述的一种基于视频分析的景别划分的方法及系统,根据镜头信息分割技术将视频分割成多个镜头信息片段,通过分析各镜头信息片段中是否含有人物帧,作为快速判断该镜头信息是否为远景的依据,进而对含有人物帧的镜头信息片段做进一步分析,实现最终的景别划分,为影视的拍摄手法提供了有益数据,并提高了对影视分析的效率,避免了人工景别划分方法中存在的人工成本高且处理效率低等问题。

(2)本发明所述的一种基于视频分析的景别划分的方法及系统,在对含有人物帧的镜头信息片段进行画面采集时,获取的采样点数据包含有人体的边界点坐标数据,根据人体头部的边界坐标数据,获取人体头部的面积数据,进而得到人体头部占显示屏的比例数值,通过计算各镜头信息中人体头像在显示屏中占有的面积比例,实现对镜头的景别划分,具有处理效率高、准确率高且易操作等特点。

本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

虽然已经通过例子对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上例子仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员应该理解,可在不脱离本发明的范围和精神的情况下,对以上实施例进行修改。本发明的范围由所附权利要求来限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1