一种动态广告植入位置的检测方法及装置与流程

文档序号:24939115发布日期:2021-05-04 11:31阅读:158来源:国知局
一种动态广告植入位置的检测方法及装置与流程

本发明涉及广告植入技术领域,更具体的说,涉及一种动态广告植入位置的检测方法及装置。



背景技术:

广告植入是指将广告投放素材融入到影视剧的内容中,相比于在片头、片尾和片中等插入广告的形式,广告植入与情景深入融合,更容易让受众接受,从而起到潜移默化的宣传效果。

传统的广告植入是静态的,要求在广告拍摄时就确定好植入的广告内容,在广告拍摄完成后不容易变更植入的广告。另外,静态广告植入对拍摄道具的部署同样需要耗费大量资源,尤其在拍摄户外高楼广告牌等大型广告时成本极高。

为解决静态广告植入存在的种种弊端,动态广告植入应运而生。动态广告植入是指对已经完成拍摄的视频内容进行二次合成,在视频合适位置插入广告素材,以达到广告植入的目的。动态广告植入相对于静态广告植入摆脱了广告拍摄的限制,使得植入广告不再受拍摄周期的限制,同时也降低了广告植入的成本,充分利用了视频中的潜在广告资源,增加了广告售卖周期与应变能力,挖掘潜在的广告库存量,使得广告植入能根据实际情况进行灵活变动。

对于动态广告植入而言,检测合适的广告植入位置是最为关键的技术。目前业界主流是将动态广告植入作为一个视频后期制作问题来处理,人工检测广告植入的合适点位并标记,然后通过ae等视频编辑软件进行遮罩处理。现有动态广告植入位置的检测方法存在几个问题:一是对于每个视频都需要人工遍览全部内容,然后记录下广告植入的合适点位,因此,需要耗费大量的人力和时间;二是检测效率低,对广告植入点位的判断标准不够明确,从而增加了后续广告植入的难度。



技术实现要素:

有鉴于此,本发明公开一种动态广告植入位置的检测方法及装置,以实现实现对视频中动态广告植入位置的自动筛选与精准定位,从而节省人工观看视频检测动态广告植入位置并标记所花费的时间与成本,提高动态广告植入位置的检测精度和检测效率,进而降低了广告植入成本,在一定程度上增加了广告收益。

一种动态广告植入位置的检测方法,包括:

对获取的需要广告植入的目标视频采用分镜算法进行场景镜头切分,得到多个分镜视频片段;

从多个所述分镜视频片段中筛选出包含目标物体的目标分镜视频片段,其中,所述目标物体为适合动态广告植入的物体;

从多个所述目标分镜视频片段中,筛选出包含的所述目标物体的相关参数满足预设参数阈值的目标分镜视频片段作为动态广告植入视频片段,其中,所述目标物体的相关参数包括:所述目标物体的关键帧数、占屏比、清晰度和被遮挡比例;

对所述动态广告植入视频片段,采用预先训练的级联金字塔网络模型对包含所述目标物体的首帧进行点位回归,得到精确的动态广告植入位置。

可选的,所述对获取的需要广告植入的目标视频采用分镜算法进行场景镜头切分,得到多个分镜视频片段,具体包括:

对所述目标视频采用基于内容变化的分镜算法进行场景镜头切分,得到多个原始分镜视频片段;

根据每个所述原始分镜视频片段的首帧和尾帧,确定每个所述原始分镜视频片段的视频持续时长;

从多个所述原始分镜视频片段中,筛选出视频持续时长不小于视频持续时长阈值的原始分镜视频片段作为所述分镜视频片段。

可选的,所述从多个所述分镜视频片段中筛选出包含目标物体的目标分镜视频片段,具体包括:

依次从每个所述分镜视频片段中抽取出对应的中间帧;

用预先训练的目标检测模型对抽取的每个所述中间帧进行目标物体检测;

将检测到所述目标物体的中间帧对应的分镜视频片段确定为所述目标分镜视频片段。

可选的,所述从多个所述目标分镜视频片段中,筛选出包含的所述目标物体的相关参数满足预设参数阈值的目标分镜视频片段作为动态广告植入视频片段,具体包括:

统计各个所述目标分镜视频片段中所述目标物体连续出现的关键帧数;

从各个所述目标分镜视频片段中筛选出所述关键帧数不小于关键帧数阈值的目标分镜视频片段,记为第一目标分镜视频片段;

统计各个所述第一目标分镜视频片段中所述目标物体的占屏比;

从各个所述第一目标分镜视频片段中筛选出所述占屏比不小于占屏比阈值的第一目标分镜视频片段,记为第二目标分镜视频片段;

计算每个所述第二目标分镜视频片段中所述目标物体的清晰度;

从各个所述第二目标分镜视频片段中筛选出所述清晰度不小于清晰度阈值的第二目标分镜视频片段,记为第三目标分镜视频片段;

计算每个所述第三目标分镜视频片段中所述目标物体的被遮挡比例;

从各个所述第三目标分镜视频片段中筛选出所述被遮挡比例不大于被遮挡比例阈值的第三目标分镜视频片段,作为动态广告植入视频片段。

可选的,还包括:

将所述动态广告植入视频片段的相关信息以及对应的所述动态广告植入位置存储至数据库。

一种动态广告植入位置的检测装置,包括:

视频切分单元,用于对获取的需要广告植入的目标视频采用分镜算法进行场景镜头切分,得到多个分镜视频片段;

第一筛选单元,用于从多个所述分镜视频片段中筛选出包含目标物体的目标分镜视频片段,其中,所述目标物体为适合动态广告植入的物体;

第二筛选单元,用于从多个所述目标分镜视频片段中,筛选出包含的所述目标物体的相关参数满足预设参数阈值的目标分镜视频片段作为动态广告植入视频片段,其中,所述目标物体的相关参数包括:所述目标物体的关键帧数、占屏比、清晰度和被遮挡比例;

广告植入位置确定单元,用于对所述动态广告植入视频片段,采用预先训练的级联金字塔网络模型对包含所述目标物体的首帧进行点位回归,得到精确的动态广告植入位置。

可选的,所述视频切分单元具体包括:

视频切分子单元,用于对所述目标视频采用基于内容变化的分镜算法进行场景镜头切分,得到多个原始分镜视频片段;

时长确定子单元,用于根据每个所述原始分镜视频片段的首帧和尾帧,确定每个所述原始分镜视频片段的视频持续时长;

第一筛选子单元,用于从多个所述原始分镜视频片段中,筛选出视频持续时长不小于视频持续时长阈值的原始分镜视频片段作为所述分镜视频片段。

可选的,所述第一筛选单元具体包括:

中间帧抽取子单元,用于依次从每个所述分镜视频片段中抽取出对应的中间帧;

检测子单元,用于用预先训练的目标检测模型对抽取的每个所述中间帧进行目标物体检测;

视频片段确定子单元,用于将检测到所述目标物体的中间帧对应的分镜视频片段确定为所述目标分镜视频片段。

可选的,所述第二筛选单元具体包括:

关键帧数统计子单元,用于统计各个所述目标分镜视频片段中所述目标物体连续出现的关键帧数;

第二筛选子单元,用于从各个所述目标分镜视频片段中筛选出所述关键帧数不小于关键帧数阈值的目标分镜视频片段,记为第一目标分镜视频片段;

占屏比统计子单元,用于统计各个所述第一目标分镜视频片段中所述目标物体的占屏比;

第三筛选子单元,用于从各个所述第一目标分镜视频片段中筛选出所述占屏比不小于占屏比阈值的第一目标分镜视频片段,记为第二目标分镜视频片段;

清晰度计算子单元,用于计算每个所述第二目标分镜视频片段中所述目标物体的清晰度;

第四筛选子单元,用于从各个所述第二目标分镜视频片段中筛选出所述清晰度不小于清晰度阈值的第二目标分镜视频片段,记为第三目标分镜视频片段;

被遮挡比例计算子单元,用于计算每个所述第三目标分镜视频片段中所述目标物体的被遮挡比例;

第五筛选子单元,用于从各个所述第三目标分镜视频片段中筛选出所述被遮挡比例不大于被遮挡比例阈值的第三目标分镜视频片段,作为动态广告植入视频片段。

可选的,所述检测装置还包括:

存储单元,用于将所述动态广告植入视频片段的相关信息以及对应的所述动态广告植入位置存储至数据库。

从上述的技术方案可知,本发明公开了一种动态广告植入位置的检测方法及装置,对获取的需要广告植入的目标视频采用分镜算法进行场景镜头切分,得到多个分镜视频片段,从多个分镜视频片段中筛选出包含适合动态广告植入的目标物体的目标分镜视频片段,在从多个目标分镜视频片段中,筛选出包含的所述目标物体的相关参数满足预设参数阈值的目标分镜视频片段作为动态广告植入视频片段,通过对动态广告植入视频片段,采用预先训练的级联金字塔网络模型对包含所述目标物体的首帧进行点位回归,得到精确的动态广告植入位置。本发明利用深度学习技术与图像处理技术,实现了视频中动态广告植入位置的自动筛选与精准定位,从而节省了人工观看视频检测动态广告植入位置并标记所花费的时间与成本,提高了动态广告植入位置的检测精度和检测效率,进而降低了广告植入成本,在一定程度上增加了广告收益。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据公开的附图获得其他的附图。

图1为本发明实施例公开的一种动态广告植入位置的检测方法流程图;

图2为本发明实施例公开的一种对获取的需要广告植入的目标视频采用分镜算法进行场景镜头切分,得到多个分镜视频片段的方法流程图;

图3为本发明实施例公开的一种从多个分镜视频片段中筛选出包含目标物体的目标分镜视频片段的方法流程图;

图4为本发明实施例公开的一种从多个目标分镜视频片段中,筛选出动态广告植入视频片段的方法流程图;

图5为本发明实施例公开的一种动态广告植入位置的检测装置的结构示意图;

图6为本发明实施例公开的一种视频切分单元的结构示意图;

图7为本发明实施例公开的一种第一筛选单元的结构示意图;

图8为本发明实施例公开的一种第二筛选单元的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例公开了一种动态广告植入位置的检测方法及装置,对获取的需要广告植入的目标视频采用分镜算法进行场景镜头切分,得到多个分镜视频片段,从多个分镜视频片段中筛选出包含适合动态广告植入的目标物体的目标分镜视频片段,在从多个目标分镜视频片段中,筛选出包含的所述目标物体的相关参数满足预设参数阈值的目标分镜视频片段作为动态广告植入视频片段,通过对动态广告植入视频片段,采用预先训练的级联金字塔网络模型对包含所述目标物体的首帧进行点位回归,得到精确的动态广告植入位置。本发明利用深度学习技术与图像处理技术,实现了视频中动态广告植入位置的自动筛选与精准定位,从而节省了人工观看视频检测动态广告植入位置并标记所花费的时间与成本,提高了动态广告植入位置的检测精度和检测效率,进而降低了广告植入成本,在一定程度上增加了广告收益。

参见图1,本发明实施例公开的一种动态广告植入位置的检测方法流程图,该方法包括:

步骤s101、对获取的需要广告植入的目标视频采用分镜算法进行场景镜头切分,得到多个分镜视频片段;

在实际应用中,可以从媒体资产数据库中获取需广告植入的目标视频。为便于后续查找,可以记录目标视频的保存路径。

其中,本实施例中,对目标视频可以采用基于内容变化的分镜算法进行场景镜头切分,得到多个分镜视频片段。本发明中后续以分镜视频片段为基本单元进行动态广告植入位置的检测。

步骤s102、从多个所述分镜视频片段中筛选出包含目标物体的目标分镜视频片段;

其中,所述目标物体为适合动态广告植入的物体,比如,广告牌、画框、电视屏、宣传栏和led(lightemittingdiode,发光二极管)屏幕等。

步骤s103、从多个所述目标分镜视频片段中,筛选出包含的所述目标物体的相关参数满足预设参数阈值的目标分镜视频片段作为动态广告植入视频片段;

其中,目标物体的相关参数包括:目标物体的关键帧数、占屏比、清晰度和被遮挡比例。

步骤s104、对所述动态广告植入视频片段,采用预先训练的级联金字塔网络模型对包含所述目标物体的首帧进行点位回归,得到精确的动态广告植入位置。

其中,目标物体的首帧也即目标物体的首个关键帧。

在实际应用中,可以采用标注了精确位置的图像数据集训练级联金字塔网络(cascadedpyramidnetwork,cpn)。整个网络结构由两部分构成,先用特征金字塔网络globalnet识别出简单关键点,再用refinenet网络拟合前者识别下的困难关键点,实现更精确的点位回归。

步骤s104的实现过程具体如下:

确定目标物体在动态广告植入视频片段中出现的首帧;

根据目标物体位置的bbox,获取目标物体截图,其中,bbox表示目标物体位置的一个值,根据目标物体的每一帧位置的左上角坐标(x1,y1)和目标物体的每一帧位置的右下角坐标(x2,y2)构成的一个框来确定目标物体的具体位置。

利用预先训练的具有关键点检测功能的级联金字塔网络模型对目标物体截图中目标物体的首帧进行点位回归,得到精确的精确的点位位置数据,该点位位置数据也即动态广告植入位置。

综上可知,本发明公开了一种动态广告植入位置的检测方法,对获取的需要广告植入的目标视频采用分镜算法进行场景镜头切分,得到多个分镜视频片段,从多个分镜视频片段中筛选出包含适合动态广告植入的目标物体的目标分镜视频片段,在从多个目标分镜视频片段中,筛选出包含的所述目标物体的相关参数满足预设参数阈值的目标分镜视频片段作为动态广告植入视频片段,通过对动态广告植入视频片段,采用预先训练的级联金字塔网络模型对包含所述目标物体的首帧进行点位回归,得到精确的动态广告植入位置。本发明利用深度学习技术与图像处理技术,实现了视频中动态广告植入位置的自动筛选与精准定位,从而节省了人工观看视频检测动态广告植入位置并标记所花费的时间与成本,提高了动态广告植入位置的检测精度和检测效率,进而降低了广告植入成本,在一定程度上增加了广告收益。

为便于后续查找动态广告植入位置,在步骤s104之后,还可以包括:

将所述动态广告植入视频片段的相关信息以及对应的所述动态广告植入位置存入相关数据库中。

其中,动态广告植入视频片段的相关信息可以包括:视频编号、目标物体首次出现的帧数、目标物体出现的持续时长、目标物体类别,点位位置数据等。

当目标视频下所有的分镜视频片段未全部检测完成,则继续对分镜视频片段进行筛选,直至目标视频下所有的分镜视频片段均检测完成。

在对当前的目标视频的动态广告植入位置检测完成后,继续对媒体资产数据库中其他的目标视频进行动态广告植入位置的检测。

由于本发明是从多个分镜视频片段中检测适合动态广告植入的位置,因此为提高检测效率,本发明在确定动态广告植入位置之前对切分得到的多个分镜视频片段进行了初步筛选。

因此,为进一步优化上述实施例,参见图2,本发明实施例公开的一种对获取的需要广告植入的目标视频采用分镜算法进行场景镜头切分,得到多个分镜视频片段的方法流程图,也即步骤s101具体可以包括:

步骤s201、对目标视频采用基于内容变化的分镜算法进行场景镜头切分,得到多个原始分镜视频片段;

步骤s202、根据每个所述原始分镜视频片段的首帧和尾帧,确定每个所述原始分镜视频片段的视频持续时长;

其中,原始分镜视频片段的首帧和尾帧均是关键帧。

具体的,根据如下公式计算单个原始分镜视频片段的视频持续时长clip_duration,公式如下:

clip_duration=(end_frame_index-begin_frame_index)/fps;

式中,end_frame_index为单个原始分镜视频片段的尾帧,begin_frame_index为单个原始分镜视频片段的首帧,fps为单个原始分镜视频片段的帧率。

步骤s203、从多个所述原始分镜视频片段中,筛选出视频持续时长不小于视频持续时长阈值的原始分镜视频片段作为分镜视频片段。

其中,视频持续时长阈值的取值依据实际需要而定,比如3s,本发明在此不做限定。

需要说明的是,步骤s203中从多个原始分镜视频片段中筛选得到的分镜视频片段,也即后续进行动态广告植入位置检测的基本单元的分镜视频片段。

本实施例中,对于视频持续时长小于视频持续时长阈值的原始分镜视频片段进行丢弃。

为进一步优化上述实施例,参见图3,本发明实施例公开的一种从多个分镜视频片段中筛选出包含目标物体的目标分镜视频片段的方法流程图,也即步骤s102具体包括:

步骤s301、依次从每个所述分镜视频片段中抽取出对应的中间帧;

步骤s302、用预先训练的目标检测模型对抽取的每个所述中间帧进行目标物体检测;

yolov5目标检测模型的训练过程包括:用包含适合动态广告植入的目标物体,且标注了边界框的图像数据集,对yolov5网络进行训练得到yolov5目标检测模型,yolov5目标检测模型具有检测目标物体的能力。

步骤s303、将检测到所述目标物体的中间帧对应的分镜视频片段确定为所述目标分镜视频片段。

需要说明的是,若从中间帧中没有检测到目标物体,则确定没有检测到目标物体的中间帧对应的分镜视频片段不适合进行动态广告植入,此时,丢弃没有检测到目标物体的中间帧对应的分镜视频片段,并继续从下一个分镜视频片段中抽取出对应的中间帧,再次对下一个分镜视频片段的中间帧进行目标物体的检测。

为进一步优化上述实施例,参见图4,本发明实施例公开的一种从多个目标分镜视频片段中,筛选出动态广告植入视频片段的方法流程图,也即,步骤s103具体可以包括:

步骤s401、统计各个目标分镜视频片段中目标物体连续出现的关键帧数;

在统计目标物体连续出现的关键帧数时,可以目标分镜视频片段的中间帧为基准,向中间帧的左侧和右侧分别扩展,每十帧提取一帧关键帧。

步骤s402、从各个所述目标分镜视频片段中筛选出关键帧数不小于关键帧数阈值的目标分镜视频片段,记为第一目标分镜视频片段;

需要说明的是,对于关键帧数小于关键帧数阈值的目标分镜视频片段进行丢弃,并返回图2所示实施例中的步骤s203,继续对分镜视频片段进行初步筛选。

在实际应用中,除了根据关键帧数筛选第一目标分镜视频片段外,还可以根据目标物体持续出现时长进行筛选。

具体的,(1)计算每个目标分镜视频片段中目标物体持续出现时长的计算公式如下:

object_display_duration=frame_nums/fps;

式中,object_display_duration为单个目标分镜视频片段中目标物体连续出现的时长,frame_nums为单个目标分镜视频片段中目标物体连续出现的关键帧数,fps为帧频率。

(2)从各个所述目标分镜视频片段中筛选出目标物体持续出现时长不低于预设时长的目标分镜视频片段作为第一目标分镜视频片段。

其中,对于目标物体持续出现时长低于预设时长的目标分镜视频片段则丢弃。

步骤s403、统计各个所述第一目标分镜视频片段中目标物体的占屏比;

其中,目标物体的占屏比指的是目标物体占整个屏幕的百分比。

具体的,计算目标物体的占屏比的过程如下:

假设单个第一目标分镜视频片段的尺寸size=(width,height),width为宽度,height为高度。

(1)计算每一帧的目标物体的占屏比frame_screen_ratio=((x2-x1)*(y2-y1))/(width*height),其中,(x1,y1)为目标物体的每一帧位置的左上角坐标,(x2,y2)为目标物体的每一帧位置的右下角坐标。

(2)统计目标物体持续出现过程中的平均占屏比clip_screen_ratio,公式如下:

(3)将平均占屏比clip_screen_ratio作为目标物体的占屏比。

步骤s404、从各个所述第一目标分镜视频片段中筛选出目标物体的占屏比不小于占屏比阈值的第一目标分镜视频片段,记为第二目标分镜视频片段;

其中,对于目标物体的占屏比小于占屏比阈值的第一目标分镜视频片段则丢弃。

占屏比阈值的取值依据实际需要而定,比如0.1。

需要说明的是,在实际应用中,目标物体的占屏比也不能过大,通常不能超过0.3,以满足广告植入需求。

步骤s405、计算每个所述第二目标分镜视频片段中目标物体的清晰度;

具体的,在实际应用中,可以采用拉普拉斯算子对目标物体在每一帧处的清晰度进行计算。

步骤s406、从各个所述第二目标分镜视频片段中筛选出目标物体的清晰度不小于清晰度阈值的第二目标分镜视频片段,记为第三目标分镜视频片段;

其中,清晰度阈值的取值依据实际需要而定,本发明在此不做限定。

本实施例中,对于清晰度小于清晰度阈值的第二目标分镜视频片段则丢弃。

步骤s407、计算每个所述第三目标分镜视频片段中目标物体的被遮挡比例;

在实际应用中,可以利用基于mobilenetv2的deeplabv3分割模型对每个第三目标分镜视频片段的每一帧进行语义分割,并计算人物、车辆和植物等物体与目标物体区域的重叠面积,基于重叠面积确定目标物体的被遮挡比例。

其中,mobilenetv2是一个轻量级的backbone网络,deeplabv3是一个分割网络。

步骤s408、从各个所述第三目标分镜视频片段中筛选出目标物体的被遮挡比例不大于被遮挡比例阈值的第三目标分镜视频片段,作为动态广告植入视频片段。

其中,对于目标物体的被遮挡比例大于被遮挡比例阈值的第三目标分镜视频片段则丢弃,此时返回步骤s203,对下一个分镜视频片段进行筛选。

与上述方法实施例相对应,本发明还公开了一种动态广告植入位置的检测装置。

参见图5,本发明实施例公开的一种动态广告植入位置的检测装置的结构示意图,该装置包括:

视频切分单元501,用于对获取的需要广告植入的目标视频采用分镜算法进行场景镜头切分,得到多个分镜视频片段;

在实际应用中,可以从媒体资产数据库中获取需广告植入的目标视频。为便于后续查找,可以记录目标视频的保存路径。

其中,本实施例中,对目标视频可以采用基于内容变化的分镜算法进行场景镜头切分,得到多个分镜视频片段。本发明中后续以分镜视频片段为基本单元进行动态广告植入位置的检测。

第一筛选单元502,用于从多个所述分镜视频片段中筛选出包含目标物体的目标分镜视频片段;

其中,所述目标物体为适合动态广告植入的物体,比如,广告牌、画框、电视屏、宣传栏和led(lightemittingdiode,发光二极管)屏幕等。

第二筛选单元503,用于从多个所述目标分镜视频片段中,筛选出包含的所述目标物体的相关参数满足预设参数阈值的目标分镜视频片段作为动态广告植入视频片段;

其中,所述目标物体的相关参数包括:所述目标物体的关键帧数、占屏比、清晰度和被遮挡比例。

广告植入位置确定单元504,用于对所述动态广告植入视频片段,采用预先训练的级联金字塔网络模型对包含所述目标物体的首帧进行点位回归,得到精确的动态广告植入位置。

其中,目标物体的首帧也即目标物体的首个关键帧。

在实际应用中,可以采用标注了精确位置的图像数据集训练级联金字塔网络(cascadedpyramidnetwork,cpn)。整个网络结构由两部分构成,先用特征金字塔网络globalnet识别出简单关键点,再用refinenet网络拟合前者识别下的困难关键点,实现更精确的点位回归。

因此,广告植入位置确定单元504具体可以用于:

确定目标物体在动态广告植入视频片段中出现的首帧;

根据目标物体位置的bbox,获取目标物体截图,其中,bbox表示目标物体位置的一个值,根据目标物体的每一帧位置的左上角坐标(x1,y1)和目标物体的每一帧位置的右下角坐标(x2,y2)构成的一个框来确定目标物体的具体位置。

利用预先训练的具有关键点检测功能的级联金字塔网络模型对目标物体截图中目标物体的首帧进行点位回归,得到精确的精确的点位位置数据,该点位位置数据也即动态广告植入位置。

综上可知,本发明公开了一种动态广告植入位置的检测装置,对获取的需要广告植入的目标视频采用分镜算法进行场景镜头切分,得到多个分镜视频片段,从多个分镜视频片段中筛选出包含适合动态广告植入的目标物体的目标分镜视频片段,在从多个目标分镜视频片段中,筛选出包含的所述目标物体的相关参数满足预设参数阈值的目标分镜视频片段作为动态广告植入视频片段,通过对动态广告植入视频片段,采用预先训练的级联金字塔网络模型对包含所述目标物体的首帧进行点位回归,得到精确的动态广告植入位置。本发明利用深度学习技术与图像处理技术,实现了视频中动态广告植入位置的自动筛选与精准定位,从而节省了人工观看视频检测动态广告植入位置并标记所花费的时间与成本,提高了动态广告植入位置的检测精度和检测效率,进而降低了广告植入成本,在一定程度上增加了广告收益。

为便于后续查找动态广告植入位置,检测装置还可以包括:

存储单元,用于将所述动态广告植入视频片段的相关信息以及对应的所述动态广告植入位置存储至数据库。

其中,动态广告植入视频片段的相关信息可以包括:视频编号、目标物体首次出现的帧数、目标物体出现的持续时长、目标物体类别,点位位置数据等。

当目标视频下所有的分镜视频片段未全部检测完成,则继续对分镜视频片段进行筛选,直至目标视频下所有的分镜视频片段均检测完成。

在对当前的目标视频的动态广告植入位置检测完成后,继续对媒体资产数据库中其他的目标视频进行动态广告植入位置的检测。

由于本发明是从多个分镜视频片段中检测适合动态广告植入的位置,因此为提高检测效率,本发明在确定动态广告植入位置之前对切分得到的多个分镜视频片段进行了初步筛选。

因此,为进一步优化上述实施例,参见图6,本发明实施例公开的一种视频切分单元的结构示意图,视频切分单元具体可以包括:

视频切分子单元601,用于对所述目标视频采用基于内容变化的分镜算法进行场景镜头切分,得到多个原始分镜视频片段;

时长确定子单元602,用于根据每个所述原始分镜视频片段的首帧和尾帧,确定每个所述原始分镜视频片段的视频持续时长;

其中,原始分镜视频片段的首帧和尾帧均是关键帧。

具体的,根据如下公式计算单个原始分镜视频片段的视频持续时长clip_duration,公式如下:

clip_duration=(end_frame_index-begin_frame_index)/fps;

式中,end_frame_index为单个原始分镜视频片段的尾帧,begin_frame_index为单个原始分镜视频片段的首帧,fps为单个原始分镜视频片段的帧率。

第一筛选子单元603,用于从多个所述原始分镜视频片段中,筛选出视频持续时长不小于视频持续时长阈值的原始分镜视频片段作为所述分镜视频片段。

其中,视频持续时长阈值的取值依据实际需要而定,比如3s,本发明在此不做限定。

本实施例中,对于视频持续时长小于视频持续时长阈值的原始分镜视频片段进行丢弃。

为进一步优化上述实施例,参见图7,本发明实施例公开的一种第一筛选单元的结构示意图,第一筛选单元具体可以包括:

中间帧抽取子单元701,用于依次从每个所述分镜视频片段中抽取出对应的中间帧;

检测子单元702,用于用预先训练的目标检测模型对抽取的每个所述中间帧进行目标物体检测;

yolov5目标检测模型的训练过程包括:用包含适合动态广告植入的目标物体,且标注了边界框的图像数据集,对yolov5网络进行训练得到yolov5目标检测模型,yolov5目标检测模型具有检测目标物体的能力。

视频片段确定子单元703,用于将检测到所述目标物体的中间帧对应的分镜视频片段确定为所述目标分镜视频片段。

需要说明的是,若从中间帧中没有检测到目标物体,则确定没有检测到目标物体的中间帧对应的分镜视频片段不适合进行动态广告植入,此时,丢弃没有检测到目标物体的中间帧对应的分镜视频片段,并继续从下一个分镜视频片段中抽取出对应的中间帧,再次对下一个分镜视频片段的中间帧进行目标物体的检测。

参见图8,本发明实施例公开的一种第二筛选单元的结构示意图,第二筛选单元具体可以包括:

关键帧数统计子单元801,用于统计各个所述目标分镜视频片段中所述目标物体连续出现的关键帧数;

在统计目标物体连续出现的关键帧数时,可以目标分镜视频片段的中间帧为基准,向中间帧的左侧和右侧分别扩展,每十帧提取一帧关键帧。

第二筛选子单元802,用于从各个所述目标分镜视频片段中筛选出所述关键帧数不小于关键帧数阈值的目标分镜视频片段,记为第一目标分镜视频片段;

在实际应用中,除了根据关键帧数筛选第一目标分镜视频片段外,还可以根据目标物体持续出现时长进行筛选。

具体的,(1)计算每个目标分镜视频片段中目标物体持续出现时长的计算公式如下:

object_display_duration=frame_nums/fps;

式中,object_display_duration为单个目标分镜视频片段中目标物体连续出现的时长,frame_nums为单个目标分镜视频片段中目标物体连续出现的关键帧数,fps为帧频率。

(2)从各个所述目标分镜视频片段中筛选出目标物体持续出现时长不低于预设时长的目标分镜视频片段作为第一目标分镜视频片段。

其中,对于目标物体持续出现时长低于预设时长的目标分镜视频片段则丢弃。

占屏比统计子单元803,用于统计各个所述第一目标分镜视频片段中所述目标物体的占屏比;

其中,目标物体的占屏比指的是目标物体占整个屏幕的百分比。

具体的,计算目标物体的占屏比的过程如下:

假设单个第一目标分镜视频片段的尺寸size=(width,height),width为宽度,height为高度。

(1)计算每一帧的目标物体的占屏比frame_screen_ratio=((x2-x1)*(y2-y1))/(width*height),其中,(x1,y1)为目标物体的每一帧位置的左上角坐标,(x2,y2)为目标物体的每一帧位置的右下角坐标。

(2)统计目标物体持续出现过程中的平均占屏比clip_screen_ratio,公式如下:

(3)将平均占屏比clip_screen_ratio作为目标物体的占屏比。

第三筛选子单元804,用于从各个所述第一目标分镜视频片段中筛选出所述占屏比不小于占屏比阈值的第一目标分镜视频片段,记为第二目标分镜视频片段;

其中,对于目标物体的占屏比小于占屏比阈值的第一目标分镜视频片段则丢弃。

占屏比阈值的取值依据实际需要而定,比如0.1。

需要说明的是,在实际应用中,目标物体的占屏比也不能过大,通常不能超过0.3,以满足广告植入需求。

清晰度计算子单元805,用于计算每个所述第二目标分镜视频片段中所述目标物体的清晰度;

具体的,在实际应用中,可以采用拉普拉斯算子对目标物体在每一帧处的清晰度进行计算。

第四筛选子单元806,用于从各个所述第二目标分镜视频片段中筛选出所述清晰度不小于清晰度阈值的第二目标分镜视频片段,记为第三目标分镜视频片段;

其中,清晰度阈值的取值依据实际需要而定,本发明在此不做限定。

本实施例中,对于清晰度小于清晰度阈值的第二目标分镜视频片段则丢弃。

被遮挡比例计算子单元807,用于计算每个所述第三目标分镜视频片段中所述目标物体的被遮挡比例;

在实际应用中,可以利用基于mobilenetv2的deeplabv3分割模型对每个第三目标分镜视频片段的每一帧进行语义分割,并计算人物、车辆和植物等物体与目标物体区域的重叠面积,基于重叠面积确定目标物体的被遮挡比例。

其中,mobilenetv2是一个轻量级的backbone网络,deeplabv3是一个分割网络。

第五筛选子单元808,用于从各个所述第三目标分镜视频片段中筛选出所述被遮挡比例不大于被遮挡比例阈值的第三目标分镜视频片段,作为动态广告植入视频片段。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1