一种基于卷积神经网络的视频台标识别装置及工作方法与流程

文档序号：12133981阅读：来源：国知局

技术特征：

1.一种基于卷积神经网络的视频台标识别装置，其特征在于：包括视频数据库、解码模块、关键帧提取模块、关键帧融合模块、台标扩充模块和深度卷积神经网络台标识别模块；连接关系为视频数据库、解码模块、关键帧提取模块、关键帧融合模块和深度卷积神经网络台标识别模块依序连接，台标扩充模块与深度卷积神经网络台标识别模块单独连接。

2.根据权利要求1所述的一种基于卷积神经网络的视频台标识别装置，其特征在于：所述视频数据库包括互联网视频和电视视频。

3.根据权利要求1所述的一种基于卷积神经网络的视频台标识别装置，其特征在于：所述台标扩充模块还包括台标背景变换模块、台标均衡化处理模块、台标镜像化处理模块、台标模糊锐化处理模块、台标亮度对比度调节模块、台标高斯噪声添加模块。

4.根据权利要求1所述的一种基于卷积神经网络的视频台标识别装置，其特征在于：所述解码模块还包括视频时长识别模块，所述视频时长识别模块，可识别视频时长，并输出视频时长识别结果，所述视频时长识别结果为长视频或短视频。

5.根据权利要求1所述的一种基于卷积神经网络的视频台标识别装置，其特征在于：所述深度卷积神经网络台标识别模块包括卷积层、全连接层和softmax层，所述卷基层包括Conv1、Conv2、Conv3、Conv4和Conv5；所述Conv1、Conv2和Conv5后面设有一个max-pooling层。

6.根据权利要求1所述的一种基于卷积神经网络的视频台标识别装置，其特征在于：所述关键帧融合模块的融合策略公式为S_i＝αS_i-1+(1-α)F_i；(其中，i表示关键帧序号，F_i表示第i帧关键帧，S_i表示i个关键帧融合后的图像帧。)

7.根据权利要求1-6任意一项所述的一种基于卷积神经网络的视频台标识别装置的工作方法，其特征在于：包括如下步骤：

a.将台标模型库载入所述台标扩充模块，将扩充后的台标模型库载入所述深度卷积神经网络台标识别模块存储；

b.所述解码模块对视频数据库信息解码，然后获取所述视频数据库中视频总时长，当视频长度大于2分钟时，视为所述长视频，否则视为所述短视频；

c.当解码模块鉴定为所述长视频时，首先在压缩域上进行等间隔采样，定位距离每个采样时间点最近的关键帧位置并通过所述关键帧提取模块进行解码，获取关键帧内容，一个视频获取十帧关键帧信息，用九宫格裁剪方法提取出现在视频左上、右上、左下、右下四个角落的关键帧信息，然后以opencv的Mat形式保存；

d.当解码模块鉴定为所述短视频时，首先对完整视频通过所述关键帧提取模块进行解码，然后等间隔采样十帧内容，用九宫格裁剪方法提取出现在视频左上、右上、左下、右下四个角落的关键帧信息，以opencv的Mat形式保存；

e.所述关键帧融合模块读取关键帧提取模块的关键帧信息后，基于图像加权平均算法将各个角落的多帧关键帧进行融合，并将融合后的关键帧送入所述深度卷积神经网络台标识别模块；

f.所述深度卷积神经网络台标识别模块接收所述融合后的关键帧图像，卷积处理，所述Conv1、Conv2和Conv5后接的max-pooling层，对卷积后的所述关键帧进行下采样，从而实现降维；为了提高模型的收敛速度，所述卷积层和所述全连接层的激活函数采用ReLU，为了防止出现过拟合，采用迁移学习的方式训练网络，首先使用ImageNet 2012数据集预先训练一个模型，用其参数对所述卷积层进行初始化，所述全连接层参数则采用高斯分布小随机数进行初始化，将所述卷积层的学习速率调为0.001，所述全连接层以两倍的速率更新参数。

g.根据深度卷积神经网络的输出结果判断输入视频中是否存在有害台标。

完整全部详细技术资料下载

当前第2页1 2 3