一种基于关键帧和颜色直方图的网络视频格式文件摘要提取方法

文档序号:10627264阅读:371来源:国知局
一种基于关键帧和颜色直方图的网络视频格式文件摘要提取方法
【专利摘要】本发明公开了一种基于关键帧和颜色直方图的网络视频格式文件摘要提取方法,其具体步骤如下:通过URL确定网络视频格式文件的地址;利用UDP协议缓存下载网络视频格式文件;将视频序列切分为若干镜头,再从每个镜头中按均匀时间间隔提取3个关键帧;基于关键帧之间的差异计算镜头之间的距离矩阵,然后采用层次汇合聚类算法HAC对镜头进行层次聚类;从每个聚合类中选出时间最长的镜头,将摘要的总时间长度按比例分配给每个选出的镜头,根据分配的时间长度,根据颜色直方图对关键帧打分,从每个选出的镜头中找出一个重要连续片段;最终的摘要就是将这些片段按时间顺序进行串接所形成的视频序列。
【专利说明】
一种基于关键帧和颜色直方图的网络视频格式文件摘要提取方法
技术领域
[0001]本发明涉及一种基于关键帧和颜色直方图的网络视频格式文件摘要提取方法
【背景技术】
[0002]目前网络爬虫只爬取文本,不能爬取音乐、图片和视频等多媒体文件,原因主要是多媒体数据量巨大;如何下载传输多媒体文件;如何索引多媒体文件;进而对处理过的多媒体文件进行检索。现在因特网上有大量的多媒体文件,特别是社交网站和多媒体分享的兴起,需要对多媒体文件进行精准检索。
[0003]网络爬虫,也称网络蜘蛛、网络机器人,是一个自动提取网页的程序,它从因特网上下载网页,是搜索引擎的重要组成部分。网络爬虫利用标准的HTTP协议,根据超级链接和Web文档检索的方法遍历因特网信息空间。
[0004]因特网上有数千种不同的数据类型,HTTP给每种要通过Web传输的对象都打上了名为MME类型的数据格式标签(常见视频格式:video/MP4V-ES,video/mpeg, video/quicktime, video/vnd.mpegurl, video/x-msvideo)。统一资源定位符(URL)是资源标识符最常见的形式。URL描述了一台特定服务器上某资源的特定位置。
[0005]UDP是OSI参考模型中一种无连接的传输层协议,它主要用于不要求分组顺序到达的传输中,分组传输顺序的检查与排序由应用层完成,提供面向事务的简单不可靠信息传送服务。网络视频可通过UDP进行下载,因为UDP具有TCP所望尘莫及的速度优势。
[0006]本发明提供了一种基于关键帧和颜色直方图的网络视频格式文件摘要提取方法,可在适当增加数据量的前提下,通过URL确定网络视频格式文件的地址,利用UDP协议缓存下载网络视频格式文件,将视频序列切分为若干镜头,然后根据颜色直方图从镜头中提取关键帧,最终形成网络视频格式文件摘要。

【发明内容】

[0007]本发明的目的在于提供一种基于关键帧和颜色直方图的网络视频格式文件摘要提取方法。本发明包括以下特征:
[0008]发明技术方案
[0009]—种基于关键帧和颜色直方图的网络视频格式文件摘要提取方法,其具体步骤如下:
[0010]I)通过URL确定网络视频格式文件的地址;
[0011 ] 2)利用UDP协议缓存下载网络视频格式文件;
[0012]3)将视频序列切分为若干镜头,再从每个镜头中按均匀时间间隔提取3个关键帧;
[0013]4)基于关键帧之间的差异计算镜头之间的距离矩阵,然后采用层次汇合聚类算法HAC,对镜头进行层次聚类;
[0014]5)从每个聚合类中选出时间最长的镜头,将摘要的总时间长度按比例分配给每个选出的镜头,根据分配的时间长度,根据颜色直方图对关键帧打分,从每个选出的镜头中找出一个重要连续片段;
[0015]6)最终的摘要就是将这些片段按时间顺序进行串接所形成的视频序列。
【附图说明】
[0016]图1是基于关键帧和颜色直方图的网络视频格式文件摘要提取流程图。
【具体实施方式】
[0017]这种基于关键帧和颜色直方图的网络视频格式文件摘要提取方法,包括如下步骤:
[0018]I)通过URL确定网络视频格式文件的地址;
[0019]2)利用UDP协议缓存下载网络视频格式文件;
[0020]3)将视频序列切分为若干镜头,再从每个镜头中按均匀时间间隔提取3个关键帧;
[0021]4)基于关键帧之间的差异计算镜头之间的距离矩阵,然后采用层次汇合聚类算法HAC,对镜头进行层次聚类;
[0022]5)从每个聚合类中选出时间最长的镜头,将摘要的总时间长度按比例分配给每个选出的镜头,根据分配的时间长度,根据颜色直方图对关键帧打分,从每个选出的镜头中找出一个重要连续片段;
[0023]6)最终的摘要就是将这些片段按时间顺序进行串接所形成的视频序列。
【主权项】
1.一种基于关键帧和颜色直方图的网络视频格式文件摘要提取方法,其具体步骤如下: 1)通过URL确定网络视频格式文件的地址; 2)利用UDP协议缓存下载网络视频格式文件; 3)将视频序列切分为若干镜头,再从每个镜头中按均匀时间间隔提取3个关键帧; 4)基于关键帧之间的差异计算镜头之间的距离矩阵,然后采用层次汇合聚类算法HAC,对镜头进行层次聚类; 5)从每个聚合类中选出时间最长的镜头,将摘要的总时间长度按比例分配给每个选出的镜头,根据分配的时间长度,根据颜色直方图对关键帧打分,从每个选出的镜头中找出一个重要连续片段; 6)最终的摘要就是将这些片段按时间顺序进行串接所形成的视频序列。
【文档编号】H04N21/8549GK105992074SQ201510041681
【公开日】2016年10月5日
【申请日】2015年1月27日
【发明人】张军
【申请人】张军
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1