基于视频标签获取视频热点信息的方法

文档序号:6350629阅读:267来源:国知局
专利名称:基于视频标签获取视频热点信息的方法
技术领域
本发明涉及网络视频应用领域,更具体地说,本发明涉及一种基于视频标签获取视频热点信息的方法。
背景技术
视频标签是指用于描述视频特征的短语。现有视频标签技术都是针对整个视频进行描述,无法对视频精彩片段进行描述。此外,现有视频标签技术还存在描述不够精确,导致基于现有视频标签技术的广告推送不够精准、广告内容和视频内容不相关、投放效果差的问题。

发明内容
有鉴于此,本发明的目的是提供一种基于视频标签获取视频热点信息的方法,其能通过热点提高视频描述准确度,进而提高基于热点的广告推送效果。本发明是通过以下技术方案实现的一种基于视频标签获取视频热点信息的方法,包括以下步骤获取视频的视频标签,视频标签包括视频的时间点和标签内容,对视频标签的标签内容进行中文分词,过滤分词结果,以保留名词、动词作为视频标签所在时间点的特征描述词,计算特征描述词在视频标签中的重要程度值,根据重要程度值对特征描述词进行排序,并取K个最重要的特征描述词作为时间点的热点备用词,对热点备用词进行统计建模,以生成视频热点信息。计算特征描述词在视频标签中的重要程度值的步骤包括计算特征描述词的词
频值,具体计算公式为7^;其中Hi, j为特征描述词i在视频标签j中出现的次数,
M为视频标签j的特征描述词总数,计算特征描述词的逆向文件频率值,具体计算公式为
权利要求
1.一种基于视频标签获取视频热点信息的方法,包括以下步骤获取视频的视频标签,所述视频标签包括所述视频的时间点和标签内容;对所述视频标签的标签内容进行中文分词,过滤分词结果,以保留名词、动词作为所述视频标签所在时间点的特征描述词;计算所述特征描述词在所述视频标签中的重要程度值;根据所述重要程度值对所述特征描述词进行排序,并取K个最重要的特征描述词作为所述时间点的热点备用词;对所述热点备用词进行统计建模,以生成视频热点信息。
2.根据权利要求1所述的方法,其特征在于,所述计算所述特征描述词在所述视频标签中的重要程度值的步骤包括n..计算所述特征描述词的词频值,具体计算公式为Wu =#,其中nM为特征描述词i在视频标签j中出现的次数,M为视频标签j的特征描述词总数;计算所述特征描述词的IdI逆向文件频率值,具体计算公式为=1°§ ;. \ ι,其中IDI为视频标签的总数,I U Ii e dj} I为包含特征描述词i的视频标签总数;根据以下公式计算特征描述词的重要程度值=特征描述词的词频值*特征描述词的逆向文件频率值。
3.根据权利要求1所述的方法,其特征在于,所述对所述热点备用词进行统计建模,以生成视频热点信息的步骤包括取出所述视频中存在所述热点备用词的所有时间点;从所述所有时间点中选择点击次数最多的N个时间点作为临时热点;将所述临时热点前后10秒内的所有热点备用词存入所述临时热点中,以生成所述视频热点信息。
4.根据权利要求1所述的方法,其特征在于,所述计算所述特征描述词在所述视频标签中的重要程度值的步骤是采用TF-IDF算法。
5.根据权利要求1所述的方法,其特征在于,所述K的取值等于5。
6.根据权利要求1所述的方法,其特征在于,所述N的取值等于所述视频的长度/300
全文摘要
本发明公开了一种基于视频标签获取视频热点信息的方法,包括以下步骤获取视频的视频标签,视频标签包括视频的时间点和标签内容,对视频标签的标签内容进行中文分词,过滤分词结果,以保留名词、动词作为视频标签所在时间点的特征描述词,计算特征描述词在视频标签中的重要程度值,根据重要程度值对特征描述词进行排序,并取K个最重要的特征描述词作为时间点的热点备用词,对热点备用词进行统计建模,以生成视频热点信息。本发明能通过热点提高视频描述准确度,进而提高基于热点的广告推送效果。
文档编号G06F17/30GK102567467SQ20111039651
公开日2012年7月11日 申请日期2011年12月2日 优先权日2011年12月2日
发明者廖小飞, 曲鑫, 金海 , 陆枫 申请人:华中科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1