视频质量挖掘系统及方法

文档序号:6503399阅读:182来源:国知局
视频质量挖掘系统及方法
【专利摘要】本发明公开了一种视频质量挖掘系统及方法,该系统包括:视频源模块,包含用于视频挖掘的来自多个不同视频源的多个视频;分类模组,对该视频源模块中各视频源的视频依据视频属性分别进行分类,并将不同视频源的分类结果进行合并;权重计算模组,对分类后的各视频,依据不同的视频属性获得多个权重,并将所获得的多个权重根据权重计算公式获得各视频最终的权重;排行榜候选集合生成模组,则对于每个分类中的各视频,依据视频的权重生成各分类的排行榜候选集合,通过本发明,不仅可以较为客观地挖掘出高质量视频,而且可以保证所挖掘出的视频的质量。
【专利说明】视频质量挖掘系统及方法

【技术领域】
[0001] 本发明关于一种网络视频系统及方法,特别是涉及一种UGC视频网站中高质量视 频的视频质量挖掘系统及方法。

【背景技术】
[0002] UGC全称为User Generated Content,也就是用户生成内容的意思。与传统视频 网站不同,UGC视频网站中视频有如下特点:
[0003] 1)短视频为主
[0004] 2)视频由用户上传,视频质量参差不齐 [0005] 3)数量大,视频更新快·
[0006] 这些特点,使得自动化发现和挖掘网站中的高质量视频,变得困难。
[0007] 目前,对于UGC视频网站的视频质量挖掘,一种简单的解决方法,是由人工来筛 选,该方法的优点在于,一定程度上能保证被筛选视频的质量.但是缺点也是显而易见的:
[0008] 1)耗费人力物力,由于视频更新快,需要编辑不断的去把握当前的热点.
[0009] 2)主观程度高,这包括:a,选择视频的好坏,取决与编辑的经验.b,选取视频时, 不可避免的会有个人的倾向。
[0010] 对于UGC视频网站视频质量挖掘的另一种方法,是完全依赖于如视频播放数、评 论数等统计意义的数据,常见的有如:一周播放最多排行榜,今日评论排行榜等.,这些统 计数据,从一定程度上,确实能反映出视频的热门程度,播放数较高的视频,一般也确实是 当前热门播放的视频。但也存在如下问题:
[0011] 1)视频播放数受推广手段影响.。比如,某视频出现在百度首页,或者在社区中 被某个名人转发,则视频更容易被曝光,从而拥有大量播放数.但这些视频,质量并不一定 好,而用户可能是被"骗"点入观看视频,并非用户真正喜欢。
[0012] 举例:
[0013] 用户想在网站上找刚上映的电影,但由于版权原因,社区网站上并没有完整版电 影,只有花絮或者宣传片.用户通过搜索引擎被"骗"点入,并非真正喜欢。
[0014] 2)视频质量难于保证。一些标题党视频,经常有相当多的点击,但这些视频,也不 应归类为高质量的视频。


【发明内容】

[0015] 为克服上述现有技术存在的不足,本发明之目的在于提供一种视频质量挖掘系统 及方法,通过将不同视频源的视频分别进行分类并合并,对各视频依据视频属性获得权重, 根据权重获得各分类的排行榜候选集合,不仅可以较为客观地挖掘出高质量视频,而且可 以保证所挖掘出的视频的质量。
[0016] 为达上述及其它目的,本发明提出一种视频质量挖掘系统,至少包括:
[0017] 视频源模块,包含用于视频挖掘的来自多个不同视频源的多个视频;
[0018] 分类模组,对该视频源模块中各视频源的视频依据视频属性分别进行分类,并将 不同视频源的分类结果进行合并;
[0019] 权重计算模组,对分类后的各视频,依据不同的视频属性获得多个权重,并将所获 得的多个权重根据权重计算公式获得各视频最终的权重;
[0020] 排行榜候选集合生成模组,则对于每个分类中的各视频,依据视频的权重生成各 分类的排行榜候选集合。
[0021] 进一步地,该系统还包括存储模块,将各分类的排行榜候选集合存储于数据库中。
[0022] 进一步地,该视频源模块包括实时统计播放数获得的视频源、人工编辑推荐的视 频源以及重要V⑶上传的视频源。
[0023] 进一步地,该分类模组将该实时统计播放数获得的视频源依据视频属性中的时间 和播放数将视频源中的视频分类。
[0024] 进一步地,该分类模组将人工编辑推荐的视频源依据视频属性中的视频位置将视 频源中的视频分类。
[0025] 进一步地,该分类模组将该重要V⑶上传的视频源依据视频属性中的上传时间将 视频源中的视频分类。
[0026] 进一步地,该权重计算公式为:
[0027] Rank = wl*Rl+w2*R2+w3*R3
[0028] 其中,Rank为该权重计算模组计算所得权重,wl,《2, w3为经验参数,R1为根据统 计视频的播放数得出视频的权重,R2为根据视频出现在页面碎片的位置计算得出视频权重 R2, R3为根据该V⑶的重要程度,给予该V⑶上传视频的权重。
[0029] 进一步地,该视频质量挖掘系统还包括重排序模组,该重排序模组对于各分类排 行榜候选集合中的视频依据视频新获取的属性及基础属性重新计算权重,并根据重新计算 后的权重进行重排序,形成新的各分类的排行榜候选集合。
[0030] 进一步地,该重排序模组包括包括点击反馈模块、去重模块、黑名单过滤模块、播 放数总量获取模块以及权重重计算模块,该点击反馈模块用于挖掘前一天用户对播放页推 荐位视频点击情况,该去重模块用于判断是否具有重复的视频,该黑名单过滤模块用于过 滤黑名单以及存储于视频列表中状态不合法的视频,该播放数总量获取模块结合视频的新 颖程度及播放数总量,调整视频权重,该权重重计算模块依据点击反馈模块获得的视频点 击反馈的权重,依据去重模块计算出的惩罚项,并根据视频的基础属性计算出视频的属性 权重,利用重计算公式获得各视频的新权重值,并根据新权重值对各分类排行榜候选集合 中的视频进行重排序,形成新的各分类的排行榜候选集合。
[0031] 进一步地,该重计算公式为:
[0032] V = R+vl+v2+v3
[0033] 其中,V为新权重值,R为该权种计算模组获得的权重值,VI为该点击反馈模块根 据视频被点击的次数获得的权重,V2为该去重模块到视频为重复视频计算出的惩罚项,V3 为根据视频基础属性计算出的视频的属性权重。
[0034] 为达到上述及其他目的,本发明还提供一种视频质量挖掘方法,包括如下步骤:
[0035] 步骤一,对不同视频源的视频依据视频属性分别进行分类,并将不同视频源的分 类结果进行合并;
[0036] 步骤二,对分类后的各视频,依据不同的视频属性获得多个权重,并根据权重计算 公式获得各视频最终的权重;
[0037] 步骤三,对于每个分类中的各视频,依据视频的权重生成各分类的排行榜候选集 合。
[0038] 进一步地,于步骤三后,还包括将各分类的排行榜候选集合存储于数据库中的步 骤。
[0039] 进一步地,该视频源包括实时统计播放数获得的视频源、人工编辑推荐的视频源 以及重要V⑶上传的视频源。
[0040] 进一步地,对于实时统计播放数获得的视频源,分类依据的视频属性为时间与播 放数;对于人工编辑推荐的视频源,分类依据的视频属性为视频位置;对于重要V⑶上传的 视频源,分类依据的视频属性为上传时间。
[0041] 进一步地,于步骤一中,分类合并的结果包括上升最快的视频、热门视频及精选视 频。
[0042] 进一步地,步骤二还包括如下步骤:
[0043] 依据统计的视频的播放数,得到视频的权重R1 ;
[0044] 根据视频的出现的位置,计算出视频权重R2 ;
[0045] 根据V⑶的重要程度,给予该V⑶上传视频的权重R3 ;
[0046] 利用权重计算公式Rank = wl*Rl+w2*R2+w3*R3获得各视频的最终权重,其中wl, w2, w3为经验参数。
[0047] 进一步地,于步骤二中,根据线上点击率情况,对各视频的权重做调节。
[0048] 进一步地,该步骤三之后还包括如下步骤:
[0049] 对于各分类排行榜候选集合中的视频依据视频新获取的属性及原始属性重新计 算权重,并根据重新计算后的权重进行重排序,形成新的各分类的排行榜候选集合。
[0050] 进一步地,重排序步骤包括:
[0051] 根据点击反馈模块获得该视频被点击的次数,得出视频点击反馈的权重vl ;
[0052] 根据去重模块的判断结果,计算出惩罚项v2 ;
[0053] 根据视频的基础属性,计算出视频的属性权重v3 ;
[0054] 依据重计算公式V = R+vl+v2+v3获得各视频的新权重值,其中R为步骤二中获得 的权重值;
[0055] 根据重新计算后的权重对各分类的排行榜候选集合进行重排序,形成新的各分类 的排行榜候选集合。
[0056] 进一步地,该基础属性包括视频标题长度、上传时间、视频时长、清晰程度。
[0057] 与现有技术相比,本发明一种视频质量挖掘系统及方法通过将不同视频源的视频 分别进行分类并合并,对各视频依据视频属性获得权重,根据权重获得各分类的排行榜候 选集合,不仅可以较为客观地挖掘出高质量视频,而且可以保证所挖掘的视频的质量。

【专利附图】

【附图说明】
[0058] 图1为本发明一种视频质量挖掘系统的系统架构图;
[0059] 图2为本发明一种视频质量挖掘方法的步骤流程图;
[0060] 图3、图4及图5为本发明之较佳实施例的视频质量挖掘结果示意图。

【具体实施方式】
[0061] 以下通过特定的具体实例并结合【专利附图】
附图
【附图说明】本发明的实施方式,本领域技术人员可 由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。本发明亦可通过其它不同 的具体实例加以施行或应用,本说明书中的各项细节亦可基于不同观点与应用,在不背离 本发明的精神下进行各种修饰与变更。
[0062] 图1为本发明一种视频质量挖掘系统的系统架构图。如图1所示,本发明一种视 频质量挖掘系统,用于UGC视频网站中的高质量视频挖掘,至少包括:视频源模块101、分类 模组102、权重计算模组103、排行榜候选集合生成模组104以及存储模块105。
[0063] 其中,视频源模块101包含用于视频挖掘的来自多个不同视频源的多个视频,在 本发明较佳实施例中,视频源模块101具有以下三种视频源:1、实时统计各视频的视频播 放数,播放数超过一预设值的视频为实时统计获得的视频源;2、人工编辑推荐的视频,包括 包括页面碎片和栏目,即网站编辑整理出的各个分类,各个栏目的视频,这类视频源的质量 一般比较高;3、重要VCU(Value Creating User/Unit,仓ij造价值的用户/机构)上传的视 频,对长期以来,网站和社区认可的V⑶所上传的视频,一般质量都有保证.这些视频是高 质量视频的一个来源。
[0064] 分类模组102对视频源模块101中各视频源的视频依据视频属性分别进行分类, 并将不同视频源的分类结果进行合并。具体来说,对于实时统计播放数的获得的视频源,分 类模组102依据视频属性中的时间和播放数将该视频源中的视频分类,在本发明较佳实施 例中,分为三类:上升最快、热门视频以及精选视频,举例来说,分类模组102将最近5小时, 小时级播放数> 20的视频归为上升最快的视频,将最近24小时,小时级播放数> 50的视 频归类为热门视频,将最近10天.每天播放数> 200的视频归为精选视频;对于人工编辑 推荐的视频,分类模组102依据视频属性中的视频位置进行分类,例如,分类模组102将当 前页面碎片视频归类为上升最快的视频,将当前栏目视频归类为热门视频,将历史栏目视 频归类为精选视频;对于重要VCU上传的视频,分类模组102则根据视频属性中的上传时 间进行分类,例如,分类模组102将最近1天上传视频归类为上升最快的视频,将最近2天 上传的视频归类为热门视频,将最近10天上传的视频归类为精选视频,对三种视频源的分 类结果可如表1所示,分类结果102将不同视频源的分类结果进行合并,形成对视频源模块 101中视频总的分类结果。
[0065;

【权利要求】
1. 一种视频质量挖掘系统,至少包括: 视频源模块,包含用于视频挖掘的来自多个不同视频源的多个视频; 分类模组,对该视频源模块中各视频源的视频依据视频属性分别进行分类,并将不同 视频源的分类结果进行合并; 权重计算模组,对分类后的各视频,依据不同的视频属性获得多个权重,并将所获得的 多个权重根据权重计算公式获得各视频最终的权重; 排行榜候选集合生成模组,则对于每个分类中的各视频,依据视频的权重生成各分类 的排行榜候选集合。
2. 如权利要求1所述的视频质量挖掘系统,其特征在于:该系统还包括存储模块,将各 分类的排行榜候选集合存储于数据库中。
3. 如权利要求1所述的视频质量挖掘系统,其特征在于:该视频源模块包括实时统计 播放数获得的视频源、人工编辑推荐的视频源以及重要VCU上传的视频源。
4. 如权利要求3所述的视频质量挖掘系统,其特征在于:该分类模组将该实时统计播 放数获得的视频源依据视频属性中的时间和播放数将视频源中的视频分类。
5. 如权利要求4所述的视频质量挖掘系统,其特征在于:该分类模组将人工编辑推荐 的视频源依据视频属性中的视频位置将视频源中的视频分类。
6. 如权利要求5所述的视频质量挖掘系统,其特征在于:该分类模组将该重要VCU上 传的视频源依据视频属性中的上传时间将视频源中的视频分类。
7. 如权利要求6所述的视频质量挖掘系统,其特征在于,该权重计算公式为: Rank = wl*Rl+w2*R2+w3*R3 其中,Rank为该权重计算模组计算所得权重,wl,《2, w3为经验参数,R1为根据统计视 频的播放数得出视频的权重,R2为根据视频出现在页面碎片的位置计算得出视频权重R2, R3为根据该V⑶的重要程度,给予该V⑶上传视频的权重。
8. 如权利要求1所述的视频质量挖掘系统,其特征在于:该视频质量挖掘系统还包括 重排序模组,该重排序模组对于各分类排行榜候选集合中的视频依据视频新获取的属性及 基础属性重新计算权重,并根据重新计算后的权重进行重排序,形成新的各分类的排行榜 候选集合。
9. 如权利要求8所述的视频质量挖掘系统,其特征在于:该重排序模组包括包括点击 反馈模块、去重模块、黑名单过滤模块、播放数总量获取模块以及权重重计算模块,其中, 该点击反馈模块用于挖掘前一天用户对播放页推荐位视频点击情况; 该去重模块用于判断是否具有重复的视频; 该黑名单过滤模块用于过滤黑名单以及存储于视频列表中状态不合法的视频; 该播放数总量获取模块结合视频的新颖程度及播放数总量,调整视频权重; 该权重重计算模块依据点击反馈模块获得的视频点击反馈的权重,依据去重模块计算 出的惩罚项,并根据视频的基础属性计算出视频的属性权重,利用重计算公式获得各视频 的新权重值,并根据新权重值对各分类排行榜候选集合中的视频进行重排序,形成新的各 分类的排行榜候选集合。
10. 如权利要求8所述的视频质量挖掘系统,其特征在于,该重计算公式为: V = R+vl+v2+v3 其中,V为新权重值,R为该权种计算模组获得的权重值,VI为该点击反馈模块根据视 频被点击的次数获得的权重,V2为该去重模块到视频为重复视频计算出的惩罚项,V3为根 据视频基础属性计算出的视频的属性权重。
11. 一种视频质量挖掘方法,包括如下步骤: 步骤一,对不同视频源的视频依据视频属性分别进行分类,并将不同视频源的分类结 果进行合并; 步骤二,对分类后的各视频,依据不同的视频属性获得多个权重,并根据权重计算公式 获得各视频最终的权重; 步骤三,对于每个分类中的各视频,依据视频的权重生成各分类的排行榜候选集合。
12. 如权利要求11所述的一种视频质量挖掘方法,其特征在于:于步骤三后,还包括将 各分类的排行榜候选集合存储于数据库中的步骤。
13. 如权利要求11所述的一种视频质量挖掘方法,其特征在于:该视频源包括实时统 计播放数获得的视频源、人工编辑推荐的视频源以及重要VCU上传的视频源。
14. 如权利要求13所述的一种视频质量挖掘方法,其特征在于:对于实时统计播放数 获得的视频源,分类依据的视频属性为时间与播放数;对于人工编辑推荐的视频源,分类依 据的视频属性为视频位置;对于重要VCU上传的视频源,分类依据的视频属性为上传时间。
15. 如权利要求14所述的一种视频质量挖掘方法,其特征在于:于步骤一中,分类合并 的结果包括上升最快的视频、热门视频及精选视频。
16. 如权利要求14所述的一种视频质量挖掘方法,其特征在于,步骤二还包括如下步 骤: 依据统计的视频的播放数,得到视频的权重R1 ; 根据视频的出现的位置,计算出视频权重R2 ; 根据V⑶的重要程度,给予该V⑶上传视频的权重R3 ; 利用权重计算公式Rank = wl*Rl+w2*R2+w3*R3获得各视频的最终权重,其中wl,w2, w3为经验参数。
17. 如权利要求16所述的一种视频质量挖掘方法,其特征在于:于步骤二中,根据线上 点击率情况,对各视频的权重做调节。
18. 如权利要求11所述的一种视频质量挖掘方法,其特征在于,该步骤三之后还包括 如下步骤: 对于各分类排行榜候选集合中的视频依据视频新获取的属性及原始属性重新计算权 重,并根据重新计算后的权重进行重排序,形成新的各分类的排行榜候选集合。
19. 如权利要求18所述的一种视频质量挖掘方法,其特征在于,重排序步骤包括: 根据点击反馈模块获得该视频被点击的次数,得出视频点击反馈的权重vl ; 根据去重模块的判断结果,计算出惩罚项v2 ; 根据视频的基础属性,计算出视频的属性权重v3 ; 依据重计算公式V = R+vl+v2+v3获得各视频的新权重值,其中R为步骤二中获得的权 重值; 根据重新计算后的权重对各分类的排行榜候选集合进行重排序,形成新的各分类的排 行榜候选集合。
20.如权利要求19所述的一种视频质量挖掘方法,其特征在于:该基础属性包括视频 标题长度、上传时间、视频时长、清晰程度。
【文档编号】G06F17/30GK104216879SQ201310205575
【公开日】2014年12月17日 申请日期:2013年5月29日 优先权日:2013年5月29日
【发明者】姚璐, 陈运文, 姜迅, 吕鹏, 陈华清 申请人:酷盛(天津)科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1