基于用户观影行为的视频评分方法、装置及视频系统与流程

文档序号:12666345阅读:312来源:国知局

本发明涉及视频推荐技术领域,特别是涉及一种基于用户观影行为的视频评分方法、装置及视频系统。



背景技术:

虽然目前主流网站都会有用户对所观看视频进行打分的设计,但是国内大部分人并没有养成观看完视频,对视频进行打分评价的习惯。基本都是通过用户对视频的隐式操作获取评,这就导致视频网站无法精确获取用户对视频喜好程度的有效信息,而且,现有的隐式操作评价机制因为每次都是统计一段时间范围内的观看视频,这些观看视频可能只占所有视频的一部分,评分系统无法覆盖的全部视频,导致为用户设计的个性化推荐效果会大打折扣。



技术实现要素:

本发明的目的是针对现有技术中存在的技术缺陷,而提供一种基于用户观影行为的视频评分方法及其装置,其综合利用用户的隐式行为,例如观看次数、观看时长、是否收藏、是否分享、是否顶踩等因素,然后根据视频所属专辑、视频的出品人有效打分以进一步对未被点击的视频或新视频进行参考打分。

为实现本发明的目的所采用的技术方案是:

一种基于用户观影行为的视频评分方法,包括,

统计预定时间内所有视频的相关指标,

清洗相关指标数据并分别进行映射转换;

按预定权重获取每个视频的评分,

按该视频的评分计算同一归属类别下所有统计范围内视频的平均分值作为其有效分值,根据归属类别计算统计范围外未被点击视频的有效分值。

所述的视频相关指标包括独立访客数、访客的访问次数、视频的有效播放时长、视频被收藏数、视频分享次数、被顶的次数和被踩的次数。

所述的归属分类包括所属专辑和出品人,所述的有效分值按权重根据所属专辑和出品人两个归属分类的平均分值计算所得。

所述的映射转换包括独立访客数和访客的访问次数的范围区间映射,视频的有效播放时长占据该视频物理时长的比例的范围区间映射,视频被收藏数和视频分享次数分别乘以映射分值后的平均分值计算,被顶的次数和被踩的次数的分值计算。

所述的相关指标数据存储在分布式存储系统上。

一种基于用户观影行为的视频评分装置,包括,

统计模块,用以统计预定时间内所有视频的相关指标,

清洗映射模块,用以清洗相关指标数据并分别进行映射转换;

评分计算模块,用以按预定权重获取每个视频的评分,

赋值模块,用以按该视频的评分计算同一归属类别下所有统计范围内视频的平均分值作为其有效分值,然后根据归属类别计算统计范围外未被点击视频的有效分值。

所述的视频相关指标包括独立访客数、访客的访问次数、视频的有效播放时长、视频被收藏数、视频分享次数、被顶的次数和被踩的次数。

所述的归属分类包括所属专辑和出品人,所述的有效分值为所属专辑和出品人两个归属分类的平均值。

清洗映射模块包括

访问次数类映射子模块,用以将独立访客数和访客的访问次数进行对应的范围区间映射,

播放时长映射子模块,用以将视频的有效播放时长占据该视频物理时长的比例进行对应的范围区间映射,

交互类指标映射子模块,用以根据视频被收藏数和视频分享次数分别乘以行为映射分值后的平均分值计算,

评价类指标映射子模块,用以根据行为映射分值计算被顶的次数和被踩的次数对应的分值。

一种具有所述的基于用户观影行为的视频评分装置的视频系统。

与现有技术相比,本发明的有益效果是:

本发明首先充分利用了用户对视频的各种隐式喜好操作,例如点击、收藏、分享、顶踩等数据指标,利用这些指标,设计公式有效地对一段时间内被点击视频进行了评分,这些评分从侧面反映出了用户的喜好程度。进而由被点击视频评分对视频所属专辑、出品人进行了评价打分,最后再利用专辑、出品人分值,对一定时间内未被点击的视频也赋予一定的分值,从而为全部视频进行打分。借助专辑、出品人的视频关联性,利用客户对演员、出品人、导演等的喜好特征,提高了评分的准确性,提高后续推荐系统的精准度。

附图说明

图1所示为本发明的基于用户观影行为的视频评分方法及其装置的流程示意图。

具体实施方式

以下结合附图和具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明旨在对未被点击的视频进行预评分,同时也发现并解决了新上传视频的评分冷启动问题,即由于视频刚刚被上传,假如简单的给其评分赋值为0的话,很可能在后期的内部排序或者其它规则的推荐上,对其造成不利影响。因为这些新上传的视频,其内容很可能对用户是有吸引力的,仅仅是没有及时的展示给用户而已。

本发明基于用户观影行为的视频评分方法,包括,

步骤101,统计预定时间内所有视频的相关指标,所述的视频相关指标包括UV、VV、PT、KC、SC、DC和DD。其中,UV:Unique Vistor,独立访客数,指一天内观看某视频的人数。同一个视频被同一个人多次观看记为一次。

VV:Visit View,访客的访问次数。每访问一次计做一次。

PT:Play Time,视频的有效播放时长。

KC:Kepp Count,视频被收藏数。

S C:Share Count,视频分享次数。

DC:Digg Up,视频顶踩功能中,用户明确表示喜欢的次数。

DD:Digg Down,视频顶踩功能中,用户明确表示不喜欢的次数

统计预定时间如10天内,所有视频的相关指标,能有效保证数据的丰富性,提高后续预评分的准确性,同时,若数据量较大的话,一般会选择将数据存储在分布式存储系统如HDFS上。

步骤102,清洗相关指标数据并分别进行映射转换;

该步骤中,清洗数据主要包括了数据格式清洗、刷量作弊清洗等。具体的映射转换包括:

(1)将次数类指标如UV、VV按照不同范围的次数映射到不同的值;例如次数count<1000时,对应分值为1,1000<=count<=5000时,分值为2,此类指标映射分值范围为[1,5];

(2)时间类指标PT,按照每个用户观看时长占据视频物理时长的比例,映射为不同的分值。如一个用户的(观看时长)/(物理时长)<=10%,则将分值映射为1,10%<=(观看时长)/(物理时长)<=30%,score为2。此类指标映射分值范围[1,5];

(3)收藏指标KC,视频每被收藏一次,分值为5,最后用(5*KC)/UV,求出平均收藏分值;

(4)分享指标SC,视频每被分享一次,分值为4,最后用(4*SC)/UV,求出平均分享分值;

(5)顶踩数比例(DC/DD),将其映射为不同分值,映射值为DCD。

将不同的指标采用不同的规则进行映射,综合考虑了普遍性和个人行为的影响,保证最终分值的合理性,具体分值等可根据视频类型的不同进行调整。

步骤103,按预定权重获取每个视频的评分,

Score1=Wvv*VV+Wuv*UV+Wpt*PT

Score2=Wkc*KC+Wsc*SC+Wdcd*DCD

vidscore=Score1+Score2

上式中的VV、UV、PT、KC、SC、DCD分别为经过映射处理后的分值,而Wvv,Wuv,Wpt,Wkc,Wsc,Wdcd分别为对应分值的权重,利用第三个公式计算10天内被点击视频的评分。其中,各权重类指标可根据视频类型或者当前流行等进行具体调整。

步骤104,按该视频的评分计算同一归属类别下所有统计范围内视频的平均分值作为其有效分值,根据归属类别计算统计范围外未被点击视频的有效分值。

所述的归属分类包括所属专辑和出品人,所述的有效分值按权重根据所属专辑和出品人两个归属分类的平均分值计算所得,当然,归属分类还可包括导演、演员等,在具体有效分值计算时可进行按权重计算。

通常一个出品人会上传多个视频,而多个视频又会根据其视频内容被划分到不同专辑下,所以可以计算专辑或出品人下包含多个视频的分数均值,作为专辑或者出品人的有效分值,如下述计算公式:

albumscore=(vid1score+vid2score+…+vidkscore)/(vidnumber1)

userscore=(vid1score+vid2score+…+Vidnscore)/(vidnumber2)

其中vid:视频id,album:视频所属专辑,user:视频所属出品人,vidnumberl,vidnumber2分别为专辑、出品人下包含视频的个数。

当视频数量很大时,10天内被点击的视频只能是全部视频的一部分,那些未被点击的视频,尤其是新上传的视频,则根据所属专辑和出品人两个归属分类的平均分值计算按权重计算得到,如用其对应专辑和出品人分值的均值作为此类视频的有效分值。

(vid_noclick)score=(albumscore+userscore)/2

上式中的vid_noclick为10天内未被点击的视频,albumscore和userscore为该视频对应的专辑和出品人。

本发明首先充分利用了用户对视频的各种隐式喜好操作,例如点击、收藏、分享、顶踩等数据指标,利用这些指标,设计公式有效地对一段时间内被点击视频进行了评分,这些评分从侧面反映出了用户的喜好程度。进而由被点击视频评分对视频所属专辑、出品人进行了评价打分,最后再利用专辑、出品人分值,对一定时间内未被点击的视频也赋予一定的分值,从而为全部视频进行打分。借助专辑、出品人的视频关联性,利用客户对演员等的喜好特征,提高了评分的准确性,提高后续推荐系统的精准度。

同时,本发明还公开了一种基于用户观影行为的视频评分装置,包括,

统计模块,用以统计预定时间内所有视频的相关指标,所述的视频相关指标包括UV、VV、PT、KC、SC、DC和DD。

清洗映射模块,用以清洗相关指标数据并分别进行映射转换;其包括,

访问次数类映射子模块,用以将独立访客数和访客的访问次数进行对应的范围区间映射,

播放时长映射子模块,用以将视频的有效播放时长占据该视频物理时长的比例进行对应的范围区间映射,

交互类指标映射子模块,用以根据视频被收藏数和视频分享次数分别乘以行为映射分值后的平均分值计算,

评价类指标映射子模块,用以根据行为映射分值计算被顶的次数和被踩的次数对应的分值。

评分计算模块,用以按预定权重获取每个视频的评分,

赋值模块,用以按该视频的评分计算同一归属类别下所有统计范围内视频的平均分值作为其有效分值,完后根据归属类别计算统计范围外未被点击视频的有效分值。所述的归属分类包括所属专辑和出品人,所述的有效分值为所属专辑和出品人两个归属分类的平均值。

通过模块间的有效数据处理,实现了对一定周期内未点击视频的打分且保证其时效性,提高了客户有后台视频库的交互性,使视频能感受到当前流行趋势,为后台进行有效精准推荐奠定基础。

同时,本发明还公开了一种具有所述的基于用户观影行为的视频评分装置的视频系统,该视频系统内的所有视频能进行有效打分,能提高在一定时间周期内未点击视频的推荐分值有效更新,保证后台推荐系统的精准度,改善个性化推荐效果,提高用户感受。

以上所述仅是本发明的优选实施方式,应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1