一种基于多用户的视频推荐方法及装置的制造方法

文档序号:9911082阅读:672来源:国知局
一种基于多用户的视频推荐方法及装置的制造方法
【技术领域】
[0001] 本发明涉及推荐技术领域,尤其涉及一种基于多用户的视频推荐方法及装置。
【背景技术】
[0002] 随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时 代,推荐系统应运而生。推荐系统或基于视频内容,或基于用户历史行为记录,向用户找到 其已知范围之外的感兴趣的视频,拓展其观影体验。
[0003] 现有的推荐系统通常都是针对单设备单用户来进行推荐,而在单设备中还可能会 涉及多用户。以电视为例,在一个家庭中,通常会有多个用户观看电视,在各个时间段的观 看兴趣点是不同的,每个成员会按照自己的兴趣主动选择相关视频进行观看,从而导致在 电视上获取的历史记录是多个隐含用户的兴趣叠加。例如:一个家庭由四口人组成,分别为 父亲、母亲、奶奶和孩子。父亲喜欢动作片,母亲喜欢爱情片,奶奶喜欢京剧戏曲,孩子喜欢 动画片。同一家庭的四个成员共享一台电视,在推荐系统的历史记录中标记为同一个用户, 那么,推荐系统会同时推荐动作片、爱情片、京剧戏曲、动画片等相似视频,这样就会导致对 每个家庭成员推荐的结果都掺杂了大量的无用视频,造成不能针对每个家庭成员的兴趣和 爱好进行推荐,推荐准确度不高,用户体验差。

【发明内容】

[0004] 本发明的实施例提供一种基于多用户的视频推荐方法,能够针对多用户中每个用 户需求和兴趣,为其推荐喜欢的视频,提高推荐的准确性。
[0005] 为达到上述目的,本发明的实施例采用如下技术方案:
[0006] 本发明实施例提供一种基于多用户的视频推荐方法,包括以下步骤:
[0007] 根据视频信息及预设用户操作类型权重,计算任意两视频之间的第一相似度和第 二相似度,所述视频信息包括用户对视频历史操作信息;
[0008] 根据所述任意两视频之间的第一相似度和第二相似度,得到任意两视频之间的综 合相似度;
[0009] 根据所述任意两视频之间的综合相似度,对所述视频进行聚类,得到多个兴趣点;
[0010] 根据所述用户对视频历史操作信息,统计每个用户的历史操作视频在划分时间段 所属的兴趣点;
[0011] 根据所述兴趣点分布,为每个用户生成推荐列表。
[0012] 本发明实施例还提供了一种基于多用户的视频推荐装置,包括:
[0013] 相似度计算模块,用于根据视频信息及预设用户操作类型权重,计算任意两视频 之间的第一相似度和第二相似度,所述视频信息包括用户对视频历史操作信息;
[0014] 综合模块,用于根据所述任意两视频之间的第一相似度和第二相似度,得到任意 两视频之间的综合相似度;
[0015] 聚类模块,用于根据所述任意两视频之间的综合相似度,对所述视频进行聚类,得 到多个兴趣点;
[0016] 统计模块,用于根据所述用户对视频历史操作信息,统计每个用户的历史操作视 频在划分时间段所属的兴趣点;
[0017] 推荐模块,用于根据所述兴趣点分布,为每个用户生成推荐列表。
[0018] 本发明实施例所提供的基于多用户的视频推荐方法及装置,根据视频信息及预设 用户操作类型权重,计算任意两视频之间的第一相似度和第二相似度,并根据得到的任意 两视频之间的第一相似度和第二相似度得到任意两视频之间综合的相似度,根据所述任意 两视频之间的综合相似度,对所述视频进行聚类,可以获得多个兴趣点,每个兴趣点代表一 个聚类簇,相似度高的视频可以被聚类在一起,形成一个聚类簇,表征用户的喜好,再根据 每个用户对视频的历史操作信息,可以对每个用户的历史操作信息中操作视频的时间点和 操作视频分别所属的时间段和兴趣点进行统计,这样就了解了当每个用户在各个时间段的 喜好,那么就可以根据每个用户在各个时间段的兴趣点分布情况进行兴趣点中视频的选 取,进而根据选取的视频生成推荐列表为用户进行推荐。因为该方法可以针对每个用户的 历史操作记录对每个用户在各个时间段的喜好情况进行了解,进而针对每个用户在各个不 同时间段的兴趣和爱好生成其喜欢的视频的推荐列表进行推荐,所以满足了多用户对于推 荐的需求,提高了对于多用户推荐的准确性,对于多用户来说用户体验更好。并且,由于用 户操作类型权重反映了用户对视频的喜好度,用户对视频历史操作是视频在实际应用场景 中场景特性的直接体现,因此得到的任意两视频之间的综合相似度包含了基于用户操作行 为的视频间的相似度,反映视频在具体场景中的相关度,而根据任意两视频之间的综合相 似度,对所述视频进行聚类,可以把因为具体应用场景关联在一起和视频本身相似度高的 视频聚集在一起,从而为后续推荐提供了结合用户行为和应用场景的视频间的关联性数据 和与视频本身相似的数据,使得聚类后的兴趣点中的视频数据更加全面,避免了对单一视 频相似度进行聚类导致的从兴趣点中选取用户喜欢视频信息不全面的问题,推荐准确性更 高。另一方面,根据任意两视频之间的综合相似度,对所述视频进行聚类,在对每个用户在 每个时间段的操作视频情况进行统计的时候,范围限定到聚类后生成的兴趣点中的视频, 相比于对所有数据库中的视频进行统计,大大减少了计算量,提高了推荐效率。
【附图说明】
[0019] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的附图。
[0020] 图1为本发明实施例提供的一种基于多用户的视频推荐方法的方法流程图;
[0021] 图2为本发明实施例提供的一种基于多用户的视频推荐装置的结构示意图。
【具体实施方式】
[0022]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
[0023] 本发明实施例提供一种基于多用户的视频推荐方法,如图1所示,该方法包括:
[0024] 101、基于多用户的视频推荐装置根据视频信息及预设用户操作类型权重,计算任 意两视频之间的第一相似度和第二相似度。
[0025] 本发明实施例中的基于多用户的视频推荐装置可以为管理所有终端设备的服务 器,也可以为某一终端设备,该终端设备可以是智能电视或便携式、袖珍式或手持式的电子 设备,例如,智能手机、平板电脑以及个人数字助理等。
[0026] 本发明实施例中的视频信息包括视频属性信息和用户对视频历史操作信息。
[0027] 视频属性信息包括视频标识、名称、类型、国家、导演、演员、简介等。对简介进行文 本分词处理,并去除停用词(介词、连接词、语气词等虚词),将剩下的实词和名称、类型、国 家、导演、演员等信息,作为视频的标签特征,构成标签库。每个视频对应一个标签库,可以 用视频ID表示下标,即视频OOOlvotxn对应标签库tagtxxn,所有视频标签库构成总标签库T = [ tagoooi,tagoo02,···) 0
[0028] 其中,视频标识可以为该视频的名称或视频的ID或其他可唯一表示该视频的标 识,本实施例中采用vl、v2、v3、......、vm表示不同视频的标识。
[0029]示例性的,获取多用户的视频推荐装置会获取预定时间范围内所有用户对视频的 操作数据,然后,对这个用户的操作数据进行预处理,提取出用户对视频所执行的特定用户 操作的数据,然后将用户对视频所执行的特定用户操作的数据作为用户对视频的历史操作 信息。
[0030] 其中,本发明实施例中用户对视频的历史操作信息包括:用户标识、用户标识对视 频标识操作行为,用户标识对视频标识操作时间。例如,对于视频来说,该特定用户操作类 型包括:点击、收藏、购买等。需要说明的是,上述的具体用户操作类型仅仅是一种示例,仅 仅是将可以代表用户喜好的用户操作类型筛选出来,然后,为其赋不同的权重来表示不同 的用户对不同的视频的喜好度。例如,{:点击1、收藏2、购买3}。
[0031] 其中,上述的用户标识可以为该用户的登陆账号或者其他可唯一表示该用户的标 识,本实施例中采用ul、u2、u3 un形式表示不同用户的标识。
[0032]优选的,在步骤101中,可以设置一个更新周期,更新周期的长短可以根据视频数 据的数据库更新情况进行设定,例如,可以设为一个月,一周或一天,本发明对此不进行限 制,在每个更新周期内获取所述每个更新周期内的视频数据的属性信息并进行更新。本实 施例下述各步骤均以当前周期为例进行说明。
[0033] 具体地,所述任意两视频之间的第一相似度具体计算方式为:根据所述视频属性 信息,获取每个视频的词频和逆文档频率因子,根据所述每个视频的词频和逆文档频率因 子,获得每个视频第一特征向量,根据第一相似度计算公式获得任意两视频之间的第一相 似度,其中,第一相似度计算公式为
W为视频^第 一特征向量,Pv2为视频V2第一特征向量。
[0034] 具体地,根据词频计算公式,计算每个视频标签库中的标签特征的词频,词频计算 公式为:
,其中,Wi为标签特征,iei,2,…,n,n为标签 特征总数,为视频L的视频标签库,jei,2,…,m,m为视频总数,若/(W 中,标 签特征Wl与视频标签库中视频v的第j个标签特征相同,那么/(W = togl.,)为丨,否则为〇, T为总视频标签库,| W |表示每个视频标签库中的标签特征集合在一起去重后的总数。
[0035] 示例性的,对每一个视频标签库中的每一个标签特征,统计其在所有视频标签库 中出现的次数,可以用每个标签特征在所有视频标签库中出现的次数除以每个视频标签库 中的标签特征集合在一起去重后的总数获得。
[0036] 具体地,根据逆文档频率因子的计算公式,计算每个标签特征的逆文档频率因子, 逆文档频率因子计算公式为
|其中,W为每个视频标 签库中的标签特征集合在一起去重后的总数,tagv为视频v的视频标签库,I (Wi £ tagv)为
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1