一种视频推荐方法和装置制造方法

文档序号:7806765阅读:114来源:国知局
一种视频推荐方法和装置制造方法
【专利摘要】本发明公开了一种视频推荐方法和装置,用于解决推荐方法中存在的推荐的准确度和全面度均偏低、灵活性较差的问题。方法包括:在设定的周期内,从各视频源已发布的视频数据库中,筛选出设定数量的视频数据,作为第一视频数据集;并在用户发生操作行为时,根据该用户的标识信息,采集该用户已观看的视频,从相关视频数据库中,确定出该用户已观看的视频的相关视频数据,作为第二视频数据集;分别从第一视频数据集和第二视频数据集中,选取设定数量的视频数据,形成该用户对应的视频推荐列表,并推荐给该用户,从而提高了推荐的全面度、以及灵活性,由于该方法是实时处理的,也提高了推荐的准确度。
【专利说明】一种视频推荐方法和装置

【技术领域】
[0001] 本发明涉及信息【技术领域】,特别涉及一种视频推荐方法和装置。

【背景技术】
[0002] 随着信息技术的迅猛发展,网络数据呈现爆炸式增长,网络用户的日常生活也得 到了极大的丰富。但是面对纷繁复杂的网络数据,用户难以快速定位自己喜欢的内容,为了 解决上述问题,随之出现了在线视频推荐。
[0003] 在线视频推荐是视频网站帮助用户查找,以使用户能够观看某种特定领域视频的 方法和工具。相对于传统的视频目录浏览方式或者视频搜索方式,视频推荐能够在用户不 确定合适的搜索词的情况下,通过分析用户行为,得到用户需求的特定视频领域,并在该视 频领域内进行推荐,避免了搜索词的输入和层次目录的多次点击过程,使得查找并观看某 种特定类型的视频更加简单容易。
[0004] 当前已有的视频推荐方法主要有两种。一种是用户主动选择喜欢的视频类别,然 后系统根据用户选择来推荐相同类别的视频;另一种则是根据用户的历史观看记录,推荐 与用户观看过的视频相同类别的其他视频。这两种方法都侧重于利用用户的观看信息来进 行视频推荐,其推荐结果过度集中于用户观看过的某一种类的视频数据(如电影),对于喜 好比较单一的用户,其推荐结果较好。但是随着互联网视频网站的发展和用户上网观看视 频的行为增多,用户对观看视频类型和特征的需求更为多样化,现有的视频推荐方法,无法 反映用户的真实兴趣,推荐的准确度和全面度均偏低,更无法预测用户可能喜欢的潜在的 视频类别,灵活性较差。
[0005] 综上所述,由于现有的视频推荐方法都是基于用户的观看信息进行分析,得到的 推荐结果过度集中于用户观看过的某一种类的视频数据,无法反映用户的兴趣变化,推荐 的准确度和全面度均偏低,更无法预测用户可能喜欢的潜在的视频类别,灵活性较差。


【发明内容】

[0006] 本发明实施例提供了一种视频推荐方法和装置,用于解决现有视频推荐方法存在 的无法反映用户的兴趣变化,推荐的准确度和全面度均偏低,无法预测用户可能喜欢的潜 在的视频类别,灵活性较差的问题。
[0007] 本发明实施例提供的一种视频推荐方法,包括:
[0008] 在设定的周期内,从各视频源已发布的视频数据库中,筛选出设定数量的视频数 据,作为第一视频数据集;并在用户发生操作行为时,根据所述用户的标识信息,采集所述 用户已观看的视频,从相关视频数据库中,确定出所述用户已观看的视频的相关视频数据, 作为第二视频数据集;
[0009] 分别从所述第一视频数据集和所述第二视频数据集中,选取设定数量的视频数 据,形成所述用户对应的视频推荐列表,并推荐给所述用户。
[0010] 本发明实施例提供的一种视频推荐装置,包括: toon] 第一处理单元,用于在设定的周期内,从各视频源已发布的视频数据库中,筛选出 设定数量的视频数据,作为第一视频数据集;
[0012] 第二处理单元,用于在用户发生操作行为时,根据所述用户的标识信息,采集所述 用户已观看的视频,从相关视频数据库中,确定出所述用户已观看的视频的相关视频数据, 作为第二视频数据集;
[0013] 视频推荐列表确定单元,用于分别从所述第一视频数据集和所述第二视频数据集 中,选取设定数量的视频数据,形成所述用户对应的视频推荐列表,并推荐给所述用户。
[0014] 本发明实施例中,在设定的周期内,从各视频源已发布的视频数据库中,筛选出设 定数量的视频数据,作为第一视频数据集,并在用户发生操作行为时,根据该用户的标识信 息,采集该用户已观看的视频,从相关视频数据库中,分别确定出该用户已观看的视频的相 关视频数据,作为第二视频数据集;分别从第一视频数据集和第二视频数据集中,选取设定 数量的视频数据,形成该用户对应的视频推荐列表,并推荐给该用户。采用本发明实施例提 供的方法得到的视频推荐列表,不仅兼顾了用户的自身喜好,也利用各视频源已发布的视 频数据库中的视频数据,对用户可能喜欢的潜在的视频数据进行了探索,提高了推荐的全 面度、以及灵活性;另外,由于该方法是实时处理的,也提高了推荐的准确度。

【专利附图】

【附图说明】
[0015] 图1为本发明提供的一种视频推荐方法的流程图;
[0016] 图2为本发明提供的形成第一视频数据集的流程图;
[0017] 图3为本发明提供的形成第二视频数据集的流程图;
[0018] 图4为本发明提供的形成第三视频数据集的流程图;
[0019] 图5为本发明提供的形成第四视频数据集的流程图;
[0020] 图6为本发明提供的视频推荐列表的流程图;
[0021] 图7为本发明提供的一种视频推荐装置的示意图;
[0022] 图8为本发明提供的另一种视频推荐装置的示意图。

【具体实施方式】
[0023] 下面结合说明书附图对本发明实施例作进一步详细描述。应当理解,此处所描述 的实施例仅用于说明和解释本发明,并不用于限定本发明。
[0024] 如图1所示,本发明实施例提供的一种视频推荐方法,该方法包括:
[0025] 步骤11、在设定的周期内,从各视频源已发布的视频数据库中,筛选出设定数量的 视频数据,作为第一视频数据集;并在用户发生操作行为时,根据该用户的标识信息,采集 该用户已观看的视频,从相关视频数据库中,确定出该用户已观看的视频的相关视频数据, 作为第二视频数据集。
[0026] 本步骤中,在设定的周期内,从各视频源已发布的视频数据库中,筛选出设定数量 的视频数据,可以采用离线处理的方式。
[0027] 本步骤中,用户发生操作行为至少包括用户观看某个视频数据和用户收藏了某个 视频数据。
[0028] 本步骤中,采集所述用户已观看的视频是指用户进行了操作的视频,该操作包括 观看和收藏等。
[0029] 本步骤中,在设定的周期内,从各视频源已发布的视频数据库中,筛选出设定数量 的视频数据;并在用户发生操作行为时,根据该用户的标识信息,采集该用户已观看的视 频,从相关视频数据库中,确定出该用户已观看的视频的相关视频数据两个处理过程是并 行处理的。
[0030] 步骤12、分别从第一视频数据集和第二视频数据集中,选取设定数量的视频数据, 形成该用户对应的视频推荐列表,并推荐给该用户。
[0031] 本发明实施例中,在设定的周期内,从各视频源已发布的视频数据库中,筛选出设 定数量的视频数据,作为第一视频数据集;并在用户发生操作行为时,根据该用户的标识信 息,采集该用户已观看的视频,从相关视频数据库中,确定出该用户已观看的视频的相关视 频数据,作为第二视频数据集;分别从第一视频数据集和第二视频数据集中,选取设定数量 的视频数据,形成该用户对应的视频推荐列表,并推荐给该用户。采用本发明实施例提供的 方法得到的视频推荐列表,不仅兼顾了用户的自身喜好,也利用各视频源已发布的视频数 据库中的视频数据,对用户可能喜欢的潜在的视频数据进行了探索,提高了推荐的全面度、 以及灵活性;另外,由于该方法是实时处理的,也提高了推荐的准确度,推荐结果也能反映 出用户的兴趣变化。
[0032] 上述步骤11?步骤12给出了形成用户的视频推荐列表的具体方案,并将所形成 的视频推荐列表推荐给该用户,基于本发明实施例提供的方法,可以并行处理多用户的情 况,即多条进程可以并行处理多用户的情况,具体的,实时获取在线用户的行为,当用户有 操作行为(如观看视频、收藏视频等)时,将该用户的标识信息userid(即能够唯一标识 该用户的信息)添加至消息队列(MQ),并行处理时,不同进程根据消息互斥机制,从MQ中获 取用户标识信息,从而保证各进程不会取到同一 uSer_id,各进程执行上述步骤11?步骤 12,以形成该用户的视频推荐列表,并推荐给该用户。
[0033] 本发明实施例应用于视频播放系统中,视频播放系统中聚合了多种类型的视频数 据,还可以通过社交网络,从其他播放系统处获取视频数据。
[0034] 在实施中,步骤11中,在设定的周期内,从各视频源已发布的视频数据库中,筛选 出设定数量的视频数据,作为第一视频数据集,包括:
[0035] 在设定的周期内,从各视频源已发布的视频数据库中,确定出发布时间为设定时 间的视频数据,并对确定出的视频数据进行去重处理;以及
[0036] 从去重处理后得到的视频数据中,筛选出设定数量(如1000条)的视频数据,作 为第一视频数据集。
[0037] 较佳地,设定的周期可以是24小时,即每24小时从各视频源已发布的视频数据库 中,筛选一次视频数据,形成第一视频数据集。
[0038] 较佳地,设定时间可以是4年,即确定出发布时间为近4年的视频数据。
[0039] 较佳地,第一视频数据集的数据格式为{medial,media2,media3. . . },第一视频数 据集中的视频数据是按发布时间排序的,发布时间越近的视频数据在第一视频数据集中的 排序越靠前。
[0040] 较佳地,在设定的周期内,从各视频源已发布的视频数据库中,确定出发布时间为 设定时间且视频类型为设定类型(如电影)的视频数据。
[0041] 较佳地,从去重处理后得到的视频数据中,筛选出设定数量的视频数据之前,还包 括:按照各视频数据的发布时间的先后顺序;
[0042] 相应的,筛选出设定数量的视频数据,包括:按照各视频数据的发布时间,顺序筛 选出设定数量的视频数据,以形成第一视频数据集。这样,第一视频数据集中的视频数据都 是发布时间较近的视频。
[0043] 当然,除了上述优选的筛选方式,也可以采用其他的筛选方式,如随机筛选。本发 明实施例不对第一视频数据集中的各视频数据的筛选方式进行限定。
[0044] 举例说明第一视频数据集的形成过程,如图2所示,从各数据源(如数据源a、b、c 等)中,通过抓取、融合处理,形成数据集I ;筛选设定类型(如电影)且发布时间为近4年 的影片作为随机电影集K,隔时筛选K中最近发布的1000条视频数据,作为第一视频数据集 B〇
[0045] 在实施中,步骤11中,根据用户的标识信息,采集该用户已观看的视频之后,还包 括:对采集到的视频进行去重处理,以及按照该用户的观看时间,对去重处理后得到的视频 进行排序,并顺序选择出设定数量的视频;
[0046] 从相关视频数据库中,确定出该用户已观看的视频的相关视频数据,包括:从相关 视频数据库中,确定出所选择出的视频的相关视频数据。
[0047] 其中,设定数量的视频可以是该用户已观看的所有视频,也可以是该用户已观看 的部分视频。
[0048] 进一步,从相关视频数据库中,确定出该用户已观看的视频的相关视频数据,作为 第二视频数据集,包括:
[0049] 从相关视频数据库中,按照机会均等原则,先依次确定出所选择出的视频的第一 个相关视频数据,再依次确定出所选择出的视频的第二个相关视频数据,直至确定出所选 择出的视频的所有相关视频数据,并将依次确定出的相关视频数据作为第二视频数据集。
[0050] 举例说明,如图3所示,用户已观看的视频(即历史记录)按照该用户的观看时 间排序后的集合为:{medial, meida2, meida3,…;假设选定该用户已观看的m条视频,即 medial, meida2, meida3,…,meidam,贝U从相关视频数据库中,获取到的该m条视频的相关 视频数据为:
[0051] {{medial, [relatll,relatl2, relatl3,…]} {media2,[relat21,relat22, relat2 3, ... ]} {media3,[relat31,relat32, relat33,…]p..},其中,medial, media2, meida3 …为 用户已观看的视频的标识信息,[relatll, relatl2…meidal]为相关视频数据库中所保存 的meidal的相关视频数据集的格式,其他视频数据的相关视频数据集类似;
[0052] 机会均等原则旨在将该用户每个已观看的视频的相关视频都选取到,因此选取顺 序为:
[0053] relatll, relat21, relat31, ".relatl2, relat22, relat32,… ,relatl3, relat23, relat33,…以形成第二视频数据集。
[0054] 较佳地,在从相关视频数据库中,确定出该用户已观看的视频的相关视频数据时, 用户观看时间越新的视频,其相关视频数据的排序越靠前,达到推荐结果对用户最新观看 视频反应敏感的效果。
[0055] 基于上述任一实施例,较佳地,步骤12中,形成用户对应的视频推荐列表之前,该 方法还包括:在用户发生操作行为时,根据该用户的标识信息,判断是否存在该用户对应的 经验预测集合,在确定存在该用户对应的经验预测集合时,从该用户对应的经验预测集合 中,选取出设定数量的视频数据作为第三视频数据集,其中,该经验预测集合是采用用户交 互行为的协同过滤算法预测出的该用户偏好的视频数据;
[0056] 相应的,步骤12中,形成用户对应的视频推荐列表,还包括:从第三视频数据集选 取设定数量的视频数据,并结合从第一视频数据集和第二视频数据集中选取的视频数据, 形成该用户对应的视频推荐列表。
[0057] 具体的,所采用的用户交互行为的协同过滤算法是,将该用户设为目标用户,基于 目标用户的邻居用户的兴趣爱好预测目标用户的兴趣偏好。具体为:先根据目标用户收藏 和/或已观看的视频,寻找与目标用户有相同喜好的邻居用户,然后根据目标用户的邻居 用户的偏好产生向目标用户的推荐,如图4所示。
[0058] 较佳地,第三视频数据集的数据格式为:{{userl :user_idl,medias: {meidall, media12, meidal3}} , {user2:user_id2, medias: {meida21, media22, meida23}}, {user3:user_id3, medias: {meida31,media32, meida33}}, · · · } 〇
[0059] 较佳地,若不存在用户对应的经验预测集合,则从第一冷启动数据集中,选取出设 定数量的视频数据作为第三视频数据集,其中,第一冷启动数据集L为在设定周期获取到 的本视频播放系统中热播视频数据形成的集合,如在每天的凌晨获取当前热播视频数据并 形成第一冷启动数据集,第一冷启动数据集L的数据格式为{medial,media2,media3. . . }。
[0060] 举例说明,形成第三视频数据集的过程如图4所示,在用户发生操作行为时,将该 用户的标识信息(userjd)存储到MQ,实时从MQ中获取发生操作行为的用户的标识信息, 并判断是否有经验预测集合N ;若是,则从N中获取X条(设定数量)视频数据,以形成第 三视频数据集A ;若否,则从第一冷启动数据集L中获取X条视频数据,以形成第三视频数 据集A。
[0061] 基于上述任一实施例,较佳地,步骤12中,形成用户对应的视频推荐列表之前,该 方法还包括:在用户发生操作行为时,判断是否存在热播视频集合;并在确定存在热播视 频集合时,从该热播视频集合中,选取出设定数量的视频数据作为第四视频数据集,其中, 该热播视频集合中包含设定周期内热播的视频数据;
[0062] 相应的,步骤12中,形成用户对应的视频推荐列表,还包括:从第四视频数据集选 取设定数量的视频数据,并结合从第一视频数据集和第二视频数据集中选取的视频数据, 形成该用户对应的视频推荐列表。
[0063] 较佳地,在设定周期内,统计该周期内热播的视频数据,并选择设定数量的热播视 频数据作为热播视频集合。该热播视频集合中的各视频数据可以是同一视频类型的视频数 据,也可以是不同视频类型的视频数据。其中,设定周期可以是一天,也可以是一个周,也可 以是一个月。
[0064] 具体的,在统计设定周期内热播的视频数据时,根据视频数据的播放次数进行统 计,视频数据的播放次数越多,该视频数据的热播程度越高。
[0065] 较佳地,该方法还包括:在设定时间段,对热播视频集合中的视频数据进行更新。 例如,在每天的〇:〇〇时刻开始对热播视频集合中的视频数据进行更新。
[0066] 举例说明,热播视频集合Η的形成过程,如图5所示,从本视频播放系统的各视频 数据源中,通过数据抓取、融合、分离处理,形成每日、每周或每月热播数据库D,随即从数据 库D中筛选出y条类型为"电影"的视频数据,以形成第四视频数据集H。
[0067] 较佳地,若不存在热播视频集合,或者热播视频集合未更新,则从预先配置的第二 冷启动数据集中,选取出设定数量的视频数据作为第四视频数据集,其中,第二冷启动数据 集Μ是在本视频播放系统启动前,通过社交网络,从其他视频播放系统获取的热播视频数 据。
[0068] 基于上述任一实施例,较佳地,步骤12中,形成用户对应的视频推荐列表之前,该 方法还包括:在用户发生操作行为时,根据该用户的标识信息,判断是否存在该用户对应 的经验预测集合,在确定存在该用户对应的经验预测集合时,从该用户对应的经验预测集 合中,选取出设定数量的视频数据作为第三视频数据集,其中,该经验预测集合是采用用户 交互行为的协同过滤算法预测出的所述用户偏好的视频数据;并判断是否存在热播视频集 合,在确定存在热播视频集合时,从该热播视频集合中,选取出设定数量的视频数据作为第 四视频数据集,其中,该热播视频集合中包含设定周期内热播的视频数据;
[0069] 相应的,步骤12中,形成用户对应的视频推荐列表,还包括:分别从第三视频数据 集和第四视频数据集选取设定数量的视频数据,并结合从第一视频数据集和第二视频数据 集中选取的视频数据,形成该用户对应的视频推荐列表。
[0070] 基于上述任一实施例,较佳地,步骤12中,形成用户对应的视频推荐列表,包括:
[0071] 对选取出的视频数据进行去重处理,并将去重处理后得到的视频数据与该用户已 观看的视频进行互斥处理,以从去重处理后得到的视频数据中,去除该用户已观看的视频; 以及
[0072] 根据视频数据的类型信息,对互斥处理后得到的视频数据,进行聚簇处理,并按照 从密集到稀疏的顺序排列。
[0073] 进一步,若互斥处理后得到的视频数据的数量小于去重处理前选取出的视频数据 的数量,根据视频数据的类型信息,对互斥处理后得到的视频数据,进行聚簇处理之前,还 包括:
[0074] 从各视频源已发布的视频数据库中,选择视频数据补充到互斥处理后得到的视频 数据中,以使补充后的视频数据的数量达到去重处理前选取出的视频数据的数量,以进一 步对用户可能喜欢的潜在的视频数据进行了探索,提高推荐的全面度、以及灵活性。
[0075] 以分别从第一视频数据集Α、第二视频数据集Β、第三视频数据集C和第四视频数 据集Η中选取设定数量的视频数据,形成该用户对应的视频推荐列表为例进行说明。具体 处理过程为:先根据user_id和当前时间,获取动态数目配置项ma、ra、re、po,分别从Α、Β、 C、H中,选取对应数量的视频数据,形成集合Τ ;然后,对集合Τ中的视频数据进行去重处理, 并利用该用户已观看的视频数据形成的集合I与集合T做互斥处理,即从集合T中去除该 用户已观看的视频,其中,若处理后集合T中的视频数据的数据量少于本视频播放系统要 求的每页能够显示的推荐视频的数量,则从B中选取相应数量的视频数据进行补齐和兴趣 探索;接着,对每页所要显示的集合T中的视频数据,按照视频tag (类型)聚簇,并从密集 到稀疏依次排列,得到集合R ;最后,对集合R中的视频数据进行去重处理,并利用该用户已 观看的视频数据形成的集合I与集合R做互斥操作,最终形成本视频播放系统每页的视频 推荐列表,如图6所示。
[0076] 需要说明的是,每个视频会对应有自己的tag属性,比如爱情,动作,惊悚等。聚 簇处理的过程如下:对于每页视频数据medias : [medial, meida2, media3,...]中的每个 meida的tag进行统计,统计每个tag(标签)出现的次数,假设统计结果如下:"爱情" :7 次,"动作":3次,"惊悚":1次,这样tag被分为三簇。然后将视频数据按照tag簇的稀疏程 度从密到稀排列,即先排含有"爱情" tag的视频数据,然后是含有"动作" tag的视频数据, 最后是含有"惊悚" tag的视频数据,以达到tag密集的视频数据放到本视频播放系统的视 频推荐列表的焦点位置进行显示的效果。
[0077] 上述方法处理流程可以用软件程序实现,该软件程序可以存储在存储介质中,当 存储的软件程序被调用时,执行上述方法步骤。
[0078] 基于同一发明构思,本发明实施例还提供了一种视频推荐装置,如图7所示,该装 置包括:
[0079] 第一处理单元71,用于在设定的周期内,从各视频源已发布的视频数据库中,筛选 出设定数量的视频数据,作为第一视频数据集;
[0080] 第二处理单元72,用于在用户发生操作行为时,根据所述用户的标识信息,采集所 述用户已观看的视频息,从相关视频数据库中,确定出所述用户已观看的视频的相关视频 数据,作为第二视频数据集;
[0081] 视频推荐列表确定单元73,用于分别从所述第一视频数据集和所述第二视频数据 集中,选取设定数量的视频数据,形成所述用户对应的视频推荐列表,并推荐给所述用户。
[0082] 在实施中,第一处理单元71具体用于:
[0083] 在设定的周期内,从各视频源已发布的视频数据库中,确定出发布时间为设定时 间的视频数据,并对确定出的视频数据进行去重处理;以及从去重处理后得到的视频数据 中,筛选出设定数量的视频数据,作为所述第一视频数据集。
[0084] 在实施中,第二处理单元72根据所述用户的标识信息,采集所述用户已观看的视 频之后,还用于:
[0085] 对采集到的视频进行去重处理;以及按照所述用户的观看时间,对去重处理后得 到的视频进行排序,并顺序选择出设定数量的视频;
[0086] 第二处理单元72从相关视频数据库中,确定出所述用户已观看的视频的相关视 频数据,包括:从相关视频数据库中,确定出所选择出的视频的相关视频数据。
[0087] 进一步,第二处理单元72从相关视频数据库中,分别确定出所述用户已观看的视 频的相关视频数据,作为第二视频数据集,包括:
[0088] 从相关视频数据库中,按照机会均等原则,先依次确定出所选择出的视频的第一 个相关视频数据,再依次确定出所选择出的视频的第二个相关视频数据,直至确定出所选 择出的视频的所有相关视频数据,并将依次确定出的相关视频数据作为第二视频数据集。
[0089] 作为一种优选的实现方式,较佳地,该装置还包括:
[0090] 第三处理单元74,用于在用户发生操作行为时,根据所述用户的标识信息,判断是 否存在所述用户对应的经验预测集合;并在确定存在所述用户对应的经验预测集合时,从 所述用户对应的经验预测集合中,选取出设定数量的视频数据作为第三视频数据集,其中, 所述经验预测集合是采用用户交互行为的协同过滤算法预测出的所述用户偏好的视频数 据;
[0091] 视频推荐列表确定单元73具体用于:从所述第三视频数据集选取设定数量的视 频数据,并结合从所述第一视频数据集和所述第二视频数据集中选取的视频数据,形成所 述用户对应的视频推荐列表。
[0092] 作为另一种优选的实现方式,较佳地,该装置还包括:
[0093] 第四处理单元75,用于在用户发生操作行为时,判断是否存在热播视频集合;并 在确定存在所述热播视频集合时,从所述热播视频集合中,选取出设定数量的视频数据作 为第四视频数据集,其中,所述热播视频集合中包含设定时间段内热播的视频数据;
[0094] 视频推荐列表确定单元73具体用于:从所述第四视频数据集选取设定数量的视 频数据,并结合从所述第一视频数据集和所述第二视频数据集中选取的视频数据,形成所 述用户对应的视频推荐列表。
[0095] 作为再一种优选的实现方式,较佳地,该装置还包括:
[0096] 第三处理单元74,用于在用户发生操作行为时,根据所述用户的标识信息,判断 是否存在所述用户对应的经验预测集合,在确定存在所述用户对应的经验预测集合时,从 所述用户对应的经验预测集合中,选取出设定数量的视频数据作为第三视频数据集,其中, 所述经验预测集合是采用用户交互行为的协同过滤算法预测出的所述用户偏好的视频数 据;
[0097] 第四处理单元75,用于在用户发生操作行为时,判断是否存在热播视频集合,在确 定存在所述热播视频集合时,从所述热播视频集合中,选取出设定数量的视频数据作为第 四视频数据集,其中,所述热播视频集合中包含设定时间段内热播的视频数据;
[0098] 视频推荐列表确定单元73具体用于:分别从所述第三视频数据集和所述第四视 频数据集选取设定数量的视频数据,并结合从所述第一视频数据集和所述第二视频数据集 中选取的视频数据,形成所述用户对应的视频推荐列表。
[0099] 基于上述任一实施例,较佳地,视频推荐列表确定单兀73具体用于:
[0100] 对选取出的视频数据进行去重处理,并将去重处理后得到的视频数据与所述用户 已观看的视频进行互斥处理,以从去重处理后得到的视频数据中,去除所述用户已观看的 视频;以及根据视频数据的类型信息,对互斥处理后得到的视频数据,进行聚簇处理,并按 照从密集到稀疏的顺序排列,以形成所述视频推荐列表。
[0101] 较佳地,若互斥处理后得到的视频数据的数量小于去重处理前选取出的视频数据 的数量,所述视频推荐列表确定单元73根据视频数据的类型信息,对互斥处理后得到的视 频数据,进行聚簇处理之前,还用于:
[0102] 从各视频源已发布的视频数据库中,选择视频数据补充到互斥处理后得到的视频 数据中,以使补充后的视频数据的数量达到去重处理前选取出的视频数据的数量。
[0103] 本发明实施例提供的视频推荐装置应用于视频播放系统,该视频播放系统包含多 个并行处理的视频推荐装置,可以并行处理多用户的情况。下面结合一个具体实施例,对本 发明实施例提供的视频推荐装置进行说明。
[0104] 如图8所示,该装置包括离线测试区和在线测试区,其中,离线预测区包括行为预 测器(即第三处理单元)和随机预测器(即第一处理单元),在线预测区包括相关预测器 (即第二处理单元)和热播预测器(即第四处理单元)。当用户发生操作行为时,将该用户 的标识信息(userjd)加入到消息队列(MQ)中,根据消息互斥机制从消息队列中获取已发 生操作行为的用户的标识信息,并将该标识信息分别输入至行为预测器、随机预测器、相关 预测器、以及热播预测器。
[0105] 进一步,行为预测器输出第三数据集A,随机预测器输出第一数据集B、相关预测 器输出第二数据集C、以及热播预测器输出第四数据集H。
[0106] 进一步,该装置根据分页显示要求和当前时间因素,对A、B、C、H进行融合调配,轮 询选取A、B、C、H中的视频数据组成视频集合T ;对T进行去重处理,并与该用户已观看的视 频进行互斥处理,对处理后的数据进行个数补全处理,得到每页推荐给用户的视频推荐集; 进一步,该装置对每页的视频推荐集按照视频tag特征进行聚簇,并按照从密集到稀疏的 顺序进行排列,得到每页推荐给用户的视频推荐表R,并保存R。
[0107] 本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序 产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实 施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机 可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产 品的形式。
[0108] 本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程 图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一 流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算 机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理 器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生 用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能 的装置。
[0109] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特 定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指 令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或 多个方框中指定的功能。
[0110] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计 算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或 其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图 一个方框或多个方框中指定的功能的步骤。
[0111] 尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造 性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优 选实施例以及落入本发明范围的所有变更和修改。
[0112] 显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精 神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围 之内,则本发明也意图包含这些改动和变型在内。
【权利要求】
1. 一种视频推荐方法,其特征在于,该方法包括: 在设定的周期内,从各视频源已发布的视频数据库中,筛选出设定数量的视频数据,作 为第一视频数据集;并在用户发生操作行为时,根据所述用户的标识信息,采集所述用户已 观看的视频,从相关视频数据库中,确定出所述用户已观看的视频的相关视频数据,作为第 二视频数据集; 分别从所述第一视频数据集和所述第二视频数据集中,选取设定数量的视频数据,形 成所述用户对应的视频推荐列表,并推荐给所述用户。
2. 如权利要求1所述的方法,其特征在于,在设定的周期内,从各视频源已发布的视频 数据库中,筛选出设定数量的视频数据,作为第一视频数据集,包括: 在设定的周期内,从各视频源已发布的视频数据库中,确定出发布时间为设定时间的 视频数据,并对确定出的视频数据进行去重处理;以及 从去重处理后得到的视频数据中,筛选出设定数量的视频数据,作为所述第一视频数 据集。
3. 如权利要求1所述的方法,其特征在于,根据所述用户的标识信息,采集所述用户已 观看的视频之后,还包括:对采集到的视频进行去重处理,以及按照所述用户的观看时间, 对去重处理后得到的视频进行排序,并顺序选择出设定数量的视频; 从相关视频数据库中,确定出所述用户已观看的视频的相关视频数据,包括:从相关视 频数据库中,确定出所选择出的视频的相关视频数据。
4. 如权利要求3所述的方法,其特征在于,从相关视频数据库中,确定出所述用户已观 看的视频的相关视频数据,作为第二视频数据集,包括: 从相关视频数据库中,按照机会均等原则,先依次确定出所选择出的视频的第一个相 关视频数据,再依次确定出所选择出的视频的第二个相关视频数据,直至确定出所选择出 的视频的所有相关视频数据,并将依次确定出的相关视频数据作为第二视频数据集。
5. 如权利要求1所述的方法,其特征在于,形成所述用户对应的视频推荐列表之前,该 方法还包括:在用户发生操作行为时,根据所述用户的标识信息,判断是否存在所述用户对 应的经验预测集合;并在确定存在所述用户对应的经验预测集合时,从所述用户对应的经 验预测集合中,选取出设定数量的视频数据作为第三视频数据集,其中,所述经验预测集合 是采用用户交互行为的协同过滤算法预测出的所述用户偏好的视频数据; 形成所述用户对应的视频推荐列表,还包括:从所述第三视频数据集选取设定数量的 视频数据,并结合从所述第一视频数据集和所述第二视频数据集中选取的视频数据,形成 所述用户对应的视频推荐列表。
6. 如权利要求1所述的方法,其特征在于,形成所述用户对应的视频推荐列表之前,该 方法还包括:在用户发生操作行为时,判断是否存在热播视频集合;并在确定存在所述热 播视频集合时,从所述热播视频集合中,选取出设定数量的视频数据作为第四视频数据集, 其中,所述热播视频集合中包含设定时间段内热播的视频数据; 形成所述用户对应的视频推荐列表,还包括:从所述第四视频数据集选取设定数量的 视频数据,并结合从所述第一视频数据集和所述第二视频数据集中选取的视频数据,形成 所述用户对应的视频推荐列表。
7. 如权利要求1所述的方法,其特征在于,形成所述用户对应的视频推荐列表之前,该 方法还包括:在用户发生操作行为时,根据所述用户的标识信息,判断是否存在所述用户对 应的经验预测集合,在确定存在所述用户对应的经验预测集合时,从所述用户对应的经验 预测集合中,选取出设定数量的视频数据作为第三视频数据集,其中,所述经验预测集合是 采用用户交互行为的协同过滤算法预测出的所述用户偏好的视频数据;并判断是否存在热 播视频集合,在确定存在所述热播视频集合时,从所述热播视频集合中,选取出设定数量的 视频数据作为第四视频数据集,其中,所述热播视频集合中包含设定时间段内热播的视频 数据; 形成所述用户对应的视频推荐列表,还包括:分别从所述第三视频数据集和所述第四 视频数据集选取设定数量的视频数据,并结合从所述第一视频数据集和所述第二视频数据 集中选取的视频数据,形成所述用户对应的视频推荐列表。
8. 如权利要求1?7任一项所述的方法,其特征在于,形成所述用户对应的视频推荐列 表,包括: 对选取出的视频数据进行去重处理,并将去重处理后得到的视频数据与所述用户已 观看的视频进行互斥处理,以从去重处理后得到的视频数据中,去除所述用户已观看的视 频; 根据视频数据的类型信息,对互斥处理后得到的视频数据,进行聚簇处理,并按照从密 集到稀疏的顺序排列,以形成所述视频推荐列表。
9. 如权利要求8所述的方法,其特征在于,若互斥处理后得到的视频数据的数量小于 去重处理前选取出的视频数据的数量,根据视频数据的类型信息,对互斥处理后得到的视 频数据,进行聚簇处理之前,还包括: 从各视频源已发布的视频数据库中,选择视频数据补充到互斥处理后得到的视频数据 中,以使补充后的视频数据的数量达到去重处理前选取出的视频数据的数量。
10. -种视频推荐装置,其特征在于,该装置包括: 第一处理单元,用于在设定的周期内,从各视频源已发布的视频数据库中,筛选出设定 数量的视频数据,作为第一视频数据集; 第二处理单元,用于在用户发生操作行为时,根据所述用户的标识信息,采集所述用户 已观看的视频,从相关视频数据库中,确定出所述用户已观看的视频的相关视频数据,作为 第二视频数据集; 视频推荐列表确定单元,用于分别从所述第一视频数据集和所述第二视频数据集中, 选取设定数量的视频数据,形成所述用户对应的视频推荐列表,并推荐给所述用户。
11. 如权利要求10所述的装置,其特征在于,所述第二处理单元根据所述用户的标 识信息,采集所述用户已观看的视频之后,还用于:对采集到的视频进行去重处理,以及按 照所述用户的观看时间,对去重处理后得到的视频进行排序,并顺序选择出设定数量的视 频; 所述第二处理单元从相关视频数据库中,确定出所述用户已观看的视频的相关视频数 据,作为第二视频数据集,包括:从相关视频数据库中,按照机会均等原则,先依次确定出所 选择出的视频的第一个相关视频数据,再依次确定出所选择出的视频的第二个相关视频数 据,直至确定出所选择出的视频的所有相关视频数据,并将依次确定出的相关视频数据作 为第二视频数据集。
12. 如权利要求10所述的装置,其特征在于,该装置还包括: 第三处理单元,用于在用户发生操作行为时,根据所述用户的标识信息,判断是否存在 所述用户对应的经验预测集合;并在确定存在所述用户对应的经验预测集合时,从所述用 户对应的经验预测集合中,选取出设定数量的视频数据作为第三视频数据集,其中,所述经 验预测集合是采用用户交互行为的协同过滤算法预测出的所述用户偏好的视频数据; 所述视频推荐列表确定单元具体用于:从所述第三视频数据集选取设定数量的视频数 据,并结合从所述第一视频数据集和所述第二视频数据集中选取的视频数据,形成所述用 户对应的视频推荐列表。
13. 如权利要求10所述的装置,其特征在于,该装置还包括: 第四处理单元,用于在用户发生操作行为时,判断是否存在热播视频集合;并在确定存 在所述热播视频集合时,从所述热播视频集合中,选取出设定数量的视频数据作为第四视 频数据集,其中,所述热播视频集合中包含设定时间段内热播的视频数据; 所述视频推荐列表确定单元具体用于:从所述第四视频数据集选取设定数量的视频数 据,并结合从所述第一视频数据集和所述第二视频数据集中选取的视频数据,形成所述用 户对应的视频推荐列表。
14. 如权利要求10所述的装置,其特征在于,该装置还包括: 第三处理单元,用于在用户发生操作行为时,根据所述用户的标识信息,判断是否存在 所述用户对应的经验预测集合,在确定存在所述用户对应的经验预测集合时,从所述用户 对应的经验预测集合中,选取出设定数量的视频数据作为第三视频数据集,其中,所述经验 预测集合是采用用户交互行为的协同过滤算法预测出的所述用户偏好的视频数据; 第四处理单元,用于在用户发生操作行为时,判断是否存在热播视频集合,在确定存在 所述热播视频集合时,从所述热播视频集合中,选取出设定数量的视频数据作为第四视频 数据集,其中,所述热播视频集合中包含设定时间段内热播的视频数据; 所述视频推荐列表确定单元具体用于:分别从所述第三视频数据集和所述第四视频数 据集选取设定数量的视频数据,并结合从所述第一视频数据集和所述第二视频数据集中选 取的视频数据,形成所述用户对应的视频推荐列表。
15. 如权利要求10?14任一项所述的装置,其特征在于,所述视频推荐列表确定单元 具体用于: 对选取出的视频数据进行去重处理,并将去重处理后得到的视频数据与所述用户已观 看的视频进行互斥处理,以从去重处理后得到的视频数据中,去除所述用户已观看的视频; 以及根据视频数据的类型信息,对互斥处理后得到的视频数据,进行聚簇处理,并按照从密 集到稀疏的顺序排列,以形成所述视频推荐列表。
【文档编号】H04N21/266GK104065981SQ201410281599
【公开日】2014年9月24日 申请日期:2014年6月20日 优先权日:2014年6月20日
【发明者】胡伟凤, 高雪松, 周翚, 许丽星, 谢杰, 王洁, 于旭, 张帅 申请人:海信集团有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1