一种视频推荐方法和装置制造方法

文档序号：7806765阅读：114来源：国知局

一种视频推荐方法和装置制造方法
【专利摘要】本发明公开了一种视频推荐方法和装置，用于解决推荐方法中存在的推荐的准确度和全面度均偏低、灵活性较差的问题。方法包括：在设定的周期内，从各视频源已发布的视频数据库中，筛选出设定数量的视频数据，作为第一视频数据集；并在用户发生操作行为时，根据该用户的标识信息，采集该用户已观看的视频，从相关视频数据库中，确定出该用户已观看的视频的相关视频数据，作为第二视频数据集；分别从第一视频数据集和第二视频数据集中，选取设定数量的视频数据，形成该用户对应的视频推荐列表，并推荐给该用户，从而提高了推荐的全面度、以及灵活性，由于该方法是实时处理的，也提高了推荐的准确度。
【专利说明】一种视频推荐方法和装置

【技术领域】
[0001] 本发明涉及信息【技术领域】，特别涉及一种视频推荐方法和装置。

【背景技术】
[0002] 随着信息技术的迅猛发展，网络数据呈现爆炸式增长，网络用户的日常生活也得到了极大的丰富。但是面对纷繁复杂的网络数据，用户难以快速定位自己喜欢的内容，为了解决上述问题，随之出现了在线视频推荐。
[0003] 在线视频推荐是视频网站帮助用户查找，以使用户能够观看某种特定领域视频的方法和工具。相对于传统的视频目录浏览方式或者视频搜索方式，视频推荐能够在用户不确定合适的搜索词的情况下，通过分析用户行为，得到用户需求的特定视频领域，并在该视频领域内进行推荐，避免了搜索词的输入和层次目录的多次点击过程，使得查找并观看某种特定类型的视频更加简单容易。
[0004] 当前已有的视频推荐方法主要有两种。一种是用户主动选择喜欢的视频类别，然后系统根据用户选择来推荐相同类别的视频；另一种则是根据用户的历史观看记录，推荐与用户观看过的视频相同类别的其他视频。这两种方法都侧重于利用用户的观看信息来进行视频推荐，其推荐结果过度集中于用户观看过的某一种类的视频数据（如电影），对于喜好比较单一的用户，其推荐结果较好。但是随着互联网视频网站的发展和用户上网观看视频的行为增多，用户对观看视频类型和特征的需求更为多样化，现有的视频推荐方法，无法反映用户的真实兴趣，推荐的准确度和全面度均偏低，更无法预测用户可能喜欢的潜在的视频类别，灵活性较差。
[0005] 综上所述，由于现有的视频推荐方法都是基于用户的观看信息进行分析，得到的推荐结果过度集中于用户观看过的某一种类的视频数据，无法反映用户的兴趣变化，推荐的准确度和全面度均偏低，更无法预测用户可能喜欢的潜在的视频类别，灵活性较差。

【发明内容】

[0006] 本发明实施例提供了一种视频推荐方法和装置，用于解决现有视频推荐方法存在的无法反映用户的兴趣变化，推荐的准确度和全面度均偏低，无法预测用户可能喜欢的潜在的视频类别，灵活性较差的问题。
[0007] 本发明实施例提供的一种视频推荐方法，包括：
[0008] 在设定的周期内，从各视频源已发布的视频数据库中，筛选出设定数量的视频数据，作为第一视频数据集；并在用户发生操作行为时，根据所述用户的标识信息，采集所述用户已观看的视频，从相关视频数据库中，确定出所述用户已观看的视频的相关视频数据，作为第二视频数据集；
[0009] 分别从所述第一视频数据集和所述第二视频数据集中，选取设定数量的视频数据，形成所述用户对应的视频推荐列表，并推荐给所述用户。
[0010] 本发明实施例提供的一种视频推荐装置，包括： toon] 第一处理单元，用于在设定的周期内，从各视频源已发布的视频数据库中，筛选出设定数量的视频数据，作为第一视频数据集；
[0012] 第二处理单元，用于在用户发生操作行为时，根据所述用户的标识信息，采集所述用户已观看的视频，从相关视频数据库中，确定出所述用户已观看的视频的相关视频数据，作为第二视频数据集；
[0013] 视频推荐列表确定单元，用于分别从所述第一视频数据集和所述第二视频数据集中，选取设定数量的视频数据，形成所述用户对应的视频推荐列表，并推荐给所述用户。
[0014] 本发明实施例中，在设定的周期内，从各视频源已发布的视频数据库中，筛选出设定数量的视频数据，作为第一视频数据集，并在用户发生操作行为时，根据该用户的标识信息，采集该用户已观看的视频，从相关视频数据库中，分别确定出该用户已观看的视频的相关视频数据，作为第二视频数据集；分别从第一视频数据集和第二视频数据集中，选取设定数量的视频数据，形成该用户对应的视频推荐列表，并推荐给该用户。采用本发明实施例提供的方法得到的视频推荐列表，不仅兼顾了用户的自身喜好，也利用各视频源已发布的视频数据库中的视频数据，对用户可能喜欢的潜在的视频数据进行了探索，提高了推荐的全面度、以及灵活性；另外，由于该方法是实时处理的，也提高了推荐的准确度。

【专利附图】

【附图说明】
[0015] 图1为本发明提供的一种视频推荐方法的流程图；
[0016] 图2为本发明提供的形成第一视频数据集的流程图；
[0017] 图3为本发明提供的形成第二视频数据集的流程图；
[0018] 图4为本发明提供的形成第三视频数据集的流程图；
[0019] 图5为本发明提供的形成第四视频数据集的流程图；
[0020] 图6为本发明提供的视频推荐列表的流程图；
[0021] 图7为本发明提供的一种视频推荐装置的示意图；
[0022] 图8为本发明提供的另一种视频推荐装置的示意图。

【具体实施方式】
[0023] 下面结合说明书附图对本发明实施例作进一步详细描述。应当理解，此处所描述的实施例仅用于说明和解释本发明，并不用于限定本发明。
[0024] 如图1所示，本发明实施例提供的一种视频推荐方法，该方法包括：
[0025] 步骤11、在设定的周期内，从各视频源已发布的视频数据库中，筛选出设定数量的视频数据，作为第一视频数据集；并在用户发生操作行为时，根据该用户的标识信息，采集该用户已观看的视频，从相关视频数据库中，确定出该用户已观看的视频的相关视频数据，作为第二视频数据集。
[0026] 本步骤中，在设定的周期内，从各视频源已发布的视频数据库中，筛选出设定数量的视频数据，可以采用离线处理的方式。
[0027] 本步骤中，用户发生操作行为至少包括用户观看某个视频数据和用户收藏了某个视频数据。
[0028] 本步骤中，采集所述用户已观看的视频是指用户进行了操作的视频，该操作包括观看和收藏等。
[0029] 本步骤中，在设定的周期内，从各视频源已发布的视频数据库中，筛选出设定数量的视频数据；并在用户发生操作行为时，根据该用户的标识信息，采集该用户已观看的视频，从相关视频数据库中，确定出该用户已观看的视频的相关视频数据两个处理过程是并行处理的。
[0030] 步骤12、分别从第一视频数据集和第二视频数据集中，选取设定数量的视频数据，形成该用户对应的视频推荐列表，并推荐给该用户。
[0031] 本发明实施例中，在设定的周期内，从各视频源已发布的视频数据库中，筛选出设定数量的视频数据，作为第一视频数据集；并在用户发生操作行为时，根据该用户的标识信息，采集该用户已观看的视频，从相关视频数据库中，确定出该用户已观看的视频的相关视频数据，作为第二视频数据集；分别从第一视频数据集和第二视频数据集中，选取设定数量的视频数据，形成该用户对应的视频推荐列表，并推荐给该用户。采用本发明实施例提供的方法得到的视频推荐列表，不仅兼顾了用户的自身喜好，也利用各视频源已发布的视频数据库中的视频数据，对用户可能喜欢的潜在的视频数据进行了探索，提高了推荐的全面度、以及灵活性；另外，由于该方法是实时处理的，也提高了推荐的准确度，推荐结果也能反映出用户的兴趣变化。
[0032] 上述步骤11?步骤12给出了形成用户的视频推荐列表的具体方案，并将所形成的视频推荐列表推荐给该用户，基于本发明实施例提供的方法，可以并行处理多用户的情况，即多条进程可以并行处理多用户的情况，具体的，实时获取在线用户的行为，当用户有操作行为（如观看视频、收藏视频等）时，将该用户的标识信息userid(即能够唯一标识该用户的信息）添加至消息队列（MQ)，并行处理时，不同进程根据消息互斥机制，从MQ中获取用户标识信息，从而保证各进程不会取到同一 uSer_id，各进程执行上述步骤11?步骤 12,以形成该用户的视频推荐列表，并推荐给该用户。
[0033] 本发明实施例应用于视频播放系统中，视频播放系统中聚合了多种类型的视频数据，还可以通过社交网络，从其他播放系统处获取视频数据。
[0034] 在实施中，步骤11中，在设定的周期内，从各视频源已发布的视频数据库中，筛选出设定数量的视频数据，作为第一视频数据集，包括：
[0035] 在设定的周期内，从各视频源已发布的视频数据库中，确定出发布时间为设定时间的视频数据，并对确定出的视频数据进行去重处理；以及
[0036] 从去重处理后得到的视频数据中，筛选出设定数量（如1000条）的视频数据，作为第一视频数据集。
[0037] 较佳地，设定的周期可以是24小时，即每24小时从各视频源已发布的视频数据库中，筛选一次视频数据，形成第一视频数据集。
[0038] 较佳地，设定时间可以是4年，即确定出发布时间为近4年的视频数据。
[0039] 较佳地，第一视频数据集的数据格式为{medial，media2，media3. . . }，第一视频数据集中的视频数据是按发布时间排序的，发布时间越近的视频数据在第一视频数据集中的排序越靠前。
[0040] 较佳地，在设定的周期内，从各视频源已发布的视频数据库中，确定出发布时间为设定时间且视频类型为设定类型（如电影）的视频数据。
[0041] 较佳地，从去重处理后得到的视频数据中，筛选出设定数量的视频数据之前，还包括：按照各视频数据的发布时间的先后顺序；
[0042] 相应的，筛选出设定数量的视频数据，包括：按照各视频数据的发布时间，顺序筛选出设定数量的视频数据，以形成第一视频数据集。这样，第一视频数据集中的视频数据都是发布时间较近的视频。
[0043] 当然，除了上述优选的筛选方式，也可以采用其他的筛选方式，如随机筛选。本发明实施例不对第一视频数据集中的各视频数据的筛选方式进行限定。
[0044] 举例说明第一视频数据集的形成过程，如图2所示，从各数据源（如数据源a、b、c 等）中，通过抓取、融合处理，形成数据集I ;筛选设定类型（如电影）且发布时间为近4年的影片作为随机电影集K，隔时筛选K中最近发布的1000条视频数据，作为第一视频数据集 B〇
[0045] 在实施中，步骤11中，根据用户的标识信息，采集该用户已观看的视频之后，还包括：对采集到的视频进行去重处理，以及按照该用户的观看时间，对去重处理后得到的视频进行排序，并顺序选择出设定数量的视频；
[0046] 从相关视频数据库中，确定出该用户已观看的视频的相关视频数据，包括：从相关视频数据库中，确定出所选择出的视频的相关视频数据。
[0047] 其中，设定数量的视频可以是该用户已观看的所有视频，也可以是该用户已观看的部分视频。
[0048] 进一步，从相关视频数据库中，确定出该用户已观看的视频的相关视频数据，作为第二视频数据集，包括：
[0049] 从相关视频数据库中，按照机会均等原则，先依次确定出所选择出的视频的第一个相关视频数据，再依次确定出所选择出的视频的第二个相关视频数据，直至确定出所选择出的视频的所有相关视频数据，并将依次确定出的相关视频数据作为第二视频数据集。
[0050] 举例说明，如图3所示，用户已观看的视频（即历史记录）按照该用户的观看时间排序后的集合为：{medial, meida2, meida3,…;假设选定该用户已观看的m条视频，即 medial, meida2, meida3,…，meidam，贝U从相关视频数据库中，获取到的该m条视频的相关视频数据为：
[0051] {{medial, [relatll，relatl2, relatl3,…]} {media2，[relat21，relat22, relat2 3, ... ]} {media3，[relat31，relat32, relat33,…]p..}，其中，medial, media2, meida3 …为用户已观看的视频的标识信息，[relatll, relatl2…meidal]为相关视频数据库中所保存的meidal的相关视频数据集的格式，其他视频数据的相关视频数据集类似；
[0052] 机会均等原则旨在将该用户每个已观看的视频的相关视频都选取到，因此选取顺序为：
[0053] relatll, relat21, relat31, ".relatl2, relat22, relat32,… ,relatl3, relat23, relat33,…以形成第二视频数据集。
[0054] 较佳地，在从相关视频数据库中，确定出该用户已观看的视频的相关视频数据时，用户观看时间越新的视频，其相关视频数据的排序越靠前，达到推荐结果对用户最新观看视频反应敏感的效果。
[0055] 基于上述任一实施例，较佳地，步骤12中，形成用户对应的视频推荐列表之前，该方法还包括：在用户发生操作行为时，根据该用户的标识信息，判断是否存在该用户对应的经验预测集合，在确定存在该用户对应的经验预测集合时，从该用户对应的经验预测集合中，选取出设定数量的视频数据作为第三视频数据集，其中，该经验预测集合是采用用户交互行为的协同过滤算法预测出的该用户偏好的视频数据；
[0056] 相应的，步骤12中，形成用户对应的视频推荐列表，还包括：从第三视频数据集选取设定数量的视频数据，并结合从第一视频数据集和第二视频数据集中选取的视频数据，形成该用户对应的视频推荐列表。
[0057] 具体的，所采用的用户交互行为的协同过滤算法是，将该用户设为目标用户，基于目标用户的邻居用户的兴趣爱好预测目标用户的兴趣偏好。具体为：先根据目标用户收藏和/或已观看的视频，寻找与目标用户有相同喜好的邻居用户，然后根据目标用户的邻居用户的偏好产生向目标用户的推荐，如图4所示。
[0058] 较佳地，第三视频数据集的数据格式为：{{userl :user_idl，medias: {meidall, media12, meidal3}} , {user2:user_id2, medias: {meida21, media22, meida23}}, {user3:user_id3, medias: {meida31，media32, meida33}}, · · · } 〇
[0059] 较佳地，若不存在用户对应的经验预测集合，则从第一冷启动数据集中，选取出设定数量的视频数据作为第三视频数据集，其中，第一冷启动数据集L为在设定周期获取到的本视频播放系统中热播视频数据形成的集合，如在每天的凌晨获取当前热播视频数据并形成第一冷启动数据集，第一冷启动数据集L的数据格式为{medial，media2，media3. . . }。
[0060] 举例说明，形成第三视频数据集的过程如图4所示，在用户发生操作行为时，将该用户的标识信息（userjd)存储到MQ，实时从MQ中获取发生操作行为的用户的标识信息，并判断是否有经验预测集合N ;若是，则从N中获取X条（设定数量）视频数据，以形成第三视频数据集A ;若否，则从第一冷启动数据集L中获取X条视频数据，以形成第三视频数据集A。
[0061] 基于上述任一实施例，较佳地，步骤12中，形成用户对应的视频推荐列表之前，该方法还包括：在用户发生操作行为时，判断是否存在热播视频集合；并在确定存在热播视频集合时，从该热播视频集合中，选取出设定数量的视频数据作为第四视频数据集，其中，该热播视频集合中包含设定周期内热播的视频数据；
[0062] 相应的，步骤12中，形成用户对应的视频推荐列表，还包括：从第四视频数据集选取设定数量的视频数据，并结合从第一视频数据集和第二视频数据集中选取的视频数据，形成该用户对应的视频推荐列表。
[0063] 较佳地，在设定周期内，统计该周期内热播的视频数据，并选择设定数量的热播视频数据作为热播视频集合。该热播视频集合中的各视频数据可以是同一视频类型的视频数据，也可以是不同视频类型的视频数据。其中，设定周期可以是一天，也可以是一个周，也可以是一个月。
[0064] 具体的，在统计设定周期内热播的视频数据时，根据视频数据的播放次数进行统计，视频数据的播放次数越多，该视频数据的热播程度越高。
[0065] 较佳地，该方法还包括：在设定时间段，对热播视频集合中的视频数据进行更新。例如，在每天的〇:〇〇时刻开始对热播视频集合中的视频数据进行更新。
[0066] 举例说明，热播视频集合Η的形成过程，如图5所示，从本视频播放系统的各视频数据源中，通过数据抓取、融合、分离处理，形成每日、每周或每月热播数据库D，随即从数据库D中筛选出y条类型为"电影"的视频数据，以形成第四视频数据集H。
[0067] 较佳地，若不存在热播视频集合，或者热播视频集合未更新，则从预先配置的第二冷启动数据集中，选取出设定数量的视频数据作为第四视频数据集，其中，第二冷启动数据集Μ是在本视频播放系统启动前，通过社交网络，从其他视频播放系统获取的热播视频数据。
[0068] 基于上述任一实施例，较佳地，步骤12中，形成用户对应的视频推荐列表之前，该方法还包括：在用户发生操作行为时，根据该用户的标识信息，判断是否存在该用户对应的经验预测集合，在确定存在该用户对应的经验预测集合时，从该用户对应的经验预测集合中，选取出设定数量的视频数据作为第三视频数据集，其中，该经验预测集合是采用用户交互行为的协同过滤算法预测出的所述用户偏好的视频数据；并判断是否存在热播视频集合，在确定存在热播视频集合时，从该热播视频集合中，选取出设定数量的视频数据作为第四视频数据集，其中，该热播视频集合中包含设定周期内热播的视频数据；
[0069] 相应的，步骤12中，形成用户对应的视频推荐列表，还包括：分别从第三视频数据集和第四视频数据集选取设定数量的视频数据，并结合从第一视频数据集和第二视频数据集中选取的视频数据，形成该用户对应的视频推荐列表。
[0070] 基于上述任一实施例，较佳地，步骤12中，形成用户对应的视频推荐列表，包括：
[0071] 对选取出的视频数据进行去重处理，并将去重处理后得到的视频数据与该用户已观看的视频进行互斥处理，以从去重处理后得到的视频数据中，去除该用户已观看的视频；以及
[0072] 根据视频数据的类型信息，对互斥处理后得到的视频数据，进行聚簇处理，并按照从密集到稀疏的顺序排列。
[0073] 进一步，若互斥处理后得到的视频数据的数量小于去重处理前选取出的视频数据的数量，根据视频数据的类型信息，对互斥处理后得到的视频数据，进行聚簇处理之前，还包括：
[0074] 从各视频源已发布的视频数据库中，选择视频数据补充到互斥处理后得到的视频数据中，以使补充后的视频数据的数量达到去重处理前选取出的视频数据的数量，以进一步对用户可能喜欢的潜在的视频数据进行了探索，提高推荐的全面度、以及灵活性。
[0075] 以分别从第一视频数据集Α、第二视频数据集Β、第三视频数据集C和第四视频数据集Η中选取设定数量的视频数据，形成该用户对应的视频推荐列表为例进行说明。具体处理过程为：先根据user_id和当前时间，获取动态数目配置项ma、ra、re、po,分别从Α、Β、 C、H中，选取对应数量的视频数据，形成集合Τ ;然后，对集合Τ中的视频数据进行去重处理，并利用该用户已观看的视频数据形成的集合I与集合T做互斥处理，即从集合T中去除该用户已观看的视频，其中，若处理后集合T中的视频数据的数据量少于本视频播放系统要求的每页能够显示的推荐视频的数量，则从B中选取相应数量的视频数据进行补齐和兴趣探索；接着，对每页所要显示的集合T中的视频数据，按照视频tag (类型）聚簇，并从密集到稀疏依次排列，得到集合R ;最后，对集合R中的视频数据进行去重处理，并利用该用户已观看的视频数据形成的集合I与集合R做互斥操作，最终形成本视频播放系统每页的视频推荐列表，如图6所示。
[0076] 需要说明的是，每个视频会对应有自己的tag属性，比如爱情，动作，惊悚等。聚簇处理的过程如下：对于每页视频数据medias : [medial, meida2, media3,...]中的每个 meida的tag进行统计，统计每个tag(标签）出现的次数，假设统计结果如下："爱情" :7 次，"动作":3次，"惊悚":1次，这样tag被分为三簇。然后将视频数据按照tag簇的稀疏程度从密到稀排列，即先排含有"爱情" tag的视频数据，然后是含有"动作" tag的视频数据，最后是含有"惊悚" tag的视频数据，以达到tag密集的视频数据放到本视频播放系统的视频推荐列表的焦点位置进行显示的效果。
[0077] 上述方法处理流程可以用软件程序实现，该软件程序可以存储在存储介质中，当存储的软件程序被调用时，执行上述方法步骤。
[0078] 基于同一发明构思，本发明实施例还提供了一种视频推荐装置，如图7所示，该装置包括：
[0079] 第一处理单元71，用于在设定的周期内，从各视频源已发布的视频数据库中，筛选出设定数量的视频数据，作为第一视频数据集；
[0080] 第二处理单元72,用于在用户发生操作行为时，根据所述用户的标识信息，采集所述用户已观看的视频息，从相关视频数据库中，确定出所述用户已观看的视频的相关视频数据，作为第二视频数据集；
[0081] 视频推荐列表确定单元73,用于分别从所述第一视频数据集和所述第二视频数据集中，选取设定数量的视频数据，形成所述用户对应的视频推荐列表，并推荐给所述用户。
[0082] 在实施中，第一处理单元71具体用于：
[0083] 在设定的周期内，从各视频源已发布的视频数据库中，确定出发布时间为设定时间的视频数据，并对确定出的视频数据进行去重处理；以及从去重处理后得到的视频数据中，筛选出设定数量的视频数据，作为所述第一视频数据集。
[0084] 在实施中，第二处理单元72根据所述用户的标识信息，采集所述用户已观看的视频之后，还用于：
[0085] 对采集到的视频进行去重处理；以及按照所述用户的观看时间，对去重处理后得到的视频进行排序，并顺序选择出设定数量的视频；
[0086] 第二处理单元72从相关视频数据库中，确定出所述用户已观看的视频的相关视频数据，包括：从相关视频数据库中，确定出所选择出的视频的相关视频数据。
[0087] 进一步，第二处理单元72从相关视频数据库中，分别确定出所述用户已观看的视频的相关视频数据，作为第二视频数据集，包括：
[0088] 从相关视频数据库中，按照机会均等原则，先依次确定出所选择出的视频的第一个相关视频数据，再依次确定出所选择出的视频的第二个相关视频数据，直至确定出所选择出的视频的所有相关视频数据，并将依次确定出的相关视频数据作为第二视频数据集。
[0089] 作为一种优选的实现方式，较佳地，该装置还包括：
[0090] 第三处理单元74,用于在用户发生操作行为时，根据所述用户的标识信息，判断是否存在所述用户对应的经验预测集合；并在确定存在所述用户对应的经验预测集合时，从所述用户对应的经验预测集合中，选取出设定数量的视频数据作为第三视频数据集，其中，所述经验预测集合是采用用户交互行为的协同过滤算法预测出的所述用户偏好的视频数据；
[0091] 视频推荐列表确定单元73具体用于：从所述第三视频数据集选取设定数量的视频数据，并结合从所述第一视频数据集和所述第二视频数据集中选取的视频数据，形成所述用户对应的视频推荐列表。
[0092] 作为另一种优选的实现方式，较佳地，该装置还包括：
[0093] 第四处理单元75,用于在用户发生操作行为时，判断是否存在热播视频集合；并在确定存在所述热播视频集合时，从所述热播视频集合中，选取出设定数量的视频数据作为第四视频数据集，其中，所述热播视频集合中包含设定时间段内热播的视频数据；
[0094] 视频推荐列表确定单元73具体用于：从所述第四视频数据集选取设定数量的视频数据，并结合从所述第一视频数据集和所述第二视频数据集中选取的视频数据，形成所述用户对应的视频推荐列表。
[0095] 作为再一种优选的实现方式，较佳地，该装置还包括：
[0096] 第三处理单元74,用于在用户发生操作行为时，根据所述用户的标识信息，判断是否存在所述用户对应的经验预测集合，在确定存在所述用户对应的经验预测集合时，从所述用户对应的经验预测集合中，选取出设定数量的视频数据作为第三视频数据集，其中，所述经验预测集合是采用用户交互行为的协同过滤算法预测出的所述用户偏好的视频数据；
[0097] 第四处理单元75,用于在用户发生操作行为时，判断是否存在热播视频集合，在确定存在所述热播视频集合时，从所述热播视频集合中，选取出设定数量的视频数据作为第四视频数据集，其中，所述热播视频集合中包含设定时间段内热播的视频数据；
[0098] 视频推荐列表确定单元73具体用于：分别从所述第三视频数据集和所述第四视频数据集选取设定数量的视频数据，并结合从所述第一视频数据集和所述第二视频数据集中选取的视频数据，形成所述用户对应的视频推荐列表。
[0099] 基于上述任一实施例，较佳地，视频推荐列表确定单兀73具体用于：
[0100] 对选取出的视频数据进行去重处理，并将去重处理后得到的视频数据与所述用户已观看的视频进行互斥处理，以从去重处理后得到的视频数据中，去除所述用户已观看的视频；以及根据视频数据的类型信息，对互斥处理后得到的视频数据，进行聚簇处理，并按照从密集到稀疏的顺序排列，以形成所述视频推荐列表。
[0101] 较佳地，若互斥处理后得到的视频数据的数量小于去重处理前选取出的视频数据的数量，所述视频推荐列表确定单元73根据视频数据的类型信息，对互斥处理后得到的视频数据，进行聚簇处理之前，还用于：
[0102] 从各视频源已发布的视频数据库中，选择视频数据补充到互斥处理后得到的视频数据中，以使补充后的视频数据的数量达到去重处理前选取出的视频数据的数量。
[0103] 本发明实施例提供的视频推荐装置应用于视频播放系统，该视频播放系统包含多个并行处理的视频推荐装置，可以并行处理多用户的情况。下面结合一个具体实施例，对本发明实施例提供的视频推荐装置进行说明。
[0104] 如图8所示，该装置包括离线测试区和在线测试区，其中，离线预测区包括行为预测器（即第三处理单元）和随机预测器（即第一处理单元），在线预测区包括相关预测器 (即第二处理单元）和热播预测器（即第四处理单元）。当用户发生操作行为时，将该用户的标识信息（userjd)加入到消息队列（MQ)中，根据消息互斥机制从消息队列中获取已发生操作行为的用户的标识信息，并将该标识信息分别输入至行为预测器、随机预测器、相关预测器、以及热播预测器。
[0105] 进一步，行为预测器输出第三数据集A，随机预测器输出第一数据集B、相关预测器输出第二数据集C、以及热播预测器输出第四数据集H。
[0106] 进一步，该装置根据分页显示要求和当前时间因素，对A、B、C、H进行融合调配，轮询选取A、B、C、H中的视频数据组成视频集合T ;对T进行去重处理，并与该用户已观看的视频进行互斥处理，对处理后的数据进行个数补全处理，得到每页推荐给用户的视频推荐集；进一步，该装置对每页的视频推荐集按照视频tag特征进行聚簇，并按照从密集到稀疏的顺序进行排列，得到每页推荐给用户的视频推荐表R，并保存R。
[0107] 本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。
[0108] 本发明是参照根据本发明实施例的方法、设备（系统）、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0109] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0110] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0111] 尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
[0112] 显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。
【权利要求】
1. 一种视频推荐方法，其特征在于，该方法包括：在设定的周期内，从各视频源已发布的视频数据库中，筛选出设定数量的视频数据，作为第一视频数据集；并在用户发生操作行为时，根据所述用户的标识信息，采集所述用户已观看的视频，从相关视频数据库中，确定出所述用户已观看的视频的相关视频数据，作为第二视频数据集；分别从所述第一视频数据集和所述第二视频数据集中，选取设定数量的视频数据，形成所述用户对应的视频推荐列表，并推荐给所述用户。
2. 如权利要求1所述的方法，其特征在于，在设定的周期内，从各视频源已发布的视频数据库中，筛选出设定数量的视频数据，作为第一视频数据集，包括：在设定的周期内，从各视频源已发布的视频数据库中，确定出发布时间为设定时间的视频数据，并对确定出的视频数据进行去重处理；以及从去重处理后得到的视频数据中，筛选出设定数量的视频数据，作为所述第一视频数据集。
3. 如权利要求1所述的方法，其特征在于，根据所述用户的标识信息，采集所述用户已观看的视频之后，还包括：对采集到的视频进行去重处理，以及按照所述用户的观看时间，对去重处理后得到的视频进行排序，并顺序选择出设定数量的视频；从相关视频数据库中，确定出所述用户已观看的视频的相关视频数据，包括：从相关视频数据库中，确定出所选择出的视频的相关视频数据。
4. 如权利要求3所述的方法，其特征在于，从相关视频数据库中，确定出所述用户已观看的视频的相关视频数据，作为第二视频数据集，包括：从相关视频数据库中，按照机会均等原则，先依次确定出所选择出的视频的第一个相关视频数据，再依次确定出所选择出的视频的第二个相关视频数据，直至确定出所选择出的视频的所有相关视频数据，并将依次确定出的相关视频数据作为第二视频数据集。
5. 如权利要求1所述的方法，其特征在于，形成所述用户对应的视频推荐列表之前，该方法还包括：在用户发生操作行为时，根据所述用户的标识信息，判断是否存在所述用户对应的经验预测集合；并在确定存在所述用户对应的经验预测集合时，从所述用户对应的经验预测集合中，选取出设定数量的视频数据作为第三视频数据集，其中，所述经验预测集合是采用用户交互行为的协同过滤算法预测出的所述用户偏好的视频数据；形成所述用户对应的视频推荐列表，还包括：从所述第三视频数据集选取设定数量的视频数据，并结合从所述第一视频数据集和所述第二视频数据集中选取的视频数据，形成所述用户对应的视频推荐列表。
6. 如权利要求1所述的方法，其特征在于，形成所述用户对应的视频推荐列表之前，该方法还包括：在用户发生操作行为时，判断是否存在热播视频集合；并在确定存在所述热播视频集合时，从所述热播视频集合中，选取出设定数量的视频数据作为第四视频数据集，其中，所述热播视频集合中包含设定时间段内热播的视频数据；形成所述用户对应的视频推荐列表，还包括：从所述第四视频数据集选取设定数量的视频数据，并结合从所述第一视频数据集和所述第二视频数据集中选取的视频数据，形成所述用户对应的视频推荐列表。
7. 如权利要求1所述的方法，其特征在于，形成所述用户对应的视频推荐列表之前，该方法还包括：在用户发生操作行为时，根据所述用户的标识信息，判断是否存在所述用户对应的经验预测集合，在确定存在所述用户对应的经验预测集合时，从所述用户对应的经验预测集合中，选取出设定数量的视频数据作为第三视频数据集，其中，所述经验预测集合是采用用户交互行为的协同过滤算法预测出的所述用户偏好的视频数据；并判断是否存在热播视频集合，在确定存在所述热播视频集合时，从所述热播视频集合中，选取出设定数量的视频数据作为第四视频数据集，其中，所述热播视频集合中包含设定时间段内热播的视频数据；形成所述用户对应的视频推荐列表，还包括：分别从所述第三视频数据集和所述第四视频数据集选取设定数量的视频数据，并结合从所述第一视频数据集和所述第二视频数据集中选取的视频数据，形成所述用户对应的视频推荐列表。
8. 如权利要求1?7任一项所述的方法，其特征在于，形成所述用户对应的视频推荐列表，包括：对选取出的视频数据进行去重处理，并将去重处理后得到的视频数据与所述用户已观看的视频进行互斥处理，以从去重处理后得到的视频数据中，去除所述用户已观看的视频；根据视频数据的类型信息，对互斥处理后得到的视频数据，进行聚簇处理，并按照从密集到稀疏的顺序排列，以形成所述视频推荐列表。
9. 如权利要求8所述的方法，其特征在于，若互斥处理后得到的视频数据的数量小于去重处理前选取出的视频数据的数量，根据视频数据的类型信息，对互斥处理后得到的视频数据，进行聚簇处理之前，还包括：从各视频源已发布的视频数据库中，选择视频数据补充到互斥处理后得到的视频数据中，以使补充后的视频数据的数量达到去重处理前选取出的视频数据的数量。
10. -种视频推荐装置，其特征在于，该装置包括：第一处理单元，用于在设定的周期内，从各视频源已发布的视频数据库中，筛选出设定数量的视频数据，作为第一视频数据集；第二处理单元，用于在用户发生操作行为时，根据所述用户的标识信息，采集所述用户已观看的视频，从相关视频数据库中，确定出所述用户已观看的视频的相关视频数据，作为第二视频数据集；视频推荐列表确定单元，用于分别从所述第一视频数据集和所述第二视频数据集中，选取设定数量的视频数据，形成所述用户对应的视频推荐列表，并推荐给所述用户。
11. 如权利要求10所述的装置，其特征在于，所述第二处理单元根据所述用户的标识信息，采集所述用户已观看的视频之后，还用于：对采集到的视频进行去重处理，以及按照所述用户的观看时间，对去重处理后得到的视频进行排序，并顺序选择出设定数量的视频；所述第二处理单元从相关视频数据库中，确定出所述用户已观看的视频的相关视频数据，作为第二视频数据集，包括：从相关视频数据库中，按照机会均等原则，先依次确定出所选择出的视频的第一个相关视频数据，再依次确定出所选择出的视频的第二个相关视频数据，直至确定出所选择出的视频的所有相关视频数据，并将依次确定出的相关视频数据作为第二视频数据集。
12. 如权利要求10所述的装置，其特征在于，该装置还包括：第三处理单元，用于在用户发生操作行为时，根据所述用户的标识信息，判断是否存在所述用户对应的经验预测集合；并在确定存在所述用户对应的经验预测集合时，从所述用户对应的经验预测集合中，选取出设定数量的视频数据作为第三视频数据集，其中，所述经验预测集合是采用用户交互行为的协同过滤算法预测出的所述用户偏好的视频数据；所述视频推荐列表确定单元具体用于：从所述第三视频数据集选取设定数量的视频数据，并结合从所述第一视频数据集和所述第二视频数据集中选取的视频数据，形成所述用户对应的视频推荐列表。
13. 如权利要求10所述的装置，其特征在于，该装置还包括：第四处理单元，用于在用户发生操作行为时，判断是否存在热播视频集合；并在确定存在所述热播视频集合时，从所述热播视频集合中，选取出设定数量的视频数据作为第四视频数据集，其中，所述热播视频集合中包含设定时间段内热播的视频数据；所述视频推荐列表确定单元具体用于：从所述第四视频数据集选取设定数量的视频数据，并结合从所述第一视频数据集和所述第二视频数据集中选取的视频数据，形成所述用户对应的视频推荐列表。
14. 如权利要求10所述的装置，其特征在于，该装置还包括：第三处理单元，用于在用户发生操作行为时，根据所述用户的标识信息，判断是否存在所述用户对应的经验预测集合，在确定存在所述用户对应的经验预测集合时，从所述用户对应的经验预测集合中，选取出设定数量的视频数据作为第三视频数据集，其中，所述经验预测集合是采用用户交互行为的协同过滤算法预测出的所述用户偏好的视频数据；第四处理单元，用于在用户发生操作行为时，判断是否存在热播视频集合，在确定存在所述热播视频集合时，从所述热播视频集合中，选取出设定数量的视频数据作为第四视频数据集，其中，所述热播视频集合中包含设定时间段内热播的视频数据；所述视频推荐列表确定单元具体用于：分别从所述第三视频数据集和所述第四视频数据集选取设定数量的视频数据，并结合从所述第一视频数据集和所述第二视频数据集中选取的视频数据，形成所述用户对应的视频推荐列表。
15. 如权利要求10?14任一项所述的装置，其特征在于，所述视频推荐列表确定单元具体用于：对选取出的视频数据进行去重处理，并将去重处理后得到的视频数据与所述用户已观看的视频进行互斥处理，以从去重处理后得到的视频数据中，去除所述用户已观看的视频；以及根据视频数据的类型信息，对互斥处理后得到的视频数据，进行聚簇处理，并按照从密集到稀疏的顺序排列，以形成所述视频推荐列表。
【文档编号】H04N21/266GK104065981SQ201410281599
【公开日】2014年9月24日申请日期:2014年6月20日优先权日:2014年6月20日
【发明者】胡伟凤, 高雪松, 周翚, 许丽星, 谢杰, 王洁, 于旭, 张帅申请人:海信集团有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：胡伟凤;高雪松;周翚;许丽星;谢杰;王洁;于旭;张帅
技术所有人：海信集团有限公司
我是此专利的发明人

上一篇：一种控制方法、装置和系统的制作方法
上一篇：成像设备、成像方法、图像生成设备以及图像生成方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。