本发明涉及视频推荐领域,特别涉及一种视频的推荐方法及系统。
背景技术:
1、随着信息爆炸和多媒体应用的迅速发展,推荐系统作为信息过滤和个性化服务的关键技术,逐渐成为各类应用的核心。传统的推荐方法主要包括协同过滤和基于内容的推荐,然而,这些方法在面对用户冷启动、数据稀疏以及推荐多样性等挑战时存在一定局限性。传统的热门推荐容易造成信息过滤狭窄,使用户陷入信息的“过滤泡”中,缺乏足够的多样性。此外,这些方法通常难以有效处理大规模的用户和视频信息,导致推荐性能下降,无法满足用户多样化的信息需求。在全球范围内的业务展开过程中,由于全球用户分布在不同的国家和地区,不同的国家有不同的代理租户负责运营,不同租户的管理范围中能够观看的视频权限不同。而目前的视频推荐系统无法支持不同租户不同的视频管理范围。
技术实现思路
1、有鉴于此,本技术提出了一种视频的推荐方法及系统,如图1-5所示,具体方案如下:
2、第一部分,本技术提出了一种视频推荐方法,包括:
3、获取观看权限及各观看权限在视频数据库中对应的视频集合;
4、获得同一观看权限下的所有用户在预设第一时间段内的用户行为日志数据以得到第一日志数据,根据第一日志数据得到第一时间段的热门视频列表;
5、获取同一观看权限下的所有用户在预设第二时间段内的用户行为日志数据以得到第二日志数据,根据第二日志数据为视频集合内的每部视频选取与其最相近的多部视频的视频名称,得到兴趣相近列表;将这一兴趣相近列表存入缓存中,便于后期调用;
6、根据视频集合中所有视频的视频详情数据计算每部视频的特征向量,为每部视频获取与其内容最相近的多部视频的视频名称,得到内容相近列表;将这一内容相近列表存入缓存中,便于后期调用;
7、获得目标用户最新用户日志数据中的视频名称,根据视频名称调取其对应的兴趣相近列表和内容相近列表,组成准兴趣视频列表;同样,可以将这一准兴趣视频列表存入缓存中,便于后期调用;
8、从热门视频列表中选出多部视频组成热门推荐列表,从准兴趣视频列表中选出多部视频组成兴趣推荐列表。在实际应用中,选出热门推荐列表和兴趣推荐列表的时间可以是定时的,也可以是根据实际情况调整为不定时的,选取视频组成列表的这一过程,则可以通过调用缓存中存储的数据来实现。
9、在一些具体实施例中,第一时间段的热门视频列表的获取过程包括:
10、从第一日志数据中筛选出第一用户行为日志数据,为每一种第一用户行为日志数据分配相应的权重分值;
11、根据每部视频中所涉及的第一用户行为,为视频进行赋分,选取分值最高的多部视频,构成同一观看权限下的用户在第一时间段中的热门视频列表。
12、在一些具体实施例中,兴趣相近列表的获取过程包括:
13、用户行为日志数据包括观看数据和收藏数据;
14、获取同一观看权限下的所有用户在预设第二时间段内的观看数据,观看数据包括用户名称和视频名称的字段数据;
15、将用户名称和视频名称的字段数据放入预训练的召回算法模型中进行模型以获得获得每一视频所对应的与其最相近的多部视频的视频名称,构成兴趣相近列表。
16、在一些具体实施例中,内容相近列表的获取过程包括:
17、获取视频集合下所有视频的视频详情数据,将视频详情数据放入分词器得到关键词列表;
18、使用tf-idf算法(tf-idf,term frequency–inverse document frequency,词频-逆文档频率,是一种用于信息检索与数据挖掘的常用加权技术,常用于挖掘文章中的关键词)。通过预训练的特征向量模型训练多个数字代替关键词列表中的关键词,计算视频中每个关键词出现的词频,其中词频为某个关键词在视频中出现的总次数与视频的总词数的比值;
19、获得视频集合中的视频总数以及视频集合中包含关键词的视频数,计算视频中每个关键词的逆文档频率idf,其中n为视频集合中的视频总数,m为包含关键词的视频总数:
20、
21、将所得的词频与逆文档频率相乘,得到每部视频的特征向量,将特征向量存储在向量数据库中,计算获得每部视频所对应的与其内容上最相近的多部视频的视频名称,构成内容相近列表。
22、在一些具体实施例中,组成准兴趣视频列表的过程包括:
23、最新用户行为日志数据包括最新观看记录和最新收藏记录;
24、根据目标用户的最新观看记录中的视频名称调取与其所对应的兴趣相近列表和内容相近列表,将调取的兴趣相近列表放入第一集合中,将调取的内容相近列表放入第二集合中;
25、根据目标用户的最新收藏记录中的视频名称调取其所对应的兴趣相近列表和内容相近列表,将兴趣相近列表放入第一集合中,将内容相近列表放入第二集合中;
26、在第一集合和第二集合中各抽取一或多个视频名称,将抽取后的视频名称组成准兴趣视频列表。
27、在一些具体实施例中,形成热门推荐列表和兴趣推荐列表的具体步骤包括:
28、预设比例m:n,预设常数k;
29、从热门视频列表中选出m*k部视频组成热门推荐列表;
30、从准兴趣视频列表中选出n*k部视频形成兴趣推荐列表。
31、在一些具体实施例中,当热门视频列表中的视频数不足m*k个,和/或准兴趣视频列表中的视频数不足n*k个时,根据预设规则向视频集合中抽取视频或向视频集合中随机抽取视频进行补充。
32、在一些具体实施例中,形成热门推荐列表和兴趣推荐列表的具体步骤还包括:
33、在选取视频之前,检测并剔除热门视频列表和准兴趣视频列表中的过期数据、无效数据和重复数据。
34、在一些具体实施例中,第一时间段和第二时间段可以为从每一整点时刻向前推算的一个时间范围,也可以是从用户由前端访问兴趣推荐列表和热门推荐列表的时间节点为起点向前推算的一个时间范围。
35、在实际应用中,视频播放的系统覆盖多个国家与地区,地区之间由于语言等区别,不同地区的用户所观看的视频内容有所不同,在一个实施例中,不同的地区会有运营商也即租户会对其所负责地区的所有用户进行管理和运营,运营商下属管理的用户只能观看在运营商运营范围内的视频,即每一运营商对应视频总库中的一种观看权限,受到该运营商管理的用户,只能在运营商所规定的观看范围内对视频系统中的视频进行观看。而后续所有的视频名称列表的生成,也是针对在同一个运营商管理之下,处于同一观看权限下的观众而言的。需要说明的是,不同的地区之间不同的观看权限也有可能覆盖视频总库中相同的视频范围,本技术并未限定各个观看权限之间在观看内容上的具体区别。
36、在一个实施例中,视频总库可以是imdb库(internet movie database,互联网电影数据库,是一个广受欢迎的电影和电视节目数据库、是一个在线的综合性电影信息平台,包含了大量关于电影、电视节目、演员、导演、编剧等相关信息)。
37、第二部分,本技术提出了一种视频推荐系统,可用于实现上述技术方案中的任一项推荐方法,包括:
38、视频数据库,用于存储视频及各视频的详情数据,视频数据库中对应观看权限形成有多个视频集合;
39、权限管理模块,用于管理目标用户的观看权限,并限制目标用户仅能访问其观看权限所对应的视频集合;
40、读取模块,用于获取用户行为日志数据;
41、训练模块,用于对读取模块获取的用户日志数据和用户行为数据进行训练和计算;
42、缓存模块,用于存储热门视频列表、准兴趣视频列表、兴趣相近列表、和内容相近列表;
43、输出模块,用于在缓存模块中选取、组成并展示热门推荐列表和兴趣推荐列表。
44、本技术将召回算法、基于内容推荐和热门推荐的推荐系统进行了整合创新。
45、首先,通过混合召回算法,本技术实现了用户个性化推荐,充分考虑了用户历史行为和相似用户的喜好,提高了推荐系统的准确性和用户满意度。
46、其次,基于内容推荐算法引入了对视频本身特征的考虑,进一步提升了系统对用户兴趣的理解,弥补了协同过滤在冷启动等场景中的不足。
47、最后,热门推荐的引入使得系统能够灵活适应用户的实时兴趣变化,保持推荐的新颖性和多样性。
48、这一整合性设计带来了多方面的优点。首先,通过召回算法和内容推荐的有机结合,系统综合了两者的优势,实现了更全面、更精准的推荐服务。其次,对于新用户和冷启动视频,基于内容推荐的算法能够更好地处理,提高了系统的适用性。热门推荐的加入提升了系统对热门视频的敏感性,及时捕捉用户的瞬时兴趣,为新用户提供了有价值的初始化数据。
49、有益效果:本技术提出了一种视频的推荐方法及系统,通过将召回算法和内容推荐算法进行有机结合,对用户的行为日志数据进行了充分的利用,得到内容相近列表和兴趣相近列表,再通过引入热门推荐列表,能够有效解决新用户的冷启动问题,在提升推荐系统的精准性、适用性和实时性方面取得了显著进展,为用户提供了更个性化、更全面的推荐服务,有效提高了用户满意度和平台的活跃度。