一种个性化视频推荐系统及方法与流程

文档序号:12598250阅读:512来源:国知局
一种个性化视频推荐系统及方法与流程

本发明属于互联网技术领域,具体而言,涉及一种个性化视频推荐系统及方法。



背景技术:

随着互联王的发展,各种类型的电子商务、线上游戏、网络金融交易、语言学习以及在线视频等应运产生。许多网页内容正逐渐摆脱互联网的束缚,朝向多元化、更广泛的应用环境发展,大多数的网站会在网站会在网站首页显示所提供服务的页面链接,当使用者访问网站时,便可看到提供服务页面链接的网站首页,但是目前常见的网站的页面是配置固定不变的页面,比如视频网站,当使用者想要寻找某一视频链接时,常常必须在密密麻麻的页面费心寻找才有办法进行链接观看视频;另一方面,由于每个用户的兴趣点往往是不相同的,固定的网站页面无法突显用户的兴趣点,不便用户使用。



技术实现要素:

为解决现有上述现有技术存在的不足,本发明的主要目的在于提供一种个性化视频推荐系统及方法,其能自动记录并学习用户的浏览行为,从中挖掘用户的兴趣点,并根据每个用户的个人兴趣,挖掘出符合个性化需求的内容。

本发明提供了一种个性化视频推荐系统,至少包括:

接收模块,用于接收用户上传的视频,将所述视频存储在预设视频数据库,所述视频数据库包括视频信息库和/或CMS数据库;

点击行为记录模块,用于获取各用户的点击行为,并将该用户点击的视频分别进行存储;

兴趣模型建立模块,用于获取该用户点击的视频的属性信息,并根据该属性信息提取用户的兴趣标记,建立兴趣模型;

候选视频生成模块,用于根据预设的视频生成规则从所述视频数据库中生成候选视频列表;

视频推荐模块,用于根据预设的权值计算模型计算所述候选视频列表中每条候选视频的权值,并根据每条候选视频的权值计算结果排序生成推荐列表,输出推荐结果。

进一步,在所述个性化视频推荐系统中,所述兴趣模型建立模块包括

获取子模块,用于获取每个视频的标题关键字、标签、类别信息,并进行合并和统计频率;

标记子模块,用于按频率由高到低排列,取前k个出现频率最高的词汇,构成对应用户的兴趣标记。

进一步,在所述个性化视频推荐系统中,所述候选视频生成模块包括

第一查询子模块,用于根据每个视频的标记,查询与所述视频数据库中相似的前S1条视频标识;

第二查询子模块,用于根据该兴趣模型中的兴趣标记,查询所述视频数据库中所有与所述兴趣标记相关的视频标识,并取与每个兴趣标记对应的最新的前S2条视频;

第三查询子模块,用于查询并获取所述视频数据库中最热门的前S3条视频标识。

进一步,在所述个性化视频推荐系统中,该权值计算模型为:

new_weight=origin_weight*repeat_ratio*time_ratio

其中,new_weight为每条候选视频的最终权值,origin_weight为每条候选视频原始权值,repeat_ratio为重复因数,time_ratio为时间因数。

更进一步,在上述所述个性化视频推荐系统中,该原始权值origin_weight为:origin_weight=playcount_hour+playcount_total*0.002,其中,playcount_hour表示过去1小时中当前视频被点击的数量,playcount_total表示当前视频从生成至今总的点击数量;该重复因数repeat_ratio为:repeat_ratio=1.0+0.1*(N-1),其中N为重复出现的次数;该时间因数time_ratio:当前页面为非播放页时,

time_ratio=1.0-0.02*(T-1),当前页面为播放页时,

当T=1时,time_ratio=1.2,1<T<=20时,time_ratio=1.0-0.02*(T-1),其中T表示从最近视频开始,往前倒推的个数。

进一步,在所述个性化视频推荐系统中,所述系统还包括

过滤模块,用于将排序结果与所述数据表进行比对,若某个候选视频的视频标识在所述数据表中出现,则将其从该推荐列表中删除。

进一步,该数据表以队列方式存储。

本发明还提供一种个性化视频推荐方法,包括如下步骤:

接收用户上传的视频,将所述视频存储在预设视频数据库,所述视频数据库包括视频信息库和/或CMS数据库;

获取各用户的点击行为,并将该用户点击的视频分别进行存储至数据表;

获取该用户点击的视频的属性信息,并根据该属性信息提取用户的兴趣标记,建立兴趣模型,所述属性信息包括关键字、标签及类别信息;

根据预设的视频生成规则从所述视频数据库中生成候选视频列表;

根据预设的权值计算模型计算所述候选视频列表中每条候选视频的权值,并根据每条候选视频的权值计算结果排序生成推荐列表,输出推荐结果。

进一步,在所述个性化视频推荐方法中,所述获取该用户点击的视频的属性信息,并根据该属性信息提取用户的兴趣标记,建立兴趣模型包括

获取每个视频的标题关键字、标签、类别信息,并进行合并和统计频率;

按频率由高到低排列,取前k个出现频率最高的词汇,构成对应用户的兴趣标记。

进一步地,所述根据预设的视频生成规则从所述视频数据库中生成候选视频列表包括

根据每个视频的标记,查询与所述视频数据库中相似的前S1条视频标识;

根据该兴趣模型中的兴趣标记,查询所述视频数据库中所有与所述兴趣标记相关的视频标识,并取与每个兴趣标记对应的最新的前S2条视频;

所述所述视频数据库中最热门的前S3条视频标识。

进一步,在所述个性化视频推荐方法中,所述权值计算模型为:

new_weight=origin_weight*repeat_ratio*time_ratio

其中,new_weight为每条候选视频的最终权值,origin_weight为每条候选视频原始权值,repeat_ratio为重复因数,time_ratio为时间因数。

进一步,在所述个性化视频推荐方法中,该原始权值origin_weight为:

origin_weight=playcount_hour+playcount_total*0.002,其中,playcount_hour表示过去1小时中当前视频被点击的数量,playcount_total表示当前视频从生成至今总的点击数量;该重复因数repeat_ratio为:repeat_ratio=1.0+0.1*(N-1),其中N为重复出现的次数;该时间因数time_ratio:当前页面为非播放页时,time_ratio=1.0-0.02*(T-1),当前页面为播放页时,当T=1时,time_ratio=1.2,1<T<=20时,

time_ratio=1.0-0.02*(T-1),其中T表示从最近视频开始,往前倒推的个数。

进一步,在所述个性化视频推荐方法中,所述方法还包括

将排序结果与所述数据表进行比对,若某个候选视频的视频标识在所述数据表中出现,则将其从该推荐列表中删除。

与现有技术相比,本发明一种个性化视频推荐系统及其方法通过自动记录并学习用户的浏览行为,并从中挖掘出用户的兴趣点,建立兴趣模型,并根据每个用户的兴趣,挖掘出符合个性化需求的内容,达到了个性化推荐视频的目的,方便了用户。

附图说明

图1为本发明一种个性化视频推荐系统的系统架构图;

图2为本发明一种个性化视频推荐方法的步骤流程图。

具体实施方式

下面通过具体的实施例并结合附图对本发明做进一步的详细描述。

以下通过特定的具体实例并结合附图说明本发明的实施方式,本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。本发明亦可通过其它不同的具体实例加以施行或应用,本说明书中的各项细节亦可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。

图1为本发明一种个性化视频推荐系统的系统架构图。如图1所示,本发明一种个性化视频推荐系统,用于于视频网站向用户推荐个性化视频,其至少包括:接收模块101、点击行为记录模块102、兴趣模型建立模块103、候选视频生成模块104以及视频推荐模块105。

其中,接收模块101,用于接收用户上传的视频,将所述视频存储在预设视频数据库。视频数据库存储视频网站提供的所有视频资料,每笔视频资料均有唯一的标识(id),称为vid,并具有标题关键字、标签、类别等属性信息。

点击行为记录模块102用于获取各用户的点击行为,并将该用户点击的视频分别进行存储至数据表。用户点击的视频标识vid记录于数据库表中。也就是说,点击行为记录模块102在此建立用户与视频资料直接的关联,每个用户通过唯一的一个标示(称为userid)来标识,即不同的userid表示不同的用户。对于任一用户userid,该用户在视频网站上,每次点击一条视频,则该视频的vid会记录在后台的数据表中。在本发明之较佳实施例中,该数据表可选的采用队列的方式记录。用户点击的视频vid,在此成为点击行为队列(past_videolist),即,按点击发生的时间先后,采用队列保存,存放用户最近的N次点击的视频vid,当队列存储已满而用户新产生点击时,去掉距今最久的一个视频vid,并将最新的视频存入点击行为队列past_videolist。

兴趣模型建立模块103,用于获取该用户点击的视频的属性信息,并根据该属性信息提取用户的兴趣标记,建立兴趣模型,所述属性信息包括关键字、标签及类别信息。从上述点击行为队列中past_videolist中,获取每个视频的标题关键字、标签、类别等属性信息,根据该些属性信息,提取用户的兴趣标记,构建用户的兴趣模型。具体地说,兴趣模型建立模块103从点击行为队列中,获取每个视频的标题关键字、标签、类别信息,并进行合并和统计次数,按频率由高到低排列,取前k个出现频率最高的词汇,构成该用户的兴趣标记,即对每个用户userid,生成其对应的兴趣标记:interest_word_1;interest_word_2;……interest_word_k。

进一步,所述兴趣模型建立模块包括

获取子模块,用于获取每个视频的标题关键字、标签、类别信息,并进行合并和统计频率;

标记子模块,用于按频率由高到低排列,取前k个出现频率最高的词汇,构成对应用户的兴趣标记。

候选视频生成模块104,用于根据一相关视频生成规则从视频数据库中生成候选视频列表。在本发明之较佳实施例中,该相关视频生成规则包含三方面:

1、根据已观看的每一个视频vid,于视频数据库中查询与其相似的前S1(例如S1取10)条视频vid,也就是说,针对点击行为队列past_videolist中的每个视频vid,于视频数据库中查询与其相似的前S1(例如S1取10)条视频vid;

2、根据建立的兴趣模型中的兴趣标记interest_word,于视频数据库中查询所有相关的视频vid,取每个兴趣标记interest_word对应的最新的前S2(例如S2取20)条视频vid;

3、于该视频数据库中挑取当前最热门的前S3(例如S3取50)条视频vid,这里最热门的前S3条视频vid可以为人工编辑推荐的,但不以此为限。

当然,可以将根据以上相关视频生成规则获得视频部分或所有视频合并起来,构成候选视频列表candidate_vid。

视频推荐模块105,用于根据预设的权值计算模型计算所述候选视频列表中每条候选视频的权值,并根据每条候选视频的权值计算结果排序生成推荐列表,输出推荐结果。将候选视频列表中的候选视频进行合并,对每条候选视频根据一权值计算模型进行权值计算,并根据每条候选视频的权值计算结果输出推荐结果。在本发明较佳实施例中,计算出每条候选视频的权值后,并将其按从大到小排序,输出指定需求条数。具体来说,该权值计算模型为:

new_weight=origin_weight*repeat_ratio*time_ratio

其中,new_weight为候选视频的最终权值,origin_weight为原始权值,repeat_ratio为重复因数,time_ratio为时间因数。

其中对于为原始权值origin_weight、重复因数repeat_ratio及时间因数time_ratio的计算如下:

A:原始权值origin_weight

origin_weight=playcount_hour+playcount_total*0.002

其中,playcount_hour表示过去1小时中该视频被点击的数量,playcount_total表示该视频从生成至今,总的点击数量。

B:重复因数repeat_ratio

其中,重复因数repeat_ratio是根据视频(video)重复的次数进行加权,在本发明较佳实施例中,设置为repeat_ratio=1.0+0.1*(N-1);其中N为重复出现的次数,即,只出现1次时,repeat_ration=1;N=3时(即在3个候选视频列表中出现),则repeat_ratio=1.2。在此需注意的是,为避免过度加权,当repeat_ratio>1.5时,设置repeat_CN 103136275 A说明书75/6页8ratio=1.5

C:时间因数time_ratio

time_ratio是针对点击行为队列past_videolist的先后顺序进行权值调整,希望对最近观看的视频予以更多的重视。在本发明较佳实施例中,设置为:

当type=0时(即非播放页的推荐)

time_ratio=1.0-0.02*(T-1)

其中,T表示从最近视频开始,往前倒推的个数。最近一次观看的视频vid标识为1,之前观看的为T=2,以此类推,最早观看的视频T=20(即T最大上限为20,时间早于20的设为20)。

当type=1时(即当前页面为播放页)此时对当前观看视频vid给予更多权值优待:

当T=1时,time_ratio=1.2。

1<T<=20时,time_ratio=1.0-0.02*(T-1)

较佳的,本发明之个性化视频推荐系统还包括一过滤模块106,在该视频推荐模块105将候选视频按权值计算结果从大到小排列后,与点击行为队列past_videolist进行比对,如果某个候选视频的视频vid在点击行为队列past_videolist(即曾观看的视频vid列表)中出现,从候选视频列表中删除。

进一步,本发明所述的个性化视频推荐系统还可选的包括

过滤模块106,用于将排序结果与所述数据表进行比对,若某个候选视频的视频标识在所述数据表中出现,则将其从该推荐列表中删除。

在过滤模块106完成过滤后,在个性化的推荐结果页上,根据需要的条数,选择相应条数的个性化推荐视频结果,进行展现。于此同时,用户对这些视频的所有点击行为,也会在点击行为记录模块102中继续收集反馈,在下一次生成个性化推荐结果时使用,这样不仅能源源不断的得到新的推荐结果,同时用户的反馈不断的被收集,个性化推荐的结果也越来越符合用户的兴趣需求。

图2为本发明一种个性化视频推荐方法的步骤流程图,以下将配合图2进一步说明本发明之个性化视频推荐方法。如图2所示,本发明之个性化视频推荐方法,用于根据用户的点击行为对视频数据库中的视频资料进行推荐,其包括如下步骤:

步骤201,获取各用户的点击行为,并将该用户点击的视频分别进行存储至数据表。

每个用户通过唯一的一个标示(称为userid)来标识,即不同的userid表示不同的用户。对于任一用户userid,该用户在视频网站上,每次点击一条视频,则该视频的vid会记录在后台的数据表中。在本发明之较佳实施例中,该数据表采用队列的方式记录用户点击的视频vid,在此成为点击行为队列(past_videolist);

步骤202,获取该用户点击的视频的属性信息,并根据该属性信息提取用户的兴趣标记,建立兴趣模型,所述属性信息包括关键字、标签及类别信息。

从上述点击行为队列past_videolist中,获取每个视频的标题关键字、标签、类别等属性信息,根据该些属性信息,提取用户的兴趣标记,构建用户的兴趣模型。具体地说,从点击行为队列past_videolist中,获取每个视频的标题关键字、标签、类别信息,并进行合并和统计次数,按频率由高到低排列,取前k个出现频率最高的词汇,构成该用户的兴趣标记,即对每个用户userid,生成其对应的兴趣标记:interest_word_1;interest_word_2;……interest_word_k;

步骤203,根据预设的视频生成规则从所述视频数据库中生成候选视频列表。该相关视频生成规则或为根据点击行为队列的每个视频id查询与其相似的前S1条视频vid,或为根据兴趣标记于视频数据库中查询所有相关的视频vid并取最新的前S2条,或为挑取当前最热门的前S3条视频vid;在此,可以将根据该相关视频生成规则获得的视频部分或所有视频合并起来,构成候选视频列表candidate_vid;

步骤204,根据预设的权值计算模型计算所述候选视频列表中每条候选视频的权值,并根据每条候选视频的权值计算结果排序生成推荐列表,输出推荐结果。

在本发明较佳实施例中,计算出每条候选视频的权值后,并将其按从大到小排序,输出指定需求条数。

较佳的,在步骤204中,在计算出每条候选视频的权值并排序后,将其与点击行为队列past_videolist进行比对,若某个候选视频的视频vid在点击行为队列past_videolist(即曾观看的视频vid列表)中出现,则从推荐列表中删除。

综上所述,本发明一种个性化视频推荐系统及其方法通过自动记录并学习用户的浏览行为,并从中挖掘出用户的兴趣点,建立兴趣模型,并根据每个用户的兴趣,挖掘出符合个性化需求的内容,达到了个性化推荐视频的目的,方便了用户。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1