一种混合个性化推荐方法与流程

文档序号:13483459阅读:217来源:国知局
本发明涉及电视视频领域,尤其涉及一种混合个性化推荐方法。
背景技术
:推荐系统存在很多推荐算法,不乏像协同过滤一样比较成熟的算法,但在不同的应用场景,基于不同的数据应用时并不能完全满足需求。在使用全网的视频作为推荐内容时,不可避免的遇到了用户-视频关联矩阵稀疏问题。技术实现要素:鉴于目前存在的上述不足,本发明提供一种混合个性化推荐方法,能够基于用户的短期观看历史行为和热播片库进行混合个性化推荐。为达到上述目的,本发明的实施例采用如下技术方案:一种混合个性化推荐方法,所述混合个性化推荐方法包括以下步骤:获取可供推荐的影视元数据;进行相似影视检索以获得候选影视;通过排序权重对候选影视进行相似排序;进行用户行为聚类并根据聚类结果生成混合推荐候选影视;对所有候选影视进行若干次排序后获得用于显示的推荐结果。依照本发明的一个方面,所述获取可供推荐的影视元数据包括:获取互联网数据、深度epg数据和点播元数据,以形成统一影视元数据管理库。依照本发明的一个方面,所述进行相似影视检索以获得候选影视包括:将每一部影视元数据转换成向量,对向量的元素进行加权,再将影视库的所有影视进行转换,用所有向量构建kd-tree,遍历所有向量,每个影视使用kd-tree检索到最相似的k部影视作为候选影视。依照本发明的一个方面,所述进行用户行为聚类包括:对用户观看过的影片使用聚类算法进行粗聚类。依照本发明的一个方面,所述进行用户行为聚类并根据聚类结果生成混合推荐候选影视包括:从聚类结果的每个簇中提取质心向量v,簇idcid、簇内影片个数cn、最近的观看时间tl,提取出来的信息作为用户画像。遍历获取到的簇质心向量,每个簇用质心向量从构建好的kd-tree中搜索k个近邻作为候选影片。依照本发明的一个方面,所述对所有候选影视进行若干次排序后获得用于显示的推荐结果包括:对所有候选影视进行若干次排序后获得用于显示的推荐结果。依照本发明的一个方面,包括第一次排序,具体为:使用加权函数(1+簇内影片个数*影片个数权值)*(1+相似推荐权值*检索推荐权重)*(1+标准化后的最近观看时间*时间权值)对候选影片加权,降序排序。依照本发明的一个方面,包括第二次排序、过滤,具体为:从前到后遍历第一次排序的结果,根据首次排序权值,相同cid的候选影片出现次数和衰减权值计算二次排序权值,根据算得的新权值对结果进行第二次降序排序,从排序结果头部截断出想要数量的影片作为最终候选集。依照本发明的一个方面,包括第三次排序,具体为:使用第三次排序方法对第二次排序、过滤后的结果进行排序,获得最终用于显示的推荐结果。依照本发明的一个方面,所述用于显示的推荐结果包括各种类型的影视混合。本发明实施的优点:本发明所述的混合个性化推荐方法,包括:获取可供推荐的影视元数据;进行相似影视检索以获得候选影视;通过排序权重对候选影视进行相似排序;进行用户行为聚类并根据聚类结果生成混合推荐候选影视;对所有候选影视进行若干次排序后获得用于显示的推荐结果;对用户行为进行聚类建立用户画像,使用聚类获得的用户画像生成推荐结果;基于用户的短期观看历史行为(最近观看的电影、电视剧、综艺等进行混合推荐)和热播片库进行个性化推荐,推荐结果中电影、电视剧、综艺等混合在一起;基于内容推荐,不受用户-影片关联矩阵稀疏问题影响,具有良好的解释性和推荐效果。附图说明为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明所述的一种混合个性化推荐方法示意图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。如图1所示,一种混合个性化推荐方法,所述混合个性化推荐方法包括以下步骤:步骤s1:获取可供推荐的影视元数据;在实际应用中,所述获取可供推荐的影视元数据包括:获取互联网数据、深度epg数据和点播元数据,以形成统一影视元数据管理库。步骤s2:进行相似影视检索以获得候选影视;在实际应用中,所述进行相似影视检索以获得候选影视包括:将每一部影视元数据转换成向量,对向量的元素进行加权,再将影视库的所有影视进行转换,用所有向量构建kd-tree,遍历所有向量,每个影视使用kd-tree检索到最相似的k部影视作为候选影视。将每一步影片转换成向量。例如:影片id影片标签影片地区上映时间月播放量1024科幻中国2008132000假设只有科幻、动作两个影片标签;只有中国和国外两个地区标签的情况。使用函数f(x)=arctan(ln(x+1)*p)来处理播放量,p为控制播放量平滑程度的变量。使用函数g(t)=(t-1900)/(2016-1900)来处理上映时间。就可以将这部影片转换为向量:对向量的元素进行加权,比如我们希望地区拥有比单个标签更高的权重,影片的第一个标签获得额外0.1的权重:科幻动作中国国外上映时间月播放量1.10200.930.95将影视库的所有影片进行转换:科幻动作中国国外上映时间月播放量1.10200.930.95..................用所有向量构建kd-tree,遍历所有向量,每个影片使用kd-tree检索到最相似的k部影片作为候选影片。步骤s3:通过排序权重对候选影视进行相似排序;对于一部影片a的候选影片b我们使用函数wb=(1+上映时间*时间权重)*(1+月播放量*播放量权重)*(1+a/b相似度*相似度权重)来作为影片b在影片a的相似推荐列表中的排序权重。计算所有a的候选影片的排序权重并按照排序权重降序排列截断,即得到影片a的相似推荐结果。步骤s4:进行用户行为聚类并根据聚类结果生成混合推荐候选影视;在实际应用中,所述进行用户行为聚类包括:对用户观看过的影片使用聚类算法进行粗聚类。为找到用户的兴趣点并在兴趣点上推荐更多影片或将兴趣点影片顺序更靠前显示,我们对用户观看过的影片使用聚类算法进行粗聚类。在实际应用中,所述进行用户行为聚类并根据聚类结果生成混合推荐候选影视包括:从聚类结果的每个簇中提取质心向量v,簇idcid、簇内影片个数cn、最近的观看时间tl,提取出来的信息作为用户画像。遍历获取到的簇质心向量,每个簇用质心向量从构建好的kd-tree中搜索k个近邻作为候选影片。步骤s5:对所有候选影视进行若干次排序后获得用于显示的推荐结果。在实际应用中,所述对所有候选影视进行若干次排序后获得用于显示的推荐结果包括:对所有候选影视进行若干次排序后获得用于显示的推荐结果。其中,包括第一次排序,具体为:使用加权函数(1+簇内影片个数*影片个数权值)*(1+相似推荐权值*检索推荐权重)*(1+标准化后的最近观看时间*时间权值)对候选影片加权,降序排序。其中,包括第二次排序、过滤,具体为:从前到后遍历第一次排序的结果,根据首次排序权值,相同cid的候选影片出现次数和衰减权值计算二次排序权值,比如首次排序是某候选项权值为2,与这项相同cid的候选项已经出现若干次,那么该项新权值为2-(3*衰减权值),根据算得的新权值对结果进行第二次降序排序。从排序结果头部截断出想要数量的影片作为最终候选集。其中,包括第三次排序,具体为:使用第三次排序方法对第二次排序、过滤后的结果进行排序,获得最终用于显示的推荐结果。在实际应用中,所述用于显示的推荐结果包括各种类型的影视混合。本发明实施的优点:本发明所述的混合个性化推荐方法,包括:获取可供推荐的影视元数据;进行相似影视检索以获得候选影视;通过排序权重对候选影视进行相似排序;进行用户行为聚类并根据聚类结果生成混合推荐候选影视;对所有候选影视进行若干次排序后获得用于显示的推荐结果;对用户行为进行聚类建立用户画像,使用聚类获得的用户画像生成推荐结果;基于用户的短期观看历史行为(最近观看的电影、电视剧、综艺等进行混合推荐)和热播片库进行个性化推荐,推荐结果中电影、电视剧、综艺等混合在一起;基于内容推荐,不受用户-影片关联矩阵稀疏问题影响,具有良好的解释性和推荐效果。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本领域技术的技术人员在本发明公开的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1