一种基于组合策略的iptv节目推荐方法

文档序号:9671295阅读:431来源:国知局
一种基于组合策略的iptv节目推荐方法
【技术领域】
[0001] 本发明设及通信领域,具体设及一种基于组合策略的IPTV节目推荐方法。
【背景技术】
[0002] IPTV作为一种新兴的交互式服务技术,在电视节目推荐领域被广泛研究;一开 始,面对电视内容信息过载的问题时,大多数系统都是利用电子节目指南巧PG)来解决的, 但是单纯使用EPG并不会让人们觉得方便,因为它需要用户不断的进行需求的输入,并且 随着电视节目数量的不断增大,电子节目指南巧PG)显得越来越力不从屯、,于是出现了个 人电视节目推荐系统:了¥-30111:、]\11111:;[-曰旨6]11:、?-6?6、基于17-曰]1八;[1116 161曰(1曰1曰的推荐系 统、TOPR等。
[0003] 随着云计算技术的广泛应用,在电视推荐领域中,CPRS和PDra也都采用了云计算 技术,其中CPRS利用用户的人口统计信息使用k-means算法进行聚类,再利用knearest nei曲bor(KNN)算法对节目进行分类,但其基于人口统计信息的k-means算法只是使用了 用户年龄运一个特征值,所W推荐结果必然是粗糖的;而PDPR系统基于云计算技术收集并 分析用户的查看模式(比如使用手机,个人电脑等查看模式)来达到数字电视节目推荐的 目的,比如在通讯服务,手机,个人电脑所产生的数据中分析出用户兴趣偏好,其推荐方法 依然是基于内容的推荐,具体为分析目标用户对某一节目的观看时间占该节目总时长的比 例来确定时间特征值所占的权重值;除去已分析的基于内容推荐的缺点W外,依靠用户观 看节目所占时长的比例来确定用户的偏好程度具有很大的不确定性,比如用户可能是开着 电视,却做别的事去了,运在生活中非常普遍,或者用户只看了很小一段时间而因为一些事 情需要离开,运被系统确定为对该节目有很低的偏好度,然而事实上该用户可能非常喜欢 运个节目。
[0004] 在基于内容的潜语义分析算法,SVD算法,W及基于内容的SVd算法中,基于内容 的潜语义分析算法在基于内容的算法基础上,额外增加了对节目剧情内容的潜语义分析; SVD算法只是单纯的应用到用户-节目评分矩阵的上;基于内容的SVD算法把SVD分解技 术应用在了用户-元数据矩阵W上,W中的元素Wti表示节目j对于元数据C的相关度(权 值)。上述3个算法,并没有有效结合在一起,而是针对某一类问题(比如冷启动)孤立提 出的3种算法,并不能有效地同时解决多种问题。并且单纯的SVD算法在计算稀疏性特别 大矩阵时,其推荐质量并不理想。
[0005] 协同过滤的优点是能够处理多种类型的内容,包括结构化或者非结构化的,比如 文本,电影,图像等;不需要用户的配置文件或者物品内容数据;可W推荐与用户过去喜欢 的物品不相似的,但用户很有可能喜欢的物品。相应地,协同过滤算法也存在不少问题,冷 启动问题和稀疏性问题: 阳006] 冷启动问题:冷启动问题分为用户冷启动和物品冷启动,用户冷启动是指当一个 新用户加入系统后,该新用户并没有任何历史数据而无法获得推荐;物品冷启动是指当一 个新物品加入系统后,物品并没有被任何人评价过,而无法被推荐出去。
[0007] 稀疏性问题:每个用户一般都只对很少的物品作出评价,导致物品被评分量占总 的物品量的比例极低,在大型电子商务系统中,用户评分的项目一般不会超过项目总数的 1 %,运将导致推荐结果质量低下。
[0008] 基于内容的推荐kontent-basedrecommendation)试图通过推荐那些和用户之 前喜欢的物品相似的物品,具体是根据用户的兴趣模型或者用户配置文件对物品内容信息 的相似度匹配而得到的,用户配置文件是用户兴趣的一种结构化表示。根据基于内容推荐 的特性,知道它并没有稀疏性和物品冷启动问题,但是它的推荐的结果过于定制化,很难发 现用户和之前用户喜欢的物品不同的物品,并且会因为推荐对象的类型不同,其特征提取 能力而受到限制,比如图像,视频,音乐都没有有效的特征提取方法,而且文本资源的特征 提取方法也仅仅只能反映资源的一部分内容。

【发明内容】

[0009] 为了解决现有技术中的问题,本发明提供了一种基于组合策略的IPTV节目推荐 方法。
[0010] 本发明的一种基于组合策略的IPTV节目推荐方法,包括W下步骤:
[0011] 步骤①:数据获取,从用户评分数据库读取用户评分数据;
[0012] 步骤②:数据过滤,依据所述步骤①的用户评分数据判断,如果当前节目的评分用 户数占总用户数的比例小于设定值m时,执行步骤③,否则执行步骤④;
[0013] 步骤③:基于内容的推荐,基于用户配置文件数据库和节目内容数据库中的用户 配置文件和节目内容信息,通过用户ID查找用户配置文件,并使用查找到的用户配置文件 构建向量空间模型U;通过节目ID查找节目信息,并使用查找到的节目信息构建向量空间 模型P;
[0014]然后计算每一个节目向量P和用户模型向量U之间的余弦相似度Sim(U,P),并把 相似度最高N个节目作为推荐结果;
[0015] 步骤④:协同过滤推荐,基于所述步骤②中的用户评分数据,首先构建用户-节目 评分矩阵,其次利用基于物品的协同过滤方法将原始用户-节目评分矩阵进行填充,然后 把填充后的用户-节目评分矩阵作为奇异值分解技术的输入,通过奇异值分解技术能够将 原始用户-节目评分矩阵重新填充从而得到一个无缺失值的用户-节目评分矩阵,最后将 无缺失值的用户-节目评分矩阵再次使用基于物品的协同过滤方法预测出原始用户-节目 评分矩阵中未评分项的评分,把预测评分值最高的N个节目作为推荐结果;
[0016] 步骤⑥:推荐结果推送,将所述步骤③和步骤④中的N个节目推荐给相应的IPTV 用户。
[0017] 所述步骤③中的用户配置文件会根据用户评分数据库中的用户评分数据动态更 新。
[0018] 所述步骤③中的余弦相似度sim(u,P)的计算公式如下所列:
[0019] Sim(u,p)= / 如倘X严)) 阳020] 其中,U(i)表示用户模型向量U的第i个元素,PW表示节目向量P的第i个元 素。
[0021] 本发明相对于现有技术具有W下优点:
[0022] 1、本发明将基于内容的推荐方法、基于物品的协同过滤方法和奇异值分解技术结 合起来,避免了单独使用每个方法或技术带来的问题,使得整体的推荐结果更加科学,有 效。
[0023] 2、本发明中用户配置文件并非静态不变的,而是会依据用户评分数据实时动态更 新,运样会有效减少用户配置文件中因用户少填、错填、兴趣变化等原因造成的误差,提高 预测效果。
【附图说明】
[0024] 图1为本发明的流程示意图。
【具体实施方式】
[00巧]W下结合附图,对本发明的一种基于组合策略的IPTV节目推荐方法做进一步的 详细说明。
[0026] 如图1所示,本发明的一种基于组合策略的IPTV节目推荐方法,包括W下步骤:
[0027] 步骤①:数据获取,从用户评分数据库读取用户评分数据;
[0028] 步骤②:数据过滤,依据所述步骤①的用户评分数据判断,如果当前节目的评分用 户数占总用户数的比例小于设定值m时,执行步骤③,否则执行步骤④;
[0029] 步骤③:基于内容的推荐,基于用户配置文件数据库和节目内容数据库中的用户 配置文件和节目内容信息,通过用户ID查找用户配置文件,并使用查找到的用户配置文件 构建向量空间模型U;通过节目ID查找节目信息,并使用查找到的节目信息构建向量空间 模型P;然后计算每一个节目向量P和用户模型向量U之间的余弦相似度Sim(U,P),并把相 似度最高N个节目作为推荐结果;
[0030] 步骤④:协同过滤推荐,基于所述步骤②中的用户评分数据,首先构建用户-节目 评分矩阵,其次利用基于物品的协同过滤方法将原始用户-节目评分矩阵进行填充,然后 把填充后的用户-节目评分矩阵作为奇异值分解技术的输入,通过奇异值分解技术能够将 原始用户-节目评分矩阵重新填充从而得到一个无缺失值的用户-节目评分矩阵,最后将 无缺失值的用户-节目评分矩阵再次使用基于物品的协同过滤方法预测出原始用户-节目 评分矩阵中未评分项的评分,把预测评分值最高的N个节目作为推荐结果;
[0031] 步骤⑥:推荐结果推送,将所述步骤③和步骤④中的N个节目推荐给相应的IPTV 用户。
[0032] 所述步骤②中的设定值m会根据用户评分数据不断进行优化。
[0033] 所述步骤③中的用户配置文件会根据用户评分数据库中的用户评分数据动态更 新。
[0034] 所述步骤③中的余弦相似度sim(u,P)的计算公式如下所列:
[0036] 其中,u(i)表示用户模型向量U的第i个元素,p(i)表示节目向量P的第i个元 素。
[0037] 在基于内容的推荐步骤中,用户通过注册提供显式的兴趣偏好,包括喜欢的节目 类型,演员,导演等特征值信息来建立用户兴趣模型并生成用户配置文件。但是考虑到通过 显式收集的兴趣偏好并不完全代表用户真正的兴趣取向,主要是因为1,用户本身并不能具 体量化每个关键字的重要程度;2,由于用户的惰性可能用户想尽快的完成注册而故意少填 错填一些兴趣偏好;3,用户的兴趣变化。基于W上3个原因本发明提出了一种用户兴趣模 型动态更新的机制,当用户给某个物品评分的时候,根据用户给该物品的评分信息和该物 品的内容信息来更新用户配置文件中相应关键词的权值和相应关键词出现次数,最后通过 用户配置文件和物品内容向量模型的相似度匹配完成推荐并把相似度最高N个节目作为 基于内容的推荐结果。
[0038] 在协同过滤推荐步骤中,首先为节目构建用户-节目评分矩阵,其次利用基于物 品协同过滤为原始用户-节目评分矩阵进行填充,然后把填充后的用户-节目评分矩阵作 为奇异值分解技术的输入,通过奇异值分解技术能够将原始用户-节目评分矩阵重新填充 而得到一个无缺失值的用户-节目评分矩阵,最后将无缺失值的用户-节目评分矩阵再次 使用基于物品的协同过滤方法预测出原始矩阵中未评分项的评分,把预测评分最高的N个 节目,作为协同过滤推荐的推荐结果。基于物品的
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1