一种基于机顶盒的数字电视节目推荐方法及系统的制作方法

文档序号:6424131阅读:206来源:国知局
专利名称:一种基于机顶盒的数字电视节目推荐方法及系统的制作方法
技术领域
本发明涉及数字家庭技术领域,具体涉及到一种基于机顶盒的数字电视节目推荐方法及系统。
背景技术
随着数字电视技术的快速发展,有线数字电视系统在目前编码与调制制式下可以达到500 600套节目的传输容量。将出现电视用户在如此众多的节目中无法挑选他们感兴趣的内容的问题。为彻底解决这种电视信息“过载”问题,电子节目指南必须具有智能性, 它能够根据用户的兴趣、爱好和规律自动提前向用户推荐电视节目,同时它还能自动跟踪用户兴趣的变化而对所推荐的电视节目作出调整,这就是数字电视节目推荐系统的概念。在电视节目推荐系统领域,TV-Advisor系统利用用户的显性反馈自动调整用户特征,从而向用户推荐符合其特征的电视节目;P-EPG(Personal-Electronic Program Guide)系统和Multi-Agent系统在利用显性反馈信息的同时,从用户收视记录中自动提取用户的隐形反馈信息,从而更好更全面地反映用户兴趣特征。上述两个系统都是基于内容的推荐系统。PTV(Personal TV)系统和TV-Scout系统在应用基于内容的推荐机制的同时引入合作过滤机制,使得推荐的节目更加符合用户的心愿。

发明内容
本发明提供了一种基于机顶盒的数字电视节目推荐系统,该系统是基于内容过滤和合作过滤混合方式的个人电视节目推荐系统来进行操作的,由以下四个功能模块组成, 分别是用户特性文件模块、节目特性文件模块、合作过滤模块、推荐模块;其中,节目特性文件模块从节目分类,节目制作信息,节目内容信息,节目播出信息方面来描述;其中,节目制作信息包括主要演员、导演、制作商、制作年代等;节目内容信息包括对节目内容的文字描述;节目播出信息包括节目的播出频道、播出时间等;用户特性文件模块描述用户对电视节目的喜好、不喜好和要求;推荐模块采用基于内容相似度匹配的推荐机制,也可以采用基于合作过滤模块的推荐机制;基于内容的推荐机制通过计算用户特征向量与节目特征向量之间的相似度,然后将相似度高的节目推荐给用户;合作过滤模块通过寻找与特定用户有相似爱好的k个近邻,将系统推荐给这k个近邻的电视节目中具有较高频率的节目也推荐给该用户。在计算相似度的过程时,还必须考虑分量特性在相似度计算中的权重;合作过滤的关键在于近邻的选取,但是近邻的选取要求该用户具有较长时间的收视记录,因此,对于新注册用户,系统还必须依赖基于内容的推荐机制,同时对于用户兴趣的突然变化,合作过滤推荐机制也无法作出及时的反应;所以,完善的个人电视节目推荐系统必须将基于内容的推荐机制和基于合作过滤的推荐机制有机地结合起来。用户特性文件模块中由于需要反映用户对电视节目不确定的需求或喜好,所以对用户特性的描述必需用到模糊集的概念;另外,由于电视节目所包含的领域广泛,用户对电视节目的喜好会发生变化,为动态地捕捉用户的这种变化,必需引入反馈的概念,使用户特
4性文件自适应地随用户兴趣的变化而变化。初始用户特性的获取有2种方式第1种方式是在用户注册成为推荐系统的用户时要求用户向系统提供系统设计的调查问卷,第2种方式是根据社会调查信息给予用户初始特性,必要时需要将两种方式结合起来;在第1种方式中,用户需要提供的信息分为两类第1类是用户的基本信息,包括性别、职业、年龄,收看电视的时间、喜好节目的类别等硬性信息;第2类是用户曾经看过的最喜欢的电视节目和最不喜欢的电视节目等软性信息;用户特性文件的自动更新依赖于用户信息的反馈和反馈信息的提取。用户信息的反馈分为显性反馈和隐性反馈两种,显性反馈是系统向用户提供交互操作界面,用户可对系统提供的推荐结果作出评价,并且用户随时可以修改其特性文件的内容,显性反馈有利于反映用户突然的兴趣变化,对于非交互式电视网络,即没有使用STB 的电视网络,显性反馈是唯一的反馈方式;隐性反馈依靠STB自动记录用户的历史收视清单,并将这些信息自动反馈给系统以提取有用的信息,隐性反馈更有利于反映用户渐进式的兴趣变化。本发明还提供了一种基于机顶盒的数字电视节目推荐方法,该方法中采用在用户注册成为推荐系统用户时要求用户向系统提供系统设计的调查问卷,或者根据社会调查信息给予用户初始特性;特性主要包括用户的性另I」、职业、年龄、收看电视的时间、喜好节目的类别等硬性信息;以及喜爱的节目和不喜欢的节目,这类为显性用户信息,同时提取用户的隐性信息,包括用户正在收看的节目,经常看的节目类别等等,提取用户特性信息后从中抽取用户特征向量,同时对节目类别,节目内容也抽取节目特征向量,然后计算两者的相似度,根据相似度进行用户喜爱节目种类和类别进行聚类算法,通过数据挖掘算法K-NN算法找出在欧式距离最相近的K个邻近节目形成推荐列表,推荐给用户。上述技术方案可以看出,由于本发明采用了一种基于机顶盒的数字电视节目推荐方法,该方法充分利用了 MPEG视频流的结构特点和I帧间隔的统计特性,在准确性和效率方面比传统的算法都有明显的性能提高。此外,该算法的软件实现简单,可移植性能好,易于嵌入其他视频检索及分析算法。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1是本发明的方法流程图;图2是本发明的系统模块图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明提出了一种基于机顶盒的数字电视节目推荐方法,如图1所示为本发明方法的流程图。该方法采用的是自适应滤波算法LMS进行预测的快速I帧搜索方法。该算法充分利用了 MPEG视频流的结构特点和I帧间隔的统计特性,在准确性和效率方面比传统的算法都有明显的性能提高。此外,该算法的软件实现简单,可移植性能好,易于嵌入其他视频检索及分析算法。该方法中采用在用户注册成为推荐系统用户时要求用户向系统提供系统设计的调查问卷,或者根据社会调查信息给予用户初始特性。特性主要包括用户的性别、职业、年龄、收看电视的时间、喜好节目的类别等硬性信息;以及喜爱的节目和不喜欢的节目,这类为显性用户信息,同时提取用户的隐性信息,包括用户正在收看的节目,经常看的节目类别等等,提取用户特性信息后从中抽取用户特征向量,同时对节目类别,节目内容也抽取节目特征向量,然后计算两者的相似度,根据相似度进行用户喜爱节目种类和类别进行聚类算法,通过数据挖掘算法K-NN算法找出在欧式距离最相近的K个邻近节目形成推荐列表,推荐给用户。本发明提出的一种基于机顶盒的数字电视节目推荐系统,主要是基于内容过滤和合作过滤混合方式的个人电视节目推荐系统来进行操作的,如图2所示主要由以下四个功能模块组成用户特性文件模块、节目特性文件模块、合作过滤模块、推荐模块。节目特性文件模块可以从节目分类,节目制作信息,节目内容信息,节目播出信息等几个方面来描述。其中,节目制作信息包括主要演员、导演、制作商、制作年代等;节目内容信息包括对节目内容的文字描述;节目播出信息包括节目的播出频道、播出时间等。国家标准和DVB(digital video broadcasting)对电视节目进行了两层分类。因此可以从 SKservice info rma2t i on,Si)信息中得到电视节目的分类信息。但是由于SI的分类信息不尽完善,并且SI信息有时也无法得到,因此,有必要自己定义更加详尽更加深入的分类树。另外,由于同一节目可能会属于不同的类别,还必需定义每一个节目属于不同类别的权重。分类信息只能框架性地定义节目属性,如果需要进一步描述节目特性,文字描述是有益的。对节目特性的描述涉及不同的描述方式,例如有数字型描述(如节目时间等)、文字型描述等,因此在与用户特性文件的匹配时必需考虑描述方式的对应,并且不同的描述方式需要采用不同的匹配准则例如文字型的采用Boolean准则。用户特性文件模块描述用户对电视节目的喜好、不喜好和要求。由于需要反映用户对电视节目不确定的需求或喜好,所以对用户特性的描述必需用到模糊集的概念。另外, 由于电视节目所包含的领域广泛,用户对电视节目的喜好会发生变化,为动态地捕捉用户的这种变化,必需引入反馈的概念,使用户特性文件自适应地随用户兴趣的变化而变化。初始用户特性的获取有2种方式第1种方式是在用户注册成为推荐系统的用户时要求用户向系统提供系统设计的调查问卷;第2种方式是根据社会调查信息给予用户初始特性。必要时需要将两种方式结合起来。在第1种方式中,用户需要提供的信息分为两类第1类是用户的基本信息,包括性别、职业、年龄,收看电视的时间、喜好节目的类别等硬性信息;第2类是用户曾经看过的最喜欢的电视节目和最不喜欢的电视节目(数量越多越好)等软性信息。用户特性文件的自动更新依赖于用户信息的反馈和反馈信息的提取。用户的信息反馈分为显性反馈和隐性反馈两种。显性反馈是系统向用户提供交互操作界面,用户可对系统提供的推荐结果作出评价,并且用户随时可以修改其特性文件的内容。显性反馈有利于反映用户突然的兴趣变化,对于非交互式电视网络(没有使用STB),显性反馈是唯一的反馈方式。隐性反馈依靠STB自动记录用户的历史收视清单,并将这些信息自动反馈给系统以提取有用的信息,隐性反馈更有利于反映用户渐进式的兴趣变化。推荐模块可以采用基于内容相似度匹配的推荐机制,也可以采用基于合作过滤的推荐机制。基于内容的推荐机制通过计算用户特征向量与节目特征向量之间的相似度,然后将相似度高的节目推荐给用户。在计算相似度的过程时,还必须考虑分量特性在相似度计算中的权重,基于内容的推荐方法除了利用上述相似度匹配方法之外,也可以采用Bayes 分类算法。由于电视节目内容描述信息有限,因此基于内容的推荐机制不能充分匹配用户和节目的特性。合作过滤机制通过寻找与特定用户有相似爱好的k个近邻,将系统推荐给这k个近邻的电视节目中具有较高频率的节目也推荐给该用户。合作过滤的关键在于近邻的选取,但是近邻的选取要求该用户具有较长时间的收视记录,因此,对于新注册用户,系统还必须依赖基于内容的推荐机制,同时对于用户兴趣的突然变化,合作过滤推荐机制也无法作出及时的反应。所以,完善的个人电视节目推荐系统必须将基于内容的推荐机制和基于合作过滤的推荐机制有机地结合起来。作为数字电视节目推荐系统研究的第一步,构建一个结构完整、基于实际播出平台的系统是必要的,本文依托深圳市有线数字电视平台真实的频道、用户和节目环境,基于显性用户特征,搭建了国内第1个数字电视节目推荐系统。具体实施如下用户显性特性文件的定义用户在申请注册成为系统用户的过程中,系统将要求用户提供两方面的用户信息。第1类信息是普通用户信息,例如姓名、年龄、性别、职业、收入水平、受教育程度、定购的频道名称、希望的节目推荐方式包括邮件、手机短信、网站主页等;第2类信息是用户的收视喜好信息,例如对各频道的喜好程度、对各收视时间段的喜好程度、对节目类别,包括二级类别的喜好程度、从系统所列演员和导演库中挑选所喜爱的对象并注明喜好程度等。 第2类特征是一种定量的用户特征,将用于推荐算法的计算。节目特性文件的定义对于一个特定的节目,其特性文件由下列要素组成节目名称、节目播出的时间以及持续时间、节目播出的频道、节目第1和第2级类别、演员或主持人信息、导演或制作人信息、节目内容简介、节目剧照或片花等。在规划节目特性文件过程中,我们又将其分为动态信息和静态信息两种,动态信息主要指各频道节目的名称及播出时间,静态信息主要指节目对应的其他信息,并且采用XML格式对节目特性进行定义。以下是用XML格式对中央电视一台2005年11月21日晚上19:55至20:47时段节目特性文件的定义示例〈Program channel = “ 13 “ star t = “ 20051121195500 “ stop = “20051121204700" >〈title Iang=" zh-chs" > 剧场家风 O) </tit le>〈credits〉<actor> 王庆祥 </actor><actor> 王海燕 </ actor>〈/credits〉
<desc Iang=" zh-chs" >锦萍偷偷跑到幼儿园接出了贝贝!杨正民终于在游乐场见到了自己的亲孙女......</desc>〈Content Type)〈Base Type)电视剧〈/Base Type)〈Extended Type)都市生活情感〈/Extended Type)〈/Content Type)</Program>在DVB分类与国家分类标准之上,我们结合中国的实际情况,对节目分类进行了调整,定义了电影、电视剧、新闻、财经、文化娱乐、体育健身、戏曲、少儿、科教、动画、纪录片、旅游生活、访谈、军事、法制、专题16个1级类别,和IM个2级类别。例如电视剧的2 级类别有港台、日韩、外国、政治题材、历史题材、都市生活情感题材、公检法涉案题材、农村题材、少儿题材、部队生活题材、宫廷戏说题材、武侠神话题材、室内情景喜剧、电视艺术片和动画片15个。推荐机制基于用户显性特征的推荐方法。显性推荐指数为E = w[t]r[t]+w[c]r[c] + (l/K) Σ w[i]r[i],w[t],w[c],w[i]分别表示观看电视喜好的时间、频道和属性(属性有K类)的权重,分别取0. 1、0.2和0.7 ;r[t]、r[c]、r[i]分别表示对应的值。本文基于上述节目特性的实际情况,对上述算法作了调整,具体表示如下E = w[t]r[t]+w[c]r[c]+w[g] Σ w[i]r[i]/w[i]式中的wg表示属性项的整体权重,时间、频道与属性的权重依照测试结果优化分布,各子类属性的权重将视子类权重的重要程度确定。需要说明的是,上述装置和系统内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁盘或光盘等。以上对本发明实施例所提供的一种基于机顶盒的数字电视节目推荐方法及系统, 进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式
及应用范围上均会有改变之处,综上所述本说明书内容不应理解为对本发明的限制。
权利要求
1.一种基于机顶盒的数字电视节目推荐系统,其特征在于,该系统是基于内容过滤和合作过滤混合方式的个人电视节目推荐系统来进行操作的,由以下四个功能模块组成,分别是用户特性文件模块、节目特性文件模块、合作过滤模块、推荐模块;其中,节目特性文件模块从节目分类,节目制作信息,节目内容信息,节目播出信息方面来描述;其中,节目制作信息包括主要演员、导演、制作商、制作年代等 ’节目内容信息包括对节目内容的文字描述; 节目播出信息包括节目的播出频道、播出时间等;用户特性文件模块描述用户对电视节目的喜好、不喜好和要求;推荐模块采用基于内容相似度匹配的推荐机制,也可以采用基于合作过滤模块的推荐机制;基于内容的推荐机制通过计算用户特征向量与节目特征向量之间的相似度,然后将相似度高的节目推荐给用户;合作过滤模块通过寻找与特定用户有相似爱好的k个近邻,将系统推荐给这k个近邻的电视节目中具有较高频率的节目也推荐给该用户。
2.根据权利要求1所述的系统,其特征在于,用户特性文件模块中由于需要反映用户对电视节目不确定的需求或喜好,所以对用户特性的描述必需用到模糊集的概念;另外,由于电视节目所包含的领域广泛,用户对电视节目的喜好会发生变化,为动态地捕捉用户的这种变化,必需引入反馈的概念,使用户特性文件自适应地随用户兴趣的变化而变化;初始用户特性的获取有2种方式第1种方式是在用户注册成为推荐系统的用户时要求用户向系统提供系统设计的调查问卷,第2种方式是根据社会调查信息给予用户初始特性,必要时需要将两种方式结合起来;在第1种方式中,用户需要提供的信息分为两类第 1类是用户的基本信息,包括性别、职业、年龄,收看电视的时间、喜好节目的类别等硬性信息;第2类是用户曾经看过的最喜欢的电视节目和最不喜欢的电视节目等软性信息;用户特性文件的自动更新依赖于用户信息的反馈和反馈信息的提取。
3.根据权利要求1或2所述的系统,其特征在于,用户信息的反馈分为显性反馈和隐性反馈两种,显性反馈是系统向用户提供交互操作界面,用户可对系统提供的推荐结果作出评价,并且用户随时可以修改其特性文件的内容,显性反馈有利于反映用户突然的兴趣变化,对于非交互式电视网络,即没有使用STB的电视网络,显性反馈是唯一的反馈方式;隐性反馈依靠STB自动记录用户的历史收视清单,并将这些信息自动反馈给系统以提取有用的信息,隐性反馈更有利于反映用户渐进式的兴趣变化。
4.根据权利要求1所述的系统,其特征在于,在计算相似度的过程时,还必须考虑分量特性在相似度计算中的权重;合作过滤的关键在于近邻的选取,但是近邻的选取要求该用户具有较长时间的收视记录,因此,对于新注册用户,系统还必须依赖基于内容的推荐机制,同时对于用户兴趣的突然变化,合作过滤推荐机制也无法作出及时的反应;所以,完善的个人电视节目推荐系统必须将基于内容的推荐机制和基于合作过滤的推荐机制有机地结合起来。
5.一种基于机顶盒的数字电视节目推荐方法,其特征在于,该方法中采用在用户注册成为推荐系统用户时要求用户向系统提供系统设计的调查问卷,或者根据社会调查信息给予用户初始特性;特性主要包括用户的性另U、职业、年龄、收看电视的时间、喜好节目的类别等硬性信息;以及喜爱的节目和不喜欢的节目,这类为显性用户信息,同时提取用户的隐性信息,包括用户正在收看的节目,经常看的节目类别等等,提取用户特性信息后从中抽取用户特征向量,同时对节目类别,节目内容也抽取节目特征向量,然后计算两者的相似度,根据相似度进行用户喜爱节目种类和类别进行聚类算法,通过数据挖掘算法K-NN算法找出在欧式距离最相近的K个邻近节目形成推荐列表,推荐给用户。
全文摘要
本发明公开了一种基于机顶盒的数字电视节目推荐系统,该系统主要是基于内容过滤和合作过滤混合方式的个人电视节目推荐系统来进行操作的,主要由以下四个功能模块组成用户特性文件模块、节目特性文件模块、合作过滤模块、推荐模块。同时,本发明还公开了一种基于机顶盒的数字电视节目推荐方法。通过本发明使得设计中数据准确性和执行效率很高,从而向用户推荐符合其特征的电视节目,同时通过基于内容的推荐机制的同时引入合作过滤机制,使得推荐的节目更加符合用户的心愿。
文档编号G06F17/30GK102184235SQ20111012456
公开日2011年9月14日 申请日期2011年5月13日 优先权日2011年5月13日
发明者关友强, 凌伯辉, 赖增军, 钟灿威 申请人:广州星海传媒有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1