一种网络节目聚合及节目推荐系统和方法

文档序号:7967784阅读:327来源:国知局
专利名称:一种网络节目聚合及节目推荐系统和方法
技术领域
本发明涉及网络多媒体领域,具体地说,是涉及一种网络节目聚合及节目推荐系统和方法。
背景技术
随着我国广播电视事业的蓬勃发展,中央、省、地县的多级节目播出体系已逐步完善,频道数量在不断增加,在目前编码与调制制式下,有线数字电视系统的传输容量可以达到500 600套节目。这虽然满足了各种用户的观看需求,但也让用户在这么多节目中找到自己真正喜欢的节目变得困难。同时,用户希望能看到更多自己喜欢的节目,但目前的节目来源却很单一,因此,如何获取丰富的节目源也是一个需要考虑的问题。鉴于以上,网络节目聚合及节目推荐系统的建立具有重要的意义。网络聚合是指将互联网上的海量信息与资源(如博客、论坛、影视、音乐、文件等) 在进行人工或机器的内容挑选、分析、分类的基础上,为用户提供有用的、更具针对性的信息。网络聚合不是简单的信息堆积,而是对海量信息进行深度挖掘分析之后的分类、挑选, 它提高了资源优势且降低了获取资源的成本。个性化推荐系统是一种特殊的数据挖掘系统,主要体现在推荐系统的实时性、交互性上。它通过学习用户的兴趣爱好,向用户推荐符合其兴趣的信息。系统不仅要根据用户以往的历史记录,还要结合当前的行为动作做出反应,并根据与用户交互的反馈结果更新推荐的结果。节目推荐技术主要有两种隐式过滤和显式推荐。隐式过滤是通过综合用户自己手动输入的喜好和观察用户的浏览行为近似的推测出用户对哪些信息感兴趣或不感兴趣,进而将用户更感兴趣的信息过滤优先推荐给用户。显式推荐是根据用户对以往看
过的节目的评价打分来预测为用户对未观看节目的兴趣,从而给用户推荐更为感兴趣的节目。现有的用户喜好建模方法主要包括以下几种类型(1)手动建模手动建模是指在建立用户模型时由用户自己手动输入和选择自己感兴趣的类型、项目、列表等。(2)显式建模显式建模是指由用户提供与自己兴趣相关的示例及其类别属性来建立用户模型的建模方法。一般通过要求用户在浏览的过程中对浏览过的节目进行打分反馈,用户对已欣赏过的示例给出1-5分的评价,从而记录体现用户对该示例的喜恶度。显式用户模型可以通过学习算法得到用户喜好模型,精确度较高。(3)隐式建模(也称自动用户建模)隐式建模是指根据用户的浏览行为自动构建用户模型并且在建模过程无需用户主动提供信息的建模方法。该建模方法改进了显式建模方法中的示例攻取途径,将其转化为无需用户标注的自动示例获取方法。通过对用户选择的超链接或浏览行为的观察近似地推测出用户对哪些信息感兴趣或不感兴趣,进而根据推测得到的感兴趣与不感兴趣的信息构建用户模型。该建模方法由于无需用户主动提供信息,因而不会造成对用户的干扰,有利于提高个性化服务系统的易用性,是用户建模技术发展的趋势。在电视节目推荐领域,目前国际上有很多组织都致力于个性化节目推荐的研究, 最著名的当属TV-Advisor系统,该系统能够利用用户的显式反馈自动调整用户特征,然后向用户推荐符合其特征的电视节目。此外,还有基于内容推荐的P-EPG系统和Multi-Agent 系统,它们不仅能够利用显式反馈信息,还能够从用户收视记录中自动提取用户的隐形反馈信息,能更全面的反映用户的兴趣特征。而PTV系统和TV-Scout系统则在应用基于内容推荐机制的同时引入基于协作过滤的推荐技术,使推荐的节目更加匹配用户的兴趣。现有的用户喜好建模方法存在以下不足1、对于手动建模,首先,这种建模方式完全依赖于用户的个人主动行为,大大降低了用户使用的积极性。再者,使用该建模方式需要用户在应用过程中自我提炼喜好,无法顾及到用户兴趣度一般的喜好,喜好的峰值点与谷点的过渡不足,无法全面的体现用户的喜好。另外,当用户的喜好出现转移和改变时,就不得不依赖用户自行修改当初的喜好设置。2、对于显式建模,其存在一个较大的问题,即“冷启动”,具体是指对于刚刚注册的用户,打分反馈没有或过少,因而无法从中得出成型的喜好模型,在建模起初会存在明显的推荐误偏差。3、对于隐式建模,通过用户的浏览行为仅能得到用户对相应信息感兴趣与否的推断,而得不到用户感兴趣的程度。该建模方法就目前的实际反馈来看,自动建模获取信息的准确度有些不足。现有的电视节目推荐系统都取得了较好的效果,但还是有以下一些不足之处1、主动性不强。由于目前采用的推荐技术主要是基于内容的搜索和分类浏览技术,因此用户必须输入关键词或是按类别手动查找才能得到相关信息,不能根据用户行为给用户提供主动的推荐。2、节目源单一。受推荐技术的限制,目前电视推荐中所使用的节目源都是单一的, 并不能为用户带来最为丰富的内容体验。3、个性化不足。基于内容的推荐并不考虑用户,单纯考虑节目文本间的关系;搜索结果千人一面。而基于用户的推荐所针对的也是一群用户,而非单个用户;且搜索结果也是针对不同用户的个性化排序。4、无法让用户对推荐结果理解清晰。因为个性化推荐系统嵌入在搜索引擎中,从而使用户很难判断哪些是因为自己的个性化喜好而获得推荐,哪些是网络上点击率较高的节目。用户无法很好的理解反馈结果,便无法更好的反馈自我的意愿。

发明内容
本发明所要解决的技术问题是需要提供一种网络节目聚合及节目推荐系统及其操作方法,以实现节目源的扩展以及用户喜好的充分体现。为了解决上述技术问题,本发明提供了一种网络节目聚合及节目推荐方法,其特征在于,包括以下步骤基于网络节目服务器中的网络节目信息构建网络节目源;从本地节目源和所述网络节目源中的多个节目中提取表示节目特征的节目特征信息;对用户建立体现所述用户的手动喜好输入信息、显式喜好反馈信息和隐式喜好反馈信息的综合喜好模型;基于所述综合喜好模型向所述用户展示带有所述节目特征信息的推荐节目列表。
优选的,所述节目特征信息为节目标题、类型、主演、导演、语言、地区、时间、海报和/或简介。优选的,所述显式喜好反馈信息包括用户对节目所评价的打分值;所述手动喜好输入信息包括用户手动输入或修改的用户信息和/或喜好节目的信息;所述隐式喜好反馈信息包括通过分析用户的播放历史和行为信息,提取出的用户喜好信息。优选的,还包括根据节目的打分值对所述推荐节目列表中的节目进行排序,其中, 将已评价节目的打分值确定为所述用户对该节目所评价的打分值;以及基于所述用户的综合喜好模型和其它用户的综合喜好模型来预测未评价节目的打分值;所述已评价节目为用户的显式喜好反馈信息中包括该用户对该节目所评价的打分值的节目;以及,所述未评价节目为用户的显式喜好反馈信息中不包括该用户对该节目所评价的打分值的节目。优选的,根据以下步骤来预测所述用户的未评价节目的打分值针对所述用户的各个已评价节目,分别计算各其它用户对所述用户的未评价节目所评价的打分值与对所述用户的已评价节目的打分值的平均差值;基于各所述平均差值和所述用户的各已评价节目的打分值,来预测所述用户的未评价节目的打分值。优选的,分别计算各所述平均差值与所述用户的各已评价节目的打分值的和,作为与所述用户的各已评价节目对应的初始预测打分值;将所述各已评价节目的其他用户评价人数作为的权重,基于所述权重计算所述初始预测打分值的加权平均值作为所述用户的未评价节目的预测打分值。优选的,仅对用户未观看过的节目进行打分值的预测和排序,在所述推荐节目列表中仅显示用户未观看过的节目的节目特征信息。优选的,基于所述综合喜好模型,针对根据所述用户的节目搜索行为所得到的搜索结果进行排序,向所述用户展示排序后的所述搜索结果。本发明还提供一种网络节目聚合及节目推荐系统,其特征在于,包括以下模块节目特征表示模块,用于从网络节目服务器中获取网络节目信息以在本地构建网络节目源; 网络节目聚合模块,用于从本地节目源和所述网络节目源中的多个节目中提取表示节目特征的节目特征信息;用户喜好综合学习模块,用于对每个用户建立体现该用户手动喜好输入信息、显式喜好反馈信息和隐式喜好反馈信息的综合喜好模型;主动推荐模块,用于基于所述综合喜好模型向每个登录的用户提供带有所述节目特征信息的推荐节目列表。优选的,所述网络节目聚合及节目推荐系统还包括搜索过滤推荐模块,用于对用户的搜索行为得到的搜索结果中的节目,基于所述综合喜好模型进行排序,推荐给用户。与现有技术相比,本发明具有以下优点1、本发明的节目源包括两部分一部分是运营商提供的,一部分是网络聚合的节目源,通过网络节目聚合针对特定节目网站,抓取节目详细信息,使节目源得到了充分的扩充。2、在使用本发明时,使得用户在观看本地资源节目的同时,可进行网络搜索,实现本地资源和网络资源的同时利用,同时搜索结果可以是节目加简介信息的类型,可以最大限度方便用户识别该节目是否是自己感兴趣的节目。3、在喜好模型的参与下实现了主动推荐与主动搜索的结合,使被动收看的用户, 实现了自主权。
4、根据植入服务器的内含记忆函数的个人喜好分析模型,使筛选信息更人性化, 从而提高智能化和交互功能。5、在应用层面上,把本地媒资库和网络节目聚合联系起来,从而将网络电视的交互式搜索功能移植到数字电视或者网络电视等新媒体平台中。这是现有电视平台所不能充分发挥的功能,也从一定程度上满弥补了新媒体平台节目内容不足的缺憾,并且满足了用户对交互性的需求。6、用户喜好综合建模,能够根据用户对观看节目的打分反馈建立显式模型,根据浏览行为记录和注册的手动输入建立隐式喜好模型,从而建立综合喜好模型。使用可以兼容显式建模的准确度和隐式建模的易发性,也可以弥补单一建模所带来的明显弊端。7.本发明的节目推荐算法易于实现和维护,普通工程师可以轻松解释所有的聚合数据,并且算法易于实现和测试。算法运行时可即时更新,新增一个评分项,对预测结果即时产生影响。算法的查询响应效率高,能够快速的执行查询,计算量大大减少,运算速度快。 算法对初次访问者要求交底,对于一个评分项目很少的用户,同样能够获得有效的推荐。另外,本算法与现有的较为准确的算法相比,具有合理的准确性。8、搜索结果根据喜好模型进行过滤重排序,能够把搜索结果根据隐式喜好模型进行过滤重排序,从而把用户更可能喜欢节目优先呈现。本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。


附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例共同用于解释本发明,并不构成对本发明的限制。在附图中图1是根据本发明实施例一的网络节目聚合及节目推荐方法的流程图;图2是根据本发明实施例一的网络节目聚合及节目推荐方法中对节目信息进行聚合的流程图;图3为根据本发明实施例一的网络节目聚合及节目推荐方法中根据用户操作赋予权重值的对应表;图4为根据本发明实施例一的网络节目聚合及节目推荐方法中用户对节目打分表;图5为根据本发明实施例一的网络节目聚合及节目推荐方法中节目推荐过程的流程图;图6为根据本发明实施例一的网络节目聚合及节目推荐方法中用户评分的实例表;图7为根据本发明实施例二的网络节目聚合及节目推荐系统的功能框图。
具体实施例方式以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合, 所形成的技术方案均在本发明的保护范围之内。另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。实施例一图1为根据本发明实施例一的网络节目聚合及节目推荐方法的流程图,下面参照图1详细说明该方法的各步骤。步骤S110,从网络节目服务器中获取网络节目信息以在本地构建网络节目源。在本步骤中,从节目所在的网络节目服务器获取网络节目信息,对网络节目信息进行聚合,并在本地构建网络节目源,与本地已有的本地节目源共同作为节目源。在本实施例中,节目可包括视频、音频、文本或其组合的多媒体形式的电影、电视剧、音乐、广播、有声读物等。优选采用c/s(客户端/服务器)模式进行与网络节目服务器的通信,可运用网络爬虫技术和正则表达式实现对特定节目网站内容的聚合,从网页中提取节目对应的特征信息,获取网络节目信息的目的是充分利用网络资源来弥补本地节目源单一而导致的资源不足。对网络节目信息进行聚合的过程具体为针对指定的节目网站,先以该网站的站内搜索引擎为依托,进行初步的广度优先搜索,获取所需的URL链接。然后通过这些URL进行深度搜索,通过对网页源代码的分析,使用正则表达式匹配所需的节目信息(标题、类型、主演、 导演、地区、语言、时间、海报地址、节目地址等)。最后将获取的节目数据存储到数据库中, 该数据库可以是与存储本地节目相同的数据库。此外,定期检测链接的有效性,保证服务质量。具体流程如图2所示。在图2中,客户端先通过socket套接字与指定的网络节目服务器建立起连接(开始步骤),然后利用http协议向特定节目网站(网络节目服务器)发送响应消息。服务器接收到请求后会给予响应的相应信息,客户端接收到网页代码后,使用正则表达式进行匹配,将所需的URL分别提取出来放入队列中。同时,开始访问采集到的URL所对应链接的网页,继续使用正则表达式匹配所需的节目信息,将其提取出来后存入到数据库中。为了保证服务的质量,可定期检测节目链接是否有效,对失效链接进行及时地去除。步骤S120,从本地节目源和网络节目源中的多个节目中提取表示节目特征的节目特征信息。本步骤旨在从设置在本地的网络节目源和本地节目源中的多个节目中提取体现节目特征的节目特征信息,该节目特征信息也称为节目元数据,是指一组能提供有关节目信息的有组织的数据集,如节目标题、类型、主演、导演、语言、地区、简介等。节目特征信息可包含在节目描述文件中,一个具有市场竞争力的节目描述文件需要具备的条件有格式是公开的、能自由使用和扩展、容易解析和被自动系统使用。XMUExtensible Markup Language)是目前描述节目元数据的趋势,也是TV-Anytime组织和IEEE TV Metadata作为节目元数据物理形式的选择。因此,本实施例优选采用XML格式对节目特征进行定义以形成节目特征信息,以下是一个节目的节目特征信息的定义示例〈program number=" 14" source="l">
<title>哈利.波特与死亡圣器(下)</title> <language> 英语 </language>
〈director〉大卫·叶慈 </director> <cast>
<actor>丹尼尔·雷德克里夫</actor> <actor>艾玛·沃特森 </actor> <actor>鲁珀特.格林特</actor>
</cast> <typelist>
<type>l7 险 </type> <type> 魔幻 </type> </typelist>
<region>^国 </region> <brieft>
《哈利·波特与死亡圣器》是“哈利·波特”系列的第七部,也就是最后一部。还有四天,哈利就要迎来自己十七岁的生日,成为一名真……
</ brie^>
<time>146</time> 〈/program〉其中,source为1表示属于本地节目源,为2表示属于网络节目源。优选的,如果是网络节目源提供的网络节目,那么定义XML文件时则会多两个标签,一个用来标记网络节目源海报的图片地址,另一个标记网络节目地址。步骤S130,对每个用户建立体现该用户手动喜好输入信息、显式喜好反馈信息和隐式喜好反馈信息的综合喜好模型。获取用户喜好信息的方式有三种手动喜好输入信息、显式喜好反馈信息和隐式喜好反馈信息。手动喜好输入信息一般是用户手动输入或修改自己的用户基本信息和喜好的节目的信息。显式喜好反馈信息是用户对观看的节目按照提供的打分方式主动进行的评价打分。隐式喜好反馈信息是通过记录用户的播放历史和行为信息,经过分析处理,提取出用户的隐式喜好。通过对现有用户模型的分析和比对发现,单一的用户建模方式不能很好的适应于用户对易发性和准确性的要求。手动建模因为其易发性弱、准确性不定等问题,已经无法在适应于目前的用户市场需求,所以本实施例中的用户模型将采用综合建模方法。一方面,可以兼容显式建模的准确度和隐式建模的易发性,另一方面,又可以弥补单一建模带来的明显弊端。根据信息收集的行为信息分类,本实施例的用户综合喜好模型可以是由手动喜好输入信息、显式喜好反馈信息和隐式喜好反馈信息(本文中简称为手动喜好、显式喜好和隐式喜好)组成的综合推荐喜好模型,即用户喜好P =显式喜好Pl+隐式喜好Ps+手动喜好W1此处的“ + ”并不是指单纯数学上的相加,而是表示用户的喜好由这三部分共同所组成。因为手动喜好Wi的信息处理模式与隐式喜好的信息处理模式相同,所以在具体信息处理分析时采用的方法与隐式喜好相同,并在后文中并入隐式喜好模型进行表述,因此,用户综合喜好模型由隐式喜好模型和显式喜好模型两部分构成。对于隐式喜好1^,主要是依据浏览历史依托节目的本体模型所构建的。首先在用户注册时,采用手动建模,由用户手动输入个人喜好,例如喜欢的节目类型、地区、语言等特征信息,将这些信息作为用户的隐式喜好模型最基础的部分。手动输入的信息因为较为粗略且信息处理结构同隐式喜好模型相同,故而也归入隐式喜好部分。此外,这种方式主要是利用机器学习的方式,通过用户的行为信息,让机器记录下用户的个性化信息,对于不同的行为反映用户喜好程度的不同,为每个行为赋予相应的喜好权重值,如图3所示,对用户的搜索、浏览、观看和手动输入等方式分别给赋予了权重。通过记录用户的操作,进行权重记录,再对权重值进行计算。通过这种方式可以使用户无形中参与到从搜索到观看节目结束的整个过程的反馈中去。在隐式喜好的记录个性化信息过程中,选取地区、类型、语言等重要本体模型的特征信息为隐式喜好模型的特征信息,选出具体的节目特征,记录和累加这些特征信息下的具体属性的喜好权重,从而建立出线性隐式喜好模型。例如,喜好记录空白的用户A对爱情片很有兴趣,那么可以以“爱情”为关键词进行搜索,在系统进行搜索的同时,个性化节目推荐模型的信息获取和预处理模块会记录用户的此次行为,给“类型”特征下的“爱情”属性赋喜好权重2。在搜索的结果中,用户A又对《谍海风云》很感兴趣,点击进一步查看,那么《谍海风云》的本体模型中“类型”特征下的 “爱情”属性得以累加喜好权重1,总的喜好权重为3 ;《谍海风云》本体模型中“地区”特征下的“美国”属性和“语言”特征下的“英语属性”都分别获得值为1的喜好权重。如果用户 A进一步播放观看,那么以上提到的属性都将可以累加喜好权重2。这些因为用户A隐式行为而带来的个性化信息在预处理后都将计入数据库,作为用户A的隐式喜好模型。对于显式喜好P1,主要是依据用户主动地反馈的个人观看节目打分值所构建的。 优选的,用户对看过的节目进行1-5分的打分来反映用户的喜好程度,如图4所示,从1到5 分分别表示用户从不喜欢到很喜欢的5个程度。通过打分直接数字化反映用户的喜好,记录到用户的显式喜好模型中。通过对用户的显式喜好、隐式喜好和手动输入进行建模,得到体现用户综合喜好的综合喜好模型。优选的,对于新用户,需要进行注册才能建立属于自己的个性化喜好模型。在注册的过程中,可通过两个方面收集用户信息首先要求用户填写个人信息(如性别、年龄、职业等),其次让用户选择喜欢看的节目的类型和地区等。通过这些信息建立起新用户的初始喜好模型,之后,根据用户在观看节目过程中的显式喜好、隐式喜好和手动输入对该初始喜好模型进行更新,作为该用户的综合喜好模型。步骤S140,基于综合喜好模型向每个登录的用户提供具有节目特征信息推荐节目列表。图5示出了用户登录系统后,系统向用户进行节目推荐的基本流程。如图5所示, 用户开机登录后,判断用户是否为新用户,对新用户则首先要进行注册。之后系统对用户进行节目推荐,推荐的节目以列表形式呈现给用户,每个节目均具有对应的节目特征信息。 如果用户喜欢推荐的节目,则可对推荐的节目进行观看并打分。如果用户不喜欢推荐的节目,则可在系统中进行节目搜索以获得喜欢的节目,用户对搜索得到的节目可进行观看和打分。用户对推荐的节目或搜索到的节目进行观看和打分所产生的显示喜好信息均可以用于更新用户的综合喜好模型。在推荐节目时,具体的,如果用户针对节目的打分记录低于预定数量(优选10 部),则将该用户视为新注册用户,可根据隐式喜好模型(含手动模型)为用户自动推荐资源库中的节目。如果用户的打分记录不低于预定数量的节目,则认为该用户是长期使用用户,则根据用户以往的显式喜好模型自动为用户精确推荐本地媒资库内的节目。在用户登录之后,首先接收到的是系统生成的个性化的推荐节目(优选十个),之后,自主选择权可转移到用户手里,用户可以直接播放推荐的节目,也可以主动搜索其他节目。在观看节目时,可以对其进行打分(优选五分制),通过打分可以直接反映用户的喜好并将其数字化, 记录到综合喜好模型中。对长期使用用户推荐节目时,根据用户对节目的打分来进行排序,将排序的节目结合节目对应的节目特征信息通过列表形式推荐给用户。对于显式喜好模型中所具有的节目,则根据用户打分进行排序,而对于用户未观看或未打分的节目,则需要对该节目的打分进行预测,根据预测的打分值(下文称预测打分值)与其它节目进行排序。优选的,在对用于推荐节目时,可以只推荐用户未观看过的节目,仅对用户未观看过的节目进行预测并排序,在推荐节目列表中仅显示用户未观看过的节目的节目特征信息。在本实施例中计算某一用户对某一未评价节目的预测打分值可具体为以下步骤1、获取该用户已评价的预定数量的节目的打分值,以及其他预定数量用户对该用户已评价的节目的打分值和未评价节目的打分值。2、基于其他用户的打分值得出每个其他节目与未评价节目之间的差值平均值。具体的,计算出其他用户对每个其他节目的打分与其他用户对该未评价节目打分的差值,每个其他节目与未评价节目的差值的数量等于其他用户的数量,以每个其他节目的多个打分值为一组,将一组中不同用户对该其他节目的打分值与未评价节目的打分的差值求和,以其他用户的数量对差值的和求平均作为该其他节目与未评价节目的平均差值。3、根据用户对其他节目的打分值和得到的平均差值得出用户对未评价节目的多个初始预测打分值,将多个初始预测打分值求加权平均值作为用户对未评价节目的预测打分值,其中,求加权平均值时每个初始预测打分值的权重为计算每个初始预测打分值时与未评价节目求差值的已评价节目的其他用户评价人数(即,不包括该用户的评价人数)。具体的,例如推算节目1的初始预测打分值时,将用户对节目2、3... η的打分值,分别与按上一步中计算的这些节目与节目1的差值的平均值相加,从而得到多个节目1的初始预测打分值。将多个预测打分值求加权平均值作为该用户对该节目的预测打分值,其中,求加权平均值的权重为节目的其他用户评价人数。以图6所示的打分记录为例,小李对节目1至4有打分,小张对节目1、2、4和5有打分(将已有打分的节目称为已评价节目),小陈对节目2至5有打分,而对节目1未打分, 则依据下述步骤来预测小陈对节目1的打分值首先根据小李和小张对节目的打分来求出节目1分别与节目2至5之间打分值的平均差值,分别记为P21、P31、P41和P51 (参考图6)P21=[(L1--L2)+ (Z1-Z2)],/2 = [(5--4)-卜(3--2)1/2= 1
P3I= -T=5-2=3
P41=[(L1--L4)+ ( -Z4)],/2 = [(5--3)-K3--4)1/2 = 0. 5
P5I=Z1-Z5=3-3=0然后,将上述算得的节目1分别与节目2至5之间的打分值的平均差值分别与小陈对节目2至5所评价的打分值之和,分别确定为小陈的相对于相应节目的初始预测打分值,分别记为S21, S31^S41和S51 S21 = 1+2 = 3S31 = 3+4 = 7S41 = 0. 5+2 = 2. 5S51 = 0+5 = 5根据评价人数(不包括所述用户)确定节目2至4的权重w2、w3> W4和w5,分别为 2、1、2、1,将所预测的打分值(记为C1)确定为C1 = [(w2X S21) + (w3 X S31) + (w4 X S41) + (w5 X S51) ] / (w2+w3+w4+w5)]= [2 X 3+1 X 7+2 X 2. 5+1 X 5] /6 = 3. 83由此,得出小陈对节目1的预测打分值为3. 83。需要说明的是,上述基于各初始预测打分值来确定所预测的打分值的方式只是举例。例如,也可直接将各初始预测打分值的平均值(本例中平均值为4. 38)作为所预测的打分值。根据上述步骤可获得用户对多个未评价的节目的预测打分值,并根据预测打分值和用户已打分的节目的打分值综合进行排序,将排在顶部的预定数量的节目结合对应的节目特征信息以推荐节目列表的形式显示给用户。本实施例还可以包括优选步骤步骤S150,基于综合喜好模型,针对根据用户的节目搜索行为所得到的搜索结果进行排序,向用户展示排序后的搜索结果。
当用户对推荐的节目均不感兴趣时,用户可对感兴趣的节目进行搜索。用户的搜索行为分为网络搜索和本地搜索,一般来说,搜索结果会根据点击量或者热门度的大众化标准进行排序显示,这样可能会忽略用户的个性化需求。所以在本实施例中,无论用户是在本地库中进行搜索还是在网络上搜索,都将搜索结果根据用户的隐式喜好模型进行重新排序。更具体的,用户的搜索结果中的第一页优先呈现预定数量的(优选10条)搜素结果,根据这些结果的节目特征信息,根据用户对不同特征的喜好程度的不同,为搜索结果中的节目赋以推荐权重,以此把搜索结果的首页的预定数量的节目按权重(即按喜好)进行重新排序,以起到节目过滤的效果,从而首先呈现更接近用户喜好的结果。实施例二图7为本实施例的网络节目聚合及节目推荐系统的功能框图,下面结合图7详细说明该系统的组成。网络节目聚合及节目推荐系统1主要由以下4个功能模块组成节目特征表示模块10、网络节目聚合模块20、用户喜好综合学习模块30、主动推荐模块40。节目特征表示模块10用于从本地节目源和网络节目源中的多个节目中提取表示节目特征的节目特征信息。优选的,节目特征表示模块10中包括用于存储节目描述文件的数据存储模块11、存储本地节目资源的本地节目资源模块12以及存储网络节目资源的网络节目资源模块13。网络节目聚合模块20与节目所在的网络节目服务器进行网络通信,用于从网络节目服务器中获取网络节目信息以在本地构建网络节目源,从而实现对网络节目的聚合。用户喜好综合学习模块30用于对每个用户建立体现该用户手动喜好输入信息、 显式喜好反馈信息和隐式喜好反馈信息的综合喜好模型,以反映用户的喜好。用户喜好综合学习模块30具体包括以下子模块手动输入子模块31,显式反馈子模块32,隐式反馈子模块33,喜好学习子模块34,以及用户综合喜好模型子模块35。系统获取用户信息源的方式有三种手动喜好输入信息、显式喜好反馈信息和隐式喜好反馈信息,分别通过本实施例中的手动输入子模块31,显式反馈子模块32和隐式反馈子模块33来实现。喜好学习子模块34根据手动喜好输入信息、显式喜好反馈信息和隐式喜好反馈信息对用户喜好进行学习,并通过用户综合喜好模型子模块35建立用户综合喜好模型。主动推荐模块40用于基于综合喜好模型向每个登录的用户提供带有所述节目特征信息的推荐节目列表。具体的,通过推荐算法计算用户对未评价节目的喜好程度的预测打分值,根据预测打分值和用户打分值综合对节目进行排序,并向用户提供推荐节目列表。 该模块从用户喜好综合学习模块30和节目特征表示模块10中获取相应数据信息,并将推荐的节目信息发送到客户端。主动推荐模块40包括推荐算法子模块41和推荐子模块42。 推荐算法子模块41根据节目特征表示模块10中的节目特征信息和将用户喜好综合学习模块30中的用户喜好信息计算用户对节目喜好程度的预测值,并发送给推荐子模块42,推荐子模块根据预测值对节目进行排序,并向用户推荐。优选的,本实施例的网络节目聚合及节目推荐系统1还包括搜索过滤推荐模块 (未在图中示出)。该模块与主动推荐模块40类似,从用户喜好综合学习模块30和节目特征表示模块10中获取相应数据信息,并将搜索过滤后的节目信息发送到客户端。
本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。虽然本发明所揭露的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化, 但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。
权利要求
1.一种网络节目聚合及节目推荐方法,其特征在于,包括以下步骤 基于网络节目服务器中的网络节目信息构建网络节目源;从本地节目源和所述网络节目源中的多个节目中提取表示节目特征的节目特征信息;对用户建立体现所述用户的手动喜好输入信息、显式喜好反馈信息和隐式喜好反馈信息的综合喜好模型;基于所述综合喜好模型向所述用户展示带有所述节目特征信息的推荐节目列表。
2.根据权利要求1所述的方法、其特征在于,所述节目特征信息为节目标题、类型、主演、导演、语言、地区、时间、海报和/或简介。
3.根据权利要求1或2所述的方法、其特征在于, 所述显式喜好反馈信息包括用户对节目所评价的打分值;所述手动喜好输入信息包括用户手动输入或修改的用户信息和/或喜好节目的信息; 所述隐式喜好反馈信息包括通过分析用户的播放历史和行为信息,提取出的用户喜好 fn息ο
4.根据权利要求3所述的方法,其特征在于,还包括根据节目的打分值对所述推荐节目列表中的节目进行排序,其中,将已评价节目的打分值确定为所述用户对该节目所评价的打分值;以及基于所述用户的综合喜好模型和其它用户的综合喜好模型来预测未评价节目的打分值;所述已评价节目为用户的显式喜好反馈信息中包括该用户对该节目所评价的打分值的节目;以及,所述未评价节目为用户的显式喜好反馈信息中不包括该用户对该节目所评价的打分值的节目。
5.根据权利要求4所述的方法,其特征在于,根据以下步骤来预测所述用户的未评价节目的打分值针对所述用户的各个已评价节目,分别计算各其它用户对所述用户的未评价节目所评价的打分值与对所述用户的已评价节目的打分值的平均差值;基于各所述平均差值和所述用户的各已评价节目的打分值,来预测所述用户的未评价节目的打分值。
6.根据权利要求5所述的方法,其特征在于,分别计算各所述平均差值与所述用户的各已评价节目的打分值的和,作为与所述用户的各已评价节目对应的初始预测打分值;将所述各已评价节目的其他用户评价人数作为的权重,基于所述权重计算所述初始预测打分值的加权平均值作为所述用户的未评价节目的预测打分值。
7.根据权利要求6所述的方法、其特征在于,仅对用户未观看过的节目进行打分值的预测和排序,在所述推荐节目列表中仅显示用户未观看过的节目的节目特征信息。
8.根据权利要求1所述的方法,其特征在于,还包括基于所述综合喜好模型,针对根据所述用户的节目搜索行为所得到的搜索结果进行排序,向所述用户展示排序后的所述搜索结果。
9.一种网络节目聚合及节目推荐系统,其特征在于,包括以下模块节目特征表示模块,用于从网络节目服务器中获取网络节目信息以在本地构建网络节目源;网络节目聚合模块,用于从本地节目源和所述网络节目源中的多个节目中提取表示节目特征的节目特征信息;用户喜好综合学习模块,用于对每个用户建立体现该用户手动喜好输入信息、显式喜好反馈信息和隐式喜好反馈信息的综合喜好模型;主动推荐模块,用于基于所述综合喜好模型向每个登录的用户提供带有所述节目特征信息的推荐节目列表。
10.根据权利要求9所述的系统,其特征在于,所述网络节目聚合及节目推荐系统还包括搜索过滤推荐模块,用于对用户的搜索行为得到的搜索结果中的节目,基于所述综合喜好模型进行排序,推荐给用户。
全文摘要
本发明公开了一种网络节目聚合及节目推荐方法和系统,所述方法包括以下步骤基于网络节目服务器中的网络节目信息构建网络节目源;从本地节目源和所述网络节目源中的多个节目中提取表示节目特征的节目特征信息;对用户建立体现所述用户的手动喜好输入信息、显式喜好反馈信息和隐式喜好反馈信息的综合喜好模型;基于所述综合喜好模型向所述用户展示带有所述节目特征信息的推荐节目列表。根据本发明的方法和系统,能够扩充节目源,方便用户识别该节目是否是自己感兴趣的节目,把用户更可能喜欢节目优先呈现,能够使筛选信息更人性化,从而提高智能化和交互功能。
文档编号H04N21/43GK102523511SQ201110353398
公开日2012年6月27日 申请日期2011年11月9日 优先权日2011年11月9日
发明者刘剑波, 张宜春, 杨成, 王欢, 田佳音, 陈洁超, 陈萌 申请人:中国传媒大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1