基于上下文的推荐系统的制作方法

文档序号:6596035阅读:271来源:国知局
专利名称:基于上下文的推荐系统的制作方法
技术领域
本发明涉及向用户推荐产品或服务的系统、方法、和计算机程序产品。
背景技术
在当今的信息社会里,知识正在以前所未有的惊人步伐从个体阶段步入团体层面。信息——数字时代的珍贵原料从未如此容易地通过互联网获得、处理和传播。然而,随着数量巨大的信息呈现在用户面前,当用户需要时,以更好地满足他们要求的方式找出他们想要的东西的难度迅速增大。推荐系统通过使用对特定对象或项目的评估对那个对象或项目作出推荐。它们被作为基于计算机的智能系统引入,以应付信息和产品过量的问题。推荐系统的两个基本实体是用户和项目。用户是利用向他提供有关各种项目的意见的推荐系统和从推荐系统接收有关新项目的推荐的人员。通常,推荐系统的目的是生成有关新项目的建议或预测特定项目对特殊用户的实用性。推荐系统的输出可以是,例如,预测或推荐。 将预测表达成代表特定项目的预期意见的数值。可以将推荐表达成预料活跃用户最喜欢的项目列表。文件和用户简介可以用关键词向量或列表来表示以便于比较和学习。如今,人们花费在看电视(TV)上的时间越来越少,而花费在浏览互联网上的时间越来越多。以传统方式广播和在TV上观看的视频内容现在越来越普遍地可从互联网上获得。同时,新的电视机和机顶盒使互联网内容可经由电视机访问。此外,已经提出了使用户能够使用遥控器和他们的电视机访问互联网服务和浏览互联网的能上网 (internet-enabled)电视机。硬盘驱动器和数字视频压缩技术提供了时移电视直播和不必担心磁带或其它移动记录媒体的可用性地高质量记录大量电视节目的可能性。同时,视听信号的数字化使普通用户的内容源的数量成倍增加。使用例如简单抛物面天线和数字接收器就可获得数以百计的频道。每天在互联网上触及各种服务地发布成千上万个视频片段,且所有主要内容制作商都已经使它们的整个内容库可在线获得。每天广播和可获得数千个可能感兴趣的节目,并且可以将它们记录和存储在本地以便于以后访问。但是,虽然为普通用户提供的内容极大地增加了,但消耗在可用内容上的时间已经成为限制参数。因此,根据用户需要和偏爱筛选出特定信息和选择个别内容已经成为重要课题。推荐系统可以通过例如估计某个用户对某个项目的喜欢程度,并自动排序内容项来解决这些问题。这可以通过将内容项的特点或特征与用户简介或用户设置相比较来完成。因此,可以将推荐系统看作筛选出引起用户注意的用户特定内容的工具或机构。但是,在许多情况下,来自不同媒体或服务的内容是分开处理的,从而将推荐系统的用户引向既耗费时间又负载加重的操作。举一个例子来说,互联网浏览通常使用互联网浏览器来完成,而TV接收器具有它们自己的传统界面。可编程录像机(PVR)可以经由显示在TV上的电子节目指南(EPG)或经由网页来控制。EPG是按照例如欧洲电信标准协会 (ETSI)的EN 300707vl.2. 1标准规定的。EPG可以是存储在产品中和用户经由屏幕菜单等访问的数据库。EPG的值将符合用户观看判据的大多数感兴趣节目告知用户。现在,用户可以看看在接着的几天内是否可获得和在什么频道上可获得他选择的节目。或者,用户可以通过将信息提供者与节目数据相联系的评价而选择要被告知的最佳节目。可以包括像节目的语言、它的副标题和不适合孩子观看的节目的音频描述或指示那样的类似属性。因此,通过将数据作为数据库存储在电视机或录像机中,将呈现或显示信息的方式与发送数据的方式分开,允许观众按照他的偏爱有选择地存储信息,使用预定刷新序列以便使大多数关键信息总是可用,以及使用最终产品中的存储设备以便观众即时访问有关可用节目的信息和网络运营商可以减小最佳性能所需的带宽,EPG提供了观众选择想观看的节目所需的功能, 并且提供了将这个信息传送到电视机或录像机的便捷途径。已经为内容用户(例如,观众)建议了个人用户平台作为构建他们自己的个人 (TV)简介(例如,在“真正”频道旁边的个人TV频道)的选项。这可以用几种方式实现。 按照第一种选项,可以使用“种子”节目。在观看节目(例如,BBC新闻)的同时,用户可以通过在EPG中创建由特定内容(例如,BBC新闻广播)和有关其它相关新闻内容的建议组成的个人频道(叫做,例如,“我的新闻”),创建或修改个人(TV)简介。这些建议可以基于过去观看选择的评价,包括用户对系统认为相关的内容所投的赞成和反对票。按照第二种选项,用户可以通过输入特定特点创建他们自己所希望的个人(TV)简介(例如,个人频道简介),和系统可以按照观众的选择和偏爱再次“学习”如何细调这个新个人(TV)简介内容。 按照第三种选项,用户可以简单地下载别人已经创建好的个人(TV)简介(例如,个人频道简介)。我们的想法是,最终可以提供充满这样观众可以相互推荐的简介的网站。但是,上述互联网浏览与TV服务的分离导致在浏览互联网、阅读博客、阅读在线新闻、访问社交网站上朋友的页面时,用户可能会偶然碰到与TV节目或电影有关的信息。 如果该信息是令人感兴趣的,应该按照新获得信息改变个人TV简介,或应该将个人TV或 PVR编程成记录与用户在互联网上找到的东西有关的节目或电影。这导致了经由电视机的用户界面进行相当多的和耗时的操作。在一些情况下,这样的延迟可能是不恰当的,并且可能妨碍TV节目或电影或经由互联网浏览器检测到的其它内容项的及时记录。

发明内容
本发明的目的是提供能够快速和可靠修改为用户推荐的内容项的推荐系统。这个目的是通过如权利要求1所要求的系统、如权利要求17所要求的方法和如权利要求18所要求的计算机程序产品实现的。按照本发明,提供了第一提取器,它适用于将第一特征提取算法应用在内容项上, 从而提取表征运行在特定装置上的第一应用程序处理的输入数据的内容的第一特征。另外,还提供了第二提取器,它适用于将第二特征提取算法应用于运行在特定装置或系统的另一个装置上的第二应用程序的数据库的内容,从而提取表征第二应用程序的数据库的内容的第二特征。比较器可操作地与第一提取器和第二提取器连接,并适用于比较第一和第二特征,从而识别用于推荐的匹配项。于是,提供了当通过比较器检测到或识别出与第一应用程序的处理数据的匹配项时自动或响应性地访问第二应用程序的设置(像,例如,个人电视设置等那样)的便捷方式。可以将可以通过特定内容表征的任何类型的输入数据与可以包含可以作出推荐的任何类型产品和/或服务的第二应用程序的数据库的内容相比较。因此,可以没有明显延迟和中断其它应用程序或过程地提供推荐和随后修改进程。按照第一方面,可以提供由第一应用程序触发以便激活第二应用程序的切换功能或切换进程。这个切换进程保证了推荐和随后修改进程无缝地和自动地启动,以便使处理延迟最小。按照可以与第一方面结合的第二方面,所述第一应用程序可以包含互联网浏览器,和输入数据可以包含从互联网下载的内容信息。在一种特定实现中,内容信息可以包含超文本标记语言(HTML)文档。这样的基于浏览器应用程序提供了在用户的浏览或冲浪活动期间可以提供第二应用程序的推荐的优点,其中可以突出显示特定内容项以便将有关推荐选项告知用户。按照可以与上述第一和第二方面的至少一个方面结合的第三方面,所述第二应用程序的数据库可以包含电子节目指南信息。这里,在第一应用程序中一检测到电视相关信息,就可以在输入数据的处理期间向用户推荐电视访问。按照可以与上述第一至第三方面的任何一个方面结合的第四方面,所述第二应用程序的数据库可以是电影数据库。与上述第三方面类似,如果有的话,可以推荐与经过第一应用程序处理的输入数据有关的电影数据库当中的电影。按照可以与上述第一至第四方面的任何一个方面结合的第五方面,所述第一提取器可以适用于检测输入数据的内容与电视节目有关还是与现有电影或电视作品有关。因此,经过第一应用程序处理的输入数据中的相应项目可以用于触发到第二应用程序的切换或切换进程,或为了推荐给用户,可以突出显示出来供用户选择,然后用户单独激活切换进程。按照可以与上述第一至第五方面的任何一个方面结合的第六方面,所述第一和第二特征提取算法可以适用于从输入数据中除去标记和无用词的至少一种。从而,可以从输入数据中剥离与输入数据的任何内容无关或不指示输入数据的任何内容的信息。按照可以与上述第一至第六方面的任何一个方面结合的第七方面,所述比较器可以适用于根据第一和第二特征之间的重叠量识别匹配项。这种措施提供了可以预定决定足够相似度或匹配度所需的预定重叠量的优点。按照可以与上述第一至第七方面的任何一个方面结合的第八方面,所述第一和第二特征可以包含检索词频率逆文档频率值的向量(vectors of term frequency inverse document frequency value)。这种手段保证捕获到输入数据的词汇、文本文档和特定类别之间的相关性。按照可以与上述第一至第八方面的任何一个方面结合的第九方面,所述比较器可以适用于应用词干抽取过程(word stemmer)、近似字符串匹配过程、和计算n-gram的过程的至少一种。从而,可以提供优化所述第一和第二特征之间的比较的可替代或另外算法。按照可以与上述第一至第九方面的任何一个方面结合的第十方面,所述第一提取器可以包含网页文本的自动关键词标识器,其中将关键词标记成用于做个人电视频道的种子。因此,可以实现消费者根据所浏览网页获取电视内容的简单方式。按照可以与上述第一至第十方面的任何一个方面结合的第十一方面,所述第二特征可以包含设置在数据库中的元数据。在一个特例中,所述比较器可以适用于将不同权重应用于所述元数据。这种措施提供了可以将关键词等的列表与内容项相联系,从而可以减少或防止生成关键词的附加处理的优点。按照可以与上述第一至第十一方面的任何一个方面结合的第十二方面,所述第二特征可以包含即时电视节目点播(TV-Anytime)功能的内容引用标识符(CRID)。从而,可以提供内容引用,以便允许内容的地点无关引用。按照可以与上述第一至第十二方面的任何一个方面结合的第十三方面,可以为显示匹配项和提供选择匹配项的输入功能提供用户界面。因此,可以向用户提供选择或记录匹配项的选项。注意,上述推荐系统可以根据含有分立硬件部件的至少一个分立硬件电路、至少一个集成芯片、一排芯片模块、或受存储在存储器中的软件例程或程序控制的至少一个信号处理设备或计算机设备或芯片来实现。


现在参考附图,根据本发明的实施例举例描述本发明,在附图中图1示出了按照第一实施例的能上网电视机的示意性方块图;以及图2示出了各个实施例所涉及的处理步骤的示意图流程图。
具体实施例方式现在根据带有基于个人电视的推荐技术的示范性能上网电视机描述本发明的实施例。图1示出了按照第一实施例的能上网电视机的示意性方块图。该电视机包含可以施加浏览器(B) 20和TV接收器(TV) 40的输出信号以便显示在屏幕上的显示单元或模块 10。TV接收器40经由可以是抛物面卫星天线的天线60接收输入信号。浏览器20与互联网50连接,以便访问互联网内容(网页)或下载其它内容信息。浏览器20可以通过用户界面(UI)22控制,用户界面(UI) 22可以包含键盘、指针设备、触摸板等。另外,TV接收器 40可以与可编程录像机(PVR)42连接,可编程录像机(PVR)42可以经由可以例如根据广播或互联网信息更新的存储在数据库32中的电子节目指南(EPG)来控制。另外,还提供了根据指示电视机的至少一个用户的偏爱的用户简介表46推荐EPG 32当中的节目信息的推荐单元48。另外,提供了分析浏览器20处理的输入数据以便提取表征经过处理输入数据的内容的特征(例如,关键词等)的确定单元或模块30。确定单元30还访问数据库32,以便分析数据库的内容和提取表征可用节目数据的内容的特征。根据所提取特征之间的所确定匹配,确定单元30控制可编程录像机42和/或用户简介表46提供对与在浏览器20上处理的输入数据有关的TV节目或作品的访问。更新的用户简介表46影响或控制推荐单元48, 从而推荐的TV节目可以适用于被浏览的互联网内容。在一个特定实现例子中,确定单元30可以配置成识别与TV节目或电影作品有关的数据项,并且在显示单元10的屏幕上突出显示或标记这些数据项。然后,用户可以使用用户界面22激活或切换到确定单元30上的匹配过程。在上述实施例中,确定单元30可以实现成例如互联网浏览器20的插件,用于分析例如HTML元素(例如,标题、链接、段落、表格单元格等),和自动检测HTML文档中的内容与即将播放的TV节目有关还是与现有电影/TV作品有关。在这种情况下,向用户提供了通过使用用户界面22简单地选择上下文相关菜单等上的选项访问他个人的TV设置的便捷方式 (上下文相关菜单可以例如当在突出显示的HTML元素上进行鼠标右击时出现)。可以向用户提供例如将即将播放的TV节目加入他的个人TV频道之一中,或通过评价相关内容(例如,“喜欢”/ “不喜欢”)更新他的简介。按照第一实施例,当用户正在使用浏览器20浏览互联网时,他可能阅读到有关某个话题或个人的在线新闻文章。确定单元30自动地或响应正在运行浏览器应用程序的激活而分析数据库32中的EPG的文本和内容,并自动检测在特定TV频道上,在晚上晚些时候是否安排了具有有关该话题或个人的信息的TV节目来播放。于是,确定单元30控制浏览器20显示指示已经在数据库32的EPG中找到相关TV节目的图标。另外,该系统可以显示有关相关TV节目的信息(例如,元数据)。现在,用户可以点击或激活该图标,和浏览器20可以指示与用户当前正在阅读的网页有关的所检索TV节目。用户现在可以选择将所检索TV节目加入设置在他的用户简介表46中的个人新闻频道中的选项。按照第二实施例,确定单元30访问的数据库32可以包含电影信息。当用户正在浏览互联网,例如,正在阅读有关特定电影的重拍的博客条目时,确定单元30(例如,浏览器插件)自动地或响应正在运行浏览器应用程序的激活而分析电影数据库的文本和内容, 并自动检测与该电影相联系的人物是否出现在各种TV和电影作品的元数据中。另外,出现在博客条目中的以上电影的标题词组也可以出现在电影数据库中。于是,确定单元30控制浏览器20显示指示已经找到相关电影/TV信息的图标。用户现在可以经由用户界面22点击或激活该图标,并且拥有通过评价所识别人物和所识别电影(例如,“喜欢”/ “不喜欢”) 更新用户简介表46中他的个人TV简介的选项。注意,结合图1所述的单元或模块可以实现成分立硬件电路或功能,或实现成控制处理器或计算设备(例如,中央处理单元(CPU)、PC、服务器等)的软件例程。图2示出了按照上述第一和第二实施例的基于上下文推荐过程的的示意图流程图。注意,本发明不局限于TV/电影作品或TV节目的推荐,而是可以为任何可推荐产品和服务实现。举一个例子来说,上述浏览器应用程序和TV应用程序(例如,TV/DVR)可以适用于运行在经由网络(例如,互联网)连接的不同物理系统上。在更具体的例子中,互联网浏览器可以用在与机顶盒应用程序(例如,DVR)通信的移动电话上。一般说来,该系统和过程含有可以是经过运行在处理系统上的相应应用程序处理 (例如,装入浏览器20中和在浏览器20中得到处理)的任何文字文档(例如,HTML文档) 的输入数据、和来自可用服务和/或产品(例如,EPG或电影数据)的数据库(DB)的另一种输入数据。如上所述,推荐系统可以通过浏览器20的插件或直接访问装载和显示在浏览器中的数据的任何其它例程或电路来控制。在图2的过程的步骤S200中,通过特征提取算法分析经过处理的输入数据(例如,HTML文档),以提取表征其内容的(文字)特征。任何内容分析和特征提取算法都可以用于此目的。举一个例子来说,首先可以从输入数据中剥离它的语言标记(例如,HTML文本),然后可以除去无用词。无用词是特定语言中像代词、冠词那样不代表特定文档的频繁使用词汇,以及像助动词那样的频繁使用动词。就英语而言,无用词的进一步例子是 “about”、“actually”、“because”、“could”、“did”、“either”、“for”、“got”、“have,,、 “into”、“just”、“knoWn”、“less”、“me”、“not”、“of”、“put”、“rather”、“she”、“that,,、 “11壯1”、“%巧”、 狀”、和“7011”等。然后,可以将文档中的其余词汇用作代表该文档的特征。也可以使用像描述在例如D. Munteanu等人的文章《文本文档推荐系统中的分类过禾呈〉〉(D. Munteanu et al. “ Classification Process in a Text Document Recommender System" ),The Annals of" Dunarea D.Jos" University of Galatz,ISSN 1221-454X, 2005中那样的其它分类算法,或在本文件或其它地方引用的参考文献中提到的其它算法。类似地,在步骤SlOO中,以相似方式处理数据库(例如,EPG或电影数据)的内容。如图2中的虚线箭头所指,步骤S100的处理可选地可以通过步骤S200的过程激活,例如,当步骤S200的分析开始时或当已经检测到输入数据的预定类型或内容时。然后,汇总标题、风格、描述和其它元数据,以创建内容(例如,TV节目或电影)的文字描述。可以将文字描述视作单独文档地处理它们。然后,可以通过关键词的列表表示每个所提取或所剥离项目。然后,在比较步骤S300中比较在步骤S100和S200中提取的特征或项目以寻找匹配。例如,当在步骤S100和S200中提取的特征之间存在足够大重叠时,可以认为找到匹配。 也可以使用其它类型的特征和计算匹配的其它方式,并应该认为这些都在本发明的范围之内。例如,取代将简单的数组提取项目(例如,关键词等)用于代表文档和数据库项目,也可以使用检索词频率逆文档频率(TFIDF)值的向量。这样用于文本分类的TFIDF描述在,例如,张某等人的文章《用于文本分类的改进TF-IDF手段》(Slang et al. , ‘‘ An improved TF-IDF approach for text classification " ), Journal of Zhejiang University SCIENCE, ISSN 1009-3095 中。另外,可以通过使用词库(或本体)将同义词和相关术语包括进来丰富该组提取项目(例如,关键词)。另外或可替代地,为了方便匹配过程,可以使用像描述在,例如, S. Abdou等人的文章《用于基因组任务的词根评估、询问扩展和人工索引手段》(S. Abdou et al. , “ Evaluation of Stemming, Query Expansion and Manual Indexing Approaches for the Genomic Task" ,TREC-2005)中的那些那样的词干抽取过程将所提取项目(例如, 关键词列表或特征组)中的项目缩减成它们的词干。可替代地,除了在比较步骤S300中进行严格字符串匹配之外,也可以使用像描述在,例如,US 5,467,425或W. Litwin等人的文章《使用累积代数符号差的模式匹配和 n-gram 取样》(W. Litwin et al. , “ Pattern Matching Using Cumulative Algebraic Signatures and η-gram Sampling",2006)中的那样,基于自然语言处理的概率模型的近似字符串匹配或所谓“n-gram”的计算。在寻找步骤S100和S200的所提取项目或特征之间的匹配时,取决于从数据库中检索的数据的结构,也可以使用一些元数据。例如,在EPG数据库的情况下,可以通过数据库提供与一个项目相联系的关键词的列表,以便可以省略在步骤S100中生成附加关键词。 或者,可替代地,可以将从数据库32的内容中提取的关键词、特征或项目加入从已经列在数据库32中的元数据中导出的关键词中。作为一个附加选项,在进行匹配时不同元数据可以具有不同权重。例如,从节目的标题中提取的关键词可以具有比从梗概中提取的关键词
高的权重。当在步骤S300中发现匹配时,在步骤S320中提取匹配项,并且可以在步骤S330 中通知用户以便提供控制访问。这可以使用图形手段来实现(例如,显示图标,突出显示文档中已经发现匹配的文本或段落)。可替代地,系统可以不干扰用户,只有当用户在用户界面22上选择特定选项时才显示匹配结果,因此,步骤S330可以是一个可选步骤。在推荐TV节目或电影的情况下,控制访问可以向用户提供记录EPG项目、将其加入他的个人频道之一中、或评价它(例如,选择“喜欢”或“不喜欢”)的选项。然后,确定单元30可以相应地访问可编程录像机42或用户简介表46,以便开始修改内容(步骤S340)。在上述第二实施例的电影数据库情况下,可以使用与显示在图2中的那个相似的过程,差异在于,当在步骤S300中发现匹配时,如果已经发现与EPG 32的附加匹配,则只能给出在可编程录像机42上安排记录的选项。注意,本发明不局限于HTML文档或互联网内容,也可以应用于任何类型的输入数据,例如,数字文字文档。此外,本发明可以应用于机顶盒、电视机、移动电话、个人数字助理 (PDA)、个人计算机(PC)和含有互联网浏览器的所有设备。另外,本发明可以应用于使用推荐从多种来源(例如,网络电视)中收集、筛选、和向它们的用户呈现内容的服务。因此,本发明也不局限于TV/电影内容的推荐,也可以应用于音乐、话剧、图书、和可以作出推荐的所有类型产品和服务。作为上述实施例的特定应用,可以使用即时电视节目点播(TVA)系统的TVA功能。 这里,内容引用标识符(CRID)允许内容的地点无关引用。它可以由也具有将CRID转化成地点的能力的权威机构指定。CRID可以指向单个内容或一系列其它CRID。它可以实现成指向可以通过注册互联网域名识别的权威机构分配的数据或内容的统一资源标识符(URI)。 从而,可以提供分配内容的简单机制。总之,本发明涉及包含第一提取器和第二提取器的推荐系统和方法,第一提取器应用第一特征提取算法提取表征运行在系统上的第一应用程序(例如,互联网浏览器)处理的输入数据(例如,网页、电子文档等)的内容的第一特征,而第二提取器应用第二特征提取算法提取表征运行在系统上的第二应用程序(例如,个人TV或电影访问程序)的数据库的内容的第二特征。另外,还提供了比较第一和第二特征以便识别用于推荐的匹配项的比较器。虽然在附图和上面的描述中详细例示和描述了本发明,但这样的例示和描述应该被认为是例示性的或示范性的,而不是限制性的。本发明不局限于所公开的实施例。通过阅读本公开,其它修改对于本领域的普通技术人员来说是显而易见的。这样的修改可能涉及在技术上已知的和可以用于取代本文已述的特征或除了本文已述的特征之外还可以使用的其它特征。本领域的普通技术人员可以通过研究附图、本公开和所附权利要求书了解和实现所公开实施例的变种。在权利要求书中,词汇“包含”并不排除其它元件或步骤,和不定冠词“一个”或“一种”也不排除多个元件或步骤。单个处理器或其它单元可以根据相应软件例程至少完成图2的功能。计算机程序可以存储/分布在像与其它硬件一起或作为其它硬件的一部分供应的光存储媒体或固态媒体那样的适当媒体上,但也可以像经过互联网或其它有线或无线远程通信系统那样,以其它形式分配。某些措施被阐述在相互不同从属权利要求中的仅有事实并不指示不能使用这些措施的组合获益。权利要求书中的任何标号都不应该理解为限制本发明的范围。
权利要求
1.一种为至少一个内容项作出推荐的系统,所述系统包含a)第一提取器(S200),用于应用第一特征提取算法提取表征运行在所述系统上的第一应用程序处理的输入数据的内容的第一特征;b)第二提取器(S100),用于应用第二特征提取算法提取表征运行在所述系统上的第二应用程序的数据库(3 的内容的第二特征;c)比较器(S300),用于比较所述第一和第二特征,以便识别用于所述推荐的匹配项,d)其中,所述第一提取器(S200)适用于检测所述输入数据的所述内容与电视节目有关还是与现有电影或电视作品有关。
2.按照权利要求1所述的系统,进一步包含由第一应用程序触发以便激活第二应用程序的切换功能。
3.按照权利要求1所述的系统,其中所述第一应用程序包含互联网浏览器(20),和所述输入数据包含从互联网下载的内容信息。
4.按照权利要求3所述的系统,其中所述内容信息包含HTML文档。
5.按照权利要求1所述的系统,其中所述第二应用程序的所述数据库(32)包含电子节目指南信息。
6.按照权利要求1所述的系统,其中所述第二应用程序的所述数据库(32)是电影数据库。
7.按照权利要求1所述的系统,其中所述第一和第二特征提取算法适用于从所述输入数据中除去标记和无用词的至少一种。
8.按照权利要求1所述的系统,其中所述比较器(S300)适用于根据所述第一和第二特征之间的重叠量识别匹配项。
9.按照权利要求1所述的系统,其中所述第一和第二特征包含检索词频率逆文档频率值的向量。
10.按照权利要求1所述的系统,其中所述比较器适用于应用词干抽取过程、近似字符串匹配过程、和计算n-gram的过程的至少一种。
11.按照权利要求1所述的系统,其中所述第一提取器(S200)包含网页文本的自动关键词标识器,和其中将关键词标记成用于做个人电视频道的种子。
12.按照权利要求1所述的系统,其中所述第二特征包含设置在所述数据库(3 中的元数据。
13.按照权利要求12所述的系统,其中所述比较器(S300)适用于将不同权重应用于所述元数据。
14.按照权利要求1所述的系统,其中所述第二特征包含即时电视节目点播功能的内容引用标识符。
15.按照权利要求1所述的系统,进一步包含提供选择所述匹配项的输入功能的用户界面(22)。
16.一种为至少一个内容项作出推荐的方法,所述方法包含a)应用第一特征提取算法提取表征第一数据处理应用程序处理的输入数据的内容的第一特征;b)应用第二特征提取算法提取表征第二数据处理应用程序的数据库的内容的第二特征;c)比较所述第一和第二特征,以便识别用于所述推荐的匹配项,d)其中,所述第一提取器(S200)适用于检测所述输入数据的所述内容与电视节目有关还是与现有电影或电视作品有关。
17. 一种包含当运行在计算设备上时形成按照权利要求16所述的步骤的代码模块的计算机程序产品。
全文摘要
本发明涉及一种推荐系统和方法,其包含第一提取器(S200),用于应用第一特征提取算法提取表征运行在所述系统上的第一应用程序(例如,互联网浏览器)处理的输入数据(例如,网页)的内容的第一特征;以及第二提取器(S100),用于应用第二特征提取算法提取表征运行在所述系统上的第二应用程序(例如,个人TV或电影访问程序)的数据库的内容的第二特征。另外,还提供了比较所述第一和第二特征以便识别用于推荐的匹配项的比较器(S300)。
文档编号G06F17/30GK102265276SQ200980152202
公开日2011年11月30日 申请日期2009年12月15日 优先权日2008年12月23日
发明者M.巴比里, S.P.P.普龙克 申请人:阿克塞尔斯普林格数字电视指导有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1