用于控制推荐器系统的装置、方法和计算机可读存储介质与流程

文档序号:13453614阅读:124来源:国知局
本申请是申请日为2009年12月15日、申请号为200980151799.1、发明名称为“用于推荐器系统的自适应隐式学习”的发明专利申请的分案申请。本发明涉及一种用于针对至少一个内容项目隐式地控制推荐器系统的装置、方法和计算机程序产品。
背景技术
:推荐器技术的使用正在被稳定地引入到市场中。在各种示例中,网站提供推荐器以支持用户发现他们喜欢的内容项目(例如,电影),以及电子设备(例如,个人视频记录器)使用推荐器来自动过滤内容项目。推荐器系统被越来越多地应用以通过基于来自用户对所选内容项目(例如,书、歌曲、电视(tv)节目、电影等)的反馈学习用户简档来个性化或个人化服务和产品,并且使用机器学习技术来推断新项目的评级(rating)。推荐器典型地基于用户对项目提供的评级来学习用户的偏好。这些评级典型地是二元分类,分别诸如“喜欢”和“不喜欢”,或者基于喜欢程度的范围的更精细的分类。同样,用户评级提供接口,用户通过该接口向推荐器教授其偏好。从在推荐器能够做出明智的建议之前用户不得不对相当大量的项目进行评级的意义来说,这一学习过程是单调乏味的。推荐器系统典型地需要来自用户的反馈以学习用户的口味。这一反馈可以显式地(explicitly)或隐式地(implicitly)提供。显式反馈包括用户对多个项目提供评级,即在五分量表上或以二元的喜欢/不喜欢的形式对多个项目提供评级。隐式反馈来自观察用户动作,诸如购买、下载、选择项目用于重放或删除等。用户动作随后被推荐器系统解释并被变换成评分。例如,典型地,推荐器系统将购买动作解释为正分数,或者在视频项目的情况下,多于/少于50%的总观看持续时间可以意味着正/负分数。贯穿下文,将区别由用户对内容项目给出的“评级(rating)”和由推荐器系统生成的“分数(score)”或“评分(scoring)”。通常使用的技术是协作过滤和朴素贝叶斯分类。由此,从大量的内容项目中只能检索到用户(或用户组)喜欢或者偏好的那些项目。典型地,作为单机服务或单元、或者作为对于现有服务或单元的附件来提供推荐器。它们越来越多地出现在例如电视机或视频记录器的消费设备中。因此,隐式学习使得用户不必显式地对项目进行评级。但是,其典型地是比较不可靠的,因为难以以标准方式解释用户动作。用户可能以难以用固定模型解释的许多不同方式表现。此外,用户行为可能随着时间而发展,使得解释他的/她的动作甚至更加困难。技术实现要素:本发明的目的是提供改进的隐式学习方法和装置,通过所述方法和装置,隐式学习可以个别地适应于每个用户从而反映用户行为的改变。这一目的是通过用于控制推荐器系统的装置、、方法和计算机可读存储介质实现的。根据本发明的用于控制推荐器系统的装置包括:a)记录器(s100),用于对于由用户接口控制的至少一个内容项目检测和记录用户接口动作;b)计算器(s200,s300),用于基于记录的用户接口动作计算表征该内容项目的使用的数字或种类值,以及用于从所述数字或种类值和从对于所述内容项目的显式的用户评级确定对评级历史的贡献;和c)转换器(s400),用于将所述评级历史转换为用户接口简档,该用户接口简档被提供至推荐器(s500)以便对新内容项目进行评级;d)其中所述推荐器(s500)的输出被用作用于所述推荐器系统的隐式评级历史(s600)。根据本发明的控制推荐器系统的方法包括:a)对于由用户接口控制的至少一个内容项目记录用户接口动作;b)基于记录的用户接口动作计算表征内容项目的使用的数字或种类值;c)从所述数字或种类值和从对于所述内容项目的显式的用户评级确定对评级历史的贡献;和d)将所述评级历史转换为用于所述内容项目的用户接口简档,该用户接口简档被提供至推荐器以便对新内容项目进行评级;和e)将所述推荐器的输出用作用于所述推荐器系统的隐式评级历史。根据本发明的计算机可读存储介质,其上存储有计算机程序,该程序当在计算机设备上运行时执行上述方法的步骤。因此,提出的学习方法提供如何将对内容项目的用户动作变换为关于这些项目的评分的显式学习。在用户接口处的用户动作与被评级的内容项目相关联,并且所识别和记录的用户接口动作被作为属于这些内容项目的元数据。由此,可以提供个别地适应于每个用户并且能够随着时间而发展以反映改变的用户行为的隐式学习形式。尽管仍然需要被显式地评级的项目,但在充分的学习之后,提出的隐式学习极大地使用户免于不得不显式地对内容项目进行评级。实际上,可以提供两种评级/评分过程:隐式评分过程和显式评级过程。评级过程可以以较慢的步速运行,有效地使用户摆脱连续对许多项目进行评级。根据第一方面,接口动作可以包括用于控制内容项目的使用的控制动作。因此,控制动作可以通过在用户接口处不同的键、或按钮的激活来确定,从而可以以简单直接的方式实现删除和记录。根据特定示例,内容项目可以包括顺序音频和/或视频信息,并且控制动作可以控制开始、停止、删除和跳过音频和/或视频信息中的至少一个。根据可以与上面的第一方面组合的第二方面,用户接口动作可以与包括所述至少一个内容项目的日期、时间和顺序次序中的至少一个的相关联的上下文信息一起记录。通过还记录这样的日期和次序信息,可以评估用户接口动作之间的历史关系。根据可以与上面的第一和第二方面中的任一个组合的第三方面,计算器可以被适配用于从内容项目的使用确定以下至少一个:内容项目的使用的部分(fraction)、内容项目的使用的数目、没有中断的使用的最长片段、内容项目的删除、激活快进控制的次数、激活重放控制的次数、激活向前跳进控制的次数、跳过内容项目的次数、内容项目的显式归档、开始和删除之间的持续时间、读取元数据所花费的时间以及对扩展的元数据的访问。假设从用户动作获得的简档对于基于所获得的表征数字或种类值对内容项目进行评级来说足够成熟,则这些表征数字或种类值提供关于用户对于内容项目的态度的良好表示,例如他/她喜欢或不喜欢这一内容项目。根据可以与上面的第一到第三方面中的任一个组合的第四方面,可以提供合成器(integrator),用于组合隐式评级历史和所提供的显式评级历史。这提供了可以通过显式评级值增强较为不可靠的隐式评分值(例如由于低使用数目)以潜在地改善推荐器系统的最终评分的优点。根据可以与上面的第一到第四方面中的任一个组合的第五方面,计算器可以被适配用于延迟用于内容项目的数字或种类值和给定的显式评级的组合,直到对于该内容项目可以获得预定数目的数字或种类值。这一延迟用来在对内容项目进行评级之前获得用于该内容项目的足够的元数据(即,用户动作),但是假定用户接口简档已经足够成熟。然而,在使用用户动作进行隐式评分和基于隐式地构建的评级历史进行评分之间可以进行区分。前者仅能用于隐式地构建评级历史,并且因此可以被延迟。后者不能被延迟。根据可以与上面的第一到第五方面中的任一个组合的第六方面,推荐器系统可以被适配为在合成推荐器中组合基于从用户接口动作获得的隐式评分历史获得的隐式简档和基于显式用户评级的显式简档。隐式和显式地构建的评级历史这样被分离地变换(translate)成两个简档。由此,由于考虑显式地获得的用户简档,可以改善合成推荐器的最终评级的可靠性。根据可以与上面的第一到第六方面中的任一个组合的第七方面,推荐器系统可以包括用于使用隐式评级历史的隐式推荐器、基于显式评级历史来控制的显式推荐器和用于组合隐式和显式推荐器的输出的组合器。与第六方面类似,显式和隐式推荐器的组合提供最终评级的潜在地改善的可靠性。根据可以与上面的第一到第七方面中的任一个组合的第八方面,其中如果推荐器指示还没有达到用户接口简档的预定可信度(confidence),则可以激活用于显式评级的输入功能。这一输入功能确保在隐式评级的可靠性不够的情况下可以获得显式用户简档。在第八方面中,推荐器可以例如基于在pronk等的“incorporatingconfidenceinanaivebayesianclassifier”,lnai3538,springer,proceedingsofthe10thinternationalconferenceonusermodeling,um’05,edinburgh,scotland,7月24-29日,317-326中描述的系统。根据第九方面,如果对于内容项目计算器检测到预定数目的记录的接口动作但是还没有获得显式评级,则可以激活用于显式评级的输入功能。这一措施确保在对于内容项目计算贡献(contribution)之前可以获得显式评级。注意,可以作为具有分立的硬件组件的分立硬件电路、作为集成芯片、作为芯片模块的布置、或者作为信号处理设备或计算机设备或者由存储在存储器中的软件例程或程序控制的芯片,来实现上述控制或推荐器装置。附图说明现在将参考附图基于实施例作为示例来描述本发明,其中:图1示出了能够在其中实现本发明的推荐器系统的示意性框图;图2示出了能够在其中实现本发明的推荐器的示意性框图;图3示出了根据第一实施例的推荐器的示意性框图;图4示出了指示包括第二和第三实施例的推荐器的替换结构的示意图。具体实施方式现在将基于示例性推荐器系统来描述本发明的实施例,所述推荐器系统对于诸如书、电视节目、电影等的内容项目生成评级和评分。图1示出了包括连接至源(s)101的信息数据贮存器103的推荐器系统的示意性框图。源101可以例如是因特网上的电子节目指南(epg)服务,其提供有关电视节目的信息数据。信息数据贮存器103可以连接到至少一个与个人化内容频道关联的过滤器(f)105。注意,可以提供任意数量的个人化内容频道。过滤器105的输出连接到相应的推荐器引擎(re)107。由此,每个个人化内容频道可以具有与其关联的自己的推荐器引擎107。每个推荐器引擎107并且因此个人化内容频道具有与其关联的简档(p)109。推荐器引擎107的输出连接到调度器(sch)111。调度器111连接到存储设备113(例如,一组硬盘驱动器),并连接到选择器(sel)115。信息数据贮存器103还连接到内容源(cs)117。内容源117以广播或点播方式提供例如至少音频/视频信息。另外,内容源117可以提供信息数据,例如在视频信号的垂直消隐间隔内的epg信息,或关于特定内容项目的片段的mpeg-7元数据(例如,电影的场景边界)。内容源117连接到选择器115,该选择器115包括至少一组内容隔离器件(例如调谐器等等),其允许隔离一个或多个内容项目用于记录在存储设备113上。选择器115的输出连接到存储设备113.现在将描述图1的装置的操作。从源(因特网)101收集要在个人化内容频道上播出的当前内容项目的信息数据、或者经由其它手段(例如经由模拟电视广播信号的垂直消隐间隔中的传送或经由数字视频广播(dvb)传输流)获得所述信息数据、或者通过上述各项中任意项的组合获得所述信息数据。该内容项目可以是电视节目、包含视频和/或音频的数据流、或者节目片段等等。信息数据可以包括与内容项目关联的多个属性和属性值,诸如题目、演员、导演和流派。每个简档109基于信息数据和指示用户的“喜欢”或“不喜欢”的数据。“喜欢”和“不喜欢”的评级可以基于对经过关联的过滤器105的内容项目的反馈。这一反馈可以由使用特定个人化内容频道的用户作为显式评级而给出。评级可以以若干方式做出。例如,用户可以使用遥控设备通过在用户接口(例如所述遥控设备)上按压适当的按钮,对于当前选择的内容项目或当前内容项目的给定属性指示他的评级(“喜欢”或“不喜欢”)。可替换地,可以观察用户的行为,从而用于所有用户的固定规则可以由对于每个用户“学习”和个人化的规则代替。在更高级的设定中,可以提供或计算离散或连续标度上的“喜欢”程度,而不仅仅是“喜欢”或“不喜欢”分类。当内容项目的信息数据经过过滤器105时,该信息数据被转送到推荐器引擎107。推荐器引擎对于该随后的内容项目基于其关联的简档109计算“喜欢”程度或评级。然后,将关联到该随后的内容项目的信息数据与所计算的评级一起转送给调度器111,调度器111随后计算记录计划表,该记录计划表将被用来调度由推荐器引擎107提供的内容项目到存储设备113上的记录。具体地,对于每个个人化的内容频道,调度器111可以主要考虑喜欢程度或评级高的内容项目,同时仍然考虑足够的新内容。为此,由调度器111计算的记录计划表被用于指示选择器115选择可以从内容源117得到的内容项目,以将他们记录在存储设备113上。用户或用户简档可以使用隐式简档建立(profiling)和显式简档建立得出。隐式简档建立方法从用户的使用历史(例如观看和未观看的电视表演的组)不引人注意地得出内容使用简档。显式简档建立方法可以通过使用户指定内容项目的等级的评级得出内容使用简档。图2示出了能够在其中实现本发明的、具有隐式和显式简档建立选项的用户接口的示意性框图。提供用户接口(ui)10,其可以例如是遥控器或用户可以控制内容项目的使用的任何其他类型的控制设备。用户接口10还可以在用户可以与之交互的显示屏(例如,触摸屏)上实现。根据图2,用户接口10与包含分别向显式和隐式推荐器110、120提供输入的基于显式和隐式的偏好简档90、100的推荐器系统关联。epg130将涉及电视表演的数据输入到推荐器110、120两者。这样的数据可以包括每个电视表演的题目、频道、开始时间和其他特征。图2的用户接口10可以用于控制基于显式和隐式的简档90、100的内容,从而控制显式和隐式推荐器110、120。根据第一实施例,提出一种方法和装置,通过所述方法和装置可以实现关于如何将对项目的用户动作变换成关于这些项目的评级或评分的显式学习。这是通过将在用户接口的用户动作与所评级的项目关联并把这些动作作为属于这些项目的元数据来完成的。由此,提供一种隐式学习形式,其个别地适应于每个用户并反映变化的用户行为。图3示出了使能提出的自适应隐式学习的控制装置的基本步骤、元件或组件的示意图。给定由用户使用的内容项目m,所述装置或系统记录诸如开始(例如播放)、停止、删除、跳过的所有用户接口动作和诸如一天中的时间、一周中的天、先前访问过的项目等的上下文信息(组件s100)。这些用户动作然后被变换成用户接口(ui)特征。ui特征表征特定内容项目的使用或使用方式,并且必须被适当地设计以获得用户交互的丰富度但是是从细节中提取的。例如,计算器可以计算内容项目的使用的部分(例如,所观看的节目的部分)作为ui特征,而不是使用开始和停止时间戳。在组件s200中计算的ui特征的示例为:●内容项目的使用(例如,播放)的部分●使用的数目(numberofuses)(例如,观看的数目)●没有中断的使用的最长片段(例如,没有中断地观看的最长片段)●用户显式地删除的内容项目(例如,节目)●使用快进的次数●使用重放的次数●使用向前跳进的次数●跳过内容项目(例如,节目)的次数●内容项目是否被用户显式地归档●开始(例如,播放)和删除之间的持续时间●读取元数据花费的持续时间●访问扩展的元数据将计算的ui特征值与内容项目m关联并存储。计算的ui特征值可以取决于用户动作随着时间而累积。可选地,如果用户对于相关内容项目提供显式评级(组件s250),该评级可以在组件s300中与和同一内容项目关联的ui特征值组合。作为更进一步的选项目,隐式评分和显式评级之间的这一关联可以不是瞬时的,而是可以被延迟直到对于相关内容项目已经计算了或可获得足够的隐式ui特征值,例如不在相关内容项目被删除(或归档)之前,或不在在用户接口处的某一固定数目的用户动作已经被施加到相关内容项目之前。足够的隐式ui特征可以对应于预定数目,该预定数目可以是固定的或可以取决于内容项目的类型。组件s300中的组合的输出可以被称为ui特征评级历史。这样的评级历史的示例在下面的表1中给出。表1:部分ui特征评级历史的示例项目id(ui特征,值)评级1(观看的部分,0.6-0.7)喜欢1(读取元数据的时间,3-4分钟)喜欢2(观看的部分,0.1-0.2)不喜欢………然后,在组件s400,获得的ui特征评级历史被变换成适合于基于ui特征的推荐器的ui特征简档。诸如朴素贝叶斯分类、决策树、支持向量机、神经网络等任何已知的机器学习算法可以被用于实现基于ui特征的推荐器。例如,在朴素贝叶斯分类器的情形中,在组件s400中计算的ui特征简档可以如在下面的表2中所举例说明地表示。表2:部分ui特征简档的示例ui特征u1值喜欢计数不喜欢计数观看的部分0.6-0.7203观看的部分0.1-0.2124读取元数据的时间3-4分钟165…………注意,尽管图3中仅示出了一个项目m,但是在ui特征评级历史中累积多个具有ui特征和显式评级的那些项目。然后,每当可以获得新的内容项目并且用户将足够数目的ui动作施加到这一内容项目时,在组件s500中执行实际的隐式学习。基于从这一内容项目提取的ui特征和ui特征简档,推荐器可以计算基于ui特征的这一新内容项目的评分。由此,对于要被要被评分的每个新项目,记录的用户动作(在组件s100中获得)和得出的ui特征(在组件s200中获得)是必需的。最后,获得的评分在组件s600中被添加到存储的隐式评级历史。由此,可以为推荐器系统提供自适应隐式学习方案。图4示出了可以在其中使用上面的隐式评级历史的、具有隐式和显式推荐器的推荐器系统的示意性方框图。根据图4的图的上部的行或分支,从图3的组件s250的显式评级历史和图3的组件s600的隐式评级历史生成合成的评级历史。基于从组件s310获得的合成的评级历史,在组件s410中生成合成的简档,并将其提供到组件s510中的推荐器,在其中基于合成的简档和新内容项目的数据获得对于新内容项目n的评级。作为根据对应于图4的中部分支或行的第二实施例的替换,显式和隐式评级历史s250,s600可以分离地用于在组件s420中生成显式简档和在组件s440中生成隐式简档,所述显式简档和隐式简档两者输入到合成推荐器(组件s520)以获得对于新内容项目n的评级。由此,基于两个评级历史建立两个分离的简档,并且这些分离的简档在单个合成推荐器中被组合。这种单个合成推荐器在例如v.pronk等的“incorporatingusercontrolintorecommendersystemsbasedonbayesianclassification”proc.acmrecommendersystems,recsys’07,minneapolis,mn,usa,10月19-20日中描述。作为根据对应于图2的下部分支或行的第三实施例的另一替换,在组件s420、s440中生成的显式和隐式简档可以被提供到分离的显式和隐式推荐器(组件s540、s560),并且随后在组合器(组件s620)中被组合以获得对于新内容项目n的评级。由此,在第三实施例中提供分离的隐式推荐器,其仅使用隐式评级历史。该推荐器(组件s560)和显式推荐器(组件s540)的输出可以被以各种方式组合,例如通过使用径向基函数组合以建立函数近似。作为对于所有上面的实施例的另一选项,推荐器系统可以适配为如果隐式推荐器不能基于提供的ui特征产生具有足够的可信度的评分和/或如果(例如,通过图3中的组件s300)检测到对于内容项目已经获得了预定(足够)数目的记录的接口动作但是没有获得显式评级,则启动输入动作(例如,与用户对话或输入请求等)以恳求用户的显式评级。因此,所需要的可信度可以取决于对于相关内容项目获得的ui特征值的数目或取决于ui特征简档的成熟度。获得的显式评级然后可以添加到显式评级历史并与低可信度评分组合,或者不考虑任何隐式评级而使用。注意,本发明可以应用于用于机顶盒、电视机、移动电话、个人数字助理(pda)、个人计算机(pc)以及其中推荐器被用于从多个源向它们的用户收集、过滤和呈现内容的所有设备的推荐器系统。另外,其可以应用在服务器上或由因特网或任何其他数据网络上的服务应用。因此本发明不限于电视或电影内容的推荐器,而是可以应用于音乐、戏剧表演和可以对于推荐器获得使用数据或用户动作数据的所有类型的产品和服务。总之,已经描述了用于控制推荐器系统的装置、方法和计算机程序产品,其中对内容项目的用户动作与对这些内容项目的显式评级相关联,并被变换成随后由推荐器使用的ui特征简档。该推荐器基于对该项目的用户动作对新项目进行评级,并由此创建隐式地学习的评级历史。该学习使得隐式评级或评分被个人化。其可以以若干方式与显式地学习的评级历史相结合,以改善整体性能和/或通过使用户显式地对较少的项目进行评级而减轻他/她的负担。虽然已经在附图和前面的描述中详细说明和描述了本发明,但这样的说明和描述应当被认为是说明性的或示例性的而不是限制性的。本发明不限于公开的实施例。通过阅读本公开,其他修改对于本领域技术人员也将是显而易见的。这样的修改可以涉及本领域中已知并且可以代替或附加于此处已经描述的特征而使用的其他特征。本领域技术人员从对附图、本公开和附加的权利要求的学习可以理解和实现公开的实施例的变型。在权利要求中,词语“包括(comprising)”不排除其他元件或步骤,不定冠词“a(一个)”或“an(一个)”不排除多个元件或步骤。单个处理器或其他单元可以基于对应的软件例程实现至少图3和图4的功能。计算机程序可以在适当的介质(诸如与其他硬件一起或作为其他硬件的一部分提供的光存储介质或固态介质)上存储/分发,但是也可以以其他形式分发,诸如经由因特网或其他有线或无线通信系统分发。某些措施在相互不同的从属权利要求中陈述的仅有的事实不表示这些措施的组合不能使用以使优点突出。权利要求中的任何参考标号不应当解释为限制其范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1