信息处理装置、信息处理方法和程序的制作方法

文档序号:6380750阅读:119来源:国知局
专利名称:信息处理装置、信息处理方法和程序的制作方法
技术领域
本技术涉及信息处理装置、信息处理方法和程序。
背景技术
近年来,对使用诸如内容查看历史、内容购买历史等行动历史来搜索要推荐给用户的内容的系统的开发已取得积极进展。例如,已知如下结构(基于内容的滤除:content-based filtering):根据对作为行动对象的内容赋予的元数据,生成表示内容特征的特征矢量,并且基于该特征矢量的类似度提取要推荐的内容。该结构用于推荐特征与过去用户所选择的内容的特征类似的内容的系统。例如,日本未经审查的专利申请公开N0.2002-215665公开了基于内容的滤除。当使用这种基于内容的滤除时,只推荐与过去用户所选择的内容类似的内容。为此,因为不推荐给予用户新鲜感的内容,所以用户对于推荐结果失去了兴趣。除了基于内容的滤除之外,已知的在内容推荐中广泛使用的另一种结构是协同滤除(collaborative filtering)。协同滤除与基于内容的滤除在使用用户的行动历史方面是类似的,然而,协同滤除具有考虑的是用户的类似度而非内容的类似度的结构。例如,使用协同滤除的系统基于根据行动历史估计的用户特征,来搜索与对象用户类似的类似用户,并且向对象用户推荐类似用户过去所选择的内容。例如,日本未经审查的专利申请公开N0.2002-334256公开了协同滤除。当使用上述的协同滤除时,因为推荐的是执行类似行动的类似用户所选择的内容,所以可能推荐与对象用户过去所选择的内容不类似的内容。结果,有机会推荐给予用户新鲜感的内容。然而,在使用协同滤除的系统中,有可能很容易推荐对于系统的所有用户都热门的内容,进一步地,可能推荐不适于对象用户的喜好的、如同噪声的内容。

发明内容
如上所述,基于内容的滤除和协同滤除广泛用于推荐内容的系统中。然而,在使用这些滤除方法的系统中,难以推荐给予用户新鲜感的内容同时兼顾考虑用户本质的喜好。另外,虽然已经对将基于内容的滤除和协同滤除进行组合的混合型结构进行了研究,但存在一些要解决的问题,如,系统的复杂度、处理负荷的大小等。因此,在上述情况下构思出本技术,期望本技术提供新型且改进的信息处理装置、信息处理方法和程序,它们可以在较轻的处理负荷下为用户提供给予用户新鲜感的信息同时兼顾考虑用户本质的喜好。根据本技术的实施例,提供一种信息处理装置,包括:差分应用单元,根据表示第一特征信息与第二特征信息之间的差的差分特征信息、以及第三特征信息,得到第四特征信息,其中所述第一特征信息表征对象用户的行动,所述第二特征信息表征所述对象用户在执行上述行动之后执行的另一行动,所述第三特征信息表征所述对象用户新执行的行动;以及对象提取单元,提取基于所述第四特征信息的信息。
另外,根据本技术的另一实施例,提供一种信息处理方法,包括:根据表示第一特征信息与第二特征信息之间的差的差分特征信息、以及第三特征信息,得到第四特征信息,其中所述第一特征信息表征对象用户的行动,所述第二特征信息表征所述对象用户在执行上述行动之后执行的另一行动,所述第三特征信息表征所述对象用户新执行的行动;以及提取基于所述第四特征信息的信息。另外,根据本技术的又一实施例,提供一种使计算机实现包括如下功能的程序:差分应用,根据表示第一特征信息与第二特征信息之间的差的差分特征信息、以及第三特征信息,得到第四特征信息,其中所述第一特征信息表征对象用户的行动,所述第二特征信息表征所述对象用户在执行上述行动之后执行的另一行动,所述第三特征信息表征所述对象用户新执行的行动;以及对象提取,提取基于所述第四特征信息的信息。根据上述的本技术,能够在较轻的处理负荷下为用户提供给予用户新鲜感的信息同时兼顾考虑用户本质的喜好。


图1是四项类推(four-term analogy)的概要的示例性图示;图2是四项类推所涉及的处理的流程的示例性图示;图3是四项类推的多维化(mult1-dimensionalization)的不例性图不;图4是内容元数据的结构的示例性图示;图5是使用四项类推的推荐方法中的学习处理(离线处理)的示例性图示;图6是使用四项类推的推荐方法中的推荐处理(在线处理)的示例性图示;图7是根据本技术的实施例的推荐方法的概要的示例性图示;图8是根据本技术的第一实施例的推荐方法(特征矢量基)的概要的示例性图示;图9是根据本技术的第二实施例的推荐方法(单词矢量基)的概要的示例性图示;图10是根据本技术的第一实施例的推荐系统的结构的示例性图示;图11是根据本技术的第一实施例的推荐系统中使用的特征数据库的结构例的示例性图示;图12是根据本技术的第一实施例的推荐系统中使用的变动数据库的结构例的示例性图示;图13是根据本技术的第一实施例的学习处理的流程(概要)的示例性图示;图14是根据本技术的第一实施例的学习处理的流程(细节)的示例性图示;图15是根据本技术的第一实施例的推荐处理(基本方式)的流程(概要)的示例性图示;图16是根据本技术的第一实施例的推荐处理(基本方式)的流程(细节)的示例性图示;图17是根据本技术的第一实施例的推荐处理(用户选择方式)的流程(概要)的示例性图示;图18是根据本技术的第一实施例的推荐处理(用户选择方式)的流程(细节)的示例性图示;图19是根据本技术的第一实施例的推荐理由的显示方法(显示例#1)的示例性图示;图20是根据本技术的第一实施例的推荐理由的显示方法(显示例#2)的示例性图示;图21是根据本技术的第一实施例的跨类推荐(cross-categoryrecommendation)的方法的示例性图示;图22是根据本技术的第二实施例的推荐系统的结构的示例性图示;图23是根据本技术的第二实施例的学习处理的流程(概要)的示例性图示;图24是根据本技术的第二实施例的学习处理的流程(细节)的示例性图示;图25是根据本技术的第二实施例的推荐处理的流程(概要)的示例性图示;图26是根据本技术的第二实施例的推荐处理的流程(细节)的示例性图示;以及图27是能够实现根据本技术的各实施例的推荐系统的各个结构元件的功能的硬件结构例的示例性图示。
具体实施例方式下文中,将参照附图详细说明本发明的优选实施例。注意的是,在本说明书和附图中,用相同的附图标记表示具有基本相同功能和结构的结构元件,并且省略对这些结构元件的重复说明。[说明的过程]下文中,将简要说明以下将提供的说明的过程。其中,首先,将参照图1和图2说明用作理解以下将说明的实施例的技术的参考的四项类推的概念。接着,将参照图3至图6简要说明将四项类推进行多维化的方法和使用四项类推的推荐方法的例子。然后,将参照图7至图9说明将要后述的实施例的概要。接着,将参照图10至图21说明本技术的第一实施例。其中,首先,将参照图10至图12说明根据该实施例的推荐系统100的结构。然后,将参照图13和图14说明推荐系统100中执行的学习处理的流程。然后,将参照图15至图18说明推荐系统100中执行的推荐处理的流程。然后,将参照图19和图20说明根据该实施例的推荐理由的显示方法。然后,将参照图21说明根据该实施例的跨类推荐(cross-category recommendation)的方法。接着,将参照图22至图26说明本技术的第二实施例。其中,首先,将参照图22说明根据该实施例的推荐系统200的结构。然后,将参照图23和图24说明推荐系统200中执行的学习处理的流程。然后,将参照图25和图26说明推荐系统200中执行的推荐处理的流程。然后,将说明组合根据该实施例的技术(单词矢量基)和根据第一实施例的技术(特征矢量基)的方法。接着,参照图27,将说明能够实现根据本技术的各实施例的推荐系统的各个结构元件的功能的硬件结构。最近,将总结根据实施例的技术思想,简要说明该技术思想带来的效果。(说明项)1:导言1-1:什么是四项类推?1-2:四项类推的多维化
1-3:使用四项类推的推荐方法的例子1-3-1:离线处理1-3-2:在线处理1-4:实施例的概要1-4-1:思想1-4-2:特征矢量基的例子1-4-3:单词矢量基的例子2:第一实施例(特征矢量基)2-1:系统结构2-2:学习处理的流程2-2-1:概要2-2-2:细节2-3:推荐处理的流程(基本方式)2-3-1:概要2-3-2:细节2-4:推荐处理的流程(用户选择方式)2-4-1:概要2-4-2:细节2-5:推荐理由的显示2-6:跨类推荐3:第二实施例(单词矢量基)3-1:系统结构3-2:学习处理的流程3-2-1:概要3-2-2:细节3-3:推荐处理的流程3-3-1:概要3-3-2:细节3-4:与特征矢量基的组合4:关于可应用性5:硬件结构例6:总结〈1:导言〉首先,将说明用作理解随后将说明的实施例的技术的参考的四项类推的概念、使用四项类推的推荐方法和以下将说明的实施例的概要。[1-1:什么是四项类推?(图1和图2)]首先,将参照图1说明四项类推的概念。图1是四项类推的概念的示例性图示。四项类推是指对人基于前提知识而对事物进行类推的过程的建模。当为具有“事例:A —B”的前提知识的人提供信息C时,此人根据信息C类推出的信息X是什么?例如,如果单词“鱼”被作为A提供,并且单词“鳞片”被作为B提供,则人可能想到单词“具有”、“覆盖”等所表达的概念作为A和B之间的关系R。然后,如果向此人提供单词“鸟”作为信息C以使他或她基于关系R类推信息X,则期望此人类推例如单词“羽毛”、“翅膀”等。以此方式,对人的类推过程的建模就是四项类推。关于四项类推,已关注到用于估计“事例:A — B”作为前提知识被给予的人所类推的“事例:c — X”的解X的技术。注意的是,在下文中,存在如下情况:用“A:B=C:X”来表达根据“事例:A — B”类推“事例:C — X”的过程。作为估计“A:B=C:X”的解X的技术,例如,已知的是所谓结构映射论(structure mappingtheory)的估计方法。这种估计方法是通过如图1中所示向“事例:C — X”的C (下文中,状况C)应用“事例:A — B”的A (下文中,状况A)和B (下文中,结果B)之间的关系R来估计解X (下文中,结果X)的方法。换句话讲,上述的结构映射论还可以是指将构成前提知识的知识区域(下文中,基底区域)的结构映射到用于求出解X的问题的区域(下文中,目标区域)的方法。关于结构映射论,例如,在 D.Gentner 的 “Structure-Mapping:A Theoretical Framework forAnalogy” Cognitive Science, 1983 (《结构映射:类推的理论框架》,《认知科学》,1983年)等中有所说明。当使用上述的结构映射论时,可以通过将映射基底区域的结构时出现的无意义知识排除在外,得到在某一程度上合理的类推结果X。例如,如图1中所示,当单词“鱼”被提供作为状况A时,在估计结果X的过程中,可以将根据单词“鱼”类推的“蓝色”、“小”等的知识排除在外。类似地,当单词“鳞片”被提供作为结果B时,在估计结果X的过程中,可以将“硬”、“透明”等的知识排除在外。在例如图2所示的处理顺序中,执行基于结构映射论估计结果X的处理。首先,如图2中所示,执行估计状况A和结果B之间的关系R的处理(S10)。接着,执行将步骤SlO中估计的关系R从基底区域映射到目标区域的处理(S11)。然后,执行通过向状况C应用关系R来估计结果X的处理(S12)。通过执行步骤SlO至S12的处理,基于“事例:A — B”估计“事例:C —X”的解X。上文中,已简要说明了四项类推的概念。Kaneko等人已经进行了对将本文说明的四项类推的概念从模糊论的角度进行体系化的研究,并且已经报道了该研究的结果。例如,2010年的第5届软计算智能系统国际会议(5th International Conferenceon Soft Computingand Intelligent Systems)和第11届高级智能系统国际研讨会(IIthInternational Symposium on Advanced Intelligent Systems) (SCIS&ISIS 10)等中由 Yosuke Kaneko、Kazuhiro Okada、Shinichiro Ito、Takuya Nomura 和 TomihiroTakagi 关 于“AProposal of Analogical Reasoning Based on Structural Mappingandlmage Schemas”(《基于结构映射和图像方案的类推推理的提议》)的报道。在报道中,Kaneko等人已提出了一种推荐系统,在该推荐系统中,根据单词的共现频率(co-occurrence frequency)提取用作映射对象的关系R,并且单词词性的信息被用作结构。该报道可能也有助于理解四项类推的概念。[1-2:四项类推的多维化(图3和图4)]接着,将参照图3说明将四项类推多维化的方法。图3是将四项类推多维化的方法的示例性图示。注意的是,关于将四项类推多维化,已经提出了例如日本专利申请N0.2011-18787中公开的方法。将简要涉及该方法。图1的例子是从一个基底区域结构映射到一个目标区域的例子。另外,在图1的例子中,状况A、结果B、状况C和结果X都用一个单词来表达。在此,考虑的是如下方法:如图3中所示,扩展四项类推的概念,并且将结构从多个基底区域映射到一个目标区域。另夕卜,在此,前提是状况A、结果B、状况C和结果X中的每个都用包括一个或多个单词的单词矢量来表达。注意的是,在此考虑的方法被设置成被称为“多维四项类推”。下文中,将简要说明多维四项类推的概念。如图3中所示,考虑η个基底区域(基底区域I至基底区域η)。另外,在基底区域k (k=l至η)中,包括“事例:Ak —Bk”。此外,状况Ak和结果Bk被设置成用包括多个单词的单词矢量来表达。另外,基底区域I至基底区域η的结构被设置成被映射到一个目标区域。此外,在该目标区域中,包括“事例:C —(j=l至η)”。然而,状况Ak和结果Bk之间的关系Rk被用于估计“事例=C — Xk)”的结果Xk。例如,状况Ak (k=l至η)是用表征从一个人(下文中,对象用户)过去所选择的内容群中提取的对象用户的喜好的单词矢量来表达的。另外,结果Bk (k=l至η)是基于状况Ak的前提并且是用表征该内容群之后对象用户所选择的内容的单词矢量来表达的。此外,关系Rk (k=l至η)是用表征状况Ak和结果Bk之间关系的单词矢量来表达的。然后,状况C是用从包括对象用户新选择内容的内容群中提取的、表征对象用户的喜好的单词矢量来表达的。另外,结果Xk (k=l至η)是用表征基于状况C单词矢量和关系R的单词矢量而类推的内容的单词矢量来表达的。换句话讲,使用状况A1和结果B1之间的关系R1以及状况C来类推结果以类似方式,用关系R2和状况C来类推结果X2,并且用关系R3和状况C来类推结果X3,…,并且用关系Rn和状况C来类推结果Xn。注意的是,例如,使用所谓TF-1DF的算法生成各单词矢量。TF-1DF是从文件中提取特征单词的算法。TF-1DF输出被称为TF-1DF值的指标。用表示单词的出现频率的TF值与表示逆出现频率(inverse appearance frequency)的IDF值的乘积来表达TF-1DF值。例如,如果文件d中出现单词j的次数被设置成N」,文件d中包括的单词的总数被设置为N,文件的总数被设置为D并且出现单词j的文件的数量被设置为Dj,则用以下的公式(I)来表达TF值tf(j,d)。另外,用以下的公式(2)来表达IDF值idf(j)。另外,用以下的公式(3)来表达TF-1DF值tfidf (j,d)。也就是说,在大多数文件中出现的单词的TF-1DF值减小,并且在特定文件中频繁出现的单词的TF-1DF值增大。为此,可以使用该指标提取表征各个文件的单词。另外,通过提取具有高TF-1DF值的多个单词,生成表征文件的单词矢量。tf (j, d) =Nj/N...(I)idf (j) =l+ln (D/Dj)...(2)tfidf (j, d) =tf (j, d).1df。)…(3)
本文中,将考虑使用将食谱投稿站点(recipe contribution site)用作信息源的例子。大多数食谱投稿站点被构造成使得用户能够自由地将他们自己创作的食物的食谱进行投稿。另外,这种食谱投稿站点被构造成使得阅读了该食谱投稿站点的其他用户可以写评论。当然,与其它信息站点类似,在食谱投稿站点中提供了用于标题、图像和说明的域。另夕卜,在食谱投稿站点之中,存在设置有用于配料、烹饪工序、烹饪要诀、食物历史、登记种类等的域的站点。这些域被定义为元数据。如图4中所示,例如,某个食谱投稿站点的结构由诸如标题、图像、说明、配料、烹饪工序、烹饪工序要诀、评论、历史、种类等的元数据构成。在此之中,用于标题、说明、配料、烹饪工序、烹饪工序要诀、评论和历史的域包括可用于多维四项类推的信息。如图4中所示,例如,用于配料、烹饪工序和烹饪工序要诀的域可以用作状况A和状况C的信息源。另外,用于标题、说明和评论的域可以用作结果B的信息源。此外,用于历史的域可以用作关系R的信息源。也就是说,状况A和状况B的信息源被设置在表示用户喜好(在这个例子中,配料、烹饪工序、烹饪要诀等)的区域中。同时,结果B的信息源被设置在记述了该食谱投稿站点上记载的食物的实际品尝结果等的区域中。另外,关系R的信息源被设置在记述了状况A和结果B之间关系(做成食谱投稿站点上记载的食物之前的处理等)的区域中。以此方式,使用元数据的结构,能够容易地设置状况A、结果B、状况C和关系R的信息源。另外,能够使用上述TF-1DF值等 ,根据各区域中公开的文件生成与状况A、结果B和状况C对应的单词矢量。尽管在此考虑的是将食谱投稿站点用作信息源的例子,但通过参照元数据的结构还可以将状况A、结果B、状况C和关系R的信息源设置在其它类型的站点中。注意的是,结果X的信息源被设置在附加了与结果B的信息源的元数据相同的元数据的区域中。如果以此方式设置信息源,则可以使用从用户已阅读的站点的历史等提取的单词矢量,基于如图3中所示的多维四项类推来估计结果X1至Xn。上文中,已简要说明了四项类推的概念。本发明的发明人已想到如本文所述的多维四项类推被应用于内容推荐的结构。关于该结构,日本专利申请N0.2011-72324已做出详细说明,然而,为了阐明该结构和以下将说明的实施例之间的差别,本文中将对其内容进行简要介绍[1-3:使用四项类推的推荐方法的例子(图5和图6)]使用多维四项类推的信息处理系统的推荐方法大略地被划分成离线处理方法和在线处理方法,在离线处理方法中,要用于推荐的事例群是由学习处理生成的,在在线处理方法中,使用离线处理中生成的事例群而推荐内容。下文中,将依次说明离线处理方法和在线处理方法。(1-3-1:离线处理(图 5))首先,将参照图5说明离线处理方法。如上所述,要被作为离线处理而实现的主处理内容是生成事例群。在离线处理中,使用的是用户过去生成的内容群。为此,如图5中所示,在离线处理之前存在所谓的由用户生成内容((I)用户输入)的处理。在图5的例子中,已备好n+1条内容,包括内容I至内容n+1。注意的是,被赋予较高号码的内容被定义成最近生成的内容。首先,信息处理系统按照从n+1条内容生成的顺序、选择η条内容作为状况A的信息源。另外,信息处理系统选择最近的内容作为结果B的信息源。在此,被选择作为状况A的信息源的η条内容用状况A1来表达,并且被选择作为结果B的信息源的内容用结果B1来表达。类似地,对于q=l、…、m-1,信息处理系统按照n_q条内容被生成的顺序、选择这n_q条内容作为状况A的信息源。另外,信息处理系统选择次序为q+Ι的新内容作为结果B的信息源。对于q=l、…、m-1中的每个,被选择作为状况A的信息源的n-q条内容用状况A (q+n来表达,并且被选择作为结果B的信息源的内容用结果B (q+n来表达。在此,m被设置成使得与状MAm对应的内容的条数达到预定数量。如果以此方式(2)提取一对状况Ak(k=l、…、m)和结果Bk,则信息处理系统对于k=l、…、m的每个,生成表征状况Ak和结果Bk之间关系Rk的单词矢量。举例来说,本文将说明表征状况A1和结果B1之间关系R1的单词矢量的生成方法。首先,信息处理系统针对与状况A1对应的η条内容,参照被设置为状况A的信息源的区域(下文中,区域Α),以生成表征该区域的单词矢量(3)。例如,信息处理系统生成分别表征内容I至η的区域A的η个单词矢量,并且信息处理系统将这η个单词矢量整合,将其设置为状况A1的单词矢量。接着,信息处理系统从状况A1的单词矢量提取单词(在该例子中,两个单词)(4)。注意的是,在以下的说明中,可能存在在此提取的一对单词被称为状况仏的单词矢量的情况。接着,信息处理系统针对与结果B1对应的内容,生成表征被设置为结果B的信息源的区域(下文中,区域B)的单词矢量,并且将该单词矢量设置成结果B1的单词矢量(5)。然后,信息处理系统从结果B1的单词 矢量提取单词(在这个例子中,两个单词)(6)。注意的是,在以下的说明中,可能存在在此提取的一对单词也被称为结果B1的单词矢量的情况。然后,信息处理系统搜索从状况A1的单词矢量提取的单词被包括在区域A中、并且从结果B1的单词矢量提取的单词被包括在区域B中的内容(7)。接着,信息处理系统针对从搜索处理提取的内容,生成表征被设置为关系R的信息源的区域(下文中,区域R)的单词矢量,并且将该单词矢量设置成关系R1的单词矢量
(S)0然而,当由搜索处理提取了多条内容时,生成分别表征每条内容的区域R的多个单词矢量,并且整合这些多个单词矢量,以将其设置为关系R的单词矢量。以此方式生成的关系R1的单词矢量被与从状MA1的单词矢量提取的单词和从结果B1的单词矢量提取的单词相关联地保持在信息处理系统中。注意的是,从单词矢量提取的单词存在多种组合。为此,针对不同单词的所有组合,执行上述(4)、(6)、(7)和(8)的处理。然后,顺序地,将上述(8)中生成的单词矢量追加至关系凡的单词矢量。另外,不仅针对状况A1和结果B1的组合,而且对于状况Α2、…、Am和结果Β2、…、Bm的所有组合,都执行上述的处理。然后,生成关系%、…、Rm的单词矢量。结果,完成了在以下将说明的在线处理中将使用的事例群的准备。上文中,已说明了使用多维四项类推的推荐方法中的离线处理方法。(1-3-2:在线处理(图 6))接着,将参照图6说明在线处理方法。如上所述,在线处理中执行的主要处理是使用事例群搜索内容并且发出搜索结果。注意的是,在此提到的在线处理是指从用户接收到推荐请求时执行的处理。如上所述,当已接收到推荐请求时执行在线处理。换句话讲,当用户已选择新内容时执行在线处理。如图6中所示,当用户选择新内容((I)用户输入)时,信息处理系统提取状况C的单词矢量(2)。此时,信息处理系统首先提取表示用户喜好的单词矢量(下文中,喜好矢量),然后使用表征被设置为新内容的状况C的信息源的区域(下文中,区域C)的单词来更新喜好矢量。然后,信息处理系统将已经受更新的信号矢量设置成状况C的单词矢量。接着,信息处理系统从状况C的单词矢量提取单词(在这个例子中,两个单词)(3)。然后,信息处理系统参照离线处理中生成的事例群,从关系R的单词矢量提取单词(在这个例子中,一个单词)(4)。然后,信息处理系统搜索从状况C的单词矢量提取的单词在区域C中出现并且从关系R的单词矢量提取的单词在区域R中出现的内容(5)。然后,信息处理系统生成示出搜索处理中提取的内容的项目ID的列表(下文中,推荐列表)(6)。存在多个从状况C的单词列表提取的单词和从关系R的单词列表提取的单词的组合。为此,针对不同的组合,重复执行推荐单词列表生成处理,以生成多个推荐列表。信息处理系统整合多个推荐列表,并且为每条推荐内容赋予分值。然后,信息处理系统基于赋予的分值选择要推荐的多条推荐内容的组合,并且生成包括所选择的多条推荐内容的推荐列表(7)。然后,信息处理系统向已发送推荐请求的用户呈现推荐列表。上文中,已说明了使用多维四项类推的推荐方法中的在线处理方法。如上所述,使用多维四项类推的推荐方法涉及如下结构:从用户的行动历史中提取将状况和结果进行联系的关系,并且使用这种关系和新状况来搜索推荐内容。注意的是,在以上的说明中,已经以用户对内容的选择历史作为用户的行动历史的例子,然而,对于其它行动历史,与以上相同的方法也被视为是可能的。换句话讲,据说该推荐方法具有如下结构:提取过去的行动和行动所造成的结果之间的关系,并且推荐具有表示新行动的信息和表示所提取关系的信息作为关键信息的、要被推荐的内容。然而,对上述推荐方法的关注点应放在:不是通过直接使用表示状况的信息和表示结果的信息来提取这两者的之间的关系,而是示出以上述两种信息作为关键信息而搜索得到的结果的关系的域中包括的信息被用作所述关系。随后将说明的根据实施例的技术涉及如下结构:直接使用表征作为原因的行动的信息和表征作为结果的行动的信息,并且准确地捕获从原因到结果这一过程中出现的用户的喜好变化,并且在推荐中利用该喜好变化。[1-4:实施例的概要(图7至图9)]下文中,将简要说明实施例的概要。(1-4-1:思想(图 7))首先,将参照图7简要说明随后将说明的第一实施例和第二实施例的共同的技术思想的概要。在根据本实施例的技术中,在作为原因的用户行动和作为上述行动的结果的用户所采取的行动之间,提取用户的喜好变动的分量,据此,并且在考虑用户的固定的喜好和变动的喜好的情况下,提取推荐对象。图7示意性示出其概念。如图7中所示,根据本实施例的系统准备表征作为原因的行动的特征信息(下文中,原因特征信息)和表征作为结果的行动的特征信息(下文中,结果特征信息),并且提取结果特征信息和原因特征信息之间的差。此外,系统将所提取的差视为喜好变动的分量(下文中,变动分量),并且生成使变动分量作用于用户的新结构、以用于推荐对象的提取的特征信息(下文中,推荐因子)。然后,系统基于所生成的推荐因子来搜索推荐对象。当在使用多维四项类推的推荐方法中提取原因(状况)和结果之间的关系时,原因的特征和结果的特征被用作关键信息,以搜索这两个特征共同出现的内容,并且从搜索结果提取表示关系的信息。为此,很难说,在表示关系的信息中,包括除了从原因到结果这一处理中所产生的用户喜好变化之外的各种要素,并且提取本实施例中提到的变动分量。换句话讲,可以说,虽然在根据实施例的技术中用户的变动的喜好和固定的喜好彼此分开,但在使用多维四项类推的推荐方法中没有特别考虑关于喜好的变动和固定的概念。从这个角度看,本实施例的技术和使用多维四项类推的推荐方法彼此明显不同。下文中,将说明实现了根据本实施例的技术思想的例子的概要。(1-4-2:特征矢量基的例子(图8))首先,参照图8。在此将介绍如下结构:通过用特征矢量表达用户的行动并且用特征矢量的差分表达变动分量来计算推荐因子。在随后说明的第一实施例中,将详细说明该结构的具体实现方法。如图8中所示,可以使用给定特征量空间F中的特征矢量表达用户的行动。注意的是,可以举出例如选择、购买、阅读、书写、按压、供给、吃、移动、骑行、步行、锻炼、预约、刷牙、洗衣、烹饪、工作、讨论、通话、文件制作、驾车等各种例子作为用户的行动。这些行动具有作为行动对象的具体物体(下文中,对象物)。例如,对于“选择”和“购买”行动,借出物品、待售商品等是对象物。另外,对于“供给”,水等是对象物。此外,对于“吃”,乌冬面、寿司、烤肉等是对象物。能够使用诸如单词或单词群、照片和声音等表达对象物的信息(下文中,内容)来识别对象物。然而,当这种对象物是文本、音乐、视频等时,对象物自身用作内容。可以使用某种特征量来表征如上所述的内容。例如,用表征内容的单词群构成的单词矢量来表征文本所表达的内容。另外,由例如通过分析信号波形而得到的节奏或代码进程(progress of codes)等乐曲信息来表征音乐数据。除此之外,使用各种机械学习技术表征内容的方法也在研究中。图8的例子示出用特征量空间中的特征矢量表达各内容的方法。注意的是,各特征矢量表征用户的行动或与行动对应的内容。另外,图8只示出限定特征量空间的三个轴(f\、f2和f3)以便于说明,但是特征量空间中的维数不限于3。如果如图8中所不使用特征矢量,用例如特征矢量UP1表达与原因对应的用户行动。以类似方法,用特征矢量CP1表达与结果对应的用户行动。因此,可以用特征矢量R(下文中,变动矢量R)表达表示从原因到结果这一处理所产生的用户喜好变动的变动分量。特征矢量R是特征矢量UP1与特征矢量CP1之差。另外,当用户执行新行动时,用特征矢量UP2表达新行动(与新原因对应的用户行动)。因此,当期望得到根据新原因的推荐对象时,系统通过合成特征矢量UP2和变动矢量R来计算特征矢量CP2作为推荐因子,并且提取与特征矢量CP2对应的推荐对象。注意的是,可以通过不变动地合成特征矢量CP2和变动矢量R来得到特征矢量CP2,但实际上,采用的方法是:通过使用特征矢量UP2和变动矢量R,搜素与合成两个矢量而得到的特征矢量逼近的特征矢量CP2。例如,系统从用户的行动历史提取原因和结果的多个组合,并且通过将原因和结果投影在特征量空间中,来准备与原因、结果和变动分量对应的特征矢量的组合。此外,系统对特征矢量聚类(cluster),并且准备代表各聚类的原因的特征矢量和从各聚类的特征矢量延伸的变动矢量R。除此之外,系统选择特征矢量UP2附近的聚类,并且使用代表该聚类的特征矢量和变动矢量R来搜索特征矢量CP2。如上所述,作为实现根据本实施例的技术思想的方法,可以考虑使用特征矢量的例子。下文中,与例子相关的方案被称为特征矢量基。注意的是,在以下将说明的第一实施例中详细说明该方案。(1-4-3:单词矢量基的例子(图9))现在,将参照图9。在此将说明如下结构:用单词矢量表达用户行动,并且通过用单词矢量之差表达变动分量来计算推荐因子。在以下说明的第二实施例中将详细地说明用于实现该结构的具体方法。如图9中所示,可以用由一个或多个单词构成的单词矢量来表达表征用户行动的各内容。此外,用由一个或多个单词矢量构成的单词集来表征用户行动。例如,用单词集A表征与原因对应的用户行动。另外,用单词集B表征与结果对应的用户行动。在这种情况下,用表示单词集A和单词集B之差的变动分量R表达从原因到结果这一处理所产生的用户喜好变动。如图9中所示,变动分量R的要素被分为消失单词群和出现单词群。消失单词群是从原因到结果的过程中消失的单词群。也就是说,消失单词群是在单词集A中存在而在单词集B中不存在的单词群。另一方面,出现单词群是从原因到结果的过程中新出现的单词群。也就是说,出现单词群是在单词集A中不存在而在单词集B中存在的单词群。以此方式,在特征矢量基的情况下,用特征矢量表达变动分量,而在单词矢量基的情况下,用单词的消失和出现表达变动分量。然而,应该理解,即使以此方式使用不同的表达方法,与上述本实施例相关的技术思想也以相同方式实现。例如如果提供与新原因对应的单词集C,则系统可以通过用变动分量R作用于单词集C来生成用作推荐因子的单词集D。以上提到的“作用”意指如下操作:从单词集C中删除消失单词群并且向单词集C追加出现单词群。通过执行这种操作,从原因到结果这一处理所产生的用户喜好变动被反映到新原因,然后在用户的固定的喜好之外,可以得到精确地反映用户的喜好变动的推荐因子。系统使用以此方式生成的单词集D搜索推荐对象。注意的是,即使在使用单词集的这种方案中,也可以用与特征矢量基相同的方式构造使用聚类的实际技术。另外,可以使用该技术和特征矢量基技术的组合。如上所述,作为实现根据本实施例的技术思想的方法,可以考虑使用单词集的例子。下文中,基于该例子的方案被称为单词矢量基。注意的是,在以下将说明的第二实施例中详细说明该方案。〈2:第一实施例(特征矢量基)>将说明本技术的第一实施例。本实施例涉及特征矢量基的推荐算法。[2-1:系统结构(图10至图12)]首先,将参照图10至图12说明根据第一实施例的推荐系统100的系统结构例。图10至图12是根据本实施例的推荐系统100的系统结构例的示例性图示。注意的是,推荐系统100可以被构造成具有包括图27所示硬件结构或其部分功能的I台信息处理装置,或者可以被构造成具有通过局域网或广域网连接的多台信息处理装置或其部分功能。当然,可以按任意方式设置构成网络的通信电路的类型、通信方案等(例如,LAN、WLAN、WAN、因特网、移动电话线路、固定电路线路、ADSL、光纤、GSM、LTE等)。首先,将参照图10。如图10中所示,推荐系统100主要由用户喜好提取引擎101、特征数据库102、内容特征提取引擎103、变动提取引擎104、变动数据库105、推荐引擎106和变动类型数据库107构成。注意的是,尽管在附图中未示出,但推荐系统100具有用于从外部电子设备10和20获取信息的单元。另外,电子设备10和20可以是互不相同的装置,或者可以是相同的装置。当用户作出行动时,行动的信息被输入到用户喜好提取引擎101和变动提取引擎104中作为行动历史。注意的是,下文中,为了便于说明,将以用户选择内容的行动为例来提供说明。在这种情况下,用户通过操作电子设备10而选择的内容的信息(例如,元数据)被输入到用户喜好提取引擎101和变动提取引擎104作为行动历史。当输入行动历史时,用户喜好提取引擎101参照输入的行动历史中包括的内容的元数据来提取表征内容的特征信息CP。例如,使用由表征内容的单词群构成的单词矢量、或通过在尺寸上压缩该单词矢量而得到的特征矢量作为特征信息CP。下文中,为了便于说明,将说明使用通过在尺寸上压缩单词矢量而得到的特征矢量作为特征信息CP的方法。当针对行动历史中包括的各内容生成特征矢量时,用户喜好提取引擎101将生成的特征矢量存储在特征数据库102中。注意的是,在以下说明中,将用CP表示针对各内容生成的特征矢量。另外,用户喜好提取引擎101收集针对各用户的行动历史中包括的内容生成的特征矢量CP,然后通过叠加特征矢量CP生成表示各用户的喜好的特征矢量UP。然后,用户喜好提取引擎101将生成的特征矢量UP存储在特征数据库102中。注意的是,作为生成特征矢量UP的方法,例如,考虑的是如下方法:从一个用户的行动历史中包括的内容的特征矢量CP提取具有高分值的特征矢量UP,然后将这些结果设置到特征矢量UP。另外,作为另一种方法,考虑的是如下方法:从一个用户的行动历史中包括的各内容提取单词矢量,从这些矢量中提取具有高分值的单词以生成新的单词矢量,然后通过对新的单词矢量执行尺度压缩来生成特征矢量UP。在这些方法或其它已知方法的使用中,通过直接或间接叠加针对各用户生成的特征矢量CP来生成表征用户行动历史的特征矢量UP。表征各内容的特征矢量CP和表征用户的行动历史的特征矢量UP被存储在具有例如图11所示构成的特征数据库102中。在图11的例子中,表示特征矢量类型(CP或UP)的域和用于识别特征矢量的各种类型的识别ID被与特征矢量的细节相关联地存储。注意的是,图11中示出的特征数据库102的结构是例子,并且例如,如果识别ID的编号规则被设置成用于识别类型,则用于类型的域是不必要的。另外,因为假定特征矢量已经受尺度压缩,所以举例说明了各成分用实数值表示的特征矢量,但是用于显示特征矢量的格式可以根据用于表达特征量的格式的思想而适当变更。然后,特征数据库102还可以存储与用户的行动历史不相关的内容的特征矢量CP。这类特征矢量CP是由内容特征提取引擎103生成的。内容特征提取引擎103从外部信息源获取内容的元数据,并且根据所获取的元数据生成特征矢量CP。例如,内容特征提取引擎103以映射在与用户喜好提取引擎101生成的特征矢量CP或UP相同的特征量空间(下文中,特征量空间F)中的形式,生成特征矢量CP。以此方式,特征数据库102存储针对用户行动历史中包括的内容和外部内容而得到的、与特征量空间F中的点对应的特征矢量CP和UP。注意的是,特征数据库102根据输入到用户喜好提取引擎101的行动历史的更新或内容特征提取引擎103获取的外部内容的变动而适当更新。
当以上述方式构造或更新特征数据库102时,变动提取引擎104使用特征数据库102中存储的特征矢量CP和UP,提取表示从原因到结果这一处理所产生的用户喜好变动的变动分量R。在特征矢量基的情况下,用得自对应于原因的行动历史的特征矢量UP和得自对应于结果的行动历史的特征矢量CP (下文中,UPe)之差(下文中,变动矢量R)表达变动分量R。首先,变动提取引擎104将行动历史分成原因和结果的组合(下文中,事例),如图13中所示。然后,变动提取引擎104从特征数据库102提取各事例的特征矢量UP和UPe,计算矢量之差,接着生成变动矢量R。当以此方式生成变动矢量R时,变动提取引擎104将所生成的变动矢量R存储在变动数据库105中。如例如图12中所示地构造变动数据库105。如图12中所示,用于识别对应于原因的特征矢量UP的识别ID、用于识别对应于结果的特征矢量UPe的识别ID和这两个矢量的变动矢量R的细节被彼此相关联地存储。注意的是,与特征数据库102的情况类似,数据库的结构和显示格式可以适当变动。当以此方式构造特征数据库102和变动数据库105时,可以使用数据库中存储的信息来推荐内容。对内容的推荐被实现为推荐引擎106的功能。首先,当从用户接收到推荐请求时,推荐引擎106按照推荐请求开始内容推荐处理。推荐请求是基于用户的新行动发出的。例如,当用户通过操作电子设备20选择新内容时,从电子设备20向推荐引擎106发送推荐请求。此时,电子设备20向推荐引擎106发送用户的行动历史(示出新内容的选择行动等的信息)。当接收到行动历史时,推荐引擎106根据表征行动历史中包括的内容的特征矢量CP生成表征用户的特征矢量UP’。此时,当在生成特征矢量UP’的处理中使用的特征矢量CP已经被存储在特征数据库102中时,推荐引擎106从特征数据库102获取对应的特征矢量CP。另一方面,当特征矢量CP没有被存储在特征数据库102中时,推荐引擎106根据从电子设备20接收的行动历史中包括的内容的元数据,生成表征内容的特征矢量CP。然后,推荐引擎106通过叠加特征矢量CP,生成特征矢量UP’。注意的是,生成特征矢量UP’的方法与用户喜好提取引擎101生成特征矢量UP的方法基本相同。换句话讲,特征矢量UP’也被映射到规定了特征矢量UP的特征量空间F中。当生成特征矢量UP’时,推荐引擎106使用特征矢量UP’和变动矢量R来搜索用作推荐因子的特征矢量CP。在此,将更详细地讨论搜索特征矢量CP的方法。变动矢量R被存储在变动数据库105中。变动矢量R表示从原因到结果这一处理所产生的用户喜好变动。例如,让我们假设用户A在食用“猪排饭”之后倾向于喝“热咖啡”。另一方面,让我们假设用户B在食用“猪排饭”之后倾向于喝“热绿茶”。各用户的这种喜好变动用变动矢量R来表达。然而,可能存在用户A有时喝“热咖啡”而在其它时间喝“热绿茶”的情况。另外,根据用户在“猪排饭”之前食用的东西或者直到用户吃完“猪排饭”前执行的用户行动,所得的行动可能发生变动。如上所述的所得行动的差异被表达为事例的差异。如之前所说明的,用户信号提取引擎101通过变动同一用户的行动历史的原因和结果的组合来生成多个事例,并且针对这些事例得到特征矢量UP和UPe。此外,变动提取引擎104针对特征矢量UP和UPe生成变动矢量R。因此,考虑到事例的差异的各种变动矢量R被存储在变动数据库105中。为此,推荐引擎106选择具有位于特征矢量UP’附近的特征矢量UP作为起始点的变动矢量R。此夕卜,推荐引擎106选择通过组合所选的变动矢量R和特征矢量UP’而得到的特征矢量UPe’附近的特征矢量CP,以将其设置为推荐因子。然而,当存在多个类似事例时,在分别对特征矢量UP和UPe聚类之后,优选为选择代表各聚类的特征矢量UP和UPe,或者将变动矢量R合并到连接这些聚类的矢量。另外,可以使多个变动矢量R与对应于特征矢量UP的聚类相关联。此外,可以对各变动矢量R设置分值或权重值。当使用聚类时,推荐引擎106选择接近特征矢量UP’的聚类,并且获取对应于该聚类的变动矢量R。然后,推荐引擎106通过合成特征矢量UP’和变动矢量R来搜索推荐因子。另外,当选择变动矢量R时,推荐引擎106从变动数据库107读取与所选变动矢量R对应的变动类型的信息,并且将变动类型的信息和推荐结果提供给用户。例如,当变动矢量R表示“浓厚”时,变动类型数据库107与变动矢量R相关联地存储表示“浓厚”的数据(例如,文本数据、音频数据、图像数据等)作为变动类型的信息。为此,推荐引擎106为用户提供表示“浓厚”的数据作为推荐理由,并且连带为用户提供使用基于变动矢量R和特征矢量UP’的推荐因子检测到的推荐结果(例如,参见图19)。注意的是,变动类型的信息可以被用作当使用户选择变动矢量R时用于识别选项的信息(例如,参见图20)。上文中,已经说明了根据本实施例的推荐系统100的系统结构。在此所述的系统结构是例子,并且可以根据实施例适当变动一些结构元件。不用说,这种变动也落入本实施例的技术范围内。[2-2:学习处理的流程(图13和图14)]接着,将参照图13和图14说明根据实施例的学习处理的流程。注意的是,在此提到的学习处理意指特征数据库10 2和变动数据库105的构建处理。(2-2-1:概要(图 13))首先,将参照图13。图13是根据本实施例的学习处理的概要的示例性图示。另外,注意的是,图13所示的处理过程是通过简化处理次序和细节而表达的,使根据本实施例的学习处理的细节更容易理解。如图13中所示,根据本实施例的学习处理包括用于生成事例的处理过程和用于针对各事例生成变动矢量R的处理过程。在用于生成事例的处理过程中,如图13上部所示,执行如下处理:从一个行动历史选择和提取原因和结果的组合。例如,如图13中所示,当存在用作行动历史的对象的n+1条内容时,通过将最近的内容设置成结果B1并且将之前内容设置成原因A1来生成事例#I。以相同方式,在不包括最近内容的内容群中,选择结果B2和原因A2,由此生成事例#2。重复同样的处理,由此得到事例#1、…、事例#m。注意的是,可以对于作为原因的内容的条数设置最小数量。当得到事例#1、...、事例#m时,针对各事例执行用于生成变动矢量R的处理过程。例如,当考虑事例#1时,如图13的下部中所示,从构成原因A1的内容群提取表征该内容群的单词矢量Wl。此外,通过单词矢量巧的尺度压缩得到特征矢量UP115注意的是,在此,尽管已举例说明了由单词矢量W1直接得到特征矢量UP1的方法,而没有使用由构成原因A1的各内容的特征矢量CP得到特征矢量UP的方法,但可以使用任一种方法。类似地,从构成结果B1的内容,提取表征内容的单词矢量W/。此外,由单词矢量W1,的尺度压缩得到特征矢量UPe1。然后,通过从特征矢量UPe1减去特征矢量UP1来生成变动矢量I。在此,已示出针对事例#1生成变动矢量R1的方法,而以相同方式,生成分别对应于事例#2、…、事例#m的变动矢量R2、…、Rm。在上述过程中生成的特征矢量被存储在特征数据库102中,并且变动矢量被存储在变动数据库105中。上文中,已经说明了根据本实施例的学习处理的概要。注意的是,可以在得到事例#1、…、事例#m的变动矢量R时执行事例的聚类。在这种情况下,已经受聚类的特征矢量和已经受合并的变动矢量被分别存储在特征数据库102和变动数据库105中。(2-2-2:细节(图 14))接着,将参照图14。图14是根据本实施例的学习处理的流程的示例性图示。如图14中所示,推荐系统100首先根据内容的元数据生成表征该内容的单词矢量(SlOl)0接着,推荐系统100对步骤SlOl中生成的单词矢量执行尺度压缩,然后生成特征量空间F的特征矢量CP(S102)。然后,推荐系统100从用户的行动历史提取“原因一结果”的组合(事例)(S103)。接着,推荐系统100针对步骤S103中提取的“原因和结果”的所有组合,计算“原因”的特征矢量UP与“结果”的特征矢量UPe之差,然后生成变动矢量R (S104)。然后,推荐系统100对特征矢量UP聚类并且合并变动矢量R(S105)。随后,推荐系统100将已经受聚类的特征矢量UP和特征矢量CP存储在特征数据库102中,并且将已经受合并的变动矢量R存储在变动数据库105中(S106)。此后,推荐系统100结束与学习处理相关的一系列处理。上文中,已经说明了根据本实施例的学习处理的流程。在图14的例子中,是在特征矢量的聚类和变动矢量的合并这一前提下提供的说明,但是当没有执行聚类处理和合并处理时,可以通过省去与以上处理相关的步骤来实现学习处理。

[2-3:推荐处理的流程(基本方式)(图15和图16)]接着,将参照图15和图16说明根据本实施例的推荐处理的流程。注意的是,将在执行特征矢量的聚类处理和变动矢量的合并处理这一前提下提供说明。(2-3-1:概要(图 15))首先,将参照图15。图15是根据本实施例的推荐处理的概要的示例性图示。注意的是,以下将说明的推荐处理主要是通过推荐引擎106的功能实现的。如图15中所示,在推荐处理中,使用用户的新行动历史(新原因X)。首先,推荐引擎106提取表征构成新原因X的内容群的单词矢量W。接着,推荐引擎106对所提取的单词矢量W执行尺度压缩,随后生成特征量空间F的特征矢量UPX。然后,推荐引擎106选择特征矢量UPx附近的聚类,然后得到代表该聚类的特征矢量UP。。接着,推荐引擎106从变动数据库105获取已经受合并的变动矢量RM1、…、和Rsfa,然后将各变动矢量与特征矢量UP。合成。然后,推荐引擎106使用由合成处理生成的特征矢量UPz(RM1)、…、和UPz (Rsfa)作为推荐因子,以搜索推荐候选项。然后,推荐引擎106向用户呈现推荐候选项之中的预定数量的推荐结果。此时,推荐引擎106向用户呈现变动类型的信息(推荐理由)连同推荐结果。上文中,已经说明了根据本实施例的推荐处理的概要。(2-3-2:细节(图 16))
接着,将参照图16说明根据本实施例的推荐处理的流程。如图16中所示,推荐引擎106首先获取用作推荐对象的用户的行动历史(S111)。然后,推荐引擎106根据步骤Slll中获取的行动历史生成特征量空间F的特征矢量UPx(S112)。此时,推荐引擎106对表征用作新原因的用户行动历史的单词矢量执行尺度压缩,然后生成特征矢量UPX。然后,推荐引擎106选择位于特征矢量UPxB近的聚类的特征矢量UPc (S113)。然后,推荐引擎106搜索位于变动矢量RM1、…、和Rsfa应用于特征矢量UP。的位置附近的特征矢量CP,然后从搜索结果提取推荐候选项(S114)。然后,推荐引擎106向用户呈现与变动矢量RM1、…、和Rsfa中的每个对应的推荐候选项,连带呈现推荐理由(S115)。此时,呈现与变动矢量RM1、…、和Rsfa对应的变动类型的信息作为推荐理由(例如,参见图19)。此后,推荐引擎106结束与推荐处理相关的一系列处理。上文中,已经说明了根据本实施例的推荐处理的流程。[2-4:推荐处理的流程(用户选择方式)(图17和图18)]目前已在由推荐引擎106决定变动矢量R的前提下提供了说明。然而,在导出推荐结果的处理中,可能存在用户想要他/她自己决定喜好变动的方向性的情况。因此,以下将说明推荐系统100中可以选择变动矢量R的结构(下文中,用户选择方式)。通过具有选择性,推荐系统100可以实现用作超出推荐系统的框架而搜索新的关联信息的搜索系统的功能。(2-4-1:概要(图 17))首先,将参照图17。图17是根据本实施例的推荐处理(用户选择方式)的概要的示例性图是。注意的是,以下将说明的推荐处理主要是通过推荐引擎106的功能实现的。如图17中所示,在推荐处理中使用用户的新行动历史(新原因X)。首先,推荐引擎106提取表征构成新原因X的内容群的单词矢量W。接着,推荐引擎106对所提取的单词矢量W执行尺度压缩,随后生成特征量空间F的特征矢量UPx。然后,推荐引擎106选择特征矢量UPx附近的聚类,然后得到代表该聚类的特征矢量UP。。接着,推荐引擎106从变动数据库105获取已经受合并的变动矢量RM1、…、和Rsfa,然后向用户呈现与之对应的变动类型。当用户选择变动类型时,推荐引擎106合成对应于所选变动类型的变动矢量Rmu和特征矢量UP。。然后,推荐引擎106使用合成处理中生成的特征矢量UPz(Rmu)作为推荐因子来搜索推荐候选项。然后,推荐引擎106向用户呈现推荐候选项之中的预定数量的结果。上文中,已经说明了根据本实施例的推荐处理(用户选择方式)的概要。(2-4-2:细节(图 18))
接着,将参照图18说明根据本实施例的推荐处理(用户选择方式)的流程。如图18中所示,推荐引擎106首先获取用作推荐对象的用户的行动历史(S121)。接着,推荐引擎106根据步骤S121中获取的行动历史生成特征量空间F的特征矢量UPx(S122)。此时,推荐引擎106对表征用作新原因的用户行动历史的单词矢量执行尺度压缩,然后生成特征矢量UPX。然后,推荐引擎106选择位于特征矢量UPxB近的聚类的特征矢量UPc (S123)。接着,推荐引擎106在向用户呈现分别对应于变动矢量RM1、…、和Rfc的变动类型的信息之后请求用户进行选择(S124 ;参见例如图20)。然后,推荐引擎106搜索位于与所选变动类型对应的变动矢量Rmu应用于特征矢量UP。的位置附近的特征矢量CP,然后从搜索结果提取推荐候选项(S125)。然后,推荐引擎106向用户呈现推荐候选项(S126)。此后,推荐引擎106结束与推荐处理相关的一系列处理。上文中,已经说明了根据本实施例的推荐处理的流程。[2-5:推荐理由的显示(图19和图20)]如之前所说明的,当向用户呈现推荐结果时,推荐引擎106向用户呈现导出该推荐结果的理由(推荐理由)。例如,在没有使用用户选择方式的情况下,如图19中所示,使推荐引擎106显示推荐结果和针对用于得到该推荐结果的变动矢量R的推荐理由。另外,在使用用户选择方式的情况下,如图20中所示,推荐引擎106在提取变动矢量R的候选项的阶段,向用户呈现针对各变动矢量R的推荐理由,然后允许用户选择推荐理由。然后,使推荐引擎106使用与所选推荐理由对应的变动矢量R来显示推荐结果。[2-6:跨类推荐(图 21)]目前,已经说明了使用在同一特征量空间F中的变动矢量R搜索推荐因子的方法,但在下文中,将介绍通过将变动矢量R投影在不同的特征量空间F’中而搜索推荐因子的方法(下文中,跨类推荐)。跨类推荐适于例如从与进餐相关的行动历史提取的用户喜好变动应用于与阅读相关的行动推荐的情况。如上所述,用户的行动历史是用特征量空间中的特征矢量来表达的。为此,从用户的行动历史得到给定特征量空间F中的特征矢量UP和UPe以及变动矢量R。然而,从原因到结果这一处理所产生的用户喜好变动不一定只在同一特征量空间F中表达。例如,如果喜好变动是“低廉”,则“低价位餐”的“低廉”在与进餐相关的特征量空间中表达,并且“低通话费用”的“低廉”在与通话费用相关的另一特征量空间中表达。换句话讲,如果“低廉”的对象在不同特征量空间中彼此相关,则“低廉”的概念可以投影到不同的特征量空间中。具体地讲,通过准备与给定特征量空间F中的特征矢量形成对应关系并且被定义在不同的特征量空间F’中的多个特征矢量,并且然后通过学习将一个特征量空间内的点移动到另一个特征量空间中的点,更好地实现映射。如果使用映射,则如图21中所示,可以将基于用作原因的特征矢量UP1和基于用作结果的特征矢量CP1而得到的变动矢量R转换成不同特征量空间F’中的变动矢量R’。然后,通过将变动矢量R’应用于特征量空间F’中的新原因UP2,得到用作推荐因子的特征矢量CP2。换句话讲,通过向根据本实施例的技术应用上述结构,可以使用属于某一类别的喜好变动来适当选择属于其它类别的推荐候选项。上文中,已经说明了跨类推荐。上文中,已经说明了本技术的第一实施例。如在此举例说明的,可以使用特征矢量实现根据本技术的实施例的技术思想。〈3:第二实施例(单词矢量基)>接着,将说明本技术的第二实施例。本实施例涉及单词矢量基的推荐算法。[3-1:系统结构(图 22)]首先,将参照图22说明根据本实施例的推荐系统200的系统结构例。图22是根据本实施例的推荐系统200的系统结构例的示例性图示。注意的是,推荐系统200可以通过具有图27所示硬件结构或其一些功能的I台信息处理装置、或者通过局域网或广域网彼此连接的多台信息处理装置或其一些功能来构造。当然,可以按任意方式设置构成网络的通信电路的类型、通信方案等(例如,LAN、WLAN、WAN、因特网、移动电话线路、固定电路线路、ADSL、光纤、GSM、LTE 等)。如图22中所示,推荐系统200主要由用户喜好提取引擎201、特征数据库202、内容特征提取引擎203、变动提取引擎204、变动数据库205、推荐引擎206和变动类型数据库207构成。注意的是,尽管在附图中未示出,但推荐系统200具有用于从外部电子设备10和20获取信息的单元。另外,电子设备10和20可以是互不相同的装置,或者可以是相同的装置。当用户作出行动时,关于行动的信息被输入到用户喜好提取引擎201和变动提取引擎204中作为行动历史。注意的是,下文中,为了便于说明,将以用户选择内容的行动的例子为例来提供说明。在这种情况下,用户通过操作电子设备10而选择的内容的信息(例如,元数据)被输入到用户喜好提取引擎201和变动提取引擎204中作为行动历史。当输入行动历史时,用户喜好提取引擎201参照输入的行动历史中包括的内容的元数据,然后提取表征该内容的特征信息CP。在本实施例中,由表征内容的单词群构成的单词矢量被用作特征信息CP。当针对行动历史中包括的各内容生成单词矢量时,用户喜好提取引擎201将生成的单词矢量存储在特征数据库202中。注意的是,在以下说明中,将用Wct表示针对各内容生成的单词矢量。另外,用户喜好提取引擎201收集针对各用户的行动历史中包括的内容生成的单词矢量WCT,然后通过叠加单词矢量\ ,生成表示各用户的喜好的单词矢量WUP。然后,用户喜好提取引擎201将生成的单词矢量Wup存储在特征数据库202中。注意的是,作为生成单词矢量Wup的方法,例如,考虑的是如下方法:从构成某个用户的行动历史中包括的内容群的单词提取具有高分值的单词,然后将该单词设置成单词矢量评^。另外,作为其它方法,考虑的是如下方法:从某个用户的行动历史中包括的各内容提取单词矢量Wq),然后通过将具有高分值的单词和单词矢量Wct组合来生成单词矢量WUP。在使用这些方法或其它已知方法的处理中,通过直接或间接叠加在针对各用户生成的单词矢量WCT,来生成表征用户行动历史的单词矢量WUP。特征数据库202还可以存储与用户的行动历史不相关的内容的单词矢量W『这类单词矢量Wcp是由内容特征提取引擎203生成的。内容特征提取引擎203从外部信息源获取内容的元数据,然后根据所获取的元数据生成单词矢量Wqjij此时,内容特征提取引擎203用与用户喜好提取引擎201相同的方法生成单词矢量W&以此方式,特征数据库202存储针对用户行动历史中包括的内容和外部内容而得到的多个单词矢量Wa^PWuptj注意的是,特征数据库202根据输入到用户喜好提取引擎201的行动历史的更新或内容特征提取引擎203获取的外部内容的变动而适当更新。当如上所述构建或更新特征数据库202时,变动提取引擎204使用特征数据库202中存储的单词矢量Wct和W UP,提取表示从原因到结果这一处理所产生的用户喜好变动的变动分量R。在单词矢量基的情况下,用得自对应于原因的行动历史的单词矢量Wup和得自对应于结果的行动历史的特征矢量Wct (下文中,Wupe)之差表达变动分量R。具体地讲,用在单词矢量Wupe中存在而在单词矢量Wup中不存在的单词群(下文中,出现单词群)和在单词矢量Wup中存在而在单词矢量Wupe中不存在的单词群(下文中,消失单词群)表达变动分量R。
首先,变动提取引擎204用与上述第一实施例(参见图13)相同的方式将行动历史分成原因和结果的组合(事例)。然后,变动提取引擎204从特征数据库202提取对应于各事例的单词矢量Wup和WUPe,提取矢量之差,然后生成变动分量R。在生成变动分量R之后,变动提取引擎204将所生成的变动分量R存储在变动数据库205中。当如上所述地构建了特征数据库202和变动数据库205时,可以使用数据库中存储的信息来推荐内容。对内容的推荐是通过推荐引擎206的功能实现的。首先,当从用户接收到推荐请求时,推荐引擎206根据推荐请求开始内容的推荐处理。推荐请求是基于用户的新行动发出的。例如,当用户通过操作电子设备20选择新内容时,从电子设备20向推荐引擎206发送推荐请求。此时,电子设备20向推荐引擎206发送用户的行动历史(示出选择新内容的行动等的信息)。当接收到行动历史时,推荐引擎206根据表征行动历史中包括的内容的单词矢量Wct生成表征用户的单词矢量Wu/。此时,当在生成单词矢量Wu/的处理中使用的单词矢量Wcp已经被存储在特征数据库202中时,推荐引擎206从特征数据库202获取对应的单词矢量1Ρ。另一方面,当单词矢量Wcp没有被存储在特征数据库202中时,推荐引擎206根据从电子设备20接收的行动历史中包括的内容的元数据生成表征该内容的单词矢量WCP。然后,推荐引擎206通过叠加单词矢量WCT,生成单词矢量Wu/。注意的是,生成单词矢量Wu/的方法与用户喜好提取引擎201生成单词矢量Wup的方法基本相同。当生成单词矢量Wu/时,推荐引擎206使用单词矢量Wu/和变动矢量R来搜索用作推荐因子的W。/’的集合。具体地讲,推荐引擎206选择变动分量R,并且将所选变动分量R与单词矢量Wu/合成,以将结果设置为推荐因子。变动分量R被存储在变动数据库205中。变动分量R表示从原因到结果的处理所产生的用户的喜好变动。然而,当存在多个类似事例时,优选为将事例聚类,然后选择代表各聚类的单词矢量Wup和WUPe,或者将变动分量R合并到表达聚类之间变动的单词集。另外,可以使对应于单词矢量Wup的聚类对应于多个变动分量R。此外,可以对各变动分量R设置分值或权重值。当使用聚类时,推荐引擎206选择接近单词矢量Wu/的聚类,并且随后获取对应于该聚类的变动分量R。然后,推荐引擎206通过合成单词矢量Wu/和变动矢量R来生成推荐因子。另外,当选择变动分量R时,推荐引擎206从变动类型数据库207读取与所选变动分量R对应的变动类型的信息,并且将变动类型的信息连同推荐结果一起提供给用户。例如,当变动分量R表示“清淡”时,变动类型数据库207存储与该变动分量R对应的表示“清淡”的数据(例如,文本数据、音频数据、图像数据等)作为变动类型的信息。为此,推荐引擎206为用户提供表示“清淡”的数据作为推荐理由,并且连带为用户提供使用基于变动分量R和单词矢量Wu/的推荐因子检测到的推荐结果(例如,参见图19)。当使用户选择变动分量R时,变动类型的信息可以被用作识别选项的信息(例如,参见图20)。上文中,已经说明了根据本实施例的推荐系统200的系统结构。在此所述的系统结构是例子,并且可以根据实施例适当变动它的某些结构元件。不用说,这种变动也落入本实施例的技术范围内。[3-2:学习处理的流程(图23和图24)]接着,将参照图23和图24说明根据实施例的学习处理的流程。注意的是,在此提到的学习处理意指特征数据库202和变动数据库205的构建处理。
(3-2-1:概要(图 23))首先,将参照图23。图23是根据本实施例的学习处理的概要的示例性图示。另外,注意的是,图23所示的处理过程是通过简化处理次序和细节而表达的,以使根据本实施例的学习处理的细节更容易理解。另外,因为用于生成事例的处理过程与上述第一实施例基本相同,所以在此将省略对其的说明。首先,当得到事例#1、…、事例#m时,针对各事例执行用于生成变动矢量R的处理过程。例如,当考虑某个事例时,从构成原因A的内容群(单词集A:WUP),提取表征该内容群的一个或多个单词矢量以相同的方式,从构成结果B的内容(单词集B:WUPe),提取表征该内容的单词矢量然后,提取单词矢量Wupe和单词矢量Wup之差(消失单词群和出现单词群),然后生成变动分量R。以此方式,生成分别对应于事例#1、…和事例#m的变动分量札、…和Rm。在上述处理过程中生成的单词矢量被存储在特征数据库202中,并且变动分量被存储在变动数据库205中。上文中,已经说明了根据本实施例的学习处理的概要。注意的是,可以在针对事例#1、…和事例#m得到变动分量R时执行对事例的聚类。在这种情况下,已经受聚类的特征矢量和已经受合并的变动分量被分别存储在特征数据库202和变动数据库205中。(3-2-2:细节(图 24))接着,将参照图24。图24是根据本实施例的学习处理的流程的示例性图示。如图24中所示,推荐系统200首先根据内容的元数据生成表征该内容的单词矢量W(S201)。接着,推荐系统200从用户的行动历史提取“原因和结果”的组合(事例)(S202)。接着,推荐系统200针对所有的“原因和结果”的组合,提取“原因”的单词矢量Wup和“结果”的单词矢量Wupe之差(消失单词群dW和出现单词群aW),然后生成变动分量R (S203)。然后,推荐系统200将已经受 聚类的单词矢量Wct和单词矢量Wup存储在特征数据库202中,并且将已经受合并的变动分量R存储在变动数据库205中(S204)。此后,推荐系统200结束与学习处理相关的一系列处理。上文中,已经说明了根据本实施例的学习处理的流程。在图24的例子中,已经说明了没有执行聚类处理和合并处理的情况,但是处理流程也可以变形为考虑对单词矢量的聚类处理和对变动分量的合并处理。[3-3:推荐处理的流程(图25和图26)]接着,将参照图25和图26说明根据本实施例的推荐处理的流程。(3-3-1:概要(图 25))如图25中所示,在推荐处理中,使用用户的新行动历史(新原因C)。首先,推荐引擎206提取表征构成新原因C的内容群(单词集C)的一个或多个单词矢量WC。接着,推荐引擎206选择变动数据库105中存储的变动分量R,然后通过向单词集C应用所选变动分量R来生成推荐因子。具体地讲,通过从单词集C删除消失单词群然后向其追加出现单词群来生成推荐因子(单词集D)。接着,推荐引擎206使用所生成的推荐因子来搜索推荐候选项。然后,推荐引擎206向用户呈现推荐候选项之中的预定数量的推荐结果。此时,推荐引擎206连同推荐结果向用户呈现关于变动类型的信息(推荐理由)。上文中,已经说明了根据本实施例的推荐处理的概要。注意的是,在以上说明中,使用措辞“单词集”,但是单词矢量也是单词集的一个例子。另外,通过多个单词矢量构成的单词矢量群也是单词集的例子。(3-3-2:细节(图 26))接着,将参照图26说明根据本实施例的推荐处理的流程。如图26中所示,推荐引擎206获取用作推荐对象的用户的行动历史作为新原因(S211)。然后,推荐引擎206生成表征步骤S211中获取的行动历史的单词矢量1/(5212)。然后,推荐引擎206通过向单词矢量Wu/应用变动矢量R(消失单词群dW和出现单词群aW)来生成单词矢量Wup/,然后使用单词矢量Wup/提取推荐候选项(S214)。然后,推荐引擎206向用户呈现与变动分量R对应的推荐候选项连同推荐理由(S215)。此后,推荐引擎206结束与推荐处理相关的一系列处理。上文中,已经说明了根据本实施例的推荐处理的流程。[3-4:与特征矢量基的组合]目前,已经说明了单词矢量基的例子。另外,已经说明了特征矢量基的例子。这些例子可以单独使用,而且还可以组合起来使用。例如,当包括图像数据和文本数据的内容被设置为行动的对象时,考虑将特征矢量基的结构应用于图像数据并且将单词矢量基的结构应用于文本数据的组合技术。另外,对于将包括音频数据或其它二进制数据而不是图像数据的内容设置为行动的对象的情况,同样如此。另外,考虑将在特征矢量基的结构和单词矢量基的结构两者中提取的推荐候选项都向用户呈现的组合技术。此外,可以使用如下结构:计算通过该组合技术而提取的推荐候选项的分值,并且向用户呈现具有降序分值的预定数量的推荐候选项。以此方式,能够组合特征矢量基和单词矢量基的结构。另外,这种组合也属于根据本技术的实施例的技术范围。上文中,已经说明了特征矢量基和单词矢量基的结构的组合技术。上文中,已经说明了根据本技术的第二实施例。如在此举例说明的,可以使用单词矢量实现根据本技术的实施例的技术思想。另外,该结构可以与特征矢量基的结构组合。〈4:关于可应用性〉目前,为了便于说明,已经在包括文本数据的数字内容的条件下提供了说明。然而,根据本技术的实施例的技术范围还可以应用于除了包括文本数据的数字内容之外的行动对象。例如,在音乐数据的情况下,如果从其波形等提取特征量,则可以对其应用特征矢量基的结构。另外,在图像数据的情况下,如果从其颜色、边缘信息等提取特征量,则可以对其应用特征矢量基的结构。在运动图像数据的情况下,如果从每帧的颜色或边缘信息、帧内编码信息、帧间编码信息、情景信息、章节信息等提取特征量,则可以对其应用特征矢量基的结构。另外,就音乐数据而言,可以向其赋予包括艺术家名、传记、流派、销售、评级、基调信息等的元数据。基于此,因为可以从元数据提取单词矢量,所以可以对其应用特征矢量基和单词矢量基的结构。以类似方式,就图像数据而言,可以向其赋予包括人、地点、对象、时间、拍摄条件(例如,F值、缩放值、闪光灯的使用等)等的元数据。基于此,因为可以从元数据提取单词矢量,所以可以对其应用特征矢量基和单词矢量基的结构。另外,就运动图像数据而言,可以向其赋予包括表演者、流派、用户的评论等的元数据。另外,就电影、电视视频等而言,可以得到包括赞助人名、预告信息等的元数据。基于此,因为可以从元数据提取单词矢量,所以可以对其应用特征矢量基和单词矢量基的结构。注意的是,就书、日记、主页、研究论文等包括的文章而言,可以向其赋予包括出版日期、种类、流派、出版社信息、作者信息等的元数据。基于此,因为可以从元数据提取单词矢量,所以可以对其应用特征矢量基和单词矢量基的结构。除此之外,例如,可以使用利用GPS功能的移动轨迹、利用POS系统等得到的购买或租借历史等、通话历史、电子邮件收发历史、音乐播放器的操作历史、主页的访问历史等。此外,还可以从家庭用电使用状态等得到家用电器的使用历史,得到汽车或摩托车等的运行历史,或者可以得到公共运输机构的票务历史,使得该历史可以作为用于推荐的行动历史。另外,要推荐的内容不限于数字内容,并且能够推荐包括各种商品和服务的任意对象。以此方式,根据本技术的实施例的技术思想具有广泛的可应用性。上文中,已经说明了根据本技术的实施例的技术思想的可应用性。不用说,可应用性当然不限于上述例子。<5:硬件结构例(图27) >可以使用例如图27中示出的信息处理装置的硬件结构来实现构成上述推荐系统100和200的各结构元件的功能。换句话讲,通过使用计算机程序控制图27中示出的硬件来实现各结构元件的功能。注意的是,硬件的形式是任意的,例如,在此包括移动信息终端(包括个人计算机、移动电话、PHS、PDA等)、游戏机和各种信息电器。此外,以上的“PHS”是个人手持电话系统的缩写。另外,以上的“PDA”是个人数字助理的缩写。如图27中所示,该硬件主要包括CPU 902、ROM 904、RAM906、主机总线908和电桥910。此外,该硬件包括外部总线912、接口 914、输入单元916、输出单元918、存储单元920、驱动器922、连接端口 924和通信单元926。此外,CPU是中央处理单元的缩写。另外,ROM是只读存储器的缩写。此外,RAM是随机存取存储器的缩写。例如,CPU 902用作算术处理单元或控制单元,并且基于R0M904、RAM 906、存储单元920或可移除记录介质928上记录的各种程序,控制各结构元件的整体运行或部分运行。ROM 904是用于存储例如待加载到CPU 902上的程序或在算术运算中使用的数据等。RAM906暂时或永久地存储例如待加载到CPU 902上的程序或在执行程序的处理中任意改变的各种参数等。这些结构元件通过例如能够执行高速数据传输的主机总线908彼此连接。对于它的部分,例如,主机总线908通过电桥910连接到数据传输速度相对较低的外部总线912。此外,例如,输入单元916是鼠标、键盘、触摸面板、按钮、开关或操纵杆。另外,输入单元916可以是通过使用红外线或其它无线电波而能够发送控制信号的远程控制器。例如,输出单元918是诸如CRT、IXD、PDP或ELD等的显示装置、诸如扬声器或耳机等的音频输出装置、打印机、移动电话或传真机,这些装置可以以可视或可听方式告知用户所获取的信息。此外,CRT是阴极射线管的缩写。LCD是液晶显示器的缩写。PDP是等离子体显示面板的缩写。另外,ELD是电致发光显示器的缩写。存储单元920是用于存储各种数据的装置。例如,存储单元920是诸如硬盘驱动器(HDD)的磁性存储装置、半导体存储装置、光学存储装置或磁-光存储装置。HDD是硬盘驱动器的缩写。驱动器922是读取记录在诸如磁盘、光盘、磁-光盘等可移除记录介质928上记录的信息,或者将信息写入可移除记录介质928的装置。例如,可移除记录介质928是DVD介质、蓝光(Blu-ray)介质、HD-DVD介质、各种半导体存储介质等。当然,例如,可移除记录介质928可以是搭载有非接触式ID芯片的IC卡或电子设备。IC是集成电路的缩写。连接端口 924是诸如USB端口、IEEE1394端口、SCS1、RS-232C端口的端口或用于连接诸如光学音频端口的外部连接装置930的端口。例如,外部连接装置930是打印机、移动音乐播放器、数码相机、数码摄像机或IC记录器。此外,USB是通用串行总线的缩写。另夕卜,SCSI是小计算机系统接口的缩写。通信单元926是将连接到网络932的通信装置,并且是例如用于有线或无线LAN、Bluetooth (蓝牙,注册商标)或WUSB的通信卡、光学通信路由器、ADSL路由器或用于各种通信的调制解调器。连接到通信单元926的网络932由有线连接或无线连接网络构成,并且例如是因特网、家用LAN、红外通信、可见光通信、广播或卫星通信。此外,LAN是局域网的缩写。另外,WUSB是无线USB的缩写。此外,ADSL是不对称数字用户线。〈6:总结〉最后,将简要总结本实施例的技术思想。以下说明的技术思想可以应用于各种信息处理装置,如,PC、移动电话、游戏机、信息终端、信息家电、汽车导航系统、成像装置、图像记录和再现装置、视频接收器、视频显示装置、机顶盒和通信装置。例如,可以如下地表达上述的信息处理装置的功能结构。以下(I)中将说明的信息处理装置包括如下构造:在提取信息的处理中使用表示对应于原因的第一特征信息和对应于结果的第二特征信息之间差的差分特征信息。另外,信息处理装置包括如下构造:使用差分特征信息和对应于新原因的第三特征信息,得到将在提取信息的处理中使用的第四特征信息。通过使用差分特征信息来考虑用户的喜好变动。另一方面,因为在提取信息的处理中使用第三特征信息,所以考虑的是用户的固定的喜好。结果,在以下(I)中将说明的信息处理装置提取的信息中考虑的是用户的喜好变动和固定的喜好。换句话讲,可以为用户提供给予用户新鲜感同时兼顾用户本质品味的信息。注意的是,因为以下(I)中将说明的信息处理装置用特征信息的差表达用户的喜好变动,所以可以通过具有相对较轻负担的处理得到如上所述的合适信息。(I) 一种信息处理装置,包括:差分应用单元,根据表示第一特征信息与第二特征信息之间的差的差分特征信息、以及第三特征信息,得到第四特征信息,其中所述第一特征信息表征对象用户的行动,所述第二特征信息表征所述对象用户在执行上述行动之后执行的另一行动,所述第三特征信息表征所述对象用户新执行的行动;以及对象提取单元,提取基于所述第四特征信息的信息。(2)根据(I)所述的信息处理装置,其中,所述第一特征信息是所述对象用户选择的一条或多条内容,并且所述第二特征信息是在所述对象用户选择所述一条或多条内容之后,由所述对象用户选择的内容。( 3 )根据(I )或(2 )所述的信息处理装置,其中,所述差分应用单元通过使所述差分特征信息作用于所述第三特征信息,来得到所述第四特征信息。(4)根据(2)或(3)所述的信息处理装置,其中,所述第一特征信息用第一特征矢量来表达,
所述第二特征信息用第二特征矢量来表达,所述差分特征信息用特征量空间中的表示所述第一特征矢量和所述第二特征矢量之间差的差分特征矢量来表达,所述第三特征信息用第三特征矢量来表达,并且所述差分应用单元通过将所述第三特征矢量和所述差分特征矢量合成来得到第四特征矢量作为所述第四特征信息。(5)根据(4)所述的信息处理装置,其中,基于由从所述对象用户选择的一条或多条内容提取的特征单词群构成的第一单词矢量来得到所述第一特征矢量,并且基于由从所述对象用户选择所述一条或多条内容之后选择的内容提取的特征单词群构成的第二单词矢量来得到所述第二特征矢量。(6)根据(5)所述的信息处理装置,其中,通过对从所述对象用户选择的所述一条或多条内容提取的特征单词群构成的所述第一单词矢量进行尺度压缩,来得到所述第一特征矢量,并且通过将由从所述对象用户选择所述一条或多条内容之后选择的内容提取的特征单词群构成的所述第二单词矢量映射到规定所述第一特征矢量的特征量空间,来得到所述
第二特征矢量。(7)根据(5)或(6)所述的信息处理装置,其中,构成所述第一单词矢量的各单词被设置有根据单词的重要度的权重值,并且当得到所述第一特征矢量时考虑该权重值,并且构成所述第二单词矢量的各单词被设置有根据单词的重要度的权重值,并且当得到所述第二特征矢量时考虑该权重值。(8)根据(3)所述的信息处理装置,其中,所述差分应用单元通过向所述差分特征信息赋予预定权重、然后使所述差分特征信息作用于所述第三特征信息,来得到所述第四特征信息。(9)根据(I)至(3)中的任一项所述的信息处理装置,其中,所述第一特征信息是由从所述对象用户选择的一条或多条内容提取的特征单词群构成的第一单词矢量,所述第二特征信息是由从所述对象用户选择所述一条或多条内容之后选择的内容提取的特征单词群构成的第二单词矢量,并且所述差分特征信息由消失单词矢量和出现单词矢量构成,其中消失单词矢量由包括在所述第一单词矢量中但不包括在所述第二单词矢量中的单词群所构成,出现单词矢量由包括在所述第二单词矢量中但不包括在所述第一单词矢量中的单词群所构成。( 10)根据(9)所述的信息处理装置,其中,所述第三特征信息是由从所述对象用户新选择的内容提取的特征单词群构成的第三单词矢量,并且当包括在所述消失单词矢量中的单词被包括在所述第三单词矢量中时,所述差分应用单元从所述第三单词矢量删除所述消失单词矢量中包括的所述单词,并且当存在包括在所述出现单词矢量中但不包括在所述第三单词矢量中的单词时,所述差分应用单元通过将所述出现单词矢量中包括的单词追加到所述第三单词矢量,来得到所述第四特征信息。(11)根据(4)至(8)中的任一项所述的信息处理装置,还包括:差分映射单元,所述差分映射单元使用映射信息,将第一特征量空间中得到的所述差分特征矢量映射到第二特征量空间,所述映射信息使得在属于不同种类的所述第一特征量空间和所述第二特征量空间内的点在这两个特征量空间上彼此相关联,其中,所述差分应用单元通过将所述第三特征矢量与映射到所述第二特征量空间的所述差分特征矢量合成来得到所述第四特征矢量,其中所述第三特征矢量表征所述第二特征量空间所属种类中的所述对象用户新选择的内容。(12)根据(I)至(11)中的任一项所述的信息处理装置,其中,所述差分应用单元从表征用户行动的多条特征信息之中选择具有接近所述第三特征信息的特征的特征信息,然后使用与所选的特征信息对应的差分特征信息得到所述第四特征信息。(13)根据(I)至(11)中的任一项所述的信息处理装置,其中,所述差分应用单元从通过将表征用户行动的多条特征信息聚类而得到的多个聚类之中选择具有接近所述第三特征信息的特征的聚类,然后使用与代表所选聚类的特征信息对应的差分特征信息,得到所述第四特征信息。(14 )根据(I)至(11)中的任一项所述的信息处理装置,还包括:信息提供单元,为用户提供信息,其中,所述差分应用单元从表征用户行动的多条特征信息之中选择具有接近所述第三特征信息的特征的特征信息,所述信息提供单元为用户提供与所述差分应用单元选择的所述特征信息对应的差分特征信息,以促进对所述差分特征信息的选择,并且所述差分应用单元使用由用户选择的差分特征信息,得到所述第四特征信息。( 15 )根据(I)至(11)中的任一项所述的信息处理装置,还包括:信息提供单元,为用户提供信息,其中,所述差分应用单元从通过将表征用户行动的多条特征信息聚类而得到的多个聚类之中选择具有接近所述第三特征信息的特征的聚类,所述信息提供单元为用户提供与代表所述差分应用单元选择的聚类的特征信息对应的差分特征信息,以促进对该差分特征信息的选择,并且所述差分应用单元使用由用户选择的所述差分特征信息得到所述第四特征信息。(16) 一种信息处理方法,包括:根据表示第一特征信息与第二特征信息之间的差的差分特征信息、以及第三特征信息,得到第四特征信息,其中所述第一特征信息表征对象用户的行动,所述第二特征信息表征所述对象用户在执行上述行动之后执行的另一行动,所述第三特征信息表征所述对象用户新执行的行动;以及提取基于所述第四特征信息的信息。( 17) 一种计算机实现如下功能的程序:差分应用功能,根据表示第一特征信息与第二特征信息之间的差的差分特征信息、以及第三特征信息,得到第四特征信息,其中所述第一特征信息表征对象用户的行动,所述第二特征信息表征所述对象用户在执行上述行动之后执行的另一行动,所述第三特征信息表征所述对象用户新执行的行动;以及对象提取功能,提取基于所述第四特征信息的信息。( 18) 一种计算机可读记录介质,所述计算机可读记录介质上记录有使计算机实现如下功能的程序:差分应用功能,根据表示第一特征信息与第二特征信息之间的差的差分特征信息、以及第三特征信息,得到第四特征信息,其中所述第一特征信息表征对象用户的行动,所述第二特征信息表征所述对象用户在执行上述行动之后执行的另一行动,所述第三特征信息表征所述对象用户新执行的行动;以及对象提取功能,提取基于所述第四特征信息的信息。(参考)上述的推荐引擎106和206是差分应用单元、目标提取单元、差分映射单元或信息提供单元的例子。尽管已参照附图详细说明了本发明的优选实施例,但本发明不限于此。对于本领域的技术人员显而易见的是,各种修改形式或变形形式是可能的,只要它们落入所附权利要求书或其等同物的技术范围内。应该理解,这类修改形式或变形形式也落入本发明的技术范围内。本领域的普通技术人员应该理解,根据设计要求和其它因素,可能出现各种修改形式、组合、子组合和替代形式,只要它们落入所附权利要求书或其等同物的范围内。本技术包含与2011年11月14日在日本专利局提交的日本优先权专利申请JP2011-248604中公开的主题相关的主题,该优先权专利申请的全部内容特此以引用方式并入。
权利要求
1.一种信息处理装置,包括: 差分应用单元,根据表示第一特征信息与第二特征信息之间的差的差分特征信息、以及第三特征信息,得到第四特征信息,其中所述第一特征信息表征对象用户的行动,所述第二特征信息表征所述对象用户在执行上述行动之后执行的另一行动,所述第三特征信息表征所述对象用户新执行的行动;以及 对象提取单元,提取基于所述第四特征信息的信息。
2.根据权利要求1所述的信息处理装置, 其中,所述第一特征信息是所述对象用户选择的一条或多条内容,并且所述第二特征信息是在所述对象用户选择所述一条或多条内容之后,由所述对象用户选择的内容。
3.根据权利要求1所述的信息处理装置,其中,所述差分应用单元通过使所述差分特征信息作用于所述第三特征信息,来得到所述第四特征信息。
4.根据权利要求2所述的信息处理装置, 其中,所述第一特征信息用第一特征矢量来表达, 所述第二特征信息用第二特征矢量来表达, 所述差分特征信息用特征量空间中的表示所述第一特征矢量和所述第二特征矢量之间差的差分特征矢量来表达, 所述第三特征信息用第三特征矢量来表达,并且 所述差分应用单元通过 将所述第三特征矢量和所述差分特征矢量合成来得到第四特征矢量作为所述第四特征信息。
5.根据权利要求4所述的信息处理装置, 其中,基于由从所述对象用户选择的一条或多条内容提取的特征单词群构成的第一单词矢量来得到所述第一特征矢量,并且 基于由从所述对象用户选择所述一条或多条内容之后选择的内容提取的特征单词群构成的第二单词矢量来得到所述第二特征矢量。
6.根据权利要求5所述的信息处理装置, 其中,通过对从所述对象用户选择的所述一条或多条内容提取的特征单词群构成的所述第一单词矢量进行尺度压缩,来得到所述第一特征矢量,并且 通过将由从所述对象用户选择所述一条或多条内容之后选择的内容提取的特征单词群构成的所述第二单词矢量映射到规定所述第一特征矢量的特征量空间,来得到所述第二特征矢量。
7.根据权利要求5所述的信息处理装置, 其中,构成所述第一单词矢量的各单词被设置有根据单词的重要度的权重值,并且当得到所述第一特征矢量时考虑该权重值,并且 构成所述第二单词矢量的各单词被设置有根据单词的重要度的权重值,并且当得到所述第二特征矢量时考虑该权重值。
8.根据权利要求3所述的信息处理装置,其中,所述差分应用单元通过向所述差分特征信息赋予预定权重、然后使所述差分特征信息作用于所述第三特征信息,来得到所述第四特征信息。
9.根据权利要求1所述的信息处理装置, 其中,所述第一特征信息是由从所述对象用户选择的一条或多条内容提取的特征单词群构成的第一单词矢量, 所述第二特征信息是由从所述对象用户选择所述一条或多条内容之后选择的内容提取的特征单词群构成的第二单词矢量,并且 所述差分特征信息由消失单词矢量和出现单词矢量构成,其中消失单词矢量由包括在所述第一单词矢量中但不包括在所述第二单词矢量中的单词群所构成,出现单词矢量由包括在所述第二单词矢量中但不包括在所述第一单词矢量中的单词群所构成。
10.根据权利要求9所述的信息处理装置, 其中,所述第三特征信息是由从所述对象用户新选择的内容提取的特征单词群构成的第三单词矢量,并且 当包括在所述消失单词矢量中的单词被包括在所述第三单词矢量中时,所述差分应用单元从所述第三单词矢量删除所述消失单词矢量中包括的所述单词,并且当存在包括在所述出现单词矢量中但不包括在所述第三单词矢量中的单词时,所述差分应用单元通过将所述出现单词矢量中包括的单词追加到所述第三单词矢量,来得到所述第四特征信息。
11.根据权利要求4所述的信息处理装置,还包括: 差分映射单元,所述差分映射单元使用映射信息,将第一特征量空间中得到的所述差分特征矢量映射到第二特征量空间,所述映射信息使得在属于不同种类的所述第一特征量空间和所述第二特征量空间内的点在这两个特征量空间上彼此相关联, 其中,所述差分应用 单元通过将所述第三特征矢量与映射到所述第二特征量空间的所述差分特征矢量合成来得到所述第四特征矢量,其中所述第三特征矢量表征所述第二特征量空间所属种类中的所述对象用户新选择的内容。
12.根据权利要求1所述的信息处理装置,其中,所述差分应用单元从表征用户行动的多条特征信息之中选择具有接近所述第三特征信息的特征的特征信息,然后使用与所选的特征信息对应的差分特征信息得到所述第四特征信息。
13.根据权利要求1所述的信息处理装置,其中,所述差分应用单元从通过将表征用户行动的多条特征信息聚类而得到的多个聚类之中选择具有接近所述第三特征信息的特征的聚类,然后使用与代表所选聚类的特征信息对应的差分特征信息,得到所述第四特征信肩、O
14.根据权利要求1所述的信息处理装置,还包括: 信息提供单元,为用户提供信息, 其中,所述差分应用单元从表征用户行动的多条特征信息之中选择具有接近所述第三特征信息的特征的特征信息, 所述信息提供单元为用户提供与所述差分应用单元选择的所述特征信息对应的差分特征信息,以促进对所述差分特征信息的选择,并且 所述差分应用单元使用由用户选择的差分特征信息,得到所述第四特征信息。
15.根据权利要求1所述的信息处理装置,还包括: 信息提供单元,为用户提供信息, 其中,所述差分应用单元从通过将表征用户行动的多条特征信息聚类而得到的多个聚类之中选择具有接近所述第三特征信息的特征的聚类, 所述信息提供单元为用户提供与代表所述差分应用单元选择的聚类的特征信息对应的差分特征信息,以促进对该差分特征信息的选择,并且 所述差分应用单元使用由用户选择的所述差分特征信息得到所述第四特征信息。
16.—种信息处理方法,包括: 根据表示第一特征信息与第二特征信息之间的差的差分特征信息、以及第三特征信息,得到第四特征信息,其中所述第一特征信息表征对象用户的行动,所述第二特征信息表征所述对象用户在执行上述行动之后执行的另一行动,所述第三特征信息表征所述对象用户新执行的行动;以及 提取基于所述第四特征信息的信息。
17.一种使计算机实现如下功能的程序: 差分应用功能,根据表示第一特征信息与第二特征信息之间的差的差分特征信息、以及第三特征信息,得到第四特征信息,其中所述第一特征信息表征对象用户的行动,所述第二特征信息表征所述对象用户在执行上述行动之后执行的另一行动,所述第三特征信息表征所述对象用户新执行的行动;以及 对象提取功能,提 取基于所述第四特征信息的信息。
全文摘要
本发明提供了一种信息处理装置、信息处理方法和程序,该信息处理装置包括差分应用单元,根据表示第一特征信息与第二特征信息之间的差的差分特征信息、以及第三特征信息,得到第四特征信息,其中所述第一特征信息表征对象用户的行动,所述第二特征信息表征所述对象用户在执行上述行动之后执行的另一行动,所述第三特征信息表征所述对象用户新执行的行动;以及对象提取单元,提取基于所述第四特征信息的信息。
文档编号G06F17/27GK103198089SQ20121044023
公开日2013年7月10日 申请日期2012年11月7日 优先权日2011年11月14日
发明者宫原正典, 上前田直树 申请人:索尼公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1