信息处理设备、重要度计算方法和程序的制作方法

文档序号:6354628阅读:360来源:国知局
专利名称:信息处理设备、重要度计算方法和程序的制作方法
技术领域
本发明涉及信息处理设备、重要度计算方法和程序。
背景技术
随着近来信息和通信技术的发展,诸如音乐、视频、电子书、新闻文章、产品信息或事件信息之类的各种内容被通过网络提供给用户。然而,对于各个用户,难以从这样大量的内容中找到适合的信息。因此,提供了支持用户找到内容的关键字搜索或风格搜索之类的搜索服务,和由系统推荐适合用户的内容的推荐服务等。例如,在日本未审查专利申请特开 2007-323315号公报中记载了适合许多内容推荐服务采用的称为协同过滤的技术。此外,在日本未审查专利申请特开2007-200339号公报中记载了通过使用基于向量空间模型的匹配来确定要推荐的TV节目的技术。在上述内容搜索服务、内容推荐服务和其它内容相关的服务中,确定服务的有效性的关键因素是内容的属性的处理。一般,内容的属性包括不同类型,例如,人为地给予内容的属性,通过分析内容数据生成的属性以及基于内容上的用户动作计算出的属性。目前, 不仅提供给用户的内容数而且服务中所要处理的内容的属性的多样性都在增加。因此,用于从内容的属性中有效地提取对内容的分类、搜索和推荐重要的属性的技术受到关注。例如,日本未审查专利申请特开平9-325969号公报记载了用于从被分类到类别中的数据的多个属性中提取重要属性的技术的示例。

发明内容
然而,在日本未审查专利申请特开平9-325969号公报中所记载的技术中,重要度时针对每个单独的属性来确定的,并且不能识别关于彼此相关的属性的组合的重要度。例如,“风格”和“年代”是音乐内容的属性的示例。“风格”的属性值是“摇滚乐”、“流行乐”、 “古典乐”等等。“年代”的属性值例如是“20世纪70年代”、“20世纪80年代”、“20世纪90 年代”等。在这样的情形中,即使同一“风格”(例如“摇滚乐”),依赖于其所属于的“摇滚乐”的“年代”对用户也具有不同的含义。具体而言,从内容的大量属性中可以灵活地评估关于属性的各种组合的重要度,期望将这样的重要度用于各种应用,例如,呈现内容的推荐理由或给出用于内容搜索的风格。鉴于以上所述,希望提供能够灵活地评估关于内容的属性的各种组合的重要度的新颖的改进的信息处理设备、重要度计算方法和程序。根据本发明的一个实施例,提供一种信息处理设备,包括存储单元,所述存储单元具有属性表,所述属性表存储给予多个内容的属性值;以及重要度计算单元,所述重要度计算单元使用所述属性表中所存储的属性值,关于除内容的特定属性以外的一个或多个属性来计算对所述内容的特定属性的重要度,其中所述重要度计算单元使用判决表来计算所述重要度,其中将所述特定属性用作判决属性并且将所述一个或多个属性用作条件属性。在该配置中,对所述特定属性的重要度可以使用判决表针对各种组合来计算,其中将所述一个或多个属性用作条件属性的集合。所述重要度计算单元可以基于对于所述判决表形成所述判决属性的正区域的内容的数目来计算所述重要度。所述信息处理设备还可以包括提取单元,所述提取单元根据由所述重要度计算单元计算出的重要度来提取一个或多个重要属性,所述一个或多个重要属性将用于生成与所述内容有关并要呈现给用户的信息。所述信息处理设备还可以包括推荐单元,所述推荐单元通过使用所述属性表中所存储的属性值来选择要推荐给用户的内容,并且,基于由所述提取单元提取的所述一个或多个重要属性来生成推荐理由。所述推荐单元可以将为了内容的选择而计算出的每个内容的得分存储到所述属性表中,并且所述提取单元可以,根据由所述重要度计算单元将所述得分用作判决属性所计算出的重要度,来提取所述一个或多个重要属性。所述属性表还存储基于针对每个内容的用户反馈所给出的反馈属性的属性值,所述推荐单元可以通过使用所述反馈属性的属性值来选择要推荐给用户的内容,并且所述提取单元可以,根据由所述重要度计算单元将所述反馈属性用作判决属性所计算出的重要度,来提取所述一个或多个重要属性。所述属性表还可以存储基于针对每个内容的用户动作的状况所给出的情境属性的属性值,所述推荐单元可以通过使用所述情境属性的属性值来选择要推荐给用户的内容,并且所述提取单元可以,根据由所述重要度计算单元将所述情境属性用作判决属性所计算出的重要度,来提取所述一个或多个重要属性。所述属性表可以存储给予多个内容的基本属性的属性值以及通过分析所述基本属性的属性值获得的扩展属性的属性值。所述提取单元可以根据第一重要度和第二重要度来提取所述一个或多个重要属性,其中所述第一重要度是由所述重要度计算单元将所述特定属性用作判决属性并且将所述扩展属性中包括的一个或多个属性用作条件属性来计算的,所述第二重要度是由所述重要度计算单元将所述扩展属性中所包括的属性用作判决属性并且将所述基本属性中所包括的一个或多个属性用作条件属性来计算的。所述信息处理设备还可以包括分析单元,所述分析单元根据通过PLSA (概率潜在语义分析)或LDA (潜在Dirichlet分配)的概率分类,基于所述基本属性的属性值来计算所述扩展属性的属性值。所述信息处理设备还可以包括内容列表生成单元,所述内容列表生成单元使用所述属性表中所存储的属性值来生成要再现的内容的列表,并且,基于由所述提取单元提取的所述一个或多个重要属性来生成内容列表的标题,其中,所述提取单元可以,根据由所述重要度计算单元将用于所述内容列表生成单元的所述内容列表的生成的属性用作判决属性所计算出的重要度,来提取所述一个或多个重要属性。所述信息处理设备还可以包括内容列表生成单元,所述内容列表生成单元根据用户指定来生成要再现的内容的列表,并且,基于由所述提取单元提取的所述一个或多个重要属性来生成内容列表的标题,其中,所述提取单元可以,根据由所述重要度计算单元将具有依赖于用户指定的存在与否确定的属性值的属性用作判决属性所计算出的重要度,来提取所述一个或多个重要属性。所述存储单元还可以包含历史数据,所述历史数据指示针对多个内容的用户动作的历史,并且所述重要度计算单元可以通过使用所述历史数据中所包括的内容的属性值来为每个用户关于所述一个或多个重要属性计算所述重要度。所述重要度计算单元可以根据粗糙集合理论来导出所述判决表中的所述判决属性的正区域。根据本发明的另一实施例,提供一种信息处理设备中的重要度计算方法,所述信息处理设备具有利用存储介质存储了给予多个内容的属性值的属性表,所述方法包括以下步骤使用所述属性表中所存储的属性值,关于除内容的特定属性以外的一个或多个属性来计算对所述内容的特定属性的重要度,其中所述重要度是使用判决表来计算的,其中将所述特定属性用作判决属性并将所述一个或多个属性用作条件属性。根据本发明的一个实施例,提供一种程序,所述程序使得控制信息处理设备的计算机用作以下单元,其中所述信息处理设备具有利用存储介质存储了给予多个内容的属性值的属性表,所述计算机被使得用作重要度计算单元,所述重要度计算单元使用所述属性表中所存储的属性值,关于除内容的特定属性以外的一个或多个属性来计算对所述内容的特定属性的重要度,其中所述重要度计算单元使用判决表来计算所述重要度,其中将所述特定属性用作判决属性并且将所述一个或多个属性用作条件属性。根据上述本发明的实施例,可以提供能够灵活地评估关于内容的属性的各种组合的重要度的新颖的改进的信息处理设备、重要度计算方法和程序。


图1是示出根据一个实施例的信息处理设备的配置的框图;图2是用于说明根据一个实施例的属性表的概述的说明性示图;图3是用于说明作为存储在属性表中的基本属性的元数据的示例的说明性示图;图4是用于说明作为基本属性存储在属性表中的情境数据的示例的说明性示图;图5是用于说明属性表中所存储的扩展属性的概述的说明性示图;图6是用于说明图5中示出的扩展属性的具体示例的说明性示图;图7是用于说明属性表中所存储的评价输出的示例的说明性示图;图8是用于说明判决表中所涉及的概念的说明性示图;图9是用于说明基于判决表计算重要度的说明性示图;图10是用于说明性基于判决表计算出的重要度的示例的说明性示图;图11是用于说明基于判决表计算出的重要度的另一示例的说明性示图;图12是用于说明重要属性的逐步提取的说明性示图;图13是用于说明呈现推荐理由的画面的示例的说明性示图;图14是用于说明性呈现推荐理由的画面的另一示例的说明性示图;图15是示出根据一个实施例的信息处理设备的预处理的流程的示例的流程图。图16是示出根据一个实施例的信息处理设备的推荐处理的流程的示例的流程图;图17是示出根据一个可替换示例的信息处理设备的配置的框图18是用于说明根据另一可替换示例的个人化的说明性示图;以及图19是示出硬件配置的示例的框图。
具体实施例方式以下将参考附图来详细描述本发明的优选实施例。注意,在该说明书和附图中,具有基本相同的功能和结构的结构元件用相同的标号表示,并且省略对这些结构元件的重复描述。将以如下顺序来描述
具体实施例方式1.术语描述2.根据一个实施例的信息处理设备的示例性配置2-1.属性表2-2.存储单元2-3.分析单元2-4.用户接口控制单元2-5.推荐单元2-6.重要度计算单元2-7.提取单元2-8.画面示例3.根据一个实施例的处理流程3-1.预处理3-2.推荐处理4.可替换示例4-1.播放列表的提供4-2.个人化5.示例性硬件配置6.总结<1.术语描述〉本说明书中所使用的主要术语的描述如下-概率分类一种用于将内容或文本的集合的要素分类到子集中的技术。在概率分类中,一个内容或文本可能以相同的概率归属于多个子集。-潜在话题该概念对应于概率分类中的每个子集并且潜在地贡献于每个内容或文本的出现。可以认为是用于表达每个子集的领域、话题等。-PLSA(概率潜在语义分析)概率分类之一。通过潜在话题提供概率生成模型并且其在文本分类领域中被广泛使用。-LDA (潜在Dirichlet分配)概率分类之一,其是PLSA的扩展。通过潜在话题提供概率生成模型并且其在文本分类领域中被广泛使用。-话题集合以相同的归属概率被分类到给定潜在话题中的内容或文本的集合。-粗糙集合理论作为用于分析判决表的基础的理论,该分析伴随由于不可辨识性引起的不确定性。
-明晰(crisp)-粗糙集合理论一种粗糙集合理论。该技术用于通过在可以以某一水平指定对象集合的范围中选择属性来计算对象的充分逼近。-模糊-粗糙集合理论一种粗糙集合理论,其是明晰-粗糙集合理论的扩展。该技术使得能够通过将对象属性从名词属性扩展成数字属性来处理连续值中的属性以及对象的描述。-推荐引擎基于用户的偏好或用户关于内容的动作来推荐内容的系统模块。推荐引擎基于各种推荐算法,例如已被付诸实践的CF或CBF。-CF 协同过滤。一种推荐算法。该技术积累多个用户的偏好数据并且基于与和与给定用户具有类似偏好的另一用户有关的数据来进行推荐等。-CBF 基于内容的过滤。一种推荐算法。该技术基于内容的属性数据的相似性来进行内容的推荐等。-推荐理由当推荐引擎推荐内容时向用户呈现的有关推荐依据的说明。<2.根据一个实施例的信息处理设备的示例性配置〉根据本发明一个实施例的信息处理设备100通常是这样的设备,其具有存储了用于多个内容的属性值的属性表,并且关于除内容的特定属性以外的一个或多个属性来计算指示对该特定属性的贡献度的重要度。在该实施例中,信息处理设备100还具有推荐功能。 信息处理设备100选择要被推荐给用户的内容,根据计算出的重要度生成推荐的理由,并且向用户呈现与要推荐的内容有关的信息和推荐理由。图1是示出根据本发明一个实施例的信息处理设备100的配置的框图。参考图1, 信息处理设备100包括存储单元110、分析单元120、用户接口(UI)控制单元130、推荐单元 140、重要度计算单元150和提取单元160。信息处理设备100例如可以是能够通过UI控制单元130播放存储单元110中所存储的内容的内容播放器。可替换地,信息处理设备100 例如可以是通过UI控制单元130经由网络向终端设备提供内容数据的内容服务器。更一般地,信息处理设备100可以是任意种类的设备,例如高性能计算机、PC(个人计算机)、数字家电、游戏机、AV播放器或智能电话。[2-1.属性表]首先描述被保存在根据该实施例的信息处理设备100的存储单元110中的属性表。属性表是存储被给予多个内容的一个或多个属性值的表格。图2是用于说明根据该实施例的属性表的概述的说明性示图。参考图2,属性表概括地具有三种属性类别基本属性、扩展属性和评价属性。基本属性进一步被分成两种类别元数据和情境(context)数据。基本属性(元数据)、基本属性(情境数据)、扩展属性和评价属性中的每一个属性都包含一个或多个属性项(各个属性)。对于每个属性项,属性值被给予每个内容。以下,将关于图2中所示出的属性的各个类别来描述属性的更具体的示例。(1)基本属性元数据图3是用于说明作为被存储在属性表中的基本属性的元数据的示例的说明性示图。参考图3,元数据包含五种属性“风格”、“年代”、“氛围”、“关键字”和“艺术家”。在图 3的示例中,那些属性被表示为数字属性。例如,对于“风格”,给出指示每个内容是否属于 "Gl 摇滚乐”、“G2:流行乐”和其它风格的数值作为属性值。例如,内容Cl的“风格”的属性值是(G1,G2,-) = (0.0,1.0,…)。同样,对于“年代”,给出指示每个内容是否属于 "El 70年代(20世纪70年代),V‘E2 :80年代(20世纪80年代)”和其它年代的数值作为属性值。例如,内容Cl的“年代”的属性值是(E1,E2,…)=(1.0,0.0,…)。此外,内容 C2的“年代”的属性值是(E1,E2,…)=(0.0,1.0,…)。注意,一个内容可以以相同的权重属于多个“风格”、“年代”等。“氛围”例如是利用日本未审查专利申请特开2007-207218号公报所公开的技术来分析音乐内容的音频信号的特征值所给出的属性。例如,对每个内容,给出指示每个内容是否给人像“Ml 愉悦的”、“M2 欢乐的”这样的印象的数值作为“氛围”的属性值。“关键字”是作为对从服务提供商或与每个内容有关的用户提供的评论的文本分析的结果给出的属性。例如,对每个内容给出诸如评论中所包含的名词或形容词之类的每个词出现的频率作为“关键字”的属性值。“艺术家”例如是为与音乐内容有关的每个人名给出的属性。例如,对每个内容给出指示其是否与诸如作曲者、作词者、演唱者或演奏者之类的个人有关的数值作为“艺术家”的属性值。应当注意,图3中示出的属性不仅可以以数字属性的形式表示,也可以以名词属性的形式表示。例如,在名词属性的形式中,内容Cl可以表示为“风格” = “G1 摇滚乐”, “年代” ="El 70年代”,并且内容C2可以表示为“风格” ="G2 流行乐”,“年代” =“E2 80年代”(“属性”=“属性值”)。元数据通常可以,独立于诸如用户的浏览、视听或购买(以下称为浏览等)之类的动作、后述推荐处理等,被预先给予每个内容,(2)基本属性情境图4是用于说明作为被存储在属性表中的基本属性的情境数据的示例的说明性示图。情境数据通常是基于对每个内容的用户动作的状况给出的数据。参考图4,情境数据包含两种属性“时间段”和“地点”。例如,“时间段”指示每个内容在“Tl :10-12(点钟)”、 "T2 :12-14(点钟)”和其它时间段期间被浏览等的次数。例如,内容Cl的“时间段”的属性值是(T1,T2,…)=(2,10,…)。此外,内容C2的“时间段”的属性值是(Τ1,Τ2,…)= (3,1,…)。同样,“地点”指示每个内容在“Ρ1 东京”、“Ρ2:大阪”和其它地点被浏览等的次数。例如,内容Cl的“地点”的属性值是(Pl,Ρ2,…)=(8,4,…)。此外,内容C2的 “地点”的属性值是(Ρ1,Ρ2,…)=(0,4,…)。注意,除了图4中示出的属性以外,情境数据例如可以包含可以与用户动作相关联地获得的任意属性,例如,一周内的每天、日期、国家(地点)、用户性别或年龄段。此外,取代像图4中所示的“东京”或“大阪”这样的地理位置,情境数据中可以包含有关像“家”、“办公室”或“汽车内”这样的“地点”的属性值。(3)扩展属性图5是用于说明被存储在属性表中的扩展属性的概述的说明性示图。扩展属性是可以通过分析给予每个内容的基本属性的属性值获得的属性。在该实施例中,属性表具有的扩展属性被划分成两层评论层和人物层。评论层指示每个内容关于每个潜在话题 XI,…,Xm的归属概率,这是通过根据概率分类分析基本属性“关键字”的属性值获得的。 另一方面,人物层指示每个内容关于每个潜在话题Υ1,…,Ym的归属概率,这是通过根据概率分类分析基本属性“艺术家”的属性值获得的。图6是用于说明图5中示出的扩展属性的具体示例的说明性示图。图6的上部为每个内容Cl、C2和C3示出关键字(K1,K2,K3,K4,K5,…的属性值(每个关键字在评论中出现的频率)。关键字ΚΙ、Κ2、Κ3、Κ4和Κ5分别是“绯闻”、“相片集”、“支持度”、“唱片”和 “才能”。对于内容Cl,关键字(Κ1,Κ2,Κ3,Κ4,Κ5,…)=(1,0,2,0,1,…)。对于内容C2, 关键字(Κ1,Κ2,Κ3,Κ4,Κ5,...) = (0,1,0,2,1,…)。对于内容 C3,关键字(Kl,Κ2,Κ3, Κ4,Κ5,…)=(3,0,1,1,0,…)。根据通过PLSA或LDA建模的概率分类,那些关键字依赖于每个内容潜在地属于的潜在话题的贡献而出现在每个内容的评论中。相反,如果根据通过PLSA或LDA的概率分类分析出关键字(Κ1,Κ2,Κ3,Κ4,Κ5,…)的属性值,则可以获得每个内容关于每个潜在话题的归属概率。具体而言,当关键字w在每个内容的评论d中出现的概率是ρ (w I d)时,出现概率 P(WId)用以下等式(1)表示。等式(1)Pi}V\d) = YJP{w\xi)· p{xt\d)在等式⑴中,Xi是潜在话题,p(w|Xi)是关于潜在话题Xi出现字w的概率,并且 P(XiId)是每个内容(即,评论d)的话题分布。注意,潜在话题Xi的数目根据要分析的数据空间的维数等被预先设置为恰当的值(例如,16)。图6的下部示出通过根据通过PLSA或LDA的概率分类分析关键字(Kl,K2,K3, K4, K5,…)的属性值获得的关于每个潜在话题(XI,X2,…,Xn)的归属概率的示例。例如,对于内容Cl,归属概率(XI,X2, -,Xn) = (0.4,0. 1,…,0.3)。对于内容C2,归属概率 (XI,X2…,Xn) = (0. 1,0. 2,…,0.1)。对于内容 C3,归属概率(XI,X2,…,Xn) = (0.6, 0.1,…,0.1)。在该实施例中,各个内容关于每个潜在话题的归属概率被存储在属性表中, 作为扩展属性中一层的属性值。注意,在根据概率分类计算扩展属性时,适于在正规化一个属性项(例如,每个关键字)的范围内的基本属性的属性值之后(在将最大值设置为1之后)应用概率分类。(4)评价属性图7是用于说明被存储在属性表中的评价属性的示例的说明性示图。评价属性通常是指示由推荐引擎或用户对每个内容的评价的属性。参考图7,评价属性被分成两种类别算法得分和用户反馈(FB)。算法得分包括通过一个或多个推荐算法计算出的每个内容的得分S1,S2,…。例如,得分S 1可以是通过CF(协同过滤)计算出的得分,而得分S2可以是通过CBF(基于内容的过滤)计算出的得分。在该情况中,内容Cl的得分Sl例如对应于推荐所针对的用户的用户偏好和已经对内容Cl进行了浏览等的另一用户的用户偏好之间的相似度。此外,内容Cl的得分S2例如对应于被推荐所针对的用户进行了浏览等的内容的元数据和内容Cl 的元数据之间的相似度。另一方面,用户FB包含基于来自用户的反馈或每个内容给出的属性值。用户FB 的属性值指示“Y:喜欢”或“N:不喜欢”的二进制数据、多级(例如,5级)评价中的d得分等。可替换地,用户反馈例如可以包括像用户的浏览等这样的动作的数目。以下,将顺次描述图1中示出的信息处理设备100的各个组件的操作。[2-2.存储单元]
存储单元110使用诸如硬盘或半导体存储器之类的存储介质来配置并且具有以上参考图2至图8描述的属性表。属性表存储上述基本属性、扩展属性和评价属性的各个属性项的属性值。然后,存储单元110利用信息处理设备100的每个组件来输入和输出那些属性值。存储单元110还存储实际的内容数据。例如,当信息处理设备100是音乐播放器时,音乐内容的音频数据可以存储在存储单元110中。[2-3.分析单元]分析单元120根据通过PLSA或LDA的概率分类来基于属性表中的基本属性的属性值计算出扩展输出的属性值。例如,分析单元120通过根据概率分类分析基本属性的属性值中与关键字有关的属性值来计算扩展属性的评论层的属性值。具体而言,扩展属性的评论层的属性值可以是每个内容的话题分布,例如通过将每个内容的话题分布与关键字关于每个潜在话题的出现概率的乘积加和导出与关键字有关的属性值(出现频率)(参考等式(1))。此外,分析单元120通过根据概率分类分析基本属性的属性值中与艺术家有关的属性值来计算扩展属性的人物层的属性值。然后,分析单元120将计算出的扩展属性的属性值存储到属性表中。当内容的数据库(例如存储单元110)中积累某一数目的内容时或者每个月或每年定期地,可以由分析单元120执行根据概率分类的分析。注意,在下文中详细描述了PLSA :Thomas Hofman, “ Probabilistic latent semantic indexing “ ,1999, Proceedings of the 22nd annual international ACM SIGIR conference on Research and development in information retrieval。此夕卜,在
LDA =David Μ. Blei, Andrew Y. Ng, and Michael I. Jordan, “ Latent Dirichlet Allocation" , 2003, Journal of Machine Learning Research, Volume 3。[2-4.用户接口控制单元]UI控制单元130控制信息处理设备100和用户之间的用户接口。用户接口通常包括由显示装置显示的画面接口和诸如鼠标、键盘、触控面板或小键盘之类的输入接口。用户接口还可以包括内容再现接口,例如音频输出电路或视频输出电路。用户接口例如可以安装在信息处理设备100上,或者安装在通过网络连接到信息处理设备100的终端设备上。更具体地,响应于用户对某一内容的动作,例如,UI控制单元130更新该内容的内容数据。具体而言,假定用户例如在东京在上午11点浏览了内容Cl。在该情况中,UI控制单元130为内容Cl更新时间段“Tl :10-12(点钟)”和地点“P1 东京”的属性值。例如,UI 控制单元130可以基于终端设备的IP地址或借助GPS (全球定位系统)来识别出用户浏览内容的地点。此外,例如,UI控制单元130通过输入接口为某一内容获得图7中所示的用户反馈的值并且间所获得的值存储到属性表中。此外,例如,UI控制单元130控制显示器来显示由稍后描述的推荐单元140生成的推荐画面。另外,当信息处理设备100或终端设备设有用于检测用户的状况的感测器时,例如,UI控制单元130可以将通过感测器获得的用户的状况存储到属性表中,作为情境数据的属性值。例如,通过具有微笑感测功能的成像模块可以获得用户的微笑的状况,或者,通过生物感测器可以获得用户的脉搏率或呼吸率的状况。[2-5.推荐单元]推荐单元140用作推荐引擎,其通过使用被存储在存储单元110中所保存的属性表中的属性值来选择要推荐给用户的内容。此外,推荐单元140基于由稍后描述的提取单元160提取的一个或多个重要属性来生成推荐理由。然后,推荐单元140生成用于向用户呈现与要推荐的内容有关的信息和推荐理由,并且使得所生成的推荐画面通过UI控制单元130显示在显示设备上。由推荐单元140进行的内容选择可以根据任意已知的推荐算法来进行,例如上述 CF或CBF。例如,当推荐单元140使用CF作为推荐算法时,推荐单元140指定所具有的偏好与用户的偏好相似的另一用户。接着,推荐单元140提取由指定的其他用户进行了浏览等的一组内容。此时,推荐单元140例如根据偏好的相似度、指定的其他用户对每个内容的评价等,来为所提取出的这组内容中的每个内容计算得分(每个内容对用户的适合度、推荐的可信度等。)所计算出的每个内容的得分被存储到属性表中。然后,推荐单元140选择具有相对较高的得分的内容作为要推荐给用户的内容。另一方面,当推荐单元140使用CBF作为推荐算法时,例如,推荐单元140提取出所具有的元数据与由用户进行了浏览等的内容的元数据相似的一组内容。此时,推荐单元 140例如根据元数据的相似度来为所提取出的这组内容中的每个内容计算得分。计算出的每个内容的得分被存储在属性表中。然后,推荐单元140选择具有相对较高的得分的内容作为要推荐给用户的内容。此外,推荐单元140例如可以通过使用属性表中所存储的有关用户FB的属性值来选择要推荐给用户的内容。例如,在多个内容中,具有合适的有关用户FB的属性值的内容可以被优先地选作要推荐的内容。此外,例如,要推荐给用户的内容可以通过使用属性表中所存储的有关情境数据的属性值来选择。例如,在多个内容中,具有在执行推荐处理期间以及在推荐所针对的用户所位于的地点中被更频繁地浏览等这样的业绩记录的内容被优先地选作要推荐的内容。在选择要推荐的内容之后,推荐单元140使得重要度计算单元150关于除用于内容的选择的特定属性以外的一个或多个属性,计算对该特定属性的重要度。此外,推荐单元140使得提取单元160提取要用于生成要呈现给用户的推荐理由的一个或多个重要度属性。然后,推荐单元140通过使用由提取单元160提取出的一个或多个重要属性来生成推荐理由,并且将显示与要推荐的内容有关的信息和推荐理由的画面输出给UI控制单元130。[2-6.重要度计算单元]重要度计算单元150通过使用属性表中所存储的属性值来关于除内容的特定属性以外的一个或属性计算对该特定属性的重要度。具体地,在该实施例中,重要度计算单元 150通过使用判决表来计算对一个或多个属性的重要度,其中将特定属性作为判决属性并将一个或多个属性作为条件属性。例如,如下所述,重要度计算单元150可以基于对于上述判决表形成判决属性的正区域的内容的数目来计算重要度。判决表中的判决属性的正区域可以根据粗糙集合理论来导出。(1)判决表中所涉及的概念图8是用于说明应用粗糙集合理论的判决表中所涉及的概念的说明性示图。图8 的上部示出判决表的基本结构。图8中示出的判决表是二维表格,其具有沿垂直轴的对象全体集合U和沿水平轴的属性全体集合A。对象全体集合U是内容的集合。另一方面,属性全体集合A是属性项的集合。属性全体集合A是条件属性C和判决属性D的合集。条件属性C和判决属性D两者都包含一个或多个属性。属性值集合V是属性全体集合A中所包含的每个属性可以具有的名词属性的属性值的集合。例如,当图3中示出的属性“风格”和 “年代”是属性全体集合A的元时,V= {{摇滚乐,爵士乐,···},{70年代,80年代,···}}。 属性值函数P是当对象全体集合U的一个元(内容)和属性全体集合A的一个元(属性) 被给定时指定属性值的函数(P :UXA — V)。图8的左下方示出概念集合X。概念集合X是当特定属性的属性值被视为一个概念时属于该概念的内容的集合。例如,当属性A可以具有“Y”或“N”的二进制属性值时,对属性α = “γ”的概念的概念集合Y包括具有属性A = “Y”内容作为元素。图8的右下方示出属性子集P (P£C)和Q (QGD)。属性子集P是条件属性C中要用于重要度计算的条件属性的集合。另一方面,属性子集Q是判决属性C中要用于重要度计算的判决属性的集合。(2)与明晰-粗糙集合有关的定义式表1示出使用上述判决表中所涉及的概念描述的与明晰-粗糙集合有关的定义表达式。
表1.与明晰-粗糙集合有关的定义式项目等式P-等同关系IND{P) = {xeU,yGU\VaGP, a(x) = a(_y)}P-等同类Mp = e C/I G 7M)(P)}
U用P-等同类划分UfP = ^iaePl U IIND{a)}概念X的P-向上逼近P'X = {XGU\ [Χ]Ρ ΓΛΧ^Φ) 二 {χ e t/ I 3y((x,y) e IND(P) λ (ye Χ))}概念X的P-向下逼近P"X = {χ e i/ 丨[X]尸 c Χ} = yy((x,y) e IND(P) (ye X))}U用Q-等同类划分_,υ[χ]2= / xsUP,Q中的正区域POSp(Q)= [jP"X XGlUO 以下参考图9来描述表1中的各个项目。图9的上方示出内容Cl至C6被包括在对象全体集合U中的判决表的示例。图9的判决表中的条件属性的属性子集P包括基本属性中的元数据“风格”、“年代”、“关键字(“世界”)”和“氛围(愉悦的)”。为了描述简明, 假定“风格”、“年代”、和“氛围(愉悦的),,以名词属性的形式表示。判决属性的属性子集A 包括评价属性中的用户FB “喜欢”。在表1中,P-等同关系的等式指示属于对象全体集合U的内容χ和内容y在条件属性的属性子集P中具有等同关系。例如,在图9的判决表中,内容C2的条件属性的属性值和内容C6的条件属性的属性值是相等的,使得内容C2和内容C6具有等同关系。P-等同类指示在条件属性的属性子集P中与某一内容χ具有等同关系的内容的集合。在图9的判决表中,内容C2和内容C6形成一个P-等同类。U用P-等同类划分指示对象全体集合U可以被划分成P-等同类的子集。在图9 的判决表中,对象全体集合U可被划分成5个子集{Cl}、{C2,C6}、{C3}、{C4}和{C5}。概念X的P向上逼近指示基于条件属性的属性子集P的属性值被确定为有可能被包括在概念集合X中的内容的集合。在图9的判决表中,有可能被包括在判决属性Q的“喜欢” =“γ”的概念集合X中的内容是Cl、C2、C4和C6。因此,概念“喜欢” =“Y”的向上逼近是集合{C1,C2,C4,C6}。注意,内容C2被包括在向上逼近中,这是因为与内容C2为等同关系的内容C6中的“喜欢”是“Y”。概念X的P向下逼近指示基于条件属性的属性子集P的属性值被确定为有必要被包括在概念集合X中的内容的集合。在图9的判决表中,被确定为有必要被包括在判决属性Q的“喜欢” = “Y”的概念集合X中的内容是内容Cl和C4。因此,内容C6未被包括在向下逼近中,这是因为与内容C6为等同关系的内容C2的“喜欢”是“N”。U用Q-等同类划分指示对象全体集合U可被划分成Q-等同类的子集。在图9的判决表中,对象全体集合U可被划分成2个子集{C1,C4,C6}和{C2,C3,C5},,它们分别形成判决属性Q的等同类。P,Q中的正区域指示判决属性Q的等同类的P-向下逼近的全部等同类的合集。在图9的判决表中,概念“喜欢” =“Y”的向下逼近是集合{C1,C4}。概念“喜欢” =“N”的向下逼近是集合IC3,C5}。因此,图9的判决表中条件属性P、判决属性Q中的正区域时集合 {{Cl, C4},{C3,C5}}O(3)与模糊-粗糙集合有关的定义式图2针对上述判决表中所涉及的概念来示出与模糊-粗糙集合有关的定义式。使用模糊-粗糙集合取代明晰-粗糙集合使得不仅能够处理有关数字属性的逼近集合,还可以处理有关名词属性的逼近集合。例如,在表2中,模糊等同类μπ(χ)(对象χ中的属性& 的隶属度(membership)值)被表示为0. 0到1. 0的连续值。
权利要求
1.一种信息处理设备,包括存储单元,所述存储单元具有属性表,所述属性表存储给予多个内容的属性值;以及重要度计算单元,所述重要度计算单元使用所述属性表中所存储的属性值,针对除内容的特定属性以外的一个或多个属性,计算对所述内容的特定属性的重要度,其中所述重要度计算单元使用判决表来计算所述重要度,所述判决表将所述特定属性用作判决属性并且将所述一个或多个属性用作条件属性。
2.根据权利要求1所述的信息处理设备,其中所述重要度计算单元基于对于所述判决表形成所述判决属性的正区域的内容的数量来计算所述重要度。
3.根据权利要求2所述的信息处理设备,还包括提取单元,所述提取单元根据由所述重要度计算单元计算出的重要度,提取一个或多个要用于生成与所述内容有关并要呈现给用户的信息的重要属性。
4.根据权利要求3所述的信息处理设备,还包括推荐单元,所述推荐单元通过使用所述属性表中所存储的属性值来选择要推荐给用户的内容,并且,基于由所述提取单元提取的所述一个或多个重要属性来生成推荐理由。
5.根据权利要求4所述的信息处理设备,其中所述推荐单元将为了内容的选择而计算出的每个内容的得分存储到所述属性表中,并且所述提取单元根据由所述重要度计算单元使用所述得分作为判决属性而计算出的重要度,来提取所述一个或多个重要属性。
6.根据权利要求4所述的信息处理设备,其中所述属性表还存储基于针对每个内容的用户反馈所给出的反馈属性的属性值,所述推荐单元通过使用所述反馈属性的属性值,来选择要推荐给用户的内容,并且所述提取单元根据由所述重要度计算单元使用所述反馈属性作为判决属性所计算出的重要度,来提取所述一个或多个重要属性。
7.根据权利要求4所述的信息处理设备,其中所述属性表还存储基于针对每个内容的用户动作的状况所给出的情境属性的属性值,所述推荐单元通过使用所述情境属性的属性值来选择要推荐给用户的内容,并且所述提取单元根据由所述重要度计算单元使用所述情境属性作为判决属性所计算出的重要度,来提取所述一个或多个重要属性。
8.根据权利要求3所述的信息处理设备,其中所述属性表存储给予多个内容的基本属性的属性值以及通过分析所述基本属性的属性值获得的扩展属性的属性值。
9.根据权利要求8所述的信息处理设备,其中所述提取单元根据第一重要度和第二重要度来提取所述一个或多个重要属性,其中所述第一重要度是由所述重要度计算单元使用所述特定属性作为判决属性并且使用所述扩展属性中包括的一个或多个属性作为条件属性而计算的,所述第二重要度是由所述重要度计算单元使用所述扩展属性中所包括的属性作为判决属性并且使用所述基本属性中所包括的一个或多个属性用作条件属性而计算的。
10.根据权利要求9所述的信息处理设备,还包括分析单元,所述分析单元根据通过概率潜在语义分析PLSA或潜在Dirichlet分配LDA 的概率分类,基于所述基本属性的属性值来计算所述扩展属性的属性值。
11.根据权利要求3所述的信息处理设备,还包括内容列表生成单元,所述内容列表生成单元使用所述属性表中所存储的属性值来生成要再现的内容的列表,并且,基于由所述提取单元提取的所述一个或多个重要属性来生成内容列表的标题,其中,所述提取单元根据由所述重要度计算单元使用被所述内容列表生成单元用于生成所述内容列表的属性作为判决属性而计算出的重要度,来提取所述一个或多个重要属性。
12.根据权利要求3所述的信息处理设备,还包括内容列表生成单元,所述内容列表生成单元根据用户指定来生成要再现的内容的列表,并且,基于由所述提取单元提取的所述一个或多个重要属性来生成内容列表的标题,其中,所述提取单元根据由所述重要度计算单元使用具有依赖于用户指定存在与否而确定的属性值的属性作为判决属性而计算出的重要度,来提取所述一个或多个重要属性。
13.根据权利要求1所述的信息处理设备,其中所述存储单元还包含历史数据,所述历史数据指示对于多个内容的用户动作的历史,并且所述重要度计算单元通过使用所述历史数据中所包括的内容的属性值来为每个用户针对所述一个或多个重要属性计算所述重要度。
14.根据权利要求1所述的信息处理设备,其中所述重要度计算单元根据粗糙集合理论来导出所述判决表中的所述判决属性的正区域。
15.一种信息处理设备中的重要度计算方法,所述信息处理设备具有利用存储介质存储了给予多个内容的属性值的属性表,所述方法包括以下步骤使用所述属性表中所存储的属性值,针对除内容的特定属性以外的一个或多个属性, 计算对所述内容的特定属性的重要度,其中,所述重要度是使用判决表来计算的,所述判决表将所述特定属性用作判决属性并将所述一个或多个属性用作条件属性。
16.一种程序,所述程序使得控制具有利用存储介质存储了给予多个内容的属性值的属性表的信息处理设备的计算机用作以下单元重要度计算单元,所述重要度计算单元使用所述属性表中所存储的属性值,针对除内容的特定属性以外的一个或多个属性,计算对所述内容的特定属性的重要度,其中,所述重要度计算单元使用判决表来计算所述重要度,所述判决表将所述特定属性用作判决属性并且将所述一个或多个属性用作条件属性。
全文摘要
本发明公开了信息处理设备、重要度计算方法和程序。该信息处理设备包括存储单元,其具有存储给予多个内容的属性值的属性表;以及重要度计算单元,其使用属性表中所存储的属性值,关于除内容的特定属性以外的一个或多个属性来计算对内容的特定属性的重要度,其中该重要度计算单元使用判决表来计算所述重要度,其中将所述特定属性用作判决属性并且将所述一个或多个属性用作条件属性。
文档编号G06F17/30GK102163211SQ20111004038
公开日2011年8月24日 申请日期2011年2月16日 优先权日2010年2月23日
发明者宫嵜充弘 申请人:索尼公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1