信息处理装置、信息处理方法及程序的制作方法

文档序号:6622019阅读:133来源:国知局
信息处理装置、信息处理方法及程序的制作方法
【专利摘要】本发明公开了一种信息处理装置和信息处理方法。该信息处理装置包括元数据扩展单元。元数据扩展单元被配置为:使用响应者表现出响应的其他项目的元数据来扩展目标项目的元数据,该响应者是已经对目标项目表现出响应的用户,其中要扩展目标项目的元数据。
【专利说明】信息处理装置、信息处理方法及程序
[0001] 相关申请的交叉引用
[0002] 本申请要求于2013年8月6日提交的日本优先权专利申请JP2013-163372的权 益,其全部内容通过引用合并于本文中。

【背景技术】
[0003] 本技术涉及信息处理装置、信息处理方法及程序,具体地涉及期望用于扩展项目 的元数据的信息处理装置、信息处理方法及程序。
[0004]到目前为止,已知协同过滤(CF)和基于内容的过滤(CBF)作为用于向用户 推荐项目的技术(例如参见日本专利申请公报No. 2003-167901和日本专利申请公报 No.2012-190061)。


【发明内容】

[0005] 然而,例如在CBF的应用中,由于具有少量元数据的项目与其他项目的元数据仅 有很少的共有部分,因此计算出的项目与其他项目之间的相似度较低,难以将该项目推荐 给用户。
[0006] 本技术是鉴于上述情况提出的,因此期望扩展项目的元数据。
[0007] 根据本技术的实施方式的信息处理装置包括元数据扩展单元。元数据扩展单元被 配置为:使用响应者表现出响应的其他项目的元数据来扩展目标项目的元数据,该响应者 是已经对目标项目表现出响应的用户,其中要扩展目标项目的元数据。
[0008] 元数据扩展单元可以使用响应者在指定时间段内表现出响应的项目的元数据来 扩展目标项目的元数据,该指定时段包括响应者对目标项目表现出响应的时间段。
[0009] 元数据扩展单元可以使用响应者紧接在对目标项目表现出响应之前或紧接在对 目标项目表现出响应之后表现出响应的指定数量的项目的元数据来扩展目标项目的元数 据。
[0010] 元数据扩展单元可以将响应者限于属于指定组的用户,以扩展目标项目的元数 据。
[0011] 元数据扩展单元可以当通过指定方法对各个项目进行分类时,使用与目标项目属 于同一组的项目的元数据来扩展目标项目的元数据。
[0012] 元数据扩展单元可以以将特征量向量加在一起的方式来扩展目标项目的元数据, 其中特征量向量基于响应者表现出响应的各个项目的元数据。
[0013] 元数据扩展单元可以增大响应者在与响应者对目标项目表现出响应的时间段接 近的时间段中表现出响应的项目的权重,以将特征量向量加在一起。
[0014] 元数据扩展单元可以分配与响应类型和响应程度中的至少之一相对应的权重,以 将特征量向量加在一起。
[0015] 元数据扩展单元可以向响应者分配权重,以将特征量向量加在一起。
[0016] 元数据扩展单元可以分配与响应者表现出响应的项目的数量相对应的权重,以将 特征量向量加在一起。
[0017] 元数据扩展单元可以增大与目标项目相似的项目的权重,以将特征量向量加在一 起。
[0018] 元数据扩展单元可以将目标项目的特征量向量的权重设定为与其他项目的特征 量向量的权重的值不同的值。
[0019] 元数据扩展单元可以不加上目标项目的特征量向量。
[0020] 信息处理装置还可以包括推荐单元。推荐单元针对作为要推荐给目标用户的候选 项目的每个候选项目,计算通过将候选项目与目标用户表现出响应的各个项目之间的特征 量向量的相似度加在一起而获得的得分,以及基于得分将项目推荐给目标用户,其中目标 用户表现出响应的项目与候选项目中的至少之一使用经扩展的特征量向量来计算得分。
[0021] 信息处理装置还可以包括搜索单元。搜索单元搜索这样的项目:在该项目的经扩 展的元数据中包括所提供的关键字。
[0022] -种根据本技术的另一实施方式的信息处理装置的信息处理方法包括:使用响应 者表现出响应的其他项目的元数据来扩展目标项目的元数据,响应者是已经对目标项目表 现出响应的用户,其中要扩展目标项目的元数据。
[0023] -种根据本技术的又一实施方式的程序使得计算机执行处理,该处理包括:使用 响应者表现出响应的其他项目的元数据来扩展目标项目的元数据,响应者是已经对目标项 目表现出响应的用户,其中要扩展目标项目的元数据。
[0024] 根据本技术的实施方式,使用响应者表现出响应的其他项目的元数据扩展目标项 目的元数据,响应者是已经对目标项目表现出响应的用户,其中要扩展目标项目的元数据。
[0025] 根据本技术的实施方式,可以充分扩展项目的元数据。
[0026] 根据对如附图所示的最佳模式实施方式的以下详细的描述,本公开内容的这些以 及其他目的、特征和优点将变得更加明显。

【专利附图】

【附图说明】
[0027] 图1是示出应用本技术的信息处理装置的框图;
[0028] 图2是用于描述离线处理的流程图;
[0029] 图3是用于描述元数据扩展处理的细节的流程图;
[0030] 图4是用于描述元数据扩展处理的具体示例的图;
[0031] 图5是用于描述项目推荐处理的流程图;
[0032] 图6是示出项目特征量的示例的图;
[0033] 图7是示出用户的购买历史的示例的图;
[0034] 图8是示出对用本技术与用CBF和CF计算项目之间的相似度的结果进行比较的 示例的图;
[0035] 图9是用于描述项目搜索处理的流程图;以及
[0036] 图10是示出计算机的配置示例的框图。

【具体实施方式】
[0037] 接下来,将描述用于实施本技术的模式(在下文中称为实施方式)。注意,将以如 下顺序给出描述。
[0038] 1.实施方式
[0039] 2.修改示例 [0040] 1.实施方式
[0041](信息处理装置11的配置示例)
[0042] 图1是示出应用本技术的信息处理装置11的实施方式的框图。
[0043] 信息处理装置11是提供项目的推荐和搜索服务的装置。注意,由信息处理装置11 推荐或搜索的项目不限于具体类型的项目。例如,设想各种内容和商业产品如活动图像、静 止图像、书、文档、歌曲、电视节目、软件、新闻文章、博客文章、微博句子以及信息;社区站点 中的用户;以及社区站点内的社区。此外,信息处理装置11能够针对项目的一部分进行推 荐和搜索(例如,电影的一个场景或歌曲吸引人的部分)。
[0044] 信息处理装置11包括离线处理系统21、在线处理系统22、日志存储单元23、元数 据存储单元24、用户信息存储单元25、特征量向量存储单元26以及关联矩阵存储单元27。
[0045] 离线处理系统21包括特征量向量生成单元31、元数据扩展单元32以及相似度计 算单元33。
[0046] 如下文所述,特征量向量生成单元31基于每个项目的存储在元数据存储单元24 中的元数据来生成表示该项目的特征的特征量向量。特征量向量生成单元31将所生成的 每个项目的特征量向量存储在特征量向量存储单元26中。
[0047] 如下文所述,元数据扩展单元32使用其他项目的特征量向量来扩展每个项目的 存储在特征量向量存储单元26中的特征量向量,以扩展该项目的元数据。元数据扩展单元 32将经扩展的特征量向量存储在特征量向量存储单元26中。
[0048] 如下文所述,相似度计算单元33基于存储在特征量向量存储单元26中的特征量 向量来计算各个项目之间的相似度。此外,相似度计算单元33生成以表格形式表示各个项 目之间的相似度的关联矩阵,并且将所生成的关联矩阵存储在关联矩阵存储单元27中。
[0049] 在线处理系统22包括日志采集单元41、搜索单元42和推荐单元43。
[0050] 日志采集单元41从经由网络如因特网(未示出)连接的服务器和客户端采集与 每个用户对每个项目的响应有关的信息。注意,并未特别地限定要采集的响应的类型。例 如,这样设定对于购买、预订及下载项目的响应,对于浏览信息的响应,以及对于进行评价 或评论的响应。
[0051]日志采集单元41基于所采集的信息来生成表示每个用户对每个项目的响应的历 史的日志(在下文中称为响应日志),并且将所生成的日志存储在日志存储单元23中。例 如,响应日志包括表现出响应的用户的用户ID、作为响应目标的项目的项目ID、响应时间 段、响应类型等。
[0052] 如下文所述,搜索单元42基于每个项目的存储在特征量向量存储单元26中的特 征量向量来搜索对应于给定条件的项目。搜索单元42将项目的搜索结果经由网络(未示 出)发送给由用户操作的客户端等。
[0053] 如下文所述,推荐单元43基于存储在关联矩阵存储单元27中的关联矩阵来提取 要推荐给用户的项目。推荐单元43将与所提取的项目有关的信息经由网络(未示出)发 送给由用户操作的客户端等。
[0054] 日志存储单元23存储如上所述的响应日志。
[0055] 元数据存储单元24存储每个项目的元数据。注意,元数据可以包括任何类型的信 息,只要其与项目有关即可。此外,未特别限定元数据的格式,其可以具有任何类型。
[0056] 用户信息存储单元25存储与接收由信息处理装置11提供的服务的用户有关的用 户信息。注意,用户信息例如包括用户的属性,如年龄、性别、地址以及职业等。
[0057] 如上所述,特征量向量存储单元26存储每个项目的特征量向量。
[0058] 如上所述,关联矩阵存储单元27存储关联矩阵。
[0059] (信息处理装置11的处理)
[0060] 接下来,将描述信息处理装置11的处理。
[0061](离线处理)
[0062] 首先,将参照图2的流程图来描述由信息处理装置11执行的离线处理。注意,该 处理例如被周期性地执行。
[0063] 在步骤S1中,特征量向量生成单元31基于元数据生成每个项目的特征量向量。也 就是说,特征量向量生成单元31生成其中每个项目的元数据被向量化的特征量向量,并且 将所生成的特征量向量存储在特征量向量存储单元26中。
[0064] 注意,任何方法可用作为根据元数据生成特征量向量的方法,但是将简要地描述 该方法的一个不例。
[0065] 首先,特征量向量生成单元31根据元数据提取每个指定属性的属性值。此处,属 性根据其特性对项目的特征进行分类,属性的示例包括参数如类别(genre)、作者以及关键 字。此外,属性值代表指示与每个属性有关的特定信息的值。例如,当项目为电视节目时, 属性"类别"的属性值包括动作、喜剧、情节剧、体育、新闻、综艺节目、非小说作品等。
[0066] 接下来,特征量向量生成单元31使用任何方法如TF-IDF(词频逆文档频率)计算 表示所提取的属性值中的每个属性值的影响或重要性的得分。此外,属性值与得分的组合 变得等效于表示项目的特征的项目特征量。
[0067] 然后,特征量向量生成单元31生成以向量形式表示项目特征量的特征量向量。也 就是说,特征量向量为各个属性的向量(属性向量)组合在一起的组合向量。属性值是构 成属性向量的分量(坐标轴),并且各个属性值的得分表示属性值的分量的大小。
[0068] 注意,在例如日本专利申请公报No. 2011-135183中公开了生成特征量向量的方 法的细节。
[0069]在步骤S2中,元数据扩展单元32执行元数据扩展处理。此处,将参照图3的流程 图来描述元数据扩展处理的细节。
[0070] 在步骤S21中,元数据扩展单元32从未处理的项目中选择其元数据要被扩展的目 标项目。
[0071] 在步骤S22中,元数据扩展单元32基于用户对其他项目的响应来扩展元数据,该 用户已经对目标项目表现出响应。然后,元数据扩展单元32将目标项目的扩展后的特征量 向量(在下文中称为扩展特征量向量)存储在特征量向量存储单元26中。
[0072] 具体地,元数据扩展单元32使用存储在日志存储单元23中的响应日志,根据如下 表达式(1)来计算扩展特征量向量qep在扩展特征量向量qei中,目标向量i的特征量向 量。^皮扩展。
[0073](表达式1)

【权利要求】
1. 一种信息处理装置,包括: 元数据扩展单元,被配置为使用响应者表现出响应的其他项目的元数据来扩展目标项 目的元数据,所述响应者是已经对所述目标项目表现出响应的用户,其中要扩展所述目标 项目的所述元数据。
2. 根据权利要求1所述的信息处理装置,其中 所述元数据扩展单元被配置为使用所述响应者在指定时间段内表现出响应的项目的 元数据来扩展所述目标项目的所述元数据,所述指定时段包括所述响应者对所述目标项目 表现出所述响应的时间段。
3. 根据权利要求1所述的信息处理装置,其中 所述元数据扩展单元被配置为使用所述响应者紧接在对所述目标项目表现出所述响 应之前或紧接在对所述目标项目表现出所述响应之后表现出响应的指定数量的项目的元 数据,来扩展所述目标项目的所述元数据。
4. 根据权利要求1所述的信息处理装置,其中 所述元数据扩展单元被配置为将所述响应者限于属于指定组的用户,W扩展所述目标 项目的元数据。
5. 根据权利要求1所述的信息处理装置,其中 所述元数据扩展单元被配置为当通过指定方法对各个项目进行分类时,使用与所述目 标项目属于同一组的项目的元数据来扩展所述目标项目的元数据。
6. 根据权利要求1所述的信息处理装置,其中 所述元数据扩展单元被配置为W将特征量向量加在一起的方式来扩展所述目标项目 的所述元数据,其中所述特征量向量基于所述响应者表现出所述响应的各个项目的所述元 数据。
7. 根据权利要求6所述的信息处理装置,其中 所述元数据扩展单元被配置为增大所述响应者在与所述响应者对所述目标项目表现 出响应的时间段接近的时间段中表现出所述响应的项目的权重,W将所述特征量向量加在 一起。
8. 根据权利要求6所述的信息处理装置,其中 所述元数据扩展单元被配置为分配与响应类型和响应程度中的至少之一相对应的权 重,W将所述特征量向量加在一起。
9. 根据权利要求6所述的信息处理装置,其中 所述元数据扩展单元被配置为向所述响应者分配权重,W将所述特征量向量加在一 起。
10. 根据权利要求9所述的信息处理装置,其中 所述元数据扩展单元被配置为分配与所述响应者表现出所述响应的所述项目的数量 相对应的权重,W将所述特征量向量加在一起。
11. 根据权利要求6所述的信息处理装置,其中 所述元数据扩展单元被配置为增大与所述目标项目相似的项目的权重,W将所述特征 量向量加在一起。
12. 根据权利要求6所述的信息处理装置,其中 所述元数据扩展单元被配置为将所述目标项目的所述特征量向量的权重设定为与所 述其他项目的所述特征量向量的权重的值不同的值。
13. 根据权利要求6所述的信息处理装置,其中 所述元数据扩展单元被配置为不加上所述目标项目的所述特征量向量。
14. 根据权利要求6所述的信息处理装置,还包括: 推荐单元,被配置为: 针对作为要推荐给目标用户的候选项目的每个候选项目,计算通过将所述候选项目与 所述目标用户表现出响应的各个项目之间的所述特征量向量的相似度加在一起而获得的 得分,W及 基于所述得分将所述项目推荐给所述目标用户,其中 所述目标用户表现出所述响应的所述项目与所述候选项目中的至少之一使用经扩展 的特征量向量来计算所述得分。
15. 根据权利要求1所述的信息处理装置,还包括: 搜索单元,被配置为搜索该样的项目:在所述项目的经扩展的元数据中包括所提供的 关键字。
16. -种信息处理装置的信息处理方法,所述方法包括: 使用响应者表现出响应的其他项目的元数据来扩展目标项目的元数据,所述响应者是 已经对所述目标项目表现出响应的用户,其中要扩展所述目标项目的所述元数据。
17. -种用于使得计算机执行处理的程序,所述处理包括: 使用响应者表现出响应的其他项目的元数据来扩展目标项目的元数据,所述响应者是 已经对所述目标项目表现出响应的用户,其中要扩展所述目标项目的所述元数据。
【文档编号】G06F17/30GK104346428SQ201410371444
【公开日】2015年2月11日 申请日期:2014年7月30日 优先权日:2013年8月6日
【发明者】金本胜吉, 荒木一宪, 中桥亮, 宫原正典, 吉山和树, 高木友博 申请人:索尼公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1