数据分析装置、数据分析方法

文档序号:9375998阅读:492来源:国知局
数据分析装置、数据分析方法
【技术领域】
[0001]本发明关于数据分析装置、数据分析方法以及程序,特别是,关于对多个目标变量和多个解释变量的关联性同时进行分析的数据分析装置、数据分析方法以及程序。
【背景技术】
[0002]对蓄积的庞大的数据进行分析而导出的将来预测的结果开始被应用到企业决策中。例如,超市、便利商店等店铺中,基于各商品的需要预测结果而对各商品的购买数进行调整。例如,在进行各商品的需要预测的情况下,对各商品的属性、购买各商品的顾客的属性等商品/顾客信息与各商品的购买实际业绩的关系进行分析。此时,作为目标变量,能够使用各商品的购买实际业绩值,另一方面,作为解释变量,能够使用各商品的属性(价格、制造商)、购买各商品的顾客的属性(年龄、性别)等。
[0003]在上述数据分析中,取代对多个目标变量分别进行处理而对表示各目标变量和多个解释变量的关联性的预测规则独立地进行学习,正在开发一种通过在考虑多个目标变量间的关联性的同时,对表示各目标变量和多个解释变量的关联性的预测规则进行学习从而提高预测精度的技术。这种研究方法,被称作“多重任务型分析”。即,在多重任务型分析中,在对表示各目标变量和多个解释变量的关联性的预测规则进行学习后,通过在所学习的预测规则中输入多个解释变量的值,从而计算各目标变量的预测值。
[0004]多重任务型分析技术的一例记载在非专利文献I中。在非专利文献I所记载的技术中,基于多个目标变量的实测值和多个解释变量的实测值,对利用与所有的目标变量共通而关联的解释变量所表达的预测规则(以下,称作“共通预测规则”)、和利用针对各目标变量而分别关联的解释变量所表达的不同目标变量的预测规则(以下,称作“个别预测规则”)进行学习。接下来,在所学习的共通预测规则和个别预测规则中输入各解释变量的实测值,针对每个目标变量计算预测值。
[0005]另外,作为关联技术,在非专利文献2中记载了用于将目标函数最小化的凸优化方法。
[0006]现有技术文献
[0007]非专利文献
[0008]非专利文献I
[0009]A.Jalalij et al.,"A Dirty Model for Mult1-task Learning, "NIPS2010.
[0010]非专利文献2
[0011]M.Heiler and C.Schnoerrj ,,Learning Sparse Representat1ns by Non-NegativeMatrix Factorizat1n and Sequential Cone Programming, "Journal of Machine LearningResearch7(2006)1385-1407.
[0012]上述非专利文献1、2的所有公开内容作为引用而引入到本说明书中。以下的分析由本发明者所做出。
[0013]在多重任务型的数据分析中,不仅要求机器所预测的结果,在实用上也要求表示机器是如何导出预测结果的。这是因为在进行决策时不仅需要确认预测结果,而且导出预测结果的预测规则的妥当性是重要的。
[0014]为了使用户知道机器是如何导出预测结果的,需要对用户显示并提供预测规则。然而,若目标变量的数目涉及数千?数万种类,则预测规则的数目也为数千?数万种类,用户难于对各预测规则是否妥当进行确认。
[0015]因此,即使在目标变量的数目庞大的情况下,在不大幅度地降低预测精度的情况下削减所学习的预测规则的个数变得十分重要,但目前这种技术尚未确立。

【发明内容】

[0016]因此,在多重任务型的数据分析中,期望在防止预测精度的降低的同时削减预测规则的数目。本发明的目标在于提供一种对所涉及的期望有所贡献的数据分析装置、数据分析方法以及程序。
[0017]本发明的第一视点所涉及的数据分析装置是一种多重任务型的数据分析装置,其中具备:
[0018]存储部,其对多个目标变量的实测值即第一实测值、与所述多个目标变量对应的多个解释变量的实测值即第二实测值、和与预测对象的目标变量对应的解释变量的实测值即第三实测值进行保存;以及
[0019]预测规则学习部,其使用所述第一实测值和所述第二实测值,对由与所述多个目标变量共通关联的解释变量所表达的预测规则即共通预测规则、由通过与各目标变量关联的解释变量所表达的各目标变量的预测规则构成的个别预测规则、由将所述个别预测规则所包含的预测规则分组化时的针对各组的预测规则构成的组预测规则进行学习。
[0020]本发明的第二视点所涉及的数据分析方法是计算机进行多重任务型的数据分析的数据分析方法,其中包括:
[0021]所述计算机将多个目标变量的实测值即第一实测值、与所述多个目标变量对应的多个解释变量的实测值即第二实测值、和与预测对象的目标变量对应的解释变量的实测值即第三实测值保存在存储部的步骤;以及
[0022]使用从所述存储部读出的所述第一实测值和所述第二实测值,对由与所述多个目标变量共通关联的解释变量所表达的预测规则即共通预测规则、由通过与各目标变量关联的解释变量所表达的各目标变量的预测规则构成的个别预测规则、和由将所述个别预测规则中所包含的预测规则分组化时的针对各组的预测规则构成的组预测规则进行学习,并存储在所述存储部的步骤。
[0023]本发明的第三视点所涉及的程序是使计算机执行多重任务型的数据分析的程序,其中,
[0024]使计算机执行如下处理:
[0025]将多个目标变量的实测值即第一实测值、与所述多个目标变量对应的多个解释变量的实测值即第二实测值、和与预测对象的目标变量对应的解释变量的实测值即第三实测值保存在存储部的处理;以及
[0026]使用从所述存储部读出的所述第一实测值和所述第二实测值,对由与所述多个目标变量共通关联的解释变量所表达的预测规则即共通预测规则、由通过与各目标变量关联的解释变量所表达的各目标变量的预测规则构成的个别预测规则、和由将所述个别预测规则中所包含的预测规则分组化时的针对各组的预测规则构成的组预测规则进行学习,从而存储于所述存储部的处理。
[0027]发明效果
[0028]根据本发明所涉及的数据分析装置、数据分析方法以及程序,在多重任务型的数据分析中,能够防止预测精度的降低并削减预测规则的数目。
【附图说明】
[0029]图1是将一实施方式所涉及的数据分析装置的结构作为一例而表示的框图。
[0030]图2是将第一实施方式所涉及的数据分析装置的结构作为一例而表示的框图。
[0031]图3是将第一实施方式所涉及的数据分析装置的动作作为一例而表示流程图。
【具体实施方式】
[0032]首先,针对一实施方式的概要进行说明。另外,附记在该概要的附图参照标号是专门用于帮助理解的例示,其意图并非将本发明限定于图示的形态。
[0033]图1是对一实施方式所涉及的数据分析装置10的结构进行例示的框图。若参照图1,则数据分析装置10是多重任务型的数据分析装置,具备存储部14、预测规则学习部15B、以及预测值计算部15C。
[0034]存储部14对多个目标变量的实测值即第一实测值14 A、与该多个目标变量对应的多个解释变量的实测值即第二实测值14B、以及与预测对象的目标变量对应的解释变量的实测值即第三实测值14C进行保存。
[0035]预测规则学习部15 A使用第一实测值14 A和第二实测值14B,对于利用与多个目标变量共通而关联的解释变量所表达的预测规则即共通预测规则14D、由通过与各目标变量关联的解释变量所表达的不同目标变量的预测规则构成的个别预测规则14E、和由与将个别预测规则14E中所包含的预测规则分组化时的各组相对应的预测规则构成的组预测规则14F进行计算。这里,优选为,预测规则学习部15B以个别预测规则14E中所包含的多个预测规则中相互类似的预测规则属于同一组的方式对该多个预测规则进行分组化。
[0036]预测值计算部15C使用由预测规则学习部15计算出的共通预测规则14D以及组预测规则14F、和第三实测值14C,计算预测对象的目标变量的预测值14G。
[0037]根据所涉及的数据分析装置10,在多重任务型的数据分析中,能够在防止预测精度的降低的同时减少预测规则的数目。这是因为,根据数据分析装置10,能够替代由不同目标变量的预测规则构成的个别预测规则14E,使用与将个别预测规则14E中包含的预测规则分组化时的各组相对应的组预测规则14F和共通预测规则14D,而对预测对象的目标变量的预测值14G进行计算,此时,能够使组预测规则14F中所包含的预测规则的数目比个别预测规则14E中所包含的预测规则的数目大幅度地减少。
[0038]因此,根据数据
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1