数据分析支援装置的制造方法_5

文档序号:8367465阅读:来源:国知局
理的规则形式,因此变量变动生成部14返回步骤S4 — 6 (步骤S4 - 10)。
[0218]变量变动生成部14从“气温”的变量类型“时间类型”的变量变动规则中选择一个规则形式“与η年前相比之差”(步骤S4 — 6)。
[0219]由于规则形式“与η年前相比之差”的变动更新状态为“完成”,因此变量变动生成部14进入步骤S4 — 10 (步骤S4 — 7)。
[0220]由于已对“气温”的变量类型“时间类型”的全部规则形式进行了处理,因此变量变动生成部14进入步骤S4 — 11 (步骤S4 - 10)。
[0221]由于关于“气温”存在未处理的变量类型,因此变量变动生成部14返回步骤S4 -4(步骤 S4 — 11) ο
[0222]变量变动生成部14选择作为“气温”的变量类型之一的“空间类型”(步骤S4 -4)0
[0223]变量变动生成部14从变量变动规则保管部22获得空间类型的变量变动规则(步骤 S4 - 5) ο
[0224]变量变动生成部14从“气温”的变量类型“空间类型”的变量变动规则中选择一个规则形式“与(X - n,y)的地点相比之差”(步骤S4 — 6)。
[0225]由于规则形式“与(X — n,y)的地点相比之差”的变动更新状态为“删除”,因此变量变动生成部14进入步骤S4 — 8 (步骤S4 — 7)。
[0226]关于“气温”的变量类型“时间类型”的规则形式“与(X - n,y)的地点相比之差”,变量变动生成部14删除利用当前的变动生成值“2”生成的变动“与(X - 2,y)的地点相比之差”。另外,变量变动生成部14使变动更新状态为“完成”(步骤S4 — 9)。该时刻的与“气温”相关的“生成的变动”项目的值如图22的右列所示。
[0227]由于在“气温”的变量类型“空间类型”的规则形式中存在未处理的规则形式,因此变量变动生成部14返回步骤S4 — 6 (步骤S4 - 10)。
[0228]变量变动生成部14从“气温”的变量类型“空间类型”的变量变动规则中选择一个规则形式“与(X,y - η)的地点相比之差”(步骤S4 — 6)。
[0229]由于规则形式“与(x,y — η)的地点相比之差”的变动更新状态为“完成”,因此变量变动生成部14进入步骤S4 — 10 (步骤S4 — 7)。
[0230]由于已对“气温”的变量类型“空间类型”的全部规则形式进行了处理,因此变量变动生成部14进入步骤S4 — 11 (步骤S4 - 10)。
[0231]由于已对“气温”的全部变量类型进行了处理,因此变量变动生成部14进入步骤S4 - 12(步骤 S4 - 11) ο
[0232]变量变动生成部14对“气温”结束全部的处理。变量变动生成部14对于其他变量也进行相同的处理,然后结束处理(步骤S4 - 12)。
[0233]接下来,对第三轮步骤S4至步骤S7的重复中的、分析结束判断部16的流程图(图
13)的动作进行叙述。
[0234]分析结束判断部16计算出当次的分析结果的精度(步骤S6 — I)。
[0235]这里,假设当次的分析结果的精度超过上次的分析结果的精度。分析结束判断部16进入步骤S6 — 4 (步骤S6 — 2)。
[0236]分析结束判断部16判断为结束分析处理,并结束处理(步骤S6 — 4)。
[0237]通过到此为止的处理,生成了“与一日前相比的气温差”、“与两日前相比的气温差”以及“与(X — 1,y)的地点相比的气温差”这三个变动作为与“气温”相关的“生成的变动”项目的值。如上述那样,关于空间类型,将值因空间上的位置而不同的变量称作空间类型的变量,例如,相对于“某一地点的、某一时刻的气温”,存在“相邻地点的、相同时刻的气温”这样的不同的值。
[0238]为了得到这三个变动的值,变量变动生成部14参照作为气象数据的主关键字的“日期”或“地域”的值而计算出“气温”的值即可。在图23中示出“与一日前相比的气温差”的计算方法,在图24中示出“与(X - 1,y)的地点相比的气温差”的计算方法。
[0239]即,在分析对象数据中,变量变动生成部14按照每个相同的值的地域项目,从与具有某一日期的值的日期项目的值相关联的气温项目的值中,减去与相对于该某一日期的值是前一日的日期的值的日期项目的值相关联的气温项目的值。由此,变量变动生成部14计算出“与一日前相比的气温差”这一变动的值(一 2.6,1.1,一 1.5,…)。
[0240]同样,在分析对象数据中,变量变动生成部14按照每个相同的值的地域项目,从与具有某一日期的值的日期项目的值相关联的气温项目的值中,减去与相对于该某一日期的值是前两日的日期的值的日期项目的值相关联的气温项目的值。由此,变量变动生成部14计算出“与两日前相比的气温差”这一变动的值(一 1.5,一 0.4,…)。
[0241]另外,在分析对象数据中,变量变动生成部14按照每个相同的值的日期项目,从与具有某一地域码的值的地域项目的值相关联的气温项目的值中,减去与相对于该某一地域码的值是相邻的地域码的值的地域项目的值相关联的气温项目的值。由此,变量变动生成部14计算出“与(X — Ly)的地点相比的气温差”这一变动的值(0.0,— 0.8,2.1,…)。
[0242]所生成的变动的值以及分析对象数据通过变量变动生成部14被写入分析数据集保管部23。
[0243]如上述那样,根据本实施方式,判断表示变量的类型的变量类型,基于该判断的变量类型、以及预先按照不同变量类型规定变量的变动的生成方法的变量变动规则,生成各变量的变动,计算出该生成的变动对目标变量的贡献率,并基于该贡献率判断是采用该变动还是删除该变动,由此,能够与变量相应地应用不同的变换式(变量变动规则)来生成变量。
[0244]补充来说,通过该类型对变量进行分类,应用每个类型不同的变换式而生成新的变量,从而能够动态地决定适合各变量的变量合成单元。
[0245]另外,根据本实施方式,按照所输入的规则变更指示,变更变量变动规则保管部22内的变量变动规则,通过该构成,够根据需要设定适当的变量变动规则。
[0246]而且,根据本实施方式,分析所生成的变动,在当次的分析结果的精度比上次的分析结果的精度高时,执行上述贡献率的计算,通过该构成,参照上次的分析结果,使用有助于提高分析结果的精度的变量来生成新的变量,从而能够有效利用持续执行的分析结果。
[0247]补充来说,在专利文献2记载的方式中,根据在与监视的对象值(例:尺寸)相对应的属性值的集(例:制造编号、批号)中预先确定的属性值条件,生成监视的对象值的派生时间序列(例:三次移动平均、三次自回归)。在该专利文献2记载的方式中,比较原始的时间序列数据与派生时间序列数据,自动地判断监视对象值的变动(例:中心值降低),并将判断结果通知给使用者。
[0248]然而,在这种专利文献2记载的方式中,在每次的分析中固定地使用用于生成派生时间序列的属性值的集及生成逻辑,由于不从上次的分析结果接受反馈,因此存在不能有效地利用以前的分析结果的问题。
[0249]与此相对,在本实施方式中,如上述那样,能够在有效地利用上次的分析结果的同时生成变量。
[0250]此外,上述的各实施方式中记载的方法能够作为能够让计算机来执行的程序而存储在磁盘(软盘(注册商标)、硬盘等)、光盘(⑶一 ROM、DVD等)、光磁盘(MO)、半导体存储器等存储介质中进行分发。
[0251]另外,作为该存储介质,只要是能够存储程序并且能够由计算机进行读取的存储介质即可,其存储形式可以是任意方式。
[0252]另外,也可以由基于从存储介质安装到计算机的程序的指示而在计算机上运行的OS(操作系统)、数据库管理软件、网络软件等的MW(中间件)等执行用于实现上述实施方式的各处理的一部分。
[0253]而且,各实施方式中的存储介质并不局限于独立于计算机的介质,也包含将利用LAN、网络等传送的程序下载并存储或者临时存储的存储介质。
[0254]另外,存储介质并不局限于一个,从多个介质中执行上述的各实施方式中的处理的情况也包含在本发明中的存储介质中,介质结构也可以是任意的结构。
[0255]此外,也可以是,各实施方式中的计算机基于存储于存储介质的程序来执行上述的各实施方式中的各处理,是与由一个个人计算机等构成的装置、多个装置网络连接而成的系统等的任意结构。
[0256]另外,各实施方式中的计算机并不局限于个人计算机,也包含信息处理设备所包含的运算处理装置、微型计算机等,并通称为能够通过程序实现本发明的功能的设备、装置。
[0257]此外,对本发明的几个实施方式进行了说明,但这些实施方式是作为例子而提示的,并非旨在限定发明的范围。这些新的实施方式能够以其他各种方式来实施,在不脱离发明的主旨的范围内能够进行各种省略、替换、变更。这些实施方式、其变形包含于发明的范围、主旨内,并且包含于权利要求所记载的发明及其等同的范围内。
【主权项】
1.一种数据分析支援装置,其特征在于,根据具有目标变量与作为针对所述目标变量的说明变量的候选的各变量在内的分析对象数据,生成所述各变量的变动,从而支援所述分析对象数据的分析,该数据分析支援装置具备: 变量类型判断单元(11),针对所述各变量,判断表示变量的类型的变量类型; 变量变动生成单元(14),基于判断出的所述变量类型、以及预先按照不同变量类型规定了变量的变动的生成方法的变量变动规则,来生成所述各变量的变动;以及 变量贡献率判断单元(17),计算出所生成的所述变动对所述目标变量的贡献率,并基于该贡献率,判断是采用该变动还是删除该变动。
2.根据权利要求1所述的数据分析支援装置,其特征在于, 所述数据分析支援装置具备: 变量变动规则存储单元(22),存储所述变量变动规则;以及 规则变更单元(13),按照被输入的规则变更指示,变更所述变量变动规则存储单元内的变量变动规则。
【专利摘要】实施方式的数据分析支援装置具备变量类型判断单元(11)、变量变动生成单元(14)以及变量贡献率判断单元(17)。所述变量类型判断单元针对所述各变量,判断表示变量的类型的变量类型。所述变量变动生成单元基于判断出的所述变量类型、以及预先按照不同变量类型规定了变量的变动的生成方法的变量变动规则,来生成所述各变量的变动。所述变量贡献率判断单元计算出所生成的所述变动对所述目标变量的贡献率,并基于该贡献率判断是采用该变动还是删除该变动。
【IPC分类】G06F17-18
【公开号】CN104685492
【申请号】CN201380050377
【发明人】江川诚二, 矶部庄三, 樱井茂明, 西一嘉, 松本茂, 早川留美
【申请人】株式会社东芝, 东芝解决方案株式会社
【公开日】2015年6月3日
【申请日】2013年7月4日
【公告号】EP2902919A1, US20150199368, WO2014050248A1
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1