数据分析支援装置的制造方法_3

文档序号:8367465阅读:来源:国知局
11获得变量k的“变量值的值的列表”(步骤S2 — 4)。
[0092]变量类型判断部11根据变量k的“变量值的值的列表”,尝试判断变量a的变量类型(步骤S2 — 5)。如果能够判断,则变量类型判断部11进入步骤S2 — 7。如果不能判断,变量类型判断部11进入步骤S2 - 6。
[0093]变量类型判断部11通过人工判断变量k的类型(步骤S2 — 6)。
[0094]变量类型判断部11参照变量k的类型来追加变量a的变量类型(步骤S2 — 7)。
[0095]如果变量类型判断部11已对变量a的全部主关键字变量进行了处理,则进入步骤S2 — 9。如果存在未处理的主关键字变量,则返回步骤S2 — 2 (步骤S2 — 8)。
[0096]如果变量类型判断部11已对收集数据保管部21的数据中的全部变量判断了变量类型,则结束处理。如果存在未判断变量类型的变量,则变量类型判断部11返回步骤S2 -1 (步骤 S2 - 9) ο
[0097]但是,变量类型判断方法并不限定于上述的方法。变量类型判断方法例如也可以采用如下方法:在难以进行步骤S2 - 6的人工判断的情况下,仅进行步骤S2 — 3、S2 — 5中的自动判断,且仅在能够自动判断变量k的类型的情况下对变量a分配变量类型。
[0098]接下来,使用图12说明步骤S4的变量变动的生成动作的详细情况。此外,变量变动生成部14例如使用表示生成的变动的状态的状态数据,来执行步骤S4。这里,状态数据例如像后述的图15所示那样是变量项目、变量类型项目、规则形式项目、更新状态项目、值项目、以及“生成的变动”项目相关联而成的表形式的数据。变量项目是将分析对象数据内的主关键字所确定的变量的项目作为值的项目。变量类型项目是将“时间”或者“空间”作为值的项目。规则形式项目是将“与η日前相比之差”、“与η年前相比之差”、“与(X — η,y)的地点相比之差”或者“与U,y — η)的地点相比之差”作为值的项目。更新状态项目是将“增加”、“完成”或者“删除”这样的变动更新状态作为值的项目。值项目是具有自然数的变动生成值的项目。“生成的变动”项目是具有将变动生成值代入规则形式项目的值的η而得的值(变动)的项目。
[0099]变量变动生成部14对于被预处理部12处理过的数据的各变量,应用变量变动规则。
[0100]变量变动生成部14从被预处理部12处理过的数据中选择变量(步骤S4 — I)。将选择的变量设为变量a。
[0101]变量变动生成部14判断是否是首次将变量变动规则应用于变量a。在首次应用的情况下,变量变动生成部14进入步骤S4 - 3。在并非首次应用的情况下,变量变动生成部14进入步骤S4 — 4 (步骤S4 — 2)。
[0102]作为初始化,关于变量a的相对于全部变量类型的变量变动规则的全部规则形式,变量变动生成部14使变动更新状态为“增加”,使变动生成值η为初始值。变量变动生成部14将全部规则形式应用于变量a。之后,变量变动生成部14进入步骤S4 — 12 (步骤S4 — 3) ο
[0103]变量变动生成部14选择变量a的一个变量类型(步骤S4 — 4)。将选择的类型设为类型t。
[0104]变量变动生成部14从变量变动规则保管部22获得类型t的变量变动规则(步骤S4 — 5) ο
[0105]变量变动生成部14根据变量a的变量类型t的变量变动规则选择,一个规则形式(步骤S4 — 6)。变量变动生成部14将选择的规则形式设为规则形式r。
[0106]变量变动生成部14参照规则形式r的变动更新状态S。在变动更新状态s是“增加”的情况下,变量变动生成部14进入步骤S4 — 8。在变动更新状态s是“删除”的情况下,变量变动生成部14进入步骤S4 - 9。在变动更新状态s是“完成”的情况下,变量变动生成部14进入步骤S4 — 10 (步骤S4 — 7)。
[0107]关于变量a的变量类型t的规则形式r,变量变动生成部14更新变动生成值并应用规则。之后,变量变动生成部14进入步骤S4 — 10 (步骤S4 — 8)。
[0108]关于变量a的变量类型t的规则形式r,变量变动生成部14删除利用当前的变动生成值生成的变动。另外,变量变动生成部14使变动更新状态为“完成”(步骤S4 — 9)。
[0109]变量变动生成部14如果已对变量a的变量类型t的全部规则形式进行了处理,则进入步骤S4 -1lo如果存在未处理的规则形式,则变量变动生成部14返回步骤S4 — 6(步骤 S4 — 10) ο
[0110]变量变动生成部14如果已对变量a的全部变量类型进行了处理,则进入步骤S4 - 12。如果存在未处理的变量类型,则变量变动生成部14返回步骤S4 一 4(步骤S4 一
11)。
[0111]变量变动生成部14如果已对全部变量进行了处理,则结束处理。如果存在未处理的变量,则变量变动生成部14返回步骤S4 — I (步骤S4 - 12)。
[0112]接下来,使用图13说明步骤S6的分析结束判断动作的详细情况。
[0113]分析结束判断部16计算出当次的分析结果的精度(步骤S6 — I)。
[0114]如果当次的精度比上次的分析结果的精度高,则分析结束判断部16进入步骤
S6- 3。如果当次的精度不比上次的分析结果的精度高,则分析结束判断部16进入步骤
56— 4 (步骤 S6 — 2)。
[0115]分析结束判断部16判断为继续进行分析处理,并结束处理(步骤S6 — 3)。
[0116]分析结束判断部16判断为结束分析处理,并结束处理(步骤S6 — 4)。
[0117]最后,使用图14说明步骤S7的变量贡献率判断动作的详细情况。
[0118]变量贡献率判断部17计算出各变量变动的贡献率,确定接下来的重复分析中的变动的增加方法。
[0119]变量贡献率判断部17选择一个变量变动(步骤S7 — I)。变量贡献率判断部17将选择的变量变动设为变动a。
[0120]变量贡献率判断部17计算出变动a的贡献率(步骤S7 — 2)。
[0121]变量贡献率判断部17判断变动a的贡献率是否较高。如果贡献率较低,则变量贡献率判断部17进入步骤S7 — 4。如果贡献率较高,则变量贡献率判断部17进入步骤S7 —5 (步骤 S7 - 3) ο
[0122]变量贡献率判断部17将变动a的变动更新状态变更为“删除”(步骤S7 — 4)。
[0123]变量贡献率判断部17如果已对全部变动进行了处理,则结束处理。如果存在未处理的变动,则变量贡献率判断部17返回步骤S7 — I (步骤S7 — 5)。
[0124]在计算各变动的贡献率时,能够使用像相关系数或确定系数那种通常所使用的贡献率。另外,也可以使用其他的指标。
[0125]在判断贡献率是否较高时,既可以预先设定固定的阈值,也可以基于相同的变量或其他变量的其他变动的贡献率来相对地进行判断。
[0126]另外,在上述的例子中,在某一变动的贡献率较低的情况下,立即在步骤S7 - 3、
57- 4中将变动更新状态从“删除”变更为“完成”,但也可以采用预先设定针对变动生成值的阈值、尝试增加变动直至变动生成值到达该阈值为止的方法。
[0127]以下,着眼于一个变量,对实际生成变动的过程进行说明。这里,以图7中的变量“气温”为例进行说明。
[0128]如图11所示,变量类型判断部11选择变量类型为未判断的“气温”(步骤S2 -1)0
[0129]变量类型判断部11从“气温”的主关键字(地域、日期)中选择变量“地域”(步骤 S2 - 2) ο
[0130]这里,假设不能从“地域”这一变量名中判断“地域”的类型。变量类型判断部11进入步骤S2 — 4 (步骤S2 — 3)。
[0131]变量类型判断部11获得“地域”的变量值的值的列表((1,1)、(1,2)、(1,3)、…)(步骤 S2 - 4) ο
[0132]这里,假设能够从“地域”的变量值的值的列表中判断出“地域”的类型是“空间类型”。变量类型判断部11进入步骤S2 — 7 (步骤S2 — 5)。
[0133]变量类型判断部11向“气温”的变量类型中追加“空间类型”(步骤S2 — 7)。
[0134]由于在“气温”的主关键字变量中存在未处理的主关键字变量,因此变量类型判断部11返回步骤S2 — 2 (步骤S2 — 8)。
[0135]变量类型判断部11从“气温”的主关键字(地域、日期)中选择变量“日期”(步骤 S2 - 2) ο
[0136]这里,假设能够从“日期”这一变量名中判断出“日期”的类型是“时间类型”。变量类型判断部11进入步骤S2 — 7 (步骤S2 — 3)。
[0137]变量类型判断部11向“气温”的变量类型中追加“时间类型”(步骤S2 — 7)。
[0138]由于已对“气温”的全部主关键字变量进行了处理,因此变量类型判断部11进入步骤S2 - 9。
[0139]变量类型判断部11对收集数据保管部21的数据中的全部变量进行处理,并结束处理(步骤S2 — 9)。
[0140]此外,重复执行整个处理顺序(图10)的步骤S4至步骤S7。
[0141]接下来,对第一轮步骤S4至步骤S7的重复中的、变量变动生成部14的流程图(图
12)的动作进行叙述。
[0142]变量变动生成部14从已被预处理部12处理的数据中选择“气温”(步骤S4 — I)。
[0143]由于是首次在“气温”中应用变量变动规则,因此变量变动生成部14进入步骤S4 — 3 (步骤 S4 — 2)。
[0144]关于“气温”的相对于全部变量类型(时间类型、空间类型)的变量变动规则的全部规则形式,变量变动生成部14使变动更新状态为“增加”,使变动生成值为初始值。变量变动生成部14将全部规则形式应用于“气温”。之后,变量变动生成部14进入步骤S4 -12 (步骤S4 — 3)。关于“气温”的“生成的变动”项目的值如图15的右列所示。
[0145]变量变动生成部14对全部变量进行处理,并结束处理(步骤S4 - 12)。
[0146]接下来,对第一轮步骤S4至步骤S7的重复中的、分析结束判断部16的流程图(图
13)的动作进行叙述。
[0147]分析结束判断部16计算出当次的分析结果的精度(步骤S6 — I)。
[0148]由于不存在上次的分析结果的精度,不能与当次的分析结果的精度进行比较,因此分析结束判断部16进入步骤S6 — 3 (步骤S6 — 2)。
[0149]分析结束判断部16判断为继续进行分析处理,并结束处理(步骤S6 — 3)。
[0150]接下来,对第一轮步骤S4至步骤S7的重复中的、变量贡献率判断部17的流程图(图14)的动作进行叙述。当次假设通过与目标变量之间的相关,计算出贡献率。假设通过与固定的阈值之间的比较来判断贡献率的高低
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1