数据检索装置、程序及记录介质的制作方法

文档序号:12071254阅读:231来源:国知局
数据检索装置、程序及记录介质的制作方法

本发明涉及通过通用方式从多个数据库来检索数据的数据检索装置。



背景技术:

<BI工具>

BI商业智能(Business Intelligence)是一种应用于经营规划或企业战略等企业意思决定中的方式,该应用是从业务系统等存储的企业内的庞大数据自行自由地分析用户所需要的数据来加入应用。为此,所使用的BI工具具有用户能够通过对话给予指示的直观的人机界面,以便即便是不具有详细的系统或编程知识的用户也能够使用,能够利用普遍使用的商务用语进行检索或分析,能够将其结果通过多种形式灵活报告。

<OLAP>

BI工具的数据分析是利用称作联机分析处理OLAP(online analytical processing)的多维分析手法进行。

在OLAP中,将成为操作对象的数据定义为多个数据合计项目(维)和定量的值项目(专项)的组的具有多维数据结构的多维数据集立方体来处理(CODD:多维的概念视图)。

此外,数据以完全具有一贯性作为前提条件(CODD:次元一般性,没有限定的多维间的运算处理)。

在OLAP中,由于逻辑上是多维的分析用多维数据集立方体,一般取出2维的数据来以表、图表、图等形式表示,通过切片、切块、钻取/上卷的数据分析操作切换显示,通过重复这些进行多维数据集立方体的多维的方面分析。

.切片…用某个界面仅切取多维数据的特定成员作为2维表。

.切块…替换纵横项目,将多维数据的所有不同面作为2维表。

.钻取/上卷…从合计的结果钻下,并且将显示详细内容数据的操作进行钻取,将反操作称作上卷。

<DWH,DM,ETL>

一般来说,在企业等组织中运行多个业务系统,在多种源中分散数据,所以数据分析中需要将这些数据临时进行整理综合。

作为将从多个业务系统收集的数据按时间序列存储,分析大量数据来用于意志决定的有用方法,有数据仓库(DWH)。此外,通常数据集市(DM)规模比数据仓库小,向特定题目或部门聚集需要的数据,来支持经营干部决定有关商务的战略。将从数据仓库、数据集市等中存储的数据检索的检索结果再次进行编制,作为多维多等级的多维数据集立方体而用于OLAP分析中。

为了将业务系统中发生的数据保存到数据库中来构筑数据仓库或数据集市,需要ETL(提取,变换,装载)作业。最近,大都使用预先具备向数据库的装载工序所需功能的ETL工具,但是由于从多个不同信息源异步地供应数据,故一般作业变得非常复杂。

在先技术文献

专利文献

专利文献1:专利第3213585号



技术实现要素:

发明所要解决的问题

基于BI工具的OLAP,以具有多维数据结构的单一多维数据集立方体作为前提,而提供一种用于高度数据分析的方法。

但是,在现实世界中,很多时候很难得到完整且具有一贯性的数据,此外,为准备这样的数据需要付出大量成本,在数据准备和合计阶段有时候疏漏重要信息。

<小粒度未整合,即统计上的粗细度未整合(明细数据中不包含共通键项目)的例子>

参考图1进行说明。例如,按商品/按老顾客定义“销售额”,按商品/按采购商定义“采购额”。对于商品,可将“毛利额”作为[按商品合计的销售额-按商品合计的采购额]进行计算。并且,通过按商品记录合计,能够将全公司等级(全公司等级)的“销售额”、“采购额”、“毛利”进行报告(上卷)。

但是,若要从按商品记录看到按老顾客的明细,由于在明细等级不定义按老顾客的“采购额”和“毛利额”,所以不能钻取看到相同的多维数据集立方体。

一方面,对于单独“销售额”,通过按老顾客/按商品进行合计来报告全公司等级的销售额,由此按老顾客,进一步由此能够按老顾客/按商品进行钻取。有关“采购额”也同样。

该例子的情况下,称作“毛利额”的值项目(专项),将“老顾客”及“采购商”仅在数据合计项目(维)中不包含的上位的粒度(等级高低)中进行定义,所以“销售额”在不包含“采购商”的全等级中定义,“采购额”在不包含“老顾客”的全等级中定义。

因此,参考所有这些“销售额”、“采购额”以及“毛利额”数据,在1个分析用多维数据集立方体是不可能的,需要准备3个多维数据集立方体。

<大粒度的未整合(对聚集数据的综合处理限定/限制)的例子>

参考图2进行说明。例如,在多国籍企业中,在各国以不同通货进行会计处理,在进行连结多国企业,需要进行对基准通货的换算来进行合计。由于通货间的汇率时刻在变动,所以可能以某个时刻的汇率进行换算来制作基于连结库的报告书或进行评价。但是,在合计基准通货时,换算前金额或通货等项目不能聚集,所以会被舍弃。

此外,法制度或规定、系统等在多个国的企业间不一定相同,通过数据综合能够宏观地把握整体,但看不到聚集的结果的数据是极其多。因此,用于取得具体动作的分析中,多数情况下不需要连结库中的聚集数据,而是需要见到个别原数据。

在现实世界中,虽然随处存在包含未整合的数据,但是在用于分析这样的包含未整合的数据的方法因下述的理由而无法实现。

(以往的数据综合手法(单一多维数据集立方体)的限制)

若是完全具有一贯性的单一多维数据集立方体,上位等级的数据能够通过聚集下位等级的数据来生成,所以能够从业务系统收集较少种类的数据来保持于数据库就可以。因此,以往将范围限定在企业核心的数据,将从业务系统收集的数据进行清理,暂时存储到数据仓库或数据集市,通过由此切出多维数据集立方体,从而尽量作为完全具有一贯性的多维数据模型来供分析。

但是,在分析包含未整合的数据时,回避未整合的某个部分,分别分为可模型化的部分而需要构筑多个多维数据集立方体。为此,所需的多维数据集立方体的个数按照包含未整合的数据的种类或项目数来增加级数,若处理所有情况,则逻辑上因为会成为庞大的各数数量,所以很难处理这样的事件。

从企业活动的复杂化/多样化、管理的高度化等要因,管理人员的关心会从特定问题领域向整个企业活动扩大,随之企业内外的所有数据有可能成为分析对象。

但是,对复制企业内的所有业务系统的数据来提供作为分析数据的费用对效果而言,从企业保有的数据的种类或量来看显然不能实行。

此外,虽然业务数据时时刻刻发生变化,若考虑用于数据仓库更新的数据复制所需的批次处理时间,很难作为最新数据的分析数据来提供。

并且,在综合最初独立动作的多个业务系统的数据需要相当的工程作业,所综合的系统数越增加,其劳力急遽的增加。但是,本该需要综合/聚集的数据是其中一部分,反而不简要地直接分析业务系统数据的作法也有很多有效趋势。

因此,总括复制并再构筑数据,提供作为不包含未整合的多维数据集立方体的以往的数据综合手法,在成本、时间、信息损失方面,不符合企业要求更高范围更广分析的需求。将整体上在可共通化的范围建立关联来进行数据综合,有关详细内容是生成业务系统的原数据,而如直接分析各个数据般依据用户的分析需求的实态的灵活方法可说是理想的。

(基于单一多维数据集立方体的OLAP分析的限制)

在一般的OLAP分析中,将单一的多维数据集立方体作为对象,高校进行数据分析。但是,在将包含未整合的数据相互关联的多个多维数据集立方体进行分析时,尽管在各个多维数据集立方体之间存在有很深关系性,但因为没有对其关系性进行管理/利用的方法,所以只将各个完全作为其它的多维数据集立方体进行处理。

因此,分析某个多维数据集立方体的过程中参照关联的其它多维数据集立方体的情况下,也不提供之前的分析内容的移交或关联的项目的称作引导的用户支持,只能新打开其它多维数据集立方体来从头开始进行处理。

(对多个多维数据集立方体的以往的BI工具的表现方法的限制)

BI工具利用1个数据逻辑上构筑多维的分析用多维数据集立方体,从其取出数据而基本上以2维的表、图表等形式来显示,且通过切片、切块、钻取的分析操作切换显示来进行多维的方面分析。

但是,包含未整合的数据处理时,因为有必要掌握包括多个数据的关连内容,故只单纯以2维的表或图表来表现是很难的。

因此,例如,将从各种信息源集中的数据作为图表报告在相同画面上配置多个,暂时显示来自多种视角的信息的仪表板或称仪表盘是相当有效的手法。但是,在以往的BI工具的仪表板中,能够静态地并列显示所切出的信息,将不同数据作为对象对多个多维数据集立方体总括来同时进行切片或钻取等的功能因为没有定义不同数据之间的项目的关联性,所以不能进行定义,包含未整合的数据的多维方面的分析需要很多时间。

并且,从某个报告向将关联的不同数据作为对象的报告来迁移时,不仅没有提供定义数据之间的关系性的单元,在以切片、切块、钻取的单一多维数据集立方体作为前提的单纯分析操作中并不合适的情形也很多,通过BI工具实现不同数据之间的报告的迁移是极其困难的。

因此,本发明的目的是提供一种数据检索工具,该数据检索工具是在企业等中将分散在多个业务系统中的关联数据收集进行分析时,用来分析数据,该数据是在单一多维数据集立方体中很难处理的含有未整合的数据。

解决问题的手段

为了实现上述目的,本发明基本上提供一种具有如下特征的数据检索工具:

.将虚拟数据库的功能和BI工具的功能一体地融合为软件,

.用管理多个检索之间的数据关联性的单一数据词典进行控制,由此,

.将分别从多个数据库取得的数据进行综合来制作检索结果,

.根据用途/目的利用多个检索结果来制作多个报告,

.将所制作的多个报告自动地建立关联进行操作。

<将来自多个数据库的数据进行综合的虚拟数据库功能>

在现有方式中,复制多个分散的关联数据来存储到数据仓库等中,从此切出用于分析的多维数据集立方体。但是,根据现有方式,在包含未整合的分析数据时,因为所分析的多维数据集立方体根据趋势或方式而不同,所以需要存储的数据的种类或量变得巨大。

对此,根据虚拟数据库(EII(Enterprise information integration)或还称作Federated database system),不移动或复制所分散的数据,用户能够通过单一质询进行对多个数据库的检索。虚拟数据库毕竟只是具有各种定义或规则的逻辑性,仅根据执行时所需要的数据来虚拟且实时地制作实际数据。

因此,虚拟数据库不需要进行无谓的数据复制,所以灵活性较高,容易处理业务数据的容量的增大或数据库数的增大,并且还能够进行包括多个数据仓库或数据集市的数据综合或外部数据的数据综合。此外,不需要用于保存复制数据的服务器或数据库的成本,还能够降低供数据管理或数据质量维持、系统修改/变更的运用/维护成本。并且,虚拟数据库需要如DWH那样的数据的重构作业,因不存在数据生成的时间偏差,所以能够实时地取得直接数据,具有能够制作反映业务的最新状况的报告的优点。

通过利用虚拟数据库的功能,可在不对来自业务系统等的数据进行复制或存储并恒定保持的情况下,能够取得每次需要的数据来提供模拟的多维数据模型的数据,进行分析。

<将所制作的多个报告建立关联的数据词典功能>

数据词典包括:虚拟数据结构的定义信息,表达结构的定义信息,以及检索请求的定义信息。虚拟数据结构的定义信息,在作为检索对象的多个数据库的各个数据库中保存的表或项目等物理数据结构的定义信息的基础上,还包括与物理数据结构完全分开而独立地根据用途/目的用户独自视点灵活来定义数据结构,包含用于将具有物理数据结构的数据进行综合/编辑来变换为所要求的数据结构的定义。表达结构的定义信息包括用于对用户进行支援输入来发出符合检索要件的检索请求的定义。并且,检索请求的定义信息用于管理不同检索请求之间的关联性。

数据词典中,定义不同检索请求之间的关联性,通过具有大体上可识别的数据项目的定义信息,以及复合的或等级性的数据项目的定义信息,能够在根据基于虚拟数据结构发出的检索请求所取得的多个检索结果,以及根据检索结果制作的多个报告之间,进行数据项目或数据等级的共通性/关联性管理。

<将多个报告建立关联操作的BI功能>

一般的BI工具具有非定型检索、定型检索、处理称作报告参考的单一报告的功能,在以单一检索结果为对象的范围内,通过切片、切块、钻取的数据分析操作能够向关联报告移动。

进一步,在本发明中,能够利用数据词典管理多个检索请求之间的关联性,所以通过将虚拟数据库的功能和BI工具的功能融合为一体软件,由此能够处理包含未整合的数据。因此,本发明具有能够对以不同检索结果作为对象的报告也能够进行相互之间的关联建立的检索链接的功能,能够实现移交当前的报告的提取条件或选择内容并向关联的报告移动。

此外,根据本发明,将多个报告在相同画面上配置多个仪表板中,能够实现将参照不同检索结果的多个报告成批进行数据分析操作的功能。

进行具体说明。本发明的数据检索装置具有以下结构。

本发明的第1方面是以响应于检索命令而返回检索数据的2个以上的数据库1作为数据源的数据检索装置。

该数据检索装置包括:

数据词典10,包括用于对用户终端2进行支援输入而发出符合检索要件的检索请求的表达结构的定义信息、解析上述检索请求来变换为能够用上述数据库1处理的物理信息来表现的检索命令的虚拟数据结构的定义信息、以及用于管理不同检索请求之间的关联性的检索请求的定义信息;

商务智能部30,根据由上述数据词典10中定义的上述表达结构,对上述用户终端2进行支援输入,发出基于上述表达结构描述的检索请求,并且将基于在虚拟数据库部20执行检索请求而取得的上述虚拟数据结构的检索结果向上述用户终端2输出;以及

虚拟数据库部20,根据上述数据词典10中定义的上述虚拟数据结构解析上述检索请求来生成检索命令,由上述数据库1分别执行所生成的检索命令来取得2个以上的检索数据,对所取得的2个以上的检索数据进行综合加工来制作对应于检索请求的检索结果,

能够将对应于不同检索请求制作的多个检索结果利用上述检索请求的定义信息建立关联。

更具体说明。优选上述数据词典10包括:

有关对响应于检索命令并返回检索数据的对数据库1的物理数据结构的定义信息;

虚拟数据结构的定义信息,用于描述符合检索要件的检索请求,并变换为以上述数据库1处理的物理数据结构所表示的检索命令,并且根据从上述数据库1取得的检索数据来制作与检索请求对应的检索结果;以及

表达结构的定义信息,对上述用户终端2进行支援输入来发出符合检索要件的检索请求,并且向上述用户终端2输出检索结果,

且表达结构的定义信息具有管理不同检索请求之间的关联性的检索请求的定义信息。

优选上述虚拟数据库部20和上述商务智能部30基于上述数据词典10中包含的对不同检索请求之间的关联性进行管理的检索请求的定义信息来进行控制。

具体来说,优选上述虚拟数据库部20在制作上述检索请求的定义信息中建立关联的不同检索请求所对应的多个检索结果时,将所制作的多个检索结果自动建立关联,

上述商务智能部30根据上述虚拟数据库部20建立关联的多个检索结果分别制作多个报告,并且将所制作的多个报告自动建立关联。

优选上述商务智能部30具有:

检索请求发出单元31,根据上述数据词典10的上述表达结构支持上述用户终端2,根据上述表达结构将检索请求向上述虚拟数据库部20发出;以及

报告输出单元32,根据从上述虚拟数据库部20取得的检索结果制作报告,向上述用户终端2发送。

优选上述商务智能部30,

能够将根据执行多个检索请求得到的多个检索结果制作的多个报告依次或同时显示,

能够利用对上述数据词典10中包含的不同检索请求之间的关联性进行管理的检索请求的定义信息,将多个报告相互建立关联进行操作。

优选上述商务智能部30,

针对第1检索请求将第2检索请求作为关联检索对应起来,

在上述用户终端2执行第1检索请求来显示第1检索结果,选择第1检索结果中包含的数据来指示向第2检索请求的链接,由此,

将第1检索请求中包含的提取条件项目和条件值、以及与从第1检索结果中选择的数据对应的项目和表示值移交到第2检索请求,

在第2检索请求的提取条件中存在与从第1检索请求移交的项目建立关联的关联项目时,优选将该关联项目的条件值置换为由第1检索请求移交的条件值,执行第2检索请求来显示第2检索结果。

优选上述商务智能部30能够构成将从多个检索结果输出的多个报告配置到相同画面上的仪表板,

在仪表板内的1个报告的检索结果中包含的数据被选择时,将与所选择的数据对应的标题项目及表示值移交到仪表板内的其它报告,

在其它报告的检索请求的提取条件中存在与被移交的标题项目建立关联的项目时,通过将其它提取条件的条件值置换为被移交的表示值,执行检索请求来显示新的检索结果,由此能够联动操作仪表板内的多个报告。

优选上述商务智能部30的上述报告输出单元32,在检索请求包含可分类的多个标题项目(维)和可聚集的1以上的值项目(专项)时,对于聚集等级相同的标题项目的组合作为一体进行聚集操作。

在此,在用于区分标题项目顺序的聚集等级被设定为2以上时,上述报告输出单元32,

在将某个聚集等级的检索结果显示于上述用户终端2时,对于标题项目,仅对上述某个聚集等级上位的标题项目来表示其值,对于值项目,仅在上述某个聚集等级上位的标题项目显示聚集的合计值,

在上述用户终端2选择上述某个聚集等级的检索结果的特定数据时,将具有与所选择的特定数据显示的标题项目相同的标题项目的下一位聚集等级的明细记录显示于上述用户终端2。

优选上述商务智能部30具有库管理单元33,该库管理单元33保存上述用户终端2临时制作的检索请求,并能够读取和再利用,

通过根据用户的权限设定能够利用库管理单元33的上述用户终端2,能够根据利用目的共享检索请求。

优选上述商务智能部30具有检索履历管理单元34,该检索履历管理单元34通过上述用户终端2的指定能够将检索请求对应的检索结果保存一定期间或一定履历次数,

在上述用户终端2中,当从库中指定检索请求时,一览显示与该检索请求对应的检索结果,

通过从中指定检索结果,能够直接参照检索结果。

优选上述检索请求发出单元31能够处理将关联的多个项目以1个概念表示的集合项目,

在将上述集合项目指定到检索请求的提取条件中时,能够参照上述关联的多个项目的值来设定条件值,并且,

通过将上述集合项目追加到检索结果的显示项目中的上述用户终端2的输入操作,上述关联的多个项目自动追加到检索结果的显示项目。

优选上述检索请求发出单元31的上述集合项目,

由相互有等级关系的1以上的项目构成,

在上述用户终端2的画面中,当从一览显示上位等级的项目的值选择1个值时,一览显示与其值关联的下位等级的项目的值,

上述用户终端2能够从一览显示任意等级的值中指定作为检索的提取条件的值。

优选上述虚拟数据库部20具有:

检索请求翻译单元21,解析根据上述虚拟数据结构描述的检索请求,生成对上述数据库1的1以上的检索命令;

检索命令执行单元22,对上述数据库1中的几个分别执行由上述检索请求翻译单元21生成的检索命令来取得检索数据;以及

数据综合加工单元23,对由上述检索命令执行单元22取得的1以上的检索数据进行综合加工来制作与数据检索请求所对应的检索结果。

优选上述检索请求翻译单元21根据上述数据词典10的上述虚拟数据结构解析上述检索请求,

生成可在检索对象的数据库上执行的检索命令和可在上述数据综合加工单元23上执行的1个以上的检索命令,

通过将对某个数据综合加工单元23的检索命令的输出作为对其它数据综合加工单元23的检索命令的输入,能够生成进行多阶段的数据综合加工的检索命令。

上述检索请求翻译单元21将对检索请求中被指示的上述虚拟数据库部20的提取条件变换为对上述数据库1的检索命令来适用,

由检索请求要求的分类合计预先在上述数据库1中执行,

参考管理对象的静态属性的主机的处理不在明细数据的检索阶段执行,而是在数据聚集的阶段执行,

由此,以使得从上述数据库1送出的数据量变得最小的方式最优化检索命令。

上述检索命令执行单元22在上述数据库支持SQL语言作为检索接口时,具备以下执行单元中一种以上:

对上述数据库的物理表的基于SQL的检索命令的执行单元;

使用上述数据库中保存的存储过程的检索命令的执行单元;或者

将上述数据库的用SQL语言直接定义的检索的检索结果作为检索对象,从检索结果再次检索的检索命令的执行单元,

在上述数据库为不支持SQL语言作为检索接口的数据库时,

具备与该数据库的检索接口对应的检索命令的执行单元,

上述数据库为文件系统上的数据文件时,

具备与该数据文件对应的检索命令的执行单元。

上述优选数据综合加工单元23将由上述检索命令执行单元22取得的中间检索数据或其它数据综合加工单元23输出的结果数据中1个或多个作为输入,进行数据综合和数据加工,能够将结果数据输出为1个表,

并且将结果数据作为输入交给其它数据综合处理加工单元23,由此能够进行多段数据综合加工处理。

上述数据综合加工单元23具备以下方式中任一个以上的数据综合方式,其中能够选择最优的方式:

将从各数据库提取/合计的中间数据合并后用键聚集的合并方式;

或者,根据检索请求的内容,从多个数据库的检索对象候补自动选择并提取/合计检索对象的选择方式;

或者,对从1个数据库取得的中间数据的各记录,根据预先定义的参照条件从其它数据库取得参照数据,且根据参照数据对原中间数据不足的项目进行补足的参照方式。

上述数据综合加工单元23的数据综合方式中的参照方式优选具备以下方式中任一个以上的数据综合方式,能够从中选择最优的方式:

根据从1个数据库提取/合计的中间数据,对中间数据的各记录按照结合条件逐次检索其它数据库来进行综合的逐次参照方式;

或者,将从其它数据库提取/合计的中间数据传送到1个数据库管理系统,将传送的中间数据彼此或中间数据与数据库管理系统内的数据用数据库管理系统的结合功能进行综合的总括结合方式;

或者,取得成为参照源的检索对象的数据和成为参照目的地的检索对象的数据,且预先按照参照条件的条件值的顺序排序,之后将参照源记录和参照目的地记录依次一件一件地读取来与参照条件的条件值进行比较,对参照条件成立的部份来进行综合的依序合并方式。

上述数据综合加工单元23优选具备以下处理的功能:以键项目分组并将属性项目值向每组聚集的分类/聚集处理、有关项目的值的数据编辑处理、以及基于判定条件的数据提取处理、基于输出顺序指定的分类处理的功能,

此外,可与依赖于记录间关系或顺序的运算对应。

优选上述数据综合加工单元23能够将进行了数据综合和数据加工的结果数据,向商务智能部30、其它数据综合处理加工单元23或数据库的表、文件系统中保存的数据文件、通过网络发送的数据流中任一个外部的输出目的地输出。

优选上述数据综合加工单元23具备检索数据/缓存,该检索数据/缓存,为将数据综合处理结果的表数据、或作为检索命令执行结果分割制作的中间检索数据预先制作,并保存在该外部存储区域,在执行检索时,不参考数据库中数据而代之以参考该外部存储区域中保存的数据。

优选上述数据库1包括关系数据库、目标指向数据库、XML数据库、文件系统、URL索引管理系统、数据仓库、数据集市中至少1个。

本发明的第2方面是使得计算机发挥以响应于检索命令而返回检索数据的2个以上的数据库1作为数据源的数据检索装置的功能的程序。

该程序使得上述计算机起到数据检索装置的功能,

数据检索装置包括:

数据词典10,包括用于对用户终端2进行支援输入而发出符合检索要件的检索请求的表达结构的定义信息、解析上述检索请求来变换为能够以上述数据库1处理的物理信息来表现的检索命令的虚拟数据结构的定义信息、以及用于管理不同检索请求之间的关联性的检索请求的定义信息;

商务智能部30,根据由上述数据词典10中定义的上述表达结构,对上述用户终端2进行支援输入,发出基于上述表达结构描述的检索请求,并且将基于由虚拟数据库部20执行检索请求而取得的上述虚拟数据结构的检索结果向上述用户终端2输出;以及

虚拟数据库部20,根据上述数据词典10中定义的上述虚拟数据结构解析上述检索请求来生成检索命令,由上述数据库1分别执行所生成的检索命令来取得2个以上的检索数据,对所取得的2个以上的检索数据进行综合加工来制作对应于检索请求的检索结果,

将对应于不同检索请求制作的多个检索结果并利用上述检索请求的定义信息建立关联。

本发明的第3方面是保存上述程序的计算机可读取的记录介质。

发明效果

本发明通过设计能够管理多个检索请求间关联性的数据词典,将虚拟数据库和BI工具作为一体软件进行融合,由此发挥如下功能:从多个数据库直接取得数据的功能,将对应于用途/目的的多个检索结果建立关联制作的功能,以及将聚集到多个检索结果的多个报告建立关联操作的功能。因此,根据本发明,在单一多维数据集立方体很难处理的包含未整合的数据分析变得容易。由此,从用户的观点来看,根据用户的目的或用途能够灵活制作虚拟数据结构,例如,对于全体通过建立关联来进行数据综合来进行分析,详细来说能够简单实现直接分析业务系统各数据的自由度较高且极细致的分析。

这样,本发明包括BI工具的功能和虚拟数据库的功能的双方,其特征在于,各个功能通过共通的数据词典驱动。通过使得BI工具作为检索对象的数据结构定义与虚拟数据库提供的数据结构定义共通化,虚拟数据库的提供功能自行必须且充分满足需要BI工具的检索要件,能够大幅简化分析/设计程序。此外,在BI的要件分析中,很难正确把握用户需求,即使在构筑途中或完成后也经常要进行许多要件的追加/变更,但是在数据词典中一维地管理BI工具和虚拟数据库的数据结构定义,使得用户要件的追加/变更的影像范围明确,能够使得系统维护程序大幅效率化。

并且,从组织的顶级经营分析到各个现场的个别业务分析,因能够使用共通的数据分析单元,所以能够促进组织中的信息共享和通信通畅。

此外,从系统的观点,为了数据分析,将企业内的多个业务系统的大量数据进行总括复制,没必要对数据仓库等进行重构/存储,仅通过将虚拟数据结构定义到数据词典并能够立即使用分析数据,从而能够以极其短期间/低成本进行开发。

此外,由于能够对企业全体的数据进行综合的体系管理,具有能够谋求有关数据的存取管理或品质管理的效率化的优点。

附图说明

【图1】图1示出小粒度的未整合的例。

【图2】图2示出大粒度的未整合的例。

【图3】图3示出系统的整体结构。

【图4】图4示出包含未整合的数据的分析处理的概念。

【图5】图5示出数据词典的数据结构的概略。

【图6】图6示出商务智能部的功能模块。

【图7】图7示出检索请求发出的画面的例。

【图8】图8示出库管理的画面的例。

【图9】图9示出检索链接的画面操作的例。

【图10】图10示出检索链接的提取条件以及选择内容的移交处理的流程。

【图11】图11示出仪表板中的多个报告之间的提取条件联动的设定画面的例。

【图12】图12示出类虚拟项目中的提取条件设定画面的操作的例。

【图13】图13示出虚拟数据库部的功能模块。

【图14】图14示出多个数据综合方式的处理概念。

【图15A】图15A示出逐次参照方式和总括结合方式的处理概念。

【图15B】图15B示出顺次整合方式的处理概念。

【图16】图16示出顺次合并方式的处理概念。

【图17】图17示出顺次合并方式的处理的流程。

【图18】图18示出数据/缓存的处理概念。

【图19】图19示出多阶段的数据综合加工单元的处理概念。

具体实施方式

下面,利用附图对用于实施本发明的方式进行说明。本发明不限定于下面说明的方式,还包括本领域技术人员根据下面的方式在显而易见范围的变更方式。

<系统的整体结构图>

图3示出本发明的一实施方式的数据检索装置的整体结构。数据检索装置100是以响应于检索命令而返回检索数据的2台以上的数据库1作为数据源的数据检索装置。数据检索装置100连接到2台以上的外部的数据库1、1台或2台以上的外部的用户终端2和1台或2台以上的外部的管理者终端3。此外,数据检索装置100具备数据词典10、虚拟数据库部20、商务智能部30。此外,数据检索装置100也可以具有连接到外部的管理者终端2的数据词典编辑部40。

作为数据库1连接的数据库为2台以上的情况,不仅包括数据库在物理上分为2台以上的情况,还包括在物理上1个数据库因包括不同种数据等理由而逻辑上分为2台以上的情况。

<包含未整合的数据的分析处理影像图>

图4是利用数据检索装置100对单一多维数据集立方体中很难处理的包含未整合的数据进行分析时的处理影像图。

在图4所示的例中,检索请求1及检索请求2所检索的对象(数据库等)不同。其中,检索请求1和检索请求2所检索的内容相关联。因此,检索请求1和检索请求2通过数据词典10的检索请求之间的关联性的定义(检索请求的定义信息),作为关联检索而对应起来。检索请求彼此的关联建立,可在检索请求的输入画面等中由用户任意进行。

这样,在数据词典10通过将检索请求1和检索请求2建立关联,能够将根据执行检索请求1的检索结果1制作的报告1、以及根据执行检索请求2的检索结果2制作的报告2而依照请求之间的关联性来相互建立关联。因此,能够实现将当前报告的提取条件或选择内容一边移交一边来向关联的报告移动的检索链接的功能。这样,通过将根据不同检索请求制作的多个检索结果建立关联,即便在不同检索结果之间也能够在报告之间简单地移动,从而能够对单一的多维数据集立方体中很难处理的包含未整合的数据高效地进行分析。

具体来说,用户首先从商务智能部30的检索请求输入画面,根据用途/目的进行提取条件或输出方法等的设定,将检索请求1向虚拟数据库部20发出。在虚拟数据库部20,根据所接受的检索请求1,对多个数据库1中几个发出检索命令来执行检索,将通过各个检索取得的2个以上的检索数据进行综合来制作检索结果1。在商务智能部30,根据所制作的检索结果1构筑分析用的多维的多维数据集立方体,将该多维数据集立方体的1个断面显示为报告1。对所显示的报告1,通过指示切片、切块、钻取的OLAP分析操作,能够切换为检索结果1的多维数据集立方体的其它断面来进行显示。

并且,商务智能部30根据数据词典10中的检索请求1和检索请求2的关联性的定义,提供用于从基于检索请求1制作的报告1调用检索请求2的检索链接功能。在从报告1调用检索请求2时,将检索请求1中包含的提取条件项目和条件值,以及对所显示的报告1用户通过鼠标或键盘选择的数据所对应的项目和表示值移交给检索请求2。在检索请求2的提取条件中存在与由检索请求1移交的项目建立关联的关联项目时,将其关联项目的条件值置换为由检索请求1移交的条件值后,发出检索请求2。这样,商务智能部30将检索请求2向虚拟数据库20发出。此外,虚拟数据库部20执行检索请求2来制作检索结果2,并交接到商务智能部30。商务智能部30根据检索结果2构筑分析用的多维的多维数据集立方体,将多维数据集立方体的1个断面显示为报告2。由此,对于与报告1中用户所选择的相关联的内容,可由检索请求2自动从不同视角进行检索,并作为报告2显示。对于所显示的报告2,与上述报告1同样,通知指示切片、切块、钻取的OLAP分析操作,能够切换为检索结果2的多维数据集立方体的其它断面来进行显示。

在此,从报告1向报告2的移动可不经过人工自动进行。因此,通过由数据词典10定义检索请求1和检索请求2的关联性,可将根据执行检索请求1的检索结果1制作的报告1和根据执行检索请求2的检索结果2制作的报告2相互建立关联,即使在不同检索结果之间也能够简单地在报告间移动。

此外,即使是在将由不同检索请求制作的多个报告配置到相同画面上的仪表板上,同样,能够基于检索请求之间的关联性的定义进行报告之间的关联建立。基于报告之间的关联建立,对于仪表板上配置的根据不同数据制作的多个报告,能够实现总括进行切片、切块、钻取OLAP分析操作。

<数据词典的数据结构>

图5是表示数据词典10的数据结构的概略的类图。

数据词典10由物理数据结构的定义信息、虚拟数据结构的定义信息及表达结构的定义信息的3等级构成。物理数据结构的定义信息分别连接到作为检索对象的多个数据库1,定义进行数据检索所需的称作表或项目的物理数据结构。虚拟数据结构的定义信息与物理数据结构完全分开而独立,根据用途/目的从数据利用的视角来灵活定义数据结构,定义包含用于变换为请求物理数据的数据结构的定义的虚拟数据结构。表达结构的定义信息为定义用于对用户进行支援输入而发出符合检索要件的检索请求的表达结构。

物理数据结构的定义信息,基本上是与数据库的定义相同或其所需部分的转记。虚拟数据结构的定义信息由具有有关数据库的知识的系统管理者根据数据利用需求而构筑,是通例。一方面,有关表达结构的定义信息是用户根据各个权限或作用可随时追加/更新。

(物理数据结构)

数据词典10从虚拟数据库部20连接到作为检索对象的外部数据库,将进行数据检索所需的信息定义为物理数据结构。所连接的数据库的个数优选为2台以上。数据库为2台以上的情况不仅包括物理上数据库分为2台以上的情况,还包括因包含不同种数据等理由而逻辑上分为2台以上的情况。

物理数据结构的定义信息包括:作为检索对象的数据库的定义“物理数据库”,物理数据库中包含的“物理表”,以及物理表中包含的“物理项目”的定义信息。

“物理数据库”的定义信息是向数据库的连接顺序、数据库能够处理的数据型种类、数据库中装备的函数的种类等定义了数据库固有的信息等的定义信息,检索对象涉及多个数据库时,定义多个“物理数据库”。

“物理表”的定义信息为与数据库中保存的表(表)的定义相同的定义信息或其所需部分的转记。

“物理项目”的定义是数据库内的物理表中包含的项目(字段)及与其属性的定义相同的定义信息,或其所需部分的转记。

(虚拟数据结构)

在数据词典10中,有关虚拟数据结构定义了基于用户或业务的立场的数据结构。虚拟数据结构的定义信息基本上包含:作为虚拟数据结构的全体的“虚拟数据库”,虚拟数据库中包含的“虚拟表”,虚拟表中包含的“虚拟项目”的定义信息。

作为对象的用户或业务为独立的多个时,有时定义多个“虚拟数据库”的定义信息。

“虚拟表”的定义信息是虚拟项目的集合,能够生成逻辑上完全具有一贯性的多维数据模型。1个虚拟表中包含的虚拟项目是通过任意组合来定义检索,可利用所取得的数据制作多维数据集立方体。

在“虚拟项目”的定义信息中,对在业务以及系统中作为识别对象而可具体识别的实体的特征或性质等属性进行定义(例如“老顾客”,“商品”,“订单”,“销售额”等)。“虚拟项目”的定义信息中包含以项目名不同的多个物理项目作为逻辑上相同的虚拟项目来综合的定义。即,项目名不同的多个物理项目是作为物理上不同项目来处理。其中,即使项目名不同的多个物理项目,有时为逻辑上相同的项目。因此,将项目名不同的多个物理项目的对应关系在“虚拟项目”的定义信息中进行定义,由此能够将这些多个物理项目处理为相同的虚拟项目。

并且,虚拟数据结构优选具有表示“虚拟项目”对“虚拟表”的对应关系的“虚拟表项目”的定义信息。本实施例从属于虚拟表而不直接定义虚拟项目。即,在本实施例中,为了在不同虚拟表之间将虚拟项目建立关联,将虚拟项目与虚拟表分开而独立地在虚拟数据库内进行定义,并将对虚拟表的虚拟项目的对应关系作为“虚拟表项目”建立关联。由此,即使在不同虚拟表之间,在逻辑上为相同的项目时,分配相同的虚拟项目。

通过这样设置“虚拟表项目”的定义信息,即使在不同虚拟表之间也能够判断是否为相同的虚拟项目,若是相同的虚拟项目,则能够保证具有共通属性。因此,通过参照虚拟表项目,即使在通过不同虚拟表的检索来制作的检索结果之间,也能够进行提取条件或选择条件的移交。

此外,在本实施例,相同虚拟数据库内的不同虚拟表中的相同项目的判别是通过在虚拟数据库内将虚拟项目的名称设置为唯一的限定来进行的。其中,也可以通过不限于这些的方式进行相同项目的判别。此外,在欲对每个虚拟表表示不同虚拟项目名称时,可对虚拟表项目赋予每个虚拟表的别名来处理。

此外,在本实施例,不同虚拟数据库之间的相同项目的判别是通过如下方式进行:对每个虚拟表分别定义虚拟项目,在不同虚拟表之间,将表示相同的虚拟项目的定义信息从后相互附加到虚拟项目上。

构成“虚拟表”的“虚拟表项目”的定义信息分为在多维数据集立方体作为数据合计项目(维)处理的项目和在多维数据集立方体作为值项目(专项)处理的项目。

并且,“虚拟表项目”的定义信息除了通常的文字型、数值型、日期型的单纯的数据型之外,为了表现具有多个属性的实体,可作为关联的多个虚拟项目的集合而定义1个虚拟项目(类虚拟项目)。尤其是,有关处于等级关系的多个虚拟项目的集合,可定义等级型类虚拟项目。

并且,虚拟数据结构的定义信息中,为包含有使用虚拟数据库的功能而将具有物理数据结构的多个数据库中保存的数据变换为具有虚拟数据结构的虚拟数据所需的定义信息。因此,虚拟数据结构中包括如“计算表”、“计算项目”、“物理表结合定义”以及“计算表适用定义”的定义信息。

“计算表”的定义信息包括:将外部的数据库作为直接的检索对象的“外部计算表”的定义信息;以及将包含外部计算表的其它计算表作为检索对象的“内部计算表”的定义信息。

“计算项目”的定义信息针对每个计算表对各虚拟项目定义最大一个,在用计算表对虚拟项目不定义计算项目时,可不用计算表计算该虚拟项目。

(外部计算表)

“外部计算表”的定义信息是可从数据库同时计算的计算项目的集合有关的定义信息,外部计算表建立对应于1个数据库。

在数据库支持SQL语言作为检索接口时,“外部计算表”的定义信息具备对数据库的物理表的基于SQL的检索单元,或使用数据库中保存的存储过程的检索单元,或将可用数据库的SQL语言直接定义的检索的检索结果作为检索对象对检索结果进行再次检索的检索单元(内视图)中任一个检索单元。此外,在数据库不支持SQL语言作为检索接口时,外部计算表具备与该数据库的检索接口对应的检索单元。此外,在数据库为文件系统上的数据文件时,外部计算表可具备与该数据文件对应的检索命令的执行单元。

此外,“外部计算表”的定义信息,通过由“物理表结合定义”定义多个物理表的相互的结合条件,可将数据库中包含的多个物理表作为检索对象。“物理表结合定义”将在外部计算表中作为基准默认使用的物理表作为最上位的根,将可补足性地结合参照的物理表作为下位的子的树结构,或以网络结构表现。具体来说,通过该定义信息,在生成数据库检索命令时,自动附加所需的物理表之间的结合条件。

在外部计算表的计算项目中包含:结合定义的物理表的物理项目、以数据库固有的语法来描述的计算定义式或选择条件式等定义信息。在生成数据库检索命令时,外部计算表的计算项目用于自动附加该计算项目的计算方法。

(内部计算表)

在“内部计算表”的定义信息中,以包含外部计算表的1个以上的其它计算表的输出作为输入,可定义综合为1个处理结果来输出的数据综合处理。此外,在内部计算表的计算项目中,可定义有关项目编辑、分类/聚集、排序等数据加工处理的指示。

(计算表适用定义)

“计算表适用定义”是对特定的虚拟表进行检索时可适用的计算表的关系的定义信息。在本实施例,将与虚拟表对应的1个内部计算表作为最上位的根,用将1个以上的外部计算表作为末端叶节点的树结构表现,或可用网络结构表现。

对于1个内部计算表,可在其下位配置1个以上的计算表,下位的计算表的输出成为上位的内部计算表的输入。可将用上位的内部计算表综合下位的多个计算表的输出的方式包含在计算表适用定义中,在本实施例中,可指定合并方式、选择方式、参照方式及其任意的组合。

计算表适用定义在最简单的结构中,具有上位的1个内部计算表和下位的1个外部计算表。此外,在更加复杂的情况下,具有多段上位的内部计算表和最下位的多个外部计算表。

或者,计算表适用定义可以作为网络结构表现。此时,内部计算表将1个以上的其它计算表的输出作为输入进行综合,根据条件分场景输出1个以上的处理结果。

(表达结构)

在数据词典10中,表达结构可包括:对用户进行支援输入来发出符合检索要件的检索请求的定义,以及用于将检索结果向用户输出的定义。

“检索请求”的定义信息包括:作为检索对象指示虚拟表的“检索表”,指示虚拟表的数据的检索范围的“提取条件”,以及指示作为检索结果取得数据的虚拟项目的“显示项目”的定义信息。此外,在虚拟数据库上执行检索请求的检索结果存在时,在表达结构中管理:

检索日期时间、检索执行者、检索状况、报告输出状况等的“检索履历”及其“检索结果”的数据。

此外,在“检索请求”的定义信息中包含用于管理不同检索请求之间关联性的定义信息。即,在“检索请求”的定义信息中定义了:即使作为检索对象的数据库或从数据库提取数据的条件不同的多个检索请求,这些多个检索请求相互具有关联性。由此,在“检索请求”的定义信息中,可包含对将不同检索结果作为对象的报告进行相互之间的关联建立的“检索链接”的设定。在“检索链接”中,以不同检索结果作为对象的相互之间的关联建立是通过分配不同检索结果的“提取条件”或“显示项目”中共通的“虚拟项目”来实现。

在表达结构中可包含“仪表板”。仪表板是用于将用户所需的多种视角的1个以上的报告汇总为1个来显示的功能,包含各个报告的检索请求和与检索请求对应的检索结果的报告输出方法或配置等定义。仪表板内的多个报告的提取条件以共通的“虚拟项目”作为对象时,可作为“仪表板提取条件”总括指定。由此,可将参照仪表板内的不同检索结果的多个报告总括起来进行数据分析操作。

表达结构还包括“库”。库为保管用户制作的报告的检索请求的模板或仪表板。通过限于可参照/编辑库的用户权限,能够实现对被许可的用户之间报告的检索模板或仪表板的共享。

<商务智能部的结构>

图6示出本实施例中的商务智能部30的功能模块图。如图6所示,商务智能部30的一例,包括:检索请求发出单元31,报告输出单元32,库管理单元33,检索履历管理单元34,检索链接单元35,仪表板显示单元36,以及仪表板联动单元37。

商务智能部30的动作可根据用户的作用或目的假设多个利用模式。例如,在供权限用户或管理人员用的自由检索中,使用检索请求发出单元31的功能,任意设定输出项目、输出形式、条件项目等来发出检索请求,自由制作对想要查看的数据的报告。此外,在供一般用户或经营层用的定型检索中,从库管理单元33等调用固定设定有输出项目、输出形式、条件项目等的检索模板,仅改变条件的值来发出检索请求,制作预先标准化的报告。此外,在报告参照中,从检索结果一览等,由检索履历管理单元34调用阅览自行或其它用户过去检索的检索结果。此时,不需要直接使用检索请求发出单元31的功能。

(检索请求发出单元)

图7示出检索请求发出单元31起作用时的画面图像。检索请求发出单元31根据数据词典10中登录的表达结构的定义信息对用户终端2进行支援输入,可发出符合由该用户终端2输入的检索要件的检索请求。检索请求发出单元31的一例具有:“检索对象选择功能”,“提取条件设定功能”,“显示项目设定功能”,以及“检索请求发出功能”。

在检索对象选择功能中,可选择虚拟数据库和虚拟表,并从所表示的可选择的虚拟项目的一览选择任意的虚拟项目来追加到提取条件项目或显示项目。图7所示的例中,示出可从称作“销售实绩”虚拟数据库中包含的称作“出货实绩”的虚拟表中选择称作“商品”的虚拟项目来追加到提取条件项目以及显示项目的状态。

在提取条件设定功能中,若选择提取条件项目,则显示各个虚拟项目上分配的数值型、文字型、日期型、菜单选择型等各种的条件设定对话框。因此,用户可按照画面指示简单设定提取条件。

在显示项目设定功能中,能够指定检索结果的报告显示的显示项目,并且能够对显示项目设定交叉合计时的行/列的指定、排序中的显示项目的优先顺序、排序时的排列方向、小计的有无等。

在检索请求发出功能中,进行报告的文件名等的设定,若全部设定完成,则指示执行检索。

这样,由检索请求发出单元31发出检索请求。之后,由检索请求发出单元31发出的检索请求如图6所示发送到虚拟数据库部20,并且传送到检索履历管理单元34。

(报告输出单元)

报告输出单元32对从虚拟数据库部20取得的检索结果,在用户终端上基本上1个画面上将1个表或图表等作为报告显示之外,还可以通过表计算软件、CSV文件、或HTML文件等形式进行外部输出。

此外,报告输出单元32不仅直接显示检索结果,还具备以下功能:能够将检索结果进行重新编制来制作多维多等级的多维数据集立方体,且将检索结果在特定项目分组合计的功能;指定行以及列的项目来交叉合计的功能;将所检索的数据在特定项目进行排序的功能;以及附加根据所检索的数据计算值的功能等。

检索请求的显示项目区分为:能够识别和分类数据且成为行或列的标签的标题项目(维);以及定义成为分析对象的属性且能够区分聚集值的值项目(专项)。通常,对于检索请求指定的标题项目,显示各个值,对于值项目,显示在标题项目聚集的合计值,并输出报告。

并且,在检索请求的标题项目可设定聚集等级。在聚集等级相同的标题项目存在多个时,不对每个个别标题项目进行分组/合计计算等聚集操作,将聚集等级相同的标题项目的组合作为一体来进行。

在聚集等级被设定为2以上时,在由用户终端2指定了某个聚集等级时,对标题项目仅对聚集等级上位的标题项目显示值,对于值项目,仅对上述某个聚集等级上位的标题项目显示聚集的合计值来进行报告输出。在用户终端2选择了上述某个聚集等级的报告的特定数据时,将其下一位聚集等级的明细记录向用户终端2显示。由此,当选择聚集的1个记录时,可通过聚集等级的设定来简单实现展开显示其详细内容数据的钻取或其反向上卷操作。

此外,切片是可通过变更检索请求中包含的提取条件的指定来实现,切块是可通过变更检索请求中包含的显示项目的指定来实现。

在通过用户终端2进行报告的数据分析操作时,报告输出单元32制作其数据分析操作后的表或图表等来再次提供给用户终端2。

如图6所示,由报告输出单元32制作的报告可传给检索链接单元35以及仪表板显示单元36。

(库管理单元)

库管理单元33保管根据用户的检索要件制作的检索请求,通过在按照用户的权限许可的用户之间共享,可再利用作为用于定型检索的检索模板。此外,库管理单元33,可保管与用户过去检索的检索要件对应的检索结果,且自己或其它用户可将检索结果作为报告来参照。由此,具有支持用户间的信息或分析专有技术的共享的作用。

图8示出库管理单元33发挥功能时的画面图像。

在本实施例中,检索请求的库按虚拟数据库单位或特定用户的组单位制作,所登录的检索请求可一览显示。库中登录的检索请求即使不是登录者本人,具有参照权限的用户就可以参照。

库管理单元33具备定期例行执行检索的功能,例行执行基于被指定的检索要件的检索来定期制作检索结果,由此不用每次检索一般用户日常使用的报告,可预先制作。

如图6所示,用户制作的检索请求通过库管理单元33被传给检索请求发出单元31及仪表板显示单元36。

(检索履历管理单元)

检索履历管理单元34根据用户终端2的指定,将检索请求对应的检索结果保存一定期间或一定履历次数。因此,如图6所示,检索履历管理单元34中输入检索请求发出单元31发出的检索请求和对应于该检索请求从虚拟数据库20取得的检索结果。

当用鼠标等来选择由检索请求库显示的检索请求之一时,有关被指定了检索履历的保持的检索请求,将最近检索的执行日期时间等作为检索履历来进行菜单显示,当从菜单中选择时,在画面上显示其检索结果的报告。在新进行检索时,从检索履历菜单选择“新检索”。

对于检索履历保持,可指定保持年、月、周、日等一定期间或一定的履历次数的检索结果来登录到检索履历管理单元34。

通过利用这些功能,即使是各种角色和熟练用户,可不用每次检索就可立即得到标准化且质量稳定的报告,容易共享用户间的信息。

(仪表板显示单元)

仪表板显示单元36为了将用户所需的多种视角的信息汇总为1个报告来显示于用户终端2的显示部(显示器),可在1个画面内配置多个表或图表。仪表板内的各个表或图表是使用检索请求指示部以及报告表示部显示,所以基本上能够独立动作。仪表板与检索请求同样登录到库,或者作为模板再利用,或参考过去的检索结果。

(包含未整合的用于处理数据的功能)

本发明除了作为商务智能的一般功能之外,还具备包含未整合的可处理数据的功能。因此,本发明作为将由多个检索请求制作的聚集到多个检索结果的多个报告建立关联操作的功能,具备检索链接单元35及多个报告的总括操作功能。

此外,本发明通过具备将主表等关联的多个虚拟项目的集合定义为可在多个检索请求共通使用的类虚拟项目的功能,即使是不同检索请求之间也容易作为共通的虚拟项目来建立关联来进行处理。

(检索链接单元)

检索链接单元35对于以不同检索结果作为对象的报告,也能够进行相互之间的关联建立。利用该检索链接单元35,实现将当前的报告的提取条件或选择内容移交来向关联的其它报告的移动。图9示出检索链接单元35的画面操作影像。

在检索链接单元35,首先,当选择用户终端上显示的表或图表的1个数据(记录)来进行鼠标/敲击或按钮的按下等的操作时,可链接的报告的一览进行菜单显示。例如,图9所示的“表中检索链接”的例中,从某个报告的表中包含的数据(记录)中选择B产业的商品P的数量:120,显示新窗口,在该窗内显示如“销售按月推移”或“按担当者明细”、“销售利益率”那样,根据该选择的数据显示可链接的其它报告的菜单。

此外,当从菜单中选择1个报告时,进行当前显示的报告的检索请求中包含的提取条件的条件项目及条件值、以及与在检索结果中选择的记录对应的显示项目和表示值的移交。即,与链接目的地的检索请求的提取条件上移交的项目相同的项目存在时,将其条件值置换为被移交的条件值之后,执行链接目的地的检索请求来取得检索结果,并替换画面。

在检索链接的一览菜单显示的报告是通过针对链接源的检索请求,将库中登录的任意的检索进行关联来设定,在将链接源的检索请求保存到库中时,将菜单显示的报告的信息也一起保存。

如上所述的多个报告彼此的关联建立(链接)基于数据词典10中的检索请求的定义信息。即,在数据词典10中,而在检索请求的定义信息中,定义了即使成为检索对象的数据库或从数据库提取数据的条件不同的多个检索请求,这些多个检索请求相互也具有关联性的内容。因此,首先,检索链接单元35参照数据词典10的检索请求的定义信息,在该定义信息中,确定某个检索请求和其它检索请求是否建立了关联。由此,检索链接单元35能够把握基于某个检索请求制作的报告和基于其它检索请求制作的报告之间的关联性。此外,检索链接单元35在被指定了某个报告的数据时,参照数据词典10的检索请求中包含的关联性的定义信息,将具有与该被指定的数据建立关联的数据的其它报告显示于用户的使用终端上。由此,进行报告之间的链接。

接着,图10示出检索链接单元35中对于以不同检索结果作为对象的报告也能够实现相互之间关联建立的提取条件以及选择内容的移交的处理流程。

首先,检索链接单元35从成为链接源的报告的检索请求取得1个提取条件(S1)。接着,检索链接单元35参照数据词典10,从成为链接目的地的报告的检索请求取得1个提取条件(S2)。此外,检索链接单元35参照数据词典10,判断链接源的提取条件的虚拟项目和链接目的地的提取条件的虚拟项目是否关联为“相同”(S3)。在此,若链接源的提取条件的虚拟项目和链接目的地的提取条件的虚拟项目在数据词典1中关联为“相同”,检索链接单元35就将链接目的地的提取条件的条件值置换为链接源的提取条件的条件值(S4)。另一方面,若链接源的提取条件的虚拟项目和链接目的地的提取条件的虚拟项目相同,则不做任何动作。

之后,检索链接单元35同样调查下一个链接目的地的提取条件(S5)。在此,若判断为对全部链接目的地的提取条件的调查结束时,进入对下一链接源的提取条件的调查(S6),若判断为链接目的地的检索请求中尚包括未处理的提取条件,则再次返回步骤S2。之后,在步骤S6,同样调查下一个链接源的提取条件(S6)。在此,若判断为对全部的链接源的提取条件结束调查,则进入下一步骤S7,若判断为链接源的检索请求中尚有未处理的提取条件,则再次返回步骤S1。

接着,检索链接单元35从作为链接源的报告的检索结果提取通过鼠标等从画面上选择的记录,取得选择记录的显示项目和表示值的1个对(S7)。接着,检索链接单元35,从成为链接目的地的报告的检索请求取得1个提取条件(S8)。此外,检索链接单元35参照数据词典100,判断链接源的选择记录的显示项目和链接目的地的提取条件的虚拟项目是否关联为“相同”(S9)。在此,若链接源的选择记录的显示项目和链接目的地的提取条件的虚拟项目在数据词典10中关联为“相同”,则检索链接单元35将链接目的地的提取条件的条件值置换为链接源选择记录的该显示项目的表示值(S10)。另一方面,若链接源的选择记录的显示项目和链接目的地的提取条件的虚拟项目不相同,则什么动作都不做。

之后,检索链接单元35通过同样调查下一链接目的地的提取条件(S11),若判断为完成对全部链接目的地的提取条件的调查,则进入下一链接源的选择记录的调查(S12),又若判断为链接源的检索请求中尚有未处理的提取条件,则再次返回步骤S8。之后,在步骤S12,同样调查下一链接源的选择记录的显示项目(S12)。在此,若判断为对全部链接源的选择记录的显示项目的调查结束,则结束移交处理,若判断为链接源的选择记录中尚有未处理的显示项目,则再次返回步骤S7。

最后,检索链接单元35向虚拟数据库部20发出提取条件被置换的链接目的地报告的检索请求,并得到提取条件以及选择内容被移交的链接目的地的检索结果。

在此,有关是否关联为“相同”的判定,在本实施例中,当链接源报告的检索请求和链接目的地报告的检索请求将相同的虚拟数据库作为检索对象时,与检索对象的虚拟表无关而根据是否与虚拟项目的定义(即项目的名称)相同来判断。由此,不个别定义各个检索请求间或检索结果间或报告之间的项目的关联建立,自动实现不同报告间的提取条件以及选择内容的移交。

此外,即使在链接源检索请求和链接目的地检索请求的检索对象为不同虚拟数据库时,通过参照虚拟项目的定义上附加的表示“不同虚拟表间为相同的虚拟项目”的定义信息,能够判定关联建立。

(仪表板联动单元)

仪表板联动单元37即使在将相同画面上配置多个报告的仪表板中,也可以将由不同检索结果制作的多个报告总括来进行数据分析操作。

图11示出仪表板中的多个报告之间的提取条件联动的设定画面的影像。

为了在构成仪表板的多个报告之间使得提取条件联动,首先,指示“条件追加”的按钮来打开“仪表板提取条件的追加”的画面(图11下)。这样,在该“仪表板提取条件的追加”的画面上显示使得提取条件联动的报告的检索请求中包含的提取条件。由此,从该画面上显示的提取条件中选择任意的提取条件来追加到仪表板提取条件上。被追加的仪表板提取条件显示于“仪表板提取条件的一览”(图11左侧)。

例如,在图11所示的例中,使得称作“按商品销售一览”的报告的检索请求中包含的称作“商品编号”的提取条件与其它报告的提取条件联动。因此,在图11的例中,首先,将称作“按商品销售一览”的报告的检索请求中包含的“商品编号”的提取条件项目追加到仪表板提取条件。

接着,若从仪表板的一览选择1个仪表板提取条件,在称作“与该提取条件联动的报告”的部位显示包含与所选择的提取条件相同的提取条件项目的报告一览(图11右上)。因此,对该“与该提取条件联动的报告”上显示的各个报告指定可否与其它报告的提取条件联动。由此,通过1次提取条件设定,能够同时设定可进行提取条件的联动的多个报告的提取条件。

例如,在图11所示的例中,当从仪表板的一览中选择“商品编号”的提取条件项目时,在称作“与该提取条件联动的报告”的部位(图11右上)显示称作“按商品销售一览”、“每月销售推移”、“按担当者实绩”以及“按老顾客销售排行”的报告。这表示此处显示的各种报告具有可与称作“商品编号”提取条件联动的提取条件。因此,能够从这些各种报告中任意选择使得称作“商品编号”的提取条件联动的报告。此外,在图11所示的例中,能够设定为仅使“按商品销售一览”和“每月销售推移”的提取条件联动。

并且,例如,不管是否具有相同意思内容,能够使得名称不同的多个提取条件项目相互联动。例如,若指示指定图11所示的“与其他提取条件链接”的按钮,则仪表板的一览中选择的提取条件(商品编号)以外的提取条件项目以能够选择地来一览显示。因此,从此处显示的提取条件项目中选择设定为与仪表板一览中选择的提取条件(商品编号)联动的提取条件项目。由此,能够使得该仪表板的一览中选择的提取条件(商品编号)和其他提取条件项目链接。此外,这样设定了提取条件的链接的仪表板提取条件为可显示于利用时的提取检索条件的一览上,在执行检索时,链接源的仪表板提取条件的值可作为链接目的地的仪表板提取条件的值直接使用。

在图11所示的例中,在该仪表板上已定义了称作“商品识别代码”的仪表板提取条件项目。其中,虽然该称作“商品识别代码”的提取条件项目的意思内容与称作“商品编号”的提取条件项目相同,但是由于其名称不同,所以在基于计算机的处理中处理为不同提取条件项目的可能性高。因此,通过使得这些“商品识别代码”和“商品编号”在操作画面上的“与其他提取条件链接”的部位相互联动,可根据来自用户终端的输入操作,能够通过不同报告之间的链接操作正确进行。

如此一来,则有关被指定联动关系的提取条件项目的信息被登录到数据词典10的表达结构中。这表示数据词典10的内容(特别是提取条件项目彼此的联动关系)是根据来自用户终端的输入操作来更新。此外,通过实际使用本发明的系统,能够提高数据词典10内的信息的精度。

此外,通过使用使得多个报告之间的提取条件联动的功能,不仅在提取条件设定时,能够使得仪表板上的报告的钻取联动。在初始状态下,条件值在空的状态下制作仪表板提取条件项目,在对仪表板上的任一个报告上指示钻取时,若钻取的项目为仪表板提取条件项目,则将使得提取条件联动的多个报告的提取条件的值置换为以钻取来指示的值,由此使得仪表板上的多个报告联动来进行钻取。

(类虚拟项目)

称作“老顾客”或“商品”、“社员”的主表主要用于管理对象的属性,其构造与其它数据分开而独立定义,具有一般还将关联的多个项目一体进行操作的特征。

本发明具备将这样的关联的多个虚拟项目的集合与虚拟表分开而独立定义为1个虚拟项目的类虚拟项目的功能。

例如,在保持代码和名称等属性的主表中,在通过检索请求发出单元31的检索对象选择而将类虚拟项目选择为显示项目时,能够使得类虚拟项目所属的多个虚拟项目(例如,代码和名称等)追加到自动检索请求的显示项目。此外,在检索请求发出单元31的提取条件设定中,能够进行如下指引:用户自动地来显示并列记载代码和名称等的容易分辨的菜单,且当用户从菜单选择条件时仅代码被追加到检索条件上。

此外,对于处于等级关系的多个虚拟项目的集合,能够定义等级型类虚拟项目。在等级型类虚拟项目中,作为一例,在检索请求指示部的提取条件设定中,当上位等级的项目的值从菜单显示中选择1个时,在菜单显示与其值建立关联的下位等级的项目的值,用户能够从任意的等级的菜单显示的值中指定作为检索的提取条件的值。

图12示出基于类虚拟项目以及等级型类虚拟项目的提取条件设定画面的操作影像。

通过不将属于主表的多个项目以从属于各个虚拟表的形式个别定义,作为能够以多个虚拟表共通使用的类虚拟项目总括定义,在由对不同虚拟表的检索请求制作的检索结果之间,作为相同或关联的虚拟项目容易移交提取条件或选择条件的值。此外,在不同虚拟表中,将检索时的提取条件的值设定或显示项目的选择等能够以共通的引导或操作顺序进行,由此提高用户的便利性。

<虚拟数据库部的结构>

图13示出本实施例中的虚拟数据库部20的功能模块图。如图13所示,虚拟数据库20包括:检索请求翻译单元21,检索命令执行单元22,以及数据综合加工单元23。

虚拟数据库部20接受由商务智能部30制作的检索请求,能够进行将在虚拟数据库部20内检索的数据作为检索结果返回商务智能部30的处理。或者,虚拟数据库部20构成为接受商务智能部30以外制作的检索请求,也能够构成为向商务智能部30以外的外部输出目的地返回检索结果。

虚拟数据库部20接受的检索请求的描述形式构成为包含作为检索对象的表、作为检索对象的项目的列表、提取条件的指定、分组的指定、排序顺序的指定、检索结果的输出目的地以及表示检索结果的格式的指定等,能够扩展使用标准SQL语句,或者可以使用专用的语句。

(检索请求翻译单元)

虚拟数据库部20中输入的检索请求首先被交给检索请求翻译单元21。检索请求翻译单元21由检索请求解析功能和检索命令生成功能构成。

(检索请求解析功能)

在检索请求解析功能中,对于所输入的检索请求中的项目列表、提取条件、分组指定及排序顺序指定等中出现的所有项目,根据数据词典10内的虚拟数据结构的定义信息变换为虚拟项目。并且,排除重复的虚拟项目,制作应作为检索对象包含的虚拟项目的唯一的组。

接着,检索请求翻译单元21有关所提取的虚拟项目组,根据计算表适用定义进行计算表的检查,检测1个以上的符合的计算表(以下,符合计算表)。

通常计算表适用定义是具有在上位的1个计算表的下位具有1个以上的计算表的树结构。计算表适用定义的末端的节点由以数据库作为检索对象的外部计算表构成,除此以外的上位的节点由内部计算表构成。

在下位的内部计算表的上位定义了内部计算表时,通过将与下位的内部计算表对应的数据综合加工单元23的输出作为与上位的内部计算表对应的数据综合加工单元23的输入,由此表示以多阶段实施数据综合加工单元23。

对于各个虚拟项目,为了探索计算表适用定义来检测最佳的符合计算表,因此有时利用虚拟项目检测不同符合计算表。此时,在执行由不同符合计算表生成的检索命令的阶段,最终综合利用不同检索命令执行单元或不同数据综合加工单元取得的各个数据来提供为1个检索结果。

计算表适用定义的上位计算表和下位计算表的关系是在本实施例中可从合并关系、选择关系、参照关系的3个选择,由此决定数据综合处理功能下的数据综合方式。

探索计算表适用定义,检测最优的符合计算表的顺序具体来说如下。此外,以后,将分组指定或提取条件中使用的虚拟项目称作键项目,将除此之外的虚拟项目描述为属性项目。

(1)在计算表的计算项目列表包含所有包含于虚拟项目组中的键项目,并且在包含一个以上于虚拟项目组中包含的属性项目时,将该计算表作为符合计算表。此外,在计算表中个别地指定了基于提取条件的条件值的判定等的符合条件时,仅在检索请求满足符合条件时,作为符合计算表。

(2)在下位多个计算表定义为合并关系时,在先行的计算表中符合的属性项目中也留在用于检查以后的计算表的虚拟项目组。

(3)在下位多个计算表定义为选择关系时,从用于检查以后的计算表的虚拟项目组排除符合先行的计算表的属性项目。

(4)在下位计算表定义为参照关系时,认为下位的计算表的项目也可在上位的计算表中进行计算,在虚拟项目组包含下位的计算表的项目时,将上位的计算表和下位的计算表作为符合计算表。

(5)从最上位的计算表,对于其下位的计算表按顺序检查以上的顺序,在计算表符合时,进一步对其下位的计算表按顺序进行检查,并重复进行。在用于检查以后的计算表的虚拟项目组中没有属性项目时,或若检查完全部计算表,则结束以上流程。

(检索命令生成功能)

与检索请求翻译单元21得到的检索请求对应的1个以上的符合计算表被交给检索命令生成功能。在检索命令生成功能中,对应于符合计算表,符合计算表为外部参照表时,生成可在检索对象的数据库3上执行的检索命令,并交给检索命令执行单元22。此外,在符合计算表为内部参照表时,生成可在数据综合加工单元23执行的1个以上的检索命令,交给数据综合加工单元23。

首先,在检索命令生成功能,有关各个符合计算表,将虚拟项目组的键项目以及符合属性项目的计算项目设为各检索单位的计算项目组。

接着,在检索命令生成功能,对于所求得的各个检索单位中的检索项目列表、分组指定、排序指定及提取条件,根据利用物理表及物理项目描述的计算项目的计算定义式,对虚拟项目名进行式展开。

此外,计算表中的计算定义式中使用多个物理表时,从物理表结合定义求出多个物理表之间的结合条件来追加到表参照式。

对于与检索对象的数据库对应的计算语句定义中的检索项目列表、分组指定式列表、排序指定式列表、表参照式、提取条件式等的各命令要素,代入展开上述式来得到的式,生成可执行的1个检索命令。

通过将以上过程重复符合计算表的个数的次数,可得到一系列的标准化检索命令的组。

此外,在本实施例中,检索命令生成功能构成为从1个符合计算表生成1个检索命令,但是也可以构成为从1个符合计算表生成多个检索命令,或从多个符合计算表生成1个检索命令。

(检索命令执行单元)

检索命令执行单元22对数据库1执行根据检索请求翻译单元21的检索命令生成功能制作的1或多个检索命令,作为对各个检索命令的响应取得检索数据来临时保存到保管区域,并向数据综合加工单元23的数据综合处理功能送出。

在数据库1支持检索接口作为SQL语言时,可构成为具备以下各执行单元中1个以上的执行单元:对数据库1的物理表的基于SQL的检索命令的执行单元;使用数据库1中保存的存储过程的检索命令的执行单元;或将用数据库1的SQL语言直接定义的检索的检索结果作为检索对象从检索结果再次检索的检索命令的执行单元。

此外,数据库1不支持SQL语言作为检索接口时,只要构成为具备与数据库1的检索接口对应的检索命令的执行单元,在数据库1为文件系统上的数据文件时,构成为具备与该数据文件对应的检索命令的执行单元就可以。

检索数据的临时保管区域的一例,只要利用数据库1上中的临时表、特定的作业用数据库上中的临时表、磁记录介质上的临时文件、存储器上的存储区域等来构成就可以。

(数据综合加工单元)

数据综合加工单元23根据检索请求翻译单元21生成的内部计算表对应的检索命令,执行数据综合以及数据加工的处理。

进行了数据综合和数据加工的结果数据作为与检索请求对应的检索结果,向商务智能部30或商务智能部30以外的输出目的地发送。

作为商务智能部30以外的输出目的地,例如,可对数据库的表输出结果数据。或者,对文件系统中保存的数据文件或通过网络发送的数据流等输出结果数据。此时,作为结果数据的输出形式的一例,能够使用CSV(逗号分隔可变长数据)形式、HTML形式、XML形式、表计算工作表形式等。

最单纯的结构例中,在数据综合加工单元23中,将在检索命令执行单元22中的处理过程中分割制作的多个中间检索数据的1个或多个作为输入,进行数据综合和数据加工,将结果数据作为1个表输出。

此外,在更加复杂的结构例中,将某个数据综合加工单元23输出的结果数据交给作为向其它数据综合加工单元22的输入。

在发出多个与内部计算表对应的检索命令时,按照检索命令中指示的顺序,交给前段的数据综合加工单元23输出的结果数据作为向后段的数据综合加工单元23的输入,依次重复数据综合加工单元23的处理,能够多阶段执行数据综合加工单元23的处理。

数据综合加工单元23的功能包括:数据综合处理功能;以及对综合的数据进行加工的数据加工处理功能。

(数据综合处理功能)

在数据综合处理功能,根据1个或多个中间数据进行数据综合来制作1个表数据。

在数据综合处理功能,具备合并方式、选择方式、参照方式的数据综合方式,能够从中选择或组合使用最优的方式。

有关对检索请求中指定的虚拟表怎样使用数据综合方式是描述在与数据词典10的虚拟表对应的计算表适用定义中。

图14示出这些多个数据综合方式的处理概念图。

在合并方式(UNION),从可适用于检索请求的多个计算表生成多个检索命令,合并全部的并列执行多个检索命令来提取的多个检索数据,先作为1个表数据。多个计算表的检索数据包含全部共通的键项目,但是属性项目只包含一部分检索数据。因此,将该表数据在所包含的全部的键项目中进行分组,通过将属性项目值聚集到每组中,由此除去键项目全部重复的冗余部分(非标准性)。在不特别指定时,属性项目的聚集方法,对数值型数据进行合计计算,在数值型以外的数据为空值和有效值时不进行选择有效值的最大值计算就可以。其中,能够用数据词典个别指定聚集方法。

在图14的合并方式所示的例中,要求在检索结果请求中具有“老顾客”和“商品”作为键项目,检索数据1和检索数据2同时满足该要件,双方中存在值为“老顾客1”和“商品1”的记录。接着,对于属性项目的单价,由于仅检索数据1具有值,所以聚集来将“单价1”作为检索结果的值。此外,对于数量,在检索数据1和检索数据2的双方都有值,所以在数值型的合计计算中聚集来将“数量1+数量2”作为检索结果的值。

在合并方式,能够用1个检索命令取得来自各个数据库的检索数据,此外,能够并列执行多个检索命令,所以处理性能较高,但是为聚集所需的键项目全部包含在所取得的检索数据中成为要件。

在选择方式(CHOICE),对检索请求按照优先顺序检查可适用的多个计算表,并以包含全部的所要求的键项目为条件,选择包含各个属性项目的优先顺序最高的计算表来生成并执行检索命令来取得检索数据。对于多个属性项目生成多个检索命令时,将分别执行而提取的多个检索数据以与合并方式同样的方法进行分组及聚集,除去冗余部分。

在图14的选择方式所示的例中,要求在检索结果具有“老顾客”和“商品”,但是检索数据1作为键项目只具有“老顾客”,所以不作为检索对象。接着,在检索数据2包含“老顾客”和“商品”作为键项目,所以从其还取得属性项目的“单价”、“数量”。由此,由于能够取得全部的属性项目,所以在此结束判定,但是若不能取得属性项目的一部分,则进一步继续同样的判定。

在选择方式,对某个数据库中保存的明细数据,还配合制作包括1或多个等级的聚集数据来保存到数据库中时,将满足赋予的检索请求的要求内容,并且将聚集等级最高的数据作为检索对象自动选择计算表,由此能够谋求提高数据库的检索处理效率。

在参照方式(LOOKUP),在1个计算表上将参照关联的1或多个参照的计算表建立关联。对于生成/执行与原来的1个计算表对应的检索命令来取得的检索数据的各记录,根据按所参照的每个计算表在计算表适用定义中定义的参照条件进行检索来作为参照数据,对原来的检索数据不足的项目,从与参照数据对应的项目转记值来使用多个检索数据计算结果数据。

在图14的参照方式所示的例中,在最初的检索数据1中得到“老顾客”、“商品”、“数量”,但是缺少称作“单价”的项目。检索数据2的参照条件设为“检索数据1的商品和检索数据2的商品相同值”时,以用检索数据1得到的商品的值“商品1”作为条件参照检索数据2,将所得到的单价的值“单价1”转记为检索结果的单价的值。

在参照方式,在执行1个检索命令取得的检索数据中不包含需要的聚集键的一部分时,取得执行其它检索命令来关联的检索数据,具有能够补充不足的聚集键来进行聚集处理的优点。

(参照的处理方式)

在参照方式中,根据所定义的参照条件进行检索来取得参照数据,但是一般参照条件作为条件式的变数包含参照源的项目,所以参照源和参照目的地的数据库不同时,不能利用参照目的地的数据库直接执行检索。因此,不同数据库之间的参照的处理方式需要与通常的数据库中的结合处理(JOIN)不同结构。

在本实施例中,作为参照的处理方式,具备逐次参照方式、总括结合方式及顺次合并方式的3个处理方式。在图15A及图15B表示这些多个参照的处理方式的处理概念图。

在逐次参照方式,从生成/执行1个检索命令来取得的检索数据各取得1记录。为了检索该记录来作为参照源,将作为变数包含在参照条件的条件式中的参照源的项目置换为该记录的项目值。对由此得到的参照条件附加检索命令来取得参照目的地的检索数据,并将双方的记录连结来计算结果数据。对所取得的全部检索数据逐次重复以上的顺序。

所需要的参照的检索命令次数在原理上成为参照源的检索数据的件数,所以在特别参照大量数据时具有花费处理时间的倾向。但是,不是在参照源的检索数据的每1个记录,而是能够将参照源的检索数据的多个记录汇总而组合到参照1个的检索命令的结合条件中,此时发出的检索命令的个数成为(参照源的检索数据的件数÷参照每1次的记录数)。

总括结合方式暂时将成为参照源的检索对象的数据以及成为参照目的地的检索对象的全部数据保存到1个作业用数据库中,并对作业用数据库发出进行结合(JOIN)处理的检索命令,将结果数据进行总括计算。在作业用数据库需要充分的作业区域,一般处理顺序变得复杂。

对于总括结合方式的处理效率,作业用数据库中的结合处理通常相当高速,所以大大依赖于向成为结合处理对象的数据的作业用数据库传送的传送效率,尤其是写入效率。作业用数据库可以使用检索对象的数据库中任一个,所以参照源或参照目的地的数据的任一个皆为大量,相反侧为少量时,通过向保存大量侧的数据的数据库传送少量侧的数据,不进行大量数据的传送,而可高速进行处理。此外,数据的更新频率较低,即使静态保持也没有问题的数据通过预先传送到作业用数据库,能够提高参照检索的处理效率。

在顺次合并方式中,将成为参照源的检索对象的数据和成为参照目的地的检索对象的数据预先按照参照条件的条件值的顺序排序,之后顺次读取来比较参照源记录和参照目的地记录的参照条件的条件值,并对条件值一致的来计算结果数据。

图16例示顺次合并方式的处理概念。在参照源数据包含“出货目的地代码”、“商品代码”、“数量”。在参照目的地数据1包含“出货目的地代码”和“出货目的地名”。参照源数据和参照目的地数据1的参照条件是“参照源数据.出货目的地代码=参照目的地数据1.出货目的地代码”。因此,将参照源数据用出货目的地代码排序,并将参照目的地数据1用出货目的地代码排序。之后,依次读取参照源数据和参照目的地数据1,对于出货目的地代码相同的记录,出货目的地名转记为参照目的地数据1,其它项目从参照源数据转记来制作中间数据。

接着,同样对中间数据和参照目的地数据2用商品代码进行排序。之后,顺次读取中间数据和参照目的地数据2,对于商品代码相同的记录,商品名和单价转记参照目的地数据2,其它项目从中间数据转记,制作结果数据。若参照源数据或参照目的地数据存在多个具有相同的条件值时,对各个记录制作结果数据,因此输出多个结果数据。

图17示出顺次合并方式的具体处理流程。

首先,用参照条件中包含的全部的参照源项目对参照源数据进行排序,用参照条件中包含的全部的参照目的地的项目对参照目的地数据进行排序。此时,排序的顺序的参照条件的条件值成为升序。(在为降序时,将以下的大小关系反过来读取就可以。)

接着,从参照源读取1件记录。从参照目的地还读取记录,在存在多个相同条件值的记录时,读取全部的相同条件值的记录作为记录/设置。

用基于参照源记录的项目值的参照条件的条件值和基于参照目的地记录的项目值的参照条件的条件值进行大小比较。在参照源记录的条件值较小时,读取下一参照源记录,再次进行条件值的大小比较。若在参照目的地记录/设置的条件值较小时,读取下一参照目的地记录/设置,再次进行条件值的大小比较。

若双方的条件值相等,即若参照条件成立,则从参照目的地记录/设置取出1件来作为参照目的地记录,对于参照源记录的不足项目,从参照目的地记录转记值,输出结果数据。对参照目的地记录/设置的全部记录重复该处理。由此,参照源的1记录和参照目的地的n记录的条件值对应时,结果数据输出n记录。若完成记录/设置的处理,则读取下一参照源记录,再次进行条件值的大小比较。

在此参照目的地记录/设置在记录输出后也保留原状地留下,所以在参照源的m记录的条件值与包含参照目的地的n记录的记录/设置的条件值对应时,结果数据输出m×n记录。这成为与包含SQL的键重复的记录的结合处理相等的结果。

以后,重复该顺序直到处理完全部的参照源记录或全部的参照目的地记录。

在顺次合并方式中,虽然需要预先对成为检索对象的数据进行,但是通过顺次读取1次全记录结束参照处理,所以处理时间极为稳定。其中,只需要有全体中一部分记录时,需要读取全记录,所以过于不合适。

此外,包含排序处理或参照条件比较处理,对所有处理进行顺序处理,所以存储器消耗量极少,适合大量数据的处理。尤其是在必须彼此结合多个大量数据等时,顺次合并方式发挥大效果。

如上所述,对于数据综合方式,从多个方式选择最优的综合方式,或能够组合使用多个综合方式,此外,对于综合方式对于参照时的处理方式,也从多个方式选择最优的参照处理方式,或能够组合使用多个参照处理方式,能够实现各种状况中最优的综合处理效率。

(数据加工处理功能)

在数据加工处理功能中,对数据综合处理功能中得到的1个表数据进行以下的处理,输出符合检索命令中的指示内容的结果数据。

(1)在键项目中进行分组,将属性项目值按每组进行聚集的分类/聚集处理

(2)在检索命令中有数据编辑的指定时,数值运算、文字列操作、日期变换、代码变换等的数据编辑处理

(3)在指定数据提取条件时,基于特定的值范围条件指定、基于文字列的方式/匹配等的数据提取处理

(4)在对检索命令指定输出顺序时,分类处理

此外,数据加工处理功能还可以具有在记录内的标量运算中很难处理的、进行依赖于记录间关系/顺序的运算的功能。其功能例如下。

(1)1号的合计,1号和2号的合计,1号和2号和3号的合计,的累计处理

(2)称作1号的合计、1号和2号的合计、2号和3号的合计、3号和4号的合计的移动累计处理

(3)称作1号的值、2号和1号的差分、3号和2号的差分的差分处理

(4)基于开头值、末尾值、开头第n件、末尾第n件等记录序列号的处理

(5)基于跟前一个记录、后面一个记录等记录顺序的处理

(6)分散、相关、推定、验证等统计处理

这种处理使用SQL的分析函数也能够实现,但是在通常的数据库/引擎中SQL的分析函数在存储器处理,在能够处理的数据量上有限定,不符合大量数据的处理。本实施例的数据加工处理功能,流处理作为前提,所以存储器的消耗量极少,具有适合大量数据的处理的优点。

(检索命令生成功能的最优化)

此外,根据检索命令执行单元22取得的多个中间检索数据,在数据综合加工单元23中进行数据综合处理或数据加工处理。因此,在检索请求翻译单元21的检索命令生成功能中,重要的是以将从作为处理对象的数据库的结果数据的记录件数设为最少的方式,生成检索命令。由此,不减少基于结果数据的传送的通信系统开销,并且能够提高数据综合加工单元23的处理效率。因此,在检索命令生成功能中能够进行下面的处理。

在对检索请求中被指示的虚拟数据库部的提取条件中,对于可能的提取条件变换为对数据库的检索命令来适用。由此,能够将作为成为检索对象的数据以及检索结果返回的数据进行收敛。

检索请求中要求的分类合计中,对于可能的分类合计,利用对数据库的检索命令预先分类合计来聚集检索结果。由此,能够减少从数据库输出的检索结果的数据件数。

此外,参照如代码/名称变换那样的对不频繁进行数据更新的静态属性进行管理的主机的处理,为不在件数较多的向数据库的明细数据的检索阶段进行,而是对件数较少的聚集后的数据进行。由此,能够减少参照处理次数。

(数据/缓存)

并且,在数据综合加工单元,提高检索处理效率,所以具有能够对检索数据进行缓存的机构。图18示出检索数据/缓存的处理概念图。检索数据/缓存将数据综合处理结果的表数据、或数据库检索执行功能中的处理过程中分割制作的中间检索数据预先制作来保存在检索数据/缓存用的外部存储区域,在执行检索时,代替数据库,通过参照检索数据/缓存用的外部存储区域的数据来实现。

在检索数据/缓存用的外部存储区域预先保存的定时能够任意设定管理者指定的一定的日期时间、或基于用户的初次检索时、或数据更新等基于外部事件的启动等任意设定,此外通过管理者的指定,设定检索数据/缓存的有效期限,在超过有效期间时,能够再次制作检索数据/缓存。

此外,有关检索数据/缓存的作成对象范围,按虚拟表或计算表单位包括用户可选择的全部项目,用户的可指定的提取条件包含全部值,能够制作。由此,对于以虚拟表或计算表作为对象的所有检索,检索数据/缓存有效,能够谋求检索处理效率的高速化。

(数据综合加工单元的多阶段化的效果)

本发明具有能够多阶段执行数据综合加工单元23的处理的功能。这种多阶段的数据综合加工的必要性在求出特定对象的件数的情况、或求出整体结构比的情况或求出出现频率的情况、或仅输出上位/下位n件的情况下等,特别在进行检索结果的指标化等统计加工的阶段发生多次。

此外,在对大量数据进行复杂统计处理时,从处理效率的观点看具有许多需要分步骤来执行数据综合加工的情况。

在本发明中,在数据词典的计算表适用定义中定义适用的虚拟项目和多阶段的数据综合加工,由此根据来自用户的检索请求,对每个虚拟项目判断自动需要的段数的数据综合加工,从而能够执行适当段数的数据综合加工处理。

根据图19说明包含多阶段的数据综合加工单元的处理影像。

在数据库中保存按商店分割的多个出货数据(物理表:T1以及T2),分别包含相当于商品、出货目的地、出货数量的项目。但是,T1和T2用检索中不使用的“…”表示的部位不同,此外,从所登录的项目名称不同(“商店名”和“Dealer”,“商品名”和“Product”等)的这一点中,数据的格式不同。从包含该T1及T2而构筑的数据库按照用R表示的商品得到合计了出货数量和出货目的地数的最终检索结果。

首先,在取得按商品的出货数量时,对根据T1及T2提取所需的数据的多个检索数据,根据数据词典关联名称不同的项目来综合为1个表,按商品合计所综合的数据。由此,得到按商品计算出货数量的第1结果数据(V1)。此时,数据综合加工单元执行1次。

另一方面,在按商品取得出货目的地数和出货数量时,对从T1以及T2取得综合到1个表的数据,为了临时排除重复的出货目的地,按按商品/出货目的地聚集(V2)数据之后,需要按商品进行出货目的地数计算来得到第2结果数据(V3)。因此,需要利用按商品/出货目的地的数据聚集、出货目的地件数的计算,需要执行2次数据综合加工单元。

此外,通过合计第1结果数据(V1)和第2结果数据(V3)的数据,能够得到对应于检索请求的最终的结果数据R。

在此,为得到检索结果所需要的数据综合加工的段数是根据数据词典自动判别,所以用户完全不需要识别。

通过实现本发明中的多阶段的数据综合加工,将用户以往很难直接从数据库取得的复杂或高度的统计处理等的报告,能够仅通过发出检索请求来简单取得,不必在事前或事后进行基于人工的数据加工。即,与以往的虚拟数据库相比,对于更加复杂或高度的检索要件,具有能够灵活处理的特长。

以上,在本申请的说明书中,为了表现本发明的内容,参照附图来说明了本发明的实施方式。其中,本发明不限定于上述实施方式,包括本领域的技术人员基于本申请的说明书中记载的事项显而易见的变更方式或改良方式。

【附图标记说明】

1 数据库

2 用户终端

3 管理者终端

10 数据词典

20 虚拟数据库部

21 检索请求翻译单元

22 检索命令执行单元

23 数据综合加工单元

30 商务智能部

31 检索请求发出单元

32 报告输出单元

33 仪表板单元

34 库管理单元

40 数据词典编辑部

100 数据检索装置

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1