分布式多点数据抽取方法

文档序号:6546738阅读:357来源:国知局
分布式多点数据抽取方法
【专利摘要】本发明具体涉及分布式多点数据抽取方法;包括以下步骤:步骤101:首先针对外部数据源DB及字段结构建立数据源表,步骤102:建立数据源表;步骤103的建立内部数据源表;步骤104:选取需引入数据字段和步骤105:添加数据表定位字段GUID,步骤106:生成内部数据源表结构;步骤107:GUID定位码生成器,步骤108:生成带定位码的内部数据源表;步骤109:建立程序定位数据表,步骤110:约束条件智能生成器,步骤111:用户录入筛选条件,步骤112:单元格位置标注筛选条件及颜色,步骤113:由GUID标识表名、字段名、记录条件、时间、客户名;步骤114的GUID条件,步骤115:生成SELECT;步骤116:获取目标数据,步骤117:聚类分析判断;步骤118:分析报告表;让用户获取需要的任何数量的筛选数据结果。
【专利说明】分布式多点数据抽取方法
【技术领域】
[0001]本发明涉及数据处理【技术领域】,具体涉及分布式多点数据抽取方法。
【背景技术】
[0002]通常数据分析技术的主要方式,是通过数据筛选,获取满足条件的数据元素。目前,实现数据分析筛选,在SQL、Access, Oracle等数据平台中,是通过编制程序语句实现数据筛选,其优势是可以通过其语句函数等,编制程序写语句实现各种筛选结果。但并不能在其数据平台上直接通过鼠标或键盘点击指令界面化操作,实现数据筛选,不能直接构建出将筛选条件与数据元素绑定并记载。在Excel软件中,可以设置筛选条件获取筛选结果,但用户筛选条件无法保存,更不能将筛选条件与单元格绑定;其他现有中外应用或专用软件,公开发表的信息中也未出现上述权利要求涉及到的分布式多点数据抽取技术。

【发明内容】

[0003]本发明的目的为了解决上述问题,提供了分布式多点数据抽取方法。
[0004]为实现上述目的,本发明提供了分布式多点数据抽取方法,包括以下步骤:
[0005]步骤101:首先针对外部数据源DB及字段结构建立数据源表,针对步骤102中的建立数据源表进行判断是否要进入步骤103的建立内部数据源表,如果不需要建立内部数据源表,则进入步骤107:⑶ID定位码生成器;如果需要建立内部数据源表,那么进入步骤104:选取需引入数据字段和步骤105:添加数据表定位字段⑶ID,再进入步骤106:生成内部数据源表结构;接着进入步骤107:⑶ID定位码生成器,由⑶ID定位码生成器对生成内部数据源表结构进行处理,然后进入步骤108:生成带定位码的内部数据源表;针对生成带定位码的内部数据源表进入步骤109:建立程序定位数据表,对建立程序定位数据表进行判定是否要生成步骤110:约束条件智能生成器,如果否,则进入步骤113:由GUID标识表名、字段名、记录条件、时间、客户名;如果是,则进入步骤110:约束条件智能生成器,再进入步骤111:用户录入筛选条件,由约束条件智能生成器对用户录入筛选条件进行判断是否符合,如果符合条件则进入步骤112:单元格位置标注筛选条件及颜色,如果不符合条件则进入步骤113:由GUID标识表名、字段名、记录条件、时间、客户名;由步骤113生成步骤114的⑶ID条件,针对⑶ID条件进入步骤115:生成SELECT ;从而进入步骤116:获取目标数据,针对获取的目标数据进入步骤117:聚类分析判断;最终针对由聚类分析判断得出步骤118:分析报告表。
[0006]本发明具有以下有益效果:采用本发明的方法,可在不编写程序语句的情况下,让用户能完整的设定任何数量的数据筛选条件,获取需要的任何数量的筛选数据结果,且将任何数量的筛选条件组合记载于数据表中。
【专利附图】

【附图说明】
[0007]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0008]图1为本发明分布式多点数据抽取方法处理流程图。
【具体实施方式】
[0009]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0010]参见图1,本发明提供了分布式多点数据抽取方法,包括以下步骤:
[0011]步骤101:首先针对外部数据源DB及字段结构建立数据源表,针对步骤102中的建立数据源表进行判断是否要进入步骤103的建立内部数据源表,如果不需要建立内部数据源表,则进入步骤107:⑶ID定位码生成器;如果需要建立内部数据源表,那么进入步骤104:选取需引入数据字段和步骤105:添加数据表定位字段⑶ID,再进入步骤106:生成内部数据源表结构;接着进入步骤107:⑶ID定位码生成器,由⑶ID定位码生成器对生成内部数据源表结构进行处理,然后进入步骤108:生成带定位码的内部数据源表;针对生成带定位码的内部数据源表进入步骤109:建立程序定位数据表,对建立程序定位数据表进行判定是否要生成步骤110:约束条件智能生成器,如果否,则进入步骤113:由GUID标识表名、字段名、记录条件、时间、客户名;如果是,则进入步骤110:约束条件智能生成器,再进入步骤111:用户录入筛选条件,由约束条件智能生成器对用户录入筛选条件进行判断是否符合,如果符合条件则进入步骤112:单元格位置标注筛选条件及颜色,如果不符合条件则进入步骤113:由⑶ID标识表名、字段名、记录条件、时间、客户名;由步骤113生成步骤114的⑶ID条件,针对⑶ID条件进入步骤115:生成SELECT ;从而进入步骤116:获取目标数据,针对获取的目标数据进入步骤117:聚类分析判断;最终针对由聚类分析判断得出步骤118:分析报告表。二维数据表中,以单元格位置信息为绑定点,记载用户所设定的数据分析筛选的条件,并将行的各单元格已经设置的若干个数据筛选条件进行数理逻辑关联,应用数据筛选语句抽取满足组合条件的数据样本。而若干个单元格和数据行形成的筛选条件集合,将用户需要筛选的数据,以语句方式完整的与各数据单元关联,形式上分布于数据单元中,形成分布式多点数据抽取技术。
[0012]本发明举例说明:二维数据设列标识X和行标识Y:
[0013]列集合X= {XI,X2, X3, X4, X5......Xnj
[0014]行集合Y= {YI, Y2, Y3, Y4, Y5......Ynj
[0015]X1X2X3X4X5......Xn
[0016]
【权利要求】
1.分布式多点数据抽取方法,其特征在于:包括以下步骤: 步骤101:首先针对外部数据源DB及字段结构建立数据源表,针对步骤102中的建立数据源表进行判断是否要进入步骤103的建立内部数据源表,如果不需要建立内部数据源表,则进入步骤107:⑶ID定位码生成器;如果需要建立内部数据源表,那么进入步骤104:选取需引入数据字段和步骤105:添加数据表定位字段GUID,再进入步骤106:生成内部数据源表结构;接着进入步骤107:⑶ID定位码生成器,由⑶ID定位码生成器对生成内部数据源表结构进行处理,然后进入步骤108:生成带定位码的内部数据源表;针对生成带定位码的内部数据源表进入步骤109:建立程序定位数据表,对建立程序定位数据表进行判定是否要生成步骤110:约束条件智能生成器,如果否,则进入步骤113:由GUID标识表名、字段名、记录条件、时间、客户名;如果是,则进入步骤110:约束条件智能生成器,再进入步骤111:用户录入筛选条件,由约束条件智能生成器对用户录入筛选条件进行判断是否符合,如果符合条件则进入步骤112:单元格位置标注筛选条件及颜色,如果不符合条件则进入步骤113:由⑶ID标识表名、字段名、记录条件、时间、客户名;由步骤113生成步骤114的⑶ID条件,针对⑶ID条件进入步骤115:生成SELECT ;从而进入步骤116:获取目标数据,针对获取的目标数据进入步骤117:聚类分析判断;最终针对由聚类分析判断得出步骤118:分析报告表。
【文档编号】G06F17/30GK103970880SQ201410208607
【公开日】2014年8月6日 申请日期:2014年5月17日 优先权日:2014年5月17日
【发明者】白崇明 申请人:白崇明
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1