一种大数据处理方法及系统与流程

文档序号:11919238阅读:276来源:国知局
一种大数据处理方法及系统与流程

本发明涉及数据处理技术领域,特别涉及一种大数据处理方法及系统。



背景技术:

当前,随着信息时代的发展,人们在日常工作生活中所产生的数据越来越多,这些大数据一方面对存储技术提出了更高的要求,另一方面由于这些大数据能够反映出特定对象的行为规律,如果能够通过对这些大数据进行分析处理来确定出这些大数据背后所蕴含的意义,将会为企业在开发产品或提供服务时提供非常关键的指引作用。

然而,如何对大数据进行高效地分析处理依然是目前有待进一步解决的问题。



技术实现要素:

有鉴于此,本发明的目的在于提供一种大数据处理方法及系统,能够实现对大数据进行高效地分析处理。其具体方案如下:

一种大数据处理方法,包括:

采集用户行为大数据;

将采集到的用户行为大数据保存至预先搭建的分布式数据库系统;其中,所述分布式数据库系统包括N个数据库节点,N为大于1的整数;

利用分布式框架以及预设的数据挖掘模型,分别对所述N个数据库节点上的用户行为大数据进行数据挖掘处理,相应地得到N组用户行为分析结果;

将所述N组用户行为分析结果进行汇集,得到用户行为整体分析结果。

可选的,所述分布式数据库系统为Oracle RAC数据库系统。

可选的,所述将采集到的用户行为大数据保存至预先搭建的分布式数据库系统的过程,包括:

按照用户行为类别的不同,将采集到的用户行为大数据分类保存至不同的数据库节点。

可选的,所述数据挖掘模型包括基于分类和/或聚类和/或回归分析和/或关联规则的数据挖掘模型。

可选的,所述将所述N组用户行为分析结果进行汇集的过程之后,还包括:

获取客户终端发送的结果查询请求;

若所述结果查询请求为合法请求,则将与所述结果查询请求对应的用户行为分析结果发送至所述客户终端的显示屏。

本发明还公开了一种大数据处理系统,包括:

大数据采集模块,用于采集用户行为大数据;

分布式数据保存模块,用于将所述大数据采集模块采集到的用户行为大数据保存至预先搭建的分布式数据库系统;其中,所述分布式数据库系统包括N个数据库节点,N为大于1的整数;

分布式数据挖掘模块,用于利用分布式框架以及预设的数据挖掘模型,分别对所述N个数据库节点上的用户行为大数据进行数据挖掘处理,相应地得到N组用户行为分析结果;

结果汇集模块,用于将所述N组用户行为分析结果进行汇集,得到用户行为整体分析结果。

可选的,所述分布式数据库系统为Oracle RAC数据库系统。

可选的,所述分布式数据保存模块,具体用于按照用户行为类别的不同,将采集到的用户行为大数据分类保存至不同的数据库节点。

可选的,所述数据挖掘模型包括基于分类和/或聚类和/或回归分析和/或关联规则的数据挖掘模型。

可选的,所述大数据处理系统,还包括:

请求获取模块,用于获取客户终端发送的结果查询请求;

结果发送模块,用于当所述结果查询请求为合法请求,则将与所述结果查询请求对应的用户行为分析结果发送至所述客户终端的显示屏。

本发明中,大数据处理方法,包括:采集用户行为大数据;将采集到的用户行为大数据保存至预先搭建的分布式数据库系统;其中,分布式数据库系统包括N个数据库节点,N为大于1的整数;利用分布式框架以及预设的数据挖掘模型,分别对上述N个数据库节点上的用户行为大数据进行数据挖掘处理,相应地得到N组用户行为分析结果;将上述N组用户行为分析结果进行汇集,得到用户行为整体分析结果。

可见,本发明采集到用户行为大数据之后,将会把这些大数据保存至分布式数据库系统,然后利用分布式框架和预设的数据挖掘模型,分别对每个数据节点上的用户行为大数据进行相应的数据挖掘处理,相应地得到多组用户行为分析结果,接着再把这些结果进行合并,便可得到用户行为整体分析结果。由上可见,本发明基于分布式技术,分别对多份用户行为大数据同时进行数据挖掘处理,这样可以大幅提升大数据的分析处理速度,也即,本发明实现了对大数据进行高效地分析处理的目的。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例公开的一种大数据处理方法流程图;

图2为本发明实施例公开的一种具体的大数据处理方法流程图;

图3为本发明实施例公开的一种大数据处理系统结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例公开了一种大数据处理方法,参见图1所示,该方法包括:

步骤S11:采集用户行为大数据。

步骤S12:将采集到的用户行为大数据保存至预先搭建的分布式数据库系统;其中,分布式数据库系统包括N个数据库节点,N为大于1的整数。

本实施例中,上述分布式数据库系统具体可以是Oracle RAC数据库系统(Oracle RAC,即Oracle Real Application Cluster)。

步骤S13:利用分布式框架以及预设的数据挖掘模型,分别对上述N个数据库节点上的用户行为大数据进行数据挖掘处理,相应地得到N组用户行为分析结果。

步骤S14:将上述N组用户行为分析结果进行汇集,得到用户行为整体分析结果。

可见,本发明实施例采集到用户行为大数据之后,将会把这些大数据保存至分布式数据库系统,然后利用分布式框架和预设的数据挖掘模型,分别对每个数据节点上的用户行为大数据进行相应的数据挖掘处理,相应地得到多组用户行为分析结果,接着再把这些结果进行合并,便可得到用户行为整体分析结果。由上可见,本发明实施例基于分布式技术,分别对多份用户行为大数据同时进行数据挖掘处理,这样可以大幅提升大数据的分析处理速度,也即,本发明实施例实现了对大数据进行高效地分析处理的目的。

参见图2所示,本发明实施例公开了一种具体的大数据处理方法,包括如下步骤:

步骤S21:采集用户行为大数据。

步骤S22:将采集到的用户行为大数据保存至预先搭建的Oracle RAC数据库系统;其中,Oracle RAC数据库系统包括N个数据库节点,N为大于1的整数。

具体的,上述步骤S22中,可以按照用户行为类别的不同,将采集到的用户行为大数据分类保存至不同的数据库节点。例如,将用户网上挑选商品行为、用户网上支付行为、用户网上理财行为等各种用户行为所对应的大数据分别保存至上述Oracle RAC数据库系统中的不同的数据库节点。

步骤S23:利用分布式框架以及预设的数据挖掘模型,分别对上述N个数据库节点上的用户行为大数据进行数据挖掘处理,相应地得到N组用户行为分析结果。

本实施例中,上述数据挖掘模型具体可以包括基于分类和/或聚类和/或回归分析和/或关联规则的数据挖掘模型。

步骤S24:将上述N组用户行为分析结果进行汇集,得到用户行为整体分析结果。

进一步的,将上述N组用户行为分析结果进行汇集的过程之后,还可以包括:获取客户终端发送的结果查询请求,若结果查询请求为合法请求,则将与结果查询请求对应的用户行为分析结果发送至客户终端的显示屏。

相应的,本发明实施例还公开了一种大数据处理系统,参见图3所示,该系统包括:

大数据采集模块11,用于采集用户行为大数据;

分布式数据保存模块12,用于将大数据采集模块11采集到的用户行为大数据保存至预先搭建的分布式数据库系统;其中,分布式数据库系统包括N个数据库节点,N为大于1的整数;

分布式数据挖掘模块13,用于利用分布式框架以及预设的数据挖掘模型,分别对上述N个数据库节点上的用户行为大数据进行数据挖掘处理,相应地得到N组用户行为分析结果;

结果汇集模块14,用于将上述N组用户行为分析结果进行汇集,得到用户行为整体分析结果。

具体的,本实施例中,上述分布式数据库系统可以为Oracle RAC数据库系统。

另外,上述分布式数据保存模块,具体可以用于按照用户行为类别的不同,将采集到的用户行为大数据分类保存至不同的数据库节点。

进一步的,上述数据挖掘模型可以包括基于分类和/或聚类和/或回归分析和/或关联规则的数据挖掘模型。

本实施例中,上述大数据处理系统,还可以进一步包括请求获取模块和结果发送模块;其中,

请求获取模块,用于获取客户终端发送的结果查询请求;

结果发送模块,用于当结果查询请求为合法请求,则将与结果查询请求对应的用户行为分析结果发送至客户终端的显示屏。

可见,本发明实施例采集到用户行为大数据之后,将会把这些大数据保存至分布式数据库系统,然后利用分布式框架和预设的数据挖掘模型,分别对每个数据节点上的用户行为大数据进行相应的数据挖掘处理,相应地得到多组用户行为分析结果,接着再把这些结果进行合并,便可得到用户行为整体分析结果。由上可见,本发明实施例基于分布式技术,分别对多份用户行为大数据同时进行数据挖掘处理,这样可以大幅提升大数据的分析处理速度,也即,本发明实施例实现了对大数据进行高效地分析处理的目的。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本发明所提供的一种大数据处理方法及系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1