一种大数据存储分析系统的制作方法

文档序号:30087406发布日期:2022-05-18 06:19阅读:54来源:国知局

1.本发明涉及数据分析系统领域,尤其涉及一种大数据存储分析系统。


背景技术:

2.大数据或称巨量资料,指的是所涉及的资料量规模巨大到无法透过主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯,在网页大数据获取的过程中,由于网页中的数据种类多且繁杂,现有的大数据储存分析系统在对获取的数据处理过程中,难以进行较好的归类与存储,因此,许多数据只能短暂性的爬取与利用,无法长久的储存,由于数据类型混乱且统一整合在一起,在多次分析时数据积累过多则混乱程度明显加大,为数据的存储与分析带来不便,还有,对于数据可视化过程效果并不明显,并不能给予用户多样的数据提取或者查看方式,使用局限性非常大,而同时,对于远程的移动端或者主机端客户来说,存储的大数据也难以依照类型进行精准调用。


技术实现要素:

3.本发明的目的是为了解决背景技术中存在的缺点,而提出的一种大数据存储分析系统。
4.为达到以上目的,本发明采用的技术方案为:一种大数据存储分析系统,包括采集模块,所述采集模块连接有数据预处理模块,所述数据预处理模块包括数据持久化模块,所述数据预处理模块连接有导入模块,所述导入模块连接有存储模块,所述存储模块连接有数据可视化模块,所述数据可视化模块连接有人机交互模块,其中:所述数据预处理模块将网页上爬取的数据信息进行解析过滤筛选;所述数据持久化模块将处理后的数据信息分类整合;所述导入模块用来传输数据至存储模块中以进行保存;所述数据可视化模块将存储模块中的存储数据进行可视化表现,以供人机交互模块使用过程中直观的获取数据信息。
5.优选的,所述数据预处理模块还包括数据解析模块、数据过滤模块、数据加密模块与网络传输模块,其中:所述数据解析模块用来解析网页中的数据;所述数据过滤模块用来过滤掉网页中无用数据,无用数据包括文字字数、段落间行间距与网页页数。
6.优选的,所述网络传输模块连接有云端服务器模块,所述网络传输模块将预处理的数据发送至云端服务器模块中,所述云端服务器模块用来对数据进行储存,以便于后期调取使用。
7.优选的,所述云端服务器模块包括云存储库、云调取模块、云更新模块,所述云存储库用来储存云端数据,所述云调取模块用来调取云存储库中的云端数据,所述云更新模块用来根据上传的云端数据对云存储库中的数据信息进行及时更新。
8.优选的,所述数据可视化模块包括数显模块、a/d转换模块、数据分发模块、读写模块、预警模块与冗沉数据消除模块,所述数显模块用来直接将数值显示出来,所述a/d转换模块进行模数转换以将数据传输至外界连接设备,所述数据分发模块用来将归类的数据分批次发送,所述读写模块用来将数据读写出来以获得直观数据,所述预警模块对错误数据进行预警,所述冗沉数据消除模块用来删除掉超过预设的储存时长的数据。
9.优选的,所述人机交互模块包括身份录入模块、密码登录模块、拖拽命令模块、位移处理模块与点击命令模块,所述身份录入模块用来录入用户的身份信息,所述密码登录模块用来设置登录密码并依据登录密码对用户身份进行验证,所述拖拽命令模块用来识别用户触屏时的拖拽动作来对应执行程序命令,所述位移处理模块用来识别用户触屏时的位移距离来对应执行程序命令,所述点击命令模块用来识别用户点击位置来对应执行程序命令。
10.优选的,所述人机交互模块连接有外部服务系统,所述外部服务系统通过第三方用户端对收据的数据进行调取使用。
11.优选的,所述外部服务系统包括手持终端与通讯模块,所述通讯模块用来进行手持终端与人机交互模块之间的数据传输,所述手持终端包括移动端与主机端。
12.优选的,所述数据持久化模块包括共享数据模块、流程数据模块、汇总数据模块、规则数据模块、整合数据模块、综合数据模块、指标数据模块与其它数据模块,所述共享数据模块用来集中整个网页中的公开数据,所述流程数据模块用来整合网页中的流程次数,所述汇总数据模块用来存储网页中的求和数据,所述规则数据模块用来存储网页中的定制标准数值,所述指标数据模块用来存储指标数值,所述其它数据模块用来整合除去共享数据模块、流程数据模块、汇总数据模块、规则数据模块、整合数据模块、综合数据模块与指标数据模块所储存的数据。
13.与现有技术相比,本发明具有以下有益效果:1、本发明可以对网页上爬取的数据进行解析与过滤处理,处理掉无用或者错误数据,并将数据在云端进行存储,提升数据质量,降低系统运行负担,实现了网页上大数据的整合归类,为后续储存带来合理基础、为后期调取带来便捷,还提供了多种数据可视化的方式,满足不同用户的调取需求。
14.2、本发明通过数据持久化模块将数据进行整合归类,共享数据模块用来集中整个网页中的公开数据,流程数据模块用来整合网页中的流程次数,汇总数据模块用来存储网页中的求和数据,规则数据模块用来存储网页中的定制标准数值,指标数据模块用来存储指标数值,其它数据模块用来整合除去共享数据模块、流程数据模块、汇总数据模块、规则数据模块、整合数据模块、综合数据模块与指标数据模块所储存的数据,因此实现了网页上大数据的整合归类,为后续储存带来合理基础、为后期调取带来便捷。
15.3、通过数据解析模块来解析网页中的数据,数据过滤模块用来过滤掉网页中无用数据,无用数据包括文字字数、段落间行间距与网页页数,网络传输模块连接有云端服务器模块,网络传输模块将预处理的数据发送至云端服务器模块中,云端服务器模块用来对数据进行储存,以便于后期调取使用,可以对网页上爬取的数据进行解析与过滤处理,处理掉无用或者错误数据,并将数据在云端进行存储,提升数据质量,降低系统运行负担。
16.4、通过数显模块来直接将数值显示出来,a/d转换模块进行模数转换以将数据传
输至外界连接设备,数据分发模块用来将归类的数据分批次发送,读写模块用来将数据读写出来以获得直观数据,预警模块对错误数据进行预警,冗沉数据消除模块用来删除掉超过预设的储存时长的数据,可以进行数据的可视化,且提供了多种数据可视化的方式,满足不同用户的调取需求。
附图说明
17.图1为本发明一种大数据存储分析系统的结构示意图;图2为本发明一种大数据存储分析系统的云端服务器原理图;图3为本发明一种大数据存储分析系统的数据持久化模块原理图;图4为本发明一种大数据存储分析系统的人机交互模块原理图;图5为本发明一种大数据存储分析系统的数据可视化模块原理图。
具体实施方式
18.以下描述用于揭露本发明以使本领域技术人员能够实现本发明。以下描述中的优选实施例只作为举例,本领域技术人员可以想到其他显而易见的变型。
19.如图1-图5所示的一种大数据存储分析系统,包括采集模块,采集模块连接有数据预处理模块,数据预处理模块包括数据持久化模块,数据预处理模块连接有导入模块,导入模块连接有存储模块,存储模块连接有数据可视化模块,数据可视化模块连接有人机交互模块,其中:数据预处理模块将网页上爬取的数据信息进行解析过滤筛选;数据持久化模块将处理后的数据信息分类整合;导入模块用来传输数据至存储模块中以进行保存;数据可视化模块将存储模块中的存储数据进行可视化表现,以供人机交互模块使用过程中直观的获取数据信息。
20.本发明可以对网页上爬取的数据进行解析与过滤处理,处理掉无用或者错误数据,并将数据在云端进行存储,提升数据质量,降低系统运行负担,实现了网页上大数据的整合归类,为后续储存带来合理基础、为后期调取带来便捷,还提供了多种数据可视化的方式,满足不同用户的调取需求。
21.数据预处理模块还包括数据解析模块、数据过滤模块、数据加密模块与网络传输模块,其中:数据解析模块用来解析网页中的数据;数据过滤模块用来过滤掉网页中无用数据,无用数据包括文字字数、段落间行间距与网页页数。
22.网络传输模块连接有云端服务器模块,网络传输模块将预处理的数据发送至云端服务器模块中,云端服务器模块用来对数据进行储存,以便于后期调取使用。
23.云端服务器模块包括云存储库、云调取模块、云更新模块,云存储库用来储存云端数据,云调取模块用来调取云存储库中的云端数据,云更新模块用来根据上传的云端数据对云存储库中的数据信息进行及时更新。
24.数据可视化模块包括数显模块、a/d转换模块、数据分发模块、读写模块、预警模块
与冗沉数据消除模块,数显模块用来直接将数值显示出来,a/d转换模块进行模数转换以将数据传输至外界连接设备,数据分发模块用来将归类的数据分批次发送,读写模块用来将数据读写出来以获得直观数据,预警模块对错误数据进行预警,冗沉数据消除模块用来删除掉超过预设的储存时长的数据。
25.人机交互模块包括身份录入模块、密码登录模块、拖拽命令模块、位移处理模块与点击命令模块,身份录入模块用来录入用户的身份信息,密码登录模块用来设置登录密码并依据登录密码对用户身份进行验证,拖拽命令模块用来识别用户触屏时的拖拽动作来对应执行程序命令,位移处理模块用来识别用户触屏时的位移距离来对应执行程序命令,点击命令模块用来识别用户点击位置来对应执行程序命令。
26.人机交互模块连接有外部服务系统,外部服务系统通过第三方用户端对收据的数据进行调取使用。
27.外部服务系统包括手持终端与通讯模块,通讯模块用来进行手持终端与人机交互模块之间的数据传输,手持终端包括移动端与主机端。
28.数据持久化模块包括共享数据模块、流程数据模块、汇总数据模块、规则数据模块、整合数据模块、综合数据模块、指标数据模块与其它数据模块,共享数据模块用来集中整个网页中的公开数据,流程数据模块用来整合网页中的流程次数,汇总数据模块用来存储网页中的求和数据,规则数据模块用来存储网页中的定制标准数值,指标数据模块用来存储指标数值,其它数据模块用来整合除去共享数据模块、流程数据模块、汇总数据模块、规则数据模块、整合数据模块、综合数据模块与指标数据模块所储存的数据。
29.本发明通过数据持久化模块将数据进行整合归类,共享数据模块用来集中整个网页中的公开数据,流程数据模块用来整合网页中的流程次数,汇总数据模块用来存储网页中的求和数据,规则数据模块用来存储网页中的定制标准数值,指标数据模块用来存储指标数值,其它数据模块用来整合除去共享数据模块、流程数据模块、汇总数据模块、规则数据模块、整合数据模块、综合数据模块与指标数据模块所储存的数据,因此实现了网页上大数据的整合归类,为后续储存带来合理基础、为后期调取带来便捷;通过数据解析模块来解析网页中的数据,数据过滤模块用来过滤掉网页中无用数据,无用数据包括文字字数、段落间行间距与网页页数,网络传输模块连接有云端服务器模块,网络传输模块将预处理的数据发送至云端服务器模块中,云端服务器模块用来对数据进行储存,以便于后期调取使用,可以对网页上爬取的数据进行解析与过滤处理,处理掉无用或者错误数据,并将数据在云端进行存储,提升数据质量,降低系统运行负担;通过数显模块来直接将数值显示出来,a/d转换模块进行模数转换以将数据传输至外界连接设备,数据分发模块用来将归类的数据分批次发送,读写模块用来将数据读写出来以获得直观数据,预警模块对错误数据进行预警,冗沉数据消除模块用来删除掉超过预设的储存时长的数据,可以进行数据的可视化,且提供了多种数据可视化的方式,满足不同用户的调取需求。
30.以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1